統計学実践ワークブック 第15章 確率過程の基礎 p.119 計数過程としての表現のお気持ちを理解する
理解したいこと
- ①ある繰り返し起こるイベントに対してn番目の発生時刻をとみれば、は時刻tまでに起こるイベントの回数を表す確率過程とみなせる。
- ②
①のお気持ちをくしゃみを通じて理解する
- ある繰り返し起こるイベント → くしゃみ
- k番目の発生時刻 → k回目のくしゃみが出た時刻
- ここで k = 5 、 t = 11:00 とすると
- は、11:00までに合計くしゃみ回数が5回となったことを表している。
- 11:00 は、5回目のくしゃみが出た時刻が11:00だということを表している。
- 疑問)11:00は確かに時刻であるが数学的な表記としては微妙なのでは?
- 回答)適当な日付(例:2022-03-28)を時刻に添えてからunix epoch time に脳内変換すれば時刻は整数となるので、そういう風に解釈すればよし。
計数過程と正値確率変数列の読み替え
- 日本語訳:「時刻tまでの合計イベント回数がk回以上であること」と「k回目のイベント発生時刻が時刻t以前であること」は同じ(事象を別の視点で述べている)
- 具体例:11:00までに合計くしゃみ回数が5回以上であること vs 5回目のくしゃみは11:00までに発生している
- 具体例の深掘り:11:00までに合計くしゃみ回数が5回以上である、ということは10:45に合計くしゃみ回数は5回でその後6回目を10:46、7回目を10:59といったイベントを、「11:00までに合計くしゃみ回数が5回以上である」という文章は含んでいる。
②を理解したいのでお気持ちを読み取る
を直接求めないのはなぜ?
それを知るために計算しているから。p.119の上にはポアソン分布に従う、と書いてある。p.119の中段以降はこれを導出するための式の羅列である。p.120あたりでガンマ分布をガシガシ計算することでポアソン分布になることが書いてある。なので結論だけ知りたいのであれば途中の式はスルーしても良いかもしれない。
なぜと引き算しているのか
- まず、確率変数列Tは指数分布をごにょごにょしてガンマ分布に従うらしい。指数分布もガンマ分布も連続型確率分布であるため、確率変数が範囲ではなく1点を取る確率は0となる。たとえばXが標準正規分布に従う確率変数であるとして、X = 2となる確率は0であることと似た理屈である。ということで、確率変数列Tに注目すると等号ではなく不等号が現れそうな気配が感じ取れる。
- 次に、確率を引き算するときは包含関係が隠れている可能性があって、包含関係のうち共通部分を差し引いているかもしれない(直感)
- くしゃみの例で言えば、
- 11:00に合計くしゃみ回数が5回である
- を
- 5回目のくしゃみをした時刻が11:00以前である
- 6回目のくしゃみをした時刻が11:00以前である
- の二つを駆使して、 11:00までに合計くしゃみ回数が5回であるを表している、と見れば良い。
- くしゃみの例で言えば、
- 図示すると以下である。