axjack's blog

### axjack is said to be an abbreviation for An eXistent JApanese Cool Klutz ###

クーポンコレクターまたはコンプリートガチャ問題

統計学実践ワークブック問5.5より。

問題の概要

4種類のカードを等確率無作為復元抽出で引く。

  • [1] 4種類のカードを全て揃えるまでの、回数の期待値
  • [2] あらたに5種類目のカードが追加されたとする。
    • x: はじめの4種類を集めてから、追加の5種類目を揃えるまでの、回数の期待値
    • y: はじめから5種類を全て揃えるまでの、回数の期待値
    • このとき、xとyの差を求めよ

[1]

幾何分布の復習

成功確率pのベルヌーイ試行において、はじめて成功するまでに起こる「失敗の回数」をXとすると、Xは幾何分布に従う。ここでX = kとなる確率は、\displaystyle P(X=k) = (1-p)^{k}p、k = 0,1,...となる。Xの期待値をもとめるため、Xの確率母関数を計算すると、
 \displaystyle  \rm E[s^X] = \sum_{k=0}^{\infty} s^{k}(1-p)^{k}p =  p\sum_{k=0}^{\infty} (s(1-p))^{k} = \frac{p}{1 - (s(1-p))}

である。

期待値E[X]は確率母関数をsで微分してs=1を代入したものとなる*1ので、
 \displaystyle \frac{d}{ds}E[s^X] = \frac{d}{ds}  \frac{p}{1 - (s(1-p))} \\= \frac{d}{ds} p(1-s(1-p))^{-1} = p(-1)(1-s(1-p))^{-2}(-(1-p)) = p(1-p)(1-s(1-p))^{-2}
より、s = 1を代入し、
 \displaystyle p(1-p)(1-s(1-p))^{-2} |_{s=1} = p(1-p)(1-(1-p))^{-2} = p(1-p)p^{-2} = \frac{1-p}{p}

となる。

ここで、Xは『はじめて成功するまでに起こる「失敗の回数」』であるから、W = X+1とすれば「はじめて成功するまでの回数」の確率変数に変換することができる。Wの期待値は \displaystyle E[W] = E[X+1] = E[X] + 1 = \frac{1-p}{p} + 1 = \frac{1-p}{p} + \frac{p}{p} = \frac{1}{p}

となる。つまり、初めて成功するまでの回数を確率変数とする幾何分布の期待値は、成功確率の逆数となる。

4種類のカードを全て揃えるまでの、回数の期待値

4種類のカードを全て揃えるということは、

確率変数 成功確率 失敗確率 幾何分布に従う時の意味
X_1 \frac{4}{4}  1 - \frac{4}{4} 1種類目を引き当てる
X_2 \frac{3}{4} 1 - \frac{3}{4} 1種類揃い済み、2種類目を引き当てる
X_3 \frac{2}{4} 1 - \frac{2}{4} 2種類揃い済み、3種類目を引き当てる
X_4 \frac{1}{4} 1 - \frac{1}{4} 3種類揃い済み、4種類目を引き当てる

という確率変数X_1 , ... , X_4 についての和の期待値E[X_1 + X_2 + X_3 + X_4]を求めることに等しい。
確率変数ごとに確率が異なる(揃うたびに成功確率は小さくなる)ことに注意しつつ、それぞれ幾何分布に従っていることを踏まえると、求める期待値は、

 \displaystyle E[ X_1 + X_2 + X_3 + X_4 ] = E[ X_1] + E[ X_2 ] + E[ X_3 ] + E[ X_4 ]
 \displaystyle =  (\frac{4}{4})^{-1} + (\frac{3}{4})^{-1} + (\frac{2}{4})^{-1} + (\frac{1}{4})^{-1} = ... = \frac{25}{3}
となる。

[2]

  • x: はじめの4種類を集めてから、追加の5種類目を揃えるまでの、回数の期待値
  • y: はじめから5種類を全て揃えるまでの、回数の期待値

について、yはX_1 \sim Geo(p = \frac{5}{5}) X_2 \sim Geo(p = \frac{4}{5} ) 、…、X_5 \sim Geo(p = \frac{1}{5} ) について和の期待値を求めれば良いので、\displaystyle  y = (\frac{5}{5})^{-1} + ... + (\frac{1}{5})^{-1} = \frac{127}{12} となる。*2

一方、xについては[1]の期待値に X_5 \sim Geo(p = \frac{1}{5} ) の期待値を加えたものとなるので、
 x = \frac{25}{3} + E[X_5] = \frac{25}{3} + ( \frac{1}{5})^{-1} = \frac{40}{3} となる。

以上より、 \displaystyle x - y = \frac{40}{3} - \frac{127}{12} = \frac{23}{12} となる。

*1: \frac{d}{ds}E[s^X] = E[Xs^{X-1}]

*2:Geo(p)は成功確率pを持つ幾何分布の意味。

axjack is said to be an abbreviation for An eXistent JApanese Cool Klutz.