axjack's blog

axjack is said to be an abbreviation for An eXistent JApanese Cool Klutz.

ポアソン分布と適合度検定

準1級 例題/解説 の問2より。

ある地域における1日の死亡者数の集計結果表


\begin{array}{c}
死亡者数(人) & 0 & 1 & 2 & 3 & 4 & 5 & 6以上 &計\\
\hline
件数(日数) & 55 & 144 & 140 & 95 & 45 & 15 & 6 &500\\
\end{array}

1日の死亡者数Xがパラメータλのポアソン分布に従うと仮定する。ある日の死亡者数が3人である確率は?

 \displaystyle Poisson(x; λ) =  \frac{ \lambda^x e^{- \lambda} } { x! }

に於いて、λ=3を代入すればよい。

同分布を仮定した時、E[X2] とλの関係は?

  E[X] = \lambda, V[X] = \lambda = E[X^2] - E^2[X]

より、

  E[X^2] = \lambda + {\lambda}^2

パラメータλの推定値は?

 \hat{ \lambda } = \sum x_i \hat{p}_i

より求める。ここで \hat{p} は 件数を件数総和の500 で割ったものとする。Rで計算すると、

# 人
x <- 0:6
# 件数
v <- c(55,144,140,95,45,15,6)
# 割合
vprop <- v/sum(v)

# 標本平均
lam_hat <- sum(x * vprop) 
print(lam_hat)
#> print(lam_hat)
#[1] 2

より、  \hat{ \lambda} = 2 となる。

パラメータの推定値から期待度数を求めよ

6以上に注意してRで計算すると、

# ポアソン分布(λ=2)からX = 0,1,2,3,4,5までの確率を求める。
dpois05 <- dpois(0:5, lambda = 2)

# 6以上の確率
dpoisGE6 <- 1 - sum(dpois05)

# 期待度数Expected_i = n * p_i。この問題ではnは500
round( 500 * c(dpois05, dpoisGE6), 1)
#> round( 500 * c(dpois05, dpoisGE6), 1)
#[1]  67.7 135.3 135.3  90.2  45.1  18.0   8.3

期待度数をもとに、適合度検定を実行せよ

で適合度検定を実行する。

   \displaystyle  {\chi_0}^2  = \sum \frac{  { (O_i - E_i) }^2 }{E_i}

より、カイ二乗値は

expected <- round( 500 * c(dpois05, dpoisGE6), 1)
sum( (expected - v )^2/expected )
#[1] 4.498116

ところで自由度は, 7-1-1 より5なので自由度5のカイ二乗分布の上側5%点(⇔下側 95%点)を求めると、

qchisq(1-0.05, 5)
#[1] 11.0705

となるので、4.498116 < 11.0705 より有意水準5%において棄却域に入っていない。よってポアソン分布に従っていることを棄却することはできない*1

*1:ポアソン分布に従っていないとは言えない。言い回しが難しい。。

axjack is said to be an abbreviation for An eXistent JApanese Cool Klutz.