axjack's blog

### axjack is said to be an abbreviation for An eXistent JApanese Cool Klutz ###

統計学実践ワークブック 第20章 分散分析と実験計画法

# 統計学実践ワークブック ####
# 第20章 分散分析と実験計画法 ####
# pp.167-172

# 参考
# https://www1.doshisha.ac.jp/~mjin/R/Chap_13/13.html

# [p.167]表20.1 ####
A1 <- c(9.7,8.7,10.2,11.3,11.2,11.7)
A2 <- c(9.8,11.8,13.1,10.9,11.3,10.3)
A3 <- c(9.2,10.0,10.2,8.9,10.4,10.6)
A4 <- c(13.1,12.6,12.7,12.6,14.3,12.9)
A5 <- c(10.8,10.5,13.0,11.9,13.4,10.3)

A <- rep(paste0('A',1:5), rep(6,5))
y <- c(A1,A2,A3,A4,A5)
df <- data.frame(A, y)
df |> head()

dev.off()
par(mfcol = c(1,1))
boxplot(y~A, data = df, col = "lightblue")
aov(y~A, data=df) |> summary()



# [p.170]表20.4 ####
A1 <- c(339,419,289,132,178,202)  
A2 <- c(138,142,206,173,192,166)
A3 <- c(190,201,120,59,77,25)
A4 <- c(197,126,204,157,168,194)
A5 <- c(423,384,312,381,283,247)
A6 <- c(368,383,345,235,230,171)

A <- rep(paste0('A',1:6), rep(6,6))
B <- rep(paste0('B',1:2), rep(3,2))
y <- c(A1,A2,A3,A4,A5,A6)
df <- data.frame(A,B,y)
df |> head()

par(mfcol = c(1,2))
boxplot(y~A, data = df, col = "lightblue")
boxplot(y~B, data = df, col = "lightgreen")
aov(y~A*B, data=df) |> summary()



# [p.172]表20.6 ####
A1 <- c(5.2,12.3,7.1,20.5,9.4)
A2 <- c(3.8,11.3,7.2,18.5,9.0)  
A3 <- c(7.2,15.3,10.6,25.3,11.1)
A4 <- c(3.5,10.2,8.5,20.2,10.7)

A <- rep(paste0('A',1:4),rep(5,4))
B <- rep(paste0('B',1:5),4)
y <- c(A1,A2,A3,A4)
df <- data.frame(A,B,y)

df |> head()
dev.off()
par(mfcol = c(1,1))
boxplot(y~A, data = df, col = "lightblue")

print("ブロック因子を導入した分散分析表の例")
aov(y~A+B, data=df) |> summary()

print("ブロック因子を導入しない場合の1元配置分散分析表の例")
aov(y~A, data=df) |> summary()

統計学実践ワークブック 第18章 質的回帰の問18.1-3のロジスティック回帰分析/プロビットモデルをRで実行

第18章 質的回帰

  • データの引用元
    • 統計学実践ワークブック pp.152-153
# 問18.1 ####
# データ
LIs    <- c(8,10,12,14,16,18,20,22,24,26,28,32,34,38)
Kanja  <- c(2,2,3,3,3,1,3,2,1,1,1,1,1,3)
Kankai <- c(0,0,0,0,0,1,2,1,0,1,1,0,1,2)

# 加工
LI     <- rep(LIs,Kanja)
resp   <- mapply( (\(x,y) c(rep(1,x),rep(0,y-x))), Kankai, Kanja ) |> unlist() 
df     <- data.frame(LI,resp)

# ロジスティック回帰
glm.logistic <- glm(df$resp ~ ., family=binomial(link="logit"), data = df)
summary(glm.logistic)

# [1]の確率
predict(glm.logistic, newdata = data.frame(LI=30), type = "response")



# 問18.2
# データ
Smokings  <- c(0,1,0,1,0,1,0,1)
Obesitys  <- c(0,0,1,1,0,0,1,1)
Snorings  <- c(0,0,0,0,1,1,1,1)
reisu     <- c(60,17,8,2,187,85,51,23)
kouketsus <- c(5,2,1,0,35,13,15,8)

# 加工
smoking   <- rep(Smokings, reisu)
obesity   <- rep(Obesitys, reisu)
snoring   <- rep(Snorings, reisu)
resp      <- mapply( (\(x,y) c(rep(1,x),rep(0,y-x))), kouketsus, reisu ) |> unlist() 
df2       <- data.frame(smoking,obesity,snoring,resp)

# ロジスティック回帰
glm.logistic2 <- glm(resp ~., family = binomial(link = "logit"), data = df2)
summary(glm.logistic2)

# [1]の確率
predict(glm.logistic2, newdata = data.frame(smoking=1,obesity=1,snoring=1),type="response")



# 問18.3
# プロビットモデル
# データは問18.2と同じ
glm.probit <- glm(resp ~., family = binomial(link = "probit"), data = df2)
summary(glm.probit)

# [1]の確率
predict(glm.probit, newdata = data.frame(smoking=1,obesity=1,snoring=1),type="response")

監査サンプリングについてのメモ

単語集

単語 意味 補足
監基報530 監査基準委員会報告書530 監査サンプリングについての記載がある。
逸脱 不備や例外を表していると思われる。
n サンプルサイズ 監基報530ではサンプル数と書かれている。
k サンプル内の逸脱件数
pT 許容逸脱率 想定する母集団の逸脱率、ようするに母比率と思われる。TはTolerableの意味。
pE 予想逸脱率 これがよく分からない。EはExpectedの意味。
risk 1 - 信頼度 リスク

確率として考える

 \displaystyle X_i

  • 逸脱なら  \displaystyle X_i = 1
  • そうでないなら  X_i = 0

とする確率変数で、 \displaystyle X_i は ベルヌーイ分布(  Bin(1, p_T) )に従っている。
すると、 \displaystyle K =\sum_{i=1}^{n} X_i は 二項分布(  Bin(n, n p_T) ) に従い、
さらに、 \displaystyle \bar{X} = \frac{K}{n} = \frac{1}{n} \sum_{i=1}^{n} X_i は二項分布(  Bin(n, p_T) ) に従う。

   \displaystyle P_{p_T} (  \bar{X}  < \bar{X}' ) < risk
となるような最小の  \bar{X}'は、逸脱件数:k とサンプルサイズ: n を用いて、
 \bar{X}'  = \frac{k}{n}
と表される。

統計として考える

Rでシミュレーションを実行するのと、二項分布の分布関数・分位点関数を用いて確認。

## 関数 AuditSim ####
# 母集団の大きさ: N
# 母集団に含まれる逸脱件数: K
# サンプルサイズ: n
# シミュレーション回数: how_many_times
## ####
AuditSim <- function(N=1000,K=50,n=45,how_many_times=10000){
paste("母集団の大きさ:",N,"\n") |> cat()
paste("母集団に含まれる逸脱件数:",K,"\n") |> cat()
paste("母集団の逸脱率:", K/N,"\n") |> cat()
paste("サンプルサイズ:", n,"\n") |> cat()
paste("シミュレーション回数:", how_many_times,"\n") |> cat()
cat("\n")


# 母集団設計 ################
# 母集団のサイズ: N
# 母集団に存在する逸脱件数: K
# 母集団作成
devi <- rep(1,K)
not_devi <- rep(0, N-K)
pop <- c(devi,not_devi)

# 標本設計 ################
# サンプルサイズ: n

# シミュレーション ################
# シミュレーション回数: how_many_times

# シミュレーション実行
replicate(how_many_times,{
# 母集団から無作為抽出でサンプルサイズnの標本を取得し
draws <- sample(pop, n, replace = TRUE)
# 標本の逸脱件数をカウントする
sum(draws)
}
) -> deviation_in_sample


# 結果確認 ################
# シミュレーションで得られた標本の逸脱件数の度数
table(deviation_in_sample) |> print()
cat("\n")


# シミュレーションで得られた標本の逸脱件数の相対度数
(table(deviation_in_sample)/how_many_times) |> print()
cat("\n")

# ヒストグラムの表示[標本の逸脱件数の度数]
hist_main = paste("Histogram of # of deviation in sample","\n","N=",N,"K=",K,"n=",n)
hist(deviation_in_sample, right = FALSE, main = hist_main, );box();

}



# サンプルサイズ: 42 でシミュレーションを実施
AuditSim(N = 1000, K = 90, n = 42, how_many_times = 10000)

# 二項分布の確率質量関数から、P(X=0) + P(X=1)を計算する
sum(dbinom(0:1, 42, prob = 0.09))


# 二項分布の累積分布関数から、P(X <= 1)を計算する
pbinom(1, 42, prob = 0.09)


# リスクが10% を下回る、最小のサンプルサイズを求める
risk <- 0.1
n_max <- 1000
k <- 1
( pbinom(k, 1:n_max, prob = 0.09) < risk ) |> which() |> head(1)

実行例

f:id:axjack:20211020171321p:plain
f:id:axjack:20211020171331p:plain
f:id:axjack:20211020171341p:plain


ガンマ関数とガンマ分布についてのポエム

統計学実践ワークブック第15章にて、"指数分布(λ)はガンマ分布(1, 1/λ)である"、というワンフレーズでつまずいたので、
復習を兼ねてポエムです。なお、以下の議論において、厳密性は度外視している。

ガンマ関数

定義

s > 0 とする。ガンマ関数Γ(s) は次式で定義される。

 \displaystyle \Gamma(s) = \int_0^{\infty}  t^{s-1} e^{-t} dt

性質1: Γ(1) = 1

Γ(1) = 1である。
  \displaystyle \because \Gamma(1) = \int_0^{\infty}  t^{0} e^{-t} dt  = \int_0^{\infty} e^{-t}dt =  \Big [ -e^{-t} \Big ]_0^{\infty} = 1

性質2: Γ(s) = (s-1)Γ(s-1)

Γ(s) = (s-1)Γ(s-1)である。
 \displaystyle \because \Gamma(s) = \int_0^{\infty}  t^{s-1} e^{-t} dt = \int_0^{\infty}  t^{s-1} \Big(-e^{-t}\Big)' dt
 \displaystyle = \Big[  (t^{s-1} )'(-e^{-t})  \Big]_0^{\infty} -  \int_0^{\infty}  (t^{s-1} )'(-e^{-t})  dt
 \displaystyle =  \int_0^{\infty}  (s-1)t^{(s-1)-1}e^{-t}  dt
 \displaystyle =  (s-1) \int_0^{\infty}  t^{(s-1)-1}e^{-t}  dt
 \displaystyle =  (s-1) \Gamma(s-1)

性質3: Γ(n) = (n-1)! where n ∈ ℕ

n>0; n \in N のとき、Γ(n) = (n-1)!である。
∵ 性質1と2より、ガンマ関数は

{\displaystyle 
\Gamma(n) = \begin{eqnarray}
  \left\{
    \begin{array}{l}
      1 \ \rm{if} \ n = 1 \\
       \rm{otherwise} \ (n-1) \Gamma(n-1)
    \end{array}
  \right.
\end{eqnarray}
}

再帰的に記述できる。これは(n-1)!の階乗の再帰的な表現に等しい。

性質4: Γ(1/2) = √π

 \Gamma(\frac{1}{2}) = \sqrt{\pi}   である。

まず、
 \displaystyle I = \Gamma(\frac{1}{2}) =  \int_0^{\infty}  t^{-\frac{1}{2}} e^{-t} dt  = \int_0^{\infty}  \frac{ 1 }{ \sqrt{t} }  e^{-t} dtにて
 \displaystyle t = x^2 と変数変換すると \displaystyle \frac{dt}{dx} = 2xなので、
 \displaystyle  \int_0^{\infty}  \frac{ 1 }{ \sqrt{t} }  e^{-t} dt = \int_0^{\infty}  \frac{ 1 }{ x }  e^{-x^2} 2xdx = 2 \int_0^{\infty}  e^{-x^2} dx
となって、区間(0,∞)のガウス積分  \int_0^{\infty}  e^{-x^2} dx  が現れる。

ガウス積分を計算すると、
 \displaystyle  J = \int_0^{\infty}  e^{-x^2} dx にて、
 \displaystyle  J^2 = \Big(  \int_0^{\infty}  e^{-x^2} dx \Big) \Big( \int_0^{\infty}  e^{-y^2} dy \Big)
 \displaystyle =   \int_0^{\infty}  \int_0^{\infty}   e^{-(x^2+y^2) }  dxdy

ここで、 x = rcos(\theta), y = rsin(\theta) また諸々のヤコビアンの計算により、 dxdy = rdrd\theta とすると、
 \displaystyle J^2  =   \int_0^{\infty}  \int_0^{  \frac{\pi}{2}  }   e^{-r^2 } rdrd\theta  = \frac{\pi}{2}  \int_0^{\infty} \Big(  -\frac{1}{2} e^{-r^2 }   \Big)'  dr
  \displaystyle  = \frac{\pi}{2} \frac{1}{2}   \Big[  e^{-r^2 }   \Big]_{\infty}^{0}  = \frac{\pi}{4}

よって、区間(0,∞)のガウス積分 \displaystyle J = \sqrt{  \frac{\pi}{4} }   なので、
 \displaystyle \Gamma(\frac{1}{2})  = 2J = 2  \sqrt{  \frac{\pi}{4} }  = \sqrt{\pi}

ガンマ分布

定義

a>0, b>0, x ∈(0,∞) として、確率密度関数f(x)が
 \displaystyle   \frac{1}{\Gamma(a) b^a } x^{a-1} exp( {-\frac{x}{b}  } )
と表される連続型確率分布を、ガンマ分布G(a, b) という。

確率分布であること

連続型確率分布が(0,∞)で積分すると1になることを示せば良い。
ここで、 \displaystyle \frac{x}{b} = t とすると \displaystyle  \frac{dx}{dt} = bt より、

 \displaystyle   \int_0^{\infty}  \frac{1}{\Gamma(a) b^a } x^{a-1} exp( {-\frac{x}{b}  } ) dx
 \displaystyle  =  \int_0^{\infty}  \frac{1}{\Gamma(a) b^a } (bt)^{a-1} exp( -t   ) bdt
 \displaystyle  =  \int_0^{\infty}  \frac{1}{\Gamma(a) b^a } b^{a-1} b t^{a-1} exp( -t   ) dt
 \displaystyle  =  \int_0^{\infty}  \frac{1}{\Gamma(a) b^a } b^a t^{a-1} exp( -t   ) dt
 \displaystyle  =   \frac{1}{\Gamma(a)  }  \int_0^{\infty}  t^{a-1} exp( -t   ) dt
 \displaystyle  =   \frac{1}{\Gamma(a)  }  \Gamma(a)  = 1

モーメント母関数

X ~ G(a,b) としてモーメント母関数  M_X(t) を求める。

 \displaystyle M_X(t) = E\Big[ \rm{e}^{tX} \Big]  = \int_0^{\infty}  \rm{e}^{tx}  \frac{1}{\Gamma(a) b^a } x^{a-1} exp( {-\frac{x}{b}  } ) dx
 \displaystyle  =   \int_0^{\infty}  \frac{1}{\Gamma(a) b^a } x^{a-1} exp( {-x (  \frac{1}{b} -t ) } ) dx

ここで  \displaystyle x (  \frac{1}{b} -t ) = y とすると、

 \displaystyle  =   \int_0^{\infty}   \frac{1}{\Gamma(a) b^a } ( \frac{1}{ \frac{1}{b} - t } )^{a-1} y^{a-1} exp( -y )  \frac{1}{ \frac{1}{b} - t } dy
 \displaystyle  =   \int_0^{\infty}   \frac{1}{\Gamma(a) b^a } ( \frac{1}{ \frac{1}{b} - t } )^a y^{a-1} exp( -y )  dy
 \displaystyle  =   ( \frac{1}{1 - bt } )^a  \frac{1}{\Gamma(a) }   \int_0^{\infty}  y^{a-1} exp( -y )  dy
 \displaystyle  =   ( \frac{1}{1 - bt } )^a  \frac{1}{\Gamma(a) }   \Gamma(a)
 \displaystyle  =   ( 1 - bt )^{-a}
となる。

再生性

X ~ G(a1, b) , Y ~ G(a2, b) でXとYは互いに独立であるとする、この時 X+Yの分布はモーメント母関数を用いて
 M_{X+Y}( t ) = M_X(t) M_Y(t) =  (1 - bt )^{-a_1} (1 - bt )^{-a_2} = (1-bt)^{-(a_1+a_2)}
と表される。これは X+Y ~ G(a1+a2, b) に等しい。よってガンマ分布は再生性を持つ。

指数分布(λ)はガンマ分布(1, 1/λ)である

指数分布は確率密度関数 f(x) = \lambda \rm{exp}(-\lambda x) と表される。従って、ガンマ分布 G(a,b)にて
 G(a = 1, b = \frac{1}{\lambda} ) として求めると、
 \displaystyle  G(a = 1, b = \frac{1}{\lambda})   \rightarrow \frac{1}{\Gamma(1) (1/\lambda)^1 } x^{1-1} exp( {-\frac{x}{1/\lambda}  } )
 \displaystyle = \lambda exp( {-\lambda x  } )
となり、確かに一致する。

マルコフ連鎖

統計学実践ワークブック問14.2より。

問題の概要

  • 状態空間S = {1,2,3}
  • マルコフ連鎖 X = (Xn)を以下に定める
    • Xが状態iにあるとき、カードを1枚ランダムに引く。取り出したカードが
      • a_i であれば状態iにとどまる
      • a_j であれば
        • 確率c_ij = min( j/i, 1 ) で状態jに推移
        • 確率 1 - c_ij で iにとどまる
  • カードは復元抽出とする
  • (1)マルコフ連鎖Xの確率推移行列Q を求めよ

問題の理解

どのカードもどーよーにたしからしく引く、つまり1/3の確率で引くことができると考える。 また、各状態で「とどまる」とはつまり、状態iから状態iに推移すると言い換えることができる。

これらの点に注意しながら、以下「状態2」について詳細に計算過程を記述する。 なお、カードは[1][2][3]で表し、状態は①②③で表すとする。また、分数および1と0は確率のことを指している。

  • ②のとき
    • 1/3で[1]を引き当てる
      • 1/2で①へ推移 ⇔ 確率1/6で ②→①と状態推移する
      • 1/2で[2]へ推移 ⇔ 確率1/6で ②→②と状態推移する
    • 1/3で[2]を引き当てる
      • 1で②へ推移 ⇔ 確率1/3で②→②と状態推移する
    • 1/3で[3]を引き当てる
      • 1で③へ推移 ⇔ 確率1/3で②→③と状態推移する
      • 0で②へ推移 ⇔ 確率0で②→②と状態推移する

これを状態推移ごとにまとめると、

状態推移 確率
②→① 1/6
②→② 1/6
②→② 1/3
②→③ 1/3
②→② 0

となって、図で表現すると

f:id:axjack:20211009012654p:plain

f:id:axjack:20211009012751p:plain

f:id:axjack:20211009012801p:plain

f:id:axjack:20211009012810p:plain

となる。

従って、確率推移行列の第2行の成分は(1/6,1/2,1/3)となる。

同様に考えると、

  • 第1行の成分は(1/3,1/3,1/3)
  • 第3行の成分は(1/9,2/9,2/3)

となる。

二項分布の正規近似から母比率の検定統計量まで

二項分布の正規近似は闇が深いっぽいので、深追いせず流れだけを書いておくメモです。

 X \sim Bin(n, p)

↓ 正規近似 as n→∞
↓ 実はここで色々厄介な近似をしているらしい。
↓ たとえばスターリングの公式など。

 X \sim  N(np, np(1-p) )

↓ Xを標準化(平均値引いて標準偏差で割る)

 \displaystyle \frac{ X-np } { \sqrt{ np(1-p) }}  \sim N(0, 1)

↓ 確率変数の分母分子をnで割る。確率変数は実質変わらない。

 \displaystyle   \frac{\bar{X} - p}{  \sqrt{   \frac{p(1-p)}{n} } }  \sim N(0,1)

切断正規分布

統計学実践ワークブックの問6.1〔4〕は、いわゆる切断正規分布の問題である。このキーワードでググると良い。 なお、期待値を求めるために確率変数 Z|Z>0 のモーメント母関数を計算しようとすると怪我をする?ので、素直に \displaystyle \frac{  f(\rm z)  }{  P(Z>0)  }   から定義通り期待値を求めましょう。

2022-02-19 追記

ワークブックに従い、素直に確率密度関数f(z) = (1/2)×ϕ(z) where z > 0 , 0 where z ≦ 0 と考えた方が楽。

中心極限定理をラフに証明する

厳密さを捨てて大略理解できれば良いぐらいの証明です。

準備

正規分布のモーメント母関数

確率変数X N(\mu, \sigma^2) に従う時、モーメント母関数 M_{X}[t; \mu , {\sigma}^2 ]  は、
 \displaystyle M_{X}[t; \mu , {\sigma}^2 ]  = \rm exp( \mu t + \frac{1}{2} {\sigma}^2 {t}^2 )
とくに、 \mu = 0, \sigma^2 = 1 のとき、 \displaystyle M_{X}[ t; \mu=0 , {\sigma}^2=1 ] = \rm exp(  \frac{1}{2} {t}^2 )

指数関数の底eの極限

 \displaystyle \lim_{n \rightarrow \infty } (1+\frac{1}{n} )^n  = \rm e

 \displaystyle \lim_{n \rightarrow \infty } (1+\frac{a}{n} )^n  = \lim_{n \rightarrow \infty } ( (1+\frac{a}{n} )^{\frac{n}{a}} )^a  =(  \lim_{n \rightarrow \infty }  (1+\frac{a}{n} )^{\frac{n}{a}} )^a   = \rm e^a

テイラー展開

 \displaystyle f(x) = \sum_{k=0}^{\infty} \frac{ x^k }{k!} f^{(k)}(0)   = 1 + xf'(0) + \frac{1}{2}x^2 f''(0) + \cdots  \approx 1 + xf'(0) + \frac{1}{2}x^2 f''(0)
とくに、 \displaystyle \rm e^x  = 1 + x + \frac{1}{2}x^2 + \cdots  \approx 1 + x + \frac{1}{2}x^2

逆数

 \displaystyle \frac{1}{ \frac{1}{\sqrt{n}} }  = \Bigl(   \frac{1}{\sqrt{n}}  \Bigr) ^{-1}  =  \sqrt{n}

中心極限定理

示したいこと

確率変数 X_1, X_2, \cdots X_n が平均\mu、分散\sigma^2の分布にi.i.d.で従っている。
このとき、標本平均 \displaystyle \bar{X} を標準化した統計量Tは標準正規分布N(0,1)に分布収束する。

標準化した確率変数の確認

以下を示す

確率変数 X_i はi.i.d. で平均\mu、分散\sigma^2で従っている。
X_iを標準化した確率変数を Z_i とするとき、
 \displaystyle \bar{X} を標準化した確率変数は \displaystyle \sqrt{n} \bar{Z} となる。

導出

X_i を標準化した変数を Z_i とすると、 \displaystyle Z_i = \frac{X_i - \mu}{\sigma}  E[ Z_i ]  = 0, V[ Z_i] = 1  である。

つぎに、 \bar{X}について、\displaystyle E[ \bar{X} ]  = \mu , V[ \bar{X} ] = \frac{{\sigma}^2}{n} であるから、

標本平均 \displaystyle \bar{X} を標準化した統計量\rm T \displaystyle \frac{ \bar{X} - \rm E[\bar{X}] }{ \sqrt{ \rm V[ \bar{X} ]}}   =  \frac{\bar{X} - \mu }{ \frac{\sigma}{\sqrt{n}}}  = \sqrt{n} \Bigl( \frac{\bar{X} - \mu }{\sigma} \Bigr)
となる。

一方、 \displaystyle \bar{Z} = \frac{1}{n} \sum Z_i = \frac{1}{n} \sum (\frac{X_i - \mu}{\sigma} )    = \frac{1}{n \sigma} (n \bar{X}-n\mu)     =  \frac{\bar{X} - \mu}{\sigma}

となるので、 \displaystyle \sqrt{n} \bar{Z} = \sqrt{n} \frac{\bar{X} - \mu}{\sigma}  = T となる。

モーメント母関数

統計量Tのモーメント母関数、すなわち \sqrt{n}\bar{Z}のモーメント母関数を求める。 Z_1, \cdots, Z_nが互いに独立であることに留意すると、

 \displaystyle M_{  \sqrt{n}\bar{Z}  }(t) = \rm E[  \rm exp( t \sqrt{n}\bar{Z} ) ]   
= \rm E[  exp(  t \sqrt{n}  \frac{1}{n}  \sum Z_i  )  ]   
= \rm E[  exp(  t \frac{1}{\sqrt{n} }  \sum Z_i  )  ]   
= \rm  \Bigl(  E[  exp(  t \frac{1}{\sqrt{n} }  Z_1 )  ]   \Bigr)^n

とかける。ここで、

 \displaystyle \rm E[  exp(  t \frac{1}{\sqrt{n} }  Z_1  ) ] \\ 
= \displaystyle \rm E[  1  + \frac{t}{\sqrt{n} }  Z_1  +  \frac{t^2}{2n}  {Z_1}^2 + \cdots ]   \\
 \displaystyle  \approx \rm E[  1  + \frac{t}{\sqrt{n} }  Z_1  +  \frac{t^2}{2n}  {Z_1}^2 ]  \\
=  \displaystyle  1  + \frac{t}{\sqrt{n} }  \rm E[ Z_1 ]   +  \frac{t^2}{2n}  \rm E [ {Z_1}^2   ]  \\
=   \displaystyle 1  + \frac{t}{\sqrt{n} }  \rm 0   +  \frac{t^2}{2n}  \rm 1     \\
=   \displaystyle 1  +  \frac{t^2}{2n}

と近似することができるから、

 \displaystyle   M_{  \sqrt{n}\bar{Z}  }(t)  = \rm  \Bigl(  E[  exp(  t \frac{1}{\sqrt{n} }  Z_1 )  ]   \Bigr)^n   =  \rm  \Bigl(  1  +  \frac{t^2}{2n}     \Bigr)^n  
= \rm  \Bigl(  1  +  \frac{ \frac{1}{2}t^2 }{n}      \Bigr)^n    =  \rm exp( \frac{1}{2}t^2 ) \ ( as \ n \rightarrow \infty )

となって、これは標準正規分布のモーメント母関数に一致する。
よって、標本平均 \displaystyle \bar{X} を標準化した統計量Tは標準正規分布N(0,1)に分布収束する。

axjack is said to be an abbreviation for An eXistent JApanese Cool Klutz.