axjack's blog

### axjack is said to be an abbreviation for An eXistent JApanese Cool Klutz ###

母比率の信頼区間に含まれる2次不等式を解く

母比率の信頼区間

母比率 pの母集団からサイズnの標本を抽出する。このとき標本割合  \hat{p} = x / n について、 \hat{p} は近似的に平均p、分散  pq /n  正規分布 N(p,  pq /n ) に従う。ただし、 q = 1 - p である。したがって、 z = \frac{ 
  \hat{p} - p }  {   \sqrt{pq /n }  }  と標準化した z は 標準正規分布  N(0,1) に従う。

さて、確率 \rm{P}(  -z_0 <   z   \lt  z_0  )  =  1 - \alpha から不等式  -z_0 < z < z_0  を抜き出したものに z = \frac{ 
  \hat{p} - p }  {   \sqrt{pq /n }  }  の右辺を代入すると、p100\alpha/2%信頼区間

 \displaystyle  \hat{p} - z_0 \sqrt{  \frac{pq}{n}  }  \lt  p  \lt  \hat{p} +  z_0 \sqrt{  \frac{pq}{n}  }

と表される。例えば \alpha = 0.10 とすれば、  \hat{p} - 1.64 \sqrt{  \frac{pq}{n}  }  \lt  p  \lt  \hat{p} +  1.64  \sqrt{  \frac{pq}{n}  }   である。通常ここで p は未知であり不等式の左右の \sqrt{ \, \,  } にある pはnが大なるとき \hat{p} の一致性から  \frac{pq}{n}  = \frac{  \hat{p}(1-\hat{p} )  }{n}  と置き換えて、

 \displaystyle  \hat{p} - z_0 \sqrt{  \frac{  \hat{p}(1-\hat{p}  )}{n}  }  \lt  p  \lt  \hat{p} +  z_0 \sqrt{  \frac{\hat{p}(1-\hat{p})  }{n}  }

という公式が用いられる。

2次不等式を解く

それでは、  \frac{pq}{n}  = \frac{  \hat{p}(1-\hat{p} )  }{n}  を用いず
   \hat{p} - z_0 \sqrt{  \frac{pq}{n}  }  \lt  p  \lt  \hat{p} +  z_0 \sqrt{  \frac{pq}{n}  }
 p について解いてみる。以下、式変形。

式変形

   \hat{p} - z_0 \sqrt{  \frac{pq}{n}  }  \lt  p  \lt  \hat{p} +  z_0 \sqrt{  \frac{pq}{n}  }
  \iff     - z_0 \sqrt{  \frac{pq}{n}  }  \lt   p  - \hat{p}    \lt   +  z_0 \sqrt{  \frac{pq}{n}  }
  \iff     | p  - \hat{p} |   \lt    z_0 \sqrt{  \frac{pq}{n}  }
  \iff     | p  - \hat{p} |^2   \lt   \Bigr( z_0 \sqrt{  \frac{pq}{n}  }  \Bigl)^2
  \iff     p^2 - 2p\hat{p} + (\hat{p})^2   - \Bigr( z_0 \sqrt{  \frac{pq}{n}  }  \Bigl)^2    <     0
  \iff     p^2 - 2p\hat{p} + (\hat{p})^2   - (z_0)^2  \frac{pq}{n}      <     0
  \iff     np^2 - 2np\hat{p} + n(\hat{p})^2   - (z_0)^2 pq      <     0
  \iff     np^2 - 2np\hat{p} + n(\hat{p})^2   - (z_0)^2 p(1-p)      <     0
  \iff     np^2 - 2np\hat{p} + n(\hat{p})^2   - (z_0)^2 p  +  (z_0)^2p^2      <     0
  \iff     \Bigl(n + (z_0)^2\Bigr) p^2      +   \Bigl(  -2n\hat{p}  - (z_0)^2  \Bigr)p     + n(\hat{p})^2         <     0
  \iff     p^2      +   \Bigl(  \frac{   -2n\hat{p}  - (z_0)^2   }   { n + (z_0)^2    }  \Bigr)p     + \frac{   n(\hat{p})^2  }{{ n + (z_0)^2    } }         <     0
  \iff     \Bigl(  p   +   \frac{1}{2} (    \frac{-2n\hat{p}-(z_0)^2}{ n + (z_0)^2}  )  \Bigr)^2  -  \Bigl(  \frac{1}{2} (    \frac{-2n\hat{p}-(z_0)^2}{ n + (z_0)^2}  ) \Bigr)^2    + \frac{   n(\hat{p})^2  }{{ n + (z_0)^2    } }         <     0
  \iff     \Bigl(  p   +   \frac{1}{2} (    \frac{-2n\hat{p}-(z_0)^2}{ n + (z_0)^2}  )  \Bigr)^2    <  \frac{1}{4} \Bigl(  \frac{-2n\hat{p}-(z_0)^2}{ n + (z_0)^2} \Bigr)^2  -  \frac{   n(\hat{p})^2  }{{ n + (z_0)^2    } }
  \iff   p   +   \frac{1}{2} \Bigl(    \frac{-2n\hat{p}-(z_0)^2}{ n + (z_0)^2}  \Bigr)   <   \pm  \sqrt{    \frac{1}{4} \Bigl(  \frac{-2n\hat{p}-(z_0)^2}{ n + (z_0)^2} \Bigr)^2  -  \frac{   n(\hat{p})^2  }{{ n + (z_0)^2    } }  }
  \iff   p<  - \frac{1}{2} \Bigl(    \frac{-2n\hat{p}-(z_0)^2}{ n + (z_0)^2}  \Bigr)   \pm  \sqrt{    \frac{1}{4} \Bigl(  \frac{-2n\hat{p}-(z_0)^2}{ n + (z_0)^2} \Bigr)^2  -  \frac{   n(\hat{p})^2  }{{ n + (z_0)^2    } }  }


となる。

具体例で検証

統計学基礎のp.118の例9の数字を使って検証してみる。例9の主要な数字は、

標本サイズ n = 1200
標本比率  \hat{p} = 0.054 にて
母比率 p の95%信頼区間を求める。

である。ここで、 z_0 =  1.96 とする。

公式を用いる

  \hat{p} - z_0 \sqrt{  \frac{  \hat{p}(1-\hat{p})  }{n}  }  \lt  p  \lt  \hat{p} +  z_0 \sqrt{  \frac{  \hat{p}(1-\hat{p})  }{n}  }
なので、  0.054  \pm 1.96 \sqrt{ \frac{0.054(1-0.054)}{1200}  }   =  [0.04121184, 0.06678816 ]
となる。

2次不等式を解いた結果を用いる

    p<  - \frac{1}{2} \Bigl(    \frac{-2n\hat{p}-(z_0)^2}{ n + (z_0)^2}  \Bigr)   \pm  \sqrt{    \frac{1}{4} \Bigl(  \frac{-2n\hat{p}-(z_0)^2}{ n + (z_0)^2} \Bigr)^2  -  \frac{   n(\hat{p})^2  }{{ n + (z_0)^2    } }  }
なので、Rを用いて計算すると

n <- 1200
ph <- 0.054
z0 <- 1.96
A <- (-2*(n*ph) - (z0)^2)/(n+(z0)^2)
B <- (n*ph^2)/(n+z0^2)

c(-(1/2)*A - sqrt( (1/4)*A ^2 - B),-(1/2)*A + sqrt( (1/4)*A ^2 - B))

> c(-(1/2)*A - sqrt( (1/4)*A ^2 - B),-(1/2)*A + sqrt( (1/4)*A ^2 - B))
[1] 0.04257642 0.06827005

より、 [0.04257642,0.06827005 ]
となる。

axjack is said to be an abbreviation for An eXistent JApanese Cool Klutz.