axjack's blog

### axjack is said to be an abbreviation for An eXistent JApanese Cool Klutz ###

統計学実践ワークブック 第1章 事象と確率 問1.3

[解くときのコツ]

  • 1段階目 → 解けるけど腑に落ちない
    • 条件付き確率を使った典型例*1ではあるが、やはり難しい。1%とか99%とか0.1%などといった微妙な数字が並んで混乱しがち。なんとなく計算はできるけど立式の見通しが立たない。気合いで解けることはある。解答を見ても分子分母がやたらと長くて萎える。
  • 2段階目 → 面積図*2?を書いてみる
    • 立式が思い付かないけど図さえ書ければ解けることに気づく。解ければいいっしょ、というスタンス。
  • 3段階目 → 全て記号で考える
    • 図を書くのが面倒になる。むしろ記号で表すことができれば、手書きでもプレーンテキストでもLaTeXでも書けてたとえツールが何もなくても口頭で(頭上で?暗唱で?)式を展開できるという利便性に気づく。

問1.3の概要

ワークブックp.4を参照。

条件付き確率

定義

 P(A|B) = \frac{ P(A,B) }{  P(B) }

亜種と簡単な応用

事象が増えたバージョン

 \displaystyle P(左|右) = \frac{P(左,右)}{P(右)}

  \displaystyle  P(A,B|C ) = \frac{P(A,B,C)}{P(C)}

  \displaystyle  P(A|B,C ) = \frac{P(A,B,C)}{P(B,C)}

余事象を挿入する

 P(A|B) = \frac{ P(A,B) }{  P(B) } = \frac{ P(A,B,X) + P(A,B,X^C)} {P(B)} \\
= P(A,X|B) + P(A,X^C|B)

その他

「事象Aで条件つけた事象X、の確率」と「事象Aで条件つけた『事象Xの余事象』、の確率」の和は1
 P(X|A) + P(X^C|A) = \frac{P(X,A)}{P(A)} + \frac{P(X^C,A)}{P(A)} \\
= \frac{P(X,A) + P(X^C,A)}{P(A)} \\
= \frac{P(A)}{P(A)} = 1

3つの事象の積事象を条件付き確率で分解する
 P(A,B,C) = P(A|B,C)P(B,C) \\
= P(A|B,C)P(B|C)P(C)

まれによく見る変形
 P(A,B| C) = \frac{  P(A,B,C) } {P(C)} = \frac{P(A|B,C)P(B,C)}{P(C)} \\
= P(A|B,C)P(B|C)

解答

情報をまとめると、

記号 確率 内容
P(X) 1/100 病気である確率
P(X^C) 99/100 病気ではない確率
P(Y_1 \mid X) 99/100 病気の人が検査1で陽性となる確率
P(Y_1 \mid X^C ) 2/100 病気ではない人が検査1で陽性となる確率
P(Y_2 \mid Y_1, X) 90/100 病気であり検査1で陽性となった人、が検査2で陽性となる確率
P(Y_2 \mid Y_1, X^C ) 10/100 病気ではないが検査1で陽性となった人、が検査2で陽性となる確率

[1]

P(X|Y_1)を求めれば良い。条件付き確率より、


\displaystyle P(X|Y_1) = \frac{ P(X,Y_1) } { P(Y_1) }\\
\displaystyle = \frac{P(Y_1,X) } { P(Y_1) } \\
\displaystyle = \frac{ P(Y_1|X)P(X) } { P(Y_1) }\\
\displaystyle = \frac{ P(Y_1|X)P(X) } { P(Y_1,X) + P(Y_1,X^C) }\\
\displaystyle = \frac{ P(Y_1|X)P(X) } { P(Y_1|X)P(X) + P(Y_1|X^C)P(X^C) }

[2]

 P(X|Y_2, Y_1 )を求めれば良い。


\displaystyle P(X|Y_2, Y_1 ) = \frac{P(X,Y_2,Y_1)}{P(Y_2,Y_1)}\\
\displaystyle = \frac{P(Y_2,X,Y_1)}{P(Y_2,Y_1)}\\
\displaystyle = \frac{P(Y_2|X,Y_1)P(X,Y_1)}{P(Y_2,Y_1)}\\
\displaystyle = \frac{P(Y_2|X,Y_1)P(X|Y_1)P(Y_1)}{P(Y_2,Y_1)}\\
\displaystyle = \frac{P(Y_2|X,Y_1)P(X|Y_1)}{\frac{P(Y_2,Y_1)}{P(Y_1)}}\\
\displaystyle = \frac{P(Y_2|X,Y_1)P(X|Y_1)}{P(Y_2|Y_1)}\\
\displaystyle = \frac{P(Y_2|X,Y_1)P(X|Y_1)}{  P(Y_2,X|Y_1) + P(Y_2,X^C|Y_1 ) }  \\
\displaystyle = \frac{P(Y_2|X,Y_1)P(X|Y_1)}{  P(Y_2|X,Y_1)P(X|Y_1) + P(Y_2|X^C,Y_1)P(X^C|Y_1)  }  \\

*1:「条件付き確率 病気」もしくは「ベイズの定理 病気」で検索。

*2:「条件付き確率 面積図」で検索。

axjack is said to be an abbreviation for An eXistent JApanese Cool Klutz.