axjack's blog

axjack is said to be an abbreviation for An eXistent JApanese Cool Klutz.

2019年6月 統計検定準一級 問11

問題の超大雑把な概要

詳細はお手元に問題を用意してください。

定数の情報:

\theta,\phi \in [0,1], \phi + \theta \le 1

推移確率行列M

\begin{equation}M=\begin{pmatrix} 1-\theta & \theta & 0  \\\\ \theta & 1-\theta-\phi  & \phi \\\\ 0 & \phi & 1-\phi  \end{pmatrix} \end{equation}

問題

[1]

格付けの状態(A,B,C)を番号(1,2,3)に対応させ、 i,j \in \{1,2,3\} とする。ある年の格付けAが100社・格付けBが20社・格付けCが0社。翌年において、
・A→Bに推移した企業が5社
・B→Aに推移した企業が1社
・他に変化はなかった
\phi = 0.01とする

このとき、\theta最尤推定値を、小数点第3位を四捨五入して答えよ。

[2]

Mの固有値をλとし、直交行列(U)_{ij}= u_{ij}
\begin{equation}U^{T}MU = \begin{pmatrix} \lambda_{1} & 0 & 0 \\\\ 0 & \lambda_{2} & 0 \\\\ 0 & 0 & \lambda_{3} \end{pmatrix} \end{equation}
を満たすように取る。
t年に於いて格付けAの企業がt+nにおいて格付けCである確率を、n・λ・uを用いて表せ。

解答

[1]

ある年→翌年の格付けの変化は、

\begin{pmatrix} 95 & 5 & 0 \\\\ 1 & 19 & 0 \\\\ 0 & 0 & 0 \end{pmatrix}

と表される。求めたいのはθの最尤推定値である。確率は与えられている。確率分布は3項の状態を扱っているので多項分布の3項版とする。


多項分布の式は、\displaystyle Mult( m | \mu, N ) = \frac{N!}{m_{1}! \cdots m_{K}! } \prod_{k=1}^{K}\mu_{k}^{m_k} ただし N=\sum_{k=1}^K m_k

よって、尤度関数Lは

 \displaystyle L = \frac{ (95+5+0)! }{95!5!0!} (1-\theta)^{95} \theta^{5} 0^0 \times \frac{ (1+19+0)! }{1!19!0!} \theta^1 (1-\theta-\phi)^{19} \phi^0  \times 
\frac{ (0+0+0)! } {0!0!0!} 0^0 \phi^0 (1-\phi)^0


\phi = 0.01*1を代入しながら整理すると、

 \displaystyle L = \frac{ (100)! }{95!5!0!} (1-\theta)^{95} \theta^{5} 0^0 \times \frac{ (20)! }{1!19!0!} \theta^1 (1-\theta-0.01)^{19} (0.01)^0  \times 
\frac{ (0+0+0)! } {0!0!0!} 0^0 (0.01)^0 (1-0.01)^0


さらに、 t^0 = 0^0 = 0! = 1 , t \in \mathbb{R}から、

 \displaystyle L = \frac{ 100! }{95!5!} (1-\theta)^{95} \theta^{5} \times \frac{ 20! }{1!19!} \theta (0.99-\theta)^{19}

と簡約化できる。


従って、\theta最尤推定値を \displaystyle \frac{\partial}{\partial \theta} \log L = 0 な θで導出できると信ずれば*2

 \displaystyle \frac{ \partial } {\partial \theta } \log L  = 0 から、

 \displaystyle \frac{ \partial } {\partial \theta } \log L  =  \frac{ \partial } {\partial \theta } \Bigl( \log(100!) - \log(95!) - \log(5!) + 95\log(1-\theta) + 5\log(\theta) + \log(20!) - \log(1!) - \log(19!) + \log(\theta) + 19\log(0.99 - \theta)  \Bigr)  = 0 \\\\
\displaystyle \iff  95 \frac{-1}{1-\theta} + 6 \frac{1}{\theta} + 19\frac{-1}{0.99 - \theta}= 0 \\\\
\displaystyle \iff  120\theta^2 -124.99\theta + 5.94 = 0 \\\\
\displaystyle \iff  \theta = 0.991667 \ or \ 0.0499159

ここで、\phi + \theta \le 1 \iff 0.01 + \theta \le 1 \iff \theta \le 0.99 から、 \theta = 0.0499159 \simeq 0.05

となる。

[2]

チャップマン–コルモゴロフ方程式 より、推移確率行列Mのn乗はn回の推移の確率に等しいので、

  • M^nを計算し
  • 格付けA → 格付けCに対応するM^n上の成分すなわち
  • M^nの1行3列目の成分を求め

れば良い。さて、

\begin{equation}U^{T}MU = \begin{pmatrix} \lambda_{1} & 0 & 0 \\\\ 0 & \lambda_{2} & 0 \\\\ 0 & 0 & \lambda_{3} \end{pmatrix} \end{equation}

の両辺をn乗すると、

\begin{equation}U^{T}M^nU = \begin{pmatrix} \lambda_{1}^n & 0 & 0 \\\\ 0 & \lambda_{2}^n & 0 \\\\ 0 & 0 & \lambda_{3}^n \end{pmatrix} \end{equation}

となるので、

\begin{equation} M^n =  U \begin{pmatrix} \lambda_{1}^n & 0 & 0 \\\\ 0 & \lambda_{2}^n & 0 \\\\ 0 & 0 & \lambda_{3}^n \end{pmatrix} \end{equation} U^T

従って、

\begin{equation} M^n =  \begin{pmatrix} u_{11} & u_{12} & u_{13} \\\\  u_{21} & u_{22} & u_{23}  \\\\ u_{31} & u_{32} & u_{33}   \end{pmatrix} \begin{pmatrix} \lambda_{1}^n & 0 & 0 \\\\ 0 & \lambda_{2}^n & 0 \\\\ 0 & 0 & \lambda_{3}^n \end{pmatrix} \end{equation} \begin{pmatrix} u_{11} & u_{12} & u_{13} \\\\  u_{21} & u_{22} & u_{23}  \\\\ u_{31} & u_{32} & u_{33}   \end{pmatrix} ^T

\iff \begin{equation} M^n =  \begin{pmatrix} u_{11} & u_{12} & u_{13} \\\\  u_{21} & u_{22} & u_{23}  \\\\ u_{31} & u_{32} & u_{33}   \end{pmatrix} \begin{pmatrix} \lambda_{1}^n & 0 & 0 \\\\ 0 & \lambda_{2}^n & 0 \\\\ 0 & 0 & \lambda_{3}^n \end{pmatrix} \end{equation} \begin{pmatrix} u_{11} & u_{21} & u_{31} \\\\  u_{12} & u_{22} & u_{32}  \\\\ u_{13} & u_{23} & u_{33}   \end{pmatrix}

となるので、M^nの1行3列目の成分は、

 \begin{pmatrix} \lambda_{1}^n u_{11} & \lambda_{2}^n u_{12} & \lambda_{3}^n u_{13} \end{pmatrix} 
\begin{pmatrix} u_{31} & u_{32} & u_{33}  \end{pmatrix}^T \\\\
=  \displaystyle \lambda_{1}^n u_{11}u_{31}  + \lambda_{2}^n u_{12}u_{32} + \lambda_{3}^n u_{13}u_{33}  \\\\
=  \displaystyle \sum_{k=1}^{3} \lambda_{k}^n u_{1k}u_{3k}


である。

*1:ここで尤度関数の変数が(θ,φ)からθのみになるのだと思われる。慈悲に感謝。

*2:真面目にやる場合はラグランジュの未定なんちゃら法とか極値が極大値になっているかとかを調べる必要があるゆえ。然し乍らどうやら信ずるものは救われるらしく、たとえば多項分布の推定 - MOXBOX / HazMatを参照。