axjack's blog

### axjack is said to be an abbreviation for An eXistent JApanese Cool Klutz ###

統計学実践ワークブック 第27章 AR(1)過程

ワークブックp.243にある、AR(1)過程を4つ描画します。

AR(1)過程とは

時点t = 1,2, ... , T について

 \displaystyle Y_t = c + \phi_1 Y_{t-1} + U_t

といったモデル。ここでは U_tはホワイトノイズ( WN(0,1))です。

ソースコード

# AR(1)過程を生成する
genAR1 <- function(Y,Y_1,constant,phi_1){
  Y[1] <- Y_1
  for (t in 2:length(Y)) {
    Y[t] <- constant + phi_1 * Y[t - 1] + rnorm(1,0,1)
  }
  Y
}


# 描画
dev.off()
par(mfrow=c(2,2))
Y <- numeric(100)
genAR1(Y,0,0,phi_1 = -0.6) |> plot(type="l", main="phi_1 = -0.6", xlab="", ylab="")
genAR1(Y,0,0,phi_1 = 0)    |> plot(type="l", main="phi_1 =  0", xlab="", ylab="")
genAR1(Y,0,0,phi_1 = 0.4)  |> plot(type="l", main="phi_1 =  0.4", xlab="", ylab="")
genAR1(Y,0,0,phi_1 = 0.9)  |> plot(type="l", main="phi_1 =  0.9", xlab="", ylab="")

描画結果

f:id:axjack:20211216201224p:plain

考察

  • 係数が負の時とゼロの時の違い
    • 負の時は、上下上下という規則に見える
    • 0の時は、負の時に比べれば上下上下の規則性が感じられない
  • 係数が0.4の時、
    • 隣接項がある程度似ている
  • 係数が0.9の時、
    • 滑らか

統計学実践ワークブック 第24章 クラスター分析でのメモ

データとデータを併合し、クラスターを形成したい。どのデータとデータをクラスターと認定するかは、データデータ間の距離が小さいもので決めるとする。

 

ところで、データとデータは距離が計算できるものの、データとクラスター或いはクラスターとクラスター間の距離はどのように定めれば良いか。ここで登場するのが最近隣法や最遠隣法などのクラスター間の距離の決め方である。

 

大事な点は、最近隣法にしろ最遠隣法にしろこれはあくまで距離の定め方ただそれだけであって、クラスターとして併合するか否かの認定方法は「距離が小さいもの」という基準であることには変わりない。

統計学実践ワークブック 第23章 判別分析 問23.3の[1]の判別関数の展開

久しぶりに条件付き確率(ベイズの定理)が出てきて分からん!って感じでした。類題?は統計検定準1級 2019年論述問3です。

問題文の一部

 \displaystyle f_q( x ) =  \log \frac { P(y=1| x)  }{ P(y=-1| x )  }  \tag{1}

を云々。

ポイント(復習)

 C_iをカテゴリ、 x をデータとする時、ベイズの定理より

 \displaystyle P(C_i | x ) = \frac{ P(C_i, x) } { P(x) } = \frac{ P(x | C_i ) P(C_i) }{P(x) } \propto  P(x | C_i ) P(C_i) \tag{2}

と表すことができる。

式変形の過程

(2)を用いて(1)を式変形すると、

 \displaystyle (1) =  \log \frac {   P(x, y=1 ) / P(x) }{  P(x, y = -1 )/P(x)  }

 \displaystyle =  \log \frac {   P(x, y=1 )  }{  P(x, y = -1 )}

 \displaystyle =  \log \frac {   P(x|y=1 )P(y=1) } {  P(x|y = -1 )P(y=-1)   }

 \displaystyle =  \log \frac {   P(x|y=1 )\pi_1 } {  P(x|y = -1 )\pi_2  }

となる。ここで、  P(x|y=1)正規分布 \displaystyle N(\mu_1, \Sigma_1)確率密度関数に基づいて表されるということなので、

 \displaystyle P(x|y=1 ) = (2\pi)^{-2/2}  (\det\Sigma_1)^{-1/2} \exp\Bigl( - \frac{1}{2} (x - \mu)' {\Sigma_1}^{-1} (x - \mu) \Bigr)
と置き換えれば良い。 P(x|y=-1) についても同様である。

axjack is said to be an abbreviation for An eXistent JApanese Cool Klutz.