axjack's blog

axjack is said to be an abbreviation for An eXistent JApanese Cool Klutz.

統計検定2級に合格したので勉強法やら参考書などを書いておきます。

はじめに

勉強の甲斐あって、2018年11月実施の統計検定2級に合格しました。ネットで検索したブログやら記事やらwebページやらを励みに、なんとか合格にたどり着いたというところです。

これから受験するみなさんの何か参考になったら良いな、という気持ちでこのブログ記事を書きます。

成績

2回受験して2回目で合格しました。

1回目の受験(2018年6月)

  • 成績:不合格
  • 評価:?(不合格者のうち、上位20〜40 %)
  • 正答数:18問正解 in 34問
  • 正答率:53 %

2回目の受験(2018年11月)

  • 成績:合格
  • 評価:A(優秀成績賞)
  • 正答数:27問正解 in 34問
  • 正答率:79 %

参考書・お世話になった本

参考リンク・お世話になったリンク

資料探しのコツは、

  • 統計 講義 site:ac.jp
  • 医療統計 講義
  • 生物統計 講義

のように、できれば大学の学部レベルあたりの講義資料を見るのが良いでしょう。まとまっているし信憑性もありそうですし。1つの資料にこだわらず何個も資料を横串で見ると、理解が深まって良いと思います。というか、一つの資料でカバーできる範囲では無いんだなぁと探していて思いました。

勉強法

全般

  • 参考書に掲げた書籍の例題から演習問題から、片っ端から解く
  • 参考リンクに掲げたページを、暇な時に読みこなす
  • 勝手にヤマをハラない
    • ここは難しいから諦めよう → 1回目の受験で落ちた原因
    • 試験範囲は『統計検定2級対応 統計学基礎』の全ページです

分野別?の対策

教科書の目次に沿って書いてみます。

第1章 データの記述と要約

箱ひげ図やローレンツ曲線やジニ係数ラスパイレス指数でおなじみの第1章。ローレンツ曲線なんてコラム的な扱い、試験に出ないだろう・・・と思っていましたがちゃんと出題されます。ジニ係数ラスパイレス指数も同様です。

練習問題がなかなか見つからない範囲ですが、教科書の例題や定義はきちんと押さえておきましょう。練習問題が少ないとはいえ、試験前に2・3回は自分で計算して置いた方が良いです。定義式をふわっと覚えているだけだと、実際に試験で出題された際に後悔します。

第2章 確率と確率分布

分布と名のつくものは全暗記。この式で定義されているのは何分布?なんて問題も出ます。暗記さえしていれば解ける問題もあるので、そういうところは確実に抑え失点を防ぎましょう。

試験に出る応用的な確率の問題はわりかし難しいので、ここはあまり注力しなくても良いのでは?と個人的には思います。統計検定であって確率検定ではないので、サイコロを7回投げる時2以下の目が出る確率を解けるようになってもなんだかなぁ、と。

ただ、ベイズの定理や条件付き確率は、典型的な問題であれば解けるようにしておいた方が良いと思います。サイコロよりはベイズの定理の方が重要かつ為になりそうな概念かと。

第3章・第4章・第5章・第6章

教科書によると、ここからが2級のメインパートです。ひとまずざっくりまとめると、

  • 第3章 統計的推定
  • 第4章 統計的仮説検定
    • 仮説検定
  • 第5章 線形モデル分析
    • 線形回帰
    • 分散分析
  • 第6章 その他の分析法 正規性の検討,適合度と独立性のΧ2検定
    • 適合度の検定
    • 独立性の検定

です。

1回目落ちて2回目で合格したので自信(?)を持って言えますが、3章から順に勉強しない方が良いです。なぜかというと、ここからが2級のメイン!と意気込んで勉強するも意味がわからず挫折orz となること間違いなしだからです。点推定も信頼区間も、割と挫折を誘います。

なので、まずは3〜6章を一通り眺めて、自分にしっくりきそうな章を1つだけ見つけてください。見つかったらその章を浅く理解します。そしてその後、他の章へ戻り浅く理解し、ぐるぐると浅い理解を反復し、最終的に3〜6章全部の理解を深めましょう。

じつは3〜6章は推測統計の枠に入った仲間たちなので、どこから始めても横のつながりが垣間見えて、最終的には全部つながります。(そこが2級の醍醐味なのかもしれません)

なお私は、

仮説検定を浅く理解
↓
適合度の検定と独立性の検定を楽しむ(∵意外と計算が楽なので)
↓
分散分析を楽しむ(∵意外と計算が楽なので。但し一元配置に限る。)
↓
仮説検定を浅く理解
↓
線形回帰をチラ見
↓
仮説検定を浅く理解
↓
点推定・信頼区間をチラ見
↓
仮説検定の問題を解きまくる
点推定・信頼区間の問題を解きまくる
たまに適合度独立性分散分析線形回帰の問題を解く
・・・

のようなループで理解を深めることができ・・・たと思います。

その他

合格者の声

合格してから気づいたのですが、公式サイトの統計検定TOP > 合格者の声 > 2級も必見です。様々な方の勉強方法やモチベーションが書かれています。

電卓

10桁ぐらい表示できれば十分でしょう。私が買ったのは「CASIO MH-10T」です。電卓で大事なことを箇条書きすると、

  • 電卓を叩いた時のレスポンスが極めて大事
  • [C]・[AC]の挙動の違いを理解する
  • [M+]・[M-]・[MRC]を駆使する
  • [ = ] を押さなくても計算ができる場合があることを理解する

です。たとえば、 n = 20なデータの組 (x_i, y_i). i \in [1,n] の、

  • 総和
  • 二乗和
  • 積和
  • 平均
  • 分散
  • 共分散
  • 回帰係数の傾きの推定量
  • 回帰係数の切片の推定量
  • 相関係数

あたりをさらっと電卓で出せるようになると良いでしょう。慣れれば機械的に答えが出てしまいます。

細かく言えば、[=] を押さなくても計算ができる場合があることを理解するは、

i x_i y_i
1 3 4
2 7 8
3 5 6
4 1 2

とデータが与えられた時に積和: \sum{}x_i y_i を求めるとします。この時、

[3] [x] [4] [=] [M+]
[7] [x] [8] [=] [M+] 
[5] [x] [6] [=] [M+] 
[1] [x] [2] [=] [M+] 
[MRC]

と電卓を叩くのではなく、

[3] [x] [4] [M+]
[7] [x] [8] [M+] 
[5] [x] [6] [M+] 
[1] [x] [2] [M+] 
[MRC]

と叩く、ということです。素早く計算でき、かつ打鍵ミス低減 → 問題をたくさん解くことができる、に繋がります。このTipsはnが大きくなるにつれて効果が大きくなるでしょう。

おわりに

試験まで諦めずに勉強し、試験中も諦めなければなんとか合格できるはずです。Enjoy 統計学!

2級合格後の自分は?

準1級合格を目指して勉強しています。どうやら線形代数の知識をフル活用するらしく、絶賛苦しんでいる最中です。対称行列の2次形式を偏微分したり楽しい毎日を送っています。