問題文
リンクが切れていないなら問題文を参照。
問題の大雑把な概要
- 中性子の月次カウントデータ217点が与えられている( )
- Fused Lasso を用いて を平滑化した実数列( ) を生成する。
- Fused Lasso:
- 小問〔1〕:
- の場合にFused Lassoで平滑化した結果を表す図を選ぶ。
- 小問〔2〕:
- 図が与えられているので適切な平滑化手法(Fused Lasso) を選ぶ。
小問〔1〕:
Lassoは
- 罰則項 の 各 を、0にしたりしなかったりするいい感じの回帰分析。
- λを大きくすると0になる各 は多くなり、λが小さかったら0になる各 は少なくなる。
という考えのもと小問〔1〕を見つめる。
ところで今回のは通常のLassoの回帰係数ではなく「 を平滑化した実数列( ) 」ということを念頭におくと、得られるβはyにほぼほぼ近いがいい感じに平滑化されているものだと考えることができる。
また、罰則項の中身がということは、第i+1項と第i項の差を表している。ということで、
- ならば隣接する項の差が0 ⇔ グラフの横軸に平行
と解釈できる。従って、λ=500よりFused Lassoで得られるβは、0になる が多い→横軸に平行な線が多い。
と考えて、答えは4となる。
小問〔2〕:
Lassoの問題なので、
- 罰則項はきっと の形をしているであろう
- 誤差項は2乗誤差だよねきっと
- 平滑化と言っているし誤差項の絶対値の中身は、差の形になっている
を踏まえて → 4,5 に絞る。
次に、4と5の違いを考えると
- 4は
- βの3項間の傾きについて述べている。
- 5は
- βの4項間の傾きについて述べている。
となることから、Lassoで得られたβによる傾き( )が3点の間で等しくなりがちな選択肢4が図に適していそうである。
5の場合は の中のパラメータの数が選択肢4よりは複雑なので図ほどシンプルな曲線は描けずもう少し滑らかとなるであろう。