axjack's blog

axjack is said to be an abbreviation for An eXistent JApanese Cool Klutz.

多変量解析法入門pp.52-53のテコ比の式変形

やること 多変量解析法入門p.52の式(4.35)あたりの式変形の行間を埋めてみる。 式変形 式(4.35)にて ここで、上式の第一項は 第二項は より、バラバラにした項を足して元に戻せば、 となる。ということで、の係数をテコ比と呼ぶ。式(4.36)

とりあえずアソシエーション分析する〜その3〜

手を動かして形は理解したっぽいので、今度こそ(?)仕組みを理解する編です。いきなり読むと分からなくなるので、何となくアソシエーション分析のパッケージ{arules}は動かせたけどイマイチ意味がわからないんだよなーという状態になった時に読むのをお勧め…

とりあえずアソシエーション分析する〜その2〜

前回に引き続きとりアソしてみます。 前回↓ axjack.hatenablog.jp tranID で group-by した時グループに属するitemが1個のもの、を除外する ファイルの準備 前処理 データの確認 参考 tranID で group-by した時グループに属するitemが1個のもの、を除外する…

とりあえずアソシエーション分析する

タイトル通りです。とりあえず動かしてみたい!という願望でやってみました。理解は後からついてくると信じて、まずは手を動かしたいという人向け?の記事です。 読み込むデータの準備 データの読み込み 生成したtranデータの確認 いよいよアソシエーション…

2019年6月 統計検定準一級 問11

問題の超大雑把な概要 詳細はお手元に問題を用意してください。 定数の情報: 推移確率行列: 問題 [1] 格付けの状態(A,B,C)を番号(1,2,3)に対応させ、とする。ある年の格付けAが100社・格付けBが20社・格付けCが0社。翌年において、 ・A→Bに推移した企業が5…

【一年ぶり】自宅のインターネットが使えなくなって使えるようになるまでの顛末

タイトルの通りですがまさか一年前と同じタイミングで同じ理由で回線が故障するとは笑 来年も起こるのだろうか 去年はこちら↓ axjack.hatenablog.jp 要約 ネットが繋がらない 去年と同じか!? 回線事業者に連絡 → 局で故障があった 時系列 いつ だれ・なに …

2019年6月 統計検定準一級 問3の[1]の(1)(2)

問3の[1]の(1)(2) 問3の[1]の(1) 母比率をとする。また、は近似的に正規分布に従う。 、帰無仮説、対立仮説の片側検定。帰無仮説のもとでが0.0733以上となる確率は? 解答 帰無仮説のもと、 を計算すれば良い。数字を代入すると、 問3の[1]の(2) 母比率をと…

重回帰分析をRで

やること ソースコード 結果の確認 (1)回帰式 (2)自由度調整済み寄与率 (3)同じ地区で広さ=70平米, 築年数=10年, 価格=5.8千万円の提示は妥当か やること 永田『多変量解析法入門』(以下参考書)よりp.2のデータをもとに重回帰分析を行う。 ソースコード # デ…

2019年6月 統計検定準一級 問1

はじめに 問題を解く ポアソン分布の性質 ポアソン分布に従う確率変数の和の分布 条件付き確率分布 はじめに 本番で解けなかった問題を解いてみます。今回は問1です。この問題で問われていることは 確率分布の和 条件付き確率分布 です。似たような問題ない…

2019年6月 統計検定準一級 問10

Rでロジスティック回帰 テーマはロジスティック回帰。問題文に記載された出典を調べると、Risk Analysis of the Space Shuttle: Pre-Challenger Prediction of Failureがヒットするので、このデータを用いれば再現が出来る(のだろうか)。ひとまずやってみる…

2019年6月度 統計検定準一級受験記録

記録 感想 次回も受験しますか? 反省点・改善すべき点 おわりに 記録 受験日:2019/6/16(日) 会場:中央大学 後楽園キャンパス 感想 人生で一番難しい数学の試験だった 手ごたえは皆無 開始の合図とともに終了の合図が聞こえる 試合開始直後に殺されていた…

初期値1から始めたニュートン法による平方根の近似値計算は、7回ほど反復計算しておけば大丈夫そうです。 

はじめに ニュートン法による平方根の近似 例 結論 コード 結果確認 要約統計量 箱ひげ図 おわりに はじめに 今日で令和元年ゴールデンウィークも無事終了です。 前回に引き続きニュートン法で平方根を求めてみました。今回は、N = [1,1000] の範囲でニュー…

ニュートン法で平方根の値を求める

R

きっかけ 電卓のルートってどうやって求めるんだっけ? → たぶんニュートン法だろうなぁ。ということで、Rで簡単に実装して計算してみました。 実装 ニュートン法 fnewton <- function(xn=1,p=2,a=2){ return ( xn - ( xn^p - a )/( p * ((xn)^(p-1)) ) ) } …

ソフトバンクからOCNモバイルONEにMNPで乗り換える

はじめに 手続き 諸元 手続き経過 SIMカードが届いてから 構成プロファイルのインストール MNP開通手続き SIMカード入れ替え OCN関連のアプリをインストール 各種疎通テスト おわりに 簡単だったこと 難しかったこと はじめに 平成もそろそろ終わりそうな今…

固定長ファイルをテキストエディタで分割する

はじめに 分割ってどういうこと? 想定するデータの形式 やりかた ヘッダレコード エンドレコード トレイラーレコード データレコード レコード種別に関係なく30byteずつ分割する おわりに 【追記】分割されたファイルから改行を消す はじめに 3月もあと10日…

ggplot, geom_point, facet_gridの練習

R

はじめに ggplotやqplotを日々練習しています。ggplot, geom_point, facet_gridを組み合わせると、 グラフ内側のx軸(量的) グラフ内側のy軸(量的) グラフ外側の横側(質的) グラフ外側の上側(質的) 点の色(質的・量的) のように5変数くらい同時に、割と分か…

データミックス(DataMix)のデータサイエンティスト育成コースページにあるスクール紹介動画[0:29]~[0:31]辺りに表示される書籍を出来る限り書き起こす

はじめに データミックス(DataMix)とは? 書き起こし 当該箇所 書籍リスト 感想 補足 第四次産業革命スキル習得講座 はじめに インスタグラムで流れる企業宣伝動画を見ていたらデータミックス(DataMix)のデータサイエンティスト育成コースなるものが目に飛び…

不偏分散が不偏であることを確認する

元ネタ 統計の基礎 の 母集団からランダムに取り出した標本でなくても,例えば10個の固定した値を4個と6個に分ける場合,両者を比較するには何で割った分散を使うかという問題についても,一貫して n − 1で割るほうが比較としては正しくなります: を別デー…

所沢市の平成29年版統計書-2 人口(その1)-1.人口の推移から、人口の総数=男+女となっていることを確認する

はじめに 動機 やること データソース コード sublimeでの加工 1. 総数-男-女の列を取得する 2. 数値表現をカンマ有りからカンマ無しへと置換する 3. ダブルクオーテーションを削除する Rで読み込み 結果確認 おわりに はじめに 動機 昨今不正統計が話題であ…

次の元号をRで予想してみる〜前処理編〜

はじめに コード rvestの準備 rvestでwebスクレイピング→テキスト処理(1文字ずつに分解) 結果確認 終わりに 参考にしたサイト はじめに 平成もあと3ヶ月足らずで終わってしまいますね。色んな方が次の元号を予想している流れがあるので、自分でも予想して…

非階層的な部署コードと階層的な部署テキストを持つテーブルから、部署テキストで階層構造を導出する。の補足

SQL

まえがき ソースコード 実行環境 テーブル作成 データinsert 部署の紐付け 結果確認 前回の抽出ロジックの場合 考察 まえがき 前回の宿題の1つが解決できたのでメモを残す記事です。前回の宿題とは、 部署テキストの途中から他の部署名を含むという場合(e.g…

非階層的な部署コードと階層的な部署テキストを持つテーブルから、部署テキストで階層構造を導出する。

SQL

はじめに タイトルの詳しい説明 どうやるか? なぜこのように抽出すると(一見)うまくいくのか? ソース 実行環境 テーブル作成 データinsert 部署の紐付け 結果確認 感想 良い点 改善すべき点 はじめに タイトルの詳しい説明 日本語って難しいですね。非階層…

センター試験2019 数学I・数学Aの統計の問題だけを解く。数学Ⅱ・数学Bの統計もちょっとだけ解く。

www.toshin.com 統計のみ解いて、確率は手を出さないことにします・・・。問題文はリンク先または適当にググってください。 数学I・数学A〔2〕 (1) 2013年のヒストグラム 図1によると、2013年のboxplot(箱ひげ図)は、 最小値:72 1Q:76 中央値:81 3Q:8…

統計検定2級に合格したので勉強法やら参考書などを書いておきます。

はじめに 成績 1回目の受験(2018年6月) 2回目の受験(2018年11月) 参考書・お世話になった本 参考リンク・お世話になったリンク 勉強法 全般 分野別?の対策 第1章 データの記述と要約 第2章 確率と確率分布 第3章・第4章・第5章・第6章 その他 合格者の声 …

アーカイ部

リンク ja:dokuwiki [DokuWiki] ja:features [DokuWiki] 低価格・格安のライトプラン - レンタルサーバーはさくらインターネット Amazon S3(拡張性と耐久性を兼ね揃えたクラウドストレージ)|AWS Amazon S3に画像を置いてアクセス制御 :: GitHub Pages | R…

統計学入門 p.65 問3.4 ブートストラップ(途中)

データ data.x <- c(71,68,66,67,70,71,70,73,72,65,66) data.y <- c(69,64,65,63,65,62,65,64,66,59,62) 相関係数は > cor(data.x, data.y) [1] 0.5580547 ブートストラップ 11組のデータからランダムに11個復元抽出し相関係数を計算する、ような関数を作る…

カイ二乗分布をRで図示する

ソース # df個のN(0,1)な確率変数の二乗和 f <- function(df) sum( rnorm(n=df,m=0,sd =1)^2 ) # 繰り返し回数 N <- 10000; # カイ二乗分布をN回計算してヒストグラムを書く showHistOfChiSqrd <- function (df){ cs <- sapply(rep(df,N),f) hist(cs, freq =…

期待値の基本からモーメント母関数まで

基本 確率分布の総和は1 期待値と原点周りのモーメント 以下は記法として覚えてしまうのが得策です。 指数関数 マクローリン展開です。 期待値の性質 モーメント母関数 上記の式を結集すると、モーメント母関数が理解できてく。はず。。となるので、を得る。

統計検定2級 2018年6月 問4の2

2010年の輸出物価指数をとすると、2011年の輸出物価指数は変化率を用いてと書ける。以下同様に書き出すと、 の式が得られる。さて、前年からの変化率が常にrであるならばとなるので、得られた式を下から上に掛けて代入していくと、となる。ところで、「変化…

平方和分解の途中式を淡々と書く。

となるが、ここで上式の第二項を取り出すととなるので、結局と得る。なお、 および、 を用いた。