axjack's blog

### axjack is said to be an abbreviation for An eXistent JApanese Cool Klutz ###

2019-01-01から1年間の記事一覧

2019年大掃除大会まとめ

揃えるもの 液体固体 カビキラー バスマジックリン 油汚れマジックリン ← 心強い パイプユニッシュ いつもの台所洗剤 ゴシゴシ系 歯ブラシ メラミンスポンジ ← ボロボロになりがち ぞうきん ← 便利。乾拭き重要 スポンジ アルコール除菌ペーパー 防具 マスク…

『確率4万分の1、県の入札くじに6回連続当選「奇跡的」』なのかどうかを調べよう

www.asahi.com 動機 面白いニュースを見かけたので計算してみましたなポストです。記事のこの部分に注目しました。 6回のくじにはそれぞれ制限価格で入札した3~8の鑑定業者が参加した。6回連続で当たる確率を計算すると約4万分の1となる。 奇跡ってど…

2018年11月 統計検定2級 問9

この問題をなぜ解くのか 問題文の概要 解答 問(1) 問(2) この問題をなぜ解くのか 前にこんなこと統計検定であって確率検定ではないので、サイコロを7回投げる時2以下の目が出る確率を解けるようになってもなんだかなぁ統計検定2級に合格したので勉強法や…

超幾何分布

何度やっても忘れるのでブログに書いて覚えよう。 超幾何分布の確率質量関数 計算例 その1 男50人女50人から10人を選ぶ。10人のうち男3人女7人となる確率pは、超幾何分布を用いて その2 統計検定準一級2017年問10より引用。表の80人から30人を無作為抽出する…

連の検定(Runs Test for Detecting Non-randomness)

はじめに 連の検定についてよく分からなかったのでRで実装して確かめてみました。 連とは? 2値{A,B}を取る系列ABAABBAAABBBABがあった時、これをA | B | AA | BB | AAA | BBB | A | Bと連続する同じ値ごとに分割できるように見える。この時同じ文字または…

自由度調整済み決定係数を決定係数で表す

やること タイトルの通り式変形をするだけです。 式変形

2019年8月をワールドワイドに考える

はじめに UTCを考慮すると途端にわけわからなくなったので整理する。 UTCとは wikiで協定世界時 - Wikipediaをみませう。 UTCってプラマイいくつまであるの? 時間帯 (標準時) - WikipediaによるとからUTC-12からUTC+14まである。日本はUTC+9 2019年8月をUTC…

久保川『現代数理統計学の基礎』p.25 命題2.21 (平方変換)

やること 確率変数の確率密度関数をとする。 Xの平方変換に対して、Yの密度関数は? という命題について、式変形の行間を埋めます。 以下途中式 に対してであるからと無事式変形できる。

多変量解析法入門pp.52-53のテコ比の式変形

やること 多変量解析法入門p.52の式(4.35)あたりの式変形の行間を埋めてみる。 式変形 式(4.35)にて ここで、上式の第一項は 第二項は より、バラバラにした項を足して元に戻せば、 となる。ということで、の係数をテコ比と呼ぶ。式(4.36)

とりあえずアソシエーション分析する〜その3〜

手を動かして形は理解したっぽいので、今度こそ(?)仕組みを理解する編です。いきなり読むと分からなくなるので、何となくアソシエーション分析のパッケージ{arules}は動かせたけどイマイチ意味がわからないんだよなーという状態になった時に読むのをお勧め…

とりあえずアソシエーション分析する〜その2〜

前回に引き続きとりアソしてみます。 前回↓ axjack.hatenablog.jp tranID で group-by した時グループに属するitemが1個のもの、を除外する ファイルの準備 前処理 データの確認 参考 tranID で group-by した時グループに属するitemが1個のもの、を除外する…

とりあえずアソシエーション分析する

タイトル通りです。とりあえず動かしてみたい!という願望でやってみました。理解は後からついてくると信じて、まずは手を動かしたいという人向け?の記事です。 読み込むデータの準備 データの読み込み 生成したtranデータの確認 いよいよアソシエーション…

2019年6月 統計検定準一級 問11

問題の超大雑把な概要 詳細はお手元に問題を用意してください。 定数の情報: 推移確率行列: 問題 [1] 格付けの状態(A,B,C)を番号(1,2,3)に対応させ、とする。ある年の格付けAが100社・格付けBが20社・格付けCが0社。翌年において、 ・A→Bに推移した企業が5…

【一年ぶり】自宅のインターネットが使えなくなって使えるようになるまでの顛末

タイトルの通りですがまさか一年前と同じタイミングで同じ理由で回線が故障するとは笑 来年も起こるのだろうか 去年はこちら↓ axjack.hatenablog.jp 要約 ネットが繋がらない 去年と同じか!? 回線事業者に連絡 → 局で故障があった 時系列 いつ だれ・なに …

2019年6月 統計検定準一級 問3の[1]の(1)(2)

問3の[1]の(1)(2) 問3の[1]の(1) 母比率をとする。また、は近似的に正規分布に従う。 、帰無仮説、対立仮説の片側検定。帰無仮説のもとでが0.0733以上となる確率は? 解答 帰無仮説のもと、 を計算すれば良い。数字を代入すると、 問3の[1]の(2) 母比率をと…

重回帰分析をRで

やること ソースコード 結果の確認 (1)回帰式 (2)自由度調整済み寄与率 (3)同じ地区で広さ=70平米, 築年数=10年, 価格=5.8千万円の提示は妥当か やること 永田『多変量解析法入門』(以下参考書)よりp.2のデータをもとに重回帰分析を行う。 ソースコード # デ…

2019年6月 統計検定準一級 問1

はじめに 問題を解く ポアソン分布の性質 ポアソン分布に従う確率変数の和の分布 条件付き確率分布 はじめに 本番で解けなかった問題を解いてみます。今回は問1です。この問題で問われていることは 確率分布の和 条件付き確率分布 です。似たような問題ない…

2019年6月 統計検定準一級 問10

Rでロジスティック回帰 テーマはロジスティック回帰。問題文に記載された出典を調べると、Risk Analysis of the Space Shuttle: Pre-Challenger Prediction of Failureがヒットするので、このデータを用いれば再現が出来る(のだろうか)。ひとまずやってみる…

2019年6月度 統計検定準一級受験記録

記録 感想 次回も受験しますか? 反省点・改善すべき点 おわりに 記録 受験日:2019/6/16(日) 会場:中央大学 後楽園キャンパス 感想 人生で一番難しい数学の試験だった 手ごたえは皆無 開始の合図とともに終了の合図が聞こえる 試合開始直後に殺されていた…

初期値1から始めたニュートン法による平方根の近似値計算は、7回ほど反復計算しておけば大丈夫そうです。 

はじめに ニュートン法による平方根の近似 例 結論 コード 結果確認 要約統計量 箱ひげ図 おわりに はじめに 今日で令和元年ゴールデンウィークも無事終了です。 前回に引き続きニュートン法で平方根を求めてみました。今回は、N = [1,1000] の範囲でニュー…

ニュートン法で平方根の値を求める

R

きっかけ 電卓のルートってどうやって求めるんだっけ? → たぶんニュートン法だろうなぁ。ということで、Rで簡単に実装して計算してみました。 実装 ニュートン法 fnewton <- function(xn=1,p=2,a=2){ return ( xn - ( xn^p - a )/( p * ((xn)^(p-1)) ) ) } …

ソフトバンクからOCNモバイルONEにMNPで乗り換える

はじめに 手続き 諸元 手続き経過 SIMカードが届いてから 構成プロファイルのインストール MNP開通手続き SIMカード入れ替え OCN関連のアプリをインストール 各種疎通テスト おわりに 簡単だったこと 難しかったこと はじめに 平成もそろそろ終わりそうな今…

固定長ファイルをテキストエディタで分割する

はじめに 分割ってどういうこと? 想定するデータの形式 やりかた ヘッダレコード エンドレコード トレイラーレコード データレコード レコード種別に関係なく30byteずつ分割する おわりに 【追記】分割されたファイルから改行を消す はじめに 3月もあと10日…

ggplot, geom_point, facet_gridの練習

R

はじめに ggplotやqplotを日々練習しています。ggplot, geom_point, facet_gridを組み合わせると、 グラフ内側のx軸(量的) グラフ内側のy軸(量的) グラフ外側の横側(質的) グラフ外側の上側(質的) 点の色(質的・量的) のように5変数くらい同時に、割と分か…

データミックス(DataMix)のデータサイエンティスト育成コースページにあるスクール紹介動画[0:29]~[0:31]辺りに表示される書籍を出来る限り書き起こす

はじめに データミックス(DataMix)とは? 書き起こし 当該箇所 書籍リスト 感想 補足 第四次産業革命スキル習得講座 はじめに インスタグラムで流れる企業宣伝動画を見ていたらデータミックス(DataMix)のデータサイエンティスト育成コースなるものが目に飛び…

不偏分散が不偏であることを確認する

元ネタ 統計の基礎 の 母集団からランダムに取り出した標本でなくても,例えば10個の固定した値を4個と6個に分ける場合,両者を比較するには何で割った分散を使うかという問題についても,一貫して n − 1で割るほうが比較としては正しくなります: を別デー…

所沢市の平成29年版統計書-2 人口(その1)-1.人口の推移から、人口の総数=男+女となっていることを確認する

はじめに 動機 やること データソース コード sublimeでの加工 1. 総数-男-女の列を取得する 2. 数値表現をカンマ有りからカンマ無しへと置換する 3. ダブルクオーテーションを削除する Rで読み込み 結果確認 おわりに はじめに 動機 昨今不正統計が話題であ…

次の元号をRで予想してみる〜前処理編〜

はじめに コード rvestの準備 rvestでwebスクレイピング→テキスト処理(1文字ずつに分解) 結果確認 終わりに 参考にしたサイト はじめに 平成もあと3ヶ月足らずで終わってしまいますね。色んな方が次の元号を予想している流れがあるので、自分でも予想して…

非階層的な部署コードと階層的な部署テキストを持つテーブルから、部署テキストで階層構造を導出する。の補足

SQL

まえがき ソースコード 実行環境 テーブル作成 データinsert 部署の紐付け 結果確認 前回の抽出ロジックの場合 考察 まえがき 前回の宿題の1つが解決できたのでメモを残す記事です。前回の宿題とは、 部署テキストの途中から他の部署名を含むという場合(e.g…

非階層的な部署コードと階層的な部署テキストを持つテーブルから、部署テキストで階層構造を導出する。

SQL

はじめに タイトルの詳しい説明 どうやるか? なぜこのように抽出すると(一見)うまくいくのか? ソース 実行環境 テーブル作成 データinsert 部署の紐付け 結果確認 感想 良い点 改善すべき点 はじめに タイトルの詳しい説明 日本語って難しいですね。非階層…

axjack is said to be an abbreviation for An eXistent JApanese Cool Klutz.