Monthly Archives: 9月 2015

「Think Stats 第2版 プログラマのための統計入門」第11回(9/29)

Posted on by 0 comment

参加者 青木(読み手)、沼田、今井(記)

範囲 pp.120-128

9章 仮説検定

  • 9.2 HypothesisTest
    • p.122 CoinTestクラスの二つ目の関数 ミススペル
      RunMod el → RunModel
  • 9.3 平均の差を検定する
  • 9.4 他の検定統計量
  • 9.5 相関を検定する
    • p.126 下から2行目 ミススペル
      TestStatisti → TestStatistic
  • 9.6 割合を検定する

「Think Stats 第2版 プログラマのための統計入門」第10回(9/25)

Posted on by 0 comment

参加者 今井(読み手)、沼田(記)
範囲 pp.109 – 120

8章 推定

  • 8.2 分散を予測する
  • 8.3 標本分布
  • 8.4 標本バイアス
  • 8.5 指数分布
    • 最尤推定量:さいゆうすいていりょう
  • 8.6 演習問題
  • 8.7 用語集

9章 仮説検定

  • 9.1 古典的仮説検定

「Think Stats 第2版 プログラマのための統計入門」第9回(9/18)

Posted on by 0 comment

参加者 沼田(読み手)、今井、青木(記)

範囲 pp.96-108

7章 変数間の関係

  • 7.2 関係を特徴付ける
    • p.97 l.1 「最高値のビンより大きな値は、len(bins)に対応させます」ではなく「最高値のビンより大きな値は、len(bins)-1に対応させます」では?
    • p.97 図7-3について、25パーセンタイルの線では身長が200cmの体重は195cmの体重より軽いのはなぜか。
      → 「体重が200cm以上の値は200cmのビンにまとめられている。これにより体重が重い人が増えることになり、相対的に25パーセンタイルの体重が軽く算出されるのでは」という話が出たが、よく考えたら重い人が増えれば25パーセンタイルの体重も増えるはずなので、他の原因があるのではないか。
  • 7.3 相関
  • 7.4 共分散
  • 7.5 ピアソンの相関
  • 7.6 非線形関係
    • p.101 図7-4の2段目中央のグラフには相関係数がない。これはyの標準偏差が0になり、計算ができないから。
  • 7.7 スピアマンの順位相関
  • 7.8 相関と因果
  • 7.9 演習問題
  • 7.10 用語集

8章 推定

  • 8.1 推定ゲーム

「Think Stats 第2版 プログラマのための統計入門」第8回(9/15)

Posted on by 0 comment

参加者 青木(読み手)、沼田、今井(記)

範囲 pp.85-96

6章 確率密度関数

  • 6.7 モーメント
    • p.85 下
      素モーメントの読み方は? → ソモーメント (Ref. 統計用語集)
    • p.86 中ほど下
      「もしも各位置Xiで定規に錘を垂らし、…」が良くわからない。
      → 錘を振り回す力によって錘が描く円が大きくなるので、分散の大きさを慣性モーメントに例えているのだろう。
  • 6.8 歪度
  • 歪度の読み方は? → わいど (Ref. 統計用語集)
    • p.88 中ほどコード1行目 衍字
      firs ts → firsts
    • p.89 図6-3
      平均、中央値はプログラムではなくあとから書いてそう。
    • p.89 図6-4
      平均、中央値が逆。本文には平均79.0, 中央値77.3と書いてある。
  • 6.9 演習問題
  • 6.10 用語集
    • p.91 中ほど 中心モーメントの英語表記 脱字
      central momen → central moment

7章 変数間の関係

  • 7.1 散布図
    • p.94 図7-1 表題
      「RFSSの…」 は、「BRFSSの…」 の間違いか。

「Think Stats 第2版 プログラマのための統計入門」第7回(9/11)

Posted on by 0 comment

参加者 今井(読み手)、青木、沼田(記)
範囲 pp.72 – 85

5章 分布をモデル化する

  • 5.6 乱数の生成
    • ICDFとは?CDFの逆関数(inverse function)?
  • 5.7 モデルが何の役に立つの?
  • 5.8 演習問題
  • 5.9 用語集

6章 確率密度関数

  • 6.1 PDF
    • p.79 ページ上部のコード例
      sqrtの引数はvarだろう。.NormalPdfの前のスペースもおそらく不要では。
  • 6.2 カーネル密度推定
    • p.80 ページ下部のコード例
      thinkplot.Pdfの引数pdfはsample_pdfの誤り?また、その後の説明に出てくるpmfは?
  • 6.3 分布のフレームワーク
  • 6.4 Hist実装
  • 6.5 Pmf実装
  • 6.6 Cdf実装

「Think Stats 第2版 プログラマのための統計入門」第6回(9/8)

Posted on by 0 comment

参加者 沼田(読み手)、今井、青木(記)

範囲 pp.59-71

5章 分布をモデル化する

  • 5.1 指数分布
    • p.59 脱字 「指数分布(exponential distributio)」→「指数分布(exponential distribution)」
  • 5.2 正規分布
  • 5.3 正規確率プロット
  • 5.4 対数正規分布
  • 5.5 パレート分布

「Think Stats 第2版 プログラマのための統計入門」第5回(9/4)

Posted on by 0 comment

参加者 青木(読み手)、沼田、今井(記)

範囲 pp.47-58

4章 累積分布関数

  • 4.1 PMFの限界
  • 4.2 パーセンタイル
  • 4.3 累積分布関数 (CDF)
    • p.50 中程コード22行目
      countは整数0ではなく、実数0.0なのだろう?
      → probを実数計算したいからではないか。
  • 4.4 CDFの表現
    • p.51 下コード1行目
      firsts, othersはこの後参照されない。たぶん載せているコードは一部のコードで、載せていないところで使われているのではないか。
  • 4.5 CDFを比較する
  • 4.6 パーセンタイル派生統計量
    • p.54 訳注
      • URL最後のQuantilの’e’はないの?
        → 脱字のようです。’e’無しはなく、https://en.wikipedia.org/wiki/Quantile はありました。
      • “四分位数も分位数全体もQuantile”は、英語、日本語どちらのWikipediaのこと?
        → どちらも、四分位数はQuartileと書いていました。ただ、英語版WikipediaではQuartileが独立したページになっているのに対し、日本語Wikipediaでは、四分位数は分位数に転送されてそこにまとめて書かれているので、そう思ったのでは。
  • 4.7 乱数
    • p.55 なぜ一様分布なのだろう?
      → weightsの分布ではなくranksの分布だから
  • 4.8 パーセンタイル順位を比較する
  • 4.9 演習問題
  • 4.10 用語集

「Think Stats 第2版 プログラマのための統計入門」第4回(9/1)

Posted on by 0 comment

参加者 今井(読み手)、青木、沼田(記)
範囲 pp.33 – 45

3章 確率質量関数

  • 3.1 Pmf
  • 3.2 PMFをプロットする
    • 図3-1
      図2-5同様、棒グラフの左右がコードの指定と逆になっているようにみえる。
  • 3.3 その他の可視化
  • 3.4 クラスサイズのパラドックス
    • 観察
      出席者数の多いクラスをとっている学生に出席者数を聞いた場合の回答は大きい数になり、バイアスがかかるということだろう。
    • BiasPmfは説明用で、実際に使うのはUnbiasPmfのほうではないか。
  • 3.5 DataFrameのインデックス処理
    • コード例
      初めの例の3行目 np.random .randn(4, 2) の.の前のスペースと中央のコード例1行目の col umns のスペースは不要だろう。
  • 3.6 演習問題
  • 3.7 用語集