Monthly Archives: 10月 2011

「集合知プログラミング」第6回(10月28日)

Posted on by 0 comment

参加者 沼田(読み手)、今井、青木(記)

範囲 pp. 31 – 38

3章 グループを見つけ出す

  • 3.1 教師あり学習VS教師なし学習
  • 3.2 単語ベクトル
    • 3.2.1 ブロガーを分類する
    • 3.2.2 フィード中の単語を数える
  • 3.3 階層的クラスタリング p.38 の最後の段落(「階層的クラスタリングアルゴリズム…」から始まる)の直前まで
    クラスター分析のデンドログラムは、アイテム間の距離は結合点までの長さ(深さ)で表すようです。

「集合知プログラミング」第5回(10月25日)

Posted on by 0 comment

参加者 青木(読み手)、沼田、今井(記)
範囲 pp. 24 – 30

2章 推薦を行う

  • 2.7 アイテムベースのフィルタリング
    • 2.7.1 アイテム間の類似度のデータセットを作る
      • p.25 コード中ほど
        printの書式指定の後の%は何?
        → 文字列の演算子のようです。format % value としたらフォーマットされた文字列が得られるらしい。format中複数の変数がある場合は、valueをタプルにする。
      • p.25 コード中
        topMatches()が定義されてたのってどこだった?
        → 索引に関数定義ページもある。
        recommendatins.pyのtopMatches関数 … 15
        p.15のtopMatches()の第二引数名がpersonになっているが、ここではitemを与えている。一つ抽象化した引数名にしたいね。
    • 2.7.2 推薦を行う
  • 2.8 MovieLensのデータセットを使う
    • p.28 コード内
      • openしているu.itemの例が載っていない。おそらく’|’でIDとタイトルに区切られた文字列だろう。
      • u.dataの区切りはp.27を見ると空白に見えるが、コードをみるとタブらしい。
      • 実用的なコードだと、prefsはタイトルではなく映画のIDをいれておいて、最後の結果出力するときにタイトルに変換する方がいいのだろうなぁ。
    • pp.28-29 実行例
      結果をもう少し出して、ユーザベースとアイテムベースでどのくらい似ているか(違っているか)を見てみたかった。
  • 2.9 ユーザベース VS アイテムベース
  • 2.10 エクササイズ

「集合知プログラミング」第4回(10月21日)

参加者 今井(読み手)、青木、沼田(記)
範囲 pp. 18 – 24

2章 推薦を行う

  • 2.5 似ている製品
  • 2.6 del.icio.usのリンクを推薦するシステムを作る
    • 2.6.1 del.icio.usのAPI
      • p.21 下から2行目
        get_userpostsは与えられたユーザのすべての投稿を返す(sが抜けている)
    • 2.6.2 データセットを作る
    • 2.6.3 ご近所さんとリンクの推薦

「集合知プログラミング」第3回(10月18日)

Posted on by 0 comment

参加者 沼田(読み手)、今井、青木(記)

範囲 pp. 11 – 17

2章 推薦を行う

  • 2.3 似ているユーザを探し出す
    • 2.3.2 ピアソン相関によるスコア
    • 2.3.4 どちらの類似性尺度を利用すべきなのか?
    • 2.3.4 評者をランキングする
  • 2.4 アイテムを推薦する

「集合知プログラミング」第2回(10月14日)

Posted on by 0 comment

参加者 青木(読み手)、沼田、今井(記)
範囲 pp. 1 – 11

1章 集合知への招待

  • 1.1 集合知とは何か?
  • 1.2 機械学習とは何か?
  • 1.3 機械学習の限界
  • 1.4 実生活における例
  • 1.5 学習アルゴリズムのその他の使用

2章 推薦を行う

  • 2.1 協調フィルタリング
    • p.7 下からl.2
      訪ねる → 尋ねる
  • 2.2 嗜好の収集
    • p.9 実行例
      • critics[‘Toby’][‘Snakes on a plane’]はここで代入するまえから4.5だから、例としてはわかりにくい。
      • 最後の出力、4.5のあとのコンマ二つは一つ。
  • 2.3 似ているユーザを探し出す
    • 2.3.1 ユークリッド距離によるスコア
      • p.11 プログラムコード
        全体を通してperson1, person2の両方にあるアイテムであるかを二回判断しているのであまり良いコードではないと思う。
        上の方で、両方にあるアイテムをキーとしてsiを作っているのだから、下の方の平方和を計算するところで、person1にあるitemがperson2にあるかを確かめながらループするより、siのキーを使ってループする方が良いのではないか。
        もし、両方共に評価しているものが一つも無いことだけを確認するためにであれば、siで値を保存する必要はないはず。
        もっと進めると、初めのループのsi[item]=1のところで平方和計算もできるはず。

「集合知プログラミング」第1回(10月11日)

参加者 今井(読み手)、青木、沼田(記)
範囲 巻末, pp. v – xxv

巻末

  • カバーの説明
    • l.5 島嶼
      島嶼(とうしょ)とは大小さまざまな島のこと。(Wikipedia 島嶼より)
  • 著者紹介
  • 訳者紹介

訳者まえがき

はじめに

「入門 HTML5」第18回(10月4日)

Posted on by 0 comment

参加者 沼田(読み手)、青木(記)
範囲 pp. 213 – 227

10章 マイクロデータによるマークアップの拡張

  • 10.7 レビューをマークアップする
    p.216 Item Id:__1のTypeは、http://data-vocabulary.org/Address の間違いではないだろうか
  • 10.8 参考文献

付録

  • A.2 参考文献
Category: 入門 HTML5