「R言語による Random Forest 徹底入門−集団学習による分類・予測−」− #TokyoR #11 で講師をしてきました
2011/01/29 第11回R勉強会@東京(Tokyo.R #11) で講師をしてきました。
「R言語による Random Forest 徹底入門 −集団学習による分類・予測−」。
Random Forest は"機械学習"の方法論で、集団学習により精度高い判別・予測を実現します。
双方向の進行で、質疑応答・議論含め 合計60分で話しました。
隠れ Random Forest 祭り
今回のTokyo.R、実は「隠れ Random Forest 祭り」。直前の3トーク、「3. caretパッケージの紹介」(id:dichika [Twitter:@dichika])、「4. RにおけるHPC 並列計算編」([Twitter:@sfchaos])、「5.Rで始めるテキストマイニング)」([Twitter:@AntiBayesian])の中で、「Random Forest良い、詳細は [Twitter:@hamadakoichi] さんから!」という嬉しい振りを受けてのトークとなりました。
Random Forest 徹底入門
内容構成に関しては、初めての人でも分かるようにと、"Random Forest" の前提知識となる "決定木"や"集団学習"に関しても内容構成に入れ、それぞれ"アルゴリズム"、"R言語での実行方法(実行可能なSource Code含む)"を記載しています。また各自がすぐに実行し試せるように、資料中で用いているデータも、R言語環境にデフォルトで用意されているデータを用いています。
統計解析・データマイニング・機械学習・R言語人材の活躍の場
データマイニング+WEBの創設の思いにも書いていますが、「蓄積されたデータを活用し、継続的に活動進化できる世界を作りたい」と私は考えています。
その中で、統計解析・データマイニング・機械学習は重要な要素です。それらのスキルセットを持った R言語の人材に関し、"R言語人材が そのスキルを十分に活かし活躍できる場が提供されているか?"を調べてみました(※資料前半に結果を記載しています)。
2011/01/28 にそれまでになかった、新たなよい変化がありました。今後、ソーシャル業界全体や、他業界の人材採用の追従を歓迎します。今後、各領域での統計解析・データマイニング・機械学習・R言語の活用、人材の活躍の場を広げていきたい。そう考えています。一緒に、蓄積データの統計解析・データマイニング・機械学習活用による 継続的な活動・サービス進化を実現していきたい。
関連資料
- Random Forest:
全体AGENDA/講師資料
今回の全体AGENDAと公開されている資料を以下に共有します。
- 1. Rによるデータサイエンス第II部 第6章 自己組織化マップ(id:bob3 [Twitter:@bob3bob3])
- 2. ggplot2:パッケージ製作者(Wickamさん)の話を聞いて ([Twitter:@aad34210])
- 3. caretパッケージの紹介 (id:dichika [Twitter:@dichika])
- 4. RにおけるHPC 並列計算編([Twitter:@sfchaos])
- 5. Rで始めるテキストマイニング ([Twitter:@AntiBayesian])
- 資料:(※公開され次第、追記します)
- 6. R言語による Random Forest 徹底入門 ([Twitter:@hamadakoichi])
推薦文献
- 作者: 金明哲
- 出版社/メーカー: 森北出版
- 発売日: 2007/10/01
- メディア: 単行本(ソフトカバー)
- 購入: 36人 クリック: 694回
- この商品を含むブログ (64件) を見る
- 作者: 青木繁伸
- 出版社/メーカー: オーム社
- 発売日: 2009/04/01
- メディア: 単行本
- 購入: 10人 クリック: 123回
- この商品を含むブログ (34件) を見る