Mahout JP を立ち上げました #MahoutJP
Hadoop上で動作する 大規模データマイニング・機械学習ライブラリ Apache Mahout に関し、技術情報まとめ・発信よる活用の裾野を広げることを目的としMahout JPを立ち上げました。
私も含め TokyoWebminingでMahoutに関する各種講師をしていたメンバーや、Tokyo.R、PRML会のメンバー含め、各業界のデータマイニング・機械学習で活動してきたメンバーで集まり、Mahoutに関する情報まとめ・発信をしていきます。
現在、Mahout はドキュメントがまだ整備されていなく、唯一ある書籍 Mahout in Actionでも情報が限られているため、実際に活用しようとするとソースコードから読み込む必要がある状態です。今回、 Mahout JPとして、Mahoutに関わっている各メンバーで集まり、"手法の入門的内容からMahout実行まで"の実際に活用できる情報発信をしていきたいと思います。それにより、大規模データマイニング・機械学習 活用の裾野を広げていきたいと思います。
今回情報発信メンバーの募集に関し、多くの方々から参画の声をもらえ、感謝しています。またさらに、本家 Mahout Wiki 記載されていない各種内容に関しても、日本で先行し情報まとめ・発信ていこうという精力的なメンバー達が集まっており、嬉しく思っています。
これから、Mahout JP をどうぞよろしくお願い致します。
内容構成
現在まずは調査した中で、Mahoutに関し"手法の入門的内容からMahout実行まで"の内容が最も豊富だったTokyoWebminingや、Hadoop Conference Japan 2011での講師内容を中心に、現時点で日本での各情報をまとめてあります。
-
- Installation : 開発環境の構築法
- members : 情報発信メンバー
Mahout JP 立上げ経緯
関連資料
- Mahout RandomForest Driver 実装法 -大規模分散 機械学習・判別 - - hamadakoichi blog
- Mahout: Canopy and K-means Clustering - hamadakoichi blog
- Mahout: Data Converter for Clustering - hamadakoichi blog
- Mahout Programming : K-Means Clustering - hamadakoichi blog
推薦文献
- 作者: Sean Owen,Robin Anil,Ted Dunning,Ellen Friedman
- 出版社/メーカー: Manning Publications
- 発売日: 2011/10/17
- メディア: ペーパーバック
- 購入: 4人 クリック: 81回
- この商品を含むブログ (11件) を見る
- 作者: Satnam Alag,堀内孝彦,真鍋加奈子,真鍋和久
- 出版社/メーカー: ソフトバンククリエイティブ
- 発売日: 2009/03/27
- メディア: 大型本
- 購入: 13人 クリック: 295回
- この商品を含むブログ (64件) を見る
- 作者: Toby Segaran,當山仁健,鴨澤眞夫
- 出版社/メーカー: オライリージャパン
- 発売日: 2008/07/25
- メディア: 大型本
- 購入: 91人 クリック: 2,220回
- この商品を含むブログ (277件) を見る