Mahout JP を立ち上げました #MahoutJP

Hadoop上で動作する 大規模データマイニング機械学習ライブラリ Apache Mahout に関し、技術情報まとめ・発信よる活用の裾野を広げることを目的としMahout JPを立ち上げました。

私も含め TokyoWebminingでMahoutに関する各種講師をしていたメンバーや、Tokyo.RPRML会のメンバー含め、各業界のデータマイニング機械学習で活動してきたメンバーで集まり、Mahoutに関する情報まとめ・発信をしていきます。


現在、Mahout はドキュメントがまだ整備されていなく、唯一ある書籍 Mahout in Actionでも情報が限られているため、実際に活用しようとするとソースコードから読み込む必要がある状態です。今回、 Mahout JPとして、Mahoutに関わっている各メンバーで集まり、"手法の入門的内容からMahout実行まで"の実際に活用できる情報発信をしていきたいと思います。それにより、大規模データマイニング機械学習 活用の裾野を広げていきたいと思います。

今回情報発信メンバーの募集に関し、多くの方々から参画の声をもらえ、感謝しています。またさらに、本家 Mahout Wiki 記載されていない各種内容に関しても、日本で先行し情報まとめ・発信ていこうという精力的なメンバー達が集まっており、嬉しく思っています。

これから、Mahout JP をどうぞよろしくお願い致します。

内容構成

現在まずは調査した中で、Mahoutに関し"手法の入門的内容からMahout実行まで"の内容が最も豊富だったTokyoWebminingや、Hadoop Conference Japan 2011での講師内容を中心に、現時点で日本での各情報をまとめてあります。

    • Seminars : Mahout の各機械学習データマイニングの方法論、Mahoutでの実行法の講師資料まとめです。初めての方はまずここから見ると分かりやすいと思います。
    • Applications : Mahoutのサービス活用
    • Clustering : クラスタリング:似ているものをグループ化する
    • Classification : 分類:分類・判別を行う
    • Pattern Mining : パターンマイニング: 頻出パターンを抽出する
    • Recommender : 推薦: 興味に合うものを推薦する
    • Regression : 回帰: 数値予測を行う
    • Dimension Reduction : 次元縮約: 説明変数を重要な変数へ縮約
    • Evolutionary Algorithms : 進化的アルゴリズム
    • Installation : 開発環境の構築法
    • members : 情報発信メンバー

Mahout JP 立上げ経緯

Mahout JP 立上げ #MahoutJP

推薦文献

Mahout in Action

Mahout in Action

集合知イン・アクション

集合知イン・アクション

集合知プログラミング

集合知プログラミング