第11回データマイニング+WEB@東京 に参加してきた
いままで参加しようとおもってた勉強ですが、気づいたときには埋まっているのと、時間の長さで躊躇してなかなか参加できないでいました。
http://tokyowebmining11.eventbrite.com/
http://d.hatena.ne.jp/hamadakoichi/20110612/p1
詳しいことはhamadakoichiさんの方に書かれているので割愛。私の方の感想を。
1.Mahout.JP
自分もいずれMahoutを使ってみたいですが、まだ手が出せてない状態です。近いうちに触りたいです。
2.Fuzzy K-means
u_ijの更新式が出てなかったですが(ってか更新式がある時点で私が質問してた,u_ijがシグモイド状に分布とかいうのはおかしな質問になりますが)、複雑に要素が絡む場合k-meansよりMapReduce向きではなさそうでした。
ちなみにK-meansであれば、
Mapper:中心点に対して、各点がクラスタ分類。位置を渡す
Reducer:Mapperから渡された位置をもとに中心点を計算
だけでいけるのでMapReduceしやすい構造じゃないかと考えました。
ってソース読めばいいのか。
3.Infer.netとグラフィカルモデル
これ、まんまPRML勉強会の説明持ってきたような・・おかげで自分は復習としてとってもよかったですが、周りはつらそうでしたw
「あんな数式がグラフィカルモデルだとこう見えて、Infer.netだといちいち推論かかなくてもいけるよ!」的な説明もあるとよかったかと。
ただグラフィカルモデルは論文読んでてもちょくちょく出てくるのでこのへんは押さえておいたほうがいいんでしょうね。
4.Infer.netの事例紹介
うお、これ今後役に立ちそう。今回広告屋さんが少なめと残念がってたけど、先日のさくテキにはプロの広告担当の方居らっしゃったなぁ(ネットじゃないけど)
5.科研費などの申請状況調査
これ、申請・受理された人の出願ジャンル移動状況を分析してたんですね。新しい研究分野が見つかりそうです。
おまけ
飲み会の席で「cubic neural networkがすごい」的な話を伺ったのですが、自分でちょっとググったところ一部で使われてるだけでそれほどでもないかなぁという風に見えました。階層構造をとればメタ知識も管理できそうですが、問題は入力をどう数値化するってとこにあるかと。
これからMahoutとかも触れる機会ができそうなのでどんどん触っていきたいです!(なぜかは明日のエントリで)