第1回 にこにこテキストマイニング勉強会 ( #nicoTextMining #1) に参加してきた

「第1回 にこにこテキストマイニング勉強会 (#nicoTextMining)」([Twitter:@toilet_lunch] さん, [Twitter:@AntiBayesian] さん 主催) に参加してきた。実際にどう活用するかを目的した会。最近、毎週トークをしていましたが、今週は聴講者。

ATND: 第1回 にこにこテキストマイニング勉強会 : ATND

以下、ツイートまとめ(Togetter)、各講師資料、メモ、の覚書き。

目的・概要

目的:

テキストマイニングについての学習のスタートアップ
テキストマイニング技術に関して気軽に参加・議論することができる場の提供


概要:

テキストマイニングとは、例えば製品の評判をweb上のテキストから抽出したり、
大量のアンケートテキストを分析するために用いられる技術であり、特にマーケティングの場で多くの利用例があります。

この勉強会ではそうしたテキストマイニングを題材とし、用いられている要素技術とそれに関わる課題の議論、
またテキストマイニングを実務に活かす方法について考えていきます。

第1回 にこにこテキストマイニング勉強会 : ATND

テキストマイニングの歩き方 ([Twitter:@AntiBayesian])

資料:テキストマイニングの歩き方(PDF)

  • テキストマイニングのビジネス活用方法について話す
  • あんちべさんがなぜかスーツ
  • 個人指定で問いかけがきたw 双方向進行好きですよ

ゆるふわテキストマイニングをしてみよう ([Twitter:@toilet_lunch])

資料:ゆるふわテキストマイニングをしてみよう(PDF)

  • 評判分析のツールを作ってみた
  • 評価表現を使う
    • 物事に対し評価しているような表現を使う
  • 単語感情極性対応表 (ポジティブ・ネガティブ表現 辞書)
  • Key
    • ジャンルの限定
    • テキストのクリーニング
    • 言語の困難さ(否定表現、未知語、助詞の省略、複合表現、評価ゆれ、複雑すぎる構造の文)

コピー&ペーストのみで始めるテキストマイニング超入門 ([Twitter:@langstat])

アンケート自由回答のテキストマイニング事例 ([Twitter:@bob3bob3])

資料:アンケート自由回答のテキストマイニング事例(PDF)

  • 商用ツール:お金がある人向け。ツール紹介
    • TRUE TELLER (野村総研
    • Text Mining Studio (数理システム)
    • SPSS Text Analysis for Survey (SPSS)
  • アンケート事例紹介:「楽しい食事」ってどんな食事?
    • 食品会社の調査
    • 単語出現頻度分析
      • 同義語、表記ゆれ
      • 名詞、形容詞に絞って分析
  • 話題分析 (ことばネットワーク)
    • 話題ネットワーク分析での話で挙がった TokyoWebmining 9での Graph Clustering。 内容まとめ
  • 特徴語分析
  • コレスポンデンス分析
  • 仮説の検証