ログインしてさらにmixiを楽しもう

コメントを投稿して情報交換!
更新通知を受け取って、最新情報をゲット!

テキストマイニングコミュのテキストマイニングからの応用

  • mixiチェック
  • このエントリーをはてなブックマークに追加
はじめまして。
本日コミュに参加させていただきました。
テキストマイニング、というワードを知ったのも今日ということで、知識もないですがご教示いただければと思います。

アンケート調査で得られた自由記述回答をどのようにして処理しようか悩んでいます。
自由記述回答を分析した先行研究を辿ってみて、「テキストマイニング」という手法を知りました。
テキストマイニングとは、単純に言うと「自由記述の文章を区切る」という作業のことなんですよね??
この解釈で正しいならば、文章を区切ったあと、どのような分析にかけられるのが主な方法なのでしょうか。

また、参考になりそうな書籍や文献などご存知でしたら教えて下さい。
宜しくお願い致します。

コメント(3)

はじめまして。

アンケートの自由記述の場合だと、回答者の属性によって、自由記述に含まれる言葉にどんな変化があったかという分析が多いと思います。例えば「(他の年代に比べて)若年層の回答に多く出てくる言葉は?」といった分析です。単に年代別に言葉の出現率を比べて、若年層の回答に多い言葉をリストアップしても良いでしょうし、数量化III類(対応分析)を用いても良いでしょう。もちろん年代に限らず、その他の通常の設問もすべて同様に使うことができます。

その他にも、似た言葉を含む回答のグループに分類したり(回答のクラスター分析)、出現パターンの似た言葉同士のグループに分類したり(言葉のクラスター分析)、出現パターンの似た言葉ほど近くに布置されるようなマッピングや(多次元尺度法)、出現パターンの似た言葉を線で結んだネットワーク図作成(共起ネットワーク)などがあるでしょうか。

また、自動的に切り出した語の分析だけでは上手く行かなければ、ある種のコンセプトと言いますか概念と言いますかを取り出すこと(コーディング)も考えられます。取り出した後は、上述の言葉の解析と同じような解析を行えます。

ここまでに挙げた分析であれば、チュートリアルやマニュアルと格闘することを厭わないならば、すべて某フリー・ソフトウェアで行えます(苦笑)。市販のツールは高価なだけあって?もっといろいろな趣向を凝らしているかと思います。

※テキストマイニングという言葉は使う人によって意味が違っていたりして曖昧なのですが、語を切り出した後の統計解析まで含めて「テキストマイニング」と呼ばれることが多いような気がします。
はっしーさん、ご紹介ありがとうございます。

自作ソフトの名前を書こうかとも思ったのですが、書き込む度に宣伝というのも?と迷って、「某フリー・ソフトウェア+(苦笑)」ということになりました (^_^;)

ログインすると、みんなのコメントがもっと見れるよ

mixiユーザー
ログインしてコメントしよう!

テキストマイニング 更新情報

テキストマイニングのメンバーはこんなコミュニティにも参加しています

星印の数は、共通して参加しているメンバーが多いほど増えます。

人気コミュニティランキング