ログインしてさらにmixiを楽しもう

コメントを投稿して情報交換!
更新通知を受け取って、最新情報をゲット!

インテリジェンス マイニングコミュの『意味検索』の時代が到来!

  • mixiチェック
  • このエントリーをはてなブックマークに追加
『意味検索』の時代が到来!

インテリジェンス・マイニング事業を創業して、11年目。

その当時から考えていた”文章や文節を「意味」で「検索」する」方法が密かに、その需要がでてきているようだ。

これもまた、外国発の手法として、ネットやWikipediで論じられている。意味検索を含めた言語解析は、欧米の文章構造はそれに適している。文字列が、単語ごとにスペースなどで区切られているからだ。

それに比べて、日本語は、句読点はあるものの、単語間の区分けがないので、分解に苦労する。かつ、活用が多い助動詞を分けるのはさらにたいへんだ。さらに、尊敬語、丁寧語、謙譲語などが入っているとさらに難しくなる。

いままでは、検索といえば、単語の並びで引っ張り出しているので、ある単語をG社やY社の検索エンジンで検索すると何十万、何百万という検索結果が出現する。

最近は改善されたが、当時、こんなことがあった。

「本能」というコトバで検索をかけたら、なんと「日本能率協会」という企業名が出現したのだ。「本能寺」ももちろん出てきた。

「本能」と「本能寺」は、文字の並びでは一部合致するが、意味の合致性から判断するとどうでしょう?

先の、「日本能率協会」が出現したのは、どうしてでしょうか?
”日本”の「本」と”能率”の「能」が検索されてしまったのだ。

「本能寺」は許容できたとしても、「日本能率協会」は、論外です。

意味検索とは、これらの意味を掴んで対象文章を探し出す技術です。
文章の意味を判断して、目的に合った文章や関連性(因果、相関、関連)のある文章を拾い出すのです。

最近、あるナレッジマネジメント・システムのメーカーから、「意味検索」を組み込みたいという案件が舞い込み、技術的検討に入った。

あるルートから入ってきた情報では、ある大手電機メーカーが、深みのあるナレッジマネジメントの仕組み開発が最大の課題とか。そこにアプローチする戦略を練っているいるところ。

また、ある知的所有権の文書の評価・格付の案件も、突然、入ってきた。評価や格付のベースは、そこにある文章の「意味別分類」の技術だ。

10年間、言い続けていた、小社の提言・提案が、やっと市場性を浴びてきたようだ。英語圏では、勝手に開発が進むだろうが、難しい日本語は、誰もができる訳ではない。

今年は、忙しくなりそうだ。

これらの案件には、インテリジェンス・マイニングとデータ・マイニングがマイニングの両輪となって実現するものと考えている。

*「意味検索」のキーワード;(Wikipediaに解説があります)

 ・オントロジー
 ・セマンティック・ウエブ
 ・メタデータ

コメント(0)

mixiユーザー
ログインしてコメントしよう!

インテリジェンス マイニング 更新情報

インテリジェンス マイニングのメンバーはこんなコミュニティにも参加しています

星印の数は、共通して参加しているメンバーが多いほど増えます。

人気コミュニティランキング