MeCabは 京都大学情報学研究科−日本電信電話株式会社コミュニケーション科学基礎研究所共同研究ユニットプロジェクトを通じて開発されたオープンソース形態素解析エンジンです.
言語, 辞書,コーパスに依存しない汎用的な設計を基本方針としています.
パラメータの推定に Conditional Random Fields (CRF) を用いており, ChaSenが採用している隠れマルコフモデルに比べ性能が向上しています。
また、平均的に ChaSen, Juman, KAKASIより高速に動作します.
ちなみに和布蕪(めかぶ)は, 作者(=工藤拓氏)の好物です.
MeCab公式サイト:http://
作者である工藤拓氏のサイト:http://
キーワード:自然言語処理,形態素解析,めかぶ,メカブ,和布蕪,マイニング,分かち書き,わかち書き
困ったときには