ログインしてさらにmixiを楽しもう

コメントを投稿して情報交換!
更新通知を受け取って、最新情報をゲット!

音声入力を始めよう!コミュのアドバンストメディアの新ソフト

  • mixiチェック
  • このエントリーをはてなブックマークに追加
いまさっき、音声認識でニュースを調べたら、次の情報がはいりました。

http://japan.cnet.com/news/media/story/0,2000056023,20360111,00.htm

アドバンスト・メディア、しゃべり言葉も認識する音声入力ソフト

WebBCN (BCN)

2007/11/01 11:35

トラックバック(1)

コメント(0)

ブックマーク(3)

印刷用ページ

 アドバンスト・メディア(鈴木清幸社長)は10月31日、キーボード入力を行わずに、マイクに向かって話すだけで入力が可能な音声入力ソフト「AmiVoice Es2008」を11月16日に発売すると発表した。価格はUSBマイク同梱版が2万6040円、ソフトウェアのみが1万9425円。

 使用者の声や話し方の特徴を事前に学習させる必要がない「不特定話者対応」の音声認識技術「AmiVoice」を採用。同技術は医療分野や議事録作成支援システムとして利用されており、キーボード入力が苦手なPCユーザー向けの新しい入力インターフェイスとして発売する。

 「ブログ日記・メール辞書」「しゃべりことば辞書」「書きことば辞書」「政治経済辞書」の4つの辞書を搭載し、用途に応じて切り替えることで、高い認識率を実現。正しく認識されていない単語でも、カーソルを合わせるだけで、変換候補がリストアップされ、結果を自動で学習する候補学習機能を搭載した。使用者が頻繁に使用する単語を登録したり、音響学習機能によりユーザーの声を自動学習することも可能。

 また、ICレコーダーなどで録音したファイルをAmiVoiceエディターにドラッグアンドドロップするだけで文字に変換でき、音声ファイルからテキストに書き起こす作業の負担を軽減できる。対応OSはWindows Vista/XP/2000。

アドバンスト・メディア=http://www.advanced-media.co.jp/

コメント(22)

HPに行ってみたら、いろいろと資料をダウンロードできるのですが、どうも企業向け(医療関連、議事録関連、一般企業の電話応対など)の会社です。会社に直接電話して問い合わせてみると、MC2という会社が担当しているということです。ううむ、どうなっているのだろう。
MC2という会社の電話番号とかわかりましたが、HPのほうは何の準備も出来ていません。まだ本格的リリースの前なんですが、あまりにも体制が整っていない感じですね。ドラゴン以上のものを期待できないかもしれません。

ああ、それよりもドラゴンの日本語はどうしたのでしょうね。日本ではver7ですが、英語ではver9なんですからね。私たちとしては日本語ドラゴン9が欲しいところです。
shaktiさま、ごめんください。

 アドバンスド メディア社の新製品のニュース、ありがとうございました。

 発売になったら 早速、この製品の使い具合を検討してみたい と 思っています。

 不特定話者の 音声入力であっても、音声認識できる点が
アドバンスド メディア社の 特長でして、すばらしいところ
です。

 どんな種類の録音機を使用して音声ファイルを作成しようが、差別なしにそれらを取り込んで 音声認識できる点が、
実は、どの程度の精度なのか、ここに 大きな興味が あります。

 
 

2ちゃんねるで、音声認識ソフトのところをみてみましたら、この会社の内部にはどうやら様々な問題があるようです。
コトバ表現研究所の渡辺知明さんのブログで取り扱われている。
この人とは、どこかの音声認識のMLでやりとりしたことがある。しかも、
別の全く関係ところのご縁で、本を無料で送ってもらったことがある人なんです。

http://kotobahyogen.seesaa.net/article/72536838.html
>使い勝手もいい。常駐させておいて、ワンキーで直ぐにスタートできる。他のソフトとの競合もない。ジャマをしない。以前は入力できなかったソフトの上でもダイレクト入力できる。使い慣れたドラゴンスピーチもいっしょに起動しておいて双方を切り替えて使うこともできる。

この文章が興味を引かせる
AmiVoiceEs2008を購入して使ってみました。
ユーザー登録することもせずに、ヘッドセットマイクから音声認識を試みましたが、かなりの認識結果を得ました。(USBアダプタを使わずに、ヘッドセットマイクのマイクジャックをコンピュータのマイクの所に差し込む形です)
認識スピードも速いです。

単語登録で、氏名を登録したところ、一発で音声認識できました。よく使う固有名詞は、単語登録することがよいようです。

このトピックで、AmiVoiceEs2008に関わる音声認識のノウハウの情報交換をしましょう。

一点、ドラゴンスピーチと違うところで、よく分からないのは、音声認識させた結果を(表示された)別の候補と入れ替えることができる場合は、問題ないのですが、その候補にない場合、どうやって学習させたらよいのかということです。
単語登録という形しか方法はないのか、知りたいところです。

もし、おわかりになる方がいらっしゃいましたら、教えてください。
>ユーザー登録することもせずに、ヘッドセットマイクから音声認識を試みましたが、かなりの認識結果を得ました

音声認識を教育に利用する可能性がひらけてくるかもしれませんね。音読検証装置とか(笑)、新しい作文指導とか。

ところで、CPUとメモリーはどのくらいですか?
「ユーザー登録をしなかった」と書きましたが、いわゆるソフトのユーザー登録ということではなく、自分の声を音声認識ソフトになじませるためのユーザー登録をしなかったということです。ドラゴンスピーチでは、この作業をしないと音声認識はできないのです。

さて、ご質問にお答えします。

PCの性能は音声認識に関係があるので、私の環境をお知らせします。

CPUは、インテル セレロン(M)1400MHz
メモリーは、1ギガです。

ドラゴンスピーチを使う場合、1ギガのメモリーは必要だと思います。
私のコンピュータにつけられるメモリーの最大値が、1ギガなので、
それ以上のメモリーを搭載したPCとの比較は、できないのですが、
みなさんの環境と音声認識の関係を情報交換できるといいですね。

私、実は、CPUは950くらい(セレロンじゃなくて、名前忘れたが、もう少し良い奴)、メモリーは384MB詩かありません。(ただし、Win2000です)。でも、一応は、なんとか、ドラゴンは出来るみたいです。いまさら、メモリーをつけたすきにもなれないしなあ。
とうとう私も AmiVoice を購入してみました。さて、非常に興味深い。結果でしたのでご報告いたします。まず最初に、メインに使っているパソコンに入れてみましたが、その時の使った感触としては、ドラゴンスピーチと比べてまだまだ使いにくいなっという印象でした。そこで、もう一つのパソコンにインストールしてみたのですが、素晴らしかった!

このパソコンは Windows 2000ですが、 CPU はたったセルロンの650しかありません。メモリも400メガバイト程度です。このパソコンでは、ドラゴンスピーチは、かなり使いにくいはずです。ところが、 AmiVoice と USB マイクを使って今書いているのですが、かなり実用的です。決してスピードが遅くないのです。アスロン CPU 950のパソコンでドラゴンスピーチを使っていたとき以上ののスピードです。

ところで、一つ気になるのは現在使っているパソコンでは、小さな声で話すとよく認識できるのに対し、別のパソコンではむしろ大きめな声が必要だったということです。 USBマイクを使うのにこのような違いができるのはどうしてでしょうか。
残念ながら AmiVoice はまだまだ使いにくいという感じです。おそらく、マイクの位置と、恋の大きさによっては、認識率は良くなるのかもしれませんが、ドラゴンスピーチのほうが使いやすいというのが正直なところです。皆さんは、どうしてなんでしょうか。

ただし、0審の文章を書くには問題がないのかもしれません。よどみなく自分の好きなことをお書いて行こうとするならば、不満が残るような気がします。(これは AmiVoice による)0

AmiVoiceである種の文章を書いていると、スムーズに誤変換は少なく、ちゃんとやってくれます。なぜ、ギャップがこれほどまで大きいのでしょうか。ドラゴンとamivoiceの両方を使っている皆さんは、どのような印象をもたれているのでしょうか。
AmiVoiceES2008買いました。(ドラゴンは未経験。)
現在苦戦中。というより、半ば放置しています。

これは、今のところおもちゃ並みですね。

測ったことはありませんが、今のところ手打ちの方が早いです。

いろいろ情報交換できたら、と思っております。

AmiVoiceES2008買いました。(ドラゴンは未経験。)
現在苦戦中。というより、半ば放置しています。

これは、今のところおもちゃ並みですね。

測ったことはありませんが、今のところ手打ちの方が早いです。

いろいろ情報交換できたら、と思っております。

音声認識の失敗の原因は、大きく分けて二つあると思います。
① マイクの使い方の失敗
② 語彙登録不足

ようじさんは、どちらの問題だと思いますか。
私の場合は、語彙の問題はある程度解決してきたのですが、時々マイクの調子がおかしくなります。原因は必ずしも良く判りません。しかしそれでも、調子が良くなってくればかなり実用的なものであると思います。最初はドラゴンスピーチの方が性能が上だと思っていましたが、今必ずしもそんなふうに思っていません。
無線きーぼーどで電池が足りないtk、同じだ
AmiVoice を買いました。(ドラゴンは未経験。)
現在苦戦中。というより、なかば放置しています。

これは、今のところ玩具並みですね。

くかった事はありませんが、今のところ、うちの方が早いです。

いろいろ情報交換できたら、と思っとります。

以上、修正なしで、ようじさんの発言を AmiVoice で書いてみました。
久しぶりに AmiVoice を使っています。
いつもよりはっきり話した方が正確に変換されやすいようです。ただ、これは個人差があるので、一概には言えないと思います。
ちなみに私の入力環境は、「サンワサプライ」<(ここ手打ちです)のヘッドセットを使っています。

本当は、思いつきでしゃべったことをどんどん文書にしてくれると助かるのですが、まだそこまでは、満足できる変換精度が得られません。
例えば、一通り思いついた事を話して、文章の頭からまとめて直すような使い方ができません。つまり、後から入力した文章を読んだときに、全く意味がわからないのです。もちろん音声を再生すれば、大体話したことを思い出せるのですが、面倒です。

個人的には、「5文字削除」等の使い方を覚えたので、少しキーボードをさわる回数が減りました。しかし、この方法等をしながら入力しているとなかなか先に進めませんね。
ようじさん、

こちらはVoiceAtokの例です。
http://video.mixi.jp/view_video.pl?owner_id=633374&video_id=1121028

私が使っているVistaでは使えなくなってしまいましたけどね。
条件が整えばVista付属の音声認識でもけっこういけます。
ようじさん

すでにご存知のことかもしれませんが、 AmiVoice にしても速度重視なのか精度重視なのかを選択する事ができます。

また、2ちゃんねるの音声認識のところで、 Visita を使って音声認識を披露してくれている方がいます。かなり認識精度は高いようです。

AmiVoice に対する私の不満は、修正がちょっとしにくい場合があるということです。この点、 VoiceATOK はやりやすいと思います。

−−−−−−−−−

ログインすると、残り1件のコメントが見れるよ

mixiユーザー
ログインしてコメントしよう!

音声入力を始めよう! 更新情報

音声入力を始めよう!のメンバーはこんなコミュニティにも参加しています

星印の数は、共通して参加しているメンバーが多いほど増えます。

人気コミュニティランキング