ログインしてさらにmixiを楽しもう

コメントを投稿して情報交換!
更新通知を受け取って、最新情報をゲット!

音声入力を始めよう!コミュの認識エラーの修正には どう対応されていますか?

  • mixiチェック
  • このエントリーをはてなブックマークに追加
 ストンです。
 長いこと ご無沙汰しておりました。また、いろいろと教えてほしいので、よろしくお願いいたします。

認識エラーの修正に、どんなやり方をしているでしょうか?
 今回は、この問題について、日頃皆さんが行っている方法についてお尋ねいたします。

 これには三つの方法があると思います。
(1) 音声コマンドで行う
(2) マイクについたボタン、スイッチを使う
(3)(1)と「キー入力」を併用する

私は、長いこと(2)を中心に認識エラーの修正を行っていました。しかし、ごく最近ですが、ドラゴンスピーチの持つ音声コマンド機能が非常に優れていることを発見しました。

 この結果、認識エラーの修正問題が大幅に改善され、「音声入力」の能率が数段と向上いたしました。改めて、ドラゴンスピーチの「音声コマンド」機能の学習が不十分だったことを反省しています。

 多分、私と同じような経験をされたために、ドラゴンスピーチの価値を十分に認識しないままに、この音声認識ソフトの使用を断念してしまったユーザーの方が多くおられるのではないかと考え、勝手ながら、今回この問題を提起した次第です。

 なお、私の最新のブログで、この点については詳しく報告してありますので、ご興味のある方は、それをお読みください。
 http://blog.livedoor.jp/stone06/ です。

 「音声入力」を行う以上、その修正問題に関しても音声コマンドで行うのが当然です。そうしなかったのは、トラブル発生の際、「音声入力」による解決策を見つけることができず、全く別な方法に求めたからです。

 「音声コマンド」の機能は、徹底的に学習することが実はドラゴンスピーチを使いこなす秘訣でもあることを、私は、誠に恥ずかしいことながら、今頃になって漸く気づきました。

 みなさんは、この認識エラーの修正問題に対し「音声コマンド」機能を十分に活用されているでしょうか?お尋ねいたします。

コメント(15)

認識エラーへの対処法について私の場合をお知らせします。

ICレコーダーからの文字認識を最近は使っています。
ただ、ストンさんのように、フィリップ社製のものでなく、ソニーのICレコーダーを使っています。
この場合は、ICレコーダーのボタンを使って修正はできませんし、マイクを使っての修正もできません。
ですので、誤認識している範囲をキーボードで指定して、修正します。結構、認識率がよいので、これで簡単に原稿が作れます。

ICレコーダーを使っていないときは、ヘッドセットマイクでの音声認識をしていましたので、しゃべって文字化して、間違っていた場合は、「音声コマンド」で主に修正していました。

たぶん、ICレコーダーからの音声認識をしない方は、修正も音声コマンドを使っている方の方が多いのではないかと思います。

では、また。
<video src="1121028:56a481c52e1b16e3bc2560e8b55c28a2">

私はVoiceATOK派ですのでエラーの修正はキーボードですね。
この動画でも修正するところを示しています。
IMEの誤認識と同じような感覚で修正できるのは利点だと思います。

使い勝手が分かっていらっしゃる方はともかく、初心者の方にとっては、あまり音声だけで修正することにこだわらないほうがいいような気もします。
山本さん、動画でご説明ありがとうございます。

動画をキャプチャするのは、どのようにしていらっしゃるのでしょうか。

ドラゴンスピーチの音声認識の変換の様子を示す上では、わかりやすくていいですね。

教えていただけますか。別のトピックですが、いいでしょうか。
いのっちさん、

キャプチャにはCamStudioを使いました。

http://nonn-et-twk.dnsalias.net/twk/CamStudio/

みなさんもご自分の音声入力のようすを動画で紹介されてみては?

ちなみに上記の動画で入力したテキストは以下のとおりです。

「音声入力を使うと、非常に高速に文字を入力することができます。特殊な訓練は必要ありませんが、いくつかのコツを覚えることでうまく認識させることができます。最初から最後まで音声だけで入力することにこだわると、なかなかうまくいきません。必要に応じてキーボードで修正することで、実用的に使うことができます。文書を考えながら入力するのも、慣れれば楽にできるようになります。」
<video src="1173420:8726061bb58264c71feb6a1fb3315697">

ゆうじさんが動画で入力したテキストを、私がICレコーダーに録音しました。その音声ファイルを文字認識させた様子を動画にしてみました。画面が小さくて見にくいのですが、雰囲気は分かっていただけると思います。

ヘッドセットマイクで音声認識させるよりも、ICレコーダーで音声認識させるほうが、変換スピードは高速です。(もちろん、同じスピードで読み上げていてもです)

日本のICレコーダーをつかっての音声認識の場合は、修正はキーボードをつかうしかありません。フィリップ社のディクテーションマシーンの場合は、違います。

ICレコーダーで音声認識させる場合も、ドラゴンエディタ上で変換候補の中から選択して誤認識の部分を訂正していくと、次回から同じ誤認識をしなくなるように学習しますので、使い込んでいくと、認識精度も上がっていきます。
ゆうじさん、動画のキャプチャソフトのご紹介ありがとうございました。
マイクから音声入力した場合は、動画に音声も一緒に録音できるのですが、例えば、ドラゴンエディタ上に文字化した文章を、自分の録音した声で再生した場合、その音声を動画と一緒に録音することは、可能なのでしょうか。
分かりましたら、教えていただけますか。
いのっちさん、

CamStudioでは録音できるのは、マイクとスピーカーのどちらかだったと思います。

私の音声入力の主な用途はパソコンでの文章作成なので、認識もパソコンでになりますね。

【音声入力】
ゆうじさま、ごめんください。

ゆうじさまの「音声入力」の活動具合を動画で説明されている方法は、誠にわかりやすい、見事なデモンストレーションだと思いました。

特に、誤記された文章を修正している様子は、この動画でとてもよくわかります。この件で一つ希望を言わせてもらうと、画面に印字された文章がいささか読みにくいのです。これを改良する方法はないものでしょうか。

CamStudioというソフトのことを全く知らないのでお尋ねいたします。この動画は、ブログ画面とか、ドラゴンスピーチ画面とか、ワード画面でも表現可能なのでしょうか。

ゆうじさまの 素晴らしい説明から、私も自分が今実行している音声入力の修正の仕方をこの動画を使って説明できるように、CamStudioを学習してみようと思います。貴重なご指導 ありがとうございました。
いのっちさま、ごめんください。

早速 このたびのテーマについて ご返事いただきまして、ありがとうございました。

特に、ゆうじさまの 動画説明に対して ご質問してくださり、音声入力の説明方法に動画を活用する件で より広範な問題を引き出してくださいました。音声入力の 一般的な説明に 動画を活用するヒントを与えてくださったことは、この先の音声入力の普及に拍車がかかることが期待できそうです。

重ねて、感謝申し上げます。
                  以上
ストンさま、

おほめいただきありがとうございます。

以下のリンクで少し大きい画面が見られます。
http://video.mixi.jp/view_video.pl?owner_id=633374&video_id=1121028

mixiにアップロードする場合は、450x338ドットの大きさでキャプチャすると、解像度が一致してきれいに表示できると思います。
まだ実際にこの大きさでは試していませんが。
私の例ではそれより小さめにしているので、アップロードしたときに拡大され、文字がはっきり読めなくなっています。

CamStudioはどの画面にでも使えます。
<video src="1190544:27bdb495d653215be58135e411d6dbdf">
ICレコーダーの音声を、ドラゴンエディタで再生させた様子を紹介します。
文字認識は、無修正の状態です。
<video src="1190623:703ac92e3f1e855422d3e6aee44188eb">
ICレコーダーからの文字認識を修正している様子を紹介します。マウスの矢印が、キャプチャできないので、黒く反転されているのは、範囲選択した部分であると思ってみてください。

修正ボックスの左下の「発音した語句の確認」ボタンをクリックすると、読み声が確認できますので、その様子も見てください。

音声を付けるために、ソースネクストの「ストリーミングレコーダー」を購入して動画をキャプチャしています。
<video src="1191301:67a9190bfe7e138f0fafaf9e85ca1790">

一度ドラゴンスピーチに学習させたあと、同じ音声データから文字認識させると、誤認識が少なくなります。

「いくつかの骨を覚えることで」の部分は、誤認識していますが、その他は正しく認識している様子が分かると思います。

修正をするときに、例えば上の場合「骨」だけを「コツ」と修正するよりも、「いくつかの骨を覚えることで」と範囲指定して「いくつかのコツを覚えることで」と修正した方が、学習の効果があるそうですので、お試しください。
ゆうじさんにご紹介していただいたCamStudioは、日本語版でした。こちらは、マイクの音声のみ録音できます。

英語版では、マイク以外にスピーカーの音を録音できることが分かりました。

私のホームページで、使い方を掲載しました。
ご活用ください。

CamStudioの使い方
http://www.geocities.jp/ino_hideki55/freesoft-camstudio.htm

ログインすると、みんなのコメントがもっと見れるよ

mixiユーザー
ログインしてコメントしよう!

音声入力を始めよう! 更新情報

音声入力を始めよう!のメンバーはこんなコミュニティにも参加しています

星印の数は、共通して参加しているメンバーが多いほど増えます。

人気コミュニティランキング