ログインしてさらにmixiを楽しもう

コメントを投稿して情報交換!
更新通知を受け取って、最新情報をゲット!

ゲームの明日を語る会コミュの[05.03.13] 任天堂・脳トレプロジェクト

  • mixiチェック
  • このエントリーをはてなブックマークに追加
コミュ内ニュース検索用です。

ミクシイニュースより。
+++++++++

[ゲーム]【GDC07】「任天堂の忍者」島田氏が脳トレプロジェクトの舞台裏を語る
(RBB TODAY - 03月13日 12:51)
任天堂 開発環境制作第2グループ グループマネージャー 島田健嗣氏

 国内販売1500万台を経てなおも品薄状態が続くニンテンドーDS。そのキラーソフトとなったのが「脳を鍛える大人のDSトレーニング」(脳トレ)だ。本ゲームはまた、タッチペンによる「文字認識」とマイクによる「音声認識」の双方を導入した、初のタイトルとなった。

 しかし、その開発期間は約3ヶ月。開発人員は10人未満にすぎなかった。

 米サンフランシスコで開催されたGDCで9日(現地時間)、任天堂の島田健嗣氏は「Rethinking the Development Timeline」と題した講演を行い、なぜこのような短期間・少人数で開発が成功したのか、その秘密を紹介した。手品の種は文字認識と音声認識のライブラリを、ゲーム開発に先駆けて行っていたこと。島田氏は講演内で開発の手順を説明すると共に、「先を読み、仕込みをしておく」重要性について訴えた。

 任天堂には開発環境を専門に整備する部隊が存在する。「SDK・無線環境グループ」「グラフィック・オーディオ環境グループ」「要素技術・ミドルウェア開発グループ」である。彼らが開発したライブラリは任天堂社内だけでなく、サードパーティ向けにも提供される。島田氏はこのうち後者2つのリーダーである。そしてDSの文字認識と音声認識のライブラリを作り上げたのが、3番目のグループだった。ゲーム開発を陰で支える「忍者」的な存在である。

 島田氏はDSの立ち上げに狂奔しながらも、「文字認識」と「音声認識」が必要になる時が来ると確信していた。というよりDSにタッチスクリーンとマイクが存在する以上、いつか必要になることは明らかだった。とはいえ、これらは積み重ねが重要な技術で、任天堂社内で一朝一夕に開発できるものではない。そのため社外メーカーのエンジンで使用できるものがあるか、独自に調査を進められた。

 ポイントは「メモリー容量」「応答速度」「他言語対応」「コスト」など。中でもDSで快適に動作させるため、メモリー容量が小さく、軽快に動作することが重要視された。こうして複数の候補に絞り込まれていった。

 これと平行して岩田社長を中心に「DSのユーザー層をいかに拡大させるか」という検討会が行われていた。その中で出てきたものに、当時ベストセラーだった「川島教授の脳を鍛える大人の計算ドリル」をDS向けに開発する、というアイディアがあった。2005年11月、担当プログラマーから島田氏に一本の電話が来る。ちなみにその時の条件は「DSを本のように縦持ちにしても認識できること」だったという。

 島田氏は当初、意味がわからなかったが、PC上のデモソフトを見てすぐに理解。動作を確認してライブラリを提供した。ここから「脳トレ」プロジェクトは本格的にスタートした。

 ただし、社外のライブラリはゲーム用に最適化されていたわけではない。そこから様々なチューニングが必要だった。これらはゲーム開発チームから島田氏に集められ、ライブラリメーカーに伝えられて改良されていった。この時点で「2005年の春には発売したい」という要望があったため、開発期間は3ヶ月程度しか余裕がなかった。

 音声認識で問題となったのが、「幅広い年齢層に対応させる」ことと、「終了判定」だった。

 一般の音声認識ライブラリは成人の声を元にチューニングされている。これをゲームで使えるようにするには、子供からお年寄りまで、幅広い年齢層に対応させる必要があった。特に子供の声は周波数が高いため、独自に収集が必要だった。サンプル数は130単語で20人分。社員の子供によるボランティアの協力だ。社内のサウンドルームと、社屋前の路上で録音。寒風の中での録音は子供たちにとって、かなり大変だった。

 一方で「終了判定」についてはライブラリメーカーの協力が不可欠だった。一般的に音声認識では、「音声が途切れて一定時間経過する」ことを条件に認識を終了する。この時の無音時間は長い方がいい。無音時間が短ければ「ハットトリック」などの単語が「ハッ」「トトリック」などと、2音に分かれて認識される危険性があるからだ。

 しかし「脳トレ」では、短い言葉をポンポンと並べていき、それをサクサクと認識させる必要があった。文字の色を発話で入力させる「色彩判別」のためだ。これをおもしろくするには、無音時間は短く、認識率は高くする必要がある。そのためライブラリメーカーに要望が出され、改良が続けられた。

 一方で高齢者ならではの問題も発生した。特に「黄色」の認識率が悪い点が問題視された。加齢に伴って「キイロ(kiiro)」が「チイロ(chiiro)」や「イイロ(iiro)」などと、渇舌が悪くなる点が原因だったのだ。そこで「副辞書」の作成がなされた。「チイロ」「イイロ」などの候補を辞書に登録しておき、「黄色」の場合はどちらでも正解とする。これが副辞書の考え方だ。

 そもそも音声認識は単語が長い方が認識しやすい。「アカ」「アオ」などと短い単語を短時間で連続して認識させるのは、音声認識にとって過酷な環境となる。携帯ゲーム機の宿命として、プレイ環境が常に静かだとは限らない。誤認識の問題も必ず発生する。そこで解析内容に対して「一番近いのはアカ、二番目に近いのはアオ」などと確からしさの順番をつけ、二番目に近い解析結果までに正解があれば「正解」とした。

 完璧を求めない。曖昧さを残したチューニングをすることで、プレイアビリティの向上が求められたのだ。

 一方で手書き文字認識についても膨大なデータ収集が必要とされた。「脳トレ」には計算のスピードを競う「計算20」「計算100」がある。急いで書くと文字が乱れやすい。しかし通常の文字認識ライブラリは「はっきり、綺麗に書く」ことが前提とされている。これもまた過酷な環境だ。そこでDSのタッチパネルで筆跡を自動的に収集するプログラムが開発され、任天堂社員の協力でデータが収集された。この時、重要だったのがデータ解析の手間などを自動化するための最初の段取り。また入力テンポを向上するために、一筆ごとにペンが離れると解析するよう改良がなされた。

 このようにゲームソフトとライブラリの平行作業で開発が進められた結果、「脳を鍛える大人のDSトレーニング」は2005年5月21日に発売できた。

 しかし、島田氏の「先読み」は続いた。DSの本体メニューには日本語以外に「英独仏伊西」の5カ国言語に対応している。そのため音声認識・文字認識ライブラリの多言語対応が必要だと考えたのだ。繰り返すが、この時点で「脳トレ」の米国版・欧州版の発売は未定だった。しかし「いつかは必要になる」と島田氏は判断。岩田社長からも必要性を認められ、多言語対応が開始された。

 ただし、実際の作業はアメリカ版は米国任天堂、欧州版はドイツにある欧州任天堂のスタッフが行うことになる。国内ですら大変だった作業を、今度は現地のスタッフが行い、その要望を島田氏率いる部隊が中継して、社外のライブラリメーカーに伝えなければならない。これを効率よく進めるため、「1.現地に出張し」「2.ノウハウを口頭で直接説明し」「3.データ収集に問題がないか確認する」ことが遵守された。島田氏は中でも、最初にスタッフ間で共通認識を持つことが重要だと指摘した。

 一方で新たな問題も発生した。日本版で使われた手書き文字認識のライブラリが欧州版に非対応だったのだ。そのため急遽、別の製品を採用する必要があり、最終的にスウェーデン製のライブラリが採用された。また欧州版では現地の強い要望により、オランダ語にも対応している。これについてはドイツ語と似ていることから、ドイツ語の副辞書扱いで処理された。

 さらに、この作業を行っている間に新しい作業が発生した。「脳トレ」のセールスが好調だったため、続編の「もっと脳を鍛える大人のDSトレーニング」の開発がスタートしたのだ。こちらでは新たに「漢字認識」という難問があった。最終的に6500文字に対応するため、約500名の任天堂社員が、今まで一度も書いたことのないような漢字を、DSのタッチスクリーン上で書き、筆跡データ収集に協力することになった。

 このように前半は「日本語の音声認識」「日本語の文字認識」「英語の音声認識」が平行し、後半では「欧州版の音声認識」「アルファベットの文字認識」「漢字認識」が平行した。これが日本・アメリカ・ドイツそしてスウェーデンで分担作業で進められた。短期間で効率よく進めるために、時差を利用した時間配分スケジュールが立てられた。地球の丸さが幸いした。

 「脳トレ」は日・米・欧に加えて韓国版も発売され、日本版の「もっと脳トレ」とあわせて、4地域5バージョンとなっている。島田氏は成功要因を「先を読み、仕込みをしたこと」「プロジェクト内での意識共有」「国際的な視野を持つこと」の3点を上げた。特に上層部の理解と、現場から提案する勇気がなくては、こうした要素技術への投資は難しいと指摘。また外部メーカーとの折衝については、ゲームでの要望をきちんと伝えて、しっかり理解してもらうこと。曖昧なままで進めないことが重要だとした。

 現在、島田氏はWii、DS向けの開発環境の整備を続けている。最近の例ではWii向けに2D&3Dグラフィック・エフェクトがプレビューできる「NintendoWare for Revolution」がある。今年から実機がなくてもPC上だけでプレビューができるように改良。ハル研究所と共同で開発されている。またWiiの各種コーデックや、ソフトウェアキーボードの予測入力ライブラリ、音声合成など、先を見越した実験や調査の日々が続いている。

 「自分たちの作ったライブラリが多くのディベロッパーに採用され、世界中で使われていることは、とても励みになる」(島田氏)。今後もさまざまな技術を準備していくので、皆さんもさらに驚きを持ったゲーム作りをしてほしい、「任天堂の忍者」はこう述べて講演を締めくくった。

コメント(1)

以下、前にニューストピでコメントした内容です。

+++++++++++++

個人的に、日本語教育に勉強してきているので、音声認識に関する部分が興味深かったです。
脳トレやってて「あか」「あお」「きいろ」の中で、「あか」のアクセントの反応が悪い気がしましたが、それは私だけでしょうか。

赤=[あ]か(あ、にアクセント)
   
垢=あ[か](か、にアクセント)

で、何故か後者でないときちんと反応しなかったのです。
それが気になりました。


青=[あ]お

というので、アクセントのおく部分も似ているから、区別したということなのでしょうか。
「はっきり発音する」のがアクセント的に正しい(あくまでも東京方言的に正しいっていう意味で)っていうのと違う気もするのですが…。

あと、同じく任天堂のお料理ナビで、工程を見ていくときに、
「次」という他に、
数字を言うことで、見たい工程にスキップできる機能があるのですが、

   
五番=[ご]ばん(ご、にアクセント)
   
碁盤=ごばん(平坦な言い方)

で後者の言い方じゃないと反応しなかったのです。
……そんなこと気にするのは私くらいでしょうが。

文字認識もそうですが、言葉を扱うゲームというのは、あいまいさを残さないと、汎用性に欠けるというのは分かるのですが……正解でないのに正解になるのは結構、やる気がそがれるものですし、今後の技術の発達に期待です。

ログインすると、みんなのコメントがもっと見れるよ

mixiユーザー
ログインしてコメントしよう!

ゲームの明日を語る会 更新情報

ゲームの明日を語る会のメンバーはこんなコミュニティにも参加しています

星印の数は、共通して参加しているメンバーが多いほど増えます。

人気コミュニティランキング