« NRIがテクニカルセミナで次世代ケータイを活用した基幹業務システム構築ソリューションを紹介(1/19) | Main | 「ファイナルファンタジーII」など、注目BREWゲームアプリ情報[12月中旬~下旬](1/21) »

January 20, 2006

分散型音声認識機能「声de入力」の将来性はBREWアプリとの連携に(1/22改題)

今月12日、KDDIはニュースリリース「世界初、au携帯電話に分散型音声認識機能『声de入力』を搭載~歩行者向けナビゲーションサービス、EZナビウォークにて提供開始~」を発表しました。
これは、今年2月上旬より「声de入力」機能を利用したEZナビウォークを配信し、歩きながら画面を見ずに発声するだけで乗換検索や、目的地検索が可能になるというものです。

今回の「世界初」は正確には「端末とサーバで処理を分担し、少量のパケット送受で音声認識が可能なDSR型の音声認識機能を、Smart Phone(SymbianOSおよびWindows Mobile等の汎用OSを搭載した端末)以外の携帯電話上で実現するのは世界初」という意味とのことで、若干わかりづらいのですが、要するに、ケータイ上のソフトウェアとサーバの処理分担による分散型音声認識機能ということで、注目されます。
これは、ケータイ側で音声の特徴情報を抽出し、高性能なサーバにより大規模かつ最新の情報に基づく音声認識を高精度にて実現するというテクノロジであり、過去のケータイによる音声認識の問題点を次々とクリアする可能性をもっています。
しかも、音声認識を開始する直前に周辺雑音を測定し、利用環境に適した音響分析処理を行うことや、誤った認識結果である可能性がある場合にその原因を推定し、利用方法をアドバイスする機能など、使いやすさを大きく向上するソリューションが盛り込まれています。

しかし、私も参加させていただいた連載企画「BREW最新事情」を担当されたITメディアの吉岡綾乃さんが書かれた記事によると、残念なことに、この件はBREWの活用事例にはなっていません(主にこの行以降を1/22に追記しました)。
つまり、特徴パラメータの抽出、計算はBREWアプリではなく、端末上のソフトウェアで行なっているので、今のところ、現行機種でこの機能を動かすことは不可能ということです。
もし、これが(全機能ではなくても)BREWアプリで実現できたら、非常に早いスピードでの普及が期待できますし、いろいろなアイディアが実現できると思うのですが。

なお、「『今から音声認識開始』→『認識開始』→『音声認識終了』という部分のAPIは、BREWアプリから利用できるものになっている」(KDDI)ということですので、このAPIを突破口として、分散型音声認識機能とBREWアプリの連携が発展することに期待したいと思います。

詳しくはニュースリリースをご覧ください。

KDDI ニュースリリース 2006年1月12日
世界初、au携帯電話に分散型音声認識機能「声de入力」を搭載
~歩行者向けナビゲーションサービス、EZナビウォークにて提供開始~
[ http://www.kddi.com/corporate/news_release/2006/0112/index.html ]

ITmediaビジネスモバイル 2006/01/12
au「声de入力」は、今までの音声認識とどこが違う?
[ http://www.itmedia.co.jp/enterprise/mobile/articles/0601/12/news082.html ]

|

« NRIがテクニカルセミナで次世代ケータイを活用した基幹業務システム構築ソリューションを紹介(1/19) | Main | 「ファイナルファンタジーII」など、注目BREWゲームアプリ情報[12月中旬~下旬](1/21) »

Comments

1/20に公開したこのコラムですが、一部、誤りと確認が取れていない(私の想定に甘さの有る)記述がありましたので、訂正しました。

これは、

・特徴パラメータの抽出、計算はBREWアプリではなく、端末上のソフトウェアで行なっている
・「『今から音声認識開始』→『認識開始』→『音声認識終了』という部分のAPIは、BREWアプリから利用できるものになっている。ただ、APIを公開するかどうかは決まっていない」(KDDI)

という2情報の読み損ねによるものです。
ご迷惑をおかけした方にお詫び申し上げます。

上記の情報の詳細は、ITメディアの吉岡綾乃さんの記事をご覧下さい。
[ http://www.itmedia.co.jp/enterprise/mobile/articles/0601/12/news082.html ]

Posted by: 平野正喜@ランドッグ・オーグ | January 22, 2006 at 10:16 AM

Post a comment



(Not displayed with comment.)


Comments are moderated, and will not appear on this weblog until the author has approved them.



TrackBack

TrackBack URL for this entry:
http://app.cocolog-nifty.com/t/trackback/27993/8252056

Listed below are links to weblogs that reference 分散型音声認識機能「声de入力」の将来性はBREWアプリとの連携に(1/22改題):

« NRIがテクニカルセミナで次世代ケータイを活用した基幹業務システム構築ソリューションを紹介(1/19) | Main | 「ファイナルファンタジーII」など、注目BREWゲームアプリ情報[12月中旬~下旬](1/21) »