JP2006227954A - 情報処理装置及び情報処理方法等 - Google Patents

情報処理装置及び情報処理方法等 Download PDF

Info

Publication number
JP2006227954A
JP2006227954A JP2005041551A JP2005041551A JP2006227954A JP 2006227954 A JP2006227954 A JP 2006227954A JP 2005041551 A JP2005041551 A JP 2005041551A JP 2005041551 A JP2005041551 A JP 2005041551A JP 2006227954 A JP2006227954 A JP 2006227954A
Authority
JP
Japan
Prior art keywords
instruction
information
user
cause
information processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005041551A
Other languages
English (en)
Inventor
Kentaro Yamamoto
健太郎 山本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Pioneer Corp
Original Assignee
Pioneer Electronic Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pioneer Electronic Corp filed Critical Pioneer Electronic Corp
Priority to JP2005041551A priority Critical patent/JP2006227954A/ja
Publication of JP2006227954A publication Critical patent/JP2006227954A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】 ユーザがより安心して操作を行うことが可能な情報処理装置及び情報処理方法等を提供する。
【解決手段】 本願に係る情報処理装置は、ユーザから入力手段を通じて入力された指示情報に基づいて、予め用意された複数の指示候補のうちから1の指示を認識し、当該認識された指示に応じた情報処理を行う情報処理装置であって、前記複数の指示候補のうちから1の指示を認識できなかった場合に、その認識できなかった原因を解析し、当該解析された原因を示す原因情報をユーザに対して提示する。
【選択図】 図3

Description

本発明は、ユーザから入力手段を通じて入力された指示情報に基づいて、予め用意された複数の指示候補のうちから1の指示を認識し、当該認識された指示に応じた情報処理を行う装置及び方法等の技術分野に関する。
近年、音声認識技術を用いてユーザから発話された音声指示を認識し、当該認識された指示に従って所定の情報処理を行うオーディオ装置やナビゲーション装置等が知られるようになってきている。特に、一部の車載用オーディオ装置や車載用ナビゲーション装置では、危険防止のため、殆どの手入力での操作を禁止し、ユーザからの音声指示によって各種情報処理(例えば、楽曲の絞込み処理等)を行うようになっており、今後一般的になってくるものと考えられる。
また、例えば、特許文献1に開示された楽曲検索装置においても、データの手入力を行なわずに、音声認識技術を用いて楽曲の検索を行うことができるようになっている。
特開平10−91176号公報
ところで、上記のように、音声によって指示を行う音声操作は、オーディオ装置やナビゲーション装置のユーザの間で未だ一般的に定着しておらず、苦手意識や恐怖感があるユーザが多くいるものと想定される。
特に、何らかの原因(例えば、ノイズや発話タイミング等)で音声操作がうまくいかず、ユーザの意図するように装置が動作しないような場合、益々恐れを抱いて音声操作が使用されなくなるという不都合が生じる可能性がある。このことは、装置が多機能化して操作が複雑になればなるほど顕著になると予想される。
そこで、このような問題の解消を一つの課題とし、ユーザがより安心して操作を行うことが可能な情報処理装置及び情報処理方法等を提供することを目的する。
上記課題を解決するため、請求項1に記載の発明は、ユーザから入力手段を通じて入力された指示情報に基づいて、予め用意された複数の指示候補のうちから1の指示を認識し、当該認識された指示に応じた情報処理を行う情報処理装置であって、前記複数の指示候補のうちから1の指示を認識できなかった場合に、その認識できなかった原因を解析する原因解析手段と、前記解析された原因を示す原因情報をユーザに対して提示する提示手段と、を備えることを特徴とする。
請求項4に記載の発明は、ユーザから入力手段を通じて入力された指示情報に基づいて、予め用意された複数の指示候補のうちから1の指示を認識し、当該認識された指示に応じた情報処理を行う情報処理方法であって、前記複数の指示候補のうちから1の指示を認識できなかった場合に、その認識できなかった原因を解析する工程と、前記解析された原因を示す原因情報をユーザに対して提示する工程と、を備えることを特徴とする。
請求項5に記載の情報処理プログラムは、ユーザから入力手段を通じて入力された指示情報に基づいて、予め用意された複数の指示候補のうちから1の指示を認識し、当該認識された指示に応じた情報処理を行うコンピュータを、前記複数の指示候補のうちから1の指示を認識できなかった場合に、その認識できなかった原因を解析し、前記解析された原因を示す原因情報をユーザに対して提示するように機能させることを特徴とする。
請求項6に記載の記録媒体は、請求項5に記載の情報処理プログラムがコンピュータ読み取り可能に記録されていることを特徴とする。
以下、本願の最良の実施形態を添付図面に基づいて説明する。なお、以下に説明する実施の形態は、車両に搭載された車載用オーディオ装置に対して本願を適用した場合の実施形態である。
先ず、図1を参照して、本実施形態における車載用オーディオ装置の構成及び機能を説明する。図1は、本実施形態における車載用オーディオ装置の概要ブロック例を示す図である。
図1に示すように、車載用オーディオ装置1は、情報再生部11、情報出力部12、楽曲特徴量抽出部13、情報記録再生部14、操作・表示部15、マイクロフォン16、音声認識部17、ネットワーク3を介して楽曲配信サーバ2との間でデータ通信を行うための通信部(通信機器及び通信アンテナを含む)18、撮像部19、画像処理部20及びシステム制御部21等を備えて構成されている。
なお、車載用オーディオ装置1は、通信部(通信機器及び通信アンテナを含む)18を介して例えば移動体通信網、インターネット等から構成されたネットワーク3を介して楽曲配信サーバ2との間でデータ通信が可能になっている。
情報再生部11は、システム制御部21の制御下、CD(Compact Disc:CD−DA(Digital Audio)、CD−R、CD−R/W等の総称)、MD(Mini Disc)、DVD(Digital Versatile Disc:DVD−Audio、DVD−Video、DVD−R、DVD−RW等の総称)、又はカード型記録媒体(例えば、メモリースティックやSDカード等)等の記録媒体(記録手段)に記録された楽曲データを再生し、当該楽曲データを情報出力部12、楽曲特徴量抽出部13、及び情報記録再生部14に出力するようになっている。
例えば、情報再生部11がCD(例えば、CD−DA)に記録された楽曲データを再生するものである場合、当該情報再生部11は、図示しないが、当該CDに光ビームを照射して記録情報を光学的に読み取り電気信号に光電変換し出力する光ピックアップ、当該光ピックアップから出力された電気信号からRF(Radio Frequency)信号等を生成して出力するRFアンプ、当該RF信号に所定の復調処理及び誤り訂正処理等を行いデジタル信号に変換して楽曲データを再生するデジタル信号処理回路(例えばDSP(Digital Signal Processor)等により構成)及び、スピンドルモータ及び光ピックアップをサーボ制御するサーボ回路等を備え、当該楽曲データの再生、出力を行う。
また、情報再生部11は、記録媒体に楽曲データに付随する付随情報(例えば、楽曲のタイトル、ジャンル(例えば、ロック、ジャズ、ポップス、クラッシック、ヒップホップ等)などのテキスト情報)、アーティスト名、年代(例えば、いつ製作されたかを示す情報)等)が記録されている場合には、情報再生部11は、システム制御部21の制御下、当該付随情報を記録媒体から読み出し、情報記録再生部14に出力するようになっている。
なお、CD以外の記録媒体から楽曲データを再生するための構成及び機能については公知の技術であるので、詳しい説明は省略する。また、マルチメディアプレーヤのように、複数の記録媒体から楽曲データを再生するように構成してもよい。
情報出力部12は、図示しないが、情報再生部11により再生出力された楽曲データ(デジタル音声信号)又はシステム制御部21から出力された、楽曲を選択するための音声ガイド情報等を入力し、これをアナログ音声信号に変換するDAC(Digital-to-Analog Converter)、当該アナログ音声信号を増幅して出力するAMP(Amplifier)、及び増幅されたアナログ音声信号を音波として出力するスピーカ等を備えており、楽曲又は音声ガイド情報をスピーカから出力するようになっている。
楽曲特徴量抽出部13は、例えばDSP等により構成されており、情報再生部11により再生出力された楽曲データを入力し、当該楽曲データから当該楽曲データの特徴を示す楽曲特徴量を抽出し、情報記録再生部14及びシステム制御部21に出力するようになっている。
ここで、楽曲特徴量とは、その楽曲の特徴を定量的に示す情報(例えば、0〜100の間の数値等で表される)であり、これには、例えば、楽曲の楽音から得られる楽音特徴量などが含まれる。
楽音特徴量としては、キー(ハ長調、イ短調等の曲の調性)、キーの変化位置(又は変化パターン)、コード(和音、又は和音の組合せ)、当該コードの変化位置(又は変化パターン)、当該コードの変化量(CPM)(又は変化率(HVL))、ビート(拍:強弱を持った一定のパルス信号)、当該ビートの最大値(又は、最小値、平均値)、当該ビートの変化位置(又は変化パターン)、当該ビートの変化量(BPM)(又は変化率)、楽音の最大強度や平均強度、音量、当該音量の変化位置(又は変化パターン)などが挙げられる。
これらの楽音特徴量の抽出には、公知の様々な方法を適用可能であるので、詳しい説明を省略するが、例えば、楽曲特徴量抽出部13が、楽曲データを高速フーリエ変換(Fast Fourier Transform)して周波数分析を行い時間軸に沿った所定の時間間隔で周波数毎の音量値を算出してキー及びこれに関する量(キーの変化位置等)、コード及びこれに関する量(コードの変化位置や変化量等)の抽出を行ったり、所定のスレッショルドレベルにて楽曲データに係る波形のエンベロープを検出することによりビート及びこれに関する量(ビート(信号)の最大値等)の抽出を行う。
このような楽曲特徴量は、例えばシステム制御部21による楽曲の曲調判別に使用される。この曲調判別の処理では、例えば、予め設定され記憶された、楽曲特徴量と曲調との対応付けを規定した曲調対応付けテーブルが用いられ、楽曲データの楽曲特徴量に基づいて行われ、一旦楽曲データの曲調が判別されると、判別された曲調を示す情報は、当該楽曲データに対応付けられて後述する楽曲リストに登録されることになる。なお、当該曲調判別の処理は、本願と直接の関係がないので詳しい説明を省略する。
情報記録再生部14は、例えば、楽曲データを一時的に蓄積するバッファメモリ、楽曲データをエンコード(圧縮等)又はデコード(伸長等)するためのエンコーダ/デコーダ、HD(Hard Disc)、及びHDに楽曲データ等を記録又はHDから再生等を行うためのHDドライブ等を備えている。なお、情報記録再生部14が、MD、DVD−RW、又はカード型記録媒体等の記録媒体を備えて構成されるものであっても良い。
そして、情報記録再生部14は、システム制御部21の制御下、情報再生部11から出力された楽曲データを例えば圧縮して、HDに記録すると共に、情報再生部11から出力された付随情報を楽曲データに関連付けて当該記録媒体に記録する。また、情報記録再生部14は、システム制御部21の制御下、楽曲特徴量抽出部13から出力された楽曲特徴量を当該楽曲データに関連付けて記録するようになっている。
更に、情報記録再生部14は、システム制御部21の制御下、例えば楽曲配信サーバ2からネットワーク3を介して配信され通信部18を介して受信された楽曲データ及びこれに付随する付随情報を当該記録媒体に記録するようになっている。なお、楽曲配信サーバ2から取得される楽曲データの楽音特徴量も、例えば当該取得の際に、楽曲特徴量抽出部13により抽出され、当該楽曲データに関連付けて記録される。
このように情報記録再生部14におけるHDに記録される各楽曲データには、固有の登録番号(例えば、シリアル番号)が付与され、リスト管理されるようになっている。例えば、HDに記録されている楽曲データの登録番号、データ容量、記録場所、演奏時間、上記付随情報、及び楽曲特徴量等の管理情報が楽曲リストに登録される。この楽曲リストのデータは、例えばHDに記録され、適宜、システム制御部21により読み出され使用される。なお、当該管理情報に楽曲データの曲調(例えば、明るい曲、ノリがいい曲、癒される曲、静かな曲、悲しい曲等)が含まれるようにしても良い。また、楽曲データに付随する付随情報は、楽曲データがHDに記録される際に、ユーザが操作・表示部15を操作して入力され、上記管理情報に登録されるようにしても良い。
操作・表示部15は、例えばタッチパネル式の表示パネル(例えば液晶パネル)を備えており、システム制御部21の制御下、上記楽曲リストに含まれる管理情報や、楽曲を選択するための操作ボタンを含む表示ガイド情報等を表示するようになっている。表示パネル上に表示された操作ボタンが押されると(言い換えれば、操作ボタンに触れられると)、当該操作ボタンに対応する操作指示信号がシステム制御部21に出力される。なお、楽曲を選択するための操作ボタンを備えるリモコンが併用されても良い。
マイクロフォン16は、例えばユーザにより発話された各種指示に関する音声を検出(集音)して、その音声信号を音声認識部17に出力するようになっている。
音声認識部17は、公知の音声認識処理を行うものであり、マイクロフォン16からの音声信号を待ち受け、当該音声信号の周波数分析を行い、予め用意された発話音声候補群の中から最も適合する候補を1又は複数選定して、選定された候補を示す情報をシステム制御部21に出力するようになっている。更に、音声認識部17は、マイクロフォン16からの音声信号の周波数分析によってノイズのレベルを示すノイズ情報をシステム制御部21に出力するようになっている。
撮像部19は、例えばCCDカメラからなり、車両内の所定の位置(例えば、運転者、又は同乗者の口元が撮影可能な位置)に取り付けられ、車両内(例えば、運転者又は同乗者の口元)を撮像し、当該撮像された画像情報を画像処理部20に出力するようになっている。
画像処理部20は、撮像部19からの画像情報を取得して画像解析を行い、車両内において何らかの動きを検出するようになっており、当該検出された動き(例えば、運転者又は同乗者の口元の動き)を示す動き情報をシステム制御部21に出力するようになっている。
システム制御部21は、演算機能を有するCPU、作業用RAM、及び各種処理プログラム(本願の情報処理プログラムを含む)やデータを記憶するROM等を備えている。なお、情報処理プログラムは、例えばネットワーク3に接続された所定のサーバからダウンロードされるようにしてもよいし、例えば、CD−ROM等の記録媒体に記録されて当該記録媒体のドライブを介して読み込まれるようにしてもよい。
そして、CPUがROM等に記憶されたプログラムを実行することにより、コンピュータとしてのシステム制御部21は、車載用オーディオ装置1全体を統括制御するとともに、本願の原因解析手段及び提示手段等として機能するようになっている。
具体的には、システム制御部21は、ユーザから操作・表示部15における操作ボタン或いはマイクロフォン16等の入力手段を通じて入力された指示情報に基づいて、予め用意された複数の指示候補のうちから1の指示を認識し、当該認識された指示に応じた情報処理を行う。
図2は、システム制御部21における楽曲絞込み処理の流れの一例を示す概念図である。
図2に示す例では、楽曲絞込み処理が開始された場合、システム制御部21は、複数の第一指示候補(例えば、ジャンル、年代、アーティスト名、曲調等の楽曲の選び方の指示候補)を用意(RAMの所定の記憶領域に記憶)して待ち受け状態となり、例えば音声認識部17から指示情報(例えば、ユーザが“ジャンル”と発話)が入力されると、システム制御部21は、当該指示情報に対応する1の指示(例えば、ジャンルで選ぶ指示)を認識し、当該認識された指示に応じた情報処理、例えば、ジャンルに属する第二指示候補(例えば、ロック、ポップ、ジャズ、ヒップホップ等の楽曲の属性の指示候補)を用意し、ユーザからの入力を待ち受ける処理を行う。そして、ユーザから入力手段を通じて指示情報(例えば、ユーザが“ロック”と発話)が入力されると、システム制御部21は、当該指示情報に対応する1の指示(例えば、ロックに該当する楽曲を選択する指示)を認識し、当該認識された指示に応じた情報処理、例えば、属性が「ロック」である楽曲データを楽曲リストから所定数(例えば、ランダムに10曲)選曲する処理を行う。
そして、システム制御部21は、上記複数の指示候補のうちから1の指示を認識できなかった場合に、原因解析手段として、その認識できなかった原因を解析するようになっている。
例えば、ユーザが何らかの指示を発話し、音声認識部17が発話音声候補群の中から最も適合する候補を1つに絞れず複数の候補を選定して、その情報をシステム制御部21に出力した場合に、システム制御部21は、上記複数の指示候補のうちから1の指示を認識できないことになる。この場合、システム制御部21は、例えば、音声認識部17からのノイズ情報から高周波ノイズのレベルを判定し、ノイズが所定レベル以上にある場合(例えば、ユーザの指示の発話時に車両内外の騒音等によりノイズが多く発生していたことによる)、当該認識できなかった原因がノイズにあると解析することになる。或いは、システム制御部21は、例えば、画像処理部20からの動き情報により運転者の口元が動き出すタイミングを判定し、当該タイミングが音声認識部17により認識できないタイミングである場合(例えば、音声認識部17が待ち受け状態にないタイミングであったことによる)、当該認識できなかった原因が発話タイミングにあると解析することになる。
また、システム制御部21が、待ち受けていない指示候補をユーザが発話した場合にも、1の指示を認識できないことになるが、この場合、当該認識できなかった原因が、待ち受けていない指示が発話されたことにあると解析することにある。
そして、システム制御部21は、原因解析の結果、その解析された原因(例えば、ノイズ、発話タイミング等)を示す原因情報を、提示手段として、ユーザに対して提示(例えば、操作・表示部15における表示パネル上に表示したり、情報出力部12におけるスピーカから音声出力することによって提示)するようになっている。
更に、システム制御部21は、上記原因情報を提示するとともに、上記認識できなかった原因の対処方法を示す情報をユーザに対して提示する。例えば、上記原因がノイズにある場合、対処方法を示す情報としては、現在いる地域から離れて再度発話することを促す情報が挙げられる。また、上記原因が発話タイミングにある場合、対処方法を示す情報としては、発話タイミングを少し遅らせることを促す情報が挙げられる。このような原因の対処方法を示す情報は、夫々の原因を示す情報に対応付けられて予め記憶されるようになっている。
更にまた、システム制御部21は、上記複数の指示候補(例えば、ジャンル、年代、アーティスト名、曲調等の楽曲の選び方の指示候補)を用意し待ち受け状態にあるとき、1の指示を認識できなかった場合に、複数の指示候補(例えば、音声認識部17によりジャンル、年代の2つに絞れている場合にはその2つの指示候補)のうちの何れか1の例えばジャンルで選ぶ指示を上記1の指示として例えばランダムに選定し、当該選定した指示により行なわれるべき情報処理(例えば、ジャンルに属する第二指示候補(例えば、ロック、ポップ、ジャズ、ヒップホップ等の楽曲の属性の指示)を用意し、ユーザからの入力を待ち受ける処理)を起点として最終的な情報処理(例えば、ロック、ポップ、ジャズ、ヒップホップの全部又は一部が指示された場合における選曲処理)の結果に至るまでの案内を示す案内情報を生成し、ユーザに対して提示するようになっている。
次に、システム制御部21の楽曲絞込み処理において実行される原因解析及び案内情報生成処理について、図3等を参照して詳しく説明する。
図3は、システム制御部21における楽曲絞込み処理を示すフローチャートである。
図3に示す楽曲絞込み処理は、例えばユーザが楽曲絞込み処理要求を発話、或いは、ユーザが楽曲絞込み処理要求を示す操作ボタンを押下することにより開始され、システム制御部21は、先ず、複数の第一指示候補(例えば、ジャンル、年代、アーティスト名、曲調等の楽曲の選び方の指示候補)を用意し、例えば「ジャンル、年代、アーティスト名、曲調から選べますので、このうち何れかを選択入力して下さい」との音声ガイド情報を情報出力部12から音声出力し(ステップS1)、入力待ち受け状態となる(ステップS2)。これにより、システム制御部21から、音声認識部17及び画像処理部20に対して入力待ち受け指令を与えられ、これにより、音声認識部17はマイクロフォン16からの入力待ち受け状態となり、画像処理部20は撮像部19からの入力待ち受け状態となる。
これに対し、ユーザが何らかの言葉を発すると、その音声がマイクロフォン16により集音(入力)され、音声認識部17が発話音声候補群の中から最も適合する候補の選定処理を行う。その結果、1又は複数の候補が選定できた場合には、その候補を示す指示情報と、その時のノイズのレベルを示すノイズ情報とがシステム制御部21に出力される。一方、1つの候補も選定できなかった場合には(例えば、音声の入力があったが音量が小さくて認識できない、或いは、発話音声候補群以外の音声であったことによる)、選定できなかった旨を示す指示情報と、その時のノイズのレベルを示すノイズ情報とがシステム制御部21に出力される。また、このとき、画像処理部20においては、撮像部19にて撮像された画像情報に基づき画像解析が行われ、車両内において何らかの動き(例えば、運転者の口元の動き)を示す動き情報がシステム制御部21に出力される。
そして、ステップS2において、例えば音声認識部17からの指示情報の入力があった場合には、システム制御部21が、これに応じ(ステップS2:Y)、当該指示情報に基づき、上記用意された複数の第一指示候補のうちから1の指示を認識できた否かを判別する(ステップS3)。例えば、当該指示情報中に、ジャンル、年代、アーティスト名、曲調のうち何れか1つを示す情報が含まれている場合には、1の指示を認識できると判別され(ステップS3:Y)、ステップS4に移行される。一方、当該指示情報中に、ジャンル、年代、アーティスト名、曲調のうち何れか2以上を示す情報が含まれている場合、又は何れの情報も含まれていない場合には、1の指示を認識できないと判別され(ステップS3:N)、ステップS5に移行される。
ステップS4では、システム制御部21は、上記複数の第一指示候補のうち上記指示情報に含まれる1の指示(例えば、ジャンルで選ぶ指示)を認識し、当該指示に応じた情報処理、例えば、ジャンルに属する第二指示候補(例えば、ロック、ポップ、ジャズ、ヒップホップ等の楽曲の属性の指示候補)を用意し、例えば「ロック、ポップ、ジャズ、ヒップホップから選べますので、このうち何れかを選択入力して下さい」との音声ガイド情報を情報出力部12から音声出力する。そして、ステップS8で最終的な情報処理(例えば、選曲処理)が終了していないと判別された場合には(ステップS8:N)、ステップS2に戻り再び入力待ち受け状態となる。
一方、ステップS5における原因解析及び提示処理では、システム制御部21は、1の指示が認識できなかった原因を音声認識部17からの指示情報及びノイズ情報、更には画像処理部20からの動き情報等に基づいて解析し、その解析された原因を示す原因情報及び原因の対処方法を示す情報を、例えば、情報出力部12から音声出力することによってユーザに対して提示する。
例えば、上述したように、ノイズが所定レベル以上にある場合、ノイズが原因であると解析され、例えば「この地域のノイズレベルが高いことが原因で認識できませんでした」等の原因情報と、「現在の地域から少し離れて再度発話して下さい」等の原因の対処方法を示す情報が順次、情報出力部12から音声出力される。
また、発話タイミングが音声認識部17により認識できないタイミングである場合、原因が発話タイミングにあると解析され、例えば「発話のタイミングが少し早かったことが原因で認識できませんでした」等の原因情報と、「・・・を選択入力して下さい、とスピーカから音声出力された後、2秒後に発話して下さい」等の原因の対処方法を示す情報が順次、情報出力部12から音声出力される。
更に、例えば、画像処理部20からの動き情報により運転者の口元が動いているにも拘わらず、音声認識部17からの指示情報に候補の選定できなかったことが示されている場合には、原因が発話者の声が小さい又は発話音声候補群以外の言葉が発せられたことにあると解析される。この場合、例えば、「声が小さいか、又はジャンル、年代、アーティスト名、曲調以外の言葉を発話されたことが原因で認識できませんでした」等の原因情報と、「もっと大きな声で、ジャンル、年代、アーティスト名、曲調のうち何れか1つを発話してください」等の原因の対処方法を示す情報が順次、情報出力部12から音声出力される。
次に、ステップS6における案内情報生成及び提示処理では、システム制御部21は、例えば、上記複数の指示候補のうちの何れか1の指示候補を上記1の指示として選定し、当該選定された指示により行なわれるべき情報処理を起点として最終的な情報処理の結果に至るまでの処理を行い(シミュレート)し、その結果に基づき上記最終的な情報処理の結果に至るまでの案内を示す案内情報を生成して、その案内情報を、例えば、情報出力部12から音声出力することによってユーザに対して提示する。
この案内情報には、例えば、最終的な情報処理の結果に至るまでの過程において、ユーザがどのような指示を与えれば、どのような処理が行われ、どのような結果に至るのかのフロー(流れ)等を示す情報を含ませることができ、上記過程においてユーザの指示により処理が分かれる場合には、その全ての場合におけるフローを示す情報が含まれても良いし、何れか一つのフローを示す情報が含まれても良い。
例えば、ジャンル、年代、アーティスト名、曲調等の楽曲の選び方の指示候補が用意され待ち受け状態にあるとき、音声認識部17から入力された指示情報にジャンル及び年代が示されていた場合(或いは、何も示されていない場合)には、例えばジャンルで選ぶ指示が上記1の指示として例えばランダムに選定され、当該選定された指示により行なわれるべき情報処理(例えば、ジャンルに属するロック、ポップ、ジャズ、ヒップホップ等の楽曲の属性の指示を用意し、ユーザからの入力を待ち受ける処理)を起点として最終的な情報処理の結果に至るまで(例えば、ロック、ポップ、ジャズ、ヒップホップの全部又は一部が指示された場合における選曲処理の結果に至るまで)のシミュレートが行われ、その結果に基づき例えば「楽曲をジャンルで選ぶ場合、ロック、ポップ、ジャズ、ヒップホップから選べ、仮に、ロックで選ぶ場合、XXX・・・のタイトルの楽曲が選ばれ、ジャズで選ぶ場合、ZZZ・・・のタイトルの楽曲が選ばれます」等の案内情報が生成され、ユーザに対して提示される。
また、例えば、上記第一指示候補が用意され待ち受け状態にあるとき、音声認識部17から入力された指示情報に上記待ち受け候補以外が示されていた(例えば、「きょくち」)場合には、上記第一指示候補のうち、これに最も近い指示候補(例えば、より多くの語が一致する指示候補、ここでは、曲調(きょくちょう)で選ぶ指示)が上記1の指示として選定され(これにより、ユーザが発話しようとしたことが予測される)、当該選定された指示により行なわれるべき情報処理(例えば、曲調に属する明るい曲、ノリがいい曲、癒される曲、静かな曲等の楽曲の属性の指示を用意し、ユーザからの入力を待ち受ける処理)を起点として最終的な情報処理(例えば、明るい曲、ノリがいい曲、癒される曲、静かな曲)の全部又は一部が指示された場合における選曲処理の結果に至るまで処理)をシミュレートし、その結果に基づき例えば「楽曲を曲調で選ぶ場合、明るい曲、ノリがいい曲、癒される曲、静かな曲から選べ、仮に、明るい曲で選ぶ場合、SSS・・・のタイトルの楽曲が選ばれます」等の案内情報を生成し、ユーザに対して提示される。
なお、このような案内情報の基本となる基本フォーム(例えば、上記例でいえば、「楽曲を<・・・>で選ぶ場合、<・・・>から選べ、仮に、<・・・>で選ぶ場合、<・・・>のタイトルの楽曲が選ばれます」)が予め記憶されており、システム制御部21は、そのときの待ち受け指示候補、そのときの処理結果に応じて、適切な情報を選定して基本フォームに組み込んで当該案内情報を生成することになる。
そして、ステップS6の処理が終了すると、再び入力待ち受け状態となる(ステップS2)。
一方、入力待ち受け状態になってから所定時間(例えば、1分)が経過すると(ステップS7:Y)、ステップS6に移行し、例えば音声認識部17から入力された指示情報に何も示されていない場合と同様の案内情報生成及び提示処理が行われることになる。
以上の処理を経てステップS8で最終的な情報処理(例えば、選曲処理)が終了したと判別された場合には(ステップS8:Y)、当該処理が終了し、例えば選曲処理により選曲された楽曲データが、システム制御部21の制御の下、情報記録再生部14から再生され、情報出力部12を通じて出力されることになる。
以上説明したように上記実施形態によれば、ユーザから入力された指示情報に基づき、複数の指示候補のうちから1の指示を認識できなかった場合に、その認識できなかった原因を解析し、解析された原因を示す原因情報を提示するとともに、認識できなかった原因の対処方法を示す情報をユーザに対して提示するように構成したので、音声操作がうまくいかなかったときでも、ユーザは、何が悪かったのかの原因と、その対処方法を適切なタイミングで把握することができ、ひいては、ユーザに対して安心感を与えることができる(言い換えれば、装置を使用することに対する苦手意識や恐怖感や払拭をすることができる)。また、装置が多機能になり、より複雑化された場合であっても、ユーザに対して、安心感を与え、ユーザフレンドリーな装置を実現することができる。よって、ユーザが恐れを抱いて音声操作を使用しなくなるという不都合を回避することができる。
更に、ユーザから入力された指示情報に基づき、複数の指示候補のうちから1の指示を認識できなかった場合に、当該複数の指示候補のうちの何れか1の指示候補を1の指示として選定し、当該選定された指示により行なわれるべき情報処理を起点として最終的な情報処理の結果に至るまでの案内を示す案内情報をユーザに対して提示するように構成したので、指示がうまく認識されずユーザが困ったときでも、ユーザは、自分が行おうとしていた最終的な結果や、その課程におけるフロー(流れ)を把握することができ、ひいては、ユーザに対してその後の指示の与え方を的確にサポートすることができる。
また、例えば、上述したように、ユーザから入力された指示情報に含まれている指示候補が待ち受けている指示候補にないとき、当該最も近い(例えば、より多くの語が一致する)指示候補が上記1の指示として選定され、これに応じた情報処理が行われるように構成すれば、ユーザがどのようなシナリオを想定して指示しようとしていたのかが考慮された案内情報をユーザに対して提示することができる。更に、この場合において、例えば、ユーザの再生履歴情報や嗜好情報を蓄積しておき、ユーザから入力された指示情報に含まれている指示候補が待ち受けている指示候補にないとき、ユーザの履歴情報や嗜好情報に基づき、ユーザが指示する可能性が高い指示候補を1の指示として選定(例えば、ユーザがロックを聴いている回数が最も多い、或いはユーザがロックを好む場合には、ロックを選定)し、当該選定された指示により行なわれるべき情報処理を起点として最終的な情報処理の結果に至るまでの案内を示す案内情報を生成してユーザに対して提示するように構成すれば、更に一層、ユーザがどのようなシナリオを想定して指示しようとしていたのかを高い確率で予測でき、より利便性が高い情報をユーザに対して提供することができる。
なお、上記実施形態においては、主としてユーザと装置1とが音声対話する場合(つまり、音声操作の場合)を例にとって説明したが、これに限定されるものではなく、操作・表示部15を通じた対話の場合に適用されても良い。この場合、例えば表示パネル上に複数の操作ボタンが表示され、指示候補として待ち受けていない操作ボタンにユーザが触れた場合、或いはユーザが複数の操作ボタンに同時に触れた場合、或いはユーザが触れている時間が短かった(又は押圧が弱かった)場合等に、システム制御部21は、1の指示を認識できなくなるので、その認識できなかった原因を解析し、解析された原因を示す原因情報を表示パネルに表示するとともに、認識できなかった原因の対処方法を示す情報を表示パネルに表示することによりユーザに対して提示する。また、この場合の案内情報として、例えば、最終的な情報処理の結果に至るまでの操作フロー(ユーザの指示による分岐を含む)を図式的に表示パネルに表示させるように構成しても良い。
また、上記実施形態においては、本願を車載用オーディオ装置に対して適用した場合の例について説明したが、これに限定されるものではなく、例えば、その他の家庭用、業務用の情報(音声情報ばかりでなく映像情報も含む)再生装置、或いはナビゲーション装置に対しても適用可能である。例えば、車載用ナビゲーション装置における音声対話による経路誘導(ルート案内)処理(例えば、ユーザにより発話された目的地(指示)を示す指示情報の入力がされたとき、システム制御部が、待ち受けている目的地候補(指示候補)から1の目的地を認識する場合)に対して本願を適用することができる。
本実施形態における車載用オーディオ装置の概要ブロック例を示す図である。 システム制御部21における楽曲絞込み処理の流れの一例を示す概念図である。 システム制御部21における楽曲絞込み処理を示すフローチャートである。
符号の説明
1 車載用オーディオ装置
2 楽曲配信サーバ
3 ネットワーク
11 情報再生部
12 情報出力部
13 楽曲特徴量抽出部
14 情報記録再生部
15 操作・表示部
16 マイクロフォン
17 音声認識部
18 通信部
19 撮像部
20 画像処理部
21 システム制御部

Claims (6)

  1. ユーザから入力手段を通じて入力された指示情報に基づいて、予め用意された複数の指示候補のうちから1の指示を認識し、当該認識された指示に応じた情報処理を行う情報処理装置であって、
    前記複数の指示候補のうちから1の指示を認識できなかった場合に、その認識できなかった原因を解析する原因解析手段と、
    前記解析された原因を示す原因情報をユーザに対して提示する提示手段と、
    を備えることを特徴とする情報処理装置。
  2. 請求項1に記載の情報処理装置において、
    前記提示手段は、前記原因情報を提示するとともに、前記認識できなかった原因の対処方法を示す情報を前記ユーザに対して提示することを特徴とする情報処理装置。
  3. 請求項1又は2に記載の情報処理装置において、
    前記複数の指示候補のうちから1の指示を認識できなかった場合に、前記提示手段は、当該複数の指示候補のうちの何れか1の指示候補を前記1の指示として選定し、当該選定された指示により行なわれるべき情報処理を起点として最終的な情報処理の結果に至るまでの案内を示す案内情報を前記ユーザに対して提示することを特徴とする情報処理装置。
  4. ユーザから入力手段を通じて入力された指示情報に基づいて、予め用意された複数の指示候補のうちから1の指示を認識し、当該認識された指示に応じた情報処理を行う情報処理方法であって、
    前記複数の指示候補のうちから1の指示を認識できなかった場合に、その認識できなかった原因を解析する工程と、
    前記解析された原因を示す原因情報をユーザに対して提示する工程と、
    を備えることを特徴とする情報処理方法。
  5. ユーザから入力手段を通じて入力された指示情報に基づいて、予め用意された複数の指示候補のうちから1の指示を認識し、当該認識された指示に応じた情報処理を行うコンピュータを、
    前記複数の指示候補のうちから1の指示を認識できなかった場合に、その認識できなかった原因を解析し、
    前記解析された原因を示す原因情報をユーザに対して提示するように機能させることを特徴とする情報処理プログラム。
  6. 請求項5に記載の情報処理プログラムがコンピュータ読み取り可能に記録されていることを特徴とする記録媒体。
JP2005041551A 2005-02-18 2005-02-18 情報処理装置及び情報処理方法等 Pending JP2006227954A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005041551A JP2006227954A (ja) 2005-02-18 2005-02-18 情報処理装置及び情報処理方法等

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005041551A JP2006227954A (ja) 2005-02-18 2005-02-18 情報処理装置及び情報処理方法等

Publications (1)

Publication Number Publication Date
JP2006227954A true JP2006227954A (ja) 2006-08-31

Family

ID=36989286

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005041551A Pending JP2006227954A (ja) 2005-02-18 2005-02-18 情報処理装置及び情報処理方法等

Country Status (1)

Country Link
JP (1) JP2006227954A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016170238A (ja) * 2015-03-12 2016-09-23 アルパイン株式会社 音声入力装置及びコンピュータプログラム
JP2019015959A (ja) * 2017-07-05 2019-01-31 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド オーディオ再生方法、オーディオ再生装置、オーディオ再生デバイス、及びサーバ
JP2022531987A (ja) * 2020-02-18 2022-07-12 バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド 音声インタラクション方法、装置、機器、及びコンピュータ記憶媒体
WO2024053476A1 (ja) * 2022-09-05 2024-03-14 ダイキン工業株式会社 システム、支援方法、サーバ装置及び通信プログラム

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016170238A (ja) * 2015-03-12 2016-09-23 アルパイン株式会社 音声入力装置及びコンピュータプログラム
JP2019015959A (ja) * 2017-07-05 2019-01-31 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド オーディオ再生方法、オーディオ再生装置、オーディオ再生デバイス、及びサーバ
JP2022531987A (ja) * 2020-02-18 2022-07-12 バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド 音声インタラクション方法、装置、機器、及びコンピュータ記憶媒体
US11978447B2 (en) 2020-02-18 2024-05-07 Baidu Online Network Technology (Beijing) Co., Ltd. Speech interaction method, apparatus, device and computer storage medium
WO2024053476A1 (ja) * 2022-09-05 2024-03-14 ダイキン工業株式会社 システム、支援方法、サーバ装置及び通信プログラム
JP7482459B2 (ja) 2022-09-05 2024-05-14 ダイキン工業株式会社 システム、支援方法、サーバ装置及び通信プログラム

Similar Documents

Publication Publication Date Title
US7953504B2 (en) Method and apparatus for selecting an audio track based upon audio excerpts
JP4260788B2 (ja) 音声認識機器制御装置
JP4616337B2 (ja) 再生順変更支援ユニット、楽曲情報再生装置及び再生順変更支援方法
US20050216257A1 (en) Sound information reproducing apparatus and method of preparing keywords of music data
JP3892410B2 (ja) 音楽データ選曲装置、音楽データ選曲方法、並びに、音楽データの選曲プログラムおよびそれを記録した情報記録媒体
JP4469891B2 (ja) 情報処理装置及び情報処理プログラム
JP2006202127A (ja) 推奨情報提示装置及び推奨情報提示方法等
KR20080043358A (ko) 재생 디바이스의 동작을 제어하는 방법 및 시스템
JP2006195385A (ja) 音楽再生装置および音楽再生プログラム
JP2006227954A (ja) 情報処理装置及び情報処理方法等
JP4330174B2 (ja) 情報選択方法及び情報選択装置等
US8069177B2 (en) Information selecting method, information selecting device and so on
JP4475597B2 (ja) 提示データ選択装置及び提示データ選択方法等
JP4877811B2 (ja) 特定区間抽出装置、音楽記録再生装置、音楽配信システム
KR101944303B1 (ko) 음성인식을 이용한 자동 음원 선곡이 가능한 자동차 오디오 시스템 제어방법
US20080140236A1 (en) Musical Composition Reproducing Apparatus and a Method for Reproducing Musical Composition
EP1793381A1 (en) Musical composition reproducing device, musical composition reproducing method and so forth
JP2006276560A (ja) 音楽再生装置および音楽再生方法
JP2009092977A (ja) 車載装置および楽曲検索システム
JPH11242496A (ja) 情報再生装置
KR20010099450A (ko) 음악파일 재생장치
JP2007226649A (ja) 検索装置及びプログラム
KR101576683B1 (ko) 히스토리 저장모듈을 포함하는 오디오 재생장치 및 재생방법
JP2006199228A (ja) インターフェイス設定装置及びインターフェイス設定方法等
JP2000268545A (ja) 音声再生装置