JP2001216131A - 情報処理装置および方法、並びにプログラム格納媒体 - Google Patents

情報処理装置および方法、並びにプログラム格納媒体

Info

Publication number
JP2001216131A
JP2001216131A JP2000027889A JP2000027889A JP2001216131A JP 2001216131 A JP2001216131 A JP 2001216131A JP 2000027889 A JP2000027889 A JP 2000027889A JP 2000027889 A JP2000027889 A JP 2000027889A JP 2001216131 A JP2001216131 A JP 2001216131A
Authority
JP
Japan
Prior art keywords
program
voice
recognition
window
display
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000027889A
Other languages
English (en)
Inventor
Satoshi Fujimura
聡 藤村
Yasuhiko Kato
靖彦 加藤
Shuji Yonekura
修二 米倉
Takashi Sasai
崇司 笹井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2000027889A priority Critical patent/JP2001216131A/ja
Publication of JP2001216131A publication Critical patent/JP2001216131A/ja
Pending legal-status Critical Current

Links

Landscapes

  • User Interface Of Digital Computer (AREA)
  • Stored Programmes (AREA)

Abstract

(57)【要約】 【課題】 音声認識された結果が、どのアプリケーショ
ンに送られるかを使用者に認識させる。 【解決手段】 音声認識のアプリケーションが起動さ
れ、そのアプリケーションのウィンドウの表示が、最小
表示と指示されている場合、そのアプリケーションの小
型表示ウィンドウ241は、音声認識に対応し、アクテ
ィブな状態とされている電子ペットウィンドウ191の
近傍に表示される。また、小型表示ウィンドウ241
は、音声認識が実行されている間だけ表示される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は情報処理装置および
方法、並びにプログラム格納媒体に関し、特に、音声認
識を行う装置に用いて好適な情報処理装置および方法、
並びにプログラム格納媒体に関する。
【0002】
【従来の技術】音声を認識し、認識した音声に対応し
て、所定の処理を実行するパーソナルコンピュータなど
の情報処理装置が普及しつつある。例えば、パーソナル
コンピュータにおいて、音声認識が実行される場合、音
声認識用アプリケーションが起動され、その起動された
ことを示すウィンドウなどがディスプレイ表示される。
そのウィンドウには、使用者が音声として発話した言葉
を認識した結果などが表示される。
【0003】
【発明が解決しようとする課題】上述した音声認識が実
行されている状態において表示されるウィンドは、小型
表示され、タスクバーなどに格納される場合がある。そ
のような小型表示され、かつ、複数の音声認識対応のア
プリケーションが実行されている場合、使用者は、入力
した音声の認識結果が、どのアプリケーションに対して
送られたのかがわかりづらいといった課題があった。
【0004】また、音声認識をさせる場合、使用者は、
予め決められたコマンドを発話する必要がある。そのコ
マンドは、アプリケーションにより異なり、また、その
数も多いため、使用者は覚えきれず、使いこなせないた
め、使い勝手が悪くなるといった課題があった。
【0005】本発明はこのような状況に鑑みてなされた
ものであり、ウィンドウが小型表示されている時には、
音声の認識結果が送られるアプリケーションの近傍にウ
ィンドウを表示し、また、コマンドの一覧を音声により
呼び出せるようにすることにより、使用者にとって使い
勝手の良い音声認識を実現させることを目的とする。
【0006】
【課題を解決するための手段】請求項1に記載の情報処
理装置は、音声を認識する状態が指示されているか否か
を判断する第1の判断手段と、第1の判断手段により音
声を認識する状態が指示されていると判断された場合、
音声認識の結果に対応して所定の処理を実行するプログ
ラムが起動され、かつ、アクティブな状態になっている
か否かを判断する第2の判断手段と、第2の判断手段に
より音声認識の結果に対応して所定の処理を実行するプ
ログラムが起動され、かつ、アクティブな状態になって
いると判断された場合、音声認識が指示されている状態
を示す第1のウィンドウを、プログラムに対応するる第
2のウィンドウの近傍、または、重なる位置に表示され
るように表示を制御する第1の表示制御手段と、第2の
判断手段により音声認識の結果に対応して所定の処理を
実行するプログラムは起動されていない、または、起動
されてはいるがアクティブな状態ではないと判断された
場合、第1のウィンドウが予め定められた所定の位置に
表示されるように表示を制御する第2の表示制御手段と
を含むことを特徴とする。
【0007】音声認識した結果が、所定の処理を実行さ
せるためのコマンドの一覧の表示を指示するものであっ
た場合、コマンドの一覧が表示されるように表示を制御
する第3の表示制御手段をさらに含むようにすることも
できる。
【0008】請求項3に記載の情報処理方法は、音声を
認識する状態が指示されているか否かを判断する第1の
判断ステップと、第1の判断ステップの処理で音声を認
識する状態が指示されていると判断された場合、音声認
識の結果に対応して所定の処理を実行するプログラムが
起動され、かつ、アクティブな状態になっているか否か
を判断する第2の判断ステップと、第2の判断ステップ
の処理で音声認識の結果に対応して所定の処理を実行す
るプログラムが起動され、かつ、アクティブな状態にな
っていると判断された場合、音声認識が指示されている
状態を示す第1のウィンドウを、プログラムに対応する
第2のウィンドウの近傍、または、重なる位置に表示さ
れるように表示を制御する第1の表示制御ステップと、
第2の判断ステップの処理で音声認識の結果に対応して
所定の処理を実行するプログラムは起動されていない、
または、起動されてはいるがアクティブな状態ではない
と判断された場合、第1のウィンドウが予め定められた
所定の位置に表示されるように表示を制御する第2の表
示制御ステップとを含むことを特徴とする。
【0009】請求項4に記載のプログラム格納媒体のプ
ログラムは、音声を認識する状態が指示されているか否
かを判断する第1の判断ステップと、第1の判断ステッ
プの処理で音声を認識する状態が指示されていると判断
された場合、音声認識の結果に対応して所定の処理を実
行するプログラムが起動され、かつ、アクティブな状態
になっているか否かを判断する第2の判断ステップと、
第2の判断ステップの処理で音声認識の結果に対応して
所定の処理を実行するプログラムが起動され、かつ、ア
クティブな状態になっていると判断された場合、音声認
識が指示されている状態を示す第1のウィンドウを、プ
ログラムに対応する第2のウィンドウの近傍、または、
重なる位置に表示されるように表示を制御する第1の表
示制御ステップと、第2の判断ステップの処理で音声認
識の結果に対応して所定の処理を実行するプログラムは
起動されていない、または、起動されてはいるがアクテ
ィブな状態ではないと判断された場合、第1のウィンド
ウが予め定められた所定の位置に表示されるように表示
を制御する第2の表示制御ステップとを含むことを特徴
とする。
【0010】請求項1に記載の情報処理装置、請求項3
に記載の情報処理方法、および請求項4に記載のプログ
ラム格納媒体においては、音声認識の結果に対応して所
定の処理を実行するプログラムが起動され、かつ、アク
ティブな状態になっていると判断された場合、音声認識
が指示されている状態を示す第1のウィンドウが、プロ
グラムに対応する表示される第2のウィンドウの近傍、
または、重なる位置に表示されるように表示が制御さ
れ、音声認識の結果に対応して所定の処理を実行するプ
ログラムは起動されていない、または、起動されてはい
るがアクティブな状態ではないと判断された場合、第1
のウィンドウが予め定められた所定の位置に表示される
ように表示が制御される。
【0011】
【発明の実施の形態】以下、本発明に係る情報処理装置
の一実施の形態を図面を参照して説明する。
【0012】図1乃至図6は、本発明を適用した携帯型
パーソナルコンピュータの構成例を表している。このパ
ーソナルコンピュータ1は、ミニノート型のパーソナル
コンピュータとされ、基本的に、本体2と、本体2に対
して開閉自在とされている表示部3により構成されてい
る。図1は、表示部3を本体2に対して開いた状態を示
す外観斜視図、図2は、図1の平面図、図3は、表示部
3を本体2に対して閉塞した状態を示す左側側面図、図
4は、表示部3を本体2に対して180度開いた状態を
示す右側側面図、図5は、図3の正面図、図6は、図4
の底面図である。
【0013】本体2には、各種の文字や記号などを入力
するとき操作されるキーボード4、マウスカーソルを移
動させるときなどに操作されるスティック式ポインティ
ングデバイス5が、その上面に設けられている。また、
本体2の上面には、音を出力するスピーカ8と、表示部
3に設けられているCCDビデオカメラ23で撮像すると
き操作されるシャッタボタン10がさらに設けられてい
る。
【0014】表示部3の上端部には、ツメ13が設けら
れており、図3に示すように、表示部3を本体2に対し
て閉塞した状態において、ツメ13に対向する位置にお
ける本体2には、ツメ13が嵌合する孔部6が設けられ
ている。本体2の前面には、スライドレバー7が前面に
平行に移動可能に設けられており、スライドレバー7は
孔部6に嵌合したツメ13と係合してロックし、またロ
ック解除することができるようになっている。ロックを
解除することにより、表示部3を本体2に対して回動す
ることができる。ツメ13の隣りには、マイクロホン2
4が取り付けられている。このマイクロホン24は、図
6にも示すように、背面からの音も収音できるようにな
されている。
【0015】本体2の正面にはまた、プログラマブルパ
ワーキー(PPK)9が設けられている。本体2の右側面
には、図4に示すように、排気孔11が設けられてお
り、本体2の前面下部には、図5に示すように、吸気孔
14が設けられている。さらに、排気孔11の右側に
は、PCMCIA(Personal Computer Memory Card Internat
ional Association)カード(PCカード)を挿入する
ためのスロット12が設けられている。
【0016】表示部3の正面には、画像を表示するLCD
(Liquid Crystal Display)21が設けられており、そ
の上端部には、撮像部22が、表示部3に対して回動自
在に設けられている。すなわち、この撮像部22は、LC
D21と同一の方向と、その逆の方向(背面の方向)と
の間の180度の範囲の任意の位置に回動することがで
きるようになされている。撮像部22には、CCDビデオ
カメラ23が取り付けられている。
【0017】表示部3の下側の本体側には、電源ランプ
PL、電池ランプBL、メッセージランプML、その他のLED
よりなるランプが設けられている。なお、図3に示す符
号40は、本体2の左側面に設けられた電源スイッチで
あり、図5に示す符号25は、CCDビデオカメラ23の
フォーカスを調整する調整リングである。さらに、図6
に示す符号26は、本体2内に増設メモリを取り付ける
ための開口部を被覆する蓋であり、符号41は、蓋26
のロックツメを外すためのピンを挿入する小孔である。
【0018】図7は、パーソナルコンピュータ1の内部
の構成を表している。内部バス51には、図7に示すよ
うに、CPU(Central Processing Unit)52、必要に応
じて挿入されるPCカード53、RAM(Random Access M
emory)54、およびグラフィックチップ81が接続さ
れている。この内部バス51は、外部バス55に接続さ
れており、外部バス55には、ハードディスクドライブ
(HDD)56、I/O(入出力)コントローラ57、キ
ーボードコントローラ58、スティック式ポインティン
グデバイスコントローラ59、サウンドチップ60、LC
Dコントローラ83、モデム50などが接続されてい
る。
【0019】CPU52は、各機能を統括するコントロー
ラであり、PCカード53は、オプションの機能を付加
するとき適宜装着される。
【0020】RAM54の中には、起動が完了した時点に
おいて、電子メールプログラム(アプリケーションプロ
グラム)54A、オートパイロットプログラム(アプリ
ケーションプログラム)54B、そしてOS(基本プロ
グラム)54Cが、HDD56から転送され、記憶され
る。
【0021】電子メールプログラム54Aは、電話回線
のような通信回線などからネットワーク経由で通信文を
授受するプログラムである。電子メールプログラム54
Aは、特定機能としての着信メール取得機能を有してい
る。この着信メール取得機能は、メールサーバ93に対
して、そのメールボックス93A内に自分(利用者)宛
のメールが着信しているかどうかを確認して、自分宛の
メールがあれば取得する処理を実行する。
【0022】オートパイロットプログラム54Bは、予
め設定された複数の処理(またはプログラム)などを、
予め設定された順序で順次起動して、処理するプログラ
ムである。
【0023】OS54Cは、Windows98(商標)に代
表される、コンピュータの基本的な動作を制御するもの
である。
【0024】一方、外部バス55側のハードディスクド
ライブ(HDD)56には、電子メールプログラム56
A、オートパイロットプログラム56B、OS56Cが
記憶されている。ハードディスクドライブ56内のOS
56C、オートパイロットプログラム56B、および電
子メールプログラム56Aは、起動(ブートアップ)処
理の過程で、RAM54内に順次転送され、格納される。
【0025】I/Oコントローラ57は、マイクロコン
トローラ61を有し、このマイクロコントローラ61に
は、I/Oインタフェース62が設けられている。この
マイクロコントローラ61は、I/Oインタフェース6
2、CPU63、RAM64、ROM69が相互に接続されて構
成されている。このRAM64は、キー入力ステイタスレ
ジスタ65、LED(発光ダイオード)制御レジスタ6
6、設定時刻レジスタ67、レジスタ68を有してい
る。設定時刻レジスタ67は、ユーザが予め設定した時
刻(起動条件)になると起動シーケンス制御部76の動
作を開始させる際に利用される。レジスタ68は、予め
設定された操作キーの組み合わせ(起動条件)と、起動
すべきアプリケーションプログラムの対応を記憶するも
ので、その記憶された操作キーの組み合わせがユーザに
より入力されると、その記憶されたアプリケーションプ
ログラム(例えば電子メール)が起動されることにな
る。
【0026】キー入力ステイタスレジスタ65は、ワン
タッチ操作用のプログラマブルパワーキー(PPK)9が
押されると、操作キーフラグが格納されるようになって
いる。LED制御レジスタ66は、レジスタ68に記憶さ
れたアプリケーションプログラム(電子メール)の立ち
上げ状態を表示するメッセージランプMLの点灯を制御す
るものである。設定時刻レジスタ67は、所定の時刻を
任意に設定することができるものである。
【0027】なお、このマイクロコントローラ61に
は、バックアップ用のバッテリ74が接続されており、
各レジスタ65,66,67の値は、本体2の電源がオ
フとされている状態においても保持されるようになって
いる。
【0028】マイクロコントローラ61内のROM69の
中には、ウェイクアッププログラム70、キー入力監視
プログラム71、LED制御プログラム72が予め格納さ
れている。このROM69は、例えばEEPROM(electricall
y erasable and programmable read only memory)で構
成されている。このEEPROMはフラッシュメモリとも呼ば
れている。さらにマイクロコントローラ61には、常時
現在時刻をカウントするRTC(Real-Time Clock)75が
接続されている。
【0029】ROM69の中のウェイクアッププログラム
70は、RTC75から供給される現在時刻データに基づ
いて、設定時刻レジスタ67に予め設定された時刻にな
ったかどうかをチェックして、設定された時刻になる
と、所定の処理(またはプログラム)などの起動をする
プログラムである。キー入力監視プログラム71は、PP
K9が利用者により押されたかどうかを常時監視するプ
ログラムである。LED制御プログラム72は、メッセー
ジランプMLの点灯を制御するプログラムである。
【0030】ROM69には、さらにBIOS(Basic Input O
utput System)73が書き込まれている。このBIOS73
は、電源投入時にOS56Cを起動したり、起動した
後、各種アプリケーションソフトウェアと周辺機器(デ
ィスプレイ、キーボード、ハードディスクドライブな
ど)の間でデータを授受する等の機能を有する。
【0031】外部バス55に接続されているキーボード
コントローラ58は、キーボード4からの入力をコント
ロールする。スティック式ポインティングデバイスコン
トローラ59は、スティック式ポインティングデバイス
5の入力を制御する。
【0032】サウンドチップ60は、マイクロホン24
からの入力を取り込み、あるいは内蔵スピーカ8に対し
て音声信号を供給する。
【0033】モデム50は、公衆電話回線90、インタ
ーネットサービスプロバイダ91を介して、インターネ
ットなどの通信ネットワーク92やメールサーバ93な
どに接続することができる。
【0034】内部バス51に接続されているグラフィッ
クチップ81には、CCDビデオカメラ23で取り込んだ
画像データが、処理部82で処理された後、ZV(Zo
omed Video)ポートを介して入力されるよう
になされている。グラフィックチップ81は、処理部8
2を介してCCDビデオカメラ23より入力されたビデオ
データを、内蔵するVRAM81に記憶し、適宜、これを読
み出して、LCDコントローラ83に出力する。LCDコント
ローラ83は、グラフィックチップ81より供給された
画像データをLCD21に出力し、表示させる。バックラ
イト84は、LCD21を後方から照明するようになされ
ている。
【0035】電源スイッチ40は、電源をオンまたはオ
フするとき操作される。半押しスイッチ85は、シャッ
タボタン10が半押し状態にされたときオンされ、全押
しスイッチ86は、シャッタボタン10が全押し状態に
されたときオンされる。反転スイッチ87は、撮像部2
2が180度回転されたとき(CCDビデオカメラ23がL
CD21の反対側を撮像する方向に回転されたとき)、オ
ンされるようになされている。
【0036】ドライブ88は、外部バス55に接続され
ている。ドライブ88は、磁気ディスク351(フロッ
ピディスクを含む)、光ディスク352(CD-ROM(Compa
ct Disc-Read Only Memory)、DVD(Digital Versatile D
isc)を含む)、光磁気ディスク353(MD(Mini-Dis
c)を含む)、または半導体メモリ354などが装着さ
れ、装着された磁気ディスク351、光ディスク35
2、光磁気ディスク353、または半導体メモリ354
などに記録されているプログラムまたはデータを、外部
バス55または内部バス51を介して、HDD56またはR
AM54に供給する。
【0037】ドライブ88は、外部バス55または内部
バス51を介して、モデム50、HDD56、またはRAM5
4から供給されたプログラムまたはデータなどを、装着
された磁気ディスク351、光ディスク352、光磁気
ディスク353、または半導体メモリ354などに記録
させる。
【0038】図8は、音声認識に係るプログラムをパー
ソナルコンピュータ1が起動させたときの、所定のプロ
グラムによる機能ブロックを示す図である。音声認識エ
ンジン101は、読み仮名辞書データベース111に予
め記憶されている漢字に対する読み、またはエンジン用
認識単語・文法データベース112に予め記憶されてい
る認識単語、若しくは文法を基に、マイクロホン24か
ら入力された使用者の音声に対応するデータを入力し、
使用者が発話した言葉に対応するテキストなどの所定の
方式のデータを生成して、音声コマンダ102に供給す
る。
【0039】音声認識エンジン101は、音声コマンダ
102から認識単語、若しくは文法などのデータを受信
して、読み仮名辞書データベース111またはエンジン
用認識単語・文法データベース112に記憶させる。
【0040】音声コマンダ102は、使用者が発話した
所定の言葉に対応する単語(テキストなど)などのデー
タが音声認識エンジン101から供給されたとき、静止
画撮影プログラム103、静止画閲覧プログラム10
4、若しくは電子ペットプログラム105を起動させ、
または静止画撮影プログラム103、静止画閲覧プログ
ラム104、若しくは電子ペットプログラム105に所
定コマンド(使用者が発話した言葉に対応する)を送信
する。
【0041】音声コマンダ102は、使用者が発話した
他の所定の言葉に対応する単語(テキストなど)などの
データが音声認識エンジン101から供給されたとき、
ランチャ設定データベース113に記憶されている起動
に関する設定に基づき、電子メールプログラム54A、
ワードプロセッサプログラム106、または表計算プロ
グラム107を起動させ、電子メールプログラム54A
にメールアドレスなどの所定のデータを供給する。
【0042】また、音声コマンダ102は、グラフィカ
ルなユーザインターフェースを有し、使用者により、グ
ラフィカルなユーザインターフェースを介して種々の設
定がなされ、使用者により設定された内容を分類して、
アプリケーションプログラム(電子メールプログラム5
4A、ワードプロセッサプログラム106、または表計
算プログラム107)の起動に関する設定をランチャ設
定データベース113に、漢字の読み、または静止画撮
影プログラム103、静止画閲覧プログラム104、若
しくは電子ペットプログラム105のコマンドなどに関
する設定を辞書設定データベース114に、音声認識す
る単語または文法に関する設定を認識単語・文法データ
ベース115にそれぞれ記憶させる。
【0043】音声コマンダ102は、所定のタイミング
で、例えば、音声認識エンジン101に音声を認識させ
るとき、認識単語・文法データベース115に記憶して
いる認識単語のデータおよび文法のデータを、音声認識
エンジン101に送信する。
【0044】音声認識エンジン101は、OS54Cを
起動するとき入力される使用者を判別するデータに基づ
いて、その使用者用の読み仮名辞書データベース111
およびエンジン用認識単語・文法データベース112を
利用する。音声コマンダ102は、OS54Cを起動す
るとき入力される使用者を判別するデータに基づいて、
その使用者用のランチャ設定データベース113、辞書
設定データベース114、および認識単語・文法データ
ベース115を利用する。
【0045】仮名辞書データベース111、エンジン用
認識単語・文法データベース112、ランチャ設定デー
タベース113、辞書設定データベース114、および
認識単語・文法データベース115は、パーソナルコン
ピュータ1の使用者毎に生成され、HDD56に記録され
る。
【0046】静止画撮影プログラム103は、CCDビデ
オカメラ23から入力された画像を、シャッタボタン1
0などの操作に対応した信号に基づき、静止画像のデー
タを生成して、所定のファイルとしてHDD56に記録す
る。
【0047】静止画閲覧プログラム104は、静止画撮
影プログラム103が記録させた静止画像のファイルを
選択し、または使用者に選択させ、選択された静止画像
をLCD21に表示させる。電子ペットプログラム105
は、LCD21に仮想的なペットを表示させ、使用者の操
作に対応して、仮想的なペットに指示などを与える。
【0048】ワードプロセッサプログラム106は、文
字または図形などから成る文書を編集するためのプログ
ラムである。表計算プログラム107は、所定の形式の
表に配置された数値に所定の演算を実行する、または配
置された数値に対応するグラフを描写するなどの機能を
有する。
【0049】図9は、音声コマンダ102のより詳細な
機能を説明する図である。UI(ユーザインターフェー
ス)処理部123は、アプリケーション通信部121、
エンジン通信部122、音声ランチャ制御部124、ユ
ーザ辞書制御部125、または認識テスト処理部126
から所定のデータを入力するとともに、キーボード4ま
たはスティック式ポインティングデバイス5などから所
定の信号を入力して、マイクロフォン24を介して入力
された音声の大きさまたは音声認識の結果などを、所定
のウィンドウに表示させる。UI処理部123は、所定
のプログラムを起動させるとき、アプリケーション通信
部121、または音声ランチャ制御部124から入力さ
れたデータを基に、所定の画像をLCD21に表示させ
る。
【0050】UI処理部123は、キーボード4または
ステッィク式ポインティングデバイス5などの操作に対
応した信号を基に、UI処理部123自身の状態を変化
させ、所定のデータをアプリケーション通信部121、
エンジン通信部122、音声ランチャ制御部124、ユ
ーザ辞書制御部125、または認識テスト処理部126
に供給する。
【0051】また、UI処理部123は、静止画撮影プ
ログラム103、静止画閲覧プログラム104、および
電子ペットプログラム105の状態、並びにエンジン通
信部122を介して音声認識エンジン101から供給さ
れた、使用者が発話した所定の言葉に対応する所定のテ
キストなどのデータを基に、アプリケーション通信部1
21または音声ランチャ制御部124に、コマンドを送
信または所定のプログラムの起動をさせるか否かを決定
し、アプリケーション通信部121または音声ランチャ
制御部124にコマンドを送信させ、または所定のプロ
グラムの起動させる。
【0052】アプリケーション通信部121は、静止画
撮影プログラム103、静止画閲覧プログラム104、
または電子ペットプログラム105を起動させ、起動し
ている静止画撮影プログラム103、静止画閲覧プログ
ラム104、または電子ペットプログラム105と通信
を行い、静止画撮影プログラム103、静止画閲覧プロ
グラム104、または電子ペットプログラム105から
それぞれの状態を示すデータを受信する。
【0053】アプリケーション通信部121は、静止画
撮影プログラム103、静止画閲覧プログラム104、
および電子ペットプログラム105の状態を示すデータ
などをエンジン通信部122またはUI処理部123に
供給するとともに、エンジン通信部122またはUI処
理部123から、使用者が発話した所定の言葉に対応す
る所定のテキストなどのデータ、または使用者のキーボ
ード4などへの操作に対応するデータなどを受信する。
【0054】また、アプリケーション通信部121は、
静止画撮影プログラム103、静止画閲覧プログラム1
04、および電子ペットプログラム105の状態、並び
にエンジン通信部122を介して音声認識エンジン10
1から供給された、使用者が発話した所定の言葉に対応
する所定のテキストなどのデータを基に、静止画撮影プ
ログラム103、静止画閲覧プログラム104、若しく
は電子ペットプログラム105のいずれかを起動させ、
または静止画撮影プログラム103、静止画閲覧プログ
ラム104、若しくは電子ペットプログラム105のい
ずれかに所定のコマンドを供給する。
【0055】静止画撮影プログラム103、静止画閲覧
プログラム104、および電子ペットプログラム105
のいずれもが、フォーカスがあてられていないとき(い
ずれもアクティブでないとき)、音声コマンダ102
は、静止画撮影プログラム103、静止画閲覧プログラ
ム104、または電子ペットプログラム105のいずれ
かを対象としたコマンドを実行できない。
【0056】静止画撮影プログラム103、静止画閲覧
プログラム104、および電子ペットプログラム105
のいずれかが、フォーカスがあてられているとき(いず
れかがアクティブであるとき)、音声コマンダ102
は、アクティブである、静止画撮影プログラム103、
静止画閲覧プログラム104、または電子ペットプログ
ラム105のいずれかを対象としたコマンドを実行する
ことができる。
【0057】このような静止画撮影プログラム103、
静止画閲覧プログラム104、または電子ペットプログ
ラム105のいずれかの特定のプログラムを対象とした
コマンドをローカルなコマンドと称する。
【0058】なお、音声コマンダ102がローカルなコ
マンドを送信するプログラムを特定する方法は、フォー
カスに限らず、他の状態またはデータを参照するように
してもよい。
【0059】エンジン通信部122は、所定の方式を基
づいて、認識単語・文法データベース115から認識単
語のデータおよび文法のデータを読み出して、そのデー
タを音声認識エンジン101に送信するとともに、音声
認識エンジン101から供給された使用者が発話した所
定の言葉に対応する所定のテキストなどのデータを受信
する。
【0060】エンジン通信部122は、例えば、図10
に例を示すMicrosoft Speech API(商標)(以下、SAPI
と称する)に規定された方式で、音声認識エンジン10
1に認識単語・文法データベース115に記憶されてい
る認識単語のデータおよび文法のデータを送信する。図
10に示すデータの例には、音声認識の対象が<Global>
および<SVCommand>から構成され、<Global>が更に(Chan
geWin),(VoiceCommand)から構成され、<SVCommand>が
「ヘルプ」、「前へ」などのコマンドの他、<SendMail>
で表されるメールのコマンドも含むことが記述されてい
る。また、図10に示すデータの例には、「ヘルプ」と
いうコマンドのコード番号が102であり、「パパ」と
いう読みを有する単語に「[email protected]
という文字列が関連していることなどが示されている。
【0061】音声認識エンジン101は、エンジン通信
部122から受信したデータを、所定の方式のデータに
変換して、読み仮名辞書データベース111またはエン
ジン用認識単語・文法データベース112に記憶させ、
読み仮名辞書データベース111またはエンジン用認識
単語・文法データベース112に記憶しているデータに
基づき、音声認識の処理を実行する。
【0062】音声認識エンジン101は、エンジン通信
部122に、使用者が発話した所定の言葉に対応する、
コード番号(例えば、102など)、認識した単語また
は文(例えば、”パパにメール”など)、および認識し
た単語に関連する文字列(例えば、”[email protected]
ny.co.jp”)のデータを送信する。
【0063】例えば、使用者がマイクロフォン24に向
かって「パパにメール」という音声を入力して、音声認
識エンジン101が正しく音声を認識したとき、音声認
識エンジン101は、7fffffff(16進数)、”パパに
メール”、および”[email protected]”をエン
ジン通信部122に送信する。
【0064】エンジン通信部122は、音声認識エンジ
ン101から受信したデータを基に、受信したデータを
アプリケーション通信部121、UI処理部123、音
声ランチャ制御部124、ユーザ辞書制御部125、ま
たは認識テスト処理部126のいずれに送信するかを判
断し、その判断に基づいて、音声認識エンジン101か
ら受信したデータを所定の方式に変換して、選択された
アプリケーション通信部121、UI処理部123、音
声ランチャ制御部124、ユーザ辞書制御部125、ま
たは認識テスト処理部126のいずれかに変換したデー
タを供給する。
【0065】音声ランチャ制御部124は、グラフィカ
ルなユーザインターフェースを表示させて使用者により
入力された、アプリケーションプログラム(電子メール
プログラム54A、ワードプロセッサプログラム10
6、または表計算プログラム107)の起動に関する設
定をランチャ設定データベース113に保存させるとと
もに、その設定に基づき、認識単語・文法データベース
115に記憶されている音声認識する単語または文法に
関する設定を更新させる。
【0066】音声ランチャ制御部124は、エンジン通
信部122からランチャに関するデータを受信したと
き、ランチャ設定データベース113に記憶されている
起動に関する設定に基づき、電子メールプログラム54
A、ワードプロセッサプログラム106、または表計算
プログラム107のいずれかを起動させ、電子メールプ
ログラム54Aにメールアドレスなどを供給する。
【0067】音声コマンダ102は、フォーカスの状態
にかかわらず(いずれのプログラムがアクティブであっ
ても)、電子メールプログラム54A、ワードプロセッ
サプログラム106、または表計算プログラム107の
いずれかを起動させるコマンドを実行することができ
る。
【0068】このような、フォーカスの状態などにかか
わらず、常に実行することができる、例えば、電子メー
ルプログラム54A、ワードプロセッサプログラム10
6、または表計算プログラム107のいずれかを起動さ
せるコマンドをグローバルなコマンドと称する。
【0069】ユーザ辞書制御部125は、グラフィカル
なユーザインターフェースを表示させ使用者により入力
された、認識する音声に関する設定を辞書設定データベ
ース114に記憶させるとともに、その設定に基づき、
認識単語・文法データベース115に記憶されている音
声認識する単語または文法に関する設定を更新させる。
【0070】認識テスト処理部126は、使用者により
テストを実行する旨がユーザ辞書制御部125に入力さ
れたとき、グラフィカルなユーザインターフェースを表
示させて、辞書設定データベース114に記憶され、選
択されている所定の1の単語と、エンジン通信部122
を介して、音声認識エンジン101から供給された、音
声を認識した結果を示す単語とが一致するか否かを判定
し、その判定の結果を表示する。
【0071】また、認識テスト処理部126は、使用者
によりテストを実行する旨がユーザ辞書制御部125に
入力されたとき、グラフィカルなユーザインターフェー
スを表示させて、エンジン通信部122を介して、音声
認識エンジン101から供給された、音声を認識した結
果を示す単語が、辞書設定データベース114に記憶さ
れ、選択されている所定の1以上の単語に含まれるか否
かを判定し、その判定の結果を表示する。
【0072】音声コマンダ102が起動されると、UI
処理部123は、LCD21に起動中を示す画像を表示さ
せるとともに、図11に示す音声コマンダ102のウィ
ンドウを表示させ、音声認識エンジン101の起動を待
つ状態1に遷移する。
【0073】音声コマンダウィンドウ161は、レベル
ゲージ162、認識結果表示部163、ランチャ設定ボ
タン164、辞書管理ボタン165、ヘルプボタン16
6、最小化ボタン167、閉じるボタン168、認識状
態表示部169、および音声入力モード切り換えボタン
170を有する。
【0074】レベルゲージ162は、マイクロフォン2
4を介して入力された使用者の音声のレベル(マイクロ
フォン24が出力する信号の振幅)を表示する。認識結
果表示部163は、エンジン通信部122から供給され
た認識された音声に対応する単語または文を表示する。
ランチャ設定ボタン164は、電子メールプログラム5
4A、ワードプロセッサプログラム106、または表計
算プログラム107の起動に関する設定をするとき、操
作される。
【0075】辞書管理ボタン165は、認識する音声に
関する設定を辞書設定データベース114に記憶させる
とき、操作される。ヘルプボタン166は、オンライン
ヘルプをLCD21に表示させるとき、操作される。最小
化ボタン167は、音声コマンダウィンドウ161をLC
D21から消去し、例えば、タスクトレイ上に所定のア
イコンを表示させるとき、操作される。閉じるボタン1
68は、音声コマンダ102を終了させるとき、操作さ
れる。
【0076】認識状態表示部169は、音声認識エンジ
ン101の状態またはローカルコマンドが使用できるか
否か(所定のプログラムがアクティブであるか否か)な
どを表示する。音声入力モード切り換えボタン170
は、常時認識モードと通常の認識モードとを切り換える
ときに、操作される。
【0077】音声認識エンジン101が起動された場
合、上述したような音声コマンダウィンドウ161がLC
D21に表示される。このような状態で、閉じるボタン
168がクリックされると、UI処理部123は、音声
コマンダ102を終了させる。また、使用者が音声認識
に割り当てているキー(例えば、キーボード4のコント
ロールキーなど。以下、認識キーと称する)を押圧した
とき、UI処理部123は、音声入力可能な状態に遷移
する。
【0078】音声入力可能な状態に遷移するとき、UI
処理部123は、アプリケーション通信部121から静
止画撮影プログラム103、静止画閲覧プログラム10
4、および電子ペットプログラム105の内、アクティ
ブであるプログラムを示すデータを受信し、アクティブ
であるプログラムの名称を音声コマンダウィンドウ16
1の認識状態表示部169に表示させる。静止画撮影プ
ログラム103、静止画閲覧プログラム104、または
電子ペットプログラム105のいずれもアクティブでな
いとき、UI処理部123は、音声コマンダウィンドウ
161の認識状態表示部169にその旨(例えば、”Gl
obal Command”など)を表示させる。
【0079】音声入力可能な状態において、使用者がマ
イクロフォン24から入力させた音声に対応する信号が
音声認識エンジン101に供給され、音声認識エンジン
101に供給された音声に対応する信号のレベルに対応
するデータが、エンジン通信部122を介して、UI処
理部123に供給される。また、UI処理部123は、
音声に対応する信号のレベルに対応するデータに基づ
き、音声コマンダウィンドウ161のレベルゲージ16
2の表示を更新する。
【0080】さらに、音声認識エンジン101が音声を
認識したとき、UI処理部123は、音声認識エンジン
101から認識した単語または文などのデータを受信
し、音声コマンダウィンドウ161の認識結果表示部1
63に認識した単語または文を表示させる。
【0081】音声認識可能な状態において、使用者が認
識キーを離したとき、UI処理部123は、アプリケー
ション通信部121または音声ランチャ制御部124
に、音声認識エンジン101から供給された、コード番
号、認識した単語または文、および認識した単語に関連
する文字列のデータに対応する、所定の動作(例えば、
電子メールプログラム54Aの起動など)を要求する。
【0082】このとき、アプリケーション通信部121
は、UI処理部123からの要求に対応して、静止画撮
影プログラム103、静止画閲覧プログラム104、若
しくは電子ペットプログラム105のいずれかを起動さ
せ、または静止画撮影プログラム103、静止画閲覧プ
ログラム104、若しくは電子ペットプログラム105
のいずれかに所定のコマンドを送信する。
【0083】このとき、音声ランチャ制御部124は、
UI処理部123からの要求に対応して、電子メールプ
ログラム54A、ワードプロセッサプログラム106、
若しくは表計算プログラム107のいずれかを起動さ
せ、または電子メールプログラム54Aに所定のデータ
(例えば、メールアドレスなど)を供給する。
【0084】アプリケーション通信部121または音声
ランチャ制御部124が所定のプログラムに対して、所
定の動作を完了させたとき、アプリケーション通信部1
21または音声ランチャ制御部124はUI処理部12
3にその旨を通知し、UI処理部123は、動作の対象
となる所定のプログラムに応じて、動作の対象となる所
定のプログラムを使用者に認識させる画像をLCD21に
表示させる。
【0085】LCD21に動作の対象となる所定のプログ
ラム認識させる画像が表示されるので、使用者は、音声
の認識の結果、および音声コマンダ102の動作を知る
ことができる。
【0086】音声入力モード切り換えボタン170がク
リックされたとき、UI処理部123は、常時認識モー
ドである状態に遷移する。常時認識モードに遷移すると
き、UI処理部123は、アプリケーション通信部12
1から静止画撮影プログラム103、静止画閲覧プログ
ラム104、および電子ペットプログラム105の内、
アクティブであるプログラムを示すデータを受信し、ア
クティブであるプログラムの名称を認識状態表示部16
9に表示させる。静止画撮影プログラム103、静止画
閲覧プログラム104、または電子ペットプログラム1
05のいずれもアクティブでないとき、UI処理部12
3は、音声コマンダウィンドウ161の認識状態表示部
169にその旨(例えば、”Global Command”など)を
表示させる。
【0087】常時認識モードにおいては、音声コマンダ
2は、認識キーに対する操作に係わらず、音声認識エン
ジンが所定の音声を認識したとき、静止画撮影プログラ
ム103、静止画閲覧プログラム104、若しくは電子
ペットプログラム105のいずれかを起動させ、若しく
は静止画撮影プログラム103、静止画閲覧プログラム
104、若しくは電子ペットプログラム105のいずれ
かに所定のコマンドを送信し、または電子メールプログ
ラム54A、ワードプロセッサプログラム106、若し
くは表計算プログラム107のいずれかを起動させ、若
しくは電子メールプログラム54Aに所定のデータを供
給する。
【0088】常時認識モードにおいて、音声入力モード
切り換えボタン170がクリックされたとき、UI処理
部123は、通常の認識モードに遷移する。
【0089】通常認識モードにおいて、音声コマンダウ
ィンドウ161の辞書管理ボタン165がクリックされ
ると、UI処理部123は、辞書を設定する状態に遷移
し、ユーザ辞書制御部125に辞書の設定の処理を要求
する。辞書を設定する状態において、ユーザ辞書制御部
125は、辞書設定用のダイアログをLCD21に表示さ
せ、辞書設定用のダイアログへの操作に基づき、辞書設
定データベース114および認識単語・文法データベー
ス115に記憶されている設定を更新する。
【0090】辞書を設定する状態において、辞書設定用
のダイアログに配置されているテストボタンがクリック
されると、UI処理部123は、音声認識テストを実行
する状態に遷移し、認識テスト処理部126に音声認識
テストの処理を要求する。認識テスト処理部126は、
音声認識テストのダイアログをLCD21に表示させ、エ
ンジン通信部122を介して、音声認識エンジン101
から供給された、音声を認識した単語が、辞書設定デー
タベース114に登録されている単語と一致するか否か
を判定する音声認識のテストを実行し、その結果を表示
する。
【0091】または、認識テスト処理部126は、音声
認識テストのダイアログをLCD21に表示させ、エンジ
ン通信部122を介して、音声認識エンジン101から
供給された認識した単語が、辞書設定データベース11
4に登録されている単語に含まれているか否かを判定す
る音声認識のテストを実行し、その結果を表示する。
【0092】音声認識テストを実行する状態において、
音声認識テストのダイアログに配置されているテストボ
タンがクリックされると、UI処理部123は、辞書を
設定する状態に遷移する。辞書を設定する状態におい
て、辞書設定用のダイアログに配置されている閉じるボ
タンがクリックされると、UI処理部123は、通常認
識モードに遷移する。
【0093】通常認識モードにおいて、音声コマンダウ
ィンドウ161のランチャ設定ボタン164がクリック
されると、UI処理部123は、音声ランチャ制御部1
24の電子メールプログラム54A、ワードプロセッサ
プログラム106、または表計算プログラム107を起
動する設定を行う状態に遷移し、音声ランチャ制御部1
24にプログラムの起動の設定の処理を要求する。
【0094】起動の設定を行う状態において、音声ラン
チャ制御部124は、ランチャ設定用のダイアログをLC
D21に表示させ、ランチャ設定用のダイアログへの操
作に基づき、ランチャ設定データベース113に記憶さ
れている設定を更新する。
【0095】次に、パーソナルコンピュータ1のLCD2
1に表示する画面について説明する。図12は、音声コ
マンダ102、音声認識エンジン101、および電子ペ
ットプログラム105が起動しているとき、LCD21に
表示される画面を示す図である。
【0096】LCD21の画面の所定の位置に、電子メー
ルプログラム54Aに対応するアイコン181、ワード
プロセッサプログラム106に対応するアイコン18
2、表計算プログラム107に対応するアイコン18
3、音声コマンダウィンドウ161、および電子ペット
プログラム105が表示させる電子ペットウィンドウ1
91が配置される。
【0097】スティック式ポインティングデバイス5な
どを操作してアイコン181を選択して、起動コマンド
を実行する(図示せぬメニューなどから選択するなどの
操作をする)と、電子メールプログラム54Aが起動さ
れる。アイコン182を選択して、起動コマンドを実行
すると、ワードプロセッサプログラム106が起動され
る。アイコン183を選択して、起動コマンドを実行す
ると、表計算プログラム107が起動される。
【0098】電子ペットウィンドウ191は、仮想空間
内で生息している電子ペットが表示される表示部200
と、複数のボタン201乃至206から構成されてい
る。閉じるボタン201は、電子ペットプログラム10
5を終了させたいときに操作され、拡大ボタン202
は、電子ペットウィンドウ191の表示を拡大させたい
ときに操作され、最小化ボタン203は、電子ペットウ
ィンドウ191をLCD21上から消去し、タスクバーに
収納させたい時に操作される。
【0099】また、音階指示ボタン204は、図示しな
いロボットに対して指示を出す場合に操作され、辞書管
理ボタン205は、辞書に仮想ペットの新たな名前など
を登録させたい時などに操作され、ヘルプボタン206
は、わからないことを調べたい時に操作される。
【0100】図12に示したような状態で、使用者が、
音声コマンダウィンドウ161の最小化ボタン167を
操作すると、その操作結果として、タスクトレイ211
上に、音声コマンダ102に対応するアイコンが、図1
3に示しように表示される。図13において、タスクト
レイ211に表示されている複数のアイコンの内、アイ
コン221が、音声コマンダ102に対応するアイコン
である。
【0101】このアイコン211上に、使用者がカーソ
ル231を移動させ、クリックなどの所定の操作を行う
と、図14に示すように、メニューが表示される。メニ
ューには、音声コマンダウィンドウ161を通常表示さ
せたいとき(図12に示したような表示に戻したいと
き)に操作される”通常表示”、通常の認識モードと常
時認識モードとを切り換える時に操作される”入力モー
ド切換”、および音声コマンダ102を終了させる時に
操作される”終了”が表示されている。
【0102】図13に示したような表示状態のとき、す
なわち、音声コマンダウィンドウ161が、最小化され
ており、タスクトレイ211にアイコン221が表示さ
れている状態のとき、ユーザが音声認識を行わせるため
に、認識キーを操作すると、図15に示したように、小
型表示ウィンドウ241が表示される。この小型表示ウ
ィンドウ241は、認識キーが操作された時点で、起動
されている(アクティブにされている)音声認識対応の
アプリケーションの近傍に表示される。、例えば、図1
5の場合、音声認識対応のアプリケーションとして電子
ペットプログラム105が起動されており、その電子ペ
ットプログラム105の電子ペットウィンドウ191の
左上に重ならないように表示されている。
【0103】電子ペットウィンドウ191自体が、LCD
21の端にあるために見切れてしまっている場合があ
る。そのような場合は、図16に示すように、小型表示
ウィンドウ241は、電子ペットウィンドウ191に重
ねられて表示される。なお、アプリケーションに対する
小型表示ウィンドウ241の位置は、右上、右下、左下
など、どこでもよく、左上に限定されるものではない。
【0104】音声認識に対応しているアプリケーション
が起動され、かつ、そのアプリケーションがアクティブ
な状態になっている場合は、上述したように、認識キー
が操作されると、そのアプリケーションの近傍に、小型
表示ウィンドウ241が表示されるが、音声認識に対応
しているアプリケーションが起動されていないとき、ま
たは、起動されているが、アクティブな状態になってい
ないときは、例えば、図17に示すように、LCD21の
画面の中央下側に、小型表示ウィンドウ241は表示さ
れる。勿論、その表示位置は、中央下側に限られるもの
ではない。
【0105】小型表示ウィンドウ241の左側の丸い部
分は、レベルゲージ162(図11)と同様の表示を行
う部分であり、右側の細長い部分は、認識状態表示部1
69と同様の表示(音声認識された結果を表示)する部
分である。
【0106】図18は、音声認識に対応している2つの
アプリケーションが起動されている状態を示している。
図18には、音声認識に対応しているアプリケーション
として電子ペットプログラム105と静止画閲覧プログ
ラム104が起動されている状態を示している。このよ
うな状態において、静止画閲覧プログラム104がアク
ティブな状態であるときに、ユーザが認識キーを操作す
ると、そのアクティブな状態となっている静止画閲覧ウ
ィンドウ251の左上に、小型表示ウィンドウ241が
表示される。
【0107】このように、音声認識された結果を、どの
アプリケーションに送るか、換言すれば、どのアプリケ
ーションに対して音声によるコマンドを出すのかを、ア
プリケーションに対応するウィンドウの近傍に、小型表
示ウィンドウ241を表示させることにより、使用者に
認識させることが可能となる。
【0108】また、例えば、使用者が電子ペットプログ
ラム105に対して音声によるコマンドを出そうと思
い、認識キーを操作したにも関わらず、小型表示ウィン
ドウ241が、静止画閲覧ウィンドウ251の近傍に表
示されたり、画面中央下側に表示されたときには、使用
者は、電子ペットプログラム105がアクティブな状態
になっていないと判断することができ、その判断に基づ
いて、電子ペットプログラム105をアクティブな状態
にし、再度、認識キーを操作して電子ペットプログラム
105に対してコマンドを出すことができる。すなわ
ち、誤ったアプリケーションに対してコマンドを出して
しまうようなことを防ぐことが可能となる。
【0109】さらに、このような小型表示ウィンドウ2
41にすることにより、音声コマンダウィンドウ161
を通常表示させる場合に比べ、その描画に係る時間(処
理能力)を軽減させることが可能となる。
【0110】ところで、音声認識させるためには、予め
設定されているコマンドの形式に従って発話する必要が
ある。使用者は、音声認識により処理を実行させている
とき、所望な処理を実行させるためには、どのようなコ
マンド形式に従って発話すれば良いかわからない時があ
る。そのような場合、使用者は、”コマンド一覧”と発
話することにより、コマンドに関するヘルプ画面をLCD
21上に表示させることができる。
【0111】図19は、使用者が”コマンド一覧”と発
話した結果。”コマンド一覧”と認識され、音声コマン
ダウィンドウ161の認識結果表示部163に表示され
た状態を示している。もちろん、音声コマンドウィンド
ウ161が、最小化表示が指示されていることにより、
小型表示ウィンドウ241が表示される場合、その小型
表示ウィンドウ241に”コマンド一覧”と表示され
る。このように、使用者が発話した”コマンド一覧”と
いう言葉が認識されることにより、図20に示したよう
に、音声コマンドに関するヘルプ画面がLCD21上に表
示される。
【0112】このように、音声認識に関するコマンドの
操作に困ったときには、音声により、ヘルプ画面を表示
させることができるようにすることにより、使用者は、
マウスなどを操作してヘルプ画面を表示させる操作を行
わなくて良く、一貫して音声にて操作を行うことがで
き、使い勝手が向上する。
【0113】音声認識は、使用回数が多いほど、学習し
ていき、認識率が高くなる。そこで、使用者は、音声コ
マンダ102を何回使用したかという情報を知りたいと
きがある。そのような場合、例えば、コマンドとして”
何回使ったかな”という言葉を発話することにより、音
声コマンダ102を使用した回数を知ることができる。
具体的には、使用者が”何回使ったかな”と発話する
と、その発話が認識された結果が、図21(A)に示す
ように、音声コマンダウィンドウ161の認識結果表示
部163に表示される。そして、図21(B)に示すよ
うに、認識状態表示部169に、使用回数が表示される
(図21(B)の表示例の場合、8回である)。この表
示は所定時間表示された後に、消される。
【0114】次に、音声認識エンジン101および音声
コマンダ102を実行するCPU52の音声によるコマン
ドの送信の処理を図22のフローチャートを参照して説
明する。ここでは、音声コマンダウィンドウ161が最
小化表示が指示されており、音声認識に対応しているア
プリケーションが1以上起動されていることを前提とし
て説明する。
【0115】ステップS1において、音声コマンダ10
2は、常時入力モードが選択されているか否かを判定
し、常時入力モードが選択されていないと判定された場
合、ステップS2に進み、認識キーが押圧されているか
否かを判定する。ステップS2において、認識キーが押
圧されていないと判定された場合、ステップS2に戻
り、音声コマンダ102は、認識キーが押圧されるま
で、認識キーの押圧の判定の処理を繰り返す。
【0116】ステップS2において、認識キーが押圧さ
れたと判定された場合、ステップS3に進み、小型表示
ウィンドウ241を、アクティブな状態になっている音
声認識に対応しているアプリケーションの近傍、ここで
は、左上に表示する(図15に示したような状態)。そ
して、ステップS4において、音声コマンダ102は、
音声認識エンジン101に音声認識の処理を実行させ
る。ステップS5において、音声コマンダ102は、音
声認識エンジン101から音声認識の処理の結果を受信
する。
【0117】ステップS6において、音声コマンダ10
2は、音声認識エンジン101から受信した音声認識の
処理の結果を、小型表示ウィンドウ241に表示させ
る。ステップS7において、音声コマンダ102は、認
識キーが離されたか否かを判定し、認識キーが離された
と判定された場合、ステップS8に進み、表示されてい
る小型表示ウィンドウ241をLCD21上から消し、ス
テップS9において、コマンドの送信を実行して、処理
は終了する。
【0118】ステップS7において、認識キーが離され
ていないと判定された場合、ステップS10に進み、音
声コマンダ102は、解除キー(例えば、シフトキー)
が押圧されたか否かを判定する。ステップS10におい
て、解除キーが押圧されたと判定された場合、ステップ
S11に進み、音声コマンダ102は、音声認識の結果
をクリアして、ステップS4に戻り、音声認識の処理を
繰り返す。ステップS10において、解除キーが押圧さ
れていないと判定された場合、ステップS11はスキッ
プされ、ステップS4に戻り、音声認識の処理を繰り返
す。
【0119】一方、ステップS1において、常時入力モ
ードが選択されていると判定された場合、ステップS1
2に進み、小型表示ウィンドウ241を、アクティブな
状態になっている音声認識に対応しているアプリケーシ
ョンの左上に表示される。そして、ステップS13にお
いて、音声コマンダ102は、音声認識エンジン101
に音声認識の処理を実行させる。ステップS14におい
て、音声コマンダ102は、音声認識エンジン101か
ら音声認識の処理の結果を受信する。
【0120】ステップS15において、音声コマンダ1
02は、音声認識エンジン101から受信した音声認識
の処理の結果を、小型表示ウィンドウ241に表示させ
る。ステップS16において、音声コマンダ102は、
コマンドの送信を実行して、ステップS1に戻り、コマ
ンドの送信または起動の処理を繰り返す。
【0121】このように、認識キーの操作により、使用
者は、音声コマンダウィンドウ161が最小化表示され
ている状態においても、音声が認識された結果を小型表
示ウィンドウ241を確認して、コマンドの送信をさせ
ることができ、誤った認識による処理の実行を防止する
ことができる。また、以上のように、使用者は、キーボ
ード4などを操作することなく、簡単に、電子ペットと
遊んだり、静止画像を閲覧したりすることができる。
【0122】上述した一連の処理は、ハードウェアによ
り実行させることもできるが、ソフトウェアにより実行
させることもできる。一連の処理をソフトウェアにより
実行させる場合には、そのソフトウェアを構成するプロ
グラムが、専用のハードウェアに組み込まれているコン
ピュータ、または、各種のプログラムをインストールす
ることで、各種の機能を実行することが可能な、例えば
汎用のパーソナルコンピュータなどに、プログラム格納
媒体からインストールされる。
【0123】コンピュータにインストールされ、コンピ
ュータによって実行可能な状態とされるプログラムを格
納するプログラム格納媒体は、図7に示すように、磁気
ディスク95(フロッピディスクを含む)、光ディスク
96(CD-ROM(Compact Disc-Read Only Memory)、DVD(D
igital Versatile Disc)を含む)、光磁気ディスク97
(MD(Mini-Disc)を含む)、若しくは半導体メモリ9
8などよりなるパッケージメディア、または、プログラ
ムが一時的若しくは永続的に格納されるROM69や、ハ
ードディスク56などにより構成される。プログラム格
納媒体へのプログラムの格納は、必要に応じてルータ、
モデム50などのインタフェースを介して、ローカルエ
リアネットワーク、インターネット92、図示せぬデジ
タル衛星放送といった、有線または無線の通信媒体を利
用して行われる。
【0124】なお、本明細書において、プログラム格納
媒体に格納されるプログラムを記述するステップは、記
載された順序に沿って時系列的に行われる処理はもちろ
ん、必ずしも時系列的に処理されなくとも、並列的ある
いは個別に実行される処理をも含むものである。
【0125】また、本明細書において、システムとは、
複数の装置により構成される装置全体を表すものであ
る。
【0126】
【発明の効果】以上の如く、請求項1に記載の情報処理
装置、請求項3に記載の情報処理方法、および請求項4
に記載のプログラム格納媒体によれば、音声認識の結果
に対応して所定の処理を実行するプログラムが起動さ
れ、かつ、アクティブな状態になっていると判断された
場合、音声認識が指示されている状態を示す第1のウィ
ンドウを、プログラムに対応する第2のウィンドウの近
傍、または、重なる位置に表示されるように表示を制御
し、音声認識の結果に対応して所定の処理を実行するプ
ログラムは起動されていない、または、起動されてはい
るがアクティブな状態ではないと判断された場合、第1
のウィンドウが予め定められた所定の位置に表示される
ように表示を制御するようにしたので、使用者は、音声
認識の状態を確認することができ、もって、誤った処理
を指示することを防ぐことができる。
【図面の簡単な説明】
【図1】パーソナルコンピュータ1の外観斜視図であ
る。
【図2】パーソナルコンピュータ1の平面図である。
【図3】パーソナルコンピュータ1の左側側面図であ
る。
【図4】パーソナルコンピュータ1の右側側面図であ
る。
【図5】パーソナルコンピュータ1の正面図である。
【図6】パーソナルコンピュータ1の底面図である。
【図7】パーソナルコンピュータ1の構成を示すブロッ
ク図である。
【図8】パーソナルコンピュータ1の機能ブロックを示
す図である。
【図9】パーソナルコンピュータ1の機能ブロックを示
す図である。
【図10】SAPIを説明する図である。
【図11】音声コマンダウィンドウ161を示す図であ
る。
【図12】LCD21に表示される画面を説明する図であ
る。
【図13】LCD21に表示される画面を説明する図であ
る。
【図14】LCD21に表示される画面を説明する図であ
る。
【図15】LCD21に表示される画面を説明する図であ
る。
【図16】LCD21に表示される画面を説明する図であ
る。
【図17】LCD21に表示される画面を説明する図であ
る。
【図18】LCD21に表示される画面を説明する図であ
る。
【図19】LCD21に表示される画面を説明する図であ
る。
【図20】LCD21に表示される画面を説明する図であ
る。
【図21】LCD21に表示される画面を説明する図であ
る。
【図22】音声認識に関する処理を説明するフローチャ
ートである。
【符号の説明】
1 パーソナルコンピュータ, 4 キーボード, 1
0 シャッタボタン,21 LCD, 23 CCDビデオカ
メラ, 24 マイクロフォン, 52 CPU, 59
ROM, 54 RAM, 84A 電子メールプログラ
ム, 86 前押しスイッチ, 88 ドライブ, 9
2 インターネット, 95 磁気ディスク, 96
光ディスク, 97 光磁気ディスク, 98 半導体
メモリ,101 音声認識エンジン, 102 音声コ
マンダ, 103 静止画撮影プログラム, 104
静止画閲覧プログラム, 111 読み仮名辞書データ
ベース, 112 エンジン用認識単語・文法データベ
ース, 113 ランチャ設定データベース, 114
辞書設定データベース, 115 認識単語データベ
ース, 121 アプリケーション通信部, 122
エンジン通信部,123 UI処理部, 124 音声
ランチャ制御部, 125 ユーザ辞書制御部, 12
6 認識テスト処理部, 241 小型表示ウィンドウ
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G10L 15/00 G10L 3/00 551P 15/28 561C 15/22 571H (72)発明者 米倉 修二 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 (72)発明者 笹井 崇司 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 Fターム(参考) 5B076 AB17 5D015 KK03 LL02 LL05 5E501 AA02 AC37 CA03 CB15 EA21 EB05 FA06 FA23 FA43 FB22 9A001 DD11 HH17 HH34

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 音声を認識する状態が指示されているか
    否かを判断する第1の判断手段と、 前記第1の判断手段により音声を認識する状態が指示さ
    れていると判断された場合、音声認識の結果に対応して
    所定の処理を実行するプログラムが起動され、かつ、ア
    クティブな状態になっているか否かを判断する第2の判
    断手段と、 前記第2の判断手段により音声認識の結果に対応して所
    定の処理を実行するプログラムが起動され、かつ、アク
    ティブな状態になっていると判断された場合、音声認識
    が指示されている状態を示す第1のウィンドウを、前記
    プログラムに対応する第2のウィンドウの近傍、また
    は、重なる位置に表示されるように表示を制御する第1
    の表示制御手段と、 前記第2の判断手段により音声認識の結果に対応して所
    定の処理を実行するプログラムは起動されていない、ま
    たは、起動されてはいるがアクティブな状態ではないと
    判断された場合、前記第1のウィンドウが予め定められ
    た所定の位置に表示されるように表示を制御する第2の
    表示制御手段とを含むことを特徴とする情報処理装置。
  2. 【請求項2】 音声認識した結果が、所定の処理を実行
    させるためのコマンドの一覧の表示を指示するものであ
    った場合、コマンドの一覧が表示されるように表示を制
    御する第3の表示制御手段をさらに含むことを特徴とす
    る請求項1に記載の情報処理装置。
  3. 【請求項3】 音声を認識する状態が指示されているか
    否かを判断する第1の判断ステップと、 前記第1の判断ステップの処理で音声を認識する状態が
    指示されていると判断された場合、音声認識の結果に対
    応して所定の処理を実行するプログラムが起動され、か
    つ、アクティブな状態になっているか否かを判断する第
    2の判断ステップと、 前記第2の判断ステップの処理で音声認識の結果に対応
    して所定の処理を実行するプログラムが起動され、か
    つ、アクティブな状態になっていると判断された場合、
    音声認識が指示されている状態を示す第1のウィンドウ
    を、前記プログラムに対応する第2のウィンドウの近
    傍、または、重なる位置に表示されるように表示を制御
    する第1の表示制御ステップと、 前記第2の判断ステップの処理で音声認識の結果に対応
    して所定の処理を実行するプログラムは起動されていな
    い、または、起動されてはいるがアクティブな状態では
    ないと判断された場合、前記第1のウィンドウが予め定
    められた所定の位置に表示されるように表示を制御する
    第2の表示制御ステップとを含むことを特徴とする情報
    処理方法。
  4. 【請求項4】 音声を認識する状態が指示されているか
    否かを判断する第1の判断ステップと、 前記第1の判断ステップの処理で音声を認識する状態が
    指示されていると判断された場合、音声認識対応のプロ
    グラムが起動され、かつ、アクティブな状態になってい
    るか否かを判断する第2の判断ステップと、 前記第2の判断ステップの処理で音声認識の結果に対応
    して所定の処理を実行するプログラムが起動され、か
    つ、アクティブな状態になっていると判断された場合、
    音声認識が指示されている状態を示す第1のウィンドウ
    を、前記プログラムに対応する第2のウィンドウの近
    傍、または、重なる位置に表示されるように表示を制御
    する第1の表示制御ステップと、 前記第2の判断ステップの処理で音声認識の結果に対応
    して所定の処理を実行するプログラムは起動されていな
    い、または、起動されてはいるがアクティブな状態では
    ないと判断された場合、前記第1のウィンドウが予め定
    められた所定の位置に表示されるように表示を制御する
    第2の表示制御ステップとを含むことを特徴とするコン
    ピュータが実行可能なプログラムが格納されているプロ
    グラム格納媒体。
JP2000027889A 2000-02-04 2000-02-04 情報処理装置および方法、並びにプログラム格納媒体 Pending JP2001216131A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000027889A JP2001216131A (ja) 2000-02-04 2000-02-04 情報処理装置および方法、並びにプログラム格納媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000027889A JP2001216131A (ja) 2000-02-04 2000-02-04 情報処理装置および方法、並びにプログラム格納媒体

Publications (1)

Publication Number Publication Date
JP2001216131A true JP2001216131A (ja) 2001-08-10

Family

ID=18553399

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000027889A Pending JP2001216131A (ja) 2000-02-04 2000-02-04 情報処理装置および方法、並びにプログラム格納媒体

Country Status (1)

Country Link
JP (1) JP2001216131A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007521522A (ja) * 2003-08-21 2007-08-02 マイクロソフト コーポレーション リッチ最小化アプリケーションを提供するためのシステムおよび方法
KR101073154B1 (ko) * 2005-01-07 2011-10-12 주식회사 현대오토넷 윈도우 환경에서의 음성인식을 이용한 사용자 인터페이스장치 및 그 제어 방법
CN106878390A (zh) * 2017-01-09 2017-06-20 北京奇虎科技有限公司 电子宠物互动控制方法、装置及可穿戴设备
JP2020134627A (ja) * 2019-02-15 2020-08-31 レノボ・シンガポール・プライベート・リミテッド 情報処理装置、情報処理方法およびプログラム
JP2020194557A (ja) * 2011-09-30 2020-12-03 アップル インコーポレイテッドApple Inc. バーチャルアシスタントのコマンド処理を容易にするためのコンテクスト情報の使用
JP2022028879A (ja) * 2020-12-21 2022-02-16 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド 音声データの処理方法、装置、機器及び記憶媒体
US11831799B2 (en) 2019-08-09 2023-11-28 Apple Inc. Propagating context information in a privacy preserving manner

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007521522A (ja) * 2003-08-21 2007-08-02 マイクロソフト コーポレーション リッチ最小化アプリケーションを提供するためのシステムおよび方法
KR101073154B1 (ko) * 2005-01-07 2011-10-12 주식회사 현대오토넷 윈도우 환경에서의 음성인식을 이용한 사용자 인터페이스장치 및 그 제어 방법
JP2020194557A (ja) * 2011-09-30 2020-12-03 アップル インコーポレイテッドApple Inc. バーチャルアシスタントのコマンド処理を容易にするためのコンテクスト情報の使用
JP7082645B2 (ja) 2011-09-30 2022-06-08 アップル インコーポレイテッド バーチャルアシスタントのコマンド処理を容易にするためのコンテクスト情報の使用
CN106878390A (zh) * 2017-01-09 2017-06-20 北京奇虎科技有限公司 电子宠物互动控制方法、装置及可穿戴设备
CN106878390B (zh) * 2017-01-09 2020-07-28 北京奇虎科技有限公司 电子宠物互动控制方法、装置及可穿戴设备
JP2020134627A (ja) * 2019-02-15 2020-08-31 レノボ・シンガポール・プライベート・リミテッド 情報処理装置、情報処理方法およびプログラム
US11831799B2 (en) 2019-08-09 2023-11-28 Apple Inc. Propagating context information in a privacy preserving manner
JP2022028879A (ja) * 2020-12-21 2022-02-16 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド 音声データの処理方法、装置、機器及び記憶媒体
JP7371075B2 (ja) 2020-12-21 2023-10-30 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド 音声データの処理方法、装置、機器及び記憶媒体

Similar Documents

Publication Publication Date Title
US7047199B2 (en) Communication apparatus, communication method and program storage medium
US6757657B1 (en) Information processing apparatus, information processing method and program storage medium
US7099920B1 (en) Method and system for creating an e-mail by automatically constituting a text and an attached file of the e-mail basing on at least one words or sentences and picture stored in a single picture file
JP2000222185A (ja) 情報処理装置および方法、並びに提供媒体
KR20190021012A (ko) 인공지능 기기에서의 연속 대화 기능
JP2001216131A (ja) 情報処理装置および方法、並びにプログラム格納媒体
JP2001216059A (ja) 情報処理装置および方法、並びにプログラム格納媒体
JP2001216061A (ja) 情報処理装置および方法、並びにプログラム格納媒体
JP3449364B2 (ja) 電子機器におけるプログラム起動装置、プログラム起動方法、媒体および電子機器
JP2001075774A (ja) 情報処理装置および方法、並びにプログラム格納媒体
JP2001216128A (ja) 情報処理装置および方法、並びにプログラム格納媒体
JP2000152138A (ja) 情報処理装置、情報処理方法、およびプログラム格納媒体
JP2001075591A (ja) 情報処理装置および方法、並びにプログラム格納媒体
JPH11212893A (ja) 電子機器におけるプログラム起動装置、プログラム起動方法、媒体および電子機器
JP2001075775A (ja) 情報処理装置および方法、並びにプログラム格納媒体
JP2001075773A (ja) 情報処理装置および方法、並びにプログラム格納媒体
JP2001142878A (ja) 情報処理装置および方法、並びにプログラム格納媒体
JP2001075592A (ja) 情報処理装置および方法、並びにプログラム格納媒体
JP2000112726A (ja) 電子機器におけるプログラム起動装置、プログラム起動方法、および媒体
JP2001096481A (ja) 情報処理装置および方法、並びにプログラム格納媒体
JP2001222353A (ja) 情報処理装置および方法、並びにプログラム格納媒体
JP2001222358A (ja) 情報処理装置および方法、並びにプログラム格納媒体
JP2000112727A (ja) 電子機器におけるプログラム起動装置、プログラム起動方法、および媒体
JP2000105690A (ja) 電子機器におけるプログラム起動装置、プログラム起動方法、および媒体
JP2000112730A (ja) 電子機器におけるプログラム起動装置、プログラム起動方法、および媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070126

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080515

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080918