JPH11338493A

JPH11338493A - 情報処理装置および方法、並びに提供媒体

Info

Publication number: JPH11338493A
Application number: JP14374598A
Authority: JP
Inventors: Satoshi Fujimura; 聡藤村
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 1998-05-26
Filing date: 1998-05-26
Publication date: 1999-12-10

Abstract

(57)【要約】【課題】音声認識結果の修正をより迅速に行えるよう
にする。【解決手段】入力キー４−２は、新規に音声を入力す
るとき操作される。修正キー４−３は、表示部３−１に
表示されている未確定の認識結果を修正するための音声
を入力するとき操作される。いまの場合、表示部３−１
には、入力された２つの文章が表示されており、２つの
文章のうち、上側に表示されている文章は、既に確定さ
れているものである。一方、その下に反転表示されてい
る文章は、ユーザが入力キー４−２を操作して音声で入
力した直後の未確定のものであり、修正することが可能
な状態とされている。この状態で修正を行う場合、ユー
ザは、修正キー４−３を操作しながら、修正したい箇所
のみを発話する。例えば、「今日は５時から開始です」
の「開始」の部分を「会議」に修正する場合、ユーザ
は、修正キー４−３を操作している間に、「会議」と発
話する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、情報処理装置およ
び方法、並びに提供媒体に関し、特に、音声認識の認識
結果を修正する場合において、より容易に修正箇所を指
定し、もって、より迅速に誤りを修正することができる
ようにした、情報処理装置および方法、並びに提供媒体
に関する。

【０００２】

【従来の技術】最近、スケジュールや、住所録などの個
人情報を管理するためのPIM（Personal Information Ma
nager）としては、電子手帳やPDA（Personal Digital A
ssistant）などがある。また、ソフトウェアで構成され
たPIMをパーソナルコンピュータで実行させて使用する
場合もある。本明細書では、これらを個人情報管理装置
と総称する。

【０００３】これらの個人情報管理装置では、ユーザイ
ンタフェースの向上のため、表示部と一体に形成された
タッチパネル（タッチタブレット）を備えるものや、音
声認識機能を備えるものが実用化されている。音声認識
機能を備える個人情報管理装置では、ユーザは、管理し
たい情報やコマンドなどを音声で入力することができ
る。

【０００４】ところが、実際には、１００％の精度の音
声認識は難しく、通常、認識結果をユーザに提示し、そ
の正誤を確認させるようになされている。認識結果に誤
りがある場合、ユーザがその一部または全部を修正する
必要がある。

【０００５】従来では、認識結果を表示部に表示させ、
その認識結果に誤りがある場合、ユーザが、装置に備え
付けのボタンやキー等の操作部を操作して修正箇所を指
定したり、タッチペン（または指）を用いて上述したタ
ッチパネルを介して修正箇所を指定していた。

【０００６】

【発明が解決しようとする課題】しかしながら、このよ
うな修正箇所の指定操作は煩雑であり、情報の迅速な入
力が妨げられてしまう課題があった。

【０００７】本発明はこのような状況に鑑みてなされた
ものであり、より迅速に認識結果の修正をできるように
するものである。

【０００８】

【課題を解決するための手段】請求項１に記載の情報処
理装置は、音声を入力する第１の入力手段と、第１の入
力手段により入力された音声から特徴量を抽出する抽出
手段と、抽出手段により抽出された特徴量に対応して、
音声を認識する認識手段と、認識手段による認識結果に
修正すべき部分が存在する場合において、修正すべき部
分に対する音声を入力する第２の入力手段と、第２の入
力手段により入力された音声に対応して、認識結果を修
正する修正手段とを備えることを特徴とする。

【０００９】請求項５に記載の情報処理方法は、音声を
入力する第１の入力ステップと、第１の入力ステップで
入力された音声から特徴量を抽出する抽出ステップと、
抽出ステップで抽出された特徴量に対応して、音声を認
識する認識ステップと、認識ステップにおける認識結果
に修正すべき部分が存在する場合において、修正すべき
部分に対する音声を入力する第２の入力ステップと、第
２の入力ステップで入力された音声に対応して、認識結
果を修正する修正ステップとを含むことを特徴とする。

【００１０】請求項６に記載の提供媒体は、音声を入力
する第１の入力ステップと、第１の入力ステップで入力
された音声から特徴量を抽出する抽出ステップと、抽出
ステップで抽出された特徴量に対応して、音声を認識す
る認識ステップと、認識ステップにおける認識結果に修
正すべき部分が存在する場合において、修正すべき部分
に対する音声を入力する第２の入力ステップと、第２の
入力ステップで入力された音声に対応して、認識結果を
修正する修正ステップとを含む処理を情報処理装置に実
行させるコンピュータが読み取り可能なプログラムを提
供することを特徴とする。

【００１１】請求項１に記載の情報処理装置、請求項５
に記載の情報処理方法、および請求項６に記載の提供媒
体においては、入力された音声から特徴が抽出され、抽
出された特徴量に対応して音声が認識され、認識結果に
修正すべき部分が存在する場合において、修正すべき部
分に対する音声が入力され、それに対応して、認識結果
が修正される。

【００１２】

【発明の実施の形態】以下に本発明の実施の形態を説明
するが、特許請求の範囲に記載の発明の各手段と以下の
実施の形態との対応関係を明らかにするために、各手段
の後の括弧内に、対応する実施の形態（但し一例）を付
加して本発明の特徴を記述すると、次のようになる。但
し勿論この記載は、各手段を記載したものに限定するこ
とを意味するものではない。

【００１３】請求項１に記載の情報処理装置は、音声を
入力する第１の入力手段（例えば、図２の入力キー４−
２）と、第１の入力手段により入力された音声から特徴
量を抽出する抽出手段（例えば、図２の音声分析部１
２）と、抽出手段により抽出された特徴量に対応して、
音声を認識する認識手段（例えば、図２のCPU１３）
と、認識手段による認識結果に修正すべき部分が存在す
る場合において、修正すべき部分に対する音声を入力す
る第２の入力手段（例えば、図２の修正キー４−３）
と、第２の入力手段により入力された音声に対応して、
認識結果を修正する修正手段（例えば、図２のCPU１
３）とを備えることを特徴とする。

【００１４】請求項４に記載の情報処理装置は、認識結
果の修正を命令するための特定のコマンドを予め記憶す
る記憶手段（例えば、図２のROM１４）をさらに備え、
修正手段は、記憶手段に記憶されているコマンドに対応
する音声が第１の入力手段または第２の入力手段により
入力された場合、コマンドに対応する音声に継続して入
力される音声を認識結果の修正箇所として、認識結果を
修正することを特徴とする。

【００１５】図１は、本発明の情報処理装置を適用した
個人情報管理装置の構成例を示す外観図である。この個
人情報管理装置の本体１には、音声を入力するためのマ
イクロフォン２、所定の画像を表示するための表示部３
−１、および操作キー４が設けられている。表示部３−
１の表面上には、ユーザがタッチペン５または指などを
用いて接触することにより指示された位置に対応する信
号を出力する、いわゆるタッチパネル３−２が配置され
ている。このタッチパネル３−２は、ガラスまたは樹脂
等の透明な材料により構成されており、ユーザは、表示
部３−１に表示される画像を、タッチパネル３−２を介
して見ることができる。また、ユーザは、タッチペン５
を用いて、タッチパネル３−２に所定の文字を入力（記
述）したり、表示部３−１に表示されている所定のオブ
ジェクト（アイコン）の選択または実行などを行うこと
ができる。

【００１６】操作部４は、確定キー４−１、入力キー４
−２、および修正キー４−３の３つのキーにより構成さ
れている。確定キー４−１は、表示部３−１に表示され
ている未確定状態の認識結果を確定するとき操作され
る。入力キー４−２は、新規に音声を入力するとき操作
される。修正キー４−３は、表示部３−１に表示されて
いる未確定の認識結果を修正するための音声を入力する
とき操作される。

【００１７】図１の表示例の場合、表示部３−１には、
ユーザが入力キー４−２を操作して入力した音声が認識
された２つの文章が表示されており、２つの文章のう
ち、上側に表示されている文章（黒字）は、既に確定さ
れているものである。一方、その下に反転表示されてい
る文章は、ユーザが入力キー４−２を操作して音声を入
力した直後の未確定のものであり、修正することが可能
な状態とされている。この状態で修正を行う場合、ユー
ザは、修正キー４−３を操作（押下）しながら、修正し
たい箇所のみを発話する。例えば、「今日は５時から開
始です」の「開始」の部分を「会議」に修正する場合、
ユーザは、修正キー４−３を操作しながら、「会議」と
発話し、発話が終了したら、修正キー４−３の操作を停
止する（押下していた修正キー４−３を戻す）。

【００１８】図２は、図１の個人情報管理装置の内部の
電気的な構成例を示すブロック図である。この例におい
て、マイクロフォン２は、ユーザが発話した音声をアナ
ログの電圧信号に変換し、音声信号としてＡ／Ｄ変換部
１１に出力する。Ａ／Ｄ変換部１１は、マイクロフォン
２より供給された音声信号をＡ／Ｄ変換し、音声分析部
１２に出力するようになされている。音声分析部１２
は、Ａ／Ｄ変換部１１より供給された音声信号から、音
声認識に必要な特徴量の抽出を行い、分析データとして
CPU１３に出力する。

【００１９】特徴量の抽出としては、例えば、音声信号
のエネルギー、零交差数、またはピッチなどの抽出を行
ったり、線形予測分析（LPC：Linear Predictive Codin
g）、高速フーリエ変換（FFT：Fast Fourie Transfor
m）、バンドパスフィルタ群によるフィルタバンク分
析、またはWavlet変換などを用いて周波数分析し、帯域
分割されたエネルギーを要素とするベクトル時系列を特
徴量として抽出することが考えられる。また、得られた
特徴量に対し、K-L（Karhunen-Loeve）変換や、ニュー
ラルネットワーク等の写像を施すことで、分離度のより
大きな特徴量に変換する場合もある。さらに、特徴量
（特徴ベクトル）を圧縮し、量子化する場合もある。

【００２０】ROM１４またはRAM１５には、学習用の音声
信号を音響分析して得られる特徴量をもとに作成された
パラメータ（音声学習データ）と、音声認識用辞書デー
タが記憶されている。CPU１３は、音声分析部１２より
供給された分析データを一旦RAM１５に格納し、これに
対して、ROM１４またはRAM１５に記憶されている音声学
習データと音声認識用辞書を参照して認識処理を行い、
認識結果に対応するテキストデータを作成する。認識処
理としては、例えば、ＤＰ（Dynamic Programming）マ
ッチング、ニューラルネットワーク、またはＨＭＭ（Hi
dden Markov Model）などを用いたものが考えられる。
また、文章全体を認識対象とする場合、２レベルＤＰマ
ッチングを適用することも考えられる。CPU１３により
作成されたテキストデータは、表示制御部１６に出力さ
れ、表示部３−１に表示される。また、CPU１３は、ROM
１４に記憶されているアプリケーションプログラムを実
行するようになされている。

【００２１】表示制御部１６は、認識結果としてのテキ
ストデータや、図形、記号などのデータをCPU１３から
受け取り、これらを用いて表示すべき画像を描画し、表
示部３−１に表示させるようになされている。入力検出
部１７は、タッチタブレット３−２、確定キー４−１、
入力キー４−２、および修正キー４−３が接続されてお
り、ユーザによるこれらの操作を検出し、対応する信号
をCPU１３に出力するようになされている。

【００２２】図３は、図２の個人情報管理装置の他の構
成例を示す図であり、図２に示した場合と対応する部分
には、同一の符号を付してあり、その説明は適宜省略す
る。この例においては、さらに、音声合成部１８とスピ
ーカ１９が新たに設けられている。音声合成部１８は、
例えば、CPU１３が出力したテキストデータ（認識結
果）に対応する音声信号を合成し、スピーカ１９を介し
て出力するようになされている。ユーザは、スピーカ１
９より出力される音声に対応して、認識結果の正誤を判
断することができる。なお、その他の構成は、図２に示
した場合と同様とされている。

【００２３】次に、図４のフローチャートを参照して、
図２に示した個人情報管理装置の動作を説明する。ま
ず、ステップＳ１において、ユーザによる操作部４の所
定のキーの操作が待機される。操作部４が操作される
と、ステップＳ２に進み、ユーザにより操作されたキー
が、入力キー４−２であるか否かが判定され、ユーザが
入力キー４−２を操作したと判定された場合、ステップ
Ｓ３に進む。ステップＳ３において、表示部３−１に表
示されている認識結果の中に、未確定の認識結果がある
か否かが判定され、未確定の認識結果は存在しないと判
定された場合、ステップＳ５に進む。一方、ステップＳ
３において、未確定の認識結果が存在すると判定された
場合、ステップＳ４で、未確定の認識結果が確定された
後、ステップＳ５に進む。即ち、未確定の認識結果が存
在する状態において、ユーザが入力キー４−１を操作し
て新たな音声を入力すると、未確定認識結果が自動的に
確定される。

【００２４】ステップＳ５において、入力キー４−２が
継続して操作されている間にユーザが発話した音声が、
マイクロフォン２とＡ／Ｄ変換部１１を介して、音声分
析部１１に入力され、音声分析部１１は、入力された音
声信号から特徴量を抽出し、分析データとしてCPU１３
に出力する。入力キー４−２の操作が戻されると、音声
の入力が停止され、ステップＳ６に進む。

【００２５】ステップＳ６において、CPU１３は、音声
分析部１１より供給される分析データに対して音声認識
処理を実行し、認識結果を表示制御部１６に出力する。
ステップＳ７において、表示制御部１６は、CPU１３よ
り供給された認識結果を未確定状態で表示部３−１に表
示する（反転表示する）。その後、ステップＳ１に戻
り、以降の処理が再び実行される。

【００２６】ステップＳ２において、ユーザにより操作
されたキーが、入力キー４−２ではないと判定された場
合、ステップＳ８に進み、操作されたキーが修正キー４
−３であるか否かが判定される。ステップＳ８におい
て、ユーザにより操作されたキーが修正キー４−３であ
ると判定された場合、ステップＳ９に進み、修正キー４
−３が操作されている間にユーザが発話した音声が、マ
イクロフォン２とＡ／Ｄ変換部１１を介して、音声分析
部１１に入力され、音声分析部１１は、入力された音声
信号から特徴量を抽出し、分析データとしてCPU１３に
出力する。

【００２７】ステップＳ１０に進み、CPU１３は、RAM１
５に記憶されている未確定の認識結果の特徴量と、音声
分析部１１より供給された分析データの特徴量を比較
し、修正部分を決定する。いま、ユーザが入力キー４−
２を操作して入力した音声「今日は５時から会議です」
が、「今日は５時から開始です」と誤って認識され、未
確定の認識結果として、表示部３−１に表示されている
ものとする。RAM１５に記憶されている未確定の認識結
果の特徴量（パワー成分）の波形の例は図５（Ａ）に示
されている。いまの場合、ユーザは、「開始」を「会
議」に変更したいので、修正キー４−３を操作しなが
ら、音声「会議」を入力する。この「会議」に対応する
特徴量の波形は、図５（Ｂ）に示されている。

【００２８】CPU１３は、この２つの特徴量を比較（照
合）し、最も近似している波形の対応付け（キーワード
スポッティング）の決定を行う。対応付けを決定する方
法としては、例えば、連続ＤＰマッチングを用いること
が考えられる。連続ＤＰマッチングは、単語音声認識の
ための手法として知られているＤＰマッチング法を応用
したものであり、照合の対称となるデータの始端と終端
が不明な場合に用いられる手法である。これを用いた場
合、CPU１３は、未確定状態の音声データの特徴量（図
５（Ａ））に対して、その始端から終端まで、単位時間
づつ照合位置をずらしながら、修正のための音声の特徴
量（図５（Ｂ））とのＤＰマッチングを行う。なお、対
応付けの決定は、連続ＤＰマッチング以外の方法を用い
るようにしてもよい。

【００２９】図４の説明に戻り、ステップＳ１１におい
て、CPU１３は、決定された修正箇所の音声認識を行
う。このとき、対応付けられた２つの特徴量をデータと
し、また、「開始」という単語を認識対象語彙から除外
する。これにより、１回目の認識より精度が向上する。
ステップＳ１２に進み、CPU１３は、RAM１４に記憶され
ている未確定の認識結果を変更し、それに対応してステ
ップＳ１３において、未確定結果の表示が表示制御部１
６により更新され、ステップＳ１に戻り、以降の処理が
繰り返される。

【００３０】ステップＳ８において、ユーザにより操作
されたキーが修正キー４−３ではないと判定された場
合、ステップＳ１４において、ユーザにより操作された
キーが確定キー４−１であるか否かが判定される。ステ
ップＳ１４において、ユーザにより操作されたキーが確
定キー４−１ではないと判定された場合、ステップＳ１
に戻り、以降の処理が再び実行される。一方、ステップ
Ｓ１４において、ユーザにより操作されたキーが確定キ
ー４−１であると判定された場合、ステップＳ１５に進
み、まだ確定されていない認識結果が存在するか否かが
判定される。

【００３１】ステップＳ１５において、まだ確定されて
いない認識結果が存在すると判定された場合、ステップ
Ｓ１６に進み、未確定の認識結果が確定された後、ステ
ップＳ１に戻り、以降の処理が実行される。ステップＳ
１５において、確定されていない認識結果は存在しない
と判定された場合（即ち、全ての認識結果は確定されて
いると判定された場合）、ステップＳ１７において、音
声認識を終了するか否かが判定される。ステップＳ１７
において、まだ音声認識の終了ではないと判定された
（ユーザにより音声認識の終了はしないと指示された）
場合、ステップＳ１に戻り、以降の処理が実行される。
ステップＳ１７において、音声認識を終了すると判定さ
れた場合、処理が終了される。

【００３２】図６は、ユーザが「今日は５時から会議で
す」という文章を入力するときのユーザと個人情報管理
装置の間の動作を説明する図である。この例において
は、ステップＳ３１において、ユーザは、入力キー４−
２を操作しながら、「今日は５時から会議です」と発話
する。個人情報管理装置は、ステップＳ３２で、ユーザ
が発話した音声を音声認識し、ステップＳ３３で、その
認識結果「今日は５時から開始です」を未確定状態で表
示部３−１に表示させる。ステップＳ３４において、ユ
ーザは表示部３−１に表示された認識結果を確認し、い
まの場合、「開始」の部分が誤っているので、ステップ
Ｓ３５において、修正キー４−３を操作しながら、「会
議」と発話する。

【００３３】ステップＳ３６において、個人情報管理装
置は、ユーザの発話に対応して、未確定認識結果の修正
箇所を決定し、修正箇所の音声認識を再度行う。このと
き、修正箇所の認識結果が「会議」であるものとする。
ステップＳ３７において、個人情報管理装置は、「今日
は５時から開始です」の表示を、「今日は５時から会議
です」の表示に変更する。いまの場合、１回の修正で正
しい結果を得ることができたが、もし、修正結果が再び
誤っていても、ユーザは、何度でも修正を行うことが可
能である。この場合、上述したように、一度誤った表現
は除外されるので、再び同じ誤りが発生することはな
い。

【００３４】図７は、図６の他の例を示した図である。
この例では、ユーザがステップＳ４１で「今日は５時か
ら会議です」と発話したのに対し、個人情報管理装置
が、ステップＳ４２で「今日は５時か高い木です」と誤
認識した場合を示している。この例において、個人情報
管理装置が誤認識した未確定認識結果と、ユーザが修正
するために発話した「会議」の特徴量の対応関係は、図
８に示すようになる。この場合、「高い木」の「カイ
キ」と、「会議」の「カイギ」が対応しているものと考
えることができる。ところが、この部分を修正箇所とし
て、未確定認識結果を修正すると、「今日は５時かた会
議です」となり、日本語としての意味を成さなくなる。
このように、未確定認識結果と、修正するために発話さ
れた単語の対応付けの結果、単語の境界を変更する必要
性が生じる場合がある。この場合、ステップＳ４６にお
いて、CPU１３は、修正するために発話された単語「会
議」に対応する「カイキ」と、その周囲の部分（いまの
場合、「ゴジカタ」）についても再度音声認識するよう
になされている。なお、その他のステップは、図６に示
した場合と同様とされており、その説明は省略する。

【００３５】以上の実施の形態においては、通常の音声
と、修正のための音声の入力を区別するために、入力キ
ー４−２と修正キー４−３の２つのキーを設けるように
したが、修正を指示するためのコマンドとしての特定の
語句を、ROM１４またはRAM１５に予め予約（記憶）させ
ておき、このコマンドに対応する音声が入力されたとき
に、この後に続く音声を未確定認識結果に対する修正箇
所として認識させるようにしてもよい。例えば、このコ
マンドを「違う」という単語に定めておき、上述のよう
に「開始」を「会議」に修正する場合、「違う、会議」
のように発話する。

【００３６】また、以上においては、未確定状態の認識
結果を確定するための確定キー４−１を設けた場合を示
したが、例えば、一定の時間が経過したときに、未確定
の認識結果が確定されるようにしてもよい。

【００３７】さらに、以上においては、本発明の情報処
理装置を、携帯型の個人情報処理に適用した場合を示し
たが、勿論、他の装置にも適用することができる。

【００３８】以上の各処理を実行するコンピュータプロ
グラムをユーザに提供する提供媒体としては、磁気ディ
スク、CD-ROM、固体メモリなどの記録媒体の他、ネット
ワーク、衛星などの通信媒体を利用することができる。

【００３９】

【発明の効果】以上の如く、請求項１に記載の情報処理
装置、請求項５に記載の情報処理方法、および請求項６
に記載の提供媒体によれば、入力された音声から特徴を
抽出し、抽出した特徴量に対応して音声を認識し、認識
結果に修正すべき部分が存在する場合において、修正す
べき部分に対する音声を入力し、それに対応して認識結
果を修正するようにしたので、ユーザを煩わすことな
く、認識結果の修正をより迅速に行うことが可能とな
る。

【図面の簡単な説明】

【図１】本発明の情報処理装置を適用した個人情報管理
装置の外観の構成例を示す図である。

【図２】図１の個人情報管理装置の電気的な構成例を示
すブロック図である。

【図３】図２の個人情報管理装置の他の構成例を示すブ
ロック図である。

【図４】図２の個人情報管理装置の動作を説明するフロ
ーチャートである。

【図５】修正箇所の対応付けを説明する図である

【図６】ユーザと個人情報管理装置の間の動作を示す図
である。

【図７】図６の他の例を示す図である。

【図８】図５の修正箇所の対応付けの他の例を示してい
る。

【符号の説明】

１本体，２マイクロフォン，３−１表示部，
３−２タッチパネル，４−１確定キー，４−
２入力キー，４−３修正キー，５タッチペ
ン，１１Ａ／Ｄ変換部，１２音声分析部，１
３ CPU，１４ROM，１５ RAM，１６表示制御
部，１７入力検出部

Claims

【特許請求の範囲】

【請求項１】音声を入力する第１の入力手段と、前記第１の入力手段により入力された音声から特徴量を
抽出する抽出手段と、前記抽出手段により抽出された前記特徴量に対応して、
前記音声を認識する認識手段と、前記認識手段による前記認識結果に修正すべき部分が存
在する場合において、前記修正すべき部分に対する音声
を入力する第２の入力手段と、前記第２の入力手段により入力された前記音声に対応し
て、前記認識結果を修正する修正手段とを備えることを
特徴とする情報処理装置。
【請求項２】前記修正手段は、前記認識結果に対応す
る特徴量と、前記第２の入力手段により入力された前記
音声に対応する特徴量とを比較し、その比較結果に対応
して、前記認識結果の修正箇所を決定することを特徴と
する請求項１に記載の情報処理装置。
【請求項３】前記修正手段は、前記認識結果の前記修
正個所を修正した場合において、前記修正箇所の前後の
整合性が取れなくなったとき、前記修正箇所の周囲の部
分も同時に修正することを特徴とする請求項３に記載の
情報処理装置。
【請求項４】前記認識結果の修正を命令するための特
定のコマンドを予め記憶する記憶手段をさらに備え、前記修正手段は、前記記憶手段に記憶されている前記コ
マンドに対応する音声が前記第１の入力手段または前記
第２の入力手段により入力された場合、前記コマンドに
対応する音声に継続して入力される音声を、前記認識結
果の修正箇所として、前記認識結果を修正することを特
徴とする請求項１に記載の情報処理装置。
【請求項５】音声を入力する第１の入力ステップと、前記第１の入力ステップで入力された音声から特徴量を
抽出する抽出ステップと、前記抽出ステップで抽出された前記特徴量に対応して、
前記音声を認識する認識ステップと、前記認識ステップにおける前記認識結果に修正すべき部
分が存在する場合において、前記修正すべき部分に対す
る音声を入力する第２の入力ステップと、前記第２の入力ステップで入力された前記音声に対応し
て、前記認識結果を修正する修正ステップとを含むこと
を特徴とする情報処理方法。
【請求項６】音声を入力する第１の入力ステップと、前記第１の入力ステップで入力された音声から特徴量を
抽出する抽出ステップと、前記抽出ステップで抽出された前記特徴量に対応して、
前記音声を認識する認識ステップと、前記認識ステップにおける前記認識結果に修正すべき部
分が存在する場合において、前記修正すべき部分に対す
る音声を入力する第２の入力ステップと、前記第２の入力ステップで入力された前記音声に対応し
て、前記認識結果を修正する修正ステップとを含む処理
を情報処理装置に実行させるコンピュータが読み取り可
能なプログラムを提供することを特徴とする提供媒体。