JPH10171493A - Method of processing information, device and recording medium therefor - Google Patents

Method of processing information, device and recording medium therefor

Info

Publication number
JPH10171493A
JPH10171493A JP8330740A JP33074096A JPH10171493A JP H10171493 A JPH10171493 A JP H10171493A JP 8330740 A JP8330740 A JP 8330740A JP 33074096 A JP33074096 A JP 33074096A JP H10171493 A JPH10171493 A JP H10171493A
Authority
JP
Japan
Prior art keywords
input
utterances
information processing
voice
recognition result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP8330740A
Other languages
Japanese (ja)
Other versions
JP3624064B2 (en
Inventor
Hiroki Yamamoto
寛樹 山本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP33074096A priority Critical patent/JP3624064B2/en
Publication of JPH10171493A publication Critical patent/JPH10171493A/en
Application granted granted Critical
Publication of JP3624064B2 publication Critical patent/JP3624064B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To prevent user from repeating utterance of a speech erroneously recognized. SOLUTION: A result of a speech recognition is judged whether it is true or false (S200), and if the recognition result is false, it is judged whether or not the number of times of utterance reaches a threshold value (S300). If the number of the utterance reaches the threshold value, it is judged as a suitable timing and a changeover of the input method and a method therefor are presented to a user (S400).

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、音声認識を利用し
た情報処理方法及び装置及び記憶媒体に関するものであ
る。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an information processing method and apparatus using voice recognition and a storage medium.

【0002】[0002]

【従来の技術】現在の音声認識技術では、誤認識された
発話内容は、繰り返し発話しても誤認識を繰り返すこと
がある。また、発話内容やユーザの発話様式によっては
何度発話しても認識されない場合がある。このような音
声認識を用いた情報入力方式では、認識しにくい内容を
入力するには、認識できるまでに何度も発話を繰り返す
必要があり、ユーザは何度も発話する労力と時間を費や
すことになる。このような場合に対処するため、従来の
音声認識を用いた情報入力装置では、キーボード等別の
入力方法を備えておき、ユーザの指示によって切り替え
を可能としていたが、音声入力から他の入力方法への切
り替えのタイミングは、ユーザの判断に負っていた。
2. Description of the Related Art In the current speech recognition technology, an erroneously recognized utterance content may be repeatedly erroneously recognized even if the utterance is repeated. Also, depending on the content of the utterance or the utterance style of the user, the utterance may not be recognized no matter how many times it is uttered. In such an information input method using voice recognition, in order to input difficult-to-recognize contents, it is necessary to repeat utterances many times before recognition can be performed, and a user spends labor and time uttering many times. become. In order to cope with such a case, the conventional information input device using voice recognition is provided with another input method such as a keyboard, and can be switched by a user's instruction. The timing of the switch to was determined by the user.

【0003】[0003]

【発明が解決しようとする課題】ユーザが発話した内容
が認識しにくいかどうかをユーザ自身が判断するのは難
しいため、誤認識を繰り返す場合でも、他の入力方法へ
の変更を行なわず、なんとか音声で入力しようと発話を
繰り返すユーザがいる。また結果的に認識されず、音声
入力をあきらめ、他の入力方法に切替えざるを得ない場
合もある。このような場合、正しい情報を入力できるま
でに、発話の繰り返しによって時間がかかり、また繰り
返し発話するためユーザに体力的、精神的負担がかか
る。
Since it is difficult for the user to judge whether or not the content uttered by the user is difficult to recognize, even if erroneous recognition is repeated, the input method is not changed to another input method and somehow is managed. There is a user who repeats an utterance to input by voice. Also, as a result, there is a case where the voice input is not recognized and the voice input has to be given up and switched to another input method. In such a case, it takes time to repeat the utterance until correct information can be input, and since the utterance is repeated, a physical and mental burden is imposed on the user.

【0004】[0004]

【課題を解決する為の手段】上記従来の課題を解決する
為に、本発明は、入力音声を認識し、前記認識結果の正
誤を判断し、前記認識結果が誤っているとの判断がなさ
れた音声の発声回数を計数し、前記計数した発声回数が
閾値に達しているか否かを判断し、前記発声回数が閾値
に達していると判断された場合に、入力方法の切り替え
を提示する情報処理方法及び装置及び記憶媒体を提供す
る。
SUMMARY OF THE INVENTION In order to solve the above-mentioned conventional problems, the present invention recognizes an input voice, judges whether the recognition result is correct or not, and judges that the recognition result is wrong. Counting the number of utterances of the uttered voice, determining whether the counted number of utterances has reached a threshold, and when it is determined that the number of utterances has reached a threshold, information for presenting switching of an input method. Provided are a processing method and apparatus, and a storage medium.

【0005】上記従来の課題を解決する為に、本発明
は、好ましくは前記入力音声の認識の結果を報知し、前
記報知した結果に対する正誤の指示を入力し、前記入力
した指示を、前記認識結果の正誤の判断とする。
[0005] In order to solve the above-mentioned conventional problems, the present invention preferably provides a method of notifying the result of recognition of the input voice, inputting a correct / incorrect instruction to the notified result, and converting the input instruction to the recognition result. Judge whether the result is correct or not.

【0006】上記従来の課題を解決する為に、本発明
は、好ましくは前記発声回数は、前記認識が行われた入
力音声の個数とする。
In order to solve the above-mentioned conventional problems, in the present invention, preferably, the number of utterances is set to the number of input voices for which the recognition has been performed.

【0007】上記従来の課題を解決する為に、本発明
は、好ましくは前記発声回数は、前記認識結果が同じ音
声の個数とする。
[0007] In order to solve the above-mentioned conventional problems, in the present invention, preferably, the number of utterances is the number of voices having the same recognition result.

【0008】上記従来の課題を解決する為に、本発明
は、好ましくは前記発声回数は、前記認識が行われた入
力音声の内、音声の波形が類似しているものの個数とす
る。
In order to solve the above-mentioned conventional problems, in the present invention, preferably, the number of utterances is set to the number of input voices having similar waveforms among the input voices subjected to the recognition.

【0009】上記従来の課題を解決する為に、本発明
は、好ましくは前記発声回数は、前記認識が行われた入
力音声の内、音声の長さが類似しているものの個数とす
る。
[0009] In order to solve the above-mentioned conventional problems, in the present invention, preferably, the number of utterances is the number of input voices having a similar voice length among the recognized input voices.

【0010】上記従来の課題を解決する為に、本発明
は、好ましくは前記発声回数は、前記入力音声の認識結
果を入力する項目ごとに計数する。
In order to solve the above-mentioned conventional problems, the present invention preferably counts the number of utterances for each input item of the recognition result of the input voice.

【0011】上記従来の課題を解決する為に、本発明
は、好ましくは前記発声回数は、前記認識結果が正しい
と判断された後の回数を計数する。
[0011] In order to solve the above-mentioned conventional problems, the present invention preferably counts the number of utterances after the recognition result is determined to be correct.

【0012】上記従来の課題を解決する為に、本発明
は、好ましくは前記閾値は、前記入力音声の認識結果を
入力する項目ごとに変更する。
In order to solve the above-mentioned conventional problems, the present invention preferably changes the threshold value for each item for inputting the recognition result of the input voice.

【0013】前記正しいと判断された認識結果を、表示
手段に表示する。
The recognition result determined to be correct is displayed on display means.

【0014】上記従来の課題を解決する為に、本発明
は、好ましくは前記発声回数が閾値に達していると判断
された場合に、切り替え可能な入力方法を表示画面に表
示する。
[0014] In order to solve the above-mentioned conventional problems, the present invention preferably displays a switchable input method on a display screen when it is determined that the number of utterances has reached a threshold value.

【0015】上記従来の課題を解決する為に、本発明
は、好ましくは前記入力方法の切り替えの提示に対して
指示された入力方法により入力された情報を、前記入力
音声の認識結果を入力すべく選択されていた項目に対応
付けて記憶する。
[0015] In order to solve the above-mentioned conventional problems, the present invention preferably inputs information input by an input method instructed to the presentation of the switching of the input method to input a recognition result of the input voice. The item is stored in association with the item that has been selected.

【0016】上記従来の課題を解決する為に、本発明
は、好ましくは音声認識以外の入力装置の電源ONの信
号を検知し、前記電源ONの信号を前記入力方法の切り
替えの提示に対する入力方法の選択指示と判断する。
In order to solve the above-mentioned conventional problems, the present invention preferably detects a power-on signal of an input device other than voice recognition, and inputs the power-on signal to the input method switching presentation method. Is determined to be a selection instruction.

【0017】上記従来の課題を解決する為に、本発明
は、好ましくは前記切り替え可能な入力方法は、キーボ
ードとする。
In order to solve the above-mentioned conventional problems, in the present invention, preferably, the switchable input method is a keyboard.

【0018】上記従来の課題を解決する為に、本発明
は、好ましくは前記切り替え可能な入力方法は、ポイン
ティングデバイスとする。
In order to solve the above-mentioned conventional problems, the present invention is preferably arranged such that the switchable input method is a pointing device.

【0019】上記従来の課題を解決する為に、本発明
は、好ましくは前記切り替え可能な入力方法は、タッチ
パネルとする。
In order to solve the above-mentioned conventional problems, in the present invention, preferably, the switchable input method is a touch panel.

【0020】上記従来の課題を解決する為に、本発明
は、好ましくは前記切り替え可能な入力方法は、ライト
ペンとする。
In order to solve the above-mentioned conventional problems, the present invention is preferably arranged such that the switchable input method is a light pen.

【0021】上記従来の課題を解決する為に、本発明
は、好ましくは前記切り替え可能な入力方法は、音声入
力とする。
In order to solve the above-mentioned conventional problems, in the present invention, preferably, the switchable input method is a voice input.

【0022】上記従来の課題を解決する為に、本発明
は、好ましくは前記切り替え可能な入力方法は、画像入
力とする。
In order to solve the above-mentioned conventional problems, in the present invention, preferably, the switchable input method is an image input.

【0023】上記従来の課題を解決する為に、本発明
は、好ましくは入力音声を認識し、前記認識結果の正誤
を判断し、前記認識結果が誤っているとの判断がなされ
た音声の発声回数を計数し、前記発声回数が閾値に達し
た時に、入力方法を音声認識以外の方法に切り替える。
In order to solve the above-mentioned conventional problems, the present invention preferably recognizes an input speech, judges whether the recognition result is correct or not, and produces a speech which is judged to be incorrect. The number of times is counted, and when the number of utterances reaches a threshold, the input method is switched to a method other than the voice recognition.

【0024】上記従来の課題を解決する為に、本発明
は、好ましくは前記切り替える音声認識以外の方法は、
予め設定された方法とする。
In order to solve the above-mentioned conventional problems, the present invention preferably provides a method other than the switching voice recognition,
The method is set in advance.

【0025】[0025]

【発明の実施の形態】以下、図面を参照しながら本発明
の一実施例を説明する。図1は本発明に係わる情報入力
装置の概略構成の一例を表すブロック図である。図2は
本発明にかかわる音声入力による情報入力処理のフロー
チャートである。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS An embodiment of the present invention will be described below with reference to the drawings. FIG. 1 is a block diagram illustrating an example of a schematic configuration of an information input device according to the present invention. FIG. 2 is a flowchart of an information input process by voice input according to the present invention.

【0026】以下で説明するユーザの発話に対する音声
認識などの処理は記憶装置(400)に記憶されたプログラ
ムに沿ってCPU(200)が処理する。図2のフローチャート
のプログラムも記憶装置400に記憶され、CPU20
0によって実行される。記憶装置400に記憶されるプ
ログラムは、本装置に着脱可能なFD或いはCD−RO
M等の記憶媒体や、公衆回線或はLANを介した他の端
末からダウンロードしても良い。
Processing such as voice recognition for a user's utterance described below is performed by the CPU (200) according to a program stored in the storage device (400). The program of the flowchart of FIG.
Performed by 0. The program stored in the storage device 400 is an FD or CD-RO detachable from the device.
It may be downloaded from a storage medium such as M or another terminal via a public line or a LAN.

【0027】ユーザが入力すべき情報を発話すると、音
声認識ステップ(S100)において、ユーザの発話を検出
し、マイクロフォンや電話等の音声入出力装置(700)を
通して音声が取り込まれ、A/D変換、音響分析を行なっ
た後、分析結果と記憶装置(400)に記録されているモデ
ルとの類似度の計算など音声認識処理をCPU(200)で行な
い、その結果を表示装置(300)に表示する。
When the user utters the information to be input, in a voice recognition step (S100), the utterance of the user is detected, the voice is taken in through a voice input / output device (700) such as a microphone or a telephone, and A / D conversion is performed. After performing acoustic analysis, the CPU (200) performs speech recognition processing such as calculation of the similarity between the analysis result and the model recorded in the storage device (400), and displays the result on the display device (300). I do.

【0028】認識結果判定ステップ(S200)において、認
識結果が正解と判断された場合はその情報入力を終了す
る。
In the recognition result determination step (S200), if the recognition result is determined to be correct, the information input is terminated.

【0029】認識結果判定ステップ(S200)において、認
識結果が誤りと判定された場合は、発話回数検出ステッ
プ(S300)に進む。
If it is determined in the recognition result determination step (S200) that the recognition result is erroneous, the process proceeds to the number-of-utterances detection step (S300).

【0030】発話回数検出ステップ(S300)では発話回数
を検出する。発話回数は、情報の入力位置(項目)が切
り替った時、及びS200で正解と判断された時を0と
設定し、発話を検出する度に回数をインクリメントす
る。S300で検出した発話回数が予め定めた閾値未満
のときは、音声認識ステップ(S100)で再度のユーザの発
話に待機する。
In the utterance count detecting step (S300), the utterance count is detected. The number of utterances is set to 0 when the information input position (item) is switched and when it is determined to be correct in S200, and the number of utterances is incremented each time an utterance is detected. If the number of utterances detected in S300 is less than the predetermined threshold, the process waits for another user utterance in the voice recognition step (S100).

【0031】発話回数検出ステップ(S300)において、発
話回数が閾値に達した場合は入力方法提示・決定ステッ
プ(S400)に進む。
In the utterance count detection step (S300), if the utterance count has reached the threshold value, the flow proceeds to the input method presentation / decision step (S400).

【0032】入力情報提示・決定ステップでは情報入力
方式において可能な入力方法を図5に示すようなウイン
ドウで表示装置(300)に示し、ユーザの指示により選択
された入力方法に切替える。
In the input information presenting / deciding step, possible input methods in the information input method are shown on the display device (300) in a window as shown in FIG. 5, and are switched to the input method selected by a user's instruction.

【0033】ユーザがキーボード入力を指示した場合は
キーボード入力ステップ(S500)に進み、マウスやタッチ
パネルやライトペンなどポインティングデバイスによる
入力を選択した場合はポインティングデバイス入力ステ
ップ(S501)に進む。
When the user instructs a keyboard input, the process proceeds to a keyboard input step (S500). When the user selects an input using a pointing device such as a mouse, a touch panel, or a light pen, the process proceeds to a pointing device input step (S501).

【0034】キーボード入力ステップ(S500)ではユーザ
がキーボード(500)を用いて入力する、S100で正し
く認識されなかった情報の入力を受け付け、ポインティ
ングデバイス入力ステップ(S501)ではユーザがポインテ
ィングデバイス(600)を用いて表示装置(300)の表
示画面上で指示する情報入力を受け付ける。
In the keyboard input step (S500), the user receives an input of information not correctly recognized in S100, which is input by the user using the keyboard (500). In the pointing device input step (S501), the user inputs the information to the pointing device (600). Is used to accept information input on the display screen of the display device (300).

【0035】入力が終了したら情報入力を終了し、音声
が入力される度にS100〜S501を繰り返す。
When the input is completed, the information input is terminated, and S100 to S501 are repeated each time a voice is input.

【0036】認識結果判定ステップ(200)における判定
を詳細に説明すると、例えば、図3に示すようなウイン
ドウを表示装置(300)上に表示し、S100で得た認識
結果(図3の例では「東京」)をユーザに報知する。こ
れに対してキーボード(500)で'y'が押されれば正解と
し、'n'が押されれば誤りと判定する。また、図4に示
すように、「はい」か「いいえ」の選択をポインティン
グデバイス600により行うようにしても良い。
The determination in the recognition result determination step (200) will be described in detail. For example, a window as shown in FIG. 3 is displayed on the display device (300), and the recognition result obtained in S100 (in the example of FIG. 3, "Tokyo") to the user. On the other hand, if 'y' is pressed on the keyboard (500), the answer is correct, and if 'n' is pressed, it is determined to be incorrect. Further, as shown in FIG. 4, selection of “Yes” or “No” may be performed by the pointing device 600.

【0037】S400で提示され、選択される入力方法
として、図2のフローチャートではキーボードとポイン
ティングデバイス(マウス)の例について述べたが、そ
の他の入力方法として、タッチパネル、ライトペン、音
声(認識処理を行わずに音声データそのものを記憶す
る)、画像(スキャナによる原稿の読み取り等)等が考
えられる。また、入力方法の選択方法としては、図5に
示すようなウインドウ上での指示の他に、選択する入力
手段(例えば音声入力用マイクロフォン、画像入力用ス
キャナ等)のスイッチをONにすることにより、これを
選択信号として判断しても良い。
As an input method presented and selected in S400, an example of a keyboard and a pointing device (mouse) has been described in the flowchart of FIG. 2, but as other input methods, a touch panel, a light pen, a voice (recognition processing is performed). Without storing the audio data itself), an image (reading a document by a scanner, etc.), and the like. As a method of selecting an input method, in addition to an instruction on a window as shown in FIG. 5, by turning on a switch of an input means to be selected (for example, a microphone for image input, a scanner for image input, or the like). , May be determined as a selection signal.

【0038】図2のフローチャートにおける認識結果判
定ステップ(S200)において、音声認識ステップ(S100)で
認識結果を表示した後、例えばマウス(ポインティング
デバイス(600)をクリックするとかキーボード(500)を打
鍵するなど、ユーザが発話以外の入力を行なった場合に
認識結果を正解と判定し、認識結果表示後に再度発話が
検出された場合は誤りと判定しても良い。
In the recognition result judging step (S200) in the flowchart of FIG. 2, after displaying the recognition result in the voice recognition step (S100), for example, clicking the mouse (pointing device (600) or hitting the keyboard (500)) For example, the recognition result may be determined to be correct when the user performs an input other than the utterance, and the utterance may be determined to be incorrect if the utterance is detected again after the recognition result is displayed.

【0039】図2のフローチャートにおける発話回数検
出ステッププ(S300)において、発話回数の計数方法とし
て、過去に発話された発話を比較し(例えば音声の波形
が似ているもの、或は発話の長さが近いもの)、内容が
同じものを識別してこれらの発話回数だけを数える方法
がある。例えば、ユーザが、 1回目: 東京都 2回目: 東京都 3回目: 東京 4回目: 東京都 のように4回発声し、4回の発話に対する認識結果判定ス
テップが全て誤りだった時に、発話回数検出ステップ(S
300)で検出される発話回数はこの方法では3回となる
(先にS300で説明した方法の場合、上記例では発話
回数は4回と判断される)。
In the utterance count detection step (S300) in the flowchart of FIG. 2, utterances that have been uttered in the past are compared (for example, those having similar speech waveforms or the length of utterances). There is a method of identifying those having the same contents and counting only the number of utterances. For example, when the user utters four times as in the first time: Tokyo second time: Tokyo third time: Tokyo fourth time: Tokyo, and the recognition result determination step for the four utterances is all incorrect, the number of utterances Detection step (S
The number of utterances detected in (300) is three in this method (in the case of the method described earlier in S300, the number of utterances is determined to be four in the above example).

【0040】また発話回数検出ステッププ(S300)におい
て、発話回数の計数方法として、過去の発話のうち認識
結果が同じものだけを数える方法がある。例えば、ユー
ザが、 のように5回発声し、5回の発話に対する認識結果判定ス
テッププ(S200)が全て誤りだった時に、発話回数検出ス
テップ(S300)で検出される発話回数は3回となる。
In the step of detecting the number of utterances (S300), there is a method of counting the number of utterances in the past utterances in which only those having the same recognition result are counted. For example, if the user And the recognition result determination step (S200) for all five utterances is incorrect, the number of utterances detected in the utterance number detection step (S300) is three.

【0041】図2のフローチャートにおける入力方法提
示・決定ステップ(S400) において、あらかじめ切替え
る入力方法を決めておき、入力方法提示・決定ステップ
(S400) では、ユーザにより決められている入力方法へ
強制的に変更することを表示装置(300)上で通知し、自
動的に決められた入力方法に切替えても良い。
In the input method presenting / determining step (S400) in the flowchart of FIG. 2, an input method to be switched is determined in advance, and the input method presenting / determining step is performed.
In (S400), it may be notified on the display device (300) that the input method is forcibly changed to the input method determined by the user, and the input method may be automatically switched to the determined input method.

【0042】S200で正解と判断された結果は、音声
入力時に選択されていた入力枠(項目)位置に文字列と
して表示され、その項目と関連づけて記憶される。
The result determined to be correct in S200 is displayed as a character string at the position of the input frame (item) selected at the time of voice input, and stored in association with the item.

【0043】また、S500やS501等の他の入力方
法で情報が入力された場合も、それらの情報は、音声入
力時に選択されていた入力枠(項目)位置に表示され、
記憶される。
Also, when information is input by another input method such as S500 or S501, the information is displayed at the position of the input frame (item) selected at the time of voice input.
It is memorized.

【0044】[0044]

【発明の効果】以上説明したように、本発明によれば、
入力音声を認識し、前記認識結果の正誤を判断し、前記
認識結果が誤っているとの判断がなされた音声の発声回
数を計数し、前記計数した発声回数が閾値に達している
か否かを判断し、前記発声回数が閾値に達していると判
断された場合に、入力方法の切り替えを提示することに
より、発話による情報入力から他の方法での情報入力へ
の切り替えのタイミングを適切なタイミングで行うの
で、ユーザがする状況判断や配慮を少なくすることがで
き、ユーザの労力を軽減することが可能となる。
As described above, according to the present invention,
Recognize the input voice, determine whether the recognition result is correct or incorrect, count the number of utterances of the voice for which the recognition result is determined to be incorrect, and determine whether the counted number of utterances reaches a threshold. Judgment, when it is determined that the number of utterances has reached the threshold value, by presenting the switching of the input method, the timing of switching from the information input by utterance to the information input by another method is set to an appropriate timing. Therefore, it is possible to reduce the situation judgment and consideration performed by the user, and it is possible to reduce the user's labor.

【0045】以上説明したように、本発明によれば、前
記入力音声の認識の結果を報知し、前記報知した結果に
対する正誤の指示を入力し、前記入力した指示を、前記
認識結果の正誤の判断とすることにより、認識結果の正
誤の判断を確実に行うことができる。
As described above, according to the present invention, the result of recognition of the input voice is reported, a correct / incorrect instruction for the reported result is input, and the input instruction is used to determine whether the recognition result is correct or incorrect. By making the determination, it is possible to reliably determine whether the recognition result is correct or not.

【0046】以上説明したように、本発明によれば、前
記発声回数は、前記認識が行われた入力音声の個数とす
ることにより、ユーザの発話回数を正確に把握すること
が出来る。
As described above, according to the present invention, the number of utterances of the user can be accurately grasped by setting the number of utterances to the number of input voices recognized.

【0047】以上説明したように、本発明によれば、前
記発声回数は、前記認識結果が同じ音声の個数とするこ
とにより、認識結果の特徴を元に発声回数を把握するこ
とが出来る。
As described above, according to the present invention, the number of utterances can be grasped based on the feature of the recognition result by setting the number of utterances to the number of voices having the same recognition result.

【0048】以上説明したように、本発明によれば、前
記発声回数は、前記認識が行われた入力音声の内、音声
の波形が類似しているものの個数とすることにより、同
じ発声がなされた回数を計数することができる。
As described above, according to the present invention, the same utterance is made by setting the number of utterances to the number of input voices having similar waveforms among the recognized input voices. Can be counted.

【0049】以上説明したように、本発明によれば、前
記発声回数は、前記認識が行われた入力音声の内、音声
の長さが類似しているものの個数とすることにより、簡
単な処理で同じ発声がなされた回数を計数することが出
来る。
As described above, according to the present invention, the number of utterances is set to the number of input voices having similar lengths among the recognized input voices. The number of times the same utterance is made can be counted.

【0050】以上説明したように、本発明によれば、前
記発声回数は、前記入力音声の認識結果を入力する項目
ごとに計数することにより、入力方法の切り替えタイミ
ングをより正確に判断することが出来る。
As described above, according to the present invention, it is possible to more accurately determine the switching timing of the input method by counting the number of utterances for each input item of the recognition result of the input voice. I can do it.

【0051】以上説明したように、本発明によれば、前
記発声回数は、前記認識結果が正しいと判断された後の
回数を計数することにより、入力方法の切り替えのタイ
ミングをより正確に判断することが出来る。
As described above, according to the present invention, the number of utterances can be determined more accurately by counting the number of times after the recognition result is determined to be correct, thereby switching the input method. I can do it.

【0052】以上説明したように、本発明によれば、前
記閾値は、前記入力音声の認識結果を入力する項目ごと
に変更することにより、入力方法を切り替えるのが適切
である発声回数の管理を適切に行うことが出来る。
As described above, according to the present invention, the threshold value is changed for each item to which the recognition result of the input voice is input, thereby managing the number of utterances at which it is appropriate to switch the input method. Can be done properly.

【0053】前記正しいと判断された認識結果を、表示
手段に表示することにより、認識結果を確実に把握する
ことが出来る。
By displaying the recognition result determined to be correct on the display means, the recognition result can be grasped reliably.

【0054】以上説明したように、本発明によれば、前
記発声回数が閾値に達していると判断された場合に、切
り替え可能な入力方法を表示画面に表示することによ
り、切り替え可能な入力方法の確認を確実に行え、ま
た、それに対する選択指示を容易かつ確実に行える。
As described above, according to the present invention, when it is determined that the number of utterances has reached the threshold value, the switchable input method is displayed on the display screen, whereby the switchable input method is displayed. Can be surely confirmed, and a selection instruction can be easily and reliably performed.

【0055】以上説明したように、本発明によれば、前
記入力方法の切り替えの提示に対して指示された入力方
法により入力された情報を、前記入力音声の認識結果を
入力すべく選択されていた項目に対応付けて記憶するこ
とにより、入力方法を切り替えた後でも目的とする位置
への情報の入力を連続的に行うことが出来る。
As described above, according to the present invention, the information input by the input method instructed to the presentation of the switching of the input method is selected to input the recognition result of the input voice. By storing the information in association with the items, the information can be continuously input to the target position even after the input method is switched.

【0056】以上説明したように、本発明によれば、音
声認識以外の入力装置の電源ONの信号を検知し、前記
電源ONの信号を前記入力方法の切り替えの提示に対す
る入力方法の選択指示と判断することにより、新たな入
力方法の装置の電源投入と、選択指示動作を簡略にする
ことが出来る。
As described above, according to the present invention, a power-on signal of an input device other than voice recognition is detected, and the power-on signal is input to the input method selection instruction in response to the input method switching presentation. By making the determination, it is possible to simplify the power-on of the device using the new input method and the selection instruction operation.

【0057】以上説明したように、本発明によれば、前
記切り替え可能な入力方法は、キーボードとすることに
より、より確実に情報を入力することが出来る。
As described above, according to the present invention, the switchable input method is a keyboard so that information can be input more reliably.

【0058】以上説明したように、本発明によれば、前
記切り替え可能な入力方法は、ポインティングデバイス
とすることにより、容易に確実な情報を入力することが
出来る。
As described above, according to the present invention, when the switchable input method is a pointing device, reliable information can be input easily.

【0059】以上説明したように、本発明によれば、前
記切り替え可能な入力方法は、タッチパネルとすること
により、簡単な操作で確実な情報を入力することが出来
る。以上説明したように、本発明によれば、前記切り替
え可能な入力方法は、ライトペンとすることにより、容
易に確実な情報を入力することが出来る。
As described above, according to the present invention, the switchable input method is a touch panel, so that reliable information can be input by a simple operation. As described above, according to the present invention, when the switchable input method is a light pen, reliable information can be easily input.

【0060】以上説明したように、本発明によれば、前
記切り替え可能な入力方法は、音声入力とすることによ
り、入力方法の切り替えによるユーザの負担がなく、か
つ確実に情報を入力することが出来る。
As described above, according to the present invention, the switchable input method is a voice input, so that there is no burden on the user due to the switching of the input method, and the information can be input reliably. I can do it.

【0061】以上説明したように、本発明によれば、前
記切り替え可能な入力方法は、画像入力とすることによ
り、多くの情報を容易でかつ確実に入力することが出来
る。
As described above, according to the present invention, the switchable input method is an image input, so that much information can be input easily and reliably.

【0062】以上説明したように、本発明によれば、入
力音声を認識し、前記認識結果の正誤を判断し、前記認
識結果が誤っているとの判断がなされた音声の発声回数
を計数し、前記発声回数が閾値に達した時に、入力方法
を音声認識以外の方法に切り替えることにより、無為な
発話を繰り返させることなく、かつ入力方法の切り替え
指示操作を不要とするので、よりユーザにとって使いや
すい情報入力環境を提供することを可能とする。
As described above, according to the present invention, the input speech is recognized, the correctness of the recognition result is determined, and the number of utterances of the voice determined to be incorrect is counted. By switching the input method to a method other than voice recognition when the number of utterances reaches the threshold, the user does not needlessly repeat utterances and does not need to perform an input method switching instruction operation. It is possible to provide an easy information input environment.

【0063】以上説明したように、本発明によれば、前
記切り替える音声認識以外の方法は、予め設定された方
法とすることにより、ユーザ個々に適した入力方法への
自動切換えを可能とし、操作性を向上させることが出来
る。
As described above, according to the present invention, the method other than the voice recognition to be switched is a preset method, thereby enabling automatic switching to an input method suitable for each user. Properties can be improved.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明に関わる情報処理装置のブロック図。FIG. 1 is a block diagram of an information processing apparatus according to the present invention.

【図2】本発明に関わる情報入力方法のフローチャー
ト。
FIG. 2 is a flowchart of an information input method according to the present invention.

【図3】認識結果確認用のウインドウ例示図1。FIG. 3 is an exemplary diagram 1 of a window for confirming a recognition result.

【図4】認識結果確認用のウインドウ例示図2。FIG. 4 is an exemplary diagram 2 of a window for confirming a recognition result.

【図5】入力方法選択用のウインドウ例示図。FIG. 5 is an exemplary view of a window for selecting an input method.

Claims (24)

【特許請求の範囲】[Claims] 【請求項1】 入力音声を認識し、前記認識結果の正誤
を判断し、前記認識結果が誤っているとの判断がなされ
た音声の発声回数を計数し、前記計数した発声回数が閾
値に達しているか否かを判断し、前記発声回数が閾値に
達していると判断された場合に、入力方法の切り替えを
提示することを特徴とする情報処理方法。
An input voice is recognized, the correctness of the recognition result is determined, and the number of voices of voice determined to be incorrect is counted, and the counted number of voices reaches a threshold. An information processing method characterized by determining whether or not the number of utterances has reached a threshold, and presenting a switch of an input method.
【請求項2】 前記入力音声の認識の結果を報知し、前
記報知した結果に対する正誤の指示を入力し、前記入力
した指示を、前記認識結果の正誤の判断とすることを特
徴とする請求項1に記載の情報処理方法。
2. The method according to claim 1, wherein a result of the recognition of the input voice is notified, a correct / incorrect instruction for the notified result is input, and the input instruction is used to determine whether the recognition result is correct or incorrect. The information processing method according to 1.
【請求項3】 前記発声回数は、前記認識が行われた入
力音声の個数とすることを特徴とする請求項1に記載の
情報処理方法。
3. The information processing method according to claim 1, wherein the number of utterances is the number of input voices for which the recognition has been performed.
【請求項4】 前記発声回数は、前記認識結果が同じ音
声の個数とすることを特徴とする請求項1に記載の情報
処理方法。
4. The information processing method according to claim 1, wherein the number of utterances is the number of voices having the same recognition result.
【請求項5】 前記発声回数は、前記認識が行われた入
力音声の内、音声の波形が類似しているものの個数とす
ることを特徴とする請求項1に記載の情報処理方法。
5. The information processing method according to claim 1, wherein the number of utterances is the number of input voices having similar waveforms among the recognized input voices.
【請求項6】 前記発声回数は、前記認識が行われた入
力音声の内、音声の長さが類似しているものの個数とす
ることを特徴とする請求項1に記載の情報処理方法。
6. The information processing method according to claim 1, wherein the number of utterances is the number of input voices having similar lengths among the input voices subjected to the recognition.
【請求項7】 前記発声回数は、前記入力音声の認識結
果を入力する項目ごとに計数することを特徴とする請求
項1に記載の情報処理方法。
7. The information processing method according to claim 1, wherein the number of utterances is counted for each input item of the recognition result of the input voice.
【請求項8】 前記発声回数は、前記認識結果が正しい
と判断された後の回数を計数することを特徴とする請求
項1に記載の情報処理方法。
8. The information processing method according to claim 1, wherein the number of times of utterance counts the number of times after the recognition result is determined to be correct.
【請求項9】 前記閾値は、前記入力音声の認識結果を
入力する項目ごとに変更することを特徴とする請求項1
に記載の情報処理方法。
9. The method according to claim 1, wherein the threshold value is changed for each item for inputting a recognition result of the input voice.
An information processing method according to claim 1.
【請求項10】 前記発声回数が閾値に達していると判
断された場合に、切り替え可能な入力方法を表示画面に
表示することを特徴とする請求項1に記載の情報処理方
法。
10. The information processing method according to claim 1, wherein a switchable input method is displayed on a display screen when it is determined that the number of utterances has reached a threshold.
【請求項11】 前記入力方法の切り替えの提示に対し
て指示された入力方法により入力された情報を、前記入
力音声の認識結果を入力すべく選択されていた項目に対
応付けて記憶することを特徴とする請求項1に記載の情
報処理方法。
11. A method of storing information input by an input method instructed for presentation of switching of the input method, in association with an item selected to input a recognition result of the input voice. 2. The information processing method according to claim 1, wherein:
【請求項12】 音声認識以外の入力装置の電源ONの
信号を検知し、前記電源ONの信号を前記入力方法の切
り替えの提示に対する入力方法の選択指示と判断するこ
とを特徴とする請求項1に記載の情報処理方法。
12. A power-on signal of an input device other than voice recognition is detected, and the power-on signal is determined as an input method selection instruction in response to presentation of the input method switching. An information processing method according to claim 1.
【請求項13】 前記切り替え可能な入力方法は、キー
ボードとすることを特徴とする請求項1に記載の情報処
理方法。
13. The information processing method according to claim 1, wherein the switchable input method is a keyboard.
【請求項14】 前記切り替え可能な入力方法は、ポイ
ンティングデバイスとすることを特徴とする請求項1に
記載の情報処理方法。
14. The information processing method according to claim 1, wherein the switchable input method is a pointing device.
【請求項15】 前記切り替え可能な入力方法は、タッ
チパネルとすることを特徴とする請求項1に記載の情報
処理方法。
15. The information processing method according to claim 1, wherein the switchable input method is a touch panel.
【請求項16】 前記切り替え可能な入力方法は、ライ
トペンとすることを特徴とする請求項1に記載の情報処
理方法。
16. The information processing method according to claim 1, wherein the switchable input method is a light pen.
【請求項17】 前記切り替え可能な入力方法は、音声
入力とすることを特徴とする請求項1に記載の情報処理
方法。
17. The information processing method according to claim 1, wherein the switchable input method is a voice input.
【請求項18】 前記切り替え可能な入力方法は、画像
入力とすることを特徴とする請求項1に記載の情報処理
方法。
18. The information processing method according to claim 1, wherein the switchable input method is an image input.
【請求項19】 入力音声を認識し、前記認識結果の正
誤を判断し、前記認識結果が誤っているとの判断がなさ
れた音声の発声回数を計数し、前記発声回数が閾値に達
した時に、入力方法を音声認識以外の方法に切り替える
ことを特徴とする情報処理方法。
19. Recognizing an input voice, judging correctness of the recognition result, counting the number of utterances of the voice for which the recognition result is determined to be incorrect, and when the number of utterances reaches a threshold value. An information processing method characterized by switching an input method to a method other than speech recognition.
【請求項20】 前記切り替える音声認識以外の方法
は、予め設定された方法とすることを特徴とする請求項
19に記載の情報処理方法。
20. The method other than the switching voice recognition is a method set in advance.
20. The information processing method according to 19.
【請求項21】 入力音声を認識する認識手段と、前記
認識結果の正誤を判断する正誤判断手段と、前記認識結
果が誤っているとの判断がなされた音声の発声回数を計
数する計数手段と、前記計数した発声回数が閾値に達し
ているか否かを判断する判断手段と、前記発声回数が閾
値に達していると判断された場合に、入力方法の切り替
えを提示する切り替え提示手段とを有することを特徴と
する情報処理装置。
21. Recognizing means for recognizing an input voice, correctness determining means for determining whether the recognition result is correct, and counting means for counting the number of utterances of the voice for which the recognition result is determined to be incorrect. Determining means for determining whether or not the counted number of utterances has reached a threshold, and switching presenting means for presenting switching of an input method when it is determined that the number of utterances has reached a threshold. An information processing apparatus characterized by the above-mentioned.
【請求項22】 入力音声を認識する認識手段と、前記
認識結果の正誤を判断する正誤判断手段と、前記認識結
果が誤っているとの判断がなされた音声の発声回数を計
数する計数手段と、前記発声回数が閾値に達した時に、
入力方法を音声認識以外の方法に切り替える切り替え手
段とを有することを特徴とする情報処理装置。
22. Recognizing means for recognizing an input voice, correctness / incorrectness determining means for determining whether the recognition result is correct, and counting means for counting the number of utterances of a voice for which the recognition result is determined to be incorrect. , When the number of utterances reaches a threshold,
An information processing apparatus, comprising: switching means for switching an input method to a method other than speech recognition.
【請求項23】 コンピュータが読み取り可能な記憶媒
体であって、入力音声を認識する工程と、前記認識結果
の正誤を判断する工程と前記認識結果が誤っているとの
判断がなされた音声の発声回数を計数する工程と、前記
計数した発声回数が閾値に達しているか否かを判断する
工程と、前記発声回数が閾値に達していると判断された
場合に、入力方法の切り替えを提示する工程のプログラ
ムを記憶した記憶媒体。
23. A computer-readable storage medium, comprising: a step of recognizing an input voice; a step of determining whether the recognition result is correct; and a step of uttering a voice in which the recognition result is determined to be incorrect. Counting the number of times, determining whether the counted number of utterances has reached a threshold, and presenting a switching of the input method when it is determined that the number of utterances has reached a threshold. Storage medium that stores the program of.
【請求項24】 コンピュータが読み取り可能な記憶媒
体であって、入力音声を認識する工程と、前記認識結果
の正誤を判断する工程と、前記認識結果が誤っていると
の判断がなされた音声の発声回数を計数する工程と、前
記発声回数が閾値に達した時に、入力方法を音声認識以
外の方法に切り替える工程のプログラムを記憶した記憶
媒体。
24. A storage medium readable by a computer, comprising: a step of recognizing an input voice; a step of determining whether the recognition result is correct; and a step of determining whether the recognition result is incorrect. A storage medium storing a program for counting the number of utterances, and for switching an input method to a method other than voice recognition when the number of utterances reaches a threshold value.
JP33074096A 1996-12-11 1996-12-11 Information processing method and apparatus, and storage medium Expired - Fee Related JP3624064B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP33074096A JP3624064B2 (en) 1996-12-11 1996-12-11 Information processing method and apparatus, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP33074096A JP3624064B2 (en) 1996-12-11 1996-12-11 Information processing method and apparatus, and storage medium

Publications (2)

Publication Number Publication Date
JPH10171493A true JPH10171493A (en) 1998-06-26
JP3624064B2 JP3624064B2 (en) 2005-02-23

Family

ID=18236037

Family Applications (1)

Application Number Title Priority Date Filing Date
JP33074096A Expired - Fee Related JP3624064B2 (en) 1996-12-11 1996-12-11 Information processing method and apparatus, and storage medium

Country Status (1)

Country Link
JP (1) JP3624064B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7177806B2 (en) 2001-11-28 2007-02-13 Fujitsu Limited Sound signal recognition system and sound signal recognition method, and dialog control system and dialog control method using sound signal recognition system
US9899023B2 (en) 2014-10-17 2018-02-20 Hyundai Motor Company Audio video navigation device, vehicle and method for controlling the audio video navigation device

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7177806B2 (en) 2001-11-28 2007-02-13 Fujitsu Limited Sound signal recognition system and sound signal recognition method, and dialog control system and dialog control method using sound signal recognition system
US9899023B2 (en) 2014-10-17 2018-02-20 Hyundai Motor Company Audio video navigation device, vehicle and method for controlling the audio video navigation device

Also Published As

Publication number Publication date
JP3624064B2 (en) 2005-02-23

Similar Documents

Publication Publication Date Title
US8249870B2 (en) Semi-automatic speech transcription
JP5756555B1 (en) Utterance evaluation apparatus, utterance evaluation method, and program
JP2001265326A (en) Performance position detecting device and score display device
CN109545184B (en) Recitation detection method based on voice calibration and electronic equipment
JPWO2016103988A1 (en) Information processing apparatus, information processing method, and program
JP2003345487A (en) Operation assistance method, operation assistance device, program and medium storing program
JP5025261B2 (en) System for correcting speech recognition results with confidence level indications
US10770077B2 (en) Electronic device and method
CN111077996B (en) Information recommendation method and learning device based on click-to-read
JP2002132287A (en) Speech recording method and speech recorder as well as memory medium
JP2020095210A (en) Minutes output device and control program for minutes output device
CN117292688B (en) Control method based on intelligent voice mouse and intelligent voice mouse
JP6914724B2 (en) Information processing equipment, information processing methods and programs
JPH10171493A (en) Method of processing information, device and recording medium therefor
JP6710893B2 (en) Electronics and programs
JP3664499B2 (en) Voice information processing method and apparatus
CN111953860B (en) Scanning method, scanning device, scanning pen and storage medium
JPH10222049A (en) Study authorization device and method therefor
JPH0944600A (en) Method and device for input character prediction in on-line character recognition
JP4229627B2 (en) Dictation device, method and program
CN111540378A (en) Audio detection method, device and storage medium
JPH11110379A (en) Method and device for retrieving information
JP2002268683A (en) Method and device for information processing
JP3668657B2 (en) Pattern recognition device and method, pattern registration device and method
CN109326303A (en) Voice separation method and system

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040629

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040830

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20041116

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20041129

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081203

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091203

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091203

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101203

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111203

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees