JPH0437997B2 - - Google Patents

Info

Publication number
JPH0437997B2
JPH0437997B2 JP57227706A JP22770682A JPH0437997B2 JP H0437997 B2 JPH0437997 B2 JP H0437997B2 JP 57227706 A JP57227706 A JP 57227706A JP 22770682 A JP22770682 A JP 22770682A JP H0437997 B2 JPH0437997 B2 JP H0437997B2
Authority
JP
Japan
Prior art keywords
recognition
signal
voice
reliability
sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP57227706A
Other languages
English (en)
Other versions
JPS59121097A (ja
Inventor
Teruhiko Ukita
Hidenori Shinoda
Yoichi Takebayashi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Tokyo Shibaura Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tokyo Shibaura Electric Co Ltd filed Critical Tokyo Shibaura Electric Co Ltd
Priority to JP57227706A priority Critical patent/JPS59121097A/ja
Publication of JPS59121097A publication Critical patent/JPS59121097A/ja
Publication of JPH0437997B2 publication Critical patent/JPH0437997B2/ja
Granted legal-status Critical Current

Links

Description

【発明の詳細な説明】 〔発明の技術分野〕 本発明は信号音に同期して発声された入力音声
を効果的に、且つ信頼性良く認識することのでき
る音声認識装置に関する。
〔発明の技術的背景とその問題点〕
近時、音声認識技術の発達が目覚ましく、孤立
発声された音声を高い精度で認識する音声認識装
置や、単音節毎に区切つて発声された音声を入力
とする音声タイプライター等が一部で実用化され
るに至つている。ところで、上記の単語音声認識
装置の場合、発声された1音のみを認識すればよ
いわけではなく、1音の認識が終了したときには
速やかに次の1音の認識処理を行うことが必要で
ある。そこで従来では、例えば「ピー」といつた
信号音を1音認識終了毎に出力し、この信号音に
同期して次の1音の発声入力を促すことが行なわ
れている。また音声タイプライターにあつては、
連続発声された音節を取扱うので、セグメンテー
シヨンの問題を緩和するべく、上記信号音を所定
の周期で出力し、音声発声のタイミングを指示す
る等の工夫が施されている。従つて発声者は上記
信号音をモニタし、これに同期して音声を発声す
ればよいことになる。
さて、従来一般的な音声認識装置にあつては、
入力音声の認識結果を上記装置に付随して設けら
れたCRTキヤラクタデイスプレイ等の表示装置
を用いて表示することが行われている。この為、
その認識結果を確認する為には、発声者がこれを
目視する必要があり、高速性等の音声入力方式の
利点が著しく損われていた。このような不具合を
解消するべく、特開昭56−138799号公報等には、
「ピツ」「ブー」なる2つの信号音を準備し、信号
音に同期して入力された音声が正しく認識された
か否かによつて上記信号音を異ならせることが開
示されている。このような手段によれば、認識で
きなかつた音声の再入力を促すことができる等の
効果が得られる。然し乍ら、このままでは、どの
ように発声すれば正しく音声認識されるかが不明
であり、誤りを未然に防ぐことを殆んど期待する
ことができないと云う問題がある。
〔発明の目的〕
本発明はこのような事情を考慮してなされたも
ので、その目的とするところは、入力音声の認識
状況を発声者に対して簡易に知らしめ、認識誤り
を未然に、且つ効果的に防ぐことができ、音声入
力の高速化を図り得る実用性の高い音声認識装置
を提供することにある。
〔発明の概要〕
上記目的を達成するために、本発明に係る音声
認識装置では、音声の入力を促す信号音を出力す
る手段と、上記信号音に同期して発声入力された
音声信号を認識処理する手段と、この手段によつ
て現時点において行われた認識処理による認識信
頼度と現時点より一定の認識処理回数分だけ遡つ
た期間内に行われた認識処理による認識信頼度と
を平均した平均認識信頼度に対応させて前記信号
音の出力形態を可変する出力形態可変手段とを備
えている。
〔発明の効果〕
かくして本発明によれば、入力した音声の認識
状況、つまり認識信頼度を信号音の変化として発
声者に知らせ、正しい発声を促すようにしている
ので、誤つた認識を未然に防ぎ、音声入力の高速
化を図ることが可能となる。特に、現時点におい
て行われた認識処理による認識信頼度と現時点よ
り一定の認識処理回数分だけ遡つた期間内に行わ
れた認識処理による認識信頼度とを平均した平均
認識信頼度に対応させて前記信号音の出力形態を
可変するようにしているので、長い時間に亘つて
音声を入力するような場合に、発声傾向が時間の
経過にしたがつてどのように変化しているかを発
声者に知らせることができ、この結果、信号音で
入力を催促するときに起こり易い発声者の戸惑い
を緩和できるので、使い易さを向上させることが
できる。しかも、認識信頼度、例えば音声認識処
理過程における類似度計算結果等を利用して信号
音を可変するだけでよいので、その制御が容易で
あり、実用性が高い等の効果が奏せられる。
〔発明の実施例〕
以下、図面を参照して本発明の一実施例につき
説明する。
第1図a〜cは、所定の周期で出力され、音声
の発声入力を促す信号音aと、この信号音に同期
して発声入力される音声のパワーbと、上記音声
の認識処理における類似度cとの関係を示すもの
である。ここでは、信号音に同期して「オ、ン、
セ、イ、ニ、ン、シ、キ」なる音声を発声入力し
たときの音声パワー変化が示される。
第2図は実施例装置の概略構成図であり、1は
音声認識部である。この音声認識部1は、例えば
入力音声を分析してその音声特徴パラメータを求
め、辞書登録された標準音声パターンとのパター
ンマツチングを、例えば類似度計算して行い、そ
の類似度値に従つて上記入力音声を認識するもの
である。この場合、上記認識の信頼度は、認識処
理過程で求められる類似度値や、類似度の大なる
順に求められる第1位と第2位との類似度差等に
よつて表わされる。しかして、この信頼度の情報
は、1音認識の都度シフトレジスタ2に格納され
る。類似度平均化回路3は、シフトレジスタ2に
格納された過去数サンプルの信頼度(類似度値)
を得てこれを平均化処理し、音声認識の状況を判
定している。このようにして求められた認識状況
を示す信頼度の情報が制御データとしてレジスタ
4に格納される。
信号音発生回路5は、前記音声認識部1が入力
音声の1音の認識処理を終了する都度出力する信
号を受けて、発声者の次の1音の発声入力を促す
信号音を発生するものである。そして、この信号
音の出力形態は、前記レジスタ4に格納された制
御データに従つて可変されるようになつている。
しかして上記信号音の出力形態の制御は次のよ
うにして行われる。即ち信号音は、例えば第3図
に示すように、認識結果の信頼度が或る閾値Th
以上であり、正確な音声認識が行われているとき
には一定周波数に制御されるようになつている。
そして、上記音声認識の信頼性が高くなる程、そ
の周波数を低下させる等して、信号音周波数が信
頼度に対応するように可変制御される。尚、この
信号音の制御を、例えば第4図に示すように、信
頼度に応じて信号音の振幅や出力時間幅を変える
等して行つてもよい。更には、信号音出力波形を
歪ませて信頼度の低下を表わすようにしてもよ
い。具体的には、信頼度0.1〜1.0に対応して、信
号音の周波数を2000Hz〜1000Hzの幅で変化させれ
ば、その認識を容易に行い得る。
このようにして、音声認識の信頼度に応じて信
号音の形態が可変制御される本装置によれば、発
声者は信号音に同期して発声するに際して、今ま
での発声の仕方が装置にとつて認識し易いもので
あつたか否かを容易に知ることができ、音声の発
声入力の仕方を工夫して装置が認識し易い音声を
即時的に入力することが可能となる。そして、装
置ではこれを信頼度良く、確実に認識することが
可能となる。これ故、誤認識を効果的に未然に防
ぎ、高速に且つ効率の良い音声入力を行わしめる
ことが可能となる。しかも、従来の認識がなされ
たか否かの信号音情報とは異なつて、認識状況が
知らしめられるので、高い認識精度を得るべく発
声の工夫を施すことが容易となり、不安定な認識
判定処理を回避することが可能となる。そして、
上述したように、信号音の出力形態の可変制御も
簡単であるから、装置を容易に、且つ安価に製作
できる等の効果が奏せられる。
尚、本発明は上記実施例に限定されるものでは
ない。例えば信頼度に応じて信号音を何段階かに
分けて可変制御することも可能である。また信頼
度の情報としては、音声の認識処理に用いられる
他の判断要素を用いてもよく、これを写像して信
頼度とすることも可能である。要するに本発明は
その要旨を逸脱しない範囲で種々変形して実施す
ることができる。
【図面の簡単な説明】
第1図は信号音と入力音声とその認識結果の信
頼度との関係を示す図、第2図は本発明の一実施
例装置の概略構成図、第3図および第4図はそれ
ぞれ信号音の出力形態と信頼度との関係を示す図
である。 1……音声認識部、2……レジスタ、3……類
似度平均化回路、4……レジスタ、5……信号音
発生回路。

Claims (1)

  1. 【特許請求の範囲】 1 音声の入力を促す信号音を出力する手段と、
    上記信号音に同期して発声入力された音声信号を
    認識処理する手段と、この手段によつて現時点に
    おいて行われた認識処理による認識信頼度と現時
    点より一定の認識処理回数分だけ遡つた期間内に
    行われた認識処理による認識信頼度とを平均した
    平均認識信頼度に対応させて前記信号音の出力形
    態を可変する出力形態可変手段とを具備してなる
    ことを特徴とする音声認識装置。 2 前記出力形態可変手段は、前記信号音の周波
    数、振幅、時間幅、波形のうちの少なくとも1つ
    を可変するものであることを特徴とする特許請求
    の範囲第1項記載の音声認識装置。
JP57227706A 1982-12-28 1982-12-28 音声認識装置 Granted JPS59121097A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57227706A JPS59121097A (ja) 1982-12-28 1982-12-28 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57227706A JPS59121097A (ja) 1982-12-28 1982-12-28 音声認識装置

Publications (2)

Publication Number Publication Date
JPS59121097A JPS59121097A (ja) 1984-07-12
JPH0437997B2 true JPH0437997B2 (ja) 1992-06-23

Family

ID=16865068

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57227706A Granted JPS59121097A (ja) 1982-12-28 1982-12-28 音声認識装置

Country Status (1)

Country Link
JP (1) JPS59121097A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002031810A1 (fr) * 2000-10-11 2002-04-18 Sony Corporation Appareil de commande de robot

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09292895A (ja) * 1996-04-25 1997-11-11 Matsushita Electric Ind Co Ltd ヒューマン・マシン・インタフェース装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58216298A (ja) * 1982-06-11 1983-12-15 株式会社ピーエフユー 音声単語認識装置の応答確認方式

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58216298A (ja) * 1982-06-11 1983-12-15 株式会社ピーエフユー 音声単語認識装置の応答確認方式

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002031810A1 (fr) * 2000-10-11 2002-04-18 Sony Corporation Appareil de commande de robot

Also Published As

Publication number Publication date
JPS59121097A (ja) 1984-07-12

Similar Documents

Publication Publication Date Title
US7013276B2 (en) Method of assessing degree of acoustic confusability, and system therefor
US7062439B2 (en) Speech synthesis apparatus and method
KR870009322A (ko) 스피커 배열 언어 인식 시스템
US5212731A (en) Apparatus for providing sentence-final accents in synthesized american english speech
JPS592040B2 (ja) 音声認織装置
CN107610691B (zh) 英语元音发声纠错方法及装置
JP3311460B2 (ja) 音声認識装置
JPH0437997B2 (ja)
JP3112037B2 (ja) 音声認識装置
GB2231700A (en) Speech recognition
JP3354339B2 (ja) 日本語処理装置
JP2502493B2 (ja) 規則合成音のリズム制御方法
US8688452B2 (en) Automatic generation of distractors for special-purpose speech recognition grammars
EP1422691B1 (en) Method for adapting a speech recognition system
JPH0546196A (ja) 音声認識装置
JPS59224900A (ja) 音声認識方法
JPS61292199A (ja) 音声認識装置
JP2578771B2 (ja) 音声認識装置
JPH06110491A (ja) 音声認識装置
JPS62209598A (ja) 単語音声認識処理方式
JPH04199198A (ja) 音声認識装置
JPS6140686A (ja) 標準パタ−ン登録方式
JPS58168100A (ja) 音声認識装置
JPH0424697A (ja) 音声認識装置
JPS63155198A (ja) 無声音検出方法