JPS63300298A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPS63300298A
JPS63300298A JP62133363A JP13336387A JPS63300298A JP S63300298 A JPS63300298 A JP S63300298A JP 62133363 A JP62133363 A JP 62133363A JP 13336387 A JP13336387 A JP 13336387A JP S63300298 A JPS63300298 A JP S63300298A
Authority
JP
Japan
Prior art keywords
key
word
words
accessed
speech recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62133363A
Other languages
English (en)
Inventor
康弘 小森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP62133363A priority Critical patent/JPS63300298A/ja
Publication of JPS63300298A publication Critical patent/JPS63300298A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は、音声認識装置に関するものである。
[従来の技術] 従来この種の装置においては、音声認識を全単語にわた
ってマツチングをとって行なうか、あるいは入力音声の
認識結果を利用して、予備選択を行なう方式が謀られて
いる。
[発明が解決しようとする問題点] ところが、このような形態の音声認識では、大量語の認
識の際に処理時間がかかったり、認識誤りによる予備選
択誤り率が高いという欠点があった。
そこで、本発明の目的は、上述の従来の欠点を除去また
は軽減し、入力音声に近い特徴を多く有する単語を予備
選択することが可能な音声認識装置を提供することにあ
る。
と [問題点が解決するための手段] このような目的を達成するために、本発明は単語を格納
した単語辞書手段と、時系列に入力される音声を電気信
号に変換する音声入力部と、その電気信号から、入力さ
れた音声の特徴を抽出する手段と、電気信号から、入力
された音声の音素を抽出する手段と、抽出された音声の
特徴および音素をキーとして単語辞書手段にアクセスす
る指示を与えるインデックス手段と、キーと単語との関
係を示すテーブルを有する手段と、単語がキーによって
アクセスされた回数を計数する手段と、テーブルとアク
セスされた回数とに応じて、単語の候補として予備選択
するためのしきい値を決めるしきい値手段と、しきい値
以上の回数にわたってアクセスされた単語を候補単語と
して選択する手段とを具えたことを特徴とする。
さらに、本発明は単語を格納した単語辞書手段と、時系
列に入力される音声を電気信号に変換する音声入力部と
、その電気信号から、入力された音声の特徴を抽出する
手段と、電気信号から、入力された音声の音素を抽出す
る手段と、抽出された音声の特徴および音素をキーとし
て単語辞書手段にアクセスする指示を与えるインデック
ス手段と、単語がキーによってアクセスされた回数を計
数する手段と、そのアクセスされた回数に応じて、単語
の候補として予備選択するためのしきい値を決めるしき
い値手段と、しきい値以上の回数にわたってアクセスさ
れた単語を候補単語として選択する手段とを具えたこと
を特徴とする。
[作 用] 本発明によれば、音声認識のマツチングすべき候補単語
を予m選択することが可能であり、しかも、入力音声の
もつ特徴を多く有している単語のみを候補とすることに
より、予備選択の誤り率を減少することができる。
[実施例] 以下に、図面を参照して、本発明の実施例を詳細に説明
する。
第1図は本発明の一実施例を示すブロック図であり、こ
こで、1は時系列に入力される音声入力を受ける音声入
力部でマイクロホンなどの音声トランスジューサIAと
その音声入力をデジタル信号に変換するA/Dコンバー
タIBとを有する。2はそのデジタル音声信号を受けて
音声入力に刻する音響処理と特徴抽出を行う音う処理・
特徴抽出部、3は音素認識部である。
4は奇習処置特徴抽出部2および音素認識部3の出力を
刺激(キー)として、単語をアクセスする単語ポインタ
4Aおよびキー出現位置カウンタ4Bを有するインデッ
クス部である。
5はROMであって、単語辞書5Aと第2図に示す制御
手順のプログラムを格納するエリア5Bとを有する。
6Aはキー・単語関係テーブルであって、インデックス
部4から時系列に得られるキー(特徴)が示す単語のう
ちで、そのキーはどの位置に出現するかを示す、6Bは
キーアクセスカウンタであって、インデックス部4から
のキーにより辞書5の単語がアクセスされた回数をカウ
ントする。
7は時系列に入力されるキーに反応する単語のうち、ア
クセスカウンタ6Bにより頻度高く反応を示したと判断
された単語を認識すべき単語の候補として予備選択する
しきい値を定める候補選択部である。
8は単語候補部であって、すべてのキーが入力された後
に、あるしきい値以上の回数にわたってアクセスされた
単語を候補単語としてストアする。
なお、この候補選択部7では、キー単語関係テーブル6
Aによって、入力音声から得られるキーの時系列情報を
判定することにより、アクセスカウンタ6Bによるキー
の出現頻度のみならず、そのキーの時系列情報をも用い
てしきい値を定めることによって、予備選択される候補
単語の個数を減少させることができる。
9は単語認識部であり、音素認識部3からの音素認識の
結果と単語候補部8からの候補単語とを照合してマツチ
ングを行い、両者の一致のとれたとき、すなわちマツチ
ングのとれたときに、その候補単語を音声認識結果の出
力として取り出す。
第2図は第1図に示した本発明音声認識装置のROM 
5のプログラムエリア5Bに格納する制御手順のフロー
チャートである。
まず、ステップS1において初期化が行われた後、音声
が入力される。次のステップS2において、入力音声の
音響処理と特徴抽出を行い、さらにステップS3からS
5において音素認識を行ないながら、キーを検出する。
次のステップS6では、キーの検索をインデックス部4
より行ない、ついで、ステップS7においてインデック
スをアクセスする。さらに、次のステップS8では、そ
のインデックスの単語ポインタによりキーを含む単語に
アクセスする。
次のステップS9では、キーの前後関係をみる。
すなわち、この時に、その前にアクセスされたキーと現
在入力されたキーとで単語内における時系列の条件を満
足すれば、ステップSIOに進み、その単語のキーのア
クセスカウンタをインクリメントする。
ステップS9において、上述の条件が満足されないとき
、およびステップS10の次には再びステッブS2に戻
り、音声入力が終了するまで、以上の過程を繰り返す。
ステップS4において、音声入力の終了が判断されたと
きには、ステップSllに進み、ここで、キーアクセス
カウンタの結果が、人カキ−によりあらかじめ定められ
ているあるしきい値を超える単語を候補単語として単語
認識部9に渡す。
次のステップS12において、単語認識部9は、音素認
識の結果と候補単語とのマツチングにより単語の認識を
行い、さらにステップS13において、マツチングのと
れたときの認識結果を出力する。
第3図〜第6図はキーとして音響特徴を用いた場合の本
発明実施例の動作の例である。
ここでは、入力音声から、[無音・摩擦・短時間]とい
う順序で特徴(キー)が得られた例を示す。
第3図は音声入力前の初期状態を示す。ここで、キーと
しては、摩擦、バズ音(buzz)、無音。
鼻韻、長い単語、短い単語などを用いている。単語ポイ
ンタ4Aにはそのキーを含む単語の番号が収容されてい
る。キー出現位置カウンタ4Bは、単語内のどの位置に
そのキーが出現するかを示すテーブルであり、キーの出
現位置のうちのいずれの位置を入力されたキーが取り扱
うかを示しているカウンタであり、初期状態は“1”と
し、“0”はそのキーでアクセスした時点のキーが最終
キーであることを示す。“−”はアクセスの必要がない
ことを示す。
以上の部分がインデックス部4を構成する。
単語辞書5Aの部分は、単語番号、i語の音素記号列を
有する。さらに加えて、その単語において、最後にアク
セスされたキーのその単語内での位置を示す最終キー位
置およびアクセスされた回数を示すキーアクセスカウン
タ6Bをここでは併せて示す。かかる最終キー位置およ
びキーアクセスカウンタ6Bは、初期化において“0”
状態にある。この最終キー位置により、時系列の正しい
順序を判断ができ、またキーアクセスカウンタ6Bのカ
ウント数により単語候補を決定することができる。
音声が入力される前は第3図の状態にある。音声が入力
され、最初のキーとして[無音]が検出されたとすると
第4図のような状態になる。このときインデックス部4
のキーの“無音”を探し、無音の指している単語ポイン
タ4Aによりアクセスを行う。本例の場合は、単語20
と40である。
次に、単語辞書5A内の最終キー位置とインデックスの
最初のキーの出現位置とを比較して(この場合、前者は
O1単語20.40においては2)であるから0≦2で
ある。したがって、この場合には時系列の条件を満たし
ているので、キーアクセスカウンタ6Bの内容をインク
リメントして1にする。
その結果、インデックス部4のキー出現位置カウンタ4
Bの内容を1ずつインクリメントして、単語辞書5A内
の最終キー位置にさきほどのキー出現位置である2を代
入しておく。但し、単語40のキー出現位置は次に“無
音”のキーが出現しても、アクセスできないので、“−
”の記号を入れて、アクセスできないようにしておく。
第5図は、第4図の[無音]の次に[摩擦]キーが出現
した場合であり、第6図は音声が終了し、最終キーが[
短い時間コであったときの最終結果である。ここで、内
部状態の変化のしかたは第4図と同様である。
音声入力が終了したときに、[無音] [摩擦][短時
間コというキ一時系列に近い順にキーカウンタは大きな
値をもち、この例では、100%のキー情報を有する単
語は40番であり、1つだけ情報が落ちたものは10.
20.50などとなる。
ここで、第1図の候補選択部7において、あるしきい値
を決定することにより、候補単語の個数を減少させて、
予備選択を可能にする。
本発明は上述した実施例にのみ限られず、種々変更でき
る。
たとえば、時系列の情報を無視し、キーの出現回数のみ
により予備選択を行なうこともできる。
この場合には、第1図に示したキーー単語関係テーブル
6Aと、第3図〜第6図に示したインデックス部4のキ
ー出現位置およびそのカウンタ4Bと単語辞書5A内の
最終キー位置を省略し、第2図のフローチャートの判定
ステップS9を省略することにより、同様のアルゴリズ
ムで簡単に実現が可能である。
キーを音響レベルにおける特徴ではなく、第7図に示す
ように、音素認識の結果の音素を用いたり、あるいは第
8図に示すように、単音節を用いることによっても、上
述の実施例と同様の方法で音声認識を実現可能である。
さらにまた、音声入力が、第9図に示すように、ラティ
スの形態で複数候補とともに行なわれる場合には、第7
図や第8図のように音素ラティスについてのラティスカ
ウンタ6Cを設け、複数候補が同時に出現する音素の時
点(第9図の時点1では「a」と「0」、時点2では「
z」と「s」など)のアクセスにおいては、その時点1
とか時点2をラティスカウンタ6Cに入れ、すでに同一
のラティスカウンタによりアクセスされていたならば、
最終キー位置を小さい方に変更するアルゴリズムを加え
ることにより、同様の処理で予備選択が可能となる。
[発明の効果] 以上から明らかなように、本発明によれば、音声認識の
マツチングすべき候補単語を予備選択することが可能で
あり、しかも、入力音声のもつ特徴を多く有している単
語のみを候補とすることにより、予備選択の誤り率を減
少することができる。
【図面の簡単な説明】
第1図は本発明の一実施例を示すブロック図、第2図は
その動作手順の一例を示すフローチャート、 第3図〜第6図は本実施例における動作例の説明図、 第7図および第8図は本発明の他の実施例の説明図、 第9図は入力音素ラティスの一例の説明図である。 1・・・音声入力部、 2・・・音響処理・特徴抽出部、 3・・・音素認識部、 4・・・インデックス部、 4A・・・単語ポインタ、 4B・・・キー出現位置カウンタ、 5・・・ROM 。 5A・・・単語辞書、 5B・・・プログラムエリア、 6A・・・キーー単語関係テーブル、 6B・・・キーアクセス・カウンタ、 6C・・・ラティスカウンタ、 7・・・候補選択部、 8・・・単語候補部、 9・・・単語認識部。 船医 坏 ’(Y) 1= 々 2区 驚く 剖ω城 蔗 3区 乏 鄭0 T怪 セ インデノクス部・I         1lJi辞書5
A」ね t マ 0フ 否 び

Claims (1)

  1. 【特許請求の範囲】 1)単語を格納した単語辞書手段と、 時系列に入力される音声を電気信号に変換する音声入力
    部と、 その電気信号から、当該入力された音声の特徴を抽出す
    る手段と、 前記電気信号から、当該入力された音声の音素を抽出す
    る手段と、 前記抽出された音声の特徴および音素をキーとして前記
    単語辞書手段にアクセスする指示を与えるインデックス
    手段と、 当該キーと単語との関係を示すテーブルを有する手段と
    、 単語がキーによってアクセスされた回数を計数する手段
    と、 前記テーブルと前記アクセスされた回数とに応じて、単
    語の候補として予備選択するためのしきい値を決めるし
    きい値手段と、 前記しきい値以上の回数にわたってアクセスされた単語
    を候補単語として選択する手段と を具えたことを特徴とする音声認識装置。 2)前記インデックス手段は、前記キーとそのキーを有
    する単語との関係に応じて、前記キーを有する単語への
    アクセスを行なう単語ポインタを有することを特徴とす
    る特許請求の範囲第1項記載の音声認識装置。 3)前記インデックス手段は、前記キーを有する単語の
    うちで、当該キーが出現する位置を示すカウンタを有し
    、そのキー出現位置カウンタの内容に応じて、前記キー
    の時系列情報を判定することを特徴とする特許請求の範
    囲第2項記載の音声認識装置。 4)前記しきい値手段は、前記キーの各々あてに、当該
    各キーを基にしてアクセスされた単語の個数を計数する
    キーアクセスカウンタを有することを特徴とする第1項
    ないし第3項のいずれかの項に記載の音声認識装置。 5)単語を格納した単語辞書手段と、 時系列に入力される音声を電気信号に変換する音声入力
    部と、 その電気信号から、当該入力された音声の特徴を抽出す
    る手段と、 前記電気信号から、当該入力された音声の音素を抽出す
    る手段と、 前記抽出された音声の特徴および音素をキーとして前記
    単語辞書手段にアクセスする指示を与えるインデックス
    手段と、 単語がキーによってアクセスされた回数を計数する手段
    と、 そのアクセスされた回数に応じて、 単語の候補として予備選択するためのしきい値を決める
    しきい値手段と、 前記しきい値以上の回数にわたってアクセスされた単語
    を候補単語として選択する手段と を具えたことを特徴とする音声認識装置。 6)前記インデックス手段は、前記キーとそのキーを有
    する単語との関係に応じて、前記キーを有する単語への
    アクセスを行なう単語ポインタを有することを特徴とす
    る特許請求の範囲第5項記載の音声認識装置。 7)前記インデックス手段は、前記キーを有する単語の
    うちで、当該キーが出現する位置を示すカウンタを有し
    、そのキー出現位置カウンタの内容に応じて、前記キー
    の時系列情報を判定することを特徴とする特許請求の範
    囲第6項記載の音声認識装置。 8)前記しきい値手段は、前記キーの各々あてに、当該
    各キーを基にしてアクセスされた単語の個数を計数する
    キーアクセスカウンタを有することを特徴とする第5項
    ないし第6項のいずれかの項に記載の音声認識装置。
JP62133363A 1987-05-30 1987-05-30 音声認識装置 Pending JPS63300298A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62133363A JPS63300298A (ja) 1987-05-30 1987-05-30 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62133363A JPS63300298A (ja) 1987-05-30 1987-05-30 音声認識装置

Publications (1)

Publication Number Publication Date
JPS63300298A true JPS63300298A (ja) 1988-12-07

Family

ID=15102972

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62133363A Pending JPS63300298A (ja) 1987-05-30 1987-05-30 音声認識装置

Country Status (1)

Country Link
JP (1) JPS63300298A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8126714B2 (en) 2007-04-10 2012-02-28 Mitsubishi Electric Corporation Voice search device

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8126714B2 (en) 2007-04-10 2012-02-28 Mitsubishi Electric Corporation Voice search device

Similar Documents

Publication Publication Date Title
US8249870B2 (en) Semi-automatic speech transcription
US20050021330A1 (en) Speech recognition apparatus capable of improving recognition rate regardless of average duration of phonemes
CN107369439A (zh) 一种语音唤醒方法和装置
JPS5972496A (ja) 単音識別装置
JPS59121100A (ja) 連続音声認識装置
US8140334B2 (en) Apparatus and method for recognizing voice
US5987412A (en) Synthesising speech by converting phonemes to digital waveforms
JPS63300298A (ja) 音声認識装置
JP2002278579A (ja) 音声データ検索装置
US20110165541A1 (en) Reviewing a word in the playback of audio data
JPS593491A (ja) 音声認識装置
Rao et al. A novel process for Melakartha Raaga recognition using hidden Markov models (HMM)
CN114974233A (zh) 一种语音识别方法、装置、设备及存储介质
JPS6148897A (ja) 音声認識装置
JPH11259085A (ja) 音声認識装置及び認識結果提示方法
JPS6315295A (ja) 音声認識装置
JPH0226262B2 (ja)
JPS6346499A (ja) 大語▲い▼単語音声認識方式
JPS6385697A (ja) 音声認識方法
JPS60250400A (ja) 音声認識装置
JPS63254497A (ja) パタ−ン認識装置
JPS62278597A (ja) 音素標準パタ−ンの切り出し方法
JPS60203993A (ja) 音声認識方法
JPH0194396A (ja) 音声認識方式
JP2003066989A (ja) 音声認識方法および音声認識装置ならびに音声認識プログラム