JPH0310298A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH0310298A
JPH0310298A JP1144206A JP14420689A JPH0310298A JP H0310298 A JPH0310298 A JP H0310298A JP 1144206 A JP1144206 A JP 1144206A JP 14420689 A JP14420689 A JP 14420689A JP H0310298 A JPH0310298 A JP H0310298A
Authority
JP
Japan
Prior art keywords
circuit
dictionary
recognition
similarity
words
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1144206A
Other languages
English (en)
Inventor
Atsushi Shinpo
敦 新保
Teruaki Uehara
輝昭 上原
Tomoyuki Kishi
智之 岸
Hiromi Ando
安藤 博美
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP1144206A priority Critical patent/JPH0310298A/ja
Publication of JPH0310298A publication Critical patent/JPH0310298A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 「産業上の利用分野] 本発明は、予め使用者の音声に基づいて認識対象の語句
の特徴パラメータを辞書回路に登録しておく特定話者認
識型の音声認識装置に関するものである。
[従来の技術] 音声認識装置は、特定話者認識型と不特定話者認識型と
の二つのタイプに大別することができる。
ここに、特定話者認識型とは、装置の使用者を特定人(
通常は一人であるが、複数人とすることも可能である)
に限定し、装置の使用に先立って、予め、認識対象の語
句の特徴パラメータを特定人である使用者の音声に基づ
いて辞書回路に登録しておくものである。
一方、不特定話者認識型とは、装置の使用者を特定しな
いもので、誰でも使用でき、また、予め使用者自身の音
声を使って認識対象のJπ句の特徴パラメータを辞書回
路に登録しておくような手間か不要になるため、使用者
側から見ると便利であるか、現状では、技術的に未解決
な部分が多い。
しかし、前記特定話者認識型は、使用法が多少限定され
るものの、装置における回路規模、認識率の点で優れ、
最近では、音声ダイヤル装置なとに実用化されてきてい
る。
ここに、音声タイヤル装置とは、電話をかける相手の名
前等を予め使用者が発声して、この発声に基づいた特徴
パラメータとその相手の電話番号とを対応させて該装置
に内蔵された音声認識装置に登録しておき、電話をかけ
る時には、相手の名前を発声すれば、′前記音声認識装
置かその相手を認識して、自動的にその相手にタイヤル
する装置をいう。
さて、第2図は、前述の特定話者認識型の音声認識装置
の従来例を示したものである。
この音声認識装置は、特公昭64−720号公報や「東
海大学出版会出版、古井 貞著、「ディジタル音声処理
」の160.1.61頁」に記載の技術の要部を示した
ものである。
第2図の内容を説明すると、以下の如くである。
ディジタル信号系列で表された音声信号は、入力端20
1より特徴量抽出回路202に入力し、該特徴量抽出回
路202で認識処理に必要となる特徴パラメータに変換
される。
この特徴パラメータは、切り替えスイッチ203による
接点切り替えによって辞書回路204または認識処理回
路205に送出することかでき、使用者の音声登録時に
は辞書回路204に格納され、使用者の音声認識時には
認識処理回路205に送られる。
音声登録時において、同し語句を数回発声して登録する
場合には、前記特徴パラメータの平均値が辞書回路20
4に格納される。
音声認識時には、認識処理回路に送られた特徴パラメー
タと前記辞書回路204に予め格納されている全ての語
句の特徴パラメータとを比較して、辞書回路204内の
全ての特徴パラメータに対する類似度を該認識処理回路
205で算出し、前記辞書回路204内の語句で最も類
似度の高い語句を認識結果として出力端206に出力す
る。
[発明か解決しようとする課題] ところで、第2図に示した構成の一従来装置の場合、例
えば、人名の「かとう−1や「さとう」のように発音が
酷似する語句は誤認識され易く、このような語句のため
に装置の認識性能が低下するという問題かあった。
これは、発音が酷似している語句相互は、当然に辞書回
路に登録される特徴パラメータ相互の類似度か高くなり
、類似度が基準レベル以」二に高い複数の語句か存在す
る場合には、認識処理回路205における類似度に基づ
く抽出が困難になるためであり、このような問題を解決
することが、今後の課題とされていた。
本発明は、前記事情に鑑みてなされたもので、発音が酷
似する語句の誤認識による認識性能の低下という不都合
を防止することのできる特定話者認識型の音声認識装置
を提供することを目的とする。
[課題を解決するための手段] 本発明に係る音声認識装置は、予め使用者自身の発した
音声の特徴パラメータを、認識対象の語句の特徴パラメ
ータとして辞書回路に登録しておき、認識処理時には、
入力音声に対して作成した特徴パラメータと前記辞書回
路に既登録の語句の特徴パラメータとの類似度から入力
音声の示す語句を認識する装置である。
具体的には、前記辞書回路に特徴パラメータを登録する
登録処理時において登録用に使用者の発した音声の特徴
パラメータと辞書回路に既登録の語句の特徴パラメータ
との類似度を算出する認識処理回路を備える。
また、さらに、前記認識処理回路によって算出された類
似度と予め設定された閾値とを比較して閾値に対する高
低関係を判断する判定回路と、既登録の語句の特徴パラ
メータに対して類似度の高い特徴パラメータの登録を防
止するために前記判定回路による判定結果に基ついた入
力指示を使用者へ指示する指示回路とを備える。
1作用] 本発明に係る音声認識装置は、認識対象の語句の特徴パ
ラメータを辞書回路に登録する登録処理時に、認識処理
回路によって、登録用に使用者自信の発した音声の特徴
パラメータと前記辞書回路に既登録の3π句の特徴パラ
メータとの類似度を算出する。そして、算出した類似度
は、判定回路によって、予め設定された閾値に対する高
低関係を判断する。そして、前記判定回路による判定結
果に基づいた入ノJ指示を、指示回路により使用者へ指
示する。
従って、使用者は、辞書回路に既登録の語句と特徴パラ
メー・夕が類似する音声は、登録処理時に指示回路より
確認することかでき、発音の酷似する語句をそのまま辞
書回路に登録するような不都合を回避することかでき、
これによって、発音が酷似する語句の誤認識による認識
性能の低下という不都合を防止することかでき、装置の
認識性能を向」ニさせることかできる。
[実施例] 第1図は、本発明に係る音声認識装置の一実施例の構成
説明図である。
一実施例の音声認識装置は、いわゆる特定話者認識型の
もので、第1図に示すように、入力端101と、出ノJ
端102と、特徴量抽出回路103と、辞書回路104
と、認識処理回路105と、判定回路106と、指示回
路107とを備えている。
前記入力端101は、音声信号の入力部で、ティジタル
信号系列で表された音声信号を受ける。
前記出力端102は、認識結果の出力部である。
前記特徴量抽出回路103は、前記入力端101から信
号線110を介して音声信号を受け、該音声信号を特徴
パラメータに変換して信号線111を介して認識処理回
路105に出力する。
辞書回路104は、認識対象の語句の特徴パラメータを
格納しておく回路であり、該辞書回路104に格納され
た特徴パラメータは、信号線112を介して認識処理回
路105に出力することができる。
前記認識処理回路105は、登録処理時および認識処理
時に、それぞれ特徴量抽出回路103から受けた特徴パ
ラメータと辞書回路104に既登録の全ての語句の特徴
パラメータとを比較して、既登録の全ての語句に対して
類似度を算出する。
ここに、登録処理とは、特徴量抽出回路103で作成し
た特徴パラメータを前記辞書回路104に登録するため
の処理をいう。また、認識処理とは、特徴量抽出回路1
03に入力した音声信号の表す語句の認識を行うための
処理をいう。
前記類似度の値は、例えばユークリッド距離等で表され
、前記登録処理時には、算出した類似度のうち最高位の
類似度の値か、信号線113を介して前記判定回路10
6に出力される。また、前記認識処理時には、最高位の
類似度を示す語句を認識結果として、信号線114を介
して出力端102へ出力する。
前記判定回路106は、前記認識処理回路105から受
けた類似度と予め設定した閾値とを比較して、前記類似
度の閾値に対する高低関係を判断し、判断結果に応じて
、制御信号を辞書回路104および指示回路107に出
力する。信号線115は、該判定回路106から辞書回
路104へ制御信号を送るものであり、また、信号線1
16は該判定回路106から指示回路へ制御信号を送る
ものであり、指示回路107はCRTなとの表示画面を
有している。
この判定回路106によって、認識処理回路105から
受けた類似度が閾値よりも高い(即ぢ、新たに登録しよ
うとする語句の発音か、既に辞書回路104に登録され
ている語句の発音に酷似している)と判断された場合は
、信号線115を介して辞書回路104に出力された制
御信号によって、この新たな語句の特徴パラメータの辞
書登録が見送られる。また、同時に、信号線116を介
して指示回路107に出力された制御信号によって、指
示回路107の表示画面は、例えば、[既に登録済みの
○○と良く似た語句で、誤り易いので、呼び方を変えて
再入力して下さい−1等の入力指示を表示する(たたし
、前記○○は、辞書回路0 104に既登録の語句の具体例が入る)。
一方、前記判定回路1.06によって、認識処理回路1
05から受けた類似度が閾値よりも低い(即ぢ、新たに
登録しようとする語句の発音が既に辞書回路104に登
録されている語句の発音にあまり似ていない)と判断さ
れた場合は、信号線115を介して辞書回路104に出
力された制御信号によって、この新たな語句の特徴パラ
メータの辞書登録か許される。辞書登録される特徴パラ
メータは、前記認識処理回路105から信号線117を
介して辞書回路104に送られる。また、同時に、信号
線116を介して指示回路107に出力された制御信号
によって、指示回路+07の表示画面は、例えば、「登
録終了しました。次に登録する語句を発声して下さい。
J等の入力指示を表示する。
次に、具体例を挙げて、実施例の音声認識装置の登録処
理時の作用を説明する。
具体例としては、「かとう」、「すずき」、「かもい−
1,「つかはら−1という人名の特徴パラメータが既に
前記辞書回路10/Iに登録されている状態で、新たに
「さとう−1という人名を登録する場合である。
使用者が登録用に「さとうJを発声すると、この音声の
特徴パラメータが特徴■抽出回路103で作成され、こ
の特徴パラメータか認識処理回路105に送られる。そ
して、認識処理回路+05では、この[さとう」に関す
る特徴パラメータを辞書回路]0/Iに既登録の全ての
語句の特徴パラメータと比較して、それぞれ類似度を算
出する。
辞書回路10<に登録されている語句の中では、「かと
う−1に対する類似度か最高位になり、この「かとう」
に対する類似度の値が判定回路106に送られる。
判定回路106では、「かとう」に対する類似度の値と
閾値とを比較して、類似度の値か閾値よりも低い場合に
は、「さとう」の登録を受は入れるべ(、辞書回路10
/lおよび指示回路107に所定の制御信号を出)Jす
る。一方、類似度の値が閾値よりも高い場合には、「さ
とう−1の登録を見通るべく、辞書回路104および指
示回路107に所定の制御信号を出力する。
判定回路+06が、「さとう」の登録を不適と判定した
場合、前述のように、指示回路107には、「既に登録
済みの「かとう」と良く似た語句で、認識処理時に誤り
易いので、呼び方を変えて再人力して下さい」等の入力
指示を出す。
このような指示に対して、使用者は、例えば、フルネー
ムである「さとうしんいぢろう」とか、あるいは、名前
の頭文字を付加した「えすさとう」とか、「かとう−1
に対して発音」二で区別を付は易い呼び方に変えて、再
入力すれば良い。
認識処理時の作用は、従来のものと同様であるので、説
明を省略する。
以上に示したように、前記実施例の音声認識装置では、
使用者は、辞書回路104に既登録の語句と特徴パラメ
ータが類似する音声は、登録処理時に指示回路107に
より確認することができ、発音の酷似する語句をそのま
ま辞書回路104に登録するような不都合を回避するこ
とが゛でき、これによって、発音が酷似する語句の誤認
識による詔、識性能の低下という不都合を防止すること
ができ、装置の認識性能を向」二ざ且ることができる。
なお、前記実施例における指示回路107は、表示画面
によって視覚的に人力指示を行うものを示したが、合成
音声等によって、聴覚的に入力指示を行うようにしても
よ(、また、視覚的および聴覚的な指示を併用しても良
い。
また、前記指示回路1.07による入力指示は、既登録
の語句の特徴パラメータに対して類似度の高い特徴パラ
メータの登録を防止するためのもので、具体的な指示内
容・形式は前記趣旨を逸脱しない範囲であれば自由であ
り、前記実施例に限定するものではない。ただし、指示
内容としては、[入力された音声の辞書登録に対する適
否−1だけでなく、さらに、そのままでは登録すること
が不適な場合には、例えば、「発音を変えて再登録して
下さい」等の「不適を回避するための具体的対策」を併
せて示せば、使用者の登録手続きを円滑にして、装置の
取り扱い性を向上させることが可3 4 能になる。
U発明の効果] 本発明に係る音声認識装置は、認識対象の語句の特徴パ
ラメータを辞書回路に登録する登録処理時に、認識処理
回路によって、登録用に使用者自信の発した音声の特徴
パラメータと前記辞書回路に既登録の語句の特徴パラメ
ータとの類似度を算出する。そして、算出した類似度は
、判定回路によって、予め設定された閾値に対する高低
関係を判断する。そして、前記判定回路による判定結果
に基ついた入力指示を、指示回路により使用者へ指示す
る。
従って、使・用者は、辞書回路に既登録の語句と特徴パ
ラメータが類似する音声は、登録処理時に指示回路より
確認することができ、発音の酷似する語句をそのまま辞
書回路に登録するような不都合を回避することかでき、
これによって、発音が酷似する語句の誤認識による認識
性能の低下という不都合を防止することかてき、装置の
認識性能を向上さぜることかてきる。
【図面の簡単な説明】
第1図は本発明に係る音声認識装置の一実施例の構成説
明図、第2図は従来の音声認識装置の構成説明図である
。 101・・・・入力端、102 ・・・出力端、103
・特徴量抽出回路、104 ・ 辞書回路、10認識処
理回路、+06・・・・判定回路、107 ・・・指示
回路。

Claims (1)

  1. 【特許請求の範囲】 予め使用者自身の発した音声の特徴パラメータを認識対
    象の語句の特徴パラメータとして辞書回路に登録してお
    き、認識処理時には、入力音声に対して作成した特徴パ
    ラメータと前記辞書回路に既登録の語句の特徴パラメー
    タとの類似度から入力音声の示す語句を認識する音声認
    識装置において、 前記辞書回路に特徴パラメータを登録する登録処理時に
    おいて登録用に使用者の発した音声の特徴パラメータと
    辞書回路に既登録の語句の特徴パラメータとの類似度を
    算出する認識処理回路と、該認識処理回路によって算出
    された類似度と予め設定された閾値とを比較して閾値に
    対する高低関係を判断する判定回路と、既登録の語句の
    特徴パラメータに対して類似度の高い特徴パラメータの
    登録を防止するために前記判定回路による判定結果に基
    づいた入力指示を使用者へ指示する指示回路とを備えた
    ことを特徴とする音声認識装置。
JP1144206A 1989-06-08 1989-06-08 音声認識装置 Pending JPH0310298A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1144206A JPH0310298A (ja) 1989-06-08 1989-06-08 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1144206A JPH0310298A (ja) 1989-06-08 1989-06-08 音声認識装置

Publications (1)

Publication Number Publication Date
JPH0310298A true JPH0310298A (ja) 1991-01-17

Family

ID=15356695

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1144206A Pending JPH0310298A (ja) 1989-06-08 1989-06-08 音声認識装置

Country Status (1)

Country Link
JP (1) JPH0310298A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002502992A (ja) * 1998-02-03 2002-01-29 デテモビール ドイチェ テレコム モビールネット ゲーエムベーハー 音声認識システムにおける認識率向上方法及び装置
WO2006109515A1 (ja) * 2005-03-31 2006-10-19 Pioneer Corporation 操作者認識装置、操作者認識方法、および、操作者認識プログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002502992A (ja) * 1998-02-03 2002-01-29 デテモビール ドイチェ テレコム モビールネット ゲーエムベーハー 音声認識システムにおける認識率向上方法及び装置
WO2006109515A1 (ja) * 2005-03-31 2006-10-19 Pioneer Corporation 操作者認識装置、操作者認識方法、および、操作者認識プログラム
JPWO2006109515A1 (ja) * 2005-03-31 2008-10-23 パイオニア株式会社 操作者認識装置、操作者認識方法、および、操作者認識プログラム
JP4588069B2 (ja) * 2005-03-31 2010-11-24 パイオニア株式会社 操作者認識装置、操作者認識方法、および、操作者認識プログラム
US7979718B2 (en) 2005-03-31 2011-07-12 Pioneer Corporation Operator recognition device, operator recognition method and operator recognition program

Similar Documents

Publication Publication Date Title
US5912949A (en) Voice-dialing system using both spoken names and initials in recognition
KR20010093334A (ko) 잡음 신호에서 음성의 엔드포인팅 방법
KR100595610B1 (ko) 전화번호 안내 방법 및 장치
KR20010093327A (ko) 음성 인식 제거 체계
US20010056345A1 (en) Method and system for speech recognition of the alphabet
JPH0310298A (ja) 音声認識装置
JP2009104047A (ja) 情報処理方法及び情報処理装置
JP2002278588A (ja) 音声認識装置
KR20040008990A (ko) 음성인식 키 입력 무선 단말장치, 무선 단말장치에서키입력 대신 음성을 이용하는 방법 및 그 기록매체
JP2000101705A (ja) 無線電話機
JP2655086B2 (ja) 電話回線音声入力システム
JP3112037B2 (ja) 音声認識装置
JP3597398B2 (ja) 音声認識装置
JP2002101204A (ja) 通話仲介システム及び聴覚障害者用電話機
JPH01152851A (ja) 音声ダイアリング装置
JP2000122678A (ja) 音声認識機器制御装置
JP2005283797A (ja) 音声認識装置および音声認識方法
JP2656234B2 (ja) 会話音声理解方法
WO2002069324A1 (en) Detection of inconsistent training data in a voice recognition system
KR100230972B1 (ko) 전전자교환기의 화자종속 음성인식서비스 장치 및 방법
JPH086590A (ja) 音声対話のための音声認識方法及び装置
KR20000074617A (ko) 음성인식기기의 자동 훈련방법
JP3278595B2 (ja) 携帯電話
JP3327213B2 (ja) 音声認識型通信制御装置
JPH0228700A (ja) 音声ダイヤリング装置