JPH06167992A - 音声パターン作成装置およびそれを用いた標準パターン登録装置 - Google Patents

音声パターン作成装置およびそれを用いた標準パターン登録装置

Info

Publication number
JPH06167992A
JPH06167992A JP4341224A JP34122492A JPH06167992A JP H06167992 A JPH06167992 A JP H06167992A JP 4341224 A JP4341224 A JP 4341224A JP 34122492 A JP34122492 A JP 34122492A JP H06167992 A JPH06167992 A JP H06167992A
Authority
JP
Japan
Prior art keywords
pattern
standard pattern
standard
voice
new
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4341224A
Other languages
English (en)
Inventor
Junichiro Fujimoto
潤一郎 藤本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP4341224A priority Critical patent/JPH06167992A/ja
Publication of JPH06167992A publication Critical patent/JPH06167992A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 任意の言葉の標準パターンを登録して音声認
識させる場合、誤認識が生ずるのを著しく低減すること
が可能である。 【構成】 標準パターン作成部6は、音声区間検出部4
から出力された特徴変換結果の音声に係わる部分を標準
パターンとしてそのままの形で辞書5に登録する登録部
11と、そのままの形で辞書5に登録されている複数の
標準パターンを例えばワーキングエリアに読み出し、各
標準パターンをそれぞれ複数の部分に分割する分割部1
2と、複数の特徴パターンをそれぞれ複数の部分に分割
したときにこれらを組合せ連結して新たな音声の標準パ
ターンを生成し、登録部11によりそのままの形で辞書
5に登録されている標準パターンと併せて、新たな標準
パターンの全てを,または一部を辞書5に登録するパタ
ーン生成部13とを備えている。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声認識等に用いられ
る音声パターンを作成する音声パターン作成装置および
それを用いた標準パターン登録装置に関する。
【0002】
【従来の技術】一般に、音声認識装置においては、実際
の音声認識を行なうに先立って、種々の音声の標準的な
特徴パターン,すなわち標準パターンを辞書に予め登録
しておき、音声認識時には、話者によって発声された未
知の音声の特徴パターンを辞書に登録されている種々の
標準パターンと照合してこれらの間の類似度を求め、種
々の標準パターンのうちで最も大きな類似度を与えた標
準パターンに対応した言葉(例えば単語)を認識結果と
して出力するようになっている。
【0003】ところで、この種の音声認識装置では、標
準パターンとして、例えば、「足立」,「井上」,「宇
野」,「遠藤」,「小野」,「加藤」,「木下」,「日
下部」,「小林」,「山田」の10人の名前の単語に対
応したパターンが登録されている時に、話者が「佐藤」
と発声すると、上記10個の標準パターンの中で「佐
藤」に最も類似している「加藤」が認識結果として出力
されてしまう。
【0004】このような誤認識を防止するため、従来で
は、特開昭61−133996号,特開昭63−295
394号に開示されているように、類似度に閾値を設け
る技術が提案されている。これによれば、種々の標準パ
ターンのうち、最も大きな類似度を与える標準パターン
が選択されたときにも、この類似度が閾値以下である場
合には、これをリジェクトすることができ、誤認識がな
されるのを防止できる。また、特開昭58−86598
号に開示されているような標準パターンに重み付けをし
て、上記のような誤認識を防止する技術も提案されてい
る。
【0005】
【発明が解決しようとする課題】しかしながら、上述し
た従来技術において、類似度に対しどの程度の閾値を設
定するかは非常に難かしく、誤認識等を確実に防止する
には限度があった。具体的に説明すると、上述した例に
おいて、「加藤」,「佐藤」の場合は、それぞれ/ka
too/,/satoo/と発音するから、両者は/k
/と/s/が違うだけで他はすべて同じである。この結
果、「加藤」,「佐藤」にはもともと大きな差がなく、
閾値を決めにくいという問題があった。また、この場
合、厳密に閾値を決めると、「加藤」と正しく発声して
いるのにリジェクトされてしまい、認識結果が得られな
いという事態が起きるという欠点があった。
【0006】また、標準パターンへの重み付けは、登録
される言葉が予め決まっている場合や、特定話者方式の
時に限られるという問題があった。具体的には、「佐
藤」と「加藤」との違いを強調するため、標準パターン
の「加藤」の/k/の部分に重みを付けておくというこ
とも考えられるが、これは、「加藤」と「佐藤」の違い
を強調するには十分であっても、入力される全ての言葉
に対して十分とはいえない。すなわち、例えば、「加
納」という名前が入力された場合に、「加藤」と異常に
高い類似度を示し、誤認識を生じさせる事態が生ずる。
【0007】このように、上述した従来技術では、任意
の言葉の標準パターンを登録して音声認識させる場合、
誤認識が生ずるのを著しく低減するには限度があり、汎
用的かつ実用的な音声認識装置を提供するのは非常に難
しいという欠点があった。例えば、音声認識の利用者が
任意の言葉を登録して使用するような場合、(特に、あ
る決められたキ−ワ−ドが認識されたとき動作するよう
なアプリケ−ションの場合)、特定の言葉が入力された
か否かを判定できず、このため、利用できる範囲に限界
があった。
【0008】本発明は、任意の言葉の標準パターンを登
録して音声認識させる場合、誤認識が生ずるのを著しく
低減することの可能な汎用的かつ実用的な音声認識装置
を実現することの可能な音声パタ−ン作成装置および標
準パタ−ン登録装置を提供することを目的としている。
【0009】
【課題を解決するための手段および作用】上記目的を達
成するために、請求項1記載の音声パタ−ン作成装置
は、複数の音声の特徴パターンのそれぞれを複数の部分
に分割する分割手段と、分割手段により分割された複数
の特徴パターンの各部分を組合せ連結して新たな音声の
特徴パターンを作成するパターン作成手段とを有してい
ることを特徴としている。これにより、他の言葉に対す
る音声の特徴パターンを簡単に作成することができる。
【0010】また、請求項2記載の標準パターン登録装
置は、請求項1記載の音声パタ−ン作成装置において、
複数の音声の特徴パターンを標準パターンとしてそのま
まの形で辞書に登録する登録手段をさらに有し、前記分
割手段は、前記標準パターンを複数の部分に分割し、前
記パターン作成手段は、分割された複数の標準パターン
の各部分を組合せ連結して新たな特徴パターンを生成
し、前記登録手段によりそのままの形で登録されている
前記標準パターンと併せて、該新たな特徴パターンを新
たな標準パターンとして辞書に登録することを特徴とし
ている。これにより、任意の言葉の標準パターンを登録
して音声認識させる場合、誤認識が生ずるのを著しく低
減することができる。
【0011】また、請求項9記載の音声パタ−ン作成装
置は、複数の音声の特徴パターンのそれぞれを、周波数
軸方向に一定量だけ高域へおよび/または低域へずら
し、新たな音声の特徴パターンを作成するパターン作成
手段を有していることを特徴としている。これにより、
元の標準パターンと同じ言葉であるが、話者が相違する
場合に対応した音声の標準パターンを簡単に作成するこ
とができる。
【0012】また、請求項10記載の標準パターン登録
装置は、請求項9記載の音声パターン作成装置におい
て、複数の音声の特徴パターンを標準パターンとしてそ
のままの形で辞書に登録する登録手段をさらに有し、前
記パターン作成手段は、複数の標準パターンのそれぞれ
を周波数軸方向に一定量だけ高域へおよび/または低域
へずらし、新たな音声パターンを作成したとき、前記登
録手段によりそのままの形で登録されている前記標準パ
ターンと併せて、該新たな音声パターンの全て,または
一部を標準パターンとして辞書に登録するようになって
いることを特徴としている。これにより、不特定話者用
の辞書を容易に作成することができ、不特定話者用の音
声認識装置に適用することができる。
【0013】
【実施例】以下、本発明の実施例を図面に基づいて説明
する。図1は本発明に係る音声パターン作成装置が適用
された音声認識装置の構成例を示す図である。図1を参
照すると、この音声認識装置は、マイクロフォン等の音
声入力部1と、音声入力部1から入力された音声信号を
アナログ−デジタル変換するA/D変換器2と、デジタ
ル変換された音声信号に対し特徴変換を施す特徴変換部
3と、特徴変換結果から音声に係わる部分を音声区間と
して検出する音声区間検出部4と、種々の標準パターン
が登録される辞書5と、標準パターンを作成し登録する
場合と実際の音声認識を行なう場合とで切り替えがなさ
れるスイッチSWと、標準パターンの作成,登録時に、
音声区間検出部4から出力された特徴変換結果の音声に
係わる部分に基づき音声の標準パターンを作成し、辞書
5に登録する標準パターン作成部6と、音声認識時に、
音声区間検出部4から出力される特徴変換結果の音声に
係わる部分,すなわち未知のパターンを辞書5に登録さ
れている種々の標準パターンと照合して類似度を求め、
最も大きな類似度を与える標準パターンに対応した言葉
(例えば単語)を認識結果として出力する認識部7とを
備えている。なお、上記特徴変換部3は、例えばFFT
(高速フーリエ変換器)により構成されており、この場
合には、音声信号を周波数領域に変換し、特徴量として
音声のスペクトルを得るようになっている。また、この
場合、A/D変換器2としては、16ビット,16KH
Z程度の特性のものが用いられる。
【0014】また、標準パターン作成部6は、音声区間
検出部4から出力された特徴変換結果の音声に係わる部
分を標準パターンとしてそのままの形で辞書5に登録す
る登録部11と、そのままの形で辞書5に登録されてい
る複数の標準パターンを例えばワーキングエリアに読み
出し、各標準パターンをそれぞれ複数の部分に分割する
分割部12と、複数の特徴パターンをそれぞれ複数の部
分に分割したときにこれらを組合せ連結して新たな音声
の標準パターンを生成し、登録部11によりそのままの
形で辞書5に登録されている標準パターンと併せて、新
たな標準パターンの全てを,または一部を辞書5に登録
するパターン生成部13とを備えている。
【0015】次にこのような構成の音声認識装置の動作
を図2のフローチャートを用いて説明する。実際の音声
認識動作を行なうに先立って、標準パターンの作成処理
が選択されるようにスイッチSWを切り替える。しかる
後、話者は、ある言葉,例えば単語に対応した音声の標
準パターンを辞書5に登録するため、この単語を発声す
る。話者の発声した単語音声が音声入力部1から入力さ
れると(ステップS1)、この入力音声信号は、特徴変
換部3において、特徴量(例えばスペクトル)に変換さ
れ(ステップS2)、音声区間検出部4において、特徴
変換結果のうち音声に係わる部分が音声区間として検出
され(ステップS3)、スイッチSWを介して標準パタ
ーン作成部6に入力する。
【0016】標準パターン作成部6では、先ず、登録部
11において、音声区間検出部4から出力された特徴変
換結果の音声に係わる部分を標準パターンとしてそのま
まの形で言葉(例えば単語)と対応させて辞書5に登録
する(ステップS4)。ステップS1乃至S4の処理を
繰り返し、例えば所定種類の単語音声の標準パターンが
そのままの形で辞書5に登録されたとき(ステップS
5)、さらに、分割部12では、辞書5にそのままの形
で登録された個々の標準パターンを複数の部分に分割す
る(ステップS6)。次いで、パターン生成部13で
は、複数種類の標準パターンの各分割部分を組合せ連結
して、新たな音声の標準パターンとして生成し(ステッ
プS7)、この新たな音声の標準パターンをも辞書5に
併せて登録する(ステップS8)。このようにして、辞
書5には、音声区間検出部4から出力されたそのままの
形での標準パターンと併せて、上記新たな標準パターン
が登録される。
【0017】辞書5に上記のような標準パターンが登録
された後、認識処理が選択されるようスイッチSWを切
り替える。この場合には、話者の発声が音声入力部1か
ら入力されると、この入力音声信号は、特徴変換部3で
特徴量(例えばスペクトル)に変換され、音声区間検出
部4,スイッチSWを介して認識部7に入力する。認識
部7では、スイッチSWを介して入力した未知音声のパ
ターンを前述のようにして辞書5に登録されている種々
の標準パターンと照合して類似度を求め、最も大きな類
似度を与える標準パターンに対応した言葉を認識結果と
して出力する。このようにして、一連の音声認識処理を
行なうことができる。
【0018】ところで、本実施例では、上記のように、
標準パターン作成部6に、分割部12とパターン生成部
13とがさらに設けられていることを特徴としており、
分割部12,パターン生成部13における処理の態様を
より詳細に説明する。
【0019】分割部12における分割の仕方として、辞
書5に登録された標準パターンを時間軸方向に例えばn
等分する態様が考えられる。より具体的には、上記ステ
ップS5の処理において、辞書5に例えば図3(a)に
示すように、3つの標準パターンA,B,C(それぞ
れ、単語「日下部」,「加藤」,「小林」に対応)が登
録された場合、分割部12では、図4に示すように、こ
れら3つの標準パターンA,B,Cを例えばワーキング
エリアにコピーし、しかる後、これらを時間軸方向に3
等分(n=3)し、それぞれの部分をA1,A2,A
3,B1,B2,B3,C1,C2,C3とするよう分
割することができる。
【0020】また、パターン生成部13は、分割部12
において分割された複数種類の標準パターンの各部分を
組合せて新たな標準パターンを生成するが、この際に一
定の組合せ規則が設定されている。すなわち、パターン
生成部13は、分割前の標準パターンにおいて、先頭に
あった部分は連結後も先頭に位置させるような規則を有
している。この規則によって、パターン生成部13は、
組合せを行なうときに、例えば、分割前のパターンで先
頭にあった部分を特別なグループとして扱い、先頭以外
の部分を連結してから先頭の付加を行なうようになって
いる。
【0021】また、パターン生成部13は、分割前の標
準パターンにおいて、末尾にあった部分は連結後も末尾
に位置させるような規則を有している。この規則によっ
て、パターン生成部13は、組合せを行なうときに、分
割前のパターンで末尾にあった部分を特別なグループと
して扱い、末尾以外の部分を連結してからこれを末尾に
付加するようになっている。
【0022】換言すれば、このような規則は、図4の例
において、分割された部分を組合せるときに、An,B
n,Cnの添え字nの順番を守ることを意味する。これ
によって、パターンの組替え時に常識的でない標準パタ
ーンが作成されるのを防止することができる。すなわ
ち、実際の音声認識処理においては、「佐藤」,「加
藤」の例からも明らかなように、先頭が違う音で、末尾
が同じ音のような場合が問題になるのであって、「佐
藤」と「藤加」のような先頭と末尾が入れ替わっている
ような言葉に関しては、一般には問題とはならず、従っ
て、上記規則に従った組合せにより作成される標準パタ
ーンのみが重要なものとなる。
【0023】このような規則に従って図4に示したよう
な3つの標準パターンA,B,Cの3分割された各部分
A1,A2,A3,B1,B2,B3,C1,C2,C
3に対して組合せ連結処理を行なうと、例えば図5に示
すような新しい標準パターンD(この例ではA2+B2
+B3)を作ることができ、この新たな標準パターンD
(A2+B2+B3)を図3(b)に示すように、標準
パターンA,B,Cと併せて辞書5に登録することがで
きる。この場合、組合せ連結によって作り出した新たな
パターンについても長さなどの情報を作りこれを付加し
て登録することができる。但し、図3(b)の例では、
辞書5への登録時に、そのままの形で登録される標準パ
ターンA,B,Cには、それぞれ言葉(単語),すなわ
ち「日下部」,「加藤」,「小林」が対応付けられる
が、新たに作成された標準パターンについては、所定の
言葉(単語)への対応付けがなされない。
【0024】いま例えば、A,B,Cの各標準パターン
がそれぞれ「日下部」,「加藤」,「小林」であった場
合、新たな標準パターンD(A2+B2+B3)は「佐
藤」のパターンに非常に近い物となる。従って、標準パ
ターンに重み付けなどをせずとも、類似の標準パターン
が自動的に作成されるので、類似音の入力音声に対して
誤った認識がなされるのを容易に防止することができ
る。すなわち、類似の音声入力に対しては、組合せによ
って新たに作り出された標準パターンの方が大きな類似
性をもつので、認識結果をリジェクトとして出力した
り、あるいは所定のメッセージを出力したりすることが
できる。すなわち、上記の例において、話者が「佐藤」
と発声すると、この入力音声は、標準パターンA,B,
C,Dのうち、新たな標準パターンDに最も類似し、従
って、「加藤」と誤認識しない。また、図3(b)の例
では、新たな標準パターンDに最も類似する場合でも、
この標準パターンDには単語との対応付けがなされてい
ないので、認識結果は、特定の単語ではなく、リジェク
トとなる。これにより、例えば、ある決められたキ−ワ
−ドが認識されたとき動作するようなアプリケ−ション
の場合、簡単な手法で、ある特定の言葉が発声されたか
否かを判定することができる。なお、図3(c)に示す
ように、新たな標準パターンDに対しても言葉(単語)
との対応付けを行なって辞書5に登録することも可能で
あり、この場合には、リジェクトではなく、正しい認識
結果を出力させることができる。
【0025】また、上記例では、標準パターンの時間軸
方向の分割数nを“3”としたが、nを3分割以外の分
割数とすることもできるし、また、等分割である必要も
ない。
【0026】例えば、通常、単語の音声認識の場合、1
0〜20m秒ごとにスペクトルを求める処理が行なわ
れ、また、単語の音声の短かいものは「2/ni/」,
「5/go/」のように単音節で構成され、継続時間が
200m秒程度である。従って、これを多数の部分に分
割しても、それぞれの部分の時間長は短かく、連結した
後の新しいパターン上での影響力は小さい。さらに、単
音節であれば、継続部は何分割しても同じ母音の部分片
となるので、分割することに意味がないという事実も考
慮し、図3(a)のように登録された複数の音声の標準
パターンA,B,Cのそれぞれを、時間軸に対して冒頭
近傍と、末尾近傍に2分し、Aの冒頭近傍にBの末尾近
傍を継ぎ足して新たな音声パターンとして登録し、Bの
冒頭近傍にCの末尾近傍を継ぎ足すことで新たな音声パ
ターンを作成して登録し、この過程を繰り返すことによ
り作成されたパターンの全て,または一部を新たな標準
パターンとして登録するようにすることもできる。
【0027】図6はこのような処理の流れを示すフロー
チャートである。図6を参照すると、分割部12は、辞
書5に登録されているm個の標準パターンを3分割する
かわりに2分割して、パターン生成部13に与える(ス
テップS11)。パターン生成部13では、先ず、本来
の言葉として登録されたm個の標準パターンに番号を付
け(ステップS12)、2分割された部分を各番号のパ
ターンの冒頭部,末尾部とする。次いで、カウンタiを
初期化して“1”にし(ステップS13)、i番目のパ
ターンの冒頭部と(i+1)番目のパターンの末尾部と
を連結して新しい標準パターンを形成する(ステップS
15)。iを“1”ずつ歩進して(ステップS16)、
上記処理を繰り返し行ない、カウンタiがmになったと
き(ステップS14)、m番目のパターンの冒頭に最初
の1番目のパターンの末尾を付け加えて(ステップS1
7)、処理を終了する。この結果、短かい音声にとって
も効果的な、また、無駄のないパターン連結を行なうこ
とができる。なお、上記処理例では、カウンタiを
“1”ずつ歩進し、パターン番号を1番ずつずらすよう
にしたが、1番ずつである必要もないし、また、ランダ
ムに継ぎ合わせるようにしても良い。
【0028】このように、登録されている複数種類の標
準パターンを時間軸方向にn分割して組合せを行ない、
新たな標準パターンを作成したが、その際、上述の例,
例えば2分割の例では、一定の時間長(例えば2等分な
ど)での分割を行なっている。しかしながら、このよう
な分割では、厳密には、単語中のある音韻をその真ん中
で分割してしまうことが避けられない。従って、音韻の
切れ目とパターンの分割部とをできる限り一致させるの
が望ましい。このために、例えば、複数の音声の標準パ
ターンA,B,Cのそれぞれについて、時間軸方向にパ
ターンの変化の大きな部分を検出し、この部分で、末尾
近傍に分割し、Aの冒頭近傍にBの末尾近傍を継ぎ足し
て新たな音声パターンとして登録し、Bの冒頭近傍にC
の末尾近傍を継ぎ足すことで新たな音声パターンを作成
して登録し、この過程を繰り返すことにより作成された
パターンの全て、または一部を新たな標準パターンとし
て登録するようにすることもできる。
【0029】図7は分割部12における上記のような処
理の流れを示すフローチャートである。図7の処理で
は、時間をi,周波数をjとし、音声の標準パターンを
a(i,j)とし、また標準パターンの全長をnで表わ
すとき、先ず、時間カウンタiを“1”に初期設定する
(ステップS21)。次いで、時間iにおけるパターン
全体に対して、次式のように、パターンの時間変化率d
iを求める(ステップS22)。
【0030】
【数1】
【0031】iを“1”ずつ歩進して(ステップS2
4)、上記処理を繰り返し、各iごとにパターンの時間
変化率diを求め、カウンタiが(n−1)になったと
きに(ステップS23)、パターン全長nの中から、d
iが最大となるようなiを求めて、これをinとする(ス
テップS25)。次いで、標準パターンを1〜inとi
n+1からnまでとに2分割する(ステップS25)。こ
のような分割によって、パターンが音韻の中央で不連続
に連結されるような事態を防止することができる。
【0032】あるいは、上記処理のかわりに、複数の音
声の標準パターンA,B,Cのそれぞれについて、時間
軸方向に音声エネルギーの極小部分を検出し、この部分
で末尾近傍に分割し、Aの冒頭近傍にBの末尾近傍を継
ぎ足して新たな音声パターンとして登録し、Bの冒頭近
傍にCの末尾近傍を継ぎ足すことで新たな音声パターン
を作成して登録し、この過程を繰り返すことにより作成
されたパターンの全てまたは一部を新たな標準パターン
として登録するようにすることもできる。
【0033】図8は分割部12における上記のような処
理の流れを示すフローチャートである。この処理では、
先ず、時間カウンタiを“1”に初期設定し(ステップ
S31)、次いで、a(i,j)をjについて合計する
ことによって、時間iでのエネルギーpiを求める(ス
テップS32)。しかる後、pi-1とpiとの差を求め、
これをDiとする(ステップS33)。次いで、iを
“1”ずつ歩進して(ステップS35)、上記処理を繰
り返し、各iごとにエネルギーpi並びに差Diを求め、
カウンタiがnとなったときに(ステップS34)、D
iに基づき、エネルギーの極小部分の検出を行なう。す
なわち、この検出処理では、piの極小値が、Di-1とD
iの符号が異なり、かつDiが正であることにより求めら
れるので、この点を求めてi’とすることによりなされ
る(ステップS36)。しかる後、パターンを1〜i’
とi’〜nとに分割する(ステップS37)。このよう
な分割によって、図7の処理例と同様に、パターンが音
韻の中央で不連続に連結されるような事態を防止するこ
とができる。なお、1つの音声中でこのようなi’が複
数個ある時は、その時のDiが小さい方を選んだり、あ
るいは先頭に近い(または遠い)ものを選んだり、さら
には中央に近いものを選ぶなどの処置を行なうことがで
きる。
【0034】上述した各例のように、標準パターンを時
間軸方向に分割し、これらを組合せるという処理は、元
の音声に類似した別の言葉を合成することを直感的に把
握することができ、非常に考え易いが、パターン間の類
似ということを考えれば、時間軸方向に分割するだけで
なく、周波数軸方向に分割しても同様の効果を得ること
ができる。従って、分割部12としては、例えば、図9
に示すように、複数の音声の特徴パターンA,B,Cの
それぞれを、周波数軸に対して高域近傍と低域近傍とに
2分して、それぞれA1,A2,B1,B2,C1,C
2とし、図10に示すように、Aの低域近傍A1にBの
高域近傍B2を継ぎ足して新たな音声パターンDとして
登録し、Bの低域近傍B1にCの高域近傍C2を継ぎ足
すことで新たな音声パターンEを作成して登録するとい
うような過程を繰り返して作成されたパターンD,E,
…の全て,または一部を新たな標準パターンとして登録
するようにすることもできる。
【0035】あるいは、分割部12における分割処理で
はなく、複数の音声の標準パターンA,B,Cのそれぞ
れを、周波数軸に対して一定量だけ高域へシフト(ずら
す)ような操作を施して作成された新たな音声パターン
の全て,または一部を新たな標準パターンとして登録す
るようにすることもできる。
【0036】図11は1つの標準パターンa(i,j)
を、周波数軸に対して一定量だけ高域へずらせる操作を
施して、新たな標準パターンを生成する処理の流れを示
すフローチャートである。この処理では、先ず、時間カ
ウンタiを“1”に初期設定する(ステップS41)。
次いで、周波数カウンタjを“1”に設定する(ステッ
プS42)。しかる後、a(i,j)を周波数方向へ例
えば2サンプル分シフトし、b(i,j+2)とする
(ステップS43)。jの範囲を1からJとするとき、
jを“1”ずつ歩進して(ステップS45)、j=1〜
J−2の範囲でこのシフト処理を繰り返し行ない、jが
J−2となったときに(ステップS44)、シフトの結
果、作成されたb(i,j)をa(i,j)に再び写像
する。すなわち、先ず、jを“1”に初期設定し(ステ
ップS46)、しかる後、b(i,j)をa(i,j)
に写像する(ステップS47)。jを“1”ずつ歩進し
て(ステップS49)、j=3〜Jの範囲でこの写像処
理を繰り返し行ない、jがJ−2となったときに(ステ
ップS48)、この写像処理を終了する。この写像処理
の結果、a(i,j)のj=1とj=2の部分は元のま
まのデータが残り、j=3〜Jの部分は、元の1からJ
−2までのデータがシフトされたことになる。このよう
にして、1つの時間iにおいて高域へのデータシフトを
行なった後、iを“1”ずつ歩進して(ステップS5
1)、上記と同様の処理を繰り返し行ない、iがn(全
パターン長)となったときに(ステップS50)、1つ
の標準パターンに対するシフト処理を完了する。なお、
この例では、周波数方向に2サンプルずらしたが、シフ
ト量は2サンプルに限らず任意に設定でき、サンプリン
グの周波数に応じて、これを変化させることができる。
【0037】また、上記例では、高域方向へシフトさせ
たが、低域方向へシフトさせることもできる。すなわ
ち、複数の音声の標準パターンA,B,Cのそれぞれ
を、周波数軸に対して一定量だけ低域へシフト(ずら
す)ような操作を施して作成された新たな音声パターン
の全て,または一部を新たな標準パターンとして登録す
るようにすることもできる。この処理は図11の処理と
基本的にほぼ同じになされ、図11のステップS43に
おいて、a(i,j+2)を周波数方向へ2サンプル分
シフトして、b(i,j)とする処理だけが相違する。
このようにして、1つの標準パターンに対して周波数軸
に対して2サンプル分だけ低域へシフトすると、a
(i,j)のj=J−1とJには元のままのデータが残
り、j=1〜J−2には、元のj=3からJのデータが
シフトされたことになる。
【0038】また、高域へのシフトと低域へのシフトと
の両方を施すこともできる。すなわち、複数の音声の標
準パターンA,B,Cのそれぞれを、周波数軸に対して
一定量だけ高域へずらせるような操作を施して作成され
た新たな音声パターンの全て,または一部を標準パター
ンとして登録し、さらに、元の標準パターンA,B,C
のそれぞれを周波数軸に対して一定量だけずらせるよう
な操作を施して作成された新たな音声パターンの全て,
または一部をも標準パターンとして登録するようにする
こともできる。
【0039】上記のような標準パターンの高域,低域へ
のシフトは、異なる発声者のパターンを作るような操作
に匹敵する。従って、高域または低域へのシフトを行な
って作成された新たな標準パターンを辞書5に登録する
ことによって、登録者(特定話者)の声よりも高い声に
対してまたは低い声に対して誤認識がなされないよう防
御することができ、さらに、この新たな標準パターンに
所定の単語を対応させれば、辞書5を不特定話者用のも
のにすることができる。
【0040】また、高域へのシフトと低域へのシフトと
の両方を施すことによって、登録者(特定話者)の声よ
りも高い声に対しても、また、低い声に対しても防御す
ることができ、さらに、この新たな標準パターンに所定
の単語を対応させれば、辞書5を不特定話者用のものに
容易にすることができる。
【0041】上述した各例では、標準パターンを時間軸
方向または周波数軸方向に分割して、違うもの同士を連
結して新たな標準パターンを作り、これを併せて辞書5
に登録するようにしており、これにより、例えば「加
藤」,「佐藤」のような類似語間での誤認識を防止でき
るが、例えば、登録すべき言葉の中に、「佐藤」,「佐
治」のように冒頭が同じ言葉や、「坂本」,「橋本」の
ように末尾が同じ言葉であるような場合、「佐藤」,
「佐治」の例において冒頭,末尾に分割して組合せる
と、組合せた結果にも、元の「佐藤」,「佐治」が生成
されることがある。「坂本」,「橋本」の場合にも同様
である。このような元の単語と同一のものが新たな標準
パターンとして登録されてしまうと、本来の正しい認識
ができなくなる。従って、このような新たな標準パター
ンは辞書5に登録されるべきではない。
【0042】そこで、このような問題を回避するため、
さらに、辞書5に登録されている元の標準パターン,新
たな標準パターンの全ての標準パターン間の類似性を求
め、類似性が決められた値よりも大きな標準パターンに
ついてはこれを消去するような処理を行なうこともでき
る。
【0043】図12はこのような処理の一例を示すフロ
ーチャートである。なお、この処理例では、元の標準パ
ターンに基づき新たな標準パターンを作成し、この新た
な標準パターンが元の標準パターンと併せて辞書5に登
録されたとき、先ず、辞書5に登録されている標準パタ
ーン(元の標準パターンの数W,並びに新たな標準パタ
ーンの数(L−W))の全て(合計L個の標準パター
ン)に、T1,T2,…,TLのように番号付けをする。
この際、例えば、元の標準パターンから順番に番号付け
をし、(T1〜TW)元の標準パターンの番号に続いて新
たな標準パターンの番号付けを行なう(TW+1〜TL)。
また、2つの標準パターン間の類似度を求めるために、
便宜上、2つの標準パターンのうちの一方の標準パター
ンの番号をrとし、他方の標準パターンの番号をkとす
る。
【0044】全ての標準パターンに対して番号付けを行
なった後、rを“1”に初期設定する(ステップS6
1)。次いで、kを“W+1”に設定する(ステップS
62)。しかる後、標準パターンTrと標準パターンTk
との間の類似度Srkを求める(ステップS63)。次い
で、rがkよりも小さいか否かを判断する(ステップS
64)。なお、この判断は、rとkとが同じである場合
(2つの標準パターンTr,Tkが同一のものである場
合)、およびrとkとが逆の場合(Tr,Tkに対し
k,Trの場合)を除外するためになされるものであ
る。すなわち、図13に示すようなテーブルにおいて、
新たな標準パタ−ンTW+1〜TLに関し、対角線DG上を
も含めてこの対角線DGよりも下の部分については以後
の処理を行なわせないためになされるものである。この
ような判断によりrがkよりも小さいとき、すなわち図
13のテーブルで対角線DGよりも上の部分の関係にあ
るとき、ステップS63で求めた類似度Srkが所定の閾
値S’よりも小さいか否かを判断する(ステップS6
5)。SrkがS’よりも小さいときには、2つの標準パ
ターンTr,Tk間の類似度が小さいと判断し、消去処理
を行なわない。これに対し、SrkがS’よりも小さくな
いときには、2つの標準パターンTr,Tk間の類似度が
大きいと判断し、一方の標準パターンTkを辞書5から
消去する(ステップS66)。
【0045】このようにして、ある2つの標準パターン
r,Tk間の類似度Srkを求め、これに基づき所定の処
理を行なった後、kを“1”ずつ歩進して(ステップS
68)、同様の処理を繰り返し行ない、kがLとなった
ときに(ステップS67)、rを“1”ずつ歩進して
(ステップS70)、同様の処理を繰り返し行ない、r
がL−1となったときに(ステップS69)、処理を終
了する。
【0046】上記のような処理は、換言すれば、kをW
+1からLまで順番に変化させ、またrを1からL−1
まで順番に変化させて、図13に示すようなTkとTr
の間の類似度表を作成し、この中で、大きな類似度とな
った2つの標準パターンのうちの一方のパターンTk
消去することにある。また、このような処理(具体的に
はステップS64の処理)において、新たな標準パター
ンの番号が元の標準パターンの番号よりも常に大きいの
で、消去対象となるのは、新たな標準パターンのみであ
り、元のパターンについてはこれを消去させずに残すこ
とができる。なお、この時の閾値S’の決め方について
は特に限定されないが、例えば、これを次のように決め
ることができる。すなわち、この標準パターンを使って
正しい認識が行なわれた時に、正解となる標準パターン
が獲得する類似度の90%程度に閾値S’を設定するこ
とができる。この方法によれば、まぎらわしい言葉の中
で、混乱を引き起こすような標準パターンを取り除くこ
とができる。
【0047】また、本発明の本来の目的は、類似した別
の言葉を区別するために、類似の標準パターンを準備す
ることにある。従って、全く類似性のない標準パターン
や、分割の都合で大した類似性がない標準パターンが生
成された場合には、これらを辞書5に登録する必要がな
く、また、これらを登録しないようにすることで、辞書
5の節約を行なうことができる。すなわち、連結により
作成された新たな標準パターンと元の標準パターンとの
間の類似性を調べ、元の標準パターン全てとの類似性が
決められた値よりも小さな標準パターンについてはこれ
を消去するようにすることができる。なお、これと同様
の方法は、特開昭61−292696号公報にも示され
ている。この公報に開示の方法は、予め、1つの音声に
対して複数の標準パターンが登録されている時、複数の
パターン間で類似度を求め、似ているものは一方を消去
するものであるが、この方法では、その際にどちらのパ
ターンを消去してもよく、この方法を本発明に適用する
と、元のパターンが消去されてしまうことがあり、この
結果正しい認識ができなくなってしまうという問題が生
じる。従って、本発明への適用においては、類似度が所
定閾値よりも低い標準パターンを消去するに際して、元
のパターンについてはこれが消去されず、新たなパター
ンのみが消去されるような処理がなされる必要がある。
【0048】図14はこのような処理の一例を示すフロ
ーチャートである。この処理では、元の標準パターンの
数をL1、連結操作等で作った新たな標準パターンの数
をL2とし、元の標準パターンの各々に、1〜L1の番号
付けをし、また、新たな特徴パターンの各々にL1+1
〜L1+L2の番号付けをしておく。また、変数kが元の
標準パターンを示し、rが操作で作り出した標準パター
ンを示す。
【0049】先ず、rにL+1を初期設定する(ステッ
プS81)。次いで、kに“1”を設定し(ステップS
82)、類似度の最大値mxを“0”に初期設定する
(ステップS83)。しかる後、番号kの元の標準パタ
ーンTkと番号rの新たな標準パターンTrとの間の類似
度Srkを求め(ステップS84)、この類似度Srkがm
xよりも大きいか否かを判断する(ステップS85)。
mxよりも大きい場合には、mxにこの類似度Srkの値
を設定する(ステップS86)。次いで、kを“1”ず
つ歩進して(ステップS88)、同様の処理を繰り返し
行ない、kがL1となったとき(ステップS87)、こ
のときのmxが所定閾値S’よりも大きいか否かを判断
する(ステップS89)。すなわち、上記の処理は、番
号kが1〜L1までのL1個の元の標準パターンTkのそ
れぞれと番号rの新たな標準パターンTrとの間のL1
の類似度を求め、これらの類似度のうちで最も大きな類
似度が所定の閾値S’よりも大きいか否かを判断するも
のである。この結果、最も大きな類似度mxが所定閾値
S’よりも大きくないときには、番号rの新たな標準パ
ターンTrは、L1個の元の標準パターンTkのいずれと
も類似度が小さいので、これを消去する(ステップS9
0)。次いで、rを“1”ずつ歩進して(ステップS9
2)、L2個の新たな標準パターンTrのそれぞれに対し
て上記と同様の処理を繰り返し行ない、rがL1+L2
なったときに(ステップS91)、処理を終了する。こ
のようにして、L2個の新たな標準パターンのうちで、
1個の元の標準パターンのいずれとも類似度の小さい
ものを消去することができる。なお、この処理におい
て、閾値S’の決め方としては、これを例えば全く類似
音を含まない言葉同士を比較した時の類似度と同程度に
選んでおけば良い。この結果、全ての登録すべき言葉と
類似性が乏しいようなもの、すなわち、標準パターンの
ノイズとなるようなものを消去することができる。従っ
て、辞書5の容量を節約して本来の効果を得ることがで
きる。
【0050】また、上記例では1〜L1を元の標準パタ
ーンとしたが、これとは逆に、1〜L2を新たな標準パ
ターンとし、L2+1からL1+L2を元の標準パターン
とし、1〜L2を消去対象として、同様の処理を行なう
こともできる。
【0051】
【発明の効果】以上に説明したように、請求項1記載の
発明によれば、複数の音声の特徴パターンのそれぞれを
複数の部分に分割し、分割手段により分割された複数の
特徴パターンの各部分を組合せ連結して新たな音声の特
徴パターンを作成するようにしているので、他の言葉に
対する音声の特徴パターンを簡単に作成することができ
る。
【0052】また、請求項2記載の発明によれば、請求
項1記載の音声パターン作成装置を用いた標準パターン
登録装置であって、複数の音声の特徴パターンを標準パ
ターンとしてそのままの形で辞書に登録する登録手段を
さらに有し、上記分割手段は、上記標準パターンを複数
の部分に分割し、上記パターン作成手段は、分割された
複数の標準パターンの各部分を組合せ連結して新たな特
徴パターンを生成し、登録手段によりそのままの形で登
録されている標準パターンと併せて、該新たな特徴パタ
ーンを新たな標準パターンとして辞書に登録するので、
任意の言葉の標準パターンを登録して音声認識させる場
合、誤認識が生ずるのを著しく低減することができる。
【0053】また、請求項3乃至請求項5記載の発明に
よれば、パターン作成手段は、複数の標準パターンのそ
れぞれを複数の部分に分割し、これらを組合せ連結して
新たな標準パターンを作成する際に、分割前の標準パタ
ーンにおいて先頭にあった部分は連結後の新たな標準パ
ターンにおいても先頭に位置させ、また、分割前の標準
パターンにおいて末尾にあった部分は連結後の新たな標
準パターンにおいても末尾に位置させるように組合せる
ので、常識的でないパターンが生成,登録されるのを防
止することができる。
【0054】また、請求項6乃至請求項8記載の発明に
よれば、分割手段は、複数の音声の標準パターンのそれ
ぞれを時間軸方向に分割し、パターン作成手段は、時間
軸方向に分割された各標準パターンの各部分を所定の規
則に従って組合せ連結して新たな音声パターンとして作
成し、この過程を繰り返すことにより作成された音声パ
ターンの全て,または一部を標準パターンとして登録す
るようになっているので、他の言葉に対する音声の特徴
パターンを容易に作成し、登録することができる。
【0055】また、請求項9記載の発明によれば、複数
の音声の特徴パターンのそれぞれを、周波数軸方向に一
定量だけ高域へおよび/または低域へずらし、新たな音
声の特徴パターンを作成するので、元の標準パターンと
同じ言葉であるが、話者が相違する場合に対応した音声
の標準パターンを簡単に作成することができる。
【0056】また、請求項10記載の発明によれば、請
求項9記載の音声パターン作成装置を用いた標準パター
ン登録装置であって、複数の音声の特徴パターンを標準
パターンとしてそのままの形で辞書に登録する登録手段
をさらに有し、パターン作成手段は、複数の標準パター
ンのそれぞれを周波数軸方向に一定量だけ高域へおよび
/または低域へずらし、新たな音声パターンを作成した
とき、登録手段によりそのままの形で登録されている標
準パターンと併せて、該新たな音声パターンの全て,ま
たは一部を標準パターンとして辞書に登録するようにな
っているので、不特定話者用の辞書を容易に作成するこ
とができ、不特定話者用の音声認識装置に適用すること
ができる。
【0057】また、請求項11記載の発明によれば、そ
のままの形で辞書に登録された元の標準パターンと前記
パターン作成手段により作成された新たな標準パターン
との間の類似性を求め、元の標準パターンとの類似性が
決められた値よりも大きな新たな標準パターンについて
は、これを辞書から消去するようになっているので、音
声認識においてまぎらわしい言葉の中で、混乱を生じさ
せるような標準パターンを取り除くことができる。
【0058】また、請求項12記載の発明によれば、そ
のままの形で登録された元の標準パターンと新たな標準
パターンとの間の類似性を求め、元の標準パターンとの
類似性が決められた値よりも小さな新たな標準パターン
については、これを辞書から消去するようになっている
ので、音声認識に不要な標準パターンを取り除くことが
できる。
【0059】また、請求項13記載の発明によれば、登
録手段は、複数の音声の標準パターンをそのままの形で
登録するに際し、該標準パターンを所定の言葉と対応付
けして辞書に登録する一方、パターン作成手段は、新た
な標準パターンを言葉との対応付けを行なわずに辞書に
登録するようになっているので、元の標準パターンに対
応した音声と多少類似しているが、これとは異なる音声
が入力したとき、この音声が新たな標準パターンに最も
類似する場合に、これをリジェクトすることができ、誤
認識がなされるのを有効に防止することができる。
【0060】また、請求項14記載の発明によれば、登
録手段は、複数の音声の標準パターンをそのままの形で
登録するに際し、該標準パターンを所定の言葉と対応付
けして辞書に登録し、また、パターン作成手段も、新た
な標準パターンを所定の言葉と対応付けして辞書に登録
するようになっているので、元の標準パターンに対応し
た音声と多少類似しているが、これとは異なる音声が入
力したとき、この音声が新たな標準パターンに最も類似
する場合には、これをも正しく認識させることができ
る。
【図面の簡単な説明】
【図1】本発明に係る音声パターン作成装置,標準パタ
ーン登録装置が適用された音声認識装置の構成例を示す
図である。
【図2】図1の音声認識装置の動作を示すフローチャー
トである。
【図3】辞書への標準パターンの登録例を示す図であ
る。
【図4】標準パターンA,B,Cのそれぞれを時間軸方
向に3等分する様子を示す図である。
【図5】図4のように時間軸方向に3等分した標準パタ
ーンを組合せて作成される新たな標準パターンの一例を
示す図である。
【図6】複数の標準パターンのそれぞれを時間軸方向に
分割して組合せ新たな標準パターンを作成する処理の流
れを示すフローチャートである。
【図7】複数の標準パターンのそれぞれを時間軸方向に
分割して組合せ新たな標準パターンを作成する処理の流
れを示すフローチャートである。
【図8】複数の標準パターンのそれぞれを時間軸方向に
分割して組合せ新たな標準パターンを作成する処理の流
れを示すフローチャートである。
【図9】標準パターンA,B,Cのそれぞれを周波数軸
方向に2等分する様子を示す図である。
【図10】図9のように周波数軸方向に2等分した標準
パターンを組合せて作成される新たな標準パターンの一
例を示す図である。
【図11】1つの標準パターンa(i,j)を、周波数
軸に対して一定量だけ高域へずらせる操作を施して、新
たな標準パターンを生成する処理の流れを示すフローチ
ャートである。
【図12】元の標準パターン,新たな標準パターンの全
ての標準パターン間の類似性を求め、類似性が決められ
た値よりも大きな標準パターンについてはこれを消去す
る処理の流れを示すフローチャートである。
【図13】標準パターン間の類似度表の一例を示す図で
ある
【図14】元の標準パターンと新たな標準パターンとの
間の類似性を調べ、元の標準パターン全てとの類似性が
決められた値よりも小さな標準パターンを消去する処理
の流れを示すフローチャートである。
【符号の説明】
1 音声入力部 2 A/D変換器 3 特徴変換部 4 音声区間検出部 5 辞書 6 標準パターン作成部 7 認識部 11 登録部 12 分割部 13 パターン生成部 SW スイッチ

Claims (14)

    【特許請求の範囲】
  1. 【請求項1】 複数の音声の特徴パターンのそれぞれを
    複数の部分に分割する分割手段と、分割手段により分割
    された複数の特徴パターンの各部分を組合せ連結して新
    たな音声の特徴パターンを作成するパターン作成手段と
    を有していることを特徴とする音声パターン作成装置。
  2. 【請求項2】 請求項1記載の音声パターン作成装置を
    用いた標準パターン登録装置であって、複数の音声の特
    徴パターンを標準パターンとしてそのままの形で辞書に
    登録する登録手段をさらに有し、前記分割手段は、前記
    標準パターンを複数の部分に分割し、前記パターン作成
    手段は、分割された複数の標準パターンの各部分を組合
    せ連結して新たな特徴パターンを生成し、前記登録手段
    によりそのままの形で登録されている前記標準パターン
    と併せて、該新たな特徴パターンを新たな標準パターン
    として辞書に登録することを特徴とする標準パターン登
    録装置。
  3. 【請求項3】 請求項2記載の標準パターン登録装置に
    おいて、前記パターン作成手段は、複数の標準パターン
    のそれぞれを複数の部分に分割し、これらを組合せ連結
    して新たな標準パターンを作成する際に、分割前の標準
    パターンにおいて先頭にあった部分は連結後の新たな標
    準パターンにおいても先頭に位置させるように組合せる
    ことを特徴とする標準パターン登録装置。
  4. 【請求項4】 請求項2記載の標準パターン登録装置に
    おいて、前記パターン作成手段は、複数の標準パターン
    のそれぞれを複数の部分に分割し、これらを組合せ連結
    して新たな標準パターンを作成する際に、分割前の標準
    パターンにおいて末尾にあった部分は連結後の新たな標
    準パターンにおいても末尾に位置させるように組合せる
    ことを特徴とする標準パターン登録装置。
  5. 【請求項5】 請求項2記載の標準パターン登録装置に
    おいて、前記パターン作成手段は、複数の標準パターン
    のそれぞれを複数の部分に分割し、これらを組合せ連結
    して新たな標準パターンを作成する際に、分割前の標準
    パターンにおいて先頭にあった部分は連結後の新たな標
    準パターンにおいても先頭に位置させ、また、分割前の
    標準パターンにおいて末尾にあった部分は連結後の新た
    な標準パターンにおいても末尾に位置させるように組合
    せることを特徴とする標準パターン登録装置。
  6. 【請求項6】 請求項2記載の標準パターン登録装置に
    おいて、前記分割手段は、複数の音声の標準パターンの
    それぞれを時間軸方向に分割し、前記パターン作成手段
    は、時間軸方向に分割された各標準パターンの各部分を
    所定の規則に従って組合せ連結して新たな音声パターン
    として作成し、この過程を繰り返すことにより作成され
    た音声パターンの全て,または一部を標準パターンとし
    て登録するようになっていることを特徴とする標準パタ
    ーン登録装置。
  7. 【請求項7】 請求項6記載の標準パターン登録装置に
    おいて、前記分割手段は、標準パターンを時間軸方向に
    等分割するか、または、時間軸方向において標準パター
    ンの変化の大きな部分を検出し、この部分で標準パター
    ンを分割するか、または、時間軸方向において音声エネ
    ルギーの極小部分を検出し、この部分で標準パターンを
    分割するようになっていることを特徴とする標準パター
    ン登録装置。
  8. 【請求項8】 請求項2記載の標準パターン登録装置に
    おいて、前記分割手段は、複数の音声の標準パターンの
    それぞれを周波数軸方向に分割し、前記パターン作成手
    段は、周波数軸方向に分割された各標準パターンの各部
    分を所定の規則に従って組合せ連結して新たな音声パタ
    ーンとして作成し、この過程を繰り返すことにより作成
    された音声パターンの全て,または一部を標準パターン
    として登録するようになっていることを特徴とする標準
    パターン登録装置。
  9. 【請求項9】 複数の音声の特徴パターンのそれぞれ
    を、周波数軸方向に一定量だけ高域へおよび/または低
    域へずらし、新たな音声の特徴パターンを作成するパタ
    ーン作成手段を有していることを特徴とする音声パター
    ン作成装置。
  10. 【請求項10】 請求項9記載の音声パターン作成装置
    を用いた標準パターン登録装置であって、複数の音声の
    特徴パターンを標準パターンとしてそのままの形で辞書
    に登録する登録手段をさらに有し、前記パターン作成手
    段は、複数の標準パターンのそれぞれを周波数軸方向に
    一定量だけ高域へおよび/または低域へずらし、新たな
    音声パターンを作成したとき、前記登録手段によりその
    ままの形で登録されている前記標準パターンと併せて、
    該新たな音声パターンの全て,または一部を標準パター
    ンとして辞書に登録するようになっていることを特徴と
    する標準パターン登録装置。
  11. 【請求項11】 請求項2または請求項10記載の標準
    パターン登録装置において、そのままの形で辞書に登録
    された元の標準パターンと前記パターン作成手段により
    作成された新たな標準パターンとの間の類似性を求め、
    元の標準パターンとの類似性が決められた値よりも大き
    な新たな標準パターンについては、これを辞書から消去
    するようになっていることを特徴とする標準パターン登
    録装置。
  12. 【請求項12】 請求項2または請求項10記載の標準
    パターン登録装置において、そのままの形で登録された
    元の標準パターンと新たな標準パターンとの間の類似性
    を求め、元の標準パターンとの類似性が決められた値よ
    りも小さな新たな標準パターンについては、これを辞書
    から消去するようになっていることを特徴とする標準パ
    ターン登録装置。
  13. 【請求項13】 請求項2または10記載の標準パター
    ン登録装置において、前記登録手段は、複数の音声の標
    準パターンをそのままの形で登録するに際し、該標準パ
    ターンを所定の言葉と対応付けして辞書に登録する一
    方、前記パターン作成手段は、新たな標準パターンを言
    葉との対応付けを行なわずに辞書に登録するようになっ
    ていることを特徴とする標準パターン登録装置。
  14. 【請求項14】 請求項2または10記載の標準パター
    ン登録装置において、前記登録手段は、複数の音声の標
    準パターンをそのままの形で登録するに際し、該標準パ
    ターンを所定の言葉と対応付けして辞書に登録し、ま
    た、前記パターン作成手段も、新たな標準パターンを所
    定の言葉と対応付けして辞書に登録するようになってい
    ることを特徴とする標準パターン登録装置。
JP4341224A 1992-11-27 1992-11-27 音声パターン作成装置およびそれを用いた標準パターン登録装置 Pending JPH06167992A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4341224A JPH06167992A (ja) 1992-11-27 1992-11-27 音声パターン作成装置およびそれを用いた標準パターン登録装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4341224A JPH06167992A (ja) 1992-11-27 1992-11-27 音声パターン作成装置およびそれを用いた標準パターン登録装置

Publications (1)

Publication Number Publication Date
JPH06167992A true JPH06167992A (ja) 1994-06-14

Family

ID=18344347

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4341224A Pending JPH06167992A (ja) 1992-11-27 1992-11-27 音声パターン作成装置およびそれを用いた標準パターン登録装置

Country Status (1)

Country Link
JP (1) JPH06167992A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100441181B1 (ko) * 1995-04-07 2005-04-06 소니 가부시끼 가이샤 음성인식방법및장치
CN112334975A (zh) * 2018-06-29 2021-02-05 索尼公司 信息处理设备、信息处理方法和程序

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100441181B1 (ko) * 1995-04-07 2005-04-06 소니 가부시끼 가이샤 음성인식방법및장치
CN112334975A (zh) * 2018-06-29 2021-02-05 索尼公司 信息处理设备、信息处理方法和程序

Similar Documents

Publication Publication Date Title
JP3078205B2 (ja) 波形の連結及び部分的重複化による音声合成方法
US20110131038A1 (en) Exception dictionary creating unit, exception dictionary creating method, and program therefor, as well as speech recognition unit and speech recognition method
JPH07334184A (ja) 音響カテゴリ平均値計算装置及び適応化装置
US20030120490A1 (en) Method for creating a speech database for a target vocabulary in order to train a speech recorgnition system
JPH0582599B2 (ja)
JP2876861B2 (ja) 自動採譜装置
JPH06167992A (ja) 音声パターン作成装置およびそれを用いた標準パターン登録装置
US6594631B1 (en) Method for forming phoneme data and voice synthesizing apparatus utilizing a linear predictive coding distortion
US5970454A (en) Synthesizing speech by converting phonemes to digital waveforms
JPH0854891A (ja) 音響分類処理装置及び方法、話者分類処理装置及び方法
JPH07319495A (ja) 音声合成装置のための合成単位データ生成方式及び方法
US20240144934A1 (en) Voice Data Generation Method, Voice Data Generation Apparatus And Computer-Readable Recording Medium
US6934680B2 (en) Method for generating a statistic for phone lengths and method for determining the length of individual phones for speech synthesis
US6502074B1 (en) Synthesising speech by converting phonemes to digital waveforms
JPH04324499A (ja) 音声認識装置
JP2757356B2 (ja) 単語音声認識方法および装置
JPS6060697A (ja) 音声標準特徴パタ−ン作成処理方式
KR100236962B1 (ko) 음소별 화자 종속 변이음 모델링 방법
JPS61223799A (ja) 音声合成装置
JP3536380B2 (ja) 音声認識装置
JPH0556519B2 (ja)
JPH05100695A (ja) 音声認識装置
JPH04347898A (ja) 音声認識方法
JPS6073592A (ja) 特定話者用音声認識装置
JPS6287993A (ja) 音声認識装置