JPS62247399A - 音声認識方式 - Google Patents

音声認識方式

Info

Publication number
JPS62247399A
JPS62247399A JP61091529A JP9152986A JPS62247399A JP S62247399 A JPS62247399 A JP S62247399A JP 61091529 A JP61091529 A JP 61091529A JP 9152986 A JP9152986 A JP 9152986A JP S62247399 A JPS62247399 A JP S62247399A
Authority
JP
Japan
Prior art keywords
word
words
speech
patterns
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61091529A
Other languages
English (en)
Inventor
芳春 阿部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP61091529A priority Critical patent/JPS62247399A/ja
Publication of JPS62247399A publication Critical patent/JPS62247399A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、文章を単位として連続発声された文章連続音
声の認識方式に関するものである。
〔従来の技術〕
文章連続音声の認識方式のうち、入力音声中の単語標準
パターンを利用した単語検出とこれによって作られる単
語列の後処理に基づく方式として、音節標準パターンを
併用する方式(rCVスポツティングによる連続音声認
識の検討」日本音響学会音声研究会資料S85−13.
  P、  90〜P。
98参照)及び単語標準パターンのみを用いる方式(「
連続DPによる連続単語認識実験とその考察」電子通信
学会論文誌、 ’84 /6.  Vol、J67−D
、 No、6.  P、  677〜P、  684参
照)が提案されている。
第1図は、この種方式の一般的構成を示すブロック図で
、1は音声入力端、2は音声波形のスペクトル分析等に
よる特徴抽出部、3は標準パターンとして用いる音声パ
ターンの記憶部、4はDP(D ynamic P r
ograming)マツチングによるスペクトル距離計
算等により、特徴抽出部2で抽出された入力音声パター
ンの任意の部分と標準パターン記憶部3に記憶された標
準パターンとの類似度を計算する類似度計算部、5は類
似度計算部4の計算結果に基づき単語を検出する単語検
出部、6は単語検出部5により検出された単語が構成す
る複数の単語列の中から時間的に連続し、かつ文法的に
正しい候補単語列を選択して出力する単語列選択部、7
は認識結果が出力される候補単語列出力端である。
次に動作について説明する。音声入力端1に加えられた
未知入力音声は、特徴抽出部2によって未知入力音声パ
ターンを表す特徴ベクトルの時系列に変換され、この未
知入力音声パターンの任意の部分と音声パターンの記憶
部3に記憶されている単語標準パターンとの類似度が類
似度計算部4によって求められる。単語検出部5は、こ
の類似度が所定の値より大きくなりかつ極小となるとき
の未知入力音声パターンの部分に、この単語標準パター
ンに対応する単語が存在するものとして検出する。一方
、単語列選択部6は、このような単語検出を対応する音
声パターンが標準パターンの記憶部3に記憶されている
単語のすべてについて行うことによって求められる検出
単語のなす列の中で時間的に連続し、しかも文法的に正
しい候補単語列を出力する。
〔発明が解決しようとする問題点3 以上のような構成において、音節標準パターンを用いる
方式は、認識単位として、単語の代わりに音節に対応す
る標準パターンを基本的な単位として用いるもので、未
知入力音声に対応する入力文章を音節の連続として表す
ので、任意の文章を普遍的に認識できる方式である。し
かしながら、単独では全く意味のない言語学上の単位で
ある音節の候補列中から単語に相当する部分を抽出し、
意味のある単語としてまとめるため、単語列選択のため
の処理が極めて複雑な組合わせ問題となるため、とても
実用的な処理時間では認識処理が行えず、又、処理時間
を小さくすればすべての解を探索できないため、十分な
認識率が得られないなどという問題点がある。
一方、単語標準パターンを用いる方式は、音節を基本的
な単位として用いる上述の方式に比べ、音節の組合せ候
補から単語を求める処理が不要となるので、上述のよう
な処理時間の問題はかなり軽減される。しかしながら、
本願のように文章連続音声を認識の対象とする場合、単
語によっては活用変化する単語が存在するため、活用変
化によって生じる数だけの種類の単語に対応する音声パ
ターンを標準パターンとして記憶しておかなければなら
ないので、多くのメモリが必要になるだけではなく、標
準パターン数の増加に伴う、類似度計算における演算量
の増大に見合うだけのハードウェア資源が必要となるな
どという問題点がある。
本発明は上記のような問題点を解消するためになされた
もので、標準パターンの記憶に要するメモリ量及び類似
度計算に要する演算量が少なくて済み、かつ単語列選択
における処理が複雑にならない音声認識方式を提供する
ことにある。
c問題点を解決するための手段〕 この発明に係る音声認識方式は、活用変化しない単語に
ついては、その単語全体に対応する音声パターンを標準
パターンとして記憶することは従来と変らないが、上述
のような問題点がある活用変化する単語については、従
来とは異なり活用変化によっても変化しない無変化部分
と、活用変化に伴って生じる活用語尾とに分1割し、こ
れらの単語成分に対応する音声パターンを標準パターン
として記憶しておくことにより、比較的少数の標準パタ
ーンで文章連続音声を認識できるようにしたものである
〔作用〕 この発明においては、基本的には単語を単位として一連
の処理を行なうので、単語列選択における処理が複雑に
なることはなく、また、活用変化する単語の活用語尾は
共通するものが多いので標準パターンもあまり多くなら
ず、全体としてのメモリ量及び類似度計算に要する演算
量も少なくて済む。
〔実施例〕
以下、本発明の一実施例を図について説明する。
第2図は、本発明の一実施例の標準パターンとして第1
図の標準パターン記憶部3に記憶されている音声パター
ンに対応する単語或いは単語成分の読みの異なるものの
読みの一覧表を示す図である。
図のa欄は、説明のためにつけられた番号で直接動作と
は関係しないものである。b欄は、標準パターンとして
登録されている音声パターンに対応する読みの異なる単
語及び単語成分の読みをカタカナで示したものである。
第3図は、この実施例の入力文章音声の中で使用化能な
単語の一覧表を示す図である。図のC欄は説明のための
番号であり、d欄、e欄及びf欄はそれぞれ使用可能単
語名2品詞の種類及びその読みを示す。
第4図はこの実施例で認識可能な人力文章音声の極く少
数の例を示す図である。図のg欄は説明のための番号、
h欄は入力文章例、i欄は候補単語列を示し、カタカナ
の読みの下の番号は第2図のa欄の番号に対応する。
次に上記各図を用いて本方式について具体的に説明する
第3図に示した本実施例の使用可能な単語のうち、活用
変化のある単語は、番号1,2.4.’8の4種の単語
「赤い」、「ある」、「大きい」。
「ない」だけである。
これらの単語の活用変化によって生じる変化形を、それ
ぞれの読み(読みはカッコの中に示す)と共に示せば、 単語「赤い」の変化形は、 「赤い」 (アカイ)、「赤<」(アヵク)。
「赤けれ」 (アカヶレ)、「赤かっ」 (アカカッ)
、「赤かろう」 (アカカロオ)であり、また、単語「
ある」の変化形は、「ある」 (アル)、「あら」 (
アラ)、「あり」 (アリ)、「あれ」 (アレ)、「
あろう」(アロオ)、「あっ」 (アラ) であり、更に、単語「大きい」の変化形は、「大きい」
 (オオキイ)、「大きく」(オオキク)、「太きけれ
」 (オオキケレ)、「太きかつ」 (オオキカッ)、
「大きかろう」(オオキカロオ) であり、また更に、単語「ない」の変化形は、「な゛い
」 (ナイ)、「なく」(ナタ)、「なけれ」 (ナケ
レ)、「なかっJ (ナカッ)。
「なかろう」 (ナカロオ) である。これら単語の活用変化によっても変化しない無
変化部分は、それぞれ「赤」 (アカ)。
「あ」 (ア)、「太き」 (オオキ)、「な」 (す
)であり、これらは第2図のそれぞれ番号2,1゜5.
13の所に示されるように、それらに対応する音声パタ
ーンが標準パターンとして第1図に示した標準パターン
記憶部3に記憶されている。
また、上記活用変化によって変化する活用語尾部分は、
異なる読みだけを示せば、 「イ」、「り」、「ケレ」、「カッ」、「カロオ」、「
ル」、「う」、「す」、「し」。
「ロオ」、「ツ」の11種だけである。
これらは、それぞれ第2図の番号3,8,9゜6、7.
20. 18. 19.21.22.26の行に示され
る通り、これらに対応する音声パターンが標準パターン
として記憶されている。
一方、第3図に示した本実施例で使用可能な単語のうち
、活用変化のないものは、番号が3,5゜6.7.9,
10,11,12,13.14゜15であり、これらは
、単語゛全体がそれぞれ第2図の番号4.10,11,
12.14:  15゜16.17,23.24.25
の行に示される通り、対応する音声パターンが標準パタ
ーンとして記憶されている。
このように本実施例では、使用可能な単語のうち、活用
変化のあるものについては、すべての変化形に対応する
音声パターンをもれなく標準パターンとして記憶するの
ではなく、無変化部分と変化部分とに分けて記憶してい
るので、記憶する標準パターンの数が少なくて済み、よ
って標準パターンの記憶に要するメモリ量及び類似度計
算に要する演算量も少なくて済む。しかも、使用可能な
単語だけから組み立てられる任意の文章に対応する文章
音声を単語列選択における処理が複雑となることなく認
識することが可能となる。
なお上記実施例では、使用可能な単語数は15であるが
、これはさらに使用できる単語が多い場合でも成立する
ことはいうまでもない。
また上記実施例では、活用変化する単語として形容詞型
の活用変化をする単語と、三段活用する単語のうち特に
単語「ある」について見られる活用変化の例を示したが
、他の型の活用変化をする単語についても、同じように
無変化部分と活用語尾部分を抽出することができること
も言うまでもない。
〔発明の効果〕
本発明は以上説明したように、活用変化のある単語につ
いて無変化部分と活用語尾部分とに分けて、対応する音
声パターンを標準パターンとして記憶するので、より少
ない標準パターンの数で、より多くの種類の文章を入力
することができ、単語列選択のための処理が複雑になる
ことなく、メモリの節約及び類似度を求めるための演算
量を節約できるという効果がある。
【図面の簡単な説明】
第1図は音声認識方式の一般的構成を示すブロック図、
第2図は本発明の一実施例の標準パターンの一覧表を示
す図、第3図は実施例の入力可能な単語の一覧表を示す
図、第4図は実施例の入力可能な文章の例と出力候補単
語列を示す図である。 図において、1は音声入力端、2は特徴抽出部、3は標
準パターン記憶部、4は類似度計算部、5は単語検出部
、6は単語列選択部、7は候補単語列出力端である。 代理人  大  岩  増  雄(ばか2名)手続補正
書(自発 昭和  年  月  日

Claims (1)

    【特許請求の範囲】
  1. 単語毎にその音声パターンを標準パターンとして予め記
    憶しておき、連続して入力される入力音声パターンに対
    して上記各標準パターンとの類似度を逐次求めることに
    より、入力音声中における単語の存在とその存在区間を
    検出し、検出された単語が構成する複数の単語列の中か
    ら時間的に連続しかつ文法的に正しい単語列を選択して
    出力する音声認識方式において、上記標準パターンとし
    て、活用変化しない単語については単語全体に対応する
    音声パターンを記憶し、活用変化する単語については各
    単語を無変化部分と活用語尾部分に分割し、各単語の無
    変化部分に対応する音声パターンと種類の異なる活用語
    尾部分に対応する音声パターンを記憶し、入力音声パタ
    ーンに対して上記各標準パターンとの類似度を求めるよ
    うにしたことを特徴とする音声認識方式。
JP61091529A 1986-04-21 1986-04-21 音声認識方式 Pending JPS62247399A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61091529A JPS62247399A (ja) 1986-04-21 1986-04-21 音声認識方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61091529A JPS62247399A (ja) 1986-04-21 1986-04-21 音声認識方式

Publications (1)

Publication Number Publication Date
JPS62247399A true JPS62247399A (ja) 1987-10-28

Family

ID=14028965

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61091529A Pending JPS62247399A (ja) 1986-04-21 1986-04-21 音声認識方式

Country Status (1)

Country Link
JP (1) JPS62247399A (ja)

Similar Documents

Publication Publication Date Title
JPH05127692A (ja) 音声認識装置
JPS63259697A (ja) 音声認識方法
CN112908308B (zh) 一种音频处理方法、装置、设备及介质
JPS62247399A (ja) 音声認識方式
JP3371761B2 (ja) 氏名読み音声合成装置
JPS6312312B2 (ja)
JP3440840B2 (ja) 音声認識方法及びその装置
JPH0415503B2 (ja)
JPS61184683A (ja) 認識結果選択方式
JP3059207B2 (ja) ネットワーク作成装置
JPH049320B2 (ja)
JPH05119793A (ja) 音声認識方法及び装置
JP3348735B2 (ja) パターン照合方式
JPS60188995A (ja) 文章発声方法
JPH0223876B2 (ja)
JPS6118760B2 (ja)
JPS60179799A (ja) 音声認識装置
JPH08320864A (ja) 音声合成用の辞書登録装置
JPS59186026A (ja) かな漢字変換方法
JPS63158598A (ja) 単語検出装置
JPS63158597A (ja) 単語検出方式
JPS63158600A (ja) 単語検出装置
JPS63103393A (ja) 単語認識装置
JPS60147797A (ja) 音声認識装置
JPH10334088A (ja) フリガナ付与方法及び装置及びフリガナ付与プログラムを格納した記憶媒体