JPS58129499A - 音声認識方法 - Google Patents

音声認識方法

Info

Publication number
JPS58129499A
JPS58129499A JP1087582A JP1087582A JPS58129499A JP S58129499 A JPS58129499 A JP S58129499A JP 1087582 A JP1087582 A JP 1087582A JP 1087582 A JP1087582 A JP 1087582A JP S58129499 A JPS58129499 A JP S58129499A
Authority
JP
Japan
Prior art keywords
unvoiced
phoneme
voiceless
word
recognized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1087582A
Other languages
English (en)
Other versions
JPH021320B2 (ja
Inventor
入間野 孝雄
金指 久則
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Computer Basic Technology Research Association Corp
Original Assignee
Computer Basic Technology Research Association Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Computer Basic Technology Research Association Corp filed Critical Computer Basic Technology Research Association Corp
Priority to JP1087582A priority Critical patent/JPS58129499A/ja
Publication of JPS58129499A publication Critical patent/JPS58129499A/ja
Publication of JPH021320B2 publication Critical patent/JPH021320B2/ja
Granted legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 行ない、この認識音素系列を単語辞書と照合して単語を
認識する音声認識方法に関し、無声破裂音の音素認識率
を高めることによって単語認識率を向上させることを目
的とするものである。
先ず、従来のこの種の単語音声認識方法について、第1
図とともに説明する。第1図に示すように、入力単語音
声を分析し、この入力単語音声の特徴を抽出して入力単
語音声を構成する音素をB4識し、この認識された音素
系列をコンフユーノヨンマトリクスを用いて単語辞書中
の各単語と照合し、尤度(ユウド)の大きい単語を認識
単語とするものである。
第1図における音素認識段について説明すると、入力音
声をl Qmsずつのフレームに分割し、フレーム単位
の音素認識を行なった上で、これを音素単位にまとめ、
認識音素系列を得る。この段階において、無声子音には
さまれた母音のうちUとIは無声化しやすいため、通常
の母音認識手段では認識できず両側の無声子音と一体と
なり、3個の音素が1個の無声子音として認識されるこ
とが多い。よってこれを修正するために、認識音素系列
の各音素毎に第2図に示した処理を行なう。即ち、その
音素が無声子音である場合、その無声子音が真に一個の
音素であるか、あるいは無声子音,無声化母音,無声子
音が連続して一体となったものかどうか、音素継続時間
、・やワの時間変化等によりチェックし、3音素が連続
したものであると判断されたならば、その無声子音を前
後に2分割し、間に母音音素Ul(U(つ)と■(イ)
の中間音)を挿入する。
ところで、従来例において認識される無声子音の種類に
は、無声摩擦音S(す、シ、ス、セ、ソの子声部)、無
声破擦音C(チ、ソの子音部)、無声破裂音P(力、キ
、り、ケ、コ、り、テ、ト。
・母、ピj ” PK、ポの子音部)の3種類がある。
第2図に示す処理において、先ず無声子音(以下coと
表わす)が検出され、それが3個の無声音の連続と見な
された時、第1の無声子音を01、第2の無声子音をC
2で表わせば、CI 、C2の音素認識結果として、c
oの音素認識結果をそのまま用いていた。このことを音
素認識率で評価した場合、coの認識結果は事実上C1
の認識結果であることが多いので、C1にcoをあては
めることは問題ないが、C2にcoをあてはめた場合の
認識率は低かった。一般にC1とC2の音素は一致しな
いことが多いのであって、C2の音素認識はC1と別に
行なうべきであるが、C2区間及びその直前における音
声の物理的性質が不安定なため、C2の認識が困難であ
った。そのだめ、このことが単語認識率低下の一原因と
なるという欠点があった。
本発明は、上記従来技術の欠点を解消するものであり、
以下に本発明の一実施例について説明する。
本実施例と前記従来例の相異点は、無声子音coをC1
とC2に分割した後、第3図に示すように、coが無声
摩擦音S1又は無声破擦音Cであった場合、co区間中
に音声パワレベルの著しく低い区間、すなわち無音区間
Qが存在し、がっQ区間の後端と、C2に後続する母音
の前端との間の時間t(Cz)が予め定められたスレッ
ンユホールド値’rpより短かい時、C2を破裂音Pに
書き換えるものである。
第4図は単語「クラシキ」のうの尾部よりキの途中迄の
、フレーム(1Qms )毎の音素認識結果、及びパワ
レベルを、時間をそろえて表示したものである。第4図
において、coはSと認識された。
従って従来はC1、C2共にSとなり、C2は誤まりで
あったが、本実施例では、t(Cz)≦TPである限り
C2は正しくPと認識される。なお、本実施例ではピと
キの識別は行なっていないので、キはKIではなく、P
■で表わされる。
本実施例においては、Tp = 6 Qmsであるが、
この値は外部条件により変化し得るものであり、5 Q
msに限定するものではない。
第4図のフレーム毎の音素認識においてQとSが重複し
て認識されているのは、単語中のQ区間は、発声の不安
定によりたまたまパワレベルが低下したものか、音節の
境界である真の無音部なのか、ただちには判別できない
ためである。また、coの両端でSと母音が重複して認
識されているのは、現在、音素境界は重複認識すること
にしているためであり、特別な理由はない。
本発明は上記のような構成であり、C1がS又はCであ
り、C2がPである場合のC2の音素認識率は、従来は
とんど0%、であったものが、本発明により80〜90
%に向上した。不発゛明による音素並びを持つ単語は、
「クラシキ」(本実施例における正解認識音素系列はP
URAS I P I )、「タカツキ」(同じ(TA
KACUPI)等多数有り、これら単語が正しく音素認
識されることにより、単語認識率も向上するものである
【図面の簡単な説明】
第1図は、単語音声認識アルゴリズムの概略図、第2図
は、従来方法の無声音処理ルーチンを示す図、第3図は
、本発明の一実施例の無声音処理ルーチンを示す図、第
4図は、本発明の一実施例におけるフレーム毎の音素認
識を示す図である。 特許出願人 電子計算機基本技術研究組合) 代  理  人  星   野   恒   司、→1
’、、、+LJシ 第1図 第3図

Claims (1)

    【特許請求の範囲】
  1. 無声摩擦音または無声破擦音に後続する母音が無声化し
    、さらに無声破裂音が後続して3個の無声音音素が一つ
    ながりの無声音区間となっている場合、この無声音区間
    中にパワレベルの低い部分が存在し、かつそのパワレベ
    ルの低い部分の後端と後続する最初の有声音の前端との
    間の時間が予メ設定されたスレッシュホールド値より短
    かい時に、その区間を無声破裂音の区間として無声破裂
    音音素を認識することを特徴とする音声認識方法。
JP1087582A 1982-01-28 1982-01-28 音声認識方法 Granted JPS58129499A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1087582A JPS58129499A (ja) 1982-01-28 1982-01-28 音声認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1087582A JPS58129499A (ja) 1982-01-28 1982-01-28 音声認識方法

Publications (2)

Publication Number Publication Date
JPS58129499A true JPS58129499A (ja) 1983-08-02
JPH021320B2 JPH021320B2 (ja) 1990-01-11

Family

ID=11762502

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1087582A Granted JPS58129499A (ja) 1982-01-28 1982-01-28 音声認識方法

Country Status (1)

Country Link
JP (1) JPS58129499A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107666381B (zh) * 2011-10-14 2020-08-07 索尼公司 用于无线电通信***中的设备和方法以及计算机存储介质

Also Published As

Publication number Publication date
JPH021320B2 (ja) 1990-01-11

Similar Documents

Publication Publication Date Title
US20070203700A1 (en) Speech Recognition Apparatus And Speech Recognition Method
Vorstermans et al. Automatic segmentation and labelling of multi-lingual speech data
Ponting et al. The use of variable frame rate analysis in speech recognition
Derouault Context-dependent phonetic Markov models for large vocabulary speech recognition
JPS58129499A (ja) 音声認識方法
Yang Contextual effects on syllable duration
Fujimura et al. A duration modeling technique with incremental speech rate normalization.
Saravari et al. A demisyllable approach to speech synthesis of Thai A tone language
JPS58129498A (ja) 音声認識方法
Derouault Context-dependent phone Markov models for speech recognition
JPS6039691A (ja) 音声認識方法
JPS5872995A (ja) 単語音声認識方法
Ruske et al. Syllable-based stochastic models for continuous speech recognition
JPS60216394A (ja) 音声合成方式
JPS63217399A (ja) 音声区間検出装置
Coker Articulatory Timing in Speech Production; Articulatory Distinctive Features
JPS5969798A (ja) ピツチ抽出方法
JPS6073598A (ja) 音声認識方式
JPS61270800A (ja) 無声化音声合成方法
JPS5925240B2 (ja) 音声区間の語頭検出方式
JPS6225796A (ja) 音声認識装置
JPH0635494A (ja) 音声認識装置
JPS5849996A (ja) 平均音素パターン作成装置
Vayrynen et al. Enhancing Phoneme recognizer performance with a simple rule based language model
JPH0235500A (ja) 音声認識方式