JPS5912185B2 - 有声無声判定装置 - Google Patents

有声無声判定装置

Info

Publication number
JPS5912185B2
JPS5912185B2 JP128778A JP128778A JPS5912185B2 JP S5912185 B2 JPS5912185 B2 JP S5912185B2 JP 128778 A JP128778 A JP 128778A JP 128778 A JP128778 A JP 128778A JP S5912185 B2 JPS5912185 B2 JP S5912185B2
Authority
JP
Japan
Prior art keywords
voiced
outputs
voice
unvoiced
waveform
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP128778A
Other languages
English (en)
Other versions
JPS5494212A (en
Inventor
哲 田口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP128778A priority Critical patent/JPS5912185B2/ja
Publication of JPS5494212A publication Critical patent/JPS5494212A/ja
Publication of JPS5912185B2 publication Critical patent/JPS5912185B2/ja
Expired legal-status Critical Current

Links

Description

【発明の詳細な説明】 本発明は音声の有声無声判定を行なう有声無声判定装置
に関し、殊に高周囲雑音環境下において良好な有声無声
判定を行なうための有声無声判定装置に係るものである
音声波形における有声無声判定特性の音声の分析合成、
認識等における重要なパラメータであることが知られて
いる。
例えば、音声の分析合成系においては分析部で判定され
る有声無声判定結果が合成部において合成される合成音
の品質に大きな影響を及ぼす。音声波形の有声無声判定
方法としては、従来、音声波形のエネルギー、零交さ率
、単位遅れにおける自己相関係数、一次の線形予測係数
、線形予測分析における予測残差電力等種々の方法、あ
るいは前記種々の方法の組合せ等、が知られている。し
かしながら従来の方法、例えば音声波形のエネルギーを
用いる方法は、高周囲雑音環境下において、エネルギー
の小さい無声音が雑音の影響で、エネルギーが増大し、
無声音を有声音に間違がえることが多い。同様に零交さ
率を用いる方法は、比較的にエネルギーの小さい有声音
、例えば有声音同志のいわゆる渡りの部分や有声音の語
尾附近を無声音に間違がえることが多い。また、単位遅
れによる自己相関係数を用いる方法と一次の線形予測供
数を用いる方法と、線形予測分析における予測残差電力
を用いる方法とは、一般に周囲雑音がパワースペクトラ
ムで表現すると10低域が大きい有色雑音であるため多
大な影響を受ける。以上のように従来の有声無声判定法
は、高周囲雑音環境下において、判定誤りを起し易とい
う欠点を有していた。本発明の目的は、周囲雑音の影響
を軽減し、よ15り確実な有声無声判定を可能とする有
声無声判定装置を提供することにある。
本発明は音声波形から直接的に、あるいは音声のスペク
トラムを表現するパラメータでつくられる逆フィルタを
通過した音声波形(以下残差波形nという)(例えば、
板倉文忠、「統計的手法による音声の特徴抽出」、東北
大学電気通信研究所主催第8回シンポジウム。
小林勉、山本啓、「極性相関法を用いた有声/無声性の
判定について」、日本音響学会研究発表会講演論文集、
1976年525月)から直接的に、もしくは残差波形
から直接的に求めるのと等価な手法(例えば前記「統計
的手法による音声の特徴抽出」)で自己相関係、ケプス
トラム、極性相関係数、差分係数(例えば、福馬均、中
村顕一「音声ピッチ抽出の差分演算によ30る一手法」
、昭和52年度電子通信学会情報部門全国大会)等の相
関係数を計測する手段と、前記相関係数の周期性もしく
は時間的類似性を計測する手段とから構成されている。
本発明の特徴は、有声音の相関係数が概周期性35を持
ち、前記概周期がピッチ周期とよく一致するという第1
の性質と、無声音と多くの場合の周囲雑音とのそれぞれ
の相関係数が時間遅れ方向に収oハ:一束性を持つとい
う第2の性質とを利用して、周囲雑音の相関係数の影響
が大きい遅れ零附近の部分を除去した相関係数列の周期
性もしくは時間的類似性を計測して有声無声判定を行な
うことにある。
このため相関係数が概周期性を持つという有声音の特徴
を高周囲雑音環境下において正確に抽出し得る。従つて
前記環境下において、より正確な有声無声判定を行ない
得るという効果がある。一般に、音声波形の有声音部分
は概周期的であるため、音声波形から直接的に求められ
る有声音部分の相関波形は、例えば第1図に示す自己相
関波形の様に概周期的となる。一方、周囲雑音は通常、
周期性が弱く、周囲雑音波形から直接的に求められる相
関波形は、例えば第2図に示す自己相関波形の様に、遅
れ零附近の変化は大きく、遅れの増加に伴なつて=定値
に収束して行く。前記収束値は例えば自己相関係数、ケ
プストラム、極性相関係数等では零であり、差分係数等
では正のある値となる。また周囲雑音と有声音との相互
相関は一般に殆んど零であり、分析ウインドウの影響に
よる相互相関の分散を無視するならば、周囲雑音の混入
した有声音の相関波形は、自己相関波形を例に取れば、
例えば第3図に示す様に第1図に示す有声音の自己相関
波形と第2図に示す周囲雑音の自己相関波形との線形加
算で近似的に表現される。他の相関係数、例えばケブス
トラムについても、自己相関係数が波形のパクースペト
ラムのフーリエ逆変換であるのに対し、ケブストラムが
波形のパクースペクトラムの絶対値の対数のフーリエ逆
変換であることから明らかのように、周囲雑音の混入し
た有声音のケプストラムは、有声音のケプストラムと周
囲雑音のケプストラムとの線形加算で近似的に表現され
る。極性相関係数、差分係数等についても同様である。
故にピツチ周期程度またはピツチ周期以上の遅れ時間に
おける相関波形又は相関波形の変化分はほぼ有声音の相
関波形を表わしていることになる。また無声音の相関波
形は概して周期性を持たないのが普通である。従つて、
周囲雑音の混入した直接的な音声の相関波形のピツチ周
期およびピツチ周期の整数倍の遅れ時間における類似性
を計測することにより、又は相関波形の周期性を計測す
ることにより、前記音声の有声無声判定を確実に行なう
ことができる。また残差波形から求めた相関係数を用い
た場合でも、有声部の周期性は保存されており(例えば
、前記「極性相関法を用いた有声/無声性の判定につい
て」)、直接的な音声から求めた相関係数と同様の取扱
いができる。次に図面を参照して本発明を詳細に説明す
る。
第4図は本発明の第1の実施例を示すプロツク図である
。まず、周囲雑音を含んだ音声波形信号が波形入力端子
401を介してA/D変換器402へ入力される。
A/D変換器402は前記波形信号を標本化し、さらに
量子化して一時メモリ403へ出力する。一時メモリ4
03は連続的に入力される前記標本化波形信号を一時的
に記憶し、ウインドウ処理器404へ出力する。ウイン
ドウ処理器404は標本化波形信号に例えば矩形ウイン
ドウ、・・ミングウインドウ等の窓関数演算を実施し、
標本化波形信号を切出し、前記切出した波形信号を相関
器405へ出力する。相関器405は周囲雑音の影響が
殆んどない遅れ時間(例えば2mSEC)からピツチ周
期の最大値の整数倍(例えば15mSECの3倍の45
mSEC)までの相関係数を計測し有声度計測器406
へ出力する。
有声度計測器406は前記相関係数から有声度を計測し
、有声無声を判定し、判定結果を有声無声判定信号とし
て有声無声判定信号出力端子407を介して出力する。
次に図面を参照して有声度計測器406の第1の構成例
を詳細に説明する。
第5図は有声度計測器406の第1の構成例を示すプロ
ツク図である。本構成例は自己相関係数、ケプストラム
、極性相関係数等の相関係数に有効である。相関器40
5で計測された相関係数が相関係数入力端子501を介
して相似度計測器502へ入力される。
相似度計測器502は相似度、R(K)を例えばで計測
する。
但しρPは遅れPにおける相関係数、Kは遅れ時間間の
時間的距離でピツチ検索範囲の最小値(例えば2.5m
SEC)からピツチ検索範囲の最大値(例えば15mS
EC)までの範囲をとる。Nは周囲雑音の影響が殆んど
ない遅れ時間、Mは前記ピツチ周期の最大値の整数倍(
例えば15mSECの3倍の45mSEC)より短かい
遅れ時間である。相似度計測器502はさらに計測した
R(K)を最大値検索器503へ出力する。最大値検索
器503はR(K)の最大値RMAXを検索し、有無判
定器504へ出力する。有無判定器504はRMAXを
あらかじめ設定された判定基準値と比較して、RMAX
が前記判定基準値より大きければ有声と、小さければ無
声と判定し、判定結果を有声無声判定信号として有声無
声判定信号出力端子505を介して出力する。次に図面
を参照して有声度計測器406の第2の構成例を詳細に
説明する。
第6図は有声度計測器406の第2の構成例を示すプロ
ツク図である。本構成例は自己相関係数、ケプストラム
、極性相関係数等の相関係数に有効である。相関器40
5で計測された相関係数が相関係数入力端子601を介
して相似度計測器602と最大値検索器605とへ入力
される。
相似度計測器602は相似度S(K)を例えば、で計測
する。
但しρ2は遅れPにおける相関係数、Kは遅れ時間の時
間的距離でピツチ検索範囲の最小値(例えば2.5mS
EC)からピツチ検索範囲の最大値(例えば15mSE
C)までの範囲をとる。Nは周囲雑音の影響が殆んどな
い遅れ時間、Mは前記ピツチ周期の最大値の整数倍(例
えば45mSEC)より短かい遅れ時間である。相似度
計測器602はさらに計測したS(K)を最小値検索器
603へ出力する。最小値検索器603はS(K)の最
小値SMlNを検索し、有無判定器604へ出力する。
最大値検索器605は相関係数入力端子601を介して
供給される相関係数の最大値、ρMAXを検索し、判定
信号発生器606へ出力する。判定信号発生器606は
絹AXの増加につれて単調に増加する判定基準値信号を
発生し、有無判定器604へ出力する。有無判定器60
4は最小値検索器603より供給されるSMINと、判
定信号発生器606より供給される判定基準値信号とを
比較し、SMlNが前記判定基準値より小いさければ有
声と、大きければ無声と判定し、判定結果を有声無声判
定信号として有声無声判定信号出力端子607を介して
出力する。次に図面を参照して有声度計測器406の第
3構成例を詳細に説明する。第7図は有声度計測器40
6の第3の構成例を示すプロツク図である。本構成例は
自己相関係数、ケプストラム、極性相関係数等の相関係
数に有効である。相関器405で計測された相関係数が
相関係数入力端子701を介してピツチ抽出器702と
整数倍ピツチ検索器703とへ入力される。
ピツチ抽出器702は相関係数を用いたピツチ抽出法と
してよく知られた方法で、ピツチ周期と、ピツチ周期に
おける相関係数であるρMAXを求める。さらにピツチ
抽出器702は前記ピツチ周期を整数倍ピツチ検索器7
03へ、ρMAXを有無判定器704へそれぞれ出力す
る。整数倍ピツチ検索器703はピツチ抽出器702か
ら供給されるピツチ周期情報を用いて、相関係数入力端
子701を介して供給される相関係数の、ピツチ周期の
例えば2倍の遅延時間等の整数倍の遅延時間附近におけ
る最大の相関値、ρ2MAX等を検索する。さらに整数
倍ピツチ検索器703はρ2MAX等を有無判定器70
4へ出力する。有無判定器704は前記ρ2MAX等の
前記ρMAXに対する比率を計測し、前記比率があらか
じめ設定されている判定基準値より大きければ有声と判
定し、小さければ無声と判定して、判定結果を有声無声
判定信号として有声無声判定信号出力端子705を介し
て出力する。次に図面を参照して有声度計測器406の
第4の構成例を詳細に説明する。第8図は有声度計測器
406の第4の構成例を示すプロツク図である。本実施
例は差分係数等の相関係数、及び自己相関係数、ケプス
トラム、極性相関係数等の相関係数に有効である。相関
器405で計測された相関係数が相関係数人力端子80
1を介して極小値抽出器802とピツチ遅れ極小値抽出
器803と極大値抽出器804とピツチ遅れ極大値抽出
器805とピツチ抽出器806とへ人力される。
極小値抽出器802は周囲雑音の影響が殆んどない遅れ
時間の相関係数列から極小値、ρMINと、ρMINに
おける遅れ時間、TMINを検索し、ρMINを有無判
定器807へ、TMINをピツチ遅れ極小値抽出器80
3へそれぞれ出力する。ピツチ抽出器806は相関係数
を用いたピツチ抽出法としてよく知られる方法で、ピツ
チ周期Tpを求め、ピツチ遅れ極小値抽出器803とピ
ツチ遅れ極大値抽出器805とへ出力する。ピツチ遅れ
極小値抽出器803は、TMlN+TP附近の相関係数
列から、極小値ρMINDを検索し、有無判定器807
へ出力する。極大値抽出器804は周囲雑音の影響が殆
んどない遅れ時間の相関係数列から極大値、ρMAXと
ρMAXにおける遅れ時間、TMAXを検索し、ρMA
Xを有無判定器807へ、TMAXをピツチ遅れ極大値
抽出器805へそれぞれ出力する。ピツチ遅れ極大値抽
出器805は前記TMAXとピツチ抽出器806から供
給されるTpとによりTMAX+TPを計算し、前記計
算値附近の相関係都びリから、極大値ρMAXDを検索
し、有無判定器807へ出力する。有無判定器807は
有無度Vを例えばで計測する。
更に有無判定器807は例えばあらかじめ設定された判
定基準値とvとを比較して、vが前記判定基準値より大
きければ、有声と判定し、小さければ無声と判定して判
定結果を有声無声判定信号として有声無声判定信号出力
端子808を介して出力する。次に図面を参照して本発
明の第2の実施例を詳細に説明する。
第9図は本発明の第2の実施例を示すプロツク図である
。まず、周囲雑音を含んだ音声波形信号が波形入力端子
901を介してA/D変換器902へ入力される。
A/D変換器902は前記波形信号を標本化し、さらに
量子化して一時メモリ903へ出力する。一時メモリ9
03は連続的に入力される前記標本化波形信号を一時的
に記憶し、ウインドウ処理器904へ出力する。ウイン
ドウ処理器904は標本化波形信号に例えば矩形ウイン
ドウ、・・ミングウインドウ等の窓関数演算を実施し、
標本化波形信号を切出し、前記切出した波形信号をスペ
クトラムパラメータ抽出器905と逆フイルタ906と
へ出力する。スペクトラムパラメータ抽出器905は線
形予測法等によりスペクトラムパラメータを抽出し、逆
フイルタ906へ出力する。逆フイルタ906は前記ス
ペクトラムパラメータで表現される逆フイルタを構成し
、ウインドウ処理器904より供給される波形をろ波し
相関器907へ出力する。相関器907は周囲雑音の影
響が殆んどない遅れ時間(例えば2mSEC)からピツ
チ周期の最大値の整数倍(例えば15mSECの3倍の
45mSEC)までの相関係数を計測し有声度計測器9
08へ出力する。有声度計測器908は前記相関係数か
ら有声度を計測し、有声無声を判定し、判定結果を有声
無声判定信号として有声無声判定信号出力端子909を
介して出力する。なお有声度計測器908は第1の実施
例で示した第4図の有声度計測器406と等価である。
またスペクトラムパラメータ抽出器905と逆フイルタ
906とはA/D変換器902と一時メモリ903との
間、もしくは一時メモリ903とウインドウ処理器90
4との間へ移しても本発明を実施し得るのは明らかであ
る。
【図面の簡単な説明】
第1図は有声音部の自己相関波形の特徴を説明するため
の波形図、第2図は周囲雑音の自己相関波形の特徴を説
明するための波形図、第3図は周囲雑音の混入した有声
音部の自己相関波形の特徴を説明するための波形図、第
4図は本発明の第1の実施例を説明するためのプロツク
図である。 第4図において、401は波形入力端子、402はA/
D変換器、403は一時メモリ、404はウインドウ処
理器、405は相関器、406は有声度計測器、407
は有声無声判定信号出力端子。 第5図は有声度計測器406の第1の構成例を説明する
ためのプロツク図である。 第5図において、501は相関係数入力端子、502は
相似度計測器、503は最大値検索器、504は有無判
定器、505は有声無声判定信号出力端子。 第6図は有声度計測器406の第2の構成例を説明する
ためのプロツク図である。 第6図において、601は相関係数入力端子、602は
相似度計測器、603は最小値検索器、604は有無判
定器、605は最大値検索器、606は判定信号発生器
、607は有声無声判定信号出力端子。 第7図は有声度計測器406の第3の構成例を説明する
ためのプロツク図である。 第7図において、701は相関係数入力端子、702は
ピツチ抽出器、703は整数倍ピッチ検索器、704は
有無判定器、705は有声無声判定信号出力端子。 第8図は有声度計測器406の第4の構成例を説明する
ためのプロツク図である。 第8図において、801は相関係数入力端子、802は
極小値抽出器、803はピツチ遅れ極小値抽出器、80
4は極大値抽出器、805はピツチ遅れ極大値抽出器、
806はピツチ抽出器、807は有無判定器、808は
有声無声判定信号出力端子。 第9図は本発明の第2の実施例を説明するためのプロツ
ク図である。 第9図において、901は波形入力端子、902はA/
D変換器、903は一時メモリ、904はウィンドウ処
理器、905はスペクトラムパラメータ抽出器、906
は逆フイルタ、907は相関器、908は有声度計測器
、909は有声無声判定信号出力端子。

Claims (1)

    【特許請求の範囲】
  1. 1 音声の有声無声判定を行なう有声無声判定装置にお
    いて、音声波形から相関係数を計測する手段と、一定遅
    れ時間以降の前記相関係数の周期性もしくは時間的類似
    性を計測する手段とを有することを特徴とする有声無声
    判定装置。
JP128778A 1978-01-09 1978-01-09 有声無声判定装置 Expired JPS5912185B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP128778A JPS5912185B2 (ja) 1978-01-09 1978-01-09 有声無声判定装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP128778A JPS5912185B2 (ja) 1978-01-09 1978-01-09 有声無声判定装置

Publications (2)

Publication Number Publication Date
JPS5494212A JPS5494212A (en) 1979-07-25
JPS5912185B2 true JPS5912185B2 (ja) 1984-03-21

Family

ID=11497228

Family Applications (1)

Application Number Title Priority Date Filing Date
JP128778A Expired JPS5912185B2 (ja) 1978-01-09 1978-01-09 有声無声判定装置

Country Status (1)

Country Link
JP (1) JPS5912185B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6118989A (ja) * 1984-07-05 1986-01-27 松下電器産業株式会社 デイスプレイ装置
JPS6263989A (ja) * 1985-09-17 1987-03-20 松下電器産業株式会社 表示装置

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56104399A (en) * 1980-01-23 1981-08-20 Hitachi Ltd Voice interval detection system
JPS56111900A (en) * 1980-02-12 1981-09-03 Nippon Electric Co System discriminating existence of input voice
JPS5772199A (en) * 1980-10-23 1982-05-06 Tokyo Shibaura Electric Co Voice recognition device
US4731846A (en) * 1983-04-13 1988-03-15 Texas Instruments Incorporated Voice messaging system with pitch tracking based on adaptively filtered LPC residual signal
GB2139052A (en) * 1983-04-20 1984-10-31 Philips Electronic Associated Apparatus for distinguishing between speech and certain other signals
JP4490090B2 (ja) * 2003-12-25 2010-06-23 株式会社エヌ・ティ・ティ・ドコモ 有音無音判定装置および有音無音判定方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6118989A (ja) * 1984-07-05 1986-01-27 松下電器産業株式会社 デイスプレイ装置
JPS6263989A (ja) * 1985-09-17 1987-03-20 松下電器産業株式会社 表示装置

Also Published As

Publication number Publication date
JPS5494212A (en) 1979-07-25

Similar Documents

Publication Publication Date Title
KR100438826B1 (ko) 스무딩 필터를 이용한 음성 합성 시스템 및 그 방법
US4956865A (en) Speech recognition
Wong et al. Comparison of linear prediction cepstrum coefficients and mel-frequency cepstrum coefficients for language identification
US4074069A (en) Method and apparatus for judging voiced and unvoiced conditions of speech signal
JP3423906B2 (ja) 音声の動作特性検出装置および検出方法
JPS597120B2 (ja) 音声分析装置
JPH0990974A (ja) 信号処理方法
JPH06332492A (ja) 音声検出方法および検出装置
JPS5912185B2 (ja) 有声無声判定装置
KR940002437B1 (ko) 음성 인식방법 및 장치
JP2016042152A (ja) 音声認識装置及びプログラム
JP2797861B2 (ja) 音声検出方法および音声検出装置
JP2940835B2 (ja) ピッチ周波数差分特徴量抽出法
KR100526110B1 (ko) 화자인식시스템의 화자 특징벡터 생성방법 및 시스템
CN106920558A (zh) 关键词识别方法及装置
RU2174714C2 (ru) Способ выделения основного тона
JPH04100099A (ja) 音声検出装置
JPH05289691A (ja) 発話速度測定装置
Boll et al. Robust syntax free speech recognition
JP2001042889A (ja) 音声認識入力音声の音程正規化装置
Shimodaira et al. Robust pitch detection by narrow band spectrum analysis
JP2001083978A (ja) 音声認識装置
JPS6151320B2 (ja)
RU2807170C2 (ru) Детектор диалогов
Hu et al. Efficient estimation of perceptual features for speech recognition.