JPS62111299A - 音声信号特徴抽出回路 - Google Patents

音声信号特徴抽出回路

Info

Publication number
JPS62111299A
JPS62111299A JP60251277A JP25127785A JPS62111299A JP S62111299 A JPS62111299 A JP S62111299A JP 60251277 A JP60251277 A JP 60251277A JP 25127785 A JP25127785 A JP 25127785A JP S62111299 A JPS62111299 A JP S62111299A
Authority
JP
Japan
Prior art keywords
vocal
filter
signal
vocal cord
feature extraction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP60251277A
Other languages
English (en)
Inventor
明寿 山田
永井 清隆
良二 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP60251277A priority Critical patent/JPS62111299A/ja
Publication of JPS62111299A publication Critical patent/JPS62111299A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野           一本発明は音
声認識に用いる音声の特徴抽出部や電話音声のデジタル
信号変換器(以下コーデックという〕に用い、る場合の
音声信号の低ビツトレートデジタル変換に用いられる音
声信号特徴抽出回路に関するものである。
従来の技術 近年、電話機器のデジタル化の傾向は、機器の機能拡大
や、通信回線利用の拡大とともに推進されてくるものと
考えられる0しかし、それに伴い有限の回線に対して多
くの加入者に対するサービスは限度があり、回線の有効
利用を行う必要が生じてぐる。この様な対策として音声
信号の圧縮、即ち低ビツトレートでの音声信号変換が必
要となつてきた。この様な低ビツトレートでの音声コー
デックの方法として、従来は音声信号のレベル変動のバ
ラツキを利用して信号に非線形のカーブをあてはめ圧縮
、伸張を行うものや、音声信号の相関性を利用して信号
波形の変化成分のみを符号化して圧縮率を増加し、低ビ
ツトレートを図る方法、或は音声のスペクトルパラメー
タとその残差を複数のパルスで近似し低ビツトレート化
を行うものがあった。また音声認識では、入力音声の特
徴を抽出し辞書と入力音声との比較をパターンマツチン
グで行うために膨大な入力音声データを圧縮しパラメー
タとして辞書に持たなければならず、入力音声もまた同
じパラメータとして抽出しなければならないために上記
と同様に、線形予測係数等を用いて声道パラメータを特
徴抽出としていた。
以下図面を参照しながら、上述した従来の音声信号特徴
抽出回路の一例について説明する。
第3図は従来の特徴抽出回路の構成を示すものである。
第3図において、入力音声は音声合成器102とパルス
発生回路IC)1とにより疑似音声を発生し入力音声と
減算器106によってその誤差成分を出力するこの誤差
成分の2乗を2乗誤差最少化評価回路103によって最
少になるようにパルス発生回路101のパルス位置ト各
々のパルス信号レベルを制御する。また音声合生器10
2に用いるパラメータは入力音声を線形予測分析104
によって構成される。ここで上記のようにして得られた
パルス位置、パルス信号レベル、及び線形予測パラメー
タを量子化マルチプレクサ105によって入力音声の特
徴を抽出する様に行っていた。この様な例は例えば、1
981年12月1日ビー・ニス・アタール(B、S、ム
tal) 米国特許第3263371号明細書に示され
ている。
発明が解決しようとする問題点 一般に音声、或は音声以外の発音メカニズム(例えば、
トロンポーン等の管楽器)をモデル化した場合、零極の
モデルで表すことができる。この零極モデルのフィルタ
係数を持つフィルタを雑音源で、駆動することによって
音を発生している。
音声でも声道部と声帯部とに分けて考える事が出来る。
従来用いられてきた特徴抽出方法ではこの声道モデルを
線形予測係数で近似した全極モデルとして位置ずけられ
るが、全極モデルで逆フィルタされた後の残差成分には
鼻子音や声帯から肺の部分では極モデルにのらず零点と
して音響系では扱われている。このためとの残差成分の
中には音声信号の多くの情報を含んでいた。
この様に零モデル系の導入によって発生系の完全な同定
が可能である事からみて、明らかに声帯発生モデルを用
いることが音声認識の特徴抽出として有効かつ、効率的
圧縮が可能であり、また音声コーデックの音声品質を向
上するものである。
しかしながらかかる従来の様な回路では、音声の発生メ
カニズムからは声道パラメータ抽出以外何等の対応関係
がなく、全極モデルで逆フィルタされた後の残差成分に
は多くの音声情報が残っており、それを単なるパルス発
声回路で代用していた。、この場合、特に無声音等の音
声部分では効率的な圧縮が出来ず音声鳳質の劣化や、完
全な音声の特徴を抽出する事ができなかった。
本発明は上記問題点に鑑み、音声、或はその他の音響信
号発生器を極零モデル化して特徴を抽出する事を主眼と
し、音源を単純なインパルス、或は雑音源として持ち入
力音響信号と、極零モデルからなる合成フィルタを介し
て得られる合成音との誤差を最少にする様に、上記した
合成フィルタの係数を最適化する事を特徴としているた
込、音声或はその他の音響信号に対して完全なモデル化
が可能となる。さらにこのモデル化された合成フィルタ
の係数を量子化器をもちいて音声コーデック、或は音声
認識装置に用いられる音声信号特徴抽出回路のデータ圧
縮として有効な音声信号特徴抽出回路を提供するもので
ある。
問題点を解決するだめの手段 上記問題点を解決する為に本発明の音声信号特徴抽出回
路は、入力音声を声道パラメータに分析する声道パラメ
ータ分析部と、雑音信号或はパルス信号源を持ちこの信
号源に接続した声帯特性フィルタにより得られる疑似声
帯信号を、上記声道パラメータ分析部によって得られる
声道パラメータによって形成される合成した声道フィル
タに接続し、さらにその出力から得られる合声音と入力
音声との差を検出し、その誤差を上記声帯特性フィルタ
に帰還し、その誤差が最少になるように声帯特性フィル
タの値を制御し、上記声道パラメータ分析部と、誤差が
最少化されて最適化された声帯特性フィルタとから得ら
れるそれぞれのパラメータを抽出するように構成されて
いる。
作用 本発明は上記した構成によって、入力音声を声道パラメ
ータと声帯パラメータとに分離し、音源として単純化し
たパルス、或は雑音を持ち声道パラメータとして入力信
号の同定が出来なかった場合、その残差成分を声帯フィ
ルタの係数を2乗誤差最少化アルゴリズムにより制御す
ることとなる。
即ち音声以外の入力音に対しても対応がとれるだけでな
く、入力音声に雑音等が重畳した場合、従来の様な線形
予測フィルタで構成される音声コーデックや音声認識に
用いられる特徴抽出回路の音声発声系の同定精度の劣化
に対しても、極零モデルとしてとらえられるので有効と
なる。
実施例 以下本発明の一実施例の音声信号特徴抽出回路について
1図面を参照しながら説明する。
第1図は本発明の一実施例における音声信号特徴抽出回
路の構成を示すものである。第1図において、1は声道
パラメータ分析部、2は声道フィルタ、3は雑音発生器
、4は声帯特性フィルタ、6は減算器、6は量子化器及
びマルチプレクサからなる量子化器マルチプレクサ、7
は2乗誤差最少化評価回路である。尚、雑音発生器3は
パルス発生器を用いてもよい。
以上の様に構成された音声信号特徴抽出回路について、
以下第1図をもってその動作を説明する。
まず第1図において、入力音声は声道パラメータ分析部
1により音声を声道に依存したパラメータに分析し量子
化器、及びマルチプレクサ6へと送出する。さらにそζ
で得られた声道パラメータを声道フィルタ2へと送出す
る。一方、雑音発生器3からの信号は声帯フィルタ4を
介して音声の疑似声帯音を得て声道フィルタ2を介して
合成音を得る0ここで得られた合成音と入力音声との比
較を減算器6によって行いその誤差を2乗誤差最少化評
価器7へと出力し、その評価に従って声帯特性フィルタ
4のフィルタ計数を制御する。なお、得られた声帯特性
フィルタ4の計数を量子化器マルチプレクサ6へと送出
する。
以上の様に本実施例によれば、音声信号特徴抽出回路に
関して、例えば声道パラメータ分析部を線形予測フィル
タ、声帯特性フィルタをトランスバーサル型フィルタに
よって構成し学習同定法を用いたアルゴリズムで上記し
たトランスバーサル型フィルタの係数を制御することで
構成する系の安定性も補償する事ができる。このように
音声発声メカニズムに基ずいて特徴抽出が出来るため、
例え音声と同時に不要な周囲雑音75閂入った場合でも
従来のような声道モデル(全極型モデル)のみに依存し
た場合のような声道パラメータの劣化が起こらず音声コ
ーデックにおける音声品質の向上が図れ、また音声認識
における音声の特徴抽出精度の向上が図れる〇 以下本発明の第2の実施例について図面を参照しながら
説明する。
第2図は本発明の第2の実施例を示す音声信号特徴抽出
回路の構成を示すブロック図である。
同図において、11は線形予測分析器(声道分析として
用いる)、12は音声の有声、無声を判別する有声無声
判別検出回路、13は減算器、14は全極型の声道フィ
ルタ、16はパルス信号発生器、16は雑音信号発生器
、17は零モデルフィルタ、18は2乗誤差最少化評価
回路である。
第2図において第1図に示す第1の実施例の構成と異な
るのは入力音声の有声、無声を有声無声判別検出回路1
2を設は更にその判別結果から有声の場合、パルス信号
発生器15を動作し、無声の場合雑音信号発生器16を
動作するようにスイッチ2oを制御する構成とした点で
ある。上記の様に構成された音声信号特徴抽出回路につ
いて以下その動作を説明する。
一般に音声は母音等のように音声のピッチに依存してい
る場合と摩擦音等のように音声のピッチに依存せず声道
内の狭めを通る気流の乱れ等から起きる音、或は唇を閉
じて鼻から音を出すような極零モデル(この場合鼻の空
間が零点となる)等色々な場合が考え、られる。
第2図においてはこの音声一般の発声機構を考えて、入
力音声の有声無声を判別回路12でもって判定しそのデ
ータも有効に用いて音声の特徴抽出を行うものである。
さらにこのデータを量子化器マルチプレクサ19へと送
出しより能率的な音声信号特徴抽出回路を実現したもの
である。
発明の効果 以上の様に本発明は、音声及びそれ以外の音響入力信号
に対して完全なモデルを当てはめることができ、また効
率的な音声の特徴を抽出するものである。さらに本発明
は、低ビツトレート音声コーデックにおける音声品質の
向上や、音声認識における入力音声の特徴抽出回路に対
しても有効な回路を提供するものである。
なお、第1,2の実施例において量子化器マルチプレク
サ6.19は各パラメータの出現頻度に応じて最適なビ
ットアロケーシヲンを行うこトモできる。またさらに声
帯特性フィルタをトランスバーサルフィルタで構成した
が、その他の全零型フィルタで構成してもよい。
【図面の簡単な説明】
第1図は本発明の第1の実施例における音声信号特徴抽
出回路の構成を示すブロック図、第2図は本発明の第2
の実施例における音声信号特徴抽出回路のブロック図、
第3図は従来例の音声信号特徴抽出回路のブロック図で
ある。 1.11・・・・・・声道パラメータ分析部、2.14
□・・・・・・声道フィルタ* 3g ’ 5 g ’
 6・旧・・雑音発生器、4.17・・・・・・声帯特
性フィルタ、5.13・・・・・・減算器、6,19・
・・・・・量子化器マルチプレクサ、7.18・・・・
・・2乗誤差最少化評価回路、12・・・・・・−有声
無声判別検出回路。

Claims (3)

    【特許請求の範囲】
  1. (1)入力音声を声道パラメータに分析する声道パラメ
    ータ分析部と、雑音信号或はパルス信号源を持ちこの信
    号源に接続した声帯特性フィルタにより得られる疑似声
    帯信号を、上記声道パラメータ分析部によって得られる
    声道パラメータによって形成される声道フィルタに接続
    し、さらにその出力から得られる合声音と入力音声との
    差を検出し、その誤差を上記声帯特性フィルタに帰還し
    、その誤差が最少になるように上記声帯特性フィルタの
    値を制御し、上記声道パラメータ分析部と、誤差が最少
    化されて最適化された上記声帯特性フィルタとから得ら
    れるそれぞれのパラメータを抽出する事を特徴とする音
    声信号特徴抽出回路。
  2. (2)入力信号を線形予測分析して得られた線形予測パ
    ラメータをもちいて声道フィルタを構成し、有限インパ
    ルス応答型フィルタによって声帯特性フィルタを構成し
    、白色信号あるいはパルス信号と上記声帯特性フィルタ
    とにより疑似声帯信号を作り、上記声道フィルタの出力
    からえられる合声音と入力音声との誤差の2乗を最少化
    するように声帯特性フィルタを制御してなることを特徴
    とする特許請求の範囲第1項記載の音声信号特徴抽出回
    路。
  3. (3)入力音声信号を分析し音声の有声または無声を検
    出し、検出信号により上記パルス信号と雑音信号とを切
    り替える事を特徴とする特許請求の範囲第1項記載の音
    声信号特徴抽出回路。
JP60251277A 1985-11-08 1985-11-08 音声信号特徴抽出回路 Pending JPS62111299A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60251277A JPS62111299A (ja) 1985-11-08 1985-11-08 音声信号特徴抽出回路

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60251277A JPS62111299A (ja) 1985-11-08 1985-11-08 音声信号特徴抽出回路

Publications (1)

Publication Number Publication Date
JPS62111299A true JPS62111299A (ja) 1987-05-22

Family

ID=17220401

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60251277A Pending JPS62111299A (ja) 1985-11-08 1985-11-08 音声信号特徴抽出回路

Country Status (1)

Country Link
JP (1) JPS62111299A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01261930A (ja) * 1988-04-13 1989-10-18 Kokusai Denshin Denwa Co Ltd <Kdd> 音声復号器のポスト雑音整形フィルタ
JPH09258795A (ja) * 1996-03-25 1997-10-03 Nippon Telegr & Teleph Corp <Ntt> ディジタルフィルタおよび音響符号化/復号化装置
JP2003323200A (ja) * 2002-04-29 2003-11-14 Docomo Communications Laboratories Usa Inc 音声符号化のための線形予測係数の勾配降下最適化
JP2004517348A (ja) * 2000-10-17 2004-06-10 クゥアルコム・インコーポレイテッド 非音声のスピーチの高性能の低ビット速度コード化方法および装置
US6859775B2 (en) 2001-03-06 2005-02-22 Ntt Docomo, Inc. Joint optimization of excitation and model parameters in parametric speech coders

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01261930A (ja) * 1988-04-13 1989-10-18 Kokusai Denshin Denwa Co Ltd <Kdd> 音声復号器のポスト雑音整形フィルタ
JPH09258795A (ja) * 1996-03-25 1997-10-03 Nippon Telegr & Teleph Corp <Ntt> ディジタルフィルタおよび音響符号化/復号化装置
JP2004517348A (ja) * 2000-10-17 2004-06-10 クゥアルコム・インコーポレイテッド 非音声のスピーチの高性能の低ビット速度コード化方法および装置
US6859775B2 (en) 2001-03-06 2005-02-22 Ntt Docomo, Inc. Joint optimization of excitation and model parameters in parametric speech coders
JP2003323200A (ja) * 2002-04-29 2003-11-14 Docomo Communications Laboratories Usa Inc 音声符号化のための線形予測係数の勾配降下最適化
JP4489371B2 (ja) * 2002-04-29 2010-06-23 株式会社エヌ・ティ・ティ・ドコモ 合成音声を最適化する方法、音声合成フィルタを生成する方法、音声最適化方法及び音声最適化装置

Similar Documents

Publication Publication Date Title
Yu et al. DurIAN: Duration Informed Attention Network for Speech Synthesis.
AU656787B2 (en) Auditory model for parametrization of speech
Anusuya et al. Front end analysis of speech recognition: a review
Talkin et al. A robust algorithm for pitch tracking (RAPT)
KR100316077B1 (ko) 분산형음성인식시스템
Bahl et al. Multonic Markov word models for large vocabulary continuous speech recognition
Algazi et al. Transform representation of the spectra of acoustic speech segments with applications. I. General approach and application to speech recognition
CN111724809A (zh) 一种基于变分自编码器的声码器实现方法及装置
JPH08335091A (ja) 音声認識装置、および音声合成装置、並びに音声認識合成装置
Hagen Robust speech recognition based on multi-stream processing
Ziółko et al. Wavelet method of speech segmentation
JPS5827200A (ja) 音声認識装置
JPS62111299A (ja) 音声信号特徴抽出回路
JP3523382B2 (ja) 音声認識装置及び音声認識方法
Kurcan Isolated word recognition from in-ear microphone data using hidden markov models (HMM)
Wang et al. An experimental analysis on integrating multi-stream spectro-temporal, cepstral and pitch information for mandarin speech recognition
JPH05307395A (ja) 音声合成装置
Kotnik et al. Efficient noise robust feature extraction algorithms for distributed speech recognition (DSR) systems
CN114220414A (zh) 语音合成方法以及相关装置、设备
JPS62111300A (ja) 音声分析合成回路
Hernando Pericás et al. A comparative study of parameters and distances for noisy speech recognition
Brown et al. Characterization of spectral transitions with applications to acoustic sub-word segmentation and automatic speech recognition
JP2000099099A (ja) データ再生装置
JP3342310B2 (ja) 音声復号化装置
JP2658426B2 (ja) 音声認識方法