JP2841797B2 - 音声分析・合成装置 - Google Patents

音声分析・合成装置

Info

Publication number
JP2841797B2
JP2841797B2 JP2237545A JP23754590A JP2841797B2 JP 2841797 B2 JP2841797 B2 JP 2841797B2 JP 2237545 A JP2237545 A JP 2237545A JP 23754590 A JP23754590 A JP 23754590A JP 2841797 B2 JP2841797 B2 JP 2841797B2
Authority
JP
Japan
Prior art keywords
band
sound source
parameter
harmonic
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2237545A
Other languages
English (en)
Other versions
JPH04116700A (ja
Inventor
勝志 瀬座
裕久 田崎
邦男 中島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2237545A priority Critical patent/JP2841797B2/ja
Publication of JPH04116700A publication Critical patent/JPH04116700A/ja
Application granted granted Critical
Publication of JP2841797B2 publication Critical patent/JP2841797B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は、音声信号をデジタル伝送あるいは蓄積する
ときに用いる音声分析・合成装置の改良に関するもので
ある。
[従来の技術] 入力音声信号を低ビットレートで符号化する方法とし
て、一定時間の分析フレーム(以下、フレームと略す)
毎にスペクトル包絡分析して得られる音声合成フィルタ
を、有声音の場合はピッチ周波数間隔のインパルス列、
無声音の場合は白色雑音で駆動するボコーダ式が知られ
ており、例えば“ディジタル音声処理”古井貞煕著pp.5
5、図4.14、東海大学出版会、1985年9月25日により報
告されている。
第3図および第4図は、上記文献と同様の構成を表す
図であり、第3図は分析部を、第4図は合成部を表す。
第3図において、(1)は入力音声信号、(2)はこの
入力音声信号(1)からスペクトル包絡を表すパラメー
タを求めるスペクトル包絡分析手段、(3)はこのスペ
クトル包絡分析手段(2)により出力されるスペクトル
包絡パラメータ、(22)は入力音声信号(1)のフレー
ムのピッチ周期を求めるピッチ周期抽出手段、(23)は
このピッチ周期抽出手段(22)によって求められたピッ
チ周期、(24)は入力音声信号(1)のフレームの有声
・無声を判定する有声・無声判定手段、(25)はこの有
声・無声判定手段(24)の出力である有声・無声情報で
これらにより分析部(I)を構成する。
第4図において、(20)は音声の周波数的な特徴を付
与する音声合成フィルタ手段、(21)はこの音声合成フ
ィルタ手段(20)で合成された合成音声、(26)は上記
ピッチ周期(23)によりピッチ周期間隔のインパルス列
を生成するインパルス列生成手段、(27)はこのインパ
ルス列生成手段(26)の出力であるインパルス列、(2
8)は白色雑音生成手段、(29)はこの白色雑音生成手
段(28)の出力である白色雑音、(30)は上記有声・無
声情報(25)により上記音声合成フィルタ手段(20)に
入力させる信号を上記インパルス列(27)と上記白色雑
音(29)とに切り替える切り替えスイッチでこれらによ
り合成部(II)を構成する。
次に、従来装置の動作を説明する。
まず、分析部(I)について説明する。
スペクトル包絡分析手段(2)は,入力音声信号
(1)を入力とし、スペクトル包絡を表すパラメータを
求め、これをスペクトル包絡パラメータ(3)として出
力する。ピッチ周期抽出手段(22)は、入力音声信号
(1)を入力とし、該フレームのピッチ周期を求め、こ
れをピッチ周期(23)として出力する。有声・無声判別
手段(24)は入力音声信号(1)を入力とし、該フレー
ムの有声・無声判定を行いその結果を有声・無声情報
(25)として出力する。
次に合成部(II)を説明する。
切り替えスイッチ(30)は、有声・無声情報(25)が
有声音の場合はインパルス列生成手段(26)に、無声音
の場合は白色雑音生成手段(28)に接続される。該フレ
ームが有声音の場合、インパルス列生成手段(26)はピ
ッチ周期(23)を入力とし、ピッチ周期間隔のインパル
ス列を生成し、これをインパルス列(27)として音声合
成フィルタ手段(20)に出力する。無声音の場合、白色
雑音生成手段(28)は白色雑音を生成し、これを白色雑
音(29)として音声合成フィルタ手段(20)に出力す
る。音声合成フィルタ手段(20)は、入力されたスペク
トル包絡パラメータ(3)から該当する音声合成フィル
タを求め、該フレームが有声音の場合インパルス列(2
7)で、無声音の場合白色雑音(29)で、このフィルタ
を駆動して音声を合成し、これを合成音声(21)として
出力する。
[発明が解決しようとする課題] 以上説明したように、従来装置では音声信号を有声、
無声音の2つに分類し、有声音の場合ピッチ周期間隔の
インパルス列を、無声音の場合白色雑音を音声合成フィ
ルタ手段の駆動音源としている。このようにインパルス
列や白色雑音を単独で駆動音源とすると、有声音の立ち
上がりや立ち下がり、有声音から無声音の渡り部分や、
声帯波雑音の多い話者の音声の場合に音声の過渡部だけ
でなく定常母音部でも、合成音の音質が劣化することが
あった。
本発明は上記課題の解消を行うものである。
[課題を解決するための手段] 本発明の音声分析・合成装置は、分析部に入力音声信
号を複数の周波数帯域に分割し、各帯域に含まれる調波
成分と雑音成分の比率を求める帯域別雑音比率推定手段
と、入力された音声信号から調波音源のパラメータを求
め音源パラメータとして出力する音源パラメータ抽出手
段とを備え、合成部に上記音源パラメータより調波音源
を求め出力する調波音源生成手段と、白色雑音を出力す
る白色雑音生成手段と、各帯域毎に調波音源と白色雑音
の振幅比をその帯域の雑音振幅比に調整し、駆動音源と
して出力する帯域別振幅調整手段と、駆動音源で音声合
成フィルタを駆動して音声を合成する音声合成フィルタ
手段を備えたものである。
[作用] 本発明における帯域別雑音比推定手段は、入力音声信
号を複数の周波数帯域に分割し、各帯域に含まれる調波
成分と雑音成分の振幅比を求め、帯域別雑音比として出
力し、音源パラメータ抽出手段は入力された音声信号か
ら調波音源のパラメータを求め音源パラメータとして出
力し、調波音源生成手段は音源パラメータより調波音源
を生成し、白色雑音生成手段は白色雑音を生成する。帯
域別振幅調整手段は、各帯域の調波成分と雑音成分の振
幅比にしたがって、前記調波音源と前記白色雑音の振幅
を調整し、これを重ね合わせたものを駆動音源とする。
音声合成フィルタ手段は駆動音源で音声合成フィルタを
駆動して音声を合成する。
[実施例] (実施例1) 以下、本発明の一実施例を第1図について説明する。
第1図は本発明の分析部(I)の一実施例を示す構成
図、第2図は本発明の合成部(II)の一実施例を示す構
成図である。第1図において、(1)は入力音声信号、
(2)はこの入力音声信号(1)の線形予測分析を行い
スペクトル包絡パラメータを求めるスペクトル包絡分析
手段、(3)はそのスペクトル包絡パラメータ、(4)
は上記スペクトル包絡分析手段(2)で線形予測分析に
よって求められた線形予測残差信号の振幅(5)は上記
入力音声信号(1)から音源パラメータを求める音源パ
ラメータ抽出手段、(6)はその音源パラメータ、
(7)は上記入力音声信号(1)の帯域毎に雑音成分の
比率を求める帯域別雑音比推定手段、(8)はその帯域
別雑音比で、これらにより分析部(I)を構成してい
る。
第2図において、(9)は上記音源パラメータ(6)
からインパルス列を生成し調波音源として出力する調波
音源生成手段、(10)はその調波音源、(11)は白色雑
音生成手段、(12)はこの白色雑音生成手段(11)で生
成された白色雑音、(13)は上記帯域別雑音比(8)に
対応する帯域毎に、上記調波音源(10)と上記白色雑音
(12)の振幅比を上記帯域別雑音比(8)に従って調整
して駆動音源を求める帯域別振幅調整手段で、振幅調整
手段(14)、帯域フィルタ(16)、駆動音源生成手段
(18)から構成される。なお(15)は振幅調整手段(1
4)の出力である振幅調整音源、(17)は帯域フィルタ
(16)の出力である帯域別駆動音源、(19)は駆動音源
生成手段(18)の出力である駆動音源である。(20)は
上記スペクトル包絡パラメータ(3)と駆動音源(19)
から音声を合成する音声合成フィルタ手段、(21)はそ
の出力である合成音声であり、これらにより合成部(I
I)構成している。
以上のように構成された装置にあって、まず分析部
(I)の動作を説明する。
スペクトル包絡分析手段(2)では、スペクトル包絡
を分析する方法として、例えば、入力音声信号(1)の
線形予測分析を行い線形予測フィルタパラメータを求
め、これをスペクトル包絡パラメータ(3)として出力
し、また、入力音声信号(1)を線形予測逆フィルタリ
ングすることにより得られる線形予測残差信号(以下、
残差信号と略す)の振幅を求め、これを振幅(4)とし
て出力する。音源パラメータ抽出手段(5)は、入力音
声信号(1)を入力とし、音源パラメータとして、例え
ば、ピッチ周期を求め、音源パラメータ(6)を出力す
る。帯域別雑音比推定手段(7)は、入力音声信号
(1)を入力とし、有限M個の帯域毎に、音声信号に対
する雑音成分の比率を求め、これを帯域別雑音比(8)
として出力する。帯域別雑音比(8)を推定する方法と
して例えば次の〜の手順によるものがある。
入力音声信号(1)を線形予測逆フィルタリングして
残差信号を求める。
この残差信号にNポイントのDFT(Discret Fourier T
ransform)をして、対数パワースペクトルを求める。
対数パワースペクトルを逆DFTして残差信号のケプス
トラムを求める。
次に残差信号のケプストラムについて、K次までの低
次のケプストラムとピッチ周期に相当する点の前後数ポ
イントのケプストラムのみを残しその他の成分を0とす
る、いわゆるリフタリング処理を行い、これをDFTする
ことで周波数領域での推定調波成分を求める。
この推定調波成分と対数パワースペクトルとの差を有
限M個の帯域毎に求め、これを帯域別雑音比(g
(m):m=1、M)とする。
合成部(II)では、調波音源生成手段(9)に、音源
パラメータ(6)が入力され、ピッチ周期間隔のインパ
ルス列を生成し、これを調波音源(10)として出力す
る。又、白色雑音生成手段(11)は、白色雑音を生成
し、これを白色雑音(12)として出力する。帯域別振幅
調整手段(13)には、まず振幅調整手段(14)に振幅
(4)、帯域別雑音比(8)、調波音源(10)、白色雑
音(12)が入力される。振幅調整手段(14)は、M個の
帯域別雑音比g(m)(m=1、・・・、M)を用い
て、調波音源(10)と白色雑音(12)の振幅比が1−g
(m)対g(m)となるように振幅を調整し、得られた
振幅調整後の調波音源と白色雑音を加算してM個の振幅
調整音源(15)を生成し、振幅調整音源(15)を帯域フ
ィルタ(16)に出力する。帯域フィルタ(16)は、帯域
別雑音比推定手段(7)で設定した各周波数帯域を通過
域とするM個の帯域フィルタ(バンドパスフィルタ)で
構成され、入力されたM個の振幅調整音源(15)に、各
々の対応する周波数帯域を通過域とするフィルタリング
を行い、M個の帯域別駆動音源を求め、これを帯域別駆
動音源(17)として出力する。駆動音源生成手段(18)
は入力されたM個の帯域別駆動音源(17)を重ね合わせ
ること(信号の加算)により駆動音源を求め、これを駆
動音源(19)として出力する。音声合成フィルタ手段
(20)は、帯域別振幅調整手段(13)より入力された駆
動音源(19)で、スペクトル包絡パラメータ(3)より
計算される音源合成フィルタを駆動して音声を合成し、
これを合成音声(21)として出力する。
(実施例2) 上記実施例では、調波成分を表す音源として、ピッチ
周期間隔のインパルス列を用いたが、声帯波形を近似し
たモデル等を使用し、そのモデルのパラメータを用いる
ことも可能である。
[発明の効果] 本発明によれば、入力音声信号を有限M個に帯域分割
し、各周波数帯域毎に調波成分と雑音成分の振幅比を求
め、各帯域における調波音源と白色雑音の振幅をその振
幅比に調整したので、原音声に含まれる調波成分と雑音
成分の混在している状態を精度よく表すことができイン
パルス列や白色雑音を単独で駆動音源とすると合成音声
の音質が劣化する有声音の立ち上がりや立ち下がり、有
声音から無声音への渡りの部分や、声帯波雑音の多い話
者の音声等において、合成音声の音質が向上する効果を
有する。
【図面の簡単な説明】
第1図は本発明の分析部の一実施例を表す構成図、第2
図は本発明の合成部の一実施例を表す構成図、第3図は
従来のボコーダ方式による音声分析部の構成図、第4図
は従来のボコーダ方式による音声合成部の構成図であ
る。 図中、(1)は入力音声信号、(2)はスペクトル包絡
分析手段、(3)はスペクトル包絡パラメータ、(4)
は振幅、(5)は音源パラメータ抽出手段、(6)は音
源パラメータ、(7)は帯域別雑音比推定手段、(8)
は帯域別雑音比、(9)は調波音源生成手段、(10)は
調波音源、(11)は白色雑音生成手段、(12)は白色雑
音、(13)は帯域別振幅調整手段、(14)は振幅調整手
段、(15)はM個の振幅調整音源、(16)は帯域フィル
タ、(17)はM個の帯域別駆動音源、(18)は駆動音源
生成手段、(19)は駆動音源、(20)は音声合成フィル
タ手段、(21)は合成音声、(22)はピッチ周期抽出手
段、(23)はピッチ周期、(24)は有声・無声判定手
段、(25)は有声・無声情報、(26)はインパルス列生
成手段、(27)はインパルス列、(28)は白色雑音生成
手段、(29)は白色雑音、(30)は切り替えスイッチで
ある。 なお、図中同一符号は同一または相当部分を示す。
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭62−31222(JP,A) 特開 昭62−212700(JP,A) 特開 昭57−189200(JP,A) 特開 昭60−53999(JP,A) (58)調査した分野(Int.Cl.6,DB名) G10L 3/00 - 9/18 H03M 7/30 JICST(JOIS)

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】入力音声信号をスペクトル包絡情報を表す
    パラメータと音源信号に分離する分析部と、この分析部
    で分離されたスペクトル包絡情報を表すパラメータと音
    源信号により音声合成を行う合成部とからなる音声分析
    ・合成装置において、分析部に、前記入力音声信号から
    スペクトル包絡情報を表すパラメータを求めるスペクト
    ル包絡分析手段と、前記入力音声信号を有限M個の周波
    数帯域に分割し、各周波数帯域に含まれる調波成分と雑
    音成分の比率を求め、帯域別雑音比として出力する帯域
    別雑音比率推定手段と、前記入力音声信号から調波音源
    のパラメータを求め音源パラメータとして出力する音源
    パラメータ抽出手段を備え、合成部に、この音源パラメ
    ータ抽出手段から出力された音源パラメータより調波音
    源を求める調波音源生成手段と、白色雑音を出力する白
    色雑音生成手段と、各周波数帯域毎に、前記調波音源生
    成手段から出力される調波音源と前記白色雑音の振幅比
    を前記帯域別雑音比推定手段より出力される帯域別雑音
    比に従って調整して駆動音源を求める帯域別振幅調整手
    段と、この帯域別振幅調整手段より出力される駆動音源
    で前記スペクトル包絡情報より求められる音声合成フィ
    ルタを駆動して音声を合成する音声合成フィルタ手段を
    備えることを特徴とした音声分析・合成装置。
JP2237545A 1990-09-07 1990-09-07 音声分析・合成装置 Expired - Fee Related JP2841797B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2237545A JP2841797B2 (ja) 1990-09-07 1990-09-07 音声分析・合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2237545A JP2841797B2 (ja) 1990-09-07 1990-09-07 音声分析・合成装置

Publications (2)

Publication Number Publication Date
JPH04116700A JPH04116700A (ja) 1992-04-17
JP2841797B2 true JP2841797B2 (ja) 1998-12-24

Family

ID=17016918

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2237545A Expired - Fee Related JP2841797B2 (ja) 1990-09-07 1990-09-07 音声分析・合成装置

Country Status (1)

Country Link
JP (1) JP2841797B2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3292711B2 (ja) * 1999-08-06 2002-06-17 株式会社ワイ・アール・ピー高機能移動体通信研究所 音声符号化復号方法および装置
JP4296752B2 (ja) 2002-05-07 2009-07-15 ソニー株式会社 符号化方法及び装置、復号方法及び装置、並びにプログラム
KR100744352B1 (ko) 2005-08-01 2007-07-30 삼성전자주식회사 음성 신호의 하모닉 성분을 이용한 유/무성음 분리 정보를추출하는 방법 및 그 장치
JP5089295B2 (ja) * 2007-08-31 2012-12-05 インターナショナル・ビジネス・マシーンズ・コーポレーション 音声処理システム、方法及びプログラム
JP5085700B2 (ja) * 2010-08-30 2012-11-28 株式会社東芝 音声合成装置、音声合成方法およびプログラム
JP6201205B2 (ja) * 2012-11-30 2017-09-27 Kddi株式会社 音声合成装置、音声合成方法および音声合成プログラム

Also Published As

Publication number Publication date
JPH04116700A (ja) 1992-04-17

Similar Documents

Publication Publication Date Title
Schroeder Vocoders: Analysis and synthesis of speech
JP2841797B2 (ja) 音声分析・合成装置
JPH05307399A (ja) 音声分析方式
JPH04358200A (ja) 音声合成装置
JPH05307395A (ja) 音声合成装置
JP3197975B2 (ja) ピッチ制御方法及び装置
JP2650355B2 (ja) 音声分析合成装置
EP0421531B1 (en) Device for sound synthesis
JPH08110796A (ja) 音声強調方法および装置
JP3201268B2 (ja) 音声通信装置
JP3410387B2 (ja) 音声素片作成装置、音声合成装置、音声素片作成方法、音声合成方法及び記録媒体
JP2588963B2 (ja) 音声合成装置
JPS62102294A (ja) 音声符号化方式
JPH0916198A (ja) 低ビットレートボコーダにおける励起信号発生装置及び励起信号発生方法
JP2723184B2 (ja) 音声分析合成方式
JPS5925239B2 (ja) パラメ−タ補間方式
JP2004258422A (ja) 音源情報を用いた音源分離・抽出方法および装置
Bogner et al. Frequency multiplication of speech signals
JPH0690638B2 (ja) 音声分析方式
JPS5965895A (ja) 音声合成方法
JP3263136B2 (ja) 信号のピッチ同期位置抽出方式及び信号合成方式
JP2973966B2 (ja) 音声通信装置
JPH02247700A (ja) 音声合成装置
JP2535809B2 (ja) 線形予測型音声分析合成装置
JPS61259300A (ja) 音声合成方式

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees