JPS5816297A - 音声合成方式 - Google Patents

音声合成方式

Info

Publication number
JPS5816297A
JPS5816297A JP11483481A JP11483481A JPS5816297A JP S5816297 A JPS5816297 A JP S5816297A JP 11483481 A JP11483481 A JP 11483481A JP 11483481 A JP11483481 A JP 11483481A JP S5816297 A JPS5816297 A JP S5816297A
Authority
JP
Japan
Prior art keywords
sound source
frame
source signal
waveform
signal waveform
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11483481A
Other languages
English (en)
Inventor
雄三 布施
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP11483481A priority Critical patent/JPS5816297A/ja
Publication of JPS5816297A publication Critical patent/JPS5816297A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Alarm Systems (AREA)
  • Selective Calling Equipment (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明は音声合成方式、特に線形予測符号化(以下LP
Cと略称する)による音声合成方式に関する。
通常のLPC音声合成方式では合成用の音源信号として
単純なパルスを用いているが、大幅な情報圧縮が可能と
なるも、音源情報の細部が失われ、導出される合成音声
の品質が劣化する不都合がある。
そこで斯る不都合を解消すべく、複数個の合成用音源信
号を用い、それ等のうちの1つをフレーム毎に選択して
そのフレームでのLPC音声合成を行う第1図乃至第7
図に示すような音声合成方式が、本発明者により先に提
案さねた。
すなわち第1図はその構成を漿略的に示すもので、同図
において、(1)は原音声が印加される入力端子、(2
)は入力される原音声から分析しようとする波形部分を
切り出し、その切り出した波形からLPCパラメータ等
声道の伝達特性に関する特徴パラメータや有声/無声、
ピッチ周波数、撮幅等の音源に関する特徴パラメータを
抽出する音声分析器、(3)は伝送路、(4)は特徴パ
ラメータより音声の再合成を行う音声合成器である。
そしてこの方式では上述の如く予測残差信号そのものを
音声合成器(4)側に伝送するには膨大な情報量を必要
とするので、その代りに各フレームでの予測残差信号を
周波数分析し2、その微細成分を平滑して得られるスベ
クトラル包絡に関する情報を音声合成器(4)側に伝送
するようにする。
この動作を第2図のフローチャートに従って説明する。
ステップ0υで例えば第3図の如き原音声(第3図は女
性音”ア”の時間波形を表わしている)を印加し、ステ
ップO2でLPC分析を行い、ステップ(t31Kr、
pcパラメータすなわち上述の線形予測係数akを抽出
する。一般に音声合成に必要なパラメータは、音源に関
しては有声/無声、ピッチ周波数、振幅であり、声道の
伝達特性(スペクトラム包絡)に関しては方式により異
なるが、このLPC音声合成方式の場合上記LPCパラ
メータが対応する。
またLPC分析によりステップQ4)K予測残差信号を
得、との予測残差信号からステラ1a勺で音源パラメー
タの一つである振幅を抽出し、更にステップQI19で
第4図の如き予測残差信号を得る。第4図は第3図の原
音声に対応した予測残差信号である。そしてこの予測残
差信号によりステップ06)でピッチ分析を行い、ステ
ップ(17)にピッチ周波数(ピッチ周期)を得る。こ
のピッチ周期は声帯音源における音声振動の基本周期で
あり、有声音を特徴づける重要なパラメータである。な
おこれ等の各パラメータを求める周期(フレーム周期)
としては通常10〜2Qm96G程度、波形切り出し窓
の時間長は15〜3Q m8ec程度が用いらねる。
そしてこれ等ステップQl)〜αηは音声分析器(2)
側で行われ、慣用されているものである。
次にステップa樽で第4図の如き予測残差信号に例えば
256サンプルポイントをもってフーリエ変換を施し、
時間−周波数変換、を行う。この結果第5図に波形Sで
示すような予測残差信号の周波数スペクトルが得られる
。この周波数スペクトルは位相情報が除去され実質的に
パワースペクトルで表わされる。そしてこの周波数スペ
クトルをステップ(11で例えばケプストラム法により
スペクトル平滑を行い、第5図に包絡線Eで示すような
スペクトル包絡を得る。第5図では略々1フレ一ム分を
表わしている。
このスペクトル平滑を各フレームに付いて行い、ステッ
プ(イ)に複数個のスペクトル包絡を得る。この得られ
た複数個のスペクトル包絡はフレーム毎に異なるので、
それらをフレーム毎に伝送するにはやはりかなりの情報
量を必要とする。そこでステップ(2I)においてスペ
クトル包絡間の距離によって分離する、すなわちスペク
トル包絡の形状が似ているものは1つの群VCまとめ、
それらの内の1つのスペクトル包絡を代表パターンとし
て用いるようにする。次に残余のスペクトル包絡群につ
いても同様の操作を行い、順次代表パターンを抽出する
。そしてこの操作を繰り返すことによりステップ0渇に
複数個例えば16個の代表パターンを表わすスペクトル
包絡す1〜+16を得ることができ、これKよって全フ
レームの予測残差信号情報を表現することができる。ま
たこの16個のスペクトル包絡す1〜+16は、2=1
6であるからフレーム毎に4ビツト、例えばスペクトル
包絡+1には[0001]、スペクトル包絡+2には(
0010:1等各スペクトル包終に対するビットコード
を予め割り当て−おけば、所望時その対応するビット情
報により対応する任意のスペクトル包絡を選ぶことがで
きる。  ′ 次にステップ(2りで適当な位相条件の下でフーリエ逆
変換を行い、各スペクトル包絡+1〜+16に対応した
第6図に示すような時間波形すなわちインパルス≠1〜
+16をステップc!4)に得る。ここで位相情報を必
要とする、つまり上述のステップ08)におけるフーリ
エ変換で位相情報が除去されているので、このフーリエ
逆変換の際に何等かの位相情報を与えてやる必要がある
わけであるが、合成音声の音質は音源信号の波形にはさ
して影響されないものと思われるので、このステップ(
2国におけるフーリエ逆変換の際の位相情報は、その後
の信号処理の都合の良いように与えればよい。この位相
情報の与え方によりステップC!(イ)に得られるイン
パルス÷1〜+16の波形は、例えば第7図A 、 B
 、 CK示すような種々なものとなる。この第7図A
、B、Cのインパルス波形のうち、インパルスの持続時
間を一定としたとき、インパルス波形の最終端部の信号
レベルが最も小さくなるのは第7図Cの波形である。従
ってこの第7図Cの如きインパルス波形を用いた場合に
ステップ(25)におけるLPC音声合成の際音源波形
接続誤差が最も少なくなると考えられる。そこでステッ
プ@におけるフーリエ逆変換の際は、ステップ(財)に
得らねるインパルス−#−1〜+16の波形が実質的に
第7図Cに示すような波形になるよう位相条件を与える
のが好ましい。この第7図Cのインパルスは最小位相推
移系のインパルス・レスポンスであって、それを得るた
めの位相条件は容易に示すことができる。
このように予測残差信号情報の代表パターンであるスペ
クトル包絡+1〜÷16をステップいでフーリエ逆変換
を行い対応する時間波形に変換したものを音声合成器(
4)(第1図)の音源信号として用いることになる。な
おこのフーリエ逆変換は音声合成器(4)側で行うには
膨大なハードウェアを必要とするので実時間動作を要し
ない場合には音声分析器(1)(第1図)側でソフトウ
ェアでフーリエ逆変換を行ってスペクトル包絡を時間波
形に変換し、それを音声合成器(1)側に伝送する方法
をとるのがよい。
そして音声合成器(4)側で行われるLPC音声合成の
ステップ(25)では各フレームに付き4ビット程度の
情報量を割り当て、上述の如くステップ0りにある16
個のインパルス≠1〜+16のうちの1つを選択してそ
のフレームの合成用音源とする。つまりこの選択された
インパルスが、そのフレームの音声合成に必要な音源情
報のうちの有声音に関する情報に実質的に対応するわけ
である。
またステップQ印では音源情報としてステップ(+51
の振幅情報、ステップαDのピッチ情報が付加されると
共に、ステップ(1皺のLPCパラメータが声道の伝達
特性に関する情報として付加さね、この結果ステップ(
26) K合成音声が取り出される。
このような音声合成方式により、各々のフレームでの合
成音声の周波数スペクトルが原音声のものに、より近似
したものとなり、合成音声の品質が改善される。
ところで上述の如き音声合成方式の場合、1つのフレー
ムでの合成用音源波形として1種の音源波形をピッチ周
期毎に配置したものを用いるので、各フレームの接続部
で合成音声の波形、信号レベルが不連続になりやすく、
合成音声の音質が滑らかでない不都合がある。
本発明は斯る点に鑑み、上述の如き合成音声のフレーム
毎の不連続を少なくしてその音質を滑らかなものとする
ことができる音声合成方式を提供するものである。
本発明では2つの有声フレーム(或いは2つの無声フレ
ーム)が相続く場合、それ等のフレーム間で各フレーム
での音源信号波形の対応するサンプル値に補間を旋すこ
とにより、各フレーム間で音源信号波形が滑らかに少し
ずつ変化するようにする。
以下本発明の一実施例を第8図乃至第10図に基づいて
詳しく説明する。
第8図は本実施例の構成を示すもので、同図において、
 C31)はクロック発生器、0りはアドレスカウンタ
、(3→はフレームカウンタ、04)は補間りpツクカ
ウンタであって、クロック発生器C31)からのクロッ
クを夫々各カウンタによりカウントすることにより3種
類のタイミング信号が生成される。
051は音源信号波形メモリであって、このメモリ0つ
には第2図に関連して説明したように予測残差信号情報
の代表パターンである複数個のスペクトル包絡を適当な
位相条件の下でフーリエ逆変換して時間波形(インパル
スレスポンス)に変換シ、それ等をLPC音声合成の音
源として用いるべく、予めフレーム毎に音源信号波形デ
ータとして記憶している。このメモリc3茄に記憶され
ている音源信号波形データのうちから、アドレスカウン
タ国の出力により一つのフレームの音源信号波形が選択
される。
C(6)は現在のフレームより時間的に1つ前のフレー
ムの音源信号波形を一時的に蓄えておくバッファメモリ
であって、フレームカウンタ(至)の出力によりフレー
ム毎にその内容が更新される。(37)及び(38)は
共に係数器であって、係数器07)はメモ!J C35
1より出力された現在のフレームの音源信号波形に後述
されるような成る係数を付加するように働き、−力係数
器(到はバッファメモリ(絢の出力すなわち上述の現在
のフレームより1つ前のフレームの音源信号波形に上記
とは別の成る係数を付加するように働く。なおこれ等係
数器07)及び(至)により付加される係数は、補間ク
ロックカウンタ04)から補間クロックが係数器C37
)及び(至)に供給される毎に更新される。また補間ク
ロックの周波数は1フレームを何等分して補間するかに
よって異なり、例えば1フレームを4等分して補間を行
なう場合には、フレーム周波数の4倍の周波数とされる
0!は係数器037)及び□□□の各出力を加算・・す
葛ための加算器、 (40)は補間さねた音源信号が取
り出される出力端子である。
次に本実施例の動作を説明する。いまメモIJ G5!
に記憶されて各フレームに対応した音源信号波形のうち
、例えばフレーム−#−nでの音源信号波形をen (
m)、これに続くフレーム+n + 1での音源信号波
形をen+1(m)とする。mはメモリc351に記憶
された音源信号波形のサンプルポイント数でm=1゜2
、・・・・・yで表わされる。例えばサンプリング周波
数10kHz (サンプリング周期100μs)でt=
30とすると音源信号波形の長さはQ、 1m8 X 
30= 3msとなる。
そして、第9図に示すように、1フレ一ム区間を複数個
に分割、例えば4等分した場合を考え、各フレームの接
続部の前後4つの分割区間に分割数J=1.2,3.4
と番号をつける。
そしてその各々の分割区間内での音源信号波形enJ(
m)を、次のように直線補間によって決定する。
上記(1)式において分割数JはJ=1.2,3.4で
アリ、サンプルポイント数mはm = l 、 2 、
・・・・、Qである。
上記(1)式よりJ=1の分割区間での音源信号波形e
nl(m)は enl(m)=en(m)          ・・・
・・(2)となり、フレームナnでの補間前の音源信号
波形に一致することがわかる。
またJ=2の分割区間での音源信号波形en2(m)は
上記(1)より となる。第10図はこのJ=2において実際に数値を入
れて補間な行った場合を示すものである。
すなわち、上記(3)式より、m =−1の時のen(
m) 。
en+ 1(”)の各レベルを夫々1.0,0.9とす
ると補間後ノe112(m)のレベルは0.975とな
り、以下同様Km=2の時のen(m) 、 en+t
(m)の各レベルを夫々−0,8,−0,7とすると補
間後のenz(m)のレベルは−0,775となり、m
 = 3の時のen(m) 。
en+x(m)の各レベルを夫々0.5,0.7とする
と補間後のen2(m)のレベルは0.55となり、m
 = 4の時(7) en(m) 、 en+t(m)
の各レベルを夫々−〇、2゜−〇、3とすると補間後の
en2(m)のレベルは−0,225となり、結果とし
て第10図Aに実線で示す音源信号波形en(m)と第
10図Bに実線で示す音源信号波形en+ s (”)
により第10図Aに破線で示すような補間された音源信
号波形en 2 (m )が得られることになる。
以下同様にして補間を行うことにより、に2→3→4と
進むVCつれて、音源信号波形en、1(m)は次第に
次のフレーム+n+1での補間前の音源信号波形en+
x(”)に近づいてゆく。
、(I9 上述は1フレ一ム区間を4等分した場合であるが、一般
に1フレ一ム区間なに等分した場合の各々の分割区間内
での音源信号波形en、1(m)は次式%式% つまりこの(4)式より補間された音源信号は、これ等
2つの相続くフレームでの音源信号波形の対応するサン
プル値を線形結合したものとなるので、係数器C37)
 、(至)及び加算器0特を用いて得ることができる。
なお上記(4)式においてJ=l、J・・・・・km=
12、・・・・・eである。分割数にとしては2,4.
8・・・・等2のベキ乗に選べば上記(4)式の補間計
算が2進データのビットシフトで容易に行われるので好
都合である。
そしてこのような補間動作を第8図の回路を用いて行う
わけであるが、それには先ず、クロック発生器01)か
らのクロックをアドレスカウンタ02でカウントして、
そのアドレス情報によりメモリ4351内の対応する各
フレームの波形データ、例えばフ(1→ レームナnの音源信号波形en(m)を選択する。そし
てこのフレーム4 nの音源信号波形en(m)はフレ
ームカウンタ03)の出力によりバッファメモリ(至)
に蓄積される。
続いてフレームナnの次のフレーム+n+1の音源信号
波形en(m)が同様にメモリGツ内からアドレスカウ
ンタC32のアドレス情報により選択され、フレームカ
ウンタO■の出力によりバッファメモリ(36)に蓄積
される。との特売にバッファメモリ06)に蓄積されて
(・たフレーム4nの音源信号波形en(m)は係数器
−に供給される。つまりバッファメモリ(至)の内容は
フレームカウンタC331の出力によりフレーム毎に更
新される。
またメモリ(35)よりフレーム+n+1の音源信号波
形en +1(” )がバッファメモリ(ト)に供給さ
れる時点で係数器(37)にも供給される。そして補間
クロックカウンタ04)の出力が係数器G′?)及び(
至)に供給された時点で、これ等の係数器により夫々成
る係数が付加される。すなわち、上記(4)式より係数
器間にに−J+1 おいては音源信号波形en(m)に対して係数 。
k−J+1 が付加されてその出力側にはen(m)・−Y−の信号
が取り出され、一方係数器07)にお℃・ては音源信−
1 その出力側にはen+1(m)・−に−の信号が取り出
される。そして取り出されたこれ等の信号は加算器0鴎
に供給されて加算され、もって出力端子(4(IIKは
上記(4)式で表わされるような補間された音源信号波
形en、1(m)が出力される。
上述の如く本発明によれば、2つの有声フレーム(或い
は2つの無声フレーム)が相続く場合、それ等のフレー
ム間で各フレームでの音源信号波形の対応するサンプル
値に補間を旋して、各フレーム間で音源信号波形が滑ら
かに少しずつ変化するようにしたので、各フレームの接
続部での合成音声の波形、信号レベルの不連続が除去さ
れて音質の滑らかな品、質のすぐれた合成音声を得るこ
とができる。
【図面の簡単な説明】
第1図は本発明の先行技術に係る一例を概略的に示すブ
ロック図、第2図乃至第7図は第1図の動作駅1明に供
するための線図、第8図は本発明の一実施例を示す構成
図、第9図及び第10図は第8図の動作説明に供するた
めの線図である。 Gelはクロック発生器、 C321はアドレスカウン
タ、03)はフレームカウンタ、(財)は補間クロック
カウンタ、 C35iは音源信号波形メモリ、(至)は
バッファメモリ、(37)、(至)は係数器、0坤は加
算器である。 第1図 第7図

Claims (1)

    【特許請求の範囲】
  1. 音源信号波形をフレーム毎に変える音声合成方式におい
    て、連続するフレーム間で各フレームでの音源信号波形
    の対応すゐサンプル値に補間を旋し、フレーム間での音
    源信号波形が滑らかに変化するようにしたことを特徴と
    する音声合成方式。
JP11483481A 1981-07-22 1981-07-22 音声合成方式 Pending JPS5816297A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11483481A JPS5816297A (ja) 1981-07-22 1981-07-22 音声合成方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11483481A JPS5816297A (ja) 1981-07-22 1981-07-22 音声合成方式

Publications (1)

Publication Number Publication Date
JPS5816297A true JPS5816297A (ja) 1983-01-29

Family

ID=14647855

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11483481A Pending JPS5816297A (ja) 1981-07-22 1981-07-22 音声合成方式

Country Status (1)

Country Link
JP (1) JPS5816297A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60118899A (ja) * 1983-11-30 1985-06-26 松下電器産業株式会社 音声分析合成方法
JPS60173285A (ja) * 1984-02-17 1985-09-06 大成建設株式会社 岩盤掘削ビツト
JPS61150000A (ja) * 1984-12-24 1986-07-08 日本電気株式会社 音声符号化方式とその装置
JPS6238500A (ja) * 1985-08-13 1987-02-19 日本電気株式会社 高能率音声符号化方式とその装置
JPS62159199A (ja) * 1985-12-26 1987-07-15 エイ・ティ・アンド・ティ・コーポレーション 音声メツセ−ジ処理装置と方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5672500A (en) * 1979-11-20 1981-06-16 Tokyo Shibaura Electric Co Voice synthesizer
JPS5680099A (en) * 1979-12-03 1981-07-01 Matsushita Electric Ind Co Ltd Parameter interporation system

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5672500A (en) * 1979-11-20 1981-06-16 Tokyo Shibaura Electric Co Voice synthesizer
JPS5680099A (en) * 1979-12-03 1981-07-01 Matsushita Electric Ind Co Ltd Parameter interporation system

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60118899A (ja) * 1983-11-30 1985-06-26 松下電器産業株式会社 音声分析合成方法
JPS60173285A (ja) * 1984-02-17 1985-09-06 大成建設株式会社 岩盤掘削ビツト
JPS6350510B2 (ja) * 1984-02-17 1988-10-11 Taisei Kensetsu Kk
JPS61150000A (ja) * 1984-12-24 1986-07-08 日本電気株式会社 音声符号化方式とその装置
JPS6238500A (ja) * 1985-08-13 1987-02-19 日本電気株式会社 高能率音声符号化方式とその装置
JPS62159199A (ja) * 1985-12-26 1987-07-15 エイ・ティ・アンド・ティ・コーポレーション 音声メツセ−ジ処理装置と方法

Similar Documents

Publication Publication Date Title
US4393272A (en) Sound synthesizer
KR960002387B1 (ko) 음성 처리 시스템 및 음성 처리방법
CA1046642A (en) Phase vocoder speech synthesis system
CA1065490A (en) Emphasis controlled speech synthesizer
JPS5936275B2 (ja) 残留励起予測音声符号化方式
JP2707564B2 (ja) 音声符号化方式
US3909533A (en) Method and apparatus for the analysis and synthesis of speech signals
JPH04134400A (ja) 音声符号化装置
JPS62159199A (ja) 音声メツセ−ジ処理装置と方法
US4382160A (en) Methods and apparatus for encoding and constructing signals
JPH10319996A (ja) 雑音の効率的分解と波形補間における周期信号波形
AU724355B2 (en) Waveform synthesis
GB2050125A (en) Data converter for a speech synthesizer
US5715363A (en) Method and apparatus for processing speech
WO1998021710A1 (fr) Convertisseur de rapidite de reproduction de sons
JPS5816297A (ja) 音声合成方式
JPH05265495A (ja) 音声符号化装置並びにその分析器及び合成器
JP3731575B2 (ja) 符号化装置及び復号装置
JPH0632037B2 (ja) 音声合成装置
JP2715437B2 (ja) マルチパルス符号化装置
JPS62102294A (ja) 音声符号化方式
JPH051957B2 (ja)
JP3112462B2 (ja) 音声符号化装置
JPH0468400A (ja) 音声符号化方式
EP1267327A2 (en) Optimization of model parameters in speech coding