JPS61150000A - 音声符号化方式とその装置 - Google Patents

音声符号化方式とその装置

Info

Publication number
JPS61150000A
JPS61150000A JP59272435A JP27243584A JPS61150000A JP S61150000 A JPS61150000 A JP S61150000A JP 59272435 A JP59272435 A JP 59272435A JP 27243584 A JP27243584 A JP 27243584A JP S61150000 A JPS61150000 A JP S61150000A
Authority
JP
Japan
Prior art keywords
parameter
sound source
pitch
representing
circuit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP59272435A
Other languages
English (en)
Other versions
JP2844590B2 (ja
Inventor
一範 小澤
卓 荒関
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP59272435A priority Critical patent/JP2844590B2/ja
Priority to CA000498407A priority patent/CA1252568A/en
Priority to US06/813,167 priority patent/US4821324A/en
Publication of JPS61150000A publication Critical patent/JPS61150000A/ja
Application granted granted Critical
Publication of JP2844590B2 publication Critical patent/JP2844590B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は音声信号を低いビットレイトで高品質に符号化
するための符号化方法とその装置に関する。
(従来技術) 音声信号を低い伝送ビットレイト(例えば4.8kbp
s  程度)で符号化する方式として、ボコーダ(vO
cODER) 、が知られている。この方法については
、原理については例えば、エムアールシュレイダ−(M
、 R,5CROEDER)氏によ6 「ホコーy’ス
:−rナリシス アンド シンセシス オプ スピーチ
(VOCODER8: ANALYSIS AND 5
YNTHESIS 0FSPEECH月と趙した論文(
PROC,IEEE、 p、 p、 720−734、
 MAY、 1966 ;文献1月等に詳細に説明され
ている。また、線形予測分析法を用いるボコーダとして
エルピーシ−ボコーダ(LPCVOCODER)が知ら
れており、その内容については、例えは、シェープイー
マーケル(J、 D、 MARKEL)氏らによる「ア
 リニアープレディクションボコーダベイスドアボンザ
オートコリレイション メソッド(ALINEARPR
EDICTION VOCODERBASED UPO
NTHE  AUTOCORRELATION  ME
THOD)J と題した論文(IEEE ’I’RAN
S、 A、 S、 S、 P、 、 p、 p、 12
4−134゜APPIL、  1974  ;  文献
2月等に詳細に説明されている。本発明はVOCODE
Rの音源部を改良したちのであり、LPCVOCODE
Rと密接な関係があるので、以下LPCVOCODER
について合成部の構成を中心に概略を説明する。
第4図は、文献2に記載(7)LPCVOCODERの
合成部(受信部)を示すブロック図である。合成部は音
源発生部500と合成フィルタ回路510からなる。音
源発生部500はインパルス発生器501と雑音発生器
502と有声l無声切り替え回路503と、ゲイン回路
504から構成される。VOCODERでは、音声信号
は短時間(夙えば20m 5ec)毎に有声と無声の2
種にわけられ、有声の場合は、インパルス発声器501
からピッチ周期Pdの時間間隔をもつパルス列が発生さ
れる。一方無声の場合は、雑音発生器502から白色雑
音が発生される。有声l無声の制御は、切り換え回路5
03にておこなわれる。このようにして発生された信号
に対して、ゲイン回路504にてゲインGがあたえられ
、音源信号d(n)として合成フィルタ510へ出力さ
れる。合成フィルタ510では音源信号−d(n)とフ
ィルタパラメータKiを用いて音声x(n)を合成し出
力する。ここでピッチ周期Pd、有声l無声切り換え信
号(V/UV)、ゲインG、 フィルタパラメータKi
は分析側(送信側)においてあらかじめ定められた時間
ごとに計算され受信側に伝送される。
(発明が解決しようとする問題点) 以上説明したLPCVOCODERにおいては、伝送情
報は、ピッチ周期、有声l無声信号、ゲイン、フィルタ
パラメータであり、これらの情報から音声信号を合成で
きるので伝送ビットレイトをひくく(例えば4.8k 
bps程度)することができる。しかしながら、この従
来法では品質の良好な音声を合成することは困難であっ
た。それは音声を有声と無声という2種の極端なりラス
にわけているので、有声/無声の判別誤りがおきた場合
はおおきな品質劣化をひきおこすといる欠点があった。
また、音源信号は、有声の場合には音源を1ピツチあた
り1個のインパルスで表しており、位相情報を含まない
ため個人性はかなり損なわれており、その合成音は所謂
F機械的な音Jであった。また、無声と有声の切り換わ
り部では音源を良好に表すことができず、劣化がおきて
いた。更に、ピッチ周期がずれで求まった場合には、お
おきな品質劣化を引き起こすという欠点があった。本発
明は、比較的少ない演算量で、低い伝送ビットレイトで
も高品質な音声を合成することのできる高能率音声符号
化方式とその装置を提供することを目的をする。
(問題点を解決するための手段) 本発明の音声符号化方式は、送信側では離散的な音声信
号を入力し、前記音声信号から短時間スペクトル包絡を
表すスペクトルパラメータとピッチを表すピッチパラメ
ータとを抽出して符号化し、前記音声信号と前記ピッチ
パラメータと前記スペクトルパラメータをもとにして前
記音声信号を表すための代表的な音源パルス列を前記ピ
ッチパラメータに応じて求めた時間区間のうちの代表的
な区間に対しあらかじめ定められた個数だけ求めて符号
化し、前記ピッチパラメータ表す符号と前記スペクトル
パラメータを表す符号とを組み合わせて出力し、受信(
R1−では前記組み合わされた符号を入力し、前記ピッ
チパラメータを表す符号と前記スペクトルパラメータを
表す符号と前記代表的な音源パルス列を表す符号とを分
離して復号し、前記復号されたピッチパラメータと前記
復号された音源パルス列をもとに前記音源パルス列に対
し時間的になめらかな変化をあたえる処理をほどこして
駆動音源信号を復元し前記復元された駆動音源信号と前
記復号されたスペクトルパラメータとをもとに前記音声
信号を合成することを特徴とする。
また・本発明の符号化装置は、入力した音声イ言号から
短時間スペクトル包絡を表すスペクトルパラメータとピ
ッチを表すピッチパラメータとを抽出し符号化するパラ
メータ計算回路と、前記音声信号と前記ピッチパラメー
タと前記スペクトルパラメータをもとにして、前記音声
信号を表すための代表的な音源パルス列を前記ピッチパ
ラメータに応じて求めた時間区間のうちの代表的な区間
に対しあらかじめ定められた個数だけ求めて符号化する
駆動信号計算回路と、前記パラメータ計算回路の出力符
号と前記駆動信号計算回路の出力符号とを組み合わせて
出力するマルチプレクサ回路とを有することを特徴とす
る。
更に本発明の復号化装置は、ピッチパラメータを表す符
号とスペクトルパラメータを表す符号と代表的な音源パ
ルス列を表す符号とが組み合わされた符号系列が入力さ
れ、前記ピッチパラメータを表す符号と前記スペクトル
パラメータを表す符号と前記音源パルス列を表す符号と
を分離して復号するデマルチプレクサ回路と、前記復号
されたピッチパラメータと前記復号された音源パルス列
をもとに前記音源パルス列に対して時間的になめらかな
変化を与える処理を施して駆動音源信号を復元する駆動
音源信号復元回路と、前記駆動音源信号と前記復号され
たスペクトルパラメータとをもとに音声信号を合成し出
力する合成フィルタ回路とを有することを特徴とする。
(作用) 本発明は音源信号をつねに第5図に示すような複数個の
パルスの組み合わ一+!:(マルチパルス)で表し、有
声部と無声部でパルスと雑音を切り換えないことを特徴
とする。第5図において横軸は離散的な時間を、縦軸が
振幅を表す。音声はこのマルチパルスと合成フィルタか
ら合成される。音源を表すパルスの振幅と位置を求める
方法としては、例えばアナリシスーバイーシンセシス(
ANALYSIS−by−3YNTHESIS ; A
−b−8)の方法を用いる方法が知られており、その詳
細についてはビー ニス アタル(B、 S、 ATA
L)氏らによる「ア ニ二一 モデルオブエル ピー 
シーエクサイテイション 7オープロデユーシングナチ
ユラル サウンディング スピーチアット ロウビット
 レイツ(A NEW MODELOFLPCEXCI
TATIONFORPRODUCINGNATU−RA
LSOUNDINGSPEECHATLOWBITRA
TES)Jと題した論文(PROC,1,C,A、 S
、 S、 P、 、 p、 p、 614−617゜1
982 ;文献3)等に説明されている。また高速に求
める方法として、相関演算にもとづく方法が知られてお
り、詳細は特願昭57−231606号明細書(文献4
)等に言己載されているのでここでは説明を省略する。
更に本発明は音声信号の周期性を利用しており、送信側
では音声信号を表すための代表的な音源パルスを代表的
な1ピッチ区間に対し、あらがじめ定めた個数だけ計算
し、このパルスの振幅、位置と音声信号のスペクトル包
絡特性を表すスペクトルパラメータとピッチ周期情報と
を伝送する。
受信側では代表的なパルスの振幅、位置とピッチ周期情
報を用いて、前後のフレームからv)イ間処理により、
この代表的なパルスを時間的:二tめらかに変化させな
が−ら駆動音源信号を復元し、この駆動音源信号と、補
間処理により時間的になめらかに変化させて求めたスペ
クトルパラメータとを用いて高品質な音声信号を合成す
ることを特徴としている。
(実施例) 以下、本発明の実施例について図面を参照して詳細に説
明する。第1図(a)は本発明による高能率音声符号化
方式の送信側の一実施例を示すブロック図であり、第1
図(b)は受信側の一実施例を示すブロック図である。
第1図(a)において、音声信号X(n)が入力され、
あらかじめ定められたサンプル数だけバッファメモリ回
路110に蓄積される。次ににパラメータ計算回路14
0は、バッファメモリ回路110からあらかじめ定めら
れたサンプル数の音声信号を入力し、音声信号のスペク
トル包絡を表すにパラメータを計算する。ここでにパラ
メータはPARCOR係数と同一のパラメータである。
Kパラメータの計算法としては、自己相関法がよく知ら
れている。この方法の詳細については、ジョン マクホ
ウル氏 (JOHNMAKHOUL)氏らによる「クオ
ンタイゼイションブロパディズ オプ トランスミッシ
ョン パラメータズ イン リニア プリディクチイブ
 システンズ(QUANTIZATION PROPE
RTIES OF TRANS−MISSIONPAR
AMETER8INLINEARPREDIC−TIV
E SYSTEMS月と趙した論文(IEEE TRA
NS、A。
S、 S、 P、 、 p、 p、 309−321.
1983 ;文献5)等に述べられているので、ここで
は説明を省略する。
第1図(a)にもどって、KパラメータKiは、Kパラ
メータ符号化回路160へ出力される。Kパラメータ符
号化回路160は、あらかじめ定められた量子化ビット
数に基すいてKiを符号化し、符号ffK+をマルチプ
レクサ260へ出力する。また、Kパラメータ符号化回
路160は、eKIを復号化して得たにパラメータ復号
値Ki’を用い、予測係数値ai′に変換し、インパル
ス応答計算回路170と重みずけ回路200とへ出力す
る。またにパラメータ復号値に、を補間回路255へ出
力する。
ピッチ分析回路130は、バッファメモリ回路110の
出力を用いてピッチ周期Pを計算する。Pの計算法は、
例えば、アールブイコックス(R,V、 C0X)氏ら
による「リアル タム インプリメンティションオプタ
イム ドメインハーモニツクスケイリングオプ スピー
チ シグナルズ(REAL−TIME IMPLE−M
ENTATION OF TIME DOMAIN H
ARMONIC8CALING OF 5PEECH5
IGNALS)と題した論文(IEEE TRANS、
 A、 S、 S、 P、 、 p、 p、 258−
272.1983 ;文献6)等で述べられている方法
を用いることができる。
ピッチ符号化回路150は、ピッチ周期Pdをあらがじ
めさだめられた量子化ビット数で量子化符号化し、符号
edをマルチプレクサ260へ出力する。また復号化、
して得たPd′を駆動信号計算回路220、及び補間回
路255へ出力する。
インパルス応答計算回路170は、Kパラメータ符号化
回路160から予測系数値ai′を入力し、重みすけさ
れた合成フィルタの伝達関数を表すインパルス応答り、
(n)を計算する。ここでり、、(n)の計算には、例
えば特願昭59−042305号明細書の第4図(a)
にg己載のインパルス応答計算回路210と同一の方法
を用いることができる。インパルス応答hw(n)は、
自己相関関数計算回路180と相互相関関数計算回路2
10とへ出力される。
自己相関関数計算回路180はインパルス応答計算回路
170からインパルス応答hw(n)を入力し、次式に
従い自己相関関数を計算する。
自己相関関数Rhh (・)は駆動信号計算回路220
へ出力される。
次に減算器120はバッファメモリ回路110の音声信
号X(n)から合成フィルタ回路250の出力を1フレ
ーム分減算し、結果e(n)を重みすけ回路200へす
る。重みずけ回路200はe(n)を入力し、またにパ
ラメータ符号化回路160から予測係数ai′を入力し
、e(n)に対し重みずけを施して求めたeV(n)を
出力する。ここでew(n)の計算には、例えば特願昭
59−042305号明細書の第4図(a)に記載の重
みすけ回路410と同一の方法を用いることができる。
相互相関関数計算回路210は、重みずけ回路200か
らe、−(n)を入力し、インパルス応答計算回路17
0からインパルス応答hw (n)を入力し、次式に従
い相互相関関数甲産。)を計算する。
9h、(ffil=Σe、(nl・h、(n−rn )
+ (1≦m≦M  ・・(21wrl 相互相関関数 %(m)は駆動信号計算回路220へ出
力される。
次に駆動信号計算回路220は、音声信号を表す音源信
号として、パルス系列を代表的なピッチ区間に対して計
算する。この手順を次に示す。まず最初に、フレームを
ピッチ周期P d’ごとのサブフレームに分割する。こ
の分割にはピッチ励振位置を知る必要があるが、これは
音源を表すノクルステ]を求めることにより知ることが
できる。つまり、第1番目のパルスのffl?iEから
、と・ノチの励振位置を知ることができる。ココでパル
ス列の計算に(↓、例工ば特願昭57−231606号
明細書の第(21)式で示した方法を用いることができ
る。第2図(a)に1フレームの音声波形を、第2図(
b)に第1番目に求まるノクルスg1とこのパルスの位
置を用いて分割したサブフレームのようすを示す。次の
処理とシテサブフレーム毎に、あらかじめ定められた個
数の/<ルスを計算する。代表的なピッチ区間の選定法
としては、例えば絶対値の大きなパルスを含むサブフレ
ームを代表ピッチ区間とし、この区間に含まれるパルス
を代表パルスとする方法を用しすること力fできる。こ
のようにして求めた代表とツチノくルスを第2図(c)
に示す。パルスの振幅、位置は符号器230へ出力され
る。また、サブフレーム位相T、代表ピッチ区間のサブ
フレーム番号(第2図(c)では3)を代表ピッチ位置
としてあらかじめ定められたビ・ント数で符号化し、マ
ルチプレクサ260へ出力する。
符号化回路230は、入力したパスルの振幅、位置を符
号化する。そして、代表ピッチ区間のパルスの振幅、位
置の符号をマルチプレクサへ出力する。
また、入力した全てのパルスの振幅、位置の復号値gi
’、 mi’を駆動信号復元回路240へ出力する。こ
こでパルスの符号化法には、例えば特願 昭57−23
1605号明細書に記載の符号化回路250と同一の方
法を用いることができる。他の符号化法として、可変長
符号化法、あるいは、差分符号化法等積々の方法が考え
られる。
駆動信号復元回路240は、符号化回路230から入力
したパルスの振幅および位置の復号値を用いて、1フレ
一ム分のパルスを発生させ、これを駆動音源信号として
合成フィルタ回路250へ出力する。
補間回路255は、ピッチ周期Pd’、サブフレーム位
相T、代表ピッチ位置を入力する。そして、フレームを
ピッチ周期Pd’ごとのサブフレームに分割し、Kパラ
メータをこのサブフレームごとに補間する。ここで補間
は直線補間とし、1フレーム過去及び1フレーム先のに
パラメータの値を用いる。この補間のようすを第3図に
示す。図において第jフレームのi番目のにパラメータ
Ki、 jは、1フレーム過去の値Ki、 j−1,及
び1フレーム先の値Ki、 j+1を用ν1て、サブフ
レーム毎に補間がおこなわれる。代表と・7千区間には
、Kパラメータ符号化回路160から入力したにパラメ
ータ復号値を用いる。このようにして補間して求めたに
パラメータは、合成フィルタ回路250へ出力される。
合成フィルタ250は、駆動音源信号、及び補間された
にパラメータを入力し、1フレ一ム分の応答信号X(n
)を計算する。ここでこの計算には、例えば特願昭57
−231605号明細書に記載の合成フィルり回路32
0と同一の方法を用いることができる。
マルチプレクサ回路260は、Kパラメータ符号化回路
160の符号’Kiとピッチ符号化回路150の符号e
、と符号化回路230の符号及びサブフレーム位相、代
表ピッチ位置を入力し、これらを組あわせて送信側出力
端子270から出力する。以上で本発明による高能率音
声符号化方式の送信側の説明を終了する。
次に、本発明による音声符号化方式の受信側の構成につ
いて、第1図(b)を参照して説明する。
デマルチプレクサ290は、受信側入力端子280から
入力した符号のうち、Kパラメータをあられす符号と、
ピッチ周期を表す符号と、パルスの振幅、位置を表す符
号と、サブフレーム位相、代表ピッチ位置を表す符号と
を分離して、それぞれにパラメータ復号回路330、ピ
ッチ復号回路320、パルス復号回路300、駆動信号
復元回路340へ出力する。
Kパラメータ復号回路330は、Kパラメータを復号し
て復号値Ki′を補間回路335へ出力する。
ピッチ復号回路320は、ピッチ周期P d’を復号し
て、駆動信号復元回路340、補間回路335へ出力す
る。
パルス復号回路300はパルス振幅gi′、位置mi’
を復号して駆動信号復元回路340へ出力する。
駆動信号復元回路340は、まずサブフレーム位相、代
表ピッチ位置を表す符号と、ピッチ周期Pd’を入力し
、フレームをピッチ周期Pd’ごとのサブフレームに分
割する。そして代表ピッチ位置で表されるサブフレーム
区間に対して位置m゛に振幅g′のパルスを発生させる
。次に、代表ピッチパルスと1フレーム過去、及び1フ
レーム先の代表的なパルスを用いてサブフレーム毎にパ
ルスを補間して求める。こうして全てのサブフレームに
ついてパルスを発生させ駆動音源信号を復元し、1フレ
一ム分の駆動音源信号を合成フィルタ回路350へ出力
する。
補間回路335は、送信側の補間回路255と同一の動
作をし、復号されたにパラメータをピッチ周期ごとに補
間し、補間されたパラメータを合成フィルタ回路350
へ出力する。
合成フィルタ回路350は、駆動音源信号、補間された
にパラメータを入力し、送信側の合成7゛イルタ回路2
50と同一の動作をして、1フレ一ム分の合成音声信号
X(n)を計算し受信側出力端子360から出力する。
以上で本発明による。高能率音声符号化方式の受信側の
説明をおえる。
駆動信号計算回路220におけるパルス計算法としては
、本実施例でのべた方法の他に種々の方法を用いること
ができる。例えばパルスを1つ求めるごとに過去に求め
たパルスの振幅を調整する方法を用いることができる。
この方法の詳細については小野圧らによる「マルチパル
ス駆動型音声符号化法における音源パルス探索法の検討
」と題した論文印本音響学会講演論文鳥157.198
3 ;文献7)等に述べられているのでここでは説明を
省略する。
また、駆動信号計算回路220にてパルスを求めるさい
に、フレームをサブ7に一ムに分割した後に、サブフレ
ームごとにパルスを求めていたが、サブフレームに分割
せずに、フレーム全体に対してあらかじめ定めた個数の
パルスを求めるようにしてもよい。更に、本実施例の送
信側では、Kパラメータの値はフレーム内で一定(つま
り合成フィルタの特性がフレーム内で変化しない)とし
て、このフレーム内のサブフレームごとにパルスを求め
たが、Kパラメータの値をサブフレーム毎になめらかに
変化させながらパルスを求めてもよい。具体的には、K
パラメータの値を前後のフレームのにパラメータの値を
用いてサブフレーム毎に補間し、この値を予測係数に変
換して、重みすけ回路200、インパルス応答計算回路
170、合成フィルタ回路250に出力し、サブフレー
ム毎に係数を更新して求めた相互相関関係、自己相関関
係を用いパルスを計算する。このうようにしたほうが、
より良好な音声を合成できる。また、パルス及びにパラ
メータの値を補間するさいに、送信側では、代表的なピ
ッチ区間の位置を求め伝送し、この区間を基準としてピ
ッチ周期に同期させて補間していたが、パルス及びにパ
ラメータのいずれか一方、あるいは両方とも、あらかじ
め定められたピッチ区間(例えば、フレームの中央付近
のピッチ区間)を基準として補間を施してもよい。両方
ともにこのような補間法を用いる場合は、代表ピッチ区
間の位置を表す符号を伝送しなくてもよく、伝送ビット
レイトを減らすことができる。また、代表ピッチ区間と
して、絶対値の大きなパルスを含むサブフレームを選択
していたが、例えばフレーム中央のサブフレームな選択
する方法等、他の方法を用いることもできる。また、サ
ブフレーム分割を行うときにピッチ周期は一定としてい
たが、この値も前後のフレームのピッチ周期を用いて補
間するようにしてもよい。一方、パルス及びにパラメー
タをピッチ周期に同期させずに捕間する方法も考えられ
る。
この場合は、フレームをあらかじめ定められた時間間隔
(例えば2.5m sec程度程度図切り、この区間毎
に補間処理を行う。この場合はサブフレーム位相は伝送
しなくてもよい。ここで、補間の基準区間としては、代
表区間を送信側で求めてもよいし、あらかじめ定めてお
いてもよい(例えばフレーム中央付近)。後者の場合に
は、サブフレーム位相と代表ピッチ位置を伝送しなくて
もよく、更にビットレイトを減らすことができる。
次に、パルス、合成フィルタのパラメータ、ピッチ周期
の補間法としては、直線補間以外の方法も考えられる。
例えば、パルス、ピッチ周期については、対数補間等も
考えられる。また、合成フィルタのパラメータを補間す
る場合、本実施例ではにパラメータについて補間したが
、例えば予測係数を補間する方法(但し、この場合はフ
ィルタの安定性をチェックする必要がある)や、対数断
面積関数を補間する方法や、自己相関関数を補間する方
法等を用いることもできる。これらの具体的な方法は、
ビーエスアタル(B、 S、 ATAL)氏らによる「
スピーチ アナリシス アンド シンセシス バイリニ
アー プリディクション オプ ザ スピーチウニイブ
(SPEECHANALYSIS AND 5YNTH
ESISBY LINEARPREDICTION O
F THE 5PEECHWAVE) と趙した論文(
J、 ACOUST、 SOC,AM、、、 p、 p
637−655.1971 ;文献8)等で述べられて
いるので説明は省略する。
本実施例では、フレーム長一定としてにパラメータの分
析および音源パルス列の計算をしたが、フレーム長は可
変としてもよい。このようにした場合には、音声の変化
部では、フレーム長を短くし、定常部ではフレーム長を
長くできるので、伝送ビットレイトを低減することがで
きる。
更に、ピッチ周期に応じて(例えばピッチ周期の整数倍
)フレーム長を決めるようにすれば、本実施例で述べた
サブフレーム位相も送らなくてよいので、更に伝送ビッ
トレイトを低減することができる。
本発明の他の構成法として、第1図(a)に於ける駆動
信号復元回路240、合成フィルタ回路250、補間回
路255、減算回路120を省略して構成をとることも
できる。このようにした場合は、送信側で音声信号を合
成しなくてもよく、装置構成を簡略化することができる
尚、ディジタル信号処理の分野でよく知られているよう
に、自己相関関数はパワスペクトルから計算することも
できる。また、相互相関関数はクロスパワスペクトルか
ら計算することもできる。
これらの対応関係については、ニーブイ オッペンハイ
ム(A、 V、 OPPENHEIM)氏らによる「デ
ィジタル信号2Q (DIGITAL 5IGNAL 
PROCESSING)Jと超した単行本(文献9)等
の第8章にて詳細に説明されているので、ここでは説明
を省略する。
(発明の効果) 本発明によれば、音源信号を複数個のパルス列(マルチ
パルス)の組み合わせで表すと共に、音声信号の周期性
を利用して、音声信号を良好に表すように代表的なピッ
チ区間のパルスを求めて伝送し、この代表的なピッチパ
ルスを時間的になめらかに変化させながら駆動音源信号
を復元し音声を合成しているので、低い伝送ビットレイ
トにおいても高品質な音声を合成できるという効果があ
る。
【図面の簡単な説明】
第1図(a)、(b)は、本発明による高能率音声符号
化方式の一実施例を表すブロック図、第2図(a)〜(
c)は駆動信号計算回路220における処理内容の一例
を示す図、第3図は補間回路の処理例を示す図、第4図
は従来方式の合成側の構成を示すブロック図、第5図は
マルチパルスで表した音源信号の一例を示す図である。 図において 110・・・・・バッファメモリ回路 120・・・・・減算回路 250、350・・・・・合成フィルタ回路200・・
・・・重みずけ回路 170・・・・・インパルス応答計算回路180・・・
・・自己相関関数計算回路210・・・・・相互相関関
数計算回路220・・・・・駆動信号計算回路 240、340・・・・・駆動信号復元回路130・・
・・・ピッチ分析回路 140・・・・・Kパラメータ計算回路150・・・・
・ピッチ符号化回路 160・・・・・Kパラメータ符号化回路230・・・
・・符号化回路 255、335・・・・・補間回路 260・・・・・マルチプレクサ 290・・・・・デマルチプレクサ 300・・・・・パルス復号回路 320・・・・・ピッチ復号回路 330−・・−にパラメータ復号回路 をそれぞれ示す。 オ 2 図 (b) オ 3 口 オ 4 図 オ 5 図 手続補正書(甑v) 特許庁長官殿          感 1、事件の表示  昭和59年  特許願 第2724
35号2、発明の名称 音声符号化方式とその装置 3、補正をする者 事件との関係        出願人 東京都港区芝五丁目33番1号 (423)  日本電気株式会社 代表者 関本忠弘 4、代理人 、61,3.了 S補正の対象 (1)  [B書の特許請求の範囲の欄(2)  明細
書の発明の詳細な説明の欄&補正の内容 +1)  特許請求の範囲を別紙のように補正する。 (2)  明細書47頁第9行目に「スピクトル」と6
るを「スペクトル」と間圧する。 (3)  明細書第7頁第17行目に「符号とt」とあ
るのを「符号と前記代表的な音源パルス列を表す符号と
を」と補正する。 (4)  明細書第9頁第13行目に「前記駆動音源」
とめるのを「前記復元嘔れた駆動音源」と補正する。 (5)  明i4v2ig17頁第1行目に「パスル」
とめるのt−rパルス」と補正する。 (6)明細書第18頁第2行目にrhi、jJ とめる
OをrKijJと補正する。 (7)  明細書第18頁第3行目に「Ki 、 j 
−I J  とbるのtrKij−IJと補正する。 (8〕  明細書第18頁第3行目に、「Ki、j刊」
とあるのを「Ki)刊」と補正する。 (9)  明m誓第19頁第6行目に「サブフレーム位
相」とあるのを「サブフレーム位相Jと補正する。 αl11  明細書第23頁第1行目に「方法等」とめ
るのf:r方法や良好な音声を再生できるような区間を
選択する方法等」と補正する。 、1ノ11N 代理人 弁理士 内 原   晋 特許請求の範囲 L 送信側では離散的な音声信号を入力し、前記音声信
号から短時間スペクトル包絡t−表すスペクトルパラメ
ータとピッチを表すピッチパラメータとを抽出して符号
化し、前記音声信号と前記ピッチパラメータと前記スペ
クトルパラメータ分もとくして前記音声信号を表わすた
めの代表的な音源パルス列を前記ピッチパラメータに応
じて求めた時間区間のうちの代表的な区間に対しあらか
じめ定められた個数たけ求めて符号化し、前記ピッチパ
ラメータを表す符号と前記スペクトルパラメータt−表
す符号と前記代表的な音源パルス列t”表わす符号とt
−組み合わせて出力し、受信例では前記組み合わされた
符号を人力し、前記ピッチパラメータを表す符号と前記
スペクトルパラメータを表す符号と前記代表的な音源パ
ルスタリを表す符号とを分離して信号し、前記復号され
たピッチパラメータと前記復号された音源パルス列をも
とに前記音源パルス列に対し時間的にな0らかな変化を
与える処理をほどこして駆動音源信号を復元し前記復元
された駆動音源信号と前記復元されたスペクトルパラメ
ータをもとに前記音声信号を合成することを特徴とする
音声符号化方式。 2 入力し7tf声信号から短時間スペクトル包絡を表
すスペクトルパラメータとピッチt−iすピッチパラメ
ータとt抽出し符号化するパラメータ計算回路と、前記
音声信号と前記ピッチパラメータと前記スペクトルパラ
メータをもとにして前記曽声信号を表わ丁友めの代表的
な音源パルス列を前記ピッチパラメータに応じて求めた
時間区間のうちの代表的な区間に対しめらかじめ定めら
れた個数だけ求めて符号化する駆動信号計算回路と、前
記パラメータ計算回路の出力符号と前記駆動信号計算回
路の出力符号とを組み合わせて出力するマルチプレクサ
回路とを有すること1特徴とする音声符号化装置。 1 ピッチパラメータを表す符号とスペクトルパラメー
タを茨す符号とfmパルス列を表す符号とが組み合わさ
れた符号系列が入力さn1前記ビソチバ2メータを表す
符号と前記スペクトルパラメータを表す符号と前記音源
パルス列ヲ表す符号とを分離して復号するマルチプレク
サ回路と、前記復号延KL7Cヒツチパラメータと前記
復号さnた音源パルス列をもとに前記音源パルス列に対
して時間的になめらかな変化を与える処理をほどこして
駆動音源信号f:復元する駆動音源信号復元回路と、i
Ir紀復元された駆動音源信号と前記復号されたスペク
トルパラメータとをもとに音声信号を合成し出力する合
成フィルタ回路と金有することに%徴とする音声復号化
装置。 代理人 弁理士 内 原   晋・   、:゛、ノ

Claims (1)

  1. 【特許請求の範囲】 1、送信側では離散的な音声信号を入力し、前記音声信
    号から短時間スペクトル包絡を表すスペクトルパラメー
    タとピッチを表すピッチパラメータとを抽出して符号化
    し、前記音声信号と前記ピッチパラメータと前記スペク
    トルパラメータをもとにして前記音声信号を表すための
    代表的な音源パルス列を前記ピッチパラメータに応じて
    求めた時間区間のうちの代表的な区間に対しあらかじめ
    定められた個数だけ求めて符号化し、前記ピッチパラメ
    ータを表す符号と前記スペクトルパラメータを表す符号
    とを組み合わせて出力し、受信側では前記組み合わされ
    た符号を入力し、前記ピッチパラメータを表す符号と前
    記スペクトルパラメータを表す符号と前記代表的な音源
    パルス列を表す符号とを分離して復号し、前記復号され
    たピッチパラメータと前記復号された音源パルス列をも
    とに前記音源パルス列に対し時間的になめらかな変化を
    与える処理をほどこして駆動音源信号を復元し前記復元
    された駆動音源信号と前記復元されたスペクトルパラメ
    ータををもとに前記音声信号を合成することを特徴とす
    る音声符号化方式。 2、入力した音声信号から短時間スペクトル包絡を表す
    スペクトルパラメータとピッチを表すピッチパラメータ
    とを抽出し符号化するパラメータ計算回路と、前記音声
    信号と前記ピッチパラメータと前記スペクトルパラメー
    タをもとにして前記音声信号を表すための代表的な音源
    パルス列を前記ピッチパラメータに応じて求めた時間区
    間のうちの代表的な区間に対しあらかじめ定められた個
    数だけ求めて符号化する駆動信号計算回路と、前記パラ
    メータ計算回路の出力符号と前記駆動信号計算回路の出
    力符号とを組み合わせて出力するマルチプレクサ回路と
    を有することを特徴とする音声符号化装置。 3、ピッチパラメータを表す符号とスペクトルパラメー
    タを表す符号と音源パルス列を表す符号とが組み合わさ
    れた符号系列が入力され、前記ピッチパラメータを表す
    符号と前記スペクトルパラメータを表す符号と前記音源
    パルス列を表す符号とを分離して復号するマルチプレク
    サ回路と、前記復号されたピッチパラメータと前記復号
    された音源パルス列をもとに前記音源パルス列に対して
    時間的になめらかな変化を与える処理をほどこして駆動
    音源信号を復元する駆動音源信号復元回路と、前記駆動
    音源信号と前記復号されたスペクトルパラメータとをも
    とに音声信号を合成し出力する合成フィルタ回路とを有
    することを特徴とする音声復号化装置。
JP59272435A 1984-12-24 1984-12-24 音声符号化方式とその装置 Expired - Lifetime JP2844590B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP59272435A JP2844590B2 (ja) 1984-12-24 1984-12-24 音声符号化方式とその装置
CA000498407A CA1252568A (en) 1984-12-24 1985-12-23 Low bit-rate pattern encoding and decoding capable of reducing an information transmission rate
US06/813,167 US4821324A (en) 1984-12-24 1985-12-24 Low bit-rate pattern encoding and decoding capable of reducing an information transmission rate

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59272435A JP2844590B2 (ja) 1984-12-24 1984-12-24 音声符号化方式とその装置

Publications (2)

Publication Number Publication Date
JPS61150000A true JPS61150000A (ja) 1986-07-08
JP2844590B2 JP2844590B2 (ja) 1999-01-06

Family

ID=17513869

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59272435A Expired - Lifetime JP2844590B2 (ja) 1984-12-24 1984-12-24 音声符号化方式とその装置

Country Status (1)

Country Link
JP (1) JP2844590B2 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5816297A (ja) * 1981-07-22 1983-01-29 ソニー株式会社 音声合成方式
JPS59116793A (ja) * 1982-12-24 1984-07-05 日本電気株式会社 音声符号化装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5816297A (ja) * 1981-07-22 1983-01-29 ソニー株式会社 音声合成方式
JPS59116793A (ja) * 1982-12-24 1984-07-05 日本電気株式会社 音声符号化装置

Also Published As

Publication number Publication date
JP2844590B2 (ja) 1999-01-06

Similar Documents

Publication Publication Date Title
JP2940005B2 (ja) 音声符号化装置
JP3180762B2 (ja) 音声符号化装置及び音声復号化装置
JP3582589B2 (ja) 音声符号化装置及び音声復号化装置
JP2615548B2 (ja) 高能率音声符号化方式とその装置
JP2844589B2 (ja) 音声信号符号化方法とその装置
JP2829978B2 (ja) 音声符号化復号化方法及び音声符号化装置並びに音声復号化装置
JP3303580B2 (ja) 音声符号化装置
JP2956068B2 (ja) 音声符号化復号化方式
JP2560682B2 (ja) 音声信号符号化復号化方法とその装置
JPS61150000A (ja) 音声符号化方式とその装置
JP3319396B2 (ja) 音声符号化装置ならびに音声符号化復号化装置
JP2001142499A (ja) 音声符号化装置ならびに音声復号化装置
JP3552201B2 (ja) 音声符号化方法および装置
JP2508002B2 (ja) 音声符号化方法とその装置
JP2853170B2 (ja) 音声符号化復号化方式
JP3063087B2 (ja) 音声符号化復号化装置及び音声符号化装置ならびに音声復号化装置
JP2658438B2 (ja) 音声符号化方法とその装置
JPS63127299A (ja) 音声信号符号化・復号化方式およびその装置
JP2629762B2 (ja) ピッチ抽出装置
JP2946528B2 (ja) 音声符号化復号化方法及びその装置
JP2898641B2 (ja) 音声符号化装置
JP2817196B2 (ja) 音声符号化方式
JPH043878B2 (ja)
JPS62207036A (ja) 音声符号化方式とその装置
JP3144244B2 (ja) 音声符号化装置

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term