JPH0426119B2 - - Google Patents

Info

Publication number
JPH0426119B2
JPH0426119B2 JP57231605A JP23160582A JPH0426119B2 JP H0426119 B2 JPH0426119 B2 JP H0426119B2 JP 57231605 A JP57231605 A JP 57231605A JP 23160582 A JP23160582 A JP 23160582A JP H0426119 B2 JPH0426119 B2 JP H0426119B2
Authority
JP
Japan
Prior art keywords
sequence
circuit
signal sequence
calculation circuit
sound source
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP57231605A
Other languages
English (en)
Other versions
JPS59116794A (ja
Inventor
Kazunori Ozawa
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP57231605A priority Critical patent/JPS59116794A/ja
Priority to CA000444239A priority patent/CA1197619A/en
Priority to US06/565,804 priority patent/US4716592A/en
Publication of JPS59116794A publication Critical patent/JPS59116794A/ja
Publication of JPH0426119B2 publication Critical patent/JPH0426119B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Analogue/Digital Conversion (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)

Description

【発明の詳細な説明】 本発明は音声信号の低ビツトレイト波形符号化
方式、特に伝送情報量を10kビツト/秒以下とす
るような符号化・復号化装置に関する。 音声信号を10kビツト/秒程度以下の伝送情報
量で符号化するための効果的な方法としては、音
声信号の駆動音源信号系列を、それを用いて再生
した信号と入力信号との誤差最小を条件として、
短時間毎に探索する方法が、よく知られている。
これらの方法はその探索方法によつて木符号化
(TREE CODING)、ベクトル量子化
(VECTORQUANTIZATION)と呼ばれてい
る。また、これらの方法以外に、駆動音源信号系
列を表わす複数個のパルス系列を、短時間毎に、
符号器側で、A−b−S(NALYSIS−Y−
SYNTHESIS)の手法を用いて逐次的に求めよ
うとする方式が最近、提案されている。本発明
は、この方式に関係するものである。この方式の
詳細については、ビー・エス・アタール(B・
S・ATAL)氏らによるアイ.シー.エー.エ
ス.エス.ピー(I.C.A.S.S.P)の予稿集、1982
年614〜617頁に掲載の「ア.ニユー.モデル.オ
ブ.エル.ピー.シー.エクサイテイシヨン.フ
オー.プロデユーシング.ナチユラル.サウンデ
イング.スピーチ.アツト.ロウ.ビツト.レイ
ツ」(“A NEW MODEL OF LPC
EXCITATION FOR PRODUCING
NATURAL−SOUNDING SPEECH ATLOW
BIT RATES”)と題した論文(文献1)に説明
されているので、ここでは簡単に説明を行なう。 第1図は、前記文献1、に記載された従来方式
における符号器側の処理を示すブロツク図であ
る。図において、100は符号器入力端子を示
し、A/D変換された音声信号系列x(n)が入
力される。110はバツフアメモリ回路であり、
音声信号系列を1フレーム(例えば10msec,8K
Hzサンプリングの場合は80サンプル)分、蓄積す
る。110の出力値は減算器120と、Kパラメ
ータ計算回路180とに出力される。但し、文献
1、によればKパラメータのかわりにレフレクシ
ヨン.コエフイシエンツ(REFLECTION
COEFFICIENTS)と記載されているが、これは
Kパラメータと同一のパラメータである。Kパラ
メータ計算回路180は、110の出力値を用
い、共分散法に従つて、フレーム毎の音声信号ス
ペクトルを表わすKパラメータKiを16次分(1
≦i≦16)求め、これらを合成フイルタ130へ
出力する。140は、音源パルス発生回路であ
り、1フレームにあらかじめ定められた個数のパ
ルス系列を発生させる。ここでは、このパルス系
列をd(n)と記する。140によつて発生され
た音源パルス系列の一例を第2図に示す。第2図
で横軸は離散的な時刻を、縦軸は振幅をそれぞれ
に示す。ここでは、1フレーム内に8個のパルス
を発生させる場合について示してある。140に
よつて発生されたパルス系列d(n)は、合成フ
イルタ130を駆動する。合成フイルタ130
は、d(n)を入力し、音声信号x(n)に対応す
る再生信号x〓(n)を求め、これを減算器120
へ出力する。ここで、合成フイルタ130は、K
パラメータKiを入力し、これらを予測パラメー
タai(1≦i=16)へ変換し、aiを用いてx〓(n)
を計算する。x〓(n)は、d(n)とaiを用い下式
のように表わすことができる。 x〓(n)=d(n)+Pi=1 ai・x〓(n−i) −(1) 上式でPは合成フイルタの次数を示し、ここで
はP=16としている。減算器120は、原信号x〓
(n)と再生信号x(n)との差e(n)を計算し、重み付
け回路190へ出力する。190は、e(n)を入
力し、重み付け関数w(n)を用い、次式に従つて
重み付け誤差ew(n)を計算する。 ew(n)=w(n)*e(n) −(2) 上式で、記号“*”はたたみこみ積分を表わ
す。また、重み付け関数w(n)は、周波数軸上で
重み付けを行なうものであり、そのZ変換値をW
(Z)とすると、合成フイルタの予測パラメータai
を用いて、次式により表わされる。 W(Z)=(1−Pi=1 aiZ-i)/(1−Pi=1 ai・ri・Z-i) −(3) 上式でrは0≦r≦1の定数であり、W(Z)の
周波数特性を決定する。つまり、r=1とする
と、W(Z)=1となり、その周波数特性は平担と
なる。一方、r=0とすると、W(Z)は合成フイ
ルタの周波数特性の逆特性となる。従つて、rの
値によつてW(Z)の特性を変えることができる。
また、(3)式で示したようにW(Z)を合成フイルタ
の周波数特性に依存させて決めているのは、聴感
的なマスク効果を利用しているためである。つま
り、入力音声信号のスペクトルのパワが大きな箇
所では(例えばフオルマントの近傍)、再生信号
のスペクトルとの誤差が少々大きくても、その誤
差は耳につき難いという聴感的な性質による。第
3図に、あるフレームにおける入力音声信号のス
ペクトルと、W(Z)の周波数特性の一例とを示し
た。ここではr=0.8とした。図において、横軸
は周波数(最大4KHz)を、縦軸は対数振幅(最
大60dB)をそれぞれ示す。また、上部の曲線は
音声信号のスペクトルを、下部の曲線は重み付け
関数の周波数特性を表わしている。 第1図へ戻つて、重み付け誤差ew(n)は、誤差
最小化回路150へフイードバツクされる。誤差
最小化回路150は、ew(n)の値を1フレーム分
記憶し、これらを用いて次式に従い、重み付け2
乗誤差εを計算する。 ε=Nn=1 ew(n)2 −(4) ここで、Nは2乗誤差を計算するサンプル数を
示す。文献1、の方式では、この時間長を5msec
としており、これは8KHzサンプリングの場合に
はN=40に相当する。次に、誤差最小化回路15
0は、前記(4)式で計算した2乗誤差εを小さくす
るように音源パルス発生回路140に対し、パル
ス位置及び振幅情報を与える。140は、この情
報に基づいて音源パルス系列を発生させる。合成
フイルタ130は、この音源パルス系列を駆動源
として再生信号x〓(n)を計算する。次に減算器12
0では、先に計算した原信号と再生信号との誤差
e(n)から現在求まつた再生信号x〓(n)を減算して、
これを新たな誤差e(n)とする。重み付け回路1
90はe(n)を入力し重み付け誤差ew(n)を計算
し、これを誤差最小化回路150へフイードバツ
クする。150は、再び、2乗誤差とを計算し、
これを小さくするように音源パルス系列の振幅と
位置を調整する。こうして音源パルス系列の発生
から誤差最小化による音源パルス系列の調整まで
の一連の処理は、音源パルス系列のパルス数があ
らかじめ定められた数に達するまでくり返され、
音源パルス系列が決定される。 以上で従来方式の説明を終了する。 この方式の場合に、伝送すべき情報は、合成フ
イルタのKパラメータKi(1≦i≦16)と、音源
パルス系列のパルス位置及び振幅であり、1フレ
ーム内にたてるパルスの数によつて任意の伝送レ
イトを実現できる。さらに、伝送レイトを
10Kbps以下とする領域に対しては、良好な再生
音質が得られ有効な方式の一つと考えられる。 しかしながら、この従来方式は、演算量が非常
に多いという欠点がある。これは音源パルス系列
におけるパルス位置の振幅を計算する際に、その
パルスに基づいて再生した信号と原信号との誤差
及び2乗誤差を計算し、それらをフイードバツク
させて、パルス位置と振幅を調整していることに
起因している。更には、パルスの数があらかじめ
定められた値に達するまでこの処理をくり返すこ
とに起因している。更に、この従来方式によれ
ば、分析フレーム長を一定としており、入力音声
信号系列のパワーの大きな部分でフレームが切り
換わつた場合には、再生信号系列においてフレー
ムの境界部近傍で波形の不連続に起因した劣化が
発生し、再生音声品質を大きく損なうという欠点
がある。 本発明の目的は、比較的少ない演算量で、フレ
ーム境界部近傍での品質劣化がほとんどなく、
10Kbps以下の伝送レイトに適用し得る高品質な
音声符号化・復号化装置を提供することにある。 本発明の音声符号化・復号化装置は、送信側で
は、離散的な音声信号系列を入力し前記音声信号
系列から過去に求めた駆動音源信号系列に由来し
た応答信号系列を減算する減算回路と、前記音声
信号系列あるいは前記減算結果の短時間スペクト
ル包絡を表わすパラメータを抽出して符号化する
パラメータ計算回路と、前記スペクトル包絡を表
わすパラメータをもとにインパルス応答系列を計
算するインパルス応答系列計算回路と、前記イン
パルス応答系列の計算回路の出力系列を入力し相
関々数列を計算する相関々数列計算回路と、前記
減算結果をもとに目標信号系列を作り、前記目標
信号系列と前記インパルス応答系列との相互相
関々数列を計算する相互相関々数列計算回路と、
前記相関々数列と前記相互相関々数列とを入力し
前記音声信号系列の駆動音源信号系列を計算し符
号化する駆動音源信号系列計算回路と、前記駆動
音源信号系列に由来した前記応答信号系列を計算
する応答信号系列計算回路と、前記スペクトル包
絡を表わすパラメータ計算回路の出力符号系列と
前記駆動音源信号系列の符号系列とを組み合わせ
て出力するマルチプレクサ回路とを有し、受信側
では、前記符号系列を入力し前記駆動音源信号系
列の符号系列と前記スペクトル包絡を表わすパラ
メータの符号系列とを分離するデマルチプレクサ
回路と、分離して得た符号系列から前記駆動音源
信号系列を復号化し音源パルス系列を発生させる
音源パルス系列発生回路と、分離して得た前記ス
ペクトル包絡を表わすパラメータの符号系列を復
号化する復号回路と、前記復号化したスペクトル
包絡を表わすパラメータを用いて音声信号系列を
再生し出力する合成フイルタ回路とを有すること
を特徴とする。 本発明の音声符号化装置は、 離散的音声信号系列を入力し前記音声信号系列
から応答信号系列を減算する減算回路と、前記音
声信号系列あるいは前記減算回路の出力系例の短
時間スペクトル包絡を表わすパラメータを抽出し
符号化するパラメータ計算回路と、前記スペクト
ル包絡を表わすパラメータをもとにインパルス応
答系列を計算するインパルス応答系列計算回路
と、前記インパルス応答系列計算回路の出力系列
を入力し相関々数列を計算する相関々数列計算回
路と、前記減算回路の出力系列または前記減算回
路の出力系列にあらかじめ定められた補正を施し
た信号と前記インパルス応答系列との相互相関々
数列を計算する相互相関々数列計算回路と、前記
相関々数列と前記相互相関々数列とを入力し前記
音声信号系列の駆動音源信号系列を計算し符号化
する駆動音源信号系列計算回路と、前記駆動音源
信号系列を入力して前記駆動音源信号系列に由来
した前記応答信号系列を計算する応答信号系列計
算回路と、前記パラメータ計算回路の出力符号系
列と前記駆動音源信号系列の符号系列とを組み合
わせて出力するマルチプレクサ回路とを有するこ
とを特徴とする。 本発明の音声復号化装置は、 離散的音声信号系列から過去に求めた駆動音源
信号系列に由来した応答信号系列を減算し、前記
音声信号系列あるいは減算結果の短時間スペクト
ル包絡を表わすパラメータを抽出して符号化し、
前記パラメータから求めたインパルス応答系列と
前記減算結果とを用いて計算した相互相関々数列
と前記インパルス応答系列を用いて計算した相
関々数列とを使つて駆動音源信号系列を探索して
符号化し、前記スペクトル包絡を表わすパラメー
タの符号系列とを組み合わせて出力された符号系
列を入力し前記駆動音源信号系列を表わす符号系
列と前記スペクトル包絡を表わすパラメータの符
号系列とを分離するデマルチプレクサ回路と、分
離して得た前記駆動音源信号系列を表わす符号系
列を復号化して音源パルス系列を発生させる音源
パルス系列発生回路と、分離して得た前記スペク
トル包絡を表わすパラメータの符号系列を復号化
する復号回路と、前記音源パルス系列発生回路の
出力系列を入力し前記復号回路の出力パラメータ
を用いて音声信号系列を再生し出力する合成フイ
ルタ回路を有することを特徴とする。 本発明による音声符号化装置は、音源パルス系
列を計算するアルゴリズムに特徴の一つがある。
従つて以下では、このアルゴリズムを最初に詳細
に説明することにする。 まず、1フレーム内の任意の時刻nにおける音
源パルス系列d(n)を次式で表わす。 d(n)=kk=1 gk・δo,mk −(5) ここで、δn,mkはクロネツカーのデルタを表
わし、n=mkの場合に1で、n≠mkの場合は0
である。またgkは、位置mkのパルスの振幅を表
わす。d(n)を合成フイルタに入力して得られる
再生信号x〓(n)は、合成フイルタの予測パラメータ
をai(1≦i≦Np;ここでNpは合成フイルタの次
数を示す)とすると、次式のように書ける。 x〓(n)=d(n)+Npi=1 aix〓(n−i) −(6) 次に、入力音声信号x(n)と再生信号x〓(n)との
1フレーム内の重み付け2乗誤差Jは次のように
書ける。 J=Nn=1 ((x(n)−x〓(n))*w(n))2 −(7) ここでw(n)は重み付け回路のインパルス応答
であり、例えば従来例と同一特性としてもよい。
又、Nは1フレームのサンプル数を示す。(7)式は
さらに次式のように変形できる。 J=Nn=1 (x(n)*w(n) −x〓(n)*w(n))2 −(8) ここでx〓(n)*w(n)の項は次式に従つて変形さ
れる。 x〓(w)(n)=x〓(n)*w(n) −(9) とおく。(9)式の両辺をZ変換すると、 X〓(Z)=X〓(Z)・W(Z) −(10) とかける。X〓(Z)は更に次のようにかける。 X〓(Z)=H(Z)・D(Z) −(11) ここでD(Z)は音源パルス系列(5)式のZ変換を
示し、H(Z)は合成フイルタのインパルス応答の
Z変換値を示す。 (11)式を(10)式に代入すると、 Xw(Z)=D(Z).H(Z).W(Z) −(12) となり、Hw(Z)=H(Z).W(Z)とおき、(12)式を逆
Z変換し、Hw(Z)の逆Z変換値をhw(n)とする
と、次式を得る。 xw(n)=d(n)*hw(n) −(13) ここで、hw(n)は合成フイルタと重み付け回路
の縦続接続フイルタのインパルス応答を示す。(1
3)式に(5)式を代入して次式を得る。 X〓w(n)=Ki=1 gihw(n−mi) −(14) ここでKは、1フレームにたてるパルス数を示
す。(14)式、(9)式を(8)式に代入すれば、 J=Nn=1 (xw(n)−Ki=1 gihw(n−mi))2 −(15) とかける。従つて、(7)式は(15)式のように表わせ
ることになる。 (15)式を最小とするような音源パルス系列の振幅
gk,位置mkの計算式を、次に導出する。 (15)式をgkで偏微分して0とおくことによつ
て、次式が導かれる。 ここで、ψxh(・)はXw(n)とhw(n)から計算し
た相互相関々数列を表す。また、ψhh(・)は、
インパルス応答hω(n)の相関々数列を表す。イン
パルス応答の相関々数列としては共分散関数列あ
るいは自己相関々数列が知られている。相互相
関々数列と共分散関数列は、次式のように表せ
る。 尚、ψhh(・)は音声信号処理の分野では共分散
関数と呼ばれることが多い。 ψxh(−mk)=Nn=1 xw(n)hw(n−mk) =ψhx(mk),(1≦mk≦N) −(17) ψ(mi,mk)=N-(ni-nk)n-1 hw(n−mi) hw(n−mk),(1≦mk≦N) −(18) (16)式によれば、パルスの位置mkをパラメータ
として、位置mkに対応した振幅gkが計算できる。
パルスの位置mkは各パルスについて、|gk|が最
大となるmkを選べばよい。 これは、(16)式をgiについて、解くことによつ
て証明されるが、ここでは証明は略す。 以上で本アルゴリズムの導出に関する説明を終
える。 本発明による音声符号化装置のもう一つの特徴
は、フレーム境界部近傍での品質劣化がほとんど
ないことであり、これは次に実施例を用いて説明
する。第4図は、(16)式による音源パルス計算ア
ルゴリズムを用いた符号器の一構成例を示すブロ
ツク図である。 図において、第1図と同一番号を付した構成要
素は、第1図と同一の働きをするのでここでは説
明を省略する。第4図において各構成要素は1フ
レーム毎に以下の処理を行なう。また、1フレー
ムのサンプル数をNとする。Kパラメータ計算回
路280は、バツフアメモリ回路110に蓄積さ
れた音声信号系列x(n)を入力し、あらかじめ定
められた次数Np個のKパラメータKi(1≦i≦
Np)を計算する。KiはKパラメータ符号化回路
200に出力される。Kパラメータ符号化回路2
00は例えばあらかじめ定められた量子化ビツト
数に基づいて、Kiを符号化し、符号lkiをマルチプ
レクサ260へ出力する。またKパラメータ符号
化回路200は、lkiを復号化し、復号値ki′(1
≦i≦Np)をインパルス応答計算回路210と、
重み付け回路290と、合成フイルタ回路320
へ出力する。インパルス応答計算回路210は、
ki′を入力し、前述の(13)式におけるhw(n)(合成
フイルタと重み付け回路の縦続接続からなるフイ
ルタのインパルス応答)の計算を、あらかじめ定
められたサンプル数だけ行ない、求まつたhw(n)
を共分散関数計算回路220と、相互相関々数計
算回路235とへ出力する。 共分散関数計算回路220は、あらかじめ定め
られたサンプル数のhw(n)を入力し、前述の(18)式
に従つてhw(n)の共分散ψhh(mi,mk)(1≦i,
K≦N)を計算し、これをパルス系列計算回路2
40へ出力する。次に減算器285はバツフアメ
モリ回路110に蓄積された音声信号系列x(n)
から、合成フイルタ回路320の出力系列を1フ
レーム分減算し、減算結果を重み付け回路290
へ出力する。ここで合成フイルタ回路320には
後述するように、現フレームより1フレーム過去
の音源パルス系列を駆動信号として応答信号系列
を求め、その後、駆動信号を0として現フレーム
に延ばした信号系列が1フレーム分蓄積されてい
る。つまりこれは、合成フイルタのインパルス応
答の意味のあるサンプル数がたかだか2フレーム
程度であるとすれば、現フレームの音声信号系列
は、1フレーム過去の音源パルスによつて駆動さ
れた合成フイルタ出力信号をその後、駆動信号を
0として、現フレームへ延ばした信号系列と、現
フレームの音源パルス系列によつて駆動された合
成フイルタ出力信号系列との和として表現できる
という考えに基づいている。重み付け回路290
は、Kパラメータ符号化回路200からKi′を入
力し、重み付け関数w(n)を、例えば従来方式の
(3)式に従つて計算する。これは他の周波数重み付
け方法を用いて計算してもよい。また、重み付け
回路290は、減算器285の減算結果を入力
し、これとw(n)とのたたみこみ積分計算を行な
い、得られたxw(n)を相互相関々数計算回路23
5へ出力する。相互相関々数計算回路235は、
xw(n)とhw(n)とを入力し、前述の(17)式に従つて、
相互相関々数ψxh(−mk)(1≦mk≦N)を計算
し、これをパルス系列計算回路240へ出力す
る。 次に、パルス系列計算回路240は、相互相
関々数計算回路235からψxh(−mk)を、共分
散関数計算回路220からψhh(mi,mk)(1≦
mi,mk≦N)をそれぞれ入力し、前述の音源パ
ルス計算式(16)式を用いて、パルスの振幅gkを計
算する。例えば、1つ目のパルスは(16)におい
て、k=1とおいて振幅g1を位置m1の関数とし
て求める。 次に、|g1|を最大とするようなm1を選び、そ
の際のm1,g1を1番目のパルスの位置及び振幅
とする。次に、2番目のパルスは、(16)式におい
て、k=2とおくことにより求まる。(16)式によ
れば、2番目のパルスは1番目のパルスによる影
響をさしひいて求まることを意味している。3番
目以降のパルスも同様にして計算でき、あらかじ
め定められたパルス数に達するか、あるいは、求
まつたパルスのgk,mkを(15)式に代入して得られ
る誤差の値が、あらかじめ定められたしきい値以
下になるまでパルスの計算を続ける。パルス系列
の振幅、位置を表わすgk,mkは、符号化回路2
50へ出力される。 符号化回路250は、音源パルス計算回路24
0から、音源パルス系列の振幅gk及び位置mk
入力し、これらを後述の正規化係数を用いて符号
化し、gk,mk及び正規化係数を表わす符号をマ
ルチプレクサ260へ出力する。また、これを復
号化し、gk,mkの復号化値gk′及びmk′をパルス
系列発生回路300へ出力する。ここで、符号化
の方法は種々考えられるが、振幅gkの符号化につ
いては、従来よく知られている方法を用いること
ができる。例えば、振幅の確率分布を正規型と仮
定して、正規型の場合の最適量子化器を用いる方
法が考えられる。これについては、ジエー・マツ
クス(J.MAX)氏によるアイ.アール.イー.
トランザクシヨンズ.オン.インフオメーシヨ
ン.セオリー(IRETRANSACTIONS ON
INFORMATION THEORY)の1960年3月号、
7〜12頁に掲載の「クオンタイジング.フオー.
ミニマム.デイストーシヨン」
(“QUANTIZING FOR MINIMUM
DISTORTION”)と題した論文(文献2、)等に
詳述されているので、ここでは説明を省略する。
また、他の方法としては、1フレーム内のパルス
系列の振幅の最大値を正規化係数として、この値
で各パルス振幅を正規化した後に量子化、符号化
する方法も考えられる。前者の方法の場合には、
1フレーム内のr.m.s(ROOT MEAN
SQUARE)値を正規化係数とすればよい。次に
パルスの位置の符号化についても種々の方法が考
えられる。例えばフアクシミリ信号符号化の分野
でよく知られているランレングス符号等を用いて
もよい。これは符号“0”の続く長さをあらかじ
め定められた符号系列を用いて表わすものであ
る。また、正規化係数の符号化には、従来よく知
られている対数圧縮符号化等を用いることができ
る。 尚、パルス系列の符号化に関しては、ここで説
明した符号化方法に限らず、衆知の最良の方法を
用いることができることは勿論である。 再び第4図に戻つて、パルス系列発生回路30
0は入力したgk′,mk′を用いて、mk′の位置に振
幅gk′をもつ音源パルス系列を1フレーム分計算
し、これを駆動信号として、合成フイルタ回路3
20へ出力する。合成フイルタ回路320はKパ
ラメータ符号化回路200からKパラメータ量子
化値Ki′(1≦i≦Np)を入力し、これを予測パ
ラメータai(1≦i≦Np)に衆知の方法を用いて
変換しておく。次に合成フイルタ回路320はパ
ルス発生回路300から1フレーム分の駆動音源
信号を入力して、この1フレーム分の信号に1フ
レーム分、零を付加し、この2フレーム分の信号
に対する応答信号系列x〓(n)′を求める。更に、第
2フレームの零信号列によつて応答信号系列を計
算する際には、合成フイルタ回路320は、Kパ
ラメータ符号化回路200から新たなKi′(1≦
i≦Np)を入力し、これを用いて行なう。次式
にこのことを示す。 ここで、駆動音源信号d(n)は、1≦n≦Nで
はパルス発生回路300からの出力パルス系列を
表わし、N+1≦n≦2Nでは全て0の系列を表
わす。また、(19)でaj iは現フレーム時刻jのKi
(1≦i≦Np)から計算した予測パラメータを、
aj-1 iは1フレーム時刻過去のフレーム時刻j−1
のKi′から計算した予測パラメータをそれぞれ示
す。(19)式に従つて求めたx〓′(n)のうち、第2フレ
ーム目のx〓′(n)(N+1≦n≦2N)が減算器28
5へ出力される。 次に、マルチプレクサ260は、Kパラメータ
符号化回路200の出力符号と、符号化回路25
0の出力符号を入力し、これらを組み合わせて、
送信側出力端子270から通信路へ出力する。以
上で本発明による音声符号化装置の説明を終え
る。 次に、本発明による音声復号化装置の説明を行
なう。第5図は、本発明による音声復号化装置の
構成例を示す。図において、復号器入力端子35
0からフレーム毎に符号系列を入力し、デマルチ
プレクサ360はこの符号系列を、Kパラメータ
符号系列と、音源パルス系列の振幅及び位置を表
わす符号系列と、正規化係数を表わす符号とに分
離し、Kパラメータ符号系列をKパラメータ復号
化回路380へ出力し、残りの符号系列を復号化
回路370へ出力する。復号化回路370は、ま
ず正規化係数を表わす符号を復号し、これを用い
て音源パルス系列の符号系列を復号し、パルスの
振幅gk′と位置mk′をパルス系列発生回路420
へ出力する。ここでパルス系列発生回路420
は、第4図符号器側におけるパルス系列発生回路
300と同一の動作を行ない、1フレーム内のパ
ルス系列を発生させ、合成フイルタ回路440へ
出力する。合成フイルタ回路440は、Kパラメ
ータ復号化回路380からNp個のKパラメータ
復号値Ki′(1≦i≦Np)を入力し、これらを予
測パラメータai(1≦i≦Np)に変換する。次に、
パルス系列発生回路420から駆動音源信号を1
フレーム分入力し、これを用いて音声信号系列を
1フレーム分再生する。 この合成フイルタ440内部では、1フレーム
過去の音源パルス系列から求まつた応答信号系列
が現フレームの音源パルス系列によつて求まつた
再生信号系列に加算され、音声信号系列が再生さ
れる。再生された音声信号系列x〓(n)は、バツフア
メモリ回路470へ出力される。バツフアメモリ
回路470は、1フレーム分のx〓(n)を蓄積した後
に、復号器側出力端子410を通して出力する。
以上で本発明による音声復号化装置の説明を終了
する。 本発明の構成によれば、音源パルス系列の計算
を(16)式に従つているので、文献1の従来方式に
見られたパルスにより合成フイルタを駆動し、再
生信号を求め、原信号との誤差及び2乗誤差をフ
イードバツクしてパルスを調整するという径路が
なく、またその処理をくり返す必要もないので、
演算量を大幅に減らすことが可能で、良好な再生
音質が得られるという大きな効果がある。更に(1
6)式の演算において、ψxh(−mk)とψhh(mi,mk
(1≦mi,mk≦N)の値を、1フレーム毎に、前
もつて計算しておくことによつて、(16)式の計算
は掛け算と引き算という非常に簡略化された演算
となり、更に演算量を減らすことができるという
効果がある。また、音源パルス系列を探索する他
の従来方式と比べても、本発明による方法は、同
一の伝送情報量の場合に、より良好な品質を得る
ことができるという効果がある。 更に、本発明の構成によれば分析フレーム長が
一定でない場合は勿論のこと、分析フレーム長を
一定にした場合でも、波形の不連続に起因したフ
レームの境界近傍での再生信号の劣化がほとんど
ないという大きな効果がある。この効果は符号器
側において、現フレームの音源パルス系列を計算
する際に、1フレーム過去のフレームの音源パル
ス系列によつて合成フイルタを駆動して得た応答
信号系列を現フレームにまで伸ばして求め、これ
を入力音声信号系列から減算した結果を目標信号
系列として現フレームの音源パルス系列を計算す
るという構成にしたことによる。またこの効果は
復号器側において、受信し復号化して得た音源パ
ルスを駆動源として再生した信号系列と、1フレ
ーム過去の音源パルス系列に由来した応答信号系
列とを用いて音声信号系列を再生するという構成
にしたことによる。 尚、前述の本発明の実施例においては、1フレ
ーム内の音源パルス系列の符号化は、パルス系列
が全て求まつた後に、第4図の構成要素250に
よつて符号化を施したが、符号化をパルス系列の
計算に含めて、パルスを1つ計算する毎に、符号
化を行ない、次のパルスを計算するという構成に
してもよい。このような構成をとることによつ
て、符号化の歪をも含めた誤差を最小とするよう
なパルス系列が求まるので、更に品質を向上させ
ることができる。 また、前述の実施例においては、パルス系列の
計算はフレーム単位で行なつたが、フレームをい
くつかのサブフレームに分割し、そのサブフレー
ム毎にパルス系列を計算するような構成にしても
よい。この構成によれば、フレーム長をNとすれ
ば、第4図に示した構成と比べて演算量を大略
1/d倍にすることができる。ここでdはフレーム 分割数を示す。例えばd=2とすれば、演算量は
約1/2にできる。勿論、同等の特性は得られる。 更に本発明の構成によれば、第4図に示した符
号器側の実施例において、1フレーム過去の音源
パルス系列によつて合成フイルタ回路320を駆
動した後に、1フレーム全て0の音源パルス系列
を入力し、応答信号系列を現フレームにまで伸ば
して求めた。この場合に、1フレーム過去の音源
パルス系列によつて合成フイルタを駆動した際に
は1フレーム過去に入力されたKパラメータ値を
そのまま用いたが、1フレーム全て0の音源パル
ス系列を入力した際には、現フレーム時刻に入力
されたKパラメータ値を用いる構成とした。ここ
で、1フレーム全て0の音源パルス系列を入力し
た際にも、合成フイルタ回路320のKパラメー
タ値としては1フレーム過去に入力されたKパラ
メータ値をそのまま用いるような構成としてもよ
い。このような構成とした場合には、第5図復号
器側の構成も符号器側と同一の変更を必要とす
る。 また、以上説明した構成例においては、短時間
音声信号系列のスペクトル包絡を表わすパラメー
タとしてはKパラメータを用いたが、これはよく
知られている他のパラメータ(例えばLSPパラメ
ータ等)を用いてもよい。更に、前述の(7)式にお
ける重み付け関数w(n)はなくてもよい。 尚、デイジタル信号処理の分野でよく知られて
いるように、自己相関関数はパワスペクトルから
計算してもよい。また相互相関関数はクロス・パ
ワススペクトルから計算してもよい。 また、本発明による音源パルス計算式(16)式に
おいては、ψhh(゜)として(18)式に従つて共分散
関数を計算したが、これは下式のような自己相
関々数列を計算するような構成にしてもよい。 Ψhh(|mi−mk|)=N−|mi−mk| 〓 n=1hw(n) hw(n−|mi−mk|,(1≦|mi−mk|≦N)
(20) このような構成をとることによつてψhh(゜)の
計算に要する演算量を大幅に低減させることが可
能となり、全体の演算量も低減できるという効果
がある。 また、第4図に示した本発明の構成による符号
器の一実施例においては、バツフアメモリ回路1
10の後ろに減算回路285をおく構成とした
が、減算回路285をバツフアメモリ回路110
の前におく構成としてもよい。更には、第4図に
おいてはKパラメータ計算回路280は減算回路
285の前に接続されており、バツフアメモリ回
路110の出力系列を分析するような構成とした
が、Kパラメータ計算回路280を減算回路28
5の後ろに接続して、285の出力系列を分析す
るような構成としてもよい。
【図面の簡単な説明】
第1図は従来方式の構成を示すブロツク図、第
2図は音源パルス系列の一例を示す図、第3図は
入力音声信号系列の周波数特性と第1図に記載の
重み付け回路の周波数特性の一例を示す図、第4
図は本発明の構成による音声符号化装置側の一実
施例を示すブロツク図、第5図は本発明の構成に
よる音声復号化装置側の一実施例を示すブロツク
図をそれぞれ示す。 図において、110,470……バツフアメモ
リ回路、120,285……減算回路、130,
320,440……合成フイルタ回路、140,
300,420……音源パルス発生回路、150
……誤差最小化回路、180,280……Kパラ
メータ計算回路、190,290……重み付け回
路、200……Kパラメータ符号化回路、240
……音源パルス計算回路、210……インパルス
応答計算回路、220……共分散関数計算回路、
235……相互相関々数計算回路、250……符
号化回路をそれぞれ示す。

Claims (1)

  1. 【特許請求の範囲】 1 送信側では、離散的な音声信号系列を入力し
    前記音声信号系列から過去に求めた駆動音源信号
    系列に由来した応答信号系列を減算する減算回路
    と、前記音声信号系列あるいは前記減算結果の短
    時間スペクトル包絡を表わすパラメータを抽出し
    て符号化するパラメータ計算回路と、前記スペク
    トル包絡を表わすパラメータをもとにインパルス
    応答系列を計算するインパルス応答系列計算回路
    と、前記インパルス応答系列の計算回路の出力系
    列を入力し相関々数列を計算する相関々数列計算
    回路と、前記減算結果をもとに目標信号系列を作
    り、前記目標信号系列と前記インパルス応答系列
    との相互相関々数列を計算する相互相関々数列計
    算回路と、前記相関々数列と前記相互相関々数列
    とを入力し前記音声信号系列の駆動音源信号系列
    を計算し符号化する駆動音源信号系列計算回路
    と、前記駆動音源信号系列に由来した前記応答信
    号系列を計算する応答信号系列計算回路と、前記
    スペクトル包絡を表わすパラメータ計算回路の出
    力符号系列と前記駆動音源信号系列の符号系列と
    を組み合わせて出力するマルチプレクサ回路とを
    有し、受信側では、前記符号系列を入力し前記駆
    動音源信号系列の符号系列と前記スペクトル包絡
    を表わすパラメータの符号系列とを分離するデマ
    ルチプレクサ回路と、分離して得た符号系列から
    前記駆動音源信号系列を復号化し音源パルス系列
    を発生させる音源パルス系列発生回路と、分離し
    て得た前記スペクトル包絡を表わすパラメータの
    符号系列を復号化する復号回路と、前記復号化し
    たスペクトル包絡を表わすパラメータを用いて音
    声信号系列を再生し出力する合成フイルタ回路と
    を有することを特徴とする音声符号化・復号化装
    置。 2 離散的音声信号系列を入力し前記音声信号系
    列から応答信号系列を減算する減算回路と、前記
    音声信号系列あるいは前記減算回路の出力系列の
    短時間スペクトル包絡を表わすパラメータを抽出
    し符号化するパラメータ計算回路と、前記スペク
    トル包絡を表わすパラメータをもとにインパルス
    応答系列を計算するインパルス応答系列計算回路
    と、前記インパルス応答系列計算回路の出力系列
    を入力し相関々数列を計算する相関々数列計算回
    路と、前記減算回路の出力系列または前記減算回
    路の出力系列にあらかじめ定められた補正を施し
    た信号と前記インパルス応答系列との相互相関々
    数列を計算する相互相関々数列計算回路と、前記
    相関々数列と前記相互相関々数列とを入力し前記
    音声信号系列の駆動音源信号系列を計算し符号化
    する駆動音源信号系列計算回路と、前記駆動音源
    信号系列を入力して前記駆動音源信号系列に由来
    した前記応答信号系列を計算する応答信号系列計
    算回路と、前記パラメータ計算回路の出力符号系
    列と前記駆動音源信号系列の符号系列とを組み合
    わせて出力するマルチプレクサ回路とを有するこ
    とを特徴とする音声符号化装置。
JP57231605A 1982-12-24 1982-12-24 音声符号化・復号化装置 Granted JPS59116794A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP57231605A JPS59116794A (ja) 1982-12-24 1982-12-24 音声符号化・復号化装置
CA000444239A CA1197619A (en) 1982-12-24 1983-12-23 Voice encoding systems
US06/565,804 US4716592A (en) 1982-12-24 1983-12-27 Method and apparatus for encoding voice signals

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57231605A JPS59116794A (ja) 1982-12-24 1982-12-24 音声符号化・復号化装置

Publications (2)

Publication Number Publication Date
JPS59116794A JPS59116794A (ja) 1984-07-05
JPH0426119B2 true JPH0426119B2 (ja) 1992-05-06

Family

ID=16926127

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57231605A Granted JPS59116794A (ja) 1982-12-24 1982-12-24 音声符号化・復号化装置

Country Status (1)

Country Link
JP (1) JPS59116794A (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61107815A (ja) * 1984-10-30 1986-05-26 Nec Corp デイジタル符号化装置
JP2940005B2 (ja) * 1989-07-20 1999-08-25 日本電気株式会社 音声符号化装置

Also Published As

Publication number Publication date
JPS59116794A (ja) 1984-07-05

Similar Documents

Publication Publication Date Title
EP0409239B1 (en) Speech coding/decoding method
EP1202251B1 (en) Transcoder for prevention of tandem coding of speech
US6052659A (en) Nonlinear filter for noise suppression in linear prediction speech processing devices
US5027405A (en) Communication system capable of improving a speech quality by a pair of pulse producing units
JP2002268696A (ja) 音響信号符号化方法、復号化方法及び装置並びにプログラム及び記録媒体
JP3266178B2 (ja) 音声符号化装置
JPH0426119B2 (ja)
JP2900431B2 (ja) 音声信号符号化装置
JPH0426120B2 (ja)
JPH0425560B2 (ja)
JP2853170B2 (ja) 音声符号化復号化方式
JPH0481199B2 (ja)
JP3063087B2 (ja) 音声符号化復号化装置及び音声符号化装置ならびに音声復号化装置
JP2946528B2 (ja) 音声符号化復号化方法及びその装置
JP3148920B2 (ja) 音声符号化復号化装置
JP2615862B2 (ja) 音声符号化復号化方法とその装置
JP3017747B2 (ja) 音声符号化装置
JPH0632030B2 (ja) 音声符号化方法
JPH0378637B2 (ja)
JPH043878B2 (ja)
JPH077277B2 (ja) 音声符号化方法とその装置
JPH0378638B2 (ja)
JPH0572780B2 (ja)
JPH0632034B2 (ja) 音声符号化方法
JPH0632031B2 (ja) 音声符号化方法とその装置