JPH05158495A - 音声符号化伝送装置 - Google Patents

音声符号化伝送装置

Info

Publication number
JPH05158495A
JPH05158495A JP4038652A JP3865292A JPH05158495A JP H05158495 A JPH05158495 A JP H05158495A JP 4038652 A JP4038652 A JP 4038652A JP 3865292 A JP3865292 A JP 3865292A JP H05158495 A JPH05158495 A JP H05158495A
Authority
JP
Japan
Prior art keywords
filter
encoder
noise
signal
encoders
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP4038652A
Other languages
English (en)
Inventor
Hidehira Iseda
衡平 伊▲せ▼田
Koji Okazaki
晃二 岡崎
Naoji Matsuo
直司 松尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP4038652A priority Critical patent/JPH05158495A/ja
Publication of JPH05158495A publication Critical patent/JPH05158495A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【目的】 本発明は音声信号を高能率符号化により情報
量圧縮するなどして伝送する音声符号化伝送装置に係
り、特に聴覚重み付けフィルタを使用して量子化雑音の
スペクトラムを整形することで雑音感を軽減するように
した音声符号化伝送装置に関するものであり、雑音感を
軽減するために用いる聴覚重み付けフィルタを常に最適
化することで、再生信号の聴感上の品質向上を図ること
を目的とするものである。 【構成】 送信側に、各々特性が異なる聴覚重み付けフ
ィルタ100#1〜100#nを持つ複数の符号器101#1
〜101#nと、複数の符号器対応に設けられて対応する
符号器の出力信号を復号化する複数の送信側復号器10
#1〜102#nと、送信側復号器からの再生信号に基づ
き対応する符号器で生じる量子化雑音を所定の評価関数
に従って評価して複数の符号器101#1〜101#nのう
ちから雑音感の少ない符号器を判定する評価手段103
と、評価手段103の判定結果に従って選択した雑音感
の少ない符号器の出力信号を受信側に伝送するようにす
る選択手段104とを備えたものである。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は音声信号を高能率符号化
により情報量圧縮するなどして伝送する音声符号化伝送
装置に係り、特に聴覚重み付けフィルタを使用して量子
化雑音のスペクトラムを整形することで雑音感を軽減す
るようにした音声符号化伝送装置に関するものである。
【0002】近年のディジタル通信回線の普及に伴い、
回線の有効利用を図るため、音声信号を伝送するにあた
ってその音声信号の情報量を圧縮して高能率に符号化す
る方式が注目されている。また、このような音声信号の
高能率符号化は、通信回線だけでなく音声蓄積応答シス
テム等においても、音声情報蓄積用メモリの容量削減の
ために有用である。
【0003】
【従来の技術】従来、音声信号の高能率符号化を行う音
声符号化伝送装置においては、再生信号の雑音感を軽減
する目的で、聴覚重み付けフィルタを使用して量子化雑
音のスペクトルを整形するようにしたものが知られてい
る。このような聴覚重み付けフィルタを使用する場合、
聴覚重み付けフィルタを送信側装置だけに設けるもの、
受信側装置だけに設けるもの、あるいはその両者に設け
るものがある。この聴覚重み付けフィルタを使用した装
置を開示する文献としては例えば次のようなものがあ
る。
【0004】 (1)M.R.Schroeder,et.al,"Optimizing digital speech coder by explotin g masking propertis of the human ear" J.Acoust.Soc.Amer.,vol.66,pp.1647- 1651,Dec 1979. (2)B.S.et.al,"Predictive coding of speech at low bit rate" IEEE Tra ns.Commun.,Vol.COM-,pp.600-614,Apr.1982. (3)M.R.Schroeder,et.al."Code-excited linear prediction(CELP)9:High -quality speech at very low bit rate" in Proc.IEEE Int.Conf.Acoust.,Spee ch,Signal Processing,Tampa,FL,1985,vol.1,paper 25.1.1. (4)CCITT G.721 (5)N.S.JAYAT et.al, "ADAPTIVE POSTFILTERING OF 16Kb/s-ADPCM SPEECH, " Proc.ICASSP pp.829-832,April 1986. (6)M.R.Schroeder et.al "Code-Excited Linear Prediction (CELP):High Quality Speech at Low Bit Rates," Proc.ICASSP,pp937-940,March 1985. (7)I.A.Gerson et.al,"Vector Sum Excited Lineat Predicton(VSELP) Spe ech coding at 8 kbps," Proc ISASSP,pp461-464,April 1990. p (8)P.Kroon et.al,"A Class of Analysis-by-Synthesis Predictive Coder s for High Qualty Speech Coding at Rates Between 4.8 and 16 kbit/s," IEE E JSAC,vol.6, No.2, February. (9)N.S.JAYANT et.al,"Digital Coding of Waveform",pp.135,Pretence-ha ll
【0005】
【発明が解決しようとする課題】これらの従来装置で
は、使用されている聴覚重み付けフィルタは1個のみで
あり、よってフィルタの形式、次数、リーク係数等によ
り定まるフィルタ特性は一種類の固定的なものである。
このため、入力音声信号のスペクトラムに対して最適な
雑音整形が常に行われているとは必ずしもいえず、再生
信号の雑音感が大きくなって聴感上の音声品質の劣化を
引き起すことが多かった。
【0006】本発明はかかる問題点に鑑みてなされたも
のであり、その目的とするところは、雑音感を軽減する
ために用いる聴覚重み付けフィルタを常に最適化するこ
とで、再生信号の聴感上の品質向上を図ることにある。
【0007】
【課題を解決するための手段】図1〜図3は本発明に係
る原理説明図である。本発明に係る音声符号化伝送装置
は、図1に示されるように、一つの形態として、送信側
に、各々特性が異なる聴覚重み付けフィルタ100#1
100#nを持つ複数の符号器101#1〜101#nと、複
数の符号器対応に設けられて対応する符号器の出力信号
を復号化する複数の送信側復号器102#1〜102
#nと、送信側復号器からの再生信号に基づき対応する符
号器で生じる量子化雑音を所定の評価関数に従って評価
して複数の符号器101#1〜101#nのうちから雑音感
の少ない符号器を判定する評価手段103と、評価手段
103の判定結果に従って選択した雑音感の少ない符号
器の出力信号を受信側に伝送するようにする選択手段1
04とを備えたものである。
【0008】この形態の音声符号化伝送装置において、
送信側復号器は対応する符号器の聴覚重み付けフィルタ
の逆特性を持つ聴覚重み付け逆フィルタを用いて復号化
を行うよう構成できる。またこの形態の音声符号化伝送
装置において、例えばCELP方式符号器のように、送
信側復号器が対応する符号器の構成の一部としてその内
部に含まれているようにすることができる。
【0009】また本発明に係る音声符号化伝送装置は、
図2に示されるように、他の形態として、送信側に、各
々特性が異なる聴覚重み付けフィルタ200#1〜200
#nを持つ複数の符号器201#1〜201#nと、符号器が
その量子化器と聴覚重み付けフィルタの特性に基づいて
発生する聴覚重み付けされた量子化雑音の大きさを各符
号器201#1〜201#nについてそれぞれ推定する量子
化雑音推定手段202と、量子化雑音推定手段202の
推定結果と入力音声信号とに基づいて複数の符号器20
#1〜201#nの入力音声信号に対する雑音感を所定の
評価関数に従って評価して複数の符号器201#1〜20
#nのうちから雑音感の少ない符号器を判定する評価手
段203と、評価手段203の判定結果に従って選択し
た雑音感の少ない符号器を用いて入力音声信号を符号化
するようにする選択手段204とを備えたものである。
【0010】また本発明に係る音声符号化伝送装置は、
送信側に各々特性が異なる聴覚重み付けフィルタを持
つ複数の符号器を備え、これら複数の符号器の量子化雑
音を所定の評価関数に従って評価して雑音感の少ない符
号器を判定し、その雑音感の少ない符号器の出力信号を
受信側に伝送するように構成したものである。
【0011】さらに本発明に係る音声符号化伝送装置
は、図3に示されるように、また他の形態として、送信
側に、入力音声信号を符号化する符号器301と、符号
器301の出力信号を、各々特性が異なる複数の聴覚重
み付けフィルタ300#1〜300#nをそれぞれ使用して
復号化する送信側復号器302と、送信側復号器302
でそれぞれ復号化した再生信号と入力音声信号とに基づ
いてその再生信号の雑音感を所定の評価関数に従って評
価して複数の聴覚重み付けフィルタ300#1〜300#n
のうちから雑音感の少ない聴覚重み付けフィルタを判定
する評価手段303と、評価手段303で判定した雑音
感の少ない聴覚重み付けフィルタに関する選択情報を受
信側に送信する選択情報送信手段304とを備え、受信
側に、送信側と同じの各々特性が異なる複数の聴覚重み
付けフィルタ400#1〜400#nを備え、受信側装置
は、複数の聴覚重み付けフィルタ400#1〜400#n
うちから受信した選択情報に対応する聴覚重み付けフィ
ルタを選択して、その聴覚重み付けフィルタを使用して
受信信号を復号化するようにしたものである。
【0012】
【作用】図1の形態の音声符号化伝送装置では、送信側
において、それぞれ異なる特性の聴覚重み付けフィルタ
100#1〜100#nを持つ複数の符号器101#1〜10
#nを並列動作させてそれぞれ入力音声信号の符号化を
行い、それらの符号器101#1〜101#nの符号化信号
を対応する送信側復号器102#1〜102#nでそれぞれ
復号化して、それらの再生信号を評価手段103で評価
することで、符号器101#1〜101#nのうちから入力
音声信号に対して雑音感の少ない符号器がどれであるか
を判定する。その判定結果に基づいて選択手段104
で、その雑音感の少ない符号器の出力信号を選択して受
信側へ伝送する。
【0013】また図2の形態の音声符号化伝送装置で
は、送信側において、量子化雑音推定手段202が、各
符号器201#1〜201#nについてその符号器の聴覚重
み付けされた量子化雑音の大きさを、符号器の量子化器
と聴覚重み付けフィルタの特性に基づいて推定する。評
価手段203はこの量子化雑音推定手段202の推定結
果と入力音声信号とに基づいて、各符号器201#1〜2
01#nの入力音声信号に対する雑音感を所定の評価関数
に従って評価する。選択手段204は、この評価手段2
03の評価結果に従って雑音感の少ない符号器を選択し
てその符号器を用いて入力音声信号を符号化するように
する。
【0014】これにより常に最適な聴覚重み付け特性の
(つまり雑音感が小さい)符号器で音声信号を符号化す
ることができる。またこの装置では、各符号器の雑音感
を評価するにあたって、各符号器の出力信号を実際に復
号化する局部復号器は必要なくこれを量子化雑音推定手
段202による推定で代替しており、また選択された以
外の残りの符号器を動作させる必要もないので、ハード
ウェア量とソフトウェア量の削減できる。
【0015】このように図1、図2の本発明の音声符号
化伝送装置は、送信側に備えられた各々特性が異なる聴
覚重み付けフィルタを持つ複数の符号器の雑音感を、現
に局部復号化された再生信号に基づきあるいは推定に基
づきそれぞれ評価し、雑音感の少ない符号器を判定し、
その雑音感の少ない符号器の出力信号を受信側に伝送す
るものである。
【0016】また図3の形態の音声符号化伝送装置で
は、送信側において、入力音声信号を符号器301で符
号化し、さらにその符号化した信号を、送信側復号器3
02によりそれぞれ異なる特性の聴覚重み付けフィルタ
を用いて復号化し、それぞれの再生信号を生成する。こ
れらの再生信号を評価手段303で所定の評価関数に従
って評価して、どの聴覚重み付けフィルタを用いた再生
信号が雑音感が少ないかを判定し、その選択情報を選択
情報送信手段304を用いて受信装置側に伝送する。
【0017】受信側では、送信装置側から伝送されてき
た選択情報に基づいて、その選択情報に対応する聴覚重
み付けフィルタ(すなわち送信側で雑音感を少ないと判
定されたもの)を用いて受信信号を聴覚重み付けしつつ
復号化する。これにより受信側において、常に雑音感の
少ない特性の聴覚重み付けフィルタを用いて音声信号を
再生することが可能になる。
【0018】
【実施例】以下、図面を参照して本発明の実施例を説明
する。なお、以下の説明において全図を通して同じ参照
番号が付された回路要素は同じ機能をもつ回路要素を表
すものとする。図4には本発明の一実施例としての音声
符号化伝送装置が示される。図4において、送信装置
は、入力音声信号に対してそれぞれ並列動作して符号化
を行う3台の符号器1と、これら3台の符号器1にそれ
ぞれ対応して設けられてその出力信号を局部復号化して
再生信号を生成する3台の局部復号器2と、これら3台
の局部復号器2からの再生信号の量子化雑音スペクトラ
ムを評価する評価部4と、この評価部4の評価結果に基
づき上記3台の符号器1のうちの一つの出力信号を選択
して伝送路側に送出する選択部3とを含み構成される。
【0019】なお以下の説明において、これら3台の符
号器1あるいは局部復号器2のように信号系統の異なる
回路を個々に区別して説明する必要がある時には、各系
統を#1、#2、#3・・・で区別して、その系統の回
路要素の参照記号やパラメータ等に添字#1、#2、#
3・・・を付して区別するものとする。例えば符号器1
#1、1#2、1#3のように記述する。
【0020】各符号器1は伝達関数W(z) の聴覚重み付
けフィルタ5と量子化器6で構成されており、量子化器
6からの出力信号が選択部3を介して伝送路に送出され
る。ここで各符号器1#n、1#2、1#3の聴覚重み付けフ
ィルタ5#1、5#2、5#3はそれぞれ異なる伝達関数W
(z) #1、W(z) #2、W(z) #3を持っている。また各局部
復号器2は逆量子化器7と伝達関数1/W(z) の聴覚重
み付け逆フィルタ8で構成されており、聴覚重み付け逆
フィルタ8からの出力信号は評価部4に送出される。こ
こで各局部復号器2#n、2#2、2#3の聴覚重み付け逆フ
ィルタ8#1、8#2、8#3は聴覚重み付けフィルタ5#1
#2、5#3の伝達関数W(z) #1、W(z) #2、W(z) #3
対応するそれぞれ異なる伝達関数1/W(z) #1、1/W
(z) #2、1/W(z) #3を持っている。
【0021】量子化雑音スペクトラム評価部4は各聴覚
重み付け逆フィルタ8#1、8#2、8#3からの局部復号信
号に基づいてそれら局部復号信号中の雑音のラウドネス
を計算することで、各符号器1#1〜1#3における符号化
の評価を行い、最も雑音感の少ない信号系統の符号器1
#nを判定し、選択部3がその符号器1#nからの符号化信
号を選択するよう選択部3に制御信号を出力すると共
に、どの符号器を選択したかを指示する選択情報をサイ
ド情報として受信装置側に送出するようになっている。
【0022】受信装置は3台の復号器10を備えてお
り、各復号器10は逆量子化器12と伝達関数1/W
(z) の聴覚重み付け逆フィルタ13で構成される。これ
らの復号器10#1、10#2、10#3は送信装置の局部復
号器2#1、2#2、2#3に対応した同一構成となってい
る。また選択部9と11を備え、送信装置から送られて
きたサイド情報により復号器10#1、10#2、10#3
うちの一つを選択して受信信号の復号化を行うようにな
っている。
【0023】以下、実施例装置の動作を説明する。送信
装置においては、3台の並列動作している符号器1#1
#3に音声信号がそれぞれ入力されて、聴覚重み付けフ
ィルタ5#1〜5#3でそれぞれ異なる伝達関数W(z) #1
W(z) #3で聴覚重み付けされた後に、量子化器6#1〜6
#3で量子化される。これらの符号器1#1〜1#3の符号化
信号は、対応する局部復号器2#1〜2#3で復号化され、
それらからの再生信号は量子化雑音スペクトラム評価部
4に入力される。
【0024】量子化雑音スペクトラム評価部4では、各
局部復号器2#1〜2#3からの再生信号についてその量子
化雑音のラウドネスを計算することで分析・評価を行
い、量子化雑音のラウドネスが最小の符号器を決定す
る。この量子化雑音のラウドネスが最小の符号器からの
出力信号が再生にあたって聴感上最も雑音感が少なくな
るので、量子化雑音スペクトラム評価部4はその符号器
の出力信号を選択するように選択部3を切換え制御し、
その符号器の出力信号を伝送路を介して受信装置に送出
する。また同時に、どの聴覚重み付けフィルタを使用し
た符号器を選択したかという選択情報もサイド情報とし
て受信装置側に送る。
【0025】受信装置では、このサイド情報を受信する
と、そのサイド情報に従って選択部9、11を切り換え
る。これにより、送信側で選択された聴覚重み付け特性
の符号器1#nに対応する聴覚重み付け逆特性を持つ復号
器10#nが選択される。つまり、送信側で雑音のラウド
ネスが最小になる聴覚重み付け特性W(z) #1で符号化さ
れた信号が伝送された場合には、受信側では聴覚重み付
け特性1/W(z) #1で受信信号を復号するものである。
【0026】これにより、送信側では、常に最適な聴覚
重み付け特性を持つ符号器で音声信号を符号化すること
ができ、聴感上の特性の良い音声信号の高能率符号化が
可能となる。
【0027】なお、量子化雑音スペクトラム評価部4に
おける量子化雑音のラウドネスの計算は例えば次のよう
な方法で行える。 (1)入力信号と雑音信号に適当な時間フレーム毎に窓
関数(ハミング窓など)をかけて切り出し、FFT(高
速フーリエ変換)あるいはDFT(離散フーリエ変換)
を使用して周波数領域に変換する。ここで入力周波数の
周波数領域の値をXj 、誤差信号の周波数領域の値をn
j とする。 (2)入力信号の臨界帯域毎のパワーSi 、および誤差
信号の臨界帯域毎のパワーNi を算出する。 Si =Σxj 2 (jはi番目の臨界帯域の範囲) Ni =Σnj 2 (jはi番目の臨界帯域の範囲) (3)Si 、Ni と、以下の式で示される関数Bi とを
畳み込み、マスキングの影響を考慮したパワーBi 、Q
i を算出する。 10log10 i =15.81 +7.5(i+0.474)-17.5(1+0.474)2)1/2 i =Si *Bi (*は畳み込み) Qi =Ni *Bi (4)各臨界帯域毎の信号の最小可聴値をθi として、
臨界帯域内の雑音の最小可聴レベルMi を求める。 Mi =max(Si 10**{(−15.5+i)/10,θi } ただし、**はべき乗の演算を表す記号である。 (5)各臨界帯域毎の雑音のラウドネスを求める。 Li =[max( Ni −Mi ,0) /{1+( Si /Ni ) ui}]vi ui,viは臨界帯域毎に異なるが、ここでは近似的に
ui=2.0、vi=0.25とする。 (6)雑音のラウドネスLn を求める。 Ln =ΣLi
【0028】本発明の実施にあたっては種々の変形形態
が可能である。図5には本発明の他の実施例としての音
声符号化伝送装置の送信装置側の構成が示される。この
実施例はAPC(Adaptive Predictive Coding:適応予
測符号化)方式の音声符号化伝送装置に本発明を適用し
た場合のものであり、この方式の音声符号化伝送装置で
は送信側でどの聴覚重み付けフィルタを使用した符号器
を選択したかという選択情報は受信側に伝送しなくとも
受信側での再生が可能である。
【0029】図5において、21は予測誤差を求めるフ
ィルタであり、1−P(z) の伝達関数を持ち、入力音声
信号に1−P(z) のフィルタをかけることで予測誤差成
分を得る。ここで、伝達関数P(z) は予測フィルタの伝
達関数であり、この予測フィルタは音声信号の隣接相関
による冗長性を取り除くものであり、フィルタの係数は
適当な時間フレーム毎に線形予測分析法などで決定され
る。
【0030】フィルタ21で得られた予測誤差成分は3
台の並列配置された符号器22に入力される。各符号器
22は減算器26、29、量子化器27、逆量子化器2
8、聴覚重み付けフィルタ30を含み構成される公知の
構成のものである。量子化器27は予測誤差成分を量子
化して情報量が圧縮された信号を生成するもので、この
時に量子化誤差が発生する。逆量子化器28はこの信号
を逆量子化するもので、減算器29で得られる逆量子化
器28の出力と予測誤差成分の差が量子化誤差となる。
【0031】聴覚重み付けフィルタ30はこの量子化誤
差に聴覚重み付けを行ってその出力信号を減算器26に
入力させる。各聴覚重み付けフィルタ30は量子化雑音
成分を整形し、聴感上の雑音を低減するものである。量
子化器の出力信号を復号化し入力信号と比較して整形さ
れた量子化雑音を得る。各符号器1#1〜1#3の聴覚重み
付けフィルタ30#1〜30#1はそれぞれ異なる聴覚重み
付け特性の伝達関数W(z) #1〜W(z) #3を持っている。
各聴覚重み付けフィルタ30#1〜30#3のタップ情報は
フレームの継ぎ目で前フレームで選択された聴覚重み付
けフィルタ30#nのタップ情報が各聴覚重み付けフィル
タ30#1〜30#3のタップ情報に複写される。この聴覚
重み付けフィルタ30#1〜30#3の構成については後に
詳しく述べる。
【0032】各符号器22#1〜22#3の出力信号は選択
部24でその一つが選択されて伝送路側に送出されると
共に、それぞれの符号器22#1〜22#3に対応して設け
られた局部復号器23#1〜23#3に入力される。各局部
復号器23は逆量子化器31、加算器32、予測器33
を含み構成される。逆量子化器31は逆量子化器28と
同じ構成である。予測器33は伝達関数P(z) を持ち、
各予測フィルタ33#1〜33#3のタップ情報はフレーム
の継ぎ目で前フレームで選択された予測フィルタ33#n
のタップ情報が各予測フィルタ33#1〜33#3のタップ
情報に複写される。
【0033】各局部復号器23#1〜23#3の出力信号は
雑音スペクトラム評価部25に入力される。雑音スペク
トラム評価部25は各局部復号器の再生信号について雑
音のラウドネスLn を計算して、最も雑音のラウドネス
Ln が小さい聴覚重み付けフィルタが組み込まれた符号
器を判定する。判定の結果は選択部24に与えられ、そ
れにより選択部24はそのラウドネスの最小な符号器の
出力信号を選択して伝送路側に送出する。この出力信号
を選択する処理は適当なフレーム毎に行われる。
【0034】次に、この実施例装置における予測フィル
タ33#1〜33#3および聴覚重み付けフィルタ30#1
30#3の構成例と、入力信号が8kHz でサンプリング
された場合のパラメータの例を説明する。
【0035】予測フィルタ33の更新周期は雑音のスペ
クトラム分析時にFFTを使用することを考慮して、2
のべき乗(128サンプル毎)とする。予測フィルタ3
3は線形予測分析から求める。次数は10次程度とす
る。各予測フィルタ33#1〜33#3の伝達関数P(z) は
何れも同じで、以下に示すものである。 P(z) =Σai -i ただし、i=1,10であり、ai は予測フィルタで用
いられる予測係数である。
【0036】聴覚重み付けフィルタ30は全零フィルタ
であり、次数は予測フィルタ33と同じで、フィルタの
係数は予測フィルタ33の予測係数aにリーク係数γを
かけたものとし、リーク係数γの大きさを変化させるこ
とでフィルタの特性を変化させる。
【0037】各符号器22#1、22#2、22#3における
聴覚重み付けフィルタ30#1、30#2、30#3の伝達関
数W(z) #1、W(z) #2、W(z) #3をそれぞれ次のように
異なるものに構成する。ここで、上記のようにγはリー
ク係数である。 W(z) #1=Σγ-ii -i ただし、γ=0.9、i=1,10 W(z) #2=Σγ-ii -i ただし、γ=0.8、i=1,10 W(z) #3=Σγ-ii -i ただし、γ=0.7、i=1,10
【0038】量子化器27はフレーム毎に予測誤差信号
の標準偏差で正規化される。分析窓は128点のハミン
グ窓を使用し、臨界帯域数は17とする。
【0039】以上のようにすると、符号器22#1〜22
#3の聴覚重み付け特性はそれぞれ異なるものとなり、し
たがって入力音声信号をそれぞれ異なる聴覚重み付け特
性を使用して符号化することができる。符号化された信
号は局部復号器23#1〜23#3でそれぞれ復号されて、
それらの復号信号の雑音のラウドネスが雑音スペクトラ
ム評価部25で評価され、それにより最も雑音のラウド
ネスが小さい聴覚重み付け特性の符号器が判定される。
選択部24はこの判定結果に応じてその雑音のラウドネ
スが小さい符号器からの出力信号を選択して伝送路側に
送出する。
【0040】受信側には、送信側における局部復号器2
3と同じ構成の復号器が用意されていて、これにより受
信信号を復号する。
【0041】なお、上述の図4、図5の装置における異
なる聴覚重み付け特性の実現法は上記のものに限られる
ものではなく、例えば聴覚重み付けフィルタの形式を変
えたり、聴覚重み付けフィルタの次数を変化させたり、
あるいはこれらを組み合わせたりすることでも、異なる
聴覚重み付け特性を実現することができる。以下、これ
について説明する。
【0042】まず、聴覚重み付けフィルタの形式を変え
ることで、特性を変化させる場合についての例を示す。
聴覚重み付けフィルタ30#1、30#2、30#3の構成
(伝達関数)をそれぞれ次のように変更する。 聴覚重み付けフィルタ30#1の伝達関数: 1−W(z) #1=1−Σγ-ii -i ただし、γ=0.8とし、i=1,10とする. 聴覚重み付けフィルタ30#2の伝達関数: 1−W(z) #1=(1−Σγ1 -ii -i)/(1−Σγ2 -ii -i) ただし、γ1 =0.9、γ2 =0.4とし、i=1,1
0とする. 聴覚重み付けフィルタ30#3の伝達関数: 1−W(z) #3=1/(1−Σγ-ii -i) ただし、γ=0.2とし、i=1,10とする.
【0043】この場合、フレームの継ぎ目で聴覚重み付
けフィルタのタップ情報を複写するため、全ての聴覚重
み付けフィルタ30において、過去10サンプルの入力
と過去10サンプルの出力を保持しておく。
【0044】次に聴覚重み付けフィルタの次数を変える
ことで特性を変化させる場合についての例を示す。 聴覚重み付けフィルタ30#1、30#2、30#3の伝達関
数W(z) #1、W(z) #2、W(z) #3をそれぞれ以下によう
にする。 W(z) #1=Σγ-ii -i ただし、γ=0.8であり、i=1,10とする。 W(z) #2=Σγ-ii -i ただし、γ=0.8であり、i=1,8とする。 W(z) #3=Σγ-ii -i ただし、γ=0.8であり、i=1,6とする。
【0045】この場合、フレームの継ぎ目で聴覚重み付
けフィルタのタップ情報を複写するため、全ての聴覚重
み付けフィルタにおいて、過去10サンプルの入力(最
大のタップ数のデータ)を保持しておく。
【0046】なお、上記の聴覚重み付けフィルタの形式
と次数の変更を組み合わせる場合には、全ての聴覚重み
付けフィルタにおいて最大タップ数の入力データと出力
データを保持するようにする。
【0047】図6には本発明のまた他の実施例としての
音声符号化伝送装置が示される。この実施例は本発明
を、例えば前掲の文献3)に記載されたようなCELP
(CodeExcited Linear Predective Coding:符号励振形
線形予測)方式の符号化伝送装置に適用した場合のもの
である。
【0048】図6において、この実施例装置は入力音声
信号に対して並列動作する3台の符号器40、各符号器
40で作られる量子化誤差が入力されてそのラウドネス
を計算し評価する量子化雑音スペクトラム評価部48、
量子化雑音スペクトラム評価部48の評価結果に従って
量子化雑音が最も小さい符号器の符号化情報(コードブ
ックインデックス、ゲインなど)を選択して受信側に送
出する選択部49を含み構成される。
【0049】各符号器40は、送信信号となる符号化情
報を生成するコードブック41、コードブックからの符
号化情報のゲインを変えるゲイン係数乗算器42、ピッ
チ予測フィルタ43、再生信号を出力する近接予測フィ
ルタ44、再生信号と入力信号との差をとって量子化誤
差を生成する減算器45、減算器45からの量子化誤0
に聴覚重み付けを行う聴覚重み付けフィルタ46、聴覚
重み付けフィルタ46で重み付け後の量子化誤差の電力
を計算してその誤差電力が最小となるようにコードブッ
ク41の符号化情報の検索を制御する二乗誤差最小化回
路47などを含み構成される。
【0050】かかるCELP方式の符号器40では、コ
ードブックインデックスとゲインの全ての組合せをピッ
チ予測フィルタ43と近接予測フィルタ44に入力して
得られた結果と、入力信号との差分を減算器45でと
り、その差分に聴覚重み付けフィルタ46で聴覚重み付
け特性をかけた値のパワーが最も小さいコードブックイ
ンデックスとゲインの組合せを選択して、これを受信側
に送るものである。
【0051】ここで、各ピッチ予測フィルタ43#1〜4
#3の伝達関数1/B(z) は共に同じで、 B(z) =1−αzL ただし、Lはピッチ周期である。
【0052】また各近接予測フィルタ44#1〜44#3
伝達関数1/A(z) も共に同じで、 A(z) =1−Σai -i ただし、i=1,10である。
【0053】ゲイン係数乗算器42#1〜42#3のゲイン
はそれぞれG#1、G#2、G#3である。またコードブック
41#1〜41#3のコードブックインデックスはそれぞれ
#1、n#2、n#3である。
【0054】聴覚重み付けフィルタ46#1、46#2、4
#3はそれぞれ次の伝達関数W(z) #1、W(z) #2、W
(z) #3のものを使用する。 W(z) #1=(1−Σγ1 -ii -i)/(1−Σγ2 -ii -i) ただし、γ1 =1.0、γ2 =0.4であり、i=1,10である。 0.(z) #2=(1−Σγ1 -ii -i)/(1−Σγ2 -ii -i) ただし、γ1 =1.0、γ2 =0.6であり、i=1,10である。 W(z) #3=(1−Σγ1 -ii -i)/(1−Σγ2 -ii -i) ただし、γ1 =1.0、γ2 =0.8であり、i=1,10である。
【0055】これにより各符号器40#1〜40#3では、
それぞれ異なる聴覚重み付け特性を使用して音声信号の
符号化が行われ、このうち量子化雑音のラウドネスが最
小の符号化を行った符号器がどれであるかが量子化雑音
スペクトラム評価部48で判定され、その判定結果に基
づき選択部49はそのラウドネス最小の符号器の符号化
情報(すなわちコードブックインデックスnとゲイン
G)を選択して受信側に送る。
【0056】図7には本発明のまた他の実施例としての
音声符号化伝送装置が示される。前述した各実施例の音
声符号化伝送装置は聴覚重み付け特性が異なる複数の符
号器を同時に動作させるものであるが、かかる音声符号
化伝送装置では現に同時動作している符号器が複数台常
に必ず必要であり、さらにその符号器の雑音特性を雑音
スペクトラム評価部で評価するために各符号器の出力信
号を局部復号する局部復号器が同じく複数台必要となる
ので、送信側のハードウェア規模が非常に大きくなる。
またこれら符号器や局部復号器をマイクロコンピュータ
やDSP等を用いてソフトウェア処理で実現した場合、
その処理量が非常に大きくなるという問題がある。この
図7の実施例はかかる問題を解決したものである。
【0057】図7において、1#1〜1#3は聴覚重み付け
特性がそれぞれ異なる符号器、3と427は選択部であ
ってこの3台の符号器1#1〜1#3の一つを選択してその
選択した符号器への音声信号の入力と符号化結果の出力
を行うものである。417は量子化誤差推定部であっ
て、符号器の聴覚重み付けフィルタに対応する聴覚重み
付け逆フィルタの特性と量子化器の特性(量子化ステッ
プサイズなど)に基づいてその符号器に固有の聴覚重み
付けされた量子化誤差(あるいは量子化雑音)を3台の
符号器1#1〜1#3それぞれについて推定するものであ
る。437は量子化雑音スペクトラム評価部であって、
量子化雑音推定部417で推定された結果(すなわち各
符号器1#1〜1#3の量子化誤差)と入力音声信号とに基
づいて、その音声信号に対する各符号器1#1〜1#3の量
子化雑音のラウドネスを計算・評価して量子化雑音のラ
ウドネスが最小のもの(すなわち聴感上最も雑音感が少
ないもの)を判定する回路である。
【0058】この実施例装置の動作を以下に説明する。
量子化誤差推定部417は、各符号器1#1〜1#3につい
て、その符号器の量子化特性(量子化器6の量子化ステ
ップサイズなど)と聴覚重み付け逆フィルタの特性(伝
達関数1/W(z)など)とに基づいてその符号器の雑音
信号の特性(量子化誤差)を推定する。この量子化誤差
は量子化特性と逆フィルタ特性1/W(z)が予め分かれ
ば計算でほぼ一意に推定することができる。この推定の
方法は後に詳しく述べる。
【0059】量子化雑音スペクトラム評価部437は、
量子化誤差推定部417で推定された各符号器1#1〜1
#3の量子化雑音電力を受け取り、これらの量子化雑音情
報と入力音声信号とに基づいて、各符号器1#1〜1#3
その音声信号が入力された時の各符号器1#1〜1#3の量
子化雑音のラウドネスを計算、分析する。ここで量子化
雑音のラウドネスが最小のものを聴感上最も雑音感が少
ないと見なすことができる。
【0060】選択部3と427は量子化雑音スペクトラ
ム評価部437からその評価結果である切替え信号を受
け取ることで、3台の符号器1#1〜1#3のうちから、量
子化雑音のラウドネスが最小となる聴覚重み付けフィル
タを使用した符号器を選択し、その符号器に音声信号を
入力して符号化を行い、、その符号化結果を伝送路側に
送り出す。この時、どの聴覚重み付けフィルタを使用し
た符号器を選択したかという情報もサイド情報として多
重化して伝送する。
【0061】復号器側では、どの聴覚重み付けフィルタ
を使用したかという情報に基づいて複数の聴覚重み付け
逆フィルタ中から最適な聴覚重み付け逆フィルタを選択
して使用し,受信信号を復号化する。
【0062】このように、本実施例の音声符号化伝送装
置が前述の各実施例の符号化伝送装置と相違する点は、
雑音のラウドネス評価の際に用いる量子化誤差電力を前
述の各実施例では局部復号器2#1〜2#3で実際に得てい
たのに対して 本実施例では量子化誤差推定部417で
推定して用いることであり、これにより送信側の局部復
号器が不要となり、それを実現するためのハードウェア
あるいはソフトウェアが不要となる。さらに本実施例で
は入力音声信号に対して複数の符号器を同時に動作させ
るのではなく、最も雑音感が少ないと評価された符号器
のみに音声信号を入力して符号化を行っているので、特
に符号化をソフトウェア的に実現したような場合には残
りの符号器についてはソフトウェア処理を行う必要がな
くなり、ソフトウェア処理を削減することができる。
【0063】量子化誤差の推定方法前述の雑音信号の推
定方法を以下に示す。この推定は各逆フィルタ毎に行う
ものである。 (1)聴覚重み付け逆フィルタ(1/W(z) #1、1/W
(z)#2、1/W(z) #3)の周波数特性を求める。 (2)周波数特性を雑音のラウドネスの算出時に使用す
る時間フレームに対応した間隔(サンプリング周波数/
フレーム長)で周波数軸上でサンプリングを行う。 (3)サンプリングされた値に対して、切出しで使用す
る窓にFFT(DFT)をかけたものを畳み込む。 (4) 量子化誤差の電力を量子化器の特性から算出す
る。この算出法は量子化器の特性に応じてそれぞれ異な
るものになるが、例えば線型量子化器の場合の量子化誤
差電力E2 は量子化幅をΔとすると、E2 =Δ2 /1
2、となり、1サンプルあたりの電力はE2 /フレーム
長となる。 (5)量子化特性の周波数を白色(フラット)と仮定し
て、(3)で得られた特性に乗じて、雑音信号の周波数
領域の電力を得る。
【0064】雑音のラウドネスの算出方法 量子化雑音のラウドネスの算出方法は前述したものと同
じであるが、ステップ(1)における量子化誤差信号の
周波数領域の値nj としては上記推定法で求めた値を使
用する。
【0065】図8には本発明のまた他の実施例が示され
る。この実施例の音声符号化伝送装置は図5で説明した
APC方式について上述の実施例同様に送信側ハードウ
ェア/ソフトウェアの削減を図ったものである。この実
施例でも、前述の図5の実施例同様に、送信側でどの聴
覚重み付けフィルタを選択したかという情報は受信側に
伝送しなくともよい。
【0066】図8において、予測誤差を求めるフィルタ
21、符号器22#1〜22#3、選択部24などは図5で
説明したものと同じものである。相違点として、本実施
例装置は量子化誤差推定部51と符号器22#1〜22#3
への音声信号の入力を切り換える選択部53を有し、一
方、局部復号器は持たず、雑音スペクトラム評価部52
には量子化雑音推定部51で推定された量子化誤差電力
が入力されている。
【0067】符号器22#1〜22#3では3種類の聴覚重
み付けフィルタ30#1〜30#3を使用する。これら聴覚
重み付けフィルタ30#1〜30#3の特性はそれぞれW#1
(z)、W#2(z)、W#3(z)である。これらは量子化雑音
成分を整形し、聴感上の雑音感を低減するものであり、
整形された雑音成分は量子化雑音にそれぞれ(1−W
(z) #1)/(1−P(z))、(1−W(z) #2)/(1−
P(z))、(1−W(z) #3)/(1−P(z))の特性の
フィルタ60#1〜60#3がかかったものとなる。。
【0068】量子化誤差推定部51では、各々の符号器
22#1〜22#3について、それらに対応したフィルタ6
#1〜60#3の周波数特性と量子化器の特性から、各々
の聴覚重み付けされた量子化誤差信号の電力を求める。
この各符号器の量子化誤差情報は雑音スペクトラム評価
部52に渡される。
【0069】雑音スペクトラム評価部52は、量子化誤
差推定部51で得られた量子化誤差電力と入力音声信号
とから、雑音のラウドネスを計算して求めてそれらを評
価し、最も雑音のラウドネスの小さい聴覚重み付けフィ
ルタが組み合わされた符号器を判定し、その評価結果に
基づいてその符号器を選択するように選択部53、24
に制御信号を送る。
【0070】選択部24、53は雑音スペクトラム評価
部52で選ばれた符号器を選択するよう切替えを行い、
それによれ音声信号をその符号器に入力して符号化を行
うと共にその符号化結果を伝送路に出力する。この出力
を選択する処理は適当なフレーム毎に行われる。各聴覚
重み付けフィルタのタップ係数としてはフレームの継ぎ
目で選択された聴覚重み付けフィルタのタップ係数が各
聴覚重み付けフィルタのタップ係数に複写される。
【0071】この実施例における予測フィルタ33#1
33#3および聴覚重み付けフィルタ30#1〜30#3の構
成は図5で説明したものと同様にすることができる。
【0072】量子化誤差の推定方法 この実施例における雑音信号の推定方法を次に示す。 (1) (1−W(z) #1)/(1−P(z))、(1−W
(z) #2)/(1−P(z))、(1−W(z) #3)/(1−
P(z))のフィルタ60#1〜60#3の周波数特性を求め
る。 (2) 8000/128Hz毎に周波数軸上でサンプリ
ングを行う。 (3) サンプリングされた値に対して、切出しで使用
する窓に128点のハミング窓にFFTをかけたものを
畳み込み、離散周波数軸上のフィルタの特性を得る。 (4) 量子化誤差の大きさを量子化器の特性から算出
する。 例えば、ラプラス分布に最適化された2bit の非線型量
子化器の場合、予測誤差信号のパワー(入力信号に(1
−P(z))のフィルタをかけたもの)から、7.54d
B小さい値が量子化誤差電力となる。(文献(3)参
照)。 (5) 量子化誤差の周波数特性を白色(フラット)と
仮定し、(3)で得られた特性に乗じて雑音周波数の周
波数領域の電力を得る。
【0073】図9には本発明のまた他の実施例が示され
る。この実施例は受信側の復号器側だけに聴覚重み付け
フィルタを使用して量子化雑音のスペクトラムを整形し
雑音感を軽減する従来の形態の音声符号化伝送装置に本
発明を適用したものであり、特にここでは本発明を前掲
の文献(4)に記載されているようなADPCM(Adap
tive Differential Pulse Code Modulation)方式の高能
率音声符号化伝送装置に適用し、聴覚重み付けフィルタ
として、前掲の文献(5)に記載されているようなフォ
ルマント構造に基づく後処理フィルタ(Post-Filter)を
用いた場合の実施例を説明する。
【0074】図9において、送信側の装置は、ADPC
M符号器70と、このADPCM符号器70の符号化情
報を復号化し再生信号を生成するADPCM復号器71
と、このADPCM符号器71からの再生信号にそれぞ
れ異なる特性の聴覚重み付けをするフォルマント構造に
基づく3つの後処理フィルタ72#1〜72#3と、これら
の後処理フィルタ72#1〜72#3で聴覚重み付けした再
生信号の量子化雑音スペクトラムを評価する量子化雑音
スペクトラム評価部73とを含み構成される。
【0075】また受信側の装置は、伝送路から受信した
受信信号を復号化して再生信号を生成するADPCM復
号器74と、送信側の後処理フィルタ72#1〜72#3
同じ特性で聴覚重み付けをする3つの後処理フィルタ7
#1〜76#3と、これら後処理フィルタ76#1〜76#3
の一つを選択してADPCM復号器74からの再生信号
を聴覚重み付けする選択部75、77とを含み構成され
る。
【0076】ここで送信側の後処理フィルタ72#1〜7
#3と受信側の後処理フィルタ76#1〜76#3はADP
CMの復号器の予測フィルタにリーク係数α、βを乗じ
て実現され、例えば前掲の文献(5)に記載されている
ACPCM復号器では、予測フィルタはその伝達関数
が、 {1+B(z) }/{1 −A(z) } A(z) =Σaj -j ただし、Σはj=1から2ま
で B(z) =Σb j -j ただし、Σはj=1から6ま
で の形で構成されており、後処理フィルタはその伝達関数
が、 {1+B'(z)}/{1 −A'(z)} A'(z)=Σaj αj -j ただし、Σはj=1から
2まで O≦α≦1 B'(z)=Σb j βj -j ただし、Σはj=1から
6まで O≦β≦1 の形で実現される。
【0077】ここでリーク係数α、βの値により聴覚重
み付けフィルタの特性を変化させることが可能であり、
本実施例ではこのα、βの値の組合せを3種類設定して
いる。この組合せとしては例えば、 α=0.2 β=0.8 α=0.1 β=0.8 α=0.1 β=0.9 などのようにすることができる。
【0078】この実施例装置の動作を説明すると、送信
側装置において、ADPCM符号器70で符号化した信
号をADPCM復号器71で復号化し、その再生信号を
それぞれ後処理フィルタ72#1〜72#3を通して聴覚重
み付けをする。そして各聴覚重み付けした再生信号を量
子化雑音スペクトラム評価部73に入力して、ここでこ
れら各々異なる聴覚重み付け特性で整形された再生信号
と入力音声信号との間で雑音のラウドネスを計算し分析
して、その中から(量子化)雑音のラウドネスが最小の
ものを最も聴覚特性がよい(すわなち雑音感が最も少な
い)ものと判定し、それがどの聴覚重み付けフィルタ
(すなわち後処理フィルタ72#1〜72#3)であったか
の選択情報を、ADPCM符号器70の符号化情報に多
重化して受信側に送る。
【0079】この量子化雑音スペクトラム評価部73で
の雑音のラウドネスの算出方法は前述の図4の実施例の
場合と同じであり、3つの後処理フィルタ72#1〜72
#3のうちの最も聴覚特性がよいものを選択する動作は適
当なフレーム毎に行われ、フレームのつなぎ目で、選択
された後処理フィルタ72#nのタップ係数およびフィル
タ係数が、各後処理フィルタ72#1〜72#3のタップ係
数およびフィルタ係数に複写される。
【0080】受信側装置では、受信信号中から選択情報
を分離し、それにより現に受信している符号化信号に対
してどの聴覚重み付け特性の後処理フィルタを用いれば
その再生信号の雑音感が最も少なくなるかを認識し、そ
の雑音感が最も少ない後処理フィルタ76#nを選択する
ように選択部75、77を切り替えて復号化された信号
に聴覚重み付けを行う。
【0081】図10には本発明のまた他の実施例が示さ
れる。この実施例は前述の図9の実施例と同様に受信側
装置だけで聴覚重み付けを行って雑音整形を行う形態の
音声符号化伝送装置に本発明を適用したものであり、図
9の実施例と同様に、符号化方式としてADPCM方
式、聴覚重み付けフィルタとしてフォルマント構造に基
づく後処理フィルタを使用している。
【0082】図9の実施例との相違点は、ノイズラウド
ネスを計算するために量子化雑音スペクトラム評価部7
3に入力する入力音声信号にも聴覚重み付けフィルタを
かけていることである。すなわち、後処理フィルタ72
#1〜72#3に対応した特性の、聴覚重み付けフィルタと
してのフォルマント構造に基づく3つの後処理フィルタ
78#1〜78#3を用意してこれらで入力音声信号にそれ
ぞれ聴覚重み付けを行って量子化雑音スペクトラム評価
部73に入力する。
【0083】量子化雑音スペクトラム評価部73では、
入力音声信号に後処理フィルタ78#1がかかった信号
と、ADPCM復号器71で復号化された再生信号に後
処理フィルタ72#1がかかった信号との間でノイズラウ
ドネスを計算する。同様に、入力音声信号に後処理フィ
ルタ78#2がかかった信号と、ADPCM復号器71で
復号化された再生信号に後処理フィルタ72#2がかかっ
た信号との間、入力音声信号に後処理フィルタ78#3
かかった信号と、ADPCM復号器71で復号化された
再生信号に後処理フィルタ72#3がかかった信号との間
でぞれぞれノイズラウドネスを計算する。そして、これ
らの中で最もノイズラウドネスの小さい後処理フィルタ
を判定して、その選択情報を受信側装置に伝送する。
【0084】なお、受信側装置は図9で説明したものと
同じ構成であり、その動作も同じである。
【0085】この図10の実施例は、後処理フィルタ7
#1〜72#3による聴覚重み付けのかかり方が強く再生
信号が聴感上こもった音のような感じになる場合におい
て、比較的適正な聴覚重み付け特性を選択することがで
きるという特長を持つ。
【0086】図11および図12には本発明のまた他の
実施例が示される。この実施例の音声符号化伝送装置
は、前述の図9、図10と同様に受信側装置においてだ
け聴覚重み付けを行って雑音整形を行うタイプの音声符
号化伝送装置に本発明を適用したものであり、符号化方
式としてCELP方式、聴覚重み付けフィルタとして例
えば前掲の文献(7)に記載されているようなピッチ構
造に基づくピッチ前処理フィルタ(Pitch-prefilter)を
用いている。
【0087】図11は送信装置の実施例を示すものであ
り、図中、80はCELP方式の符号器である。81〜
85はCELP符号器80で符号化した情報を送信装置
側で復号化するための回路であり、81はコードブッ
ク、82はゲイン係数乗算器、83#1〜83#3はそれぞ
れ特性が異なる聴覚重み付けフィルタとしてのピッチ構
造に基づく3つのピッチ前処理フィルタ、84#1〜84
#3はそれぞれピッチ前処理フィルタ83#1〜83#3の出
力信号が入力されるピッチ予測フィルタ、85#1〜85
#3はそれぞれピッチ予測フィルタ84#1〜84#3の出力
信号が入力される近接予測フィルタ、86はそれぞれ近
接予測フィルタ85#1〜85#3の出力信号(すなわち復
号化された再生信号)が入力されてそれらと入力音声信
号とに基づいて各再生信号の量子化雑音スペクトラムを
評価する量子化雑音スペクトラム評価部である。
【0088】また図12は受信装置の実施例を示すもの
であり、91はコードブック、92はゲイン係数乗算
器、93#1〜93#3はそれぞれ特性が異なる聴覚重み付
けフィルタとしてのピッチ構造に基づく3つのピッチ前
処理フィルタであり、このピッチ前処理フィルタ93#1
〜93#3は送信装置側のピッチ前処理フィルタ83#1
83#3にそれぞれ対応した同一特性を持つものである。
96はピッチ前処理フィルタ93#1〜93#3の一つを選
択する選択部、94は選択部96で選択されたピッチ前
処理フィルタ93#nの出力信号が入力されるピッチ予測
フィルタ、95はピッチ予測フィルタ94の出力信号が
入力されて復号化された再生信号を生成する近接予測フ
ィルタである。
【0089】本実施例では、ピッチ予測フィルタ84、
94の伝達関数B(z) は、 B(z) =1−αz-L (ただし、Lはピッチ周期、αは例えば0.8などの定
数である.)に設定する。また近接予測フィルタ85、
95の伝達関数A(z) は、 A(z) =1−ΣAj -j (ただし、Σはj=1からNまで、Nは予測次数であ
る.)に設定する。またGをゲイン係数乗算器82、9
2のゲイン、nをコードブック81、91のコードブッ
クインデックスとする。
【0090】また本実施例ではピッチ前処理フィルタ8
#1〜83#3の特性を次のようにすることで3つの異な
る特性を実現している。 ピッチ前処理フィルタ83#1の伝達関数=1/(1−β1 -L) ピッチ前処理フィルタ83#2の伝達関数=1/(1−β2 -L) ピッチ前処理フィルタ83#3の伝達関数=1/(1−β3 -L) ここでβ1 、β2 、β3 は入力音声信号から求まる値β
に異なる係数を乗じたものである。なお勿論のことであ
るが、この他にもβ1 、β2 、β3 を固定的に与えた
り、ピッチ前処理フィルタによってピッチ周期Lの値を
変化させることなどによって異なる聴覚重み付け特性を
実現することができる。
【0091】この実施例装置の動作を説明すると、送信
装置側において、CELP符号器80で符号化した情報
を、それぞれ異なる特性のピッチ前処理フィルタ(聴覚
重み付けフィルタ)83#1〜83#3を用いてそれぞれに
復号化し、それらの再生信号を量子化雑音スペクトラム
評価部86に入力して、この量子化雑音スペクトラム評
価部86で、復号化された再生信号の中からノイズラウ
ドネスが最も小さくなるものに対応するピッチ前処理フ
ィルタ83#nを判定する。そしてそれがどのピッチ前処
理フィルタであったかを示す選択情報を受信装置側に伝
送する。
【0092】受信装置側では、受信した選択情報を分離
してどのピッチ前処理フィルタを用いて受信信号を復号
化すれば最も雑音感が軽減されるかを知り、そのピッチ
前処理フィルタ93#nを選択部96で選択して受信信号
を復号化する。
【0093】図13には本発明のさらにまた他の実施例
としての音声符号化伝送装置の送信装置側の構成が示さ
れる。この実施例の音声符号化伝送装置は、前述の図1
2と同様に受信側装置においてだけ聴覚重み付けを行っ
て雑音整形を行うタイプの音声符号化伝送装置であっ
て、符号化方式としてCELP方式、聴覚重み付けフィ
ルタとして例えば前掲の文献(8)に記載されているよ
うなピッチ構造に基づくピッチ後処理フィルタ(Pitch-
postfilter) を用いている。
【0094】図13において、80はCELP方式の符
号器、81はコードブック、82はゲイン係数乗算器、
84はピッチ予測フィルタ、85は近接予測フィルタ、
86は量子化雑音スペクトラム評価部であり、これらは
図11で説明したものと同じである。87#1〜87#3
ピッチ構造に基づくピッチ後処理フィルタであり、聴覚
重み付けフィルタとして働き、それぞれ聴覚重み付け特
性が異なっている。例えば、 ピッチ後処理フィルタ87#1=1(1−ε1 -L) ピッチ後処理フィルタ87#2=1(1−ε2 -L) ピッチ後処理フィルタ87#3=1(1−ε3 -L) のように設定する。ここでは他のパラメータは前述の図
11の実施例の場合と同じとする。
【0095】なお図示しないが受信装置側の構成は送信
側の復号化部と同様なものであり、コードブック81、
ゲイン係数乗算器82、ピッチ予測フィルタ84、近接
予測フィルタ85、ピッチ後処理フィルタ87#1〜87
#3を含み構成され、さらに送信装置側からの選択情報に
従ってピッチ後処理フィルタ87#1〜87#3の一つを選
択して受信側での再生信号として出力する選択部を備え
たものである。
【0096】この実施例装置の動作は図11の実施例の
ものと同様であり、、送信装置側において、CELP符
号器80で符号化した情報を、それぞれ異なる特性のピ
ッチ後処理フィルタ(聴覚重み付けフィルタ)87#1
87#3を用いてそれぞれに復号化し、それらの再生信号
を量子化雑音スペクトラム評価部86に入力して、この
量子化雑音スペクトラム評価部86で、復号化された再
生信号の中からノイズラウドネスが最も小さくなるもの
に対応するピッチ後処理フィルタ87#nを判定し、それ
がどのピッチ後処理フィルタであったかを示す選択情報
を受信装置側に伝送する。
【0097】受信装置側では、受信した選択情報を分離
してどのピッチ後処理フィルタを用いて受信信号を復号
化すれば最も雑音感が軽減されるかを知り、そのピッチ
後処理フィルタ97#nを用いて受信信号を復号化する。
【0098】なお、これら図11、図13の実施例は更
に種々に変形することができる。例えば、図11の実施
例において、近接予測フィルタ85#1〜85#3の後段
に、フォルマント構造に基づく後処理フィルタをそれぞ
れ設けることも可能である。これらの後処理フィルタは
同一特性としても、あるいはそれぞれ特性が異なるよう
にしてもよい。これによりピッチ構造とホルマント構造
の双方による聴覚重み付けを施せる。
【0099】また図13の実施例においても、近接予測
フィルタ85の後段にホルマント構造に基づく後処理フ
ィルタを一つ設けてその出力信号を3分岐してそれぞれ
ピッチ後処理フィルタ87#1〜87#3に入力するように
してもよい。その他、種々のフィルタの組合せが可能で
ある。
【0100】以上の実施例では説明を簡単化するために
聴覚重み付けフィルタの特性を3つとしたが、もちろん
本発明はこれに限られるもではなく、3以上であっても
よいし、2であってもよい。
【0101】また、上述の実施例における送信側の複数
の符号器の実現方法としてはハードウェア回路によるも
のであってもよく、ソフトウェア処理によるものであっ
てもよい。またハードウェア回路として1台分の符号器
を用意し、その聴覚重み付け特性関数や量子化ステップ
サイズなどのパラメータをソフトウェア的に種々に設定
することで等価的に複数台の符号器を実現するものであ
ってもよい。
【0102】
【発明の効果】以上に説明したように、本発明によれ
ば、音声信号のスペクトラムに対して、聴感上最適な聴
覚重み付け特性を用いて雑音整形がされるから、再生信
号の雑音感が格段に改善される。
【0103】
【発明の効果】 【図面の簡単な説明】
【図1】本発明に係る原理説明図である。
【図2】本発明に係る原理説明図である。
【図3】本発明に係る原理説明図である。
【図4】本発明の一実施例としての音声符号化伝送装置
を示す図である。
【図5】本発明の他の実施例の音声符号化伝送装置(A
PC方式)を示す図である。
【図6】本発明の他の実施例の音声符号化伝送装置(C
ELP方式)を示す図である。
【図7】本発明のまた他の実施例の音声符号化伝送装置
を示す図である。
【図8】本発明のまた他の実施例の音声符号化伝送装置
(APC方式)を示す図である。
【図9】本発明のさらに他の実施例の音声符号化伝送装
置(ADPCM方式)を示す図である。
【図10】本発明のさらに他の実施例の音声符号化伝送
装置(ADPCM方式)を示す図である。
【図11】本発明のさらに他の実施例の音声符号化伝送
装置(CELP方式)の送信装置を示す図である。
【図12】本発明のさらに他の実施例の音声符号化伝送
装置(CELP方式)の受信装置を示す図である。
【図13】本発明のさらに他の実施例の音声符号化伝送
装置(CELP方式)を示す図である。
【符号の説明】
1、22、40 符号器 2、23 局部復号器 3、9、11、24、49、53、427選択部 4、25、48、52、437、73、86 量子化雑
音スペクトラム評価部 5、30、46 聴覚重み付けフィルタ 6、27 量子化器 7、12、28、31 逆量子化器 8、13 聴覚重み付け逆フィルタ 33 予測フィルタ 41、81、91 コードブック 42、82、92 ゲイン係数乗算器 43、84#1〜84#3、94 ピッチ予測フィルタ 44、85#1〜85#3、95 近接予測フィルタ 47 二乗誤差最小化回路 60、417 量子化誤差推定部 70 ADPCM符号器 71、74 ADPCM復号器 72#1〜72#3、76#1〜76#3、78#1〜78#3
ォルマント構造に基づく後処理フィルタ 73 量子化雑音スペクトラム評価部 75、77 選択部 80 CELP方式符号器 83#1〜83#3、93#1〜93#3 ピッチ構造に基づく
ピッチ前処理フィルタ 87#1〜87#3 ピッチ構造に基づくピッチ後処理フィ
ルタ

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 送信側に、各々特性が異なる聴覚重み付
    けフィルタ(100#1〜100#n)を持つ複数の符号器
    (101#1〜101#n)と、 該複数の符号器対応に設けられて対応する符号器の出力
    信号を復号化する複数の送信側復号器(102#1〜10
    #n)と、 該送信側復号器からの再生信号に基づき対応する符号器
    で生じる量子化雑音を所定の評価関数に従って評価して
    該複数の符号器のうちから雑音感の少ない符号器を判定
    する評価手段(103)と、 該評価手段の判定結果に従って選択した雑音感の少ない
    符号器の出力信号を選択して受信側に伝送するようにす
    る選択手段(104)とを備えた音声符号化伝送装置。
  2. 【請求項2】 該送信側復号器は対応する符号器の聴覚
    重み付けフィルタの逆特性を持つ聴覚重み付け逆フィル
    タを用いて復号化を行うよう構成された請求項1記載の
    音声符号化伝送装置。
  3. 【請求項3】 該送信側復号器は対応する符号器の構成
    の一部としてその内部に含まれている請求項1記載の音
    声符号化伝送装置。
  4. 【請求項4】 送信側に、各々特性が異なる聴覚重み付
    けフィルタ(200#1〜200#n)を持つ複数の符号器
    (201#1〜201#n)と、 該符号器がその量子化器と聴覚重み付けフィルタの特性
    に基づいて発生する聴覚重み付けされた量子化雑音の大
    きさを各符号器についてそれぞれ推定する量子化雑音推
    定手段(202)と、 該量子化雑音推定手段の推定結果と入力音声信号とに基
    づいて該複数の符号器の入力音声信号に対する雑音感を
    所定の評価関数に従って評価して該複数の符号器のうち
    から雑音感の少ない符号器を判定する評価手段(20
    3)と、 該評価手段の判定結果に従って選択した雑音感の少ない
    符号器を用いて入力音声信号を符号化するようにする選
    択手段(204)とを備えた音声符号化伝送装置。
  5. 【請求項5】 受信側の復号器に、送信側の符号器の聴
    覚重み付けフィルタの逆特性を持つ聴覚重み付け逆フィ
    ルタをそれぞれ備え、送信側でどの聴覚重み付けフィル
    タを使用したかという選択情報も受信側に伝送し、受信
    側の復号器では送信側で使用した聴覚重み付けフィルタ
    の逆特性を持つ聴覚重み付け逆フィルタを使用して復号
    化するようにした請求項1〜4の何れかに記載の音声符
    号化伝送装置。
  6. 【請求項6】 送信側の符号器は予測フィルタと聴覚重
    み付けフィルタを組み合わせて使用して量子化雑音の整
    形を行い、送信側でどの聴覚重み付けフィルタを使用し
    たかの選択情報は受信側に伝送しないようにした請求項
    1〜4の何れかに記載の音声符号化伝送装置。
  7. 【請求項7】 送信側に各々特性が異なる聴覚重み付け
    フィルタを持つ複数の符号器を備え、これら複数の符号
    器の雑音感をそれぞれ評価して雑音感の少ない符号器を
    判定し、その雑音感の少ない符号器の出力信号を受信側
    に伝送するように構成された音声符号化伝送装置。
  8. 【請求項8】 送信側に、 入力音声信号を符号化する符号器(301)と、 該符号器の出力信号を、各々特性が異なる複数の聴覚重
    み付けフィルタ(300#1〜300#n)をそれぞれ使用
    して復号化する送信側復号器(302)と、 該送信側復号器でそれぞれ復号化した再生信号と入力音
    声信号とに基づいてその再生信号の雑音感を所定の評価
    関数に従って評価して該複数の聴覚重み付けフィルタの
    うちから雑音感の少ない聴覚重み付けフィルタを判定す
    る評価手段(303)と、 該評価手段で判定した雑音感の少ない聴覚重み付けフィ
    ルタに関する選択情報を受信側に送信する選択情報送信
    手段(304)とを備え、 受信側に、 送信側と同じ各々特性が異なる複数の聴覚重み付けフィ
    ルタ(400#1〜400#n)を備え、 受信側装置は、該複数の聴覚重み付けフィルタのうちか
    ら受信した選択情報に対応する聴覚重み付けフィルタを
    選択して、その聴覚重み付けフィルタを使用して受信信
    号を復号化するようにした音声符号化伝送装置。
  9. 【請求項9】 該聴覚重み付けフィルタとして、音声信
    号のフォルマント構造に基づくもの、音声信号のピッチ
    構造に基づくもの、あるいはその両者を組み合わせたも
    のが使用されることを特徴とする請求項1〜8の何れか
    に記載の音声符号化伝送装置。
JP4038652A 1991-05-07 1992-01-29 音声符号化伝送装置 Withdrawn JPH05158495A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4038652A JPH05158495A (ja) 1991-05-07 1992-01-29 音声符号化伝送装置

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP13184391 1991-05-07
JP28207191 1991-10-02
JP3-131843 1991-10-02
JP3-282071 1991-10-02
JP4038652A JPH05158495A (ja) 1991-05-07 1992-01-29 音声符号化伝送装置

Publications (1)

Publication Number Publication Date
JPH05158495A true JPH05158495A (ja) 1993-06-25

Family

ID=27289898

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4038652A Withdrawn JPH05158495A (ja) 1991-05-07 1992-01-29 音声符号化伝送装置

Country Status (1)

Country Link
JP (1) JPH05158495A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08328600A (ja) * 1995-06-01 1996-12-13 Sony Corp 音声信号符号化方法及び装置、並びに音声信号符号化復号化装置
US5864794A (en) * 1994-03-18 1999-01-26 Mitsubishi Denki Kabushiki Kaisha Signal encoding and decoding system using auditory parameters and bark spectrum
JP2002123299A (ja) * 2000-08-09 2002-04-26 Sony Corp 音声処理装置および音声処理方法、学習装置および学習方法、並びにプログラムおよび記録媒体
JP2006054545A (ja) * 2004-08-10 2006-02-23 Matsushita Electric Ind Co Ltd ディジタルゲイン制御装置とそれを用いたオーディオ信号電力増幅装置、並びにそれらの方法
JP2009524100A (ja) * 2006-01-18 2009-06-25 エルジー エレクトロニクス インコーポレイティド 符号化/復号化装置及び方法
US7720999B2 (en) 2002-11-26 2010-05-18 Qualcomm Incorporated System and method for optimizing multimedia compression using plural encoders
US7912711B2 (en) 2000-08-09 2011-03-22 Sony Corporation Method and apparatus for speech data
WO2018052004A1 (ja) * 2016-09-15 2018-03-22 日本電信電話株式会社 サンプル列変形装置、信号符号化装置、信号復号装置、サンプル列変形方法、信号符号化方法、信号復号方法、およびプログラム

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5864794A (en) * 1994-03-18 1999-01-26 Mitsubishi Denki Kabushiki Kaisha Signal encoding and decoding system using auditory parameters and bark spectrum
JPH08328600A (ja) * 1995-06-01 1996-12-13 Sony Corp 音声信号符号化方法及び装置、並びに音声信号符号化復号化装置
JP2002123299A (ja) * 2000-08-09 2002-04-26 Sony Corp 音声処理装置および音声処理方法、学習装置および学習方法、並びにプログラムおよび記録媒体
US7912711B2 (en) 2000-08-09 2011-03-22 Sony Corporation Method and apparatus for speech data
JP4736266B2 (ja) * 2000-08-09 2011-07-27 ソニー株式会社 音声処理装置および音声処理方法、学習装置および学習方法、並びにプログラムおよび記録媒体
US7720999B2 (en) 2002-11-26 2010-05-18 Qualcomm Incorporated System and method for optimizing multimedia compression using plural encoders
JP2010213297A (ja) * 2002-11-26 2010-09-24 Qualcomm Inc 複数のエンコーダを用いてマルチメディア圧縮を最適化するためのシステムおよび方法
JP2006054545A (ja) * 2004-08-10 2006-02-23 Matsushita Electric Ind Co Ltd ディジタルゲイン制御装置とそれを用いたオーディオ信号電力増幅装置、並びにそれらの方法
JP2009524100A (ja) * 2006-01-18 2009-06-25 エルジー エレクトロニクス インコーポレイティド 符号化/復号化装置及び方法
WO2018052004A1 (ja) * 2016-09-15 2018-03-22 日本電信電話株式会社 サンプル列変形装置、信号符号化装置、信号復号装置、サンプル列変形方法、信号符号化方法、信号復号方法、およびプログラム
JPWO2018052004A1 (ja) * 2016-09-15 2019-07-04 日本電信電話株式会社 サンプル列変形装置、信号符号化装置、信号復号装置、サンプル列変形方法、信号符号化方法、信号復号方法、およびプログラム
US11468905B2 (en) * 2016-09-15 2022-10-11 Nippon Telegraph And Telephone Corporation Sample sequence converter, signal encoding apparatus, signal decoding apparatus, sample sequence converting method, signal encoding method, signal decoding method and program

Similar Documents

Publication Publication Date Title
US6584441B1 (en) Adaptive postfilter
US7848921B2 (en) Low-frequency-band component and high-frequency-band audio encoding/decoding apparatus, and communication apparatus thereof
AU763471B2 (en) A method and device for adaptive bandwidth pitch search in coding wideband signals
RU2262748C2 (ru) Многорежимное устройство кодирования
CN100393085C (zh) 数字网络中的音频信号质量增强
CN102341852B (zh) 滤波语音信号的方法和滤波器
KR100574031B1 (ko) 음성합성방법및장치그리고음성대역확장방법및장치
JP4302978B2 (ja) 音声コーデックにおける擬似高帯域信号の推定システム
US20090204397A1 (en) Linear predictive coding of an audio signal
MXPA96004161A (en) Quantification of speech signals using human auiditive models in predict encoding systems
JP2897551B2 (ja) 音声復号化装置
EP2132731B1 (en) Method and arrangement for smoothing of stationary background noise
JPH09152896A (ja) 声道予測係数符号化・復号化回路、声道予測係数符号化回路、声道予測係数復号化回路、音声符号化装置及び音声復号化装置
US20130218557A1 (en) Adaptive Approach to Improve G.711 Perceptual Quality
JPH05158495A (ja) 音声符号化伝送装置
CN115917645A (zh) 多模式空间音频编码的舒适噪声生成
KR20010090438A (ko) 백그라운드 잡음 재생을 이용한 음성 코딩
JP3270922B2 (ja) 符号化,復号化方法及び符号化,復号化装置
JP2018511086A (ja) オーディオ信号を符号化するためのオーディオエンコーダー及び方法
WO1997031367A1 (en) Multi-stage speech coder with transform coding of prediction residual signals with quantization by auditory models
KR100554164B1 (ko) 서로 다른 celp 방식의 음성 코덱 간의 상호부호화장치 및 그 방법
EP1035538B1 (en) Multimode quantizing of the prediction residual in a speech coder
JP2508007B2 (ja) 音声波形符号復号化装置
KR20060064694A (ko) 디지털 음성 코더들에서의 고조파 잡음 가중
JPH05232995A (ja) 一般化された合成による分析音声符号化方法と装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 19990408