JPH08328600A - 音声信号符号化方法及び装置、並びに音声信号符号化復号化装置 - Google Patents

音声信号符号化方法及び装置、並びに音声信号符号化復号化装置

Info

Publication number
JPH08328600A
JPH08328600A JP7160113A JP16011395A JPH08328600A JP H08328600 A JPH08328600 A JP H08328600A JP 7160113 A JP7160113 A JP 7160113A JP 16011395 A JP16011395 A JP 16011395A JP H08328600 A JPH08328600 A JP H08328600A
Authority
JP
Japan
Prior art keywords
gain
audio signal
frequency
gain control
control means
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7160113A
Other languages
English (en)
Inventor
Akihito Nakagawa
彰人 中川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP7160113A priority Critical patent/JPH08328600A/ja
Publication of JPH08328600A publication Critical patent/JPH08328600A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【目的】本発明は、音声信号符号化方法及び装置、並び
に音声信号符号化復号化装置において、既存の構成にフ
イルタを追加した簡易な構成で、より聴覚モデルに基づ
く等価曲線特性に近似した重み付けができ、これにより
聴感上の音質を向上し得るようにする。 【構成】入力される音声信号を聴覚モデルに基づいた等
価曲線特性と逆の特性で利得を制御した後に圧縮符号化
をする。これにより音声信号の符号化の際に、聴感上で
認識されやすい周波数帯域に割り当てるビツト数を増や
し、認識されにくい周波数帯域に割り当てるビツト数を
削減できる。かくして利得制御手段としてフイルタを設
けるだけの簡易な構成で、聴覚モデルに基づく周波数特
性に、より近似した重み付けができ、聴感上の音質を向
上し得る。

Description

【発明の詳細な説明】
【0001】
【目次】以下の順序で本発明を説明する。 産業上の利用分野 従来の技術(図7) (1)直交変換方法(図8〜図12) (2)サブバンドコーデイング方法(図13) 発明が解決しようとする課題 課題を解決するための手段 作用 実施例(図1〜図6) 発明の効果
【0002】
【産業上の利用分野】本発明は音声信号符号化方法及び
装置、並びに音声信号符号化復号化装置に関し、特に音
声信号を圧縮符号化する場合に適用して好適なものであ
る。
【0003】
【従来の技術】従来、この種の音声信号符号化復号化装
置として、図7(A)及び(B)に示す音声信号符号化
装置1及び音声信号復号化装置2がある。音声信号符号
化装置1は入力される音声信号S1を元のデータよりデ
ータ量を低減させた圧縮データS2に変換し、また音声
信号復号化装置2は音声信号符号化装置1により変換さ
れた圧縮データS2を元の音声信号S1に復元する。
【0004】すなわち図7(A)に示すように、音声信
号符号化装置1は入力されるデイジタル信号でなる音声
信号S1をエンコーダ3により圧縮符号化し、これによ
り得られた圧縮データS2を出力する。また図7(B)
に示すように、音声信号復号化装置2は入力された圧縮
データS2をデコーダ4で復号化することにより音声信
号S1に復元して出力する。
【0005】音声信号符号化装置1に入力される音声信
号S1を圧縮する方法及び音声信号復号化装置2に入力
される圧縮データS2を伸長する方法において、低ビツ
トレートでかつ高音質を実現する符号化及び復号化方法
として、一般に直交変換方法とサブバンドコーデイング
方法との2つが用いられている。以下にこの2つの処理
方法の概要を説明する。
【0006】(1)直交変換方法 図8(A)に示す構成の音声信号符号化装置10は時系
列でなる音声信号S10を周波数領域変換器11に入力
し、DCT(Discrete Cosine Transform )等により周
波数領域に変換したスペクトルデータS11を重み付け
回路12及びビツト割当て回路13に送出する。重み付
け回路12は図9に示す聴覚モデルに基づく等価曲線特
性を基に、聴覚上において認識される度合いに応じてス
ペクトルデータS11に順位をつけ(以下、これを重み
付けと呼ぶ)、これにより得られる重み付け信号S12
をビツト割当て回路13へ送出する。また重み付け回路
12は、重み付けの際に得られる量子化幅等の補助情報
を補助情報信号S13としてマルチプレクサ14へ送出
する。
【0007】ここで重み付け回路12が重み付け処理を
する上で基準となる聴覚モデルに基づく等価曲線特性
(図9)は、人の聴覚において周波数帯域毎にどの位の
音圧レベルで認識されるかをあらわしている。
【0008】ビツト割当て回路13は重み付け信号S1
2に基づいてスペクトルデータS11を量子化及び符号
化する。ここで圧縮符号化した後のビツト数の総計が伝
送上規定されているビツトレートに収まるように、各ス
ペクトルに割当てるビツトレートが調整される(以下、
これをビツト割当てと呼ぶ)。符号化されたデータ信号
S14はマルチプレクサ14へ送出される。マルチプレ
クサ14はデータ信号S14に補助情報信号S13を付
加して符号化した後、圧縮データS15として所定の伝
送路(図示せず)へと送出する。
【0009】ここで圧縮データS15は、図8(B)に
示す構成の音声信号復号化装置20によつて復号化され
る。音声信号復号化装置20は圧縮データS15を分離
回路21に入力し、データ信号S20と補助情報信号S
21とに分離した後、補助情報信号S21を演算回路2
2に、またデータ信号S20を復号化回路23にそれぞ
れ送出する。
【0010】演算回路22は補助情報信号S21を基に
して各スペクトル毎の割当てビツト数及び量子化幅を算
出し、算出結果を情報信号S22として復号化回路23
へ送出する。復号化回路23は情報信号S22に基づき
データ信号S20を復号化し、得られたスペクトルデー
タS23を時系列領域変換器24へ送出する。時系列領
域変換器24はスペクトルデータS23を時間領域に逆
変換することにより音声信号S24に復元し、これをス
ピーカ等の外部機器に出力する。
【0011】次に図8(A)の重み付け回路12でなさ
れている重み付け及びビツト割当て回路13でなされて
いるビツト割当てのアルゴリズムの具体例を、ATRA
C(Adaptive TRansform Acoustic Codeing )のアルゴ
リズムを例にとつて説明する。因みにATRACとは、
一定周波数帯域の音以外はレベルが高くないと聞きとり
にくい、またある周波数の音が聞こえている時は同じ周
波数近辺の小さい音は聞こえなくなる、等の現象を利用
した音声信号の圧縮技術の名称である。
【0012】図10は図8(A)の周波数領域変換器1
1より送出されたスペクトルデータS11の周波数分布
状態を示す。ここで現在用いられているDSP(Digita
l Signal Processor)は一回の処理単位当たり512 回の
演算が可能であるが、1回の演算では1回の加算、1回
の乗算及び演算結果の内部RAMへの格納等の単純動作
しかできず、512 本の各スペクトルデータ毎に重み付け
及びビツト割当てをすることは実際上、不可能である。
【0013】そのため、スペクトルデータS11は重み
付け回路12及びビツト割当て回路13(図8)で量子
化及び符号化する上で処理速度をあげられるように、図
11に示すようなスペクトルデータの何本かを一組にし
たブロツクユニツトに分割される。これにより重み付け
及びビツト割当てはブロツクユニツトを1単位としてな
される。なお本来のスペクトルデータは512 本あるがこ
こでは便宜上、数を減らしている。
【0014】重み付け回路12(図8(A))はブロツ
クユニツト化されたスペクトルデータにおいて、スペク
トルデータの最大中心周波数及び一か所に集中又は分散
している度合いの指数(以下、これを分散指数と呼ぶ)
を、最大中心周波数のあるブロツクユニツトと前後5個
のブロツクユニツトの差を基にして算出する。また当該
最大中心周波数と分散指数を基に、各ブロツクユニツト
毎に量子化幅(割当てビツト数)及び、削除するブロツ
クユニツトを決定するしきい値を算出し、ビツト割当て
回路13に算出結果を与える。
【0015】ビツト割当て回路13は図12に示すよう
に、算出されたしきい値より割当てビツト数の小さいブ
ロツクユニツトのスペクトルは削除し、それ以外では割
当てられた量子化幅でスペクトルデータを量子化及び符
号化する。なお、図11では音の大きさとブロツクユニ
ツトの割当てビツト数を比例させてあるが、実際はブロ
ツクユニツトの周波数帯等でブロツクユニツトの割当て
ビツト数が決まる。
【0016】ここで量子化後のスペクトルは、入力値を
P、Word Length を係数N及びScale Factorを係数Fと
して、Round 〔〕内を四捨五入するものとすると、次式
【数1】 で表される数式で符号化され、係数F及びNが補助信号
となる。さらに割当てビツト数及びしきい値は、各ブロ
ツクユニツトに割当てられた重みをパラメータとして算
出されるため、各ブロツクユニツトへの割当てビツト数
や削除の判断は聴覚の特性に沿うようにしている。
【0017】上述の演算処理の結果、総合ビツトレート
が規定より大きい場合は高域側のブロツクユニツトより
割当てビツト数を1ビツトずつ減らし、小さい場合は低
域側のブロツクユニツトより割当てビツト数を1ビツト
ずつ増やす。
【0018】(2)サブバンドコーデイング方法 図13(A)に示す音声信号符号化装置30において、
各帯域フイルタ31A〜31Nは入力される時系列でな
る音声信号S30を、ある帯域幅で複数の帯域に分割し
た各音声信号S31A〜S31Nに分け(以下、これを
帯域分割と呼ぶ)、各量子化回路32A〜32Nへ送出
する。ここで一般的には各帯域の帯域幅は高域になる
程、広くとる。各帯域フイルタ31A〜31Nにより帯
域分割された各音声信号S31A〜S31Nは、それぞ
れ所定の帯域にしか信号が存在しないためにサンプリン
グレートを落としても復元できるので、各量子化回路3
2A〜32Nにより各々サンプルの間引きをされる。
【0019】周波数領域変換器33は音声信号S30を
FFT(Fast Fourier Transform:高速フーリエ変換)
等により周波数領域へ変換した後、スペクトルデータS
32として重み付け回路34へ送出する。重み付け回路
34はスペクトルデータS32の周波数特性を測り、さ
らに等価曲線特性(図9)を基に各音声信号S31A〜
S31Nについて各々重み付けをする。これにより得ら
れた重み付け結果はビツト割当て信号S33A〜S33
Nとして量子化回路32A〜32Nに送出される。また
重み付け回路34は量子化幅等の補助情報信号S34を
マルチプレクサ35へ送出する。
【0020】量子化回路32A〜32Nはビツト割当て
信号S33A〜S33Nに基づき、各音声信号S31A
〜S31N各々にビツト割当てすると共に量子化する。
量子化された各帯域分割信号S35A〜S35Nはマル
チプレクサ35に送出される。マルチプレクサ35は量
子化された各帯域分割信号S35A〜S35Nと補助情
報信号S34とを多重化及び符号化した後、圧縮データ
S36として送出し、所定の伝送路を介して音声信号復
号化装置40に伝送する。
【0021】図13(B)に示す音声信号復号化装置4
0において、復号化回路41は圧縮データS36を復号
化して各帯域分割信号S40A〜S40Nと補助情報信
号S41とに分離した後、再量子化回路42A〜42N
に送出する。
【0022】再量子化回路42A〜42Nは補助情報信
号S41を基にして各帯域分割信号S40A〜S40N
を再量子化及び補間した後、各帯域フイルタ43A〜4
3Nを介して各帯域幅の信号を復元して加算器44に送
出する。加算器44は与えられる全信号を加算すること
により音声信号S44を復元して外部へ出力する。
【0023】従来の音声信号符号化装置1及び音声信号
復号化装置2は上述のような方法で音声信号の符号化及
び圧縮データの復号化をすることにより、比較的簡易な
構成で高能率な符号化及び復号化を行つていた。
【0024】
【発明が解決しようとする課題】ところでかかる構成の
音声信号符号化装置1で用いられる音声信号符号化方法
においては、周波数軸上での音のエネルギー分布に対し
て人の聴感上で感度の高い周波数帯域(認識されやすい
周波数帯域)の情報は残し、感度の低い帯域(認識され
にくい周波数帯域)の情報は削減する、という情報の重
み付けにより重みの軽い周波数情報から必要に応じて情
報の削減をしている。この場合、聴覚モデルに基づく等
価曲線特性(図9)に合わせて周波数軸上の各周波数帯
域に対して、音声情報を符号化する際のビツト数の割当
てを重み付けることが理想的である。
【0025】しかし各周波数帯域に対して理想的な重み
付けをするためには非常に複雑な回路構成を有するエン
コーダ及びデコーダを要し、また複雑な回路構成によつ
て多くの処理時間をも要することになる。
【0026】そこで音声信号符号化装置1では音声デー
タを複数の周波数帯域毎に区切ることでブロツク化し、
各ブロツク毎に重み付け及びビツト割当てを行うように
し、さらに音声処理のアルゴリズムも演算回数の少ない
関数を用いるようにしていた。また各周波数帯域毎に分
割されたブロツク単位で重み付けすることから、聴覚モ
デルに基づく等価曲線特性(図9)を階段状にした近似
な特性を用いて重み付けをしていた。このような方法を
用いることにより音声信号符号化装置1は、簡易な構成
で実時間内に音声信号を処理していた。
【0027】ところが上述の方法は限られた回路規模や
処理時間等の条件内において重み付けを行つているため
に、聴覚モデルに基づく等価曲線特性に、より近似した
理想的な重み付けをなすことが技術的に困難であるとい
う問題があつた。
【0028】本発明は以上の点を考慮してなされたもの
で、簡易な構成で、聴覚モデルに基づく等価曲線特性
に、より近似した重み付けができることにより聴感上の
音質を向上し得る音声信号符号化方法及び装置、並びに
音声信号符号化復号化装置を提案しようとするものであ
る。
【0029】
【課題を解決するための手段】かかる課題を解決するた
めに本発明においては、エンコーダの前段に、入力され
る音声信号の利得を聴覚モデルに基づく周波数特性と逆
の周波数特性に従つて利得制御する利得制御手段を設け
るようにする。
【0030】また本発明においては、エンコーダの前段
に、入力される音声信号のうち、聴覚における明瞭度の
小さい周波数帯域の音声信号を削除するように利得制御
する利得制御手段を設けるようにする。
【0031】
【作用】入力される音声信号を聴覚モデルに基づく周波
数特性と逆の周波数特性で利得制御した後に符号化す
る。これにより音声信号の符号化の際に、聴感上で認識
されやすい周波数帯域に割り当てるビツト数を増加で
き、認識されにくい周波数帯域に割り当てるビツト数を
削減できる。かくして従来の構成に利得制御手段として
フイルタを設けるだけの簡易な構成で、聴覚モデルに基
づく周波数特性に、より近似した重み付けができ、聴感
上の音質を向上し得る。
【0032】また入力される音声信号のうち、人の音声
が存在しない周波数帯域をカツトするように利得制御す
ることにより、音声信号の符号化の際に人の音声が存在
しない周波数帯域に割り当てるビツト数を削減でき、人
の音声が存在する周波数帯域に割当てるビツト数を増や
すことができる。かくして人の音声を符号化する場合の
明瞭度を向上し得る。
【0033】
【実施例】以下図面について、本発明の一実施例を詳述
する。
【0034】図7との対応部分に同一符号を付して示す
図1(A)及び(B)において、50は全体として音声
信号符号化装置を示し、また60は全体として音声信号
復号化装置を示す。音声信号符号化装置50において
は、入力される音声信号S50の周波数特性を重み付け
の際に最適化できるように利得制御するプレ・エンフア
シス・フイルタ(Pre-emphasis Filter )51をエンコ
ーダ52の前段に設けるようになされている。また音声
信号復号化装置60においては、デコーダ61の後段に
周波数特性を補正するデ・エンフアシス・フイルタ(De
-emphasis Filter)62を設けるようになされている。
【0035】通常プレ・エンフアシス・フイルタ又はデ
・エンフアシス・フイルタとよばれるフイルタは、プレ
・エンフアシス・フイルタで入力信号の高域側を持ち上
げ、デ・エンフアシス・フイルタで周波数特性を補正す
るために高域側を持ち下げることでS/N比の劣化を抑
えている。しかしここではビツト割当てのための重み付
け処理において、より理想的な重み付けをなすためのも
のとして用いる。
【0036】音声信号符号化装置50は入力される音声
信号S50を、プレ・エンフアシス・フイルタ51を介
して可聴帯域内において聴感上感度の良い帯域では利得
を上げ、また感度の良くない帯域では利得を下げた後、
音声データS51としてエンコーダ52に送出するよう
になされている。エンコーダ52は利得制御された音声
データS51を周波数領域への変換、重み付け及びビツ
ト割当てした後、復号化に用いられる補助情報と組み合
わせて符号化し、圧縮データS52として音声信号復号
化装置60へ所定の伝送路を介して伝送する。
【0037】音声信号復号化装置60は伝送されてきた
圧縮データS52をデコーダ61に入力する。デコーダ
61は圧縮データS52をデータ部分と補助情報とに分
離して、補助情報を基にデータ部分を復号化する。その
後、時系列領域へと逆変換して復元し、デ・エンフアシ
ス・フイルタ62へ音声データS60として送出する。
【0038】デ・エンフアシス・フイルタ62はデコー
ダ61で復元された時点の音声データS60の周波数特
性がプレ・エンフアシス・フイルタ51により利得制御
されたままの状態にあるため、デ・エンフアシス・フイ
ルタ62でなされた周波数特性の変化分を補正すること
により音声信号S61として外部へ出力するようになさ
れている。
【0039】ここで上述の効果を得られるプレ・エンフ
アシス・フイルタ51及びデ・エンフアシス・フイルタ
62の実現性を、図2を示して以下に説明する。
【0040】プレ・エンフアシス・フイルタ51では聴
覚において感度の高い帯域程、利得を上げ、感度の低い
帯域程、利得を下げる。またデ・エンフアシス・フイル
タ62ではプレ・エンフアシス・フイルタ51と逆の周
波数特性で利得制御する(図1)。このようにすること
で音質の向上を望めるため、用いるフイルタとしては2
次のIIR(巡回型フイルタ)程度で十分である。
【0041】図2において70は全体として2次のII
Rフイルタを示し、入力される音声信号をデータメモリ
でなる各遅延素子71、72、73及び74を介して各
掛算器75、76、77、78及び79に入力する。各
掛算器は入力される音声信号に当該掛算器にそれぞれ接
続される係数メモリ(図示せず)に記憶された所定の係
数を乗算した後、加算器80に送出して全て加算した後
に外部へ出力する。
【0042】すなわち当該2次のIIRフイルタ70
は、次式で表される伝達関数
【数2】 に基づき、入力される音声信号の周波数特性を利得制御
して出力する。
【0043】上述のIIRフイルタ70をDSPで構成
する場合、掛算器5個、係数メモリ5個及びデータメモ
リ5個で構成できる。一般に用いられるオーデイオ用D
SPは、1処理単位あたり演算回数512 回が可能であ
り、係数メモリ512 個及びデータメモリ512 個を有する
ことから、2次のIIRフイルタは小規模の回路構成で
得られることがわかる。
【0044】また上述のIIRフイルタ70の逆特性を
有するフイルタは、上述のIIRフイルタの伝達関数を
表す式(2)の逆数でなる、次式で表される逆特性の伝
達関数
【数3】 に基づき構成できる。従つて、以上のことから実施例に
用いるプレ・エンフアシス・フイルタ51及びデ・エン
フアシス・フイルタ62は十分実現可能であることがわ
かる。
【0045】以上の構成において、音声信号S50はプ
レ・エンフアシス・フイルタ51により図9に示す聴覚
モデルに基づく等価曲線特性において、感度の高い帯域
になる程、利得を上げ、感度の低い帯域になる程、利得
を下げるようになされている。このように音声信号符号
化装置50は入力される音声信号S50の周波数特性
を、より聴覚モデルに基づく等価曲線特性に見合つた重
み付けを行えるように利得制御する。また圧縮データS
52はデ・エンフアシス・フイルタ62により聴覚モデ
ルにおいて感度の高い帯域になる程、利得を下げ、また
感度の低い帯域になる程、利得を上げるようになされて
いる。このように音声信号復号化装置60は音声信号符
号化装置50で音声信号S50に施された周波数特性の
変化分を補正することができる。
【0046】次に従来の場合の圧縮符号化処理と、実施
例の場合のように利得制御した後に圧縮符号化する処理
との対比を、図3及び図4を用いて以下に説明する。
【0047】従来の圧縮符号化処理を示す図3におい
て、入力された音声信号のスペクトルは高能率を求めら
れる符号化のためにブロツクユニツトBU1及びブロツ
クユニツトBU2に分けられている。このようにブロツ
クユニツト単位で重み付けをすることにより処理が簡略
化される。またここで示される等価曲線は理想的な等価
曲線とする。
【0048】スペクトル単位を基準にするとブロツクユ
ニツトBU1にあるスペクトルAR1はブロツクユニツ
トBU2にあるスペクトルAR2よりレベル的には小さ
いが、等価曲線上においてはスペクトルAR1は等価曲
線より上にありスペクトルAR2は等価曲線より下にあ
る。すなわち聴感上で認識される度合いにおいてはスペ
クトルAR2よりスペクトルAR1の方が大きいことに
なる。
【0049】しかしブロツクユニツト単位を基準にする
と、ブロツクユニツトBU1及びブロツクユニツトBU
2の等価曲線の平均値は、ブロツクユニツトBU2の方
がブロツクユニツトBU1よりも小さい。すなわちブロ
ツクユニツト単位ではブロツクユニツトBU2の方がブ
ロツクユニツトBU1よりも、聴感上で認識される度合
いが大きいことになり、またスペクトルAR2はスペク
トルAR1よりもスペクトルレベルが大きい。
【0050】従つてブロツクユニツト単位での重み付け
処理において、ブロツクユニツトBU2はブロツクユニ
ツトBU1よりも多くのビツト数を割当てられ、聴感上
では認識される度合いの大きいスペクトルAR1を有す
るブロツクユニツトBU1は削除又は割当てビツト数の
削減をされることになる。
【0051】これに対して図3との対応部分に同一符号
を付して示す図4は実施例での圧縮符号化処理を示し、
エンコーダ52の前段にプレ・エンフアシス・フイルタ
51が設けられている場合のものである。プレ・エンフ
アシス・フイルタ51は聴覚モデルに基づく等価曲線特
性(図9)と逆の周波数特性を有することにより、入力
されるスペクトルが等価曲線に近い、又は等価曲線より
上の場合は利得を上げ、逆に等価曲線から離れている場
合は利得を下げるようになされている。
【0052】すなわち聴覚上認識されやすいレベルの場
合は利得を上げ、逆に聴覚上認識されにくい場合は利得
を下げることができ、これによりスペクトルAR1はレ
ベルが大きくなりスペクトルAR2はレベルが小さくな
る。
【0053】従つてブロツクユニツトBU1はブロツク
ユニツトBU2よりもレベルが大きくなり、ブロツクユ
ニツト単位上においても聴感上で認識される度合いが大
きいことになる。そのためスペクトルAR2より認識さ
れやすいスペクトルAR1を有するブロツクユニツトB
U1が、ブロツクユニツトBU2よりも多くのビツト数
を割当てられる。これにより従来に比して理想的な重み
付けができる。
【0054】以上の構成によれば、エンコーダ52の前
段に聴覚モデルに基づく等価曲線特性と逆の周波数特性
を有するプレ・エンフアシス・フイルタ51を設けて音
声信号の利得を制御した後に圧縮符号化をする。またデ
コーダ61の後段にエンコーダ52と、ほぼ逆の周波数
特性を有するデ・エンフアシス・フイルタ62を設け
て、音声信号を復号した後、プレ・エンフアシス・フイ
ルタ51で音声信号に施された周波数特性の変化分を補
正するようにする。これにより従来の構成にフイルタを
追加しただけの簡易な構成で、より聴感上の音質を向上
し得る音声信号符号化装置50及び音声信号復号化装置
60を実現することができる。
【0055】なお上述の実施例においては、入力される
音声信号の利得を制御する第1の制御手段でなるプレ・
エンフアシス・フイルタ51及びプレ・エンフアシス・
フイルタ51とほぼ逆の特性を有し、復号された音声信
号の周波数特性を利得制御して出力する第2の制御手段
でなるデ・エンフアシス・フイルタ62にデジタルフイ
ルタを用いる場合について述べたが、本発明はこれに限
らず、音声信号をアナログ状態のまま処理するならば、
アナログフイルタを用いてもよい。
【0056】また上述の実施例においては2次のIIR
フイルタ(図2)を用いる場合について述べたが、本発
明はこれに限らず、FIRフイルタを用いてもよい。こ
れは一般的なオーデイオ用DSPで構成可能である。例
えば図5に示すような500Tapの対称型FIRフイルタ9
0において、標本化周波数Fsを44100 〔Hz〕とする
と、周波数幅精度ΔNは次式
【数4】 で表される。
【0057】すなわちFIRフイルタ90は、ナイキス
ト周波数(標本化周波数の半分)を250 等分した約88
〔Hz〕の周波数幅で、利得を指定して設計できる周波数
特性上の精度を持ち得る。また次式
【数5】 で表されるFIRフイルタ90の伝達関数に示すよう
に、これをDSPで構成する場合は処理に要する演算が
積和乗算251 回であり、係数メモリ251 個及び単位遅延
素子500 個で構成し得る。このようなFIRフイルタ9
0を用いることにより、細かな周波数特性にも対応し得
る。
【0058】さらに上述の実施例においてはエンコーダ
52の前段にプレ・エンフアシス・フイルタ51を、ま
たデコーダ61の後段にデ・エンフアシス・フイルタ6
2を設ける場合について述べたが、本発明はこれに限ら
ず、図1との対応部分に同一符号を付して示す図6の音
声信号符号化装置100及び音声信号復号化装置101
に示すように、エンコーダ52の前段だけにプレ・エン
フアシス・フイルタ51を設ける構成で用いてもよい。
【0059】例えば人の音声を符号化する場合、圧縮率
を上げていくと音声の明瞭度が悪くなる。これは人の音
声の明瞭度が周波数上の中域近辺に依存しているのに対
して、殆どの高能率での符号化では人の音声が存在しな
い周波数帯域においてもビツト割当てをするためであ
る。
【0060】そのためプレ・エンフアシス・フイルタ5
1で人の音声が存在しない周波数帯域の音声信号をカツ
トすることで、人の音声の明瞭度が依存する周波数上の
中域近辺に割当てるビツト数を増やすことができ、明瞭
度を向上させることができる。このときプレ・エンフア
シス・フイルタ51は人の音声の明瞭度について不要な
周波数帯の除去に用いられているだけなので、デ・エン
フアシス・フイルタ62において音声信号の補正をする
必要が生じず、上述の実施例のようにデコーダの後段に
デ・エンフアシス・フイルタ62を設けなくてもよい。
【0061】
【発明の効果】上述のように本発明によれば、入力され
る音声信号を聴覚モデルに基づく周波数特性と逆の周波
数特性で利得制御した後に符号化する。これにより音声
信号の符号化の際に、聴覚上で認識されやすい周波数帯
域に割り当てるビツト数を増加でき、認識されにくい周
波数帯域に割り当てるビツト数を削減できる。かくして
従来の構成に利得制御手段としてフイルタを設けるだけ
の簡易な構成で、聴覚モデルに基づく周波数特性に、よ
り近似した重み付けができ、聴感上の音質を向上し得る
音声信号符号化方法及び装置、並びに音声信号符号化復
号化装置が実現できる。
【0062】また入力される音声信号のうち、人の音声
が存在しない周波数帯域をカツトするように利得制御す
ることにより、音声信号の符号化の際に人の音声が存在
しない周波数帯域に割り当てるビツト数を削減でき、人
の音声が存在する周波数帯域に割当てるビツト数を増や
すことができる。かくして人の音声を符号化する場合の
明瞭度を向上し得る音声信号符号化方法及び装置、並び
に音声信号符号化復号化装置が実現できる。
【図面の簡単な説明】
【図1】本発明の一実施例による音声信号符号化復号化
装置を示すブロツク図である。
【図2】実施例におけるフイルタの実現性の説明のため
に供するブロツク図である。
【図3】一般のエンコーダにおける重み付けを説明する
ために供する略線図である。
【図4】本発明の一実施例による重み付けを説明するた
めに供する略線図である。
【図5】他の実施例による対称型のFIRフイルタを示
すブロツク図である。
【図6】他の実施例による音声信号符号化復号化装置を
示すブロツク図である。
【図7】従来の音声信号符号化復号化装置を示すブロツ
ク図である。
【図8】直交変換方法によるエンコーダ及びデコーダを
示すブロツク図である。
【図9】聴覚モデルに基づく音の強さの等価曲線を示す
グラフである。
【図10】スペクトルデータS11の分布状態を示す略
線図である。
【図11】量子化及び符号化の処理の概念を示す略線図
である。
【図12】スペクトルデータS14の分布状態を示す略
線図である。
【図13】サブバンド・コーデイング方法によるエンコ
ーダ及びデコーダを示すブロツク図である。
【符号の説明】
1、50、100……音声信号符号化装置、2、60、
110……音声信号復号化装置、3、10、30、52
……エンコーダ、4、20、40、61……デコーダ、
11、33……周波数領域変換器、12、34……重み
付け回路、13……ビツト割当て回路、14、35……
マルチプレクサ、21……分離回路、22……演算回
路、23、41……復号化回路、24……時系列領域変
換器、31A〜31N、43A〜43N……帯域フイル
タ、32A〜32N……量子化回路、42A〜42N…
…再量子化回路、44、73……加算器、51……プレ
・エンフアシス・フイルタ、62……デ・エンフアシス
・フイルタ、70……IIRフイルタ、71、72、7
3、74……単位遅延素子、75、76、77、78、
79……掛算器、90……対称型FIRフイルタ。

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】入力される音声信号の利得を制御した後に
    圧縮符号化することを特徴とする音声信号符号化方法。
  2. 【請求項2】入力される上記音声信号を、聴覚モデルに
    基づく周波数特性と逆の周波数特性に従つて利得制御す
    ることを特徴とする請求項1に記載の音声信号符号化方
    法。
  3. 【請求項3】入力される上記音声信号のうち、聴覚にお
    ける明瞭度の小さい周波数帯域の音声信号を削除するよ
    うに利得制御することを特徴とする請求項1に記載の音
    声信号符号化方法。
  4. 【請求項4】入力される音声信号の利得を制御する利得
    制御手段と、 上記利得制御手段により利得制御された音声信号を圧縮
    符号化するエンコーダとを具えることを特徴とする音声
    信号符号化装置。
  5. 【請求項5】上記利得制御手段は、入力される上記音声
    信号を、聴覚モデルに基づく周波数特性と逆の周波数特
    性に従つて利得制御することを特徴とする請求項4に記
    載の音声信号符号化装置。
  6. 【請求項6】上記利得制御手段は、入力される上記音声
    信号のうち、聴覚における明瞭度の小さい周波数帯域の
    音声信号を削除するように利得制御することを特徴とす
    る請求項4に記載の音声信号符号化装置。
  7. 【請求項7】入力される音声信号の利得を制御する第1
    の利得制御手段と、 上記第1の利得制御手段により利得制御された音声信号
    を圧縮符号化するエンコーダと、 上記圧縮符号化された音声信号を復号するデコーダと、 上記第1の利得制御手段とほぼ逆の周波数特性を有し、
    復号された音声信号の利得を制御して出力する第2の利
    得制御手段とを具えることを特徴とする音声信号符号化
    復号化装置。
  8. 【請求項8】上記第1の利得制御手段は、入力される上
    記音声信号を、聴覚モデルに基づく周波数特性と逆の周
    波数特性に従つて利得制御することを特徴とする請求項
    7に記載の音声信号符号化復号化装置。
  9. 【請求項9】上記第1の利得制御手段は、入力される上
    記音声信号のうち、聴覚における明瞭度の小さい周波数
    帯域の音声信号を削除するように利得制御することを特
    徴とする請求項7に記載の音声信号符号化復号化装置。
JP7160113A 1995-06-01 1995-06-01 音声信号符号化方法及び装置、並びに音声信号符号化復号化装置 Pending JPH08328600A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7160113A JPH08328600A (ja) 1995-06-01 1995-06-01 音声信号符号化方法及び装置、並びに音声信号符号化復号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7160113A JPH08328600A (ja) 1995-06-01 1995-06-01 音声信号符号化方法及び装置、並びに音声信号符号化復号化装置

Publications (1)

Publication Number Publication Date
JPH08328600A true JPH08328600A (ja) 1996-12-13

Family

ID=15708146

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7160113A Pending JPH08328600A (ja) 1995-06-01 1995-06-01 音声信号符号化方法及び装置、並びに音声信号符号化復号化装置

Country Status (1)

Country Link
JP (1) JPH08328600A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003023764A1 (en) * 2001-09-13 2003-03-20 Conexant Systems, Inc. Controlling a weighting filter based on the spectral content of a speech signal

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63191200A (ja) * 1986-07-30 1988-08-08 日本電気株式会社 音声波形符号復号化装置
JPH03116199A (ja) * 1989-09-29 1991-05-17 Nec Corp 音声信号符号化装置
JPH05158495A (ja) * 1991-05-07 1993-06-25 Fujitsu Ltd 音声符号化伝送装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63191200A (ja) * 1986-07-30 1988-08-08 日本電気株式会社 音声波形符号復号化装置
JPH03116199A (ja) * 1989-09-29 1991-05-17 Nec Corp 音声信号符号化装置
JPH05158495A (ja) * 1991-05-07 1993-06-25 Fujitsu Ltd 音声符号化伝送装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003023764A1 (en) * 2001-09-13 2003-03-20 Conexant Systems, Inc. Controlling a weighting filter based on the spectral content of a speech signal

Similar Documents

Publication Publication Date Title
JP4950040B2 (ja) マルチチャンネルオーディオ信号を符号化及び復号する方法及び装置
JP4212591B2 (ja) オーディオ符号化装置
US8447597B2 (en) Audio encoding device, audio decoding device, audio encoding method, and audio decoding method
RU2335809C2 (ru) Аудиокодирование
US7986797B2 (en) Signal processing system, signal processing apparatus and method, recording medium, and program
JP4800645B2 (ja) 音声符号化装置、及び音声符号化方法
JP3765622B2 (ja) オーディオ符号化復号化システム
JPH0525408B2 (ja)
KR100813193B1 (ko) 정보 신호의 양자화 방법 및 장치
JP3636094B2 (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
EP1249837A2 (en) A method for decompressing a compressed audio signal
JP3353868B2 (ja) 音響信号変換符号化方法および復号化方法
JPH0653911A (ja) 音声データ符号化方法及び音声データ符号化装置
JP2000151413A (ja) オーディオ符号化における適応ダイナミック可変ビット割り当て方法
US6678653B1 (en) Apparatus and method for coding audio data at high speed using precision information
JPH08328600A (ja) 音声信号符号化方法及び装置、並びに音声信号符号化復号化装置
JP4645869B2 (ja) ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体
JP3336619B2 (ja) 信号処理装置
JPH0537395A (ja) 帯域分割符号化方法
JP4538705B2 (ja) ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体
JP2001148632A (ja) 符号化装置、符号化方法、及びその記録媒体
JP3010663B2 (ja) ノイズシェーピング回路
JP3146121B2 (ja) 符号化復号化装置
JP2993324B2 (ja) 音声高能率符号化装置
JPH08167851A (ja) 高能率符号化方法及び装置、並びに伝送媒体

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040114

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040312

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040702