JPH0844392A - 音響信号符号化復号方法 - Google Patents

音響信号符号化復号方法

Info

Publication number
JPH0844392A
JPH0844392A JP6176496A JP17649694A JPH0844392A JP H0844392 A JPH0844392 A JP H0844392A JP 6176496 A JP6176496 A JP 6176496A JP 17649694 A JP17649694 A JP 17649694A JP H0844392 A JPH0844392 A JP H0844392A
Authority
JP
Japan
Prior art keywords
coefficient
band
shape
quantization
encoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP6176496A
Other languages
English (en)
Other versions
JP3237089B2 (ja
Inventor
卓 ▲高▼島
Taku Takashima
Yoshiaki Asakawa
吉章 淺川
Hidetoshi Sekine
英敏 関根
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP17649694A priority Critical patent/JP3237089B2/ja
Priority to US08/497,474 priority patent/US5956686A/en
Priority to KR1019950020429A priority patent/KR960006301A/ko
Priority to CN95109605A priority patent/CN1121620A/zh
Publication of JPH0844392A publication Critical patent/JPH0844392A/ja
Application granted granted Critical
Publication of JP3237089B2 publication Critical patent/JP3237089B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【目的】 音響信号符号化に用いる適応的変換符号化復
号方法において、スペクトル包絡の帯域間で異なる冗長
度を有効に活用し、低ビットレートで符号化を行う。 【構成】 適応的変換符号化方法において、スペクトル
包絡を帯域分割し、各帯域のスペクトル包絡に異なる符
号化方法を適用可能とする(ステップ205〜208、
217〜219)。 【効果】 音響信号の適応的変換符号化において、本発
明を用いることにより、スペクトル包絡に対して各周波
数帯域での時間変動に適する符号化・伝送方法に調節す
る事が可能となり、帯域毎に異なる冗長度を有効に利用
してスペクトル包絡符号化に要するビットを削減した高
能率音響信号符号化復号方法が実現可能となる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音響信号の通信および
記録に関し、特に音響信号符号化復号方法に関する。
【0002】
【従来の技術】近年、テレビ会議等を目的とした広帯域
音声を対象とした高品質音声符号化や、マルチメディア
の為の高品質のオーディオ符号化が盛んに行われてい
る。これらの符号化方法においては、スペクトル包絡情
報を補助情報として用いる適応的変換符号化方法が用い
られることが多い。この方法を用いた符号化復号方法と
しては、特開平3-184098号公報記載の”適応変換符号化
の方法及び装置”に述べられた方法、"Transform Codin
g of Audio Signals Using Perceptual Noise Criteria
: James D. Johnston : IEEE Journal on Selected ar
eas in Communications, Vol. 6, No 2"に記された方法
などの公知例がある。発明の説明の準備として、従来に
用いられている適応的変換符号化方法について説明す
る。図2は、適応的変換符号化復号方法の処理の概要を
示した図である。図中、3はデジタル化された入力を一
定サンプル数格納し符号化ブロックを構成する入力バッ
ファの処理である。4は高速フーリエ変換等による周波
数領域への変換処理であり、13は4に対応した時間領域
への変換処理である。5はMaxの量子化器等を用いた変換
係数量子化処理であり、11は5に対応した逆量子化処理
である。6は入力のスペクトル包絡を算出する処理であ
り、周波数領域の変換係数の電力をいくつかの帯域で平
均化してスペクトル包絡を近似する方法、入力を線形予
測分析してスペクトル包絡を推定する方法等が用いられ
る。7はスペクトル包絡を符号化する処理、12は7に対応
したスペクトル包絡復号処理である。8は伝送速度-歪み
理論等に基づいて各帯域の変換係数量子化のビット配分
・量子化幅を適応的に制御する処理である。9は量子化
変換係数とスペクトル包絡符号を多重化し伝送符号を生
成する処理、10は伝送符号を多重分離して量子化変換係
数とスペクトル包絡符号を復元する処理である。14はブ
ロック単位の出力信号を格納し、順次出力する出力バッ
ファである。図2にそって符号化復号処理を説明する。
符号化1では、入力音響信号からバッファ3により符号化
ブロックが構成され、周波数領域への変換4にて変換係
数に変換され、変換係数量子化5で量子化される。この
変換係数量子化5では、入力信号からスペクトル包絡算
出6により得られるスペクトル包絡に基づいて8により適
応的に制御されるビット配分・量子化幅で各帯域の係数
を量子化する。これは、各帯域の量子化歪みを聴覚的に
制御するためである。一方、スペクトル包絡は別途7で
符号化される。そして多重化9により量子化変換係数と
スペクトル包絡符号から伝送符号が生成される。復号2
では、まず、多重分離10により、量子化変換係数とスペ
クトル包絡符号が分離される。そして、スペクトル包絡
復号12によりスペクトル包絡が復号され、これに基づい
て、ビット配分・量子化幅算出8でビット配分・量子化
幅が算出され、これを適用して変換係数逆量子化11で変
換係数が復号される。この係数を時間領域への逆変換13
で時間信号に変換し、出力バッファ14に格納して順次出
力し、音響信号を復号する。
【0003】
【発明が解決しようとする課題】従来の技術で説明した
適応的変換符号化方法では、スペクトル包絡を全帯域同
じ符号化方法で符号化し、かつ、全帯域ブロック毎に更
新している。一方、音響信号のスペクトル包絡の時間変
動は、帯域によって差異が存在し、一般に低域では時間
変動が小さくなる傾向にある。このような時間変動の小
さい帯域は、隣接ブロック間での相関が高く大きな冗長
度を有するが、スペクトル包絡を全帯域同じ符号化方法
で符号化し、かつ、全帯域ブロック毎に更新する従来の
適応的変換符号化方法では、この冗長度は有効に活用さ
れておらず、符号化の効率が悪い。特に、スペクトル包
絡を線形予測分析によって推定する場合、従来の手法で
は入力信号を全帯域一括で分析して線形予測係数を算出
・符号化して伝送するため、帯域毎の時間変動の差異の
考慮は不可能であった。以上の様に、従来の技術におい
ては、スペクトル包絡の時間変動の帯域間の差異によっ
て生じる冗長度が考慮されていないため、高品質を保っ
た低ビットレート符号化のための適応的変換符号化復号
方法としては不十分であった。本発明の目的は、このよ
うな問題点を改善し、帯域毎に異なる冗長度を有効に利
用することができ、かつ音響信号の性質によらず、スペ
クトル包絡の冗長成分を有効に活用可能な音響信号符号
化復号方法を提供することにある。
【0004】
【課題を解決するための手段】本発明では課題解決のた
めに、概形状(スペクトル包絡)を帯域分割し、各帯域
毎のスペクトル包絡の時間変動に適した符号化を行う方
法を用いることに特徴がある。この方法の処理の流れ図
を図1に示す。図中、i は低域から順に付けた帯域のイ
ンデックス、Nはスペクトル包絡の分割帯域数である。
また、図中、203は特に限定はしないが高速フーリエ変
換等の周波数領域への変換処理、222は203に対応した時
間領域への変換処理、209および220は特に限定はしない
が伝送速度-歪み理論等に基づいたビット配分・量子化
幅計算処理、210は特に限定はしないがMaxの量子化器等
の量子化処理、221は210に対応した逆量子化処理であ
る。図2にそって本発明の課題解決のための手段を説明
する。符号化では、まず、入力201で入力された標本化
音響信号をバッファ更新202でMサンプル格納して符号化
ブロックを構成する。このMは特に限定される値ではな
い。この符号化ブロックに対し、周波数領域への変換20
3を行い変換係数を算出する。そして、帯域 i 分割スペ
クトル包絡算出205で帯域 i のスペクトル包絡を算出
し、帯域 i 分割スペクトル包絡符号化206でその符号化
を実行する。ここで、帯域 i 分割スペクトル包絡算出2
05は、隣接帯域の変換係数の電力平均値をスペクトル包
絡とする場合にはスペクトル包絡を帯域毎に分割する処
理となり、線形予測分析等によるスペクトル包絡推定を
行なう場合には、入力信号を帯域分割して線形予測分析
等を行ない分割帯域毎にスペクトル包絡を算出する処理
となる。また、帯域 i 分割スペクトル包絡符号化206
は、帯域 i のスペクトル包絡の時間変動に適する方式
に設定された符号化処理である。この処理は各帯域で異
なる方法をとる事を可能とし、時間変動の小さい帯域で
バックワード適応やブロック間予測符号化手法、または
更新周期を長くする処理等を行う。以上の205〜207の処
理をN帯域について行い、全帯域のスペクトル包絡を近
似する。これを基にビット配分・量子化幅算出209で、
変換係数量子化210に適用される各帯域のビット配分・
量子化幅を求め、先に203で求めた変換係数を210で量子
化する。そして多重化211で、変換係数符号、スペクト
ル包絡符号、その他の符号を多重化して伝送符号を出力
する。復号側では、まず多重分離215で、変換係数符
号、スペクトル包絡符号、その他の符号を分離する。そ
して各帯域 i に対して、帯域 i 分割スペクトル包絡復
号217を実行し、帯域 i のスペクトル包絡を復号する。
これをN帯域について行い、全帯域のスペクトル包絡を
構成し、ビット配分・量子化幅算出220にて各帯域の変
換係数のビット配分・量子化幅を求め、変換係数逆量子
化221で変換係数を復号する。これを時間領域への逆変
換222で時間信号に変換し、バッファ更新223で出力バッ
ファを更新して順次出力することにより音響信号を復号
する。
【0005】
【作用】本発明においては、適応的変換符号化方法に、
前記手段の項に記載した、スペクトル包絡を帯域分割し
て各帯域毎に異なる符号化方法を適用する事により、音
響信号のスペクトル包絡の時間変動の帯域毎の差異を考
慮した符号化を行うことが可能となる。特に、時間変動
の小さい帯域の冗長度を有効に利用することを可能と
し、適応的変換符号化方法における符号化歪みを抑制し
た低ビットレートのスペクトル包絡符号化が実現され
る。
【0006】
【実施例】本発明の第一の実施例を図3、図4に示す。
図3が本実施例の符号化側、図4が復号側の構成図であ
る。本実施例は、音声帯域を高周波帯域と低周波帯域に
分割し(以下高周波帯域を高域、低周波帯域を低域と称
す)、それぞれに異なる音声符号化復号方法を用いた例
を示している。図3にそって、符号化処理の説明を行
う。符号化では、まず、標本化された入力がバッファ30
3に入力される。本実施例では、入力は50〜7000Hzに帯
域制限された音響信号であり、標本化周波数は16kHzで
ある。バッファは、直前の8サンプルに続けて、120サン
プルを格納し、符号化ブロックを構成する。すなわち、
符号化ブロックは8サンプルの重複成分を持つ。この入
力に数1で表される分析窓を乗ずる。
【数1】 数1中の t は符号化ブロック内のサンプルの位置のイ
ンデックス、Lは符号化ブロックのサンプル数を表す。
本実施例では、数1中のLは128,Mは8である。窓掛けさ
れた符号化ブロックは、DCT 305により256点離散コサイ
ン変換が施され、DCT係数に変換される。この係数は1〜
5bitのMaxの量子化器で構成される量子化306で量子化さ
れる。この量子化306では、各帯域のDCT係数のビット配
分・量子化幅はビット配分・量子化幅算出323で制御さ
れる。本実施例では、スペクトル包絡から数2でビット
配分を、数3で量子化幅を算出する。
【数2】
【数3】 なお、数2および数3中の j は低域側から順に付けら
れた変換係数の周波数帯域のインデックス、σjは帯域
j でのスペクトル包絡、R*は1サンプル当たりの平均ビ
ット数を表している。本実施例では、R*は1.93としてい
る。また、本実施例では、スペクトル包絡の高域(4kHz
〜7kHz)を301で、低域(50〜4kHz)を302で求め、高域
には7bitベクトル量子化、低域には後ろ向き適応手法を
適用する。高域スペクトル算出・符号化301では、まず
入力から公知の24tapのQMF(quadrature mirror filter)
で構成されるQMF 308により高域信号(4k〜7kHz)を算
出し、分析バッファ更新309で高域スペクトル包絡分析
用のバッファを更新する。高域スペクトル分析用バッフ
ァは、100サンプルで構成される。この分析バッファに
対し、LPC分析310で8次の線形予測分析を行い線形予測
係数(LPC )を計算する。これをLPC→LSP変換311で線
スペクトル対(LSP)に変換し、VQ 312にて7bitのベク
トル量子化を行う。また符号はVQ-1 313で逆量子化さ
れ、LSP→LPC変換314により量子化LPC係数に変換され
て、スペクトル包絡315で高域スペクトル包絡に変換さ
れる。一方、低域スペクトル算出302では、入力のスペ
クトル包絡を過去の符号化復号信号からの算出値で近似
する後ろ向き適応手法を用いる。そのため、変換係数符
号から逆量子化307により変換係数をもとめ、それをIDC
T 316で逆コサイン変換し、1ブロック遅延317で1ブロ
ックの時間、復号信号を保持する。これをQMF318で帯域
分割して低域信号を求め、分析バッファ更新319で100サ
ンプルで構成される低域スペクトル分析バッファを更新
する。この分析バッファに対しLPC分析320で12次のLPC
分析を行い、スペクトル包絡321により低域スペクトル
包絡を算出する。301と302で求められた低域、高域スペ
クトル包絡は、全帯域スペクトル合成322で合成され、
前述のビット配分・量子化幅算出323の処理に適用され
る。そして、多重化324で変換係数符号と高域LSP符号か
ら伝送符号を構成する。
【0007】次に、復号処理の説明を行う。復号処理で
は、まず、多重分離403により伝送符号を変換係数符号
と7bitの高域LSP符号に分離する。高域スペクトル包絡
は図中の401で復号される。高域LSP符号はVQ-1 410で逆
量子化され、LSP→LPC変換411により量子化LPC係数に変
換され、スペクトル包絡315により、高域スペクトル包
絡に復号される。一方、低域スペクトルは、図中の402
において、後ろ向き適応手法により算出される。後ろ向
き適応は復号側でも符号化側と同様の処理であり、1ブ
ロック遅延413により保持された復号信号をQMF 414によ
って帯域分割し、その低域信号により分析バッファ更新
415で低域スペクトル分析用バッファを更新し、LPC分析
416で12次のLPC分析を行い、スペクトル包絡417により
低域スペクトル包絡を得る。そして、符号化側と同様
に、全帯域スペクトル合成404を行い、符号化側323と同
じ処理であるビット配分・量子化幅算出405で変換係数
の量子化の条件を得る。これを基に、変換係数の逆量子
化406、IDCT 407を行い、数4の合成窓を乗じ、重複す
る16サンプルを加算して出力信号とし、バッファ409に
格納し順次出力し、復号出力を得る。
【数4】 本実施例では、低域スペクトル包絡のブロック間の高い
相関を利用して、低域スペクトル包絡に後ろ向き適応を
用い、高域スペクトル包絡のみを符号化・伝送するた
め、スペクトル包絡の符号化に要するビットは7bit/blo
ckであるにも関わらず、良好な音質を達成している。本
実施例により、伝送ビットレートが同じ場合、全帯域一
括でLSPを量子化・伝送する場合よりも良好な音質が達
成された。また、本実施例による音響信号符号化復号方
法を広帯域電話システムに組み込むことにより、伝送ビ
ットレート32kbit/sで良好な音質が得られる。
【0008】次に、本発明の第二の実施例の流れ図を図
5、図6に示す。図5が本実施例の符号化の流れ図、図
6が復号の流れ図である。なお、図中 i は低域側から
順に付けたスペクトル包絡符号化分割帯域のインデック
ス、Nはスペクトル包絡符号化分割帯域数である。本実
施例も、帯域分割数は低域、高域の2つである。なお、
本実施例は流れ図で示しているが、ブロック図も流れ図
より容易に構成可能である。まず、図5にそって、符号
化処理の説明を行う。符号化では、まず、入力501で入
力される標本化音響信号から、バッファ更新502で符号
化ブロックを構成する。本実施例での標本化周波数は16
kHzである。また、本実施例では、符号化ブロックは256
サンプルで構成され、うち16サンプルが重複成分であ
る。これに、分析窓503で数1でLを256、Mを16とした分
析窓を乗じ、DCT 504で256点の離散コサイン変換を行
う。一方、スペクトル包絡算出・符号化のため、符号化
ブロックをN帯域分割フィルタ505 によってN帯域の信号
に分割する。本実施例では、N=2とし、分割フィルタに
は公知の24tapのQMFを用いた。そして、帯域 i の信号
について、LPC分析507でm(i)次のLPC係数を算出し、LPC
→LSP 508でLSP係数に変換し、LSP差分計算509で直前の
ブロックの量子化LSP係数との差分を数5に従い算出す
る。ただし、数5において、pはLSP係数の次数、nは現
在符号化中のブロック、n-1が直前のブロックを指すイ
ンデックス、Δlspは差分値である。
【数5】 この差分値の絶対値の平均がth(i)より小さければ、差
分ベクトル量子化511で差分値をkd(i)ビットでベクトル
量子化し、th(i)以上であればLSPベクトル量子化512でL
SP係数をk(i)ビットでベクトル量子化する。この結果得
られた量子化LSP係数を、LSP→スペクトル包絡514でス
ペクトル包絡に変換する。以上の507〜514の処理をN帯
域について行い、全帯域のスペクトル包絡を近似する。
これを基にビット配分・量子化幅算出516で、DCT係数量
子化517に適用される各帯域のビット配分・量子化幅を
求め、先に求めたDCT係数を量子化する。本実施例で
は、ビット配分・量子化幅算出516には数2、数3でLを
256,R*を1.47とした計算式を適用し、DCT係数量子化に
は公知のMaxの量子化器(1〜5bit)を用いている。そし
て多重化518で、DCT係数符号、LSP係数符号、帯域 i の
LSP符号化の差分値/非差分値切替フラグ(0/1)を多
重化し合計で360bit/blockのビットレートの伝送符号と
して出力する。
【0009】復号側では、まず多重分離602で、DCT係数
符号、LSP係数符号、帯域 i のLSP符号化の差分値/非
差分値切替フラグを分離する。そして帯域 i 毎に、切
替フラグに従い差分ベクトル逆量子化605もしくはLSPベ
クトル逆量子化606によってLSP係数を復号し、LSP→ス
ペクトル包絡607で帯域 i のスペクトル包絡を復号す
る。これをN帯域について実行して全帯域のスペクトル
包絡を復号し、ビット配分・量子化幅算出610にて各帯
域のDCT係数のビット配分・量子化幅を求め、DCT係数逆
量子化517でDCT係数を復号する。これをIDCT 612で256
点逆コサイン変換を行い、合成窓613で数4の窓を乗
じ、重複成分を加算して出力信号を復号する。本実施例
では、m(i),th(i),kd(i),k(i)は表1に示す値とし
た。
【表1】 本実施例によれば、高域・低域のいずれのスペクトル包
絡の変動が大きい場合でも追従可能で、かつ、時間変動
のすくない場合は冗長なビットを削減することが可能と
なる。適応的変換符号化では、スペクトル包絡符号化の
ビット以外のビットがDCT係数量子化に使用されるた
め、冗長ビットが削減されたブロックでは音質が改善さ
れる。この効果により、本実施例の方法では、同じ伝送
ビットレートの従来手法に比べ、入力スペクトルの変動
が少ない区間での音質改善が達成される。また、本実施
例の方法を24kbit/sの音声伝送装置に適用することによ
り、同じビットレートの従来の装置より良好な音質が得
られる。
【0010】本発明の第三の実施例の流れ図を図7、図
8に示す。図7が本実施例の符号化のフローチャート、
図8が復号のフローチャートである。なお、図中 n は
符号化開始時の符号化ブロックを0として順に付けた符
号化ブロックのインデックス、 i は、低域側から順に
付けたスペクトル包絡符号化分割帯域のインデックスで
ある。本実施例も帯域分割数は低域、高域の2つであ
る。なお、本実施例は流れ図で示しているが、ブロック
図も流れ図より容易に構成可能である。まず、図7にそ
って、符号化処理の説明を行う。符号化では、まず、入
力701で入力される標本化音響信号から、バッファ更
新502で符号化ブロックを構成する。本実施例での標
本化周波数は32kHzである。また、本実施例では、符号
化ブロックは256サンプルで構成され、16サンプルが重
複成分である。これに、分析窓503で数1でLを256,Mを
16とした分析窓を乗じ、DCT 504で256点の離散コサイン
変換を行う。そして、スペクトル包絡算出・符号化のた
め、DCT係数をN帯域に分割する。本実施例ではこの分割
は表2の帯域 i の構成の欄に示す通りとした。表2で
は帯域 i に属するDCT係数の周波数帯域のインデックス
の範囲を示してある。
【表2】 そして、帯域 i の信号について、帯域 i 更新タイミン
グ判定706で、ブロックnが帯域 i の更新タイミングで
あるかを判断し、スペクトル算出・符号化処理と、スペ
クトル符号化無しの切り替えを行う。この切替は、スペ
クトル包絡の時間変動に応じて適応的に実行することも
可能だが、本実施例では固定とし、表2の更新タイミン
グに示す条件で切替を行う事とした。そして、スペクト
ル算出・符号化時には、帯域 i スペクトル算出707で低
域からm(i)個のDCT係数の平均を順次算出し、スペクト
ルベクトル量子化708でk(i)ビットのベクトル量子化を
行う。一方、スペクトル更新無しの場合には、スペクト
ル予測値計算709で過去のスペクトルから算出される予
測値を算出しブロックnのスペクトル包絡とする。この
予測値計算は、数6で表される方法で行う。なお、数6
中のajrは予測係数、Qは予測次数をあらわす。本実施例
では、予測次数Qは2とし、予測係数ajrは多数のデータ
を基にLBGアルゴリズム等で学習させた値を用いた。
【数6】 そして、スペクトル補間710で、このスペクトル量子化
値もしくは予測値を対数領域で線形補間して、帯域 i
のスペクトル包絡とする。上記706から711までの処理を
N帯域について行い、全帯域のスペクトル包絡を近似す
る。これを基にビット配分・量子化幅算出713で、DCT係
数量子化714に適用される各帯域のビット配分・量子化
幅を求め、先に704で求めたDCT係数を量子化する。本実
施例では、ビット配分・量子化幅算出713には数2でR*
を1.25とした計算式と数3の計算式を適用し、DCT係数
量子化714には公知のMaxの量子化器(1〜5bit)を用い
ている。そして多重化715で、DCT係数符号、スペクトル
符号を多重化して伝送符号を出力する。
【0011】復号側では、まず多重分離802で、DCT係数
符号、スペクトル符号を分離する。そして帯域 i 毎
に、帯域 i 切替タイミング判定804に従いスペクトルベ
クトル逆量子化805もしくはスペクトル予測値計算806を
実行し、スペクトル補間807で対数領域での線形補間を
行い、帯域 i のスペクトル包絡を復号する。上記804〜
808の処理をN帯域について実行して全帯域のスペクトル
包絡を構成し、ビット配分・量子化幅算出810にて各帯
域のDCT係数のビット配分・量子化幅を求め、DCT係数逆
量子化811でDCT係数を復号する。これをIDCT 812で256
ポイント逆コサイン変換を行い、合成窓813で数4の窓
を乗じ、重複成分を加算して出力信号を復号する。本実
施例によれば、スペクトル包絡の変動が小さい帯域では
スペクトル包絡を予測手法により求めるのみで伝送を行
わないブロックを含むため、音質を保ちつつ平均伝送ビ
ットレートを低減することが可能である。また、本実施
例の方法を48kbit/sの音響信号記録装置に適用すること
により、伝送ビットレート64kbit/sの従来の装置とほぼ
同等の音質が得られる。なお、ここで述べた第1、第2
および第3の実施例は全てスペクトル包絡の帯域を低域
と高域に2分割し、それぞれに異なる符号化復号方法を
適用する方法を示したが、分割数は特に2に限定される
ものではなく3以上の分割を行ってそれぞれに異なる符
号化復号方法を適用してもよいし、分割した帯域のうち
いくつかは共通の符号化復号方法を用いてもよい。
【0012】
【発明の効果】本発明によれば、適応的変換符号化方法
で使用するスペクトル包絡を各周波数帯域での時間変動
に適する符号化・伝送方法に調節する事が可能となり、
帯域毎に異なる冗長度を有効に利用した音響信号符号化
復号方法が実現可能となる。また、本発明では、各周波
数帯域のスペクトル包絡符号化復号方法を時間変動に応
じて適応的に変更することも可能であるため、音響信号
の性質によらず、スペクトル包絡の冗長成分を有効に活
用した適応的変換符号化方法が実現可能となる。
【図面の簡単な説明】
【図1】本発明の音響信号符号化復号方法の処理の流れ
図である。
【図2】音響信号適応的変換符号化復号方法の原理を示
す構成図である。
【図3】本発明の第一の実施例の符号化処理の構成図で
ある。
【図4】本発明の第一の実施例の復号処理の構成図であ
る。
【図5】本発明の第二の実施例の符号化方法の流れ図で
ある。
【図6】本発明の第二の実施例の復号方法の流れ図であ
る。
【図7】本発明の第三の実施例の符号化方法の流れ図で
ある。
【図8】本発明の第三の実施例の復号方法の流れ図であ
る。
【符号の説明】
1…符号化,2…復号,3…入力バッファ,4…周波数領域
への変換,5…変換係数量子化,6…スペクトル包絡算
出,7…スペクトル包絡符号化,8…ビット配分・量子化
幅算出,9…多重化,10…多重分離,11…変換係数逆量
子化,12…スペクトル包絡復号,13…時間領域への逆変
換,14…出力バッファ,201…入力,202…入力バッファ
更新,203…周波数領域への変換,204…帯域インデック
ス初期化,205…帯域i分割スペクトル包絡算出,206…
帯域i分割スペクトル符号化,207…帯域インデックス加
算,208…帯域処理終了判定,209…ビット配分・量子化
幅算出,210…変換係数量子化,211…多重化,212…伝
送符号出力,214…伝送符号入力,215…多重分離,216
…帯域インデックス初期化,217…帯域i分割スペクトル
復号,218…帯域インデックス加算,219…帯域処理終了
判定,220…ビット配分量子化幅算出,221…変換係数逆
量子化,222…時間領域への逆変換,223…出力バッファ
更新,224…出力,301…高域スペクトル符号化,302…
低域スペクトル後ろ向き適応,303…入力バッファ,304
…分析窓,305…128点DCT,306…変換係数量子化,307,
406…変換係数逆量子化,308…24tapQMF,309…高域ス
ペクトル分析用バッファ更新,310…8次LPC分析,311…
LPC→LSP変換,312…7bitベクトル量子化,313,410…7b
itベクトル逆量子化,314,411…LSP→LPC変換,315,412
…LPC→スペクトル包絡変換,316,407…128点IDCT,31
7,413…1ブロック遅延,318,414…24tapQMF,319,415
…低域用分析バッファ更新,320,416…12次LPC分析,32
1,417…LPC→スペクトル包絡変換,322,404…全帯域ス
ペクトル包絡合成,323,405…ビット配分・量子化幅算
出,324…多重化,403…多重分離,408…合成窓,409…
出力バッファ,501…入力,502…入力バッファ更新,50
3…分析窓,504…256点DCT,505…N帯域分フィルタ,50
6,603…帯域インデックスi初期化,507…帯域 i LPC分
析,508…帯域 i LPC→LSP変換,509…帯域 i LSP差分
計算,510…帯域 i 差分値判定,511…帯域 i LSP差分
ベクトル量子化,512…帯域 i LSPベクトル量子化,51
3,607…帯域 i LSP→スペクトル包絡変換,514,608…帯
域インデックスi加算,515,609…帯域分割処理終了判
定,516,610…ビット配分・量子化幅算出,517…DCT係
数量子化,518…多重化,519…伝送符号出力,601…伝
送符号入力,602…多重分離,604…帯域 i 切替フラグ
による処理切替,605…帯域 i LSP差分ベクトル逆量子
化,606…帯域 i LSPベクトル逆量子化,611…DCT係数
逆量子化,612…256点IDCT,613…合成窓,614…バッフ
ァ更新,615…音響信号出力,701…n番目のブロックの
入力,702…入力バッファ更新,703…分析窓,704…256
点DCT,705,803…帯域インデックス i 初期化,706,804
…帯域 i 更新タイミング判定,707…帯域 i スペクト
ル包絡算出,708…帯域 i スペクトルベクトル量子化,
709,806…帯域 i スペクトルベクトル予測値計算,710,
807…帯域 i スペクトル包絡補間,711,808…帯域イン
デックス加算,712,809…帯域分割処理終了判定,713,8
10…ビット配分・量子化幅算出,714…DCT係数量子化,
715…多重化,716…伝送符号出力,801…伝送路符号入
力,802…多重分離,805…帯域 i スペクトルベクトル
逆量子化,811…DCT係数逆量子化,812…256点IDCT,81
3…合成窓,814…出力バッファ更新,815…音響信号出

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 音響信号を所定数の標本値によって構成
    されるブロック単位で周波数領域の係数に変換し、前記
    音響信号の周波数成分の概形状に基づき前記係数の量子
    化のビット配分および量子化幅を制御して符号化し復号
    する方法において、前記周波数成分の概形状を複数帯域
    に分割し、該周波数成分の概形状の時間変動に応じて、
    前記帯域毎に異なる手法を用い周波数成分を符号化する
    ことを特徴とする音響信号符号化復号方法。
  2. 【請求項2】 前記複数帯域に分割された周波数成分の
    概形状の符号化手法を、前記帯域毎の周波数成分概形状
    の時間変動に応じて変更することを特徴とする請求項1
    記載の音響信号符号化復号方法。
  3. 【請求項3】 前記複数帯域に分割された周波数成分の
    概形状の更新周期を、帯域毎の周波数成分の概形状の変
    動に応じて変更することを特徴とする請求項1および2
    記載の音響信号符号化復号方法。
  4. 【請求項4】 前記音響信号を帯域分割した信号を線形
    予測分析することにより、前記複数帯域に分割された周
    波数成分の概形状を推定することを特徴とする請求項1
    記載の音響信号符号化復号方法。
  5. 【請求項5】 音響信号を符号化する際、所定数の標本
    値によって構成されるブロック単位で周波数領域の係数
    に変換し、前記音響信号の周波数成分の概形状に基づき
    前記係数の量子化のビット配分および量子化幅を制御し
    て各帯域の係数を量子化するとともに前記概形状を符号
    化し、当該量子化変換係数と概形状符号から多重化によ
    り伝送符号を生成し、復号の際には、該伝送符号から量
    子化変換係数と概形状符号を多重分離し、当該概形状を
    復号し、該概形状に基づいてビット配分・量子化幅を算
    出し、該ビット配分・量子化幅を適用して変換係数を復
    号し、該係数を時間信号に変換・格納して順次出力する
    音響信号の符号化復号方法において、前記概形状を複数
    帯域に分割する処理と、各該帯域における概形状の時間
    変動に応じ、各帯域毎に異なる手法を適用して符号化/
    復号する処理と、全帯域の概形状を近似し、各帯域のビ
    ット配分・量子化幅を算出する処理とを備えたことを特
    徴とする音響信号符号化復号方法。
  6. 【請求項6】 音響信号を符号化する際、所定数の標本
    値によって構成されるブロック単位で周波数領域の係数
    に変換し、前記音響信号の周波数成分の概形状に基づき
    前記係数の量子化のビット配分および量子化幅を制御し
    て各帯域の係数を量子化するとともに前記概形状を符号
    化し、当該量子化変換係数と概形状符号から多重化によ
    り伝送符号を生成し、復号の際には、該伝送符号から量
    子化変換係数と概形状符号を多重分離し、当該概形状を
    復号し、該概形状に基づいてビット配分・量子化幅を算
    出し、該ビット配分・量子化幅を適用して変換係数を復
    号し、該係数を時間信号に変換・格納して順次出力する
    音響信号の符号化復号方法において、入力音響信号から
    構成された標本化符号化ブロックを複数帯域の信号に分
    割する処理と、該帯域毎の信号に対し、線形予測分析を
    行って線形予測係数を算出し、線スペクトル対に変換す
    る処理と、該線スペクトル対と直前のブロックの量子化
    係数との差分を算出する処理と、該差分の絶対値の平均
    が所定の値より小さければ差分値をベクトル量子化し、
    大きければ線スペクトル対係数をベクトル量子化し、得
    られた量子化係数を概形状に変換する処理と、全帯域の
    概形状を近似し、各帯域のビット配分・量子化幅を算出
    する処理とを備えたことを特徴とする音響信号符号化復
    号方法。
  7. 【請求項7】 音響信号を符号化する際、所定数の標本
    値によって構成されるブロック単位で周波数領域の係数
    に変換し、前記音響信号の周波数成分の概形状に基づき
    前記係数の量子化のビット配分および量子化幅を制御し
    て各帯域の係数を量子化するとともに前記概形状を符号
    化し、当該量子化変換係数と概形状符号から多重化によ
    り伝送符号を生成し、復号の際には、該伝送符号から量
    子化変換係数と概形状符号を多重分離し、当該概形状を
    復号し、該概形状に基づいてビット配分・量子化幅を算
    出し、該ビット配分・量子化幅を適用して変換係数を復
    号し、該係数を時間信号に変換・格納して順次出力する
    音響信号の符号化復号方法において、入力音響信号から
    構成された標本化符号化ブロックを複数帯域に分割する
    処理と、帯域毎の信号について、当該ブロックの帯域が
    更新タイミングにあるかを判断する処理と、更新タイミ
    ングと判断した場合は当該帯域の概形状算出およびベク
    トル量子化を行い、更新無しと判断した場合には過去の
    概形状から算出される予測値を算出して当該概形状とす
    る処理と、得られた量子化値もしくは予測値を線形補間
    する処理と、補間後の全帯域の概形状を近似し、各帯域
    のビット配分・量子化幅を算出する処理とを備えたこと
    を特徴とする音響信号符号化復号方法。
  8. 【請求項8】 音響信号を符号化する際、所定数の標本
    値によって構成されるブロック単位で周波数領域の係数
    に変換し、前記音響信号の周波数成分の概形状に基づき
    前記係数の量子化のビット配分および量子化幅を制御し
    て各帯域の係数を量子化するとともに前記概形状を符号
    化し、当該量子化変換係数と概形状符号から多重化によ
    り伝送符号を生成し、復号の際には、該伝送符号から量
    子化変換係数と概形状符号を多重分離し、当該概形状を
    復号し、該概形状に基づいてビット配分・量子化幅を算
    出し、該ビット配分・量子化幅を適用して変換係数を復
    号し、該係数を時間信号に変換・格納して順次出力する
    音響信号の符号化復号方法において、入力された標本化
    音響信号から概形状の高域信号を算出・蓄積し、該信号
    に対して線形予測分析を行い線形予測係数を計算し、該
    係数を線スペクトル対に変換してベクトル量子化を行う
    処理と、該ベクトル量子化にて得られた符号を逆量子化
    し、前記線スペクトル対から線形予測係数に逆変換した
    後、高域概形状に変換する処理を含む高域処理と、前記
    係数の量子化にて得られた変換係数符号を逆量子化し復
    号して、1ブロック遅延させて保持し、復号信号を帯域
    分割して概形状の低域信号を求め、該信号に対し線形予
    測分析を行って低域概形状を算出する低域処理と、前記
    処理で求められた低域/高域概形状を合成して、前記係
    数の量子化のビット配分および量子化幅を算出する処理
    とを備えたことを特徴とする音響信号符号化復号方法。
JP17649694A 1994-07-28 1994-07-28 音響信号符号化復号方法 Expired - Fee Related JP3237089B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP17649694A JP3237089B2 (ja) 1994-07-28 1994-07-28 音響信号符号化復号方法
US08/497,474 US5956686A (en) 1994-07-28 1995-06-30 Audio signal coding/decoding method
KR1019950020429A KR960006301A (ko) 1994-07-28 1995-07-12 음향 신호 부호화/복호화 방법
CN95109605A CN1121620A (zh) 1994-07-28 1995-07-27 音频信号编码/译码方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP17649694A JP3237089B2 (ja) 1994-07-28 1994-07-28 音響信号符号化復号方法

Publications (2)

Publication Number Publication Date
JPH0844392A true JPH0844392A (ja) 1996-02-16
JP3237089B2 JP3237089B2 (ja) 2001-12-10

Family

ID=16014680

Family Applications (1)

Application Number Title Priority Date Filing Date
JP17649694A Expired - Fee Related JP3237089B2 (ja) 1994-07-28 1994-07-28 音響信号符号化復号方法

Country Status (4)

Country Link
US (1) US5956686A (ja)
JP (1) JP3237089B2 (ja)
KR (1) KR960006301A (ja)
CN (1) CN1121620A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2005112005A1 (ja) * 2004-04-27 2008-03-27 松下電器産業株式会社 スケーラブル符号化装置、スケーラブル復号化装置、およびこれらの方法

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4276781B2 (ja) * 1998-03-19 2009-06-10 シーメンス アクチエンゲゼルシヤフト 音声信号処理方法および音声信号処理装置
JP3871840B2 (ja) * 1999-12-24 2007-01-24 日本電気株式会社 圧縮動画像再符号化装置
DE10008699C1 (de) * 2000-02-24 2001-05-23 Daimler Chrysler Ag Verfahren und Vorrichtung zur Analog-Digital-Wandlung eines Signals
DE10028593C1 (de) * 2000-06-14 2001-10-18 Daimler Chrysler Ag Verfahren und Vorrichtung zur Digital-Analog-Wandlung eines Signals
EP1199812A1 (en) 2000-10-20 2002-04-24 Telefonaktiebolaget Lm Ericsson Perceptually improved encoding of acoustic signals
SE522553C2 (sv) 2001-04-23 2004-02-17 Ericsson Telefon Ab L M Bandbreddsutsträckning av akustiska signaler
JP3415126B2 (ja) * 2001-09-04 2003-06-09 三菱電機株式会社 可変長符号多重化装置、可変長符号分離装置、可変長符号多重化方法及び可変長符号分離方法
US7062429B2 (en) * 2001-09-07 2006-06-13 Agere Systems Inc. Distortion-based method and apparatus for buffer control in a communication system
KR100524065B1 (ko) * 2002-12-23 2005-10-26 삼성전자주식회사 시간-주파수 상관성을 이용한 개선된 오디오 부호화및/또는 복호화 방법과 그 장치
US7724827B2 (en) * 2003-09-07 2010-05-25 Microsoft Corporation Multi-layer run level encoding and decoding
CN1909066B (zh) * 2005-08-03 2011-02-09 昆山杰得微电子有限公司 音频编码码量控制和调整的方法
US8599925B2 (en) * 2005-08-12 2013-12-03 Microsoft Corporation Efficient coding and decoding of transform blocks
KR101261524B1 (ko) * 2007-03-14 2013-05-06 삼성전자주식회사 노이즈를 포함하는 오디오 신호를 저비트율로부호화/복호화하는 방법 및 이를 위한 장치
US7774205B2 (en) * 2007-06-15 2010-08-10 Microsoft Corporation Coding of sparse digital media spectral data
KR101403340B1 (ko) * 2007-08-02 2014-06-09 삼성전자주식회사 변환 부호화 방법 및 장치
EP2242391A2 (de) * 2008-01-26 2010-10-27 IND Co Establishment Schuhwerk
CN101770775B (zh) 2008-12-31 2011-06-22 华为技术有限公司 信号处理方法及装置
WO2014198726A1 (en) * 2013-06-10 2014-12-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for audio signal envelope encoding, processing and decoding by modelling a cumulative sum representation employing distribution quantization and coding
US9928850B2 (en) * 2014-01-24 2018-03-27 Nippon Telegraph And Telephone Corporation Linear predictive analysis apparatus, method, program and recording medium
EP3115991A4 (en) 2014-03-03 2017-08-02 Samsung Electronics Co., Ltd. Method and apparatus for high frequency decoding for bandwidth extension
WO2015162500A2 (ko) 2014-03-24 2015-10-29 삼성전자 주식회사 고대역 부호화방법 및 장치와 고대역 복호화 방법 및 장치

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4622680A (en) * 1984-10-17 1986-11-11 General Electric Company Hybrid subband coder/decoder method and apparatus
US4975956A (en) * 1989-07-26 1990-12-04 Itt Corporation Low-bit-rate speech coder using LPC data reduction processing
JPH03181232A (ja) * 1989-12-11 1991-08-07 Toshiba Corp 可変レート符号化方式
CA2032765C (en) * 1989-12-21 1995-12-12 Hidetaka Yoshikawa Variable rate encoding and communicating apparatus
US5235669A (en) * 1990-06-29 1993-08-10 At&T Laboratories Low-delay code-excited linear-predictive coding of wideband speech at 32 kbits/sec
JPH04127747A (ja) * 1990-09-19 1992-04-28 Toshiba Corp 可変レート符号化方式
JP3134455B2 (ja) * 1992-01-29 2001-02-13 ソニー株式会社 高能率符号化装置及び方法
US5526464A (en) * 1993-04-29 1996-06-11 Northern Telecom Limited Reducing search complexity for code-excited linear prediction (CELP) coding
IT1270439B (it) * 1993-06-10 1997-05-05 Sip Procedimento e dispositivo per la quantizzazione dei parametri spettrali in codificatori numerici della voce
CA2137756C (en) * 1993-12-10 2000-02-01 Kazunori Ozawa Voice coder and a method for searching codebooks

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2005112005A1 (ja) * 2004-04-27 2008-03-27 松下電器産業株式会社 スケーラブル符号化装置、スケーラブル復号化装置、およびこれらの方法
JP4546464B2 (ja) * 2004-04-27 2010-09-15 パナソニック株式会社 スケーラブル符号化装置、スケーラブル復号化装置、およびこれらの方法

Also Published As

Publication number Publication date
KR960006301A (ko) 1996-02-23
CN1121620A (zh) 1996-05-01
US5956686A (en) 1999-09-21
JP3237089B2 (ja) 2001-12-10

Similar Documents

Publication Publication Date Title
JP3237089B2 (ja) 音響信号符号化復号方法
US5983172A (en) Method for coding/decoding, coding/decoding device, and videoconferencing apparatus using such device
US6721700B1 (en) Audio coding method and apparatus
EP0770985B1 (en) Signal encoding method and apparatus
KR101162275B1 (ko) 오디오 신호 처리 방법 및 장치
JP4567238B2 (ja) 符号化方法、復号化方法、符号化器、及び復号化器
EP1203370B1 (en) Method for improving the coding efficiency of an audio signal
JP2003529787A (ja) 可変時間/周波数分解能および時間/周波数切り替えを使用する効率的なスペクトルエンベロープ符号化
JPWO2008072670A1 (ja) 符号化装置、復号装置、およびこれらの方法
WO2006120931A1 (ja) 符号化装置、復号化装置及びこれらの方法
JP2007504503A (ja) 低ビットレートオーディオ符号化
JP4603485B2 (ja) 音声・楽音符号化装置及び音声・楽音符号化方法
JP2002330075A (ja) サブバンドadpcm符号化方法、復号方法、サブバンドadpcm符号化装置、復号装置およびワイヤレスマイクロホン送信システム、受信システム
KR20050006028A (ko) 에프쥐에스 오디오 부호화에서 스케일 팩터방식 비트시프트
JP2001519552A (ja) ビットレートスケーラブルなオーディオデータストリームを生成する方法および装置
JP3087814B2 (ja) 音響信号変換符号化装置および復号化装置
US20090210219A1 (en) Apparatus and method for coding and decoding residual signal
US6012025A (en) Audio coding method and apparatus using backward adaptive prediction
JP2891193B2 (ja) 広帯域音声スペクトル係数量子化装置
US20040054529A1 (en) Transmitter and receiver for speech coding and decoding by using additional bit allocation method
JP3453116B2 (ja) 音声符号化方法及び装置
JP3099876B2 (ja) 多チャネル音声信号符号化方法及びその復号方法及びそれを使った符号化装置及び復号化装置
WO1998035447A2 (en) Audio coding method and apparatus
JP3827720B2 (ja) 差分コーディング原理を用いる送信システム
JPH08129400A (ja) 音声符号化方式

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees