JP2004101720A - 音響符号化装置及び音響符号化方法 - Google Patents

音響符号化装置及び音響符号化方法 Download PDF

Info

Publication number
JP2004101720A
JP2004101720A JP2002261549A JP2002261549A JP2004101720A JP 2004101720 A JP2004101720 A JP 2004101720A JP 2002261549 A JP2002261549 A JP 2002261549A JP 2002261549 A JP2002261549 A JP 2002261549A JP 2004101720 A JP2004101720 A JP 2004101720A
Authority
JP
Japan
Prior art keywords
signal
acoustic
encoding
decoding
decoded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002261549A
Other languages
English (en)
Other versions
JP3881943B2 (ja
Inventor
Masahiro Oshikiri
押切 正浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to JP2002261549A priority Critical patent/JP3881943B2/ja
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to PCT/JP2003/010247 priority patent/WO2004023457A1/ja
Priority to US10/526,566 priority patent/US7996233B2/en
Priority to CNB038244144A priority patent/CN100454389C/zh
Priority to CN2008101831098A priority patent/CN101425294B/zh
Priority to EP03794081A priority patent/EP1533789A4/en
Priority to AU2003257824A priority patent/AU2003257824A1/en
Publication of JP2004101720A publication Critical patent/JP2004101720A/ja
Application granted granted Critical
Publication of JP3881943B2 publication Critical patent/JP3881943B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

【課題】遅延が短く低ビットレートで高品質に符号化を行うこと。
【解決手段】ダウンサンプリング器101は、サンプリングレートFHの入力データをサンプリングレートFHより低いサンプリングレートFLに変換する。基本レイヤ符号化器102は、サンプリングレートFLの入力データを所定の基本フレーム単位で符号化する。局所復号化器103は、第1符号化コードを復号化する。アップサンプリング器104は、復号信号のサンプリングレートをFHに上げる。減算器106は、入力信号を復号信号で減算し、減算結果を残差信号とする。フレーム分割器107は、残差信号を基本フレームより時間長が短い拡張フレームに分割する。拡張レイヤ符号化器108は、拡張フレームに分割された残差信号を符号化し、この符号化で得られた第2符号化コードを多重化器109に出力する。
【選択図】   図1

Description

【0001】
【発明の属する技術分野】
本発明は、楽音信号または音声信号などの音響信号を高能率に圧縮符号化する音響符号化装置及び音響符号化方法に関し、特に符号化コードの一部からでも楽音や音声を復号することができるスケーラブル符号化を行う音響符号化装置及び音響符号化方法に関する。
【0002】
【従来の技術】
楽音信号または音声信号を低ビットレートで圧縮する音響符号化技術は、移動体通信における電波等の伝送路容量及び記録媒体の有効利用のために重要である。音声信号を符号化する音声符号化に、ITU(International Telecommunication Union)で規格化されているG726、G729などの方式がある。これらの方式は、狭帯域信号(300Hz〜3.4kHz)を対象とし、8kbit/s〜32kbit/sのビットレートで高品質に符号化できる。
【0003】
また、広帯域信号(50Hz〜7kHz)を符号化する標準方式としてITUのG722、G722.1や、3GPP(The 3rd Generation Partnership Project)のAMR−WBなどが存在する。これらの方式は、6.6kbit/s〜64kbit/sのビットレートで広帯域音声信号を高品質に符号化できる。
【0004】
音声信号を低ビットレートで高能率に符号化を行う有効な方法に、CELP(Code Excited Linear Prediction)がある。CELPは、人間の音声生成モデルを工学的に模擬したモデルに基づき、乱数やパルス列で表される励振信号を周期性の強さに対応するピッチフィルタと声道特性に対応する合成フィルタに通し、その出力信号と入力信号の二乗誤差が聴覚特性の重み付けの下で最小になるよう符号化パラメータを決定する方法である。(例えば、非特許文献1参照)
【0005】
最近の標準音声符号化方式の多くがCELPに基づいており、例えばG729は、8kbit/sのビットレートで狭帯域信号の符号化でき、AMR−WBは6.6kbit/s〜23.85kbit/sのビットレートで広帯域信号を符号化できる。
【0006】
一方で、楽音信号を符号化する楽音符号化の場合、MPEG(Moving Picture Expert Group)で規格化されているレイヤ3方式やAAC方式のように、楽音信号を周波数領域に変換し、聴覚心理モデルを利用して符号化を行う変換符号化が一般的である。これらの方式は、サンプリングレートが44.1kHzの信号に対しチャネル当たり64kbit/s〜96kbit/sのビットレートでほとんど劣化が生じないことが知られている。
【0007】
しかしながら、音声信号が主体で、背景に音楽や環境音が重畳している信号を符号化する場合、音声符号化方式を適用すると背景部の音楽や環境音の影響で、背景部の信号のみならず音声信号も劣化してしまい全体的な品質が低下するという問題がある。これは、音声符号化方式が、CELPという音声モデルに特化した方式を基本にしているために生じる問題である。また、音声符号化方式が対応できる信号帯域は高々7kHzまでであり、それ以上の高域を持つ信号に対しては構成上十分に対応しきれないという問題がある。
【0008】
一方で、楽音符号化は、音楽に対して高品質に符号化を行うことができるので、前述したような背景に音楽や環境音がある音声信号についても十分な品質を得ることができる。また、楽音符号化は、対象となる信号の帯域もCD品質であるサンプリングレートが22kHz程度の信号まで対応可能である。
【0009】
その反面、高品質な符号化を実現するためにはビットレートを高くして使用する必要があり、仮にビットレートを32kbit/s程度まで低く抑えると復号信号の品質が大きく低下するという問題がある。そのため、伝送レートの低い通信網で使用できないという問題がある。
【0010】
上述した問題を回避するためにこれらの技術を組み合わせて、最初に入力信号を基本レイヤにてCELPで符号化し、次にその復号信号を入力信号から減算して得られる残差信号を求め、この信号を拡張レイヤにて変換符号化を行うスケーラブル符号化が考えられる。
【0011】
この方法では、基本レイヤはCELPを用いているため音声信号を高品質に符号化でき、かつ拡張レイヤは基本レイヤで表しきれない背景の音楽や環境音、基本レイヤでカバーする周波数帯よりも高い周波数成分の信号を効率よく符号化することができる。さらにこの構成によればビットレートを低く抑えることができる。加えて、この構成によれば、符号化コードの一部つまり基本レイヤの符号化コードのみから音響信号を復号することが可能であり、このようなスケーラブル機能は伝送容量の異なる複数のネットワークに対するマルチキャストの実現に有効である。
【0012】
しかしながら、このようなスケーラブル符号化では、拡張レイヤにて遅延が増大するという問題が生じる。この問題について図27及び図28を用いて説明する。図27は、従来の音声符号化における基本レイヤのフレーム(基本フレーム)と拡張レイヤのフレーム(拡張フレーム)の一例を示す図である。図28は、従来の音声復号化における基本レイヤのフレーム(基本フレーム)と拡張レイヤのフレーム(拡張フレーム)の一例を示す図である。
【0013】
従来の音声符号化では、基本フレームと拡張フレームが、特定の同じ時間長のフレームで構成されている。図27において、時刻T(n−1)〜T(n)に入力される入力信号は、第n基本フレームとなり基本レイヤにて符号化が行われる。これに対応して拡張レイヤでも時刻T(n−1)〜T(n)の残差信号に対して符号化が行われる。
【0014】
ここで、拡張レイヤでMDCT(変形離散コサイン変換)を用いる場合、MDCTの分析フレームは前後に隣接する分析フレームと半分ずつ重ね合わせる必要がある。この重ね合わせは、合成時のフレーム間の不連続の発生を防ぐために行われる。
【0015】
MDCTの場合、直交基底は分析フレーム内のみならず隣接する分析フレームとの間でも直交性が成り立つよう設計されており、そのために合成時に隣接する分析フレームと重ね合わせ加算することでフレーム間の不連続による歪の発生を防いでいる。図27では、第n分析フレームはT(n−2)〜T(n)の長さに設定され、符号化処理が行われる。
【0016】
復号化処理では、第n基本フレームと第n拡張フレームの復号信号が生成される。拡張レイヤではIMDCT(変形離散コサイン逆変換)が行われ、前述したように前フレーム(この場合は第n−1拡張フレーム)の復号信号と合成フレーム長の半分だけ重ね合わせ加算を行う必要がある。そのために、復号化処理部では時刻T(n−1)の信号までしか生成することができない。
【0017】
つまり、図28に示すような基本フレームと同じ長さの遅延(この場合はT(n)−T(n−1)の時間長)が生じてしまう。仮に、基本フレームの時間長を20msとした場合、拡張レイヤで新たに生じる遅延は20msとなる。このような遅延の増大は、音声通話サービスを実現する上で深刻な問題となる。
【0018】
【非特許文献1】
”Code−Excited Linear Prediction (CELP): high quality speech at very low bit rates”, Proc. ICASSP 85, pp.937−940, 1985.
【0019】
【発明が解決しようとする課題】
このように、従来の装置においては、音声が主体で背景に音楽や雑音が重畳しているような信号を、遅延が短く低ビットレートで高品質に符号化を行うことが難しいという問題がある。
【0020】
本発明はかかる点に鑑みてなされたものであり、音声が主体で背景に音楽や雑音が重畳しているような信号であっても、遅延が短く低ビットレートで高品質に符号化を行うことのできる音響符号化装置及び音響符号化方法を提供することを目的とする。
【0021】
【課題を解決するための手段】
本発明の音響符号化装置は、入力信号のサンプリングレートを下げるダウンサンプリング手段と、サンプリングレートが下げられた入力信号を所定の基本フレーム単位で符号化する基本レイヤ符号化手段と、符号化された入力信号を復号化して復号信号を得る復号化手段と、前記復号信号のサンプリングレートを入力時の入力信号のサンプリングレートと同一のレートに上げるアップサンプリング手段と、入力時の入力信号とサンプリングレートが上げられた復号信号との差分信号を得る減算手段と、前記基本フレームより時間長が短い拡張フレーム単位で前記差分信号を符号化する拡張レイヤ符号化手段と、を具備する構成を採る。
【0022】
本発明の音響符号化装置は、基本フレーム単位の差分信号を拡張フレーム単位に分割するフレーム分割手段を具備し、前記拡張レイヤ符号化手段は分割された差分信号を符号化する構成を採る。
【0023】
これらの構成によれば、音響符号化装置側で、基本フレームより短い時間長である拡張フレーム単位に残差信号を分割し、分割した残差信号を符号化し、音響復号化装置側で、この基本フレームより短い時間長の拡張フレーム単位で符号化された残差信号を復号化し、時刻が重なる部分を重ね合わせることにより、復号化時の遅延の原因となる拡張フレームの時間長を短くすることができ、音声復号化の遅延を短くすることができる。
【0024】
本発明の音響符号化装置は、前記基本レイヤ符号化手段は、符号励振線形予測法を用いて入力信号を符号化する構成を採る。
【0025】
この構成によれば、送信側において、基本レイヤにCELPを適用して入力信号を符号化し、受信側において、この符号化した入力信号にCELPを適用して復号することにより、低ビットレートで高品質な基本レイヤを実現することができる。
【0026】
本発明の音響符号化装置は、前記拡張レイヤ符号化手段は、前記差分信号を時間領域から周波数領域に直交変換し、変換後の前記差分信号を符号化する構成を採る。
【0027】
この構成によれば、差分信号を時間領域から周波数領域に変換し、変換後の信号について基本レイヤの符号化によりカバーできない周波数領域を拡張レイヤで符号化することにより、音楽のようにスペクトルの変化が大きい信号にも対応することができる。
【0028】
本発明の音響符号化装置は、前記拡張レイヤ符号化手段は、変形離散コサイン変換を用いて前記差分信号を時間領域から周波数領域に変換する構成を採る。
【0029】
この構成によれば、隣接するフレーム間の不連続の発生を抑えることができる。
【0030】
本発明の音響符号化装置は、前記拡張レイヤ符号化手段は、周波数領域に変換した前記差分信号を所定の帯域のみ符号化する構成を採る。
【0031】
この構成によれば、基本レイヤの符号化でカバーできない領域のみを符号化の対象とすることにより、符号化の対象となる信号を少なくすることができ、ビットレートの増加を抑えて効率よく変換係数を符号化することができる。
【0032】
本発明の音響符号化装置は、聴覚に寄与しない振幅値を表す聴覚マスキングを算出する聴覚マスキング手段を具備し、前記拡張レイヤ符号化手段は、前記聴覚マスキング内の信号を符号化の対象としない構成を採る。
【0033】
この構成によれば、マスキング効果の特性を利用して、入力信号のスペクトルから聴覚マスキングを算出し、拡張レイヤの符号化において、量子化歪をこのマスキング値以下になるように量子化を行うことにより、品質の劣化を伴わずに量子化の対象となるMDCT係数の数を減らすことができ、低ビットレートで高品質に符号化を行うことができる。
【0034】
本発明の音響符号化装置は、前記拡張レイヤ符号化手段は、聴覚マスキングと残差信号の差をとり、この差が相対的に大きい残差信号を符号化の対象とし、前記残差信号が存在する時間領域と周波数領域の位置を符号化する構成を採る。
【0035】
この構成によれば、拡張レイヤにおける符号化において、残差信号を時間領域から周波数領域に変換した後、聴覚マスキングを算出して符号化の対象となる係数を決定し、周波数とフレーム数の2次元での係数の位置情報を符号化することにより、符号化の対象となる係数と符号化の対象とならない係数の配置が連続することを利用して情報量を圧縮することができ、低ビットレートで高品質に符号化を行うことができる。
【0036】
本発明の音響符号化装置は、前記拡張レイヤ符号化手段は、時間領域と周波数領域の一方または両方において、それぞれ複数の領域を一つのグループとし、聴覚マスキングと残差信号の差を前記グループ単位で算出し、この差が相対的に大きいグループに含まれる残差信号のみを符号化する構成を採る。
【0037】
この構成によれば、符号化する信号の時間領域と周波数領域の位置情報をグループ単位とすることにより、少ないビット数で符号化の対象となった領域の位置を表すことができるため、低ビットレート化を図ることができる。
【0038】
本発明の音響復号化装置は、符号化側において入力信号を所定の基本フレーム単位で符号化した第1符号化コードを復号化して第1復号信号を得る基本レイヤ復号化手段と、入力信号と符号化側において第1符号化コードを復号した信号との残差信号を前記基本フレームより時間長が短い拡張フレーム単位で符号化した第2符号化コードを復号化して第2復号信号を得る拡張レイヤ復号化手段と、第1復号信号のサンプリングレートを前記第2復号信号のサンプリングレートと同一のサンプリングレートに上げるアップサンプリング手段と、前記第2復号信号とサンプリングレートを上げられた第1復号信号を加算する加算手段と、を具備する構成を採る。
【0039】
この構成によれば、音響符号化装置側で、基本フレームより短い時間長である拡張フレーム単位に残差信号を分割し、分割した残差信号を符号化し、音響復号化装置側で、この基本フレームより短い時間長の拡張フレーム単位で符号化された残差信号を復号化し、時刻が重なる部分を重ね合わせることにより、復号化時の遅延の原因となる拡張フレームの時間長を短くすることができ、音声復号化の遅延を短くすることができる。
【0040】
本発明の音響復号化装置は、基本レイヤ復号化手段は、符号励振線形予測法を用いて第1符号化コードを復号化する構成を採る。
【0041】
この構成によれば、送信側において、基本レイヤにCELPを適用して入力信号を符号化し、受信側において、この符号化した入力信号にCELPを適用して復号することにより、低ビットレートで高品質な基本レイヤを実現することができる。
【0042】
本発明の音響復号化装置は、拡張レイヤ復号化手段は、第2符号化コードを復号化した信号を周波数領域から時間領域に直交変換する構成を採る。
【0043】
この構成によれば、差分信号を時間領域から周波数領域に変換し、変換後の信号について基本レイヤの符号化によりカバーできない周波数領域を拡張レイヤで符号化することにより、音楽のようにスペクトルの変化が大きい信号にも対応することができる。
【0044】
本発明の音響復号化装置は、第2復号信号同士を同じタイミングで符号化したフレーム部分を重ね合わせる重ね合わせ加算手段を具備し、前記拡張レイヤ復号化手段は、前記第2符号化コードを復号した信号に変形離散コサイン逆変換を用いて周波数領域から時間領域に直交変換することにより前記第2復号信号を復号して前記加算手段に出力し、加算手段は、前記重ね合わせ手段において重ね合わされた第2復号信号と前記第1復号信号とを加算する構成を採る。
【0045】
この構成によれば、隣接するフレーム間の不連続の発生を抑えることができる。
【0046】
本発明の音響復号化装置は、前記拡張レイヤ復号化手段は、第2符号化コードから残差信号が存在する時間領域と周波数領域との情報を復号し、前記残差信号が存在する時間領域と周波数領域を復号化する構成を採る。
【0047】
この構成によれば、マスキング効果の特性を利用して、入力信号のスペクトルから聴覚マスキングを算出し、拡張レイヤの符号化において、量子化歪をこのマスキング値以下になるように量子化を行うことにより、品質の劣化を伴わずに量子化の対象となるMDCT係数の数を減らすことができ、低ビットレートで高品質に符号化を行うことができる。
【0048】
本発明の音響復号化装置は、前記拡張レイヤ復号化手段は、時間領域と周波数領域の一方または両方において、それぞれ複数の領域を一つのグループとし、復号の対象となるグループに含まれる残差信号を復号化する。
【0049】
この構成によれば、符号化する信号の時間領域と周波数領域の位置情報をグループ単位とすることにより、少ないビット数で符号化の対象となった領域の位置を表すことができるため、低ビットレート化を図ることができる。
【0050】
本発明の音響信号送信装置は、音響信号を電気的信号に変換する音響入力手段と、この音響入力手段から出力された信号をディジタル信号に変換するA/D変換手段と、このA/D変換手段から出力されたディジタル信号を符号化する上記音響符号化装置と、この符号化装置から出力された符号化コードを無線周波数の信号に変調するRF変調手段と、このRF変調手段から出力された信号を電波に変換して送信する送信アンテナとを具備する構成を採る。
【0051】
本発明の音響信号受信装置は、電波を受信する受信アンテナと、この受信アンテナに受信された信号を復調するRF復調手段と、このRF復調手段にて得られた情報を復号する上記音響復号化装置と、この復号化装置から出力された信号をアナログ信号に変換するD/A変換手段と、このD/A変換手段から出力された電気的信号を音響信号に変換する音響出力手段とを具備する構成を採る。
【0052】
本発明の通信端末装置は、上記音響信号送信装置あるいは上記音響信号受信装置の少なくとも一方を具備する構成を採る。本発明の基地局装置は、上記音響信号送信装置あるいは上記音響信号受信装置の少なくとも一方を具備する構成を採る。
【0053】
これらの構成によれば、通信において少ないビット数で効率よく音響信号を符号化する音響符号化装置を提供することができる。
【0054】
本発明の音響符号化方法は、符号化側において、所定の基本フレーム単位で入力信号を符号化して第1符号化コードを作成し、符号化された前記入力信号を復号化して第1復号信号を得て、前記入力信号と前記復号信号との差分信号を得て、前記基本フレームより時間長が短い拡張フレーム単位で前記差分信号を符号化して第2符号化コードを作成し、復号化側において、前記第1符号化コードを復号化して第2復号信号を得て、前記第2符号化コードを復号化して第3復号信号を得て、前記第2復号信号と前記第3復号信号を加算するようにした。
【0055】
この方法によれば、音響符号化装置側で、基本フレームより短い時間長である拡張フレーム単位に残差信号を分割し、分割した残差信号を符号化し、音響復号化装置側で、この基本フレームより短い時間長の拡張フレーム単位で符号化された残差信号を復号化し、時刻が重なる部分を重ね合わせることにより、復号化時の遅延の原因となる拡張フレームの時間長を短くすることができ、音声復号化の遅延を短くすることができる。
【0056】
【発明の実施の形態】
本発明者は、入力信号を符号化した基本フレームの時間長と、入力信号と符号化した入力信号を復号した信号との差分を符号化した拡張フレームの時間長が同一であることにより、復調時に長い遅延が発生することに着目し、本発明をするに至った。
【0057】
すなわち、本発明の骨子は、拡張レイヤのフレームの時間長を基本レイヤのフレームの時間長より短く設定して拡張レイヤの符号化を行い、音声が主体で背景に音楽や雑音が重畳しているような信号を遅延が短く低ビットレートで高品質に符号化を行うことである。
【0058】
以下、本発明の実施の形態について図面を参照して詳細に説明する。
(実施の形態1)
図1は、本発明の実施の形態1に係る音響符号化装置の構成を示すブロック図である。図1の音響符号化装置100は、ダウンサンプリング器101と、基本レイヤ符号化器102と、局所復号化器103と、アップサンプリング器104と、遅延器105と、減算器106と、フレーム分割器107と、拡張レイヤ符号化器108と、多重化器109とから主に構成される。
【0059】
図1において、ダウンサンプリング器101は、サンプリングレートFHの入力データ(音響データ)を受けつけ、この入力データをサンプリングレートFHより低いサンプリングレートFLに変換して基本レイヤ符号化器102に出力する。
【0060】
基本レイヤ符号化器102は、サンプリングレートFLの入力データを所定の基本フレーム単位で符号化し、入力データを符号化した第1符号化コードを局所復号化器103と多重化器109に出力する。例えば、基本レイヤ符号化器102は、入力データをCELP方式で符号化する。
【0061】
局所復号化器103は、第1符号化コードを復号化し、復号化により得られた復号信号をアップサンプリング器104に出力する。アップサンプリング器104は、復号信号のサンプリングレートをFHに上げて減算器106に出力する。
【0062】
遅延器105は、入力信号を所定の時間遅延して減算器106に出力する。この遅延の大きさをダウンサンプリング器101と基本レイヤ符号化器102とアップサンプリング器104で生じる時間遅れと同値とすることにより、次の減算処理での位相のずれを防ぐ役割を持つ。例えば、この遅延時間は、ダウンサンプリング器101、基本レイヤ符号化器102、局所復号化器103、及びアップサンプリング器104における処理の時間の総和とする。減算器106は、入力信号を復号信号で減算し、減算結果を残差信号としてフレーム分割器107に出力する。
【0063】
フレーム分割器107は、残差信号を基本フレームより時間長が短い拡張フレームに分割し、拡張フレームに分割した残差信号を拡張レイヤ符号化器108に出力する。拡張レイヤ符号化器108は、拡張フレームに分割された残差信号を符号化し、この符号化で得られた第2符号化コードを多重化器109に出力する。多重化器109は、第1符号化コードと第2符号化コードを多重化して出力する。
【0064】
次に、本実施の形態に係る音響符号化装置の動作について説明する。ここでは、サンプリングレートFHの音響データである入力信号を符号化する例について説明する。
【0065】
入力信号は、ダウンサンプリング器101において、サンプリングレートFHより低いサンプリングレートFLに変換される。そして、サンプリングレートFLの入力信号は、基本レイヤ符号化器102において符号化される。そして、符号化された入力信号が局所復号化器103において復号化され、復号信号が生成される。復号信号は、アップサンプリング器104において、サンプリングレートFLより高いサンプリングレートFHに変換される。
【0066】
一方、入力信号は、遅延器105において所定の時間遅延した後、減算器106に出力される。減算器106において遅延器105を介してきた入力信号とサンプリングレートFHに変換された復号信号との差分をとることにより、残差信号が得られる。
【0067】
残差信号は、フレーム分割器107において、基本レイヤ符号化器102における符号化のフレーム単位より時間長の短いフレームに分割される。そして、分割された残差信号は、拡張レイヤ符号化器108において符号化される。基本レイヤ符号化器102において符号化された入力信号と、拡張レイヤ符号化器108において符号化された残差信号は、多重化器109において多重化される。
【0068】
以下、基本レイヤ符号化器102と拡張レイヤ符号化器108とがそれぞれ符号化する信号について説明する。図2は、音響信号の情報の分布の一例を示す図である。図2において、縦軸は情報量を示し、横軸は周波数を示す。図2では、入力信号に含まれる音声情報と背景音楽・背景雑音情報がどの周波数帯にどれだけ存在しているかを表している。
【0069】
図2に示すように、音声情報は、周波数の低い領域に情報が多く存在し、高域に向かうほど情報量は減少する。一方、背景音楽・背景雑音情報は、音声情報と比べると相対的に低域の情報は少なく、高域に含まれる情報が大きい。
【0070】
そこで、基本レイヤではCELPを用いて音声信号を高品質に符号化し、拡張レイヤでは基本レイヤで表しきれない背景の音楽や環境音、基本レイヤでカバーする周波数帯よりも高い周波数成分の信号を効率よく符号化する。
【0071】
図3は、基本レイヤと拡張レイヤで符号化の対象とする領域の一例を示す図である。図3において、縦軸は情報量を示し、横軸は周波数を示す。図3は、基本レイヤ符号化器102と拡張レイヤ符号化器108がそれぞれ符号化する情報の対象となる領域を表している。
【0072】
基本レイヤ符号化器102は、0〜FL間の周波数帯の音声情報を効率よく表すように設計されており、この領域での音声情報は品質良く符号化することができる。しかし、基本レイヤ符号化器102では、0〜FL間の周波数帯の背景音楽・背景雑音情報の符号化品質が高くない。
【0073】
拡張レイヤ符号化器108は、上記説明にある基本レイヤ符号化器102の能力不足の部分と、FL〜FH間の周波数帯の信号をカバーするように設計されている。よって、基本レイヤ符号化器102と拡張レイヤ符号化器108を組み合わせることで広い帯域で高品質な符号化が実現できる。
【0074】
図3に示すように、基本レイヤ符号化器102における符号化により得られた第1符号化コードには、0〜FL間の周波数帯の音声情報が含まれているので、少なくとも第1符号化コードのみでも復号信号が得られるというスケーラブル機能が実現できる。
【0075】
本実施の形態の音響符号化装置100では、この拡張レイヤ符号化器108において符号化するフレームの時間長を基本レイヤ符号化器102において符号化するフレームの時間長よりも十分に短く設定することにより、拡張レイヤで生じる遅延を短くする。
【0076】
図4は、基本レイヤと拡張レイヤの符号化の一例を示す図である。図4において、横軸は時刻を示す。図4では、時刻T(n−1)からT(n)までの入力信号を第nフレームとして処理する。基本レイヤ符号化器102は、第nフレームを一つの基本フレームである第n基本フレームとして符号化を行う。一方、拡張レイヤ符号化器108は、第nフレームを複数の拡張フレームに分割して符号化する。
【0077】
ここで、基本レイヤのフレーム(基本フレーム)に対して拡張レイヤのフレーム(拡張フレーム)の時間長は1/Jに設定されている。図4では便宜上J=8に設定しているが、本実施例はこの数値に限定されることは無く、J≧2となる任意の整数を用いることができる。
【0078】
図4の例では、J=8としているので、拡張フレームが8個で基本フレーム1個に対応することになる。以後、第n基本フレームに対応する拡張フレームのそれぞれを第n拡張フレーム(#j)(j=1〜8)と表記することにする。各拡張レイヤの分析フレームは、隣接するフレーム間で不連続が生じないように、分析フレームの半分が重なり合うように設定され、符号化処理が行われる。例えば、図4では、フレーム401とフレーム402をあわせた領域が分析フレームとなる。そして、復号化側は、上記説明の入力信号を基本レイヤと拡張レイヤで符号化した信号を復号化する。
【0079】
図5は、基本レイヤと拡張レイヤの復号化の一例を示す図である。図5において、横軸は時刻を示す。復号化処理では、第n基本フレームと第n拡張フレームの復号信号が生成される。拡張レイヤでは、前フレームとの重ね合わせ加算が成立する区間の信号を復号することができる。図5では、時刻501まで、すなわち第n拡張フレーム(#8)の中心の位置まで復号信号が生成される。
【0080】
つまり、本実施の形態の音響符号化装置では、拡張レイヤで生じる遅延が時刻501から時刻502までであり、基本レイヤの時間長の1/8で済むことになる。例えば、基本フレームの時間長が20msである場合、拡張レイヤで新たに生じる遅延は2.5msとなる。
【0081】
この例では、拡張フレームの時間長を基本フレームの時間長の1/8とした場合であったが、一般に拡張フレームの時間長を基本フレームの時間長の1/Jとした場合に、拡張レイヤで生じる遅延は1/Jとなり、本発明を適用するシステムで許容される遅延の大きさによってJを設定することが可能である。
【0082】
次に、上記復号化を行う音響復号化装置につい説明する。図6は、本発明の実施の形態1に係る音響復号化装置の構成を示すブロック図である。図6の音響復号化装置600は、分離器601と、基本レイヤ復号化器602と、アップサンプリング器603と、拡張レイヤ復号化器604と、重ね合わせ加算器605と、加算器606とから主に構成される。
【0083】
分離器601は、音響符号化装置100において符号化されたコードを基本レイヤ用の第1符号化コードと拡張レイヤ用の第2符号化コードに分離し、第1符号化コードを基本レイヤ復号化器602に出力し、第2符号化コードを拡張レイヤ復号化器604に出力する。
【0084】
基本レイヤ復号化器602は、第1符号化コードを復号してサンプリングレートFLの復号信号を得る。そして、基本レイヤ復号化器602は、復号信号をアップサンプリング器603に出力する。アップサンプリング器603は、サンプリングレートFLの復号信号をサンプリングレートFHの復号信号に変換して加算器606に出力する。
【0085】
拡張レイヤ復号化器604は、第2符号化コードを復号してサンプリングレートFHの復号信号を得る。この第2符号化コードは、音響符号化装置100において、入力信号を基本フレームより時間長が短い拡張フレーム単位で符号化したコードである。そして、拡張レイヤ復号化器604は、この復号信号を重ね合わせ加算器605に出力する。
【0086】
重ね合わせ加算器605は、拡張レイヤ復号化器604において復号された拡張フレーム単位の復号信号を重ね合わせ、重ね合わせた復号信号を加算器606に出力する。具体的には、重ね合わせ加算器605は、復号信号に合成用の窓関数を乗じ、前フレームで復号された時間領域の信号とフレームの半分だけオーバーラップさせて加算して出力信号を生成する。
【0087】
加算器606は、アップサンプリング器603においてアップサンプリングされた基本レイヤの復号信号と、重ね合わせ加算器605において重ね合わされた拡張レイヤの復号信号とを加算して出力する。
【0088】
このように、本実施の形態の音響符号化装置及び音響復号化装置によれば、音響符号化装置側で、基本フレームより短い時間長である拡張フレーム単位に残差信号を分割し、分割した残差信号を符号化し、音響復号化装置側で、この基本フレームより短い時間長の拡張フレーム単位で符号化された残差信号を復号化し、時刻が重なる部分を重ね合わせることにより、復号化時の遅延の原因となる拡張フレームの時間長を短くすることができ、音声復号化の遅延を短くすることができる。
【0089】
(実施の形態2)
本実施の形態では、基本レイヤの符号化においてCELPを用いる例について説明する。図7は、本発明の実施の形態2の基本レイヤ符号化器の内部構成の一例を示すブロック図である。図7は、図1の基本レイヤ符号化器102の内部構成を示す図である。図7の基本レイヤ符号化器102は、LPC分析器701と、聴感重み部702と、適応符号帳探索器703と、適応ゲイン量子化器704と、目標ベクトル生成器705と、雑音符号帳探索器706と、雑音ゲイン量子化器707と、多重化器708とから主に構成される。
【0090】
LPC分析器701は、サンプリングレートFLの入力信号のLPC係数を算出し、このLPC係数をLSP係数などの量子化に適したパラメータに変換して量子化する。そして、LPC分析器701は、この量子化で得られる符号化コードを多重化器708に出力する。
【0091】
また、LPC分析器701は、符号化コードから量子化後のLSP係数を算出してLPC係数に変換し、量子化後のLPC係数を、適応符号帳探索器703、適応ゲイン量子化器704、雑音符号帳探索器706、及び雑音ゲイン量子化器707に出力する。さらに、LPC分析器701は、量子化前のLPC係数を聴感重み部702に出力する。
【0092】
聴感重み部702は、LPC分析器701で求められたLPC係数に基づいてダウンサンプリング器101から出力された入力信号に重み付けを行う。これは、量子化歪のスペクトルを入力信号のスペクトル包絡にマスクされるようスペクトル整形を行うことを目的としている。
【0093】
適応符号帳探索器703では、聴覚重み付けされた入力信号を目標信号として適応符号帳の探索が行われる。過去の音源系列をピッチ周期で繰り返した信号を適応ベクトルと呼び、あらかじめ定められた範囲のピッチ周期で生成された適応ベクトルによって適応符号帳は構成される。
【0094】
聴覚重み付けされた入力信号をt(n)、ピッチ周期iの適応ベクトルにLPC係数で構成される合成フィルタのインパルス応答を畳み込んだ信号をp(n)としたとき、適応符号帳探索器703は、式(1)の評価関数Dを最小とする適応ベクトルのピッチ周期iをパラメータとして多重化器708に出力する。
【0095】
【数1】
Figure 2004101720
ここで、Nはベクトル長を表す。式(1)の第1項はピッチ周期iに独立なので、実際には、適応符号帳探索器703は第2項のみを計算する。
【0096】
適応ゲイン量子化器704は、適応ベクトルに乗じられる適応ゲインの量子化を行う。適応ゲインβは、以下の式(2)で表され、適応ゲイン量子化器704は、この適応ゲインβをスカラー量子化し、量子化時に得られる符号を多重化器708に出力する。
【0097】
【数2】
Figure 2004101720
【0098】
目標ベクトル生成器705は、入力信号から適応ベクトルの影響を減算して、雑音符号帳探索器706と雑音ゲイン量子化器707で用いる目標ベクトルを生成して出力する。目標ベクトル生成器705は、p(n)を式1で表される評価関数Dを最小とするときの適応ベクトルに合成フィルタのインパルス応答を畳み込んだ信号、βqを式2で表される適応ベクトルβをスカラー量子化したときの量子化値としたとき、目標ベクトルt2(n)は、以下に示す式(3)のように表される。
【0099】
【数3】
Figure 2004101720
【0100】
雑音符号帳探索器706は、前記目標ベクトルt2(n)とLPC係数を用いて雑音符号帳の探索を行う。例えば、雑音符号帳探索器706には、ランダム雑音や大規模な音声信号を使って学習した信号を用いることができる。また、雑音符号帳探索器706が備える雑音符号帳は、代数(Algebraic)符号帳のように、振幅1のパルスをあらかじめ定められた非常に少ない数だけ有するベクトルで表されることができる。この代数符号長は、パルスの位置とパルスの符号(極性)の最適な組み合わせを少ない計算量で決定することができるという特徴がある。
【0101】
雑音符号帳探索器706は、目標ベクトルをt2(n)、コードjに対応する雑音ベクトルに合成フィルタのインパルス応答を畳み込んだ信号をc(n)としたとき、以下に示す式(4)の評価関数Dを最小とする雑音ベクトルのインデックスjを多重化器708に出力する。
【0102】
【数4】
Figure 2004101720
【0103】
雑音ゲイン量子化器707は、雑音ベクトルに乗じる雑音ゲインを量子化する。雑音ゲイン量子化器707は、以下に示す式(5)を用いて雑音ゲインγを算出し、この雑音ゲインγをスカラー量子化して多重化器708に出力する。
【0104】
【数5】
Figure 2004101720
【0105】
多重化器708は、送られてきたLPC係数、適応ベクトル、適応ゲイン、雑音ベクトル、雑音ゲインの符号化コードを多重化して局所復号化器103及び多重化器109に出力する。
【0106】
次に、復号化側について説明する。図8は、本発明の実施の形態2の基本レイヤ復号化器の内部構成の一例を示すブロック図である。図8は、図6の基本レイヤ復号化器602の内部構成を示す図である。図8の基本レイヤ復号化器602は、分離器801と、音源生成器802と、合成フィルタ803とから主に構成される。
【0107】
分離器801は、分離器601から出力された第1符号化コードをLPC係数、適応ベクトル、適応ゲイン、雑音ベクトル、雑音ゲインの符号化コードに分離して、適応ベクトル、適応ゲイン、雑音ベクトル、雑音ゲインの符号化コードを音源生成器802に出力する。同様に、分離器801は、LPC係数の符号化コードを合成フィルタ803に出力する。
【0108】
音源生成器802は、適応ベクトル、適応ベクトルゲイン、雑音ベクトル、雑音ベクトルゲインの符号化コードを復号し、以下に示す式(6)を用いて音源ベクトルex(n)を生成する。
【0109】
【数6】
Figure 2004101720
ここで、q(n)は適応ベクトル、βは適応ベクトルゲイン、c(n)は雑音ベクトル、γは雑音ベクトルゲインを表す。
【0110】
合成フィルタ803では、LPC係数の符号化コードからLPC係数を復号し、以下に示す式(7)を用いて復号されたLPC係数から合成信号syn(n)を生成する。
【0111】
【数7】
Figure 2004101720
ここで、αは復号されたLPC係数、NPはLPC係数の次数を表す。そして、合成フィルタ803は、復号された復号信号syn(n)をアップサンプリング器603に出力する。
【0112】
このように、本実施の形態の音響符号化装置及び音響復号化装置によれば、送信側において、基本レイヤにCELPを適用して入力信号を符号化し、受信側において、この符号化した入力信号にCELPを適用して復号することにより、低ビットレートで高品質な基本レイヤを実現することができる。
【0113】
なお、本実施の形態の音声符号化装置は、量子化歪の知覚を抑制するために、合成フィルタ803の後にポストフィルタを従属接続する構成を採ることもできる。図9は、本発明の実施の形態2の基本レイヤ復号化器の内部構成の一例を示すブロック図である。但し、図8と同一の構成となるものについては、図8と同一番号を付し、詳しい説明を省略する。
【0114】
ポストフィルタ901は、量子化歪の知覚の抑制の実現のために様々な構成を適用しうるが、代表的な方法として、分離器801で復号されて得られるLPC係数から構成されるホルマント強調フィルタを用いる方法がある。ホルマント強調フィルタH(z)は以下に示す式(8)で表される。
【0115】
【数8】
Figure 2004101720
ここで、A(z)は復号LPC係数から構成される合成フィルタ、γ、γ、μはフィルタの特性を決定する定数を表す。
【0116】
(実施の形態3)
本実施の形態の特徴は、拡張レイヤの入力信号を周波数領域の係数に変換した後に符号化する変換符号化を用いる点にある。本実施の形態における拡張レイヤ符号化器108の基本構成を図10を用いて説明する。図10は、本発明の実施の形態3の拡張レイヤ符号化器の内部構成の一例を示すブロック図である。図10は、図1の拡張レイヤ符号化器108の内部構成の一例を示す図である。図10の拡張レイヤ符号化器108は、MDCT部1001と、量子化器1002とから主に構成される。
【0117】
MDCT部1001は、フレーム分割器107から出力された入力信号をMDCT変換(変形離散コサイン変換)してMDCT係数を求める。MDCT変換は、前後の隣接フレームと分析フレームを半分ずつ完全に重ね合わせ、分析フレームの前半部は奇関数、後半部は偶関数という直交基底を用いる。MDCT変換は、波形を合成する際、逆変換後の波形を重ね合わせて加算することにより、フレーム境界歪が発生しないという特徴がある。MDCTを行う際には、sin窓などの窓関数を入力信号に乗ずる。MDCT係数をX(n)とすると、MDCT係数は、以下に示す式(9)に従い算出される。
【0118】
【数9】
Figure 2004101720
ここでX(n)は入力信号に窓関数を乗算した信号を表す。
【0119】
量子化器1002は、MDCT部1001で求められたMDCT係数を量子化する。具体的には、量子化器1002は、MDCT係数それぞれをスカラー量子化する、または複数のMDCT係数をまとめてベクトルとしベクトル量子化する。上記量子化方法は、特にスカラー量子化を適用する場合では、十分な品質を得るためにビットレートが高くなる傾向にある。そのため、この量子化方法は、拡張レイヤに十分なビットを配分することができる場合に有効である。そして、量子化器1002は、MDCT係数を量子化した符号を多重化器109に出力する。
【0120】
次に、ビットレートの増加を抑えて効率よくMDCT係数を量子化する方法について説明する。図11は、MDCT係数の配置の一例を示す図である。図11において、横軸は時間、縦軸は周波数を表す。
【0121】
拡張レイヤで符号化の対象となるMDCT係数は、図11で表されるように時間方向と、周波数方向の2次元のマトリクスで表すことができる。本実施の形態では1個の基本フレームに対し8個の拡張フレームを設定しているので横軸は8次元となり、縦軸は拡張フレームの長さに一致する次元数となる。図11では、縦軸を16次元で表しているが限定はなく、好ましくは時間を示す縦軸方向に60次元とするのが望ましい。
【0122】
図11で表されるMDCT係数の全てについて十分高いSNRが得られるように量子化するには多くのビットが必要になる。この問題を回避するために、本実施の形態の音響符号化装置では、あらかじめ決めておいた帯域に含まれるMDCT係数のみを量子化し、それ以外のMDCT係数の情報は全く送らないようにする。つまり、図11の網掛け部分1101のMDCT係数を量子化し、それ以外のMDCT係数の量子化を行わないようにする。
【0123】
この量子化方法は、基本レイヤが符号化の対象とする帯域(0〜FL)は、既に基本レイヤで充分な品質で符号化されており充分な情報量を持つので、それ以外の帯域(例えばFL〜FH)を拡張レイヤで符号化すれば良いという考えに基づく。
【0124】
このように、基本レイヤの符号化でカバーできない領域のみを符号化の対象とすることにより、符号化の対象となる信号を少なくすることができ、ビットレートの増加を抑えて効率よく変換係数を符号化することができる。
【0125】
次に、復号化側について説明する。以下、周波数領域から時間領域への変換法に変形離散コサイン逆変換(IMDCT)を用いる場合について説明を行う。図12は、本発明の実施の形態3の拡張レイヤ復号化器の内部構成の一例を示すブロック図である。図12は、図6の拡張レイヤ復号化器604の内部構成の一例を示す図である。図12の拡張レイヤ復号化器604は、MDCT係数復号化器1201と、IMDCT部1202とから主に構成される。
【0126】
MDCT係数復号化器1201は、分離器601から出力される第2符号化コードから量子化されたMDCT係数を復号する。IMDCT部1202は、MDCT係数復号化器1201から出力されるMDCT係数にIMDCTを施し、時間領域の信号を生成して重ね合わせ加算器605に出力する。
【0127】
このように、本実施の形態の音響符号化装置及び音響復号化装置によれば、差分信号を時間領域から周波数領域に変換し、変換後の信号について基本レイヤの符号化によりカバーできない周波数領域を拡張レイヤで符号化することにより、音楽のようにスペクトルの変化が大きい信号にも対応することができる。
【0128】
なお、拡張レイヤが符号化の対象とする帯域をFL〜FHに固定しなくても良い。基本レイヤの符号化方式の特性や入力信号の高域に含まれる情報量により拡張レイヤが効果的に機能する帯域が変わる。従って、実施の形態2で説明したように、基本レイヤに広帯域信号用のCELPを用い、さらに入力信号が音声である場合、拡張レイヤが符号化の対象とする帯域を6kHz〜9kHzに設定すると良い。
【0129】
(実施の形態4)
人間の聴覚特性には、ある信号が与えられたとき、その信号の周波数の近傍に位置する信号が聞こえなくなるというマスキング効果がある。本実施の形態の特徴は、入力信号を基に聴覚マスキングを求め、聴覚マスキングを利用して拡張レイヤの符号化を行う点にある。
【0130】
図13は、本発明の実施の形態4に係る音響符号化装置の構成を示すブロック図である。ただし、図1と同一の構成となるものについては、図1と同一番号を付し、詳しい説明を省略する。図13の音響符号化装置1300は、聴覚マスキング算出部1301と、拡張レイヤ符号化器1302とを具備し、マスキング効果の特性を利用して、入力信号のスペクトルから聴覚マスキングを算出し、量子化歪をこのマスキング値以下になるようにMDCT係数の量子化を行う点が図1の音響符号化装置と異なる。
【0131】
遅延器105は、入力信号を所定の時間遅延して減算器106と聴覚マスキング算出部1301に出力する。聴覚マスキング算出部1301は、入力信号に基づいて、人間の聴覚では知覚できない範囲を示す聴覚マスキングを算出して拡張レイヤ符号化器1302に出力する。拡張レイヤ符号化器1302は、聴覚マスキングを超える領域について差分信号を符号化して多重化器109に出力する。
【0132】
次に、聴覚マスキング算出部1301の詳細について説明する。図14は、本実施の形態の聴覚マスキング算出部の内部構成の一例を示すブロック図である。図14の聴覚マスキング算出部1301は、FFT部1401と、バークスペクトル算出器1402と、スプレッド関数畳み込み器1403と、トーナリティ算出器1404と、聴覚マスキング算出器1405とから主に構成される。
【0133】
図14において、FFT部1401は、遅延器105から出力された入力信号をフーリエ変換し、フーリエ係数{Re(m),Im(m)}を算出する。ここでmは周波数を表す。
【0134】
バークスペクトル算出器1402は、以下の式(10)を用いてバークスペクトルB(k)を算出する。
【0135】
【数10】
Figure 2004101720
ここで、P(m)はパワースペクトルを表し、以下の式(11)より求められる。
【0136】
【数11】
Figure 2004101720
また、kはバークスペクトルの番号に対応し、FL(k)、FH(k)はそれぞれ第kバークスペクトルの最低周波数(Hz)、最高周波数(Hz)を表す。バークスペクトルB(k)はバークスケール上で等間隔に帯域分割されたときのスペクトル強度を表す。ヘルツスケールをf、バークスケールをBと表したとき、ヘルツスケールとバークスケールの関係は以下の式(12)で表される。
【0137】
【数12】
Figure 2004101720
【0138】
スプレッド関数畳み込み器1403は、バークスペクトルB(k)にスプレッド関数SF(k)を畳み込み、C(k)を算出する。
【0139】
【数13】
Figure 2004101720
【0140】
トーナリティ算出器1404は、以下の式(14)を用い、パワースペクトルP(m)から各バークスペクトルのスペクトル平坦度SFM(k)を求める。
【0141】
【数14】
Figure 2004101720
ここで、μg(k)は第kバークスペクトルの幾何平均、μa(k)は第kバークスペクトルの算術平均を表す。そして、トーナリティ算出器1404は、以下の式(15)を用いてスペクトル平坦度SFM(k)のデシベル値SFMdB(k)からトーナリティ係数α(k)を算出する。
【0142】
【数15】
Figure 2004101720
【0143】
聴覚マスキング算出器1405は、以下の式(16)を用いてトーナリティ算出器1404で算出したトーナリティ係数α(k)から各バークスケールのオフセットO(k)を求める。
【0144】
【数16】
Figure 2004101720
【0145】
そして、聴覚マスキング算出器1405は、以下の式(17)を用いてスプレッド関数畳み込み器1403で求めたC(k)からオフセットO(k)を減算して聴覚マスキングT(k)を算出する。
【0146】
【数17】
Figure 2004101720
ここで、T(k)は絶対閾値を表す。絶対閾値は、人間の聴覚特性として観測される聴覚マスキングの最小値を表す。そして、聴覚マスキング算出器1405は、バークスケールで表される聴覚マスキングT(k)をヘルツスケールM(m)に変換して拡張レイヤ符号化器1302に出力する。
【0147】
このようにして求められた聴覚マスキングM(m)を使って、拡張レイヤ符号化器1302にてMDCT係数の符号化を行う。図15は、本実施の形態の拡張レイヤ符号化器の内部構成の一例を示すブロック図である。図15の拡張レイヤ符号化器1302は、MDCT部1501と、MDCT係数量子化器1502とから主に構成される。
【0148】
MDCT部1501は、フレーム分割器107から出力された入力信号に分析窓を乗じた後、MDCT変換(変形離散コサイン変換)してMDCT係数を求める。MDCT変換は、前後の隣接フレームと分析フレームを半分ずつ完全に重ね合わせ、分析フレームの前半部は奇関数、後半部は偶関数という直交基底を用いる。MDCT変換は、波形を合成する際、逆変換後の波形を重ね合わせて加算することにより、フレーム境界歪が発生しないという特徴がある。MDCTを行う際には、sin窓などの窓関数を入力信号に乗ずる。MDCT係数をX(n)とすると、MDCT係数は、式(9)に従い算出される。
【0149】
MDCT係数量子化器1502は、MDCT部1501から出力された入力信号に聴覚マスキング算出部1301から出力された聴覚マスキングを用いて入力信号を量子化する係数と量子化しない係数に分類し、量子化する係数のみを符号化する。具体的には、MDCT係数量子化器1502は、MDCT係数X(m)と聴覚マスキングM(m)を比較し、M(m)よりも強度が小さいMDCT係数X(m)はマスキング効果により人間の聴覚では知覚されないので無視して符号化の対象から外し、M(m)よりも強度の大きいMDCT係数のみを量子化する。そして、MDCT係数量子化器1502は、量子化したMDCT係数を多重化器109に出力する。
【0150】
このように、本実施の形態の音響符号化装置によれば、マスキング効果の特性を利用して、入力信号のスペクトルから聴覚マスキングを算出し、拡張レイヤの符号化において、量子化歪をこのマスキング値以下になるように量子化を行うことにより、品質の劣化を伴わずに量子化の対象となるMDCT係数の数を減らすことができ、低ビットレートで高品質に符号化を行うことができる。
【0151】
なお、上記実施の形態では、FFTを使った聴覚マスキングの算出法について説明しているが、FFTの代わりMDCTを使って聴覚マスキングを算出することもできる。図16は、本実施の形態の聴覚マスキング算出部の内部構成の一例を示すブロック図である。但し、図14と同一の構成となるものについては、図14と同一番号を付し、詳しい説明を省略する。
【0152】
MDCT部1601は、MDCT係数を使ってパワースペクトルP(m)を近似する。具体的には、MDCT部1601は、以下の式(18)を用いてP(m)を近似する。
【0153】
【数18】
Figure 2004101720
ここで、R(m)は、入力信号をMDCT変換して求めたMDCT係数を表す。
【0154】
バークスペクトル算出器1402は、MDCT部1601において近似されたP(m)からバークスペクトルB(k)を算出する。それ以後は上述した方法に従い聴覚マスキングを算出する。
【0155】
(実施の形態5)
本実施の形態は拡張レイヤ符号化器1302に関し、その特徴は聴覚マスキングを超えるMDCT係数を量子化の対象としたときに、MDCT係数の位置情報を効率よく符号化する方法に関するものである。
【0156】
図17は、本発明の実施の形態5の拡張レイヤ符号化器の内部構成の一例を示すブロック図である。図17は、図13の拡張レイヤ符号化器1302の内部構成の一例を示す図である。図17の拡張レイヤ符号化器1302は、MDCT部1701と、量子化位置決定部1702と、MDCT係数量子化器1703と、量子化位置符号化器1704と、多重化器1705とから主に構成される。
【0157】
MDCT部1701は、フレーム分割器107から出力された入力信号に分析窓を乗じた後、MDCT変換(変形離散コサイン変換)してMDCT係数を求める。MDCT変換は、前後の隣接フレームと分析フレームを半分ずつ完全に重ね合わせ、分析フレームの前半部は奇関数、後半部は偶関数という直交基底を用いる。MDCT変換は、波形を合成する際、逆変換後の波形を重ね合わせて加算することにより、フレーム境界歪が発生しないという特徴がある。MDCTを行う際には、sin窓などの窓関数を入力信号に乗ずる。MDCT係数をX(n)とすると、MDCT係数は、式(9)に従い算出される。
【0158】
MDCT部1701で求められたMDCT係数をX(j,m)と表す。ここでjは拡張フレームのフレーム番号を表し、mは周波数を表す。本実施の形態では、拡張フレームの時間長を基本フレームの時間長の1/8である場合について説明を行うものとする。図18は、MDCT係数の配置の一例を示す図である。MDCT係数X(j,m)は、図18に示すように横軸が時間、縦軸が周波数であるマトリクス上に表すことができる。MDCT部1701は、MDCT係数X(j,m)を量子化位置決定部1702とMDCT係数量子化器1703に出力する。
【0159】
量子化位置決定部1702は、聴覚マスキング算出部1301から出力される聴覚マスキングM(j,m)とMDCT部1701から出力されるMDCT係数X(j,m)を比較し、どの位置のMDCT係数を量子化の対象とすべきか決定する。
【0160】
具体的には、量子化位置決定部1702は、以下の式(19)を満たす場合、X(j,m)を量子化する。
【0161】
【数19】
Figure 2004101720
【0162】
そして、量子化位置決定部1702は、以下の式(20)を満たす場合、X(j,m)を量子化しない。
【0163】
【数20】
Figure 2004101720
【0164】
そして、量子化位置決定部1702は、量子化の対象となるMDCT係数X(j,m)の位置情報をMDCT係数量子化器1703と量子化位置符号化器1704に出力する。ここで、位置情報は、時間jと周波数mの組み合わせを指す。
【0165】
図18では、量子化位置決定部1702で決定された量子化の対象となるMDCT係数X(j,m)の位置を網掛けで表している。この例では、(j,m) = (6,1), (5,3), ・・・, (7,15), (5,16)の位置にあるMDCT係数X(j,m)が量子化の対象となる。
【0166】
なお、ここで聴覚マスキングM(j,m)は拡張フレームに同期させて算出されているものとする。ただし計算量などの制限から、基本フレームに同期させて算出する構成でも良い。この場合、拡張フレームに同期させる場合に比べ聴覚マスキングの算出が1/8で済む。また、この場合、基本フレームで一度聴覚マスキングを求めた後に、同一の聴覚マスキングを全ての拡張フレームに対して使用することになる。
【0167】
MDCT係数量子化器1703は、量子化位置決定部1702で決定された位置のMDCT係数X(j,m)を量子化する。量子化する際に、MDCT係数量子化器1703は、聴覚マスキングM(j,m)の情報を利用し、量子化誤差が聴覚マスキングM(j,m)以下になるように量子化を行う。MDCT係数量子化器1703は、量子化後のMDCT係数をX’(j,m)としたとき、以下の式(21)を満たすように量子化を行う。
【0168】
【数21】
Figure 2004101720
【0169】
そして、MDCT係数量子化器1703は、量子化した後の符号を多重化器1705に出力する。
【0170】
量子化位置符号化器1704は、位置情報を符号化する。例えば、量子化位置符号化器1704は、ランレングス法を適用して位置情報を符号化する。量子化位置符号化器1704は、周波数の低い方から時間軸方向に走査し、符号化の対象となる係数が連続して存在しない区間の数と符号の対象となる係数が連続して存在する区間の数を位置情報とする符号化を行う。
【0171】
具体的には、(j,m)=(1,1)からjが増加する方向に走査し、符号化の対象となる係数があらわれるまでの座標の数を位置情報とする符号化を行う。そして、次に、符号化の対象となる係数までの座標の数をさらに位置情報とする。
【0172】
図18では、(j,m)=(1,1)から最初に符号化の対象となる係数の位置(j,m)=(1,6)までの距離5、次に、符号化の対象となる係数は一つしか連続していないので1、次に符号化しない係数が連続する区間の数14となる。このように、図18では、位置情報を表す符号は、5、1、14、1、4、1、4・・・、5、1、3となる。量子化位置符号化器1704は、この位置情報を多重化器1705に出力する。多重化器1705は、MDCT係数X(j,m)の量子化の情報と位置情報を多重化して多重化器109に出力する。
【0173】
次に、復号化側について説明する。図19は、本発明の実施の形態5の拡張レイヤ復号化器の内部構成の一例を示すブロック図である。図19は、図6の拡張レイヤ復号化器604の内部構成の一例を示す図である。図19の拡張レイヤ復号化器604は、分離器1901と、MDCT係数復号化器1902と、量子化位置復号化器1903と、時間−周波数マトリクス生成器1904と、IMDCT部1905とから主に構成される。
【0174】
分離器1901は、分離器601から出力された第2符号化コードをMDCT係数量子化情報と量子化位置情報に分離し、MDCT係数量子化情報をMDCT係数復号化器1902に出力し、量子化位置情報を量子化位置復号化器1903に出力する。
【0175】
MDCT係数復号化器1902は、分離器1901から出力されるMDCT係数量子化情報からMDCT係数を復号して時間−周波数マトリクス生成器1904に出力する。
【0176】
量子化位置復号化器1903は、分離器1901から出力される量子化位置情報から量子化位置情報を復号して時間−周波数マトリクス生成器1904に出力する。この量子化位置情報は、復号MDCT係数のそれぞれが、時間周波数マトリクスのどこに位置するかを表す情報である。
【0177】
時間−周波数マトリクス生成器1904は、量子化位置復号化器1903から出力される量子化位置情報と、MDCT係数復号化器1902から出力される復号MDCT係数を用いて図18に示すような時間−周波数マトリクスを生成する。図18では、復号MDCT係数が存在する位置を網掛けで表し、復号MDCT係数が存在しない位置を白地で表している。白地の位置では復号MDCT係数が存在しないので、復号MDCT係数としてゼロが与えられる。
【0178】
そして、時間−周波数マトリクス生成器1904は、各拡張フレーム(j=1〜J)毎に復号MDCT係数をIMDCT部1905に出力する。IMDCT部1905は、復号MDCT係数にIMDCTを施し、時間領域の信号を生成して重ね合わせ加算器605に出力する。
【0179】
このように、本実施の形態の音響符号化装置及び音響復号化装置によれば、拡張レイヤにおける符号化において、残差信号を時間領域から周波数領域に変換した後、聴覚マスキングを行って符号化の対象となる係数を決定し、周波数とフレーム数の2次元での係数の位置情報を符号化することにより、符号化の対象となる係数と符号化の対象とならない係数の配置が連続することを利用して情報量を圧縮することができ、低ビットレートで高品質に符号化を行うことができる。
【0180】
(実施の形態6)
図20は、本発明の実施の形態6の拡張レイヤ符号化器の内部構成の一例を示すブロック図である。図20は、図13の拡張レイヤ符号化器1302の内部構成の一例を示す図である。但し、図17と同一の構成となるものについては、図17と同一番号を付し、詳しい説明を省略する。図20の拡張レイヤ符号化器1302は、領域分割器2001と、量子化領域決定部2002と、MDCT係数量子化器2003と、量子化領域符号化器2004とを具備し、聴覚マスキングを超えるMDCT係数を量子化の対象としたときに、MDCT係数の位置情報を効率よく符号化する別の方法に関するものである。
【0181】
領域分割器2001は、MDCT部1701で求められたMDCT係数X(j,m)を複数の領域に分割される。ここでいう領域とは、複数のMDCT係数の位置をまとめたものを指し、符号化器と復号化器の両方に共通の情報としてあらかじめ定められたものである。
【0182】
量子化領域決定部2002は、量子化の対象となる領域を決定する。具体的には、量子化領域決定部2002は、領域をS(k)(k=1〜K)と表したとき、領域S(k)に含まれるMDCT係数X(j,m)の内、このMDCT係数X(j,m)が聴覚マスキングM(m)を超える量の総和を算出し、この総和の大きいものからK’個(K’<K)の領域を選択する。
【0183】
図21は、MDCT係数の配置の一例を示す図である。図21では、領域S(k)の一例を示している。図21の網掛け部は、量子化領域決定部2002で決定された量子化の対象となる領域を表す。この例では、領域S(k)は時間軸方向に4次元、周波数軸方向に2次元の長方形になっており、量子化の対象はS(6)、S(8)、S(11)、S(14)の4領域である。
【0184】
量子化領域決定部2002は、前述したようにMDCT係数X(j,m)が聴覚マスキングM(j,m)を超える量の総和によってどの領域S(k)を量子化の対象とするか決定する。その総和V(k)は、以下の式(22)より求められる。
【0185】
【数22】
Figure 2004101720
この方法では、入力信号によっては高域の領域V(k)が選択されにくくなることもある。そこで、式(22)の代わりに以下の式(23)のようなMDCT係数X(j,m)の強度で正規化する方法を使用しても良い。
【0186】
【数23】
Figure 2004101720
【0187】
そして、量子化領域決定部2002は、量子化の対象となる領域の情報をMDCT係数量子化器2003と量子化領域符号化器2004に出力する。
【0188】
量子化領域符号化器2004は、量子化の対象となる領域に符号1、そうでないない領域に符号0を割り振り、多重化器1705に出力する。図21の場合、符号は0000 0101 0010 0100となる。さらに、この符号をランレングスで表すことも可能である。その場合、得られる符号は5、1、1、1、2、1、2、1、2となる。
【0189】
MDCT係数量子化器2003は、量子化領域決定部2002で決定された領域に含まれるMDCT係数の量子化を行う。量子化の方法としては、領域に含まれるMDCT係数から1つ以上のベクトルを構成し、ベクトル量子化を行う。ベクトル量子化の際、聴覚マスキングM(j,m)で重み付けを行った尺度を用いても良い。
【0190】
次に、復号化側について説明する。図22は、本発明の実施の形態6の拡張レイヤ復号化器の内部構成の一例を示すブロック図である。図22は、図6の拡張レイヤ復号化器604の内部構成の一例を示す図である。図22の拡張レイヤ復号化器604は、分離器2201と、MDCT係数復号化器2202と、量子化領域復号化器2203と、時間−周波数マトリクス生成器2204と、IMDCT部2205とから主に構成される。
【0191】
本実施の形態の特徴は、前述した実施の形態6の拡張レイヤ符号化器1302により生成された符号化コードを復号することができる点にある。
【0192】
分離器2201は、分離器601から出力される第2符号化コードをMDCT係数量子化情報と量子化領域情報に分離し、MDCT係数量子化情報をMDCT係数復号化器2202に出力し、量子化領域情報を量子化領域復号化器2203に出力する。
【0193】
MDCT係数復号化器2202は、分離器2201から得られるMDCT係数量子化情報からMDCT係数を復号する。量子化領域復号化器2203は、分離器2201から得られる量子化領域情報から量子化領域情報を復号する。この量子化領域情報は、復号MDCT係数のそれぞれが、時間周波数マトリクスのどの領域に属するかを表す情報である。
【0194】
時間−周波数マトリクス生成器2204は、量子化領域復号化器2203から得られる量子化領域情報と、MDCT係数復号化器2202から得られる復号MDCT係数を使って図21に示すような時間−周波数マトリクスを生成する。図21では、復号MDCT係数が存在する領域を網掛けで表し、復号MDCT係数が存在しない領域を白地で表している。白地の領域では復号MDCT係数が存在しないので、復号MDCT係数としてゼロが与えられる。
【0195】
そして、時間−周波数マトリクス生成器2204は、各拡張フレーム(j=1〜J)毎に復号MDCT係数をIMDCT部2205に出力する。IMDCT部2205は、復号MDCT係数にIMDCTを施し、時間領域の信号を生成して重ね合わせ加算器605に出力する。
【0196】
このように、本実施の形態の音響符号化装置及び音響復号化装置によれば、聴覚マスキングを超える残差信号が存在する時間領域と周波数領域の位置情報をグループ単位とすることにより、少ないビット数で符号化の対象となった領域の位置を表すことができるため、低ビットレート化を図ることができる。
【0197】
(実施の形態7)
次に、本発明の実施の形態7について、図面を参照して説明する。図23は、本発明の実施の形態7に係る通信装置の構成を示すブロック図である。図23における信号処理装置2303は前述した実施の形態1から実施の形態6に示した音響符号化装置の中の1つによって構成されている点に本実施の形態の特徴がある。
【0198】
図23に示すように、本発明の実施の形態7に係る通信装置2300は、入力装置2301、A/D変換装置2302及びネットワーク2304に接続されている信号処理装置2303を具備している。
【0199】
A/D変換装置2302は、入力装置2301の出力端子に接続されている。信号処理装置2303の入力端子は、A/D変換装置2302の出力端子に接続されている。信号処理装置2303の出力端子はネットワーク2304に接続されている。
【0200】
入力装置2301は、人間の耳に聞こえる音波を電気的信号であるアナログ信号に変換してA/D変換装置2302に与える。A/D変換装置2302はアナログ信号をディジタル信号に変換して信号処理装置2303に与える。信号処理装置2303は入力されてくるディジタル信号を符号化してコードを生成し、ネットワーク2304に出力する。
【0201】
このように、本発明の実施の形態の通信装置によれば、通信において前述した実施の形態1〜6に示したような効果を享受でき、少ないビット数で効率よく音響信号を符号化する音響符号化装置を提供することができる。
【0202】
(実施の形態8)
次に、本発明の実施の形態8について、図面を参照して説明する。図24は、本発明の実施の形態8に係る通信装置の構成を示すブロック図である。図24における信号処理装置2403は前述した実施の形態1から実施の形態6に示した音響復号化装置の中の1つによって構成されている点に本実施の形態の特徴がある。
【0203】
図24に示すように、本発明の実施の形態8に係る通信装置2400は、ネットワーク2401に接続されている受信装置2402、信号処理装置2403、及びD/A変換装置2404及び出力装置2405を具備している。
【0204】
受信装置2402の入力端子は、ネットワーク2401に接続されている。信号処理装置2403の入力端子は、受信装置2402の出力端子に接続されている。D/A変換装置2404の入力端子は、信号処理装置2403の出力端子に接続されている。出力装置2405の入力端子は、D/A変換装置2404の出力端子に接続されている。
【0205】
受信装置2402は、ネットワーク2401からのディジタルの符号化音響信号を受けてディジタルの受信音響信号を生成して信号処理装置2403に与える。信号処理装置2403は、受信装置2402からの受信音響信号を受けてこの受信音響信号に復号化処理を行ってディジタルの復号化音響信号を生成してD/A変換装置2404に与える。D/A変換装置2404は、信号処理装置2403からのディジタルの復号化音声信号を変換してアナログの復号化音声信号を生成して出力装置2405に与える。出力装置2405は、電気的信号であるアナログの復号化音響信号を空気の振動に変換して音波として人間の耳に聴こえるように出力する。
【0206】
このように、本実施の形態の通信装置によれば、通信において前述した実施の形態1〜6に示したような効果を享受でき、少ないビット数で効率よく符号化された音響信号を復号することができるので、良好な音響信号を出力することができる。
【0207】
(実施の形態9)
次に、本発明の実施の形態9について、図面を参照して説明する。図25は、本発明の実施の形態9に係る通信装置の構成を示すブロック図である。本発明の実施の形態9において、図25における信号処理装置2503は、前述した実施の形態1から実施の形態6に示した音響符号化手段の中の1つによって構成されている点に本実施の形態の特徴がある。
【0208】
図25に示すように、本発明の実施の形態9に係る通信装置2500は、入力装置2501、A/D変換装置2502、信号処理装置2503、RF変調装置2504及びアンテナ2505を具備している。
【0209】
入力装置2501は人間の耳に聞こえる音波を電気的信号であるアナログ信号に変換してA/D変換装置2502に与える。A/D変換装置2502はアナログ信号をディジタル信号に変換して信号処理装置2503に与える。信号処理装置2503は入力されてくるディジタル信号を符号化して符号化音響信号を生成し、RF変調装置2504に与える。RF変調装置2504は、符号化音響信号を変調して変調符号化音響信号を生成し、アンテナ2505に与える。アンテナ2505は、変調符号化音響信号を電波として送信する。
【0210】
このように、本実施の形態の通信装置によれば、無線通信において前述した実施の形態1〜6に示したような効果を享受でき、少ないビット数で効率よく音響信号を符号化することができる。
【0211】
なお、本発明は、オーディオ信号を用いる送信装置、送信符号化装置又は音響信号符号化装置に適用することができる。また、本発明は、移動局装置又は基地局装置にも適用することができる。
【0212】
(実施の形態10)
次に、本発明の実施の形態10について、図面を参照して説明する。図26は、本発明の実施の形態10に係る通信装置の構成を示すブロック図である。本発明の実施の形態10において、図26における信号処理装置2603は、前述した実施の形態1から実施の形態6に示した音響復号化手段の中の1つによって構成されている点に本実施の形態の特徴がある。
【0213】
図26に示すように、本発明の実施の形態10に係る通信装置2600は、アンテナ2601、RF復調装置2602、信号処理装置2603、D/A変換装置2604及び出力装置2605を具備している。
【0214】
アンテナ2601は、電波としてのディジタルの符号化音響信号を受けて電気信号のディジタルの受信符号化音響信号を生成してRF復調装置2602に与える。RF復調装置2602は、アンテナ2601からの受信符号化音響信号を復調して復調符号化音響信号を生成して信号処理装置2603に与える。
【0215】
信号処理装置2603は、RF復調装置2602からのディジタルの復調符号化音響信号を受けて復号化処理を行ってディジタルの復号化音響信号を生成してD/A変換装置2604に与える。D/A変換装置2604は、信号処理装置2603からのディジタルの復号化音声信号を変換してアナログの復号化音声信号を生成して出力装置2605に与える。出力装置2605は、電気的信号であるアナログの復号化音声信号を空気の振動に変換して音波として人間の耳に聴こえるように出力する。
【0216】
このように、本実施の形態の通信装置によれば、無線通信において前述した実施の形態1〜6に示したような効果を享受でき、少ないビット数で効率よく符号化された音響信号を復号することができるので、良好な音響信号を出力することができる。
【0217】
なお、本発明は、オーディオ信号を用いる受信装置、受信復号化装置又は音声信号復号化装置に適用することができる。また、本発明は、移動局装置又は基地局装置にも適用することができる。
【0218】
また、本発明は上記実施の形態に限定されず、種々変更して実施することが可能である。例えば、上記実施の形態では、信号処理装置として行う場合について説明しているが、これに限られるものではなく、この信号処理方法をソフトウェアとして行うことも可能である。
【0219】
例えば、上記信号処理方法を実行するプログラムを予めROM(Read Only Memory)に格納しておき、そのプログラムをCPU(Central Processor Unit)によって動作させるようにしても良い。
【0220】
また、上記信号処理方法を実行するプログラムをコンピュータで読み取り可能な記憶媒体に格納し、記憶媒体に格納されたプログラムをコンピュータのRAM(Random Access memory)に記録して、コンピュータをそのプログラムにしたがって動作させるようにしても良い。
【0221】
なお、上記説明では、時間領域から周波数領域への変換法にMDCTを用いる場合について説明を行っているがこれに限定されず直交変換であればいずれも適用できる。例えば、離散フーリエ変換または離散コサイン変換等を適用することもできる。
【0222】
なお、本発明は、オーディオ信号を用いる受信装置、受信復号化装置又は音声信号復号化装置に適用することができる。また、本発明は、移動局装置又は基地局装置にも適用することができる。
【0223】
【発明の効果】
以上説明したように、本発明の音響符号化装置及び音響符号化方法によれば、拡張レイヤのフレームの時間長を基本レイヤのフレームの時間長より短く設定して拡張レイヤの符号化を行うことにより、音声が主体で背景に音楽や雑音が重畳しているような信号であっても、遅延が短く低ビットレートで高品質に符号化を行うことができる。
【図面の簡単な説明】
【図1】本発明の実施の形態1に係る音響符号化装置の構成を示すブロック図
【図2】音響信号の情報の分布の一例を示す図
【図3】基本レイヤと拡張レイヤで符号化の対象とする領域の一例を示す図
【図4】基本レイヤと拡張レイヤの符号化の一例を示す図
【図5】基本レイヤと拡張レイヤの復号化の一例を示す図
【図6】本発明の実施の形態1に係る音響復号化装置の構成を示すブロック図
【図7】本発明の実施の形態2の基本レイヤ符号化器の内部構成の一例を示すブロック図
【図8】本発明の実施の形態2の基本レイヤ復号化器の内部構成の一例を示すブロック図
【図9】本発明の実施の形態2の基本レイヤ復号化器の内部構成の一例を示すブロック図
【図10】本発明の実施の形態3の拡張レイヤ符号化器の内部構成の一例を示すブロック図
【図11】MDCT係数の配置の一例を示す図
【図12】本発明の実施の形態3の拡張レイヤ復号化器の内部構成の一例を示すブロック図
【図13】本発明の本発明の実施の形態4に係る音響符号化装置の構成を示すブロック図
【図14】上記実施の形態の聴覚マスキング算出部の内部構成の一例を示すブロック図
【図15】上記実施の形態の拡張レイヤ符号化器の内部構成の一例を示すブロック図
【図16】上記実施の形態の聴覚マスキング算出部の内部構成の一例を示すブロック図
【図17】本発明の実施の形態5の拡張レイヤ符号化器の内部構成の一例を示すブロック図
【図18】MDCT係数の配置の一例を示す図
【図19】本発明の実施の形態5の拡張レイヤ復号化器の内部構成の一例を示すブロック図
【図20】本発明の実施の形態6の拡張レイヤ符号化器の内部構成の一例を示すブロック図
【図21】MDCT係数の配置の一例を示す図
【図22】本発明の実施の形態6の拡張レイヤ復号化器の内部構成の一例を示すブロック図
【図23】本発明の実施の形態7に係る通信装置の構成を示すブロック図
【図24】本発明の実施の形態8に係る通信装置の構成を示すブロック図
【図25】本発明の実施の形態9に係る通信装置の構成を示すブロック図
【図26】本発明の実施の形態10に係る通信装置の構成を示すブロック図
【図27】従来の音声符号化における基本レイヤのフレーム(基本フレーム)と拡張レイヤのフレーム(拡張フレーム)の一例を示す図
【図28】従来の音声復号化における基本レイヤのフレーム(基本フレーム)と拡張レイヤのフレーム(拡張フレーム)の一例を示す図
【符号の説明】
101 ダウンサンプリング器
102 基本レイヤ符号化器
103 局所復号化器
104 アップサンプリング器
105 遅延器
106 減算器
107 フレーム分割器
108、1302 拡張レイヤ符号化器
109、1705 多重化器
601、1901、2201 分離器
602 基本レイヤ復号化器
603 アップサンプリング器
604 拡張レイヤ復号化器
605 重ね合わせ加算器
606 加算器
1001、1501、1601、1701 MDCT部
1002 量子化器
1201、1902、2202 MDCT係数復号化器
1202、1905、2205 IMDCT部
1301 聴覚マスキング算出部
1401 FFT部
1402 バークスペクトル算出器
1403 スプレッド関数畳み込み器
1404 トーナリティ算出器
1405 聴覚マスキング算出器
1502、1703、2003 MDCT係数量子化器
1702 量子化位置決定部
1704 量子化位置符号化器
1903 量子化位置復号化器
1904、2204 時間周波数マトリクス生成器
2001 領域分割器
2002 量子化領域決定部
2004 量子化領域符号化器
2203 量子化領域復号化器

Claims (20)

  1. 入力信号のサンプリングレートを下げるダウンサンプリング手段と、サンプリングレートが下げられた入力信号を所定の基本フレーム単位で符号化する基本レイヤ符号化手段と、符号化された入力信号を復号化して復号信号を得る復号化手段と、前記復号信号のサンプリングレートを入力時の入力信号のサンプリングレートと同一のレートに上げるアップサンプリング手段と、入力時の入力信号とサンプリングレートが上げられた復号信号との差分信号を得る減算手段と、前記基本フレームより時間長が短い拡張フレーム単位で前記差分信号を符号化する拡張レイヤ符号化手段と、を具備することを特徴とする音響符号化装置。
  2. 基本フレーム単位の差分信号を拡張フレーム単位に分割するフレーム分割手段を具備し、前記拡張レイヤ符号化手段は分割された差分信号を符号化することを特徴とする請求項1に記載の音響符号化装置。
  3. 前記基本レイヤ符号化手段は、符号励振線形予測法を用いて入力信号を符号化することを特徴とする請求項1または請求項2に記載の音響符号化装置。
  4. 前記拡張レイヤ符号化手段は、前記差分信号を時間領域から周波数領域に直交変換し、変換後の前記差分信号を符号化することを特徴とする請求項1から請求項3のいずれかに記載の音響符号化装置。
  5. 前記拡張レイヤ符号化手段は、変形離散コサイン変換を用いて前記差分信号を時間領域から周波数領域に変換することを特徴とする請求項4に記載の音響符号化装置。
  6. 前記拡張レイヤ符号化手段は、周波数領域に変換した前記差分信号を所定の帯域のみ符号化することを特徴とする請求項4または請求項5記載の音響符号化装置。
  7. 聴覚に寄与しない振幅値を表す聴覚マスキングを算出する聴覚マスキング手段を具備し、前記拡張レイヤ符号化手段は、前記聴覚マスキング内の信号を符号化の対象としないことを特徴とする請求項4から請求項6のいずれかに記載の音響符号化装置。
  8. 前記拡張レイヤ符号化手段は、聴覚マスキングと残差信号の差をとり、この差が相対的に大きい残差信号を符号化の対象とし、前記残差信号が存在する時間領域と周波数領域の位置を符号化することを特徴とする請求項7に記載の音響符号化装置。
  9. 前記拡張レイヤ符号化手段は、時間領域と周波数領域の一方または両方において、それぞれ複数の領域を一つのグループとし、聴覚マスキングと残差信号の差を前記グループ単位で算出し、この差が相対的に大きいグループに含まれる残差信号のみを符号化することを特徴とする請求項8に記載の音響符号化装置。
  10. 符号化側において入力信号を所定の基本フレーム単位で符号化した第1符号化コードを復号化して第1復号信号を得る基本レイヤ復号化手段と、入力信号と符号化側において第1符号化コードを復号した信号との残差信号を前記基本フレームより時間長が短い拡張フレーム単位で符号化した第2符号化コードを復号化して第2復号信号を得る拡張レイヤ復号化手段と、第1復号信号のサンプリングレートを前記第2復号信号のサンプリングレートと同一のサンプリングレートに上げるアップサンプリング手段と、前記第2復号信号とサンプリングレートを上げられた第1復号信号を加算する加算手段と、を具備することを特徴とする音響復号化装置。
  11. 基本レイヤ復号化手段は、符号励振線形予測法を用いて第1符号化コードを復号化することを特徴とする請求項10に記載の音響復号化装置。
  12. 拡張レイヤ復号化手段は、第2符号化コードを復号化した信号を周波数領域から時間領域に直交変換することを特徴とする請求項10または請求項11に記載の音響復号化装置。
  13. 第2復号信号同士を同じタイミングで符号化したフレーム部分を重ね合わせる重ね合わせ加算手段を具備し、前記拡張レイヤ復号化手段は、前記第2符号化コードを復号した信号に変形離散コサイン逆変換を用いて周波数領域から時間領域に直交変換することにより前記第2復号信号を復号して前記加算手段に出力し、加算手段は、前記重ね合わせ手段において重ね合わされた第2復号信号と前記第1復号信号とを加算することを特徴とする請求項12に記載の音響復号化装置。
  14. 前記拡張レイヤ復号化手段は、第2符号化コードから残差信号が存在する時間領域と周波数領域との情報を復号し、前記残差信号が存在する時間領域と周波数領域を復号化することを特徴とする請求項12または請求項13に記載の音響復号化装置。
  15. 前記拡張レイヤ復号化手段は、時間領域と周波数領域の一方または両方において、それぞれ複数の領域を一つのグループとし、復号の対象となるグループに含まれる残差信号を復号化することを特徴とする請求項14に記載の音響復号化装置。
  16. 音響信号を電気的信号に変換する音響入力手段と、この音響入力手段から出力された信号をディジタル信号に変換するA/D変換手段と、このA/D変換手段から出力されたディジタル信号を符号化する請求項1から請求項9のいずれかに記載の音響符号化装置と、この符号化装置から出力された符号化コードを無線周波数の信号に変調するRF変調手段と、このRF変調手段から出力された信号を電波に変換して送信する送信アンテナとを具備することを特徴とする音響信号送信装置。
  17. 電波を受信する受信アンテナと、この受信アンテナに受信された信号を復調するRF復調手段と、このRF復調手段にて得られた情報を復号する請求項10から請求項15のいずれかに記載の音響復号化装置と、この復号化装置から出力された信号をアナログ信号に変換するD/A変換手段と、このD/A変換手段から出力された電気的信号を音響信号に変換する音響出力手段とを具備することを特徴とする音響信号受信装置。
  18. 請求項16記載の音響信号送信装置あるいは請求項17記載の音響信号受信装置の少なくとも一方を具備することを特徴とする通信端末装置。
  19. 請求項16記載の音響信号送信装置あるいは請求項17記載の音響信号受信装置の少なくとも一方を具備することを特徴とする基地局装置。
  20. 符号化側において、所定の基本フレーム単位で入力信号を符号化して第1符号化コードを作成し、符号化された前記入力信号を復号化して第1復号信号を得て、前記入力信号と前記復号信号との差分信号を得て、前記基本フレームより時間長が短い拡張フレーム単位で前記差分信号を符号化して第2符号化コードを作成し、復号化側において、前記第1符号化コードを復号化して第2復号信号を得て、前記第2符号化コードを復号化して第3復号信号を得て、前記第2復号信号と前記第3復号信号を加算することを特徴とする音響符号化方法。
JP2002261549A 2002-09-06 2002-09-06 音響符号化装置及び音響符号化方法 Expired - Lifetime JP3881943B2 (ja)

Priority Applications (7)

Application Number Priority Date Filing Date Title
JP2002261549A JP3881943B2 (ja) 2002-09-06 2002-09-06 音響符号化装置及び音響符号化方法
US10/526,566 US7996233B2 (en) 2002-09-06 2003-08-12 Acoustic coding of an enhancement frame having a shorter time length than a base frame
CNB038244144A CN100454389C (zh) 2002-09-06 2003-08-12 声音编码设备和声音编码方法
CN2008101831098A CN101425294B (zh) 2002-09-06 2003-08-12 声音编解码与发送接收设备及编码方法、通信终端和基站
PCT/JP2003/010247 WO2004023457A1 (ja) 2002-09-06 2003-08-12 音響符号化装置及び音響符号化方法
EP03794081A EP1533789A4 (en) 2002-09-06 2003-08-12 METHOD AND DEVICE FOR CODING SOUNDS
AU2003257824A AU2003257824A1 (en) 2002-09-06 2003-08-12 Sound encoding apparatus and sound encoding method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002261549A JP3881943B2 (ja) 2002-09-06 2002-09-06 音響符号化装置及び音響符号化方法

Publications (2)

Publication Number Publication Date
JP2004101720A true JP2004101720A (ja) 2004-04-02
JP3881943B2 JP3881943B2 (ja) 2007-02-14

Family

ID=31973133

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002261549A Expired - Lifetime JP3881943B2 (ja) 2002-09-06 2002-09-06 音響符号化装置及び音響符号化方法

Country Status (6)

Country Link
US (1) US7996233B2 (ja)
EP (1) EP1533789A4 (ja)
JP (1) JP3881943B2 (ja)
CN (2) CN101425294B (ja)
AU (1) AU2003257824A1 (ja)
WO (1) WO2004023457A1 (ja)

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005112001A1 (ja) * 2004-05-19 2005-11-24 Matsushita Electric Industrial Co., Ltd. 符号化装置、復号化装置、およびこれらの方法
WO2006030865A1 (ja) * 2004-09-17 2006-03-23 Matsushita Electric Industrial Co., Ltd. スケーラブル符号化装置、スケーラブル復号化装置、スケーラブル符号化方法、スケーラブル復号化方法、通信端末装置および基地局装置
JP2006119363A (ja) * 2004-10-21 2006-05-11 Casio Comput Co Ltd 音声符号化装置、音声復号装置、音声符号化方法及び音声復号方法
WO2006062202A1 (ja) * 2004-12-10 2006-06-15 Matsushita Electric Industrial Co., Ltd. 広帯域符号化装置、広帯域lsp予測装置、帯域スケーラブル符号化装置及び広帯域符号化方法
WO2006075663A1 (ja) * 2005-01-14 2006-07-20 Matsushita Electric Industrial Co., Ltd. 音声切替装置および音声切替方法
KR100738077B1 (ko) 2005-09-28 2007-07-12 삼성전자주식회사 계층적 오디오 부호화 및 복호화 장치와 방법
JPWO2005106850A1 (ja) * 2004-04-28 2007-12-13 松下電器産業株式会社 階層符号化装置および階層符号化方法
JPWO2006028009A1 (ja) * 2004-09-06 2008-05-08 松下電器産業株式会社 スケーラブル復号化装置および信号消失補償方法
JPWO2006090852A1 (ja) * 2005-02-24 2008-07-24 松下電器産業株式会社 データ再生装置
WO2008120440A1 (ja) * 2007-03-02 2008-10-09 Panasonic Corporation 符号化装置および符号化方法
JP2011507440A (ja) * 2007-12-21 2011-03-03 フランス・テレコム 適応型ウィンドウを有する変換ベースの符号化/復号化
JP2012168494A (ja) * 2010-04-13 2012-09-06 Sony Corp 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
KR101471978B1 (ko) * 2007-02-02 2014-12-12 삼성전자주식회사 오디오 신호의 음질 향상을 위한 데이터 삽입 방법 및 그장치
US9208795B2 (en) 2009-10-07 2015-12-08 Sony Corporation Frequency band extending device and method, encoding device and method, decoding device and method, and program
US9390717B2 (en) 2011-08-24 2016-07-12 Sony Corporation Encoding device and method, decoding device and method, and program
US9583112B2 (en) 2010-04-13 2017-02-28 Sony Corporation Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program
US9659573B2 (en) 2010-04-13 2017-05-23 Sony Corporation Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program
JP2017122925A (ja) * 2010-04-13 2017-07-13 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP2017151454A (ja) * 2013-01-29 2017-08-31 フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. 低複雑度の調性適応音声信号量子化
US9767824B2 (en) 2010-10-15 2017-09-19 Sony Corporation Encoding device and method, decoding device and method, and program
US9875746B2 (en) 2013-09-19 2018-01-23 Sony Corporation Encoding device and method, decoding device and method, and program
US10692511B2 (en) 2013-12-27 2020-06-23 Sony Corporation Decoding apparatus and method, and program

Families Citing this family (55)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8446947B2 (en) * 2003-10-10 2013-05-21 Agency For Science, Technology And Research Method for encoding a digital signal into a scalable bitstream; method for decoding a scalable bitstream
US7536302B2 (en) * 2004-07-13 2009-05-19 Industrial Technology Research Institute Method, process and device for coding audio signals
JP2006243043A (ja) * 2005-02-28 2006-09-14 Sanyo Electric Co Ltd 高域補間装置及び再生装置
US20090210219A1 (en) * 2005-05-30 2009-08-20 Jong-Mo Sung Apparatus and method for coding and decoding residual signal
WO2007090988A2 (fr) * 2006-02-06 2007-08-16 France Telecom Procede et dispositif de codage hierarchique d'un signal audio source, procede et dispositif de decodage, programmes et signal correspondants
WO2007102782A2 (en) * 2006-03-07 2007-09-13 Telefonaktiebolaget Lm Ericsson (Publ) Methods and arrangements for audio coding and decoding
WO2007105586A1 (ja) * 2006-03-10 2007-09-20 Matsushita Electric Industrial Co., Ltd. 符号化装置および符号化方法
US7610195B2 (en) * 2006-06-01 2009-10-27 Nokia Corporation Decoding of predictively coded data using buffer adaptation
CN101479788B (zh) * 2006-06-29 2012-01-11 Nxp股份有限公司 声音帧长度适配
US20080059154A1 (en) * 2006-09-01 2008-03-06 Nokia Corporation Encoding an audio signal
US7461106B2 (en) 2006-09-12 2008-12-02 Motorola, Inc. Apparatus and method for low complexity combinatorial coding of signals
US8214202B2 (en) * 2006-09-13 2012-07-03 Telefonaktiebolaget L M Ericsson (Publ) Methods and arrangements for a speech/audio sender and receiver
JPWO2008072732A1 (ja) * 2006-12-14 2010-04-02 パナソニック株式会社 音声符号化装置および音声符号化方法
US8560328B2 (en) * 2006-12-15 2013-10-15 Panasonic Corporation Encoding device, decoding device, and method thereof
RU2459283C2 (ru) * 2007-03-02 2012-08-20 Панасоник Корпорэйшн Кодирующее устройство, декодирующее устройство и способ
JP4708446B2 (ja) * 2007-03-02 2011-06-22 パナソニック株式会社 符号化装置、復号装置およびそれらの方法
WO2008151137A2 (en) * 2007-06-01 2008-12-11 The Trustees Of Columbia University In The City Of New York Real-time time encoding and decoding machines
JP5282906B2 (ja) 2007-06-27 2013-09-04 日本電気株式会社 多地点接続装置、信号分析及び装置と、その方法及びプログラム
WO2009006405A1 (en) 2007-06-28 2009-01-08 The Trustees Of Columbia University In The City Of New York Multi-input multi-output time encoding and decoding machines
US8576096B2 (en) * 2007-10-11 2013-11-05 Motorola Mobility Llc Apparatus and method for low complexity combinatorial coding of signals
US8209190B2 (en) 2007-10-25 2012-06-26 Motorola Mobility, Inc. Method and apparatus for generating an enhancement layer within an audio coding system
US7889103B2 (en) 2008-03-13 2011-02-15 Motorola Mobility, Inc. Method and apparatus for low complexity combinatorial coding of signals
US8639519B2 (en) 2008-04-09 2014-01-28 Motorola Mobility Llc Method and apparatus for selective signal coding based on core encoder performance
WO2010070187A1 (en) * 2008-12-19 2010-06-24 Nokia Corporation An apparatus, a method and a computer program for coding
US8175888B2 (en) 2008-12-29 2012-05-08 Motorola Mobility, Inc. Enhanced layered gain factor balancing within a multiple-channel audio coding system
US8200496B2 (en) 2008-12-29 2012-06-12 Motorola Mobility, Inc. Audio signal decoder and method for producing a scaled reconstructed audio signal
US8219408B2 (en) 2008-12-29 2012-07-10 Motorola Mobility, Inc. Audio signal decoder and method for producing a scaled reconstructed audio signal
US8140342B2 (en) 2008-12-29 2012-03-20 Motorola Mobility, Inc. Selective scaling mask computation based on peak detection
CN101771417B (zh) * 2008-12-30 2012-04-18 华为技术有限公司 信号编码、解码方法及装置、***
EP2237269B1 (en) * 2009-04-01 2013-02-20 Motorola Mobility LLC Apparatus and method for processing an encoded audio data signal
WO2011048810A1 (ja) * 2009-10-20 2011-04-28 パナソニック株式会社 ベクトル量子化装置及びベクトル量子化方法
KR101309671B1 (ko) * 2009-10-21 2013-09-23 돌비 인터네셔널 에이비 결합된 트랜스포저 필터 뱅크에서의 오버샘플링
US8442837B2 (en) 2009-12-31 2013-05-14 Motorola Mobility Llc Embedded speech and audio coding using a switchable model core
CN102131081A (zh) * 2010-01-13 2011-07-20 华为技术有限公司 混合维度编解码方法和装置
US8423355B2 (en) 2010-03-05 2013-04-16 Motorola Mobility Llc Encoder for audio signal including generic audio and speech frames
US8428936B2 (en) 2010-03-05 2013-04-23 Motorola Mobility Llc Decoder for audio signal including generic audio and speech frames
AU2011241424B2 (en) * 2010-04-14 2016-05-05 Voiceage Evs Llc Flexible and scalable combined innovation codebook for use in CELP coder and decoder
KR20130088756A (ko) * 2010-06-21 2013-08-08 파나소닉 주식회사 복호 장치, 부호화 장치 및 이러한 방법
US20130173275A1 (en) * 2010-10-18 2013-07-04 Panasonic Corporation Audio encoding device and audio decoding device
US8805697B2 (en) * 2010-10-25 2014-08-12 Qualcomm Incorporated Decomposition of music signals using basis functions with time-evolution information
FR2969805A1 (fr) * 2010-12-23 2012-06-29 France Telecom Codage bas retard alternant codage predictif et codage par transformee
WO2012109407A1 (en) 2011-02-09 2012-08-16 The Trustees Of Columbia University In The City Of New York Encoding and decoding machine with recurrent neural networks
EP2727108B1 (en) * 2011-07-01 2015-09-09 Dolby Laboratories Licensing Corporation Sample rate scalable lossless audio coding
CN103325373A (zh) 2012-03-23 2013-09-25 杜比实验室特许公司 用于传送和接收音频信号的方法和设备
JP5619326B2 (ja) * 2012-06-21 2014-11-05 三菱電機株式会社 符号化装置、復号装置、符号化方法、符号化プログラム、復号方法および復号プログラム
US9129600B2 (en) 2012-09-26 2015-09-08 Google Technology Holdings LLC Method and apparatus for encoding an audio signal
US9357211B2 (en) * 2012-12-28 2016-05-31 Qualcomm Incorporated Device and method for scalable and multiview/3D coding of video information
EP2922057A1 (en) * 2014-03-21 2015-09-23 Thomson Licensing Method for compressing a Higher Order Ambisonics (HOA) signal, method for decompressing a compressed HOA signal, apparatus for compressing a HOA signal, and apparatus for decompressing a compressed HOA signal
CN105869652B (zh) * 2015-01-21 2020-02-18 北京大学深圳研究院 心理声学模型计算方法和装置
EP3182411A1 (en) * 2015-12-14 2017-06-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing an encoded audio signal
US20180336469A1 (en) * 2017-05-18 2018-11-22 Qualcomm Incorporated Sigma-delta position derivative networks
CN108922550A (zh) * 2018-07-04 2018-11-30 全童科教(东莞)有限公司 一种采用摩斯声码控制机器人移动的方法及***
CN113113032A (zh) * 2020-01-10 2021-07-13 华为技术有限公司 一种音频编解码方法和音频编解码设备
CN114945981A (zh) * 2020-06-24 2022-08-26 华为技术有限公司 一种音频信号处理方法和装置
CN113782043B (zh) * 2021-09-06 2024-06-14 北京捷通华声科技股份有限公司 语音采集方法、装置、电子设备及计算机可读存储介质

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5675705A (en) * 1993-09-27 1997-10-07 Singhal; Tara Chand Spectrogram-feature-based speech syllable and word recognition using syllabic language dictionary
JPH0846517A (ja) * 1994-07-28 1996-02-16 Sony Corp 高能率符号化及び復号化システム
JP3139602B2 (ja) * 1995-03-24 2001-03-05 日本電信電話株式会社 音響信号符号化方法及び復号化方法
JP3152109B2 (ja) * 1995-05-30 2001-04-03 日本ビクター株式会社 オーディオ信号の圧縮伸張方法
JP3653826B2 (ja) * 1995-10-26 2005-06-02 ソニー株式会社 音声復号化方法及び装置
JP3849210B2 (ja) * 1996-09-24 2006-11-22 ヤマハ株式会社 音声符号化復号方式
JP3329216B2 (ja) * 1997-01-27 2002-09-30 日本電気株式会社 音声符号化装置及び音声復号装置
JPH10285046A (ja) * 1997-04-08 1998-10-23 Sony Corp 情報信号処理装置、情報信号記録装置及び情報信号再生装置
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
JP3134817B2 (ja) * 1997-07-11 2001-02-13 日本電気株式会社 音声符号化復号装置
JPH11130997A (ja) 1997-10-28 1999-05-18 Mitsubishi Chemical Corp 記録液
KR100304092B1 (ko) 1998-03-11 2001-09-26 마츠시타 덴끼 산교 가부시키가이샤 오디오 신호 부호화 장치, 오디오 신호 복호화 장치 및 오디오 신호 부호화/복호화 장치
JP3344962B2 (ja) 1998-03-11 2002-11-18 松下電器産業株式会社 オーディオ信号符号化装置、及びオーディオ信号復号化装置
WO1999050828A1 (en) * 1998-03-30 1999-10-07 Voxware, Inc. Low-complexity, low-delay, scalable and embedded speech and audio coding with adaptive frame loss concealment
JP3541680B2 (ja) * 1998-06-15 2004-07-14 日本電気株式会社 音声音楽信号の符号化装置および復号装置
US6266644B1 (en) * 1998-09-26 2001-07-24 Liquid Audio, Inc. Audio encoding apparatus and methods
JP4173940B2 (ja) * 1999-03-05 2008-10-29 松下電器産業株式会社 音声符号化装置及び音声符号化方法
DE60017825T2 (de) * 1999-03-23 2006-01-12 Nippon Telegraph And Telephone Corp. Verfahren und Vorrichtung zur Kodierung und Dekodierung von Audiosignalen und Aufzeichnungsträger mit Programmen dafür
US6246345B1 (en) * 1999-04-16 2001-06-12 Dolby Laboratories Licensing Corporation Using gain-adaptive quantization and non-uniform symbol lengths for improved audio coding
US6446037B1 (en) * 1999-08-09 2002-09-03 Dolby Laboratories Licensing Corporation Scalable coding method for high quality audio
JP3559488B2 (ja) 2000-02-16 2004-09-02 日本電信電話株式会社 音響信号の階層符号化方法及び復号化方法
FI109393B (fi) * 2000-07-14 2002-07-15 Nokia Corp Menetelmä mediavirran enkoodaamiseksi skaalautuvasti, skaalautuva enkooderi ja päätelaite
US7606703B2 (en) * 2000-11-15 2009-10-20 Texas Instruments Incorporated Layered celp system and method with varying perceptual filter or short-term postfilter strengths
TW490655B (en) * 2000-12-27 2002-06-11 Winbond Electronics Corp Method and device for recognizing authorized users using voice spectrum information
DE10102159C2 (de) * 2001-01-18 2002-12-12 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Erzeugen bzw. Decodieren eines skalierbaren Datenstroms unter Berücksichtigung einer Bitsparkasse, Codierer und skalierbarer Codierer
DE10102155C2 (de) * 2001-01-18 2003-01-09 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Erzeugen eines skalierbaren Datenstroms und Verfahren und Vorrichtung zum Decodieren eines skalierbaren Datenstroms
US6973574B2 (en) * 2001-04-24 2005-12-06 Microsoft Corp. Recognizer of audio-content in digital signals
US7136418B2 (en) * 2001-05-03 2006-11-14 University Of Washington Scalable and perceptually ranked signal coding and decoding
US6934676B2 (en) * 2001-05-11 2005-08-23 Nokia Mobile Phones Ltd. Method and system for inter-channel signal redundancy removal in perceptual audio coding
US6979236B1 (en) * 2004-07-07 2005-12-27 Fci Americas Technology, Inc. Wedge connector assembly

Cited By (59)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4679513B2 (ja) * 2004-04-28 2011-04-27 パナソニック株式会社 階層符号化装置および階層符号化方法
JPWO2005106850A1 (ja) * 2004-04-28 2007-12-13 松下電器産業株式会社 階層符号化装置および階層符号化方法
JP5013863B2 (ja) * 2004-05-19 2012-08-29 パナソニック株式会社 符号化装置、復号化装置、通信端末装置、基地局装置、符号化方法及び復号化方法
CN1954363B (zh) * 2004-05-19 2011-10-12 松下电器产业株式会社 编码装置和编码方法
WO2005112001A1 (ja) * 2004-05-19 2005-11-24 Matsushita Electric Industrial Co., Ltd. 符号化装置、復号化装置、およびこれらの方法
US8688440B2 (en) 2004-05-19 2014-04-01 Panasonic Corporation Coding apparatus, decoding apparatus, coding method and decoding method
US8463602B2 (en) 2004-05-19 2013-06-11 Panasonic Corporation Encoding device, decoding device, and method thereof
JP4989971B2 (ja) * 2004-09-06 2012-08-01 パナソニック株式会社 スケーラブル復号化装置および信号消失補償方法
JPWO2006028009A1 (ja) * 2004-09-06 2008-05-08 松下電器産業株式会社 スケーラブル復号化装置および信号消失補償方法
US8712767B2 (en) 2004-09-17 2014-04-29 Panasonic Corporation Scalable encoding apparatus, scalable decoding apparatus, scalable encoding method, scalable decoding method, communication terminal apparatus, and base station apparatus
US7848925B2 (en) 2004-09-17 2010-12-07 Panasonic Corporation Scalable encoding apparatus, scalable decoding apparatus, scalable encoding method, scalable decoding method, communication terminal apparatus, and base station apparatus
WO2006030865A1 (ja) * 2004-09-17 2006-03-23 Matsushita Electric Industrial Co., Ltd. スケーラブル符号化装置、スケーラブル復号化装置、スケーラブル符号化方法、スケーラブル復号化方法、通信端末装置および基地局装置
JP4626261B2 (ja) * 2004-10-21 2011-02-02 カシオ計算機株式会社 音声符号化装置及び音声符号化方法
JP2006119363A (ja) * 2004-10-21 2006-05-11 Casio Comput Co Ltd 音声符号化装置、音声復号装置、音声符号化方法及び音声復号方法
CN101076853B (zh) * 2004-12-10 2010-10-13 松下电器产业株式会社 宽带编码装置、宽带线谱对预测装置、频带可扩展编码装置以及宽带编码方法
US8229749B2 (en) 2004-12-10 2012-07-24 Panasonic Corporation Wide-band encoding device, wide-band LSP prediction device, band scalable encoding device, wide-band encoding method
WO2006062202A1 (ja) * 2004-12-10 2006-06-15 Matsushita Electric Industrial Co., Ltd. 広帯域符号化装置、広帯域lsp予測装置、帯域スケーラブル符号化装置及び広帯域符号化方法
US8010353B2 (en) 2005-01-14 2011-08-30 Panasonic Corporation Audio switching device and audio switching method that vary a degree of change in mixing ratio of mixing narrow-band speech signal and wide-band speech signal
WO2006075663A1 (ja) * 2005-01-14 2006-07-20 Matsushita Electric Industrial Co., Ltd. 音声切替装置および音声切替方法
JPWO2006090852A1 (ja) * 2005-02-24 2008-07-24 松下電器産業株式会社 データ再生装置
JP2012083767A (ja) * 2005-02-24 2012-04-26 Panasonic Corp データ再生装置およびデータ再生方法
JP5107574B2 (ja) * 2005-02-24 2012-12-26 パナソニック株式会社 データ再生装置、データ再生方法、プログラム、および集積回路
KR100738077B1 (ko) 2005-09-28 2007-07-12 삼성전자주식회사 계층적 오디오 부호화 및 복호화 장치와 방법
KR101471978B1 (ko) * 2007-02-02 2014-12-12 삼성전자주식회사 오디오 신호의 음질 향상을 위한 데이터 삽입 방법 및 그장치
AU2008233888B2 (en) * 2007-03-02 2013-01-31 Panasonic Intellectual Property Corporation Of America Encoding device and encoding method
RU2471252C2 (ru) * 2007-03-02 2012-12-27 Панасоник Корпорэйшн Устройство кодирования и способ кодирования
US8554549B2 (en) 2007-03-02 2013-10-08 Panasonic Corporation Encoding device and method including encoding of error transform coefficients
WO2008120440A1 (ja) * 2007-03-02 2008-10-09 Panasonic Corporation 符号化装置および符号化方法
KR101414354B1 (ko) 2007-03-02 2014-08-14 파나소닉 인텔렉츄얼 프로퍼티 코포레이션 오브 아메리카 부호화 장치 및 부호화 방법
US8918314B2 (en) 2007-03-02 2014-12-23 Panasonic Intellectual Property Corporation Of America Encoding apparatus, decoding apparatus, encoding method and decoding method
US8918315B2 (en) 2007-03-02 2014-12-23 Panasonic Intellectual Property Corporation Of America Encoding apparatus, decoding apparatus, encoding method and decoding method
RU2579663C2 (ru) * 2007-03-02 2016-04-10 Панасоник Интеллекчуал Проперти Корпорэйшн оф Америка Устройство кодирования и способ кодирования
RU2579662C2 (ru) * 2007-03-02 2016-04-10 Панасоник Интеллекчуал Проперти Корпорэйшн оф Америка Устройство кодирования и способ кодирования
JP2011507440A (ja) * 2007-12-21 2011-03-03 フランス・テレコム 適応型ウィンドウを有する変換ベースの符号化/復号化
US9691410B2 (en) 2009-10-07 2017-06-27 Sony Corporation Frequency band extending device and method, encoding device and method, decoding device and method, and program
US9208795B2 (en) 2009-10-07 2015-12-08 Sony Corporation Frequency band extending device and method, encoding device and method, decoding device and method, and program
US9583112B2 (en) 2010-04-13 2017-02-28 Sony Corporation Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program
US10224054B2 (en) 2010-04-13 2019-03-05 Sony Corporation Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program
US10546594B2 (en) 2010-04-13 2020-01-28 Sony Corporation Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program
US9659573B2 (en) 2010-04-13 2017-05-23 Sony Corporation Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program
US9679580B2 (en) 2010-04-13 2017-06-13 Sony Corporation Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program
JP2012168494A (ja) * 2010-04-13 2012-09-06 Sony Corp 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP2017122925A (ja) * 2010-04-13 2017-07-13 ソニー株式会社 信号処理装置および方法、並びにプログラム
KR102015233B1 (ko) * 2010-04-13 2019-08-27 소니 주식회사 복호 장치 및 복호 방법
US10381018B2 (en) 2010-04-13 2019-08-13 Sony Corporation Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program
US10297270B2 (en) 2010-04-13 2019-05-21 Sony Corporation Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program
KR20180018852A (ko) * 2010-04-13 2018-02-21 소니 주식회사 복호 장치 및 복호 방법
US9406312B2 (en) 2010-04-13 2016-08-02 Sony Corporation Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program
US10236015B2 (en) 2010-10-15 2019-03-19 Sony Corporation Encoding device and method, decoding device and method, and program
US9767824B2 (en) 2010-10-15 2017-09-19 Sony Corporation Encoding device and method, decoding device and method, and program
US9390717B2 (en) 2011-08-24 2016-07-12 Sony Corporation Encoding device and method, decoding device and method, and program
JP2017151454A (ja) * 2013-01-29 2017-08-31 フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. 低複雑度の調性適応音声信号量子化
JP2019164367A (ja) * 2013-01-29 2019-09-26 フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. 低複雑度の調性適応音声信号量子化
US10468043B2 (en) 2013-01-29 2019-11-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Low-complexity tonality-adaptive audio signal quantization
US11094332B2 (en) 2013-01-29 2021-08-17 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Low-complexity tonality-adaptive audio signal quantization
US11694701B2 (en) 2013-01-29 2023-07-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Low-complexity tonality-adaptive audio signal quantization
US9875746B2 (en) 2013-09-19 2018-01-23 Sony Corporation Encoding device and method, decoding device and method, and program
US10692511B2 (en) 2013-12-27 2020-06-23 Sony Corporation Decoding apparatus and method, and program
US11705140B2 (en) 2013-12-27 2023-07-18 Sony Corporation Decoding apparatus and method, and program

Also Published As

Publication number Publication date
CN101425294B (zh) 2012-11-28
US20050252361A1 (en) 2005-11-17
WO2004023457A1 (ja) 2004-03-18
JP3881943B2 (ja) 2007-02-14
CN100454389C (zh) 2009-01-21
AU2003257824A1 (en) 2004-03-29
CN101425294A (zh) 2009-05-06
EP1533789A1 (en) 2005-05-25
CN1689069A (zh) 2005-10-26
US7996233B2 (en) 2011-08-09
EP1533789A4 (en) 2006-01-04

Similar Documents

Publication Publication Date Title
JP3881943B2 (ja) 音響符号化装置及び音響符号化方法
JP3881946B2 (ja) 音響符号化装置及び音響符号化方法
US8209188B2 (en) Scalable coding/decoding apparatus and method based on quantization precision in bands
JP5047268B2 (ja) Mdct係数を使用する音声後処理
JP4166673B2 (ja) 相互使用可能なボコーダ
JP5535241B2 (ja) 音声信号復元装置および音声信号復元方法
US6081776A (en) Speech coding system and method including adaptive finite impulse response filter
JP2001222297A (ja) マルチバンドハーモニック変換コーダ
JP2003323199A (ja) 符号化装置、復号化装置及び符号化方法、復号化方法
JP4958780B2 (ja) 符号化装置、復号化装置及びこれらの方法
KR20080103088A (ko) 디코더 및 대응 디바이스에서 디지털 신호의 반향들의 안전한 구별과 감쇠를 위한 방법
JP2004310088A (ja) 半レート・ボコーダ
JP4622164B2 (ja) 音響信号符号化方法及び装置
CN115171709B (zh) 语音编码、解码方法、装置、计算机设备和存储介质
JP4603485B2 (ja) 音声・楽音符号化装置及び音声・楽音符号化方法
JP2004302259A (ja) 音響信号の階層符号化方法および階層復号化方法
JP4373693B2 (ja) 音響信号の階層符号化方法および階層復号化方法
JP4287840B2 (ja) 符号化装置
JP6713424B2 (ja) 音声復号装置、音声復号方法、プログラム、および記録媒体
JP3576485B2 (ja) 固定音源ベクトル生成装置及び音声符号化/復号化装置
JPH11194799A (ja) 楽音符号化装置および楽音復号化装置および楽音符号化復号化装置およびプログラム記憶媒体
JP2004046238A (ja) 広帯域音声復元装置及び広帯域音声復元方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050405

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050602

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060418

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060616

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20060705

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20061107

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20061113

R150 Certificate of patent or registration of utility model

Ref document number: 3881943

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091117

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101117

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101117

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111117

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121117

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121117

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131117

Year of fee payment: 7

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term