JP5235168B2 - 符号化方法、復号方法、符号化装置、復号装置、符号化プログラム、復号プログラム - Google Patents

符号化方法、復号方法、符号化装置、復号装置、符号化プログラム、復号プログラム Download PDF

Info

Publication number
JP5235168B2
JP5235168B2 JP2009148887A JP2009148887A JP5235168B2 JP 5235168 B2 JP5235168 B2 JP 5235168B2 JP 2009148887 A JP2009148887 A JP 2009148887A JP 2009148887 A JP2009148887 A JP 2009148887A JP 5235168 B2 JP5235168 B2 JP 5235168B2
Authority
JP
Japan
Prior art keywords
signal
encoding
unit
frequency domain
decoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009148887A
Other languages
English (en)
Other versions
JP2011007870A (ja
Inventor
公孝 堤
茂明 佐々木
祐介 日和▲崎▼
勝宏 福井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2009148887A priority Critical patent/JP5235168B2/ja
Publication of JP2011007870A publication Critical patent/JP2011007870A/ja
Application granted granted Critical
Publication of JP5235168B2 publication Critical patent/JP5235168B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

この発明は、音声信号等の入力された信号をベクトル量子化により符号化する技術及び圧縮された符号を復号する技術に関する。
カスタネットの楽音のように時間的にレベルが急激に変動する音響信号を周波数領域におけるベクトル量子化により符号化すると、入力した音響信号中のレベルが小さい時間区間で、入力信号に対する符号化歪が大きくなり、これが聴感を著しく損なう雑音として知覚される。このような雑音はプリエコーと呼ばれている。特許文献1に記載された符号化方法は、時間領域で符号化を行う第一符号化方法と、周波数領域で符号化を行う第二符号化方法とを備え、入力信号の性質に応じて第一符号化方法と第二符号化方法の何れかを選択して符号化していた(例えば、特許文献1参照。)。
入力信号の性質に応じて、時間領域で符号化を行う第一符号化方法と周波数領域で符号化を行う第二符号化方法とを切り替えることにより、プリエコーの発生を低減することができる。これにより、入力信号の特徴や性質に応じた、効率の良い高品質な復号信号を得ることができた。
特許第3317470号公報
特許文献1に記載された符号化器によれば、入力信号の性質に応じて最適な符号化方法で符号化できるが、第一符号化方法及びと第二符号化方法で用いる量子化方法が異なり、複数のコードブックを保持する必要があり、多くの記憶領域が必要となるという課題があった。
上記の課題を解決するために、符号化においては、入力された音響信号を一定時間長に対応するサンプルをまとめて構成されるフレーム単位で処理を行う。時間領域符号化方法と周波数領域符号化方法とのうち、復号した際により品質が高い音響信号を得ることができる符号化方法を選択して、その選択結果である信号識別情報を出力する。時間領域符号化方法が選択された場合には、フレーム単位で構成された音響信号を第一コードブックを用いてベクトル量子化により符号化して、信号量子化符号インデックスを出力する。周波数領域符号化方法が選択された場合には、フレーム単位で構成された音響信号を周波数領域信号に時間周波数変換し、第一コードブックを用いたベクトル量子化により符号化して、その符号化結果である信号量子化符号インデックスを出力する。
復号においては、符号分離部から出力される信号量子化符号インデックス及び信号識別情報を用いる。信号識別情報が時間領域符号化方法を示す場合には、信号量子化符号インデックスを第一コードブックを用いて逆ベクトル量子化により復号し、時間領域復号音響信号を得る。信号識別情報が周波数領域符号化方法を示す場合には、信号量子化符号インデックスを第一コードブックを用いて逆ベクトル量子化により復号した後、周波数時間変換を行い、時間領域復号信号に変換する。最後に時間領域復号信号を重畳加算することにより、復号信号を出力する。
時間領域符号化方法と周波数領域符号化方法とで同一のコードブックを用いることにより、従来よりも記憶領域を小さくすることができる。
第一実施形態の符号化装置の例の機能ブロック図。 第一実施形態の符号化方法の例の流れ図。 第一実施形態の復号装置の例の機能ブロック図。 第一実施形態の復号方法の例の流れ図。 第二実施形態の符号化装置の例の機能ブロック図。 第二実施形態の符号化方法の例の流れ図。 第二実施形態の復号装置の例の機能ブロック図。 第二実施形態の復号方法の例の流れ図。 第三実施形態の符号化装置の例の機能ブロック図。 第三実施形態の符号化方法の例の流れ図。 第三実施形態の復号装置の例の機能ブロック図。 第三実施形態の復号方法の例の流れ図。 サブバンド分割およびサブバンド合成の模式図。 動的ビット割当の例の流れ図。 動的ビット割当の模式図。 動的ビット割当に用いるビット割当テーブルの図。
以下、図面を参照してこの発明の実施形態を詳細に説明する。
[第一実施形態]
≪符号化≫
図1に第一実施形態の符号化装置の機能ブロックを例示する。図2に第一実施形態の符号化方法の流れ図を例示する。
第一実施形態の符号化装置は、図1に例示するように、フレーム構成部1、信号識別部2、スイッチ31、時間領域符号化部4、周波数領域符号化部5、コードブック記憶部6、符号多重化部7を含む。
入力された音響信号は、フレーム構成部1に入力される。入力された音響信号は例えばマイクロフォン等のセンサからディジタル形式で取得した音響信号サンプルである。フレーム構成部1は、入力された音響信号を一定時間長に対応するサンプル数まとめて、フレーム単位の音響信号を構成し、フレームごとの音響信号を信号識別部2に送る(ステップC1)。例えば、サンプリング周波数を32kHzとしたとき、5msecに対応するフレームは160サンプルから構成される。
信号識別部2は、時間領域符号化方法と周波数領域符号化方法とのうち、復号した際により品質が高い音響信号を得ることができる符号化方法を選択し(ステップC2)その選択結果である信号識別情報が時間領域符号化方法を表す場合、スイッチ31をフレーム単位の入力音響信号が時間領域符号化部4に送られるよう切り替えた上で、信号識別情報を符号多重化部7に送る(ステップC3)。一方、信号識別情報が周波数領域符号化方法を表す場合は、スイッチ31をフレーム単位の入力音響信号が周波数領域符号化部5に送られるよう切り替えた上で、信号識別情報を符号多重化部7に送る(ステップC4)。
信号識別部2は、復号した際により品質が高い音響信号を得ることができる符号化方法を選択するために、例えばフレームごとの音響信号から特徴量を計算して、その特徴量と所定の閾値とを比較して、その大小により時間領域符号化方法と周波数領域符号化方法の何れかを選択する。識別に用いる特徴量として、例えばフレーム内のサンプルの値の絶対値の最大値と、そのフレーム内のサンプルの値の絶対値の平均値との差分などを利用することができる。この場合、特徴量が所定の閾値よりも大きい場合には、そのフレームにおいて音響信号が急激な時間変化をすると判断し、時間領域符号化方法を選択する。一方、特徴量が所定の閾値以下である場合には、周波数領域符号化方法を選択する。所定の閾値は、求める性能や仕様に基づいて適宜決定される。
信号識別部2において時間領域符号化方法が選択された場合には、時間領域符号化部4のベクトル量子化部41が、フレームごとの音響信号を第一コードブックを用いて、ベクトル量子化により符号化し(ステップC5)、その符号化結果である信号量子化符号インデックスを符号多重化部7に出力する。
信号識別部2において周波数領域符号化方法が選択された場合には、周波数領域符号化部5の時間周波数変換部51は、フレームごとの音響信号を周波数領域信号に変換する(ステップC7)。例えば、修正離散コサイン変換(以下、MDCT)や離散コサイン変換(以下、DCT)により周波数領域信号に変換する。
周波数領域符号化部5のベクトル量子化部52が、変換された周波数領域信号を入力ベクトルとみなし、第一コードブックを用いてベクトル量子化により符号化して(ステップC8)、その符号化結果である信号量子化符号インデックスを符号多重化部7に出力する。
時間領域符号化部4のベクトル量子化部41及び周波数領域符号化部5のベクトル量子化部52は共に、コードブック記憶部6に記憶された同一の第一コードブックを用いてベクトル量子化を行う。このように、符号化方法によらず同一のコードブック(この実施形態では第一コードブック)を用いることにより、必要な記憶領域を従来よりも小さくすることができる。
符号多重化部7は、信号識別情報及び信号量子化符号インデックスを所定の順序に並べて1つのデータセットとして出力する(ステップC10)。パケットとしてIP通信網等に伝送する場合には、必要なヘッダ情報をデータセットに付加して伝送する。
≪復号≫
図3は第一実施形態の復号装置の機能ブロックを例示する。図4は第一実施形態の復号方法の流れ図を例示する。
第一実施形態の復号装置は、図1に例示するように、符号分離部8、時間領域復号部9、周波数領域復号部10、コードブック記憶部11、重畳加算部12、スイッチ31,32、信号識別部14を含む。
符号分離部8は、入力されたデータセットから所定の位置から所定のビット数を読み込み、信号識別情報及び信号量子化符号インデックスを分離する(ステップD1)。信号識別情報は、信号識別部14に送られる。信号量子化符号インデックスは、スイッチ32の切り替え状態に応じて、時間領域復号部9又は周波数領域復号部10に送られる。符号分離部8が特許請求の範囲の入力部に対応し、ステップD1が特許請求の範囲の入力ステップに対応する。
信号識別部14は、信号識別情報が時間領域復号方法と周波数領域復号方法の何れを示すか識別し、スイッチ32を切り替える(ステップD2)。
信号識別情報が時間領域符号化方法を示す場合には、信号識別部14は、符号分離部8と時間領域復号部9とを接続するようにスイッチ32を切り替え、時間領域復号部9と重畳加算部12とを接続するようにスイッチ33を切り替える。次に、時間領域復号部9が信号量子化符号インデックスを復号する(ステップD3)。
具体的には、時間領域復号部9の逆ベクトル量子化部91が、コードブック記憶部11に記憶された第一コードブックを用いて、逆ベクトル量子化により信号量子化符号インデックスを復号し(ステップD3)、フレームごとの時間領域信号を出力する。フレーム単位の時間領域信号は重畳加算部12に送られる。
一方、信号識別情報が周波数領域符号化方法を示す場合には、信号識別部14は、符号分離部8と周波数領域復号部10とを接続するようにスイッチ32を切り替え、周波数領域復号部10と重畳加算部12とを接続するようにスイッチ33を切り替える。次に、周波数領域復号部10が信号量子化符号インデックスを復号する(ステップD4,D5)。
具体的には、周波数領域復号部10の逆ベクトル量子化部101が、コードブック記憶部11に記憶された第一コードブックを用いて逆ベクトル量子化により信号量子化符号インデックスを復号し(ステップD4)、フレームごとの周波数領域信号を周波数時間変換部102に送る。
周波数時間変換部102は、フレームごとの周波数領域信号を、符号化の際に時間周波数変換部51(図1)が行った時間周波数変換に対応する周波数時間変換により、フレームごとの時間領域信号に変換する(ステップD5)。例えば、時間周波数変換としてMDCTを用いた場合には、逆MDCTを実行する。周波数時間変換により出力されたフレームごとの時間領域信号は、重畳加算部12に送られる。
時間領域復号部9の逆ベクトル量子化部91及び周波数領域復号部10の逆ベクトル量子化部101は共に、コードブック記憶部11に記憶された同一の第一コードブックを用いて逆ベクトル量子化を行う。このように、復号方法によらず同一のコードブック(この実施形態では第一コードブック)を用いることにより、必要な記憶領域を従来よりも小さくすることができる。
なお、コードブック記憶部11に記憶された第一コードブックは、符号化装置のコードブック記憶部6に記憶された第一コードブックと同一のコードブックである。
重畳加算部12は、フレームごとの時間領域信号を重畳加算して、連続した時間領域信号を生成する(ステップD6)。すなわち、フレームごとの時間領域信号に、例えばハミング窓等の窓関数を掛けて得られる信号をフレーム長の半分づつ重ねて加算をすることにより、連続した時間領域信号を生成する。
[第二実施形態]
第二実施形態は、フレームを分割したサブフレーム単位でベクトル量子化、逆ベクトル量子化を行う部分で、第一実施形態とは異なる。他の部分は、第一実施形態と同様である。以下、第一実施形態と異なる部分を重点的に説明し、第一実施形態と同様である部分については同一の符号を付けて重複説明を略する。
≪符号化≫
図5に第二実施形態の符号化装置の機能ブロックを例示する。図6に第二実施形態の符号化方法の流れ図を例示する。
第二実施形態の時間領域符号化部4は、ベクトル量子化部41に加えて、サブフレーム分割部42を含む。また、第二実施形態の周波数領域符号化部5は、時間周波数変換部51及びベクトル量子化部52に加えて、サブバンド分割部53を含む。
入力した音響信号を、フレーム構成部1でフレーム単位の音響信号とし、信号識別部2において、信号識別情報を決定し、出力する(ステップC1,C2,C3,C4)。以上は、第一実施形態と同じである。
信号識別情報が時間領域符号化方法を表す場合には、時間領域符号化部4のサブフレーム分割部42は、図13(A)に例示するように、フレーム構成部1から出力されたフレーム単位の音響信号を、サブフレームに分割する(ステップC11)。例えば、1フレームのサンプル数を160、サブフレームあるいはサブバンドの数を10とした場合には、1サブフレームのサンプル数は16である。
サブフレーム単位で構成された音響信号は、ベクトル量子化部41に送られる。ベクトル量子化部41は、サブフレーム単位で構成された音響信号をサブフレーム毎に第二コードブックを用いてベクトル量子化により符号化して、その符号化結果である信号量子化符号インデックスを出力する(ステップC5)。
信号識別情報が周波数領域符号化を表す場合には、時間周波数変換部51がフレーム単位の入力音響信号を時間周波数変換して、フレーム単位の周波数領域信号を出力し、サブバンド分割部53が、フレーム単位の周波数領域信号を、サブバンド単位に分割し(ステップC12)、ベクトル量子化部52に送る。ベクトル量子化部52は、サブバンドで分割された周波数領域信号をサブバンド毎に、第二コードブックを用いたベクトル量子化により符号化して、信号量子化符号インデックスを出力する。
時間領域符号化部4のベクトル量子化部41及び周波数領域符号化部5のベクトル量子化部52は共に、コードブック記憶部15に記憶された同一の第二コードブックを用いてベクトル量子化を行う。
≪復号≫
図7に第二実施形態の復号装置の機能ブロックを例示する。図8に第二実施形態の復号方法の流れ図を例示する。
第二実施形態の時間領域復号部9は、逆ベクトル量子化部91に加えて、サブフレーム合成部92を含む。第二実施形態の周波数領域復号部10は、逆ベクトル量子化部101及び周波数時間変換部102に加えて、サブバンド合成部103を含む。
信号識別情報が時間領域符号化方法を示す場合には、時間領域復号部9の逆ベクトル量子化部91は、コードブック記憶部16に記憶された第二コードブックを用いて逆ベクトル量子化により信号量子化符号インデックスの復号を行い、サブフレーム単位の時間領域信号を生成する(ステップD3)。
そして、サブフレーム合成部92は、図13(B)に例示するように、サブフレームごとの時間領域信号を時系列順に並べてフレーム単位の時間領域信号を生成し(ステップD7)、重畳加算部12に送る。
信号識別情報が周波数領域符号化方法を示す場合には、周波数領域復号部10の逆ベクトル量子化部101は、コードブック記憶部16に記憶された第二コードブックを用いて逆ベクトル量子化により信号量子化インデックスを復号し、サブフレーム単位の周波数領域信号を生成する(ステップD4)。
そして、サブバンド合成部103は、サブフレーム単位の周波数領域信号を合成して、フレーム単位の周波数領域信号を生成し(ステップD8)、時間周波数変換部102に送る。
時間領域復号部9の逆ベクトル量子化部91及び周波数領域復号部10の逆ベクトル量子化部101は共に、コードブック記憶部16に記憶された同一の第二コードブックを用いて逆ベクトル量子化を行う。
なお、コードブック記憶部16に記憶された第二コードブックは、符号化装置のコードブック記憶部15に記憶された第二コードブックと同一のコードブックである。
フレームよりも短いサブフレーム、サブバンドごとにベクトル量子化を行うことにより、コードブック記憶部15,16に記憶された第二コードブックを構成するコードベクトルの次元を下げることができ、記憶領域をより小さくすることができる。
[第三実施形態]
第三実施形態は、サブフレームあるいはサブバンドごとに割り当てるビット数を動的に変化させる点が第二実施形態とは異なる。他の部分は第二実施形態と同様である。以下、第二実施形態と異なる部分を重点的に説明し、第二実施形態と同様である部分については同一の符号を付けて重複説明を省略する。
≪符号化≫
図9に第三実施形態の符号化装置の機能ブロックを例示する。図10に第三実施形態の符号化方法の流れ図を例示する。
第三実施形態の符号化装置は動的ビット割当部13を含む。
サブフレーム分割部42又はサブバンド分割部53で分割されたサブフレームあるいはサブバンド単位の音響信号は、動的ビット割当部13に送られる。
動的ビット割当部13は、サブフレーム又はサブバンドごとに異なる数のビットを各サブフレーム又はサブバンドに割り当て(ステップC13,C14)、その割当結果である割当ビット情報をベクトル量子化部41又はベクトル量子化部52、符号多重化部7に送る。例えば、聴感的重要度の大きいサブフレーム、サブバンドほど多くのビットが割当られるような動的ビット割当を行う。または、平均振幅が大きなサブフレーム、サブバンドほど多くのビットを割り当てる。ここで、平均振幅とは、サブフレーム、サブバンドを構成するサンプルの値の平均値である。
以下、動的ビット割当の一例を説明する。
サブバンド単位で構成される周波数領域信号をS(w)[k](w=0,…,W−1、k=0,…,L’−1)として、第wサブバンド周波数領域信号列S(w)[k]の平均振幅指標A[w](w=0,…,W−1)(以下、「第wサブバンド平均振幅指標」と呼ぶ。)を次式にしたがって算出する。ここで、Wをサブバンドの数、L’をサブバンドを構成するサンプル数とした。round(x)は、xの小数点以下を切り捨てて整数化する関数である。
Figure 0005235168
次に、以下のような手順で第wサブバンドの割当ビット情報B[w](w=0,…,W−1)を算出する。まず、第wサブバンド平均振幅指標A[w]から次式で決まる第wサブバンド聴覚的重要度ip[w](w=0,…,W−1)を算出する。
ip[w]=A[w]/2
次に第wサブバンド聴覚的重要度ip[w]とビット割当テーブルRを利用した二分探索法により、第wサブバンドの割当ビット情報B[w]を出力する。動的ビット割当では、“water Level”を以下の式に基づく二分探索により選択し、“water Level λ”と第wサブバンド聴覚的重要度ip[w]を利用して次式の第wサブバンド割当ビット情報B[w]を算出する。ビット割当テーブルRは、互いに異なるR個の自然数b,b,…,bR−1が登録されたテーブルである。b<b<…<bR−1とする。
Figure 0005235168
具体的には、例えば図14に示す方法で算出すればよい。まず、パラメータ(maxIP,minIP,λ,i)を初期値に設定する(S50351)。一時的なB[w]の値として、Bt[w](w=1,…,W−1)を計算し、計算されたBt[w]の合計Sum_Bt=Σ W−1Bt[w]を求める(S50352)。Sum_Btが割当可能な総ビット数(total_bit_budget)を越えるかを確認する(S50353)。
ステップS50353がYesの場合、パラメータ(minIP,λ,i)を変更する(S50354)。ステップS50353がNoの場合、B[w]をBt[w]とし、パラメータ(maxIP,λ,i)を変更する(S50355)。
iが事前に定めた定数未満かを確認する(S50356)。ステップS50356がYesの場合、ステップS50352に戻る。ステップS50356がNoの場合、B[w]を、第wサブバンドの割当ビット情報B[w]として出力する。また、事前に決定した回数の反復探索が終了した時点で上記のB[w]の式の評価を行う。
反復処理を終了する収束条件を別途定義して処理を終了してもよい。例えば、割当ビット数の合計が割当可能な総ビット数(total_bit_budget)に等しくなるような場合に処理を終了するなどの方法が考えられる。最終的なビット数の合計が割当可能な総ビット数を越える場合には、例えばip[w]が小さいサブバンドから順に、上式で選択したビット数よりテーブル一つ分小さいビットを割り当てることにより削減し、割当ビット数の合計が総ビット数の合計よりも小さくなるように調整し、最終的な第wサブバンド割当ビット情報を決定する。
サブフレーム単位の入力信号において、動的ビット割当を行う場合には、サブバンド単位で構成される周波数領域信号の代わりに、サブフレーム単位で構成される時間領域信号を用いればよい。
信号識別情報が時間領域符号化方法を示す場合には、ベクトル量子化部41は、割り当てられたビット数B[w]に応じて定まる探索範囲で、コードブック記憶部6に記憶された第二コードブックを探索して、各サブフレームw(w=1,…,W)をベクトル量子化する(ステップC5、図15、図16参照)。例えば、B[w]個のビット数で表すことができる数は2^B[w]であるため、第二コードブックの中の0番目から2^B[w]−1番目までの2^B[w]個のコードベクトルを探索して、サブフレーム単位で構成される音響信号からなるベクトルに最も近いベクトルを選択し、B[w]個のビットで、選択したコードベクトルを表現して、信号量子化符号インデックスとする。
信号識別情報が周波数領域符号化方法を示す場合には、ベクトル量子化部52は、ベクトル量子化部41と同様に、割り当てられたビット数B[w]に応じて定まる探索範囲で、コードブック記憶部6に記憶された第二コードブックを探索して、各サブバンドw(w=1,…,W)をベクトル量子化する(ステップC8、図15、図16参照)。
割当ビット情報は符号多重化部7に送られ、符号多重化部7は、信号識別情報と、信号量子化符号インデックスと、割当ビット情報とを所定の順序で並べてデータセットとする(ステップC9)。IP網上を伝送する場合は、必要なヘッダ情報を付加してパケットとし、出力する。
≪復号≫
図11に第三実施形態の復号装置の機能ブロックを例示する。第三実施形態の復号方法の流れ図を図12に例示する。
符号分離部8は、入力されたデータセットの所定の位置から所定のビット数を読出し、信号識別情報、信号量子化符号インデックス、割当ビット情報を生成する(ステップD1)。
信号識別部14は、信号識別情報に応じてスイッチ32,33、34の切り替えを行う。信号識別情報が時間領域符号化方法を示す場合には、信号識別部14は符号分離部8と時間領域復号部9とを接続するようにスイッチ34を切り替える。一方、信号識別情報が周波数領域符号化方法を示す場合には、信号識別部14は符号分離部8と周波数領域復号部10とを接続するようにスイッチ34を切り替える。
信号識別情報が時間領域符号化方法を示す場合には、時間領域復号部9の逆ベクトル量子化部91は、割当ビット情報を参照して、各サブフレームの信号量子化インデックスを求める(ステップD9)。そして、コードブック記憶部16に記憶された第二コードブックを用いて逆ベクトル量子化により信号量子化符号インデックスの復号を行い、サブフレームごとの時間領域信号を生成する(ステップD3)。
信号識別情報が周波数領域符号化方法を示す場合には、周波数領域復号部10の逆ベクトル量子化部101は、割当ビット情報を参照して、各サブフレームの信号量子化インデックスを求める(ステップD9)。そして、コードブック記憶部16に記憶された第二コードブックを用いて逆ベクトル量子化により信号量子化符号インデックスの復号を行い、サブバンドごとの周波数領域信号を生成する(ステップD4)。
時間領域復号部9の逆ベクトル量子化部91及び周波数領域復号部10の逆ベクトル量子化部101は共に、コードブック記憶部16に記憶された同一の第二コードブックを用いて逆ベクトル量子化を行う。このように、復号方法によらず同一のコードブック(この実施形態では第二コードブック)を用いることにより、必要な記憶領域を従来よりも小さくすることができる。
サブフレーム合成部92およびサブバンド合成部103、および周波数時間変換部102、重畳加算部12の動作は第二実施形態と同じである。
このように、平均振幅が大きなサブフレームあるいはサブバンド、すなわち聴覚的に重要なサブフレームあるいはサブバンドほど多くのビットを割り当てることにより、限られた符号長の中でできる限り精度良く符号化をすることができる。
[変形例等]
符号化方法及び復号方法は、コンピュータによって実現することができる。各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、各装置における各処理機能が、コンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、これらの装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。
この発明は、上述の実施形態に限定されるものではなく、この発明の趣旨を逸脱しない範囲で適宜変更が可能である。
1 フレーム構成部
2 信号識別部
4 時間領域符号化部
41 ベクトル量子化部
42 サブフレーム分割部
5 周波数領域符号化部
51 時間周波数変換部
52 ベクトル量子化部
53 サブフレーム分割部
6 第一コードブック記憶部
9 時間領域復号部
91 逆ベクトル量子化部
92 サブフレーム合成部
10 周波数領域復号部
101 逆ベクトル量子化部
102 時間周波数変換部
103 サブフレーム合成部
11 第二コードブック記憶部
13 動的ビット割当部
14 信号識別部
15 第一コードブック記憶部
16 第二コードブック記憶部

Claims (11)

  1. 入力された音響信号を構成するサンプルを所定の数でまとめて、フレームごとの音響信号を構成するフレーム構成ステップと、
    時間領域符号化方法と周波数領域符号化方法とのうち、復号した際により品質が高い音響信号を得ることができる符号化方法を選択して、その選択結果である信号識別情報を出力する信号識別ステップと、
    時間領域符号化方法が選択された場合には、上記フレームごとの音響信号を第一コードブックを用いてベクトル量子化により符号化して、その符号化結果である信号量子化符号インデックスを出力する時間領域符号化ステップと、
    周波数領域符号化方法が選択された場合には、上記フレームごとの音響信号を周波数領域信号に変換して上記第一コードブックを用いてベクトル量子化により符号化して、その符号化結果である信号量子化符号インデックスを出力する周波数領域符号化ステップと、
    を含む符号化方法。
  2. 請求項1に記載された符号化方法において、
    上記時間領域符号化ステップは、上記フレームごとの音響信号を上記一定時間長よりも短いサブフレームに分割するサブフレーム分割ステップと、サブフレームごとの音響信号を第二コードブックを用いてベクトル量子化により符号化して、その符号化結果である信号量子化符号インデックスを出力するベクトル量子化ステップとを含み、
    上記周波数領域符号化ステップは、上記フレームごとの音響信号を周波数領域信号に変換する時間周波数変換ステップと、変換された周波数領域信号を上記一定時間長よりも短いサブバンドに分割するサブバンド分割ステップと、サブバンドごとの周波数領域信号を上記第二コードブックを用いてベクトル量子化により符号化して、その符号化結果である信号量子化符号インデックスを出力するベクトル量子化ステップとを含む、
    ことを特徴とする符号化方法。
  3. 請求項2に記載された符号化方法において、
    上記時間領域符号化ステップは、サブフレームごとに異なる数のビットを各サブフレームに割り当て、そのビット割り当て結果である割当ビット情報を出力する動的ビット割当ステップを更に含み、その割り当てられたビットが多いほど多くの、上記第二コードブックに含まれたコードベクトルを探索し、その割り当てられたビットで上記信号量子化符号インデックスを表すステップである、
    上記周波数領域符号化ステップは、サブバンドごとに異なる数のビットを各サブバンドに割り当て、そのビット割り当て結果である割当ビット情報を出力する動的ビット割当ステップを更に含み、その割り当てられたビットが多いほど多くの、上記第二コードブックに含まれたコードベクトルを探索し、その割り当てられたビットで上記信号量子化符号インデックスを表すステップである、
    ことを特徴とする符号化方法。
  4. 請求項1に記載された符号化方法により出力された上記信号量子化符号インデックス及び上記信号識別情報が入力される入力ステップと、
    上記信号識別情報が示す符号化方法を識別する信号識別ステップと、
    上記信号識別情報が時間領域符号化方法を示す場合には、上記信号量子化符号インデックスを上記第一コードブックを用いて逆ベクトル量子化により復号する時間領域復号ステップと、
    上記信号識別情報が周波数領域符号化方法を示す場合には、上記信号量子化符号インデックスを上記第一コードブックを用いて逆ベクトル量子化により復号して時間領域信号に変換する周波数領域復号ステップと、
    を含む復号方法。
  5. 請求項2又は3に記載された符号化方法により出力された上記信号量子化符号インデックス及び上記信号識別情報が入力される入力ステップと、
    上記時間領域復号ステップは、上記信号量子化符号インデックスを上記第二コードブックを用いて逆ベクトル量子化により復号してサブフレームごとの時間領域信号を生成する逆ベクトル量子化ステップと、生成されたサブフレームごとの時間領域信号を時系列順に並べて、フレームごとの時間領域信号を生成するサブフレーム合成ステップとを含み、
    上記周波数領域復号ステップは、上記信号量子化符号インデックスを上記第二コードブックを用いて逆ベクトル量子化により復号してサブバンドごとの周波数領域信号を生成する逆ベクトル量子化ステップと、生成されたサブバンドごとの周波数領域信号を合成してフレームごとの周波数領域信号を生成するサブバンド合成ステップと、生成されたフレームごとの周波数領域信号を時間領域信号に変換する時間領域信号変換ステップとを含む、
    ことを特徴とする復号方法。
  6. 入力された音響信号を構成するサンプルを所定の数でまとめて、フレームごとの音響信号を構成するフレーム構成部と、
    時間領域符号化方法と周波数領域符号化方法とのうち、復号した際により品質が高い音響信号を得ることができる符号化方法を選択して、その選択結果である信号識別情報を出力する信号識別部と、
    時間領域符号化方法が選択された場合には、上記フレームごとの音響信号を第一コードブックを用いてベクトル量子化により符号化して、その符号化結果である信号量子化符号インデックスを出力する時間領域符号化部と、
    周波数領域符号化方法が選択された場合には、上記フレームごとの音響信号を周波数領域信号に変換して上記第一コードブックを用いてベクトル量子化により符号化して、その符号化結果である信号量子化符号インデックスを出力する周波数領域符号化部と、
    を含む符号化装置。
  7. 請求項6に記載された符号化装置において、
    上記時間領域符号化部は、上記フレームごとの音響信号を上記一定時間長よりも短いサブフレームに分割するサブフレーム分割部と、サブフレームごとの音響信号を第二コードブックを用いてベクトル量子化により符号化して、その符号化結果である信号量子化符号インデックスを出力するベクトル量子化部とを含み、
    上記周波数領域符号化部は、上記フレームごとの音響信号を周波数領域信号に変換する時間周波数変換部と、変換された周波数領域信号を上記一定時間長よりも短いサブバンドに分割するサブバンド分割部と、サブバンドごとの周波数領域信号を上記第二コードブックを用いてベクトル量子化により符号化して、その符号化結果である信号量子化符号インデックスを出力するベクトル量子化部とを含む、
    ことを特徴とする符号化装置。
  8. 請求項7に記載された符号化装置において、
    上記時間領域符号化部は、サブフレームごとに異なる数のビットを各サブフレームに割り当て、そのビット割り当て結果である割当ビット情報を出力する動的ビット割当部を更に含み、その割り当てられたビットが多いほど多くの、上記第二コードブックに含まれたコードベクトルを探索し、その割り当てられたビットで上記信号量子化符号インデックスを表す部である、
    上記周波数領域符号化部は、サブフレームごとに異なる数のビットを各サブフレームに割り当て、そのビット割り当て結果である割当ビット情報を出力する動的ビット割当部を更に含み、その割り当てられたビットが多いほど多くの、上記第二コードブックに含まれたコードベクトルを探索し、その割り当てられたビットで上記信号量子化符号インデックスを表す部である、
    ことを特徴とする符号化装置。
  9. 請求項6に記載された符号化装置により出力された上記信号量子化符号インデックス及び上記信号識別情報が入力される入力部と、
    上記信号識別情報が示す符号化方法を識別する信号識別部と、
    上記信号識別情報が時間領域符号化方法を示す場合には、上記信号量子化符号インデックスを上記第一コードブックを用いて逆ベクトル量子化により復号する時間領域復号部と、
    上記信号識別情報が周波数領域符号化方法を示す場合には、上記信号量子化符号インデックスを上記第一コードブックを用いて逆ベクトル量子化により復号して時間領域信号に変換する周波数領域復号部と、
    を含む復号装置。
  10. 請求項7又は8に記載された符号化装置により出力された上記信号量子化符号インデックス及び上記信号識別情報が入力される入力部と、
    上記時間領域復号部は、上記信号量子化符号インデックスを上記第二コードブックを用いて逆ベクトル量子化により復号してサブフレームごとの時間領域信号を生成する逆ベクトル量子化部と、生成されたサブフレームごとの時間領域信号を時系列順に並べて、フレームごとの時間領域信号を生成するサブフレーム合成部とを含み、
    上記周波数領域復号部は、上記信号量子化符号インデックスを上記第二コードブックを用いて逆ベクトル量子化により復号してサブバンドごとの周波数領域信号を生成する逆ベクトル量子化部と、生成されたサブバンドごとの周波数領域信号を合成してフレームごとの周波数領域信号を生成するサブバンド合成部と、生成されたフレームごとの周波数領域信号を時間領域信号に変換する時間領域信号変換部とを含む、
    ことを特徴とする復号装置。
  11. 請求項1から3の何れかに記載された符号化方法の各ステップ、又は、請求項4又は5に記載された復号方法の各ステップをコンピュータに実行させるためのプログラム。
JP2009148887A 2009-06-23 2009-06-23 符号化方法、復号方法、符号化装置、復号装置、符号化プログラム、復号プログラム Active JP5235168B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009148887A JP5235168B2 (ja) 2009-06-23 2009-06-23 符号化方法、復号方法、符号化装置、復号装置、符号化プログラム、復号プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009148887A JP5235168B2 (ja) 2009-06-23 2009-06-23 符号化方法、復号方法、符号化装置、復号装置、符号化プログラム、復号プログラム

Publications (2)

Publication Number Publication Date
JP2011007870A JP2011007870A (ja) 2011-01-13
JP5235168B2 true JP5235168B2 (ja) 2013-07-10

Family

ID=43564647

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009148887A Active JP5235168B2 (ja) 2009-06-23 2009-06-23 符号化方法、復号方法、符号化装置、復号装置、符号化プログラム、復号プログラム

Country Status (1)

Country Link
JP (1) JP5235168B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112767953B (zh) 2020-06-24 2024-01-23 腾讯科技(深圳)有限公司 语音编码方法、装置、计算机设备和存储介质
CN113766150B (zh) * 2021-08-31 2024-03-26 北京安酷智芯科技有限公司 一种降噪方法、电路***、电子设备及计算机可读存储介质
WO2023100494A1 (ja) * 2021-12-01 2023-06-08 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置、復号装置、符号化方法、及び、復号方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3317470B2 (ja) * 1995-03-28 2002-08-26 日本電信電話株式会社 音響信号符号化方法、音響信号復号化方法
JPH09261065A (ja) * 1996-03-25 1997-10-03 Mitsubishi Electric Corp 量子化装置及び逆量子化装置及び量子化逆量子化システム

Also Published As

Publication number Publication date
JP2011007870A (ja) 2011-01-13

Similar Documents

Publication Publication Date Title
KR101414354B1 (ko) 부호화 장치 및 부호화 방법
JP4977472B2 (ja) スケーラブル復号化装置
JP5413839B2 (ja) 符号化装置および復号装置
JP4859670B2 (ja) 音声符号化装置および音声符号化方法
JP5383676B2 (ja) 符号化装置、復号装置およびこれらの方法
JP2018116297A (ja) 帯域幅拡張のための高周波数符号化/復号化方法及びその装置
RU2718421C1 (ru) Устройство аудиодекодирования, устройство аудиокодирования, способ аудиодекодирования, способ аудиокодирования, программа аудиодекодирования и программа аудиокодирования
JP4272897B2 (ja) 符号化装置、復号化装置およびその方法
JPWO2006041055A1 (ja) スケーラブル符号化装置、スケーラブル復号装置及びスケーラブル符号化方法
JP2009533716A (ja) オーディオ符号化並びに復号化における励起の処理
KR20190060887A (ko) 노이즈 신호 처리 방법, 노이즈 신호 생성 방법, 인코더, 디코더, 및 인코딩/디코딩 시스템
WO2024051412A1 (zh) 语音编码、解码方法、装置、计算机设备和存储介质
JP5299327B2 (ja) 音声処理装置、音声処理方法、およびプログラム
JP4216364B2 (ja) 音声符号化/復号化方法および音声信号の成分分離方法
JP5235168B2 (ja) 符号化方法、復号方法、符号化装置、復号装置、符号化プログラム、復号プログラム
JP3344944B2 (ja) オーディオ信号符号化装置,オーディオ信号復号化装置,オーディオ信号符号化方法,及びオーディオ信号復号化方法
JPWO2009113516A1 (ja) 信号分析制御システム及びその方法と、信号制御装置及びその方法と、プログラム
JP5400880B2 (ja) 符号化方法、復号方法、それらの方法を用いた装置、プログラム、記録媒体
JPWO2015049820A1 (ja) 音響信号符号化装置、音響信号復号装置、端末装置、基地局装置、音響信号符号化方法及び復号方法
CN110709925B (zh) 用于音频编码或解码的方法及装置
JP4578145B2 (ja) 音声符号化装置、音声復号化装置及びこれらの方法
JP2002091497A (ja) オーディオ信号符号化方法、復号化方法及びそれらの方法を実行するプログラム記憶媒体
JP2006047561A (ja) オーディオ信号符号化装置およびオーディオ信号復号化装置
CN113113032A (zh) 一种音频编解码方法和音频编解码设备
JP5188913B2 (ja) 量子化装置、量子化方法、逆量子化装置、逆量子化方法、音声音響符号化装置および音声音響復号装置

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20110720

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120521

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130311

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130319

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130325

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5235168

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160405

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350