JP4679513B2 - 階層符号化装置および階層符号化方法 - Google Patents

階層符号化装置および階層符号化方法 Download PDF

Info

Publication number
JP4679513B2
JP4679513B2 JP2006512764A JP2006512764A JP4679513B2 JP 4679513 B2 JP4679513 B2 JP 4679513B2 JP 2006512764 A JP2006512764 A JP 2006512764A JP 2006512764 A JP2006512764 A JP 2006512764A JP 4679513 B2 JP4679513 B2 JP 4679513B2
Authority
JP
Japan
Prior art keywords
layer
delay
input signal
signal
delay amount
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006512764A
Other languages
English (en)
Other versions
JPWO2005106850A1 (ja
Inventor
正浩 押切
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Publication of JPWO2005106850A1 publication Critical patent/JPWO2005106850A1/ja
Application granted granted Critical
Publication of JP4679513B2 publication Critical patent/JP4679513B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Communication Control (AREA)

Description

本発明は、階層符号化装置および階層符号化方法に関する。
音声信号を低ビットレートで圧縮する音声符号化技術は、移動体通信システムにおける電波等の有効利用のために重要である。さらに近年の傾向として、通話音声の品質向上に対する期待が高まってきており、臨場感の高い通話サービスの実現が望まれている。そのため音声信号の高品質化のみならず、より広帯域のオーディオ信号等の音声以外の信号をも高品質に符号化できることが望ましい。
このように、電波の受信環境が良好な場合には高品質化を実現し、受信環境が劣悪な場合には低ビットレート化を実現する符号化技術が必要となってきている。この要求に対し、複数の符号化技術を階層的に統合し、スケーラビリティを持たせるアプローチが有望視されている。スケーラビリティ(またはスケーラブル機能)とは、符号化コードの一部からでも復号信号を生成することのできる機能を指す。
図1は、従来の階層符号化(エンベディッド符号化、スケーラブル符号化)装置の一例として、2つのレイヤからなる階層符号化装置10の構成を示すブロック図である。
音響データが入力信号として入力され、ダウンサンプリング部11でサンプリングレートの低い信号が生成される。ダウンサンプリングされた信号が第1レイヤ符号化部12に与えられ、この信号を符号化する。第1レイヤ符号化部12の符号化コードは、多重化部17に与えられると共に、第1レイヤ復号化部13に与えられる。第1レイヤ復号化部13では、符号化コードをもとに第1レイヤの復号信号を生成する。次に、アップサンプリング部14にて、第1レイヤ復号化部13から出力される復号信号のサンプリングレートを上げる。遅延部15は、入力信号に所定時間の遅延を与える。遅延部15より出力される入力信号からアップサンプリング部14から出力された第1レイヤ復号信号を減算して残差信号を生成し、この残差信号を第2レイヤ符号化部16に与える。第2レイヤ符号化部16は、与えられた残差信号を符号化して、符号化コードを多重化部17に出力する。多重化部17は、第1レイヤ符号化コードと第2レイヤ符号化コードを多重化して符号化コードとして出力する。
この階層符号化装置10は、入力信号に対し所定の時間的な遅延を与える遅延部15を備えている。この遅延部15は、入力信号と第1レイヤ復号信号の時間的なずれ(位相差)を補正するためのものである。遅延部15で補正される位相差は、ダウンサンプリング部11もしくはアップサンプリング部14でのフィルタリング処理、ならびに第1レイヤ符号化部12もしくは第1レイヤ復号化部13での信号処理において発生する。この位相差を補正するための遅延量、すなわち、遅延部15で使用される遅延量は、予め設定された所定の固定値(固定のサンプル数)が使用される(例えば、特許文献1、2参照)。
特開平8−46517号公報 特開平8−263096号公報
しかしながら、第1レイヤ符号化部で使用される符号化方法、または、アップサンプリング部もしくはダウンサンプリング部で行われる各処理の手法によっては、遅延部で補正すべき位相差が時間的に変化することがある。
例えば、第1レイヤ符号化部にCELP(符号励振線形予測符号化:Code Excited Linear Prediction)方式を適用する場合、CELP方式は聴覚的に歪みが知覚されないように様々な工夫が施されており、その多くが時変で位相特性が変わるフィルタ処理に基づいている。例えば、符号化部における聴覚マスキング処理、復号化部におけるピッチ強調処理、パルス拡散処理、雑音後処理、ポストフィルタ処理等がこれに相当し、時変で位相特性が変わるフィルタ処理に基づいている。なお、これらの処理の全てがCELPに適用されているというわけではないが、ビットレートが低くなる程、このような処理が多くCELPに適用される。
CELPのこれらの処理は、ある所定の時間間隔(通常は、フレーム単位)で求められた入力信号の特性を表すパラメータを用いて行われる。音声信号のように特性が時間的に変化する信号に対しては、このパラメータも時間的に変化し、その結果フィルタの位相特性が変化する。よって、第1レイヤ復号信号の位相が時間的に変化する現象が生じる。
また、CELP以外でも、アップサンプリング処理ならびにダウンサンプリング処理でも位相差が時間的に変化することが起こり得る。例えば、これらサンプリング変換処理に使用する低域通過フィルタ(LPF)にIIR型フィルタを用いる場合には、このフィルタの特性が線形位相特性ではなくなるため、入力信号の周波数特性が変化すると位相差も変わってくる。なお、線形位相特性を有するFIR型のLPFの場合は、位相差は固定である。
このように、遅延部で補正すべき位相差は時間的に変化する状況であるのに対し、従来の階層符号化装置は、遅延部において固定の遅延量を用いることにより位相差を補正しているので、適切に位相補正を行えない。
図2および図3は、遅延部によって行われる位相補正が適切である場合と適切でない場合の残差信号の振幅を比較するための図である。
図2は、位相補正が適切である場合の残差信号を示している。この図に示すように、位相補正が適切である場合、第1レイヤ復号信号の位相に適合するように入力信号の位相をDサンプルだけ補正することにより、残差信号の振幅値を小さくすることが可能となっている。一方、図3は、位相補正が適切でない場合の残差信号を示している。この図に示すように、位相補正が適切でない場合、入力信号から直接第1レイヤ復号信号を減算しても、位相差が的確に補正されていないため、残差信号の振幅値は大きくなってしまう。
このように、遅延部で行われる位相補正が適切でなかった場合、残差信号の振幅が大きくなる現象が発生する。かかる場合、第2レイヤ符号化部(入力信号と第1レイヤ復号信号との位相差を問題とする場合)における符号化において多大なビットが必要となり、その結果、第2レイヤ符号化部から出力される符号化コードのビットレートが増加する。
なお、今まで説明を簡単にするために、入力信号と第1レイヤ復号信号との位相差を補正する遅延部に着目して説明をしてきたが、3つ以上のレイヤを有する階層符号化においても状況は同じである。すなわち、遅延部で補正すべき位相差が時間的に変化する場合、遅延部において固定の遅延量を用いると、下位レイヤの符号化部から出力される符号化コードのビットレートが増加するという問題がある。
よって、本発明の目的は、適切な遅延量を算出することができ、ビットレートの増加を抑えることができる階層符号化装置および階層符号化方法を提供することである。
本発明の階層符号化装置は、少なくともM階層(Mは2以上の整数)の符号化により入力信号を符号化する階層符号化装置であって、前記入力信号に遅延を与える遅延手段と、第M−1レイヤの復号信号と前記入力信号との相互相関値を算出し、前記相互相関値が最大となるときの遅延量を所定時間ごとに算出し、前記遅延量を、前記入力信号に与える前記遅延として前記遅延手段に出力する算出手段と、第Mレイヤの符号化を、前記第M−1レイヤの復号信号と、前記遅延を与えられた入力信号と、を用いて行う第Mレイヤ符号化手段と、を具備する構成を採る。
本発明によれば、適切な遅延量を算出することができ、ビットレートの増加を抑えることができる。
以下、本発明の実施の形態について、添付図面を参照して詳細に説明する。
(実施の形態1)
図4は、本発明の実施の形態1に係る階層符号化装置100の主要な構成を示すブロック図である。
階層符号化装置100には、例えば、音響データが入力され、あらかじめ定められたサンプル数で入力信号が区分されてフレーム化が行われ、第1レイヤ符号化部101に与えられる。入力信号をs(i)と表したとき、(n−1)・NF≦i<n・NFの範囲の入力信号を含むフレームが第nフレームとなる。ここでNFはフレーム長を表す。
第1レイヤ符号化部101は、第nフレームの入力信号を符号化し、第1レイヤ符号化コードを多重化部106に与えると共に、第1レイヤ復号化部102に与える。
第1レイヤ復号化部102は、第1レイヤ符号化コードから第1レイヤ復号信号を生成し、この第1レイヤ復号信号を遅延量算出部103および第2レイヤ符号化部105に与える。
遅延量算出部103は、第1レイヤ復号信号と入力信号とを用いて入力信号に与えるべき遅延量を算出し、その遅延量を遅延部104に与える。なお、遅延量算出部103の詳細については、後述する。
遅延部104は、遅延量算出部103から与えられる遅延量だけ入力信号を遅延させ、第2レイヤ符号化部105に与える。遅延量算出部103から与えられる遅延量をD(n)と表したとき、第2レイヤ符号化部105に与えられる入力信号はs(i−D(n))と表される。
第2レイヤ符号化部105は、第1レイヤ復号信号と遅延部104から与えられる入力信号とを用いて符号化を行い、第2レイヤ符号化コードを多重化部106に出力する。
多重化部106は、第1レイヤ符号化部101で求められた第1レイヤ符号化コードと第2レイヤ符号化部105で求められた第2レイヤ符号化コードとを多重化して、出力コードとして出力する。
図5は、遅延量算出部103内部の主要な構成を示すブロック図である。
遅延量算出部103には、入力信号s(i)および第1レイヤ復号信号y(i)が入力される。両信号は相関分析部121に与えられる。
相関分析部121は、入力信号s(i)と第1レイヤ復号信号y(i)との相互相関値Cor(D)を算出する。なお、相互相関値Cor(D)は、次の(式1)で定義される。
Figure 0004679513
また、各々の信号のエネルギーで正規化した次の(式2)に従っても良い。
Figure 0004679513
ここで、Dは遅延量を表し、DMIN≦D≦DMAXの範囲で相互相関値を算出する。DMINおよびDMAXは、遅延量Dの取り得る最小値および最大値を表す。
また、ここでは相互相関値の算出に(n−1)・FL≦i<n・FLの範囲の信号、つまり第nフレーム全体の信号を用いることを想定している。なお、本発明はこれに限定されず、フレーム長より長い信号もしくは短い信号を用いて相互相関値を算出することも可能である。
さらに、相互相関値Cor(D)にDの関数で表される重みw(D)を上記の(式1)の右辺もしくは(式2)の右辺に乗じたものを用いても良い。その場合、(式1)および(式2)は、次の(式3)および(式4)のように表される。
Figure 0004679513
Figure 0004679513
相関分析部121は、このように算出された相互相関値Cor(D)を最大値検出部122に与える。
最大値検出部122は、相関分析部121から与えられる相互相関値Cor(D)のうち最大値となる値を検出し、そのときの遅延量Dmax(算出遅延量)を出力する。
図6は、音声信号を処理したときに遅延量Dmaxがどのように変化するかを示した図である。図6の上段は、入力音声信号を表しており、横軸は時間、縦軸は振幅値を表す。図6の下段は、上記の(式2)に従い算出された遅延量の変化を示しており、横軸は時間、縦軸は遅延量Dmaxを表す。
図6の下段に示す遅延量は、第1レイヤ符号化部101および第1レイヤ復号化部102で生じる理論的な遅延量に対する相対値を表している。この図は、入力信号のサンプリングレートを16kHzとし、第1レイヤ符号化部101にCELP方式を用いて作成したものである。この図にあるように、入力信号に与えるべき遅延量が時間的に変動していることが分かる。なお、例えば、時間0〜0.15秒、0.2〜0.3秒の箇所を見れば、有音以外(無音もしくは背景雑音)の箇所では、遅延量Dが不安定に変動する傾向があることもわかる。
このように、本実施の形態によれば、2つのレイヤからなる階層符号化において、入力
信号と第1レイヤ復号信号とを用いて遅延量を動的に(各フレームごとに)算出する遅延量算出部103を有する。そして、第2レイヤ符号化部105は、この動的な遅延量が与えられた後の入力信号を用いて第2符号化を行う。これにより、入力信号の位相と第1レイヤ復号信号の位相をより正確に一致させることができ、第2レイヤ符号化部105のビットレートの削減を図ることができる。
さらに一般化するならば、本実施の形態は、複数レイヤからなる階層符号化の第Mレイヤ(Mは2以上の整数)の符号化において、遅延量算出部にて、入力信号と第M−1レイヤの復号信号とから遅延量を各フレームごとに求め、この遅延量に従い入力信号の遅延を行う。これにより、入力信号と低位レイヤの出力信号との類似性(位相差)が改善され、第Mレイヤ符号化部のビットレートを削減することができる。
なお、本実施の形態では、遅延量を各フレームごとに算出する場合を例にとって説明したが、遅延量の算出タイミング(算出間隔)は、フレームごとに限定されるわけではなく、特定の処理の処理単位時間を基準にして行われる。例えば、第1レイヤ符号化部でCELP方式を用いる場合、このCELPは、各フレームごとにLPC分析および符号化が行われるのが通常であるので、遅延量の算出も各フレームごとに行われる。
以下、上記の階層符号化装置100の各部について、より詳細に説明する。
図7は、第1レイヤ符号化部101にCELPを用いたときの構成を示す図である。なお、ここでは、CELPを用いた場合について説明するが、第1レイヤ符号化部101にCELPを用いることが本発明の要件ではなく、それ以外の方式を用いることも可能である。
LPC分析部131にて入力信号のLPC係数が求められる。このLPC係数は、聴感的な品質向上のために利用され、聴感重みフィルタ135と聴感重みつき合成フィルタ134とに与えられる。それと同時にLPC量子化部132に与えられ、LPC量子化部132ではLPC係数をLSP係数等の量子化に適したパラメータに変換され、量子化を行う。その量子化で得られる符号化コードが多重化部144に与えられ、かつLPC復号部133に与えられる。LPC復号部133では、符号化コードから量子化後のLSP係数を算出しLPC係数に変換する。これにより、量子化後のLPC係数が求められる。この量子化後のLPC係数が聴感重み付き合成フィルタ134に与えられ、適応符号帳136、適応ゲイン、雑音符号帳137、および雑音ゲインの符号化に利用される。
ここで聴感重みフィルタ135は、以下の(式5)で表される。
Figure 0004679513
ここで、α(i)はLPC係数、NPはLPC係数の次数、γAR、γMAは聴感重みの強さを制御するパラメータである。LPC係数は、フレーム単位で求められるため、聴感重みフィルタ135の特性はフレーム毎に変化することになる。
聴感重みフィルタ135は、LPC分析部131で求められたLPC係数に基づいて入力信号に重み付けを行う。これは、量子化歪のスペクトルを入力信号のスペクトル包絡にマスクされるようスペクトル整形を行うことを目的として行われる。
次に、適応ベクトル、適応ベクトルゲイン、雑音ベクトル、および雑音ベクトルゲインの探索方法について説明する。
適応符号帳136は、過去に生成した駆動音源信号を内部状態として保持しており、この内部状態を所望のピッチ周期で繰り返すことにより適応ベクトルを生成することができる。ピッチ周期の取る範囲は、60Hz〜400Hzの間が適当である。また、雑音符号帳137から、予め記憶領域に格納されている雑音ベクトル、または代数構造のように記憶領域を持たずに特定のルールに従い生成されるベクトルが雑音ベクトルとして出力される。ゲイン符号帳143から、適応ベクトルに乗じられる適応ベクトルゲインと、雑音ベクトルに乗じられる雑音ベクトルゲインとが出力され、乗算器138および乗算器139にてそれぞれのゲインがそれぞれのベクトルに乗じられる。加算器140にて、適応ベクトルゲインが乗じられた適応ベクトルと雑音ベクトルゲインが乗じられた雑音ベクトルとが加算されて駆動音源信号が生成され、聴感重み付き合成フィルタ134に与えられる。なお、聴感重み付き合成フィルタは、次の(式6)で表される。
Figure 0004679513
ここで、α’(i)は、量子化後のLPC係数を表す。
聴感重み付き合成フィルタ134は、駆動音源信号が通されて聴感重み付き合成信号が生成され減算器141に与えられる。減算器141は、聴感重み付き入力信号から聴感重み付き合成信号を減算し、探索部142に減算後の信号が与えられる。探索部142は、減算後の信号から定義される歪みが最小となる適応ベクトル、適応ベクトルゲイン、雑音ベクトル、および雑音ベクトルゲインの組み合わせを効率よく探索し、それら符号化コードを多重化部144に送る。この例では、適応ベクトルゲインと雑音ベクトルゲインを要素として持つベクトルとみなし、両者を同時に決定する構成を表している。しかし、この方法に限定されることはなく、適応ベクトルゲインと雑音ベクトルゲインを各々独立に決定する構成であっても良い。
全てのインデックスが決定された後に、多重化部144にてインデックスを多重化して符号化コードを生成し、出力する。それと共に、そのときのインデックスを用いて駆動音源信号を算出し、適応符号帳136に駆動音源信号を与えて次の入力信号に備える。
図8は、第1レイヤ符号化部101にCELPを用いた時の、第1レイヤ復号化部102の構成を表す。第1レイヤ復号化部102は、第1レイヤ符号化部101で求められた符号化コードを用いて第1レイヤ復号信号を生成する機能を有する。
入力される第1レイヤ符号化コードから、分離部151にて符号化コードを分離し、適応符号帳152、雑音符号帳153、ゲイン符号帳154およびLPC復号部156にそれぞれ与えられる。LPC復号部156では、与えられる符号化コードを用いてLPC係数を復号し、合成フィルタ157ならびに後処理部158に与える。
次に、適応符号帳152、雑音符号帳153、およびゲイン符号帳154は、符号化コードを利用してそれぞれ、適応ベクトルq(i)、雑音ベクトルc(i)、適応ベクトルゲインβ、および雑音ベクトルゲインγをそれぞれ復号する。ゲイン符号帳154は、適応ベクトルゲインと雑音ゲインベクトルを要素として持つベクトルとして表されていても良いし、適応ベクトルゲインと雑音ベクトルゲインを各々独立のパラメータとして保持す
る形態でも良い。どちらであるかは、第1レイヤ符号化部101のゲインの構成に依存する。
音源生成部155は、適応ベクトルに適応ベクトルゲインを乗じ、雑音ベクトルに雑音ベクトルゲインを乗じ、それぞれの乗算後の信号を加算して駆動音源信号を生成する。駆動音源信号をex(i)と表すと、駆動音源信号ex(i)は次の(式7)のように求められる。
Figure 0004679513
主観的な品質を改善するために、上記駆動音源信号に後処理的な信号処理が施される。例えば、周期性信号の周期性をより強めて音質を改善するピッチ強調処理、パルス性音源による雑音感を緩和するパルス拡散処理、背景雑音部の不必要なエネルギー変動を緩和するスムージング処理等がこれに相当する。このような処理は、時変のフィルタ処理に基づき実現されているため、出力信号の位相が変動するという現象の原因になっている。
次に、復号されたLPC係数と駆動音源信号ex(i)とを用いて、合成フィルタ157にて合成信号syn(i)を次の(式8)に従い生成する。
Figure 0004679513
ここで、αは復号されたLPC係数、NPはLPC係数の次数を表す。このように復号された復号信号syn(i)を後処理部158に与える。
後処理部158は、聴感的な音質を改善するためのポストフィルタ処理、背景雑音時の品質を改善するための雑音後処理等が適用される場合がある。このような処理は時変のフィルタ処理に基づき実現されているため、出力信号の位相が変動するという現象の原因になっている。
なお、ここでは、第1レイヤ復号化部102に後処理部158を含む構成を例にとって説明したが、このような後処理部が存在しない構成を採ることも可能である。
図9は、第2レイヤ符号化部105内部の主要な構成を示すブロック図である。
遅延部104から遅延処理された入力信号が入力され、また、第1レイヤ復号化部102から第1レイヤ復号信号が入力される。減算器161は、入力信号から第1レイヤ復号信号を減算し、その残差信号を時間領域符号化部162に与える。時間領域符号化部162は、この残差信号を符号化して第2符号化コードを生成し、出力する。なお、ここでは、CELPのようなLPC係数と駆動音源モデルとに基づいた符号化方式を利用することもできる。
図10は、図9に示した第2レイヤ符号化部105の別のバリエーション(第2レイヤ符号化部105a)を示すブロック図である。この第2レイヤ符号化部105aの特徴は、入力信号と第1レイヤ復号信号とを周波数領域に変換し、周波数領域上で符号化する方法を適用している点にある。
遅延部104から遅延処理された入力信号が入力され、周波数領域変換部163にて入力スペクトルに変換され、周波数領域符号化部164に与えられる。また、第1レイヤ復
号化部102から第1レイヤ復号信号が入力され、周波数領域変換部165にて第1レイヤ復号スペクトルに変換され、周波数領域符号化部164に与える。周波数領域符号化部164は、周波数領域変換部163、165から与えられる入力スペクトルおよび第1レイヤ復号スペクトルを用いて符号化を行い、第2符号化コードを生成し出力する。なお、周波数領域符号化部164では、聴覚マスキングを利用して聴感的な歪みを低減させる符号化方式を利用することもできる。
以下、上記の階層符号化装置100で符号化された符号化情報を復号化する階層復号化装置170の各部について、詳細に説明する。
図11は、階層復号化装置170内部の主要な構成を示すブロック図である。
階層復号化装置170には、符号化コードが入力される。分離部171は、入力された符号化コードを分離し、第1レイヤ復号化部172用の符号化コードと第2レイヤ復号化部173用の符号化コードとを生成する。第1レイヤ復号化部172は、分離部171で得られた符号化コードを用いて第1レイヤ復号信号を生成し、この復号信号を第2レイヤ復号化部173に与える。また、第1レイヤ復号信号は、直接階層復号化装置170の外部にも出力される。これにより、第1レイヤ復号化部172で生成される第1レイヤ復号信号を出力する必要が生じた場合には、この出力を利用することができる。
第2レイヤ復号化部173は、分離部171で分離された第2レイヤ符号化コードと第1レイヤ復号化部172から得られる第1レイヤ復号信号とが与えられる。第2レイヤ復号化部173は、後述する復号化処理を行い、第2レイヤ復号信号を出力する。
この構成によれば、第1レイヤ復号化部172で生成される第1レイヤ復号信号が必要の場合には、直接出力することができる。また、より品質の高い第2レイヤ復号化部173の出力信号を出力する必要がある場合には、これを出力させることもできる。いずれの復号信号が出力されるかは、アプリケーションやユーザの設定や判定結果に基づく。
図12は、第1レイヤ符号化部101にCELPが用いられた時の、第1レイヤ復号化部172内部の主要な構成を示すブロック図である。第1レイヤ復号化部172は、第1レイヤ符号化部101で生成された符号化コードを用いて第1レイヤ復号信号を生成する機能を有する。
第1レイヤ復号化部172は、入力される第1レイヤ符号化コードから、分離部181にて符号化コードを分離し、適応符号帳182、雑音符号帳183、ゲイン符号帳184、およびLPC復号部186にそれぞれ与えられる。LPC復号部186では、与えられる符号化コードを用いてLPC係数を復号し、合成フィルタ187ならびに後処理部188に与える。
次に、適応符号帳182、雑音符号帳183、およびゲイン符号帳184では、符号化コードを利用してそれぞれ適応ベクトルq(i)、雑音ベクトルc(i)、適応ベクトルゲインβ、および雑音ベクトルゲインγをそれぞれ復号する。ゲイン符号帳184は、適応ベクトルゲインと雑音ゲインベクトルを要素として持つベクトルとして表されていても良いし、適応ベクトルゲインと雑音ベクトルゲインを各々独立のパラメータとして保持する形態でも良い。どちらであるかは、第1レイヤ符号化部101のゲインの構成に依存する。
音源生成部185は、適応ベクトルに適応ベクトルゲインを乗じ、雑音ベクトルに雑音ベクトルゲインを乗じ、それぞれの乗算後の信号を加算して駆動音源信号を生成する。駆
動音源信号をex(i)と表すと、駆動音源信号ex(i)は、次の(式9)のように求められる。
Figure 0004679513
主観的な品質を改善するために、上記の駆動音源信号に後処理的な信号処理を施しても良い。例えば、周期性信号の周期性をより強めて音質を改善するピッチ強調処理、パルス性音源による雑音感を緩和するパルス拡散処理、背景雑音部の不必要なエネルギー変動を緩和するスムージング処理等がこれに相当する。
次に、復号されたLPC係数と駆動音源信号ex(i)とを用いて合成フィルタ187にて合成信号syn(i)を次の(式10)に従い生成する。
Figure 0004679513
ここで、αは復号されたLPC係数、NPはLPC係数の次数を表す。このように復号された復号信号syn(i)を後処理部188に与える。なお、後処理部188では、聴感的な音質を改善するためのポストフィルタ処理、背景雑音時の品質を改善するための雑音後処理等が適用される場合がある。なお、ここでは、第1レイヤ復号化部172に後処理部188を含む構成について説明したが、このような後処理部が存在しない構成を採ることも可能である。
図13は、第2レイヤ復号化部173内部の主要な構成を示すブロック図である。
分離部181から第2レイヤ符号化コードが入力され、時間領域復号化部191で第2レイヤ復号残差信号が生成される。なお、第2レイヤ符号化部105にてCELPのようなLPC係数と駆動音源モデルとに基づいた符号化方式が利用された場合には、第2レイヤ復号化部173では、その復号処理を行い信号を生成することになる。
加算部192は、入力される第1レイヤ復号信号と時間領域復号化部191から与えられる第2レイヤ復号残差信号とを加算して第2レイヤ復号信号を生成し、出力する。
図14は、図13に示した第2レイヤ復号化部173の別のバリエーション(第2レイヤ復号化部173a)を示すブロック図である。
この第2レイヤ復号化部173aの特徴は、第2レイヤ符号化部105が入力信号と第1レイヤ復号信号とを周波数領域に変換し、周波数領域上で符号化した場合に、この方法により生成された第2レイヤ符号化コードを復号できる点にある。
第1レイヤ復号信号が入力され、周波数領域変換部193にて第1レイヤ復号スペクトルが生成され、周波数領域復号化部194に与えられる。また、周波数領域復号化部194には、第2レイヤ符号化コードが入力される。
周波数領域復号化部194は、第2レイヤ符号化コードと第1レイヤ復号スペクトルとに基づいて第2レイヤ復号スペクトルを生成し、時間領域変換部195に与える。ここで、周波数領域復号化部194は、第2レイヤ符号化部105で用いられた周波数領域符号化に対応する復号処理を行い、第2レイヤ復号スペクトルを生成することになる。なお、この復号処理には、聴覚マスキングを利用して聴感的な歪みを低減させる符号化方式が用
いされた場合の復号処理が想定される。
時間領域変換部195は、与えられる第2レイヤ復号スペクトルを時間領域の信号に変換して第2レイヤ復号信号を生成し、出力する。ここでは、必要に応じ、適切な窓掛けおよび重ね合わせ加算等の処理を行い、フレーム間に生じる不連続を回避する。
(実施の形態2)
本発明の実施の形態2に係る階層符号化装置200は、入力信号の有音部分を検出する構成を備え、有音と判定された場合に遅延量算出部で求められた遅延量Dに従って入力信号を遅延させ、有音以外(無音もしくは背景雑音)と判定された場合は、あらかじめ定められている遅延量Dcを用いて入力信号を遅延させ、適応遅延制御は行わない。
図6の下段で既に示したように、有音以外の箇所では遅延量算出部で求められる遅延量は、不安定に変動する傾向にある。この現象は入力信号の遅延量が頻繁に変動することを意味し、この信号を用いて符号化を行うと、復号信号の品質劣化が生じてしまう。
そこで、本実施の形態では、有音以外の箇所では、あらかじめ定められた遅延量Dcを用いて入力信号を遅延させる。これにより、入力信号の遅延量が頻繁に変動する現象を抑えることができ、復号信号の品質劣化を防止することができる。
図15は、本実施の形態に係る階層符号化装置200の主要な構成を示すブロック図である。なお、この階層符号化装置は、実施の形態1に示した階層符号化装置100(図4参照)と同様の基本的構成を有しており、同一の構成要素には同一の符号を付し、その説明を省略する。
VAD部201は、入力信号を用いて入力信号が有音か有音以外(無音もしくは背景雑音)かを判定(検出)する。具体的には、VAD部201は、入力信号を分析して、例えばエネルギー情報もしくはスペクトル情報等を求め、これら情報に基づき有音判定を行う。なお、第1レイヤ符号化部101で求めたLPC係数やピッチ周期、ゲイン情報等を利用して有音判定する構成であっても良い。このようにして求めた判定情報S2を遅延量算出部202に与える。
図16は、遅延量算出部202内部の主要な構成を示すブロック図である。遅延量算出部202は、VAD部201から与えられる判定情報に基づいて、有音と判定された場合には最大値検出部122にて求められた遅延量D(n)を出力する。一方、判定情報が有音でない場合には、遅延量算出部202は、バッファ211に予め記録されている遅延量Dcを出力する。
(実施の形態3)
本発明の実施の形態3に係る階層符号化装置は、内部の遅延量算出部301において、前フレーム(第n−1フレーム)で求めた遅延量D(n−1)をバッファに保持しておいて、現フレーム(第nフレーム)で相関分析を行うときの分析範囲を、D(n−1)の近傍に限定する。すなわち、現フレームで使用する遅延量を前フレームで使用した遅延量の一定範囲内に収まるように制限を加える。よって、図6の下段のように遅延量Dが大きく変動する場合に、出力される復号信号に不連続な部分が発生して、その結果異音が生じる問題を回避することができる。
本実施の形態に係る階層符号化装置は、実施の形態1に示した階層符号化装置100(図4参照)と同様の基本的構成を有しているので、その説明を省略する。
図17は、上記の遅延量算出部301の主要な構成を示すブロック図である。なお、この遅延量算出部301も、実施の形態1に示した遅延量算出部103と同様の基本的構成を有しており、同一の構成要素には同一の符号を付し、その説明を省略する。
バッファ302は、前フレーム(第n−1フレーム)で求められた遅延量D(n−1)の値を保持しており、この遅延量D(n−1)を分析範囲決定部303に与える。分析範囲決定部303は、現フレーム(第nフレーム)の遅延量を決定するための相互相関値を求める際の遅延量の範囲を決定し、相関分析部121aに与える。現フレームの遅延量D(n)の分析範囲を表すRminおよびRmaxは、前フレームの遅延量D(n−1)を用いて次の(式11)および(式12)のように表すことができる。
Figure 0004679513
Figure 0004679513
ここで、DMINはRminの取り得る最小値、DMAXはRmaxの取り得る最大値を表し、Min( )は入力値のうちの最小値を出力する関数、Max( )は入力値のうちの最大値を出力する関数を表す。また、Hは前フレームの遅延量D(n−1)に対する探索範囲を表す。
相関分析部121aは、分析範囲決定部303から与えられる分析範囲Rmin≦D≦Rmaxの範囲に含まれる遅延量Dに対して相関分析を行い、相互相関値Cor(D)を算出し、最大値検出部122に与える。最大値検出部122は、相互相関値Cor(D){ただし、Rmin≦D≦Rmax}の中で最大となる時の遅延量Dを求め、これを第nフレームの遅延量D(n)として出力する。それと共にバッファ302に遅延量D(n)を与え、次のフレームの処理に備える。
なお、本実施の形態では、現フレームの遅延量に対し、この遅延量が前フレームで使用された遅延量の一定範囲内に収まるような制限が加えられる形態を説明したが、現フレームで使用される遅延量を所定の範囲内、例えば、予め定められた標準遅延量なるものを設定しておいて、この標準遅延量に対し一定範囲内に収まるような制限を加えるような形態であっても良い。
(実施の形態4)
本発明の実施の形態4に係る階層符号化装置は、相関分析部の前段にアップサンプリング部を設け、入力信号のサンプリングレートを増加(アップサンプリング)させた後に、第1レイヤ復号信号との相関分析を行い、遅延量の算出を行う。よって、小数値で表される精度の高い遅延量を求めることができる。
本実施の形態に係る階層符号化装置は、実施の形態1に示した階層符号化装置100(図4参照)と同様の基本的構成を有しているので、その説明を省略する。
図18は、本実施の形態に係る遅延量算出部401の主要な構成を示すブロック図である。なお、この遅延量算出部401も、実施の形態1に示した遅延量算出部103と同様の基本的構成を有しており、同一の構成要素には同一の符号を付し、その説明を省略する。
アップサンプリング部402は、入力信号s(i)のアップサンプリングを行い、サンプリングレートを上げた信号s’(i)を生成し、相関分析部121bにアップサンプリング
後の入力信号s’(i)を与える。なお、以下、サンプリングレートをU倍にする場合を例にとって説明を行う。
相関分析部121bは、アップサンプリング後の入力信号s’(i)と第1レイヤ復号信号y(i)とを用いて相互相関値Cor(D)を算出する。相互相関値Cor(D)は以下の(式13)によって算出される。
Figure 0004679513
また、次の(式14)に従っても良い。
Figure 0004679513
または、前述したように重み関数w(D)を乗じた式に従っても良い。相関分析部121bは、このようにして算出された相互相関値を最大値検出部122bに与える。
最大値検出部122bは、相互相関値Cor(D)が最も最大となるときのDを求め、比D/Uで表される小数値を遅延量D(n)として出力する。
なお、相関分析部121bで求めたアップサンプリング後の入力信号s’(i)に対し遅延量D/Uだけ位相のずれた信号を、第2レイヤ符号化部105に直接与えても良い。第2レイヤ符号化部105に与える信号をs”(i)とすると、s”(i)は、以下の(式15)のように表される。
Figure 0004679513
このように、入力信号のサンプリングレートを増加させた後に遅延量を算出するため、より精度の高い遅延量に基づき処理を行うことが可能になる。さらに、アップサンプリング後の入力信号を直接第2レイヤ符号化部に与えることを行えば、新たなアップサンプリング処理を行う必要がなくなり、演算量の増加を防ぐことが可能となる。
(実施の形態5)
本実施の形態では、第1レイヤ符号化部101に与えられる入力信号のサンプリングレート(サンプリング周波数)、すなわち、第1レイヤ復号化部102の出力信号のサンプリングレートと、第2レイヤ符号化部105に与えられる入力信号のサンプリングレートとが異なる場合でも、符号化を行うことができる階層符号化装置を開示する。すなわち、本発明の実施の形態5に係る階層符号化装置は、第1レイヤ符号化部101の前段にダウンサンプリング部501を備え、第1レイヤ復号化部102の後段にアップサンプリング部502を備える。
この構成によれば、遅延量算出部103に入力される2つの信号のサンプリングレートを揃えることができるので、周波数軸方向にスケーラビリティを有する帯域スケーラブル符号化に対応することが可能となる。
図19は、本実施の形態に係る階層符号化装置500の主要な構成を示すブロック図である。なお、この階層符号化装置は、実施の形態1に示した階層符号化装置100と同様の基本的構成を有しており、同一の構成要素には同一の符号を付し、その説明を省略する。
ダウンサンプリング部501は、入力信号のサンプリングレートを下げ、第1レイヤ符号化部101に与える。入力信号のサンプリングレートをFs、第1レイヤ符号化部101に与える入力信号のサンプリングレートをFs1とすると、ダウンサンプリング部501は、入力信号のサンプリングレートがFsからFs1に変換されるようにダウンサンプリング処理を行う。
アップサンプリング部502は、第1レイヤ復号信号のサンプリングレートを上げた後に、この信号を遅延量算出部103および第2レイヤ符号化部105に与える。第1レイヤ復号化部102より与えられる第1レイヤ復号信号のサンプリングレートをFs1、遅延量算出部103および第2レイヤ符号化部105に与える信号のサンプリングレートをFs2とすると、アップサンプリング部502は、第1レイヤ復号信号のサンプリングレートがFs1からFs2に変換されるようにアップサンプリング処理を行う。
なお、本実施の形態では、サンプリングレートFsとFs2とは同じ値である。かかる場合、実施の形態1〜4で既に述べた各遅延量算出部を適用することができる。
(実施の形態6)
図20は、本発明の実施の形態6に係る階層符号化装置600の主要な構成を示すブロック図である。なお、この階層符号化装置600は、実施の形態1に示した階層符号化装置100と同様の基本的構成を有しており、同一の構成要素には同一の符号を付し、その説明を省略する。
本実施の形態も、実施の形態5と同様に、第1レイヤ符号化部101に与えられる入力信号のサンプリングレートと第2レイヤ符号化部105に与えられる入力信号のサンプリングレートとが異なる。本実施の形態に係る階層符号化装置600は、第1レイヤ符号化部101の前段にダウンサンプリング部601を設けるが、実施の形態5と異なり、第1レイヤ復号化部102の後段にはアップサンプリング部502を設置しない。
本実施の形態によれば、第1レイヤ符号化部101の後段にアップサンプリング部502が必要ないために、このアップサンプリング部で必要な演算量や遅延の増加を回避することができる。
なお、本実施の形態の構成において、第2レイヤ符号化部105は、サンプリングレートFsの入力信号とサンプリングレートFs1の第1レイヤ復号信号を用いて第2レイヤ符号化コードを生成することになる。よって、実施の形態1等で示した遅延量算出部103と異なる動作を行う遅延量算出部602が設置されている。遅延量算出部602には、サンプリングレートFsの入力信号と、サンプリングレートFs1の第1レイヤ復号信号とが入力される。
図21は、遅延量算出部602内部の主要な構成を示すブロック図である。
サンプリングレートFsの入力信号と、サンプリングレートFs1の第1レイヤ復号信号とは、変形相関分析部611に与えられる。変形相関分析部611は、サンプリングレートFsとFs1との関係から適切なサンプル間隔のサンプル値を用いて相互相関値を算
出する。具体的には、以下のような処理を行う。
サンプリングレートFsとFs1の最小公倍数をGとしたとき、入力信号のサンプル間隔Uと第1レイヤ出力信号のサンプル間隔Vは、次の(式16)および(式17)のように表される。
Figure 0004679513
Figure 0004679513
このとき、変形相関分析部611で算出される相互相関値Cor(D)は、次の(式18)のように表される。
Figure 0004679513
また、次の(式19)に従っても良い。
Figure 0004679513
または、前述したように重み関数w(D)を乗じた式に従っても良い。このようにして算出された相互相関値を最大値検出部122に与える。
図22は、変形相関分析部611において行われる処理の概要を説明するための図である。なお、ここでは、入力信号のサンプリングレートFsが16kHz、第1レイヤ復号信号のサンプリングレートFs1が8kHzの条件のときの処理を表している。
サンプリングレートが上記の条件のとき、最小公倍数Gは16000となるので、入力信号のサンプル間隔Uと第1レイヤ出力信号のサンプル間隔Vは、それぞれ、U=2、V=1となる。そこで、このサンプル間隔の関係に従い、図に示されるように相互相関値が算出される。
図23は、変形相関分析部611において行われる処理の別のバリエーションを示す図である。なお、ここでは、入力信号のサンプリングレートFsが24kHz、第1レイヤ復号信号のサンプリングレートFs1が16kHzの条件のときの処理を表している。
サンプリングレートが上記の条件のとき、最小公倍数Gは48000となるので、入力信号のサンプル間隔Uと第1レイヤ出力信号のサンプル間隔Vは、それぞれ、U=3、V=2となる。そこで、このサンプル間隔の関係に従い、図に示されるように相互相関値が算出される。
(実施の形態7)
本発明の実施の形態7に係る階層符号化装置は、内部の遅延量算出部701において前フレームで求めた遅延量D(n−1)をバッファに保持し、現フレームで相関分析を行うときの分析範囲をD(n−1)の近傍に限定する。よって、図6の下段のように遅延量Dが大きく変動する場合に、入力信号に不連続な部分が発生し、その結果異音が生じる問題を回避することができる。
本実施の形態に係る階層符号化装置は、実施の形態1に示した階層符号化装置100(図4参照)と同様の基本的構成を有しているので、その説明を省略する。
図24は、上記の遅延量算出部701の主要な構成を示すブロック図である。なお、この遅延量算出部701は、実施の形態3に示した遅延量算出部301と同様の基本的構成を有しており、同一の構成要素には同一の符号を付し、その説明を省略する。また、変形相関分析部611aは、実施の形態6に示した変形相関分析部611と同様の機能を有している。
バッファ302は、前フレーム(第n−1フレーム)で求められた遅延量D(n−1)の値を保持しており、この遅延量D(n−1)を分析範囲決定部303に与える。分析範囲決定部303は、現フレーム(第nフレーム)の遅延量を決定するための相互相関値を求める際の遅延量の範囲を決定し、この範囲を変形相関分析部611aに与える。現フレームの遅延量D(n)の分析範囲を表すRminとRmaxは、前フレームの遅延量D(n−1)を用いて次の(式20)および(式21)のように表すことができる。
Figure 0004679513
Figure 0004679513
ここで、DMINはRminの取り得る最小値、DMAXはRmaxの取り得る最大値を表し、Min( )は入力値の内の最小値を出力する関数、Max( )は入力値の内の最大値を出力する関数を表す。また、Hは前フレームの遅延量D(n−1)に対する探索範囲を表す。
変形相関分析部611aは、分析範囲決定部303から与えられる分析範囲Rmin≦D≦Rmaxの範囲に含まれる遅延量Dに対して相関分析を行い、相互相関値Cor(D)を算出し、最大値検出部122に与える。最大値検出部122は、相互相関値Cor(D){ただし、Rmin≦D≦Rmax}の中で最大となる時の遅延量Dを求め、これを第nフレームの遅延量D(n)として出力する。これと共に、変形相関分析部611aは、バッファ302に遅延量D(n)を与え、次のフレームの処理に備える。
(実施の形態8)
本発明の実施の形態8に係る階層符号化装置は、入力信号のサンプリングレートを上げた後に第1レイヤ復号信号との相関分析を行う。よって、小数値で表される精度の高い遅延量を求めることができる。
本実施の形態に係る階層符号化装置は、実施の形態1に示した階層符号化装置100(図4参照)と同様の基本的構成を有しているので、その説明を省略する。
図25は、本実施の形態に係る遅延量算出部801の主要な構成を示すブロック図である。なお、この遅延量算出部801は、実施の形態6に示した遅延量算出部602と同様の基本的構成を有しており、同一の構成要素には同一の符号を付し、その説明を省略する
アップサンプリング部802は、入力信号s(i)のアップサンプリングを行いサンプリングレートを上げた信号s’(i)を生成し、変形相関分析部611bにアップサンプリング後の入力信号s’(i)を与える。なお、ここでは、サンプリングレートをT倍にする場合を例にとって説明する。
変形相関分析部611bは、アップサンプリング後の入力信号s’(i)のサンプリングレートT・FsとFs1との関係から、適切なサンプル間隔のサンプル値を用いて相互相関値を算出する。具体的には、次のような処理を行う。
サンプリングレートT・FsとFs1の最小公倍数をGとしたとき、入力信号のサンプル間隔Uと第1レイヤ出力信号のサンプル間隔Vは、次の(式22)および(式23)のように表される。
Figure 0004679513
Figure 0004679513
このとき、変形相関分析部611bで算出される相互相関値Cor(D)は、次の(式24)のように表される。
Figure 0004679513
また、次の(式25)に従っても良い。
Figure 0004679513
または、前述したように重み関数w(D)を乗じた式に従っても良い。このようにして算出された相互相関値を最大値検出部122bに与える。
以上、本発明に係る各実施の形態について説明した。
本発明に係る階層符号化装置は、上記各実施の形態に限定されず、種々変更して実施することが可能である。例えば、各実施の形態は、適宜組み合わせて実施することが可能である。
本発明に係る階層符号化装置は、移動体通信システムにおける通信端末装置および基地局装置に搭載することも可能であり、これにより上記と同様の作用効果を有する通信端末装置および基地局装置を提供することができる。
なお、ここでは、レイヤ数が2の場合を例にとって説明したが、レイヤ数はこれに限られず、レイヤ数が2以上の階層符号化にも本発明は適用可能である。
また、ここでは、入力信号と第1レイヤ復号信号の位相差を補正するように入力信号の位相を制御する方法について説明したが、逆に両信号の位相差を補正するように第1レイヤ復号信号の位相を制御する構成であっても良い。この場合、第1レイヤ復号信号の位相をどのように制御したかを示す情報を符号化して、復号化部に伝送する必要がある。
また、上記各実施の形態で用いた雑音符号帳は、固定符号帳(fixed codebook)、確率符号帳(stochastic codebook)、または乱数符号帳(random codebook)と呼ばれることもある。
また、ここでは、本発明をハードウェアで構成する場合を例にとって説明したが、本発明はソフトウェアで実現することも可能である。例えば、本発明に係る階層符号化方法のアルゴリズムをプログラミング言語によって記述し、このプログラムをメモリに記憶しておいて情報処理手段によって実行させることにより、本発明の階層符号化装置と同様の機能を実現することができる。
また、上記各実施の形態の説明に用いた各機能ブロックは、典型的には集積回路であるLSIとして実現される。これらは個別に1チップ化されていても良いし、一部または全てを含むように1チップ化されていても良い。
また、ここではLSIとしたが、集積度の違いによって、IC、システムLSI、スーパーLSI、ウルトラLSI等と呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路または汎用プロセッサで実現しても良い。LSI製造後に、プログラム化することが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続もしくは設定を再構成可能なリコンフィギュラブル・プロセッサを利用しても良い。
さらに、半導体技術の進歩または派生する別技術により、LSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行っても良い。バイオ技術の適応等が可能性としてあり得る。
本明細書は、2004年4月28日出願の特願2004−134519に基づく。この内容はすべてここに含めておく。
本発明に係る階層符号化装置および階層符号化方法は、移動体通信システム等において有用である。
従来の階層符号化装置の構成を示すブロック図 位相補正が適切である場合の残差信号を示す図 位相補正が適切でない場合の残差信号を示す図 実施の形態1に係る階層符号化装置の主要な構成を示すブロック図 実施の形態1に係る遅延量算出部内部の主要な構成を示すブロック図 音声信号を処理したときに遅延量Dmaxがどのように変化するかを示した図 実施の形態1に係る第1レイヤ符号化部にCELPを用いたときの構成を示す図 実施の形態1に係る第1レイヤ復号化部の構成を表す図 実施の形態1に係る第2レイヤ符号化部内部の主要な構成を示すブロック図 実施の形態1に係る第2レイヤ符号化部の別のバリエーションを示すブロック図 実施の形態1に係る階層復号化装置内部の主要な構成を示すブロック図 実施の形態1に係る第1レイヤ復号化部内部の主要な構成を示すブロック図 実施の形態1に係る第2レイヤ復号化部内部の主要な構成を示すブロック図 実施の形態1に係る第2レイヤ復号化部の別のバリエーションを示すブロック図 実施の形態2に係る階層符号化装置の主要な構成を示すブロック図 実施の形態2に係る遅延量算出部内部の主要な構成を示すブロック図 実施の形態3に係る遅延量算出部の主要な構成を示すブロック図 実施の形態4に係る遅延量算出部の主要な構成を示すブロック図 実施の形態5に係る階層符号化装置の主要な構成を示すブロック図 実施の形態6に係る階層符号化装置の主要な構成を示すブロック図 実施の形態6に係る遅延量算出部内部の主要な構成を示すブロック図 実施の形態6に係る変形相関分析部において行われる処理の概要を説明するための図 実施の形態6に係る変形相関分析部において行われる処理の別のバリエーションを示す図 実施の形態7に係る遅延量算出部の主要な構成を示すブロック図 実施の形態8に係る遅延量算出部の主要な構成を示すブロック図

Claims (10)

  1. 少なくともM階層(Mは2以上の整数)の符号化により入力信号を符号化する階層符号化装置であって、
    前記入力信号に遅延を与える遅延手段と、
    第M−1レイヤの復号信号と前記入力信号との相互相関値を算出し、前記相互相関値が最大となるときの遅延量を所定時間ごとに算出し、前記遅延量を、前記入力信号に与える前記遅延として前記遅延手段に出力する算出手段と、
    第Mレイヤの符号化を、前記第M−1レイヤの復号信号と、前記遅延を与えられた入力信号と、を用いて行う第Mレイヤ符号化手段と、
    を具備する階層符号化装置。
  2. 前記算出手段は、
    前記遅延手段で与える遅延を、前記第M−1レイヤの符号化の処理単位時間ごとに算出する、
    請求項1記載の階層符号化装置。
  3. 前記入力信号が有音であるか否か判定する判定手段をさらに具備し、
    前記算出手段は、
    前記入力信号が有音であると判定された場合、前記遅延手段で与える遅延を所定時間ごとに算出し、前記入力信号が有音でないと判定された場合、前記遅延手段で与える遅延を予め定められた固定値とする、
    請求項1記載の階層符号化装置。
  4. 前記算出手段は、
    前記遅延手段で与える遅延を、前回算出した遅延に対して一定範囲内に収まるように算出する、
    請求項1記載の階層符号化装置。
  5. 前記算出手段は、
    前記遅延手段で与える遅延を、予め定められた所定の範囲内で算出する、
    請求項1記載の階層符号化装置。
  6. 前記算出手段は、
    前記入力信号を予めアップサンプリングし、算出する遅延の精度を高める、
    請求項1記載の階層符号化装置。
  7. 前記算出手段は、
    前記第M−1レイヤの復号信号のサンプル数と前記入力信号のサンプル数とが異なる場合、サンプル数の少ない方の信号に揃えてサンプル数の多い方の信号の一部のサンプルを用いて、これら2つの信号の相互相関値を、前記第M−1レイヤの復号信号と前記入力信号との前記相互相関値として算出する、
    請求項1記載の階層符号化装置。
  8. 請求項1記載の階層符号化装置を具備する通信端末装置。
  9. 請求項1記載の階層符号化装置を具備する基地局装置。
  10. 少なくともM階層(Mは2以上の整数)の符号化により入力信号を符号化する階層符号化方法であって、
    第M−1レイヤの復号信号と前記入力信号との相互相関値を算出し、前記相互相関値が最大となるときの、前記第M−1レイヤの復号信号と前記入力信号との間の遅延量を前記入力信号に与える遅延として、所定時間ごとに算出する算出ステップと、
    前記入力信号に遅延を与える遅延ステップと、
    第Mレイヤの符号化を、前記第M−1レイヤの復号信号と、前記遅延を与えられた入力信号と、を用いて行う第Mレイヤ符号化ステップと、
    を具備する階層符号化方法。
JP2006512764A 2004-04-28 2005-04-22 階層符号化装置および階層符号化方法 Expired - Fee Related JP4679513B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2004134519 2004-04-28
JP2004134519 2004-04-28
PCT/JP2005/007710 WO2005106850A1 (ja) 2004-04-28 2005-04-22 階層符号化装置および階層符号化方法

Publications (2)

Publication Number Publication Date
JPWO2005106850A1 JPWO2005106850A1 (ja) 2007-12-13
JP4679513B2 true JP4679513B2 (ja) 2011-04-27

Family

ID=35241898

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006512764A Expired - Fee Related JP4679513B2 (ja) 2004-04-28 2005-04-22 階層符号化装置および階層符号化方法

Country Status (9)

Country Link
US (1) US7949518B2 (ja)
EP (1) EP1736965B1 (ja)
JP (1) JP4679513B2 (ja)
KR (1) KR20070007851A (ja)
CN (1) CN1947173B (ja)
AT (1) ATE403217T1 (ja)
BR (1) BRPI0510513A (ja)
DE (1) DE602005008574D1 (ja)
WO (1) WO2005106850A1 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8626503B2 (en) * 2005-07-14 2014-01-07 Erik Gosuinus Petrus Schuijers Audio encoding and decoding
BRPI0613469A2 (pt) * 2005-07-14 2012-11-06 Koninkl Philips Electronics Nv aparelhos e métodos para gerar um número de canais de áudio de saìda e um fluxo de dados, fluxo de dados, meio de armazenamento, receptor para gerar um número de canais de áudio de saìda, transmissor para gerar um fluxo de dados, sistema de transmissão, métodos de recepção e de transmissão de um fluxo de dados, produto de programa de computador, e, dispositivos de reprodução de áudio e de gravação de áudio
EP2116998B1 (en) * 2007-03-02 2018-08-15 III Holdings 12, LLC Post-filter, decoding device, and post-filter processing method
CN100524462C (zh) * 2007-09-15 2009-08-05 华为技术有限公司 对高带信号进行帧错误隐藏的方法及装置
JPWO2009081567A1 (ja) * 2007-12-21 2011-05-06 パナソニック株式会社 ステレオ信号変換装置、ステレオ信号逆変換装置およびこれらの方法
CN101771417B (zh) * 2008-12-30 2012-04-18 华为技术有限公司 信号编码、解码方法及装置、***
EP2306456A1 (en) * 2009-09-04 2011-04-06 Thomson Licensing Method for decoding an audio signal that has a base layer and an enhancement layer
CN102081927B (zh) * 2009-11-27 2012-07-18 中兴通讯股份有限公司 一种可分层音频编码、解码方法及***
MX352581B (es) * 2012-05-21 2017-11-29 Genentech Inc Anticuerpos e inmunoconjugados contra ly6e y metodos de uso.
EP2894860A1 (en) * 2014-01-14 2015-07-15 Thomson Licensing Method and apparatus for multiplexing layered coded contents
CN110336644B (zh) * 2019-07-15 2020-12-15 杭州泽铭睿股权投资有限公司 一种高维调制下的分层编码方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0998434A (ja) * 1995-09-29 1997-04-08 Toshiba Corp 画像符号化装置および画像復号化装置
JP2001028757A (ja) * 1996-03-22 2001-01-30 Sony Corp 画像信号の符号化方法、伝送方法及び復号方法、符号化装置、伝送装置及び復号装置
JP2001142496A (ja) * 1999-11-11 2001-05-25 Sony Corp ディジタル信号処理装置および処理方法、ディジタル信号記録装置および記録方法、並びに記録媒体
JP2001142497A (ja) * 1999-11-11 2001-05-25 Sony Corp ディジタル信号処理装置および処理方法、ディジタル信号記録装置および記録方法、並びに記録媒体
JP2003280694A (ja) * 2002-03-26 2003-10-02 Nec Corp 階層ロスレス符号化復号方法、階層ロスレス符号化方法、階層ロスレス復号方法及びその装置並びにプログラム
JP2003323199A (ja) * 2002-04-26 2003-11-14 Matsushita Electric Ind Co Ltd 符号化装置、復号化装置及び符号化方法、復号化方法
JP2004101720A (ja) * 2002-09-06 2004-04-02 Matsushita Electric Ind Co Ltd 音響符号化装置及び音響符号化方法
JP2004102186A (ja) * 2002-09-12 2004-04-02 Matsushita Electric Ind Co Ltd 音響符号化装置及び音響符号化方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62234435A (ja) * 1986-04-04 1987-10-14 Kokusai Denshin Denwa Co Ltd <Kdd> 符号化音声の復号化方式
US5054075A (en) * 1989-09-05 1991-10-01 Motorola, Inc. Subband decoding method and apparatus
US5388209A (en) * 1991-08-02 1995-02-07 Sony Corporation Apparatus for high-speed recording compressed digital data with increased compression
DE4243831A1 (de) * 1992-12-23 1994-06-30 Daimler Benz Ag Verfahren zur Laufzeitschätzung an gestörten Sprachkanälen
JPH0846517A (ja) 1994-07-28 1996-02-16 Sony Corp 高能率符号化及び復号化システム
JP3139602B2 (ja) 1995-03-24 2001-03-05 日本電信電話株式会社 音響信号符号化方法及び復号化方法
FI964975A (fi) * 1996-12-12 1998-06-13 Nokia Mobile Phones Ltd Menetelmä ja laite puheen koodaamiseksi
US6868377B1 (en) * 1999-11-23 2005-03-15 Creative Technology Ltd. Multiband phase-vocoder for the modification of audio or speech signals
US6757648B2 (en) * 2001-06-28 2004-06-29 Microsoft Corporation Techniques for quantization of spectral data in transcoding
GB0120450D0 (en) * 2001-08-22 2001-10-17 Mitel Knowledge Corp Robust talker localization in reverberant environment
WO2003091989A1 (en) 2002-04-26 2003-11-06 Matsushita Electric Industrial Co., Ltd. Coding device, decoding device, coding method, and decoding method
US7356748B2 (en) * 2003-12-19 2008-04-08 Telefonaktiebolaget Lm Ericsson (Publ) Partial spectral loss concealment in transform codecs

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0998434A (ja) * 1995-09-29 1997-04-08 Toshiba Corp 画像符号化装置および画像復号化装置
JP2001028757A (ja) * 1996-03-22 2001-01-30 Sony Corp 画像信号の符号化方法、伝送方法及び復号方法、符号化装置、伝送装置及び復号装置
JP2001142496A (ja) * 1999-11-11 2001-05-25 Sony Corp ディジタル信号処理装置および処理方法、ディジタル信号記録装置および記録方法、並びに記録媒体
JP2001142497A (ja) * 1999-11-11 2001-05-25 Sony Corp ディジタル信号処理装置および処理方法、ディジタル信号記録装置および記録方法、並びに記録媒体
JP2003280694A (ja) * 2002-03-26 2003-10-02 Nec Corp 階層ロスレス符号化復号方法、階層ロスレス符号化方法、階層ロスレス復号方法及びその装置並びにプログラム
JP2003323199A (ja) * 2002-04-26 2003-11-14 Matsushita Electric Ind Co Ltd 符号化装置、復号化装置及び符号化方法、復号化方法
JP2004101720A (ja) * 2002-09-06 2004-04-02 Matsushita Electric Ind Co Ltd 音響符号化装置及び音響符号化方法
JP2004102186A (ja) * 2002-09-12 2004-04-02 Matsushita Electric Ind Co Ltd 音響符号化装置及び音響符号化方法

Also Published As

Publication number Publication date
JPWO2005106850A1 (ja) 2007-12-13
CN1947173B (zh) 2011-02-09
BRPI0510513A (pt) 2007-10-30
DE602005008574D1 (de) 2008-09-11
EP1736965B1 (en) 2008-07-30
CN1947173A (zh) 2007-04-11
KR20070007851A (ko) 2007-01-16
US7949518B2 (en) 2011-05-24
EP1736965A4 (en) 2007-07-11
ATE403217T1 (de) 2008-08-15
EP1736965A1 (en) 2006-12-27
US20070233467A1 (en) 2007-10-04
WO2005106850A1 (ja) 2005-11-10

Similar Documents

Publication Publication Date Title
JP4679513B2 (ja) 階層符号化装置および階層符号化方法
US8069040B2 (en) Systems, methods, and apparatus for quantization of spectral envelope representation
CN101180676B (zh) 用于谱包络表示的向量量化的方法和设备
JP2005513539A (ja) 音声信号の効率的コーディングのための信号修正方法
US20100010810A1 (en) Post filter and filtering method
JP3357795B2 (ja) 音声符号化方法および装置
US10672411B2 (en) Method for adaptively encoding an audio signal in dependence on noise information for higher encoding accuracy
JPWO2010103854A1 (ja) 音声符号化装置、音声復号装置、音声符号化方法及び音声復号方法
US20100153099A1 (en) Speech encoding apparatus and speech encoding method
JPWO2008018464A1 (ja) 音声符号化装置および音声符号化方法
JP4373693B2 (ja) 音響信号の階層符号化方法および階層復号化方法
JP4820954B2 (ja) デジタル音声符号器における高調波ノイズ重み付け
JP2004151424A (ja) トランスコーダ及び符号変換方法
JP6001451B2 (ja) 符号化装置及び符号化方法
JP2003195900A (ja) 音声信号符号化装置、音声信号復号装置及び音声信号符号化方法
JPH09185396A (ja) 音声符号化装置
JP2002366172A (ja) ピッチ成分を抑圧した線形予測分析方法及び線形予測分析回路

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080317

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100914

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101112

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110111

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110201

R150 Certificate of patent or registration of utility model

Ref document number: 4679513

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140210

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees