JP5491193B2 - 音声コード化の方法および装置 - Google Patents

音声コード化の方法および装置 Download PDF

Info

Publication number
JP5491193B2
JP5491193B2 JP2009543393A JP2009543393A JP5491193B2 JP 5491193 B2 JP5491193 B2 JP 5491193B2 JP 2009543393 A JP2009543393 A JP 2009543393A JP 2009543393 A JP2009543393 A JP 2009543393A JP 5491193 B2 JP5491193 B2 JP 5491193B2
Authority
JP
Japan
Prior art keywords
signal
frequency
time filter
generating
limited
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009543393A
Other languages
English (en)
Other versions
JP2010515090A (ja
Inventor
アレクサンドレ デラットレ
Original Assignee
モビクリップ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by モビクリップ filed Critical モビクリップ
Publication of JP2010515090A publication Critical patent/JP2010515090A/ja
Application granted granted Critical
Publication of JP5491193B2 publication Critical patent/JP5491193B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)

Description

本発明は、音声コード化の方法および装置に関する。詳しくは、音声スペクトルのすべて、またはその一部分を増強するコード化に関し、具体的には、コンピュータ・ネットワーク、たとえばインターネット上でのその送信、あるいはデジタル情報媒体上へのその記憶を目的としたコード化に関する。本方法および装置は、すべてのハードウェア・プラットフォーム上で音声信号を圧縮し、次いで解凍するために、どのようなシステム中にも組み込むことができる。
音声圧縮では、音声信号の帯域幅を限定することによって、しばしばその速度を低下させる。一般に、低周波だけが保持される、というのは人間の耳は、高周波より低周波において、より良好なスペクトル分解能と感度を有するからである。通常、信号の低周波だけが保持され、それによってデータの送信速度が全面的により低くなる。低周波に含まれる高調波が高周波中にも存在するので、従来技術によるいくつかの方法は、低周波に限定された信号から、人為的に高周波を再現することを可能にする高調波を抽出しようと試みている。
これらの方法は、一般に、低周波スペクトルを置き換えることによって、高周波スペクトルを再現することからなるスペクトル増強に基づいており、この高周波スペクトルは、スペクトル的に再形成される。したがって、その結果得られた信号は、低周波部分については受信された低周波信号から構成され、高周波部分については再形成された増強部から構成される。
圧縮、および最初の周波数の帯域幅を圧縮し限定するために使用される方法によって、信号の品質を損なう生成物が発生することが判明している。さらに、受信時での高品質信号の再構成は、送信データの帯域幅が狭く、および受信時の処理が簡単で高速であることだけを要して、可能な最良の知覚品質をもたらすことを可能にしなければならない。
この問題は、周波数が限定された信号を表すデータに加えて、ブロード化された信号の全体に適用されることになる時間フィルタに関する情報を、その送信される低周波部分およびその再構成される高周波部分の両方で送信することによって有利に解決される。このフィルタの適用によって、再構成された高周波部分の再形成と、送信された低周波部分に存在する圧縮生成物の修正が可能になる。このようにして、再構成された信号の全体への時間フィルタの適用は、簡単で費用がかからず、それによって良好な品質の知覚信号を生成することが可能になる。
本発明は、信号をコード化する方法に関し、前記方法は、
−周波数が限定された信号を生成する工程であって、元の信号のスペクトルが、高周波の抑制によって低減される、工程と、
−時間フィルタを生成する工程であって、前記時間フィルタは、前記限定された信号のスペクトルのブロード化によって生成された信号に適用されたとき、前記元の信号にスペクトル的に近い信号を見出すためのものである、工程とを少なくとも含む。
本発明の特定の実施形態によれば、前記元の信号の所与の一部分に対して、前記フィルタは、前記元の信号の一部分に、および前記限定された信号のスペクトルのブロード化によって生成された信号の対応する部分に適用されたフーリエ変換の係数の関数の要素対要素除算によって生成される。
本発明の特定の実施形態によれば、異なるサイズのフーリエ変換が、使用される各サイズに対応する複数のフィルタを生成するために使用される。前記生成されたフィルタは、前記元の信号と、前記限定された信号のスペクトルをブロード化して生成された信号に前記フィルタを適用して生成された信号とを比較することによってなされた前記複数のフィルタからの選択に対応する。
本発明の特定の実施形態によれば、前記選択は、所定の時間フィルタの集合体からに拡張される。
本発明の特定の実施形態によれば、前記周波数が限定された合成信号は、その送信を目的としてコード化され、前記フィルタは、前記コード化され限定された合成信号のスペクトルを復号しブロード化して生成された信号と、前記元の信号とを使用して生成される。
本発明は、また、信号を復号する方法に関し、前記方法は、
−送信された信号を受信する工程と、
−前記受信された信号に関する時間フィルタを受信する工程と、
−前記受信された信号を復号することによって、復号された信号を生成する工程と、
−前記復号された信号のスペクトルをブロード化することによって、拡張された信号を生成する工程と、
−前記受信された前記時間フィルタによる、前記拡張された信号の畳み込みによって、再構成された信号を生成する工程とを少なくとも含む。
本発明の特定の実施形態によれば、前記生成されたフィルタからサイズが減少されたフィルタが、前記再構成された信号を生成する工程で、この生成されたフィルタの代わりに使用される。
本発明の特定の実施形態によれば、前記生成されたフィルタの代わりにサイズが減少されたフィルタを使用するという前記選択は、デコーダの能力に従って行われる。
本発明は、また、信号をコード化するための装置に関し、前記装置は、
−周波数が限定された信号を生成する手段であって、元の信号のスペクトルが、高周波の抑制によって減少される、手段と、
−前記周波数が限定された信号をコード化することによって、コード化された周波数が限定された信号を生成する手段と、
−時間フィルタを生成する工程であって、前記時間フィルタは、前記限定された信号のスペクトルの復号およびブロード化によって生成された信号に適用されたとき、前記元の信号に近い信号を見出すためのものである、工程とを少なくとも含む。
本発明は、また、信号を復号するための装置に関し、前記装置は、
−送信された信号を受信する手段と、
−前記受信された信号に関する時間フィルタを受信する手段と、
−前記受信された信号を復号することによって、復号された信号を生成する手段と、
−前記復号された信号のスペクトルをブロード化することによって、拡張された信号を生成する手段と、
−前記受信された前記時間フィルタによる、前記拡張された信号の畳み込みによって、再構成された信号を生成する手段とを少なくとも含む。
上記に述べた本発明の特徴およびその他は、例の実施形態に関する次の記述を読むと、より明瞭に明らかになり、その記述は、添付図面と共に提示される。
本発明の例の実施形態によるコード化方法の全体的なアーキテクチャを示す図である。 本発明の例の実施形態による復号方法の全体的なアーキテクチャを示す図である。 エンコーダの実施形態のアーキテクチャを示す図である。 デコーダの実施形態のアーキテクチャを示す図である。
発明の詳細な説明
図1に、コード化方法を全体的に示す。信号101は、コード化されるソース信号であり、したがって、この信号は、周波数の点で限定されていない元の信号である。工程102は、信号101の周波数限定の工程を示す。この周波数限定は、たとえば、ローパス・フィルタによって予めフィルタリングされた信号101をサブサンプリング(subsampling)することによって実施することができる。サブサンプリングは、サンプルのセットに1個のサンプルのみを保持し、信号から他のサンプルを抑制することからなる。n個のサンプルから1個が保持される、ファクタ「n」によるサブサンプリングによって、スペクトル幅がnによって分割される信号を生成することが可能になる、ただしnは、ここでは整数である。有理数の比q/pによるサブサンプリングを行うことも可能である。サブサンプリングは、ファクタpによって実施され、ついでサブサンプリングは、ファクタqによって実施される。スペクトル成分を失わないようにするために、スーパーサンプリング(supersampling)から始めることが好ましい。無理数の比による周波数の変化には、最も近い有理数の分数を求め、上記のように進めることが可能である。入力信号101のスペクトルを限定する他の方法も、基本的なフィルタリング方法として使用することができる。次いで、その結果得られた信号は、周波数が限定された信号(周波数限定信号)と呼ぶことにし、工程106中でコード化される。たとえばPCM、ADPCMまたは他の規格に従ったコード化など、どのような音声のコード化または圧縮の手段も、ここで使用することができる。この周波数限定信号は、デコーダへのその送信を目的として、マルチプレクサ108に供給される。
圧縮モジュール106からの出力においてコード化された周波数限定信号は、また、入力として、復号モジュール107に供給される。このモジュールは、コード化モジュール106とは逆の演算を行い、周波数限定信号のバージョンを構築することを可能にし、そのバージョンは、デコーダがアクセスすることになるバージョンと同一であり、アクセスしたとき、デコーダは、また、デコーダが受け取ることになるコード化された限定信号を復号するという、この演算を行う。次いで、そのように復号された限定信号は、周波数ブロード化モジュール103によって、元のスペクトル範囲に戻される。この周波数のブロード化は、たとえば、入力信号のサンプル間にゼロ値のサンプルを挿入することによる、入力信号の単純なスーパーサンプリング(supersampling)から構成することができる。信号のスペクトルをブロード化するどのような他の方法も、使用することができる。この拡張された周波数信号は、周波数ブロード化モジュール103から出力され、次いでフィルタ生成モジュール104に供給される。このフィルタ生成モジュール104は、元の信号101も受信し、時間フィルタを計算する。その時間フィルタは、周波数ブロード化モジュール103から出力された拡張信号に適用されたとき、元の信号に近付けるように、その信号を整形することを可能にする。次いで、そのようにして計算されたフィルタは、任意選択の圧縮工程105の後、マルチプレクサ108に供給される。
このようにして、送信されることになる信号の周波数が限定されて圧縮されたバージョン、および時間フィルタの係数を送ることが可能である。この時間フィルタは、解凍されて周波数が拡張された信号に一度適用されると、その信号を再形成して、元の信号に近い拡張信号を見出す。フィルの計算は、元の信号に、および解凍および周波数ブロード化の後にデコーダが得ることになる信号に基づき行われ、そのことによって、これら2つの処理フェーズによって導入された、どのような欠陥も修正することが可能になる。第1に、フィルタは、再構成された信号に、その全周波数範囲において適用され、それによって、送信された低周波部分に対して、ある種の圧縮生成物を修正することが可能になる。第2に、それは、また、送信されないが、周波数ブロード化によって再構成される高周波部分を再形成する。
図2に、対応する復号方法を全体的に示す。したがって、デコーダは、コーダのマルチプレクサ108から出力された信号を受信する。それは、送信信号中に含まれたS1bと呼ばれるコード化された周波数限定信号およびフィルタFの係数を取り出すために、信号を逆多重化する。次いで、信号S1bは、図1のモジュール107に機能的に相当する復号および解凍モジュール202によって復号される。一度復号されると、信号は、図1のモジュール103に機能的に相当するモジュール203によって、周波数が拡張される。したがって、信号が復号され、その周波数が拡張されたバージョンの信号が生成される。さらに、フィルタFの係数は、コード化または圧縮されている場合、解凍モジュール201によって復号され、そして得られたフィルタは、信号を整形するためのモジュール204中で拡張された時間信号に適用される。次いで、信号が、元の信号に近い出力として生成される。この処理は、再形成のために信号に適用されるフィルタの時間特性のため、実施するのは簡単である。
送信され、そして信号の再構成中に適用されるフィルタは、周期的に送信され、時間とともに変化する。したがって、このフィルタは、それが適用される信号の部分に適合する。したがって、信号の各部分について、この信号部分のダイナミックなスペクトル特性に従い特に適合する時間フィルタを計算することが可能である。具体的には、いくつかのタイプの時間フィルタ生成器を備え、各信号の部分について、この部分に対して最善の結果をもたらすフィルタを選択することが可能である。これは、可能である、というのは、フィルタ生成モジュールは、第1に元の信号と、第2にデコーダによって再構成されることになる拡張された信号を含み、したがって、フィルタ生成モジュールは、拡張された信号がいくつかの異なるフィルタによって生成された場合、拡張された信号部分へ各フィルタを適用して生成された信号と、できるだけそれに近付くことが求められる元の信号を比較する立場にあるからである。したがって、このフィルタ生成方法は、信号の全体について所与のタイプのフィルタを選択することに限定されず、各信号の部分の特性に従ってフィルタのタイプを変えることが可能である。
ここで、本発明の特定の実施形態を、図3および4を参照して詳細に述べる。この実施形態では、所与の周波数、たとえば32kHzでサンプリングされた信号301から、S1bと呼ばれるその低周波に限定された信号を生成することが求められる。信号S1bの周波数を拡張して生成された信号を整形するためのフィルタFを決定することも求められる。元の信号301は、ローパス・フィルタによってフィルタリングされ、そしてサブサンプリング・モジュール302によってファクタnによるサブサンプリングが行われる。元の信号のn個のサンプルから1個だけを保持する、ただしnは整数である。実際、nは、一般に4を超えない。したがって、信号は、スペクトル範囲の点で損なわれ、たとえば、n=2の場合、16kHzでサンプリングされた信号が生成される。次いで、この信号は、たとえばPCM(Pulse Code Modulation)タイプの方法を用いてモジュール311によってコード化され、次いで、それは、たとえばADPCM(モジュール302)によって圧縮される。このようにして、元の信号301の低周波を含むサブサンプリングされた信号が生成される。この信号は、デコーダに送るために、マルチプレクサ314に送られる。
並行して、この信号は、復号モジュール313に送信される。このようにして、エンコーダ中では、デコーダがそれに送られる信号から生成することになる信号が、シミュレートされる。この信号は、フィルタFを生成するために使用され、したがってこれらのコード化および復号、および圧縮および解凍のフェーズから生じる生成物を考慮に入れることが可能になる。次いで、この信号は、モジュール303中で時間信号の各サンプル間にn−1個のゼロを挿入することによって、周波数が拡張される。このようにして、元の信号と同じスペクトル範囲を有する信号が再構成される。ナイキスト定理によって、n次スペクトルのエイリアシングが生成される。たとえば、n=2の場合、信号は、コード化時、2次のオーダーでサブサンプリングされ、復号時、2次のオーダーでスーパーサンプリングされる。スペクトルは、「ミラー」によるように周波数領域中で軸対称に繰り返される。モジュール304中で、フーリエ変換が、モジュール303から出力された周波数が拡張された時間周波数に対して行われる。実際、高速フーリエ変換が、スライドさせて所与の可変サイズの操作ウィンドウに対して行われる。これらのサイズは、通常、128、256および512個のサンプルであるが、たとえ計算を簡単化するために、優先的に2の累乗を使用するとしても、任意のサイズのものもありえる。次に、これらのウィンドウに適用される、これらの変換の係数が計算される。同じフーリエ変換計算が、モジュール306中で元の信号に対して行われる。
次いで、逆フーリエ変換によって、サイズが、使用されるウィンドウのサイズ、したがって128、256または512に比例した時間フィルタを生成するために、工程304および306によって生成されたフーリエ変換の係数の絶対値の間で要素対要素除算305が行われる。選択されるウィンドウのサイズが大きくなると、フィルタが含むことになる係数がより多くなり、より正確になるが、その適用は、復号時の計算の点で、より費用がかかる。したがって、この工程は、異なるサイズのいくつかのフィルタを生成し、それによって最終的に使用するフィルタを選択することが必要になる。この選択工程は、モジュール309によって実施されることが分かる。ウィンドウ間の比の係数が実数であり、そして周波数空間で対称的であるとき、それゆえ、相当するフィルタFは、時間領域中で、実数であり対称的である。この対称性を使用すると、係数の半分だけを送信し、残されたものは、対称性によって推定することができる。対称的な実数フィルタを生成すると、デコーダ中のフィルタによる、拡張された受信信号の畳み込み中に必要になる演算数を減少させることも可能になる。他の実施形態では、非対称的な実数フィルタを生成することが可能である。たとえば、操作ウィンドウ中の時間信号の周波数が限定されている場合、無限インパルス応答を有するチェビシェフローパス・フィルタのパラメータを、工程304および306から出力されたスペクトルと、ウィンドウのカットオフ周波数から反復して決定することが有利にも可能である。
このようにして、フィルタは、時間空間中で生成され、選択モジュール309の入力に供給される。
任意選択で、モジュール308が他のタイプのフィルタをもたらすことがある。たとえば、それは、線形、三次または他のフィルタを提供することができる。これらのフィルタは、スーパーサンプリングをもたらすことで知られている。周波数限定信号のサンプル間にゼロの初期値を加えたサンプルの値を計算するために、既知サンプルの値をコピーし、サンプル間の平均を取ることが可能であり、それが、結局サンプルの既知の値間の線形補間を成すことになる。すべてのこれらのタイプのフィルタは、信号の値から独立しており、スーパーサンプリングされた信号を再形成することが可能である。したがって、モジュール308は、使用することができる、そのようなフィルタを任意の数だけ含む。
したがって、選択モジュール309は、入力においてフィルタの集合体を有することになる。それは、モジュール305によって生成された、そして元の信号に、および再構成された信号に適用されるフーリエ変換の絶対値の除算によって様々なサイズのウィンドウのために生成されるフィルタに対応するフィルタを有することになる。また、選択モジュール309は、入力として、元の信号301およびモジュール303から出力された再構成された信号を有することになる。このようにして、モジュール309は、該当の信号部分について最善の出力信号、すなわち元の信号にスペクトル的にもっとも近い出力信号を与えるフィルタを選択するために、モジュール303から出力された再構成された信号に様々なフィルタを適用したものと元の信号を比較することができる。たとえば、モジュール303から出力された信号にフィルタを適用することによって得られたスペクトルと、元の信号の同じ部分のスペクトルの間の比を取ることが可能である。次いで、ひずみの関数を最小限で発生するフィルタが選択される。この信号部分は、操作ウィンドウと呼ばれ、フィルタを計算するために使用された最大ウィンドウより大きくする必要がある。512個サンプルの操作ウィンドウのサイズを通常使用することが可能になる。この操作ウィンドウのサイズは、信号によって変えることもできる。これは、大きなサイズの操作ウィンドウは、信号の実質的に固定された部分のコード化に使用することができ、一方、高速変動をより良好に考慮するために、より小さいウィンドウは、よりダイナミックな信号部分により適することになるからである。この部分は、信号の各部分について、デコーダによる信号の最善の再構成をもたらし、そして元の信号に接近させることができる、もっとも当てはまるフィルタの選択を可能にする部分である。
一度このフィルタが選択されると、モジュール310は、送信されるデータを最適化するために、たとえばハフマン・テーブルを使用して、コード化されるフィルタのスペクトル係数を量子化することになる。したがって、マルチプレクサ314は、信号の各部分とともに、この信号部分の復号にもっとも当てはまるフィルタを多重化する。このフィルタは、この信号部分の解析によって生成された異なるサイズのフィルタの集合体から、あるいは一連の所与のフィルタ、通常、線形であり、再構成をもたらし、デコーダによる信号部分の再構成のためにより有利であると判明した場合、選択することができるフィルタも含む集合体から選択される。生成されたフィルタが所与のフィルタのなかの1つであったとき、所与のフィルタ、通常、線形であって再構成をもたらし、デコーダによる信号部分の再構成のためにより有利であると判明した場合、選択することができるフィルタの集合体の間でこのフィルタを識別する識別子だけを送信することが可能である。生成されたフィルタが所与のフィルタのなかの1つであったとき、モジュール308によって供給された所与のフィルタの集合体の間でこのフィルタを識別する識別子だけ、およびそのフィルタの任意のパラメータを送信することが可能である。これは、これらの所与のフィルタの係数が、フィルタを適用したい信号部分に従って計算されておらず、これらの係数を送る必要がなく、それは、デコーダが知ることができるからである。したがって、この場合、フィルタに関する情報を送るための帯域幅が、フィルタの簡単な識別子に減少される。
図4に、説明する特定の実施形態での対応する復号を示す。デコーダが信号を受信し、信号を逆多重化する。次いで、音声信号S1bは、モジュール404によって復号され、次いで、受信されたサンプル間にゼロのn−1個のサンプルをモジュール405によって挿入し、それによってファクタnのスーパーサンプリングが行われる。並行して、フィルタFのスペクトル係数が、モジュール401によって逆量子化され、ハフマン・テーブルに従って復号される。フィルタのサイズは、デコーダのモジュール402によって、その計算またはメモリの能力、あるいはすべてのあり得るハードウェアの制限に合わせることができることが有利である。わずかなリソースを有するデコーダは、サブサンプリングされたフィルタを使用することが可能であり、それによってフィルタが適用されたとき、演算を減少させることができる。サブサンプリングされたフィルタは、また、送信チャネルのリソースまたはデコーダのリソースに従ってエンコーダによって生成することができる、ただし、もちろん後者の情報がエンコーダによって保持されているものとする。さらに、フィルタのスペクトルは、音出力パワーまたは能力など、デコーダの音演奏ハードウェア能力に従って、より少ないスーパーサンプリングデ(n−1、n−2など)を実施するために、復号時、減少させることができる。次いで、モジュール403は、時間領域中の実数フィルタを生成するために、フィルタのスペクトル係数に対して逆フーリエ変換を行う。例の実施形態では、フィルタは、より対称的であり、それによって、フィルタ送信のために送られるデータを減少させることが可能である。モジュール406は、そのように構成されたフィルタを用いて、モジュール405から出力されたスーパーサンプリングされた信号の畳み込みを行って、その結果得られる信号を生成する。この畳み込みは、計算の点で特に経済的である、というのは、スーパーサンプリングが、ゼロ値を挿入することによって行われるからである。さらに、フィルタが実数であり、好ましい実施形態では対称的でさえあることによって、この畳み込みに必要な演算数を減少させることが可能である。
フィルタが、周波数が拡張された信号の全体に適用されるので、本発明は、送信された低域部分から再構成されたスペクトルの高域部分だけでなく、そのように再構成された信号の全体も再形成するという効果をもたらす。このようにして、それによって、送信されていないスペクトルの部分をモデル化するが、送信された低周波部分の圧縮、解凍、コード化および復号の様々な演算によって生じる生成物を修正することも可能である。
本発明の第2の効果は、各信号部分についていくつかの中から、音演奏の品質および使用される「機械時間」の点で最善フィルタを選択することができるモジュールによって、各信号部分の特性に従って使用されるフィルタをダイナミックに適合させるという可能性である。

Claims (12)

  1. 元の音声信号をコード化する方法であって、
    周波数が限定された信号を生成する工程であって、元の信号の周波数が、高周波の抑制によって低減される、工程と、
    前記周波数が限定された信号のコード化によって、コード化された周波数が限定された信号を生成する工程と、
    前記周波数が限定された信号のスペクトルをブロード化することによって、拡張された周波数の信号を生成する工程と、
    前記拡張された周波数の信号および前記元の信号から時間フィルタを生成する工程であって、前記拡張された周波数の信号に前記時間フィルタを適用することによって、前記元の信号にスペクトル的に近い信号を出力するように前記時間フィルタが生成される、工程と、
    前記周波数が限定された信号および、前記時間フィルタまたは前記時間フィルタを識別する時間フィルタ識別子の何れか一方を送信する工程とを少なくとも含むことを特徴とする、方法。
  2. 前記時間フィルタは、前記元の信号および前記拡張された周波数の信号に適用されたフーリエ変換の係数の関数の要素対要素除算によって生成されることを特徴とする、請求項1に記載の方法。
  3. 異なるサイズのフーリエ変換が、使用される各サイズに対応する複数の時間フィルタを生成するために使用され、
    時間フィルタを生成する工程において生成される前記時間フィルタが、生成された前記複数のフィルタからの選択に対応し、
    前記時間フィルタを前記拡張された周波数の信号に適用して生成された信号と前記元の信号を比較することにより選択を行う、ことを特徴とする、請求項2に記載の方法。
  4. 前記選択は、所定の時間フィルタの集合体に拡張されることを特徴とする、請求項3に記載の方法。
  5. 前記周波数が限定された信号は、その送信を目的としてコード化され、前記時間フィルタは、
    前記コード化された周波数が限定された信号を復号し生成された信号と、
    前記元の信号とを使用して生成されることを特徴とする、請求項1に記載の方法。
  6. 請求項1乃至5の何れか一つに記載のコード化の方法を行う間に送信される前記周波数が限定された信号を復号する方法であって、
    前記周波数が限定された信号を受信することによって、受信された信号を生成する工程と、
    前記コード化の方法を行う間に送信される前記時間フィルタまたは前記時間フィルタ識別子を受信する工程と、
    前記受信された信号を復号することによって、復号された信号を生成する工程と、
    前記復号された信号のスペクトルをブロード化することによって、拡張された信号を生成する工程と、
    前記受信された時間フィルタまたは前記受信された時間フィルタ識別子によって識別される時間フィルタによる、前記拡張された信号の全体の畳み込みによって、再構成された信号を生成する工程とを少なくとも含むことを特徴とする、方法。
  7. 前記時間フィルタからサイズが減少された時間フィルタが、再構成された信号を生成する工程で、この時間フィルタの代わりに使用されることを特徴とする、請求項6に記載の方法。
  8. 前記時間フィルタの代わりにサイズが減少された時間フィルタを使用するという前記選択は、デコーダの能力に従って行われることを特徴とする、請求項7に記載の方法。
  9. 元の音声信号をコード化するための装置であって、
    周波数が限定された信号を生成する手段であって、前記元の信号のスペクトルが高周波の抑制によって減少される、手段と、
    前記周波数が限定された信号をコード化することによって、コード化された周波数が限定された信号を生成する手段と、
    前記周波数が限定された信号のスペクトルをブロード化することによって、拡張された周波数の信号を生成する手段と、
    前記拡張された周波数の信号および前記元の信号から時間フィルタを生成する手段であって、前記拡張された周波数の信号に前記時間フィルタを適用することによって、前記元の信号にスペクトル的に近い信号を出力するように前記時間フィルタが生成される、手段と、
    前記周波数が限定された信号および、前記時間フィルタまたは前記時間フィルタを識別する時間フィルタ識別子の何れか一方を送信する手段とを少なくとも含むことを特徴とする、装置。
  10. 請求項9に記載のコード化するための装置によって送信される前記周波数が限定された信号を復号するための装置であって、
    前記周波数が限定された信号を受信することによって、受信された信号を生成する手段と、
    前記コード化するための装置によって送信される前記時間フィルタまたは前記時間フィルタ識別子を受信する手段と、
    前記受信された信号を復号することによって、復号された信号を生成する手段と、
    前記復号された信号のスペクトルをブロード化することによって、拡張された信号を生成する手段と、
    前記受信された時間フィルタまたは前記受信された時間フィルタ識別子によって識別される時間フィルタによる、前記拡張された信号の全体の畳み込みによって、再構成された信号を生成する手段とを少なくとも含むことを特徴とする、装置。
  11. 前記元の信号が音声信号の時間的一部分であることを特徴とする請求項1乃至5の何れか一つに記載の方法。
  12. 前記信号が音声信号の時間的一部分であることを特徴とする請求項6乃至8の何れか一つに記載の方法。
JP2009543393A 2006-12-28 2007-12-27 音声コード化の方法および装置 Active JP5491193B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FR06/11481 2006-12-28
FR0611481A FR2911031B1 (fr) 2006-12-28 2006-12-28 Procede et dispositif de codage audio
PCT/EP2007/011433 WO2008080605A1 (fr) 2006-12-28 2007-12-27 Procede et dispositif de codage audio

Publications (2)

Publication Number Publication Date
JP2010515090A JP2010515090A (ja) 2010-05-06
JP5491193B2 true JP5491193B2 (ja) 2014-05-14

Family

ID=38055366

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009543393A Active JP5491193B2 (ja) 2006-12-28 2007-12-27 音声コード化の方法および装置

Country Status (7)

Country Link
US (1) US8595017B2 (ja)
EP (1) EP2126904B1 (ja)
JP (1) JP5491193B2 (ja)
AT (1) ATE470933T1 (ja)
DE (1) DE602007007125D1 (ja)
FR (1) FR2911031B1 (ja)
WO (1) WO2008080605A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013125346A (ja) * 2011-12-13 2013-06-24 Olympus Imaging Corp サーバ装置及び処理方法
CN112954581B (zh) * 2021-02-04 2022-07-01 广州橙行智动汽车科技有限公司 一种音频播放方法、***及装置

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62234435A (ja) * 1986-04-04 1987-10-14 Kokusai Denshin Denwa Co Ltd <Kdd> 符号化音声の復号化方式
DE68927483T2 (de) * 1988-02-29 1997-04-03 Sony Corp Verfahren und Einrichtung zur Digitalsignalverarbeitung
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
JP4505565B2 (ja) * 1996-05-08 2010-07-21 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴイ 特定の第1サンプリング周波数を持つデジタル情報信号の送信
US6226616B1 (en) * 1999-06-21 2001-05-01 Digital Theater Systems, Inc. Sound quality of established low bit-rate audio coding systems without loss of decoder compatibility
US6674862B1 (en) * 1999-12-03 2004-01-06 Gilbert Magilen Method and apparatus for testing hearing and fitting hearing aids
EP1186100A2 (en) * 2000-01-07 2002-03-13 Koninklijke Philips Electronics N.V. Generating coefficients for a prediction filter in an encoder
US7742927B2 (en) * 2000-04-18 2010-06-22 France Telecom Spectral enhancing method and device
SE0004163D0 (sv) * 2000-11-14 2000-11-14 Coding Technologies Sweden Ab Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
US7711123B2 (en) * 2001-04-13 2010-05-04 Dolby Laboratories Licensing Corporation Segmenting audio signals into auditory events
JP3957589B2 (ja) * 2001-08-23 2007-08-15 松下電器産業株式会社 音声処理装置
RU2316154C2 (ru) * 2002-04-10 2008-01-27 Конинклейке Филипс Электроникс Н.В. Кодирование стереофонических сигналов
US7516066B2 (en) * 2002-07-16 2009-04-07 Koninklijke Philips Electronics N.V. Audio coding
RU2005135648A (ru) 2003-04-17 2006-03-20 Конинклейке Филипс Электроникс Н.В. (Nl) Генерация аудиосигналов
US7725324B2 (en) * 2003-12-19 2010-05-25 Telefonaktiebolaget Lm Ericsson (Publ) Constrained filter encoding of polyphonic signals
CA2457988A1 (en) * 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
FI119533B (fi) * 2004-04-15 2008-12-15 Nokia Corp Audiosignaalien koodaus
KR20070056081A (ko) * 2004-08-31 2007-05-31 마츠시타 덴끼 산교 가부시키가이샤 스테레오 신호 생성 장치 및 스테레오 신호 생성 방법
WO2006049205A1 (ja) * 2004-11-05 2006-05-11 Matsushita Electric Industrial Co., Ltd. スケーラブル復号化装置およびスケーラブル符号化装置
KR101220621B1 (ko) * 2004-11-05 2013-01-18 파나소닉 주식회사 부호화 장치 및 부호화 방법
BRPI0516376A (pt) * 2004-12-27 2008-09-02 Matsushita Electric Ind Co Ltd dispositivo de codificação de som e método de codificação de som
DE102005000830A1 (de) * 2005-01-05 2006-07-13 Siemens Ag Verfahren zur Bandbreitenerweiterung
US7573912B2 (en) * 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
KR100956877B1 (ko) * 2005-04-01 2010-05-11 콸콤 인코포레이티드 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 방법 및장치
KR100818268B1 (ko) * 2005-04-14 2008-04-02 삼성전자주식회사 오디오 데이터 부호화 및 복호화 장치와 방법
US20070092086A1 (en) * 2005-10-24 2007-04-26 Pang Hee S Removing time delays in signal paths
CA2646961C (en) * 2006-03-28 2013-09-03 Sascha Disch Enhanced method for signal shaping in multi-channel audio reconstruction
FR2911020B1 (fr) * 2006-12-28 2009-05-01 Actimagine Soc Par Actions Sim Procede et dispositif de codage audio

Also Published As

Publication number Publication date
EP2126904A1 (fr) 2009-12-02
DE602007007125D1 (de) 2010-07-22
FR2911031B1 (fr) 2009-04-10
US8595017B2 (en) 2013-11-26
EP2126904B1 (fr) 2010-06-09
ATE470933T1 (de) 2010-06-15
WO2008080605A1 (fr) 2008-07-10
JP2010515090A (ja) 2010-05-06
FR2911031A1 (fr) 2008-07-04
US20100094640A1 (en) 2010-04-15

Similar Documents

Publication Publication Date Title
JP5165559B2 (ja) オーディオコーデックポストフィルタ
US6263312B1 (en) Audio compression and decompression employing subband decomposition of residual signal and distortion reduction
KR100986153B1 (ko) 합성된 스펙트럼 성분을 적용하기 위하여 디코딩된 신호의 특성을 사용하는 오디오 코딩 시스템
JP4444296B2 (ja) オーディオ符号化
JP5859504B2 (ja) 合成フィルターバンク、フィルタリング方法及びコンピュータプログラム
JP3483958B2 (ja) 広帯域音声復元装置及び広帯域音声復元方法及び音声伝送システム及び音声伝送方法
JP2019113858A (ja) Hoa信号の係数領域表現からこのhoa信号の混合した空間/係数領域表現を生成する方法および装置
KR20160002846A (ko) 고차 앰비소닉스 표현을 압축 및 압축해제하기 위한 방법 및 장치
AU2003243441B2 (en) Audio coding system using characteristics of a decoded signal to adapt synthesized spectral components
KR100813193B1 (ko) 정보 신호의 양자화 방법 및 장치
CN113470667A (zh) 语音信号的编解码方法、装置、电子设备及存储介质
JP4444297B2 (ja) オーディオ符号化
JP5491193B2 (ja) 音声コード化の方法および装置
JP5491194B2 (ja) 音声コード化の方法および装置
US20130085762A1 (en) Audio encoding device
CN115116455A (zh) 音频处理方法、装置、设备、存储介质及计算机程序产品
EP3248190B1 (en) Method of encoding, method of decoding, encoder, and decoder of an audio signal
CN115116456A (zh) 音频处理方法、装置、设备、存储介质及计算机程序产品
US20030187528A1 (en) Efficient implementation of audio special effects
EP2355094B1 (en) Sub-band processing complexity reduction
Gunjal et al. Traditional Psychoacoustic Model and Daubechies Wavelets for Enhanced Speech Coder Performance
JP2002026738A (ja) オーディオデータ復号処理装置および方法、ならびにオーディオデータ復号処理プログラムを記録したコンピュータ読取可能な記録媒体
JP3504485B2 (ja) 楽音符号化装置および楽音復号化装置および楽音符号化復号化装置およびプログラム記憶媒体
CN117198301A (zh) 音频编码方法、音频解码方法、装置、可读存储介质
CN117834596A (zh) 音频处理方法、装置、设备、存储介质及计算机程序产品

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20101201

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130205

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20130404

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20130411

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20130507

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20130514

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130604

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130805

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20131101

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20131111

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20131204

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20131211

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131225

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140204

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140227

R150 Certificate of patent or registration of utility model

Ref document number: 5491193

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250