JP5227459B2 - 合成オーディオ信号を生成する装置及び方法並びにオーディオ信号を符号化する装置及び方法 - Google Patents

合成オーディオ信号を生成する装置及び方法並びにオーディオ信号を符号化する装置及び方法 Download PDF

Info

Publication number
JP5227459B2
JP5227459B2 JP2011529585A JP2011529585A JP5227459B2 JP 5227459 B2 JP5227459 B2 JP 5227459B2 JP 2011529585 A JP2011529585 A JP 2011529585A JP 2011529585 A JP2011529585 A JP 2011529585A JP 5227459 B2 JP5227459 B2 JP 5227459B2
Authority
JP
Japan
Prior art keywords
frequency band
patching
spectral
audio signal
frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011529585A
Other languages
English (en)
Other versions
JP2012504781A (ja
Inventor
フレデリック ナーゲル
マルクス マルトラス
ジェレミ− ルコンテ
ステファン バイエル
ギローム フッファス
ヨハネス ヒルペルト
ジュリアン ロビラード
Original Assignee
フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン filed Critical フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン
Publication of JP2012504781A publication Critical patent/JP2012504781A/ja
Application granted granted Critical
Publication of JP5227459B2 publication Critical patent/JP5227459B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Complex Calculations (AREA)
  • Stored Programmes (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)

Description

本発明は、オーディオ信号処理に関し、特に、合成オーディオ信号を生成する装置及び方法と、オーディオ信号を符号化する装置及び方法と、符号化されたオーディオ信号とに関する。
オーディオ信号の記憶や伝送は、多くの場合、厳しいビットレートの制限を受ける。そのような制限は通常、信号の中間的な符号化によって克服される。過去においては、非常に低いビットレートしか使用できない場合、符号器は伝送されるオーディオ帯域を思い切って減少させることを余儀なくされた。現代のオーディオコーデックにおいては、特許文献1〜3及び非特許文献1〜12に示されるように、帯域幅拡張方法(BWE)を使用して広帯域信号を符号化することができる。
上述の文献におけるアルゴリズムは高周波帯域(HF)コンテンツのパラメトリック表示に依存している。この表示は、復号化された信号の低周波部分(LF)から、HFスペクトル領域への転位(「パッチング」)とパラメータ主導の後処理の適用という手段を用いて生成される。
このような技術分野においては、スペクトル帯域複製(SBR)などの帯域幅拡張方法が、HFR(高周波再構築)に基づくコーデックにおいて、高周波信号の効率的な生成方法として使用されている。
非特許文献1に開示されたスペクトル帯域複製(SBR)は、HF情報を生成するために、直行ミラーフィルタバンク(QMF)を使用している。所謂「パッチング」を使用して低いQMF帯域信号が高いQMF帯域へとコピーされ、その結果、LF部分の情報がHF部分において複製される。生成されたHF部分は、その後、スペクトル包絡及び調性を調整するパラメータの助けを借りて、元のHF部分に対して適合される。
HE−AACで標準化されたように、SBRにおいては、単純なコピーによるパッチングも含む全ての操作が、常にQMFドメインの中で実行される。しかし、他の異なるパッチング方法は、FFTドメインや時間ドメインなどのような異なるドメインで実行可能である。従って、QMFドメインの代わりにFFTドメイン又は時間ドメインで作動し、かつQMF分析ステップへと供給するための追加的な変換を必要とするパッチングアルゴリズムを、SBRが選択できるようにすることも可能であろう。
単純なSBRでは、特別なハードウエア又はソフトウエアの必要事項や信号特性を考慮しない、単一のアルゴリズムだけが使用可能である。そのため、SBRがパッチングアルゴリズムを適合させることはできない。そこで、2つの異なるパッチングアルゴリズムの間で単純に選択できるようにすることも可能であろう。しかし、それら2つのパッチング方法が異なるドメインで作動するため、過渡領域でブロッキングアーチファクトが発生しやすくなり、両方のパッチング方法の間における繊細な切替は実質的に不可能となる。
特許文献4は、スペクトル包絡調整と組み合わせた、スペクトル帯域複製における転位方法を開示している。
特許文献5は、信号がパルス列状又は非パルス列状のいずれかに分類できることを教示し、この分類に基づいて、適応型の切替転位器を提案している。この切替転位器は2つのパッチングアルゴリズムを並行して実行し、ミキシングユニットは(パルス列状か非パルス列状かの)分類に依存して両方のパッチ済信号を結合させる。転位器間の実際の切替又はミキシングは、包絡及び制御データに応じて包絡調整フィルタバンクの中で実行される。さらに、パルス列状の信号については、基本信号がフィルタバンクドメインへと変換され、周波数置換処理が実行され、その周波数置換の結果に対する包絡調整が実行される。これらの処理は、パッチングと追加的処理が結合した工程である。非パルス列状の信号については、周波数ドメイン転位器(FD転位器)が設けられ、この周波数ドメイン転位器の結果は次にフィルタバンクドメインへと変換され、ここで包絡調整が実行される。つまりこの文献は、一つの選択肢としてパッチングと追加的処理との結合手法を備え、他の選択肢として包絡調整が実行されるフィルタバンク以外に配置された周波数ドメイン転位器を備える方法を開示しているが、その手法の柔軟性及び構成の可能性に関して問題がある。
米国特許第5,455,888号公報 米国特許出願第08/951,029号 米国特許第6,895,375号公報 WO98/57436 WO02/052545
M Dietz, L. Liljeryd, K. Kjorling and O. Kunz, "Spectral Band Replication, a novel approach in audio coding" in 112th AES Convention, Munich, May 2002 S. Meltzer, R. Bohm and F. Henn, "SBR enhanced audio codecs for digital broadcasting such as "Digital Radio Mondiale" (DRM)," in 112th AES Convention, Munich, May 2002 T. Ziegler, A. Ehret, P. Ekstrand and M. Lutzky, "Enhancing mp3 with SBR: Features and Capabilities of the new mp3PRO Algorithm," in 112th AES Convention, Munich, May 2002 International Standard ISO/IEC 14496-3:2001 FPDAM 1, "Bandwidth Extension," ISO/IEC, 2002 E. Larsen, R. M. Aarts, and M. Danessis. "Efficient high-frequency bandwidth extension of music and speech" in AES 112th Convention, Munich, Germany, May 2002 R.M. Aarts, E. Larsen, and O. Ouweltjes. "A unified approach to low-and high frequency bandwidth extension" in AES 115th Convention, New York, USA, October 2003 K. Kayhko. "A Robust Wideband Enhancement for Narrowband Speech Signal" Research Report, Helsinki University of Technology, Laboratory of Acoustics and Audio Signal Processing, 2001 E. Larsen and R.M. Aarts. "Audio Bandwidth Extension Application to psychoacoustics, Signal Processing and Loudspeaker Design. John Wiley & Sons, Ltd, 2004 E. Larsen, R.M. Aarts, and M. Danessis. "Efficient high-frequency bandwidth extension of music and speech" in AES 112th Convention, Munich, Germany, May 2002 J. Makhoul. "Spectral Analysis of Speech by Linear Prediction". IEEE Transactions of Audio and Electroacoustics, AU-21(3), June 1973 Frederik Nagel, Sascha Disch, "A harmonic bandwidth extension method for audio codecs," ICASSP International Conference on Acoustics, Speech and Signal Processing, IEEE CNF, Taipei, Taiwan, April 2009
本発明の目的は、改良されたオーディオ品質を提供しかつ効率的な構成を可能にする、合成オーディオ信号生成の概念を提供することである。
前記目的は、請求項1に係る合成オーディオ信号を生成する装置、請求項10に係るオーディオ信号を符号化する装置、請求項12に係る生成方法、請求項13に係る符号化方法、請求項14に係る符号化されたオーディオ信号又は請求項15に係るコンピュータプログラムによって達成できる。
本発明は、上述のような改良された品質及び/又は効率的な構成は、以下のような場合に達成されるという基本的知見に基づいている。即ち、オーディオ信号のある時間部分をスペクトル表現へと変換した後、複数の異なるスペクトルドメイン・パッチングアルゴリズムを実行し、各パッチングアルゴリズムは前記オーディオ信号のコア周波数帯域(core frequency band)の対応するスペクトル成分から導出された高周波帯域(upper frequency band)のスペクトル成分を含む修正済スペクトル表現を生成する。そして、パッチング制御信号に従って、第1の時間部分のための第1のスペクトルドメイン・パッチングアルゴリズムを前記複数の異なるスペクトルドメイン・パッチングアルゴリズムから選択し、かつ第2の異なる時間部分のための第2のスペクトルドメイン・パッチングアルゴリズムを前記複数の異なるスペクトルドメイン・パッチングアルゴリズムから選択することで、前記修正済スペクトル表現を取得する。この方法によれば、異なるドメインの2つのパッチングアルゴリズム間での切替に起因した品質及び/又は柔軟性の低下を防止することができ、従って、知覚的な品質を維持しながら処理の複雑性を低減することもできる。
本発明の一実施形態に従えば、パッチング制御信号を使用して合成オーディオ信号を生成する装置は、第1の変換器とスペクトルドメイン・パッチ生成器と高周波再構築処理器と結合器とを備える。第1の変換器は、オーディオ信号のある時間部分をスペクトル表現へと変換する。スペクトルドメイン・パッチ生成器は、複数の異なるスペクトルドメイン・パッチングアルゴリズムを実行し、各パッチングアルゴリズムは、オーディオ信号のコア周波数帯域の対応するスペクトル成分から導出された高周波数帯域のスペクトル成分を含む、修正済スペクトル表現を生成する。スペクトルドメイン・パッチ生成器はさらに、パッチング制御信号に従って、第1の時間部分のための第1のスペクトルドメイン・パッチングアルゴリズムを前記複数の異なるスペクトルドメイン・パッチングアルゴリズムから選択し、かつ第2の異なる時間部分のための第2のスペクトルドメイン・パッチングアルゴリズムを前記複数の異なるスペクトルドメイン・パッチングアルゴリズムから選択することで、前記修正済スペクトル表現を取得する。高周波再構築処理器は、スペクトル帯域複製パラメータに従って、前記修正済スペクトル表現又はその修正済スペクトル表現から導出された信号を処理し、帯域幅拡張信号を取得する。結合器は、コア周波数帯域にスペクトル成分を持つオーディオ信号又はそのオーディオ信号から導出された信号と、前記帯域幅拡張信号とを結合し、合成オーディオ信号を取得する。
本発明の他の実施形態に従えば、オーディオ信号を符号化する装置は、コア符号器とパラメータ抽出器とパラメータ計算器とを備える。オーディオ信号はコア周波数帯域と高周波数帯域とを含む。コア符号器は、コア周波数帯域内のオーディオ信号を符号化する。パラメータ抽出器はオーディオ信号からパッチング制御信号を抽出し、そのパッチング制御信号は複数の異なるスペクトルドメイン・パッチングアルゴリズムの中から選択された1つのパッチングアルゴリズムを示し、その選択されたパッチングアルゴリズムは、帯域幅拡張復号器において合成オーディオ信号を生成するためにスペクトルドメインで実行される。パラメータ計算器は、高周波数帯域からスペクトル帯域複製パラメータを計算する。
本発明のさらに他の実施形態に従えば、符号化されたオーディオ信号のデータストリームは、コア周波数帯域内で符号化された符号化済オーディオ信号と、複数の異なるスペクトルドメイン・パッチングアルゴリズムの中から選択された1つのパッチングアルゴリズムを示すパッチング制御信号であって、その選択されたパッチングアルゴリズムは帯域幅拡張復号器において合成オーディオ信号を生成するためにスペクトルドメインで実行される、パッチング制御信号と、オーディオ信号の高周波数帯域から計算されたスペクトル帯域複製パラメータと、を備える。
つまり、本発明の実施形態は、スペクトルドメインのパッチングアルゴリズムのグループの中の少なくとも2つの異なるスペクトルドメイン・パッチングアルゴリズムの間で切り替える概念に関連する。前記スペクトルドメインのパッチングアルゴリズムのグループは、単相ボコーダ(single phase vocoder)に基づくハーモニックな転位と非ハーモニックなコピー操作のSBR機能とを持つ第1パッチングアルゴリズムと、多相ボコーダ(multiple phase vocoder)に基づくハーモニックな転位を持つ第2パッチングアルゴリズムと、非ハーモニックなコピー操作のSBR機能を持つ第3パッチングアルゴリズムと、非線形歪み操作(non-linear distortion)を持つ第4パッチングアルゴリズムと、を含んでも良い。さらに、帯域幅拡張は、帯域幅拡張信号の高周波数帯域がコア周波数帯域のクロスオーバー周波数の少なくとも4倍の最大周波数を持つように実行されても良い。
結果として、スペクトルドメインにおいて少なくとも2つの異なるパッチングアルゴリズムの間で切替を行うことで、帯域幅拡張のシナリオの中で同等の知覚的品質を持ちながら複雑さを低減できる。
本発明の別の実施形態は、修正済スペクトル表現から導出された時間ドメイン信号をスペクトルドメインへと変換するための時間/周波数変換器を含まない装置に関連する。従って、本発明の実施形態では、高周波再構築処理器が、修正済スペクトル表現に対して直接的に処理することもでき、この場合、異なるドメインで処理可能なパッチングと追加的処理との組合せの手法のように、時間ドメインからスペクトルドメインへの(例えばQMF分析のような)追加的変換を必要としない。
本発明のさらに別の実施形態は、複数の異なるスペクトルドメイン・パッチングアルゴリズムから選択された1つのパッチングアルゴリズムを決定する、パラメータ抽出器に関する。ここで、前記選択されたパッチングアルゴリズムとは、オーディオ信号又はそのオーディオ信号から導出されたある信号と、スペクトルドメインで複数のパッチングアルゴリズムを実行し且つオーディオ信号のある時間部分の修正済スペクトル表現を処理することで取得された複数の帯域幅拡張信号と、の間の比較に基づくものである。従って、本発明のこの実施形態は、帯域幅拡張復号器において合成オーディオ信号を生成するための最適なパッチングアルゴリズムを選択する方法を提供する。
制御パラメータは、どのパッチングが最適かを決定するために使用されても良い。その目的で、「合成による分析(analysis by synthesis)」ステージを使用しても良い。即ち、全てのパッチを適用し、ある目標に従った最適なパッチを選択しても良い。本発明の好適なモードにおいては、その目標とは、知覚的品質における原状回復の最高レベルを得ることである。他のモードにおいては、目標関数を最適化する必要がある。例えば、その目標とは、オリジナルHFのスペクトル平坦度にできるだけ近い状態に維持することでも良い。
一つの方法では、パッチングの選択は、オリジナル信号、合成信号又はその両方を考慮することにより、符号器だけで実行できる。この決定(パッチング制御信号)はその後に復号器へと送られる。他の方法では、パッチングの選択は、合成信号のコア帯域だけを考慮しながら符号器と復号器との両側において同期的に実行されても良い。この後者の方法では追加的なサイド情報を生成する必要がない。
以下に、添付の図面を参照しながら本発明の実施例を説明する。
パッチング制御信号を使用して合成オーディオ信号を生成する装置の実施例を示すブロック図である。 図1aのスペクトルドメイン・パッチ生成器の構成を示すブロック図である。 合成オーディオ信号を生成する他の実施例の装置を示すブロック図である。 帯域幅拡張スキームの概略図である。 第1パッチングアルゴリズムの例示的な概略図である。 第2パッチングアルゴリズムの例示的な概略図である。 第3パッチングアルゴリズムの例示的な概略図である。 第4パッチングアルゴリズムの例示的な概略図である。 図1aの実施例においてスペクトルドメイン・パッチ生成器の後に時間/周波数変換器が配置されていない場合を示すブロック図である。 図1aの実施例において第2の変換器(周波数/時間変換器)を伴う場合を示すブロック図である。 オーディオ信号を符号化する装置の一実施例を示すブロック図である。 オーディオ信号を符号化する装置の他の実施例を示すブロック図である。 周波数ドメインにおけるパッチング・スキームの実施例の全体図である。
図1aは、本発明の実施例に従い、パッチング制御信号119を使用して合成オーディオ信号145を生成する装置100を示すブロック図である。装置100は、第1変換器110とスペクトルドメイン・パッチ生成器120と高周波数再構築処理器130と結合器140とを備える。第1変換器110はオーディオ信号105のある時間部分をスペクトル表現115へと変換する。スペクトルドメイン・パッチ生成器120は、複数の異なるスペクトルドメイン・パッチングアルゴリズム117−1を実行し、この各パッチングアルゴリズムはオーディオ信号105のコア周波数帯域の対応するスペクトル成分から導出された高周波帯域のスペクトル成分を含む修正済スペクトル表現125を生成する。図1bに示すように、スペクトルドメイン・パッチ生成器120は、パッチング制御信号119に従って、第1の時間部分107−1のための第1スペクトルドメイン・パッチングアルゴリズム117−2を複数の異なるスペクトルドメイン・パッチングアルゴリズム117−1から選択し、かつ第2の異なる時間部分107−2のための第2スペクトルドメイン・パッチングアルゴリズム117−3を複数の異なるスペクトルドメイン・パッチングアルゴリズム117−1から選択することで、修正済スペクトル表現125を取得する。
高周波再構築処理器130は、スペクトル帯域複製パラメータ127に従って、修正済スペクトル表現125又はその修正済スペクトル表現125から導出された信号を処理し、帯域幅拡張信号135を取得する。その修正済スペクトル表現125から導出された信号とは、例えばQMFドメインの信号であって、修正済スペクトル表現125に基づく修正済時間ドメイン信号に対してQMF分析を適用した後に得られる信号であっても良い。結合器140は、コア周波数帯域にスペクトル成分を持つオーディオ信号105又はそのオーディオ信号105から導出された信号と帯域幅拡張信号135とを結合し、合成オーディオ信号145を取得する。ここで、そのオーディオ信号105から導出された信号とは、例えば復号化された低周波数信号であって、符号化済のオーディオ信号をコア周波数帯域内で復号化した後に得られる信号であっても良い。
図1aから分かるように、装置100のスペクトルドメイン・パッチ生成器120は、時間ドメインではなくスペクトルドメインで作動する。
図2aは、合成オーディオ信号145を生成する他の実施例である装置200を示すブロック図である。ここでは、図2aにおける装置200の構成要素であって図1aにおける装置100の構成要素と同じものは、説明及び図示を省略する。図2aにおける実施例では、装置200のスペクトルドメイン・パッチ生成器120は、スペクトルドメイン・パッチングアルゴリズムのグループ203の中から少なくとも2つの異なるスペクトルドメイン・パッチングアルゴリズムを実行する。スペクトルドメイン・パッチングアルゴリズムのグループ203は、単相ボコーダに基づくハーモニックな転位と非ハーモニックなコピー操作のSBR機能とを持つ第1のパッチングアルゴリズム205−1と、多相ボコーダに基づくハーモニックな転位を持つ第2のパッチングアルゴリズム205−2と、非ハーモニックなコピー操作のSBR機能を持つ第3のパッチングアルゴリズム205−3と、非線形歪み操作を持つ第4のパッチングアルゴリズム205−4と、を含んでいる。
図2bに示すように、装置200は、帯域幅拡張信号135の高周波数帯域220がコア周波数帯域210のクロスオーバー周波数215の少なくとも4倍の最大周波数225を持つように、帯域幅拡張を実行しても良い。SBRにおいては、コア周波数帯域210の最高周波数として定義されるクロスオーバー周波数215の典型的は値は、例えば4kHz,5kHz又は6kHz以下の領域にある。その結果、高周波数帯域220の最大周波数225は、例えば約16kHz,20kHz又は24kHzということになる。
図3は、第1パッチングアルゴリズム205−1の例示的な概略図である。詳しくは、スペクトルドメイン・パッチ生成器120は、少なくとも2つの異なるスペクトルドメイン・パッチングアルゴリズムから選択された1つのパッチングアルゴリズムを実行し、その選択されたパッチングアルゴリズムは第1パッチングアルゴリズム205−1を含む。この第1パッチングアルゴリズム205−1は、コア周波数帯域210から抽出されたソース周波数帯域310から第1の目標周波数帯域310’への変換を制御するための係数2の帯域幅拡張ファクタ(σ)を持つ単相ボコーダ305に基づいた、ハーモニックな転位を含む。ここで、ソース周波数帯域310内のスペクトル成分の位相は、第1の目標周波数帯域310’がクロスオーバー周波数(fx)からこのクロスオーバー周波数(fx)の2倍までの領域の周波数を持つように、帯域幅拡張ファクタ(σ)により乗算される。第1パッチングアルゴリズム205−1は非ハーモニックなコピー操作のSBR機能315をさらに備え、このSBR機能315は、第1コピー操作を用いて、第2の目標周波数帯域320’がクロスオーバー周波数(fx)の2倍からこのクロスオーバー周波数(fx)の3倍までの領域の周波数を持つように、第1の目標周波数帯域310’のスペクトル成分を第2の目標周波数帯域320’へと変換し、さらに、第2コピー操作を用いて、第3の目標周波数帯域330’が高周波数帯域220に含まれるクロスオーバー周波数(fx)の3倍からこのクロスオーバー周波数(fx)の4倍までの領域の周波数を持つように、第2の目標周波数帯域320’のスペクトル成分を第3の目標周波数帯域330’へと変換する。この場合、高周波数帯域220は、第1の目標周波数帯域310’と、第2の目標周波数帯域320’と、第3の目標周波数帯域330’とを含む。特に、図3に示すように、帯域幅拡張信号135はコア周波数帯域210から生成された高周波数帯域220を含み、この高周波数帯域220はクロスオーバー周波数(fx)の4倍の最大周波数を持つ。
図4は、第2パッチングアルゴリズム205−2の例示的な概略図である。詳しくは、スペクトルドメイン・パッチ生成器120は、少なくとも2つの異なるスペクトルドメイン・パッチングアルゴリズムから選択された1つのパッチングアルゴリズムを実行し、その選択されたパッチングアルゴリズムは第2パッチングアルゴリズム205−2を含む。この第2パッチングアルゴリズム205−2は、コア周波数帯域210から抽出された第1ソース周波数帯域410から第1の目標周波数帯域410’への変換を制御するための係数2の第1帯域幅拡張ファクタ(σ1)を持つ多相ボコーダ405に基づいた、ハーモニックな転位を含む。ここで、第1ソース周波数帯域410内のスペクトル成分の位相は、第1の目標周波数帯域410’がクロスオーバー周波数(fx)からこのクロスオーバー周波数(fx)の2倍までの領域の周波数を持つように、第1帯域幅拡張ファクタ(σ1)により乗算される。第2パッチングアルゴリズム205−2は、コア周波数帯域210から抽出された第2ソース周波数帯域420−1,420−2から第2の目標周波数帯域420’,420''への変換を制御するための係数3の第2帯域幅拡張ファクタ(σ2)をさらに備える。ここで、第2ソース周波数帯域420−1,420−2内のスペクトル成分の位相は、第2の目標周波数帯域420’,420''が、クロスオーバー周波数(fx)の2倍からこのクロスオーバー周波数(fx)の3倍までの領域、又はクロスオーバー周波数(fx)からこのクロスオーバー周波数(fx)の3倍までの領域の周波数をそれぞれ持つように、第2帯域幅拡張ファクタ(σ2)により乗算される。最後に、第2パッチングアルゴリズム205−2は、コア周波数帯域210から抽出された第3ソース周波数帯域430−1,430−2から第3の目標周波数帯域430’,430''への変換を制御するための係数4の第3帯域幅拡張ファクタ(σ3)をさらに備える。ここで、第3ソース周波数帯域430−1,430−2内のスペクトル成分の位相は、第3の目標周波数帯域430’,430''が、クロスオーバー周波数(fx)の3倍からこのクロスオーバー周波数(fx)の4倍までの領域、又はクロスオーバー周波数(fx)から高周波数帯域220に含まれるこのクロスオーバー周波数(fx)の4倍までの領域の周波数をそれぞれ持つように、第3帯域幅拡張ファクタ(σ3)により乗算される。図3に示す第1パッチングアルゴリズム205−1の中と同様に、帯域幅拡張信号135の高周波数帯域220は、第1の目標周波数帯域410’と、第2の目標周波数帯域420’,420''と、クロスオーバー周波数(fx)の4倍の最大周波数を持つ第3の目標周波数帯域430’ ,430''とを含む。
図5は、第3パッチングアルゴリズム205−3の例示的な概略図である。図5の実施例においては、スペクトルドメイン・パッチ生成器120は、少なくとも2つの異なるスペクトルドメイン・パッチングアルゴリズムから選択された1つのパッチングアルゴリズムを実行し、その選択されたパッチングアルゴリズムは第3パッチングアルゴリズム205−3を含む。この第3パッチングアルゴリズム205−3は、非ハーモニックなコピー操作のSBR機能505を備え、このSBR機能505は、第1コピー操作を用いて、第1の目標周波数帯域510’がクロスオーバー周波数(fx)からこのクロスオーバー周波数(fx)の2倍までの領域の周波数を持つように、コア周波数帯域210であるソース周波数帯域510のスペクトル成分を第1の目標周波数帯域510’へと変換する。さらに、第1の目標周波数帯域510’内のスペクトル成分は、第2コピー操作を用いて、第2の目標周波数帯域520’がクロスオーバー周波数(fx)の2倍からこのクロスオーバー周波数(fx)の3倍までの領域の周波数を持つように、第2の目標周波数帯域520’へと変換される。最後に、第2の目標周波数帯域520’内のスペクトル成分は、第3コピー操作を用いて、第3の目標周波数帯域530’が高周波数帯域220に含まれるクロスオーバー周波数(fx)の3倍からこのクロスオーバー周波数(fx)の4倍までの領域の周波数を持つように、第3の目標周波数帯域530’へと変換される。この場合も、帯域幅拡張信号135の高周波数帯域220は、第1の目標周波数帯域510’と、第2の目標周波数帯域520’と、クロスオーバー周波数(fx)の4倍の最大周波数を持つ第3の目標周波数帯域530’とを含む。
図6は、第4パッチングアルゴリズム205−4の例示的な概略図である。図6の実施例においては、スペクトルドメイン・パッチ生成器120は、少なくとも2つの異なるスペクトルドメイン・パッチングアルゴリズムから選択された1つのパッチングアルゴリズムを実行し、その選択されたパッチングアルゴリズムは第4パッチングアルゴリズム205−4を含む。この第4パッチングアルゴリズム205−4は、クロスオーバー周波数(fx)からこのクロスオーバー周波数(fx)の4倍までの周波数領域を持つ高周波数帯域220内のスペクトル成分を生成する、非線形的な歪み操作を含む。
一般的に、上述した図3〜図6における実施例では、スペクトルドメイン・パッチングアルゴリズム205−1;205−2;205−3;205−4はスペクトルドメイン・パッチ生成器120を用いて実行される。この生成器120は、コア周波数帯域210から導出されたイニシャル帯域310,310’,320’;410,420−1,420−2,430−1,430−2;510,510’,520’か又はコア周波数帯域210内には含まれないある高周波数帯域を、高周波数帯域220内の目標スペクトル成分へと変換するが、この場合、その目標スペクトル成分が各スペクトルドメイン・パッチングアルゴリズムについて異なるように変換する。
特にスペクトルドメイン・パッチ生成器120は、コア周波数帯域210或いは高周波数帯域220からイニシャル帯域を抽出するための帯域通過フィルタを備えても良く、その帯域通過フィルタの帯域通過特性は、イニシャル帯域が図3〜図6に示すように対応する目標周波数帯域310’,320’,330’;410’,420’,420'',430',430''; 510’,520’,530'へと変換されるように、選択されても良い。
上述の異なるスペクトルドメイン・パッチングアルゴリズム205−1;205−2;205−3;205−4は、図2bの帯域拡張スキームで必要とされたような方法で実行されても良い。
具体的には、例えば図3又は図4において示すような単相又は多相ボコーダをそれぞれ使用することで、周波数構造はハーモニック的に正確に高周波数領域へと拡張される。なぜなら、基本帯域(例えばコア周波数帯域210)は、一定の乗算(例えばσ1=2,σ2=3,σ3=4)によってスペクトル的に伸張されるからであり、基本帯域内のスペクトル成分は新たに生成されたスペクトル成分と結合されるからである。
位相ボコーダに基づくパッチングアルゴリズムは、基本帯域が帯域幅において既に厳しい制限を受けている場合、例えば非常に低いビットレートを使用するため高周波数成分の再構築が比較的低い周波数から開始するような場合には、有利である。この場合、典型的なクロスオーバー周波数は約5KHz未満であり、4KHz未満であってもよい。この領域では、人間の耳は不正確に配置されたハーモニックから起こる不協和音に対して非常に敏感である。その結果、「不自然」なトーンという印象を与える可能性もある。加えて、(約30Hz〜300Hzのスペクトル不協和音を持つ)スペクトル的に近接したトーン同士はきめの粗いトーンとして知覚される。基本帯域の周波数構成のハーモニックな継続性により、これらの不正確で不快な聴覚的印象を回避できる。
さらに、例えば図5に示すような非ハーモニックなコピー操作のSBR機能を使用することで、スペクトル領域は、高周波数領域又は複製されるべき領域へとサブバンド単位でコピーされる。全てのパッチング方法にとって言えることであるが、コピー操作も、高周波数信号のスペクトル特性が多くの点で基本帯域信号の特性に類似するという認識の上に成り立っている。2つの特性間のずれは非常に小さいとされる。加えて、人間の耳は典型的には(典型的には約5KHzから始まる)高周波数においてはあまり敏感ではなく、特に精密でないスペクトルマッピングに関して顕著ではない。実際、この点がスペクトル帯域複製全般において鍵となる考え方である。コピー操作は特に、容易且つ高速で実行できるという長所を持つ。コピー操作のパッチングアルゴリズムはまた、パッチの境界部分について高い柔軟性を持つ。なぜなら、スペクトルのコピーはいかなるサブバンド境界でも実行できる可能性があるからである。
最後に、非線形の歪み操作を用いたパッチングアルゴリズム(図6を参照)は、クリッピング(clipping)、制限法(limiting)、二乗法(squaring)などを用いたハーモニクスの生成を含んでも良い。例えば、(上述の位相ボコーダ・パッチングアルゴリズムを適用した後などのように)もし伸張された信号のスペクトル的な占有率が非常に低い場合には、その伸張されたスペクトルは、望ましくない周波数の穴を回避するために、歪み操作された信号によって任意の追加的補足を受けることもできる。
パッチングアルゴリズムのグループ203(図2a参照)からの上述したパッチングアルゴリズムの他に、スペクトルミラーリングのような、スペクトルドメインにおける他のパッチングアルゴリズムを実行しても良い。
図7の実施例においては、装置700は、時間/周波数変換器を含まないように示されている。つまり、この実施例では、高周波数再構築処理器130は、修正済スペクトル表現125をその入力として受け取る。
上述の構成は、次の点で有利である。即ち、この場合では、高周波数再構築処理器130により実行される修正済スペクトル表現125の追加的な処理が、例えばFFT又はQMFドメインなど、スペクトルドメイン・パッチ生成器120により実行されるパッチングアルゴリズムと同じドメインにおいて、容易に実行できるからである。従って、時間ドメインから(例えばQMF分析など)スペクトルドメインへの変換のような異なるドメイン間での追加的な変換は必要でなくなり、より簡素な構成が可能となる。
図8の実施例においては、装置800は、修正済スペクトル表現125を時間ドメインへと変換するための第2の変換器810をさらに備える。ここでも、図8の装置800における構成要素であって図1aの装置100における構成要素に対応するものは、説明を省略する。図8に示すように、第1の変換器110により適用された分析に適合する合成が、第2の変換器810に適用されても良い。ここで、第1の変換器110は第1の変換長111を有する変換を実行し、他方、第2の変換器810は第2の変換長を有する変換を実行する。特に、高周波数帯域220内の最大周波数(fmax)とコア周波数帯域210内のクロスオーバー周波数(fx)との比率と、第1変換長111とが考慮されるという点において、第2の変換長は帯域幅拡張特性に依存していても良い。
本発明の一実施例においては、第1の変換器110は、例えば高速フーリエ変換(FFT)、短時間フーリエ変換(STFT)、離散フーリエ変換(DFT)、QMF分析などを実行しても良く、他方、第2の変換器810は、例えば逆高速フーリエ変換(IFFT)、逆短時間フーリエ変換(ISTFT)、逆離散フーリエ変換(IDFT)、QMF合成などを実行しても良い。
具体的には、第2の変換長は、fmax/fxの比率に第1の変換長111を乗算した値に等しくなるように選択されても良い。このように、第2の変換長又は第2の変換器810により適用された周波数分解能は、図2bに示す帯域幅拡張スキームの帯域幅拡張特性に対して容易に適合させることができる。なぜなら、帯域幅拡張特性は本質的に、ナイキスト原理に従うさらに効果的なサンプリングレートに応じた上述の比率(fmax/fx)によって支配されるからである。
図9は、オーディオ信号105を符号化するための装置900の一実施例のブロック図である。オーディオ信号105は、コア周波数帯域210と高周波数帯域220とを有する。特に、符号化装置900は、コア符号器910とパラメータ抽出器920とパラメータ計算器930とを備える。コア符号器910はコア周波数帯域210内でオーディオ信号105を符号化し、コア周波数帯域210内で符号化された符号化済オーディオ信号915を取得する。さらに、パラメータ抽出器920はオーディオ信号105からパッチング制御信号119を抽出し、そのパッチング制御信号119は、複数の異なるスペクトルドメイン・パッチングアルゴリズム117−1の中から選択された1つのパッチングアルゴリズムを指示するものである。具体的には、選択されたパッチングアルゴリズムは、帯域幅拡張復号器において合成オーディオ信号を生成するためにスペクトルドメインで実行されても良い。最後に、パラメータ計算器930は、高周波数帯域220からSBRパラメータ127を計算する。高周波数帯域220から計算されたSBRパラメータ127と、選択されたパッチングアルゴリズムを指示するパッチング制御信号119と、コア周波数帯域210内で符号化された符号化済オーディオ信号915とは、ビットストリームの中に記憶され又は伝送されるべき符号化済のオーディオ信号935を構成しても良い。
図9に示す実施例においては、パラメータ抽出器920はオーディオ信号105又はそのオーディオ信号105から導出された信号を分析し、その分析信号の信号特性に基づいてパッチング制御信号119を決定する。例えば、パッチング制御信号119は、分析信号の「スピーチ」としての特性を持つ第1時間部分107−1については第1パッチングアルゴリズムを指示し、分析信号の「静的な音楽」としての特性を持つ第2時間部分107−2については第2パッチングアルゴリズムを指示する。
従って、スピーチ信号の場合には、LPC(線形予測符号化)ドメインにおける処理のようなスピーチソースモデル又は情報生成モデルに基づく処理が使用されても良く、他方、静的な音楽の場合には、静的ソースモデル又は情報シンクモデルが使用されても良い。前者の場合には、音声を生成する人間のスピーチ/音声生成システムが表現され、後者の場合には、音声を受け取る人間の音響システムが表現される。
加えて、信号に依存する処理スキームは、過渡イベントを含む時間部分のためのハーモニックな転位と、過渡イベントを含まない時間部分のための非ハーモニックなコピー操作との間の切り替えにより構成されても良い。
開ループに対応する上述の処理は、オーディオ信号105又はこのオーディオ信号105から導出された信号の信号特性に関する直接的な分析に基づいている。代替的に、パラメータ抽出器920は、「合成による分析」の構成に対応する閉ループにおいて操作可能であっても良い。
図10に示す実施例では、「合成による分析」構成においてオーディオ信号105を符号化する装置1000を示す。具体的には、符号化装置1000のパラメータ抽出器920は、複数の異なるスペクトルドメイン・パッチングアルゴリズム117−1から選択された1つのパッチングアルゴリズムを決定する。ここで、選択されたパッチングアルゴリズムとは、オーディオ信号105又はそのオーディオ信号105から導出されたある信号と、スペクトルドメインで複数のパッチングアルゴリズム117−1を実行し且つオーディオ信号105のある時間部分の修正済スペクトル表現125を処理することで得られた複数の帯域幅拡張済信号1005と、の間の比較に基づくものである。この比較は、例えばパッチングアルゴリズム選択ユニット1010により実行され、複数の帯域幅拡張信号1005からのスペクトル平坦度(SFM)のパラメータ(SFM1005)及びオーディオ信号105からのスペクトル平坦度のパラメータ(SFMref)を計算し、その計算されたSFMパラメータであるSFM1005及びSFMrefを比較し、かつその比較されたSFMパラメータにおける偏差が最小となる特定の(最適な)パッチングアルゴリズムを複数のパッチングアルゴリズム117−1から選択する、ことを含む。最後に、選択された最適なパッチングアルゴリズムは、パラメータ抽出器920の出力にあるパッチング制御信号119により指示されても良い。
図11は、周波数ドメインにおけるパッチングスキームのための一実施例の全体図である。特に、図2bに示す帯域幅拡張スキームなどにおいて帯域幅拡張信号を生成する装置1100を説明するものである。図11の実施例では、オーディオ信号105は、1024サンプルのフレーム長(frame:1024)を持つPCM(パルス符号変調)データ1101により表現されている。このPCMデータ1101は、例えば、符号化済のオーディオ信号935から導出された基本帯域を含む、復号化済の低周波信号であってもよく、その符号化済のオーディオ信号935は符号器900のような符号化装置から伝送されたものである。次に、PCMデータ1101を例えば係数2でダウンサンプリングしてダウンサンプリング済の信号1115を取得する、ダウンサンプラ1110を使用しても良い。ダウンサンプリング済の信号1115は、「ウインドウ」と記載したブロックにより示す分析ウインドウ化器1120に供給されても良く、この分析ウインドウ化器1120は、オーディオサンプルの複数のブロックであって互いにオーバーラップするようにウインドウ化された連続的なブロックを生成しても良い。ここで、その複数の連続的なブロックのうちの各ブロックは、例えば512個のオーディオサンプルを含んでも良い。加えて、オーディオサンプルの2つの連続するブロック間の第1の時間的距離は、例えば「Inc=64」で示すように、64サンプルに対応するように調整されても良い。さらに、オーディオサンプルの2つの連続するブロック間のオーバーラップは、分析ウインドウ化器1120により適用される複数の異なる分析ウインドウ関数から1つの適切な(最適な)分析ウインドウ関数を選択することで制御されても良い。オーディオ信号105のある時間部分1125は、オーディオサンプルの複数の連続的なブロックのうちの1つの連続的なブロックに対応し、次に第1変換器110へと供給されても良く、この変換器は、例えばN=512の第1変換長111を持つFFT処理器1130として構成されても良い。FFT処理器1130は、時間部分1125を、例えば極形式1135−1の構成を持つスペクトル表現115へと変換しても良い。特に、このスペクトル表現1135−1は、振幅情報1135−2と位相情報1135−3とを含み、これらの情報は、次に図2aのスペクトルドメインパッチ生成器120に対応するスペクトルドメインパッチ生成器1141により処理される。図11のスペクトルドメイン・パッチ生成器1141は、第1パッチングアルゴリズム205−1に対応しかつ「位相ボコーダ+コピー操作」と示す第1パッチングアルゴリズム1141−1と、第2パッチングアルゴリズム205−2に対応しかつ「位相ボコーダ」と示す第2パッチングアルゴリズム1143−1と、第3パッチングアルゴリズム205−3に対応しかつ「SBRのような機能」と示す第3パッチングアルゴリズム1145−1と、図2aに示されたパッチングアルゴリズムのグループ203の中の第4パッチングアルゴリズム205−4に対応しかつ「例えば非線形歪み操作などの他の機能」と示す第4パッチングアルゴリズム1147−1と、を含んでも良い。
図2aの説明の中で上述したように、第1パッチングアルゴリズム1141−1は、単相ボコーダ1141−2と非ハーモニックなコピー操作の機能1141−3及び1141−4とを含む。さらに、第2のパッチングアルゴリズム1143−1は多相ボコーダ操作に基づいており、第1位相ボコーダ1143−2と第2位相ボコーダ1143−3と第3位相ボコーダ1143−4とを含む。さらに、第3パッチングアルゴリズム1145−1は非ハーモニックなコピー操作のSBR機能を持ち、第1コピー操作1145−2と第2コピー操作1145−3と第3コピー操作1145−4を実行する。最後に、第4パッチングアルゴリズム1147−1は、非線形歪み操作の機能を持つ。
特に、図11の実施例においては、パッチングアルゴリズムのブロック1141−1,1143−1,1145−1及び1147−1のサブ成分は、図2aにおけるパッチングアルゴリズムのブロック205−1,205−2,205−3及び205−4の各成分に対応していても良い。また、シンボルζ(クロスオーバー帯域)は、クロスオーバー周波数(fx)に対応していても良い。
さらに、パッチ選択器1150は、スペクトルドメイン・パッチ生成器1141を制御するためのパッチング制御信号119に対応したパッチング制御信号1155を供給しても良く、それによって、パッチングアルゴリズムのグループ1141−1,1143−1,1145−1,1147−1から少なくとも2つの異なるスペクトルドメイン・パッチアルゴリズムが実行され、修正済スペクトル表現125に対応する修正スペクトル表現1149が得られる。
任意ではあるが、修正スペクトル表現1149を後続の補間器1160により処理し、補間された修正済スペクトル表現1165を得ても良い。その補間された修正済スペクトル表現1165は、次に第2変換器810へと供給されても良く、この第2変換器はN=2048の第2変換長を持つIFFT処理器1170として構成されても良い。ここで、図8の説明と同様に、N=2048の第2変換長はN=512の第1変換長の正に4倍に調整されている。上述したように、異なるスペクトルドメイン・パッチングアルゴリズムを用いて実行される帯域幅拡張スキームの帯域幅拡張特性が考慮されても良い。
IFFT処理器1170は、補間された修正済スペクトル表現1165を、図8の修正済時間ドメイン信号815に対応する修正済時間ドメイン信号1175へと変換しても良い。修正済時間ドメイン信号1175は、次に合成ウインドウ化器1180へと供給され、ここで、この修正済時間ドメイン信号1175に対してある合成ウインドウ関数が適用され、修正されたウインドウ化済時間ドメイン信号1185が取得される。ここで、合成ウインドウ関数は、分析ウインドウ関数を適用したことで生じた影響が合成ウインドウ関数を適用することで補償されるように、分析ウインドウ関数に対して適合される。
帯域幅拡張により、修正されたウインドウ化済時間ドメイン信号1185を、オリジナルサンプリングレート(例えば8kHz)よりも高い有効サンプリングレート(例えば32kHz)でサンプリングしなければならないので、修正されたウインドウ化済時間ドメイン信号1185は、最後に、「オーバーラップと加算」と記述したブロック1190においてオーバーラップ−加算されてもよい。つまり、このブロック1190により適用され「Inc=256」と記述したように例えば256サンプルを持つ第2時間距離と、分析ウインドウ化器1120により適用され例えば64サンプルを持つ第1時間距離との間の比率(例えば比率=4)が、前記高い有効サンプリングレートとオリジナルサンプリングレートとの間の比率に等しくなっても良い。このように、出力信号1195は、オリジナル(ダウンサンプリングされた)信号1115と同じオーバーラップ特性を持つように取得されてもよい。装置1100により供給される出力信号1195には、図1aに示す周波数再構築処理器130から始まる更なる処理を施し、帯域幅が拡張された複製信号を最終的に取得しても良い。
図11に示す実施例では、異なるパッチングアルゴリズムの全てが同じドメイン、例えば周波数ドメインにおいて実行されることに注意すべきである。このドメインは、SBRの場合のようにQMFドメインであっても良く、又はフーリエ変換された場合のように他のいずれのドメインであっても良い。実際のパッチデータ生成は異なるドメインで実行されても良く、しかしその場合には、全体のパッチングは常に同じドメインで実行される。
さらに、選択の対象となるパッチングに対して様々なソースモデルを関連させることができる。例えば、非特許文献12に示されたスピーチ帯域幅拡張において使用されるスピーチソースモデルをスピーチ信号のために選択し、他方、静的な音楽のためには静的なソースモデルを適合させても良い。同様に、上述したように、過渡についてはパッチングのために独自のモデルを用いても良い。
さらに、時間−周波数変換のためのオーバーラップする分析及び合成ウインドウを用いることで、異なるパッチング・スキームの間のスムーズな転位が保証される。代替的に、より低いオーバーラップを可能にするために、分析及び合成のための特別なウインドウを使用することもできる。
要約すれば、図11の実施例においては、パッチング方法は、隣接する周波数部分の単純なコピー操作と、位相ボコーダに基づくハーモニックな転位のスキームと、隣接する周波数部分のコピー操作を含む位相ボコーダに基づくハーモニックな転位のスキームと、の間から選択することができる。
本発明はこれまでブロック図を用いて説明し、各ブロックが現実又は論理的なハードウエア要素を示してきたが、本発明はまたコンピュータに実装された方法によって実行されても良い。この場合には、各ブロックはそれぞれ対応する方法ステップを示し、それらのステップは対応する論理的又は実体的ハードウエアのブロックにより実行される機能を示す。
上述した実施の形態は、本発明の原理を単に例示的に示したにすぎない。本明細書に記載した構成及び詳細について、修正及び変更が可能であることは当業者にとって明らかである。従って、本発明は、以下に添付する特許請求の範囲の技術的範囲によってのみ限定されるものであり、本明細書に実施形態の説明及び解説の目的で提示した具体的詳細によって限定されるものではない。
本発明の方法の所定の実施条件に依るが、本発明の方法は、ハードウエア又はソフトウエアにおいて実行可能である。この方法は、その中に格納される電子的に読出し可能な制御信号を有し、本発明の方法が実行されるようにプログラム可能なコンピュータシステムと協働する、デジタル記憶媒体、特にディスク,DVD,又はCDなどを使用して実行することができる。本発明は一般的に、機械読出し可能なキャリアに記憶されたプログラムコードを有する、コンピュータプログラム製品として構成することができ、このプログラムコードは、当該コンピュータプログラム製品がコンピュータ上で作動するときに、本発明の方法を実行するよう作動するものである。換言すれば、本発明の方法は、当該コンピュータプログラムがコンピュータ上で作動するときに、本発明の方法の少なくとも1つを実行するためのプログラムコードを有する、コンピュータプログラムである。本発明の符号化されたオーディオ信号は、デジタル記憶媒体など、いかなる機械読出し可能な記憶媒体にも記憶されることができる。
本発明の各実施例は、帯域幅拡張において、音声とハードウエアと信号特性とをパッチング処理のために考慮可能にする。最適なパッチングの決定は、開ループ又は閉ループの中で実行できる。従って、復元品質は制御及び強化可能である。
本発明の概念は、異なるパッチングアルゴリズム間でのスムーズな転位が容易に達成できるという利点があり、信号に基づく帯域幅拡張の高速で正確な適用を可能にする。
本発明の特徴を最も顕著に示すアプリケーションは、携帯機器の中に構成され、従って電池からの電力供給で作動する、オーディオ復号器である。

Claims (15)

  1. パッチング制御信号(119;1155)を使用して合成オーディオ信号(145)を生成する装置(100;200;700;800;1100)であって、
    オーディオ信号(105;1101)のある時間部分(107−1;107−2;1125)をスペクトル表現(115:1135−1)へと変換する第1の変換器(110;1130)と、
    複数の異なるスペクトルドメイン・パッチングアルゴリズム(117−1)を実行するスペクトルドメイン・パッチ生成器(120;1141)であって、各パッチングアルゴリズムは、前記オーディオ信号(105;1101)のコア周波数帯域(210)の対応するスペクトル成分から導出された高周波数帯域(220)のスペクトル成分を含む修正済スペクトル表現(125;1149)を生成するものであり、前記パッチング制御信号(119;1155)に従って、第1の時間部分(107−1)のための第1スペクトルドメイン・パッチングアルゴリズム(117−2)を前記複数の異なるスペクトルドメイン・パッチングアルゴリズム(117−1)から選択し、かつ第2の異なる時間部分(107−2)のための第2スペクトルドメイン・パッチングアルゴリズム(117−3)を前記複数の異なるスペクトルドメイン・パッチングアルゴリズム(117−1)から選択することで、前記修正済スペクトル表現(125;1149)を取得する、スペクトルドメイン・パッチ生成器(120;1141)と、
    スペクトル帯域複製パラメータ(127)に従って、前記修正済スペクトル表現(125;1149)又はその修正済スペクトル表現(125;1149)から導出された信号を処理し、帯域幅拡張信号(135)を取得する、高周波再構築処理器(130)と、
    前記コア周波数帯域(210)にスペクトル成分を持つ前記オーディオ信号(105;1101)又はそのオーディオ信号(105;1101)から導出された信号と、前記帯域幅拡張信号(135)とを結合し、前記合成オーディオ信号(145)を取得する結合器(140)と、
    を備えることを特徴とする装置。
  2. 請求項1に記載の装置(100;200;700;800;1100)であって、
    前記スペクトルドメイン・パッチ生成器(120;1141)は、スペクトルドメインで作動し時間ドメインでは作動しないことを特徴とする装置。
  3. 請求項1又は2に記載の装置(200)であって、
    前記スペクトルドメイン・パッチ生成器(120)は、スペクトルドメインのパッチングアルゴリズムのグループ(203)の中から少なくとも2つの異なるスペクトルドメイン・パッチングアルゴリズムを実行し、
    前記パッチングアルゴリズムのグループ(203)は、単相ボコーダに基づくハーモニックな転位と非ハーモニックなコピー操作のスペクトル帯域複製機能とを持つ第1パッチングアルゴリズム(205−1)と、多相ボコーダに基づくハーモニックな転位を持つ第2パッチングアルゴリズム(205−2)と、非ハーモニックなコピー操作のスペクトル帯域複製機能を持つ第3パッチングアルゴリズム(205−3)と、非線形歪み操作を持つ第4パッチングアルゴリズム(205−4)とを含み、
    前記帯域幅拡張信号(135)の高周波数帯域(220)がコア周波数帯域(210)のクロスオーバー周波数(215;fx)の少なくとも4倍の最大周波数(225;fmax)を持つように、帯域幅拡張を実行することを特徴とする装置。
  4. 請求項3に記載の装置であって、
    前記スペクトルドメイン・パッチ生成器(120)は前記少なくとも2つの異なるスペクトルドメイン・パッチングアルゴリズムから選択された1つのパッチングアルゴリズムを実行し、その選択されたパッチングアルゴリズムは第1パッチングアルゴリズム(205−1)を含み、
    この第1パッチングアルゴリズム(205−1)は、コア周波数帯域(210)から抽出されたソース周波数帯域(310)から第1の目標周波数帯域(310’)への変換を制御するための係数2の帯域幅拡張ファクタ(σ)を持つ単相ボコーダ(305)に基づいたハーモニックな転位を含み、前記第1の目標周波数帯域(310’)が前記クロスオーバー周波数(fx)からこのクロスオーバー周波数(fx)の2倍までの領域の周波数を持つように、前記ソース周波数帯域(310)内のスペクトル成分の位相を前記帯域幅拡張ファクタ(σ)により乗算し、
    前記第1パッチングアルゴリズム(205−1)は非ハーモニックなコピー操作のスペクトル帯域複製機能(315)をさらに備え、このスペクトル帯域複製機能(315)は、第1コピー操作を用いて、第2の目標周波数帯域(320’)が前記クロスオーバー周波数(fx)の2倍からこのクロスオーバー周波数(fx)の3倍までの領域の周波数を持つように、前記第1の目標周波数帯域(310’)のスペクトル成分を前記第2の目標周波数帯域(320’)へと変換し、さらに、第2コピー操作を用いて、第3の目標周波数帯域(330’)が前記高周波数帯域(220)に含まれる前記クロスオーバー周波数(fx)の3倍からこのクロスオーバー周波数(fx)の4倍までの領域の周波数を持つように、前記第2の目標周波数帯域(320’)のスペクトル成分を前記第3の目標周波数帯域(330’)へと変換し、
    前記高周波数帯域(220)は、前記第1の目標周波数帯域(310’)と前記第2の目標周波数帯域(320’)と前記第3の目標周波数帯域(330’)とを含むことを特徴とする装置。
  5. 請求項3に記載の装置であって、
    前記スペクトルドメイン・パッチ生成器(120)は前記少なくとも2つの異なるスペクトルドメイン・パッチングアルゴリズムから選択された1つのパッチングアルゴリズムを実行し、その選択されたパッチングアルゴリズムは前記第2パッチングアルゴリズム(205−2)を含み、
    この第2パッチングアルゴリズム(205−2)は、前記コア周波数帯域(210)から抽出された第1ソース周波数帯域(410)から第1の目標周波数帯域(410’)への変換を制御するための係数2の第1帯域幅拡張ファクタ(σ1)を持つ多相ボコーダ(405)に基づいた、ハーモニックな転位を含み、前記第1の目標周波数帯域(410’)が前記クロスオーバー周波数(fx)からこのクロスオーバー周波数(fx)の2倍までの領域の周波数を持つように、前記第1ソース周波数帯域(410)内のスペクトル成分の位相を前記第1帯域幅拡張ファクタ(σ1)により乗算し、
    前記第2パッチングアルゴリズム(205−2)は、前記コア周波数帯域(210)から抽出された第2ソース周波数帯域(420−1,420−2)から第2の目標周波数帯域(420’,420'')への変換を制御するための係数3の第2帯域幅拡張ファクタ(σ2)をさらに備え、前記第2の目標周波数帯域(420’ ,420'')が前記クロスオーバー周波数(fx)の2倍からこのクロスオーバー周波数(fx)の3倍までの領域、又は前記クロスオーバー周波数(fx)からこのクロスオーバー周波数(fx)の3倍までの領域の周波数を持つように、前記第2ソース周波数帯域(420−1,420−2)内のスペクトル成分の位相を前記第2帯域幅拡張ファクタ(σ2)により乗算し、
    前記第2パッチングアルゴリズム(205−2)は、前記コア周波数帯域(210)から抽出された第3ソース周波数帯域(430−1,430−2)から第3の目標周波数帯域(430’,430'')への変換を制御するための係数4の第3帯域幅拡張ファクタ(σ3)をさらに備え、前記第3の目標周波数帯域(430’ ,430'')が前記クロスオーバー周波数(fx)の3倍からこのクロスオーバー周波数(fx)の4倍までの領域、又は前記クロスオーバー周波数(fx)から前記高周波数帯域(220)に含まれるこのクロスオーバー周波数(fx)の4倍までの領域の周波数を持つように、前記第3ソース周波数帯域(430−1,430−2)内のスペクトル成分の位相を前記第3帯域幅拡張ファクタ(σ3)により乗算し、
    前記高周波数帯域(220)は、前記第1の目標周波数帯域(410’)と第2の目標周波数帯域(420’ ,420'')と第3の目標周波数帯域(430’ ,430'')とを含むことを特徴とする装置。
  6. 請求項3に記載の装置であって、
    前記スペクトルドメイン・パッチ生成器(120)は、前記少なくとも2つの異なるスペクトルドメイン・パッチングアルゴリズムから選択された1つのパッチングアルゴリズムを実行し、その選択されたパッチングアルゴリズムは第3パッチングアルゴリズム(205−3)を含み、
    この第3パッチングアルゴリズム(205−3)は、非ハーモニックなコピー操作のスペクトル帯域複製機能(505)を備え、このスペクトル帯域複製機能(505)は、第1コピー操作を用いて、第1の目標周波数帯域(510’)が前記クロスオーバー周波数(fx)からこのクロスオーバー周波数(fx)の2倍までの領域の周波数を持つように、前記コア周波数帯域(210)であるソース周波数帯域(510)のスペクトル成分を第1目標周波数帯域(510’)へと変換し、第2コピー操作を用いて、第2の目標周波数帯域(520’)が前記クロスオーバー周波数(fx)の2倍からこのクロスオーバー周波数(fx)の3倍までの領域の周波数を持つように、前記第1の目標周波数帯域(510’)内のスペクトル成分を前記第2の目標周波数帯域(520’)へと変換し、さらに、第3コピー操作を用いて、第3の目標周波数帯域(530’)が前記高周波数帯域(220)に含まれる前記クロスオーバー周波数(fx)の3倍からこのクロスオーバー周波数(fx)の4倍までの領域の周波数を持つように、前記第2の目標周波数帯域(520’)内のスペクトル成分を前記第3の目標周波数帯域(530’)へと変換し、
    前記高周波数帯域(220)は、前記第1の目標周波数帯域(510’)と第2の目標周波数帯域(520’)と第3の目標周波数帯域(530’)とを含むことを特徴とする装置。
  7. 請求項3に記載の装置であって、
    前記スペクトルドメイン・パッチ生成器(120)は、前記少なくとも2つの異なるスペクトルドメイン・パッチングアルゴリズムから選択された1つのパッチングアルゴリズムを実行し、その選択されたパッチングアルゴリズムは第4パッチングアルゴリズム(205−4)を含み、
    この第4パッチングアルゴリズム(205−4)は、前記クロスオーバー周波数(fx)からこのクロスオーバー周波数(fx)の4倍までの領域の周波数を持つ前記高周波数帯域(220)内のスペクトル成分を生成するための非線形的な歪み操作を含むことを特徴とする装置。
  8. 請求項1乃至7のいずれか1項に記載の装置(700)であって、
    前記修正済スペクトル表現(125)から導出されたある時間ドメイン信号をスペクトルドメインへと変換するための、時間/周波数変換器を含まないことを特徴とする装置。
  9. 請求項1乃至8のいずれか1項に記載の装置(800)であって、
    前記修正済スペクトル表現(125)を時間ドメインへと変換するための第2の変換器(810)をさらに備え、前記第1の変換器(110)により適用された分析に適合する合成を前記第2の変換器(810)が適用し、前記第1の変換器(110)は第1の変換長(111)を有する変換を実行し、前記第2の変換器(810)は第2の変換長を有する変換を実行し、前記高周波数帯域(220)内の前記最大周波数(fmax)と前記コア周波数帯域(210)内の前記クロスオーバー周波数(fx)との比率と、前記第1変換長(111)とが考慮されるという点において、前記第2の変換長は帯域幅拡張特性に依存していることを特徴とする装置。
  10. コア周波数帯域(210)と高周波数帯域(220)とを含むオーディオ信号(105)を符号化する装置(900;1000)において、
    前記オーディオ信号(105)を前記コア周波数帯域(210)内で符号化するコア符号器(910)と、
    前記オーディオ信号(105)からパッチング制御信号(119)を抽出するパラメータ抽出器(920)であって、このパッチング制御信号(119)は、複数の異なるスペクトルドメイン・パッチングアルゴリズム(117−1)から選択された1つのパッチングアルゴリズムを指示するものであり、その選択されたパッチングアルゴリズムは、帯域幅拡張復号器において合成オーディオ信号を生成するためにスペクトルドメインで実行される、パラメータ抽出器(920)と、
    前記高周波数帯域(220)からスペクトル帯域複製パラメータ(127)を計算するためのパラメータ計算器(930)と、
    を含むことを特徴とする符号化装置。
  11. 請求項10に記載の符号化する装置(1000)であって、
    前記パラメータ抽出器(920)は、前記複数の異なるスペクトルドメイン・パッチングアルゴリズム(117−1)から前記選択されたパッチングアルゴリズムを決定し、前記選択されたパッチングアルゴリズムは、前記オーディオ信号(105)又はそのオーディオ信号(105)から導出されたある信号と、スペクトルドメインで前記複数のパッチングアルゴリズム(117−1)を実行し且つ前記オーディオ信号(105)のある時間部分の修正済スペクトル表現(125)を処理することで取得された複数の帯域幅拡張済信号(1005)と、の間の比較に基づくものであることを特徴とする符号化装置。
  12. パッチング制御信号(119;1155)を使用して合成オーディオ信号(145)を生成する方法(100;200;700;800;1100)であって、
    オーディオ信号(105;1101)のある時間部分(107−1;107−2;1125)をスペクトル表現(115:1135−1)へと変換するステップ(110;1130)と、
    複数の異なるスペクトルドメイン・パッチングアルゴリズム(117−1)を実行するステップ(120;1141)であって、各パッチングアルゴリズムは、前記オーディオ信号(105;1101)のコア周波数帯域(210)の対応するスペクトル成分から導出された高周波数帯域(220)のスペクトル成分を含む修正済スペクトル表現(125;1149)を生成するものであり、パッチング制御信号(119;1155)に従って、第1の時間部分(107−1)のための第1スペクトルドメイン・パッチングアルゴリズム(117−2)を前記複数の異なるスペクトルドメイン・パッチングアルゴリズム(117−1)から選択し、かつ第2の異なる時間部分(107−2)のための第2スペクトルドメイン・パッチングアルゴリズム(117−3)を前記複数の異なるスペクトルドメイン・パッチングアルゴリズム(117−1)から選択することで、前記修正済スペクトル表現(125;1149)を取得するステップ(120;1141)と、
    スペクトル帯域複製パラメータ(127)に従って、前記修正済スペクトル表現(125;1149)又はその修正済スペクトル表現(125;1149)から導出された信号を処理し、帯域幅拡張信号(135)を取得する処理ステップ(130)と、
    前記コア周波数帯域(210)にスペクトル成分を持つ前記オーディオ信号(105;1101)又はそのオーディオ信号(105;1101)から導出された信号と、前記帯域幅拡張信号(135)とを結合し、前記合成オーディオ信号(145)を取得する結合ステップと、
    を備えることを特徴とする方法。
  13. コア周波数帯域(210)と高周波数帯域(220)とを含むオーディオ信号(105)を符号化する方法(900;1000)において、
    前記オーディオ信号(105)を前記コア周波数帯域(210)内で符号化するステップ(910)と、
    前記オーディオ信号(105)からパッチング制御信号(119)を抽出するステップ(920)であって、このパッチング制御信号(119)は、複数の異なるスペクトルドメイン・パッチングアルゴリズム(117−1)から選択された1つのパッチングアルゴリズムを指示するものであり、その選択されたパッチングアルゴリズムは、帯域幅拡張復号器において合成オーディオ信号を生成するためにスペクトルドメインで実行される、抽出ステップ(920)と、
    前記高周波数帯域(220)からスペクトル帯域複製パラメータ(127)を計算するステップ(930)と、
    を含むことを特徴とする符号化方法。
  14. 符号化されたオーディオ信号(935)を記録したコンピュータ読み取り可能な記憶媒体であって、前記符号化されたオーディオ信号(935)は、
    コア周波数帯域(210)内で符号化された符号化済オーディオ信号(915)と、
    複数の異なるスペクトルドメイン・パッチングアルゴリズム(117−1)から選択された1つのパッチングアルゴリズムを指示するパッチング制御信号(119)であり、その選択されたパッチングアルゴリズムは、帯域幅拡張復号器において合成オーディオ信号(145)を生成するためにスペクトルドメインで実行される、パッチング制御信号(119)と、
    オーディオ信号(105)の高周波数帯域(220)から計算されたスペクトル帯域複製パラメータ(127)と、
    を含むことを特徴とする、記憶媒体
  15. コンピュータ請求項13又は14に係る方法を実行させるためのコンピュータプログラム。
JP2011529585A 2009-04-09 2010-04-01 合成オーディオ信号を生成する装置及び方法並びにオーディオ信号を符号化する装置及び方法 Active JP5227459B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US16806809P 2009-04-09 2009-04-09
US61/168,068 2009-04-09
EP09181008.5 2009-12-30
EP09181008A EP2239732A1 (en) 2009-04-09 2009-12-30 Apparatus and method for generating a synthesis audio signal and for encoding an audio signal
PCT/EP2010/054434 WO2010115845A1 (en) 2009-04-09 2010-04-01 Apparatus and method for generating a synthesis audio signal and for encoding an audio signal

Publications (2)

Publication Number Publication Date
JP2012504781A JP2012504781A (ja) 2012-02-23
JP5227459B2 true JP5227459B2 (ja) 2013-07-03

Family

ID=42123165

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2011507945A Active JP5165106B2 (ja) 2009-04-02 2010-04-01 ハーモニックな帯域拡張と非ハーモニックな帯域拡張との組合せを使用して、入力信号表示に基づいて帯域拡張信号の表示を生成するための装置と方法及びコンピュータプログラム
JP2011529585A Active JP5227459B2 (ja) 2009-04-09 2010-04-01 合成オーディオ信号を生成する装置及び方法並びにオーディオ信号を符号化する装置及び方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2011507945A Active JP5165106B2 (ja) 2009-04-02 2010-04-01 ハーモニックな帯域拡張と非ハーモニックな帯域拡張との組合せを使用して、入力信号表示に基づいて帯域拡張信号の表示を生成するための装置と方法及びコンピュータプログラム

Country Status (21)

Country Link
US (2) US9697838B2 (ja)
EP (3) EP2239732A1 (ja)
JP (2) JP5165106B2 (ja)
KR (2) KR101207120B1 (ja)
CN (2) CN102027537B (ja)
AR (3) AR076199A1 (ja)
AT (1) ATE534119T1 (ja)
AU (2) AU2010233858B9 (ja)
BR (1) BRPI1003636B1 (ja)
CA (2) CA2721629C (ja)
CO (1) CO6311123A2 (ja)
EG (1) EG26400A (ja)
ES (2) ES2396686T3 (ja)
HK (1) HK1159842A1 (ja)
MX (2) MX2011002419A (ja)
MY (2) MY151346A (ja)
PL (2) PL2269189T3 (ja)
RU (1) RU2501097C2 (ja)
SG (1) SG174113A1 (ja)
TW (2) TWI492222B (ja)
WO (2) WO2010112587A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013525833A (ja) * 2010-04-16 2013-06-20 フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. ガイドされた帯域幅拡張およびブラインド帯域幅拡張を用いて広帯域信号を生成するため装置、方法およびコンピュータプログラム

Families Citing this family (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2452044C1 (ru) * 2009-04-02 2012-05-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Устройство, способ и носитель с программным кодом для генерирования представления сигнала с расширенным диапазоном частот на основе представления входного сигнала с использованием сочетания гармонического расширения диапазона частот и негармонического расширения диапазона частот
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
AU2015203065B2 (en) * 2010-01-19 2017-05-11 Dolby International Ab Improved subband block based harmonic transposition
PL3564955T3 (pl) 2010-01-19 2021-04-19 Dolby International Ab Ulepszona transpozycja harmonicznych opierająca się na bloku pod-pasma
EP2362376A3 (en) * 2010-02-26 2011-11-02 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for modifying an audio signal using envelope shaping
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5243620B2 (ja) 2010-06-09 2013-07-24 パナソニック株式会社 帯域拡張方法、帯域拡張装置、プログラム、集積回路およびオーディオ復号装置
PL3544007T3 (pl) * 2010-07-19 2020-11-02 Dolby International Ab Przetwarzanie sygnałów audio podczas rekonstrukcji wysokiej częstotliwości
US12002476B2 (en) 2010-07-19 2024-06-04 Dolby International Ab Processing of audio signals during high frequency reconstruction
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
PL3567589T3 (pl) * 2011-02-18 2022-06-06 Ntt Docomo, Inc. Koder mowy i sposób kodowania mowy
DE102011106034A1 (de) * 2011-06-30 2013-01-03 Zte Corporation Verfahren und Vorrichtung zur Spektralbandreplikation und Verfahren und System zur Audiodecodierung
TWI576832B (zh) * 2011-06-30 2017-04-01 三星電子股份有限公司 產生帶寬延伸訊號的裝置與方法
US20130006644A1 (en) * 2011-06-30 2013-01-03 Zte Corporation Method and device for spectral band replication, and method and system for audio decoding
CN103035248B (zh) * 2011-10-08 2015-01-21 华为技术有限公司 音频信号编码方法和装置
US9530424B2 (en) 2011-11-11 2016-12-27 Dolby International Ab Upsampling using oversampled SBR
CN104541327B (zh) * 2012-02-23 2018-01-12 杜比国际公司 用于高频音频内容的有效恢复的方法及***
EP2682941A1 (de) * 2012-07-02 2014-01-08 Technische Universität Ilmenau Vorrichtung, Verfahren und Computerprogramm für frei wählbare Frequenzverschiebungen in der Subband-Domäne
ES2549953T3 (es) * 2012-08-27 2015-11-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y método para la reproducción de una señal de audio, aparato y método para la generación de una señal de audio codificada, programa de ordenador y señal de audio codificada
EP2709106A1 (en) * 2012-09-17 2014-03-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating a bandwidth extended signal from a bandwidth limited audio signal
US9258428B2 (en) 2012-12-18 2016-02-09 Cisco Technology, Inc. Audio bandwidth extension for conferencing
CN103971693B (zh) * 2013-01-29 2017-02-22 华为技术有限公司 高频带信号的预测方法、编/解码设备
KR101798126B1 (ko) 2013-01-29 2017-11-16 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 주파수 향상 오디오 신호를 생성하는 디코더, 디코딩 방법, 인코딩된 신호를 생성하는 인코더, 및 컴팩트 선택 사이드 정보를 이용한 인코딩 방법
EP3054446B1 (en) 2013-01-29 2023-08-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, method for providing an encoded audio information, method for providing a decoded audio information, computer program and encoded representation using a signal-adaptive bandwidth extension
EP3742440B1 (en) 2013-04-05 2024-07-31 Dolby International AB Audio decoder for interleaved waveform coding
JP6305694B2 (ja) * 2013-05-31 2018-04-04 クラリオン株式会社 信号処理装置及び信号処理方法
CN104217727B (zh) * 2013-05-31 2017-07-21 华为技术有限公司 信号解码方法及设备
EP2830064A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection
WO2015041070A1 (ja) 2013-09-19 2015-03-26 ソニー株式会社 符号化装置および方法、復号化装置および方法、並びにプログラム
WO2015063227A1 (en) * 2013-10-31 2015-05-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio bandwidth extension by insertion of temporal pre-shaped noise in frequency domain
EP2881943A1 (en) * 2013-12-09 2015-06-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding an encoded audio signal with low computational resources
BR112016014476B1 (pt) 2013-12-27 2021-11-23 Sony Corporation Aparelho e método de decodificação, e, meio de armazenamento legível por computador
KR102244612B1 (ko) * 2014-04-21 2021-04-26 삼성전자주식회사 무선 통신 시스템에서 음성 데이터를 송신 및 수신하기 위한 장치 및 방법
EP2963648A1 (en) * 2014-07-01 2016-01-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio processor and method for processing an audio signal using vertical phase correction
KR102306537B1 (ko) 2014-12-04 2021-09-29 삼성전자주식회사 소리 신호를 처리하는 방법 및 디바이스.
TWI758146B (zh) 2015-03-13 2022-03-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
WO2016149085A2 (en) * 2015-03-13 2016-09-22 Psyx Research, Inc. System and method for dynamic recovery of audio data and compressed audio enhancement
JP6611042B2 (ja) * 2015-12-02 2019-11-27 パナソニックIpマネジメント株式会社 音声信号復号装置及び音声信号復号方法
EP3483878A1 (en) * 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
CN109036457B (zh) 2018-09-10 2021-10-08 广州酷狗计算机科技有限公司 恢复音频信号的方法和装置
TWI742486B (zh) * 2019-12-16 2021-10-11 宏正自動科技股份有限公司 輔助歌唱系統、輔助歌唱方法及其非暫態電腦可讀取記錄媒體
GB202203733D0 (en) * 2022-03-17 2022-05-04 Samsung Electronics Co Ltd Patched multi-condition training for robust speech recognition

Family Cites Families (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5127054A (en) 1988-04-29 1992-06-30 Motorola, Inc. Speech quality improvement for voice coders and synthesizers
US5455888A (en) 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
JPH10124088A (ja) 1996-10-24 1998-05-15 Sony Corp 音声帯域幅拡張装置及び方法
SE9700772D0 (sv) * 1997-03-03 1997-03-03 Ericsson Telefon Ab L M A high resolution post processing method for a speech decoder
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
SE9903553D0 (sv) 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
US6549884B1 (en) 1999-09-21 2003-04-15 Creative Technology Ltd. Phase-vocoder pitch-shifting
US7742927B2 (en) 2000-04-18 2010-06-22 France Telecom Spectral enhancing method and device
US6584438B1 (en) * 2000-04-24 2003-06-24 Qualcomm Incorporated Frame erasure compensation method in a variable rate speech coder
SE0001926D0 (sv) 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
JP2002082685A (ja) * 2000-06-26 2002-03-22 Matsushita Electric Ind Co Ltd 音声帯域拡張装置及び音声帯域拡張方法
US20020016698A1 (en) * 2000-06-26 2002-02-07 Toshimichi Tokuda Device and method for audio frequency range expansion
SE0004818D0 (sv) 2000-12-22 2000-12-22 Coding Technologies Sweden Ab Enhancing source coding systems by adaptive transposition
US20020128839A1 (en) 2001-01-12 2002-09-12 Ulf Lindgren Speech bandwidth extension
WO2003007480A1 (fr) 2001-07-13 2003-01-23 Matsushita Electric Industrial Co., Ltd. Dispositif de decodage de signaux audio et dispositif de codage de signaux audio
JP2003108197A (ja) * 2001-07-13 2003-04-11 Matsushita Electric Ind Co Ltd オーディオ信号復号化装置およびオーディオ信号符号化装置
US6988066B2 (en) 2001-10-04 2006-01-17 At&T Corp. Method of bandwidth extension for narrow-band speech
US6895375B2 (en) 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech
DE60214027T2 (de) 2001-11-14 2007-02-15 Matsushita Electric Industrial Co., Ltd., Kadoma Kodiervorrichtung und dekodiervorrichtung
JP3926726B2 (ja) * 2001-11-14 2007-06-06 松下電器産業株式会社 符号化装置および復号化装置
EP1423847B1 (en) * 2001-11-29 2005-02-02 Coding Technologies AB Reconstruction of high frequency components
US20030187663A1 (en) * 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
TWI288915B (en) * 2002-06-17 2007-10-21 Dolby Lab Licensing Corp Improved audio coding system using characteristics of a decoded signal to adapt synthesized spectral components
US20040138876A1 (en) 2003-01-10 2004-07-15 Nokia Corporation Method and apparatus for artificial bandwidth expansion in speech processing
KR100917464B1 (ko) 2003-03-07 2009-09-14 삼성전자주식회사 대역 확장 기법을 이용한 디지털 데이터의 부호화 방법,그 장치, 복호화 방법 및 그 장치
FI119533B (fi) 2004-04-15 2008-12-15 Nokia Corp Audiosignaalien koodaus
JP4977471B2 (ja) 2004-11-05 2012-07-18 パナソニック株式会社 符号化装置及び符号化方法
JP2006243041A (ja) 2005-02-28 2006-09-14 Yutaka Yamamoto 高域補間装置及び再生装置
US7953605B2 (en) * 2005-10-07 2011-05-31 Deepen Sinha Method and apparatus for audio encoding and decoding using wideband psychoacoustic modeling and bandwidth extension
KR20070115637A (ko) 2006-06-03 2007-12-06 삼성전자주식회사 대역폭 확장 부호화 및 복호화 방법 및 장치
US8417532B2 (en) 2006-10-18 2013-04-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding an information signal
EP1970900A1 (en) 2007-03-14 2008-09-17 Harman Becker Automotive Systems GmbH Method and apparatus for providing a codebook for bandwidth extension of an acoustic signal
CN101276587B (zh) * 2007-03-27 2012-02-01 北京天籁传音数字技术有限公司 声音编码装置及其方法和声音解码装置及其方法
ES2704286T3 (es) * 2007-08-27 2019-03-15 Ericsson Telefon Ab L M Método y dispositivo para la descodificación espectral perceptual de una señal de audio, que incluyen el llenado de huecos espectrales
CN101393743A (zh) * 2007-09-19 2009-03-25 中兴通讯股份有限公司 一种可配置参数的立体声编码装置及其编码方法
JP5098569B2 (ja) 2007-10-25 2012-12-12 ヤマハ株式会社 帯域拡張再生装置
RU2483368C2 (ru) 2007-11-06 2013-05-27 Нокиа Корпорейшн Кодер
EP2220646A1 (en) 2007-11-06 2010-08-25 Nokia Corporation Audio coding apparatus and method thereof
JP5400059B2 (ja) 2007-12-18 2014-01-29 エルジー エレクトロニクス インコーポレイティド オーディオ信号処理方法及び装置
RU2491658C2 (ru) 2008-07-11 2013-08-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Синтезатор аудиосигнала и кодирующее устройство аудиосигнала
EP2169670B1 (en) 2008-09-25 2016-07-20 LG Electronics Inc. An apparatus for processing an audio signal and method thereof
CA2748003C (en) 2009-01-16 2016-05-24 Dolby International Ab Cross product enhanced harmonic transposition
DK2211339T3 (en) 2009-01-23 2017-08-28 Oticon As listening System
US8781844B2 (en) 2009-09-25 2014-07-15 Nokia Corporation Audio coding
KR101370870B1 (ko) * 2009-12-16 2014-03-07 돌비 인터네셔널 에이비 Sbr 비트스트림 파라미터 다운믹스

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013525833A (ja) * 2010-04-16 2013-06-20 フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. ガイドされた帯域幅拡張およびブラインド帯域幅拡張を用いて広帯域信号を生成するため装置、方法およびコンピュータプログラム

Also Published As

Publication number Publication date
AR076237A1 (es) 2011-05-26
CA2721629A1 (en) 2010-10-07
BR122021012137A2 (pt) 2023-01-03
BR122021012290A2 (pt) 2023-01-03
AU2010233858A1 (en) 2010-10-14
CO6311123A2 (es) 2011-08-22
CA2734973A1 (en) 2010-10-14
CN102027537B (zh) 2012-10-03
PL2269189T3 (pl) 2012-04-30
TWI492222B (zh) 2015-07-11
ES2396686T3 (es) 2013-02-25
AR097531A2 (es) 2016-03-23
WO2010112587A1 (en) 2010-10-07
KR101248321B1 (ko) 2013-03-27
RU2501097C2 (ru) 2013-12-10
BR122021012145A2 (pt) 2023-01-03
EP2239732A1 (en) 2010-10-13
AU2010230129A1 (en) 2010-10-07
PL2351025T3 (pl) 2013-04-30
ES2377551T3 (es) 2012-03-28
BRPI1003636A2 (pt) 2019-07-02
HK1159842A1 (en) 2012-08-03
ATE534119T1 (de) 2011-12-15
US20130090934A1 (en) 2013-04-11
BR122021012115A2 (pt) 2023-01-03
MX2010012343A (es) 2011-02-23
BRPI1001239A2 (pt) 2022-11-22
CA2721629C (en) 2015-10-13
CN102027537A (zh) 2011-04-20
CA2734973C (en) 2016-10-18
EP2269189A1 (en) 2011-01-05
SG174113A1 (en) 2011-10-28
US20120010880A1 (en) 2012-01-12
AU2010230129B2 (en) 2011-09-29
MX2011002419A (es) 2011-04-05
WO2010115845A1 (en) 2010-10-14
CN102177545A (zh) 2011-09-07
TWI416507B (zh) 2013-11-21
JP2011520146A (ja) 2011-07-14
BR122021012125A2 (pt) 2023-01-03
KR20110081292A (ko) 2011-07-13
JP5165106B2 (ja) 2013-03-21
EP2351025A1 (en) 2011-08-03
AU2010233858B9 (en) 2013-05-30
EP2351025B1 (en) 2012-11-14
BRPI1003636B1 (pt) 2020-11-24
AR076199A1 (es) 2011-05-26
KR20110005865A (ko) 2011-01-19
MY151346A (en) 2014-05-15
US9076433B2 (en) 2015-07-07
CN102177545B (zh) 2013-03-27
TW201044379A (en) 2010-12-16
JP2012504781A (ja) 2012-02-23
RU2011109670A (ru) 2012-09-27
US9697838B2 (en) 2017-07-04
AU2010233858B2 (en) 2013-05-16
EG26400A (en) 2013-10-09
EP2269189B1 (en) 2011-11-16
TW201044378A (en) 2010-12-16
KR101207120B1 (ko) 2012-12-03
MY153798A (en) 2015-03-31

Similar Documents

Publication Publication Date Title
JP5227459B2 (ja) 合成オーディオ信号を生成する装置及び方法並びにオーディオ信号を符号化する装置及び方法
US8386268B2 (en) Apparatus and method for generating a synthesis audio signal using a patching control signal
JP5329714B2 (ja) 帯域拡張符号化装置、帯域拡張復号化装置及び位相ボコーダ
JP5244971B2 (ja) オーディオ信号合成器及びオーディオ信号符号器
JP2015526769A (ja) 音声信号を再生するための装置および方法、符号化音声信号を生成するための装置および方法、コンピュータプログラム、および符号化音声信号
US10909994B2 (en) Apparatus, method and computer program for generating a representation of a bandwidth-extended signal on the basis of an input signal representation using a combination of a harmonic bandwidth-extension and a non-harmonic bandwidth-extension
AU2013207549B2 (en) Apparatus and method for generating a synthesis audio signal and for encoding an audio signal
AU2014201331B2 (en) Bandwidth extension encoder, bandwidth extension decoder and phase vocoder

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130122

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130129

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130226

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130315

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5227459

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160322

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250