JP4740260B2 - 音声信号の帯域幅を疑似的に拡張するための方法および装置 - Google Patents

音声信号の帯域幅を疑似的に拡張するための方法および装置 Download PDF

Info

Publication number
JP4740260B2
JP4740260B2 JP2007551692A JP2007551692A JP4740260B2 JP 4740260 B2 JP4740260 B2 JP 4740260B2 JP 2007551692 A JP2007551692 A JP 2007551692A JP 2007551692 A JP2007551692 A JP 2007551692A JP 4740260 B2 JP4740260 B2 JP 4740260B2
Authority
JP
Japan
Prior art keywords
signal
bandwidth
envelope
exc
decoder
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007551692A
Other languages
English (en)
Other versions
JP2008513848A (ja
Inventor
ガイザー ベルント
ヤックス ペーター
シャンドル シュテファン
タデイ エルヴ
テレ アウリス
ファリー ペーター
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens AG
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG filed Critical Siemens AG
Publication of JP2008513848A publication Critical patent/JP2008513848A/ja
Application granted granted Critical
Publication of JP4740260B2 publication Critical patent/JP4740260B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Machine Translation (AREA)

Description

本発明は、音声信号の帯域幅を疑似的に拡張するための方法および装置に関する。
音声信号は、たとえば発話者に依存して80〜160Hzの間にある音声基本周波数から10kHzの周波数にまで達する幅広い周波数領域にわたる。しかし、たとえば電話等である特定の伝送媒体を介して行われる音声通信では、帯域幅効率の理由から、限定された一部しか伝送されず、保証されるセンテンス理解性は約98%である。
電話システムに対して規定された300Hz〜3.4kHzの最小帯域幅に相応して、音声信号を基本的に3つの周波数領域に下位分割することができる。これらの周波数領域はそれぞれ、固有の音声特性と主観的な感覚とを特徴づける。約300Hzを下回る比較的低い周波数は基本的に、たとえば母音のような有声の音声部分で現れる。この周波数領域は、この場合はトーン成分を含む。すなわち、とりわけ音声基本周波数を有し、音域に依存して場合によっては幾つかの高調波も含む。
音声信号の音量および動的特性の主観的な感覚では、このような低域周波数が重要である。それに対して、音声基本周波数は人間の聴者によって、仮想的なピッチ感覚の音響心理学的特性に起因して、低域周波数が欠落した場合でも、比較的高い周波数領域に含まれる高調波構造から知覚することができる。したがって、発話行動時には基本的に音声信号中に、約300Hz〜約3.4kHzの領域に中間的な周波数が存在する。複数のフォーマットによる前記周波数の時変のスペクトルカラーリングと、時間的なスペクトルの細密構造とが、その時点で発声された音ないしは音素を特徴づける。このようにして中間的な周波数は、音声理解性に関連する情報の大部分を搬送する。
それに対して無声音では、たとえば「s」または「f」等の鋭い音で特に強く現れるように、約3.4kHzを上回る高い周波数成分が生じる。「k」または「t」等のいわゆる破裂音も、強い高周波成分を含む幅広いスペクトルを有する。したがって、このような上方の周波数領域にある信号は、どちらかというとノイズ状でありかつ調性を有する。この領域にも存在するフォーマットの構造は時間的に比較的不変であるが、発話者が異なるごとに異なる。高い周波数成分は、音声信号の鮮明さ、有無および自然さにおいて重要である。というのも、このような高い周波数成分が存在しないと、音声は鈍く聞こえるからである。さらに、このような高い周波数成分によって、摩擦音および子音をより良好に区別できるようになるので、このような高い周波数成分によって音声の理解性の上昇も保証される。
帯域幅が制限された伝送チャネルを有する音声通信システムを介して音声信号が伝送される場合、基本的には、伝送すべき音声信号を可能な限り高品質で送信側から受信側へ伝送できるようにすることが望ましく、常に目標とされる。しかしこの音声品質は、多数の要素を有する主観的なパラメータであり、それらのうちで音声信号の理解性が、このような音声通信システムにおいて最も重要なパラメータである。
最新のデジタル伝送システムでは、すでに比較的高い音声理解性を実現できるようになっている。ここでは、電話帯域幅を(3.4kHzを上回る)高い周波数に拡張することによっても、(300Hzを下回る)低い周波数に拡張することによっても、音声信号の主観的な判定が改善されることが公知になっている。したがって主観的な品質改善の点では、音声通信用のシステムにおいて、通常の電話帯域幅と比較して拡大された帯域幅を実現する努力が必要とされる。ここでは、伝送を修正し、符号化方式によってより幅広い伝送帯域幅を実現するか、または択一的に、疑似的な帯域幅拡張を行うという可能なアプローチがある。帯域幅のこのような拡張によって、受信側において周波数帯域幅が、50Hz〜7kHzの領域まで拡大される。適切な信号処理アルゴリズムによって、狭帯域の音声信号の短いセグメントからパターン識別の手法によって、広帯域のモデルのパラメータが検出される。このパラメータはその後、音声の欠落した信号成分の評価に使用される。この手法では狭帯域の音声信号から、50Hz〜7kHzの領域にある周波数成分を含む広帯域の補完部を生成し、この広帯域の補完部によって、主観的に知覚される音声品質が改善される。
現在の音声信号および音響信号の符号化アルゴリズムでは、疑似的な帯域幅拡張技術がますます使用されるようになってきている。たとえば、広帯域領域(50Hz〜7kHzの音響的帯域幅)では、AMR‐WB(Adaptive Multirate Wideband)符号化‐復号化アルゴリズム等の音声符号化標準方式が使用される。このAMR‐WB標準方式では、上方の周波数副帯(約6.4〜7kHzの周波数領域)は低周波成分から外挿される。このような符号化‐復号化方式では、帯域幅拡張は一般的に、比較的少数の副次的情報によって行われる。この副次的情報は、たとえばフィルタ係数または増幅率である。フィルタ係数はたとえば、LPC(Linear Prediction Filter)方式によって形成することができる。このような副次的情報は、符号化されたビットストリームで受信側へ伝送される。現在、帯域幅拡張技術を基礎とする他の標準方式として、AMR‐WB+標準方式と、拡張aacPlus音声/音響符号化‐復号化方式が見られる。情報を符号化および復号化するために構成された方式はコーデックと称され、符号化器および復号化器の双方を含む。固定網用に構成されたかまたは移動無線網用に構成されたかに関係なく、すべてのデジタル電話機はこのようなコーデックを含んでおり、このコーデックはアナログ信号をデジタル信号に変換し、デジタル信号をアナログ信号に変換する。このようなコーデックは、ハードウェアでもソフトウェアでも実現することができる。
現在、帯域幅拡張技術を使用する音声/音響信号符号化アルゴリズムを実現する際には、たとえば6.4〜7kHzの周波数領域にある拡張帯域の成分を既述のLPC符号化技術によって符号化および復号化する。ここでは、符号化器において入力信号の拡張帯域のLPC分析が行われ、残留信号のサブフレームのLPC係数と増幅率とが符号化される。復号化器では、拡張帯域の残留信号が生成され、伝送された増幅率とLPC合成フィルタとが出力信号を生成するのに使用される。上記のプロセスは、広帯域の入力信号に直接適用することができ、また、限界領域ないしは臨界領域でダウンサンプリングされた拡張帯域の副帯信号でも適用できる。
拡張aacPlus符号化標準方式では、SBR(Spectral Band Replication)技術が使用される。この技術では、広帯域の音響信号は64チャネルQMFフィルタバンクによって周波数副帯に分割される。高周波のフィルタバンクチャネルには、綿密に考えられ技術的に高度に開発されたパラメトリック符号化が、信号成分の副帯に適用される。そのためには、ビットストリーム内容を検査するために、多数の検出器および評価回路が必要とされ、使用される。公知の標準方式および符号化‐復号化方式では、すでに音声信号のとりわけ音声品質の改善を実現できるにもかかわらず、音声品質のさらなる改善のために努力を払わなければならない。また、上記の標準方式および符号化‐復号化方式は非常に面倒であり、構造が非常に複雑である。
したがって本発明の課題は、音声信号の帯域幅を疑似的に拡張するための方法および装置において、より良好な音声品質とより良好な音声理解性とを実現できる方法および装置を提供することである。さらに、このことを比較的簡単かつ簡便に実現できるようにしなければならない。
前記課題は、請求項1記載の特徴を有する方法と、請求項23記載の特徴を有する装置によって解決される。
音声信号の帯域幅を疑似的に拡張するための本発明の方法では、以下のステップを実施する:
a)広帯域の入力音声信号を供給するステップ
b)帯域幅拡張に必要な該広帯域の入力音声信号の信号成分を、該広帯域の入力音声信号の拡張帯域から検出するステップ
c)該帯域幅拡張のために検出された信号成分の時間的な包絡線を検出するステップ
d)該帯域幅拡張のために検出された信号成分のスペクトル包絡線を検出するステップ
e)時間的な包絡線およびスペクトル包絡線の情報を符号化し、符号化された該情報を帯域幅の拡張を実施するために供給するステップ
f)符号化された該情報を復号化し、帯域幅拡張された出力音声信号を生成するために、時間的な包絡線およびスペクトル包絡線を、符号化された該情報から復号化するステップ
本発明の方法によって、音声信号の伝送時に音声理解性と音声品質とを改善することができる。ここでは、音声信号は音響信号も指す。さらに、本発明による方法は伝送時の妨害に対して非常にロバストでもある。
有利には、帯域幅拡張に必要な信号成分はフィルタリングによって、とりわけバンドパスフィルタリングによって広帯域の入力音声信号から検出される。こうすることにより、必要な信号成分を簡単かつ簡便に選択できるようになる。
ステップc)で行われる時間的な包絡線の検出は有利には、ステップd)で行われるスペクトル包絡線の検出に依存せずに行われる。こうすることにより、これらの包絡線の検出は精確に行われ、相互間の影響が回避される。
有利には、時間的な包絡線およびスペクトル包絡線の符号化をステップe)で行う前に、該時間的な包絡線およびスペクトル包絡線の量子化を行う。有利にはステップd)において、スペクトル包絡線を検出するために、帯域幅拡張のために検出された信号成分のスペクトル副帯の信号出力を検出する。特徴づけのために必要な時間的な包絡線およびスペクトル包絡線を、このようにして非常に精確に検出することができる。
スペクトル副帯の信号出力を検出するために有利なのは、帯域幅拡張のために検出された信号成分の信号セグメントを生成することである。この信号セグメントはとりわけ変換され、とりわけFF(Fast Fourier)変換される。さらに有利には、ステップc)において時間的な包絡線を検出するために、帯域幅拡張のために検出された信号成分の時間的な信号セグメントの信号出力を検出する。このことにより、必要なパラメータの検出を簡便に行うことができる。
有利にはステップf)において、時間的な包絡線およびスペクトル包絡線の再構成された形状に関する符号化された情報が復号化される。
有利には、復号化器において該復号化器に伝送された信号から励振信号が生成される。この伝送された信号の信号出力は、広帯域の入力音声信号の周波数領域に相応する周波数領域において、励振信号の生成を可能にする信号出力である。復号化器には有利には、広帯域の入力音声信号の拡張帯域の帯域領域の周波数を下回る周波数を含む帯域領域を有する変調された狭帯域信号が、励振信号の生成のために伝送される。励振信号は有利には、復号化器へ伝送された信号の基本周波数の高調波を有する。
時間的な包絡線の復号化された情報と励振信号とから、有利には第1の補正係数が求められる。さらに、第1の補正係数と励振信号とから時間的な包絡線の再構成を行い、とりわけ第1の補正係数と励振信号との乗算によって行う。さらに有利には、時間的な包絡線の再構成されたものをフィルタリングし、このフィルタリングでインパルス応答を生成する。このインパルス応答と、時間的な包絡線の再構成とから、スペクトル包絡線の再構成を行う。また、スペクトル包絡線の再構成から、広帯域の入力音声信号の拡張帯域の信号成分を再構成する。こうすることにより、時間的な包絡線およびスペクトル包絡線の再構成を、非常に確実かつ非常に精確に行うことができる。
有利な実施形態では、復号化器に、広帯域の入力信号の拡張帯域の周波数を下回る周波数を含む帯域領域を有する狭帯域の信号が伝送される。
帯域幅拡張された出力音声信号は有利には、復号化器に伝送された狭帯域の信号とスペクトル包絡線の再構成とから、とりわけこれら両信号の加算から検出され、復号化器の出力信号として供給される。このようにして、高い音声理解性と音声品質とを保証する出力信号を生成および供給することができる。
ステップa)〜e)は有利には、有利には送信側に配置された符号化器で行われる。ステップe)で生成された符号化された情報は、有利にはデジタル信号として復号化器へ伝送される。少なくともステップf)は、有利には受信側で行われる。ここでは、復号化器は受信側に配置される。しかし、本発明による方法のすべてのステップa)〜f)を受信側で行うこともできる。この場合、ステップa)〜e)は受信側で、(異なって実施される)評価法に置換される。ステップa)〜e)を別個に、送信側で行うこともできる。
広帯域の入力音声信号は有利には、約50Hz〜7kHzの間の帯域幅を有する。広帯域の入力音声信号の拡張帯域は、有利には約3.4kHz〜約7kHzの周波数領域を有する。さらに狭帯域の信号は、約50Hz〜約3.4kHzの広帯域の入力音声信号の信号領域を有する。
音声信号の帯域幅を疑似的に拡張するための本発明の装置は、広帯域の入力音声信号が印加されるように構成されており、少なくとも以下の構成要素を含む:
a)帯域幅拡張に必要な該広帯域の入力音声信号の信号成分を、該広帯域の入力音声信号の拡張帯域から検出するための手段
b)該帯域幅拡張のために検出された信号成分の時間的な包絡線を検出するための手段
c)該帯域幅拡張のために検出された信号成分のスペクトル包絡線を検出するための手段
d)時間的な包絡線およびスペクトル包絡線の情報を符号化し、符号化された情報を帯域幅の拡張を実施するために供給するための符号化器
e)符号化された情報を復号化し、帯域幅拡張された出力音声信号を生成するために、時間的な包絡線およびスペクトル包絡線を、該符号化された包絡線から復号化するための復号化器
本発明の装置によって、たとえば移動無線端末機器またはISDN機器等の通信機器における伝送時の音声信号の音声品質が改善され、かつ音声理解性も改善される。
a)〜d)の手段は、有利には符号化器として構成される。この符号化器は送信側または受信側に配置することができ、復号化器は受信側に配置される。
本発明の方法の有利な実施形態は、転用可能である限り、本発明の装置の有利な実施形態としても見なすことができる。
以下で本発明の実施例を、概略的な図面に基づいて詳細に説明する。
図面
図1 本発明による装置の符号化器を示す。
図2 本発明による装置の復号化器を示す。
以下で本発明を詳細に説明するにあたり、音声信号という概念は音響信号も指す。図1および図2では、同一要素および同機能の要素に同一の参照記号が付与されている。
図1に、音声信号の帯域幅を疑似的に拡張するための本発明の装置の符号化器1の概略的なブロック回路図が示されている。符号化器1は、ハードウェアで実装することができ、またソフトウェアでアルゴリズムとしても実装することができる。符号化器1はこの実施例では、広帯域の入力音声信号Si wb(k)をバンドパスフィルタリングするために構成されたブロック11を有する。さらに符号化器1は、ブロック11に接続されたブロック12およびブロック13を有する。ブロック12はここでは、帯域幅拡張のために検出された信号成分の時間的な包絡線を検出するために構成されている。この信号成分は、広帯域の入力音声信号の拡張帯域から検出される。これに相応してブロック13は、帯域幅拡張のために検出された信号成分のスペクトル包絡線を検出するために構成されている。この信号成分は、広帯域の入力音声信号の拡張帯域から検出される。
さらに、図1に示された内容から、ブロック12およびブロック13はブロック14に接続されているのが見て取れる。ブロック14は、ブロック12ないしは13によって生成された時間的な包絡線およびスペクトル包絡線を量子化するために構成されている。
図1にはさらに、バンドパスフィルタとして構成されたブロック2が示されている。このブロック2には、広帯域の入力音声信号si wb(k)が印加される。さらに、ブロック2は別のブロック3に接続されている。このブロック3は、別の符号化器として構成されている。
この実施例では、符号化器1およびブロック2および3は第1の電話機内に配置されている。広帯域の入力音声信号は、この実施例では約50Hz〜約7kHzの帯域幅を有する。本発明では、図1に示された内容から見て取れるように、この広帯域の入力音声信号si wb(k)は符号化器1のバンドパスフィルタないしはブロック11に印加される。
このブロック11によって、帯域幅拡張に必要な信号成分が、この実施例では約3.4kHz〜約7kHzの帯域幅を有する拡張帯域から検出される。帯域幅拡張に必要な信号成分は信号seb(k)によって表され、ブロック11の出力信号として両ブロック12および13へ伝送される。
ブロック12において、この信号seb(k)から時間的な包絡線が検出される。
これに相応してブロック13において、信号seb(k)によって表される信号成分のスペクトル包絡線が検出される。
以下で、前記の時間的な包絡線およびスペクトル包絡線の検出を詳細に説明する。まず、帯域幅拡張に必要な信号成分を表す信号seb(k)が分割され、この窓化された信号セグメントとが変換される。
信号seb(k)は、それぞれk‐サンプリング値の長さを有するフレーム内で分割される。後続のすべてのステップおよび部分アルゴリズムは、一貫してフレームに基づいて行われる。有利には、(たとえば10msまたは20msまたは30msの期間を有する)すべての音声フレームが、複数の下位フレーム(たとえば2.5または5msの期間)に下位分割される。
その後、窓化された信号セグメントは変換される。その際、この実施例では変換は、周波数空間でFFT(Fast Fourier Transform)によって行われる。FFT変換された信号セグメントは、ここで以下の数式1)にしたがって求められる:
Figure 0004740260
前記数式1)では、NfはFFT長ないしはフレームサイズを示し、μはフレームインデックスを示し、Mfは窓化された信号セグメントのフレームのオーバーラップを示す。さらに、Wf(K)は窓関数を示す。次に、周波数空間で拡張帯域の周波数領域の副帯で信号出力を計算する。信号強度ないしは信号出力のこのような計算は、以下の数式2)にしたがって行われる。
Figure 0004740260
この数式2)では、λは相応の副帯のインデックスを示し、EBλは、第λ番目の周波数空間窓で非ゼロ係数を有するすべてのFFTインターバル領域iを含む集合を表す。数式2)による副帯の信号出力Pf(μ,λ)は、復号化器へ伝送されるスペクトル包絡線の情報を表す。
時間領域で行われる時間的な包絡線の検出は、スペクトル包絡線の検出と同様に行われ、バンドパスフィルタリングされた広帯域の入力音声信号si wb(k)の窓化された短時間のセグメントに基づく。このようにして、時間的な包絡線の検出時にも信号seb(k)の信号セグメントが考慮される。
窓化された各セグメントごとに、信号出力を以下の数式3)にしたがって計算する。
Figure 0004740260
上記数式3)では、Ntはフレーム長を示し、vはフレームインデックスを示し、Miはここでも信号セグメントのフレームのオーバーラップを示す。ここでは一般的に、時間的な包絡線を抽出するために使用されるフレーム長NtおよびフレームのオーバーラップMtは、スペクトル包絡線の検出のために使用される相応の量NtおよびMtより小さいかないしは非常に小さいことに留意すべきである。
時間的な包絡線のパラメータを信号seb(k)から抽出するための択一的手段に、該信号seb(k)のヒルベルト変換(90°移相フィルタ)を実施する手段がある。フィルタリングされた部分のショートセグメント信号出力と信号seb(k)の本来の部分とを加算することにより、短時間の時間的な包絡線が得られる。これはダウンサンプリングされ、信号出力Pt(v)が求められる。信号セグメントの信号出力Pt(v)は、時間的な包絡線の情報を表す。
数式2)および3)にしたがって抽出された信号出力のパラメータを表す、時間的な包絡線を表す信号spt(v)およびスペクトル包絡線を表す信号spf(μ,λ)は、ブロック14において量子化および符号化される。ブロック14の出力信号はデジタル信号BWEであり、符号化済みの形態で時間的な包絡線の情報とスペクトル包絡線の情報とを含むビットストリームを表す。
このデジタル信号BWEは復号化器へ伝送される。以下で、この復号化器を詳細に説明する。ここで留意されたいのは、数式2)および3)にしたがって抽出された信号強度のパラメータ間のリダンダンシーで、たとえばベクトル量子化によって行われるような共通ないしは結合的な符号化を行えることである。
また、図1に示されているように、広帯域の入力音声信号si wb(k)はブロック2にも伝送される。バンドパスフィルタとして構成されたこのブロック2によって、広帯域の入力音声信号si wb(k)の狭帯域の領域の信号成分がフィルタリングされる。この狭帯域の領域は、この実施例では50Hz〜3.4kHzの間にある。ブロック2の出力信号は狭帯域信号snb(k)であり、この実施例では別の符号化器として構成されたブロック3へ伝送される。ブロック3において狭帯域信号snb(k)は符号化され、デジタル信号BWNとしてビットストリームとして、以下で説明する復号化器へ伝送される。
図2に、音声信号の帯域幅を疑似的に拡張するための本発明の装置の前記のような復号化器5の概略的なブロック回路図が示されている。図2に示されているように、デジタル信号BWNはまず別の復号化器4へ伝送され、該復号化器4は、該デジタル信号BWNに含まれる情報を復号化し、該情報から狭帯域信号snb(k)を生成し戻す。さらに復号化器4は、副次的情報を含む別の信号ssi(k)も生成する。この副次的情報は、たとえば増幅率またはフィルタリング係数である。この信号ssi(k)は、復号化器5のブロック51へ伝送される。ブロック51はこの実施例では、拡張帯域の周波数領域で励振信号を生成するために構成されており、このために信号ssi(k)の情報が考慮される。
さらに、この実施例では受信側内に配置された復号化器5は、符号化器1と復号化器2との間で伝送区間を介して伝送された信号BWEを復号化するために構成されたブロック52を有する。ここで、デジタル信号BWNもこの伝送区間を介して符号化器1と復号化器5との間で伝送されることに留意されたい。図2に示されているように、ブロック51もブロック52も復号化領域53〜55に接続されている。復号化器5の動作原理、ないしは本発明の方法の復号化器5で実施されるステップを、以下で詳細に説明する。
すでに上記で述べたように、符号化されたデジタル信号BWEに含まれる情報はブロック52で復号化され、数式2)および3)にしたがって計算され時間的な包絡線およびスペクトル包絡線を表す信号出力が再構成される。図2に示されているように、ブロック51で生成された励振信号sexc(k)は、時間的な包絡線およびスペクトル包絡線を再構成するための入力信号である。
この励振信号sexc(k)は、基本的に任意の信号とすることができる。この励振信号sexc(k)の基本的な前提条件として、該励振信号が広帯域の入力スペクトル信号si wb(k)の拡張帯域の周波数領域において十分な信号出力を有するということが成立するようにしなければならない。たとえば励振信号sexc(k)として、狭帯域の信号snb(k)の変調形態を使用するか、または任意のノイズを使用することができる。すでに述べたようにこの励振信号sexc(k)は、広帯域の出力音声信号s° wb(k)の拡張帯域の信号成分においてスペクトル包絡線および時間的な包絡線の細密構造化に重要である。それゆえこの励振信号sexc(k)を、該励振信号sexc(k)が狭帯域の信号snb(k)の基本周波数の高調波を有するように形成するのが有利である。
階層的な音声符号化の場合、こうするために別の復号化器4のパラメータを使用することができる。たとえば、Δkが基本周波数の比率偏差または実際値偏差であり、bがCELP狭帯域復号化器における適応的符号ブックのLTB増幅率である場合、たとえば、その時点の基本周波数の整数倍である高調波周波数による励振を、任意の信号neb(k)から、バンドパスフィルタのLTP合成フィルタリング(拡張帯域の周波数領域)によって行うことができる。
ここでは、励振信号は以下の数式4)にしたがって得られる。
Figure 0004740260
ここでは、LTP増幅率を関数f(b)によって低減または制限することにより、拡張帯域の生成される信号成分の過剰有声化(Ueberstimmhaftigkeit)を阻止することができる。合成的な広帯域励振を、狭帯域のコーデックのパラメータによって実施できるようにするために、他に実施できる択一的手段は複数存在することに留意されたい。
励振信号を生成できるようにするための別の手段に、狭帯域の信号snb(k)を、固定的な周波数を有する正弦関数によって変調するか、または上記ですでに言及したように、任意の信号neb(k)を直接使用する手段がある。励振信号sexc(k)を生成するのに使用される方法は、デジタル信号BWEの生成、該デジタル信号BWEのフォーマットおよび該デジタル信号BWEの復号化に全く依存しないことを強調しておく。したがって、このことに関しては独立した調整を行うことができる。
以下で、時間的な包絡線の再構成を詳細に説明する。デジタル信号BWEは、すでに述べたようにブロック52で復号化され、数式2)および3)にしたがって計算され時間的な包絡線およびスペクトル包絡線を表す信号出力のパラメータが、信号spt(v)およびspf(μ,λ)に相応して供給される。図2に示されているように、この実施例ではまず、時間的な包絡線の再構成が行われる。これは復号化領域53において行われる。こうするためには、励振信号sexc(k)および信号spt(v)がこの復号化領域53へ伝送される。図2に示されているように、励振信号sexc(k)はブロック531にも乗算器532にも伝送される。ブロック531には信号spt(v)も伝送される。ブロック531に伝送された信号から、スカラ補正係数g1(k)が形成される。このスカラ補正係数g1(k)は、ブロック531から乗算器532へ伝送される。
その後、乗算器532において励振信号sexc(k)とスカラ補正係数g1(k)とが乗算されて出力信号s´ exc(k)が形成される。この出力信号s´ exc(k)は、時間的な包絡線の再構成を特徴づける。この出力信号s´ exc(k)はほぼ正しい時間的な包絡線を有するが、正しい周波数の点では未だ不正確ないしは不精確であるため、次のステップでスペクトル包絡線の再構成を行って、この不精確な周波数を必要な周波数に適合できるようにしなければならない。
図2に示されているように、出力信号s´ exc(k)は復号化器5の第2の復号化領域54へ伝送され、ここへは信号spf(μ,λ)も伝送される。第2の復号化領域54はブロック541およびブロック542を有し、ブロック541は出力信号s´ exc(k)をフィルタリングするために構成されている。出力信号s´ exc(k)および信号spf(μ,λ)からインパルス応答h(k)が生成され、ブロック541からブロック542へ伝送される。ブロック542では、出力信号s´ exc(k)およびインパルス応答h(k)からスペクトル包絡線の再構成が行われる。再構成されたこのスペクトル包絡線は、ブロック542の出力信号s exc(k)によって表される。
図2に示された実施例では、次に第2の復号化領域54の出力信号s exc(k)の生成に基づいて、時間的な包絡線の再構成を復号化器5の第3の復号化領域55で再度行う。時間的な包絡線の再構成は、第1の復号化領域53で行われるのと同様に行われる。この再構成では第3の復号化領域55において、出力信号S exc(k)および信号spt(v)からブロック551によって第2のスカラ補正係数g2(k)が生成され、乗算器552へ伝送される。
復号化器5の第3の復号化領域55の出力信号として、帯域幅拡張のために必要な信号成分を表す信号seb(k)が供給される。この信号seb(k)は加算器56へ伝送され、該加算器56へは狭帯域の信号snb(k)も伝送される。狭帯域の信号snb(k)と信号seb(k)との加算により、帯域幅拡張された出力信号s° wb(k)が形成され、復号化器5の出力信号として供給される。
図2に示された実施形態は単なる例であり、本発明では、第1の復号化領域53で行われるような時間的な包絡線の1回の再構成と、第2の復号化領域54で行われるようなスペクトル包絡線の1回の再構成だけですでに十分であることに留意されたい。また、第2の復号化領域54で行われるスペクトル包絡線の再構成を、第1の復号化領域53で行われる時間的な包絡線の再構成の前に行えることにも留意されたい。換言するとこのような実施形態では、第2の復号化領域54は第1の復号化領域53の前に配置される。しかし、時間的な包絡線の再構成とスペクトル包絡線の再構成の交互の実施が再度続行され、たとえば図2に示された実施形態では、第3の復号化領域55の次に別の付加的な復号化領域が配置され、この復号化領域でスペクトル包絡線の再構成が再度行われるように構成することもできる。
すでに上記で述べたように、本発明はこの実施例において、有利には約50Hz〜7kHzの周波数領域を有する広帯域の入力音声信号に適用される。また、本発明はこの実施例において、音声信号の帯域幅を疑似的に拡張するためにも構成されている。ここでは拡張帯域は、約3.4kHz〜約7kHzの周波数領域によって予め定められる。しかし、低周波の周波数領域にある拡張帯域に本発明が適用されるように構成することもできる。ここでは、たとえば拡張帯域は、約50Hz以下の周波数から約3.4kHzの周波数領域までの周波数領域を有する。音声信号の帯域幅を疑似的に拡張する本発明の方法を使用して、拡張帯域の周波数領域が少なくとも部分的に約7kHzの周波数を上回り、たとえば最大8kHzの周波数を上回り、とりわけ10kHz以上の周波数を上回るようにもできることを明示的に強調したい。
すでに述べたように、時間的な包絡線の再構成は図2によれば第1の復号化領域53において、第1のスカラ補正係数g1(k)と励振信号sexc(k)との乗算によって行われる。
ここでは、時間領域での乗算は周波数領域でのたたみ込み演算に相応することに留意されたい。したがって、以下の数式5)が成り立つ。
Figure 0004740260
スペクトル包絡線が基本的に第1の復号化領域53によって変化しない限りは、第1のスカラ補正係数ないしは増幅率g1(k)は厳密なローパス周波数特性を有するはずである。
この増幅率ないしは第1の補正係数g1(k)を計算するためには、すでに上記で、符号化器1においてブロック12によって信号seb(k)から時間的な包絡線の抽出の分割および分析、ないしは信号spt(v)の生成の分割および分析で行ったように、励振信号sexc(k)を分割および分析する。
数式3)による計算のように復号化された信号出力と信号強度Pt exc(v)の分析結果との比によって、第v番目の信号セグメントの所望の増幅率γ(v)が得られる。第v番目の信号セグメントのこの増幅率は、次の数式6)にしたがって算出される。
Figure 0004740260
この増幅率γ(v)から、増幅率ないしは第1の補正係数g1(k)が補間およびローパスフィルタリングによって計算される。このローパスフィルタリングは、上記増幅率ないしは第1の補正係数g1(k)がスペクトル包絡線に及ぼす影響を制限するのに決定的に重要である。
拡張帯域の必要な信号成分のスペクトル包絡線の再構成は、時間的な包絡線の再構成を特徴づける出力信号s´ exc(k)のフィルタリングによって求められる。フィルタ演算は、ここでは時間領域または周波数空間で実現することができる。インパルス応答h(k)の大きな時間散乱ないしは時間拡がりを回避できるようにするためには、相応の周波数特性H(z)を平滑化することができる。所望の周波数特性を決定できるようにするためには、第1の復号化領域53の出力信号s´ exc(k)を分析することにより、Pf exc (μ,λ)の信号出力を見つけられるようにする。拡張帯域の周波数領域の相応の副帯の所望の増幅率Φ(μ,λ)は、以下の数式7)にしたがって計算される。
Figure 0004740260
スペクトル包絡線の成形フィルタの周波数特性H(μ,i)は、増幅率Φ(μ,λ)の補間と、周波数を考慮して行われる平滑化とによって計算することができる。スペクトル包絡線の成形フィルタを時間領域で使用する場合、たとえば線形位相FIRフィルタによって使用する場合、フィルタ係数は周波数特性H(μ,i)の逆FF変換と後続の窓化とによって計算することができる。
上記の実施形態によって説明および図示したように、時間的な包絡線の再構成はスペクトル包絡線の再構成に影響し、その逆にも影響する。したがって有利には、この実施例で説明しかつ図2に示したように、時間的な包絡線の再構成とスペクトル包絡線の再構成とを交互に行うのを、繰り返しプロセスで行うのが有利である。このことにより、復号化器で再構成された拡張帯域の信号成分の時間的な包絡線およびスペクトル包絡線の一致が格段に改善され、符号化器で生成された相応の時間的な包絡線およびスペクトル包絡線を実現することができる。
図2にしたがって説明した実施例では、1.5倍の繰り返し(時間的な包絡線の再構成、スペクトル包絡線の再構成および時間的な包絡線の再度の再構成)が行われる。本発明によって実現されるような帯域幅拡張により、高調波を有する励振信号を正しい周波数で、たとえばその時点の音の基本周波数の整数倍で生成するのが容易になる。ここで留意すべきなのは、本発明は、広帯域の入力信号のダウンサンプリングされた副帯信号成分にも適用できることである。このことは、計算の手間が小さいことが必要である場合に有利である。
有利には、符号化器1およびブロック2および3は送信側に配置される。論理的には、ブロック2および3ならびに符号化器1で実施されるステップも送信側で実施される。ブロック4および復号化器5は、有利には受信側に配置される。したがって、復号化器5およびブロック4で実施されるステップが受信側で処理されることも理解できる。ここで、符号化器1で実施されるステップは復号化器5において実施され、ひいてはもっぱら受信側で実施されるように本発明を実現できることも留意されたい。その際には、数式2)および3)にしたがって計算された信号出力が復号化器5において評価されるように構成することができる。とりわけ、ブロック52は信号出力のこのパラメータを評価するために構成される。このような構成により、デジタル信号BWEで伝送される副次的情報の発生する可能性のある伝送誤りを抑圧することができる。たとえばデータ損失等によって失われた包絡線のパラメータを一時的に評価することにより、信号帯域幅の面倒な切り換えを阻止することができる。
音声信号の帯域幅を疑似的に拡張する従来の方法と異なり、本発明では、すでに使用された増幅率およびフィルタ係数を副次的情報として伝送することはなく、所望の時間的な包絡線およびスペクトル包絡線を副次的情報として復号化器へ伝送するだけである。このようにして初めて、増幅率およびフィルタ係数は、受信側に配置された復号化器で計算される。このような構成により、受信側の帯域幅の疑似的な拡張を簡便に分析し、場合によっては補正できるようになる。さらに、本発明による方法および本発明による装置は、励振信号の妨害に対して非常にロバストであり、たとえば、受信された狭帯域の信号のこのような妨害が伝送誤りによって引き起こされるのに対して非常にロバストである。
時間的な包絡線およびスペクトル包絡線の分析、伝送および再構成を別個に行うことにより、時間領域でも周波数領域でも、時間的および周波数空間の非常に良好な分解能ないしは細分化が実現できるようになる。それゆえ、静的な音および音質の再現性も、一時的ないしは短時間の信号の再現性も非常に良好になる。音声信号に関してはとりわけ、このような格段に改善された時間分解能によって、破裂音(Stoppkonsonant, Plosiv)の再現が良好になる。
従来の帯域幅拡張と比較して、本発明によって、LPC合成フィルタの代わりに線形位相FIRフィルタによる周波数成形を行えるようになる。このことにより、典型的なアーティファクト("filter ringing")が低減できるようになる。さらに、本発明によって非常にフレキシブルかつモジュール的な構成が可能になり、さらに、受信側ないしは復号化器5内の個々のブロックを簡単に交換または調整できるようになる。有利には、このような変更または調整を行うために、送信側ないしは符号化器1、または、符号化された情報を復号化器5ないしは受信側へ伝送するための伝送信号のフォーマットを変更しなくてもよい。さらに本発明による方法によって、異なる復号化器を動作させることができる。このことにより、広帯域の入力信号の再形成を、使用可能な計算能力に依存して異なる精度で行うことができる。
また、スペクトル包絡線および時間的な包絡線を表す受信されたパラメータが、帯域幅の拡張に使用できるだけでなく、さらに、たとえば再フィルタリング等の後続の信号処理ブロック、または変換符号化器等の付加的な符号化段をサポートするのにも使用できることにも留意すべきである。
このようにして得られ、たとえば帯域幅拡張のためのアルゴリズムへ供給される狭帯域の音声信号snb(k)は、たとえばサンプリング周波数が係数2だけ低減されるのにしたがい、8kHzのサンプリングレートで得ることができる。
本発明と、本発明の基礎となる帯域幅拡張原理とによって、G.729A+−標準方式の情報の広帯域の励振を発生することができる。デジタル信号BWEで伝送される副次的情報のデータレートは、約2kbit/sとすることができる。さらに本発明では、必要とされる計算システムの複雑性が比較的低くなり、ないしは複雑な計算上の手間が比較的小さくなり、3WMOPSを下回る。さらに、本発明による方法および本発明による装置は、G.729A+−標準方式のベースバンド妨害に対して非常にロバストである。本発明は有利には、Voice over IPの用途にも使用することができる。さらに、本発明の方法および本発明の装置はTDAC包絡線に対して両立性を有する。とりわけ本発明は、構成が非常にモジュール的かつフレキシブルであり、かつコンセプト化がモジュール的およびフレキシブルである。
本発明による装置の符号化器を示す。 本発明による装置の復号化器を示す。

Claims (19)

  1. 音声信号の帯域幅を擬似的に拡張する方法において、
    a)広帯域の入力音声信号(si wb(k))を供給するステップと、
    b)帯域幅拡張に必要な該広帯域の入力音声信号(si wb(k))の信号成分(seb(k))を、該広帯域の入力音声信号(si wb(k))の拡張帯域から検出するステップと、
    c)該帯域幅拡張のために検出された該信号成分(seb(k))の時間的な包絡線を検出するステップと、
    d)該帯域幅拡張のために検出された該信号成分(seb(k))のスペクトル包絡線を検出するステップと、
    e)該時間的な包絡線およびスペクトル包絡線の情報を符号化し、符号化された該情報を帯域幅の拡張を実施するために供給するステップと、
    f)復号化器(5)において、帯域幅拡張された出力音声信号(s° wb(k))を生成するために、符号化された該情報を復号化して前記時間的な包絡線およびスペクトル包絡線を再構成するステップ
    とを有し、
    ステップc)において行われる前記時間的な包絡線の検出と、ステップd)において行われる前記スペクトル包絡線の検出とを、それぞれ相互に依存せずに行い、
    該復号化器(5)に伝送された信号(s si (k))から励振信号(s exc (k))を生成し、
    該伝送された信号(s si (k))は、前記広帯域の入力音声信号(s i wb (k))の拡張帯域の周波数領域に相応する周波数領域において、励振信号(s exc (k))の生成を可能にする信号強度を有し、
    前記時間的な包絡線の復号化された情報および励振信号(s exc (k))から、第1の補正係数(g 1 (k))を検出し、
    前記第1の補正係数(g 1 (k))および励振信号(s exc (k))から、前記時間的な包絡線の再構成を、該第1の補正係数(g 1 (k))と励振信号(s exc (k))との乗算によって行うことを特徴とする方法。
  2. 帯域幅拡張のために必要な前記信号成分(seb(k))を前記広帯域の入力音声信号(si wb(k))から、バンドパスフィルタリングによって検出する、請求項1記載の方法。
  3. ステップe)で前記時間的な包絡線およびスペクトル包絡線の符号化を行う前に、該時間的な包絡線およびスペクトル包絡線の量子化を行う、請求項1または2記載の方法。
  4. ステップd)において前記スペクトル包絡線を検出するために、帯域幅拡張のために検出された前記信号成分(seb(k))のスペクトル副帯の信号出力(Pf(μ,λ))を検出する、請求項1から3までのいずれか1項記載の方法。
  5. 前記スペクトル副帯の信号出力(Pf(μ,λ))を検出するために、帯域幅拡張のために検出された前記信号成分(seb(k))の信号セグメントを形成し、
    該信号セグメントをFF変換する、請求項4記載の方法。
  6. ステップc)において前記時間的な包絡線を検出するために、帯域幅拡張のために検出された前記信号成分(seb(k))の時間的な信号セグメントの信号強度(Pt(v))を検出する、請求項1から5までのいずれか1項記載の方法。
  7. 前記復号化器(5)に、前記広帯域の入力音声信号(s i wb (k))の拡張帯域の帯域領域を下回る帯域領域を有する変調された狭帯域の信号を、前記励振信号(s exc (k))の生成のために伝送する、請求項1から6までのいずれか1項記載の方法。
  8. 前記励振信号(s exc (k))は、前記復号化器(5)に伝送された信号(s si (k))の基本周波数の高調波を含む、請求項1から7までのいずれか1項記載の方法。
  9. 前記時間的な包絡線の再構成されたものをフィルタリングし、フィルタリング時にインパルス応答(h(k))を生成する、請求項8記載の方法。
  10. 前記インパルス応答(h(k))および時間的な包絡線の再構成から、前記スペクトル包絡線の再構成を行う、請求項9記載の方法。
  11. 前記スペクトル包絡線の再構成から、前記広帯域の入力音声信号(s i wb (k))の拡張帯域の信号成分(s eb (k))を再構成する、請求項10記載の方法。
  12. 復号化器(5)へ、前記広帯域の入力信号(s i wb (k))の拡張帯域を下回る帯域領域を含む狭帯域の信号(s nb (k))を伝送する、請求項1から11までのいずれか1項記載の方法。
  13. 前記帯域幅拡張された出力音声信号(s ° wb (k))を、前記復号化器(5)へ伝送された狭帯域の信号(s nb (k))と前記スペクトル包絡線の再構成とから検出し、該復号化器(5)の出力信号として供給する、請求項11および12記載の方法。
  14. 前記ステップa)〜e)を符号化器(1)で行い、
    ステップd)で生成された符号化された情報を、デジタル信号(BWE)として復号化のために伝送する、請求項1から13までのいずれか1項記載の方法。
  15. 前記広帯域の入力音声信号(s i wb (k))は、約50Hz〜約7kHzの間の帯域幅を有する、請求項1から14までのいずれか1項記載の方法。
  16. 前記広帯域の入力音声信号(s i wb (k))の拡張帯域は、約3.4kHz〜約7kHzの周波数領域を有する、請求項1から15までのいずれか1項記載の方法。
  17. 前記狭帯域の信号(s nb (k))は、前記広帯域の入力音声信号(s i wb (k))の約50Hz〜約3.4kHzの信号領域を有する、請求項12記載の方法。
  18. 音声信号の帯域幅を擬似的に拡張するための装置であって、
    該装置に、広帯域の入力音声信号(si wb(k))が印加されるように構成された形式のものにおいて、
    a)帯域幅拡張に必要な該広帯域の入力音声信号(si wb(k))の信号成分(seb(k))を、該広帯域の入力音声信号(si wb(k))の拡張帯域から検出するための手段と、
    b)帯域幅拡張のために検出された該信号成分(seb(k))の時間的な包絡線を検出するための手段と、
    c)帯域幅拡張のために検出された該信号成分(seb(k))のスペクトル包絡線を検出するための手段と、
    d)時間的な包絡線およびスペクトル包絡線を符号化し、符号化された情報を帯域幅の拡張を実施するために供給するための符号化器(1)と、
    e)帯域幅拡張された出力音声信号(s° wb(k))を生成するために、符号化された該情報復号化して前記時間的な包絡線およびスペクトル包絡線を再構成するための復号化器(5)
    とを有し、
    b)の手段による時間的な包絡線の検出と、c)の手段によるスペクトル包絡線の検出とが、それぞれ相互に依存せずに行われ
    前記復号化器(5)は、
    該復号化器(5)に伝送された信号(s si (k))から励振信号(s exc (k))を生成するための手段(51)と、
    前記時間的な包絡線の復号化された情報および励振信号(s exc (k))から、第1の補正係数(g 1 (k))を検出するための手段(531)と、
    前記第1の補正係数(g 1 (k))および励振信号(s exc (k))から、前記時間的な包絡線の再構成を、該第1の補正係数(g 1 (k))と励振信号(s exc (k))との乗算によって行うための手段(532)
    とを有し、
    前記伝送された信号(s si (k))は、前記広帯域の入力音声信号(s i wb (k))の拡張帯域の周波数領域に相応する周波数領域において、励振信号(s exc (k))の生成を可能にする信号強度を有することを特徴とする装置。
  19. a)〜d)の手段は符号化器(1)として構成されている、請求項18記載の装置。
JP2007551692A 2005-07-13 2006-06-30 音声信号の帯域幅を疑似的に拡張するための方法および装置 Expired - Fee Related JP4740260B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DE102005032724.9 2005-07-13
DE102005032724A DE102005032724B4 (de) 2005-07-13 2005-07-13 Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen
PCT/EP2006/063742 WO2007073949A1 (de) 2005-07-13 2006-06-30 Verfahren und vorrichtung zur künstlichen erweiterung der bandbreite von sprachsignalen

Publications (2)

Publication Number Publication Date
JP2008513848A JP2008513848A (ja) 2008-05-01
JP4740260B2 true JP4740260B2 (ja) 2011-08-03

Family

ID=36994160

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007551692A Expired - Fee Related JP4740260B2 (ja) 2005-07-13 2006-06-30 音声信号の帯域幅を疑似的に拡張するための方法および装置

Country Status (12)

Country Link
US (1) US8265940B2 (ja)
EP (1) EP1825461B1 (ja)
JP (1) JP4740260B2 (ja)
KR (1) KR100915733B1 (ja)
CN (2) CN101676993B (ja)
AT (1) ATE407424T1 (ja)
CA (1) CA2580622C (ja)
DE (2) DE102005032724B4 (ja)
DK (1) DK1825461T3 (ja)
ES (1) ES2309969T3 (ja)
PL (1) PL1825461T3 (ja)
WO (1) WO2007073949A1 (ja)

Families Citing this family (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5547081B2 (ja) * 2007-11-02 2014-07-09 華為技術有限公司 音声復号化方法及び装置
AU2008339211B2 (en) * 2007-12-18 2011-06-23 Lg Electronics Inc. A method and an apparatus for processing an audio signal
EP2077550B8 (en) * 2008-01-04 2012-03-14 Dolby International AB Audio encoder and decoder
KR101261677B1 (ko) 2008-07-14 2013-05-06 광운대학교 산학협력단 음성/음악 통합 신호의 부호화/복호화 장치
WO2010028301A1 (en) * 2008-09-06 2010-03-11 GH Innovation, Inc. Spectrum harmonic/noise sharpness control
US8407046B2 (en) * 2008-09-06 2013-03-26 Huawei Technologies Co., Ltd. Noise-feedback for spectral envelope quantization
US8532998B2 (en) 2008-09-06 2013-09-10 Huawei Technologies Co., Ltd. Selective bandwidth extension for encoding/decoding audio/speech signal
US8532983B2 (en) * 2008-09-06 2013-09-10 Huawei Technologies Co., Ltd. Adaptive frequency prediction for encoding or decoding an audio signal
WO2010031003A1 (en) * 2008-09-15 2010-03-18 Huawei Technologies Co., Ltd. Adding second enhancement layer to celp based core layer
US8577673B2 (en) * 2008-09-15 2013-11-05 Huawei Technologies Co., Ltd. CELP post-processing for music signals
CN101751926B (zh) 2008-12-10 2012-07-04 华为技术有限公司 信号编码、解码方法及装置、编解码***
US9947340B2 (en) * 2008-12-10 2018-04-17 Skype Regeneration of wideband speech
WO2010070770A1 (ja) * 2008-12-19 2010-06-24 富士通株式会社 音声帯域拡張装置及び音声帯域拡張方法
JP4932917B2 (ja) * 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
JP4921611B2 (ja) * 2009-04-03 2012-04-25 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
US8781844B2 (en) * 2009-09-25 2014-07-15 Nokia Corporation Audio coding
KR101613684B1 (ko) * 2009-12-09 2016-04-19 삼성전자주식회사 음향 신호 보강 처리 장치 및 방법
JP5652658B2 (ja) * 2010-04-13 2015-01-14 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
EP2581905B1 (en) * 2010-06-09 2016-01-06 Panasonic Intellectual Property Corporation of America Bandwidth extension method, bandwidth extension apparatus, program, integrated circuit, and audio decoding apparatus
US20130108073A1 (en) * 2010-07-09 2013-05-02 Bang & Olufsen A/S Method and apparatus for providing audio from one or more speakers
US8560330B2 (en) * 2010-07-19 2013-10-15 Futurewei Technologies, Inc. Energy envelope perceptual correction for high band coding
US8924200B2 (en) * 2010-10-15 2014-12-30 Motorola Mobility Llc Audio signal bandwidth extension in CELP-based speech coder
US8868432B2 (en) * 2010-10-15 2014-10-21 Motorola Mobility Llc Audio signal bandwidth extension in CELP-based speech coder
KR20120046627A (ko) * 2010-11-02 2012-05-10 삼성전자주식회사 화자 적응 방법 및 장치
CN102610231B (zh) * 2011-01-24 2013-10-09 华为技术有限公司 一种带宽扩展方法及装置
EP2737479B1 (en) * 2011-07-29 2017-01-18 Dts Llc Adaptive voice intelligibility enhancement
JP5997592B2 (ja) * 2012-04-27 2016-09-28 株式会社Nttドコモ 音声復号装置
JP6200034B2 (ja) * 2012-04-27 2017-09-20 株式会社Nttドコモ 音声復号装置
US9258428B2 (en) 2012-12-18 2016-02-09 Cisco Technology, Inc. Audio bandwidth extension for conferencing
MY172752A (en) * 2013-01-29 2019-12-11 Fraunhofer Ges Forschung Decoder for generating a frequency enhanced audio signal, method of decoding encoder for generating an encoded signal and method of encoding using compact selection side information
CA2961336C (en) * 2013-01-29 2021-09-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoders, audio decoders, systems, methods and computer programs using an increased temporal resolution in temporal proximity of onsets or offsets of fricatives or affricates
EP2784775B1 (en) * 2013-03-27 2016-09-14 Binauric SE Speech signal encoding/decoding method and apparatus
CN104217727B (zh) * 2013-05-31 2017-07-21 华为技术有限公司 信号解码方法及设备
US9666202B2 (en) 2013-09-10 2017-05-30 Huawei Technologies Co., Ltd. Adaptive bandwidth extension and apparatus for the same
US10163447B2 (en) * 2013-12-16 2018-12-25 Qualcomm Incorporated High-band signal modeling
EP3199956B1 (en) * 2016-01-28 2020-09-09 General Electric Technology GmbH Apparatus for determination of the frequency of an electrical signal and associated method

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3946821B2 (ja) * 1996-12-13 2007-07-18 東北リコー株式会社 排版装置
DE19706516C1 (de) * 1997-02-19 1998-01-15 Fraunhofer Ges Forschung Verfahren und Vorricntungen zum Codieren von diskreten Signalen bzw. zum Decodieren von codierten diskreten Signalen
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US5890125A (en) * 1997-07-16 1999-03-30 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method
US6978236B1 (en) * 1999-10-01 2005-12-20 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
CA2290037A1 (en) * 1999-11-18 2001-05-18 Voiceage Corporation Gain-smoothing amplifier device and method in codecs for wideband speech and audio signals
DE10041512B4 (de) * 2000-08-24 2005-05-04 Infineon Technologies Ag Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen
US20020031129A1 (en) * 2000-09-13 2002-03-14 Dawn Finn Method of managing voice buffers in dynamic bandwidth circuit emulation services
DE10102173A1 (de) * 2001-01-18 2002-07-25 Siemens Ag Verfahren und Anordnung zum Umsetzen von parametrisch codier-ten Sprachsignalen verschiedener Bandbreite in Sprachsignale
JP2003044098A (ja) * 2001-07-26 2003-02-14 Nec Corp 音声帯域拡張装置及び音声帯域拡張方法
US6895375B2 (en) * 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech
US20030187663A1 (en) 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
DE50205504D1 (de) * 2002-09-12 2006-03-30 Siemens Ag Kommunikationsendgerät mit Bandbreitenerweiterung und Echokompensation
DE10252070B4 (de) * 2002-11-08 2010-07-15 Palm, Inc. (n.d.Ges. d. Staates Delaware), Sunnyvale Kommunikationsendgerät mit parametrierter Bandbreitenerweiterung und Verfahren zur Bandbreitenerweiterung dafür
US20040138876A1 (en) * 2003-01-10 2004-07-15 Nokia Corporation Method and apparatus for artificial bandwidth expansion in speech processing
US20050004793A1 (en) * 2003-07-03 2005-01-06 Pasi Ojala Signal adaptation for higher band coding in a codec utilizing band split coding
KR100956877B1 (ko) * 2005-04-01 2010-05-11 콸콤 인코포레이티드 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 방법 및장치

Also Published As

Publication number Publication date
CN101676993B (zh) 2012-05-30
KR20070090143A (ko) 2007-09-05
ATE407424T1 (de) 2008-09-15
CN101061535A (zh) 2007-10-24
CA2580622C (en) 2011-05-10
KR100915733B1 (ko) 2009-09-04
US20080126081A1 (en) 2008-05-29
PL1825461T3 (pl) 2009-02-27
CA2580622A1 (en) 2007-01-13
WO2007073949A1 (de) 2007-07-05
DE102005032724A1 (de) 2007-02-01
DE102005032724B4 (de) 2009-10-08
CN101676993A (zh) 2010-03-24
JP2008513848A (ja) 2008-05-01
DE502006001491D1 (de) 2008-10-16
US8265940B2 (en) 2012-09-11
ES2309969T3 (es) 2008-12-16
EP1825461B1 (de) 2008-09-03
DK1825461T3 (da) 2009-01-26
EP1825461A1 (de) 2007-08-29
CN100568345C (zh) 2009-12-09

Similar Documents

Publication Publication Date Title
JP4740260B2 (ja) 音声信号の帯域幅を疑似的に拡張するための方法および装置
US10373623B2 (en) Apparatus and method for processing an audio signal to obtain a processed audio signal using a target time-domain envelope
JP4220461B2 (ja) 時間的に離散した音声信号のアップサンプリングした信号を発生する方法と装置
US8935156B2 (en) Enhancing performance of spectral band replication and related high frequency reconstruction coding
JP6334808B2 (ja) 時間ドメイン符号化と周波数ドメイン符号化の間の分類の改善
KR101373004B1 (ko) 고주파수 신호 부호화 및 복호화 장치 및 방법
US8532983B2 (en) Adaptive frequency prediction for encoding or decoding an audio signal
US10255928B2 (en) Apparatus, medium and method to encode and decode high frequency signal
US9280978B2 (en) Packet loss concealment for bandwidth extension of speech signals
US8909539B2 (en) Method and device for extending bandwidth of speech signal
US20140297271A1 (en) Speech signal encoding/decoding method and apparatus
KR20180002906A (ko) 오디오 신호 디코더에서의 개선된 주파수 대역 확장
US7603271B2 (en) Speech coding apparatus with perceptual weighting and method therefor
Bhatt Simulation and overall comparative evaluation of performance between different techniques for high band feature extraction based on artificial bandwidth extension of speech over proposed global system for mobile full rate narrow band coder
JP4313993B2 (ja) オーディオ復号化装置およびオーディオ復号化方法
CN103155035A (zh) 基于celp的语音编码器中的音频信号带宽扩展
Lombard et al. Frequency-domain comfort noise generation for discontinuous transmission in evs
KR101352608B1 (ko) 음성 신호의 대역폭 확장 방법 및 그 장치

Legal Events

Date Code Title Description
A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20080806

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20080904

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080912

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081212

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090123

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090417

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20090525

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20090626

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20101227

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20101228

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110428

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140513

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees