JP2007065636A - 音声通信システムにおいて快適雑音を生成する方法および装置 - Google Patents

音声通信システムにおいて快適雑音を生成する方法および装置 Download PDF

Info

Publication number
JP2007065636A
JP2007065636A JP2006208368A JP2006208368A JP2007065636A JP 2007065636 A JP2007065636 A JP 2007065636A JP 2006208368 A JP2006208368 A JP 2006208368A JP 2006208368 A JP2006208368 A JP 2006208368A JP 2007065636 A JP2007065636 A JP 2007065636A
Authority
JP
Japan
Prior art keywords
background noise
frame
energy value
estimated
channel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006208368A
Other languages
English (en)
Other versions
JP4643517B2 (ja
Inventor
Edgardo M Cruz-Zeno
エム.クルーズ−ジーノ エドガード
James P Ashley
ピー.アシュリー ジェームズ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Motorola Solutions Inc
Original Assignee
Motorola Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Motorola Inc filed Critical Motorola Inc
Publication of JP2007065636A publication Critical patent/JP2007065636A/ja
Application granted granted Critical
Publication of JP4643517B2 publication Critical patent/JP4643517B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Noise Elimination (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

【課題】 ネットワーク帯域幅利用を減少させつつより高い品質を達成すべく、音声通信システムにおいて快適雑音を生成すること。
【解決手段】快適雑音生成のために種々の電子機器で使用され得る方法は、音声に背景雑音を加えたものを示す複数の情報フレームを受け取る工程(705)、複数の情報フレームに基づいて1または複数の背景雑音特性を推定する工程(710)、および1または複数の背景雑音特性に基づいて快適雑音信号を生成する工程(715)を含む。方法はさらに、複数の情報フレームから音声信号を生成する工程(720)、および音声活動検出に基づいて快適雑音信号と音声信号との間で切り替えを行うことにより出力信号を生成する工程(725)を含む。
【選択図】 図7

Description

本発明は、包括的には通信システムに関し、詳細には音声通信システムにおける快適雑音(comfort noise)の生成に関する。
移動通信サービスの増大する需要を満たすために、多くの現在の移動通信システムが、会話中にチャネルが40%〜60%の時間のみで音声情報を伝えているという事実を利用することにより、その容量を増加させている。残りの時間、チャネルはただ無言(silence)または背景雑音を送信するために使用される。多くの場合、チャネルの音声活動は40%よりも低くさえある。不連続送信(DTX)を始めとする従来の移動通信システムは、音声活動がない時間の間に減少させた情報量を送ることにより、チャネル容量のある程度の増加を提供している。
図1のタイミング図は、従来のDTXシステムの典型的なアナログ音声信号105および対応のデータフレーム信号110を示す。DTXシステムでは、送信側は通常、音声活動検出器(VAD)を使用して音声の存在を検出する。VAD出力に基づいて、送信側は音声活動がある場合に活動音声フレーム115を送る。音声活動が検出されない場合、送信側は受信側に断続的に無言識別情報[無言記述子](SID)フレーム120を送信し、音声が再び検出されるか、または更新SIDが必要とされるまで、活動音声フレームの送信を停止する。復号(受信)側は、SIDフレーム120を使用して、「快適(comfort)」雑音を生成する。SIDフレームが受け取られない間、デコーダは自身が受け取った最新のSIDフレームに基づいて快適雑音を生成し続ける。従来のDTXシステムの例は、3rd Generation Partnership Project; Technical Specification Group Services and System Aspects; Mandatory speech codec speech processing functions, Adaptive Multi-Rate (AMR) speech codec Comfort noise aspects(Release 6)により発行された3GPP TS 26.092 V6.0.0(2004−12)仕様書に記載されている。
図2のタイミング図は、従来のCTXシステムの典型的なアナログ音声信号205および対応のデータフレーム信号210を示す。CTXシステムでは、チャネルの音声活動を利用するために可変レートボコーダが使用され得る。これらのシステムでは、通信リンクの維持のために必要なビットレートは音声活動のない期間の間は減少される。VADは、音声活動と送信されている音声フレームの種類とに従って送信ビットレートを変化させるレート判定サブシステムの一部である。そのような技術の例はCDMAシステムに使用される拡張変数レートコーデック(enhanced variable rate codec, EVRC)である。EVRCは、3つの可能なビットレート(フル、ハーフ、および8つのレートフレーム)間で選択を行う。音声活動がない間は、8番目のレートフレームだけが送信され、それによりシステム内のチャネルによって利用される帯域幅が減少する。この技術は、システム全体の容量の増加を支援する。従来のCTXシステムの例は、Enhanced Variable Rate Codec, Speech Service Option 3 for Wideband Spread Spectrum Digital Systemにより発行された3GPP2 C.S0014−A V1.0(2004年4月)に記載されている。
パケットベースの通信システムでは、DTXシステムやCTXシステムで使用されるような可変レートコーデックを用いた帯域幅減少スキームは、大きな容量の増加は提供しない可能性がある。DTXネットワークではSIDフレームは、例えば正常な音声フレームの帯域幅と同等な帯域幅を使い得る。CTXシステムの場合、可変レートコーデックを使用するという利点は、パケットベースのネットワークに重要な帯域幅減少を提供しない可能性がある。それは、減少されたビットレートフレームが、パケットベースのネットワークでは、音声活動フレームと同様の帯域幅を利用し得るという事実による。例えば、EVRCが使用される場合、8番目のレートパケットは、各パケットに付加されているオーバーヘッド情報により、フルレートまたはハーフレートパケットと同様の帯域幅を利用し、それにより、他のタイプの通信チャネル上で得られる可変レートコーデックによって提供される容量の増加を無くす可能性がある。
EVRCを使用してパケットベースのネットワークで帯域幅の利用を減少することへの1つのアプローチは、すべての8番目のレートパケットの送信を無くすことである。その場合、復号側で、欠落パケットはフレーム消去(frame erasure, FER)として取り扱われ得る。しかしながら、EVRCのFER取り扱いは、一連の消去された長いフレームを取り扱うようには設計されなかったため、ユーザに提示された信号を合成する際にこの技術は低品質の出力を生成する。また、デコーダは欠落した8番目のレートフレームによって表わされる背景雑音についての情報を受け取らないため、オリジナルの背景雑音信号に類似する信号を送信側で生成することができない。
米国特許第5,870,397号 米国特許第6,577,862号 米国特許第6,606,593号
したがって、ネットワーク帯域幅利用を減少させつつ、より高い品質を達成すべく、上述の方法を改善する必要がある。
上記問題点を解決するために、請求項1に記載の発明は、音声通信システムで快適雑音を生成する方法であって、音声に背景雑音を加えたものを示す複数の情報フレームを受け取る工程、前記複数の情報フレームに基づいて1または複数の背景雑音特性を推定する工程、および前記1または複数の背景雑音特性に基づいて快適雑音信号を生成する工程、を含む方法を要旨とする。
請求項2に記載の発明は、請求項1に記載の方法において、前記背景雑音特性を推定する工程は、複数の情報フレームのうちの先のフレームの対応する周波数チャネルの推定背景雑音エネルギー値と、現在のフレームの対応する周波数チャネルの推定チャネルエネルギー値とから、複数の情報フレームのうちの現在のフレームの複数の周波数チャネルの各々に対する現在の推定背景雑音エネルギー値を連続的に決定することを含むことを要旨とする。
請求項3に記載の発明は、請求項1に記載の方法において、前記背景雑音を推定する工程は、現在のフレームの対応する周波数チャネルの推定チャネルエネルギー値が、複数の周波数フレームのうちの先のフレームの対応する周波数チャネルの推定背景雑音エネルギー値よりも小さい場合に、複数の情報フレームのうちの現在のフレームの周波数チャネルの現在の推定背景雑音エネルギー値を、複数の情報フレームのうちの現在のフレームの対応する周波数チャネルの推定チャネルエネルギー値と等しく設定すること、およびそれ以外の場合に、複数の情報フレームのうちの現在のフレームの周波数チャネルの現在の推定背景雑音エネルギー値を、複数の周波数フレームのうちの先のフレームの対応する周波数チャネルの推定背景雑音エネルギー値に増分エネルギー値を加えたものに等しく設定することを含むことを要旨とする。
請求項4に記載の発明は、請求項1に記載の方法において、前記1または複数の背景雑音特性を推定する工程は、
Figure 2007065636
から成り、式中、Ebgn(m,i) は複数の情報フレームのうちのm番目のフレームのi番目の周波数チャネルの推定背景雑音エネルギー値であり、Ech(m,i)は複数の情報フレームのうちのm番目のフレームのi番目の周波数チャネルの推定チャネルエネルギー値であり、Ebgn(m-1,i) は複数の周波数フレームのうちの(m−1)番目のフレームのi番目の周波数チャネルの推定背景雑音エネルギー値であり、Δは増分エネルギー値であることを要旨とする。
請求項5に記載の発明は、請求項1に記載の方法において、前記1または複数の背景雑音特性を推定する工程は、
Figure 2007065636
から成り、式中、Ebgn(m,i )は複数の情報フレームのうちのm番目のフレームのi番目の周波数チャネルの推定背景雑音エネルギー値であり、Ech(m,i )は複数の情報フレームのうちのm番目のフレームのi番目の周波数チャネルの推定チャネルエネルギー値であり、Ebgn(m-1,i )は複数の周波数フレームのうちの(m−1)番目のフレームのi番目の周波数チャネルの推定背景雑音エネルギー値であり、Δ1 は第1の増分エネルギー値であり、Δ2 は第2の増分エネルギー値であり、Evoiceは音声エネルギーを示すエネルギー値であることを要旨とする。
請求項6に記載の発明は、請求項1に記載の方法において、複数の情報フレームから音声信号を生成する工程、および音声活動検出に基づいて快適雑音信号と音声信号との間で切り替えを行うことにより出力信号を生成する工程をさらに含むことを要旨とする。
請求項7に記載の発明は、請求項1に記載の方法において、前記快適雑音信号を生成する工程は、背景雑音特性に由来するスペクトル成分の逆離散フーリエ変換を行うことを含むことを要旨とする。
請求項8に記載の発明は、プログラム命令のセットを含む処理システムを備えた、音声通信システムにおいて快適雑音を生成する装置であって、該プログラム命令のセットは1または複数のプロセッサを音声に背景雑音を加えたものを示す複数の情報フレームを受け取ること、前記複数の情報フレームに基づいて1または複数の背景雑音特性を推定すること、および前記1または複数の背景雑音特性に基づいて快適雑音信号を生成すること、を行わせるように制御するものであることを要旨とする。
請求項9に記載の発明は、請求項8に記載の装置において、情報フレームを含む無線信号を受け取る無線周波数受信機と、快適雑音を示すスピーカとをさらに備えたことを要旨とする。
請求項10に記載の発明は、プログラム命令のセットを含む媒体であって、該プログラム命令のセットは1または複数のプロセッサを、音声に背景雑音を加えたものを示す複数の情報フレームを受け取ること、前記複数の情報フレームに基づいて1または複数の背景雑音特性を推定すること、および前記1または複数の背景雑音特性に基づいて快適雑音信号を生成すること、を行わせるように制御するために使用できるものであることを要旨とする。
添付図面は、別個の図全体を通じて同様な参照番号は同一又は機能的に類似の要素を示し、以下の詳細な説明と共に、本明細書に組み込まれ、その一部を形成する。添付図面はさらに、本発明に基づく様々な実施形態を例示すると共に様々な原理及び利点を説明する役割を果たす。
当業者には、図中の要素が簡潔性と明瞭性を期すよう描かれており、必ずしも正しい縮尺ではないことが理解されるだろう。例えば、本発明の実施形態についての理解をより促すために、図中のいくつかの要素の寸法は、他の要素と比べて誇張されることがある。
本発明による詳しい実施形態を説明する前に、そのような実施形態は主として音声通信システムでの快適雑音の生成に関連する方法の工程および装置の構成要素の組み合わせに存在することに注意すべきである。従って、適当な場合、装置の構成要素および方法の工程は図中の従来の記号によって表され、ここでの説明によって恩恵を受ける当業者に容易に明らかとなるであろう詳細で以て本開示を不明瞭にしないように、本発明の実施形態の理解に関連する詳細な説明だけを示す。
本文書では、第1および第2、上部および下部など、関係を表す用語の使用は、ある存在(entity)又は動作を、他の存在又は動作と区別するためにのみ使用されており、存在又は動作間の実際の関係又は順番が必ずしも要求され、又は含まれる必要がないことが理解される。用語「から成る(comprise)」「からなっている(comprising)」、またはその用語のあらゆる他の変化形は、非排他的な包含物をその範囲内に入れるものとし、ある要素のリストを含むプロセス、方法、物、または装置は、その要素のみを含むわけではなく、明示的に列挙されていない他の要素やそのようなプロセス、方法、物、または装置に固有の要素を含みうる。「…から成る、を含む」に後続する数詞を限定しない要素は、より多くの束縛がなければ、構成要素を構成するプロセス、方法、物品、または装置における追加の同一要素の存在を排除しない。
以下、CTXシステムで非音声フレームを送信する必要を減らすか無くすフレーム抑制方法を説明する。先行技術方法とは対照的に、ここで記述された方法は、特にパケットベースのネットワークにおける快適雑音のより良好な合成と、帯域幅利用の減少とを提供する。
図3を参照すると、本発明のいくつかの実施形態による、エンコーダ−デコーダ300の機能ブロック図が示される。エンコーダ−デコーダ300はエンコーダ301およびデコーダ302を含む。アナログ音声信号304 sはフレームバッファ305によってフレーム306に分解され、パケット・エンコーダ310によって符号化される。入力信号のプロパティに基づいて、現在の音声パケットを送信するか省略するために、判定がDTXスイッチ315によって下される。デコード側で、受信パケット319はパケット・エンコーダ320によりフレーム sm(n)にデコードされ、これは情報フレーム321とも称される。
ここに説明された本発明の実施形態では、米国特許第5,870,397号で行われるようにパケット・エンコーダ310(送信側)がSIDフレーム、または雑音コーディング(8番目のレート)フレームを送る必要がない。ただし、パケット・エンコーダ320で受け取られる場合にはそれらを使用することができる。快適雑音を再生するために、背景雑音推定器325をこれらの実施形態で使用して、復号化された活動音声情報フレーム321を処理し、背景雑音のスペクトル特性326(背景雑音特性とも称される)の推定値を生成する。推定背景特性326を、欠落パケット合成装置330により使用し、快適雑音信号331を生成する。その後、情報フレーム321と快適雑音331との間で選択が行われるようスイッチ335を使用して、出力信号303を生成する。スイッチは、例えば2つの正常なフレーム期間のような所定時間の間で、活動音声を含む情報フレームが受け取られていない時を検出する音声活動検出器(図3に示さない)により起動される。
以下により詳細に説明するように、スイッチ335は「ソフト」スイッチであると考えられてもよい。
図4を参照すると、本発明の実施形態による、背景雑音推定器の機能ブロック図が示される。復号化された音声と雑音音声mを加えたものについて、ここでは情報フレームとも呼ばれるが、背景雑音推定値は以下のように音声に雑音信号321 Sm(n)を加えたものから得られ得る。第1に、離散フーリエ変換(DFT)機能405は、音声に雑音フレーム406を加えたもののDFT Sm(k)を得るために使用される。kはバイナリ・インデックスである。フレームのスペクトル表示の各二進数kについては、またはチャネルと呼ばれる二進数のグループの各々について、推定チャネルまたはバイナリ・エネルギー(Ech(m, i)が計算される。これは各チャネルi(iは0からNc-1まで)に対して以下の方程式1を使用することにより遂行され得る。ここで、Ncはチャネルの数である。iの各値については、この演算が、図4で例証した推定チャネルエネルギー推定器(ECE)420の1つによって行なわれ得る。
Figure 2007065636
式中、Eminは最小の許容チャネルエネルギーであり、αw(m)チャネルエネルギー平滑化因数(以下に定義)であり、fL(i)およびf(i)は低いおよび高いチャネル結合テーブルの各々のi番目の要素であり、これは以下に示されるようなEVRCのための雑音抑圧のために定義されたのと同じ限界値であってもよいし、他のシステムで適するように決定された他の限界値であってもよい。
Figure 2007065636
チャネルエネルギー平滑化因数αw(m)は、フレーム誤差の存在も含めて、種々の因数によって変更され得る。例えば、平滑化因数は次のように定義することができる。
Figure 2007065636
これは、αw(m)が、第1フレーム(m=1)に対して0の値を取り、すべての後続のフレームに対しては重み付け係数wαの0.85倍の値をとることを意味する。これは、推定チャネルエネルギーが、第1のフレームの非フィルタチャネルエネルギーに初期化されることを許容すると共に、重み付け係数により他のすべてのフレームに対して適応に対するいくらかの制御を供給する。重み付け係数は
Figure 2007065636
に従って変更され得る。
各チャネルの背景雑音エネルギーの推定値Ebgn(m,i)は、
Figure 2007065636
に従って得られ、更新され得る。
iの各値については、この演算は、図4で例証した背景雑音推定器425のうちの一つによって行なわれる得る。方程式(5)によって与えられる背景雑音推定値Ebgnは、図5および6を参照しながら以下にさらに詳しく説明するものとして使用され得る背景特性の1つの形式である。他のものが使用されてもよい。
フレームmのチャネルiの推定チャネルエネルギーが、フレームm−1でのチャネルiの背景雑音エネルギー推定値よりも小さい場合に、フレームmのチャネルiの背景雑音エネルギー推定値は、そのフレームmのチャネルiの推定チャネルエネルギーに設定されることが理解されよう。
フレームmのチャネルiの推定チャネルエネルギーが、この例では12デシベルである値だけ、フレームm−1でのチャネルiの背景雑音推定値よりも大きな場合、フレームmのチャネルiの背景雑音推定値は、フレームm−1のチャネルiの背景雑音に第1の小さな増分(この実施例では0.005デシベル)を加えて設定される。12という値は、チャネルエネルギーが本明細書でEvoiceとも識別される活動音声エネルギーである可能性が非常に高くなる最小のデシベル値である。第1の小さなインクリメントはここではΔ1として識別される。フレームレートが50フレーム/秒であり、Echがいくつかの周波数チャネルで数秒間Evoiceを超えたままである場合に、背景雑音推定値は0.25デシベル/秒だけ上昇することが理解される。
フレームmのチャネルiの推定チャネルエネルギーが、この例では12デシベルよりも小さい値だけ、フレームm−1でのチャネルiの背景雑音推定値よりも大きく、また、フレームm−1のチャネルiの背景雑音推定値よりも大きいかそれに等しい場合に、フレームmのチャネルiの背景雑音エネルギー推定値は、フレームm−1のチャネルiの背景雑音エネルギー推定値に第2の小さな増分Δ2(この例では0.01デシベル)を加えて設定される。12デシベルという値は、Evoiceを表わす。第2の小さな増分はここではΔ2として識別されることが理解されよう。フレームレートが50フレーム/秒であり、推定チャネルエネルギーがいくつかの周波数チャネルで数秒間Evoiceを超えたままである場合に、背景雑音エネルギー推定値は0.5デシベル/秒/チャネルだけ上昇することが理解される。推定チャネルエネルギーが先のフレームからの背景雑音エネルギー推定値に近い場合、チャネルエネルギーは背景雑音由来である可能性が大きいため、背景雑音エネルギー推定値はより大きな値だけ増分されるだろうことが理解される。このため、上記実施形態ではΔ2はΔ1よりも大きいことが認識されるだろう。
いくつかの実施形態では、Evoice、Δ1およびΔ2の値はシステム特性における差を提供するために別々に選択され得る。例えば、ΔまたはΔ1は0.5dB以下に設計され;Δ2は1.0dB以下に設計され;Evoiceは50dB未満であり得る。
また、複数の増分があるように、あるいは基準値(例えば12デシベル)に対する、フレームmのチャネルiの推定チャネルエネルギーとフレームm−1のチャネルiの背景雑音推定値との差の比からそのような増分を計算できるように、より多くの間隔を使用することも可能である。音声オーディオと同時に存在する背景オーディオの良好な推定を行う背景特性を生成するために、当業者に明白な他の機能を使用してもよい。
いくつかの実施形態では、背景雑音推定器は、より簡単な技法に従って、背景特性426 Ebgn(m, i)を決定し得る。
Figure 2007065636
この技法によって提供される背景雑音エネルギー推定(背景特性)の値は上述したのと同様には機能しない可能性はあるが、本明細書に説明する他の実施形態の利益のうちの一部を提供するだろう。
図5を参照すると、欠落パケット合成装置330(図3)の機能ブロック図が、本発明のいくつかの実施形態に従って示される。背景雑音推定値Ebgn 326が、背景雑音推定器325(図3)により、すべての受信音声フレームに対して更新される。パケット・エンコーダ320がフレームmのパケットを受け取ると、パケットは符号化され、sm(n)を生成する。音声フレームが欠落しているか受け取られていないことをパケット・エンコーダ320が検出すると、欠落パケット合成装置330はEbgnのスペクトル特性に基づいて快適雑音を合成するように動作する。快適雑音は以下のように合成され得る。
第1に、快適雑音のスペクトルの大きさXdecmag(m,k)が、背景雑音推定値426 Ebgn(m,i)に基づいて、スペクトル成分大きさ計算器505により生成される。これは方程式(7)に示されるように達成され得る。
Figure 2007065636
スペクトル成分のランダム位相が、スペクトル成分のランダム位相生成器510によって以下に従って生成される。
Figure 2007065636
式中、ran0は一様に分配された擬似乱数生成器のスパニング[0.0,1.0]である。背景雑音スペクトルは乗算器515によって以下のように生成され、
Figure 2007065636
その後、逆DFT520を用いて時間領域に変換され、
Figure 2007065636
を生成する。式中、g(n)は平滑化された台形窓であり、
Figure 2007065636
により定義される。
式中Lはディジタル化されたオーディオフレーム長さであり、Dはディジタル化されたオーディオフレームオーバラップであり、MはDFT長さである。
方程式(10)で、xdex(m-1, n)は先のフレーム出力であり、これはパケット・エンコーダ320または活動音声パケットが受け取られなかった場合には生成された快適雑音フレームから由来し得る。方程式10は、フレームの遷移によってオーディオを滑らかにするために先のフレームと現在のフレームのオーバラップ追加を用いることにより、快適雑音の期間中に、および快適雑音の期間後に1つの活動音声フレームに対して、音声信号xdexがどのように生成されるかを定義する。これらの方程式によって、平滑化は、連続する快適雑音フレーム間の遷移だけでなく、快適雑音と活動音声との間の遷移や、その逆の間の遷移にも生じる。他の従来のオーバラップ機能は他のいくつかの実施形態で使用されてもよい。方程式10および11の使用から生じるオーバラップは、図3のスイッチ335のような「ソフト」な形式のスイッチを起動すると考えられる。
図6を参照すると、本発明のいくつかの実施形態による、再エンコーダ600の機能ブロック図が示される。図3−5および方程式1−11に関してこれまで説明した技法は好結果を生じさせるが、再エンコードスキームの組み込むことにより、いくつかのシステムではより良い結果が得られ得る。再エンコードスキームでは、通信リンク601上で受け取られたパケットは、音声活動が検出される場合、音声活動検出器(VAD)625に結合され、スイッチ605を通って渡され、パケット・エンコーダ610により復号される。VAD 625は音声活動を含むパケットの存在または不在を検出し、得られた判定によってスイッチ605を制御する。音声活動が検出された場合、パケット・エンコーダ610は、出力信号621の音声信号部分として、活動音声のディジタル化オーディオサンプルを生成する。この活動音声のオーディオサンプルは、スイッチ605を通って同時にフィードバックされ、結果は背景快適雑音合成装置615に結合される。合成装置615は背景雑音推定器325および上述した欠落パケット合成装置330を含む。背景快適雑音合成装置615の出力はエンコーダに結合され、エンコーダは背景快適雑音合成装置615によって生成された快適雑音を表わすパケットを生成する。活動音声が検出された場合、エンコーダ620の出力は使用されない。音声活動パケットがないことをVAD 625が判定した場合、パケット・エンコーダ620の出力はパケット・エンコーダ610の入力に切り替えられ、パケット・エンコーダ610は出力信号621の快適雑音信号部分のためのディジタル化雑音サンプルを生成する。
いくつかの実施形態では、VAD 625は、快適雑音を伝える8番目のレートパケットと活動音声を伝える他のパケットとのような有効パケットが受け取られた場合にスイッチ605を第1の状態にし、パケットが欠落していることが判定された場合にスイッチ605を第2の状態にする有効パケット検出器により置き換えられてもよい。有効パケット検出器の出力が第1の状態である場合、スイッチ605は、通信リンク601上で受け取られたパケットをパケット・エンコーダ610に結合し、パケット・エンコーダ610の出力は背景雑音合成装置615に結合される。有効パケット検出器の出力が第2の状態である場合、スイッチ605はパケット・エンコーダ620の出力をパケット・エンコーダ610に結合し、パケット・エンコーダ610の出力は背景雑音合成装置615に結合されない。さらに、背景快適雑音合成装置615は、例えば、
Figure 2007065636
で与えられるように、代替の背景雑音推定方法を実施するように変更されてもよい。ここでβは0から1までの範囲の値を有する重み付け係数である。この方程式は非音声フレームが受け取られた場合に背景雑音推定値を更新するために使用される。この方程式の更新方法は、音声フレームが受け取られた場合に使用される方程式5および6によって提供される更新方法よりも積極的であり得る。
用語「背景雑音」は、本説明の全体にわたって使用されているが、音声が存在しても存在しなくても存在するエネルギーは、音楽のような、通常雑音であると考えられるもの以外のものであり得るということが理解されよう。また、用語「音声」は、聞き手に伝えられるように意図された発話または他のオーディオを意味するものと通常解釈され、例えば、背景雑音の存在下でマイクロホンの近くで再生される音楽を含み得ることが理解されよう
要約すると、図7のフローチャートによって例証されるように、本発明の実施形態による音声通信おいて快適雑音を生成する方法のいくつかの工程は、音声に背景雑音を加えたものを示す複数の情報フレームを受け取る工程(705)、複数の情報フレームに基づいて1または複数の背景雑音特性を推定する工程(710)、および1または複数の背景雑音特性に基づいて快適雑音信号を生成する工程(715)を含む。方法はさらに、複数の情報フレームから音声信号を生成する工程(720)、および音声活動検出に基づいて快適雑音信号と音声信号との間で切り替えを行うことにより出力信号を生成する工程(725)を含み得る。
図8のブロック図は、本発明のいくつかの実施形態による、聞こえる快適雑音を生成することができる装置である電子機器800を示す。電子機器800は無線周波数受信機805を備え、無線周波数受信機805は無線信号801を受け取り、上述のように該無線信号801から情報フレーム319,601(図3,6)のような情報フレームを復号し、それらを処理セクション810に結合する。本明細書で上述した状況のように、情報フレームは音声部分と背景雑音部分とを含む音声信号を有している。音声部分は、通常音声部分に含まれる音声オーディオよりも低いエネルギー準位で、通常背景雑音部分に含まれる背景雑音に非常に似た、背景雑音も含んでいる。処理セクション810は、快適雑音を含む出力信号621の生成を含めて図7に関して上述された機能を実行するよう1または複数のプロセッサを制御するプログラム命令を含んでいる。出力信号621は、適切な電子機器(図8には示していない)を通じてスピーカ815に結合され、スピーカ815は図6の出力信号621に基づいて聞こえる出力816を示す。聞こえる出力は、通常、聞こえる音声部分と聞こえる快適雑音部分との両方を含んでいる。
本明細書で説明した実施形態は、音声信号を受信機に送信する装置によって背景雑音だけが捕らえられている間に音声信号の背景雑音内容についてのいかなる情報も送信する必要なしに、携帯電話のような音声信号を受け取る装置で、快適雑音を生成する方法および装置を提供するということが理解されよう。従来の音声信号の送受信方法および手段に対して帯域幅の節約を許容するため、このことは有益である。
本明細書で説明した実施形態は、1または複数の従来のプロセッサと、該プロセッサが本明細書で説明した本発明の実施携帯の機能の一部、大部分、または全部を一定の非プロセッサ回路と共に実行するよう制御する固有の格納プログラム命令とから構成され得ることが理解されよう。そのような非プロセッサ回路には、無線受信機、無線送信機、信号ドライバ、クロック回路、電源回路、およびユーザ入力装置が含まれるが、それらに限定されるわけではない。そのようなものとして、それらの機能は、音声通信システムにおいて快適雑音の生成を行う方法の工程として解釈され得る。代わりに、一部またはすべての機能が、格納プログラム命令を行っていない状態マシンによって、または各機能または特定の機能のいくつかの組み合わせがカスタムロジックとして実装された1または複数の特定用途向け集積回路(ASIC)において、実行されてもよい。もちろん、これらのアプローチの組み合わせを使用することも可能である。プロセッサおよび格納プログラム命令を使用して本発明の実施携帯の機能を実行ができる状況では、そのような機能を実行する手段が、磁気記憶であれ、ファイルを伝える信号であれ、格納プログラム命令を格納する媒体であるということが理解されよう。さらに、恐らく多くの努力や、例えば利用可能な時間、現行の技術、および経済的考慮事項によって動機付けられる多くの設計上の選択が想定されるにもかかわらず、開示された概念と原理に導かれれば、当業者は最小限の実験でそのような格納プログラム命令およびICを容易に生成できることが予想される。
以上の明細書では、本発明を特定の実施態様を参照して説明してきた。しかし、当業者であれば、特許請求の範囲に記載される本発明の範囲から逸脱することなく、種々の改変と変更が行えることが理解される。したがって、明細書と図面は、限定的な意味ではなく例証的な意味で解釈され、そのような改変はすべて、本発明の範囲内に含まれるものとする。利点、効果、課題の解決策、およびあらゆる利点、長所、または解決策を生じさせるか、またはより顕著にする任意の1つまたは2つ以上の要素は、請求項のいずれかまたはすべての重要な、必要な、または不可欠な特徴または要素として解釈されるべきでない。本発明は、本願の係属中に行われるすべての補正および発行される請求項のすべての均等物を含めて、請求項によってのみ定義される。
従来の不連続送信システムの典型的なアナログ音声信号および対応データフレーム信号を示すタイミング図。 従来の連続送信システムの典型的なアナログ音声信号および対応データフレーム信号を示すタイミング図。 本発明のいくつかの実施形態による、エンコーダ−デコーダの機能ブロック図。 本発明の実施形態による、背景雑音推定器の機能ブロック図。 本発明のいくつかの実施形態による、欠落パケット合成装置の機能ブロック図。 本発明のいくつかの実施形態による、再エンコーダの機能ブロック図。 本発明の実施形態による、音声通信において快適雑音を生成する方法のいくつかの工程を例証するフローチャート。 本発明のいくつかの実施形態による、聞こえる快適雑音を生成することができる装置である電子機器のブロック図。

Claims (10)

  1. 音声通信システムで快適雑音を生成する方法であって、
    音声に背景雑音を加えたものを示す複数の情報フレームを受け取る工程、
    前記複数の情報フレームに基づいて1または複数の背景雑音特性を推定する工程、および
    前記1または複数の背景雑音特性に基づいて快適雑音信号を生成する工程、
    を含む方法。
  2. 前記背景雑音特性を推定する工程は、
    複数の情報フレームのうちの先のフレームの対応する周波数チャネルの推定背景雑音エネルギー値と、現在のフレームの対応する周波数チャネルの推定チャネルエネルギー値とから、複数の情報フレームのうちの現在のフレームの複数の周波数チャネルの各々に対する現在の推定背景雑音エネルギー値を連続的に決定することを含む、請求項1に記載の方法。
  3. 前記背景雑音を推定する工程は、
    現在のフレームの対応する周波数チャネルの推定チャネルエネルギー値が、複数の周波数フレームのうちの先のフレームの対応する周波数チャネルの推定背景雑音エネルギー値よりも小さい場合に、複数の情報フレームのうちの現在のフレームの周波数チャネルの現在の推定背景雑音エネルギー値を、複数の情報フレームのうちの現在のフレームの対応する周波数チャネルの推定チャネルエネルギー値と等しく設定すること、および
    それ以外の場合に、複数の情報フレームのうちの現在のフレームの周波数チャネルの現在の推定背景雑音エネルギー値を、複数の周波数フレームのうちの先のフレームの対応する周波数チャネルの推定背景雑音エネルギー値に増分エネルギー値を加えたものに等しく設定すること、を含む、請求項1に記載の方法。
  4. 前記1または複数の背景雑音特性を推定する工程は、
    Figure 2007065636
    から成り、式中、
    Ebgn(m,i)は複数の情報フレームのうちのm番目のフレームのi番目の周波数チャネルの推定背景雑音エネルギー値であり、
    Ech(m,i)は複数の情報フレームのうちのm番目のフレームのi番目の周波数チャネルの推定チャネルエネルギー値であり、
    Ebgn(m-1,i)は複数の周波数フレームのうちの(m−1)番目のフレームのi番目の周波数チャネルの推定背景雑音エネルギー値であり、
    Δは増分エネルギー値である、請求項1に記載の方法。
  5. 前記1または複数の背景雑音特性を推定する工程は、
    Figure 2007065636
    から成り、式中、
    Ebgn(m,i)は複数の情報フレームのうちのm番目のフレームのi番目の周波数チャネルの推定背景雑音エネルギー値であり、
    Ech(m,i)は複数の情報フレームのうちのm番目のフレームのi番目の周波数チャネルの推定チャネルエネルギー値であり、
    Ebgn(m-1,i)は複数の周波数フレームのうちの(m−1)番目のフレームのi番目の周波数チャネルの推定背景雑音エネルギー値であり、
    Δ1は第1の増分エネルギー値であり、
    Δ2は第2の増分エネルギー値であり、
    Evoiceは音声エネルギーを示すエネルギー値である、請求項1に記載の方法。
  6. 複数の情報フレームから音声信号を生成する工程、および
    音声活動検出に基づいて快適雑音信号と音声信号との間で切り替えを行うことにより出力信号を生成する工程、をさらに含む請求項1に記載の方法。
  7. 前記快適雑音信号を生成する工程は、背景雑音特性に由来するスペクトル成分の逆離散フーリエ変換を行うことを含む、請求項1に記載の方法。
  8. プログラム命令のセットを含む処理システムを備えた、音声通信システムにおいて快適雑音を生成する装置であって、該プログラム命令のセットは1または複数のプロセッサを
    音声に背景雑音を加えたものを示す複数の情報フレームを受け取ること、
    前記複数の情報フレームに基づいて1または複数の背景雑音特性を推定すること、および
    前記1または複数の背景雑音特性に基づいて快適雑音信号を生成すること、
    を行わせるように制御するものである、装置。
  9. 情報フレームを含む無線信号を受け取る無線周波数受信機と、快適雑音を示すスピーカとをさらに備えた請求項8に記載の装置。
  10. プログラム命令のセットを含む媒体であって、該プログラム命令のセットは1または複数のプロセッサを
    音声に背景雑音を加えたものを示す複数の情報フレームを受け取ること、
    前記複数の情報フレームに基づいて1または複数の背景雑音特性を推定すること、および
    前記1または複数の背景雑音特性に基づいて快適雑音信号を生成すること、
    を行わせるように制御するために使用できるものである、媒体。
JP2006208368A 2005-08-31 2006-07-31 音声通信システムにおいて快適雑音を生成する方法および装置 Active JP4643517B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US11/216,624 US7610197B2 (en) 2005-08-31 2005-08-31 Method and apparatus for comfort noise generation in speech communication systems

Publications (2)

Publication Number Publication Date
JP2007065636A true JP2007065636A (ja) 2007-03-15
JP4643517B2 JP4643517B2 (ja) 2011-03-02

Family

ID=37308962

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006208368A Active JP4643517B2 (ja) 2005-08-31 2006-07-31 音声通信システムにおいて快適雑音を生成する方法および装置

Country Status (5)

Country Link
US (1) US7610197B2 (ja)
JP (1) JP4643517B2 (ja)
KR (1) KR101018952B1 (ja)
CN (1) CN101366077B (ja)
WO (1) WO2007027291A1 (ja)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2461898C2 (ru) * 2008-03-26 2012-09-20 Хуавэй Текнолоджиз Ко., Лтд. Способ и устройство для кодирования и декодирования
JP2014505907A (ja) * 2011-02-14 2014-03-06 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 不活性相の間のノイズ合成を用いるオーディオコーデック
JP2014510307A (ja) * 2011-02-14 2014-04-24 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン オーディオコーデックにおけるノイズ生成
US9047859B2 (en) 2011-02-14 2015-06-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding and decoding an audio signal using an aligned look-ahead portion
JP2016500453A (ja) * 2012-12-21 2016-01-12 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 低ビットレートで背景ノイズをモデル化するためのコンフォートノイズ付加
US9384739B2 (en) 2011-02-14 2016-07-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for error concealment in low-delay unified speech and audio coding
US9536530B2 (en) 2011-02-14 2017-01-03 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Information signal representation using lapped transform
US9583114B2 (en) 2012-12-21 2017-02-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Generation of a comfort noise with high spectro-temporal resolution in discontinuous transmission of audio signals
US9583110B2 (en) 2011-02-14 2017-02-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing a decoded audio signal in a spectral domain
US9595262B2 (en) 2011-02-14 2017-03-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Linear prediction based coding scheme using spectral domain noise shaping
US9595263B2 (en) 2011-02-14 2017-03-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding and decoding of pulse positions of tracks of an audio signal
US9620129B2 (en) 2011-02-14 2017-04-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result

Families Citing this family (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070160154A1 (en) * 2005-03-28 2007-07-12 Sukkar Rafid A Method and apparatus for injecting comfort noise in a communications signal
US8611305B2 (en) * 2005-08-22 2013-12-17 Qualcomm Incorporated Interference cancellation for wireless communications
US8594252B2 (en) * 2005-08-22 2013-11-26 Qualcomm Incorporated Interference cancellation for wireless communications
US9071344B2 (en) * 2005-08-22 2015-06-30 Qualcomm Incorporated Reverse link interference cancellation
US8743909B2 (en) * 2008-02-20 2014-06-03 Qualcomm Incorporated Frame termination
US8630602B2 (en) * 2005-08-22 2014-01-14 Qualcomm Incorporated Pilot interference cancellation
US9014152B2 (en) * 2008-06-09 2015-04-21 Qualcomm Incorporated Increasing capacity in wireless communications
US20070136055A1 (en) * 2005-12-13 2007-06-14 Hetherington Phillip A System for data communication over voice band robust to noise
US20070294087A1 (en) * 2006-05-05 2007-12-20 Nokia Corporation Synthesizing comfort noise
CN101246688B (zh) * 2007-02-14 2011-01-12 华为技术有限公司 一种对背景噪声信号进行编解码的方法、***和装置
CN101303855B (zh) * 2007-05-11 2011-06-22 华为技术有限公司 一种舒适噪声参数产生方法和装置
JP2009063928A (ja) * 2007-09-07 2009-03-26 Fujitsu Ltd 補間方法、情報処理装置
CN100555414C (zh) * 2007-11-02 2009-10-28 华为技术有限公司 一种dtx判决方法和装置
CN101483042B (zh) * 2008-03-20 2011-03-30 华为技术有限公司 一种噪声生成方法以及噪声生成装置
CN101339767B (zh) 2008-03-21 2010-05-12 华为技术有限公司 一种背景噪声激励信号的生成方法及装置
US9277487B2 (en) 2008-08-01 2016-03-01 Qualcomm Incorporated Cell detection with interference cancellation
US9237515B2 (en) * 2008-08-01 2016-01-12 Qualcomm Incorporated Successive detection and cancellation for cell pilot detection
US20100097955A1 (en) * 2008-10-16 2010-04-22 Qualcomm Incorporated Rate determination
US8320553B2 (en) * 2008-10-27 2012-11-27 Apple Inc. Enhanced echo cancellation
US20100260273A1 (en) * 2009-04-13 2010-10-14 Dsp Group Limited Method and apparatus for smooth convergence during audio discontinuous transmission
US9160577B2 (en) 2009-04-30 2015-10-13 Qualcomm Incorporated Hybrid SAIC receiver
US8787509B2 (en) * 2009-06-04 2014-07-22 Qualcomm Incorporated Iterative interference cancellation receiver
US8831149B2 (en) * 2009-09-03 2014-09-09 Qualcomm Incorporated Symbol estimation methods and apparatuses
PT2491559E (pt) * 2009-10-19 2015-05-07 Ericsson Telefon Ab L M Método e estimador de fundo para a detecção de actividade de voz
BR112012012632B1 (pt) 2009-11-27 2020-12-15 Qualcomm Incorporated Método e equipamento para aumentar a capacidade de transmissão em comunicações sem fio, e memória legível por computador
US9509452B2 (en) 2009-11-27 2016-11-29 Qualcomm Incorporated Increasing capacity in wireless communications
RU2011103938A (ru) 2011-02-03 2012-08-10 ЭлЭсАй Корпорейшн (US) Управление акустическими эхо-сигналами на основе временной области
MY159444A (en) 2011-02-14 2017-01-13 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E V Encoding and decoding of pulse positions of tracks of an audio signal
PT2866228T (pt) * 2011-02-14 2016-08-31 Fraunhofer Ges Forschung Descodificador de áudio que compreende um estimador de ruído de fundo
WO2012127278A1 (en) * 2011-03-18 2012-09-27 Nokia Corporation Apparatus for audio signal processing
US8589153B2 (en) 2011-06-28 2013-11-19 Microsoft Corporation Adaptive conference comfort noise
US8972256B2 (en) * 2011-10-17 2015-03-03 Nuance Communications, Inc. System and method for dynamic noise adaptation for robust automatic speech recognition
CN103137133B (zh) * 2011-11-29 2017-06-06 南京中兴软件有限责任公司 非激活音信号参数估计方法及舒适噪声产生方法及***
KR101629661B1 (ko) * 2012-08-29 2016-06-13 니폰 덴신 덴와 가부시끼가이샤 복호 방법, 복호 장치, 프로그램 및 그 기록매체
BR112015002826B1 (pt) * 2012-09-11 2021-05-04 Telefonaktiebolaget L M Ericsson (Publ) método, meio de armazenamento legível por computador, e, controlador de ruído de conforto para gerar parâmetros de controle de ruído de conforto
EP3054446B1 (en) * 2013-01-29 2023-08-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, method for providing an encoded audio information, method for providing a decoded audio information, computer program and encoded representation using a signal-adaptive bandwidth extension
PL3550562T3 (pl) * 2013-02-22 2021-05-31 Telefonaktiebolaget Lm Ericsson (Publ) Sposoby i urządzenia dla zawieszenia DTX w kodowaniu audio
CN105225668B (zh) * 2013-05-30 2017-05-10 华为技术有限公司 信号编码方法及设备
TWI553631B (zh) 2013-06-21 2016-10-11 弗勞恩霍夫爾協會 用於解碼音訊信號之裝置與方法,以及相關電腦程式
EP2922054A1 (en) * 2014-03-19 2015-09-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and corresponding computer program for generating an error concealment signal using an adaptive noise estimation
CN105101109B (zh) * 2014-05-15 2019-12-03 哈尔滨海能达科技有限公司 警用数字集群***的不连续发送的实现方法、终端和***
CN105336339B (zh) 2014-06-03 2019-05-03 华为技术有限公司 一种语音频信号的处理方法和装置
EP2980790A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for comfort noise generation mode selection
GB2532041B (en) * 2014-11-06 2019-05-29 Imagination Tech Ltd Comfort noise generation
CN105681512B (zh) * 2016-02-25 2019-02-01 Oppo广东移动通信有限公司 一种降低语音通话功耗的方法及装置
US10978096B2 (en) * 2017-04-25 2021-04-13 Qualcomm Incorporated Optimized uplink operation for voice over long-term evolution (VoLte) and voice over new radio (VoNR) listen or silent periods
US10880440B2 (en) 2017-10-04 2020-12-29 Proactiv Audio Gmbh Echo canceller and method therefor
CN113314133A (zh) * 2020-02-11 2021-08-27 华为技术有限公司 音频传输方法及电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003501925A (ja) * 1999-06-07 2003-01-14 エリクソン インコーポレイテッド パラメトリックノイズモデル統計値を用いたコンフォートノイズの生成方法及び装置
JP2003529950A (ja) * 1998-11-23 2003-10-07 テレフォンアクチーボラゲット エル エム エリクソン(パブル) 忠実度改善のためのコンフォートノイズ変動特性に基づく音声符号化
JP2004534263A (ja) * 2001-06-12 2004-11-11 グローブスパン ヴィラタ、インコーポレイテッド 擬似快適ノイズを発生させる簡単なスペクトル推定技術を実行する方法とシステム

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5657422A (en) * 1994-01-28 1997-08-12 Lucent Technologies Inc. Voice activity detection driven noise remediator
FI110826B (fi) * 1995-06-08 2003-03-31 Nokia Corp Akustisen kaiun poisto digitaalisessa matkaviestinjärjestelmässä
EP0756267A1 (en) 1995-07-24 1997-01-29 International Business Machines Corporation Method and system for silence removal in voice communication
US5949888A (en) * 1995-09-15 1999-09-07 Hughes Electronics Corporaton Comfort noise generator for echo cancelers
US5960389A (en) 1996-11-15 1999-09-28 Nokia Mobile Phones Limited Methods for generating comfort noise during discontinuous transmission
US6563803B1 (en) * 1997-11-26 2003-05-13 Qualcomm Incorporated Acoustic echo canceller
US6526140B1 (en) * 1999-11-03 2003-02-25 Tellabs Operations, Inc. Consolidated voice activity detection and noise estimation
GB2356538A (en) 1999-11-22 2001-05-23 Mitel Corp Comfort noise generation for open discontinuous transmission systems
US6577862B1 (en) 1999-12-23 2003-06-10 Ericsson Inc. System and method for providing comfort noise in a mobile communication network
GB2358558B (en) 2000-01-18 2003-10-15 Mitel Corp Packet loss compensation method using injection of spectrally shaped noise
US6738358B2 (en) * 2000-09-09 2004-05-18 Intel Corporation Network echo canceller for integrated telecommunications processing
US7243065B2 (en) * 2003-04-08 2007-07-10 Freescale Semiconductor, Inc Low-complexity comfort noise generator
US7318030B2 (en) * 2003-09-17 2008-01-08 Intel Corporation Method and apparatus to perform voice activity detection
US7649988B2 (en) * 2004-06-15 2010-01-19 Acoustic Technologies, Inc. Comfort noise generator using modified Doblinger noise estimate
US7454010B1 (en) * 2004-11-03 2008-11-18 Acoustic Technologies, Inc. Noise reduction and comfort noise gain control using bark band weiner filter and linear attenuation
US7464029B2 (en) * 2005-07-22 2008-12-09 Qualcomm Incorporated Robust separation of speech signals in a noisy environment

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003529950A (ja) * 1998-11-23 2003-10-07 テレフォンアクチーボラゲット エル エム エリクソン(パブル) 忠実度改善のためのコンフォートノイズ変動特性に基づく音声符号化
JP2003501925A (ja) * 1999-06-07 2003-01-14 エリクソン インコーポレイテッド パラメトリックノイズモデル統計値を用いたコンフォートノイズの生成方法及び装置
JP2004534263A (ja) * 2001-06-12 2004-11-11 グローブスパン ヴィラタ、インコーポレイテッド 擬似快適ノイズを発生させる簡単なスペクトル推定技術を実行する方法とシステム
JP2004536334A (ja) * 2001-06-12 2004-12-02 グローブスパン ヴィラタ、インコーポレイテッド 無音挿入記述子パケット無しで擬似快適ノイズを発生させる方法とシステム

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2461898C2 (ru) * 2008-03-26 2012-09-20 Хуавэй Текнолоджиз Ко., Лтд. Способ и устройство для кодирования и декодирования
US9620129B2 (en) 2011-02-14 2017-04-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result
US9047859B2 (en) 2011-02-14 2015-06-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding and decoding an audio signal using an aligned look-ahead portion
US9595262B2 (en) 2011-02-14 2017-03-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Linear prediction based coding scheme using spectral domain noise shaping
US9595263B2 (en) 2011-02-14 2017-03-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding and decoding of pulse positions of tracks of an audio signal
US9583110B2 (en) 2011-02-14 2017-02-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing a decoded audio signal in a spectral domain
US9384739B2 (en) 2011-02-14 2016-07-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for error concealment in low-delay unified speech and audio coding
US9536530B2 (en) 2011-02-14 2017-01-03 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Information signal representation using lapped transform
JP2014505907A (ja) * 2011-02-14 2014-03-06 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 不活性相の間のノイズ合成を用いるオーディオコーデック
US9153236B2 (en) 2011-02-14 2015-10-06 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio codec using noise synthesis during inactive phases
JP2014510307A (ja) * 2011-02-14 2014-04-24 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン オーディオコーデックにおけるノイズ生成
JP7297803B2 (ja) 2012-12-21 2023-06-26 フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 低ビットレートで背景ノイズをモデル化するためのコンフォートノイズ付加
US9583114B2 (en) 2012-12-21 2017-02-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Generation of a comfort noise with high spectro-temporal resolution in discontinuous transmission of audio signals
JP2018084834A (ja) * 2012-12-21 2018-05-31 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 低ビットレートで背景ノイズをモデル化するためのコンフォートノイズ付加
US10147432B2 (en) 2012-12-21 2018-12-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Comfort noise addition for modeling background noise at low bit-rates
US10339941B2 (en) 2012-12-21 2019-07-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Comfort noise addition for modeling background noise at low bit-rates
US10789963B2 (en) 2012-12-21 2020-09-29 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Comfort noise addition for modeling background noise at low bit-rates
JP2021092816A (ja) * 2012-12-21 2021-06-17 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 低ビットレートで背景ノイズをモデル化するためのコンフォートノイズ付加
JP2016500453A (ja) * 2012-12-21 2016-01-12 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 低ビットレートで背景ノイズをモデル化するためのコンフォートノイズ付加

Also Published As

Publication number Publication date
US7610197B2 (en) 2009-10-27
KR20080042153A (ko) 2008-05-14
US20070050189A1 (en) 2007-03-01
CN101366077A (zh) 2009-02-11
JP4643517B2 (ja) 2011-03-02
KR101018952B1 (ko) 2011-03-02
CN101366077B (zh) 2013-08-14
WO2007027291A1 (en) 2007-03-08

Similar Documents

Publication Publication Date Title
JP4643517B2 (ja) 音声通信システムにおいて快適雑音を生成する方法および装置
JP5351206B2 (ja) 非連続音声送信の際の擬似背景ノイズパラメータ適応送信のためのシステム及び方法
JP3826185B2 (ja) 不連続送信における音声デコーダのハングオーバー期間を評価する方法および音声エンコーダおよびトランシーバ
CN112334980B (zh) 自适应舒适噪声参数确定
JP6542478B2 (ja) インターフレーム時間シフト変動のためのチャネル調整
JP2004525540A (ja) 音声通信中に快適ノイズを発生するための方法およびシステム
CN1168204A (zh) 通信***中噪声抑制方法及装置
US11716584B2 (en) Parametric audio decoding
EP3682445B1 (en) Selecting channel adjustment method for inter-frame temporal shift variations
US20080103765A1 (en) Encoder Delay Adjustment
US7542897B2 (en) Condensed voice buffering, transmission and playback
WO2009064826A1 (en) Method and apparatus for managing speech decoders
JP4437011B2 (ja) 音声符号化装置
CN115527544A (zh) 语音数据传输方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091124

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100219

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101116

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101202

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4643517

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131210

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131210

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131210

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131210

Year of fee payment: 3

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131210

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250