JP5006975B2 - 背景雑音情報の復号化方法および背景雑音情報の復号化手段 - Google Patents

背景雑音情報の復号化方法および背景雑音情報の復号化手段 Download PDF

Info

Publication number
JP5006975B2
JP5006975B2 JP2010547138A JP2010547138A JP5006975B2 JP 5006975 B2 JP5006975 B2 JP 5006975B2 JP 2010547138 A JP2010547138 A JP 2010547138A JP 2010547138 A JP2010547138 A JP 2010547138A JP 5006975 B2 JP5006975 B2 JP 5006975B2
Authority
JP
Japan
Prior art keywords
decoding
transition
sid frame
frame
background noise
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010547138A
Other languages
English (en)
Other versions
JP2011512564A (ja
Inventor
セティアワン パンジ
シャンドル シュテファン
タデイ エルヴ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Unify GmbH and Co KG
Original Assignee
Siemens Enterprise Communications GmbH and Co KG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens Enterprise Communications GmbH and Co KG filed Critical Siemens Enterprise Communications GmbH and Co KG
Publication of JP2011512564A publication Critical patent/JP2011512564A/ja
Application granted granted Critical
Publication of JP5006975B2 publication Critical patent/JP5006975B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Telephonic Communication Services (AREA)

Description

本発明は、音声信号符号化プロセスにおける背景雑音情報の復号化方法および背景雑音情報の復号化手段に関する。
電話機における対話では、アナログの音声伝送に対して、通信開始から帯域幅の制限が行われる。つまり、音声伝送は制限された周波数帯域300Hz〜3400Hzで行われる。
このように制限された周波数帯域は今日のディジタル通信に対する種々の音声信号符号化プロセスに設けられている。このために符号化過程の前にアナログ信号の帯域幅制限が行われる。符号化および復号化のために、前述した300Hz〜3400Hzの周波数での帯域幅制限を行うコーデックが使用され、これを狭帯域音声コーデック(ナローバンドスピーチコーデック)と称している。コーデックとは、オーディオ信号の再構成を目的とした、オーディオ信号のディジタル符号化プロトコルとデータの復号化プロトコルとの双方を含むものであると理解されたい。
狭帯域音声コーデックは、例えば、ITU−T勧告G.729から公知である。ここに説明されている符号化プロトコルによれば、狭帯域の音声信号の伝送は8kbit/sのデータレートで行われる。
また、聴取の印象を改善するために拡張された周波数領域で符号化を行う、いわゆる広帯域音声コーデック(ワイドバンドスピーチコーデック)も知られている。拡張された周波数領域とは例えば50Hz〜7000Hzの範囲である。広帯域音声コーデックは例えばITU−T勧告G.729.EVから公知である。
通常、広帯域音声コーデックに対する符号化プロセスはスケーラブルに構成されている。スケーラビリティとは、ここでは、伝送される符号化データが種々に区切られた複数のブロックを含み、各ブロックが狭帯域成分、広帯域成分および/または符号化音声信号の帯域幅全体を含むことを意味する。こうしたスケーラブルな構成により、一方では受信機側でのダウンリンク適合性が得られ、他方では、伝送チャネルのデータ伝送容量が制限されている場合にも、送信機側および受信機側で伝送されるデータフレームのデータレートおよびサイズを適合化するための簡単な手段が得られる。
コーデックによる伝送データレートを低減するために、ふつう、伝送すべきデータは圧縮される。圧縮は例えば音声データの符号化のために励起信号に対するパラメータとフィルタパラメータとを定めた符号化プロセスによって行われる。この場合、フィルタパラメータおよび励起信号に特有のパラメータは受信機に伝送され、そこでコーデックによって合成されて、主観的な聴取印象の点でもとの音声信号にできるかぎり似た音声信号が形成される。"合成分析(アナリシス・バイ・シンセシス)"と称されるこうしたプロセスにより、求められディジタル化されたサンプリング値そのものは伝送されず、受信機側で音声信号の合成を行うために求められたパラメータが伝送されるのである。
伝送データレートを低減する別の手段として、当技術分野には、不連続伝送法すなわちディスコンティニュアストランスミッションDTXと称される手法も存在する。この手法の基本的な目的は会話の休止期間中に伝送データレートを低減することである。
このために、送信機側で、会話期間および休止期間の識別が行われ、これをボイスアクティビティディテクションVADと称する。これは、音声信号が所定の信号レベルを下回ったときに休止期間を識別するものである。
通常、受信機側の加入者は、休止期間のあいだ、完全な静寂状態を期待してはいない。むしろ、完全な静寂状態は、受信機側の加入者にとって、いらつきの原因となったり、接続切れを疑わせるものとなったりする。このため、いわゆる快適性雑音(コンフォートノイズ)を形成する手法が知られている。
快適性雑音とは、受信機側での静寂フェーズを埋めるために合成された雑音のことである。当該の快適性雑音は、音声信号の伝送のために設けられたデータレートに負荷をかけずに、コネクションが続行している主観的印象を形成するために用いられる。言い換えれば、送信機側での快適性雑音の符号化には、音声データの符号化に必要なコストよりも小さなコストしか必要でない。受信機側で実際に受信され合成される(すなわち復号化される)快適性雑音は低いデータレートのデータとして伝送される。ここで伝送されるデータは、当技術分野では、静寂状態挿入記述子SID(サイレンスインサーションディスクリプション)と称されている。
ただし、従来技術では、広帯域音声コーデック、例えばITU−T規格G.729.1またはG.722.2、あるいは、3GPP規格AMR−WBなどを用いた不連続伝送法を使用する際に、問題が発生する。これらのスケーラブル広帯域音声コーデックは、通常、帯域幅50Hz〜7000Hzの種々のデータレートを支援している。
音声情報を符号化するための可能なデータレートは、例えば、規格G.729.1で用いられる8,12,14,16,…,32kbit/sである。8kbit/sおよび12kbit/sのデータレートは狭帯域50Hz〜4kHzの信号へ適用される。14kbit/s以上のデータレートはそれより上方の周波数帯域4kHz〜7kHzの信号へ適用される。
伝送のあいだ、前述した各データレートを切り換えることができる。ただし、狭帯域のデータレートから広帯域のデータレートへの急激な切り換えは、周知のように、ヒトの耳にとって障害的な作用として聞こえる。こうした急激な移行は、例えば、送信機と受信機とのあいだの伝送網を介したデータストリームの削減すなわちビットストリームトランケイションの結果として、また、伝送網での付加的なコネクションやデータ渋滞(コンジェスション)の結果として、生じる。前述したデータストリームの削減はデータレートを変化させ、最終的には音声信号の伝送を広帯域から狭帯域へ移行させてしまうこともある。
エンコーダで不連続伝送法すなわちDTX法が行われる場合、各データフレームの伝送に対してデータレートの節約が可能である。DTX法は、相応のフレームが休止期間であると識別された場合に適用される。DTX法の適用時には、2つの係数に基づいて、伝送フレームについて低減されたデータレートが達成される。これは、第1に、エンコーダ側から非アクティブなフレームの全てをデコーダ側へ送信しなくてよいということであり、第2に、送信されるSIDフレームないし非アクティブなフレームのビット数が音声データフレームのビット数よりも格段に小さいということである。
当該の方法では、会話期間および休止期間の識別VADに対するエンコーダの関与が必要である。会話期間および休止期間の識別回路により、その時点のサンプリング値を含む符号化すべきフレームが音声信号を含む会話期間となるかあるいは背景雑音を含む休止期間となるかが送信側のエンコーダに報知される。こうした識別によって、エンコーダにおいて、非アクティブな音声フレームの知覚特性を求める措置が講じられる。知覚特性として、例えば、平均エネルギやスペクトル特性、時間特性などが挙げられる。
これに応じて、エンコーダは、特別なフレームであるSIDフレームをデコーダへ送信する。デコーダはSIDフレームに含まれる情報に基づいて快適性雑音を合成する。その際に、デコーダは、SIDフレームに含まれる雑音情報が狭帯域情報であるか広帯域情報であるかを求める。
広帯域のデータレートと狭帯域のデータレートとの切り換え、すなわち、ビットレートスイッチングは、スケーラブル広帯域音声コーデックの通常のシナリオの1つである。通常の会話フェーズすなわち休止がない場合のデータレートの切り換え処理は従来の技術文献に充分に説明されているが、DTXフェーズへの移行時のデータレートの切り換え処理はこれまで知られていない。
したがって、DTXフェーズ中またはDTXフェーズへの移行時のデータレートの切り換え処理方法を実現し、DTXフェーズへの移行前または移行中の狭帯域のデータレートと広帯域のデータレートとの切り換えに最適に応答することに対する強い要求が存在する。
休止期間のあいだ、データレートの削減は不確実である。これは、SIDフレームのデータ占有すなわちビットストリームイロケーションで必要となるビット数が、通常のコーデック演算すなわち会話フェーズのみにおけるコーデック演算でのアクティブな音声データフレームのビット数よりも小さいためである。
ここから、アクティブな会話フェーズのあいだにデータレートを変更し、休止期間すなわちDTXフェーズでは広帯域モードにとどめるシナリオが得られる。ヒトの耳あるいはデコーダ側の受信器にとってきわめて障害的に聞こえるのは、アクティブな音声フレームが狭帯域で復号化され、休止期間の背景雑音が広帯域で再生されるケースである。
このようなケースは、例えばエンコーダ側で伝送網により送信される音声データフレームが分断されるが、伝送網側では広帯域のSIDフレームの伝送容量が充分に残っているような場合に、高い確率で生じる。
しかも、これまで、休止期間中にSIDフレームのデータレートを切り換える手法は知られていない。従来の方法では、通常のコーデック動作において、アクティブな会話フェーズのあいだにしかデータレートを切り換えることができなかったのである。
したがって、本発明の課題は、SIDフレームのデータレートを休止期間中に切り換える手段を提供し、デコーダ側の合成信号の品質を改善することである。
この課題は、独立請求項に記載された特徴によって解決される。
本発明の基本的着想は、帯域幅切換特性(ビットレートスイッチング特性)についての情報をアクティブな会話フェーズ中に求めるということにある。なお、本発明で使用される音声信号符号化プロセスまたは音声信号コーデックのスケーラブル性とは、コーデックが帯域幅の切り換えを行う手段を有することを意味する。
複数の帯域幅切換回路を有する送受信機間でのデータレートの時間特性図である。 Aには帯域幅切換回路の第1のシナリオが示されており、Bには帯域幅切換回路の第2のシナリオが示されている。 狭帯域から広帯域へほぼ一定に移行するデコーダ側の帯域幅切換回路の特性を示す図である。
本発明によれば、会話フェーズのあいだ、デコーダ側で、アクティブな狭帯域音声フレームに対するアクティブな広帯域音声フレームのパーセンテージ情報が形成される。言い換えれば、従来技術で行われてきたような、会話フェーズへの切り換え時点での背景雑音の特性情報の形成は行われない。アクティブな広帯域音声フレームの割合が大きいということは、コーデック側で広帯域が好ましいものとされ、DTXフェーズ中に雑音情報を広帯域で合成ないし復号化する必要があることを意味する。逆に、アクティブな広帯域音声フレームの割合が小さいのであれば、受信されたSIDフレームから広帯域雑音の合成ないし復号化が可能であるとしても、デコーダ側ではDTXフェーズへの移行時に狭帯域雑音を形成する必要があるのである。
本発明の方法によれば、休止期間中にSIDフレームのデータレートの切り換えが可能となる。種々のデータレートを有する雑音情報を切り換えるために、本発明では、それぞれ異なるデータレートを有する雑音情報の所定の割合を精細に求めている。当該の割合は、任意の比での切り換えとは異なり、種々のデータレートを有する雑音情報間で調整可能である。
雑音信号の品質を広帯域または狭帯域の音声信号の品質へ調整および適合できることにより、信号全体すなわち雑音信号および音声信号の双方について、受信機側で信号品質をいちじるしく高めることができる。本発明の方法によれば、デコーダで合成される信号の品質が改善される。
本発明の方法の有利な実施形態は従属請求項に記載されている。
本発明の方法にしたがって、休止期間において雑音信号が所定の品質すなわち広帯域または狭帯域のいずれかで合成される場合、アクティブな会話フェーズの最後の幾つかのフレームにおいて伝送網側でアクティブなデータフレームの削減が起こる。
説明のために、使用されるコーデックが、広帯域の再生を好ましいものとし、伝送網によって過去に広帯域の伝送が優勢に保証されていたケースを考察する。この場合、最初のSIDフレームが受信されるまでは、狭帯域の音声フレームとしてのアクティブな音声フレームは受信を行うデコーダには僅かしか到来しない。
ここで付加的な措置を講じなければ、最初の幾つかのSIDフレームにおいて、狭帯域の音声信号から広帯域の音声信号への急激な移行が生じる。このような移行は、一般的な広帯域の受信条件への再調整にとって重要ではあるが、受信機では障害として受信される。
本発明の有利な実施形態では、DTXフェーズへの移行時に、まず、背景雑音情報が主として狭帯域で復号化され、設定可能な所定の時間が経過した後に、背景雑音情報が主として広帯域で復号化される。こうした移行は有利にはほぼ一定に行われる。つまり、個別の時点での所定の比率係数への移行がほぼ一定に調整される。
本発明の有利な別の実施形態では、迅速な切り換え(ファストスイッチング)が行われ、100msの時間内で、比率係数0の狭帯域の雑音信号品質から比率係数1の広帯域の雑音信号品質へのほぼ一定の移行が行われる。こうした移行はデコーダ側で行われる。
特に有利には、ヒトの主観的な聴取印象に対して、次のような比率係数が有利であると判明している。すなわち、
DTXフェーズへの移行時、狭帯域雑音のみを表す比率係数0
DTXフェーズへ移行してから
20ms経過した時点で比率係数0.09525986892242
40ms経過した時点で比率係数0.19753086419753
60ms経過した時点で比率係数0.36595031245237
80ms経過した時点で比率係数0.62429507696997
100ms経過した時点で広帯域雑音のみを表す比率係数1
へ設定される。
さらに、使用されるコーデックが、狭帯域の再生を好ましいものとし、伝送網によって過去に広帯域の伝送が保証されていなかったケースを考察する。この場合、最初のSIDフレームが受信されるまでは、広帯域の音声フレームとしてのアクティブな音声フレームは受信を行うデコーダには僅かしか到来しない。
本発明の有利な別の実施形態では、DTXフェーズへの移行時に、まず、背景雑音情報が主として広帯域で復号化され、設定可能な所定の時間が経過した後に、背景雑音情報が主として狭帯域で復号化される。こうした移行は、前述した実施形態同様に有利にはほぼ一定に行われ、個別の時点での所定の比率係数への移行が調整される。
本発明の有利な別の実施形態では、迅速な切り換え(ファストスイッチング)が行われ、100msの時間内で、比率係数1の広帯域の雑音信号品質から比率係数0の狭帯域の雑音信号品質へのほぼ一定の移行が行われる。こうした移行はデコーダ側で行われる。
広帯域雑音から狭帯域雑音へほぼ一定に移行させるには、前述した値の比率係数が逆順で設定される。
本発明の他の特徴および利点を実施例に則して詳細に説明する。
図1には、音声データフレームをそのつど所定のデータレートDRで伝送し、さらに第3の時点t3からSIDフレームを伝送することが示されている。
第1の時点t1の前には、広帯域のアクティブな音声フレームが32kbit/sのデータレートで伝送されている。このデータレートは時点t1から22kbit/sへ切り換えられており、第2の時点t2からは12kbit/sへ切り換えられている。12kbit/sのデータレートは狭帯域の音声フレームに相応する。
第3の時点t3で、送信機側の休止期間により、DTXフェーズへの移行が行われる。第3の時点t3からSIDフレームが所定の時間にわたって送信される。
第3の時点t3から、前述した状況が生じる。すなわち、第2の時点t2から第3の時点t3までの時間に先行して狭帯域の音声信号が伝送され、時点t3からSIDフレームによる広帯域の雑音信号が利用されるというケースが生じる。SIDフレームが1フレーム当たり43ビットの長さ、1回の送信当たり20msの時間で送信される場合、データレートは43bit/20ms=2.15kbit/sとなる。
この状況では、デコーダ側で直接に狭帯域音声信号から広帯域雑音信号へ不安定な移行が生じる。こうした急激な移行はヒトの感覚器官にとってきわめて障害的に感じられる。
図2A,図2BにはデータレートDRの時間特性に対するシナリオが示されている。
図2Aには、伝送網の制限または他の条件による制限のために、基本的に8kbit/の狭帯域の伝送が行われ、第1の時点t1から第2の時点t2までの僅かな時間のあいだだけ広帯域の32kbit/sの伝送が行われることが示されている。
図2Bでは、図2Aと逆に、基本的に32kbit/の広帯域の伝送が行われ、第4の時点t4から第5の時点t5までの僅かな時間のあいだだけ狭帯域の8kbit/sの伝送が行われることが示されている。
以下では、図2Aの第3の時点t3および図2Bの第6の時点t6をDTXフェーズへの移行時点とする。
本発明の方法によれば、会話フェーズのあいだ、デコーダ側で、アクティブな狭帯域フレームに対するアクティブな広帯域フレームの割合に関する情報が形成される。
図2Aの実施例ではアクティブな広帯域音声フレームのパーセンテージがきわめて小さく、図2Bの実施例ではアクティブな広帯域音声フレームのパーセンテージが大きい。
図2Aの実施例の第3の時点t3のDTXフェーズへの移行時に、本発明の方法にしたがって狭帯域雑音が形成される。これは、第3の時点t3以降に受信される図示されていないSIDフレームによって広帯域雑音の合成が可能となるにもかかわらず行われる。
これに対して、図2Bの実施例の第6の時点t6のDTXフェーズへの移行時には、本発明の方法にしたがって、雑音情報が広帯域で合成される。
図3には、雑音信号品質HB−SHAREが時間TIMEに関して示されている。図3では、図2Bのシナリオに続いた雑音信号の形成が表されており、デコーダ側で求められたアクティブな広帯域音声フレームのパーセンテージに基づいて、DTXフェーズ中に雑音情報を広帯域で合成する必要があることが求められている。
図3によれば、DTXフェーズへの移行は時点0msで行われる。狭帯域音声信号から広帯域雑音信号への移行をほぼ一定に行う際に、ヒトの感覚器官での主観的な聴取印象にとって適切であると判明しているのは、この時点で専ら狭帯域信号を用いること、つまり、広帯域雑音の割合を0にすることである。時点100msで広帯域雑音の割合は1(100%)となる。時点0msでの狭帯域雑音信号のみの状態から時点100msでの広帯域雑音信号のみの状態への移行をほぼ一定に行うには、DTXフェーズへ移行してからそれぞれ離散的に、
20ms経過した時点(TIME20ms)で
HB−SHARE0.09525986892242
40ms経過した時点(TIME40ms)で
HB−SHARE0.19753086419753
60ms経過した時点(TIME60ms)で
HB−SHARE0.36595031245237
80ms経過した時点(TIME80ms)で
HB−SHARE0.62429507696997
へ設定するのが適切であると判明している。
本発明の別の実施例として、広帯域音声信号から狭帯域雑音信号への移行を説明する。
このために、まず、図2Aのシナリオを若干変更し、第3の時点t3の直前に、図示されていないが、32kbit/sの広帯域伝送への切り換えを行うものとする。ここでの"ピーク"はあるものの、アクティブな広帯域音声フレームのパーセンテージはきわめて小さく、DTXフェーズへの移行時に、狭帯域伝送が優勢であった履歴に基づいて、ひいては、狭帯域の伝送特性の続行が将来期待されていることに基づいて、広帯域で開始されるが狭帯域の雑音信号へ移行する雑音信号が合成される。広帯域音声信号から狭帯域雑音信号への移行をほぼ一定に行うには、DTXフェーズへの移行時に、広帯域の信号のみでこれを開始する必要がある。つまり、広帯域雑音の割合を1とする。時点100msで狭帯域雑音の割合は0となる。DTXフェーズへの移行時の広帯域雑音信号から100msの時点での狭帯域雑音信号への移行を行う場合には、有利には、上掲したHB−SHAREの値を逆順で設定する。これらの値は図3のHB−SHAREの曲線に相応する。

Claims (15)

  1. スケーラブル音声信号符号化プロセスを用いて背景雑音情報を伝送するためのSIDフレームの復号化方法において、
    会話フェーズ中、受信された狭帯域音声フレームに対する受信された広帯域音声フレームの割合を求めるステップ、および、
    DTXフェーズへの移行時に求められた前記割合にしたがってSIDフレームに含まれる背景雑音情報を復号化するステップ
    を有する
    ことを特徴とするSIDフレームの復号化方法。
  2. 前記受信された広帯域音声フレームの割合が前記受信された狭帯域音声フレームに比べて大きいと識別された場合、前記DTXフェーズへの移行時に前記背景雑音情報を主として広帯域で復号化する、請求項1記載のSIDフレームの復号化方法。
  3. 前記DTXフェーズへの移行時に、まず、背景雑音情報を主として狭帯域で復号化し、設定可能な所定の時間が経過した後に、該背景雑音情報を主として広帯域で復号化する、請求項2記載のSIDフレームの復号化方法。
  4. 広帯域での復号化への移行を、広帯域の雑音信号品質と狭帯域の雑音信号品質との比を表す比率係数(HB‐SHARE)によって調整する、請求項3記載のSIDフレームの復号化方法。
  5. 前記比率係数を前記DTXフェーズへの移行時点で0へ設定する、請求項4記載のSIDフレームの復号化方法。
  6. 前記比率係数を、前記DTXフェーズへ移行してから100ms経過した時点で1へ設定する、請求項4または5記載のSIDフレームの復号化方法。
  7. 前記比率係数を、前記DTXフェーズへ移行してから20ms経過した時点で0.09525986892242へ設定し、40ms経過した時点で0.19753086419753へ設定し、60ms経過した時点で0.36595031245237へ設定し、80ms経過した時点で0.62429507696997へ設定する、請求項4から6までのいずれか1項記載のSIDフレームの復号化方法。
  8. 前記受信された広帯域音声フレームの割合が前記受信された狭帯域音声フレームに比べて小さいと識別された場合、前記DTXフェーズへの移行時に前記背景雑音情報を主として狭帯域で復号化する、請求項1記載のSIDフレームの復号化方法。
  9. 前記DTXフェーズへの移行時に、まず、前記背景雑音情報を主として広帯域で復号化し、設定可能な所定の時間が経過した後に、該背景雑音情報を主として狭帯域で復号化する、請求項8記載のSIDフレームの復号化方法。
  10. 狭帯域での復号化への移行を、広帯域の雑音信号品質と狭帯域の雑音信号品質との比を表す比率係数(HB‐SHARE)によって調整する、請求項9記載のSIDフレームの復号化方法。
  11. 前記比率係数を前記DTXフェーズへの移行時点で1へ設定する、請求項10記載のSIDフレームの復号化方法。
  12. 前記比率係数を、前記DTXフェーズへ移行してから100ms経過した時点で0へ設定する、請求項10または11記載のSIDフレームの復号化方法。
  13. 前記比率係数を、前記DTXフェーズへ移行してから20ms経過した時点で0.62429507696997へ設定し、40ms経過した時点で0.36595031245237へ設定し、60ms経過した時点で0.19753086419753へ設定し、80ms経過した時点で0.09525986892242へ設定する、請求項10から12までのいずれか1項記載のSIDフレームの復号化方法。
  14. 請求項1から13までのいずれか1項記載のSIDフレームの復号化方法の各ステップを実行する手段を備えていることを特徴とするコーデック。
  15. 当該のコーデックはITU‐T規格G.729.1にしたがって構成されている、請求項14記載のコーデック。
JP2010547138A 2008-02-19 2009-02-02 背景雑音情報の復号化方法および背景雑音情報の復号化手段 Expired - Fee Related JP5006975B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DE102008009720.9 2008-02-19
DE102008009720A DE102008009720A1 (de) 2008-02-19 2008-02-19 Verfahren und Mittel zur Dekodierung von Hintergrundrauschinformationen
PCT/EP2009/051120 WO2009103609A1 (de) 2008-02-19 2009-02-02 Verfahren und mittel zur dekodierung von hintergrundrauschinformationen

Publications (2)

Publication Number Publication Date
JP2011512564A JP2011512564A (ja) 2011-04-21
JP5006975B2 true JP5006975B2 (ja) 2012-08-22

Family

ID=40790517

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010547138A Expired - Fee Related JP5006975B2 (ja) 2008-02-19 2009-02-02 背景雑音情報の復号化方法および背景雑音情報の復号化手段

Country Status (8)

Country Link
US (1) US8260606B2 (ja)
EP (1) EP2245622B1 (ja)
JP (1) JP5006975B2 (ja)
KR (1) KR101166650B1 (ja)
CN (1) CN101946281B (ja)
DE (1) DE102008009720A1 (ja)
RU (1) RU2454737C2 (ja)
WO (1) WO2009103609A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2980790A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for comfort noise generation mode selection
JP2016038513A (ja) * 2014-08-08 2016-03-22 富士通株式会社 音声切替装置、音声切替方法及び音声切替用コンピュータプログラム
US10049684B2 (en) * 2015-04-05 2018-08-14 Qualcomm Incorporated Audio bandwidth selection

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FI105001B (fi) * 1995-06-30 2000-05-15 Nokia Mobile Phones Ltd Menetelmä odotusajan selvittämiseksi puhedekooderissa epäjatkuvassa lähetyksessä ja puhedekooderi sekä lähetin-vastaanotin
RU2237296C2 (ru) * 1998-11-23 2004-09-27 Телефонактиеболагет Лм Эрикссон (Пабл) Кодирование речи с функцией изменения комфортного шума для повышения точности воспроизведения
US6691084B2 (en) * 1998-12-21 2004-02-10 Qualcomm Incorporated Multiple mode variable rate speech coding
US6631139B2 (en) * 2001-01-31 2003-10-07 Qualcomm Incorporated Method and apparatus for interoperability between voice transmission systems during speech inactivity
EP1808852A1 (en) * 2002-10-11 2007-07-18 Nokia Corporation Method of interoperation between adaptive multi-rate wideband (AMR-WB) and multi-mode variable bit-rate wideband (VMR-WB) codecs
JP4438280B2 (ja) * 2002-10-31 2010-03-24 日本電気株式会社 トランスコーダ及び符号変換方法
PL1897085T3 (pl) 2005-06-18 2017-10-31 Nokia Technologies Oy System i sposób adaptacyjnej transmisji parametrów szumu łagodzącego w czasie nieciągłej transmisji mowy
ATE490454T1 (de) * 2005-07-22 2010-12-15 France Telecom Verfahren zum umschalten der raten- und bandbreitenskalierbaren audiodecodierungsrate
EP1955321A2 (en) 2005-11-30 2008-08-13 TELEFONAKTIEBOLAGET LM ERICSSON (publ) Efficient speech stream conversion
US8260609B2 (en) * 2006-07-31 2012-09-04 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of inactive frames
US8032359B2 (en) * 2007-02-14 2011-10-04 Mindspeed Technologies, Inc. Embedded silence and background noise compression
KR101290622B1 (ko) * 2007-11-02 2013-07-29 후아웨이 테크놀러지 컴퍼니 리미티드 오디오 복호화 방법 및 장치
CN101335000B (zh) * 2008-03-26 2010-04-21 华为技术有限公司 编码的方法及装置

Also Published As

Publication number Publication date
DE102008009720A1 (de) 2009-08-20
WO2009103609A1 (de) 2009-08-27
RU2454737C2 (ru) 2012-06-27
EP2245622B1 (de) 2016-07-13
US8260606B2 (en) 2012-09-04
EP2245622A1 (de) 2010-11-03
KR101166650B1 (ko) 2012-07-23
JP2011512564A (ja) 2011-04-21
RU2010138566A (ru) 2012-03-27
US20110040560A1 (en) 2011-02-17
CN101946281A (zh) 2011-01-12
CN101946281B (zh) 2012-08-15
KR20100125340A (ko) 2010-11-30

Similar Documents

Publication Publication Date Title
US8032359B2 (en) Embedded silence and background noise compression
KR101364983B1 (ko) Sid 프레임을 인코딩하기 위한 방법
US8340959B2 (en) Method and apparatus for transmitting wideband speech signals
JP2010521911A (ja) データパケットのシーケンスを伝送するための装置および方法ならびにデータパケットのシーケンスをデコードするためのデコーダおよび装置
KR101462293B1 (ko) 고정된 배경 잡음의 평활화를 위한 방법 및 장치
JP2010540992A (ja) ノイズ生成装置及び方法
US8787490B2 (en) Transmitting data in a communication system
JP5415460B2 (ja) 背景ノイズ情報を符号化する方法および手段
JP5006975B2 (ja) 背景雑音情報の復号化方法および背景雑音情報の復号化手段
WO2021244418A1 (zh) 一种音频编码方法和音频编码装置
KR100465318B1 (ko) 광대역 음성신호의 송수신 장치 및 그 송수신 방법
JPWO2003067792A1 (ja) ディジタル回線伝送装置
JP3587920B2 (ja) 送信方法及び受信方法
JP2001100796A (ja) オーディオ信号符号化装置

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120426

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120525

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150601

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5006975

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees