JP3927159B2 - 可変レートボコーダーにおけるエンコーディングレート選択決定のための方法および装置 - Google Patents

可変レートボコーダーにおけるエンコーディングレート選択決定のための方法および装置 Download PDF

Info

Publication number
JP3927159B2
JP3927159B2 JP2003297413A JP2003297413A JP3927159B2 JP 3927159 B2 JP3927159 B2 JP 3927159B2 JP 2003297413 A JP2003297413 A JP 2003297413A JP 2003297413 A JP2003297413 A JP 2003297413A JP 3927159 B2 JP3927159 B2 JP 3927159B2
Authority
JP
Japan
Prior art keywords
rate
encoded
frames
frame
background noise
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2003297413A
Other languages
English (en)
Other versions
JP2004046228A (ja
Inventor
アンドリュー・ピー・デジャコ
ウイリアム・アール・ガードナー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=23106989&utm_source=***_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JP3927159(B2) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2004046228A publication Critical patent/JP2004046228A/ja
Application granted granted Critical
Publication of JP3927159B2 publication Critical patent/JP3927159B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Dc Digital Transmission (AREA)

Description

本発明はボコーダーに関し、例えば、可変レートボコーダーにおけるスピーチエンコーディングレート決定のための発明および、改良されたその装置と方法に関する。
可変レートスピーチ圧縮システムは、エンコーディングが始まる以前に、レート決定アルゴリズムのある種のフォーム(即ち、形式)を使用することが一般的である。このレート決定アルゴリズムは、高いビットレート・エンコーディング・スキームを、スピーチが在る処のオーディオ信号のセグメントヘアサインすると共に、サイレント(即ち、無音)セグメントのためのより低いレート・エンコーディング・スキームが在る。この方法では、再構築されたスピーチのボイス(以下、音声と称する)の質が高く保たれる期間において、より低いビットレートが達成される。このように、効率的にオペレートするために、可変レートスピーチコーダーは、種々の背景雑音環境において無音とスピーチとを識別することができるようなロバストレート(即ち、粗いレート)の決定アルゴリズムを要する。
可変レートスピーチ圧縮システムと、可変レートボコーダーの一例は、米国特許番号07/713,661、出願日1991年6月11日、その発明の名称は「可変レートボコーダー」であり、本願発明の譲受人に譲渡されたものであり、この内容は本発明の参考文献である。
可変レートボコーダのこの改良においては、入力スピーチは、符号励起線形予測符号化(CELP)技術を使ってエンコードされる。スピーチアクティビティのレベルは、音声化されたスピーチに加えて、背景雑音を含む入力オーディオ・サンプルにおけるエネルギーから決定される。このボコーダーが種々のレベルの背景雑音のもとでエンコードし高い質の音声を提供するためには、適合する適応閾値技術が、レート決定アルゴリズム上の背景雑音の影響のため補償することが要求される。
ボコーダーは主として、例えばセルラーテレホンまたは、パーソナル・コミュニケーション・デバイス等のような通信デバイスに使用され、それは、送信のためのデジタル形式に変換される処のアナログオーディオ信号へのデジタル信号圧縮を提供するものである。モバイル環境においては、セルラーテレホンまたは、パーソナル・コミュニケーション・デバイス等が使用され得るが、高レベルの背景雑音エネルギーは、レート決定アルゴリズムがレート決定アルゴリズムに基づく信号エネルギーを使用して、低エネルギーの非音声音と背景雑音の静粛(即ち、サイレンス)とを識別することを困難なものにしている。このように、非音声音の周波数は低ビットレートにエンコードされ、その音声質は、子音として例えば、”s”,”x”,”ch”,”sh”,”t”などのような再構築されたスピーチにおいて、質的低下を生ずる。
背景雑音のエネルギーにおける単なるベースレート決定を行うボコーダーは、閾値の設定における背景雑音に関係する処の信号強度を考慮することを忘れてしまう。背景雑音において単にその閾値レベルを基礎にするボコーダーは、背景雑音が上昇するときには、それらの閾値レベルを1つに合わせて圧縮処理を行おうとする。また、その信号レベルが固定されて継続されるような場合には、閾値レベルを設定するためには、確かにこれが正しい手法ではあるが、しかし、その信号レベルが背景雑音を伴って上昇するときは、その閾値レベルを圧縮することは、最適な解決策では決してない。よって、その信号強度を考慮する処の閾値レベル設定のための代替的な方法は、可変レートボコーダーに必要とされるものである。
背景雑音エネルギーに基づくベースレート決定を行うボコーダーを通しての音楽再生中においては、最終的な問題がまだ存在する。人がしゃべるときには、息継ぎするためのポーズ(即ち、休止)しなければならず、これは、適切な背景雑音レベルにリセット(即ち、再設定)するための閾値を許容するものである。しかしながら、ボコーダーを通しての音楽の伝送において、例えば、ミュージック・オン・ホールド・コンディション(即ち、状況)において起こるような、ポーズが無くて、フルレートよりも少ないレートでコード化されるべき音楽が演奏開始されるまでには、その閾値は上昇し続けることがある。このような状況においては、その可変レートコーダーは、音楽と背景雑音とを混同してしまう。
本発明の第1の目的は、背景雑音としての低エネルギーの非音声音スピーチのコーディングの確率を削減することによる一方法を提供することである。本発明においては、入力信号は、高周波数成分と低周波数成分とにフルタリングされる。このフルタリングされた入力信号の成分は、次に、スピーチの存在を検出するためにそれぞれ分析される。なぜならば、非音声音は高い周波数成分をもっており、その強度は高い周波数バンドに係わり、このバンドにおいては、全周波数バンドにわたる背景雑音に比較すれば、その背景雑音からの識別が更にしやすい故である。
本発明の第2の目的は、信号エネルギーのみならず背景雑音エネルギーをも考慮した、閾値レベルの設定をすることによる一手段を提供することにある。本発明において、音声検知の閾値設定は、その入力信号の信号対雑音比(SNR)の予測に基づいている。例示する実施例によれば、信号エネルギーは、アクティブスピーチの時間中における、その最大信号エネルギーとして予測され、また、背景雑音エネルギーは、無音の時間中におけるその最大信号エネルギーとして予測される。
本発明の第3の目的は、可変レートボコーダーを通る音楽のためのコーディングの一方法を提供することである。例示する実施例によれば、レート選択装置は、閾値レベルが上昇した閾値を超過する連続的なフレームの数を検知して、そのフレームの数の周期性のチェックを行う。もし、その入力信号に周期的があれば、音楽が在ることを示している。音楽の存在が検知されると、その信号がフルレートでコード化されるようなレベルに閾値が設定される。
本発明は、可変レートボコーダーにおけるエンコーディングレートの選択決定のための発明装置および、その改良された方法である。
本発明は、「ボコーダによりエンコードされた複数のフレームに残存フレームを付加する方法において、第1のレートで予め定められた数の連続するフレームがエンコードされていることを検出し、第1のレートよりも小さい第2のレートで次の連続するフレームがエンコードされなければならないことを決定し、第1のレートでエンコードされる次の連続するフレームにより開始される連続する残存フレームの数を選択し、その選択した数は背景雑音レベルの推定値に依存していることを特徴とする。」とする。
図1を参照すると、入力信号S(n)は、サブバンドエネルギー計算用の構成要素4および、サブバンドエネルギー計算用の構成要素6に供給される。この入力信号S(n)は、オーディオ信号と背景雑音とから構成されている。このオーディオ信号は一般的にはスピーチであるが、もちろん音楽であってもよい。本発明の実施例においては、入力信号S(n)は、0〜4kHzの周波数を有し、これはほぼ人間のスピーチ信号のバンド幅である。
例示する実施例においては、4kHzの入力信号S(n)は、2つに分離したサブバンドにフィルタリングされる。この2つに分離したサブバンドは、各々、0〜2kHzの間および、2〜4kHzの間に存在する。例示する実施例においては、入力信号は、サブバンドフィルタによって、複数のサブバンドに分離されてもよく、このデザインは、従来技術で良く知られており、1994年2月1日出願の米国特許番号08/189,819「周波数選択アダプティプ(適応)フィルタリング」に詳細開示され、本願発明の譲受人に譲渡されたものであり、この内容の開示は文献の援用である。
サブフィルタのインパルス・レスポンスは、ローパスフィルタのためのものとしては、hL(n)で示され、ハイパスフィルタのためのものとしては、hH(n)で示されている。その信号のサブバンド構成要素の結果得られるエネルギーは、例えば、値RL(0)および値RH(0)を与えるために計算され得る。すなわち、従来技術で良く知られているように、単純に、サブバンドフィルタ出力サンプルのスクエア(即ち、二乗)を合算することによって得られる。
好適実施例によっては、入力信号S(n)がサブバンドエネルギー計算用の構成要素4に供給されたとき、入力フレームの低周波数構成要素であるRL(0)が、下式により算出される。
Figure 0003927159
ただし、 Lは、インパルス・レスポンスhL(n)をもつローパスフィルタにおいて、タップ(tap)する数である。
また、このRS(i)は、下式で与えられる入力信号S(n)の自己相関関数(autocorrelation)である。
Figure 0003927159
ただし、 Nは、フレーム中のサンプル数である。
また、RhLは、下式で与えられるローパスフィルタhL(n)の自己相関関数である。
Figure 0003927159
高周波数RH(0)は、サブバンドエネルギー計算用の構成要素6において、計算される。
サブバンドフィルタの自己相関関数の値は、計算ロード(即ち、負荷)を削減するため、先に計算され得る。さらに、計算された幾つかのRS(i)の値は、入力信号S(n)のコーディングにおける他の計算に使われる。そしてこれは、本発明のエンコーディングレート選択方法のネット(即ち、正味)の計算負担を削減する。例えば、LPCフィルタ・タップ値の計算については、上述の従来技術では良く知られており、米国特許番号08/004,484には詳述されている。もし、あるものが10タップLPCフィルタを要する方法でスピーチをコード化すると仮定した場合、RS(i)だけは計算が必要であり(但し、i は、11〜L-1)、更にこれらに加えて、この計算は信号のコーディングにおいても利用される。なぜならば、RS(i)(但し、i は、0〜10)は、LPCフィルタ・タップ値の計算において使用される。例示する実施例では、これらのサブバンドフィルタは17タップ、即ち、L=17である。
サブバンドエネルギー計算用の構成要素4は、計算されたRL(0)の値を供給し、そして、サブバンドエネルギー計算用の構成要素6は、計算されたRH(0)の値を、サブバンドレート決定用の構成要素14へ供給する。サブバンドレート決定用の構成要素12は、RL(0)の値を、2つの所定の閾値TL1/2とTLfullとに対して比較を行い、圧縮に従って、示唆されたエンコーディングレートRATELをアサインする。
そのレートのアサイメントは、次記に従って処理される。
RATEL =1/8レート RL(0)≦TL1/2 (4)
RATEL = 半レート TL1/2<RL(0)≦TLfull (5)
RATEL = フルレート RL(0)>TLfull (6)
サブバンドレート決定用の構成要素14は、同様な取扱いによって、高い周波数エネルギー値RH(0)に従って、異なる2つの閾値TH1/2およびTHfullに基づき、示唆するエンコーディングレートRATEHを選択する。サブバンドレート決定用の構成要素12は、示唆されたエンコーディングレートRATELをエンコーディングレート選択用の構成要素16へ供給し、一方、サブバンドレート決定用の構成要素14は、示唆されたエンコーディングレートRATEHをこのエンコーディングレート選択用の構成要素16へ供給する。例示する実施例においては、このエンコーディングレート選択用の構成要素16は、2つの示唆するレートの高い方を選択し、選択された「エンコードレート」として、高いレートを提供する。
また、サブバンドエネルギー計算用の構成要素4は、低い周波数エネルギーの値RL(0)も、閾値適応用の構成要素8に供給する。そしてここでは、次の入力フレームのために、閾値TL1/2およびTLfullが計算される。同様に、サブバンドエネルギー計算用の構成要素6は、高い周波数エネルギーの値RH(0)を、閾値適応用の構成要素10に供給する。そしてここでも、次の入力フレームのために、閾値TH1/2およびTHfullが計算される。
閾値適応用の構成要素8は、低い周波数エネルギー値RL(0)を受け取ると、S(n)が背景雑音またはオーディオ信号を含むか否かを判定する。例示する実施例では、オーディオ信号が在るか否かをこの閾値適応用の構成要素8が判定することによる方法としては、下式で与えられる「正規化自己相関関数機能」(以下、NACFと略称する)によって審査する方法である。
Figure 0003927159
ただし、 e(n)は、LPCフィルタによる、入力信号S(n)のフィルタリングからの結果をもたらすホルマント・残留信号。
LPCフィルタによる、信号のフィルタリングや、設計については良く知られており、前述された米国特許番号08/004,484に詳述されている。入力信号S(n)は、LPCフィルタによりフィルタリングされ、ホルマントの相互作用を取り除く。NACFは、オーディオ信号が存在するか否かを判断するために、再び閾値と比較される。もし、NACFが所定の閾値よりも大きい場合は、これは、スピーチ又は音楽のようなオーディオ信号の存在を特徴づける周期性を有する入力フレームであることを示している。ここで、スピーチおよび音楽のパーツには周期性はないが、NACFのローバリュー(即ち、極小値)を示すであろうし、背景雑音は通常、どんな周期性も現わさないと共に、NACFのローバリューをほとんど常に示す。
S(n)が背景雑音を含んでいると判断されると、NACFの値は、閾値T H1よりも小さく、よって、RL(0)の値は、現在の背景雑音の予測値BGNLを更新するために使用される。ここに例示した実施例では、T H1は0.35である。
RL(0)は、再び、現在の背景雑音の予測値BGNLと比較される。もし、RL(0)がこの予測値BGNLより小さい場合には、NACFの値を無視して、この予測値BGNLがRL(0)に等しいとして設定される。
背景雑音の予測値BGNLは、NACFが閾値T H1よりも小さい場合にのみ増加される。もし、このRL(0)がBGNLよりも大きく、そしてNACFがT H1よりも小さい場合には、背景雑音エネルギーを示すBGNLが、αl・BGNLとして設定される。なお、αlは1以上の数である。なお、ここで例示する実施例では、αlは1.03である。BGNLは、NACFがT H1より小さい限り増加し続ける。また、背景雑音の予測値BGNLが最大値BGNmaxに設定される時点において、BGNLが所定のこの最大値BGNmaxに達するまでは、RL(0)が現在の背景雑音の予測値BGNLより大きい。
もし、オーディオ信号が検出された場合には、第2の閾値T H2を超過するNACFの値によって表され、この信号エネルギー予測値SLが更新される。例示する実施例では、T H2は0.5に設定される。RL(0)の値は、現在のローパス信号エネルギー予測値SLに対して比較される。もし、RL(0)がこの現在のローパス信号エネルギー予測値SLよりも大きい場合は、SLはRL(0)に等しく設定される。もし逆に、RL(0)がこの予測値SLよりも小さい場合は、再度、NACFがT H2より大きい場合にだけ、SLは、α2・SLとして設定される。なお、ここで例示する実施例では、α2は0.96である。
閾値適応用の構成要素8は、次に、下式(8)に従って信号対雑音比の予測値を計算する。
Figure 0003927159
閾値適応用の構成要素8は、次に、下式(9)〜(12)に従って、量子化信号対雑音比のインデックスISNRL を計算する。
Figure 0003927159
ただし、 nintとは、最も近い整数にラウンド(例えば、四捨五入)する機能値である。
閾値適応用の構成要素8は、信号対雑音比のインデックスISNRLへの信号に従って、2つのスケーリングファクタ(即ち、計数逓減率)KL1/2およびKLfullを選択または計算する。例えば、次に示す表1にはスケーリングファクタ値のルックアップテーブル1が提供されている。
Figure 0003927159
これらの2つの値は、下式に従ってレート選択のための閾値を計算するのに使用される。
TL1/2 = KL1/2・BGNL (11)
TLfull = KLfull・BGNL (12)
ただし、TL1/2は、低周波数ハーフ(半)レート閾値、 TLfullは、低周波数フルレート閾値。
閾値適応用の構成要素8は、レート決定用の構成要素12に、TL1/2およびTLfullを供給する。一方、閾値適応用の構成要素10は、レート決定用の構成要素14に、TH1/2およびTHfullを供給する。
オーディオ信号エネルギーの予測値Sの初期値は次のように設定される。(但し、SL又はSHでもよい)。
初期の信号エネルギーの予測値SINITは、−18.0dBMOで、3.17dBmOは、フル・サイン(sine)曲線の信号強度を示す。例示する実施例では、−8031〜8031の増幅範囲でのデジタルのサイン曲線である。また、SINITは、アコースティック信号が存在することが決定されるまで使用される。
1つのアコースティック信号が最初に検出されることによる方法は、1つの閾値に対してNACFを比較することである。例示する実施例では、このNACFは、連続する10フレームのための閾値を超過しなければならない。このコンディションが合致した後には、信号エネルギーの予測値Sは、先の10フレームにその最大の信号エネルギー値が設定される。
背景雑音の予測値BGNLの初期値は、BGNmaxに初めは設定される。サブバンドフレームエネルギー値が受け取られると直ちに、(但し、その値はBGNmaxよりも小さいが)
背景雑音の予想値が、受け取られたサブバンドエネルギーレベルの値にリセットされる。そして、前述されたように、背景雑音の予想値BGNLの生成が行われる。
好適実施例においては、フルレート・スピーチフレームの連続が続くときには、ハングオーバー・コンディションがアクチュエートされる。そして、ローレートのフレームが検出される。例示する実施例において、4つの連続するスピーチフレームが、1フレームによりフルレートでエンコードされるときには、エンコーディングレート(ENC0RDING RATE)がフルレートよりも小さく設定され、その計算された信号対雑音比は、所定の最小SNRよりも小さく、また、そのフレームのためのエンコーディングレートがフルレートで設定される。なお、例示する実施例では、この所定の最小SNRは、式(8)の規定によれば、27.5dBである。
好適実施例においては、ハングオーバーフレームの数は、信号のノイズレシオ(即ち、S/N)に対する一作用機能である。例示する実施例では、ハングオーバーフレームの数は、次のように規定されている。
#ハングオーバーフレーム番号=1 22.5<SNR<27.5 (13)
#ハングオーバーフレーム=2 SNR≦27.5 (14)
#ハングオーバーフレーム=0 SNR≧27.5 (15)
本発明はまた、音楽の存在を検知するための一方法を提供することでもあり、前述したように、ポーズの無いことで、その背景雑音の測定が再設定されることを許容する。音楽の存在を検知する方法とは、コールの最初に音楽成分が存在しないことを推量することである。これは、本発明のエンコーディングレート選択装置をして、適切に推測し、初期の背景雑音エネルギーBGNinitに初期化することを許容している。なぜならば、背景雑音と異なる音楽は、ある周期的な特徴を有している。本発明は、背景雑音から音楽を区別するためにNACFの値を検証している。また、本発明の音楽検知方法は、下式に従って平均NACFの値を計算する。
Figure 0003927159
ただし、 NACFは、式(7)に規定されている。
また、Tは、背景雑音の予測された値が、初期の背景雑音の予測値BGNINITから増加していく場合における連続するフレーム数である。
もし、背景雑音BGNが、フレームの所定の値Tのために増加していき、NACFAVEが所定の閾値を超過すると、音楽の存在が検知され、背景雑音BGNは予測値BGNINITにリセットされる。ここで、注意することは、このT値は、エンコーディングレートがフルレートより下に降下しない十分な低さにセットされることである。したがって、このT値は、BGNintおよびアコースティック信号の一機能として設定されるべきである。
好適実施例の前述の内容は、当業者だれもが本発明品を作り又は利用できるようにするために提供されている。したがって、これらの好適実施例の種々な改良については当業者には明らかであり、また、ここで定義された本発明の要旨は、その発明の能力を使うことなく、他の実施例にも応用され得るものである。以上のように、本発明は、ここで開示された実施例に限るものではなく、この要旨およびここに開示の発明を有した広い範囲にも一致するものである。
本発明のブロック図。

Claims (27)

  1. ボコーダによりエンコードされた複数のフレームにハングオーバーフレームを付加する方法において、
    第1のレートで予め定められた数の連続するフレームがエンコードされていることを検出し、
    第1のレートよりも小さい第2のレートで次の連続するフレームがエンコードされるべきであることを決定し、前記決定はレート決定アルゴリズムに基づいており、
    第2のレートではなく第1のレートで次の連続するフレームがエンコードされるべきかどうかを決定し、前記決定は背景雑音レベルの推定値に依存しており、
    第2のレートではなく第1のレートで次の連続するフレームがエンコードされるべきかどうかを決定する前記ステップが、第1のレートで次の連続するフレームがエンコードされるべきであるとの決定を与える場合、第1のレートでエンコードするために次の連続するフレームで始まる連続するハングオーバーフレームの数を選択し、その数は背景雑音レベルの推定値に依存しているステップを含むハングオーバーフレーム付加方法。
  2. 前記選択は信号対雑音比の関数であるハングオーバーフレームの数を選択するステップを含んでいる請求項1記載の方法。
  3. 前記検出は、予め定められた数の連続するフレームが最大のサポート可能なレートでエンコードされていることを検出するステップを含んでいる請求項1記載の方法。
  4. 前記検出は、予め定められた数の連続するフレームが実質上活性のスピーチを含んでいるように分類されたフレームをエンコードすることを意図するレートでエンコードされたことを検出するステップを含んでいる請求項1記載の方法。
  5. 前記決定は、次の連続するフレームが最小のサポート可能なレートでエンコードされるべきであることを決定するステップを含んでいる請求項1記載の方法。
  6. 前記決定は、次の連続するフレームが実質上背景雑音を含むか沈黙であるとして分類されたフレームをエンコードすることを意図するレートでエンコードされるべきであることを決定するステップを含んでいる請求項1記載の方法。
  7. 背景雑音レベルの推定値を生成するステップをさらに含んでいる請求項1記載の方法。
  8. 背景雑音レベルの推定値に基づいて信号対雑音比を計算するステップをさらに含んでいる請求項7記載の方法。
  9. 前記選択は信号対雑音比の関数であるハングオーバーフレームの数を選択するステップを含んでいる請求項8記載の方法。
  10. ボコーダによりエンコードされた複数のフレームにハングオーバーフレームを付加する装置において、
    第1のレートで予め定められた数の連続するフレームがエンコードされていることを検出する手段と、
    第1のレートよりも小さい第2のレートで次の連続するフレームがエンコードされるべきであることを決定し、前記決定はレート決定アルゴリズムに基づいている手段と、
    第2のレートではなく第1のレートで次の連続するフレームがエンコードされるべきかどうかを決定し、前記決定は背景雑音レベルの推定値に依存している手段と、
    第2のレートではなく第1のレートで次の連続するフレームがエンコードされるべきかどうかを決定する前記手段が、第1のレートで次の連続するフレームがエンコードされるべきであるとの決定を与える場合、第1のレートでエンコードするために次の連続するフレームで始まる連続するハングオーバーフレームの数を選択し、その数は背景雑音レベルの推定値に依存している手段とを含むハングオーバーフレーム付加装置。
  11. 前記選択する手段は、信号対雑音比の関数であるハングオーバーフレームの数を選択する手段を含んでいる請求項10記載の装置。
  12. 前記検出する手段は、予め定められた数の連続するフレームが最大のサポート可能なレートでエンコードされていることを検出する手段を含んでいる請求項10記載の装置。
  13. 前記検出する手段は、予め定められた数の連続するフレームが実質上活性のスピーチを含んでいるとして分類されたフレームをエンコードすることを意図するレートでエンコードされていることを検出する手段を含んでいる請求項10記載の装置。
  14. 前記決定する手段は、次の連続するフレームが最小のサポート可能なレートでエンコードされるべきであることを決定する手段を含んでいる請求項10記載の装置。
  15. 前記決定する手段は、次の連続するフレームが実質上背景雑音を含むか沈黙であるとして分類されたフレームをエンコードすることを意図するレートでエンコードされるべきであることを決定する手段を含んでいる請求項10記載の装置。
  16. 背景雑音レベルの推定値を生成する手段をさらに含んでいる請求項10記載の装置。
  17. 背景雑音レベルの推定値に基づいて信号対雑音比を計算する手段をさらに含んでいる請求項16記載の装置。
  18. 前記選択する手段は、信号対雑音比の関数であるハングオーバーフレームの数を選択する手段を含んでいる請求項17記載の装置。
  19. ボコーダによりエンコードされた複数のフレームにハングオーバーフレームを付加する装置において、
    第1のレートで予め定められた数の連続するフレームがエンコードされていることを検出し、第1のレートよりも小さい第2のレートで次の連続するフレームがエンコードされるべきであることを決定し、前記決定はレート決定アルゴリズムに基づいており、第2のレートではなく第1のレートで次の連続するフレームがエンコードされるべきかどうかを決定し、前記決定は背景雑音レベルの推定値に依存しており、前記第2のレートではなく第1のレートで次の連続するフレームがエンコードされるべきかどうかの決定が、第1のレートで次の連続するフレームがエンコードされるべきであるとの決定を与える場合、第1のレートでエンコードするために次の連続するフレームで始まる連続するハングオーバーフレームの数を選択し、その数は背景雑音レベルの推定値に依存するように構成されたエンコーディングレート選択装置を具備するハングオーバーフレーム付加装置。
  20. 前記エンコーディングレート選択装置はさらに、信号対雑音比の関数であるハングオーバーフレームの数を選択するように構成されている請求項19記載の装置。
  21. 前記エンコーディングレート選択装置は、予め定められた数の連続するフレームが最大のサポート可能なレートでエンコードされていることを検出するように構成されている請求項19記載の装置。
  22. 前記エンコーディングレート選択装置は、予め定められた数の連続するフレームが実質上活性のスピーチを含むとして分類されたフレームをエンコードすることを意図するレートでエンコードされたことを検出するように構成されている請求項19記載の装置。
  23. 前記エンコーディングレート選択装置はさらに、次の連続するフレームが最小のサポート可能なレートでエンコードされるべきであることを決定するように構成されている請求項19記載の装置。
  24. 前記エンコーディングレート選択装置はさらに、次の連続するフレームが実質上背景雑音を含むか沈黙であるとして分類されたフレームをエンコードすることを意図するレートでエンコードされるべきであることを決定するように構成されている請求項19記載の装置。
  25. さらに、前記エンコーディングレート選択装置に結合され、背景雑音レベルの推定値を生成するように構成されている閾値適応装置を具備している請求項19記載の装置。
  26. さらに、前記閾値適応装置に結合されてフレームエネルギレベルの推定値を生成するように構成されているエネルギ計算装置を具備し、前記閾値適応装置はさらにエネルギ計算装置からフレームエネルギレベルの推定値を受取り、フレームエネルギレベルの推定値と背景雑音レベルの推定値とに基づいて信号対雑音比を計算するように構成されている請求項25記載の装置。
  27. 前記エンコーディングレート選択装置はさらに、信号対雑音比の関数であるハングオーバーフレームの数を選択するように構成されている請求項26記載の装置。
JP2003297413A 1994-08-10 2003-08-21 可変レートボコーダーにおけるエンコーディングレート選択決定のための方法および装置 Expired - Lifetime JP3927159B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US08/288,413 US5742734A (en) 1994-08-10 1994-08-10 Encoding rate selection in a variable rate vocoder

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP50740496A Division JP3502101B2 (ja) 1994-08-10 1995-08-01 可変レートボコーダーにおけるエンコーディングレート選択決定のための方法および装置

Publications (2)

Publication Number Publication Date
JP2004046228A JP2004046228A (ja) 2004-02-12
JP3927159B2 true JP3927159B2 (ja) 2007-06-06

Family

ID=23106989

Family Applications (8)

Application Number Title Priority Date Filing Date
JP50740496A Expired - Lifetime JP3502101B2 (ja) 1994-08-10 1995-08-01 可変レートボコーダーにおけるエンコーディングレート選択決定のための方法および装置
JP2003297412A Withdrawn JP2004004971A (ja) 1994-08-10 2003-08-21 可変レートボコーダーにおけるエンコーディングレート選択決定のための方法および装置
JP2003297413A Expired - Lifetime JP3927159B2 (ja) 1994-08-10 2003-08-21 可変レートボコーダーにおけるエンコーディングレート選択決定のための方法および装置
JP2007145736A Withdrawn JP2007293355A (ja) 1994-08-10 2007-05-31 可変レートボコーダのエンコードレート決定方法および装置
JP2007145738A Expired - Lifetime JP4680958B2 (ja) 1994-08-10 2007-05-31 可変レートボコーダのエンコーディングレート決定方法および装置
JP2007145735A Expired - Lifetime JP4680956B2 (ja) 1994-08-10 2007-05-31 エンコードレート選択方法および装置
JP2007145737A Expired - Lifetime JP4680957B2 (ja) 1994-08-10 2007-05-31 可変レートボコーダにおけるスピーチエンコーディングレート決定の方法および装置
JP2011095137A Expired - Lifetime JP4870846B2 (ja) 1994-08-10 2011-04-21 可変レートボコーダのエンコードレート決定方法および装置

Family Applications Before (2)

Application Number Title Priority Date Filing Date
JP50740496A Expired - Lifetime JP3502101B2 (ja) 1994-08-10 1995-08-01 可変レートボコーダーにおけるエンコーディングレート選択決定のための方法および装置
JP2003297412A Withdrawn JP2004004971A (ja) 1994-08-10 2003-08-21 可変レートボコーダーにおけるエンコーディングレート選択決定のための方法および装置

Family Applications After (5)

Application Number Title Priority Date Filing Date
JP2007145736A Withdrawn JP2007293355A (ja) 1994-08-10 2007-05-31 可変レートボコーダのエンコードレート決定方法および装置
JP2007145738A Expired - Lifetime JP4680958B2 (ja) 1994-08-10 2007-05-31 可変レートボコーダのエンコーディングレート決定方法および装置
JP2007145735A Expired - Lifetime JP4680956B2 (ja) 1994-08-10 2007-05-31 エンコードレート選択方法および装置
JP2007145737A Expired - Lifetime JP4680957B2 (ja) 1994-08-10 2007-05-31 可変レートボコーダにおけるスピーチエンコーディングレート決定の方法および装置
JP2011095137A Expired - Lifetime JP4870846B2 (ja) 1994-08-10 2011-04-21 可変レートボコーダのエンコードレート決定方法および装置

Country Status (20)

Country Link
US (1) US5742734A (ja)
EP (6) EP1703493B1 (ja)
JP (8) JP3502101B2 (ja)
KR (3) KR100455826B1 (ja)
CN (5) CN1512488A (ja)
AT (5) ATE235734T1 (ja)
AU (1) AU711401B2 (ja)
BR (2) BR9510780B1 (ja)
CA (3) CA2171009C (ja)
DE (5) DE69533881T2 (ja)
DK (3) DK1233408T3 (ja)
ES (5) ES2299122T3 (ja)
FI (5) FI117993B (ja)
HK (2) HK1015185A1 (ja)
IL (1) IL114874A (ja)
MX (1) MX9600920A (ja)
PT (3) PT1239465E (ja)
TW (1) TW277189B (ja)
WO (1) WO1996005592A1 (ja)
ZA (1) ZA956081B (ja)

Families Citing this family (65)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6389010B1 (en) 1995-10-05 2002-05-14 Intermec Ip Corp. Hierarchical data collection network supporting packetized voice communications among wireless terminals and telephones
US7924783B1 (en) 1994-05-06 2011-04-12 Broadcom Corporation Hierarchical communications system
TW271524B (ja) * 1994-08-05 1996-03-01 Qualcomm Inc
US5742734A (en) 1994-08-10 1998-04-21 Qualcomm Incorporated Encoding rate selection in a variable rate vocoder
US6292476B1 (en) * 1997-04-16 2001-09-18 Qualcomm Inc. Method and apparatus for providing variable rate data in a communications system using non-orthogonal overflow channels
JPH09162837A (ja) * 1995-11-22 1997-06-20 Internatl Business Mach Corp <Ibm> 圧縮方式を動的に変更する通信方法及び装置
JPH09185397A (ja) * 1995-12-28 1997-07-15 Olympus Optical Co Ltd 音声情報記録装置
US5794199A (en) * 1996-01-29 1998-08-11 Texas Instruments Incorporated Method and system for improved discontinuous speech transmission
FI964975A (fi) * 1996-12-12 1998-06-13 Nokia Mobile Phones Ltd Menetelmä ja laite puheen koodaamiseksi
JPH10210139A (ja) * 1997-01-20 1998-08-07 Sony Corp 音声記録機能付き電話装置及び音声記録機能付き電話装置の音声記録方法
US6202046B1 (en) 1997-01-23 2001-03-13 Kabushiki Kaisha Toshiba Background noise/speech classification method
US5920834A (en) * 1997-01-31 1999-07-06 Qualcomm Incorporated Echo canceller with talk state determination to control speech processor functional elements in a digital telephone system
DE19742944B4 (de) * 1997-09-29 2008-03-27 Infineon Technologies Ag Verfahren zum Aufzeichnen eines digitalisierten Audiosignals
US6240386B1 (en) 1998-08-24 2001-05-29 Conexant Systems, Inc. Speech codec employing noise classification for noise compensation
US7072832B1 (en) * 1998-08-24 2006-07-04 Mindspeed Technologies, Inc. System for speech encoding having an adaptive encoding arrangement
US6463407B2 (en) * 1998-11-13 2002-10-08 Qualcomm Inc. Low bit-rate coding of unvoiced segments of speech
US6393074B1 (en) 1998-12-31 2002-05-21 Texas Instruments Incorporated Decoding system for variable-rate convolutionally-coded data sequence
JP2000244384A (ja) * 1999-02-18 2000-09-08 Mitsubishi Electric Corp 移動通信端末装置及び移動通信端末装置における音声符号化レート決定方法
US6397177B1 (en) * 1999-03-10 2002-05-28 Samsung Electronics, Co., Ltd. Speech-encoding rate decision apparatus and method in a variable rate
US7330902B1 (en) * 1999-05-10 2008-02-12 Nokia Corporation Header compression
US7127390B1 (en) 2000-02-08 2006-10-24 Mindspeed Technologies, Inc. Rate determination coding
US6898566B1 (en) * 2000-08-16 2005-05-24 Mindspeed Technologies, Inc. Using signal to noise ratio of a speech signal to adjust thresholds for extracting speech parameters for coding the speech signal
US6640208B1 (en) * 2000-09-12 2003-10-28 Motorola, Inc. Voiced/unvoiced speech classifier
US6745012B1 (en) * 2000-11-17 2004-06-01 Telefonaktiebolaget Lm Ericsson (Publ) Adaptive data compression in a wireless telecommunications system
US7120134B2 (en) 2001-02-15 2006-10-10 Qualcomm, Incorporated Reverse link channel architecture for a wireless communication system
CN1288625C (zh) * 2002-01-30 2006-12-06 松下电器产业株式会社 音频编码与解码设备及其方法
US7657427B2 (en) 2002-10-11 2010-02-02 Nokia Corporation Methods and devices for source controlled variable bit-rate wideband speech coding
KR100841096B1 (ko) * 2002-10-14 2008-06-25 리얼네트웍스아시아퍼시픽 주식회사 음성 코덱에 대한 디지털 오디오 신호의 전처리 방법
US7602722B2 (en) * 2002-12-04 2009-10-13 Nortel Networks Limited Mobile assisted fast scheduling for the reverse link
KR100754439B1 (ko) * 2003-01-09 2007-08-31 와이더댄 주식회사 이동 전화상의 체감 음질을 향상시키기 위한 디지털오디오 신호의 전처리 방법
WO2005111568A1 (ja) * 2004-05-14 2005-11-24 Matsushita Electric Industrial Co., Ltd. 符号化装置、復号化装置、およびこれらの方法
CN1295678C (zh) * 2004-05-18 2007-01-17 中国科学院声学研究所 子带自适应谷点降噪***和方法
KR100657916B1 (ko) 2004-12-01 2006-12-14 삼성전자주식회사 주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치및 방법
US20060224381A1 (en) * 2005-04-04 2006-10-05 Nokia Corporation Detecting speech frames belonging to a low energy sequence
KR100757858B1 (ko) * 2005-09-30 2007-09-11 와이더댄 주식회사 선택적 인코딩 시스템 및 상기 선택적 인코딩 시스템의동작 방법
KR100717058B1 (ko) * 2005-11-28 2007-05-14 삼성전자주식회사 고주파 성분 복원 방법 및 그 장치
CN101213589B (zh) * 2006-01-12 2011-04-27 松下电器产业株式会社 对象声音分析装置和对象声音分析方法
EP1984911A4 (en) * 2006-01-18 2012-03-14 Lg Electronics Inc DEVICE AND METHOD FOR SIGNAL CODING AND DECODING
CN101379548B (zh) 2006-02-10 2012-07-04 艾利森电话股份有限公司 语音检测器和用于其中抑制子频带的方法
US8920343B2 (en) 2006-03-23 2014-12-30 Michael Edward Sabatino Apparatus for acquiring and processing of physiological auditory signals
CN100483509C (zh) * 2006-12-05 2009-04-29 华为技术有限公司 声音信号分类方法和装置
CN101217037B (zh) * 2007-01-05 2011-09-14 华为技术有限公司 对音频信号的编码速率进行源控的方法和***
JPWO2009038170A1 (ja) * 2007-09-21 2011-01-06 日本電気株式会社 音声処理装置、音声処理方法、プログラム及び音楽・メロディ配信システム
WO2009038115A1 (ja) * 2007-09-21 2009-03-26 Nec Corporation 音声符号化装置、音声符号化方法及びプログラム
US20090099851A1 (en) * 2007-10-11 2009-04-16 Broadcom Corporation Adaptive bit pool allocation in sub-band coding
US8554550B2 (en) * 2008-01-28 2013-10-08 Qualcomm Incorporated Systems, methods, and apparatus for context processing using multi resolution analysis
CN101335000B (zh) 2008-03-26 2010-04-21 华为技术有限公司 编码的方法及装置
CN102396024A (zh) * 2009-02-16 2012-03-28 韩国电子通信研究院 使用自适应正弦波脉冲编码的用于音频信号的编码/解码方法及其设备
CN104485118A (zh) 2009-10-19 2015-04-01 瑞典爱立信有限公司 用于语音活动检测的检测器和方法
US9047878B2 (en) * 2010-11-24 2015-06-02 JVC Kenwood Corporation Speech determination apparatus and speech determination method
CN102985969B (zh) * 2010-12-14 2014-12-10 松下电器(美国)知识产权公司 编码装置、解码装置和编码方法、解码方法
US8990074B2 (en) * 2011-05-24 2015-03-24 Qualcomm Incorporated Noise-robust speech coding mode classification
US8666753B2 (en) * 2011-12-12 2014-03-04 Motorola Mobility Llc Apparatus and method for audio encoding
US9263054B2 (en) * 2013-02-21 2016-02-16 Qualcomm Incorporated Systems and methods for controlling an average encoding rate for speech signal encoding
CN110265059B (zh) 2013-12-19 2023-03-31 瑞典爱立信有限公司 估计音频信号中的背景噪声
US9564136B2 (en) 2014-03-06 2017-02-07 Dts, Inc. Post-encoding bitrate reduction of multiple object audio
ES2754706T3 (es) * 2014-03-24 2020-04-20 Nippon Telegraph & Telephone Método de codificación, codificador, programa y soporte de registro
ES2838006T3 (es) * 2014-07-28 2021-07-01 Nippon Telegraph & Telephone Codificación de señal de sonido
RU2713852C2 (ru) * 2014-07-29 2020-02-07 Телефонактиеболагет Лм Эрикссон (Пабл) Оценивание фонового шума в аудиосигналах
KR101619293B1 (ko) 2014-11-12 2016-05-11 현대오트론 주식회사 전원 반도체의 제어 방법 및 제어 장치
CN107742521B (zh) 2016-08-10 2021-08-13 华为技术有限公司 多声道信号的编码方法和编码器
EP3751567B1 (en) 2019-06-10 2022-01-26 Axis AB A method, a computer program, an encoder and a monitoring device
CN110992963B (zh) * 2019-12-10 2023-09-29 腾讯科技(深圳)有限公司 网络通话方法、装置、计算机设备及存储介质
WO2021253235A1 (zh) * 2020-06-16 2021-12-23 华为技术有限公司 语音活动检测方法和装置
CN113611325B (zh) * 2021-04-26 2023-07-04 珠海市杰理科技股份有限公司 基于清浊音实现的语音信号变速方法、装置和音频设备

Family Cites Families (74)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3633107A (en) * 1970-06-04 1972-01-04 Bell Telephone Labor Inc Adaptive signal processor for diversity radio receivers
JPS5017711A (ja) * 1973-06-15 1975-02-25
US4076958A (en) * 1976-09-13 1978-02-28 E-Systems, Inc. Signal synthesizer spectrum contour scaler
US4214125A (en) * 1977-01-21 1980-07-22 Forrest S. Mozer Method and apparatus for speech synthesizing
CA1123955A (en) * 1978-03-30 1982-05-18 Tetsu Taguchi Speech analysis and synthesis apparatus
DE3023375C1 (ja) * 1980-06-23 1987-12-03 Siemens Ag, 1000 Berlin Und 8000 Muenchen, De
JPS57177197A (en) * 1981-04-24 1982-10-30 Hitachi Ltd Pick-up system for sound section
USRE32580E (en) * 1981-12-01 1988-01-19 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech coder
JPS6011360B2 (ja) * 1981-12-15 1985-03-25 ケイディディ株式会社 音声符号化方式
US4535472A (en) * 1982-11-05 1985-08-13 At&T Bell Laboratories Adaptive bit allocator
EP0111612B1 (fr) * 1982-11-26 1987-06-24 International Business Machines Corporation Procédé et dispositif de codage d'un signal vocal
EP0127718B1 (fr) * 1983-06-07 1987-03-18 International Business Machines Corporation Procédé de détection d'activité dans un système de transmission de la voix
US4672670A (en) * 1983-07-26 1987-06-09 Advanced Micro Devices, Inc. Apparatus and methods for coding, decoding, analyzing and synthesizing a signal
EP0163829B1 (en) * 1984-03-21 1989-08-23 Nippon Telegraph And Telephone Corporation Speech signal processing system
DE3412430A1 (de) * 1984-04-03 1985-10-03 Nixdorf Computer Ag, 4790 Paderborn Schalteranordnung
EP0167364A1 (en) * 1984-07-06 1986-01-08 AT&T Corp. Speech-silence detection with subband coding
FR2577084B1 (fr) * 1985-02-01 1987-03-20 Trt Telecom Radio Electr Systeme de bancs de filtres d'analyse et de synthese d'un signal
US4885790A (en) * 1985-03-18 1989-12-05 Massachusetts Institute Of Technology Processing of acoustic waveforms
US4856068A (en) * 1985-03-18 1989-08-08 Massachusetts Institute Of Technology Audio pre-processing methods and apparatus
US4630304A (en) * 1985-07-01 1986-12-16 Motorola, Inc. Automatic background noise estimator for a noise suppression system
US4827517A (en) * 1985-12-26 1989-05-02 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech processor using arbitrary excitation coding
CA1299750C (en) * 1986-01-03 1992-04-28 Ira Alan Gerson Optimal method of data reduction in a speech recognition system
US4797929A (en) * 1986-01-03 1989-01-10 Motorola, Inc. Word recognition in a speech recognition system using data reduced word templates
US4899384A (en) * 1986-08-25 1990-02-06 Ibm Corporation Table controlled dynamic bit allocation in a variable rate sub-band speech coder
US4771465A (en) * 1986-09-11 1988-09-13 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech sinusoidal vocoder with transmission of only subset of harmonics
US4797925A (en) * 1986-09-26 1989-01-10 Bell Communications Research, Inc. Method for coding speech at low bit rates
US4903301A (en) * 1987-02-27 1990-02-20 Hitachi, Ltd. Method and system for transmitting variable rate speech signal
US5054072A (en) * 1987-04-02 1991-10-01 Massachusetts Institute Of Technology Coding of acoustic waveforms
US4868867A (en) * 1987-04-06 1989-09-19 Voicecraft Inc. Vector excitation speech or audio coder for transmission or storage
US4890327A (en) * 1987-06-03 1989-12-26 Itt Corporation Multi-rate digital voice coder apparatus
US4899385A (en) * 1987-06-26 1990-02-06 American Telephone And Telegraph Company Code excited linear predictive vocoder
CA1337217C (en) * 1987-08-28 1995-10-03 Daniel Kenneth Freeman Speech coding
JPS6491200A (en) * 1987-10-02 1989-04-10 Fujitsu Ltd Voice analysis system and voice synthesization system
US4852179A (en) * 1987-10-05 1989-07-25 Motorola, Inc. Variable frame rate, fixed bit rate vocoding method
US4817157A (en) * 1988-01-07 1989-03-28 Motorola, Inc. Digital speech coder having improved vector excitation source
US4897832A (en) 1988-01-18 1990-01-30 Oki Electric Industry Co., Ltd. Digital speech interpolation system and speech detector
DE3883519T2 (de) * 1988-03-08 1994-03-17 Ibm Verfahren und Einrichtung zur Sprachkodierung mit mehreren Datenraten.
EP0331857B1 (en) * 1988-03-08 1992-05-20 International Business Machines Corporation Improved low bit rate voice coding method and system
CA1335003C (en) * 1988-03-11 1995-03-28 Daniel Kenneth Freeman Voice activity detection
US5023910A (en) * 1988-04-08 1991-06-11 At&T Bell Laboratories Vector quantization in a harmonic speech coding arrangement
US4864561A (en) * 1988-06-20 1989-09-05 American Telephone And Telegraph Company Technique for improved subjective performance in a communication system using attenuated noise-fill
JPH0783315B2 (ja) * 1988-09-26 1995-09-06 富士通株式会社 可変レート音声信号符号化方式
CA1321645C (en) * 1988-09-28 1993-08-24 Akira Ichikawa Method and system for voice coding based on vector quantization
JP3033060B2 (ja) * 1988-12-22 2000-04-17 国際電信電話株式会社 音声予測符号化・復号化方式
US5222189A (en) * 1989-01-27 1993-06-22 Dolby Laboratories Licensing Corporation Low time-delay transform coder, decoder, and encoder/decoder for high-quality audio
EP0392126B1 (en) * 1989-04-11 1994-07-20 International Business Machines Corporation Fast pitch tracking process for LTP-based speech coders
JPH0754434B2 (ja) * 1989-05-08 1995-06-07 松下電器産業株式会社 音声認識装置
US5060269A (en) * 1989-05-18 1991-10-22 General Electric Company Hybrid switched multi-pulse/stochastic speech coding technique
GB2235354A (en) * 1989-08-16 1991-02-27 Philips Electronic Associated Speech coding/encoding using celp
US5054075A (en) * 1989-09-05 1991-10-01 Motorola, Inc. Subband decoding method and apparatus
US5185800A (en) * 1989-10-13 1993-02-09 Centre National D'etudes Des Telecommunications Bit allocation device for transformed digital audio broadcasting signals with adaptive quantization based on psychoauditive criterion
US5307441A (en) 1989-11-29 1994-04-26 Comsat Corporation Wear-toll quality 4.8 kbps speech codec
JP3004664B2 (ja) * 1989-12-21 2000-01-31 株式会社東芝 可変レート符号化方法
JP2861238B2 (ja) * 1990-04-20 1999-02-24 ソニー株式会社 ディジタル信号符号化方法
JP2751564B2 (ja) * 1990-05-25 1998-05-18 ソニー株式会社 ディジタル信号符号化装置
US5103459B1 (en) * 1990-06-25 1999-07-06 Qualcomm Inc System and method for generating signal waveforms in a cdma cellular telephone system
JPH04100099A (ja) * 1990-08-20 1992-04-02 Nippon Telegr & Teleph Corp <Ntt> 音声検出装置
JPH04157817A (ja) * 1990-10-20 1992-05-29 Fujitsu Ltd 可変レート符号化装置
US5206884A (en) * 1990-10-25 1993-04-27 Comsat Transform domain quantization technique for adaptive predictive coding
JP2906646B2 (ja) * 1990-11-09 1999-06-21 松下電器産業株式会社 音声帯域分割符号化装置
US5317672A (en) * 1991-03-05 1994-05-31 Picturetel Corporation Variable bit rate speech encoder
KR940001861B1 (ko) * 1991-04-12 1994-03-09 삼성전자 주식회사 오디오 대역신호의 음성/음악 판별장치
US5187745A (en) * 1991-06-27 1993-02-16 Motorola, Inc. Efficient codebook search for CELP vocoders
ATE294441T1 (de) * 1991-06-11 2005-05-15 Qualcomm Inc Vocoder mit veränderlicher bitrate
JP2705377B2 (ja) * 1991-07-31 1998-01-28 松下電器産業株式会社 帯域分割符号化方法
EP0525774B1 (en) * 1991-07-31 1997-02-26 Matsushita Electric Industrial Co., Ltd. Digital audio signal coding system and method therefor
US5410632A (en) 1991-12-23 1995-04-25 Motorola, Inc. Variable hangover time in a voice activity detector
JP3088838B2 (ja) * 1992-04-09 2000-09-18 シャープ株式会社 音楽検出回路及び該回路を用いた音声信号入力装置
JP2976701B2 (ja) * 1992-06-24 1999-11-10 日本電気株式会社 量子化ビット数割当方法
US5341456A (en) * 1992-12-02 1994-08-23 Qualcomm Incorporated Method for determining speech encoding rate in a variable rate vocoder
US5457769A (en) * 1993-03-30 1995-10-10 Earmark, Inc. Method and apparatus for detecting the presence of human voice signals in audio signals
US5644596A (en) 1994-02-01 1997-07-01 Qualcomm Incorporated Method and apparatus for frequency selective adaptive filtering
US5742734A (en) 1994-08-10 1998-04-21 Qualcomm Incorporated Encoding rate selection in a variable rate vocoder
US6134215A (en) 1996-04-02 2000-10-17 Qualcomm Incorpoated Using orthogonal waveforms to enable multiple transmitters to share a single CDM channel

Also Published As

Publication number Publication date
US5742734A (en) 1998-04-21
CN1131473A (zh) 1996-09-18
EP1424686A3 (en) 2006-03-22
ATE235734T1 (de) 2003-04-15
HK1015185A1 (en) 1999-10-08
DE69535452T2 (de) 2007-12-13
DE69530066D1 (de) 2003-04-30
FI122272B (fi) 2011-11-15
ATE285620T1 (de) 2005-01-15
ES2233739T3 (es) 2005-06-16
ATE298124T1 (de) 2005-07-15
CA2488918C (en) 2011-02-01
ES2281854T3 (es) 2007-10-01
JP4680958B2 (ja) 2011-05-11
EP1239465B2 (en) 2010-02-17
JP2007293355A (ja) 2007-11-08
JP2011209733A (ja) 2011-10-20
FI961112A (fi) 1996-04-12
JP4680956B2 (ja) 2011-05-11
EP1530201B1 (en) 2007-04-04
ES2299122T3 (es) 2008-05-16
JP2007304605A (ja) 2007-11-22
IL114874A0 (en) 1995-12-08
EP1703493A3 (en) 2007-02-14
ES2240602T3 (es) 2005-10-16
BR9506036A (pt) 1997-10-07
DK1239465T3 (da) 2005-08-29
EP1233408B1 (en) 2004-12-22
IL114874A (en) 1999-03-12
WO1996005592A1 (en) 1996-02-22
KR20040004420A (ko) 2004-01-13
EP1239465A3 (en) 2002-09-18
JP4870846B2 (ja) 2012-02-08
CN1512488A (zh) 2004-07-14
EP0728350B1 (en) 2003-03-26
CA2171009A1 (en) 1996-02-22
CA2488921C (en) 2010-09-14
JP2007304604A (ja) 2007-11-22
FI117993B (fi) 2007-05-15
JP3502101B2 (ja) 2004-03-02
JP4680957B2 (ja) 2011-05-11
HK1077911A1 (en) 2006-02-24
PT728350E (pt) 2003-07-31
ATE386321T1 (de) 2008-03-15
AU711401B2 (en) 1999-10-14
DK1233408T3 (da) 2005-01-24
PT1239465E (pt) 2005-09-30
PT1233408E (pt) 2005-05-31
KR100455225B1 (ko) 2004-11-06
CN1512489A (zh) 2004-07-14
CN1512487A (zh) 2004-07-14
EP1703493B1 (en) 2008-02-13
DE69533881D1 (de) 2005-01-27
ES2194921T3 (es) 2003-12-01
FI20050703A (fi) 2005-07-01
EP1530201A2 (en) 2005-05-11
DE69530066T2 (de) 2004-01-29
FI123708B (fi) 2013-09-30
JPH09504124A (ja) 1997-04-22
AU3275195A (en) 1996-03-07
JP2004004971A (ja) 2004-01-08
CA2488918A1 (en) 1996-02-22
CN1945696A (zh) 2007-04-11
EP0728350A1 (en) 1996-08-28
EP1233408A1 (en) 2002-08-21
KR100455826B1 (ko) 2005-04-06
DE69534285T2 (de) 2006-03-23
CA2488921A1 (en) 1996-02-22
DE69534285D1 (de) 2005-07-21
CN100508028C (zh) 2009-07-01
EP1239465B1 (en) 2005-06-15
DK0728350T3 (da) 2003-06-30
DE69535709T2 (de) 2009-02-12
ES2240602T5 (es) 2010-06-04
FI961112A0 (fi) 1996-03-08
TW277189B (ja) 1996-06-01
FI20050702A (fi) 2005-07-01
CN1320521C (zh) 2007-06-06
EP1424686A2 (en) 2004-06-02
DK1239465T4 (da) 2010-05-31
JP2004046228A (ja) 2004-02-12
KR960705305A (ko) 1996-10-09
EP1703493A2 (en) 2006-09-20
ZA956081B (en) 1996-03-15
DE69535709D1 (de) 2008-03-27
BR9510780B1 (pt) 2011-05-31
DE69534285T3 (de) 2010-09-09
DE69535452D1 (de) 2007-05-16
JP2007304606A (ja) 2007-11-22
ATE358871T1 (de) 2007-04-15
CN1168071C (zh) 2004-09-22
MX9600920A (es) 1997-06-28
KR20040004421A (ko) 2004-01-13
CA2171009C (en) 2006-04-11
EP1530201A3 (en) 2005-08-10
FI122273B (fi) 2011-11-15
EP1239465A2 (en) 2002-09-11
DE69533881T2 (de) 2006-01-12
FI20061084A (fi) 2006-12-07
FI119085B (fi) 2008-07-15
FI20050704A (fi) 2005-07-01

Similar Documents

Publication Publication Date Title
JP3927159B2 (ja) 可変レートボコーダーにおけるエンコーディングレート選択決定のための方法および装置
JP2010044421A (ja) 減少レート、可変レートの音声分析合成を実行する方法及び装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051206

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20060306

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20060313

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060606

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070130

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070301

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110309

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110309

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120309

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130309

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130309

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140309

Year of fee payment: 7

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term