JP2011209733A - 可変レートボコーダのエンコードレート決定方法および装置 - Google Patents
可変レートボコーダのエンコードレート決定方法および装置 Download PDFInfo
- Publication number
- JP2011209733A JP2011209733A JP2011095137A JP2011095137A JP2011209733A JP 2011209733 A JP2011209733 A JP 2011209733A JP 2011095137 A JP2011095137 A JP 2011095137A JP 2011095137 A JP2011095137 A JP 2011095137A JP 2011209733 A JP2011209733 A JP 2011209733A
- Authority
- JP
- Japan
- Prior art keywords
- subband
- rate
- threshold
- encoding rate
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 19
- 238000004364 calculation method Methods 0.000 claims abstract description 32
- 230000005236 sound signal Effects 0.000 claims description 13
- 238000005311 autocorrelation function Methods 0.000 claims description 9
- 230000006978 adaptation Effects 0.000 description 9
- 206010019133 Hangover Diseases 0.000 description 6
- 241000282344 Mellivora capensis Species 0.000 description 5
- 230000006835 compression Effects 0.000 description 5
- 238000007906 compression Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 230000000737 periodic effect Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000003321 amplification Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Dc Digital Transmission (AREA)
Abstract
【課題】可変レートボコーダのエンコーディングレートを決定する装置および方法を提供する。
【解決手段】入力信号を受取り、予め定められたサブバンドエネルギー計算フォーマットにしたがって複数のサブバンドエネルギー値を計算するサブバンドエネルギー計算手段4,6と、それら複数のサブバンドエネルギ値を受取って、複数のサブバンドエネルギー値にしたがってそのエンコーディングレートを選択または決定するエンコーディングレート決定手段16とを具備する。
【選択図】図1
【解決手段】入力信号を受取り、予め定められたサブバンドエネルギー計算フォーマットにしたがって複数のサブバンドエネルギー値を計算するサブバンドエネルギー計算手段4,6と、それら複数のサブバンドエネルギ値を受取って、複数のサブバンドエネルギー値にしたがってそのエンコーディングレートを選択または決定するエンコーディングレート決定手段16とを具備する。
【選択図】図1
Description
本発明はボコーダに関し、例えば、可変レートボコーダにおけるスピーチエンコーディングレート決定のための発明および、改良されたその装置と方法に関する。
可変レートスピーチ圧縮システムは、エンコーディングが始まる以前に、レート決定アルゴリズムのある種のフォーム(即ち、形式)を使用することが一般的である。このレート決定アルゴリズムは、高いビットレート・エンコーディング・スキームを、スピーチが在る処のオーディオ信号のセグメントヘアサインすると共に、サイレント(即ち、無音)セグメントのためのより低いレート・エンコーディング・スキームが在る。この方法では、再構築されたスピーチのボイス(以下、音声と称する)の質が高く保たれる期間において、より低いビットレートが達成される。このように、効率的にオペレートするために、可変レートスピーチコーダは、種々の背景雑音環境において無音とスピーチとを識別することができるようなロバストレート(即ち、粗いレート)の決定アルゴリズムを要する。
可変レートスピーチ圧縮システムと、可変レートボコーダの一例は、米国特許番号07/713,661、出願日1991年6月11日、その発明の名称は「可変レートボコーダ」であり、本願発明の譲受人に譲渡されたものであり、この内容は本発明の参考文献である。
可変レートボコーダのこの改良においては、入力スピーチは、符号励起線形予測符号化(CELP)技術を使ってエンコードされる。スピーチアクティビティのレベルは、音声化されたスピーチに加えて、背景雑音を含む入力オーディオ・サンプルにおけるエネルギから決定される。このボコーダが種々のレベルの背景雑音のもとでエンコードし高い質の音声を提供するためには、適合する適応閾値技術が、レート決定アルゴリズム上の背景雑音の影響のため補償することが要求される。
ボコーダは主として、例えばセルラーテレホンまたは、パーソナル・コミュニケーション・デバイス等のような通信デバイスに使用され、それは、送信のためのデジタル形式に変換される処のアナログオーディオ信号へのデジタル信号圧縮を提供するものである。モバイル環境においては、セルラーテレホンまたは、パーソナル・コミュニケーション・デバイス等が使用され得るが、高レベルの背景雑音エネルギは、レート決定アルゴリズムがレート決定アルゴリズムに基づく信号エネルギを使用して、低エネルギの非音声音と背景雑音の静粛(即ち、サイレンス)とを識別することを困難なものにしている。このように、非音声音の周波数は低ビットレートにエンコードされ、その音声質は、子音として例えば、”s”,”x”,”ch”,”sh”,”t”などのような再構築されたスピーチにおいて、質的低下を生ずる。
背景雑音のエネルギにおける単なるベースレート決定を行うボコーダは、閾値の設定における背景雑音に関係する処の信号強度を考慮することを忘れてしまう。背景雑音において単にその閾値レベルを基礎にするボコーダは、背景雑音が上昇するときには、それらの閾値レベルを1つに合わせて圧縮処理を行おうとする。また、その信号レベルが固定されて継続されるような場合には、閾値レベルを設定するためには、確かにこれが正しい手法ではあるが、しかし、その信号レベルが背景雑音を伴って上昇するときは、その閾値レベルを圧縮することは、最適な解決策では決してない。よって、その信号強度を考慮する処の閾値レベル設定のための代替的な方法は、可変レートボコーダに必要とされるものである。
背景雑音エネルギに基づくベースレート決定を行うボコーダを通しての音楽再生中においては、最終的な問題がまだ存在する。人がしゃべるときには、息継ぎするためのポーズ(即ち、休止)しなければならず、これは、適切な背景雑音レベルにリセット(即ち、再設定)するための閾値を許容するものである。しかしながら、ボコーダを通しての音楽の伝送において、例えば、ミュージック・オン・ホールド・コンディション(即ち、状況)において起こるような、ポーズが無くて、フルレートよりも少ないレートでコード化されるべき音楽が演奏開始されるまでには、その閾値は上昇し続けることがある。このような状況においては、その可変レートコーダは、音楽と背景雑音とを混同してしまう。
本発明の第1の目的は、背景雑音としての低エネルギの非音声音スピーチのコーディングの確率を削減することによる一方法を提供することである。本発明においては、入力信号は、高周波数成分と低周波数成分とにフルタリングされる。このフルタリングされた入力信号の成分は、次に、スピーチの存在を検出するためにそれぞれ分析される。なぜならば、非音声音は高い周波数成分をもっており、その強度は高い周波数バンドに係わり、このバンドにおいては、全周波数バンドにわたる背景雑音に比較すれば、その背景雑音からの識別が更にしやすい故である。
本発明の第2の目的は、信号エネルギのみならず背景雑音エネルギをも考慮した、閾値レベルの設定をすることによる一手段を提供することにある。本発明において、音声検知の閾値設定は、その入力信号の信号対雑音比(SNR)の予測に基づいている。例示する実施例によれば、信号エネルギは、アクティブスピーチの時間中における、その最大信号エネルギとして予測され、また、背景雑音エネルギは、無音の時間中におけるその最大信号エネルギとして予測される。
本発明の第3の目的は、可変レートボコーダを通る音楽のためのコーディングの一方法を提供することである。例示する実施例によれば、レート選択装置は、閾値レベルが上昇した閾値を超過する連続的なフレームの数を検知して、そのフレームの数の周期性のチェックを行う。もし、その入力信号に周期的があれば、音楽が在ることを示している。音楽の存在が検知されると、その信号がフルレートでコード化されるようなレベルに閾値が設定される。
本発明は、可変レートボコーダにおけるエンコーディングレートの選択決定のための発明装置および、その改良された方法である。
本発明は、「可変レートボコーダのエンコーディングレートを決定する装置において、入力信号を受取り、予め定められたサブバンドエネルギ計算フォーマットにしたがって複数のサブバンドエネルギ値を計算するサプバンドエネルギ計算手段と、前記複数のサブバンドエネルギ値を受取って、前記複数のサブバンドエネルギ値にしたがってそのエンコーディングレートを決定するレート決定手段とを具備していることを特徴とする。」とする。
図1を参照すると、入力信号S(n)は、サブバンドエネルギ計算用の構成要素4および、サブバンドエネルギ計算用の構成要素6に供給される。この入力信号S(n)は、オーディオ信号と背景雑音とから構成されている。このオーディオ信号は一般的にはスピーチであるが、もちろん音楽であってもよい。本発明の実施例においては、入力信号S(n)は、0〜4kHzの周波数を有し、これはほぼ人間のスピーチ信号のバンド幅である。
例示する実施例においては、4kHzの入力信号S(n)は、2つに分離したサブバンドにフィルタリングされる。この2つに分離したサブバンドは、各々、0〜2kHzの間および、2〜4kHzの間に存在する。例示する実施例においては、入力信号は、サブバンドフィルタによって、複数のサブバンドに分離されてもよく、このデザインは、従来技術で良く知られており、1994年2月1日出願の米国特許番号08/189,819「周波数選択アダプティプ(適応)フィルタリング」に詳細開示され、本願発明の譲受人に譲渡されたものであり、この内容の開示は文献の援用である。
サブフィルタのインパルス・レスポンスは、ローパスフィルタのためのものとしては、hL(n)で示され、ハイパスフィルタのためのものとしては、hH(n)で示されている。その信号のサブバンド構成要素の結果得られるエネルギは、例えば、値RL(0)および値RH(0)を与えるために計算され得る。すなわち、従来技術で良く知られているように、単純に、サブバンドフィルタ出力サンプルのスクエア(即ち、二乗)を合算することによって得られる。
ただし、 Lは、インパルス・レスポンスhL(n)をもつローパスフィルタにおいて、タップ(tap)する数である。また、このRs(i)は、下式で与えられる入力信号S(n)の自己相関関数(autocorrelation)である。
高周波数RH(0)は、サブバンドエネルギ計算用の構成要素6において、計算される。
サブバンドフィルタの自己相関関数の値は、計算ロード(即ち、負荷)を削減するため、先に計算され得る。さらに、計算された幾つかのRS(i)の値は、入力信号S(n)のコーディングにおける他の計算に使われる。そしてこれは、本発明のエンコーディングレート選択方法のネット(即ち、正味)の計算負担を削減する。例えば、LPCフィルタ・タップ値の計算については、上述の従来技術では良く知られており、米国特許番号08/004,484には詳述されている。もし、あるものが10タップLPCフィルタを要する方法でスピーチをコード化すると仮定した場合、Rs(i)だけは計算が必要であり(但し、i は、11〜L-1)、更にこれらに加えて、この計算は信号のコーディングにおいても利用される。なぜならば、Rs(i)(但し、i は、0〜10)は、LPCフィルタ・タップ値の計算において使用される。例示する実施例では、これらのサブバンドフィルタは17タップ、即ち、L=17である。
サブバンドエネルギ計算用の構成要素4は、計算されたRL(0)の値を供給し、そして、サブバンドエネルギ計算用の構成要素6は、計算されたRH(0)の値を、サブバンドレート決定用の構成要素14へ供給する。サブバンドレート決定用の構成要素12は、RL (0)の値を、2つの所定の閾値TL1/2とTLfullとに対して比較を行い、圧縮に従って、示唆されたエンコーディングレートRATELをアサインする。
そのレートのアサイメントは、次記に従って処理される。
RATEL =1/8レート RL(0)≦TL1/2 (4)
RATEL = 半レート TL1/2<RL(0)≦TLfull (5)
RATEL = フルレート RL(0)>TLfull (6)
サブバンドレート決定用の構成要素14は、同様な取扱いによって、高い周波数エネルギ値RH(0)に従って、異なる2つの閾値TH1/2およびTHfullに基づき、示唆するエンコーディングレートRATEHを選択する。サブバンドレート決定用の構成要素12は、示唆されたエンコーディングレートRATELをエンコーディングレート選択用の構成要素16へ供給し、一方、サブバンドレート決定用の構成要素14は、示唆されたエンコーディングレートRATEHをこのエンコーディングレート選択用の構成要素16へ供給する。例示する実施例においては、このエンコーディングレート選択用の構成要素16は、2つの示唆するレートの高い方を選択し、選択された「エンコードレート」として、高いレートを提供する。
RATEL = 半レート TL1/2<RL(0)≦TLfull (5)
RATEL = フルレート RL(0)>TLfull (6)
サブバンドレート決定用の構成要素14は、同様な取扱いによって、高い周波数エネルギ値RH(0)に従って、異なる2つの閾値TH1/2およびTHfullに基づき、示唆するエンコーディングレートRATEHを選択する。サブバンドレート決定用の構成要素12は、示唆されたエンコーディングレートRATELをエンコーディングレート選択用の構成要素16へ供給し、一方、サブバンドレート決定用の構成要素14は、示唆されたエンコーディングレートRATEHをこのエンコーディングレート選択用の構成要素16へ供給する。例示する実施例においては、このエンコーディングレート選択用の構成要素16は、2つの示唆するレートの高い方を選択し、選択された「エンコードレート」として、高いレートを提供する。
また、サブバンドエネルギ計算用の構成要素4は、低い周波数エネルギの値RL(0)も、閾値適応用の構成要素8に供給する。そしてここでは、次の入力フレームのために、閾値TL1/2およびTLfullが計算される。同様に、サブバンドエネルギ計算用の構成要素6は、高い周波数エネルギの値RH(0)を、閾値適応用の構成要素10に供給する。そしてここでも、次の入力フレームのために、閾値TH1/2およびTHfullが計算される。
閾値適応用の構成要素8は、低い周波数エネルギ値RL(0)を受け取ると、S(n)が背景雑音またはオーディオ信号を含むか否かを判定する。例示する実施例では、オーディオ信号が在るか否かをこの閾値適応用の構成要素8が判定することによる方法としては、下式で与えられる「正規化自己相関関数機能」(以下、NACFと略称する)によって審査する方法である。
ただし、 e(n)は、LPCフィルタによる、入力信号S(n)のフィルタリングからの結果をもたらすホルマント・残留信号。
LPCフィルタによる、信号のフィルタリングや、設計については良く知られており、前述された米国特許番号08/004,484に詳述されている。入力信号S(n)は、LPCフィルタによりフィルタリングされ、ホルマントの相互作用を取り除く。NACFは、オーディオ信号が存在するか否かを判断するために、再び閾値と比較される。もし、NACFが所定の閾値よりも大きい場合は、これは、スピーチ又は音楽のようなオーディオ信号の存在を特徴づける周期性を有する入力フレームであることを示している。ここで、スピーチおよび音楽のパーツには周期性はないが、NACFのローバリュー(即ち、極小値)を示すであろうし、背景雑音は通常、どんな周期性も現わさないと共に、NACFのローバリューをほとんど常に示す。
S(n)が背景雑音を含んでいると判断されると、NACFの値は、閾値T H1よりも小さく、よって、RL(0)の値は、現在の背景雑音の予測値BGNLを更新するために使用される。ここに例示した実施例では、T H1は0.35である。
RL(0)は、再び、現在の背景雑音の予測値BGNLと比較される。もし、RL(0)がこの予測値BGNLより小さい場合には、NACFの値を無視して、この予測値BGNLがRL(0)に等しいとして設定される。
背景雑音の予測値BGNLは、NACFが閾値T H1よりも小さい場合にのみ増加される。もし、このRL(0)がBGNLよりも大きく、そしてNACFがT H1よりも小さい場合には、背景雑音エネルギを示すBGNLが、αl・BGNLとして設定される。なお、αlは1以上の数である。なお、ここで例示する実施例では、αlは1.03である。BGNLは、NACFがT H1より小さい限り増加し続ける。また、背景雑音の予測値BGNLが最大値BGNmaxに設定される時点において、BGNLが所定のこの最大値BGNmaxに達するまでは、RL(0)が現在の背景雑音の予測値BGNLより大きい。
もし、オーディオ信号が検出された場合には、第2の閾値T H2を超過するNACFの値によって表され、この信号エネルギ予測値SLが更新される。例示する実施例では、TH2は0.5に設定される。RL(0)の値は、現在のローパス信号エネルギ予測値SLに対して比較される。もし、RL(0)がこの現在のローパス信号エネルギ予測値SLよりも大きい場合は、SLはRL(0)に等しく設定される。もし逆に、RL(0)がこの予測値SLよりも小さい場合は、再度、NACFがT H2より大きい場合にだけ、SLは、α2・SLとして設定される。なお、ここで例示する実施例では、α2は0.96である。
ただし、 nintとは、最も近い整数にラウンド(例えば、四捨五入)する機能値である。
閾値適応用の構成要素8は、信号対雑音比のインデックスISNRLへの信号に従って、2つのスケーリングファクタ(即ち、計数逓減率)KL1/2およびKLfullを選択または計算する。例えば、次に示す表1にはスケーリングファクタ値のルックアップテーブル1が提供されている。
これらの2つの値は、下式に従ってレート選択のための閾値を計算するのに使用される。TL1/2 = KL1/2・BGNL (11)
TLfull = KLfull・BGNL (12)
ただし、TL1/2は、低周波数ハーフ(半)レート閾値、 TLfullは、低周波数フルレート閾値。
TLfull = KLfull・BGNL (12)
ただし、TL1/2は、低周波数ハーフ(半)レート閾値、 TLfullは、低周波数フルレート閾値。
閾値適応用の構成要素8は、レート決定用の構成要素12に、TL1/2およびTLfullを供給する。一方、閾値適応用の構成要素10は、レート決定用の構成要素14に、TH1/2およびTHfullを供給する。
オーディオ信号エネルギの予測値Sの初期値は次のように設定される。(但し、SL又はSHでもよい)。
初期の信号エネルギの予測値SINITは、−18.0dBMOで、3.17dBmOは、フル・サイン(sine)曲線の信号強度を示す。例示する実施例では、−8031〜8031の増幅範囲でのデジタルのサイン曲線である。また、SINITは、アコースティック信号が存在することが決定されるまで使用される。
1つのアコースティック信号が最初に検出されることによる方法は、1つの閾値に対してNACFを比較することである。例示する実施例では、このNACFは、連続する10フレームのための閾値を超過しなければならない。このコンディションが合致した後には、信号エネルギの予測値Sは、先の10フレームにその最大の信号エネルギ値が設定される。
背景雑音の予測値BGNLの初期値は、BGNmaxに初めは設定される。サブバンドフレームエネルギ値が受け取られると直ちに、(但し、その値はBGNmaxよりも小さいが) 背景雑音の予想値が、受け取られたサブバンドエネルギレベルの値にリセットされる。そして、前述されたように、背景雑音の予想値BGNLの生成が行われる。
好適実施例においては、フルレート・スピーチフレームの連続が続くときには、ハングオーバー・コンディションがアクチュエートされる。そして、ローレートのフレームが検出される。例示する実施例において、4つの連続するスピーチフレームが、1フレームによりフルレートでエンコードされるときには、エンコーディングレート(ENC0RDING RATE)がフルレートよりも小さく設定され、その計算された信号対雑音比は、所定の最小SNRよりも小さく、また、そのフレームのためのエンコーディングレートがフルレートで設定される。なお、例示する実施例では、この所定の最小SNRは、式(8)の規定によれば、27.5dBである。
好適実施例においては、ハングオーバーフレームの数は、信号のノイズレシオ(即ち、S/N)に対する一作用機能である。例示する実施例では、ハングオーバーフレームの数は、次のように規定されている。
#ハングオーバーフレーム番号=1 22.5<SNR<27.5 (13)
#ハングオーバーフレーム=2 SNR≦27.5 (14)
#ハングオーバーフレーム=0 SNR≧27.5 (15)
本発明はまた、音楽の存在を検知するための一方法を提供することでもあり、前述したように、ポーズの無いことで、その背景雑音の測定が再設定されることを許容する。音楽の存在を検知する方法とは、コールの最初に音楽成分が存在しないことを推量することである。これは、本発明のエンコーディングレート選択装置をして、適切に推測し、初期の背景雑音エネルギBGNinitに初期化することを許容している。なぜならば、背景雑音と異なる音楽は、ある周期的な特徴を有している。本発明は、背景雑音から音楽を区別するためにNACFの値を検証している。また、本発明の音楽検知方法は、下式に従って平均NACFの値を計算する。
#ハングオーバーフレーム=2 SNR≦27.5 (14)
#ハングオーバーフレーム=0 SNR≧27.5 (15)
本発明はまた、音楽の存在を検知するための一方法を提供することでもあり、前述したように、ポーズの無いことで、その背景雑音の測定が再設定されることを許容する。音楽の存在を検知する方法とは、コールの最初に音楽成分が存在しないことを推量することである。これは、本発明のエンコーディングレート選択装置をして、適切に推測し、初期の背景雑音エネルギBGNinitに初期化することを許容している。なぜならば、背景雑音と異なる音楽は、ある周期的な特徴を有している。本発明は、背景雑音から音楽を区別するためにNACFの値を検証している。また、本発明の音楽検知方法は、下式に従って平均NACFの値を計算する。
ただし、 NACFは、式(7)に規定されている。
また、Tは、背景雑音の予測された値が、初期の背景雑音の予測値BGNINITから増加していく場合における連続するフレーム数である。
もし、背景雑音BGNが、フレームの所定の値Tのために増加していき、NACFAVEが所定の閾値を超過すると、音楽の存在が検知され、背景雑音BGNは予測値BGNINITにリセットされる。ここで、注意することは、このT値は、エンコーディングレートがフルレートより下に降下しない十分な低さにセットされることである。したがって、このT値は、BGNintおよびアコースティック信号の一機能として設定されるべきである。
好適実施例の前述の内容は、当業者だれもが本発明品を作り又は利用できるようにするために提供されている。したがって、これらの好適実施例の種々な改良については当業者には明らかであり、また、ここで定義された本発明の要旨は、その発明の能力を使うことなく、他の実施例にも応用され得るものである。以上のように、本発明は、ここで開示された実施例に限るものではなく、この要旨およびここに開示の発明を有した広い範囲にも一致するものである。
Claims (28)
- 可変レートボコーダのエンコーディングレートを決定する装置であって、
入力信号(S(n))を受取り、予め定められたサブバンドエネルギ計算フォーマットにしたがって複数のサブバンドエネルギ値を決定するサブバンドエネルギ計算手段(4, 6)と、
信号エネルギ推定値と背景雑音推定値を決定し、各サブバンドにおける複数のエンコーディングレート閾値を決定し、各エンコーディングレート閾値が前記信号エネルギ推定値対前記背景雑音推定値の比に基づいている閾値計算手段(8,10)と、
前記複数のサブバンドエネルギ値および前記複数のエンコーディングレート閾値を受信し、前記複数のサブバンドエネルギ値および前記複数のエンコーディングレート閾値により前記入力信号(S(n))に対するエンコーディングレートを決定するレート決定手段(12,14,16)とを具備している装置。 - 前記閾値計算手段(8,10)は信号対雑音比値にしたがってスケール値を決定するように適用される請求項1記載の装置。
- 前記閾値計算手段(8,10)は背景雑音推定値と前記スケール値とを乗算することにより少なくとも1つの閾値を決定するように適用される請求項3記載の装置。
- 前記レート決定手段は、前記エンコーディングレートを決定するために前記複数のサブバンドエネルギ値の少なくとも1つを前記少なくとも1つの閾値と比較するように適用される請求項1記載の装置。
- 前記レート決定手段は、前記エンコーディングレートを決定するために前記複数のサブバンドエネルギ値の少なくとも1つを前記少なくとも1つの閾値と比較するように適用される請求項4記載の装置。
- 前記レート決定手段(12,14,16)は複数の示唆されたエンコーディングレートを決定するように適用され、各示唆されたエンコーディングレートは前記複数のサブバンドエネルギ値の各々に対応し、前記レート決定手段は前記複数の示唆されたエンコーディングレートにしたがって前記エンコーディングレートを決定するように適用される請求項1記載の装置。
- 前記サブバンドエネルギ計算手段(4, 6)はサブバンドエネルギ計算装置を含み、前記レート決定手段(12,14,16)は、前記複数のサブバンドエネルギ値を受信し前記複数のサブバンドエネルギ値にしたがって前記エンコーディングレートを選択するように適用されたレート選択装置を含む請求項1記載の装置。
- 前記サブバンドエネルギ計算装置および前記レート選択装置間に配置された閾値計算装置をさらに含み、前記閾値計算装置が前記サブバンドエネルギ値を受け、複数のサブバンドエネルギ値にしたがってエンコーディングレート閾値のセットを決定するように適用される請求項8記載の装置。
- 前記閾値計算装置が前記複数のサブバンドエネルギ値にしたがって信号対雑音比値を決定するように適用される請求項10記載の装置。
- 前記閾値計算装置が前記信号対雑音比値にしたがってスケール値を決定するように適用される請求項11記載の装置。
- 前記閾値計算装置が背景雑音推定値と前記スケール値とを乗算することにより少なくとも1つの閾値を決定するように適用される請求項12記載の装置。
- 前記レート選択装置は、前記エンコーディングレートを決定するために前記複数のサブバンドエネルギ値の少なくとも1つを少なくとも1つの閾値と比較するように適用される請求項8記載の装置。
- 前記レート選択装置は、前記エンコーディングレートを決定するために前記複数のサブバンドエネルギ値の少なくとも1つを前記少なくとも1つの閾値と比較するように適用される請求項13記載の装置。
- 前記レート選択装置は複数の示唆されたエンコーディングレートを決定するように適用され、各示唆されたエンコーディングレートは前記複数のサブバンドエネルギ値の各々に対応し、前記レート選択装置は前記複数の示唆されたエンコーディングレートにしたがって前記エンコーディングレートを決定するように適用される請求項8記載の装置。
- 可変レートボコーダのエンコーディングレートを決定する方法であって、
入力信号(S(n))を受取り、
予め定められたサブバンドエネルギ計算フォーマットにしたがって複数のサブバンドエネルギ値を決定し、
信号エネルギ推定値と背景雑音推定値の比に基づいて信号対雑音比値を決定し、
各サブバンドにおいて信号対雑音比値に基づいて複数のエンコーディングレート閾値を決定し、
前記複数のサブバンドエネルギ値および前記複数のエンコーディングレート閾値にしたがって前記入力信号(S(n))に対するエンコーディングレートを決定するステップを含む方法。 - エンコーディングレート閾値のセットを決定する前記ステップは前記信号対雑音比値にしたがってスケール値を決定する請求項17記載の方法。
- エンコーディングレート閾値のセットを決定する前記ステップは背景雑音推定値と前記スケール値とを乗算することにより前記レート閾値を決定する請求項19記載の方法。
- 前記エンコーディングレートを決定するステップは、前記エンコーディングレートを決定するために前記複数のサブバンドエネルギ値の少なくとも1つを少なくとも1つの閾値と比較する請求項17記載の方法。
- 前記エンコーディングレートを決定するステップは、前記エンコーディングレートを決定するために前記複数のサブバンドエネルギ値の少なくとも1つを前記少なくとも1つの閾値と比較する請求項20記載の方法。
- 前記複数のサブバンドエネルギ値の各々にしたがって示唆されたエンコーディングレートを発生するステップをさらに含み、前記エンコーディングレートを決定するステップは前記示唆されたエンコーディングレートの1つを選択する請求項17記載の方法。
- 前記サブバンドエネルギ計算手段が入力信号の各周波数サブバンドに対する信号エネルギを決定するサブバンドフィルタサブシステムを含み、前記レート決定手段が入力信号(S(n))の各周波数サブバンドの信号エネルギに基づいて入力信号のエンコーディングレートを選択するレート選択サブシステムを含む請求項1記載の装置。
- サブバンドフィルタサブシステムは複数のサブバンドエネルギ計算素子(4, 6)を含み、各複数のサブバンドエネルギ計算素子は周波数サブバンド信号エネルギを決定するように適用される請求項24記載の装置。
- レート選択サブシステムは複数の閾値適用素子(8,10) を含み、各複数の閾値適用素子は、オーディオ信号が周波数サブバンドに存在するか否かを判断するため、対応しているサブバンドエネルギ計算素子(4, 6)からの周波数サブバンド信号エネルギを使用するように適用される請求項25記載の装置。
- 各閾値適用素子(8,10)は対応する周波数サブバンドの信号エネルギおよび雑音推定値に基づいた閾値を決定するように構成され、閾値はオーディオ信号が周波数サブバンド中に存在するか否かを決定するために使用される請求項26記載の装置。
- 複数の閾値適用素子(8,10)は入力信号(S(n))の各周波数サブバンドの結合された信号エネルギに基づいて閾値を決定するように構成され、閾値はオーディオ信号が周波数サブバンド中に存在するか否かを決定するために使用される請求項26記載の装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US08/288,413 US5742734A (en) | 1994-08-10 | 1994-08-10 | Encoding rate selection in a variable rate vocoder |
US288,413 | 1994-08-10 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007145736A Division JP2007293355A (ja) | 1994-08-10 | 2007-05-31 | 可変レートボコーダのエンコードレート決定方法および装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011209733A true JP2011209733A (ja) | 2011-10-20 |
JP4870846B2 JP4870846B2 (ja) | 2012-02-08 |
Family
ID=23106989
Family Applications (8)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP50740496A Expired - Lifetime JP3502101B2 (ja) | 1994-08-10 | 1995-08-01 | 可変レートボコーダーにおけるエンコーディングレート選択決定のための方法および装置 |
JP2003297412A Withdrawn JP2004004971A (ja) | 1994-08-10 | 2003-08-21 | 可変レートボコーダーにおけるエンコーディングレート選択決定のための方法および装置 |
JP2003297413A Expired - Lifetime JP3927159B2 (ja) | 1994-08-10 | 2003-08-21 | 可変レートボコーダーにおけるエンコーディングレート選択決定のための方法および装置 |
JP2007145736A Withdrawn JP2007293355A (ja) | 1994-08-10 | 2007-05-31 | 可変レートボコーダのエンコードレート決定方法および装置 |
JP2007145738A Expired - Lifetime JP4680958B2 (ja) | 1994-08-10 | 2007-05-31 | 可変レートボコーダのエンコーディングレート決定方法および装置 |
JP2007145735A Expired - Lifetime JP4680956B2 (ja) | 1994-08-10 | 2007-05-31 | エンコードレート選択方法および装置 |
JP2007145737A Expired - Lifetime JP4680957B2 (ja) | 1994-08-10 | 2007-05-31 | 可変レートボコーダにおけるスピーチエンコーディングレート決定の方法および装置 |
JP2011095137A Expired - Lifetime JP4870846B2 (ja) | 1994-08-10 | 2011-04-21 | 可変レートボコーダのエンコードレート決定方法および装置 |
Family Applications Before (7)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP50740496A Expired - Lifetime JP3502101B2 (ja) | 1994-08-10 | 1995-08-01 | 可変レートボコーダーにおけるエンコーディングレート選択決定のための方法および装置 |
JP2003297412A Withdrawn JP2004004971A (ja) | 1994-08-10 | 2003-08-21 | 可変レートボコーダーにおけるエンコーディングレート選択決定のための方法および装置 |
JP2003297413A Expired - Lifetime JP3927159B2 (ja) | 1994-08-10 | 2003-08-21 | 可変レートボコーダーにおけるエンコーディングレート選択決定のための方法および装置 |
JP2007145736A Withdrawn JP2007293355A (ja) | 1994-08-10 | 2007-05-31 | 可変レートボコーダのエンコードレート決定方法および装置 |
JP2007145738A Expired - Lifetime JP4680958B2 (ja) | 1994-08-10 | 2007-05-31 | 可変レートボコーダのエンコーディングレート決定方法および装置 |
JP2007145735A Expired - Lifetime JP4680956B2 (ja) | 1994-08-10 | 2007-05-31 | エンコードレート選択方法および装置 |
JP2007145737A Expired - Lifetime JP4680957B2 (ja) | 1994-08-10 | 2007-05-31 | 可変レートボコーダにおけるスピーチエンコーディングレート決定の方法および装置 |
Country Status (20)
Country | Link |
---|---|
US (1) | US5742734A (ja) |
EP (6) | EP1703493B1 (ja) |
JP (8) | JP3502101B2 (ja) |
KR (3) | KR100455826B1 (ja) |
CN (5) | CN1512488A (ja) |
AT (5) | ATE235734T1 (ja) |
AU (1) | AU711401B2 (ja) |
BR (2) | BR9510780B1 (ja) |
CA (3) | CA2171009C (ja) |
DE (5) | DE69533881T2 (ja) |
DK (3) | DK1233408T3 (ja) |
ES (5) | ES2299122T3 (ja) |
FI (5) | FI117993B (ja) |
HK (2) | HK1015185A1 (ja) |
IL (1) | IL114874A (ja) |
MX (1) | MX9600920A (ja) |
PT (3) | PT1239465E (ja) |
TW (1) | TW277189B (ja) |
WO (1) | WO1996005592A1 (ja) |
ZA (1) | ZA956081B (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021006898A (ja) * | 2019-06-10 | 2021-01-21 | アクシス アーベー | 方法、コンピュータプログラム、エンコーダ、及びモニタリングデバイス |
Families Citing this family (64)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6389010B1 (en) | 1995-10-05 | 2002-05-14 | Intermec Ip Corp. | Hierarchical data collection network supporting packetized voice communications among wireless terminals and telephones |
US7924783B1 (en) | 1994-05-06 | 2011-04-12 | Broadcom Corporation | Hierarchical communications system |
TW271524B (ja) * | 1994-08-05 | 1996-03-01 | Qualcomm Inc | |
US5742734A (en) † | 1994-08-10 | 1998-04-21 | Qualcomm Incorporated | Encoding rate selection in a variable rate vocoder |
US6292476B1 (en) * | 1997-04-16 | 2001-09-18 | Qualcomm Inc. | Method and apparatus for providing variable rate data in a communications system using non-orthogonal overflow channels |
JPH09162837A (ja) * | 1995-11-22 | 1997-06-20 | Internatl Business Mach Corp <Ibm> | 圧縮方式を動的に変更する通信方法及び装置 |
JPH09185397A (ja) * | 1995-12-28 | 1997-07-15 | Olympus Optical Co Ltd | 音声情報記録装置 |
US5794199A (en) * | 1996-01-29 | 1998-08-11 | Texas Instruments Incorporated | Method and system for improved discontinuous speech transmission |
FI964975A (fi) * | 1996-12-12 | 1998-06-13 | Nokia Mobile Phones Ltd | Menetelmä ja laite puheen koodaamiseksi |
JPH10210139A (ja) * | 1997-01-20 | 1998-08-07 | Sony Corp | 音声記録機能付き電話装置及び音声記録機能付き電話装置の音声記録方法 |
US6202046B1 (en) | 1997-01-23 | 2001-03-13 | Kabushiki Kaisha Toshiba | Background noise/speech classification method |
US5920834A (en) * | 1997-01-31 | 1999-07-06 | Qualcomm Incorporated | Echo canceller with talk state determination to control speech processor functional elements in a digital telephone system |
DE19742944B4 (de) * | 1997-09-29 | 2008-03-27 | Infineon Technologies Ag | Verfahren zum Aufzeichnen eines digitalisierten Audiosignals |
US6240386B1 (en) | 1998-08-24 | 2001-05-29 | Conexant Systems, Inc. | Speech codec employing noise classification for noise compensation |
US7072832B1 (en) * | 1998-08-24 | 2006-07-04 | Mindspeed Technologies, Inc. | System for speech encoding having an adaptive encoding arrangement |
US6463407B2 (en) * | 1998-11-13 | 2002-10-08 | Qualcomm Inc. | Low bit-rate coding of unvoiced segments of speech |
US6393074B1 (en) | 1998-12-31 | 2002-05-21 | Texas Instruments Incorporated | Decoding system for variable-rate convolutionally-coded data sequence |
JP2000244384A (ja) * | 1999-02-18 | 2000-09-08 | Mitsubishi Electric Corp | 移動通信端末装置及び移動通信端末装置における音声符号化レート決定方法 |
US6397177B1 (en) * | 1999-03-10 | 2002-05-28 | Samsung Electronics, Co., Ltd. | Speech-encoding rate decision apparatus and method in a variable rate |
US7330902B1 (en) * | 1999-05-10 | 2008-02-12 | Nokia Corporation | Header compression |
US7127390B1 (en) | 2000-02-08 | 2006-10-24 | Mindspeed Technologies, Inc. | Rate determination coding |
US6898566B1 (en) * | 2000-08-16 | 2005-05-24 | Mindspeed Technologies, Inc. | Using signal to noise ratio of a speech signal to adjust thresholds for extracting speech parameters for coding the speech signal |
US6640208B1 (en) * | 2000-09-12 | 2003-10-28 | Motorola, Inc. | Voiced/unvoiced speech classifier |
US6745012B1 (en) * | 2000-11-17 | 2004-06-01 | Telefonaktiebolaget Lm Ericsson (Publ) | Adaptive data compression in a wireless telecommunications system |
US7120134B2 (en) | 2001-02-15 | 2006-10-10 | Qualcomm, Incorporated | Reverse link channel architecture for a wireless communication system |
CN1288625C (zh) * | 2002-01-30 | 2006-12-06 | 松下电器产业株式会社 | 音频编码与解码设备及其方法 |
US7657427B2 (en) | 2002-10-11 | 2010-02-02 | Nokia Corporation | Methods and devices for source controlled variable bit-rate wideband speech coding |
KR100841096B1 (ko) * | 2002-10-14 | 2008-06-25 | 리얼네트웍스아시아퍼시픽 주식회사 | 음성 코덱에 대한 디지털 오디오 신호의 전처리 방법 |
US7602722B2 (en) * | 2002-12-04 | 2009-10-13 | Nortel Networks Limited | Mobile assisted fast scheduling for the reverse link |
KR100754439B1 (ko) * | 2003-01-09 | 2007-08-31 | 와이더댄 주식회사 | 이동 전화상의 체감 음질을 향상시키기 위한 디지털오디오 신호의 전처리 방법 |
WO2005111568A1 (ja) * | 2004-05-14 | 2005-11-24 | Matsushita Electric Industrial Co., Ltd. | 符号化装置、復号化装置、およびこれらの方法 |
CN1295678C (zh) * | 2004-05-18 | 2007-01-17 | 中国科学院声学研究所 | 子带自适应谷点降噪***和方法 |
KR100657916B1 (ko) | 2004-12-01 | 2006-12-14 | 삼성전자주식회사 | 주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치및 방법 |
US20060224381A1 (en) * | 2005-04-04 | 2006-10-05 | Nokia Corporation | Detecting speech frames belonging to a low energy sequence |
KR100757858B1 (ko) * | 2005-09-30 | 2007-09-11 | 와이더댄 주식회사 | 선택적 인코딩 시스템 및 상기 선택적 인코딩 시스템의동작 방법 |
KR100717058B1 (ko) * | 2005-11-28 | 2007-05-14 | 삼성전자주식회사 | 고주파 성분 복원 방법 및 그 장치 |
CN101213589B (zh) * | 2006-01-12 | 2011-04-27 | 松下电器产业株式会社 | 对象声音分析装置和对象声音分析方法 |
EP1984911A4 (en) * | 2006-01-18 | 2012-03-14 | Lg Electronics Inc | DEVICE AND METHOD FOR SIGNAL CODING AND DECODING |
CN101379548B (zh) | 2006-02-10 | 2012-07-04 | 艾利森电话股份有限公司 | 语音检测器和用于其中抑制子频带的方法 |
US8920343B2 (en) | 2006-03-23 | 2014-12-30 | Michael Edward Sabatino | Apparatus for acquiring and processing of physiological auditory signals |
CN100483509C (zh) * | 2006-12-05 | 2009-04-29 | 华为技术有限公司 | 声音信号分类方法和装置 |
CN101217037B (zh) * | 2007-01-05 | 2011-09-14 | 华为技术有限公司 | 对音频信号的编码速率进行源控的方法和*** |
JPWO2009038170A1 (ja) * | 2007-09-21 | 2011-01-06 | 日本電気株式会社 | 音声処理装置、音声処理方法、プログラム及び音楽・メロディ配信システム |
WO2009038115A1 (ja) * | 2007-09-21 | 2009-03-26 | Nec Corporation | 音声符号化装置、音声符号化方法及びプログラム |
US20090099851A1 (en) * | 2007-10-11 | 2009-04-16 | Broadcom Corporation | Adaptive bit pool allocation in sub-band coding |
US8554550B2 (en) * | 2008-01-28 | 2013-10-08 | Qualcomm Incorporated | Systems, methods, and apparatus for context processing using multi resolution analysis |
CN101335000B (zh) | 2008-03-26 | 2010-04-21 | 华为技术有限公司 | 编码的方法及装置 |
CN102396024A (zh) * | 2009-02-16 | 2012-03-28 | 韩国电子通信研究院 | 使用自适应正弦波脉冲编码的用于音频信号的编码/解码方法及其设备 |
CN104485118A (zh) | 2009-10-19 | 2015-04-01 | 瑞典爱立信有限公司 | 用于语音活动检测的检测器和方法 |
US9047878B2 (en) * | 2010-11-24 | 2015-06-02 | JVC Kenwood Corporation | Speech determination apparatus and speech determination method |
CN102985969B (zh) * | 2010-12-14 | 2014-12-10 | 松下电器(美国)知识产权公司 | 编码装置、解码装置和编码方法、解码方法 |
US8990074B2 (en) * | 2011-05-24 | 2015-03-24 | Qualcomm Incorporated | Noise-robust speech coding mode classification |
US8666753B2 (en) * | 2011-12-12 | 2014-03-04 | Motorola Mobility Llc | Apparatus and method for audio encoding |
US9263054B2 (en) * | 2013-02-21 | 2016-02-16 | Qualcomm Incorporated | Systems and methods for controlling an average encoding rate for speech signal encoding |
CN110265059B (zh) | 2013-12-19 | 2023-03-31 | 瑞典爱立信有限公司 | 估计音频信号中的背景噪声 |
US9564136B2 (en) | 2014-03-06 | 2017-02-07 | Dts, Inc. | Post-encoding bitrate reduction of multiple object audio |
ES2754706T3 (es) * | 2014-03-24 | 2020-04-20 | Nippon Telegraph & Telephone | Método de codificación, codificador, programa y soporte de registro |
ES2838006T3 (es) * | 2014-07-28 | 2021-07-01 | Nippon Telegraph & Telephone | Codificación de señal de sonido |
RU2713852C2 (ru) * | 2014-07-29 | 2020-02-07 | Телефонактиеболагет Лм Эрикссон (Пабл) | Оценивание фонового шума в аудиосигналах |
KR101619293B1 (ko) | 2014-11-12 | 2016-05-11 | 현대오트론 주식회사 | 전원 반도체의 제어 방법 및 제어 장치 |
CN107742521B (zh) | 2016-08-10 | 2021-08-13 | 华为技术有限公司 | 多声道信号的编码方法和编码器 |
CN110992963B (zh) * | 2019-12-10 | 2023-09-29 | 腾讯科技(深圳)有限公司 | 网络通话方法、装置、计算机设备及存储介质 |
WO2021253235A1 (zh) * | 2020-06-16 | 2021-12-23 | 华为技术有限公司 | 语音活动检测方法和装置 |
CN113611325B (zh) * | 2021-04-26 | 2023-07-04 | 珠海市杰理科技股份有限公司 | 基于清浊音实现的语音信号变速方法、装置和音频设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0287731A (ja) * | 1988-09-26 | 1990-03-28 | Fujitsu Ltd | 可変レート音声信号符号化方式 |
WO1992022891A1 (en) * | 1991-06-11 | 1992-12-23 | Qualcomm Incorporated | Variable rate vocoder |
JPH0537395A (ja) * | 1991-07-31 | 1993-02-12 | Matsushita Electric Ind Co Ltd | 帯域分割符号化方法 |
JPH066313A (ja) * | 1992-06-24 | 1994-01-14 | Nec Corp | 量子化ビット数割当方法 |
Family Cites Families (70)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3633107A (en) * | 1970-06-04 | 1972-01-04 | Bell Telephone Labor Inc | Adaptive signal processor for diversity radio receivers |
JPS5017711A (ja) * | 1973-06-15 | 1975-02-25 | ||
US4076958A (en) * | 1976-09-13 | 1978-02-28 | E-Systems, Inc. | Signal synthesizer spectrum contour scaler |
US4214125A (en) * | 1977-01-21 | 1980-07-22 | Forrest S. Mozer | Method and apparatus for speech synthesizing |
CA1123955A (en) * | 1978-03-30 | 1982-05-18 | Tetsu Taguchi | Speech analysis and synthesis apparatus |
DE3023375C1 (ja) * | 1980-06-23 | 1987-12-03 | Siemens Ag, 1000 Berlin Und 8000 Muenchen, De | |
JPS57177197A (en) * | 1981-04-24 | 1982-10-30 | Hitachi Ltd | Pick-up system for sound section |
USRE32580E (en) * | 1981-12-01 | 1988-01-19 | American Telephone And Telegraph Company, At&T Bell Laboratories | Digital speech coder |
JPS6011360B2 (ja) * | 1981-12-15 | 1985-03-25 | ケイディディ株式会社 | 音声符号化方式 |
US4535472A (en) * | 1982-11-05 | 1985-08-13 | At&T Bell Laboratories | Adaptive bit allocator |
EP0111612B1 (fr) * | 1982-11-26 | 1987-06-24 | International Business Machines Corporation | Procédé et dispositif de codage d'un signal vocal |
EP0127718B1 (fr) * | 1983-06-07 | 1987-03-18 | International Business Machines Corporation | Procédé de détection d'activité dans un système de transmission de la voix |
US4672670A (en) * | 1983-07-26 | 1987-06-09 | Advanced Micro Devices, Inc. | Apparatus and methods for coding, decoding, analyzing and synthesizing a signal |
EP0163829B1 (en) * | 1984-03-21 | 1989-08-23 | Nippon Telegraph And Telephone Corporation | Speech signal processing system |
DE3412430A1 (de) * | 1984-04-03 | 1985-10-03 | Nixdorf Computer Ag, 4790 Paderborn | Schalteranordnung |
EP0167364A1 (en) * | 1984-07-06 | 1986-01-08 | AT&T Corp. | Speech-silence detection with subband coding |
FR2577084B1 (fr) * | 1985-02-01 | 1987-03-20 | Trt Telecom Radio Electr | Systeme de bancs de filtres d'analyse et de synthese d'un signal |
US4885790A (en) * | 1985-03-18 | 1989-12-05 | Massachusetts Institute Of Technology | Processing of acoustic waveforms |
US4856068A (en) * | 1985-03-18 | 1989-08-08 | Massachusetts Institute Of Technology | Audio pre-processing methods and apparatus |
US4630304A (en) * | 1985-07-01 | 1986-12-16 | Motorola, Inc. | Automatic background noise estimator for a noise suppression system |
US4827517A (en) * | 1985-12-26 | 1989-05-02 | American Telephone And Telegraph Company, At&T Bell Laboratories | Digital speech processor using arbitrary excitation coding |
CA1299750C (en) * | 1986-01-03 | 1992-04-28 | Ira Alan Gerson | Optimal method of data reduction in a speech recognition system |
US4797929A (en) * | 1986-01-03 | 1989-01-10 | Motorola, Inc. | Word recognition in a speech recognition system using data reduced word templates |
US4899384A (en) * | 1986-08-25 | 1990-02-06 | Ibm Corporation | Table controlled dynamic bit allocation in a variable rate sub-band speech coder |
US4771465A (en) * | 1986-09-11 | 1988-09-13 | American Telephone And Telegraph Company, At&T Bell Laboratories | Digital speech sinusoidal vocoder with transmission of only subset of harmonics |
US4797925A (en) * | 1986-09-26 | 1989-01-10 | Bell Communications Research, Inc. | Method for coding speech at low bit rates |
US4903301A (en) * | 1987-02-27 | 1990-02-20 | Hitachi, Ltd. | Method and system for transmitting variable rate speech signal |
US5054072A (en) * | 1987-04-02 | 1991-10-01 | Massachusetts Institute Of Technology | Coding of acoustic waveforms |
US4868867A (en) * | 1987-04-06 | 1989-09-19 | Voicecraft Inc. | Vector excitation speech or audio coder for transmission or storage |
US4890327A (en) * | 1987-06-03 | 1989-12-26 | Itt Corporation | Multi-rate digital voice coder apparatus |
US4899385A (en) * | 1987-06-26 | 1990-02-06 | American Telephone And Telegraph Company | Code excited linear predictive vocoder |
CA1337217C (en) * | 1987-08-28 | 1995-10-03 | Daniel Kenneth Freeman | Speech coding |
JPS6491200A (en) * | 1987-10-02 | 1989-04-10 | Fujitsu Ltd | Voice analysis system and voice synthesization system |
US4852179A (en) * | 1987-10-05 | 1989-07-25 | Motorola, Inc. | Variable frame rate, fixed bit rate vocoding method |
US4817157A (en) * | 1988-01-07 | 1989-03-28 | Motorola, Inc. | Digital speech coder having improved vector excitation source |
US4897832A (en) † | 1988-01-18 | 1990-01-30 | Oki Electric Industry Co., Ltd. | Digital speech interpolation system and speech detector |
DE3883519T2 (de) * | 1988-03-08 | 1994-03-17 | Ibm | Verfahren und Einrichtung zur Sprachkodierung mit mehreren Datenraten. |
EP0331857B1 (en) * | 1988-03-08 | 1992-05-20 | International Business Machines Corporation | Improved low bit rate voice coding method and system |
CA1335003C (en) * | 1988-03-11 | 1995-03-28 | Daniel Kenneth Freeman | Voice activity detection |
US5023910A (en) * | 1988-04-08 | 1991-06-11 | At&T Bell Laboratories | Vector quantization in a harmonic speech coding arrangement |
US4864561A (en) * | 1988-06-20 | 1989-09-05 | American Telephone And Telegraph Company | Technique for improved subjective performance in a communication system using attenuated noise-fill |
CA1321645C (en) * | 1988-09-28 | 1993-08-24 | Akira Ichikawa | Method and system for voice coding based on vector quantization |
JP3033060B2 (ja) * | 1988-12-22 | 2000-04-17 | 国際電信電話株式会社 | 音声予測符号化・復号化方式 |
US5222189A (en) * | 1989-01-27 | 1993-06-22 | Dolby Laboratories Licensing Corporation | Low time-delay transform coder, decoder, and encoder/decoder for high-quality audio |
EP0392126B1 (en) * | 1989-04-11 | 1994-07-20 | International Business Machines Corporation | Fast pitch tracking process for LTP-based speech coders |
JPH0754434B2 (ja) * | 1989-05-08 | 1995-06-07 | 松下電器産業株式会社 | 音声認識装置 |
US5060269A (en) * | 1989-05-18 | 1991-10-22 | General Electric Company | Hybrid switched multi-pulse/stochastic speech coding technique |
GB2235354A (en) * | 1989-08-16 | 1991-02-27 | Philips Electronic Associated | Speech coding/encoding using celp |
US5054075A (en) * | 1989-09-05 | 1991-10-01 | Motorola, Inc. | Subband decoding method and apparatus |
US5185800A (en) * | 1989-10-13 | 1993-02-09 | Centre National D'etudes Des Telecommunications | Bit allocation device for transformed digital audio broadcasting signals with adaptive quantization based on psychoauditive criterion |
US5307441A (en) † | 1989-11-29 | 1994-04-26 | Comsat Corporation | Wear-toll quality 4.8 kbps speech codec |
JP3004664B2 (ja) * | 1989-12-21 | 2000-01-31 | 株式会社東芝 | 可変レート符号化方法 |
JP2861238B2 (ja) * | 1990-04-20 | 1999-02-24 | ソニー株式会社 | ディジタル信号符号化方法 |
JP2751564B2 (ja) * | 1990-05-25 | 1998-05-18 | ソニー株式会社 | ディジタル信号符号化装置 |
US5103459B1 (en) * | 1990-06-25 | 1999-07-06 | Qualcomm Inc | System and method for generating signal waveforms in a cdma cellular telephone system |
JPH04100099A (ja) * | 1990-08-20 | 1992-04-02 | Nippon Telegr & Teleph Corp <Ntt> | 音声検出装置 |
JPH04157817A (ja) * | 1990-10-20 | 1992-05-29 | Fujitsu Ltd | 可変レート符号化装置 |
US5206884A (en) * | 1990-10-25 | 1993-04-27 | Comsat | Transform domain quantization technique for adaptive predictive coding |
JP2906646B2 (ja) * | 1990-11-09 | 1999-06-21 | 松下電器産業株式会社 | 音声帯域分割符号化装置 |
US5317672A (en) * | 1991-03-05 | 1994-05-31 | Picturetel Corporation | Variable bit rate speech encoder |
KR940001861B1 (ko) * | 1991-04-12 | 1994-03-09 | 삼성전자 주식회사 | 오디오 대역신호의 음성/음악 판별장치 |
US5187745A (en) * | 1991-06-27 | 1993-02-16 | Motorola, Inc. | Efficient codebook search for CELP vocoders |
EP0525774B1 (en) * | 1991-07-31 | 1997-02-26 | Matsushita Electric Industrial Co., Ltd. | Digital audio signal coding system and method therefor |
US5410632A (en) † | 1991-12-23 | 1995-04-25 | Motorola, Inc. | Variable hangover time in a voice activity detector |
JP3088838B2 (ja) * | 1992-04-09 | 2000-09-18 | シャープ株式会社 | 音楽検出回路及び該回路を用いた音声信号入力装置 |
US5341456A (en) * | 1992-12-02 | 1994-08-23 | Qualcomm Incorporated | Method for determining speech encoding rate in a variable rate vocoder |
US5457769A (en) * | 1993-03-30 | 1995-10-10 | Earmark, Inc. | Method and apparatus for detecting the presence of human voice signals in audio signals |
US5644596A (en) † | 1994-02-01 | 1997-07-01 | Qualcomm Incorporated | Method and apparatus for frequency selective adaptive filtering |
US5742734A (en) † | 1994-08-10 | 1998-04-21 | Qualcomm Incorporated | Encoding rate selection in a variable rate vocoder |
US6134215A (en) | 1996-04-02 | 2000-10-17 | Qualcomm Incorpoated | Using orthogonal waveforms to enable multiple transmitters to share a single CDM channel |
-
1994
- 1994-08-10 US US08/288,413 patent/US5742734A/en not_active Expired - Lifetime
-
1995
- 1995-07-08 TW TW084107075A patent/TW277189B/zh not_active IP Right Cessation
- 1995-07-20 ZA ZA956081A patent/ZA956081B/xx unknown
- 1995-08-01 AT AT95929372T patent/ATE235734T1/de active
- 1995-08-01 MX MX9600920A patent/MX9600920A/es unknown
- 1995-08-01 CN CNA2004100016646A patent/CN1512488A/zh active Pending
- 1995-08-01 AT AT06013824T patent/ATE386321T1/de not_active IP Right Cessation
- 1995-08-01 CN CNA2006101003869A patent/CN1945696A/zh active Pending
- 1995-08-01 ES ES06013824T patent/ES2299122T3/es not_active Expired - Lifetime
- 1995-08-01 DE DE69533881T patent/DE69533881T2/de not_active Expired - Lifetime
- 1995-08-01 EP EP06013824A patent/EP1703493B1/en not_active Expired - Lifetime
- 1995-08-01 ES ES95929372T patent/ES2194921T3/es not_active Expired - Lifetime
- 1995-08-01 EP EP95929372A patent/EP0728350B1/en not_active Expired - Lifetime
- 1995-08-01 DE DE69534285T patent/DE69534285T3/de not_active Expired - Lifetime
- 1995-08-01 CN CNB951907174A patent/CN1168071C/zh not_active Expired - Lifetime
- 1995-08-01 DK DK02009465T patent/DK1233408T3/da active
- 1995-08-01 ES ES02009467T patent/ES2240602T5/es not_active Expired - Lifetime
- 1995-08-01 BR BRPI9510780-0A patent/BR9510780B1/pt not_active IP Right Cessation
- 1995-08-01 CN CNB2004100016650A patent/CN1320521C/zh not_active Expired - Lifetime
- 1995-08-01 DK DK02009467.8T patent/DK1239465T4/da active
- 1995-08-01 EP EP05001938A patent/EP1530201B1/en not_active Expired - Lifetime
- 1995-08-01 AT AT02009465T patent/ATE285620T1/de active
- 1995-08-01 KR KR1019960701839A patent/KR100455826B1/ko not_active IP Right Cessation
- 1995-08-01 WO PCT/US1995/009830 patent/WO1996005592A1/en active IP Right Grant
- 1995-08-01 JP JP50740496A patent/JP3502101B2/ja not_active Expired - Lifetime
- 1995-08-01 AU AU32751/95A patent/AU711401B2/en not_active Expired
- 1995-08-01 ES ES05001938T patent/ES2281854T3/es not_active Expired - Lifetime
- 1995-08-01 DE DE69530066T patent/DE69530066T2/de not_active Expired - Lifetime
- 1995-08-01 EP EP02009465A patent/EP1233408B1/en not_active Expired - Lifetime
- 1995-08-01 KR KR10-2003-7005883A patent/KR20040004420A/ko not_active Application Discontinuation
- 1995-08-01 AT AT05001938T patent/ATE358871T1/de not_active IP Right Cessation
- 1995-08-01 DE DE69535709T patent/DE69535709T2/de not_active Expired - Lifetime
- 1995-08-01 PT PT02009467T patent/PT1239465E/pt unknown
- 1995-08-01 BR BR9506036A patent/BR9506036A/pt not_active Application Discontinuation
- 1995-08-01 PT PT95929372T patent/PT728350E/pt unknown
- 1995-08-01 DK DK95929372T patent/DK0728350T3/da active
- 1995-08-01 KR KR10-2003-7005884A patent/KR100455225B1/ko not_active IP Right Cessation
- 1995-08-01 CA CA002171009A patent/CA2171009C/en not_active Expired - Lifetime
- 1995-08-01 EP EP02009467A patent/EP1239465B2/en not_active Expired - Lifetime
- 1995-08-01 AT AT02009467T patent/ATE298124T1/de active
- 1995-08-01 CA CA2488918A patent/CA2488918C/en not_active Expired - Lifetime
- 1995-08-01 ES ES02009465T patent/ES2233739T3/es not_active Expired - Lifetime
- 1995-08-01 CN CNB2004100016631A patent/CN100508028C/zh not_active Expired - Lifetime
- 1995-08-01 EP EP04003180A patent/EP1424686A3/en not_active Ceased
- 1995-08-01 PT PT02009465T patent/PT1233408E/pt unknown
- 1995-08-01 CA CA2488921A patent/CA2488921C/en not_active Expired - Lifetime
- 1995-08-01 DE DE69535452T patent/DE69535452T2/de not_active Expired - Lifetime
- 1995-08-08 IL IL11487495A patent/IL114874A/xx not_active IP Right Cessation
-
1996
- 1996-03-08 FI FI961112A patent/FI117993B/fi not_active IP Right Cessation
-
1998
- 1998-12-28 HK HK98116184A patent/HK1015185A1/xx not_active IP Right Cessation
-
2003
- 2003-08-21 JP JP2003297412A patent/JP2004004971A/ja not_active Withdrawn
- 2003-08-21 JP JP2003297413A patent/JP3927159B2/ja not_active Expired - Lifetime
-
2005
- 2005-07-01 FI FI20050703A patent/FI123708B/fi not_active IP Right Cessation
- 2005-07-01 FI FI20050704A patent/FI122272B/fi not_active IP Right Cessation
- 2005-07-01 FI FI20050702A patent/FI122273B/fi not_active IP Right Cessation
- 2005-10-31 HK HK05109679A patent/HK1077911A1/xx not_active IP Right Cessation
-
2006
- 2006-12-07 FI FI20061084A patent/FI119085B/fi not_active IP Right Cessation
-
2007
- 2007-05-31 JP JP2007145736A patent/JP2007293355A/ja not_active Withdrawn
- 2007-05-31 JP JP2007145738A patent/JP4680958B2/ja not_active Expired - Lifetime
- 2007-05-31 JP JP2007145735A patent/JP4680956B2/ja not_active Expired - Lifetime
- 2007-05-31 JP JP2007145737A patent/JP4680957B2/ja not_active Expired - Lifetime
-
2011
- 2011-04-21 JP JP2011095137A patent/JP4870846B2/ja not_active Expired - Lifetime
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0287731A (ja) * | 1988-09-26 | 1990-03-28 | Fujitsu Ltd | 可変レート音声信号符号化方式 |
WO1992022891A1 (en) * | 1991-06-11 | 1992-12-23 | Qualcomm Incorporated | Variable rate vocoder |
JPH0537395A (ja) * | 1991-07-31 | 1993-02-12 | Matsushita Electric Ind Co Ltd | 帯域分割符号化方法 |
JPH066313A (ja) * | 1992-06-24 | 1994-01-14 | Nec Corp | 量子化ビット数割当方法 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021006898A (ja) * | 2019-06-10 | 2021-01-21 | アクシス アーベー | 方法、コンピュータプログラム、エンコーダ、及びモニタリングデバイス |
JP7125447B2 (ja) | 2019-06-10 | 2022-08-24 | アクシス アーベー | 方法、コンピュータプログラム、エンコーダ、及びモニタリングデバイス |
TWI820333B (zh) * | 2019-06-10 | 2023-11-01 | 瑞典商安訊士有限公司 | 方法,電腦程式,編碼器和監控裝置 |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4870846B2 (ja) | 可変レートボコーダのエンコードレート決定方法および装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111018 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111117 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141125 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |