JP5061111B2 - 音声符号化装置および音声符号化方法 - Google Patents
音声符号化装置および音声符号化方法 Download PDFInfo
- Publication number
- JP5061111B2 JP5061111B2 JP2008534412A JP2008534412A JP5061111B2 JP 5061111 B2 JP5061111 B2 JP 5061111B2 JP 2008534412 A JP2008534412 A JP 2008534412A JP 2008534412 A JP2008534412 A JP 2008534412A JP 5061111 B2 JP5061111 B2 JP 5061111B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- noise
- correction coefficient
- speech
- noise ratio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 32
- 238000012937 correction Methods 0.000 claims description 243
- 238000004364 calculation method Methods 0.000 claims description 127
- 230000005236 sound signal Effects 0.000 claims description 119
- 238000013139 quantization Methods 0.000 claims description 84
- 238000004458 analytical method Methods 0.000 claims description 54
- 238000012546 transfer Methods 0.000 claims description 40
- 238000001914 filtration Methods 0.000 claims description 38
- 230000003595 spectral effect Effects 0.000 claims description 32
- 230000008569 process Effects 0.000 claims description 16
- 230000003044 adaptive effect Effects 0.000 claims description 15
- 238000000605 extraction Methods 0.000 claims 2
- 230000015572 biosynthetic process Effects 0.000 description 64
- 238000003786 synthesis reaction Methods 0.000 description 64
- 238000001514 detection method Methods 0.000 description 62
- 230000006870 function Effects 0.000 description 44
- 238000009499 grossing Methods 0.000 description 36
- 238000010586 diagram Methods 0.000 description 34
- 230000014509 gene expression Effects 0.000 description 29
- 238000001228 spectrum Methods 0.000 description 29
- 238000012545 processing Methods 0.000 description 28
- 238000007493 shaping process Methods 0.000 description 24
- 230000004044 response Effects 0.000 description 20
- 230000000694 effects Effects 0.000 description 12
- 230000001629 suppression Effects 0.000 description 6
- 230000007774 longterm Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 230000005284 excitation Effects 0.000 description 4
- 230000006866 deterioration Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 238000005311 autocorrelation function Methods 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 230000000630 rising effect Effects 0.000 description 2
- 208000037656 Respiratory Sounds Diseases 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
- G10L19/265—Pre-filtering, e.g. high frequency emphasis prior to encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
覚重み付けフィルタの特性を切り替える。音声区間とは、音声信号が支配的な区間であって、背景雑音区間とは、非音声信号が支配的な区間である。特許文献2記載の技術によれば、背景雑音区間と音声区間とを区別して、聴覚重み付けフィルタの特性を切り替えることにより、音声信号の各区間に適応した聴覚重み付けフィルタリングを行うことができる。
図1は、本発明の実施の形態1に係る音声符号化装置100の主要な構成を示すブロック図である。
号化パラメータCLと、音源探索部107から入力される音源符号化パラメータCEとを多重し、得られるビットストリームを復号側に送信する。
EH=10log10(|AH|2) …(5)
EL=10log10(|AL|2) …(6)
式(7)に従って行う。
ENH=αENH+(1−α)EH …(7)
ENL=αENL+(1−α)EL …(8)
斜補正係数算出部141に出力する。
γ3’=β(低域SNR−高域SNR)+C …(9)
限値を決定することで、背景雑音平均エネルギレベルが低い場合に量子化雑音の低域成分を高くシェイピングしすぎないようにしている。
γ3=βγ3+(1−β)γ3’ …(10)
音声区間であるかを判定し、判定の結果を雑音区間検出結果として高域雑音レベル更新部136および低域雑音レベル更新部137に出力する。具体的には、雑音判定部155は、線形予測残差の2乗平均値が所定の閾値未満であってかつピッチ予測利得が所定の閾値未満である場合、または無音判定部153から入力される無音判定結果が無音区間を示す場合には、入力音声信号が雑音区間であると判定し、他の場合には入力音声信号が音声区間であると判定する。
、量子化雑音のスペクトル傾斜の調整機能をさらに補正するため、ホルマント重み付けを変えずに量子化雑音のスペクトル傾斜を調整することができる。
図6は、本発明の実施の形態2に係る音声符号化装置200の主要な構成を示すブロック図である。
である。すなわち、聴覚重み付けフィルタ206の伝達関数は下記の式(18)で示される。
られる信号をメモリ更新部210に出力する。
となる。また、フィルタ処理を複数段階に分けることによって生じる演算精度の劣化を回避し、符号化精度を向上することができる。全体的に、本実施の形態に係る音声符号化装置200を構成するフィルタの数は6個であり、実施の形態1に示した音声符号化装置100を構成するフィルタの数11個であるため、数の差が5個となる。
図7は、本発明の実施の形態3に係る音声符号化装置300の主要な構成を示すブロック図である。なお、音声符号化装置300は、実施の形態1に示した音声符号化装置100(図1参照)と同様の基本的構成を有しており、同一の構成要素には同一の符号を付し、その説明を省略する。なお、音声符号化装置300のLPC分析部301、傾斜補正係数制御部303、および音源探索部307は、音声符号化装置100のLPC分析部101、傾斜補正係数制御部103、および音源探索部107と処理の一部に相違点があり、それを示すために異なる符号を付し、以下、これらについてのみ説明する。
高域雑音レベル更新部136および低域雑音レベル更新部137は、このようにバイアスが掛けられた音声信号高域成分エネルギレベルおよび音声信号低域成分エネルギレベルを用いる。これにより、加算器138および139において、背景雑音のないクリーンな音声データに対しても安定したSNRを得ることができる。
本発明の実施の形態4に係る音声符号化装置は、本発明の実施の形態3に係る音声符号化装置300と同様の基本的構成を有しており、同様の基本的動作を行うため、図示せず、なお、詳細な説明を略す。ただし、本実施の形態に係る音声符号化装置の傾斜補正係数制御部403と、実施の形態3に係る音声符号化装置300の傾斜補正係数制御部303とは一部の処理において相違点があり、それを示すために異なる符号を付し、以下、傾斜補正係数制御部403についてのみ説明する。
の場合には入力音声信号が音声区間であると判定する。ここで、第1カウンタの値に対応する閾値として、例えば、100を用いて、第2カウンタの値に対応する閾値として、例えば、10を用い、高域SNRおよび低域SNRに対応する閾値として、例えば、5dBを用いる。
本発明の実施の形態5においては、適応マルチレートワイドバンド(AMR−WB:Adaptive MultiRate - WideBand)音声符号化において、量子化雑音のスペクトル傾斜を適応的に調整し、背景雑音信号と音声信号とが重畳した雑音音声重畳区間に対しても適した聴覚重み付けフィルタリングを行うことができる音声符号化方法について説明する。
γ3”=Kmax−S(Kmax−Kmin)/Th1 …(25)
γ3”=Kmin−Th1(Kmax−Kmin)/(Th2−Th1)+S(Kmax−Kmin)/(Th2−Th1) …(26)
補正係数制御部503を備えない場合に、聴覚重み付けフィルタ505−1〜505−3に用いられる定数の傾斜補正係数γ3”の値である。また、KminおよびKmaxは、0<Kmin<Kmax<1を満たす定数である。
、Kmaxより小さい値の傾斜補正係数γ3”を算出する。これにより、量子化誤差スペクトルは低域が持ち上げられたグラフ703のようになる。
図16は、本発明の実施の形態6に係る音声符号化装置600の主要な構成を示すブロック図である。図16に示す音声符号化装置600は、実施の形態5に示した音声符号化装置500(図12参照)と同様の基本的構成を有しており、同一の構成要素には同一の符号を付し、その説明を省略する。
E=10log10(|A|2) …(28)
EN=αEN+(1−α)E …(29)
ルギレベル算出部611から雑音レベル更新部613に入力される音声信号エネルギレベル、すなわち、この式に示すEは、背景雑音のエネルギレベルとなる。ENは雑音レベル更新部613が保持している背景雑音の平均エネルギレベルを示し、αは長期平滑化係数であって、0≦α<1である。雑音レベル更新部613は、保持している背景雑音の平均エネルギレベルを加算器614に出力する。
γ=SKmax/Th1 …(31)
γ=Kmax−Kmax(S−Th1)/(Th2−Th1) …(32)
信号の雑音区間の平均的なスペクトル特性を表す線形予測係数に乗じて重み係数を算出し、この重み係数を用いて聴覚重み付けフィルタの線形予測逆フィルタを構成するため、入力信号のスペクトル特性に合わせて量子化雑音スペクトル包絡を調整し、復号音声の音質を向上することができる。
本発明の実施の形態7に係る音声符号化装置(図示せず)は、実施の形態5に示した音声符号化装置500と基本的に同様な構成を有し、傾斜補正係数制御部503の内部の構成および処理動作のみが異なる。
D2=λ×Nd×D1(ただし、0≦λ×Nd≦1) …(33)
正係数とは、本実施の形態に係る音声符号化装置が仮に傾斜補正係数制御部503を備えない場合に、聴覚重み付けフィルタ505−1〜505−3に用いられる定数の傾斜補正係数を指す。
D2’=λ’×En×D2(ただし、(0≦(λ’×En)≦1) …(34)
Claims (10)
- 音声信号に対し線形予測分析を行って線形予測係数を生成する線形予測分析手段と、
前記線形予測係数を量子化する量子化手段と、
前記量子化の雑音のスペクトル傾斜を調整するための傾斜補正係数を含む伝達関数を用いて、入力音声信号に対し聴覚重み付けフィルタリングを行い聴覚重み付け音声信号を生成する聴覚重み付け手段と、
前記音声信号の第1周波数帯域の信号対雑音比を用いて、前記傾斜補正係数を制御する傾斜補正係数制御手段と、
前記聴覚重み付け音声信号を用いて適応符号帳および固定符号帳の音源探索を行い音源信号を生成する音源探索手段と、
を具備し、
前記傾斜補正係数制御手段は、
前記音声信号の第1周波数帯域の第1信号の信号対雑音比と、前記音声信号の第1周波数帯域よりも高い第2周波数帯域の第2信号の信号対雑音比とを用いて、前記傾斜補正係数を制御し、
前記傾斜補正係数制御手段は、
前記音声信号から前記第1信号と前記第2信号とを抽出する抽出手段と、
前記第1信号のエネルギと、前記第2信号のエネルギとを算出するエネルギ算出手段と、
前記第1信号の雑音区間のエネルギと、前記第2信号の雑音区間のエネルギとを算出する雑音区間エネルギ算出手段と、
前記第1信号の信号対雑音比と、前記第2信号の信号対雑音比とを算出する信号対雑音比算出手段と、
前記第1信号の信号対雑音比と、前記第2信号の信号対雑音比との差に第1定数を乗算し、さらに第2定数を加算して前記傾斜補正係数を得る傾斜補正係数算出手段と、
を具備する、
音声符号化装置。 - 前記傾斜補正係数は、
前記第1信号の信号対雑音比よりも前記第2信号の信号対雑音比が高いほど前記量子化雑音の低域成分をより高くシェイピングし、前記第2信号の信号対雑音比よりも前記第1信号の信号対雑音比が高いほど前記量子化雑音の高域成分をより高くシェイピングする傾斜補正係数である、
請求項1記載の音声符号化装置。 - 前記傾斜補正係数制御手段は、
前記第1信号の雑音区間のエネルギと、前記第2信号の雑音区間のエネルギとを加算し、さらに第3定数を乗算して前記傾斜補正係数の下限値を算出する下限値算出手段と、
前記傾斜補正係数を、前記下限値以上、かつ、あらかじめ定めた上限値以下の範囲内に制限する制限手段と、
をさらに具備する請求項1記載の音声符号化装置。 - 前記傾斜補正係数制御手段は、
前記音声信号を用いて算出されたエネルギが第1の閾値未満である区間、または前記音声信号に対し線形予測分析を行って得られる線形予測利得の逆数に相当するパラメータが第2の閾値未満であってかつ前記音声信号に対しピッチ分析を行い得られるピッチ予測利得が第3の閾値未満である区間を雑音区間として検出する雑音区間検出手段と、
を具備する請求項1記載の音声符号化装置。 - 前記雑音区間検出手段は、
前記第1信号のエネルギと、前記第2信号のエネルギとを加算して得られるエネルギと、前記線形予測分析手段における線形予測分析の過程で得られる線形予測利得に関するパラメータと、前記音源探索の過程で得られるピッチ予測利得とを用いて前記音声信号の雑音区間を検出する、
請求項4記載の音声符号化装置。 - 前記音声信号において、連続的に雑音区間と判定されるフレームの数をカウントする第1カウンタと、連続的に音声区間と判定されるフレームの数をカウントする第2カウンタと、をさらに具備し、
前記雑音区間検出手段は、
前記検出された雑音区間において、前記第1カウンタの値が第4の閾値未満であるか、前記第2カウンタの値が第5の閾値以上であるか、または前記第1信号の信号対雑音比と、前記第2信号の信号対雑音比との両方が第6の閾値未満であるか、のいずれかに該当する区間をさらに検出する、
請求項5記載の音声符号化装置。 - 音声信号に対し線形予測分析を行って線形予測係数を生成する線形予測分析手段と、
前記線形予測係数を量子化する量子化手段と、
前記量子化の雑音のスペクトル傾斜を調整するための傾斜補正係数を含む伝達関数を用いて、入力音声信号に対し聴覚重み付けフィルタリングを行い聴覚重み付け音声信号を生成する聴覚重み付け手段と、
前記音声信号の第1周波数帯域の信号対雑音比を用いて、前記傾斜補正係数を制御する傾斜補正係数制御手段と、
前記聴覚重み付け音声信号を用いて適応符号帳および固定符号帳の音源探索を行い音源信号を生成する音源探索手段と、
を具備し、
前記傾斜補正係数制御手段は、
前記音声信号から前記第1周波数帯域の第1信号を抽出する抽出手段と、
前記第1信号のエネルギを算出するエネルギ算出手段と、
前記第1信号の雑音区間のエネルギを算出する雑音区間エネルギ算出手段と、
前記第1信号の信号対雑音比が第1の閾値以上である場合には、前記第1信号の信号対雑音比が大きいほど前記傾斜補正係数の値をより大きくし、前記第1信号の信号対雑音比が第1の閾値より小さい場合には、前記第1信号の信号対雑音比が小さいほど前記傾斜補正係数の値をより大きくする傾斜補正係数算出手段と、
を具備し、
前記傾斜補正係数算出手段は、
前記傾斜補正係数の値を所定の範囲に制限し、前記第1信号の信号対雑音比が第2の閾値以下または第3の閾値以上である場合には、前記傾斜補正係数の値を前記所定の範囲の最大値にする、
音声符号化装置。 - 音声信号に対し線形予測分析を行って線形予測係数を生成する線形予測分析手段と、
前記線形予測係数を量子化する量子化手段と、
前記量子化の雑音のスペクトル傾斜を調整するための傾斜補正係数を含む伝達関数を用いて、入力音声信号に対し聴覚重み付けフィルタリングを行い聴覚重み付け音声信号を生成する聴覚重み付け手段と、
前記音声信号の信号対雑音比を用いて、前記聴覚重み付け手段において入力音声信号に対し聴覚重み付けフィルタリングを行う線形予測逆フィルタを構成する重み係数を制御する重み係数制御手段と、
前記聴覚重み付け音声信号を用いて適応符号帳および固定符号帳の音源探索を行い音源信号を生成する音源探索手段と、
を具備し、
前記重み係数制御手段は、
前記音声信号のエネルギを算出するエネルギ算出手段と、
前記音声信号の雑音区間のエネルギを算出する雑音区間エネルギ算出手段と、
前記音声信号の信号対雑音比が第1の閾値以上である場合には、前記音声信号の信号対雑音比が大きいほどより大きくなり、前記音声信号の信号対雑音比が第1の閾値より小さい場合には、前記音声信号の信号対雑音比が小さいほどより小さくなる調整係数を算出し、前記音声信号の雑音区間の線形予測係数に前記調整係数を乗じて前記重み係数を算出する算出手段と、
を具備し、
前記算出手段は、
前記音声信号の信号対雑音比が第2の閾値以下または第3の閾値以上である場合には、前記調整係数を「0」とする、
音声符号化装置。 - 音声信号に対し線形予測分析を行って線形予測係数を生成する線形予測分析手段と、
前記線形予測係数を量子化する量子化手段と、
前記量子化の雑音のスペクトル傾斜を調整するための傾斜補正係数を含む伝達関数を用いて、入力音声信号に対し聴覚重み付けフィルタリングを行い聴覚重み付け音声信号を生成する聴覚重み付け手段と、
前記音声信号の第1周波数帯域の信号対雑音比を用いて、前記傾斜補正係数を制御する傾斜補正係数制御手段と、
前記聴覚重み付け音声信号を用いて適応符号帳および固定符号帳の音源探索を行い音源信号を生成する音源探索手段と、
を具備し、
前記傾斜補正係数制御手段は、
前記音声信号の第1周波数帯域におけるエネルギと、前記音声信号の前記第1周波数帯域よりも高い第2周波数帯域におけるエネルギを算出するエネルギ算出手段と、
前記音声信号の第1周波数帯域および第2周波数帯域それぞれにおける雑音区間のエネルギを算出する雑音区間エネルギ算出手段と、
前記音声信号の第1周波数帯域における信号対雑音比を算出する信号対雑音比算出手段と、
前記音声信号の第1周波数帯域における信号対雑音比と、前記音声信号の第1周波数帯域および第2周波数帯域それぞれにおける雑音区間のエネルギの比と、に基づき前記傾斜補正係数を算出する傾斜補正係数算出手段と、
を具備する、
音声符号化装置。 - 音声信号に対し線形予測分析を行って線形予測係数を生成するステップと、
前記線形予測係数を量子化するステップと、
前記量子化の雑音のスペクトル傾斜を調整するための傾斜補正係数を含む伝達関数を用いて、入力音声信号に対し聴覚重み付けフィルタリングを行い聴覚重み付け音声信号を生成するステップと、
前記音声信号の第1周波数帯域の信号対雑音比を用いて、前記傾斜補正係数を制御するステップと、
前記聴覚重み付け音声信号を用いて適応符号帳および固定符号帳の音源探索を行い音源信号を生成するステップと、
を具備し、
前記傾斜補正係数を制御するステップは、
前記音声信号の第1周波数帯域の第1信号の信号対雑音比と、前記音声信号の第1周波数帯域よりも高い第2周波数帯域の第2信号の信号対雑音比とを用いて、前記傾斜補正係数を制御し、
前記傾斜補正係数を制御するステップは、
前記音声信号から前記第1信号と前記第2信号とを抽出するステップと、
前記第1信号のエネルギと、前記第2信号のエネルギとを算出するステップと、
前記第1信号の雑音区間のエネルギと、前記第2信号の雑音区間のエネルギとを算出するステップと、
前記第1信号の信号対雑音比と、前記第2信号の信号対雑音比とを算出するステップと、
前記第1信号の信号対雑音比と、前記第2信号の信号対雑音比との差に第1定数を乗算し、さらに第2定数を加算して前記傾斜補正係数を得るステップと、
を具備する音声符号化方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008534412A JP5061111B2 (ja) | 2006-09-15 | 2007-09-14 | 音声符号化装置および音声符号化方法 |
Applications Claiming Priority (8)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006251532 | 2006-09-15 | ||
JP2006251532 | 2006-09-15 | ||
JP2007051486 | 2007-03-01 | ||
JP2007051486 | 2007-03-01 | ||
JP2007216246 | 2007-08-22 | ||
JP2007216246 | 2007-08-22 | ||
PCT/JP2007/067960 WO2008032828A1 (fr) | 2006-09-15 | 2007-09-14 | Dispositif de codage audio et procédé de codage audio |
JP2008534412A JP5061111B2 (ja) | 2006-09-15 | 2007-09-14 | 音声符号化装置および音声符号化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2008032828A1 JPWO2008032828A1 (ja) | 2010-01-28 |
JP5061111B2 true JP5061111B2 (ja) | 2012-10-31 |
Family
ID=39183880
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008534412A Expired - Fee Related JP5061111B2 (ja) | 2006-09-15 | 2007-09-14 | 音声符号化装置および音声符号化方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US8239191B2 (ja) |
EP (1) | EP2063418A4 (ja) |
JP (1) | JP5061111B2 (ja) |
WO (1) | WO2008032828A1 (ja) |
Families Citing this family (41)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006009074A1 (ja) * | 2004-07-20 | 2006-01-26 | Matsushita Electric Industrial Co., Ltd. | 音声復号化装置および補償フレーム生成方法 |
US7844453B2 (en) | 2006-05-12 | 2010-11-30 | Qnx Software Systems Co. | Robust noise estimation |
US8335685B2 (en) | 2006-12-22 | 2012-12-18 | Qnx Software Systems Limited | Ambient noise compensation system robust to high excitation noise |
US8326620B2 (en) * | 2008-04-30 | 2012-12-04 | Qnx Software Systems Limited | Robust downlink speech and noise detector |
US8032359B2 (en) | 2007-02-14 | 2011-10-04 | Mindspeed Technologies, Inc. | Embedded silence and background noise compression |
EP2116997A4 (en) | 2007-03-02 | 2011-11-23 | Panasonic Corp | AUDIO DECODING DEVICE AND AUDIO DECODING METHOD |
ATE456130T1 (de) * | 2007-10-29 | 2010-02-15 | Harman Becker Automotive Sys | Partielle sprachrekonstruktion |
WO2009084221A1 (ja) * | 2007-12-27 | 2009-07-09 | Panasonic Corporation | 符号化装置、復号装置およびこれらの方法 |
CN101483495B (zh) * | 2008-03-20 | 2012-02-15 | 华为技术有限公司 | 一种背景噪声生成方法以及噪声处理装置 |
JP5245714B2 (ja) * | 2008-10-24 | 2013-07-24 | ヤマハ株式会社 | 雑音抑圧装置及び雑音抑圧方法 |
JP5131149B2 (ja) * | 2008-10-24 | 2013-01-30 | ヤマハ株式会社 | 雑音抑圧装置及び雑音抑圧方法 |
JP5754899B2 (ja) | 2009-10-07 | 2015-07-29 | ソニー株式会社 | 復号装置および方法、並びにプログラム |
TWI529703B (zh) | 2010-02-11 | 2016-04-11 | 杜比實驗室特許公司 | 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法 |
JP5850216B2 (ja) | 2010-04-13 | 2016-02-03 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP5609737B2 (ja) | 2010-04-13 | 2014-10-22 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
US9047875B2 (en) * | 2010-07-19 | 2015-06-02 | Futurewei Technologies, Inc. | Spectrum flatness control for bandwidth extension |
JP6075743B2 (ja) | 2010-08-03 | 2017-02-08 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
JP5903758B2 (ja) | 2010-09-08 | 2016-04-13 | ソニー株式会社 | 信号処理装置および方法、プログラム、並びにデータ記録媒体 |
JP5707842B2 (ja) | 2010-10-15 | 2015-04-30 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
US9197981B2 (en) * | 2011-04-08 | 2015-11-24 | The Regents Of The University Of Michigan | Coordination amongst heterogeneous wireless devices |
US8990074B2 (en) * | 2011-05-24 | 2015-03-24 | Qualcomm Incorporated | Noise-robust speech coding mode classification |
US8483291B2 (en) * | 2011-06-30 | 2013-07-09 | Broadcom Corporation | Analog to digital converter with increased sub-range resolution |
KR102138320B1 (ko) * | 2011-10-28 | 2020-08-11 | 한국전자통신연구원 | 통신 시스템에서 신호 코덱 장치 및 방법 |
US20130163781A1 (en) * | 2011-12-22 | 2013-06-27 | Broadcom Corporation | Breathing noise suppression for audio signals |
JP6179087B2 (ja) * | 2012-10-24 | 2017-08-16 | 富士通株式会社 | オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化用コンピュータプログラム |
CN103928031B (zh) | 2013-01-15 | 2016-03-30 | 华为技术有限公司 | 编码方法、解码方法、编码装置和解码装置 |
ES2626977T3 (es) * | 2013-01-29 | 2017-07-26 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato, procedimiento y medio informático para sintetizar una señal de audio |
RU2648953C2 (ru) * | 2013-01-29 | 2018-03-28 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Наполнение шумом без побочной информации для celp-подобных кодеров |
JP6531649B2 (ja) | 2013-09-19 | 2019-06-19 | ソニー株式会社 | 符号化装置および方法、復号化装置および方法、並びにプログラム |
JP6425097B2 (ja) * | 2013-11-29 | 2018-11-21 | ソニー株式会社 | 周波数帯域拡大装置および方法、並びにプログラム |
CN105849801B (zh) | 2013-12-27 | 2020-02-14 | 索尼公司 | 解码设备和方法以及程序 |
EP2922056A1 (en) | 2014-03-19 | 2015-09-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and corresponding computer program for generating an error concealment signal using power compensation |
EP2922055A1 (en) * | 2014-03-19 | 2015-09-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and corresponding computer program for generating an error concealment signal using individual replacement LPC representations for individual codebook information |
EP2922054A1 (en) | 2014-03-19 | 2015-09-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and corresponding computer program for generating an error concealment signal using an adaptive noise estimation |
EP4376304A2 (en) * | 2014-03-31 | 2024-05-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Encoder, decoder, encoding method, decoding method, and program |
US9373342B2 (en) * | 2014-06-23 | 2016-06-21 | Nuance Communications, Inc. | System and method for speech enhancement on compressed speech |
CN106486129B (zh) * | 2014-06-27 | 2019-10-25 | 华为技术有限公司 | 一种音频编码方法和装置 |
JP2016038435A (ja) * | 2014-08-06 | 2016-03-22 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
EP3259754B1 (en) * | 2015-02-16 | 2022-06-15 | Samsung Electronics Co., Ltd. | Method and device for providing information |
EP3079151A1 (en) * | 2015-04-09 | 2016-10-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and method for encoding an audio signal |
JP6501259B2 (ja) * | 2015-08-04 | 2019-04-17 | 本田技研工業株式会社 | 音声処理装置及び音声処理方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08272394A (ja) * | 1995-03-30 | 1996-10-18 | Olympus Optical Co Ltd | 音声符号化装置 |
JPH09244698A (ja) * | 1996-03-08 | 1997-09-19 | Sei Imai | 音声符号/復号化方式及び装置 |
JP2000347688A (ja) * | 1999-06-09 | 2000-12-15 | Mitsubishi Electric Corp | 雑音抑圧装置 |
JP2001228893A (ja) * | 2000-02-18 | 2001-08-24 | Matsushita Electric Ind Co Ltd | 音声認識装置 |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5341456A (en) * | 1992-12-02 | 1994-08-23 | Qualcomm Incorporated | Method for determining speech encoding rate in a variable rate vocoder |
SE501340C2 (sv) | 1993-06-11 | 1995-01-23 | Ericsson Telefon Ab L M | Döljande av transmissionsfel i en talavkodare |
JPH0786952A (ja) * | 1993-09-13 | 1995-03-31 | Nippon Telegr & Teleph Corp <Ntt> | 音声の予測符号化方法 |
JP2964879B2 (ja) * | 1994-08-22 | 1999-10-18 | 日本電気株式会社 | ポストフィルタ |
JPH08292797A (ja) | 1995-04-20 | 1996-11-05 | Nec Corp | 音声符号化装置 |
US6064962A (en) * | 1995-09-14 | 2000-05-16 | Kabushiki Kaisha Toshiba | Formant emphasis method and formant emphasis filter device |
FR2742568B1 (fr) | 1995-12-15 | 1998-02-13 | Catherine Quinquis | Procede d'analyse par prediction lineaire d'un signal audiofrequence, et procedes de codage et de decodage d'un signal audiofrequence en comportant application |
US6453288B1 (en) | 1996-11-07 | 2002-09-17 | Matsushita Electric Industrial Co., Ltd. | Method and apparatus for producing component of excitation vector |
KR100938017B1 (ko) | 1997-10-22 | 2010-01-21 | 파나소닉 주식회사 | 벡터 양자화 장치 및 방법 |
US6385573B1 (en) * | 1998-08-24 | 2002-05-07 | Conexant Systems, Inc. | Adaptive tilt compensation for synthesized speech residual |
CN1242379C (zh) | 1999-08-23 | 2006-02-15 | 松下电器产业株式会社 | 音频编码装置 |
US6937979B2 (en) * | 2000-09-15 | 2005-08-30 | Mindspeed Technologies, Inc. | Coding based on spectral content of a speech signal |
US6615169B1 (en) * | 2000-10-18 | 2003-09-02 | Nokia Corporation | High frequency enhancement layer coding in wideband speech codec |
US6941263B2 (en) * | 2001-06-29 | 2005-09-06 | Microsoft Corporation | Frequency domain postfiltering for quality enhancement of coded speech |
US7353168B2 (en) * | 2001-10-03 | 2008-04-01 | Broadcom Corporation | Method and apparatus to eliminate discontinuities in adaptively filtered signals |
JP3785363B2 (ja) | 2001-12-27 | 2006-06-14 | 松下電器産業株式会社 | 音声信号符号化装置、音声信号復号装置及び音声信号符号化方法 |
US7024358B2 (en) * | 2003-03-15 | 2006-04-04 | Mindspeed Technologies, Inc. | Recovering an erased voice frame with time warping |
JPWO2006025313A1 (ja) | 2004-08-31 | 2008-05-08 | 松下電器産業株式会社 | 音声符号化装置、音声復号化装置、通信装置及び音声符号化方法 |
JP2006251532A (ja) | 2005-03-11 | 2006-09-21 | Sony Corp | バックライト製造管理システム及びバックライト製造管理方法 |
JP5032012B2 (ja) | 2005-08-19 | 2012-09-26 | 公益財団法人鉄道総合技術研究所 | 矢板併用型直接基礎及びその施工方法 |
JP2007216246A (ja) | 2006-02-15 | 2007-08-30 | Jfe Steel Kk | 熱間圧延における金属帯の形状制御方法 |
-
2007
- 2007-09-14 EP EP07807364A patent/EP2063418A4/en not_active Ceased
- 2007-09-14 US US12/440,661 patent/US8239191B2/en active Active
- 2007-09-14 WO PCT/JP2007/067960 patent/WO2008032828A1/ja active Application Filing
- 2007-09-14 JP JP2008534412A patent/JP5061111B2/ja not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08272394A (ja) * | 1995-03-30 | 1996-10-18 | Olympus Optical Co Ltd | 音声符号化装置 |
JPH09244698A (ja) * | 1996-03-08 | 1997-09-19 | Sei Imai | 音声符号/復号化方式及び装置 |
JP2000347688A (ja) * | 1999-06-09 | 2000-12-15 | Mitsubishi Electric Corp | 雑音抑圧装置 |
JP2001228893A (ja) * | 2000-02-18 | 2001-08-24 | Matsushita Electric Ind Co Ltd | 音声認識装置 |
Also Published As
Publication number | Publication date |
---|---|
EP2063418A4 (en) | 2010-12-15 |
JPWO2008032828A1 (ja) | 2010-01-28 |
EP2063418A1 (en) | 2009-05-27 |
US8239191B2 (en) | 2012-08-07 |
US20090265167A1 (en) | 2009-10-22 |
WO2008032828A1 (fr) | 2008-03-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5061111B2 (ja) | 音声符号化装置および音声符号化方法 | |
JP5164970B2 (ja) | 音声復号装置および音声復号方法 | |
CA2399706C (en) | Background noise reduction in sinusoidal based speech coding systems | |
CA2176665C (en) | Method of adapting the noise masking level in an analysis-by-synthesis speech coder employing a short-term perceptual weighting filter | |
EP1898397B1 (en) | Scalable decoder and disappeared data interpolating method | |
US9454974B2 (en) | Systems, methods, and apparatus for gain factor limiting | |
JP4846712B2 (ja) | スケーラブル復号化装置およびスケーラブル復号化方法 | |
KR100905585B1 (ko) | 음성신호의 대역폭 확장 제어 방법 및 장치 | |
JP5153886B2 (ja) | 雑音抑圧装置および音声復号化装置 | |
KR102105044B1 (ko) | 낮은 레이트의 씨이엘피 디코더의 비 음성 콘텐츠의 개선 | |
WO2011153278A1 (en) | Systems, methods, apparatus, and computer program products for wideband speech coding | |
KR20010101422A (ko) | 매핑 매트릭스에 의한 광대역 음성 합성 | |
JP4679513B2 (ja) | 階層符号化装置および階層符号化方法 | |
JP5291004B2 (ja) | 通信ネットワークにおける方法及び装置 | |
US10672411B2 (en) | Method for adaptively encoding an audio signal in dependence on noise information for higher encoding accuracy | |
EP1619666B1 (en) | Speech decoder, speech decoding method, program, recording medium | |
Hu et al. | A cross-correlation technique for enhancing speech corrupted with correlated noise | |
US20100153099A1 (en) | Speech encoding apparatus and speech encoding method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100324 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120424 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120620 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120717 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120806 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150810 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |