JP5986565B2 - 音声符号化装置、音声復号装置、音声符号化方法及び音声復号方法 - Google Patents
音声符号化装置、音声復号装置、音声符号化方法及び音声復号方法 Download PDFInfo
- Publication number
- JP5986565B2 JP5986565B2 JP2013519367A JP2013519367A JP5986565B2 JP 5986565 B2 JP5986565 B2 JP 5986565B2 JP 2013519367 A JP2013519367 A JP 2013519367A JP 2013519367 A JP2013519367 A JP 2013519367A JP 5986565 B2 JP5986565 B2 JP 5986565B2
- Authority
- JP
- Japan
- Prior art keywords
- band
- signal
- encoding
- restriction
- extension
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 44
- 230000000670 limiting effect Effects 0.000 claims description 62
- 230000003044 adaptive effect Effects 0.000 description 80
- 238000001228 spectrum Methods 0.000 description 67
- 238000004364 calculation method Methods 0.000 description 35
- 238000010586 diagram Methods 0.000 description 30
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 24
- 238000012986 modification Methods 0.000 description 18
- 230000004048 modification Effects 0.000 description 18
- 238000004458 analytical method Methods 0.000 description 14
- 238000001514 detection method Methods 0.000 description 11
- 238000004891 communication Methods 0.000 description 9
- 230000000694 effects Effects 0.000 description 6
- 230000003595 spectral effect Effects 0.000 description 6
- 230000015556 catabolic process Effects 0.000 description 4
- 230000001186 cumulative effect Effects 0.000 description 4
- 230000007423 decrease Effects 0.000 description 4
- 238000006731 degradation reaction Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000012805 post-processing Methods 0.000 description 4
- 238000013139 quantization Methods 0.000 description 4
- 230000002829 reductive effect Effects 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 230000006866 deterioration Effects 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000035807 sensation Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/66—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
- H04B1/667—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using a division in frequency subbands
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
<音声符号化装置の構成>
図2は、本発明の実施の形態1に係る音声符号化装置100の構成を示すブロック図である。
図3は、本実施の形態における適応帯域制限部102の構成を示すブロック図である。
図4は、本実施の形態における適応帯域選択部301の構成を示すブロック図である。
図5は、本発明の実施の形態1における音声復号装置500の構成を示すブロック図である。
本実施の形態によれば、ピッチ周期に応じて帯域制限周波数を適応的に調整し、帯域制限周波数以上の帯域は、帯域拡張レイヤにおける符号化対象から除外するか、または帯域拡張レイヤにおいてエネルギーを減衰させて聴感的な重要度を下げることにより、ビットレートを低くしても符号化に伴う全体的な品質の劣化を防ぐことができる。
本実施の形態において、第1レイヤ符号化部101において入力信号を単に符号化したが、本発明はこれに限らず、入力信号が音声であるのか音楽であるのかをモード判定し、そのモード判定情報を適応帯域制限部102に出力し、適応帯域制限部102において入力信号が音声の場合と音楽の場合とによって帯域制限を行うか否かを切り替えてもよい。具体的には、入力信号が音声であった場合には帯域制限を行い、入力信号が音楽であった場合には帯域制限を行わないように切り替えてもよい。
本実施の形態は、入力信号をFFT(Fast Fourier Transform)分析することによりスペクトルを求め、求めたスペクトルと、ピッチ周波数及びビットレートによって決まる閾値とを用いて帯域制限周波数を決定する点に特徴を有する。ここでビットレートは、音声符号化装置の外部から入力される。
図6は、本発明の実施の形態2における適応帯域選択部600の構成を示すブロック図である。なお、本実施の形態における音声符号化装置は、図2と同一構成であるので、その説明を省略する。本実施の形態における適応帯域制限部は、適応帯域選択部301の代わりに適応帯域選択部600を有する以外は図3と同一構成であるので、その説明を省略する。また、本実施の形態における音声復号装置は、図5と同一構成であるので、その説明を省略する。
図7は、帯域制限周波数の決定方法を示す図である。図7は、超広帯域音声スペクトルを、E[0]〜E[8]の9つのサブバンドに分割した場合を示す。なお、超広帯域音声スペクトルは、9つのサブバンドに分割する場合に限らず、任意の数のサブバンドに分割することができる。また、各サブバンドの帯域幅は、等幅である場合に限らず、異なる幅であってもよい。
図8は、帯域制限周波数決定部604の動作を示すフロー図である。
本実施の形態によれば、サブバンドエネルギー比に応じて帯域制限周波数を適応的に調整することにより、ビットレートを低くしても符号化に伴う全体的な品質の劣化を防ぐことができる。
本実施の形態において、スペクトル算出部601は、入力信号に対してFFT分析を行うことによりスペクトルを算出したが、本発明はこれに限らず、第1レイヤ符号化部で生成されるLPC(Linear Prediction coding)係数を用いてスペクトル包絡を求めてもよい。
本実施の形態において、スペクトル算出部は、入力信号に対してFFT分析を行ってスペクトルを算出したが、本発明はこれに限らず、FFT以外のDFT(Discrete Fourier Transform)、DCT(Discrete Cosine Transform)、MDCT(Modified Discrete Cosine Transform)またはフィルタバンクなどを使用することができる。
本実施の形態は、無声区間における背景雑音スペクトルと、有声区間における音声スペクトルとの比較に基づく帯域制限を行うことで、制限帯域を符号化対象から除外する点に特徴を有する。すなわち、無声区間においては背景雑音スペクトルを求め、有声区間では音声スペクトルを求める。有声区間においては、背景雑音のレベルを下回る帯域の音声スペクトルに関しては背景雑音にマスキングされ、聴感上重要ではないとみなすことができるので、この背景雑音のレベルを下回る帯域を制限する。
図12は、本発明の実施の形態3における適応帯域選択部1200の構成を示すブロック図である。なお、本実施の形態における音声符号化装置は、図2と同一構成であるので、その説明を省略する。また、本実施の形態における適応帯域制限部102は、適応帯域選択部301の代わりに適応帯域選択部1200を有する以外は図4と同一構成であるので、その説明を省略する。また、本実施の形態における音声復号装置は、図5と同一構成であるので、その説明を省略する。
図13は、本実施の形態における帯域制限周波数の決定方法を示す図である。
本実施の形態によれば、音声スペクトルのレベルと背景雑音スペクトルのレベルとの関係に応じて帯域制限周波数を適応的に調整することにより、ビットレートを低くしても符号化に伴う全体的な品質の劣化を防ぐことができる。
本実施の形態において、スペクトル算出部は、入力信号に対してFFT分析を行ってスペクトルを算出したが、本発明はこれに限らず、FFT以外のDFT、DCT、MDCTまたはフィルタバンクなどを使用することができる。
上記の実施の形態1〜実施の形態3において、音声符号化装置をスケーラブル構成として説明したが、本発明はこれに限らず、スケーラブル構成ではない符号化方式にも適用可能である。図14は、スケーラブル構成ではない音声符号化装置1400の構成を示すブロック図である。本発明は、図14に示すような音声符号化装置1400にも適用することができる。
本実施の形態は、音声復号装置において帯域に制限を加える点に特徴を有する。
本実施の形態による音声復号装置は、帯域制限周波数を適応的に調整し、帯域制限周波数以上の帯域を、帯域拡張レイヤにおける符号化対象から除外するか、または帯域拡張レイヤにおいてエネルギーを減衰させて聴感的な重要度を下げることにより、ビットレートを低くしても符号化に伴う全体的な品質の劣化を防ぐことができる。
図16は、本実施の形態の変形例に係る音声復号装置1600を示すブロック図である。
上記の実施の形態1〜実施の形態4において、階層数が2のスケーラブル構成にしたが、本発明はこれに限らず、階層数が3以上のスケーラブル構成にも適用可能である。
102、901、1401、1502、1602 適応帯域制限部
103 帯域拡張レイヤ符号化部
104 多重化部
301、600、1001、1701 適応帯域選択部
302、1702 帯域制限信号生成部
401、602 ピッチ周期算出部
402、604、1205 帯域制限周波数決定部
601、1201 スペクトル算出部
603 閾値算出部
1101 スペクトル包絡算出部
1202 音声検出部
1203 スイッチ部
1204 背景雑音スペクトル算出部
1402 符号化部
1501、1601 復号部
Claims (8)
- 広帯域の信号を第1レイヤにおいて符号化するとともに、前記広帯域よりも高域である拡張帯域の信号を帯域拡張レイヤにおいて符号化する音声符号化装置であって、
前記拡張帯域において符号化の際に制限を加える帯域を選択する帯域選択手段と、
入力信号の帯域のうち前記選択された帯域に前記制限を加える帯域制限手段と、
を具備し、
前記帯域選択手段は、
前記拡張帯域において符号化対象から前記制限を加える帯域として、前記入力信号のピッチ周波数が高いほど除外する帯域を広く選択し、
前記帯域制限手段は、
前記選択された帯域を符号化対象から除外することにより前記制限を加える、
音声符号化装置。 - 広帯域の信号を第1レイヤにおいて符号化するとともに、前記広帯域よりも高域である拡張帯域の信号を帯域拡張レイヤにおいて符号化する音声符号化装置であって、
前記拡張帯域において符号化の際に制限を加える帯域を選択する帯域選択手段と、
入力信号の帯域のうち前記選択された帯域に前記制限を加える帯域制限手段と、
を具備し、
前記帯域選択手段は、
前記拡張帯域において前記制限を加える帯域として、前記入力信号のピッチ周波数が高いほどエネルギーを減衰させる帯域を広く選択し、
前記帯域制限手段は、
前記選択された帯域のエネルギーを減衰させることにより前記制限を加える、
音声符号化装置。 - 符号化装置において生成された、広帯域の信号を符号化することによって得られた第1レイヤ符号化情報を第1レイヤにおいて復号し、前記広帯域よりも高域である拡張帯域の信号を符号化することによって得られた帯域拡張レイヤ符号化情報を帯域拡張レイヤにおいて復号する音声復号装置であって、
前記拡張帯域において出力の際に制限を加える帯域を選択する帯域選択手段と、
復号信号の帯域のうち前記選択された帯域に前記制限を加える帯域制限手段と、
を具備し、
前記帯域選択手段は、
前記拡張帯域において出力対象から前記制限を加える帯域として、前記復号信号のピッチ周波数が高いほど除外する帯域を広く選択し、
前記帯域制限手段は、
前記選択された帯域を出力対象から除外することにより前記制限を加える、
音声復号装置。 - 符号化装置において生成された、広帯域の信号を符号化することによって得られた第1レイヤ符号化情報を第1レイヤにおいて復号し、前記広帯域よりも高域である拡張帯域の信号を符号化することによって得られた帯域拡張レイヤ符号化情報を帯域拡張レイヤにおいて復号する音声復号装置であって、
前記拡張帯域において出力の際に制限を加える帯域を選択する帯域選択手段と、
復号信号の帯域のうち前記選択された帯域に前記制限を加える帯域制限手段と、
を具備し、
前記帯域選択手段は、
前記拡張帯域において前記制限を加える帯域として、前記復号信号のピッチ周波数が高いほどエネルギーを減衰させる帯域を広く選択し、
前記帯域制限手段は、
前記選択された帯域のエネルギーを減衰させることにより前記制限を加える、
音声復号装置。 - 広帯域の信号を第1レイヤにおいて符号化するとともに、前記広帯域よりも高域である拡張帯域の信号を帯域拡張レイヤにおいて符号化する音声符号化方法であって、
前記拡張帯域において符号化の際に制限を加える帯域を選択するステップと、
入力信号の帯域のうち前記選択された帯域に制限を加えるステップと、
を具備し、
前記帯域を選択するステップは、
前記拡張帯域において符号化対象から前記制限を加える帯域として、前記入力信号のピッチ周波数が高いほど除外する帯域を広く選択し、
前記選択された帯域に制限を加えるステップは、
前記選択された帯域を符号化対象から除外することにより前記制限を加える、
音声符号化方法。 - 広帯域の信号を第1レイヤにおいて符号化するとともに、前記広帯域よりも高域である拡張帯域の信号を帯域拡張レイヤにおいて符号化する音声符号化方法であって、
前記拡張帯域において符号化の際に制限を加える帯域を選択するステップと、
入力信号の帯域のうち前記選択された帯域に制限を加えるステップと、
を具備し、
前記帯域を選択するステップは、
前記拡張帯域において前記制限を加える帯域として、前記入力信号のピッチ周波数が高いほどエネルギーを減衰させる帯域を広く選択し、
前記選択された帯域に制限を加えるステップは、
前記選択された帯域のエネルギーを減衰させることにより前記制限を加える、
音声符号化方法。 - 広帯域の信号を第1レイヤにおいて復号するとともに、前記広帯域よりも高域である拡張帯域の信号を帯域拡張レイヤにおいて復号する音声復号方法であって、
前記拡張帯域において出力の際に制限を加える帯域を選択するステップと、
復号信号の帯域のうち前記選択された帯域に前記制限を加えるステップと、
を具備し、
前記帯域を選択するステップは、
前記拡張帯域において出力対象から前記制限を加える帯域として、前記復号信号のピッチ周波数が高いほど除外する帯域を広く選択し、
前記選択された帯域に前記制限を加えるステップは、
前記選択された帯域を出力対象から除外することにより前記制限を加える、
音声復号方法。 - 広帯域の信号を第1レイヤにおいて復号するとともに、前記広帯域よりも高域である拡張帯域の信号を帯域拡張レイヤにおいて復号する音声復号方法であって、
前記拡張帯域において出力の際に制限を加える帯域を選択するステップと、
復号信号の帯域のうち前記選択された帯域に前記制限を加えるステップと、
を具備し、
前記帯域を選択するステップは、
前記拡張帯域において前記制限を加える帯域として、前記復号信号のピッチ周波数が高いほどエネルギーを減衰させる帯域を広く選択し、
前記選択された帯域に前記制限を加えるステップは、
前記選択された帯域のエネルギーを減衰させることにより前記制限を加える、
音声復号方法。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011129428 | 2011-06-09 | ||
JP2011129428 | 2011-06-09 | ||
JP2011172393 | 2011-08-05 | ||
JP2011172393 | 2011-08-05 | ||
PCT/JP2012/003409 WO2012169133A1 (ja) | 2011-06-09 | 2012-05-25 | 音声符号化装置、音声復号装置、音声符号化方法及び音声復号方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2012169133A1 JPWO2012169133A1 (ja) | 2015-02-23 |
JP5986565B2 true JP5986565B2 (ja) | 2016-09-06 |
Family
ID=47295725
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013519367A Active JP5986565B2 (ja) | 2011-06-09 | 2012-05-25 | 音声符号化装置、音声復号装置、音声符号化方法及び音声復号方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US9264094B2 (ja) |
EP (1) | EP2709103B1 (ja) |
JP (1) | JP5986565B2 (ja) |
WO (1) | WO2012169133A1 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9208798B2 (en) * | 2012-04-09 | 2015-12-08 | Board Of Regents, The University Of Texas System | Dynamic control of voice codec data rate |
EP2936486B1 (en) | 2012-12-21 | 2018-07-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Comfort noise addition for modeling background noise at low bit-rates |
CN104681032B (zh) * | 2013-11-28 | 2018-05-11 | ***通信集团公司 | 一种语音通信方法和设备 |
US9697843B2 (en) * | 2014-04-30 | 2017-07-04 | Qualcomm Incorporated | High band excitation signal generation |
DE112019003209T5 (de) | 2018-06-28 | 2021-04-08 | Sony Corporation | Codiervorrichtung, Codierverfahren, Decodiervorrichtung, Decodierverfahren und Programm |
CN112470104B (zh) | 2018-07-03 | 2024-04-19 | 索尼公司 | 编码设备、编码方法、解码设备、解码方法、发送***、接收设备和程序 |
CN112534723B (zh) * | 2018-08-08 | 2024-06-18 | 索尼公司 | 解码装置、解码方法和程序 |
US20230110255A1 (en) * | 2021-10-12 | 2023-04-13 | Zoom Video Communications, Inc. | Audio super resolution |
Family Cites Families (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3134455B2 (ja) | 1992-01-29 | 2001-02-13 | ソニー株式会社 | 高能率符号化装置及び方法 |
JPH07327014A (ja) | 1994-06-01 | 1995-12-12 | Matsushita Electric Ind Co Ltd | オーディオ信号高能率符号化装置 |
JPH09127987A (ja) * | 1995-10-26 | 1997-05-16 | Sony Corp | 信号符号化方法及び装置 |
TW321810B (ja) | 1995-10-26 | 1997-12-01 | Sony Co Ltd | |
SE512719C2 (sv) * | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
US6539355B1 (en) * | 1998-10-15 | 2003-03-25 | Sony Corporation | Signal band expanding method and apparatus and signal synthesis method and apparatus |
GB2351889B (en) * | 1999-07-06 | 2003-12-17 | Ericsson Telefon Ab L M | Speech band expansion |
FI115329B (fi) * | 2000-05-08 | 2005-04-15 | Nokia Corp | Menetelmä ja järjestely lähdesignaalin kaistanleveyden vaihtamiseksi tietoliikenneyhteydessä, jossa on valmiudet useisiin kaistanleveyksiin |
US7330814B2 (en) * | 2000-05-22 | 2008-02-12 | Texas Instruments Incorporated | Wideband speech coding with modulated noise highband excitation system and method |
JP3576935B2 (ja) * | 2000-07-21 | 2004-10-13 | 株式会社ケンウッド | 周波数間引き装置、周波数間引き方法及び記録媒体 |
JP2002169599A (ja) * | 2000-11-30 | 2002-06-14 | Toshiba Corp | ノイズ抑制方法及び電子機器 |
CN1244904C (zh) * | 2001-05-08 | 2006-03-08 | 皇家菲利浦电子有限公司 | 声频信号编码方法和设备 |
JP4119696B2 (ja) | 2001-08-10 | 2008-07-16 | 松下電器産業株式会社 | 送信装置、受信装置及び無線通信方法 |
US7162415B2 (en) * | 2001-11-06 | 2007-01-09 | The Regents Of The University Of California | Ultra-narrow bandwidth voice coding |
US7447631B2 (en) * | 2002-06-17 | 2008-11-04 | Dolby Laboratories Licensing Corporation | Audio coding system using spectral hole filling |
US7548852B2 (en) * | 2003-06-30 | 2009-06-16 | Koninklijke Philips Electronics N.V. | Quality of decoded audio by adding noise |
JP4222250B2 (ja) * | 2004-04-26 | 2009-02-12 | ヤマハ株式会社 | 圧縮楽音データ再生装置 |
EP1864281A1 (en) * | 2005-04-01 | 2007-12-12 | QUALCOMM Incorporated | Systems, methods, and apparatus for highband burst suppression |
ATE528748T1 (de) * | 2006-01-31 | 2011-10-15 | Nuance Communications Inc | Verfahren und entsprechendes system zur erweiterung der spektralen bandbreite eines sprachsignals |
US20080300866A1 (en) * | 2006-05-31 | 2008-12-04 | Motorola, Inc. | Method and system for creation and use of a wideband vocoder database for bandwidth extension of voice |
JP4918841B2 (ja) * | 2006-10-23 | 2012-04-18 | 富士通株式会社 | 符号化システム |
CN101903943A (zh) * | 2008-01-01 | 2010-12-01 | Lg电子株式会社 | 用于处理信号的方法和装置 |
JP5337381B2 (ja) * | 2008-01-18 | 2013-11-06 | 富士フイルム株式会社 | メロシアニン色素及び光電変換素子 |
WO2010028297A1 (en) * | 2008-09-06 | 2010-03-11 | GH Innovation, Inc. | Selective bandwidth extension |
WO2010028301A1 (en) * | 2008-09-06 | 2010-03-11 | GH Innovation, Inc. | Spectrum harmonic/noise sharpness control |
JP5326714B2 (ja) | 2009-03-23 | 2013-10-30 | 沖電気工業株式会社 | 帯域拡張装置、方法及びプログラム、並びに、量子化雑音学習装置、方法及びプログラム |
GB2476041B (en) * | 2009-12-08 | 2017-03-01 | Skype | Encoding and decoding speech signals |
JP2011129428A (ja) | 2009-12-18 | 2011-06-30 | Toyota Motor Corp | 蓄電素子のホルダ |
JP2011172393A (ja) | 2010-02-19 | 2011-09-01 | Sumitomo Wiring Syst Ltd | バスバー回路構造体 |
US8738385B2 (en) * | 2010-10-20 | 2014-05-27 | Broadcom Corporation | Pitch-based pre-filtering and post-filtering for compression of audio signals |
-
2012
- 2012-05-25 JP JP2013519367A patent/JP5986565B2/ja active Active
- 2012-05-25 US US14/123,841 patent/US9264094B2/en active Active
- 2012-05-25 EP EP12796725.5A patent/EP2709103B1/en active Active
- 2012-05-25 WO PCT/JP2012/003409 patent/WO2012169133A1/ja active Application Filing
Also Published As
Publication number | Publication date |
---|---|
JPWO2012169133A1 (ja) | 2015-02-23 |
EP2709103A1 (en) | 2014-03-19 |
EP2709103B1 (en) | 2015-10-07 |
EP2709103A4 (en) | 2014-03-26 |
US9264094B2 (en) | 2016-02-16 |
US20140122065A1 (en) | 2014-05-01 |
WO2012169133A1 (ja) | 2012-12-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5986565B2 (ja) | 音声符号化装置、音声復号装置、音声符号化方法及び音声復号方法 | |
US10559313B2 (en) | Speech/audio signal processing method and apparatus | |
RU2688247C2 (ru) | Устройство и способ для расширения диапазона частот для акустических сигналов | |
US10217470B2 (en) | Bandwidth extension system and approach | |
US7983904B2 (en) | Scalable decoding apparatus and scalable encoding apparatus | |
JP5171256B2 (ja) | ステレオ符号化装置、ステレオ復号装置、及びステレオ符号化方法 | |
JP5706445B2 (ja) | 符号化装置、復号装置およびそれらの方法 | |
ES2706148T3 (es) | Dispositivo de codificación de audio vocal, dispositivo de decodificación de audio vocal, procedimiento de codificación de audio vocal, y procedimiento de decodificación de audio vocal | |
JP5753540B2 (ja) | ステレオ信号符号化装置、ステレオ信号復号装置、ステレオ信号符号化方法及びステレオ信号復号方法 | |
US20140052439A1 (en) | Method and apparatus for polyphonic audio signal prediction in coding and networking systems | |
CN110706715B (zh) | 信号编码和解码的方法和设备 | |
US20140114651A1 (en) | Device and method for execution of huffman coding | |
JPWO2009057327A1 (ja) | 符号化装置および復号装置 | |
US9589576B2 (en) | Bandwidth extension of audio signals | |
JPWO2007114291A1 (ja) | 音声符号化装置、音声復号化装置、およびこれらの方法 | |
JP6082703B2 (ja) | 音声復号装置及び音声復号方法 | |
JP2011501228A (ja) | 知覚モデルの適応的調整 | |
CN105874534B (zh) | 编码装置、解码装置、编码方法、解码方法及程序 | |
JP5295380B2 (ja) | 符号化装置、復号化装置およびこれらの方法 | |
Gibson | Challenges in speech coding research |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150220 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20151117 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160216 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160802 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160805 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5986565 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |