JP4887282B2 - 音声符号化におけるパルス割当方法 - Google Patents
音声符号化におけるパルス割当方法 Download PDFInfo
- Publication number
- JP4887282B2 JP4887282B2 JP2007502640A JP2007502640A JP4887282B2 JP 4887282 B2 JP4887282 B2 JP 4887282B2 JP 2007502640 A JP2007502640 A JP 2007502640A JP 2007502640 A JP2007502640 A JP 2007502640A JP 4887282 B2 JP4887282 B2 JP 4887282B2
- Authority
- JP
- Japan
- Prior art keywords
- channel
- pulses
- pulse
- assigned
- allocation method
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 25
- 238000004891 communication Methods 0.000 description 12
- 230000005236 sound signal Effects 0.000 description 10
- 230000003044 adaptive effect Effects 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 101000710013 Homo sapiens Reversion-inducing cysteine-rich protein with Kazal motifs Proteins 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 238000010295 mobile communication Methods 0.000 description 3
- 230000000737 periodic effect Effects 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 229930091051 Arenine Natural products 0.000 description 1
- 101000911772 Homo sapiens Hsc70-interacting protein Proteins 0.000 description 1
- 101001139126 Homo sapiens Krueppel-like factor 6 Proteins 0.000 description 1
- 101000661807 Homo sapiens Suppressor of tumorigenicity 14 protein Proteins 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 108090000237 interleukin-24 Proteins 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Mobile Radio Communication Systems (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
"AMR Wideband Speech Codec; General Description", 3GPP TS 26.171, V5.0.0 (2001-03) "Wideband Coding of Speech at Around 16 kbit/s Using Adaptive Multi-Rate Wideband (AMR-WB)", Geneva, ITU-T Recommendation G.722.2 (2003-07)
い。
本実施の形態では、入力ステレオ信号の各チャネル間の類似度、各チャネルの周期性および定常度に基づいて、各チャネルへのパルス数の割り当てを決定する。類似度、周期性および定常度に基づいて、各チャネルに対して必要な数のパルスを割り当てる。各チャネルへの割当パルス数の決定後、通常のAMR−WB音声符号化と同様のパルス探索を行って、各チャネルに対するパルス位置が決定される。これらのパルスは、符号語のセットとして符号化され、音声ビットストリームにおけるパラメータの1つである符号帳インデックスとして送信される。
互相関値がしきい値より大きい場合)、または、LチャネルとRチャネルが同一である場合(すなわち、モノラル信号である場合)は、両方のチャネルが共通のパルスセットを用いる。つまり、ST303において、Lチャネルに対するパルス数Num_Pulse(L)がPと設定され、Rチャネルに対するパルス数Num_Pulse(R)が0と設定される。または、逆に、Lチャネルに対するパルス数Num_Pulse(L)が0と設定され、Rチャネルに対するパルス数Num_Pulse(R)がPと設定される。例えば、AMR−WB音声符号化のモード8の場合には、P=24に設定される。ST303においてNum_Pulseが設定される様子を図5Aに示す。この例では、P=24である。LチャネルまたはRチャネルのいずれか一方に24本すべてのパルスが割り当てられるため、図6Aに示すように、両方のチャネルに対してp0〜p23の1つの共通のパルスセットが用いられる。図6Aに示すパルス割当のタイプを、以下「タイプ0」という。
本のパルスが割り当てられ、Lチャネルに対しては、Rチャネルよりも少ない数のパルスが割り当てられる。よって、パルス割当のタイプはタイプ2(図6C)となる。
本実施の形態では、音声信号の特性に基づいてK1、K2を決定して、各チャネル間のパルス割当を適応的に変化させる。各チャネルへのパルス数の分配比率は、例えば、各チャネルの音声信号の周期性およびMAFに基づいて求めることができる。
応じて変化させてもよい。例えば、実施の形態1において、パルス割当タイプが「タイプ0」、すなわち、LチャネルとRチャネルが非常に類似している場合(例えば、相互相関値がしきい値より大きい場合)、または、LチャネルとRチャネルが同一である場合(すなわち、モノラル信号である場合)には、他のタイプでの割当パルス数の合計(上記各実施の形態ではP=24本)よりも少ない数のパルスをRチャネルまたはLチャネルのいずれか一方のみに割り当てるようにしてもよい。このようにすることで、伝送効率をより向上させることができる。
Claims (6)
- ステレオ信号に対する音声符号化における固定符号帳探索の際のパルス割当方法であって、
ステレオ信号の各チャネルの特性および各チャネル間の類似度に応じて、各チャネルに割り当てるパルス数を決定する、
パルス割当方法。 - 前記類似度がしきい値以上の場合、いずれか1つのチャネルにすべてのパルスを割り当てる、
請求項1記載のパルス割当方法。 - 前記特性を各チャネルの定常度、周期性および最大自己相関係数の少なくとも1つに基づいて判断する、
請求項1記載のパルス割当方法。 - 前記定常度、前記周期性および前記最大自己相関係数がより大きいチャネルに対して、より少ないパルス数を割り当てる、
請求項3記載のパルス割当方法。 - 各チャネルの特性が等しい場合、各チャネルに対して均等にパルス数を割り当てる、
請求項1記載のパルス割当方法。 - 各チャネルに割り当てたパルス数を示す符号語を音声復号側へ通知する、
請求項1記載のパルス割当方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007502640A JP4887282B2 (ja) | 2005-02-10 | 2006-02-09 | 音声符号化におけるパルス割当方法 |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005034984 | 2005-02-10 | ||
JP2005034984 | 2005-02-10 | ||
PCT/JP2006/302258 WO2006085586A1 (ja) | 2005-02-10 | 2006-02-09 | 音声符号化におけるパルス割当方法 |
JP2007502640A JP4887282B2 (ja) | 2005-02-10 | 2006-02-09 | 音声符号化におけるパルス割当方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2006085586A1 JPWO2006085586A1 (ja) | 2008-06-26 |
JP4887282B2 true JP4887282B2 (ja) | 2012-02-29 |
Family
ID=36793157
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007502640A Expired - Fee Related JP4887282B2 (ja) | 2005-02-10 | 2006-02-09 | 音声符号化におけるパルス割当方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US8024187B2 (ja) |
EP (1) | EP1847988B1 (ja) |
JP (1) | JP4887282B2 (ja) |
CN (1) | CN101116137B (ja) |
WO (1) | WO2006085586A1 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DK2827327T3 (da) | 2007-04-29 | 2020-10-12 | Huawei Tech Co Ltd | Fremgangsmåde til excitationsimpulskodning |
CN101931414B (zh) | 2009-06-19 | 2013-04-24 | 华为技术有限公司 | 脉冲编码方法及装置、脉冲解码方法及装置 |
EP2523189B1 (en) * | 2010-01-08 | 2014-09-03 | Nippon Telegraph And Telephone Corporation | Encoding method, decoding method, encoder apparatus, decoder apparatus, program and recording medium |
CN102299760B (zh) | 2010-06-24 | 2014-03-12 | 华为技术有限公司 | 脉冲编解码方法及脉冲编解码器 |
US9230554B2 (en) | 2011-02-16 | 2016-01-05 | Nippon Telegraph And Telephone Corporation | Encoding method for acquiring codes corresponding to prediction residuals, decoding method for decoding codes corresponding to noise or pulse sequence, encoder, decoder, program, and recording medium |
US11145316B2 (en) * | 2017-06-01 | 2021-10-12 | Panasonic Intellectual Property Corporation Of America | Encoder and encoding method for selecting coding mode for audio channels based on interchannel correlation |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10207496A (ja) * | 1997-01-27 | 1998-08-07 | Nec Corp | 音声符号化装置及び音声復号装置 |
JP2004509365A (ja) * | 2000-09-15 | 2004-03-25 | テレフオンアクチーボラゲツト エル エム エリクソン | 複数チャネル信号の符号化及び復号化 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5651090A (en) * | 1994-05-06 | 1997-07-22 | Nippon Telegraph And Telephone Corporation | Coding method and coder for coding input signals of plural channels using vector quantization, and decoding method and decoder therefor |
JP2778567B2 (ja) * | 1995-12-23 | 1998-07-23 | 日本電気株式会社 | 信号符号化装置及び方法 |
SE519552C2 (sv) * | 1998-09-30 | 2003-03-11 | Ericsson Telefon Ab L M | Flerkanalig signalkodning och -avkodning |
CA2290037A1 (en) * | 1999-11-18 | 2001-05-18 | Voiceage Corporation | Gain-smoothing amplifier device and method in codecs for wideband speech and audio signals |
SE519985C2 (sv) | 2000-09-15 | 2003-05-06 | Ericsson Telefon Ab L M | Kodning och avkodning av signaler från flera kanaler |
DE10057881A1 (de) * | 2000-11-21 | 2002-05-23 | Philips Corp Intellectual Pty | Gasentladungslampe mit Leuchtstoffschicht |
WO2004090870A1 (ja) * | 2003-04-04 | 2004-10-21 | Kabushiki Kaisha Toshiba | 広帯域音声を符号化または復号化するための方法及び装置 |
-
2006
- 2006-02-09 CN CN2006800045364A patent/CN101116137B/zh not_active Expired - Fee Related
- 2006-02-09 US US11/815,916 patent/US8024187B2/en active Active
- 2006-02-09 WO PCT/JP2006/302258 patent/WO2006085586A1/ja active Application Filing
- 2006-02-09 JP JP2007502640A patent/JP4887282B2/ja not_active Expired - Fee Related
- 2006-02-09 EP EP06713401A patent/EP1847988B1/en not_active Not-in-force
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10207496A (ja) * | 1997-01-27 | 1998-08-07 | Nec Corp | 音声符号化装置及び音声復号装置 |
JP2004509365A (ja) * | 2000-09-15 | 2004-03-25 | テレフオンアクチーボラゲツト エル エム エリクソン | 複数チャネル信号の符号化及び復号化 |
Also Published As
Publication number | Publication date |
---|---|
JPWO2006085586A1 (ja) | 2008-06-26 |
CN101116137A (zh) | 2008-01-30 |
EP1847988B1 (en) | 2011-08-17 |
US20090043572A1 (en) | 2009-02-12 |
EP1847988A1 (en) | 2007-10-24 |
EP1847988A4 (en) | 2010-12-29 |
WO2006085586A1 (ja) | 2006-08-17 |
CN101116137B (zh) | 2011-02-09 |
US8024187B2 (en) | 2011-09-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10535358B2 (en) | Method and apparatus for encoding/decoding speech signal using coding mode | |
US7987089B2 (en) | Systems and methods for modifying a zero pad region of a windowed frame of an audio signal | |
FI120327B (fi) | Menetelmä ja laite alennetun nopeuden muuttuvanopeuksisen vokoodauksen suorittamiseksi | |
CN100508030C (zh) | 一种编码/解码音频信号的方法及相应设备 | |
KR101238583B1 (ko) | 비트 스트림 처리 방법 | |
US8374883B2 (en) | Encoder and decoder using inter channel prediction based on optimally determined signals | |
JP4887282B2 (ja) | 音声符号化におけるパルス割当方法 | |
JP5706445B2 (ja) | 符号化装置、復号装置およびそれらの方法 | |
ES2687249T3 (es) | Decisión no sonora/sonora para el procesamiento de la voz | |
WO2001022402A1 (en) | Multimode speech encoder | |
DK1879179T3 (da) | Fremgangsmåde og anordning til kodning af audiodata baseret på vektorkvantisering | |
KR100614496B1 (ko) | 가변 비트율의 광대역 음성 및 오디오 부호화 장치 및방법 | |
FI118704B (fi) | Menetelmä ja laite lähdekoodauksen tekemiseksi | |
US8688442B2 (en) | Audio decoding apparatus, audio coding apparatus, and system comprising the apparatuses | |
JP5355387B2 (ja) | 符号化装置および符号化方法 | |
CN114097028A (zh) | 用于编解码音频流中的元数据及用于灵活对象内和对象间比特率适配的方法和*** | |
KR100546758B1 (ko) | 음성의 상호부호화시 전송률 결정 장치 및 방법 | |
FI119955B (fi) | Menetelmä, kooderi ja laite puheenkoodaukseen synteesi-analyysi puhekoodereissa | |
EP1859441A1 (en) | Low-complexity code excited linear prediction encoding | |
KR101798084B1 (ko) | 부호화 모드를 이용한 음성신호의 부호화/복호화 장치 및 방법 | |
KR101770301B1 (ko) | 부호화 모드를 이용한 음성신호의 부호화/복호화 장치 및 방법 | |
Jbira et al. | Multi-layer scalable LPC audio format | |
Bossen et al. | Minoru Etoh, Khosrow Lashkari |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080514 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090130 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111122 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111212 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141216 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |