JP3143406B2 - 音声符号化方法 - Google Patents
音声符号化方法Info
- Publication number
- JP3143406B2 JP3143406B2 JP09035062A JP3506297A JP3143406B2 JP 3143406 B2 JP3143406 B2 JP 3143406B2 JP 09035062 A JP09035062 A JP 09035062A JP 3506297 A JP3506297 A JP 3506297A JP 3143406 B2 JP3143406 B2 JP 3143406B2
- Authority
- JP
- Japan
- Prior art keywords
- input signal
- signal
- adaptive quantizer
- quantization width
- code
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 title claims abstract description 27
- 238000013139 quantization Methods 0.000 claims abstract description 73
- 230000003044 adaptive effect Effects 0.000 claims abstract description 57
- 238000010586 diagram Methods 0.000 description 9
- 230000001934 delay Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
方法に関し、特に適応パルス符号変調(AdaptivePulse
Code Modulation、以下「APCM」と称す。)方法、
及び適応差分パルス符号変調(Adaptive Differential
Pulse Code Modulation、以下「ADPCM」と称
す。)方法の改良に関する。
方法がある。この方法は音声の隣接標本間、例えば時間
t1と時間t2の音声データにおいて、時間t1に算出し
た予測値と時間t2における音声信号との差分をとり、
この差分を量子化してADPCM符号とすることによっ
て音声を圧縮し、次にその符号を逆量子化することによ
って、差分信号の逆量子化値を得、その値を逐次加算す
ることで通常のPCM符号形式の音声を再生する方法で
ある。
化値を得る際に必要となる量子化幅をADPCM符号に
応じて適宜変化させていくことを特徴としている。
DPCM符号化装置4、及びADPCM復号化装置5の
概略構成図であり、以下に各構成の機能を順次説明す
る。尚、以下で用いるnは整数とする。
に入力された信号xnと予測信号ynの差分dnを、数1
求められた差分dnを数2
符号Lnを求め、その符号Lnをメモリ6に出力する。
その量子化幅Δn+1を次の量子化の際に用いるため、第
1適応量子化器42に送る。
と符号Lnの関係を表1に示す。
化値qn求める。
号wnを第1予測器46に送る。
ルだけ遅延させることによって次の予測信号yn+1を求
め、この予測信号yn+1は第1加算器41に送られ、こ
の第1加算器41以降の処理は上述の繰り返しとなる。
逆量子化器51は数6
が、正しくADPCM復号化装置5に伝送されれば、即
ちLn=Ln’の場合には、ADPCM符号化装置4側で
用いられているqn、yn、及びwnの値は、夫々ADP
CM復号化装置側5で用いられているqn’、yn’、及
びwn’の値と等しい。
の符号Ln’を読み出して、数7
化幅Δn+1は第2適応逆量子化器51に送られ、次の逆
量子化のために用いられる。
る。
は第2予測器54に送られると共に、ADPCM復号化
装置5から出力される。
プルだけ遅延させて次の予測信号yn +1’を求め、この
予測信号yn+1’を第3加算器53に送る。
号xnと予測信号ynとの差分dnの関係を示した図であ
る。
び“]”は境界値をその範囲に含み、“(”及び“)”は
境界値をその範囲に含まないものとすると、図6では差
分d nの値が[0,T]の範囲にあるときは0.5T
に、(T,2T]の範囲にあるときは1.5Tに、・・・・
・、(7T,∞]の範囲にあるときは7.5Tに夫々量
子化されている。
0.5Tに、[−2T,−T)の範囲にあるときは−
1.5Tに、・・・・・、[−∞,−7T)の範囲にあると
きは−7.5Tに夫々量子化されている。
技術において、量子化幅Δn+1を求めるには、表1に示
す乗数M(Ln)を用いるが、差分dnが小さいときに
は、量子化幅Δn+1も小さい値に設定される。
い信号xn+1が符号化装置に入力されると、現実には量
子化幅Δn+1が小さいため、当該信号xn+1を量子化した
場合に大きな量子化誤差が生じてしまい、これを再生す
ると、聴覚的に耳障りな音となっていた。
合でも量子化すれば、0.5Tとなり、逆量子化値が0
ではなくなっていた。
値が0になることが多く、量子化誤差が増大するという
欠点があった。
のまま差分dnとするものであるため、ADPCM方法
と同様の欠点があった。
を適応量子化器で量子化するAPCM符号化方法であっ
て、APCM符号化装置へ入力された音声の入力信号x
nを適応量子化器によって量子化する際、入力信号xn≧
0の場合、適応量子化器への入力信号en=xn+Tn/
2(但し、単位量子化幅Tn)を求め、また入力信号xn
<0の場合、適応量子化器への入力信号en=xn−Tn
/2を求める第1ステップと、第1ステップによって求
めた、前記適応量子化器への入力信号enを、不均一な
量子化幅をもつ適応量子化器によって量子化し、符号L
nを求める第2ステップと、第2ステップによる符号Ln
に基づいて、単位量子化幅Tn+1を求め、その単位量子
化幅Tn+1を前記適応量子化器に送る第3ステップと、
前記単位量子化幅Tn+1に基づいて、前記適応量子化器
への入力信号en+1を求める第4ステップと、前記符号
Lnを逆量子化し、逆量子化値qn'を求める第5ステッ
プと、からなることを特徴とする。
号xnの予測値ynとの差分dnを適応量子化器で量子化
するADPCM符号化方法であって、ADPCM符号化
装置へ入力された音声の入力信号xnと該入力信号xnの
予測値ynとの差分dnを適応量子化器によって量子化す
る際、差分dn≧0の場合、前記適応量子化器への入力
信号en=dn+Tn/2(但し、単位量子化幅Tn)を求
め、また差分dn<0の場合、前記適応量子化器への入
力信号en=dn−Tn/2を求める第1ステップと、第
1ステップによって求めた、前記適応量子化器への入力
信号enを不均一な量子化幅をもつ適応量子化器によっ
て量子化し、符号Lnを求める第2ステップと、第2ス
テップによる符号Lnに基づいて、単位量子化幅Tn+1を
求め、その単位量子化幅Tn+1を前記適応量子化器に送
る第3ステップと、適応逆量子化器による、前記符号L
nの逆量子化によって求められた逆量子化値qn、及び前
記予測値ynに基づいて、次の予測信号yn+1を求める第
4ステップと、前記単位量子化幅Tn+1に基づいて、前
記適応量子化器への入力信号en+1を求める第5ステッ
プと、からなることを特徴とする。
乃至図4に基づいて説明する。
るADPCM符号化装置、及びADPCM復号化装置の
概略構成図である。尚、以下で用いるnは整数とする。
装置に入力された信号xnと予測信号ynの差分dnを数
9
すように、後述する第1適応量子化器の入力信号e
n(表2における左から第1番目の欄を以下「第1欄」
という。)、第1適応量子化器による符号Ln(表2に
おける左から第2番目の欄を以下「第2欄」とい
う。)、第1適応逆量子化器の逆量子化値qn(表2に
おける左から第3番目の欄を以下「第3欄」とい
う。)、及び第1量子化幅更新器による単位量子化幅T
n+1(表2における左から第1番目の欄を以下「第4
欄」という。)の対応関係を示すテーブルが予め格納さ
れている。
第1適応量子化器14に出力され、第1適応量子化器1
4は、表2の第1欄、及び第2欄に従って符号Lnを求
め、この符号Lnをメモリ3に送る。
欄、及び第3欄に従って逆量子化値q nを求め、その逆
量子化値qnを第3加算器16に送る。
号wnを第1予測器17に送る。
ルだけ遅延させることによって次の予測信号yn+1を求
め、この予測信号yn+1を第1加算器11に送る。
の第4欄に従って適応的に単位量子化幅Tn+1を求め、
その単位量子化幅Tn+1を次の量子化の際に用いる。
に入力された信号xnと予測信号ynの差分dnの値によ
って以下の調整信号を発生させる。
信号enを求め、この入力信号enを第1適応量子化器1
4に送る。
手段21においても、第1記憶手段13に格納されてい
るテーブルと同一のテーブルが格納されている(ここで
は、表2の表示を割愛する。)。
が、正しくADPCM復号化装置2に伝送されれば、即
ちLn=Ln’の場合には、ADPCM符号化装置1側で
用いられているen’、qn’、yn’、Tn’及びwn’
の値は、夫々ADPCM復号化装置側2で用いられてい
るen、qn、yn、Tn及びwnの値と等しい。
化器22は表2の第2欄、及び第3欄に従って逆量子化
値qn’を出力する。
の符号Ln’を読み出して、前述した表2の第2欄、及
び第4欄に従って単位量子化幅Tnに基づいて単位量子
化幅Tn+1を求める。而して、その単位量子化幅Tn+1は
第2適応逆量子化器22に送ら れ、次の逆量子化のた
めに用いられる。
を第2予測器25に送る。
プルだけ遅延させることによって次の予測信号yn+1’
を求め、この予測信号yn+1’を第4加算器24に送
る。
置1の動作説明を図2のフローチャートに従って説明す
る。
測信号ynを差し引き、その差分dnを求める。
めた差分dnが正の数か、又は負の数かを判定し、正の
数である場合にはステップS12に進み、一方負の数で
ある場合にはステップS13に進む。
めた差分dnに単位量子化幅Tnの1/2を加えて、第1
適応量子化器への入力信号enを求めた後、ステップS
14に進む。
0で求めた差分dnに単位量子化幅Tnの1/2を差し引
いて、第1適応量子化器への入力信号enを求めた後、
ステップS14に進む。
して符号Lnを求めた後、ステップS15に進む。ステ
ップS15では、ステップS14で求めた符号Ln、及
び単位量子化幅Tnに基づいて単位量子化幅Tnの更新を
行った後、ステップS16に進む。
及び逆量子化値qnを使って次の予測値yn+1を求める。
号xnと予測信号ynとの差分dnの関係を示した図であ
る。
力信号enの値が(−0.5T,0.5T]の範囲にある
ときは0に、(0.5T,1.5T]の範囲にあるときは
Tに、・・・・・、(10.5T,∞]の範囲にあるときは1
2Tに量子化されている。
あるときは−Tに、(−2.5T,−1.5T]の範囲に
あるときは−2Tに、・・・・・、[−∞,−11.5T]の
範囲にあるときは−13Tに量子化されている。
処理のフローチャートである。
置2の第2適応逆量子化器22はメモリ3の符号Ln’
を読み出して、表2の第2欄、及び第3欄に従って符号
Ln’、及び単位量子化幅Tnから逆量子化値qn’を求
め、ステップS21に進む。
めた逆量子化値qn’を使って次の予測信号yn+1’を求
め、ステップS22に進む。
て単位量子化幅Tnの更新を行う。
では、入力信号xn、或るいは入力信号xnとその入力信
号xnの予測値ynとの差分dnの絶対値が小さい値から
大きい値に急激に変化し、単位量子化幅Tnが小さい値
のときも、最適な量子化値を求めることで、従来発生し
ていた量子化誤差を減少させることができる効果を奏す
る。
逆量子化した値が0になり、量子化誤差が発生しなくな
るという効果を奏する。
符号化装置、及びADPCM復号化装置の概略構成図で
ある。
置のフローチャートである。
概念図である。
置のフローチャートである。
ynとの差分dnの関係を示した図である。
Claims (2)
- 【請求項1】 入力信号x n を適応量子化器で量子化す
る音声符号化方法であって、 音声符号化装置へ入力され
た音声の入力信号x n を適応量子化器によって量子化す
る際、入力信号x n ≧0の場合、適応量子化器への入力
信号e n =x n +T n /2(但し、単位量子化幅T n )を求
め、また入力信号x n <0の場合、適応量子化器への入
力信号e n =x n −T n /2を求める第1ステップと、 第
1ステップによって求めた、前記適応量子化器への入力
信号e n を、不均一な量子化幅をもつ適応量子化器によ
って量子化し、符号L n を求める第2ステップと、 第2
ステップによる符号L n に基づいて、単位量子化幅T n+1
を求め、その単位量子化幅T n+1 を前記適応量子化器に
送る第3ステップと、 前記単位量子化幅T n+1 に基づい
て、前記適応量子化器への入力信号e n+1 を求める第4
ステップと、 前記符号L n を逆量子化し、逆量子化値
q n ’を求める第5ステップと、からなることを特徴と
する音声符号化方法。 - 【請求項2】 入力信号x n と該入力信号x n の予測値y
n との差分d n を適応量子化器で量子化する音声符号化方
法であって、 音声符号化装置へ入力された音声の入力信
号x n と該入力信号x n の予測値y n との差分d n を適応量
子化器によって量子化する際、差分d n ≧0の場合、前
記適応量子化器への入力信号e n =d n +T n /2(但
し、単位量子化幅T n )を求め、また差分d n <0の場
合、前記適応量子化器への入力信号e n =d n −T n /2
を求める第1ステップと、 第1ステップによって求め
た、前記適応量子化器への入力信号e n を不均一な量子
化幅をもつ適応量子化器によって量子化し、符号L n を
求める第2ステップと、 第2ステップによる符号L n に
基づいて、単位量子化幅T n+1 を求め、その単位量子化
幅T n+1 を前記適応量子化器に送る第3ステップと、 適
応逆量子化器による、前記符号L n の逆量子化によって
求められた逆量子化 値q n 、及び前記予測値y n に基づい
て、次の予測信号y n+1 を求める第4ステップと、 前記
単位量子化幅T n+1 に基づいて、前記適応量子化器への
入力信号e n+1 を求める第5ステップと、からなること
を特徴とする音声符号化方法。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP09035062A JP3143406B2 (ja) | 1997-02-19 | 1997-02-19 | 音声符号化方法 |
US09/367,229 US6366881B1 (en) | 1997-02-19 | 1998-02-18 | Voice encoding method |
CA002282278A CA2282278A1 (en) | 1997-02-19 | 1998-02-18 | Voice encoding method |
PCT/JP1998/000674 WO1998037636A1 (fr) | 1997-02-19 | 1998-02-18 | Procede de codage de signaux vocaux |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP09035062A JP3143406B2 (ja) | 1997-02-19 | 1997-02-19 | 音声符号化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH10233696A JPH10233696A (ja) | 1998-09-02 |
JP3143406B2 true JP3143406B2 (ja) | 2001-03-07 |
Family
ID=12431544
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP09035062A Expired - Lifetime JP3143406B2 (ja) | 1997-02-19 | 1997-02-19 | 音声符号化方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US6366881B1 (ja) |
JP (1) | JP3143406B2 (ja) |
CA (1) | CA2282278A1 (ja) |
WO (1) | WO1998037636A1 (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7240001B2 (en) * | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
US6934677B2 (en) | 2001-12-14 | 2005-08-23 | Microsoft Corporation | Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands |
US7299190B2 (en) * | 2002-09-04 | 2007-11-20 | Microsoft Corporation | Quantization and inverse quantization for audio |
JP4676140B2 (ja) | 2002-09-04 | 2011-04-27 | マイクロソフト コーポレーション | オーディオの量子化および逆量子化 |
US7502743B2 (en) | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
JP4245606B2 (ja) | 2003-06-10 | 2009-03-25 | 富士通株式会社 | 音声符号化装置 |
US7831434B2 (en) | 2006-01-20 | 2010-11-09 | Microsoft Corporation | Complex-transform channel coding with extended-band frequency coding |
US7885819B2 (en) | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
US8482439B2 (en) | 2008-12-26 | 2013-07-09 | Kyushu Institute Of Technology | Adaptive differential pulse code modulation encoding apparatus and decoding apparatus |
US9742434B1 (en) * | 2016-12-23 | 2017-08-22 | Mediatek Inc. | Data compression and de-compression method and data compressor and data de-compressor |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59178030A (ja) | 1983-03-28 | 1984-10-09 | Fujitsu Ltd | 適応型差分符号化方式 |
JPS59210723A (ja) | 1983-05-16 | 1984-11-29 | Nippon Telegr & Teleph Corp <Ntt> | 符号器 |
US4686512A (en) * | 1985-03-01 | 1987-08-11 | Kabushiki Kaisha Toshiba | Integrated digital circuit for processing speech signal |
JPS62194742A (ja) * | 1986-02-21 | 1987-08-27 | Hitachi Ltd | Adpcm符号化方式 |
JPS62213321A (ja) * | 1986-03-13 | 1987-09-19 | Fujitsu Ltd | 符号化装置 |
JPS6359024A (ja) * | 1986-08-28 | 1988-03-14 | Fujitsu Ltd | 適応量子化方式 |
JPS6410742A (en) * | 1987-07-02 | 1989-01-13 | Victor Company Of Japan | Digital signal transmission system |
JPH0828875B2 (ja) * | 1989-08-21 | 1996-03-21 | 三菱電機株式会社 | 符号化装置および復号化装置 |
JPH03177114A (ja) * | 1989-12-06 | 1991-08-01 | Fujitsu Ltd | Adpcm符号化方式 |
JPH07118651B2 (ja) * | 1990-11-22 | 1995-12-18 | ヤマハ株式会社 | ディジタル・アナログ変換回路 |
-
1997
- 1997-02-19 JP JP09035062A patent/JP3143406B2/ja not_active Expired - Lifetime
-
1998
- 1998-02-18 US US09/367,229 patent/US6366881B1/en not_active Expired - Lifetime
- 1998-02-18 WO PCT/JP1998/000674 patent/WO1998037636A1/ja active Application Filing
- 1998-02-18 CA CA002282278A patent/CA2282278A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
WO1998037636A1 (fr) | 1998-08-27 |
CA2282278A1 (en) | 1998-08-27 |
JPH10233696A (ja) | 1998-09-02 |
US6366881B1 (en) | 2002-04-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20160102364A (ko) | 멀티 채널 신호의 부호화/복호화 장치 및 방법 | |
JP2009537033A (ja) | 情報信号符号化 | |
JP3143406B2 (ja) | 音声符号化方法 | |
JP6456412B2 (ja) | Celp符号器および復号器で使用するための柔軟で拡張性のある複合革新コードブック | |
JP3541680B2 (ja) | 音声音楽信号の符号化装置および復号装置 | |
JP3266178B2 (ja) | 音声符号化装置 | |
JPH09127995A (ja) | 信号復号化方法及び信号復号化装置 | |
US20020040299A1 (en) | Apparatus and method for performing orthogonal transform, apparatus and method for performing inverse orthogonal transform, apparatus and method for performing transform encoding, and apparatus and method for encoding data | |
JP3559488B2 (ja) | 音響信号の階層符号化方法及び復号化方法 | |
JP3417362B2 (ja) | 音声信号復号方法及び音声信号符号化復号方法 | |
JP3143359B2 (ja) | 音声符号化方法 | |
JP2794842B2 (ja) | 符号化方法とその復号化方法 | |
JP3099876B2 (ja) | 多チャネル音声信号符号化方法及びその復号方法及びそれを使った符号化装置及び復号化装置 | |
JP3183743B2 (ja) | 音声処理システムにおける線型予測分析方法 | |
JPH028900A (ja) | 音声符号化復号化方法並びに音声符号化装置及び音声復合化装置 | |
JPH08211900A (ja) | ディジタル音声圧縮方式 | |
JP2975764B2 (ja) | 信号の符号化復号化装置 | |
JP2603631B2 (ja) | 音声分析合成装置 | |
JPH1049200A (ja) | 音声情報圧縮蓄積方法及び装置 | |
JP4343529B2 (ja) | フィルタ装置及び方法 | |
JP2637965B2 (ja) | 音声符号化復号化方法とその装置 | |
JPS5917439B2 (ja) | スペクトルパラメ−タの差分符号化方式 | |
JPS635926B2 (ja) | ||
JP3273870B2 (ja) | 音声の線形予測パラメータ符号化装置 | |
JP3101376B2 (ja) | 音声符号化方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081222 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081222 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091222 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101222 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101222 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111222 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121222 Year of fee payment: 12 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131222 Year of fee payment: 13 |
|
EXPY | Cancellation because of completion of term |