JP4533386B2 - オーディオ符号化装置及びオーディオ符号化方法 - Google Patents
オーディオ符号化装置及びオーディオ符号化方法 Download PDFInfo
- Publication number
- JP4533386B2 JP4533386B2 JP2006527708A JP2006527708A JP4533386B2 JP 4533386 B2 JP4533386 B2 JP 4533386B2 JP 2006527708 A JP2006527708 A JP 2006527708A JP 2006527708 A JP2006527708 A JP 2006527708A JP 4533386 B2 JP4533386 B2 JP 4533386B2
- Authority
- JP
- Japan
- Prior art keywords
- short
- block
- input signal
- encoding
- fluctuation ratio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 85
- 238000013139 quantization Methods 0.000 claims description 120
- 238000004364 calculation method Methods 0.000 claims description 79
- 238000004458 analytical method Methods 0.000 claims description 49
- 238000006243 chemical reaction Methods 0.000 claims description 45
- 230000000873 masking effect Effects 0.000 claims description 35
- 230000001131 transforming effect Effects 0.000 claims description 7
- 238000012545 processing Methods 0.000 description 26
- 238000010586 diagram Methods 0.000 description 23
- 238000001228 spectrum Methods 0.000 description 23
- 238000007796 conventional method Methods 0.000 description 16
- 238000009432 framing Methods 0.000 description 16
- 230000008569 process Effects 0.000 description 15
- 230000008859 change Effects 0.000 description 10
- 230000000694 effects Effects 0.000 description 8
- 230000005236 sound signal Effects 0.000 description 8
- 230000004048 modification Effects 0.000 description 7
- 238000012986 modification Methods 0.000 description 7
- 238000005311 autocorrelation function Methods 0.000 description 4
- 230000003044 adaptive effect Effects 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 230000006866 deterioration Effects 0.000 description 3
- 241000282412 Homo Species 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
- G10L19/025—Detection of transients or attacks for time/frequency resolution switching
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
図10は、第1の従来技術である、MPEG−2 AACのエンコーダの構成を示す構成図である。以下、この図に示される技術を第1の従来技術とする。AAC エンコーダの詳細は、例えば下記の非特許文献1に詳しく記載されている。
(a)AAC方式は、MDCTスペクトルの指数部を初期値に設定する。
(b)AAC方式は、MDCTスペクトルを仮数部と指数部とに変形する。すなわち、AAC方式は、MDCTスペクトルを浮動小数点表示に変形する。そして、AAC方式は、仮数部を量子化する(MDCT量子化)。
(c)AAC方式は、(b)で量子化された仮数部と指数部とをハフマン符号化した時に必要となるビット数(総ビット数)を求める。
(d)AAC方式は、(c)で求めた総ビット数が現フレームに許された量子化ビット数(許容ビット数)以下であれば、量子化を終了する。AAC方式は、総ビット数が許容ビット数以上の場合は、(a)で設定した指数部を不適当と判断する。そして、AAC方式は、指数部を変更して(b)〜(d)の処理を繰り返す。そして、AAC方式は、総ビット数が許容ビット数以下となる指数部を決定する。
上記第1の従来技術の問題を解決する方法として、MDCT変換と心理聴覚分析との前に、入力信号の性質を調べてブロック長を先に決定する方法が知られている。入力信号の性質を調べる方法には、例えば下記の特許文献1に開示された方法がある。この方法は公知である。
入力信号を一定のサンプル数からなるフレームに分割し、1フレームの入力信号を符号化する長ブロックモードと、前記フレームを分割して短ブロックとし、該短ブロックを符号化する短ブロックモードとを備えたオーディオ符号化装置において、
前記入力信号から電力変動比を算出する電力算出手段と、
前記入力信号から予測利得変動比を算出する算出手段と、
前記電力変動比と前記予測利得変動比とから、長ブロックによる符号化を行うか又は短ブロックによる符号化を行うかを判定するブロック長判定手段とを備える。
前記ブロック長判定手段が、
前記電力変動比及び前記予測利得変動比のいずれか一方があらかじめ決められた閾値より大きい場合に短ブロックによる符号化を選択し、前記電力変動比及び前記予測利得変動比のいずれか一方があらかじめ決められた閾値より大きい場合以外の場合に、長ブロックによる符号化を選択する。
前記ブロック長判定手段が用いる符号化する際のブロック長を判定するための閾値を、前記ブロック長判定手段の判定結果に応じて変化させる閾値決定手段を備える。
前記閾値決定手段が、
前記ブロック長判定手段の判定結果が短ブロックによる符号化を表す場合に、前記閾値を初期値よりも大きな値に設定する。
前記算出手段が、
前記電力算出手段が電力を算出するブロックを所定数用いて1つのブロックとし、該1つのブロックの前記予測利得変動比を算出する。
前記電力算出手段が、
前記算出手段が予測利得を算出するブロックを所定数用いて1つのブロックとし、該1つのブロックの前記電力変動比を算出する。
入力信号を一定のサンプル数からなるフレームに分割し、1フレームの入力信号を符号化する長ブロックモードと、
前記フレームを分割して短ブロックとし、該短ブロックを符号化する短ブロックモードとを備えたオーディオ符号化装置において、
前記入力信号から電力変動比を算出する電力算出手段と、
前記入力信号から予測利得変動比を算出する算出手段と、
前記電力変動比と前記予測利得変動比とから、長ブロックによる符号化を行うか又は短ブロックによる符号化を行うかを判定するブロック長判定手段と、
前記ブロック長判定手段により長ブロックによる符号化が選択された場合は、長ブロック単位で入力信号を離散コサイン変換して第1の係数を求める第1の変換手段と、
前記ブロック長判定手段により短ブロックによる符号化が選択された場合は、短ブロック単位で入力信号を離散コサイン変換して第2の係数を求める第2の変換手段と、
前記ブロック長判定手段の判定結果に応じて前記第1の係数又は前記第2の係数を第3の係数として選択する選択手段と、
前記入力信号からマスキング閾値を求める心理聴覚分析手段と、
前記マスキング閾値に従って前記第3の係数をスペクトル量子化して第1の符号を求める量子化手段と、
前記第1の符号をハフマン符号化して第2の符号を求めるハフマン符号化手段と、
前記第2の符号から、出力されるビットストリームの総ビット数を計算し、該計算の結果に基づいてビットストリームの出力を指示する量子化制御手段と、
前記第2の符号からビットストリームを生成し、前記量子化制御手段の指示に基づいてビットストリームを出力するビットストリーム生成手段とを備える。
前記ブロック長判定手段が、
前記電力変動比及び前記予測利得変動比の少なくともいずれか一方があらかじめ決められた閾値より大きい場合に短ブロックによる符号化を選択し、前記電力変動比及び前記予測利得変動比の少なくともいずれか一方があらかじめ決められた閾値より大きい場合以外の場合は長ブロックによる符号化を選択する。
前記ブロック長判定手段が用いる符号化する際のブロック長を判定するための閾値を、前記ブロック長判定手段の判定結果に応じて変化させる閾値決定手段を備える。
前記閾値決定手段が、
前記ブロック長判定手段の判定結果が短ブロックによる符号化を表す場合に、前記閾値を初期値よりも大きい値に設定する。
前記算出手段が、
前記電力算出手段が電力を算出するブロックを所定数用いて1つのブロックとし、該1つのブロックの前記予測利得変動比を算出する。
前記電力算出手段が、
前記算出手段が予測利得を算出するブロックを所定数用いて1つのブロックとし、該1つのブロックの前記電力変動比を算出する。
入力信号を一定のサンプル数からなるフレームに分割し、1フレームの入力信号を符号化する長ブロックモードと、前記フレームを分割して短ブロックとし、該短ブロックを符号化する短ブロックモードとを備えたオーディオ符号化方法において、
前記入力信号から電力変動比を算出する電力算出工程と、
前記入力信号から予測利得変動比を算出する算出工程と、
前記電力変動比と前記予測利得変動比とから、長ブロックによる符号化を行うか又は短ブロックによる符号化を行うかを判定するブロック長判定工程とを備える。
入力信号を一定のサンプル数からなるフレームに分割し、1フレームの入力信号を符号化する長ブロックモードと、
前記フレームを分割して短ブロックとし、該短ブロックを符号化する短ブロックモードとを備えたオーディオ符号化方法において、
前記入力信号から電力変動比を算出する電力算出工程と、
前記入力信号から予測利得変動比を算出する算出工程と、
前記電力変動比と前記予測利得変動比とから、長ブロックによる符号化を行うか又は短ブロックによる符号化を行うかを判定するブロック長判定工程と、
前記ブロック長判定工程において長ブロックによる符号化が選択された場合は、長ブロック単位で入力信号を離散コサイン変換して第1の係数を求める第1の変換工程と、
前記ブロック長判定工程において短ブロックによる符号化が選択された場合は、短ブロック単位で入力信号を離散コサイン変換して第2の係数を求める第2の変換工程と、
前記ブロック長判定工程の判定結果に応じて前記第1の係数又は前記第2の係数を第3の係数として選択する選択工程と、
前記入力信号からマスキング閾値を求める心理聴覚分析工程と、
前記マスキング閾値に従って前記第3の係数をスペクトル量子化して第1の符号を求める量子化工程と、
前記第1の符号をハフマン符号化して第2の符号を求めるハフマン符号化工程と、
前記第2の符号から、出力されるビットストリームの総ビット数を計算し、該計算の結果に基づいてビットストリームの出力を指示する量子化制御工程と、
前記第2の符号からビットストリームを生成し、前記量子化制御工程における指示に基づいてビットストリームを出力するビットストリーム生成工程とを備える。
102 電力算出部
103 算出部
104 ブロック長判定部
105 選択器
106 長ブロック用のMDCT変換部
107 短ブロック用のMDCT変換部
108 選択器
109 心理聴覚分析部
110 量子化部
111 ハフマン符号化部
112 ビットストリーム生成部
113 量子化制御部
401 フレーム化部
402 電力算出部
403 自己相関算出部
404 kパラメータ算出部
405 予測利得算出部
406 予測利得変動比算出部
407 ブロック長判定部
408 選択器
409 長ブロック用のMDCT変換部
410 短ブロック用のMDCT変換部
411 選択器
412 心理聴覚分析部
413 量子化部
414 ハフマン符号化部
415 ビットストリーム生成部
416 量子化制御部
601 フレーム化部
602 電力算出部
603 自己相関算出部
604 kパラメータ算出部
605 予測利得算出部
606 予測利得変動比算出部
607 ブロック長判定部
608 閾値決定部
609 選択器
610 長ブロック用のMDCT変換部
611 短ブロック用のMDCT変換部
612 選択器
613 心理聴覚分析部
614 量子化部
615 ハフマン符号化部
616 ビットストリーム生成部
617 量子化制御部
以下、図面を参照して本発明を実施するための最良の形態について説明する。まず、本発明のオーディオ符号化装置及びオーディオ符号化方法の概要について説明する。図1は、本発明のオーディオ符号化装置の概要図である。以下の説明は、本発明のオーディオ符号化方法の概要の説明も兼ねる。図1において、フレーム化部101は、入力信号を、所定のサンプル数からなる入力信号フレーム(長ブロック)に分割する。次に、長ブロック用のMDCT変換部106、短ブロック用のMDCT変換部107、電力算出部102及び算出部103は、1フレームを長ブロックよりも更に短い短ブロックに分割する。図2は、本発明のオーディオ符号化装置で用いる長ブロックと短ブロックの一例の概念図である。図2は、1フレーム(長ブロック)を4つ短ブロックに分割する場合を示している。以下では、図2に示される例を元に説明する。しかし、本発明は、1フレームをn個(n>0)に分割する場合でも同様に実施できる。
B)次に、ブロック長判定部104は、ΔP(1,2)、ΔP(2,3)、ΔP(3,4)の中で閾値THPよりも大きいものが一つでもあれば短ブロックを選択し、なければ次のC)へ進む。
C)次に、ブロック長判定部104は、ΔG(1,2)、ΔG(2,3)、ΔG(3,4)の中で閾値THGよりも大きいものが一つでもあれば短ブロックを選択し、なければ長ブロックを選択する。
図4は、本発明のオーディオ符号化装置の第1の実施形態の構成図である。図4において、フレーム化部401は、入力した信号を所定のサンプル数からなる入力信号フレーム(長ブロック)に分割する。
(B)ブロック長判定部407は、ΔP(1,2)、ΔP(2,3)、ΔP(3,4)の中で閾値THPよりも大きいものが一つでもあれば短ブロックを選択し(S501,S502,S503,S508)、なければ(C)へ進む。
図6は、本発明のオーディオ符号化装置の第2の実施形態の構成図である。本実施形態は、第1の実施形態と比較して、電力変動比に対する閾値THPと予測利得変動比に対する閾値THGとを動的に変化させる部分が異なる。それ以外の部分は第1の実施形態と共通であるので説明を省略する。
(1)本実施形態の変形例は、短ブロックが選ばれた後、一定時間は短ブロックを選択しない。
(2)本実施形態の変形例は、短ブロックが選ばれた後、α又はβを十分に大きくする。ただし、本実施形態の変形例は、THG又はTHP範囲をあらかじめ調べておく必要がある。
(3)本実施形態の変形例は、短ブロックが選択され、閾値がTHG+α又はTHP+βとなっている場合に、再度短ブロックが選択された場合、閾値を、THG+α+α又はTHP+β+βとする。ただし、本実施形態の変形例は、一定時間後は、閾値を元の値に戻す。
次に、本発明のオーディオ符号化装置の第3の実施形態について説明する。本実施形態の構成は、図4に示される第1の実施形態と同じである。しかし、第3の実施形態は、予測利得変動比をフレーム単位で求める点が前述の第1の実施形態とは異なる。すなわち、本実施形態では、電力を算出するブロックを所定数用いて1つのブロックとし、この1つのブロックの予測利得変動比を算出する。
(2)次に、ブロック長判定部は、ΔP(1,2)、ΔP(2,3)、ΔP(3,4)の中で、一つでもあらかじめ決められた閾値THPよりも大きいものがあれば短ブロックを選択する
次に、本発明のオーディオ符号化装置の第4の実施形態について説明する。本実施形態の構成は第1の実施形態の構成と同じある。しかし、本実施形態は、1フレームを8つの短ブロックに分割して行う電力変動比の計算方法が第1の実施形態と異なる。すなわち、本実施形態は、予測利得を算出するブロックを所定数用いて1つのブロックとし、この1つのブロックの電力変動比を算出する。
Claims (12)
- 入力信号を一定のサンプル数からなるフレームに分割し、1フレームの入力信号を符号化する長ブロックモードと、前記フレームを分割して複数の短ブロックとし、該短ブロックを符号化する短ブロックモードとを備えたオーディオ符号化装置において、
前記入力信号が分割された前記複数の短ブロックから隣接する短ブロック間毎の電力変動比を算出する電力算出手段と、
前記入力信号が分割された前記複数の短ブロックから隣接する短ブロック間毎の予測利得変動比を算出する算出手段と、
前記短ブロック間毎の電力変動比と前記短ブロック間毎の予測利得変動比とから、長ブロックによる符号化を行うか又は短ブロックによる符号化を行うかを判定するブロック長判定手段とを備え、
前記ブロック長判定手段は、前記短ブロック間毎の電力変動比及び前記短ブロック間毎の予測利得変動比のいずれかがあらかじめ決められた閾値より大きい場合に短ブロックによる符号化を選択し、そうでなければ長ブロックによる符号化を選択する
オーディオ符号化装置。 - 前記ブロック長判定手段が用いる符号化する際の前記閾値を、前記ブロック長判定手段の判定結果に応じて変化させる閾値決定手段を備える
請求項1記載のオーディオ符号化装置。 - 前記閾値決定手段は、前記ブロック長判定手段の判定結果が短ブロックモードによる符号化を表す場合に、前記閾値を初期値よりも大きな値に設定する
請求項2に記載のオーディオ符号化装置。 - 入力信号を一定のサンプル数からなるフレームに分割し、1フレームの入力信号を符号化する長ブロックモードと、前記フレームを分割して複数の短ブロックとし、該短ブロックを符号化する短ブロックモードとを備えたオーディオ符号化装置において、
前記入力信号が分割された前記複数の短ブロックから隣接する短ブロック間毎の電力変動比を算出する電力算出手段と、
前記入力信号が分割された複数のフレームから隣接するフレーム間毎の予測利得変動比
を算出する算出手段と、
前記短ブロック間毎の電力変動比及び前記フレーム間毎の予測利得変動比のいずれかがあらかじめ決められた閾値より大きい場合に短ブロックモードによる符号化を選択し、そうでなければ長ブロックモードによる符号化を選択するブロック長判定手段と
を備えるオーディオ符号化装置。 - 入力信号を一定のサンプル数からなるフレームに分割し、1フレームの入力信号を符号化する長ブロックモードと、前記フレームを分割して複数の短ブロックとし、該短ブロックを符号化する短ブロックモードとを備えたオーディオ符号化装置において、
前記入力信号が分割された複数のフレームから隣接するフレーム間毎の電力変動比を算出する電力算出手段と、
前記入力信号が分割された前記複数の短ブロックから隣接する短ブロック間毎の予測利得変動比を算出する算出手段と、
前記フレーム毎の電力変動比及び前記短ブロック間毎の予測利得変動比のいずれかがあらかじめ決められた閾値より大きい場合に短ブロックモードによる符号化を選択し、そうでなければ長ブロックモードによる符号化を選択するブロック長判定手段と
を備えるオーディオ符号化装置。 - 入力信号を一定のサンプル数からなるフレームに分割し、1フレームの入力信号を符号化する長ブロックモードと、前記フレームを分割して複数の短ブロックとし、該短ブロックを符号化する短ブロックモードとを備えたオーディオ符号化装置において、
前記入力信号が分割された前記複数の短ブロックから隣接する短ブロック間毎の電力変動比を算出する電力算出手段と、
前記入力信号が分割された前記複数の短ブロックから隣接する短ブロック間毎の予測利得変動比を算出する算出手段と、
前記短ブロック間毎の電力変動比及び前記短ブロック間毎の予測利得変動比のいずれかがあらかじめ決められた閾値より大きい場合に短ブロックモードによる符号化を選択し、そうでなければ長ブロックモードによる符号化を選択するブロック長判定手段と、
前記ブロック長判定手段により長ブロックモードによる符号化が選択された場合には、長ブロック単位で入力信号を離散コサイン変換して第1の係数を求める第1の変換手段と、
前記ブロック長判定手段により短ブロックモードによる符号化が選択された場合は、短ブロック単位で入力信号を離散コサイン変換して第2の係数を求める第2の変換手段と、
前記ブロック長判定手段の判定結果に応じて前記第1の係数又は前記第2の係数を第3の係数として選択する選択手段と、
前記入力信号からマスキング閾値を求める心理聴覚分析手段と、
前記マスキング閾値に従って前記第3の係数をスペクトル量子化して第1の符号を求める量子化手段と、
前記第1の符号をハフマン符号化して第2の符号を求めるハフマン符号化手段と、
前記第2の符号からビットストリームを生成し、前記量子化制御手段の指示に基づいてビットストリームを出力するビットストリーム生成手段と
を備えるオーディオ符号化装置。 - 前記ブロック長判定手段が用いる符号化する際の前記閾値を、前記ブロック長判定手段の判定結果に応じて変化させる閾値決定手段を備える
請求項6に記載のオーディオ符号化装置。 - 前記閾値決定手段は、前記ブロック長判定手段の判定結果が短ブロックモードによる符号化を表す場合に、前記閾値を初期値よりも大きな値に設定する
請求項7に記載のオーディオ符号化装置。 - 入力信号を一定のサンプル数からなるフレームに分割し、1フレームの入力信号を符号化する長ブロックモードと、前記フレームを分割して複数の短ブロックとし、該短ブロックを符号化する短ブロックモードとを備えたオーディオ符号化装置において、
前記入力信号が分割された前記複数の短ブロックから隣接する短ブロック間毎の電力変動比を算出する電力算出手段と、
前記入力信号が分割された複数のフレームから隣接するフレーム間毎の予測利得変動比を算出する算出手段と、
前記短ブロック間毎の電力変動比及び前記フレーム間毎の予測利得変動比のいずれかがあらかじめ決められた閾値より大きい場合に短ブロックモードによる符号化を選択し、そうでなければ長ブロックモードによる符号化を選択するブロック長判定手段と、
前記ブロック長判定手段により長ブロックモードによる符号化が選択された場合には、長ブロック単位で入力信号を離散コサイン変換して第1の係数を求める第1の変換手段と、
前記ブロック長判定手段により短ブロックモードによる符号化が選択された場合は、短ブロック単位で入力信号を離散コサイン変換して第2の係数を求める第2の変換手段と、
前記ブロック長判定手段の判定結果に応じて前記第1の係数又は前記第2の係数を第3の係数として選択する選択手段と、
前記入力信号からマスキング閾値を求める心理聴覚分析手段と、
前記マスキング閾値に従って前記第3の係数をスペクトル量子化して第1の符号を求める量子化手段と、
前記第1の符号をハフマン符号化して第2の符号を求めるハフマン符号化手段と、
前記第2の符号からビットストリームを生成し、前記量子化制御手段の指示に基づいてビットストリームを出力するビットストリーム生成手段と
を備えるオーディオ符号化装置。 - 入力信号を一定のサンプル数からなるフレームに分割し、1フレームの入力信号を符号化する長ブロックモードと、前記フレームを分割して複数の短ブロックとし、該短ブロックを符号化する短ブロックモードとを備えたオーディオ符号化装置において、
前記入力信号が分割された複数のフレームから隣接するフレーム間毎の電力変動比を算出する電力算出手段と、
前記入力信号が分割された前記複数の短ブロックから隣接する短ブロック間毎の予測利得変動比を算出する算出手段と、
前記フレーム毎の電力変動比及び前記短ブロック間毎の予測利得変動比のいずれかがあらかじめ決められた閾値より大きい場合に短ブロックモードによる符号化を選択し、そうでなければ長ブロックモードによる符号化を選択するブロック長判定手段と、
前記ブロック長判定手段により長ブロックモードによる符号化が選択された場合には、長ブロック単位で入力信号を離散コサイン変換して第1の係数を求める第1の変換手段と、
前記ブロック長判定手段により短ブロックモードによる符号化が選択された場合は、短ブロック単位で入力信号を離散コサイン変換して第2の係数を求める第2の変換手段と、
前記ブロック長判定手段の判定結果に応じて前記第1の係数又は前記第2の係数を第3の係数として選択する選択手段と、
前記入力信号からマスキング閾値を求める心理聴覚分析手段と、
前記マスキング閾値に従って前記第3の係数をスペクトル量子化して第1の符号を求める量子化手段と、
前記第1の符号をハフマン符号化して第2の符号を求めるハフマン符号化手段と、
前記第2の符号からビットストリームを生成し、前記量子化制御手段の指示に基づいてビットストリームを出力するビットストリーム生成手段と
を備えるオーディオ符号化装置。 - 入力信号を一定のサンプル数からなるフレームに分割し、1フレームの入力信号を符号化する長ブロックモードと、前記フレームを分割して複数の短ブロックとし、該短ブロックを符号化する短ブロックモードとを備えたオーディオ符号化方法において、
前記入力信号が分割された前記複数の短ブロックから隣接する短ブロック間毎の電力変動比を算出する電力算出工程と、
前記入力信号が分割された前記複数の短ブロックから隣接する短ブロック間毎の予測利得変動比を算出する算出工程と、
前記短ブロック間毎の電力変動比及び前記短ブロック間毎の予測利得変動比のいずれかがあらかじめ決められた閾値より大きい場合に短ブロックモードによる符号化を選択し、そうでなければ長ブロックモードによる符号化を選択するブロック長判定工程と
を備えるオーディオ符号化方法。 - 入力信号を一定のサンプル数からなるフレームに分割し、1フレームの入力信号を符号化する長ブロックモードと、前記フレームを分割して複数の短ブロックとし、該短ブロックを符号化する短ブロックモードとを備えたオーディオ符号化方法において、
前記入力信号が分割された前記複数の短ブロックから隣接する短ブロック間毎の電力変動比を算出する電力算出工程と、
前記入力信号が分割された前記複数の短ブロックから隣接する短ブロック間毎の予測利得変動比を算出する算出工程と、
前記短ブロック間毎の電力変動比及び前記短ブロック間毎の予測利得変動比のいずれかがあらかじめ決められた閾値より大きい場合に短ブロックモードによる符号化を選択し、そうでなければ長ブロックモードによる符号化を選択するブロック長判定工程と
前記ブロック長判定工程において長ブロックモードによる符号化が選択された場合には、長ブロック単位で入力信号を離散コサイン変換して第1の係数を求める第1の変換工程と、
前記ブロック長判定工程において短ブロックモードによる符号化が選択された場合は、短ブロック単位で入力信号を離散コサイン変換して第2の係数を求める第2の変換工程と、
前記ブロック長判定工程の判定結果に応じて前記第1の係数又は前記第2の係数を第3の係数として選択する選択工程と、
前記入力信号からマスキング閾値を求める心理聴覚分析工程と、
前記マスキング閾値に従って前記第3の係数をスペクトル量子化して第1の符号を求める量子化工程と、
前記第1の符号をハフマン符号化して第2の符号を求めるハフマン符号化工程と、
前記第2の符号からビットストリームを生成し、前記量子化制御工程における指示に基づいてビットストリームを出力するビットストリーム生成工程と
を備えるオーディオ符号化方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2004/010416 WO2006008817A1 (ja) | 2004-07-22 | 2004-07-22 | オーディオ符号化装置及びオーディオ符号化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2006008817A1 JPWO2006008817A1 (ja) | 2008-05-01 |
JP4533386B2 true JP4533386B2 (ja) | 2010-09-01 |
Family
ID=35784953
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006527708A Expired - Fee Related JP4533386B2 (ja) | 2004-07-22 | 2004-07-22 | オーディオ符号化装置及びオーディオ符号化方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20070118368A1 (ja) |
EP (1) | EP1775718A4 (ja) |
JP (1) | JP4533386B2 (ja) |
WO (1) | WO2006008817A1 (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4658853B2 (ja) * | 2006-04-13 | 2011-03-23 | 日本電信電話株式会社 | 適応ブロック長符号化装置、その方法、プログラム及び記録媒体 |
JP4658852B2 (ja) * | 2006-04-13 | 2011-03-23 | 日本電信電話株式会社 | 適応ブロック長符号化装置、その方法、プログラム及び記録媒体 |
US7966175B2 (en) | 2006-10-18 | 2011-06-21 | Polycom, Inc. | Fast lattice vector quantization |
US7953595B2 (en) | 2006-10-18 | 2011-05-31 | Polycom, Inc. | Dual-transform coding of audio signals |
US20090144054A1 (en) * | 2007-11-30 | 2009-06-04 | Kabushiki Kaisha Toshiba | Embedded system to perform frame switching |
EP2077550B8 (en) | 2008-01-04 | 2012-03-14 | Dolby International AB | Audio encoder and decoder |
CN102067211B (zh) | 2009-03-11 | 2013-04-17 | 华为技术有限公司 | 一种线性预测分析方法、装置及*** |
CN102930871B (zh) * | 2009-03-11 | 2014-07-16 | 华为技术有限公司 | 一种线性预测分析方法、装置及*** |
CN102243872A (zh) * | 2010-05-10 | 2011-11-16 | 炬力集成电路设计有限公司 | 对音频数字信号进行编码、解码的方法及*** |
JP6881931B2 (ja) * | 2016-09-30 | 2021-06-02 | 株式会社モバイルテクノ | 信号圧縮装置、信号伸長装置、信号圧縮プログラム、信号伸長プログラム及び通信装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0766733A (ja) * | 1993-08-25 | 1995-03-10 | Victor Co Of Japan Ltd | 音声高能率符号化装置 |
JP2000134106A (ja) * | 1998-10-29 | 2000-05-12 | Matsushita Electric Ind Co Ltd | オーディオ変換符号化のための周波数領域でのブロックサイズ判定適応方法 |
JP2003510643A (ja) * | 1999-09-20 | 2003-03-18 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオ信号を補正する処理回路、受信機、通信システム、携帯装置、及びその方法 |
JP2003233400A (ja) * | 2002-02-08 | 2003-08-22 | Ntt Docomo Inc | 復号装置、符号化装置、復号方法、及び、符号化方法 |
JP2004054156A (ja) * | 2002-07-24 | 2004-02-19 | Victor Co Of Japan Ltd | 音響信号符号化方法及び音響信号符号化装置 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3252005B2 (ja) * | 1993-03-08 | 2002-01-28 | パイオニア株式会社 | 適応ブロック長変換符号化のブロック長選択装置 |
TW271524B (ja) * | 1994-08-05 | 1996-03-01 | Qualcomm Inc | |
US5774837A (en) * | 1995-09-13 | 1998-06-30 | Voxware, Inc. | Speech coding system and method using voicing probability determination |
JPH09232964A (ja) * | 1996-02-20 | 1997-09-05 | Nippon Steel Corp | ブロック長可変型変換符号化装置および過渡状態検出装置 |
US5848391A (en) * | 1996-07-11 | 1998-12-08 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Method subband of coding and decoding audio signals using variable length windows |
JP2000206990A (ja) * | 1999-01-12 | 2000-07-28 | Ricoh Co Ltd | デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体 |
JP4021124B2 (ja) * | 2000-05-30 | 2007-12-12 | 株式会社リコー | デジタル音響信号符号化装置、方法及び記録媒体 |
EP1440433B1 (en) * | 2001-11-02 | 2005-05-04 | Matsushita Electric Industrial Co., Ltd. | Audio encoding and decoding device |
US7460993B2 (en) * | 2001-12-14 | 2008-12-02 | Microsoft Corporation | Adaptive window-size selection in transform coding |
JP3815323B2 (ja) * | 2001-12-28 | 2006-08-30 | 日本ビクター株式会社 | 周波数変換ブロック長適応変換装置及びプログラム |
US7389226B2 (en) * | 2002-10-29 | 2008-06-17 | Ntt Docomo, Inc. | Optimized windows and methods therefore for gradient-descent based window optimization for linear prediction analysis in the ITU-T G.723.1 speech coding standard |
TWI275074B (en) * | 2004-04-12 | 2007-03-01 | Vivotek Inc | Method for analyzing energy consistency to process data |
US7177804B2 (en) * | 2005-05-31 | 2007-02-13 | Microsoft Corporation | Sub-band voice codec with multi-stage codebooks and redundant coding |
-
2004
- 2004-07-22 EP EP04770880A patent/EP1775718A4/en not_active Withdrawn
- 2004-07-22 JP JP2006527708A patent/JP4533386B2/ja not_active Expired - Fee Related
- 2004-07-22 WO PCT/JP2004/010416 patent/WO2006008817A1/ja active Application Filing
-
2007
- 2007-01-18 US US11/654,679 patent/US20070118368A1/en not_active Abandoned
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0766733A (ja) * | 1993-08-25 | 1995-03-10 | Victor Co Of Japan Ltd | 音声高能率符号化装置 |
JP2000134106A (ja) * | 1998-10-29 | 2000-05-12 | Matsushita Electric Ind Co Ltd | オーディオ変換符号化のための周波数領域でのブロックサイズ判定適応方法 |
JP2003510643A (ja) * | 1999-09-20 | 2003-03-18 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオ信号を補正する処理回路、受信機、通信システム、携帯装置、及びその方法 |
JP2003233400A (ja) * | 2002-02-08 | 2003-08-22 | Ntt Docomo Inc | 復号装置、符号化装置、復号方法、及び、符号化方法 |
JP2004054156A (ja) * | 2002-07-24 | 2004-02-19 | Victor Co Of Japan Ltd | 音響信号符号化方法及び音響信号符号化装置 |
Also Published As
Publication number | Publication date |
---|---|
WO2006008817A1 (ja) | 2006-01-26 |
EP1775718A1 (en) | 2007-04-18 |
JPWO2006008817A1 (ja) | 2008-05-01 |
EP1775718A4 (en) | 2008-05-07 |
US20070118368A1 (en) | 2007-05-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP4235660B1 (en) | Audio decoder | |
JP6704037B2 (ja) | 音声符号化装置および方法 | |
EP2282310B1 (en) | Entropy coding by adapting coding between level and run-length/level modes | |
US9842603B2 (en) | Encoding device and encoding method, decoding device and decoding method, and program | |
JP4548348B2 (ja) | 音声符号化装置及び音声符号化方法 | |
JP5583881B2 (ja) | オーディオ信号の変換方法及び変換装置、オーディオ信号の適応的符号化方法及び適応的符号化装置 | |
KR20080049116A (ko) | 오디오 코딩 | |
US20070118368A1 (en) | Audio encoding apparatus and audio encoding method | |
RU2640722C2 (ru) | Усовершенствованный квантователь | |
JP6739604B2 (ja) | 符号化方法、装置、プログラム及び記録媒体 | |
JP2004258603A (ja) | レベル・モードとラン・レングス/レベル・モードの間での符号化を適応させるエントロピー符号化 | |
JP2010060989A (ja) | 演算装置および方法、量子化装置および方法、オーディオ符号化装置および方法、並びにプログラム | |
KR101387808B1 (ko) | 가변 비트율을 갖는 잔차 신호 부호화를 이용한 고품질 다객체 오디오 부호화 및 복호화 장치 | |
JP4699117B2 (ja) | 信号符号化装置、信号復号化装置、信号符号化方法、及び信号復号化方法。 | |
JP2003233397A (ja) | オーディオ符号化装置、オーディオ符号化プログラム及びオーディオ符号化データ伝送装置 | |
JP2010078964A (ja) | 演算装置および方法、量子化装置および方法、並びにプログラム | |
KR100880995B1 (ko) | 오디오 부호화 장치 및 오디오 부호화 방법 | |
JP4273062B2 (ja) | 符号化方法、符号化装置、復号化方法及び復号化装置 | |
EP3514791B1 (en) | Sample sequence converter, sample sequence converting method and program | |
WO2019244666A1 (ja) | 符号化装置および方法、復号装置および方法、並びにプログラム | |
JP2008268792A (ja) | オーディオ信号符号化装置およびそのビットレート変換装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100216 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100419 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100518 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100611 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130618 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |