JP4556866B2 - 高能率符号化プログラム及び高能率符号化装置 - Google Patents

高能率符号化プログラム及び高能率符号化装置 Download PDF

Info

Publication number
JP4556866B2
JP4556866B2 JP2005376442A JP2005376442A JP4556866B2 JP 4556866 B2 JP4556866 B2 JP 4556866B2 JP 2005376442 A JP2005376442 A JP 2005376442A JP 2005376442 A JP2005376442 A JP 2005376442A JP 4556866 B2 JP4556866 B2 JP 4556866B2
Authority
JP
Japan
Prior art keywords
value
calculated
characteristic
filter
quantization
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005376442A
Other languages
English (en)
Other versions
JP2007178677A (ja
Inventor
定浩 安良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Victor Company of Japan Ltd
Original Assignee
Victor Company of Japan Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Victor Company of Japan Ltd filed Critical Victor Company of Japan Ltd
Priority to JP2005376442A priority Critical patent/JP4556866B2/ja
Publication of JP2007178677A publication Critical patent/JP2007178677A/ja
Application granted granted Critical
Publication of JP4556866B2 publication Critical patent/JP4556866B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、音声又はオーディオ信号の符号化のための高能率符号化プログラム及び高能率符号化装置に関し、特に量子化雑音スペクトルを聴感的に望ましいものとすることによって聴くに耐え得る品質を提供する高能率符号化プログラム及び高能率符号化装置に関する。
従来から音声やオーディオ信号を符号化する技術はあり、その従来技術として下記の特許文献1がある。特許文献1には、差分符号化と準瞬時圧縮を用いた符号化方式において、量子化雑音スペクトルの形を変形させることで聴感上の品質を向上させる方法が記載されている。この方法は、デジタル音声信号の隣接する2サンプル間の差分値を、一定サンプル数の差分値から構成されるブロック内のレベルの最大値に応じて求めたレンジ情報を用いて圧縮を行う方式であり、レベル検出手段、マスキング特性演算手段、等ラウドネス曲線発生手段からの情報により決定されるフィルタ特性を、ノイズシェイピング手段によって量子化雑音に対して適用することで、等ラウドネス特性やマスキング特性に沿った量子化雑音スペクトルの形に変更することができ、聴感上のノイズを低減させることができる。
また、他の符号化技術としては下記の非特許文献1に記載されている技術が存在する。この技術は適応型差分PCM(Pulse Code Modulation)であり広く知られている。この技術は、1サンプル前の値を予測値として現サンプルとの差分値を算出して符号化を行うものであり、その際のステップサイズ(量子化幅)は直前の差分値を符号化した符号により決定される。この方式に基づく符号化ツールがPC(Personal Computer)で動作する汎用オーディオ編集ソフトウェアに組み込まれており、自由に符号化、復号化をすることができる。具体的に図12を用いて非特許文献1の高能率符号化装置を説明する。
図12に示すように、入力されるオーディオ信号X(n)はサンプリング周波数8kHz、12bit精度のリニアPCMである。通常のCDなどでは16ビットの精度があるため、LSB(Least Significant Bit)4ビット目を四捨五入して12bitに丸めて使用している。差分算出ステップ部121において、現サンプルであるX(n)と圧縮伸長された1つ前のサンプルX´(n−1)との差分が取られて差分値d(n)が生成される。そして、ステップサイズ(量子化幅)決定ステップ部123において、1つ前の差分値の符号化結果に基づき決定されたステップサイズss(n)が圧縮ステップ部122に供給され、差分値d(n)は4ビットのADPCMコードL(n)に変換される。伸長ステップ部124では、圧縮ステップ部122で変換されたADPCMコードL(n)が逆変換されて量子化雑音(以下、量子化誤差とも言う)を含んだ差分値d´(n)が得られる。そして、累積ステップ部125において差分算出ステップ部121の逆処理が行われて1つ前のサンプルX´(n−1)が再構築される。
また、この技術では、音声信号向けの符号化方式であるため、比較的緩やかな信号の変化を想定している。これにより、入力信号に急激な変化が生じた場合、直前の差分値を符号化した符号から現在のステップサイズ(量子化幅)を決定する構成ではステップサイズが信号に追随できずに量子化雑音が増加し、ざらざらと耳障りな音になるという問題があった。この問題を解消するため、上述した特許文献1に記載された技術を用いることを考える。特許文献1に記載された技術におけるノイズシェイピング手段は、量子化雑音を等ラウドネス特性やマスキング特性に基づいて聴覚的に聞こえない領域(例えば、16kHz以上)の量子化雑音を増加させるようにスペクトル形状を変化させている。
特許第3191457号公報(要約、図5) "Dialogic ADPCM Algorithm"1988,Dialogic Cooperation
しかしながら、特許文献1に記載された技術を非特許文献1に記載された技術に適用しようとした場合、非特許文献1の技術で用いられるサンプリング周波数が8kHz(ナイキスト周波数4kHz)であることから、量子化雑音を移動する帯域が存在しないという問題がある。また、マスキング特性に基づいた場合においても、マスキングレベル算出の際に一般的に低中域の量子化雑音を減らすように重み付けがなされるため、低中域で減らした分の量子化雑音を移動させる先がないという問題がある。
本発明は、上記問題を解決するためのものであり、低サンプリング周波数を用いる符号化において、既存のフォーマットに何ら変更を加えることなく、周波数的に一様に拡がった量子化雑音のスペクトル包絡線をオーディオ信号のスペクトル包絡線に近づけることができ、オーディオ信号の高品質化を図ることができ、特定の周波数帯域だけ信号対量子化雑音比(SNR)が高いといった偏りを改善することができ、処理フレーム境界で発生する品質ギャップを防ぐことができる高能率符号化プログラム及び高能率符号化装置を提供することを目的とする。
上記目的を達成するために、本発明によれば、等ラウドネス特性及び/又はマスキング特性に基づいて、聴覚的に聞こえない領域の量子化雑音を増加させるようにスペクトル形状を変化させることが可能なサンプリング周波数に比べて低い低サンプリング周波数によりサンプリングされた入力オーディオ信号における現サンプルと1つ前のサンプルとの差分値を算出する差分算出ステップと、前記差分値に対して量子化及び符号化を行う圧縮ステップと、前記圧縮ステップから得られた出力に対して復号化及び逆量子化を行う伸長ステップと、前記圧縮ステップの符号化結果に基づいて、次に算出される差分値の量子化の際の量子化幅を決定する量子化幅決定ステップと、前記伸長ステップから得られた出力と前記差分値を算出する際の前記1つ前のサンプルの値とを加え、次の差分算出ステップにおいて差分値を算出する際の1つ前のサンプルの値を算出する累積ステップとをコンピュータに実行させるための高能率符号化プログラムであって、前記入力オーディオ信号を所定のサンプル数ごとに分けて処理フレームを生成するフレーム化ステップと、生成された前記処理フレームに対するスペクトル包絡線の逆特性のスペクトル包絡線を求め、求められた前記逆特性のスペクトル包絡線の特性を打ち消すスペクトル包絡線の特性を示す係数を算出し、算出された前記係数をフィルタ係数とするフィルタ特性決定ステップと、前記圧縮ステップへの入力の値と前記伸長ステップから得られた出力の値とに基づいて量子化雑音を算出し、算出された前記量子化雑音に対して、前記処理フレームごとに算出された前記フィルタ係数から構成されるフィルタの対応する前記フィルタ係数をかけて量子化雑音スペクトルを整形するノイズシェイピングステップとを更にコンピュータに実行させる高能率符号化プログラムであり、前記フィルタ特性決定ステップは、前記処理フレームの前記逆特性のスペクトル包絡線の最大レベルと最小レベルとの差により定まる振幅変動幅を所定の制限幅内に収めるよう処理を行うスペクトル包絡制限ステップを有する高能率符号化プログラムが提供される。この構成により、低サンプリング周波数を用いる符号化において、既存のフォーマットに何ら変更を加えることなく、周波数的に一様に拡がった量子化雑音のスペクトル包絡線をオーディオ信号のスペクトル包絡線に近づけることができ、オーディオ信号の高品質化を図ることができる。また、特定の周波数帯域だけ信号対量子化雑音比(SNR)が高いといった偏りを改善することができる。なお、量子化雑音は、量子化ひずみ又は量子化誤差とも言う。以下においても同様である。また、低サンプリング周波数とは、上述したように、量子化雑音を等ラウドネス特性やマスキング特性に基づいて聴覚的に聞こえない領域(例えば、16kHz以上)の量子化雑音を増加させるようにスペクトル形状を変化させることができないようなサンプリング周波数であって、例えば32kHz以下の周波数を言い、後述する8kHzに限られるものではない。
また、本発明によれば、等ラウドネス特性及び/又はマスキング特性に基づいて、聴覚的に聞こえない領域の量子化雑音を増加させるようにスペクトル形状を変化させることが可能なサンプリング周波数に比べて低い低サンプリング周波数によりサンプリングされた入力オーディオ信号における現サンプルと1つ前のサンプルとの差分値を算出する差分算出ステップと、前記差分値に対して量子化及び符号化を行う圧縮ステップと、前記圧縮ステップから得られた出力に対して復号化及び逆量子化を行う伸長ステップと、前記圧縮ステップの符号化結果に基づいて、次に算出される差分値の量子化の際の量子化幅を決定する量子化幅決定ステップと、前記伸長ステップから得られた出力と前記差分値を算出する際の前記1つ前のサンプルの値とを加え、次の差分算出ステップにおいて差分値を算出する際の1つ前のサンプルの値を算出する累積ステップとをコンピュータに実行させるための高能率符号化プログラムであって、前記入力オーディオ信号を所定のサンプル数ごとに分けて処理フレームを生成するフレーム化ステップと、生成された前記処理フレームに対するスペクトル包絡線の逆特性のスペクトル包絡線を求め、求められた前記逆特性のスペクトル包絡線の特性を打ち消すスペクトル包絡線の特性を示す係数を算出し、算出された前記係数をフィルタ係数とするフィルタ特性決定ステップと、前記圧縮ステップへの入力の値と前記伸長ステップから得られた出力の値とに基づいて量子化雑音を算出し、算出された前記量子化雑音に対して、前記処理フレームごとに算出された前記フィルタ係数から構成されるフィルタの対応する前記フィルタ係数をかけて量子化雑音スペクトルを整形するノイズシェイピングステップとを更にコンピュータに実行させる高能率符号化プログラムであり、前記フィルタ特性決定ステップは、前記処理フレームにおいてサンプルの値に変化がなくその値が続く場合、前記値が続くサンプルの数をカウントするDC値探索ステップと、カウントされた前記サンプルの数に基づいて、前記量子化雑音にかけるフィルタ係数を算出された前記フィルタ係数にするか、あらかじめ所定の記憶領域に格納された保存フィルタ係数にするかを選択する最終フィルタ選択ステップとを有する高能率符号化プログラムが提供される。この構成により、低サンプリング周波数を用いる符号化において、既存のフォーマットに何ら変更を加えることなく、周波数的に一様に拡がった量子化雑音のスペクトル包絡線をオーディオ信号のスペクトル包絡線に近づけることができ、オーディオ信号の高品質化を図ることができる。また、処理フレーム境界で発生する品質ギャップを防ぐことができる。
また、本発明によれば、等ラウドネス特性及び/又はマスキング特性に基づいて、聴覚的に聞こえない領域の量子化雑音を増加させるようにスペクトル形状を変化させることが可能なサンプリング周波数に比べて低い低サンプリング周波数によりサンプリングされた入力オーディオ信号における現サンプルと1つ前のサンプルとの差分値を算出する差分算出ステップと、前記差分値に対して量子化及び符号化を行う圧縮ステップと、前記圧縮ステップから得られた出力に対して復号化及び逆量子化を行う伸長ステップと、前記圧縮ステップの符号化結果に基づいて、次に算出される差分値の量子化の際の量子化幅を決定する量子化幅決定ステップと、前記伸長ステップから得られた出力と前記差分値を算出する際の前記1つ前のサンプルの値とを加え、次の差分算出ステップにおいて差分値を算出する際の1つ前のサンプルの値を算出する累積ステップとをコンピュータに実行させるための高能率符号化プログラムであって、前記入力オーディオ信号を所定のサンプル数ごとに分けて処理フレームを生成するフレーム化ステップと、生成された前記処理フレームに対するスペクトル包絡線の逆特性のスペクトル包絡線を求め、求められた前記逆特性のスペクトル包絡線の特性を打ち消すスペクトル包絡線の特性を示す係数を算出し、算出された前記係数をフィルタ係数とするフィルタ特性決定ステップと、前記圧縮ステップへの入力の値と前記伸長ステップから得られた出力の値とに基づいて量子化雑音を算出し、算出された前記量子化雑音に対して、前記処理フレームごとに算出された前記フィルタ係数から構成されるフィルタの対応する前記フィルタ係数をかけて量子化雑音スペクトルを整形するノイズシェイピングステップとを更にコンピュータに実行させる高能率符号化プログラムであり、前記フィルタ特性決定ステップは、前記処理フレームの前記逆特性のスペクトル包絡線の最大レベルと最小レベルとの差により定まる振幅変動幅を所定の制限幅内に収めるよう処理を行うスペクトル包絡制限ステップと、前記処理フレームにおいてサンプルの値に変化がなくその値が続く場合、前記値が続くサンプルの数をカウントするDC値探索ステップと、カウントされた前記サンプルの数に基づいて、前記量子化雑音にかけるフィルタ係数を算出された前記フィルタ係数にするか、あらかじめ所定の記憶領域に格納された保存フィルタ係数にするかを選択する最終フィルタ選択ステップとを有する高能率符号化プログラムが提供される。この構成により、低サンプリング周波数を用いる符号化において、既存のフォーマットに何ら変更を加えることなく、周波数的に一様に拡がった量子化雑音のスペクトル包絡線をオーディオ信号のスペクトル包絡線に近づけることができ、オーディオ信号の高品質化を図ることができる。また、特定の周波数帯域だけ信号対量子化雑音比(SNR)が高いといった偏りを改善することができる。また、処理フレーム境界で発生する品質ギャップを防ぐことができる。
また、本発明の高能率符号化プログラムにおいて、前記フィルタ特性決定ステップにおける生成された前記処理フレームに対するスペクトル包絡線の逆特性のスペクトル包絡線の算出ステップが、線形予測分析により線形予測係数を求める第1の線形予測分析ステップと、前記線形予測係数に対してフーリエ変換によりスペクトル包絡線を求めるスペクトル包絡算出ステップとからなり、求められた前記逆特性のスペクトル包絡線の特性を打ち消すスペクトル包絡線の特性を示す係数の算出ステップが、前記フーリエ変換により求められたスペクトル包絡線に対して、逆フーリエ変換をして得られた係数を用いて線形予測分析を行い線形予測係数を求める第2の線形予測分析ステップからなることは、本発明の好ましい態様である。この構成により、周波数的に一様に拡がった量子化雑音のスペクトル包絡線をオーディオ信号のスペクトル包絡線に近づけることができる。
また、本発明の高能率符号化プログラムにおいて、前記フレーム化ステップにおいて構成される前記処理フレームが直前の処理フレームを結合させた処理フレームであることは、本発明の好ましい態様である。この構成により、処理フレーム境界で発生する品質ギャップを防ぐことができる。
また、本発明によれば、等ラウドネス特性及び/又はマスキング特性に基づいて、聴覚的に聞こえない領域の量子化雑音を増加させるようにスペクトル形状を変化させることが可能なサンプリング周波数に比べて低い低サンプリング周波数によりサンプリングされた入力オーディオ信号における現サンプルと1つ前のサンプルとの差分値を算出する差分算出手段と、前記差分値に対して量子化及び符号化を行う圧縮手段と、前記圧縮手段からの出力に対して復号化及び逆量子化を行う伸長手段と、前記圧縮手段の符号化結果に基づいて、次に算出される差分値の量子化の際の量子化幅を決定する量子化幅決定手段と、前記伸長手段からの出力と前記差分値を算出する際の前記1つ前のサンプルの値とを加え、次に差分算出手段において差分値を算出する際の1つ前のサンプルの値を算出する累積手段とから構成される高能率符号化装置であって、前記入力オーディオ信号を所定のサンプル数ごとに分けて処理フレームを生成するフレーム化手段と、生成された前記処理フレームに対するスペクトル包絡線の逆特性のスペクトル包絡線を求め、求められた前記逆特性のスペクトル包絡線の特性を打ち消すスペクトル包絡線の特性を示す係数を算出し、算出された前記係数をフィルタ係数とするフィルタ特性決定手段と、前記圧縮手段への入力の値と前記伸長手段からの出力の値とに基づいて量子化雑音を算出し、算出された前記量子化雑音に対して、前記処理フレームごとに算出された前記フィルタ係数から構成されるフィルタの対応する前記フィルタ係数をかけて量子化雑音スペクトルを整形するノイズシェイピング手段とを更に有し、前記フィルタ特性決定手段は、前記処理フレームの前記逆特性のスペクトル包絡線の最大レベルと最小レベルとの差により定まる振幅変動幅を所定の制限幅内に収めるよう処理を行うスペクトル包絡制限手段を有する高能率符号化装置が提供される。この構成により、低サンプリング周波数を用いる符号化において、既存のフォーマットに何ら変更を加えることなく、周波数的に一様に拡がった量子化雑音のスペクトル包絡線をオーディオ信号のスペクトル包絡線に近づけることができ、オーディオ信号の高品質化を図ることができる。また、特定の周波数帯域だけ信号対量子化雑音比(SNR)が高いといった偏りを改善することができる。
また、本発明によれば、等ラウドネス特性及び/又はマスキング特性に基づいて、聴覚的に聞こえない領域の量子化雑音を増加させるようにスペクトル形状を変化させることが可能なサンプリング周波数に比べて低い低サンプリング周波数によりサンプリングされた入力オーディオ信号における現サンプルと1つ前のサンプルとの差分値を算出する差分算出手段と、前記差分値に対して量子化及び符号化を行う圧縮手段と、前記圧縮手段からの出力に対して復号化及び逆量子化を行う伸長手段と、前記圧縮手段の符号化結果に基づいて、次に算出される差分値の量子化の際の量子化幅を決定する量子化幅決定手段と、前記伸長手段からの出力と前記差分値を算出する際の前記1つ前のサンプルの値とを加え、次に差分算出手段において差分値を算出する際の1つ前のサンプルの値を算出する累積手段とから構成される高能率符号化装置であって、前記入力オーディオ信号を所定のサンプル数ごとに分けて処理フレームを生成するフレーム化手段と、生成された前記処理フレームに対するスペクトル包絡線の逆特性のスペクトル包絡線を求め、求められた前記逆特性のスペクトル包絡線の特性を打ち消すスペクトル包絡線の特性を示す係数を算出し、算出された前記係数をフィルタ係数とするフィルタ特性決定手段と、前記圧縮手段への入力の値と前記伸長手段からの出力の値とに基づいて量子化雑音を算出し、算出された前記量子化雑音に対して、前記処理フレームごとに算出された前記フィルタ係数から構成されるフィルタの対応する前記フィルタ係数をかけて量子化雑音スペクトルを整形するノイズシェイピング手段とを更に有し、前記フィルタ特性決定手段は、前記処理フレームにおいてサンプルの値に変化がなくその値が続く場合、前記値が続くサンプルの数をカウントするDC値探索手段と、カウントされた前記サンプルの数に基づいて、前記量子化雑音にかけるフィルタ係数を算出された前記フィルタ係数にするか、あらかじめ所定の記憶領域に格納された保存フィルタ係数にするかを選択する最終フィルタ選択手段とを有する高能率符号化装置が提供される。この構成により、低サンプリング周波数を用いる符号化において、既存のフォーマットに何ら変更を加えることなく、周波数的に一様に拡がった量子化雑音のスペクトル包絡線をオーディオ信号のスペクトル包絡線に近づけることができ、オーディオ信号の高品質化を図ることができる。また、処理フレーム境界で発生する品質ギャップを防ぐことができる。
また、本発明によれば、等ラウドネス特性及び/又はマスキング特性に基づいて、聴覚的に聞こえない領域の量子化雑音を増加させるようにスペクトル形状を変化させることが可能なサンプリング周波数に比べて低い低サンプリング周波数によりサンプリングされた入力オーディオ信号における現サンプルと1つ前のサンプルとの差分値を算出する差分算出手段と、前記差分値に対して量子化及び符号化を行う圧縮手段と、前記圧縮手段からの出力に対して復号化及び逆量子化を行う伸長手段と、前記圧縮手段の符号化結果に基づいて、次に算出される差分値の量子化の際の量子化幅を決定する量子化幅決定手段と、前記伸長手段からの出力と前記差分値を算出する際の前記1つ前のサンプルの値とを加え、次に差分算出手段において差分値を算出する際の1つ前のサンプルの値を算出する累積手段とから構成される高能率符号化装置であって、前記入力オーディオ信号を所定のサンプル数ごとに分けて処理フレームを生成するフレーム化手段と、生成された前記処理フレームに対するスペクトル包絡線の逆特性のスペクトル包絡線を求め、求められた前記逆特性のスペクトル包絡線の特性を打ち消すスペクトル包絡線の特性を示す係数を算出し、算出された前記係数をフィルタ係数とするフィルタ特性決定手段と、前記圧縮手段への入力の値と前記伸長手段からの出力の値とに基づいて量子化雑音を算出し、算出された前記量子化雑音に対して、前記処理フレームごとに算出された前記フィルタ係数から構成されるフィルタの対応する前記フィルタ係数をかけて量子化雑音スペクトルを整形するノイズシェイピング手段とを更に有し、前記フィルタ特性決定手段は、前記処理フレームの前記逆特性のスペクトル包絡線の最大レベルと最小レベルとの差により定まる振幅変動幅を所定の制限幅内に収めるよう処理を行うスペクトル包絡制限手段と、前記処理フレームにおいてサンプルの値に変化がなくその値が続く場合、前記値が続くサンプルの数をカウントするDC値探索手段と、カウントされた前記サンプルの数に基づいて、前記量子化雑音にかけるフィルタ係数を算出された前記フィルタ係数にするか、あらかじめ所定の記憶領域に格納された保存フィルタ係数にするかを選択する最終フィルタ選択手段とを有する高能率符号化装置が提供される。この構成により、低サンプリング周波数を用いる符号化において、既存のフォーマットに何ら変更を加えることなく、周波数的に一様に拡がった量子化雑音のスペクトル包絡線をオーディオ信号のスペクトル包絡線に近づけることができ、オーディオ信号の高品質化を図ることができる。また、特定の周波数帯域だけ信号対量子化雑音比(SNR)が高いといった偏りを改善することができる。また、処理フレーム境界で発生する品質ギャップを防ぐことができる。
本発明の高能率符号化プログラム及び高能率符号化装置は、上記構成を有し、低サンプリング周波数を用いる符号化において、既存のフォーマットに何ら変更を加えることなく、周波数的に一様に拡がった量子化雑音のスペクトル包絡線をオーディオ信号のスペクトル包絡線に近づけることができ、オーディオ信号の高品質化を図ることができる。また、特定の周波数帯域だけ信号対量子化雑音比(SNR)が高いといった偏りを改善することができる。また、処理フレーム境界で発生する品質ギャップを防ぐことができる。
以下、本発明の実施の形態に係る高能率符号化装置及び高能率符号化プログラムについて図1から図11を用いて説明する。図1は本発明の実施の形態に係る高能率符号化装置の構成を示す構成図である。図2は本発明の実施の形態に係る高能率符号化装置におけるフレーム化ステップ部の処理の一例を説明するための図である。図3は本発明の実施の形態に係る高能率符号化装置におけるフィルタ特性決定ステップ部の処理の一例を説明するためのフローチャートである。図4は本発明の実施の形態に係る高能率符号化装置における処理フレームのデータの逆特性を持つスペクトル包絡線(以下、単にスペクトル包絡とも言う)を示す図である。図5は本発明の実施の形態に係る高能率符号化装置におけるスペクトル包絡制限ステップ部の処理の一例について説明するための図である。
図6は本発明の実施の形態に係る高能率符号化装置における開始フレームにおいてDCデータが存在することによる問題点を説明するための図である。図7は本発明の実施の形態に係る高能率符号化装置における終了フレームにおいてDCデータが存在することによる問題点を説明するための図である。図8は本発明の実施の形態に係る高能率符号化装置におけるDC値探索ステップ部の処理の一例を示すフローチャートである。図9は本発明の実施の形態に係る高能率符号化装置におけるDC値探索ステップ部の処理の一例の一部(開始フレーム探索ステップ)の処理を示すフローチャートである。図10は本発明の実施の形態に係る高能率符号化装置におけるDC値探索ステップ部の処理の一例の一部(終了フレーム探索ステップ)の処理を示すフローチャートである。図11は本発明の実施の形態に係る高能率符号化装置におけるノイズシェイピングステップ部による作用を示した概念図である。
まず、本発明の実施の形態に係る高能率符号化装置について説明する。図1に示すように、本発明の実施の形態に係る高能率符号化装置は、従来の高能率符号化装置に対して、フレーム化ステップ部16、フィルタ特性決定ステップ部17、ノイズシェイピングステップ部18が追加された形になっている。入力されるオーディオ信号X(n)はサンプリング周波数8kHz、12bit精度のリニアPCMである。差分算出ステップ部11では、現サンプルであるX(n)と圧縮伸長された1つ前のサンプルX´(n−1)との差分が取られて差分値d(n)が生成される。そして、ステップサイズ(量子化幅)決定ステップ部13では、1つ前の差分値の符号化結果に基づきステップサイズss(n)が決定され、決定されたステップサイズss(n)が圧縮ステップ部12に供給され、圧縮ステップ部12では差分値d(n)が4ビットのADPCMコードL(n)に変換される。伸長ステップ部14では、圧縮ステップ部12で変換されたADPCMコードL(n)が逆変換されて量子化雑音を含んだ差分値d´(n)が得られる。そして、累積ステップ部15において差分算出ステップ部11の逆処理が行われて1つ前のサンプルX´(n−1)が再構築される。
入力されるオーディオ信号X(n)は、フレーム化ステップ部16において1024のサンプル単位でフレーム化が行われる。そして、蓄積されている前フレームの1024サンプルと現フレームの1024サンプルを時系列的に結合して2048サンプルの処理フレームを構成する(オーバーラッピング処理とも言う)。
フィルタ特性決定ステップ部17では、上述したようにオーバーラッピング処理された処理フレームに対して線形予測(LPC(Linear Predictive Coding))分析を用いてスペクトル包絡の特性を持った線形予測係数と次数の算出を行う。ノイズシェイピングステップ部18では、圧縮ステップ部12に入力される直前の差分値d(n)と伸長ステップ部14の後の差分値d´(n)から得られた量子化誤差e(n)(e(n)=d(n)−d´(n))に対して、線形予測係数を用いて構成したFIR(Finite Impulse Response)フィルタを適用する。フィルタ処理を受けた量子化誤差ns(n−1)は、差分算出ステップ部11にフィードバックされることにより量子化誤差スペクトルの概形がフィルタ特性に合わせて整形される。
次に、上述したフレーム化ステップ部16の処理の一例を図2を用いて説明する。入力されるオーディオ信号X(n)は、1024サンプル単位(フレームとも言う)で切り分けられる。処理フレームは不図示の記憶領域に保存してある過去のフレームデータと時系列的に結合され構成される。先頭の処理フレーム0は、通常ゼロデータの1024サンプルを過去のフレームデータとして用いて構成されるが、オーディオ信号X(n)の先頭サンプルがゼロデータでない場合には先頭サンプルと同じ値で過去のフレームデータを埋めてもよい。
そして、フィルタ特性決定ステップ部17はこの処理フレームを用いて線形予測係数を算出する。このようにオーバーラップさせたデータを用いる理由は、線形予測係数を滑らかに変化させてフレームのつなぎ目においてフィルタ処理によるデータギャップが起こらないようにするためである。処理フレーム0で求めたフィルタ係数はフレーム0の量子化誤差データの1024サンプルに対して適用される。同様に、処理フレーム1で求めたフィルタ係数はフレーム1の量子化誤差データの1024サンプルに対して適用される。そのため、フレーム0とフレーム1のつなぎ目が滑らかにつながる必要がある。また、ここではフレーム構造を採っているが、差分算出ステップ部11への入力は1サンプルごとであるため、フレームの先頭から1サンプル単位で差分算出ステップ部11に入力される。
次に、上述したフィルタ特性決定ステップ部17の処理の一例について図3を用いて説明する。図3に示すように、第1の線形予測分析ステップ部における処理ステップS31では、入力された処理フレームのデータに対して線形予測を行い線形予測係数を得る。スペクトル包絡算出ステップ部における処理ステップS32では、得られた線形予測係数に対して順方向のFFT(Fast Fourier Transform)を掛けてパワースペクトルを計算し、デシベル表示することにより図4に示すような処理フレームのデータの逆特性を持つスペクトル包絡が得られる。スペクトル包絡制限ステップ部における処理ステップS33では、スペクトル包絡特性の振幅変動幅を所定の制限幅内に収めるために振幅変動幅に対する制限幅の比率を算出し、パワースペクトルに乗ずる処理を行う。
ノイズシェイピングという手法は、量子化誤差量を減らすことではなく、量子化誤差スペクトルの形状を変形させるための作用であるから、極端に偏ったスペクトル包絡では一部が良くなっても他の部分がかなり悪くなることになる。しかし、スペクトル包絡制限ステップS33でスペクトル包絡を修正することで一様の品質に収めることができる。このようにして得られた修正パワースペクトルに対して、第2の線形予測分析ステップ部における処理ステップS34では、逆方向のFFTにより算出した自己相関関数を用いて線形予測を行うことにより順特性のスペクトル包絡を持つ線形予測係数が算出される。
DC(Direct Current)探索ステップ部における処理ステップS35では、入力された処理フレームのデータと第2の線形予測分析ステップ部における処理ステップS34で算出された線形予測係数(現フィルタ係数)を用いて、処理フレームのデータ中に、ある変化が無く一定値(ゼロ又はノンゼロ値)が続くサンプルの数をカウントする。そして、現フィルタ係数を用いるか、不図示の記憶領域に保存してあるフィルタ係数を用いるかを判断し、その結果を現フィルタ使用フラグとして出力する。最終フィルタ選択ステップ部における処理ステップS36では、現フィルタ使用フラグに応じて現フィルタ係数と保存してあるフィルタ係数との切り替えを行い、最終フィルタ係数が決定される。保存してあるフィルタ係数としては、あらかじめ用意した固定フィルタ係数や、過去のフレームで算出された現フィルタ係数などである。
ここで、上述したスペクトル包絡制限ステップ部における処理ステップS33の詳細について図4及び図5を用いて説明する。第1の線形予測分析ステップ部における処理ステップS31により、原音のスペクトル包絡の概形を平均レベルを中心として打ち消すような線形予測係数が算出される。その概形が図4中に示した点線のスペクトル包絡である。そして、第2の線形予測分析ステップ部における処理ステップS34において、得られたスペクトル包絡の特性を再度打ち消すような線形予測係数を求めるため、最終的に得られるスペクトル包絡の特性は図4中に実線で示す原音のスペクトル包絡に一致する。例えば、第1の線形予測分析ステップ部における処理ステップS31の結果として得られたスペクトル包絡が図5中に示す制限前のスペクトル包絡である場合、低域における特性がかなり極端に落ち込んでいることから、このまま第2の線形予測分析ステップ部における処理ステップS34を適用してしまうと、低域の量子化誤差をかなり増加させる線形予測係数が算出されてしまう。
それを防ぐために、スペクトル包絡制限ステップ部における処理ステップS33において、スペクトル包絡の振幅変動幅を所定の制限幅に収める処理を行う。例えば、平均レベルが0dBである場合には、振幅変動幅(diff_max)は下記の式(1)のように、スペクトル包絡の最小レベル(min_val)と最大レベル(max_val)の絶対距離で求められる。そして、所定の制限幅(diff)と比較して下記の式(2)及び(3)から比率(ratio)を算出する。さらに、パワースペクトルに適用させるために下記の式(4)のようにデシベルからパワーに変換する。
Figure 0004556866
Figure 0004556866
Figure 0004556866
Figure 0004556866
次に、処理フレームを処理する際に生じる問題点について図6及び図7を用いて説明する。図6は開始フレームにおいてDCデータが存在することによる問題点を表した例であり、DCデータはゼロデータとしている。従来例では、ゼロデータを入力した場合でも一定の量子化誤差が発生することから圧縮伸長された1つ前のサンプルX´(n−1)との差分値も一定の増減を繰り返すことになり、図6に示すような一定波形の繰り返しが起こる(規格上発生する量子化誤差レベル)。処理フレーム0はすべてゼロであるデータに対するフィルタ係数の値(フィルタ係数0)であるが、処理フレーム1ではゼロ以外のデータを含んだフィルタに対するフィルタ係数の値(フィルタ係数1)が計算される。その結果、一定の量子化誤差に対して異なったフィルタ係数が適用されることになるため、クリック音が発生する原因となる。図7は終了フレームにおいても同様のクリック音が発生することを示した図である。この図7では、ゼロデータ部分に対応する一定の量子化誤差にかかるフィルタ係数(フィルタ係数0、1、2)が3種類とも異なることから2箇所のクリック音が発生することを示している。
このような問題を解消するために以下の図8から図10に示す処理が行われる。図8はDC値探索ステップ部における図3中の処理ステップS35のフローチャートを詳しく示す図である。まず、オーディオ信号の最初のフレームであるかを判断し(ステップS81)、最初のフレームであれば最初のサンプル値をDC値として不図示の記憶領域に保存する(ステップS82)。そして、開始フレーム探索が完了したか(開始フレーム探索完了フラグ)をチェックし(ステップS83)、開始フレーム探索が完了しているならば図10で後述する終了フレーム探索ステップを行う(ステップS85)。開始フレーム探索が完了していない場合には図9で後述する開始フレーム探索ステップを行う(ステップS84)。また、ステップS81において、最初のフレームでない場合はステップS83に進む。
以下では開始フレーム探索ステップ(ステップS84)の詳細について図9を用いて説明する。まず、不図示の記憶領域に保存したDC値がゼロデータであるか否かを判断し(ステップS91)、ゼロデータである場合、線形予測係数(現フィルタ係数)の値がすべてゼロであるか否かをチェックする(ステップS92)。すべてがゼロである場合、不図示の記憶領域に保存してあるフィルタ係数を選択するように現フィルタ使用フラグをオフ(OFF)にする(ステップS94)。この場合、まだゼロデータが続いている可能性があるので開始フレーム探索完了フラグはセットしない。一方、ステップS92において現フィルタ係数がすべてゼロでない場合、ゼロデータの継続が途切れたと判断し、開始フレーム探索完了フラグをセットする(ステップS93)。そして、現フィルタ使用フラグをオフ(OFF)にする(ステップS94)。
そして、ステップS91において、保存したDC値がゼロでない(ノンゼロ値である)場合には、処理フレームの先頭サンプル(時間的に一番早いサンプル)からノンゼロ値が継続するサンプルの数をカウントする(ステップS95)。次に、カウント値がフレーム長(処理フレームの半分)より少ないか否かを判断し(ステップS96)、少ないならば開始フレーム探索完了フラグをセットする(ステップS97)。一方、カウント値がフレーム長以上である場合には、ゼロデータのときと同様に次のフレームまで継続している可能性があるので開始フレーム探索完了フラグはセットしない。そして、DC値信頼性判定(ステップS98)では、不図示の記憶領域に保存してあるDC値が本当に正しいかを判定し、例えば継続するカウント数やサンプルの平均値などによりDC値の更正を行う。そして、現フィルタ使用フラグをオフ(OFF)にする(ステップS99)。
以下では図8で上述した終了フレーム探索ステップ(ステップS85)の詳細について図10を用いて説明する。まず、線形予測係数(現フィルタ係数)の係数がすべてゼロであるか否かをチェックし(ステップS101)、ゼロであるならばDC値のカウント数をフレーム長にセットする(ステップS103)。一方、線形予測係数(現フィルタ係数)の係数がゼロでなければ処理フレームの終わりのサンプル(時間的に一番遅いサンプル)から不図示の記憶領域に保存してあるDC値が継続するサンプルの数をカウントする(ステップS102)。そして、カウント数が所定値以上か否かを判断し(ステップS104)、所定値以上であるならば現フィルタ使用フラグをオフ(OFF)にする(ステップS106)。所定値より少ない場合には現フィルタ使用フラグをオン(ON)にする(ステップS105)。
以上のように、図1に示すフレーム化ステップ部16及びフィルタ特性決定ステップ部17で処理された結果に対してノイズシェイピングステップ部18では、圧縮ステップ部12に入力される直前の差分値d(n)と伸長ステップ部14の後の差分値d´(n)から得られた量子化誤差e(n)(e(n)=d(n)−d´(n))に対して、上述した線形予測係数を用いて構成したFIRフィルタを適用する。フィルタ処理を受けた量子化誤差ns(n−1)は、差分算出ステップ部11にフィードバックされることにより量子化誤差スペクトルの概形がフィルタ特性に合わせて整形される。
図11はノイズシェイピングステップ部18による作用を示した概念図である。図11に示すように、従来技術により圧縮伸長を行った際の量子化誤差(従来の量子化誤差)は、周波数的に一様に拡がった平坦なスペクトルを有する。通常のオーディオ信号は、図11に示すようになだらかなスロープを描いているため、オーディオ信号対量子化誤差比(SNR)は低中域が高く、高域に向かうにつれて悪くなる。しかし、本発明のノイズシェイピングステップ部18を適用することにより、量子化誤差の平坦なスペクトルはオーディオ信号のスペクトル包絡に似た形に整形される。この結果、SNRが全帯域で一様となる方向に向かうため量子化誤差を聴覚的に減少させることができる。
以上説明したように本発明によれば、周波数的に一様に拡がった量子化誤差のスペクトル包絡線をオーディオ信号のスペクトル包絡線に近づけることができ、量子化誤差を聴覚的に減少させることができる。また、本発明において、スペクトル包絡特性の変動幅を所定の範囲内に収めるようにスペクトル包絡線を制限するようにした処理では、量子化誤差のスペクトル包絡線の変動幅を制限し、特定の周波数帯域だけ信号対量子化誤差比(SNR)が高いといった偏りを改善することができる。さらに、入力されたオーディオ信号に変化がなく一定値が続く場合に、そのサンプル数をカウントし、所定値以上であればスペクトル包絡特性から算出したフィルタ係数ではなく、保存してあるフィルタ係数を用いるようにした場合では、フレーム境界で発生する品質ギャップを防ぐことができる。また、本発明は既存のフォーマットに何ら変更を加えることがないため、従来からの再生プレーヤ、再生装置を使用することができる。
なお、本発明は上述した高能率符号化装置の機能をコンピュータに実現させるためのプログラムを含むものである。このプログラムは記録媒体から読み取られてコンピュータに取り込まれてもよいし、通信ネットワークを介して伝送されてコンピュータに取り込まれてもよい。
本発明に係る高能率符号化プログラム及び高能率符号化装置は、低サンプリング周波数を用いる符号化において、既存のフォーマットに何ら変更を加えることなく、周波数的に一様に拡がった量子化雑音のスペクトル包絡線をオーディオ信号のスペクトル包絡線に近づけることができ、オーディオ信号の高品質化を図ることができる。また、特定の周波数帯域だけ信号対量子化雑音比(SNR)が高いといった偏りを改善することができる。また、処理フレーム境界で発生する品質ギャップを防ぐことができる。そのため、音声又はオーディオ信号の符号化のための高能率符号化プログラム及び高能率符号化装置に関し、特に量子化雑音スペクトルを聴感的に望ましいものとすることによって聴くに耐え得る品質を提供する高能率符号化プログラム及び高能率符号化装置などに有用である。
本発明の実施の形態に係る高能率符号化装置の構成を示す構成図である。 本発明の実施の形態に係る高能率符号化装置におけるフレーム化ステップ部の処理の一例を説明するための図である。 本発明の実施の形態に係る高能率符号化装置におけるフィルタ特性決定ステップ部の処理の一例を説明するためのフローチャートである。 本発明の実施の形態に係る高能率符号化装置における処理フレームのデータの逆特性を持つスペクトル包絡を示す図である。 本発明の実施の形態に係る高能率符号化装置におけるスペクトル包絡制限ステップ部の処理の一例について説明するための図である。 本発明の実施の形態に係る高能率符号化装置における開始フレームにおいてDCデータが存在することによる問題点を説明するための図である。 本発明の実施の形態に係る高能率符号化装置における終了フレームにおいてDCデータが存在することによる問題点を説明するための図である。 本発明の実施の形態に係る高能率符号化装置におけるDC値探索ステップ部の処理の一例を示すフローチャートである。 本発明の実施の形態に係る高能率符号化装置におけるDC値探索ステップ部の処理の一例の一部(開始フレーム探索ステップ)の処理を示すフローチャートである。 本発明の実施の形態に係る高能率符号化装置におけるDC値探索ステップ部の処理の一例の一部(終了フレーム探索ステップ)の処理を示すフローチャートである。 本発明の実施の形態に係る高能率符号化装置におけるノイズシェイピングステップ部による作用を示した概念図である。 従来の高能率符号化装置の構成を示す構成図である。
符号の説明
0、1、2 処理フレーム
11、121 差分算出ステップ部(差分算出手段)
12、122 圧縮ステップ部(圧縮手段)
13、123 ステップサイズ(量子化幅)決定ステップ部(量子化幅決定手段)
14、124 伸長ステップ部(伸長手段)
15、125 累積ステップ部(累積手段)
16 フレーム化ステップ部(フレーム化手段)
17 フィルタ特性決定ステップ部(フィルタ特性決定手段)
18 ノイズシェイピングステップ部(ノイズシェイピング手段)

Claims (8)

  1. 等ラウドネス特性及び/又はマスキング特性に基づいて、聴覚的に聞こえない領域の量子化雑音を増加させるようにスペクトル形状を変化させることが可能なサンプリング周波数に比べて低い低サンプリング周波数によりサンプリングされた入力オーディオ信号における現サンプルと1つ前のサンプルとの差分値を算出する差分算出ステップと、
    前記差分値に対して量子化及び符号化を行う圧縮ステップと、
    前記圧縮ステップから得られた出力に対して復号化及び逆量子化を行う伸長ステップと、
    前記圧縮ステップの符号化結果に基づいて、次に算出される差分値の量子化の際の量子化幅を決定する量子化幅決定ステップと、
    前記伸長ステップから得られた出力と前記差分値を算出する際の前記1つ前のサンプルの値とを加え、次の差分算出ステップにおいて差分値を算出する際の1つ前のサンプルの値を算出する累積ステップとをコンピュータに実行させるための高能率符号化プログラムであって、
    前記入力オーディオ信号を所定のサンプル数ごとに分けて処理フレームを生成するフレーム化ステップと、
    生成された前記処理フレームに対するスペクトル包絡線の逆特性のスペクトル包絡線を求め、求められた前記逆特性のスペクトル包絡線の特性を打ち消すスペクトル包絡線の特性を示す係数を算出し、算出された前記係数をフィルタ係数とするフィルタ特性決定ステップと、
    前記圧縮ステップへの入力の値と前記伸長ステップから得られた出力の値とに基づいて量子化雑音を算出し、算出された前記量子化雑音に対して、前記処理フレームごとに算出された前記フィルタ係数から構成されるフィルタの対応する前記フィルタ係数をかけて量子化雑音スペクトルを整形するノイズシェイピングステップとを更にコンピュータに実行させる高能率符号化プログラムであり、
    前記フィルタ特性決定ステップは、前記処理フレームの前記逆特性のスペクトル包絡線の最大レベルと最小レベルとの差により定まる振幅変動幅を所定の制限幅内に収めるよう処理を行うスペクトル包絡制限ステップを有する高能率符号化プログラム。
  2. 等ラウドネス特性及び/又はマスキング特性に基づいて、聴覚的に聞こえない領域の量子化雑音を増加させるようにスペクトル形状を変化させることが可能なサンプリング周波数に比べて低い低サンプリング周波数によりサンプリングされた入力オーディオ信号における現サンプルと1つ前のサンプルとの差分値を算出する差分算出ステップと、
    前記差分値に対して量子化及び符号化を行う圧縮ステップと、
    前記圧縮ステップから得られた出力に対して復号化及び逆量子化を行う伸長ステップと、
    前記圧縮ステップの符号化結果に基づいて、次に算出される差分値の量子化の際の量子化幅を決定する量子化幅決定ステップと、
    前記伸長ステップから得られた出力と前記差分値を算出する際の前記1つ前のサンプルの値とを加え、次の差分算出ステップにおいて差分値を算出する際の1つ前のサンプルの値を算出する累積ステップとをコンピュータに実行させるための高能率符号化プログラムであって、
    前記入力オーディオ信号を所定のサンプル数ごとに分けて処理フレームを生成するフレーム化ステップと、
    生成された前記処理フレームに対するスペクトル包絡線の逆特性のスペクトル包絡線を求め、求められた前記逆特性のスペクトル包絡線の特性を打ち消すスペクトル包絡線の特性を示す係数を算出し、算出された前記係数をフィルタ係数とするフィルタ特性決定ステップと、
    前記圧縮ステップへの入力の値と前記伸長ステップから得られた出力の値とに基づいて量子化雑音を算出し、算出された前記量子化雑音に対して、前記処理フレームごとに算出された前記フィルタ係数から構成されるフィルタの対応する前記フィルタ係数をかけて量子化雑音スペクトルを整形するノイズシェイピングステップとを更にコンピュータに実行させる高能率符号化プログラムであり、
    前記フィルタ特性決定ステップは、前記処理フレームにおいてサンプルの値に変化がなくその値が続く場合、前記値が続くサンプルの数をカウントするDC値探索ステップと、
    カウントされた前記サンプルの数に基づいて、前記量子化雑音にかけるフィルタ係数を算出された前記フィルタ係数にするか、あらかじめ所定の記憶領域に格納された保存フィルタ係数にするかを選択する最終フィルタ選択ステップとを有する高能率符号化プログラム。
  3. 等ラウドネス特性及び/又はマスキング特性に基づいて、聴覚的に聞こえない領域の量子化雑音を増加させるようにスペクトル形状を変化させることが可能なサンプリング周波数に比べて低い低サンプリング周波数によりサンプリングされた入力オーディオ信号における現サンプルと1つ前のサンプルとの差分値を算出する差分算出ステップと、
    前記差分値に対して量子化及び符号化を行う圧縮ステップと、
    前記圧縮ステップから得られた出力に対して復号化及び逆量子化を行う伸長ステップと、
    前記圧縮ステップの符号化結果に基づいて、次に算出される差分値の量子化の際の量子化幅を決定する量子化幅決定ステップと、
    前記伸長ステップから得られた出力と前記差分値を算出する際の前記1つ前のサンプルの値とを加え、次の差分算出ステップにおいて差分値を算出する際の1つ前のサンプルの値を算出する累積ステップとをコンピュータに実行させるための高能率符号化プログラムであって、
    前記入力オーディオ信号を所定のサンプル数ごとに分けて処理フレームを生成するフレーム化ステップと、
    生成された前記処理フレームに対するスペクトル包絡線の逆特性のスペクトル包絡線を求め、求められた前記逆特性のスペクトル包絡線の特性を打ち消すスペクトル包絡線の特性を示す係数を算出し、算出された前記係数をフィルタ係数とするフィルタ特性決定ステップと、
    前記圧縮ステップへの入力の値と前記伸長ステップから得られた出力の値とに基づいて量子化雑音を算出し、算出された前記量子化雑音に対して、前記処理フレームごとに算出された前記フィルタ係数から構成されるフィルタの対応する前記フィルタ係数をかけて量子化雑音スペクトルを整形するノイズシェイピングステップとを更にコンピュータに実行させる高能率符号化プログラムであり、
    前記フィルタ特性決定ステップは、前記処理フレームの前記逆特性のスペクトル包絡線の最大レベルと最小レベルとの差により定まる振幅変動幅を所定の制限幅内に収めるよう処理を行うスペクトル包絡制限ステップと、
    前記処理フレームにおいてサンプルの値に変化がなくその値が続く場合、前記値が続くサンプルの数をカウントするDC値探索ステップと、
    カウントされた前記サンプルの数に基づいて、前記量子化雑音にかけるフィルタ係数を算出された前記フィルタ係数にするか、あらかじめ所定の記憶領域に格納された保存フィルタ係数にするかを選択する最終フィルタ選択ステップとを有する高能率符号化プログラム。
  4. 前記フィルタ特性決定ステップにおける生成された前記処理フレームに対するスペクトル包絡線の逆特性のスペクトル包絡線の算出ステップは、線形予測分析により線形予測係数を求める第1の線形予測分析ステップと、前記線形予測係数に対してフーリエ変換によりスペクトル包絡線を求めるスペクトル包絡算出ステップとからなり、
    求められた前記逆特性のスペクトル包絡線の特性を打ち消すスペクトル包絡線の特性を示す係数の算出ステップは、前記フーリエ変換により求められたスペクトル包絡線に対して、逆フーリエ変換をして得られた係数を用いて線形予測分析を行い線形予測係数を求める第2の線形予測分析ステップからなる請求項1から3のいずれか1つに記載の高能率符号化プログラム。
  5. 前記フレーム化ステップにおいて構成される前記処理フレームは、直前の処理フレームを結合させた処理フレームである請求項1から4のいずれか1つに記載の高能率符号化プログラム。
  6. 等ラウドネス特性及び/又はマスキング特性に基づいて、聴覚的に聞こえない領域の量子化雑音を増加させるようにスペクトル形状を変化させることが可能なサンプリング周波数に比べて低い低サンプリング周波数によりサンプリングされた入力オーディオ信号における現サンプルと1つ前のサンプルとの差分値を算出する差分算出手段と、
    前記差分値に対して量子化及び符号化を行う圧縮手段と、
    前記圧縮手段からの出力に対して復号化及び逆量子化を行う伸長手段と、
    前記圧縮手段の符号化結果に基づいて、次に算出される差分値の量子化の際の量子化幅を決定する量子化幅決定手段と、
    前記伸長手段からの出力と前記差分値を算出する際の前記1つ前のサンプルの値とを加え、次に差分算出手段において差分値を算出する際の1つ前のサンプルの値を算出する累積手段とから構成される高能率符号化装置であって、
    前記入力オーディオ信号を所定のサンプル数ごとに分けて処理フレームを生成するフレーム化手段と、
    生成された前記処理フレームに対するスペクトル包絡線の逆特性のスペクトル包絡線を求め、求められた前記逆特性のスペクトル包絡線の特性を打ち消すスペクトル包絡線の特性を示す係数を算出し、算出された前記係数をフィルタ係数とするフィルタ特性決定手段と、
    前記圧縮手段への入力の値と前記伸長手段からの出力の値とに基づいて量子化雑音を算出し、算出された前記量子化雑音に対して、前記処理フレームごとに算出された前記フィルタ係数から構成されるフィルタの対応する前記フィルタ係数をかけて量子化雑音スペクトルを整形するノイズシェイピング手段とを更に有し、
    前記フィルタ特性決定手段は、前記処理フレームの前記逆特性のスペクトル包絡線の最大レベルと最小レベルとの差により定まる振幅変動幅を所定の制限幅内に収めるよう処理を行うスペクトル包絡制限手段を有する高能率符号化装置。
  7. 等ラウドネス特性及び/又はマスキング特性に基づいて、聴覚的に聞こえない領域の量子化雑音を増加させるようにスペクトル形状を変化させることが可能なサンプリング周波数に比べて低い低サンプリング周波数によりサンプリングされた入力オーディオ信号における現サンプルと1つ前のサンプルとの差分値を算出する差分算出手段と、
    前記差分値に対して量子化及び符号化を行う圧縮手段と、
    前記圧縮手段からの出力に対して復号化及び逆量子化を行う伸長手段と、
    前記圧縮手段の符号化結果に基づいて、次に算出される差分値の量子化の際の量子化幅を決定する量子化幅決定手段と、
    前記伸長手段からの出力と前記差分値を算出する際の前記1つ前のサンプルの値とを加え、次に差分算出手段において差分値を算出する際の1つ前のサンプルの値を算出する累積手段とから構成される高能率符号化装置であって、
    前記入力オーディオ信号を所定のサンプル数ごとに分けて処理フレームを生成するフレーム化手段と、
    生成された前記処理フレームに対するスペクトル包絡線の逆特性のスペクトル包絡線を求め、求められた前記逆特性のスペクトル包絡線の特性を打ち消すスペクトル包絡線の特性を示す係数を算出し、算出された前記係数をフィルタ係数とするフィルタ特性決定手段と、
    前記圧縮手段への入力の値と前記伸長手段からの出力の値とに基づいて量子化雑音を算出し、算出された前記量子化雑音に対して、前記処理フレームごとに算出された前記フィルタ係数から構成されるフィルタの対応する前記フィルタ係数をかけて量子化雑音スペクトルを整形するノイズシェイピング手段とを更に有し、
    前記フィルタ特性決定手段は、前記処理フレームにおいてサンプルの値に変化がなくその値が続く場合、前記値が続くサンプルの数をカウントするDC値探索手段と、
    カウントされた前記サンプルの数に基づいて、前記量子化雑音にかけるフィルタ係数を算出された前記フィルタ係数にするか、あらかじめ所定の記憶領域に格納された保存フィルタ係数にするかを選択する最終フィルタ選択手段とを有する高能率符号化装置。
  8. 等ラウドネス特性及び/又はマスキング特性に基づいて、聴覚的に聞こえない領域の量子化雑音を増加させるようにスペクトル形状を変化させることが可能なサンプリング周波数に比べて低い低サンプリング周波数によりサンプリングされた入力オーディオ信号における現サンプルと1つ前のサンプルとの差分値を算出する差分算出手段と、
    前記差分値に対して量子化及び符号化を行う圧縮手段と、
    前記圧縮手段からの出力に対して復号化及び逆量子化を行う伸長手段と、
    前記圧縮手段の符号化結果に基づいて、次に算出される差分値の量子化の際の量子化幅を決定する量子化幅決定手段と、
    前記伸長手段からの出力と前記差分値を算出する際の前記1つ前のサンプルの値とを加え、次に差分算出手段において差分値を算出する際の1つ前のサンプルの値を算出する累積手段とから構成される高能率符号化装置であって、
    前記入力オーディオ信号を所定のサンプル数ごとに分けて処理フレームを生成するフレーム化手段と、
    生成された前記処理フレームに対するスペクトル包絡線の逆特性のスペクトル包絡線を求め、求められた前記逆特性のスペクトル包絡線の特性を打ち消すスペクトル包絡線の特性を示す係数を算出し、算出された前記係数をフィルタ係数とするフィルタ特性決定手段と、
    前記圧縮手段への入力の値と前記伸長手段からの出力の値とに基づいて量子化雑音を算出し、算出された前記量子化雑音に対して、前記処理フレームごとに算出された前記フィルタ係数から構成されるフィルタの対応する前記フィルタ係数をかけて量子化雑音スペクトルを整形するノイズシェイピング手段とを更に有し、
    前記フィルタ特性決定手段は、前記処理フレームの前記逆特性のスペクトル包絡線の最大レベルと最小レベルとの差により定まる振幅変動幅を所定の制限幅内に収めるよう処理を行うスペクトル包絡制限手段と、
    前記処理フレームにおいてサンプルの値に変化がなくその値が続く場合、前記値が続くサンプルの数をカウントするDC値探索手段と、
    カウントされた前記サンプルの数に基づいて、前記量子化雑音にかけるフィルタ係数を算出された前記フィルタ係数にするか、あらかじめ所定の記憶領域に格納された保存フィルタ係数にするかを選択する最終フィルタ選択手段とを有する高能率符号化装置。
JP2005376442A 2005-12-27 2005-12-27 高能率符号化プログラム及び高能率符号化装置 Expired - Fee Related JP4556866B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005376442A JP4556866B2 (ja) 2005-12-27 2005-12-27 高能率符号化プログラム及び高能率符号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005376442A JP4556866B2 (ja) 2005-12-27 2005-12-27 高能率符号化プログラム及び高能率符号化装置

Publications (2)

Publication Number Publication Date
JP2007178677A JP2007178677A (ja) 2007-07-12
JP4556866B2 true JP4556866B2 (ja) 2010-10-06

Family

ID=38303931

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005376442A Expired - Fee Related JP4556866B2 (ja) 2005-12-27 2005-12-27 高能率符号化プログラム及び高能率符号化装置

Country Status (1)

Country Link
JP (1) JP4556866B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120095729A1 (en) * 2010-10-14 2012-04-19 Electronics And Telecommunications Research Institute Known information compression apparatus and method for separating sound source

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61158218A (ja) * 1984-12-29 1986-07-17 Sony Corp 信号伝送装置
JPS62234435A (ja) * 1986-04-04 1987-10-14 Kokusai Denshin Denwa Co Ltd <Kdd> 符号化音声の復号化方式
JPH05248972A (ja) * 1992-03-06 1993-09-28 Sony Corp 音声信号処理方法
JPH06152542A (ja) * 1992-10-31 1994-05-31 Sony Corp 高能率符号化装置、ノイズスペクトル変更装置及び方法
JP2000081899A (ja) * 1998-09-03 2000-03-21 Olympus Optical Co Ltd 音声認識装置、音声記録再生装置
JP2002123298A (ja) * 2000-10-18 2002-04-26 Nippon Telegr & Teleph Corp <Ntt> 信号符号化方法、装置及び信号符号化プログラムを記録した記録媒体

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61158218A (ja) * 1984-12-29 1986-07-17 Sony Corp 信号伝送装置
JPS62234435A (ja) * 1986-04-04 1987-10-14 Kokusai Denshin Denwa Co Ltd <Kdd> 符号化音声の復号化方式
JPH05248972A (ja) * 1992-03-06 1993-09-28 Sony Corp 音声信号処理方法
JPH06152542A (ja) * 1992-10-31 1994-05-31 Sony Corp 高能率符号化装置、ノイズスペクトル変更装置及び方法
JP2000081899A (ja) * 1998-09-03 2000-03-21 Olympus Optical Co Ltd 音声認識装置、音声記録再生装置
JP2002123298A (ja) * 2000-10-18 2002-04-26 Nippon Telegr & Teleph Corp <Ntt> 信号符号化方法、装置及び信号符号化プログラムを記録した記録媒体

Also Published As

Publication number Publication date
JP2007178677A (ja) 2007-07-12

Similar Documents

Publication Publication Date Title
JP4478183B2 (ja) 音声信号を安定して分類する装置および方法、音声信号データベースを構築して動作させる方法、およびコンピュータプログラム
JP3307138B2 (ja) 信号符号化方法及び装置、並びに信号復号化方法及び装置
KR100348368B1 (ko) 디지털 음향 신호 부호화 장치, 디지털 음향 신호 부호화방법 및 디지털 음향 신호 부호화 프로그램을 기록한 매체
JP5390690B2 (ja) 音声コーデックの品質向上装置およびその方法
JP4760278B2 (ja) 補間装置、オーディオ再生装置、補間方法および補間プログラム
JP2004198485A (ja) 音響符号化信号復号化装置及び音響符号化信号復号化プログラム
JP2001343997A (ja) デジタル音響信号符号化装置、方法及び記録媒体
KR100636144B1 (ko) 오디오 신호 부호화/복호화 장치 및 방법
US7444289B2 (en) Audio decoding method and apparatus for reconstructing high frequency components with less computation
US20070118362A1 (en) Audio compression/decompression device
JP4556866B2 (ja) 高能率符号化プログラム及び高能率符号化装置
JP2020190606A (ja) 音声雑音除去装置及びプログラム
JP4593364B2 (ja) オーディオデータの補間方法および補間装置
JP4508599B2 (ja) データ圧縮方法
JP4649351B2 (ja) デジタルデータ復号化装置
JP4627737B2 (ja) デジタルデータ復号化装置
JPH1083623A (ja) 信号記録方法、信号記録装置、記録媒体および信号処理方法
JP2003280691A (ja) 音声処理方法および音声処理装置
JP4641272B2 (ja) デジタルデータ復号化装置
JP4004525B1 (ja) 信号処理方法、信号処理装置及びコンピュータプログラム
JPH05204395A (ja) 音声用利得制御装置および音声記録再生装置
JP2005003912A (ja) オーディオ信号符号化装置、オーディオ信号符号化方法及びプログラム
JP4530567B2 (ja) デジタルオーディオ復号装置
JP2007108360A (ja) 補間装置、オーディオ再生装置、補間方法および補間プログラム
JP2006078882A (ja) 音声録音再生装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071228

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100531

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100629

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100712

R151 Written notification of patent or utility model registration

Ref document number: 4556866

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130730

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130730

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130730

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees