JP2011022435A - 信号符号化装置、信号復号装置、信号処理システム、これらにおける処理方法およびプログラム - Google Patents

信号符号化装置、信号復号装置、信号処理システム、これらにおける処理方法およびプログラム Download PDF

Info

Publication number
JP2011022435A
JP2011022435A JP2009168465A JP2009168465A JP2011022435A JP 2011022435 A JP2011022435 A JP 2011022435A JP 2009168465 A JP2009168465 A JP 2009168465A JP 2009168465 A JP2009168465 A JP 2009168465A JP 2011022435 A JP2011022435 A JP 2011022435A
Authority
JP
Japan
Prior art keywords
amplitude
encoding
fluctuation amount
decoding
band
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009168465A
Other languages
English (en)
Other versions
JP5304504B2 (ja
Inventor
Yuji Maeda
祐児 前田
Atsushi Matsumoto
淳 松本
Yasuhiro Tokuri
康裕 戸栗
Shiro Suzuki
志朗 鈴木
Yuki Matsumura
祐樹 松村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2009168465A priority Critical patent/JP5304504B2/ja
Priority to EP10167417.4A priority patent/EP2284832B1/en
Priority to US12/832,476 priority patent/US8606567B2/en
Priority to CN2010102263164A priority patent/CN101958120B/zh
Publication of JP2011022435A publication Critical patent/JP2011022435A/ja
Application granted granted Critical
Publication of JP5304504B2 publication Critical patent/JP5304504B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

【課題】入力信号の符号化による圧縮効率を向上させる。
【解決手段】スペクトル符号化処理部300は、複数の符号化アルゴリズムにより入力信号における周波数スペクトルの量子化値を符号化する。振幅基準値生成部220は、周波数スペクトルを正規化するための振幅基準値を、分割帯域に含まれる周波数スペクトルに基づいて生成する。振幅変動量算出部260は、算出対象である分割帯域の近傍の分割帯域に対する振幅基準値に基づいて、その分割帯域の振幅変動量を算出する。そして、振幅変動量算出部260は、その算出された振幅変動量が大きい場合には、その分割帯域における量子化値を、量子化値の出現確率分布の偏り度合いが大きい分割帯域に適用する符号化アルゴリズムにより符号化させる。
【選択図】図2

Description

本発明は、信号符号化装置、信号復号装置および信号処理システムに関し、特に入力信号に基づいて生成された周波数成分を符号化する信号符号化装置、および、これらにおける処理方法ならびに当該方法をコンピュータに実行させるプログラムに関する。
従来、音響信号を符号化する音響信号符号化装置では、周波数成分に変換された音響信号を正規化および量子化して、その量子化された量子化値を符号化するものが一般的である。例えば、音響信号における周波数成分を所定の帯域ごとに分割して、その帯域ごとに分割された信号を量子化するシステムが提案されている(例えば、特許文献1参照。)。
特許第3277692号公報(図1)
上述の従来技術では、所定の分割帯域ごとに音響信号の周波数成分を量子化することによって、量子化精度を分割帯域ごとに制御できることから、マスキング効果などの人間の聴覚上の性質を利用した量子化を行うことができる。しかしながら、分割帯域ごとに量子化を行うと、量子化値の出現確率の分布が分割帯域ごとに異なるため、量子化値の出現確率分布によっては、著しく符号化効率が低下してしまい、音響信号の圧縮効率が低下する場合がある。
本発明はこのような状況に鑑みてなされたものであり、入力信号の符号化による圧縮効率を向上させることを目的とする。
本発明は、上記課題を解決するためになされたものであり、その第1の側面は、入力信号における周波数スペクトルの量子化値を複数の符号化アルゴリズムにより符号化する符号化部と、上記周波数スペクトルのスペクトル包絡に基づいて上記周波数スペクトルに関する振幅変動量を算出する振幅変動量算出部と、上記複数の符号化アルゴリズムのうち上記振幅変動量における上記量子化値の出現確率分布の偏り度合いに応じた上記符号化アルゴリズムを選択する符号化選択部とを具備する信号符号化装置およびその処理方法ならびに当該方法をコンピュータに実行させるプログラムである。これにより、量子化値を符号化するための複数の符号化アルゴリズムのうち、入力信号における周波数スペクトルのスペクトル包絡における振幅変動量に基づく量子化値の出現確率分布の偏り度合いに応じた符号化アルゴリズムを選択させるという作用をもたらす。
また、この第1の側面において、上記周波数スペクトルの周波数帯域における複数の分割帯域ごとに抽出された上記周波数スペクトルの最大レベルに基づいて上記分割帯域に対する振幅基準値を上記スペクトル包絡として生成する振幅基準値生成部をさらに具備し、上記振幅変動量算出部は、上記複数の分割帯域のうち所定の分割帯域である変動量算出帯域に対する上記振幅基準値に基づいて上記振幅変動量を上記分割帯域ごとに算出し、上記符号化選択部は、上記分割帯域に対する上記振幅変動量が大きい場合には上記偏り度合いが大きい上記分割帯域に対応する上記量子化値を符号化するための上記符号化アルゴリズムを上記分割帯域ごとに選択するようにしてもよい。これにより、複数の分割帯域の各々における周波数スペクトルの最大レベルに基づいて生成された振幅基準値のうち、算出対象である分割帯域の近傍における変動量算出帯域に対する振幅基準値に基づいて振幅変動量を算出させ、その振幅変動量が大きい場合には、出現確率分布の偏り度合いが大きい分割帯域に対応する量子化値を符号化する符号化アルゴリズムを分割帯域ごとに選択させるという作用をもたらす。この場合において、上記振幅変動量算出部は、上記変動量算出帯域である隣接する上記分割帯域に対する上記振幅基準値の差に基づいて上記振幅変動量を上記分割帯域ごとに算出するようにしてもよい。これにより、振幅変動量算出部により、低域または高域の隣接する分割帯域の振幅基準値の差分に基づいて周波数スペクトルに関する振幅変動量を分割帯域ごとに算出させるという作用をもたらす。
また、上記周波数スペクトルの周波数帯域における複数の分割帯域ごとに抽出された上記周波数スペクトルの最大レベルに基づいて上記分割帯域に対する振幅基準値を上記スペクトル包絡として生成する振幅基準値生成部をさらに具備し、上記振幅変動量算出部は、上記複数の分割帯域のうち所定の分割帯域である変動量算出帯域に対する上記振幅基準値に基づいて上記振幅変動量を上記分割帯域ごとに算出し、上記符号化選択部は、上記分割帯域に対する上記振幅変動量が大きい場合には上記偏り度合いが大きい上記分割帯域に対応する上記量子化値を符号化するための上記符号化アルゴリズムを上記分割帯域ごとに選択する場合において、上記振幅変動量算出部は、低域における上記分割帯域に対する上記振幅基準値の平均値と上記変動量算出帯域に対する振幅基準値とに基づいて上記振幅変動量を上記分割帯域ごとに算出するようにしてもよい。これにより、低域における分割帯域の振幅基準値の平均値と、振幅変動量の算出対象である分割帯域の振幅基準値とに基づいて分割帯域に対する振幅変動量を算出させるという作用をもたらす。
また、上記周波数スペクトルの周波数帯域における複数の分割帯域ごとに抽出された上記周波数スペクトルの最大レベルに基づいて上記分割帯域に対する振幅基準値を上記スペクトル包絡として生成する振幅基準値生成部をさらに具備し、上記振幅変動量算出部は、上記複数の分割帯域のうち所定の分割帯域である変動量算出帯域に対する上記振幅基準値に基づいて上記振幅変動量を上記分割帯域ごとに算出し、上記符号化選択部は、上記分割帯域に対する上記振幅変動量が大きい場合には上記偏り度合いが大きい上記分割帯域に対応する上記量子化値を符号化するための上記符号化アルゴリズムを上記分割帯域ごとに選択する場合において、上記振幅基準値生成部は、上記分割帯域の振幅レベルの基準となるスケールファクタを上記振幅基準値として生成するようにしてもよい。これにより、振幅基準値生成部により、分割帯域における周波数スペクトルを正規化するための振幅レベルであるスケールファクタを、振幅基準値として生成させるという作用をもたらす。
また、本発明の第2の側面は、入力信号における周波数スペクトルの量子化値が符号化された符号化データを複数の復号アルゴリズムにより復号する復号部と、上記周波数スペクトルの周波数帯域における複数の分割帯域ごとに抽出された上記周波数スペクトルに基づいて生成された振幅基準値のうち所定の上記分割帯域の上記振幅基準値により上記分割帯域に対する振幅変動量を算出する振幅変動量算出部と、上記複数の復号アルゴリズムのうち上記振幅変動量における上記量子化値の出現確率分布の偏り度合いに応じた上記復号アルゴリズムを選択する復号選択部とを具備する信号復号装置およびその処理方法ならびに当該方法をコンピュータに実行させるプログラムである。これにより、符号化された符号化データを復号するための複数の復号アルゴリズムのうち、信号符号化装置からの振幅基準値に基づいて算出された振幅変動量における量子化値の出現確率分布の偏り度合いに応じた復号アルゴリズムを選択させるという作用をもたらす。
また、本発明の第3の側面は、入力信号における周波数スペクトルの量子化値を複数の符号化アルゴリズムにより符号化する符号化部と、上記周波数スペクトルにおける複数の分割帯域ごとに抽出された周波数スペクトルに基づいて上記分割帯域に対する振幅基準値を生成する振幅基準値生成部と、上記複数の分割帯域のうち所定の分割帯域である変動量算出帯域に対する上記振幅基準値に基づいて上記振幅変動量を上記分割帯域ごとに算出する振幅変動量算出部と、上記複数の符号化アルゴリズムのうち上記振幅変動量における量子化値の出現確率分布の偏り度合いに応じた上記符号化アルゴリズムを選択する符号化選択部とを備える信号符号化装置と、上記入力信号における周波数スペクトルの量子化値が符号化されたデータを複数の復号アルゴリズムにより復号する復号部と、上記信号符号化装置における上記振幅基準値符号化部により生成された振幅基準値のうち上記変動量算出帯域に対する振幅基準値に基づいて振幅変動量を上記分割帯域ごとに算出する振幅変動量算出部と、上記複数の復号アルゴリズムのうち上記振幅変動量における上記量子化値の出現確率分布の偏り度合いに応じた上記復号アルゴリズムを選択する復号選択部とを備える信号復号装置とを具備する信号処理システムである。これにより、信号符号化装置により、量子化値を符号化するための複数の符号化アルゴリズムのうち、複数の分割帯域における変動量算出帯域の振幅基準値に基づいて生成された振幅変動量における量子化値の出現確率分布の偏り度合いに応じた上記符号化アルゴリズムを選択させ、信号復号装置により、信号符号化装置からの各分割帯域における振幅基準値のうち、信号符号化装置と同一に定められた変動量算出帯域の振幅基準値による振幅変動量に基づいて、符号化された符号化データを復号するための複数の復号アルゴリズムのうち、量子化値の出現確率分布の偏り度合いに応じた復号アルゴリズムを選択させるという作用をもたらす。
本発明によれば、入力信号の符号化による圧縮効率を向上させることができるという優れた効果を奏し得る。
本発明の実施の形態における音響信号処理システムの一構成例を示すブロック図である。 本発明の第1の実施の形態における音響信号符号化装置200の一構成例を示すブロック図である。 本発明の第1の実施の形態における振幅変動量算出部260により各分割帯域に対する振幅変動量の判定例を示す図である。 振幅変動量算出部260により振幅変動量が大きいと判定された分割帯域のうち、分割帯域幅W4における分割帯域に対応する量子化値の出現確率分布の一例を示す図である。 振幅変動量算出部260により振幅変動量が大きいと判定された分割帯域のうち、分割帯域幅W8における分割帯域に対応する量子化値の出現確率分布の一例を示す図である。 振幅変動量算出部260により振幅変動量が大きいと判定された分割帯域のうち、分割帯域幅W16における分割帯域に対応する量子化値の出現確率分布の一例を示す図である。 本発明の第1の実施の形態におけるスペクトル符号化処理部300の一構成例を示すブロック図である。 本発明の第1の実施の形態における音響信号符号化装置200の符号化方法における処理手順例を示すフローチャートである。 本発明の第1の実施の形態における音響信号符号化装置200による正規化スペクトル生成処理(ステップS920)の処理手順例を示すフローチャートである。 本発明の第1の実施の形態における振幅変動量算出部260による振幅変動判定処理(ステップS930)の処理手順例を示すフローチャートである。 本発明の第1の実施の形態におけるスペクトル符号化処理部300によるスペクトル符号化処理(ステップS940)の処理手順例を示すフローチャートである。 本発明の第2の実施の形態における音響信号復号装置400の一構成例を示すブロック図である。 本発明の第2の実施の形態におけるスペクトル復号処理部500の一構成例を示すブロック図である。 音響信号処理システム100による圧縮率と従来システムによる圧縮率との比較結果を示す図である。 本発明の第2の実施の形態における音響信号符号化装置200の復号方法における処理手順例を示すフローチャートである。 本発明の第2の実施の形態における振幅変動量算出部460による振幅変動判定処理(ステップS960)の処理手順例を示すフローチャートである。 本発明の第2の実施の形態におけるスペクトル復号処理部500によるスペクトル復号処理(ステップS970)の処理手順例を示すフローチャートである。 本発明の第2の実施の形態における音響信号復号装置400による逆正規化処理(ステップS980)の処理手順例を示すフローチャートである。 本発明の第3の実施の形態における音響信号符号化装置200の一構成例を示すブロック図である。 本発明の第3の実施の形態における音響信号符号化装置200による振幅変動判定処理(ステップS990)の処理手順例を示すフローチャートである。 本発明の第4の実施の形態における音響信号復号装置400の一構成例を示すブロック図である。 本発明の第5の実施の形態におけるスペクトル符号化処理部の一構成例を示すブロック図である。
以下、本発明を実施するための形態(以下、実施の形態と称する)について説明する。説明は以下の順序により行う。
1.第1の実施の形態(符号化処理:隣接する分割帯域の振幅基準値に基づく符号化アルゴリズムの切替え例)
2.第2の実施の形態(復号処理:音響符号化装置からの振幅基準値に基づく復号アルゴリズムの切替え例)
3.第3の実施の形態(符号化処理:周波数スペクトルの平均値と分割帯域の振幅基準値とに基づく符号化アルゴリズムの切替え例)
4.第4の実施の形態(復号処理:周波数スペクトルの平均値と分割帯域の振幅基準値とに基づく復号アルゴリズムの切替え例)
5.第5の実施の形態(符号化処理:振幅変動量に基づく算術符号化アルゴリズムまたはハフマン符号化アルゴリズムへの切替え例)
<1.第1の実施の形態>
[音響信号処理システムの構成例]
図1は、本発明の実施の形態における音響信号処理システムの一構成例を示すブロック図である。音響信号処理システム100は、音響信号入力端子101からの音響信号を符号化する音響信号符号化装置200と、その符号化された音響信号を復号して音響信号出力線401を介してスピーカ600に出力する音響信号復号装置400とを備えている。ここでは、音響信号符号化装置200により符号化された音響信号がネットワーク110を介して音響信号復号装置400に伝送されることを想定している。
音響信号符号化装置200は、音響信号入力端子101から入力される入力信号である音響信号を周波数成分に変換して、その周波数成分を符号化するものである。この音響信号符号化装置200は、例えば、複数チャンネルの音響信号の各々を周波数成分に変換して、その変換された周波数成分を正規化する。
また、音響信号符号化装置200は、その正規化された周波数成分を量子化して、その量子化された周波数成分をチャンネルごとに符号化する。この音響信号符号化装置200は、各チャンネルの符号化された量子化値である符号化データおよびこれらの符号化に関する符号化情報を多重化して、音響符号化データとして符号列出力線201を介してネットワーク110に出力する。
ネットワーク110は、音響信号符号化装置200と音響信号復号装置400との間を接続する接続網である。このネットワーク110は、音響信号符号化装置200から出力された音響符号化データを、符号列入力線202を介して音響信号復号装置400に伝送する。
音響信号復号装置400は、符号列入力線202から供給された音響符号化データを復号することによって、音響信号を生成するものである。この音響信号復号装置400は、例えば、音響符号化データを、各チャンネルの符号化データおよび符号化情報に分離して、その符号化情報に基づいて復号された符号化データを量子化値として生成する。この音響信号復号装置400は、その各チャンネルの量子化値を逆量子化および逆正規化することによって、音響信号の周波数成分を生成する。この音響信号復号装置400は、その生成された周波数成分を時間領域の信号に変換することによって、各チャンネルの音響信号を生成して、スピーカ600に供給する。
スピーカ600は、音響信号復号装置400から供給された音響信号を出力するものである。このスピーカ600は、音響信号復号装置400から供給された各チャンネルの音響信号である電気信号を音波に変換して出力する。
このように、音響信号処理システム100は、音響信号入力端子101から入力された音響信号を音響信号符号化装置200により符号化することによって、その音響信号の情報量が圧縮された音響符号化データを生成することができる。また、音響信号処理システム100は、音響信号復号装置400により、その音響符号化データを復号することによって、音響信号を復元することができる。
これにより、音響信号処理システム100は、音響信号入力端子101から入力された音響信号を音響符号化データに変換することによって、情報量が圧縮された音響信号をネットワーク110に伝送することができる。なお、音響信号処理システム100は、特許請求の範囲に記載の信号処理システムの一例である。次に、音響信号処理システム100における音響信号符号化装置200の構成例について以下に図面を参照して説明する。
[音響信号符号化装置200の構成例]
図2は、本発明の第1の実施の形態における音響信号符号化装置200の一構成例を示すブロック図である。
この音響信号符号化装置200は、周波数スペクトル生成部210と、振幅基準値生成部220と、量子化振幅情報算出部230と、スペクトル正規化部240と、語長情報生成部250と、振幅変動量算出部260とを備える。さらに、この音響信号符号化装置200は、符号化帯域設定部270と、振幅基準値符号化部280と、多重化部290と、スペクトル符号化処理部300とを備える。なお、音響信号符号化装置200は、特許請求の範囲に記載の信号符号化装置の一例である。
周波数スペクトル生成部210は、音響信号入力端子101から入力された音響信号を周波数成分に変換することによって、音響信号の周波数スペクトルを生成するものである。この周波数スペクトル生成部210は、一定の時間間隔によりサンプリングされた離散時間信号である音響信号を一定のサンプリング数のフレーム単位により抽出する。そして、周波数スペクトル生成部210は、その抽出された各フレームの音響信号を周波数領域に変換することによって、周波数スペクトルを生成する。
この周波数スペクトル生成部210は、例えば、音響信号入力端子101からの各チャンネルの音響信号に対する高速フーリエ変換(FFT:Fast Fourier Transform)によって算出されたフーリエ係数を、周波数スペクトルとして生成する。あるいは、この周波数スペクトル生成部210は、修正離散余弦変換(MDCT:Modified Discrete Cosine Transform)により算出されたMDCT係数を、周波数スペクトルとして生成する。また、周波数スペクトル生成部210は、その生成された周波数成分を示す周波数スペクトルを、振幅基準値生成部220およびスペクトル正規化部240に供給する。
振幅基準値生成部220は、周波数スペクトル生成部210により生成された周波数スペクトルの振幅を正規化するための基準となる振幅基準値を生成するものである。ここにいう振幅基準値とは、例えば、周波数スペクトルの振幅レベルの基準となるスケールファクタのことをいう。この振幅基準値生成部220は、周波数スペクトル生成部210から供給される周波数スペクトルの全周波数帯域を所定の分割帯域(スケールファクタバンド)に分割して、その分割された分割帯域に対応する周波数スペクトルを分割帯域ごとに抽出する。
この振幅基準値生成部220は、その抽出された周波数スペクトルのうち代表する周波数スペクトルの振幅レベルに基づいて、分割帯域に対する振幅基準値を生成する。この振幅基準値生成部220は、例えば、分割帯域における周波数スペクトルのうち振幅レベルが最大となる周波数スペクトルを、代表する周波数スペクトルとして選択して、その選択された周波数スペクトルのレベルに基づいて分割帯域に対する振幅基準値を生成する。すなわち、この振幅基準値生成部220は、周波数スペクトルの周波数帯域における複数の分割帯域ごとに抽出された周波数スペクトルの最大レベルに基づいて、分割帯域に対する振幅基準値をそれぞれ生成する。
この振幅基準値生成部220は、例えば、次式に基づいて、第i番の分割帯域に対する振幅基準値Ar[i]を生成する。
Figure 2011022435
ここで、Aiは、第i番の分割帯域に対応する周波数スペクトルのうち、第i番の分割帯域を代表する周波数スペクトルの振幅レベルを示す。また、iは、分割帯域のインデックスを示す。また、振幅レベルAiが「1」以上である場合には、式1における上段の式により、「logAi+1」を超えない最大の整数値が振幅基準値Ar[i]として生成される。すなわち、「logAi+1」の小数点以下を切り捨てた値が振幅基準値Ar[i]として生成される。
また、振幅基準値生成部220は、複数の分割帯域の各々に対する振幅基準値Ar[i]を、量子化振幅情報算出部230、語長情報生成部250、振幅変動量算出部260および振幅基準値符号化部280に供給する。なお、振幅基準値生成部220は、特許請求の範囲に記載の振幅基準値生成部の一例である。
量子化振幅情報算出部230は、振幅基準値生成部220から供給された振幅基準値に基づいて、周波数スペクトルを正規化するための量子化振幅情報を算出するものである。この量子化振幅情報算出部230は、例えば、次式に基づいて各分割帯域に対する量子化振幅情報A(q)iを算出する。
Figure 2011022435
また、量子化振幅情報算出部230は、上式に基づいて算出された各分割帯域に対する量子化振幅情報A(q)iをスペクトル正規化部240に供給する。
スペクトル正規化部240は、量子化振幅情報算出部230からの量子化振幅情報に基づいて、周波数スペクトル生成部210から供給された周波数スペクトルを正規化するものである。このスペクトル正規化部240は、量子化振幅情報算出部230からの分割帯域に対する振幅基準値に基づいて分割帯域に対応する周波数スペクトルのレベルを正規化することによって、分割帯域ごとに正規化スペクトルを生成する。
このスペクトル正規化部240は、例えば、次式により、第i番の分割帯域に対する量子化振幅情報A(q)iと、第i番の分割帯域に対応する各周波数スペクトルのレベルX[m]とに基づいて、正規化スペクトルのレベルN[m]を算出する。
Figure 2011022435
ここで、mは、周波数スペクトルの周波数に相当する周波数番号を示す。mは、第i番の分割帯域における周波数スペクトルの周波数番号のうち、最も小さい周波数番号を示す。また、mi+1は、第i+1番の分割帯域における周波数スペクトルの周波数番号のうち、最も小さい周波数番号を示す。
上式の式3により、スペクトル正規化部240は、第i番の分割帯域における量子化振幅情報A(q)iと、第i番の分割帯域に対応する各周波数スペクトルX[m]とに基づいて、第i番の分割帯域に対応する正規化スペクトルN[m]を生成する。これにより、正規化スペクトルN[m]の値域は、「−1.0」乃至「1.0」となる。また、スペクトル正規化部240は、信号線241を介して、その正規化スペクトルをスペクトル符号化処理部300に供給する。
語長情報生成部250は、振幅基準値生成部220からの各分割帯域に対応する振幅基準値に基づいて、量子化精度を決定する語長情報(ワードレングス)を分割帯域ごとに生成するものである。この語長情報生成部250は、例えば、全ての振幅基準値に対して人間の聴覚特性を考慮した重み付けを行うことによって、各分割帯域に対する語長情報を生成する。
また、語長情報生成部250は、信号線271からの符号化帯域数によって定まる符号化すべき分割帯域に限り語長情報を生成する。また、語長情報生成部250は、その生成された語長情報を、信号線251を介してスペクトル符号化処理部300に供給する。
振幅変動量算出部260は、振幅基準値生成部220から供給される各分割帯域に対応する振幅基準値に基づいて、周波数スペクトル生成部210により生成された周波数スペクトルに関する振幅変動量を算出するものである。すなわち、この振幅変動量算出部260は、音響信号における周波数スペクトルに対するスペクトル包絡に基づいて、その周波数スペクトルに関する振幅変動量を算出する。
この振幅変動量算出部260は、複数の分割帯域のうち、所定の分割帯域である変動量算出帯域に対する振幅基準値に基づいて、振幅変動量を分割帯域ごとに算出する。また、振幅変動量算出部260は、信号線271からの符号化帯域数によって定まる符号化すべき分割帯域に限り振幅変動量を算出する。
この振幅変動量算出部260は、例えば、振幅変動量の算出対象である分割帯域の近傍における各分割帯域を変動量算出帯域として、変動量算出帯域に対する各振幅基準値に基づいて、周波数スペクトルに関する振幅変動量を算出する。この例において、振幅変動量算出部260は、例えば、変動量算出帯域として、隣接する分割帯域に対する振幅基準値の差分に基づいて分割帯域に対する振幅変動量を算出する。
また、振幅変動量算出部260は、各分割帯域に対する振幅変動量に基づいて、分割帯域に対する振幅変動量が大きいか否かを判定する。この振幅変動量算出部260は、例えば、算出した振幅変動量が一定の変動量閾値を超えた場合には、振幅変動量が大きい分割帯域である旨を示す振幅変動判定フラグを生成する。一方、振幅変動量算出部260は、振幅変動量が一定の変動量閾値を超えない場合には、振幅変動量が小さい分割帯域である旨を示す振幅変動判定フラグを生成する。
この振幅変動量算出部260は、例えば、次式に示す条件式に基づいて、第i番の分割帯域に対する振幅変動量が大きいか否かを判定する。
Figure 2011022435
ここで、Th1およびTh2は、第1および第2の変動量閾値を示す。また、NCは、符号化をすべき分割帯域のうち最大の分割帯域番号を示す符号化帯域番号である。なお、式4の上段の条件式において、第i−1番およびi番の分割帯域が変動量算出帯域に該当する。また、式4の下段の条件式において、第i−1番乃至i+1番の分割帯域が変動量算出帯域に該当する。
式4の上段の条件式により、振幅変動量算出部260は、第i番の分割帯域の振幅基準値Ar[i]と、第i番の分割帯域の低域側に隣接する第i−1番の分割帯域の振幅基準値Ar[i−1]との差分により、第i番の分割帯域に対する振幅変動量を算出する。そして、振幅変動量算出部260は、その算出された振幅変動量が第1の変動量閾値Th1以上であるか否かを判断する。すなわち、この振幅変動量算出部260は、低域側の隣接する分割帯域に対する振幅基準値を比較対象として、振幅変動量が大きい分割帯域であるか否かを判断する。
また、式4の下段の条件式により、振幅変動量算出部260は、第i番の分割帯域に対する振幅基準値に「2」を乗じた乗算値(2×Ar[i])を算出する。また、この振幅変動量算出部260は、第i番の分割帯域の両側に隣接する第i−1番およびi+1番の分割帯域に対する振幅基準値の加算値(Ar[i−1]+Ar[i+1])を算出する。
さらに、この振幅変動量算出部260は、乗算値(2×Ar[i])から加算値(Ar[i−1]+Ar[i+1])を減算することによって、第i番の分割帯域に対する振幅変動量を算出する。そして、その算出された振幅変動量が、第2の変動量閾値Th2以上であるか否かを判断する。すなわち、この振幅変動量算出部260は、両側の隣接する分割帯域に対する振幅基準値の平均値を比較対象として、振幅変動量が大きい分割帯域であるか否かを判断する。
また、振幅変動量算出部260は、式4に示す2つの条件式のうちいずれか一方の条件式を満足する分割帯域を、近傍の分割帯域に対して振幅変動量が大きい分割帯域であると判定する。すなわち、振幅変動量算出部260は、近傍の分割帯域の振幅基準値に比べて振幅基準値が一定の大きさを超える分割帯域を、近傍の分割帯域よりも振幅基準値が大きい分割帯域と判定する。
この振幅変動量算出部260は、例えば、振幅変動量が大きい分割帯域であると判定した場合には、振幅変動判定フラグを「1」に設定し、振幅変動が大きい分割帯域でないと判定した場合には、振幅変動判定フラグを「0」に設定する。
また、振幅変動量算出部260は、その設定された振幅変動判定フラグをスペクトル符号化処理部300に供給する。なお、ここでは、分割帯域に対する振幅基準値に基づいて振幅変動量を算出する例について説明したが、線形予測分析やケプストラム分析によって生成されるスペクトル包絡に基づいて振幅変動量を算出するようにしてもよい。また、振幅変動量算出部260は、特許請求の範囲に記載の振幅変動量算出部の一例である。
符号化帯域設定部270は、周波数スペクトル生成部210により生成された周波数スペクトルにおける全周波数帯域のうち、周波数スペクトルを符号化する符号化帯域の上限を設定するものである。この符号化帯域設定部270は、音響信号の符号化レートに基づいて、分割帯域の上限の番号を符号化帯域数として設定する。なお、音響信号の符号化レートは、ここでは図示されていない中央演算処理装置(CPU:Central Processing Unit)から供給される。また、符号化帯域設定部270は、設定された符号化帯域数を、信号線271を介して振幅変動量算出部260、多重化部290およびスペクトル符号化処理部300に供給する。
スペクトル符号化処理部300は、スペクトル正規化部240から供給された正規化スペクトルに対して符号化処理を施すものである。このスペクトル符号化処理部300は、語長情報生成部250、振幅変動量算出部260および符号化帯域設定部270からの出力に基づいて、スペクトル正規化部240からの正規化スペクトルを符号化する。
このスペクトル符号化処理部300は、語長情報生成部250からの語長情報に基づいて分割帯域における正規化スペクトルを変換することによって、量子化値である整数データを分割帯域ごとに生成する。また、スペクトル符号化処理部300は、振幅変動量算出部260からの振幅変動判定フラグに基づいて、複数の符号化アルゴリズムのうち1つの符号化アルゴリズムを選択する。
また、スペクトル符号化処理部300は、その選択された符号化アルゴリズムにより、生成した整数データを符号化する。また、スペクトル符号化処理部300は、信号線301を介して、その符号化された整数データを符号化データとして多重化部290に供給する。
振幅基準値符号化部280は、振幅基準値生成部220からの各分割帯域に対する振幅基準値を符号化するものである。この振幅基準値符号化部280は、その符号化された振幅基準値を多重化部290に供給する。
多重化部290は、スペクトル符号化処理部300からの符号化データと、振幅基準値符号化部280からの符号化された振幅基準値と、符号化帯域設定部270からの符号化帯域数とを1つの符号列(ビットストリーム)に多重化するものである。すなわち、この多重化部290は、これらの符号化データと、符号化された振幅基準値と、符号化帯域数とを時間分割により多重化することによって、音響符号化データを生成する。また、多重化部290は、その生成された音響符号化データを、1つの符号列として符号列出力線201に出力する。
このように、振幅変動量算出部260を設けることによって、近傍の分割帯域に比べて振幅基準値が大きい分割帯域を、振幅変動量が大きい分割帯域と判定することができる。これにより、音響信号符号化装置200は、振幅変動量に応じた符号化アルゴリズムにより、量子化値である整数データを符号化することができる。ここで、振幅変動量算出部260により各分割帯域に対する振幅変動量の判定例について以下に図面を参照して説明する。
[振幅変動量算出部260による振幅変動量の判定例]
図3は、本発明の第1の実施の形態における振幅変動量算出部260により各分割帯域に対する振幅変動量の判定例を示す図である。図3(a)は、振幅変動量算出部260により、振幅基準値に基づいて分割帯域における周波数スペクトルの振幅変動量が大きいと判定された振幅変動大分割帯域262乃至268を概念的に示す図である。図3(b)は、図3(a)に示した振幅変動大分割帯域263の近傍を示す拡大図である。
ここでは、1フレームを周波数スペクトルに変換するための変換長を256とする。すなわち、周波数スペクトル生成部210により、1フレームに対して256本の周波数スペクトルが生成される。また、ここでは、横軸を周波数に相当する周波数番号fとし、縦軸を振幅スペクトルとする。この振幅スペクトルは、周波数スペクトルの大きさ(レベル)を対数表現により表わしたものである。
図3(a)には、周波数スペクトルX[m]211と、振幅基準値Ar[i]に基づく量子化振幅情報線A(q)i221と、振幅変動大分割帯域262乃至268とが示されている。また、ここでは、各分割帯域における周波数スペクトルの本数を示す分割帯域幅W2、W4、W8およびW16がそれぞれ示されている。
実線により示される周波数スペクトル211は、周波数スペクトル生成部210により音響信号に基づいて生成された周波数スペクトルの一例である。この周波数スペクトル211は、近傍の周波数スペクトルに比べて極めて狭い帯域幅において周波数スペクトルの振幅が著しく大きくなるようなパルス的な波形を数多く含む。また、周波数スペクトル211は、大局的には、周波数が高くなるほど振幅スペクトルは徐々に小さくなる。
破線により示される量子化振幅情報線221は、振幅基準値生成部220により生成された各分割帯域に対する振幅基準値に基づく量子化振幅情報を示す線である。この量子化振幅情報線221は、所定の分割帯域の各々に含まれる周波数スペクトルの最大レベルに基づいて振幅基準値が生成されるため、周波数スペクトルに対する大局的なスペクトル包絡を示す。
振幅変動大分割帯域262乃至268は、式4に示す2つの条件式のうち少なくとも1つの条件式を満足する分割帯域であって、振幅変動量算出部260により振幅基準値の振幅変動量が大きいと判定された分割帯域である。すなわち、振幅変動大分割帯域262乃至268は、隣接する分割帯域の振幅基準値に比べて、振幅基準値がある程度大きい分割帯域である。
このように、振幅変動量算出部260により、式4に基づいて判定された振幅変動大分割帯域262乃至268においては、周波数スペクトル211のパルス的な波形が含まれるため、他の分割帯域に比べて周波数スペクトルのレベル差は大きくなる。ここで、一例として、振幅変動大分割帯域263における周波数スペクトルのレベル差について、図3(b)を参照して簡単に説明する。
図3(b)には、図3(a)に示した振幅変動大分割帯域263における周波数スペクトルの極大点222および極小点223が示されている。また、振幅変動大分割帯域263の帯域幅BWは、分割帯域幅W8の周波数帯域内であるため、8本の周波数スペクトルに対応する帯域幅である。
極大点222は、振幅変動大分割帯域263の帯域幅BWに含まれる周波数スペクトルのうち、振幅が最も大きい周波数スペクトルの振幅レベルを示す。この極大点222により、音響信号の周波数特性におけるパルス的な波形が形成される。
極小点223は、振幅変動大分割帯域263の帯域幅BWに含まれる周波数スペクトルのうち、振幅が最も小さい周波数スペクトルの振幅レベルを示す。この極小点223は、近傍の周波数スペクトルの振幅とほぼ同程度の振幅レベルを示す。
このように、振幅変動大分割帯域263における周波数スペクトルのレベル差ΔAは、振幅変動大分割帯域262乃至268以外の分割帯域に比べて、大きいことが分かる。すなわち、複数の分割帯域のうち近傍の分割帯域に比べて振幅基準値が大きい分割帯域においては、その分割帯域における極一部の周波数スペクトルの振幅のみが著しく大きくなる傾向があるため、分割帯域における周波数スペクトルのレベル差が大きくなる。
このように、本発明の第1の実施の形態では、振幅変動量算出部260を設けることによって、式4に示す条件式に基づいて近傍の分割帯域に対する振幅基準値を基準にして振幅変動量の大きい分割帯域262乃至268を判定することができる。これにより、分割帯域における周波数スペクトルのレベル差の大きい分割帯域262乃至268を特定することができる。次に、分割帯域における周波数スペクトルのレベル差に応じた量子化値の出現確率分布の解析結果について以下に図面を参照して説明する。
[周波数スペクトルの振幅変動量と量子化値の出現確率分布との関係]
図4は、振幅変動量算出部260により振幅変動量が大きいと判定された分割帯域のうち、分割帯域幅W4における分割帯域に対応する量子化値の出現確率分布の一例を示す図である。
ここでは、全体出現確率分布811と、振幅変動大812と、振幅変動小813とが示されている。この例では、値域が「−1」乃至「1」の正規化スペクトルが、均等量子化により「−31」乃至「31」の量子化値に変換された場合における量子化値の出現確率分布を示す。また、ここでは、横軸を量子化値とし、縦軸を出現確率とする。
点線により示される全体出現確率分布811は、分割帯域幅W4の全分割帯域における量子化値の出現確率分布である。この全体出現確率分布811は、出現確率分布の偏りが比較的小さい平坦な分布を示す。
破線により示される振幅変動大812は、振幅変動量算出部260によって、式4に基づいて振幅変動量が大きいと判定された分割帯域における量子化値の出現確率分布である。すなわち、この振幅変動大812は、振幅変動量が大きい分割帯域における量子化値の出現確率分布である。この振幅変動大812は、量子化値の出現確率分布の偏り度合いが大きく、量子化値「0」付近の出現確率が高い。
実線により示される振幅変動小813は、振幅変動量算出部260により、式4のいずれの条件も満足しないことから、振幅変動量が大きいと判定されなかった分割帯域における量子化値の出現確率分布である。すなわち、この振幅変動小813は、周波数スペクトルのレベル差の小さい平坦な波形を示す分割帯域における出現確率分布である。この振幅変動小813は、量子化値の出現確率分布の偏り度合いが小さい平坦な出現確率分布を示す。
このように、分割帯域幅W4における分割帯域のうち、振幅変動量算出部260によって振幅変動量が大きいと判定された分割帯域に対応する量子化値の出現確率分布の偏り度合いは大きく、量子化値「0」近傍の出現確率が大きくなる。次に、分割帯域幅W8における分割帯域に対応する量子化値の出現確率分布について以下に図面を参照して説明する。
図5は、振幅変動量算出部260により振幅変動量が大きいと判定された分割帯域のうち、分割帯域幅W8における分割帯域に対応する量子化値の出現確率分布の一例を示す図である。
ここでは、全体出現確率分布821と、振幅変動大822と、振幅変動小823とが示されている。この例では、図4と同様に、値域が「−1」乃至「1」の正規化スペクトルが、均等量子化により「−31」乃至「31」の量子化値に変換された場合における量子化値の出現確率分布を示す。また、ここでは、横軸を量子化値とし、縦軸を出現確率とする。
点線により示される全体出現確率分布821は、分割帯域幅W8の全分割帯域における量子化値の出現確率分布である。この全体出現確率分布821は、図4に示した全体出現確率分布811と同様に、出現確率分布の偏りが比較的小さい平坦な分布を示す。
破線により示される振幅変動大822は、振幅変動量算出部260によって、式4に基づいて振幅変動量が大きいと判定された分割帯域における量子化値の出現確率分布である。この振幅変動大822は、図4に示した振幅変動大812と同様に、量子化値の出現確率分布の偏り度合いが大きく、量子化値「0」付近の出現確率が高い。
実線により示される振幅変動小823は、振幅変動量算出部260により、式4のいずれの条件も満足しないことから、振幅変動量が大きいと判定されなかった分割帯域における量子化値の出現確率分布である。この振幅変動小823は、図4に示した振幅変動大812と同様に、量子化値の出現確率分布の偏り度合いが小さい平坦な出現確率分布を示す。
このように、分割帯域幅W8における分割帯域においても、振幅変動量算出部260によって振幅変動量が大きいと判定された分割帯域に対応する量子化値の出現確率分布の偏り度合いは大きく、量子化値「0」近傍の出現確率が大きくなる。また、分割帯域幅W4における振幅変動大812に比べて、分割帯域幅W4における振幅変動大822の方が、量子化値「0」付近の出現確率が高く、出現確率分布の偏り度合いが大きい。次に、分割帯域幅W16における分割帯域に対応する量子化値の出現確率分布について以下に図面を参照して説明する。
図6は、振幅変動量算出部260により振幅変動量が大きいと判定された分割帯域のうち、分割帯域幅W16における分割帯域に対応する量子化値の出現確率分布の一例を示す図である。
ここでは、全体出現確率分布831と、振幅変動大832と、振幅変動小833とが示されている。この例では、図4および図5と同様に、値域が「−1」乃至「1」の正規化スペクトルが、均等量子化により「−31」乃至「31」の量子化値に変換された場合における量子化値の出現確率分布を示す。また、ここでは、横軸を量子化値とし、縦軸を出現確率とする。
点線により示される全体出現確率分布831は、分割帯域幅W8の全分割帯域における量子化値の出現確率分布である。この全体出現確率分布831は、図4および図5に示した全体出現確率分布811および821と同様に、出現確率分布の偏りが比較的小さい平坦な分布を示す。
破線により示される振幅変動大832は、振幅変動量算出部260によって、式4に基づいて振幅変動量が大きいと判定された分割帯域における量子化値の出現確率分布である。この振幅変動大832は、図4および図5に示した振幅変動大812および813と同様に、量子化値の出現確率分布の偏り度合いが大きく、量子化値「0」付近の出現確率が高い。
実線により示される振幅変動小833は、振幅変動量算出部260により、式4のいずれの条件も満足しないことから、振幅変動量が大きいと判定されなかった分割帯域における量子化値の出現確率分布である。この振幅変動小833は、図4および図5に示した振幅変動大812および822と同様に、量子化値の出現確率分布の偏り度合いが小さい平坦な出現確率分布を示す。
このように、分割帯域幅W16における振幅変動大832は、分割帯域幅W8における振幅変動大822と略等しい出現確率分布を示す。また、分割帯域幅W16における分割帯域においても、振幅変動量算出部260によって振幅変動量が大きいと判定された分割帯域に対応する量子化値の出現確率分布の偏り度合いは大きく、量子化値「0」の近傍の出現確率が大きくなる。
したがって、分割帯域幅に拘らず、振幅変動量算出部260によって振幅変動量が大きいと判定された分割帯域に対応する量子化値の出現確率分布の偏り度合いは大きくなり、量子化値「0」近傍の出現確率が大きくなる。このため、複数のパルス的な波形を示す周波数スペクトルを符号化する場合は、一意の符号化アルゴリズムにより量子化値を符号化すると、分割帯域ごとに量子化値の出現確率分布の偏り度合いが異なるため、符号化効率を著しく低下させる場合がある。
ここで、複数の符号化アルゴリズムのうち、分割帯域における周波数スペクトルの振幅変動量に応じた符号化アルゴリズムにより量子化値を符号化するスペクトル符号化処理部300の構成例について、以下に図面を参照して説明する。
[スペクトル符号化処理部300の構成例]
図7は、本発明の第1の実施の形態におけるスペクトル符号化処理部300の一構成例を示すブロック図である。
スペクトル符号化処理部300は、整数データ生成部310と、符号化部320と、符号化選択部330と、第1および第2符号化テーブル340および350とを備える。この例では、複数の符号化アルゴリズムとして、第1および第2符号化テーブル340および350に基づく2つのハフマン符号化アルゴリズムによって、周波数スペクトルの量子化値を符号化することを想定する。
整数データ生成部310は、信号線251を介して供給される語長情報に基づいて、信号線241を介してスペクトル正規化部240から供給される正規化スペクトルを分割帯域ごとに量子化値に変換することによって、整数データを生成するものである。この整数データ生成部310は、分割帯域ごとに、量子化精度を決定する語長情報に従って、一定の関数により正規化スペクトルを整数データに変換する。
この整数データ生成部310は、例えば、第i番の分割帯域に対応する語長情報WL[i]に従って、次式に示す関数Fにより、第i番の分割帯域に対応する整数データI[m]を生成する。ここでは、語長情報WL[i]を符号無しの量子化ビット数とする。
Figure 2011022435
ここで、関数Fは、例えば、次式により表わすことができる。
Figure 2011022435
この式5および式6により、値域「1」乃至「−1」の正規化スペクトルN[m]は、語長情報WL[i]に基づいて、整数データI[m]の量子化値に変換される。例えば、語長情報WL[i]が「2」を示す場合には、第i番の分割帯域に対応する正規化スペクトルは、値域が「−3」乃至「3」の整数データI[m]に変換される。
また、整数データ生成部310は、信号線271を介して符号化帯域設定部270から供給される符号化帯域数により符号化すべき分割帯域を特定して、その特定された分割帯域における正規化スペクトルを整数データに変換する。また、整数データ生成部310は、その変換された整数データを分割帯域ごとに符号化部320に供給する。
符号化部320は、入力信号における周波数スペクトルの量子化値を、複数の符号化アルゴリズムにより符号化するものである。この符号化部320は、第1および第2符号化テーブル340および350のうち、いずれか一方の符号化テーブルに保持された符号表を参照して、整数データ生成部310からの量子化値である整数データを符号化する。すなわち、符号化部320は、2つの符号化アルゴリズムのうちいずれか一方により、整数データ生成部310からの整数データを符号化する。
また、符号化部320は、信号線271からの符号化帯域数によって特定される符号化すべき分割帯域における整数データを、分割帯域ごとに符号化する。また、符号化部320は、その符号化された整数データを符号化データとして信号線301に出力する。なお、符号化部320は、特許請求の範囲に記載の符号化部の一例である。
第1および第2符号化テーブル340および350は、ハフマン符号化により事前に生成された符号表を保持する符号化テーブルである。第1符号化テーブル340は、分割帯域における出現確率分布の偏り度合いが小さい量子化値である整数データを符号化するための符号表を保持する。この第1符号化テーブル340に保持された符号表は、図4乃至図6に示した振幅変動量小813乃至833に基づく量子化値の出現確率分布を用いて事前に生成される。また、第1符号化テーブル340は、その保持している符号表を符号化選択部330に出力する。
第2符号化テーブル350は、分割帯域における出現確率分布の偏り度合いが大きい量子化値である整数データを符号化するための符号表を保持する。この第2符号化テーブル350に保持された符号表は、事前に、図4乃至図6に示した振幅変動量大812乃至832に基づく量子化値の出現確率分布によって生成される。また、第2符号化テーブル350は、その保持している符号表を符号化選択部330に出力する。
符号化選択部330は、信号線261を介して振幅変動量算出部260から供給された振幅変動判定フラグに基づいて、第1および第2符号化テーブル340および350からの出力のうち、いずれか一方を選択するものである。この符号化選択部330は、振幅基準値の振幅変動量が大きい旨を示す振幅変動判定フラグが供給された場合には、分割帯域における出現確率分布の偏り度合いが大きい量子化値を符号化するための符号表が保持された第2符号化テーブル350の出力を選択する。
一方、符号化選択部330は、振幅基準値の振幅変動量が小さい旨を示す振幅変動判定フラグが供給された場合には、出現確率分布の偏り度合いが小さい量子化値を符号化するための符号表が保持された第1符号化テーブル340の出力を選択する。すなわち、この符号化選択部330は、複数の符号化アルゴリズムのうち、振幅変動量における量子化値の出現確率分布の偏り度合いに応じた符号化アルゴリズムを選択する。
具体的には、符号化選択部330は、例えば、振幅変動判定フラグが「1」に設定されている場合には、第2符号化テーブル350の出力を選択し、幅変動量判定フラグが「0」に設定されている場合には、第1符号化テーブル340の出力を選択する。
また、符号化選択部330は、その選択された第1または第2符号化テーブル340または350の出力を符号化部320に供給する。すなわち、符号化選択部330は、その選択された第1または第2符号化テーブル340または350の出力を符号化部320に参照させることによって、振幅変動量の大きさに応じた符号化データを符号化部320に生成させる。なお、符号化選択部330は、特許請求の範囲に記載の符号化選択部の一例である。
このように、2つの第1および第2符号化テーブル340および350を設けることによって、量子化値の出現確率分布の偏り度合いに応じて符号化データを生成することができる。また、符号化選択部330を設けることによって、近傍の分割帯域に対する振幅基準値に基づいて生成された振幅変動量により量子化値の出現確率分布の偏り度合いに応じた符号化アルゴリズムを選択することができる。
これにより、音響信号符号化装置200は、符号化部320により生成される符号化データの符号化効率を向上させることができる。なお、ここでは、2つの第1および第2符号化テーブル340および350を設ける例について説明したが、3つ以上の符号化テーブルを設けるようにしてもよい。この場合には、分割帯域に対する振幅変動量の判定基準を3段階以上設定して、その判定結果に応じて複数の符号化テーブルを切り替える。これにより、振幅変動量における量子化値の出現確率分布の変化に対して、より柔軟な符号化処理を実現することができる。
[音響信号符号化装置200の動作例]
次に本発明の第1の実施の形態における音響信号符号化装置200の動作について図面を参照して説明する。
図8は、本発明の第1の実施の形態における音響信号符号化装置200の符号化方法における処理手順例を示すフローチャートである。
まず、周波数スペクトル生成部210により、音響信号を周波数成分に変換することによって、周波数スペクトルが生成される(ステップS911)。そして、スペクトル正規化部240により、量子化振幅情報算出部230からの量子化振幅情報と、周波数スペクトル生成部210からの周波数スペクトルに基づいて正規化スペクトルを生成する正規化スペクトル処理が実行される(ステップS920)。続いて、振幅基準値符号化部280により、振幅基準値生成部220により生成された振幅基準値が符号化される(ステップS912)。
この後、振幅変動量算出部260により、各分割帯域に対する振幅基準値により算出された振幅変動量に基づいて振幅変動判定処理が実行される(ステップS930)。そして、スペクトル符号化処理部300により、各分割帯域に対する振幅変動量における量子化値の出現確率分布に応じた符号化処理が実行される(ステップS940)。そして、多重化部290により、振幅情報符号化処理において符号化された振幅基準値と、スペクトル符号化処理において生成された符号化データが多重化されて(ステップS913)、符号化処理方法の処理手順が終了する。
[正規化スペクトル生成処理の処理手順例]
図9は、本発明の第1の実施の形態における音響信号符号化装置200による正規化スペクトル生成処理(ステップS920)の処理手順例を示すフローチャートである。
まず、振幅基準値生成部220により、周波数スペクトル生成部210により生成された周波数スペクトルが周波数分割されて、所定の分割帯域ごとに周波数スペクトルが抽出される(ステップS921)。そして、振幅基準値生成部220により、分割帯域ごとに抽出された周波数スペクトルの最大レベルに基づいて、各分割帯域に対する振幅基準値Ar[i]が生成される(ステップS922)。
この後、量子化振幅情報算出部230により、分割帯域に対する振幅基準値に基づいてその分割帯域に対する量子化振幅情報が分割帯域ごとに算出される(ステップS923)。続いて、スペクトル正規化部240により、分割帯域ごとに、分割帯域に対応する量子化振幅情報に基づいて、その分割帯域に対応する周波数スペクトルが正規化されて、正規化スペクトルが生成されて(ステップS924)、正規化スペクトル生成処理が終了する。
[振幅変動判定処理の処理手順例]
図10は、本発明の第1の実施の形態における振幅変動量算出部260による振幅変動判定処理(ステップS930)の処理手順例を示すフローチャートである。
まず、符号化帯域設定部からの符号化帯域数NCに基づいて、振幅変動判定フラグAmFlag[0]乃至[NC−1]が「0」に設定される(ステップS931)。そして、分割帯域番号iが「1」に設定されることによって、第1番の分割帯域が、判定対象の分割帯域として設定される(ステップS932)。これらのステップS931およびS932の処理により振幅変動判定処理の初期化が終了する。
この後、式4の上段の条件式に基づいて、第1番の分割帯域に対する振幅基準値Ar[1]から、低域側に隣接する第0番の分割帯域に対する振幅基準値Ar[0]を減算した減算値が第1変動量閾値Th1以上であるか否かが判断される(ステップS933)。そして、減算値が第1変動量閾値Th1以上である場合には、第1番の分割帯域が振幅変動量の大きい分割帯域と判定されて、第1番の分割帯域に対する振幅変動判定フラグAmFlag[1]に「1」が設定される(ステップS938)。
一方、減算値が第1変動量閾値Th1未満である場合には、式4の下段の条件式を満足するか否かが判断される(ステップS934)。すなわち、分割帯域番号「i=1」が最大の分割帯域番号(NC−1)未満であり、かつ、振幅基準値Ar[1]に「2」を乗じた乗算値から、振幅基準値Ar[0]および[2]の和を減算した値が第2変動量閾値Th2以上であるか否かが判断される。
そして、式4の下段の条件式を満足する場合には、第1番の分割帯域が振幅変動量の大きい分割帯域と判定されて、第1番の分割帯域に対する振幅変動判定フラグAmFlag[1]に「1」が設定される(ステップS938)。一方、式4の下段の条件式を満足しない場合には、第1番の分割帯域が振幅変動量の大きい分割帯域でないと判定されて、第1番の分割帯域に対する振幅変動判定フラグAmFlag[1]に「0」が設定される(ステップS935)。
このように、ステップS933およびS934の処理により、入力信号における周波数スペクトルに対する各分割帯域の振幅基準値によるスペクトル包絡に基づいて、振幅変動量が算出される。なお、ステップS933およびS934は、特許請求の範囲に記載の振幅変動量算出手順の一例である。
そして、分割帯域番号を「1」増加させるために、分割帯域番号「1」に「1」を加えた値「2」が分割帯域番号iに設定される(ステップS936)。この後、分割帯域番号iが符号化帯域数NCと一致するか否かが判断される(ステップS937)。そして、分割帯域番号iが符号化帯域数NCと一致しない場合には、符号化帯域数NCに一致するまで、ステップS933乃至S936およびS938の一連の処理が繰り返される。一方、分割帯域番号iが符号化帯域数NCと一致した場合には、振幅変動判定処理が終了する。
[スペクトル符号化処理の処理手順例]
図11は、本発明の第1の実施の形態におけるスペクトル符号化処理部300によるスペクトル符号化処理(ステップS940)の処理手順例を示すフローチャートである。
まず、語長情報生成部250により、ステップS922の処理において生成された各分割帯域の振幅基準値に基づいて、各分割帯域に対する語長情報が生成される(ステップS941)。そして、整数データ生成部310により、ステップS924の処理において生成された正規化スペクトルが、各分割帯域に対する語長情報に基づいて変換されることによって、分割帯域ごとに整数データが生成される(ステップS942)。
次に、分割帯域番号iが「0」に設定される(ステップS943)。続いて、符号化選択部330により、第0番の分割帯域に対する振幅変動判定フラグAmFlag[0]が「0」であるか否かが判断される(ステップS944)。
そして、振幅変動判定フラグAmFlag[0]が「0」である場合には、振幅変動量が小さい分割帯域であるため、符号化選択部330により、第1符号化テーブル340に保持された符号表が選択される(ステップS945)。すなわち、符号化選択部330により、第1符号化テーブル340の出力として、出現確率分布の偏り度合いが小さい量子化値である整数データを符号化するための符号表が選択される。
一方、振幅変動判定フラグAmFlag[0]が「1」である場合には、振幅変動量が大きい分割帯域であるため、符号化選択部330により、第2符号化テーブル350に保持された符号表が選択される(ステップS949)。すなわち、符号化選択部330により、第2符号化テーブル350の出力として、出現確率分布の偏り度合いが大きい分割帯域における量子化値である整数データを符号化するための符号表が選択される。
このように、ステップS944、S945およびS949の処理により、複数の符号化アルゴリズムのうち、振幅変動量における量子化値の出現確率分布の偏り度合いに応じた符号化アルゴリズムが選択される。なお、ステップS944、S945およびS949は、特許請求の範囲に記載の符号化選択手順の一例である。
この後、符号化部320により、符号化選択部330において選択された第1または第2符号化テーブルに保持された符号表に基づいて、第0番の分割帯域に対応する整数データが符号化される(ステップS946)。これにより、第0番の分割帯域に対応する符号化データが生成される。すなわち、符号化選択部330により選択された符号化アルゴリズムにより周波数スペクトルの量子化値が符号化される。なお、ステップS946は、特許請求の範囲に記載の符号化手順の一例である。
そして、分割帯域番号を「1」増加させるために、分割帯域番号「0」に「1」を加えた値「1」が分割帯域番号iに設定される(ステップS947)。この後、分割帯域番号iが符号化帯域数NCと一致するか否かが判断される(ステップS948)。そして、分割帯域番号iが符号化帯域数NCと一致しない場合には、符号化帯域数NCに一致するまで、ステップS944乃至S947およびS949の一連の処理が繰り返される。一方、分割帯域番号iが符号化帯域数NCと一致した場合には、スペクトル符号化処理が終了する。
このように、本発明の第1の実施の形態では、振幅変動量算出部260により、近傍の分割帯域の振幅基準値に基づいて各分割帯域の振幅変動量を算出することによって、近傍の分割帯域に比べて振幅基準値が一定の大きさを超える分割帯域を判定することができる。これにより、音響信号符号化装置200は、分割帯域ごとに、量子化値の出現確率分布の偏り度合いに応じた符号化を行うことによって、符号化効率を向上させることができる。
<2.第2の実施の形態>
[音響信号復号装置400の構成例]
図12は、本発明の第2の実施の形態における音響信号復号装置400の一構成例を示すブロック図である。
音響信号復号装置400は、符号列分離部410と、振幅基準値復号部420と、振幅変動量算出部460と、語長情報生成部450と、スペクトル復号処理部500とを備える。また、音響信号復号装置400は、さらに、量子化振幅情報算出部430と、スペクトル逆正規化部440と、音響信号生成部470とを備える。
符号列分離部410は、符号列入力線202から供給された符号列である音響符号化データを、符号化データ、符号化された振幅基準値および符号化帯域数に分離するものである。この符号列分離部410は、信号線411を介して、音響信号が符号化された符号化データを分割帯域ごとにスペクトル復号処理部500に供給する。
また、符号列分離部410は、信号線412を介して、分割帯域の上限を示す符号化帯域数を、スペクトル復号処理部500、振幅基準値復号部420、振幅変動量算出部460および語長情報生成部450に供給する。また、符号列分離部410は、信号線413を介して、各分割帯域に対する符号化された振幅基準値を振幅基準値復号部420に供給する。
振幅基準値復号部420は、信号線413からの符号化された各分割帯域の振幅基準値を復号するものである。この振幅基準値復号部420は、その復号された各分割帯域の振幅基準値を、振幅変動量算出部460、語長情報生成部450および量子化振幅情報算出部430に供給する。
振幅変動量算出部460は、振幅基準値復号部420から供給される各分割帯域に対する振幅基準値に基づいて、分割帯域に対する振幅変動量を算出するものである。この振幅変動量算出部460は、図2に示した音響信号符号化装置200における振幅変動量算出部260に対応する。すなわち、この振幅変動量算出部460は、音響信号符号化装置200における振幅変動量算出部260と同一条件により、各分割帯域に対する振幅変動量を算出する。
この振幅変動量算出部460は、複数の分割帯域のうち、所定の分割帯域である変動量算出帯域に対する振幅基準値に基づいて、振幅変動量を分割帯域ごとに算出する。この振幅変動量算出部460は、例えば、振幅変動量の算出対象である分割帯域の近傍における各分割帯域を変動量算出帯域として、この変動量算出帯域に対するそれぞれの振幅基準値に基づいて、周波数スペクトルに関する振幅変動量を算出する。この例において、振幅変動量算出部460は、例えば、変動量算出帯域として、隣接する分割帯域に対する振幅基準値の差分に基づいて、分割帯域に対する振幅変動量を算出する。
なお、振幅変動量算出部460は、音響信号符号化装置200における振幅変動量算出部260と同一の機能であるため、ここでの詳細な説明を省略する。また、振幅変動量算出部460は、特許請求の範囲に記載の音響信号復号装置における振幅変動量算出部の一例である。
語長情報生成部450は、振幅基準値復号部420からの各分割帯域に対応する振幅基準値に基づいて、量子化精度を決定する語長情報を分割帯域ごとに生成するものである。この語長情報生成部450は、図2に示した音響信号符号化装置200における語長情報生成部250と同様の機能を有する。すなわち、この語長情報生成部450は、語長情報生成部250と同一条件により、各分割帯域に対する語長情報を生成する。
この語長情報生成部450は、例えば、全ての振幅基準値に対して人間の聴覚特性を考慮した重み付けを行うことによって、各分割帯域に対する語長情報を生成する。また、語長情報生成部450は、その生成された語長情報を、信号線451を介してスペクトル復号処理部500に供給する。
スペクトル復号処理部500は、入力信号における周波数スペクトルの量子化値が符号化された符号化データを、複数の復号アルゴリズムにより復号するものである。また、スペクトル復号処理部500は、図2に示したスペクトル符号化処理部300に対応するものである。
このスペクトル復号処理部500は、語長情報生成部450および振幅変動量算出部460からの各分割帯域の語長情報および振幅変動判定フラグと、符号列分離部410からの符号化帯域数とに基づいて、符号列分離部410からの符号化データを復号する。
このスペクトル復号処理部500は、振幅変動量算出部460からの振幅変動判定フラグに基づいて、複数の復号アルゴリズムのうち1つの復号アルゴリズムを選択する。また、スペクトル復号処理部500は、その選択された復号アルゴリズムにより符号化データを復号することによって、量子化値である整数データを生成する。
また、スペクトル復号処理部500は、語長情報生成部450からの語長情報に基づいて分割帯域における整数データを変換することによって、正規化スペクトルを生成する。また、スペクトル復号処理部500は、その生成された正規化スペクトルをスペクトル逆正規化部440に供給する。
量子化振幅情報算出部430は、振幅基準値復号部420から供給された振幅基準値に基づいて、正規化スペクトルを周波数スペクトルに変換するための量子化振幅情報を算出するものである。この量子化振幅情報算出部430、図2に示した音響信号符号化装置200における量子化振幅情報算出部230と同様の機能を有する。すなわち、この量子化振幅情報算出部430は、音響信号符号化装置200における量子化振幅情報算出部230と同一条件により、各分割帯域に対する量子化振幅情報を算出する。
この量子化振幅情報算出部430は、例えば、式2に基づいて、各分割帯域に対する量子化振幅情報A(q)iを算出する。また、量子化振幅情報算出部230は、式3に基づいて算出された各分割帯域に対する量子化振幅情報A(q)iを、スペクトル逆正規化部440に供給する。
スペクトル逆正規化部440は、量子化振幅情報算出部430からの量子化振幅情報に基づいて、スペクトル復号処理部500からの正規化スペクトルを逆正規化することによって、周波数スペクトルを生成するものである。このスペクトル逆正規化部440は、例えば、次式により、第i番の分割帯域に対する量子化振幅情報A(q)iと、第i番の分割帯域に対応する各正規化スペクトルのレベルN'[m]とを乗算することによって、周波数スペクトルのレベルX'[m]を算出する。
Figure 2011022435
また、スペクトル逆正規化部440は、上式に基づいて算出された周波数スペクトルX'[m]を分割帯域ごとに音響信号生成部470に供給する。
音響信号生成部470は、スペクトル逆正規化部440から供給された全周波数帯域における周波数スペクトルである周波数領域のデータを時間領域の信号に変換することによって、音響信号を生成するものである。
この音響信号生成部470は、例えば、周波数スペクトルに対して高速フーリエ逆変換を行うことによって、フレーム単位により音響信号を生成する。その他の例として、この音響信号生成部470は、逆修正離散余弦変換により音響信号をフレーム単位により生成する。また、音響信号生成部470は、その生成された音響信号を音響信号出力線401に供給する。すなわち、音響信号生成部470は、音響信号出力線401を介して、スピーカ600に音響信号を供給する。
このように、音響信号復号装置400は、音響信号符号化装置200における振幅変動量算出部260と同様の構成の振幅変動量算出部460を設けることによって、振幅基準値に基づいて、スペクトル符号化処理部300に対応する復号処理を実現することができる。ここで、図7に示したスペクトル符号化処理部300に対応するスペクトル復号処理部500の構成例を以下に図面を参照して説明する。
[スペクトル復号処理部500の構成例]
図13は、本発明の第2の実施の形態におけるスペクトル復号処理部500の一構成例を示すブロック図である。このスペクトル復号処理部500は、復号部510と、第1および第2復号テーブル520および530と、復号選択部540と、正規化スペクトル生成部550とを備える。
復号部510は、入力信号における周波数スペクトルの量子化値が符号化された符号化データを、複数の復号アルゴリズムにより復号するものである。この復号部510は、第1および第2復号テーブル520および530のうち、いずれか一方の符号化テーブルに保持された符号表を参照して、信号線411を介して符号列分離部410から供給された符号化データを復号する。すなわち、復号部510は、2つの復号アルゴリズムのうちいずれか一方により、符号化データを復号する。
また、復号部510は、信号線412を介して符号列分離部410から供給された符号化帯域数により特定される復号すべき分割帯域に対応する符号化データを復号する。また、復号部510は、その復号された符号化データを量子化値である整数データとして正規化スペクトル生成部550に供給する。なお、復号部510は、特許請求の範囲に記載の復号部の一例である。
第1および第2復号テーブル520および530は、ハフマン符号化により事前に生成された符号表を復号表として保持する復号テーブルである。この第1および第2復号テーブル520および530は、図7に示した第1および第2符号化テーブル340および350にそれぞれ対応する。すなわち、この第1および第2復号テーブル520および530は、第1および第2符号化テーブル340および350に保持された符号表と同一の符号表を復号表として保持する。
第1復号テーブル520は、分割帯域における出現確率分布の偏り度合いが小さい量子化値である整数データを符号化するための符号表に対応する復号表を保持する。また、第1復号テーブル530は、その保持された復号表を復号選択部540に出力する。
第2復号テーブル530は、分割帯域における出現確率分布の偏り度合いが大きい量子化値である整数データを符号化するための符号表に対応する復号表を保持する。また、第2復号テーブル530は、その保持された復号表を復号選択部540に出力する。
復号選択部540は、信号線461を介して振幅変動量算出部460から供給された振幅変動判定フラグに基づいて、第1および第2復号テーブル520および530からの出力のうち、いずれか一方を選択するものである。この復号選択部540は、分割帯域に対する振幅基準値の振幅変動量が大きい旨を示す振幅変動判定フラグが供給された場合には、第2復号テーブル530に保持された復号表を選択する。
一方、復号選択部540は、分割帯域に対する振幅基準値の振幅変動量が小さい旨を示す振幅変動判定フラグが供給された場合には、第1復号テーブル520に保持された復号表を選択する。すなわち、この復号選択部540は、複数の復号アルゴリズムのうち、振幅変動量における量子化値の出現確率分布の偏り度合いに応じた復号アルゴリズムを選択する。
具体的には、復号選択部540は、例えば、振幅変動判定フラグが「1」に設定されている場合には、第2復号テーブル530に保持された復号表を選択する。一方、復号選択部540は、振幅変動量判定フラグが「0」に設定されている場合には、第1復号テーブル520に保持された復号表を選択する。
また、復号選択部540は、その選択された第1または第2復号テーブル520または530に保持された復号表を復号部510に供給する。なお、復号選択部540は、特許請求の範囲に記載の復号選択部の一例である。
正規化スペクトル生成部550は、信号線451を介して供給される語長情報に基づいて、復号部510から供給される量子化値である整数データを分割帯域ごとに変換することによって、正規化スペクトルを生成するものである。この正規化スペクトル生成部550は、分割帯域ごとに、符号化時と同一の語長情報に従って、一定の関数により整数データを正規化スペクトルに変換する。
この正規化スペクトル生成部550は、例えば、第i番の分割帯域に対応する語長情報WL[i]に従って、次式に示す関数Fにより、第i番の分割帯域に対応する整数データI[m]を正規化スペクトルN'[m]に変換する。ここでは、語長情報WL[i]を符号無しの量子化ビット数とする。
Figure 2011022435
ここで、式6に示した関数Fに対応する関数Fは、例えば、次式により表わすことができる。
Figure 2011022435
この式8および式9により、語長情報WL[i]に基づいて、量子化値である整数データI[m]が、値域「1」乃至「−1」の正規化スペクトルN'[m]に変換される。例えば、語長情報WL[i]が「2」を示す場合には、第i番の分割帯域に対応する値域「−3」乃至「3」の整数データI[m]が、正規化スペクトルN'[m]に変換される。
また、正規化スペクトル生成部550は、信号線412を介して符号列分離部410から供給される符号化帯域数によって特定される符号化すべき分割帯域に対応する整数データに限り、正規化スペクトルに変換する。また、正規化スペクトル生成部550は、その変換された正規化スペクトルを分割帯域ごとに信号線501を介してスペクトル逆正規化部440に供給する。
このように、第1および第2符号化テーブル340および350に対応する第1および第2復号テーブル520および530を設けることによって、音響信号符号化装置200により生成された符号化データを復号することができる。また、復号選択部540を設けることによって、音響信号符号化装置200における符号化選択部330と同様に第1および第2復号テーブル520および530を選択することができるため、適切な復号処理を実行することができる。
また、音響信号復号装置400は、振幅基準値に基づいて復号アルゴリズムを選択するため、各分割帯域に適用した符号化に関する付加情報を音響信号符号化装置200において符号列に多重化せずに、符号化データを適切に復号することができる。したがって、分割帯域ごとに符号化に関する付加情報を多重化する必要が無いため、音響信号符号化装置200により生成される音響符号化データの圧縮率を向上させることができる。
[圧縮効率の改善例]
図14は、音響信号処理システム100による整数データの圧縮率と従来システムによる整数データの圧縮率との比較結果を示す図である。ここでは、音源121ごとに、従来システムおよび音響信号処理システム100の圧縮率122と、圧縮率差123とが示されている。
音源121には、圧縮率の比較素材として、一般楽曲1および2と、鍵盤楽器1および2と、打楽器1および2と、管楽器1および2と、クラシックとが示されている。
圧縮率122には、従来システムによる圧縮率および音響信号処理システム100による圧縮率が示されている。この従来システムおよび音響信号処理システム100による圧縮率122は、その数値が小さいほど圧縮の効率が良いことを意味する。従来システムによる圧縮率122は、固定長の符号化によって生成された1秒当たりの音響符号化データに対する、1つのハフマン符号化テーブルにより生成された1秒当たりの音響符号化データの割合を示す。
また、音響信号処理システム100による圧縮率は、固定長の符号化によって生成された1秒当たりの音響符号化データに対して、音響信号処理システム100によって生成される1秒当たりの音響符号化データの割合を示す。すなわち、音響信号処理システム100による圧縮率は、固定長の符号化によって生成された音響符号化データに対して、2つの第1および第2符号化テーブル340および350を切り替えることによって生成される音響符号化データの割合を示す。
圧縮率差123には、音響信号処理システム100による圧縮率から従来システムによる圧縮率を減算した値が示されている。この圧縮率差123は、その数値が小さいほど、従来システムに比べて音響信号処理システム100による圧縮率が向上していることを示す。
このように、音響信号処理システム100による圧縮率122は、従来システムによる圧縮率122に比べて、いずれの音源121も小さい。したがって、音響信号符号化装置200により生成される音響符号化データの圧縮率は、従来システムに比べて向上していることが分かる。これは、各分割帯域の振幅基準値により算出された振幅振動量における量子化値の出現確率分布の偏り度合いに応じて符号化テーブルを選択することによる符号化効率の改善、および、従来システムとは異なり符号化に関する付加情報が不要であることに起因する。
また、打楽器1および2と、管楽器1および2とに対応する圧縮率差123が比較的小さいことから、周波数軸上における振幅レベルの変動が大きい音響信号ほど、圧縮率は向上すると考えられる。
[音響信号復号装置400の動作例]
次に本発明の第2の実施の形態における音響信号符号化装置200の動作について図面を参照して説明する。
図15は、本発明の第2の実施の形態における音響信号符号化装置200の復号方法における処理手順例を示すフローチャートである。
まず、符号列分離部410により、符号列入力線202から入力された符号列が、符号化データと、符号化された振幅基準値と、符号化帯域数とに分離される(ステップS951)。続いて、振幅基準値復号部420により、符号列分離部410からの符号化された振幅基準値が復号される(ステップS952)。
そして、振幅変動量算出部460により、振幅基準値復号部420からの分割帯域ごとの振幅基準値に基づいて振幅変動判定フラグを生成する振幅変動判定処理が実行される(ステップS960)。この後、スペクトル復号処理部500により、振幅変動判定処理によって生成された振幅変動判定フラグに基づいて、符号列分離部410からの符号化データに対するスペクトル復号処理が分割帯域ごとに実行される(ステップS970)。
続いて、スペクトル逆正規化部440により、スペクトル復号処理によって生成された正規化スペクトルに対するスペクトル逆正規化処理が分割帯域ごとに実行される(ステップS980)。そして、音響信号生成部470により、スペクトル逆正規化処理によって生成された周波数スペクトルに基づいて音響信号が生成されて(ステップS953)、復号方法における処理手順が終了する。
[振幅変動量算出部460による振幅変動判定処理例]
図16は、本発明の第2の実施の形態における振幅変動量算出部460による振幅変動判定処理(ステップS960)の処理手順例を示すフローチャートである。この振幅変動判定処理(ステップS960)は、図10に示した振幅判定処理(ステップS930)に対応する。
まず、符号列分離部410からの符号化帯域数NCに基づいて、振幅変動判定フラグAmFlag[0]乃至[NC−1]が「0」に設定される(ステップS961)。そして、分割帯域番号iが「1」に設定される(ステップS962)。これらのステップS961およびS962の処理により振幅変動判定処理の初期化が終了する。
この後、式4の上段の条件式に基づいて、第1番の分割帯域に対する振幅基準値Ar[1]から、低域側に隣接する第0番の分割帯域に対する振幅基準値Ar[0]を減算した減算値が、第1変動量閾値Th1以上であるか否かが判断される(ステップS963)。そして、その減算値が第1変動量閾値Th1以上である場合には、第1番の分割帯域が振幅変動量の大きい分割帯域と判定されて、第1番の分割帯域に対する振幅変動判定フラグAmFlag[1]に「1」が設定される(ステップS968)。
一方、減算値が第1変動量閾値Th1未満である場合には、式4に示した下段の条件式を満足するか否かが判断される(ステップS964)。すなわち、分割帯域番号「i=1」が最大の分割帯域番号(NC−1)未満であり、かつ、振幅基準値Ar[1]に「2」を乗じた乗算値から、振幅基準値Ar[0]および[2]の和を減算した値が第2変動量閾値Th2以上であるか否かが判断される。
そして、式4の下段の条件式を満足する場合には、第1番の分割帯域が振幅変動量の大きい分割帯域と判定されて、第1番の分割帯域に対する振幅変動判定フラグAmFlag[1]に「1」が設定される(ステップS968)。一方、式4の下段の条件式を満足しない場合には、第1番の分割帯域が振幅変動量の大きい分割帯域でないと判定されて、第1番の分割帯域に対する振幅変動判定フラグAmFlag[1]に「0」が設定される(ステップS965)。
このように、ステップS963およびS964の処理により、音響信号符号化装置200からの振幅基準値のうち、所定の分割帯域の振幅基準値に基づいて分割帯域に対する振幅変動量が算出される。なお、ステップS963およびS964は、特許請求の範囲に記載の振幅変動量算出手順の一例である。
そして、分割帯域番号を「1」増加させるために、分割帯域番号「1」に「1」を加えた値「2」が分割帯域番号iに設定される(ステップS966)。この後、分割帯域番号iが符号化帯域数NCと一致するか否かが判断される(ステップS967)。そして、分割帯域番号iが符号化帯域数NCと一致しない場合には、符号化帯域数NCに一致するまで、ステップS963乃至S966およびS968の一連の処理が繰り返される。一方、分割帯域番号iが符号化帯域数NCと一致した場合には、振幅変動判定処理が終了する。
[スペクトル復号処理部500によるスペクトル復号処理例]
図17は、本発明の第2の実施の形態におけるスペクトル復号処理部500によるスペクトル復号処理(ステップS970)の処理手順例を示すフローチャートである。
まず、スペクトル復号処理の初期化のため、分割帯域番号iが「0」に設定される(ステップS971)。続いて、復号選択部540により、第0番の分割帯域に対する振幅変動判定フラグAmFlag[0]が「0」であるか否かが判断される(ステップS972)。
そして、振幅変動判定フラグAmFlag[0]が「0」である場合には、振幅変動量が小さい分割帯域であるため、復号選択部540により、第1復号テーブル520に保持された復号表が選択される(ステップS973)。すなわち、復号選択部540により、第1符号化テーブル340の出力として、出現確率分布の偏り度合いが小さい量子化値である整数データを符号化するための符号表に対応する復号表が選択される。
一方、振幅変動判定フラグAmFlag[0]が「1」である場合には、振幅変動量が大きい分割帯域であるため、復号選択部540により、第2復号テーブル530に保持された復号表が選択される(ステップS977)。すなわち、復号選択部540により、第2復号テーブル530の出力として、分割帯域における出現確率分布の偏り度合いが大きい量子化値である整数データを符号化するための符号表に対応する復号表が選択される。
このように、ステップS972、S973およびS977の処理により、複数の復号アルゴリズムのうち、振幅変動量における量子化値の出現確率分布の偏り度合いに応じた復号アルゴリズムが選択される。なお、ステップS972、S973およびS977は、特許請求の範囲に記載の復号選択手順の一例である。
この後、復号部510により、復号選択部540において選択された第1または第2復号テーブルに保持された復号表に基づいて、第0番の分割帯域に対応する符号化データが復号される(ステップS974)。これにより、第0番の分割帯域に対応する整数データが生成される。すなわち、復号選択部540により選択された復号アルゴリズムにより符号化データが復号される。なお、ステップS974は、特許請求の範囲に記載の復号手順の一例である。
そして、分割帯域番号を「1」増加させるために、分割帯域番号「0」に「1」を加えた値「1」が分割帯域番号iに設定される(ステップS975)。この後、分割帯域番号iが符号化帯域数NCと一致するか否かが判断される(ステップS976)。そして、分割帯域番号iが符号化帯域数NCと一致しない場合には、符号化帯域数NCに一致するまで、ステップS972乃至S975およびS977の一連の処理が繰り返される。一方、分割帯域番号iが符号化帯域数NCと一致した場合には、スペクトル復号処理が終了する。
[スペクトル逆正規化処理の処理手順例]
図18は、本発明の第2の実施の形態における音響信号復号装置400によるスペクトル逆正規化処理(ステップS980)の処理手順例を示すフローチャートである。
まず、語長情報生成部450により、ステップS952の処理において生成された各分割帯域の振幅基準値に基づいて、各分割帯域に対する語長情報が生成される(ステップS981)。そして、正規化スペクトル生成部550により、ステップS970の処理において生成された整数データが、各分割帯域に対する語長情報に基づいて変換されることによって、分割帯域ごとに正規化スペクトルが生成される(ステップS982)。
この後、量子化振幅情報算出部430により、分割帯域に対する振幅基準値に基づいてその分割帯域に対する量子化振幅情報が分割帯域ごとに算出される(ステップS983)。続いて、スペクトル逆正規化部440により、分割帯域ごとに、分割帯域に対応する量子化振幅情報に基づいて、その分割帯域に対応する正規化スペクトルが周波数スペクトルに変換されて(ステップS984)、スペクトル逆正規化処理が終了する。なお、符号化帯域数を越える分割帯域における周波数スペクトルは全て「0」とする。
このように、本発明の第2の実施の形態では、音響信号符号化装置200と同一の振幅変動量算出部460を設けることによって、音響信号符号化装置200により符号化された符号化データを各分割帯域に対する振幅変動量に基づいて復号することができる。すなわち、音響信号復号装置400は、各分割帯域の振幅基準値に基づいて振幅変動量を算出することによって、その振幅変動量における量子化値の出現確率分布の偏り度合いに応じて符号化された符号化データを適切に復号することができる。
なお、本発明の第1および第2の実施の形態では、式4に示した条件式により振幅変動量が大きい分割帯域を判定する例について説明したが、パルス的な波形を含む分割帯域を特定するために他の条件式を用いて判定するようにしてもよい。ここで、式4に示した条件式に加えて他の条件式により振幅変動量の大きい分割帯域を判定するように改良したのが以下に説明する第3および第4の実施の形態である。
<3.第3の実施の形態>
[音響信号符号化装置200の構成例]
図19は、本発明の第3の実施の形態における音響信号符号化装置200の一構成例を示すブロック図である。この音響信号符号化装置200は、図2に示した音響信号符号化装置200における振幅変動量算出部260の構成に代えて、平均振幅基準値算出部721および振幅変動量算出部760を備えている。ここでは、平均振幅基準値算出部721および振幅変動量算出部760以外の構成は、図2に示したものと同様であるため、ここでの説明を省略する。
平均振幅基準値算出部721は、振幅基準値生成部220により生成される各分割帯域の振幅基準値の平均値を平均振幅基準値として算出するものである。この平均振幅基準値算出部721は、例えば、0Hz乃至3KHzの低域における分割帯域に対する平均振幅基準値を算出する。これにより、平均振幅基準値算出部721は、低域における分割帯域に対する振幅基準値を算出対象にすることによって、図3に示したように、高域に比べて低域における振幅基準値の方が大きいため、平均振幅基準値を比較的大きな値に設定することができる。
この平均振幅基準値算出部721は、例えば、次式に基づいて、平均振幅基準値Ar_aveを算出する。
Figure 2011022435
ここで、SBは、平均振幅基準値Ar_aveの算出対象の分割帯域のうち、最も低域の分割帯域に対応する分割帯域番号を示す開始帯域番号である。EBは、平均振幅基準値Ar_aveの算出対象の分割帯域のうち、最も高域の分割帯域に対応する分割帯域番号に「1」を加算した値を示す終了帯域番号である。
また、平均振幅基準値算出部721は、例えば、式10における「EB−SB」による除算に代えて「1/(EB−SB)」に相当する値を乗算することによって、平均振幅基準値Ar_aveを算出するようにしてもよい。これにより、式10の演算処理における除算によって発生する誤差を防止することができる。また、平均振幅基準値算出部721は、その算出された平均振幅基準値Ar_aveを振幅変動量算出部760に供給する。
振幅変動量算出部760は、振幅基準値生成部220からの各分割帯域に対する振幅基準値と、平均振幅基準値算出部721からの平均振幅基準値とに基づいて、周波数スペクトルに関する振幅変動量を算出するものである。この振幅変動量算出部760は、図2に示した振幅変動量算出部260に対応する。
この振幅変動量算出部760は、式4の条件式に加えて次式に示す条件に基づいて、近傍の分割帯域に比べて振幅基準値の振幅変動量が大きい分割帯域を判定する。
Figure 2011022435
ここで、Th3およびTh4は、第3および第4の変動量閾値を示す。第4の変動量閾値Th4は、式4に示した第1の変動量閾値Th1よりも小さい値に設定される。式4の条件式を満たさない分割帯域であっても、量子化値の出現確率分布の偏り度合いが大きいと考えられる分割帯域を特定するためである。
また、式11に示したNSは、分割帯域のうち最も低域の分割帯域に対応する分割帯域番号を示す開始番号である。このように開始番号NSを設定するのは、低域の分割帯域は周波数スペクトルの本数が少ないため、符号化効率の改善にあまり寄与しないためである。これにより、低域の分割帯域を判定対象から除外することができるため、振幅変動判定処理に伴う演算処理を軽減することができる。なお、式11の上段の条件式におけるi番の分割帯域が変動量算出帯域に該当する。また、式11の下段の条件式における第i−1番およびi番の分割帯域が変動量算出帯域に該当する。
この式11の上段に示した条件式により、振幅変動量算出部760は、第i番の分割帯域の振幅基準値Ar[i]から、平均振幅基準値算出部721からの平均振幅基準値Ar_aveを減算することによって、第i番の分割帯域に対する振幅変動量を算出する。すなわち、振幅変動量算出部760は、低域における分割帯域に対する振幅基準値の平均値と、変動量算出帯域に対する振幅基準値とに基づいて、振幅変動量を分割帯域ごとに算出する。
そして、振幅変動量算出部760は、その算出された振幅変動量が第3の変動量閾値Th3以上であるか否かを判断する。すなわち、振幅変動量算出部760は、式11の上段に示した条件式に基づいて、平均振幅基準値Ar_aveよりも第3の変動量閾値Th3以上の振幅基準値を示す分割帯域であるか否かを判定する。
また、式11の下段の条件式により、振幅変動量算出部760は、第i番の分割帯域の振幅基準値Ar[i]と、第i番の分割帯域の低域側に隣接する第i−1番における振幅基準値Ar[i−1]との差分により、第i番の分割帯域に対する振幅変動量を算出する。そして、振幅変動量算出部260は、その算出された振幅変動量が第4の変動量閾値Th4以上であるか否かを判断する。すなわち、振幅変動量算出部760は、式11の下段に示した条件式に基づいて、その振幅基準値が低域側の隣接分割帯域に対する振幅基準値に比べて第4の変動量閾値Th4以上の分割帯域であるか否かを判定する。
また、振幅変動量算出部760は、式11に示す2つの条件式に基づいて、両者の条件式を満足する分割帯域を、近傍の分割帯域に対する振幅変動量が大きい分割帯域であると判定する。これにより、振幅変動量算出部760は、式4の条件式を満足しない分割帯域であっても、分割帯域における周波数スペクトルのレベル差が大きいと想定される分割帯域を、振幅変動量の大きい分割帯域と判定することができる。
なお、振幅変動量算出部760の上述の機能以外の他の機能については、図2に示した振幅変動量算出部260と同様であるため、ここでの説明を省略する。また、振幅変動量算出部760は、特許請求の範囲に記載の振幅変動量算出部の一例である。
このように、平均振幅基準値算出部721および振幅変動量算出部760を設けることによって、低域における分割帯域に対する振幅基準値の平均値に基づいて、振幅変動量の大きい分割帯域を判定することができる。すなわち、振幅変動量算出部760は、量子化値の出現確率分布の偏り度合いの大きい分割帯域を、式11の条件式に基づいて判定することができる。
[音響信号符号化装置200の動作例]
次に本発明の第3の実施の形態における音響信号符号化装置200の動作について図面を参照して説明する。この音響信号符号化装置200の動作については、図9に示した音響信号符号化装置200における振幅判定処理(ステップS930)に代えて振幅判定処理(ステップS990)が実行される。このため、振幅判定処理(ステップS990)についてのみ以下に図面を参照して簡単に説明し、その他の処理については、図9に示したものと同様であるため、ここでの説明を省略する。
図20は、本発明の第3の実施の形態における音響信号符号化装置200による振幅変動判定処理(ステップS990)の処理手順例を示すフローチャートである。ここでは、ステップS991、S992およびS993の処理以外は、図10に示した処理と同様であるため、ここでの説明を省略する。
まず、平均振幅基準値算出部721により、振幅基準値生成部220からの各分割帯域に対する振幅基準値の平均値を算出することによって、平均振幅基準値Ar_aveが算出される(ステップS991)。例えば、平均振幅基準値算出部721により、低域に対応する分割帯域の振幅基準値の平均値が平均振幅基準値として算出される。
ステップS934において式4の下段の条件式を満足しない場合には、振幅変動量算出部760により、式11に示した上段の条件式が満足するか否かが判断される。すなわち、判定対象の第i番の分割帯域に対する振幅基準値Ar[i]から、平均振幅基準値算出部721により算出された平均振幅基準値Ar_aveを減算した減算値が、第3変動量閾値Th3以上であるか否かが判断される(ステップS992)。
そして、この減算値が第3変動量閾値Th3未満である場合には、ステップS935に進み、振幅変動量の大きい分割帯域でないと判定されて、第i番の分割帯域に対する振幅変動判定フラグAmFlag[i]に「0」が設定される(ステップS935)。一方、減算値が第3変動量閾値Th3以上である場合には、振幅変動量算出部760により、式11に示した下段の条件式が満足するか否かが判断される。すなわち、第i番の分割帯域に対する振幅基準値Ar[i]から、低域側に隣接する第i−1番の分割帯域に対する振幅基準値Ar[i−1]を減算した減算値が第4変動量閾値Th4以上であるか否かが判断される(ステップS993)。
そして、その減算値が第4変動量閾値Th4以上である場合には、第i番の分割帯域が振幅変動量の大きい分割帯域と判定されて、第i番の分割帯域に対する振幅変動判定フラグAmFlag[i]に「1」が設定される(ステップS938)。一方、式11の下段の条件式を満足しない場合には、第i番の分割帯域が振幅変動量の大きい分割帯域でないと判定されて、第i番の分割帯域に対する振幅変動判定フラグAmFlag[i]に「0」が設定される(ステップS935)。
このように、ステップS933、S934、S992およびS993の処理において、入力信号における周波数スペクトルに対する各分割帯域の振幅基準値によるスペクトル包絡に基づいて振幅変動量が算出される。なお、ステップS933、S934、S992およびS993は、特許請求の範囲に記載の振幅変動量算出手順の一例である。
このように、本発明の第3の実施の形態では、第1の実施の形態における振幅変動量算出部260により振幅変動量が小さいと判定された分割帯域のうち、量子化値の出現確率分布の偏り度合いの大きい分割帯域を、式11の条件式によって判定することができる。次に、本発明の第3の実施の形態における音響信号符号化装置200に対応する音響信号復号装置を第4の実施の形態として以下に図面を参照して簡単に説明する。
<4.第4の実施の形態>
図21は、本発明の第4の実施の形態における音響信号復号装置400の一構成例を示すブロック図である。この音響信号復号装置400は、第3の実施の形態における音響信号符号化装置200に対応する音響信号復号装置である。
この音響信号復号装置400は、図12に示した音響信号復号装置400における振幅変動量算出部260に代えて、平均振幅基準値算出部721および振幅変動量算出部760を備えている。この平均振幅基準値算出部721および振幅変動量算出部760以外の他の構成は、図12に示したものと同様であるため、図12と同一符号を付してここでの説明を省略する。
また、平均振幅基準値算出部721および振幅変動量算出部760は、図19に示した音響信号符号化装置200における平均振幅基準値算出部721および振幅変動量算出部760と同様のものであるため、図19と同一符号を付してここでの説明を省略する。
なお、本発明の第4の実施の形態における音響信号復号装置400の動作例については、図16に示した音響信号復号装置400における振幅判定処理(ステップS960)に代えて振幅判定処理(ステップS990)が実行される。このため、振幅判定処理(ステップS990)以外の他の処理については、図16に示したものと同様であるため、ここでの説明を省略する。また、振幅判定処理(ステップS990)は、図20に示したものと同様であるため、ここでの説明を省略する。
このように、平均振幅基準値算出部721および振幅変動量算出部760を設けることによって、第3の実施の形態における音響信号符号化装置200により生成された音響符号化データを適切に復号することができる。なお、本発明の実施の形態では、2つのハフマン符号化テーブルのうち一方を選択することによって符号化アルゴリズムを切り替える例について説明したが、複数の異なる符号化部のうち1つの符号化部を選択するようにしてもよい。ここで、複数の符号化部のうち1つの符号化部を選択する例について以下に図面を参照して説明する。
<5.第5の実施の形態>
[スペクトル符号化処理部の構成例]
図22は、本発明の第5の実施の形態におけるスペクトル符号化処理部の一構成例を示すブロック図である。
スペクトル符号化処理部800は、整数データ生成部810と、符号化部820と、符号化選択部830と、加算部860とを備える。このスペクトル符号化処理部800は、図2に示したスペクトル符号化処理部300に対応する。また、符号化部820は、ハフマン符号化部840および算術符号化部850を備える。この例では、整数データ生成部810は、図7に示した整数データ生成部310と同様の構成であるため、ここでの説明を省略する。
符号化部820は、入力信号における周波数スペクトルの量子化値を、複数の符号化アルゴリズムにより符号化するものである。この符号化部820は、ハフマン符号化部840および算術符号化部850のうち、いずれか一方の符号化部により、整数データ生成部810からの量子化値である整数データを符号化する。すなわち、符号化部820は、2つの符号化アルゴリズムのうちいずれか一方により、整数データ生成部810からの整数データを符号化する。
また、符号化部820は、信号線271からの符号化帯域数によって特定される符号化すべき分割帯域における整数データを分割帯域ごとに符号化する。また、符号化部320は、その符号化された整数データを符号化データとして信号線301に出力する。なお、符号化部820は、特許請求の範囲に記載の符号化部の一例である。
ハフマン符号化部840は、ハフマン符号化により事前に生成された符号表を参照して、符号化選択部830から出力される整数データを符号化するものである。このハフマン符号化部840は、振幅変動判定フラグが振幅変動量の小さい旨を示す場合に、その振幅変動判定フラグに対応する整数データを符号化する。すなわち、ハフマン符号化部840は、出現確率分布の偏りが小さい分割帯域に対応する量子化値である整数データを符号化する。また、ハフマン符号化部840は、その符号化された整数データを符号化データとして加算部860に供給する。
算術符号化部850は、符号化選択部830から出力される整数データを算術符号化により符号化するものである。この算術符号化部850は、振幅変動判定フラグが振幅変動量の大きい旨を示す場合に、その振幅変動判定フラグに対応する整数データを算術符号化により符号化する。すなわち、算術符号化部850は、出現確率分布の偏りが大きい分割帯域に対する量子化値である整数データを算術符号化により符号化する。また、算術符号化部850は、その符号化された整数データを符号化データとして加算部860に供給する。
符号化選択部830は、信号線261を介して振幅変動量算出部260から供給された振幅変動判定フラグに基づいて、ハフマン符号化部840および算術符号化部850のうちいずれか一方の符号化部を選択するものである。この符号化選択部830は、振幅基準値の振幅変動量が大きい旨を示す振幅変動判定フラグが供給された場合には、分割帯域における出現確率分布の偏り度合いが大きい量子化値を符号化するための算術符号化部850に整数データを出力する。
一方、符号化選択部830は、振幅基準値の振幅変動量が小さい旨を示す振幅変動判定フラグが供給された場合には、出現確率分布の偏り度合いが小さい量子化値を符号化するためのハフマン符号化部840に整数データを出力する。すなわち、この符号化選択部830は、複数の符号化アルゴリズムのうち、振幅変動量における量子化値の出現確率分布の偏り度合いに応じた符号化アルゴリズムを選択する。
具体的には、符号化選択部830は、例えば、振幅変動判定フラグが「1」に設定されている場合には、算術符号化部850に整数データを出力し、幅変動量判定フラグが「0」に設定されている場合には、ハフマン符号化部840に整数データを出力する。なお、符号化選択部830は、特許請求の範囲に記載の符号化選択部の一例である。
加算部860は、ハフマン符号化部840または算術符号化部850から出力された符号化データを信号線301に供給するものである。この加算部860は、振幅変動量が大きい旨を示す振幅変動判定フラグが符号化選択部830に供給された場合には、算術符号化部850から供給された符号化データを信号線301に出力する。一方、加算部860は、振幅変動量が小さい旨を示す振幅変動判定フラグが符号化選択部830に供給された場合には、ハフマン符号化部840から供給された符号化データを信号線301に出力する。
このように、本発明の第5の実施の形態では、算術符号化部850を設けることによって、第1および第3の実施の形態に比べて、量子化値の出現確率分布の偏り度合いが大きい分割帯域に対応する整数データの符号化効率を改善することができる。
このように、本発明の実施の形態によれば、音響信号の周波数スペクトルに対するスペクトル包絡の振幅変動量における出現確率分布の偏り度合いに応じた符号化処理によって量子化値の符号化効率を改善することができる。また、各分割帯域に対する振幅基準値に基づいてアルゴリズムを選択することから、分割帯域ごとに適用した符号化アルゴリズムに関する付加情報を音響符号化データに多重化する必要がないため、音響符号化データのデータ量を削減することができる。これにより、入力信号における周波数成分の符号化による圧縮率を向上させることができる。
なお、本発明の実施の形態では、音響信号に対する音響信号処理システム100について説明したが、画像信号に対する符号化および復号を行う画像処理システムにも適用することができる。
なお、本発明の実施の形態は本発明を具現化するための一例を示したものであり、本発明の実施の形態において明示したように、本発明の実施の形態における事項と、特許請求の範囲における発明特定事項とはそれぞれ対応関係を有する。同様に、特許請求の範囲における発明特定事項と、これと同一名称を付した本発明の実施の形態における事項とはそれぞれ対応関係を有する。ただし、本発明は実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において実施の形態に種々の変形を施すことにより具現化することができる。
また、本発明の実施の形態において説明した処理手順は、これら一連の手順を有する方法として捉えてもよく、また、これら一連の手順をコンピュータに実行させるためのプログラム乃至そのプログラムを記憶する記録媒体として捉えてもよい。この記録媒体として、例えば、CD(Compact Disc)、MD(MiniDisc)、DVD(Digital Versatile Disk)、メモリカード、ブルーレイディスク(Blu-ray Disc(登録商標))等を用いることができる。
100 音響信号処理システム
200 音響信号符号化装置
210 周波数スペクトル生成部
220 振幅基準値生成部
230、430 量子化振幅情報算出部
240 スペクトル正規化部
250、450 語長情報生成部
260、460、760 振幅変動量算出部
270 符号化帯域設定部
280 振幅基準値符号化部
290 多重化部
300、800 スペクトル符号化処理部
310、810 整数データ生成部
320、820 符号化部
330、830 符号化選択部
340 第1符号化テーブル
350 第2符号化テーブル
400 音響信号復号装置
410 符号列分離部
420 振幅基準値復号部
440 スペクトル逆正規化部
470 音響信号生成部
500 スペクトル復号処理部
510 復号部
520 第1復号テーブル
530 第2復号テーブル
540 復号選択部
550 正規化スペクトル生成部
600 スピーカ
721 平均振幅基準値算出部
840 ハフマン符号化部
850 算術符号化部
860 加算部

Claims (11)

  1. 入力信号における周波数スペクトルの量子化値を複数の符号化アルゴリズムにより符号化する符号化部と、
    前記周波数スペクトルのスペクトル包絡に基づいて前記周波数スペクトルに関する振幅変動量を算出する振幅変動量算出部と、
    前記複数の符号化アルゴリズムのうち前記振幅変動量における前記量子化値の出現確率分布の偏り度合いに応じた前記符号化アルゴリズムを選択する符号化選択部と
    を具備する信号符号化装置。
  2. 前記周波数スペクトルの周波数帯域における複数の分割帯域ごとに抽出された前記周波数スペクトルの最大レベルに基づいて前記分割帯域に対する振幅基準値を前記スペクトル包絡として生成する振幅基準値生成部をさらに具備し、
    前記振幅変動量算出部は、前記複数の分割帯域のうち所定の分割帯域である変動量算出帯域に対する前記振幅基準値に基づいて前記振幅変動量を前記分割帯域ごとに算出し、
    前記符号化選択部は、前記分割帯域に対する前記振幅変動量が大きい場合には前記偏り度合いが大きい前記分割帯域に対応する前記量子化値を符号化するための前記符号化アルゴリズムを前記分割帯域ごとに選択する
    請求項1記載の信号符号化装置。
  3. 前記振幅変動量算出部は、前記変動量算出帯域である隣接する前記分割帯域に対する前記振幅基準値の差に基づいて前記振幅変動量を前記分割帯域ごとに算出する請求項2記載の信号符号化装置。
  4. 前記振幅変動量算出部は、低域における前記分割帯域に対する前記振幅基準値の平均値と前記変動量算出帯域に対する振幅基準値とに基づいて前記振幅変動量を前記分割帯域ごとに算出する請求項2記載の信号符号化装置。
  5. 前記振幅基準値生成部は、前記分割帯域の振幅レベルの基準となるスケールファクタを前記振幅基準値として生成する請求項2記載の信号符号化処理装置。
  6. 入力信号における周波数スペクトルの量子化値が符号化された符号化データを複数の復号アルゴリズムにより復号する復号部と、
    前記周波数スペクトルの周波数帯域における複数の分割帯域ごとに抽出された前記周波数スペクトルに基づいて生成された振幅基準値のうち所定の前記分割帯域の前記振幅基準値により前記分割帯域に対する振幅変動量を算出する振幅変動量算出部と、
    前記複数の復号アルゴリズムのうち前記振幅変動量における前記量子化値の出現確率分布の偏り度合いに応じた前記復号アルゴリズムを選択する復号選択部と
    を具備する信号復号装置。
  7. 入力信号における周波数スペクトルの量子化値を複数の符号化アルゴリズムにより符号化する符号化部と、前記周波数スペクトルにおける複数の分割帯域ごとに抽出された周波数スペクトルに基づいて前記分割帯域に対する振幅基準値を生成する振幅基準値生成部と、前記複数の分割帯域のうち所定の分割帯域である変動量算出帯域に対する前記振幅基準値に基づいて前記振幅変動量を前記分割帯域ごとに算出する振幅変動量算出部と、前記複数の符号化アルゴリズムのうち前記振幅変動量における量子化値の出現確率分布の偏り度合いに応じた前記符号化アルゴリズムを選択する符号化選択部とを備える信号符号化装置と、
    前記入力信号における周波数スペクトルの量子化値が符号化されたデータを複数の復号アルゴリズムにより復号する復号部と、前記信号符号化装置における前記振幅基準値符号化部により生成された振幅基準値のうち前記変動量算出帯域に対する振幅基準値に基づいて振幅変動量を前記分割帯域ごとに算出する振幅変動量算出部と、前記複数の復号アルゴリズムのうち前記振幅変動量における前記量子化値の出現確率分布の偏り度合いに応じた前記復号アルゴリズムを選択する復号選択部とを備える信号復号装置と
    を具備する信号処理システム。
  8. 入力信号における周波数スペクトルのスペクトル包絡に基づいて振幅変動量を算出する振幅変動量算出手順と、
    前記周波数スペクトルの量子化値を符号化するための複数の符号化アルゴリズムのうち前記振幅変動量における前記量子化値の出現確率分布の偏り度合いに応じた前記符号化アルゴリズムを選択する符号化選択手順と、
    前記符号化選択手順により選択された符号化アルゴリズムにより前記周波数スペクトルの前記量子化値を符号化する符号化手順と
    を具備する信号符号化処理方法。
  9. 入力信号における周波数スペクトルのスペクトル包絡に基づいて振幅変動量を算出する振幅変動量算出手順と、
    前記周波数スペクトルの量子化値を符号化するための複数の符号化アルゴリズムのうち前記振幅変動量における前記量子化値の出現確率分布の偏り度合いに応じた前記符号化アルゴリズムを選択する符号化選択手順と、
    前記符号化選択手順により選択された符号化アルゴリズムにより前記周波数スペクトルの前記量子化値を符号化する符号化手順と
    をコンピュータに実行させるプログラム。
  10. 入力信号の周波数スペクトルの周波数帯域における複数の分割帯域ごとに抽出された前記周波数スペクトルに基づいて生成された振幅基準値のうち所定の前記分割帯域の前記振幅基準値により前記分割帯域に対する振幅変動量を算出する振幅変動量算出手順と、
    前記周波数スペクトルの量子化値が符号化された符号化データを復号するための複数の復号アルゴリズムのうち前記振幅変動量における前記量子化値の出現確率分布の偏り度合いに応じた前記復号アルゴリズムを選択する復号選択手順と、
    前記復号選択手順により選択された復号アルゴリズムにより前記符号化データを前記分割帯域ごとに復号する復号手順と
    を具備する信号復号処理方法。
  11. 入力信号の周波数スペクトルの周波数帯域における複数の分割帯域ごとに抽出された前記周波数スペクトルに基づいて生成された振幅基準値のうち所定の前記分割帯域の前記振幅基準値により前記分割帯域に対する振幅変動量を算出する振幅変動量算出手順と、
    前記周波数スペクトルの量子化値が符号化された符号化データを復号するための複数の復号アルゴリズムのうち前記振幅変動量における前記量子化値の出現確率分布の偏り度合いに応じた前記復号アルゴリズムを選択する復号選択手順と、
    前記復号選択手順により選択された復号アルゴリズムにより前記符号化データを前記分割帯域ごとに復号する復号手順と
    をコンピュータに実行させるプログラム。
JP2009168465A 2009-07-17 2009-07-17 信号符号化装置、信号復号装置、信号処理システム、これらにおける処理方法およびプログラム Expired - Fee Related JP5304504B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2009168465A JP5304504B2 (ja) 2009-07-17 2009-07-17 信号符号化装置、信号復号装置、信号処理システム、これらにおける処理方法およびプログラム
EP10167417.4A EP2284832B1 (en) 2009-07-17 2010-06-25 Audio signal encoding apparatus, audio signal decoding apparatus, audio signal encoding process method, audio signal decoding process method, and program
US12/832,476 US8606567B2 (en) 2009-07-17 2010-07-08 Signal encoding apparatus, signal decoding apparatus, signal processing system, signal encoding process method, signal decoding process method, and program
CN2010102263164A CN101958120B (zh) 2009-07-17 2010-07-09 信号编码和解码设备及处理方法、信号处理***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009168465A JP5304504B2 (ja) 2009-07-17 2009-07-17 信号符号化装置、信号復号装置、信号処理システム、これらにおける処理方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2011022435A true JP2011022435A (ja) 2011-02-03
JP5304504B2 JP5304504B2 (ja) 2013-10-02

Family

ID=42751534

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009168465A Expired - Fee Related JP5304504B2 (ja) 2009-07-17 2009-07-17 信号符号化装置、信号復号装置、信号処理システム、これらにおける処理方法およびプログラム

Country Status (4)

Country Link
US (1) US8606567B2 (ja)
EP (1) EP2284832B1 (ja)
JP (1) JP5304504B2 (ja)
CN (1) CN101958120B (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016054523A (ja) * 2012-01-17 2016-04-14 ソニー株式会社 復号装置、復号方法、およびプログラム
WO2019244666A1 (ja) * 2018-06-21 2019-12-26 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8762158B2 (en) * 2010-08-06 2014-06-24 Samsung Electronics Co., Ltd. Decoding method and decoding apparatus therefor
PL397008A1 (pl) * 2011-11-17 2013-05-27 Politechnika Poznanska Sposób kodowania obrazu
US11039138B1 (en) 2012-03-08 2021-06-15 Google Llc Adaptive coding of prediction modes using probability distributions
CN105336335B (zh) * 2014-07-25 2020-12-08 杜比实验室特许公司 利用子带对象概率估计的音频对象提取
CN107004422B (zh) * 2014-11-27 2020-08-25 日本电信电话株式会社 编码装置、解码装置、它们的方法及程序
KR20220035096A (ko) * 2019-07-19 2022-03-21 소니그룹주식회사 신호 처리 장치 및 방법, 그리고 프로그램
CN117476012A (zh) * 2022-07-27 2024-01-30 华为技术有限公司 音频信号的处理方法及其装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07336232A (ja) * 1994-06-13 1995-12-22 Sony Corp 情報符号化方法及び装置、情報復号化方法及び装置、並びに情報記録媒体
JP2003233397A (ja) * 2002-02-12 2003-08-22 Victor Co Of Japan Ltd オーディオ符号化装置、オーディオ符号化プログラム及びオーディオ符号化データ伝送装置
JP2008032823A (ja) * 2006-07-26 2008-02-14 Toshiba Corp 音声符号化装置
WO2009056866A1 (en) * 2007-10-30 2009-05-07 Cambridge Silicon Radio Ltd Fast spectral partitioning for efficient encoding

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03277692A (ja) 1990-12-21 1991-12-09 Res Assoc Util Of Light Oil 高オクタン価ガソリン基材の製造方法
TW295747B (ja) * 1994-06-13 1997-01-11 Sony Co Ltd
US6937979B2 (en) * 2000-09-15 2005-08-30 Mindspeed Technologies, Inc. Coding based on spectral content of a speech signal
US7272566B2 (en) * 2003-01-02 2007-09-18 Dolby Laboratories Licensing Corporation Reducing scale factor transmission cost for MPEG-2 advanced audio coding (AAC) using a lattice based post processing technique
US9653088B2 (en) * 2007-06-13 2017-05-16 Qualcomm Incorporated Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07336232A (ja) * 1994-06-13 1995-12-22 Sony Corp 情報符号化方法及び装置、情報復号化方法及び装置、並びに情報記録媒体
JP2003233397A (ja) * 2002-02-12 2003-08-22 Victor Co Of Japan Ltd オーディオ符号化装置、オーディオ符号化プログラム及びオーディオ符号化データ伝送装置
JP2008032823A (ja) * 2006-07-26 2008-02-14 Toshiba Corp 音声符号化装置
WO2009056866A1 (en) * 2007-10-30 2009-05-07 Cambridge Silicon Radio Ltd Fast spectral partitioning for efficient encoding
JP2011501246A (ja) * 2007-10-30 2011-01-06 ケンブリッジ シリコン ラジオ リミテッド 効率的なエンコーディングに対する高速スペクトル分割

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016054523A (ja) * 2012-01-17 2016-04-14 ソニー株式会社 復号装置、復号方法、およびプログラム
WO2019244666A1 (ja) * 2018-06-21 2019-12-26 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
JPWO2019244666A1 (ja) * 2018-06-21 2021-07-15 ソニーグループ株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
JP7318645B2 (ja) 2018-06-21 2023-08-01 ソニーグループ株式会社 符号化装置および方法、復号装置および方法、並びにプログラム

Also Published As

Publication number Publication date
JP5304504B2 (ja) 2013-10-02
US8606567B2 (en) 2013-12-10
CN101958120B (zh) 2012-10-03
EP2284832B1 (en) 2019-01-23
US20110015933A1 (en) 2011-01-20
EP2284832A1 (en) 2011-02-16
CN101958120A (zh) 2011-01-26

Similar Documents

Publication Publication Date Title
JP5304504B2 (ja) 信号符号化装置、信号復号装置、信号処理システム、これらにおける処理方法およびプログラム
AU2018204110B2 (en) Signal processing apparatus and method, and program
JP4899359B2 (ja) 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
WO1998000837A1 (fr) Procedes de codage et de decodage de signaux audio, et codeur et decodeur de signaux audio
RU2707722C2 (ru) Устройство аудиодекодирования, устройство аудиокодирования, способ аудиодекодирования, способ аудиокодирования, программа аудиодекодирования и программа аудиокодирования
JP2011059714A (ja) 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
CN111602197B (zh) 解码装置、编码装置、它们的方法以及计算机可读记录介质
US10229688B2 (en) Data compression apparatus, computer-readable storage medium having stored therein data compression program, data compression system, data compression method, data decompression apparatus, data compression/decompression apparatus, and data structure of compressed data
CN111602196B (zh) 编码装置、解码装置、它们的方法及计算机可读记录介质
WO2011004744A1 (ja) 音響信号処理装置、その処理方法およびプログラム
JP3344944B2 (ja) オーディオ信号符号化装置,オーディオ信号復号化装置,オーディオ信号符号化方法,及びオーディオ信号復号化方法
KR20160120713A (ko) 복호 장치, 부호화 장치, 복호 방법, 부호화 방법, 단말 장치, 및 기지국 장치
JP6400590B2 (ja) 音響信号符号化装置、音響信号復号装置、端末装置、基地局装置、音響信号符号化方法及び復号方法
WO2002021091A1 (fr) Analyseur de signal de bruit, synthetiseur de signal de bruit, procede d'analyse de signal de bruit et procede de synthese de signal de bruit
JP4973397B2 (ja) 符号化装置および符号化方法、ならびに復号化装置および復号化方法
JP4317355B2 (ja) 符号化装置、符号化方法、復号化装置、復号化方法および音響データ配信システム
JP2004246038A (ja) 音声楽音信号符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、および復号化プログラム
JP6439843B2 (ja) 信号処理装置および方法、並びにプログラム
JP5724338B2 (ja) 符号化装置および符号化方法、復号装置および復号方法、並びにプログラム
JP4573670B2 (ja) 符号化装置、符号化方法、復号化装置及び復号化方法
JP5569476B2 (ja) 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
JP6210338B2 (ja) 信号処理装置および方法、並びにプログラム
JP3389849B2 (ja) 量子化装置
CN111788628A (zh) 编码装置、编码方法、程序以及记录介质
JP4993992B2 (ja) 信号処理方法、信号処理装置及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120528

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130311

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130319

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130508

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130528

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130610

R151 Written notification of patent or utility model registration

Ref document number: 5304504

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees