JP5098492B2 - 信号処理装置及び信号処理方法、並びにプログラム - Google Patents

信号処理装置及び信号処理方法、並びにプログラム Download PDF

Info

Publication number
JP5098492B2
JP5098492B2 JP2007197960A JP2007197960A JP5098492B2 JP 5098492 B2 JP5098492 B2 JP 5098492B2 JP 2007197960 A JP2007197960 A JP 2007197960A JP 2007197960 A JP2007197960 A JP 2007197960A JP 5098492 B2 JP5098492 B2 JP 5098492B2
Authority
JP
Japan
Prior art keywords
signal component
additional signal
normalization coefficient
component
coefficient information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007197960A
Other languages
English (en)
Other versions
JP2009031676A (ja
Inventor
弘幸 本間
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to JP2007197960A priority Critical patent/JP5098492B2/ja
Application filed by Sony Corp filed Critical Sony Corp
Priority to US12/524,992 priority patent/US8290784B2/en
Priority to PCT/JP2008/061614 priority patent/WO2009016902A1/ja
Priority to EP08790629.3A priority patent/EP2187388B1/en
Priority to CN2008800035982A priority patent/CN101595524B/zh
Priority to KR1020097009982A priority patent/KR20100039823A/ko
Publication of JP2009031676A publication Critical patent/JP2009031676A/ja
Priority to HK10100801.7A priority patent/HK1133944A1/xx
Application granted granted Critical
Publication of JP5098492B2 publication Critical patent/JP5098492B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、符号列を復号することなく音量の増減を行う場合に用いて好適な信号処理装置及び信号処理方法、並びにプログラムに関する。
オーディオ信号の高能率符号化は、人間の聴覚の仕組みを利用することで、CD(Compact Disk)相当の音質を元のCDの1/10から1/20程度のデータ量に圧縮することが可能となっている。現在、市場にもこれらの技術を利用した商品が流通しており、より小さな記録媒体に記録したり、ネットワークを通じて配信したりすることが可能になっている。こうしたオーディオ信号の高能率符号化に用いられる聴覚特性には、主に、同時マスキングと経時マスキングといったものが挙げられる。
同時マスキングとは、同時刻に異なる周波数の音が存在している場合に、大振幅の音の近傍周波数に小振幅の音があると小振幅の音はマスクされてしまい知覚しにくくなるという聴覚の特性である。
一方、経時マスキングとは、時間方向のマスキング効果であり、例えば大振幅の音の前後の時刻に存在する小振幅の音はマスクされてしまい知覚しにくくなるという聴覚の特性である。この経時マスキングには、時間的に前に発生した音が後に発生した音をマスクする順向マスキングと、時間的に後に発生した音が前に発生した音をマスクする逆向マスキングの二つの現象がある。順向マスキングに関しては、数十msecのオーダーで効くが、逆行マスキングの効果があるのは1msec程度の非常に短い時間であることが知られている。
代表的なオーディオ高能率符号化方式では、時間信号をMDCT(修正離散コサイン変換)で直交変換した後、得られた周波数軸上のMDCT係数に対して、複数のMDCT係数のまとまり毎(以降、これを量子化ユニットと呼ぶ。)に、正規化を行い、その後、量子化及び符号化を行っている。
この量子化ユニットの幅は一般的に低域側では狭く、高域側では広くとられており、量子化ユニット毎に量子化ステップ数を適応的に変化させ、聴覚の性質に合った量子化雑音の発生の制御ができるようになっている。
ところが、上述した方法では、周波数成分を量子化する帯域は固定されている。このため、例えば、スペクトルが特定の狭い帯域に集中する場合には、それらのスペクトル成分を十分な精度で量子化しようとすると、それらのスペクトル成分を同じ量子化ユニットに含まれる多数のスペクトルに対して多くのビットを割り振らなければならない。
一般に、特定の周波数にエネルギが集中するトーン性の信号における量子化雑音は、エネルギが広い周波数帯域にわたってなだらかに分布する信号に加わった量子化雑音と比較して非常に耳につき易く、聴覚上大きな障害となる。さらに、トーン性成分が十分精度良く量子化されていないと、それらのスペクトル成分を時間軸上の信号に戻して前後のブロックと合成した場合にブロック間での歪みが大きくなり、やはり大きな聴感上の障害となる。
このため、トーン性成分の符号化のためには十分なビット数で量子化を行わなければならないが、上述のように所定の帯域毎に量子化精度が決められる場合にはトーン性成分を含む量子化ユニット内の多数のスペクトルに対して多くのビットを割り当てて量子化を行う必要があり、符号化効率が悪くなってしまう。
このような問題を解決する手段として、特許第3336617号では、周波数成分を複数の信号成分に分離して独立に符号化を行うことで、トーン性の信号に対しても効率よく符号化を行えることを可能とした。
ところで、こうしたオーディオ信号の高能率符号化には、符号化・復号化に際してそれなりの演算量やメモリを必要とされるため、一旦、符号化された符号列に対して、簡便な信号処理を施す場合には、復号化した後所望の信号処理を行い、再度符号化するといった処理は行わずに符号列のパラメータを直接変更することで、少ない演算量や小さなメモリで所望の信号処理が行える場合がある。
特許第3879249号公報には、符号列の中の正規化係数情報を直接変更することで、信号のフィルタリングを行うことを可能にする発明が記載されている。また、特許第3879250号公報には、符号列の中の正規化係数情報を直接変更することで、信号のレベル調整を行うことを可能にする発明が記載されている。
特許第3336617号公報 特許第3879249号公報 特許第3879250号公報
ところが、フェード関数の形状によっては、前述の特許発明を直接適用した場合に、信号の性質によって問題が発生する場合がある。以降、図面を参照しながらこの問題の説明を行う。
図10は、6ビットの正規化係数情報と対応する正規化係数との関係の一例を示す図である。このテーブルの正規化係数情報は、例えば、次式で変換され、約−30デシベルから96デシベルまでを2デシベル刻みで表現することができる。
SFval(SF)=2^(SF/3−5)
また、図11は、符号列中の正規化係数情報を直接変更し、フェードインを実現する際の、フェード関数とそれに対応する正規化係数情報の減算量との関係を示す図である。図11に示すように、時間フレーム毎の正規化係数の減算量SFfi(frame)は、対応する時刻を入力とした場合のフェード関数の出力に相当する値となっている。
また、図12は、例えば次式のフェード関数Fa(t)に対応する正規化係数情報の減算量SFfi(frame)を示す図である。
Fa(t)=sin^2(PI/2.0*t/N)
ここで、フェードインスタートから終了までの時間Nは、159フレーム分としている。図12に示すように、113番目のフレームから159番目のフレームまでは、SFfiが1となり、また、94番目のフレームから112番目のフレームまでは、SFfiが2となっている。
このようにフェード関数の後半は、長い時間、一定値のSFfiが続くことになり、また、正規化係数の刻み幅が2デシベル刻みという理由もあって、一定振幅の正弦波のような定常信号を入力した場合には、SFfiが変化する瞬間がユーザに知覚されてしまう。
本発明は、このような従来の実情に鑑みて提案されたものであり、高音質な符号化列を出力する信号処理装置及び信号処理方法、並びにプログラムを提供することを目的とする。
上述の課題を解決するために、本発明に係る信号処理装置は、時間信号を周波数成分に変換し、上記周波数成分を複数の信号成分に分離し、上記複数の信号成分のそれぞれに対して独立に正規化を行った後、上記正規化された信号成分に対して量子化及び符号化を行い、多重化して得られる符号列に対して、信号のレベル調整を行う信号処理装置において、上記符号列の正規化スペクトルデータ及び1次追加信号成分の正規化係数に第1の整数値を加算又は減算する増減手段と、上記1次追加信号成分を複製し、該複製した1次追加信号成分の正規化係数に第2の整数値を加算又は減算し、2次追加信号成分を生成する追加信号成分生成手段と、上記正規化スペクトルデータと上記1次追加信号成分と上記2次追加信号成分とを多重化する多重化手段とを備える。
また、本発明に係る信号処理方法は、時間信号を周波数成分に変換し、上記周波数成分を複数の信号成分に分離し、上記複数の信号成分のそれぞれに対して独立に正規化を行った後、上記正規化された信号成分に対して量子化及び符号化を行い、多重化して得られる符号列に対して、信号のレベル調整を行う信号処理方法であって、上記符号列の正規化スペクトルデータ及び1次追加信号成分の正規化係数に第1の整数値を加算又は減算する増減工程と、上記1次追加信号成分を複製し、該複製した1次追加信号成分の正規化係数に第2の整数値を加算又は減算し、2次追加信号成分を生成する追加信号成分生成工程と、上記正規化スペクトルデータと上記1次追加信号成分と上記2次追加信号成分とを多重化する多重化工程とを有する。
また、本発明に係るプログラムは、時間信号を周波数成分に変換し、上記周波数成分を複数の信号成分に分離し、上記複数の信号成分のそれぞれに対して独立に正規化を行った後、上記正規化された信号成分に対して量子化及び符号化を行い、多重化して得られる符号列に対して、信号のレベル調整を行う信号処理をコンピュータに実行させるためのプログラムであって、上記符号列の正規化スペクトルデータ及び1次追加信号成分の正規化係数に第1の整数値を加算又は減算する増減工程と、上記1次追加信号成分を複製し、該複製した1次追加信号成分の正規化係数に第2の整数値を加算又は減算し、2次追加信号成分を生成する追加信号成分生成工程と、上記正規化スペクトルデータと上記1次追加信号成分と上記2次追加信号成分とを多重化する多重化工程とを有する。
本発明によれば、符号列の1次追加信号成分を複製し、該複製した1次追加信号成分の正規化係数に第2の整数値を加算又は減算し、2次追加信号成分を生成することにより、高品質な符号列を得ることができる。
以下、図面を参照しながら、本発明の実施の一形態について説明する。本発明の具体例として示す信号処理装置は、符号列を復号することなく音量の増減を行うものである。
図1は、信号処理装置に入力される符号列を構成する符号化フレームの一例を示す図である。各符号化フレームは、ヘッダ、追加信号成分個数情報、1次追加信号成分、正規化係数情報、正規化信号データ、及び余剰ビットから構成されている。
このような符号列は、例えば特許第3336617号公報に記載されているように、入力PCM(Pulse-Code Modulation)信号を周波数成分に変換し、周波数成分を複数の信号成分に分離して複数の信号成分のそれぞれに対して独立に正規化を行った後、量子化及び符号化を行い、多重化することで得ることができる。
周波数成分は、入力PCM信号に対してサブバンド分割フィルタを用いて得られたサブバンド信号に対して周波数成分への変換を行って得ることができる。ここで、周波数成分は、サブバンド信号に対してゲイン制御を行った後の時間信号に対して周波数成分への変換を行ったものであってもよい。又は、入力PCM信号に対してゲイン制御を行った後の時間信号に対して周波数成分への変換を行ったものであってもよい。また、周波数成分への変換は、MDCT(修正離散コサイン変換)を用いることができる。
追加信号成分個数情報は、追加信号成分の個数を示す値であり、図1に示す例では1次追加信号成分が追加信号成分として1つ含まれているので1となる。1次追加信号成分は、さらに、1次追加信号成分の周波数軸上の位置を示す追加信号成分位置情報、1次追加信号成分の正規化係数を示す正規化係数情報、及び1次追加信号成分の正規化スペクトルデータから構成されている。正規化スペクトルデータは、スペクトルデータの正規化係数情報を用いて正規化したものである。余剰ビットは、符号化フレームで使用される総ビット数から、前述の符号化要素を含む全ての符号化要素に使用されたビット数を引いたものである。
このように1次追加信号成分及び正規化スペクトルデータは、それぞれ個別な正規化係数を用いて正規化され、それぞれの正規化係数情報とともに符号列中に多重化されている。
図2は、1次追加信号成分と正規化スペクトルデータとの関係を模式的に示す図である。この図2に示すように、図1に示すような符号化フレームを復号する場合、正規化スペクトルデータと1次追加信号成分とを加算すれば、合成スペクトルデータが得られ、これを周波数時間変換すれば出力時間信号が得られる。
図3は、第1の実施の形態における信号処理装置の構成を示すブロック図である。この信号処理装置10は、非多重化回路11と、正規化係数情報増減回路12と、信号成分追加判定回路13と、追加信号成分正規化係数情報増減回路14と、多重化回路15とを備えている。
非多重化回路11は、入力された符号列を非多重化し、正規化係数情報を正規化係数情報増減回路12に供給し、1次追加信号成分を正規化係数情報増減回路12、信号成分追加判定回路13及び追加信号成分正規化係数情報増減回路14に供給し、符号列ビット位置情報を信号成分追加判定回路13に供給し、正規化スペクトルデータ等の各符号要素を多重化回路15へと供給する。
正規化係数情報増減回路12は、後述する正規化係数情報1次増減量をもとに1次追加信号成分の正規化係数情報を含む正規化係数情報の増減を行う。この正規化係数情報の計算の結果、正規化係数情報がとり得る上限値又は下限値を越えていた場合は、それぞれ上限値又は下限値に置き換える。正規化係数情報増減回路12で増減された正規化係数情報は、多重化回路15に供給される。ここでの正規化係数情報の増減に関しては、特許第3879250号と同様な方法を用いることができる。
信号成分追加判定回路13は、符号列ビット位置情報から余剰ビット量を算出し、余剰ビット量と1次追加信号成分の符号量とを比較する。余剰ビット量が1次追加信号成分の符号量以上の場合、後述する2次追加信号成分の追加が可能であると判断する。また、余剰ビット量が1次追加信号成分の符号量よりも小さい場合、後述する2次追加信号成分の追加が不可能であると判断する。そして、この判断結果を信号成分追加判定フラグとして追加信号成分正規化係数情報増減回路14に出力する。
追加信号成分正規化係数情報増減回路14は、信号成分追加判定回路13から送られた信号成分追加判定フラグが真であった場合、入力された1次追加信号成分を複製し、2次追加信号成分を生成する。そして、2次追加信号成分に対して、後述する正規化係数情報2次増減量をもとに正規化係数情報の増減を行う。この際、正規化係数情報がとり得る上限値又は下限値を越えていた場合は、それぞれ上限値又は下限値に置き換える。追加信号成分正規化係数情報増減回路14で生成された2次追加信号成分は、多重化回路15へと送られる。
多重化回路15は、正規化係数情報増減回路12から出力された正規化係数情報及び1次追加信号成分と、追加信号成分正規化係数情報増減回路14から出力された2次追加信号成分と、非多重化回路11から出力された各符号要素とを入力とし、それぞれの要素について多重化を行い、出力符号列を出力する。
また、信号処理装置は、正規化係数情報1次増減量及び正規化係数情報2次増減量を算出するレベル制御部をさらに備える構成としてもよい。
図4は、本実施の形態における信号処理装置から出力される出力符号列の一例を示す図である。多重化回路15で多重化された符号列には、新たに2次追加信号成分が追加されているため、追加信号成分個数情報は2となる。また、余剰ビット量は、2次追加成分として1次追加成分が複製された分だけ減少する。
このように1次追加信号成分を複製して同じ正規化係数テーブルを利用する新たな2次追加信号成分を追加し、1次追加信号成分及び2次追加信号成分のそれぞれの正規化係数情報を増減させることにより、正規化係数テーブルが持つ分解能以上に細かく調整することができる。
図5は、正規化スペクトルデータ及び1次追加信号成分に関する正規化係数情報を増減させるとともに、2次追加信号成分に関する正規化係数情報を増減させる場合を模式的に示す図である。この図5の右図において、点線は正規化係数の修正前を表し、一方、実線は正規化係数情報1次増減量及び正規化係数情報2次増減量によって修正された後の正規化係数を表している。
例えば、図1に示す符号列が非多重化回路11に入力される場合、正規化係数情報増減回路12にて、フレームの信号成分の正規化係数情報と1次追加信号成分の正規化係数情報とが正規化係数情報1次増減量に応じて修正される。また、追加信号成分正規化係数情報増減回路14にて、2次追加信号成分の正規化係数情報が正規化係数情報2次増減量に応じて修正される。つまり、1次追加信号成分を複製した2次追加信号成分の追加信号成分位置情報や正規化スペクトルなどは1次追加信号成分の値を用い、正規化係数情報のみを正規化係数情報2次増減量で修正する。
このように正規化係数情報が修正された正規化スペクトルデータと1次追加信号成分と2次追加信号成分とを加算すれば、合成スペクトルデータが得られ、これを周波数時間変換すれば、高音質な出力時間信号が得られる。
次に、正規化係数情報1次増減量と正規化係数情報2次増減量との関係について説明する。これらの増減量は、フェードイン、フェードアウト等の区間に応じて外部回路において計算してもよいし、予め計算した値をテーブル等に保持し、処理フレーム毎に該当する値を読み出してもよい。
図6は、信号処理装置から出力された符号列を復号化装置において復号した場合のスペクトルデータと1次追加信号成分と2次追加信号成分との時間軸上の関係を模式的に示す図である。図中の網掛けで表示されている部分が、2次追加信号成分に相当する。この2次追加信号成分は、1次追加成分及びスペクトルデータの正規化係数情報の変更によって生じる階段状の部分を補間している。
ここで、正規化係数情報1次増減量と正規化係数情報2次増減量の関係について詳細に説明を行う。前述のフェード関数Fa(t)から正規化係数情報1次増減量を以下の式によって求める。
SFfi1(frame)=−10*log10(Fa(frame))
また、例えばFa(frame)とSFfi1(frame)との差分を補填する正規化係数情報2次増減量を以下の式によって求める。
SFfi2(frame)=−10*log10(Fa(frame)−10^(−SFfi1(frame)/10))
図7は、SFfi1(frame)及びSFfi2(frame)の一例を示す図である。
このように正規化係数情報2次増減量を用いてフェード関数と正規化係数情報1次増減量で調整された信号レベルとの差分を補填するように正規化係数情報を増減させた追加信号成分を生成することにより、正規化係数テーブルの分解能の制限によって生じる音量制御の最小調整幅を正規化係数テーブルが持つ分解能以上に細かく調整することができる。これにより、フェード関数の滑らかな出力時間信号を得ることができる。
図8は、第2の実施の形態における信号処理装置の構成を示すブロック図である。この信号処理装置20は、非多重化回路21と、正規化係数情報増減回路22と、ビット再配分回路23と、追加信号成分正規化係数情報増減回路24と、多重化回路25とを備えている。この信号処理装置20は、第1の実施の形態の信号処理装置10において、信号成分追加判定回路13の代わりに、余剰ビットを確保するためのビット再配分回路23を備えている。
非多重化回路21は、入力された符号列を非多重化し、正規化係数情報を正規化係数情報増減回路22に供給し、1次追加信号成分を正規化係数情報増減回路22、ビット再配分回路23及び追加信号成分正規化係数情報増減回路24に供給し、符号列ビット位置情報及び正規化スペクトルデータ等の各符号要素をビット再配分回路23に供給する。
正規化係数情報増減回路22は、正規化係数情報1次増減量をもとに1次追加信号成分の正規化係数情報を含む正規化係数情報の増減を行う。この正規化係数情報の計算の結果、正規化係数情報がとり得る上限値又は下限値を越えていた場合は、それぞれ上限値又は下限値に置き換える。正規化係数情報増減回路22で増減された正規化係数情報は、多重化回路25に供給される。
ビット再配分回路23は、非多重化回路21から与えられる、符号列ビット位置情報、1次追加信号成分及び各符号要素を入力とし、1次追加信号成分から2次追加信号成分を作り出すためのビット量が十分にあるかどうかを判定する。そして、ビット量が不足している場合にはビット再配分を行うことにより、スペクトルデータ等のビットを削減し、2次追加信号成分の追加が可能なビット量を産み出す。
ビット再配分に関しては、一般的なオーディオ高能率符号化方式におけるビット配分アルゴリズムを利用することができる。また、すでにビット配分済みであることを利用して、高域側の正規化係数が小さな周波数帯域の正規化スペクトルデータを0としてしまうような簡易的なビット削減方法を行ってもよい。
追加信号成分正規化係数情報増減回路24は、入力された1次追加信号成分を複製し、2次追加信号成分を生成する。そして、2次追加信号成分に対して、正規化係数情報2次増減量をもとに正規化係数情報の増減を行う。この際、正規化係数情報がとり得る上限値又は下限値を越えていた場合は、それぞれ上限値又は下限値に置き換える。追加信号成分正規化係数情報増減回路24で生成された2次追加信号成分は、多重化回路25へと送られる。
多重化回路25は、正規化係数情報増減回路22から出力された正規化係数情報及び1次追加信号成分と、追加信号成分正規化係数情報増減回路24から出力された2次追加信号成分と、ビット再配分回路23から出力された各符号要素とを入力とし、それぞれの要素について多重化を行い、出力符号列を出力する。
このように新たな追加信号成分を符号列に加える余剰ビットが無い場合でも、ビット再配分を行い、追加信号成分の追加が可能なビット量を確保することにより、追加信号成分を効果的に用いることができる。一般に、前述のような階段状のフェード関数となった場合にそれが知覚できるのは、正弦波のような単一周波数かつ振幅が一定値の信号の場合が特に顕著であり、一般楽曲のような複雑な信号においては階段状のフェード関数の効果が知覚できない場合がほとんどである。前述の正弦波のような信号では、ビットレートにもよるが、一般的に余剰ビットが十分に確保できる場合が多く、特に問題とはならないが、この第2の実施の形態のように、余剰ビットを確保する処理を行った後、追加信号成分を加えることにより、滑らかなフェード関数を実現することができる。
図9は、第3の実施の形態における信号処理装置の構成を示すブロック図である。この信号処理装置30は、非多重化回路31と、正規化係数情報増減回路32と、信号成分追加判定回路33と、追加信号成分正規化係数情報増減回路34と、多重化回路35と、1次追加信号成分生成回路36とを備えている。この信号処理装置30は、第1の実施の形態の信号処理装置10の構成に加え、1次追加信号成分生成回路36を備えている。なお、その他の構成は、第1の実施の形態の信号処理装置10の構成と同じであるため、説明を省略する。
非多重化回路31は、入力された符号列を非多重化し、正規化係数情報を正規化係数情報増減回路32及び1次追加信号成分生成回路36に供給し、正規化スペクトルデータを1次追加信号成分生成回路36に供給し、符号列ビット位置情報を信号成分追加判定回路33に供給し、各符号要素を多重化回路35へと供給する。
正規化係数情報増減回路32は、正規化係数情報1次増減量をもとに正規化係数情報の増減を行う。この正規化係数情報の計算の結果、正規化係数情報がとり得る上限値又は下限値を越えていた場合は、それぞれ上限値又は下限値に置き換える。正規化係数情報増減回路32で増減された正規化係数情報は、多重化回路35に供給される。
信号成分追加判定回路33は、符号列ビット位置情報から余剰ビット量を算出し、余剰ビット量と1次追加信号成分の符号量とを比較する。余剰ビット量が1次追加信号成分の符号量以上の場合、後述する2次追加信号成分の追加が可能であると判断する。また、余剰ビット量が1次追加信号成分の符号量よりも小さい場合、1次追加信号成分の追加が不可能であると判断する。そして、この判断結果を信号成分追加判定フラグとして追加信号成分正規化係数情報増減回路34に出力する。
追加信号成分正規化係数情報増減回路34は、信号成分追加判定回路33から送られた信号成分追加判定フラグが真であった場合、入力された1次追加信号成分に対して、正規化係数情報2次増減量をもとに正規化係数情報の増減を行う。この際、正規化係数情報がとり得る上限値又は下限値を越えていた場合は、それぞれ上限値又は下限値に置き換える。追加信号成分正規化係数情報増減回路34で生成された1次追加信号成分は、多重化回路35へと送られる。
多重化回路35は、正規化係数情報増減回路32から出力された正規化係数情報と、追加信号成分正規化係数情報増減回路34から出力された1次追加信号成分と、非多重化回路31から出力された各符号要素とを入力とし、それぞれの要素について多重化を行い、出力符号列を出力する。
1次追加信号成分生成回路36は、符号列中の正規化係数情報と正規化スペクトルデータから、振幅の大きい特定のスペクトルを新たに抽出し、新たに1次追加信号とする。
この信号処理装置30においては、元のスペクトルデータは一切変更する必要が無く、前述した方法で正規化係数情報に対して正規化係数情報1次増減量を用いて修正を行い、新たに生成された1次追加信号成分に対しては、正規化係数情報2次増減量を用いて1次追加信号成分の正規化係数情報の修正を行えばよい。
このように符号列中に1次追加信号成分が無い場合でも、1次追加信号成分を生成し、正規化係数情報2次増減量を適用することで、滑らかなフェード関数を実現することができる。
信号処理装置に入力される符号列を構成する符号化フレームの一例を示す図である。 1次追加信号成分と正規化スペクトルデータとの関係を模式的に示す図である。 第1の実施の形態における信号処理装置の構成を示すブロック図である。 本実施の形態における信号処理装置から出力される出力符号列の一例を示す図である。 2次追加信号成分に関する正規化係数情報の増減を模式的に示す図である。 スペクトルデータと1次追加信号成分と2次追加信号成分との時間軸上の関係を模式的に示す図である。 正規化係数情報1次増減量及び正規化係数情報2次増減量の一例を示す図である。 第2の実施の形態における信号処理装置の構成を示すブロック図である。 第3の実施の形態における信号処理装置の構成を示すブロック図である。 6ビットの正規化係数情報と対応する正規化係数との関係の一例を示す図である。 フェードインを実現する際の、フェード関数とそれに対応する正規化係数情報の減算量との関係を示す図である。 フェード関数に対応する正規化係数情報減算量の一例を示す図である。
符号の説明
10 信号処理装置、 11 非多重化回路、 12 正規化係数情報増減回路、 13 信号成分追加判定回路、 14 追加信号成分正規化係数情報増減回路、 15 多重化回路

Claims (6)

  1. 時間信号を周波数成分に変換し、上記周波数成分を複数の信号成分に分離し、上記複数の信号成分のそれぞれに対して独立に正規化を行った後、上記正規化された信号成分に対して量子化及び符号化を行い、多重化して得られる符号列に対して、信号のレベル調整を行う信号処理装置において、
    上記符号列の正規化スペクトルデータ及び1次追加信号成分の正規化係数に第1の整数値を加算又は減算する増減手段と、
    上記1次追加信号成分を複製し、該複製した1次追加信号成分の正規化係数に第2の整数値を加算又は減算し、2次追加信号成分を生成する追加信号成分生成手段と、
    上記正規化スペクトルデータと上記1次追加信号成分と上記2次追加信号成分とを多重化する多重化手段と
    を備える信号処理装置。
  2. 上記符号列中に上記2次追加信号成分が追加可能な余剰ビットが存在するか否かを判定する判定手段を備え、
    上記追加信号成分生成手段は、上記符号列中に上記2次追加信号成分が追加可能な余剰ビットが存在する場合、2次追加信号成分を生成することを特徴とする請求項1記載の信号処理装置。
  3. 上記符号列中のビットを削減し、上記2次追加信号成分が追加可能な余剰ビットを作り出すビット再分配手段を備えることを特徴とする請求項1項に記載の信号処理装置。
  4. 信号をレベル調整する制御関数に基づいて上記第1の整数値及び第2の整数値を算出するレベル制御手段を備え、
    上記レベル制御手段は、上記制御関数の値と上記第1の整数値により調整された信号レベルとの差分を補填するように上記第2の整数値を算出することを特徴とする請求項1記載の信号処理装置。
  5. 時間信号を周波数成分に変換し、上記周波数成分を複数の信号成分に分離し、上記複数の信号成分のそれぞれに対して独立に正規化を行った後、上記正規化された信号成分に対して量子化及び符号化を行い、多重化して得られる符号列に対して、信号のレベル調整を行う信号処理方法であって、
    上記符号列の正規化スペクトルデータ及び1次追加信号成分の正規化係数に第1の整数値を加算又は減算する増減工程と、
    上記1次追加信号成分を複製し、該複製した1次追加信号成分の正規化係数に第2の整数値を加算又は減算し、2次追加信号成分を生成する追加信号成分生成工程と、
    上記正規化スペクトルデータと上記1次追加信号成分と上記2次追加信号成分とを多重化する多重化工程と
    を有する信号処理方法。
  6. 時間信号を周波数成分に変換し、上記周波数成分を複数の信号成分に分離し、上記複数の信号成分のそれぞれに対して独立に正規化を行った後、上記正規化された信号成分に対して量子化及び符号化を行い、多重化して得られる符号列に対して、信号のレベル調整を行う信号処理をコンピュータに実行させるためのプログラムであって、
    上記符号列の正規化スペクトルデータ及び1次追加信号成分の正規化係数に第1の整数値を加算又は減算する増減工程と、
    上記1次追加信号成分を複製し、該複製した1次追加信号成分の正規化係数に第2の整数値を加算又は減算し、2次追加信号成分を生成する追加信号成分生成工程と、
    上記正規化スペクトルデータと上記1次追加信号成分と上記2次追加信号成分とを多重化する多重化工程と
    を有するプログラム。
JP2007197960A 2007-07-30 2007-07-30 信号処理装置及び信号処理方法、並びにプログラム Expired - Fee Related JP5098492B2 (ja)

Priority Applications (7)

Application Number Priority Date Filing Date Title
JP2007197960A JP5098492B2 (ja) 2007-07-30 2007-07-30 信号処理装置及び信号処理方法、並びにプログラム
PCT/JP2008/061614 WO2009016902A1 (ja) 2007-07-30 2008-06-26 信号処理装置及び信号処理方法、並びにプログラム
EP08790629.3A EP2187388B1 (en) 2007-07-30 2008-06-26 Signal processing device, signal processing method, and program
CN2008800035982A CN101595524B (zh) 2007-07-30 2008-06-26 信号处理设备、信号处理方法
US12/524,992 US8290784B2 (en) 2007-07-30 2008-06-26 Signal processing method and program
KR1020097009982A KR20100039823A (ko) 2007-07-30 2008-06-26 신호처리장치 및 신호처리방법과 프로그램
HK10100801.7A HK1133944A1 (en) 2007-07-30 2010-01-26 Signal processing apparatus, and signal processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007197960A JP5098492B2 (ja) 2007-07-30 2007-07-30 信号処理装置及び信号処理方法、並びにプログラム

Publications (2)

Publication Number Publication Date
JP2009031676A JP2009031676A (ja) 2009-02-12
JP5098492B2 true JP5098492B2 (ja) 2012-12-12

Family

ID=40304139

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007197960A Expired - Fee Related JP5098492B2 (ja) 2007-07-30 2007-07-30 信号処理装置及び信号処理方法、並びにプログラム

Country Status (7)

Country Link
US (1) US8290784B2 (ja)
EP (1) EP2187388B1 (ja)
JP (1) JP5098492B2 (ja)
KR (1) KR20100039823A (ja)
CN (1) CN101595524B (ja)
HK (1) HK1133944A1 (ja)
WO (1) WO2009016902A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5045295B2 (ja) * 2007-07-30 2012-10-10 ソニー株式会社 信号処理装置及び方法、並びにプログラム
JP5679253B2 (ja) * 2009-05-26 2015-03-04 国立大学法人東京工業大学 自立性高分子薄膜

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE211326T1 (de) 1993-05-31 2002-01-15 Sony Corp Verfahren und vorrichtung zum kodieren oder dekodieren von signalen und aufzeichnungsmedium
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
JP3164038B2 (ja) 1997-11-05 2001-05-08 日本電気株式会社 音声帯域分割復号装置
JP3879250B2 (ja) 1998-05-14 2007-02-07 ソニー株式会社 エンコード方法、デコード方法、エンコード装置、デコード装置、ディジタル信号記録方法、ディジタル信号記録装置、記録媒体、ディジタル信号送信方法及びディジタル信号送信装置
US6353584B1 (en) 1998-05-14 2002-03-05 Sony Corporation Reproducing and recording apparatus, decoding apparatus, recording apparatus, reproducing and recording method, decoding method and recording method
JP3879249B2 (ja) 1998-05-14 2007-02-07 ソニー株式会社 エンコード方法、デコード方法、エンコード装置、デコード装置、ディジタル信号記録方法、ディジタル信号記録装置、記録媒体、ディジタル信号送信方法及びディジタル信号送信装置
JP4639441B2 (ja) * 1999-09-01 2011-02-23 ソニー株式会社 ディジタル信号処理装置および処理方法、並びにディジタル信号記録装置および記録方法
JP2001134294A (ja) * 1999-11-10 2001-05-18 Toshiba Corp オーディオ信号のビットストリームの処理方法及び処理装置
US20020150246A1 (en) * 2000-06-28 2002-10-17 Akira Ogino Additional information embedding device and additional information embedding method
JP2002304198A (ja) * 2001-04-05 2002-10-18 Sony Corp 信号処理装置および信号処理方法
JP4296752B2 (ja) * 2002-05-07 2009-07-15 ソニー株式会社 符号化方法及び装置、復号方法及び装置、並びにプログラム
JP2004361602A (ja) * 2003-06-04 2004-12-24 Sony Corp データ生成方法およびデータ生成装置、データ復元方法およびデータ復元装置、並びにプログラム
CA2457988A1 (en) * 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
JP4635709B2 (ja) * 2005-05-10 2011-02-23 ソニー株式会社 音声符号化装置及び方法、並びに音声復号装置及び方法

Also Published As

Publication number Publication date
EP2187388B1 (en) 2013-10-02
CN101595524B (zh) 2012-09-26
EP2187388A1 (en) 2010-05-19
EP2187388A4 (en) 2012-07-25
JP2009031676A (ja) 2009-02-12
KR20100039823A (ko) 2010-04-16
WO2009016902A1 (ja) 2009-02-05
US20100131281A1 (en) 2010-05-27
US8290784B2 (en) 2012-10-16
HK1133944A1 (en) 2010-04-09
CN101595524A (zh) 2009-12-02

Similar Documents

Publication Publication Date Title
JP4168976B2 (ja) オーディオ信号符号化装置及び方法
JP5048697B2 (ja) 符号化装置、復号化装置、符号化方法、復号化方法、プログラムおよび記録媒体
JP4876574B2 (ja) 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
RU2381571C2 (ru) Синтезирование монофонического звукового сигнала на основе кодированного многоканального звукового сигнала
JP4296752B2 (ja) 符号化方法及び装置、復号方法及び装置、並びにプログラム
JP3926726B2 (ja) 符号化装置および復号化装置
JP4899359B2 (ja) 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
RU2469422C2 (ru) Способ и устройство для формирования уровня улучшения в системе кодирования звука
KR101967122B1 (ko) 신호 처리 장치 및 방법, 및 프로그램
JP2011059714A (ja) 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
JP4736812B2 (ja) 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
US7583804B2 (en) Music information encoding/decoding device and method
WO2011004744A1 (ja) 音響信号処理装置、その処理方法およびプログラム
JP5045295B2 (ja) 信号処理装置及び方法、並びにプログラム
JP4308229B2 (ja) 符号化装置および復号化装置
JP5098492B2 (ja) 信号処理装置及び信号処理方法、並びにプログラム
JP4297078B2 (ja) 復号方法及び装置
JP6492915B2 (ja) 符号化装置、符号化方法、及びプログラム
JP4627737B2 (ja) デジタルデータ復号化装置
JP4641272B2 (ja) デジタルデータ復号化装置
JP2007240902A (ja) デジタルデータ復号化装置
JP5569476B2 (ja) 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
JP2005148539A (ja) オーディオ信号符号化装置およびオーディオ信号符号化方法
JP2017021257A (ja) 符号化装置、符号化方法、及びプログラム
JP2002304184A (ja) 電子透かし情報埋め込み装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100309

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120619

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120809

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120828

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120910

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151005

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151005

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees