JP2013073230A - オーディオ符号化装置 - Google Patents
オーディオ符号化装置 Download PDFInfo
- Publication number
- JP2013073230A JP2013073230A JP2011214802A JP2011214802A JP2013073230A JP 2013073230 A JP2013073230 A JP 2013073230A JP 2011214802 A JP2011214802 A JP 2011214802A JP 2011214802 A JP2011214802 A JP 2011214802A JP 2013073230 A JP2013073230 A JP 2013073230A
- Authority
- JP
- Japan
- Prior art keywords
- harmonic
- unit
- frequency
- output
- output wave
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 claims abstract description 32
- 230000008569 process Effects 0.000 claims abstract description 23
- 230000015572 biosynthetic process Effects 0.000 claims description 82
- 238000003786 synthesis reaction Methods 0.000 claims description 82
- 239000000284 extract Substances 0.000 claims description 11
- 238000006243 chemical reaction Methods 0.000 claims description 9
- 239000004065 semiconductor Substances 0.000 claims description 4
- 230000002194 synthesizing effect Effects 0.000 abstract description 6
- 230000009466 transformation Effects 0.000 abstract 4
- 238000010586 diagram Methods 0.000 description 18
- 238000004458 analytical method Methods 0.000 description 17
- 238000001228 spectrum Methods 0.000 description 17
- 238000013139 quantization Methods 0.000 description 16
- 230000000873 masking effect Effects 0.000 description 15
- 230000004048 modification Effects 0.000 description 13
- 238000012986 modification Methods 0.000 description 13
- 239000008187 granular material Substances 0.000 description 11
- 230000005236 sound signal Effects 0.000 description 10
- 238000004519 manufacturing process Methods 0.000 description 7
- 238000007906 compression Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 230000006835 compression Effects 0.000 description 4
- 230000015654 memory Effects 0.000 description 4
- 101000969688 Homo sapiens Macrophage-expressed gene 1 protein Proteins 0.000 description 3
- 102100021285 Macrophage-expressed gene 1 protein Human genes 0.000 description 3
- 230000035945 sensitivity Effects 0.000 description 3
- 241000282412 Homo Species 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 108091026890 Coding region Proteins 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- PHEDXBVPIONUQT-RGYGYFBISA-N phorbol 13-acetate 12-myristate Chemical compound C([C@]1(O)C(=O)C(C)=C[C@H]1[C@@]1(O)[C@H](C)[C@H]2OC(=O)CCCCCCCCCCCCC)C(CO)=C[C@H]1[C@H]1[C@]2(OC(C)=O)C1(C)C PHEDXBVPIONUQT-RGYGYFBISA-N 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
- G10L19/265—Pre-filtering, e.g. high frequency emphasis prior to encoding
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
【課題】効率的な符号化処理を行なうオーディオ符号化装置を提供する。
【解決手段】音声データを格納する記憶部と、記憶部から音声データを取得するデータ取得制御部と、データ取得制御部から出力される音声データ信号を周波数変換する変換部と、変換部の出力波のうち第1の出力波に基づいて高調波を生成し、高調波と、変換部の出力波のうち第1の出力波より高周波成分である第2の出力波とを合成する倍音生成合成部と、倍音生成合成部からの出力に対して符号化処理を行なう符号化部を備える。
【選択図】図1
【解決手段】音声データを格納する記憶部と、記憶部から音声データを取得するデータ取得制御部と、データ取得制御部から出力される音声データ信号を周波数変換する変換部と、変換部の出力波のうち第1の出力波に基づいて高調波を生成し、高調波と、変換部の出力波のうち第1の出力波より高周波成分である第2の出力波とを合成する倍音生成合成部と、倍音生成合成部からの出力に対して符号化処理を行なう符号化部を備える。
【選択図】図1
Description
本発明は、オーディオ符号化装置であって、特に低周波成分を倍音処理し、周波数シフトすることで低周波成分を除去することにより効率的な符号化処理を行なうオーディオ符号化装置に関する。
従来、デジタルオーディオPCM(Pulse Code Modulation)データの符号化処理装置を用いた録音装置が存在する。オーディオ符号化処理としては、MPEG(Moving Picture Experts Group)において国際標準化が行われているMPEGオーディオ圧縮処理やAC−3圧縮処理などが用いられている。
たとえば、MPEG1 Audio Layer IIIの圧縮処理装置では、入力信号をサブバンド信号に分割し、それに引続きMDCT(Modified Discrete Cosine Transform[修正離散コサイン変換])を行ない、周波数領域のスペクトルに変換する。MDCTスペクトルは、折り返し歪削減バタフライで周波数領域の折返しが除去された後、量子化・ハフマン符号化部に渡される。
量子化・ハフマン符号化部では、心理聴覚分析部で計算された周波数帯域毎の許容量子化雑音電力に関する要求と、ビットレートと、ビットリザーバ(これにより擬似的な可変ビットレートを実現する)の蓄積ビット数とを元にして決定される使用可能ビット数の制限のもとで、ビット割当て部において反復ループ処理により、量子化ステップサイズ、周波数帯域毎の量子化ビット数を変化させ、スケールファクタを決定してMDCTスペクトルを量子化し、量子化インデックスのハフマン符号化を行なう。
なお、サイド情報としては、MDCTの変換ブロック長に関する情報、量子化ステップサイズ、スケールファクタ関連情報、ハフマン符号化の領域・テーブルに関する情報などが伝送される。
上記の符号化処理には、広帯域にわたりデータの多い場合に、全体的にビットが不足し、音質の劣化および効率的なオーディオ符号化処理の妨げとなる問題およびアルゴリズム的に既に高帯域がない場合に音質の劣化となる問題があり、この符号化(量子化)を効率的に行なう技術として、以下の発明が開示されている。
特開2009−237048号公報(特許文献1)は、圧縮処理により高周波成分が失われたオーディオ信号に対して、基音部との相関性がよい高周波数成分を補間することができ、低音を強調してオーディオ信号を再生するとき、周辺への低周波騒音を低減することができるオーディオ信号補間装置を提供することを目的としている。この特開2009−237048号公報(特許文献1)に開示された発明は、オーディオ信号に高周波帯域を補間する高域補間手段と、基本周波数の複数の倍音を付加しオーディオ信号の低周波帯域を強調する低域強調手段と、高域補間手段により高周波成分が補間され低域強調手段により低周波成分が強調されたオーディオ信号から予め定められた低周波成分を除去するフィルタ手段とを備える。
特開2009−244650号公報(特許文献2)は、入力音声信号に基づく高調波成分を入力音声信号に付加する場合でも、歪みの少ない音を得ることを目的としている。この特開2009−244650号公報(特許文献2)に開示された発明は、入力音声信号からスピーカの再生周波数帯域以下の周波数帯域である基本波帯域成分を抽出する基本波抽出回路と、基本波帯域成分の高調波を発生する高調波発生回路と、基本波帯域成分のレベルを低域レベルとして検出する低域レベル検出回路と、入力音声信号から前記基本波帯域成分より上の高調波帯域成分を抽出する高域成分抽出回路と、高調波帯域成分のレベルを高域レベルとして検出する高域レベル検出回路と、高域レベルに対する低域レベルの比率と高調波が歪みとなるか否かの閾値とに基づいて高調波が歪みとならないように高調波発生回路における高調波の発生量を制御する制御量演算回路とを有する。
特開2000−004163号公報(特許文献3)は、ディジタル音声圧縮システムに対して広く使用可能であり、容易にかつ低コストで実施可能なオーディオ符号化のための動的ビット割当て方法及び装置を提供することを目的としている。この特開2000−004163号公報(特許文献3)に開示された発明は、ビット割当て方法及び装置は、簡単化された同期マスキングモデルを用いて人間の聴感特性の音響心理的な振る舞いに注目して、非常に効率的なビット割当て処理を行なう。ここで、周波数分割バンドの各ユニットのピークエネルギーを計算し、簡単化された同時マスキング効果モデルを用いたときの最小可聴限界であるマスキング効果値を計算して各ユニットの絶対閾値として設定する。次いで、各ユニットの信号対マスキング比を計算し、これに基づいて、効率的な動的ビット割当てを行なう。
また、音圧レベルと周波数との関係として等ラウドネス曲線(図示せず)が国際標準規格化されている。この等ラウドネス曲線は、ISO 226:2003「Acoustics−−Normal equal−loudness−level contours」として国際標準規格化され、その内容は、音の周波数を変化させたときに等しいラウドネス(人間の聴覚による音の大きさ、騒音のうるささ)になる音圧レベルを測定し、等高線として結んだものである。従って、この等ラウドネス曲線の等高線のうちヒアリングスレッショルド(最小可聴限界値、音圧が最も低い等高線)以下は人間の耳では聴こえないとされている。
また等ラウドネス曲線から、周波数1kHz付近あるいは周波数帯3〜5kHzにかけて、非常に感度(音が聞こえやすく)がよく、それ以外の感度は比較的悪化する(音が聞こえにくくなる)ことがわかっている。
一方、バーチャルピッチ効果(所謂、ミッシングファンダメンタル)は、ある音から基本周波数を含む周波数域を取り除いた場合でも、もとの音と同じ音の高さとして認識してしまう現象である。この現象は人の脳が音高を基本周波数だけでなく倍音の比率も援用して知覚しているために起こり、例えば、低域の音を補正する技術は,100Hz未満といった低域の音を再生できない小型スピーカを使っても,再生できないはずの低域の音が「鳴っている」と感じさせ、つまり、原音がなくても,原音の周波数帯域の倍数に当たる音(倍音)が鳴っていれば,原音が聞こえるように人間が錯覚する。例えば、周波数50Hzの音を錯覚させるには、周波数100Hz,150Hz,200Hzといった50Hzの音の倍音成分を発生させればよく、このときには周波数50Hzの音は実際には存在しなくてもよいということがわかっている。
しかしながら、特開2009−237048号公報(特許文献1)および特開2009−244650号公報(特許文献2)に開示された発明は、ミッシングファンダメンタルを利用した高周波数帯の生成手法であって、低周波数帯の生成方法については具体的に検討されていない。
また、特開2000−004163号公報(特許文献3)に開示された発明は、(同時)マスキング閾値計算(通常超重量)の軽量化のためのビット割当て手順の改善についてであって、低周波数帯の生成方法については具体的に検討されていない。
また、広帯域にわたりデータの多い場合に、全体的にビットが不足し、音質の劣化する問題もある。オーディオデータ以外のデータが増加することによる割当てビットの各周波数帯域間またはスケールファクタ帯域(レベル情報同一群)間の分散割当てによる量子化ロス(量子化ノイズ)の発生、符号化情報などの冗長性の問題が生じる。
本発明の目的は、効率的な符号化処理を行なうオーディオ符号化装置を提供することである。
本発明の一実施例においては、符号化部による符号化処理前に低周波数帯(上位帯域における倍音に対する基本周波数)の情報を上位周波数帯(基本周波数波を自然数倍した周波数、所謂、倍音)へ合成し、低周波数帯へのビット割当て用のビット量を削減し、そのビット量分を上位周波数帯に割当て符号化処理をする。
本発明の一実施例においては、割当てビットの各周波数帯域間、またはスケールファクタ帯域(レベル情報同一群)間の分散割当てによる量子化ロス(量子化ノイズ)の発生、符号化情報などの冗長性を低減し、高音質化および高効率化を実現できる。
以下、本発明について図面を参照して詳しく説明する。なお、図中同一又は相当部分には同一の符号を付してその説明は繰返さない。
[実施の形態1]
図1は、本発明の実施の形態1におけるオーディオ符号化装置100の構成例を示すブロック図である。図1を参照して、このオーディオ符号化装置100は、入力用のバッファとして用いられるメモリ、例えばSDRAM(Synchronous Dynamic Random Access Memory)101と、データ取得制御部102と、サブバンド分析フィルタ部108とMDCTフィルタ部103と、倍音生成合成部104と、符号化部105と、出力用のバッファとして用いられるメモリ、例えばSDRAM106と、最小可聴限界値、マスキング効果値をMDCTフィルタ部103、倍音生成合成部104および符号化部105に与える音響心理分析部107とを含む。
図1は、本発明の実施の形態1におけるオーディオ符号化装置100の構成例を示すブロック図である。図1を参照して、このオーディオ符号化装置100は、入力用のバッファとして用いられるメモリ、例えばSDRAM(Synchronous Dynamic Random Access Memory)101と、データ取得制御部102と、サブバンド分析フィルタ部108とMDCTフィルタ部103と、倍音生成合成部104と、符号化部105と、出力用のバッファとして用いられるメモリ、例えばSDRAM106と、最小可聴限界値、マスキング効果値をMDCTフィルタ部103、倍音生成合成部104および符号化部105に与える音響心理分析部107とを含む。
SDRAM101は、符号化するデータ、たとえば音楽データを一時的に保持するバッファである。また、SDRAM106は、符号化した後のデータを一時的に保持するバッファである。SDRAM101とSDRAM106とは、異なる半導体メモリで構成されてもよいし、同じ半導体メモリで構成され、その領域を入力用バッファと出力用バッファとに分割して使用するようにしてもよい。
データ取得制御部102は、SDRAM101に保持されるデータを所定のフレーム、たとえば、1フレーム分だけ取得して、サブバンド分析フィルタ部108に出力する。
サブバンド分析フィルタ部108は、データ取得制御部102から受けた1フレーム分のデータをサブバンドに分割して、MDCTフィルタ部103に出力する。
サブバンド分析フィルタ部108は、データ取得制御部102から受けた1フレーム分のデータをサブバンドに分割して、MDCTフィルタ部103に出力する。
MDCTフィルタ部103は、サブバンド分析フィルタ部108から受けたデータのMDCT係数を算出する。
音響心理分析部107は、音声データをFFT(Fast Fourier Transform)し、周波数スペクトルを元に、最小可聴限界値、マスキング効果値を算出する。この算出した情報から、倍音生成合成部104、を制御し、また、符号化部105を制御する。これによって、符号化部105は、各スケールファクタバンドの割り当てビットを決定する。
図2は、圧縮データ(ストリーム)のデータ形式の構成の一例を示す図である。図2を参照して、たとえば、本発明の一実施例から生成されたMP3(MPEG1 Audio Layer 3)圧縮データの構成を示す。
MP3圧縮データ(ファイル)は、通常、複数のフレームで構成し、1フレームは、1152サンプル(MPEG1 Audio Layer 3の場合)からなる。1フレームは、ヘッダと、任意選択のエラー防止用CRCと、スケールファクタと呼ばれる整数値と音楽そのものを特徴づけるデータであるハフマン列とを格納するオーディオデータと、被圧縮音楽データの特徴を表すデータや圧縮する際使用される補助情報等が格納されるサイド情報と、各フレームの終わりに、何らかの補助データが格納される付加データとから構成される。また1フレームは、576サンプルを1グラニュールという単位を用いると、2グラニュールの構成となる。
さらに、オーディオデータのグラニュールGR0は、当該フレームに含まれる二つのグラニュールのうち時刻の早い方のグラニュールを指す。従って、グラニュールGR1は、残りのグラニュールである。
グラニュールGR0は、ステレオ・オーディオに対応するチャンネル0、1の構成をとり、さらに各チャンネルは、スケールファクタおよびハフマン列の構成をとる。具体的には、チャンネル0は、スケールファクタA0とハフマン列P0の構成をとり、チャンネル1はスケールファクタA1とハフマン列P1の構成をとる。
グラニュールGR1も、グラニュールGR0と同様に、ステレオ・オーディオに対応するチャンネル0、1の構成をとり、さらに各チャンネルは、スケールファクタおよびハフマン列の構成をとる。具体的には、チャンネル0は、スケールファクタB0とハフマン列Q0の構成をとり、チャンネル1はスケールファクタB1とハフマン列Q1の構成をとる。
再度図1を参照して、符号化部105は、倍音生成合成部104によって倍音合成された、もしくは、元のMDCT処理された出力に対して、決定されたマスキング値に応じて、スケールファクタバンド毎に、その成分を量子化する。ここで、量子化の前に、図示しないが、バタフライ演算、ステレオ演算処理などの音響処理を施す機能を有するものとする。さらに、符号化部105によって実際に符号化されたときの符号量を受け、ビットレート(符号量)の余剰分を繰越量として管理し、それ以降のフレームに割当てる機能も有している。
符号化部105は、倍音生成合成部104によって、合成された後のスケールファクタバンドの信号成分に対して、所定のビットレートの目標値(符号量)となるようにフレームのデータを符号化し、符号化データをSDRAM106に書き込む。
図3は、倍音生成合成部104の主要部を示すブロック図である。
図3を参照して、倍音生成合成部104は、波形合成部120と、高調波生成部130とを含む。波形合成部120および高調波生成部130の入力端子にはMDCTフィルタ部103の出力信号が与えられ、高調波生成部130の出力信号は、波形合成部120へ供給される。
図3を参照して、倍音生成合成部104は、波形合成部120と、高調波生成部130とを含む。波形合成部120および高調波生成部130の入力端子にはMDCTフィルタ部103の出力信号が与えられ、高調波生成部130の出力信号は、波形合成部120へ供給される。
高調波生成部130は、MDCTフィルタ部103の出力を受け、この出力信号から倍音を生成するための基本波となる信号を抽出するLPF(Low Pass Filter)204と、LPF204によって抽出される低周波成分のうち、音響心理分析部107によって、最小可聴限界値以上、マスキング効果値を超えると判別されたパワースペクトルを有する周波数を自然数倍した高調波を生成(倍音処理)する倍音生成部304とを含む。また、その周波数成分が存在しなければ、倍音生成合成部104は、フィルタリングおよび倍音の生成、元の信号への合成も一切する必要はない。ここで、その存在の有無は、所定の基本周波数に関して音響心理分析部107にて検出されるものとする。
一方、波形合成部120は、MDCTフィルタ部103の出力を受け、この出力の高周波成分の周波数のみを抽出するBPF(Band Pass Filter)202と、高調波生成部130からの出力信号とBPF202からの出力信号とを加重合成する合成部としてたとえば加算器402とを含む。なお、BPF202によって抽出される周波数成分はLPF204によって抽出される周波数成分より高い周波数を有する。
なお、例えば、倍音生成部304について、図示はしないが上述した基本波から少なくとも奇数次倍音の成分を含む信号を生成する奇数倍音生成部と、基本波の少なくとも偶数次倍音の成分を含む信号を生成する偶数倍音生成部とを含んでいてもよい。この場合には、奇数倍音生成部からの出力信号と偶数倍音生成部からの出力信号とは所定の比率で合成してもよい。このように、グルーピングすることにより、処理量を低減することができる。
基本100Hzの場合、200Hz、400Hz、600Hz、800Hzのみの8次までとして、処理量を低減してもよい。
基本100Hzの場合、200Hz、400Hz、600Hz、800Hzのみの8次までとして、処理量を低減してもよい。
また、生成する倍音のレベルは、高域になるにつれて下げていき、前記等ラウドネス曲線に則って、2kHzで音圧レベルが0デシベルになるように調整する。
また、倍音生成部304は、倍音処理された信号が出力されるとして説明したが、この倍音処理された信号と基本波の信号とを加重合成して出力してもよい。ただし、この場合には、出力信号に低周波成分が再度含まれるため、これらの周波数成分を除去するフィルタ部(たとえばHigh Pass FilterやBand Pass Filter)を設ける必要がある。スピーカの特性にあわせて、基本波より低いHPF(High Pass Filter)のカット周波数を設定する。
この構成を取ることにより、LPF204はMDCTフィルタ部103の出力の低周波成分を抽出し、倍音生成部304はこの抽出された信号に基づいて高調波を生成し、加算器402は、この高調波とMDCTフィルタ部103の出力波のうちLPF204によって抽出された周波数帯よりも高い周波数帯の成分を有する出力波とを加重合成することによって、低周波成分を有しない出力波を生成できる。
ミッシングファンダメンタルにより、人間はこの出力波に除去した低周波成分が含まれると認識する一方、この出力波の低周波成分が除去されているために次段の符号化部105による処理の際にビット割当てを行なわないあるいは劇的に削減することができ、代わりに高域成分の符号化(量子化)に割当てることができ、本実施の形態によるエンコードされた音声データは、量子化ノイズを低減できる。
[変形例]
以下に倍音生成合成部104の変形例1について説明する。
以下に倍音生成合成部104の変形例1について説明する。
図4は、倍音生成合成部104の変形例1の倍音生成合成部104Aの主要部を示すブロック図である。図4を参照して、倍音生成合成部104Aは、倍音生成合成部104と比較して、高調波生成部130の代わりに、高調波生成部130Aを含む。倍音生成合成部104Aの他の構成については、倍音生成合成部104と同様であるため、ここでは説明を繰返さない。
波形合成部120および高調波生成部130Aの入力端子にはMDCTフィルタ部103の出力信号が与えられ、高調波生成部130Aの出力信号は、波形合成部120へ供給される。
高調波生成部130Aは、第1次〜第n次高調波生成部608,610,…,612と、第1次〜第n次高調波生成部の各々の出力を加重合成する合成部としてたとえば加算器404とを含む。
第1次高調波生成部608は、BPF208と、倍音生成部308とを含み、BPF208および倍音生成部308は、MDCTフィルタ部の出力信号が与えられるノードと加算器404の入力ノードとの間に、直列に接続されている。また、第2次〜第n次高調波生成部610,…,612の構成についても同様であるため、ここでは説明を繰返さない。
MDCTフィルタ部103の出力信号の低周波成分を複数に分割し、複数に分割した低周波成分の各々に基づいて、第1次〜第n次高調波生成部608,610,…,612は、それぞれ対応する倍音の信号を生成する。たとえば、0〜100Hzまでの低周波数帯を10Hzごとに分割し、この分割した周波数帯ごとに各高調波生成器によって倍音の信号が生成される。
なお、波形合成部120に含まれるBPF202によって抽出される周波数成分はBPF208,BPF210,…,BPF212によって抽出される周波数成分より高い周波数成分を有する。
第1次〜第n次高調波生成部608,610,…,612の各々の出力信号は加算器404によって加重合成される。加算器402は、加算器404からの出力信号と、BPF202の出力信号とを加重合成し、合成した高調波を符号化部105へ出力する。
また、ここでは第1次〜第n次高調波生成部608,610,…,612の出力については、倍音処理された信号が出力されるとして説明したが、この倍音処理された信号と基本波の信号とを加重合成して出力してもよい。ただし、この場合には、出力信号に低周波成分が再度含まれるため、これらの周波数成分を除去するフィルタ部(たとえばHigh Pass FilterやBand Pass Filter)を設ける必要がある。スピーカの特性にあわせて、基本波より低いHPFのカット周波数を設定する。
この構成を取ることにより、BPF208,210,…,212はMDCTフィルタ部103の出力の低周波成分を複数に分割して抽出し、倍音生成部308,310,…,312はこの抽出された各信号に基づいてそれぞれ対応して高調波を生成し、加算器402は、この高調波とMDCTフィルタ部103の出力のうちBPF202がBPF208,210,…,212によって抽出される周波数帯よりも高い周波数帯を有する出力波とを加重合成することによって、低周波成分を有しない出力波を生成できる。
ミッシングファンダメンタルにより、人間はこの生成信号に除去した低周波成分が含まれると認識する一方、この生成信号の低周波成分が除去されているために次段の符号化部105による処理の際にビット割当てを削減あるいは減少することができ、代わりに高域成分の符号化(量子化)に割当てることができる。
図5は、倍音生成合成部104の変形例2の倍音生成合成部104Bの主要部を示すブロック図である。図5を参照して、倍音生成合成部104Bは、倍音生成合成部104と比較して、高調波生成部130に代えて、高調波生成部130Bを含む。倍音生成合成部104Bの他の構成については、倍音生成合成部104と同様であるため、ここでは説明を繰返さない。
高調波生成部130Bは、MDCTフィルタ部103の出力を受け、この出力信号から高調波を生成するための基本波となる信号を抽出するLPF(Low Pass Filter)204と、LPF204によって抽出される基本波から構成される信号が与えられ自然数倍した高調波を生成し、基本波の周波数成分を加重合成して出力する倍音生成部304Bと、倍音生成部304Bからの出力から基本波の周波数成分以外の成分を通過させるBPF504とを含む。
これにより、倍音生成合成部104、104Aにおいて説明してきたとおり、倍音生成部304Bのように基本波をも含んで出力するような場合には、フィルタ部であるBPF504を設ける必要がある。なお、BPF504に限定されることなく、所定の周波数より高い周波数成分を通過させるHPFを利用してもよい。スピーカの特性にあわせて、基本波より低いHPFのカット周波数を設定する。
図6は、倍音生成合成部104の変形例3の倍音生成合成部104Cの主要部を示すブロック図である。図5を参照して、倍音生成合成部104Cは、倍音生成合成部104と比較して、高調波生成部130に代えて、高調波生成部130Cを含む。倍音生成合成部104Cの他の構成については、倍音生成合成部104と同様であるため、ここでは説明を繰返さない。
高調波生成部130Cは、第1次〜第n次高調波生成部708,710,…,712と、第1次〜第n次高調波生成部の各々の出力を加重合成する加算器404とを含む。
加算器404は、第1次〜第n次高調波生成部708,710,…,712の各々の出力信号を加重合成する。加算器402は、加算器404からの出力信号と、BPF202の出力信号とを加重合成し、合成した高調波を符号化部105へ出力する。
第1次高調波生成部708は、BPF208と、倍音生成部308Cと、BPF508を含み、BPF208、倍音生成部308CおよびBPF508は、MDCTフィルタ部の出力信号が与えられるノードと加算器404の入力ノードとの間に、直列に接続されている。また、第2次〜第n次高調波生成部710,…,712の構成についても同様であるため、ここでは説明を繰返さない。
ここで、MDCTフィルタ部103の出力信号の低周波成分を複数に分割し、複数に分割した低周波成分の各々に基づいて、第1次〜第n次高調波生成部708,710,…,712は、それぞれ対応する高調波を生成する。たとえば、0〜100Hzまでの周波数帯を10Hzごとに分割し、この分割した周波数帯ごとに倍音の信号が生成される。
なお、波形合成部120に含まれるBPF202によって抽出される周波数成分はBPF208,BPF210,…,BPF212によって抽出される周波数成分より高い周波数を有する。
高調波生成部130Cに含まれる倍音生成部308C,310C,…,312Cは、BPF208,210,…,212によって抽出される基本波の周波数を自然数倍して生成した高調波と基本波とを加重合成して出力する。
これにより、倍音生成合成部104、104Aにおいて説明してきたとおり、倍音生成部304Cのように基本波をも含んで出力するような場合には、フィルタ部であるBPF508,510,…,512を設ける必要がある。なお、BPF508,510,…,512に限定されることなく、所定の周波数より高い周波数成分を通過させるHPFを利用してもよい。スピーカの特性にあわせて、基本波より低いHPFのカット周波数を設定する。
図7は、倍音生成合成部104の変形例4の倍音生成合成部104Dの主要部を示すブロック図である。図7を参照して、倍音生成合成部104Dは、倍音生成合成部104と比較して、波形合成部120に代えて、波形合成部120Dを含む。倍音生成合成部104Dの他の構成については、倍音生成合成部104と同様であるため、ここでは説明を繰返さない。
ここで、図3の倍音生成合成部104の波形合成部120と比較して、波形合成部120Dを説明する。波形合成部120Dの構成は、加算器402とBPF202とを含む。しかしながら、加算器402は、MDCTフィルタ部103の出力波と高調波生成部130の出力波とを加算し、その出力波について、BPF202を用いて低周波成分を除去することにより、104BのBPF202とBPF504を一つにまとめられる。同様の効果が期待できる。なお、BPF202に限定されることなく、HPFを使用してもよい。スピーカの特性にあわせて、基本波より低いHPFのカット周波数を設定する。
図8は、倍音生成合成部104の変形例5の倍音生成合成部104Eの主要部を示すブロック図である。図8を参照して、倍音生成合成部104Eは、図7の倍音生成合成部104Dの波形合成部120Dと図4の倍音生成合成部104Aの高調波生成部130Aとを組み合わせた構成をとるため、同様な効果が期待できる。なお、各構成の説明は同様な説明となるためここでは繰返さない。図7と同様にBPF208,210,…,212が一つにまとめられる。
次に、図1等を用いて符号化装置の構成について説明したが、処理手順を総括的に説明する。
図9は、本発明の実施の形態1における符号化装置の処理手順を説明するためのフローチャートである。図9を参照して、まず、符号化処理が開始されると、ステップS1において外部から入力されたオーディオ音声(PCM)データがSDRAM101にバッファリングされ、データ取得制御部102は、SDRAM101に格納されたデータの中から1フレーム分、または複数フレーム分のデータを取得し、次のステップS7の処理へ進む。
ステップ7では、音響心理分析部107が、最小可聴限界値、およびマスキング値を計算する。
ステップ8では、1フレーム分のデータをサブバンドに分割する。また、データ取得制御部102は、取得フレーム数を“1”だけインクリメントすることによって取得フレーム数をカウントすることができる。
そして、ステップS2において、MDCTフィルタ部103は、サブバンド分析フィルタ部108によって計算されたサブバンドデータをMDCT変換する。
ステップS3において、音響心理分析部107は、ステップS7で算出された最小可聴限界値およびマスキング値に応じて、低周波成分のうちパワースペクトルが各閾値以上の周波数成分が存在するか判定し、倍音化の対象となる基本周波数を決定する。
たとえば、音響心理分析部107は、FFTの出力波の周波数50Hzのパワースペクトルが15dBしかなく、このパワースペクトルが50Hzの聴覚閾値(0dB=1kHz)である30dBを超えていないときには、可聴パワーが不足しているため、基本波として周波数50Hzの波形を抽出しない。一方、FFTの出力波の周波数100Hzのパワースペクトルが38dBほどあり、このパワースペクトルが100Hzの聴覚閾値(0dB=1kHz)である25dBを超えているときには、パワースペクトルが十分ある(聞き取れる)ため、さらにマスキング値と比較し、マスキング効果により、そのパワースペクトルが可聴できると判定されたなら、基本周波数として周波数100Hzを決定する。ただし、基本周波数として、倍音化の対象となる周波数が複数あってもよい。
パワースペクトルが閾値以上の周波数成分が存在する場合は、ステップS4に進む。また、パワースペクトルが閾値以上の周波数成分が存在しなければ、後述するステップS4およびステップS5の付加処理は実施しないで、ステップS6へ進む。ステップS6では、ステップS7の最小可聴限界値およびマスキング値に基づいて、ビット割り当てされ、量子化がおこなわれる。
ステップS4において、ステップS3において決定した基本波に基づいて、図1の倍音生成部が、この基本波の周波数に自然数倍かけた周波数を有する高調波を生成する。
ステップS4の処理について説明する。
ステップS3で決定した基本波を利用して高調波を生成する。基本波の周波数(ここでは100Hz)に自然数n(nは2以上)倍した周波数を有する高調波のことを第n次高調波とすると、このような高調波の生成は、所望の周波数まで生成できるが、倍音として用いる場合には高調波の周波数が2kHz付近になるように自然数nを決定し生成することが好ましい。ここでは、第2次〜第20次高調波となる。2kHz付近としたのは、聴覚閾値が低く、逆にいうと、感度がよい(聞こえやすい)ため、この付近に設定することにより、人間の耳にとって、低周波数域の音声も再現されていると錯覚しやすくなる。
ステップS3で決定した基本波を利用して高調波を生成する。基本波の周波数(ここでは100Hz)に自然数n(nは2以上)倍した周波数を有する高調波のことを第n次高調波とすると、このような高調波の生成は、所望の周波数まで生成できるが、倍音として用いる場合には高調波の周波数が2kHz付近になるように自然数nを決定し生成することが好ましい。ここでは、第2次〜第20次高調波となる。2kHz付近としたのは、聴覚閾値が低く、逆にいうと、感度がよい(聞こえやすい)ため、この付近に設定することにより、人間の耳にとって、低周波数域の音声も再現されていると錯覚しやすくなる。
また、前述したとおり、等ラウドネスモデルから最小可聴限界値が0デシベルになる周波数が2kHzである。また、基本周波数を150Hzとした場合には、倍音生成・合成部の合成する元の音声の低域カット周波数は、150Hz程度にしてもよい。たとえば、300Hzの基本波の場合には、5次高調波程度までとする。この場合、元の音声から圧縮によって低域情報を失う前に元の音声から忠実に再現できる聴感を失われない帯域に付加しておくことが目的である。
MP3の場合、MDCTの576ラインの周波数解像度に対して、スケールファクタのバンド数が21であり、サンプリング周波数44.1kHzの最も低い周波数帯(バンド)境界の周波数は、150Hzである。つまり、基本周波数は、150Hzを想定しており、これは1バンド分のビットを他のビットの必要なバンドへ割当てることができることを意味する。
たとえば、基本波の周波数150Hzを基数(基本周波数)とすると、300Hz,450Hz,600Hz,750Hz,900Hz,1050Hz,…,1950Hzの高調波を生成することができる。また別の例として、周波数300Hzを基数とすると、600Hz,900Hz,1200Hz,1500Hz,1800Hz(もしくは、6次まで)の高調波を生成できる。
あるいは、基本周波数を150Hzより大きい値とした場合には、倍音生成・合成部の合成する元の音声の低域カット周波数は、スピーカ特性を考慮し、50Hz程度、それ以下としてもよい。
図10は、高調波生成について説明するための図である。図10を参照して、横軸に周波数が示され、縦軸に音圧レベルが示される。なお、説明を容易にするため、聴覚閾値(最小可聴界値)が点線で合わせて示されている。
基本波として周波数100Hzの音圧レベルL0が示されている。この音圧レベルL0は倍音生成合成部104によって抽出される。この音圧レベルL0は聴覚閾値を超えた強度を有する。
さらにこの基本波を元に周波数を自然数倍して生成された高調波のパワースペクトルL1,L2,…,L18,L19が示される。このパワースペクトルL1,L2,…,L18,L19の強度は、たとえば2000Hzの聴覚閾値を上回るように徐々に減衰させるようにレベル調整する。
2000Hzで0dBになるように高調波を生成することが好ましい。処理の効率上、生成する高調波は、偶数次数のみとか、奇数次数のみとか、2〜5次程度としてもよい。
再び図9を参照して、ステップS4で、基本波に基づいて高調波を生成が終わると、ステップS5において、倍音生成合成部104は、この高調波とMDCTフィルタ部103の出力波のうち基本波より高い周波成分の出力波とを合成し、符号化部105へ出力し、ステップS6の処理へ進む。
そして、ステップS6において、倍音生成合成部104の出力波に基づいて、符号化部105は、周波数シフトによってオーディオ情報量の少なくなった低周波成分の使用するビット量を減少させ、高周波成分の使用するビット量をより増加させて符号化処理を行ない、処理が終了する。
この処理手順により、符号化処理前に、周波数シフトによってオーディオ情報量の少なくなった低周波成分については、倍音処理され高周波成分にオーディオ情報量を集約でき、効率的に符号化処理が行なえる。
また、倍音処理され高周波成分にオーディオ情報量を集約したことによって、周波数およびスケールファクタの低周波数帯あるいはパワースペクトルの小さいスケールファクタバンドに割当てるための符号化ビットを削減あるいは減少でき、その分、情報量の多いスケールファクタバンドを符号化する際に使用できる。
さらに、倍音加算後スケールファクタバンドの情報量が帯域間に分散しないように制御し、ビット割当ての多いバンドに低音成分から生成した倍音を加算した後に、符号化することによって、スケールファクタの伝送長を削減できるとともに、スケールファクタバンドの情報が含まれている付加データについてもグラニュール間でシェアすることにより、スケールファクタについても削減できる。
本実施の形態1の構成をとることにより、必要ビット量の節約が可能であり、このような冗長性を低減し、ビット量を効率よく管理することによって、高音質化、高効率化の効果を実現できる。
[実施の形態2]
実施の形態2は、実施の形態において説明した符号化装置を用いた音楽プレイヤーシステムに関するものである。
実施の形態2は、実施の形態において説明した符号化装置を用いた音楽プレイヤーシステムに関するものである。
図11は、本発明の実施の形態2における音楽プレイヤーシステムの構成例を示すブロック図である。この音楽プレイヤーシステムは、システム全体の制御を行なうCPU(Central Processing Unit)11と、ROM(Read Only Memory)12と、RAM13(例えばSDRAM)と、ハードディスク(HDD)14と、入力処理部15と、外部IF16と、データ処理部17とを含む。
CPU11は、内部バスを介してROM12に記憶される各種プログラムを読み出してRAM13に転送し、そのプログラムを実行することによって音楽プレイヤーシステム全体の制御を行なう。また、CPU11は、所定の演算処理を行なうことによって入力処理部15から受けたコマンドに応じた処理を実行する。
外部IF16は、ユーザにより操作ボタンの操作を検知して、その操作に応じた操作入力信号を入力処理部15に出力する。入力処理部15は、外部IF16から受けた操作入力信号に応じて所定の処理を行なって操作入力信号をコマンドに変換し、内部バスを介してCPU11にコマンドを転送する。
データ処理部17は、外部IF16に接続されたたとえばCDROMのようなメディアドライブから与えられた音楽データを圧縮符号化してハードディスク14に記憶させる。また、データ処理部17は、ユーザによる操作に応じて音楽データの再生処理を行なう。
ユーザによる操作に応じて音楽データの再生を行なう場合、CPU11は、音楽データ再生のコマンドをデータ処理部17に出力すると共に、ハードディスク14内の指定された音楽データを読み出してデータ処理部17に転送する。データ処理部17は、ハードディスク14から転送された音楽データを復号して音楽データを再生し、たとえばスピーカ(図示せず)に出力させる。実施の形態において説明したオーディオ符号化装置100は、データ処理部17内に配置される。
また、CPU11は、RAM13に記憶される各種プログラムを実行することによって表示データを生成して表示処理部(図示せず)に転送したり、ハードディスク14に記憶される音楽関連情報(音楽タイトル)を読み出して表示処理部(図示せず)に転送したりする。表示処理部(図示せず)は、CPU11から受けた表示データに応じてディスプレイ(図示せず)に音楽関連情報などの表示を行なわせる。
以上説明したように、本実施の形態2における音楽プレイヤーシステムによれば、データ処理部17に実施の形態1において説明したオーディオ符号化装置100を配置するようにしたので、実施の形態1において説明した効果を奏するシステムを構築することが可能となった。
なお、本実施の形態では音楽プレイヤーシステム(音楽データの符号化)について説明したが、映像再生システム(映像データの符号化)においても実施の形態において説明したオーディオ符号化装置100を同様に適用することが可能である。
最後に図等を用いて本実施の形態1,2を総括する。
図1に示すように、実施の形態1のオーディオ符号化装置100は、音声データを格納する記憶部(たとえばSDRAM101)と、記憶部から音声データを取得するデータ取得制御部102と、データ取得制御部102から出力される音声データ信号を周波数変換する一連のサブバンド分析フィルタ部108とMDCTフィルタ部103と、変換部の出力波のうち第1の出力波に基づいて高調波を生成し、高調波と、変換部の出力波のうち第1の出力波より高周波成分である第2の出力波とを合成する倍音生成合成部104と、倍音生成合成部104からの出力に対して符号化処理を行なう符号化部105とを備える。また、実施の形態1のオーディオ符号化装置100は、マスキング値を計算し、その値を元に、MDCTフィルタ部103と倍音生成合成部104とを制御する音響心理分析部107とをさらに備える。
図1に示すように、実施の形態1のオーディオ符号化装置100は、音声データを格納する記憶部(たとえばSDRAM101)と、記憶部から音声データを取得するデータ取得制御部102と、データ取得制御部102から出力される音声データ信号を周波数変換する一連のサブバンド分析フィルタ部108とMDCTフィルタ部103と、変換部の出力波のうち第1の出力波に基づいて高調波を生成し、高調波と、変換部の出力波のうち第1の出力波より高周波成分である第2の出力波とを合成する倍音生成合成部104と、倍音生成合成部104からの出力に対して符号化処理を行なう符号化部105とを備える。また、実施の形態1のオーディオ符号化装置100は、マスキング値を計算し、その値を元に、MDCTフィルタ部103と倍音生成合成部104とを制御する音響心理分析部107とをさらに備える。
好ましくは図1に示すように、オーディオ符号化装置100において、記憶部(たとえばSDRAM101)は、周波数に対する音圧レベルの閾値をさらに格納し、倍音生成合成部104は、第1の出力波に対応する音圧レベルの値が閾値よりも大きい場合に、第1の出力波に基づいて高調波を生成する。
好ましくは、図3〜図8に示すように、オーディオ符号化装置100において、倍音生成合成部104は、第1の出力波の周波数に基づいて周波数の自然数倍の周波数を有する高調波を生成する高調波生成部130と、高調波と第2の出力波とを合成する波形合成部120とを含む。
さらに好ましくは、オーディオ符号化装置100において、第1の出力波に対応する音圧レベルの値が閾値よりも大きい場合には、高調波生成部130は第1の出力波に基づいて高調波を生成する。
さらに好ましくは、図3、図4に示すように、オーディオ符号化装置100において、高調波生成部(130)は、変換部の出力波に基づいて、第1の出力波を抽出する第1のフィルタ回路(たとえば、LPF204やBPF208〜212)と、第1のフィルタ回路の出力波の周波数を自然数倍した周波数を有する高調波を生成する倍音生成器304,308〜312と、変換部の出力波に基づいて、第2の出力波を抽出する第2のフィルタ回路BPF202と、高調波と第2のフィルタ回路の出力波とを合成して出力する加算器402とを含む。
さらに好ましくは、図3〜図6に示すように、オーディオ符号化装置100において、波形合成部120は、変換部の出力波に基づき、高調波生成部130に入力される周波数よりも高い周波数を有する出力波を抽出する第3のフィルタ回路BPF202と、生成された高調波と第3のフィルタ回路の出力波とを合成して出力する加算器402とを含む。
さらに好ましくは、図7、図8に示すようにオーディオ符号化装置100において、波形合成部120Dは、高調波と変換部の出力波とを合成して出力する加算器402と、変換部の出力波に、高調波生成部130に入力される周波数よりも高い周波数を有する出力波を抽出する第3のフィルタ回路BPF202とを含む。
さらに、好ましくは図11に示すように実施の形態2の半導体装置は、上述した実施の形態1のいずれかに記載のオーディオ符号化装置100を含む。
今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
100 オーディオ符号化装置、102 データ取得制御部、103 MDCTフィルタ部、104 倍音生成合成部、105 符号化部、120 波形合成部、130 高調波生成部、304,308,310,312 倍音生成部、402,404 加算器、11 CPU、12 ROM、13 RAM、101,106 SDRAM、14 ハードディスク、15 入力処理部、17 データ処理部、107 音響心理分析部、108 サブバンド分析フィルタ部。
Claims (8)
- 音声データを格納する記憶部と
前記記憶部から前記音声データを取得するデータ取得制御部と、
前記データ取得制御部から出力される音声データ信号を周波数変換する変換部と、
前記変換部の出力波のうち第1の出力波に基づいて高調波を生成し、前記高調波と、前記変換部の出力波のうち前記第1の出力波より高周波成分である第2の出力波とを合成する倍音生成合成部と、
前記倍音生成合成部からの出力に対して符号化処理を行う符号化部を備える、オーディオ符号化装置。 - 前記記憶部は、周波数に対する音圧レベルの閾値をさらに格納し、
前記倍音生成合成部は、前記第1の出力波に対応する前記音圧レベルの値が前記閾値よりも大きい場合に、前記第1の出力波に基づいて前記高調波を生成する、請求項1に記載のオーディオ符号化装置。 - 前記倍音生成合成部は、
前記第1の出力波の周波数に基づいて前記周波数の自然数倍の周波数を有する高調波を生成する高調波生成部と、
前記高調波と前記第2の出力波とを合成する波形合成部とを含む、請求項2に記載のオーディオ符号化装置。 - 前記音圧レベルの値が前記閾値よりも大きい場合には、前記高調波生成部は前記第1の出力波に基づいて前記高調波を生成する、請求項3に記載のオーディオ符号化装置。
- 前記高調波生成部は、
前記変換部の出力波に基づいて、前記第1の出力波を抽出する第1のフィルタ回路と、
前記第1のフィルタ回路の出力波の周波数を自然数倍した周波数を有する前記高調波を生成する倍音生成器と、
前記変換部の出力波に基づいて、前記第2の出力波を抽出する第2のフィルタ回路と、
前記高調波と前記第2のフィルタ回路の出力波とを合成して出力する合成部とを含む、請求項4に記載のオーディオ符号化装置。 - 前記波形合成部は、
前記変換部の出力波に基づき、前記高調波生成部に入力される周波数よりも高い周波数を有する出力波を抽出する第3のフィルタ回路と、
前記高調波と前記第3のフィルタ回路の出力波とを合成して出力する合成部とを含む、請求項4に記載のオーディオ符号化装置。 - 前記波形合成部は、
前記高調波と前記変換部の出力波とを合成して出力する合成部と、
前記高調波生成部に入力される周波数よりも高い周波数を有する出力波を抽出する第3のフィルタ回路とを含む、請求項4に記載のオーディオ符号化装置。 - 請求項1〜7のいずれか1項に記載のオーディオ符号化装置を含む、半導体装置。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011214802A JP2013073230A (ja) | 2011-09-29 | 2011-09-29 | オーディオ符号化装置 |
US13/563,615 US20130085762A1 (en) | 2011-09-29 | 2012-07-31 | Audio encoding device |
CN201210326726.5A CN103035250A (zh) | 2011-09-29 | 2012-09-06 | 音频编码装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011214802A JP2013073230A (ja) | 2011-09-29 | 2011-09-29 | オーディオ符号化装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2013073230A true JP2013073230A (ja) | 2013-04-22 |
Family
ID=47993415
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011214802A Withdrawn JP2013073230A (ja) | 2011-09-29 | 2011-09-29 | オーディオ符号化装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20130085762A1 (ja) |
JP (1) | JP2013073230A (ja) |
CN (1) | CN103035250A (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE112013004985T5 (de) * | 2012-10-12 | 2015-07-09 | National Instruments Ireland Resources Limited | System und Verfahren zum Kalibrieren und Synchronisieren eines Empfängers |
JP6401521B2 (ja) * | 2014-07-04 | 2018-10-10 | クラリオン株式会社 | 信号処理装置及び信号処理方法 |
CN107910016B (zh) * | 2017-12-19 | 2021-07-27 | 河海大学 | 一种带噪语音的噪声可容度判断方法 |
CN108010537A (zh) * | 2017-12-30 | 2018-05-08 | 长沙迪普美医疗科技有限公司 | 一种声音报警处理方法、装置、*** |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SE9903553D0 (sv) * | 1999-01-27 | 1999-10-01 | Lars Liljeryd | Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL) |
SE0202770D0 (sv) * | 2002-09-18 | 2002-09-18 | Coding Technologies Sweden Ab | Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks |
JP4219898B2 (ja) * | 2002-10-31 | 2009-02-04 | 富士通株式会社 | 音声強調装置 |
US7844451B2 (en) * | 2003-09-16 | 2010-11-30 | Panasonic Corporation | Spectrum coding/decoding apparatus and method for reducing distortion of two band spectrums |
US8170879B2 (en) * | 2004-10-26 | 2012-05-01 | Qnx Software Systems Limited | Periodic signal enhancement system |
JP2006243043A (ja) * | 2005-02-28 | 2006-09-14 | Sanyo Electric Co Ltd | 高域補間装置及び再生装置 |
JP4599558B2 (ja) * | 2005-04-22 | 2010-12-15 | 国立大学法人九州工業大学 | ピッチ周期等化装置及びピッチ周期等化方法、並びに音声符号化装置、音声復号装置及び音声符号化方法 |
KR100829567B1 (ko) * | 2006-10-17 | 2008-05-14 | 삼성전자주식회사 | 청각특성을 이용한 저음 음향 신호 보강 처리 방법 및 장치 |
CN101622668B (zh) * | 2007-03-02 | 2012-05-30 | 艾利森电话股份有限公司 | 电信网络中的方法和装置 |
EP2209116B8 (en) * | 2007-10-23 | 2014-08-06 | Clarion Co., Ltd. | Device and method for high-frequency range interpolation of an audio signal |
US8515747B2 (en) * | 2008-09-06 | 2013-08-20 | Huawei Technologies Co., Ltd. | Spectrum harmonic/noise sharpness control |
US20120078625A1 (en) * | 2010-09-23 | 2012-03-29 | Waveform Communications, Llc | Waveform analysis of speech |
-
2011
- 2011-09-29 JP JP2011214802A patent/JP2013073230A/ja not_active Withdrawn
-
2012
- 2012-07-31 US US13/563,615 patent/US20130085762A1/en not_active Abandoned
- 2012-09-06 CN CN201210326726.5A patent/CN103035250A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
US20130085762A1 (en) | 2013-04-04 |
CN103035250A (zh) | 2013-04-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2381571C2 (ru) | Синтезирование монофонического звукового сигнала на основе кодированного многоканального звукового сигнала | |
JP3278900B2 (ja) | データ符号化装置及び方法 | |
JP3765622B2 (ja) | オーディオ符号化復号化システム | |
JP3153933B2 (ja) | データ符号化装置及び方法並びにデータ復号化装置及び方法 | |
JP2005202248A (ja) | オーディオ符号化装置およびオーディオ符号化装置のフレーム領域割り当て回路 | |
JP2012198555A (ja) | オーディオ信号の重要周波数成分の抽出方法及びその装置、及びこれを利用した低ビット率オーディオ信号の符号化及び/または復号化方法及びその装置 | |
JPH08190764A (ja) | ディジタル信号処理方法、ディジタル信号処理装置及び記録媒体 | |
JP2006011456A (ja) | 低ビット率符号化/復号化方法及び装置並びにコンピュータ可読媒体 | |
KR101913241B1 (ko) | 인코딩 방법 및 장치 | |
JP2011059714A (ja) | 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体 | |
JP4760278B2 (ja) | 補間装置、オーディオ再生装置、補間方法および補間プログラム | |
JP2004198485A (ja) | 音響符号化信号復号化装置及び音響符号化信号復号化プログラム | |
JP5365380B2 (ja) | 音響信号処理装置、その処理方法およびプログラム | |
JPH0816195A (ja) | ディジタルオーディオ符号化方法及び装置 | |
KR100636144B1 (ko) | 오디오 신호 부호화/복호화 장치 및 방법 | |
JP2013073230A (ja) | オーディオ符号化装置 | |
US6128593A (en) | System and method for implementing a refined psycho-acoustic modeler | |
US20120195435A1 (en) | Method, Apparatus and Computer Program for Processing Multi-Channel Signals | |
JP2022517232A (ja) | ハイレゾリューションオーディオ符号化 | |
US6463405B1 (en) | Audiophile encoding of digital audio data using 2-bit polarity/magnitude indicator and 8-bit scale factor for each subband | |
US20190074805A1 (en) | Transient Detection for Speaker Distortion Reduction | |
JP4627737B2 (ja) | デジタルデータ復号化装置 | |
JP4649351B2 (ja) | デジタルデータ復号化装置 | |
JP2005114813A (ja) | オーディオ信号再生装置及び再生方法 | |
JP4271588B2 (ja) | ディジタルデータの符号化方法および符号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20141202 |