JP2006330144A - オーディオデータの補間方法および補間装置 - Google Patents
オーディオデータの補間方法および補間装置 Download PDFInfo
- Publication number
- JP2006330144A JP2006330144A JP2005150597A JP2005150597A JP2006330144A JP 2006330144 A JP2006330144 A JP 2006330144A JP 2005150597 A JP2005150597 A JP 2005150597A JP 2005150597 A JP2005150597 A JP 2005150597A JP 2006330144 A JP2006330144 A JP 2006330144A
- Authority
- JP
- Japan
- Prior art keywords
- audio data
- sampling rate
- interpolation
- frequency
- khz
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
【構成】 FIF処理部11は低サンプリングレート(22.05kHz)のオーディオデータを、フラクタル補間機能を用いて高サンプリングレート(44.1kHz)のオーディオデータに変換し、直線的にゲインが低減する伝達特性を有する補正フィルタ12は該変換により得られたオーディオデータの高域における伝達特性を低減する。
【選択図】 図1
Description
図13に示す一次元離散信号S={(un,vn):n=0,1,…,N}が与えられた際のFIF処理手順を説明する。ただし、信号Sは次式を満足する1価関数で表される信号である。
u0<u1<.....<un (1)
まず、信号Sから、(M+1)個の代表点P={(xi,yi):i=0,1,…,M}を選択する(図13中の黒丸点)。ただし、信号Sの両端点は次式に示すように、代表点として無条件に選択するものとする。
ところで、式(3)において、5つの未知パラメータai, ci, di, ei, fi(以降、写像パラメータと呼ぶ)が存在する。式(3)を実際の信号に適用するには、これら5つの未知パラメータai, ci, di, ei, fIを求めなければならない。そこで次式に示す制約条件を設ける。
先に述べたように、FIFを適用することで、与えられた信号Sは各補間区間に写される。このとき、縮小写像wiによる信号Sの像wi(s)=[(pn,qn):n=0,1,…,N]は(図15参照)、次式に示すように表すことができる。図15において大きな白丸は信号S上ののデータポイント、小さな黒丸は縮小写像wi(s)上のN個のポイントである。
図12のオーディオデータの補間装置において、入力信号である圧縮オーディオデータは、たとえば22.05KHzでサンプリングしたデータにMP3圧縮処理したものであり、圧縮オーディオデコーダ1から出力するオーディオデータの周波数特性(スペクトル)は図16の(B)に示すように、高域特性が失われた特性になる。なお、(A)は原楽音信号の周波数特性である。この圧縮オーディオデコーダ1から出力するオーディオデータを、フラクタル補間機能を用いてFIF処理部2で44.1kHzのオーディオデータに変換すると、その周波数特性は(C)に示すようになり、原楽音信号の周波数特性に類似した周波数特性となる。
M.F.Barbsley, "Fractal functions and interpolation" Constructive Approximation, vol.2, pp.303-329, 1986 D.S.Mazel and M.H. Hayes, "Using Iterated function systems to model discrete sequences" IEEE Trans. Signal Processing, vol.40, No.7, pp.1243-1249, Oct 1982.
人間の聴覚は倍音ベース(オクターブベース)に感覚ができており、周波数特性が一定のホワイトノイズを聞くとノイズが高域にシフトしたように聞こえる。これを避けるために周波数が高くなるにつれてスペクトルが低くなる(3dB/octに従って低くなる)ピンクノイズが作られた。傾き3dB/octつまり1オクターブに対して3dBの減衰をかけることで、人間の耳ですべての可聴領域で同じ音圧のノイズを聞くことができるからであり、ピンクノイズはスピーカや部屋の音響特性の測定などに用いられている。なお、図17にピンクノイズの周波数特性を示す。
ホワイトノイズとピンクノイズの関係と同様に人間の聴覚を考慮すると、楽音信号のスペクトラムは広域に従ってなだらかに低下するのが望ましい。しかし、図16の(C)のFIF処理後の楽音信号の周波数特性は16kHz付近から20kHz手前までフラットとなり、20kHz付近で多少上昇し、その後低下する特性になっている。このため、従来の補間方法は、人間の聴覚にとって望ましい特性になっておらず、聴感上高域が不自然になる。
以上から本発明の目的は、人間の聴覚にとって望ましい特性を有するように、低サンプリング圧縮されたオーディオデータを補間する補間方法及び補間装置を提供することである。
また、上記課題は本発明によれば、低サンプリングレートの圧縮オーディオデータをデコードするデコーダ、デコードして得られたオーディオデータを、フラクタル補間機能を用いて高サンプリングレートのオーディオデータに変換するアップサンプリング処理部、前記変換により得られたオーディオデータの高域における伝達特性を低減する補正フィルタを備えたオーディオデータの補間装置により達成される。補正フィルタは、直線的にゲインが低減する伝達特性を有し、前記低サンプリングレートの1/2の周波数(ナイキスト周波数)から前記高サンプリングレートの1/2の周波数(ナイキスト周波数)までの伝達特性を低減する。
FIF処理部11は低サンプリングレート(22.05kHz)のオーディオデータを、フラクタル補間機能を用いて高サンプリングレート(44.1kHz)のオーディオデータに変換し、補正フィルタ12は該変換により得られたオーディオデータの高域における伝達特性を低減する。たとえば、補正フィルタ12は図2に示すように直線的にゲインが低減する伝達特性−6dB/octあるいは−12dB/octを有し、低サンプリングレートの1/2の周波数(11.025kHz)から前記高サンプリングレートの1/2の周波数(22.05kHz)までの高域の伝達特性を補正する。すなわち、11.025kHz〜22.05kHzの生成された信号部分に補正フィルタ12で−6dB/oct、−12dB/octなどの楽音情報処理を加えて補正する。これにより、人間の聴覚に望ましい周波数特性を有する楽音信号を復元して出力することができる。すなわち、低サンプリングレートの圧縮オーディオデータをオーディオ再生向けの楽音信号として復元、出力することができる。
圧縮オーディオデータは、たとえば、原曲を低サンプリングレート(22.05kHz)でサンプリングしてMP3により圧縮したものである。補正フィルタ12は128タップのFIRフィルタで構成されており、そのインパルス応答及び周波数特性はそれぞれ図4、図5に示すようになっている。周波数特性は、低サンプリングレート(22.05kHz)の1/2の11.025kHzまで0dB一定を示し、11.025kHzから高サンプリングレート(44.1kHz)の1/2の22.05kHzまで直線的にゲインが低減する伝達特性−6dB/octを示す。
圧縮オーディオデコーダ10から出力するオーディオデータの周波数特性はシャノンの標本化定理より明らかなように、サンプリングレート(22.05kHz)の1/2以上の成分を復元できず、図6の(A)に示すように11.025kHz以上の楽音情報が欠けている。
そこで、直線的にゲインが低減する直線伝達特性−6dB/octを有する補正フィルタ12を用いて11.025kHz〜22.05kHzの高域特性に楽音処理を加えて補正する。これにより、図6(C)に示すように楽音信号のスペクトラムが広域になるに従ってなだらかに低下し、人間の聴覚に望ましい特性になり、聴感上高域の不自然さが改善され、原曲の周波数特性(図16(A)参照)に近くなる。なお、図6(C)の点線部における振幅は、図6(B)の振幅に比べて−4.8dB程度低減している。
以上では補正フィルタの周波数特性を−6dB/octの直線特性にしたが、必ずしも−6dB/octにする必要はなく、楽音ジャンル等により適宜傾斜を緩くしたり、強くしたりすることができる。図7、図8はインパルス応答及び周波数特性の別の実施例であり、周波数特性は11.025kHzまで0dB一定、11.025kHzから22.05kHzまで−12dB/octで直線的にゲインが低減する特性を示している。この補正フィルタを用いると図9に示すように高域特性の低減割合が大きい特性を有するオーディオデータが出力する。図9の点線部における振幅は、図6(B)の振幅に比べて−8.6dB程度低減しており、−6dB/octに比べて高域がおとなしくなる。
・変形例2
図3の補正フィルタ12に複数の直線特性を持たせ、ユーザ設定により、あるいは、楽音ジャンルを識別して自動的に所望の特性で補正するように構成することもできる。
・変形例3
基本的には、補正フィルタ12に図5、図8に示す特性を持たせれば十分であるが、さらに発展させたい場合には種々の特性、たとえば図10に示すような特性を持たせることができる。たとえば、楽音のジャンル(クラシック、ジャズ、ポップス)毎に異なる補正フィルタ(FIRフィルタ)係数を用意し、MP3復号時に判別されるジャンル情報によって対応するフィルタ係数を補正フィルタに自動設定するように構成する。
(1)FIF処理部11がLチャンネル、Rチャンネル用のFIFアップサンプリング部11a、11bを備えている点、
(2)補正フィルタ12がLチャンネル、Rチャンネル用のFIRフィルタ12a、12bを備えている点、
(3)種々の特性に応じたLチャンネル及びRチャンネル用の補正フィルタ係数を格納し、圧縮オーディオデコーダ10からの指示(ジャンル識別による切り換え指示)により、あるいは操作部14からのユーザ指示により所望の係数をFIRフィルタ12a、12bに設定するフィルタバンク13を設けた点、
である。
以上では、サンプリング周波数を22.05kHzから44.1kHzにアップした場合であるが、11.025kHzから44.1kHzにアップする場合にも本発明を適用することができる。
以上本発明によれば、楽音信号のスペクトラムを広域に従ってなだらかに低下するため、楽音信号を人間の聴覚に望ましい特性にでき、従来の補間技術において聴感上問題となっている高域の不自然さを改善できる。すなわち、本発明によれば、低サンプリングレートの圧縮オーディオデータをオーディオ再生向けの楽音信号として復元、出力することができる。
11 FIF処理部
12 補正フィルタ
Claims (5)
- 圧縮されたオーディオデータの補間方法において、
低サンプリングレートの圧縮オーディオデータをデコードするステップ、
得られたオーディオデータを、フラクタル補間機能を用いて高サンプリングレートのオーディオデータに変換するステップ、
該変換により得られたオーディオデータの高域における伝達特性を低減するステップ、
を備えたことを特徴とするオーディオデータの補間方法。 - 前記低減ステップにおいて、前記低サンプリングレートの1/2の周波数から前記高サンプリングレートの1/2の周波数までの伝達特性を低減する、
ことを特徴とする請求項1記載のオーディオデータの補間方法。 - 圧縮されたオーディオデータの補間装置において、
低サンプリングレートの圧縮オーディオデータをデコードするデコーダ、
デコードして得られたオーディオデータを、フラクタル補間機能を用いて高サンプリングレートのオーディオデータに変換するアップサンプリング処理部、
前記変換により得られたオーディオデータの高域における伝達特性を低減する補正フィルタ、
を備えたことを特徴とするオーディオデータの補間装置。 - 前記補正フィルタは、前記低サンプリングレートの1/2の周波数から前記高サンプリングレートの1/2の周波数までの伝達特性を低減する、
ことを特徴とする請求項3記載のオーディオデータの補間装置。 - 前記補正フィルタは、直線的にゲインが低減する伝達特性を有することを特徴とする請求項4記載のオーディオデータの補間装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005150597A JP4593364B2 (ja) | 2005-05-24 | 2005-05-24 | オーディオデータの補間方法および補間装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005150597A JP4593364B2 (ja) | 2005-05-24 | 2005-05-24 | オーディオデータの補間方法および補間装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006330144A true JP2006330144A (ja) | 2006-12-07 |
JP4593364B2 JP4593364B2 (ja) | 2010-12-08 |
Family
ID=37551918
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005150597A Expired - Fee Related JP4593364B2 (ja) | 2005-05-24 | 2005-05-24 | オーディオデータの補間方法および補間装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4593364B2 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009229492A (ja) * | 2008-03-19 | 2009-10-08 | Alpine Electronics Inc | サンプリングレート変換装置およびその変換方法 |
EP3249649A1 (en) | 2016-05-26 | 2017-11-29 | Alpine Electronics, Inc. | Audio processing apparatus and audio processing method |
CN112652317A (zh) * | 2019-10-09 | 2021-04-13 | 深圳云程科技有限公司 | 基于Android***的高采样率音频播放方法及*** |
CN112863539A (zh) * | 2019-11-28 | 2021-05-28 | 科大讯飞股份有限公司 | 一种高采样率语音波形生成方法、装置、设备及存储介质 |
EP4243445A1 (en) | 2022-03-08 | 2023-09-13 | Alps Alpine Co., Ltd. | Audio signal processing apparatus, audio system, and method for enhancing low-frequency sound sensation |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003216199A (ja) * | 2001-11-15 | 2003-07-30 | Matsushita Electric Ind Co Ltd | 復号装置、復号方法及びプログラム供給媒体 |
JP2005084370A (ja) * | 2003-09-09 | 2005-03-31 | Alpine Electronics Inc | Fifを用いたサンプリングレート変換方法 |
JP2005128387A (ja) * | 2003-10-27 | 2005-05-19 | Yamaha Corp | オーディオ帯域拡張再生装置 |
-
2005
- 2005-05-24 JP JP2005150597A patent/JP4593364B2/ja not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003216199A (ja) * | 2001-11-15 | 2003-07-30 | Matsushita Electric Ind Co Ltd | 復号装置、復号方法及びプログラム供給媒体 |
JP2005084370A (ja) * | 2003-09-09 | 2005-03-31 | Alpine Electronics Inc | Fifを用いたサンプリングレート変換方法 |
JP2005128387A (ja) * | 2003-10-27 | 2005-05-19 | Yamaha Corp | オーディオ帯域拡張再生装置 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009229492A (ja) * | 2008-03-19 | 2009-10-08 | Alpine Electronics Inc | サンプリングレート変換装置およびその変換方法 |
US8024197B2 (en) * | 2008-03-19 | 2011-09-20 | Alpine Electronics, Inc. | Sampling rate conversion apparatus and method thereof |
EP3249649A1 (en) | 2016-05-26 | 2017-11-29 | Alpine Electronics, Inc. | Audio processing apparatus and audio processing method |
US10109295B2 (en) | 2016-05-26 | 2018-10-23 | Alpine Electronics, Inc. | Audio processing apparatus and audio processing method |
CN112652317A (zh) * | 2019-10-09 | 2021-04-13 | 深圳云程科技有限公司 | 基于Android***的高采样率音频播放方法及*** |
CN112863539A (zh) * | 2019-11-28 | 2021-05-28 | 科大讯飞股份有限公司 | 一种高采样率语音波形生成方法、装置、设备及存储介质 |
CN112863539B (zh) * | 2019-11-28 | 2024-04-16 | 科大讯飞股份有限公司 | 一种高采样率语音波形生成方法、装置、设备及存储介质 |
EP4243445A1 (en) | 2022-03-08 | 2023-09-13 | Alps Alpine Co., Ltd. | Audio signal processing apparatus, audio system, and method for enhancing low-frequency sound sensation |
Also Published As
Publication number | Publication date |
---|---|
JP4593364B2 (ja) | 2010-12-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6934979B2 (ja) | オーディオ再生のためのオーディオ音場表現をレンダリングするための方法および装置 | |
JP4817658B2 (ja) | 音響仮想現実エンジンおよび配信された音声改善のための新技術 | |
JP4981123B2 (ja) | オーディオ信号の知覚音量及び/又は知覚スペクトルバランスの計算と調整 | |
US7676043B1 (en) | Audio bandwidth expansion | |
US6577739B1 (en) | Apparatus and methods for proportional audio compression and frequency shifting | |
JP5917518B2 (ja) | 知覚スペクトルアンバランス改善のための音声信号動的補正 | |
CN1798452B (zh) | 实时补偿音频频率响应特性的方法和用该方法的声音*** | |
US8873763B2 (en) | Perception enhancement for low-frequency sound components | |
JP6727194B2 (ja) | 効率的なdrcプロファイル伝送 | |
JP2007143157A (ja) | 超指向性スピーカーシステム及び信号処理方法 | |
JPH08237132A (ja) | 信号符号化方法及び装置、信号復号化方法及び装置、並びに情報記録媒体及び情報伝送方法 | |
JP2007178675A (ja) | オーディオ再生の効果付加方法およびその装置 | |
JP2003068013A (ja) | デジタルオーディオ信号の処理 | |
WO2010079596A1 (ja) | 音声制御装置および音声出力装置 | |
JP4593364B2 (ja) | オーディオデータの補間方法および補間装置 | |
CN110506425A (zh) | 低音增强 | |
JPH1028057A (ja) | オーディオ復号化装置及びオーディオ符号化復号化システム | |
EP1538602B1 (en) | Wideband synthesis from a narrowband signal | |
JP2004198485A (ja) | 音響符号化信号復号化装置及び音響符号化信号復号化プログラム | |
US5864813A (en) | Method, system and product for harmonic enhancement of encoded audio signals | |
US8306242B2 (en) | Heyser spiral low frequency correction of FIR filters | |
JP3751225B2 (ja) | オーディオ帯域拡張装置 | |
JP6124432B2 (ja) | 情報送信装置、情報送信プログラム、情報受信装置、情報受信プログラム、及び情報通信方法 | |
JP4556866B2 (ja) | 高能率符号化プログラム及び高能率符号化装置 | |
KR101882140B1 (ko) | 초지향성 및 무지향성 동시 신호출력이 가능한 복합스피커시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080118 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100708 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100714 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100831 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100914 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100915 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130924 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130924 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140924 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |