JP6621709B2

JP6621709B2 - 音声処理装置、音声処理方法及びコンピュータプログラム

Info

Publication number: JP6621709B2
Application number: JP2016105691A
Authority: JP
Inventors: 良輔田地
Original assignee: Alpine Electronics Inc
Current assignee: Alpine Electronics Inc
Priority date: 2016-05-26
Filing date: 2016-05-26
Publication date: 2019-12-18
Anticipated expiration: 2036-05-26
Also published as: US10109295B2; US20170345442A1; JP2017211558A; EP3249649A1; EP3249649B1

Description

本発明は、音声の高域成分を補間する技術に関するものである。

音声の高域成分を補間する技術としては、FIF(Fractal Interpolation Functions/フラクタル補間機能）の技術が知られている（たとえば、特許文献１、２、３）。
ここで、FIFは、図６に示すように、所定間隔のサンプルの時間位置Xiを分割点としてオーディオデータの時間区間Ｔを複数に分割した時間区間である補間区間ｔi の信号として、時間区間Ｔの信号Ｓの縮小写像ω_i(S)を補間することにより、オーディオデータをアップサンプリングして音声の高域成分を補間する技術である。

また、このようなFIFによってオーディオデータをアップサンプリングして音声の高域成分を補間する技術としては、入力したオーディオデータが表す音声の周波数帯域の上限が、オーディオデータのサンプリングレートの1/2に満たない場合に、オーディオデータのサンプリングレートを1/2にダウンサンプリングした上で、FIFによってダウンサンプリングしたオーディオデータをアップサンプリングして音声の高域成分を補間する技術も知られている（特許文献４）。

なお、サンプリングレートFsのオーディオデータが表す音声の周波数帯域の上限は、ナイキストの定理に従いFs/2となるが、圧縮符号化されて提供されるオーディオデータなどは、サンプリングレートFsのオーディオデータが表す音声の周波数帯域の上限がFs/2未満であることも多い。

特開２００５-０８４３７０号公報特開２００６-３３０１４４号公報特開２００９-２２９４９２号公報特開２００６-１１９５２４号公報

上述した、入力したオーディオデータのサンプリングレートを1/2にダウンサンプリングした上でFIFによるアップサンプリングを行って音声の高域成分を補間する技術を適用した場合でも、入力したオーディオデータが表す音声の周波数帯域の上限Fmaxが、ダウンサンプリング後のオーディオデータのサンプリングレートFsの1/2未満である場合には、ダウンサンプリング後のオーディオデータに、FmaxとFs/2の間の周波数成分が含まれていないために、図７ａに示すように、オーディオデータが表す音声の周波数帯域の上限Fmax周辺の高域成分が補間されずに欠落してしまうという現象が生じる。

なお、図７ａは、オーディオデータのサンプリングレートが96kHz、オーディオデータが表す音声の周波数帯域の上限が20kHz、ダウンサンプリング後のオーディオデータのサンプリングレートが48kHz、FIFによってアップサンプリングしたオーディオデータのサンプリングレートが96kHzである場合について表しており、図中、SIがオーディオデータの周波数特性を、SOがFIFによって高域を補間したオーディオデータの周波数特性を表している。

そこで、本発明は、オーディオデータが表す音声の周波数帯域の上限によらずに、良好に高域を補間することができる音声処理装置を提供することを課題とする。

前記課題達成のために、本発明は、オーディオデータの高域補間を行う音声処理装置に、前記高域補間の対象とするオーディオデータである入力オーディオデータが表す音声の周波数帯域の上限を検出する周波数帯域上限検出部と、前記周波数帯域上限検出部が検出した上限の２倍以下のサンプリングレートとなるように、前記入力オーディオデータを当該入力オーディオデータからサンプルを間引くことによりダウンサンプリングして、中間オーディオデータを生成するダウンサンプリング部と、前記ダウンサンプリング部が生成した中間オーディオデータを、FIF(Fractal Interpolation Functions）によってアップサンプリングして、高域補間後のオーディオデータを生成するアップサンプリング部とを備えたものである。

ここで、このような音声処理装置は、前記ダウンサンプリング部において、前記入力オーディオデータのサンプリングレートの２のべき乗分の１のサンプリングレートのうちの、前記周波数帯域上限検出部が検出した上限の２倍以下のサンプリングレートとなる最大のサンプリングレートに、前記入力オーディオデータを当該入力オーディオデータからサンプルを間引くことによりダウンサンプリングして、中間オーディオデータを生成し、前記アップサンプリング部において、前記中間オーディオデータを、FIF(Fractal Interpolation Functions）によって、当該中間オーディオデータのサンプリングレートの２のべき乗倍のサンプリングレートにアップサンプリングして、前記高域補間後のオーディオデータを生成するように構成してもよい。

また、以上の音声処理装置は、前記入力オーディオデータが、圧縮符号化されたオーディオデータを復号したオーディオデータである場合には、前記周波数帯域上限検出部において、前記圧縮符号化されたオーディオデータの再生時に単位時間あたりに処理すべき当該圧縮符号化されたオーディオデータのビット数を表すビットレートに基づいて、前記入力オーディオデータが表す音声の周波数帯域の上限を検出するように構成してもよい。

このような音声処理装置によれば、オーディオデータが表す音声の周波数帯域の上限が低い場合であっても、FIF(Fractal Interpolation Functions）によるアップサンプリングによって補間されずに欠落してしまう周波数帯域が発生してしまうことを抑止して良好に高域を補間できるようになる。

以上のように、本発明によれば、オーディオデータが表す音声の周波数帯域の上限によらずに、良好に高域を補間することができる音声処理装置を提供することができる。

本発明の実施形態に係る音声処理装置の構成を示すブロック図である。本発明の実施形態に係る音声処理装置において高域補間を行う機能ブロックを示す図である。本発明の実施形態に係る高域補間動作制御処理を示すフローチャートである。本発明の実施形態に係る高域補間動作の例を示す図である。本発明の実施形態に係る高域補間動作の例を示す図である。 FIFによる高域補間の原理を示す図である。本発明の実施形態に係る高域補間の結果と従来の高域補間の結果の比較例を示す図である。

以下、本発明の実施形態について説明する。
図１に、本実施形態に係る音声処理装置の構成を示す。
図示するように、音声処理装置は、オーディオソース１、入力処理部２、デジタルサウンドプロセッサ３、アンプ４、スピーカ５、以上各部を制御する制御部６を備えている。
このような構成において、オーディオソース１は、オーディオファイルを記録した記録メディアや、オーディオデータを受信する放送受信装置などのオーディオデータを出力する装置である。
また、入力処理部２は制御部６の制御に従ってオーディオソース１からのオーディオデータの取り込みを行い、必要に応じて取り込んだオーディオデータの復号などの前処理を行って、前処理を行ったオーディオデータを入力オーディオデータとしてデジタルサウンドプロセッサ３に出力する。

また、入力処理部２は、入力オーディオデータのデジタルサウンドプロセッサ３への出力に先だって、入力オーディオデータのサンプリングレートと、当入力オーディオデータが表す音声の周波数帯域の上限を検出し、制御部６に通知する。ここで、オーディオデータが表す音声の周波数帯域の上限は、入力オーディオデータの周波数スペクトルを解析して検出するようにしてもよい。または、オーディオソース１から取り込むオーディオデータが圧縮符号化されたオーディオデータであれば、当該圧縮符号化されたオーディオデータのビットレート（再生時に１秒間あたりに処理すべき圧縮符号化されたオーディオデータのビット数）に応じて、入力オーディオデータが表す音声の周波数帯域の上限を検出するようにしてもよい。なお、圧縮符号化されたオーディオデータのビットレートに応じて、入力オーディオデータが表す音声の周波数帯域の上限を検出する場合には、予め、ビットレートとオーディオデータが表す音声の周波数帯域の上限との関係を登録しておき、当該登録した関係に応じて、入力オーディオデータが表す音声の周波数帯域の上限を検出するようにする。
次に、デジタルサウンドプロセッサ３は、予め設定されたプログラムに従った音声処理を行うプロセッサであり、制御部６の制御に従って、入力処理部２から入力する入力オーディオデータに対して高域補間などの音声処理を施し出力オーディオデータとしてアンプ４に出力する。

そして、アンプ４はデジタルサウンドプロセッサ３から入力する出力オーディオデータを、制御部６から設定されたゲインで増幅し、スピーカ５に出力する。
次に、図２に、デジタルサウンドプロセッサ３の高域補間を行う機能構成を示す。
図示するように、デジタルサウンドプロセッサ３は、代表点抽出部３１、写像関数算出部３２、補間処理部３３とを備えている。ここで、これらの、代表点抽出部３１、写像関数算出部３２、補間処理部３３の動作については後述する。

なお、デジタルサウンドプロセッサ３の代表点抽出部３１、写像関数算出部３２、補間処理部３３は、上述のようにデジタルサウンドプロセッサ３が、予め設定されたプログラムを実行することにより実現されるものである。

次に、制御部６は予め設定されたプログラムに従った処理を行うプロセッサであり、予め設定されたプログラムに従った処理の一つとして高域補間動作制御処理を行う。
図３に、この高域補間動作制御処理の手順を示す。
図示するように、高域補間動作制御処理において制御部６は、入力処理部２からの入力オーディオデータのサンプリングレートと入力オーディオデータが表す音声の周波数帯域の上限の通知の発生を監視する（ステップ３０２）。

そして、通知が発生したならば、入力オーディオデータが表す音声の周波数帯域の上限の２倍以下となるように、代表点オーディオデータのサンプリングレートを決定し、決定した代表点オーディオデータのサンプリングレートを代表点抽出部３１に設定する（ステップ３０４）。

ここで、代表点オーディオデータのサンプリングレートは、具体的には、たとえば、入力処理部２からの入力オーディオデータのサンプリングレートの２のべき乗分の１のサンプリングレートのうちの、入力オーディオデータが表す音声の周波数帯域の上限の２倍以下となる最大のサンプリングレートとする。

さて、このようにして、代表点オーディオデータのサンプリングレートを設定された代表点抽出部３１は、予め定めた時間長の時間区間である単位処理区間Ｔ毎に、入力オーディオデータを、代表点オーディオデータのサンプリングレートとして設定されたサンプリングレートのオーディオデータにダウンサンプリングし、ダウンサンプリングしたオーディオデータを、当該単位処理区間Ｔの代表点オーディオデータとして写像関数算出部３２と補間処理部３３に出力する。

ここで、この入力オーディオデータの代表点オーディオデータへのダウンサンプリングは、代表点のサンプリングレートが設定された代表点オーディオデータのサンプリングレートとなるように、入力オーディオデータの単位処理区間Ｔ内のサンプルのうちから代表点とするサンプルを選定し、入力オーディオデータから、代表点として選定したサンプル以外のサンプルを間引いたオーディオデータを、当該単位処理区間Ｔ内の代表点オーディオデータとすることにより行う。

すなわち、たとえば、代表点オーディオデータのサンプリングレートとして、入力オーディオデータのサンプリングレートの1/2のサンプリングレートが設定された場合には、図４ａに白丸で示す入力オーディオデータの単位処理区間Ｔ内のサンプルから、一つおきにサンプルを代表点として抽出して、図４ｂに黒丸で示すように、代表点として抽出した入力オーディオデータのサンプルを代表点オーディオデータの単位処理区間Ｔ内のサンプルとする。

また、たとえば、表点のサンプリングレートとして、入力オーディオデータの１/４のサンプリングレートが設定された場合には、図４ａに白丸で示す入力オーディオデータの単位処理区間Ｔ内のサンプルから、三つおきにサンプルを代表点として抽出して、図４ｃに黒丸で示すように、代表点として抽出した入力オーディオデータのサンプルを代表点オーディオデータの単位処理区間Ｔ内のサンプルとする。

さて、以下では、このようにして生成した代表点オーディオデータの単位処理区間Ｔ内の隣接するサンプル間の区間t_iを「補間区間」と呼んで説明を行う。
さて、以上のようにして、代表点オーディオデータを受け取った写像関数算出部３２は、単位処理区間Ｔの各補間区間t_i毎に、入力オーディオデータの単位処理区間Ｔの信号を、補間区間t_iに縮小写像する写像関数ω_iを、当該補間区間t_iの写像関数ω_iとして算出し補間処理部３３に設定する。

ここで、補間区間t_iの写像関数ω_iの算出は次のように行う。
すなわち、 x_iを代表点オーディオデータの単位時間区間Ｔ内のi番目のサンプルの時間位置、y_iを単位時間区間Ｔ内のi番目のサンプルのサンプル値（大きさ）として、a_i、e_i、c_i、f_iを下式（１）-（４）によって定義する。なお、x₀は代表点オーディオデータの単位時間区間Ｔの始点となるサンプルの時間位置、y₀は単位時間区間Ｔの始点となるサンプルのサンプル値（大きさ）、x_Mは代表点オーディオデータの単位時間区間Ｔの終点となるサンプルの時間位置、y_Mは単位時間区間Ｔの終点となるサンプルのサンプル値（大きさ）を表している。

但し、d_iとしては、μ_nを単位時間区間Ｔ内の入力オーディオデータのｎ番目のサンプルの時間位置、ν_nを単位時間区間Ｔ内の入力オーディオデータのｎ番目のサンプルのサンプル値（大きさ）として、
下式（５）を最小とする値を用いる。

ここで、式（５）におけるｍは、Ｄを入力オーディオデータの隣接するサンプル間の時間間隔として下式（６）によって定める。

但し、式（６）において、 []はガウスの記号であり、 [Ｘ]はＸを超えない最大の整数を表す。
なお、式（５）は、α_n、β_nを式（７）、（８）のように定義すると、式（９）のように変形することができる。

そして、式（５）、式（９）を最小とするｄ_iは、式（１０）によって求めることができる。

そして、以上のようにして定まる、a_i、e_i、c_i、f_iを用いて、補間区間t_iの写像関数ω_iを下式（１１）によって設定する。

なお、式１１において、p_nは、単位時間区間Ｔ内の入力オーディオデータのｎ番目のサンプルの写像関数ω_iによる写像後の時間位置を、q_nは単位時間区間Ｔ内の入力オーディオデータのｎ番目のサンプルの写像関数ω_iによる写像後のサンプル値（大きさ）を表す。

ところで、以上の写像関数ω_iの算出は、計算を簡単にするために、単位時間区間Ｔの時間長が１となるように、各時間を正規化した上で行うようにしてもよい。
さて、図３に戻り、代表点オーディオデータのサンプリングレートを代表点抽出部３１に設定したならば（ステップ３０４）、制御部６は、高域補間後オーディオデータのサンプリングレートと代表点オーディオデータのサンプリングレートとの比に応じて写像元サンプル位置を算定して補間処理部３３に設定し（ステップ３０６）、ステップ３０２からの処理に戻る。なお、高域補間後オーディオデータのサンプリングレートとは、デジタルサウンドプロセッサ３において高域補間したオーディオデータである高域補間後オーディオデータのサンプリングレートとして予め設定されているサンプリングレートである。
ただし、本実施形態では、高域補間後オーディオデータのサンプリングレートと入力オーディオデータのサンプリングレートとは、高域補間後オーディオデータのサンプリングレートが、入力オーディオデータのサンプリングレートと等しいか、入力オーディオデータのサンプリングレート２のべき乗倍となる関係にあり、高域補間後オーディオデータのサンプリングレートは、代表点オーディオデータのサンプリングレートの２のべき乗倍となるものとする。

ここで、ステップ３０６の写像元サンプル位置の算定は次のように行う。
すなわち、高域補間後オーディオデータのサンプリングレートが、代表点オーディオデータのサンプリングレートの２のｎ乗倍であれば、単位処理区間Ｔを２ⁿ個の等時間長の時間区間に分割したときの、分割位置となる時間位置を写像元サンプル位置として算定する。なお、単位処理区間Ｔの始点と終点は、写像元サンプル位置として算定されない。ただし、単位処理区間Ｔの終点も写像元サンプル位置として算定するようにしてもよい。

結果、たとえば、高域補間後オーディオデータのサンプリングレートが、代表点オーディオデータのサンプリングレートの２倍であれば、図５ａ１に入力オーディオデータの写像元サンプル位置のサンプルを二重丸で示すように、単位処理区間Ｔの中央の時間位置が写像元サンプル位置として算定され、高域補間後オーディオデータのサンプリングレートが、代表点オーディオデータのサンプリングレートの４倍であれば、図５ｂ１に入力オーディオデータの写像元サンプル位置のサンプルを二重丸で示すように、単位処理区間Ｔの始点から単位処理区間Ｔの時間長の１/４離れた時間位置と、単位処理区間Ｔの中央の時間位置と、単位処理区間Ｔの終点から単位処理区間Ｔの時間長の１/４離れた時間位置とが写像元サンプル位置として算定される。

さて、このようにして写像元サンプル位置が設定された補間処理部３３は、単位処理区間Ｔの補間区間t_iのそれぞれについて、当該補間区間t_iについて写像関数算出部３２で算出された写像関数ω_iを用いて、単位処理区間Ｔの入力オーディオデータの各写像元サンプル位置にあるサンプルを、代表点オーディオデータの各代表点の間に写像することにより、代表点オーディオデータをアップサンプリングし、高域補間後オーディオデータとして出力する。

すなわち、たとえば、図５ａ１のように、単位処理区間Ｔの中央の時間位置が写像元サンプル位置として設定されている場合には、図５ａ２に示すように、代表点オーディオデータの各補間区間t_iについて、入力オーディオデータの当該写像元サンプル位置にある一つの二重丸のサンプルが、当該補間区間t_iの写像関数ω_iを用いて当該補間区間t_iの中央の時間位置に写像されて、代表点オーディオデータがアップサンプリングされ、アップサンプリングされた代表点オーディオデータが高域補間後オーディオデータとして出力される。

また、図５ｂ１のように、単位処理区間Ｔの始点から単位処理区間Ｔの１/４離れた時間位置と、単位処理区間Ｔの中央の時間位置と、単位処理区間Ｔの終点から単位処理区間Ｔの１/４離れた時間位置とが写像元サンプル位置として設定されている場合には、図５ｂ２に示すように、代表点オーディオデータの各補間区間t_iについて、入力オーディオデータの当該写像元サンプル位置にある３つの二重丸のサンプルが、当該補間区間t_iの写像関数ω_iを用いて当該補間区間の当該補間区間t_iの始点から補間区間の時間長の１/４離れた時間位置と、当該補間区間t_iの中央の時間位置と、当該補間区間t_iの終点から補間区間の時間長の１/４離れた時間位置に写像されて、代表点オーディオデータがアップサンプリングされ、アップサンプリングされた代表点オーディオデータが高域補間後オーディオデータとして出力される。

なお、以上の補間処理部３３の処理において、各写像元サンプル位置にある入力オーディオデータのサンプルが代表点オーディオデータのサンプルとして代表点オーディオデータに含まれている場合には、その代表点オーディオデータのサンプルを写像元サンプル位置にある入力オーディオデータのサンプルに代えて用いるようにしてもよい。

さて、このようにして、補間処理部３３から出力された高域補間後オーディオデータはそのまま、もしくは、デジタルサウンドプロセッサ３において周波数特性調整処理等の他の音声信号処理が施された後、出力オーディオデータとしてアンプ４に出力される。

ここで、以上のようにして生成した高域補間後オーディオデータの周波数特性を図７ｂに示す。
図７ｂは、オーディオデータのサンプリングレートが96kHz、オーディオデータが表す音声の周波数帯域の上限が20kHz、ダウンサンプリング後の代表点オーディオデータのサンプリングレートが48kHz、高域補間後オーディオデータのサンプリングレートが96kHzである場合について表しており、図中、SIがオーディオデータの周波数特性を、SOがFIFによって高域を補間したオーディオデータの周波数特性を表している。

上述した図７ａの比較よりも示されるように、本実施形態で高域補間した高域補間後のオーディオデータでは、図７ｂのように入力オーディオデータが表す音声の周波数帯域の上限Fmax周辺の高域成分も欠落なく補間されている。

よって、本実施形態によれば、オーディオデータが表す音声の周波数帯域の上限に関わらずに、良好に高域を補間することができる。

１…オーディオソース、２…入力処理部、３…デジタルサウンドプロセッサ、４…アンプ、５…スピーカ、６…制御部、３１…代表点抽出部、３２…写像関数算出部、３３…補間処理部。

Claims

オーディオデータの高域補間を行う音声処理装置であって、
前記高域補間の対象とするオーディオデータである入力オーディオデータが表す音声の周波数帯域の上限を検出する周波数帯域上限検出部と、
前記周波数帯域上限検出部が検出した上限の２倍以下のサンプリングレートとなるように、前記入力オーディオデータを当該入力オーディオデータからサンプルを間引くことによりダウンサンプリングして、中間オーディオデータを生成するダウンサンプリング部と、
前記ダウンサンプリング部が生成した中間オーディオデータを、FIF(Fractal Interpolation Functions）によってアップサンプリングして、高域補間後のオーディオデータを生成するアップサンプリング部とを有することを特徴とする音声処理装置。
請求項１記載の音声処理装置であって、
前記ダウンサンプリング部は、前記入力オーディオデータのサンプリングレートの２のべき乗分の１のサンプリングレートのうちの、前記周波数帯域上限検出部が検出した上限の２倍以下のサンプリングレートとなる最大のサンプリングレートに、前記入力オーディオデータを当該入力オーディオデータからサンプルを間引くことによりダウンサンプリングして、中間オーディオデータを生成し、
前記アップサンプリング部は、前記中間オーディオデータを、FIF(Fractal Interpolation Functions）によって、当該中間オーディオデータのサンプリングレートの２のべき乗倍のサンプリングレートにアップサンプリングして、前記高域補間後のオーディオデータを生成することを特徴とする音声処理装置。
請求項１または２記載の音声処理装置であって、
前記入力オーディオデータは、圧縮符号化されたオーディオデータを復号したオーディオデータであり、
前記周波数帯域上限検出部は、前記圧縮符号化されたオーディオデータの再生時に単位時間あたりに処理すべき当該圧縮符号化されたオーディオデータのビット数を表すビットレートに基づいて、前記入力オーディオデータが表す音声の周波数帯域の上限を検出することを特徴とする音声処理装置。
音声処理を行う音声処理装置において、オーディオデータの高域補間を行う音声処理方法であって、
前記音声処置装置が、前記高域補間の対象とするオーディオデータである入力オーディオデータが表す音声の周波数帯域の上限を検出する周波数帯域上限検出ステップと、
前記音声処置装置が、前記周波数帯域上限検出ステップで検出した上限の２倍以下のサンプリングレートとなるように、前記入力オーディオデータを当該入力オーディオデータからサンプルを間引くことによりダウンサンプリングして、中間オーディオデータを生成するダウンサンプリングステップと、
前記音声処置装置が、前記ダウンサンプリングステップで生成した中間オーディオデータを、FIF(Fractal Interpolation Functions）によってアップサンプリングして、高域補間後のオーディオデータを生成するアップサンプリング部とを有することを特徴とする音声処理方法。
請求項４記載の音声処理方法であって、
前記ダウンサンプリングステップにおいて、前記入力オーディオデータのサンプリングレートの２のべき乗分の１のサンプリングレートのうちの、前記周波数帯域上限検出ステップで検出した上限の２倍以下のサンプリングレートとなる最大のサンプリングレートに、前記入力オーディオデータを当該入力オーディオデータからサンプルを間引くことによりダウンサンプリングして、中間オーディオデータを生成し、
前記アップサンプリングステップにおいて、前記中間オーディオデータを、FIF(Fractal Interpolation Functions）によって、当該中間オーディオデータのサンプリングレートの２のべき乗倍のサンプリングレートにアップサンプリングして、前記高域補間後のオーディオデータを生成することを特徴とする音声処理方法。
請求項４または５記載の音声処理方法であって、
前記入力オーディオデータは、圧縮符号化されたオーディオデータを復号したオーディオデータであり、
前記周波数帯域上限検出ステップにおいて、前記圧縮符号化されたオーディオデータの再生時に単位時間あたりに処理すべき当該圧縮符号化されたオーディオデータのビット数を表すビットレートに基づいて、前記入力オーディオデータが表す音声の周波数帯域の上限を検出することを特徴とする音声処理方法。
コンピュータによって読み取られ実行されるコンピュータプログラムであって、
前記コンピュータを、
高域補間の対象とするオーディオデータである入力オーディオデータが表す音声の周波数帯域の上限を検出する周波数帯域上限検出部と、
前記周波数帯域上限検出部が検出した上限の２倍以下のサンプリングレートとなるように、前記入力オーディオデータを当該入力オーディオデータからサンプルを間引くことによりダウンサンプリングして、中間オーディオデータを生成するダウンサンプリング部と、
前記ダウンサンプリング部が生成した中間オーディオデータを、FIF(Fractal Interpolation Functions）によってアップサンプリングして、高域補間後のオーディオデータを生成するアップサンプリング部として機能させることを特徴とするコンピュータプログラム。
請求項７記載のコンピュータプログラムであって、
前記ダウンサンプリング部は、前記入力オーディオデータのサンプリングレートの２のべき乗分の１のサンプリングレートのうちの、前記周波数帯域上限検出部が検出した上限の２倍以下のサンプリングレートとなる最大のサンプリングレートに、前記入力オーディオデータを当該入力オーディオデータからサンプルを間引くことによりダウンサンプリングして、中間オーディオデータを生成し、
前記アップサンプリング部は、前記中間オーディオデータを、FIF(Fractal Interpolation Functions）によって、当該中間オーディオデータのサンプリングレートの２のべき乗倍のサンプリングレートにアップサンプリングして、前記高域補間後のオーディオデータを生成することを特徴とするコンピュータプログラム。
請求項７または８記載のコンピュータプログラムであって、
前記入力オーディオデータは、圧縮符号化されたオーディオデータを復号したオーディオデータであり、
前記周波数帯域上限検出部は、前記圧縮符号化されたオーディオデータの再生時に単位時間あたりに処理すべき当該圧縮符号化されたオーディオデータのビット数を表すビットレートに基づいて、前記入力オーディオデータが表す音声の周波数帯域の上限を検出することを特徴とするコンピュータプログラム。