JP2009260574A

JP2009260574A - 音声信号処理装置、音声信号処理方法及び音声信号処理装置を備えた携帯端末

Info

Publication number: JP2009260574A
Application number: JP2008106125A
Authority: JP
Inventors: Jin Chin; 迅陳
Original assignee: Sony Ericsson Mobile Communications Japan Inc
Current assignee: Sony Corp
Priority date: 2008-04-15
Filing date: 2008-04-15
Publication date: 2009-11-05

Abstract

【課題】立体音響の再生処理を行う場合に、演算処理に必要な構成や演算処理量を削減すると共に、良好な再生ができるようにする。
【解決手段】ダミーヘッドを使用して測定された頭部伝達関数を、制限されたサンプル数に間引いて頭部伝達関数データベースとして記憶部３２に記憶する。そして、記憶された頭部伝達関数データベース内の、制限されたサンプル数の頭部伝達関数から、指示された音源位置の伝達関数を処理部３３で抽出する。その抽出した伝達関数を、入力した音声信号に乗算して、バイノーラル立体音響を生成させるための２チャンネルの音声信号を算出部３７で得る。
【選択図】図１

Description

本発明は、例えば携帯電話端末などの音声信号を扱う比較的小型の電子機器に適用して好適な音声信号処理装置及び音声信号処理方法、並びにその音声信号処理装置を備えた携帯端末に関し、特に、立体音響を再生させる技術に関する。

従来、音声信号を扱うポータブル音声機器が各種実用化されている。例えば、音楽データをダウンロードして記憶し、その記憶した音楽データを、装着されたヘッドホンから再生させる携帯電話端末が普及している。また、携帯電話端末としての機能を備えてなく、音楽データの記憶と再生を行う、いわゆるポータブル型再生装置も各種実用化されている。

このような音楽データなどを再生する機能を備えた機器は、ヘッドホンを接続して、そのヘッドホンから再生させるのが一般的である。また、機器そのものが、小型のスピーカを内蔵して、その内蔵されたスピーカから出力させるようにしたものもある。

通常、この種の機器で音楽再生を行う際には、入力した音声信号が２チャンネルの音声信号であることが一般的である。従って、ヘッドホンから再生させる場合には、その２チャンネルの音声信号をそのままヘッドホンの左右のチャンネルのユニットに供給して出力させるようにしている。ところが、一般的な２チャンネルの音声信号は、ある程度の間隔を離して設置したスピーカとリスナーが向き合ったときに正しい立体音響となる、いわゆるステレオフォニックの音声信号である。

これに対して、ヘッドホンから再生される音声信号として、リスナーの頭部にヘッドホンを装着した際に、正しい立体音響で再生されるバイノーラル方式の音声信号が知られている。
２チャンネルのバイノーラル音声信号を生成させる処理は、近年の集積回路化されたＤＳＰを使用することで可能となっており、高機能化された音声処理装置などで実用化されている。例えば、ビデオ再生装置と組み合わせて使用されるヘッドホン装置として、映画などのビデオプログラムを視聴する際に、立体音響が再生される処理を行うものが実用化されている。

特許文献１には、２チャンネルのバイノーラル方式で集音された音声信号の処理についての開示がある。
特開２００５−２２３７１３号公報

先に述べたように、ポータブル型の音声再生装置の１つとして、携帯電話端末が普及している。この携帯電話端末に、上述した２チャンネルのバイノーラル音声信号を生成させる処理回路を内蔵させれば、携帯電話端末にヘッドホンを接続して、音楽などを再生させる際に、正しい立体音響で再生させることができ、好ましい。

ところが、従来のバイノーラル音声信号を生成させる処理構成は、ＤＳＰと称される非常に大規模な回路構成の集積回路を使用した非常に大規模な演算処理が必要であった。このため、例えば携帯電話端末の如き、ポータブル型の電子機器に内蔵させるのには、演算処理能力、コストなどのいずれの面からも無理があった。演算処理量が多いということは、バッテリの持続時間も短くしてしまい、好ましくない。

また、別の問題として、従来のバイノーラル音声信号を生成させる処理構成は、実際に収音した音を解析したデータに基いて行うために生じる問題がある。即ち、解析用のデータは、人間の頭部を模した形状のダミーヘッドを使用して、実際の音源からの音が、そのダミーヘッドの耳介の部分に装着したマイクロフォンで収音したものである。このため、ダミーヘッドのサイズとほぼ一致した頭部のサイズを有するリスナーが聴取する場合には、適正な立体音響が再現されるが、頭部のサイズが異なるリスナーが聴取する場合には、適正でない可能性がある。

本発明はかかる点に鑑みてなされたものであり、立体音響の再生処理を行う場合に、演算処理に必要な構成や演算処理量を削減すると共に、良好な再生ができるようにすることを目的とする。

本発明は、ダミーヘッドを使用して測定された頭部伝達関数を、制限されたサンプル数に間引いて頭部伝達関数データベースとして記憶する。そして、記憶された頭部伝達関数データベース内の、制限されたサンプル数の頭部伝達関数から、指示された音源位置の伝達関数を抽出する。その抽出した伝達関数を、入力した音声信号に畳み込んで、バイノーラル立体音響を生成させるための２チャンネルの音声信号を得る。

本発明によると、制限されたサンプル数に間引いた頭部伝達関数のデータベースを用意することで、音声信号処理を行う機器が必要な記憶手段の記憶容量をそれだけ削減することが出来る。また、そのサンプル数が間引かれた頭部伝達関数を利用して演算処理を行うことで、バイノーラル立体音響を生成するための演算処理量を削減することが出来る。

本発明によると、音声信号処理を行う機器が必要な記憶手段の記憶容量をそれだけ削減することが出来ると共に、バイノーラル立体音響を生成するための演算処理量を削減することが出来る。従って、本発明によると機器構成の簡易化につながり、例えば携帯電話端末の如きポータブル型の電子機器に内蔵させるのに適した構成に出来る。

以下、本発明の実施の形態を、添付図面を参照して説明する。
本実施の形態においては、携帯用として小型に構成された無線通信端末である、携帯電話端末に適用した例としてある。その携帯電話端末が内蔵した音声信号処理機能部において、以下に説明する処理を実行するようにしたものである。

まず、図２を参照して、本実施の形態の携帯電話端末の全体の構成例を説明する。
図２に示すように、制御部１１を備えて、この制御部１１が、携帯電話端末内の各部の処理動作を制御する。制御部１１は、制御ライン２８を介して、端末内の各部とデータのやり取りをおこなう。

また本実施の形態の携帯電話端末は、通信端末として必要な無線通信処理を行う通信部１２を備え、通信部１２にアンテナ１３が接続してある。この通信部１２が、無線電話用の基地局と無線通信を行って、基地局との間で、双方向のデータ伝送を行う。通信部１２は、データライン２９を介して、基地局側から受信したデータを端末内の各部に送出する。また、端末内の各部１７からデータライン２９を介して伝送されたデータを、基地局側に送信させる。

データライン２９には、通信部１３の他に、メモリ１４と表示部１５と音声処理部１７と立体音響処理部２１とが接続してある。メモリ１４は、本実施の形態の端末を動作させるために必要なプログラムや、ユーザが記憶させた各種データなどを記憶する。ダウンロードなどで得た音楽データなどの音声信号の記憶についても、メモリ１４が行う。後述するデータベースについても、このメモリ１４を記憶手段として使用しても良い。
表示部１５は、液晶表示ディスプレイや有機ＥＬディスプレイなどが表示手段として使用され、制御部１１の制御で、各種情報の表示を行う。後述する設定操作時には、この表示部１５での表示に従ってユーザは操作部１６での設定操作を行う。
操作部１６は、携帯電話端末として必要な数字や記号などのダイヤルキー、各種機能キーなどで構成される。これらの操作部１６を構成する各キーの操作情報は、制御部１１に供給される。

音声処理部１７は、音声信号の処理を行う処理部であり、スピーカ１８及びマイクロフォン１９が接続してある。このスピーカ１８及びマイクロフォン１９は、通話時に受話器として使用されるものである。即ち、通信部１２から音声処理部１７に供給される音声データを、音声処理部１７で復調してアナログ音声信号とし、増幅などのアナログ処理を行ってスピーカ１８から放音させる。また、マイクロフォン１９が集音した音声信号を、音声処理部１７でデジタル音声データに変調し、その変調された音声データを通信部１２に供給して、無線送信などを行う。
また、音声処理部１７に供給される音声データの内で、立体音響として出力させる音声については、次に説明する立体音響処理部２１に供給して処理させる。

そして本実施の形態の携帯電話端末は、立体音響処理部２１を備える。立体音響処理部２１は、バイノーラル立体音響としての２チャンネルの音声信号を生成する処理部である。この立体音響処理部２１で処理する音声信号は、音声処理部１７から供給される場合の他に、メモリ１４などから読み出してデータライン２９を介して供給される場合や、通信部１２で受信した音声データがデータライン２９を介して供給される場合など、いずれの音声信号であってもよい。立体音響処理部２１でバイノーラル立体音響としての２チャンネルの音声信号を生成させる具体的な処理については、図１などを参照して後述する。

立体音響処理部２１で生成された音声信号は、携帯電話端末本体に内蔵された左右のチャンネル用の２つのスピーカ２２Ｌ，２２Ｒから出力させる場合と、出力端子２３に接続されたヘッドホン（図示せず）から出力させる場合とがある。スピーカ２２Ｌ，２２Ｒは、携帯電話端末本体に内蔵されるスピーカであるので、比較的小型なスピーカユニットを使用したスピーカであるが、端末本体の周囲にいるリスナーに対して再生音を聞かせることが出来程度に増幅して出力させるスピーカである。
なお、ヘッドホンから出力させる場合には、出力端子２３にヘッドホンを直接接続していわゆる有線接続する場合の他に、例えばＢｌｕｅｔｏｏｔｈ（商標）方式などでヘッドホンと無線通信する近距離無線通信部を内蔵させて、その近距離無線通信部を介してヘッドホンに音声信号を供給する構成としてもよい。

次に、図２に示した立体音響処理部２１の構成例を、図１を参照して説明する。
図１は、本実施の形態による立体音響処理部２１の全体構成例を示した図である。
図１の左側から信号の流れに沿って順に説明すると、まず音源方向設定部３１を有する。この音源方向設定部３１は、出力させる音声信号により生成される立体音響中に音源を定位させる位置を設定するものである。この音源方向は、例えば、図２に示した制御部１１の制御に基づいて、処理する音声信号ごとに予め決められた位置とする。或いは、処理する音声信号の付加情報などに、音源位置についての指示がある場合には、その位置とする。或いはまた、図１に示した操作部１６のユーザ操作などで、音源位置を自由に設定できるようにしてもよい。

音源方向設定部３１が出力する音源位置のデータは、ＨＲＴＦ処理部３３に供給する。ＨＲＴＦ処理部３３は、頭部伝達関数（ＨＲＴＦ：Head-Related Transfer Function）を処理する処理部であり、ＨＲＴＦ（頭部伝達関数）データベース３２に格納された頭部伝達関数の中から、適切な頭部伝達関数を抽出する。ＨＲＴＦデータベース３２には、リスナーの位置を中心とした水平方向の周囲３６０°のそれぞれの音源位置での左右のチャンネルの頭部伝達関数を記憶してある。このデータベース３２は、例えば図２に示したメモリ１４を使用する。或いは、立体音響処理部２１内に専用の記憶部を用意しても良い。本実施の形態においては、このＨＲＴＦデータベース３２に格納させる頭部伝達関数として、ダミーヘッドを使用して測定された本来の頭部伝達関数のサンプリング値を間引いたサンプリング値として、データ量を大幅に削減したデータとしてある。また、データベースで示される音源位置についても、例えば１０°刻みで周囲３６０°の音源位置のデータとして、比較的粗い位置間隔としてある。

ＨＲＴＦ処理部３３で抽出された頭部伝達関数は、パーソナライズ部３４に供給する。パーソナライズ部３４は、ＨＲＴＦモデル算出部３６が算出した、頭部伝達関数のモデルのデータを使用して、ＨＲＴＦ処理部３３から供給される頭部伝達関数を修正する。ＨＲＴＦモデル算出部３６で算出する頭部伝達関数のモデルのデータは、サイズ設定部３５で設定されたリスナーの頭部のサイズのデータに基いて算出が行われる。従って、パーソナライズ部３４では、サイズ設定部３５で設定されたリスナーの頭部のサイズに基いた修正が行われることになる。サイズ設定部３５でのリスナーの頭部のサイズの設定は、例えば、図２に示した操作部１６の操作で、立体音響の設定画面を表示部１５に表示させた上で、リスナーの頭部のサイズと耳介のサイズをユーザ操作で選択することで実行される。設定されたリスナーの頭部及び耳介のサイズの設定値は、メモリ１４などに記憶されて読み出される。

パーソナライズ部３４で修正された頭部伝達関数は、立体音響算出部３７に供給される。立体音響算出部３７では、音声信号入力部３８に入力した音声信号について、供給される頭部伝達関数を使用した演算処理で、立体音響化されたバイノーラル信号としての２チャンネルの音声信号を得る。

立体音響算出部３７で得られた２チャンネルの音声信号は、出力端子２３に接続されたヘッドホン２４に供給して出力させる。或いは、立体音響算出部３７で得られた２チャンネルの音声信号を、クロストークキャンセル部３９に供給して、２つのチャンネルのクロストーク成分を除去した上で、携帯電話端末本体に内蔵されたスピーカ２２Ｌ，２２Ｒから出力させる。既に説明したように携帯電話端末本体からヘッドホン２４への伝送については、無線伝送するようにしてもよい。

次に、立体音響処理部２１内の各部の具体的な例を、図３以降を参照して説明する。
図３は、ＨＲＴＦデータベース３２に格納させる頭部伝達関数（ＨＲＴＦ）の生成処理例を示した構成である。この図３に示した処理構成は、データベースに格納させるデータを生成させる際の処理であるので、携帯電話端末を製造するメーカー側で、端末に格納させるソフトウェアを製作する際に用意するものである。

図３に示したように、まず測定された頭部伝達関数を記憶したＨＲＴＦデータベース５１を用意する。このデータベース５１に記憶された頭部伝達関数は、ダミーヘッドの両耳の箇所に装着したマイクロフォンで、それぞれの音源位置での発する音のインパルス応答を収音する測定を行って、その測定値に基いた頭部伝達関数である。この測定に使用するダミーヘッドは、標準的なサイズのものとしてある。それぞれの音源位置から拾った音は、図示しない収音処理構成で、インパルス応答を所定のサンプリング周期による５１２サンプル点で測定した信号とする。その５１２サンプル点の信号で構成される頭部伝達関数を、１つの音源位置の頭部伝達関数として記憶する。また、音源位置は、ダミーヘッドの周囲水平方向の３６０°について、例えば５°刻みの位置に設定してある。それぞれの音源位置の頭部伝達関数には、両耳時間差情報（ＩＴＤ：Inter-aural Time Differences）と、振幅情報（ＭＰＳ：Minimum Phase Systems）とがある。
このデータベース５１に記憶された頭部伝達関数は、一般的な頭部伝達関数として既知のものであり、既存の頭部伝達関数が使用可能であれば、そのまま使用してよい。

そして、データベース５１に記憶された頭部伝達関数の内の、両耳時間差抽出部５２で両耳時間差情報ＩＴＤを、それぞれの音源位置のデータごとに抽出する。また、データベース５１に記憶された頭部伝達関数の内の、振幅情報ＭＰＳを、最小位相系変換部５３で抽出して必要なデータ形式に変換する。変換された振幅情報ＭＰＳは、サンプル数変換部５４に供給して、サンプル数を削減させる処理を行う。ここでは、５１２サンプルの信号を、３２サンプルに間引く処理を行う。３２サンプル以外のサンプル数に間引くようにしてもよい。

両耳時間差抽出部５２で抽出された両耳時間差情報ＩＴＤと、サンプル数変換部５４でサンプル数が変換された振幅情報ＭＰＳは、空間的リサンプリング部５５に供給して、１音源位置ごとに３２サンプルのインパルス応答値で構成された頭部伝達関数とする。このとき、空間的リサンプリング部５５では、５°刻みの音源位置のデータを、１０°刻みの音源位置のデータとして、音源位置についても間引くようにしてある。
このようにして空間的リサンプリング部５５で得られた、１０°刻みの音源位置のそれぞれで３２サンプルの信号による頭部伝達関数を、図１に示した携帯電話端末内の処理済ＨＲＴＦデータベース３２に記憶させる。

次に、図４を参照して、図１に示したＨＲＴＦ処理部３３での処理構成例を説明する。
図４に示すように、音源方向設定部３１からの音源指示データを、ＨＲＴＦ処理部３３内の候補抽出部６１に供給する。候補抽出部６１では、ＨＲＴＦデータベース３２に記憶された頭部伝達関数の内で、指示された音源位置に近い音源位置の複数の頭部伝達関数を抽出する。例えば、音源位置が正面から右側に１３°の位置と指示されたとき、処理済ＨＲＴＦデータベース３２に記憶された１０°の頭部伝達関数と２０°の頭部伝達関数を抽出する。
抽出された頭部伝達関数の内の両耳時間差情報は、ＩＴＤ処理部６２に供給し、振幅情報はＭＰＳ処理部６３に供給する。

そして、それぞれの情報を内挿処理部６４に供給する。この内挿処理部６４では、ＩＴＤ処理部６２とＭＰＳ処理部６３から供給される複数の頭部伝達関数を使用して、音源方向設定部３１から指定された音源位置の頭部伝達関数を内挿で生成させる。例えば、音源位置が正面から右側に１３°であるとき、１０°の頭部伝達関数と２０°の頭部伝達関数を、それぞれの位置に応じた比率で乗算させる処理を行って、１３°の位置の頭部伝達関数を生成させる。指示された音源位置とＨＲＴＦデータベース３２に格納された音源位置とがほぼ一致する場合には補間は行わない。なお、内挿処理部６４での補間は行わない構成として、指示された音源位置を、処理済ＨＲＴＦデータベース３２に格納された音源位置に近似させる構成としてもよい。

図５は、図１に示したパーソナライズ部３４での処理構成例を示した図である。
このパーソナライズ部３４での処理は、図１に示したサイズ設定部３５で既に設定されたリスナーの頭部及び耳介のサイズのデータに基づいて実行される。
ここで、サイズの設定処理状態の例について説明する。例えば携帯電話端末の操作部１６を操作して、頭部のサイズ設定モードとし、そのサイズ設定用の画面を、表示部１５に表示させる。
図８はその場合の設定画面の例を示した図である。この例では、頭のサイズを、「大」「標準」「小」の３種類の中からユーザ操作で選択できる例としてある。また、耳介のサイズを、「大」「標準」「小」の３種類の中からユーザ操作で選択できる例としてある。図８の例では、頭部のサイズを「標準」として選択してあり、耳介のサイズを、「小」として選択してある。
なお、図８に示した例よりもより細かく選択ができるようにしてもよい。例えば、それぞれのサイズ選択が３段階ではなく、４段階以上選択できるようにしてもよい。また、頭部のサイズとして、水平方向の頭部のサイズと垂直方向の頭部のサイズを個別に選択できるようにしてもよい。或いは、頭部のおおよその形状として、丸形形状、細長形状などから選択させ、その上で、「大」「標準」「小」などのサイズを選択させてもよい。

サイズに応じた補正処理を行うパーソナライズ部３４には、図４に示した内挿処理部６４から、内挿された（又は内挿されていない）頭部伝達関数としての、両耳時間差情報ＩＴＤと振幅情報ＭＰＳとが供給される。さらに、図１に示したサイズ設定部３５で既に設定されたリスナーの頭部及び耳介のサイズのデータについても供給される。
また、ＨＲＴＦモデル測定データ３６ａを用意し、頭部伝達関数の各サイズでの変化のデータを記憶させておく。ＨＲＴＦモデル測定データ３６ａに記憶された頭部伝達関数の各サイズでの変化のデータの内の、そのときに設定されたサイズに応じたデータを抽出部３６ｂで抽出する。

そして、パーソナライズ部３４で、抽出部３６ｂで抽出されたデータを使用して、内挿処理部６４から供給された両耳時間差情報ＩＴＤと振幅情報ＭＰＳとを、現在設定されたサイズに応じて補正された両耳時間差情報ＩＴＤ′及び振幅情報ＭＰＳ′とする。サイズ補正処理の詳細はここでは説明しないが、頭部のサイズの大小によって、主として中音域から低音域の周波数帯域の頭部伝達関数に影響がある。また、耳介のサイズの大小によって、主として高音域の周波数帯域の頭部伝達関数に影響がある。

パーソナライズ部３４で補正された頭部伝達関数である両耳時間差情報ＩＴＤ′及び振幅情報ＭＰＳ′は、図１に示した立体音響算出部３７に供給して、音声入力部３８に入力した音声信号に対して頭部伝達関数を畳み込んで２チャンネルの音声信号として、バイノーラル方式で立体音響が再現される音声信号とする。

図６は、立体音響算出部３７の構成例を示した図である。
パーソナライズ部３４で補正された両耳時間差情報ＩＴＤ′は、フェーズ情報処理部７１に供給して、音声入力部３８から入力した音声信号に対して、その両耳時間差情報ＩＴＤ′で示された左右の時差を付与した２チャンネルの音声信号とする。そして、そのフェーズ情報処理部７１で得られた左右のチャンネルの音声信号Ｌ及びＲを、それぞれのチャンネルのＦＩＲフィルタ７２Ｌ，７２Ｒに供給する。各ＦＩＲフィルタ７２Ｌ，７２Ｒでは、供給される振幅情報ＭＰＳ′に基づいて振幅を調整して、バイノーラル方式で立体音響が再現される音声信号とする。

図７は、このようして生成されたバイノーラル方式用の２チャンネルの音声信号を出力させる出力部の構成例である。
この例では、２チャンネルの音声信号Ｌ，Ｒを、それぞれ切換スイッチ８１Ｌ，８１Ｒを介して出力端子２３に供給し、出力端子２３に接続されたヘッドホン２４の左右のドライバユニットから放音させる。このようにすることで、そのヘッドホン２４を装着したリスナーには、音源の位置が音源方向設定部３１（図１）で設定した方向の音として聞き取れる。

また、２チャンネルの音声信号Ｌ，Ｒを、それぞれ切換スイッチ８１Ｌ，８１Ｒを介してクロストークキャンセル部３９に供給する構成としてある。クロストークキャンセル部３９は、係数乗算器８２Ｌ，８２Ｒと加算器８３Ｌ，８３Ｒと増幅器８４Ｌ，８４Ｒとで構成されて、２つチャンネルの信号のクロストーク成分をキャンセルして、通常の２チャンネルの音声信号とする。クロストークキャンセル部３９でクロストーク成分がキャンセルされた左右のチャンネルの音声信号は、それぞれのチャンネル用に携帯電話端末本体に内蔵されたスピーカ２２Ｌ，２２Ｒから出力させる。このスピーカ２２Ｌ，２２Ｒから出力される音声によっても、そのスピーカ２２Ｌ，２２Ｒと向き合ったリスナーには、音源の位置が音源方向設定部３１（図１）で設定した方向の音として聞き取れる。

このように本実施の形態によると、携帯電話端末にバイノーラル方式の音声信号を生成させる立体音響算出部３７を内蔵させたので、指定された音源位置の立体音響として、ヘッドホンを装着したリスナーに聴取させることが可能となる。この場合、本実施の形態の場合には、用意する頭部伝達関数のデータベース３２として、図３に示したように、本来の頭部伝達関数からサンプル数や音源位置を大幅に削減したデータを保持するようにしたので、データベース３２が記憶する情報量を大幅に少なくすることができる。また、データベース３２から頭部伝達関数を読み出して演算処理する処理構成についても、少ない情報量の頭部伝達関数を使用した演算であるので、携帯電話端末内の回路の負担が少なくなる。従って、図２に示した携帯電話端末の如き電子機器に、それほど回路などの負担を増やすことなく、立体音響処理回路を内蔵させることが可能になる。

頭部伝達関数のサンプル数を減らすことは、再生される立体音響の再現精度が劣化することにつながる。しかしながら本例においては、リスナーの頭部のサイズを設定して、それぞれの設定に基づいて補正を行い、その点から精度を上げるようにしたので、頭部伝達関数のサンプル数の減少に伴った、立体音響の再現精度の劣化を補うように機能する。頭部のサイズだけでなく、耳介のサイズも設定するようにしたことで、さらに変換精度を向上させることができる。

また、本実施の形態の場合には、図７に示すように、クロストークキャンセル部３９を備える構成として、ヘッドホンから再生させる場合と同様の立体音響が、端末本体内のスピーカからも出力可能としたことで、ヘッドホンを使用しない場合にも対処可能である。

なお、ここまで説明した実施の形態では、携帯電話端末に立体音響処理回路を内蔵させた場合の例について説明したが、その他の音声信号（オーディオ信号）を再生処理する各種電子機器に、上述した実施の形態で説明した立体音響処理部を内蔵させてもよい。例えば、音楽データを記憶して再生するポータブル型の音楽再生装置に、上述した実施の形態で説明した立体音響処理部を内蔵させてもよい。

本発明の一実施の形態による音声信号処理構成例を示すブロック図である。本発明の一実施の形態を適用した携帯電話端末の構成例を示すブロック図である。本発明の一実施の形態によるデータベースの作成処理構成例を示したブロック図である。本発明の一実施の形態による頭部伝達関数の処理構成例を示したブロック図である。本発明の一実施の形態による頭部伝達関数の補正処理構成例を示したブロック図である。本発明の一実施の形態による頭部伝達関数を使用した音声信号の処理構成例を示したブロック図である。本発明の一実施の形態による出力部の構成例を示したブロック図である。本発明の一実施の形態による設定画面の表示例を示した説明図である。

符号の説明

１１…制御部、１２…通信部、１３…アンテナ、１４…メモリ、１５…表示部、１６…操作部、１７…音声処理部、１８…スピーカ、１９…マイクロフォン、２１…立体音響処理部、２２Ｌ，２２Ｒ…スピーカ、２３…出力端子、２４…ヘッドホン、２８…制御ライン、２９…データライン、３１…音源方向設定部、３２…処理済ＨＲＴＦデータベース、３３…ＨＲＴＦ処理部、３４…パーソナライズ部、３５…サイズ設定部、３６…ＨＲＴＦモデル算出部、３７…立体音響算出部、３８…音声入力部、３９…クロストークキャンセル部、５１…ＨＲＴＦデータベース、５２…両耳時間差抽出部、５３…最小位相系変換部、５４…サンプル数変換部、５５…空間的リサンプリング部、６１…候補抽出部、６２…ＩＴＤ処理部、６３…ＭＰＳ処理部、６４…内挿処理部、７１…フェーズ情報処理部、７２Ｌ，７２Ｒ…ＦＩＲフィルタ、８１Ｌ，８１Ｒ…切換スイッチ

Claims

ダミーヘッドを使用して測定された頭部伝達関数を、制限されたサンプル数に間引いて記憶する頭部伝達関数データベースと、
前記頭部伝達関数データベースが記憶する制限されたサンプル数の頭部伝達関数から、指示された音源位置の伝達関数を抽出する伝達関数抽出部と、
前記伝達関数抽出部が抽出した伝達関数を、入力した音声信号に畳み込んで、バイノーラル立体音響を生成させるための２チャンネルの音声信号を得る立体音響処理部と、
前記立体音響処理部で得た２チャンネルの音声信号を出力させる出力部とを備える
音声信号処理装置。
前記伝達関数抽出部が抽出した頭部伝達関数を、指定された頭部のサイズに応じて修正し、修正された頭部伝達関数を、前記立体音響処理部に供給する修正部を備えた
請求項１記載の音声信号処理装置。
前記修正部は、耳介のサイズの指定による前記頭部伝達関数の修正についても行う
請求項２記載の音声信号処理装置。
前記出力部は、ヘッドホンに音声信号を出力させる端子又は伝送処理部である
請求項１又は２記載の音声信号処理装置。
前記出力部は、２チャンネルの音声信号のクロストークをキャンセルするキャンセル処理部と、前記キャンセル処理部でクロストークがキャンセルされた２チャンネルの音声信号を出力する２つのスピーカとを備えた
請求項１又は２記載の音声信号処理装置。
ダミーヘッドを使用して測定された頭部伝達関数を、制限されたサンプル数に間引いて頭部伝達関数データベースとして記憶し、
前記記憶された頭部伝達関数データベース内の、制限されたサンプル数の頭部伝達関数から、指示された音源位置の伝達関数を抽出し、
前記抽出した伝達関数を、入力した音声信号に畳み込んで、バイノーラル立体音響を生成させるための２チャンネルの音声信号を得る
音声信号処理方法。
ダミーヘッドを使用して測定された頭部伝達関数を、制限されたサンプル数に間引いて記憶する頭部伝達関数データベースと、
前記頭部伝達関数データベースが記憶する制限されたサンプル数の頭部伝達関数から、指示された音源位置の伝達関数を抽出する伝達関数抽出部と、
前記伝達関数抽出部が抽出した伝達関数を、入力した音声信号に畳み込んで、バイノーラル立体音響を生成させるための２チャンネルの音声信号を得る立体音響処理部と、
前記立体音響処理部で得た２チャンネルの音声信号を出力させる出力部とを備える
音声信号処理装置を備えた携帯端末。