JP4399362B2

JP4399362B2 - 音声信号の生成

Info

Publication number: JP4399362B2
Application number: JP2004537424A
Authority: JP
Inventors: ロナルダスエムアールツ; ロイイルワン; ダニエルダブリュイースコッベン
Original assignee: Koninklijke Philips NV; Koninklijke Philips Electronics NV
Current assignee: Koninklijke Philips NV
Priority date: 2002-09-23
Filing date: 2003-09-16
Publication date: 2010-01-13
Anticipated expiration: 2023-09-16
Also published as: ES2328922T3; AU2003260841A1; DE60328402D1; KR101016975B1; WO2004028204A3; JP2006500817A; USRE43273E1; EP1547436B1; AU2003260841A8; US7489792B2; CN100594744C; US20060045274A1; CN1685763A; KR20050043985A; WO2004028204A2; EP1547436A2

Description

本発明は、メディアシステムにおいて、頭部伝達関数(HRTF: Head Related Transfer Function)の関連する第２の組を持つ音声信号の第２の組からの少なくとも１つの入力信号から、少なくとも１つの出力信号を生成する方法に関する。

本発明は前記方法を実行するためのコンピュータシステムにも関する。

本発明はさらに、前記方法を実行するためのコンピュータプログラムにも関する。

本発明はさらに、頭部伝達関数の関連する第２の組を持つ音声信号の第２の組からの少なくとも１つの入力信号から、音声信号の第１の組からの少なくとも１つの出力信号を生成するメディアシステムにも関する。

国際公開番号WO01/49073は、外部音源をシミュレートする音声再生システムを開示している。このシステムは多数のいわゆるＨＲＴＦを使用して、一組のヘッドホンに対し音声を生成する。

従来技術の文献において、出力、すなわち音声信号となるように合成される音源の入力チャンネルは、比較的多くのＨＲＴＦを必要とすることが通常知られている。これは通例、かなり高価であり、不要な重畳(convolution)を必要として、設計するのには複雑である前記ＨＲＴＦを用いたシステム実施となる。これはさらに図１及び図２を用いて説明され、ここで対応するＨＲＴＦの公式及び番号を備える従来の応用及び本発明は計算を用いて示される。

上記問題は前記方法により解決され、この方法は、
−音声信号の第２の組における各信号に対し、中間音声信号の第３の組からの少なくとも１つの信号及び少なくとも１つの重み値を有する重み付け関係を決めるステップと、
−音声信号の第２の組、頭部伝達関数の第２の組及び重み付け関係に基づいて頭部伝達関数の第１の組を決めるステップと、
−前記音声信号の第１の組に属する少なくとも１つの出力信号を生成するために、前記頭部伝達関数の第１の組からの少なくとも１つの頭部伝達関数を用いて、中間音声信号の第３の組から少なくとも１つの信号を伝達するステップと、
を有する。

第１のステップにおいて、音声信号の第２の組における各信号、すなわち多数の入力音声信号における各信号に対し、中間音声信号及び少なくとも１つの重み値により構成される重み付け関係が決められる。ここで、前記入力音声信号は、その後に内部で使用するための中間音声信号に変換される。

第２のステップにおいて、ＨＲＴＦの第１の組であるが、新しい組は次いで、前記入力音声信号に関連し、最初は前記入力音声信号の第２に組を変形又は伝達専用である音声信号の第２の組、通常は入力音声信号及び頭部伝達関数の第２の組に基づいて決められる。

本発明よる実施例において説明される前記決定において、ＨＲＴＦの新しい組は、本来は入力音声信号の第２の組を伝達する専用の頭部伝達関数の前記第２の組よりも少ないＨＲＴＦを有する。

次いで、第３のステップにおいて、前記新しいＨＲＴＦであるが、少ないＨＲＴＦ（すなわち頭部伝達関数の第１の組）は、中間音声信号の第３の組からの１つ以上の信号が、出力信号を得るために、前記新しい、少ない数のＨＲＴＦを用いて伝達されるので、（前記音声信号の第１の組に属している）１つ以上の出力信号を生成するのに用いられる。

前記問題はさらに、前記方法を実行することができる前記メディアシステムにより解決される。このメディアシステムは、ＴＶ，ＣＤプレーヤ、ＤＶＤプレーヤ、ラジオ、音声付ディスプレイ、増幅器、ヘッドホン又はＶＣＲでもよい。

好ましい実施例において、前記メディアシステムは、
−音声信号の第２の組における各信号に対し、中間音声信号の第３の組からの少なくとも１つの信号を有する重み付け関係、及び少なくとも１つの重み値を決めるための手段と、
−音声信号の第２の組、頭部伝達関数の第２の組及び重み付け関係に基づいて頭部伝達関数の第１の組を決める手段と、
−前記音声信号の第１の組に属する少なくとも１つの出力信号を生成するために、前記頭部伝達関数の第１の組からの少なくとも１つのＨＲＴＦを用いて、中間音声信号の第３の組からの少なくとも１つの信号を伝達する手段と、
を有する。

このメディアシステムは、本方法に関して先に述べたのと同じ理由に対し同じ利点を与える。

従来技術及び本発明は、好ましい実施例と組み合わせて及び図を参照して以下に十分説明される。

本発明において、一組の頭部伝達関数（ＨＲＴＦ）は１つ以上の音声信号を生成するのに用いられる。これらＨＲＴＦは、特定の音源から耳へ音が伝搬する方法を表す関数及び１つの組に属するＨＲＴＦの数として規定され、これは音源から２つの耳への音の伝搬を表す１つのＨＲＴＦから、音を出力する音源の数に依存する多数のＨＲＴＦへとすることができる。代わりに、数個（ｎ個）の入力信号から、ｍ個の中間信号が得られ、これはｍ個のＨＲＴＦ（ｍ＞ｎ）を２回必要とする。頭部伝達関数（ＨＲＴＦ）は、（音源とする）前記入力信号を展開し、（中間積とする）マルチチャンネルの音声となるのに用いられ、これは次いでダウンミックス(down-mix)され、幾つかの生じる出力音声信号、例えばヘッドホン用の左及び右の信号となる。

ＨＲＴＦの記述はさらに以下の雑誌、H. Moller, “Fundamentals of binaural technology” Applied Acoustics, Special issue on auditory environment and telepresence, Vol. 36, No. 3-4, pp. 171-218, (1992) にも見られる。

以下において、ＨＲＴＦはさらに詳細に規定される。（例えば、耳の間の距離及び外耳の形状のようなパラメタを考慮して）任意の音源が鼓膜において生成する音圧を知ることにより、必要とされる全てのものは、音源から鼓膜へのインパルス応答であり、これは例えば耳にマイクロホンを置くことで測定されることができる。これは、頭部インパルス応答(Head-Related Impulse Response)と呼ばれ、そのフーリエ変換が頭部伝達関数（ＨＲＴＦ）と呼ばれる。このＨＲＴＦは音源の位置特定に対する物理的な手がかり(cue)の全てを取り込んでいる。一度、左耳及び右耳に対するＨＲＴＦが分かってしまうと、片耳の音源から正確な両耳の信号を合成することが可能である。頭部伝達関数は、十分知られていて、多数の文献、例えばBlauert, Spatial hearing: The Psychophysics of Human Sound Localization (MIT Press, Cambridge, MA, 1983)において説明されている。一組のＨＲＴＦにより音声がフィルタリングされる場合、この音声はこの一組のＨＲＴＦが属する人間に対し最適となり、これによりこの音声の経験は、前記一組のＨＲＴＦが属する人間以外の誰に対しても決して最適にならない。この一組のＨＲＴＦは、特定の人間に固有のパラメタ又は係数を備えるフィルタ関数である。特定の人間に対し、上述された任意の音源、音源と人間との距離、及び関数パラメタが測定される部屋の特徴にも依存して、異なる組のＨＲＴＦが得られる。例えば音源がヘッドホンである場合、ＨＲＴＦは音声の再生が起こるヘッドホンに依存する。この関数を用いて音声をフィルタリングする結果は、ヘッドホンにおいてサラウンドの音声の最適な空間再生が得られることである。この音源は、標準的なスピーカでもよく、この場合、例えばＨＲＴＦに基づくようなクロストークキャンセルを行う必要がある。

ステレオの音声信号は、一組のマイクロホンのようなステレオ信号源から例えばミキシング装置等のような他の電子装置を介して発生する左信号成分及び右信号成分を有する。これら信号はさらに、無線信号のように空気中を又は他の適当な手段を介して、他のステレオプレーヤからの出力として入力されてもよい。

図１は、従来技術における及び本発明による３つの入力音声信号から、２つの出力音声信号を生成する実施例を示している。一般的な使用において、前記２つの出力音声信号は、ヘッドホンにおける２つのスピーカに分配されるステレオ信号を有する。

最初に、従来技術によれば、ヘッドホンによってマルチチャンネルの音声を再生することがよく知られている。ヘッドホンによるこのマルチチャンネルの音声の再生は、バイノーラル(binaural)と呼ばれる既知の技術及び頭部伝達関数（ＨＲＦＴ）を使用する。“バイノーラル”という用語は、聴取者の耳（左耳及び右耳）への２つの入力があることを指している。鼓膜の位置において記録される左チャンネル信号及び右チャンネル信号の如何なる組もバイノーラル信号と呼ばれる。

本発明は、ヘッドホンを使用するとき鼓膜において、スピーカが再生するときと同じ音声となることである。これを達成するために、音源が鼓膜に伝搬することに関する多くの知識が集められなければならない。この伝搬は色合い(coloration)、並びに両耳間時間差(inter-aural time difference)及び両耳間スペクトル差(inter-aural spectral difference)のような如何なる線形フィルタリングを含んでいる頭部伝達関数（ＨＲＴＦ）に関して最もよく表している。この両耳間時間差は、音波が左耳及び右耳への２つの異なる距離を移動するために発生する。これらの伝達関数は入射角及び音源への距離に依存している。

図に戻ると、参照番号１、２及び３は、結合してヘッドホン用の（出力）音声信号を生じる左Ｈ_ＰＬ及び右Ｈ_ＰＲとなる対応する３つのチャンネル（すなわち３つの入力音声信号）ＣＨ_１、ＣＨ_２及びＣＨ_３を示している。前記チャンネルは、参照番号４から９の３つの関連する頭部伝達関数を用いて各々送信されている。言い換えると、ＣＨ_１は、頭部伝達関数ＨＲＴＦ_１を用いて送信され、同様に、ＣＨ_２は、頭部伝達関数ＨＲＴＦ_２を用いて送信される等である。これは、チャンネルと関連するＨＲＴＦとの積の和（参照番号１０及び１１）により、ステレオ信号が生成されることを達成するために、両方のチャンネルに対し行われる。前記ステレオ（出力）信号は左側のＨ_ＰＬ（参照番号１２）及び右側のＨ_ＰＲ（参照番号１３）により、２つの生じる音声信号として示される。

左側の生じる音声信号に対する和は、

である。

同様に、右側の生じる音声信号に対する和は、

である。

これにより、従来技術の場合、この送信は３つの送信を２回、すなわち６つの頭部伝達関数を必要とする。

一般的に、本出願を通じて、“・”という記号は上述した変数が周波数領域である場合は、積を示し、時間領域である場合、“・”は変数の重畳(convolution)を示す。

一般的且つ同様に、従来例を拡張する場合、結合してｍ個の音声出力となる、すなわちｍ個の生じる音声信号となるｎ＝３の音源の（入力）チャンネル（ＣＨ_１からＣＨ_３）は、ｍ個の頭部伝達関数をｎ回必要とする。

２番目には、本発明の好ましい実施例によれば、従来例と同じ送信が異なるやり方で実施される。この例を続けるために、同じ３つのチャンネル（ＣＨ_１、ＣＨ_２及びＣＨ_３）が扱われる。これらチャンネルは、線形結合でもよく、又は重みα及びβを持つ左（中間）チャンネル若しくは右（中間）チャンネルの重み付け版でもよい。前記α及びβは各チャンネル、すなわちＬ及びＲに依存するそれらの重み値であり、これにより一般的に、

となる。

当業者は、本発明に２チャンネル（Ｌ，Ｒ）以上を与える、例えば第３のチャンネル、第４のチャンネル等、すなわちＣ、Ｄ等を与える場合、その後、数式（３）を
ＣＨ_ｉ＝α_ｉ・Ｌ＋β_ｉ・Ｒ＋ｃ_ｉ・Ｃ＋ｄ_ｉ・Ｄ
と一般化する。これは、対応するスピーカ又は最終結果の音声に対し対応する高い数の生じる（出力）音声信号（Ｈ_PL，Ｈ_PR，Ｈ_PC，Ｈ_PD等）に対する。

サウンドエンジニアリング学会誌 presented at the 19th International Conference 2001 June 21-24 Schloss Elmau, Germany by Roy Irwan and Ronald M. Aarts, Philips Research Laboratoriesにおいて、ステレオをマルチチャンネルの音声に変換する方法が開示されている。この学会誌において、３頁目に前記α及びβは、左チャンネル及び右チャンネルそれぞれに対する時間ｋにおける対応するＷ_Ｌ(k)及びＷ_Ｒ(k)（重み）記号を用いて規定される。

簡潔さのために、（生じる（出力）音声信号からなる）２つのチャンネルが本実施例において単に用いられる。

図１の従来の実施例を続けるが、以下による本発明の好ましい実施例においても実施される。

数式（１）及び数式（２）は、（チャンネルと関連するＨＲＴＦとの積の）和に未だ適用されていることがわかり、これにより数式（４）、数式（５）及び数式（６）が数式（１）及び数式（２）に代入される場合、

が与えられ、また別の表示は、

となり、それに応じて

が与えられる。

しかしながら、本発明に関してこれまでに説明されたＨＲＴＦは、数式における中間変数として単に用いられ、前記従来技術に関する説明とは対照的に、実際の頭部伝達関数として実施されない及びされる必要がないことに注意されたい。

若しくは、ｉ＝３、すなわち一般化された形式では、

である。

これにより、数式（１１）における係数Σ（α_ｉ・ＨＲＴＦ_ｉ，Ｌ）、Σ（β_ｉ・ＨＲＴＦ_ｉ，Ｌ）は、各々１つのフィルタと見なされるので、左側信号及び右側信号をそれぞれフィルタリングするために必要とされる左ヘッドホンドライバＨ_ＰＬに対し２つのフィルタしか存在しない。

同様に、数式（１２）に関して、Σ（α_ｉ・ＨＲＴＦ_ｉ，Ｒ）、Σ（β_ｉ・ＨＲＴＦ_ｉ，Ｒ）は、右ヘッドホンドライバＨ_ＰＲのための２つのフィルタがある。

これにより、右ヘッドホンドライバ用に左信号及び右信号をフィルタリングするのに２つのフィルタしか必要とされない。

これにより、３つの入力音声チャンネルを備える本発明による実施を続ける場合、送信は単に２つの送信を２回だけ必要とする、すなわち４つの頭部伝達関数を必要とする。６つの頭部伝達関数が必要とされていた図１の従来例と比較してみると、本発明は同じ送信に対しより少ない頭部伝達関数を必要とする。

同様に、同じ送信に対し、より少ない重畳が必要とされる。

言い換えると、実施例が音声信号、例えばｍ＝２（すなわち、ステレオであり、２つのヘッドホンドライバ用の２つの出力チャンネル又は信号）からなる簡単なカスケード状態にさらに一般化される場合、つまり従来技術から始まり、それに従う場合、ｎ＝５の入力チャンネル又は音声信号（ＣＨ_１からＣＨ_５）は、合計５つのＨＲＴＦを２回、すなわち（従来技術において）１０ＨＲＴＦを必要とするが、本発明の第１の実施例によれば、同じ送信に対し、依然として４つの頭部伝達関数だけしか必要とされない。

図２は１つの入力音声信号から２つの出力音声信号の生成を示す。前記２つの音声信号は、一般的な使用において、ヘッドホンにおける２つのスピーカに分配されるステレオ信号を再び有するが、本実施例において、本発明の第２の実施例として、１つだけの音源である、入力音声信号Ｍが説明されている。

第１に、従来技術は、使用されるＨＲＴＦの計算を開示している。

（本図のように）１つだけの入力チャンネル、すなわち入力音源Ｍに対する従来技術が適用され、次いで２つの生じる（出力）音声信号Ｈ_ＰＬ、Ｈ_ＰＲに分配される。図１と比較して、且つ図１によれば、原則的に、チャンネルが１つ足りない（すなわちＣＨ_３）例が用いられ、同様に、従来技術における左側の生じる（出力）音声信号に対する和は、

である。さらに、同様に右側の生じる（出力）音声信号に対する和は、

となる。

ここで、最初の大文字表記は各スピーカのチャンネルＬ及びＲそれぞれであり、２番目の小文字表記は、左耳に対するｌ、右耳に対するｒである。

これにより、この従来技術において、この送信は２つの送信を２回、すなわち４つの頭部伝達関数を必要とする。

第２に、本発明による第２の実施例、すなわち図２が説明される。

スタジオ内にいる（移動している）シンガー“Ｍ”が２つの出力音声チャンネルＨ_ＰＬ、Ｈ_ＰＲを用いてＣＤに記録されると仮定してみる。

ＰＣＡ(Principle Component Analysis)を使用することにより、必要とされるアルファ、（以下の数式（１５）に見られるような）αｉが回復される。故に、スピーカ間の線上にシンガーがいるように２つのチャンネルが使用される。前記アルファが時変数である場合でもよい。

ＰＣＡの一般的な議論は、先に述べた論文”A method to convert stereo to multi-channel”に用いられる、S. Haykin著、Principal Component Analysis Neural Networks, Prentice-Hall, N.J., 1999, Second Editionに見られる。

この単一の（入力）音源Ｍは、２つのスピーカ間のどこかにある。例えばスタジオにおいて、両方（又はさらに多くのチャンネル）、αｉ_１・Ｍと表される左側中間チャンネル（ＣＨ１）とαｉ_２・Ｍと表される右側中間チャンネルとの間にパンポットされる(pan-potted)シンガーＭがいる。これにより、

と表される。

しかしながら、この特別の実施例に対する本発明に関する前記チャンネル（ＣＨＩ_１、ＣＨＩ_２）は、数式において中間チャンネル（変数）として単に用いられ、従来技術に関する説明（すなわちＣＨ_１、ＣＨ_２）とは異なり実際のチャンネルではないことに注意されたい。

言い換えると、本発明に関し、左側及び右側（中間チャンネル）は１つのチャンネルＭ上にマッピングされる。

従来技術から図２による本発明の他の実施例へ切り換える数式（１３）及び（１４）は、

又は

若しくは

と表され、ここで、

且つ

である。

これは、数式（２０）及び（２１）における係数（H_1、H_2）それぞれが、１つのＨＲＴＦフィルタとして各々見なされるので、本発明は２つだけの重畳又はＨＲＴＦを必要とすることが示されている。

これにより、送信はここで２つの頭部伝達関数を必要とするだけである。４つの頭部伝達関数が必要とされる従来技術と比べると、本発明は、１つの（入力）音源Ｍからの同じ送信に対し、より少ない頭部伝達関数（及び同様に重畳）を必要とする。

しかしながら、２つの出力チャンネルだけしか１つのチャンネルにマッピングしない第２の実施例は非常に簡単であり、この第２の実施例は、以下に説明される、
国際公開番号WO02/07481、発明者Irwan, Roy、AARTS, Ronaldus, M、出願人Koninklijke Philips Electronics N.V.、発明の名称「Multi-channel stereo converter for deriving a stereo surround and/or audio centre signal」、２００１年７月５日出願、出願番号EP0107757、公開日２００２年１月２４日であり、ここで２つのチャンネル（Ｌ，Ｒ）はＰＣＡを用いて、１つのＣ上、すなわち中央チャンネルにマッピングされる、及び
C. Faller及びF. Baumgarther著、Binaural cue coding applied to stereo and multi-channel audio compression、Convention paper 5574(L-6) of the 122th AES Convention Munich, Germany, Audio Eng. Soc., May 2002。
ような２つより多くのチャンネルを（対応するαを備える）１つのチャンネルへマッピングするように一般化される。

当業者は、これら２つの実施例による本発明を利用する場合、これらを組み合わせ、音声入力及び出力を備える一般用途の（ＨＲＴＦ）関数ブロックとみなす。言い換えると、前記実施例は、カスケード接続の音声信号に適用される。言い換えると、１つの関数ブロックからの出力音声信号であるＨ_ＰＬ及びＨ_ＰＲの代わりに、これら出力音声信号がカスケード接続することにより、他の関数ブロックに対する入力となる。

一般的に、この出願を通じて前記数式は、例えばＴＶ、ＣＤプレーヤ、ＤＶＤプレーヤ、ラジオ、ディスプレイ、増幅器又はＶＣＲのようなメディアシステムにおいて実施されてよい。これは、図２の参照番号２０を用いて示される。しかしながら、前記数式は代わりに又は付加的に、十分な処理能力を持つヘッドホンに埋め込まれることを目的にするのに適した回路（又はソフトウェア）に統合される場合でもよい。

チャンネル間の送信、（入力音声信号）ＣＨ及びＭを他の中間音声チャンネル及び生じる（出力）音声信号又はチャンネルへの送信は、矢印により図に描かれる。これら矢印は、例えば有線又は無線のデータリンクを介して音声データの通信を可能にする回路を用いて通信が行われることを示している。このような通信の実施例は、例えば、ネットワークインタフェース、ネットワークカードを含む送信器、無線送信器、IrDaポートを介して赤外線を送信するＬＥＤのような電磁気信号に適した送信器、Bluetooth（登録商標）トランシーバを介した無線ベースの通信機等のような様々な送信器でよい。適切な送信器の他の実施例は、ケーブルモデム、電話モデム、ＩＳＤＮアダプタ、ＤＳＬアダプタ、衛星トランシーバ、イーサーネット（登録商標）アダプタ等を含む。同様に、通信チャンネルは、例えばインターネット又は他のＴＣＰ／ＩＰネットワークのようなパケットベースの通信ネットワーク、赤外線リンクのような小範囲(short-range)通信リンク、Bluetooth（登録商標）接続又は他の無線ベースのリンクからなる適切な有線又は無線データリンクのいずれかでもよい。

通信チャンネルの他の実施例は、コンピュータネットワーク及び無線通信ネットワークを含み、これらは例えばＣＤＰＤ(Cellular Digital Packet Data)ネットワーク、ＧＳＭ(Global System for Mobile)ネットワーク、ＣＤＭＡ(Code Division Multiple Access)ネットワーク、ＴＤＭＡ(Time Division Multiple Access)ネットワーク、ＧＰＲＳ(General Packet Radio service)ネットワーク、ＵＭＴＳネットワークのような第３世代のネットワーク等である。

図３は頭部伝達関数の関連する第２の組を持つ入力音声信号の第２の組からの少なくとも１つの入力信号から、少なくとも１つの出力信号を生成する方法を示す。この生成は例えばＴＶ、ＣＤプレーヤ、ＤＶＤプレーヤ、ラジオ、ディスプレイ、増幅器、ヘッドホンのようなメディアシステム及びＶＣＲにおいて行われる。

この方法の（又は前記メディアシステムのような装置に埋め込まれた）一般的なアプリケーションにおいて、前記出力音声信号は、出力音声信号の第１の組、例えばヘッドホン又は他のスピーカに送信されるＨ_ＰＬ又はＨ_ＰＲのような１つ以上の出力に属する。逆に、前記音声信号の第２の組は、例えばＣＨ_１、ＣＨ_２、…ＣＨ_ｎ及びＭのような入力でよい。しかしながら、前記（入力）音声信号は、ＨＲＴＦの関数ブロックを備える音声信号のカスケードチェーンにおいて、これら信号がカスケード結合された音声信号のブロックを（入力として）入力するか、（出力として）出力するかに依存して、入力又は出力とする汎用の音声信号とみなされる。言い換えると、ある関数ブロックからの出力音声信号が他の関数ブロックへの入力（音声信号）となる、又はその逆でもよい。

（前記入力音声信号に関連する）頭部伝達関数の前記第２の組は、説明された実施例から、入力音声信号の前記第２の組を初めに変形又は伝達する専用の頭部伝達関数（例えばHRTF_L,1、HRTF_R,1、HRTF_L,l、HRTF_R,r、HRTF1,L、HRTF_2,L、HRTF3,L、…HRTF1,R、HRTF2,R、…等）を有する。

ステップ９０において、本発明の好ましい実施例による方法が開始される。ＨＴＲＦのトラックを維持する変数、フラグ、バッファ等、入力及び処理される音声信号に対応する中間音声チャンネル、出力音声チャンネル、重み等は、デフォルト値に設定される。この方法が２回目を始める場合、破損した変数、フラグ、バッファ等がデフォルト値に再設定されるだけである。

ステップ１００において、方法の説明に続き、（入力）音声信号の第２の組における各信号に対し、重み付け関係が決められる。前記重み付け関係は、例えば（説明される２つの実施例による）対応する重み値を備えるそれぞれＬ及びＲ、ＣＨＩ１及びＣＨＩ２のように中間音声信号の第３の組から少なくとも１つの信号を有する。

本発明の実施例において説明されたように、第１の実施例としてある実施例は、（すなわちｉ個の入力音声信号の各々である）ＣＨｉ＝αｉ・Ｌ＋βｉ・Ｒであり、ここでαｉ及びβｉは重み値であり、Ｌ及びＲそれぞれは前記中間音声信号の第３の組からの信号である。

第１の実施例において、（生成される）出力音声信号よりも多くの入力音声信号は、従来技術と比較してより少ないＨＲＴＦを用いて処理される。

本発明の実施例においてさらに説明されるように、第２の実施例としての他の実施例は、ＣＨ_１＝αｉ_１・Ｍ及びＣＨ_２＝βｉ_２・Ｍであり、ここでαｉ_１及びαｉ_２各々は重み値であり、ＣＨＩ_１及びＣＨＩ_２はこの第２の実施例に関し対応する中間音声信号である。

第１の実施例に対するような第２の実施例において、（本実施例では２つの）生成される出力音声信号よりも一般的に少ない（本実施例では１つの）入力音声信号は、従来技術と比較してより少ないＨＲＴＦを用いて処理される。

ステップ２００において、頭部伝達関数の第１の（新しく生成した）組が決められる。（頭部伝達関数の）前記第１の組は、音声信号、すなわち入力音声信号の第２の組、（従来技術において説明及び用いられた）頭部伝達関数の第２の組及び新しく決められた重み付け関係に基づいている。言い換えると、頭部伝達関数の前記第１の新しい組は、次のステップにおいてそれを用いて中間音声信号の後続する変形を目的に生成される。この決定は音声信号、すなわち例えばＣＨ１、ＣＨ２…ＣＨｎ及びＭのような（通例入力として）音声信号である入力のような前記音声信号の第２の組、及び最初に前記入力音声信号の第２の組を変形又は伝達する専用の前記頭部伝達関数の第２の組を考慮する。さらに、この決定は、対応する中間信号（Ｌ、Ｒ等）との前記重み付け関係（ＣＨｉ＝αｉ・Ｌ＋βｉ・Ｒ等）を考慮して、本発明の２つの実施例を説明するのに用いられる数式に対応させる。

ステップ３００において、前記中間音声信号（Ｌ、Ｒ、ＣＨＩ_１、ＣＨＩ_２）の第３の組からの少なくとも１つの信号は、前記出力音声信号（Ｈ_ＰＬ、Ｈ_ＰＲ）の第１の組に属する少なくとも１つの信号を（入力信号として）生成するために、（新しく生成された頭部伝達関数の）前記第１の組から、少なくとも１つのＨＲＴＦを用いて伝達される。この点において、新しく生成されたＨＲＴＦ、すなわち前記頭部伝達関数（Σ（αｉ・ＨＲＴＦ_ｉ，Ｒ）、Σ（βｉ・ＨＲＴＦ_ｉ，Ｒ）、Ｈ＿１、Ｈ＿２、等）の第１の組が用いられ、実際に、Ｌ、Ｒ（第１の実施例）又はＣＨＩ_１及びＣＨＩ_２（第２の実施例）のような１つ以上の中間音声信号を伝達及び変形（重畳）する。結果として、出力音声信号Ｈ_ＰＬ、Ｈ_ＰＲの少なくとも１つが次いで生成される。

これにより、本発明による利点は、本実施例において先に説明されたように、前記生成は、従来技術よりもより少ないＨＲＴＦ及び重畳により通例行われることである。

通常、前記方法はメディアシステムが通電されている限り繰り返し開始する。そうでなければ、この方法はステップ４００で終了する。しかしながら、このメディアシステムが再び通電される等の場合、この方法はステップ１００から処理される。

コンピュータ読み取り可能媒体は、磁気テープ、光学ディスク、ＤＶＤ、コンパクトディスク（ＣＤレコーダブル又はＣＤリライタブル）、ミニディスク、ハードディスク、フロッピーディスク、スマートカード、ＰＣＭＣＩＡカード等でもよい。

特許請求の範囲において、括弧内にある如何なる参照符号も本請求項を制限するものとして構成されるものではない。「有する」という用語は請求項に挙げられる要素又はステップ以外の要素又はステップが存在することを排除するものではない。単数で要素を表示することがこのような要素が複数あることを排除するものではない。

本発明は、幾つかの別個の要素を有するハードウェア及び適切にプログラムされたコンピュータを用いて実施されることができる。幾つかの手段を列挙する装置の請求項において、これら手段の幾つかがハードウェアの同一のアイテムにより具体化されることができる。ある手段が互いに異なる独立請求項に列挙される単なる事実が、これら手段の組み合わせ有利に使用することができないことを示すものではない。

従来技術及び本発明による３つの入力音声信号から２つの出力音声信号を生成する実施例を示す。１つの入力音声信号から２つの出力音声信号の生成を示す。頭部伝達関数の関連する第２の組を持つ入力音声信号の第２の組からの少なくとも１つの入力音声信号から少なくとも１つの出力音声信号を生成する方法を示す。

Claims

メディアシステムにおいて、入力音声信号の組に含まれる少なくとも１つの入力信号から、出力音声信号の組に含まれる少なくとも１つの出力信号を生成する方法であって、所定の頭部伝達関数の組が前記入力音声信号の組に関連付けられているような、方法において、
−前記入力音声信号の組における各入力信号に対し、中間音声信号の組に含まれる少なくとも１つの信号及び少なくとも１つの重み値を有する重み付け関係を決めるステップと、
−前記入力音声信号の組、前記頭部伝達関数の組、及び前記重み付け関係に基づいて、更なる頭部伝達関数の組を決めるステップと、
−前記更なる頭部伝達関数の組に含まれる少なくとも１つの頭部伝達関数を用いて、前記中間音声信号の組に含まれる少なくとも１つの信号を処理して、前記出力音声信号の組に含まれる少なくとも１つの出力信号を生成するステップと、
を有する方法。
前記入力音声信号の組における各信号に対し前記重み付け関係を決めるステップにおいて、ＣＨ_ｉ＝α_ｉ・Ｌ＋β_ｉ・Ｒを決め、ここでＣＨ_ｉは各々入力信号であり、α_ｉ及びβ_ｉは各々前記重み値であり、Ｌ及びＲは各々前記中間音声信号の組に含まれる信号であることを特徴とする請求項１に記載の方法。
前記入力音声信号の組における各信号に対し前記重み付け関係を決めるステップにおいて、ＣＨＩ_１＝αｉ_１・Ｍ及びＣＨＩ_２＝αｉ_２・Ｍを決め、ここでαｉ_１及びαｉ_２は各々前記重み値であり、ＣＨＩ_１及びＣＨＩ_２は各々前記中間音声信号の組に含まれる信号であることを特徴とする請求項１に記載の方法。
前記メディアシステムは、ＴＶ、ＣＤプレーヤ、ＤＶＤプレーヤ、ラジオ、ディスプレイ、増幅器、ヘッドホン又はＶＣＲであることを特徴とする請求項１、２又は３に記載の方法。
請求項１、２、３又は４に記載の方法を実行するためのコンピュータ。
コンピュータ上において実行される場合、請求項１、２、３又は４に記載の方法を実行するためのコンピュータ読み取り可能媒体に記憶されるプログラムコード手段を有するコンピュータプログラム。
入力音声信号の組に含まれる少なくとも１つの入力信号から、出力音声信号の組に含まれる少なくとも１つの出力信号を生成するメディアシステムであって、所定の頭部伝達関数の組が前記入力音声信号の組に関連付けられているようなメディアシステムにおいて、
−前記入力音声信号の組における各入力信号に対し、中間音声信号の組に含まれる少なくとも１つの信号及び少なくとも１つの重み値を有する重み付け関係を決める手段と、
−前記入力音声信号の組、前記頭部伝達関数の組、及び前記重み付け関係に基づいて更なる頭部伝達関数の組を決める手段と、
−前記更なる頭部伝達関数の組に含まれる少なくとも１つの頭部伝達関数を用いて、前記中間音声信号の組に含まれる少なくとも１つの信号を処理して、前記出力音声信号の組に含まれる少なくとも１つの出力信号を生成する手段と、
を有するメディアシステム。