JP4608400B2

JP4608400B2 - 音声通話システムおよび音声通話中におけるコンテンツの提供方法

Info

Publication number: JP4608400B2
Application number: JP2005265283A
Authority: JP
Inventors: 泰金田
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 2005-09-13
Filing date: 2005-09-13
Publication date: 2011-01-12
Anticipated expiration: 2025-09-13
Also published as: US20070071204A1; CN1933517A; JP2007081649A; US7899171B2

Description

本発明は、音声通話システムに関し、特に、音声通話中のユーザに広告等のコンテンツを提供する技術に関する。

テレビ放送、ラジオ放送等のメディアを利用して広告を行うことが従来より行われている。テレビ放送およびラジオ放送を利用した広告では、例えば番組と番組との間に、および番組を時分割してその間に挿入する形態で、広告のための時間を割り当て、該時間に広告の放送信号を流す（非特許文献１）。

日本民間放送連盟（編集）、放送ハンドブック−文化をになう民法の業務知識、東洋経済新報社、1997/08、pp.340-343

上記従来の広告は、メディアとして音声通話を利用することを考慮していない。テレビ放送、ラジオ放送等の利用を前提とした時分割の広告を音声通話に適用した場合、会話が途中で途切れることとなり不自然である。

本発明は上記事情に鑑みてなされたものであり、本発明の目的は、会話を途切れさせることなく音声通話中のユーザに広告等のコンテンツを提供することにある。

上記課題を解決するために、本発明では、時分割ではなく空間分割の形態で広告を挿入する。すなわち、まず、音声通信端末各々のユーザおよびコンテンツを提供する音源の仮想空間における位置を管理するプレゼンスサーバを設ける。そして、プレゼンスサーバを用いて、音声通信端末毎に、当該音声通信端末以外の他の音声通信端末各々の音声データに対して、前記他の音声通信端末各々のユーザと当該音声通信端末のユーザとの相対位置に応じた立体音響処理を施すと共に、前記音源の音響データに対して、前記音源と当該音声通信端末のユーザとの相対位置に応じた立体音響処理を施す。このようにして立体音響処理された前記他の音声通信端末各々の音声データおよび前記音源の音響データを合成して、当該音声通信端末向けの音声通話データを生成する。この際、前記音源の仮想空間における位置は、音声通信端末各々について、当該音声通信端末のユーザにとって他の音声通信端末のユーザの位置と区別できるように設定する。

例えば、本発明は、複数の音声通信端末と、前記複数の音声通信端末各々に音源を提供するコンテンツサーバと、前記複数の音声通信各々のユーザおよび前記コンテンツサーバが提供する音源の仮想空間上における位置を管理するプレゼンスサーバと、を有する音声通話システムであって、
前記プレゼンスサーバから前記複数の音声通信各々のユーザおよび前記コンテンツサーバが提供する音源の仮想空間上における位置の情報を取得するプレゼンス取得部と、
前記音声通信端末毎に設けられたオーディオレンダラと、を有し、
前記オーディオレンダラは、
当該オーディオレンダラが対応する音声通信端末以外の他の音声通信端末各々の音声データに対して、前記プレゼンス取得部が取得した位置の情報により特定される、前記他の音声通信端末各々のユーザと当該オーディオレンダラが対応する音声通信端末のユーザとの相対位置に応じた立体音響処理を施すと共に、前記コンテンツサーバが提供する音源の音響データに対して前記プレゼンス取得部が取得した位置の情報により特定される、前記音源と当該音声通信端末のユーザとの相対位置に応じた立体音響処理を施す処理と、
前記立体音響処理された当該オーディオレンダラが対応する音声通信端末以外の他の音声通信端末各々の音声データおよび音源の音響データを合成して、当該オーディオレンダラが対応する音声通信端末向けの音声通話データを生成する処理と、を行い、
前記プレゼンスサーバは、
前記複数の音声通信端末各々について、前記音源の仮想空間における位置が、当該音声通信端末のユーザにとって他の音声通信端末のユーザの位置と区別できるように、前記音源の仮想空間における位置を決定する位置情報管理部を有する。

ここで、位置情報管理部は、例えば、音声通信端末のユーザから前記音源までの仮想空間における距離が、少なくとも当該音声通信端末のユーザから最寄りの他の音声通信端末のユーザまでの距離より長くなるようにすることで、前記音源の仮想空間における位置が当該音声通信端末のユーザにとって他の音声通信端末のユーザの位置と区別できるように、前記音源の仮想空間における位置を決定してもよい。

あるいは、音声通信端末のユーザから見た前記音源の方向が、少なくとも当該音声通信端末のユーザから見た最寄りの他の音声通信端末のユーザの方向と所定角度以上離れるようにすることで、前記音源の仮想空間における位置が当該音声通信端末のユーザにとって他の音声通信端末のユーザの位置と区別できるように、前記音源の仮想空間における位置を決定してもよい。

本発明では、音声通信端末毎に、当該音声通信端末のユーザと、当該音声通信端末以外の他の音声通信端末各々のユーザおよびコンテンツを提供する音源との仮想空間における相対位置に基づいて立体音響処理された、他の音声通信端末各々の音声データおよび音源の音響データの合成データを、当該音声通信端末向けの音声通話データとする。通話相手および音源が、仮想空間内の分割された空間、すなわち音声通信端末のユーザにとって両者を区別できる位置および/または向きに置かれているため、音声通話データに合成されている通話相手の音声データおよび前記音源の音響データが同時に与えられていても、それらを選択に聴取するか、あるいは両方を区別しながら同時に聴取することができる。したがって、会話を途切れさせることなく音声通話中のユーザに広告等のコンテンツを提供する（視聴させる）ことができる。

以下に、本発明の実施の形態を説明する。

<<第１実施形態>>
図１は本発明の第１実施形態が適用された音声通話システムの概略構成図である。図示するように、本実施形態の音声通話システムは、プレゼンスサーバ１、メディアサーバ２、広告サーバ３、および、複数の音声通信端末４が、ＩＰ（Internet Protocol）網５を介して相互接続されて構成されている。

プレゼンスサーバ１は、広告サーバ３が提供する広告音源および各音声通信端末４のユーザの仮想空間上における位置情報を管理する。ここで、仮想空間とは各音声通信端末４のユーザが音声通話を行うために仮想的に作り出した空間である。仮想空間の属性には、例えば、空間の大きさ、天井の高さ、壁および天井の反射率・色彩・質感、残響特性、空間内の空気による音の吸収率などがある。

図２はプレゼンスサーバ１の概略構成図である。

図示するように、プレゼンスサーバ１は、ＩＰ網５に接続するためのＩＰ網インターフェース部１０１と、位置情報管理部１０２と、位置情報記憶部１０３と、を有する。

図３は位置情報記憶部１０３の登録内容を模式的に示した図である。図示するように、位置情報記憶部１０３には、広告サーバ３が提供する広告音源および音声通信端末４のユーザのそれぞれについて、レコード１０３０が記憶されている。レコード１０３０は、識別情報であるユーザ/音源ＩＤを登録するフィールド１０３１と、ＩＰ網５上のアドレス（例えばＳＩＰ-ＵＲＩ、ＩＰアドレス等）を登録するフィールド１０３２と、当該ユーザ/音源ＩＤによって識別される広告サーバ３が提供する広告音源あるいは音声通信端末４のユーザの仮想空間上における位置情報である仮想位置情報を登録するフィールド１０３３と、を有する。ここで、仮想位置情報は、仮想空間における広告音源あるいはユーザの現在位置の座標情報と当該広告音源あるいはユーザの向き（発話・発音方向）の方位情報とを含む。

位置情報管理部１０２は、音声通信端末４から受信した当該音声通信端末４のユーザの仮想位置情報に基づいて、位置情報記憶部１０３に登録されている当該音声通信端末４のユーザのレコード１０３０を更新する。また、位置情報管理部１０２は、位置情報記憶部１０３に登録されている各音声通信端末４のユーザのレコード１０３０に含まれている仮想位置情報に基づいて、広告サーバ３が提供する広告音源の仮想位置情報を決定する。そして、該決定した仮想位置情報に基づいて、広告サーバ３が提供する広告音源のレコード１０３０を位置情報記憶部１０３に登録する。さらに、位置情報管理部１０２は、メディアサーバ２あるいは音声通信端末４からの位置情報要求に応答して、位置情報記憶部１０３に登録されている各レコード１０３０を該位置情報要求の送信元に送信する。

図４はプレゼンスサーバ１の動作フローを説明する図である。

位置情報管理部１０２は、ＩＰ網インターフェース部１０１を介して音声通信端末４からユーザ/音源ＩＤおよび仮想位置情報を含む位置情報登録要求を受信すると（Ｓ１００１）、当該ユーザ/音源ＩＤがフィールド１０３１に登録されているレコード１０３０を位置情報記憶部１０３から検索し（Ｓ１００２）、検索したレコード１０３０のフィールド１０３３に登録されている仮想位置情報を当該位置情報登録要求に含まれている仮想位置情報に更新する（Ｓ１００３）。

また、位置情報管理部１０２は、ＩＰ網インターフェース部１０１を介して広告サーバ３からユーザ/音源ＩＤを含む音源追加要求を受信すると（Ｓ１１０１）、位置情報記憶部１０３に記憶されている各音声通信端末４のユーザの仮想位置情報に基づいて、該要求送信元の広告サーバ２が提供する広告音源の仮想位置情報を生成する（Ｓ１１０２）。

具体的には、位置情報記憶部１０３に記憶されている音声通信端末４のユーザのレコード１０３０各々について次の処理を行うことで、広告音源の仮想位置情報を生成する。ここで、注目するレコード１０３０のフィールド１０３３に登録されている仮想位置情報により特定される仮想空間上の位置を注目位置とする。

先ず、図５（Ａ）に示すように、フィールド１０３３に登録されている仮想位置情報より特定される仮想空間１０６上の位置が注目位置に最も近い他の音声通信端末４のユーザのレコード１０３０を検出する。図５（Ａ）に示す例では、注目位置（taro）１０４_１に対して位置（jiro）１０４_３が検出され、注目位置（hanako）１０４_２に対して位置（taro）１０４_１が検出され、そして、注目位置（jiro）１０４_３に対して位置（taro）１０４_１が検出される。次に、注目位置から見て、該検出したレコード１０３０のフィールド１０３２に登録されている仮想位置情報により特定される仮想空間１０６上の位置より離れているエリアを検出する。そして、このエリアを広告音源設置エリア候補に決定する。図５（Ａ）に示す例では、注目位置（taro）１０４_１に対しては、注目位置（taro）１０４_１を中心とする半径ｒ１の範囲外のエリアが広告音源設置エリア候補に選択され、注目位置（hanako）１０４_２に対しては、注目位置（hanako）１０４_２を中心とする半径ｒ２の範囲外のエリアが広告音源設置エリア候補に選択され、そして、注目位置（jiro）１０４_３に対しては、注目位置（jiro）１０４_３を中心とする半径ｒ３の範囲外のエリアが広告音源設置エリア候補に選択される。

それから、図５（Ｂ）に示すように、位置情報記憶部１０３に記憶されている音声通信端末４のユーザのレコード１０３０各々について決定した広告音源設置エリア候補の重複範囲１０７を求め、該範囲１０７内の任意の位置１０５を音源追加要求送信元の広告サーバ３が提供する広告音源（publicity A）の仮想空間上の位置（座標）に決定する。また、決定した位置から各音声通信端末４のユーザを眺めたときに、左端に位置するユーザ（hanako）および右端に位置するユーザ（jiro）間のなす角βが最も小さくなる向きを広告音源（publicity A）の仮想空間上の向きに決定する。

位置情報管理部１０２は、以上のようにして音源追加要求送信元の広告サーバ３が提供する広告音源の仮想位置情報を生成したならば、位置情報記憶部１０３に新たなレコード１０３０を追加する。そして、該レコード１０３０のフィールド１０３１に該要求に含まれているユーザ/音源ＩＤを登録し、フィールド１０３２に該要求送信元のアドレスを登録し、そして、フィールド１０３３に生成した仮想位置情報を登録する（Ｓ１１０３）。

また、位置情報管理部１０２は、ＩＰ網インターフェース部１０１を介して広告サーバ３からユーザ/音源ＩＤを含む音源削除要求を受信すると（Ｓ１２０１）、当該ユーザ/音源ＩＤがフィールド１０３１に登録されているレコード１０３０を位置情報記憶部１０３から検索して位置情報記憶部１０３から削除する（Ｓ１２０２）。

また、位置情報管理部１０２は、ＩＰ網インターフェース部１０１を介してメディアサーバ１あるいは音声通信端末４から位置情報要求を受信すると（Ｓ１３０１）、位置情報記憶部１０３から全てのレコード１０３０を読出し（Ｓ１３０２）、該要求の送信元に返信する（Ｓ１３０３）。

図１に戻って説明を続ける。メディアサーバ２は、音声通信端末４毎に、当該音声通信端末４以外の他の音声通信端末４各々から受信した音声データに対して、プレゼンスサーバ１が管理している他の音声通信端末４各々のユーザと当該音声通信端末４のユーザとの相対位置に応じた立体音響処理を施すと共に、広告サーバ３から受信した広告音源の音響データに対して、プレゼンスサーバ１が管理している広告音源と当該音声通信端末４のユーザとの相対位置に応じた立体音響処理を施す。そして、このようにして立体音響処理された他の音声通信端末４各々の音声データおよび広告音源の音響データを合成して、当該音声通信端末４向けの音声通話データを生成する。

図６はメディアサーバ２の概略構成図である。

図示するように、メディアサーバ２は、ＩＰ網５に接続するためのＩＰ網インターフェース部２０１と、ＲＴＰ（Real-time Transport Protocol）処理部２０２と、ＳＩＰ（Session Initiation Protocol）処理部２０３と、プレゼンス取得部２０４と、空間モデラ２０５と、ユーザ情報生成部２０６と、音声分配部２０７と、音声通信端末４毎に設けられたオーディオレンダラ２０８と、を有する。

ＳＩＰ制御部２０３は、ＩＰ網インターフェース部２０１を介して広告サーバ３および各音声通信端末４との間に通話路を確立する。

ＲＴＰ処理部２０２は、広告サーバ３および音声通信端末４のそれぞれについて、通話路を介して音響データまたは音声データを受信し、受信したデータを、当該データの送信元アドレスと共に、音声分配部２０７に出力する。また、ＲＴＰ処理部２０２は、音声通信端末４毎に、当該音声通信端末４に対応付けられたオーディオレンダラ２０８から出力された合成データを、通話路を介して当該音声通信端末４に送信する。

プレゼンス取得部２０４は、ＩＰ網インターフェース部２０１を介してプレゼンスサーバ１に位置情報要求を定期的に送信し、その応答としてプレゼンスサーバ１から広告サーバ３および各音声通信端末４のレコード（仮想位置情報）１０３０を受信する。そして、受信したレコード１０３０を空間モデラ２０５に通知する。

空間モデラ２０５は、プレゼンス取得部２０４から広告サーバ３および各音声通信端末４のレコード１０３０を受け取って保持すると共に、これらのレコード１０３０をユーザ情報生成部２０６に出力する。

ユーザ情報生成部２０６は、音声通信端末４毎に次の処理を行う。すなわち、空間モデラ２０５から受信した各レコード１０３０の中から当該音声通信端末４のアドレスを含むレコード１０３０を特定して、特定したレコード１０３０を自ユーザ情報として、音声分配部２０７に送信する。また、該特定したレコード１０３０以外のレコード１０３０各々を他ユーザ/音源情報として、該自ユーザ情報に対応付けて音声分配部２０７に送信する。

音声分配部２０７は、音声通信端末４毎に、ＲＴＰ処理部２０２から受け取った音響データおよび音声データの中から、当該音声通信端末４に送信する合成データに利用するデータを抽出する。具体的には、音声通信端末４毎に次の処理を行う。

すわわち、ユーザ情報生成部２０６から受信した自ユーザ情報のうち、対象の音声通信端末４のユーザ/音源ＩＤを含む自ユーザ情報を検出し、これを当該音声通信端末４の自ユーザ情報として、当該音声通信端末４に対応付けられたオーディオレンダラ２０８に出力する。また、ユーザ情報生成部２０６から受信した他ユーザ/音源情報のうち、該自ユーザ情報に対応付けられている他ユーザ/音源情報を検出する。また、ＲＴＰ処理部５０２から受け取った音響データおよび音声データのうち、当該音声通信端末４に送信する合成データに利用する音響データおよび音声データを、該自ユーザ情報に対応付けられている他ユーザ/音源情報に含まれているアドレスに基づいて検出する。そして、検出した音響データおよび音声データ各々を、該データの検出に用いたアドレスを含む他ユーザ/音源情報に対応付けて、当該音声通信端末４に対応付けられたオーディオレンダラ２０８に出力する。

オーディオレンダラ２０８は、音声分配部５０８から各音響データおよび音声データを他ユーザ/音源情報と共に受信する。また、音声分配部５０８から自ユーザ情報を受信する。そして、受信した各音響データおよび音声データをバッファリングすることによって、該データ間で同期させる（対応付ける）。また、オーディオレンダラ２０８は、同期させた音響データおよび音声データ各々を、該データに付与されている他ユーザ/音源情報の仮想位置情報と該自ユーザ情報の仮想位置情報とにより特定される、仮想空間における広告音源および他ユーザ各々と自ユーザとの相対位置に基づいて立体音響処理する。そして、２チャンネル（左チャンネルと右チャンネル）の信号データ（信号列）を含む合成データ（３Ｄオーディオデータ）をＲＴＰ処理部２０２に出力する。

オーディオレンダラ２０８をより詳細に説明する。

３Ｄオーディオ技術では、主に人の頭（以下、「人頭」）のまわりでの音響の変化の仕方（インパルス応答）を表すＨＲＩＲ（Head Related Impulse Response）と、部屋などの仮想環境によって生成される擬似的な残響とによって音の方向および距離を表現する。ＨＲＩＲは、音源と人頭との距離、および、人頭と音源との角度（水平角度および垂直角度）によって決定される。なお、オーディオレンダラ２０８には、予めダミーへッドを使用して各距離および各角度毎に測定したＨＲＩＲの数値が記憶されているものとする。また、ＨＲＩＲの数値には、左チャネル用（ダミーヘッドの左耳で測定したもの）と、右チャネル用（ダミーヘッドの右耳で測定したもの）とで異なる数値を使用することによって、左右、前後または上下の方向感を表現する。

図７はオーディオレンダ２０８の処理を説明する図である。オーディオレンダラ２０８は、音声分配部２０７から他ユーザ/音源情報と共に送られてくる音響データおよび音声データ各々に関して下記の計算を行う。

先ず、オーディオレンダラ２０８は、他ユーザ/音源情報毎に、当該他ユーザ/音源情報および当該他ユーザ/音源情報に対応付けられている音響データあるいは音声データの信号列ｓ_ｉ[ｔ](ｔ＝１，...）を、音声分配部２０７から受け付ける。また、自ユーザ情報を音声分配部２０７から受け付ける。そして、他ユーザ/音源情報毎に、当該他ユーザ/音源情報に含まれている仮想位置情報と、当該自ユーザ情報に含まれている仮想位置情報とを、当該他ユーザ/音源情報に対応付けられている音響データあるいは音声データの信号列ｓ_ｉ[ｔ](ｔ＝１，...）に対する３Ｄオーディオ処理（立体音響処理）に用いるパラメータに設定する（Ｓ２００１）。

次に、オーディオレンダラ２０８は、他ユーザ/音源情報毎に、音響データまたは音声データの直接音と、残響である反射音とを計算する。直接音については、パラメータ設定された位置情報を用いて、自ユーザと当該他ユーザ/音響情報を持つ広告音源あるいは他ユーザとの仮想空間における距離および角度（azimuth）を計算する（Ｓ２００２）。それから、オーディオレンダラ２０８は、自ユーザとの距離および角度に対応するＨＲＩＲを、予め記憶しておいたＨＲＩＲの数値の中から特定する（Ｓ２００３）。なお、オーディオレンダラ２０８は、予め記憶しておいたＨＲＩＲの数値を補間することによって算出したＨＲＩＲの数値を使用してもよい。

次に、オーディオレンダラ２０８は、Ｓ２００１で入力した信号列と、Ｓ２００３で特定したＨＲＩＲの左チャネル用ＨＲＩＲとを使用して、畳み込み（convolution）計算を行い、左チャネル信号を生成する（Ｓ２００４）。同様に、Ｓ２００１で入力した信号列と、Ｓ２００３で特定したＨＲＩＲの右チャネル用ＨＲＩＲとを使用して、畳み込み計算を行い、右チャネル信号を生成する（Ｓ２００５）。

また、反響音については、Ｓ２００１でパラメータ設定された位置情報を用いて、付加すべき残響を計算する（Ｓ２００６、Ｓ２００７）。すなわち、オーディオレンダラ２０８は、仮想空間の属性による音響の変化の仕方（インパルス応答）に基づいて残響を計算する。以下、残響の計算について説明する。

残響は初期反射（early reflection）および後期残響（late reverberation）により構成される。そして、初期反射の方が後期残響より、他ユーザとの距離や部屋（仮想空間）の大きさなどに関する感覚の形成（認知）において、重要であると一般的に考えられている。実空間上の室内では、音源から直接発せられた音（直接音）が聞こえた後、数ｍｓから１００ｍｓくらいの間に、条件によっては、壁、天井、床などからの数１０個の初期反射を聞くことができるといわれている。部屋の形状が直方体であれば、１回の初期反射は６個だけである。しかしながら、より複雑な形状または家具などがある部屋においては、反射音の数が増え、また、壁などで複数回反射した音も聞こえる。

初期反射の計算法としてimage source methodがあり、例えば文献「Allen, J.B. and Berkley, A., "Image Method for efficiently Simulating Small-Room Acoustics", J.Acoustical Society of America， Vol.65, No.4, pp.943-950, April 1979.」に記載されている。単純なimage source methodでは、部屋の壁、天井、床を鏡面とみなし、反射音を鏡面の反対側にある音源の像からの音として計算する。

図８は説明を簡単にするために、天井と床を省略した２次元のimage source methodを模式的に表した図である。すなわち、中央に本来の仮想空間２０８１があり、当該仮想空間２０８１には自ユーザおよび広告音源（あるいは他ユーザ）が存在する。そして、音室２０８１の周囲には部屋の壁２０８２を含む１２個の鏡像が描かれている。なお、鏡像は１２個である必然性はなく、これより多くすることも少なくすることもできる。

オーディオレンダラ２０８は、鏡像各々の中に存在する広告音源（あるいは他ユーザ）の各像からの音が、自ユーザ（聴取者）に直進するものとして、広告音源（あるいは他ユーザ）の各像から自ユーザまでの距離と方向を算出する（Ｓ２００６）。音の強さは距離に反比例するため、オーディオレンダラ２０８は、距離に従って各音量を減衰させる。ただし、壁の反射率をα（０≦α≦１）とすると、壁でｎ回反射される音の標本には、αⁿを乗じて音量をさらに減衰させる。

なお、反射率αの値は０．６程度の値を使用する。０．６程度の値にする理由は、自ユーザが広告音源（あるいは他ユーザ）との距離を認識するのに充分な残響（すなわち、直接音と反射音との比）を取得するためである。また、もう１つの理由としては、αの値を過大にした場合、自ユーザの方向感覚をにぶらせるからである。

次に、オーディオレンダラ２０８は、広告音源（あるいは他ユーザ）の像毎に、自ユーザとの距離および角度に対応するＨＲＩＲを、予め記憶しておいたＨＲＩＲの数値の中から特定する（Ｓ２００７）。反射音はそれぞれ異なる方向から人頭に達するため、Ｓ２００３で特定した直接音のＨＲＩＲとは異なるＨＲＩＲを適用する必要がある。

なお、多数の反射音各々に、異なるＨＲＩＲを用いて後述するたたみこみ計算（Ｓ２００７、Ｓ２００８）を行うと、膨大な計算が必要になる。計算量の増加を防止するため、反射音の計算には、実際の音源の方向にかかわらず正面に音源があるときのＨＲＩＲを適用してもよい。そして、音が左右の耳に達する際の時間差（ITD:interaural time difference）と強度差（IID:interaural intensity difference）だけを計算することで、少ない計算量でＨＲＩＲの計算を代替できる。

次に、オーディオレンダラ２０８は、Ｓ２００１で入力した信号列と、Ｓ２００７で特定したＨＲＩＲの左チャネル用ＨＲＩＲとを使用して、畳み込み計算を行い、左チャネル信号の残響を生成する（Ｓ２００８）。同様に、Ｓ２００１で入力した信号列と、Ｓ２００７で特定したＨＲＩＲの右チャネル用ＨＲＩＲとを使用して、畳み込み計算を行い、右チャネル信号の残響を生成する（Ｓ２００９）。

さて、オーディオレンダラ２０８は、以上のようにして全ての広告音源および他ユーザの左チャネル信号を計算したならば、これらを全て加算する（Ｓ２０１０）。なお、左チャネル信号は、Ｓ２００４で算出した直接音と、Ｓ２００８で算出した反射音とが含まれる。同様に、オーディオレンダラ２０８は、以上のようにして全ての広告音源および他ユーザの右チャネル信号を計算したならば、これらを全て加算する（Ｓ２０１１）。なお、右チャネル信号は、Ｓ２００５で算出した直接音と、Ｓ２００９で算出した反射音とが含まれる。

ＨＲＩＲ計算（Ｓ２００３、Ｓ２００７）は、ＲＴＰパケットの１パケット分のデータ毎に行う。しかし、畳み込み計算（Ｓ２００４、Ｓ２００５、Ｓ２００８、Ｓ２００９）では、次の１パケット分のデータに繰り越すべき部分が生じる。このため、特定したＨＲＩＲまたは入力された信号列を次の１パケット分のデータに対する処理まで保持する必要がある。

このように、オーディオレンダラ２０８は、音声分配部２０７から送られてきた広告音源および他ユーザ各々の音響データおよび音声データに対して、上述の計算による音量の調節、残響や反響音の重ね合わせ、および、フィルタリング等の処理を行い、自ユーザの仮想空間内の位置において聞こえるべき音に音響効果を施す。すなわち、オーディオレンダラ２０８は、仮想空間の属性と広告音源および他ユーザとの相対的な位置から帰結する処理によって音声を定位させた立体音響を生成する。

図１に戻って説明を続ける。広告サーバ３は、メディアサーバ１との間に確立した通話路を介して、各音声通信端末４に提供する広告音源の音響データをメディアサーバ１に送信する。

図９は広告サーバ３の概略構成図である。

図示するように、広告サーバ３は、ＩＰ網５に接続するためのＩＰ網インターフェース部３０１と、ＲＴＰ処理部３０２と、ＳＩＰ処理部３０３と、広告情報送信制御部３０４と、広告情報記憶部３０５と、を有する。

ＳＩＰ制御部３０３は、ＩＰ網インターフェース部３０１を介してメディアサーバ２との間に通話路を確立する。

ＲＴＰ処理部３０２は、後述する広告情報送信制御部３０４より受け取った広告音源の音響データを、メディアサーバ２との間に確立された通話路を介して、メディアサーバ２に送信する。

広告情報記憶部３０５には、広告音源の音響データが広告条件と共に登録されている。図１０は広告情報記憶部３０５を模式的に表した図である。図示するように、広告音源の音響データ毎にレコード３０５０が登録されている。レコード３０５０は、広告音源の音響データの識別情報であるユーザ／音源ＩＤを登録するフィールド３０５１と、広告音源の音響データを登録するフィールド３０５２と、広告音源の音響データの送信時間帯を登録するフィールド３０５３と、を有する。なお、本実施形態ではレコード３０５０を送信時間帯の順番に登録している。

広告情報送信制御部３０４は、広告情報記憶部３０５に記憶されている広告音源の音響データのメディアサーバ２への送信を制御する。図１１は広告情報送信制御部３０４の動作フローを説明するための図である。

先ず、広告情報送信制御部３０４は、カウンタ値ｎを１にセットする（Ｓ３００１）。

次に、広告情報送信制御部３０４は、広告情報記憶部３０５に記憶されているｎ番目のレコード３０５０に注目し、これを注目レコードとする（Ｓ３００２）。それから、内蔵タイマ等を利用して、現在時刻が注目レコードのフィールド３０５３に登録されている広告時間帯の開始時刻に到達したか否かを調べる（Ｓ３００３）。

そして、広告情報送信制御部３０４は、現在時刻が広告時間帯の開始時刻に到達したならば（Ｓ３００３でＹＥＳ）、注目レコードのフィールド３０５１に登録されているユーザ/音源ＩＤを含む音源追加要求を生成し、ＩＰ網インターフェース部３０１を介してプレゼンスサーバ１に送信する（Ｓ３００４）。

次に、広告情報送信制御部３０４は、ＳＩＰ制御部３０３に通話路の確立を指示する（Ｓ３００５）。これを受けて、ＳＩＰ制御３０３はメディアサーバ２との間でＳＩＰに従った呼制御手順を実行して、メディアサーバ２との間に通話路を確立する。次に、広告情報送信制御部３０４は、注目レコードのフィールド３０５２に登録されている音響データを広告情報記憶部３０５から読み出して、ＲＴＰ処理部３０２に出力する（Ｓ３００６）。これを受けて、ＲＴＰ処理部３０２は、メディアサーバ２との間に確立されている通話路を用いて、広告情報送信制御部３０４より受け取った音響データをメディアサーバ２へ送信する。以降、広告情報送信制御部３０４は、注目レコードのフィールド３０５２に登録されている音響データのＲＴＰ処理部３０２への出力を定期的に繰り返す。この結果、該音響データのメディアサーバ２への送信が繰り返し行われる。

次に、広告情報送信制御部３０４は、内蔵タイマ等を利用して、現在時刻が注目レコードのフィールド３０５３に登録されている広告時間帯の終了時刻に到達したか否かを調べる（Ｓ３００７）。現在時刻が広告時間帯の終了時刻に到達したならば（Ｓ３００７でＹＥＳ）、注目レコードのフィールド３０５２に登録されている音響データの通話路を用いたメディアサーバ２への送信処理を停止する（Ｓ３００８）。それから、広告情報送信部３０４は、ＳＩＰ制御部３０３に通話路の切断を指示する（Ｓ３００９）。これを受けて、ＳＩＰ制御３０３はＳＩＰに従いメディアサーバ２との間の通話路を切断する。

次に、広告情報送信制御部３０４は、自広告サーバ３のユーザ/音源ＩＤを含む音源削除要求を生成し、ＩＰ網インターフェース部３０１を介してプレゼンスサーバ１に送信する（Ｓ３０１０）。その後、カウンタ値ｎを１つインクリメントし（Ｓ３０１１）、それからＳ３００２に戻る。

図１に戻って説明を続ける。音声通信端末４は、プレゼンスサーバ１に自ユーザの仮想位置情報を送信すると共に、プレゼンスサーバ１から広告サーバ３の広告音源の仮想位置情報および各音声通信端末４のユーザの仮想位置情報を受信する。そして、受信した仮想位置情報に基づいて、各音声通信端末４のユーザおよび広告サーバ３の広告音源の仮想空間における位置および向きを表示したマップを生成し出力する。

また、音声通信端末４は、メディアサーバ１に自ユーザの音声データを送信すると共に、メディアサーバ１から合成データ（３Ｄオーディオデータ）を受信する。そして、受信した合成データを再生し出力する。

図１２は音声通信端末４の概略構成図である。

図示するように、音声通信端末４は、音声入力部４０１と、音声出力部４０２と、映像出力部４０３と、操作受付部４０４と、オーディオエンコーダ４０５と、オーディオデコーダ４０６と、ＩＰ網５に接続するためのＩＰ網インターフェース部４０７と、ＳＩＰ制御部４０８と、ＲＴＰ処理部４０９と、プレゼンスプロバイダ４１０と、仮想空間マップ生成部４１１と、を有する。

音声入力部４０１は、マイク４２１で収音した音声信号の入力端子である。音声出力部４０２は、３Ｄオーディオ対応（例えば擬似５．１チャンネル対応）のヘッドフォン（あるいはスピーカ）４２２に接続される音声出力端子である。映像出力部４０３は、後述する仮想空間マップ生成部４１１から出力される仮想空間マップの映像をディスプレイ４２３に表示する。そして、操作受付部４０４は、ユーザのポインティングデバイス４２４に対する操作を受け付ける。

オーディオエンコーダ４０５は、音声入力部４０１に入力された音声信号をエンコードして音声データをＲＴＰ処理部４０９に出力する。オーディオデコーダ４０６は、ＲＴＰ処理部４０９から出力された合成データをデコードして３Ｄオーディオ対応の音声信号を音声出力部４０２に出力する。

ＳＩＰ制御部４０８は、ＩＰ網インターフェース部４０７を介してメディアサーバ３との間に通話路を確立する。ＲＴＰ処理部４０９は、オーディオエンコーダ４０５より出力された音声データをＲＴＰパケットに格納し、該ＲＴＰパケットをＳＩＰ処理部４０８により確立された通話路を介してメディアサーバ２に送信する。また、該通話路を介してメディアサーバ２より受信したＲＴＰパケットから合成データ（３Ｄオーディオデータ）を取り出して、オーディオデコーダ４０６に出力する。

プレゼンスプロバイダ４１０は、予め設定されている仮想空間の属性に従い、操作受付部４０４で受け付けた自ユーザのポインティングデバイス４２４に対する操作に応じて当該仮想空間における自ユーザの位置（座標）および視線方向（方位）を決定し、決定した位置および視線方向を含む自ユーザの仮想位置情報を、仮想空間マップ生成部４１１に送信すると共に、ＩＰ網インターフェース部４０７を介してプレゼンスサーバ１に送信する。また、プレゼンスプロバイダ４１０は、ＩＰ網インターフェース部２１２を介してプレゼンスサーバ１に位置情報要求を定期的に送信し、その応答としてプレゼンスサーバ１から広告音源および他ユーザ各々のレコード１０３０を受信する。そして、受信したレコード１０３０を仮想空間マップ生成部４１１に通知する。

仮想空間マップ生成部４１１は、プレゼンスプロバイダ４１０より受け取った自ユーザ、広告音源および他ユーザ各々のレコード１０３０に登録されている仮想位置情報に従って、自ユーザ、広告音源および他ユーザ各々の仮想空間における位置と向きを示す仮想空間マップを生成する。そして、仮想空間マップの映像を映像出力部４０３に出力する。図１３は仮想空間マップの映像の一例を示す図である。図示するように、自ユーザ４１２１、他ユーザ４１２２および広告音源４１２３の仮想空間４１２０における位置と向きが把握できるように、仮想空間マップの映像がディスプレイ４２３に表示される。

上記構成のプレゼンスサーバ１、メディアサーバ２および広告サーバ３には、図１４に示すような、プログラムに従ってデータの加工・演算を行なうＣＰＵ６０１と、ＣＰＵ３０１が直接読み書き可能なメモリ６０２と、ハードディスク等の外部記憶装置６０３と、ＩＰ網５を介して外部システムとデータ通信をするための通信装置６０４と、を有する一般的なコンピュータシステムを利用することができる。具体的には、サーバ、ホストコンピュータなどである。

また、上記構成の音声通信端末４も、図１４に示すような、プログラムに従ってデータの加工・演算を行うＣＰＵ６０１と、ＣＰＵ６０１が直接読み書き可能なメモリ６０２と、ハードディスク等の外部記憶装置６０３と、ＩＰ網５を介して外部システムとデータ通信をするための通信装置６０４と、キーボード、マウス等の入力装置６０５と、ＬＣＤ等の出力装置６０６とを有する一般的なコンピュータシステムを利用することができる。例えば、ＰＤＡ（Personal Digital Assistant）、ＰＣ（Personal Computer）などのコンピュータシステムである。

上記各装置の各機能は、メモリ６０２にロードまたは記憶された所定のプログラムを、ＣＰＵ６０１が実行することにより実現される。

図１５は本発明の第１実施形態が適用された音声通話システムの概略動作を説明するための図である。ここで、音声通信端末４は、メディアサーバ２との間に通話路を既に確立しているものとする。また、図１５では１台の音声通話端末４を示しているが、実際には複数台の音声通信端末４がメディアサーバ２との間に通話路を確立しているものとする。そして、各音声通信端末４が図１５に示す動作を行うものとする。

音声通信端末４は、ユーザ操作によって仮想空間上におけるユーザの位置および向きが変わると、新たな仮想位置情報を生成して、該仮想位置情報を含む位置情報登録要求をプレゼンスサーバ１に送信する（Ｓ５４０１）。

プレゼンスサーバ１は、音声通信端末４から位置情報登録要求を受信すると、該要求の送信元端末のユーザ／音源ＩＤおよび該要求送信元のアドレスを含むレコード１０３０を位置情報記憶部１０３から検索し、検索したレコード１０３０を該要求に含まれている仮想位置情報を用いて更新する（Ｓ５１０１）。

広告サーバ３は、現在時刻が、広告情報記憶部３０５に記憶されているレコード３０５０であって、次に処理すべきレコード３０５０（注目レコード）に登録されている広告時間帯の開始時刻になったことを検出すると（Ｓ５３０１）、注目レコードに登録されているユーザ／音源ＩＤを含む音源追加要求をプレゼンスサーバ１に送信する（Ｓ５３０２）。その後、広告サーバ３は、メディアサーバ２にＩＮＶＩＴＥメッセージを送信して（Ｓ５３０３）、メディアサーバ２との間に通話路を確立する（Ｓ５３０４）。

プレゼンスサーバ１は、広告サーバ３から音源追加要求を受信すると、広告音源の仮想位置情報を生成し、該仮想位置情報および該要求に含まれているユーザ／音源ＩＤを含むレコード１０３０を位置情報記憶部１０３に登録する（Ｓ５１０２）。

メディアサーバ２は、定期的に、プレゼンスサーバ１に位置情報要求を送信する（Ｓ５２０１）。同様に、音声通信端末４は、定期的に、プレゼンスサーバ１に位置情報要求を送信する（Ｓ５４０２）。

プレゼンスサーバ１は、メディアサーバ２から位置情報要求を受信すると、位置情報記憶部１０３から全レコード１０３０を読み出してメディアサーバ２に送信する（Ｓ５１０３）。同様に、プレゼンスサーバ１は、音声通信端末４から位置情報要求を受信すると、位置情報記憶部１０３から全レコード１０３０を読み出して音声通信端末４に送信する（Ｓ５１０４）。

音声通信端末４は、メディアサーバ２との間に確立されている通話路を介して、自ユーザの音声データをメディアサーバ１に送信する（Ｓ５４０３）。同様に、広告サーバ３は、Ｓ５３０４でメディアサーバ１との間に確立した通話路を介して、注目レコードに登録されている音響データをメディアサーバ１に送信する（Ｓ５３０５）。

メディアサーバ２は、広告サーバ３および音声通信端末４各々から受信した音響データ、音声データを、プレゼンスサーバ１から受信した広告サーバ３の広告音源および音声通信端末４のユーザ各々の仮想位置情報に基づいて３Ｄオーディオ処理する。そして、３Ｄオーディオ処理された音響データ、音声データを合成して、合成データを生成する（Ｓ５２０２）。また、メディアサーバ２は、音声通信端末４との間に確立されている通話路を介して、合成データを音声通信端末４に送信する（Ｓ５２０３）。

広告サーバ３は、現在時刻が、注目レコードに登録されている広告時間帯の終了時刻になったことを検出すると（Ｓ５３０６）、注目レコードに登録されているユーザ／音源ＩＤを含む音源削除要求をプレゼンスサーバ１に送信する（Ｓ５３０７）。その後、広告サーバ３は、メディアサーバ２にＢＹＥメッセージを送信して（Ｓ５３０８）、メディアサーバ２との間に通話路を切断する。

プレゼンスサーバ１は、広告サーバ３から音源削除要求を受信すると、該要求に含まれているユーザ／音源ＩＤあるいは該要求の送信元アドレスを含むレコード１０３０を位置情報記憶部１０３から検索し、該レコード１０３０を位置情報記憶部１０３から削除する（Ｓ５１０５）。

以上、本発明の第１実施形態について説明した。

本実施形態では、音声通信端末４毎に、他の音声通信端末４各々の音声データおよび広告サーバ３の音響データを、他の音声通信端末４各々のユーザおよび広告サーバ３の広告音源と当該音声通信端末４のユーザとの仮想空間における相対位置に基づいて３Ｄオーディオ処理し合成する。そして、合成データを当該音声通信端末４向けの音声通話データとする。この際、広告音源の仮想空間における位置は、音声通信端末４各々について、当該音声通信端末４のユーザから広告音源までの仮想空間における距離が、少なくとも当該音声通信端末４のユーザから最寄りの他の音声通信端末４のユーザまでの距離より長くなるように設定される。したがって、音声通信端末４のユーザは、通話相手および広告音源の仮想空間における当該ユーザとの相対的な位置関係から、通話データに合成されている通話相手の音声データおよび広告音源の音響データを区別することができる。また、広告音源の音響データを通話相手のユーザの音声データよりも遠方から聞かせることができる。したがって、会話を途切れさせることなく音声通話中のユーザに広告を提供する（視聴させる）ことができる。

<<第２実施形態>>
本実施形態は、上記の第１実施形態において、音声通信端末４のユーザから広告サーバ３が提供する広告音源までの仮想空間における距離を、当該ユーザのプレファレンスに応じて変化させるようにしている。

本実施形態の音声通信システムが図１に示す第１実施形態の音声通信システムと異なる点は、プレゼンスサーバ１、広告サーバ３に代えてプレゼンスサーバ１Ａ、広告サーバ３Ａを設けたことである。その他の構成は第１実施形態と同様である。

広告サーバ３Ａが第１実施形態の広告サーバ３と異なる点は、広告情報送信制御部３０４、広告情報記憶部３０５に代えて、広告情報送信制御部３０４Ａ、広告情報記憶部３０５Ａを設けた点である。その他の構成は広告サーバ３と同様である。

広告情報記憶部３０５Ａには、広告音源の音響データが広告条件および広告のジャンルと共に登録されている。図１６は広告情報記憶部３０５Ａの登録内容を模式的に表した図である。図示するように、広告音源の音響データ毎にレコード３０５０Ａが登録されている。レコード３０５０Ａは、広告のジャンルを登録するフィールド３０５４が追加されている点において、第１実施形態で説明したレコード３０５０（図１０参照）と異なる。

広告情報送信制御部３０４Ａは、図１１のＳ３００４において、音源追加要求に、注目レコードのフィールド３０５４に登録されているジャンルを含めて、プレゼンスサーバ１に送信する。その他の動作は、第１実施形態の広告送信情報制御部３０４と同様である。

プレゼンスサーバ１Ａが第１実施形態のプレゼンスサーバ１と異なる点は、位置情報管理部１０２、位置情報記憶部１０３に代えて、位置情報管理部１０２Ａ、位置情報記憶部１０３Ａを設けた点である。その他の構成はプレゼンスサーバ１と同様である。

図１７は位置情報記憶部１０３Ａの登録内容を模式的に示した図である。図示するように、広告サーバ３Ａが提供する広告音源および音声通信端末４のユーザのそれぞれについて、レコード１０３０Ａが記憶されている。レコード１０３０Ａは、ユーザのプレファレンスを登録するフィールド１０３４が追加されている点において、第１実施形態で説明したレコード１０３０（図３参照）と異なる。

位置情報管理部１０２Ａは、図４のＳ１１０３において、位置情報記憶部１０３Ａに記憶されている各音声通信端末４のユーザの仮想位置情報およびプレファレンスと、音源追加要求に含まれているジャンルとに基づいて、該要求送信元の広告サーバ２が提供する広告音源の仮想位置情報を生成する。具体的には、位置情報記憶部１０３Ａに記憶されている音声通信端末４のユーザのレコード１０３０各々について広告音源設置エリア候補を決定し、該広告音源設置エリア候補の重複範囲１０７を求めるまでは、第１実施形態と同様である（図５参照）。その後、位置情報記憶部１０３Ａに記憶されている音声通信端末４のユーザのレコード１０３０各々について、フィールド１０３４に登録されているプレファレンスが音源追加要求に含まれているジャンルに属するか否かを調べる。そして、フィールド１０３４に登録されているプレファレンスが該要求に含まれているジャンルに属するレコード１０３０のフィールド１０３３に登録されている仮想位置情報により特定される仮想空間１０６上の位置までの距離が、フィールド１０３４に登録されているプレファレンスが該要求に含まれていないジャンルに属するレコード１０３０のフィールド１０３３に登録されている仮想位置情報により特定される仮想空間１０６上の位置までの距離よりも短くなるように、該要求の送信元の広告サーバ３が提供する広告音源（publicity A）の仮想空間上の位置１０５を決定する。例えば、図５（Ｂ）において、ユーザ（taro）のプレファレンスが広告音源（publicity A）のジャンルに属し、他のユーザ（jiro, hanako）のプレファレンスが広告音源（publicity A）のジャンルに属していない場合、広告音源（publicity A）の仮想空間上の位置１０５は、重複範囲１０７内のエリア１０７Ａ内に決定される。また、決定した位置から各音声通信端末４のユーザを眺めたときに、左端に位置するユーザ（hanako）および右端に位置するユーザ（jiro）間のなす角βが最も小さくなる向きを広告音源（publicity A）の仮想空間上の向きに決定する。

また、位置情報管理部１０２Ａは、図４のＳ１１０３において、位置情報記憶部１０３に新たなレコード１０３０Ａを追加する。そして、該レコード１０３０Ａのフィールド１０３１に該要求に含まれているユーザ/音源ＩＤを登録し、該要求送信元のアドレスを登録し、フィールド１０３３に生成した仮想位置情報を登録し、そして、フィールド１０３４に該要求に含まれているジャンルを登録する。

以上、本発明の第２実施形態について説明した。

本実施形態では、上記の第１実施形態の効果に加えてさらに以下に効果を有する。すなわち、仮想空間において、広告音源のジャンルに属するプレファレンスを持たないユーザよりも、広告音源のジャンルに属するプレファレンスを持つユーザの近くに、広告音源が配置される。したがって、広告音源のジャンルに属するプレファレンスを持たないユーザに対しては比較的小さい音で、且つ、広告音源のジャンルに属するプレファレンスを持つユーザに対しては比較的大きい音で広告を聞かせることができるので、広告の効果を高めることができる。

<<第３実施形態>>
本実施形態は、上記の第１実施形態において、広告サーバ３が提供する広告音源の音響データ出力の有無を音声通信端末４毎に設定できるようにしている。

本実施形態の音声通信システムが図１に示す第１実施形態の音声通信システムと異なる点は、プレゼンスサーバ１、メディアサーバ２に代えてプレゼンスサーバ１Ｂ、メディアサーバ２Ｂを設けたことである。その他の構成は第１実施形態と同様である。

プレゼンスサーバ１Ｂが第１実施形態のプレゼンスサーバ１と異なる点は、位置情報管理部１０２、位置情報記憶部１０３に代えて、位置情報管理部１０２Ｂ、位置情報記憶部１０３Ｂを設けた点である。その他の構成はプレゼンスサーバ１と同様である。

図１８は位置情報記憶部１０３Ｂの登録内容を模式的に示した図である。図示するように、広告サーバ３が提供する広告音源および音声通信端末４のユーザのそれぞれについて、レコード１０３０Ｂが記憶されている。レコード１０３０Ｂは、広告ポリシを登録するフィールド１０３５が追加されている点において、第１実施形態で説明したレコード１０３０（図３参照）と異なる。ここで、広告ポリシとは、広告音源の音響データを出力するか否かを示すポリシである。音声通信端末４のユーザ各々の、レコード１０３０Ｂのフィールド１０３５には、広告音源の音響データを出力する「広告有り」、あるいは広告音源の音響データを出力しない「広告無し」のいずれかが登録される。なお、広告サーバ３が提供する広告音源のレコード１０３０Ｂのフィールド１０３５は、空欄（ヌルデータ）となる。

位置情報管理部１０２Ｂは、図４のＳ１１０３において、位置情報記憶部１０３に新たなレコード１０３０Ｂを追加する。そして、該レコード１０３０Ｂのフィールド１０３１に該要求に含まれているユーザ/音源ＩＤを登録し、該要求送信元のアドレスを登録し、フィールド１０３３に生成した仮想位置情報を登録し、そして、フィールド１０３５にヌルデータを登録する。

メディアサーバ２Ｂが第１実施形態のメディアサーバ２と異なる点は、ユーザ情報生成部２０６に代えて、ユーザ情報生成部２０６Ｂを設けた点である。その他の構成はメディアサーバ２と同様である。

ユーザ情報生成部２０６Ｂは、音声通信端末４毎に次の処理を行う。すなわち、空間モデラ２０５から受信した各レコード１０３０Ｂの中から当該音声通信端末４のアドレスを含むレコード１０３０Ｂを特定して、特定したレコード１０３０Ｂを自ユーザ情報として、音声分配部２０７に送信する。また、自ユーザ情報のレコード１０３０Ｂのフィールド１０３５に登録されている広告ポリシを調べ、該広告ポリシが「広告有り」ならば、自ユーザ情報のレコード１０３０Ｂ以外のレコード１０３０Ｂ各々を他ユーザ/音源情報として、該自ユーザ情報に対応付けて音声分配部２０７に送信する。一方、該広告ポリシが「広告無し」ならば、フィールド１０３５がヌルデータであるレコード１０３０Ｂ、つまり、広告サーバ３が提供する広告音源のレコード１０３０Ｂを特定し、該レコード１０３０Ｂおよび自ユーザ情報のレコード１０３０Ｂ以外のレコード１０３０Ｂ各々を他ユーザ/音源情報として、該自ユーザ情報に対応付けて音声分配部２０７に送信する。

以上、本発明の第３実施形態について説明した。

本実施形態では、上記の第１実施形態の効果に加えてさらに以下に効果を有する。すなわち、広告サーバ３が提供する広告音源の音響データ出力の有無を音声通信端末４毎に設定できる。したがって、広告を所望しないユーザの音声通信端末４から広告の音響データが出力されてないようにすることができる。

<<第４実施形態>>
本実施形態は、上記の第１実施形態において、広告サーバ３が提供する広告音源の仮想空間における位置を自動で移動させるようにしている。

本実施形態の音声通信システムが図１に示す第１実施形態の音声通信システムと異なる点は、プレゼンスサーバ１、広告サーバ３に代えてプレゼンスサーバ１Ｃ、広告サーバ３Ｃを設けたことである。その他の構成は第１実施形態と同様である。

広告サーバ３Ｃが第１実施形態の広告サーバ３と異なる点は、広告情報送信制御部３０４、広告情報記憶部３０５に代えて、広告情報送信制御部３０４Ｃ、広告情報記憶部３０５Ｃを設けた点である。その他の構成は広告サーバ３と同様である。

広告情報記憶部３０５Ｃには、広告音源の音響データが広告条件および広告音源の移動規則と共に登録されている。図１９は広告情報記憶部３０５Ｃの登録内容を模式的に表した図である。図示するように、広告音源の音響データ毎にレコード３０５０Ｃが登録されている。レコード３０５０Ｃは、広告音源の移動規則を登録するフィールド３０５５が追加されている点において、第１実施形態で説明したレコード３０５０（図１０参照）と異なる。フィールド３０５５に登録する移動規則としては、レコード３０５０Ｃの登録時に決定された仮想位置情報がそのまま維持されることを示す「固定」、定期的に仮想位置情報の更新されることを示す「更新」、仮想空間上における複数の所定の位置を巡回する「巡回」がある。「巡回」の場合、複数の所定位置各々について、仮想空間上における座標情報、巡回の順番、および、滞在時間が、巡回スケジュールとしてフィールド３０５５に合わせて登録される。

広告情報送信制御部３０４Ｃは、図１１のＳ３００４において、音源追加要求に、注目レコードのフィールド３０５５に登録されている移動規則を含めて、プレゼンスサーバ１Ｃに送信する。その他の動作は第１実施形態の広告送信情報制御部３０４と同様である。

プレゼンスサーバ１Ｃが第１実施形態のプレゼンスサーバ１と異なる点は、位置情報管理部１０２、位置情報記憶部１０３に代えて、位置情報管理部１０２Ｃ、位置情報記憶部１０３Ｃを設けた点である。その他の構成はプレゼンスサーバ１と同様である。

図２０は位置情報記憶部１０３Ｃの登録内容を模式的に示した図である。図示するように、広告サーバ３Ｃが提供する広告音源および音声通信端末４のユーザのそれぞれについて、レコード１０３０Ｃが記憶されている。レコード１０３０Ｃは、広告音源の移動規則を登録するフィールド１０３５が追加されている点において、第１実施形態で説明したレコード１０３０（図３参照）と異なる。なお、各音声通信端末４のユーザの、レコード１０３０Ｂのフィールド１０３５は、空欄（ヌルデータ）となる。

位置情報管理部１０２Ｃは、第１実施形態の位置情報管理部１０２が行う処理に加えて、位置情報記憶部１０３に登録されている、広告サーバ３Ｃが提供する広告音源のレコードレコード１０３０Ｃのフィールド１０３５に登録されている移動規則に従い、必要に応じてフィールド１０３３に登録されている仮想位置情報を変更する処理を行う。

図２１はプレゼンスサーバ１Ｃの動作フローを説明する図である。

位置情報管理部１０２ＣがＩＰ網インターフェース部１０１を介して音声通信端末４から位置情報登録要求を受信した場合（Ｓ１００１でＹＥＳ）の処理（Ｓ１００２、Ｓ１００３）、位置情報管理部１０２ＣがＩＰ網インターフェース部１０１を介して広告サーバ３Ｃから音源削除要求を受信した場合（Ｓ１２０１でＹＥＳ）の処理（Ｓ１２０２）、および、位置情報管理部１０２ＣがＩＰ網インターフェース部１０１を介してメディアサーバ１あるいは音声通信端末４から位置情報要求を受信した場合（Ｓ１３０１でＹＥＳ）の処理（Ｓ１３０２、Ｓ１３０３）は、図４に示す第１実施形態のものと同様である。

また、位置情報管理部１０２ＣがＩＰ網インターフェース部１０１を介して広告サーバ３Ｃから音源追加要求を受信した場合（Ｓ１１０１でＹＥＳ）は、図４に示す第１実施形態の場合の処理（Ｓ１１０２、Ｓ１１０３）に加えて、位置情報管理部１０２Ｃは、図示していない内蔵タイマを起動する（Ｓ１１０４）。

さらに、本実施形態のプレゼンスサーバ１Ｃは次の処理を行う。すなわち、位置情報管理部１０２Ｃは、位置情報記憶部１０３Ｃに広告音源のレコード１０３０Ｃ（フィールド１０３５の移動規則がヌルデータでないレコード１０３０Ｃ）が登録されているか否かを調べ、登録されている場合は、そのレコード１０３０Ｃのフィールド１０３５に登録されている移動規則が「更新」であるか否かを調べる（Ｓ１４０１）。移動規則が「更新」である場合（Ｓ１４０１でＹＥＳ）は、上記の内蔵タイマが所定時間の経過を示しているか否かをさらに調べ（Ｓ１４０２）、示しているならば（Ｓ１４０２でＹＥＳ）、図４のＳ１１０２と同様の要領で広告音源の仮想位置情報を再度生成する（Ｓ１４０３）。そして、広告音源のレコード１０３０Ｃのフィールド１０３３に登録されている仮想位置情報を該再度生成した仮想位置情報に更新する（Ｓ１４０４）。それから、上記の内蔵タイマをリセットし（Ｓ１４０５）、Ｓ１００１に戻る。一方、Ｓ１４０２で上記の内蔵タイマが所定時間の経過を示していない場合は（Ｓ１４０２でＮＯ）、直ちにＳ１００１に戻る。

また、位置情報管理部１０２Ｃは、位置情報記憶部１０３Ｃに広告音源のレコード１０３０Ｃが登録されている場合であって、そのレコード１０３０Ｃのフィールド１０３５に登録されている移動規則が「更新」でない場合（Ｓ１４０１でＮＯ）、該フィールド１０３５に登録されている移動規則が「巡回」であるか否かを調べる（Ｓ１５０１）。移動規則が「巡回」である場合（Ｓ１５０１でＹＥＳ）は、上記の内蔵タイマが所定時間の経過を示しているか否かをさらに調べ（Ｓ１５０２）、示しているならば（Ｓ１５０２でＹＥＳ）、該広告音源のレコード１０３０Ｃのフィールド１０３５に記載されている移動規則に従い、フィールド１０３３に登録されている仮想位置情報に含まれている仮想位置に対して順番上次の仮想位置を特定する。また、図４のＳ１１０２と同様の要領で広告音源の仮想位置における向きを決定する。そして、特定した仮想位置および決定した向きを含む仮想位置情報を再度生成し（Ｓ１５０３）、該広告音源のレコード１０３０Ｃのフィールド１０３３に登録されている仮想位置情報を該再度生成した仮想位置情報に更新する（Ｓ１５０４）。それから、上記の内蔵タイマをリセットし（Ｓ１５０５）、Ｓ１００１に戻る。一方、Ｓ１５０２で上記の内蔵タイマが所定時間の経過を示していない場合は（Ｓ１５０２でＮＯ）、直ちにＳ１００１に戻る。

以上、本発明の第４実施形態について説明した。

本実施形態では、上記の第１実施形態の効果に加えてさらに以下に効果を有する。すなわち、仮想空間において、広告音源が自動で移動するので、仮想空間に存在するより多くにユーザに広告音源の音響データを聞かせることができるので、広告の効果を高めることができる。

<<第５実施形態>>
本実施形態は、上記の第１実施形態において、音声通信端末４Ｄのユーザが広告サーバ３Ｄが提供する広告音源の音響データをリクエストできるようにしている。

本実施形態の音声通信システムが図１に示す第１実施形態の音声通信システムと異なる点は、広告サーバ３、音声通信端末４に代えて広告サーバ３Ｄ、音声通信端末４Ｄを設けたことである。その他の構成は第１実施形態と同様である。

図２２は広告サーバ３Ｄの概略構成図である。

図示するように、本実施形態の広告サーバ３Ｄが第１実施形態の広告サーバ３と異なる点は、広告情報送信制御部３０４、広告情報記憶部３０５に代えて、広告情報送信制御部３０４Ｄ、広告情報記憶部３０５Ｄを設けた点、および、リクエスト受付部３０６、リクエスト記憶部３０７を設けた点である。その他の構成は広告サーバ３と同様である。

広告情報記憶部３０５Ｄには、広告音源の音響データが広告の案内情報と共に登録されている。図２３は広告情報記憶部３０５Ｄの登録内容を模式的に表した図である。図示するように、広告音源の音響データ毎にレコード３０５０Ｄが登録されている。レコード３０５０Ｄは、広告音源の音響データの送信時間帯を登録するフィールド３０５３に代えて、広告の案内情報を登録するフィールド３０５６が設けられている点において、第１実施形態で説明したレコード３０５０（図１０参照）と異なる。

リクエスト情報記憶部３０７には、音声通信端末４より受付けた広告音源の音響データに対するリクエストが登録される。図２４はリクエスト情報記憶部３０５の登録内容を模式的に表した図である。図示するように、音声通信端末４より受付けたリクエスト毎にレコード３０７０が登録される。レコード３０７０は、リクエストの受付日時を登録するフィールド３０７１と、リクエスト送信元の音声通信端末４のユーザ/音源ＩＤを登録するフィールド３０７２と、リクエストされた広告音源の音響データのユーザ/音源ＩＤを登録するためのフィールド３０７３と、を有する。

リクエスト受付部３０６は、ＩＰ網インターフェース部３０１を介して音声通信端末４より受付けたリスト要求に従い、広告情報記憶部３０５Ｄに登録されている各レコード３０５０Ｄのフィールド３０５１、フィールド３０５６に登録されているユーザ/音源ＩＤ、案内情報が記述された広告リストを生成し、これを該リスト要求送信元の音声通信端末４に送信する。また、リクエスト受付部３０６は、ＩＰ網インターフェース部３０１を介して音声通信端末４よりリクエストを受付けると、リクエスト記憶部３０７にレコード３０７０を新規に追加する。そして、追加したレコード３０７０のフィールド３０７１に現在日時を、フィールド３０７２に該リクエストに含まれているリクエスト送信元のユーザ/音源ＩＤを、そして、フィールド３０７３に該リクエストに含まれているリクエスト対象である広告音源の音響データのユーザ/音源ＩＤを登録する。

広告情報送信制御部３０４Ｄは、リクエスト記憶部３０５に記憶されているリクエストにより特定される、広告情報記憶部３０５Ｄに記憶されている広告音源の音響データのメディアサーバ２への送信を制御する。図２５は広告情報送信制御部３０４Ｄの動作フローを説明するための図である。

先ず、広告情報送信制御部３０４Ｄは、フィールド３０７１に登録されている受信日時が最も古いレコード３０７０をリクエスト記憶部３０７から検索し、これを注目レコードとする（Ｓ３１０１）。それから、広告情報送信制御部３０４Ｄは、注目レコードのフィールド３０７３に登録されているユーザ/音源ＩＤを含む音源追加要求を生成し、ＩＰ網インターフェース部３０１を介してプレゼンスサーバ１に送信する（Ｓ３１０２）。

次に、広告情報送信制御部３０４Ｄは、ＳＩＰ制御部３０３に通話路の確立を指示する（Ｓ３１０３）。これを受けて、ＳＩＰ制御３０３はメディアサーバ２との間でＳＩＰに従った呼制御手順を実行して、メディアサーバ２との間に通話路を確立する。

それから、広告情報送信制御部３０４Ｄは、注目レコードのフィールド３０７３に登録されているユーザ/音源ＩＤがフィールド３０５１に登録されているレコード３０５０Ｄを広告情報記憶部３０５Ｄから検索する。そして、検索したレコード３０５０Ｄのフィールド３０５２に登録されている音響データを、ＲＴＰ処理部３０２に出力する（Ｓ３１０４）。これを受けて、ＲＴＰ処理部３０２は、メディアサーバ２との間に確立されている通話路を用いて、広告情報送信制御部３０４Ｄより受け取った音響データをメディアサーバ２へ送信する。以降、広告情報送信制御部３０４Ｄは、該音響データのＲＴＰ処理部３０２への出力を定期的に繰り返す。この結果、該音響データのメディアサーバ２への送信が繰り返し行われる。

次に、広告情報送信制御部３０４Ｄは、内蔵タイマ等を利用して、Ｓ３１０４での処理（音響データの繰り返し再生）が開始されてから所定時間を経過したことを検出すると（Ｓ３１０５でＹＥＳ）、該音響データの通話路を用いたメディアサーバ２への送信処理を停止する（Ｓ３１０６）。それから、広告情報送信部３０４Ｄは、ＳＩＰ制御部３０３に通話路の切断を指示する（Ｓ３１０７）。これを受けて、ＳＩＰ制御３０３はＳＩＰに従いメディアサーバ２との間の通話路を切断する。

次に、広告情報送信制御部３０４Ｄは、自広告サーバ３のユーザ/音源ＩＤを含む音源削除要求を生成し、ＩＰ網インターフェース部３０１を介してプレゼンスサーバ１に送信する（Ｓ３１０８）。その後、リクエスト記憶部３０７から注目レコードを削除し（Ｓ３１０９）、それからＳ３１０１に戻る。

図２６は音声通信端末４Ｄの概略構成図である。

図示するように、本実施形態の音声通信端末４Ｄが第１実施形態の音声通信端末４と異なる点は、リクエスト受付部４１２を新たに設けた点である。その他の構成は音声通信端末４と同様である。

リクエスト受付部４１２は、操作受付部４０４を介してユーザより受付けたリスト閲覧指示に従い、自音声通信端末４Ｄのユーザ/音源ＩＤを含むリスト要求を生成し、ＩＰ網インターフェース部４０７を介して広告サーバ３Ｄに送信する。また、リクエスト受付部４１２は、ＩＰ網インターフェース部４０７を介して広告サーバ３Ｄより受信した広告リストに従い、図２７に示すような、広告音源の音響データのユーザ/音源ＩＤ４１２１および案内情報４１２２の組がリスト表示された、ユーザから広告音源の音響データのリクエストを受付けるためのリクエスト受付画面４１２０の映像データを生成し、映像出力部４０３から出力する。また、リクエスト受付部４１２は、ユーザがポインティングデバイス４２４を操作してリクエスト受付画面４１２０中から選択したユーザ/音源ＩＤ４１２１および案内情報４１２２の組を、操作受付部４１２を介して受付け、該組を含むリクエストを生成して、ＩＰ網インターフェース部４０７を介して広告サーバ３Ｄに送信する。

以上、本発明の第５実施形態について説明した。

本実施形態では、上記の第１実施形態の効果に加えてさらに以下に効果を有する。すなわち、任意のユーザが希望した広告音源の音響データを当該ユーザに聞かせることができるので、広告の効果を高めることができる。

なお、本発明は上記の各実施形態に限定されるものではなく、その要旨の範囲内で数々の変形が可能である。

例えば、上記の実施形態では、広告音源の音響データおよび各ユーザの音声データの３Ｄオーディオ処理および合成処理をメディアサーバ２、２Ｂで行う場合を例にとり説明した。しかし、本発明はこれに限定されない。広告音源の音響データおよび各ユーザの音声データの３Ｄオーディオ処理および合成処理を各音声通信端末４、４Ｄで行うようにしてもよい。すなわち、各音声通信端末４、４Ｄは、自端末以外の音声通信端末４、４Ｄおよび広告サーバ３、３Ａ、３Ｃ、３Ｄ各々との間に通話路を確立する。そして、自端末のユーザの音声データを自端末以外の音声通信端末４、４Ｄ各々に送信すると共に、自端末以外の音声通信端末４、４Ｄおよび広告サーバ３、３Ａ、３Ｃ、３Ｄ各々から受信した音声データ、音響データを、プレゼンスサーバ１、１Ａ、１Ｂ、１Ｃから入手した自端末以外の音声通信端末４、４Ｄおよび広告サーバ３、３Ａ、３Ｃ、３Ｄ各々の仮想位置情報と自端末の仮想位置情報とに基づいて３Ｄオーディオ処理し、これ等を合成する。このようにすれば、メディアサーバ２、２Ｂが不要となる。

また、上記の各実施形態において、プレゼンスサーバ１は、広告音源の仮想空間における仮想位置を、音声通信端末４のユーザから広告音源までの距離が少なくとも当該音声通信端末４のユーザから最寄りの他の音声通信端末４のユーザまでの距離より長くなる位置に決定している。しかし、本発明はこれに限定されない。広告音源の仮想空間における仮想位置が、音声通信端末４のユーザにとって他の音声通信端末４のユーザの仮想位置と区別できるように決定するものであればよい。例えば、音声通信端末４のユーザから見た広告音源の向き（音の出力方向）が、少なくとも当該音声通信端末４のユーザから見た最寄りの他の音声通信端末４のユーザの向きと所定角度以上離れるように、広告音源の仮想空間における仮想位置を決定してもよい。

具体的には、プレゼンスサーバ１の位置情報管理部１０２は次の処理を行う。図２８（Ａ）に示すように、任意の音声通信端末４について、当該音声通信端末４のユーザの仮想位置から他の音声通信端末４のユーザを見る方向ｄを中心とする一定角度範囲γに属さないエリアを他の音声通信端末４毎に求める。図２８（Ｂ）に示すように、この処理を全ての音声通信端末４に対して実行し、その結果得られたエリアが全て重なり合う領域１０７Ａを求める。領域１０７Ａが複数存在する場合は、その中から任意の領域を１つ選択する。領域１０７Ａが存在しない場合は、上記の角度範囲γを小さくするか、あるいは、各音声通信端末４について、当該音声通信端末４のユーザの仮想位置から最も離れている他の音声通信端末４のユーザを除外して再計算する。なお、広告音源の仮想空間における向きの決定は、上記の各実施形態と同様である（図５（Ｂ）参照）。

ところで、人間の聴覚には両耳をむすぶ直線に関して対称な位置にある音源が区別し難いという弱点がある。すなわち、この直線に関して前後、上下等で対称な位置にある音源を区別するのが困難である。次のようにすれば、これ等の位置を避けて配置することができる。図２９（Ａ）に示すように、任意の音声通信端末４について、当該音声通信端末４のユーザの仮想位置から他の音声通信端末４のユーザを見る方向ｄを中心とする一定角度範囲γ、および、当該音声通信端末４のユーザの向きｅと直交する線ｆ（両耳を結ぶ直線）に対して当該一定角度範囲γと対象な範囲γ’に属さないエリアを、他の音声通信端末毎に求める。図２９（Ｂ）に示すように、この処理を全ての音声通信端末４に対して実行し、その結果得られたエリアが全て重なり合う領域１０７Ｂを求める。

また、上記の各実施形態では、通話路の確立にＳＩＰを利用する場合を例にとり説明した。しかし、本発明はこれに限定されない。例えばＨ.３２３等のＳＩＰ以外の呼制御プロトコルを利用してもよい。

また、上記の各実施形態では、音声通信端末４のユーザに提供するコンテンツとして広告音源の音響データを例にとり説明した。しかし、本発明はこれに限定されない。例えば楽曲等の音響データをコンテンツとしてユーザに提供する場合にも本発明は利用できる。

また、上記の各実施形態では、音声による広告を例にとり説明したが、本発明はこれに限定されない。仮想空間に位置するユーザおよび広告音源の音声を出力する代わりに、あるいは該出力に加えて、３Ｄグラフィクスにより仮想空間に位置するユーザおよび広告音源を表示する端末を使用する場合には、画像による広告、あるいは画像と音声とを併せて使用する広告についても、本発明によって広告の配置を決定し、それを３Ｄグラフィクスによって表示することができる。ただし、この場合はユーザの後方に広告を置いても効果が少ないので、配置を決定する際にできるだけ多くのユーザから見える位置に広告を配置するように配置の決定を行う必要がある。また、ユーザのプレファレンスを考慮する場合には、優先度の高いユーザから見える位置に配置する必要がある。

図１は本発明の第１実施形態が適用された音声通信システムの概略構成図である。図２はプレゼンスサーバ１の概略構成図である。図３は位置情報記憶部１０３の登録内容を模式的に示した図である。図４はプレゼンスサーバ１の動作フローを説明する図である。図５は仮想空間における広告音源の位置および向きを説明する図である。図６はメディアサーバ２の概略構成図である。図７はオーディオレンダ２０８の処理を説明する図である。図８は天井と床を省略した２次元のimage source methodを模式的に表した図である。図９は広告サーバ３の概略構成図である。図１０は広告情報記憶部３０５の登録内容を模式的に示した図である。図１１は広告情報位置制御部３０４の動作フローを説明する図である。図１２は音声通信端末４の概略構成図である。図１３は仮想空間マップの映像の一例を示す図である。図１４は音声通話システムを構成する各装置のハードウエア構成例を示す図である。図１５は図１に示す音声通話システムの概略動作を説明する図である。図１０は広告情報記憶部３０５Ａの登録内容を模式的に示した図である。図１７は位置情報記憶部１０３Ａの登録内容を模式的に示した図である。図１８は位置情報記憶部１０３Ｂの登録内容を模式的に示した図である。図１９は広告情報記憶部３０５Ｃの登録内容を模式的に示した図である。図２０は位置情報記憶部１０３Ｃの登録内容を模式的に示した図である。図２１はプレゼンスサーバ１Ｃの動作フローを説明する図である。図２２は広告サーバ３Ｄの概略構成図である。図２３は広告情報記憶部３０５Ｄの登録内容を模式的に示した図である。図２４はリクエスト報記憶部３０７の登録内容を模式的に示した図である。図２５は広告情報位置制御部３０４Ｄの動作フローを説明する図である。図２６は音声通信端末４Ｄの概略構成図である。図２７はリクエスト受付画面の一例を示す図である。図２８は仮想空間における広告音源の位置を説明する図である。図２９は仮想空間における広告音源の位置を説明する図である。

符号の説明

１…プレゼンスサーバ、２…メディアサーバ、３…広告サーバ、４…音声通信端末、５…ＩＰ網、１０１…ＩＰ網インターフェース部、１０２…位置情報管理部、１０３…位置情報記憶部、２０１…ＩＰ網インターフェース部、２０２…ＲＴＰ処理部、２０３…ＳＩＰ制御部、２０４…プレゼンスプロバイダ、２０５…空間モデラ、２０６…ユーザ情報生成部、２０７…音声分配部、２０８…オーディオレンダラ、３０１…ＩＰ網インターフェース部、３０２…ＲＴＰ処理部、３０３…ＳＩＰ制御部、３０４…広告情報送信制御部、３０５…広告情報記憶部、４０１…音声入力部、４０２…音声出力部、４０３…映像出力部、４０４…操作受付部、４０５…オーディオエンコーダ、４０６…オーディオデコーダ、４０７…ＩＰ網インターフェース部、４０８…ＳＩＰ制御部、４０９…ＲＴＰ処理部、４１０…プレゼンスプロバイダ

Claims

複数の音声通信端末と、前記複数の音声通信端末各々に音源を提供するコンテンツサーバと、前記複数の音声通信各々のユーザおよび前記コンテンツサーバが提供する音源の仮想空間上における位置を管理するプレゼンスサーバと、を有する音声通話システムであって、
前記プレゼンスサーバから前記複数の音声通信各々のユーザおよび前記コンテンツサーバが提供する音源の仮想空間上における位置の情報を取得するプレゼンス取得部と、
前記音声通信端末毎に設けられたオーディオレンダラと
を有し、
前記オーディオレンダラは、
当該オーディオレンダラが対応する音声通信端末以外の他の音声通信端末各々の音声データに対して、前記プレゼンス取得部が取得した位置の情報により特定される、前記他の音声通信端末各々のユーザと当該オーディオレンダラが対応する音声通信端末のユーザとの相対位置に応じた立体音響処理を施すと共に、前記コンテンツサーバが提供する音源の音響データに対して前記プレゼンス取得部が取得した位置の情報により特定される、前記音源と当該音声通信端末のユーザとの相対位置に応じた立体音響処理を施す処理と、
前記立体音響処理された他の音声通信端末各々の音声データおよび音源の音響データを合成して、当該オーディオレンダラが対応する音声通信端末向けの音声通話データを生成する処理と
を行い、
前記プレゼンスサーバは、
前記複数の音声通信端末各々について、当該音声通信端末を中心として、当該音声通信端末に最も近い他の音声通信端末までの距離を半径とする領域を特定し、それぞれの音声通信端末について特定したいずれの領域にも含まれない位置を、前記音源の仮想空間における位置として決定する位置情報管理部を有することを特徴とする音声通話システム。
複数の音声通信端末と、前記複数の音声通信端末各々に音源を提供するコンテンツサーバと、前記複数の音声通信各々のユーザおよび前記コンテンツサーバが提供する音源の仮想空間上における位置を管理するプレゼンスサーバと、を有する音声通話システムであって、
前記プレゼンスサーバから前記複数の音声通信各々のユーザおよび前記コンテンツサーバが提供する音源の仮想空間上における位置の情報を取得するプレゼンス取得部と、
前記音声通信端末毎に設けられたオーディオレンダラと
を有し、
前記オーディオレンダラは、
当該オーディオレンダラが対応する音声通信端末以外の他の音声通信端末各々の音声データに対して、前記プレゼンス取得部が取得した位置の情報により特定される、前記他の音声通信端末各々のユーザと当該オーディオレンダラが対応する音声通信端末のユーザとの相対位置に応じた立体音響処理を施すと共に、前記コンテンツサーバが提供する音源の音響データに対して前記プレゼンス取得部が取得した位置の情報により特定される、前記音源と当該音声通信端末のユーザとの相対位置に応じた立体音響処理を施す処理と、
前記立体音響処理された他の音声通信端末各々の音声データおよび音源の音響データを合成して、当該オーディオレンダラが対応する音声通信端末向けの音声通話データを生成する処理と
を行い、
前記プレゼンスサーバは、
前記複数の音声通信端末各々について、当該音声通信端末から、当該音声通信端末に最も近い他の音声通信端末への方向を中心とした所定角度の範囲内の領域を特定し、それぞれの音声通信端末について特定したいずれの領域にも含まれない位置を、前記音源の仮想空間における位置として決定する位置情報管理部を有することを特徴とする音声通話システム。
複数の音声通信端末と、前記複数の音声通信端末各々に音源を提供するコンテンツサーバと、前記複数の音声通信各々のユーザおよび前記コンテンツサーバが提供する音源の仮想空間上における位置を管理するプレゼンスサーバと、を有する音声通話システムであって、
前記プレゼンスサーバから前記複数の音声通信各々のユーザおよび前記コンテンツサーバが提供する音源の仮想空間上における位置の情報を取得するプレゼンス取得部と、
前記音声通信端末毎に設けられたオーディオレンダラと
を有し、
前記オーディオレンダラは、
当該オーディオレンダラが対応する音声通信端末以外の他の音声通信端末各々の音声データに対して、前記プレゼンス取得部が取得した位置の情報により特定される、前記他の音声通信端末各々のユーザと当該オーディオレンダラが対応する音声通信端末のユーザとの相対位置に応じた立体音響処理を施すと共に、前記コンテンツサーバが提供する音源の音響データに対して前記プレゼンス取得部が取得した位置の情報により特定される、前記音源と当該音声通信端末のユーザとの相対位置に応じた立体音響処理を施す処理と、
前記立体音響処理された他の音声通信端末各々の音声データおよび音源の音響データを合成して、当該オーディオレンダラが対応する音声通信端末向けの音声通話データを生成する処理と
を行い、
前記プレゼンスサーバは、
前記複数の音声通信端末各々について、当該音声通信端末から、当該音声通信端末に最も近い他の音声通信端末への方向を中心とした所定角度の範囲内の領域を求め、当該音声通信端末の仮想空間における向きに直交すると共に、当該音声通信端末の仮想空間における位置を通る直線に対して、前記求めた領域と対称な領域を特定し、それぞれの音声通信端末について求めた領域および特定した領域のいずれにも含まれない位置を、前記音源の仮想空間における位置として決定する位置情報管理部を有することを特徴とする音声通話システム。
請求項１乃至３のいずれか一項に記載の音声通話システムであって、
前記位置情報管理部は、
前記複数の音声通信端末各々に予め設定されたプレファレンスに基づいて、当該プレファレンスが前記音源のジャンルに属する音声通信端末から前記音源までの距離が、当該プレファレンスが前記音源のジャンルに属さない音声通信端末から前記音源までの距離よりも短くなるように、前記音源の仮想空間における位置を決定することを特徴とする音声通話システム。
請求項１乃至３のいずれか一項に記載の音声通話システムであって、
前記オーディオレンダラは、
当該オーディオレンダラが対応する音声通信端末のポリシが「音源あり」の場合に、当該オーディオレンダラが対応する音声通信端末以外の他の音声通信端末各々の音声データに対して、前記プレゼンス取得部が取得した位置の情報により特定される、前記他の音声通信端末各々のユーザと当該オーディオレンダラが対応する音声通信端末のユーザとの相対位置に応じた立体音響処理を施すと共に、前記コンテンツサーバが提供する音源の音響データに対して前記プレゼンス取得部が取得した位置の情報により特定される、前記音源と当該音声通信端末のユーザとの相対位置に応じた立体音響処理を施す処理と、
前記立体音響処理された他の音声通信端末各々の音声データおよび音源の音響データを合成して、当該オーディオレンダラが対応する音声通信端末向けの音声通話データを生成する処理と
を行い、
当該オーディオレンダラが対応する音声通信端末のポリシが「音源なし」の場合に、当該オーディオレンダラが対応する音声通信端末以外の他の音声通信端末各々の音声データに対して、前記プレゼンス取得部が取得した位置の情報により特定される、前記他の音声通信端末各々のユーザと当該オーディオレンダラが対応する音声通信端末のユーザとの相対位置に応じた立体音響処理を施す処理と、
前記立体音響処理された他の音声通信端末各々の音声データを合成して、当該オーディオレンダラが対応する音声通信端末向けの音声通話データを生成する処理と
を行うことを特徴とする音声通話システム。
請求項１乃至３のいずれか一項に記載の音声通話システムであって、
前記位置情報管理部は、
前記決定を定期的に実行して、前記音源の仮想空間における位置を更新することを特徴とする音声通話システム。
請求項１乃至３のいずれか一項に記載の音声通話システムであって、
前記コンテンツサーバは、
前記音声通信端末からリクエストを受付けるリクエスト受付部を有し、
前記リクエストされた音源を、前記複数の音声通信端末各々に提供する音源に設定することを特徴とする音声通話システム。
請求項１乃至７のいずれか一項に記載の音声通話システムであって、
前記プレゼンス取得部と、
前記音声通信端末毎に設けられたオーディオレンダラと
を有するメディアサーバをさらに有することを特徴とする音声通話システム。
請求項１乃至７のいずれか一項に記載の音声通話システムであって、
前記複数の音声通信端末各々は、
前記プレゼンス取得部と、
自端末に対応して設けられたオーディオレンダラと
を有することを特徴とする音声通話システム。
コンテンツサーバが提供する音源、および複数の音声通信端末各々のユーザの仮想空間上における位置を管理するプレゼンスサーバであって、
前記複数の音声通信端末各々について、当該音声通信端末を中心として、当該音声通信端末に最も近い他の音声通信端末までの距離を半径とする領域を特定し、それぞれの音声通信端末について特定したいずれの領域にも含まれない位置を、前記音源の仮想空間における位置として決定する位置情報管理部を有することを特徴とするプレゼンスサーバ。
コンテンツサーバが提供する音源、および複数の音声通信端末各々のユーザの仮想空間上における位置を管理するプレゼンスサーバであって、
前記複数の音声通信端末各々について、当該音声通信端末から、当該音声通信端末に最も近い他の音声通信端末への方向を中心とした所定角度の範囲内の領域を特定し、それぞれの音声通信端末について特定したいずれの領域にも含まれない位置を、前記音源の仮想空間における位置として決定する位置情報管理部を有することを特徴とするプレゼンスサーバ。
コンテンツサーバが提供する音源、および複数の音声通信端末各々のユーザの仮想空間上における位置を管理するプレゼンスサーバであって、
前記複数の音声通信端末各々について、当該音声通信端末から、当該音声通信端末に最も近い他の音声通信端末への方向を中心とした所定角度の範囲内の領域を求め、当該音声通信端末の仮想空間における向きに直交すると共に、当該音声通信端末の仮想空間における位置を通る直線に対して、前記求めた領域と対称な領域を特定し、それぞれの音声通信端末について求めた領域および特定した領域のいずれにも含まれない位置を、前記音源の仮想空間における位置として決定する位置情報管理部を有することを特徴とするプレゼンスサーバ。
コンピュータを、コンテンツサーバが提供する音源、および複数の音声通信端末各々のユーザの仮想空間における位置を管理するプレゼンスサーバとして機能させる、コンピュータ読み取り可能なプログラムであって、
前記コンピュータに、
前記複数の音声通信端末各々について、当該音声通信端末を中心として、当該音声通信端末に最も近い他の音声通信端末までの距離を半径とする領域を特定し、それぞれの音声通信端末について特定したいずれの領域にも含まれない位置を、前記音源の仮想空間における位置として決定する位置情報管理機能を実現させることを特徴とするコンピュータ読み取り可能なプログラム。
コンピュータを、コンテンツサーバが提供する音源、および複数の音声通信端末各々のユーザの仮想空間における位置を管理するプレゼンスサーバとして機能させる、コンピュータ読み取り可能なプログラムであって、
前記コンピュータに、
前記複数の音声通信端末各々について、当該音声通信端末から、当該音声通信端末に最も近い他の音声通信端末への方向を中心とした所定角度の範囲内の領域を特定し、それぞれの音声通信端末について特定したいずれの領域にも含まれない位置を、前記音源の仮想空間における位置として決定する位置情報管理機能を実現させることを特徴とするコンピュータ読み取り可能なプログラム。
コンピュータを、コンテンツサーバが提供する音源、および複数の音声通信端末各々のユーザの仮想空間における位置を管理するプレゼンスサーバとして機能させる、コンピュータ読み取り可能なプログラムであって、
前記コンピュータに、
前記複数の音声通信端末各々について、当該音声通信端末から、当該音声通信端末に最も近い他の音声通信端末への方向を中心とした所定角度の範囲内の領域を求め、当該音声通信端末の仮想空間における向きに直交すると共に、当該音声通信端末の仮想空間における位置を通る直線に対して、前記求めた領域と対称な領域を特定し、それぞれの音声通信端末について求めた領域および特定した領域のいずれにも含まれない位置を、前記音源の仮想空間における位置として決定する位置情報管理機能を実現させることを特徴とするコンピュータ読み取り可能なプログラム。
複数の音声通信端末と、前記複数の音声通信端末各々に音源を提供するコンテンツサーバと、前記複数の音声通信各々のユーザおよび前記コンテンツサーバが提供する音源の仮想空間上における位置を管理するプレゼンスサーバと、を有する音声通話システムにおいて、音声通話中である前記複数の音声通信端末各々に前記音源の音響データを提供する、音声通話中におけるコンテンツの提供方法であって、
前記複数の音声通信端末各々について、
当該音声通信端末を中心として、当該音声通信端末に最も近い他の音声通信端末までの距離を半径とする領域を特定し、それぞれの音声通信端末について特定したいずれの領域にも含まれない位置を、前記音源の仮想空間における位置として決定し、
当該音声通信端末以外の他の音声通信端末各々の音声データに対して、前記他の音声通信端末各々のユーザと当該音声通信端末のユーザとの相対位置に応じた立体音響処理を施すと共に、前記音源の音響データに対して、前記音源と当該音声通信端末のユーザとの相対位置に応じた立体音響処理を施し、
前記立体音響処理された他の音声通信端末各々の音声データおよび音源の音響データを合成して、当該音声通信端末向けの音声通話データを生成することを特徴とする音声通話中におけるコンテンツの提供方法。
複数の音声通信端末と、前記複数の音声通信端末各々に音源を提供するコンテンツサーバと、前記複数の音声通信各々のユーザおよび前記コンテンツサーバが提供する音源の仮想空間上における位置を管理するプレゼンスサーバと、を有する音声通話システムにおいて、音声通話中である前記複数の音声通信端末各々に前記音源の音響データを提供する、音声通話中におけるコンテンツの提供方法であって、
前記複数の音声通信端末各々について、
当該音声通信端末から、当該音声通信端末に最も近い他の音声通信端末への方向を中心とした所定角度の範囲内の領域を特定し、それぞれの音声通信端末について特定したいずれの領域にも含まれない位置を、前記音源の仮想空間における位置として決定し、
当該音声通信端末以外の他の音声通信端末各々の音声データに対して、前記他の音声通信端末各々のユーザと当該音声通信端末のユーザとの相対位置に応じた立体音響処理を施すと共に、前記音源の音響データに対して、前記音源と当該音声通信端末のユーザとの相対位置に応じた立体音響処理を施し、
前記立体音響処理された他の音声通信端末各々の音声データおよび音源の音響データを合成して、当該音声通信端末向けの音声通話データを生成することを特徴とする音声通話中におけるコンテンツの提供方法。
複数の音声通信端末と、前記複数の音声通信端末各々に音源を提供するコンテンツサーバと、前記複数の音声通信各々のユーザおよび前記コンテンツサーバが提供する音源の仮想空間上における位置を管理するプレゼンスサーバと、を有する音声通話システムにおいて、音声通話中である前記複数の音声通信端末各々に前記音源の音響データを提供する、音声通話中におけるコンテンツの提供方法であって、
前記複数の音声通信端末各々について、
当該音声通信端末から、当該音声通信端末に最も近い他の音声通信端末への方向を中心とした所定角度の範囲内の領域を求め、当該音声通信端末の仮想空間における向きに直交すると共に、当該音声通信端末の仮想空間における位置を通る直線に対して、前記求めた領域と対称な領域を特定し、それぞれの音声通信端末について求めた領域および特定した領域のいずれにも含まれない位置を、前記音源の仮想空間における位置として決定し、
当該音声通信端末以外の他の音声通信端末各々の音声データに対して、前記他の音声通信端末各々のユーザと当該音声通信端末のユーザとの相対位置に応じた立体音響処理を施すと共に、前記音源の音響データに対して、前記音源と当該音声通信端末のユーザとの相対位置に応じた立体音響処理を施し、
前記立体音響処理された他の音声通信端末各々の音声データおよび音源の音響データを合成して、当該音声通信端末向けの音声通話データを生成することを特徴とする音声通話中におけるコンテンツの提供方法。