JP2003061184A

JP2003061184A - 情報処理装置および方法、情報生成装置および方法、記録媒体、並びにプログラム

Info

Publication number: JP2003061184A
Application number: JP2001245991A
Authority: JP
Inventors: Tetsujiro Kondo; 哲二郎近藤; Yuji Okumura; 裕二奥村; Koichi Fujishima; 幸一藤島; Tomoyuki Otsuki; 知之大月
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2001-08-14
Filing date: 2001-08-14
Publication date: 2003-02-28
Anticipated expiration: 2021-08-14
Also published as: JP4752153B2

Abstract

(57)【要約】【課題】ユーザが発した音声を利用して、ユーザの顔
の向きを検出ことができるようにする。【解決手段】マイクアンプ２Ｌおよびマイクアンプ２
Ｒのそれぞれは、所定の位置に設置されたマイク１Ｌお
よびマイク１Ｒにより集音された所定の音源が発した音
声の音声信号を増幅して、処理用音声信号Ｌおよび処理
用音声信号Ｒを生成し、検出装置３に供給する。検出装
置３は、処理用音声信号Ｌの音圧Ｌ、および処理用音声
信号Ｒの音圧Ｒをそれぞれ算出するとともに、音圧比
（＝音圧Ｒ／音圧Ｌ）を算出する。検出装置３は、算出
した音圧比に対応する音源の向きを、自分自身が保持し
ている、音圧比と音源の向きとの対応関係を示すデータ
に基づいて検出する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、情報処理装置およ
び方法、情報生成装置および方法、記録媒体、並びにプ
ログラムに関し、特に、音源が発した音声を利用して、
音源の位置や向きを検出することができるようにした情
報処理装置および方法、情報生成装置および方法、記録
媒体、並びにプログラムに関する。

【０００２】

【従来の技術】例えば、遠隔している複数の会議室にお
ける画像や音声を、ネットワークを介して相互に通信
し、各会議室において、他の会議室の映像や音声を再生
することにより、あたかも１つのテーブルを囲んでいる
かのように会議を行うことができる遠隔システムが存在
する。

【０００３】この遠隔会議システムにおいては、会議に
参加しているユーザの顔の向きに応じて、映像の表示や
音声の出力が制御される。すなわち、ユーザの顔の向き
が検出されるようになされている。

【０００４】

【発明が解決しようとする課題】しかしながら、特殊な
センサを利用したり、ユーザの顔の部分の画像データを
利用して、ユーザの顔の向きを検出する方法は、開示さ
れているが、ユーザが発した音声を利用して、ユーザの
顔の向きを検出する方法は、まだ開示されていない。

【０００５】本発明はこのような状況に鑑みてなされた
ものであり、音源が発した音声を利用して、音源の顔の
向きを検出することができるようにするものである。

【０００６】

【課題を解決するための手段】本発明の情報処理装置
は、所定の位置に設置された複数の集音装置により集音
された、所定の音源が発した音声に対応する音声信号か
ら、音源の状態に対応する特徴量を算出する第１の算出
手段と、第１の算出手段により算出された特徴量に基づ
いて、音源の状態を検出する状態検出手段とを備えるこ
とを特徴とする。

【０００７】状態は、所定の位置にある音源の向きとす
ることができる。

【０００８】状態検出手段は、予め求められた、特徴量
と状態との対応関係を示す対応関係データを保持し、対
応関係データおよび特徴量に基づいて、状態を検出する
ことができる。

【０００９】第１の算出手段は、第１の集音装置により
集音された、音源が発した音声に対応する第１の音声信
号、および第２の集音装置により集音された、音源が発
した音声に対応する第２の音声信号から、第１の音声信
号の音圧と第２の音声信号の音圧との音圧比を、特徴量
として算出し、状態検出手段は、予め求められた、音圧
比と状態との対応関係を示す対応関係データを保持し、
対応関係データおよび音圧比に基づいて、状態を検出す
ることができる。

【００１０】第１の算出手段は、第１の集音装置により
集音された、音源が発した音声に対応する第１の音声信
号、および第２の集音装置により集音された、音源が発
した音声に対応する第２の音声信号から、第１の音声信
号の高周波部分からなる第１の高周波音声信号の音圧
と、第２の音声信号の高周波部分からなる第２の高周波
音声信号の音圧との音圧比を、特徴量として算出し、状
態検出手段は、予め求められた、音圧比と状態との対応
関係を示す対応関係データを保持し、対応関係データお
よび音圧比に基づいて、状態を検出することができる。

【００１１】第１の算出手段は、第１の集音装置により
集音された、音源が発した音声に対応する第１の音声信
号、および第２の集音装置により集音された、音源が発
した音声に対応する第２の音声信号から、第１の音声信
号の位相と第２の音声信号の位相との位相差を、特徴量
として算出し、状態検出手段は、予め求められた、位相
差と状態との対応関係を示す対応関係データを保持し、
対応関係データおよび位相差に基づいて、状態を検出す
ることができる。

【００１２】第１の算出手段は、第１の集音装置、第２
の集音装置、および第３の集音装置により集音された、
所定の範囲内に位置する音源が発した音声に対応する第
１の音声信号、第２の音声信号、および第３の音声信号
から、第１の音声信号の位相と第２の音声信号の位相と
の第１の位相差、および第１の音声信号の位相と第３の
音声信号の位相との第２の位相差を、特徴量として算出
し、状態検出手段は、第１の位相差および第２の位相差
に基づいて、音源の、平面上の位置を検出することがで
きる。

【００１３】第１の集音装置、第２の集音装置、および
第３の集音装置のそれぞれにより集音された、所定の範
囲内に設けられた複数の実験位置に位置した音源が発し
た音声に対応する第４の音声信号、第５の音声信号、お
よび第６の音声信号から、第４の音声信号の位相と第５
の音声信号の位相との第３の位相差、および第４の音声
信号の位相と第６の音声信号との第４の位相差を、実験
位置毎に算出し、さらに、第３の位相差と実験位置との
関係に基づく第１の係数、および第４の位相差と実験位
置との関係に基づく第２の係数を算出する第２の算出手
段と、第２の算出手段により算出された第１の係数およ
び第２の係数を記憶する記憶手段とをさらに設け、状態
検出手段には、第１の位相差と第１の係数との関係、お
よび第２の位相差と第２の係数との関係に基づいて、音
源の、平面上の位置を検出させることができる。

【００１４】第１の算出手段は、第２の音声信号および
第３の音声信号から、第２の音声信号の音圧と第３の音
声信号の音圧との第１の音圧比を、特徴量として、さら
に算出し、状態検出手段は、第１の音圧比および検出し
た音源の位置に基づいて、音源の向きを検出することが
できる。

【００１５】第２の集音装置および第３の集音装置のそ
れぞれにより集音された、複数の基準位置に位置し、所
定の方向を向いた音源が発した音声に対応する第４の音
声信号および第５の音声信号から、第４の音声信号の音
圧と第５の音声信号の音圧の第２の音圧比を算出し、さ
らに、第２の音圧比と所定の方向との関係に基づく係数
を、基準位置毎に算出する第２の算出手段と、係数を、
基準位置に対応させて記憶する記憶手段とをさらに設
け、状態検出手段には、検出した音源の位置に対応する
基準位置を検出するとともに、記憶手段から、検出した
基準位置に対応する係数を選択し、選択した係数および
第１の音圧比との関係に基づいて、音源の向きを検出さ
せることができる。

【００１６】第１の算出手段は、第１の集音装置、第２
の集音装置、第３の集音装置、および第４の集音装置に
より集音された、所定の範囲内に位置する音源が発した
音声に対応する第１の音声信号、第２の音声信号、第３
の音声信号、および第４の音声信号から、第１の音声信
号の位相と第２の音声信号の位相との第１の位相差、第
２の音声信号の位相と第３の音声信号の位相との第２の
位相差、および第３の音声信号の位相と第４の音声信号
の位相との第３の位相差を、特徴量として算出し、状態
検出手段は、第１の位相差、第２の位相差、および第３
の位相差に基づいて、音源の、空間上の位置を検出する
ことができる。

【００１７】第１の集音装置、第２の集音装置、第３の
集音装置、および第４の集音装置のそれぞれにより集音
された、所定の範囲内に設けられた複数の実験位置に位
置した音源が発した音声に対応する第５の音声信号、第
６の音声信号、第７の音声信号、および第８の音声信号
から、第５の音声信号の位相と第６の音声信号の位相と
の第４の位相差、第６の音声信号の位相と第７の音声信
号の位相との第５の位相差、および第７の音声信号の位
相と第８の音声信号の位相との第６の位相差を、実験位
置毎に算出し、さらに、第４の位相差と実験位置との関
係に基づく第１の係数、第５の位相差と実験位置との関
係に基づく第２の係数、および第６の位相差と実験位置
との関係に基づく第３の係数を算出する第２の算出手段
と、第２の算出手段により算出された第１の係数、第２
の係数、および第３の係数を記憶する記憶手段とをさら
に設け、状態検出手段には、第１の位相差と第１の係数
との関係、第２の位相差と第２の係数との関係、および
第３の位相差と第３の係数との関係に基づいて、音源
の、空間上の位置を検出させることができる。

【００１８】第１の算出手段は、第１の音声信号、第２
の音声信号、第３の音声信号、および第４の音声信号か
ら、第１の音声信号の音圧と第２の音声信号の音圧との
第１の音圧比、第２の音声信号の音圧と第３の音声信号
の音圧との第２の音圧比、および第３の音声信号の音圧
と第４の音声信号の音圧との第３の音圧比を、特徴量と
して、さらに算出し、状態検出手段は、第１の音圧比、
第２の音圧比、および第３の音圧比、並びに検出した音
源の位置に基づいて、音源の向きを検出することができ
る。

【００１９】第１の集音装置、第２の集音装置、第３の
集音装置、および第４の集音装置のそれぞれにより集音
された、複数の基準位置に位置し、所定の方向を向いた
音源が発した音声に対応する第５の音声信号、第６の音
声信号、第７の音声信号、および第８の音声信号から、
第５の音声信号の音圧と第６の音声信号の音圧との第４
の音圧比、第６の音声信号の音圧と第７の音声信号の音
圧との第５の音圧比、および第７の音声信号の音圧と第
８の音声信号の音圧との第６の音圧比をそれぞれ算出す
る第２の算出手段と、基準位置に対応させて、第４の音
圧比、第５の音圧比、および第６の音圧比、並びに方向
を記憶する記憶手段とをさらに設け、状態検出手段に
は、記憶手段から、検出した音源の位置に対応する基準
位置、および第１の音圧比、第２の音圧比と第３の音圧
比に対応する第４の音圧比、第５の音圧比と第６の音圧
比に対応する方向を、音源の向きとして検出させること
ができる。

【００２０】本発明の情報処理方法は、所定の位置に設
置された複数の集音装置により集音された、所定の音源
が発した音声に対応する音声信号から、音源の状態に対
応する特徴量を算出する算出ステップと、算出ステップ
の処理で算出された特徴量に基づいて、音源の状態を検
出する状態検出ステップとを含むことを特徴とする。

【００２１】本発明の第１の記録媒体のプログラムは、
所定の位置に設置された複数の集音装置により集音され
た、所定の音源が発した音声に対応する音声信号から、
音源の状態に対応する特徴量を算出する算出ステップ
と、算出ステップの処理で算出された特徴量に基づい
て、音源の状態を検出する状態検出ステップとを含むこ
とを特徴とする。

【００２２】本発明の第１のプログラムは、所定の位置
に設置された複数の集音装置により集音された、所定の
音源が発した音声に対応する音声信号から、音源の状態
に対応する特徴量を算出する算出ステップと、算出ステ
ップの処理で算出された特徴量に基づいて、音源の状態
を検出する状態検出ステップとを含むことを特徴とす
る。

【００２３】本発明の情報処理装置および方法、並びに
第１のプログラムにおいては、所定の位置に設置された
複数の集音装置により集音された、所定の音源が発した
音声に対応する音声信号から、音源の状態に対応する特
徴量が算出され、算出された特徴量に基づいて、音源の
状態が検出される。

【００２４】本発明の情報生成装置は、第１の集音装
置、第２の集音装置、および第３の集音装置のそれぞれ
により集音された、所定の範囲内に設けられた複数の実
験位置に位置した音源が発した音声に対応する第４の音
声信号、第５の音声信号、および第６の音声信号から、
第４の音声信号の位相と第５の音声信号の位相との第３
の位相差、および第４の音声信号の位相と第６の音声信
号との第４の位相差を、実験位置毎に算出する第１の算
出手段と、第３の位相差と実験位置との関係に基づい
て、第１の係数を算出し、第４の位相差と実験位置との
関係に基づいて、第２の係数を算出する第２の算出手段
とを備えることを特徴とする。

【００２５】検出装置は、第２の集音装置および第３の
集音装置のそれぞれにより集音された、複数の基準位置
に位置する音源が発した音声に対応する第７の音声信号
および第８の音声信号から、第７の音声信号の音圧と第
８の音声信号の音圧の音圧比を算出し、さらに、音圧比
と第３の係数との関係に基づいて、音源の向きをさらに
検出し、第２の集音装置および第３の集音装置のそれぞ
れにより集音された、複数の基準位置に位置する音源が
発した音声に対応する第９の音声信号および第１０の音
声信号から、第９の音声信号の音圧と第１０の音声信号
の音圧の音圧比を算出する第３の算出手段と、第９の音
声信号の音圧と第１０の音声信号の音圧の音圧比と実験
位置との関係に基づいて、第３の係数を算出する第４の
算出手段とをさらに設けることができる。

【００２６】本発明の情報生成方法は、第１の集音装
置、第２の集音装置、および第３の集音装置のそれぞれ
により集音された、所定の範囲内に設けられた複数の実
験位置に位置した音源が発した音声に対応する第４の音
声信号、第５の音声信号、および第６の音声信号から、
第４の音声信号の位相と第５の音声信号の位相との第３
の位相差、および第４の音声信号の位相と第６の音声信
号との第４の位相差を、実験位置毎に算出する第１の算
出ステップと、第３の位相差と実験位置との関係に基づ
いて、第１の係数を算出し、第４の位相差と実験位置と
の関係に基づいて、第２の係数を算出する第２の算出ス
テップとを含むことを特徴とする。

【００２７】本発明の第２の記録媒体のプログラムは、
第１の集音装置、第２の集音装置、および第３の集音装
置のそれぞれにより集音された、所定の範囲内に設けら
れた複数の実験位置に位置した音源が発した音声に対応
する第４の音声信号、第５の音声信号、および第６の音
声信号から、第４の音声信号の位相と第５の音声信号の
位相との第３の位相差、および第４の音声信号の位相と
第６の音声信号との第４の位相差を、実験位置毎に算出
する第１の算出ステップと、第３の位相差と実験位置と
の関係に基づいて、第１の係数を算出し、第４の位相差
と実験位置との関係に基づいて、第２の係数を算出する
第２の算出ステップとを含むことを特徴とする。

【００２８】本発明の第２のプログラムは、第１の集音
装置、第２の集音装置、および第３の集音装置のそれぞ
れにより集音された、所定の範囲内に設けられた複数の
実験位置に位置した音源が発した音声に対応する第４の
音声信号、第５の音声信号、および第６の音声信号か
ら、第４の音声信号の位相と第５の音声信号の位相との
第３の位相差、および第４の音声信号の位相と第６の音
声信号との第４の位相差を、実験位置毎に算出する第１
の算出ステップと、第３の位相差と実験位置との関係に
基づいて、第１の係数を算出し、第４の位相差と実験位
置との関係に基づいて、第２の係数を算出する第２の算
出ステップとを含む処理をコンピュータに実行させるこ
とを特徴とする。

【００２９】本発明の情報生成装置および方法、並びに
第２のプログラムにおいては、第１の集音装置、第２の
集音装置、および第３の集音装置のそれぞれにより集音
された、所定の範囲内に設けられた複数の実験位置に位
置した音源が発した音声に対応する第４の音声信号、第
５の音声信号、および第６の音声信号から、第４の音声
信号の位相と第５の音声信号の位相との第３の位相差、
および第４の音声信号の位相と第６の音声信号との第４
の位相差が、実験位置毎に算出され、第３の位相差と実
験位置との関係に基づいて、第１の係数が算出され、第
４の位相差と実験位置との関係に基づいて、第２の係数
が算出される。

【００３０】

【発明の実施の形態】

【００３１】図１は、本発明を適用した音源状態検出シ
ステムの第１の実施の形態の構成例を示している。この
システムでは、所定の位置にある音源が発した音声か
ら、音源の向きが検出される。なお、ここでは、音源
は、所定の位置にあるユーザの口元とし、ユーザが発し
た音声から、ユーザの口元の向き（ユーザの顔の向き）
が検出される。

【００３２】マイクロフォン（以下、マイクと略称す
る）１Ｌおよびマイク１Ｒは、図２（Ａ）に示すよう
に、ユーザの頭部の中心点が位置Ａに位置する場合にお
いて、ユーザの顔が正面方向を向いているとき、マイク
１Ｌとユーザの口元（音源）の距離Ｌと、マイクＲと音
源の距離Ｒが、それぞれ等しくなる位置に設置されてい
る。

【００３３】図１に戻り、マイク１Ｌおよびマイク１Ｒ
のそれぞれは、音源であるユーザの口元から発せられた
音声を集音し、マイクアンプ２Ｌおよびマイクアンプ２
Ｒに供給する。

【００３４】マイクアンプ２Ｌは、マイク１Ｌからの音
声信号を増幅して、処理用音声信号Ｌを生成し、検出装
置３に供給する。マイクアンプ２Ｒは、マイク１Ｒから
の音声信号を増幅して、処理用音声信号Ｒを生成し、検
出装置３に供給する。

【００３５】検出装置３は、マイクアンプ２Ｌから供給
される処理用音声信号Ｌおよびマイクアンプ２Ｒから供
給される処理用音声信号Ｒから、処理用音声信号Ｌの音
圧Ｌと処理用音声信号Ｒの音圧Ｒとの音圧比ＲＬ（＝音
圧Ｒ／音圧Ｌ）を算出する。

【００３６】検出装置３は、算出した音圧比ＲＬに対応
する音源の向き、すなわち、この例の場合、ユーザの口
元の向き（ユーザの顔の向き）を、図３に示す、音圧比
ＲＬと口元（音源）の向きとの対応関係を示すデータを
参照することで検出し、それを、図示せぬ外部の装置に
出力する。

【００３７】ところで、音声の音圧は、音源からの距離
が短ければ短いほど大きくなることから、図２（Ｃ）に
示すように、ユーザの顔（口元）が正面方向に対して右
側を向いており、距離Ｒが、距離Ｌより短い場合、この
とき検出される、マイク１Ｒにより集音される、ユーザ
が発した音声の音圧（処理用音声信号Ｒの音圧Ｒ）は、
マイク１Ｌにより集音される、ユーザが発した音声の音
圧（処理用音声信号Ｌの音圧Ｌ）より大きなる。すなわ
ちこの場合、音圧比ＲＬは、１より大きな所定の値とな
る。

【００３８】また、図２（Ｂ）に示すように、口元が正
面方向に対して左側を向いており、距離Ｒが、距離Ｌよ
り長い場合、音圧Ｒは、音圧Ｌより小さくなるので、音
圧比ＲＬは、１より小さい所定の値となる。

【００３９】また、図２（Ａ）に示すように、口元が正
面方向を向いており、距離Ｒが、距離Ｌと等しい場合、
音圧Ｒは、音圧Ｌと等しくなるので、音圧比ＲＬは、１
となる。

【００４０】このように、音圧比ＲＬ（＝音圧Ｒ／音圧
Ｌ）は、口元（音源）の向き（正確には、口元とマイク
１との距離）に対応するので、例えば、口元が向く方向
を変え、そのとき発せられた音声の音圧比ＲＬ、および
口元が向く方向を表す値を集計することで、図３に示す
データが得られる。

【００４１】図４は、検出装置３の構成例を示してい
る。

【００４２】入力部１１は、マイクアンプ２Ｌおよびマ
イクアンプ２Ｒのそれぞれから適宜供給される処理用音
声信号Ｌおよび処理用音声信号Ｒを入力する。入力部１
１は、入力した、処理用音声信号Ｌ，Ｒの一部（例え
ば、所定の時間内に入力した部分）を、特徴量算出部１
２に供給する。

【００４３】特徴量算出部１２は、入力部１１から供給
された処理用音声信号Ｌ，Ｒから、それぞれの音圧Ｌ，
Ｒを算出するとともに、音圧比ＲＬ（＝音圧Ｒ／音圧
Ｌ）を算出し、それを、検出部１３に供給する。＄検出
部１３は、図３に示した、音圧比ＲＬと口元（音源）の
対応関係を示すデータを保持しており、そのデータに基
づいて、特徴量算出部１２から供給された音圧比ＲＬに
対応する口元の向きを検出し、出力部１４に供給する。

【００４４】出力部１４は、検出部１３から供給された
口元（音源）の向きを、外部の装置に供給する。

【００４５】図５は、特徴量算出部１２の構成例を示し
ている。入力部１１から供給された処理用音声信号Ｌ
は、音圧算出部２１Ｌに供給され、処理用音声信号Ｒ
は、音圧算出部２１Ｒに、それぞれ供給される。

【００４６】音圧算出部２１Ｌは、例えば、入力された
処理用音声信号Ｌが示す値の２乗平均値、２乗平均の平
方根、または絶対値の平均値を、処理用音声信号Ｌの音
圧Ｌとして算出し、その算出結果を、音圧比算出部２２
に供給する。音圧算出部２１Ｒは、音圧算出部２１Ｌと
同様の方法で、処理用音声信号Ｒの音圧Ｒを算出し、音
圧比算出部２２に供給する。

【００４７】音圧比算出部２２は、音圧算出部２１Ｌか
らの音圧Ｌと、音圧算出部２１Ｒからの音圧Ｒに基づい
て、音圧比ＲＬ（＝音圧Ｒ／音圧Ｌ）を算出し、その算
出結果を、検出部１３に供給する。

【００４８】次に、第１の実施の形態における音源状態
検出システムの動作を、図６のフローチャートを参照し
て説明する。

【００４９】ステップＳ１において、マイク１Ｌ，１Ｒ
のそれぞれは、所定の方向を向いているユーザが発した
（所定の方向を向いている口元からの）音声を集音し、
その結果得られた音声信号を、マイクアンプ２Ｌ，２Ｒ
に供給する。

【００５０】ステップＳ２において、マイクアンプ２
Ｌ，２Ｒのそれぞれは、マイク１Ｌ，１Ｒから供給され
た音声信号を増幅して、処理用音声信号Ｌ，Ｒを生成
し、検出装置３に供給する。

【００５１】ステップＳ３において、検出装置３は、マ
イクアンプ２Ｌ，２Ｒのそれぞれから供給された処理用
音声信号Ｌ，Ｒに基づいて、口元（音源）の向きを検出
する。ここでの処理の詳細は、図７のフローチャートに
示されている。

【００５２】ステップＳ１１において、検出装置３の入
力部１１は、入力したマイクアンプ２Ｌ，２Ｒのそれぞ
れからの処理用音声信号Ｌ，Ｒの一部（所定の時間内に
入力した部分）を、特徴量算出部１２に供給する。

【００５３】次に、ステップＳ１２において、特徴量算
出部１２（音圧算出部２１Ｌ，２１Ｒ）は、入力部１１
から供給された処理用音声信号Ｌ，Ｒから、それらの音
圧Ｌ，Ｒをそれぞれ算出する。

【００５４】ステップＳ１３において、特徴量算出部１
２（音圧比算出部２２）は、ステップＳ１２で算出した
音圧Ｌ，Ｒに基づいて、音圧比ＲＬ（＝音圧Ｒ／音圧
Ｌ）を算出し、検出部１３に供給する。

【００５５】次に、ステップＳ１４において、検出部１
３は、音圧比ＲＬと口元（音源）の向きとの対応関係を
示すデータ（図３）を参照して、特徴量算出部１２から
供給された音圧比ＲＬに対応する音源の向きを検出し、
出力部１４に供給する。

【００５６】ステップＳ１５において、出力部１４は、
検出部１３から供給された口元（音源）の向きを、外部
の装置に出力する。

【００５７】その後、検出装置３の処理は終了し、音源
状態検出システムの動作（図６）も、終了する。

【００５８】図８は、本発明を適用した音源状態検出シ
ステムの第２の実施の形態の構成例を示している。この
システムでは、第１の実施の形態（図１）における場合
と同様に、所定の位置にある音源が発した音声から、音
源の向きが検出される。

【００５９】このシステムには、図１に示す検出装置３
に代えて、検出装置３１が設けられている。その他の構
成は、図１における場合と同様であり、その説明は適宜
省略する。

【００６０】マイク１Ｌとマイク１Ｒは、第１の実施の
形態における場合と同様の位置に設置されている（図
９）。

【００６１】検出装置３１は、マイクアンプ２Ｌから供
給される処理用音声信号Ｌおよびマイクアンプ２Ｒから
供給される処理用音声信号Ｒから、処理用音声信号Ｌの
高周波部分（以下、高周波処理用音声信号Ｌhと称す
る）の音圧Ｌhと、処理用音声信号Ｒの高周波部分（以
下、高周波処理用音声信号Ｒhと称する）の音圧Ｒhとの
音圧比ＲＬh（＝音圧Ｒh／音圧Ｈh）を算出する。

【００６２】検出装置３１は、算出した音圧比ＲＬhに
対応する口元（音源）の向きを、図１０に示す、音圧比
ＲＬhと口元の向きとの対応関係を示すデータに基づい
て検出し、それを、図示せぬ外部の装置に出力する。

【００６３】ところで、音声、特にその高周波部分には
指向性があるので、その高周波部分の音圧は、音源に対
する角度が小さければ小さいほど大きくなる。このこと
から、図９（Ｃ）に示すように、口元が正面方向に対し
て右側を向いており、角度Ｒが、角度Ｌより小さい場
合、このとき検出される、マイク１Ｒにより集音され
る、ユーザが発した音声の高周波部分の音圧（高周波処
理用音声信号Ｒhの音圧Ｒh）は、マイク１Ｌにより集音
される、ユーザが発した音声の高周波部分の音圧（高周
波処理用音声信号Ｌhの音圧Ｌh）よりも大きくなる。す
なわちこの場合、音圧比ＲＬhは、１より大きい所定の
値となる。

【００６４】また、図９（Ｂ）に示すように、口元が正
面方向に対して左側を向いており、角度Ｒが、角度Ｌよ
り大きい場合、音圧Ｒhは、音圧Ｌhよりも小さくなるの
で、音圧比ＲＬhは、１より小さい所定の値となる。

【００６５】また、図９（Ａ）に示すように、口元が正
面方向を向いており、角度Ｒが、角度Ｌと等しい場合、
音圧Ｒhは、音圧Ｌhと等しくなるので、音圧比ＲＬh
は、１となる。

【００６６】このように、音圧比ＲＬhは、口元（音
源）の向き（正確には、口元が向いている方向と、口元
の位置からのマイク１が位置する方向との角度）に対応
するので、口元が向く方向を変え、そのとき発せられた
音声の音圧比ＲＬh、および口元が向く方向を表す値を
集計することで、図１０に示すデータが得られる。

【００６７】図１１は、検出装置３１の構成例を示して
いる。この検出装置３１には、図４の検出装置３の特徴
量算出部１２および検出部１３に代えて、特徴量算出部
４１および検出部４２が設けられている。他の部分は、
図４における場合と同様である。

【００６８】特徴量算出部４１は、入力部１１から供給
された処理用音声信号Ｌ，Ｒの高周波部分のみを通過さ
せることで得られた、高周波処理用音声信号Ｌhおよび
高周波処理用音声信号Ｒhから、それらの音圧Ｌhおよび
音圧Ｒhをそれぞれ算出するとともに、算出した音圧Ｌh
と音圧Ｒhの音圧比ＲＬh（＝音圧Ｒh／音圧Ｌh）を算出
し、検出部４２に供給する。

【００６９】検出部４２は、図１０に示した、音圧比Ｒ
Ｌhと口元（音源）の向きとの対応関係を示すデータを
保持しており、そのデータに基づいて、特徴量算出部４
１から供給された音圧比ＲＬhに対応する口元の向きを
検出し、出力部１４に供給する。

【００７０】図１２は、特徴量算出部４１の構成例を示
している。この特徴量算出部４１には、図５の特徴量算
出部１２の音圧算出部２１Ｌおよび音圧算出部２１Ｒの
前段に、ハイパスフィルタ（ＨＰＦ）５１Ｌおよびハイ
パスフィルタ５１Ｒが設けられている。他の構成は、図
５における場合と同様である。

【００７１】ハイパスフィルタ５１Ｌは、入力部１１か
ら供給された処理用音声信号Ｌの高周波部分のみを通過
させて、音圧算出部２１Ｌに供給する。すなわち、高周
波処理用音声信号Ｌhが、音圧算出部２１Ｌに供給され
る。

【００７２】ハイパスフィルタ５１Ｒは、入力部１１か
ら供給された処理用音声信号Ｒの高周波部分のみを通過
させて、音圧算出部２１Ｒに供給する。すなわち、高周
波処理用音声信号Ｒhが、音圧算出部２１Ｒに供給され
る。

【００７３】図１３は、ハイパスフィルタ５１のカット
オフ特性を示している。カットオフ周波数ｆは、例え
ば、それを固定の値とすることや、ユーザの音声のピッ
チ周波数に比例する周波数とすることができる。

【００７４】ここでピッチ周波数とは、図１４に示すよ
うなユーザの音声の波形の中で繰り返される基本的な波
形の周期Ｔの逆数である。ピッチ周波数は、人それぞれ
により異なる。

【００７５】図１２に戻り、音圧算出部２１Ｌは、ハイ
パスフィルタ５１Ｌから供給される高周波処理用音声信
号Ｌhの音圧Ｌhを算出し、音圧比算出部２２に供給す
る。音圧算出部２１Ｒは、ハイパスフィルタ５１Ｒから
供給される高周波処理用音声信号Ｒhの音圧Ｒhを算出
し、音圧比算出部２２に供給する。

【００７６】音圧比算出部２２は、音圧算出部２１Ｌか
らの音圧Ｌhと、音圧算出部２１Ｒからの音圧Ｒhとの音
圧比ＲＬh（＝音圧Ｒh／音圧Ｌh）を算出し、検出部４
２に供給する。

【００７７】次に、第２の実施の形態における音源状態
検出システムの動作を、図１５のフローチャートを参照
して説明する。

【００７８】ステップＳ２１，Ｓ２２においては、図６
のステップＳ１，Ｓ２における場合と同様の処理が実行
されるので、その説明は省略する。

【００７９】ステップＳ２３において、検出装置３１
は、マイクアンプ２Ｌ，２Ｒのそれぞれから供給された
処理用音声信号Ｌ，Ｒに基づいて、口元（音源）の向き
を検出する。ここでの処理の詳細は、図１６のフローチ
ャートに示されている。

【００８０】ステップＳ３１において、入力部１１は、
マイクアンプ２Ｌ，２Ｒのそれぞれからの処理用音声信
号Ｌ，Ｒの一部（例えば、所定の時間内に入力した部
分）を、特徴量算出部４１に供給する。

【００８１】次に、ステップＳ３２において、特徴量算
出部４１（ハイパスフィルタ５１Ｌ，５１Ｒ）は、入力
部１１から供給された処理用音声信号Ｌ，Ｒの高周波部
分を濾過し、高周波処理用音声信号Ｌh，Ｒhを生成す
る。

【００８２】ステップＳ３３において、特徴量算出部４
１（音圧算出部２１Ｌ，２１Ｒ）は、ステップＳ３２で
生成した高周波処理用音声信号Ｌh，Ｒhから、音圧Ｌ
h，Ｒhをそれぞれ算出する。

【００８３】次に、ステップＳ３４において、特徴量算
出部４１（音圧比算出部２２）は、ステップＳ３３で算
出した音圧Ｌh，Ｒhに基づいて、音圧比ＲＬh（＝音圧
Ｒh／音圧Ｌh）を算出し、検出部４２に供給する。

【００８４】ステップＳ３５において、検出部４２は、
音圧比ＲＬhと口元（音源）の向きとの対応関係を示す
データ（図１０）を参照して、特徴量算出部４１から供
給された音圧比ＲＬhに対応する音源の向きを検出し、
出力部１４に供給する。

【００８５】次に、ステップＳ３６において、出力部１
４は、検出部４２から供給された口元（音源）を、外部
の装置に出力する。

【００８６】その後、検出装置３１の処理は終了し、音
源状態検出システムの動作（図１５）も終了する。

【００８７】図１７は、本発明を適用した音源状態検出
システムの第３の実施の形態の構成例を示している。こ
のシステムでは、第１の実施の形態（図１）および第２
の実施の形態（図８）における場合と同様に、所定の位
置にある音源が発した音声から、音源の向きが検出され
る。

【００８８】このシステムには、図１に示す検出装置３
に代えて、検出装置６１が設けられている。他の構成に
ついては同様である。＄マイク１Ｌとマイク１Ｒは、第
１の実施の形態における場合と同様の位置に設置されて
いる（図２）。

【００８９】検出装置６１は、マイクアンプ２Ｌから供
給される処理用音声信号Ｌおよびマイクアンプ２Ｒから
供給される処理用音声信号Ｒから、処理用音声信号Ｒの
位相に対する処理用音声信号Ｌの位相のずれ（位相差）
を算出する。検出装置６１は、算出した位相差に対応す
るユーザの口元（音源）の向きを、図１８に示す、位相
差と口元（音源）の向きとの対応関係を示すデータに基
づいて検出し、図示せぬ外部の装置に出力する。

【００９０】ところで、音声は、マイク１と音源との距
離が長ければ長いほど、マイク１に到達するのに時間が
かかり、また後に到達した音声の位相は、先に到達した
音声の位相に比べ遅れる特徴がある。このことから、例
えば、図２（Ｂ）に示すように、口元が正面方向に対し
て左側を向いており、距離Ｒが、距離Ｌより長い場合、
このときユーザから発せられた音声は、マイク１Ｌに先
に到達し、その後マイク１Ｒに到達するので、このとき
検出されるマイク１Ｒにより集音される音声（処理用音
声信号Ｒ）の位相（図１９（Ｂ））は、マイク１Ｌによ
り集音される音声（処理用音声信号Ｌ）の位相（図１９
（Ａ））に比べ遅れる。すなわちこの場合、処理用音声
信号Ｒの位相に対する処理用音声信号Ｌの位相の差は、
負の値となる。

【００９１】なおこのとき、距離Ｌは、距離Ｒより短い
ので、図１９（Ａ）に示す処理用音声信号Ｌのレベル
は、図１９（Ｂ）に示す処理用音声信号Ｒのレベルより
高くなる。

【００９２】また、図２（Ｃ）に示すように、口元が正
面方向に対して右側を向いており、距離Ｒが、距離Ｌよ
り短い場合、このときユーザから発せられた音声は、マ
イク１Ｒに先に到達し、その後マイク１Ｌに到達するの
で、処理用音声信号Ｒ（図２０（Ｂ））の位相は、処理
用音声信号Ｌ（図２０（Ａ））の位相に比べ進む。すな
わちこの場合、処理用音声信号Ｒの位相に対する処理用
音声信号Ｌの位相の差は、正の値となる。＄なおこのと
き、距離Ｒは、距離Ｌより短いので、図２０（Ｂ）に示
す処理用音声信号Ｒのレベルは、図２０（Ａ）に示す処
理用音声信号Ｌのレベルより高い。

【００９３】また、図２（Ａ）に示すように、ユーザの
顔が正面方向を向いており、距離Ｒが、距離Ｌと等しい
場合、このときユーザから発せられた音声は、マイク１
Ｒとマイク１Ｌに同時到達するので、処理用音声信号Ｒ
（図２１（Ｂ））の位相と、処理用音声信号Ｌ（図２１
（Ａ））の位相は、一致する。すなわちこの場合、処理
用音声信号Ｒの位相に対する処理用音声信号Ｌの位相の
位相差は、零となる。

【００９４】なおこのとき、距離Ｒと距離Ｌは等しいの
で、図２１（Ｂ）に示す処理用音声信号Ｒのレベルと図
２１（Ａ）に示す処理用音声信号Ｌのレベルは同じにな
る。

【００９５】このように、位相差は、口元（音源）の向
きに対応するので、口元が向く方向を変え、そのとき発
せられた音声の位相差、および口元が向く方向を表す値
を集計することで、図１８に示すデータが得られる。

【００９６】図２２は、検出装置６１の構成例を示して
いる。この検出装置６１には、図４の検出装置３の特徴
量算出部１２および検出部１３に代えて、特徴量算出部
７１および検出部７２が設けられている。他の構成は、
図４における場合と同様である。

【００９７】特徴量算出部７１は、入力部１１から供給
された処理用音声信号Ｌと処理用音声信号Ｒから、処理
用音声信号Ｒの位相に対する処理用音声信号Ｌの位相の
位相差を算出する。

【００９８】具体的には、特徴量算出部７１は、処理用
音声信号Ｌ，Ｒを、所定のサンプリング周期Ｔでサンプ
リングして、量子化する。これにより、処理用音声信号
Ｌからは、Ｎ個のサンプルＬ₁乃至Ｌ_Nが、処理用音声信
号Ｒからは、Ｎ個のサンプルＲ₁乃至Ｒ_Nがそれぞれ得ら
れる。なお、サンプルＬまたはサンプルＲに付されてい
る下付の番号は、サンプリング順を表してる。すなわ
ち、サンプルＬ₁は、最初にサンプリングされたサンプ
ル（第１番目のサンプル）を示す。

【００９９】次に、特徴量算出部７１は、ｊが１乃至ｎ
であるときの式（１）をそれぞれ算出し、その算出結果
の値が最大となるｊの値ｍを検出する。そして特徴量算
出部７１は、検出した値ｍにサンプリング周期Ｔを掛け
合わせて得られた値（時間）を、処理用音声信号Ｒの位
相に対する処理用音声信号Ｌの位相の位相差とする。

【数１】

【０１００】式中、Ｌi-jは、サンプルＬ_i-jの値を示
し、Ｒiは、サンプルＲ_iの値を示す。

【０１０１】すなわち、処理用音声信号Ｒと処理用音声
信号Ｌとの相関値が、処理用音声信号Ｒに対して、処理
用音声信号Ｌが、ｎ個のサンプル分の時間まで、１サン
プリング時間ずつずらされて算出され、その算出結果に
おいて最も高い相関値が得られたときの時間のずれが、
処理用音声信号Ｒの位相に対する処理用音声信号Ｌの位
相の差とされる。

【０１０２】検出部７２は、図１８に示した、位相差と
口元（音源）の向きとの対応関係を示すデータを保持し
ており、そのデータに基づいて、特徴量算出部７１から
供給された位相差に対応する音源の向きを検出し、出力
部１４に供給する。

【０１０３】次に、第３の実施の形態における音源状態
検出システムの動作を、図２３のフローチャートを参照
して説明する。

【０１０４】ステップＳ４１，Ｓ４２においては、図６
のステップＳ１，Ｓ２における場合と同様の処理が実行
されるので、その説明は省略する。

【０１０５】ステップＳ４３において、検出装置６１
は、マイクアンプ２Ｌ，２Ｒのそれぞれから供給された
処理用音声信号Ｌ，Ｒに基づいて、口元（音源）の向き
を検出する。ここでの処理の詳細は、図２４のフローチ
ャートに示されている。

【０１０６】ステップＳ５１において、入力部１１は、
マイクアンプ２Ｌ，２Ｒのそれぞれからの処理用音声信
号Ｌ，Ｒの一部（例えば、所定の時間内に入力した部
分）を、特徴量算出部７１に供給する。

【０１０７】次に、ステップＳ５２において、特徴量算
出部７１は、入力部１１から供給された処理用音声信号
Ｌ，Ｒから、処理用音声信号Ｒの位相に対する処理用音
声信号Ｌの位相の位相差を算出し、検出部７２に供給す
る。

【０１０８】ステップＳ５３において、検出部７２は、
位相差と口元（音源）の向きとの対応関係を示すデータ
（図１８）を参照して、特徴量算出部７１から供給され
た位相差に対応する音源の向きを検出し、出力部１４に
供給する。

【０１０９】ステップＳ５４において、出力部１４は、
検出部７２から供給された口元（音源）の向きを、外部
の装置に出力する。

【０１１０】その後、検出装置６１の処理は終了し、音
源状態検出システムの動作（図２３）も、終了する。

【０１１１】図２５は、本発明を適用した音源状態検出
システムの第４の実施の形態の構成例を示している。第
１の実施の形態乃至第３の実施の形態においては、音源
は、移動しないことを前提として、所定の位置ある音源
の向きが検出されたが、このシステムでは、所定の範囲
内で移動する音源の位置およびその向きが検出される。

【０１１２】このシステムには、図１に示す検出装置３
に代えて、検出装置１０１が設けられているとともに、
マイク１Ｌ、マイク１Ｃ、およびマイク１Ｒの３個のマ
イク１、並びにマイク１Ｌにより集音された音声を増幅
するマイクアンプ２Ｌ、マイク１Ｃにより集音された音
声を増幅するマイクアンプ２Ｃ、およびマイク１Ｒによ
り集音された音声を増幅するマイクアンプ２Ｒの３個の
マイクアンプ２が設けられている。

【０１１３】マイク１Ｌおよびマイク１Ｒは、図２６に
示すように、例えば、ユーザの頭部の中心点が位置Ａに
位置する場合において、口元が正面方向を向いていると
き、マイク１Ｌと口元の距離Ｌと、マイク１Ｒと口元の
距離Ｒが、それぞれ等しくなる位置に設置されている。
マイク１Ｃは、正面方向に、位置Ａから所定の距離だけ
離れた位置に設置されている。

【０１１４】図２５に戻り、検出装置１０１は、マイク
アンプ２Ｃから供給される信号（以下、処理用音声信号
Ｃと称する）の位相に対する、マイクアンプ２Ｌから供
給された処理用音声信号Ｌの位相の位相差ＣＬ、および
処理用音声信号Ｃの位相に対する、マイクアンプ２Ｒか
ら供給された処理用音声信号Ｒの位相の位相差ＣＲ、お
よび所定の係数（後述）に基づいて、所定の範囲内で移
動する口元（音源）の位置を検出する。

【０１１５】この例の場合、音源の位置は、図２７に示
すように、ユーザの頭部の中心点が位置Ａにある場合に
おいて、ユーザの顔が正面方向を向いているときの口元
（音源）の位置（以下、基準位置と称する）を原点とす
る座標（ｘ，ｙ）で示される。

【０１１６】検出装置１０１はまた、検出した口元（音
源）の位置に対応する所定の係数（後述）、および処理
用音声信号Ｌの音圧Ｌと処理用音声信号Ｒの音圧Ｒとの
音圧比ＲＬ（＝音圧Ｒ／音圧Ｌ）に基づいて、音源の向
きを検出する。

【０１１７】この例の場合、音源の向きは、図２７に示
すように、Ｙ軸に対する角度θで示される。

【０１１８】図２８は、検出装置１０１の構成例を示し
ている。

【０１１９】この検出装置１０１には、図４の検出装置
３の特徴量算出部１２および検出部１３に代えて、特徴
量算出部１１１および検出部１１２が設けられている。
他の構成は、図４における場合と同様である。

【０１２０】入力部１１は、マイクアンプ２Ｌ，２Ｃ，
２Ｒのそれぞれから適宜供給される処理用音声信号Ｌ，
Ｃ，Ｒを入力し、特徴量算出部１１１に供給する。

【０１２１】特徴量算出部１１１は、入力部１１から供
給された処理用音声信号Ｌ、処理用音声信号Ｃ、および
処理用音声信号Ｒから、位相差ＣＬ（処理用音声信号Ｃ
の位相に対する処理用音声信号Ｌの位相の位相差）、お
よび位相差ＣＲ（処理用音声信号Ｃの位相に対する処理
用音声信号Ｒの位相の位相差）を算出する。

【０１２２】特徴量算出部１１１はまた、処理用音声信
号Ｌの音圧Ｌと処理用音声信号Ｒの音圧Ｒとの音圧比Ｒ
Ｌ（＝音圧Ｒ／音圧Ｌ）を算出する。

【０１２３】特徴量算出部１１１は、それぞれ算出した
位相差ＣＬおよび位相差ＣＲ、並びに音圧比ＲＬを、検
出部１１２に出力する。

【０１２４】検出部１１２は、特徴量算出部１１１から
の位相差ＣＬおよび位相差ＣＲ、並びに所定の係数（後
述）に基づいて、所定の範囲内で移動する口元（音源）
の位置を検出する。

【０１２５】検出部１１２はまた、検出した口元（音
源）の位置に対応する所定の係数（後述）（正確には、
検出された音源の位置に対応する基準位置に対応する係
数）、および特徴量算出部１１１からの音圧比ＲＬに基
づいて、音源の向きを検出する。

【０１２６】検出部１１２は、検出した口元の位置およ
びその向きを、出力部１４に供給する。

【０１２７】図２９は、特徴量算出部１１１の構成例を
示している。

【０１２８】位相差算出部１２１は、位相差ＣＬ（処理
用音声信号Ｃの位相に対する処理用音声信号Ｌの位相の
位相差）を算出する。

【０１２９】具体的には、位相差算出部１２１は、処理
用音声信号Ｌ，Ｃを、所定のサンプリング周期Ｔでサン
プリングして、量子化する。これにより、処理用音声信
号Ｌからは、Ｎ個のサンプルＬ₁乃至Ｌ_Nが、処理用音声
信号Ｃからは、Ｎ個のサンプルＣ₁乃至Ｃ_Nがそれぞれ得
られる。

【０１３０】位相差算出部１２１は、次に、ｊが１乃至
ｎであるときの式（２）をそれぞれ算出し、その算出結
果の値が最大となるｊの値ｍを検出する。そして位相差
算出部１２１は、検出した値ｍにサンプリング周期Ｔを
乗算し、その乗算結果（時間）を、位相差ＣＬとして、
検出部１１２に出力する。

【数２】

【０１３１】すなわち、処理用音声信号Ｌと処理用音声
信号Ｃとの相関値が、処理用音声信号Ｃに対して、処理
用音声信号Ｌが、ｎ個のサンプル分の時間まで、１サン
プリング時間ずつずらされて算出され、その算出結果に
おいて最も高い相関値が得られたときの時間（値ｍ×サ
ンプリング周期Ｔ）が、位相差ＣＬとされる。

【０１３２】位相差算出部１２２は、位相差ＣＲ（処理
用音声信号Ｃの位相に対する処理用音声信号Ｒの位相の
位相差）を算出する。

【０１３３】具体的には、位相差算出部１２２は、処理
用音声信号Ｃ，Ｒを、所定のサンプリング周期Ｔでサン
プリングして、量子化する。これにより、処理用音声信
号Ｒからは、Ｎ個のサンプルＲ₁乃至Ｒ_Nが、処理用音声
信号Ｃからは、Ｎ個のサンプルＣ₁乃至Ｃ_Nがそれぞれ得
られる。

【０１３４】次に、位相差算出部１２２は、ｊが１乃至
ｎであるときの式（３）をそれぞれ算出し、その算出結
果の値が最大となるｊの値ｍを検出する。そして位相差
算出部１２２は、検出した値ｍにサンプリング周期Ｔを
乗算し、その乗算結果（時間）を、位相差ＣＲとして、
検出部１１２に出力する。

【数３】

【０１３５】すなわち、処理用音声信号Ｒと処理用音声
信号Ｃとの相関値が、処理用音声信号Ｃに対して、処理
用音声信号Ｒが、ｎ個のサンプル分の時間まで、１サン
プリング時間ずつずらされて算出され、その算出結果に
おいて最も高い相関値が得られたときの時間（値ｍ×サ
ンプリング周期Ｔ）が、位相差ＣＲとされる。

【０１３６】音圧算出部１２３は、入力された処理用音
声信号Ｌが示す値の２乗平均値、２乗平均の平方根、ま
たは絶対値の平均値を、処理用音声信号Ｌの音圧Ｌとし
て算出し、その算出結果を、音圧比算出部１２５に供給
する。音圧算出部１２４は、音圧算出部１２３と同様の
方法で、処理用音声信号Ｒの音圧Ｒを算出し、音圧比算
出部１２５に供給する。

【０１３７】音圧比算出部１２５は、音圧算出部１２３
からの音圧Ｌと、音圧算出部１２４からの音圧Ｒに基づ
いて、音圧比ＲＬ（＝音圧Ｒ／音圧Ｌ）を算出し、その
算出結果を、検出部１１２に供給する。

【０１３８】図３０は、検出部１１２の構成例を示して
いる。

【０１３９】位置算出部１３１は、特徴量算出部１１１
（位相差算出部１２１，１２２）からの位相差ＣＬおよ
び位相差ＣＲ、並びに位置係数記憶部１３２に記憶され
ている、係数ａ_L、係数ｂ_L、および係数ｃ_Lからなるxお
よびｙの一次方程式（式（４））、並びに係数ａ_R、係
数ｂ_R、および係数ｃ_Rからなるxおよびｙの一次方程式
（式（５））を解き、座標（ｘ，ｙ）（図２７）を算出
する。ａ_L×ｘ＋ｂ_L×ｙ＋ｃ_L＝位相差CL…（４）ａ_R×ｘ＋ｂ_R×ｙ＋ｃ_R＝位相差CR…（５）

【０１４０】位置算出部１３１は、算出した位置（座標
（ｘ，ｙ））を、向き係数決定部１３３および出力部１
４に供給する。

【０１４１】ところで、マイク１Ｃと口元（音源）の距
離Ｃと、マイク１Ｌと音源の距離Ｌ、およびマイク１Ｒ
と音源の距離Ｒの関係は、式（６）に示すように表すこ
とができる。距離Ｌ−距離Ｃ＝Δ_L 距離Ｒ−距離Ｃ＝Δ_R…（６）

【０１４２】Δ_LおよびΔ_Rは、図３１に示すように、Ｘ
軸、Ｙ軸、および距離の軸からなる座標空間において、
なだらかな曲面で表される。すなわち、音源が、原点か
ら比較的近い範囲内で移動する場合、Δ_LおよびΔ_Rを、
ほぼ平面に近似することができるので、Δ_LおよびΔ
_Rを、式（７）に示すように、ｘおよびｙの一次方程式
で表すことができる。ａ'_L×ｘ＋ｂ'_L×ｙ＋ｃ'_L＝Δ_L ａ'_R×ｘ＋ｂ'_R×ｙ＋ｃ'_R＝Δ_R…（７）

【０１４３】一方、音声は、上述したように、音源から
の距離が長ければ長いほど伝達に時間がかかるので、例
えば、ユーザが、図３２に示すように、正面方向に対し
て左側を向いているとき、距離Ｃは、距離Ｌより長くな
るので、マイク１Ｃには、マイク１Ｌに比べ音源からの
音声が遅れて到達する。

【０１４４】また、遅れて到達した音声の位相は、先に
到達した音声の位相に比べ遅れるので、すなわち、先に
到達した音声の位相は、後に到達した音声の位相に比べ
進むので、例えば、図３２の例の場合、処理用音声信号
Ｌの位相は、図３３（Ａ）に示すように、図３３（Ｂ）
に示す処理用音声信号Ｃの位相より進む。このときの位
相のずれが、位相差ＣＬである。

【０１４５】一方、距離Ｃが距離Ｒより長い場合、音源
からの音声は、マイク１Ｃよりマイク１Ｒに先に到達す
るので、処理用音声信号Ｒの位相は、図３３（Ｃ）に示
すように、処理用音声信号Ｃの位相より進む。このとき
の位相のずれが、位相差ＣＲである。

【０１４６】このように、位相差ＣＬおよび位相差ＣＲ
は、上述したように、距離Ｌ、距離Ｃ、および距離Ｒに
対応する。すなわち、位相差ＣＬおよび位相差ＣＲは、
音源が原点から比較的近い範囲内で移動し、Δ_Lおよび
Δ_Rを、平面に近似することができる場合、Δ_LおよびΔ
_Rに対応するので、位相差ＣＬおよび位相差ＣＲは、上
述した式（４）および式（５）に示すように、ｘおよび
ｙの一次方程式で表すことができる。

【０１４７】このシステムでは、所定の範囲内で移動す
る音源の位置および向きが検出されるが、所定の範囲と
は、Δ_LおよびΔＲを、平面に近似することができる範
囲内、すなわち、式（７）が成り立つ範囲を意味する。

【０１４８】位置係数記憶部１３２に記憶されている係
数ａ_L、係数ｂ_L、係数ｃ_L、係数ａ_R、係数ｂ_R、および
係数ｃ_Rは、次に説明するように、それら係数に関する
連立一次方程式を、最小自乗法を用いて解くことで求め
られる。

【０１４９】口元（音源）を、所定の複数の位置（座標
（ｘ_k，ｙ_k）（ｋ＝１，２，…Ｋ）で特定されるＫ箇所
の位置）に移動させ、各位置にあるときの音源から発せ
られた音声を集音し、位相差ＣＬ_kおよび位相差ＣＲ_kを
算出する実験を行うことで、式（８）および式（９）に
示すように、それぞれＫ個の、ｘおよびｙの一次方程式
が求められる。

【数４】

【数５】

【０１５０】式（８）は、式（１０）そしてさらに式
（１１）に示すように展開することで解くことができ
る。これにより、係数ａ_L、係数ｂ_L、および係数ｃ_Lが
求められる。式（９）も、式（１２）そしてさらに式
（１３）に示すように展開することで解くことができ
る。これにより、係数ａ_R、係数ｂ_R、および係数ｃ_Rが
求められる。

【数６】

【数７】

【数８】

【数９】

【０１５１】なお、式（１１）および式（１３）中、”
＋”が上付された行列は、擬似逆行列である。

【０１５２】図３０に戻り、向き係数決定部１３３は、
位置算出部１３１から供給された座標（ｘ，ｙ）に対応
する基準位置（後述）を検出する。

【０１５３】向き係数決定部１３３はまた、Ｐ個の基準
位置ｐ（ｐ＝１，２，…Ｐ）のそれぞれに対応する係数
α_p、係数β_p、係数γ_p、および係数δ_pを記憶してお
り、記憶しているそれらの係数から、検出した基準位置
に対応する、係数α、係数β、係数γ、および係数δを
選択し、向き算出部１３４に供給する。

【０１５４】向き算出部１３４は、向き係数決定部１３
３からの係数α、係数β_、係数γ、および係数δ、並び
に特徴量算出部１１１からの音圧比ＲＬに基づいて、式
（１４）に示すθの３次方程式を解いてθを算出し、出
力部１４に供給する。

【数１０】

【０１５５】ところで、音圧比ＲＬは、音源の位置およ
び向きにより異なる。例えば、図３４に示すように、音
源が、座標（ｘ_p，ｙ_p）（ｐ＝１，２，…９）で特定さ
れる基準位置ｐにあるときに発せられた音声による音圧
比ＲＬは、それぞれ異なり、また向きによっても異な
る。

【０１５６】図３５（Ａ）は、基準位置ｐ（＝４）に位
置し、角度θ_L乃至角度θ_Rの方向を向いているときの音
源から発生された音声による音圧比ＲＬ₄を表してい
る。図３５（Ｂ）は、基準位置ｐ（＝５）に位置し、角
度θ_L乃至角度θ_Rの方向を向いているときの音源から発
生された音声による音圧比ＲＬ₅を表している。図３５
（Ｃ）は、基準位置ｐ（＝６）に位置し、角度θ_L乃至
角度θ_Rの方向を向いているときの音源から発生された
音声による音圧比ＲＬ₆を表している。

【０１５７】図３５（Ａ）乃至（Ｃ）に示す軌跡から、
音圧比ＲＬは、式（１４）に示すように、角度θの３次
式で近似される。

【０１５８】向き係数決定部１３３に記憶されている、
Ｐ個の基準位置ｐのそれぞれに対応する係数α_p、係数
β_p、係数γ_p、および係数δ_pは、次に説明するように
して求められる。

【０１５９】音源の位置および向きにより音圧比ＲＬが
異なるので、音源が基準位置ｐに位置し、所定の方向
（角度θ_q（ｑ＝１，２，…Ｑ）の方向）を向いている
ときの音源から発せられる音声の音圧比ＲＬ_pqを求める
ことで、基準位置１乃至基準位置Ｐ毎に、Ｑ個の、θの
３次元方程式が求められる。

【０１６０】例えば、基準位置１に位置する音源が、そ
れぞれ角度θ₁乃至θ_Qの方向を向いているときに発した
音声から、音圧比ＲＬ₁₁乃至ＲＬ_1Qを求めることで、式
（１５）に示すような、Ｑ個の、θの３次元方程式が求
められる。

【数１１】

【０１６１】同様にして、基準位置２乃至基準位置Ｐに
ついても、それぞれＱ個の、θの３次元方程式が得ら
れ、これらを、ニュートン法やシンプレックス法などに
よる非線形最小自乗法により解くことで、基準位置１乃
至基準位置Ｐ毎に、係数α、係数β、係数γ、および係
数δが求められる。

【０１６２】次に、検出装置１０１の動作を、図３６の
フローチャートを参照して説明する。

【０１６３】ステップＳ６１において、検出装置１０１
の入力部１１は、入力したマイクアンプ２Ｌ，２Ｃ，２
Ｒのそれぞれからの処理用音声信号Ｌ，Ｃ，Ｒの一部
（所定の時間内に入力した部分）を、特徴量算出部１１
１に供給する。

【０１６４】次に、ステップＳ６２において、特徴量算
出部１１１（位相差算出部１２１，１２２）は、入力部
１１から供給された処理用音声信号Ｃ，Ｌから、位相差
ＣＬを算出するとともに、処理用音声信号Ｃ，Ｒから、
位相差ＣＲを算出する。算出された位相差ＣＬおよび位
相差ＣＲは、検出部１１２に供給される。

【０１６５】ステップＳ６３において、特徴量算出部１
１１（音圧算出部１２３，１２４、音圧比算出部１２
５）は、処理用音声信号Ｌ，Ｒの音圧Ｌ，Ｒをそれぞれ
算出するとともに、音圧比ＲＬ（＝音圧Ｒ／音圧Ｌ）を
算出する。算出された音圧比ＲＬは、検出部１１２に供
給される。

【０１６６】次に、ステップＳ６４において、検出部１
１２（位置算出部１３１）は、特徴量算出部１１１から
供給された位相差ＣＬ、並びに自分自身（位置係数記憶
部１３２）が記憶する係数ａ_L、係数ｂ_L、および係数ｃ
_Lからなる式（４）と、位相差ＣＲ、並びに係数ａ_R、係
数ｂ_R、および係数ｃ_Rからなる式（５）の連立方程式を
解き、ｘおよびｙを算出する。算出された座標（ｘ，
ｙ）は、出力部１４に供給される。

【０１６７】ステップＳ６５において、検出部１１２
（向き係数決定部１３３）は、算出した座標（ｘ，ｙ）
で特定される位置に最も近い基準位置を検出する。

【０１６８】次に、ステップＳ６６において、検出部１
１２（向き係数決定部１３３）は、記憶している、Ｐ個
の基準位置ｐのそれぞれに対応する係数α_p、係数β_p、
係数γ_p、および係数δ_pから、決定した基準位置に対応
する、係数α、係数β、係数γ、および係数δを選択す
る。

【０１６９】ステップＳ６７において、検出部１１２
（向き算出部１３４）は、特徴量算出部１１１からの音
圧比ＲＬ、並びにステップＳ６６で選択した係数α、係
数β、係数γ、および係数δからなる式（１４）を解
き、角度θを算出する。算出された角度θは、出力部１
４に供給される。

【０１７０】次に、ステップＳ６８において、出力部１
４は、検出部１１２から供給された座標（ｘ，ｙ）を、
口元（音源）の位置として、そして角度θを、音源の向
きとして外部の装置に出力する。

【０１７１】その後、処理は終了する。

【０１７２】なお、以上においては、検出部１１２にお
いて、算出された座標（ｘ，ｙ）に対応する基準位置が
検出されるとともに、記憶されている、それぞれＰ個の
係数α_p、係数β_p、係数γ_p、および係数δ_pのうちか
ら、検出された基準位置に対応する係数α、係数β、係
数γ、および係数δが選択されたが、検出部１１２が、
式（１６）乃至式（１９）に示すように、係数αが算出
されるｘ，ｙの関数ｅ、係数βが算出されるｘ，ｙの関
数ｆ、係数γが算出されるｘ，ｙの関数ｇ、および係数
δが算出されるｘ，ｙの関数ｈを記憶し、検出された座
標（ｘ，ｙ）でそれらの関数を演算することで、係数
α、係数β、係数γ、および係数δのそれぞれを算出す
ることもできる。 α＝ｅ（ｘ，ｙ）…（１６） β＝ｆ（ｘ，ｙ）…（１７） γ＝ｇ（ｘ，ｙ）…（１８） δ＝ｈ（ｘ，ｙ）…（１９）

【０１７３】この場合の検出装置１０１の動作を、図３
７のフローチャートを参照して説明する。

【０１７４】ステップＳ７１乃至ステップＳ７４、およ
びステップＳ７７においては、図３６のステップＳ６１
乃至ステップＳ６４、およびステップＳ６８における場
合と同様の処理が行われるので、その説明は省略する。

【０１７５】ステップＳ７５において、検出装置１０１
の検出部１１２は、関数ｅ（式（１６））、関数ｆ（式
（１７））、関数ｇ（式（１８））、および関数ｈ（式
（１９））をそれぞれ演算し、係数α、係数β、係数
γ、および係数δを算出する。

【０１７６】次に、ステップＳ７６において、検出部１
１２は、特徴量算出部１１１からの音圧比ＲＬ、並びに
ステップＳ７５で算出した係数α、係数β、係数γ、お
よび係数δで、式（１４）を演算し、角度θを算出す
る。

【０１７７】また、以上においては、特徴量算出部１１
１は、処理用音声信号Ｌ，Ｒから直接音圧Ｌ，Ｒを算出
し、そして音圧比ＲＬを算出する場合を例として説明し
たが、処理用音声信号Ｌ，Ｒの高周波部分の信号（高周
波処理用音声信号Ｌh，Ｒh）の音圧Ｌh，Ｒhを算出し、
それらの音圧比ＲＬhを算出することができる。

【０１７８】この例の場合における特徴量算出部１１１
の構成例を、図３８に示す。この特徴量算出部には、図
２９の特徴量算出部１１１の音圧算出部１２３および音
圧算出部１２４の前段に、ハイパスフィルタ１４１およ
びハイパスフィルタ１４２が設けられている。

【０１７９】ハイパスフィルタ１４１は、入力部１１か
ら供給された処理用音声信号Ｌの高周波部分のみを通過
させて、音圧算出部１２３に供給する。ハイパスフィル
タ１４２は、入力部１１から供給された処理用音声信号
Ｒの高周波部分のみを通過させて、音圧算出部１２４に
供給する。

【０１８０】音圧算出部１２３は、高周波処理用音声信
号Ｌhの音圧Ｌhを算出し、音圧比算出部１２５に供給す
る。音圧算出部１２４は、高周波処理用音声信号Ｒhの
音圧Ｒhを算出し、音圧比算出部１２５に供給する。

【０１８１】音圧比算出部１２５は、音圧比ＲＬhを算
出し、検出部１１２に供給する。

【０１８２】図３９は、本発明を適用した音源状態検出
システムの第５の実施の形態の構成例を示している。こ
のシステムでは、第４の実施の形態における場合と同様
に、所定の範囲内で移動する音源の位置およびその向き
の両方が検出されるが、この例の場合、３次元空間上の
位置および向きが検出される。

【０１８３】このシステムには、図１に示す検出装置３
に代えて、検出装置２０１が設けられている他、４個の
マイク１―１乃至マイク１−４、および４個のマイクア
ンプ２−１乃至２−４が設けられている。

【０１８４】マイク１−１乃至マイク１−４は、図４０
に示すような、それぞれ直交するＸ軸、Ｙ軸、およびＺ
軸からなる３次元空間上に一定の広がりを持って配置さ
れている。なお、図４０中の原点、Ｘ軸、およびＹ軸
は、図２７の原点、Ｘ軸、およびＹ軸に対応するもので
ある。すなわち、図４０に示すＺ軸は、図２７において
は、ユーザから見れば、原点から垂直方向に延びる軸で
ある。

【０１８５】図３９に戻り、マイク１−１乃至マイク１
−４は、音源からの音声（ユーザが発した音声）を集音
し、音声信号として、マイクアンプ２−１乃至２−４に
供給する。

【０１８６】マイクアンプ２−１乃至２−４は、マイク
１−１乃至１−４からの音声信号を増幅し、処理用音声
信号Ｓ１乃至Ｓ４として、検出装置２０１に供給する。

【０１８７】検出装置２０１は、音源（口元）の位置に
対応する、図４０の３次元空間における座標（ｘ，ｙ，
ｚ）を検出するとともに、口元の向きに対応する、Ｚ軸
の回りの角度θ、Ｙ軸の回りの角度φ、およびＸ軸の回
りの角度ψのそれぞれを検出する。

【０１８８】図４１は、検出装置２０１の構成例を示し
ている。この検出装置２０１には、図４の検出装置３の
特徴量算出部１２に代えて特徴量算出部２１１が、また
検出部１３に代えて、検出部２１２が設けられている。

【０１８９】入力部１１は、マイクアンプ２−１乃至２
−４のそれぞれから適宜供給される処理用音声信号Ｓ１
乃至Ｓ４を入力し、特徴量算出部２１１に供給する。

【０１９０】特徴量算出部２１１は、処理用音声信号Ｓ
１の位相と処理用音声信号Ｓ２の位相との差（以下、位
相差Ａ１と称する）、処理用音声信号Ｓ２の位相と処理
用音声信号Ｓ３の位相との差（以下、位相差Ａ２と称す
る）、および処理用音声信号Ｓ３の位相と処理用音声信
号Ｓ４の位相との差（以下、位相差Ａ３と称する）を、
それぞれ算出する。

【０１９１】特徴量算出部２１１はまた、処理用音声信
号Ｓ１乃至Ｓ４の音圧をそれぞれ算出するとともに、処
理用音声信号Ｓ１の音圧と処理用音声信号Ｓ２の音圧の
比（以下、音圧比Ｂ１と称する）、処理用音声信号Ｓ２
の音圧と処理用音声信号Ｓ３の音圧の比（以下、音圧比
Ｂ２と称する）、処理用音声信号Ｓ３の音圧と処理用音
声信号Ｓ４の音圧の比（以下、音圧比Ｂ３と称する）
を、それぞれ算出する。

【０１９２】特徴量算出部２１１は、算出した位相差Ａ
１乃至位相差Ａ３、および音圧比Ｂ１乃至音圧比Ｂ３
を、検出部２１２に出力する。

【０１９３】検出部２１２は、特徴量算出部２１１から
の位相差Ａ１乃至位相差Ａ３、および所定の係数（後
述）に基づいて、口元（音源）の位置を表す座標（ｘ，
ｙ，ｚ）を算出する。

【０１９４】検出部２１２はまた、予め求められた、所
定の位置、所定の向き、並びにその位置およびその向き
の音源から発せられた音声の音圧比Ｂ１乃至Ｂ３の対応
関係を表すデータから、算出した音圧比Ｂ１乃至Ｂ３お
よび算出した音源の位置（座標）に対応する向きを、こ
のときの音源の向きとして検出する。

【０１９５】図４２は、特徴量算出部２１１の構成例を
示している。

【０１９６】位相差算出部２２１は、位相差Ａ１を算出
し、検出部２１２に供給する。位相差算出部２２２は、
位相差Ａ２を算出し、検出部２１２に供給する。位相差
算出部２２３は、位相差Ａ３を算出し、検出部２１２に
供給する。

【０１９７】音圧算出部２２４は、処理用音声信号Ｓ１
の音圧を算出し、音圧比算出部２２８に供給する。音圧
算出部２２５は、処理用音声信号Ｓ２の音圧を算出し、
音圧比算出部２２８および音圧比算出部２２９に供給す
る。

【０１９８】音圧算出部２２６は、処理用音声信号Ｓ３
の音圧を算出し、音圧比算出部２２９および音圧比算出
部２３０に供給する。音圧算出部２２７は、処理用音声
信号Ｓ４の音圧を算出し、音圧比算出部２３０に供給す
る。

【０１９９】音圧比算出部２２８は、音圧比Ｂ１を算出
し、検出部２１２に供給する。音圧比算出部２２９は、
音圧比Ｂ２を算出し、検出部２１２に供給する。音圧比
算出部２３０は、音圧比Ｂ３を算出し、検出部２１２に
供給する。

【０２００】図４３は、検出部２１２の構成例を示して
いる。

【０２０１】位置算出部２４１には、特徴量算出部２１
１（位相差算出部２２１乃至位相差算出部２２３）から
の位相差Ａ１乃至位相差Ａ３、並びに位置係数記憶部２
４２に記憶されている係数ａ_1、係数ｂ₁、係数ｃ₁、およ
び係数ｄ₁、係数ａ_2、係数ｂ₂、係数ｃ₂、および係数
ｄ₂、並びに係数ａ_3、係数ｂ₃、係数ｃ₃、および係数ｄ₃
が供給される。

【０２０２】位置算出部２４１は、係数ａ_1、係数ｂ₁、
係数ｃ₁、および係数ｄ₁、並びに位相差Ａ１からなる
ｘ，ｙ，ｚの１次方程式（式（２０））、係数ａ_2、係数
ｂ₂、係数ｃ₂、および係数ｄ₂、並びに位相差Ａ２から
なるｘ，ｙ，ｚの１次方程式（式（２１））、そして係
数ａ_3、係数ｂ₃、係数ｃ₃、および係数ｄ₃、並びに位相
差Ａ３からなるｘ，ｙ，ｚの１次方程式（式（２２））
の連立方程式を演算し、ｘ，ｙ，ｚを算出する。ａ₁×ｘ＋ｂ₁×ｙ＋ｃ₁×ｚ＋ｄ₁＝位相差Ａ１…（２０）ａ₂×ｘ＋ｂ₂×ｙ＋ｃ₂×ｚ＋ｄ₂＝位相差Ａ２…（２１）ａ₃×ｘ＋ｂ₃×ｙ＋ｃ₃×ｚ＋ｄ₃＝位相差Ａ３…（２２）

【０２０３】位置算出部２４１は、算出した座標（ｘ，
ｙ，ｚ）（音源の位置）を、向き検出部２４３および出
力部１４に供給する。

【０２０４】位置係数記憶部２４２が記憶する、係数ａ
₁乃至ｄ₁、係数ａ₂乃至ｄ₂、および係数ａ₃乃至ｄ₃は、
基本的には、第４の実施の形態における係数ａ_L乃至ｃ_L
および係数ａ_R乃至ｃ_Rを算出する場合と同様にして求め
られる。

【０２０５】すなわち、口元（音源）を、所定の複数の
位置（座標（ｘ_k，ｙ_k，ｚ_k））に移動させ、各位置に
あるときの音源から発せられた音声を集音し、位相差Ａ
１_K、位相差Ａ２_k、および位相差Ａ３_kを算出する実験
を行うことで、式（２３）乃至式（２５）に示すような
連立方程式が求められる。

【数１２】

【数１３】

【数１４】

【０２０６】式（２３）乃至式（２５）を、最小自乗法
により解くことで、係数ａ₁乃至ｄ₁、係数ａ₂乃至ｄ₂、
および係数ａ₃乃至ｄ₃のそれぞれが求められる。

【０２０７】向き検出部２４３は、図４４に示すよう
な、予め求められた、所定の位置（座標（ｘ，ｙ，
ｚ））、所定の向き（角度θ，φ，ψ）、並びにその位
置およびその向きの音源から発せられた音声の音圧比Ｂ
１，Ｂ２，Ｂ３の対応関係を表す対応表を記憶してい
る。すなわち、向き検出部２４３は、位置算出部２４１
からの座標（ｘ，ｙ，ｚ）および特徴量算出部２１１か
らの音圧比Ｂ１，Ｂ２，Ｂ３に基づいて、それらに対応
する角度θ，φ，ψを、音源の向きとして検出し、出力
部１４に出力する。

【０２０８】この例の場合の検出装置２０１の動作を、
図４５のフローチャートを参照して説明する。

【０２０９】ステップＳ８１において、検出装置２０１
の入力部１１は、入力したマイクアンプ２−１乃至２−
４のそれぞれからの処理用音声信号Ｓ１乃至Ｓ４の一部
（所定の時間内に入力した部分）を、特徴量算出部２１
１に供給する。

【０２１０】次に、ステップＳ８２において、特徴量算
出部２１１（位相差算出部２２１乃至２２３）は、マイ
クアンプ２―１乃至２−４から供給された処理用音声信
号Ｓ１乃至Ｓ４から、処理用音声信号Ｓ１の位相と処理
用音声信号Ｓ２の位相との位相差Ａ１、処理用音声信号
Ｓ２の位相と処理用音声信号Ｓ３の位相との位相差Ａ
２、および処理用音声信号Ｓ３の位相と処理用音声信号
Ｓ４の位相との位相差Ａ３をそれぞれ算出する。算出さ
れた位相差Ａ１乃至位相差Ａ３は、検出部２１２に供給
される。

【０２１１】ステップＳ８３において、特徴量算出部２
１１（音圧算出部２２４乃至２２７、音圧比算出部２２
８乃至２３０）は、処理用音声信号Ｓ１，Ｓ２，Ｓ３，
Ｓ４の音圧を算出するとともに、処理用音声信号Ｓ１，
Ｓ２の音圧から、音圧比Ｂ１を、処理用音声信号Ｓ２，
Ｓ３の音圧から、音圧比Ｂ２を、そして処理用音声信号
Ｓ３，Ｓ４の音圧から、音圧比Ｂ３を、それぞれ算出す
る。算出された音圧比Ｂ１乃至音圧比Ｂ３は、検出部２
１２に供給される。

【０２１２】次に、ステップＳ８４において、検出部２
１２（位置算出部２４１）は、特徴量算出部２１１から
供給された位相差Ａ１乃至位相差Ａ３、並びに自分自身
（位置係数記憶部２４２）が記憶する係数ａ₁乃至ｄ₁、
係数ａ₂乃至ｄ₂、および係数ａ₃乃至ｄ₃の式（２０）乃
至式（２２）からなる連立方程式を解き、ｘ、ｙ、およ
びｚを算出する。算出された座標（ｘ，ｙ，ｚ）は、出
力部１４に供給される。

【０２１３】ステップＳ８５において、検出部２１２
（向き検出部２４３）は、図４４の対応表から、算出さ
れた座標（ｘ，ｙ，ｚ）に最も近い座標および算出され
た音圧比Ｂ１，Ｂ２，Ｂ３に最も近い音圧比を検出する
とともに、それらに対応する角度θ，φ，角度ψを検出
する。検出された角度θ、角度φ、および角度ψは、出
力部１４に供給される。

【０２１４】ステップＳ８６において、出力部１４は、
検出部２１２から供給された座標（ｘ，ｙ，ｚ）を、口
元（音源）の位置として、並びに角度θ、角度φ、およ
び角度ψを、口元の向きとして、外部の装置に出力す
る。

【０２１５】その後、処理は終了する。

【０２１６】なお、以上においては、特徴量算出部２１
１は、処理用音声信号Ｓ１乃至Ｓ４から直接音圧を算出
し、そして音圧比Ｂ１乃至Ｂ３を算出する場合を例とし
て説明したが、処理用音声信号Ｓ１乃至Ｓ４の高周波部
分の信号（高周波処理用音声信号Ｓ１h乃至Ｓ４h）の音
圧を算出し、それらの音圧比Ｂ１h乃至Ｂ３hを算出する
こともできる。高周波部分の信号の音圧比は、音源との
距離に応じても変化するが、指向性があることから、そ
れを利用することで、より正確に音源の向きを検出する
ことができる。特に有効である。

【０２１７】この例の場合における特徴量算出部２１１
の構成例を、図４６に示す。この特徴量算出部２１１に
は、図４２の特徴量算出部２１１の音圧算出部２２４乃
至２２７の前段に、ハイパスフィルタ２５１乃至２５４
が設けられている。

【０２１８】ハイパスフィルタ２５１は、入力部１１か
ら供給された処理用音声信号Ｓ１の高周波部分のみを通
過させて、音圧算出部２２４に供給する。ハイパスフィ
ルタ２５２は、入力部１１から供給された処理用音声信
号Ｓ２の高周波部分のみを通過させて、音圧算出部２２
５に供給する。

【０２１９】ハイパスフィルタ２５３は、入力部１１か
ら供給された処理用音声信号Ｓ３の高周波部分のみを通
過させて、音圧算出部２２６に供給する。ハイパスフィ
ルタ２５４は、入力部１１から供給された処理用音声信
号Ｓ４の高周波部分のみを通過させて、音圧算出部２２
７に供給する。

【０２２０】音圧算出部２２４は、高周波処理用音声信
号Ｓ１hの音圧を算出し、音圧比算出部２２８に供給す
る。音圧算出部２２５は、高周波処理用音声信号Ｓ２h
の音圧を算出し、音圧比算出部２２８および音圧比算出
部２２９に供給する。

【０２２１】音圧算出部２２６は、高周波処理用音声信
号Ｓ３hの音圧を算出し、音圧比算出部２２９および音
圧比算出部２３０に供給する。音圧算出部２２７は、高
周波処理用音声信号Ｓ４hの音圧を算出し、音圧比算出
部２３０に供給する。

【０２２２】音圧比算出部２２８は、高周波処理用音声
信号Ｓ１hの音圧と高周波処理用音声信号Ｓ２hの音圧と
の音圧比Ｂ１を算出し、検出部２１２に供給する。音圧
比算出部２２９は、高周波処理用音声信号Ｓ２hの音圧
と高周波処理用音声信号Ｓ３hの音圧との音圧比Ｂ２を
算出し、検出部２１２に供給する。音圧比算出部２３０
は、高周波処理用音声信号Ｓ３hの音圧と高周波処理用
音声信号Ｓ４hの音圧との音圧比Ｂ３を算出し、検出部
２１２に供給する。

【０２２３】なお、以上においては、音源（口元）の状
態（位置、または向き）を検出するタイミングについて
は、言及しなかったが、検出装置３，３１，６１，１０
１，２０１に、操作部を設け、その操作部が操作された
とき、音源の状態が検出されるようにしたり、また所定
の周期で、所定の期間継続して検出されるようにしたり
することができる。

【０２２４】また、以上においては、第１の実施の形態
乃至第５の実施の形態について、それぞれ別個に説明し
たが、それらを組み合わせて、ユーザの状態を検出する
ようにすることもできる。例えば、第４の実施の形態お
よび第５の実施の形態においては、音源の位置および向
きの両方を算出する場合を例として説明したが、音源の
位置のみを検出することもできる。

【０２２５】また、第４の実施の形態および第５の実施
の形態において、処理用音声信号から直接音圧を算出
し、その音圧で音圧比を算出する場合と、高周波処理用
音声信号の音圧を算出し、その音圧で音圧比を算出する
場合を別個に説明したが、それらを組み合わせて利用す
ることもできる。

【０２２６】上述した一連の処理は、ハードウエアによ
り実現させることもできるが、ソフトウエアにより実現
させることもできる。一連の処理をソフトウエアにより
実現する場合には、そのソフトウエアを構成するプログ
ラムがコンピュータにインストールされ、そのプログラ
ムがコンピュータで実行されることより、上述した検出
装置３，３１，６１，１０１，２０１が機能的に実現さ
れる。

【０２２７】図４７は、上述のような検出装置３，３
１，６１，１０１，１０２として機能するコンピュータ
５０１の一実施の形態の構成を示すブロック図である。
CPU（Central Processing Unit）５１１にはバス５１５
を介して入出力インタフェース５１６が接続されてお
り、CPU５１１は、入出力インタフェース５１６を介し
て、ユーザから、キーボード、マウスなどよりなる入力
部５１８から指令が入力されると、例えば、ROM（Read
Only Memory）５１２、ハードディスク５１４、または
ドライブ５２０に装着される磁気ディスク５３１、光デ
ィスク５３２、光磁気ディスク５３３、若しくは半導体
メモリ５３４などの記録媒体に格納されているプログラ
ムを、RAM（Random Access Memory）５１３にロードし
て実行する。これにより、上述した各種の処理が行われ
る。さらに、CPU５１１は、その処理結果を、例えば、
入出力インタフェース５１６を介して、LCD（Liquid Cr
ystalDisplay）などよりなる表示部５１７に必要に応じ
て出力する。なお、プログラムは、ハードディスク５１
４やROM５１２に予め記憶しておき、コンピュータ５０
１と一体的にユーザに提供したり、磁気ディスク５３
１、光ディスク５３２、光磁気ディスク５３３，半導体
メモリ５３４等のパッケージメディアとして提供した
り、衛星、ネットワーク等から通信部５１９を介してハ
ードディスク５１４に提供することができる。

【０２２８】なお、本明細書において、記録媒体により
提供されるプログラムを記述するステップは、記載され
た順序に沿って時系列的に行われる処理はもちろん、必
ずしも時系列的に処理されなくとも、並列的あるいは個
別に実行される処理をも含むものである。

【０２２９】また、本明細書において、システムとは、
複数の装置により構成される装置全体を表すものであ
る。

【０２３０】

【発明の効果】本発明の情報処理装置および方法、並び
に第１のプログラムによれば、所定の位置に設置された
複数の集音装置により集音された、所定の音源が発した
音声に対応する音声信号から、音源の状態に対応する特
徴量を算出し、算出された特徴量に基づいて、音源の状
態を検出するようにしたので、音源が発した音声から、
音源の状態を検出することができる。

【０２３１】本発明の情報生成装置および方法、並びに
第２のプログラムによれば、第１の集音装置、第２の集
音装置、および第３の集音装置のそれぞれにより集音さ
れた、所定の範囲内に設けられた複数の実験位置に位置
した音源が発した音声に対応する第４の音声信号、第５
の音声信号、および第６の音声信号から、第４の音声信
号の位相と第５の音声信号の位相との第３の位相差、お
よび第４の音声信号の位相と第６の音声信号との第４の
位相差を、実験位置毎に算出するようにしたので、第３
の位相差と実験位置との関係に基づいて、第１の係数を
算出し、第４の位相差と実験位置との関係に基づいて、
第２の係数が算出することができる。

【図面の簡単な説明】

【図１】本発明を適用した音源状態検出システムの第１
の実施の形態の構成例を示すブロック図である。

【図２】マイク１の設置位置を示す図である。

【図３】音圧比ＲＬと音源の向きとの対応関係を示す図
である。

【図４】図１の検出装置３の構成例を示すブロック図で
ある。

【図５】図４の特徴量算出部１２の構成例を示すブロッ
ク図である。

【図６】音源状態検出システムの動作を説明するフロー
チャートである。

【図７】図６のステップＳ３の処理の詳細を説明するフ
ローチャートである。

【図８】本発明を適用した音源状態検出システムの第２
の実施の形態の構成例を示すブロック図である。

【図９】マイク１の設置位置を示す他の図である。

【図１０】音圧比ＲＬhと音源の向きとの対応関係を示
す図である。

【図１１】図８の検出装置３１の構成例を示すブロック
図である。

【図１２】図１１の特徴量算出部４１の構成例を示すブ
ロック図である。

【図１３】カットオフ特性を示す図である。

【図１４】ピッチ周波数を説明する図である。

【図１５】音源状態検出システムの他の動作を説明する
フローチャートである。

【図１６】図１５のステップＳ２３の処理の詳細を説明
するフローチャートである。

【図１７】本発明を適用した音源状態検出システムの第
３の実施の形態の構成例を示すブロック図である。

【図１８】位相差と顔の向きとの対応関係を示す図であ
る。

【図１９】位相差を説明する図である。

【図２０】位相差を説明する他の図である。

【図２１】位相差を説明する他の図である。

【図２２】図１７の検出装置６１の構成例を示すブロッ
ク図である。

【図２３】音源状態検出システムの他の動作を説明する
フローチャートである。

【図２４】図２３のステップＳ４３の処理の詳細を説明
するフローチャートである。

【図２５】本発明を適用した音源状態検出システムの第
４の実施の形態の構成例を示すブロック図である。

【図２６】マイク１の配置位置を説明する図である。

【図２７】位置および向きを説明する図である。

【図２８】図２５の検出装置１０１の構成例を示すブロ
ック図である。

【図２９】図２８の特徴量算出部１１１の構成例を示す
ブロック図である。

【図３０】図２８の検出部１１２の構成例を示すブロッ
ク図である。

【図３１】ΔＬおよびΔＲを説明する図である。

【図３２】距離Ｃおよび距離Ｌを説明する図である。

【図３３】位相差ＣＬおよび位相差ＣＲを説明する図で
ある。

【図３４】基準位置ｐを説明する図である。

【図３５】音圧比ＲＬを説明する図である。

【図３６】検出装置１０１の動作を説明するフローチャ
ートである。

【図３７】検出装置１０１の他の動作を説明するフロー
チャートである。

【図３８】特徴量算出部１１１の他の構成例を示すブロ
ック図である。

【図３９】本発明を適用した音源状態検出システムの第
５の実施の形態の構成例を示すブロック図である。

【図４０】位置および向きを説明する他の図である。

【図４１】図３９の検出装置２０１の構成例を示すブロ
ック図である。

【図４２】図４１の特徴量算出部２１１の構成例を示す
ブロック図である。

【図４３】図４１の検出部２１２の構成例を示すブロッ
ク図である。

【図４４】座標、音圧比、および角度の対応関係を示す
対応表の例を示す図である。

【図４５】検出装置２０２の動作を説明するフローチャ
ートである。

【図４６】特徴量算出部２１１の他の構成例を示すブロ
ック図である。

【図４７】パーソナルコンピュータ５０１の構成例を示
すブロック図である。

【符号の説明】１マイクロフォン，２マイクアンプ，３検出
装置，１１入力部，１２特徴量算出部，１３
検出部，１４出力部，２１音圧算出部，２
２音圧比算出部，３１検出装置，４１特徴量
算出部，４２検出部，５１ハイパスフィルタ，
６１検出装置，７１特徴量算出部，７２検出
部，１０１検出装置，１１１特徴量算出部，
１１２検出部，１２１位相差算出部，１２２位
相差算出部，１２３音圧算出部，１２４音圧算
出部，１２５音圧比算出部，１３１位置算出
部，１３２位置係数記憶部，１３３向き係数決
定部，１３４向き算出部，１４１ハイパスフィ
ルタ，１４２ハイパスフィルタ，２０１検出装
置，２１１特徴量算出部，２１２検出部，２
２１位相差算出部，２２２位相差算出部，２２
３位相差算出部，２２４音圧算出部，２２５
音圧算出部，２２６音圧算出部，２２７音圧算
出部，２２８音圧比算出部，２２９音圧比算出
部，２３０音圧比算出部，２４１位置算出部，
２４２位置係数記憶部，２４３向き検出部，
２５１ハイパスフィルタ，２５２ハイパスフィル
タ，２５３ハイパスフィルタ，２５４ハイパス
フィルタ

───────────────────────────────────────────────────── フロントページの続き (72)発明者藤島幸一東京都品川区北品川６丁目７番35号ソニー株式会社内 (72)発明者大月知之東京都品川区北品川６丁目７番35号ソニー株式会社内Ｆターム(参考） 5D018 BB23 5D020 BB04

Claims

【特許請求の範囲】

【請求項１】所定の位置に設置された複数の集音装置
により集音された、所定の音源が発した音声に対応する
音声信号から、前記音源の状態に対応する特徴量を算出
する第１の算出手段と、前記第１の算出手段により算出された前記特徴量に基づ
いて、前記音源の状態を検出する状態検出手段とを備え
ることを特徴とする情報処理装置。
【請求項２】前記状態は、所定の位置にある前記音源
の向きであることを特徴とする請求項１の情報処理装
置。
【請求項３】前記状態検出手段は、予め求められた、
前記特徴量と前記状態との対応関係を示す対応関係デー
タを保持し、前記対応関係データおよび前記特徴量に基
づいて、前記状態を検出することを特徴とする請求項１
に記載の情報処理装置。
【請求項４】前記第１の算出手段は、第１の前記集音
装置により集音された、前記音源が発した音声に対応す
る第１の前記音声信号、および第２の前記集音装置によ
り集音された、前記音源が発した音声に対応する第２の
前記音声信号から、前記第１の音声信号の音圧と前記第
２の音声信号の音圧との音圧比を、前記特徴量として算
出し、前記状態検出手段は、予め求められた、前記音圧比と前
記状態との対応関係を示す前記対応関係データを保持
し、前記対応関係データおよび前記音圧比に基づいて、
前記状態を検出することを特徴とする請求項３に記載の
情報処理装置。
【請求項５】前記第１の算出手段は、第１の前記集音
装置により集音された、前記音源が発した音声に対応す
る第１の前記音声信号、および第２の前記集音装置によ
り集音された、前記音源が発した音声に対応する第２の
前記音声信号から、前記第１の音声信号の高周波部分か
らなる第１の高周波音声信号の音圧と、前記第２の音声
信号の高周波部分からなる第２の高周波音声信号の音圧
との音圧比を、前記特徴量として算出し、前記状態検出手段は、予め求められた、前記音圧比と前
記状態との対応関係を示す前記対応関係データを保持
し、前記対応関係データおよび前記音圧比に基づいて、
前記状態を検出することを特徴とする請求項３に記載の
情報処理装置。
【請求項６】前記第１の算出手段は、第１の前記集音
装置により集音された、前記音源が発した音声に対応す
る第１の前記音声信号、および第２の前記集音装置によ
り集音された、前記音源が発した音声に対応する第２の
前記音声信号から、前記第１の音声信号の位相と前記第
２の音声信号の位相との位相差を、前記特徴量として算
出し、前記状態検出手段は、予め求められた、前記位相差と前
記状態との対応関係を示す前記対応関係データを保持
し、前記対応関係データおよび前記位相差に基づいて、
前記状態を検出することを特徴とする請求項３に記載の
情報処理装置。
【請求項７】前記第１の算出手段は、第１の前記集音
装置、第２の前記集音装置、および第３の前記集音装置
により集音された、所定の範囲内に位置する前記音源が
発した音声に対応する第１の前記音声信号、第２の前記
音声信号、および第３の前記音声信号から、前記第１の
音声信号の位相と前記第２の音声信号の位相との第１の
位相差、および前記第１の音声信号の位相と前記第３の
音声信号の位相との第２の位相差を、前記特徴量として
算出し、前記状態検出手段は、前記第１の位相差および前記第２
の位相差に基づいて、前記音源の、平面上の位置を検出
することを特徴とする請求項１に記載の情報処理装置。
【請求項８】前記第１の集音装置、前記第２の集音装
置、および前記第３の集音装置のそれぞれにより集音さ
れた、所定の範囲内に設けられた複数の実験位置に位置
した前記音源が発した音声に対応する第４の前記音声信
号、第５の前記音声信号、および第６の前記音声信号か
ら、前記第４の音声信号の位相と前記第５の音声信号の
位相との第３の位相差、および前記第４の音声信号の位
相と前記第６の音声信号との第４の位相差を、前記実験
位置毎に算出し、さらに、前記第３の位相差と前記実験
位置との関係に基づく第１の係数、および前記第４の位
相差と前記実験位置との関係に基づく第２の係数を算出
する第２の算出手段と、前記第２の算出手段により算出
された前記第１の係数および前記第２の係数を記憶する
記憶手段とをさらに備え、前記状態検出手段は、前記第１の位相差と前記第１の係
数との関係、および前記第２の位相差と前記第２の係数
との関係に基づいて、前記音源の、平面上の位置を検出
することを特徴とする請求項７に記載の情報処理装置。
【請求項９】前記第１の算出手段は、前記第２の音声
信号および前記第３の音声信号から、前記第２の音声信
号の音圧と前記第３の音声信号の音圧との第１の音圧比
を、前記特徴量として、さらに算出し、前記状態検出手段は、前記第１の音圧比および検出した
前記音源の位置に基づいて、前記音源の向きを検出する
ことを特徴とする請求項７に記載の情報処理装置。
【請求項１０】前記第２の集音装置および前記第３の
集音装置のそれぞれにより集音された、複数の基準位置
に位置し、所定の方向を向いた前記音源が発した音声に
対応する第４の前記音声信号および第５の前記音声信号
から、前記第４の音声信号の音圧と前記第５の音声信号
の音圧の第２の音圧比を算出し、さらに、前記第２の音
圧比と前記所定の方向との関係に基づく係数を、前記基
準位置毎に算出する第２の算出手段と、前記係数を、前記基準位置に対応させて記憶する記憶手
段とをさらに備え、前記状態検出手段は、検出した前記音源の位置に対応す
る前記基準位置を検出するとともに、前記記憶手段か
ら、検出した前記基準位置に対応する前記係数を選択
し、選択した前記係数および前記第１の音圧比との関係
に基づいて、前記音源の向きを検出することを特徴とす
る請求項９に記載の情報処理装置。
【請求項１１】前記第１の算出手段は、第１の前記集
音装置、第２の前記集音装置、第３の前記集音装置、お
よび第４の前記集音装置により集音された、所定の範囲
内に位置する前記音源が発した音声に対応する第１の前
記音声信号、第２の前記音声信号、第３の前記音声信
号、および第４の前記音声信号から、前記第１の音声信
号の位相と前記第２の音声信号の位相との第１の位相
差、前記第２の音声信号の位相と前記第３の音声信号の
位相との第２の位相差、および前記第３の音声信号の位
相と前記第４の音声信号の位相との第３の位相差を、前
記特徴量として算出し、前記状態検出手段は、前記第１の位相差、前記第２の位
相差、および前記第３の位相差に基づいて、前記音源
の、空間上の位置を検出することを特徴とする請求項１
に記載の情報処理装置。
【請求項１２】前記第１の集音装置、前記第２の集音
装置、前記第３の集音装置、および前記第４の集音装置
のそれぞれにより集音された、所定の範囲内に設けられ
た複数の実験位置に位置した前記音源が発した音声に対
応する第５の前記音声信号、第６の前記音声信号、第７
の前記音声信号、および第８の前記音声信号から、前記
第５の音声信号の位相と前記第６の音声信号の位相との
第４の位相差、前記第６の音声信号の位相と前記第７の
音声信号の位相との第５の位相差、および前記第７の音
声信号の位相と前記第８の音声信号の位相との第６の位
相差を、前記実験位置毎に算出し、さらに、前記第４の
位相差と前記実験位置との関係に基づく第１の係数、前
記第５の位相差と前記実験位置との関係に基づく第２の
係数、および前記第６の位相差と前記実験位置との関係
に基づく第３の係数を算出する第２の算出手段と、前記第２の算出手段により算出された前記第１の係数、
前記第２の係数、および前記第３の係数を記憶する記憶
手段とをさらに備え、前記状態検出手段は、前記第１の位相差と前記第１の係
数との関係、前記第２の位相差と前記第２の係数との関
係、および前記第３の位相差と前記第３の係数との関係
に基づいて、前記音源の、空間上の位置を検出すること
を特徴とする請求項１１に記載の情報処理装置。
【請求項１３】前記第１の算出手段は、前記第１の音
声信号、前記第２の音声信号、前記第３の音声信号、お
よび前記第４の音声信号から、前記第１の音声信号の音
圧と前記第２の音声信号の音圧との第１の音圧比、前記
第２の音声信号の音圧と前記第３の音声信号の音圧との
第２の音圧比、および前記第３の音声信号の音圧と前記
第４の音声信号の音圧との第３の音圧比を、前記特徴量
として、さらに算出し、前記状態検出手段は、前記第１の音圧比、前記第２の音
圧比、および前記第３の音圧比、並びに検出した前記音
源の位置に基づいて、前記音源の向きを検出することを
特徴とする請求項１１に記載の情報処理装置。
【請求項１４】前記第１の集音装置、前記第２の集音
装置、前記第３の集音装置、および前記第４の集音装置
のそれぞれにより集音された、複数の基準位置に位置
し、所定の方向を向いた前記音源が発した音声に対応す
る第５の前記音声信号、第６の前記音声信号、第７の前
記音声信号、および第８の前記音声信号から、前記第５
の音声信号の音圧と前記第６の音声信号の音圧との第４
の音圧比、前記第６の音声信号の音圧と前記第７の音声
信号の音圧との第５の音圧比、および前記第７の音声信
号の音圧と前記第８の音声信号の音圧との第６の音圧比
をそれぞれ算出する第２の算出手段と、前記基準位置に対応させて、前記第４の音圧比、前記第
５の音圧比、および前記第６の音圧比、並びに前記方向
を記憶する記憶手段とをさらに備え、前記状態検出手段は、前記記憶手段から、検出した前記
音源の位置に対応する、前記基準位置、および前記第１
の音圧比、前記第２の音圧比と前記第３の音圧比に対応
する前記第４の音圧比、前記第５の音圧比と前記第６の
音圧比に対応する方向を、音源の向きとして検出するこ
とを特徴とする請求項１３に記載の情報処理装置。
【請求項１５】所定の位置に設置された複数の集音装
置により集音された、所定の音源が発した音声に対応す
る音声信号から、前記音源の状態に対応する特徴量を算
出する算出ステップと、算出ステップの処理で算出された前記特徴量に基づい
て、前記音源の状態を検出する状態検出ステップとを含
むことを特徴とする情報処理方法。
【請求項１６】所定の位置に設置された複数の集音装
置により集音された、所定の音源が発した音声に対応す
る音声信号から、前記音源の状態に対応する特徴量を算
出する算出ステップと、算出ステップの処理で算出された前記特徴量に基づい
て、前記音源の状態を検出する状態検出ステップとを含
むことを特徴とするコンピュータが読み取り可能なプロ
グラムが記録されている記録媒体。
【請求項１７】所定の位置に設置された複数の集音装
置により集音された、所定の音源が発した音声に対応す
る音声信号から、前記音源の状態に対応する特徴量を算
出する算出ステップと、算出ステップの処理で算出された前記特徴量に基づい
て、前記音源の状態を検出する状態検出ステップとを含
む処理をコンピュータに実行させることを特徴とするプ
ログラム。
【請求項１８】第１の集音装置、第２の集音装置、お
よび第３の集音装置により集音された、所定の範囲内に
位置する音源が発した音声に対応する第１の音声信号、
第２の音声信号、および第３の音声信号から、前記第１
の音声信号の位相と前記第２の音声信号の位相との第１
の位相差、および前記第１の音声信号の位相と前記第３
の音声信号の位相との第２の位相差を算出し、前記第１
の位相差と第１の係数との関係、および前記第２の位相
差と第２の係数との関係に基づいて、前記音源の位置を
検出する検出装置に対して前記第１の係数および前記第
２の係数を生成する情報生成装置において、前記第１の集音装置、前記第２の集音装置、および前記
第３の集音装置のそれぞれにより集音された、所定の範
囲内に設けられた複数の実験位置に位置した前記音源が
発した音声に対応する第４の前記音声信号、第５の前記
音声信号、および第６の前記音声信号から、前記第４の
音声信号の位相と前記第５の音声信号の位相との第３の
位相差、および前記第４の音声信号の位相と前記第６の
音声信号との第４の位相差を、前記実験位置毎に算出す
る第１の算出手段と、前記第３の位相差と前記実験位置との関係に基づいて、
前記第１の係数を算出し、前記第４の位相差と前記実験
位置との関係に基づいて、前記第２の係数を算出する第
２の算出手段とを備えることを特徴とする情報生成装
置。
【請求項１９】前記検出装置は、前記第２の集音装置
および前記第３の集音装置のそれぞれにより集音され
た、複数の基準位置に位置する前記音源が発した音声に
対応する第７の前記音声信号および第８の前記音声信号
から、前記第７の音声信号の音圧と前記第８の音声信号
の音圧の音圧比を算出し、前記音圧比と第３の係数との
関係に基づいて、前記音源の向きをさらに検出し、前記第２の集音装置および前記第３の集音装置のそれぞ
れにより集音された、複数の基準位置に位置する前記音
源が発した音声に対応する第９の前記音声信号および第
１０の前記音声信号から、前記第９の音声信号の音圧と
前記第１０の音声信号の音圧の音圧比を算出する第３の
算出手段と、前記第９の音声信号の音圧と前記第１０の音声信号の音
圧の音圧比と前記実験位置との関係に基づいて、前記第
３の係数を算出する第４の算出手段とをさらに備える請
求項１８に記載の情報生成装置。
【請求項２０】第１の集音装置、第２の集音装置、お
よび第３の集音装置により集音された、所定の範囲内に
位置する音源が発した音声に対応する第１の音声信号、
第２の音声信号、および第３の音声信号から、前記第１
の音声信号の位相と前記第２の音声信号の位相との第１
の位相差、および前記第１の音声信号の位相と前記第３
の音声信号の位相との第２の位相差を算出し、前記第１
の位相差と第１の係数との関係、および前記第２の位相
差と第２の係数との関係に基づいて、前記音源の位置を
検出する検出装置に対して前記第１の係数および前記第
２の係数を生成する情報生成装置の情報生成方法におい
て、前記第１の集音装置、前記第２の集音装置、および前記
第３の集音装置のそれぞれにより集音された、所定の範
囲内に設けられた複数の実験位置に位置した前記音源が
発した音声に対応する第４の前記音声信号、第５の前記
音声信号、および第６の前記音声信号から、前記第４の
音声信号の位相と前記第５の音声信号の位相との第３の
位相差、および前記第４の音声信号の位相と前記第６の
音声信号との第４の位相差を、前記実験位置毎に算出す
る第１の算出ステップと、前記第３の位相差と前記実験位置との関係に基づいて、
前記第１の係数を算出し、前記第４の位相差と前記実験
位置との関係に基づいて、前記第２の係数を算出する第
２の算出ステップとを含むことを特徴とする情報生成方
法。
【請求項２１】第１の集音装置、第２の集音装置、お
よび第３の集音装置により集音された、所定の範囲内に
位置する音源が発した音声に対応する第１の音声信号、
第２の音声信号、および第３の音声信号から、前記第１
の音声信号の位相と前記第２の音声信号の位相との第１
の位相差、および前記第１の音声信号の位相と前記第３
の音声信号の位相との第２の位相差を算出し、前記第１
の位相差と第１の係数との関係、および前記第２の位相
差と第２の係数との関係に基づいて、前記音源の位置を
検出する検出装置に対して前記第１の係数および前記第
２の係数を生成する情報生成装置のプログラムであっ
て、前記第１の集音装置、前記第２の集音装置、および前記
第３の集音装置のそれぞれにより集音された、所定の範
囲内に設けられた複数の実験位置に位置した前記音源が
発した音声に対応する第４の前記音声信号、第５の前記
音声信号、および第６の前記音声信号から、前記第４の
音声信号の位相と前記第５の音声信号の位相との第３の
位相差、および前記第４の音声信号の位相と前記第６の
音声信号との第４の位相差を、前記実験位置毎に算出す
る第１の算出ステップと、前記第３の位相差と前記実験位置との関係に基づいて、
前記第１の係数を算出し、前記第４の位相差と前記実験
位置との関係に基づいて、前記第２の係数を算出する第
２の算出ステップとを含むことを特徴とするコンピュー
タが読み取り可能なプログラムが記録されている記録媒
体。
【請求項２２】第１の集音装置、第２の集音装置、お
よび第３の集音装置により集音された、所定の範囲内に
位置する音源が発した音声に対応する第１の音声信号、
第２の音声信号、および第３の音声信号から、前記第１
の音声信号の位相と前記第２の音声信号の位相との第１
の位相差、および前記第１の音声信号の位相と前記第３
の音声信号の位相との第２の位相差を算出し、前記第１
の位相差と第１の係数との関係、および前記第２の位相
差と第２の係数との関係に基づいて、前記音源の位置を
検出する検出装置に対して前記第１の係数および前記第
２の係数を生成する情報生成装置のプログラムであっ
て、前記第１の集音装置、前記第２の集音装置、および前記
第３の集音装置のそれぞれにより集音された、所定の範
囲内に設けられた複数の実験位置に位置した前記音源が
発した音声に対応する第４の前記音声信号、第５の前記
音声信号、および第６の前記音声信号から、前記第４の
音声信号の位相と前記第５の音声信号の位相との第３の
位相差、および前記第４の音声信号の位相と前記第６の
音声信号との第４の位相差を、前記実験位置毎に算出す
る第１の算出ステップと、前記第３の位相差と前記実験位置との関係に基づいて、
前記第１の係数を算出し、前記第４の位相差と前記実験
位置との関係に基づいて、前記第２の係数を算出する第
２の算出ステップとを含む処理をコンピュータに実行さ
せることを特徴とするプログラム。