JP2003061184A - 情報処理装置および方法、情報生成装置および方法、記録媒体、並びにプログラム - Google Patents

情報処理装置および方法、情報生成装置および方法、記録媒体、並びにプログラム

Info

Publication number
JP2003061184A
JP2003061184A JP2001245991A JP2001245991A JP2003061184A JP 2003061184 A JP2003061184 A JP 2003061184A JP 2001245991 A JP2001245991 A JP 2001245991A JP 2001245991 A JP2001245991 A JP 2001245991A JP 2003061184 A JP2003061184 A JP 2003061184A
Authority
JP
Japan
Prior art keywords
sound
audio signal
signal
phase difference
coefficient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001245991A
Other languages
English (en)
Other versions
JP4752153B2 (ja
JP2003061184A5 (ja
Inventor
Tetsujiro Kondo
哲二郎 近藤
Yuji Okumura
裕二 奥村
Koichi Fujishima
幸一 藤島
Tomoyuki Otsuki
知之 大月
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2001245991A priority Critical patent/JP4752153B2/ja
Publication of JP2003061184A publication Critical patent/JP2003061184A/ja
Publication of JP2003061184A5 publication Critical patent/JP2003061184A5/ja
Application granted granted Critical
Publication of JP4752153B2 publication Critical patent/JP4752153B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

(57)【要約】 【課題】 ユーザが発した音声を利用して、ユーザの顔
の向きを検出ことができるようにする。 【解決手段】 マイクアンプ2Lおよびマイクアンプ2
Rのそれぞれは、所定の位置に設置されたマイク1Lお
よびマイク1Rにより集音された所定の音源が発した音
声の音声信号を増幅して、処理用音声信号Lおよび処理
用音声信号Rを生成し、検出装置3に供給する。検出装
置3は、処理用音声信号Lの音圧L、および処理用音声
信号Rの音圧Rをそれぞれ算出するとともに、音圧比
(=音圧R/音圧L)を算出する。検出装置3は、算出
した音圧比に対応する音源の向きを、自分自身が保持し
ている、音圧比と音源の向きとの対応関係を示すデータ
に基づいて検出する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、情報処理装置およ
び方法、情報生成装置および方法、記録媒体、並びにプ
ログラムに関し、特に、音源が発した音声を利用して、
音源の位置や向きを検出することができるようにした情
報処理装置および方法、情報生成装置および方法、記録
媒体、並びにプログラムに関する。
【0002】
【従来の技術】例えば、遠隔している複数の会議室にお
ける画像や音声を、ネットワークを介して相互に通信
し、各会議室において、他の会議室の映像や音声を再生
することにより、あたかも1つのテーブルを囲んでいる
かのように会議を行うことができる遠隔システムが存在
する。
【0003】この遠隔会議システムにおいては、会議に
参加しているユーザの顔の向きに応じて、映像の表示や
音声の出力が制御される。すなわち、ユーザの顔の向き
が検出されるようになされている。
【0004】
【発明が解決しようとする課題】しかしながら、特殊な
センサを利用したり、ユーザの顔の部分の画像データを
利用して、ユーザの顔の向きを検出する方法は、開示さ
れているが、ユーザが発した音声を利用して、ユーザの
顔の向きを検出する方法は、まだ開示されていない。
【0005】本発明はこのような状況に鑑みてなされた
ものであり、音源が発した音声を利用して、音源の顔の
向きを検出することができるようにするものである。
【0006】
【課題を解決するための手段】本発明の情報処理装置
は、所定の位置に設置された複数の集音装置により集音
された、所定の音源が発した音声に対応する音声信号か
ら、音源の状態に対応する特徴量を算出する第1の算出
手段と、第1の算出手段により算出された特徴量に基づ
いて、音源の状態を検出する状態検出手段とを備えるこ
とを特徴とする。
【0007】状態は、所定の位置にある音源の向きとす
ることができる。
【0008】状態検出手段は、予め求められた、特徴量
と状態との対応関係を示す対応関係データを保持し、対
応関係データおよび特徴量に基づいて、状態を検出する
ことができる。
【0009】第1の算出手段は、第1の集音装置により
集音された、音源が発した音声に対応する第1の音声信
号、および第2の集音装置により集音された、音源が発
した音声に対応する第2の音声信号から、第1の音声信
号の音圧と第2の音声信号の音圧との音圧比を、特徴量
として算出し、状態検出手段は、予め求められた、音圧
比と状態との対応関係を示す対応関係データを保持し、
対応関係データおよび音圧比に基づいて、状態を検出す
ることができる。
【0010】第1の算出手段は、第1の集音装置により
集音された、音源が発した音声に対応する第1の音声信
号、および第2の集音装置により集音された、音源が発
した音声に対応する第2の音声信号から、第1の音声信
号の高周波部分からなる第1の高周波音声信号の音圧
と、第2の音声信号の高周波部分からなる第2の高周波
音声信号の音圧との音圧比を、特徴量として算出し、状
態検出手段は、予め求められた、音圧比と状態との対応
関係を示す対応関係データを保持し、対応関係データお
よび音圧比に基づいて、状態を検出することができる。
【0011】第1の算出手段は、第1の集音装置により
集音された、音源が発した音声に対応する第1の音声信
号、および第2の集音装置により集音された、音源が発
した音声に対応する第2の音声信号から、第1の音声信
号の位相と第2の音声信号の位相との位相差を、特徴量
として算出し、状態検出手段は、予め求められた、位相
差と状態との対応関係を示す対応関係データを保持し、
対応関係データおよび位相差に基づいて、状態を検出す
ることができる。
【0012】第1の算出手段は、第1の集音装置、第2
の集音装置、および第3の集音装置により集音された、
所定の範囲内に位置する音源が発した音声に対応する第
1の音声信号、第2の音声信号、および第3の音声信号
から、第1の音声信号の位相と第2の音声信号の位相と
の第1の位相差、および第1の音声信号の位相と第3の
音声信号の位相との第2の位相差を、特徴量として算出
し、状態検出手段は、第1の位相差および第2の位相差
に基づいて、音源の、平面上の位置を検出することがで
きる。
【0013】第1の集音装置、第2の集音装置、および
第3の集音装置のそれぞれにより集音された、所定の範
囲内に設けられた複数の実験位置に位置した音源が発し
た音声に対応する第4の音声信号、第5の音声信号、お
よび第6の音声信号から、第4の音声信号の位相と第5
の音声信号の位相との第3の位相差、および第4の音声
信号の位相と第6の音声信号との第4の位相差を、実験
位置毎に算出し、さらに、第3の位相差と実験位置との
関係に基づく第1の係数、および第4の位相差と実験位
置との関係に基づく第2の係数を算出する第2の算出手
段と、第2の算出手段により算出された第1の係数およ
び第2の係数を記憶する記憶手段とをさらに設け、状態
検出手段には、第1の位相差と第1の係数との関係、お
よび第2の位相差と第2の係数との関係に基づいて、音
源の、平面上の位置を検出させることができる。
【0014】第1の算出手段は、第2の音声信号および
第3の音声信号から、第2の音声信号の音圧と第3の音
声信号の音圧との第1の音圧比を、特徴量として、さら
に算出し、状態検出手段は、第1の音圧比および検出し
た音源の位置に基づいて、音源の向きを検出することが
できる。
【0015】第2の集音装置および第3の集音装置のそ
れぞれにより集音された、複数の基準位置に位置し、所
定の方向を向いた音源が発した音声に対応する第4の音
声信号および第5の音声信号から、第4の音声信号の音
圧と第5の音声信号の音圧の第2の音圧比を算出し、さ
らに、第2の音圧比と所定の方向との関係に基づく係数
を、基準位置毎に算出する第2の算出手段と、係数を、
基準位置に対応させて記憶する記憶手段とをさらに設
け、状態検出手段には、検出した音源の位置に対応する
基準位置を検出するとともに、記憶手段から、検出した
基準位置に対応する係数を選択し、選択した係数および
第1の音圧比との関係に基づいて、音源の向きを検出さ
せることができる。
【0016】第1の算出手段は、第1の集音装置、第2
の集音装置、第3の集音装置、および第4の集音装置に
より集音された、所定の範囲内に位置する音源が発した
音声に対応する第1の音声信号、第2の音声信号、第3
の音声信号、および第4の音声信号から、第1の音声信
号の位相と第2の音声信号の位相との第1の位相差、第
2の音声信号の位相と第3の音声信号の位相との第2の
位相差、および第3の音声信号の位相と第4の音声信号
の位相との第3の位相差を、特徴量として算出し、状態
検出手段は、第1の位相差、第2の位相差、および第3
の位相差に基づいて、音源の、空間上の位置を検出する
ことができる。
【0017】第1の集音装置、第2の集音装置、第3の
集音装置、および第4の集音装置のそれぞれにより集音
された、所定の範囲内に設けられた複数の実験位置に位
置した音源が発した音声に対応する第5の音声信号、第
6の音声信号、第7の音声信号、および第8の音声信号
から、第5の音声信号の位相と第6の音声信号の位相と
の第4の位相差、第6の音声信号の位相と第7の音声信
号の位相との第5の位相差、および第7の音声信号の位
相と第8の音声信号の位相との第6の位相差を、実験位
置毎に算出し、さらに、第4の位相差と実験位置との関
係に基づく第1の係数、第5の位相差と実験位置との関
係に基づく第2の係数、および第6の位相差と実験位置
との関係に基づく第3の係数を算出する第2の算出手段
と、第2の算出手段により算出された第1の係数、第2
の係数、および第3の係数を記憶する記憶手段とをさら
に設け、状態検出手段には、第1の位相差と第1の係数
との関係、第2の位相差と第2の係数との関係、および
第3の位相差と第3の係数との関係に基づいて、音源
の、空間上の位置を検出させることができる。
【0018】第1の算出手段は、第1の音声信号、第2
の音声信号、第3の音声信号、および第4の音声信号か
ら、第1の音声信号の音圧と第2の音声信号の音圧との
第1の音圧比、第2の音声信号の音圧と第3の音声信号
の音圧との第2の音圧比、および第3の音声信号の音圧
と第4の音声信号の音圧との第3の音圧比を、特徴量と
して、さらに算出し、状態検出手段は、第1の音圧比、
第2の音圧比、および第3の音圧比、並びに検出した音
源の位置に基づいて、音源の向きを検出することができ
る。
【0019】第1の集音装置、第2の集音装置、第3の
集音装置、および第4の集音装置のそれぞれにより集音
された、複数の基準位置に位置し、所定の方向を向いた
音源が発した音声に対応する第5の音声信号、第6の音
声信号、第7の音声信号、および第8の音声信号から、
第5の音声信号の音圧と第6の音声信号の音圧との第4
の音圧比、第6の音声信号の音圧と第7の音声信号の音
圧との第5の音圧比、および第7の音声信号の音圧と第
8の音声信号の音圧との第6の音圧比をそれぞれ算出す
る第2の算出手段と、基準位置に対応させて、第4の音
圧比、第5の音圧比、および第6の音圧比、並びに方向
を記憶する記憶手段とをさらに設け、状態検出手段に
は、記憶手段から、検出した音源の位置に対応する基準
位置、および第1の音圧比、第2の音圧比と第3の音圧
比に対応する第4の音圧比、第5の音圧比と第6の音圧
比に対応する方向を、音源の向きとして検出させること
ができる。
【0020】本発明の情報処理方法は、所定の位置に設
置された複数の集音装置により集音された、所定の音源
が発した音声に対応する音声信号から、音源の状態に対
応する特徴量を算出する算出ステップと、算出ステップ
の処理で算出された特徴量に基づいて、音源の状態を検
出する状態検出ステップとを含むことを特徴とする。
【0021】本発明の第1の記録媒体のプログラムは、
所定の位置に設置された複数の集音装置により集音され
た、所定の音源が発した音声に対応する音声信号から、
音源の状態に対応する特徴量を算出する算出ステップ
と、算出ステップの処理で算出された特徴量に基づい
て、音源の状態を検出する状態検出ステップとを含むこ
とを特徴とする。
【0022】本発明の第1のプログラムは、所定の位置
に設置された複数の集音装置により集音された、所定の
音源が発した音声に対応する音声信号から、音源の状態
に対応する特徴量を算出する算出ステップと、算出ステ
ップの処理で算出された特徴量に基づいて、音源の状態
を検出する状態検出ステップとを含むことを特徴とす
る。
【0023】本発明の情報処理装置および方法、並びに
第1のプログラムにおいては、所定の位置に設置された
複数の集音装置により集音された、所定の音源が発した
音声に対応する音声信号から、音源の状態に対応する特
徴量が算出され、算出された特徴量に基づいて、音源の
状態が検出される。
【0024】本発明の情報生成装置は、第1の集音装
置、第2の集音装置、および第3の集音装置のそれぞれ
により集音された、所定の範囲内に設けられた複数の実
験位置に位置した音源が発した音声に対応する第4の音
声信号、第5の音声信号、および第6の音声信号から、
第4の音声信号の位相と第5の音声信号の位相との第3
の位相差、および第4の音声信号の位相と第6の音声信
号との第4の位相差を、実験位置毎に算出する第1の算
出手段と、第3の位相差と実験位置との関係に基づい
て、第1の係数を算出し、第4の位相差と実験位置との
関係に基づいて、第2の係数を算出する第2の算出手段
とを備えることを特徴とする。
【0025】検出装置は、第2の集音装置および第3の
集音装置のそれぞれにより集音された、複数の基準位置
に位置する音源が発した音声に対応する第7の音声信号
および第8の音声信号から、第7の音声信号の音圧と第
8の音声信号の音圧の音圧比を算出し、さらに、音圧比
と第3の係数との関係に基づいて、音源の向きをさらに
検出し、第2の集音装置および第3の集音装置のそれぞ
れにより集音された、複数の基準位置に位置する音源が
発した音声に対応する第9の音声信号および第10の音
声信号から、第9の音声信号の音圧と第10の音声信号
の音圧の音圧比を算出する第3の算出手段と、第9の音
声信号の音圧と第10の音声信号の音圧の音圧比と実験
位置との関係に基づいて、第3の係数を算出する第4の
算出手段とをさらに設けることができる。
【0026】本発明の情報生成方法は、第1の集音装
置、第2の集音装置、および第3の集音装置のそれぞれ
により集音された、所定の範囲内に設けられた複数の実
験位置に位置した音源が発した音声に対応する第4の音
声信号、第5の音声信号、および第6の音声信号から、
第4の音声信号の位相と第5の音声信号の位相との第3
の位相差、および第4の音声信号の位相と第6の音声信
号との第4の位相差を、実験位置毎に算出する第1の算
出ステップと、第3の位相差と実験位置との関係に基づ
いて、第1の係数を算出し、第4の位相差と実験位置と
の関係に基づいて、第2の係数を算出する第2の算出ス
テップとを含むことを特徴とする。
【0027】本発明の第2の記録媒体のプログラムは、
第1の集音装置、第2の集音装置、および第3の集音装
置のそれぞれにより集音された、所定の範囲内に設けら
れた複数の実験位置に位置した音源が発した音声に対応
する第4の音声信号、第5の音声信号、および第6の音
声信号から、第4の音声信号の位相と第5の音声信号の
位相との第3の位相差、および第4の音声信号の位相と
第6の音声信号との第4の位相差を、実験位置毎に算出
する第1の算出ステップと、第3の位相差と実験位置と
の関係に基づいて、第1の係数を算出し、第4の位相差
と実験位置との関係に基づいて、第2の係数を算出する
第2の算出ステップとを含むことを特徴とする。
【0028】本発明の第2のプログラムは、第1の集音
装置、第2の集音装置、および第3の集音装置のそれぞ
れにより集音された、所定の範囲内に設けられた複数の
実験位置に位置した音源が発した音声に対応する第4の
音声信号、第5の音声信号、および第6の音声信号か
ら、第4の音声信号の位相と第5の音声信号の位相との
第3の位相差、および第4の音声信号の位相と第6の音
声信号との第4の位相差を、実験位置毎に算出する第1
の算出ステップと、第3の位相差と実験位置との関係に
基づいて、第1の係数を算出し、第4の位相差と実験位
置との関係に基づいて、第2の係数を算出する第2の算
出ステップとを含む処理をコンピュータに実行させるこ
とを特徴とする。
【0029】本発明の情報生成装置および方法、並びに
第2のプログラムにおいては、第1の集音装置、第2の
集音装置、および第3の集音装置のそれぞれにより集音
された、所定の範囲内に設けられた複数の実験位置に位
置した音源が発した音声に対応する第4の音声信号、第
5の音声信号、および第6の音声信号から、第4の音声
信号の位相と第5の音声信号の位相との第3の位相差、
および第4の音声信号の位相と第6の音声信号との第4
の位相差が、実験位置毎に算出され、第3の位相差と実
験位置との関係に基づいて、第1の係数が算出され、第
4の位相差と実験位置との関係に基づいて、第2の係数
が算出される。
【0030】
【発明の実施の形態】
【0031】図1は、本発明を適用した音源状態検出シ
ステムの第1の実施の形態の構成例を示している。この
システムでは、所定の位置にある音源が発した音声か
ら、音源の向きが検出される。なお、ここでは、音源
は、所定の位置にあるユーザの口元とし、ユーザが発し
た音声から、ユーザの口元の向き(ユーザの顔の向き)
が検出される。
【0032】マイクロフォン(以下、マイクと略称す
る)1Lおよびマイク1Rは、図2(A)に示すよう
に、ユーザの頭部の中心点が位置Aに位置する場合にお
いて、ユーザの顔が正面方向を向いているとき、マイク
1Lとユーザの口元(音源)の距離Lと、マイクRと音
源の距離Rが、それぞれ等しくなる位置に設置されてい
る。
【0033】図1に戻り、マイク1Lおよびマイク1R
のそれぞれは、音源であるユーザの口元から発せられた
音声を集音し、マイクアンプ2Lおよびマイクアンプ2
Rに供給する。
【0034】マイクアンプ2Lは、マイク1Lからの音
声信号を増幅して、処理用音声信号Lを生成し、検出装
置3に供給する。マイクアンプ2Rは、マイク1Rから
の音声信号を増幅して、処理用音声信号Rを生成し、検
出装置3に供給する。
【0035】検出装置3は、マイクアンプ2Lから供給
される処理用音声信号Lおよびマイクアンプ2Rから供
給される処理用音声信号Rから、処理用音声信号Lの音
圧Lと処理用音声信号Rの音圧Rとの音圧比RL(=音
圧R/音圧L)を算出する。
【0036】検出装置3は、算出した音圧比RLに対応
する音源の向き、すなわち、この例の場合、ユーザの口
元の向き(ユーザの顔の向き)を、図3に示す、音圧比
RLと口元(音源)の向きとの対応関係を示すデータを
参照することで検出し、それを、図示せぬ外部の装置に
出力する。
【0037】ところで、音声の音圧は、音源からの距離
が短ければ短いほど大きくなることから、図2(C)に
示すように、ユーザの顔(口元)が正面方向に対して右
側を向いており、距離Rが、距離Lより短い場合、この
とき検出される、マイク1Rにより集音される、ユーザ
が発した音声の音圧(処理用音声信号Rの音圧R)は、
マイク1Lにより集音される、ユーザが発した音声の音
圧(処理用音声信号Lの音圧L)より大きなる。すなわ
ちこの場合、音圧比RLは、1より大きな所定の値とな
る。
【0038】また、図2(B)に示すように、口元が正
面方向に対して左側を向いており、距離Rが、距離Lよ
り長い場合、音圧Rは、音圧Lより小さくなるので、音
圧比RLは、1より小さい所定の値となる。
【0039】また、図2(A)に示すように、口元が正
面方向を向いており、距離Rが、距離Lと等しい場合、
音圧Rは、音圧Lと等しくなるので、音圧比RLは、1
となる。
【0040】このように、音圧比RL(=音圧R/音圧
L)は、口元(音源)の向き(正確には、口元とマイク
1との距離)に対応するので、例えば、口元が向く方向
を変え、そのとき発せられた音声の音圧比RL、および
口元が向く方向を表す値を集計することで、図3に示す
データが得られる。
【0041】図4は、検出装置3の構成例を示してい
る。
【0042】入力部11は、マイクアンプ2Lおよびマ
イクアンプ2Rのそれぞれから適宜供給される処理用音
声信号Lおよび処理用音声信号Rを入力する。入力部1
1は、入力した、処理用音声信号L,Rの一部(例え
ば、所定の時間内に入力した部分)を、特徴量算出部1
2に供給する。
【0043】特徴量算出部12は、入力部11から供給
された処理用音声信号L,Rから、それぞれの音圧L,
Rを算出するとともに、音圧比RL(=音圧R/音圧
L)を算出し、それを、検出部13に供給する。$検出
部13は、図3に示した、音圧比RLと口元(音源)の
対応関係を示すデータを保持しており、そのデータに基
づいて、特徴量算出部12から供給された音圧比RLに
対応する口元の向きを検出し、出力部14に供給する。
【0044】出力部14は、検出部13から供給された
口元(音源)の向きを、外部の装置に供給する。
【0045】図5は、特徴量算出部12の構成例を示し
ている。入力部11から供給された処理用音声信号L
は、音圧算出部21Lに供給され、処理用音声信号R
は、音圧算出部21Rに、それぞれ供給される。
【0046】音圧算出部21Lは、例えば、入力された
処理用音声信号Lが示す値の2乗平均値、2乗平均の平
方根、または絶対値の平均値を、処理用音声信号Lの音
圧Lとして算出し、その算出結果を、音圧比算出部22
に供給する。音圧算出部21Rは、音圧算出部21Lと
同様の方法で、処理用音声信号Rの音圧Rを算出し、音
圧比算出部22に供給する。
【0047】音圧比算出部22は、音圧算出部21Lか
らの音圧Lと、音圧算出部21Rからの音圧Rに基づい
て、音圧比RL(=音圧R/音圧L)を算出し、その算
出結果を、検出部13に供給する。
【0048】次に、第1の実施の形態における音源状態
検出システムの動作を、図6のフローチャートを参照し
て説明する。
【0049】ステップS1において、マイク1L,1R
のそれぞれは、所定の方向を向いているユーザが発した
(所定の方向を向いている口元からの)音声を集音し、
その結果得られた音声信号を、マイクアンプ2L,2R
に供給する。
【0050】ステップS2において、マイクアンプ2
L,2Rのそれぞれは、マイク1L,1Rから供給され
た音声信号を増幅して、処理用音声信号L,Rを生成
し、検出装置3に供給する。
【0051】ステップS3において、検出装置3は、マ
イクアンプ2L,2Rのそれぞれから供給された処理用
音声信号L,Rに基づいて、口元(音源)の向きを検出
する。ここでの処理の詳細は、図7のフローチャートに
示されている。
【0052】ステップS11において、検出装置3の入
力部11は、入力したマイクアンプ2L,2Rのそれぞ
れからの処理用音声信号L,Rの一部(所定の時間内に
入力した部分)を、特徴量算出部12に供給する。
【0053】次に、ステップS12において、特徴量算
出部12(音圧算出部21L,21R)は、入力部11
から供給された処理用音声信号L,Rから、それらの音
圧L,Rをそれぞれ算出する。
【0054】ステップS13において、特徴量算出部1
2(音圧比算出部22)は、ステップS12で算出した
音圧L,Rに基づいて、音圧比RL(=音圧R/音圧
L)を算出し、検出部13に供給する。
【0055】次に、ステップS14において、検出部1
3は、音圧比RLと口元(音源)の向きとの対応関係を
示すデータ(図3)を参照して、特徴量算出部12から
供給された音圧比RLに対応する音源の向きを検出し、
出力部14に供給する。
【0056】ステップS15において、出力部14は、
検出部13から供給された口元(音源)の向きを、外部
の装置に出力する。
【0057】その後、検出装置3の処理は終了し、音源
状態検出システムの動作(図6)も、終了する。
【0058】図8は、本発明を適用した音源状態検出シ
ステムの第2の実施の形態の構成例を示している。この
システムでは、第1の実施の形態(図1)における場合
と同様に、所定の位置にある音源が発した音声から、音
源の向きが検出される。
【0059】このシステムには、図1に示す検出装置3
に代えて、検出装置31が設けられている。その他の構
成は、図1における場合と同様であり、その説明は適宜
省略する。
【0060】マイク1Lとマイク1Rは、第1の実施の
形態における場合と同様の位置に設置されている(図
9)。
【0061】検出装置31は、マイクアンプ2Lから供
給される処理用音声信号Lおよびマイクアンプ2Rから
供給される処理用音声信号Rから、処理用音声信号Lの
高周波部分(以下、高周波処理用音声信号Lhと称す
る)の音圧Lhと、処理用音声信号Rの高周波部分(以
下、高周波処理用音声信号Rhと称する)の音圧Rhとの
音圧比RLh(=音圧Rh/音圧Hh)を算出する。
【0062】検出装置31は、算出した音圧比RLhに
対応する口元(音源)の向きを、図10に示す、音圧比
RLhと口元の向きとの対応関係を示すデータに基づい
て検出し、それを、図示せぬ外部の装置に出力する。
【0063】ところで、音声、特にその高周波部分には
指向性があるので、その高周波部分の音圧は、音源に対
する角度が小さければ小さいほど大きくなる。このこと
から、図9(C)に示すように、口元が正面方向に対し
て右側を向いており、角度Rが、角度Lより小さい場
合、このとき検出される、マイク1Rにより集音され
る、ユーザが発した音声の高周波部分の音圧(高周波処
理用音声信号Rhの音圧Rh)は、マイク1Lにより集音
される、ユーザが発した音声の高周波部分の音圧(高周
波処理用音声信号Lhの音圧Lh)よりも大きくなる。す
なわちこの場合、音圧比RLhは、1より大きい所定の
値となる。
【0064】また、図9(B)に示すように、口元が正
面方向に対して左側を向いており、角度Rが、角度Lよ
り大きい場合、音圧Rhは、音圧Lhよりも小さくなるの
で、音圧比RLhは、1より小さい所定の値となる。
【0065】また、図9(A)に示すように、口元が正
面方向を向いており、角度Rが、角度Lと等しい場合、
音圧Rhは、音圧Lhと等しくなるので、音圧比RLh
は、1となる。
【0066】このように、音圧比RLhは、口元(音
源)の向き(正確には、口元が向いている方向と、口元
の位置からのマイク1が位置する方向との角度)に対応
するので、口元が向く方向を変え、そのとき発せられた
音声の音圧比RLh、および口元が向く方向を表す値を
集計することで、図10に示すデータが得られる。
【0067】図11は、検出装置31の構成例を示して
いる。この検出装置31には、図4の検出装置3の特徴
量算出部12および検出部13に代えて、特徴量算出部
41および検出部42が設けられている。他の部分は、
図4における場合と同様である。
【0068】特徴量算出部41は、入力部11から供給
された処理用音声信号L,Rの高周波部分のみを通過さ
せることで得られた、高周波処理用音声信号Lhおよび
高周波処理用音声信号Rhから、それらの音圧Lhおよび
音圧Rhをそれぞれ算出するとともに、算出した音圧Lh
と音圧Rhの音圧比RLh(=音圧Rh/音圧Lh)を算出
し、検出部42に供給する。
【0069】検出部42は、図10に示した、音圧比R
Lhと口元(音源)の向きとの対応関係を示すデータを
保持しており、そのデータに基づいて、特徴量算出部4
1から供給された音圧比RLhに対応する口元の向きを
検出し、出力部14に供給する。
【0070】図12は、特徴量算出部41の構成例を示
している。この特徴量算出部41には、図5の特徴量算
出部12の音圧算出部21Lおよび音圧算出部21Rの
前段に、ハイパスフィルタ(HPF)51Lおよびハイ
パスフィルタ51Rが設けられている。他の構成は、図
5における場合と同様である。
【0071】ハイパスフィルタ51Lは、入力部11か
ら供給された処理用音声信号Lの高周波部分のみを通過
させて、音圧算出部21Lに供給する。すなわち、高周
波処理用音声信号Lhが、音圧算出部21Lに供給され
る。
【0072】ハイパスフィルタ51Rは、入力部11か
ら供給された処理用音声信号Rの高周波部分のみを通過
させて、音圧算出部21Rに供給する。すなわち、高周
波処理用音声信号Rhが、音圧算出部21Rに供給され
る。
【0073】図13は、ハイパスフィルタ51のカット
オフ特性を示している。カットオフ周波数fは、例え
ば、それを固定の値とすることや、ユーザの音声のピッ
チ周波数に比例する周波数とすることができる。
【0074】ここでピッチ周波数とは、図14に示すよ
うなユーザの音声の波形の中で繰り返される基本的な波
形の周期Tの逆数である。ピッチ周波数は、人それぞれ
により異なる。
【0075】図12に戻り、音圧算出部21Lは、ハイ
パスフィルタ51Lから供給される高周波処理用音声信
号Lhの音圧Lhを算出し、音圧比算出部22に供給す
る。音圧算出部21Rは、ハイパスフィルタ51Rから
供給される高周波処理用音声信号Rhの音圧Rhを算出
し、音圧比算出部22に供給する。
【0076】音圧比算出部22は、音圧算出部21Lか
らの音圧Lhと、音圧算出部21Rからの音圧Rhとの音
圧比RLh(=音圧Rh/音圧Lh)を算出し、検出部4
2に供給する。
【0077】次に、第2の実施の形態における音源状態
検出システムの動作を、図15のフローチャートを参照
して説明する。
【0078】ステップS21,S22においては、図6
のステップS1,S2における場合と同様の処理が実行
されるので、その説明は省略する。
【0079】ステップS23において、検出装置31
は、マイクアンプ2L,2Rのそれぞれから供給された
処理用音声信号L,Rに基づいて、口元(音源)の向き
を検出する。ここでの処理の詳細は、図16のフローチ
ャートに示されている。
【0080】ステップS31において、入力部11は、
マイクアンプ2L,2Rのそれぞれからの処理用音声信
号L,Rの一部(例えば、所定の時間内に入力した部
分)を、特徴量算出部41に供給する。
【0081】次に、ステップS32において、特徴量算
出部41(ハイパスフィルタ51L,51R)は、入力
部11から供給された処理用音声信号L,Rの高周波部
分を濾過し、高周波処理用音声信号Lh,Rhを生成す
る。
【0082】ステップS33において、特徴量算出部4
1(音圧算出部21L,21R)は、ステップS32で
生成した高周波処理用音声信号Lh,Rhから、音圧L
h,Rhをそれぞれ算出する。
【0083】次に、ステップS34において、特徴量算
出部41(音圧比算出部22)は、ステップS33で算
出した音圧Lh,Rhに基づいて、音圧比RLh(=音圧
Rh/音圧Lh)を算出し、検出部42に供給する。
【0084】ステップS35において、検出部42は、
音圧比RLhと口元(音源)の向きとの対応関係を示す
データ(図10)を参照して、特徴量算出部41から供
給された音圧比RLhに対応する音源の向きを検出し、
出力部14に供給する。
【0085】次に、ステップS36において、出力部1
4は、検出部42から供給された口元(音源)を、外部
の装置に出力する。
【0086】その後、検出装置31の処理は終了し、音
源状態検出システムの動作(図15)も終了する。
【0087】図17は、本発明を適用した音源状態検出
システムの第3の実施の形態の構成例を示している。こ
のシステムでは、第1の実施の形態(図1)および第2
の実施の形態(図8)における場合と同様に、所定の位
置にある音源が発した音声から、音源の向きが検出され
る。
【0088】このシステムには、図1に示す検出装置3
に代えて、検出装置61が設けられている。他の構成に
ついては同様である。$マイク1Lとマイク1Rは、第
1の実施の形態における場合と同様の位置に設置されて
いる(図2)。
【0089】検出装置61は、マイクアンプ2Lから供
給される処理用音声信号Lおよびマイクアンプ2Rから
供給される処理用音声信号Rから、処理用音声信号Rの
位相に対する処理用音声信号Lの位相のずれ(位相差)
を算出する。検出装置61は、算出した位相差に対応す
るユーザの口元(音源)の向きを、図18に示す、位相
差と口元(音源)の向きとの対応関係を示すデータに基
づいて検出し、図示せぬ外部の装置に出力する。
【0090】ところで、音声は、マイク1と音源との距
離が長ければ長いほど、マイク1に到達するのに時間が
かかり、また後に到達した音声の位相は、先に到達した
音声の位相に比べ遅れる特徴がある。このことから、例
えば、図2(B)に示すように、口元が正面方向に対し
て左側を向いており、距離Rが、距離Lより長い場合、
このときユーザから発せられた音声は、マイク1Lに先
に到達し、その後マイク1Rに到達するので、このとき
検出されるマイク1Rにより集音される音声(処理用音
声信号R)の位相(図19(B))は、マイク1Lによ
り集音される音声(処理用音声信号L)の位相(図19
(A))に比べ遅れる。すなわちこの場合、処理用音声
信号Rの位相に対する処理用音声信号Lの位相の差は、
負の値となる。
【0091】なおこのとき、距離Lは、距離Rより短い
ので、図19(A)に示す処理用音声信号Lのレベル
は、図19(B)に示す処理用音声信号Rのレベルより
高くなる。
【0092】また、図2(C)に示すように、口元が正
面方向に対して右側を向いており、距離Rが、距離Lよ
り短い場合、このときユーザから発せられた音声は、マ
イク1Rに先に到達し、その後マイク1Lに到達するの
で、処理用音声信号R(図20(B))の位相は、処理
用音声信号L(図20(A))の位相に比べ進む。すな
わちこの場合、処理用音声信号Rの位相に対する処理用
音声信号Lの位相の差は、正の値となる。$なおこのと
き、距離Rは、距離Lより短いので、図20(B)に示
す処理用音声信号Rのレベルは、図20(A)に示す処
理用音声信号Lのレベルより高い。
【0093】また、図2(A)に示すように、ユーザの
顔が正面方向を向いており、距離Rが、距離Lと等しい
場合、このときユーザから発せられた音声は、マイク1
Rとマイク1Lに同時到達するので、処理用音声信号R
(図21(B))の位相と、処理用音声信号L(図21
(A))の位相は、一致する。すなわちこの場合、処理
用音声信号Rの位相に対する処理用音声信号Lの位相の
位相差は、零となる。
【0094】なおこのとき、距離Rと距離Lは等しいの
で、図21(B)に示す処理用音声信号Rのレベルと図
21(A)に示す処理用音声信号Lのレベルは同じにな
る。
【0095】このように、位相差は、口元(音源)の向
きに対応するので、口元が向く方向を変え、そのとき発
せられた音声の位相差、および口元が向く方向を表す値
を集計することで、図18に示すデータが得られる。
【0096】図22は、検出装置61の構成例を示して
いる。この検出装置61には、図4の検出装置3の特徴
量算出部12および検出部13に代えて、特徴量算出部
71および検出部72が設けられている。他の構成は、
図4における場合と同様である。
【0097】特徴量算出部71は、入力部11から供給
された処理用音声信号Lと処理用音声信号Rから、処理
用音声信号Rの位相に対する処理用音声信号Lの位相の
位相差を算出する。
【0098】具体的には、特徴量算出部71は、処理用
音声信号L,Rを、所定のサンプリング周期Tでサンプ
リングして、量子化する。これにより、処理用音声信号
Lからは、N個のサンプルL1乃至LNが、処理用音声信
号Rからは、N個のサンプルR1乃至RNがそれぞれ得ら
れる。なお、サンプルLまたはサンプルRに付されてい
る下付の番号は、サンプリング順を表してる。すなわ
ち、サンプルL1は、最初にサンプリングされたサンプ
ル(第1番目のサンプル)を示す。
【0099】次に、特徴量算出部71は、jが1乃至n
であるときの式(1)をそれぞれ算出し、その算出結果
の値が最大となるjの値mを検出する。そして特徴量算
出部71は、検出した値mにサンプリング周期Tを掛け
合わせて得られた値(時間)を、処理用音声信号Rの位
相に対する処理用音声信号Lの位相の位相差とする。
【数1】
【0100】式中、Li-jは、サンプルLi-jの値を示
し、Riは、サンプルRiの値を示す。
【0101】すなわち、処理用音声信号Rと処理用音声
信号Lとの相関値が、処理用音声信号Rに対して、処理
用音声信号Lが、n個のサンプル分の時間まで、1サン
プリング時間ずつずらされて算出され、その算出結果に
おいて最も高い相関値が得られたときの時間のずれが、
処理用音声信号Rの位相に対する処理用音声信号Lの位
相の差とされる。
【0102】検出部72は、図18に示した、位相差と
口元(音源)の向きとの対応関係を示すデータを保持し
ており、そのデータに基づいて、特徴量算出部71から
供給された位相差に対応する音源の向きを検出し、出力
部14に供給する。
【0103】次に、第3の実施の形態における音源状態
検出システムの動作を、図23のフローチャートを参照
して説明する。
【0104】ステップS41,S42においては、図6
のステップS1,S2における場合と同様の処理が実行
されるので、その説明は省略する。
【0105】ステップS43において、検出装置61
は、マイクアンプ2L,2Rのそれぞれから供給された
処理用音声信号L,Rに基づいて、口元(音源)の向き
を検出する。ここでの処理の詳細は、図24のフローチ
ャートに示されている。
【0106】ステップS51において、入力部11は、
マイクアンプ2L,2Rのそれぞれからの処理用音声信
号L,Rの一部(例えば、所定の時間内に入力した部
分)を、特徴量算出部71に供給する。
【0107】次に、ステップS52において、特徴量算
出部71は、入力部11から供給された処理用音声信号
L,Rから、処理用音声信号Rの位相に対する処理用音
声信号Lの位相の位相差を算出し、検出部72に供給す
る。
【0108】ステップS53において、検出部72は、
位相差と口元(音源)の向きとの対応関係を示すデータ
(図18)を参照して、特徴量算出部71から供給され
た位相差に対応する音源の向きを検出し、出力部14に
供給する。
【0109】ステップS54において、出力部14は、
検出部72から供給された口元(音源)の向きを、外部
の装置に出力する。
【0110】その後、検出装置61の処理は終了し、音
源状態検出システムの動作(図23)も、終了する。
【0111】図25は、本発明を適用した音源状態検出
システムの第4の実施の形態の構成例を示している。第
1の実施の形態乃至第3の実施の形態においては、音源
は、移動しないことを前提として、所定の位置ある音源
の向きが検出されたが、このシステムでは、所定の範囲
内で移動する音源の位置およびその向きが検出される。
【0112】このシステムには、図1に示す検出装置3
に代えて、検出装置101が設けられているとともに、
マイク1L、マイク1C、およびマイク1Rの3個のマ
イク1、並びにマイク1Lにより集音された音声を増幅
するマイクアンプ2L、マイク1Cにより集音された音
声を増幅するマイクアンプ2C、およびマイク1Rによ
り集音された音声を増幅するマイクアンプ2Rの3個の
マイクアンプ2が設けられている。
【0113】マイク1Lおよびマイク1Rは、図26に
示すように、例えば、ユーザの頭部の中心点が位置Aに
位置する場合において、口元が正面方向を向いていると
き、マイク1Lと口元の距離Lと、マイク1Rと口元の
距離Rが、それぞれ等しくなる位置に設置されている。
マイク1Cは、正面方向に、位置Aから所定の距離だけ
離れた位置に設置されている。
【0114】図25に戻り、検出装置101は、マイク
アンプ2Cから供給される信号(以下、処理用音声信号
Cと称する)の位相に対する、マイクアンプ2Lから供
給された処理用音声信号Lの位相の位相差CL、および
処理用音声信号Cの位相に対する、マイクアンプ2Rか
ら供給された処理用音声信号Rの位相の位相差CR、お
よび所定の係数(後述)に基づいて、所定の範囲内で移
動する口元(音源)の位置を検出する。
【0115】この例の場合、音源の位置は、図27に示
すように、ユーザの頭部の中心点が位置Aにある場合に
おいて、ユーザの顔が正面方向を向いているときの口元
(音源)の位置(以下、基準位置と称する)を原点とす
る座標(x,y)で示される。
【0116】検出装置101はまた、検出した口元(音
源)の位置に対応する所定の係数(後述)、および処理
用音声信号Lの音圧Lと処理用音声信号Rの音圧Rとの
音圧比RL(=音圧R/音圧L)に基づいて、音源の向
きを検出する。
【0117】この例の場合、音源の向きは、図27に示
すように、Y軸に対する角度θで示される。
【0118】図28は、検出装置101の構成例を示し
ている。
【0119】この検出装置101には、図4の検出装置
3の特徴量算出部12および検出部13に代えて、特徴
量算出部111および検出部112が設けられている。
他の構成は、図4における場合と同様である。
【0120】入力部11は、マイクアンプ2L,2C,
2Rのそれぞれから適宜供給される処理用音声信号L,
C,Rを入力し、特徴量算出部111に供給する。
【0121】特徴量算出部111は、入力部11から供
給された処理用音声信号L、処理用音声信号C、および
処理用音声信号Rから、位相差CL(処理用音声信号C
の位相に対する処理用音声信号Lの位相の位相差)、お
よび位相差CR(処理用音声信号Cの位相に対する処理
用音声信号Rの位相の位相差)を算出する。
【0122】特徴量算出部111はまた、処理用音声信
号Lの音圧Lと処理用音声信号Rの音圧Rとの音圧比R
L(=音圧R/音圧L)を算出する。
【0123】特徴量算出部111は、それぞれ算出した
位相差CLおよび位相差CR、並びに音圧比RLを、検
出部112に出力する。
【0124】検出部112は、特徴量算出部111から
の位相差CLおよび位相差CR、並びに所定の係数(後
述)に基づいて、所定の範囲内で移動する口元(音源)
の位置を検出する。
【0125】検出部112はまた、検出した口元(音
源)の位置に対応する所定の係数(後述)(正確には、
検出された音源の位置に対応する基準位置に対応する係
数)、および特徴量算出部111からの音圧比RLに基
づいて、音源の向きを検出する。
【0126】検出部112は、検出した口元の位置およ
びその向きを、出力部14に供給する。
【0127】図29は、特徴量算出部111の構成例を
示している。
【0128】位相差算出部121は、位相差CL(処理
用音声信号Cの位相に対する処理用音声信号Lの位相の
位相差)を算出する。
【0129】具体的には、位相差算出部121は、処理
用音声信号L,Cを、所定のサンプリング周期Tでサン
プリングして、量子化する。これにより、処理用音声信
号Lからは、N個のサンプルL1乃至LNが、処理用音声
信号Cからは、N個のサンプルC1乃至CNがそれぞれ得
られる。
【0130】位相差算出部121は、次に、jが1乃至
nであるときの式(2)をそれぞれ算出し、その算出結
果の値が最大となるjの値mを検出する。そして位相差
算出部121は、検出した値mにサンプリング周期Tを
乗算し、その乗算結果(時間)を、位相差CLとして、
検出部112に出力する。
【数2】
【0131】すなわち、処理用音声信号Lと処理用音声
信号Cとの相関値が、処理用音声信号Cに対して、処理
用音声信号Lが、n個のサンプル分の時間まで、1サン
プリング時間ずつずらされて算出され、その算出結果に
おいて最も高い相関値が得られたときの時間(値m×サ
ンプリング周期T)が、位相差CLとされる。
【0132】位相差算出部122は、位相差CR(処理
用音声信号Cの位相に対する処理用音声信号Rの位相の
位相差)を算出する。
【0133】具体的には、位相差算出部122は、処理
用音声信号C,Rを、所定のサンプリング周期Tでサン
プリングして、量子化する。これにより、処理用音声信
号Rからは、N個のサンプルR1乃至RNが、処理用音声
信号Cからは、N個のサンプルC1乃至CNがそれぞれ得
られる。
【0134】次に、位相差算出部122は、jが1乃至
nであるときの式(3)をそれぞれ算出し、その算出結
果の値が最大となるjの値mを検出する。そして位相差
算出部122は、検出した値mにサンプリング周期Tを
乗算し、その乗算結果(時間)を、位相差CRとして、
検出部112に出力する。
【数3】
【0135】すなわち、処理用音声信号Rと処理用音声
信号Cとの相関値が、処理用音声信号Cに対して、処理
用音声信号Rが、n個のサンプル分の時間まで、1サン
プリング時間ずつずらされて算出され、その算出結果に
おいて最も高い相関値が得られたときの時間(値m×サ
ンプリング周期T)が、位相差CRとされる。
【0136】音圧算出部123は、入力された処理用音
声信号Lが示す値の2乗平均値、2乗平均の平方根、ま
たは絶対値の平均値を、処理用音声信号Lの音圧Lとし
て算出し、その算出結果を、音圧比算出部125に供給
する。音圧算出部124は、音圧算出部123と同様の
方法で、処理用音声信号Rの音圧Rを算出し、音圧比算
出部125に供給する。
【0137】音圧比算出部125は、音圧算出部123
からの音圧Lと、音圧算出部124からの音圧Rに基づ
いて、音圧比RL(=音圧R/音圧L)を算出し、その
算出結果を、検出部112に供給する。
【0138】図30は、検出部112の構成例を示して
いる。
【0139】位置算出部131は、特徴量算出部111
(位相差算出部121,122)からの位相差CLおよ
び位相差CR、並びに位置係数記憶部132に記憶され
ている、係数aL、係数bL、および係数cLからなるxお
よびyの一次方程式(式(4))、並びに係数aR、係
数bR、および係数cRからなるxおよびyの一次方程式
(式(5))を解き、座標(x,y)(図27)を算出
する。 aL×x+bL×y+cL=位相差CL…(4) aR×x+bR×y+cR=位相差CR…(5)
【0140】位置算出部131は、算出した位置(座標
(x,y))を、向き係数決定部133および出力部1
4に供給する。
【0141】ところで、マイク1Cと口元(音源)の距
離Cと、マイク1Lと音源の距離L、およびマイク1R
と音源の距離Rの関係は、式(6)に示すように表すこ
とができる。 距離L−距離C=ΔL 距離R−距離C=ΔR…(6)
【0142】ΔLおよびΔRは、図31に示すように、X
軸、Y軸、および距離の軸からなる座標空間において、
なだらかな曲面で表される。すなわち、音源が、原点か
ら比較的近い範囲内で移動する場合、ΔLおよびΔRを、
ほぼ平面に近似することができるので、ΔLおよびΔ
Rを、式(7)に示すように、xおよびyの一次方程式
で表すことができる。 a'L×x+b'L×y+c'L=ΔL a'R×x+b'R×y+c'R=ΔR…(7)
【0143】一方、音声は、上述したように、音源から
の距離が長ければ長いほど伝達に時間がかかるので、例
えば、ユーザが、図32に示すように、正面方向に対し
て左側を向いているとき、距離Cは、距離Lより長くな
るので、マイク1Cには、マイク1Lに比べ音源からの
音声が遅れて到達する。
【0144】また、遅れて到達した音声の位相は、先に
到達した音声の位相に比べ遅れるので、すなわち、先に
到達した音声の位相は、後に到達した音声の位相に比べ
進むので、例えば、図32の例の場合、処理用音声信号
Lの位相は、図33(A)に示すように、図33(B)
に示す処理用音声信号Cの位相より進む。このときの位
相のずれが、位相差CLである。
【0145】一方、距離Cが距離Rより長い場合、音源
からの音声は、マイク1Cよりマイク1Rに先に到達す
るので、処理用音声信号Rの位相は、図33(C)に示
すように、処理用音声信号Cの位相より進む。このとき
の位相のずれが、位相差CRである。
【0146】このように、位相差CLおよび位相差CR
は、上述したように、距離L、距離C、および距離Rに
対応する。すなわち、位相差CLおよび位相差CRは、
音源が原点から比較的近い範囲内で移動し、ΔLおよび
ΔRを、平面に近似することができる場合、ΔLおよびΔ
Rに対応するので、位相差CLおよび位相差CRは、上
述した式(4)および式(5)に示すように、xおよび
yの一次方程式で表すことができる。
【0147】このシステムでは、所定の範囲内で移動す
る音源の位置および向きが検出されるが、所定の範囲と
は、ΔLおよびΔRを、平面に近似することができる範
囲内、すなわち、式(7)が成り立つ範囲を意味する。
【0148】位置係数記憶部132に記憶されている係
数aL、係数bL、係数cL、係数aR、係数bR、および
係数cRは、次に説明するように、それら係数に関する
連立一次方程式を、最小自乗法を用いて解くことで求め
られる。
【0149】口元(音源)を、所定の複数の位置(座標
(xk,yk)(k=1,2,…K)で特定されるK箇所
の位置)に移動させ、各位置にあるときの音源から発せ
られた音声を集音し、位相差CLkおよび位相差CRk
算出する実験を行うことで、式(8)および式(9)に
示すように、それぞれK個の、xおよびyの一次方程式
が求められる。
【数4】
【数5】
【0150】式(8)は、式(10)そしてさらに式
(11)に示すように展開することで解くことができ
る。これにより、係数aL、係数bL、および係数cL
求められる。式(9)も、式(12)そしてさらに式
(13)に示すように展開することで解くことができ
る。これにより、係数aR、係数bR、および係数cR
求められる。
【数6】
【数7】
【数8】
【数9】
【0151】なお、式(11)および式(13)中、”
+”が上付された行列は、擬似逆行列である。
【0152】図30に戻り、向き係数決定部133は、
位置算出部131から供給された座標(x,y)に対応
する基準位置(後述)を検出する。
【0153】向き係数決定部133はまた、P個の基準
位置p(p=1,2,…P)のそれぞれに対応する係数
αp、係数βp、係数γp、および係数δpを記憶してお
り、記憶しているそれらの係数から、検出した基準位置
に対応する、係数α、係数β、係数γ、および係数δを
選択し、向き算出部134に供給する。
【0154】向き算出部134は、向き係数決定部13
3からの係数α、係数β係数γ、および係数δ、並び
に特徴量算出部111からの音圧比RLに基づいて、式
(14)に示すθの3次方程式を解いてθを算出し、出
力部14に供給する。
【数10】
【0155】ところで、音圧比RLは、音源の位置およ
び向きにより異なる。例えば、図34に示すように、音
源が、座標(xp,yp)(p=1,2,…9)で特定さ
れる基準位置pにあるときに発せられた音声による音圧
比RLは、それぞれ異なり、また向きによっても異な
る。
【0156】図35(A)は、基準位置p(=4)に位
置し、角度θL乃至角度θRの方向を向いているときの音
源から発生された音声による音圧比RL4を表してい
る。図35(B)は、基準位置p(=5)に位置し、角
度θL乃至角度θRの方向を向いているときの音源から発
生された音声による音圧比RL5を表している。図35
(C)は、基準位置p(=6)に位置し、角度θL乃至
角度θRの方向を向いているときの音源から発生された
音声による音圧比RL6を表している。
【0157】図35(A)乃至(C)に示す軌跡から、
音圧比RLは、式(14)に示すように、角度θの3次
式で近似される。
【0158】向き係数決定部133に記憶されている、
P個の基準位置pのそれぞれに対応する係数αp、係数
βp、係数γp、および係数δpは、次に説明するように
して求められる。
【0159】音源の位置および向きにより音圧比RLが
異なるので、音源が基準位置pに位置し、所定の方向
(角度θq(q=1,2,…Q)の方向)を向いている
ときの音源から発せられる音声の音圧比RLpqを求める
ことで、基準位置1乃至基準位置P毎に、Q個の、θの
3次元方程式が求められる。
【0160】例えば、基準位置1に位置する音源が、そ
れぞれ角度θ1乃至θQの方向を向いているときに発した
音声から、音圧比RL11乃至RL1Qを求めることで、式
(15)に示すような、Q個の、θの3次元方程式が求
められる。
【数11】
【0161】同様にして、基準位置2乃至基準位置Pに
ついても、それぞれQ個の、θの3次元方程式が得ら
れ、これらを、ニュートン法やシンプレックス法などに
よる非線形最小自乗法により解くことで、基準位置1乃
至基準位置P毎に、係数α、係数β、係数γ、および係
数δが求められる。
【0162】次に、検出装置101の動作を、図36の
フローチャートを参照して説明する。
【0163】ステップS61において、検出装置101
の入力部11は、入力したマイクアンプ2L,2C,2
Rのそれぞれからの処理用音声信号L,C,Rの一部
(所定の時間内に入力した部分)を、特徴量算出部11
1に供給する。
【0164】次に、ステップS62において、特徴量算
出部111(位相差算出部121,122)は、入力部
11から供給された処理用音声信号C,Lから、位相差
CLを算出するとともに、処理用音声信号C,Rから、
位相差CRを算出する。算出された位相差CLおよび位
相差CRは、検出部112に供給される。
【0165】ステップS63において、特徴量算出部1
11(音圧算出部123,124、音圧比算出部12
5)は、処理用音声信号L,Rの音圧L,Rをそれぞれ
算出するとともに、音圧比RL(=音圧R/音圧L)を
算出する。算出された音圧比RLは、検出部112に供
給される。
【0166】次に、ステップS64において、検出部1
12(位置算出部131)は、特徴量算出部111から
供給された位相差CL、並びに自分自身(位置係数記憶
部132)が記憶する係数aL、係数bL、および係数c
Lからなる式(4)と、位相差CR、並びに係数aR、係
数bR、および係数cRからなる式(5)の連立方程式を
解き、xおよびyを算出する。算出された座標(x,
y)は、出力部14に供給される。
【0167】ステップS65において、検出部112
(向き係数決定部133)は、算出した座標(x,y)
で特定される位置に最も近い基準位置を検出する。
【0168】次に、ステップS66において、検出部1
12(向き係数決定部133)は、記憶している、P個
の基準位置pのそれぞれに対応する係数αp、係数βp
係数γp、および係数δpから、決定した基準位置に対応
する、係数α、係数β、係数γ、および係数δを選択す
る。
【0169】ステップS67において、検出部112
(向き算出部134)は、特徴量算出部111からの音
圧比RL、並びにステップS66で選択した係数α、係
数β、係数γ、および係数δからなる式(14)を解
き、角度θを算出する。算出された角度θは、出力部1
4に供給される。
【0170】次に、ステップS68において、出力部1
4は、検出部112から供給された座標(x,y)を、
口元(音源)の位置として、そして角度θを、音源の向
きとして外部の装置に出力する。
【0171】その後、処理は終了する。
【0172】なお、以上においては、検出部112にお
いて、算出された座標(x,y)に対応する基準位置が
検出されるとともに、記憶されている、それぞれP個の
係数αp、係数βp、係数γp、および係数δpのうちか
ら、検出された基準位置に対応する係数α、係数β、係
数γ、および係数δが選択されたが、検出部112が、
式(16)乃至式(19)に示すように、係数αが算出
されるx,yの関数e、係数βが算出されるx,yの関
数f、係数γが算出されるx,yの関数g、および係数
δが算出されるx,yの関数hを記憶し、検出された座
標(x,y)でそれらの関数を演算することで、係数
α、係数β、係数γ、および係数δのそれぞれを算出す
ることもできる。 α=e(x,y)…(16) β=f(x,y)…(17) γ=g(x,y)…(18) δ=h(x,y)…(19)
【0173】この場合の検出装置101の動作を、図3
7のフローチャートを参照して説明する。
【0174】ステップS71乃至ステップS74、およ
びステップS77においては、図36のステップS61
乃至ステップS64、およびステップS68における場
合と同様の処理が行われるので、その説明は省略する。
【0175】ステップS75において、検出装置101
の検出部112は、関数e(式(16))、関数f(式
(17))、関数g(式(18))、および関数h(式
(19))をそれぞれ演算し、係数α、係数β、係数
γ、および係数δを算出する。
【0176】次に、ステップS76において、検出部1
12は、特徴量算出部111からの音圧比RL、並びに
ステップS75で算出した係数α、係数β、係数γ、お
よび係数δで、式(14)を演算し、角度θを算出す
る。
【0177】また、以上においては、特徴量算出部11
1は、処理用音声信号L,Rから直接音圧L,Rを算出
し、そして音圧比RLを算出する場合を例として説明し
たが、処理用音声信号L,Rの高周波部分の信号(高周
波処理用音声信号Lh,Rh)の音圧Lh,Rhを算出し、
それらの音圧比RLhを算出することができる。
【0178】この例の場合における特徴量算出部111
の構成例を、図38に示す。この特徴量算出部には、図
29の特徴量算出部111の音圧算出部123および音
圧算出部124の前段に、ハイパスフィルタ141およ
びハイパスフィルタ142が設けられている。
【0179】ハイパスフィルタ141は、入力部11か
ら供給された処理用音声信号Lの高周波部分のみを通過
させて、音圧算出部123に供給する。ハイパスフィル
タ142は、入力部11から供給された処理用音声信号
Rの高周波部分のみを通過させて、音圧算出部124に
供給する。
【0180】音圧算出部123は、高周波処理用音声信
号Lhの音圧Lhを算出し、音圧比算出部125に供給す
る。音圧算出部124は、高周波処理用音声信号Rhの
音圧Rhを算出し、音圧比算出部125に供給する。
【0181】音圧比算出部125は、音圧比RLhを算
出し、検出部112に供給する。
【0182】図39は、本発明を適用した音源状態検出
システムの第5の実施の形態の構成例を示している。こ
のシステムでは、第4の実施の形態における場合と同様
に、所定の範囲内で移動する音源の位置およびその向き
の両方が検出されるが、この例の場合、3次元空間上の
位置および向きが検出される。
【0183】このシステムには、図1に示す検出装置3
に代えて、検出装置201が設けられている他、4個の
マイク1―1乃至マイク1−4、および4個のマイクア
ンプ2−1乃至2−4が設けられている。
【0184】マイク1−1乃至マイク1−4は、図40
に示すような、それぞれ直交するX軸、Y軸、およびZ
軸からなる3次元空間上に一定の広がりを持って配置さ
れている。なお、図40中の原点、X軸、およびY軸
は、図27の原点、X軸、およびY軸に対応するもので
ある。すなわち、図40に示すZ軸は、図27において
は、ユーザから見れば、原点から垂直方向に延びる軸で
ある。
【0185】図39に戻り、マイク1−1乃至マイク1
−4は、音源からの音声(ユーザが発した音声)を集音
し、音声信号として、マイクアンプ2−1乃至2−4に
供給する。
【0186】マイクアンプ2−1乃至2−4は、マイク
1−1乃至1−4からの音声信号を増幅し、処理用音声
信号S1乃至S4として、検出装置201に供給する。
【0187】検出装置201は、音源(口元)の位置に
対応する、図40の3次元空間における座標(x,y,
z)を検出するとともに、口元の向きに対応する、Z軸
の回りの角度θ、Y軸の回りの角度φ、およびX軸の回
りの角度ψのそれぞれを検出する。
【0188】図41は、検出装置201の構成例を示し
ている。この検出装置201には、図4の検出装置3の
特徴量算出部12に代えて特徴量算出部211が、また
検出部13に代えて、検出部212が設けられている。
【0189】入力部11は、マイクアンプ2−1乃至2
−4のそれぞれから適宜供給される処理用音声信号S1
乃至S4を入力し、特徴量算出部211に供給する。
【0190】特徴量算出部211は、処理用音声信号S
1の位相と処理用音声信号S2の位相との差(以下、位
相差A1と称する)、処理用音声信号S2の位相と処理
用音声信号S3の位相との差(以下、位相差A2と称す
る)、および処理用音声信号S3の位相と処理用音声信
号S4の位相との差(以下、位相差A3と称する)を、
それぞれ算出する。
【0191】特徴量算出部211はまた、処理用音声信
号S1乃至S4の音圧をそれぞれ算出するとともに、処
理用音声信号S1の音圧と処理用音声信号S2の音圧の
比(以下、音圧比B1と称する)、処理用音声信号S2
の音圧と処理用音声信号S3の音圧の比(以下、音圧比
B2と称する)、処理用音声信号S3の音圧と処理用音
声信号S4の音圧の比(以下、音圧比B3と称する)
を、それぞれ算出する。
【0192】特徴量算出部211は、算出した位相差A
1乃至位相差A3、および音圧比B1乃至音圧比B3
を、検出部212に出力する。
【0193】検出部212は、特徴量算出部211から
の位相差A1乃至位相差A3、および所定の係数(後
述)に基づいて、口元(音源)の位置を表す座標(x,
y,z)を算出する。
【0194】検出部212はまた、予め求められた、所
定の位置、所定の向き、並びにその位置およびその向き
の音源から発せられた音声の音圧比B1乃至B3の対応
関係を表すデータから、算出した音圧比B1乃至B3お
よび算出した音源の位置(座標)に対応する向きを、こ
のときの音源の向きとして検出する。
【0195】図42は、特徴量算出部211の構成例を
示している。
【0196】位相差算出部221は、位相差A1を算出
し、検出部212に供給する。位相差算出部222は、
位相差A2を算出し、検出部212に供給する。位相差
算出部223は、位相差A3を算出し、検出部212に
供給する。
【0197】音圧算出部224は、処理用音声信号S1
の音圧を算出し、音圧比算出部228に供給する。音圧
算出部225は、処理用音声信号S2の音圧を算出し、
音圧比算出部228および音圧比算出部229に供給す
る。
【0198】音圧算出部226は、処理用音声信号S3
の音圧を算出し、音圧比算出部229および音圧比算出
部230に供給する。音圧算出部227は、処理用音声
信号S4の音圧を算出し、音圧比算出部230に供給す
る。
【0199】音圧比算出部228は、音圧比B1を算出
し、検出部212に供給する。音圧比算出部229は、
音圧比B2を算出し、検出部212に供給する。音圧比
算出部230は、音圧比B3を算出し、検出部212に
供給する。
【0200】図43は、検出部212の構成例を示して
いる。
【0201】位置算出部241には、特徴量算出部21
1(位相差算出部221乃至位相差算出部223)から
の位相差A1乃至位相差A3、並びに位置係数記憶部2
42に記憶されている係数a1、係数b1、係数c1、およ
び係数d1、係数a2、係数b2、係数c2、および係数
2、並びに係数a3、係数b3、係数c3、および係数d3
が供給される。
【0202】位置算出部241は、係数a1、係数b1
係数c1、および係数d1、並びに位相差A1からなる
x,y,zの1次方程式(式(20))、係数a2、係数
2、係数c2、および係数d2、並びに位相差A2から
なるx,y,zの1次方程式(式(21))、そして係
数a3、係数b3、係数c3、および係数d3、並びに位相
差A3からなるx,y,zの1次方程式(式(22))
の連立方程式を演算し、x,y,zを算出する。 a1×x+b1×y+c1×z+d1=位相差A1…(20) a2×x+b2×y+c2×z+d2=位相差A2…(21) a3×x+b3×y+c3×z+d3=位相差A3…(22)
【0203】位置算出部241は、算出した座標(x,
y,z)(音源の位置)を、向き検出部243および出
力部14に供給する。
【0204】位置係数記憶部242が記憶する、係数a
1乃至d1、係数a2乃至d2、および係数a3乃至d3は、
基本的には、第4の実施の形態における係数aL乃至cL
および係数aR乃至cRを算出する場合と同様にして求め
られる。
【0205】すなわち、口元(音源)を、所定の複数の
位置(座標(xk,yk,zk))に移動させ、各位置に
あるときの音源から発せられた音声を集音し、位相差A
K、位相差A2k、および位相差A3kを算出する実験
を行うことで、式(23)乃至式(25)に示すような
連立方程式が求められる。
【数12】
【数13】
【数14】
【0206】式(23)乃至式(25)を、最小自乗法
により解くことで、係数a1乃至d1、係数a2乃至d2
および係数a3乃至d3のそれぞれが求められる。
【0207】向き検出部243は、図44に示すよう
な、予め求められた、所定の位置(座標(x,y,
z))、所定の向き(角度θ,φ,ψ)、並びにその位
置およびその向きの音源から発せられた音声の音圧比B
1,B2,B3の対応関係を表す対応表を記憶してい
る。すなわち、向き検出部243は、位置算出部241
からの座標(x,y,z)および特徴量算出部211か
らの音圧比B1,B2,B3に基づいて、それらに対応
する角度θ,φ,ψを、音源の向きとして検出し、出力
部14に出力する。
【0208】この例の場合の検出装置201の動作を、
図45のフローチャートを参照して説明する。
【0209】ステップS81において、検出装置201
の入力部11は、入力したマイクアンプ2−1乃至2−
4のそれぞれからの処理用音声信号S1乃至S4の一部
(所定の時間内に入力した部分)を、特徴量算出部21
1に供給する。
【0210】次に、ステップS82において、特徴量算
出部211(位相差算出部221乃至223)は、マイ
クアンプ2―1乃至2−4から供給された処理用音声信
号S1乃至S4から、処理用音声信号S1の位相と処理
用音声信号S2の位相との位相差A1、処理用音声信号
S2の位相と処理用音声信号S3の位相との位相差A
2、および処理用音声信号S3の位相と処理用音声信号
S4の位相との位相差A3をそれぞれ算出する。算出さ
れた位相差A1乃至位相差A3は、検出部212に供給
される。
【0211】ステップS83において、特徴量算出部2
11(音圧算出部224乃至227、音圧比算出部22
8乃至230)は、処理用音声信号S1,S2,S3,
S4の音圧を算出するとともに、処理用音声信号S1,
S2の音圧から、音圧比B1を、処理用音声信号S2,
S3の音圧から、音圧比B2を、そして処理用音声信号
S3,S4の音圧から、音圧比B3を、それぞれ算出す
る。算出された音圧比B1乃至音圧比B3は、検出部2
12に供給される。
【0212】次に、ステップS84において、検出部2
12(位置算出部241)は、特徴量算出部211から
供給された位相差A1乃至位相差A3、並びに自分自身
(位置係数記憶部242)が記憶する係数a1乃至d1
係数a2乃至d2、および係数a3乃至d3の式(20)乃
至式(22)からなる連立方程式を解き、x、y、およ
びzを算出する。算出された座標(x,y,z)は、出
力部14に供給される。
【0213】ステップS85において、検出部212
(向き検出部243)は、図44の対応表から、算出さ
れた座標(x,y,z)に最も近い座標および算出され
た音圧比B1,B2,B3に最も近い音圧比を検出する
とともに、それらに対応する角度θ,φ,角度ψを検出
する。検出された角度θ、角度φ、および角度ψは、出
力部14に供給される。
【0214】ステップS86において、出力部14は、
検出部212から供給された座標(x,y,z)を、口
元(音源)の位置として、並びに角度θ、角度φ、およ
び角度ψを、口元の向きとして、外部の装置に出力す
る。
【0215】その後、処理は終了する。
【0216】なお、以上においては、特徴量算出部21
1は、処理用音声信号S1乃至S4から直接音圧を算出
し、そして音圧比B1乃至B3を算出する場合を例とし
て説明したが、処理用音声信号S1乃至S4の高周波部
分の信号(高周波処理用音声信号S1h乃至S4h)の音
圧を算出し、それらの音圧比B1h乃至B3hを算出する
こともできる。高周波部分の信号の音圧比は、音源との
距離に応じても変化するが、指向性があることから、そ
れを利用することで、より正確に音源の向きを検出する
ことができる。特に有効である。
【0217】この例の場合における特徴量算出部211
の構成例を、図46に示す。この特徴量算出部211に
は、図42の特徴量算出部211の音圧算出部224乃
至227の前段に、ハイパスフィルタ251乃至254
が設けられている。
【0218】ハイパスフィルタ251は、入力部11か
ら供給された処理用音声信号S1の高周波部分のみを通
過させて、音圧算出部224に供給する。ハイパスフィ
ルタ252は、入力部11から供給された処理用音声信
号S2の高周波部分のみを通過させて、音圧算出部22
5に供給する。
【0219】ハイパスフィルタ253は、入力部11か
ら供給された処理用音声信号S3の高周波部分のみを通
過させて、音圧算出部226に供給する。ハイパスフィ
ルタ254は、入力部11から供給された処理用音声信
号S4の高周波部分のみを通過させて、音圧算出部22
7に供給する。
【0220】音圧算出部224は、高周波処理用音声信
号S1hの音圧を算出し、音圧比算出部228に供給す
る。音圧算出部225は、高周波処理用音声信号S2h
の音圧を算出し、音圧比算出部228および音圧比算出
部229に供給する。
【0221】音圧算出部226は、高周波処理用音声信
号S3hの音圧を算出し、音圧比算出部229および音
圧比算出部230に供給する。音圧算出部227は、高
周波処理用音声信号S4hの音圧を算出し、音圧比算出
部230に供給する。
【0222】音圧比算出部228は、高周波処理用音声
信号S1hの音圧と高周波処理用音声信号S2hの音圧と
の音圧比B1を算出し、検出部212に供給する。音圧
比算出部229は、高周波処理用音声信号S2hの音圧
と高周波処理用音声信号S3hの音圧との音圧比B2を
算出し、検出部212に供給する。音圧比算出部230
は、高周波処理用音声信号S3hの音圧と高周波処理用
音声信号S4hの音圧との音圧比B3を算出し、検出部
212に供給する。
【0223】なお、以上においては、音源(口元)の状
態(位置、または向き)を検出するタイミングについて
は、言及しなかったが、検出装置3,31,61,10
1,201に、操作部を設け、その操作部が操作された
とき、音源の状態が検出されるようにしたり、また所定
の周期で、所定の期間継続して検出されるようにしたり
することができる。
【0224】また、以上においては、第1の実施の形態
乃至第5の実施の形態について、それぞれ別個に説明し
たが、それらを組み合わせて、ユーザの状態を検出する
ようにすることもできる。例えば、第4の実施の形態お
よび第5の実施の形態においては、音源の位置および向
きの両方を算出する場合を例として説明したが、音源の
位置のみを検出することもできる。
【0225】また、第4の実施の形態および第5の実施
の形態において、処理用音声信号から直接音圧を算出
し、その音圧で音圧比を算出する場合と、高周波処理用
音声信号の音圧を算出し、その音圧で音圧比を算出する
場合を別個に説明したが、それらを組み合わせて利用す
ることもできる。
【0226】上述した一連の処理は、ハードウエアによ
り実現させることもできるが、ソフトウエアにより実現
させることもできる。一連の処理をソフトウエアにより
実現する場合には、そのソフトウエアを構成するプログ
ラムがコンピュータにインストールされ、そのプログラ
ムがコンピュータで実行されることより、上述した検出
装置3,31,61,101,201が機能的に実現さ
れる。
【0227】図47は、上述のような検出装置3,3
1,61,101,102として機能するコンピュータ
501の一実施の形態の構成を示すブロック図である。
CPU(Central Processing Unit)511にはバス515
を介して入出力インタフェース516が接続されてお
り、CPU511は、入出力インタフェース516を介し
て、ユーザから、キーボード、マウスなどよりなる入力
部518から指令が入力されると、例えば、ROM(Read
Only Memory)512、ハードディスク514、または
ドライブ520に装着される磁気ディスク531、光デ
ィスク532、光磁気ディスク533、若しくは半導体
メモリ534などの記録媒体に格納されているプログラ
ムを、RAM(Random Access Memory)513にロードし
て実行する。これにより、上述した各種の処理が行われ
る。さらに、CPU511は、その処理結果を、例えば、
入出力インタフェース516を介して、LCD(Liquid Cr
ystalDisplay)などよりなる表示部517に必要に応じ
て出力する。なお、プログラムは、ハードディスク51
4やROM512に予め記憶しておき、コンピュータ50
1と一体的にユーザに提供したり、磁気ディスク53
1、光ディスク532、光磁気ディスク533,半導体
メモリ534等のパッケージメディアとして提供した
り、衛星、ネットワーク等から通信部519を介してハ
ードディスク514に提供することができる。
【0228】なお、本明細書において、記録媒体により
提供されるプログラムを記述するステップは、記載され
た順序に沿って時系列的に行われる処理はもちろん、必
ずしも時系列的に処理されなくとも、並列的あるいは個
別に実行される処理をも含むものである。
【0229】また、本明細書において、システムとは、
複数の装置により構成される装置全体を表すものであ
る。
【0230】
【発明の効果】本発明の情報処理装置および方法、並び
に第1のプログラムによれば、所定の位置に設置された
複数の集音装置により集音された、所定の音源が発した
音声に対応する音声信号から、音源の状態に対応する特
徴量を算出し、算出された特徴量に基づいて、音源の状
態を検出するようにしたので、音源が発した音声から、
音源の状態を検出することができる。
【0231】本発明の情報生成装置および方法、並びに
第2のプログラムによれば、第1の集音装置、第2の集
音装置、および第3の集音装置のそれぞれにより集音さ
れた、所定の範囲内に設けられた複数の実験位置に位置
した音源が発した音声に対応する第4の音声信号、第5
の音声信号、および第6の音声信号から、第4の音声信
号の位相と第5の音声信号の位相との第3の位相差、お
よび第4の音声信号の位相と第6の音声信号との第4の
位相差を、実験位置毎に算出するようにしたので、第3
の位相差と実験位置との関係に基づいて、第1の係数を
算出し、第4の位相差と実験位置との関係に基づいて、
第2の係数が算出することができる。
【図面の簡単な説明】
【図1】本発明を適用した音源状態検出システムの第1
の実施の形態の構成例を示すブロック図である。
【図2】マイク1の設置位置を示す図である。
【図3】音圧比RLと音源の向きとの対応関係を示す図
である。
【図4】図1の検出装置3の構成例を示すブロック図で
ある。
【図5】図4の特徴量算出部12の構成例を示すブロッ
ク図である。
【図6】音源状態検出システムの動作を説明するフロー
チャートである。
【図7】図6のステップS3の処理の詳細を説明するフ
ローチャートである。
【図8】本発明を適用した音源状態検出システムの第2
の実施の形態の構成例を示すブロック図である。
【図9】マイク1の設置位置を示す他の図である。
【図10】音圧比RLhと音源の向きとの対応関係を示
す図である。
【図11】図8の検出装置31の構成例を示すブロック
図である。
【図12】図11の特徴量算出部41の構成例を示すブ
ロック図である。
【図13】カットオフ特性を示す図である。
【図14】ピッチ周波数を説明する図である。
【図15】音源状態検出システムの他の動作を説明する
フローチャートである。
【図16】図15のステップS23の処理の詳細を説明
するフローチャートである。
【図17】本発明を適用した音源状態検出システムの第
3の実施の形態の構成例を示すブロック図である。
【図18】位相差と顔の向きとの対応関係を示す図であ
る。
【図19】位相差を説明する図である。
【図20】位相差を説明する他の図である。
【図21】位相差を説明する他の図である。
【図22】図17の検出装置61の構成例を示すブロッ
ク図である。
【図23】音源状態検出システムの他の動作を説明する
フローチャートである。
【図24】図23のステップS43の処理の詳細を説明
するフローチャートである。
【図25】本発明を適用した音源状態検出システムの第
4の実施の形態の構成例を示すブロック図である。
【図26】マイク1の配置位置を説明する図である。
【図27】位置および向きを説明する図である。
【図28】図25の検出装置101の構成例を示すブロ
ック図である。
【図29】図28の特徴量算出部111の構成例を示す
ブロック図である。
【図30】図28の検出部112の構成例を示すブロッ
ク図である。
【図31】ΔLおよびΔRを説明する図である。
【図32】距離Cおよび距離Lを説明する図である。
【図33】位相差CLおよび位相差CRを説明する図で
ある。
【図34】基準位置pを説明する図である。
【図35】音圧比RLを説明する図である。
【図36】検出装置101の動作を説明するフローチャ
ートである。
【図37】検出装置101の他の動作を説明するフロー
チャートである。
【図38】特徴量算出部111の他の構成例を示すブロ
ック図である。
【図39】本発明を適用した音源状態検出システムの第
5の実施の形態の構成例を示すブロック図である。
【図40】位置および向きを説明する他の図である。
【図41】図39の検出装置201の構成例を示すブロ
ック図である。
【図42】図41の特徴量算出部211の構成例を示す
ブロック図である。
【図43】図41の検出部212の構成例を示すブロッ
ク図である。
【図44】座標、音圧比、および角度の対応関係を示す
対応表の例を示す図である。
【図45】検出装置202の動作を説明するフローチャ
ートである。
【図46】特徴量算出部211の他の構成例を示すブロ
ック図である。
【図47】パーソナルコンピュータ501の構成例を示
すブロック図である。
【符号の説明】 1 マイクロフォン, 2 マイクアンプ, 3 検出
装置, 11 入力部, 12 特徴量算出部, 13
検出部, 14 出力部, 21 音圧算出部, 2
2 音圧比算出部, 31 検出装置, 41 特徴量
算出部, 42検出部, 51 ハイパスフィルタ,
61 検出装置, 71 特徴量算出部, 72 検出
部, 101 検出装置, 111 特徴量算出部,
112検出部, 121 位相差算出部, 122 位
相差算出部, 123 音圧算出部, 124 音圧算
出部, 125 音圧比算出部, 131 位置算出
部, 132 位置係数記憶部, 133 向き係数決
定部, 134 向き算出部, 141 ハイパスフィ
ルタ, 142 ハイパスフィルタ, 201検出装
置, 211 特徴量算出部, 212 検出部, 2
21 位相差算出部, 222 位相差算出部, 22
3 位相差算出部, 224 音圧算出部, 225
音圧算出部, 226 音圧算出部, 227 音圧算
出部, 228 音圧比算出部, 229 音圧比算出
部, 230 音圧比算出部, 241 位置算出部,
242 位置係数記憶部, 243 向き検出部,
251 ハイパスフィルタ, 252 ハイパスフィル
タ, 253 ハイパスフィルタ, 254 ハイパス
フィルタ
───────────────────────────────────────────────────── フロントページの続き (72)発明者 藤島 幸一 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 (72)発明者 大月 知之 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 Fターム(参考) 5D018 BB23 5D020 BB04

Claims (22)

    【特許請求の範囲】
  1. 【請求項1】 所定の位置に設置された複数の集音装置
    により集音された、所定の音源が発した音声に対応する
    音声信号から、前記音源の状態に対応する特徴量を算出
    する第1の算出手段と、 前記第1の算出手段により算出された前記特徴量に基づ
    いて、前記音源の状態を検出する状態検出手段とを備え
    ることを特徴とする情報処理装置。
  2. 【請求項2】 前記状態は、所定の位置にある前記音源
    の向きであることを特徴とする請求項1の情報処理装
    置。
  3. 【請求項3】 前記状態検出手段は、予め求められた、
    前記特徴量と前記状態との対応関係を示す対応関係デー
    タを保持し、前記対応関係データおよび前記特徴量に基
    づいて、前記状態を検出することを特徴とする請求項1
    に記載の情報処理装置。
  4. 【請求項4】 前記第1の算出手段は、第1の前記集音
    装置により集音された、前記音源が発した音声に対応す
    る第1の前記音声信号、および第2の前記集音装置によ
    り集音された、前記音源が発した音声に対応する第2の
    前記音声信号から、前記第1の音声信号の音圧と前記第
    2の音声信号の音圧との音圧比を、前記特徴量として算
    出し、 前記状態検出手段は、予め求められた、前記音圧比と前
    記状態との対応関係を示す前記対応関係データを保持
    し、前記対応関係データおよび前記音圧比に基づいて、
    前記状態を検出することを特徴とする請求項3に記載の
    情報処理装置。
  5. 【請求項5】 前記第1の算出手段は、第1の前記集音
    装置により集音された、前記音源が発した音声に対応す
    る第1の前記音声信号、および第2の前記集音装置によ
    り集音された、前記音源が発した音声に対応する第2の
    前記音声信号から、前記第1の音声信号の高周波部分か
    らなる第1の高周波音声信号の音圧と、前記第2の音声
    信号の高周波部分からなる第2の高周波音声信号の音圧
    との音圧比を、前記特徴量として算出し、 前記状態検出手段は、予め求められた、前記音圧比と前
    記状態との対応関係を示す前記対応関係データを保持
    し、前記対応関係データおよび前記音圧比に基づいて、
    前記状態を検出することを特徴とする請求項3に記載の
    情報処理装置。
  6. 【請求項6】 前記第1の算出手段は、第1の前記集音
    装置により集音された、前記音源が発した音声に対応す
    る第1の前記音声信号、および第2の前記集音装置によ
    り集音された、前記音源が発した音声に対応する第2の
    前記音声信号から、前記第1の音声信号の位相と前記第
    2の音声信号の位相との位相差を、前記特徴量として算
    出し、 前記状態検出手段は、予め求められた、前記位相差と前
    記状態との対応関係を示す前記対応関係データを保持
    し、前記対応関係データおよび前記位相差に基づいて、
    前記状態を検出することを特徴とする請求項3に記載の
    情報処理装置。
  7. 【請求項7】 前記第1の算出手段は、第1の前記集音
    装置、第2の前記集音装置、および第3の前記集音装置
    により集音された、所定の範囲内に位置する前記音源が
    発した音声に対応する第1の前記音声信号、第2の前記
    音声信号、および第3の前記音声信号から、前記第1の
    音声信号の位相と前記第2の音声信号の位相との第1の
    位相差、および前記第1の音声信号の位相と前記第3の
    音声信号の位相との第2の位相差を、前記特徴量として
    算出し、 前記状態検出手段は、前記第1の位相差および前記第2
    の位相差に基づいて、前記音源の、平面上の位置を検出
    することを特徴とする請求項1に記載の情報処理装置。
  8. 【請求項8】 前記第1の集音装置、前記第2の集音装
    置、および前記第3の集音装置のそれぞれにより集音さ
    れた、所定の範囲内に設けられた複数の実験位置に位置
    した前記音源が発した音声に対応する第4の前記音声信
    号、第5の前記音声信号、および第6の前記音声信号か
    ら、前記第4の音声信号の位相と前記第5の音声信号の
    位相との第3の位相差、および前記第4の音声信号の位
    相と前記第6の音声信号との第4の位相差を、前記実験
    位置毎に算出し、さらに、前記第3の位相差と前記実験
    位置との関係に基づく第1の係数、および前記第4の位
    相差と前記実験位置との関係に基づく第2の係数を算出
    する第2の算出手段と、前記第2の算出手段により算出
    された前記第1の係数および前記第2の係数を記憶する
    記憶手段とをさらに備え、 前記状態検出手段は、前記第1の位相差と前記第1の係
    数との関係、および前記第2の位相差と前記第2の係数
    との関係に基づいて、前記音源の、平面上の位置を検出
    することを特徴とする請求項7に記載の情報処理装置。
  9. 【請求項9】 前記第1の算出手段は、前記第2の音声
    信号および前記第3の音声信号から、前記第2の音声信
    号の音圧と前記第3の音声信号の音圧との第1の音圧比
    を、前記特徴量として、さらに算出し、 前記状態検出手段は、前記第1の音圧比および検出した
    前記音源の位置に基づいて、前記音源の向きを検出する
    ことを特徴とする請求項7に記載の情報処理装置。
  10. 【請求項10】 前記第2の集音装置および前記第3の
    集音装置のそれぞれにより集音された、複数の基準位置
    に位置し、所定の方向を向いた前記音源が発した音声に
    対応する第4の前記音声信号および第5の前記音声信号
    から、前記第4の音声信号の音圧と前記第5の音声信号
    の音圧の第2の音圧比を算出し、さらに、前記第2の音
    圧比と前記所定の方向との関係に基づく係数を、前記基
    準位置毎に算出する第2の算出手段と、 前記係数を、前記基準位置に対応させて記憶する記憶手
    段とをさらに備え、 前記状態検出手段は、検出した前記音源の位置に対応す
    る前記基準位置を検出するとともに、前記記憶手段か
    ら、検出した前記基準位置に対応する前記係数を選択
    し、選択した前記係数および前記第1の音圧比との関係
    に基づいて、前記音源の向きを検出することを特徴とす
    る請求項9に記載の情報処理装置。
  11. 【請求項11】 前記第1の算出手段は、第1の前記集
    音装置、第2の前記集音装置、第3の前記集音装置、お
    よび第4の前記集音装置により集音された、所定の範囲
    内に位置する前記音源が発した音声に対応する第1の前
    記音声信号、第2の前記音声信号、第3の前記音声信
    号、および第4の前記音声信号から、前記第1の音声信
    号の位相と前記第2の音声信号の位相との第1の位相
    差、前記第2の音声信号の位相と前記第3の音声信号の
    位相との第2の位相差、および前記第3の音声信号の位
    相と前記第4の音声信号の位相との第3の位相差を、前
    記特徴量として算出し、 前記状態検出手段は、前記第1の位相差、前記第2の位
    相差、および前記第3の位相差に基づいて、前記音源
    の、空間上の位置を検出することを特徴とする請求項1
    に記載の情報処理装置。
  12. 【請求項12】 前記第1の集音装置、前記第2の集音
    装置、前記第3の集音装置、および前記第4の集音装置
    のそれぞれにより集音された、所定の範囲内に設けられ
    た複数の実験位置に位置した前記音源が発した音声に対
    応する第5の前記音声信号、第6の前記音声信号、第7
    の前記音声信号、および第8の前記音声信号から、前記
    第5の音声信号の位相と前記第6の音声信号の位相との
    第4の位相差、前記第6の音声信号の位相と前記第7の
    音声信号の位相との第5の位相差、および前記第7の音
    声信号の位相と前記第8の音声信号の位相との第6の位
    相差を、前記実験位置毎に算出し、さらに、前記第4の
    位相差と前記実験位置との関係に基づく第1の係数、前
    記第5の位相差と前記実験位置との関係に基づく第2の
    係数、および前記第6の位相差と前記実験位置との関係
    に基づく第3の係数を算出する第2の算出手段と、 前記第2の算出手段により算出された前記第1の係数、
    前記第2の係数、および前記第3の係数を記憶する記憶
    手段とをさらに備え、 前記状態検出手段は、前記第1の位相差と前記第1の係
    数との関係、前記第2の位相差と前記第2の係数との関
    係、および前記第3の位相差と前記第3の係数との関係
    に基づいて、前記音源の、空間上の位置を検出すること
    を特徴とする請求項11に記載の情報処理装置。
  13. 【請求項13】 前記第1の算出手段は、前記第1の音
    声信号、前記第2の音声信号、前記第3の音声信号、お
    よび前記第4の音声信号から、前記第1の音声信号の音
    圧と前記第2の音声信号の音圧との第1の音圧比、前記
    第2の音声信号の音圧と前記第3の音声信号の音圧との
    第2の音圧比、および前記第3の音声信号の音圧と前記
    第4の音声信号の音圧との第3の音圧比を、前記特徴量
    として、さらに算出し、 前記状態検出手段は、前記第1の音圧比、前記第2の音
    圧比、および前記第3の音圧比、並びに検出した前記音
    源の位置に基づいて、前記音源の向きを検出することを
    特徴とする請求項11に記載の情報処理装置。
  14. 【請求項14】 前記第1の集音装置、前記第2の集音
    装置、前記第3の集音装置、および前記第4の集音装置
    のそれぞれにより集音された、複数の基準位置に位置
    し、所定の方向を向いた前記音源が発した音声に対応す
    る第5の前記音声信号、第6の前記音声信号、第7の前
    記音声信号、および第8の前記音声信号から、前記第5
    の音声信号の音圧と前記第6の音声信号の音圧との第4
    の音圧比、前記第6の音声信号の音圧と前記第7の音声
    信号の音圧との第5の音圧比、および前記第7の音声信
    号の音圧と前記第8の音声信号の音圧との第6の音圧比
    をそれぞれ算出する第2の算出手段と、 前記基準位置に対応させて、前記第4の音圧比、前記第
    5の音圧比、および前記第6の音圧比、並びに前記方向
    を記憶する記憶手段とをさらに備え、 前記状態検出手段は、前記記憶手段から、検出した前記
    音源の位置に対応する、前記基準位置、および前記第1
    の音圧比、前記第2の音圧比と前記第3の音圧比に対応
    する前記第4の音圧比、前記第5の音圧比と前記第6の
    音圧比に対応する方向を、音源の向きとして検出するこ
    とを特徴とする請求項13に記載の情報処理装置。
  15. 【請求項15】 所定の位置に設置された複数の集音装
    置により集音された、所定の音源が発した音声に対応す
    る音声信号から、前記音源の状態に対応する特徴量を算
    出する算出ステップと、 算出ステップの処理で算出された前記特徴量に基づい
    て、前記音源の状態を検出する状態検出ステップとを含
    むことを特徴とする情報処理方法。
  16. 【請求項16】 所定の位置に設置された複数の集音装
    置により集音された、所定の音源が発した音声に対応す
    る音声信号から、前記音源の状態に対応する特徴量を算
    出する算出ステップと、 算出ステップの処理で算出された前記特徴量に基づい
    て、前記音源の状態を検出する状態検出ステップとを含
    むことを特徴とするコンピュータが読み取り可能なプロ
    グラムが記録されている記録媒体。
  17. 【請求項17】 所定の位置に設置された複数の集音装
    置により集音された、所定の音源が発した音声に対応す
    る音声信号から、前記音源の状態に対応する特徴量を算
    出する算出ステップと、 算出ステップの処理で算出された前記特徴量に基づい
    て、前記音源の状態を検出する状態検出ステップとを含
    む処理をコンピュータに実行させることを特徴とするプ
    ログラム。
  18. 【請求項18】 第1の集音装置、第2の集音装置、お
    よび第3の集音装置により集音された、所定の範囲内に
    位置する音源が発した音声に対応する第1の音声信号、
    第2の音声信号、および第3の音声信号から、前記第1
    の音声信号の位相と前記第2の音声信号の位相との第1
    の位相差、および前記第1の音声信号の位相と前記第3
    の音声信号の位相との第2の位相差を算出し、前記第1
    の位相差と第1の係数との関係、および前記第2の位相
    差と第2の係数との関係に基づいて、前記音源の位置を
    検出する検出装置に対して前記第1の係数および前記第
    2の係数を生成する情報生成装置において、 前記第1の集音装置、前記第2の集音装置、および前記
    第3の集音装置のそれぞれにより集音された、所定の範
    囲内に設けられた複数の実験位置に位置した前記音源が
    発した音声に対応する第4の前記音声信号、第5の前記
    音声信号、および第6の前記音声信号から、前記第4の
    音声信号の位相と前記第5の音声信号の位相との第3の
    位相差、および前記第4の音声信号の位相と前記第6の
    音声信号との第4の位相差を、前記実験位置毎に算出す
    る第1の算出手段と、 前記第3の位相差と前記実験位置との関係に基づいて、
    前記第1の係数を算出し、前記第4の位相差と前記実験
    位置との関係に基づいて、前記第2の係数を算出する第
    2の算出手段とを備えることを特徴とする情報生成装
    置。
  19. 【請求項19】 前記検出装置は、前記第2の集音装置
    および前記第3の集音装置のそれぞれにより集音され
    た、複数の基準位置に位置する前記音源が発した音声に
    対応する第7の前記音声信号および第8の前記音声信号
    から、前記第7の音声信号の音圧と前記第8の音声信号
    の音圧の音圧比を算出し、前記音圧比と第3の係数との
    関係に基づいて、前記音源の向きをさらに検出し、 前記第2の集音装置および前記第3の集音装置のそれぞ
    れにより集音された、複数の基準位置に位置する前記音
    源が発した音声に対応する第9の前記音声信号および第
    10の前記音声信号から、前記第9の音声信号の音圧と
    前記第10の音声信号の音圧の音圧比を算出する第3の
    算出手段と、 前記第9の音声信号の音圧と前記第10の音声信号の音
    圧の音圧比と前記実験位置との関係に基づいて、前記第
    3の係数を算出する第4の算出手段とをさらに備える請
    求項18に記載の情報生成装置。
  20. 【請求項20】 第1の集音装置、第2の集音装置、お
    よび第3の集音装置により集音された、所定の範囲内に
    位置する音源が発した音声に対応する第1の音声信号、
    第2の音声信号、および第3の音声信号から、前記第1
    の音声信号の位相と前記第2の音声信号の位相との第1
    の位相差、および前記第1の音声信号の位相と前記第3
    の音声信号の位相との第2の位相差を算出し、前記第1
    の位相差と第1の係数との関係、および前記第2の位相
    差と第2の係数との関係に基づいて、前記音源の位置を
    検出する検出装置に対して前記第1の係数および前記第
    2の係数を生成する情報生成装置の情報生成方法におい
    て、 前記第1の集音装置、前記第2の集音装置、および前記
    第3の集音装置のそれぞれにより集音された、所定の範
    囲内に設けられた複数の実験位置に位置した前記音源が
    発した音声に対応する第4の前記音声信号、第5の前記
    音声信号、および第6の前記音声信号から、前記第4の
    音声信号の位相と前記第5の音声信号の位相との第3の
    位相差、および前記第4の音声信号の位相と前記第6の
    音声信号との第4の位相差を、前記実験位置毎に算出す
    る第1の算出ステップと、 前記第3の位相差と前記実験位置との関係に基づいて、
    前記第1の係数を算出し、前記第4の位相差と前記実験
    位置との関係に基づいて、前記第2の係数を算出する第
    2の算出ステップとを含むことを特徴とする情報生成方
    法。
  21. 【請求項21】 第1の集音装置、第2の集音装置、お
    よび第3の集音装置により集音された、所定の範囲内に
    位置する音源が発した音声に対応する第1の音声信号、
    第2の音声信号、および第3の音声信号から、前記第1
    の音声信号の位相と前記第2の音声信号の位相との第1
    の位相差、および前記第1の音声信号の位相と前記第3
    の音声信号の位相との第2の位相差を算出し、前記第1
    の位相差と第1の係数との関係、および前記第2の位相
    差と第2の係数との関係に基づいて、前記音源の位置を
    検出する検出装置に対して前記第1の係数および前記第
    2の係数を生成する情報生成装置のプログラムであっ
    て、 前記第1の集音装置、前記第2の集音装置、および前記
    第3の集音装置のそれぞれにより集音された、所定の範
    囲内に設けられた複数の実験位置に位置した前記音源が
    発した音声に対応する第4の前記音声信号、第5の前記
    音声信号、および第6の前記音声信号から、前記第4の
    音声信号の位相と前記第5の音声信号の位相との第3の
    位相差、および前記第4の音声信号の位相と前記第6の
    音声信号との第4の位相差を、前記実験位置毎に算出す
    る第1の算出ステップと、 前記第3の位相差と前記実験位置との関係に基づいて、
    前記第1の係数を算出し、前記第4の位相差と前記実験
    位置との関係に基づいて、前記第2の係数を算出する第
    2の算出ステップとを含むことを特徴とするコンピュー
    タが読み取り可能なプログラムが記録されている記録媒
    体。
  22. 【請求項22】 第1の集音装置、第2の集音装置、お
    よび第3の集音装置により集音された、所定の範囲内に
    位置する音源が発した音声に対応する第1の音声信号、
    第2の音声信号、および第3の音声信号から、前記第1
    の音声信号の位相と前記第2の音声信号の位相との第1
    の位相差、および前記第1の音声信号の位相と前記第3
    の音声信号の位相との第2の位相差を算出し、前記第1
    の位相差と第1の係数との関係、および前記第2の位相
    差と第2の係数との関係に基づいて、前記音源の位置を
    検出する検出装置に対して前記第1の係数および前記第
    2の係数を生成する情報生成装置のプログラムであっ
    て、 前記第1の集音装置、前記第2の集音装置、および前記
    第3の集音装置のそれぞれにより集音された、所定の範
    囲内に設けられた複数の実験位置に位置した前記音源が
    発した音声に対応する第4の前記音声信号、第5の前記
    音声信号、および第6の前記音声信号から、前記第4の
    音声信号の位相と前記第5の音声信号の位相との第3の
    位相差、および前記第4の音声信号の位相と前記第6の
    音声信号との第4の位相差を、前記実験位置毎に算出す
    る第1の算出ステップと、 前記第3の位相差と前記実験位置との関係に基づいて、
    前記第1の係数を算出し、前記第4の位相差と前記実験
    位置との関係に基づいて、前記第2の係数を算出する第
    2の算出ステップとを含む処理をコンピュータに実行さ
    せることを特徴とするプログラム。
JP2001245991A 2001-08-14 2001-08-14 情報処理装置および方法、情報生成装置および方法、記録媒体、並びにプログラム Expired - Fee Related JP4752153B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001245991A JP4752153B2 (ja) 2001-08-14 2001-08-14 情報処理装置および方法、情報生成装置および方法、記録媒体、並びにプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001245991A JP4752153B2 (ja) 2001-08-14 2001-08-14 情報処理装置および方法、情報生成装置および方法、記録媒体、並びにプログラム

Publications (3)

Publication Number Publication Date
JP2003061184A true JP2003061184A (ja) 2003-02-28
JP2003061184A5 JP2003061184A5 (ja) 2008-09-25
JP4752153B2 JP4752153B2 (ja) 2011-08-17

Family

ID=19075636

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001245991A Expired - Fee Related JP4752153B2 (ja) 2001-08-14 2001-08-14 情報処理装置および方法、情報生成装置および方法、記録媒体、並びにプログラム

Country Status (1)

Country Link
JP (1) JP4752153B2 (ja)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005057545A (ja) * 2003-08-05 2005-03-03 Matsushita Electric Ind Co Ltd 音場制御装置及び音響システム
JP2009517936A (ja) * 2005-11-30 2009-04-30 ノエミ バレンズエラ ミリアム 時変性の指向特性を有する音源を録音および再生する方法
JP2010103617A (ja) * 2008-10-21 2010-05-06 Nippon Telegr & Teleph Corp <Ntt> 発話向き推定装置、方法及びプログラム
JP2010124447A (ja) * 2008-10-21 2010-06-03 Nippon Telegr & Teleph Corp <Ntt> 発話正面・横向き推定装置、方法及びプログラム
JP2010206449A (ja) * 2009-03-03 2010-09-16 Nippon Telegr & Teleph Corp <Ntt> 発話向き推定装置、方法及びプログラム
JP2010206392A (ja) * 2009-03-02 2010-09-16 Nippon Telegr & Teleph Corp <Ntt> 発話向き推定装置、方法及びプログラム
JP2010206393A (ja) * 2009-03-02 2010-09-16 Nippon Telegr & Teleph Corp <Ntt> 発話向き推定装置、方法及びプログラム
JP2011017646A (ja) * 2009-07-09 2011-01-27 Nec Computertechno Ltd アクティブソナー装置、及びアクティブソナー装置を搭載したatm端末装置
JP2013072977A (ja) * 2011-09-27 2013-04-22 Fuji Xerox Co Ltd 音声解析装置
JP2013148791A (ja) * 2012-01-20 2013-08-01 Fuji Xerox Co Ltd 音解析装置、音解析システムおよびプログラム
JP2017044852A (ja) * 2015-08-26 2017-03-02 アイシン精機株式会社 発声方向特定装置
JP2019197179A (ja) * 2018-05-11 2019-11-14 富士通株式会社 発声方向判定プログラム、発声方向判定方法、及び、発声方向判定装置
JP2020126166A (ja) * 2019-02-05 2020-08-20 本田技研工業株式会社 エージェントシステム、情報処理装置、情報処理方法、およびプログラム
JP2021103028A (ja) * 2019-12-25 2021-07-15 パナソニックIpマネジメント株式会社 空気清浄システム及び空気清浄方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63262577A (ja) * 1987-04-20 1988-10-28 Sony Corp マイクロホン装置
JPH01109996A (ja) * 1987-10-23 1989-04-26 Sony Corp マイクロホン装置
JPH10215497A (ja) * 1996-11-27 1998-08-11 Fujitsu Ltd マイクロホンシステム
JPH11219193A (ja) * 1998-02-03 1999-08-10 Fujitsu Ten Ltd 車載用音声認識装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63262577A (ja) * 1987-04-20 1988-10-28 Sony Corp マイクロホン装置
JPH01109996A (ja) * 1987-10-23 1989-04-26 Sony Corp マイクロホン装置
JPH10215497A (ja) * 1996-11-27 1998-08-11 Fujitsu Ltd マイクロホンシステム
JPH11219193A (ja) * 1998-02-03 1999-08-10 Fujitsu Ten Ltd 車載用音声認識装置

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005057545A (ja) * 2003-08-05 2005-03-03 Matsushita Electric Ind Co Ltd 音場制御装置及び音響システム
JP2009517936A (ja) * 2005-11-30 2009-04-30 ノエミ バレンズエラ ミリアム 時変性の指向特性を有する音源を録音および再生する方法
JP2010103617A (ja) * 2008-10-21 2010-05-06 Nippon Telegr & Teleph Corp <Ntt> 発話向き推定装置、方法及びプログラム
JP2010124447A (ja) * 2008-10-21 2010-06-03 Nippon Telegr & Teleph Corp <Ntt> 発話正面・横向き推定装置、方法及びプログラム
JP2010206392A (ja) * 2009-03-02 2010-09-16 Nippon Telegr & Teleph Corp <Ntt> 発話向き推定装置、方法及びプログラム
JP2010206393A (ja) * 2009-03-02 2010-09-16 Nippon Telegr & Teleph Corp <Ntt> 発話向き推定装置、方法及びプログラム
JP2010206449A (ja) * 2009-03-03 2010-09-16 Nippon Telegr & Teleph Corp <Ntt> 発話向き推定装置、方法及びプログラム
JP2011017646A (ja) * 2009-07-09 2011-01-27 Nec Computertechno Ltd アクティブソナー装置、及びアクティブソナー装置を搭載したatm端末装置
JP2013072977A (ja) * 2011-09-27 2013-04-22 Fuji Xerox Co Ltd 音声解析装置
JP2013148791A (ja) * 2012-01-20 2013-08-01 Fuji Xerox Co Ltd 音解析装置、音解析システムおよびプログラム
JP2017044852A (ja) * 2015-08-26 2017-03-02 アイシン精機株式会社 発声方向特定装置
JP2019197179A (ja) * 2018-05-11 2019-11-14 富士通株式会社 発声方向判定プログラム、発声方向判定方法、及び、発声方向判定装置
US10531189B2 (en) 2018-05-11 2020-01-07 Fujitsu Limited Method for utterance direction determination, apparatus for utterance direction determination, non-transitory computer-readable storage medium for storing program
JP2020126166A (ja) * 2019-02-05 2020-08-20 本田技研工業株式会社 エージェントシステム、情報処理装置、情報処理方法、およびプログラム
US11508368B2 (en) 2019-02-05 2022-11-22 Honda Motor Co., Ltd. Agent system, and, information processing method
JP7250547B2 (ja) 2019-02-05 2023-04-03 本田技研工業株式会社 エージェントシステム、情報処理装置、情報処理方法、およびプログラム
JP2021103028A (ja) * 2019-12-25 2021-07-15 パナソニックIpマネジメント株式会社 空気清浄システム及び空気清浄方法
JP7417829B2 (ja) 2019-12-25 2024-01-19 パナソニックIpマネジメント株式会社 空気清浄システム及び空気清浄方法

Also Published As

Publication number Publication date
JP4752153B2 (ja) 2011-08-17

Similar Documents

Publication Publication Date Title
JP5229053B2 (ja) 信号処理装置、および信号処理方法、並びにプログラム
CN109804559B (zh) 空间音频***中的增益控制
JP2003061184A (ja) 情報処理装置および方法、情報生成装置および方法、記録媒体、並びにプログラム
US7039198B2 (en) Acoustic source localization system and method
KR101812862B1 (ko) 오디오 장치
Marti et al. A steered response power iterative method for high-accuracy acoustic source localization
US20040037436A1 (en) System and process for locating a speaker using 360 degree sound source localization
US20040190730A1 (en) System and process for time delay estimation in the presence of correlated noise and reverberation
JPH11304906A (ja) 音源位置推定方法およびそのプログラムを記録した記録媒体
WO2011081527A1 (en) Method and system for determining the direction between a detection point and an acoustic source
JP2006194700A (ja) 音源方向推定システム、音源方向推定方法及び音源方向推定プログラム
CN110322892B (zh) 一种基于麦克风阵列的语音拾取***和方法
JP2022546926A (ja) 空間変換領域における音場表現を処理するための装置、方法、またはコンピュータプログラム
Hao et al. Spectral flux-based convolutional neural network architecture for speech source localization and its real-time implementation
CN110515034B (zh) 一种声信号方位角测量***及方法
CN108781310A (zh) 使用视频的图像来选择要增强的视频的音频流
Shivappa et al. Role of head pose estimation in speech acquisition from distant microphones
JP5986966B2 (ja) 音場収音再生装置、方法及びプログラム
Nakano et al. Automatic estimation of position and orientation of an acoustic source by a microphone array network
JP3588576B2 (ja) 収音装置および収音方法
WO2023056905A1 (zh) 声源定位方法、装置及设备
WO2022183968A1 (zh) 音频信号处理方法、设备、***及存储介质
JP6933303B2 (ja) 波源方向推定装置、波源方向推定方法、およびプログラム
JP5513316B2 (ja) 音場収音再生装置、方法及びプログラム
JP2011071683A (ja) 映像オブジェクト検出装置、映像オブジェクト検出方法及びプログラム

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080807

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080807

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20101124

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101130

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110113

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110208

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110404

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110426

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110509

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140603

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140603

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees