JP2003066993A - ピックアップエリア及び/若しくは妨害源の表示を伴う指向的に感受性な音声ピックアップシステム - Google Patents

ピックアップエリア及び/若しくは妨害源の表示を伴う指向的に感受性な音声ピックアップシステム

Info

Publication number
JP2003066993A
JP2003066993A JP2002197250A JP2002197250A JP2003066993A JP 2003066993 A JP2003066993 A JP 2003066993A JP 2002197250 A JP2002197250 A JP 2002197250A JP 2002197250 A JP2002197250 A JP 2002197250A JP 2003066993 A JP2003066993 A JP 2003066993A
Authority
JP
Japan
Prior art keywords
pickup
area
displaying
voice
source
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2002197250A
Other languages
English (en)
Inventor
Starr Volker
シュタール フォルカー
Alexander Fischer
フィッシャー アレクサンダー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of JP2003066993A publication Critical patent/JP2003066993A/ja
Withdrawn legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S3/00Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
    • G01S3/80Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using ultrasonic, sonic or infrasonic waves
    • G01S3/802Systems for determining direction or deviation from predetermined direction
    • G01S3/808Systems for determining direction or deviation from predetermined direction using transducers spaced apart and measuring phase or time difference between signals therefrom, i.e. path-difference systems
    • G01S3/8083Systems for determining direction or deviation from predetermined direction using transducers spaced apart and measuring phase or time difference between signals therefrom, i.e. path-difference systems determining direction of source

Landscapes

  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)

Abstract

(57)【要約】 【課題】 本発明は、指向的に感受性な音声ピックアッ
プシステムの使用者がシステムの行動を説明し、使用者
の希望に従ってシステムに影響を及ぼすことを可能にす
ることを目的とする。 【解決手段】 本発明は、−システムのピックアップエ
リアを表示するシステム構成部分及び/若しくは−妨害
源を表示するシステム構成部分を備える指向的に感受性
な音声ピックアップシステムに関する。好ましい実施態
様において、人工創造物若しくは人工創造物の一部分
は、ピックアップエリア及び/若しくは妨害源を表示す
るために役立つ。例えば、様式化された人間の頭あるい
は犬の設計は適切である。例えば、本発明による音声ピ
ックアップシステムは、装置を制御するためのユーザー
インターフェイスとして使用されるであろう音声認識シ
ステムの不可欠な部分として特に重要である。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、指向的に感受性な
音声ピックアップシステムに関し、特に音声命令を登録
するためのかかる指向的に感受性な音声ピックアップシ
ステムを使用する音声認識システムに関する。そのよう
な音声認識システムは、例えば、装置を制御するための
ユーザーインターフェイスとする利点として使用するこ
とができる。
【0002】
【従来の技術】指向的な感度は、例えば、指向的なマイ
クを用いるか、若しくは適切な信号処理を伴うマイクの
配列を用いて音声ピックアップシステムによって達成さ
れる。ここでの指向的な特性の目的は、他のすべての音
声信号に関して指向的に感受性な音声ピックアップシス
テムのピックアップエリアから由来の音声信号を強調す
ることである。したがって、全方向性特質を伴うマイク
と比較すると、ピックアップエリア由来の有用な信号は
刺激され、及び/若しくはピックアップエリア外からの
妨害信号は強調され、それにより音声ピックアップシス
テムのシグナル/ノイズ比を改善する。特に、多くのマ
イクの配置、いわゆるマイクの配列は、単一のマイクと
比較して信号における大きな改良を与える。
【0003】他方で、ピックアップエリアから由来しな
い妨害信号は、ピックアップエリア外に位置する信号源
から派生する。しかしながら、その音声信号が多重径路
伝送の伝播、例えば部屋の壁からの続く反射により対応
する位相移動で音声ピックアップシステムのマイクに数
回達する場合、妨害信号は有用な信号源自体から派生す
るかもしれない。もし位相移動の大きさが平衡装置の活
動範囲内に位置すれば、いわゆる平衡装置は今までどお
りそのような入って来る位相が移動した信号を有効に利
用することができる。
【0004】しかしながら、径路が異なり、したがって
音声信号の位相移動の多重径路伝送の伝播による到着が
あまりにも大きい場合、音声ピックアップシステムが平
衡装置を有しない場合は、遅延の音声信号は有用な信号
源の妨害信号として作用する。しかしながら、受理に先
立った遅延の音声信号の最も早い偏向が、音声ピックア
ップシステムのピックアップエリアで位置していない、
例えば部屋の壁のようなポイントで発生する場合、音声
ピックアップシステムの指向的な特性はさらにこれらの
信号に作用する。音声ピックアップシステムにとって、
実際に、この最も早い偏向ポイントは、干渉する音声信
号の明白な源を表わし、したがって妨害源である。前述
に関して、指向的特質を伴う音声ピックアップシステム
は、したがって、反響として既知である多重径路伝送の
伝播による結果としての問題を減少できる。
【0005】有用な源から音声ピックアップシステムの
マイクへの直接の伝播径路が障害物によって遮断される
場合、例えば、伝播経路で最も早い偏向ポイントは明白
で有用な源である音声ピックアップシステムに見え、様
々な伝播経路によってシステムに達する信号の最も強い
ものによって到着される。概して、音声ピックアップシ
ステムは実際の信号源としてこれらの明らかな源に関す
るであろう。しかしながら、原理において、もし伝播条
件が、伝播経路を後ろにトレースすることについて、音
声源の実際位置の識別について知らされていれば、適切
に装備をされたシステムは有能だろう。
【0006】例えば、線形のマイクの配列が使用される
場合、指向的に感受性な音声ピックアップシステムのピ
ックアップエリアは、“ビーム”と呼ばれる英語用語を
使用して、部屋内の特異的な方向となるかもしれない。
しかしながら、例えば、ある平面に位置するような別の
マイクの配置を使用すると、異なって形成されるピック
アップエリアを生成することが可能である。特に、三次
元配置の使用によって、ピックアップエリアは、信号の
多大な改良の結果となる、特異的な部屋のより制限され
たエリアを制限するかもしれない。
【0007】この場合はマイクの配列が続く信号処理に
よって影響されるために、かかるシステムのピックアッ
プエリアの形状と位置は特別な柔軟性で適合されること
ができる。さらに、ピックアップエリアは、マイクの機
械的な移動によって自然と影響され得る。他方で、かか
るピックアップエリアの制御は信号源を位置するために
使用されるかもしれない。すなわち、システムの設計に
依存して、信号源が位置している方向若しくは部屋内の
より制限されたエリアを決定するために使用される。全
体の音声ピックアップセッションを通して適切なシグナ
ル/ノイズ比を獲得するために、ピックアップエリアは
また、移動する信号源を追跡するためになされる。
【0008】したがって、指向的な感受性の音声ピック
アップシステムは多くの適用を有することが分かる。例
えば、システムは、ニュースキャスターとスピーカーに
おいて高いピックアップ性能を保証し、又は音声及びビ
デオ会議での現在話しているスピーカーのピックアップ
及び同時“追跡”に役立つ。後者において、すなわちビ
デオ会議において、“追跡”信号は、ビデオカメラのピ
ックアップエリアを同時に制御するために使用されるか
もしれない。ビデオ信号はまた、スピーカーの“追跡”
において、適切なサンプル処理後に使用されるかもしれ
ない。
【0009】指向的な感受性の音声ピックアップシステ
ムの使用は、音声認識システムの音声命令の登録のため
に特に重要である。音声認識の認識の正確さは縮小する
シグナル/ノイズ比で相当に下がることが知られてい
る。この理由によって、例えば指向的な感受性の音声ピ
ックアップシステムによって表される高品質のピックア
ップシステムは、音声認識システムにおいて特に重要で
ある。
【0010】このように、WO01/29823A1は
複数の装置を操作するための自然言語インターフェイス
制御システムを記載しており、マイクの配列によってピ
ックアップされた使用者の音声は、次いで、音声認識シ
ステム(抽出モジュール及び音声認識モジュールの特質
からなる)に送られ、さらに処理段階(自然言語インタ
ーフェイスモジュール)に供給される。この処理の流れ
において、使用者の自然言語表現は最終的に命令に翻訳
され、次いで、制御装置は装置インターフェイスによっ
て接続された。すでに言及したように、指向的に感受性
な音声ピックアップシステムの機能は、全方向性特質の
マイクと比較して改善されたシグナル/ノイズ比を獲得
するために、ピックアップシステムの音声源を増大する
こと及び/若しくはピックアップエリア外からの音声源
を減ずることである。したがって、実際にピックアップ
される音声源がシステムのピックアップエリア内に位置
することは指向的に感受性な音声ピックアップシステム
に必須である。さもなければ、シグナル/ノイズ比は非
常に弱くなり、音声ピックアップシステムは使用できな
くなる。指向的に感受性な音声ピックアップシステムが
音声認識システムを供給する場合が特にこの事例であ
る。
【0011】次いで、所望の音声源に実際に集中するた
めに、指向的に感受性な音声ピックアップシステムは前
述で言及したトラッキング機能を伴って装備される。特
に、システム自体の指向的特質が使用されるかもしれな
いし、若しくは、使用は、例えばビデオカメラのような
追加の情報源からなる。それにもかかわらず、所望の音
声源は指向的に感受性な音声ピックアップシステムのピ
ックアップエリア外に位置されるかもしれない。
【0012】例えば、下記の状態が考えられる:自然言
語ユーザーインターフェイスの手段でビデオレコーダー
の操作を望む者はWO01/29823に記載されてい
る。しかしながら、この人と同じ部屋で、別の二人がお
互いに会話している。次いで、音声ピックアップシステ
ムは誤って前述の別の二人に集中する。これは、最初の
人の命令は音声ピックアップシステムによって減少され
て、一方で二人たちの会話が増大されたことを意味す
る。次いで、出力側に接続された音声認識システムは、
誤った理解の命令であるか若しくは命令ではないのいず
れも推論しない二人の会話のみを大部分“聞く”。この
状況において、最初の人は、ユーザーインターフェイス
を介したビデオレコーダーを操作する可能性を有せず、
使用者は驚き、ユーザーインタフェース及びビデオテー
プレコーダーの不完全な反応におそらくさらに悩まされ
る。
【0013】しかしながら、そのような状況若しくは同
様の状況において、さらなる問題が持ち上がる。例え
ば、所望の音声源のピックアップは、所望の音声源が指
向的に感受性な音声ピックアップシステムのピックアッ
プエリア内に位置するが、しかし、ピックアップエリア
外に位置するにも関わらず、他の音声源からの妨害が非
常に大きい場合、使用不能であるかもしれない。例え
ば、これは干渉する音声源が所望の音声源よりマイクに
はるかに接近して位置して強すぎる場合、若しくは指向
的に感受性な音声ピックアップシステムが低品質である
場合に起こり、シグナル/ノイズ比の適切な改善を生成
しない。この場合においても、使用者はシステムの不安
定な行動について説明しようと途方に暮れるだろう。
【0014】
【発明が解決しようとする課題】本発明は、指向的に感
受性な音声ピックアップシステムの使用者がシステムの
行動を説明し、使用者の希望に従ってシステムに影響を
及ぼすことを可能にするための目的を有する。
【0015】
【課題を解決するための手段】この目的は、−システム
のピックアップエリアを表示するシステム構成部分及び
/若しくは−妨害源を表示するシステム構成部分を有す
る指向的に感受性な音声ピックアップシステムによって
達成される。
【0016】使用者にシステムのピックアップエリア及
び/若しくは妨害源を表示するシステム構成部分を指向
的に感受性な音声ピックアップシステムに装備すること
は、使用者にシステムの行動を理解し、使用者の希望に
したがって影響を及ぼすことが可能なための必要な情報
を提供する。
【0017】例えば、システムがピックアップエリア外
の使用者を指示している場合、使用者はシステムによっ
て指示されるピックアップエリアに移動可能であり、若
しくは使用者はシステムの注意を使用者自身に集中で
き、その結果、システムは使用者にそのピックアップエ
リアを変える。例えば、システムの注意を増大させるた
めに、システムの設計に依存して、使用者は音声ピック
アップシステムの指向的な特性を利用するために使用者
の手を叩くかもしれない。若しくは、使用者はビデオシ
ステムの画像処理構成部分をアドレスするために活発に
揺れるかもしれない。使用者が使用者自身よりも別の音
声源をピックアップすることを所望する場合、使用者は
音声ピックアップシステムを所望の音声源に直接に注意
を向けるかもしれない。これをすることで、使用者は、
再び距離を置く前に、例えば軽く手をたたいて音声源に
向かって移動する。しかしながら、適切なシステム設備
を与えられて、所望の音声源を指す手の単なる移動は十
分であるだろう。次いで、この手の移動はビデオカメラ
でピックアップされて、画像認識によって鑑定され、音
声ピックアップシステムの指向性特質の適切な制御に変
換される。
【0018】システムが使用者に対してラジオのような
妨害源を示している場合は、使用者はこの例ではラジオ
のスイッチを切ることによって妨害を取り除くかもしれ
ない。しかしながら、代替として、使用者は大声で話し
たり、若しくはピックアップシステムに近づくことで妨
害源に関してシグナル/ノイズ比を改善するかもしれな
い。適切なシステムデザインを与えられて、妨害を打ち
消すことができなければ、使用者は、対応する適切なキ
ーを押すことによりビデオテープレコーダーを操作する
ような別の入力媒体に頼る可能性をまだ持っている。
【0019】従属の請求項2乃至5によると、ピックア
ップエリア及び/若しくは妨害源は、お互いに組み合わ
せることができるかもしれない、異なる方法及び手段に
よって表示されるかもしれない。このように、例えば、
表示にテキストと図式の指示を挿入することが可能であ
る。例えば、単語“ソファー”、ソファーのスケッチ及
び/若しくは実際のソファーの画像が示されるかもしれ
ない。代替として若しくはそこに加えて、単語“ソファ
ー”は拡声器によって音響的に放射されるかもしれな
い。ソファーがピックアップエリアであるか、若しくは
妨害源の部位であるかどうかは同様に音響的に表現され
るか、若しくは図式に表現されるかもしれない。カメラ
及び対応する画像認識が与えられて、さらに、拡声器上
に“右側角のラジオが妨害を引き起こしている”の言い
回しの放射により妨害源の部位だけでなく妨害源自体を
も指定することは実現可能である。
【0020】ピックアップエリア及び/若しくは妨害源
を表現する別の可能な方法は、矢印型の指針で、その先
端が線形のマイクの配列のピックアップビームに向かう
ような指示装置である。例えば、代替として赤若しくは
緑のLEDを指針につけさせることによって、ピックア
ップエリアと妨害源を区別することは可能である。多重
の指示装置は、より制限された部屋のエリアを指示する
ために組み合わせられるかもしれない。
【0021】かかる指示装置は、指示装置に人工創造物
の外観若しくはそのような人工創造物の四肢を与えるこ
とにより特に鮮明になることができる。例えば、このよ
うにして、人工創造物の腕若しくは人工創造物の頭が使
用されるかもしれない。人工創造物の頭を伴って、人工
的な視線の手段によって特異的に表現される表示を達成
することが可能である。人工創造物の一部分に代わっ
て、完全な人工創造物が使用されるかもしれない。この
ように、人工犬は指示される方向を完全に向き、頭の動
き及び目の視線の動きによって部屋のより制限されたエ
リアを指示するかもしれない。さらに、自動システムの
適切な心理的な印象は人工創造物の選択によって使用者
の心の中で作成することができ、愚かな/利口、貢献す
る/客観的なシステムである。
【0022】物理的な指示装置を設計する代わりに、表
示に図式で単に表現することが可能である。このよう
に、矢印は遠近法によって描写され、人工創造物は表示
画面に表現される。このような図式の表現は実際の物理
的な構成と同じ影響を有しないが、システムの柔軟性と
保全性を増大し、製造コスト及び維持費を削減する。
【0023】従属請求項6及び7は、指向的な特性が指
向的なマイク及び/若しくはマイクの配列の手段によっ
て達成される、本発明による指向的に感受性な音声ピッ
クアップシステムの実施態様に関する。
【0024】独立する請求項8、9及び10において、
しかしながら、本発明は、本発明による音声ピックアッ
プシステムから音声信号を獲得する音声認識システム、
ユーザーインターフェイスとしての音声認識システムを
使用する制御システム、及びかかる制御システムの手段
によって操作される装置に関する。すでに言及されたよ
うに、特に音声認識システムは、自然体の会話のため
に、高品質な音声ピックアップシステムに依存し、装置
を操作するためのユーザーインターフェイスとして特に
適している。これに関して、そこで制御される音声認識
システム、制御システム、及び装置は、本発明から特に
有利であるだろう。そのようなシステムは、娯楽の電子
機器若しくは家庭用器材として、家庭内で装置を操作す
るために特に使用される。同じことは、自動車の他の搭
乗者がラジオ若しくはナビゲーションシステムと対話し
ている場合、運転手は瞬時に操作したいラジオ若しくは
ナビゲーションシステムのような自動車内の装置に当て
はまる。この目的において、音声認識を伴うかかる制御
システムは、ラジオ若しくはナビゲーションシステムに
統合されることができる。
【0025】本発明は、図で示されている実施態様を参
照して下記においてさらに詳細に記載されるが、しかし
ながら、本発明は制限されない。
【0026】
【発明の実施の形態】図1は、指向的に感受性な音声ピ
ックアップシステムを有する音声認識システムを伴う本
発明による制御システムの実施態様を概略する表示であ
る。部屋の中で音声ピックアップシステムのマイク1乃
至6の位置を示すために、図1は直交軸x、y及びzを
備えたデカルトの座標系Kを示す。二つのマイク1及び
2は方向zに平行な線形のマイクの配列を形成する。残
りのマイク3乃至6は、x−y平面の水平なマイクの配
列で配置される。したがって、マイク1乃至6が共にな
って三次元のマイクの配列を形成する。
【0027】マイク1乃至6によってピックアップされ
る音声信号は、マイクの配列のピックアップエリアを定
義する適切な信号処理による、モニタリングと制御ユニ
ット15に供給される。そのようにして、モニタリング
及び制御装置は、必要な音声源がピックアップエリアで
位置しているのと同じ方法でピックアップエリアを確定
することに力を尽くす。かかる目的を達成するために、
同様にモニタリングと制御ユニット15に接続されてい
るビデオカメラ11を操作する。加えてマイク1乃至6
によって供給される音声信号を鑑定するために、したが
って、モニタリングと制御ユニット15は、所望の音源
の位置を決定するために、ビデオカメラ11のビデオ信
号のサンプル認識を実行する。
【0028】表示10と拡声器12は、出力媒体として
モニタリングと制御ユニット15に接続されている。シ
ステムの使用者は、出力媒体によってシステム行動に関
する報告を与えることができ、また、使用者はさらなる
入力を求めることができる。しかしながら、特に媒体
は、マイク1乃至6及び/若しくは方向及び/若しくは
妨害源の位置から形成されるマイクの配列のピックアッ
プエリアを指示するために使用されるかもしれない。こ
の目的のために、テキスト(ピックアップ・エリア及び
/若しくは妨害源を指定する)は、表示10によって、
若しくは音響的に拡声器12によって図式に出力するこ
とができる。可能なテキストは、“ピックアップエリ
ア:ソファー”、“ピックアップ方向は装置の左20
度”、“左後ろのラジオは妨害を引き起こす”若しくは
“装置右からの妨害”である。
【0029】加えて、若しくはテキストに代わって、図
式の表現が表示10で使用されるかもしれない。このよ
うに、ピックアップエリアがそこに位置する場合、ソフ
ァー型の図が示されるかもしれない。しかしながら、シ
ステムがこれへのビデオカメラ11を適応させて、表示
10上のその画像を再生する際にピックアップエリア及
び/若しくは妨害源の実際の画像を表示することは可能
である。それらのうちの幾つかの出力において、例え
ば、テキスト“ソファー”を表示することが可能なため
に、システムはビデオ信号をビデオカメラ11から対応
する画像認識へ供給しなければならない。システムがこ
の設備を所有していない場合は、ピックアップエリア及
び/若しくは妨害源を示すために、ピックアップユニッ
トに関する部屋方向のような間接の情報に制限されてい
るかもしれない。
【0030】さらなる表示の可能性は、二つの矢印P1
とP2及び表示10のピックアップエリアのマークAの
表示によって図1に示されている。どこの位置をシステ
ムが使用者に対して示しているか使用者が表示10を見
る場合、二つの矢印P1とP2は表示10上で歪曲され
た遠近画で表わされて使用者に通知する。ピックアップ
エリアのマークAは、システムのピックアップエリアは
この場所に位置していることを使用者に示す。システム
が、専らさらに部屋の中で制限された位置の代わりに1
つのピックアップ方向に集中する場合、単一の指標矢は
表示に十分であるが、しかし、2本以上の矢が部屋位置
のより正確な表示のために使用されてもよい。妨害源が
ピックアップエリアの代わりに表示される場合、例え
ば、型にはめられたフラッシュのような妨害源マークは
ピックアップエリアマークAの代わりに表示される。
【0031】モニタリングと制御ユニット15は、マイ
クの配列から音声認識システム16(音声信号をテキス
トに翻訳する)まで集中した音声信号を中継し、理解構
成部分17へそれを転送する。自然言語のテキストか
ら、理解構成部分17は、装置の制御に関係するそれら
の構成を抽出し、すなわち、それらは、例えば、命令に
関する装置の指示、命令、及び適用可能な場合の命令パ
ラメーターである。“テレビをCNNに切り換えろ”と
いう自然言語の文から、理解構成部分17は、受信チャ
ンネルを切り換え、新たなチャンネルはCNNであると
いうことを含むテレビが制御されるという事実を抽出す
る。
【0032】理解構成部分17は、モニタリングと制御
ユニット15に結果として戻る。後者は、情報はすべて
使用者によって所望の作用を実行することができるため
に与えられたかどうかを確認する。この場合、対応する
命令は、装置のインターフェイス18(命令を装置に特
有の命令に最終的に翻訳し、リード20、21のうちの
1つによって装置のインターフェイス18に接続された
装置に命令を中継する)へ中継される。しかしながら、
万一情報がまだ見当たらなければ、モニタリング及び制
御ユニット15は表示10及び/若しくは拡声器によっ
てこれを使用者に通知し、さらなる入力を使用者に求め
る。
【0033】見当たない及び曖昧な情報に加えて、ユー
ザーステートメントの認識が縮小された信頼度(音声認
識システム16及び/若しくは理解構成部分17は、例
えば信頼水準の計算により決定することができる)を有
する場合、モニタリングと制御ユニット15はさらに質
問を出すことができる。前述の実施例において、局名C
NNが完全に理解できなかった場合、つまり低い信頼性
を有する場合、モニタリングと制御ユニット15は使用
者に対して再度切りかえるチャンネルであるところの局
名を尋ねる。
【0034】本発明に関するモニタリングと制御ユニッ
ト15の目的は、特に、マイク1乃至6によって形成さ
れたマイクの配列のピックアップエリアで必要な音源と
して使用者を維持し、どんな妨害源も検知することであ
る。認識性能が傾く場合、例えば、システムは理解信頼
水準の減少によって認識し、及び/若しくは使用者に頻
繁に質問をして、使用者によって修正される場合、使用
者にこの事実を留めさせて、使用者におけるシステムの
ピックアップエリアを表示することができる。マイクの
配列及び/若しくはカメラ11の支援で、同様に使用者
へ表示するために更に妨害源のための部屋を探索するこ
とができる。その後、使用者は適切な対抗策をとっても
よい。例えば、使用者は、ピックアップエリアの後ろに
移動するかもしれないし、若しくは使用者自身にシステ
ムの注意を向けるために彼の手を叩くことにより使用者
にピックアップエリアをもたらすかもしれない。さら
に、使用者は妨害源のスイッチを切ってもよい。
【0035】認識結果のみの低い信頼度の場合、使用者
へのピックアップエリア及び妨害源を示す代わりに、シ
ステムはさらに連続的に若しくは周期的な間隔でのみ行
なうかもしれない。加えて、カメラ11によって供給さ
れるマイクの配列及び/若しくはビデオ信号の指向的な
特徴は、使用者のトラッキングのために使用されるかも
しれないし、使用者に集中するために使用されるかもし
れない。適切な装置で、マイクの配列のマイク1乃至6
及び/若しくはカメラ11は、さらにそれらの位置及び
配位の適切な調節を経て使用者を追跡するために作成さ
れるかもしれない。
【0036】図2は、指示装置の二つのさらなる実施態
様を示している。ピックアップエリア及び/若しくは妨
害源の方向を指示するために、システムは、棒33及び
球状の継ぎ目34によってサポートされ、フット35の
すべての方向で回転することが可能な矢印30を使用す
るかもしれない。ランプ若しくは輝く電極31は、さら
なる棒32の手段によって矢印30に適合するかもしれ
ない。その後、指示装置が活動しているかどうか、及び
それがピックアップエリア若しくは妨害源を示すかどう
かは、色及び/若しくはこのランプ31の照明パターン
によって示されるかもしれない。例えば、スイッチが切
られたランプ31は、指示装置が無効であることを示す
かもしれない、緑はピックアップエリアが示されている
ことを表すことができ、そして赤は妨害源が示されてい
ることを表す。矢印30の代わりに、使用者に容易に認
知できる指示装置の任意の他の形体が使用されるかもし
れない。実施例として、図2はまた、方向を示す延在し
た示指41を伴う手40を示している。
【0037】方向だけでなくもっと制限された部屋エリ
アも示されることになっている場合、多くのそのような
矢30若しくは同種のものは再び組み合わせられるかも
しれない。矢印30の機械的な設計に代わって、図1で
示されるように、表示10のかかる指針を単に表すこと
が可能である。
【0038】図3a及び3bは、両者は一対になってい
る目を特色とする指示装置の二つのさらなる実施態様を
示す。図3aにおいて、人の頭に似せた設計された頭
は、人工創造物を表し、眉毛51及び52、瞳55及び
56を各々有する二つの目53及び54、鼻57並びに
口58を有している。人工創造物が、目53及び54、
特に瞳55及び56の適切に設計された形状の手段によ
って、部屋のあるエリアを“見つめる”印象を観察者に
与えることは可能である。
【0039】部屋のこのエリアがシステムのピックアッ
プアエリアか、若しくは妨害源であるかどうかは、口5
8及び/若しくは眉毛51、52及び/若しくは鼻57
の形状によって示唆されるかもしれない。図3に示され
ている顔の拡大は、例えば、人工創造物がピックアップ
エリアを見つめていることを与える。一方で、下に曲げ
た口の角、つりあがった眉毛51、52若しくはしわが
寄った鼻57は妨害源を示す。システムの不活動は距離
に対する不在の熟視によって示唆することができるか、
若しくは、目53、54は、閉じるであろう図3aで示
されていないまぶたを伴って描かれるかもしれない。
【0040】図3bは、“瞳”65、66を伴う簡素化
された“一対の目”63、64を示している。二つの穴
63、64は、箱60の前壁61に切り込まれている。
前壁61の前で垂直若しくはほぼ垂直に立つと、穴6
3、64を通過して、二つのランプ若しくはLEDs6
5、66が箱60内部の後部壁62に取り付けられてい
ることが分かる。使用者が穴63、64の中心のこれら
のLEDs65、66を見る場合、使用者は正確にシス
テムの“視線”にある。LEDs65、66が穴63、
64の中心から移動する場合、使用者は視線から離れ
る。視線がピックアップシステムに関するか若しくは妨
害源の方向に関するかは、例えば、LEDs65、66
の色によって識別され、例えば、緑はピックアップ方向
であり、赤は妨害源の方向である。例えば、システムの
不活動はLEDs65、66のスイッチを切ることによ
り特徴づけられるかもしれない。
【図面の簡単な説明】
【図1】指向的に感受性な音声ピックアップシステムを
有する音声認識システムを伴う本発明による制御システ
ムの実施態様を示す。
【図2】指示装置の二つの実施態様を示す。
【図3a】“対になっている目”を有する指示装置の二
つの実施態様を示す。
【図3b】“対になっている目”を有する指示装置の二
つの実施態様を示す。
【符号の説明】
1 マイク 2 マイク 3 マイク 4 マイク 5 マイク 6 マイク 10 表示 11 ビデオカメラ 12 拡声器 15 制御ユニット 16 音声認識システム 17 理解構成部分 18 装置のインターフェイス 20 リード 21 リード P1 矢印 P2 矢印 A マーク K デカルトの座標系 x 直交軸 y 直交軸 z 直交軸 30 矢印 31 ランプ若しくは輝く電極 32 さらなる棒 33 棒 34 球状の継ぎ目 35 フット 40 手 41 方向を示す延在した示指 51 眉毛 52 眉毛 53 目 54 目 55 瞳 56 瞳 57 鼻 58 口 60 箱 61 前壁 62 後部壁 63 穴 64 穴 65 LED 66 LED
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) H04R 3/00 320 (72)発明者 フォルカー シュタール ドイツ連邦共和国,52074 アーヘン,ア オフ・デア・ヘルン 3 (72)発明者 アレクサンダー フィッシャー ドイツ連邦共和国,52078 アーヘン,シ ュラオフシュトラーセ 81ツェー Fターム(参考) 5D015 AA06 5D018 BB23 5D020 BB04 BB07

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 −システムのピックアップエリアを表示
    するシステム構成部分及び/若しくは−妨害源を表示す
    るシステム構成部分を有する指向的に感受性な音声ピッ
    クアップシステム。
  2. 【請求項2】 前記ピックアップエリア及び/若しくは
    前記妨害源は、前記ピックアップエリア及び/若しくは
    前記妨害源の音響的及び/若しくはテキスト及び/若し
    くは図式の指示によって表示されることを特徴とする請
    求項1に記載の指向的に感受性な音声ピックアップシス
    テム。
  3. 【請求項3】 前記ピックアップエリア及び/若しくは
    前記妨害源を表示するための前記システム構成部分は、
    前記ピックアップエリア及び/若しくは前記妨害源を指
    すことによって前記ピックアップエリア及び/若しくは
    前記妨害源を指示するために設計された指示装置からな
    ることを特徴とする請求項1に記載の指向的に感受性な
    音声ピックアップシステム。
  4. 【請求項4】 前記ピックアップエリア及び/若しくは
    前記妨害源を表示するための前記システム構成部分は、
    前記ピックアップエリア及び/若しくは前記妨害源を指
    すこと及び/若しくは見つめることによって前記ピック
    アップエリア及び/若しくは前記妨害源を指示するため
    に設計された人工創造物若しくは人工創造物の一部分か
    らなることを特徴とする請求項1に記載の指向的に感受
    性な音声ピックアップシステム。
  5. 【請求項5】 前記ピックアップエリア及び/若しくは
    前記妨害源が、請求項3に記載の指示装置又は請求項4
    に記載の人工創造物若しくは人工創造物の一部分の図式
    表現によって表示されることを特徴とする請求項1に記
    載の指向的に感受性な音声ピックアップシステム。
  6. 【請求項6】 指向性感度を達成するための指向性マイ
    クは、前記音声ピックアップシステムを形成することを
    特徴とする請求項1に記載の指向的に感受性な音声ピッ
    クアップシステム。
  7. 【請求項7】 指向性感度を達成するためのマイクの配
    列は、前記音声ピックアップシステムを形成することを
    特徴とする請求項1に記載の指向的に感受性な音声ピッ
    クアップシステム。
  8. 【請求項8】 −前記システムのピックアップエリアを
    表示するシステム構成部分及び/若しくは−妨害源を表
    示するシステム構成部分を備える指向的に感受性な音声
    ピックアップシステムを有する音声認識システム。
  9. 【請求項9】 −前記システムのピックアップエリアを
    表示するシステム構成部分及び/若しくは−妨害源を表
    示するシステム構成部分を備える指向的に感受性な音声
    ピックアップシステムを有する音声認識システムを伴う
    制御システム。
  10. 【請求項10】 −前記システムのピックアップエリア
    を表示するシステム構成部分及び/若しくは−妨害源を
    表示するシステム構成部分を備える指向的に感受性な音
    声ピックアップシステムを有する音声認識システムを伴
    う制御システムを含有する、特に家庭内若しくは自動車
    内の装置。
JP2002197250A 2001-07-07 2002-07-05 ピックアップエリア及び/若しくは妨害源の表示を伴う指向的に感受性な音声ピックアップシステム Withdrawn JP2003066993A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE10133126A DE10133126A1 (de) 2001-07-07 2001-07-07 Richtungssensitives Audioaufnahmesystem mit Anzeige von Aufnahmegebiet und/oder Störquelle
DE10133126.6 2001-07-07

Publications (1)

Publication Number Publication Date
JP2003066993A true JP2003066993A (ja) 2003-03-05

Family

ID=7691057

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002197250A Withdrawn JP2003066993A (ja) 2001-07-07 2002-07-05 ピックアップエリア及び/若しくは妨害源の表示を伴う指向的に感受性な音声ピックアップシステム

Country Status (4)

Country Link
US (1) US20030009329A1 (ja)
EP (1) EP1281981A2 (ja)
JP (1) JP2003066993A (ja)
DE (1) DE10133126A1 (ja)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8849185B2 (en) 2003-04-15 2014-09-30 Ipventure, Inc. Hybrid audio delivery system and method therefor
DE10339973A1 (de) 2003-08-29 2005-03-17 Daimlerchrysler Ag Intelligentes akustisches Mikrofon-Frontend mit Spracherkenner-Feedback
CA2621916C (en) * 2004-09-07 2015-07-21 Sensear Pty Ltd. Apparatus and method for sound enhancement
US8457614B2 (en) 2005-04-07 2013-06-04 Clearone Communications, Inc. Wireless multi-unit conference phone
US7697827B2 (en) 2005-10-17 2010-04-13 Konicek Jeffrey C User-friendlier interfaces for a camera
WO2011055410A1 (ja) * 2009-11-06 2011-05-12 株式会社 東芝 音声認識装置
US8676581B2 (en) * 2010-01-22 2014-03-18 Microsoft Corporation Speech recognition analysis via identification information
JP6017854B2 (ja) * 2011-06-24 2016-11-02 本田技研工業株式会社 情報処理装置、情報処理システム、情報処理方法及び情報処理プログラム
US9110891B2 (en) * 2011-12-12 2015-08-18 Google Inc. Auto-translation for multi user audio and video
US8704070B2 (en) 2012-03-04 2014-04-22 John Beaty System and method for mapping and displaying audio source locations
US10107887B2 (en) 2012-04-13 2018-10-23 Qualcomm Incorporated Systems and methods for displaying a user interface
EP2911149B1 (en) * 2014-02-19 2019-04-17 Nokia Technologies OY Determination of an operational directive based at least in part on a spatial audio property
US9911416B2 (en) 2015-03-27 2018-03-06 Qualcomm Incorporated Controlling electronic device based on direction of speech
US10547937B2 (en) * 2017-08-28 2020-01-28 Bose Corporation User-controlled beam steering in microphone array
US11082769B2 (en) * 2019-11-15 2021-08-03 Bose Corporation Audio visualization in telecommunications applications
US11889261B2 (en) 2021-10-06 2024-01-30 Bose Corporation Adaptive beamformer for enhanced far-field sound pickup

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59182688A (ja) * 1983-03-31 1984-10-17 Toshiba Corp ステレオ視処理装置
WO1989006806A1 (en) * 1988-01-19 1989-07-27 Peter Frederick Bradbeer Direction sensitive energy detecting apparatus
US5576972A (en) * 1992-05-08 1996-11-19 Harrison; Dana C. Intelligent area monitoring system
US5517429A (en) * 1992-05-08 1996-05-14 Harrison; Dana C. Intelligent area monitoring system
US5471542A (en) * 1993-09-27 1995-11-28 Ragland; Richard R. Point-of-gaze tracker
US5461711A (en) * 1993-12-22 1995-10-24 Interval Research Corporation Method and system for spatial accessing of time-based information
US5546072A (en) * 1994-07-22 1996-08-13 Irw Inc. Alert locator
US5737431A (en) * 1995-03-07 1998-04-07 Brown University Research Foundation Methods and apparatus for source location estimation from microphone-array time-delay estimates
DE69635858T2 (de) * 1995-06-22 2006-11-30 3Dv Systems Ltd. Telezentrische 3d kamera und zugehöriges verfahren
US5758264A (en) * 1996-07-16 1998-05-26 Motorola, Inc. Display of geographic locations with correlated signal quality measurements
DE19628918C1 (de) * 1996-07-18 1997-07-31 Daimler Benz Aerospace Airbus Anordnung zum Erkennen einer hochfrequenten Störstrahlung
US6522761B1 (en) * 1996-08-07 2003-02-18 The United States Of America As Represented By The Secretary Of The Navy Directionally sensitive pointing microphone
US5936571A (en) * 1997-01-31 1999-08-10 Lockheed Martin Corporation Integrated GPS/interference location system
US6052052A (en) * 1997-08-29 2000-04-18 Navarro Group Limited, Inc. Portable alarm system
US6151406A (en) * 1997-10-09 2000-11-21 Cognex Corporation Method and apparatus for locating ball grid array packages from two-dimensional image data
JP3795647B2 (ja) * 1997-10-29 2006-07-12 株式会社竹中工務店 ハンドポインティング装置
US6219645B1 (en) * 1999-12-02 2001-04-17 Lucent Technologies, Inc. Enhanced automatic speech recognition using multiple directional microphones
JP4257040B2 (ja) * 2000-06-30 2009-04-22 日本電気株式会社 無線通信システムにおける伝搬環境通知方法及び通知システム並びに制御プログラムを記録した記録媒体
US20020044614A1 (en) * 2000-09-12 2002-04-18 Molnar Karl James Methods and systems for reducing interference using co-channel interference mapping
US7039017B2 (en) * 2001-12-28 2006-05-02 Texas Instruments Incorporated System and method for detecting and locating interferers in a wireless communication system

Also Published As

Publication number Publication date
DE10133126A1 (de) 2003-01-16
US20030009329A1 (en) 2003-01-09
EP1281981A2 (de) 2003-02-05

Similar Documents

Publication Publication Date Title
US11856148B2 (en) Methods and apparatus to assist listeners in distinguishing between electronically generated binaural sound and physical environment sound
JP7275227B2 (ja) 複合現実デバイスにおける仮想および実オブジェクトの記録
JP2003066993A (ja) ピックアップエリア及び/若しくは妨害源の表示を伴う指向的に感受性な音声ピックアップシステム
US11665460B2 (en) Information processing device and information processing method
CN109218651B (zh) 视频会议中的最佳视图选择方法
JP4837917B2 (ja) 音声に基づく装置制御
US9949056B2 (en) Method and apparatus for presenting to a user of a wearable apparatus additional information related to an audio scene
US20170303052A1 (en) Wearable auditory feedback device
US10303929B2 (en) Facial recognition system
EP4085655A1 (en) Hearing aid systems and methods
US20200269421A1 (en) Information processing device, information processing method, and program
CN111741404B (zh) 拾音设备、拾音***和声音信号采集的方法
US20060195324A1 (en) Voice input interface
CN109119080A (zh) 声音识别方法、装置、穿戴式设备及存储介质
CN105527862B (zh) 一种信息处理方法及第一电子设备
JP2010010857A (ja) 音声入力ロボット、遠隔会議支援システム、遠隔会議支援方法
CN111752522A (zh) 用于听力设备的基于加速度计的音频源的选择
US20230351261A1 (en) Learning data generating device, learning data generating method, learning device, learning method, data structure, information processor, and acoustic treatment device
GB2598333A (en) A method and head-mounted unit for assisting a user
US12032155B2 (en) Method and head-mounted unit for assisting a hearing-impaired user
US20240127849A1 (en) Method of operating singing mode and electronic device for performing the same
US20230218998A1 (en) 3D Spatialisation of Voice Chat
KR20040107523A (ko) 전기 장치에 대한 대화 제어
CN118076942A (zh) 用于发起动作的方法和装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050701

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20071214