JP6140385B2 - 音響操作システム、操作方法およびコンピュータ・プログラム - Google Patents

音響操作システム、操作方法およびコンピュータ・プログラム Download PDF

Info

Publication number
JP6140385B2
JP6140385B2 JP2015209438A JP2015209438A JP6140385B2 JP 6140385 B2 JP6140385 B2 JP 6140385B2 JP 2015209438 A JP2015209438 A JP 2015209438A JP 2015209438 A JP2015209438 A JP 2015209438A JP 6140385 B2 JP6140385 B2 JP 6140385B2
Authority
JP
Japan
Prior art keywords
sound source
sound
target
distance
acoustic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015209438A
Other languages
English (en)
Other versions
JP2017083216A (ja
Inventor
俊 羅
俊 羅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lenovo Singapore Pte Ltd
Original Assignee
Lenovo Singapore Pte Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lenovo Singapore Pte Ltd filed Critical Lenovo Singapore Pte Ltd
Priority to JP2015209438A priority Critical patent/JP6140385B2/ja
Publication of JP2017083216A publication Critical patent/JP2017083216A/ja
Application granted granted Critical
Publication of JP6140385B2 publication Critical patent/JP6140385B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Description

本発明は、単純な操作音で対象装置を制御する技術に関し、さらには、無指向性の操作音でユーザが意図する対象装置を特定する技術に関する。
テレビ、空調機、および照明器具といったホーム・アプライアンスは、専用のまたは集約した赤外線式のリモート・コントローラで制御することができる。近年、IoT(Internet of Things)およびM2M(Machine to Machine)といった、個別に稼働している機器をネットワークで接続し、各機器が生成したデータをリアルタイムで統合して機器の制御に利用するシステムが発展を遂げてきている。ホーム・アプライアンスは、IoT/M2Mシステムに組み込んだ携帯式電子機器を通じて制御することも可能である。
特許文献1は、携帯端末装置に入力した音声コマンドを音声認識して操作する方法を開示する。特許文献2は、VTRやテレビジョン受像機などを音声コマンドで操作する音声コマンド遠隔制御装置を開示する。同文献は、利用者が、所望の電子機器に操作部を向けて押ボタンスイッチを押した後に、その電子機器に対するコマンドを音声で入力すると、その音声信号が無線でベース部に送信されてVTRの再生動作が開始することを記載する。
特開2006−221270号公報 特開平11−120647号公報
ホーム・アプライアンスの操作における1つの課題として、操作を意図するユーザがその場ですみやかに操作できることを挙げることができる。専用のリモート・コントローラは、操作したい瞬間にユーザの手の届く範囲にあるとはいえず、さらにボタン操作は、すみやかな操作という要請に十分に応えることはできない。IoT/M2Mシステムを構成する携帯式電子機器から操作コマンドを送る方法も同様である。
このような課題に応える1つの方法として、カメラでユーザのジェスチャを撮影して操作する方法がある。また、音声認識装置を搭載するホーム・アプライアンスまたはIoT/M2Mシステムが、ユーザ発声した、「オープン」、「クローズ」などのような言語コマンドを認識して対応する操作をする方法もある。しかし、画像認識装置および音声認識装置はシステムの規模が大がかりであることや認識精度などの問題が残る。
そこで本発明の目的は、単純な操作音を利用して対象装置を操作する方法を提供することにある。さらに本発明の目的は、ユーザが意図するときにただちに対象装置を操作できる方法を提供することにある。さらに本発明の目的は、そのような方法を実現する音響操作システム、制御装置、ネットワーク・サーバ、携帯式電子機器およびコンピュータ・プログラムを提供することにある。
本発明は、複数の対象装置の中から音響操作で選択した目的対象装置を操作する音響操作システムを提供する。音響操作システムは、第1の操作位置と第2の操作位置で音源が生成した操作音を検出する複数の対象マイクロフォンを利用して操作音のデータを受け取り、音源から対象マイクロフォンまでの操作音の伝搬時間に基づいて、第1の操作位置から対象マイクロフォンまでの第1の音源距離および第2の操作位置から対象マイクロフォンまでの第2の音源距離を計算する音源距離計算部と、第1の音源距離、第2の音源距離および第1の操作位置から第2の操作位置までの移動距離に基づいて選択した対象マイクロフォンに関連する目的対象装置を特定する対象装置特定部を有する。
操作音は空間において指向性を有しないが、音響操作システムは、第1の操作位置と第2の操作位置で発生した操作音の伝搬時間と移動距離を計算することで、操作音にユーザが意図する方向情報を抽出する。本発明では、音声認識をする必要がないため、指を鳴らしたり掌を叩いたりあるいは携帯式電子機器の筐体を叩いたりする単純なユーザの人体の動きによって操作音を生成するだけで実現できるため、ユーザがその場でただちに操作するのに都合がよい。なお、本発明ではユーザが発生する音声を単純な操作音として利用することもできる。対象マイクロフォンは、対象装置に搭載されていてもよい。
第2の操作位置は、目的対象装置に関連付けられた対象マイクロフォンから第1の操作位置に向かう方向に存在するように設定することができる。この場合、ユーザは第1の操作位置で音響操作をしたあとに、目的対象装置に関連付けられた対象マイクロフォンを目安にして第2の操作位置を選択することで、音響操作システムに容易に目的対象装置を選択する意思を伝えることができる。
音源距離計算部は、操作音の生成時刻と対象マイクロフォンが検出した操作音の検出時刻の時間差から第1の音源距離および第2の音源距離を計算することができる。また、音源距離計算部は、第1の操作位置および第2の操作位置において音源から既知の参照距離に配置した参照マイクロフォンを利用して操作音のデータを受信し、対象マイクロフォンが検出した操作音の検出時刻、参照マイクロフォンが検出した操作音の検出時刻および参照距離を利用して第1の音源距離および第2の音源距離を計算することができる。この場合、音源が生成した操作音の生成時刻を取得する必要がないため、指先や掌のような人体の部位を音源にすることが可能になる。
参照マイクロフォンをユーザが装着するウェアラブル・デバイスに搭載し、音源をユーザの指先または掌とすることができる。この場合、第1の操作位置と第2の操作位置で参照距離を保ちながら音源を容易に第2の操作位置に移動させることができる。さらに、指先や掌による操作音の生成は、直感的かつ迅速な操作を可能にする。参照マイクロフォンをユーザが保持して使用する携帯式電子機器に搭載し、音源を携帯式電子機器の筐体の一部とすることができる。
対象マイクロフォンおよび参照マイクロフォンが検出した雑音を含む検出音から操作音の時間的な発生パターンに基づいて音響操作の有効性を判断する音響操作認識部を備えれば、雑音による誤操作を防ぐことができる。音響操作認識部は、対象マイクロフォンが検出した検出音の検出時刻と参照マイクロフォンが検出した検出音の検出時刻の差に基づいて同一の発生音について対象マイクロフォンと参照マイクロフォンが検出した検出音のペアが操作音のペアを形成しないと判断したときに、音響操作を無効にすることができる。この場合、雑音を誤って操作音と認識したときや、対象マイクロフォンの音響データから操作音を認識できないようなときの誤操作を防ぐことができる。
音響操作認識部は、参照マイクロフォンまたは対象マイクロフォンが検出した先行する検出音の検出時刻と後続の検出音の検出時刻の時間差が所定値以上のときに、当該検出音を破棄して検出音から雑音を取り除くことができる。音響操作システムは、第1の操作位置および第2の操作位置においてそれぞれ生成した複数個の操作音に対応する操作コマンドを目的対象装置に出力する操作コマンド生成部を有していてもよい。
本発明の第2の態様は、複数の対象装置の中から選択した目的対象装置を音響操作に応じて音響操作システムが操作する方法を提供する。音源が第1の操作位置で生成した操作音と第2の操作位置で生成した操作音を複数の対象装置が検出する。つづいて音源から対象装置までの操作音の伝搬時間に基づいて、第1の操作位置から対象装置までの第1の音源距離および第2の操作位置から対象装置までの第2の音源距離を計算する。第1の操作位置と第2の操作位置の移動距離を取得する。つづいて、第1の音源距離、第2の音源距離および移動距離に基づいて目的対象装置を特定する。つづいて、目的対象装置に操作コマンドを送る。
第2の操作位置が、第1の操作位置から目的対象装置に向かう方向に存在する場合に、第1の音源距離と第2の音源距離の差から参照距離を減算した評価パラメータを所定の閾値と比較することで目的対象装置を特定することができる。あるいは複数の対象装置についてそれぞれ計算した評価パラメータを相互に比較することで目的対象装置を特定することができる。
音源から既知の参照距離で操作音を検出した第1の検出時刻を取得し、複数の対象装置が操作音を検出した第2の検出時刻を取得し、第2の検出時刻と第1の検出時刻の差を計算して、第1の音源距離と第2の音源距離を計算することができる。第1の操作位置で第1の個数の操作音を検出し、第2の操作位置で第2の個数の操作音を検出し、第1の個数と第2の個数の組み合わせで複数の操作コマンドを生成し、第1の個数または第2の個数が所定値以上のときに音響操作を無効にすることができる。
本発明により、単純な操作音を利用して対象装置を操作する方法を提供することができた。さらに本発明により、ユーザが意図するときにただちに対象装置を操作できるようにする方法を提供することができた。さらに本発明により、そのような方法を実現する音響操作システム、制御装置、ネットワーク・サーバおよび携帯式電子機器を提供することができた。
本実施の形態にかかる音響操作システム100の概要を説明するための図である。 音響操作システム100を構成する参照デバイス15の一例を説明するための図である。 操作音を検出して音源17から対象装置13までの音源距離dを計算する方法を説明するための図である。 音源距離dと移動距離d0から操作を意図する対象装置13dを特定する方法を説明するための図である。 音響システム100の構成の一例を説明するための概略の機能ブロック図である。 参照デバイス15および対象装置13が検出した検出音30の波形の一例を模式的に示した図である。 音響操作認識部403が、各対象装置13について音響操作の有効性を判断する方法を説明するための図である。 音響操作認識部403が、音響操作の有効性を判断する方法を説明するためのフローチャートである。 音響操作システム100の動作を説明するためのフローチャートである。 音響操作システム600の構成を説明するための概略の機能ブロック図である。 音響操作システム700の構成を説明するための概略の機能ブロック図である。
[定義]
本願明細書で使用する用語の意味を説明する。操作音は、ユーザが音響操作により発生させる時間軸上での離散的な音を意味する。音響操作は、ユーザが第1の操作位置と第2の操作位置のそれぞれで1個または複数個の操作音を生成して複数の対象装置の中から操作を意図する目的対象装置を選択して制御する操作を意味する。発生音は、操作音と雑音を含んだ音響操作の実行環境で発生するすべての音を意味する。検出音は、音響操作システムが検出した発生音を意味する。
[音響操作システム]
図1は、本実施の形態にかかる音響操作システム100の概要を説明するための図である。図2は、音響操作システム100を構成する参照デバイス15の一例を説明するための図である。ユーザ10が存在する3次元空間には、操作対象となる対象装置13a〜13e、ネットワーク・サーバ11および参照デバイス15が存在する。対象装置13a〜13eは特に限定する必要はないが、一例として、空調機、照明装置、テレビ、ドア施錠装置、およびカーテンなどのホーム・アプライアンスとすることができる。対象装置13a〜13eは、それぞれマイクロフォン201a〜201eを搭載している。
マイクロフォン201a〜201eは必ずしも対象装置13a〜13eに搭載する必要はなく、対応する対象装置13a〜13eに接続され、かつ、ユーザにとって両者の関連性が理解できるようになっていればよい。以下においては、対象装置13a〜13e、およびマイクロフォン201a〜201eを個々に区別する必要がないときは、それらを総称して対象装置13、およびマイクロフォン201と記載することにする。対象装置13と記載した場合には、単一の対象装置を示す場合と複数の対象装置を示す場合がある。
ユーザ10は、複数の対象装置13のなかから選択した対象装置13d(たとえばテレビ)に、ネットワーク・サーバ11を通じてオン/オフや音量調整などの操作コマンドを送ろうとしている。対象装置13は、既存のリモート・コントローラやネットワーク・デバイスとの操作を併用してもよい。ユーザ10は、対象装置13dの選択と操作コマンドの送信を第1の操作位置18aと第2の操作位置18bにおける音響操作で行う。
ユーザ10と対象装置13dの間には、第1の操作位置18aで音響操作をした後に音響操作を行う第2の操作位置18bを決めるための仮想的な方向直線19を定義する。ユーザ10は、第1の操作位置18aで音響操作をした後に、方向直線19を意識しながら第2の操作位置18bを決めることができる。第1の操作位置18aと第2の操作位置18bの距離を移動距離d0ということにする。
ユーザ10の手10aには、装着または保持といった態様で参照デバイス15が存在している。参照デバイス15はマイクロフォン301を搭載しており、操作音40を生成した音源17から各対象装置13までの距離を測定するための参照情報を提供する。参照デバイス15は、ユーザ10の手10aを音源にするのに都合がよく、かつ第1の操作場所18aから第2の操作場所18bまでの移動が容易な携帯式電子機器とすることができる。携帯式電子機器の一例として腕時計のように腕に装着するウェアラブル・デバイス15aを採用することができる(図2(A))。
図2でウェアラブル・デバイス15aは、マイクロフォン301aを実装している。参照デバイス15としてウェアラブル・デバイス15aを採用する場合は、ユーザが、親指に押し当てた中指をはじいて指を鳴らすことで、指先で操作音40aを生成する音源17aを構成することができる。音源17で発生した1個または複数個の操作音40aは、空中を球面状に伝搬してマイクロフォン301、201に到達する。
マイクロフォン301は、少なくともユーザが操作音40を生成する際に音源17から既知の参照距離rに存在すればよい。マイクロフォン201は音響操作の際に音源17から未知の距離に存在する。ウェアラブル・デバイス15aの場合は、音源17aとなる指先とマイクロフォン301aの参照距離rを一般的な人間の掌の大きさとしてあらかじめ想定しておくことができる。また、ウェアラブル・デバイス15aでは、空間をユーザ10が移動したり姿勢を変えたりしても参照距離rが変化しないので都合がよい。音源17aは、ユーザが指先に装着する器具や打楽器を利用して構成してもよい。
参照デバイス15としてのウェアラブル・デバイスは、めがねのように顔に装着したりベルトのように腰に装着したりするものでもよい。音源17aは、音響操作の際にマイクロフォン301aから既知の参照距離rに存在していれば指先に限定する必要はなく、ユーザ10の声でもよいしクラッピングする掌でもよい。このような音響操作は、リモート・コントローラやネットワーク・デバイスから操作するよりも、ユーザが意図するときにただちに直感的に行うことができる。参照デバイス15は、少なくとも操作音40を生成する際にマイクロフォン301が音源17から既知の参照距離rに存在するものであれば、ウェアラブル・デバイス15aに限定する必要はない。
図2(B)は、参照デバイス15の他の例としてユーザ10が手に保持して使用する携帯式電子機器15bを示している。携帯式電子機器15bは、マイクロフォン301bを搭載するスマートフォンやタブレット端末とすることができる。ユーザは、マイクロフォン301bから既知の参照距離にある筐体の所定の部位を指やペンで叩いて操作音40bを生成する。叩かれる筐体の所定の部位が音源17bとなる。操作音40bは空中を伝搬してマイクロフォン201に到達し、空中および筐体を伝搬してマイクロフォン301に到達する。
音源17a、17bは、人体の単純な動作で操作音40a、40bを生成することができる。また、ウェアラブル・デバイス15aや携帯式電子機器15bは常にユーザの身近に存在する。したがって、ユーザが意図するときにただちに方向直線19上の第1の操作位置18a、第2の操作位置18bで音響操作をするのに都合がよい。また、音源17a、17bからマイクロフォン301a、301bまでの参照距離rは事前に想定でき、かつ、第1の操作位置18a、第2の操作位置18bで参照距離rを保つのに都合がよい。ただし、本発明は参照デバイス15および音源17をここに例示した範囲に限定するものではなく、本発明の思想を逸脱しない範囲で当業者が容易に想起できるさまざまな参照デバイス15および音源17を採用することができる。
図1に戻って、音響操作システム100は原理上、方向直線19上に複数の対象装置13が重なって存在しないことを前提にする。参照デバイス15と対象装置13は、無線ネットワークでネットワーク・サーバ11に接続している。無線ネットワークの規格は特に限定する必要はなく、無線LANやBluetooth(登録商標)などを採用することができる。なお、本発明は有線ネットワークの適用を排除しない。特にネットワーク・サーバ11と対象装置13は、位置を変化させる必要がないため、有線ネットワークで接続しても音響操作には支障がない。
ネットワーク・サーバ11は、ネットワークを通じて参照デバイス15および対象装置13と操作音40の処理に必要なデータをリアルタイムで交換する。一例において、ネットワーク・サーバ11は、操作音40を処理して、対象装置13を操作するための操作コマンドを生成する。参照デバイス15、対象装置13およびネットワーク・サーバ11は、一例においてIoT/M2Mシステムとして構成することができる。他の例では、ネットワーク・サーバ11を利用しないで、操作音40の処理に必要なデータを参照デバイス15または対象装置13の一方が処理したり、両方で分散して処理したりすることもできる。
音源17で発生した操作音40は、ほぼ球面波となって対象装置13まで伝搬する。音源17は、無指向性の点音源とすることができる。音響操作システム100は、操作音40を時間軸上で離散的に存在する物理的な音として利用するため、操作音40はユーザ10と対象装置13を関連付けるための方向の情報を保有する必要がない。したがって、各対象装置13のマイクロフォン201が操作音40を検出しただけでは、ユーザ10が操作を意図する対象装置13dを特定することができない。ここで、たとえば同じ操作音40を検出するマイクロフォン201c、201dは音源17からの距離が相違するため伝搬時間に差が生ずることに着目する。本実施の形態では以下に説明するように、伝搬時間の差を利用して、方向直線19上に存在する対象装置13dとそれ以外の対象装置を区別して操作を意図する対象装置13dを特定する。
音響操作は、第1の操作位置18aおよび第2の操作位置で操作音40を生成する。ユーザ10は、第1の操作位置18aで1回目の操作音40を生成し、第1の操作位置18aと対象装置13dのマイクロフォン201dを結ぶ方向直線19上の第2の操作位置18bで2回目の操作音を生成する。このとき参照デバイス15のマイクロフォン301と音源17はともに既知の参照距離rを保ちながら第1の操作位置から第2の操作位置まで移動する。
参照デバイス15および対象装置13は、同じ操作音40を異なる検出時刻で検出する。参照デバイス15と各対象装置13は操作音40を瞬時にデータ化してネットワーク・サーバ11に送る。ネットワーク・サーバ11は、第1の操作位置18aおよび第2の操作位置18bにおける音源17から各対象装置13が搭載するマイクロフォン201までの操作音の伝搬時間の差、および参照距離rに基づいて各マイクロフォン201と音源17の距離を計算することができる。各マイクロフォン201と音源17の距離を音源距離d(図3)という。音源距離dに対して対象装置13のサイズが十分に小さい場合は、音源距離dを対象装置13と音源17の距離として扱うことができる。
2つの操作位置18a、18bでそれぞれ計算した音源距離dは、ユーザが操作を意図する対象装置13dを他の対象装置から区別する情報を与える。ネットワーク・サーバ11は、特定した対象装置13dにあらかじめ定義した操作コマンドを送る。音響操作は、第1の操作位置18aおよび第2の操作位置18bでそれぞれ1個の操作音40を生成してもよい。
この場合、対象装置13に対して現在の状態を変更する1個の情報を操作コマンドで送ることができる。具体的には、動作している対象装置を停止させたり、停止している対象装置を動作させたりする操作コマンドを送ることができる。操作コマンドの数をさらに増やすために、第1の操作位置18aおよび第2の操作位置18bでそれぞれ連続的に複数個の操作音40を生成することができる。第1の操作位置18aと第2の操作位置18bのそれぞれにおける操作音40の数の複数の組み合わせに対して複数の操作コマンドを対応付けることができる。
[音源距離の計算]
つぎに図3を参照して、操作音40を検出して音源17から対象装置13までの音源距離dを計算する方法を説明する。操作音40の発生時刻をt0とし、音源17とマイクロフォン301の参照距離をrとし、音源17とマイクロフォン201の音源距離をdとする。図3(A)は、マイクロフォン301、音源17およびマイクロフォン201の空間的な位置関係に対応する図で、図3(B)はそれらを時間軸上に配置した図である。マイクロフォン301は少なくとも音響操作をする際に、音源17を中心とし参照距離rを半径とする円16上に存在する。
任意の発生時刻t0でユーザ10が音響操作をする。音源17で発生した操作音40は音速sで空間を伝搬する。マイクロフォン301は操作音40を検出時刻t1で検出し、マイクロフォン201は同じ操作音40を検出時刻t2で検出する。操作音40がマイクロフォン301まで伝搬する時間tt1は空気中の音速をsとしたとき、tt1=t1−t0=r/sとなる。したがって、ネットワーク・サーバ11はマイクロフォン301の検出音を利用すると操作音40の発生時刻t0を、t0=t1−r/sで計算することができる。操作音40がマイクロフォン201まで伝搬する時間tt2は、tt2=t2−t0=d/sとなる。したがってネットワーク・サーバ11は音源距離dを
d=(t2−t0)s (1)
で計算することができる。
式(1)で音源距離dを計算するネットワーク・サーバ11は、音源17が操作音40を生成する発生時刻t0を電気的に取得する必要がある。たとえば、参照デバイス15が、携帯式電子機器15bの場合は、音源17bの直下に操作音、振動、または圧力などを検知するセンサを設けて、センサが動作した時刻を発生時刻t0とすることができる。ここで、式(1)は、マイクロフォン301が検出した検出時刻t1を使って、
d=(t2−t1)s+r (2)
で計算することができる。
t2−t1は、音源17からマイクロフォン301およびマイクロフォン201までの操作音40の伝搬時間の差に相当する。式(2)は、操作音40のマイクロフォン201での検出時刻t2、マイクロフォン301での検出時刻t1、および参照距離rを取得すれば音源距離dを計算できることを示している。式(2)は、指先や掌のような発生時刻t0を計時することが困難な音源17を採用する場合でも適用できる。
参照デバイス15が携帯式電子機器13bの場合は、マイクロフォン301bから参照距離rの筐体の所定の位置を叩いたときに、操作音40bが空気中と筐体を伝搬する。マイクロフォン301bが筐体を伝搬する検出する操作音40を検出する場合は、筐体の媒質の音速をmとすれば、t0=t1−r/mとなり、ネットワーク・サーバ11は音源距離dを、
d=(t2−t1)s+rs/m (3)
で計算することができる。
[ユーザの操作を意図する対象装置の特定]
図4は、音源距離dと移動距離d0から操作を意図する対象装置13dを特定する方法を説明するための図である。ここでは、操作を意図する対象装置13dを対象装置13cから区別する場合を例にして説明するが、対象装置13dを他の対象装置から区別する原理も同様に理解することができる。ユーザ10は、最初に任意の操作位置18aに音源17を位置付けて操作音40を生成する。
任意の操作位置18aは、ユーザが操作を意図した場所として自由に選択することができる。ネットワーク・サーバ11は、図3を参照して説明した方法で、操作位置18aからマイクロフォン201c、201dまでの音源距離d1、d3を計算する。つぎにユーザ10は方向直線19上の対象装置13dに近い第2の操作位置18bに音源17を位置付けて操作音40を生成する。第2の操作位置18bは、第1の操作位置18aに対して、対象装置13dより遠い位置とすることもできる。移動距離d0はあらかじめ決めておいてもよいが、本実施の形態では任意の移動距離dを後に説明するように参照デバイス15を利用して、または他の方法でネットワーク・サーバ11が計測する。
第2の操作位置18bは、厳密に方向直線19上に存在する必要はない。第2の操作位置18bが方向直線17から離れるときの許容値は、音響操作システム100の対象装置13に対する分解能または対象装置13の相互間の距離に依存する。ネットワーク・サーバ11は図3で説明した方法で、第2の操作位置18bからマイクロフォン201c、201dまでの音源距離d2、d4を計算する。第1の操作位置18aにおける参照距離rと、第2の操作位置18bにおける参照距離rはネットワーク・サーバ11が距離を認識していれば異なる値でもよい。
ネットワーク・サーバ11は、音源距離d1、d2の差および音源距離d3、d4の差を計算する。ここで、音源距離d1、d2の差の絶対値および音源距離d3、d4の差の絶対値をそれぞれΔ12、Δ34とする。第2の操作位置18bがほぼ方向直線19上に存在すれば、対象装置13dに関するΔ12は、Δ12=abs(d1−d2)≒d0となる。また、対象装置13cに関するΔ34は、三角形の3つの辺の大小関係より、移動距離d0より小さくなって、Δ34=abs(d3−d4)≠d0となる。
ここで、Δ12およびΔ34と移動距離d0の差を評価パラメータZということにする。ユーザが操作を意図する対象装置13dの評価パラメータZは、他の対象装置13cの評価パラメータZよりも小さくなる。この性質を利用してネットワーク・サーバ11は、以下の方法で評価パラメータZから対象装置13dを特定することができる。
第1の方法では、ネットワーク・サーバ11が、第1の操作位置18aにおける音源距離をdpとし、第2の操作位置18bにおける音源距離をdqとして、すべての対象装置13について評価パラメータZを計算する。ネットワーク・サーバ11は、評価パラメータZに対して所定の閾値Thを設定して、式(4)を満たす対象装置13をユーザが操作を意図する対象装置13dであると認識することができる。
Z=abs(dp−dq)−d0<Th (4)
式(4)は、評価パラメータZを閾値Thで絶対値評価しているため、ユーザが不用意に行った音響操作に対して、いずれの対象装置13も反応しないようにすることができる。他方で閾値Thを操作環境ごとに設定する必要があり、第2の操作位置18bが方向直線19から外れる程度によっては、対象装置13dを特定できない場合もでてくる。
第2の方法では、すべての対象装置13について計算した評価パラメータZの中で、式(5)を満たすように評価パラメータZが最小を示した対象装置13dを操作対象として特定することができる。
Z=abs(dp−dq)−d0=min (5)
式(5)は、評価パラメータZを相対値評価しているため、第2の操作位置18bが方向直線19から外れても、操作直線19に最も近いいずれかの対象装置13が特定される。ただし、ユーザが不用意に行った音響操作に対してもいずれかの対象装置13が反応することになる。いずれの特定方法を採用するかは、音響操作システム100を導入する環境に基づいて選択することができる。
[音響操作システム]
図5は、音響操作システム100の構成の一例を説明するための概略の機能ブロック図である。音響操作システム100は一例において、複数の対象装置13、参照デバイス15およびネットワーク・サーバ11で構成する。音響操作システム100は、他の例において図10、図11を参照して説明するように、ネットワーク・サーバ11を利用しないで構成することもできる。対象装置13、参照デバイス15およびネットワーク・サーバ11はペアリングを完了すると、ネットワークを通じてデータ交換をして音響操作システム100としてまとまりのある動作をする。ネットワークを通じたデータ交換の速度は、音響が空間や個体媒質を伝搬する時間よりも十分に短い。
複数の対象装置13はそれぞれ、操作音40を検出するマイクロフォン201、A/D変換部203、対象装置機能205、対象装置操作部207およびネットワーク・インターフェース209を備えている。対象装置機能205は、たとえば、テレビ、空調機といった各ホーム・アプライアンスの本来の機能に相当する。対象装置操作部207は、ネットワーク・サーバ11から操作コマンドを受け取って対象装置機能205を制御する。対象装置操作部207は、赤外線式のリモート・コントローラから操作信号を受け取って対象装置機能205を制御してもよい。
参照デバイス15は、マイクロフォン301、A/D変換部303、モーション・センサ305、A/D変換部307およびネットワーク・インターフェース309を備えている。モーション・センサ305は、加速度、角速度および地磁気をそれぞれ3軸で検出する。モーション・センサ305は、第1の操作位置18aから第2の操作位置18bまでの移動距離d0を計測するための状態信号を出力する。A/D変換部203、303、307は、マイクロフォン201,301またはモーション・センサ305から受け取ったアナログ信号に対して標本化処理および量子化処理をしてディジタル・データに変換し、ネットワーク・サーバ11に出力する。
ネットワーク・サーバ11は、ネットワーク・インターフェース401、音響操作認識部403、移動距離計算部405、計時部407、音源距離計算部409、対象装置特定部411および操作コマンド生成部413を含んでいる。これらの要素は、OSやアプリケーション・プログラムのようなソフトウェア資源とそれらを実行するCPU、チップ・セット、およびシステム・メモリなどのハードウェア資源の協働で構成することができる。ソフトウェア資源は、あらかじめネットワーク・サーバ11の不揮発性メモリに格納したり、ネットワークを通じてダウンロードしたりすることができる。
音響操作認識部403は、複数の対象装置13および参照デバイス15から受け取った検出音の音響データから、有効な音響操作を認識する。音響操作認識部403は、有効な音響操作を認識したときに、各対象装置13の検出時刻t2および参照デバイス15の検出時刻t1を音源距離計算部409および移動距離計算部405に送る。音響操作認識部403は、第1の操作位置18aおよび第2の操作位置18bで行われたそれぞれの操作音40の数を操作コマンド生成部413に送る。
計時部407は時刻を計時して、音響操作認識部403に提供する。音源距離計算部409は、あらかじめ音速s、m、および参照距離rを取得している。音源距離計算部409は、図3を参照して説明した方法で、各対象装置13について第1の操作位置18aおよび第2の操作位置18bにおける音源距離dを計算する。
移動距離計算部405は、検出時刻t1、t2におけるモーション・センサ305の状態信号から計算した移動距離d0を対象装置特定部411に送る。対象装置特定部411は、評価パラメータZを使った絶対値評価または相対値評価でユーザが操作を意図する対象デバイス13dを特定してその識別子を出力する。操作コマンド生成部413は、音響操作認識部403から受け取った第1の操作位置18a、第2の操作位置18bのそれぞれの操作音40の個数と、対象装置特定部411から受け取った対象装置13dの識別子から操作コマンドを生成してネットワーク・インターフェース401を通じて対象装置操作部207に出力する。
たとえば第1の操作位置18a、第2の操作位置18bでそれぞれ1個または2個の操作音を生成するときは、2つの操作位置18a、18bで行う1回の音響操作で、(1個,1個)、(1個,2個)、(2個,1個)、(2個,2個)の4つの操作情報を生成することができる。操作コマンド生成部413は、あらかじめ各対象装置13について、操作情報と操作コマンドを対応づけておくことができる。
[音響操作の認識]
つぎに、音響操作認識部403の動作の一例を図6、図7、図8を参照して説明する。図6は、参照デバイス15および対象装置13が検出した検出音30の波形の一例を模式的に示した図である。図7は音響操作認識部403が、各対象装置13について音響操作の有効性を判断する方法を説明するための図である。図8は、音響操作認識部403が音響操作の有効性を判断する手順を説明するためのフローチャートである。
マイクロフォン201、301が検出する検出音30には操作音40に加えて雑音も含まれている。また検出音30の音圧レベルが小さいと音響操作認識部403は操作音40を認識できない。したがって、誤操作を防ぐために雑音と操作音40を区別する必要がある。また、複数個の操作音40で複数の操作コマンドを生成する場合は、連続して生成される後続の操作音40と、第2の操作位置18bで生成される操作音40を区別する必要がある。音響操作認識部403は、対象装置13および参照デバイス15から受け取った雑音を含む検出音30から有効な操作音40を認識して検出時刻および操作音40の個数を抽出する。
図6は、操作位置18a、18bにおいてそれぞれ最大3個の操作音で構成する音響操作を例示して、検出音30から音響操作の有効性を判断する方法の一例を説明するための図である。図6は、第1の操作位置18aにおいて発生時刻t0で発生した連続する2個の発生音について、参照デバイス15が検出した検出音31a、32aと、対象装置13が検出した検出音31b、32bを示している。図6はまた、第2の操作位置18bにおいて発生時刻t00で発生した連続する3個の発生音について、参照デバイス15が検出した検出音33a〜35aと、対象装置13が検出した検出音33b〜35bを示している。
この時点で音響操作認識部403は発生時刻t0、t00を認識せず、また、検出音30と操作場所18a、18bの関係を認識していない。音響操作認識部403は検出音30に対して、第1の操作位置18aおよび第2の操作位置18bで最初に検出した検出音31a、33aの検出時刻t0、t00からの経過時間に、それぞれの操作位置18a、18bで音響操作を完了するまでの閾値Th1を設定している。第1の操作位置18aおよび第2の操作位置18bを認識する方法は後に説明する。
また、音響操作認識部403は検出音30に対して、第1の操作位置18aで最初に検出した検出音31aの検出時刻t0からの経過時間に、第2の操作位置18bでの音響操作を開始および終了するまでの時間としての閾値Th2、Th3を設定している。最小の閾値Th2は、第1の操作位置18aから第2の操作位置18bまで音源17が移動するまでの移動時間の最小値に基づいて設定することができる。最大の閾値Th3は、第1の操作位置18aで音響操作をしたのちに第2の操作位置18bで音響操作をしない場合に、音響操作システム100が今回の音響操作をリセットするまでの許容時間に基づいて設定することができる。
図8のブロック501で音響操作認識部403はリセットされている。リセットされた音響操作認識部403は、リセット後に最初に取得した検出音31a、31bを、第1の操作位置18aで生成されたものとして扱う。音響操作認識部403は、各対象装置13および参照デバイス15から音響データを受信して検出音30の分析を開始する。ブロック503で音響操作認識部403は、時間軸上で離散的に存在する各検出音30の発生時刻と消滅時刻を特定するために、一例において振幅に対して所定の振幅レベル36を設定する。音響操作認識部403は、音源17から対象装置13までの音源距離dが長い場合に、必要に応じて音圧レベルの減衰を補正するために波形処理をすることができる。
音響操作認識部403は、振幅レベル36で各検出音30の検出時刻と消滅時刻を特定して持続時間wを計算する。音響操作認識部403は、あらかじめ音源17が生成する操作音40の持続時間や周波数成分などの特徴情報を登録しておく。音響操作認識部403は、検出音30の持続時間wに対して、下限の閾値Th4および上限の閾値Th5を設定し、
Th4<w≦Th5 (6)
を満たさない検出音を雑音とみなすことができる。音響操作認識部403は、登録した周波数成分と検出音30の周波数成分とを比較して操作音40か否かを認識する。音響操作認識部403は、ブロック551で持続時間wや周波数成分から操作音40として認識できない検出音30を雑音として破棄することができる。
ブロック505で音響操作認識部403は、各検出音30の検出時刻に基づいて先行する検出音と後続の検出音の時間差aを計算する。図6では、検出音31a、32aの時間差a1、検出音33a、34aの時間差a2、検出音34a、35aの時間差a3を示している。対象装置13が検出した検出音についての時間差aも同様に計算することができる。なお、第1の操作位置18aで最後に検出した検出音32aと第2の操作位置18bで最初に検出した検出音33aの時間差は時間差aから除外する。
音響操作認識部403は、時間差aに対して最小の閾値Th6および最大の閾値Th7を設定する。最小の閾値Th6は、ユーザが連続的に操作音40を生成することができる最小の時間差に基づいて設定し、最大の閾値Th7は、閾値Th1と操作音の個数から設定することができる。音響操作認識部403は、
Th6<a≦Th7 (7)
の条件を満たさない後続の検出音30を雑音と見なしてブロック551で破棄することができる。
ここまでの手順で処理された検出音30は、操作音40であっても十分な音圧レベルがないために雑音として破棄されたり、ブロック503、505で分別できない雑音が混入していたりする可能性がある。本実施の形態では、さらに以下の手順を実行して音響操作認識部403が、検出音30の時間的発生パターンに基づいて音響操作の有効性を判断することができる。音響操作システム100は、図3を参照して説明したように音源距離dを計測するために、同一の操作音40について、参照デバイス15が検出した操作音40と各対象装置13が検出した操作音40で、操作音40のペアを形成する必要がある。
ブロック507で音響操作認識部403は、音響操作の有効性を判断するために、雑音を含む同一の発生音に対する検出音30のペア候補が操作音40のペアを形成するか否かを判断する。音響操作認識部403は、対象装置13で検出したたとえば検出音31bに対して、参照デバイス15が検出した先行する最も近い検出音(この場合検出音31a)を検出音30のペア候補として選択することができる。図6は、検出音30のペア候補(31a,31b)、(32a,32b)、(33a,33b)、(34a,34b)および(35a,35b)を示している。
音響操作システム100は、音響操作の利用環境における音源距離dの最大値を、あらかじめ想定することができる。音響操作認識部403は、検出音30のペア候補の有効性を判断するために、検出時刻の時間差(t2−t1)に対して最小の閾値Th8と最大の閾値Th9を設定する。最小の閾値Th8は、想定する最小の音源距離dと参照距離rとの差に基づいて設定することができる。最大の閾値値Th9は、想定する最大の音源距離dと参照距離rとの差に基づいて設定することができる。
音響操作認識部403は検出音30のペア候補が、
Th8<(t2−t1)≦Th9 (8)
を満たさないときに当該対象装置13については操作音40のペアが形成できないため、ブロック553で音響操作を無効として扱う。式(8)を満たす対象装置13については、ブロック509に移行する。図7(A)は、対象装置13が検出音31bを検出しないために、音響操作認識部403は、後続の検出音32bと先行する検出音31aによる検出音30のペア候補が有効でないことを示している。
音響操作認識部403は、各対象装置13について、リセット後に最初に検出した検出音31a、31bおよび式(7)を満たす後続の検出音32a、32bを第1の操作位置18aで発生した検出音30とみなす。音響操作認識部403は、閾値Th1を経過した後に最初に検出した検出音33a、33bおよび式(7)を満たす後続の検出音34a、35a、34b、35bを第2の操作位置18bで発生した検出音30とみなす。ブロック509で音響操作認識部403は、第1の操作位置18aで最初に検出した検出音31aと第2の操作位置18bで最初に検出した検出音33aの時間差bを計算する。対象装置13についても同様に計算することができる。
音響操作認識部403は、時間差bが
Th2<b≦Th3 (9)
を満たさないときに当該対象装置13については、ブロック553で当該音響操作を無効として扱う。式(9)を満たす対象装置13については、ブロック511に移行する。図7(B)は、検出音33aを検出するまでの時間差bが長すぎて、当該対象装置13については、音響操作認識部403がリセットされるときの様子を示している。
ブロック511で音響操作認識部403は、検出時刻t1から閾値Th1の間に検出した検出音30の数および、検出時刻t00から閾値Th1の間に検出した検出音30の数を計算する。音響操作認識部403は、検出音30の数が設定した最大個数(この場合は3個)を超える場合は、雑音が混入しているとみなして、当該対象装置13については、ブロック553で音響操作を無効として扱う。最大個数以下の対象装置13については、ブロック513に移行する。図7(C)は、閾値Th1の間に、4個の検出音31a、32a、36a、37aが検出されて音響操作が無効になるときの様子を示している。
ブロック513で音響操作認識部403は、有効な音響操作を認識した対象装置13について図9のブロック607に移行する。ブロック553で音響操作認識部403は、有効な音響操作を認識しない対象装置13について音響操作認識部403をリセットして図9のブロック603に移行し、新たに第1の操作位置18aで音響操作が行われるまで待機する。ブロック503〜511の手順は、音響操作の環境に応じて適宜選択して採用することができる。また、処理の順番は図8に例示したものに限定する必要はなく、たとえば、ブロック503、505は順番を入れ替えてもよく、また、ブロック507〜511も順番を入れ替えてもよい。
[音響操作システムの動作]
図9は音響操作システム100の動作を説明するためのフローチャートである。ブロック601で対象装置13、ネットワーク・サーバ11および参照デバイス15が相手のネットワーク・アドレスを取得して相互認証を完了し、ネットワークを構築している。ブロック603で音響操作認識部403は発生時刻t0、t00で検出音30を受け取る。
ブロック605で音響操作認識部403は、図8の手順で各対象装置13について音響操作の有効性を判断する。ブロック607で音響操作認識部403は、音響操作が有効であると認識した対象装置13について、たとえば図6に例示した検出音30に対応する操作音40を認識する。音響操作認識部403は、第1の操作位置18aおよび第2の操作位置18bに関する検出時刻t1、t2、t11、t12を音源距離計算部409と移動距離計算部405に送る。
ブロック609で音響操作認識部403は、第1の操作位置18aにおける操作音40の個数(2個)と第2の操作位置18bにおける操作音40の個数(3個)を操作コマンド生成部413に送る。ブロック611で移動距離計算部405は、検出時刻t1、t22と、モーション・センサ305が出力した状態データから移動距離d0を計算して対象装置特定部411に送る。
ブロック613で音源距離計算部409が各対象装置13について式(1)〜(3)のいずれかを利用して、各対象装置13について、第1の操作位置18aおよび第2の操作位置18bにおける音源距離dを計算する。ブロック615で対象装置特定部411は、音響操作認識部403が有効な音響操作を認識した対象装置について式(4)または式(5)のいずれかを適用し、操作を意図している対象装置13dを特定する。ブロック617で操作コマンド生成部413は、特定した対象装置13dの対象装置操作部207に対して、操作音の個数の組み合わせに対応する操作コマンドを出力して音響操作システム100をリセットする。
音響操作システム100は、ネットワーク・サーバ11の機能を対象装置13および参照デバイス15に分散することができる。たとえば、音響操作認識部403、計時部407を対象装置13および参照デバイス15に分散して搭載することもできる。計時部407を対象装置13および参照デバイス15に分散するときは、必要に応じてNTPサーバや同期コマンドを使って、分散した計時部407のRTC(Real Time Clock)を同期することができる。計時部407を分散するときは、音響操作認識部403は、対象装置13と参照デバイス15から検出時刻t1、t2を受け取るようにしてもよい。移動距離計算部405は参照デバイス15に実装することもできる。
マイクロフォン301と移動距離d0を測定するデバイスは参照デバイス15から分離することができる。このとき移動距離d0をモーション・センサ305に代えてステレオ・カメラで計測するようにしてもよい。音響操作システム100の分解能は、対象装置13の相互間の距離に依存する。音源距離dの測定精度は要求される分解能に相応のものにすることができる。この場合、図2(A)に示したように指を鳴らして操作音40aを生成するときに、第1の操作位置18aを胸の近くに設定し、前腕を伸ばした位置を第2の操作位置18bに設定して、標準的な上腕の長さを移動距離d0に設定するようにしてもよい。
[音響操作システムの他の構成例]
図10、図11は、音響操作システム600、700の構成を説明するための概略の機能ブロック図である。図10、図11では、図5と同一の要素または図5から容易に機能が理解できる要素に同一の参照番号を付して説明を省略する。音響操作システム600、700はネットワーク・サーバ11を利用しないで構成している。音響操作システム600はネットワークで接続した、参照デバイス605と対象装置603で構成している。音響操作システム600では、ネットワーク・サーバの機能を参照デバイス605に組み込んでいる。ネットワーク・インターフェース607には、複数の対象装置603が接続される。
音響操作システム700は、対象装置703と参照デバイス705で構成している。音響操作システム700では、ネットワーク・サーバの機能を対象装置703に組み込んでいる。ネットワーク・インターフェース309には、複数の対象装置703が接続される。音響操作システム600、700においても、参照デバイス605および対象装置703が搭載する機能を分散することができる。本発明は図5、図10、図11で説明した音響操作システム100、600、700に限定するものではなく、所定の機能を他の方法で分散したり類似の機能を採用したりする場合も本発明の思想を含み当業者が容易に想起できるものは本発明の範囲に含む。
これまで本発明について図面に示した特定の実施の形態をもって説明してきたが、本発明は図面に示した実施の形態に限定されるものではなく、本発明の効果を奏する限り、これまで知られたいかなる構成であっても採用することができることはいうまでもないことである。
10 ユーザ
11 ネットワーク・サーバ
100、600、700 音響操作システム
13、13a〜13e、603、703 対象装置
15、605、705 参照デバイス
15a ウェアラブル・デバイス(参照デバイス)
15b 携帯式電子機器(参照デバイス)
17、17a、17b 音源
18a 第1の操作位置
18b 第2の操作位置
19 方向直線
30、31a〜35a、31b〜35b 検出音
40、41a〜45a、41b〜45b 操作音
201、201a〜201e、301、301a、301b マイクロフォン
d 音源距離
r 参照距離

Claims (20)

  1. 複数の対象装置の中から音響操作で選択した目的対象装置を操作する音響操作システムであって、
    第1の操作位置と第2の操作位置で音源が生成した操作音を検出する複数の対象マイクロフォンを利用して前記操作音のデータを受信し、前記音源から前記対象マイクロフォンまでの前記操作音の伝搬時間に基づいて、前記第1の操作位置から前記対象マイクロフォンまでの第1の音源距離および前記第2の操作位置から前記対象マイクロフォンまでの第2の音源距離を計算する音源距離計算部と、
    前記第1の音源距離前記第2の音源距離の差と、前記第1の操作位置から前記第2の操作位置までの移動距離との差に基づいて選択した前記対象マイクロフォンに関連付けられた前記目的対象装置を特定する対象装置特定部と
    を有する音響操作システム。
  2. 前記第2の操作位置が前記目的対象装置に関連付けられた対象マイクロフォンから前記第1の操作位置に向かう方向に存在する請求項1に記載の音響操作システム。
  3. 前記音源距離計算部は、前記操作音の生成時刻と前記対象マイクロフォンが検出した前記操作音の検出時刻の時間差から前記第1の音源距離および前記第2の音源距離を計算する請求項1に記載の音響操作システム。
  4. 前記音源距離計算部は、前記第1の操作位置および前記第2の操作位置において前記音源から既知の参照距離に配置した参照マイクロフォンを利用して前記操作音のデータを受信し、前記対象マイクロフォンが検出した前記操作音の検出時刻、前記参照マイクロフォンが検出した前記操作音の検出時刻および前記参照距離を利用して前記第1の音源距離および前記第2の音源距離を計算する請求項1に記載の音響操作システム。
  5. 前記参照マイクロフォンを携帯式電子機器に搭載し、前記音源をユーザの指先または掌とした請求項4に記載の音響操作システム。
  6. 前記携帯式電子機器が、前記移動距離を取得するための状態情報を出力するモーション・センサを搭載する請求項5に記載の音響操作システム。
  7. 前記参照マイクロフォンを携帯式電子機器に搭載し、前記音源を前記携帯式電子機器の筐体の一部とした請求項4に記載の音響操作システム。
  8. 前記対象マイクロフォンおよび前記参照マイクロフォンが検出した雑音を含む検出音の時間的発生パターンに基づいて前記音響操作の有効性を判断する音響操作認識部を有する請求項4に記載の音響操作システム。
  9. 前記音響操作認識部は、前記対象マイクロフォンが検出した検出音の検出時刻と前記参照マイクロフォンが検出した検出音の検出時刻の差に基づいて同一の発生音について前記対象マイクロフォンと前記参照マイクロフォンが検出した検出音のペアが前記操作音のペアを形成しないと判断したときに、前記音響操作を無効にする請求項8に記載の音響操作システム。
  10. 前記音響操作認識部は、前記参照マイクロフォンまたは前記対象マイクロフォンが検出した先行する検出音の検出時刻と後続の検出音の検出時刻の時間差が所定値以上のときに、前記検出音を破棄する請求項8に記載の音響操作システム。
  11. 前記第1の操作位置および前記第2の操作位置においてそれぞれ生成した複数個の操作音に対応する操作コマンドを前記目的対象装置に出力する操作コマンド生成部を有する請求項1に記載の音響操作システム。
  12. 複数の対象装置の中から音響操作で選択した目的対象装置を操作する音響操作システムを構成することが可能なネットワーク・サーバであって、
    音源が生成した操作音を検出できるように第1の操作位置と第2の操作位置で前記音源から既知の参照距離に配置した参照マイクロフォンを搭載する参照デバイスから前記操作音のデータを受け取る第1のインターフェースと、
    前記第1の操作位置および前記第2の操作位置で前記音源が生成した前記操作音を検出する対象マイクロフォンをそれぞれ搭載する前記複数の対象装置から前記操作音のデータを受け取る第2のインターフェースと、
    前記操作音の前記音源から前記対象マイクロフォンまでの伝搬時間と前記音源から前記参照マイクロフォンまでの伝搬時間の差と前記参照距離に基づいて前記対象マイクロフォンと前記第1の操作位置との第1の音源距離および対象マイクロフォンと前記第2の操作位置との第2の音源距離を計算する音源距離計算部と、
    前記第1の音源距離前記第2の音源距離の差と、前記第1の操作位置から前記第2の操作位置までの移動距離との差に基づいて選択した前記対象マイクロフォンを搭載する前記目的対象装置を特定する対象装置特定部と、
    前記第2のインターフェースを通じて前記目的対象装置に操作コマンドを送る操作コマンド生成部と
    を有するネットワーク・サーバ。
  13. 音響操作で操作することが可能な対象装置に搭載する制御装置であって、
    音源が生成した操作音を検出できるように第1の操作位置と第2の操作位置で前記音源から既知の参照距離に配置した参照マイクロフォンを搭載する参照デバイスから前記操作音のデータを受け取るインターフェースと、
    前記操作音を検出する対象マイクロフォンと、
    前記操作音の前記音源から前記対象マイクロフォンまでの伝搬時間と前記音源から前記参照マイクロフォンまでの伝搬時間の差と前記参照距離に基づいて前記対象マイクロフォンと前記第1の操作位置との第1の音源距離および前記対象マイクロフォンと前記第2の操作位置との第2の音源距離を計算する音源距離計算部と、
    前記第1の音源距離前記第2の音源距離の差と、前記第1の操作位置から前記第2の操作位置までの移動距離との差に基づいて目的対象装置であることを認識する対象装置特定部と
    を有する制御装置。
  14. 複数の対象装置の中から音響操作で選択した目的対象装置を操作することが可能な携帯式電気機器であって、
    音源が生成した操作音を検出できるように第1の操作位置と第2の操作位置で前記音源から既知の参照距離に配置した参照マイクロフォンと、
    それぞれ対象マイクロフォンを搭載する前記複数の対象装置から前記操作音のデータを受け取るインターフェースと、
    前記操作音の前記音源から前記対象マイクロフォンまでの伝搬時間と前記音源から前記参照マイクロフォンまでの伝搬時間の差と前記参照距離に基づいて前記対象マイクロフォンと前記第1の操作位置との第1の音源距離および前記対象マイクロフォンと前記第2の操作位置との第2の音源距離を計算する音源距離計算部と、
    前記第1の音源距離前記第2の音源距離の差と、前記第1の操作位置から前記第2の操作位置までの移動距離との差に基づいて選択した前記目的対象装置を特定する対象装置特定部と、
    前記インターフェースを通じて前記目的対象装置に操作コマンドを送る操作コマンド生成部と
    を有する携帯式電子機器。
  15. 複数の対象装置の中から選択した目的対象装置を音響操作に応じて音響操作システムが操作する方法であって、
    音源が第1の操作位置で生成した操作音と第2の操作位置で生成した操作音を前記複数の対象装置が検出するステップと、
    前記音源から前記対象装置までの前記操作音の伝搬時間に基づいて前記第1の操作位置から前記対象装置までの第1の音源距離および前記第2の操作位置から前記対象装置までの第2の音源距離を計算するステップと、
    前記第1の操作位置と前記第2の操作位置の移動距離を取得するステップと、
    前記第1の音源距離前記第2の音源距離の差と、前記移動距離との差に基づいて前記目的対象装置を特定するステップと
    前記目的対象装置に操作コマンドを送るステップと
    を有する方法。
  16. 前記第2の操作位置が、前記第1の操作位置から前記目的対象装置に向かう方向に存在し、
    前記目的対象装置を特定するステップが、前記第1の音源距離と前記第2の音源距離の差から前記移動距離を減算した評価パラメータが所定の閾値より小さい前記対象装置を前記目的対象装置として特定するステップを含む請求項15に記載の方法。
  17. 前記第2の操作位置が、前記第1の操作位置から前記目的対象装置に向かう方向に存在し、
    前記目的対象装置を特定するステップが、前記複数の対象装置についてそれぞれ計算した前記第1の音源距離と前記第2の音源距離の差から前記移動距離を減算した評価パラメータを相互に比較して前記評価パラメータが最小の前記対象装置を前記目的対象装置として特定するステップを含む請求項15に記載の方法。
  18. 前記第1の音源距離と前記第2の音源距離を計算するステップが、
    前記音源から既知の参照距離で前記操作音を検出した第1の検出時刻を取得するステップと、
    前記複数の対象装置がそれぞれ前記操作音を検出した第2の検出時刻を取得するステップと、
    前記第2の検出時刻と前記第1の検出時刻の差を計算するステップと
    を有する請求項15に記載の方法。
  19. 前記第1の操作位置で第1の個数の操作音を検出するステップと、
    前記第2の操作位置で第2の個数の操作音を検出するステップと、
    前記第1の個数と前記第2の個数の組み合わせで複数の前記操作コマンドを生成するステップと、
    前記第1の個数または前記第2の個数が所定値以上のときに前記音響操作を無効にするステップと
    を有する請求項15に記載の方法。
  20. 音響操作に応じて複数の対象装置の中から選択した目的対象装置を操作する音響操作システムに、
    音源が第1の操作位置で生成した操作音と第2の操作位置で生成した操作音を前記複数の対象装置が検出する機能と、
    前記音源から前記対象装置までの前記操作音の伝搬時間に基づいて前記第1の操作位置から前記対象装置までの第1の音源距離および前記第2の操作位置から前記対象装置までの第2の音源距離を計算する機能と、
    前記第1の操作位置と前記第2の操作位置の移動距離を取得する機能と、
    前記第1の音源距離前記第2の音源距離の差と、前記移動距離との差に基づいて前記目的対象装置を特定する機能と
    を実現させるためのコンピュータ・プログラム。



JP2015209438A 2015-10-25 2015-10-25 音響操作システム、操作方法およびコンピュータ・プログラム Active JP6140385B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015209438A JP6140385B2 (ja) 2015-10-25 2015-10-25 音響操作システム、操作方法およびコンピュータ・プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015209438A JP6140385B2 (ja) 2015-10-25 2015-10-25 音響操作システム、操作方法およびコンピュータ・プログラム

Publications (2)

Publication Number Publication Date
JP2017083216A JP2017083216A (ja) 2017-05-18
JP6140385B2 true JP6140385B2 (ja) 2017-05-31

Family

ID=58711734

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015209438A Active JP6140385B2 (ja) 2015-10-25 2015-10-25 音響操作システム、操作方法およびコンピュータ・プログラム

Country Status (1)

Country Link
JP (1) JP6140385B2 (ja)

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1124694A (ja) * 1997-07-04 1999-01-29 Sanyo Electric Co Ltd 命令認識装置
US7148879B2 (en) * 2000-07-06 2006-12-12 At&T Corp. Bioacoustic control system, method and apparatus
JP2005284492A (ja) * 2004-03-29 2005-10-13 Mitsubishi Electric Corp 音声利用操作装置
US7885145B2 (en) * 2007-10-26 2011-02-08 Samsung Electronics Co. Ltd. System and method for selection of an object of interest during physical browsing by finger pointing and snapping
US9195303B2 (en) * 2010-03-15 2015-11-24 Nec Corporation Input device, method and medium
EP3285202B1 (en) * 2013-03-14 2019-01-30 Intermec IP Corp. Synthetic aperture rfid handheld with tag location capability

Also Published As

Publication number Publication date
JP2017083216A (ja) 2017-05-18

Similar Documents

Publication Publication Date Title
Wang et al. Device-free gesture tracking using acoustic signals
JP6553052B2 (ja) ジェスチャ相互作用式の装着可能な空間オーディオシステム
EP3790006A1 (en) Voice control method, wearable apparatus, and terminal
US20150279356A1 (en) Speech recognition system and method
US11009954B2 (en) Haptics device for producing directional sound and haptic sensations
KR101720655B1 (ko) 사용자 동작 인식 기반의 햅틱 피드백 제공 장치 및 그 동작 방법
EP3037946A1 (en) Remote controller, information processing method and system
US10852829B2 (en) Measurement of facial muscle EMG potentials for predictive analysis using a smart wearable system and method
US9811311B2 (en) Using ultrasound to improve IMU-based gesture detection
TWI549497B (zh) 控制游標的方法、遙控器以及智慧電視
US11601806B2 (en) Device, computer program and method
TW201721231A (zh) 可攜式虛擬實境系統
CN110290576A (zh) 电子设备控制方法及装置
KR20210000974A (ko) 영역(zone)을 형성하여 전자 장치에 관한 서비스를 제공하는 방법 및 그 장치
US10306394B1 (en) Method of managing a plurality of devices
JP6140385B2 (ja) 音響操作システム、操作方法およびコンピュータ・プログラム
KR102084209B1 (ko) 전자기 방해 신호 검출
Zayer et al. PAWdio: Hand input for mobile VR using acoustic sensing
CN112098929A (zh) 智能设备间的相对角度确定方法、装置、***和智能设备
WO2019054037A1 (ja) 情報処理装置、情報処理方法、およびプログラム
JP2016122876A (ja) 表示装置、表示システム、空気調和装置、照明装置、及び表示装置制御プログラム
KR102045076B1 (ko) 반지형 무선 컨트롤 장치 및 이를 이용한 무선 컨트롤 방법
JP6188151B2 (ja) 身体を伝播する信号の位相差に基づいて入力情報を決定可能な入力システム及び入力方法
KR20150084756A (ko) 스마트폰 등에 구비된 센서들을 이용한 위치추적시스템
JP6352774B2 (ja) デバイス選択方法、端末、コンピュータプログラム

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170425

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170430

R150 Certificate of patent or registration of utility model

Ref document number: 6140385

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250