JP6145736B2 - 指向性制御方法、記憶媒体及び指向性制御システム - Google Patents

指向性制御方法、記憶媒体及び指向性制御システム Download PDF

Info

Publication number
JP6145736B2
JP6145736B2 JP2015526802A JP2015526802A JP6145736B2 JP 6145736 B2 JP6145736 B2 JP 6145736B2 JP 2015526802 A JP2015526802 A JP 2015526802A JP 2015526802 A JP2015526802 A JP 2015526802A JP 6145736 B2 JP6145736 B2 JP 6145736B2
Authority
JP
Japan
Prior art keywords
unit
sound
image
sound collection
directivity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015526802A
Other languages
English (en)
Other versions
JPWO2015151131A1 (ja
Inventor
信一 重永
信一 重永
渡辺 周一
周一 渡辺
牧 直史
直史 牧
昭年 泉
昭年 泉
林 和典
和典 林
徳田 肇道
肇道 徳田
正治郎 松尾
正治郎 松尾
裕隆 澤
裕隆 澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Intellectual Property Management Co Ltd
Original Assignee
Panasonic Intellectual Property Management Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Intellectual Property Management Co Ltd filed Critical Panasonic Intellectual Property Management Co Ltd
Publication of JPWO2015151131A1 publication Critical patent/JPWO2015151131A1/ja
Application granted granted Critical
Publication of JP6145736B2 publication Critical patent/JP6145736B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones

Landscapes

  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
  • Studio Devices (AREA)
  • Closed-Circuit Television Systems (AREA)
  • Details Of Audible-Bandwidth Transducers (AREA)

Description

本発明は、音声の指向性を制御する指向性制御方法、記憶媒体及び指向性制御システムに関する。
従来、工場、店舗(例えば小売店、銀行)或いは公共の場(例えば図書館)の既定位置(例えば天井面)に設置される監視システムでは、ネットワークを介して1つ以上のカメラ装置(例えばPTZカメラ装置、全方位カメラ装置)を接続し、監視対象範囲の映像の画像データ(静止画像及び動画像を含む。以下同様。)の広画角化が図られている。
また、映像を用いた監視では得られる情報量が限られるので、1つ以上のカメラ装置以外にマイクアレイ装置を用いることにより、カメラ装置の画角内に存在する特定の監視対象(例えば人物)の発する音声データが得られる監視システムの要請が高い。このような監視システムにおいて、監視者が特定の監視対象の発する音声データを聴きたい場合には、カメラ装置により撮像された映像の画像データとマイクアレイ装置により撮像された音声の音声データとの同期が確立している必要がある。
ここで、カメラ装置により撮像された映像の画像データとマイクアレイ装置により撮像された音声の音声データとの同期を確立する先行技術として、特許文献1に示す信号処理装置が知られている。
特許文献1に示す信号処理装置は、撮影者による被写体のズーム操作の結果に応じて、撮像部により撮像された被写体までの距離を算出し、算出された距離に応じて、マイクロホンユニットにより収音された音声を強調する。更に、信号処理装置は、撮影者による被写体までの距離に応じて、撮像部により撮像された映像信号、又はマイクロホンユニットにより収音された音声信号のいずれかを遅延させる。これにより、信号処理装置は、撮影者によって被写体がズーム操作されても、被写体までの距離に応じて映像信号又は音声信号のいずれかを遅延させるので、映像信号と音声信号との同期を確立できる。
日本国特開2009−130767号公報
特許文献1では、撮影者によるズーム操作によって、マイクロホンユニットにより収音された音声信号の強調処理は行われる。しかし、特許文献1の構成を上述した監視システムに適用しようとすると、ズーム操作によって監視者が選択する監視範囲が切り替わると、マイクアレイ装置から、ズーム操作により切り替わった監視範囲における特定の被写体(例えば人物)に対する音声の指向性が適正に形成されない可能性がある。
監視システムにおいて音声データの指向性が適正に形成されないと、たとえ映像と音声とが同期していても、監視対象としての特定の被写体の発する音声が監視者に伝わらず、監視者の監視業務の効率が劣化する。
本発明は、上述した従来の課題を解決するために、監視対象に対するズーム処理により、監視対象の被写体が切り替わった場合でも、切り替わった監視対象の被写体に対する音声の指向性を適正に形成し、監視者の監視業務の効率劣化を抑制する指向性制御方法及び指向性制御システムを提供することを目的とする。
本発明は、複数のマイクを含む収音部で収音された音声の指向性を制御する指向性制御装置における指向性制御方法であって、撮像部により撮像された第1の画像を表示部に表示する第1表示ステップと、前記表示部に表示された前記第1の画像の指定箇所の指定を受け付ける指定受付ステップと、前記第1の画像が前記表示部に表示されている間に指定された前記指定箇所に応じて、前記指定箇所を含む範囲の画像の歪み補正によって得た第2の画像を前記表示部に表示する第2表示ステップと、前記収音部から、前記第2の画像の中心位置に対応する音源への方向に、前記指向性に基づいて前記音源における音声が強調されるためのビームを形成するビーム形成ステップと、入力に応じて、前記表示部の第2の画像を拡大又は小す画像処理ステップと、を備え、前記ビーム形成ステップは、前記画像処理ステップによる拡大又は縮小に応じて、前記形成されたビームのサイズを変更前記撮像部と前記収音部とは室内の天井に配置される、指向性制御方法である。
また、本発明は、複数のマイクを含む収音部で収音された音声の指向性を制御する指向性制御装置における処理を実行するプログラムが格納された記憶媒体であって、撮像部により撮像された第1の画像を表示部に表示するステップと、前記表示部に表示された前記第1の画像の指定箇所の指定を受け付けるステップと、前記第1の画像が前記表示部に表示されている間に指定された前記指定箇所に応じて、前記指定箇所を含む範囲の画像の歪み補正によって得た第2の画像を前記表示部に表示するステップと、前記収音部から、前記第2の画像の中心位置に対応する音源への方向に、前記指向性に基づいて前記音源における音声が強調されるためのビームを形成するステップと、入力に応じて、前記表示部の第2の画像を拡大又は小するステップと、を実行するプログラムが格納され、前記設定された倍率に応じて、前記形成されたビームのサイズを変更するステップを含む、記憶媒体である。
更に、本発明は、収音領域を撮像する撮像部と、複数のマイクを含み前記収音領域の音声を収音する第1収音部と、前記第1収音部で収音された音声の指向性を制御する指向性制御装置と、を備え、前記指向性制御装置は、前記撮像部により撮像された前記収音領域の第1の画像を表示する表示部と、前記表示部に表示された前記第1の画像の指定箇所の指定を受け付ける操作部と、前記第1の画像が前記表示部に表示されている間に指定された前記指定箇所に応じて、前記指定箇所を含む範囲の画像の歪み補正によって得た第2の画像を前記表示部に表示する画像取得部と、前記第1収音部から、前記第2の画像の中心位置に対応する音源への方向に、前記指向性に基づいて前記音源における音声が強調されるためのビームを形成するビーム形成部と、入力に応じて、前記表示部の前記第2の画像を拡大又は小す画像処理部と、を備え、前記ビーム形成部は、前記画像処理部による拡大又は縮小に応じて、前記形成されたビームのサイズを変更前記撮像部と前記第1収音部とは室内の天井に配置される、指向性制御システムである。
更に、本発明は、収音領域を撮像する撮像部と、複数のマイクを含み前記収音領域の音声を収音する第1収音部と、前記第1収音部の周囲に増設される第2収音部と、前記第1収音部と第2収音部で収音された音声の指向性を制御する指向性制御装置と、を備え、前記指向性制御装置は、前記撮像部により撮像された前記収音領域の第1の画像を表示する表示部と、前記表示部に表示された前記第1の画像の指定箇所の指定を受け付ける操作部と、前記第1の画像が前記表示部に表示されている間に指定された前記指定箇所に応じて、前記指定箇所を含む範囲の画像の歪み補正によって得た第2の画像を前記表示部に表示する画像取得部と、前記第1収音部から、前記第2の画像の中心位置に対応する音源への方向に、前記指向性に基づいて前記音源における音声が強調されるためのビームを形成するビーム形成部と、入力に応じて、前記表示部の前記第2の画像を拡大又は小す画像処理部と、を備え、前記ビーム形成部は、前記画像処理部による拡大又は縮小に応じて、前記形成されたビームのサイズを変更前記撮像部と前記第1収音部とは室内の天井に配置される、指向性制御システムである。
本発明によれば、監視対象に対するズーム処理により、監視対象の被写体が切り替わった場合でも、切り替わった監視対象の被写体に対する音声の指向性を適正に形成し、監視者の監視業務の効率劣化を抑制できる。
第1の実施形態の指向性制御システムのシステム構成を示すブロック図 (A)〜(E)全方位マイクアレイ装置の筐体の外観図 全方位マイクアレイ装置が方向θに音声データの指向性を形成する遅延和方式の簡単な説明図 (A)ズームアウト処理時の、指向性パターン、表示画面、音声ズーム範囲及び表示画面の表示範囲を示す図、(B)ズームアウト処理前及びズームイン処理前の、指向性パターン、表示画面、音声ズーム範囲及び表示画面の表示範囲を示す図、(C)ズームイン処理時の、指向性パターン、表示画面、音声ズーム範囲及び表示画面の表示範囲を示す図 (A)屋内のホールの天井面に、一体的に組み込まれた全方位マイクアレイ装置2及びカメラ装置1が取り付けられた監視範囲を示す図、(B)全方位画像データにおいて2人の人物91,92を含む範囲gの選択操作を示す図、(C)歪み補正処理後の2人の人物91,92の画像データがディスプレイ装置に表示され、人物91,92の会話の音声データがスピーカ装置において出力されている様子を示す図、(D)全方位画像データにおいて2人の人物93,94を含む範囲hの選択操作を示す図、(E)歪み補正処理後の2人の人物93,94の画像データがディスプレイ装置に表示され、人物93,94の会話の音声データがスピーカ装置において出力されている様子を示す図 第1の実施形態の指向性制御装置の動作手順を詳細に説明するフローチャート (A)図6に示すプライバシー保護処理の第1例としての音声プライバシー保護処理の動作手順を説明するフローチャート、(B)図6に示すプライバシー保護処理の第2例としての画像プライバシー保護処理の動作手順を説明するフローチャート (A)ボイスチェンジ処理前のピッチに対応する音声信号の波形の一例を示す図、(B)ボイスチェンジ処理後のピッチに対応する音声信号の波形の一例を示す図、(C)検出された人物の顔の輪郭内にぼかしを入れる処理の説明図 第2の実施形態の指向性制御装置の動作手順のうち、第1の実施形態の指向性制御装置の動作手順と異なる動作手順を説明するフローチャート (A)全方位マイクアレイ装置の周囲に増設マイク部を結合する第1例(ドーナツ型結合)を示す正面図、(B)全方位マイクアレイ装置の周囲に増設マイク部を結合する第1例を示す側面図 全方位マイクアレイ装置の周囲に増設マイク部を結合する第2例(ドーナツ楕円型結合)を示す正面図 (A)全方位マイクアレイ装置の周囲に増設マイク部を結合する第3例(正方形型結合又は長方形型結合)を示す正面図、(B)全方位マイクアレイ装置の周囲に増設マイク部を結合する第3例(正方形型結合又は長方形型結合)を示す側面図 (A)全方位マイクアレイ装置の周囲に増設マイク部を結合する第4例(ハニカム型結合)を示す正面図、(B)全方位マイクアレイ装置の周囲に増設マイク部を結合する第5例(ハニカム型結合)を示す正面図 (A)全方位マイクアレイ装置の周囲に増設マイク部を結合する第6例(バー型結合)を示す正面図、(B)全方位マイクアレイ装置の周囲に増設マイク部を結合する第6例(バー型結合)を示す側面図 (A)図14(B)に示す全方位マイクアレイ装置と天井取付板金とが取り付けられた状態を示す平面図、(B)図15(A)のE−E断面を示し、図14(B)に示す全方位マイクアレイ装置の周囲に増設マイク部が取り付けられた状態を示す側面図 (A)全方位マイクアレイ装置の周囲に増設マイク部を結合する第7例(バー型結合)を示す正面図、(B)全方位マイクアレイ装置の周囲に増設マイク部を結合する第8例(バー型結合)を示す正面図、(C)全方位マイクアレイ装置の周囲に増設マイク部を結合する第9例(バー型結合)を示す正面図 (A)全方位マイクアレイ装置の周囲に増設マイク部を結合する第10例(スケルトン型結合)を示す正面図、(B)全方位マイクアレイ装置の周囲に増設マイク部を結合する第10例(スケルトン型結合)を示す側面図、(C)全方位マイクアレイ装置の周囲に増設マイク部を結合する第11例(スケルトン型結合)を示す正面図、(D)全方位マイクアレイ装置の周囲に増設マイク部を結合する第11例(スケルトン型結合)を示す側面図 (A)全方位マイクアレイ装置の周囲への増設マイク部の結合方法の第1例を示す正面図、(B)全方位マイクアレイ装置の周囲への増設マイク部の結合方法の第2例を示す正面図 (A)全方位マイクアレイ装置の周囲への増設マイク部の結合方法の第3例を示す正面図、(B)図19(A)のE−E断面を示し、全方位マイクアレイ装置の周囲への増設マイク部の結合方法の第3例を示す側面図、(C)全方位マイクアレイ装置の周囲への増設マイク部の結合方法の第4例を示す補足説明図 全方位マイクアレイ装置の周囲に増設マイク部を結合する第12例(ピース型結合)を示す斜視図 増設マイク部が結合した全方位マイクアレイ装置のハードウェア構成の一例を示すブロック図
以下、本発明に係る指向性制御装置、指向性制御方法及び指向性制御システムの各実施形態について、図面を参照して説明する。各実施形態の指向性制御システムは、例えば工場、公共施設(例えば図書館、イベント会場)、又は店舗(例えば小売店、銀行)に設置される監視システム(有人監視システム及び無人監視システムを含む)として用いられる。
なお、本発明は、コンピュータである指向性制御装置に、指向性制御方法により規定される動作を実行させるためのプログラム、又は指向性制御方法により規定される動作をコンピュータに実行させるプログラムが記録されたコンピュータ読み取り可能な記録媒体として表現することも可能である。
(第1の実施形態)
図1は、本実施形態の指向性制御システム10のシステム構成を示すブロック図である。図1に示す指向性制御システム10は、カメラ装置1と、全方位マイクアレイ装置2と、指向性制御装置3と、レコーダ装置4とを含む構成である。カメラ装置1と、全方位マイクアレイ装置2と、指向性制御装置3と、レコーダ装置4とは、ネットワークNWを介して相互に接続されている。ネットワークNWは、有線ネットワーク(例えばイントラネット、インターネット)でも良いし、無線ネットワーク(例えば無線LAN(Local Area Network)、WiMAX(登録商標)、無線WAN(Wide Area Network))でも良い。図1に示す指向性制御システム10では、説明を簡単にするために、カメラ装置1及び全方位マイクアレイ装置2は1つだけ図示されているが、複数のカメラ装置及び全方位マイクアレイ装置が含まれても良い。
以下、指向性制御システム10を構成する各装置について説明する。なお、以下の説明を簡単にするために、カメラ装置1の筐体と全方位マイクアレイ装置2の筐体とは同一の位置に一体的に取り付けられるものとして説明するが(図5(A)参照)、カメラ装置1の筐体と全方位マイクアレイ装置2の筐体とは異なる位置に別体として取り付けられても良い。
撮像部の一例としてのカメラ装置1は、例えば後述する天井取付板金7zを介して、イベント会場の天井面8に固定して設置される(図5(A)参照)。カメラ装置1は、例えば監視システムにおける監視カメラとしての機能を有し、ネットワークNWに接続された監視制御室(不図示)からの遠隔操作によって、ズーム機能(例えばズームイン処理、ズームアウト処理)を用いて、所定の収音領域(例えばイベント会場内の既定領域)の全方位の映像を撮像する。カメラ装置1は、収音領域の全方位の映像を示す画像データ(即ち、全方位画像データ)、又は全方位画像データに所定の歪み補正処理を施してパノラマ変換して生成した平面画像データを、ネットワークNWを介して指向性制御装置3又はレコーダ装置4に送信する。
カメラ装置1は、ディスプレイ装置35に表示された画像データの中で、任意の位置が監視者の指95により指定されると、画像データ中の指定位置の座標データを指向性制御装置3から受信し、カメラ装置1から、指定位置に対応する実空間上の音声位置(以下、単に「音声位置」と略記する)までの距離、方向(水平角及び垂直角を含む。以下同様。)のデータを算出して指向性制御装置3に送信する。なお、カメラ装置1における距離、方向のデータ算出処理は公知技術であるため、説明は割愛する。
また、カメラ装置1は、例えばカメラ装置1における定期的なタイミング、又はディスプレイ装置35に表示された画像データに対する監視者の指95の入力操作に応じて、画像データのズームイン処理又はズームアウト処理を行う。定期的なタイミングは、例えば1時間又は10分に1回程度である。ズームイン処理又はズームアウト処理の倍率に関する情報は、予め指定されても良いし、適宜変更されても良い。カメラ装置1は、ズームイン処理又はズームアウト処理を行った場合には、ズームイン処理又はズームアウト処理の倍率に関する情報を指向性制御装置3に送信する。
収音部の一例としての全方位マイクアレイ装置2は、例えば後述する天井取付板金7zを介して、イベント会場の天井面8に固定して設置される(図5(A)参照)。全方位マイクアレイ装置2は、複数のマイクロホンユニット22,23(図2(A)〜(E)参照)が均等な間隔で設けられたマイクロホン部と、マイクロホン部の各マイクロホンユニット22,23の動作を制御するCPU2p(図21参照)とを少なくとも含む構成である。
全方位マイクアレイ装置2は、電源がONされると、マイクロホンユニット内のマイク素子により収音された音声の音声データに所定の音声信号処理(例えば増幅処理、フィルタ処理、加算処理)を施し、所定の音声信号処理により得られた音声データを、ネットワークNWを介して、指向性制御装置3又はレコーダ装置4に送信する。
ここで、全方位マイクアレイ装置2の筐体の外観について、図2(A)〜(E)を参照して説明する。図2(A)〜(E)は、全方位マイクアレイ装置2の筐体の外観図である。図2(A)〜(E)に示す全方位マイクアレイ装置2C,2A,2B,2,2Dは、外観及び複数のマイクロホンユニットの配置位置が異なるが、全方位マイクアレイ装置の機能は同等である。
図2(A)に示す全方位マイクアレイ装置2Cは、円盤状の筐体21を有する。筐体21には、複数のマイクロホンユニット22,23が同心円状に配置されている。具体的には、複数のマイクロホンユニット22が、筐体21と同一の中心を有する同心円状に且つ筐体21の円周に沿って配置され、複数のマイクロホンユニット23が、筐体21と同一の中心を有する同心円状に且つ筐体21の内側に配置されている。各々のマイクロホンユニット22は、互いの間隔が広く、直径が大きく、低い音域に適した特性を有する。一方、各々のマイクロホンユニット23は、互いの間隔が狭く、直径が小さく、高い音域に適した特性を有する。
図2(B)に示す全方位マイクアレイ装置2Aは、円盤状の筐体21を有する。筐体21には、複数のマイクロホンユニット22が、均等な間隔で縦方向と横方向の2方向に沿って十字状に配置され、縦方向の配列と横方向の配列とが筐体21の中心において交わっている。全方位マイクアレイ装置2Aは、複数のマイクロホンユニット22が縦方向と横方向の2方向に直線的に配置されているので、音声データの指向性を形成する場合の演算量を低減できる。なお、図2(B)に示す全方位マイクアレイ装置2Aにおいて、縦方向又は横方向の1列だけに、複数のマイクロホンユニット22が配置されても良い。
図2(C)に示す全方位マイクアレイ装置2Bは、図2(A)に示す全方位マイクアレイ装置2に比べ、直径の小さい円盤状の筐体21Bを有する。筐体21Bには、複数のマイクロホンユニット22が、筐体21Bの円周に沿って均等な間隔で配置されている。図2(C)に示す全方位マイクアレイ装置2Bは、各々のマイクロホンユニット22の間隔が短いので、高い音域に適した特性を有する。
図2(D)に示す全方位マイクアレイ装置2は、筐体21Cの中心に所定の直径を有する開口部21aが形成されたドーナツ型形状又はリング型形状の筐体21Cを有する。本実施形態の指向性制御システム10では、例えば図2(D)に示す全方位マイクアレイ装置2が用いられる。筐体21Cでは、複数のマイクロホンユニット22が、筐体21Cの円周方向に沿って、均等な間隔で同心円状に配置されている。
図2(E)に示す全方位マイクアレイ装置2Dは、矩形状の筐体21Dを有する。筐体21Dには、複数のマイクロホンユニット22が、筐体21Dの外周に沿って均等な間隔で配置されている。図2(E)に示す全方位マイクアレイ装置2Dでは、筐体21Dが矩形形状であるため、例えばコーナー又は壁面においても全方位マイクアレイ装置2Dの設置を簡易化できる。
全方位マイクアレイ装置2の各マイクロホンユニット22,23は、無指向性マイクロホンでも良いし、双指向性マイクロホン、単一指向性マイクロホン、鋭指向性マイクロホン、超指向性マイクロホン(例えばガンマイク)又はこれらの組み合わせでも良い。
指向性制御装置3は、例えば監視制御室(不図示)に設置される据置型のPC(Personal Computer)でも良いし、監視者が携帯可能な携帯電話機、PDA(Personal Digital Assistant)、タブレット端末、スマートフォン等のデータ通信端末でも良い。
指向性制御装置3は、通信部31と、操作部32と、画像処理部33と、信号処理部34と、ディスプレイ装置35と、スピーカ装置36と、メモリ37とを少なくとも含む構成である。信号処理部34は、指向方向算出部34aと、出力制御部34bと、ズーム連動制御部34cとを少なくとも含む。
通信部31は、カメラ装置1から送信された画像データ若しくはズームイン処理又はズームアウト処理の倍率に関する情報、又は全方位マイクアレイ装置2から送信された音声データを受信して信号処理部34に出力する。
操作部32は、監視者の入力操作を信号処理部34に通知するためのユーザインターフェース(UI:User Interface)であり、例えばマウス、キーボード等のポインティングデバイスである。また、操作部32は、例えばディスプレイ装置35の表示画面に対応して配置され、監視者の指95又はスタイラスペンによる入力操作を検出可能なタッチパネルを用いて構成されても良い。
操作部32は、ディスプレイ装置35に表示された画像データ(即ち、カメラ装置1により撮像された画像データ)の中で、監視者の指95により指定された指定位置の座標データを信号処理部34に出力する。また、操作部32は、ディスプレイ装置35に表示された画像データの中で、指95による入力操作により、ズームイン処理又はズームアウト処理の実行を指示した場合には、ズームイン処理又はズームアウト処理の指示内容を信号処理部34に出力する。
画像処理部33は、信号処理部34の指示に応じて、ディスプレイ装置35に表示された画像データに対して所定の画像処理(例えば人物の顔検出、人物の動き検出)を行い、画像処理結果を信号処理部34に出力する。
画像処理部33は、ズームイン処理がカメラ装置1により行われた場合には、信号処理部34の指示に応じて、ズームイン処理後のディスプレイ装置35の表示領域に表示される監視対象物(例えば人物)の顔の輪郭を検出し、顔にマスキング処理を施す。具体的には、画像処理部33は、検出された顔の輪郭を包含する矩形領域を算出し、矩形領域内に所定のぼかしを入れる処理を行う。画像処理部33は、ぼかしを入れる処理により生成された画像データを信号処理部34に出力する。
信号処理部34は、例えばCPU(Central Processing Unit)、MPU(Micro Processing Unit)又はDSP(Digital Signal Processor)を用いて構成され、指向性制御装置3の各部の動作を全体的に統括するための制御処理、他の各部との間のデータの入出力処理、データの演算(計算)処理及びデータの記憶処理を行う。
指向方向算出部34aは、指向方向座標(θMAh,θMAv)の算出時では、監視者の指95により指定された画像データの指定位置の座標データを操作部32から取得すると、通信部31からカメラ装置1に座標データを送信させる。指向方向算出部34aは、カメラ装置1の設置位置から、画像データの指定位置に対応する実空間上の音声(音源)位置までの距離、方向のデータを、通信部31から取得する。
指向方向算出部34aは、カメラ装置1の設置位置から、音声位置までの距離、方向のデータを用いて、全方位マイクアレイ装置2の設置位置から音声位置に向かう指向方向座標(θMAh,θMAv)を算出する。本実施形態のように、カメラ装置1の筐体を囲むように全方位マイクアレイ装置2の筐体が一体的に取り付けられている場合には、カメラ装置1から音声位置までの方向(水平角,垂直角)を、全方位マイクアレイ装置2から音声位置までの指向方向座標(θMAh,θMAv)として用いることができる。なお、カメラ装置1の筐体と全方位マイクアレイ装置2の筐体とが離れて取り付けられている場合には、指向方向算出部34aは、事前に算出されたキャリブレーションパラメータのデータと、カメラ装置1から音声位置までの方向(水平角,垂直角)のデータとを用いて、全方位マイクアレイ装置2から音声位置までの指向方向座標(θMAh,θMAv)を算出する。なお、キャリブレーションとは、指向性制御装置3の指向方向算出部34aが指向方向座標(θMAh,θMAv)を算出するために必要となる所定のキャリブレーションパラメータを算出又は取得する動作である。
指向方向座標(θMAh,θMAv)のうち、θMAhは全方位マイクアレイ装置2の設置位置から音声位置に向かう指向方向の水平角を示し、θMAvは全方位マイクアレイ装置2の設置位置から音声位置に向かう指向方向の垂直角を示す。以下の説明では、説明を簡単にするために、カメラ装置1及び全方位マイクアレイ装置の各水平角の基準方向(0度方向)が一致するとする。
出力制御部34b(ビーム形成部)は、ディスプレイ装置35及びスピーカ装置36の動作を制御し、カメラ装置1から送信された画像データをディスプレイ装置35に表示させ、全方位マイクアレイ装置2から送信された音声データをスピーカ装置36に出力させる。また、出力制御部34bは、全方位マイクアレイ装置2から送信された音声データを用いて、指向方向算出部34aにより算出された指向方向座標(θMAh,θMAv)が示す指向方向に、全方位マイクアレイ装置2により収音された音声の指向性(ビーム)を形成する。
また、出力制御部34bは、カメラ装置1により画像データのズームイン処理又はズームアウト処理が行われた場合には、ズームイン処理後又はズームアウト処理後の画像データをディスプレイ装置35に表示させ、更に、後述するズーム連動制御部34cにより調整された指向方向のビーム幅(サイズ)を用いて、音声データの指向性を再形成する。なお、ここでいうサイズとは、指向性を示すビームのビーム幅に限定されず、図4(A),図4(B),図4(C)に示す指向性パターンPT1,PT2,PT3の縦方向の長さでも良い。以下同様に、ビーム幅をビームサイズと読み替えて良い。
これにより、指向性制御装置3は、指向性が形成された指向方向に存在する監視対象物の発する音声の音量レベルを相対的に増大でき、指向性が形成されない方向の音声を抑圧して音量レベルを相対的に低減できる。
ズーム連動制御部34c(倍率設定部)は、カメラ装置1により画像データのズームイン処理又はズームアウト処理が行われた場合には、ズームイン処理又はズームアウト処理の倍率に関する情報を用いて、出力制御部34bにより形成された指向性(即ち、指向方向のビーム幅)と、スピーカ装置36から出力される音声データの音量レベルとのうち少なくとも一方又はその両方を調整する。なお、ビーム幅及び音量レベルの調整量は、それぞれ既定値でも良いし、ズームイン処理又はズームアウト処理の倍率に関する情報に応じた値でも良い。
具体的には、ズーム連動制御部34cは、カメラ装置1により画像データのズームイン処理が行われた場合には、既定値又はズームイン処理の倍率に関する情報を用いて、指向方向のビーム幅を狭く調整し、更に、音声データの音量レベルを上げる(図4(B)及び(C)参照)。図4(B)は、ズームアウト操作前及びズームイン操作前の、指向性パターンPT1、表示画面、音声ズーム範囲SAR及び表示画面の表示範囲DARを示す図である。図4(C)は、ズームイン処理時の、指向性パターンPT3、表示画面、音声ズーム範囲SAR及び表示画面の表示範囲DARを示す図である。
一方、ズーム連動制御部34cは、カメラ装置1により画像データのズームアウト処理が行われた場合には、既定値又はズームアウト処理の倍率に関する情報を用いて、指向方向のビーム幅を広く調整し、更に、音声データの音量レベルを維持する(図4(A)及び(B)参照)。図4(A)は、ズームアウト処理時の、指向性パターンPT2、表示画面、音声ズーム範囲SAR及び表示画面の表示範囲DARを示す図である。
なお、ここではカメラ装置1のズームイン処理・ズームアウト処理が行われた場合について説明するが、ズームイン処理・ズームアウト処理に限らず画像の拡大・縮小処理が行われた場合に同様の手順が適用できる。例えば、録画された画像を再生しながら画像の拡大・縮小処理が行われた場合に、音声の指向性を変更してもよい。
図4(A)〜(C)において、表示画面の表示範囲DARは、カメラ装置1の画角(即ち撮像可能なエリアIAR)内において、ディスプレイ装置35に表示されている画像データの表示範囲を示す。図4(B)では、音声ズーム範囲SARは、音声データの指向性が形成される範囲を示す。
図4(B)に示す指向性パターンPT1は、カメラ装置1がズームイン処理又はズームアウト処理を行う前に、出力制御部34bが形成した指向性(指向方向のビーム幅)のデフォルト状態を示す。
図4(C)に示す指向性パターンPT3は、カメラ装置1がズームイン処理した後に、出力制御部34bが形成した指向性(指向方向のビーム幅)を示す。図4(A)に示す指向性パターンPT2は、カメラ装置1がズームアウト処理した後に、出力制御部34bが形成した指向性(指向方向のビーム幅)を示す。
図4(B)に示すディスプレイ装置35の画像データに対してズームイン処理が行われると、指向方向のビーム幅が狭く調整されるので、指向性が形成される音声ズーム範囲SARが狭くなり、指向性の強度が上がる。この場合には、ディスプレイ装置35には、ズームイン処理後の画像データ、即ち、音声ズーム範囲SARに対応した表示範囲DARに映る1人の人物が拡大して表示され、この人物の発する音声の音量レベルも増大して出力される。
一方、図4(B)に示すディスプレイ装置35の画像データに対してズームアウト処理が行われると、指向方向のビーム幅が広く調整されるので、指向性が形成される音声ズーム範囲SARが広くなり、指向性の強度が下がる。この場合には、ディスプレイ装置35には、ズームアウト処理後の画像データ、即ち、音声ズーム範囲SARに対応した表示範囲DARに映る3人の人物が縮小して表示され、これら3人の人物の発する音声の音量レベルは維持された状態で出力される。
また、ズーム連動制御部34cは、ズームイン処理がカメラ装置1により行われた場合には、全方位マイクアレイ装置2により収音された音声データにボイスチェンジ処理を施して出力制御部34bに出力する。
表示部の一例としてのディスプレイ装置35は、例えばLCD(Liquid Crystal Display)又は有機EL(Electroluminescence)を用いて構成され、出力制御部34bの制御の下で、カメラ装置1により撮像された画像データを表示する。
音声出力部の一例としてのスピーカ装置36は、全方位マイクアレイ装置2により収音された音声の音声データ、又は、指向方向座標(θMAh,θMAv)が示す指向方向に指向性が形成された音声データを出力する。なお、ディスプレイ装置35及びスピーカ装置36は、指向性制御装置3とは別の構成としても良い。
記憶部の一例としてのメモリ38は、例えばRAM(Random Access Memory)を用いて構成され、指向性制御装置3の各部の動作時のワークメモリとして機能する。なお、メモリ38は、ハードディスク又はフラッシュメモリを用いて構成されても良く、この場合には、レコーダ装置4において記憶されている画像データ及び音声データを記憶している。
レコーダ装置4は、カメラ装置1により撮像された画像データと、全方位マイクアレイ装置2により収音された音声の音声データとを対応付けて記憶している。
図3は、全方位マイクアレイ装置2が方向θに音声データの指向性を形成する遅延和方式の簡単な説明図である。説明を分かり易くするため、マイク素子221〜22nは直線上に配列しているとする。この場合、指向性は面内の二次元領域となるが、三次元空間において指向性を形成するためには、マイクロホンを二次元配列にして、同じ処理方法を行えば良い。
音源80から発した音波は、全方位マイクアレイ装置2のマイクロホンユニット22,23に内蔵される各マイク素子221,222,223,…,22(n−1),22nに対し、ある一定の角度(入射角=(90−θ)[度])で入射する。
音源80は、例えば全方位マイクアレイ装置2の指向方向に存在する監視対象物(例えば図5(A)に示す2人の人物91,92)であり、全方位マイクアレイ装置2の筐体21の面上に対し、所定角度θの方向に存在する。また、各マイク素子221,222,223,…,22(n−1),22n間の間隔dは一定とする。
音源80から発した音波は、最初にマイク素子221に到達して収音され、次にマイク素子222に到達して収音され、同様に次々に収音され、最後にマイク素子22nに到達して収音される。
なお、全方位マイクアレイ装置2の各マイク素子221,222,223,…,22(n−1),22nの位置から音源80に向かう方向は、例えば音源80が監視対象物(例えば2人の人物91,92)の会話時の音声である場合に、全方位マイクアレイ装置2の各マイクロホン(マイク素子)から、監視者がディスプレイ装置35上において指定した指定位置に対応する音声位置に向かう方向と同じである。
ここで、音波がマイク素子221,222,223,…,22(n−1)の順に到達した時刻から最後のマイク素子22nに到達した時刻までには、到達時間差τ1,τ2,τ3,…,τ(n−1)が生じる。このため、各々のマイク素子221,222,223,…,22(n−1),22nが収音した音声の音声データがそのまま加算された場合には、位相がずれた状態で加算されるため、音波の音量レベルが全体的に弱め合う。
なお、τ1は音波がマイク素子221に到達した時刻と音波がマイク素子22nに到達した時刻との差分の時間であり、τ2は音波がマイク素子222に到達した時刻と音波がマイク素子22nに到達した時刻との差分の時間であり、同様に、τ(n−1)は音波がマイク素子22(n−1)に到達した時刻と音波がマイク素子22nに到達した時刻との差分の時間である。
本実施形態では、全方位マイクアレイ装置2は、マイク素子221,222,223,…,22(n−1),22n毎に対応して設けられたA/D変換器241,242,243,…,24(n−1),24nと、遅延器251,252,253,…,25(n−1),25nと、加算器26と、を有する構成である(図3参照)。
即ち、全方位マイクアレイ装置2は、各マイク素子221,222,223,…,22(n−1),22nが収音したアナログの音声データを、A/D変換器241,242,243,…,24(n−1),24nにおいてデジタルの音声データにAD変換する。
更に、全方位マイクアレイ装置2は、遅延器251,252,253,…,25(n−1),25nにおいて、各々のマイク素子221,222,223,…,22(n−1),22nにおける到達時間差に対応する遅延時間を与えて全ての音波の位相を揃えた後、加算器26において遅延処理後の音声データを加算する。これにより、全方位マイクアレイ装置2は、各マイク素子221,222,223,…,22(n−1),22nに、所定角度θの方向に音声データの指向性を形成できる。
例えば図3では、遅延器251,252,253,…,25(n−1),25nに設定された各遅延時間D1,D2,D3,…,D(n−1),Dnは、それぞれ到達時間差τ1,τ2,τ3,…,τ(n−1)に相当し、数式(1)により示される。
Figure 0006145736
L1は、マイク素子221とマイク素子22nとにおける音波到達距離の差である。L2は、マイク素子222とマイク素子22nとにおける音波到達距離の差である。L3は、マイク素子223とマイク素子22nとにおける音波到達距離の差であり、同様に、L(n−1)は、マイク素子22(n−1)とマイク素子22nとにおける音波到達距離の差である。Vsは音波の速度(音速)である。L1,L2,L3,…,L(n−1),Vsは既知の値である。図3では、遅延器25nに設定される遅延時間Dnは0(ゼロ)である。
このように、全方位マイクアレイ装置2は、遅延器251,252,253,…,25(n−1),25nに設定される遅延時間D1,D2,D3,…,Dn−1,Dnを変更することで、マイクロホンユニット22,23に内蔵された各々のマイク素子221,222,223,…,22(n−1),22nが収音した音声の音声データの指向性を簡易に形成できる。
なお、図3に示す指向性の形成処理の説明は、説明を簡単にするために全方位マイクアレイ装置2が行うことを前提として記載した。但し、指向性制御装置3の信号処理部34の出力制御部34bが全方位マイクアレイ装置2のマイクロホンの数と同数のAD変換器241〜24n及び遅延器251〜25nと1つの加算器26とを有する構成である場合には、指向性制御装置3の信号処理部34の出力制御部34bが、全方位マイクアレイ装置2の各マイク素子により収音された音声の音声データを用いて、図3に示す指向性の形成処理を行っても良い。
図5(A)は、屋内のホールの天井面8に、一体的に組み込まれた全方位マイクアレイ装置2及びカメラ装置1が取り付けられた監視範囲を示す図である。図5(B)は、全方位画像データにおいて2人の人物91,92を含む範囲gの選択操作を示す図である。図5(C)は、歪み補正処理後の2人の人物91,92の画像データがディスプレイ装置35に表示され、人物91,92の会話の音声データがスピーカ装置36において出力されている様子を示す図である。図5(D)は、全方位画像データにおいて2人の人物93,94を含む範囲hの選択操作を示す図である。図5(E)は、歪み補正処理後の2人の人物93,94の画像データがディスプレイ装置35に表示され、人物93,94の会話の音声データがスピーカ装置36において出力されている様子を示す図である。
図5(A)では、イベント会場の天井面8に、ドーナツ型形状の全方位マイクアレイ装置2と、全方位マイクアレイ装置2と一体として形成されたカメラ装置1と、スピーカ装置83とが設置された様子が示されている。また、図5(A)では、2人の人物91,92が会話しており、2人の人物93,94が会話しており、スピーカ装置82は所定の音楽(例えばBGM)の音声データを出力している。
図5(B)では、ディスプレイ装置35の表示画面には、カメラ装置1により撮像された収音領域の全方位に関する画像データ(全方位画像データ)が表示されている。監視者は、例えばディスプレイ装置35の表示画面に表示された4人の人物91,92,93,94の画像データのうち、左上付近(具体的には符号gの範囲)を指95でタッチ&ドラッグしたとする。カメラ装置1は、指95がタッチ&ドラッグによって指定された範囲を示す座標データを指向性制御装置3から取得し、符号gの範囲が中心となるように全方位画像データを歪み補正処理及びパノラマ変換することにより、平面画像データを生成して指向性制御装置3に送信する。なお、範囲gは、指95のタッチ点から自動的に生成されるとする。
図5(C)では、カメラ装置1により生成された平面画像データがディスプレイ装置35において表示されている。また、出力制御部34bは、指95のタッチ&ドラッグにより符号gの範囲が指定された場合に、全方位マイクアレイ装置2から、符号gの範囲の中心位置に対応する音声位置に向かう方向に音声データの指向性を形成するので、2人の人物91,92の会話音声(Hello)の音量レベルを周囲の音声の音量レベルに比べて増大して出力する(図5(B)及び(C)参照)。一方、2人の人物91,92に比べ、全方位マイクアレイ装置2により近い距離に設置されているが監視者によって指定された符号gの範囲に含まれないスピーカ装置82が出力している音楽(図5(A)に示す「♪〜」(音符)参照)は、スピーカ装置36から強調して出力されず、2人の人物91,92の会話音声の音量レベルに比べて、小さな音量レベルで出力される。
図5(D)では、図5(B)と同様に、ディスプレイ装置35の表示画面には、カメラ装置1により撮像された収音領域の全方位に関する画像データ(全方位画像データ)が表示されている。監視者は、例えばディスプレイ装置35の表示画面に表示された4人の人物91,92,93,94の画像データのうち、右下付近(具体的には符号hの範囲)を指95でタッチ&ドラッグしたとする。カメラ装置1は、指95がタッチ&ドラッグによって指定された範囲を示す座標データを指向性制御装置3から取得し、符号hの範囲が中心となるように全方位画像データを歪み補正処理及びパノラマ変換することにより、平面画像データを生成して指向性制御装置3に送信する。
図5(E)では、カメラ装置1により生成された平面画像データがディスプレイ装置35において表示されている。また、出力制御部34bは、指95のタッチ&ドラッグにより符号hの範囲が指定された場合に、全方位マイクアレイ装置2から、符号hの範囲の中心位置に対応する音声位置に向かう方向に音声データの指向性を形成するので、2人の人物93,94の会話音声(Hi!!)の音量レベルを周囲の音声の音量レベルに比べて増大して出力する(図5(D)及び(E)参照)。一方、2人の人物93,94に比べ、全方位マイクアレイ装置2により近い距離に設置されているが監視者によって指定された符号hの範囲に含まれないスピーカ装置82が出力している音楽(図5(A)に示す「♪〜」(音符)参照)は、スピーカ装置36から強調して出力されず、2人の人物93,94の会話音声の音量レベルに比べて、小さな音量レベルで出力される。なお、範囲hは、指95のタッチ点から自動的に生成されるとする。
次に、本実施形態の指向性制御システム10の詳細な動作手順について、図6を参照して説明する。図6は、第1の実施形態の指向性制御装置3の動作手順を詳細に説明するフローチャートである。図6の説明の前提として、指向性制御装置3は、監視者の指95により、ディスプレイ装置35に表示された画像データ中の任意の位置が指定され、全方位マイクアレイ装置2から、指95の指定位置に対応する実空間上の音声位置に向かう指向方向を算出しているとする。
図6において、ズーム連動制御部34cは、カメラ装置1のズームイン処理又はズームアウト処理に連動して音声データの指向性(指向方向のビーム幅)及び音量レベルを調整するか否かを示すズーム連動フラグがオンであるか否かを判定する(S1)。ズーム連動制御部34cは、ズーム連動フラグの内容をズーム連動制御部34c自身又はメモリ37において記憶することで、ズーム連動フラグがオンであるかオフであるかを判定する。ズーム連動フラグがオフであると判定された場合には(S1、NO)、図6に示す指向性制御装置3の動作は終了する。
一方、ズーム連動フラグがオンであると判定された場合には(S1、YES)、出力制御部34bは、全方位マイクアレイ装置2から、ディスプレイ装置35に表示されている画像データ中の指定位置に対応する実空間上の音声位置に向かう指向方向に音声データの指向性を形成する(S2)。
ステップS2の後、カメラ装置1の定期的なタイミング又は監視者の入力操作により、ディスプレイ装置35に表示された画像データのズームイン処理又はズームアウト処理の実行が指示されたとする。カメラ装置1は、ズームイン処理又はズームアウト処理の実行の指示に応じて、ディスプレイ装置35に表示された画像データのズームイン処理又はズームアウト処理を行う。カメラ装置1は、ズームイン処理又はズームアウト処理の後、ズームイン処理又はズームアウト処理の倍率に関する情報とズームイン処理又はズームアウト処理後の画像データとを、ネットワークNWを介して指向性制御装置3に送信する。ズーム連動制御部34cは、ズームイン処理又はズームアウト処理の倍率に関する情報(ズーム情報)とズームイン処理又はズームアウト処理後の画像データとを通信部31から取得する(S3)。
ズーム連動制御部34cは、ズームイン処理又はズームアウト処理後の画像データを用いて、画像処理部33に所定の画像処理を実行させる。画像処理部33は、ズーム連動制御部34cからの指示に応じて、ディスプレイ装置35に表示されたズームイン処理又はズームアウト処理後の画像データに対して所定の画像処理(例えば人物の顔検出、人物の動き検出)を行い、画像処理結果をズーム連動制御部34cに出力する(S4)。
ステップS4における画像処理結果により、ディスプレイ装置35に表示されたズームイン処理又はズームアウト処理後の画像データに人物が検出されない場合には(S5、NO)、ズーム連動制御部34cは、ズームイン処理又はズームアウト処理に拘わらず、音声データの指向性を調整せずに維持し、更に、音声データの音量レベルも調整せずに維持すると判定する。出力制御部34bは、ズームイン処理又はズームアウト処理の前における音声データの指向性を維持した状態で、全方位マイクアレイ装置2により収音された音声データを出力する(S6)。ステップS6の後、図6に示す指向性制御装置3の動作は終了する。
一方、ステップS4における画像処理結果により、ディスプレイ装置35に表示されたズームイン処理又はズームアウト処理後の画像データに人物が検出された場合には(S5、YES)、ズーム連動制御部34cは、ステップS3において取得されたズームイン処理又はズームアウト処理の倍率に関する情報を基に、カメラ装置1によりズームイン処理が行われたか否かを判定する(S7)。
ズーム連動制御部34cは、カメラ装置1によりズームイン処理が行われたと判定した場合には(S7、YES)、画像及び音声に関する所定のプライバシー保護処理を行う(S8)。ここで、所定のプライバシー保護処理の動作について、図7(A)、図7(B)、図8(A)〜(C)を参照して説明する。
図7(A)は、図6に示すプライバシー保護処理の第1例としての音声プライバシー保護処理の動作手順を説明するフローチャートである。図7(B)は、図6に示すプライバシー保護処理の第2例としての画像プライバシー保護処理の動作手順を説明するフローチャートである。図8(A)は、ボイスチェンジ処理前のピッチに対応する音声信号の波形の一例を示す図である。図8(B)は、ボイスチェンジ処理後のピッチに対応する音声信号の波形の一例を示す図である。図8(C)は、検出された人物の顔の輪郭内にぼかしを入れる処理の説明図である。なお、画像及び音声に関する所定のプライバシー保護処理の説明では、説明を分かり易くするために、図7(A)に示す画像プライバシー保護処理と、図7(B)に示す音声プライバシー保護処理とに、図面を分けて説明しているが、指向性制御装置3は、図7(A)に示す動作と図7(B)に示す動作とを続けて行っても良い。
図7(A)において、ズーム連動制御部34cは、音声プライバシー保護設定がオンであるか否かを判定する(S8−1)。ズーム連動制御部34cは、音声プライバシー保護設定の内容をズーム連動制御部34c自身又はメモリ37に記憶することで、音声プライバシー保護設定がオンであるかオフであるかを判定する。音声プライバシー保護設定がオフであると判定された場合には(S8−1、NO)、図7(A)に示す音声プライバシー保護処理は終了する。
一方、音声プライバシー保護設定がオンであると判定された場合には(S8−1、YES)、ズーム連動制御部34cは、ディスプレイ装置35に表示された画像データがズームイン処理されて以降、スピーカ装置36において出力される音声データに対してボイスチェンジ処理を施す(S8−2)。ステップS8−2の後、図7(A)に示す音声プライバシー保護処理は終了する。
ボイスチェンジ処理の一例として、ズーム連動制御部34cは、例えば全方位マイクアレイ装置2により収音された音声の音声データ若しくは出力制御部34bにより指向性が形成された音声データの波形のピッチを増大又は減少する(例えば図8(A)及び図8(B)参照)。これにより、ズーム連動制御部34cは、全方位マイクアレイ装置2により収音された音声若しくは指向性が形成された音声データが誰の発した声であるかの特定を困難化でき、ズームイン処理によって切り替わった監視対象物(例えば人物)のプライバシーを効果的に保護できる。
また、図7(B)において、ズーム連動制御部34cは、画像プライバシー保護設定がオンであるか否かを判定する(S8−3)。ズーム連動制御部34cは、画像プライバシー保護設定の内容をズーム連動制御部34c自身又はメモリ37に記憶することで、画像プライバシー保護設定がオンであるかオフであるかを判定する。画像プライバシー保護設定がオフであると判定された場合には(S8−3、NO)、出力制御部34bは、ズームイン処理後の画像データを、そのままディスプレイ装置35に表示させる(S8−6)。
一方、画像プライバシー保護設定がオンであると判定された場合には(S8−3、YES)、画像処理部33は、ズーム連動制御部34cの指示に応じて、ズームイン処理後のディスプレイ装置35の表示領域に表示される監視対象物(例えば人物TRG)の顔の輪郭DTLを検出(抽出)し(S8−4)、顔の輪郭DTLにマスキング処理を施す(S8−5)。具体的には、画像処理部33は、検出された顔の輪郭DTLを包含する矩形領域を算出し、矩形領域内に所定のぼかしを入れる処理を行う(図8(C)参照)。画像処理部33は、ぼかしを入れる処理により生成された画像データを出力制御部34bに出力する。
これにより、画像処理部33は、ズームイン処理後の監視対象の被写体(例えば特定の人物)が誰であるかを分かり難くすることで、被写体の画像上のプライバシーを効果的に保護できる。出力制御部34bは、ズームイン処理後の画像データをディスプレイ装置35に表示させる(S8−6)。ステップS8−6の後、図7(B)に示す画像プライバシー保護処理は終了する。
図6において、ズーム連動制御部34cは、ステップS8のプライバシー保護処理を行った後、既定値又はズームイン処理の倍率に関する情報を用いて、指向方向のビーム幅を狭く調整し、更に、音声データの音量レベルを上げる(S9)。更に、出力制御部34bは、ズーム連動制御部34cによる調整後の指向方向のビーム幅に応じて、音声データの指向性を再形成する(S9)。ステップS9の後、指向性制御装置3の動作はステップS6に進む。
一方、ズーム連動制御部34cは、カメラ装置1によりズームアウト処理が行われたと判定した場合には(S10、YES)、既定値又はズームアウト処理の倍率に関する情報を用いて、指向方向のビーム幅を広く調整し、更に、音声データの音量レベルを維持する、あるいは現在の音量レベルが十分に大きい場合には音量レベルを下げる(S11)。更に、出力制御部34bは、ズーム連動制御部34cによる調整後の指向方向のビーム幅に応じて、音声データの指向性を再形成する(S11)。ステップS11の後、指向性制御装置3の動作はステップS6に進む。
以上により、本実施形態の指向性制御システム10では、指向性制御装置3は、ディスプレイ装置35に表示された監視対象(例えば人物)に対するカメラ装置1のズーム処理により、監視対象の被写体が切り替わった場合には、音声データの指向性の強度(即ち、指向方向のビーム幅)をズーム処理に応じて調整し、更に、調整後のビーム幅に合わせて指向性を再形成するので、切り替わった監視対象の被写体に対する音声データの指向性を適正に形成でき、監視者の監視業務の効率劣化を抑制できる。
例えば、指向性制御装置3は、画像データのズーム処理がズームイン処理である場合に、指向方向のビーム幅を狭く調整でき、切り替わった監視対象の被写体(例えば特定の人物)の発する音声を被写体の周囲の音声に比べて目立つように出力できるので、監視者の監視業務効率を向上できる。
また例えば、指向性制御装置3は、画像データのズーム処理がズームアウト処理である場合に、指向方向のビーム幅を広く調整でき、切り替わった監視対象の被写体(例えば複数の人物)の発する音声を網羅的に出力できるので、監視者の監視業務効率を向上できる。
また、指向性制御装置3は、監視対象に対するズーム処理により、監視対象の被写体が切り替わった場合には、音声データの音量レベルの調整要否を判定するので、ズーム処理の内容に応じて、切り替わった監視対象の表示部の表示領域に対する大きさに合わせて音声を違和感なく出力できる。
例えば、指向性制御装置3は、画像データのズーム処理がズームイン処理である場合に、音声データの音量レベルを上げることができ、切り替わった監視対象の被写体(例えば特定の人物)の発する音声を被写体の周囲の音声に比べて大きな音量で出力できるので、監視者の監視業務効率を向上できる。
また例えば、指向性制御装置3は、画像データのズーム処理がズームアウト処理でも、音声データの音量レベルを維持できるので、切り替わった監視対象の被写体(例えば複数の人物)の発する音声を被写体の周囲の音声と同等に出力でき、ズームアウト処理によっても監視業務を監視者に違和感なく実行させることができる。
また、指向性制御装置3は、画像データに人物が検出されないと画像処理部により判断された場合には、指向方向のビーム幅を維持するので、画像データに人物が検出されていない場合には、音声データの指向性の強弱を調整せず、人物が映り込まない状況において収音領域の周囲の環境音が変動するという違和感を解消できる。
(第2の実施形態)
第1の実施形態の指向性制御システム10では、指向性制御装置3は、カメラ装置1のズームイン処理又はズームアウト処理に応じて、指向方向のビーム幅を狭く又は広く調整し、更に、ズームイン処理である場合には音声データの音量レベルを上げた。
ところが、第1の実施形態の指向性制御システム10では、全方位マイクアレイ装置2内に内蔵されるマイクロホンの配置数が既定であるために、ズームイン処理又はズームアウト処理に応じて、指向方向のビーム幅又は音量レベルが調整された場合でも、例えば収音領域の環境によっては、指向方向の音声データの強調が十分ではない場合が考えられる。
そこで、第2の実施形態では、ズームイン処理又はズームアウト処理に応じて、指向方向のビーム幅又は音量レベルが調整された場合でも、指向方向の音声データの強調が十分ではない場合に、全方位マイクアレイ装置2の周囲に増設マイク部を結合した指向性制御システムについて説明する。第2の実施形態の指向性制御システムのシステム構成のうち、後述する増設マイク部以外の構成は、第1の実施形態の指向性制御システム10と同一であるため、同一の内容に関する説明は簡略化又は省略し、異なる内容について説明する。
次に、本実施形態の指向性制御装置3の動作手順について、図9を参照して説明する。図9は、第2の実施形態の指向性制御装置3の動作手順のうち、第1の実施形態の指向性制御装置3の動作手順と異なる動作手順を説明するフローチャートである。本実施形態の指向性制御装置3の動作手順の説明では、第1の実施形態の指向性制御装置3の動作手順と異なる動作手順について説明する。図9の説明の前提として、増設マイク部が全方位マイクアレイ装置2の周囲に結合される前の状態として説明する。
図9において、ズーム連動制御部34cは、ステップS8のプライバシー保護処理を行った後、既定値又はズームイン処理の倍率に関する情報を用いて、指向方向のビーム幅を狭く調整し、更に、音声データの音量レベルを上げる(S9)。更に、出力制御部34bは、ズーム連動制御部34cによる調整後の指向方向のビーム幅に応じて、音声データの指向性を再形成する(S9)。
ステップS9の後、ズーム連動制御部34cは、ステップS9における指向性の再形成及び調整後の音声データの音量レベルによって出力された音声データの音声強調が十分であるか否かを監視者に問い合わせる(S21)。例えば、ズーム連動制御部34cは、音声強調が十分であるか否かを問い合わせるためのポップアップ画面をディスプレイ装置35に表示させ、監視者の問い合わせに関する回答の入力操作を受け付ける。音声強調が十分であるとの回答が入力された場合には(S21、YES)、指向性制御装置3の動作はステップS6に進む。
一方、音声強調が十分ではないとの回答が入力された場合には(S21、NO)、現在の全方位マイクアレイ装置2が設けられた指向性制御システム10の構成では、指向方向の音声強調が十分ではないため、全方位マイクアレイ装置2、又は全方位マイクアレイ装置2及び増設マイク部の電源がオフされた後(S22)、後述する取付方法に従って、全方位マイクアレイ装置2の周囲に増設マイク部が新規に結合される(S23)。全方位マイクアレイ装置2の周囲に対する増設マイク部の結合が終了した場合に(S24、YES)、全方位マイクアレイ装置2、又は全方位マイクアレイ装置2及び増設マイク部の電源がオンされる(S25)。この後、ズーム連動制御部34cは、再びステップS9における指向性の再形成及び調整後の音声データの音量レベルによって出力された音声データの音声強調が十分であるか否かを監視者に問い合わせる(S21)。
次に、本実施形態において第1収音部としての全方位マイクアレイ装置2の周囲に結合される各種の増設マイク部について、図面を参照して説明する。
図10(A)は、全方位マイクアレイ装置2の周囲に増設マイク部2z1aを結合する第1例(ドーナツ型結合)を示す正面図である。図10(B)は、全方位マイクアレイ装置2の周囲に増設マイク部2z1aを結合する第1例を示す側面図である。
図10(A)では、第2収音部の一例としての増設マイク部の第1例として、全方位マイクアレイ装置2の周囲を囲める程の開口部を有し、全方位マイクアレイ装置2と同心円状の筐体(ドーナツ状筐体)を有する増設マイク部2z1aが示されている。具体的には、増設マイク部2z1aと全方位マイクアレイ装置2とは、同一平面上に結合されず、図10(B)に示すように、高さ方向(鉛直方向)に離れて設置される。
結合方法としては、先ず天井面8から全方位マイクアレイ装置2及びカメラ装置1が取り外され、増設マイク部2z1aが天井面8に取り付けられてビス孔7eb1,7eb2を介してビス41によって固定され、その後、全方位マイクアレイ装置2が増設マイク部2z1aと高さ方向に離れるように取り付けられ、全方位マイクアレイ装置2と増設マイク部2z1aとがビス孔7ea1,7ea2を介してビス41によって固定される。なお、全方位マイクアレイ装置2及びカメラ装置1と増設マイク部2z1aとがそれぞれ天井面8に固定されるように取り付けられ、それぞれビス孔7ea1,7ea2を介してビス41によって固定されても良い。また、増設マイク部2z1aは、増設マイク部2z1aの筐体が天井取付金具7rによって、天井面8に固定されることが好ましい。また、全方位マイクアレイ装置2の筐体に設けられるビス孔7eb1,7eb2は、補強強度の観点から、図10(A)に示すマージン線SPLより外側の位置に設けられることが好ましい。また、ここでは結合方法としてビス41を用いたビス留めにより固定する例を説明しているが、公知の係止構造を用いて固定しても良く、以下同様である。
従って、図10(A)に示す増設マイク部2z1aの結合により、本実施形態の指向性制御システム10は、増設マイク部2z1aの円周上に複数のマイク素子を均等に配置させることにより、全方位マイクアレイ装置2を単独で用いる場合の音声の収音特性に比べて、全方位に対する音声の収音特性を均等に一層向上できる。また、指向性制御システム10は、全方位マイクアレイ装置2と増設マイク部2z1aとが高さ方向に離れて設置されるので、垂直方向(鉛直方向)の収音性能を向上できる。
図11は、全方位マイクアレイ装置2の周囲に増設マイク部2z2を結合する第2例(ドーナツ楕円型結合)を示す正面図である。
図11では、増設マイク部の第2例として、全方位マイクアレイ装置2の周囲を囲める程の開口部を有し、楕円形状の筐体を有する増設マイク部2z2が示されている。増設マイク部2z2の取り付け方法は、図10(B)に示す増設マイク部2z1aの取り付け方法と同様に、ビス孔7ec1,7ec2を介してビス41によって固定され、その他の説明(例えば全方位マイクアレイ装置2及びカメラ装置1の固定方法、マージン線SPLより外側に設けられるビス孔7ea1,7ea2。以下同様。)は同一であるため、説明を割愛する。
従って、図11に示す増設マイク部2z2の結合により、本実施形態の指向性制御システム10は、例えば増設マイク部2z2の楕円形状の長手方向には楕円形状の長手方向以外の方向に比べてより多くのマイク素子を配置させることができ、全方位マイクアレイ装置2を単独で用いる場合の音声の収音特性に比べて、音声の収音特性を均一に向上でき、更に、楕円形状の長手方向に対する音声の収音特性をより一層向上できる。また、指向性制御システム10は、全方位マイクアレイ装置2と増設マイク部2z2とが高さ方向に離れて設置されるので、垂直方向(鉛直方向)の収音性能を向上できる。
図12(A)は、全方位マイクアレイ装置2の周囲に増設マイク部2z3を結合する第3例(正方形型結合又は長方形型結合)を示す正面図である。図12(B)は、全方位マイクアレイ装置2の周囲に増設マイク部2z3を結合する第3例(正方形型結合又は長方形型結合)を示す側面図である。
図12(A)では、増設マイク部の第3例として、全方位マイクアレイ装置2の周囲を囲める程の開口部を有し、矩形形状の筐体(例えば正方形状又は長方形状の筐体)を有する増設マイク部2z3が示されている。具体的には、増設マイク部2z3と全方位マイクアレイ装置2とは、同一平面上に結合されず、図12(B)に示すように、高さ方向(鉛直方向)に離れて設置される。
結合方法としては、先ず天井面8から全方位マイクアレイ装置2及びカメラ装置1が取り外され、増設マイク部2z3が天井面8に取り付けられてビス孔7ed1,7ed2を介してビス41によって固定され、その後、全方位マイクアレイ装置2が増設マイク部2z3と高さ方向に離れるように取り付けられ、全方位マイクアレイ装置2と増設マイク部2z3とがビス孔7ea1,7ea2を介してビス41によって固定される。なお、全方位マイクアレイ装置2と増設マイク部2z3とがそれぞれ天井面8に固定されるように取り付けられ、それぞれビス孔7ea1,7ea2を介してビス41によって固定されても良い。
従って、図12(A)に示す増設マイク部2z3の結合により、本実施形態の指向性制御システム10は、増設マイク部2z3の開口部の周囲に複数のマイク素子を均等に配置させることにより、全方位マイクアレイ装置2を単独で用いる場合の音声の収音特性に比べて、全方位に対する音声の収音特性を均等に一層向上でき、更に、増設マイク部2z3を柔軟に設置できる。また、指向性制御システム10は、全方位マイクアレイ装置2と増設マイク部2z3とが高さ方向に離れて設置されるので、垂直方向(鉛直方向)の収音性能を向上できる。
図13(A)は、全方位マイクアレイ装置2の周囲に増設マイク部2z4を結合する第4例(ハニカム型結合)を示す正面図である。図13(B)は、全方位マイクアレイ装置2sの周囲に増設マイク部2z4を結合する第5例(ハニカム型結合)を示す正面図である。
図13(A)では、増設マイク部の第4例として、全方位マイクアレイ装置2の周囲を囲める程の開口部を有し、ハニカム形状の筐体を有する増設マイク部2z4が示されている。増設マイク部2z4の取り付け方法は、図10(B)に示す増設マイク部2z1aの取り付け方法と同様に、ビス孔7ee1,7ee2を介してビス41によって固定され、その他の説明は同一であるため、説明を割愛する。なお、ハニカム形状の増設マイク部2z4の取り付け数は、1つに限らず、必要応じて2つ以上でも良い。
また、図13(B)では、増設マイク部の第5例として、図13(A)に示すハニカム形状と同一のハニカム形状の筐体を有する増設マイク部2z4aが示され、全方位マイクアレイ装置2sの筐体の形状も全方位マイクアレイ装置2の筐体の形状と異なっており、矩形形状である。増設マイク部2z4aは図13(A)に示す増設マイク部2z4の開口部が形成されていない。また、全方位マイクアレイ装置2sの中心に、魚眼レンズを用いた魚眼カメラ(カメラ装置)1sが取り付けられている。増設マイク部2z4aの取り付け方法は、図10(B)に示す増設マイク部2z1aの取り付け方法と同様に、ビス孔7ef1,7ef2を介してビス41によって固定され、また、全方位マイクアレイ装置2sも同様に、ビス孔7ea3,7ea4を介してビス41によって固定され、その他の説明は同一であるため、説明を割愛する。
従って、図13(A)又は図13(B)に示す増設マイク部2z4,2z4aの結合により、本実施形態の指向性制御システム10は、増設マイク部2z4の開口部又は増設マイク部2z4aの外郭に沿って複数のマイク素子を均等に配置させることにより、全方位マイクアレイ装置2を単独で用いる場合の音声の収音特性に比べて、全方位に対する音声の収音特性を均等に一層向上でき、更に、増設マイク部2z4,2z4aを柔軟に設置でき、増設マイク部2z4,2z4aの増設方向に応じて、収音性能に差をつけることができる。また、指向性制御システム10は、全方位マイクアレイ装置2と増設マイク部2z4,2z4aとが高さ方向に離れて設置されるので、垂直方向(鉛直方向)の収音性能を向上できる。
図14(A)は、全方位マイクアレイ装置2の周囲に増設マイク部2z5a,2z5b,2z5c,2z5dを結合する第6例(バー型結合)を示す正面図である。図14(B)は、全方位マイクアレイ装置2の周囲に増設マイク部2z5a,2z5b,2z5c,2z5dを結合する第6例(バー型結合)を示す側面図である。
図14(A)では、増設マイク部の第6例として、全方位マイクアレイ装置2の周囲に、一方向に長い棒形状の筐体を有する増設マイク部2z5a,2z5b,2z5c,2z5dが示されている。具体的には、増設マイク部2z5a,2z5b,2z5c,2z5dと全方位マイクアレイ装置2とは、同一平面上に結合されても良いし、高さ方向(鉛直方向)に離れて設置されても良い。
結合方法としては、先ず天井面8から全方位マイクアレイ装置2が取り外され、既設の天井取付板金7zの端部と、増設マイク部(例えば増設マイク部2z5a,2z5c)を取り付けるための増設用取付板金7z1,7z2の端部とがそれぞれ嵌め込んで係止され、ビス41によって固定される。更に、全方位マイクアレイ装置2及びカメラ装置1が天井取付板金7zに取り付けられてビス41によって固定され、その後、増設マイク部(例えば増設マイク部2z5a,2z5c)が増設用取付板金7z1,7z2に取り付けられてビス41によって固定される。
従って、図14(A)に示す増設マイク部2z5a,2z5b,2z5c,2z5dの結合により、本実施形態の指向性制御システム10は、増設マイク部2z5a,2z5b,2z5c,2z5dの長手方向に沿って複数のマイク素子を均等に配置させることにより、全方位マイクアレイ装置2を単独で用いる場合の音声の収音特性に比べて、棒形状の長手方向に対する音声の収音特性を一層向上できる。
ここで、図14(B)に示す天井取付板金7zに対する全方位マイクアレイ装置2及びカメラ装置1の取付構造と、増設用取付板金7z1,7z2に対する増設マイク部2z5a,2z5cの取付構造と、天井取付板金7zと増設用取付板金7z1,7z2との係止構造について、図15(A)及び図15(B)を参照して説明する。図15(A)は、図14(B)に示す全方位マイクアレイ装置2と天井取付板金7zとが取り付けられた状態を示す平面図である。図15(B)は、図15(A)のE−E断面を示し、図14(B)に示す全方位マイクアレイ装置2の周囲に増設マイク部2z5a,2z5cが取り付けられた状態を示す側面図である。
図15(A)には、天井取付板金7zの表面から見た場合、即ち、天井面8から図15(B)に示す下方向を見た場合の全方位マイクアレイ装置2及びカメラ装置1の取付構造が示されている。天井取付板金7zは、表面に凹凸を有する略円盤状に形成された金属製の部材であるが、セラミックス製又は合成樹脂(例えばプラスチック又はエラストマ)製の部材が代用されても良い。
天井面8に対向する天井取付板金7zの表面には、同軸i方向に突出し、カメラ装置1を取り付けて固定するための係止片7aが同心円上の3箇所に形成されている。更に、天井取付板金7zの表面には、同軸i方向に突出し、全方位マイクアレイ装置2を取り付けて固定するための係止片7bが、係止片7aが形成された同心円よりも大きな直径の同心円上の3箇所に形成されている。
係止片7aには、カメラ装置1の底面に設けられた固定ピン43と係合する係合孔71が、一端部の径が他端部の径に比べて大きい略ひょうたん状に形成されている。同様に、係止片7bには、全方位マイクアレイ装置2の底面に設けられた固定ピン45と係合する係合孔73が、一端部の径が他端部の径に比べて大きい略ひょうたん状に形成されている。
固定ピン43,45は、それぞれ係合孔71,73の一端部と他端部との間の太さ(直径)を有する頭部と頭部より細い胴部とからなる。
天井取付板金7zの表面には、係止片7a及び係止片7bの外側に広がるように、扇形の孔部7c,7dがそれぞれ3箇所に形成されている。これらの扇形の孔部7c,7dの形状及び位置は、天井取付板金7zに全方位マイクアレイ装置2及びカメラ装置1が取り付けられた場合に、全方位マイクアレイ装置2及びカメラ装置1の各水平角の基準方向が一致するように設計されている。
天井取付板金7zの表面の中央部には、ビス41が挿通されるビス孔7eが3箇所に形成されている。天井取付板金7zは、ビス孔7eを介して、天井面8にビス41を螺合させることで、天井面8に固定される。
全方位マイクアレイ装置2及びカメラ装置1が天井取付板金7zに取り付けられる場合、先ず、カメラ装置1が天井取付板金7zに取り付けられる。この場合、固定ピン43を係止片7aに形成された係合孔71に係合させる。
即ち、カメラ装置1の底面に突出する固定ピン43を、係合孔71の径の大きい一端部側に挿し込む。そして、固定ピン43の頭部が係合孔71から突出した状態で、カメラ装置1を右方向又は左方向に回転させることで固定ピン43を係合孔71において移動させる(回転ロック方式)。そして、固定ピン43の頭部が係合孔71の他端部側に移動した状態で、固定ピン43と係合孔71とは係合したことになり、カメラ装置1は同軸i方向に固定される。
カメラ装置1を天井取付板金7zに取り付けた後、全方位マイクアレイ装置2を、全方位マイクアレイ装置2の開口部21aの内側からカメラ装置1が露出するように、天井取付板金7zに取り付ける。この場合、固定ピン45を係止片7bに形成された係合孔73に係合させる。なお、固定ピン45を係合孔73に固定する手順は、固定ピン43を係合孔71に固定する手順と同様である。
図16(A)は、全方位マイクアレイ装置2の周囲に増設マイク部2z5a,2z5b,2z5c,2z5d,2z5e,2z5f,2z5g,2z5hを結合する第7例(バー型結合)を示す正面図である。図16(B)は、全方位マイクアレイ装置2の周囲に増設マイク部2z5c,2z5f,2z5hを結合する第8例(バー型結合)を示す正面図である。図16(C)は、全方位マイクアレイ装置2の周囲に増設マイク部2z5a、2z5eを結合する第9例(バー型結合)を示す正面図である。
図16(A)〜図16(C)においても、各々の増設マイク部の取り付け方及び増設マイク部を取り付けたことによる効果は、増設マイク部の個数を除けば、図14(A)に示す増設マイク部2z5a,2z5b,2z5c,2z5dの取り付け方及び増設マイク部を取り付けたことによる効果と同様であるため、説明を割愛する。
図17(A)は、全方位マイクアレイ装置2の周囲に増設マイク部m1,m2,m3,m4を結合する第10例(スケルトン型結合)を示す正面図である。図17(B)は、全方位マイクアレイ装置2の周囲に増設マイク部m1,m2,m3,m4を結合する第10例(スケルトン型結合)を示す側面図である。図17(C)は、全方位マイクアレイ装置2の周囲に増設マイク部m1,m2,m3,m4,m5,m6,m7,m8を結合する第11例(スケルトン型結合)を示す正面図である。図17(D)は、全方位マイクアレイ装置2の周囲に増設マイク部m1,m2,m3,m4,m5,m6,m7,m8を結合する第11例(スケルトン型結合)を示す側面図である。
図17(A)では、増設マイク部の第10例として、全方位マイクアレイ装置2の筐体の対向する4箇所に設けられたコネクタ部c1,c2,c3,c4に、マイク線収容管n1,n2,n3,n4を介して、増設マイク部m1,m2,m3,m4が結合されている。
結合方法としては、先ず、全方位マイクアレイ装置2の筐体の対向する4箇所に設けられたコネクタ部c1,c2,c3,c4にマイク線収容管n1,n2,n3,n4を接続する。マイク線収容管n1,n2,n3,n4は、例えば樹脂成型により製造されたものであり、増設マイク部m1,m2,m3,m4により収音された音声の音声データを伝送するための信号線が内部に収容されている。マイク線収容管n1,n2,n3,n4が接続された後、増設マイク部m1,m2,m3,m4がマイク線収容管n1,n2,n3,n4に接続され、増設マイク部m1,m2,m3,m4の結合が終了する。
従って、図17(A)に示す増設マイク部m1,m2,m3,m4の結合により、本実施形態の指向性制御システム10は、上述した増設マイク部内のマイク素子を収容するための筐体を不要とし、筐体による音声(音波)の回り込みを排除して音声を収音できるので、全方位マイクアレイ装置2と増設マイク部m1,m2,m3,m4とを高さ方向に離れて設置する必要が無い。また、指向性制御システム10は、マイク線収容管n1,n2,n3,n4を介して、全方位マイクアレイ装置2の周囲に設けられたコネクタ部c1,c2,c3,c4と増設マイク部m1,m2,m3,m4とを簡易に接続でき、更に、全方位マイクアレイ装置2に所定形状の筐体を有する増設マイク部を増設する場合に比べて、増設マイク部を軽量化できるので、増設マイク部内のマイク素子における収音特性を一層向上できる。
また、図17(C)においても、各々の増設マイク部の取り付け方は、増設マイク部の個数を除けば、図17(A)に示す増設マイク部m1,m2,m3,m4の取り付け方と同様であるため、説明を割愛する。効果については、増設マイク部m1,m2,m3,m4と高さが違う増設マイク部m5,m6,m7,m8が追加されることで、増設マイク部m1,m2,m3,m4のみを結合する第10例に比べて、垂直方向(鉛直方向)の収音性能を向上できる。
図18(A)は、全方位マイクアレイ装置2の周囲を囲める開口部を有し、全方位マイクアレイ装置2と同心円状の筐体(ドーナツ筐体)を有する増設マイク部2z1の結合方法の第1例を示す正面図である。図18(B)は、全方位マイクアレイ装置2の周囲への増設マイク部2z1の結合方法の第2例を示す正面図である。
図18(A)に示す結合方法では、全方位マイクアレイ装置2及びカメラ装置1が拡大天井取付板金7yに予め接続されており、増設マイク部2z1が結合される場合には、全方位マイクアレイ装置2の周囲を囲むように、拡大天井取付板金7yに接続される。
図18(B)に示す結合方法では、既設の天井取付板金7zから全方位マイクアレイ装置2及びカメラ装置1が取り外され、天井取付板金7zに、例えば4つの固定部f1,f2,f3,f4を固定し、更に、増設マイク部2z1を天井取付板金7zに取り付ける場合には、4つの固定部f1,f2,f3,f4にそれぞれビス41を留めて固定する。その後、増設マイク部2z1の開口部に収まるように、全方位マイクアレイ装置2及びカメラ装置1が取り付けられる。
図19(A)は、全方位マイクアレイ装置2fの周囲への増設マイク部2z1の結合方法の第3例を示す正面図である。図19(B)は、図19(A)のE−E断面を示し、全方位マイクアレイ装置2fの周囲への増設マイク部2z1の結合方法の第3例を示す側面図である。図19(C)は、全方位マイクアレイ装置2の周囲への増設マイク部2z1の結合方法の第4例を示す補足説明図である。図19(A)及び図19(B)に示す例では、全方位マイクアレイ装置2fの筐体の円周に、例えば2つのフック部f5,f7が係止可能な凹部u1,u2が設けられている。
図19(A)及び図19(B)に示す結合方法では、既設の天井取付板金7zから全方位マイクアレイ装置2f及びカメラ装置1が取り外され、天井取付板金7zに、増設マイク部2z1の開口部の対向する4箇所に設けられたフック部f5,f6,f7,f8を凹部u1,u2に係止させて固定し、更に、全方位マイクアレイ装置2f及びカメラ装置1が取り付けられる。
図19(C)に示す結合方法では、既設の天井取付板金7zは、例えば3つのフック部f9,f10,f11が設けられた拡大天井取付板金7yに交換される。拡大天井取付板金7yに、順次、増設マイク部2z1、全方位マイクアレイ装置2及びカメラ装置1が回転ロック方式(図15(A)参照)によって接続されることで、増設マイク部2z1が全方位マイクアレイ装置2に対して結合される。
図20は、全方位マイクアレイ装置2s1の周囲に増設マイク部2zs1を結合する第12例(ピース型結合)を示す斜視図である。全方位マイクアレイ装置2s1の筐体は、矩形形状であり、魚眼レンズを含む魚眼カメラ1s又は魚眼カメラ1sと同じ大きさの蓋が収容可能な円状連結部jg3が中央に設けられ、半円状の凹面が形成された中間辺連結部jg2が中間辺部に設けられ、更に、1/4円状の凹面が形成された両端連結部jg1が両端部に設けられた構成である。
図20に示す結合方法では、増設マイク部2zs1は、全方位マイクアレイ装置2s1の筐体の周囲に隣接し、更に同一平面上となるように接着等により結合されて固定される。なお、図20に示す結合方法では、1つ又は複数の増設マイク部2zs1が全方位マイクアレイ装置2s1に結合可能であり、魚眼カメラ1sは、全方位マイクアレイ装置2s1及び増設マイク部の結合後の筐体の中央に移設される。
従って、図20に示す増設マイク部2zs1の結合により、本実施形態の指向性制御システム10は、全方位マイクアレイ装置2s1の周囲に増設マイク部2zs1を容易に連結でき、増設マイク部2zs1の連結数に応じて、全方位マイクアレイ装置2s1の筐体の中心に設置された魚眼カメラ1sを、連結後(結合後)の全方位マイクアレイ装置2s1及び増設マイク部2zs1の筐体形状に合わせて、連結後(結合後)の全方位マイクアレイ装置2s1及び増設マイク部2zs1の筐体形状の中心位置に簡易に移設できる。
最後に、上述した本実施形態の増設マイク部が全方位マイクアレイ装置2に対して結合された場合の全方位マイクアレイ装置2及び増設マイク部のハードウェア構成について、図21を参照して簡単に説明する。図21は、増設マイク部2z1が結合した全方位マイクアレイ装置2のハードウェア構成の一例を示すブロック図である。なお、図21では、図1に示すネットワークNWへの接続線の図示を省略している。
増設マイク部2z1は、少なくとも複数(例えばm個)のマイク素子22(n+1)〜22(n+m)と、マイク素子と同数のADC24(n+1)〜24(n+m)とを含む構成である。増設マイク部2z1は、結合部CN2を介して、全方位マイクアレイ装置2と結合可能である。増設マイク部2z1のマイク素子22(n+1)〜22(n+m)により収音されたアナログの音声信号は、ADC24(n+1)〜24(n+m)においてデジタルの音声信号に変換されて、全方位マイクアレイ装置2のI/F部2ifに入力される。CPU2pは、全方位マイクアレイ装置2内のマイク素子221〜22nと、増設マイク部22(n+1)〜22(n+m)とにより収音された音声信号を、不図示の通信I/F部から指向性制御装置3に送信する。
以下、上述した本発明に係る指向性制御装置、指向性制御方法及び指向性制御システムの構成、作用及び効果を説明する。
本発明の一実施形態は、複数のマイクを含む収音部で収音された音声の指向性を制御する指向性制御装置であって、前記収音部から、表示部の画像上で指定された位置に対応する音源への方向に、ビームを形成するビーム形成部と、入力に応じて、前記表示部の画像を拡大または縮小するための倍率を設定する倍率設定部と、を備え、前記ビーム形成部は、前記倍率設定部により設定された倍率に応じて、前記形成されたビームのサイズを変更する、指向性制御装置である。
この構成では、指向性制御装置は、複数のマイクを含む収音部で収音された音声の指向性を制御し、収音部から、表示部の画像上で指定された位置に対応する音源への方向にビームを形成し、入力に応じて、表示部の画像を拡大又は縮小するための倍率を設定し、更に、設定された倍率に応じて、ビームのサイズを変更する。
これにより、指向性制御装置は、監視対象に対して表示部の画像上に対する入力操作(例えばズーム処理)により、監視対象の被写体が切り替わった場合には、音声データの指向性の強度(即ち、指向方向のサイズ(例えばビーム幅))をズーム処理に応じて調整し、更に、調整後のビーム幅に合わせて指向性を形成する。従って、指向性制御装置は、切り替わった監視対象の被写体に対する音声データの指向性を適正に形成でき、監視者の監視業務の効率劣化を抑制できる。
また、本発明の一実施形態は、前記ビーム形成部は、前記倍率設定部によって前記画像を拡大するように倍率が設定された場合に、前記ビームのサイズを小さくする、指向性制御装置である。
この構成によれば、指向性制御装置は、画像データのズーム処理がズームイン処理である場合に、表示部の画像を拡大するように倍率(例えばズーム倍率)が設定されるので、設定された倍率に合わせて指向方向のビーム幅を狭く調整でき、切り替わった監視対象の被写体(例えば特定の人物)の発する音声を被写体の周囲の音声に比べて目立つように出力できるので、監視者の監視業務効率を向上できる。
また、本発明の一実施形態は、前記ビーム形成部は、前記倍率設定部によって前記画像を縮小するように倍率が設定された場合に、前記ビームのサイズを大きくする、指向性制御装置である。
この構成によれば、指向性制御装置は、画像データのズーム処理がズームアウト処理である場合に、表示部の画像を縮小するように倍率(例えばズーム倍率)が設定されるので、設定された倍率に合わせて指向方向のビーム幅を広く調整でき、切り替わった監視対象の被写体(例えば複数の人物)の発する音声を網羅的に出力できるので、監視者の監視業務効率を向上できる。
また、本発明の一実施形態は、前記ビーム形成部は、前記倍率設定部によって設定された倍率に応じて、前記音声の音量レベルの調整要否を判定する、指向性制御装置である。
この構成では、指向性制御装置は、設定された倍率に応じて、収音部により収音された音声の音量レベルの調整要否を判定する。
これにより、指向性制御装置は、監視対象に対するズーム処理によって設定された倍率に応じて、監視対象の被写体が切り替わった場合には、音声データの音量レベルの調整要否を判定するので、ズーム処理の内容に応じて、切り替わった監視対象の表示部の表示領域に対する大きさに合わせて音声を違和感なく出力できる。
また、本発明の一実施形態は、前記ビーム形成部は、前記倍率設定部によって前記画像を拡大するように倍率が設定された場合に、前記音声の音量レベルを上げる、指向性制御装置である。
この構成によれば、指向性制御装置は、画像データのズーム処理がズームイン処理である場合に、表示部の画像を拡大するように倍率が設定されるので、設定された倍率に合わせて音声データの音量レベルを上げることができ、切り替わった監視対象の被写体(例えば特定の人物)の発する音声を被写体の周囲の音声に比べて大きな音量で出力できるので、監視者の監視業務効率を向上できる。
また、本発明の一実施形態は、前記ビーム形成部は、前記倍率設定部によって前記画像を縮小するように倍率が設定された場合に、前記音声の音量レベルを維持する、あるいは下げる、指向性制御装置である。
この構成によれば、指向性制御装置は、画像データのズーム処理がズームアウト処理でも、音声データの音量レベルを維持できるので、切り替わった監視対象の被写体(例えば複数の人物)の発する音声を被写体の周囲の音声と同等に出力でき、又は十分に音量レベルが大きい場合には音量レベルを下げるので、ズームアウト処理によっても監視業務を監視者に違和感なく実行させることができる。
また、本発明の一実施形態は、前記表示部に表示された前記画像を処理する画像処理部、を更に備え、前記ビーム形成部は、前記画像処理部により前記画像に人物が検出されない場合に、前記ビームのサイズを維持する、指向性制御装置である。
この構成では、ビーム形成部は、画像データに人物が検出されないと画像処理部により判断された場合には、指向方向のビームのサイズ(例えばビーム幅)を維持する。
これにより、指向性制御装置は、画像データに人物が検出されていない場合には、音声データの指向性の強弱を調整しないので、人物が映り込まない状況において収音領域の周囲の環境音が変動するという違和感を解消できる。
また、本発明の一実施形態は、前記ビーム形成部は、前記倍率設定部によって前記画像を拡大するように倍率が設定された場合に、前記音声をボイスチェンジ処理する、指向性制御装置である。
この構成によれば、指向性制御装置は、画像を拡大するように倍率が設定された場合に、収音部により収音された音声データをボイスチェンジ処理するので、切り替わった監視対象の被写体(例えば特定の人物)の発する音声を誰の音声か分かり難くすることで、被写体の音声上のプライバシーを効果的に保護できる。
また、本発明の一実施形態は、前記画像処理部は、前記倍率設定部によって前記画像を拡大するように倍率が設定された場合に、前記画像における人物の一部をマスキング処理する、指向性制御装置である。
この構成によれば、指向性制御装置は、画像を拡大するように倍率が設定された場合に、ズームイン処理後の画像データにおける人物の一部(例えば顔)をマスキング処理するので、切り替わった監視対象の被写体(例えば特定の人物)が誰であるかを分かり難くすることで、被写体の画像上のプライバシーを効果的に保護できる。
また、本発明の一実施形態は、複数のマイクを含む収音部で収音された音声の指向性を制御する指向性制御装置における指向性制御方法であって、複数のマイクを含む収音部で収音された音声の指向性を制御するステップと、入力に応じて、前記表示部の画像を拡大または縮小するための倍率を設定するステップと、前記設定された倍率に応じて、前記形成されたビームのサイズを変更するステップと、を有する、指向性制御方法である。
この方法では、指向性制御装置は、複数のマイクを含む収音部で収音された音声の指向性を制御し、収音部から、表示部の画像上で指定された位置に対応する音源への方向にビームを形成し、入力に応じて、表示部の画像を拡大又は縮小するための倍率を設定し、更に、設定された倍率に応じて、ビームのサイズを変更する。
これにより、指向性制御装置は、監視対象に対して表示部の画像上に対する入力操作(例えばズーム処理)により、監視対象の被写体が切り替わった場合には、音声データの指向性の強度(即ち、指向方向のサイズ(例えばビーム幅))をズーム処理に応じて調整し、更に、調整後のビーム幅に合わせて指向性を形成する。従って、指向性制御装置は、切り替わった監視対象の被写体に対する音声データの指向性を適正に形成でき、監視者の監視業務の効率劣化を抑制できる。
また、本発明の一実施形態は、複数のマイクを含む収音部で収音された音声の指向性を制御する指向性制御装置における処理を実行するプログラムが格納された記憶媒体であって、複数のマイクを含む収音部で収音された音声の指向性を制御するステップと、入力に応じて、前記表示部の画像を拡大または縮小するための倍率を設定するステップと、前記設定された倍率に応じて、前記形成されたビームのサイズを変更するステップと、を実行するプログラムが格納された、記憶媒体である。
この構成では、記録媒体には、複数のマイクを含む収音部で収音された音声の指向性を制御するステップと、収音部から、表示部の画像上で指定された位置に対応する音源への方向にビームを形成するステップと、入力に応じて、表示部の画像を拡大又は縮小するための倍率を設定するステップと、設定された倍率に応じて、ビームのサイズを変更するステップとをコンピュータ(例えば指向性制御装置)に実行させるプログラムが格納されている。
これにより、記録媒体からプログラムが実行可能にインストールされたコンピュータ(例えば指向性制御装置)は、監視対象に対して表示部の画像上に対する入力操作(例えばズーム処理)により、監視対象の被写体が切り替わった場合には、音声データの指向性の強度(即ち、指向方向のサイズ(例えばビーム幅))をズーム処理に応じて調整し、更に、調整後のビーム幅に合わせて指向性を形成する。従って、指向性制御装置は、切り替わった監視対象の被写体に対する音声データの指向性を適正に形成でき、監視者の監視業務の効率劣化を抑制できる。
また、本発明の一実施形態は、収音領域を撮像する撮像部と、複数のマイクを含み前記収音領域の音声を収音する第1収音部と、前記第1収音部で収音された音声の指向性を制御する指向性制御装置と、を備え、前記指向性制御装置は、前記撮像部により撮像された前記収音領域の画像を表示する表示部と、前記表示部に表示された前記画像に対する位置の指定に応じて、前記第1収音部から、前記指定された位置に対応する音源への方向に、ビームを形成するビーム形成部と、入力に応じて、前記表示部の画像を拡大または縮小するための倍率を設定する倍率設定部と、を備え、前記ビーム形成部は、前記倍率設定部により設定された倍率に応じて、前記形成されたビームのサイズを変更する、指向性制御システムである。
この構成では、指向性制御装置は、複数のマイクを含む第1収音部で収音された音声の指向性を制御し、第1収音部から、撮像部により撮像された画像が表示部に表示されている場合に、画像上で指定された位置に対応する音源への方向にビームを形成し、入力に応じて、表示部の画像を拡大又は縮小するための倍率を設定し、更に、設定された倍率に応じて、ビームのサイズを変更する。
これにより、指向性制御システムでは、指向性制御装置は、監視対象に対して表示部の画像上に対する入力操作(例えばズーム処理)により、監視対象の被写体が切り替わった場合には、音声データの指向性の強度(即ち、指向方向のサイズ(例えばビーム幅))をズーム処理に応じて調整し、更に、調整後のビーム幅に合わせて指向性を形成する。従って、指向性制御システムでは、指向性制御装置は、切り替わった監視対象の被写体に対する音声データの指向性を適正に形成でき、監視者の監視業務の効率劣化を抑制できる。
また、本発明の一実施形態は、前記第1収音部の周囲を囲む開口部を有し、前記第1収音部と同心円状の筐体を有する第2収音部、が更に設けられた、指向性制御システムである。
この構成によれば、指向性制御システムは、第1収音部と同心円状の筐体を有する第2収音部が更に設けられるので、第2収音部の円周上に複数の収音素子(マイク素子)を均等に配置させることにより、第1収音部を単独で用いる場合の音声の収音特性に比べて、全方位に対する音声の収音特性を均等に一層向上できる。
また、本発明の一実施形態は、前記第1収音部の周囲を囲む開口部を有し、楕円形状の筐体を有する第2収音部、が更に設けられた、指向性制御システムである。
この構成によれば、指向性制御システムは、楕円形状の筐体を有する第2収音部が更に設けられるので、例えば第2収音部の楕円形状の長手方向には楕円形状の長手方向以外の方向に比べてより多くの収音素子(マイク素子)を配置させることができ、第1収音部を単独で用いる場合の音声の収音特性に比べて、音声の収音特性を均一に向上でき、更に、楕円形状の長手方向に対する音声の収音特性をより一層向上できる。
また、本発明の一実施形態は、前記第1収音部の周囲を囲む開口部を有し、矩形形状の筐体を有する第2収音部、が更に設けられた、指向性制御システムである。
この構成によれば、指向性制御システムは、矩形形状の筐体を有する第2収音部が更に設けられるので、第2収音部の開口部の周囲に複数の収音素子(マイク素子)を均等に配置させることにより、第1収音部を単独で用いる場合の音声の収音特性に比べて、全方位に対する音声の収音特性を均等に一層向上でき、更に、第2収音部を柔軟に設置できる。
また、本発明の一実施形態は、前記第1収音部の周囲を囲む開口部を有し、ハニカム形状の筐体を有する第2収音部、が更に設けられた、指向性制御システムである。
この構成によれば、指向性制御システムは、ハニカム形状の筐体を有する第2収音部が更に設けられるので、第2収音部の開口部の周囲に複数の収音素子(マイク素子)を均等に配置させることにより、第1収音部を単独で用いる場合の音声の収音特性に比べて、全方位に対する音声の収音特性を均等に一層向上でき、更に、第2収音部を柔軟に設置でき、第2収音部の増設方向に応じて、収音性能に差をつけることができる。
また、本発明の一実施形態は、前記第1収音部と前記第2収音部とは、前記第1収音部及び前記第2収音部の高さ方向に離れて設置される、指向性制御システムである。
この構成によれば、指向性制御システムは、第1収音部と第2収音部とが高さ方向に離れて設置されるので、垂直方向(鉛直方向)の収音性能を向上できる。
また、本発明の一実施形態は、前記第1収音部の周囲に、少なくとも1つの棒形状の筐体を有する第2収音部、が更に設けられる、指向性制御システムである。
この構成によれば、指向性制御システムは、少なくとも1つの棒形状の筐体を有する第2収音部が更に設けられるので、第2収音部の長手方向に沿って複数の収音素子(マイク素子)を均等に配置させることにより、第1収音部を単独で用いる場合の音声の収音特性に比べて、棒形状の長手方向に対する音声の収音特性を一層向上できる。
また、本発明の一実施形態は、前記第1収音部の周囲に、少なくとも1つの第2収音部、が更に設けられ、前記第2収音部は、所定の信号線収容管を介して、前記第1収音部の周囲に設けられたコネクタ部と接続される、指向性制御システムである。
この構成によれば、指向性制御システムは、増設マイク部内の収音素子(マイク素子)を収容するための筐体を不要とし、筐体による音声(音波)の回り込みを排除して音声を収音できるので、第1収音部と第2収音部とを高さ方向に離れて設置する必要が無い。また、指向性制御システムは、信号線収容管を介して、第1収音部の周囲に設けられたコネクタ部と第2収音部とを簡易に接続でき、更に、第1収音部に所定形状の筐体を有する第2収音部を増設する場合に比べて、増設マイク部を軽量化できるので、増設マイク部内の収音素子(マイク素子)における収音特性を一層向上できる。
また、本発明の一実施形態は、前記第1収音部と同一の矩形形状の筐体を有する第2収音部、が更に設けられ、前記第1収音部及び前記第2収音部の筐体は、中間辺部に、半円状の凹面が形成された中間辺連結部が設けられ、両端部に、1/4円状の凹面が形成された両端連結部が設けられる、指向性制御システムである。
この構成によれば、指向性制御システムは、第1収音部の周囲に第2収音部を容易に連結でき、第2収音部の連結数に応じて、第1収音部の筐体の中心に設置された撮像部を、連結後の第1収音部及び第2収音部の筐体形状に合わせて、連結後の第1収音部及び第2収音部の筐体形状の中心位置に簡易に移設できる。
また、本発明の一実施形態は、収音領域を撮像する撮像部と、複数のマイクを含み前記収音領域の音声を収音する第1収音部と、前記第1収音部の周囲に増設される第2収音部と、前記第1収音部と第2収音部で収音された音声の指向性を制御する指向性制御装置と、を備え、前記指向性制御装置は、前記撮像部により撮像された前記収音領域の画像を表示する表示部と、前記表示部に表示された前記画像に対する位置の指定に応じて、前記第1収音部から、前記指定された位置に対応する音源への方向に、ビームを形成するビーム形成部と、を備える、指向性制御システムである。
この構成では、指向性制御装置が、表示部に表示された収音領域の画像に対する位置の指定に応じて、第1収音部から、画像の指定位置に対応する音源に向かう指向方向に、第1収音部により収音された音声データの指向性を形成した音声の強調レベルが不十分だった場合に、前記第1収音部の周囲に第2収音部が増設される。
これにより、指向性制御システムでは、指向性制御装置は、音声データの指向性の強度(即ち、指向方向のビーム幅)が不十分なときでも、増設される第2収音部により、音声データの指向性の強度をより高めることができ、監視者の監視業務の効率劣化を抑制できる。
また、本発明の一実施形態は、前記第2収音部は、前記第1収音部の周囲を囲む開口部を有し、前記第1収音部と同心円状の筐体を有する、指向性制御システムである。
この構成によれば、指向性制御システムは、第1収音部と同心円状の筐体を有する第2収音部が更に設けられるので、第2収音部の円周上に複数の収音素子(マイク素子)を均等に配置させることにより、第1収音部を単独で用いる場合の音声の収音特性に比べて、全方位に対する音声の収音特性を均等に一層向上できる。
また、本発明の一実施形態は、前記第2収音部は、前記第1収音部の周囲を囲む開口部を有し、楕円形状の筐体を有する、指向性制御システムである。
この構成によれば、指向性制御システムは、楕円形状の筐体を有する第2収音部が更に設けられるので、例えば第2収音部の楕円形状の長手方向には楕円形状の長手方向以外の方向に比べてより多くの収音素子(マイク素子)を配置させることができ、第1収音部を単独で用いる場合の音声の収音特性に比べて、音声の収音特性を均一に向上でき、更に、楕円形状の長手方向に対する音声の収音特性をより一層向上できる。
また、本発明の一実施形態は、前記第2収音部は、前記第1収音部の周囲を囲む開口部を有し、矩形形状の筐体を有する、指向性制御システムである。
この構成によれば、指向性制御システムは、矩形形状の筐体を有する第2収音部が更に設けられるので、第2収音部の開口部の周囲に複数の収音素子(マイク素子)を均等に配置させることにより、第1収音部を単独で用いる場合の音声の収音特性に比べて、全方位に対する音声の収音特性を均等に一層向上でき、更に、第2収音部を柔軟に設置できる。
また、本発明の一実施形態は、前記第2収音部は、前記第1収音部の周囲を囲む開口部を有し、ハニカム形状の筐体を有する、指向性制御システムである。
この構成によれば、指向性制御システムは、ハニカム形状の筐体を有する第2収音部が更に設けられるので、第2収音部の開口部の周囲に複数の収音素子(マイク素子)を均等に配置させることにより、第1収音部を単独で用いる場合の音声の収音特性に比べて、全方位に対する音声の収音特性を均等に一層向上でき、更に、第2収音部を柔軟に設置でき、第2収音部の増設方向に応じて、収音性能に差をつけることができる。
また、本発明の一実施形態は、前記第1収音部と前記第2収音部とは、前記収音部及び前記第2収音部の高さ方向に離れて設置される、指向性制御システムである。
この構成によれば、指向性制御システムは、第1収音部と第2収音部とが高さ方向に離れて設置されるので、垂直方向(鉛直方向)の収音性能を向上できる。
また、本発明の一実施形態は、前記第2収音部は、前記第1収音部の周囲に、少なくとも1つの棒形状の筐体を有する、指向性制御システムである。
この構成によれば、指向性制御システムは、少なくとも1つの棒形状の筐体を有する第2収音部が更に設けられるので、第2収音部の長手方向に沿って複数の収音素子(マイク素子)を均等に配置させることにより、第1収音部を単独で用いる場合の音声の収音特性に比べて、棒形状の長手方向に対する音声の収音特性を一層向上できる。
また、本発明の一実施形態は、少なくとも一つの前記第2収音部が増設され、前記第2収音部は、所定の信号線収容管を介して、前記第1収音部の周囲に設けられたコネクタ部と接続される、指向性制御システムである。
この構成によれば、指向性制御システムは、増設マイク部内の収音素子(マイク素子)を収容するための筐体を不要とし、筐体による音声(音波)の回り込みを排除して音声を収音できるので、第1収音部と第2収音部とを高さ方向に離れて設置する必要が無い。また、指向性制御システムは、信号線収容管を介して、第1収音部の周囲に設けられたコネクタ部と第2収音部とを簡易に接続でき、更に、第1収音部に所定形状の筐体を有する第2収音部を増設する場合に比べて、増設マイク部を軽量化できるので、増設マイク部内の収音素子(マイク素子)における収音特性を一層向上できる。
また、本発明の一実施形態は、前記第2収音部は、前記第1収音部と同一の矩形形状の筐体を有し、前記第1収音部及び前記第2収音部の筐体は、中間辺部に、半円状の凹面が形成された中間辺連結部が設けられ、両端部に、1/4円状の凹面が形成された両端連結部が設けられる、指向性制御システムである。
この構成によれば、指向性制御システムは、第1収音部の周囲に第2収音部を容易に連結でき、第2収音部の連結数に応じて、第1収音部の筐体の中心に設置された撮像部を、連結後の第1収音部及び第2収音部の筐体形状に合わせて、連結後の第1収音部及び第2収音部の筐体形状の中心位置に簡易に移設できる。
以上、図面を参照しながら各種の実施形態について説明したが、本発明はかかる例に限定されないことは言うまでもない。当業者であれば、特許請求の範囲に記載された範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。
なお、上述した実施形態では、ズームイン処理又はズームアウト処理の倍率に関する情報を用いて、指向方向のビーム幅を調整する例を説明したが、ビーム幅に限定されず、ビームのサイズ(又はビームの大きさ)を調整するものであればどのようなものでもよい。例えば、ビーム幅ではなく、ビームの高さ(指向方向に直交した方向のビーム幅)を調整してもよい。
本発明は、監視対象に対するズーム処理により、監視対象の被写体が切り替わった場合でも、切り替わった監視対象の被写体に対する音声の指向性を適正に形成し、監視者の監視業務の効率劣化を抑制する指向性制御方法、記憶媒体及び指向性制御システムとして有用である。
1、1s カメラ装置
2、2A、2B、2C、2D、2f、2s、2s1 全方位マイクアレイ装置
2z1、2z1a、2z2、2z3、2z4、2z4a、2z5a、2z5b、2z5c、2z5d、2z5e、2z5f、2z5g、2z5h、2zs1、m1、m2、m3、m4 増設マイク部
3 指向性制御装置
4 レコーダ装置
7z 天井取付板金
7y 拡大天井取付板金
7z1、7z2 増設用取付板金
8 天井面
10 指向性制御システム
31 通信部
32 操作部
33 画像処理部
34 信号処理部
34a 指向方向算出部
34b 出力制御部
34c ズーム連動制御部
35 ディスプレイ装置
36 スピーカ装置
37 メモリ
c1、c2、c3、c4、c5、c6、c7、c8 コネクタ部
n1、n2、n3、n4 マイク線収容管

Claims (28)

  1. 複数のマイクを含む収音部で収音された音声の指向性を制御する指向性制御装置における指向性制御方法であって、
    撮像部により撮像された第1の画像を表示部に表示する第1表示ステップと、
    前記表示部に表示された前記第1の画像の指定箇所の指定を受け付ける指定受付ステップと、
    前記第1の画像が前記表示部に表示されている間に指定された前記指定箇所に応じて、前記指定箇所を含む範囲の画像の歪み補正によって得た第2の画像を前記表示部に表示する第2表示ステップと、
    前記収音部から、前記第2の画像の中心位置に対応する音源への方向に、前記指向性に基づいて前記音源における音声が強調されるためのビームを形成するビーム形成ステップと、
    入力に応じて、前記表示部の前記第2の画像を拡大又は小す画像処理ステップと、を備え、
    前記ビーム形成ステップは、
    前記画像処理ステップによる拡大又は縮小に応じて、前記形成されたビームのサイズを変更
    前記撮像部と前記収音部とは室内の天井に配置される、
    指向性制御方法。
  2. 請求項1に記載の指向性制御方法であって、
    前記ビーム形成ステップは、
    前記画像処理ステップによって前記画像を拡大するように倍率が設定された場合に、前記ビームのサイズを小さくする、
    指向性制御方法。
  3. 請求項1に記載の指向性制御方法であって、
    前記ビーム形成ステップは、
    前記画像処理ステップによって前記画像を縮小するように倍率が設定された場合に、前記ビームのサイズを大きくする、
    指向性制御方法。
  4. 請求項1に記載の指向性制御方法であって、
    前記ビーム形成ステップは、
    前記画像処理ステップによる拡大又は縮小に応じて、前記音声の音量レベルの調整要否を判定する、
    指向性制御方法。
  5. 請求項4に記載の指向性制御方法であって、
    前記ビーム形成ステップは、
    前記画像処理ステップによって前記画像を拡大された場合に、前記音声の音量レベルを上げる、
    指向性制御方法。
  6. 請求項4に記載の指向性制御方法であって、
    前記ビーム形成ステップは、
    前記画像処理ステップによって前記画像を縮小された場合に、前記音声の音量レベルを維持する、あるいは下げる、
    指向性制御方法。
  7. 請求項1に記載の指向性制御方法であって、
    前記表示部に表示された前記第2の画像中の人物検出する人物検出ステップ、を更に備え、
    前記ビーム形成ステップは、
    前記人物検出ステップにより前記第2の画像に人物が検出されない場合に、前記ビームのサイズを維持する、
    指向性制御方法。
  8. 請求項1に記載の指向性制御方法であって、
    前記ビーム形成ステップは、
    前記画像処理ステップによって前記画像を拡大された場合に、前記音声をボイスチェンジ処理する、
    指向性制御方法。
  9. 請求項7に記載の指向性制御方法であって
    画像処理ステップによって前記画像を拡大された場合に、前記第2の画像における人物の一部をマスキング処理するマスキング処理ステップ、を更に備える
    指向性制御方法。
  10. 複数のマイクを含む収音部で収音された音声の指向性を制御する指向性制御装置における処理を実行するプログラムが格納された記憶媒体であって、
    撮像部により撮像された第1の画像を表示部に表示するステップと、
    前記表示部に表示された前記第1の画像の指定箇所の指定を受け付けるステップと、
    前記第1の画像が前記表示部に表示されている間に指定された前記指定箇所に応じて、前記指定箇所を含む範囲の画像の歪み補正によって得た第2の画像を前記表示部に表示するステップと、
    前記収音部から、前記第2の画像の中心位置に対応する音源への方向に、前記指向性に基づいて前記音源における音声が強調されるためのビームを形成するステップと、
    入力に応じて、前記表示部の前記第2の画像を拡大又は縮小するステップと、を実行するプログラムが格納され
    前記ビームを形成するステップは、前記拡大又は縮小に応じて、前記形成されたビームのサイズを変更するステップを含む
    記憶媒体。
  11. 収音領域を撮像する撮像部と、
    複数のマイクを含み前記収音領域の音声を収音する第1収音部と、
    前記第1収音部で収音された音声の指向性を制御する指向性制御装置と、を備え、
    前記指向性制御装置は、
    前記撮像部により撮像された前記収音領域の第1の画像を表示する表示部と、
    前記表示部に表示された前記第1の画像の指定箇所の指定を受け付ける操作部と、
    前記第1の画像が前記表示部に表示されている間に指定された前記指定箇所に応じて、前記撮像部における前記指定箇所を含む範囲の画像の歪み補正によって得た第2の画像を前記表示部に表示する画像取得部と、
    記第1収音部から、前記第2の画像の中心位置に対応する音源への方向に、前記指向性に基づいて前記音源における音声が強調されるためのビームを形成するビーム形成部と、
    入力に応じて、前記表示部の前記第2の画像を拡大又は小す画像処理部と、を備え、
    前記ビーム形成部は、
    前記画像処理部による拡大又は縮小に応じて、前記形成されたビームのサイズを変更
    前記撮像部と前記第1収音部とは室内の天井に配置される、
    指向性制御システム。
  12. 請求項11に記載の指向性制御システムであって、
    前記第1収音部の周囲を囲む開口部を有し、前記第1収音部と同心円状の筐体を有する第2収音部、が更に設けられた、
    指向性制御システム。
  13. 請求項11に記載の指向性制御システムであって、
    前記第1収音部の周囲を囲む開口部を有し、楕円形状の筐体を有する第2収音部、が更に設けられた、
    指向性制御システム。
  14. 請求項11に記載の指向性制御システムであって、
    前記第1収音部の周囲を囲む開口部を有し、矩形形状の筐体を有する第2収音部、が更に設けられた、
    指向性制御システム。
  15. 請求項11に記載の指向性制御システムであって、
    前記第1収音部の周囲を囲む開口部を有し、ハニカム形状の筐体を有する第2収音部、が更に設けられた、
    指向性制御システム。
  16. 請求項12、13、14及び15のうちいずれか一項に記載の指向性制御システムであって、
    前記第1収音部と前記第2収音部とは、
    前記第1収音部及び前記第2収音部の高さ方向に離れて設置される、
    指向性制御システム。
  17. 請求項11に記載の指向性制御システムであって、
    前記第1収音部の周囲に、少なくとも1つの棒形状の筐体を有する第2収音部、が更に設けられる、
    指向性制御システム。
  18. 請求項11に記載の指向性制御システムであって、
    前記第1収音部の周囲に、少なくとも1つの第2収音部、が更に設けられ、
    前記第2収音部は、
    所定の信号線収容管を介して、前記第1収音部の周囲に設けられたコネクタ部と接続される、
    指向性制御システム。
  19. 請求項11に記載の指向性制御システムであって、
    前記第1収音部と同一の矩形形状の筐体を有する第2収音部、が更に設けられ、
    前記第1収音部及び前記第2収音部の筐体は、
    中間辺部に、半円状の凹面が形成された中間辺連結部が設けられ、
    両端部に、1/4円状の凹面が形成された両端連結部が設けられる、
    指向性制御システム。
  20. 収音領域を撮像する撮像部と、
    複数のマイクを含み前記収音領域の音声を収音する第1収音部と、
    前記第1収音部の周囲に増設される第2収音部と、
    前記第1収音部と第2収音部で収音された音声の指向性を制御する指向性制御装置と、を備え、
    前記指向性制御装置は、
    前記撮像部により撮像された前記収音領域の第1の画像を表示する表示部と、
    前記表示部に表示された前記第1の画像の指定箇所の指定を受け付ける操作部と、
    前記第1の画像が前記表示部に表示されている間に指定された前記指定箇所に応じて、前記撮像部における前記指定箇所を含む範囲の画像の歪み補正によって得た第2の画像を前記表示部に表示する画像取得部と、
    記第1収音部から、前記第2の画像の中心位置に対応する音源への方向に、前記指向性に基づいて前記音源における音声が強調されるためのビームを形成するビーム形成部と、
    入力に応じて、前記表示部の前記第2の画像を拡大又は小す画像処理部と、を備え、
    前記ビーム形成部は、
    前記画像処理部による拡大又は縮小に応じて、前記形成されたビームのサイズを変更
    前記撮像部と前記第1収音部とは室内の天井に配置される、
    指向性制御システム。
  21. 請求項20に記載の指向性制御システムであって、
    前記第2収音部は、
    前記第1収音部の周囲を囲む開口部を有し、前記第1収音部と同心円状の筐体を有する、
    指向性制御システム。
  22. 請求項20に記載の指向性制御システムであって、
    前記第2収音部は、
    前記第1収音部の周囲を囲む開口部を有し、楕円形状の筐体を有する、
    指向性制御システム。
  23. 請求項20に記載の指向性制御システムであって、
    前記第2収音部は、
    前記第1収音部の周囲を囲む開口部を有し、矩形形状の筐体を有する、
    指向性制御システム。
  24. 請求項20に記載の指向性制御システムであって、
    前記第2収音部は、
    前記第1収音部の周囲を囲む開口部を有し、ハニカム形状の筐体を有する、
    指向性制御システム。
  25. 請求項21、22、23及び24のうちいずれか一項に記載の指向性制御システムであって、
    前記第1収音部と前記第2収音部とは、
    前記第1収音部及び前記第2収音部の高さ方向に離れて設置される、
    指向性制御システム。
  26. 請求項20に記載の指向性制御システムであって、
    前記第2収音部は、
    前記第1収音部の周囲に、少なくとも1つの棒形状の筐体を有する、
    指向性制御システム。
  27. 請求項20に記載の指向性制御システムであって、
    少なくとも一つの前記第2収音部が増設され、前記第2収音部は、所定の信号線収容管を介して、
    前記第1収音部の周囲に設けられたコネクタ部と接続される、
    指向性制御システム。
  28. 請求項20に記載の指向性制御システムであって、
    前記第2収音部は、前記第1収音部と同一の矩形形状の筐体を有し、
    前記第1収音部及び前記第2収音部の筐体は、
    中間辺部に、半円状の凹面が形成された中間辺連結部が設けられ、
    両端部に、1/4円状の凹面が形成された両端連結部が設けられる、
    指向性制御システム。
JP2015526802A 2014-03-31 2014-03-31 指向性制御方法、記憶媒体及び指向性制御システム Active JP6145736B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2014/001899 WO2015151131A1 (ja) 2014-03-31 2014-03-31 指向性制御装置、指向性制御方法、記憶媒体及び指向性制御システム

Publications (2)

Publication Number Publication Date
JPWO2015151131A1 JPWO2015151131A1 (ja) 2017-04-13
JP6145736B2 true JP6145736B2 (ja) 2017-06-14

Family

ID=54239509

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015526802A Active JP6145736B2 (ja) 2014-03-31 2014-03-31 指向性制御方法、記憶媒体及び指向性制御システム

Country Status (3)

Country Link
JP (1) JP6145736B2 (ja)
CN (1) CN105706462B (ja)
WO (1) WO2015151131A1 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019061531A1 (zh) * 2017-09-30 2019-04-04 深圳传音通讯有限公司 移动终端中动态壁纸的调整方法、调整装置及存储介质
CN110364166B (zh) * 2018-06-28 2022-10-28 腾讯科技(深圳)有限公司 实现语音信号识别的电子设备
CN111586283B (zh) * 2019-02-19 2022-09-27 北京小米移动软件有限公司 变焦方法及装置
CN110211600B (zh) * 2019-05-17 2021-08-03 北京华控创为南京信息技术有限公司 用于定向监听通信的智能麦克风阵列模块
CN110769358B (zh) * 2019-09-25 2021-04-13 云知声智能科技股份有限公司 麦克风监控方法及装置
CN113747047B (zh) * 2020-05-30 2023-10-13 华为技术有限公司 一种视频播放的方法及设备
TWI780450B (zh) * 2020-06-30 2022-10-11 陳筱涵 拾音系統與拾音裝置
CN113253849A (zh) * 2021-07-01 2021-08-13 湖北亿咖通科技有限公司 控制栏的显示控制方法、装置及设备

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05260589A (ja) * 1992-03-10 1993-10-08 Nippon Hoso Kyokai <Nhk> 焦点収音方法
JPH05308553A (ja) * 1992-04-28 1993-11-19 Sanyo Electric Co Ltd ビデオカメラの録音装置
JPH09219858A (ja) * 1996-02-13 1997-08-19 Matsushita Electric Ind Co Ltd 映像音声符号化装置及び映像音声復号化装置
JP3537962B2 (ja) * 1996-08-05 2004-06-14 株式会社東芝 音声収集装置及び音声収集方法
JP2000004493A (ja) * 1998-06-17 2000-01-07 Matsushita Electric Ind Co Ltd ビデオカメラ
JP2000209689A (ja) * 1999-01-12 2000-07-28 Canon Inc サウンド処理装置およびその制御方法、並びに、記録媒体
JP2002223493A (ja) * 2001-01-26 2002-08-09 Matsushita Electric Ind Co Ltd マルチチャンネル収音装置
WO2002078388A2 (en) * 2001-03-27 2002-10-03 1... Limited Method and apparatus to create a sound field
JP2005124080A (ja) * 2003-10-20 2005-05-12 Sharp Corp 携帯通信端末
JP4269883B2 (ja) * 2003-10-20 2009-05-27 ソニー株式会社 マイクロホン装置、再生装置及び撮像装置
JP2005311604A (ja) * 2004-04-20 2005-11-04 Sony Corp 情報処理装置及び情報処理装置に用いるプログラム
JP2006238110A (ja) * 2005-02-25 2006-09-07 Matsushita Electric Ind Co Ltd 監視システム
JP2008271157A (ja) * 2007-04-19 2008-11-06 Fuji Xerox Co Ltd 音声強調装置及び制御プログラム
JP2009130854A (ja) * 2007-11-27 2009-06-11 Sony Corp 音声信号処理装置、音声信号処理方法及び撮像装置
JP5290896B2 (ja) * 2009-07-17 2013-09-18 株式会社熊谷組 固定装置
JP5347902B2 (ja) * 2009-10-22 2013-11-20 ヤマハ株式会社 音響処理装置
JP5825121B2 (ja) * 2012-01-31 2015-12-02 株式会社Jvcケンウッド 画像処理装置、画像処理方法、画像処理プログラム
EP2680616A1 (en) * 2012-06-25 2014-01-01 LG Electronics Inc. Mobile terminal and audio zooming method thereof
US9258644B2 (en) * 2012-07-27 2016-02-09 Nokia Technologies Oy Method and apparatus for microphone beamforming

Also Published As

Publication number Publication date
WO2015151131A1 (ja) 2015-10-08
CN105706462A (zh) 2016-06-22
JPWO2015151131A1 (ja) 2017-04-13
CN105706462B (zh) 2018-11-30

Similar Documents

Publication Publication Date Title
JP6145736B2 (ja) 指向性制御方法、記憶媒体及び指向性制御システム
US9516412B2 (en) Directivity control apparatus, directivity control method, storage medium and directivity control system
JP6202277B2 (ja) 音声処理システム及び音声処理方法
JP5958833B2 (ja) 指向性制御システム
JP5958717B2 (ja) 指向性制御システム、指向性制御方法、収音システム及び収音制御方法
WO2014103331A1 (ja) 音声処理システム及び音声処理方法
JP6218090B2 (ja) 指向性制御方法
EP2834995A1 (en) Flexible spatial audio capture apparatus
US20180158446A1 (en) Directionality control system and sound output control method
US11462235B2 (en) Surveillance camera system for extracting sound of specific area from visualized object and operating method thereof
US8965004B2 (en) Method for acquiring audio signals, and audio acquisition system thereof
WO2014122723A1 (ja) 拡声システム
JP6832507B2 (ja) マイクアレイ装置、マイクアレイシステム及びマイクアレイ装置の製造方法
JP5853181B2 (ja) 収音装置
EP2928206B1 (en) Directivity control apparatus, directivity control method, storage medium and directivity control system
CN114594892A (zh) 远程交互方法、远程交互设备以及计算机存储介质
JP2016219965A (ja) 指向性制御システム及び音声出力制御方法
JP6388144B2 (ja) 指向性制御装置、指向性制御方法、記憶媒体及び指向性制御システム
JP6256774B2 (ja) 指向性制御システム、音声出力制御方法及び記録媒体
JP2020191514A (ja) 情報処理装置および情報処理方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20161108

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170110

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170321

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170418

R151 Written notification of patent or utility model registration

Ref document number: 6145736

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151