JP6631193B2 - 動画像音収録システム、動画像音収録装置、動画像音収録プログラム、および動画像音収録方法 - Google Patents

動画像音収録システム、動画像音収録装置、動画像音収録プログラム、および動画像音収録方法 Download PDF

Info

Publication number
JP6631193B2
JP6631193B2 JP2015226788A JP2015226788A JP6631193B2 JP 6631193 B2 JP6631193 B2 JP 6631193B2 JP 2015226788 A JP2015226788 A JP 2015226788A JP 2015226788 A JP2015226788 A JP 2015226788A JP 6631193 B2 JP6631193 B2 JP 6631193B2
Authority
JP
Japan
Prior art keywords
moving image
sound
unit
acquiring
obtaining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015226788A
Other languages
English (en)
Other versions
JP2016140055A (ja
Inventor
亮人 相場
亮人 相場
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to US14/984,728 priority Critical patent/US9794685B2/en
Publication of JP2016140055A publication Critical patent/JP2016140055A/ja
Application granted granted Critical
Publication of JP6631193B2 publication Critical patent/JP6631193B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Television Signal Processing For Recording (AREA)
  • Studio Devices (AREA)
  • Circuit For Audible Band Transducer (AREA)

Description

本発明は、動画像および音を収録する動画像音収録システム、動画像音収録装置、動画像音収録プログラム、および動画像音収録方法に関する。
ビデオカメラやスマートフォン(高機能携帯電話機)、タブレット端末、テレビ会議装置など、カメラとマイクを内蔵し、カメラによる動画像信号の取得と並行して、マイクによる音声信号の取得を行う機能を備えた機器(デバイス)がある。
しかし、これらの機器では、カメラで撮影した被写体とは無関係で不要な音声がマイクに混入してしまう問題がある。そこで、この問題に対処した装置として、動画像信号を取得するカメラと、音声信号を取得するマイクと、前記カメラで取得された動画像信号内における撮影対象者の位置と、前記カメラが撮影に用いるパラメータ情報(画角情報、焦点距離情報など)とに基づき、自端末に対する前記撮影対象者の相対位置を推定する推定手段と、前記相対位置に向けて、前記マイクの指向性を調整する調整手段と、を備えた携帯端末がある(特許文献1)。
しかしながら、この携帯端末には、カメラとマイクがどちらも同一の装置に内蔵され、その位置関係が変化しないという前提がある。したがって、カメラとマイクが別々の装置に備わっており、動画像信号あるいは音声信号を無線通信等でやり取りする場合、さらにそれぞれの装置を持って動かす場合などは、その位置関係が変動するため適応できないという問題がある。
本発明は、このような問題を解決するためになされたものであり、その目的は、動画像信号と、音信号とを同時に取得するときに、動画像信号を取得する位置と、音信号を取得する位置との関係が変化する場合でも、音信号を高精度に取得できるようにすることである。
本発明は、被写体を撮影して動画像信号を取得する動画像取得手段と、音を収録して音信号を取得する音取得手段と、前記動画像取得手段の撮影方向を表す情報、および前記動画像取得手段と前記音取得手段との位置関係を表す情報を取得する撮影パラメータ取得手段と、前記撮影パラメータ取得手段により取得された前記情報に基づいて、前記音取得手段により取得する前記音信号のうち、所定の方向の音信号を強調する音強調手段と、前記動画像取得手段の動きの状態を表す情報を取得する装置状態取得手段と、前記動画像取得手段により取得された動画像信号から、空間内の所定の基準点の座標が画像上の所定の座標と合致しているか否かを判定する基準点認識手段と、を有し、前記撮影パラメータ取得手段は、前記装置状態取得手段により取得された情報を用いて、前記動画像取得手段と前記音取得手段との位置関係を表す情報を取得し、前記基準点認識手段により合致していると判定され、かつ前記装置状態取得手段により生成された動きの状態を表す情報が静止を表しているとき、撮影方向を表す情報の基準値、および位置関係を表す情報の基準値を取得する、動画像音収録システムである。
本発明によれば、動画像信号と、音信号とを同時に取得するときに、動画像信号を取得する位置と、音信号を取得する位置との関係が変化する場合でも、音信号を高精度に取得することができる。
本発明の実施形態に係る動画像音声収録ステムの構成を示すブロック図である。 本発明の実施形態に係る動画像音声収録システムにおける撮影パラメータ情報および装置状態情報の関係について説明するための図である。 本発明の実施形態に係る動画像音声収録システムにおいて、音声収録装置に対する動画像撮影装置の位置および向きを所定の状態に調整する操作の流れの一例について説明するための図である。 本発明の実施形態に係る動画像音声収録システムが撮影パラメータ情報の基準状態を取得する処理の流れを示すフローチャートである。 本発明の実施形態における動画像撮影装置の撮影方向と音声収録装置の指向性との対応関係について説明するための図である。 本発明の実施形態に係る動画像音声収録システムにおいて、音声収録装置に対する動画像撮影装置の位置が変化する場合の音声収録装置の指向性の制御について説明するための図である。 本発明の実施形態に係る動画像音声収録システムの動作を示すフローチャートである。 本発明の実施形態に係る動画像音声収録システムを実現するコンピュータシステムのハードウェア構成を示すブロック図である。
以下、本発明の実施形態について図面を参照しつつ詳細に説明する。
〈動画像音声収録システム〉
図1は、本発明の実施形態に係る動画像音声収録システム1の構成を示すブロック図である。図示のように、本発明の実施形態に係る動画像音声収録システム(以下、本システム)1は、動画像撮影装置2と、音声収録装置3からなる。
動画像撮影装置2は被写体を撮影して動画像信号を取得する。音声収録装置3は音声を収録して音声信号(音声に対応する電気信号)を取得する。また、動画像撮影装置2は、自身が取得した動画像信号と、音声収録装置3が取得した音声信号とを結合して動画像音声信号を生成し、記憶する。
なお、音声収録装置3は、音声(人間の発声による音)を収録して音声信号を生成するだけでなく、周囲に他の音(物音、機械の動作音、騒音など)が存在するときは、それらの音に対応する電気信号も生成する。すなわち、音声収録装置3は、音声を含む全ての音を収録して、それらに対応する電気信号である音信号を生成する。したがって、厳密には「音声収録装置3」は「音収録装置3」、「動画像音声収録システム1」は「動画像音収録システム1」とすべきであるが、便宜上、本実施形態では「音声収録装置3」、「動画像音声収録システム1」とした。
動画像撮影装置2は、動画像撮影手段21、基準点認識手段22、装置状態取得手段23、撮影パラメータ取得手段24、送信手段25、受信手段26、動画像音声結合手段27、および動画像音声記憶手段28を備えている。ここで、基準点認識手段22、撮影パラメータ取得手段24、および動画像音声結合手段27は、CPU、ROM、およびRAMを有する制御手段20により構成される。すなわち、ROMに記憶されている動画像音声収録プログラムなどのコンピュータプログラムをCPUがRAMを作業エリアとして処理することにより実現される機能ブロックである。
また、音声収録装置3は、音声収録手段31、音声強調手段32、強調パラメータ制御手段33、受信手段34、および送信手段35を備えている。ここで、音声強調手段32および強調パラメータ制御手段33は、CPU、ROM、およびRAMを有する制御手段30により構成される。すなわち、ROMに記憶されている動画像音声収録プログラムなどのコンピュータプログラムをCPUがRAMを作業エリアとして処理することにより実現される機能ブロックである。
《動画像撮影装置》
動画像撮影装置2における動画像撮影手段21は、例えばカメラであり、被写体を撮影して動画像信号を取得する。動画像撮影手段21は本発明に係る動画像取得手段として機能する。
基準点認識手段22は、動画像音声収録システム1が動画像信号および音声信号の取得を開始するに先立ち、動画像撮影装置2と音声収録装置3とを所定の位置関係(以下、初期位置関係)に設定するための手段である。
より詳しくは、動画像信号により構成される画像上の音声収録装置3の位置(以下、動画像信号により構成される画像上の位置を画像座標という)が所定の位置であるか否かを認識し、その結果を基準点合致情報として出力する。基準点合致情報は、例えば音声収録装置3の画像座標が所定の位置である場合は“true”、所定の位置でない場合は“false”となる。認識には、例えばパターンマッチングなどの手法を用いる(詳細については図3を参照して後述する)。なお、基準点は複数あってもよく、その場合、全ての点がそれぞれの所定の座標にあるか否かを判定する。
装置状態取得手段23は装置状態情報を取得する。装置状態情報とは、動画像撮影装置2の加速度や角加速度などである。装置状態情報は例えば、三次元空間内に設定したXYZ直交座標におけるX軸方向の加速度aX、Y軸方向の加速度aY、Z軸に対する角加速度ωZ、からなる3つの値の組(aX,aY,ωZ)で表すことができる。ここで、X軸およびY軸を含む面が水平面であり、Z軸は鉛直線である。これらの加速度や角加速度は、例えば加速度センサや角加速度センサを用いて取得することができる。
撮影パラメータ取得手段24は動画像撮影装置2の撮影パラメータ情報を取得する。撮影パラメータ情報とは、例えば、動画像撮影装置2が前述した初期位置関係に設定された状態を原点(位置関係を表す情報の基準値)、および0度(撮影方向を表す情報の基準値)としたときの、現在の動画像撮影装置2の座標(位置関係を表す情報)、および角度(撮影方向を表す情報)である。
例えばこの情報は(X,Y,θ)の3組の値で表すことが出来る。これらは、装置状態情報と、基準点認識手段22の基準点合致情報から推定する。すなわち、装置状態情報を取得する時間間隔をΔt、前回推定した撮影パラメータ情報を(X0,Y0,θ0)とすると、現在の撮影パラメータ情報は下記の式〔1〕〜式〔3〕により算出できる。
X=X0+aXΔt2…式〔1〕
Y=Y0+aYΔt2…式〔2〕
θ=θ0+ωZΔt2…式〔3〕
これらの式において、aXΔt2、aYΔt2、ωZΔt2は、それぞれ加速度aX、加速度aY、角加速度ωZの時間軸上の二重積分を表す。
ここで、初めの推定時の(X0,Y0,θ0)については、基準点合致情報が“true”、かつ装置状態情報が静止、すなわち(aX,aY,ωZ)=(0,0,0)の状態を基準状態、すなわち(X0,Y0,θ0)=(0,0,0)とし、そこから推定を始めるやり方がある。この場合、基準状態から、装置状態情報(aX、aY、ωZ)の時間軸上の二重積分を算出することで、動画像撮影装置2の現在の位置および撮影方向を表す撮影パラメータ情報を取得する。
図2は、撮影パラメータ情報と装置状態情報との関係について説明するための図である。ここで、図2Aは撮影パラメータ情報を示し、図2Bは装置状態情報を示す。
図2Aにおいて、(X,Y,θ)=(0,0,0)の点101は初期位置関係における動画像撮影装置2の撮影パラメータ情報を表し、(X,Y,θ)=(X1,Y1,θ1)の点102は動画像撮影装置2の現在の撮影パラメータ情報を表す。また、矢印103は動画像撮影装置2の現在の撮影方向(θ1)を表す。また、(X,Y,θ)=(0,Yref,0)の点100は初期位置関係における音声収録装置3に対する撮影パラメータ情報を表す。すなわち、初期位置関係では、動画像撮影装置2に対して、音声収録装置3がY軸方向(=矢印103に示す撮影方向)にYref離れた位置に存在することを表す。
図2Bにおいて、aX,aY,ωZは、任意の点105(X,Y,θ)におけるX軸方向の加速度、Y軸方向の加速度、Z軸の周りの角加速度の向きを表す。
図1の説明に戻る。送信手段25は撮影パラメータ情報を音声収録装置3へ送信する。通信方法は有線通信でも無線通信でもよい。受信手段26は音声収録装置3で収録され、強調処理された音声信号(以下、強調音声信号)を受信する。この通信方法も有線通信でも無線通信でもよい。
動画像音声結合手段27は、動画像撮影手段21により取得された動画像信号と、受信手段26により受信された強調音声信号とを結合し、関連付けられた動画像音声信号とする。動画像音声記憶手段28は、例えばハードディスク、ソリッドステートディスク、SDメモリなどからなり、動画像音声信号を記憶する。
《音声収録装置》
本発明に係る音取得手段としての音声収録手段31は、例えばマイクアレイからなり、音声を収録して音声信号を生成する。音声強調手段32は、音声信号から、任意の方向から来た音声を強調した強調音声信号を生成する。強調方法には、例えばマイクアレイによるビームフォーミングや、指向性の向きの異なるマイクの切り替えなどを用いる。マイクアレイによるビームフォーミングについては後に詳述する。
受信手段34は動画像撮影装置2から撮影パラメータ情報を受信する。強調パラメータ制御手段33は、受信手段34により受信された撮影パラメータ情報に基づいて、音声強調手段32の強調パラメータを制御する。この強調パラメータについては後に詳述する。送信手段35は、音声強調手段32により生成された強調音声信号を動画像撮影装置2へ送信する。
なお、この実施形態では、動画像撮影装置2側に動画像音声記憶手段28があり、音声収録装置3からの音声信号を受信しているが、逆に、音声収録装置3側に動画像音声記憶手段を設けて、動画像撮影装置2からの動画像信号を受信するように構成することもできる。また、動画像音声記憶手段をさらに別の装置に設けてもよい。
また、この実施形態では、動画像音声信号を最終的に記憶しているが、例えばディスプレイやスピーカなどの出力手段を設けて、そこから出力してもよいし、テレビ会議のような用途でネットワークを介して他装置へ送信してもよい。
また、この実施形態では、動画像撮影装置2と音声収録装置3とが初期位置関係であることを認識した後は、音声収録装置3は動かず、動画像撮影装置2が動くことを前提としているため、装置状態取得手段23を動画像撮影装置23内に設けたが、音声収録装置3内にも装置状態取得手段を設けることで、音声収録装置3の装置状態情報を取得するように構成してもよい。このように構成すれば、音声収録装置3が動いても、動画像撮影装置2は撮影パラメータ情報を取得することができる。
〈撮影パラメータ情報の基準状態の取得〉
音声収録装置3に対する動画像撮影装置2の位置、および向きを所定の状態に調整する操作の流れの一例について図3を参照して説明する。ここでは、図3Aに示すように、動画像撮影装置2をカメラ付きタブレット端末とし、音声収録装置3を動画像撮影装置2と無線通信可能なワイヤレスマイクとした。
この操作は第1〜第3の前提のもとで実行する。
第1の前提:音声収録装置3上の3点を基準点とする。ここでは、図3Aに示すように、音声収録装置3に付けた3つの十字型のマーカーPa、Pb、Pcの中心を基準点とした。
第2の前提:この3点を、所定の位置、所定の向きで動画像撮影装置2により撮影したときの画像座標をそれぞれ(xa,ya)、(xb,yb)、(xc,yc)とする。
第3の前提:そのとき、音声収録装置3は静止していなければならない。
ユーザは撮影中の音声収録装置3の画像を見ながら、3つの基準点であるマーカーPa、Pb、Pcの中心がそれぞれ(x1,y1)、(x2,y2)、(x3,y3)に一致するように動画像撮影装置2を動かす。このとき、確認用に撮影中の画像の(x1,y1)、(x2,y2)、(x3,y3)の点にガイドを表示することが好適である。ここでは、図3Bに示すように、(x1,y1)、(x2,y2)、(x3,y3)を指示する矢印P1、P2、P3をディスプレイ200に表示した。
ユーザが動画像撮影装置2を動かした結果、図3Cに示すように、撮影中の画像上の3つの基準点の座標がそれぞれ(x1,y1)、(x2,y2)、(x3,y3)に一致すると、基準点認識手段22は基準点合致情報として“true”を出力する。
さらに、装置状態取得手段23は、動画像撮影装置2の加速度および角加速度をセンサから取得し、装置状態情報を出力する。動画像撮影装置2が静止していれば装置状態情報は(0,0,0)を示す。
基準点合致情報として“true”を、装置状態情報として(0,0,0)を受け取った撮影パラメータ取得手段24は、その時点の状態を、座標、角度計算のための基準状態とする。すなわち、撮影パラメータ情報:(X,Y,θ)=(0,0,0)とし、操作を終了する。
図4は、動画像音声収録システム1が撮影パラメータ情報の基準状態を取得する処理の流れを示すフローチャートである。
まず、動画像撮影手段21が動画像信号を取得する(ステップS1)。次に、取得された動画像信号により構成される動画像上の基準点の画像座標(例えば図3BにおけるマーカーPa、Pb、Pcの中心の画像座標(xa,ya)、(xb,yb)、(xc,yc))が所定の座標(例えば(x1,y1)、(x2,y2)、(x3,y3))と一致しているか否かを基準点認識手段22が判定する(ステップS2)。判定の結果、一致していれば(ステップS2:YES)、ステップS3へ進み、一致していなければ(ステップS2:NO)、ステップS1に戻る。
ステップS3では、装置状態取得手段23が装置状態情報(aX,aY,ωZ)を取得する。次に、この装置状態情報が、動画像撮影装置2が静止していることを示しているか否か、すなわち(aX,aY,ωZ)=(0,0,0)であるか否かを撮影パラメータ取得手段24が判定する(ステップS4)。判定の結果、静止していることを示していれば(ステップS4:YES)、ステップS5へ進み、静止していることを示していなければ(ステップS4:NO)、ステップS1に戻る。
ステップS5では、撮影パラメータ取得手段24が、現在の撮影パラメータ情報を基準状態に設定する。すなわち(aX,aY,ωZ)=(0,0,0)のとき、動画像撮影装置2の撮影パラメータ情報(X,Y,θ)として、基準状態、すなわち(X0,Y0,θ0)=(0,0,0)を設定する。この結果、例えば図3のマーカーPa、Pb、Pcの中心が矢印P1、P2、P3の先端に一致し、かつ動画像撮影装置2が静止している時に、図2Aの点101における撮影パラメータ情報が設定される。
〈動画像撮影装置の撮影方向と音声収録装置の指向性との関係〉
図5は、動画像音声収録システム1における動画像撮影装置2の撮影方向と音声収録装置3の指向性との対応関係について説明するための図である。
図5Aは、動画像撮影手段21の撮影方向が音声収録装置3に向かう方向111である状態を示している。この図において、p,q,r,sはマイク(音声収録手段31)を表している。すなわち、4つのマイクが正方形の頂点に配置されているといえる。
この状態では、音声収録装置3の指向性を、動画像撮影手段21の中心に向いている方向にピーク値を有する指向性121、およびその反対の方向にピーク値を有する指向性122からなる双極性にする。
図5Bは、動画像撮影手段21の撮影方向が音声収録装置3へ向かう方向から反時計回りにθ回転した方向112に向いている状態を示している。この状態では、音声収録装置3の指向性を、動画像撮影手段21への方向から時計回りにφ回転した方向113にピーク値を有する指向性123からなる単極性にする。
図5Cは、動画像撮影手段21の撮影方向が音声収録装置3へ向かう方向から時計回りにθ回転した方向114に向いている状態を示している。この状態では、音声収録装置3の指向性を、動画像撮影手段21への方向から反時計回りにφ回転した方向115にピーク値を有する指向性124からなる単極性にする。
図5A、図5B、図5Cに示すように、通常、注目している音源は動画像撮影手段21の撮影方向111、112、114に位置すると考えられるため、音声収録装置3の指向性を122、123、124のように設定することにより、音源からの音を強調することができる。これらの指向性を実現するには、音声収録装置3の強調パラメータ制御手段33が制御信号として、撮影方向情報θに応じて形成する指向性の種類(単極性か双極性か)と、その向きを示すφの値を音声強調手段32に出力し、音声強調手段32がその制御信号を基に指向性を形成することになる。
θとφとの関係を示すテーブルの一例を下記の表1に示す。ここで、θ=0は図5Aに示されている方向111、すなわち、動画像撮影手段21の中心から音声収録装置3のマイクに向かう方向である。また、時計回りがθのプラス方向、反時計回りがθのマイナス方向である。つまり、図5Bではθはほぼ−π/4であり、図5Cではθはほぼπ/4である。
Figure 0006631193
また、表1において、φ=0は音声収録装置3から動画像撮影手段21の中心に向かう方向、すなわちθ=πの方向である。また、時計回りがφのプラス方向、反時計回りがφのマイナス方向である。
したがって、図5A、図5B、図5Cと表1との関係は下記のようになる。
図5A:「−π/6<θ≦π/6」・・・「双極性、φ=0」
図5B:「7π/6<θ≦11π/6」・・・「単極性、φ=π/4」
図5C:「π/6<θ≦5π/6」・・・「単極性、φ=−π/4」
音声信号を強調する方法としては、マイクアレイによるビームフォーミングなどを用いる。例えば、φ方向に指向性を形成する場合、遅延和ビームフォーミングでは下記の式〔4〕で強調音声信号が得られる。
Y(ω)=WH(ω)z(ω) …式〔4〕
ここでωは音声信号のスペクトルの角周波数、Yは強調音声信号のスペクトル、zは入力音声信号のスペクトル、Wは強調のためのフィルタ係数、Hは複素共役転置を表す。zとWはベクトル表現になっており、それぞれ、下記の式〔5〕、〔6〕で表される。
z(ω)=[Z1(ω),・・・,ZM(ω)]T …式〔5〕
W(ω)=[W1(ω),・・・,WM(ω)]T …式〔6〕
ここで、Zの添え字はマイクの番号を表し、Mはマイクの個数である。また、Tは行列の転置を表す。
ここでWの値は、各マイクの位置と強調したい音源の方向が同一平面状にあるとすると、次の式〔7〕のようになる。
m(ω)=exp{j(ω/c)(xmsinφ+ymcosφ)} …式〔7〕
ここで、cは音速、xm,mはマイクの座標、φは強調したい音声信号の音源の方向である。
〈音声収録装置に対する動画像撮影装置の位置が変化する場合の音声収録装置の指向性の制御〉
図6は、音声収録装置に対する動画像撮影装置の位置が変化する場合の音声収録装置の指向性の制御について説明するための図である。
この場合は例えば、音声収録装置3から見て、360度(2π)を8分割した領域a〜hのどこに動画像撮影装置2が位置するかで制御信号を切り替える。例えば図示のように動画像撮影装置2が領域cに位置する場合、下記の表2のように撮影方向θと制御信号(指向性の種類、向きφ)を設定する。
Figure 0006631193
この表において、θ=0は音声収録装置3から領域eの中心に向かう方向である。また、時計回りがθのプラス方向、反時計回りがθのマイナス方向である。また、φ=0は音声収録装置3から領域aの中心に向かう方向である。また、時計回りがφのプラス方向、反時計回りがφのマイナス方向である。
この表に示すデータを持つテーブルを領域毎に用意することで、音声収録装置3に対する動画像撮影装置2の方向が変化しても、適切な指向性を形成することができる。なお、動画像撮影装置2が領域c以外の領域(以下、注目領域)に位置するときは、表2におけるθの範囲の値を領域cと注目領域との角度差を付加した値にすればよい。
なお、ここではφの値を4段階に変化させているが、例えばθの値に応じて連続的に変化させるなど、より多くの段階に変化させてもよい。
〈動画像音声収録システムの動作〉
図7は、動画像音声収録システム1の動作を示すフローチャートである。
まず、動画像撮影装置2では、装置状態取得手段23が装置状態情報を取得する(ステップS11)。次に、撮影パラメータ取得手段24が、ステップS1で取得された装置状態情報から撮影パラメータ情報を推定する(ステップS12)。このときの基準状態については図4に示した処理により設定済みのものを用いる。
次いで、送信手段25が、ステップS2で推定された撮影パラメータ情報を音声収録装置3へ送信する(ステップS13)。次に、動画像撮影手段21が動画像信号を取得する(ステップS14)。
音声収録装置3では、受信手段34が撮影パラメータ情報を受信し(ステップS21)、強調パラメータ制御手段33が、ステップS21で受信された撮影パラメータ情報に応じて、音声強調パラメータを制御する(ステップS22)。
次に、音声収録手段31が音声信号を取得し(ステップS23)、音声強調手段32が、ステップS23で取得された音声信号をステップS22で取得された音声強調パラメータに基づいて強調処理し、強調音声信号を取得する(ステップS24)。次に、送信手段35が、ステップS24で取得された強調音声信号を動画像撮影装置2へ送信し、音声収録装置3側の処理を終える。
動画像撮影装置2では、受信手段26が強調音声信号を受信し(ステップS15)、動画像音声結合手段27が、ステップ14で取得された動画像信号と、ステップS15で受信された強調音声信号を結合して、動画像音声信号を取得する(ステップS16)。次に、動画像音声記憶手段28が、ステップS15で取得された動画像音声信号を記憶し(ステップS17)、動画像撮影装置2側の処理を終える。
〈動画像音声収録システムを実現するコンピュータシステム〉
図8は、動画像撮影装置2および音声収録装置3を実現するコンピュータシステムのハードウェア構成を示すブロック図である。
動画像撮影装置2および音声収録装置3は、図8に示すような汎用のコンピュータシステムにより実現することができる。このコンピュータシステムは、CPU(Central Processing Unit)11、ROM(Read Only Memory)12、RAM(Random Access Memory)13、HDD(Hard Disk Drive)14、およびI/F(インタフェース)15がバス10を介して接続された構成を有し、I/F15にはLCD(Liquid Crystal Display)などの表示部16および操作部17が接続されている。
CPU11は演算手段であり、コンピュータシステム全体の動作を制御する。ROM12は、読み出し専用の不揮発性記憶媒体であり、ファームウェア等のプログラムが格納されている。RAM13は、情報の高速な読み書きが可能な揮発性の記憶媒体であり、CPU11が情報を処理する際の作業領域として用いられる。HDD14は、情報の読み書きが可能な不揮発性の記憶媒体であり、OS(Operating System)や各種の制御プログラム、アプリケーションプログラム等が格納されている。I/F15は、バスと各種のハードウェアやネットワーク等を接続し制御する。表示部16は、ユーザがコンピュータシステムの状態を確認するための視覚的ユーザインタフェースである。操作部17は、キーボードやマウス等、ユーザがコンピュータシステムに情報を入力するためのユーザインタフェースである。
以上詳細に説明したように、本発明の実施形態に係る動画像音声収録システム1には下記(1)〜(5)の特徴がある。
(1)音声収録手段31に対する動画像撮影手段21の位置、および動画像撮影手段21の撮影方向を推定し、その推定結果に応じて、音声収録手段31へ到来する音声の方向を特定し、音声収録手段31の指向性を変化させるので、音声収録手段31と動画像撮影手段21との位置関係が変化する場合でも、良好な音声信号を取得することができる。
(2)動画像撮影手段21の撮影方向の推定結果に応じて、撮影範囲の外側から到来する音を相対的に多く抑圧することができる。
(3)動画像撮影装置2の加速度および角加速度から、動画像撮影装置2の位置および撮影方向を推定することができる。
(4)音声収録手段31に対する動画像撮影手段21の基準位置、および動画像撮影手段21の基準の撮影方向を、位置および撮影方向の推定に利用することができる。
(5)ユーザシステム利用時に、音声収録手段31に対する動画像撮影手段21の基準位置、および動画像撮影手段21の基準の撮影方向を得ることができる。
なお、以上説明した実施形態では、動画像撮影装置2と、音声収録装置3とが別々の装置であり、かつ動画像撮影装置2が動画像撮影手段(カメラ)21を内蔵し、音声収録装置3が音声収録手段(マイク)31を内蔵しているが、動画像撮影装置と音声収録装置とを1つの動画像音声収録装置とし、かつ動画像撮影手段、音声収録手段を装置と別に設けるように構成してもよい。
1…動画像音声収録システム、2…動画像撮影装置、3…音声収録装置、21…動画像撮影手段、22…基準点認識手段、23…装置状態取得手段、24…撮影パラメータ取得手段、31…音声収録手段、32…音声強調手段、33…強調パラメータ制御手段。
特開2011−41096号公報

Claims (8)

  1. 被写体を撮影して動画像信号を取得する動画像取得手段と、
    音を収録して音信号を取得する音取得手段と、
    前記動画像取得手段の撮影方向を表す情報、および前記動画像取得手段と前記音取得手段との位置関係を表す情報を取得する撮影パラメータ取得手段と、
    前記撮影パラメータ取得手段により取得された前記情報に基づいて、前記音取得手段により取得する前記音信号のうち、所定の方向の音信号を強調する音強調手段と、
    前記動画像取得手段の動きの状態を表す情報を取得する装置状態取得手段と、
    前記動画像取得手段により取得された動画像信号から、空間内の所定の基準点の座標が画像上の所定の座標と合致しているか否かを判定する基準点認識手段と、
    を有し、
    前記撮影パラメータ取得手段は、前記装置状態取得手段により取得された情報を用いて、前記動画像取得手段と前記音取得手段との位置関係を表す情報を取得し、前記基準点認識手段により合致していると判定され、かつ前記装置状態取得手段により生成された動きの状態を表す情報が静止を表しているとき、撮影方向を表す情報の基準値、および位置関係を表す情報の基準値を取得する、動画像音収録システム。
  2. 請求項1に記載された動画像音収録システムにおいて、
    前記音強調手段は、前記撮影パラメータ取得手段により取得された前記情報から推定される撮影範囲の外側から到来する音を相対的に多く抑圧する、動画像音収録システム。
  3. 請求項1に記載された動画像音収録システムにおいて、
    前記位置関係を表す情報は、前記音取得手段に対する前記動画像取得手段の位置を表す情報である、動画像音収録システム。
  4. 請求項1に記載された動画像音収録システムにおいて、
    前記動きの状態を表す情報は、加速度および角加速度を表す情報である、動画像音収録システム。
  5. 請求項1に記載された動画像音収録システムにおいて、
    前記撮影パラメータ取得手段が前記撮影方向を表す情報の基準値および位置関係を表す情報の基準値を取得するまで、前記動画像取得手段の位置と向きの調整をガイドする表示を行う手段を有する、動画像音収録システム。
  6. 被写体を撮影して動画像信号を取得する動画像取得手段と、
    音を収録して音信号を取得する音取得手段と、
    前記動画像取得手段の撮影方向を表す情報、および前記動画像取得手段と前記音取得手段との位置関係を表す情報を取得する撮影パラメータ取得手段と、
    前記撮影パラメータ取得手段により取得された前記情報に基づいて、前記音取得手段により取得する前記音信号のうち、所定の方向の音信号を強調する音強調手段と、
    前記動画像取得手段の動きの状態を表す情報を取得する装置状態取得手段と、
    前記動画像取得手段により取得された動画像信号から、空間内の所定の基準点の座標が画像上の所定の座標と合致しているか否かを判定する基準点認識手段と、
    を有し、
    前記撮影パラメータ取得手段は、前記装置状態取得手段により取得された情報を用いて、前記動画像取得手段と前記音取得手段との位置関係を表す情報を取得し、前記基準点認識手段により合致していると判定され、かつ前記装置状態取得手段により生成された動きの状態を表す情報が静止を表しているとき、撮影方向を表す情報の基準値、および位置関係を表す情報の基準値を取得する、動画像音収録装置。
  7. 動画像取得手段により取得された動画像信号、および音取得手段により取得された音信号をコンピュータにより処理する動画像音収録プログラムであって、
    前記コンピュータを、
    前記動画像取得手段の撮影方向を表す情報、および前記動画像取得手段と前記音取得手段との位置関係を表す情報を取得する撮影パラメータ取得手段と、前記撮影パラメータ取得手段により取得された前記情報に基づいて、前記音取得手段により取得する前記音信号のうち、所定の方向の音信号を強調する音強調手段と、前記動画像取得手段の動きの状態を表す情報を取得する装置状態取得手段と、前記動画像取得手段により取得された動画像信号から、空間内の所定の基準点の座標が画像上の所定の座標と合致しているか否かを判定する基準点認識手段、として機能させるための動画像音収録プログラムであって、
    前記撮影パラメータ取得手段は、前記装置状態取得手段により取得された情報を用いて、前記動画像取得手段と前記音取得手段との位置関係を表す情報を取得し、前記基準点認識手段により合致していると判定され、かつ前記装置状態取得手段により生成された動きの状態を表す情報が静止を表しているとき、撮影方向を表す情報の基準値、および位置関係を表す情報の基準値を取得する、動画像音収録プログラム。
  8. 動画像取得手段が被写体を撮影して動画像信号を取得する動画像取得ステップと、
    音を収録して音信号を取得する音取得ステップと、
    前記動画像取得ステップにおける撮影の方向を表す情報、および前記動画像取得ステップにおける撮影の位置と前記音取得ステップにおける収録の位置との関係を表す情報を取得する撮影パラメータ取得ステップと、
    前記撮影パラメータ取得ステップにより取得された前記情報に基づいて、前記音取得ステップにより取得する前記音信号のうち、所定の方向の音信号を強調する音強調ステップと、
    前記動画像取得手段の動きの状態を表す情報を取得する装置状態取得ステップと、
    前記動画像取得ステップにより取得された動画像信号から、空間内の所定の基準点の座標が画像上の所定の座標と合致しているか否かを判定する基準点認識ステップと、
    を有し、
    前記撮影パラメータ取得ステップは、前記装置状態取得ステップにより取得された情報を用いて、前記動画像取得ステップと前記音取得ステップとの位置関係を表す情報を取得し、前記基準点認識ステップにより合致していると判定され、かつ前記装置状態取得ステップにより生成された動きの状態を表す情報が静止を表しているとき、撮影方向を表す情報の基準値、および位置関係を表す情報の基準値を取得する、動画像音収録方法。
JP2015226788A 2015-01-23 2015-11-19 動画像音収録システム、動画像音収録装置、動画像音収録プログラム、および動画像音収録方法 Active JP6631193B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US14/984,728 US9794685B2 (en) 2015-01-23 2015-12-30 Video audio recording system, video audio recording device, and video audio recording method

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2015011515 2015-01-23
JP2015011515 2015-01-23

Publications (2)

Publication Number Publication Date
JP2016140055A JP2016140055A (ja) 2016-08-04
JP6631193B2 true JP6631193B2 (ja) 2020-01-15

Family

ID=56559405

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015226788A Active JP6631193B2 (ja) 2015-01-23 2015-11-19 動画像音収録システム、動画像音収録装置、動画像音収録プログラム、および動画像音収録方法

Country Status (1)

Country Link
JP (1) JP6631193B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106331501A (zh) * 2016-09-21 2017-01-11 乐视控股(北京)有限公司 声音采集方法及装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5240832B2 (ja) * 2008-06-04 2013-07-17 Necカシオモバイルコミュニケーションズ株式会社 音入力装置、音入力方法およびプログラム
WO2014125835A1 (ja) * 2013-02-15 2014-08-21 パナソニック株式会社 指向性制御システム、キャリブレーション方法、水平偏差角算出方法及び指向性制御方法

Also Published As

Publication number Publication date
JP2016140055A (ja) 2016-08-04

Similar Documents

Publication Publication Date Title
US9516241B2 (en) Beamforming method and apparatus for sound signal
US9071724B2 (en) Method and apparatus for providing a video call service
JP7305249B2 (ja) 画像特徴点の動き情報の決定方法、タスク実行方法およびデバイス
CN102104767B (zh) 具有透视失真校正的脸部姿势改进
JP7026819B2 (ja) カメラの位置決め方法および装置、端末並びにコンピュータプログラム
JP6348611B2 (ja) 自動ピント合わせ方法、装置、プログラム及び記録媒体
JP2024056955A (ja) 光学式捕捉によるパーソナライズされたhrtf
JP2016165101A (ja) 適応型カメラアレイを有するデバイス
WO2017027338A1 (en) Apparatus and method for supporting interactive augmented reality functionalities
CN109302632B (zh) 获取直播视频画面的方法、装置、终端及存储介质
US20190005678A1 (en) Pose estimation using multiple cameras
CN113763228B (zh) 图像处理方法、装置、电子设备及存储介质
CN111213365A (zh) 拍摄控制方法及控制器
JP6280674B1 (ja) 撮像角度調整システム、撮像角度調整方法及びプログラム
CN112839165B (zh) 人脸跟踪摄像的实现方法、装置、计算机设备和存储介质
JP6631193B2 (ja) 動画像音収録システム、動画像音収録装置、動画像音収録プログラム、および動画像音収録方法
JP2016194783A (ja) 画像管理システム、通信端末、通信システム、画像管理方法、及びプログラム
JP2016194784A (ja) 画像管理システム、通信端末、通信システム、画像管理方法、及びプログラム
JP6711118B2 (ja) 画像管理システム、プログラム及び情報端末
JP6521675B2 (ja) 信号処理装置、信号処理方法、及びプログラム
JP6646967B2 (ja) 制御装置、再生システム、補正方法、及び、コンピュータプログラム
US9794685B2 (en) Video audio recording system, video audio recording device, and video audio recording method
JP2018157314A (ja) 情報処理システム、情報処理方法及びプログラム
CN113707165A (zh) 音频处理方法、装置及电子设备和存储介质
CN110443841B (zh) 地面深度的测量方法、装置及***

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181009

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190712

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190813

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191009

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191023

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191031

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20191112

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20191125

R151 Written notification of patent or utility model registration

Ref document number: 6631193

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151