JP2024057447A - Image processing device, control method for image processing device, program, and storage medium - Google Patents
Image processing device, control method for image processing device, program, and storage medium Download PDFInfo
- Publication number
- JP2024057447A JP2024057447A JP2022164194A JP2022164194A JP2024057447A JP 2024057447 A JP2024057447 A JP 2024057447A JP 2022164194 A JP2022164194 A JP 2022164194A JP 2022164194 A JP2022164194 A JP 2022164194A JP 2024057447 A JP2024057447 A JP 2024057447A
- Authority
- JP
- Japan
- Prior art keywords
- marker
- detected
- focus
- image processing
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 74
- 238000003860 storage Methods 0.000 title claims description 12
- 239000003550 marker Substances 0.000 claims abstract description 114
- 238000001514 detection method Methods 0.000 claims abstract description 96
- 238000003384 imaging method Methods 0.000 claims abstract description 35
- 230000033001 locomotion Effects 0.000 claims abstract description 25
- 238000009826 distribution Methods 0.000 claims description 14
- 238000003672 processing method Methods 0.000 claims 2
- 238000004364 calculation method Methods 0.000 description 18
- 238000004891 communication Methods 0.000 description 17
- 238000010586 diagram Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 230000006835 compression Effects 0.000 description 4
- 238000007906 compression Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 3
- 238000005315 distribution function Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000003825 pressing Methods 0.000 description 2
- 230000006641 stabilisation Effects 0.000 description 2
- 238000011105 stabilization Methods 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
Images
Landscapes
- Indication In Cameras, And Counting Of Exposures (AREA)
- Studio Devices (AREA)
Abstract
【課題】 最適なフォーカス対象を設定できるようにする。【解決手段】 撮像素子により得られた画像信号から人物を認識する認識工程と、第1、第2の動作または第1、第2の音声を検出する検出工程と、前記撮像素子により得られた画像信号からマーカを検出するマーカ検出工程と、焦点状態を調整する対象として、前記認識工程により認識された人物と前記マーカ検出工程により検出されたマーカのいずれか一方を選択する選択工程と、を有し、前記選択工程では、前記第1の動作または前記第1の音声が検出された場合に、前記認識工程により認識された人物を選択し、前記第2の動作または前記第2の音声が検出された場合に前記マーカ検出工程により検出されたマーカを選択する。【選択図】 図2[Problem] To enable setting of an optimal focus target. [Solution] The present invention comprises a recognition step of recognizing a person from an image signal obtained by an imaging element, a detection step of detecting a first or second motion or a first or second sound, a marker detection step of detecting a marker from the image signal obtained by the imaging element, and a selection step of selecting either the person recognized by the recognition step or the marker detected by the marker detection step as a target for adjusting the focus state, in which in the selection step, when the first motion or the first sound is detected, the person recognized by the recognition step is selected, and when the second motion or the second sound is detected, the marker detected by the marker detection step is selected. [Selected Figure] Figure 2
Description
本発明は画像処理装置、画像処理装置の制御方法、プログラム、記憶媒体に関するものである。 The present invention relates to an image processing device, a control method for an image processing device, a program, and a storage medium.
近年、動画配信サイトでは、個人による映像配信が一般的になっている。個人による映像配信では、映像を配信する配信者が、画面に映って商品の紹介などをする出演者と、それを撮影する撮影者を兼ねることが多い。このような場合に、配信者は撮影中にカメラの操作を行うことは難しく、配信者の意図した対象にフォーカスを合わせることが難しいという課題があった。そこで、予め意図する対象の近くにマーカを配置しておき、撮影の際には、画像内のマーカの検出情報を元にフォーカスを合わせることが考えられる。 In recent years, video distribution by individuals has become common on video distribution sites. In such cases, the person distributing the video often acts as both the performer who appears on the screen to introduce a product, etc., and the person who films it. In such cases, it is difficult for the distributor to operate the camera while filming, and there is an issue that it is difficult to focus on the distributor's intended subject. As a solution, it is conceivable to place a marker near the intended subject in advance, and when filming, focus is adjusted based on detection information of the marker in the image.
引用文献1では、マーカの実際の形状や大きさと、マーカのリアルタイム撮影画像内の形状や大きさとの比較により、マーカと撮像部との現実距離を算出し、オブジェクトに撮像部のピントを合わせるためのピント位置を決定する。 In cited document 1, the actual shape and size of the marker are compared with the shape and size of the marker in the real-time captured image to calculate the actual distance between the marker and the imaging unit, and the focus position for focusing the imaging unit on the object is determined.
しかしながら、個人による映像配信で、例えば商品紹介動画などでは、マーカの位置だけでなく、出演者(配信者)などの人物にもフォーカスを合わせたい場合も多い。 However, in video distribution by individuals, such as product promotional videos, it is often necessary to focus not only on the position of the marker but also on people such as the performers (distributors).
上述の特許文献に開示された従来技術では、マーカと人物の両方が映像にある場合の優先順位について記載されていない。特許文献1では、マーカと人物の両方が画像内に存在するようなシチュエーションについては考えられていなかった。個人による映像配信で、商品の紹介などをする動画では、マーカの位置だけではなく、出演者にもフォーカスを合わせたい場合も多い。 The conventional technology disclosed in the above-mentioned patent document does not mention the priority order when both a marker and a person are present in the video. Patent document 1 does not consider the situation where both a marker and a person are present in the image. In video distribution by individuals, such as videos introducing products, it is often desirable to focus not only on the position of the marker but also on the performers.
そこで、本発明は、最適なフォーカス対象を設定できるようにすることを目的とする。 Therefore, the present invention aims to enable the optimal focus target to be set.
本発明の技術的特徴として、撮像素子により得られた画像信号から人物を検出する認識工程と、前記認識工程により認識された人物の第1、第2の動作を検出する動作検出工程と、前記撮像素子により得られた画像信号からマーカを検出するマーカ検出工程と、焦点状態を調整する対象として、前記認識工程により認識された人物と前記マーカ検出工程により検出されたマーカのいずれか一方を選択する選択工程と、を有し、前記選択工程では、前記動作検出工程により第1の動作が検出された場合に、前記認識工程により認識された人物を選択し、前記動作検出工程により第2の動作が検出された場合に前記マーカ検出工程により検出されたマーカを選択することを特徴とする。 The technical features of the present invention include a recognition process for detecting a person from an image signal obtained by an imaging element, a motion detection process for detecting first and second motions of the person recognized by the recognition process, a marker detection process for detecting a marker from an image signal obtained by the imaging element, and a selection process for selecting either the person recognized by the recognition process or the marker detected by the marker detection process as a target for adjusting the focus state, and the selection process is characterized in that when a first motion is detected by the motion detection process, the person recognized by the recognition process is selected, and when a second motion is detected by the motion detection process, the marker detected by the marker detection process is selected.
また、別の技術的特徴として、撮像素子により得られた画像信号から人物を認識する認識工程と、第1、第2の音声を検出する音声検出工程と、前記撮像素子により得られた画像信号からマーカを検出するマーカ検出工程と、焦点状態を調整する対象として、前記認識工程により認識された人物と前記マーカ検出工程により検出されたマーカのいずれか一方を選択する選択工程と、を有し、前記選択工程では、前記音声検出工程により第1の音声が検出された場合に、前記認識工程により認識された人物を選択し、前記音声検出工程により第2の音声が検出された場合に前記マーカ検出工程により検出されたマーカを選択することを特徴とする。 As another technical feature, the present invention has a recognition process for recognizing a person from an image signal obtained by an imaging element, a sound detection process for detecting first and second sounds, a marker detection process for detecting a marker from an image signal obtained by the imaging element, and a selection process for selecting either the person recognized by the recognition process or the marker detected by the marker detection process as a target for adjusting the focus state, and is characterized in that the selection process selects the person recognized by the recognition process when a first sound is detected by the sound detection process, and selects the marker detected by the marker detection process when a second sound is detected by the sound detection process.
本発明によれば、最適なフォーカス対象を設定できる。 The present invention allows you to set the optimal focus target.
以下に、本発明の好ましい実施の形態を、添付の図面に基づいて詳細に説明する。 A preferred embodiment of the present invention will be described in detail below with reference to the accompanying drawings.
(第1の実施形態)
●撮像装置の構成
図1に本発明を適用可能な画像処理装置の一例としての撮像装置1の構成図を示す。撮像装置1は、レンズ部100とカメラ本体200とを有し、レンズ部100がカメラ本体200に着脱可能に構成されているデジタルカメラ、あるいは、レンズ部100とカメラ本体200が一体的に構成されたデジタルカメラである。カメラ本体200は、ネットワーク上のサーバ装置300と無線通信または有線通信により接続可能である。サーバ装置300は、映像配信機能を有する映像配信サーバである。
First Embodiment
Configuration of the Imaging Device Fig. 1 shows a configuration diagram of an imaging device 1 as an example of an image processing device to which the present invention can be applied. The imaging device 1 is a digital camera having a
レンズ部100は撮像装置1の撮影光学系を構成する。レンズ部100は、絞り11、手振れ補正レンズ群12、フォーカス・ズームレンズ群13、などを備え、被写体の光学像をカメラ本体200へ導くことができる。
The
カメラ本体200は、レンズ部100により結像された光学像を光電変換して画像信号を生成する撮像素子21と、撮像素子21を露光する露出時間を調整するメカニカルシャッター22を備える。カメラ本体200は、複数の設定項目の設定値に基づいて、レンズ部100の絞り11とレンズ群12、13を制御すると共に、撮像素子21の駆動タイミングとメカニカルシャッター22のシャッタースピードを制御して適正な露出で画像の撮像を行う。
The
カメラ本体200は、撮像素子21で撮像された画像やカメラの撮影時の各種の設定値などを表示可能な背面表示部23を備える。背面表示部23は、液晶パネルや有機ELなどの表示デバイスで構成され、カメラ本体200におけるレンズ部100とは反対側の背面部に設けられている。
The
なお、撮像素子21が信号蓄積時間および信号読出時間を制御することで露出時間を調整可能な電子シャッター機能を備えている場合にはメカニカルシャッター22は不要である。また、メカニカルシャッター22と電子シャッター機能を備える場合に、電子シャッターで露出時間を調整する場合はメカニカルシャッター22は全開状態とする。
Note that if the
カメラ本体200は、電気回路20を備える。電気回路20は、演算処理回路20a、メモリ回路20b、画像処理回路20c、画像圧縮回路20d、駆動制御回路20g、などを含む。
The
演算処理回路20aは、レンズ部100やカメラ本体200の動作を制御するための各種の演算処理を行うCPUやMPUなどのプロセッサを含む。演算処理回路20aは、記憶部29に格納されたプログラムを実行することにより、レンズ部100やカメラ本体200の各部を制御する。ここでいうプログラムは、本実施形態の制御処理を行うプログラムを含む。
The
メモリ回路20bは、記憶部29から読み出したプログラムを展開するワークメモリ、撮像素子21で撮像された画像データを一時的に保持するバッファメモリ、背面表示部23の画像表示用メモリとして使用される。
The
画像処理回路20cは、撮像素子21で生成された画像信号をデジタルデータに変換し、各種の画像処理を行う。画像処理回路20cから出力される画像データは、背面表示部23に出力、または、画像圧縮回路20dで所定のデータ形式に圧縮されて記憶部29に出力され記録される。
The
画像圧縮回路20dは、画像処理回路20cから出力される画像データを所定のデータ形式に圧縮符号化して画像ファイルを生成する。
The
駆動制御回路20gは、演算処理回路20aの演算処理結果に基づいて、不図示の駆動回路やアクチュエータなどを制御して、レンズ部100の絞り11、レンズ群12、13、カメラ本体200のメカニカルシャッター22を制御する。
The
カメラ本体200は、ユーザ操作を受け付けるスイッチ、ボタン、タッチパネルなどの操作入力部28を備える。本実施形態では、操作入力部28は、撮影準備または撮影開始を指示するシャッタースイッチを含む。シャッタースイッチを一段目まで浅く押す、いわゆる「半押し」することで、オートフォーカス処理や自動露出処理、オートホワイトバランス処理等の動作を開始する。さらに、シャッタースイッチを半押しから二段目まで深く押す、いわゆる「全押し」することで、メカニカルシャッター22または撮像素子21の電子シャッター機能を作動させる。そして、撮像素子21からの信号読み出しから記憶部29に画像データを書き込むまでの一連の撮影処理の動作を開始する。操作入力部28として、後述するサーバ装置300による映像配信機能をユーザがオンまたはオフできるスイッチを設けてもよい。
The
カメラ本体200は、通信部25を備える。通信部25は、カメラ本体200をインターネットなどのネットワークを介して外部機器と通信可能に接続するためのインターフェース回路を備える。カメラ本体200は、通信部25により、有線または無線のネットワークに接続された外部機器とデータの送受信を行うことができる。カメラ本体200は、通信部25を制御して、画像処理回路が処理した画像データをネットワーク上のサーバ装置300に出力可能である。
The
カメラ本体200は、音声入力部27を備える。音声入力部27は、マイクロフォンなどを備え、入力された音声を電気信号に変換し、音声データとして電気回路20に出力する。電気回路20に出力された音声データは、画像データに付加されて記憶部29に出力され記録されたりする。本実施形態においては、音声入力部27はユーザが発した音声を入力し、音声データを電気回路20に出力する。音声入力部27は、カメラ本体200に内蔵されていてもよいし、不図示の外部端子に接続されていてもよい。
The
カメラ本体200は、メモリカードやハードディスクなどの記憶部29を備える。記憶部29には、演算処理回路20aが実行するプログラムが格納されている。また、記憶部29は、画像圧縮回路20dで所定のフォーマットに圧縮された画像ファイルが記録され、または、既に記録されている画像ファイルが読み出される。記憶部29は、カメラ本体200に対して着脱可能な形態であってもよいし、カメラ本体200に内蔵された形態であってもよい。
The
次に、本実施形態の映像配信サーバ300の構成および機能について説明する。
Next, we will explain the configuration and functions of the
映像配信サーバ300は、制御部30、通信部31、ストリーミング処理部32を備える。
The
制御部30は、映像配信サーバ300の動作を制御するための各種の演算処理を行うCPUやMPUなどのプロセッサを含む。制御部30は、所定のプログラムを実行することにより、映像配信サーバ300の各部を制御する。ここでいうプログラムは、本実施形態の映像配信処理を行うプログラムを含む。
The
通信部31は、ネットワークを介してカメラ本体200の通信部25と接続し、カメラ本体200および外部デバイスとデータの送受信が可能である。通信部31は、カメラ本体200の通信部25から送信された画像データをストリーミング処理部32に出力する。
The
ストリーミング処理部32は通信部25から送信された画像データを基に配信用の画像を作り出し、通信部31に送信する。ストリーミング処理された画像データは通信部31を介して図1に不図示の視聴者側のデバイスに送信される。
The
●第1の実施形態における撮像装置の処理構成
図2は、第1の実施形態における電気回路20の処理構成例を概念的に示す図である。
Processing Configuration of the Imaging Apparatus in the First Embodiment FIG. 2 is a diagram conceptually showing an example of the processing configuration of the
図2に示されるように、電気回路20は、画像取得部101、マーカ検出部102、第1距離算出部103、人物検出部104、第2距離算出部105、優先順位決定部106、パラメータ決定部107、フォーカス設定部108を有する。
As shown in FIG. 2, the
これら各処理部は、例えば、プログラムとしてメモリ回路20bに格納され、演算処理回路20aによりこれらのプログラムが実行されることにより実現される。
Each of these processing units is stored as a program in the
画像取得部101は、撮像素子21からリアルタイムに画像を逐次取得する。
The
マーカ検出部102は、画像取得部101により取得されたリアルタイム撮影画像からマーカを検出する。ここで、マーカとは、所定のパターン、形状、色が印刷されたステッカーなどである。マーカ検出部102は、マーカの形状、色、情報等を予め保持しており、これらの情報に基づいて、撮影画像からマーカを検出する。このマーカ検出には、特開2021-27544で開示された技術のような、公知の画像認識手法が利用される。本実施形態のマーカは、撮像画像から検出できる形状、色のものであればよく、具体的形態は制限しない。また、撮影画像にマーカが複数存在する場合、複数のマーカを検出してもよい。
The
第1距離検出部103は、マーカ検出部102により検出されたマーカに関する画像情報に基づいて、そのマーカと撮像素子21との距離を検出する。マーカに関する画像情報とは、リアルタイム画像内の形状や大きさ等を示す。第1距離検出部103は、あらかじめ保持してあるマーカに関する形状、大きさ情報と検出された画像情報との比較により、マーカと撮像素子21との距離を算出することができる。第1距離検出部103による距離の算出手法は、マーカに関する形状と大きさの情報や画像情報の少なくとも一つが利用されれば、特に制限されない。
The first
人物検出部104は、画像取得部101により取得されたリアルタイム画像から人物を認識する。人物検出部104は、人の顔や体の形状情報、色情報等を予め保持しており、これら保持情報に基づいて、撮影画像から人物を認識する。この人物検出には、公知の画像認識手法が利用される。
The
第2距離検出部105は、人物検出部102により認識され人物に関する現実情報及び画像情報に基づいて、その人物と撮像素子21との距離を検出する。この人物と撮像素子21との距離の検出には、特開2007-329784で開示された技術のような、公知の技術が使われる。
The second
優先順位決定部106は、前記人物またはマーカの内、前記撮像部がフォーカスを合わせる対象を決定する。どの対象を優先するかについては後述する。
The
パラメータ決定部107は、第1距離算出部103により算出された距離情報を用いて、その対象に焦点状態を調整するためのフォーカスパラメータを決定する。フォーカスパラメータは、ピント位置と被写界深度を調整するための絞り値等である。ピント位置は、撮像部101における焦点状態を調整するための構成に応じて、例えば、レンズと撮像素子との間の距離、焦点距離等で表すことができる。パラメータ決定部150によるパラメータ決定手法には公知の手法が利用され得る。
The
フォーカス設定部108は、パラメータ決定部107により決定されたフォーカスパラメータを駆動制御回路20gに設定する。
The
音声検出部109は、音声入力部27により入力された音声中から特定の音声を検出する。
The
動作検出部110は、画像取得部101により取得されたリアルタイム撮影画像から特定のジェスチャ(動作)を検出する。
The
なお、第1距離検出部103や第2距離検出部105は、撮像面位相差AF方式を用いてデフォーカス情報を求めて、その情報を元にフォーカスを合わせる対象と撮像素子21との距離を検出してもよい。また、距離ではなくデフォーカス情報を用いて、フォーカスパラメータを設定してもよい。
The first
●第1の実施形態におけるAF動作
以下、第1の実施形態における撮像制御方法について図3を用いて説明する。
AF Operation in First Embodiment An image capture control method in the first embodiment will now be described with reference to FIG.
第1の実施形態における撮像制御方法は、図3に示されるように、ステップS301からステップS315で示される複数の工程を含む。 The imaging control method in the first embodiment includes multiple steps shown in FIG. 3, from step S301 to step S315.
図3は、第1の実施形態における電気回路20の動作例を示すフローチャートである。
Figure 3 is a flowchart showing an example of the operation of the
以下の説明では、各工程は、電気回路の一部である演算処理回路20aにより実行される。
In the following explanation, each process is performed by the
操作部入力部28の入力操作により商品紹介モードが開始されると、まず、ステップS301において、電気回路20の画像取得部11は、撮像素子21からリアルタイム画像を逐次取得する。そして、ステップS302において、人物検出部104は、取得されたリアルタイム撮影画像から人物を認識する。
When the product introduction mode is started by an input operation of the operation
次にステップS303において、演算処理回路20aは事前に操作部入力部28の入力操作によりマーカ検出モードが指示されたかどうかを判定する。指示されていた場合はS304に移行し、指示されていない場合はS312に移行する。
Next, in step S303, the
ステップS304において、電気回路20のマーカ検出部102は、ステップS301で取得されたリアルタイム画像からマーカを検出する。ステップS304は、リアルタイム画像が取得される度に実行されてもよいし、所定周期で実行されてもよい。
In step S304, the
ステップS305において、リアルタイム画像内でマーカが検出されたかを判定する。マーカを検出した場合は、ステップS306に移行し、検出しなかった場合は、ステップS312に移行する。 In step S305, it is determined whether a marker has been detected in the real-time image. If a marker has been detected, the process proceeds to step S306; if not, the process proceeds to step S312.
ステップS306において、演算処理回路20aは、マーカ検出モードが、マーカ優先モード、音声モード、ジェスチャモードのいずれであるかを判定する。マーカ検出モードは、操作部入力部28により事前に指示しておく。マーカ優先モードの場合はステップS311に移行する。音声モードの場合はステップS307に移行する。ジェスチャモードの場合はステップS309に移行する。
In step S306, the
ステップS307において、優先順位決定部106は音声検出部109で音声入力部27により入力された音声から第1の音声が検出されたかを判定する。第1の音声とは、例えば、紹介する商品を示す音声や、商品紹介の開始を示す配信者による音声である。第1の音声が検出された場合はステップS311に移行し、検出されなかった場合はステップS308に移行する。
In step S307, the
ステップS308において、優先順位決定部106は音声検出部109で音声入力部27により入力された音声から第2の音声が検出されたかを判定する。第2の音声とは、例えば、商品紹介の終了を示す配信者による音声である。第2の音声が検出された場合はステップS311に移行し、検出されなかった場合はステップS312に移行する。
In step S308, the
ステップS309において、優先順位決定部106は動作検出部110で画像から第1のジェスチャ(第2の動作)が検出されたかどうかを判定する。第1のジェスチャとは、例えば、商品紹介開始時に行われる指を差すジェスチャや、手を前に差し出すジェスチャである。第1のジェスチャが検出された場合はステップS311に移行し、検出されなかった場合はステップS309に移行する。
In step S309, the
ステップS310において、優先順位決定部106は動作検出部110で画像から第2のジェスチャ(第1の動作)が検出されたかどうかを判定する。第2のジェスチャとは、例えば、商品紹介終了時に行われる指を差すのをやめるジェスチャや、手を後ろに戻すジェスチャである。第2のジェスチャが検出された場合はステップS312に移行し、検出されなかった場合はステップS311に移行する。
In step S310, the
ステップS311において第1距離検出部103は、ステップS305で検出されたマーカの画像情報に基づいて、そのマーカと撮像素子21との距離を算出する。マーカが複数存在する場合は、優先順位決定部106は、ステップS309で検出したジェスチャの内容に応じて、撮像素子21との距離を算出するマーカを決定する。例えば、ジェスチャで指を差した場所付近にあるマーカを、それ以外のマーカより優先して決定する。
In step S311, the first
ステップS312において、人物検出部104により、画像から人物が認識されたかどうかを判定する。人物が検出された場合はステップS313に移行し、検出されなかった場合はステップS314に移行する。
In step S312, the
ステップS313において、第2距離検出部103は、ステップS313で検出された人物に関する画像情報に基づいて、その人物と撮像素子21との距離を算出する。ステップS314において、演算処理回路20aはマーカおよび人物以外の被写体を検出し、それを主被写体とする。そして、主被写体に関する画像情報に基づいて、その主被写体と撮像素子21との距離を算出する。主被写体とは、マーカおよび顔以外の被写体で、たとえば画像の中央付近にある被写体である。
In step S313, the second
ステップS315において、パラメータ決定部107は、一連の処理のいずれかで算出された距離を用いて、焦点状態を調整するためのフォーカスパラメータを決定する。そして、電気回路20の演算処理回路20aは、決定されたフォーカスパラメータを駆動制御回路20gに設定する。
In step S315, the
このように処理することで、第1の音声が検出された場合に、マーカにフォーカスを合わせ、第2の音声が検出された場合は人物にフォーカスを合わせることができ、配信者の意図によりフォーカスを合わせる被写体を自由に切り替えることができる。 By processing in this way, if a first sound is detected, the focus is on the marker, and if a second sound is detected, the focus is on the person, allowing the broadcaster to freely switch the subject on which they want to focus.
マーカにフォーカスを合わせた後、周囲の画像データを用いてマーカの存在する領域を補間し、マーカが存在しないように見える画像にレタッチ処理する。レタッチ処理後の画像は、通信部を介して映像配信サーバに送信する。一方で表示部23にはレタッチ処理前の画像を表示するか、レタッチ処理後の画像で、レタッチ処理した箇所に焦点状態を調整する対象を示す指標としてのフォーカスの枠を挿入した画像を表示する。このようにすることで、映像配信先の映像視聴者側ではステッカーのない違和感のない画像を見ることができ、配信者側はフォーカスを合わせているポイント、つまりマーカのある場所をわかりやすく見ることができる。また、切り替えたタイミングの情報を記録部に記録しておき、後で動画編集の際にどのタイミングで商品を紹介しているのかの判定に用いることもできる。
After focusing on the marker, the area where the marker is present is interpolated using surrounding image data, and the image is retouched to make it look like the marker is not present. The retouched image is sent to the video distribution server via the communication unit. Meanwhile, the
(第2の実施形態)
以下、本発明の第2の実施形態について詳述する。第1の実施形態と同様の箇所については同じ記号で示し、それらの説明は省略する。
Second Embodiment
The second embodiment of the present invention will be described in detail below. The same parts as those in the first embodiment are indicated by the same reference numerals, and the description thereof will be omitted.
●第2の実施形態におけるAF動作
図4は、第2の実施形態における電気回路20の動作例を示すフローチャートである。
AF Operation in the Second Embodiment FIG. 4 is a flowchart showing an example of the operation of the
ステップS2101において、演算処理回路20aはフォーカスモード設定処理を行う。フォーカスモード設定処理の詳細については、図5にて説明する。
In step S2101, the
ステップS2102において、演算処理回路20aはフォーカスモード処理を行う。フォーカスモード処理の詳細については、図6にて説明する。
In step S2102, the
ステップS2103において、演算処理回路20aは被写体検出処理を行う。被写体検出処理の詳細については、図7にて説明する。
In step S2103, the
●第2の実施形態におけるフォーカスモード設定動作
図5は、第2の実施形態におけるフォーカスモード設定処理の動作例を示すフローチャートである。
Focus Mode Setting Operation in the Second Embodiment FIG. 5 is a flowchart showing an example of the operation of focus mode setting processing in the second embodiment.
ステップS2201において、演算処理回路20aはユーザからフォーカスモードを指示されているかを判定する。指示されていた場合はステップS2202に進み、指示されていなかった場合はステップS2207に進む。
In step S2201, the
ステップS2202において、演算処理回路20aはユーザからマーカ形状識別処理を指示されているかを判定する。指示されていた場合はステップS2203に進み、指示されていなかった場合はステップS2204に進む。
In step S2202, the
ステップS2203において、演算処理回路20aはマーカ検出部102が検出したマーカの形状や色を判定する。マーカの形状が前位置モードを示す形状であった場合は、ステップS2205に進む。マーカの形状が後位置モードを示す形状であった場合は、ステップS2206に進む。マーカの形状が中間位置モードを示す形状であった場合は、ステップS2207に進む。前位置モードとは、検出したマーカより撮像装置1に近い距離にフォーカスを合わせる(前ピンとなる)第1のモードである。後位置モードは、検出したマーカより撮像装置1から遠い距離にフォーカスを合わせる(後ピンとなる)第2のモードである。中間位置モードは、検出したマーカの距離にフォーカスを合わせる(合焦となる)第3のモードである。
In step S2203, the
ステップS2204において、第1のモード、第2のモード、第3のモードはユーザからの指示により設定可能であり、演算処理回路20aはユーザから指示されたフォーカスモード設定を判別する。ユーザからの指示が前位置モードであった場合は、ステップS2205に進む。ユーザからの指示が後位置モードであった場合は、ステップS2206に進む。ユーザからの指示が中間位置モードであった場合は、ステップS2207に進む。
In step S2204, the first mode, second mode, and third mode can be set by user instruction, and the
ステップS2205において、演算処理回路20aはフォーカスモードを前位置モードに設定する。
In step S2205, the
ステップS2206において、演算処理回路20aはフォーカスモードを後位置モードに設定する。
In step S2206, the
ステップS2207において、演算処理回路20aはフォーカスモードを中間位置モードに設定する。
In step S2207, the
●第2の実施形態におけるフォーカスモード処理
図6は、第2の実施形態におけるフォーカスモード設定処理の動作例を示すフローチャートである。
Focus Mode Processing in the Second Embodiment FIG. 6 is a flowchart showing an example of the operation of focus mode setting processing in the second embodiment.
ステップS2301において、演算処理回路20aはS2101で設定されたフォーカスモードを判別する。フォーカスモードが前位置モードであった場合は、ステップS2302に進む。フォーカスモードが後位置モードであった場合は、ステップS2303に進む。フォーカスモードが中間位置モードであった場合は、フォーカスモード処理を終了する。
In step S2301, the
ステップS2302において、演算処理回路20aはステップS311で算出された距離を変更前距離としてメモリ回路20bに記憶した後、撮像装置1に近い方向に変更する。変更する量はユーザが指定した数値に基づき算出してもよい。
In step S2302, the
ステップS2303において、演算処理回路20aはステップS311で算出された距離を変更前距離としてメモリ回路20bに記憶した後、撮像装置1から遠い方向に変更する。変更する量はユーザが指定した数値に基づき算出してもよい。
In step S2303, the
●第2の実施形態における被写体検出処理
図7は、第2の実施形態におけるフォーカスモード設定処理の動作例を示すフローチャートである。
Subject Detection Processing in the Second Embodiment FIG. 7 is a flowchart showing an example of the operation of focus mode setting processing in the second embodiment.
ステップS2401において、演算処理回路20aは画像取得部101から取得した画像から主被写体を検索する。
In step S2401, the
ステップS2402において、演算処理回路20aは主被写体が存在したかどうかを判定する。存在した場合は、被写体検出処理を終了する。存在しなかった場合は、ステップS2403に進む。
In step S2402, the
ステップS2403において、パラメータ決定部107はステップS2302ないしステップS2303でメモリ回路20bに記憶した変更前距離を基にフォーカスパラメータを決定する。その後、演算処理回路20aは、決定されたフォーカスパラメータを駆動制御回路20gに設定する。
In step S2403, the
以上述べたように、本実施形態の撮像装置1は、マーカが商品に直接貼れない場合でもマーカの前後の所定の距離にフォーカスを合わせることができ、確実に商品にフォーカスを合わせることが可能になる。 As described above, the imaging device 1 of this embodiment can focus at a specified distance in front of or behind the marker even if the marker cannot be directly attached to the product, making it possible to reliably focus on the product.
(第3の実施形態)
以下、本発明の第3の実施形態について詳述する。第1の実施形態と同様の箇所については同じ記号で示し、それらの説明は省略する。
Third Embodiment
The third embodiment of the present invention will be described in detail below. The same parts as those in the first embodiment are indicated by the same reference numerals, and the description thereof will be omitted.
●第3の実施形態における撮像装置の処理構成
図8は、第3の実施形態における電気回路3101の処理構成例を概念的に示す図である。
Processing Configuration of the Imaging Apparatus in the Third Embodiment FIG. 8 is a diagram conceptually showing an example of the processing configuration of the
電気回路3101は、第1の実施形態における電気回路20に対して、マーカ検出部3102と優先順位決定部3103の構成が異なる。マーカ検出部3102は、画像取得部101により取得されたリアルタイム撮影画像からマーカを検出する。本実施形態では、さらにマーカの検出個数を算出する。優先順位決定部3103は、前記人物またはマーカの内、前記撮像部がフォーカスを合わせる対象を決定する。どの対象を優先するかについては後述する。
The
●第3の実施形態におけるAF動作
以下、第3の実施形態における撮像制御方法について図9を用いて説明する。
AF Operation in Third Embodiment An image capture control method in the third embodiment will now be described with reference to FIG.
なお、第1の実施形態と同一の構成、動作及び処理については図中に同一の符号を付し、その説明は省略する。 The same configurations, operations, and processes as those in the first embodiment are denoted by the same reference numerals in the figures, and their explanations are omitted.
ステップS3201において、マーカの検出個数と比較する所定の個数を設定する。ユーザが操作入力部28を操作して所定の個数を設定する。ステップS3202において、マーカ検出部3102がリアルタイム画像内で検出されたマーカの個数を算出する。検出したマーカの個数が所定の個数以上の場合は、ステップS306に移行し、所定の個数よりも小さい場合は、ステップS312に移行する。
In step S3201, a predetermined number to be compared with the number of detected markers is set. The user operates the
本実施形態では、ステップS3201においてユーザの指示に基づいて所定の個数を設定する例を示した。しかしながら、他にマーカの大きさや個数、フォーカスを合わせる被写体の大きさや撮影シーンに基づいて不図示のマーカ所定個数設定部が自動で所定の個数を設定してもよい。 In this embodiment, an example has been shown in which the predetermined number is set based on a user instruction in step S3201. However, a predetermined number may also be automatically set by a predetermined number of markers setting unit (not shown) based on the size and number of markers, the size of the subject to be focused on, and the shooting scene.
所定の個数は配置されたマーカの個数よりも小さい値を設定する。マーカの個数に合わせて所定の個数を設定する場合は、例えばマーカの個数が多い場合は所定の個数を大きくする。マーカの個数が少ない場合は所定の個数を小さくする。またマーカの検出しやすさに応じて所定の個数を設定する。例えばマーカやフォーカスを合わせる被写体が大きくマーカを多く貼れる場合は所定の個数を大きくする。マーカやフォーカスを合わせる被写体が小さい場合は所定の個数を小さくする。また人物が複数いるような撮影シーンにおいてはマーカが隠れる可能性があるので所定の個数を小さくする。 The predetermined number is set to a value smaller than the number of markers placed. When setting the predetermined number according to the number of markers, for example, if there are a large number of markers, the predetermined number is made larger. If there are a small number of markers, the predetermined number is made smaller. The predetermined number is also set according to how easy it is to detect the markers. For example, if the markers or the subject to be focused on are large and many markers can be placed, the predetermined number is made larger. If the markers or the subject to be focused on are small, the predetermined number is made smaller. Also, in scenes with multiple people, the markers may be hidden, so the predetermined number is made smaller.
本実施形態では、所定の個数を1種類設定する例を示したが、他に所定の個数を2種類以上設定して優先順位決定部3103はマーカの検出個数に応じて判定してもよい。マーカの検出個数に応じて、動作検出部110の検出結果に基づいた優先順位の決定をするかを判定する。もしくは、音声検出部109の検出結果に基づいた優先順位の決定をするかを判定する。
In this embodiment, an example is shown in which one type of predetermined number is set, but two or more types of predetermined numbers may be set and the
例えば、第1の所定の個数と第2の所定の個数と第3の所定の個数を設定する。マーカの検出個数が第1の所定の個数と第2の所定の個数と第3の所定の個数よりも多い場合はマーカ検出部3102の検出結果に基づいた優先順位の決定を行う。マーカの検出個数が第1の所定の個数と第2の所定の個数よりも多く第3所定の個数よりも少ない場合は動作検出部110の検出結果に基づいた優先順位の決定を行う。マーカの検出個数が第1の所定の個数よりも多く第2の所定の個数と第3所定の個数よりも少ない場合は音声検出部109の検出結果に基づいた優先順位の決定を行う。またマーカの検出個数が第1の所定の個数と第2の所定の個数と第3所定の個数よりも少ない場合は人物検出部104の検出結果に基づいた優先順位の決定を行う。上記のように複数の所定の個数を設定して検出したマーカの検出個数に応じて優先順位の決定を行うことで、マーカをユーザの手で隠したり出したりして検出モードの選択ができる。
For example, a first predetermined number, a second predetermined number, and a third predetermined number are set. If the number of detected markers is greater than the first predetermined number, the second predetermined number, and the third predetermined number, the priority is determined based on the detection result of the
また、本発明をその好適な実施形態に基づいて詳述してきたが、本発明はこれら特定の実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の様々な形態も本発明に含まれる。さらに、上述した各実施形態は本発明の一実施形態を示すものにすぎず、各実施形態を適宜組み合わせることも可能である。 Although the present invention has been described in detail based on preferred embodiments thereof, the present invention is not limited to these specific embodiments, and various forms within the scope of the gist of the present invention are also included in the present invention. Furthermore, each of the above-described embodiments merely represents one embodiment of the present invention, and each embodiment can be combined as appropriate.
また、上述した実施形態においては、本発明をデジタルカメラ100に適用した場合を例にして説明したが、これはこの例に限定されず、画像処理に関する制御を行うことができるような表示制御装置であれば適用可能である。すなわち、本発明は携帯電話端末や携帯型の画像ビューワ、PC、ファインダーを備えるプリンタ装置、表示部を有する家電、デジタルフォトフレーム、プロジェクター、タブレットPC、音楽プレーヤー、ゲーム機、電子ブックリーダーなどに適用可能である。
In the above-mentioned embodiment, the present invention has been described as being applied to a
(その他の実施形態)
本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)をネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(又はCPUやMPU等)がプログラムコードを読み取り実行する処理である。この場合、そのプログラム、及び該プログラムを記憶した記録媒体は本発明を構成することになる。
Other Embodiments
The present invention can also be realized by executing the following process. That is, software (programs) that realize the functions of the above-described embodiments are supplied to a system or device via a network or various storage media, and the computer (or CPU, MPU, etc.) of the system or device reads and executes the program codes. In this case, the program and the storage medium on which the program is stored constitute the present invention.
100 レンズ部
11 絞り
12 手振れ補正レンズ群
13 フォーカス・ズームレンズ群
200 カメラ本体
20 電気回路
21 撮像素子
22 メカニカルシャッター
23 背面表示部
25 カメラ本体側通信部
27 音声入力部
28 操作入力部
29 記憶部
300 サーバ装置
30 制御部
31 サーバ装置側通信部
32 ストリーミング処理部
REFERENCE SIGNS
Claims (16)
前記認識手段により認識された人物の第1、第2の動作を検出する動作検出手段と、
前記撮像素子により得られた画像信号からマーカを検出するマーカ検出手段と、
焦点状態を調整する対象として、前記認識手段により認識された人物と前記マーカ検出手段により検出されたマーカのいずれか一方を選択する選択手段と、を備え、
前記選択手段は、前記動作検出手段により第1の動作が検出された場合に、前記認識手段により認識された人物を選択し、前記動作検出手段により第2の動作が検出された場合に前記マーカ検出手段により検出されたマーカを選択することを特徴とする画像処理装置。 A recognition means for recognizing a person from an image signal obtained by the imaging element;
a motion detection means for detecting first and second motions of a person recognized by the recognition means;
a marker detection means for detecting a marker from an image signal obtained by the imaging element;
a selection means for selecting, as a target for adjusting a focus state, either the person recognized by the recognition means or the marker detected by the marker detection means,
the selection means, when a first motion is detected by the motion detection means, selects the person recognized by the recognition means, and, when a second motion is detected by the motion detection means, selects the marker detected by the marker detection means.
第1、第2の音声を検出する音声検出手段と、
前記撮像素子により得られた画像信号からマーカを検出するマーカ検出手段と、
焦点状態を調整する対象として、前記認識手段により認識された人物と前記マーカ検出手段により検出されたマーカのいずれか一方を選択する選択手段と、を備え、
前記選択手段は、前記音声検出手段により第1の音声が検出された場合に、前記認識手段により認識された人物を選択し、前記音声検出手段により第2の音声が検出された場合に前記マーカ検出手段により検出されたマーカを選択することを特徴とする画像処理装置。 A recognition means for recognizing a person from an image signal obtained by the imaging element;
a voice detection means for detecting a first voice and a second voice;
a marker detection means for detecting a marker from an image signal obtained by the imaging element;
a selection means for selecting, as a target for adjusting a focus state, either the person recognized by the recognition means or the marker detected by the marker detection means,
the selection means, when a first voice is detected by the voice detection means, selects the person recognized by the recognition means, and, when a second voice is detected by the voice detection means, selects the marker detected by the marker detection means.
前記処理手段が出力したレタッチ処理後の画像信号を映像配信サーバに送信する送信手段をさらに有することを特徴とする請求項1または2に記載の画像処理装置。 a processing means for performing a retouching process on the image so that the marker detected by the marker detection means does not appear to exist;
3. The image processing apparatus according to claim 1, further comprising a transmitting unit for transmitting the retouched image signal output by said processing unit to a video distribution server.
前記モード設定手段は、マーカの形状とマーカの色の少なくともいずれか一方に応じて前記第1、第2、第3のモードを設定することを特徴とする請求項6に記載の画像処理装置。 The marker detection means detects at least one of the shape and color of the marker,
7. The image processing apparatus according to claim 6, wherein said mode setting means sets the first, second and third modes in accordance with at least one of a shape and a color of a marker.
前記認識工程により認識された人物の第1、第2の動作を検出する動作検出工程と、
前記撮像素子により得られた画像信号からマーカを検出するマーカ検出工程と、
焦点状態を調整する対象として、前記認識工程により認識された人物と前記マーカ検出工程により検出されたマーカのいずれか一方を選択する選択工程と、を有し、
前記選択工程では、前記動作検出工程により第1の動作が検出された場合に、前記認識工程により認識された人物を選択し、前記動作検出工程により第2の動作が検出された場合に前記マーカ検出工程により検出されたマーカを選択することを特徴とする画像処理方法。 a recognition step of detecting a person from an image signal obtained by the imaging element;
a motion detection step of detecting first and second motions of the person recognized by the recognition step;
a marker detection step of detecting a marker from an image signal obtained by the imaging element;
a selection step of selecting, as a target for adjusting a focus state, either the person recognized in the recognition step or the marker detected in the marker detection step,
an image processing method comprising: selecting a person recognized by the recognition step when a first motion is detected by the motion detection step; and selecting a marker detected by the marker detection step when a second motion is detected by the motion detection step, said selection step including:
第1、第2の音声を検出する音声検出工程と、
前記撮像素子により得られた画像信号からマーカを検出するマーカ検出工程と、
焦点状態を調整する対象として、前記認識工程により認識された人物と前記マーカ検出工程により検出されたマーカのいずれか一方を選択する選択工程と、を有し、
前記選択工程では、前記音声検出工程により第1の音声が検出された場合に、前記認識工程により認識された人物を選択し、前記音声検出工程により第2の音声が検出された場合に前記マーカ検出工程により検出されたマーカを選択することを特徴とする画像処理方法。 a recognition step of recognizing a person from an image signal obtained by the imaging element;
a voice detection step of detecting a first voice and a second voice;
a marker detection step of detecting a marker from an image signal obtained by the imaging element;
a selection step of selecting, as a target for adjusting a focus state, either the person recognized in the recognition step or the marker detected in the marker detection step;
an image processing method comprising: selecting a person recognized by the recognition step when a first voice is detected by the voice detection step; and selecting a marker detected by the marker detection step when a second voice is detected by the voice detection step, said selection step including:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022164194A JP2024057447A (en) | 2022-10-12 | 2022-10-12 | Image processing device, control method for image processing device, program, and storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022164194A JP2024057447A (en) | 2022-10-12 | 2022-10-12 | Image processing device, control method for image processing device, program, and storage medium |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2024057447A true JP2024057447A (en) | 2024-04-24 |
Family
ID=90779192
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022164194A Pending JP2024057447A (en) | 2022-10-12 | 2022-10-12 | Image processing device, control method for image processing device, program, and storage medium |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2024057447A (en) |
-
2022
- 2022-10-12 JP JP2022164194A patent/JP2024057447A/en active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8976270B2 (en) | Imaging device and imaging device control method capable of taking pictures rapidly with an intuitive operation | |
CN101790046B (en) | Digital photographing device, method of controlling the same | |
JP5345025B2 (en) | Image recording apparatus and method | |
CN103227902A (en) | Imaging device, display control method, and program | |
JP4236986B2 (en) | Imaging apparatus, method, and program | |
JP2007236008A (en) | Camera with image display | |
CN102739961A (en) | Image processing device capable of generating wide-range image | |
CN103888684A (en) | Image processing apparatus that combines a plurality of images | |
KR101737086B1 (en) | Digital photographing apparatus and control method thereof | |
US10075638B2 (en) | Apparatus that performs zooming operation, control method therefor, and storage medium | |
JP5013852B2 (en) | Angle of view correction apparatus and method, and imaging apparatus | |
JP2006319903A (en) | Mobile apparatus provided with information display screen | |
JP2009171428A (en) | Control method and program for digital camera apparatus and electronic zoom | |
KR20130031176A (en) | Display apparatus and method | |
JP6460783B2 (en) | Image processing apparatus and control method thereof | |
JP7380675B2 (en) | Image processing device, image processing method, program, imaging device | |
JP2024057447A (en) | Image processing device, control method for image processing device, program, and storage medium | |
JP7435592B2 (en) | Image processing device, image processing method, program, imaging device | |
US20100118155A1 (en) | Digital image processing apparatus | |
JP2018093303A (en) | Imaging apparatus and control method and program thereof | |
JP2005354606A (en) | Digital camera | |
JP7365793B2 (en) | Imaging device, its control method, and program | |
US20230362491A1 (en) | Processing apparatus for generating movie, control method therefor, and storage medium storing control program therefor | |
KR101946574B1 (en) | Apparatus and method for reproducing image and computer-readable storage medium | |
JP2011053550A (en) | Optical instrument |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20231213 |