JP7395082B1 - 画像検索装置、画像検索方法及び画像検索プログラム - Google Patents

画像検索装置、画像検索方法及び画像検索プログラム Download PDF

Info

Publication number
JP7395082B1
JP7395082B1 JP2023560266A JP2023560266A JP7395082B1 JP 7395082 B1 JP7395082 B1 JP 7395082B1 JP 2023560266 A JP2023560266 A JP 2023560266A JP 2023560266 A JP2023560266 A JP 2023560266A JP 7395082 B1 JP7395082 B1 JP 7395082B1
Authority
JP
Japan
Prior art keywords
image
unit
feature
data
camera
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2023560266A
Other languages
English (en)
Other versions
JPWO2023157043A1 (ja
Inventor
直大 澁谷
芳美 守屋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Publication of JPWO2023157043A1 publication Critical patent/JPWO2023157043A1/ja
Application granted granted Critical
Publication of JP7395082B1 publication Critical patent/JP7395082B1/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/56Information retrieval; Database structures therefor; File system structures therefor of still image data having vectorial format
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

カメラ(1-n)(n=1,・・・,N)により撮影された複数の画像のそれぞれを示す画像データと、それぞれの画像を撮影したカメラの種類を示す識別データとを取得するデータ取得部(11)と、データ取得部(11)により取得されたそれぞれの識別データが示すカメラの種類に基づいて、それぞれの画像から抽出可能な特徴量の種類において共通している種類を特定する共通種類特定部(13)とを備えるように、画像検索装置(2)を構成した。また、画像検索装置(2)は、データ取得部(11)により取得されたそれぞれの画像データが示す画像から、共通種類特定部(13)により特定された種類についての特徴量を抽出する特徴量抽出部(14)と、特徴量抽出部(14)により抽出された複数の特徴量のうち、複数の画像に含まれているいずれか1つの画像であるクエリ画像から抽出された特徴量と、複数の画像に含まれているクエリ画像以外の画像である1つ以上のギャラリ画像のそれぞれから抽出された特徴量とを比較し、特徴量の比較結果に基づいて、クエリ画像に映っている被写体と同じ被写体が映っているギャラリ画像を検索する画像検索部(16)とを備えている。

Description

本開示は、画像検索装置、画像検索方法及び画像検索プログラムに関するものである。
複数のギャラリ画像の中から、クエリ画像に映っている被写体と同じ被写体が映っているギャラリ画像を検索する画像検索装置がある(例えば、特許文献1を参照)。
当該画像検索装置は、複数のギャラリ画像のそれぞれから抽出された特徴量を保持する特徴テーブルを備えている。また、当該画像検索装置は、クエリ画像から特徴量を抽出する画像特徴抽出部と、特徴テーブルに保持されているそれぞれの特徴量と画像特徴抽出部により抽出された特徴量とを照合することで、複数のギャラリ画像の中から、クエリ画像に映っている被写体と同じ被写体が映っているギャラリ画像を検索する特徴照合部とを備えている。
特開2015-2547号公報
クエリ画像を撮影したカメラと、ギャラリ画像を撮影したカメラとが異なる種類のカメラであれば、クエリ画像から抽出可能な特徴量の種類とギャラリ画像から抽出可能な特徴量の種類とが異なることがある。このため、特許文献1に開示されている画像検索装置では、クエリ画像を撮影したカメラと、ギャラリ画像を撮影したカメラとが異なる種類のカメラであれば、画像特徴抽出部が、ギャラリ画像から抽出された特徴量と同じ種類の特徴量をクエリ画像から抽出できるとは限らない。したがって、当該画像検索装置には、画像特徴抽出部が、クエリ画像から同じ種類の特徴量を抽出できなければ、特徴照合部が、クエリ画像に映っている被写体と同じ被写体が映っているギャラリ画像を検索できないことがあるという課題があった。
本開示は、上記のような課題を解決するためになされたもので、クエリ画像を撮影したカメラと、ギャラリ画像を撮影したカメラとが異なる種類のカメラであっても、クエリ画像に映っている被写体と同じ被写体が映っているギャラリ画像を検索することができる画像検索装置、画像検索方法及び画像検索プログラムを得ることを目的とする。
本開示に係る画像検索装置は、カメラにより撮影された複数の画像のそれぞれを示す画像データと、それぞれの画像を撮影したカメラの種類を示す識別データとを取得するデータ取得部と、データ取得部により取得されたそれぞれの識別データが示すカメラの種類に基づいて、それぞれの画像から抽出可能な特徴量の種類において共通している種類を特定する共通種類特定部とを備えている。また、画像検索装置は、データ取得部により取得されたそれぞれの画像データが示す画像から、共通種類特定部により特定された種類についての特徴量を抽出する特徴量抽出部と、特徴量抽出部により抽出された複数の特徴量のうち、複数の画像に含まれているいずれか1つの画像であるクエリ画像から抽出された特徴量と、複数の画像に含まれているクエリ画像以外の画像である1つ以上のギャラリ画像のそれぞれから抽出された特徴量とを比較し、特徴量の比較結果に基づいて、クエリ画像に映っている被写体と同じ被写体が映っているギャラリ画像を検索する画像検索部とを備えている。
本開示によれば、クエリ画像を撮影したカメラと、ギャラリ画像を撮影したカメラとが異なる種類のカメラであっても、クエリ画像に映っている被写体と同じ被写体が映っているギャラリ画像を検索することができる。
実施の形態1に係る画像検索装置2を示す構成図である。 実施の形態1に係る画像検索装置2のハードウェアを示すハードウェア構成図である。 画像検索装置2が、ソフトウェア又はファームウェア等によって実現される場合のコンピュータのハードウェア構成図である。 画像検索装置2の処理手順である画像検索方法を示すフローチャートである。 画像から抽出可能な特徴量の種類を示す説明図である。 特徴量の種類に対応する特徴量抽出方法の一例を示す説明図である。 実施の形態2に係る画像検索装置2を示す構成図である。 実施の形態2に係る画像検索装置2のハードウェアを示すハードウェア構成図である。 実施の形態3に係る画像検索装置2を示す構成図である。 実施の形態3に係る画像検索装置2のハードウェアを示すハードウェア構成図である。 実施の形態4に係る画像検索装置2を示す構成図である。 実施の形態4に係る画像検索装置2のハードウェアを示すハードウェア構成図である。
以下、本開示をより詳細に説明するために、本開示を実施するための形態について、添付の図面に従って説明する。
実施の形態1.
図1は、実施の形態1に係る画像検索装置2を示す構成図である。
図2は、実施の形態1に係る画像検索装置2のハードウェアを示すハードウェア構成図である。
図1において、カメラ1-1~1-Nのそれぞれは、互いに異なる場所に設置されている。Nは、2以上の整数である。
カメラ1-n(n=1,・・・,N)は、設置場所に現れた人物を被写体として撮影し、被写体が映っている画像を示す画像データを画像検索装置2に出力する。
また、カメラ1-nは、カメラの種類を示す識別データを画像検索装置2に出力する。
ここでは、カメラ1-nが、設置場所に現れた人物を被写体として撮影している。しかし、これは一例に過ぎず、カメラ1-nが、例えば、設置場所に現れたロボット、又は、設置場所に現れた動物を被写体として撮影するようにしてもよい。
画像検索装置2は、データ取得部11、データ保持部12、共通種類特定部13、特徴量抽出部14、クエリ画像選択部15及び画像検索部16を備えている。
画像検索装置2は、クエリ画像に映っている被写体と同じ被写体が映っているギャラリ画像を検索する装置である。
マンマシンインタフェース部3は、タッチパネル等のマンマシンインタフェースを備えている。
マンマシンインタフェース部3は、クエリ画像の選択を受け付け、選択したクエリ画像を示す選択信号を画像検索装置2に出力する。
また、マンマシンインタフェース部3は、画像検索装置2により検索されたギャラリ画像を表示する。
データ取得部11は、例えば、図2に示すデータ取得回路21によって実現される。
データ取得部11は、カメラ1-n(n=1,・・・,N)により撮影された画像を示す画像データと、カメラ1-nの種類を示す識別データとを取得する。
データ取得部11は、画像データ及び識別データのそれぞれをデータ保持部12に出力する。
データ保持部12は、例えば、図2に示すデータ保持回路22によって実現される。
データ保持部12は、データ取得部11から出力された画像データ及び識別データのそれぞれを保持する。
また、データ保持部12は、特徴量抽出部14により抽出された特徴量を保持する。
共通種類特定部13は、例えば、図2に示す共通種類特定回路23によって実現される。
共通種類特定部13は、データ保持部12から、データ取得部11により取得されたそれぞれの識別データを取得する。
共通種類特定部13は、それぞれの識別データが示すカメラ1-n(n=1,・・・,N)の種類に基づいて、それぞれの画像から抽出可能な特徴量の種類において共通している種類を特定する。
共通種類特定部13は、共通の種類の特定結果を特徴量抽出部14に出力する。
特徴量抽出部14は、例えば、図2に示す特徴量抽出回路24によって実現される。
特徴量抽出部14は、データ保持部12から、データ取得部11により取得されたそれぞれの画像データを取得する。
特徴量抽出部14は、それぞれの画像データが示す画像から、共通種類特定部13により特定された種類についての特徴量を抽出する。
特徴量抽出部14は、それぞれの特徴量をデータ保持部12に出力する。
クエリ画像選択部15は、例えば、図2に示すクエリ画像選択回路25によって実現される。
クエリ画像選択部15は、データ保持部12に保持されているそれぞれの画像データが示す画像をマンマシンインタフェース部3のタッチパネルに表示させる。
クエリ画像選択部15は、マンマシンインタフェース部3により選択が受け付けられたクエリ画像を示す選択信号を取得する。
クエリ画像選択部15は、クエリ画像を示す選択信号を画像検索部16に出力する。
画像検索部16は、例えば、図2に示す画像検索回路26によって実現される。
画像検索部16は、データ保持部12に保持されている複数の特徴量の中から、クエリ画像から抽出された特徴量として、クエリ画像選択部15から出力された選択信号が示すクエリ画像から抽出された特徴量を取得する。
画像検索部16は、選択信号が示すクエリ画像から抽出された特徴量と、データ保持部12に保持されているそれぞれのギャラリ画像の特徴量とを比較する。ギャラリ画像は、データ保持部12に保持されている複数の画像のうち、クエリ画像以外の画像である。
画像検索部16は、特徴量の比較結果に基づいて、クエリ画像に映っている被写体と同じ被写体が映っているギャラリ画像を検索する。
画像検索部16は、例えば、検索したギャラリ画像をマンマシンインタフェース部3に出力する。
図1では、画像検索装置2の構成要素であるデータ取得部11、データ保持部12、共通種類特定部13、特徴量抽出部14、クエリ画像選択部15及び画像検索部16のそれぞれが、図2に示すような専用のハードウェアによって実現されるものを想定している。即ち、画像検索装置2が、データ取得回路21、データ保持回路22、共通種類特定回路23、特徴量抽出回路24、クエリ画像選択回路25及び画像検索回路26によって実現されるものを想定している。
データ保持回路22は、例えば、RAM(Random Access Memory)、ROM(Read Only Memory)、フラッシュメモリ、EPROM(Erasable Programmable Read Only Memory)、EEPROM(Electrically Erasable Programmable Read Only Memory)等の不揮発性又は揮発性の半導体メモリ、磁気ディスク、フレキシブルディスク、光ディスク、コンパクトディスク、ミニディスク、あるいは、DVD(Digital Versatile Disc)が該当する。
また、データ取得回路21、共通種類特定回路23、特徴量抽出回路24、クエリ画像選択回路25及び画像検索回路26のそれぞれは、例えば、単一回路、複合回路、プログラム化したプロセッサ、並列プログラム化したプロセッサ、ASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)、又は、これらを組み合わせたものが該当する。
画像検索装置2の構成要素は、専用のハードウェアによって実現されるものに限るものではなく、画像検索装置2が、ソフトウェア、ファームウェア、又は、ソフトウェアとファームウェアとの組み合わせによって実現されるものであってもよい。
ソフトウェア又はファームウェアは、プログラムとして、コンピュータのメモリに格納される。コンピュータは、プログラムを実行するハードウェアを意味し、例えば、CPU(Central Processing Unit)、中央処理装置、処理装置、演算装置、マイクロプロセッサ、マイクロコンピュータ、プロセッサ、あるいは、DSP(Digital Signal Processor)が該当する。
図3は、画像検索装置2が、ソフトウェア又はファームウェア等によって実現される場合のコンピュータのハードウェア構成図である。
画像検索装置2が、ソフトウェア又はファームウェア等によって実現される場合、データ保持部12がコンピュータのメモリ41上に構成される。データ取得部11、共通種類特定部13、特徴量抽出部14、クエリ画像選択部15及び画像検索部16におけるそれぞれの処理手順をコンピュータに実行させるための画像検索プログラムがメモリ41に格納される。そして、コンピュータのプロセッサ42がメモリ41に格納されている画像検索プログラムを実行する。
また、図2では、画像検索装置2の構成要素のそれぞれが専用のハードウェアによって実現される例を示し、図3では、画像検索装置2がソフトウェア又はファームウェア等によって実現される例を示している。しかし、これは一例に過ぎず、画像検索装置2における一部の構成要素が専用のハードウェアによって実現され、残りの構成要素がソフトウェア又はファームウェア等によって実現されるものであってもよい。
次に、図1に示す画像検索装置2の動作について説明する。
図4は、画像検索装置2の処理手順である画像検索方法を示すフローチャートである。画像検索装置2の処理手順には、データ取得処理手順と、共通種類特定処理手順と、特徴量抽出処理手順と、画像検索処理手順とが含まれている。
人物がカメラ1-n(n=1,・・・,N)の設置場所に現れると、カメラ1-nは、当該人物を被写体として撮影する。
カメラ1-nは、被写体が映っている画像を示す画像データを画像検索装置2に出力する。
N個のカメラ1-1~1-Nは、互いに異なる種類のカメラであってもよいし、同一種類のカメラであってもよい。
カメラ1-nとしては、例えば、可視カメラ、デプスカメラ、赤外カメラ、又は、LiDAR(Light Detection And Ranging)がある。
また、カメラ1-nは、カメラの種類を示す識別データを画像検索装置2に出力する。
識別データは、カメラ1-nが例えば可視カメラであれば、可視カメラであることを示し、カメラ1-nが例えばデプスカメラであれば、デプスカメラであることを示すデータである。また、識別データは、カメラ1-nが例えば赤外カメラであれば、赤外カメラであることを示し、カメラ1-nが例えばLiDARであれば、LiDARであることを示すデータである。
データ取得部11は、カメラ1-n(n=1,・・・,N)から、画像データ及び識別データのそれぞれが出力されたとき、画像データ及び識別データのそれぞれを取得する(図4のステップST1)。
データ取得部11は、画像データ及び識別データのそれぞれをデータ保持部12に出力する。
データ保持部12は、データ取得部11から出力された画像データ及び識別データのそれぞれを保持する。
共通種類特定部13は、データ保持部12から、データ取得部11により取得されたそれぞれの識別データを取得する。
共通種類特定部13は、それぞれの識別データが示すカメラ1-n(n=1,・・・,N)の種類に基づいて、それぞれの画像から抽出可能な特徴量の種類において共通している種類を特定する(図4のステップST2)。
図5は、画像から抽出可能な特徴量の種類を示す説明図である。
図5の例では、可視カメラにより撮影された画像及びデプスカメラにより撮影された画像のそれぞれから抽出可能な特徴量の種類が、色、シルエット、又は、テクスチャであることを示している。
また、赤外カメラにより撮影された画像から抽出可能な特徴量の種類が、シルエット、テクスチャ、又は、温度であることを示している。
LiDARにより撮影された画像から抽出可能な特徴量の種類が、シルエット、又は、テクスチャであることを示している。
したがって、例えば、N=2であるとき、カメラ1-1が可視カメラであって、カメラ1-2がデプスカメラであれば、共通種類特定部13は、それぞれのカメラにより撮影された画像から抽出可能な特徴量の種類において共通している種類が、“色”、“シルエット”、又は、“テクスチャ”であると特定する。
例えば、N=3であるとき、カメラ1-1が可視カメラであって、カメラ1-2がデプスカメラ、カメラ1-2が赤外カメラであれば、共通種類特定部13は、それぞれのカメラにより撮影された画像から抽出可能な特徴量の種類において共通している種類が、“シルエット”、又は、“テクスチャ”であると特定する。
共通種類特定部13は、共通の種類の特定結果を特徴量抽出部14に出力する。
特徴量抽出部14は、データ保持部12から、データ取得部11により取得された全ての画像データを取得する。
特徴量抽出部14は、共通種類特定部13から、共通の種類の特定結果を取得する。
特徴量抽出部14は、複数の特徴量抽出方法の中から、特定結果が示す種類についての特徴量を抽出することが可能な特徴量抽出方法を選択する(図4のステップST3)。
図6は、特徴量の種類に対応する特徴量抽出方法の一例を示す説明図である。
図6の例では、共通の種類が“色”であれば、特徴量抽出方法として、CNN(Convolutional Neural Network)(1)を用いることができる。
共通の種類が、“シルエット”又は“テクスチャ”であれば、特徴量抽出方法として、CNN(1)、CNN(2)、又は、HOG(Histogram of Oriented Gradients)を用いることができる。
共通の種類が“温度”であれば、特徴量抽出方法として、CNN(2)を用いることができる。
例えば、共通の種類が“色”であれば、CNN(1)は、学習時において、入力データとして、カラー画像を示す画像データが与えられ、かつ、学習データとして、当該カラー画像から抽出された“色”についての特徴量が与えられれば、“色”についての特徴量を学習する学習モデルである。CNN(1)は、推論時において、入力データとして、カラー画像を示す画像データが与えられれば、当該画像データに対応する“色”についての特徴量を出力する。
例えば、共通の種類が“温度”であれば、CNN(2)は、学習時において、入力データとして、グレースケールの赤外画像を示す画像データが与えられ、かつ、学習データとして、当該赤外画像から抽出された特徴量が与えられれば、“温度”についての特徴量を学習する学習モデルである。CNN(2)は、推論時において、入力データとして、赤外画像を示す画像データが与えられれば、当該画像データに対応する“温度”についての特徴量を出力する。
特徴量抽出部14は、例えば、共通の種類が“色”であれば、CNN(1)、CNN(2)及びHOGの中から、CNN(1)を選択する。
特徴量抽出部14は、例えば、共通の種類が、“シルエット”又は“テクスチャ”であれば、CNN(1)、CNN(2)及びHOGの中から、CNN(1)、CNN(2)、又は、HOGのいずれかを選択する。
特徴量抽出部14は、例えば、共通の種類が“温度”であれば、CNN(1)、CNN(2)及びHOGの中から、CNN(2)を選択する。
特徴量抽出部14は、選択した特徴量抽出方法を用いて、それぞれの画像データが示す画像から、共通種類特定部13により特定された種類についての特徴量を抽出する(図4のステップST4)。
特徴量抽出部14は、それぞれの特徴量をデータ保持部12に出力する。
データ保持部12は、特徴量抽出部14から出力されたそれぞれの特徴量を保持する。
ユーザがクエリ画像に映っている被写体と同じ被写体が映っているギャラリ画像の検索を希望する場合、ユーザは、マンマシンインタフェース部3を操作して、画像検索処理の実行を要求する。
マンマシンインタフェース部3は、画像検索処理の実行要求を受け付けて、画像検索処理の実行要求をクエリ画像選択部15に出力する。
クエリ画像選択部15は、マンマシンインタフェース部3から画像検索処理の実行要求が出力されたとき、データ保持部12に保持されている全ての画像データをマンマシンインタフェース部3に出力する。
マンマシンインタフェース部3は、クエリ画像選択部15から、全ての画像データを取得し、それぞれの画像データが示す画像をディスプレイに表示させる。
ユーザは、マンマシンインタフェース部3を操作して、ディスプレイに表示されている全ての画像の中から、クエリ画像を選択する。
マンマシンインタフェース部3は、クエリ画像の選択を受け付け、選択したクエリ画像を示す選択信号をクエリ画像選択部15に出力する。
クエリ画像選択部15は、クエリ画像を示す選択信号を画像検索部16に出力する。
画像検索部16は、クエリ画像選択部15から、選択信号を取得する。
画像検索部16は、データ保持部12に保持されている複数の特徴量の中から、選択信号が示すクエリ画像から抽出された特徴量を取得する。
また、画像検索部16は、データ保持部12に保持されている複数の特徴量の中から、選択信号が示すクエリ画像以外の画像であるそれぞれのギャラリ画像から抽出された特徴量を取得する。
画像検索部16は、クエリ画像の特徴量と、それぞれのギャラリ画像の特徴量とを比較する。
画像検索部16は、特徴量の比較結果に基づいて、クエリ画像に映っている被写体と同じ被写体が映っているギャラリ画像を検索する(図4のステップST5)。
以下、画像検索部16によるギャラリ画像の検索処理を具体的に説明する。
ここでは、説明の便宜上、データ保持部12に保持されているギャラリ画像の数がM(Mは、1以上の整数)個であり、ギャラリ画像G(m=1,・・・,M)から抽出された特徴量がFgであるとする。また、クエリ画像Qから抽出された特徴量がFqであるとする。
画像検索部16は、クエリ画像Qから抽出された特徴量Fqと、ギャラリ画像Gから抽出された特徴量Fgとの比較結果として、クエリ画像Qから抽出された特徴量Fqとギャラリ画像Gから抽出された特徴量Fgとの類似度Sq,gmを算出する。
類似度Sq,gmの算出方法としては、例えば、クエリ画像Qから抽出された特徴量Fqとギャラリ画像Gから抽出された特徴量Fgとのユークリッド距離を算出する方法のほか、クエリ画像Qから抽出された特徴量Fqとギャラリ画像Gから抽出された特徴量Fgとのコサイン類似度を算出する方法がある。
画像検索部16は、クエリ画像Qに映っている被写体と同じ被写体が映っているギャラリ画像として、M個のギャラリ画像G~Gの中で、特徴量Fqとの類似度Sq,gmが閾値Thよりも大きいギャラリ画像Gを検索する。閾値Thは、画像検索部16の内部メモリに格納されていてもよいし、画像検索装置2の外部から与えられるものであってもよい。j=1,・・・,Jであり、Jは、0以上、M以下の整数である。
画像検索部16は、クエリ画像Qに映っている被写体と同じ被写体が映っているギャラリ画像を示す画像データとして、特徴量Fqとの類似度Sq,gmが閾値Thよりも大きいギャラリ画像Gを示す画像データを図示せぬ監視装置等に出力する。
また、画像検索部16は、特徴量Fqとの類似度Sq,gmが閾値Thよりも大きいギャラリ画像Gを示す画像データをマンマシンインタフェース部3に出力する。
マンマシンインタフェース部3は、ギャラリ画像Gをディスプレイに表示させる。ギャラリ画像Gがディスプレイに表示されることで、被写体である人物の追跡が可能になる。
以上の実施の形態1では、カメラ1-n(n=1,・・・,N)により撮影された複数の画像のそれぞれを示す画像データと、それぞれの画像を撮影したカメラの種類を示す識別データとを取得するデータ取得部11と、データ取得部11により取得されたそれぞれの識別データが示すカメラの種類に基づいて、それぞれの画像から抽出可能な特徴量の種類において共通している種類を特定する共通種類特定部13とを備えるように、画像検索装置2を構成した。また、画像検索装置2は、データ取得部11により取得されたそれぞれの画像データが示す画像から、共通種類特定部13により特定された種類についての特徴量を抽出する特徴量抽出部14と、特徴量抽出部14により抽出された複数の特徴量のうち、複数の画像に含まれているいずれか1つの画像であるクエリ画像から抽出された特徴量と、複数の画像に含まれているクエリ画像以外の画像である1つ以上のギャラリ画像のそれぞれから抽出された特徴量とを比較し、特徴量の比較結果に基づいて、クエリ画像に映っている被写体と同じ被写体が映っているギャラリ画像を検索する画像検索部16とを備えている。したがって、画像検索装置2は、クエリ画像を撮影したカメラと、ギャラリ画像を撮影したカメラとが異なる種類のカメラであっても、クエリ画像に映っている被写体と同じ被写体が映っているギャラリ画像を検索することができる。
図1に示す画像検索装置2では、データ取得部11が、カメラ1-nから識別データを取得している。しかし、これは一例に過ぎず、データ取得部11が、カメラ1-nから取得した画像データに基づいて、カメラの種類を識別するようにしてもよい。
データ取得部11は、例えば、画像データの拡張子、又は、画像データのデータ配列に基づいて、カメラの種類を識別することができる。この場合、データ取得部11は、種類の識別結果を示すデータを識別データとしてデータ保持部12に出力する。
可視カメラにより撮影された画像を示す画像データの拡張子としては、例えば、“.crw”、又は、“.arw”がある。デプスカメラにより撮影された画像を示す画像データの拡張子としては、例えば、“.heif”、又は、“.heic”がある。赤外カメラにより撮影された画像を示す画像データの拡張子としては、例えば、“.iri”、又は、“.six”がある。LiDARにより撮影された画像を示す画像データの拡張子としては、例えば、“.obj”、又は、“.dxf”がある。
実施の形態2.
実施の形態2では、特徴量抽出部14により抽出されたそれぞれの特徴量を圧縮する特徴量圧縮部17を備えている画像検索装置2を説明する。
図7は、実施の形態2に係る画像検索装置2を示す構成図である。図7において、図1と同一符号は同一又は相当部分を示すので説明を省略する。
図8は、実施の形態2に係る画像検索装置2のハードウェアを示すハードウェア構成図である。図8において、図2と同一符号は同一又は相当部分を示すので説明を省略する。
図7に示す画像検索装置2は、データ取得部11、データ保持部12、共通種類特定部13、特徴量抽出部14、特徴量圧縮部17、クエリ画像選択部15及び画像検索部18を備えている。
特徴量圧縮部17は、例えば、図8に示す特徴量圧縮回路27によって実現される。
特徴量圧縮部17は、特徴量抽出部14により抽出されたそれぞれの特徴量を圧縮し、それぞれの圧縮後の特徴量をデータ保持部12に出力する。
データ保持部12は、特徴量抽出部14により抽出された特徴量を保持する代わりに、特徴量圧縮部17による圧縮後の特徴量を保持する。
画像検索部18は、例えば、図8に示す画像検索回路28によって実現される。
画像検索部18は、データ保持部12に保持されている複数の圧縮後の特徴量の中から、クエリ画像選択部15から出力された選択信号が示すクエリ画像に係る圧縮後の特徴量を取得する。
画像検索部18は、選択信号が示すクエリ画像に係る圧縮後の特徴量と、データ保持部12に保持されているそれぞれのギャラリ画像に係る圧縮後の特徴量とを比較する。
画像検索部18は、圧縮後の特徴量の比較結果に基づいて、クエリ画像に映っている被写体と同じ被写体が映っているギャラリ画像を検索する。
画像検索部18は、例えば、検索したギャラリ画像をマンマシンインタフェース部3に出力する。
図7では、画像検索装置2の構成要素であるデータ取得部11、データ保持部12、共通種類特定部13、特徴量抽出部14、特徴量圧縮部17、クエリ画像選択部15及び画像検索部18のそれぞれが、図8に示すような専用のハードウェアによって実現されるものを想定している。即ち、画像検索装置2が、データ取得回路21、データ保持回路22、共通種類特定回路23、特徴量抽出回路24、特徴量圧縮回路27、クエリ画像選択回路25及び画像検索回路28によって実現されるものを想定している。
データ保持回路22は、例えば、RAM、ROM、フラッシュメモリ、EPROM、EEPROM等の不揮発性又は揮発性の半導体メモリ、磁気ディスク、フレキシブルディスク、光ディスク、コンパクトディスク、ミニディスク、あるいは、DVDが該当する。
また、データ取得回路21、共通種類特定回路23、特徴量抽出回路24、特徴量圧縮回路27、クエリ画像選択回路25及び画像検索回路28のそれぞれは、例えば、単一回路、複合回路、プログラム化したプロセッサ、並列プログラム化したプロセッサ、ASIC、FPGA、又は、これらを組み合わせたものが該当する。
画像検索装置2の構成要素は、専用のハードウェアによって実現されるものに限るものではなく、画像検索装置2が、ソフトウェア、ファームウェア、又は、ソフトウェアとファームウェアとの組み合わせによって実現されるものであってもよい。
画像検索装置2が、ソフトウェア又はファームウェア等によって実現される場合、データ保持部12が図3に示すメモリ41上に構成される。データ取得部11、共通種類特定部13、特徴量抽出部14、特徴量圧縮部17、クエリ画像選択部15及び画像検索部18におけるそれぞれの処理手順をコンピュータに実行させるための画像検索プログラムが図3に示すメモリ41に格納される。そして、図3に示すプロセッサ42がメモリ41に格納されている画像検索プログラムを実行する。
また、図8では、画像検索装置2の構成要素のそれぞれが専用のハードウェアによって実現される例を示し、図3では、画像検索装置2がソフトウェア又はファームウェア等によって実現される例を示している。しかし、これは一例に過ぎず、画像検索装置2における一部の構成要素が専用のハードウェアによって実現され、残りの構成要素がソフトウェア又はファームウェア等によって実現されるものであってもよい。
次に、図7に示す画像検索装置2の動作について説明する。特徴量圧縮部17及び画像検索部18以外は、図1に示す画像検索装置2と同様である。このため、ここでは、特徴量圧縮部17及び画像検索部18の動作のみを説明する。
特徴量圧縮部17は、特徴量抽出部14により抽出されたそれぞれの特徴量を取得する。
特徴量圧縮部17は、スパースコーディング等の圧縮方法によって、それぞれの特徴量を圧縮する。
特徴量圧縮部17は、それぞれの圧縮後の特徴量をデータ保持部12に出力する。
データ保持部12は、特徴量圧縮部17によるそれぞれの圧縮後の特徴量を保持する。
画像検索部18は、マンマシンインタフェース部3から出力された選択信号を取得する。
画像検索部18は、データ保持部12に保持されている複数の圧縮後の特徴量の中から、選択信号が示すクエリ画像に係る圧縮後の特徴量を取得する。
また、画像検索部18は、データ保持部12に保持されている複数の圧縮後の特徴量の中から、選択信号が示すクエリ画像以外の画像であるそれぞれのギャラリ画像に係る圧縮後の特徴量を取得する。
画像検索部18は、クエリ画像に係る圧縮後の特徴量と、それぞれのギャラリ画像に係る圧縮後の特徴量とを比較する。
画像検索部18は、圧縮後の特徴量の比較結果に基づいて、クエリ画像に映っている被写体と同じ被写体が映っているギャラリ画像を検索する。
以下、画像検索部18によるギャラリ画像の検索処理を具体的に説明する。
ここでは、説明の便宜上、データ保持部12に保持されているギャラリ画像の数がM(Mは、1以上の整数)個であり、ギャラリ画像G(m=1,・・・,M)に係る圧縮後の特徴量がCFgであるとする。また、クエリ画像Qに係る圧縮後の特徴量がCFqであるとする。
画像検索部18は、クエリ画像Qに係る圧縮後の特徴量CFqと、ギャラリ画像Gに係る圧縮後の特徴量CFgとの比較結果として、クエリ画像Qに係る圧縮後の特徴量CFqとギャラリ画像Gに係る圧縮後の特徴量CFgとの類似度CSq,gmを算出する。
類似度CSq,gmの算出方法としては、例えば、クエリ画像Qに係る圧縮後の特徴量CFqとギャラリ画像Gに係る圧縮後の特徴量CFgとのユークリッド距離を算出する方法のほか、クエリ画像Qに係る圧縮後の特徴量CFqとギャラリ画像Gに係る圧縮後の特徴量CFgとのコサイン類似度を算出する方法がある。
画像検索部18は、クエリ画像Qに映っている被写体と同じ被写体が映っているギャラリ画像として、M個のギャラリ画像G~Gの中で、特徴量CFqとの類似度CSq,gmが閾値Thcよりも大きいギャラリ画像Gを検索する。閾値Thcは、画像検索部18の内部メモリに格納されていてもよいし、画像検索装置2の外部から与えられるものであってもよい。j=1,・・・,Jであり、Jは、0以上、M以下の整数である。
画像検索部18は、クエリ画像Qに映っている被写体と同じ被写体が映っているギャラリ画像を示す画像データとして、特徴量CFqとの類似度CSq,gmが閾値Thcよりも大きいギャラリ画像Gを示す画像データを図示せぬ監視装置等に出力する。
また、画像検索部18は、特徴量CFqとの類似度CSq,gmが閾値Thcよりも大きいギャラリ画像Gを示す画像データをマンマシンインタフェース部3に出力する。
マンマシンインタフェース部3は、ギャラリ画像Gをディスプレイに表示させる。
以上の実施の形態2では、特徴量抽出部14により抽出されたそれぞれの特徴量を圧縮する特徴量圧縮部17を備え、画像検索部18が、特徴量圧縮部17による複数の圧縮後の特徴量のうち、クエリ画像に係る圧縮後の特徴量と、それぞれのギャラリ画像に係る圧縮後の特徴量とを比較し、圧縮後の特徴量の比較結果に基づいて、クエリ画像に映っている被写体と同じ被写体が映っているギャラリ画像を検索するように、図7に示す画像検索装置2を構成した。したがって、図7に示す画像検索装置2は、図1に示す画像検索装置2と同様に、クエリ画像を撮影したカメラと、ギャラリ画像を撮影したカメラとが異なる種類のカメラであっても、クエリ画像に映っている被写体と同じ被写体が映っているギャラリ画像を検索することができる。また、画像検索部18における比較処理の演算量が、図1に示す画像検索部16における比較処理の演算量よりも削減される。
実施の形態3.
実施の形態3では、認証装置4から取得した認証情報とカメラ1-nにより撮影された画像との紐づけを行うデータ取得部19を備える画像検索装置2について説明する。
図9は、実施の形態3に係る画像検索装置2を示す構成図である。図9において、図1及び図7と同一符号は同一又は相当部分を示すので説明を省略する。
図10は、実施の形態3に係る画像検索装置2のハードウェアを示すハードウェア構成図である。図10において、図2及び図8と同一符号は同一又は相当部分を示すので説明を省略する。
認証装置4は、カメラ1-nが設置されている場所に現れた人物によって、例えば、社員証のID(IDentification)カードが近づけられたとき、IDカードから、当該人物の認証情報を取得する。当該人物は、カメラ1-nにより撮影された画像に映っている被写体である。
図9に示す画像検索装置2では、認証装置4が、IDカードから、人物の認証情報を取得している。しかし、これは一例に過ぎず、例えば、認証装置4が、当該人物が所持している携帯端末から、人物の認証情報を取得するようにしてもよい。
認証装置4は、認証情報を画像検索装置2に出力する。
図9に示す画像検索装置2は、データ取得部19、データ保持部12、共通種類特定部13、特徴量抽出部14、クエリ画像選択部15及び画像検索部20を備えている。
図9に示す画像検索装置2では、データ取得部19及び画像検索部20のそれぞれが図1に示す画像検索装置2に適用されている。しかし、これは一例に過ぎず、データ取得部19及び画像検索部20のそれぞれが図7に示す画像検索装置2に適用されているものであってもよい。
データ取得部19は、例えば、図10に示すデータ取得回路29によって実現される。
データ取得部19は、図1に示すデータ取得部11と同様に、カメラ1-n(n=1,・・・,N)により撮影された画像を示す画像データと、カメラの種類を示す識別データとを取得する。
データ取得部19は、認証装置4から認証情報を取得し、認証情報とカメラ1-nにより撮影された画像との紐づけを行う。
データ取得部19は、画像データ及び識別データのそれぞれをデータ保持部12に出力する。
画像検索部20は、例えば、図10に示す画像検索回路30によって実現される。
画像検索部20は、図1に示す画像検索部16と同様に、データ保持部12に保持されている複数の特徴量の中から、クエリ画像から抽出された特徴量として、クエリ画像選択部15から出力された選択信号が示すクエリ画像から抽出された特徴量を取得する。
画像検索部20は、図1に示す画像検索部16と同様に、選択信号が示すクエリ画像から抽出された特徴量と、データ保持部12に保持されているそれぞれのギャラリ画像の特徴量とを比較する。
画像検索部20は、図1に示す画像検索部16と同様に、特徴量の比較結果に基づいて、クエリ画像に映っている被写体と同じ被写体が映っているギャラリ画像を検索する。
画像検索部20は、図1に示す画像検索部16と異なり、クエリ画像に認証情報が紐づけられていれば、クエリ画像に紐づけられている認証情報と同じ認証情報が紐づけられているギャラリ画像を検索する。
画像検索部20は、例えば、検索したギャラリ画像をマンマシンインタフェース部3に出力する。
図9では、画像検索装置2の構成要素であるデータ取得部19、データ保持部12、共通種類特定部13、特徴量抽出部14、クエリ画像選択部15及び画像検索部20のそれぞれが、図10に示すような専用のハードウェアによって実現されるものを想定している。即ち、画像検索装置2が、データ取得回路29、データ保持回路22、共通種類特定回路23、特徴量抽出回路24、クエリ画像選択回路25及び画像検索回路30によって実現されるものを想定している。
データ保持回路22は、例えば、RAM、ROM、フラッシュメモリ、EPROM、EEPROM等の不揮発性又は揮発性の半導体メモリ、磁気ディスク、フレキシブルディスク、光ディスク、コンパクトディスク、ミニディスク、あるいは、DVDが該当する。
また、データ取得回路29、共通種類特定回路23、特徴量抽出回路24、クエリ画像選択回路25及び画像検索回路30のそれぞれは、例えば、単一回路、複合回路、プログラム化したプロセッサ、並列プログラム化したプロセッサ、ASIC、FPGA、又は、これらを組み合わせたものが該当する。
画像検索装置2の構成要素は、専用のハードウェアによって実現されるものに限るものではなく、画像検索装置2が、ソフトウェア、ファームウェア、又は、ソフトウェアとファームウェアとの組み合わせによって実現されるものであってもよい。
画像検索装置2が、ソフトウェア又はファームウェア等によって実現される場合、データ保持部12がコンピュータのメモリ41上に構成される。データ取得部19、共通種類特定部13、特徴量抽出部14、クエリ画像選択部15及び画像検索部20におけるそれぞれの処理手順をコンピュータに実行させるための画像検索プログラムが図3に示すメモリ41に格納される。そして、図3に示すプロセッサ42がメモリ41に格納されている画像検索プログラムを実行する。
また、図10では、画像検索装置2の構成要素のそれぞれが専用のハードウェアによって実現される例を示し、図3では、画像検索装置2がソフトウェア又はファームウェア等によって実現される例を示している。しかし、これは一例に過ぎず、画像検索装置2における一部の構成要素が専用のハードウェアによって実現され、残りの構成要素がソフトウェア又はファームウェア等によって実現されるものであってもよい。
次に、図9に示す画像検索装置2の動作について説明する。データ取得部19及び画像検索部20以外は、図1に示す画像検索装置2と同様である。このため、ここでは、主に、データ取得部19及び画像検索部20の動作のみを説明する。
N個のカメラ1-1~1-Nのそれぞれが設置されている場所には、認証装置4が設置されていることがある。
例えば、会社内にN個のカメラ1-1~1-Nが設置されているとき、カメラ1-1が設置されている会社の入口に認証装置4が設置され、カメラ1-Nが設置されている会社の出口に認証装置4が設置されていることがある。カメラ1-2~1-(N-1)のそれぞれが設置されている場所には、認証装置4が設置されていないものとする。
このような場合、会社の入口に設置されている認証装置4は、会社の入口に現れた人物によって、IDカードが近づけられると、IDカードから、当該人物の認証情報IDを取得し、認証情報IDを画像検索装置2に出力する。kは、1以上の整数である。認証情報IDは、人物毎に異なるユニークな番号等である。
会社の出口に設置されている認証装置4は、会社の出口に現れた人物によって、IDカードが近づけられると、IDカードから、当該人物の認証情報IDを取得し、認証情報IDを画像検索装置2に出力する。
データ取得部19は、図1に示すデータ取得部11と同様に、カメラ1-n(n=1,・・・,N)により撮影された画像を示す画像データと、カメラの種類を示す識別データとを取得する。
カメラ1-1が設置されている会社の入口に認証装置4が設置されていれば、データ取得部19は、会社の入口に設置されている認証装置4から認証情報IDを取得し、認証情報IDとカメラ1-1により撮影された画像との紐づけを行う。
即ち、データ取得部19は、カメラ1-1により撮影された画像を示す画像データに認証情報IDを付加する。
カメラ1-Nが設置されている会社の出口に認証装置4が設置されていれば、データ取得部19は、会社の出口に設置されている認証装置4から認証情報IDを取得し、認証情報IDとカメラ1-Nにより撮影された画像との紐づけを行う。
即ち、データ取得部19は、カメラ1-Nにより撮影された画像を示す画像データに認証情報IDを付加する。
データ取得部19は、カメラ1-n(n=1,・・・,N)により撮影された画像を示す画像データと、カメラの種類を示す識別データとをデータ保持部12に出力する。
ここでは、カメラ1-1により撮影された画像を示す画像データと、カメラ1-Nにより撮影された画像を示す画像データとには、認証情報IDが付加されており、カメラ1-n(n=2,・・・,N-1)により撮影された画像を示す画像データには、認証情報IDが付加されていない。
データ保持部12は、データ取得部11から出力された画像データ及び識別データのそれぞれを保持する。
画像検索部20は、図1に示す画像検索部16と同様に、クエリ画像選択部15から、クエリ画像を示す選択信号を取得する。
画像検索部20は、図1に示す画像検索部16と同様に、データ保持部12に保持されている複数の特徴量の中から、選択信号が示すクエリ画像から抽出された特徴量を取得する。
また、画像検索部20は、図1に示す画像検索部16と同様に、データ保持部12に保持されている複数の特徴量の中から、それぞれのギャラリ画像から抽出された特徴量を取得する。
画像検索部20は、図1に示す画像検索部16と同様に、クエリ画像の特徴量と、それぞれのギャラリ画像の特徴量とを比較する。
画像検索部20は、図1に示す画像検索部16と同様に、特徴量の比較結果に基づいて、クエリ画像に映っている被写体と同じ被写体が映っているギャラリ画像を検索する。
例えば、クエリ画像がカメラ1-1により撮影された画像であるとき、カメラ1-2,1-Nにより撮影されたギャラリ画像に映っている被写体が、クエリ画像に映っている被写体と同じであることがある。このような場合に、クエリ画像に映っている被写体と同じ被写体が映っているギャラリ画像として、カメラ1-2により撮影されたギャラリ画像のみが検索されることがある。例えば、カメラ1-1,1-2により撮影されたときには、被写体がコートを着ていたが、カメラ1-Nにより撮影されたときには、被写体がコートを着ていないような場合には、クエリ画像に映っている被写体と同じ被写体が映っているギャラリ画像として、カメラ1-2により撮影されたギャラリ画像のみが検索されることがある。
画像検索部20は、クエリ画像を示す画像データに認証情報IDが付加されていれば、データ保持部12に保持されている1つ以上のギャラリ画像が示す画像データの中に、当該認証情報IDと同じ認証情報が付加されている画像データを検索する。
カメラ1-1が設置されている会社の入口に設置されている認証装置4と、カメラ1-Nが設置されている会社の出口に設置されている認証装置4とによって、同じ人物に係る認証情報IDが取得されていれば、カメラ1-2により撮影されたギャラリ画像のほかに、カメラ1-Nにより撮影されたギャラリ画像が検索される。
画像検索部20は、例えば、検索したギャラリ画像をマンマシンインタフェース部3に出力する。
マンマシンインタフェース部3は、検索されたギャラリ画像をディスプレイに表示させる。検索されたギャラリ画像がディスプレイに表示されることで、被写体である人物の追跡が可能になる。
以上の実施の形態3では、データ取得部19が、カメラ1-nが設置されている場所に認証装置4が設置されていれば、認証装置4から、カメラ1-nにより撮影された画像に映っている被写体の認証情報を取得し、認証情報とカメラ1-nにより撮影された画像との紐づけを行うように、図9に示す画像検索装置2を構成した。また、図9に示す画像検索装置2の画像検索部20は、特徴量の比較結果に基づいて、クエリ画像に映っている被写体と同じ被写体が映っているギャラリ画像を検索するほかに、クエリ画像に認証情報が紐づけられていれば、クエリ画像に紐づけられている認証情報と同じ認証情報が紐づけられているギャラリ画像を検索するように構成した。したがって、図9に示す画像検索装置2は、図1に示す画像検索装置2と同様に、クエリ画像を撮影したカメラと、ギャラリ画像を撮影したカメラとが異なる種類のカメラであっても、クエリ画像に映っている被写体と同じ被写体が映っているギャラリ画像を検索することができる。また、カメラ1-1~1-Nのそれぞれによって被写体が撮影されるとき、被写体の服装等が変化しても、クエリ画像に映っている被写体と同じ被写体が映っているギャラリ画像を検索することができる。
実施の形態4.
実施の形態4では、データ取得部11’が、それぞれの画像データが示す画像から、被写体が映っている領域を抽出し、抽出した領域の画像データを出力する画像検索装置2について説明する。
図11は、実施の形態4に係る画像検索装置2を示す構成図である。図11において、図1、図7及び図9と同一符号は同一又は相当部分を示すので説明を省略する。
図12は、実施の形態4に係る画像検索装置2のハードウェアを示すハードウェア構成図である。図12において、図2、図8及び図10と同一符号は同一又は相当部分を示すので説明を省略する。
画像検索装置2は、データ取得部11’、データ保持部12、共通種類特定部13、特徴量抽出部14’、クエリ画像選択部15及び画像検索部16を備えている。
データ取得部11’は、例えば、図12に示すデータ取得回路21’によって実現される。
データ取得部11’は、カメラ1-n(n=1,・・・,N)により撮影された画像を示す画像データと、カメラの種類を示す識別データとを取得する。
データ取得部11’は、それぞれの画像データが示す画像から、被写体が映っている領域を抽出する。
データ取得部11’は、抽出した領域の画像データ及び識別データのそれぞれをデータ保持部12に出力する。
特徴量抽出部14’は、例えば、図12に示す特徴量抽出回路24’によって実現される。
特徴量抽出部14’は、データ保持部12から、データ取得部11’により取得されたそれぞれの画像データを取得する。
特徴量抽出部14’は、それぞれの画像データが示す領域の画像から、共通種類特定部13により特定された種類についての特徴量を抽出する。
特徴量抽出部14’は、それぞれの特徴量をデータ保持部12に出力する。
図11に示す画像検索装置2では、データ取得部11’及び特徴量抽出部14’のそれぞれが図1に示す画像検索装置2に適用されている。しかし、これは一例に過ぎず、データ取得部11’及び特徴量抽出部14’のそれぞれが、図7に示す画像検索装置2、又は、図9に示す画像検索装置2に適用されているものであってもよい。
図11では、画像検索装置2の構成要素であるデータ取得部11’、データ保持部12、共通種類特定部13、特徴量抽出部14’、クエリ画像選択部15及び画像検索部16のそれぞれが、図12に示すような専用のハードウェアによって実現されるものを想定している。即ち、画像検索装置2が、データ取得回路21’、データ保持回路22、共通種類特定回路23、特徴量抽出回路24’、クエリ画像選択回路25及び画像検索回路26によって実現されるものを想定している。
データ取得回路21’、共通種類特定回路23、特徴量抽出回路24’、クエリ画像選択回路25及び画像検索回路26のそれぞれは、例えば、単一回路、複合回路、プログラム化したプロセッサ、並列プログラム化したプロセッサ、ASIC、FPGA、又は、これらを組み合わせたものが該当する。
画像検索装置2の構成要素は、専用のハードウェアによって実現されるものに限るものではなく、画像検索装置2が、ソフトウェア、ファームウェア、又は、ソフトウェアとファームウェアとの組み合わせによって実現されるものであってもよい。
画像検索装置2が、ソフトウェア又はファームウェア等によって実現される場合、データ保持部12がコンピュータのメモリ41上に構成される。データ取得部11’、共通種類特定部13、特徴量抽出部14’、クエリ画像選択部15及び画像検索部16におけるそれぞれの処理手順をコンピュータに実行させるための画像検索プログラムが図3に示すメモリ41に格納される。そして、図3に示すプロセッサ42がメモリ41に格納されている画像検索プログラムを実行する。
また、図12では、画像検索装置2の構成要素のそれぞれが専用のハードウェアによって実現される例を示し、図3では、画像検索装置2がソフトウェア又はファームウェア等によって実現される例を示している。しかし、これは一例に過ぎず、画像検索装置2における一部の構成要素が専用のハードウェアによって実現され、残りの構成要素がソフトウェア又はファームウェア等によって実現されるものであってもよい。
次に、図11に示す画像検索装置2の動作について説明する。データ取得部11’及び特徴量抽出部14’以外は、図1に示す画像検索装置2と同様である。このため、ここでは、データ取得部11’及び特徴量抽出部14’の動作のみを説明する。
データ取得部11’は、カメラ1-n(n=1,・・・,N)から、画像データ及び識別データのそれぞれが出力されると、画像データ及び識別データのそれぞれを取得する。
データ取得部11’は、それぞれの画像データが示す画像から、被写体が映っている領域を抽出する。
被写体が映っている領域の形状は、例えば、矩形である。矩形領域の抽出方法としては、例えば、背景差分のような前景抽出した領域から最大内包矩形を探索する方法のほか、SSD(Single Shot multibox Detector)のような事前学習済みのモデルを利用して、矩形領域を抽出する方法がある。
データ取得部11’が、被写体が映っている領域を抽出することで、特徴量抽出部14’により抽出される特徴量が、概ね被写体の特徴量となる。
データ取得部11’は、抽出した領域の画像データ及び識別データのそれぞれをデータ保持部12に出力する。
データ保持部12は、データ取得部11’から出力された領域の画像データ及び識別データのそれぞれを保持する。
図11に示す画像検索装置2では、データ取得部11’が、被写体が映っている矩形領域を抽出している。しかしながら、データ取得部11’により抽出される領域は、被写体が映っている領域であればよいため、データ取得部11’により抽出される領域の形状は、矩形に限るものではなく、例えば、円形であってもよいし、四角形以外の多角形であってもよい。
特徴量抽出部14’は、データ保持部12から、データ取得部11’により取得された全ての画像データを取得する。
特徴量抽出部14’は、共通種類特定部13から、共通の種類の特定結果を取得する。
特徴量抽出部14’は、図1に示す特徴量抽出部14と同様に、複数の特徴量抽出方法の中から、共通の種類の特徴量を抽出することが可能な特徴量抽出方法を選択する。
特徴量抽出部14’は、選択した特徴量抽出方法を用いて、それぞれの画像データが示す画像から特徴量を抽出する。
特徴量抽出部14’は、それぞれの特徴量をデータ保持部12に出力する。
データ保持部12は、特徴量抽出部14’から出力されたそれぞれの特徴量を保持する。
特徴量抽出部14’により抽出される特徴量は、概ね被写体の特徴量となる。一方、図1に示す特徴量抽出部14により抽出される特徴量は、被写体の特徴量の他に、背景等の特徴量を含んでいる。したがって、図11に示す画像検索部16は、図1に示す画像検索部16よりも、クエリ画像に映っている被写体と同じ被写体が映っているギャラリ画像の検索精度が高まる。
以上の実施の形態4では、データ取得部11’が、それぞれの画像データが示す画像から、被写体が映っている領域を抽出し、領域の画像データを出力するように、図11に示す画像検索装置2を構成した。また、図11に示す画像検索装置2の特徴量抽出部14’は、データ取得部11’から出力されたそれぞれの画像データが示す領域の画像から、共通種類特定部13により特定された種類についての特徴量を抽出するように構成した。したがって、図11に示す画像検索装置2は、図1に示す画像検索装置2と同様に、クエリ画像を撮影したカメラと、ギャラリ画像を撮影したカメラとが異なる種類のカメラであっても、クエリ画像に映っている被写体と同じ被写体が映っているギャラリ画像を検索することができる。また、図11に示す画像検索装置2は、図1に示す画像検索装置2よりも、クエリ画像に映っている被写体と同じ被写体が映っているギャラリ画像の検索精度を高めることができる。
なお、本開示は、各実施の形態の自由な組み合わせ、あるいは各実施の形態の任意の構成要素の変形、もしくは各実施の形態において任意の構成要素の省略が可能である。
本開示は、画像検索装置、画像検索方法及び画像検索プログラムに適している。
1-1~1-N カメラ、2 画像検索装置、3 マンマシンインタフェース部、4 認証装置、11,11’ データ取得部、12 データ保持部、13 共通種類特定部、14,14’ 特徴量抽出部、15 クエリ画像選択部、16 画像検索部、17 特徴量圧縮部、18 画像検索部、19 データ取得部、20 画像検索部、21,21’ データ取得回路、22 データ保持回路、23 共通種類特定回路、24,24’ 特徴量抽出回路、25 クエリ画像選択回路、26 画像検索回路、27 特徴量圧縮回路、28 画像検索回路、29 データ取得回路、30 画像検索回路、41 メモリ、42 プロセッサ。

Claims (8)

  1. カメラにより撮影された複数の画像のそれぞれを示す画像データと、それぞれの画像を撮影したカメラの種類を示す識別データとを取得するデータ取得部と、
    前記データ取得部により取得されたそれぞれの識別データが示すカメラの種類に基づいて、それぞれの画像から抽出可能な特徴量の種類において共通している種類を特定する共通種類特定部と、
    前記データ取得部により取得されたそれぞれの画像データが示す画像から、前記共通種類特定部により特定された種類についての特徴量を抽出する特徴量抽出部と、
    前記特徴量抽出部により抽出された複数の特徴量のうち、前記複数の画像に含まれているいずれか1つの画像であるクエリ画像から抽出された特徴量と、前記複数の画像に含まれているクエリ画像以外の画像である1つ以上のギャラリ画像のそれぞれから抽出された特徴量とを比較し、特徴量の比較結果に基づいて、前記クエリ画像に映っている被写体と同じ被写体が映っているギャラリ画像を検索する画像検索部と
    を備えた画像検索装置。
  2. 前記データ取得部は、
    それぞれの画像を撮影したカメラの種類を示す識別データを取得する代わりに、それぞれの画像データに基づいて、それぞれの画像を撮影したカメラの種類を識別し、前記種類の識別結果を示すデータを前記識別データとして前記共通種類特定部に出力することを特徴とする請求項1記載の画像検索装置。
  3. 前記特徴量抽出部は、
    複数の特徴量抽出方法の中から、前記共通種類特定部により特定された種類についての特徴量を抽出することが可能な特徴量抽出方法を選択し、選択した特徴量抽出方法を用いて、前記データ取得部により取得されたそれぞれの画像データが示す画像から特徴量を抽出することを特徴とする請求項1記載の画像検索装置。
  4. 前記特徴量抽出部により抽出されたそれぞれの特徴量を圧縮する特徴量圧縮部を備え、
    前記画像検索部は、
    前記特徴量圧縮部による複数の圧縮後の特徴量のうち、前記クエリ画像に係る圧縮後の特徴量と、それぞれのギャラリ画像に係る圧縮後の特徴量とを比較し、圧縮後の特徴量の比較結果に基づいて、前記クエリ画像に映っている被写体と同じ被写体が映っているギャラリ画像を検索することを特徴とする請求項1記載の画像検索装置。
  5. 前記データ取得部は、
    前記カメラが設置されている場所に認証装置が設置されていれば、前記認証装置から、前記カメラにより撮影された画像に映っている被写体の認証情報を取得し、前記認証情報と前記カメラにより撮影された画像との紐づけを行い、
    前記画像検索部は、
    特徴量の比較結果に基づいて、前記クエリ画像に映っている被写体と同じ被写体が映っているギャラリ画像を検索するほかに、前記クエリ画像に認証情報が紐づけられていれば、前記クエリ画像に紐づけられている認証情報と同じ認証情報が紐づけられているギャラリ画像を検索することを特徴とする請求項1記載の画像検索装置。
  6. 前記データ取得部は、
    それぞれの画像データが示す画像から、被写体が映っている領域を抽出し、前記領域の画像データを出力し、
    前記特徴量抽出部は、
    前記データ取得部から出力されたそれぞれの画像データが示す領域の画像から、前記共通種類特定部により特定された種類についての特徴量を抽出することを特徴とする請求項1記載の画像検索装置。
  7. データ取得部が、カメラにより撮影された複数の画像のそれぞれを示す画像データと、それぞれの画像を撮影したカメラの種類を示す識別データとを取得し、
    共通種類特定部が、前記データ取得部により取得されたそれぞれの識別データが示すカメラの種類に基づいて、それぞれの画像から抽出可能な特徴量の種類において共通している種類を特定し、
    特徴量抽出部が、前記データ取得部により取得されたそれぞれの画像データが示す画像から、前記共通種類特定部により特定された種類についての特徴量を抽出し、
    画像検索部が、前記特徴量抽出部により抽出された複数の特徴量のうち、前記複数の画像に含まれているいずれか1つの画像であるクエリ画像から抽出された特徴量と、前記複数の画像に含まれているクエリ画像以外の画像である1つ以上のギャラリ画像のそれぞれから抽出された特徴量とを比較し、特徴量の比較結果に基づいて、前記クエリ画像に映っている被写体と同じ被写体が映っているギャラリ画像を検索する
    画像検索方法。
  8. カメラにより撮影された複数の画像のそれぞれを示す画像データと、それぞれの画像を撮影したカメラの種類を示す識別データとを取得するデータ取得処理手順と、
    前記データ取得処理手順で取得されたそれぞれの識別データが示すカメラの種類に基づいて、それぞれの画像から抽出可能な特徴量の種類において共通している種類を特定する共通種類特定処理手順と、
    前記データ取得処理手順で取得されたそれぞれの画像データが示す画像から、前記共通種類特定処理手順で特定された種類についての特徴量を抽出する特徴量抽出処理手順と、
    前記特徴量抽出処理手順で抽出された複数の特徴量のうち、前記複数の画像に含まれているいずれか1つの画像であるクエリ画像から抽出された特徴量と、前記複数の画像に含まれているクエリ画像以外の画像である1つ以上のギャラリ画像のそれぞれから抽出された特徴量とを比較し、特徴量の比較結果に基づいて、前記クエリ画像に映っている被写体と同じ被写体が映っているギャラリ画像を検索する画像検索処理手順と
    をコンピュータに実行させるための画像検索プログラム。
JP2023560266A 2022-02-15 2022-02-15 画像検索装置、画像検索方法及び画像検索プログラム Active JP7395082B1 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2022/005773 WO2023157043A1 (ja) 2022-02-15 2022-02-15 画像検索装置、画像検索方法及び画像検索プログラム

Publications (2)

Publication Number Publication Date
JPWO2023157043A1 JPWO2023157043A1 (ja) 2023-08-24
JP7395082B1 true JP7395082B1 (ja) 2023-12-08

Family

ID=87577699

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023560266A Active JP7395082B1 (ja) 2022-02-15 2022-02-15 画像検索装置、画像検索方法及び画像検索プログラム

Country Status (2)

Country Link
JP (1) JP7395082B1 (ja)
WO (1) WO2023157043A1 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017029784A1 (ja) 2015-08-19 2017-02-23 日本電気株式会社 画像位置合わせシステム、方法および記録媒体
JP2017063266A (ja) 2015-09-24 2017-03-30 富士通株式会社 情報処理方法、情報処理装置、及びプログラム
US20210034842A1 (en) 2019-07-31 2021-02-04 Baidu Usa Llc Method, electronic device, and computer readable medium for image identification

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017029784A1 (ja) 2015-08-19 2017-02-23 日本電気株式会社 画像位置合わせシステム、方法および記録媒体
JP2017063266A (ja) 2015-09-24 2017-03-30 富士通株式会社 情報処理方法、情報処理装置、及びプログラム
US20210034842A1 (en) 2019-07-31 2021-02-04 Baidu Usa Llc Method, electronic device, and computer readable medium for image identification

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
吉田 諭史、外2名,複数の認証技術を組合せた複数カメラでの映像追跡技術,第11回データ工学と情報マネジメントに関するフォーラム (第17回日本データベース学会年次大会) [,日本,2019年04月19日,p.1-5

Also Published As

Publication number Publication date
JPWO2023157043A1 (ja) 2023-08-24
WO2023157043A1 (ja) 2023-08-24

Similar Documents

Publication Publication Date Title
CN106446816B (zh) 人脸识别方法及装置
CN109117714B (zh) 一种同行人员识别方法、装置、***及计算机存储介质
CN109871815B (zh) 一种查询监控信息的方法及装置
US9064171B2 (en) Detection device and method for transition area in space
CN106650662B (zh) 目标对象遮挡检测方法及装置
US9805331B2 (en) Smartphone-based asset management system
CN108933925A (zh) 信息处理装置、信息处理方法以及存储介质
EP3066591A2 (en) Systems and methods for image-feature-based recognition
CN113111844B (zh) 一种作业姿态评估方法、装置、本地终端及可读存储介质
CN108875476B (zh) 自动近红外人脸注册与识别方法、装置和***及存储介质
US11048917B2 (en) Method, electronic device, and computer readable medium for image identification
KR20170077366A (ko) 얼굴 인식 시스템 및 방법
CN108885636A (zh) 车型识别装置、车型识别***以及车型识别方法
AU2011252761B2 (en) Automatic identity enrolment
CN105989174A (zh) 关注区域提取装置以及关注区域提取方法
CN111738349A (zh) 目标检测算法的检测效果评估方法、装置、存储介质及设备
US11537639B2 (en) Re-identification of physical objects in an image background via creation and storage of temporary data objects that link an object to a background
CN106682187B (zh) 用于建立图像底库的方法及装置
CN111078924A (zh) 图像检索方法、装置、终端及存储介质
US20200097735A1 (en) System and Method for Display of Object Movement Scheme
JP7395082B1 (ja) 画像検索装置、画像検索方法及び画像検索プログラム
JP6729678B2 (ja) 情報処理装置、容疑者情報生成方法及びプログラム
US11080173B2 (en) Boundary search test support device and boundary search test support method
De Marsico et al. ES-RU: an e ntropy based rule to s elect r epresentative templates in face su rveillance
JP2019083532A (ja) 画像処理システム、画像処理方法および画像処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230929

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20230929

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20231031

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20231128

R150 Certificate of patent or registration of utility model

Ref document number: 7395082

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150