JP7395082B1 - 画像検索装置、画像検索方法及び画像検索プログラム - Google Patents
画像検索装置、画像検索方法及び画像検索プログラム Download PDFInfo
- Publication number
- JP7395082B1 JP7395082B1 JP2023560266A JP2023560266A JP7395082B1 JP 7395082 B1 JP7395082 B1 JP 7395082B1 JP 2023560266 A JP2023560266 A JP 2023560266A JP 2023560266 A JP2023560266 A JP 2023560266A JP 7395082 B1 JP7395082 B1 JP 7395082B1
- Authority
- JP
- Japan
- Prior art keywords
- image
- unit
- feature
- data
- camera
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 42
- 238000000605 extraction Methods 0.000 claims abstract description 94
- 239000000284 extract Substances 0.000 claims abstract description 22
- 230000006835 compression Effects 0.000 claims description 23
- 238000007906 compression Methods 0.000 claims description 23
- 238000010586 diagram Methods 0.000 description 22
- 238000013527 convolutional neural network Methods 0.000 description 18
- 238000009434 installation Methods 0.000 description 5
- 239000002131 composite material Substances 0.000 description 4
- 239000000470 constituent Substances 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000012806 monitoring device Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/56—Information retrieval; Database structures therefor; File system structures therefor of still image data having vectorial format
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
Description
当該画像検索装置は、複数のギャラリ画像のそれぞれから抽出された特徴量を保持する特徴テーブルを備えている。また、当該画像検索装置は、クエリ画像から特徴量を抽出する画像特徴抽出部と、特徴テーブルに保持されているそれぞれの特徴量と画像特徴抽出部により抽出された特徴量とを照合することで、複数のギャラリ画像の中から、クエリ画像に映っている被写体と同じ被写体が映っているギャラリ画像を検索する特徴照合部とを備えている。
図1は、実施の形態1に係る画像検索装置2を示す構成図である。
図2は、実施の形態1に係る画像検索装置2のハードウェアを示すハードウェア構成図である。
図1において、カメラ1-1~1-Nのそれぞれは、互いに異なる場所に設置されている。Nは、2以上の整数である。
カメラ1-n(n=1,・・・,N)は、設置場所に現れた人物を被写体として撮影し、被写体が映っている画像を示す画像データを画像検索装置2に出力する。
また、カメラ1-nは、カメラの種類を示す識別データを画像検索装置2に出力する。
ここでは、カメラ1-nが、設置場所に現れた人物を被写体として撮影している。しかし、これは一例に過ぎず、カメラ1-nが、例えば、設置場所に現れたロボット、又は、設置場所に現れた動物を被写体として撮影するようにしてもよい。
画像検索装置2は、クエリ画像に映っている被写体と同じ被写体が映っているギャラリ画像を検索する装置である。
マンマシンインタフェース部3は、タッチパネル等のマンマシンインタフェースを備えている。
マンマシンインタフェース部3は、クエリ画像の選択を受け付け、選択したクエリ画像を示す選択信号を画像検索装置2に出力する。
また、マンマシンインタフェース部3は、画像検索装置2により検索されたギャラリ画像を表示する。
データ取得部11は、カメラ1-n(n=1,・・・,N)により撮影された画像を示す画像データと、カメラ1-nの種類を示す識別データとを取得する。
データ取得部11は、画像データ及び識別データのそれぞれをデータ保持部12に出力する。
データ保持部12は、データ取得部11から出力された画像データ及び識別データのそれぞれを保持する。
また、データ保持部12は、特徴量抽出部14により抽出された特徴量を保持する。
共通種類特定部13は、データ保持部12から、データ取得部11により取得されたそれぞれの識別データを取得する。
共通種類特定部13は、それぞれの識別データが示すカメラ1-n(n=1,・・・,N)の種類に基づいて、それぞれの画像から抽出可能な特徴量の種類において共通している種類を特定する。
共通種類特定部13は、共通の種類の特定結果を特徴量抽出部14に出力する。
特徴量抽出部14は、データ保持部12から、データ取得部11により取得されたそれぞれの画像データを取得する。
特徴量抽出部14は、それぞれの画像データが示す画像から、共通種類特定部13により特定された種類についての特徴量を抽出する。
特徴量抽出部14は、それぞれの特徴量をデータ保持部12に出力する。
クエリ画像選択部15は、データ保持部12に保持されているそれぞれの画像データが示す画像をマンマシンインタフェース部3のタッチパネルに表示させる。
クエリ画像選択部15は、マンマシンインタフェース部3により選択が受け付けられたクエリ画像を示す選択信号を取得する。
クエリ画像選択部15は、クエリ画像を示す選択信号を画像検索部16に出力する。
画像検索部16は、データ保持部12に保持されている複数の特徴量の中から、クエリ画像から抽出された特徴量として、クエリ画像選択部15から出力された選択信号が示すクエリ画像から抽出された特徴量を取得する。
画像検索部16は、選択信号が示すクエリ画像から抽出された特徴量と、データ保持部12に保持されているそれぞれのギャラリ画像の特徴量とを比較する。ギャラリ画像は、データ保持部12に保持されている複数の画像のうち、クエリ画像以外の画像である。
画像検索部16は、特徴量の比較結果に基づいて、クエリ画像に映っている被写体と同じ被写体が映っているギャラリ画像を検索する。
画像検索部16は、例えば、検索したギャラリ画像をマンマシンインタフェース部3に出力する。
また、データ取得回路21、共通種類特定回路23、特徴量抽出回路24、クエリ画像選択回路25及び画像検索回路26のそれぞれは、例えば、単一回路、複合回路、プログラム化したプロセッサ、並列プログラム化したプロセッサ、ASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)、又は、これらを組み合わせたものが該当する。
ソフトウェア又はファームウェアは、プログラムとして、コンピュータのメモリに格納される。コンピュータは、プログラムを実行するハードウェアを意味し、例えば、CPU(Central Processing Unit)、中央処理装置、処理装置、演算装置、マイクロプロセッサ、マイクロコンピュータ、プロセッサ、あるいは、DSP(Digital Signal Processor)が該当する。
図3は、画像検索装置2が、ソフトウェア又はファームウェア等によって実現される場合のコンピュータのハードウェア構成図である。
図4は、画像検索装置2の処理手順である画像検索方法を示すフローチャートである。画像検索装置2の処理手順には、データ取得処理手順と、共通種類特定処理手順と、特徴量抽出処理手順と、画像検索処理手順とが含まれている。
カメラ1-nは、被写体が映っている画像を示す画像データを画像検索装置2に出力する。
N個のカメラ1-1~1-Nは、互いに異なる種類のカメラであってもよいし、同一種類のカメラであってもよい。
カメラ1-nとしては、例えば、可視カメラ、デプスカメラ、赤外カメラ、又は、LiDAR(Light Detection And Ranging)がある。
また、カメラ1-nは、カメラの種類を示す識別データを画像検索装置2に出力する。
識別データは、カメラ1-nが例えば可視カメラであれば、可視カメラであることを示し、カメラ1-nが例えばデプスカメラであれば、デプスカメラであることを示すデータである。また、識別データは、カメラ1-nが例えば赤外カメラであれば、赤外カメラであることを示し、カメラ1-nが例えばLiDARであれば、LiDARであることを示すデータである。
データ取得部11は、画像データ及び識別データのそれぞれをデータ保持部12に出力する。
データ保持部12は、データ取得部11から出力された画像データ及び識別データのそれぞれを保持する。
共通種類特定部13は、それぞれの識別データが示すカメラ1-n(n=1,・・・,N)の種類に基づいて、それぞれの画像から抽出可能な特徴量の種類において共通している種類を特定する(図4のステップST2)。
図5の例では、可視カメラにより撮影された画像及びデプスカメラにより撮影された画像のそれぞれから抽出可能な特徴量の種類が、色、シルエット、又は、テクスチャであることを示している。
また、赤外カメラにより撮影された画像から抽出可能な特徴量の種類が、シルエット、テクスチャ、又は、温度であることを示している。
LiDARにより撮影された画像から抽出可能な特徴量の種類が、シルエット、又は、テクスチャであることを示している。
したがって、例えば、N=2であるとき、カメラ1-1が可視カメラであって、カメラ1-2がデプスカメラであれば、共通種類特定部13は、それぞれのカメラにより撮影された画像から抽出可能な特徴量の種類において共通している種類が、“色”、“シルエット”、又は、“テクスチャ”であると特定する。
例えば、N=3であるとき、カメラ1-1が可視カメラであって、カメラ1-2がデプスカメラ、カメラ1-2が赤外カメラであれば、共通種類特定部13は、それぞれのカメラにより撮影された画像から抽出可能な特徴量の種類において共通している種類が、“シルエット”、又は、“テクスチャ”であると特定する。
共通種類特定部13は、共通の種類の特定結果を特徴量抽出部14に出力する。
特徴量抽出部14は、共通種類特定部13から、共通の種類の特定結果を取得する。
特徴量抽出部14は、複数の特徴量抽出方法の中から、特定結果が示す種類についての特徴量を抽出することが可能な特徴量抽出方法を選択する(図4のステップST3)。
図6の例では、共通の種類が“色”であれば、特徴量抽出方法として、CNN(Convolutional Neural Network)(1)を用いることができる。
共通の種類が、“シルエット”又は“テクスチャ”であれば、特徴量抽出方法として、CNN(1)、CNN(2)、又は、HOG(Histogram of Oriented Gradients)を用いることができる。
共通の種類が“温度”であれば、特徴量抽出方法として、CNN(2)を用いることができる。
例えば、共通の種類が“温度”であれば、CNN(2)は、学習時において、入力データとして、グレースケールの赤外画像を示す画像データが与えられ、かつ、学習データとして、当該赤外画像から抽出された特徴量が与えられれば、“温度”についての特徴量を学習する学習モデルである。CNN(2)は、推論時において、入力データとして、赤外画像を示す画像データが与えられれば、当該画像データに対応する“温度”についての特徴量を出力する。
特徴量抽出部14は、例えば、共通の種類が、“シルエット”又は“テクスチャ”であれば、CNN(1)、CNN(2)及びHOGの中から、CNN(1)、CNN(2)、又は、HOGのいずれかを選択する。
特徴量抽出部14は、例えば、共通の種類が“温度”であれば、CNN(1)、CNN(2)及びHOGの中から、CNN(2)を選択する。
特徴量抽出部14は、それぞれの特徴量をデータ保持部12に出力する。
データ保持部12は、特徴量抽出部14から出力されたそれぞれの特徴量を保持する。
マンマシンインタフェース部3は、画像検索処理の実行要求を受け付けて、画像検索処理の実行要求をクエリ画像選択部15に出力する。
クエリ画像選択部15は、マンマシンインタフェース部3から画像検索処理の実行要求が出力されたとき、データ保持部12に保持されている全ての画像データをマンマシンインタフェース部3に出力する。
マンマシンインタフェース部3は、クエリ画像選択部15から、全ての画像データを取得し、それぞれの画像データが示す画像をディスプレイに表示させる。
ユーザは、マンマシンインタフェース部3を操作して、ディスプレイに表示されている全ての画像の中から、クエリ画像を選択する。
マンマシンインタフェース部3は、クエリ画像の選択を受け付け、選択したクエリ画像を示す選択信号をクエリ画像選択部15に出力する。
クエリ画像選択部15は、クエリ画像を示す選択信号を画像検索部16に出力する。
画像検索部16は、データ保持部12に保持されている複数の特徴量の中から、選択信号が示すクエリ画像から抽出された特徴量を取得する。
また、画像検索部16は、データ保持部12に保持されている複数の特徴量の中から、選択信号が示すクエリ画像以外の画像であるそれぞれのギャラリ画像から抽出された特徴量を取得する。
画像検索部16は、クエリ画像の特徴量と、それぞれのギャラリ画像の特徴量とを比較する。
画像検索部16は、特徴量の比較結果に基づいて、クエリ画像に映っている被写体と同じ被写体が映っているギャラリ画像を検索する(図4のステップST5)。
以下、画像検索部16によるギャラリ画像の検索処理を具体的に説明する。
画像検索部16は、クエリ画像Qから抽出された特徴量Fqと、ギャラリ画像Gmから抽出された特徴量Fgmとの比較結果として、クエリ画像Qから抽出された特徴量Fqとギャラリ画像Gmから抽出された特徴量Fgmとの類似度Sq,gmを算出する。
類似度Sq,gmの算出方法としては、例えば、クエリ画像Qから抽出された特徴量Fqとギャラリ画像Gmから抽出された特徴量Fgmとのユークリッド距離を算出する方法のほか、クエリ画像Qから抽出された特徴量Fqとギャラリ画像Gmから抽出された特徴量Fgmとのコサイン類似度を算出する方法がある。
画像検索部16は、クエリ画像Qに映っている被写体と同じ被写体が映っているギャラリ画像として、M個のギャラリ画像G1~GMの中で、特徴量Fqとの類似度Sq,gmが閾値Thよりも大きいギャラリ画像Gjを検索する。閾値Thは、画像検索部16の内部メモリに格納されていてもよいし、画像検索装置2の外部から与えられるものであってもよい。j=1,・・・,Jであり、Jは、0以上、M以下の整数である。
また、画像検索部16は、特徴量Fqとの類似度Sq,gmが閾値Thよりも大きいギャラリ画像Gjを示す画像データをマンマシンインタフェース部3に出力する。
マンマシンインタフェース部3は、ギャラリ画像Gjをディスプレイに表示させる。ギャラリ画像Gjがディスプレイに表示されることで、被写体である人物の追跡が可能になる。
データ取得部11は、例えば、画像データの拡張子、又は、画像データのデータ配列に基づいて、カメラの種類を識別することができる。この場合、データ取得部11は、種類の識別結果を示すデータを識別データとしてデータ保持部12に出力する。
可視カメラにより撮影された画像を示す画像データの拡張子としては、例えば、“.crw”、又は、“.arw”がある。デプスカメラにより撮影された画像を示す画像データの拡張子としては、例えば、“.heif”、又は、“.heic”がある。赤外カメラにより撮影された画像を示す画像データの拡張子としては、例えば、“.iri”、又は、“.six”がある。LiDARにより撮影された画像を示す画像データの拡張子としては、例えば、“.obj”、又は、“.dxf”がある。
実施の形態2では、特徴量抽出部14により抽出されたそれぞれの特徴量を圧縮する特徴量圧縮部17を備えている画像検索装置2を説明する。
図8は、実施の形態2に係る画像検索装置2のハードウェアを示すハードウェア構成図である。図8において、図2と同一符号は同一又は相当部分を示すので説明を省略する。
特徴量圧縮部17は、例えば、図8に示す特徴量圧縮回路27によって実現される。
特徴量圧縮部17は、特徴量抽出部14により抽出されたそれぞれの特徴量を圧縮し、それぞれの圧縮後の特徴量をデータ保持部12に出力する。
データ保持部12は、特徴量抽出部14により抽出された特徴量を保持する代わりに、特徴量圧縮部17による圧縮後の特徴量を保持する。
画像検索部18は、データ保持部12に保持されている複数の圧縮後の特徴量の中から、クエリ画像選択部15から出力された選択信号が示すクエリ画像に係る圧縮後の特徴量を取得する。
画像検索部18は、選択信号が示すクエリ画像に係る圧縮後の特徴量と、データ保持部12に保持されているそれぞれのギャラリ画像に係る圧縮後の特徴量とを比較する。
画像検索部18は、圧縮後の特徴量の比較結果に基づいて、クエリ画像に映っている被写体と同じ被写体が映っているギャラリ画像を検索する。
画像検索部18は、例えば、検索したギャラリ画像をマンマシンインタフェース部3に出力する。
また、データ取得回路21、共通種類特定回路23、特徴量抽出回路24、特徴量圧縮回路27、クエリ画像選択回路25及び画像検索回路28のそれぞれは、例えば、単一回路、複合回路、プログラム化したプロセッサ、並列プログラム化したプロセッサ、ASIC、FPGA、又は、これらを組み合わせたものが該当する。
画像検索装置2が、ソフトウェア又はファームウェア等によって実現される場合、データ保持部12が図3に示すメモリ41上に構成される。データ取得部11、共通種類特定部13、特徴量抽出部14、特徴量圧縮部17、クエリ画像選択部15及び画像検索部18におけるそれぞれの処理手順をコンピュータに実行させるための画像検索プログラムが図3に示すメモリ41に格納される。そして、図3に示すプロセッサ42がメモリ41に格納されている画像検索プログラムを実行する。
特徴量圧縮部17は、特徴量抽出部14により抽出されたそれぞれの特徴量を取得する。
特徴量圧縮部17は、スパースコーディング等の圧縮方法によって、それぞれの特徴量を圧縮する。
特徴量圧縮部17は、それぞれの圧縮後の特徴量をデータ保持部12に出力する。
データ保持部12は、特徴量圧縮部17によるそれぞれの圧縮後の特徴量を保持する。
画像検索部18は、データ保持部12に保持されている複数の圧縮後の特徴量の中から、選択信号が示すクエリ画像に係る圧縮後の特徴量を取得する。
また、画像検索部18は、データ保持部12に保持されている複数の圧縮後の特徴量の中から、選択信号が示すクエリ画像以外の画像であるそれぞれのギャラリ画像に係る圧縮後の特徴量を取得する。
画像検索部18は、クエリ画像に係る圧縮後の特徴量と、それぞれのギャラリ画像に係る圧縮後の特徴量とを比較する。
画像検索部18は、圧縮後の特徴量の比較結果に基づいて、クエリ画像に映っている被写体と同じ被写体が映っているギャラリ画像を検索する。
以下、画像検索部18によるギャラリ画像の検索処理を具体的に説明する。
画像検索部18は、クエリ画像Qに係る圧縮後の特徴量CFqと、ギャラリ画像Gmに係る圧縮後の特徴量CFgmとの比較結果として、クエリ画像Qに係る圧縮後の特徴量CFqとギャラリ画像Gmに係る圧縮後の特徴量CFgmとの類似度CSq,gmを算出する。
類似度CSq,gmの算出方法としては、例えば、クエリ画像Qに係る圧縮後の特徴量CFqとギャラリ画像Gmに係る圧縮後の特徴量CFgmとのユークリッド距離を算出する方法のほか、クエリ画像Qに係る圧縮後の特徴量CFqとギャラリ画像Gmに係る圧縮後の特徴量CFgmとのコサイン類似度を算出する方法がある。
画像検索部18は、クエリ画像Qに映っている被写体と同じ被写体が映っているギャラリ画像として、M個のギャラリ画像G1~GMの中で、特徴量CFqとの類似度CSq,gmが閾値Thcよりも大きいギャラリ画像Gjを検索する。閾値Thcは、画像検索部18の内部メモリに格納されていてもよいし、画像検索装置2の外部から与えられるものであってもよい。j=1,・・・,Jであり、Jは、0以上、M以下の整数である。
また、画像検索部18は、特徴量CFqとの類似度CSq,gmが閾値Thcよりも大きいギャラリ画像Gjを示す画像データをマンマシンインタフェース部3に出力する。
マンマシンインタフェース部3は、ギャラリ画像Gjをディスプレイに表示させる。
実施の形態3では、認証装置4から取得した認証情報とカメラ1-nにより撮影された画像との紐づけを行うデータ取得部19を備える画像検索装置2について説明する。
図10は、実施の形態3に係る画像検索装置2のハードウェアを示すハードウェア構成図である。図10において、図2及び図8と同一符号は同一又は相当部分を示すので説明を省略する。
認証装置4は、カメラ1-nが設置されている場所に現れた人物によって、例えば、社員証のID(IDentification)カードが近づけられたとき、IDカードから、当該人物の認証情報を取得する。当該人物は、カメラ1-nにより撮影された画像に映っている被写体である。
図9に示す画像検索装置2では、認証装置4が、IDカードから、人物の認証情報を取得している。しかし、これは一例に過ぎず、例えば、認証装置4が、当該人物が所持している携帯端末から、人物の認証情報を取得するようにしてもよい。
認証装置4は、認証情報を画像検索装置2に出力する。
図9に示す画像検索装置2では、データ取得部19及び画像検索部20のそれぞれが図1に示す画像検索装置2に適用されている。しかし、これは一例に過ぎず、データ取得部19及び画像検索部20のそれぞれが図7に示す画像検索装置2に適用されているものであってもよい。
データ取得部19は、図1に示すデータ取得部11と同様に、カメラ1-n(n=1,・・・,N)により撮影された画像を示す画像データと、カメラの種類を示す識別データとを取得する。
データ取得部19は、認証装置4から認証情報を取得し、認証情報とカメラ1-nにより撮影された画像との紐づけを行う。
データ取得部19は、画像データ及び識別データのそれぞれをデータ保持部12に出力する。
画像検索部20は、図1に示す画像検索部16と同様に、データ保持部12に保持されている複数の特徴量の中から、クエリ画像から抽出された特徴量として、クエリ画像選択部15から出力された選択信号が示すクエリ画像から抽出された特徴量を取得する。
画像検索部20は、図1に示す画像検索部16と同様に、選択信号が示すクエリ画像から抽出された特徴量と、データ保持部12に保持されているそれぞれのギャラリ画像の特徴量とを比較する。
画像検索部20は、図1に示す画像検索部16と同様に、特徴量の比較結果に基づいて、クエリ画像に映っている被写体と同じ被写体が映っているギャラリ画像を検索する。
画像検索部20は、図1に示す画像検索部16と異なり、クエリ画像に認証情報が紐づけられていれば、クエリ画像に紐づけられている認証情報と同じ認証情報が紐づけられているギャラリ画像を検索する。
画像検索部20は、例えば、検索したギャラリ画像をマンマシンインタフェース部3に出力する。
また、データ取得回路29、共通種類特定回路23、特徴量抽出回路24、クエリ画像選択回路25及び画像検索回路30のそれぞれは、例えば、単一回路、複合回路、プログラム化したプロセッサ、並列プログラム化したプロセッサ、ASIC、FPGA、又は、これらを組み合わせたものが該当する。
画像検索装置2が、ソフトウェア又はファームウェア等によって実現される場合、データ保持部12がコンピュータのメモリ41上に構成される。データ取得部19、共通種類特定部13、特徴量抽出部14、クエリ画像選択部15及び画像検索部20におけるそれぞれの処理手順をコンピュータに実行させるための画像検索プログラムが図3に示すメモリ41に格納される。そして、図3に示すプロセッサ42がメモリ41に格納されている画像検索プログラムを実行する。
例えば、会社内にN個のカメラ1-1~1-Nが設置されているとき、カメラ1-1が設置されている会社の入口に認証装置4が設置され、カメラ1-Nが設置されている会社の出口に認証装置4が設置されていることがある。カメラ1-2~1-(N-1)のそれぞれが設置されている場所には、認証装置4が設置されていないものとする。
このような場合、会社の入口に設置されている認証装置4は、会社の入口に現れた人物によって、IDカードが近づけられると、IDカードから、当該人物の認証情報IDkを取得し、認証情報IDkを画像検索装置2に出力する。kは、1以上の整数である。認証情報IDkは、人物毎に異なるユニークな番号等である。
会社の出口に設置されている認証装置4は、会社の出口に現れた人物によって、IDカードが近づけられると、IDカードから、当該人物の認証情報IDkを取得し、認証情報IDkを画像検索装置2に出力する。
カメラ1-1が設置されている会社の入口に認証装置4が設置されていれば、データ取得部19は、会社の入口に設置されている認証装置4から認証情報IDkを取得し、認証情報IDkとカメラ1-1により撮影された画像との紐づけを行う。
即ち、データ取得部19は、カメラ1-1により撮影された画像を示す画像データに認証情報IDkを付加する。
カメラ1-Nが設置されている会社の出口に認証装置4が設置されていれば、データ取得部19は、会社の出口に設置されている認証装置4から認証情報IDkを取得し、認証情報IDkとカメラ1-Nにより撮影された画像との紐づけを行う。
即ち、データ取得部19は、カメラ1-Nにより撮影された画像を示す画像データに認証情報IDkを付加する。
データ取得部19は、カメラ1-n(n=1,・・・,N)により撮影された画像を示す画像データと、カメラの種類を示す識別データとをデータ保持部12に出力する。
ここでは、カメラ1-1により撮影された画像を示す画像データと、カメラ1-Nにより撮影された画像を示す画像データとには、認証情報IDkが付加されており、カメラ1-n(n=2,・・・,N-1)により撮影された画像を示す画像データには、認証情報IDkが付加されていない。
データ保持部12は、データ取得部11から出力された画像データ及び識別データのそれぞれを保持する。
画像検索部20は、図1に示す画像検索部16と同様に、データ保持部12に保持されている複数の特徴量の中から、選択信号が示すクエリ画像から抽出された特徴量を取得する。
また、画像検索部20は、図1に示す画像検索部16と同様に、データ保持部12に保持されている複数の特徴量の中から、それぞれのギャラリ画像から抽出された特徴量を取得する。
画像検索部20は、図1に示す画像検索部16と同様に、クエリ画像の特徴量と、それぞれのギャラリ画像の特徴量とを比較する。
画像検索部20は、図1に示す画像検索部16と同様に、特徴量の比較結果に基づいて、クエリ画像に映っている被写体と同じ被写体が映っているギャラリ画像を検索する。
カメラ1-1が設置されている会社の入口に設置されている認証装置4と、カメラ1-Nが設置されている会社の出口に設置されている認証装置4とによって、同じ人物に係る認証情報IDkが取得されていれば、カメラ1-2により撮影されたギャラリ画像のほかに、カメラ1-Nにより撮影されたギャラリ画像が検索される。
画像検索部20は、例えば、検索したギャラリ画像をマンマシンインタフェース部3に出力する。
マンマシンインタフェース部3は、検索されたギャラリ画像をディスプレイに表示させる。検索されたギャラリ画像がディスプレイに表示されることで、被写体である人物の追跡が可能になる。
実施の形態4では、データ取得部11’が、それぞれの画像データが示す画像から、被写体が映っている領域を抽出し、抽出した領域の画像データを出力する画像検索装置2について説明する。
図12は、実施の形態4に係る画像検索装置2のハードウェアを示すハードウェア構成図である。図12において、図2、図8及び図10と同一符号は同一又は相当部分を示すので説明を省略する。
画像検索装置2は、データ取得部11’、データ保持部12、共通種類特定部13、特徴量抽出部14’、クエリ画像選択部15及び画像検索部16を備えている。
データ取得部11’は、カメラ1-n(n=1,・・・,N)により撮影された画像を示す画像データと、カメラの種類を示す識別データとを取得する。
データ取得部11’は、それぞれの画像データが示す画像から、被写体が映っている領域を抽出する。
データ取得部11’は、抽出した領域の画像データ及び識別データのそれぞれをデータ保持部12に出力する。
特徴量抽出部14’は、データ保持部12から、データ取得部11’により取得されたそれぞれの画像データを取得する。
特徴量抽出部14’は、それぞれの画像データが示す領域の画像から、共通種類特定部13により特定された種類についての特徴量を抽出する。
特徴量抽出部14’は、それぞれの特徴量をデータ保持部12に出力する。
画像検索装置2が、ソフトウェア又はファームウェア等によって実現される場合、データ保持部12がコンピュータのメモリ41上に構成される。データ取得部11’、共通種類特定部13、特徴量抽出部14’、クエリ画像選択部15及び画像検索部16におけるそれぞれの処理手順をコンピュータに実行させるための画像検索プログラムが図3に示すメモリ41に格納される。そして、図3に示すプロセッサ42がメモリ41に格納されている画像検索プログラムを実行する。
データ取得部11’は、それぞれの画像データが示す画像から、被写体が映っている領域を抽出する。
被写体が映っている領域の形状は、例えば、矩形である。矩形領域の抽出方法としては、例えば、背景差分のような前景抽出した領域から最大内包矩形を探索する方法のほか、SSD(Single Shot multibox Detector)のような事前学習済みのモデルを利用して、矩形領域を抽出する方法がある。
データ取得部11’が、被写体が映っている領域を抽出することで、特徴量抽出部14’により抽出される特徴量が、概ね被写体の特徴量となる。
データ取得部11’は、抽出した領域の画像データ及び識別データのそれぞれをデータ保持部12に出力する。
データ保持部12は、データ取得部11’から出力された領域の画像データ及び識別データのそれぞれを保持する。
図11に示す画像検索装置2では、データ取得部11’が、被写体が映っている矩形領域を抽出している。しかしながら、データ取得部11’により抽出される領域は、被写体が映っている領域であればよいため、データ取得部11’により抽出される領域の形状は、矩形に限るものではなく、例えば、円形であってもよいし、四角形以外の多角形であってもよい。
特徴量抽出部14’は、共通種類特定部13から、共通の種類の特定結果を取得する。
特徴量抽出部14’は、図1に示す特徴量抽出部14と同様に、複数の特徴量抽出方法の中から、共通の種類の特徴量を抽出することが可能な特徴量抽出方法を選択する。
特徴量抽出部14’は、選択した特徴量抽出方法を用いて、それぞれの画像データが示す画像から特徴量を抽出する。
特徴量抽出部14’は、それぞれの特徴量をデータ保持部12に出力する。
データ保持部12は、特徴量抽出部14’から出力されたそれぞれの特徴量を保持する。
特徴量抽出部14’により抽出される特徴量は、概ね被写体の特徴量となる。一方、図1に示す特徴量抽出部14により抽出される特徴量は、被写体の特徴量の他に、背景等の特徴量を含んでいる。したがって、図11に示す画像検索部16は、図1に示す画像検索部16よりも、クエリ画像に映っている被写体と同じ被写体が映っているギャラリ画像の検索精度が高まる。
Claims (8)
- カメラにより撮影された複数の画像のそれぞれを示す画像データと、それぞれの画像を撮影したカメラの種類を示す識別データとを取得するデータ取得部と、
前記データ取得部により取得されたそれぞれの識別データが示すカメラの種類に基づいて、それぞれの画像から抽出可能な特徴量の種類において共通している種類を特定する共通種類特定部と、
前記データ取得部により取得されたそれぞれの画像データが示す画像から、前記共通種類特定部により特定された種類についての特徴量を抽出する特徴量抽出部と、
前記特徴量抽出部により抽出された複数の特徴量のうち、前記複数の画像に含まれているいずれか1つの画像であるクエリ画像から抽出された特徴量と、前記複数の画像に含まれているクエリ画像以外の画像である1つ以上のギャラリ画像のそれぞれから抽出された特徴量とを比較し、特徴量の比較結果に基づいて、前記クエリ画像に映っている被写体と同じ被写体が映っているギャラリ画像を検索する画像検索部と
を備えた画像検索装置。 - 前記データ取得部は、
それぞれの画像を撮影したカメラの種類を示す識別データを取得する代わりに、それぞれの画像データに基づいて、それぞれの画像を撮影したカメラの種類を識別し、前記種類の識別結果を示すデータを前記識別データとして前記共通種類特定部に出力することを特徴とする請求項1記載の画像検索装置。 - 前記特徴量抽出部は、
複数の特徴量抽出方法の中から、前記共通種類特定部により特定された種類についての特徴量を抽出することが可能な特徴量抽出方法を選択し、選択した特徴量抽出方法を用いて、前記データ取得部により取得されたそれぞれの画像データが示す画像から特徴量を抽出することを特徴とする請求項1記載の画像検索装置。 - 前記特徴量抽出部により抽出されたそれぞれの特徴量を圧縮する特徴量圧縮部を備え、
前記画像検索部は、
前記特徴量圧縮部による複数の圧縮後の特徴量のうち、前記クエリ画像に係る圧縮後の特徴量と、それぞれのギャラリ画像に係る圧縮後の特徴量とを比較し、圧縮後の特徴量の比較結果に基づいて、前記クエリ画像に映っている被写体と同じ被写体が映っているギャラリ画像を検索することを特徴とする請求項1記載の画像検索装置。 - 前記データ取得部は、
前記カメラが設置されている場所に認証装置が設置されていれば、前記認証装置から、前記カメラにより撮影された画像に映っている被写体の認証情報を取得し、前記認証情報と前記カメラにより撮影された画像との紐づけを行い、
前記画像検索部は、
特徴量の比較結果に基づいて、前記クエリ画像に映っている被写体と同じ被写体が映っているギャラリ画像を検索するほかに、前記クエリ画像に認証情報が紐づけられていれば、前記クエリ画像に紐づけられている認証情報と同じ認証情報が紐づけられているギャラリ画像を検索することを特徴とする請求項1記載の画像検索装置。 - 前記データ取得部は、
それぞれの画像データが示す画像から、被写体が映っている領域を抽出し、前記領域の画像データを出力し、
前記特徴量抽出部は、
前記データ取得部から出力されたそれぞれの画像データが示す領域の画像から、前記共通種類特定部により特定された種類についての特徴量を抽出することを特徴とする請求項1記載の画像検索装置。 - データ取得部が、カメラにより撮影された複数の画像のそれぞれを示す画像データと、それぞれの画像を撮影したカメラの種類を示す識別データとを取得し、
共通種類特定部が、前記データ取得部により取得されたそれぞれの識別データが示すカメラの種類に基づいて、それぞれの画像から抽出可能な特徴量の種類において共通している種類を特定し、
特徴量抽出部が、前記データ取得部により取得されたそれぞれの画像データが示す画像から、前記共通種類特定部により特定された種類についての特徴量を抽出し、
画像検索部が、前記特徴量抽出部により抽出された複数の特徴量のうち、前記複数の画像に含まれているいずれか1つの画像であるクエリ画像から抽出された特徴量と、前記複数の画像に含まれているクエリ画像以外の画像である1つ以上のギャラリ画像のそれぞれから抽出された特徴量とを比較し、特徴量の比較結果に基づいて、前記クエリ画像に映っている被写体と同じ被写体が映っているギャラリ画像を検索する
画像検索方法。 - カメラにより撮影された複数の画像のそれぞれを示す画像データと、それぞれの画像を撮影したカメラの種類を示す識別データとを取得するデータ取得処理手順と、
前記データ取得処理手順で取得されたそれぞれの識別データが示すカメラの種類に基づいて、それぞれの画像から抽出可能な特徴量の種類において共通している種類を特定する共通種類特定処理手順と、
前記データ取得処理手順で取得されたそれぞれの画像データが示す画像から、前記共通種類特定処理手順で特定された種類についての特徴量を抽出する特徴量抽出処理手順と、
前記特徴量抽出処理手順で抽出された複数の特徴量のうち、前記複数の画像に含まれているいずれか1つの画像であるクエリ画像から抽出された特徴量と、前記複数の画像に含まれているクエリ画像以外の画像である1つ以上のギャラリ画像のそれぞれから抽出された特徴量とを比較し、特徴量の比較結果に基づいて、前記クエリ画像に映っている被写体と同じ被写体が映っているギャラリ画像を検索する画像検索処理手順と
をコンピュータに実行させるための画像検索プログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2022/005773 WO2023157043A1 (ja) | 2022-02-15 | 2022-02-15 | 画像検索装置、画像検索方法及び画像検索プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2023157043A1 JPWO2023157043A1 (ja) | 2023-08-24 |
JP7395082B1 true JP7395082B1 (ja) | 2023-12-08 |
Family
ID=87577699
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023560266A Active JP7395082B1 (ja) | 2022-02-15 | 2022-02-15 | 画像検索装置、画像検索方法及び画像検索プログラム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP7395082B1 (ja) |
WO (1) | WO2023157043A1 (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017029784A1 (ja) | 2015-08-19 | 2017-02-23 | 日本電気株式会社 | 画像位置合わせシステム、方法および記録媒体 |
JP2017063266A (ja) | 2015-09-24 | 2017-03-30 | 富士通株式会社 | 情報処理方法、情報処理装置、及びプログラム |
US20210034842A1 (en) | 2019-07-31 | 2021-02-04 | Baidu Usa Llc | Method, electronic device, and computer readable medium for image identification |
-
2022
- 2022-02-15 JP JP2023560266A patent/JP7395082B1/ja active Active
- 2022-02-15 WO PCT/JP2022/005773 patent/WO2023157043A1/ja active Application Filing
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017029784A1 (ja) | 2015-08-19 | 2017-02-23 | 日本電気株式会社 | 画像位置合わせシステム、方法および記録媒体 |
JP2017063266A (ja) | 2015-09-24 | 2017-03-30 | 富士通株式会社 | 情報処理方法、情報処理装置、及びプログラム |
US20210034842A1 (en) | 2019-07-31 | 2021-02-04 | Baidu Usa Llc | Method, electronic device, and computer readable medium for image identification |
Non-Patent Citations (1)
Title |
---|
吉田 諭史、外2名,複数の認証技術を組合せた複数カメラでの映像追跡技術,第11回データ工学と情報マネジメントに関するフォーラム (第17回日本データベース学会年次大会) [,日本,2019年04月19日,p.1-5 |
Also Published As
Publication number | Publication date |
---|---|
JPWO2023157043A1 (ja) | 2023-08-24 |
WO2023157043A1 (ja) | 2023-08-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106446816B (zh) | 人脸识别方法及装置 | |
CN109117714B (zh) | 一种同行人员识别方法、装置、***及计算机存储介质 | |
CN109871815B (zh) | 一种查询监控信息的方法及装置 | |
US9064171B2 (en) | Detection device and method for transition area in space | |
CN106650662B (zh) | 目标对象遮挡检测方法及装置 | |
US9805331B2 (en) | Smartphone-based asset management system | |
CN108933925A (zh) | 信息处理装置、信息处理方法以及存储介质 | |
EP3066591A2 (en) | Systems and methods for image-feature-based recognition | |
CN113111844B (zh) | 一种作业姿态评估方法、装置、本地终端及可读存储介质 | |
CN108875476B (zh) | 自动近红外人脸注册与识别方法、装置和***及存储介质 | |
US11048917B2 (en) | Method, electronic device, and computer readable medium for image identification | |
KR20170077366A (ko) | 얼굴 인식 시스템 및 방법 | |
CN108885636A (zh) | 车型识别装置、车型识别***以及车型识别方法 | |
AU2011252761B2 (en) | Automatic identity enrolment | |
CN105989174A (zh) | 关注区域提取装置以及关注区域提取方法 | |
CN111738349A (zh) | 目标检测算法的检测效果评估方法、装置、存储介质及设备 | |
US11537639B2 (en) | Re-identification of physical objects in an image background via creation and storage of temporary data objects that link an object to a background | |
CN106682187B (zh) | 用于建立图像底库的方法及装置 | |
CN111078924A (zh) | 图像检索方法、装置、终端及存储介质 | |
US20200097735A1 (en) | System and Method for Display of Object Movement Scheme | |
JP7395082B1 (ja) | 画像検索装置、画像検索方法及び画像検索プログラム | |
JP6729678B2 (ja) | 情報処理装置、容疑者情報生成方法及びプログラム | |
US11080173B2 (en) | Boundary search test support device and boundary search test support method | |
De Marsico et al. | ES-RU: an e ntropy based rule to s elect r epresentative templates in face su rveillance | |
JP2019083532A (ja) | 画像処理システム、画像処理方法および画像処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230929 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20230929 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231031 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231128 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7395082 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |