JP6419560B2 - 検索装置、方法及びプログラム - Google Patents

検索装置、方法及びプログラム Download PDF

Info

Publication number
JP6419560B2
JP6419560B2 JP2014247249A JP2014247249A JP6419560B2 JP 6419560 B2 JP6419560 B2 JP 6419560B2 JP 2014247249 A JP2014247249 A JP 2014247249A JP 2014247249 A JP2014247249 A JP 2014247249A JP 6419560 B2 JP6419560 B2 JP 6419560B2
Authority
JP
Japan
Prior art keywords
image
element information
search
symbol
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2014247249A
Other languages
English (en)
Other versions
JP2016110387A (ja
Inventor
智行 柴田
智行 柴田
俊信 中洲
俊信 中洲
雄土 山地
雄土 山地
山口 修
修 山口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2014247249A priority Critical patent/JP6419560B2/ja
Priority to US14/954,822 priority patent/US20160162752A1/en
Priority to CN201510881211.5A priority patent/CN105677696A/zh
Publication of JP2016110387A publication Critical patent/JP2016110387A/ja
Application granted granted Critical
Publication of JP6419560B2 publication Critical patent/JP6419560B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5838Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/35Categorising the entire scene, e.g. birthday party or wedding scene
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/14Details of searching files based on file metadata
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • User Interface Of Digital Computer (AREA)

Description

本発明の実施形態は、検索装置、方法及びプログラムに関する。
従来から、ユーザが入力した画像をクエリとして、検索対象の画像を検索する検索装置が知られている(例えば、特許文献1参照)。
特開2008−21169号公報
しかしながら、上述したような従来技術では、ユーザは、検索装置が入力された画像をどのように解釈して検索対象の画像を検索したのか把握できない。
本発明が解決しようとする課題は、入力された画像がどのように解釈されて検索対象の画像が検索されたかをユーザに把握させることができる検索装置、方法及びプログラムを提供することである。
実施形態の検索装置は、受付部と、検索部と、表示制御部と、を備える。受付部は、第1画像の入力を受け付ける。検索部は、前記第1画像を構成する1以上の第1構成要素のカテゴリ、位置、大きさ、形状、及び色の少なくともいずれかである第1要素情報に基づいて、第2画像を検索する。表示制御部は、前記第1要素情報に基づいて前記1以上の第1構成要素がシンボル化された第1シンボル画像とともに前記第2画像に基づく画像を表示部に表示する。
第1実施形態の検索装置の例を示す構成図。 第1実施形態の表示画面の例を示す図。 第1実施形態の検索装置の処理例を示すフローチャート。 変形例1の検索装置の例を示す構成図。 変形例1の表示画面の例を示す図。 変形例2の表示画面の例を示す図。 第2実施形態の検索装置の例を示す構成図。 第2実施形態のクエリ表示領域の例を示す図。 第2実施形態のシンボルの削除操作の例を示す図。 第2実施形態のシンボルの色変更操作の例を示す図。 各実施形態及び各変形例の検索装置のハードウェア構成例を示す図。
以下、添付図面を参照しながら、実施形態を詳細に説明する。
(第1実施形態)
図1は、第1実施形態の検索装置10の一例を示す構成図である。図1に示すように、検索装置10は、記憶部11と、画像入力部13と、受付部15と、情報生成部17と、検索部19と、画像生成部21と、表示制御部23と、表示部25と、操作入力部27とを、備える。
検索装置10は、例えば、タブレット端末、スマートフォン、又はPC(Personal Computer)などにより実現できる。
記憶部11は、例えば、HDD(Hard Disk Drive)、SSD(Solid State Drive)、メモリカード、光ディスク、RAM(Random Access Memory)、及びROM(Read Only Memory)などの磁気的、光学的、又は電気的に記憶可能な記憶装置により実現できる。画像入力部13は、例えば、カメラなどの撮像装置、ネットワークインタフェースなどの通信装置、及び上述の記憶装置等により実現できる。
受付部15、情報生成部17、検索部19、画像生成部21、及び表示制御部23は、例えば、CPU(Central Processing Unit)などの処理装置にプログラムを実行させること、即ち、ソフトウェアにより実現してもよいし、IC(Integrated Circuit)などのハードウェアにより実現してもよいし、ソフトウェア及びハードウェアを併用して実現してもよい。
表示部25は、例えば、タッチパネルディスプレイや液晶ディスプレイなどの表示装置により実現できる。操作入力部27は、例えば、タッチパネルディスプレイ、マウス、又はキーボードなどにより実現できる。
記憶部11は、複数の画像を記憶する。詳細には、記憶部11は、画像と、当該画像を構成する1以上の構成要素のカテゴリ、位置、大きさ、形状、及び色の少なくともいずれかである要素情報と、当該要素情報に基づいて当該1以上の構成要素をシンボル化したシンボル画像と、を対応付けたレコードを、複数記憶する。第1実施形態では、要素情報が、1以上の構成要素のカテゴリ及び位置を示す情報である場合を例に取り説明するが、これに限定されるものではない。
シンボル画像は、1以上の構成要素それぞれ毎に、カテゴリを当該カテゴリの名称(キーワード)、アイコン、又はイラストなどでシンボル化し、要素情報が当該構成要素の位置を示す場合、当該シンボルの位置を当該構成要素の位置に対応する位置とし、要素情報が当該構成要素の大きさを示す場合、当該シンボルの大きさを当該構成要素の大きさに対応する大きさとし、要素情報が当該構成要素の形状を示す場合、当該シンボルの周囲を当該構成要素の形状に沿って線で囲み、要素情報が当該構成要素の色を示す場合、当該シンボルの色を当該構成要素の色に対応する色とした画像である。
なお、要素情報は、画像から生成され、当該画像に対応付けられたものであるが、生成手法については、情報生成部17と同様の手法を用いればよいため、ここでは説明を省略し、情報生成部17で説明する。また、シンボル画像は、要素情報から生成され、当該要素情報に対応付けられたものであるが、生成手法については、画像生成部21と同様の手法を用いればよいため、ここでは説明を省略し、画像生成部21で説明する。
また、以下では、検索対象の画像を検索するクエリを生成するための画像を第1画像、第1画像を構成する1以上の構成要素を1以上の第1構成要素、1以上の第1構成要素のカテゴリ、位置、大きさ、形状、及び色の少なくともいずれかである要素情報を第1要素情報、1以上の第1構成要素をシンボル化したシンボル画像を第1シンボル画像と称する。なお、検索対象の画像を検索するクエリは、第1要素情報が該当する。
同様に、検索対象の画像を第2画像、第2画像を構成する1以上の構成要素を1以上の第2構成要素、1以上の第2構成要素のカテゴリ、位置、大きさ、形状、及び色の少なくともいずれかである要素情報を第2要素情報、1以上の第2構成要素をシンボル化したシンボル画像を第2シンボル画像と称する。
画像入力部13は、第1画像を入力する。なお、撮像装置により撮像された画像や通信装置により外部から受信された画像を第1画像とする場合、記憶部11に記憶されている画像は、全て第2画像となる。撮像装置により撮像された画像が動画の場合には、当該動画を構成する複数のフレーム画像のいずれかを第1画像とすればよい。また、記憶部11に記憶されている複数の画像のいずれかを第1画像とする場合、記憶部11に記憶されている画像のうち、第1画像以外の全ての画像が第2画像となる。
受付部15は、画像入力部13から第1画像の入力を受け付ける。また受付部15は、操作入力部27から各種操作入力を受け付ける。
情報生成部17は、受付部15により受け付けられた第1画像から、1以上の第1構成要素の第1要素情報を生成する。1以上の第1構成要素は、第1画像を構成する複数の第1構成要素のうちカテゴリが既知の第1構成要素である。
第1画像から1以上の第1構成要素の第1要素情報を生成するには、例えば、J. Shotton, J. Winn, C. Rother, A. Criminisi., TextonBoost for Image Understanding: Multi-Class Object Recognition and Segmentation by Jointly Modeling Texture, Layout, and Context., In IJCV.に開示されている技術を用いればよい。
例えば、情報生成部17は、予め定められた1以上のカテゴリのいずれかに属する構成要素の範囲を抽出(識別)するように学習された識別器を用いて、第1画像を構成する複数の構成要素の中から、1以上の第1構成要素それぞれのカテゴリ及び範囲を抽出する。
そして情報生成部17は、抽出した第1構成要素の範囲から、第1構成要素の位置(例えば、中心位置)、大きさ、及び形状を求めることができる。
また情報生成部17は、抽出した第1構成要素の範囲に対し、RGB色空間、LAB色空間、又はHSV色空間など任意の色空間において、均等に量子化した色ヒストグラムを生成し、最頻値の代表色を第1構成要素の色とすることができる。なお、第1構成要素の色は、1色で表現してもよいし、ヒストグラムのような分布で表現してもよいし、任意の数の代表色で表現してもよい。
なお、記憶部11に記憶されている複数の画像のいずれかを第1画像とする場合、当該第1画像の第1要素情報も記憶部11に記憶されているため、情報生成部17が当該第1要素情報を生成する必要はない。
検索部19は、受付部15により受け付けられた第1画像の第1要素情報に基づいて、第2画像を検索する。なお、検索部19は、情報生成部17により第1要素情報が生成された場合、第2画像の検索に当該第1要素情報を用い、記憶部11に第1要素情報が記憶されている場合、第2画像の検索に当該第1要素情報を用いる。
具体的には、検索部19は、記憶部11から、第1要素情報と類似する第2要素情報を含むレコードを検索する。
例えば、検索部19は、第1要素情報が示す1以上の第1構成要素それぞれのカテゴリ、位置をそれぞれ量子化する。また検索部19は、記憶部11からレコードを取得し、当該レコードに含まれる第2要素情報が示す1以上の第2構成要素それぞれのカテゴリ、位置をそれぞれ量子化する。
次に検索部19は、1以上の第1構成要素それぞれ毎に、当該第1構成要素のカテゴリ、位置の量子化値を、それぞれ、1以上の第2構成要素それぞれのカテゴリ、位置の量子化値と比較し、一致する量子化値の割合が所定割合以上であれば、当該第1構成要素に類似する第2構成要素と判定する。そして検索部19は、1以上の第1構成要素と一致する第2構成要素の割合を類似度とし、類似度が閾値以上であれば、第1要素情報と類似する第2要素情報となる。
なお第1実施形態では、要素情報が1以上の構成要素のカテゴリ及び位置を示すため、カテゴリ、位置を量子化する例について説明したが、要素情報が1以上の構成要素の大きさ、形状、及び色も示せば、大きさ、形状、及び色も量子化する。
また例えば、検索部19は、第1構成要素と第2構成要素との類似を、第1構成要素と第2構成要素との差が予め定義した差分特徴の範囲内に収まるか否かで判定してもよい。この場合、カテゴリの差分特徴は、カテゴリ間の意味的な近接関係を使用でき、位置の差分特徴は、座標間距離を画像サイズで正規化した距離を使用でき、大きさの差分特徴は、アスペクト比を使用でき、形状の差分特徴は、外接形状のエッジ情報の相関性を使用でき、色の差分特徴は、色ヒストグラムを使用できる。
また例えば、検索部19は、第1構成要素と第2構成要素との類似を、識別器を用いて判定してもよい。この場合、識別器は、主観的に一致すると判定された構成要素対と主観的に一致しないと判定された構成要素対とを統計データとして差分特徴を用いた2クラス問題として、SVM(Support Vector Machine)などの一般的な機械学習の手法で学習されたものを用いればよい。
画像生成部21は、受付部15により受け付けられた第1画像の第1要素情報に基づいて、1以上の第1構成要素をシンボル化した第1シンボル画像を生成する。なお、画像生成部21は、情報生成部17により第1要素情報が生成された場合、第1シンボル画像の生成に当該第1要素情報を用い、記憶部11に第1要素情報が記憶されている場合、第1シンボル画像の生成に当該第1要素情報を用いる。
表示制御部23は、第1シンボル画像とともに検索部19により検索された第2画像に基づく画像を表示部25に表示する。なお、表示制御部23は、画像生成部21により第1シンボル画像が生成された場合、当該第1シンボル画像を表示し、記憶部11に第1シンボル画像が記憶されている場合、当該第1シンボル画像を表示する。また第1実施形態では、第2画像に基づく画像は、検索部19により検索されたレコードに含まれる第2シンボル画像である場合を例に取り説明するが、これに限定されるものではない。
また第1実施形態では、表示制御部23は、検索部19によりレコードがn(n≧2)個検索された場合、第2画像に基づく画像として、当該n個のレコードに含まれるn個の第2シンボル画像を類似度の順に配置して表示部25に表示する。
また第1実施形態では、表示制御部23は、表示部25に表示された第2シンボル画像が指示又は選択された場合、当該第2シンボル画像を含むレコードに含まれる第2画像のサムネイル画像を表示部25に更に表示する。具体的には、操作入力部27から、表示部25に表示された第2シンボル画像を指示(例えば、タッチ操作やマウスを重ねる操作)又は選択(例えば、マウスを重ねてクリックする操作)する操作が入力され、受付部15により受け付けられると、表示制御部23は、当該第2シンボル画像を含むレコードに含まれる第2画像を取得し、当該第2画像をサムネイル画像に縮小し、表示部25に更に表示する。
また第1実施形態では、表示制御部23は、受付部15により受け付けられた第1画像のサムネイル画像を表示部25に更に表示する。具体的には、表示制御部23は、受付部15により受け付けられた第1画像をサムネイル画像に縮小し、表示部25に更に表示する。
図2は、第1実施形態の表示画面の一例を示す図である。図2に示す例では、クエリ表示領域31に、第1画像のサムネイル画像32と、第1シンボル画像33とが表示されている。
第1シンボル画像33では、サムネイル画像32の空に対応する第1シンボル画像33上の位置にカテゴリ名「空」のシンボル34が配置され、サムネイル画像32の夕焼けに対応する第1シンボル画像33上の位置にカテゴリ名「夕焼け」のシンボル35が配置され、サムネイル画像32の山に対応する第1シンボル画像33上の位置にカテゴリ名「山」のシンボル36が配置され、サムネイル画像32の湖に対応する第1シンボル画像33上の位置にカテゴリ名「湖」のシンボル37が配置されている。
また検索結果表示領域41には、検索された第2シンボル画像42〜45などが表示されている。また、図2に示す例では、第2シンボル画像45が選択されているため(図示省略)、第2シンボル画像45を含むレコードに含まれる第2画像51が更に表示されている。
図3は、第1実施形態の検索装置10で行われる処理の手順の流れの一例を示すフローチャートである。
まず、受付部15は、画像入力部13から第1画像の入力を受け付ける(ステップS101)。
続いて、情報生成部17は、受付部15により受け付けられた第1画像から、1以上の第1構成要素の第1要素情報を生成する(ステップS103)。
続いて、検索部19は、情報生成部17により生成された第1要素情報を用いて、当該第1要素情報と類似する第2要素情報、第2画像、及び第2シンボル画像を含むレコードを検索する(ステップS105)。
続いて、画像生成部21は、情報生成部17により生成された第1要素情報に基づいて、1以上の第1構成要素をシンボル化した第1シンボル画像を生成する(ステップS107)。
続いて、表示制御部23は、受付部15により受け付けられた第1画像、画像生成部21により生成された第1シンボル画像、及び検索部19により検索された第2シンボル画像を表示部25に表示する(ステップS109)。
なお、上記フローチャートにおける各ステップを、その性質に反しない限り、実行順序を変更したり、複数同時に実施したりしてもよい。例えば、第1シンボル画像の生成(ステップS107の処理)は、ステップS103以降、ステップS109以前であればどのタイミングで行ってもよい。また例えば、第1画像の表示もステップS101以降であればどのタイミングで行ってもよく、第1シンボル画像の表示も第1シンボル画像の生成後であればどのタイミングで行ってもよく、第2シンボル画像の表示もステップS105以降であればどのタイミングで行ってもよい。
以上のように第1実施形態によれば、第1画像を構成する1以上の第1構成要素のカテゴリ、位置、大きさ、形状、及び色の少なくともいずれかである第1要素情報に基づいて検索された第2画像に基づく画像とともに、当該1以上の第1構成要素をシンボル化した第1シンボル画像が表示されるため、第1画像がどのように解釈されて第2画像が検索されたかをユーザに把握させることができる。この結果、第1画像から第2画像が検索された理由をユーザに直感的に理解させ易くすることができる。
(変形例1)
上記第1実施形態において、検索された全ての第2シンボル画像を表示するのではなく、検索された第2シンボル画像数未満の代表シンボル画像、及び各代表シンボル画像に分類された第2シンボル画像の個数を示す個数情報を表示するようにしてもよい。以下では、第1実施形態との相違点の説明を主に行い、第1実施形態と同様の機能を有する構成要素については、第1実施形態と同様の名称・符号を付し、その説明を省略する。
図4は、変形例1の検索装置110の一例を示す構成図である。図4に示すように、変形例1の検索装置110は、画像生成部121及び表示制御部123が、第1実施形態と相違する。
画像生成部121は、検索部19によりレコードがn個検索された場合、生成した第1シンボル画像又は当該n個のレコードに含まれるn個の第2シンボル画像に基づいて、m(2≦m≦n)個の代表シンボル画像を更に生成してもよい。
画像生成部121は、第1シンボル画像から代表シンボル画像を生成する場合、第1シンボル画像のシンボルのカテゴリ、位置、大きさ、形状、及び色の少なくともいずれかを変更して、m個の代表シンボル画像を生成すればよい。
また画像生成部121は、n個の第2シンボル画像から代表シンボル画像を生成する場合、類似度などを基にn個の第2シンボル画像をm個のグループに分類し、グループ毎に分類された第2シンボル画像を合成して、m個の代表シンボル画像を生成すればよい。
表示制御部123は、検索部19により検索されたn個の第2シンボル画像をm個の代表シンボル画像に分類し、第2画像に基づく画像として、m個の代表シンボル画像とともに、m個の代表シンボル画像それぞれに分類された第2シンボル画像の個数を示す個数情報を表示部25に表示すればよい。なお、画像生成部121によりn個の第2シンボル画像の分類が行われている場合、表示制御部123は、分類を省略すればよい。
図5は、変形例1の表示画面の一例を示す図である。図5に示す例では、検索結果表示領域41には、生成された代表シンボル画像52〜54などが表示されるとともに、代表シンボル画像52〜54それぞれに個数情報62〜64が対応付けられて表示されている。
(変形例2)
上記第1実施形態において、第1画像及び第2画像を顔画像としてもよい。この場合、第1要素情報は、第1画像を構成する1以上の第1構成要素のカテゴリ、位置、大きさ、形状、及び色、並びに第1画像のカテゴリの少なくともいずれかとすることができる。
第1画像のカテゴリは、笑顔や怒りなど感情が挙げられ、情報生成部17は、例えば、顔の表情から感情を認識すればよい。顔の表情から感情を認識するには、例えば、D. Parikh, K. Grauman, Relative Attributes, ICCV 2011.に開示されている技術を用いればよい。
図6は、変形例2の表示画面の一例を示す図である。図6に示す例では、クエリ表示領域31に、第1画像のサムネイル画像82と、第1シンボル画像83とが表示されている。また検索結果表示領域41には、検索された第2シンボル画像91〜93などが表示されている。また、図6に示す例では、第2シンボル画像93が選択されているため(図示省略)、第2シンボル画像93を含むレコードに含まれる第2画像96が更に表示されている。
なお、図6に示す例では、要素情報が、1以上の構成要素のカテゴリ、位置、大きさ、形状、及び色、並びに第1画像のカテゴリを示す情報となっている。
(変形例3)
上記第1実施形態において、第2画像に基づく画像は、検索部19により検索されたレコードに含まれる第2画像のサムネイル画像としてもよい。そして、表示制御部23は、表示部25に表示された第2画像のサムネイル画像が指示又は選択された場合、当該第2画像を含むレコードに含まれる第2シンボル画像を表示部25に更に表示するようにしてもよい。
また上記第1実施形態において、第1画像のサムネイル画像と第1シンボル画像とを同時に表示するのではなく、いずれか一方の画像を表示し、当該一方の画像が指示又は選択された場合、他方の画像を表示するようにしてもよい。
(変形例4)
上記第1実施形態において、第1画像、第1要素情報、及び第1シンボル画像を対応付けたレコードを記憶部11に登録するようにしてもよい。このようにすれば、次回以降、第1画像、第1要素情報、及び第1シンボル画像を対応付けたレコードを検索対象に加えることができる。
また例えば、検索モードと登録モードとを分け、登録モードの場合には、検索を行わずに、第1画像、第1要素情報、及び第1シンボル画像を対応付けたレコードを記憶部11に登録できるようにしてもよい。
(変形例5)
上記第1実施形態では、記憶部11に第2シンボル画像も記憶されている例について説明したが、記憶部11に第2シンボル画像を記憶せず、検索された第2要素情報から第2シンボル画像を生成するようにしてもよい。
(変形例6)
上記第1実施形態では、検索装置10が記憶部11を備える例について説明したが、検索装置10の外部(例えば、クラウド上)に記憶部11を設けるようにしてもよい。また、検索装置10が備える記憶部11以外の構成をクラウド化してもよいし、複数の装置に分散して検索装置10を実現してもよい。
(第2実施形態)
第2実施形態では、第1シンボル画像を編集することで、第1要素情報をユーザの意図した第1要素情報に変更し、変更後の第1要素情報に基づいて検索を行う例について説明する。以下では、第1実施形態との相違点の説明を主に行い、第1実施形態と同様の機能を有する構成要素については、第1実施形態と同様の名称・符号を付し、その説明を省略する。
図7は、第2実施形態の検索装置210の一例を示す構成図である。図7に示すように、第2実施形態の検索装置210は、受付部215、情報生成部217、検索部219、及び表示制御部223が、第1実施形態と相違する。
第1実施形態では、受付部15により第1画像の入力が受け付けられると、検索部19は、情報生成部17により生成された第1要素情報を用いて検索を行ったが、第2実施形態では、受付部215により検索操作入力が受け付けられてから検索を行う。
このため、表示制御部223は、検索部219による検索が行われる前に第1シンボル画像を表示部25に表示する。
図8は、第2実施形態の表示画面のクエリ表示領域31の一例を示す図である。図8に示す例では、クエリ表示領域31に、第1画像のサムネイル画像32と、第1シンボル画像33と、カーソル71と、が表示されている。
そして受付部215は、第1シンボル画像を構成する前記1以上の第1構成要素を変更する変更入力を更に受け付ける。具体的には、受付部215は、操作入力部27から第1シンボル画像上のシンボルを変更する操作入力を受け付ける。
シンボルを変更する操作入力としては、カーソル71でシンボルを選択し、当該カテゴリを変更したり、当該シンボルの位置をずらしたり、当該シンボルの大きさを変更したり、当該シンボルの形状を変更したり、当該シンボルの色を変更したり、当該シンボルを削除したりする操作入力が挙げられる。
図9は、第2実施形態のシンボルの削除操作の一例を示す図である。図9に示す例では、消去アイコン72が表示されるとともにカーソル71でシンボル73が選択されており、カーソル71でシンボル73を消去アイコン72に移動させることでシンボル73を削除する。
図10は、第2実施形態のシンボルの色変更操作の一例を示す図である。図10に示す例では、色変更アイコン74が表示されるとともにカーソル71でシンボル73が選択されており、色変更アイコン74上で色を変更することで、シンボル73の色を変更する。
情報生成部217は、受付部215により受け付けられた変更入力に基づいて、先に生成した第1要素情報を変更する。具体的には、情報生成部217は、第1要素情報が変更後の第1シンボル画像の第1要素情報となるように変更する。
操作入力部27から検索操作入力が入力され、受付部215により受け付けられると、検索部219は、第1要素情報の変更前であれば、情報生成部217により生成された第1要素情報に基づいて第2画像を検索し、第1要素情報の変更後であれば、情報生成部217により変更された第1要素情報に基づいて第2画像を検索する。
そして表示制御部223は、検索部219により検索された第2画像に基づく画像を表示部25に更に表示する。
以上のように第2実施形態によれば、第1実施形態の効果に加え、ユーザの意図した第1要素情報を生成できるので、意図する第1画像がなくても当該意図する第1画像に基づく検索を可能とすることができる。
(変形例7)
上記第2実施形態において、変形例1〜変形例6と同様の変形をしてもよい。
(ハードウェア構成)
図11は、上記各実施形態及び各変形例の検索装置のハードウェア構成の一例を示す図である。上記各実施形態及び各変形例の検索装置は、CPUなどの制御装置901と、ROMやRAMなどの記憶装置902と、HDDなどの外部記憶装置903と、ディスプレイなどの表示装置904と、キーボードやマウスなどの入力装置905と、通信インタフェースなどの通信装置906と、を備えており、通常のコンピュータを利用したハードウェア構成となっている。
上記各実施形態及び各変形例の検索装置で実行されるプログラムは、インストール可能な形式又は実行可能な形式のファイルでCD−ROM、CD−R、メモリカード、DVD(Digital Versatile Disk)、フレキシブルディスク(FD)等のコンピュータで読み取り可能な記憶媒体に記憶されて提供される。
また、上記各実施形態及び各変形例の検索装置で実行されるプログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するようにしてもよい。また、上記各実施形態及び各変形例の検索装置で実行されるプログラムを、インターネット等のネットワーク経由で提供または配布するようにしてもよい。また、上記各実施形態及び各変形例の検索装置で実行されるプログラムを、ROM等に予め組み込んで提供するようにしてもよい。
上記各実施形態及び各変形例の検索装置で実行されるプログラムは、上述した各部をコンピュータ上で実現させるためのモジュール構成となっている。実際のハードウェアとしては、CPUがHDDからプログラムをRAM上に読み出して実行することにより、上記各部がコンピュータ上で実現されるようになっている。
なお、本発明は、上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化することができる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成することができる。例えば、実施形態に示される全構成要素からいくつかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせても良い。
以上のように、上記各実施形態及び各変形例によれば、入力された画像がどのように解釈されて検索対象の画像が検索されたかをユーザに把握させることができる。
10、110、210 検索装置
11 記憶部
13 画像入力部
15、215 受付部
17、217 情報生成部
19、219 検索部
21、121 画像生成部
23、223 表示制御部
25 表示部
27 操作入力部
901 制御装置
902 記憶装置
903 外部記憶装置
904 表示装置
905 入力装置
906 通信装置

Claims (17)

  1. 第1画像の入力を受け付ける受付部と、
    前記第1画像を構成する1以上の第1構成要素のカテゴリ、位置、大きさ、形状、及び色の少なくともいずれかである第1要素情報に基づいて、第2画像を検索する検索部と、
    前記第1要素情報に基づいて前記1以上の第1構成要素がシンボル化された第1シンボル画像とともに前記第2画像に基づく画像を表示部に表示する表示制御部と、
    を備え
    前記検索部は、第2画像と、当該第2画像を構成する1以上の第2構成要素のカテゴリ、位置、大きさ、形状、及び色の少なくともいずれかである第2要素情報と、当該1以上の第2構成要素をシンボル化した第2シンボル画像と、を対応付けた複数のレコードのうち、前記第1要素情報と類似する第2要素情報を含むレコードを検索する、
    索装置。
  2. 前記第1画像から、前記第1要素情報を生成する情報生成部を更に備える請求項1に記載の検索装置。
  3. 前記第1要素情報に基づいて、前記第1シンボル画像を生成する画像生成部を更に備える請求項1に記載の検索装置。
  4. 前記第2画像に基づく画像は、検索された前記レコードに含まれる前記第2シンボル画像である請求項1に記載の検索装置。
  5. 前記表示制御部は、前記表示部に表示された前記第2シンボル画像が指示又は選択された場合、検索された前記レコードに含まれる前記第2画像のサムネイル画像を前記表示部に更に表示する請求項4に記載の検索装置。
  6. 前記第1要素情報に基づいて、前記第1シンボル画像を生成する画像生成部を更に備え、
    前記画像生成部は、前記レコードがn(n≧2)個検索された場合、前記第1シンボル画像又は前記n個のレコードに含まれる前記n個の第2シンボル画像に基づいて、m(2≦m≦n)個の代表シンボル画像を更に生成し、
    前記表示制御部は、前記n個の第2シンボル画像を前記m個の代表シンボル画像に分類し、前記第2画像に基づく画像として、前記m個の代表シンボル画像とともに、前記m個の代表シンボル画像それぞれに分類された前記第2シンボル画像の個数を示す個数情報を前記表示部に表示する請求項1に記載の検索装置。
  7. 前記表示制御部は、前記レコードがn(n≧2)個検索された場合、前記第2画像に基づく画像として、前記n個のレコードに含まれる前記n個の第2シンボル画像を類似度の順に配置して前記表示部に表示する請求項1に記載の検索装置。
  8. 前記第1画像及び前記第2画像は、顔画像である請求項1に記載の検索装置。
  9. 前記第1要素情報は、前記第1画像を構成する1以上の第1構成要素のカテゴリ、位置、大きさ、形状、及び色、並びに前記第1画像のカテゴリの少なくともいずれかである請求項8に記載の検索装置。
  10. 前記1以上の第1構成要素は、前記第1画像を構成する複数の第1構成要素のうち前記カテゴリが既知の第1構成要素である請求項1に記載の検索装置。
  11. 前記表示制御部は、前記第1画像のサムネイル画像を前記表示部に更に表示する請求項1に記載の検索装置。
  12. 前記第2画像に基づく画像は、検索された前記レコードに含まれる前記第2画像のサムネイル画像である請求項1に記載の検索装置。
  13. 第1画像の入力を受け付ける受付部と、
    前記第1画像を構成する1以上の第1構成要素のカテゴリ、位置、大きさ、形状、及び色の少なくともいずれかである第1要素情報に基づいて当該1以上の第1構成要素がシンボル化された第1シンボル画像を表示部に表示する表示制御部と、を備え、
    前記受付部は、前記第1シンボル画像を構成する前記1以上の第1構成要素を変更する変更入力を更に受け付け、
    前記変更入力に基づいて変更された前記第1要素情報に基づいて、第2画像を検索する検索部を更に備え、
    前記表示制御部は、前記第2画像に基づく画像を前記表示部に更に表示し、
    前記検索部は、第2画像と、当該第2画像を構成する1以上の第2構成要素のカテゴリ、位置、大きさ、形状、及び色の少なくともいずれかである第2要素情報と、当該1以上の第2構成要素をシンボル化した第2シンボル画像と、を対応付けた複数のレコードのうち、前記第1要素情報と類似する第2要素情報を含むレコードを検索する、
    索装置。
  14. 検索装置が、第1画像の入力を受け付ける受付ステップと、
    前記検索装置が、前記第1画像を構成する1以上の第1構成要素のカテゴリ、位置、大きさ、形状、及び色の少なくともいずれかである第1要素情報に基づいて、第2画像を検索する検索ステップと、
    前記検索装置が、前記第1要素情報に基づいて前記1以上の第1構成要素がシンボル化された第1シンボル画像とともに前記第2画像に基づく画像を表示部に表示する表示制御ステップと、
    を含み、
    前記検索ステップは、第2画像と、当該第2画像を構成する1以上の第2構成要素のカテゴリ、位置、大きさ、形状、及び色の少なくともいずれかである第2要素情報と、当該1以上の第2構成要素をシンボル化した第2シンボル画像と、を対応付けた複数のレコードのうち、前記第1要素情報と類似する第2要素情報を含むレコードを検索する、
    索方法。
  15. 検索装置が、第1画像の入力を受け付ける第1受付ステップと、
    前記検索装置が、前記第1画像を構成する1以上の第1構成要素のカテゴリ、位置、大きさ、形状、及び色の少なくともいずれかである第1要素情報に基づいて当該1以上の第1構成要素がシンボル化された第1シンボル画像を表示部に表示する第1表示制御ステップと、
    前記検索装置が、前記第1シンボル画像を構成する前記1以上の第1構成要素を変更する変更入力を受け付ける第2受付ステップと、
    前記検索装置が、前記変更入力に基づいて変更された前記第1要素情報に基づいて、第2画像を検索する検索ステップと、
    前記検索装置が、前記第2画像に基づく画像を前記表示部に表示する第2表示制御ステップと、
    を含み、
    前記検索ステップは、第2画像と、当該第2画像を構成する1以上の第2構成要素のカテゴリ、位置、大きさ、形状、及び色の少なくともいずれかである第2要素情報と、当該1以上の第2構成要素をシンボル化した第2シンボル画像と、を対応付けた複数のレコードのうち、前記第1要素情報と類似する第2要素情報を含むレコードを検索する、
    索方法。
  16. 第1画像の入力を受け付ける受付ステップと、
    前記第1画像を構成する1以上の第1構成要素のカテゴリ、位置、大きさ、形状、及び色の少なくともいずれかである第1要素情報に基づいて、第2画像を検索する検索ステップと、
    前記第1要素情報に基づいて前記1以上の第1構成要素がシンボル化された第1シンボル画像とともに前記第2画像に基づく画像を表示部に表示する表示制御ステップと、
    をコンピュータに実行させ
    前記検索ステップは、第2画像と、当該第2画像を構成する1以上の第2構成要素のカテゴリ、位置、大きさ、形状、及び色の少なくともいずれかである第2要素情報と、当該1以上の第2構成要素をシンボル化した第2シンボル画像と、を対応付けた複数のレコードのうち、前記第1要素情報と類似する第2要素情報を含むレコードを検索する、
    ログラム。
  17. 第1画像の入力を受け付ける第1受付ステップと、
    前記第1画像を構成する1以上の第1構成要素のカテゴリ、位置、大きさ、形状、及び色の少なくともいずれかである第1要素情報に基づいて当該1以上の第1構成要素がシンボル化された第1シンボル画像を表示部に表示する第1表示制御ステップと、
    前記第1シンボル画像を構成する前記1以上の第1構成要素を変更する変更入力を受け付ける第2受付ステップと、
    前記変更入力に基づいて変更された前記第1要素情報に基づいて、第2画像を検索する検索ステップと、
    前記第2画像に基づく画像を前記表示部に表示する第2表示制御ステップと、
    をコンピュータに実行させ
    前記検索ステップは、第2画像と、当該第2画像を構成する1以上の第2構成要素のカテゴリ、位置、大きさ、形状、及び色の少なくともいずれかである第2要素情報と、当該1以上の第2構成要素をシンボル化した第2シンボル画像と、を対応付けた複数のレコードのうち、前記第1要素情報と類似する第2要素情報を含むレコードを検索する、
    ログラム。
JP2014247249A 2014-12-05 2014-12-05 検索装置、方法及びプログラム Expired - Fee Related JP6419560B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2014247249A JP6419560B2 (ja) 2014-12-05 2014-12-05 検索装置、方法及びプログラム
US14/954,822 US20160162752A1 (en) 2014-12-05 2015-11-30 Retrieval apparatus, retrieval method, and computer program product
CN201510881211.5A CN105677696A (zh) 2014-12-05 2015-12-03 检索设备和检索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014247249A JP6419560B2 (ja) 2014-12-05 2014-12-05 検索装置、方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2016110387A JP2016110387A (ja) 2016-06-20
JP6419560B2 true JP6419560B2 (ja) 2018-11-07

Family

ID=56094604

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014247249A Expired - Fee Related JP6419560B2 (ja) 2014-12-05 2014-12-05 検索装置、方法及びプログラム

Country Status (3)

Country Link
US (1) US20160162752A1 (ja)
JP (1) JP6419560B2 (ja)
CN (1) CN105677696A (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021193495A (ja) 2020-06-08 2021-12-23 コニカミノルタ株式会社 検索システム
JP2021193770A (ja) 2020-06-08 2021-12-23 コニカミノルタ株式会社 検索システム

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1185992A (ja) * 1997-09-05 1999-03-30 Omron Corp 画像登録検索装置、方法及びプログラム記録媒体
US6941323B1 (en) * 1999-08-09 2005-09-06 Almen Laboratories, Inc. System and method for image comparison and retrieval by enhancing, defining, and parameterizing objects in images
US20020087577A1 (en) * 2000-05-31 2002-07-04 Manjunath Bangalore S. Database building method for multimedia contents
JP2002304415A (ja) * 2001-04-04 2002-10-18 Omron Corp 画像検索装置
US6847733B2 (en) * 2001-05-23 2005-01-25 Eastman Kodak Company Retrieval and browsing of database images based on image emphasis and appeal
JP4527322B2 (ja) * 2001-07-25 2010-08-18 日本電気株式会社 画像検索装置、画像検索方法、及び画像検索用プログラム
US7298931B2 (en) * 2002-10-14 2007-11-20 Samsung Electronics Co., Ltd. Image retrieval method and apparatus using iterative matching
US7657100B2 (en) * 2005-05-09 2010-02-02 Like.Com System and method for enabling image recognition and searching of images
US20080177640A1 (en) * 2005-05-09 2008-07-24 Salih Burak Gokturk System and method for using image analysis and search in e-commerce
JP5358083B2 (ja) * 2007-11-01 2013-12-04 株式会社日立製作所 人物画像検索装置及び画像検索装置
JP5059545B2 (ja) * 2007-10-23 2012-10-24 株式会社リコー 画像処理装置及び画像処理方法
JP5229744B2 (ja) * 2007-12-03 2013-07-03 国立大学法人北海道大学 画像分類装置および画像分類プログラム
JP2009200699A (ja) * 2008-02-20 2009-09-03 Pfu Ltd 画像処理装置および画像処理方法
JP5127067B2 (ja) * 2009-03-06 2013-01-23 パナソニック株式会社 画像検索装置及び画像検索方法
JP5413156B2 (ja) * 2009-11-30 2014-02-12 富士ゼロックス株式会社 画像処理プログラム及び画像処理装置
JP2011138263A (ja) * 2009-12-28 2011-07-14 Seiko Epson Corp 管理システムおよび該管理システムを利用する印刷装置
US8775424B2 (en) * 2010-01-26 2014-07-08 Xerox Corporation System for creative image navigation and exploration
US20110191336A1 (en) * 2010-01-29 2011-08-04 Microsoft Corporation Contextual image search
JP2012190349A (ja) * 2011-03-11 2012-10-04 Omron Corp 画像処理装置、画像処理方法および制御プログラム
US20120254790A1 (en) * 2011-03-31 2012-10-04 Xerox Corporation Direct, feature-based and multi-touch dynamic search and manipulation of image sets
US20130007032A1 (en) * 2011-06-30 2013-01-03 United Video Properties, Inc. Systems and methods for distributing media assets based on images
US9916538B2 (en) * 2012-09-15 2018-03-13 Z Advanced Computing, Inc. Method and system for feature detection
JP2014127011A (ja) * 2012-12-26 2014-07-07 Sony Corp 情報処理装置、情報処理方法、およびプログラム
US20140193077A1 (en) * 2013-01-08 2014-07-10 Canon Kabushiki Kaisha Image retrieval apparatus, image retrieval method, query image providing apparatus, query image providing method, and program
JP2014186372A (ja) * 2013-03-21 2014-10-02 Toshiba Corp 図絵描画支援装置、方法、及びプログラム
KR20150006606A (ko) * 2013-07-09 2015-01-19 주식회사 케이티 객체 기반으로 영상을 검색하는 서버 및 방법
US10599810B2 (en) * 2014-06-04 2020-03-24 Panasonic Corporation Control method and recording system
JP6700791B2 (ja) * 2016-01-05 2020-05-27 キヤノン株式会社 情報処理装置、情報処理方法及びプログラム

Also Published As

Publication number Publication date
CN105677696A (zh) 2016-06-15
US20160162752A1 (en) 2016-06-09
JP2016110387A (ja) 2016-06-20

Similar Documents

Publication Publication Date Title
US10134165B2 (en) Image distractor detection and processing
US9886669B2 (en) Interactive visualization of machine-learning performance
US20150339348A1 (en) Search method and device
US10430457B2 (en) Image processing apparatus, image processing method, search apparatus, search method, and non-transitory computer-readable storage medium
US10891740B2 (en) Moving object tracking apparatus, moving object tracking method, and computer program product
CN112163577A (zh) 游戏画面中的文字识别方法、装置、电子设备和存储介质
WO2016006090A1 (ja) 電子機器、方法及びプログラム
US9734434B2 (en) Feature interpolation
WO2015057793A1 (en) Multi-color channel detection for note recognition and management
JP2018206252A (ja) 画像処理システム、評価モデル構築方法、画像処理方法及びプログラム
EP2947584A1 (en) Multimodal search method and device
JP6419560B2 (ja) 検索装置、方法及びプログラム
EP3800611A1 (en) Mosaic generation apparatus and method
CN112150347B (zh) 从有限的修改后图像集合中学习的图像修改样式
EP2781991B1 (en) Signal processing device and signal processing method
US20150205397A1 (en) Method for automatic computerized process control, and computerized system implementing the same
JP6441142B2 (ja) 検索装置、方法及びプログラム
TWI695275B (zh) 搜索方法、電子裝置及電腦可讀記錄媒體
JP2016025625A (ja) 情報処理装置、情報処理方法及びプログラム
JP7370759B2 (ja) 画像処理装置、画像処理方法およびプログラム
JP2021501432A (ja) 画像分類装置及び方法
KR20150096552A (ko) 사진 앨범 또는 사진 액자를 이용한 온라인 사진 서비스 시스템 및 방법
KR20200057813A (ko) 복수 개의 낱알을 식별하는 방법 및 그 장치
CN109565541B (zh) 促进捕捉数字图像的方法、设备和***
JP2010128706A (ja) 画像処理装置、画像処理方法、コンピュータプログラム、及び、情報記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170911

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180620

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180703

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180827

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180911

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181010

R151 Written notification of patent or utility model registration

Ref document number: 6419560

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees