JP2011053781A - 画像データベース作成装置、画像検索装置、画像データベース作成方法および画像検索方法 - Google Patents

画像データベース作成装置、画像検索装置、画像データベース作成方法および画像検索方法 Download PDF

Info

Publication number
JP2011053781A
JP2011053781A JP2009200088A JP2009200088A JP2011053781A JP 2011053781 A JP2011053781 A JP 2011053781A JP 2009200088 A JP2009200088 A JP 2009200088A JP 2009200088 A JP2009200088 A JP 2009200088A JP 2011053781 A JP2011053781 A JP 2011053781A
Authority
JP
Japan
Prior art keywords
image
identifier
keyword
search
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009200088A
Other languages
English (en)
Inventor
Yasuhisa Hayaishi
育央 早石
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP2009200088A priority Critical patent/JP2011053781A/ja
Priority to US12/872,947 priority patent/US20110052074A1/en
Publication of JP2011053781A publication Critical patent/JP2011053781A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5838Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5846Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)

Abstract

【課題】 検索精度の向上並びに検索速度の向上を図ること。
【解決手段】画像サーバー10は、識別子と予め対応付けられている画像データを格納する画像データベースを備えている。画像サーバー10は、プリンタ30から検索キーワードを含む検索要求を受信し、受信したキーワードに対応付けられている識別子をキーワード−識別子データベースから検索する。画像サーバー10は検索した識別子を用いて画像データベースから対応する画像データを検索する。画像サーバー10は検索した画像データをプリンタ30に対して送信する。
【選択図】図1

Description

本発明は、画像データベースの作成技術、作成された画像データベースを用いた画像検索技術に関する。
ネットワークを介して、所望の画像を検索するための技術が実用化されている。例えば、キーワード(文字列)を用いた画像検索を実現するために、画像に対してタイトル、コメントといった付帯情報(文字列情報)を対応付けて格納する画像データベースが提案されている。一方で、画像の表現、受け捉え方は様々であるため、キーワードを用いた画像検索では、表記揺れに上手く対応することが検索精度を向上させるために求められる。
この表記揺れの問題に対して、検索実行時に入力されたキーワードの類義語・同義語を含めて画像検索を実行する技術が知られている。この技術では、入力された検索語に対する同義語検索を実行し、検索語のみならず検索された類義語を含む検索クエリーを用いて画像検索が実行される(例えば、特許文献1)。
特開2008−192110号公報
しかしながら、検索時に類義語を含めて検索を実行すると複数語に対してそれぞれ検索処理が実行されるため検索速度を向上させることができないという課題がある。また、従来はデータベース毎に独自のキーワードが画像に対して割り当てられていたため、同一のキーワードを用いて、異なるデータベースにおいて検索を実行した場合に、所望の検索精度を得ることができない場合があった。
なお、これらの問題は、画像の検索のみならず、映像、音楽、ゲーム、電子書籍といったコンテンツの検索においても同様に発生し得る課題である。
本発明は、上記課題の少なくとも一部を解決するためになされたものであり、検索精度の向上並びに検索速度の向上を目的とする。
上記課題の少なくとも一部を解決するために、本発明は以下の種々の態様を採る。
第1の態様は画像データベース作成装置を提供する。第1の態様に係る画像データベース作成装置は、画像を取得する画像取得部と、画像を特徴付ける複数の特徴量を前記取得した画像から抽出する特徴量抽出部と、前記抽出した複数の特徴量を用いて、画像を特徴付ける複数の特徴量からなる特徴量群と識別子とを予め対応付けて記憶する特徴量−識別子データベースから、対応する識別子を検索する識別子検索部と、前記検索された識別子と前記取得した画像とを対応付けて画像データベースに格納する画像データベース構築部とを備える。
この構成を備える第1の態様に係る画像データベース作成装置によれば、識別子を用いて画像を検索可能な画像データベースを作成することができるので、画像検索精度の向上並びに画像検索速度の向上を図ることができる。
第1の態様に係る画像データベース作成装置はさらに、前記取得された画像に関連するキーワードを取得するキーワード取得部を備え、前記特徴量−識別子データベースにおいて、前記識別子はさらに複数のキーワードと対応付けられており、前記識別子検索部は、前記画像に関連するキーワードが取得された場合には、前記取得されたキーワードを用いて前記識別子を検索しても良い。この場合には、画像に関連するキーワードを用いて識別子を決定することが可能になるので、キーワードを用いた画像検索が可能な画像データベースを作成することができる。
第1の態様に係る画像データベース作成装置において、前記取得された画像には予めキーワードが対応付けられており、前記キーワード取得部は、前記取得された画像から前記予め対応付けられているキーワードを取得しても良い。この場合には、画像に予め対応付けられているキーワードに基づいて画像データベースを作成することができるので、キーワードを用いた画像検索精度を向上させることができる。
第1の態様に係る画像データベース作成装置はさらに、キーワードを入力可能なキーワード入力部を備え、前記キーワード取得部は、前記キーワード入力部を介して入力されたキーワードを取得しても良い。この場合には、キーワード入力部を介して入力されたキーワードに基づいて画像データベースを作成することができるので、ユーザの感覚を反映した画像データベースを作成することができる。
第1の態様に係る画像データベース作成装置において、前記特徴量は特徴量の種類を表す種別と、各種別における特徴量の特性を示す数値を含み、前記識別子検索部は、同一の種別の特徴量の数値を用いて、前記抽出した複数の特徴量に対応する前記識別子を検索しても良い。複数種類の特徴量を用いることによって、画像の特徴を客観的に数値化することができる。
第1の態様に係る画像データベース作成装置において、前記特徴量−識別子データベースは、固有のキーワードに対応する専用の識別子を含んでいても良い。この場合には、固有のキーワードを用いた検索に対して、迅速で精度の高い検索結果を提供可能な画像データベースを作成することができる。
第1の態様に係る画像データベース作成装置において、前記特徴量−識別子データベースに格納されている前記複数のキーワードは、階層化されていても良い。この場合には、複数概念のキーワードを識別子に対応付けることが可能となり、キーワードの揺らぎ等により検索精度の低下を抑制可能な画像データベースを作成することができる。
第1の態様に係る画像データベース作成装置において、前記画像データベース構築部はさらに、前記検索された識別子に対する前記取得した画像の類似度を対応付けて前記画像データベースに格納しても良い。この場合には、検索結果として得られた画像に対する、用いられた識別子(キーワード)のキーワードらしさを示すことができる。
第2の態様は、画像データベース作成方法を提供する。第2の態様に係る画像データベース作成方法は、取得した画像から画像を特徴付ける複数の特徴量を抽出し、前記抽出した複数の特徴量を用いて、画像を特徴付ける複数の特徴量からなる特徴量群と識別子とを予め対応付けて記憶する特徴量−識別子データベースから、対応する識別子を検索し、前記検索した識別子と前記取得した画像とを対応付けて画像データベースに格納することを備える。
第2の態様に係る画像データベース作成方法によれば、第1の態様に係る画像データベース作成装置と同様の作用効果を得ることができると共に、第1の態様に係る画像データベース作成装置と同様にして種々の態様にて実現され得る。
第2の態様に係る画像データベース作成方法は、画像データベース作成プログラムとして実現され得ると共に、画像データベース作成プログラムが記録されたコンピューター読み取り可能な媒体として実現され得る。
第3の態様は、画像検索装置を提供する。第3の態様に係る画像検索装置は、検索キーワードを取得する検索キーワード取得部と、前記取得したキーワードを用いて、キーワードと識別子とを対応付けて記憶するキーワード−識別子データベースから対応する識別子を検索する識別子検索部と、前記検索された識別子を用いて、画像と識別子とを対応付けて格納する画像−識別子データベースから対応する画像を検索する画像検索部とを備える。
第3の態様に係る画像検索装置によれば、キーワードに基づき検索された識別子を用いて画像を検索することができるので、画像検索精度および画像検索速度を向上させることができる。
第4に態様は、画像検索方法を提供する。第4の態様に係る画像検索方法は、検索キーワードを取得し、前記取得したキーワードを用いて、キーワードと識別子とを対応付けて記憶するキーワード識別子データベースから対応する識別子を検索し、前記検索した識別子を用いて、画像と識別子とを対応付けて格納する画像−識別子データベースから対応する画像を検索することを備える。
第4の態様に係る画像検索方法によれば、第3の態様に係る画像検索装置と同様の作用効果を得ることができると共に、第3の態様に係る画像検索装置と同様にして種々の態様にて実現され得る。
第4の態様に係る画像検索方法は、画像検索プログラムとして実現され得ると共に、画像検索プログラムが記録されたコンピューター読み取り可能な媒体として実現され得る。
本実施例に係る画像検索システムの概略構成を示す説明図である。 本実施例に係る画像サーバーの内部構成を機能ブロック図にて模式的に示す説明図である。 本実施例に係る画像データベースの一例を示す説明図である。 本実施例に係るキーワード−識別子データベースの一例を示す説明図である。 本実施例に係る画像サーバーが備えるメモリに格納されている各種プログラム、モジュールを示す説明図である。 本実施例に係る画像データベース作成装置の内部構成を機能ブロック図にて模式的に示す説明図である。 本実施例に係る特徴量−識別子データベースの一例を示す説明図である。 本実施例に係る画像データベース作成装置が備えるメモリに格納されている各種プログラム、モジュールを示す説明図である。 本実施例に係るプリンタの内部構成を機能ブロック図にて模式的に示す説明図である。 本実施例に係るプリンタが備えるメモリに格納されている各種プログラム、モジュールを示す説明図である。 本実施例に係る画像データベース作成装置において実行される識別子付与処理の処理ルーチンを示すフローチャートである。 本実施例に係る画像データベース作成装置において実行される他の識別子付与処理の処理ルーチンを示すフローチャートである。 本実施例に係る画像サーバーにおいて実行される画像検索処理の処理ルーチンを示すフローチャートである。 本実施例に係るプリンタにおいて実行される画像検索要求処理の処理ルーチンを示すフローチャートである。 本実施例に係るプリンタにおいて表示される画像検索結果画面の一例を示す説明図である。
以下、本発明に係る画像検索システム、画像サーバー、画像データベース作成装置、画像検索方法、画像検索端末装置としてのプリンタ、パーソナルコンピューターについて、図面を参照しつつ、実施例に基づいて説明する。
第1の実施例:
図1は本実施例に係る画像検索システムの概略構成を示す説明図である。本実施例に係る画像検索システムISSは、画像サーバーとしてのサーバーコンピューター10、画像データベース作成装置20、プリンタ30、パーソナルコンピューター40を備えている。サーバーコンピューター10と、画像データベース作成装置20、プリンタ30およびパーソナルコンピューター40とはネットワークNEを介して双方向通信可能に接続されている。ネットワークは、インターネットであっても良く、イントラネットであっても良い。画像データベース作成装置20はまた、サーバーコンピューター10とローカルに(ネットワークを介することなく直接)接続されていても良い。
サーバーコンピューター10は、識別子と対応付けられている複数の被検索画像データを格納し、クライアントコンピューターからの検索要求に応じて画像の検索を実行する。したがって、サーバーコンピューターは画像データベースを有する画像サーバー、画像データを検索する画像検索装置であると言うことができる。プリンタ30およびパーソナルコンピューター40は、画像サーバー10に対するクライアントまたは画像検索端末装置と呼ぶことができる。パーソナルコンピューター40は、表示ディスプレイ41並びにキーボードおよびマウスといった入力装置42を備えている。画像データベース作成装置20は、サーバーコンピューター10上に新たな画像データベースを作成、あるいは、サーバーコンピューター10上の既存の画像データベースを更新する、画像データベースの構築装置である。画像データベース作成装置20は、表示ディスプレイ21並びにキーボードおよびマウスといったキーワード等を入力するための入力装置22を備えている。
画像サーバーの構成:
図2は本実施例に係る画像サーバーの内部構成を機能ブロック図にて模式的に示す説明図である。画像サーバー10は、互いに通信可能に接続されている中央処理装置(CPU)101、メモリ102、画像データベースDB1が構築されている第1の記憶装置103、キーワード−識別子データベースDB2が構築されている第2の記憶装置104および入出力インターフェース105を備えている。CPU101は、メモリ102に格納されている各種プログラム、モジュールを実行する。メモリ102は、CPU101によって実行されるプログラム、モジュールを不揮発的に記憶すると共に、CPU101による処理実行時にプログラム、モジュールが展開される揮発的な作業領域を有する。メモリ102としては、例えば、プログラム等を不揮発的に記憶するリードオンリメモリ、プログラム実行時における揮発的な作業領域を提供するランダムアクセスメモリといった半導体記憶装置、不揮発的にデータを記録可能な磁気式のハードディスクドライブ、大容量フラッシュメモリが用いられ得る。
第1および第2の記憶装置103、104は、例えば、ハードディスクドライブ、フラッシュメモリドライブといった1または複数の大容量記憶装置によって構成されている。すなわち、両記憶装置103、104は、1つの大容量記憶装置を論理的に2つの記憶装置とすることによって実現されても良く、あるいは、物理的に異なる2つの記憶装置であっても良い。第1の記憶装置103には、複数の画像データが唯一的な識別子と対応付けて格納されている画像データベースDB1が構築されている。第2の記憶装置104には、唯一的な識別子と、対応するキーワード群とが対応付けて格納されているキーワード−識別子データベースDB2が構築されている。ここで、唯一的な識別子とは、キーワード群または画像特徴量に対して唯一的であることを意味し、また、各データベース単位にて唯一的であっても良く、予め検索対象として予定されている複数のデータベースにおいて唯一的であっても良い。なお、画像データが機器上で出力(表示、印刷)された態様が画像であるが、請求項における画像は画像データを意味することは当業者にとって自明な事項である。
なお、本実施例では、単に画像データと識別子とを対応付けて第1の記憶装置103に構築されているデータベース、単にキーワードと識別子とを対応付けて第2の記憶装置104に構築されているデータベースである場合を例にとって説明しているが、両記憶装置103、104に検索機能を備える制御部を備え、外部からの検索要求に応じて検索結果を出力する独立型のデータベースシステム(ファイルサーバー)であっても良い。この場合には、画像サーバー10の外部に画像データベースシステムが配置され、入出力インターフェース105を介して両者の間で検索要求および検索結果の送受信が実行される。また、データベース検索要求・検索結果受信用のプログラムがメモリ102に格納され、CPU101によって実行される。なお、画像データと識別子との対応付け、あるいは、キーワードと識別子との対応付けは、各画像データと識別子との対応関係を示すテーブル、あるいは、各キーワードと識別子との対応関係を示すテーブルを用いることによって実現される。これらテーブルは、両記憶装置103、104に備えられていても良く、あるいは、メモリ102に格納されていても良い。前者の場合には、両記憶装置103、104がそれぞれ、受け取ったキーワードまたは識別子に応じた識別子または画像データを特定し、特定された識別子または画像データを読み出し、後者の場合には、両記憶装置103、104はそれぞれ、CPU101から受け取った論理アドレスに従って、それぞれ識別子または画像データを読み出す。
入出力インターフェース105は、外部装置、例えば、プリンタ30、パーソナルコンピューター40といったクライアントとの間で、周知の通信プロトコルに従って検索要求および検索結果の送受信を実行する。
画像データベース:
図3は本実施例における画像データベースの一例を示す説明図である。本実施例では、各画像データと、唯一的な識別子と、関連度とが対応付けて記憶装置103に格納されることによって画像データベースDB1が構築されている。ここで、関連度とは後述するように類似度に基づいて求められた、識別子またはキーワードと画像データとの関連性の強さを示すための指標値である。本実施例では、識別子を特定することによって対応する画像データを直ちに検索することが可能であり、キーワードまたは画像の特徴量を用いた類似度の判定を行わなくて良い。また、各識別子に対する画像データの類似度についても予め対応付けられているため、計算処理を実行することなく類似度を得ることができる。画像データベースDB1は、例えば、前述のように、画像データと識別子と類似度とを対応付ける管理テーブルによって実現されている。なお、類似度は対応付けられていなくても良い。ここで、記憶装置103には、本実施例における画像データベース作成装置20によってデータベース化されていない画像データが含まれていても良く、これら画像データは画像データベース作成装置20によって順次、画像データベースDB1に加えられていく。
キーワード−識別子データベース:
図4は本実施例におけるキーワード−識別子データベースの一例を示す説明図である。本実施例では、各キーワード群と唯一的な識別子とが対応付けて記憶装置104に格納されることによってキーワード−識別子データベースDB2が構築されている。各識別子に対応付けるべきキーワードは、キーワードを一般化した上位概念、経験則に基づいて決定される。各キーワード群はキーワード群の代表的なキーワードRK1〜RK4、あるいは、キーワード群の上位概念的なキーワードから具体的なキーワードにいたるよう階層化されている。たとえば、識別子00001に対応付けられている顔に関するキーワード群では、キーワード群を代表するキーワードRK1として「顔」、顔の具体的な表情である「笑顔」、「しかめ面」、顔に関する表現である「顔立ち」、「容貌」といったように、顔に関わる様々な表現態様、あるいは、表現レベルを網羅する複数のキーワードが含まれている。また、識別子00120に対応付けられている山に関するキーワード群では、キーワード群を代表するキーワードRK2として「山」、具体的な山の名前として「富士山」、「阿蘇山」、山に関する表現として「夏山」、「雪山」、山に関連するキーワードとして「連峰」といったように、山に関わる様々な表現態様、表現レベルを網羅する複数のキーワードが含まれている。一方、顔に関するキーワードとして頻度が高いキーワードである「笑顔」に対しては、個別のキーワード群が用意されても良く、例えば、図4の例では、キーワード群「笑顔」には1つのキーワード「笑顔」のみが属しており、固有の識別子02142が割り当てられている。この場合には、頻度の高いキーワードに対して、直ちに所望のキーワードに対応する画像を検索することができる。
図3は画像サーバーが備えるメモリに格納されている各種プログラム、モジュールを示す説明図である。メモリ102に格納されている各種プログラム、モジュールについて図5を用いて説明する。メモリ102は、本実施例に係る画像データベースから画像を検索するために実行される画像検索プログラムSP1を格納している。
画像検索プログラムSP1は、キーワード取得モジュールSM11、識別子取得モジュールSM12、画像データ検索モジュールSM13および画像データ送信モジュールSM14を備えている。キーワード取得モジュールSM11は、クライアントであるプリンタ30およびパーソナルコンピューター40によって送信された検索キーワードを取得するために実行されるモジュールである。キーワード取得モジュールSM11は単語単位の名詞をキーワードとして受け付ける機能を有していても良く、あるいは、名詞と形容詞といった複数の単語から構成されるキーワードを受け付ける機能を有していても良い。前者の場合には、受け取ったキーワードを直ちに以降の処理に用いることが可能となり、後者の場合には形態素解析を経て分かち書き処理を行った上で名詞を抽出して抽出した名詞をキーワードとして以降の処理に用いれば良い。ここで、形態素解析、分かち書き処理といった技術は周知の技術であるから詳細については説明を省略する。なお、キーワード取得モジュールSM11は、プリンタ30等から送信された画像データに対応付けられているメタデータからキーワードを抽出、取得しても良い。識別子取得モジュールSM12は、キーワード取得モジュールSM11によって取得されたキーワードを用いて、キーワード−識別子データベースDB2から対応する識別子を検索・取得するために実行されるモジュールである。ここで、キーワード−識別子データベースDB2には、既述のように複数の相互に関連するキーワードを含むキーワード群が識別子と対応付けて格納されている。したがって、識別子取得モジュールSM12は、取得されたキーワードを含むキーワード群を検索することによって、対応する識別子を取得することができる。
画像データ検索モジュールSM13は、識別子取得モジュールSM12によって取得された識別子を用いて、画像データベースDB1から対応する画像データを検索・取得するためのモジュールである。具体的には、画像データ検索モジュールSM13は、取得された識別子と一致する識別子を画像データベースDB1から検索し、取得する。したがって、本実施例では、所望の画像データを検索するにあたって、類似度等の計算処理を経ることなく、直ちに所望の画像データが検索され得る。画像データ送信モジュールSM14は、検索キーワードを送信したクライアントであるプリンタ30およびパーソナルコンピューター40に対して、検索により得られた画像データを送信するためのモジュールである。なお、キーワード取得モジュールSM11、識別子取得モジュールSM12、画像データ検索モジュールSM13は、それぞれCPU101によって実行されることによって、検索キーワード取得部、識別子取得部、画像検索部として機能する。なお、キーワード取得モジュールSM11、識別子取得モジュールSM12、画像データ検索モジュールSM13は、それぞれハードウェアとして、すなわち、半導体回路として実現されても良い。
画像データベース作成装置の構成:
図6は本実施例に係る画像データベース作成装置の内部構成を機能ブロック図にて模式的に示す説明図である。画像データベース作成装置20は、互いに通信可能に接続されている中央処理装置(CPU)201、メモリ202、特徴量−識別子データベースDB3が構築されている記憶装置203、および入出力インターフェース204を備えている。CPU201は、メモリ202に格納されている各種プログラム、モジュールを実行する。メモリ202は、CPU201によって実行されるプログラム、モジュールを不揮発的に記憶すると共に、CPU201による処理実行時にプログラム、モジュールが展開される揮発的な作業領域を有する。メモリ202としては、例えば、プログラム等を不揮発的に記憶するリードオンリメモリ、プログラム実行時における揮発的な作業領域を提供するランダムアクセスメモリといった半導体記憶装置、不揮発的にデータを記録可能な磁気式のハードディスクドライブ、大容量フラッシュメモリが用いられ得る。
記憶装置203は、例えば、ハードディスクドライブ、大容量フラッシュメモリドライブといった1または複数の大容量記憶装置によって構成されている。記憶装置203には、識別子(ID)、複数の画像データの特徴量を含む画像特徴量群(画像特徴量グループ)、キーワードがそれぞれ対応付けられて構成されている特徴量−識別子データベースが構築されている。なお、画像データが機器上で出力(表示、印刷)された態様が画像であるが、請求項における画像は画像データを意味することは当業者にとって自明な事項である。
入出力インターフェース204は、外部装置、例えば、表示ディスプレイ21、入力装置22との間で、入力信号または出力信号を送受信する。
特徴量−識別子データベース:
図7は本実施例における特徴量−識別子データベースの一例を示す説明図である。本実施例では、既述の通り、一のキーワード群に対応する複数の画像特徴量と唯一的な識別子とが対応付けて記憶装置203に格納されることによって特徴量−識別子データベースDB3が構築されている。各識別子に対応付けるべき特徴量の種別および値は、経験則に基づいて決定される。なお、図7では、説明を簡単にするために、キーワードの項目にはキーワード群の代表キーワードが例示されているが、実際には、図4に示すよう複数のキーワードを含むキーワード群が対応付けられている。図7の例では、例えば、顔に関するキーワード群に対しては、顔の形状(a1)、顔のテクスチャ(a2)、顔の大きさ(a3)、顔の向き(a4)、顔の表情(a5)といった画像の特徴量が対応付けられている。なお、理解を容易にするため、顔の形状、顔のテクスチャ、顔の大きさ、顔の向き、顔の表情といった表現を用いているが、実際には、主要被写体が顔であると判断される場合に用いられる、主要被写体の形状、主要被写体のテクスチャ、主要被写体の大きさ、主要被写体の向き、主要被写体の表情といった特徴量の平均値が対応付けられている。
主要被写体の領域は、画像を構成する画素のうち、画素値、例えば、R、G、B成分値が互いに近似する隣接画素あるいは所定の色相(一般的には肌色)範囲に属する隣接画素をグループ化することによって画定することができる。顔の大きさは、例えば、顔として適切な主要被写体領域の幅および高さを画像特徴量として用意すればよく、顔の向きは、例えば、主要被写体領域の左右の振り角度、上下の振り角度を画像特徴量として用意すればよい。顔のテクスチャについては、例えば、周知のテクスチャ抽出方法において用いられる空間周波数のうち、顔として適切な空間周波数の値を画像特徴量として用意すればよい。顔の形状並びに顔の表情については、主要被写体(顔)領域の輪郭、目、鼻、口、眉毛といった器官の座標値として、顔が取り得る値の平均値を画像特徴量として用意すれば良い。
一方、風景に関するキーワード群に対しては、画像の代表色の色相(b1)、画像に占める画像の代表色の割合(b4)、画像の彩度(b2)・明度(b3)・エッジ量(b5)・エッジ方向(b6)の平均値が対応付けられている。これらの特徴量は、画像データを構成する画素データに対して統計的な処理を施すことによって得られることは、当業者によって良く知られた事項であるから詳細な説明は省略する。
笑顔のキーワード群に対しては、顔の形状(a1)、顔のテクスチャ(a2)、顔の大きさ(a3)については顔のキーワード群と同様の画像特徴量が用意され、顔の向き(as4)および顔の表情(as5)については笑顔に固有の画像特徴量が用意される。
図8は本実施例に係る画像データベース作成装置が備えるメモリに格納されている各種プログラム、モジュールを示す説明図である。メモリ202は、本実施例における画像データベースを作成するために実行される画像データベース作成プログラムSP2を格納している。画像データベース作成プログラムSP2は、画像データ取得モジュールSM21、特徴量取得モジュールSM22、識別子検索モジュールSM23、画像データベース構築モジュールSM24および識別子検索用キーワード取得モジュールSM25を備えている。
画像データ取得モジュールSM21は、画像データベース作成装置20に対して外部記憶装置から提供された画像データ、または画像サーバー10の記憶装置103に記憶されており、未だ、画像データベースDB1に属していない画像データを取得する。すなわち、本実施例に係る画像データベース作成装置20は、本実施例における画像データベースDB1とは異なる画像データベースが構築されている記憶装置に対して本実施例における画像データベースDB1を構築するために用いられても良く、あるいは、何ら画像データベースが構築されていない記憶装置に格納されている画像データを用いて画像データベースDB1を構築するために用いられても良く、または、画像データが格納されていない記憶装置に対して、外部から画像データを格納しつつ、画像データベースDB1を構築するために用いられても良い。
特徴量取得モジュールSM22は、画像データ取得モジュールSM21によって取得された画像データから特徴量を取得するために実行されるモジュールである。ここで、特徴量は、例えば、画像データの平均輝度、最小輝度、最高輝度、代表色の色相、彩度および明度、画像に占める代表色の割合、画像データに含まれる顔の形状、顔の大きさ、顔のテクスチャ、顔の向き、顔の表情、エッジ量、エッジの方向位置といった種別と、各種別において特徴量の大小または高低を示す値の双方を含んでいる。これら特徴量の種別は当業者にとって良く知られた種別であり、また、各種別が示す値(特徴量の値)の算出方法は当業者にとって周知の方法で取得することが可能である。識別子検索モジュールSM23は、特徴量取得モジュールSM22によって取得された特徴量を用いて、特徴量−識別子データベースDB3に格納されている識別子から一致または近似する識別子を検索するために実行されるモジュールである。具体的には、取得された特徴量と、各識別子に対応する特徴量との類似度をそれぞれ算出し、算出された類似度が所定の類似度以上の識別子、あるいは、算出された類似度が最も高い識別子を検索(特定)する。
画像データベース構築モジュールSM24は、識別子検索モジュールSM23によって検索された1または複数の識別子を、画像データ取得モジュールSM21によって取得された画像データに対応付けて、記憶装置103に格納して画像データベースDB1を構築する。識別子検索用キーワード取得モジュールSM25は、入力装置22によって入力されたキーワードまたは取得された画像データに予め対応付けられているキーワードを取得するために実行されるモジュールである。識別子検索用キーワード取得モジュールSM25によってキーワードが取得された場合には、画像データの特徴量に優先してキーワードに基づいた識別子の検索(決定)処理が行われても良い。ここで、優先して、とは画像データの特徴量に基づく識別子の検索処理を行わないこと、画像データの特徴量に基づく識別子の検索処理は実行するが最も類似度の高い識別子として、取得されたキーワードに対応する識別子を割り当てることを意味する。なお、画像データ取得モジュールSM21、特徴量取得モジュールSM22、識別子検索モジュールSM23、画像データベース構築モジュールSM24および識別子検索用キーワード取得モジュールSM25は、それぞれCPU201によって実行されることによって、検索画像取得部、特徴量取得部、識別子検索部、画像データベース構築部、識別子検索用キーワード取得部として機能する。なお、画像データベース作成プログラムSP2、画像データ取得モジュールSM21、特徴量取得モジュールSM22、識別子検索モジュールSM23、画像データベース構築モジュールSM24および識別子検索用キーワード取得モジュールSM25は、半導体回路といったハードウェアによって実現されても良い。
プリンタの構成:
図9は本実施例に係るプリンタの内部構成を機能ブロック図にて模式的に示す説明図である。図10は画像プリンタが備えるメモリに格納されている各種プログラム、モジュールを示す説明図である。本実施例では、画像検索端末装置としてプリンタ30を例にとって説明するが、パーソナルコンピューター40についても同様に画像検索端末装置として用いることが可能であることは言うまでもない。プリンタ30は、信号線によって互いに接続されている制御回路31、入力操作部32、表示部33、印刷部34、外部入出力インターフェース35を備えている。制御回路31は、互いに通信可能に接続されている中央処理装置(CPU)310、メモリ311、入出力(I/O)インターフェース312を備えている。CPU310は、メモリ311に格納されている各種プログラム、モジュールを実行する。メモリ311は、CPU310によって実行されるプログラム、モジュールを不揮発的に記憶すると共に、CPU310による処理実行時にプログラム、モジュールが展開される揮発的な作業領域を有する。メモリ311としては、例えば、プログラム等を不揮発的に記憶するリードオンリメモリ、プログラム実行時における揮発的な作業領域を提供するランダムアクセスメモリといった半導体記憶装置、ハードディスクドライブ、大容量フラッシュメモリが用いられ得る。入出力インターフェース312は、制御回路31と、入力操作部32、表示部33、印刷部34および外部入出力インターフェース35との間で、コマンド、データの送受信を実行する。入力操作部32は、プリンタ30に対してユーザが指示を入力するための操作部であり、例えば、ボタン、ホイールによって実現され得る。表示部33は、ユーザに対して検索した画像データに基づく画像の表示、ユーザに対する各種情報の表示を行うカラー表示可能な表示画面である。印刷部34は、ユーザ(制御回路31)からの印刷指示に従って印刷媒体に対して画像を形成する印刷実行部である。外部入出力インターフェース35は、外部装置、例えば、画像サーバー10との間で、周知の通信プロトコルに従って検索要求および検索結果の送受信を実行する。
メモリ311に格納されている各種プログラム、モジュールについて図10を用いて説明する。メモリ311は、画像サーバー10に対して画像検索を要求するための画像検索要求プログラムCP1を備え、画像検索要求プログラムCP1は、キーワード取得モジュールCM11、検索要求送信モジュールCM12、検索結果受信モジュールCM13を備えている。キーワード取得モジュールCM11は、検索対象となる画像(画像データ)を特定するためにユーザによって入力されたキーワードを取得するために実行されるモジュールである。なお、キーワードの取得は、入力操作部32によって入力されたキーワードを取得しても良く、あるいは、画像データに予め関連付けられているメタデータに記述されているキーワードを抽出、取得することによって実行されても良い。さらには、キーワードの取得は、入力操作部32によって入力されたキーワードと画像データのメタデータに記述されているキーワードの双方を取得することによって実行されても良い。検索要求送信モジュールCM12は、取得されたキーワードと検索の要求を画像サーバー10に対して送信するためのモジュールである。検索結果受信モジュールCM13は、画像サーバー10から検索結果としての一または複数の画像データを取得するためのモジュールである。なお、画像検索要求プログラムCP1、キーワード取得モジュールCM11、検索要求送信モジュールCM12、検索結果受信モジュールCM13、それぞれCPU310によって実行されることによって、画像検索要求部、検索要求キーワード取得部、検索要求送信部、検索結果受信部として機能する。
識別子付与処理
図11は本実施例に係る画像データベース作成装置によって実行される識別子付与処理の処理ルーチンを示すフローチャートである。本処理ルーチンが開始されると、画像データ取得モジュールSM21は、記憶装置103から画像データを取得する(ステップS100)。具体的には、未だ識別子が付与されていない画像データを任意の順序であるいは一定の条件(例えば、画像データの生成日時の古い順)に従って、画像サーバー10の記憶装置103から画像データを読み出し、メモリ202に格納する。なお、既述の通り、画像データは既に構築済みの他の画像データベースに属していても良く、いずれの画像データベースにも属していなくても(単に記憶装置103に格納されているだけでも)良い。また、画像データ取得モジュールSM21は、記憶装置103に代えて、他の外部記憶装置から画像データを取得しても良い。
特徴量取得モジュールSM22は、画像データ取得モジュールSM21によって取得された画像データから特徴量を取得する(ステップS102)。具体的には、予め定められた複数種類の特徴量について、それぞれ特徴量の値が求められる。予め定められた複数種類とは、特徴量−識別子データベースDB3において画像特徴量として格納されている特徴量の種類に対応する種類である。すなわち、特徴量−識別子データベースDB3を有効に活用して識別子を特定するためには、当該データベースに含まれている特徴量の種類と同種類の特徴量を用いて識別子を検索することが望ましい。
本実施例では、特徴量として、例えば、画像データの平均輝度、最小輝度、最高輝度、代表色の色相、彩度および明度、画像に占める代表色の割合、画像データに含まれる顔の形状、顔の大きさ、顔のテクスチャ、顔の向き、顔の表情、エッジ量、エッジの方向位置といった種別について、それぞれ値が求められる。画像データがRGBドットマトリクスデータである場合を例にとって説明すると、特徴量取得モジュールSM22は、先ず、画像データを構成する全ての画素データ、または所定量の画素データ間引き後に残存する画素データ(サンプリング画素データ)について、それぞれR、G、Bの成分値を求める。各成分の頻度分布(ヒストグラム)は、横軸にR、G、B成分値の値(階調値とも言う)と、縦軸に出現頻度を有するグラフ上に、求められたR、G、B成分値をプロットすることによって得られる。輝度のヒストグラムは、周知の変換式を用いて、求められたR、G、B成分値をY成分値(輝度成分値)に変換し、横軸にY成分値の値(階調値とも言う)と、縦軸に出現頻度を有するグラフ上に、求められたY成分値をプロットすることによって得られる。平均輝度は、各画素データについて得られたY成分値の合計値を画素データ数で除することによって得られ、最小輝度および最大輝度は、輝度ヒストグラムのおける最小輝度値およぎ最大輝度値を特定することによって得られる。
代表色の色相、彩度および明度は、画像データまたは間引き後の画像データをRGB値からHSV値に変換し、変換後に得られたH(色相)、S(彩度)およびV(明度)についてそれぞれ縦軸に出現頻度、横軸に各成分の値を有するヒストグラムを作成し、最も頻度の高い色相値、彩度値、および明度値をそれぞれ代表色の色相、彩度および明度として特定すれば良い。なお、RGB色空間−HSV色空間の変換処理については周知であるから詳細な説明を省略する。
エッジ量およびエッジの方向については、例えば、周知の3×3Prewittオペレータ、5×5Prewittオペレータを用いることによってエッジ量およびエッジ角度を算出することができる。
主要被写体の領域(顔領域)は、画像を構成する画素のうち、画素値、例えば、RGB三成分値が互いに近似する隣接画素あるいは所定の色相(一般的には肌色)範囲に属する隣接画素をグループ化することによって画定することができる。また、画像の全領域に対してX−Y座標軸を設定することによって、画像中における顔領域の位置、大きさ、顔領域における目口鼻等の器官位置を座標位置によって特定することができる。この前提の下、顔の大きさについては、画定された顔領域の幅および高さを座標間距離によって求め、顔の向きについては、正面を向いた顔領域における目と口との間の座標間距離および両目の間の座標間距離、口および目の大きさを基準値として予め用意しておき、例えば、画定された顔領域における目と口との間の座標間距離が基準値よりも短く、口の大きさが基準値よりも大きい場合には上向きの顔画像であると判断することが可能となり、画定された顔領域における目と口との間の座標間距離が基準値と同等であり、両目の座標間距離が基準値よりも小さく、右目の大きさが基準値よりも大きい場合には左向きの顔画像であると判断することが可能となる。したがって、各基準値に対する、画定顔領域の目と口との間の座標間距離および両目の間の座標間距離、口および目の大きさを基準値の差分と顔の角度とを予め対応付けておくことによって、顔の上下左右方向の振り角度を特定することができる。顔の形状および顔の表情については、顔の輪郭および器官の座標値に基づいて、特定することができる。すなわち、器官の座標値と顔の喜怒哀楽の表情とを予め対応付けておけばよい。顔領域のテクスチャについては、画定された顔領域に対して周波数解析を実行することによって得られる。画定された顔領域に対する周波数解析は、2次元フーリエ変換式を用いて、画定された顔領域を構成する各画素データの周波数を求めることによって実行される。一般的に、得られた周波数成分に低周波数成分が多く含まれる場合には、滑らかな画像であることを示し、高周波数成分が多く含まれる場合には、滑らかでない画像であることを示す。
特徴量取得モジュールSM22によって画像データから複数種類の特徴量が取得されると、識別子検索モジュールM23は、特徴量−識別子データベースDB3から取得された特徴量に一致する識別子を検索する(ステップS104)。具体的には、画像データから取得された各種特徴量の値と、特徴量−識別子データベースDB3において各識別子に対応付けられている各特徴量の値とを用いて類似度を算出し、算出された類似度が所定の範囲内に有る場合には、画像データから取得された特徴量の値と、識別子に対応付けられている特徴量の値とが一致すると判断される。各特徴量間の類似度の判定には、例えば、ユークリッド距離、マハラノビス距離といった距離算出方法が適用される。具体的には、画像データの各特徴量の値と、識別子に対応付けられている各特徴量の値との間の距離、すなわち、画像データの特徴量の値と識別子に対応付けられている各特徴量に値によって表される多次元ベクトル間の距離を用いて判断され、得られた距離が短いほど類似していると判断される。あるいは、画像データの各特徴量の値を成分とする多次元ベクトルと、識別子に対応付けられている各特徴量の値を成分とする多次元ベクトルとの内積を求めて判断されても良い。この場合には、両多次元ベクトルのコサイン成分の差を求めるので、得られた内積の値が1に近いほど(両多次元ベクトル間の角度が0に近いほど)類似度が高いと判断することができる。
ユークリッド距離を用いる場合には、以下に示す式(1)および(2)によって類似度を算出することができる。
Figure 2011053781
Figure 2011053781
式(1)において(xi)は画像データの特徴量の値、(yi)は識別子に対応付けられている特徴量の値を示し、kiは重み付け係数(0ではない任意の値)を示す。式(2)においては理解を容易にするために、各特徴量種毎に求められた差分の合計値(距離)が類似度として用いられることを明示している。距離を用いた類似度判断では、算出結果が0に近いほど画像データと識別子とが類似していることを示すので、重要度の高い特徴量に対して大きな係数を付与することによって、当該特徴量に対する感度を高くして検索結果数を絞り込むことんでも良い。なお、類似度の算出にあたっては、各特徴量毎に式(1)に示す数式を用いて類似度を算出し、算出された類似度の単純和を用いても良い。
一方、内積を用いる場合には、以下の式(3)によって類似度を算出することができる。式(3)において係数は、各多次元ベクトルの成分に対して適用される。
Figure 2011053781
類似度として内積を用いる場合にも、両多次元ベクトル間角度が0に近いほど画像データと識別子とが類似していることを示すので、複数の画像データにおいて共通または近似する値の特徴量に対して重み付けを大きくすることにより重要度の高い特徴量に関する感度を高くして検索結果を精選し、検索精度を向上させることができる。
識別子検索モジュールM23は、取得された各識別子について類似度と共に一時的にメモリ202に格納する。画像データベース構築モジュールM24は、メモリ202に格納されている識別子と類似度とを用いて、最も類似度が高い(すなわち、得られた類似度の値が最も小さい)識別子、あるいは、得られた類似度が所定値以下の識別子を画像データに対応付けて記憶装置103に格納して画像データベースDB1を構築または更新する(ステップS106)。なお、図3に示す画像データベースDB1の例では、画像データに対して識別子は1つしか付されていないが、画像特徴量が固有の(検索頻度の高い)キーワード、例えば「笑顔」に相当する場合には、画像データに対しては顔に関する識別子に加えて、笑顔に関する識別子も対応付けられる。また、上述のとおり、複数の識別子が類似度と共に付されていても良い。この場合であっても、同一の識別子が複数存在する訳ではなく、特徴量(キーワード群)との関係において識別子が唯一的であることに代わりはない。なお、上記手法によって得られる類似度は、一般的に類似度が高いほど小さな値を取り、直感的に類似度の程度を判断しがたい。そこで、図3に示す画像データベースDB1では、説明を簡単にするために、類似度に代えて、百分率で示される関連度を関連付けた例を示しているが、類似度の値が関連付けられていても良いことは言うまでもない。ただし、類似度の値を対応付けておき、表示の際に関連度等の指標に変換しても良い。関連度は、例えば、類似度として一般的に高い類似度を示す値域に対して100%〜50%までの値を一次関数によって割当て(但し、類似度0の場合に100%をとる)、一般的に類似していないと判断される類似度に対しては、50%未満の値を所定の規則に従って離散的に割り当てることによって得られる。あるいは、得られた類似度の逆数に正規化処理を施す等して、類似度の値の小さい(類似度が高い)場合に大きな値を採るように演算処理して得られても良い。
画像データベース作成装置20は、処理対象となる画像データがなくなるまで(ステップS108:No)、ステップS100〜S106を繰り返して実行し、対象画像データが終了すると(ステップS108:Yes)、本処理ルーチンを終了する。
図12は本実施例に係る画像データベース作成装置によって実行される他の識別子付与処理の処理ルーチンを示すフローチャートである。この例では、画像データに予めキーワードが付されている場合について説明する。なお、図11に示す識別子付与処理と同一の処理ステップについては、同一の符号を付すことで詳細な説明を省略する。
本処理ルーチンが開始されると、画像データ取得モジュールSM21は、記憶装置103から画像データを取得する(ステップS100)。画像データ取得モジュールSM21によって画像が取得されると、識別子検索用キーワード取得モジュールM25は、画像データにキーワードが対応付けられているか否かを判定する(ステップS101)。キーワードは、取得された画像データに対してメタデータとして予め対応付けられていても良く、あるいは、取得された画像データに対するキーワードとしてユーザによって入力装置22を介して入力されても良い。
識別子検索用キーワード取得モジュールM25によって画像に対応付けられているキーワードが取得されなかった場合には(ステップS101:No)、画像データベース作成装置20は、ステップS102〜ステップS108を実行する。
識別子検索用キーワード取得モジュールM25によって画像に対応付けられているキーワードが取得された場合には(ステップS101:Yes)、識別子検索モジュールM23は、取得されたキーワードを用いて、特徴量−識別子データベースDB3から該当する識別子を検索する(ステップS103)。既述のように、特徴量−識別子データベースDB3には、キーワード−識別子データベースDB2と同様のキーワード群が各識別子に対して対応付けられているので、取得されたキーワードを用いて、対応する識別子を検索することができる。特徴量−識別子データベースDB3において識別子に対応付けられているキーワード群には階層的に複数のキーワードが含まれているので、取得されたキーワードに一致するいずれかの識別子が検索されやすい。また、識別子検索用キーワード取得モジュールM25が取得されたキーワードに対して形態素解析、分かち書き処理を実行可能である場合には、分かち書き処理により得られた名詞をキーワードとして用いることによって、識別子の検索精度が向上される。なお、キーワードを用いた場合に検索される識別子は一般的に単数であるが、頻度の高いキーワード、例えば、「笑顔」の場合には、「顔」に加えて、個別に「笑顔」の識別子が用意されていることもあるため、複数の識別子が検索されることもある。
識別子が検索されると、画像データベース構築モジュールSM24は、取得された識別子を画像データに対応付けて、画像データベースを構築または更新する(ステップS106)。画像データベース作成装置20は、ステップS108の処理を実行して、本処理ルーチンを終了する。なお、本処理ルーチンでは、画像の特徴量を考慮する必要がないので、ステップS103において、特徴量−識別子データベースDB3に代えて、画像サーバー10が備えるキーワード−識別子データベースDB2が用いられても良い。
上記処理ルーチンでは、キーワードが取得された場合には、画像特徴量が全く考慮されないが、キーワードが取得された場合であっても、画像特徴量を用いて識別子が決定されても良い。この場合には、キーワードに基づいて決定された識別子に対して、高い類似度を付与し、画像特徴量に基づいて決定された識別子に対して、キーワードに基づいて決定された識別子に付与された類似度よりも低い類似度を付与しても良い。すなわち、画像データに予め付与されていたキーワードは、より画像データの特徴を表していると考えられるからである。
画像検索処理:
図13は本実施例に係る画像検索処理に際して実行される処理ルーチンを示すフローチャートである。画像検索処理は、プリンタ30等の検索端末装置からの検索要求を受けて、画像サーバー10において実行される。本処理ルーチンが開始されると、検索キーワード取得モジュールSM11は、検索キーワードを取得する(ステップS200)。検索キーワードの取得は、ユーザによって、例えば、プリンタ30の入力操作部32を介して入力されたキーワード、あるいは、プリンタ30から送信された画像データに対応付けられているメタデータに記述されているキーワードを取得することによって実現される。
検索キーワードが取得されると、識別子取得モジュールSM12は、キーワード−識別子データベースDB2を用いて取得した検索キーワードに対応する識別子を検索する(ステップS202)。具体的には、キーワード−識別子データベースDB2に含まれるキーワード群の中から検索キーワードに一致するキーワードを含むキーワード群を特定することによって、当該キーワード群に対応付けられている識別子が検索される。識別子取得モジュールSM12は、形態素解析、分かち書き処理を実行可能であってもよく、この場合には、検索キーワードとして単純名詞以外のキーワードが入力された場合であっても、分かち書き処理により得られた名詞をキーワードとして用いることによって、識別子の検索を実行することができる。なお、キーワード−識別子データベースDB2と特徴量−識別子データベースDB3とは定期的に同期処理されていることが望ましい。すなわち、キーワード−識別子データベースDB2における識別子とキーワードの対応関係と、特徴量−識別子データベースDB3における識別子とキーワードとの対応関係とが対応していない場合には、キーワードに基づいて適切な識別子を検索することができなくなり、結果として画像検索精度の低下をもたらすからである。
識別子が検索されると、画像データ検索モジュールSM13は、検索された識別子を用いて画像データベースDB1から画像データを検索する(ステップS204)。すなわち、本実施例では、画像データベースDB1から画像データを検索するに当たり、画像データの特徴量を用いた類似度判定を行うことなく、検索された識別子を用いて画像データの検索が実行される。また、検索された画像データには、識別子に対する類似度が対応付けられている。したがって、画像データベースDB1から画像データを迅速に検索することができると共に、検出された画像データとキーワードとの間の類似度を取得することができる。
画像データ送信モジュールSM14は、検索された画像データを、画像データ検索要求の送信元であるプリンタ30に対して送信して(ステップS206)、本処理ルーチンを終了する。なお、送信元であるプリンタ30の特定は、例えば、プリンタ30から送信された画像検索要求のヘッダに含まれる送信元アドレス(IPアドレス、MACアドレス)を用いることによって特定可能である。なお、本実施例において、ネットワークを介して実行される各装置間の通信は、周知のネットワークプロトコルに従って実行される。
画像検索要求処理:
図14は本実施例に係る画像検索要求処理に際して実行される処理ルーチンを示すフローチャートである。図15は本実施例に係るプリンタにおいて表示される画像検索結果画面の一例を示す説明図である。本処理ルーチンは、画像検索端末としてのプリンタ30によって実行される。本処理ルーチンが開始されると、プリンタ30のキーワード取得モジュールCM11は、キーワードを取得する(ステップS300)。具体的には、入力操作部32を介してユーザによって入力されたキーワード、あるいは、検索元となる画像データに予め対応付けられているメタデータに記述されているキーワードを抽出することによって実行される。
キーワードが取得されると、検索要求送信モジュールCM12は、画像サーバー10に対して検索要求を送信する(ステップS302)。具体的には、外部入出力インターフェース35、ネットワークNEを介してキーワードと検索要求コマンドとを含む検索要求データ列が画像サーバー10に送信される。検索結果受信モジュールCM13は、画像サーバー10から受信した検索結果としての1または複数の画像データを取得し(ステップS304)、取得した画像データを用いて複数の画像を表示部33に表示させて(ステップS306)、本処理ルーチンを終了する。なお、複数の画像を表示部33に表示させる際には、図15に示すように、各画像と識別子(キーワード)との関連度を示す指標として関連度(または類似度)を表示部33に表示しても良い。図15の例ではキーワードとして「笑顔」が用いられており、「笑顔」に割り当てられている2つの識別子「00001」、「02142」と、キーワードである「笑顔」または識別子「00001」、「02142」と画像データとの類似度に基づく関連度がそれぞれ表示されている。なお、図15に示す例のように、キーワードに対して複数の識別子が割り当てられている場合には、対応付けられている類似度のうち高い類似度、低い類似度または類似度の平均値に基づき算出された関連度が表示される。表示部33に検索画像と共に関連度を表示することにより、ユーザは、先のキーワードが検索キーワードとして適切であったか否かを判定することが可能となり、検索結果に満足がいかない場合には、キーワードを変更して再度、検索を実行することができる。なお、検索結果受信モジュールCM13には、検索結果表示制御モジュールの機能が包含されていても良く、あるいは、別途、検索結果表示制御モジュールが備えられていても良い。
以上説明した本実施例に係る画像データベース作成装置、画像データベース作成方法、画像サーバー、画像検索方法、プリンタ(画像検索端末装置)、画像検索システムによれば、画像データベースDB1は識別子と画像データとを対応付けて格納しており、識別子に基づいて画像データを検索することができる。すなわち、画像検索時において、従来用いられていた検索対象画像データおよび被検索画像データからの特徴量の抽出、両画像データの特徴量を用いた類似度の算出を実行する必要が無くなる。また、画像データベースDB1作成の際に用いられる特徴量−識別子データベースDB3では、1つの識別子に対して複数の特徴量が対応付けられている(数多くの画像データが対応付けられている)ので、従来の検索対象画像データと被検索画像データとの対比処理と比較して、より多くの画像データを迅速かつ精度良く検索することができる。
また、本実施例では、画像検索に際して、予めキーワードに基づいて識別子を検索し、検索された識別子を用いて画像データを検索することができるので、画像データの検索速度および検索精度を更に向上させることができる。すなわち、画像検索時において、従来用いられていた画像特徴量の抽出、類似度の算出を実行する必要が無くなり、また、一の識別子は、概念的に関連する複数の画像データに対応付けられ得るので、画像データの検索を迅速かつ精度良く実行することができる。
本実施例において画像データベース作成装置20によって作成される画像データベースDB1では、画像データに対して識別子に加えて、識別子(キーワード)に対する画像データの類似度が格納されているので、識別子を用いた画像検索時にあっても、検索結果に対して優先順位を付けることができる。また、ユーザに対して、検索に使用されたキーワードと検索により得られた画像との関連度を示すことが可能となり、ユーザは使用したキーワードが適切なキーワードであったか否かを数値に基づいて判断することができる。
本実施例において画像データベースDB1を作成する際に、画像データベース作成装置20によって用いられる特徴量−識別子データベースDB3には、1つの識別子に対して複数種類の特徴量が対応付けられているので、各識別子に対して対応付けられているキーワード(キーワード群)を十分に考慮した(包含した)画像データベースDB1を作成することができる。この結果、一の識別子に対して概念的に関連する複数の画像データが対応付けられた画像データベースDB1を得ることが可能となり、当該画像データベースDB1を用いた画像データの検索精度を向上させることができる。また、本実施例では、検索頻度が高い固有のキーワード、例えば、「笑顔」については、「顔」のキーワード群に対する識別子が対応付けられると共に、固有の識別子が対応付けられているので、検索頻度が高いキーワードに対応する画像データを迅速に検索することができる。
さらに、本実施例にでは、画像検索時に用いられるキーワード−識別子データベースDB2として、1の識別子に階層的な複数のキーワードから構成されるキーワード群が対応付けられているデータベースを用いている。したがって、ユーザによって入力されるキーワードに表現の揺らぎ、キーワードに同義語が存在する場合であっても、画像サーバー10は、表現の揺らぎ、同義語を考慮した同義語データベースの検索処理を行うことなく、キーワード−識別子データベースDB2から一致するキーワードを精度良く検索することができる。すなわち、キーワード群として上位概念から下位概念に亘る階層的なキーワードを備えているので抽象的なキーワードに対しても対応できると共に、同義語、関連する複数のキーワードを備えているので、ユーザによって異なるキーワードの表現に対応することができる。
また、キーワードとして新たな候補語が生まれた場合にも、対応するキーワード群のリストを更新(すなわち、対応するキーワード群に加える)ことにより、対処可能であり、識別子を新たに付与したり、識別子を変更する必要が無く、キーワード−識別子データベースDB2、特徴量−識別子データベースDB3のメンテナンスを容易に行うことができる。さらに、異なるデータベースでは一般的に固有のキーワードが用いられているが、本実施例によれば、これら異なるデータベースを統合する際にも、従前の各データベースに固有のキーワードを維持しつつ、単一の識別子を対応付けることが可能となり、キーワードの変更、更新等の作業を要することなくデータベースを統合することができる。また、画像検索端末装置であるプリンタ30においても、キーワードに対して同義語等の付加情報を加えることなく、キーワードのみを画像サーバー10に送信すれば良い。したがって、キーワードの揺らぎに起因する検索精度の低下を防止、抑制すると共に、キーワードの揺らぎに起因する画像検索時間についても時間削減を図ることができる。
・変形例:
(1)上記実施例では、特徴量−識別子データベースDB3とキーワード−識別子データベースDB2とがそれぞれ別々に備えられていたが、共通のデータベースとして、画像サーバー10に備えられていても良い。すなわち、図7に示すように、識別子−画像特徴量−キーワード(キーワード群)が対応付けられている1つのデータベースを用いても良い。この場合には、特徴量−識別子データベースDB3とキーワード−識別子データベースDB2との間における内容の同期作業が不要となり、また、画像データベース作成装置20の構成を簡易にすることができる。
(2)上記実施例では、画像検索端末装置としてプリンタ30を例にとって説明したが、パーソナルコンピューター40も同様にして用いることができる。パーソナルコンピューター40は、表示ディスプレイ41と入力装置(キーボード、マウス)42とを備えている。
(3)上記実施例では、画像検索端末装置としてのプリンタ30から検索キーワードが画像サーバー10に対して送信される例にとって説明したが、プリンタ30からキーワードに代えて検索対象となる画像データが画像サーバー10に対して送信されても良い。この場合には、例えば、画像サーバー10は、受信した画像データの特徴量を複数種取得し、特徴量−識別子データベースを用いて、検索用の識別子を検索すればよい。特徴量−識別子データベースとしては、上述の特徴量−識別子データベースDB3を用いれば良い。この場合であっても、画像データが識別子と対応付けられている画像データベースDB1が用いられ得ることに変わりはなく、画像検索処理速度の向上、画像検索精度の向上を図ることができる。
(4)上記実施例では、画像サーバー10として、クライアントからの要求に応じての画像データベースを検索するサーバーコンピューターを例にとって画像検索処理について説明したが、プリンタ30、パーソナルコンピューター40において実行されても良い。例えば、パーソナルコンピューター40の記憶装置に格納されているローカルな画像データベースに対して上記した画像データ検索が実行されも良い。また、プリンタ30に大容量記憶装置が備えられている場合には、上記した画像検索方法は、プリンタ30におけるローカルな画像データ検索に適用されても良い。すなわち、画像サーバーはネットワークに接続されていない、スタンドアローンのパーソナルコンピューターまたはプリンタが有する機能の一部、さらにはコンピュータープログラム、コンピュータープログラムが格納されたコンピューター読み取り可能媒体として実現されても良い。この場合には、パーソナルユースにおける画像データ検索の利便性、すなわち、検索速度の向上、検索精度の向上、検索の容易化を実現することができる。なお、コンピューター読み取り可能媒体としては、CD、DVD、ハードディスクドライブ、フラッシュメモリといった種々の記録媒体を用いることができる。
(5)上記実施例では、画像検索を例にとって説明したが、その他のコンテンツ、例えば、映像、音楽、ゲーム、電子書籍についても同様に適用し得る。映像の特徴量は画像と同様にして、また、キーワードはメタデータから抽出することにより取得可能であり、音楽の特徴量については曲調検出技術を適用することにより、またキーワードについてはメタデータから抽出することにより可能であり、ゲームについてはメタデータ等に基づいてキーワードを取得可能であり、電子書籍については頻出語彙を分析することにより特徴量を取得可能である。すなわち、本実施例では、図12に示すように、コンテンツに対してキーワードが対応付けられていれば、識別子によって検索可能なデータベースを作成することができる。
(6)上記実施例では、画像サーバー10から受け取った検索結果は、プリンタ40において表示のための処理が施され、表示部33に表示されているが、画像サーバー10において表示用の検索結果データを作成し、プリンタ40に対して送信しても良い。画像サーバー10からの検索結果データをプリンタ40にて表示するための手法としては、例えば、画像サーバー10にWebサーバー機能を実装し、プリンタ40にWebブラウザを実装する手法がある。この手法によれば、汎用的なHTTPプロトコルに従って、HTMLデータベースの表示を行うことができる。
以上、実施例、変形例に基づき本発明について説明してきたが、上記した発明の実施の形態は、本発明の理解を容易にするためのものであり、本発明を限定するものではない。本発明は、その趣旨並びに特許請求の範囲を逸脱することなく、変更、改良され得ると共に、本発明にはその等価物が含まれる。
ISS…画像検索システム
10…サーバーコンピューター(画像サーバー)
101…CPU
102…メモリ
103…第1の記憶装置
104…第2の記憶装置
105…入出力インターフェース
20…画像データベース作成装置
21…表示ディスプレイ
22…入力操作部
201…CPU
202…メモリ
203…記憶装置
204…入出力インターフェース
30…プリンタ
31…制御回路
310…CPU
311…メモリ
312…入出力インターフェース
32…入力操作部
33…表示部
34…印刷部
35…外部入出力インターフェース
40…パーソナルコンピューター
41…表示ディスプレイ
42…入力装置
CP1…画像検索要求プログラム
CM11…キーワード取得モジュール
CM12…検索要求送信モジュール
CM13…検索結果受信モジュール
NE…ネットワーク
SP1…画像検索プログラム
SM11…キーワード取得モジュール
SM12…識別子取得モジュール
SM13…画像データ検索モジュール
SM14…画像データ送信モジュール
SP2…画像データベース作成プログラム
SM21…画像データ取得モジュール
SM22…特徴量取得モジュール
SM23…識別子検索モジュール
SM24…画像データベース構築モジュール
SM25…識別子検索用キーワード取得モジュール
DB1…画像データベース
DB2…キーワード−識別子データベース
DB3…特徴量−識別子データベース

Claims (11)

  1. 画像データベース作成装置であって、
    画像を取得する画像取得部と、
    画像を特徴付ける複数の特徴量を前記取得した画像から抽出する特徴量抽出部と、
    前記抽出した複数の特徴量を用いて、画像を特徴付ける複数の特徴量からなる特徴量群と識別子とを予め対応付けて記憶する特徴量−識別子データベースから、対応する識別子を検索する識別子検索部と、
    前記検索された識別子と前記取得した画像とを対応付けて画像データベースに格納する画像データベース構築部とを備える、画像データベース作成装置。
  2. 請求項1に記載の画像データベース作成装置はさらに、
    前記取得された画像に関連するキーワードを取得するキーワード取得部を備え、
    前記特徴量−識別子データベースにおいて、前記識別子はさらに複数のキーワードと対応付けられており、
    前記識別子検索部は、前記画像に関連するキーワードが取得された場合には、前記取得されたキーワードを用いて前記識別子を検索する、
    画像データベース作成装置。
  3. 請求項2に記載の画像データベース作成装置において、
    前記取得された画像には予めキーワードが対応付けられており、
    前記キーワード取得部は、前記取得された画像から前記予め対応付けられているキーワードを取得する、
    画像データベース作成装置。
  4. 請求項2に記載の画像データベース作成装置はさらに、
    キーワードを入力可能なキーワード入力部を備え、
    前記キーワード取得部は、前記キーワード入力部を介して入力されたキーワードを取得する、
    画像データベース作成装置。
  5. 請求項1から4のいずれかに記載の画像データベース作成装置において、
    前記特徴量は特徴量の種類を表す種別と、各種別における特徴量の特性を示す数値を含み、
    前記識別子検索部は、同一の種別の特徴量の数値を用いて、前記抽出した複数の特徴量に対応する前記識別子を検索する、
    画像データベース作成装置。
  6. 請求項2から5のいずれかに記載の画像データベース作成装置において、
    前記特徴量−識別子データベースは、固有のキーワードに対応する専用の識別子を含んでいる、
    画像データベース作成装置。
  7. 請求項2から6のいずれかに記載の画像データベース作成装置において、
    前記特徴量−識別子データベースに格納されている前記複数のキーワードは、階層化されている、
    画像データベース作成装置。
  8. 請求項2から7のいずれかに記載の画像データベース作成装置において、
    前記画像データベース構築部はさらに、前記検索された識別子に対する前記取得した画像の類似度を対応付けて前記画像データベースに格納する、
    画像データベース作成装置。
  9. 画像データベース作成方法であって、
    取得した画像から画像を特徴付ける複数の特徴量を抽出し、
    前記抽出した複数の特徴量を用いて、画像を特徴付ける複数の特徴量からなる特徴量群と識別子とを予め対応付けて記憶する特徴量−識別子データベースから、対応する識別子を検索し、
    前記検索した識別子と前記取得した画像とを対応付けて画像データベースに格納する、
    画像データベース作成方法。
  10. 画像検索装置であって、
    検索キーワードを取得する検索キーワード取得部と、
    前記取得したキーワードを用いて、キーワードと識別子とを対応付けて記憶するキーワード−識別子データベースから対応する識別子を検索する識別子検索部と、
    前記検索された識別子を用いて、画像と識別子とを対応付けて格納する画像−識別子データベースから対応する画像を検索する画像検索部とを備える、画像検索装置。
  11. 画像検索方法であって、
    検索キーワードを取得し、
    前記取得したキーワードを用いて、キーワードと識別子とを対応付けて記憶するキーワード識別子データベースから対応する識別子を検索し、
    前記検索した識別子を用いて、画像と識別子とを対応付けて格納する画像−識別子データベースから対応する画像を検索する、画像検索方法。
JP2009200088A 2009-08-31 2009-08-31 画像データベース作成装置、画像検索装置、画像データベース作成方法および画像検索方法 Pending JP2011053781A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2009200088A JP2011053781A (ja) 2009-08-31 2009-08-31 画像データベース作成装置、画像検索装置、画像データベース作成方法および画像検索方法
US12/872,947 US20110052074A1 (en) 2009-08-31 2010-08-31 Image database creation device, image retrieval device, image database creation method and image retrieval method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009200088A JP2011053781A (ja) 2009-08-31 2009-08-31 画像データベース作成装置、画像検索装置、画像データベース作成方法および画像検索方法

Publications (1)

Publication Number Publication Date
JP2011053781A true JP2011053781A (ja) 2011-03-17

Family

ID=43625021

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009200088A Pending JP2011053781A (ja) 2009-08-31 2009-08-31 画像データベース作成装置、画像検索装置、画像データベース作成方法および画像検索方法

Country Status (2)

Country Link
US (1) US20110052074A1 (ja)
JP (1) JP2011053781A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013099373A1 (ja) * 2011-12-27 2013-07-04 三菱電機エンジニアリング株式会社 作業管理装置および作業管理システム

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8290203B1 (en) * 2007-01-11 2012-10-16 Proofpoint, Inc. Apparatus and method for detecting images within spam
JP5586970B2 (ja) * 2010-01-25 2014-09-10 キヤノン株式会社 情報処理装置および制御方法およびプログラム
CN102385571B (zh) * 2010-09-06 2016-03-30 联想(北京)有限公司 一种显示方法及显示装置
JP2013074461A (ja) * 2011-09-28 2013-04-22 Casio Comput Co Ltd 画像処理装置、画像処理方法及びプログラム
US9298712B2 (en) * 2012-12-13 2016-03-29 Microsoft Technology Licensing, Llc Content and object metadata based search in e-reader environment
CN110321448B (zh) * 2019-06-27 2023-10-17 腾讯科技(深圳)有限公司 一种图像检索方法、装置和存储介质
CN110321872B (zh) * 2019-07-11 2021-03-16 京东方科技集团股份有限公司 人脸表情识别方法及装置、计算机设备、可读存储介质
CN112800258B (zh) * 2021-03-11 2024-05-31 上海依图网络科技有限公司 图像检索方法、装置、电子设备及计算机可读存储介质

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6970860B1 (en) * 2000-10-30 2005-11-29 Microsoft Corporation Semi-automatic annotation of multimedia objects
US7457825B2 (en) * 2005-09-21 2008-11-25 Microsoft Corporation Generating search requests from multimodal queries
US20070098257A1 (en) * 2005-10-31 2007-05-03 Shesha Shah Method and mechanism for analyzing the color of a digital image
US8065313B2 (en) * 2006-07-24 2011-11-22 Google Inc. Method and apparatus for automatically annotating images
US7840076B2 (en) * 2006-11-22 2010-11-23 Intel Corporation Methods and apparatus for retrieving images from a large collection of images
JP5044236B2 (ja) * 2007-01-12 2012-10-10 富士フイルム株式会社 コンテンツ検索装置、およびコンテンツ検索方法
US8943038B2 (en) * 2007-10-04 2015-01-27 Gefemer Research Acquisitions, Llc Method and apparatus for integrated cross platform multimedia broadband search and selection user interface communication
US20110085739A1 (en) * 2008-06-06 2011-04-14 Dong-Qing Zhang System and method for similarity search of images
US7890512B2 (en) * 2008-06-11 2011-02-15 Microsoft Corporation Automatic image annotation using semantic distance learning
WO2010075408A1 (en) * 2008-12-22 2010-07-01 The Trustees Of Columbia University In The City Of New York System and method for annotating and searching media
JP2011070412A (ja) * 2009-09-25 2011-04-07 Seiko Epson Corp 画像検索装置および画像検索方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013099373A1 (ja) * 2011-12-27 2013-07-04 三菱電機エンジニアリング株式会社 作業管理装置および作業管理システム
JP2013132736A (ja) * 2011-12-27 2013-07-08 Mitsubishi Electric Engineering Co Ltd 作業管理装置および作業管理システム

Also Published As

Publication number Publication date
US20110052074A1 (en) 2011-03-03

Similar Documents

Publication Publication Date Title
JP2011053781A (ja) 画像データベース作成装置、画像検索装置、画像データベース作成方法および画像検索方法
JP2011070412A (ja) 画像検索装置および画像検索方法
US10810252B2 (en) Searching using specific attributes found in images
US8565537B2 (en) Methods and apparatus for retrieving images from a large collection of images
US10789525B2 (en) Modifying at least one attribute of an image with at least one attribute extracted from another image
US9507803B2 (en) Visual search using multiple visual input modalities
JP5309155B2 (ja) イメージ検索における対話型概念学習
CN110516096A (zh) 合成感知数字图像搜索
US8577882B2 (en) Method and system for searching multilingual documents
US11704357B2 (en) Shape-based graphics search
US20080215548A1 (en) Information search method and system
JP4948607B2 (ja) 画像検索装置、画像分類装置及び方法並びにプログラム
AU2016201273A1 (en) Recommending form fragments
JP2006048633A (ja) 画像検索システム、画像検索プログラムおよび記憶媒体、並びに画像検索方法
JP2010250637A (ja) 画像サーバー、画像検索システム、画像検索方法および画像管理方法
JP2006119723A (ja) 画像処理装置、画像処理方法
JP2010250630A (ja) 画像サーバー、画像検索システムおよび画像検索方法
JP2011203776A (ja) 類似画像検索装置、方法及びプログラム
US20240004880A1 (en) Data augmentation system, data augmentation method, and information storage medium
JP2010250636A (ja) 画像検索端末装置および画像検索要求方法
JP2002007413A (ja) 画像検索装置
JP2010250634A (ja) 画像サーバー、画像検索システム、画像検索方法およびインデックス作成方法
JP2014010640A (ja) 画像検索装置、情報処理方法、プログラム
JP6983105B2 (ja) データ蓄積システム及びデータ検索方法
JP2010250633A (ja) 画像サーバー、画像検索システム、画像検索方法およびインデックス作成方法