JP4313738B2 - 画像検索装置および方法、そのプログラム及び記録媒体 - Google Patents

画像検索装置および方法、そのプログラム及び記録媒体 Download PDF

Info

Publication number
JP4313738B2
JP4313738B2 JP2004238768A JP2004238768A JP4313738B2 JP 4313738 B2 JP4313738 B2 JP 4313738B2 JP 2004238768 A JP2004238768 A JP 2004238768A JP 2004238768 A JP2004238768 A JP 2004238768A JP 4313738 B2 JP4313738 B2 JP 4313738B2
Authority
JP
Japan
Prior art keywords
image
character string
information storage
storage means
index information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2004238768A
Other languages
English (en)
Other versions
JP2006059036A (ja
Inventor
幸生 植松
良治 片岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2004238768A priority Critical patent/JP4313738B2/ja
Publication of JP2006059036A publication Critical patent/JP2006059036A/ja
Application granted granted Critical
Publication of JP4313738B2 publication Critical patent/JP4313738B2/ja
Anticipated expiration legal-status Critical
Active legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、Webに存在する画像を検索するための画像検索装置および方法、そのプログラム及び記録媒体に関する。
従来において、画像検索装置とは、コンピュータ上で動作する画像(画像データ、画像情報)を検索するシステムのことで、他のコンピュータから入力された情報を元に画像を提示する技術を指している。こうした画像検索装置の一つの例として、図6に従来技術による画像検索装置のシステム構成例を示す。
この図6に示す、画像検索装置20は、画像インデックス21と、画像検索部22と、クライアント出力部23と、クライアント入力受付部24と、を備えている。さらに画像検索装置20は、インターネットなどのネットワーク4に接続しており、このネットワーク4を介してクライアント2も接続している。
こうした図6に示す従来技術による画像検索装置においては、文字列画像検索と類似画像検索の2種類の検索方法がある。
まず、文字列画像検索の場合は、画像インデックス21には、Web(ネットワーク4)上の画像をリンクしているページの文章から画像に関連付ける文字列情報を自動的に生成し、これを保存している。
クライアント入力受付部24よりクライアント2からの画像検索要求に伴う検索文字列が転送され、その文字列について、画像インデックス21に保存されている画像と関連付けられた文字列情報内に当該文字列が存在するか否かが、画像検索部22によって判断される。
画像検索部22は、検索文字列が文字列情報内に存在する画像の一覧を提示する画面を、クライアント出力部23に転送する。この方法は一般のWeb画像検索サービスに用いられている。
次に、図7に従来技術によるWebページ収集ロボット(Webページ収集手段)が画像インデックスを作成するためのフローチャートを示す。
従来技術によるWebページ収集ロボットは、シード(seed)と呼ばれるWebページを収集するための種となるURI(uniform resource identifier)を出発点としてWebページを取得する。
まず、ステップ20:S20でWebページの収集が開始され、ステップ21:S21において、そのシードのWebページをHTTP(Hypertext Transfer Protocol)などのプロトコルを利用してネットワーク上から取得する。
次に、ステップ22:S22において、取得したWebページの内容がテキストなのか、あるいは画像なのかをデータ分類するために、そのWebページを判定する。画像であると判定された場合(YES)は、ステップ27:S27において、その画像を一時保存したあと、画像特徴量やテキスト情報を抽出して保存する。
一方、ステップ22:S22においてNoと判定されると、ステップ23:S23において、HTML(Hypertext Mark-up language)等で記述される文字列を解析して、そのWebページがリンクするURIを取得してタグの要素を抽出する。リンクするURIは次の収集時に利用される。
次に、ステップ24:S24において、そのWebページからタグを取り除いたテキスト情報を抽出する。
次に、ステップ25:S25において、抽出したテキスト情報を保存する。
この後に、ステップ26:S26において、収集すべきすべてのWebページを取得し終わったことが判定されて、YESの場合は終了となり、NOの場合は再びステップ21:S21へ処理が戻る。
なお、更に異なる従来技術である類似画像検索では、画像からあらかじめ画像特徴量(テクスチャ、色等)を抽出し画像インデックスに保存している。画像検索部ではクライアント入力受付部より転送されてきた画像の特徴量を抽出して、その特徴量と画像インデックスに保存される特徴量を比較し、類似していると推測される画像を自動的に判断し、その画像の一覧を提示する画面をクライアント出力部に転送する。(特許文献1〜4を参照)
特開2000−250943 特開平10−240765 特開平11−025271 特開平11−224256
上述した従来技術における画像検索装置では、文字列画像検索を行った検索結果の画像を入力として類似画像検索を行う場合、インターネット上のWebページにあるような様々な大きさや画質を対象とした検索をするには、類似画像検索に使用する画像特徴量の次元数が数百次元という大量のデータを必要とし、このため計算量が膨大になっていた。
また、類似画像を自動的に判断する処理の計算量増大に伴うコストが膨大となり、実用的な速度を保ったシステムの構築が難しいという課題があった。
本発明は、これらの課題に鑑みてなされたもので、その目的とするところは、画像を含むWebページのテキスト情報や画像特徴量をもって画像インデックスに保存される情報を事前に分類することができ、画像検索の検索対象を限定することができ、画像検索に係る計算量を軽減可能な画像検索装置および方法、そのプログラム及び記録媒体を提供することにある。
課題を解決するために、請求項1に記載の本発明は、画像検索要求に応じてWebページに含まれる画像を検索するための画像検索装置において、前記画像検索要求を発するためのクライアント情報端末と、前記Webページを構成する情報を収集して画像と文字列とを抽出するためのWebページ収集手段と、前記Webページ収集手段が抽出した前記
画像と前記文字列とを分類のために予め設定されたカテゴリ毎のインデックス情報に関連付けするためのカテゴリ分類手段と、前記画像に類似する類似画像を検索のためのインデックスとして前記画像と共に前記カテゴリ毎に分類して記憶するための画像インデックス情報記憶手段と、前記画像インデックス情報記憶手段と連係し、前記カテゴリ毎に分類された前記文字列を前記類似画像に関連付けて検索のためのインデックスとして記憶するための文字列インデックス情報記憶手段と、前記画像検索要求に含まれる文字列を手がかりに前記文字列インデックス情報記憶手段に問い合わせ、当該文字列インデックス情報記憶手段によって前記画像インデックス情報記憶手段から検索取得された当該文字列の意味に
対応する複数の候補となる前記類似画像を前記クライアント情報端末へ提示するための文字列画像検索手段と、前記クライアント情報端末に提示された前記類似画像のうちから選択された類似画像に応じて前記画像インデックス情報記憶手段に問い合わせて画像特徴量を取得し、また、当該選択された類似画像に応じて前記文字列インデックス情報記憶手段に問い合わせてカテゴリ情報を取得し、当該画像特徴量と当該カテゴリ情報を検索条件として前記画像インデックス情報記憶手段に記憶された画像を検索して取得し、再び前記クライアント情報端末へ提示するための類似画像検索手段と、を備え
る。
また、請求項2に記載の本発明は、画像検索要求に応じてWebページに含まれる画像を検索するための画像検索装置で処理する画像検索方法において、前記画像検索装置により、クライアント情報端末により前記画像検索要求を発するステップと、Webページ収集手段により前記Webページを構成する情報を収集して画像と文字列とを抽出するステップと、カテゴリ分類手段により前記Webページ収集手段が抽出した前記画像と前記文字列とを分類のために予め設定されたカテゴリ毎のインデックス情報に関連付けするステップと、画像インデックス情報記憶手段により前記画像に類似する類似画像を検索のためのインデックスとして前記画像と共に前記カテゴリ毎に分類して記憶するステップと、文字列インデックス情報記憶手段により前記画像インデックス情報記憶手段と連係し、前記カテゴリ毎に分類された前記文字列を前記類似画像に関連付けて検索のためのインデックスとして記憶するステップと、文字列画像検索手段により前記画像検索要求に含まれる文字列を手がかりに前記文字列インデックス情報記憶手段に問い合わせ、当該文字列インデックス情報記憶手段によって前記画像インデックス情報記憶手段から検索取得された当該文字列の意味に対応する複数の候補となる前記類似画像を前記クライアント情報端末へ提示するステップと、類似画像検索手段により前記クライアント情報端末に提示された前記類似画像のうちから選択された類似画像に応じて前記画像インデックス情報記憶手段に問い合わせて画像特徴量を取得し、また、当該選択された類似画像に応じて前記文字列インデックス情報記憶手段に問い合わせてカテゴリ情報を取得し、当該画像特徴量と当該カテゴリ情報を検索条件として前記画像インデックス情報記憶手段に記憶された画像を検索して取得し、再び前記クライアント情報端末へ提示するステップと、を有する。
また、請求項3に記載の本発明は、画像検索要求に応じてWebページに含まれる画像を検索するための画像検索装置で実行させるための画像検索プログラムにおいて、前記画像検索装置に、クライアント情報端末により前記画像検索要求を発するステップと、Webページ収集手段により前記Webページを構成する情報を収集して画像と文字列とを抽出するステップと、カテゴリ分類手段により前記Webページ収集手段が抽出した前記画像と前記文字列とを分類のために予め設定されたカテゴリ毎のインデックス情報に関連付けするステップと、画像インデックス情報記憶手段により前記画像に類似する類似画像を検索のためのインデックスとして前記画像と共に前記カテゴリ毎に分類して記憶するステップと、文字列インデックス情報記憶手段により前記画像インデックス情報記憶手段と連係し、前記カテゴリ毎に分類された前記文字列を前記類似画像に関連付けて検索のためのインデックスとして記憶するステップと、文字列画像検索手段により前記画像検索要求に含まれる文字列を手がかりに前記文字列インデックス情報記憶手段に問い合わせ、当該文字列インデックス情報記憶手段によって前記画像インデックス情報記憶手段から検索取得された当該文字列の意味に対応する複数の候補となる前記類似画像を前記クライアント情報端末へ提示するステップと、類似画像検索手段により前記クライアント情報端末に提示された前記類似画像のうちから選択された類似画像に応じて前記画像インデックス情報記憶手段に問い合わせて画像特徴量を取得し、また、当該選択された類似画像に応じて前記文字列インデックス情報記憶手段に問い合わせてカテゴリ情報を取得し、当該画像特徴量と当該カテゴリ情報を検索条件として前記画像インデックス情報記憶手段に記憶された画像を検索して取得し、再び前記クライアント情報端末へ提示するステップと、を有する。
また、請求項4に記載の本発明は、画像検索要求に応じてWebページに含まれる画像を検索するための画像検索装置で実行させるための画像検索プログラムを記録した記録媒体において、前記画像検索装置に、クライアント情報端末により前記画像検索要求を発するステップと、Webページ収集手段により前記Webページを構成する情報を収集して画像と文字列とを抽出するステップと、カテゴリ分類手段により前記Webページ収集手段が抽出した前記画像と前記文字列とを分類のために予め設定されたカテゴリ毎のインデックス情報に関連付けするステップと、画像インデックス情報記憶手段により前記画像に類似する類似画像を検索のためのインデックスとして前記画像と共に前記カテゴリ毎に分類して記憶するステップと、文字列インデックス情報記憶手段により前記画像インデックス情報記憶手段と連係し、前記カテゴリ毎に分類された前記文字列を前記類似画像に関連付けて検索のためのインデックスとして記憶するステップと、文字列画像検索手段により前記画像検索要求に含まれる文字列を手がかりに前記文字列インデックス情報記憶手段に問い合わせ、当該文字列インデックス情報記憶手段によって前記画像インデックス情報記憶手段から検索取得された当該文字列の意味に対応する複数の候補となる前記類似画像を前記クライアント情報端末へ提示するステップと、類似画像検索手段により前記クライアント情報端末に提示された前記類似画像のうちから選択された類似画像に応じて前記画像インデックス情報記憶手段に問い合わせて画像特徴量を取得し、また、当該選択された類似画像に応じて前記文字列インデックス情報記憶手段に問い合わせてカテゴリ情報を取得し、当該画像特徴量と当該カテゴリ情報を検索条件として前記画像インデックス情報記憶手段に記憶された画像を検索して取得し、再び前記クライアント情報端末へ提示するステップと、を有する。
本発明によれば、画像を含むWebページのテキスト情報や画像特徴量をもって画像インデックスに保存される情報を事前に分類することができ、画像検索の検索対象を限定することができ、画像検索に係る計算量を軽減可能な画像検索装置および方法、そのプログラム及び記録媒体を提供することができる。
本発明は、Web(ネットワーク)にある画像(画像データ、画像情報)に対し、所定の文字列(文字列情報)について、その画像に関連付けられたテキスト情報を保存するデータベースに存在するか否かを判断して画像の検索を行う文字列画像検索プログラムと、及び、所定の画像から類似した画像を検索する類似画像検索プログラムと、を組み合わせて構成される画像検索装置および方法、そのプログラム及び記録媒体である。
図1には、本発明の画像検索装置の実施の形態に係る、全体構成を説明するための構成図を示す。
この図1には、画像検索装置1が示されており、この画像検索装置1にはインターネット(www)などのネットワーク3およびネットワーク4と、このネットワーク4を介して接続しているクライアント(クライアント情報端末)2と、が接続している。
画像検索装置1は、その内部にネットワーク4と接続してクライアント2からの入力を受付するためのクライアント入力受付部10と、クライアント2へ情報を出力するためのクライアント出力部9と、ネットワーク3に接続してWebページを収集するためのWebページ収集ロボット(Webページ収集手段)11と、Webページ収集ロボット11が収集したWebページを所定のカテゴリで分類するためのカテゴリ分類部(カテゴリ分類手段)12と、このカテゴリ分類部12で分類された情報を記憶するための画像インデックス(画像インデックス情報記憶手段)5と、および画像インデックス5に連係して動作する文字列インデックス(文字列インデックス情報記憶手段)6と、類似画像画像検索部(類似画像検索手段)7と、文字列画像検索部(文字列画像検索手段)8と、を備えている。
こうした構成による本発明の画像検索装置1を使って、クライアント2から発せられる画像検索要求に応じて画像検索が実行される。なお、クライアント2は画像検索を行うための検索要求や、あるいは検索した画像を取得して画像表示するための情報端末によって構成されている。また画像とは、画像を構成するための画像データならびに画像情報を含むものである。
クライアント2から発せられた画像検索要求は、ネットワーク4を介してクライアント入力受付部10により受付される。このクライアント入力受付部10により受付された画像検索要求は、文字列画像検索部8と類似画像画像検索部7を通して、文字列インデックス6と画像インデックス5に送られて、ここで、要求する画像に関して問い合わせを行う。
この問い合わせに対して、文字列インデックス6は要求された画像に関係する文字列に基づいて、その文字列の意味に関連する複数の候補となる類似画像を、連係して動作する画像インデックス5の中から検索して取得する。
取得された複数の類似画像は、クライアント出力部9を介してクライアント2に提示され、ここで、クライアント2を操作する図示しない操作者により選択され、この選択指示が入力される。選択された類似画像に基づいて類似画像画像検索部7は画像インデックス5の中から該当する画像を検索して取得する。類似画像検索部7にて取得された画像は、クライアント出力部9を介してクライアント2に提示される。
なお、画像インデックス5と文字列インデックス6にそれぞれ記憶されている文字列情報と画像情報(類似画像を含む)とは、インターネットなどのネットワーク3を介して収集された情報である。こうした情報収集はWebページ収集ロボット11により実行される。Webページ収集ロボット11による情報収集は、クライアント2からの画像要求の都度に行ってもよく、あるいは所定の周期で収集してもよい。
このようなWebページ収集ロボット11により収集された情報は、カテゴリ分類部12により予め設定されたカテゴリ毎に分類される。カテゴリ毎に分類された画像情報は、自身が分類されたカテゴリを示すインデックス情報(索引情報)が付与され、同様に文字列情報にも自身のカテゴリを示すインデックス情報が付与される。その後に、画像インデックス5と文字列インデックス6にそれぞれ整理されて記憶され保存される。
図2に、本発明の画像検索装置の実施の形態に係る、Webページ収集ロボット11とカテゴリ分類部12とが、文字列インデックス6および画像インデックス5へ記憶する情報を作成するまでのフローチャートを示す。
まず、ステップ1:S1にてインターネットなどのネットワーク3に存在するWebページから画像情報の収集が開始される。
次に、ステップ2:S2にて、インターネット上のWebページからWebページの情報を取得する。この情報取得において、Webページ収集ロボット11はシード(seed)と呼ばれるWebページを収集するための種となるURI(uniform resource identifier)を出発点としてWebページの情報を取得する。Webページ収集ロボット11は、シードのWebページをHTTP(Hypertext Transfer Protocol)などのプロトコルを利用し、ネットワーク3(インターネット)上のWebページからHTML形式で目的の情報を取得する。
次に、ステップ3:S3において、Webページから取得したHTMLを解析し、リンク情報を抽出する。リンク情報にはURIで記述される他のHTMLへのポインタや、画像へのリンクが含まれる。
次に、ステップ4:S4において、Webページから取得したHTMLの解析の結果で得られたリンクの中で、このリンク先が画像であるもののすべてを一時保存する。さらに、こうして一時保存された画像データの中から画像特徴量を抽出する。抽出された画像特徴量は画像インデックス5に保存される。画像インデックス5は、その画像のURIを主キーとして問い合わせを行うことができる。
次に、ステップ5:S5において、入力されたHTMLからテキスト情報を抽出し、次のステップ6:S6にて文字列インデックス6に保存する。なお、ここでいうテキスト情報とは、HTMLから抜き出したテキストや、画像をリンクするタグの近傍のテキスト意味している。なお、本発明では保存する文字列情報を限定するものではない。
次に、ステップ7:S7において、抽出された画像特徴量とテキスト情報を基にURIが属するカテゴリを自動的に判断し文字列インデックス6のデータベースに保存する。カテゴリ分類を行う方法は様々だが、Naive Bayes、c4.5、SVMなどの機械学習を用いた分類を行ってもよい。
また、その場合には学習器を作るためにカテゴリ情報を事前に付与したデータが必要となる。それ以外の場合では、EMやK-Meansなどを利用したクラスタリングを行い、分類しても構わない。
また、カテゴリ情報を限定するものではないが、カテゴリ情報を事前に付与したデータを与える場合のカテゴリとしては(アイドル、風景、乗り物、食べ物)などに分類してもよい。また、分類できなかったものに関しては、“分類なし”というカテゴリを作る。
また、前述のWeb画像検索においては、例えば分類に関しては、画像をリンクする元のページを親ページとすると、その親ページの分類を行い、さらにそのWebページに属する画像は親ページが分類されたカテゴリとしてもよいし、画像の周辺テキストを利用して画像そのものをカテゴリ分類してもよい。
分類するための情報に、親ページで分類する場合には親ページに属する画像を入力してもよい。ここで自動的に分類されたカテゴリ情報を文字列インデックス6に保存する。
次に、ステップ8:S8において、収集するすべてのWebページに対してステップ2:S2〜ステップ7:S7までの処理が終了したか否かが判断される。ここで、処理がすべて終了したと判断されると(YES)、ステップ9:S9にてWebページのデータ収集に関する、すべての処理が終了する。一方、処理が終了していないと判断されると(NO)、再び処理はステップ2:S2へ戻り繰り返される。
図3には、本発明の画像検索装置の実施の形態に係る、文字列インデックス6に記憶し保存されるデータのデータベース15の構成を説明するための説明図を示している。
この図3に示すデータベース15は、画像URIと、この画像URIを主キーとして分類されたカテゴリ情報と、親ページのURIと、その他のテキスト情報(1)・・・(n)が互いに対応付けされて整理され記憶されている。なお、その他のテキスト情報(1)・・・(n)とは、Webページのタイトルやリンク近傍のテキストを意味している。
また、図4には、本発明の画像検索装置の実施の形態に係る、画像インデックス5に記憶し保存されるデータのデータベース16の構成を説明するための説明図を示している。
この画像インデックス5に保存されたデータベース16は、画像URIと、この画像URIを主キーとして関連付けされたカラーヒストグラム(Color Histogram)と、テクスチャ(Texture)と、FEATURE(n)などの種々の画像特徴量が保存されている。
次に示す図5は、本発明の画像検索装置の実施の形態に係る、画像検索方法のフローチャートである。この画像検索方法は、図1に示した画像検索装置1において実行される。
まず、ステップ10:S10において、画像検索が開始される。
次に、ステップ11:S11において、クライアント入力受付部10より転送されてきたクライアント2からの画像要求に係る文字列を手がかりに、文字列インデックス6に問い合わせを行う。この問い合わせを受けて文字列インデックス6は画像インデックス5に記憶された画像を検索し、クライアント出力部9を通じてクライアント2に画像を提示する。なお、ここで検索されクライアント2に提示される画像は、文字列の意味に類似する類似画像であり、文字列の意味する内容に応じて複数個の類似画像がクライアント2へ提示される。
次に、ステップ12:S12において、クライアント出力部9より出力されクライアント2に提示された画像(類似画像)の中から、検索要求した所望の画像に最も近い類似画像をクライアント2を操作する図示しない操作者が選択入力する。
次に、ステップ13:S13において、提示された画像のURIから画像インデックス5に問い合わせて画像特徴量を取得する。また、提示された画像URIから文字列インデックス6に問い合わせてカテゴリ情報を取得する。
次に、ステップ14:S14において、文字列インデックス6に問い合わせた結果、カテゴリ情報が“分類なし”(NO)ではなく、存在する(YES)カテゴリだった場合、は、次にステップ16:S16へ処理が進む。
このステップ16:S16では、類似画像画像検索部7による類似画像検索の検索条件にカテゴリ情報を加える。例えば、カテゴリ情報に“乗り物”とあった場合、乗り物というカテゴリの中を検索し、こうして画像インデックス5から検索した画像をクライアント2へ提示する。
一方、ステップ15:S15では、カテゴリ情報が空欄か、あるいは“分類なし”(NO)であった場合に特にカテゴリ情報を付与せずに画像インデックス5の中から類似画像検索を行い、クライアント出力部9よりクライアント2へ検索した画像を提示する。
次に、ステップ17:S17にてクライアント2への画像提示がすべて終了する。
以上説明した本発明の実施の形態によれば、画像検索要求に応じてWebページに含まれる画像を検索するための画像検索装置において、画像検索要求を発するためのクライアント情報端末と、Webページを構成する情報を収集して画像と文字列とを抽出するためのWebページ収集手段と、Webページ収集手段が抽出した画像と文字列とを分類のために予め設定されたカテゴリ毎のインデックス情報に関連付けするためのカテゴリ分類手段と、画像に類似する類似画像を検索のためのインデックスとして画像と共にカテゴリ毎に分類して記憶するための画像インデックス情報記憶手段と、画像インデックス情報記憶手段と連係し、カテゴリ毎に分類された文字列を類似画像に関連付けて検索のためのインデックスとして記憶するための文字列インデックス情報記憶手段と、画像検索要求に含まれる文字列に対応する類似画像を文字列インデックス情報記憶手段を介して画像インデックス情報記憶手段から検索し、クライアント情報端末へ類似画像を提示するための文字列画像検索手段と、クライアント情報端末に提示された類似画像のうちから選択された類似画像に応じて画像インデックス情報記憶手段に記憶された画像を検索して取得し、再びクライアント情報端末へ提示するための類似画像検索手段と、を備えた画像検索装置を提供することができる。
また、クライアント情報端末にて選択された類似画像と、文字列インデックス情報記憶手段に記憶されたカテゴリ情報と、を類似画像検索手段の検索条件に含む画像検索装置を提供することができる。
また、本発明の実施の形態による画像検索装置は、インターネットのWebサーバ上で動作する画像検索プログラムが、ハードディスクなどの記録媒体に保存され、実行されることを想定している。よって、クライアント側はネットワークを介してWebプラウザを利用して画像検索装置1にアクセスし、クライアント入力受付部10及びクライアント出力部9を通じて画像を検索する。この画像検索方法は、ネットワーク3等に接続しない独立のスタンドアローン(stand alone)なコンピュータシステムにも適用することが可能である。
また、上記本発明の実施の形態における画像検索装置では、この画像検索装置にて実行される情報処理及び構成要素の動作をコンピュータプログラムに置き換えて構築し、例えばCDやDVD、FDなどの記録媒体に記録してもよい。これらの記録媒体をコンピュータシステムに組み込んだり、または記録媒体に記録されたプログラムを通信回線を介してコンピュータシステムにダウンロードしたり、または記録媒体からインストールし、該プログラムでコンピュータシステムを作動させることにより、画像検索装置、および画像検索方法の実現手段として機能させることができるのは勿論であり、このような記録媒体を用いることにより、その流通性を高めることができるものである。
このように、以上説明した本発明の実施の形態によれば、画像を含むWebページのテキスト情報や画像特徴量をもって画像インデックスに保存される情報を事前に分類することができ、画像検索の検索対象を限定することができ、画像検索に係る計算量を軽減可能な画像検索装置および方法、そのプログラム及び記録媒体を提供することができる。
本発明の画像検索装置の実施の形態に係る、全体構成を説明するための構成図を示す。 本発明の画像検索装置の実施の形態に係る、Webページ収集ロボット11とカテゴリ分類部12とが、文字列インデックス6および画像インデックス5へ記憶する情報を作成するまでのフローチャートを示す。 本発明の画像検索装置の実施の形態に係る、文字列インデックス6に記憶し保存されるデータのデータベース15の構成を説明するための説明図を示す。 本発明の画像検索装置の実施の形態に係る、画像インデックス5に記憶し保存されるデータのデータベース16の構成を説明するための説明図を示す。 本発明の画像検索装置の実施の形態に係る、画像検索方法のフローチャートを示す。 従来技術のシステム構成を示す。 従来技術のWebページ収集ロボットが画像インデックスを作成するためのフローチャートを示す。
符号の説明
1 画像検索装置
2 クライアント
3 ネットワーク(インターネット)
4 ネットワーク
5 画像インデックス
6 文字列インデックス
7 類似画像画像検索部
8 文字列画像検索部
9 クライアント出力部
10 クライアント入力受付部
11 Webページ収集ロボット(Webページ収集手段)
12 カテゴリ分類部(カテゴリ分類手段)

Claims (4)

  1. 画像検索要求に応じてWebページに含まれる画像を検索するための画像検索装置において、
    前記画像検索要求を発するためのクライアント情報端末と、
    前記Webページを構成する情報を収集して画像と文字列とを抽出するためのWebページ収集手段と、
    前記Webページ収集手段が抽出した前記画像と前記文字列とを分類のために予め設定されたカテゴリ毎のインデックス情報に関連付けするためのカテゴリ分類手段と、
    前記画像に類似する類似画像を検索のためのインデックスとして前記画像と共に前記カテゴリ毎に分類して記憶するための画像インデックス情報記憶手段と、
    前記画像インデックス情報記憶手段と連係し、前記カテゴリ毎に分類された前記文字列を前記類似画像に関連付けて検索のためのインデックスとして記憶するための文字列インデックス情報記憶手段と、
    前記画像検索要求に含まれる文字列を手がかりに前記文字列インデックス情報記憶手段に問い合わせ、当該文字列インデックス情報記憶手段によって前記画像インデックス情報記憶手段から検索取得された当該文字列の意味に対応する複数の候補となる前記類似画像を前記クライアント情報端末へ提示するための文字列画像検索手段と、
    前記クライアント情報端末に提示された前記類似画像のうちから選択された類似画像に応じて前記画像インデックス情報記憶手段に問い合わせて画像特徴量を取得し、また、当該選択された類似画像に応じて前記文字列インデックス情報記憶手段に問い合わせてカテゴリ情報を取得し、当該画像特徴量と当該カテゴリ情報を検索条件として前記画像インデックス情報記憶手段に記憶された画像を検索して取得し、再び前記クライアント情報端末へ提示するための類似画像検索手段と、
    を備えることを特徴とする画像検索装置。
  2. 画像検索要求に応じてWebページに含まれる画像を検索するための画像検索装置で処理する画像検索方法において、
    前記画像検索装置により、
    クライアント情報端末により前記画像検索要求を発するステップと、
    Webページ収集手段により前記Webページを構成する情報を収集して画像と文字列とを抽出するステップと、
    カテゴリ分類手段により前記Webページ収集手段が抽出した前記画像と前記文字列とを分類のために予め設定されたカテゴリ毎のインデックス情報に関連付けするステップと、
    画像インデックス情報記憶手段により前記画像に類似する類似画像を検索のためのインデックスとして前記画像と共に前記カテゴリ毎に分類して記憶するステップと、
    文字列インデックス情報記憶手段により前記画像インデックス情報記憶手段と連係し、前記カテゴリ毎に分類された前記文字列を前記類似画像に関連付けて検索のためのインデックスとして記憶するステップと、
    文字列画像検索手段により前記画像検索要求に含まれる文字列を手がかりに前記文字列インデックス情報記憶手段に問い合わせ、当該文字列インデックス情報記憶手段によって前記画像インデックス情報記憶手段から検索取得された当該文字列の意味に対応する複数の候補となる前記類似画像を前記クライアント情報端末へ提示するステップと、
    類似画像検索手段により前記クライアント情報端末に提示された前記類似画像のうちから選択された類似画像に応じて前記画像インデックス情報記憶手段に問い合わせて画像特徴量を取得し、また、当該選択された類似画像に応じて前記文字列インデックス情報記憶手段に問い合わせてカテゴリ情報を取得し、当該画像特徴量と当該カテゴリ情報を検索条件として前記画像インデックス情報記憶手段に記憶された画像を検索して取得し、再び前記クライアント情報端末へ提示するステップと、
    を有することを特徴とする画像検索方法。
  3. 画像検索要求に応じてWebページに含まれる画像を検索するための画像検索装置で実行させるための画像検索プログラムにおいて、
    前記画像検索装置に、
    クライアント情報端末により前記画像検索要求を発するステップと、
    Webページ収集手段により前記Webページを構成する情報を収集して画像と文字列とを抽出するステップと、
    カテゴリ分類手段により前記Webページ収集手段が抽出した前記画像と前記文字列とを分類のために予め設定されたカテゴリ毎のインデックス情報に関連付けするステップと、
    画像インデックス情報記憶手段により前記画像に類似する類似画像を検索のためのインデックスとして前記画像と共に前記カテゴリ毎に分類して記憶するステップと、
    文字列インデックス情報記憶手段により前記画像インデックス情報記憶手段と連係し、前記カテゴリ毎に分類された前記文字列を前記類似画像に関連付けて検索のためのインデックスとして記憶するステップと、
    文字列画像検索手段により前記画像検索要求に含まれる文字列を手がかりに前記文字列インデックス情報記憶手段に問い合わせ、当該文字列インデックス情報記憶手段によって前記画像インデックス情報記憶手段から検索取得された当該文字列の意味に対応する複数の候補となる前記類似画像を前記クライアント情報端末へ提示するステップと、
    類似画像検索手段により前記クライアント情報端末に提示された前記類似画像のうちから選択された類似画像に応じて前記画像インデックス情報記憶手段に問い合わせて画像特徴量を取得し、また、当該選択された類似画像に応じて前記文字列インデックス情報記憶手段に問い合わせてカテゴリ情報を取得し、当該画像特徴量と当該カテゴリ情報を検索条件として前記画像インデックス情報記憶手段に記憶された画像を検索して取得し、再び前記クライアント情報端末へ提示するステップと、
    を実行させることを特徴とする画像検索プログラム。
  4. 画像検索要求に応じてWebページに含まれる画像を検索するための画像検索装置で実行させるための画像検索プログラムを記録した記録媒体において、
    前記画像検索装置に、
    クライアント情報端末により前記画像検索要求を発するステップと、
    Webページ収集手段により前記Webページを構成する情報を収集して画像と文字列とを抽出するステップと、
    カテゴリ分類手段により前記Webページ収集手段が抽出した前記画像と前記文字列とを分類のために予め設定されたカテゴリ毎のインデックス情報に関連付けするステップと、
    画像インデックス情報記憶手段により前記画像に類似する類似画像を検索のためのインデックスとして前記画像と共に前記カテゴリ毎に分類して記憶するステップと、
    文字列インデックス情報記憶手段により前記画像インデックス情報記憶手段と連係し、前記カテゴリ毎に分類された前記文字列を前記類似画像に関連付けて検索のためのインデックスとして記憶するステップと、
    文字列画像検索手段により前記画像検索要求に含まれる文字列を手がかりに前記文字列インデックス情報記憶手段に問い合わせ、当該文字列インデックス情報記憶手段によって前記画像インデックス情報記憶手段から検索取得された当該文字列の意味に対応する複数の候補となる前記類似画像を前記クライアント情報端末へ提示するステップと、
    類似画像検索手段により前記クライアント情報端末に提示された前記類似画像のうちから選択された類似画像に応じて前記画像インデックス情報記憶手段に問い合わせて画像特徴量を取得し、また、当該選択された類似画像に応じて前記文字列インデックス情報記憶手段に問い合わせてカテゴリ情報を取得し、当該画像特徴量と当該カテゴリ情報を検索条件として前記画像インデックス情報記憶手段に記憶された画像を検索して取得し、再び前記クライアント情報端末へ提示するステップと、
    を実行させることを特徴とする画像検索プログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2004238768A 2004-08-18 2004-08-18 画像検索装置および方法、そのプログラム及び記録媒体 Active JP4313738B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004238768A JP4313738B2 (ja) 2004-08-18 2004-08-18 画像検索装置および方法、そのプログラム及び記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004238768A JP4313738B2 (ja) 2004-08-18 2004-08-18 画像検索装置および方法、そのプログラム及び記録媒体

Publications (2)

Publication Number Publication Date
JP2006059036A JP2006059036A (ja) 2006-03-02
JP4313738B2 true JP4313738B2 (ja) 2009-08-12

Family

ID=36106469

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004238768A Active JP4313738B2 (ja) 2004-08-18 2004-08-18 画像検索装置および方法、そのプログラム及び記録媒体

Country Status (1)

Country Link
JP (1) JP4313738B2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8085995B2 (en) 2006-12-01 2011-12-27 Google Inc. Identifying images using face recognition
KR100940365B1 (ko) * 2008-04-11 2010-02-04 엔에이치엔(주) 웹 페이지에 포함되는 이미지에 대하여 태깅을 수행하고 그결과를 이용하여 웹 검색 서비스를 제공하기 위한 방법,장치 및 컴퓨터 판독 가능한 기록 매체
JP5774985B2 (ja) * 2008-06-06 2015-09-09 トムソン ライセンシングThomson Licensing 画像の類似検索システム及び方法
JP5094918B2 (ja) * 2010-06-29 2012-12-12 ヤフー株式会社 本人認証支援装置及び方法
JP6727097B2 (ja) * 2016-10-24 2020-07-22 ヤフー株式会社 情報処理装置、情報処理方法、およびプログラム
JP2020144612A (ja) * 2019-03-06 2020-09-10 日本電信電話株式会社 ラベリング支援方法、ラベリング支援装置及びプログラム

Also Published As

Publication number Publication date
JP2006059036A (ja) 2006-03-02

Similar Documents

Publication Publication Date Title
US6883001B2 (en) Document information search apparatus and method and recording medium storing document information search program therein
KR101450358B1 (ko) 구조형 지리적 데이터 검색
EP0964341A2 (en) Integrated retrieval scheme for retrieving semi-structured documents
US20020055919A1 (en) Method and system for gathering, organizing, and displaying information from data searches
US9971782B2 (en) Document tagging and retrieval using entity specifiers
US20100077300A1 (en) Computer Method and Apparatus Providing Social Preview in Tag Selection
EP3563240A1 (en) Systems and methods for harvesting data associated with fraudulent content in a networked environment
US7069262B1 (en) Information processing apparatus, recording medium, and method for using them
JPH11224256A (ja) 情報検索方法および情報検索プログラムを記録した記録媒体
CN107025261B (zh) 主题网络语料库
JP4313738B2 (ja) 画像検索装置および方法、そのプログラム及び記録媒体
JP5232054B2 (ja) 情報提供装置
JP2007128367A (ja) 情報検索ノウハウ管理システム
US8131752B2 (en) Breaking documents
JP4606349B2 (ja) 話題画像抽出方法及び装置及びプログラム
JP4544047B2 (ja) Web画像検索結果分類提示方法及び装置及びプログラム及びプログラムを格納した記憶媒体
JP5396845B2 (ja) 文書群検出方法及び文書群検出装置
JP2008102773A (ja) データを共通のフォーマットに変換する方法
JP2007034464A5 (ja)
JP2006309509A (ja) 閲覧画面再利用装置、閲覧画面再利用プログラム、及び記録媒体
JP2002049638A (ja) 文書情報検索装置、方法、文書情報検索プログラム及び文書情報検索プログラムを格納したコンピュータ可読の記録媒体
JP5416023B2 (ja) 閲覧端末及び方法
JP2005115721A (ja) 画像検索方法、画像検索装置及び画像検索プログラム
JP3955069B2 (ja) 特許出願データ分析支援システム
KR100371805B1 (ko) 관련 웹 사이트 제공 방법 및 시스템

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080924

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080930

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081125

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090113

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090311

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20090327

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090428

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090515

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120522

Year of fee payment: 3

R151 Written notification of patent or utility model registration

Ref document number: 4313738

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120522

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130522

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140522

Year of fee payment: 5

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350