JP2002007413A - 画像検索装置 - Google Patents

画像検索装置

Info

Publication number
JP2002007413A
JP2002007413A JP2000185226A JP2000185226A JP2002007413A JP 2002007413 A JP2002007413 A JP 2002007413A JP 2000185226 A JP2000185226 A JP 2000185226A JP 2000185226 A JP2000185226 A JP 2000185226A JP 2002007413 A JP2002007413 A JP 2002007413A
Authority
JP
Japan
Prior art keywords
image
search
similarity
candidates
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000185226A
Other languages
English (en)
Inventor
Atsuyoshi Andou
淳禎 安藤
Masatake Kikuchi
正剛 菊地
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2000185226A priority Critical patent/JP2002007413A/ja
Publication of JP2002007413A publication Critical patent/JP2002007413A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Processing Or Creating Images (AREA)
  • Character Discrimination (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【課題】 文字認識と画像認識との両側面から目的の画
像を高い確率で効率的に検索し得る画像検索装置の提
供。 【解決手段】 画像Iに含まれる文字を認識するOCR
部1と、画像特徴を抽出する画像特徴量計算部3と、文
字認識結果に基づき、検索キーの文字を含む画像候補を
検索するテキスト検索実行部5と、画像認識結果に基づ
き、検索キーと可及的に類似する画像特徴を有する画像
候補を検索する画像特徴検索実行部6と、文字認識結果
の画像候補と、画像認識結果の画像候補の検索キーとの
類似度をそれぞれ数値化して統合する統合部7とを設け
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文字、図形、表、
写真等の画像、又はこれらが混在した画像を蓄積してい
る電子図書館、電子博物館、ナレッジ・マネジメント・
システム等の画像の中から、これらの中の所定の画像又
は、文字、背景の色等の条件を指定した所定の画像を検
索キーとして目的の画像を検索する装置に関する。
【0002】
【従来の技術】コンピュータの急速な普及によって、紙
文書を電子化して保存することが一般的になっている。
またインターネットのような通信ネットワークを利用
し、電子化した文書をネットワーク経由で閲覧できるシ
ステムを構築することにより、ナレッジ・マネジメント
等の知識共有基盤として活用することが可能になる。電
子化文書の量が増大するに従って、蓄積している大量の
電子化文書を活用するために、電子化文書に適切なイン
デックスを付与して検索可能な状態にすることが重要で
ある。
【0003】また、文書作成ソフトウェアの機能向上に
伴い、テキストだけの文書だけでなく、例えばプレゼン
テーションでの訴求力向上を目的として、図、表、写真
等を多用したフルカラー文書を作成することが容易にな
ってきている。このような文書では、図、表、写真等の
情報が、文書の内容に対してテキスト情報と同等の重要
性を持っている。
【0004】このように、テキストだけの文書、テキス
トと画像とが混在する文書が存在するようなシステムで
は、文書をイメージ・スキャナ等で読み取って蓄積して
おく方が一括管理が容易である。
【0005】従来、テキストと、図、表、写真等の画像
とが混在する文書を検索する装置として、文書の画像化
データから、文書に含まれる画像を含む画像領域と、テ
キストを含む文字領域とを認識し、文字領域から文字認
識した文字列を画像領域の画像に関連付けて登録してお
き、この文字列を検索キーとして目的の画像を検索する
装置が開示されている(特開平11−25113号公
報)。
【0006】また、テキストと画像とが混在する文書の
ファイリング装置として、文書の画像化データから、文
書に含まれるテキストを含む文字領域を認識し、文字領
域から文字列を文字認識するとともに各文字の大きさを
抽出し、各文字の大きさから得られた相対的文字サイズ
を文字列とともに記憶しておき、例えば相対的文字サイ
ズが大きい文字列はタイトルである確率が高く、タイト
ルの文字列が検索キーと一致した検索結果は目的とする
検索結果により近いであろうという推定に基づき、検索
結果の優先度を相対的文字サイズに従って算出し、検索
結果を優先度でランク付けして出力する装置が開示され
ている(特開平10−177641号公報)。
【0007】また、写真画像と文字情報とが記録され、
画像記録部と文字記録部が分離されたコマ画像に対し
て、文字記録部の文字列を文字認識し、文字認識した文
字を検索キーワードとして検索する装置が開示されてい
る(特開平8−185508号公報)。
【0008】さらに、文字認識時の誤りに対処した装置
として、イメージデータのテキストデータ部分を文字認
識して検索に使用する場合で、文字認識誤りが発生した
場合に、検索ヒット率が低下することを解決するため
に、文字認識時に候補としてあがった第2候補以降の文
字も含めて格納し、検索する装置が開示されている(特
開平8−69477号公報)。
【0009】
【発明が解決しようとする課題】以上のように、従来の
装置では、文書の画像化データの中の文字列を含む領域
から文字認識した文字列を、文書に含まれる画像の検索
キーとしているため、文書に文字列を含む領域がない場
合、検索キーを付与することができない。
【0010】また、建物の写真に含まれる看板の文字の
ように、画像の中に検索キーとして非常に有効な文字列
が存在していても、画像に含まれている文字列を検索キ
ーとして付与することができない。
【0011】さらに、装置の認識精度が低かったり、画
像化した文字の一部が文字認識が不可能な程度まで欠け
ていること等が原因で文字列を誤って文字認識し、誤っ
た文字列が検索キーとして付与された場合、この画像
は、文字列を検索キーとした検索によって検索され得な
いという不具合が生じる。
【0012】また、文書に含まれる図形の形、背景の色
等の画像の特徴が、文字列と同等又はそれ以上に文書の
特徴を良く表していたり、印象に残り易いような文書に
対しては、文書の画像特徴に基づいて検索する方が目的
の文書を検索し得る確率が高い。しかし、例えば同じ建
物を正面から撮影した場合と、下から仰いで撮影した場
合とでは建物の形が異なり、その結果、画像特徴が類似
しないため、画像特徴を検索キーとして目的の画像を検
索することができない。その他にも、照明条件、大気の
状態、撮影した季節、撮影機材の性能等、種々の条件に
よって画像特徴は大きく変動する。
【0013】本発明はこのような問題点を解決するため
になされたものであって、文字、図形、表、写真等が混
在する画像の中から、いずれかの画像又は、文字、背景
の色等の条件を指定した所定の画像を検索キーとして目
的の画像を検索する際、文字認識によって画像候補を検
索するとともに、画像認識によっても画像候補を検索し
て文字認識による検索結果と画像認識による検索結果と
を統合することにより、文字認識と画像認識との両側面
から目的の画像を高い確率で効率的に検索し得る画像検
索装置の提供を目的とする。
【0014】
【課題を解決するための手段】図1は本発明の検索の原
理の概念図である。画像に一意に付与されている識別番
号ID001の画像は、文字列「AAA」と書かれた紙
文書をイメージ・スキャナ等で読み取った画像(画像特
徴量0.5)であり、ID002の画像は、紙文書の損
傷、過度の複写等により、文字列「AAA」のうち、3
番目の「A」の一部が、「A」と文字認識することが不
可能な程度まで欠けている紙文書をイメージ・スキャナ
等で読み取った画像(画像特徴量0.52)である。I
D001とID002の画像は、画像としての形状が近
いため、画像特徴量が近い値になっている。
【0015】ID003の画像は、文字列「CCC」が
壁面に描かれた正面視正方形の建物を正面から撮影した
画像(画像特徴量0.1)、ID004の画像は、同様
に文字列「CCC」が壁面に描かれた正面視正方形の建
物を下から仰いで撮影した画像(画像特徴量0.9)で
ある。ID003とID004の画像は、被写体が同一
物であっても画像としての形状が大きく異なっているた
め(正方形と台形)、画像特徴量の差が大きくなってい
る。
【0016】画像特徴量は、その他、照明条件、大気の
状態、撮影した季節、撮影機材等の条件の差異によって
も大きく変動する。なお、画像特徴量は、一般的にn次
元のベクトル情報で表現されるが、本例では、説明の簡
単のために一次元のスカラ値とする。
【0017】上述のような画像に対して、ID001の
画像を検索キーの画像として検索した場合、文字認識だ
けでは、ID002〜ID004のいずれの画像も、含
まれている文字列が検索キーの画像ID001に含まれ
る文字列と一致しないため、検索結果が得られない。
【0018】しかし、画像認識によって検索した場合、
文字認識だけでは検索されなかったID002の画像
が、検索キーの画像ID001の画像の画像特徴量と非
常に近い、即ち画像特徴が可及的に類似する目的の画像
として検索される。
【0019】また、ID003の画像を検索キーの画像
として検索した場合、画像認識だけでは、ID001、
ID002、ID004のいずれの画像も、ID003
の画像特徴量との差の絶対値がかなり大きく、画像特徴
量からだけでは、これらの中に目的の画像が存在しない
ことになる。
【0020】しかし、文字認識によって検索した場合、
ID004の画像が、検索キーの画像であるID003
の画像に含まれている文字列「CCC」と同一の文字列
を含むため、目的の画像として検索される。
【0021】以上のように、本発明では、文字認識と画
像認識との両側面から画像候補を検索して両方の検索結
果を統合するので、ID001の画像を検索キーの画像
として検索した場合、文字認識だけであれば検索されな
かったID002の画像が、画像認識によって検索さ
れ、また逆に、ID003の画像を検索キーの画像とし
て検索した場合、画像認識だけであれば検索されなかっ
たID004の画像が、文字認識によって検索される。
【0022】図2は本発明の統合の原理の概念図であ
る。図2の画像候補は、検索対象の画像の中から、文字
認識及び画像認識により検索された画像候補を示すもの
である。これらの画像候補は、例えば、当初、文字列
「CCC」をテキスト検索条件として入力した文字認識
の検索結果の中から、画像ID001を検索キーの画像
とする画像認識による検索の結果、得られた候補であ
る。
【0023】ID001は文字列「CCC」が長方形の
図形の中に書かれた画像(画像特徴量0.5)、ID0
02は文字列「CCC」が楕円形の図形の中に書かれた
画像(画像特徴量0.3)、ID003は文字列「CC
C」が正方形の図形の中に書かれた画像(画像特徴量
0.55)、ID004は文字列「CCC」が台形の図
形の中に書かれた画像(画像特徴量0.9)である。
【0024】画像候補ID002〜ID004に含まれ
る文字列「CCC」は、検索キーの画像ID001に含
まれる文字列と完全に一致しているので、文字認識にお
ける、検索キーの画像ID001に対する画像候補ID
002〜ID004の類似度の順位は同列である。
【0025】しかし、画像認識における類似度、即ち検
索キーの画像ID001と画像候補ID002〜ID0
04との画像特徴量の差はそれぞれ異なっている。この
状態で、文字認識及び画像認識による検索結果を統合す
ると、画像特徴量の差の絶対値が小さい方から順(ID
003→ID002→ID004)に、検索キーの画像
との類似度がより高い画像候補としてランク付けするこ
とができる。
【0026】以上のように、文字認識の検索結果と画像
認識の検索結果とを統合することで、一致する/しない
といった二律背反の検索ではなく、所定範囲の類似度を
示す画像候補の検索が可能になり、目的の画像を高い確
率で効果的に検索することができる。また統合してラン
ク付けした画像候補を、ランク順に検索者に提示するこ
とで、検索者は目的の画像を早期に発見することができ
る。
【0027】次に本発明の検索・統合の手順を図3のフ
ローチャートに基づいて説明する。なお、以下の説明で
は、画像を検索キーとして指定する場合について説明す
るが、検索キーは画像に限らず、文字列を指定するテキ
ストデータ、画像特徴を表現したテキストデータ等であ
ってもよい。また、検索キーの画像は検索対象の画像群
の中から選択しても、また予め用意されているサンプル
の中から選択してもよい。
【0028】検索キーの画像のOCRテキスト、及び画
像特徴量を抽出する(ステップS1)。全ての画像候補
のデータについて処理したか否かをチェックしながら
(ステップS2)、データベースに蓄積されている検索
対象の画像のOCRテキスト及び画像特徴量を抽出する
(ステップS3)。
【0029】検索キーの画像に対する、OCRテキスト
の類似度と画像特徴量の類似度とを統合した、画像候補
の統合類似度を計算する(ステップS4)。全てのデー
タについて処理したか否かをチェックしながら(ステッ
プS2)、ステップS3及びS4を繰り返す。
【0030】全ての画像候補のデータについて処理が完
了すると、統合類似度の高い順番にソートしてランク付
けし、例えばディスプレイ表示等により、ランク順に検
索結果を出力する(ステップS5)。
【0031】第1発明の画像検索装置は、検索対象の画
像の中から目的の画像を検索する装置において、画像に
含まれる文字を認識する文字認識手段と、画像の画像特
徴を抽出する画像認識手段と、文字認識手段の認識結果
に基づき、検索キーの文字を含む画像候補を検索する第
1の検索手段と、画像認識手段の認識結果に基づき、検
索キーの画像特徴と可及的に類似する画像特徴を有する
画像候補を検索する第2の検索手段と、第1及び第2の
検索手段の検索結果を統合する統合手段とを備えたこと
を特徴とする。
【0032】第2発明の画像検索装置は、第1発明の前
記統合手段が、検索キーに対する第1及び第2の検索手
段の検索結果の画像候補の類似度をそれぞれ数値化する
手段を備え、画像候補を、第1及び第2の検索手段の該
類似度を統合した統合類似度が相対的に高い画像候補に
絞り込むべくなしたことを特徴とする。
【0033】第3発明の画像検索装置は、第1発明の前
記統合手段が、検索キーに対する第1及び第2の検索手
段の検索結果の画像候補の類似度をそれぞれ数値化し、
該類似度に、第1及び第2の検索手段に対して定められ
た重み係数をそれぞれ乗じた重み付き類似度を算出する
手段を備え、画像候補を、該重み付き類似度を統合した
統合類似度が相対的に高い画像候補に絞り込むべくなし
たことを特徴とする。
【0034】本発明では、検索対象の画像に含まれる文
字を認識するとともに、画像特徴を抽出し、文字認識の
認識結果に基づき、検索キーの文字を含む画像候補を検
索し、また画像認識の認識結果に基づき、検索キーと可
及的に類似する画像特徴を有する画像候補を検索して、
これらの検索結果を統合する。
【0035】このとき、検索結果を統合する一つの方法
として、文字認識による検索結果の画像候補と、画像認
識による検索結果の画像候補の検索キーとの類似度をそ
れぞれ数値化し、文字認識による画像候補と画像認識に
よる画像候補との類似度を統合し、画像候補を、統合し
た統合類似度が相対的に高い画像候補に絞り込む。
【0036】また検索結果を統合する他の方法として、
文字認識による検索結果の画像候補と、画像認識による
検索結果の画像候補の検索キーとの類似度をそれぞれ数
値化し、この類似度に、文字認識による検索結果及び画
像認識による検索結果に対して定められた重み係数をそ
れぞれ乗じた重み付き類似度を算出して統合し、画像候
補を、重み付き類似度を統合した統合類似度が相対的に
高い画像候補に絞り込む。
【0037】従って、例えば紙文書の損傷、過度の複写
等により、文字列の一部が文字認識の不可能な程度まで
欠けている文書の画像、文字が描かれた建物を異なる角
度で撮影した写真の画像等のように、文字認識だけ、又
は画像認識だけでは検索され得ない画像が検索対象の画
像に含まれている場合でも、文字認識と画像認識との両
側面から目的の画像を高い確率で効率的に検索し得る。
【0038】第4発明の画像検索装置は、第2又は第3
発明に加えて、統合類似度の高さ順に応じた順序で画像
候補の情報を提示する手段をさらに備えたことを特徴と
する。
【0039】本発明では、統合類似度の高さ順に応じた
順序で、目的の画像により近い画像候補から先にその情
報を提示する。従って、検索結果として得られた画像候
補の数が膨大であっても、検索者は目的の画像を早期に
発見することができる。
【0040】第5発明の画像検索装置は、第1乃至第4
発明のいずれかに加えて、第1又は第2の検索手段によ
る検索結果の画像候補のいずれかを検索キーとして、第
2又は第1の検索手段により、検索結果の画像候補の中
から画像候補を検索する手段をさらに備えたことを特徴
とする。
【0041】本発明では、文字認識及び画像認識のいず
れか一方の認識手段で画像候補を一旦絞り込み、この検
索結果の画像候補の中のいずれかを検索キーとして、他
方の認識手段で画像候補を検索する。従って、一方の認
識手段による検索結果の画像候補をヒントとして、目的
の画像の検索に、より適した画像を検索条件として指定
することができる。
【0042】
【発明の実施の形態】図4は本発明の画像検索装置(以
下、本発明装置という)の機能ブロック図である。上半
部は画像の登録処理に関連し、下半部は検索処理に関連
する。OCR(光学式文字認識:Optical Ch
aracter Recognition)部1は、紙
文書をイメージ・スキャナ等で読み取った画像I、又は
既に電子化されている文書を画像化した画像Iに含まれ
ている文字を光学的に読み取る文字認識手段である。
【0043】OCR部1は、画像Iから抽出した文字列
から、検索ができるようにテキスト・インデックスを生
成し、画像Iに一意に付与した識別番号に関連付けてO
CRテキスト・データベース(以下、OCRテキストD
Bと略記する)2に格納する。
【0044】OCRの手法としては、「文字認識・文書
理解の最新動向〔I〕 −文字認識とは−」(電子情報
通信学会誌、平成12年1月 JANUARY VO
L.83 No.1 pp.64−68)、「文字認識
・文書理解の最新動向〔II〕−文字認識手法−」(電
子情報通信学会誌、平成12年2月 FEBRUARY
VOL.83 No.2 pp.143−148)等
のいずれを使用してもよい。
【0045】画像特徴量計算部3は、上述の画像Iのエ
ッジ、色、濃淡等を検出して画像特徴量を計算する画像
認識手段である。画像特徴量計算部3は、計算した画像
特徴量から、検索ができるように画像インデックスを生
成し、画像Iに一意に付与した識別番号に対応付けて画
像特徴データベース(以下、画像特徴DBと略記する)
4に格納する。
【0046】画像認識の手法としては、例えば「画像を
キーとする類似画像検索システム」(村尾晃平、安藤淳
禎:1998年電子情報通信学会情報・システムソサイ
エティ大会 D−11−60,p.175,1998)
を使用することができる。
【0047】テキスト処理では、図示しない入力手段
(キーボード、マウス等)により入力された検索キー
(テキストキー、画像キー)を受け付け、テキスト検索
実行部5は、OCRテキストDB2を参照してテキスト
キーに基づくテキスト検索を実行し、画像検索実行部6
は、画像特徴DB4を参照して画像キーに基づく画像検
索を実行する。
【0048】テキスト検索実行部5及び画像検索実行部
6は、検索キーに対する検索結果の画像候補の類似度を
それぞれ数値化して検索結果の画像候補の情報(例え
ば、縮小画像、OCRテキストデータ等)とともに統合
部7に渡す。
【0049】統合部7は、テキスト検索実行部5及び画
像検索実行部6から渡された類似度を、後述するような
方法で統合し、統合後の類似度に基づいて画像候補をラ
ンク順にソーティングし、ランクの高い順に、画像候補
の情報をランキング情報とともに検索結果出力部8に渡
す。
【0050】例えばディスプレイを有する検索結果出力
部8は、統合部7から渡されたランク順に応じた並び順
で、1ページに表示が可能な数ずつ、画像候補の情報を
出力して検索者に提示する(図7参照)。
【0051】図5は本発明装置における統合例(その
1)の概念図である。テキスト検索実行部5による文字
認識の検索結果(A)として画像候補ID004、ID
007、ID010、ID040が検索されている。全
ての画像候補に含まれる文字列が検索キーの文字列と一
致するため本例ではランキングしていない。なお、この
とき、同列のランクの画像候補に同一の類似度を与えて
もよい。
【0052】画像特徴検索実行部6による画像認識の検
索結果(B)として上位から4つの画像候補ID007
(類似度0.9)、ID010(類似度0.8)、ID
040(類似度0.75)、ID051(類似度0.
7)が検索されている。なお、類似度は数値が大きいほ
ど高いものとする。
【0053】統合部7は、検索結果(A)と検索結果
(B)との論理積をとり、ID004とID051の画
像を候補から外し、残りの画像候補ID007、ID0
10、ID040の画像特徴における類似度を統合類似
度として、これらをランク付けする。即ち、画像候補I
D007が第一位、ID010が第2位、ID040が
第3位となる。
【0054】また図6は本発明装置における統合例(そ
の2)の概念図である。テキスト検索実行部5による文
字認識の検索結果(A)として画像候補ID004(類
似度0.9)、ID007(類似度0.8)、ID01
0(類似度0.5)、ID040(類似度0.4)が検
索されている。前述と同様に、類似度は数値が大きいほ
ど高いものとする。なお、全ての画像候補に含まれる文
字列が検索キーの文字列と一致する場合、類似度は同一
値になる。
【0055】画像特徴検索実行部6による画像認識の検
索結果(B)として上位から4つの画像候補ID007
(類似度0.9)、ID010(類似度0.8)、ID
040(類似度0.75)、ID051(類似度0.
7)が検索されている。
【0056】統合部7は、検索結果(A)と検索結果
(B)との論理積をとり、ID004とID051の画
像を候補から外す。残りの画像候補ID007、ID0
10、ID040に対して、テキスト検索実行部5によ
る検索結果(A)のそれぞれの類似度に、文字認識の重
み付け係数として定めた「5」を乗じ、また画像特徴検
索実行部6による検索結果(B)の画像候補のそれぞれ
の類似度に、画像認識の重み付け係数として定めた「1
0」を乗じ、重み付けした類似度を統合した統合類似度
に基づいて画像候補をランク付けする。
【0057】即ち、画像候補ID007が(5×0.8
+10×0.9=13.0)で第一位、ID010が
(5×0.5+10×0.8=10.5)で第2位、I
D040が(5×0.4+10×0.75=9.5)で
第3位となる。
【0058】なお、検索結果(A)(B)の統合に用い
るブール演算は論理積に限らず、論理和、否定等であっ
てもよい。
【0059】また、ネットワーク上のサーバ装置に本発
明装置の機能を持たせ、このサーバ装置にアクセスが可
能な複数のクライアント装置から検索を行う構成とする
こともできる。この場合のユーザ・インタフェースは市
販のブラウザが使用できる環境であれば、クライアント
装置の機種には依存せずに検索結果をクライアント装置
から閲覧することができる。
【0060】図7は本発明装置における検索結果の画面
表示例の図である。統合部7によるランク付けに応じた
順位で、第1位から第3位までの画像候補の画像(縮小
画像)が表示され、それぞれのランキング情報、テキス
ト検索における類似度、画像特徴検索における類似度、
これらを統合した総合の類似度、文字認識したテキスト
本文、例えばクライアント装置からサーバ装置へ検索を
依頼した場合等に機能する一括ダウンロード用ボタン等
が提示される。
【0061】また「画像で検索」ボタンを選択すると、
検索結果の画像候補を検索キーの画像として、さらなる
検索が連鎖的に実行される。
【0062】
【発明の効果】以上のように、本発明装置は、文字、図
形、表、写真等が混在する画像の中から、いずれかの画
像、又は文字と背景の色を指定したような所定の画像を
検索キーとして目的の画像を検索する際、文字認識によ
って画像候補を検索するとともに、画像認識によっても
画像候補を検索し、文字認識による検索結果と画像認識
による検索結果とを統合するので、文字認識と画像認識
との両側面から目的の画像を高い確率で効率的に検索し
得るという優れた効果を奏する。
【図面の簡単な説明】
【図1】本発明の検索の原理の概念図である。
【図2】本発明の統合の原理の概念図である。
【図3】本発明の検索・統合手順のフローチャートであ
る。
【図4】本発明装置の機能ブロック図である。
【図5】本発明装置における統合例(その1)の概念図
である。
【図6】本発明装置における統合例(その2)の概念図
である。
【図7】本発明装置における検索結果の画面表示例の図
である。
【符号の説明】
1 OCR部 2 OCRテキストDB 3 画像特徴量計算部 4 画像特徴DB 5 テキスト検索実行部 6 画像特徴検索実行部 7 統合部 8 検索結果出力部 I 画像
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G06T 1/00 200 G06T 1/00 200E 7/00 300 7/00 300F Fターム(参考) 5B050 BA16 BA20 EA04 EA18 GA08 5B064 AA10 BA01 5B075 ND06 NK02 NK06 PP02 PP03 PP04 PQ02 PQ36 PQ74 PR06 QM08 5L096 FA06 FA14 GA38 HA08 JA03 JA11

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 検索対象の画像の中から目的の画像を検
    索する装置において、 画像に含まれる文字を認識する文字認識手段と、 画像の画像特徴を抽出する画像認識手段と、 文字認識手段の認識結果に基づき、検索キーの文字を含
    む画像候補を検索する第1の検索手段と、 画像認識手段の認識結果に基づき、検索キーの画像特徴
    と可及的に類似する画像特徴を有する画像候補を検索す
    る第2の検索手段と、 第1及び第2の検索手段の検索結果を統合する統合手段
    とを備えたことを特徴とする画像検索装置。
  2. 【請求項2】 前記統合手段は、検索キーに対する第1
    及び第2の検索手段の検索結果の画像候補の類似度をそ
    れぞれ数値化する手段を備え、画像候補を、第1及び第
    2の検索手段の該類似度を統合した統合類似度が相対的
    に高い画像候補に絞り込むべくなしたことを特徴とする
    請求項1記載の画像検索装置。
  3. 【請求項3】 前記統合手段は、検索キーに対する第1
    及び第2の検索手段の検索結果の画像候補の類似度をそ
    れぞれ数値化し、該類似度に、第1及び第2の検索手段
    に対して定められた重み係数をそれぞれ乗じた重み付き
    類似度を算出する手段を備え、画像候補を、該重み付き
    類似度を統合した統合類似度が相対的に高い画像候補に
    絞り込むべくなしたことを特徴とする請求項1記載の画
    像検索装置。
  4. 【請求項4】 統合類似度の高さ順に応じた順序で画像
    候補の情報を提示する手段をさらに備えたことを特徴と
    する請求項2又は3に記載の画像検索装置。
  5. 【請求項5】 第1又は第2の検索手段による検索結果
    の画像候補のいずれかを検索キーとして、第2又は第1
    の検索手段により、検索結果の画像候補の中から画像候
    補を検索する手段をさらに備えたことを特徴とする請求
    項1乃至4のいずれかに記載の画像検索装置。
JP2000185226A 2000-06-20 2000-06-20 画像検索装置 Pending JP2002007413A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000185226A JP2002007413A (ja) 2000-06-20 2000-06-20 画像検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000185226A JP2002007413A (ja) 2000-06-20 2000-06-20 画像検索装置

Publications (1)

Publication Number Publication Date
JP2002007413A true JP2002007413A (ja) 2002-01-11

Family

ID=18685574

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000185226A Pending JP2002007413A (ja) 2000-06-20 2000-06-20 画像検索装置

Country Status (1)

Country Link
JP (1) JP2002007413A (ja)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003289432A (ja) * 2002-03-28 2003-10-10 Toshiba Corp 印刷装置と印刷方法
JP2003345815A (ja) * 2002-05-28 2003-12-05 Jiishisu:Kk Url検索サーバ及びurl検索システム並びに画像加工サーバ及び画像加工システム
JP2007172077A (ja) * 2005-12-19 2007-07-05 Fuji Xerox Co Ltd 画像検索システム及び方法及びプログラム
US7437398B2 (en) * 2004-07-30 2008-10-14 Intel Corporation Pattern matching architecture
JP2010152884A (ja) * 2008-12-02 2010-07-08 Intel Corp 画像認識アルゴリズム、それを用いて目標画像を識別する方法、および、携帯用電子装置へ送信するデータを選択する方法
JP2010218109A (ja) * 2009-03-16 2010-09-30 Ricoh Co Ltd 画像検索装置及び画像検索方法
US8005300B2 (en) 2005-07-21 2011-08-23 Fuji Xerox Co., Ltd. Image search system, image search method, and storage medium
JP2013504112A (ja) * 2009-09-04 2013-02-04 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ コンテンツベースの画像検索に関する関連度の視覚化
JP2013145587A (ja) * 2013-03-22 2013-07-25 Olympus Imaging Corp 画像検索システム
JP5259876B2 (ja) * 2010-02-26 2013-08-07 楽天株式会社 情報処理装置、情報処理方法、情報処理プログラムを記録した記録媒体
CN112766269A (zh) * 2021-03-04 2021-05-07 深圳康佳电子科技有限公司 一种图片文本检索方法、智能终端及存储介质
WO2024117018A1 (ja) * 2022-12-01 2024-06-06 株式会社東芝 情報処理システム、情報処理方法及びプログラム

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0492971A (ja) * 1990-08-06 1992-03-25 Canon Inc 画像検索方法及び装置
JPH06325084A (ja) * 1993-01-19 1994-11-25 Canon Inf Syst Inc 文書処理装置及びその方法と文書表示装置及びその方法
JPH09237282A (ja) * 1996-03-01 1997-09-09 Ricoh Co Ltd 文書画像データベース検索方法、画像特徴ベクトル抽出方法、文書画像閲覧システム、機械読み取り可能な媒体及び画像表示方法
JPH10289241A (ja) * 1997-04-14 1998-10-27 Canon Inc 画像処理装置及びその制御方法
JPH1115852A (ja) * 1997-06-27 1999-01-22 Nippon Telegr & Teleph Corp <Ntt> 画像データベースセンタ装置及び画像データベース登録/検索方法並びに記録媒体
JPH11149485A (ja) * 1997-09-24 1999-06-02 Ricoh Co Ltd 文書画像データベース検索方法、文書画像データベース編成方法、記録媒体、及び、文書画像データベース編成装置
JPH11232296A (ja) * 1998-02-18 1999-08-27 Mitsubishi Electric Corp 文書ファイリングシステムおよび文書ファイリング方法
JP2000148793A (ja) * 1998-09-11 2000-05-30 Nippon Telegr & Teleph Corp <Ntt> 複合メディア文書の類似検索方法及び装置及び複合メディア文書の類似検索プログラムを格納した記憶媒体

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0492971A (ja) * 1990-08-06 1992-03-25 Canon Inc 画像検索方法及び装置
JPH06325084A (ja) * 1993-01-19 1994-11-25 Canon Inf Syst Inc 文書処理装置及びその方法と文書表示装置及びその方法
JPH09237282A (ja) * 1996-03-01 1997-09-09 Ricoh Co Ltd 文書画像データベース検索方法、画像特徴ベクトル抽出方法、文書画像閲覧システム、機械読み取り可能な媒体及び画像表示方法
JPH10289241A (ja) * 1997-04-14 1998-10-27 Canon Inc 画像処理装置及びその制御方法
JPH1115852A (ja) * 1997-06-27 1999-01-22 Nippon Telegr & Teleph Corp <Ntt> 画像データベースセンタ装置及び画像データベース登録/検索方法並びに記録媒体
JPH11149485A (ja) * 1997-09-24 1999-06-02 Ricoh Co Ltd 文書画像データベース検索方法、文書画像データベース編成方法、記録媒体、及び、文書画像データベース編成装置
JPH11232296A (ja) * 1998-02-18 1999-08-27 Mitsubishi Electric Corp 文書ファイリングシステムおよび文書ファイリング方法
JP2000148793A (ja) * 1998-09-11 2000-05-30 Nippon Telegr & Teleph Corp <Ntt> 複合メディア文書の類似検索方法及び装置及び複合メディア文書の類似検索プログラムを格納した記憶媒体

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003289432A (ja) * 2002-03-28 2003-10-10 Toshiba Corp 印刷装置と印刷方法
JP2003345815A (ja) * 2002-05-28 2003-12-05 Jiishisu:Kk Url検索サーバ及びurl検索システム並びに画像加工サーバ及び画像加工システム
US7437398B2 (en) * 2004-07-30 2008-10-14 Intel Corporation Pattern matching architecture
US8005300B2 (en) 2005-07-21 2011-08-23 Fuji Xerox Co., Ltd. Image search system, image search method, and storage medium
JP2007172077A (ja) * 2005-12-19 2007-07-05 Fuji Xerox Co Ltd 画像検索システム及び方法及びプログラム
CN101950351B (zh) * 2008-12-02 2013-11-13 英特尔公司 使用图像识别算法识别目标图像的方法
CN101950351A (zh) * 2008-12-02 2011-01-19 英特尔公司 使用图像识别算法识别目标图像的方法
US8391615B2 (en) 2008-12-02 2013-03-05 Intel Corporation Image recognition algorithm, method of identifying a target image using same, and method of selecting data for transmission to a portable electronic device
JP2010152884A (ja) * 2008-12-02 2010-07-08 Intel Corp 画像認識アルゴリズム、それを用いて目標画像を識別する方法、および、携帯用電子装置へ送信するデータを選択する方法
JP2010218109A (ja) * 2009-03-16 2010-09-30 Ricoh Co Ltd 画像検索装置及び画像検索方法
JP2013504112A (ja) * 2009-09-04 2013-02-04 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ コンテンツベースの画像検索に関する関連度の視覚化
US9495388B2 (en) 2009-09-04 2016-11-15 Koninkijke Philips N.V. Visualization of relevance for content-based image retrieval
JP5259876B2 (ja) * 2010-02-26 2013-08-07 楽天株式会社 情報処理装置、情報処理方法、情報処理プログラムを記録した記録媒体
JP2013145587A (ja) * 2013-03-22 2013-07-25 Olympus Imaging Corp 画像検索システム
CN112766269A (zh) * 2021-03-04 2021-05-07 深圳康佳电子科技有限公司 一种图片文本检索方法、智能终端及存储介质
CN112766269B (zh) * 2021-03-04 2024-03-12 深圳康佳电子科技有限公司 一种图片文本检索方法、智能终端及存储介质
WO2024117018A1 (ja) * 2022-12-01 2024-06-06 株式会社東芝 情報処理システム、情報処理方法及びプログラム

Similar Documents

Publication Publication Date Title
US9430719B2 (en) System and method for providing objectified image renderings using recognition information from images
US7801893B2 (en) Similarity detection and clustering of images
US9552511B2 (en) Identifying images using face recognition
US7809192B2 (en) System and method for recognizing objects from images and identifying relevancy amongst images and information
US8897505B2 (en) System and method for enabling the use of captured images through recognition
US7809722B2 (en) System and method for enabling search and retrieval from image files based on recognized information
US7844139B2 (en) Information management apparatus, information management method, and computer program product
US7076503B2 (en) Managing media objects in a database
US6549913B1 (en) Method for compiling an image database, an image database system, and an image data storage medium
JP2011507099A (ja) イメージ検索における対話型概念学習
EP2291765A2 (en) Statistical approach to large-scale image annotation
JP4240896B2 (ja) 画像分類システム
WO2009031924A1 (ru) Способ построения системы индексирования для поиска объектов на цифровых изображениях
US20060026127A1 (en) Method and apparatus for classification of a data object in a database
JP2002007413A (ja) 画像検索装置
KR100644016B1 (ko) 동영상 검색 시스템 및 방법
Sebastine et al. Semantic web for content based video retrieval
Kim et al. User‐Friendly Personal Photo Browsing for Mobile Devices
KR20020006223A (ko) 자동 색인 로봇 시스템 및 이를 이용한 처리 방법
JP2003233800A (ja) 画像検索システム、画像検索方法及び画像検索用コンピュータプログラム
Al Qaraleh Elimination of repeated occurrences in image search engines
Veltman et al. Impediments to general purpose content based image search
Munson et al. Searching for Images on the Web Using Textual Metadata
Tukaram et al. Retrieving Images On World Wide Web

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061116

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090615

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090623

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100216

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100415

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100629