JP2008542911A - メトリック埋め込みによる画像比較 - Google Patents
メトリック埋め込みによる画像比較 Download PDFInfo
- Publication number
- JP2008542911A JP2008542911A JP2008514653A JP2008514653A JP2008542911A JP 2008542911 A JP2008542911 A JP 2008542911A JP 2008514653 A JP2008514653 A JP 2008514653A JP 2008514653 A JP2008514653 A JP 2008514653A JP 2008542911 A JP2008542911 A JP 2008542911A
- Authority
- JP
- Japan
- Prior art keywords
- image
- tree
- engine
- family
- graph
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/40—Analysis of texture
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/42—Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation
- G06V10/422—Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation for representing the structure of the pattern or shape of an object therefor
- G06V10/426—Graphical representations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/196—Recognition using electronic means using sequential comparisons of the image signals with a plurality of references
- G06V30/1983—Syntactic or structural pattern recognition, e.g. symbolic string recognition
- G06V30/1988—Graph matching
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Editing Of Facsimile Originals (AREA)
- Processing Or Creating Images (AREA)
Abstract
Description
本明細書に記載されるシステムおよび方法は、画像比較技術を提供する。これらの画像比較技術を使用して、インターネット上の画像検索を行う、画像のプールの中から原始画像の変更バージョンを特定すること等ができる。例えば、ユーザは、写真編集ソフトウェアを用いて、あるいは電子メールメッセージに画像を含めるための準備として、原始画像をトリミングおよび圧縮することにより、原始画像に変更を加える場合がある。ここに記載されるシステムおよび方法は、他の画像群の中からそのような変更が加えられた画像を検索し、見つける手段を提供する。
図3は、画像を比較する典型的システム300を示す。コンピューティングデバイス302は、インターネット304と通信可能に結合されている。コンピューティングデバイス302は、画像比較エンジン306をホスティングする。この種のネットワークコンピューティング環境は、単に例示の目的で示すものである。他の種のコンピューティングおよびネットワーク環境も、本発明の主題をホスティングすることができる。画像比較エンジン306は、画像検索308を可能にする。対象画像すなわち「原始(ソース)」画像310が、ユーザによって、またはシステム300の構成要素によって選択されることができる。画像比較エンジン306は、原始画像310を、例えばインターネット304上にある他の画像と比較し、比較ごとに類似度の指標を返す。画像比較エンジン306は、原始画像310と、候補画像の集合の要素間の最良のマッチング(一致)を指定することができる。
図4は、図3の典型的画像比較エンジン306をより詳細に示す。図4の画像比較エンジン306は、概観の目的で例示的な構成の1つを提供するものである。図示された構成要素または同様の構成要素の数多くの他の構成が可能である。このような画像比較エンジン306は、ハードウェア、ソフトウェア、またはハードウェアとソフトウェアとファームウェアの組合せ等として実行されることができる。
画像グラフ化エンジン402の画像前処理構成要素の中で、グレースケーラ406は、カラーのRGB画像の入力を受け取り、その入力を、例えばRGB値のL2ノルム(norm:基準)でグレースケール(濃淡)に変換することができる。
図に示す画像コンパレータ404の例では、ツリー差分化エンジン422は、原始画像(ソース画像)100のツリーファミリー104からHSTなどのツリーを受け取る。ツリー差分化エンジン422は、同様に候補画像のツリーファミリー104’からもツリーを受け取る。
図6は、典型的な画像比較の方法600を示す。流れ図では、個々のブロックに動作が要約されている。典型的方法600は、ハードウェア、ソフトウェア、またはその両方の組合せによって行われることができ、例えば典型的な画像比較エンジン306の構成要素によって行われることができる。
上記の主題は、ハードウェア、ソフトウェア、ファームウェア等、またはそれらの組合せとして実施することができる。特定の実施形態では、この主題は、コンピューティングデバイスや通信デバイスによって実行されるプログラムモジュール等のコンピュータ実行可能命令の一般的文脈で説明することができる。一般に、プログラムモジュールには、特定のタスクを行うか、特定の抽象データ型を実装するルーチン、プログラム、オブジェクト、コンポーネント、データ構造等が含まれる。この主題は、通信ネットワークを通じて接続された遠隔の処理デバイスにより無線通信を通じてタスクが行われる分散通信環境でも実施することができる。ワイヤレスネットワークでは、プログラムモジュールは、メモリ記憶装置を含む、ローカルおよびリモート両方の通信デバイスの記憶媒体に置くことができる。
Claims (20)
- 第1の画像を第1のグラフとして表し、第2の画像を第2のグラフとして表すステップであって、前記第1および第2のグラフの各頂点は、前記それぞれの画像のピクセルに対応するステップと、
各無向グラフの頂点間の各辺に重みを割り当てるステップであって、前記重みは、隣接するピクセル値間の差に対応するステップと、
前記第1のグラフから第1のツリーファミリーを導出し、前記第2のグラフから第2のツリーファミリーを導出するステップであって、前記ツリーファミリーにはグラフメトリックが埋め込まれているステップと、
前記第1のツリーファミリーと前記第2のツリーファミリー間の差分指標に基づいて、前記第1および前記第2の画像の差分指標を求めるステップと
を含むことを特徴とする方法。 - 前記第1および第2の画像を第1および第2のグラフとして表すステップは、各画像をウェーブレット変換で処理するステップを含むことを特徴とする請求項1に記載の方法。
- 前記ウェーブレット変換は、3段階のハールウェーブレット変換からなることを特徴とする請求項2に記載の方法。
- 各画像を縮小して、前処理画像に生じるノイズを低減するステップをさらに備えることを特徴とする請求項2に記載の方法。
- 各画像を幅およそ70ピクセルに縮小して前処理画像を形成するステップをさらに備えることを特徴とする請求項2に記載の方法。
- ツリーファミリーを導出する前記ステップは、画像の再帰的、階層的なクラスタリング分解により階層完全分離ツリーのファミリーを導出するステップを含むことを特徴とする請求項1に記載の方法。
- 前記再帰的、階層的なクラスタリング分解は、
前記前処理画像中のピクセルのクラスタ、前記ピクセルのクラスタ中の無作為のピクセル位置x、クラスタサイズr、および−r(logN)(logx)に等しい半径dを選択するステップであって、Nは、前記前処理画像中のピクセル数であるステップと、
前記ピクセルのクラスタが区分されるまで前記ピクセルのクラスタの子クラスタを生成するステップであって、該生成するステップは、xからの連続した半径のところに子クラスタを再帰的に構築するステップを含み、各子クラスタは、1回前に得られたクラスタを、現在の半径にあるクラスタで割った比に設定されるステップと
を含むことを特徴とする請求項6に記載の方法。 - 前記第1のツリーファミリーと前記第2のツリーファミリー間の差分を求めるステップは、
前記第1のツリーファミリーと前記第2のツリーファミリーのトポロジィ(接続形態)を比較するステップ、および、
前記第1および第2のファミリーのツリーノードに関連付けられたクラスタのトポロジィを比較するステップ
を含むことを特徴とする請求項1に記載の方法。 - 前記第1のツリーファミリーと前記第2のツリーファミリー間の差分を求めるステップは、前記第1のツリーファミリーおよび前記第2のツリーファミリーの各ノードに関連付けられたクラスタの凸閉包を計算してそのノードの形状パラメータを得、各ノードに関連付けられた前記クラスタの位置を前記形状パラメータと連結することにより、前記ノードに形状ベクトルを割り当て、前記第1および第2のツリーファミリーそれぞれの子ノードの集合についての前記形状ベクトル間の差分を最小にする差分指標を見つけるステップを含むことを特徴とする請求項1に記載の方法。
- 前記形状ベクトルの最小化差分のベクトルを形成し、前記ベクトルの成分を正規化することにより、前記ツリーのノードに対して差分を集計するステップをさらに含むことを特徴とする請求項9に記載の方法。
- 前記第1の画像と画像の集合の要素に対して前記方法を連続的に繰り返して、前記第1の画像との類似度が最も高い前記集合の要素を見つけるステップをさらに含むことを特徴とする請求項1に記載の方法。
- コンピューティングデバイスによって実行される、請求項1に記載の方法を実施するための複数の実行可能命令を備えることを特徴とする記憶媒体。
- 対応する画像から無向グラフを導出する画像グラフ化エンジンであって、前記無向グラフの頂点は、前記画像中のピクセルに対応する画像グラフ化エンジンと、
各前記無向グラフからツリーのファミリーを導出するツリー作成エンジンと、
前記ツリーファミリーの対応ノード間の最小差分を求めるツリー差分化エンジンと、
前記ツリーファミリー間の差分行列を作成するアグリゲータと、
前記差分行列から2つの画像についての類似度を導出するベクトルエンジンと
を備えることを特徴とする画像比較エンジン。 - 前記画像グラフ化エンジンは、
カラー画像を前処理するグレースケーラと、
ピクセルの係数ベクトル値を求めるウェーブレット変換エンジンと、
画像サイズを縮小し、ノイズを低減するダウンスケーラと
を含むことを特徴とする請求項13に記載の画像比較エンジン。 - 前記ツリー作成エンジンはさらに、無向グラフで表された画像を十分に分離されたクラスタに区分するクラスタリカーサ(recurser)を含むことを特徴とする請求項13に記載の画像比較エンジン。
- 前記ツリー作成エンジンはさらに、所有するノード数が閾値未満である対応クラスタに関連付けられたツリーノードを除去するツリープルーナ(pruner)を含むことを特徴とする請求項13に記載の画像比較エンジン。
- 前記ツリー作成エンジンはさらに、ツリーのノード数が閾値未満である場合に前記画像グラフ化エンジンから画像を再開始する再実行フィルタを含むことを特徴とする請求項13に記載の画像比較エンジン。
- 前記ツリー差分化エンジンはさらに、ツリートポロジィコンパレータとクラスタトポロジィコンパレータとを含む最小差分エンジンを有することを特徴とする請求項13に記載の画像比較エンジン。
- 対応する画像からグラフを導出する手段と、
各前記グラフからツリーのファミリーを導出する手段と、
2つの異なる画像の前記ツリーファミリー間の最小差分を求める手段と
を備えることを特徴とするシステム。 - 画像を選択する手段と、
前記ツリーファミリー間の前記最小差分に基づいて、前記画像の集合から前記選択された画像に最も類似する画像を見つける手段と
をさらに備えることを特徴とする請求項19に記載のシステム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/141,362 US7536064B2 (en) | 2005-05-31 | 2005-05-31 | Image comparison by metric embeddings |
PCT/US2006/016609 WO2006130292A2 (en) | 2005-05-31 | 2006-04-27 | Image comparison by metric embeddings |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008542911A true JP2008542911A (ja) | 2008-11-27 |
JP2008542911A5 JP2008542911A5 (ja) | 2009-07-09 |
Family
ID=37463452
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008514653A Pending JP2008542911A (ja) | 2005-05-31 | 2006-04-27 | メトリック埋め込みによる画像比較 |
Country Status (9)
Country | Link |
---|---|
US (1) | US7536064B2 (ja) |
EP (1) | EP1886256A2 (ja) |
JP (1) | JP2008542911A (ja) |
KR (1) | KR101183391B1 (ja) |
CN (1) | CN101194272A (ja) |
BR (1) | BRPI0610739A2 (ja) |
IL (1) | IL186757A0 (ja) |
RU (1) | RU2007144501A (ja) |
WO (1) | WO2006130292A2 (ja) |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8990198B2 (en) * | 2006-11-02 | 2015-03-24 | Ilan Cohn | Method and system for computerized management of related data records |
US8452108B2 (en) * | 2008-06-25 | 2013-05-28 | Gannon Technologies Group Llc | Systems and methods for image recognition using graph-based pattern matching |
JP2011517358A (ja) * | 2009-04-22 | 2011-06-02 | ペキン ユニバーシティ | 対話型多ラベル付け画像分割のための連結性類似度に基づくグラフ学習法 |
US9380292B2 (en) * | 2009-07-31 | 2016-06-28 | 3Dmedia Corporation | Methods, systems, and computer-readable storage media for generating three-dimensional (3D) images of a scene |
US8488873B2 (en) * | 2009-10-07 | 2013-07-16 | Apple Inc. | Method of computing global-to-local metrics for recognition |
US8630509B2 (en) * | 2009-11-03 | 2014-01-14 | Samsung Electronics Co., Ltd. | Structured grids for label propagation on a finite number of layers |
WO2011106440A1 (en) * | 2010-02-23 | 2011-09-01 | Loma Linda University Medical Center | Method of analyzing a medical image |
CN101882305B (zh) * | 2010-06-30 | 2014-02-05 | 中山大学 | 一种图像增强处理的方法 |
KR101348904B1 (ko) * | 2012-01-20 | 2014-01-09 | 한국과학기술원 | 고차 상관 클러스터링을 이용한 이미지 분할 방법, 이를 처리하는 시스템 및 기록매체 |
US20130155327A1 (en) * | 2012-02-01 | 2013-06-20 | Geoffrey Louis Barrows | Method to Process Image Sequences with Sub-Pixel Displacements |
CN103559705B (zh) * | 2013-10-23 | 2017-02-22 | 浙江工业大学 | 一种比较不同植物形态相似度的计算机方法 |
US9830567B2 (en) | 2013-10-25 | 2017-11-28 | Location Labs, Inc. | Task management system and method |
US10542961B2 (en) | 2015-06-15 | 2020-01-28 | The Research Foundation For The State University Of New York | System and method for infrasonic cardiac monitoring |
US10762283B2 (en) * | 2015-11-20 | 2020-09-01 | Adobe Inc. | Multimedia document summarization |
US11064219B2 (en) * | 2018-12-03 | 2021-07-13 | Cloudinary Ltd. | Image format, systems and methods of implementation thereof, and image processing |
CN111814781A (zh) * | 2019-04-11 | 2020-10-23 | 富士通株式会社 | 用于对图像块识别结果进行校正的方法、设备和存储介质 |
US11295483B1 (en) * | 2020-10-01 | 2022-04-05 | Bank Of America Corporation | System for immersive deep learning in a virtual reality environment |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001005976A (ja) * | 1999-06-04 | 2001-01-12 | Mitsubishi Electric Inf Technol Center America Inc | オブジェクト表面を探索する画像空間を順序付ける方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3141004B2 (ja) * | 1998-08-31 | 2001-03-05 | インターナショナル・ビジネス・マシーンズ・コーポレ−ション | 動画中のオブジェクトを分類する方法 |
US6636849B1 (en) * | 1999-11-23 | 2003-10-21 | Genmetrics, Inc. | Data search employing metric spaces, multigrid indexes, and B-grid trees |
US7120297B2 (en) * | 2002-04-25 | 2006-10-10 | Microsoft Corporation | Segmented layered image system |
US7298931B2 (en) | 2002-10-14 | 2007-11-20 | Samsung Electronics Co., Ltd. | Image retrieval method and apparatus using iterative matching |
GB0226787D0 (en) * | 2002-11-18 | 2002-12-24 | Qinetiq Ltd | Measurement of mitotic activity |
-
2005
- 2005-05-31 US US11/141,362 patent/US7536064B2/en not_active Expired - Fee Related
-
2006
- 2006-04-27 JP JP2008514653A patent/JP2008542911A/ja active Pending
- 2006-04-27 WO PCT/US2006/016609 patent/WO2006130292A2/en active Application Filing
- 2006-04-27 EP EP06758847A patent/EP1886256A2/en not_active Withdrawn
- 2006-04-27 RU RU2007144501/09A patent/RU2007144501A/ru not_active Application Discontinuation
- 2006-04-27 CN CNA200680018455XA patent/CN101194272A/zh active Pending
- 2006-04-27 KR KR1020077026179A patent/KR101183391B1/ko active IP Right Grant
- 2006-04-27 BR BRPI0610739-7A patent/BRPI0610739A2/pt not_active IP Right Cessation
-
2007
- 2007-10-18 IL IL186757A patent/IL186757A0/en unknown
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001005976A (ja) * | 1999-06-04 | 2001-01-12 | Mitsubishi Electric Inf Technol Center America Inc | オブジェクト表面を探索する画像空間を順序付ける方法 |
US6400846B1 (en) * | 1999-06-04 | 2002-06-04 | Mitsubishi Electric Research Laboratories, Inc. | Method for ordering image spaces to search for object surfaces |
Also Published As
Publication number | Publication date |
---|---|
KR20080021592A (ko) | 2008-03-07 |
RU2007144501A (ru) | 2009-06-10 |
US20060269167A1 (en) | 2006-11-30 |
IL186757A0 (en) | 2008-04-13 |
KR101183391B1 (ko) | 2012-09-14 |
WO2006130292A3 (en) | 2007-12-21 |
WO2006130292A2 (en) | 2006-12-07 |
CN101194272A (zh) | 2008-06-04 |
US7536064B2 (en) | 2009-05-19 |
EP1886256A2 (en) | 2008-02-13 |
BRPI0610739A2 (pt) | 2010-07-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2008542911A (ja) | メトリック埋め込みによる画像比較 | |
JP5506785B2 (ja) | 勾配ヒストグラムを用いた指紋表現 | |
US8712154B2 (en) | Image processing system and method | |
CN110088805B (zh) | 用于检测和分割多个前景对象的方法 | |
JP6341650B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
CN110807757B (zh) | 基于人工智能的图像质量评估方法、装置及计算机设备 | |
JP2006338313A (ja) | 類似画像検索方法,類似画像検索システム,類似画像検索プログラム及び記録媒体 | |
JP2013206187A (ja) | 情報変換装置、情報検索装置、情報変換方法、情報検索方法、情報変換プログラム、情報検索プログラム | |
CN112101364A (zh) | 基于参数重要性增量学习的语义分割方法 | |
CN113971644A (zh) | 基于数据增强策略选择的图像识别方法及装置 | |
CN114332500A (zh) | 图像处理模型训练方法、装置、计算机设备和存储介质 | |
US8611695B1 (en) | Large scale patch search | |
Kharinov | Model of the quasi-optimal hierarchical segmentation of a color image | |
CN107193979B (zh) | 一种同源图片检索的方法 | |
CN113792659A (zh) | 文档识别方法、装置及电子设备 | |
JP5890340B2 (ja) | 画像分類装置及び画像分類プログラム | |
CN110598727B (zh) | 基于迁移学习的模型构建方法、图像识别方法及其装置 | |
CN116543259A (zh) | 一种深度分类网络噪声标签建模与纠正方法、***及存储介质 | |
CN111091580A (zh) | 一种基于改进ResNet-UNet网络的立木图像分割方法 | |
CN116051924A (zh) | 一种图像对抗样本的分治防御方法 | |
CN113139577B (zh) | 一种基于可变形卷积网络的深度学习图像分类方法及*** | |
KR102526415B1 (ko) | 준지도 학습 방식의 단일 영상 깊이 추정 시스템 및 방법과 이를 위한 컴퓨터 프로그램 | |
CN111695526B (zh) | 网络模型生成方法、行人重识别方法及装置 | |
CN114329024A (zh) | 一种iconfont图标搜索方法和*** | |
CN113947195A (zh) | 模型确定方法、装置、电子设备和存储器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090324 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090324 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090520 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110517 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110527 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20111021 |