JP2017162230A - 情報処理装置、類似データ検索方法、及び類似データ検索プログラム - Google Patents
情報処理装置、類似データ検索方法、及び類似データ検索プログラム Download PDFInfo
- Publication number
- JP2017162230A JP2017162230A JP2016046593A JP2016046593A JP2017162230A JP 2017162230 A JP2017162230 A JP 2017162230A JP 2016046593 A JP2016046593 A JP 2016046593A JP 2016046593 A JP2016046593 A JP 2016046593A JP 2017162230 A JP2017162230 A JP 2017162230A
- Authority
- JP
- Japan
- Prior art keywords
- data
- feature
- dissimilarity
- target
- registered
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/12—Fingerprints or palmprints
- G06V40/1365—Matching; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/28—Determining representative reference patterns, e.g. by averaging or distorting; Generating dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/462—Salient features, e.g. scale invariant feature transforms [SIFT]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/762—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/191—Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
- G06V30/1914—Determining representative reference patterns, e.g. averaging or distorting patterns; Generating dictionaries, e.g. user dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/24—Character recognition characterised by the processing or recognition method
- G06V30/242—Division of the character sequences into groups prior to recognition; Selection of dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/14—Vascular patterns
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Human Computer Interaction (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】登録データ21が有する第1の特徴を表す第1の登録特徴データ22aと第2の特徴を表す第2の登録特徴データ22bとを記憶し、対象データ31が有する第1の特徴を表す第1の対象特徴データ32aと第2の特徴を表す第2の対象特徴データ32bとを生成し、2つの入力値の交換に対して演算結果が変化しない対称性を持つ第1の演算処理33により第1の登録特徴データ22aと第1の対象特徴データ32aとの第1の非類似度34を計算し、2つの入力値の交換に対して演算結果が変化する反対称性を持つ第2の演算処理35により第2の登録特徴データ22bと第2の対象特徴データ32bとの第2の非類似度36を計算し、第1の非類似度34と第2の非類似度36とに基づいて、対象データ31に類似する登録データ21を特定する、情報処理装置10が提供される。
【選択図】図1
Description
図1を参照しながら、第1実施形態について説明する。第1実施形態は、非構造化データの類似検索に関し、非構造化データの採取環境による検索結果への影響を抑制する仕組みを開示する。図1は、第1実施形態に係る情報処理装置の一例を示した図である。なお、図1に例示した情報処理装置10は、第1実施形態に係る情報処理装置の一例である。
なお、記憶部11は、RAM(Random Access Memory)などの揮発性記憶装置、或いは、HDD(Hard Disk Drive)やフラッシュメモリなどの不揮発性記憶装置である。演算部12は、CPU(Central Processing Unit)やDSP(Digital Signal Processor)などのプロセッサである。但し、演算部12は、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)などの電子回路であってもよい。演算部12は、例えば、記憶部11又は他のメモリに記憶されたプログラムを実行する。
例えば、被採取者Xから第1の環境下で予め採取された指紋データX1(登録データ21)と、被採取者Yから第2の環境下で採取された指紋データY2(対象データ31)との間の第1の非類似度34が小さい場合、YをXと誤判定するリスクがある。しかし、X1、Y2間の第2の非類似度36は大きくなる一方、被採取者Yから第1の環境下で予め採取された指紋データX1(登録データ21)と、指紋データY2との第2の非類似度36は小さくなる。そのため、誤判定のリスクを抑圧することができる。
<2.第2実施形態>
次に、第2実施形態について説明する。第2実施形態は、非構造化データの類似検索に関し、非構造化データの採取環境による検索結果への影響を抑制する仕組みを開示する。
まず、図2を参照しながら、第2実施形態に係る仕組みを実現することが可能な情報処理装置100のハードウェアについて説明する。図2は、第2実施形態に係る情報処理装置の機能を実現可能なハードウェアの一例を示した図である。なお、情報処理装置100は、第2実施形態に係る情報処理装置の一例である。
[2−2.機能]
次に、図3を参照しながら、情報処理装置100の機能について説明する。図3は、第2実施形態に係る情報処理装置が有する機能の一例を示したブロック図である。
記憶部101の機能は、上述したRAM906や記憶部920などを用いて実現できる。バイナリデータ生成部102、対称成分計算部103、反対称成分計算部104、及び類否判定部105の機能は、上述したCPU902などを用いて実現できる。
…(1)
dQ(x,y)=0ならばx=y
…(2)
dQ(x,y)≦dQ(x,z)+dQ(z,y)
…(3)
例えば、山の上にある家と谷にある駅とを移動する際に、行きと帰りとで移動する人が感じる距離が異なるように、準距離は、移動コストを考慮した距離を表す指標となる。つまり、準距離は、風や重力などに起因する移動コストを加味した距離と言える。このように、移動方向によって距離(準距離)が異なる性質を反対称性と呼ぶ。
特徴ベクトルをV、法線ベクトルをVn、オフセットをDと表現すると、超平面Sの方程式は下記の式(4)で与えられる。なお、V、Vnはベクトル量であり、Dはスカラー量である。また、・は内積を表す。そして、超平面Sを用いて特徴ベクトルVから得られるビット値をbS(V)と表現すると、ビット値bS(V)は下記の式(5)で与えられる。また、k個の超平面S1、S2、…、Skが与えられた場合、特徴ベクトルVに対応するバイナリデータ(ビット列)b(V)は下記の式(6)により与えられる。
…(4)
…(6)
再び図3を参照する。バイナリデータ生成部102は、入力装置200から特徴ベクトル(クエリ)の入力を受け付ける。入力装置200は、例えば、認証用に指紋や静脈パターンなどの画像データを採取し、採取した画像データから特徴ベクトルを抽出する装置である。生体認証機能を搭載したATM(Automatic Teller Machine)や入退出管理システムなどは入力装置200の一例である。なお、入力装置200は情報処理装置100と一体であってもよい。
ここで、図8を参照しながら、非類似度の反対称成分が有する特性(反対称性)について、さらに説明する。図8は、第2実施形態に係る非類似度の反対称成分が有する特性を超平面の一方向性によって解釈する方法について説明するための図である。
ここで、図9を参照しながら、第2実施形態に係る超平面の決定方法について説明する。図9は、第2実施形態に係る超平面の決定方法について説明するための図である。
[2−3.処理の流れ]
次に、バイナリデータの登録処理、及び入力された非構造化データの特徴ベクトル(クエリ)に類似する特徴ベクトル(レコード)の検索処理について処理の流れを説明する。
まず、図10を参照しながら、バイナリデータの登録処理の流れについて説明する。図10は、第2実施形態に係る登録処理の流れを示したフロー図である。
(S102)バイナリデータ生成部102は、超平面情報101a(図4を参照)を参照し、対称成分用の超平面に関する法線ベクトル及びオフセットの情報を用いて、S101で取得した特徴ベクトルからバイナリデータB1rを生成する(図6を参照)。
次に、図11及び図12を参照しながら、検索処理の流れについて説明する。図11は、第2実施形態に係る検索処理の流れを示した第1のフロー図である。図12は、第2実施形態に係る検索処理の流れを示した第2のフロー図である。
(S112)バイナリデータ生成部102は、超平面情報101a(図4を参照)を参照し、対称成分用の超平面に関する法線ベクトル及びオフセットの情報を用いて、S111で取得した特徴ベクトルVqからバイナリデータB1qを生成する(図6を参照)。
(S118)類否判定部105は、全てのバイナリデータB1r、B2rを選択したか否かを判定する。全てのバイナリデータB1r、B2rを選択し終えている場合、処理はS119へと進む。一方、未選択のバイナリデータB1r、B2rがある場合、処理はS114へと進む。
(S121)類否判定部105は、特徴ベクトルVq、Vrの類似度を計算する。
上記のように、超平面の一方向性に環境の変化による影響を反映させ、反対称性を有する非類似度の評価を通じて環境変化による影響を類似検索に加味することで、環境変化に起因する検索誤差を抑制することが可能になる。
11 記憶部
12 演算部
21 登録データ
22a 第1の登録特徴データ
22b 第2の登録特徴データ
31 対象データ
32a 第1の対象特徴データ
32b 第2の対象特徴データ
33 第1の演算処理
34 第1の非類似度
35 第2の演算処理
36 第2の非類似度
37 非類似度
Claims (6)
- 登録データが有する第1の特徴を表す第1の登録特徴データと、前記登録データが有する第2の特徴を表す第2の登録特徴データとを記憶する記憶部と、
対象データが有する前記第1の特徴を表す第1の対象特徴データと、前記対象データが有する前記第2の特徴を表す第2の対象特徴データとを生成し、
2つの入力値の交換に対して演算結果が変化しない対称性を持つ演算処理であって前記2つの入力値の間の非類似度を計算する第1の演算処理により、前記第1の登録特徴データと前記第1の対象特徴データとの間の第1の非類似度を計算し、
2つの入力値の交換に対して演算結果が変化する反対称性を持つ演算処理であって前記2つの入力値の間の非類似度を計算する第2の演算処理により、前記第2の登録特徴データと前記第2の対象特徴データとの間の第2の非類似度を計算し、
前記第1の非類似度と前記第2の非類似度とに基づいて、前記対象データに類似する前記登録データを特定する演算部と
を有する、情報処理装置。 - 前記演算部は、前記第1の非類似度と前記第2の非類似度との和が小さい順に前記登録データを特定する
請求項1に記載の情報処理装置。 - 前記第1の登録特徴データ、前記第2の登録特徴データ、前記第1の対象特徴データ、及び前記第2の対象特徴データはビット列であり、
前記第1の演算処理は、前記2つの入力値のうち一の入力値と他の入力値との間の排他的論理和に含まれる1の数をカウントする演算処理であり、
前記第2の演算処理は、前記2つの入力値のうち一の入力値と、他の入力値を反転した反転値との間の論理積に含まれる1の数をカウントする演算処理である
請求項1又は2に記載の情報処理装置。 - 前記第1の特徴は、同じ環境で採取された第1及び第2のデータを比較した際に前記第1のデータが有する前記第1の特徴と前記第2のデータが有する前記第1の特徴との類似度が高いほど前記第1の非類似度が小さくなる特徴であり、
前記第2の特徴は、異なる環境で採取された第3及び第4のデータを比較した際に前記第3のデータが有する前記第2の特徴と前記第4のデータが有する前記第2の特徴との類似度が高いほど前記第2の非類似度が小さくなる特徴である
請求項1〜3のいずれか1項に記載の情報処理装置。 - コンピュータが、
記憶部から、登録データが有する第1の特徴を表す第1の登録特徴データと、前記登録データが有する第2の特徴を表す第2の登録特徴データとを取得し、
対象データが有する前記第1の特徴を表す第1の対象特徴データと、前記対象データが有する前記第2の特徴を表す第2の対象特徴データとを生成し、
2つの入力値の交換に対して演算結果が変化しない対称性を持つ演算処理であって前記2つの入力値の間の非類似度を計算する第1の演算処理により、前記第1の登録特徴データと前記第1の対象特徴データとの間の第1の非類似度を計算し、
2つの入力値の交換に対して演算結果が変化する反対称性を持つ演算処理であって前記2つの入力値の間の非類似度を計算する第2の演算処理により、前記第2の登録特徴データと前記第2の対象特徴データとの間の第2の非類似度を計算し、
前記第1の非類似度と前記第2の非類似度とに基づいて、前記対象データに類似する前記登録データを特定する
類似データ検索方法。 - コンピュータに、
記憶部から、登録データが有する第1の特徴を表す第1の登録特徴データと、前記登録データが有する第2の特徴を表す第2の登録特徴データとを取得し、
対象データが有する前記第1の特徴を表す第1の対象特徴データと、前記対象データが有する前記第2の特徴を表す第2の対象特徴データとを生成し、
2つの入力値の交換に対して演算結果が変化しない対称性を持つ演算処理であって前記2つの入力値の間の非類似度を計算する第1の演算処理により、前記第1の登録特徴データと前記第1の対象特徴データとの間の第1の非類似度を計算し、
2つの入力値の交換に対して演算結果が変化する反対称性を持つ演算処理であって前記2つの入力値の間の非類似度を計算する第2の演算処理により、前記第2の登録特徴データと前記第2の対象特徴データとの間の第2の非類似度を計算し、
前記第1の非類似度と前記第2の非類似度とに基づいて、前記対象データに類似する前記登録データを特定する
処理を実行させる、類似データ検索プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016046593A JP6646216B2 (ja) | 2016-03-10 | 2016-03-10 | 情報処理装置、類似データ検索方法、及び類似データ検索プログラム |
US15/425,129 US10121085B2 (en) | 2016-03-10 | 2017-02-06 | Information processing apparatus and method of searching for similar data |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016046593A JP6646216B2 (ja) | 2016-03-10 | 2016-03-10 | 情報処理装置、類似データ検索方法、及び類似データ検索プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017162230A true JP2017162230A (ja) | 2017-09-14 |
JP6646216B2 JP6646216B2 (ja) | 2020-02-14 |
Family
ID=59788571
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016046593A Active JP6646216B2 (ja) | 2016-03-10 | 2016-03-10 | 情報処理装置、類似データ検索方法、及び類似データ検索プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US10121085B2 (ja) |
JP (1) | JP6646216B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020525958A (ja) * | 2017-10-06 | 2020-08-27 | 三菱電機株式会社 | 画像処理システム及び画像処理方法 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102681701B1 (ko) * | 2018-11-14 | 2024-07-05 | 현대자동차주식회사 | 얼굴 인식 장치 및 방법 |
CN113039534A (zh) * | 2018-11-16 | 2021-06-25 | 富士通株式会社 | 相似度计算装置、相似度计算方法以及相似度计算程序 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130262489A1 (en) * | 2012-03-28 | 2013-10-03 | Fujitsu Limited | Information conversion device and information search device |
JP2015225353A (ja) * | 2014-05-26 | 2015-12-14 | 富士通株式会社 | 画像処理装置、画像判断方法、及びプログラム |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5432935B2 (ja) | 2011-02-17 | 2014-03-05 | 日本電信電話株式会社 | 予測器選択装置、予測器選択方法、予測器選択プログラム |
JP6134246B2 (ja) | 2013-10-16 | 2017-05-24 | 日本電信電話株式会社 | ハッシュ関数生成方法、ハッシュ値生成方法、ハッシュ関数生成装置、ハッシュ値生成装置、ハッシュ関数生成プログラム及びハッシュ値生成プログラム |
-
2016
- 2016-03-10 JP JP2016046593A patent/JP6646216B2/ja active Active
-
2017
- 2017-02-06 US US15/425,129 patent/US10121085B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130262489A1 (en) * | 2012-03-28 | 2013-10-03 | Fujitsu Limited | Information conversion device and information search device |
JP2013206187A (ja) * | 2012-03-28 | 2013-10-07 | Fujitsu Ltd | 情報変換装置、情報検索装置、情報変換方法、情報検索方法、情報変換プログラム、情報検索プログラム |
JP2015225353A (ja) * | 2014-05-26 | 2015-12-14 | 富士通株式会社 | 画像処理装置、画像判断方法、及びプログラム |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020525958A (ja) * | 2017-10-06 | 2020-08-27 | 三菱電機株式会社 | 画像処理システム及び画像処理方法 |
Also Published As
Publication number | Publication date |
---|---|
JP6646216B2 (ja) | 2020-02-14 |
US10121085B2 (en) | 2018-11-06 |
US20170262718A1 (en) | 2017-09-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6004016B2 (ja) | 情報変換方法、情報変換装置および情報変換プログラム | |
US9202255B2 (en) | Identifying multimedia objects based on multimedia fingerprint | |
US10685008B1 (en) | Feature embeddings with relative locality for fast profiling of users on streaming data | |
WO2022166380A1 (zh) | 一种基于meanshift优化的数据处理方法和装置 | |
JP6004015B2 (ja) | 学習方法、情報処理装置および学習プログラム | |
JP7149976B2 (ja) | 誤り訂正方法及び装置、コンピュータ読み取り可能な媒体 | |
JP6646216B2 (ja) | 情報処理装置、類似データ検索方法、及び類似データ検索プログラム | |
WO2021143016A1 (zh) | 近似数据处理方法、装置、介质及电子设备 | |
JP5518757B2 (ja) | 文書分類学習制御装置、文書分類装置およびコンピュータプログラム | |
Sokolova et al. | Computation-efficient face recognition algorithm using a sequential analysis of high dimensional neural-net features | |
JP5520353B2 (ja) | BoF表現生成装置及びBoF表現生成方法 | |
JP6017277B2 (ja) | 特徴ベクトルの集合で表されるコンテンツ間の類似度を算出するプログラム、装置及び方法 | |
JP5833499B2 (ja) | 高次元の特徴ベクトル集合で表現されるコンテンツを高精度で検索する検索装置及びプログラム | |
US9792561B2 (en) | Learning method, information conversion device, and recording medium | |
JP6152032B2 (ja) | ハッシュ関数生成方法、ハッシュ値生成方法、ハッシュ関数生成装置、ハッシュ値生成装置、ハッシュ関数生成プログラム及びハッシュ値生成プログラム | |
US11070699B1 (en) | Systems and methods for facilitating determining contextual and semantic meaning from an image scan | |
Pattanshetti et al. | Performance evaluation and analysis of feature selection algorithms | |
Al Jazaery et al. | Automated cleaning of identity label noise in a large face dataset with quality control | |
CN112559170B (zh) | 一种边缘计算环境下缓存数据的近似匹配方法 | |
Yang et al. | PLSAV: Parallel loop searching and verifying for loop closure detection | |
CN116415573B (zh) | 一种基于知识图谱的文本主题识别方法和*** | |
van Hout et al. | Late fusion and calibration for multimedia event detection using few examples | |
Lulu et al. | TMNIO: Triplet merged network with involution operators for improved few‐shot image classification | |
Affek et al. | Open-Set Speaker Identification Using Closed-Set Pretrained Embeddings | |
Lee et al. | One-Stage Mobile Palmprint Recognition via Keypoint Detection Network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20181210 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20191129 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20191210 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20191223 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6646216 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |