JP7347551B2 - イメージ検索方法、装置、電子機器、及びコンピュータ読み取り可能な記憶媒体 - Google Patents
イメージ検索方法、装置、電子機器、及びコンピュータ読み取り可能な記憶媒体 Download PDFInfo
- Publication number
- JP7347551B2 JP7347551B2 JP2022001841A JP2022001841A JP7347551B2 JP 7347551 B2 JP7347551 B2 JP 7347551B2 JP 2022001841 A JP2022001841 A JP 2022001841A JP 2022001841 A JP2022001841 A JP 2022001841A JP 7347551 B2 JP7347551 B2 JP 7347551B2
- Authority
- JP
- Japan
- Prior art keywords
- feature
- current node
- node
- subnode
- information gain
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/53—Querying
- G06F16/532—Query formulation, e.g. graphical querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/53—Querying
- G06F16/535—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/53—Querying
- G06F16/538—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/55—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/771—Feature selection, e.g. selecting representative features from a multi-dimensional feature space
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/7715—Feature extraction, e.g. by transforming the feature space, e.g. multi-dimensional scaling [MDS]; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
- G06N5/041—Abduction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
- G06N5/048—Fuzzy inferencing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Medical Informatics (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Library & Information Science (AREA)
- Automation & Control Theory (AREA)
- Fuzzy Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Description
検索待ちのイメージセットの中のイメージの特徴を取得し、前記特徴に基づいて決定木を生成し、前記決定木の中のノードに対応する問題をそれぞれ配置するステップと、
ユーザのイメージ検索要求を受信した場合、前記問題に基づいてユーザに質問し、前記ユーザの回答を組み合わせて、前記決定木から一つの最適パスを選択し、前記最適パス上のリーフノードに対応するイメージを検索されたイメージとするステップと、を含む。
前記前処理モジュールは、検索待ちのイメージセットの中のイメージの特徴を取得し、前記特徴に基づいて決定木を生成し、前記決定木の中のノードに対応する問題をそれぞれ配置するために用いられ、
前記検索モジュールは、ユーザのイメージ検索要求を受信した場合、前記問題に基づいてユーザに質問し、前記ユーザの回答を組み合わせて、前記決定木から一つの最適パスを選択し、前記最適パス上のリーフノードに対応するイメージを検索されたイメージとするために用いられる。
少なくとも一つのプロセッサと、
前記少なくとも一つのプロセッサと通信接続されたメモリと、を含み、
前記メモリに前記少なくとも一つのプロセッサにより実行可能な命令が記憶されており、前記命令が前記少なくとも一つのプロセッサにより実行されると、前記少なくとも一つのプロセッサが上記の方法を実行させる、
前記コンピュータ命令は、コンピュータに上記の方法を実行させる。
本明細書で説明された内容は、本開示の実施例のキー又は重要な特徴を特定することを意図しておらず、本開示の範囲を制限するためにも使用されないことを理解されたい。本開示の他の特徴は、以下の明細書を通じて容易に理解できる。
情報論では、エントロピーは、ランダム変数の不確実性を表すために用いられ、情報利得はエントロピー情報論に基づいて確定される。
[数1]
g(D,A)=H(D)-H(D|A)
上記の式は、データセットDの初期エントロピーから特徴Aを知った後のデータセットDのエントロピーを減算し、一つの不確実なものについては、関連する情報をもう少し知っている限り、エントロピーは、通常、減少するため、H(D)は、通常、H(D|A)より大きく、H(D)とH(D|A)の差は、情報利得の程度を定量化することを理解することができる。
ルートノードを現在のノードとし、元のデータセットを現在のノードに対応するデータセットとし、元の特徴セットを現在のノードに対応する特徴セットとし、以下の第4の処理を実行し、
現在のノードに対応する特徴セット内の各特徴が現在のノードに対応するデータセットに対する情報利得をそれぞれ取得し、現在のノードに対応する特徴セットにそれぞれ特徴1、特徴2、及び特徴3である3つの特徴が含まれると仮定すると、3つの情報利得を取得することができ、
情報利得が最大の特徴を選択し、特徴2であると仮定すると、さらに、特徴2に対応する異なる特徴値に対応するノードをそれぞれ確立し、確立されたノードを現在のノードのサブノードとすることができ、例えば、特徴2は撮影場所であり、対応する特徴値は、北京、上海、広州などを含み、各特徴値に対応するサブノードをそれぞれ確立することができ、
現在のノードの各サブノードについて、それぞれ現在のノードに対応するデータセットから当該サブノードにマッチングするデータを選択し、当該サブノードに対応するデータセットを構成し、マッチングするデータは、選択された特徴の特徴値が当該サブノードに対応する特徴値のデータであり、例えば、あるサブノードに対応する特徴値が北京であり、現在のノードに対応するデータセットから撮影場所が北京であるデータを選択し、当該サブノードに対応するデータセットを構成することができ、
選択された特徴を特徴2のように現在のノードに対応する特徴セットから削除し、更新後の特徴セットを取得し、
現在のノードの各サブノードについて、当該サブノードがリーフノードであると決定された場合、当該サブノードに対する処理を終了し、それでない場合、当該サブノードを現在のノードとし、更新後の特徴セットを現在のノードに対応する特徴セットとし、ルートノードから開始するすべてのパス上の最後一つのノードがいずれもリーフノードであるまで、第4の処理を繰り返して実行する。
ID3アルゴリズムは、オーバーフィッティングしやすくなり、情報利得が特徴値の多い特徴に偏っているという大きい欠点がある。原因は、ある特徴に対応する特徴値が比較的に多い場合、当該特徴に基づいて分割すると純度がより高いサブセットをより容易に取得することができ、したがって、分割後のエントロピーはより低くなり、分割前のエントロピーは一定であるため、取得された情報利得はより大きくなる。
[数2]
その中:
[数3]
Nは、特徴Aに対応する特徴値の数を表し、Diは、データセットDの中の特徴Aの値が特徴値iのデータで構成されるデータセットを表し、|D|は、データセットDに含まれるデータの数を表し、|Di|は、データセットDiに含まれるデータの数を表す。
[数4]
情報利得比 = 情報利得 × ペナルティパラメータ
その中、ペナルティパラメータは、すなわち 1/HA(D)であるため、情報利得に対する特徴値の数の影響を一定の手順で相殺する。
ID3アルゴリズムでは情報利得を使用して特徴を選択し、情報利得が大きい特徴を優先的に選択し、C4.5アルゴリズムには情報利得比を使用して特徴を選択し、特徴値の数が多いことによる情報利得が大きいという問題を低減する。分類及び回帰ツリー(CART、Classification and Regression Tree)アルゴリズムは、ジニ係数を使用して特徴を選択し、ジニ係数は、不純度を表し、ジニ係数が小さいほど、不純度が低く、特徴がよく、これは情報利得(比)と反対である。
[数5]
その中、p(xi)は、データxがカテゴリiに属する確率を表し、nはカテゴリの数を表し、すなわちデータセットDにはn個のカテゴリが含まれ、Gini(D)は、データセットDからランダムに選択された一つのデータが誤って分類される確率を反映し、すなわちサンプルセット内で一つのランダムに選択されたサンプルが誤って分類される確率を表し、ジニ係数が小さいほど、サンプルセット内で選択されたサンプルが誤って分類される確率が小さくなることを表し、つまり、サンプルセットの純度が高いほど、逆に、純度が低くなる。
[数6]
その中、|D|は、データセットDに含まれるデータの数、すなわちサンプルの数を表し、|D1|は、データセットD1に含まれるデータの数を表し、|D2|は、データセットD2に含まれるデータの数を表す。
ルートノードを現在のノードとし、元のデータセットを現在のノードに対応するデータセットとし、元の特徴セットを現在のノードに対応する特徴セットとし、以下の第5の処理を実行し:
現在のノードに対応する特徴セット内の各特徴について、当該特徴に対応する各特徴値が現在のノードに対応するデータセットに対するジニ係数をそれぞれ取得し、
取得された各ジニ係数から値が最も小さいジニ係数を選択し、選択されたジニ係数に対応する特徴(特徴Aと仮定する)及び対応する特徴の特徴値(特徴値aと仮定する)を最適な特徴と最適なセグメンテーションポイントとし、
最適な特徴と最適なセグメンテーションポイントに基づいて、現在のノードに対応するデータセットをD1とD2の二つのデータセットに分割し、現在のノードの二つのサブノードを生成し、一つのサブノードはデータセットD1に対応し、別のサブノードはデータセットD2に対応し、データセットD1内のデータの特徴A値は特徴値aであり、データセットD2内のデータの特徴A値は特徴値aではなく、
現在のノードの各サブノードについて、所定の条件に適合すると決定された場合、当該サブノードに対する処理を終了することができ、例えば、当該サブノードに対応するデータセットに含まれるデータの数が所定の閾値より小さい場合、例えば、前記閾値が2であり、又は、当該サブノードに対応するデータセットのジニ係数が所定の閾値より小さい場合など、所定の条件に適合すると見なすことができ、所定の条件に適合していないと決定された場合、当該サブノードを現在のノードとし、第5の処理などを繰り返して実行することができる。
ルートノードを現在のノードとし、元のデータセットを現在のノードに対応するデータセットとし、元の特徴セットを現在のノードに対応する特徴セットとし、元のデータセットは検索待ちのイメージセットであってもよく、元の特徴セットは取得されたイメージの特徴で構成された特徴セットであってもよく、以下の第2の処理を実行し、
情報利得及び情報利得比を組み合わせて、現在のノードに対応する特徴セットから一つの最適な特徴を選択し、最適な特徴に対応する異なる特徴値について、対応するノードをそれぞれ確立し、確立されたノードを現在のノードのサブノードとし、
現在のノードの各サブノードについて、それぞれ現在のノードに対応するデータセットから当該サブノードにマッチングするデータを選択し、当該サブノードに対応するデータセットを構成し、マッチングするデータは、最適な特徴の特徴値が当該サブノードに対応する特徴値であるデータであり、
最適な特徴を現在のノードに対応する特徴セットから削除し、更新後の特徴セットを取得し、
現在のノードの各サブノードについて、当該サブノードがリーフノードであると決定された場合、当該サブノードに対する処理を終了し、それでない場合、当該サブノードを現在のノードとし、更新後の特徴セットを現在のノードに対応する特徴セットとし、ルートノードから開始するすべてのパス上の最後一つのノードがいずれもリーフノードであるまで、第2の処理を繰り返して実行する。
ルートノードを現在のノードとし、元のデータセットを現在のノードに対応するデータセットとし、元の特徴セットを現在のノードに対応する特徴セットとし、元のデータセットは検索待ちのイメージセットであってもよく、元の特徴セットは取得されたイメージの特徴で構成された特徴セットであってもよく、以下の第3の処理を実行することができ、
情報利得及び情報利得比を組み合わせて、現在のノードに対応する特徴セットから一つの最適な特徴を選択し、ジニ係数により、最適な特徴に対応する各特徴値からM個の特徴値を選択し、Mは正の整数であり、最適な特徴に対応する特徴値の数より小さく、選択されていない特徴値を他の特徴値とし、他の特徴値を一つの全体とし、M個の特徴値及び他の特徴値に対応するノードをそれぞれ確立し、確立されたM+1個のノードを現在のノードのサブノードとし、
現在のノードの各サブノードについて、それぞれ現在のノードに対応するデータセットから当該サブノードにマッチングするデータを選択し、当該サブノードに対応するデータセットを構成し、マッチングするデータは、最適な特徴の特徴値が当該サブノードに対応する特徴値であるデータであり、
最適な特徴を現在のノードに対応する特徴セットから削除し、更新後の特徴セットを取得し、
現在のノードの各サブノードについて、当該サブノードがリーフノードであると決定された場合、当該サブノードに対する処理を終了し、それでない場合、当該サブノードを現在のノードとし、更新後の特徴セットを現在のノードに対応する特徴セットとし、ルートノードから開始するすべてのパス上の最後一つのノードがいずれもリーフノードであるまで、第3の処理を繰り返して実行する。
Claims (15)
- コンピュータにより実行される、イメージ検索方法であって、
検索待ちのイメージセットの中のイメージの特徴を取得し、前記特徴に基づいて決定木を生成し、前記決定木の中のノードに対応する問題をそれぞれ配置するステップと、
ユーザのイメージ検索要求を受信した場合、前記問題に基づいてユーザに質問し、前記ユーザの回答を組み合わせて、前記決定木から一つの最適パスを選択し、前記最適パス上のリーフノードに対応するイメージを検索されたイメージとするステップと、を含み、
前記特徴に基づいて決定木を生成するステップは、
前記特徴に基づいて、所定の特徴選択基準に従って、前記決定木を生成するステップを含み、
前記所定の特徴選択基準が情報利得及び情報利得比を含み、
前記決定木を生成するステップは、
ルートノードを現在のノードとし、前記検索待ちのイメージセットを前記現在のノードに対応するデータセットとし、取得されたイメージの特徴で構成された特徴セットを前記現在のノードに対応する特徴セットとし、第2の処理を実行するステップを含み、
前記第2の処理は、
前記情報利得及び前記情報利得比を組み合わせて、前記現在のノードに対応する特徴セットから一つの最適な特徴を選択し、前記最適な特徴に対応する異なる特徴値について、対応するノードをそれぞれ確立し、確立されたノードを前記現在のノードのサブノードとし、
前記現在のノードの各サブノードについて、それぞれ前記現在のノードに対応するデータセットから前記サブノードにマッチングするデータを選択し、前記サブノードに対応するデータセットを構成し、前記マッチングするデータは、前記最適な特徴の特徴値が前記サブノードに対応する特徴値であるデータであり、
前記最適な特徴を前記現在のノードに対応する特徴セットから削除し、更新後の特徴セットを取得し、
前記現在のノードの各サブノードについて、前記サブノードがリーフノードであると決定された場合、前記サブノードに対する処理を終了し、前記サブノードがリーフノードではないと決定された場合、前記サブノードを前記現在のノードとし、前記更新後の特徴セットを前記現在のノードに対応する特徴セットとし、前記ルートノードから開始するすべてのパス上の最後一つのノードがいずれもリーフノードであるまで、前記第2の処理を繰り返して実行する、処理である、
イメージ検索方法。 - 前記決定木から一つの最適パスを選択するステップは、前記決定木内のルートノードを現在のノードとし、第1の処理を実行するステップを含み、
前記第1の処理は、
前記現在のノードに対応する問題に従って前記ユーザに質問し、
前記ユーザの回答を取得し、前記現在のノードのサブノードから前記回答にマッチングするサブノードを決定し、
前記マッチングするサブノードがリーフノードであると決定された場合、前記ルートノードから前記リーフノードまでのパスを前記最適パスとし、前記マッチングするサブノードが前記リーフノードではないと決定された場合、前記マッチングするサブノードを前記現在のノードとし、前記第1の処理を繰り返し実行する、処理である、
請求項1に記載のイメージ検索方法。 - 前記所定の特徴選択基準は、ジニ係数をさらに含む、
請求項1または2に記載のイメージ検索方法。 - 前記所定の特徴選択基準が前記情報利得、前記情報利得比、及び前記ジニ係数を含む場合、前記決定木を生成するステップは、
ルートノードを現在のノードとし、前記検索待ちのイメージセットを前記現在のノードに対応するデータセットとし、取得されたイメージの特徴で構成された特徴セットを前記現在のノードに対応する特徴セットとし、第3の処理を実行するステップを含み、
前記第3の処理は、
前記情報利得及び前記情報利得比を組み合わせて、前記現在のノードに対応する特徴セットから一つの最適な特徴を選択し、前記ジニ係数により、前記最適な特徴に対応する各特徴値からM(Mは前記最適な特徴に対応する特徴値の数より小さい正の整数である)個の特徴値を選択し、選択されていない特徴値を他の特徴値とし、前記他の特徴値を一つの全体として、前記M個の特徴値及び前記他の特徴値に対応するノードをそれぞれ確立し、確立されたM+1個のノードを前記現在のノードのサブノードとし、
前記現在のノードの各サブノードについて、それぞれ前記現在のノードに対応するデータセットから前記サブノードにマッチングするデータを選択し、前記サブノードに対応するデータセットを構成し、前記マッチングするデータは、前記最適な特徴の特徴値が前記サブノードに対応する特徴値であるデータであり、
前記最適な特徴を前記現在のノードに対応する特徴セットから削除し、更新後の特徴セットを取得し、
前記現在のノードの各サブノードについて、前記サブノードが前記リーフノードであると決定された場合、前記サブノードに対する処理を終了し、前記サブノードが前記リーフノードではないと決定された場合、前記サブノードを前記現在のノードとし、前記更新後の特徴セットを前記現在のノードに対応する特徴セットとして、前記ルートノードから開始するすべてのパス上の最後一つのノードがいずれも前記リーフノードであるまで、前記第3の処理を繰り返して実行する、処理である、
請求項3に記載のイメージ検索方法。 - 前記情報利得及び前記情報利得比を組み合わせて、前記現在のノードに対応する特徴セットから一つの最適な特徴を選択するステップは、
前記現在のノードに対応する特徴セット内の各特徴が前記現在のノードに対応するデータセットに対する情報利得をそれぞれ取得するステップと、
取得された各情報利得の平均値を計算し、前記現在のノードに対応する特徴セットの各特徴から対応する情報利得が前記平均値より大きい特徴を選択するステップと、
選択された各特徴が前記現在のノードに対応するデータセットに対する情報利得比をそれぞれ取得するステップと、
情報利得比が最大の特徴を前記最適な特徴とするステップと、を含む、
請求項4に記載のイメージ検索方法。 - 前記ジニ係数により、前記最適な特徴に対応する各特徴値からM個の特徴値を選択するステップは、
前記最適な特徴に対応する各特徴値が前記現在のノードに対応するデータセットに対するジニ係数をそれぞれ取得するステップと、
取得された各ジニ係数を小さい順にソートし、ソート後の前のM位にあるジニ係数を選択するステップと、
選択されたM個のジニ係数に対応する特徴値を前記最適な特徴に対応する各特徴値から選択されたM個の特徴値とするステップと、を含む、
請求項4または5に記載のイメージ検索方法。 - イメージ検索装置であって、
前処理モジュールと検索モジュールを含み、
前記前処理モジュールは、検索待ちのイメージセットの中のイメージの特徴を取得し、前記特徴に基づいて決定木を生成し、前記決定木の中のノードに対応する問題をそれぞれ配置するために用いられ、
前記検索モジュールは、ユーザのイメージ検索要求を受信した場合、前記問題に基づいてユーザに質問し、前記ユーザの回答を組み合わせて、前記決定木から一つの最適パスを選択し、前記最適パス上のリーフノードに対応するイメージを検索されたイメージとするために用いられ、
前記前処理モジュールは、前記特徴に基づいて、所定の特徴選択基準に従って、前記決定木を生成し、
前記所定の特徴選択基準が情報利得及び情報利得比を含み、
前記前処理モジュールは、ルートノードを現在のノードとし、前記検索待ちのイメージセットを前記現在のノードに対応するデータセットとし、取得されたイメージの特徴で構成された特徴セットを前記現在のノードに対応する特徴セットとし、第2の処理を実行し、
前記第2の処理は、
前記情報利得及び前記情報利得比を組み合わせて、前記現在のノードに対応する特徴セットから一つの最適な特徴を選択し、前記最適な特徴に対応する異なる特徴値について、対応するノードをそれぞれ確立し、確立されたノードを前記現在のノードのサブノードとし、前記現在のノードの各サブノードについて、それぞれ前記現在のノードに対応するデータセットから前記サブノードにマッチングするデータを選択し、前記サブノードに対応するデータセットを構成し、前記マッチングするデータは、前記最適な特徴の特徴値が前記サブノードに対応する特徴値であるデータであり、前記最適な特徴を前記現在のノードに対応する特徴セットから削除し、更新後の特徴セットを取得し、前記現在のノードの各サブノードについて、前記サブノードがリーフノードであると決定された場合、前記サブノードに対する処理を終了し、前記サブノードがリーフノードではないと決定された場合、前記サブノードを前記現在のノードとし、前記更新後の特徴セットを前記現在のノードに対応する特徴セットとし、前記ルートノードから開始するすべてのパス上の最後一つのノードがいずれもリーフノードであるまで、前記第2の処理を繰り返して実行する、処理である、
イメージ検索装置。 - 前記検索モジュールは、前記決定木内のルートノードを現在のノードとし、第1の処理を実行し、
前記第1の処理は、
前記現在のノードに対応する問題に従って前記ユーザに質問し、前記ユーザの回答を取得し、前記現在のノードのサブノードから前記回答にマッチングするサブノードを決定し、前記マッチングするサブノードがリーフノードであると決定された場合、前記ルートノードの開始から前記リーフノードの終了までのパスを前記最適パスとし、前記マッチングするサブノードがリーフノードではないと決定された場合、前記マッチングするサブノードを前記現在のノードとし、前記第1の処理を繰り返し実行する、処理である、
請求項7に記載のイメージ検索装置。 - 前記所定の特徴選択基準は、ジニ係数をさらに含む、
請求項7または8に記載のイメージ検索装置。 - 前記所定の特徴選択基準が前記情報利得、前記情報利得比、及び前記ジニ係数を含む場合、前記前処理モジュールは、ルートノードを現在のノードとし、前記検索待ちのイメージセットを前記現在のノードに対応するデータセットとし、取得されたイメージの特徴で構成された特徴セットを前記現在のノードに対応する特徴セットとし、第3の処理を実行し、
前記第3の処理は、
前記情報利得及び前記情報利得比を組み合わせて、前記現在のノードに対応する特徴セットから一つの最適な特徴を選択し、前記ジニ係数により、前記最適な特徴に対応する各特徴値からM(Mは前記最適な特徴に対応する特徴値の数より小さい正の整数である)個の特徴値を選択し、選択されていない特徴値を他の特徴値とし、前記他の特徴値を一つの全体として、前記M個の特徴値及び前記他の特徴値に対応するノードをそれぞれ確立し、確立されたM+1個のノードを前記現在のノードのサブノードとし、前記現在のノードの各サブノードについて、それぞれ前記現在のノードに対応するデータセットから前記サブノードにマッチングするデータを選択し、前記サブノードに対応するデータセットを構成し、前記マッチングするデータは、前記最適な特徴の特徴値が前記サブノードに対応する特徴値であるデータであり、前記最適な特徴を前記現在のノードに対応する特徴セットから削除し、更新後の特徴セットを取得し、前記現在のノードの各サブノードについて、前記サブノードがリーフノードであると決定された場合、前記サブノードに対する処理を終了し、前記サブノードがリーフノードではないと決定された場合、前記サブノードを前記現在のノードとし、前記更新後の特徴セットを前記現在のノードに対応する特徴セットとし、前記ルートノードから開始するすべてのパス上の最後一つのノードがいずれもリーフノードであるまで、前記第3の処理を繰り返して実行する、
請求項9に記載のイメージ検索装置。 - 前記前処理モジュールは、前記現在のノードに対応する特徴セット内の各特徴が前記現在のノードに対応するデータセットに対する情報利得をそれぞれ取得し、取得された各情報利得の平均値を計算し、前記現在のノードに対応する特徴セットの各特徴から対応する情報利得が前記平均値より大きい特徴を選択し、選択された各特徴が前記現在のノードに対応するデータセットに対する情報利得比をそれぞれ取得し、情報利得比が最大の特徴を前記最適な特徴とする、
請求項10に記載のイメージ検索装置。 - 前記前処理モジュールは、前記最適な特徴に対応する各特徴値が前記現在のノードに対応するデータセットに対するジニ係数をそれぞれ取得し、取得された各ジニ係数を小さい順にソートし、ソート後の前のM位にあるジニ係数を選択し、選択されたM個のジニ係数に対応する特徴値を前記最適な特徴に対応する各特徴値から選択されたM個の特徴値とする、
請求項10または11に記載のイメージ検索装置。 - 電子機器であって、
少なくとも一つのプロセッサと、
前記少なくとも一つのプロセッサと通信接続されたメモリと、を含み、
前記メモリに前記少なくとも一つのプロセッサにより実行可能な命令が記憶されており、前記命令が前記少なくとも一つのプロセッサにより実行されると、前記少なくとも一つのプロセッサが請求項1から6のいずれか一項に記載のイメージ検索方法を実行する、
電子機器。 - コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体であって、
前記コンピュータ命令は、コンピュータに請求項1から6のいずれか一項に記載のイメージ検索方法を実行させる、
非一時的なコンピュータ読み取り可能な記憶媒体。 - プロセッサによって実行される時に請求項1から6のいずれか一項に記載のイメージ検索方法を実現する、
コンピュータプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110136576.0 | 2021-02-01 | ||
CN202110136576.0A CN112948608B (zh) | 2021-02-01 | 2021-02-01 | 图片查找方法、装置、电子设备及计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022117941A JP2022117941A (ja) | 2022-08-12 |
JP7347551B2 true JP7347551B2 (ja) | 2023-09-20 |
Family
ID=76240677
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022001841A Active JP7347551B2 (ja) | 2021-02-01 | 2022-01-07 | イメージ検索方法、装置、電子機器、及びコンピュータ読み取り可能な記憶媒体 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20220245465A1 (ja) |
JP (1) | JP7347551B2 (ja) |
KR (1) | KR20220111188A (ja) |
CN (1) | CN112948608B (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP4113379A1 (en) * | 2021-06-28 | 2023-01-04 | Siemens Aktiengesellschaft | Method and system for semi-automatic completion of an engineering project |
KR102567138B1 (ko) * | 2021-12-30 | 2023-08-17 | 가천대학교 산학협력단 | 머신러닝 기반 모발 건강 진단 방법 및 시스템 |
US20230281310A1 (en) * | 2022-03-01 | 2023-09-07 | Meta Plataforms, Inc. | Systems and methods of uncertainty-aware self-supervised-learning for malware and threat detection |
CN115757801B (zh) * | 2022-12-22 | 2023-11-03 | 北京壹永科技有限公司 | 用于医疗文本的基于决策树的模型训练方法和装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015230514A (ja) | 2014-06-03 | 2015-12-21 | Kddi株式会社 | 属性値が付与された情報要素を絞り込んで検索する対話検索プログラム、装置及び方法 |
JP2017055745A (ja) | 2015-09-18 | 2017-03-23 | Psソリューションズ株式会社 | 画像判定方法 |
JP2020060846A (ja) | 2018-10-05 | 2020-04-16 | 株式会社日立製作所 | 質問生成装置および質問生成方法 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100371934C (zh) * | 2005-05-30 | 2008-02-27 | 北大方正集团有限公司 | 一种用于基于内容的海量图片快速检索的索引构建方法 |
US9324034B2 (en) * | 2012-05-14 | 2016-04-26 | Qualcomm Incorporated | On-device real-time behavior analyzer |
CN106156127B (zh) * | 2015-04-08 | 2020-06-16 | 深圳市腾讯计算机***有限公司 | 选择数据内容向终端推送的方法及装置 |
JP6719082B2 (ja) * | 2016-07-04 | 2020-07-08 | パナソニックIpマネジメント株式会社 | 決定木生成装置、決定木生成方法、決定木生成プログラム及び質問システム |
CN108875955B (zh) * | 2017-05-10 | 2023-04-18 | 腾讯科技(深圳)有限公司 | 基于参数服务器的梯度提升决策树的实现方法及相关设备 |
US11954612B2 (en) * | 2017-09-05 | 2024-04-09 | International Business Machines Corporation | Cognitive moderator for cognitive instances |
CN107678531B (zh) * | 2017-09-30 | 2020-12-01 | Oppo广东移动通信有限公司 | 应用清理方法、装置、存储介质及电子设备 |
CN107741976B (zh) * | 2017-10-16 | 2021-07-09 | 泰康保险集团股份有限公司 | 智能应答方法、装置、介质和电子设备 |
CN108764321B (zh) * | 2018-05-21 | 2019-08-30 | Oppo广东移动通信有限公司 | 图像识别方法和装置、电子设备、存储介质 |
CN110046179B (zh) * | 2018-12-25 | 2023-09-08 | 创新先进技术有限公司 | 一种报警维度的挖掘方法、装置及设备 |
CN110532363B (zh) * | 2019-08-27 | 2022-07-29 | 华侨大学 | 一种基于决策树的任务导向型自动对话方法 |
CN111385188A (zh) * | 2019-11-22 | 2020-07-07 | 百度在线网络技术(北京)有限公司 | 对话元素的推荐方法、装置、电子设备和介质 |
CN111340121B (zh) * | 2020-02-28 | 2022-04-12 | 支付宝(杭州)信息技术有限公司 | 目标特征的确定方法及装置 |
CN112101419A (zh) * | 2020-08-17 | 2020-12-18 | 清华大学 | 基于众包的高效分类***及其创建、使用方法 |
-
2021
- 2021-02-01 CN CN202110136576.0A patent/CN112948608B/zh active Active
-
2022
- 2022-01-07 JP JP2022001841A patent/JP7347551B2/ja active Active
- 2022-01-12 KR KR1020220004812A patent/KR20220111188A/ko unknown
- 2022-01-19 US US17/578,663 patent/US20220245465A1/en active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015230514A (ja) | 2014-06-03 | 2015-12-21 | Kddi株式会社 | 属性値が付与された情報要素を絞り込んで検索する対話検索プログラム、装置及び方法 |
JP2017055745A (ja) | 2015-09-18 | 2017-03-23 | Psソリューションズ株式会社 | 画像判定方法 |
JP2020060846A (ja) | 2018-10-05 | 2020-04-16 | 株式会社日立製作所 | 質問生成装置および質問生成方法 |
Also Published As
Publication number | Publication date |
---|---|
KR20220111188A (ko) | 2022-08-09 |
JP2022117941A (ja) | 2022-08-12 |
US20220245465A1 (en) | 2022-08-04 |
CN112948608B (zh) | 2023-08-22 |
CN112948608A (zh) | 2021-06-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7347551B2 (ja) | イメージ検索方法、装置、電子機器、及びコンピュータ読み取り可能な記憶媒体 | |
CN110532571B (zh) | 文本处理方法及相关装置 | |
US9792304B1 (en) | Query by image | |
JP5282658B2 (ja) | 画像学習、自動注釈、検索方法及び装置 | |
CN114549874B (zh) | 多目标图文匹配模型的训练方法、图文检索方法及装置 | |
US10482146B2 (en) | Systems and methods for automatic customization of content filtering | |
US10437868B2 (en) | Providing images for search queries | |
JP2005535952A (ja) | 画像内容検索法 | |
US8243988B1 (en) | Clustering images using an image region graph | |
US20220058222A1 (en) | Method and apparatus of processing information, method and apparatus of recommending information, electronic device, and storage medium | |
CN106446162A (zh) | 一种面向领域的本体知识库文本检索方法 | |
JP7242994B2 (ja) | ビデオイベント識別方法、装置、電子デバイス及び記憶媒体 | |
CN111930894A (zh) | 长文本匹配方法及装置、存储介质、电子设备 | |
CN112507091A (zh) | 检索信息的方法、装置、设备以及存储介质 | |
CN112506864B (zh) | 文件检索的方法、装置、电子设备及可读存储介质 | |
CN113821657A (zh) | 基于人工智能的图像处理模型训练方法及图像处理方法 | |
CN111988668B (zh) | 一种视频推荐方法、装置、计算机设备及存储介质 | |
JP5470082B2 (ja) | 情報蓄積検索方法及び情報蓄積検索プログラム | |
CN110209895B (zh) | 向量检索方法、装置和设备 | |
JP4440246B2 (ja) | 空間インデックス方法 | |
CN114428834B (zh) | 检索方法、装置、电子设备及存储介质 | |
CN113590774B (zh) | 事件查询方法、装置以及存储介质 | |
CN115329850A (zh) | 信息比对方法、装置、电子设备及存储介质 | |
CN112199461B (zh) | 基于块索引结构的文档检索方法、装置、介质和设备 | |
CN114461837A (zh) | 一种图像处理方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220107 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230217 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230228 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230524 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230808 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230821 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7347551 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |