JP7347551B2

JP7347551B2 - イメージ検索方法、装置、電子機器、及びコンピュータ読み取り可能な記憶媒体

Info

Publication number: JP7347551B2
Application number: JP2022001841A
Authority: JP
Inventors: リ、ヨン; ツァオ、イチェン; リ、ルイ
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2021-02-01
Filing date: 2022-01-07
Publication date: 2023-09-20
Anticipated expiration: 2042-01-07
Also published as: KR20220111188A; JP2022117941A; US20220245465A1; CN112948608B; CN112948608A

Description

本開示は、人工知能技術分野に関し、特に、インテリジェントクラウド、コンピュータビジョン、及びディープラーニングなどの分野のイメージ検索方法、装置、電子機器、及びコンピュータ読み取り可能な記憶媒体に関する。

現在、ユーザのイメージ数は、爆発的な増加傾向を示している。検索は、クラウドアルバム製品の基礎機能として、ユーザにイメージ（写真など）検索能力を提供することができ、イメージ数が増える時、検索機能もますます重要になる。

従来の検索方式は、主にキーワードに基づいて検索する方式であり、すなわち、ユーザがキーワードを入力すると、クラウドはキーワードを条件に最も一致するグループの分類にマッピングし、当該分類下のイメージを出力する。しかし、このような方式は、ユーザが検索するイメージに対して明確な記憶を持ち、キーワードを使用して明確に表現できる場合にのみ適用される。多くの場合、ユーザが検索待ちのイメージに対して曖昧とした記憶しか持っていない可能性があり、例えば、ある大体の時間範囲とある人がある場所にあるイメージしか記憶されていない。このような場合について、現在、まだいい解決策がない。

本開示は、イメージ検索方法、装置、電子機器、及びコンピュータ読み取り可能な記憶媒体を提供する。

イメージ検索方法は、
検索待ちのイメージセットの中のイメージの特徴を取得し、前記特徴に基づいて決定木を生成し、前記決定木の中のノードに対応する問題をそれぞれ配置するステップと、
ユーザのイメージ検索要求を受信した場合、前記問題に基づいてユーザに質問し、前記ユーザの回答を組み合わせて、前記決定木から一つの最適パスを選択し、前記最適パス上のリーフノードに対応するイメージを検索されたイメージとするステップと、を含む。

イメージ検索装置は、前処理モジュール及び検索モジュールを含み、
前記前処理モジュールは、検索待ちのイメージセットの中のイメージの特徴を取得し、前記特徴に基づいて決定木を生成し、前記決定木の中のノードに対応する問題をそれぞれ配置するために用いられ、
前記検索モジュールは、ユーザのイメージ検索要求を受信した場合、前記問題に基づいてユーザに質問し、前記ユーザの回答を組み合わせて、前記決定木から一つの最適パスを選択し、前記最適パス上のリーフノードに対応するイメージを検索されたイメージとするために用いられる。

電子機器であって、
少なくとも一つのプロセッサと、
前記少なくとも一つのプロセッサと通信接続されたメモリと、を含み、
前記メモリに前記少なくとも一つのプロセッサにより実行可能な命令が記憶されており、前記命令が前記少なくとも一つのプロセッサにより実行されると、前記少なくとも一つのプロセッサが上記の方法を実行させる、

コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体であって、
前記コンピュータ命令は、コンピュータに上記の方法を実行させる。

コンピュータプログラム製品であって、コンピュータプログラムを含み、前記コンピュータプログラムがプロセッサによって実行される時に上記の方法を実現する。

上記の開示の一つの実施例は、以下のような利点又は有益効果を有し、決定木に基づくイメージ曖昧検索方式を使用し、取得されたイメージ特徴によって生成された決定木に基づいて、ユーザに主動的に質問して誘導し、ユーザの回答を組み合わせて、ユーザが検索するイメージを決定することで、キーワードを使わずにユーザが必要とするイメージを便利かつ正確に検索できることを実現することができる。
本明細書で説明された内容は、本開示の実施例のキー又は重要な特徴を特定することを意図しておらず、本開示の範囲を制限するためにも使用されないことを理解されたい。本開示の他の特徴は、以下の明細書を通じて容易に理解できる。

図面は、本開示をより良く理解するためのものであり、本開示を限定しない。
本開示に記載されるイメージ検索方法の実施例のフローチャートである。本開示に記載される決定木の概略構成図である。本開示に記載される決定木に基づくイメージ曖昧検索方式の実現プロセスの概略図である。本開示に記載される改良後の第２の決定木の生成アルゴリズムに従って生成された決定木の概略図である。本開示に記載されるイメージ検索装置の実施例５０の構成の概略構成図である。本開示の実施例を実施するために使用できる例示的な電子機器６００の概略ブロック図を示す。

以下、図面に基づいて、本開示の例示の実施例を表現する。理解を容易にするために、本開示の実施例の様々な詳細が含まれており、それらは単なる例示と見なされるべきである。従って、当業者は、本開示の範囲及び精神から逸脱することなく、本明細書に記載の実施形態に対して様々な変更及び修正を行うことができることを認識するはずである。類似として、簡明のために、以下の表現では、よく知られた機能と構造の表現は省略される。

また、本明細書の用語「及び／又は」は、関連対象の関連関係のみを説明するものであり、３種類の関係が存在可能であることを表し、例えば、Ａ及び／又はＢは、Ａのみが存在するか、Ａ及びＢが同時に存在するか、Ｂのみが存在するという３つの場合を表すことができる。符号「／」は、一般的に前後の関連対象が「又は」の関係であることを表すことを理解されたい。

図１は、本開示に記載されるイメージ検索方法の実施例のフローチャートである。図１に示すように、以下のような具体的な実現例を含む。

ステップ１０１では、検索待ちのイメージセットの中のイメージの特徴を取得し、取得された特徴に基づいて決定木を生成し、決定木の中のノードに対応する問題をそれぞれ配置する。

ステップ１０２では、ユーザのイメージ検索要求を受信した場合、前記問題に基づいてユーザに質問し、ユーザの回答を組み合わせて、決定木から一つの最適パスを選択し、最適パス上のリーフノードに対応するイメージを検索されたイメージとする。

見つけるとおり、上記の方法の実施例に記載される解決策では、決定木に基づくイメージ曖昧検索方式を使用し、取得されたイメージ特徴によって生成された決定木に基づいて、ユーザに主動的に質問して誘導し、ユーザの回答を組み合わせて、ユーザが検索するイメージを決定することで、キーワードを使わずにユーザが必要とするイメージを便利かつ正確に検索できることを実現することができる。

決定木（ＤｅｃｉｓｉｏｎＴｒｅｅ）は、分類決定木などとも呼ばれ、予測モデルであってもよく、どのように実例を分類するツリー構造を記述するために用いられ、ノードと有向エッジで構成される。その中、ノードは、二つの種類、すなわち内部ノードとリーフノードに分類でき、内部ノードは中間ノードなどとも呼ばれ、内部ノードは一つの特徴又は属性を表し、リーフノードは一つのカテゴリを表す。

図２は、本開示に記載される決定木の構造概略図である。図２に示すように、その中の矩形ノードはリーフノードを表し、楕円形ノードは内部ノードを表す。

本開示に記載される決定木に基づくイメージ曖昧検索方式では、まず、検索待ちのイメージセットの中のイメージの特徴を取得することができ、その後、取得された特徴に基づいて決定木を生成することができ、決定木の中のノードにそれぞれ対応する問題を配置することができる。

検索待ちのイメージセットは、あるユーザのイメージセットを指すことができる。本開示では、どのように検索待ちのイメージセットの中のイメージの特徴を取得するかについては、限定されない。例えば、イメージ特徴モデルを使用してイメージの特徴を抽出することができる。

取得されたイメージの特徴は、具体的には、どのような特徴を含むかについては、同様に限定されない。例えば、撮影時間、撮影場所、動物、人物などを含むことができる。

また、決定木の中のノードに配置する問題は、通常、ユーザが簡単に理解するセマンティクスを表現する問題である。

ユーザのイメージ検索要求を受信した場合、配置された問題に基づいてユーザに質問し、ユーザの回答を組み合わせて、決定木から一つの最適パスを選択することができ、最適パス上のリーフノードに対応するイメージを検索されたイメージ、すなわちターゲットイメージとすることができる。

具体的には、決定木から最適パスを選択する時、決定木内のルートノードを現在のノードとし、以下の第１の処理を実行することができ、現在のノードに対応する問題に従ってユーザに質問し、ユーザの回答を取得し、現在のノードのサブノードから当該回答にマッチングするサブノードを決定し、マッチングするサブノードがリーフノードであると決定された場合、ルートノードから当該リーフノードまでのパスを必要な最適パスとし、それでない場合、マッチングするサブノードを現在のノードとし、第１の処理を繰り返し実行する。

上記の説明に基づいて、図３は、本開示に記載される決定木に基づくイメージ曖昧検索方式の実現プロセスの概略図である。

図３に示すように、決定木を生成し、決定木の中のノードに対応する問題を配置した後、まず、ルートノードに対応する問題に基づいてユーザに質問することができ、「写真にあの人がいますか？」であり、ユーザの回答が「はい」であると仮定すると、図３に示すような「はい」にマッチングするノードを決定することができ、当該ノードはルートノードのサブノードであり、表現を簡単にするために、当該ノードをノード１と呼ぶ。

その後、ノード１に対応する問題に基づいてユーザに質問することができ、「写真はどの季節に撮影されましたか？」であり、ユーザの回答が「秋」であると仮定すると、図３に示すような「秋」にマッチングするノードを決定することができ、当該ノードはノード１のサブノードであり、表現を簡単にするために、当該ノードをノード２と呼ぶ。

その後、ノード２に対応する問題に基づいてユーザに質問することができ、「写真はどの場所で撮影されましたか？」、ユーザの回答が「北京」であると仮定すると、図３に示すような「北京」にマッチングするノードを決定することができ、当該ノードはノード２のサブノードであり、表現を簡単にするために、当該ノードをノード３と呼ぶ。

その後、ノード３に対応する問題に基づいてユーザに質問することができ、「写真は室内で撮影しましたか？」であり、……、その後、ノードｐ（ｐは３より大きい）に対応する問題に基づいてユーザに質問することができ、「写真に建物がありますか？」であり、ユーザの回答が「はい」であると仮定すると、図３に示すような「はい」にマッチングするノードを決定することができ、ノードがｐ＋１であると仮定すると、ノードｐ＋１はリーフノードであるため、ルートノードからノードｐ＋１までのパスを必要な最適パスとすることができる。

さらに、「国慶節にＴＡが北京天安門での写真である」のような、最適パス上のリーフノードに対応するイメージを検索されたイメージとすることができる。

検索されたイメージの数は、１つ以上であってもよく、１より大きい時、数が所定の閾値より大きい場合、その中から一部のイメージを選択することもでき、選択された一部のイメージを最終結果としてユーザに返し、どのように選択するかは限定しない。

クラウドアルバムを例として、時間の経過とともに、ユーザがクラウドアルバム内のイメージの記憶ますます曖昧になり、この場合、キーワードを使用してイメージの検索を行うことができなくなり、本開示に記載される決定木に基づくイメージ曖昧検索方式は、ユーザが必要なイメージを便利かつ正確に検索するのに役立つことができる。

さらに、本開示に記載される決定木に基づくイメージ曖昧検索方式の検索速度がよく速く、結果セットに迅速に収束することができ、検索効率を向上させることができる。

また、本開示に記載される決定木に基づくイメージ曖昧検索方式は、イメージ特徴をより全面的に使用して決定を行うことができ、毎回の決定は、すべてユーザが無関係のイメージを排除するのをより正確に支援することができ、結果を検索できない状況が発生しなく、検索成功率などを向上させる。

決定木を分類する時、実例の各特徴をテストし、結果に基づいてそれをサブノードに分配し、できるだけ速く決定木を使用して分類するためには、内部ノードの構造と順序などは非常に重要である。

具体的には、本開示では、どのように決定木を生成するかは、検索速度などに直接的な影響を与える。実際のアプリケーションでは、取得されたイメージの特徴に基づいて、所定の特徴選択基準に従って、決定木を生成することができる。

特徴選択基準を制定する目的は、特徴を使用してデータセットを分割し、分割後のデータセットの純度は、分割前のデータセットの純度より高く、不確実性は、分割前のデータセットの不確実性より低く、決定木の生成プロセスは、特徴選択基準を満たす特徴を使用してデータセットを純度がより高く、不確実性がより小さくデータセットに継続的に分割するプロセスである。

現在、より一般的に使用されている特徴選択基準は、情報利得、情報利得比及びジニ指数を含み、以下でそれぞれ説明する。

一）情報利得
情報論では、エントロピーは、ランダム変数の不確実性を表すために用いられ、情報利得はエントロピー情報論に基づいて確定される。

任意の特徴Ａは、データセットＤに対する情報利得ｇ（Ｄ、Ａ）に対して、データセットＤの経験エントロピーＨ（Ｄ）と所与の特徴Ａの条件の下でデータセットＤの経験条件エントロピーＨ（Ｄ｜Ａ）との差として定義することができ、数式で以下のように表すことができる。
［数１］
ｇ（Ｄ,Ａ）＝Ｈ（Ｄ）－Ｈ（Ｄ｜Ａ）
上記の式は、データセットＤの初期エントロピーから特徴Ａを知った後のデータセットＤのエントロピーを減算し、一つの不確実なものについては、関連する情報をもう少し知っている限り、エントロピーは、通常、減少するため、Ｈ（Ｄ）は、通常、Ｈ（Ｄ｜Ａ）より大きく、Ｈ（Ｄ）とＨ（Ｄ｜Ａ）の差は、情報利得の程度を定量化することを理解することができる。

決定木を生成するプロセスは、情報利得を使用して特徴選択基準として、決定木を再帰的に構築するプロセスに変換することができ、当該プロセスは、すなわち、反復二分木三代（ＩＤ３、ＩｔｅｒａｔｉｖｅＤｉｃｈｏｔｏｍｉｓｅｒ３）アルゴリズムの実現プロセスに対応する。

ＩＤ３アルゴリズムの実現プロセスは、具体的には、以下のステップを含むことができる。
ルートノードを現在のノードとし、元のデータセットを現在のノードに対応するデータセットとし、元の特徴セットを現在のノードに対応する特徴セットとし、以下の第４の処理を実行し、
現在のノードに対応する特徴セット内の各特徴が現在のノードに対応するデータセットに対する情報利得をそれぞれ取得し、現在のノードに対応する特徴セットにそれぞれ特徴１、特徴２、及び特徴３である３つの特徴が含まれると仮定すると、３つの情報利得を取得することができ、
情報利得が最大の特徴を選択し、特徴２であると仮定すると、さらに、特徴２に対応する異なる特徴値に対応するノードをそれぞれ確立し、確立されたノードを現在のノードのサブノードとすることができ、例えば、特徴２は撮影場所であり、対応する特徴値は、北京、上海、広州などを含み、各特徴値に対応するサブノードをそれぞれ確立することができ、
現在のノードの各サブノードについて、それぞれ現在のノードに対応するデータセットから当該サブノードにマッチングするデータを選択し、当該サブノードに対応するデータセットを構成し、マッチングするデータは、選択された特徴の特徴値が当該サブノードに対応する特徴値のデータであり、例えば、あるサブノードに対応する特徴値が北京であり、現在のノードに対応するデータセットから撮影場所が北京であるデータを選択し、当該サブノードに対応するデータセットを構成することができ、
選択された特徴を特徴２のように現在のノードに対応する特徴セットから削除し、更新後の特徴セットを取得し、
現在のノードの各サブノードについて、当該サブノードがリーフノードであると決定された場合、当該サブノードに対する処理を終了し、それでない場合、当該サブノードを現在のノードとし、更新後の特徴セットを現在のノードに対応する特徴セットとし、ルートノードから開始するすべてのパス上の最後一つのノードがいずれもリーフノードであるまで、第４の処理を繰り返して実行する。

実際のアプリケーションでは、あるサブノードに対応するデータセットには一つのカテゴリ、すなわち単一のカテゴリだけを含み、継続に分割することができない場合、当該サブノードがリーフノードであると決定されることができる。

二）情報利得比
ＩＤ３アルゴリズムは、オーバーフィッティングしやすくなり、情報利得が特徴値の多い特徴に偏っているという大きい欠点がある。原因は、ある特徴に対応する特徴値が比較的に多い場合、当該特徴に基づいて分割すると純度がより高いサブセットをより容易に取得することができ、したがって、分割後のエントロピーはより低くなり、分割前のエントロピーは一定であるため、取得された情報利得はより大きくなる。

上記の問題について、情報利得比の概念を提供し、情報利得に対する特徴値の数の影響を弱めることができる。

任意の特徴ＡがデータセットＤに対する情報利得比ｇＲ（Ｄ、Ａ）であり、情報利得ｇ（Ｄ、Ａ）とデータセットＤの特徴Ａに対するエントロピーＨ_Ａ（Ｄ）の比として定義することができ、すなわち：
［数２］

その中：
［数３］

Nは、特徴Ａに対応する特徴値の数を表し、Diは、データセットＤの中の特徴Ａの値が特徴値ｉのデータで構成されるデータセットを表し、｜D｜は、データセットＤに含まれるデータの数を表し、｜D_i｜は、データセットDiに含まれるデータの数を表す。

上記の式は、一つの特徴に対応する特徴値が多くほど、不確実性が高くなり、Ｈ_Ａ（Ｄ）が大きくなることを示す。

情報利得比と情報利得の関係は、以下のように表すことができ、
［数４］
情報利得比 = 情報利得 × ペナルティパラメータ
その中、ペナルティパラメータは、すなわち１／Ｈ_Ａ（Ｄ）であるため、情報利得に対する特徴値の数の影響を一定の手順で相殺する。

情報利得比は、Ｃ４．５アルゴリズムに対応し、Ｃ４．５アルゴリズムの実現プロセスは、ＩＤ３アルゴリズムと類似しており、ＩＤ３アルゴリズム内の情報利得を情報利得比に置き換えるだけである。

三）ジニ係数（Ｇｉｎｉｃｏｅｆｆｉｃｉｅｎｔ）
ＩＤ３アルゴリズムでは情報利得を使用して特徴を選択し、情報利得が大きい特徴を優先的に選択し、Ｃ４．５アルゴリズムには情報利得比を使用して特徴を選択し、特徴値の数が多いことによる情報利得が大きいという問題を低減する。分類及び回帰ツリー（ＣＡＲＴ、ＣｌａｓｓｉｆｉｃａｔｉｏｎａｎｄＲｅｇｒｅｓｓｉｏｎＴｒｅｅ）アルゴリズムは、ジニ係数を使用して特徴を選択し、ジニ係数は、不純度を表し、ジニ係数が小さいほど、不純度が低く、特徴がよく、これは情報利得（比）と反対である。

データセットＤの純度は、ジニ係数で測定することができ、すなわちデータセットＤのジニ係数は、以下のように定義することができ、
［数５］

その中、ｐ(x_i)は、データxがカテゴリｉに属する確率を表し、nはカテゴリの数を表し、すなわちデータセットＤにはn個のカテゴリが含まれ、Ｇｉｎｉ（Ｄ）は、データセットＤからランダムに選択された一つのデータが誤って分類される確率を反映し、すなわちサンプルセット内で一つのランダムに選択されたサンプルが誤って分類される確率を表し、ジニ係数が小さいほど、サンプルセット内で選択されたサンプルが誤って分類される確率が小さくなることを表し、つまり、サンプルセットの純度が高いほど、逆に、純度が低くなる。

データセットＤについて、特徴Ａがある特徴値ａを取るかどうかに応じて、データセットＤをＤ１とＤ２の二つのデータセット（又はデータサブセットと呼ぶ）に分割することができる。

これに応じて、特徴Ａに対応する特徴値ａがデータセットＤに対するジニ係数は、以下のように定義することができ、
［数６］

その中、｜D｜は、データセットＤに含まれるデータの数、すなわちサンプルの数を表し、｜D_１｜は、データセットＤ１に含まれるデータの数を表し、｜D_２｜は、データセットＤ２に含まれるデータの数を表す。

ＩＤ３アルゴリズム及びＣ４．５アルゴリズムと比較すると、ＣＡＲＴアルゴリズムの一つの利点は、離散特徴値を処理することができるし、連続特徴値を処理することもできる。例えば、イメージの撮影時間は、一つの連続特徴値であり、季節ごとに分割してジニ係数などを計算することができる。

ＣＡＲＴアルゴリズムの実現プロセスは、具体的には、以下のステップを含むことができる。
ルートノードを現在のノードとし、元のデータセットを現在のノードに対応するデータセットとし、元の特徴セットを現在のノードに対応する特徴セットとし、以下の第５の処理を実行し：
現在のノードに対応する特徴セット内の各特徴について、当該特徴に対応する各特徴値が現在のノードに対応するデータセットに対するジニ係数をそれぞれ取得し、
取得された各ジニ係数から値が最も小さいジニ係数を選択し、選択されたジニ係数に対応する特徴（特徴Ａと仮定する）及び対応する特徴の特徴値（特徴値ａと仮定する）を最適な特徴と最適なセグメンテーションポイントとし、
最適な特徴と最適なセグメンテーションポイントに基づいて、現在のノードに対応するデータセットをD１とD２の二つのデータセットに分割し、現在のノードの二つのサブノードを生成し、一つのサブノードはデータセットＤ１に対応し、別のサブノードはデータセットＤ２に対応し、データセットＤ１内のデータの特徴Ａ値は特徴値aであり、データセットＤ２内のデータの特徴Ａ値は特徴値aではなく、
現在のノードの各サブノードについて、所定の条件に適合すると決定された場合、当該サブノードに対する処理を終了することができ、例えば、当該サブノードに対応するデータセットに含まれるデータの数が所定の閾値より小さい場合、例えば、前記閾値が２であり、又は、当該サブノードに対応するデータセットのジニ係数が所定の閾値より小さい場合など、所定の条件に適合すると見なすことができ、所定の条件に適合していないと決定された場合、当該サブノードを現在のノードとし、第５の処理などを繰り返して実行することができる。

前述のように、本開示では、取得されたイメージの特徴に基づいて、所定の特徴選択基準に従って、決定木を生成することができる。

所定の特徴選択基準は、情報利得、情報利得比、ジニ係数のいずれかを含むことができる。又は、所定の特徴選択基準は、情報利得及び情報利得比を含むことができる。又は、所定の特徴選択基準は、情報利得、情報利得比、及びジニ係数を含むことができる。

所定の特徴選択基準が情報利得である場合、ＩＤ３アルゴリズムに従って決定木を生成することができる。所定の特徴選択基準が情報利得比である場合、Ｃ４．５アルゴリズムに従って決定木を生成することができる。所定の特徴選択基準がジニ係数である場合、ＣＡＲＴアルゴリズムに従って決定木を生成することができる。所定の特徴選択基準が情報利得及び情報利得比である場合、改良後の第１の決定木生成アルゴリズムに従って決定木を生成することができる。所定の特徴選択基準が情報利得、情報利得比、及びジニ係数を含む場合、改良後の第２の決定木生成アルゴリズムに従って決定木を生成することができる。具体的にどのアルゴリズムを使用して決定木を生成するかは、実際のニーズに基づいて決定することができ、非常に柔軟で便利である。

その中、改良後の第１の決定木生成アルゴリズムの具体的な実現プロセスは、以下のステップを含むことができる。
ルートノードを現在のノードとし、元のデータセットを現在のノードに対応するデータセットとし、元の特徴セットを現在のノードに対応する特徴セットとし、元のデータセットは検索待ちのイメージセットであってもよく、元の特徴セットは取得されたイメージの特徴で構成された特徴セットであってもよく、以下の第２の処理を実行し、
情報利得及び情報利得比を組み合わせて、現在のノードに対応する特徴セットから一つの最適な特徴を選択し、最適な特徴に対応する異なる特徴値について、対応するノードをそれぞれ確立し、確立されたノードを現在のノードのサブノードとし、
現在のノードの各サブノードについて、それぞれ現在のノードに対応するデータセットから当該サブノードにマッチングするデータを選択し、当該サブノードに対応するデータセットを構成し、マッチングするデータは、最適な特徴の特徴値が当該サブノードに対応する特徴値であるデータであり、
最適な特徴を現在のノードに対応する特徴セットから削除し、更新後の特徴セットを取得し、
現在のノードの各サブノードについて、当該サブノードがリーフノードであると決定された場合、当該サブノードに対する処理を終了し、それでない場合、当該サブノードを現在のノードとし、更新後の特徴セットを現在のノードに対応する特徴セットとし、ルートノードから開始するすべてのパス上の最後一つのノードがいずれもリーフノードであるまで、第２の処理を繰り返して実行する。

その中、情報利得及び情報利得比を組み合わせて、現在のノードに対応する特徴セットから一つの最適な特徴を選択する方式は、現在のノードに対応する特徴セット内の各特徴が現在のノードに対応するデータセットに対する情報利得をそれぞれ取得するステップと、取得された各情報利得の平均値を計算し、現在のノードに対応する特徴セットの各特徴から対応する情報利得が平均値より大きい特徴を選択するステップと、選択された各特徴が現在のノードに対応するデータセットに対する情報利得比をそれぞれ取得するステップと、情報利得比が最大の特徴を最適な特徴とするステップと、を含むことができる。

Ｃ４．５アルゴリズムの欠点は、情報利得比が特徴値の少ない特徴に偏っていることであり、原因は、特徴値が少ない場合、Ｈ_Ａ（Ｄ）の値は小さくなり、それに応じて、その逆数が大きくなるため、情報利得比も大きくなり、改良後の第１の決定木生成アルゴリズムは、ある程度でこの問題を解決することができ、当該アルゴリズムでは、情報利得又は情報利得比の最大の特徴を直接に選択しなく、まず、ＩＤ３アルゴリズムを使用して平均値以上の特徴を取得し、その後、その中から情報利得比が最大の特徴などを選択することによって、ＩＤ３アルゴリズムとＣ４．５アルゴリズムの利点を同時に考慮する。

改良後の第２の決定木生成アルゴリズムの具体的な実現プロセスは、以下のようなステップを含むことができる。
ルートノードを現在のノードとし、元のデータセットを現在のノードに対応するデータセットとし、元の特徴セットを現在のノードに対応する特徴セットとし、元のデータセットは検索待ちのイメージセットであってもよく、元の特徴セットは取得されたイメージの特徴で構成された特徴セットであってもよく、以下の第３の処理を実行することができ、
情報利得及び情報利得比を組み合わせて、現在のノードに対応する特徴セットから一つの最適な特徴を選択し、ジニ係数により、最適な特徴に対応する各特徴値からＭ個の特徴値を選択し、Ｍは正の整数であり、最適な特徴に対応する特徴値の数より小さく、選択されていない特徴値を他の特徴値とし、他の特徴値を一つの全体とし、Ｍ個の特徴値及び他の特徴値に対応するノードをそれぞれ確立し、確立されたＭ＋１個のノードを現在のノードのサブノードとし、
現在のノードの各サブノードについて、それぞれ現在のノードに対応するデータセットから当該サブノードにマッチングするデータを選択し、当該サブノードに対応するデータセットを構成し、マッチングするデータは、最適な特徴の特徴値が当該サブノードに対応する特徴値であるデータであり、
最適な特徴を現在のノードに対応する特徴セットから削除し、更新後の特徴セットを取得し、
現在のノードの各サブノードについて、当該サブノードがリーフノードであると決定された場合、当該サブノードに対する処理を終了し、それでない場合、当該サブノードを現在のノードとし、更新後の特徴セットを現在のノードに対応する特徴セットとし、ルートノードから開始するすべてのパス上の最後一つのノードがいずれもリーフノードであるまで、第３の処理を繰り返して実行する。

その中、情報利得及び情報利得比を組み合わせて、現在のノードに対応する特徴セットから一つの最適な特徴を選択する方式は、現在のノードに対応する特徴セット内の各特徴が現在のノードに対応するデータセットに対する情報利得をそれぞれ取得するステップと、取得された各情報利得の平均値を計算し、現在のノードに対応する特徴セットの各特徴から対応する情報利得が平均値より大きい特徴を選択するステップと、選択された各特徴が現在のノードに対応するデータセットに対する情報利得比をそれぞれ取得するステップと、情報利得比が最大の特徴を前記最適な特徴とするステップと、を含むことができる。

ジニ係数により、最適な特徴に対応する各特徴値からＭ個の特徴値を選択する方式は、最適な特徴に対応する各特徴値が現在のノードに対応するデータセットに対するジニ係数をそれぞれ取得するステップと、取得された各ジニ係数を小さい順にソートし、ソート後の前のＭ位にあるジニ係数を選択し、選択されたＭ個のジニ係数に対応する特徴値を最適な特徴に対応する各特徴値から選択されたＭ個の特徴値とするステップと、を含むことができる。Ｍの具体的な値は、実際のニーズに基づいて決定することができる。

図４は、本開示に記載される改良後の第２の決定木の生成アルゴリズムに従って生成された決定木の概略図である。なお、表現を簡単にするために、図４では決定木の構造を簡略化し、実際の構造は、通常、図４に示されるものより複雑である。

図４に示すように、ルートノードから開始して、ルートノードを現在のノードとし、検索待ちのイメージセットを現在のノードに対応するデータセットとし、取得されたイメージの特徴で構成された特徴セットを現在のノードに対応する特徴セットとし、まず、現在のノードに対応する特徴セット内の各特徴が現在のノードに対応するデータセットに対する情報利得をそれぞれ取得し、取得された各情報利得の平均値を計算し、現在のノードに対応する特徴セットの各特徴から対応する情報利得が平均値より大きい特徴を選択し、選択された各特徴が現在のノードに対応するデータセットに対する情報利得比をそれぞれ取得し、情報利得比が最大の特徴を最適な特徴とすることができる。

例えば、現在のノードに対応する特徴セットに３つの特徴が含まれ、それぞれ特徴１、特徴２、及び特徴３であり、それに応じて、３つの情報利得を取得することができ、３つの情報利得の平均値を計算し、３つの特徴から対応する情報利得が平均値より大きい特徴を選択することができ、特徴１と特徴２を選択すると仮定すると、さらに、特徴１及び特徴２に対応する情報利得比をそれぞれ取得し、情報利得比が最大である特徴、例えば特徴１を最適な特徴とすることができる。

その後、最適な特徴に対応する各特徴値が現在のノードに対応するデータセットに対するジニ係数をそれぞれ取得することができ、取得された各ジニ係数を小さい順にソートし、ソート後の前のＭ位にあるジニ係数を選択し、選択されたＭ個のジニ係数に対応する特徴値を最適な特徴に対応する各特徴値から選択されたＭ個の特徴値とすることができ、選択されていない特徴値を他の特徴値とすることができる。さらに、他の特徴値を一つの全体とし、Ｍ個の特徴値及び他の特徴値に対応するノードをそれぞれ確立し、確立されたＭ＋１個のノードを現在のノードのサブノードとし、現在のノードの各サブノードについて、それぞれ現在のノードに対応するデータセットから当該サブノードにマッチングするデータを選択し、当該サブノードに対応するデータセットを構成することができ、マッチングするデータは、最適な特徴の特徴値が当該サブノードに対応する特徴値であるデータである。

例えば、最適な特徴は特徴１であり、特徴１は、それぞれ特徴値１、特徴値２、特徴値３、及び特徴値４である４つの特徴値に対応すると、特徴値１、特徴値２、特徴値３、及び特徴値４に対応するジニ係数をそれぞれ取得することができ、取得された４つのジニ係数を小さい順にソートすることができ、ソート後の前の２位にあるジニ係数を選択し、選択された２つのジニ係数に対応する特徴値がそれぞれ特徴値１及び特徴値２であると仮定すると、特徴値３及び特徴値４を他の特徴値とすることができ、特徴値１、特徴値２、及び他の特徴値について、対応するノードをそれぞれ確立し、確立された３つのノードを現在のノードに対応するサブノードとし、また、各サブノードについて、さらに、それぞれ現在のノードに対応するデータセットから当該サブノードにマッチングするデータを選択し、当該サブノードに対応するデータセットを構成することができ、例えば、特徴値１に対応するサブノードについて、現在のノードに対応するデータセットから特徴１の値が特徴値１であるデータを選択し、当該サブノードに対応するデータセットを構成することができる。

その後、最適な特徴を現在のノードに対応する特徴セットから削除し、更新後の特徴セットを取得することができる。例えば、特徴１を特徴１、特徴２、及び特徴３で構成される特徴セットから削除することによって、特徴２及び特徴３で構成される更新後の特徴セットを取得することができる。

現在のノードの各サブノードについて、当該サブノードがリーフノードであると決定された場合、当該サブノードに対する処理を終了することができ、それでない場合、当該サブノードを現在のノードとし、更新後の特徴セットを現在のノードに対応する特徴セットとし、ルートノードから開始するすべてのパス上の最後一つのノードがいずれもリーフノードであるまで、上記の処理を繰り返して実行することができる。

例えば、それぞれ特徴値１に対応するサブノード、特徴値２に対応するサブノード、及び他の特徴値に対応するサブノードである合計３つのサブノードが存在すると仮定すると、その中、特徴値１に対応するサブノードがリーフノードであり、図４に示すような矩形ノードであり、当該サブノードに対する処理を終了することができ、特徴値２に対応するサブノード及び他の特徴値に対応するサブノードについて、それぞれそれを現在のノードとし、更新後の特徴セットを現在のノードに対応する特徴セットとし、上記の処理を繰り返して実行し、処理を経た後、２つのサブノードをそれぞれ取得し、いずれもリーフノードであると仮定すると、決定木の確立を完了することができる。

見つけるとおり、上記のアルゴリズムでは、情報利得と情報利得比を組み合わせて、まず、ＩＤ３アルゴリズムを使用して平均値以上の特徴を取得し、次に、また、その中から情報利得比が最大の特徴などを選択することによって、ＩＤ３アルゴリズムとＣ４．５アルゴリズムの利点を同時に考慮し、また、決定された最適な特徴について、さらに、ジニ係数を使用して値が低いいくつかの特徴値を選択し、残りの特徴値を他の特徴値とすることによって、特徴値が多すぎることによる問題オプションが多すぎるなどの問題を低減することができる。

以上は、方法の実施例について説明したが、以下は、装置の実施例によって、本開示に記載される解決策をさらに説明する。

図５は、本開示に記載されるイメージ検索装置の実施例５０の構成の構造概略図である。図５に示すように、前処理モジュール５０１と検索モジュール５０２を含む。

前処理モジュール５０１は、検索待ちのイメージセットの中のイメージの特徴を取得し、取得された特徴に基づいて決定木を生成し、決定木の中のノードに対応する問題をそれぞれ配置するために用いられる。

検索モジュール５０２は、ユーザのイメージ検索要求を受信した場合、配置された問題に基づいてユーザに質問し、ユーザの回答を組み合わせて、決定木から一つの最適パスを選択し、最適パス上のリーフノードに対応するイメージを検索されたイメージとするために用いられる。

具体的には、検索モジュール５０２は、決定木内のルートノードを現在のノードとし、以下の第１の処理を実行することができ、現在のノードに対応する問題に従ってユーザに質問するステップと、ユーザの回答を取得し、現在のノードのサブノードから当該回答にマッチングするサブノードを決定し、マッチングするサブノードがリーフノードであると決定された場合、ルートノードの開始からリーフノードの終了までのパスを最適パスとし、それでない場合、マッチングするサブノードを現在のノードとし、第１の処理を繰り返し実行する。

また、前処理モジュール５０１は、取得された特徴に基づいて、所定の特徴選択基準に従って、決定木を生成することができる。所定の特徴選択基準は、情報利得を含み、又は、所定の特徴選択基準は、情報利得比を含み、又は、所定の特徴選択基準は、ジニ係数を含み、又は、所定の特徴選択基準は、情報利得を含み、及び情報利得比；又は、所定の特徴選択基準は、情報利得、情報利得比、及びジニ係数を含む。

その中、所定の特徴選択基準が情報利得及び情報利得比を含む場合、前処理モジュール５０１は、ルートノードを現在のノードとし、検索待ちのイメージセットを現在のノードに対応するデータセットとし、取得されたイメージの特徴で構成された特徴セットを現在のノードに対応する特徴セットとし、以下の第２の処理を実行し、情報利得及び情報利得比を組み合わせて、現在のノードに対応する特徴セットから一つの最適な特徴を選択し、最適な特徴に対応する異なる特徴値について、対応するノードをそれぞれ確立し、確立されたノードを現在のノードのサブノードとし、現在のノードの各サブノードについて、それぞれ現在のノードに対応するデータセットから当該サブノードにマッチングするデータを選択し、当該サブノードに対応するデータセットを構成し、マッチングするデータは、最適な特徴の特徴値が当該サブノードに対応する特徴値であるデータであり、最適な特徴を現在のノードに対応する特徴セットから削除し、更新後の特徴セットを取得し、現在のノードの各サブノードについて、当該サブノードがリーフノードであると決定された場合、当該サブノードに対する処理を終了し、それでない場合、当該サブノードを現在のノードとし、更新後の特徴セットを現在のノードに対応する特徴セットとし、ルートノードから開始するすべてのパス上の最後一つのノードがいずれもリーフノードであるまで、第２の処理を繰り返して実行することができる。

所定の特徴選択基準が情報利得、情報利得比、及びジニ係数を含む場合、前処理モジュール５０１は、ルートノードを現在のノードとし、検索待ちのイメージセットを現在のノードに対応するデータセットとし、取得されたイメージの特徴で構成された特徴セットを現在のノードに対応する特徴セットとし、以下の第３の処理を実行し、情報利得及び情報利得比を組み合わせて、現在のノードに対応する特徴セットから一つの最適な特徴を選択し、ジニ係数により、最適な特徴に対応する各特徴値からＭ個の特徴値を選択し、Ｍは正の整数であり、最適な特徴に対応する特徴値の数より小さく、選択されていない特徴値を他の特徴値とし、他の特徴値を一つの全体とし、Ｍ個の特徴値及び他の特徴値に対応するノードをそれぞれ確立し、確立されたＭ＋１個のノードを現在のノードのサブノードとし、現在のノードの各サブノードについて、それぞれ現在のノードに対応するデータセットから当該サブノードにマッチングするデータを選択し、当該サブノードに対応するデータセットを構成し、マッチングするデータは、最適な特徴の特徴値が当該サブノードに対応する特徴値であるデータであり、最適な特徴を現在のノードに対応する特徴セットから削除し、更新後の特徴セットを取得し、現在のノードの各サブノードについて、当該サブノードがリーフノードであると決定された場合、当該サブノードに対する処理を終了し、それでない場合、当該サブノードを現在のノードとし、更新後の特徴セットを現在のノードに対応する特徴セットとし、ルートノードから開始するすべてのパス上の最後一つのノードがいずれもリーフノードであるまで、第３の処理を繰り返して実行することができる。

情報利得及び情報利得比を組み合わせて、現在のノードに対応する特徴セットから一つの最適な特徴を選択する時、前処理モジュール５０１は、現在のノードに対応する特徴セット内の各特徴が現在のノードに対応するデータセットに対する情報利得をそれぞれ取得し、取得された各情報利得の平均値を計算し、現在のノードに対応する特徴セットの各特徴から対応する情報利得が平均値より大きい特徴を選択し、選択された各特徴が現在のノードに対応するデータセットに対する情報利得比をそれぞれ取得し、情報利得比が最大の特徴を最適な特徴とすることができる。

ジニ係数により、最適な特徴に対応する各特徴値からＭ個の特徴値を選択する時、前処理モジュール５０１は、最適な特徴に対応する各特徴値が現在のノードに対応するデータセットに対するジニ係数をそれぞれ取得することができ、取得された各ジニ係数を小さい順にソートし、ソート後の前のＭ位にあるジニ係数を選択し、選択されたＭ個のジニ係数に対応する特徴値を最適な特徴に対応する各特徴値から選択されたＭ個の特徴値とすることができる。

図５に示す装置の実施例の具体的な作業プロセスは、前述の方法の実施例の関連説明を参照し、ここでは説明を省略する。

つまり、上記の装置の実施例に記載される解決策を使用して、決定木に基づくイメージ曖昧検索方式を使用し、取得されたイメージ特徴によって生成された決定木に基づいて、ユーザに主動的に質問して誘導し、ユーザの回答を組み合わせて、ユーザが検索するイメージを決定することで、キーワードを使わずにユーザが必要とするイメージを便利かつ正確に検索できることを実現することができ、改良後の決定木生成アルゴリズムを提供し、検索効率などを向上させることができる。

本開示に記載される解決策は人工知能の分野に適用することができ、特に、インテリジェントクラウド、コンピュータビジョン及びディープラーニングなどの分野に関する。

人工知能は、人間のある思考プロセスと知能行為（たとえば、学習、推理、思考、計画など）をコンピュータでシミュレートすることを研究する学科であり、ハードウェアレベルの技術もソフトウェアレベルの技術もあり、人工知能ハードウェア技術は、一般的に、たとえば、センサー、専用の人工知能チップ、クラウドコンピューティング、分散ストレージ、ビッグデータ処理などの技術を含み、人工知能ソフトウェア技術は、主に、コンピュータビジョン技術、音声認識技術、自然言語処理技術及び機械学習／ディープラーニング、ビッグデータ処理技術、知識グラフ技術などのいくつかの方向を含む。

本開示の実施例によれば、本開示は、電子機器、読み取り可能な記憶媒体、及びコンピュータプログラム製品をさらに提供する。

図６に示すように、本開示の実施例の例を実現するための電子機器６００のブロック図である。電子機器は、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、サーバ、ブレードサーバ、大型コンピュータ、及び他の適切なコンピュータなどの様々な形式のデジタルコンピュータを表すことを目的とする。電子機器は、パーソナルデジタル処理、携帯電話、スマートフォン、ウェアラブルデバイス、他の同様の計算デバイスなどの様々な形式のモバイルデバイスを表すこともできる。本明細書で示されるコンポーネント、それらの接続と関係、及びそれらの機能は単なる例であり、本明細書の説明及び／又は要求される本開示の実現を制限することを意図したものではない。

図６に示すように、機器６００は計算ユニット６０１を含み、計算ユニット６０１は、読み取り専用メモリ（ＲＯＭ）６０２に記憶されているコンピュータプログラム又は記憶ユニット６０８からランダムアクセスメモリ（ＲＡＭ）６０３にロードされたコンピュータプログラムに基づいて、様々な適切な動作と処理を実行することができる。ＲＡＭ６０３には、機器６００が動作するに必要な様々なプログラムとデータも記憶することができる。計算ユニット６０１、ＲＯＭ６０２、及びＲＡＭ６０３は、バス６０４を介してお互いに接続される。入出力（Ｉ／Ｏ）インターフェース６０５もバス６０４に接続される。

機器６００内の複数のコンポーネントは、Ｉ／Ｏインターフェース６０５に接続されており、キーボード、マウスなどの入力ユニット６０６と、様々なタイプのディスプレイ、スピーカなどの出力ユニット６０７と、ディスク、光ディスクなどの記憶ユニット６０８と、及びネットワークカード、モデム、無線通信トランシーバなどの通信ユニット６０９と、を含む。通信ユニット６０９は、電子機器６００が、インターネットなどのコンピュータネットワーク、及び／又は様々な電気通信ネットワークを介して他の機器と情報／データを交換することを可能にする。

計算ユニット６０１は、様々な処理と計算能力を備える汎用及び／又は専用の処理コンポーネントである。計算ユニット６０１のいくつかの例は、中央処理装置（ＣＰＵ）、グラフィックス処理ユニット（ＧＰＵ）、様々な専用の人工知能（ＡＩ）計算チップ、様々な機械学習モデルアルゴリズムを実行する計算ユニット、デジタル信号プロセッサ（ＤＳＰ）、及び任意の適切なプロセッサ、コントローラ、マイクロコントローラなどを含むが、これらに限定されない。計算ユニット６０１は、本開示に記載される方法などの上記の様々な方法と処理を実行する。例えば、いくつかの実施例では、本開示に記載される方法は、記憶ユニット６０８などの機械読み取り可能な媒体に有形的に含まれるコンピュータソフトウェアプログラムとして実現することができる。いくつかの実施例では、コンピュータプログラムの一部又は全部は、ＲＯＭ６０２及び／又は通信ユニット６０９を介して電子機器６００にロード及び／又はインストールされる。コンピュータプログラムがＲＡＭ６０３にロードされて計算ユニット６０１によって実行される場合、上記の本開示に記載される方法の一つ又は複数のステップを実行することができる。代替的に、他の実施例では、計算ユニット６０１は、他の任意の適切な方式（例えば、ファームウェアによって）を介して本開示に記載される方法を実行するように構成されることができる。

本明細書で説明されるシステムと技術の様々な実施方式は、デジタル電子回路システム、集積回路システム、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、特定用途向け集積回路（ＡＳＩＣ）、特定用途向け標準製品（ＡＳＳＰ）、システムオンチップシステム（ＳＯＣ）、ロードプログラマブルロジックデバイス（ＣＰＬＤ）、コンピュータハードウェア、ファームウェア、ソフトウェア、及び／又はそれらの組み合わせで実現することができる。これらの様々な実施方式は、一つ又は複数のコンピュータプログラムで実施されることを含むことができ、当該一つ又は複数のコンピュータプログラムは、少なくとも一つのプログラマブルプロセッサを含むプログラム可能なシステムで実行及び／又は解釈されることができ、当該プログラマブルプロセッサは、特定用途向け又は汎用プログラマブルプロセッサであってもよく、ストレージシステム、少なくとも一つの入力装置、及び少なくとも一つの出力装置からデータ及び命令を受信し、データ及び命令を当該ストレージシステム、当該少なくとも一つの入力装置、及び当該少なくとも一つの出力装置に伝送することができる。

本開示の方法を実施するためのプログラムコードは、一つ又は複数のプログラミング言語の任意の組み合わせを使用して作成することができる。これらのプログラムコードは、プログラムコードがプロセッサ又はコントローラによって実行される時にフローチャート及び／又はブロック図に規定された機能／動作が実施されるように、汎用コンピュータ、専用コンピュータ、又は他のプログラム可能なデータ処理装置のプロセッサ又はコントローラに提供することができる。プログラムコードは、完全に機械上で実行されたり、部分的に機械上で実行されたり、独立したソフトウェアパッケージとして部分的に機械上で実行され、部分的にリモート機械上実行されたり、又は完全にリモート機械又はサーバ上で実行されたりすることができる。

本開示の文脈において、機械読み取り可能な媒体は、命令実行システム、装置、又は機器の使用、又は命令実行システム、装置又は機器と組み合わせて使用するプログラムを含むか、又は記憶することができる有形の媒体であってもよい。機械読み取り可能な媒体は、機械読み取り可能な信号媒体又は機械読み取り可能な記憶媒体であってもよい。機械読み取り可能な媒体は、電子、磁気、光学、電磁気、赤外線、又は半導体システム、装置又は機器、又は上記の内容の任意の適切な組み合わせを含むが、これらに限定されない。機械読み取り可能な記憶媒体のより具体的な例は、一つ又は複数のワイヤに基づく電気接続、ポータブルコンピュータディスク、ハードディスク、ランダムアクセスメモリ（ＲＡＭ）、読み取り専用メモリ（ＲＯＭ）、消去可能プログラマブル読み取り専用メモリ（ＥＰＲＯＭ又はフラッシュメモリ（登録商標））、光ファイバ、ポータブルコンパクトディスク読み取り専用メモリ（ＣＤ－ＲＯＭ）、光学記憶装置、磁気記憶装置、又は上記の内容の任意の適切な組み合わせを含む。

ユーザとのインタラクションを提供するために、コンピュータ上においてここで説明されているシステム及び技術を実施することができ、当該コンピュータは、ユーザに情報を表示するためのディスプレイ装置（例えば、ＣＲＴ（陰極線管）又はＬＣＤ（液晶ディスプレイ）モニタ）と、キーボード及びポインティングデバイス（例えば、マウス又はトラックボール）とを有し、ユーザは、当該キーボード及び当該ポインティングデバイスによって入力をコンピュータに提供することができる。他の種類の装置は、ユーザとのインタラクションを提供するために用いられることもでき、例えば、ユーザに提供されるフィードバックは、任意の形式のセンシングフィードバック（例えば、視覚フィードバック、聴覚フィードバック、又は触覚フィードバック）であってもよく、任意の形式（音響入力と、音声入力と、触覚入力とを含む）でユーザからの入力を受信することができる。

ここで説明されるシステム及び技術は、バックエンドコンポーネントを含む計算システム（例えば、データサーバとする）、又はミドルウェアコンポーネントを含む計算システム（例えば、アプリケーションサーバー）、又はフロントエンドコンポーネントを含む計算システム（例えば、グラフィカルユーザインタフェース又はウェブブラウザを有するユーザコンピュータ、ユーザは、当該グラフィカルユーザインタフェース又は当該ウェブブラウザによってここで説明されるシステム及び技術の実施方式とインタラクションする）、又はこのようなバックエンドコンポーネントと、ミドルウェアコンポーネントと、フロントエンドコンポーネントの任意の組み合わせを含む計算システムで実施することができる。任意の形式又は媒体のデジタルデータ通信（例えば、通信ネットワーク）によってシステムのコンポーネントを相互に接続されることができる。通信ネットワークの例は、ローカルエリアネットワーク（ＬＡＮ）と、ワイドエリアネットワーク（ＷＡＮ）と、インターネットと、ブロックチェーンネットワークと、を含む。

コンピュータシステムは、クライアントとサーバとを含むことができる。クライアントとサーバは、一般に、互いに離れており、通常に通信ネットワークを介してインタラクションする。対応するコンピュータ上で実行され、互いにクライアント-サーバ関係を有するコンピュータプログラムによってクライアントとサーバとの関係が生成される。サーバは、クラウドサーバであってもよく、クラウド計算又はクラウドホストとも呼ばれ、クラウド計算サービスシステムの中の一つのホスト製品であり、従来の物理ホストとバーチャル・プライベート・サーバ（ＶＰＳ）に、存在する管理困難度が高く、業務拡張性が弱い欠陥を解決する。サーバは、分散システムのサーバであってもよく、又はブロックチェーンを組み合わせるサーバであってもよい。

上記に示される様々な形式のフローを使用して、ステップを並べ替え、追加、又は削除することができることを理解されたい。例えば、本開示に記載されている各ステップは、並列に実行されてもよいし、順次的に実行されてもよいし、異なる順序で実行されてもよいが、本開示で開示されている技術案が所望の結果を実現することができれば、本明細書では限定されない。

上記の具体的な実施方式は、本開示に対する保護範囲の制限を構成するものではない。当業者は、設計要求と他の要因に基づいて、様々な修正、組み合わせ、サブコンビネーション、及び代替を行うことができる。任意の本開示の精神と原則内で行われる修正、同等の置換、及び改善などは、いずれも本開示の保護範囲内に含まれなければならない。

Claims

コンピュータにより実行される、イメージ検索方法であって、
検索待ちのイメージセットの中のイメージの特徴を取得し、前記特徴に基づいて決定木を生成し、前記決定木の中のノードに対応する問題をそれぞれ配置するステップと、
ユーザのイメージ検索要求を受信した場合、前記問題に基づいてユーザに質問し、前記ユーザの回答を組み合わせて、前記決定木から一つの最適パスを選択し、前記最適パス上のリーフノードに対応するイメージを検索されたイメージとするステップと、を含み、
前記特徴に基づいて決定木を生成するステップは、
前記特徴に基づいて、所定の特徴選択基準に従って、前記決定木を生成するステップを含み、
前記所定の特徴選択基準が情報利得及び情報利得比を含み、
前記決定木を生成するステップは、
ルートノードを現在のノードとし、前記検索待ちのイメージセットを前記現在のノードに対応するデータセットとし、取得されたイメージの特徴で構成された特徴セットを前記現在のノードに対応する特徴セットとし、第２の処理を実行するステップを含み、
前記第２の処理は、
前記情報利得及び前記情報利得比を組み合わせて、前記現在のノードに対応する特徴セットから一つの最適な特徴を選択し、前記最適な特徴に対応する異なる特徴値について、対応するノードをそれぞれ確立し、確立されたノードを前記現在のノードのサブノードとし、
前記現在のノードの各サブノードについて、それぞれ前記現在のノードに対応するデータセットから前記サブノードにマッチングするデータを選択し、前記サブノードに対応するデータセットを構成し、前記マッチングするデータは、前記最適な特徴の特徴値が前記サブノードに対応する特徴値であるデータであり、
前記最適な特徴を前記現在のノードに対応する特徴セットから削除し、更新後の特徴セットを取得し、
前記現在のノードの各サブノードについて、前記サブノードがリーフノードであると決定された場合、前記サブノードに対する処理を終了し、前記サブノードがリーフノードではないと決定された場合、前記サブノードを前記現在のノードとし、前記更新後の特徴セットを前記現在のノードに対応する特徴セットとし、前記ルートノードから開始するすべてのパス上の最後一つのノードがいずれもリーフノードであるまで、前記第２の処理を繰り返して実行する、処理である、
イメージ検索方法。
前記決定木から一つの最適パスを選択するステップは、前記決定木内のルートノードを現在のノードとし、第１の処理を実行するステップを含み、
前記第１の処理は、
前記現在のノードに対応する問題に従って前記ユーザに質問し、
前記ユーザの回答を取得し、前記現在のノードのサブノードから前記回答にマッチングするサブノードを決定し、
前記マッチングするサブノードがリーフノードであると決定された場合、前記ルートノードから前記リーフノードまでのパスを前記最適パスとし、前記マッチングするサブノードが前記リーフノードではないと決定された場合、前記マッチングするサブノードを前記現在のノードとし、前記第１の処理を繰り返し実行する、処理である、
請求項１に記載のイメージ検索方法。
前記所定の特徴選択基準は、ジニ係数をさらに含む、
請求項１または２に記載のイメージ検索方法。
前記所定の特徴選択基準が前記情報利得、前記情報利得比、及び前記ジニ係数を含む場合、前記決定木を生成するステップは、
ルートノードを現在のノードとし、前記検索待ちのイメージセットを前記現在のノードに対応するデータセットとし、取得されたイメージの特徴で構成された特徴セットを前記現在のノードに対応する特徴セットとし、第３の処理を実行するステップを含み、
前記第３の処理は、
前記情報利得及び前記情報利得比を組み合わせて、前記現在のノードに対応する特徴セットから一つの最適な特徴を選択し、前記ジニ係数により、前記最適な特徴に対応する各特徴値からＭ（Ｍは前記最適な特徴に対応する特徴値の数より小さい正の整数である）個の特徴値を選択し、選択されていない特徴値を他の特徴値とし、前記他の特徴値を一つの全体として、前記Ｍ個の特徴値及び前記他の特徴値に対応するノードをそれぞれ確立し、確立されたＭ＋１個のノードを前記現在のノードのサブノードとし、
前記現在のノードの各サブノードについて、それぞれ前記現在のノードに対応するデータセットから前記サブノードにマッチングするデータを選択し、前記サブノードに対応するデータセットを構成し、前記マッチングするデータは、前記最適な特徴の特徴値が前記サブノードに対応する特徴値であるデータであり、
前記最適な特徴を前記現在のノードに対応する特徴セットから削除し、更新後の特徴セットを取得し、
前記現在のノードの各サブノードについて、前記サブノードが前記リーフノードであると決定された場合、前記サブノードに対する処理を終了し、前記サブノードが前記リーフノードではないと決定された場合、前記サブノードを前記現在のノードとし、前記更新後の特徴セットを前記現在のノードに対応する特徴セットとして、前記ルートノードから開始するすべてのパス上の最後一つのノードがいずれも前記リーフノードであるまで、前記第３の処理を繰り返して実行する、処理である、
請求項３に記載のイメージ検索方法。
前記情報利得及び前記情報利得比を組み合わせて、前記現在のノードに対応する特徴セットから一つの最適な特徴を選択するステップは、
前記現在のノードに対応する特徴セット内の各特徴が前記現在のノードに対応するデータセットに対する情報利得をそれぞれ取得するステップと、
取得された各情報利得の平均値を計算し、前記現在のノードに対応する特徴セットの各特徴から対応する情報利得が前記平均値より大きい特徴を選択するステップと、
選択された各特徴が前記現在のノードに対応するデータセットに対する情報利得比をそれぞれ取得するステップと、
情報利得比が最大の特徴を前記最適な特徴とするステップと、を含む、
請求項４に記載のイメージ検索方法。
前記ジニ係数により、前記最適な特徴に対応する各特徴値からＭ個の特徴値を選択するステップは、
前記最適な特徴に対応する各特徴値が前記現在のノードに対応するデータセットに対するジニ係数をそれぞれ取得するステップと、
取得された各ジニ係数を小さい順にソートし、ソート後の前のＭ位にあるジニ係数を選択するステップと、
選択されたＭ個のジニ係数に対応する特徴値を前記最適な特徴に対応する各特徴値から選択されたＭ個の特徴値とするステップと、を含む、
請求項４または５に記載のイメージ検索方法。
イメージ検索装置であって、
前処理モジュールと検索モジュールを含み、
前記前処理モジュールは、検索待ちのイメージセットの中のイメージの特徴を取得し、前記特徴に基づいて決定木を生成し、前記決定木の中のノードに対応する問題をそれぞれ配置するために用いられ、
前記検索モジュールは、ユーザのイメージ検索要求を受信した場合、前記問題に基づいてユーザに質問し、前記ユーザの回答を組み合わせて、前記決定木から一つの最適パスを選択し、前記最適パス上のリーフノードに対応するイメージを検索されたイメージとするために用いられ、
前記前処理モジュールは、前記特徴に基づいて、所定の特徴選択基準に従って、前記決定木を生成し、
前記所定の特徴選択基準が情報利得及び情報利得比を含み、
前記前処理モジュールは、ルートノードを現在のノードとし、前記検索待ちのイメージセットを前記現在のノードに対応するデータセットとし、取得されたイメージの特徴で構成された特徴セットを前記現在のノードに対応する特徴セットとし、第２の処理を実行し、
前記第２の処理は、
前記情報利得及び前記情報利得比を組み合わせて、前記現在のノードに対応する特徴セットから一つの最適な特徴を選択し、前記最適な特徴に対応する異なる特徴値について、対応するノードをそれぞれ確立し、確立されたノードを前記現在のノードのサブノードとし、前記現在のノードの各サブノードについて、それぞれ前記現在のノードに対応するデータセットから前記サブノードにマッチングするデータを選択し、前記サブノードに対応するデータセットを構成し、前記マッチングするデータは、前記最適な特徴の特徴値が前記サブノードに対応する特徴値であるデータであり、前記最適な特徴を前記現在のノードに対応する特徴セットから削除し、更新後の特徴セットを取得し、前記現在のノードの各サブノードについて、前記サブノードがリーフノードであると決定された場合、前記サブノードに対する処理を終了し、前記サブノードがリーフノードではないと決定された場合、前記サブノードを前記現在のノードとし、前記更新後の特徴セットを前記現在のノードに対応する特徴セットとし、前記ルートノードから開始するすべてのパス上の最後一つのノードがいずれもリーフノードであるまで、前記第２の処理を繰り返して実行する、処理である、
イメージ検索装置。
前記検索モジュールは、前記決定木内のルートノードを現在のノードとし、第１の処理を実行し、
前記第１の処理は、
前記現在のノードに対応する問題に従って前記ユーザに質問し、前記ユーザの回答を取得し、前記現在のノードのサブノードから前記回答にマッチングするサブノードを決定し、前記マッチングするサブノードがリーフノードであると決定された場合、前記ルートノードの開始から前記リーフノードの終了までのパスを前記最適パスとし、前記マッチングするサブノードがリーフノードではないと決定された場合、前記マッチングするサブノードを前記現在のノードとし、前記第１の処理を繰り返し実行する、処理である、
請求項７に記載のイメージ検索装置。
前記所定の特徴選択基準は、ジニ係数をさらに含む、
請求項７または８に記載のイメージ検索装置。
前記所定の特徴選択基準が前記情報利得、前記情報利得比、及び前記ジニ係数を含む場合、前記前処理モジュールは、ルートノードを現在のノードとし、前記検索待ちのイメージセットを前記現在のノードに対応するデータセットとし、取得されたイメージの特徴で構成された特徴セットを前記現在のノードに対応する特徴セットとし、第３の処理を実行し、
前記第３の処理は、
前記情報利得及び前記情報利得比を組み合わせて、前記現在のノードに対応する特徴セットから一つの最適な特徴を選択し、前記ジニ係数により、前記最適な特徴に対応する各特徴値からＭ（Ｍは前記最適な特徴に対応する特徴値の数より小さい正の整数である）個の特徴値を選択し、選択されていない特徴値を他の特徴値とし、前記他の特徴値を一つの全体として、前記Ｍ個の特徴値及び前記他の特徴値に対応するノードをそれぞれ確立し、確立されたＭ＋１個のノードを前記現在のノードのサブノードとし、前記現在のノードの各サブノードについて、それぞれ前記現在のノードに対応するデータセットから前記サブノードにマッチングするデータを選択し、前記サブノードに対応するデータセットを構成し、前記マッチングするデータは、前記最適な特徴の特徴値が前記サブノードに対応する特徴値であるデータであり、前記最適な特徴を前記現在のノードに対応する特徴セットから削除し、更新後の特徴セットを取得し、前記現在のノードの各サブノードについて、前記サブノードがリーフノードであると決定された場合、前記サブノードに対する処理を終了し、前記サブノードがリーフノードではないと決定された場合、前記サブノードを前記現在のノードとし、前記更新後の特徴セットを前記現在のノードに対応する特徴セットとし、前記ルートノードから開始するすべてのパス上の最後一つのノードがいずれもリーフノードであるまで、前記第３の処理を繰り返して実行する、
請求項９に記載のイメージ検索装置。
前記前処理モジュールは、前記現在のノードに対応する特徴セット内の各特徴が前記現在のノードに対応するデータセットに対する情報利得をそれぞれ取得し、取得された各情報利得の平均値を計算し、前記現在のノードに対応する特徴セットの各特徴から対応する情報利得が前記平均値より大きい特徴を選択し、選択された各特徴が前記現在のノードに対応するデータセットに対する情報利得比をそれぞれ取得し、情報利得比が最大の特徴を前記最適な特徴とする、
請求項１０に記載のイメージ検索装置。
前記前処理モジュールは、前記最適な特徴に対応する各特徴値が前記現在のノードに対応するデータセットに対するジニ係数をそれぞれ取得し、取得された各ジニ係数を小さい順にソートし、ソート後の前のＭ位にあるジニ係数を選択し、選択されたＭ個のジニ係数に対応する特徴値を前記最適な特徴に対応する各特徴値から選択されたＭ個の特徴値とする、
請求項１０または１１に記載のイメージ検索装置。
電子機器であって、
少なくとも一つのプロセッサと、
前記少なくとも一つのプロセッサと通信接続されたメモリと、を含み、
前記メモリに前記少なくとも一つのプロセッサにより実行可能な命令が記憶されており、前記命令が前記少なくとも一つのプロセッサにより実行されると、前記少なくとも一つのプロセッサが請求項１から６のいずれか一項に記載のイメージ検索方法を実行する、
電子機器。
コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体であって、
前記コンピュータ命令は、コンピュータに請求項１から６のいずれか一項に記載のイメージ検索方法を実行させる、
非一時的なコンピュータ読み取り可能な記憶媒体。
プロセッサによって実行される時に請求項１から６のいずれか一項に記載のイメージ検索方法を実現する、
コンピュータプログラム。