JP2012042990A - 画像識別情報付与プログラム及び画像識別情報付与装置 - Google Patents

画像識別情報付与プログラム及び画像識別情報付与装置 Download PDF

Info

Publication number
JP2012042990A
JP2012042990A JP2010180771A JP2010180771A JP2012042990A JP 2012042990 A JP2012042990 A JP 2012042990A JP 2010180771 A JP2010180771 A JP 2010180771A JP 2010180771 A JP2010180771 A JP 2010180771A JP 2012042990 A JP2012042990 A JP 2012042990A
Authority
JP
Japan
Prior art keywords
image
identification information
feature vector
decision tree
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010180771A
Other languages
English (en)
Other versions
JP5521881B2 (ja
Inventor
Motofumi Fukui
基文 福井
Sukeji Kato
典司 加藤
Bunen Seki
文渊 戚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2010180771A priority Critical patent/JP5521881B2/ja
Priority to US13/007,140 priority patent/US8538173B2/en
Priority to AU2011200343A priority patent/AU2011200343B2/en
Priority to CN201110035044.4A priority patent/CN102376079B/zh
Publication of JP2012042990A publication Critical patent/JP2012042990A/ja
Application granted granted Critical
Publication of JP5521881B2 publication Critical patent/JP5521881B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

【課題】画像の全体に対して識別情報を付与する場合において、本構成を有しない場合と比較して、高速に識別情報を付与する画像識別情報付与プログラム及び画像識別情報付与装置を提供する。
【解決手段】本装置は、対象画像から選択された部分領域に対する第1の特徴ベクトルを算出する算出手段と、学習用画像の部分領域に対して算出された第2の特徴ベクトルと学習用画像全体に対して付与された第2の識別情報とに基づいて決定木群を用いて対象画像の内容を表す第1の識別情報を当該対象画像に付与する手段であって、第2の特徴ベクトル群と第2の識別情報群を決定木群に流したとき、決定木群の各葉に到達した第2の識別情報の数の全体に対する割り合いから求まる尤度関数を掛け合わせたものと第1の特徴ベクトルの事前確率を掛け合わせたものとの比に、第2の識別情報の事前確率を掛けることにより、第1の識別情報を決定して付与する付与手段とを備える。
【選択図】図1

Description

本発明は、画像識別情報付与プログラム及び画像識別情報付与装置に関する。
近年、画像全体及び画像の部分領域に対して、その領域の内容を説明するクラスラベルを自動的に付与する技術の研究が行われている。この技術は、画像アノテーション技術と呼ばれ、画像特徴とその画像特徴を説明する言語的意味を持つラベルとを対応付ける技術である。画像アノテーション技術は、画像検索をはじめとする画像関連のアプリケーションへの応用が期待されている。
画像アノテーション技術として、複数の学習用画像の各々を画像分割する手段と、付加されている文書を当該分割された複数の分割画像に対してそれぞれ付随させる手段と、複数の分割画像をその画像特徴が類似する画像同士に分類する手段と、分類した画像に付随した文書中の単語の出現頻度を計数する手段と、計数された出現頻度の上位所定数に対応する単語を分類の意味内容を示す単語として抽出する手段とを具えた画像の分類装置が提案されている(例えば、特許文献1参照)。
画像とラベルがペアになった学習データは、WEB画像検索などを使って容易に集めることができる。この入手容易な学習データを用いた画像アノテーションシステムを実現する代表的な先行技術としては、SML(Semantic Multi-class Labelling)がある(例えば、非特許文献1参照)。
また、SML以外の代表的な先行技術としては、kNNベースの手法が提案されている(例えば、非特許文献2〜4参照)。kNNベースの手法は、ラベルを付与したい画像から抽出した特徴ベクトルと距離的に近い学習用画像から抽出した特徴ベクトルを選び、その特徴ベクトルに対して付与されたラベルを付与する。
特開2000−353173号公報
ところで、SMLでは、画像の領域の内容を表す識別情報毎に混合ガウス分布を算出する必要がある。kNNベースの手法では、対象となる特徴ベクトルと学習用画像から抽出した各特徴ベクトルとの間の距離を計算する必要がある。
本発明の課題は、画像の全体に対して識別情報を付与する場合において、本構成を有しない場合と比較して、高速に識別情報を付与する画像識別情報付与プログラム及び画像識別情報付与装置を提供することにある。
[1]コンピュータを、処理対象の画像から選択された部分領域に対する第1の特徴ベクトルを算出する特徴ベクトル算出手段と、学習用の画像の部分領域に対して算出された第2の特徴ベクトルと前記学習用の画像の全体に対して付与された第2の識別情報とに基づいてあらかじめ生成した決定木群を用いて処理対象の画像の内容を表す第1の識別情報を当該処理対象の画像に付与する手段であって、前記第2の特徴ベクトル群と前記第2の識別情報群を前記決定木群に流したとき、前記決定木群の各葉に到達した前記第2の識別情報の数の全体に対する割り合いから求まる尤度関数を掛け合わせたものと前記特徴ベクトル算出手段によって算出された第1の特徴ベクトルの事前確率を掛け合わせたものとの比に、前記第2の識別情報の事前確率を掛けることにより、前記処理対象の画像の全体に対して前記第1の識別情報を決定して付与する画像識別情報付与手段として機能させるための画像識別情報付与プログラム。
[2]前記画像識別情報付与手段は、前記決定木群の各葉に到達した前記第2の識別情報に応じた重み付けを行うことにより前記処理対象の画像の全体に対する前記第1の識別情報を求める前記[1]に記載の画像識別情報付与プログラム。
[3]前記画像識別情報付与手段は、前記特徴ベクトル算出手段によって算出され第1のた特徴ベクトルと前記決定木群nから前記処理対象の画像の部分領域に対する識別情報を決定して付与する前記[1]乃至[2]のいずれかに記載の画像識別情報付与プログラム。
[4]処理対象の画像から選択された部分領域に対する第1の特徴ベクトルを算出する特徴ベクトル算出手段と、学習用の画像の部分領域に対して算出された第2の特徴ベクトルと前記学習用の画像の全体に対して付与された第2の識別情報とに基づいてあらかじめ生成した決定木群を用いて処理対象の画像の内容を表す第1の識別情報を当該処理対象の画像に付与する手段であって、前記第2の特徴ベクトル群と前記第2の識別情報群を前記決定木群に流したとき、前記決定木群の各葉に到達した前記第2の識別情報の数の全体に対する割り合いから求まる尤度関数を掛け合わせたものと前記特徴ベクトル算出手段によって算出された第1の特徴ベクトルの事前確率を掛け合わせたものとの比に、前記第2の識別情報の事前確率を掛けることにより、前記処理対象の画像の全体に対して前記第1の識別情報を決定して付与する画像識別情報付与手段とを備えた画像識別情報付与装置。
請求項1及び4に係る発明によれば、画像の全体に対して識別情報を付与する場合において、本構成を有しない場合と比較して、高速に識別情報を付与することができる。
請求項2に係る発明によれば、決定木の各葉の多次元空間内での体積がばらつく場合において、識別情報の精度を高めることができる。
請求項3に係る発明によれば、画像の部分領域に対して識別情報を付与することができる。
図1は、本発明の実施の形態に係る画像識別情報付与装置の構成の一例を示すブロック図である。 図2は、学習コーパスの一例を示す図である。 図3は、画像における部分領域選択の一例を示す図である。 図4は、画像における部分領域選択の他の例を示す図である。 図5は、画像における部分領域選択の他の例を示す図である。 図6は、画像における部分領域選択の他の例を示す図である。 図7は、決定木の作成方法の一例を示すフローチャートである。 図8は、確率テーブルの作成方法の一例を示す図である。 図9は、確率テーブルの一例を示す図である。 図10は、事後確率の計算方法の一例を示す図である。 図11は、事後確率の計算方法の他の例を示す図である。 図12は、本発明の実施の形態に係る画像識別情報付与装置の動作の一例を示すフローチャートである。
図1は、本発明の実施の形態に係る画像識別情報付与装置の構成の一例を示すブロック図である。
この画像識別情報付与装置1は、CPU等を有して構成された制御部2と、各種のプログラムやデータを記憶するROM、RAM、HDD等から構成された記憶部3と、画像を光学的に読み取るスキャナ等の画像入力部4と、液晶ディスプレイ等の表示部5とを備え、決定木群を識別器として用いるランダムフォレスト法を画像アノテーション技術(画像識別情報付与技術)に適用したものである。ランダムフォレスト法は非特許文献5,6などで提案されている識別モデルの一種である。
L.Breiman, "Random Forests.", Machine Learning, 2001. F.Moosman, E.Nowak, and F.Jurie, "Randomized Clustering Forests for Image Classification.", TPAMI, 2008.
画像アノテーション技術(画像識別情報付与技術)は(特許文献1)特開2000−353173号公報において提案されて以降、様々な手法が提案されている。特許文献1で提案されている手法では先ず、学習用画像を格子状に分割し、各格子領域から色や傾きなどの簡易な特徴量を抽出する。続いて、抽出した特徴量をいくつかのグループにクラスタリング(量子化)する。テスト時には、同様に格子領域から画像特徴を抽出し、その画像特徴を先にクラスタリングによって作成したグループに対して割り付けを行う。fを画像特徴、cをクラスラベルとすると、該当格子領域に対するクラスcの事後確率P(c|f)は、該当するグループ内に存在する学習用画像のクラスcの出現頻度により算出する。その後画像全体で事後確率を平均化することにより、画像全体に対するクラスラベルの確率P(c)を算出する。この方法を用いると格子領域が十分に細かい場合、処理時間は長くなるが、画像全体及び画像の部分領域に対してクラスラベルを付与することができる。
(画像入力部)
画像入力部4は、画像識別情報を付与する対象画像(テスト画像)を入力するものであり、スキャナに限られず、USBメモリ、CD−ROM等の記録媒体から対象画像を入力してもよく、ネットワークに接続されたインタフェースを介して対象画像を入力してもよい。
(記憶部)
記憶部3は、画像識別情報付与プログラム30等の各種のプログラムや、学習用画像310とクラスラベル(識別情報)311が対になった学習コーパス31と、決定木群データ32、確率テーブル33等の各種のデータを記憶する。
学習コーパス31は、学習用画像310とクラスラベル311が対になったものであり、学習データとして使用される。クラスラベル311は、一般的に複数のラベルから構成される。学習コーパス31は、キーワードによる画像検索装置、電子図鑑、WEB文書内の画像及びその近くにあるテキストの対などを用いることにより、画像とそれを説明するクラスラベルとして容易に入手することが可能である。しかしながら、これらの方法で収集した学習データは、画像のどの部分がどのクラスラベルに相当するかの対応関係が明らかではない。
図2は、学習コーパスの一例を示す図である。学習用画像310には、クラスラベル311として4つのラベル「犬、芝生、木、顔」が与えられているが、各ラベルが画像310のどの領域を説明するものなのかは事前には判定不能である。従って、学習コーパス31は、全てのクラスラベル311が、画像310の全ての画像領域を説明するものとして取り扱う。
(制御部)
制御部2のCPUは、画像識別情報付与プログラム30に従って動作することにより、学習データ取得手段21、画像領域選択手段22、特徴ベクトル算出手段23、決定木作成手段24、確率テーブル作成手段25を含む学習手段20Aとして機能し、画像受付手段26、画像領域選択手段27、特徴ベクトル算出手段28、画像識別情報付与手段29を含むテスト手段20Bとして機能する。
(学習データ取得手段)
学習データ取得手段21は、収集した学習データの中から実際に学習に使用する学習用画像を選択する部位である。学習データ取得手段21は、全ての学習用画像を選択してもよいし、一部の学習用画像のみを選択してもよい。学習データ取得手段21が一部の学習用画像を選択する手法は、基本的にはランダム選択を用いるが、学習データの全クラスラベルのうち必要なラベルを少なくとも一度は含むように選択することが望ましい。学習データ取得手段21は、後述の決定木作成手段24において、直前に生成した決定木を使用した場合に、分類性能が悪い学習用画像からサンプリングする手法をとってもよい。
(画像領域選択手段)
画像領域選択手段22は、学習データ取得手段21において選択した画像群の中から、事前に定めた個数分(=合計S)だけ学習用画像の部分領域310aとなる画像領域を選択する。画像領域の選択方法としては、あるサイズ以上の矩形領域を任意に選択してもよいし、画像中の注目点を中心に持つ画像領域を選択してもよいし、対象画像を格子状や各種クラスタリング手法により領域分割し、生成された部分領域を選択してもよい。学習用画像ごとに選択される画像領域の個数は同一である必要はなく、1つも選択されない画像が存在してもよい。
図3は、画像における部分領域選択の一例を示す図であり、矩形領域を3つ選択した例を示している。図4はHarrisオペレータ(特徴点抽出アルゴリズム)によって抽出された画像の特徴点を中心として事前に定めた半径を持つ円により4つの領域を選択した例であり、図5は画像を格子状に4×4分割し、そのうちの4領域を選択した例であり、図6は領域分割した後、生成された領域5つをすべて選択した例を示す図である。
(特徴ベクトル算出手段)
特徴ベクトル算出手段23は、画像領域選択手段22において選択した部分領域310aから画像特徴を抽出し、選択した部分領域310a全体の特徴を表現する特徴ベクトルfを生成する部位である。抽出する画像特徴としては、色、輝度、テクスチャ情報などの特徴量が考えられる。画像特徴をベクトル化する手法としては、これら画素単位で抽出した特徴量の平均値を用いてもよいし、全特徴量を量子化してその度数分布を算出するBag of Featureの形式にしてもよい。
(決定木作成手段)
決定木作成手段24は、特徴ベクトル算出手段23によって算出された特徴ベクトル群を用いて決定木を作成する。決定木作成手段24は、クラスラベル全体の集合をLとし、Lに属するラベルをcとする(0≦i≦n−1|nはラベルの総数)。また画像Iに付与されたラベル群をLとする。例えば、画像Iには、L={c,c,c}と3つのラベルが付与される。このとき、画像Iから選択されたk番目の部分領域I に対する特徴ベクトルf にも、クラスラベルとしてLが付与される。ここで、決定木Tのt番目のノードをn(i,t)とする。t=0はルートノードを意味する。各ノードn(i,t)からはn(i,l)とn(i,r)が作成される。ここで、l=2t+1,r=2t+2である。ノードn(i,t)にたどり着いた学習データ群をK と表現する。このとき、データ群K はK とK に分かれる。決定木においては、|K |=|K |+|K |、K ∩K =0が成立する。ここで|A|は、集合Aに属するデータ数を意味するものとする。この分割処理は、|K |≦thなるある事前に定めた閾値定数thをノードに到達するデータ数が下回るまで繰り返し分割される。一般的にthは小さい方が性能がよい(究極的にはth=1が理想である)。
決定木を作成するための分割手法としてはいくつかの手法が提案されているが、ここでは実施例として非特許文献6で提案された手法を画像アノテーション課題に適用させたものを示す。この分割手法は、特徴ベクトルf のm次元目の要素をf とすると、ノードn(i,t)に対して閾値θと次元mを定め、f がθより小さい場合はf をK に、それ以外の場合はK に配分する。このとき、ノードn(i,t)におけるエネルギー(シャノンエントロピー)をS(K )とすると、S(K )は以下の(数1)により算出できる。
ここでH(K )はK のラベル分布のエントロピーであり、以下の(数2)により表すことができる。
ここでcはラベルであり、nはK の中でラベルcが付与されたデータの個数に相当する値であり、データの個数そのものでもよいし、該当特徴ベクトルに付与されたラベルがn個あった場合、1.0/nとして数えてもよい。また、H(K )はK を2つのノードに分けたときのエントロピーであり、以下の(数3)により表すことができる。
また、I(K )は以下の(数4)により表すことができる。
(K )は全てのnの偏りが大きい場合に最大となり、H(K )は左右の分岐でデータの個数が同じ場合に最大となる。総合的にみてこの両条件が揃うときに、エネルギーS(K )は最大となる。決定木作成手段24は、ノードn(i,t)においてエネルギーS(K )ができるだけ大きくなるように、次元m及び閾値θを選択する。決定木作成手段24は、左右の分岐いずれかが0になるような分割を行わないようにし、どのようなパラメータでもそのようになってしまう場合は分岐を行わず、該当ノードをリーフ(分岐の終点=葉)とする。コンピュータに実装されるプログラムは、計算速度を優先させるため、次元を数回選択し、そのうえで閾値θを逐次的に変化させることにより、最適なパラメータを決定する。ノードは最終的にリーフ(葉)となり、決定木の分岐はそこで終了するが、各木におけるリーフの個数はth=1の場合に最大となり、選択した画像領域数(=S)となる。リーフは画像の領域分割におけるクラスタに相当するが、決定木作成手段24は距離計算を伴わないため、距離計算を伴う場合と比べて高速に計算できる。
学習手段20Aでは、以上の操作(画像選択、領域選択、決定木作成)を繰り返すことにより、決定木群を作成することができる。決定木作成手段24では、作成した決定木を決定木データ32として記憶部3に記憶する。
図7は、決定木の作成方法の一例を示すフローチャートである。θ及びmは枝における分岐パラメータであり、Sはその時のエントロピーに相当するスコアである。図7に示す決定木の作成方法は、特徴要素の最小値をinit_val、最大値をmax_valとし、loop_numは事前に定めた特徴次元選択回数である。
木の個数及び最大深度を事前に決定する(S1)。特徴ベクトルfとクラスラベルLのペアを選択する(S2)。t=0にリセットし(S3)、ノードn(t)が枝か否かを判定し(S4)、ノードn(t)が枝のときは(S4:Yes)、θ、m、Sを初期化する(S5)。loop=0とし(S6)、ランダムに次元mを選択し、閾値θをinit_valに設定する(S7)。エントロピーS(K)を算出し(S8)、S(K)が最大か否かを判定し(S9)、S(K)が最大のときは(S9:Yes)、θ=θ、m=m、S=S(K)とし(S10)、θ=Δθとする(S11)。次に、θ≧max_valか否かを判定し(S12)、θ≧max_valであれば(S12:Yes)、loop=1とし(S13)、loop≧loop_numか否かを判定し(S14)、loop≧loop_numであれば(S14:Yes)、t=1とし(S15)、すべて最大深度に到達し、又はすべてのリーフが終了したか否かを判定し(S16)、すべて最大深度に到達し、又はすべてのリーフが終了したら(S16:Yes)、次の決定木に進むか、次の決定木が無ければ、終了する。エントロピーを用いて分岐することにより、左右のノード間でデータ数がほぼ等しくなり、度数分布の差が大きくなる。
(確率テーブル作成手段)
確率テーブル作成手段25は、決定木作成手段24において作成した決定木群の各リーフに対して、クラスラベルの個数を数える部位である。確率テーブル作成手段25は、クラスラベルの個数を数える際に、全学習データを用いて算出してもよいし、各決定木毎に選択したサンプルのみで算出してもよいが、一般的には前者の方が高性能な結果を得ることができる。
図8は、確率テーブル(確率一覧)の作成方法の一例を示す図であり、決定木6及びその特定リーフ7でのクラスラベルの度数分布を示す。確率テーブル作成手段25は、全学習用画像から確率テーブルを作成する場合に、学習データ群について前述のように画像ごとに特定個数の矩形領域を算出してもよいし、画像領域分割の結果算出された全領域を選択してもよい。確率テーブル作成手段25は、得られた全特徴ベクトルと付随するクラスラベルを各決定木に流したとき、リーフ7でのラベルの個数を数える。テーブルを作る際に度数0となるラベルも存在するが、確率テーブル作成手段25は、過学習を防ぐ意味合いで、全てのクラスラベルの度数に一定値α(通常1より十分小さくする)を加算してもよい。
図9は、確率テーブル33の一例を示す。リーフl,l,・・・,l毎にクラスラベルC,C,・・・,Cの度数が記録されている。
(画像識別情報付与手段)
画像識別情報付与手段29は、アノテーション(識別情報)を付与する対象画像(テスト画像)から抽出した個々の特徴ベクトルに対して、クラスラベルの確率を計算する部位である。画像識別情報付与手段29は、テスト画像から領域を選択する際に、学習時と同一の領域選択方法を選ぶこととし、その領域から選択する画像特徴も学習時と同じ特徴を使用する。テスト画像Iから抽出した特徴ベクトル群をG={g,g,.....,g}とする。ここでgはテスト画像Iの部分画像領域Iから抽出した特徴ベクトルである。画像識別情報付与手段29において求めたい確率はP(c|G)であり、この値が大きいクラスcをアノテーションの結果とする。
画像識別情報付与手段29は、画像1枚から抽出する特徴ベクトルが1つである場合に、その特徴ベクトルが決定木のどのリーフにたどり着くかを算出し、そのリーフ上でのクラスラベルの度数分布をみることにより、クラスラベルを決定することができる。一方、1枚の画像から抽出する特徴ベクトルが複数の場合には、各領域ごとに識別し、それらを平均する手法が考えられるが、高性能な結果を得ることは困難である。
従来技術では、画像分類にランダムフォレスト法を適用する場合には事後確率P(c|g)を計算するのが普通である。事後確率の集合P(c|G)は、部分領域の数をn、特徴ベクトルをg(数はn個)とすると、各部分領域のクラスラベルの事後確率を平均化する、以下の(数5)によって表すことができる。
事後確率P(c|g)は、決定木をT個用いるとしたとき、以下の[数6]により表す
ことができる。
ここでlは、t番目の決定木において、特徴ベクトルgがたどりつくリーフノードを示す。(数6)の右辺の事後確率は前述のlに対応する確率テーブルにより容易に算出することができる。以上の手法は、通常のランダムフォレスト法であるが、異なるリーフの独立性が保障されないため、性能が確保されない。
そこで画像識別情報付与手段29は、事後確率P(c|g)を計算するのではなく、尤度関数P(g|c)を直接計算する。これにより、事後確率の集合P(c|G)は、ベイスの定理及び特徴ベクトルの独立性から、以下の(数7)により表すことができる。
計算式(7)において、クラスラベルの事前確率P(c)は、学習データのラベル分布から容易に計算できる。例えばラベルcが付随した学習画像の枚数を学習用画像の総数で除するなどにより算出できる。また、各特徴ベクトルの事前確率P(g)は、学習データの総ラベル数をTotal_Label_Numとし、末端のリーフlに到達した学習データの総ラベル数をLabel_Num(l)とすると、以下の(数8)により表すことができる。
(数8)において、加算項の中は、該当する末端のリーフに到達した学習データに付随するラベル数の全体に対する割合をw(l)で割ったものである。ここでw(l)は、リーフの体積に基づく重み係数である。また、尤度関数P(g|c)は、同様にリーフlに存在する学習データのクラスラベルcの総数をLabel_Num(c,l)とし、学習データのクラスラベルcの総数をTotal_Label_Num(c)とすると、以下の(数9)により表すことができる。
(数9)において、加算項の中は、該当する末端のリーフに到達した学習データに付随するクラスcの度数のクラスcの度数全体に対する割合をw(l)で割ったものである。(数8)及び(数9)中の度数は、確率テーブル作成手段25において作成した確率テーブルから容易に算出することができ、画像識別情報付与手段29は事後確率(c|G)を計算できる。
(事後確率の計算方法の変形例1)
図10は、事後確率の計算方法の変形例1を示す図である。別の実施例としては、単純に上記確率テーブルを用いるのではなく、図10に示すように該当リーフ7内で特徴ベクトルgからの距離が一定値以下であるような学習データのみを考慮してもよい。
(事後確率の計算方法の変形例2)
図11は、事後確率の計算方法の変形例2を示す図である。図11に示すように該当リーフ7内でラベルの度数を計算する際に特徴ベクトルgとの距離に応じて重みを付けて数えてもよい。画像識別情報付与手段29は、決定木の深度が十分にあり、リーフの個数が十分にある場合に、w(l)の値がリーフに依存しないものとして、全ての値を一定値に設定してもよく、この場合は(数5)と同等となる。
また、別の一例としては、リーフlに存在する学習用特徴ベクトルがk個あるとして(順にf,f,....,fとする)、w(l)は以下の(数10)により定義することができる。
ここでd(f,fは距離関数で、Zは正規化項を示す。また、w(l)は以下の(数10)により定義することもできる。
また、中間値(メディアン)によってw(l)を定めてもよい。決定木を用いた識別器では、分岐ノードにおいて閾値が定まるので、直接リーフの体積を見積もることもできる。ここでnは特徴ベクトルの次元数を意味する。画像領域が多い場合、(数7)の値は小さくなるので、事後確率を評価する際には対数尤度を計算することにする。その際確率テーブルの底上げ定数αを導入すると確率P(g|c)が0になることはないので、低出現ラベルに対する事後確率も評価することができる。
以上の手法により、画像識別情報付与手段29は、画像に対して選択した部分領域に対して尤度関数P(g|c)を計算し、ベイスの定理を用いて事後確率P(c|g)を計算し、閾値以上の値をもつクラスラベルc又は上位何個かの値をもつクラスラベルcを選択することにより、その部分領域に対してアノテーションを付けることができ、さらにそれらの結果を計算式(7)によりまとめることで事後確率の集合P(c|G)を計算することができ、画像全体に対して同様にラベルを付与することができる。
(画像識別情報付与装置の動作)
次に、画像識別情報付与装置1の動作の一例を図12に示すフローチャートに従い、学習段階とテスト段階に分けて説明する。
(1)学習段階
学習データ取得手段21は、記憶部3に記憶されている学習コーパス31の全て又は一部を学習データとして取得する(S20)。
画像領域選択手段22は、学習データ取得手段21が取得した学習用画像の部分領域310aとなる画像領域を選択する(S21)。
特徴ベクトル算出手段23は、画像領域選択手段22により選択された部分領域310aから画像特徴を抽出し、部分領域310a全体の特徴を表現する特徴ベクトルfを生成する(S22)。
決定木作成手段24は、特徴ベクトル算出手段23において算出した特徴ベクトル群を用いて決定木を作る(S23)。
確率テーブル作成手段25は、決定木作成手段24において作成した決定木群の各リーフに対して、クラスラベルの個数を数え、その結果を記憶部3の確率テーブル33に記録する(S24)。
(2)テスト段階
画像入力部4が制御部2に対象画像を入力すると、制御部2のテスト手段20Bの画像受付手段26は、入力された対象画像を受け付ける(S25)。
画像領域選択手段27は、画像受付手段26が受け付けた対象画像の部分領域となる画像領域を選択する画像領域を選択する(S26)。
特徴ベクトル算出手段28は、画像領域選択手段27により選択された部分領域から画像特徴を抽出し、部分領域全体の特徴を表現する特徴ベクトルgを生成し、画像識別情報付与手段29に出力する(S27)。
画像識別情報付与手段29は、特徴ベクトル算出手段28から出力された特徴ベクトルg、及び記憶部3の確率テーブル33を用いて、(数8)、(数9)による計算を行い、それらの結果を用いて計算式(7)による計算を行い、最も度数の高いクラスラベルを画像識別情報として対象画像全体に付与する(S28)。
なお、対象画像の部分領域に付与するクラスラベルを決定木を用いて求めることができる。この場合、画像識別情報付与手段29は、特徴ベクトル算出手段28から出力された特徴ベクトルg、及び記憶部3に記憶されている決定木データ32を用いて部分領域に対するクラスラベルを求める。
[他の実施の形態]
なお、本発明は、上記実施の形態に限定されず、発明の要旨を逸脱しない範囲で種々に変形が可能である。例えば、上記実施の形態で用いたプログラムをCD−ROM等の記録媒体に記憶して提供することもできる。また、上記実施の形態の各手段21〜29の全て又は一部をASIC等のハードウエアによって実現してもよい。また、上記実施の形態で説明した上記ステップの入替え、削除、追加等は可能である。
1…画像識別情報付与装置、2…制御部、3…記憶部、4…画像入力部、5…表示部、6…決定木、7…リーフ、20A…学習手段、20B…テスト手段、21…学習データ取得手段、22…画像領域選択手段、23…特徴ベクトル算出手段、24…決定木作成手段、25…確率テーブル作成手段、26…画像受付手段、27…画像領域選択手段、28…特徴ベクトル算出手段、29…画像識別情報付与手段、30…画像識別情報付与プログラム、31…学習コーパス、310…学習用画像、310a…部分領域、311…クラスラベル

Claims (4)

  1. コンピュータを、
    処理対象の画像から選択された部分領域に対する第1の特徴ベクトルを算出する特徴ベクトル算出手段と、
    学習用の画像の部分領域に対して算出された第2の特徴ベクトルと前記学習用の画像の全体に対して付与された第2の識別情報とに基づいてあらかじめ生成した決定木群を用いて処理対象の画像の内容を表す第1の識別情報を当該処理対象の画像に付与する手段であって、前記第2の特徴ベクトル群と前記第2の識別情報群を前記決定木群に流したとき、前記決定木群の各葉に到達した前記第2の識別情報の数の全体に対する割り合いから求まる尤度関数を掛け合わせたものと前記特徴ベクトル算出手段によって算出された第1の特徴ベクトルの事前確率を掛け合わせたものとの比に、前記第2の識別情報の事前確率を掛けることにより、前記処理対象の画像の全体に対して前記第1の識別情報を決定して付与する画像識別情報付与手段として機能させるための画像識別情報付与プログラム。
  2. 前記画像識別情報付与手段は、前記決定木群の各葉に到達した前記第2の識別情報に応じた重み付けを行うことにより前記処理対象の画像の全体に対する前記第1の識別情報を決定して付与する請求項1に記載の画像識別情報付与プログラム。
  3. 前記画像識別情報付与手段は、前記特徴ベクトル算出手段によって算出された第1の特徴ベクトルと前記決定木群から前記処理対象の画像の部分領域に対する識別情報を決定して付与する請求項1又は2に記載の画像識別情報付与プログラム。
  4. 処理対象の画像から選択された部分領域に対する第1の特徴ベクトルを算出する特徴ベクトル算出手段と、
    学習用の画像の部分領域に対して算出された第2の特徴ベクトルと前記学習用の画像の全体に対して付与された第2の識別情報とに基づいてあらかじめ生成した決定木群を用いて処理対象の画像の内容を表す第1の識別情報を当該処理対象の画像に付与する手段であって、前記第2の特徴ベクトル群と前記第2の識別情報群を前記決定木群に流したとき、前記決定木群の各葉に到達した前記第2の識別情報の数の全体に対する割り合いから求まる尤度関数を掛け合わせたものと前記特徴ベクトル算出手段によって算出された第1の特徴ベクトルの事前確率を掛け合わせたものとの比に、前記第2の識別情報の事前確率を掛けることにより、前記処理対象の画像の全体に対して前記第1の識別情報を決定して付与する画像識別情報付与手段とを備えた画像識別情報付与装置。
JP2010180771A 2010-08-12 2010-08-12 画像識別情報付与プログラム及び画像識別情報付与装置 Active JP5521881B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2010180771A JP5521881B2 (ja) 2010-08-12 2010-08-12 画像識別情報付与プログラム及び画像識別情報付与装置
US13/007,140 US8538173B2 (en) 2010-08-12 2011-01-14 Computer readable medium, apparatus, and method for adding identification information indicating content of a target image using decision trees generated from a learning image
AU2011200343A AU2011200343B2 (en) 2010-08-12 2011-01-27 Image identification information adding program, image identification information adding apparatus and image identification information adding method
CN201110035044.4A CN102376079B (zh) 2010-08-12 2011-02-09 图像识别信息添加装置和图像识别信息添加方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010180771A JP5521881B2 (ja) 2010-08-12 2010-08-12 画像識別情報付与プログラム及び画像識別情報付与装置

Publications (2)

Publication Number Publication Date
JP2012042990A true JP2012042990A (ja) 2012-03-01
JP5521881B2 JP5521881B2 (ja) 2014-06-18

Family

ID=45564874

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010180771A Active JP5521881B2 (ja) 2010-08-12 2010-08-12 画像識別情報付与プログラム及び画像識別情報付与装置

Country Status (4)

Country Link
US (1) US8538173B2 (ja)
JP (1) JP5521881B2 (ja)
CN (1) CN102376079B (ja)
AU (1) AU2011200343B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015158712A (ja) * 2014-02-21 2015-09-03 株式会社東芝 学習装置、密度計測装置、学習方法、学習プログラム、及び密度計測システム
JP2017208004A (ja) * 2016-05-20 2017-11-24 富士ゼロックス株式会社 クラス推定装置及びプログラム
WO2021131127A1 (ja) * 2019-12-23 2021-07-01 パナソニックIpマネジメント株式会社 識別情報付与装置、識別情報付与方法、及びプログラム
JP2022530785A (ja) * 2019-09-16 2022-07-01 ▲騰▼▲訊▼科技(深▲セン▼)有限公司 画像処理方法、装置、電子機器及びコンピュータプログラム
JP2022122232A (ja) * 2021-02-09 2022-08-22 アウー インテリジェンス, インコーポレイテッド 画像分類およびマーキング方法、並びに、そのシステム

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8463053B1 (en) 2008-08-08 2013-06-11 The Research Foundation Of State University Of New York Enhanced max margin learning on multimodal data mining in a multimedia database
JP5596628B2 (ja) * 2011-06-17 2014-09-24 トヨタ自動車株式会社 物体識別装置
US8832593B2 (en) 2011-12-16 2014-09-09 Harris Corporation Systems and methods for efficient spatial feature analysis
US8755606B2 (en) * 2011-12-16 2014-06-17 Harris Corporation Systems and methods for efficient feature extraction accuracy using imperfect extractors
CN103377381B (zh) * 2012-04-26 2016-09-28 富士通株式会社 识别图像的内容属性的方法和装置
CN103473231A (zh) * 2012-06-06 2013-12-25 深圳先进技术研究院 分类器构建方法和***
US9336302B1 (en) 2012-07-20 2016-05-10 Zuci Realty Llc Insight and algorithmic clustering for automated synthesis
US10319035B2 (en) 2013-10-11 2019-06-11 Ccc Information Services Image capturing and automatic labeling system
CN104281834B (zh) * 2014-05-16 2017-07-25 华为技术有限公司 一种人脸识别的方法及设备
CN104391970B (zh) * 2014-12-04 2017-11-24 深圳先进技术研究院 一种属性子空间加权的随机森林数据处理方法
US11205103B2 (en) 2016-12-09 2021-12-21 The Research Foundation for the State University Semisupervised autoencoder for sentiment analysis
US12008074B2 (en) * 2019-07-05 2024-06-11 Nec Corporation Learning device, learning method and storage medium
WO2021070258A1 (ja) * 2019-10-08 2021-04-15 日本電気株式会社 学習データ生成装置、学習データ生成方法、及び、記録媒体
CN110880022A (zh) * 2019-11-12 2020-03-13 北京小米智能科技有限公司 标注方法、装置及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000353173A (ja) * 1999-06-11 2000-12-19 Hitachi Ltd 文書付き画像の分類方法、分類装置および記録媒体
JP2010044674A (ja) * 2008-08-18 2010-02-25 Nippon Hoso Kyokai <Nhk> データ分類装置及びデータ分類プログラム

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6614789B1 (en) * 1999-12-29 2003-09-02 Nasser Yazdani Method of and apparatus for matching strings of different lengths
US7203669B2 (en) * 2003-03-17 2007-04-10 Intel Corporation Detector tree of boosted classifiers for real-time object detection and tracking
WO2006036150A1 (en) * 2004-09-28 2006-04-06 Nielsen Media Research, Inc Data classification methods and apparatus for use with data fusion
JP4533187B2 (ja) * 2005-03-01 2010-09-01 キヤノン株式会社 画像処理装置およびその制御方法
US20070053563A1 (en) * 2005-03-09 2007-03-08 Zhuowen Tu Probabilistic boosting tree framework for learning discriminative models
JP5291894B2 (ja) 2007-05-23 2013-09-18 国立大学法人山梨大学 メモリ素子、データ記録方法及びicタグ
US20090208112A1 (en) * 2008-02-20 2009-08-20 Kabushiki Kaisha Toshiba Pattern recognition method, and storage medium which stores pattern recognition program
CN101329731A (zh) * 2008-06-06 2008-12-24 南开大学 图像中数学公式的自动识别方法
CN101561874B (zh) * 2008-07-17 2011-10-26 清华大学 一种人脸虚拟图像生成的方法
CN101359372B (zh) * 2008-09-26 2011-05-11 腾讯科技(深圳)有限公司 分类器的训练方法及装置、识别敏感图片的方法及装置
JP5538967B2 (ja) * 2009-06-18 2014-07-02 キヤノン株式会社 情報処理装置、情報処理方法、プログラム
JP2011013732A (ja) * 2009-06-30 2011-01-20 Sony Corp 情報処理装置、情報処理方法、およびプログラム
JP5565190B2 (ja) * 2010-08-11 2014-08-06 富士ゼロックス株式会社 学習モデル作成プログラム、画像識別情報付与プログラム、学習モデル作成装置及び画像識別情報付与装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000353173A (ja) * 1999-06-11 2000-12-19 Hitachi Ltd 文書付き画像の分類方法、分類装置および記録媒体
JP2010044674A (ja) * 2008-08-18 2010-02-25 Nippon Hoso Kyokai <Nhk> データ分類装置及びデータ分類プログラム

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015158712A (ja) * 2014-02-21 2015-09-03 株式会社東芝 学習装置、密度計測装置、学習方法、学習プログラム、及び密度計測システム
JP2017208004A (ja) * 2016-05-20 2017-11-24 富士ゼロックス株式会社 クラス推定装置及びプログラム
US10303985B2 (en) 2016-05-20 2019-05-28 Fuji Xerox Co., Ltd. Class estimation apparatus, non-transitory computer readable medium, and class estimation method
JP2022530785A (ja) * 2019-09-16 2022-07-01 ▲騰▼▲訊▼科技(深▲セン▼)有限公司 画像処理方法、装置、電子機器及びコンピュータプログラム
JP7164252B2 (ja) 2019-09-16 2022-11-01 ▲騰▼▲訊▼科技(深▲セン▼)有限公司 画像処理方法、装置、電子機器及びコンピュータプログラム
US11907637B2 (en) 2019-09-16 2024-02-20 Tencent Technology (Shenzhen) Company Limited Image processing method and apparatus, and storage medium
WO2021131127A1 (ja) * 2019-12-23 2021-07-01 パナソニックIpマネジメント株式会社 識別情報付与装置、識別情報付与方法、及びプログラム
JP2022122232A (ja) * 2021-02-09 2022-08-22 アウー インテリジェンス, インコーポレイテッド 画像分類およびマーキング方法、並びに、そのシステム
JP7213569B2 (ja) 2021-02-09 2023-01-27 アウー インテリジェンス, インコーポレイテッド 画像分類およびマーキング方法、並びに、そのシステム

Also Published As

Publication number Publication date
US8538173B2 (en) 2013-09-17
JP5521881B2 (ja) 2014-06-18
AU2011200343B2 (en) 2013-02-21
US20120039541A1 (en) 2012-02-16
AU2011200343A1 (en) 2012-03-01
CN102376079B (zh) 2015-04-15
CN102376079A (zh) 2012-03-14

Similar Documents

Publication Publication Date Title
JP5521881B2 (ja) 画像識別情報付与プログラム及び画像識別情報付与装置
US10796145B2 (en) Method and apparatus for separating text and figures in document images
Chong et al. Simultaneous image classification and annotation
CN110362677B (zh) 文本数据类别的识别方法及装置、存储介质、计算机设备
CN108446741B (zh) 机器学习超参数重要性评估方法、***及存储介质
Liu et al. Weakly supervised multiclass video segmentation
US9218531B2 (en) Image identification apparatus, image identification method, and non-transitory computer readable medium
CN106886569B (zh) 一种基于mpi的ml-knn多标签中文文本分类方法
JP6897749B2 (ja) 学習方法、学習システム、および学習プログラム
CN103425996B (zh) 一种并行分布式的大规模图像识别方法
CN113850281B (zh) 一种基于meanshift优化的数据处理方法和装置
JP5012078B2 (ja) カテゴリ作成方法、カテゴリ作成装置、およびプログラム
Saito et al. An active learning paradigm based on a priori data reduction and organization
CN111414863B (zh) 一种增强型集成遥感影像分类方法
CN113033709A (zh) 链路预测方法和装置
CN111125329B (zh) 一种文本信息筛选方法、装置及设备
Salman et al. Gene expression analysis via spatial clustering and evaluation indexing
JP2010272004A (ja) 判別装置及び判別方法、並びにコンピューター・プログラム
CN111126443A (zh) 基于随机游走的网络表示学习方法
JP6004014B2 (ja) 学習方法、情報変換装置および学習プログラム
Pereira et al. Assessing active learning strategies to improve the quality control of the soybean seed vigor
CN112507912B (zh) 一种识别违规图片的方法及装置
Chen et al. See more for scene: Pairwise consistency learning for scene classification
JP5633424B2 (ja) プログラム及び情報処理システム
Pattanshetti et al. Performance evaluation and analysis of feature selection algorithms

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130724

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140228

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140311

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140324

R150 Certificate of patent or registration of utility model

Ref document number: 5521881

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150