TWI537841B - 圖像目標類別識別方法及裝置 - Google Patents

圖像目標類別識別方法及裝置 Download PDF

Info

Publication number
TWI537841B
TWI537841B TW103137992A TW103137992A TWI537841B TW I537841 B TWI537841 B TW I537841B TW 103137992 A TW103137992 A TW 103137992A TW 103137992 A TW103137992 A TW 103137992A TW I537841 B TWI537841 B TW I537841B
Authority
TW
Taiwan
Prior art keywords
image
category
feature points
target
feature
Prior art date
Application number
TW103137992A
Other languages
English (en)
Other versions
TW201523462A (zh
Inventor
甘永洲
鄧正平
Original Assignee
北京京東尚科信息技術有限公司
北京京東世紀貿易有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 北京京東尚科信息技術有限公司, 北京京東世紀貿易有限公司 filed Critical 北京京東尚科信息技術有限公司
Publication of TW201523462A publication Critical patent/TW201523462A/zh
Application granted granted Critical
Publication of TWI537841B publication Critical patent/TWI537841B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/771Feature selection, e.g. selecting representative features from a multi-dimensional feature space
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/231Hierarchical techniques, i.e. dividing or merging pattern sets so as to obtain a dendrogram
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/28Determining representative reference patterns, e.g. by averaging or distorting; Generating dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/088Non-supervised learning, e.g. competitive learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4023Scaling of whole images or parts thereof, e.g. expanding or contracting based on decimating pixels or lines of pixels; based on inserting pixels or lines of pixels
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/60Analysis of geometric attributes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/42Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/762Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
    • G06V10/7625Hierarchical techniques, i.e. dividing or merging patterns to obtain a tree-like representation; Dendograms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20024Filtering details
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30242Counting objects in image

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Multimedia (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Geometry (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

圖像目標類別識別方法及裝置
本發明涉及電腦數位影像處理領域,尤其涉及一種新穎的圖像目標類別識別方法及裝置。
隨著數位媒體的發展,數位圖像的數量呈指數增長;尤其在電子互聯網中,借助待銷售商品的圖像來展示商品的各個細節,用具有豐富語義內容的圖像來代替商品的細節描述,因此,圖像的數量與日劇增。而如何將大規模的圖像資料根據圖像中所描述的商品進行自動分類成了亟待解決的問題。
現存的圖像目標類別識別方法大多採用機器學習方法。在實際應用中,絕大多數學習模型中的參數是通過訓練樣本得到的,具有不確定性。同時分類模型因訓練樣本的差異會產生誤差,對目標類別的歸屬存在誤差和差錯率。此外,部分目標識別框架採用了多層結構,雖然提高了識別的精度,但卻需要大量的資源並耗費了大量的分類識別時間。
本發明提供了一種新穎的圖像目標類別識別方法和裝置,旨在解決現有圖像分類識別方法中存在的以下問題:1)現有的圖像目標類別識別方法借助分類模型參數估計的方式,其參數是通過訓練樣本得到 的,具有不確定性;2)分類模型因訓練樣本的差異會產生誤差,對目標類別的歸屬存在誤差和差錯率,不能實現圖像目標類別的精確識別;3)圖像目標類別識別的精度低且速度慢。
本發明的方法和裝置是從圖像的底層視覺特徵出發,所構 建的學習模型能夠尋找出每個目標類別圖像中的普遍共性,同時也能將不同類別進行較大程度的區分,從而實現了圖像目標類別的精確識別。同時還提升了圖像目標類別識別的精度和速度。
本發明首先提取出所有樣本圖像的關鍵特徵點,並借助聚 類分析演算法和搜索演算法等手段,大大降低了計算量。進一步利用圖像特徵共性提取方法,在降低計算量的同時,又提高了圖像識別精度。
本發明的技術解決方案如下。
本發明包括一種圖像目標類別識別方法,包括如下步驟:(S1)圖像特徵提取,利用特徵點提取方法提取出已知N個類別中所有樣本圖像的特徵點,其中N為大於1的自然數,每一類別都包含至少一幅樣本圖像,並建立已知類別-樣本圖像-特徵點對應關係;(S2)聚類分析,利用聚類演算法對提取出的全部特徵點進行聚類分析,並將這些特徵點劃分為N個子集;(S3)確定目標類別,為每個所述子集確定目標類別C n ;(S4)獲取共性特徵,利用搜索演算法獲取每個目標類別C n 中的各圖像之間的共性特徵,其中C n 為第n個目標類別,n為小於等於N的正整數。
在上述步驟S4之後還可以包括:線上圖像識別和分類步驟S5,用於對待分類的圖像進行識別和自動分類,所述線上圖像識別和分類步驟S5包括:S502:對待分類的圖像執行如步驟S1同樣的圖像特徵提取處理,提取出待分類圖像的特徵點;S503:將所提取出的待分類圖像中的特徵點與所述n個目標類別中的所述每個目標類別C n 的每個所述共性特徵 進行比對,分別計算出待分類圖像與每個目標類別之間的相似度;S504:將待分類的圖像歸屬於具有最大相似度的目標類別C n
本發明進一步包括一種圖像目標類別識別裝置,該裝置包 括:圖像特徵提取單元,被構造為:利用特徵點提取方法提取出已知N個類別中的所有樣本圖像的特徵點,其中N為大於1的自然數,每一類別都包含至少一幅樣本圖像,並建立已知類別-樣本圖像-特徵點對應關係;聚類分析單元,被構造為:利用聚類演算法對提取出的全部特徵點進行聚類分析、並將這些特徵點劃分為N個子集;確定單元,為每個所述子集確定目標類別C n ;獲取單元,利用搜索演算法搜獲取每個目標類別C n 中包含各圖像之間的共性特徵,其中C n 為第n個目標類別,n為小於等於N的正整數。
本發明還涉及一種利用如請求項1所述的圖像目標類別識 別方法對待分類圖像進行自動分類的方法,包括如下步驟:提取步驟,對待分類的圖像經歷與所述步驟S1相同的處理,提取出待分類圖像的底層視覺特徵;比對計算步驟,利用圖像相似度度量演算法將所提取出的待分類圖像中的各特徵點與每個目標類別中的共用特徵點集或與每個目標類別的平均量圖像中的各特徵點逐一進行比對,計算待分類圖像中的特徵點與每個目標類別中的特徵點之間的相似度;歸類步驟,將待分類的圖像歸屬於具有最大相似度的目標類別。
本發明又涉及一種圖像識別系統,至少包括處理器,所述 處理器被構造為至少包括如下功能單元:圖像特徵提取單元,被構造為利用特徵點提取方法提取出已知N個類別中的所有樣本圖像的特徵點,其中N為大於1的自然數,每一類別都包含至少一幅樣本圖像,並建立已知類別-樣本圖像-特徵點對應關係;聚類分析單元,被構造為利用聚類演算法對提取出的全部特徵點進行聚類分析,將這些特徵點劃分為N個子集;確定單元,為每個所述子集確定目標類別C n ;獲取單元,利用搜索演算法搜尋出每個目標類別C n 中包含各圖像之間的共性特徵,其中C n 為第n個目標類 別,n為小於等於N的正整數。
本發明的實施例已經獲得了如下有益效果:1.電腦對樣本圖像的目標類別的特徵進行自動提取和分析,自主學習和分類樣本圖像,並基於自主學習和分類的結果可以對待識別圖像進行自動類別識別;2.對目標類別代表圖像的篩選,降低了目標類別中個別具有較大差異性的圖像對整個目標類別識別的影響,同時也增強了對目標類別中共性圖像的共性特徵的提取。k叉樹的構建思想,很大程度上保證了具有相似共性的目標類別之間的空間關聯性;3.通過學習目標類別平均量圖像,不僅提高了識別的速度,同時在目標識別過程中,根據不同目標類別的特性來確定不同目標類別的閾值,很大程度上消除了採用統一的判定標準對部分目標類別的影響,減小了識別的誤差,提高了識別的精度。
S1-S4,S001-S003,S101~S103,S201-S202,S301-S302,S401-S402,S501-S504‧‧‧步驟
1‧‧‧圖像目標類別識別裝置
2‧‧‧圖像特徵提取單元
3‧‧‧聚類分析單元
4‧‧‧確定單元
5‧‧‧獲取單元
41‧‧‧統計模組
42‧‧‧確定模組
51‧‧‧搜索模組
52‧‧‧映射模組
100‧‧‧圖像識別系統
200‧‧‧圖像特徵提取單元
300‧‧‧聚類分析單元
400‧‧‧確定單元
500‧‧‧獲取單元
600‧‧‧比對計算單元
700‧‧‧歸類單元
圖1為本發明的基於離線(第一部分)電腦自主學習模型的圖像目標類別識別方法的主流程圖;圖2為本發明執行圖像預處理的流程圖;圖3為本發明一實施例中圖像底層視覺特徵提取方法的詳細流程圖;圖4為本發明一實施例中聚類分析方法的詳細流程圖;圖5為本發明一實施例中步驟S3的詳細流程圖;圖6為本發明一實施例中步驟S4的詳細流程圖;圖7為本發明線上(第二部分)圖像類別識別方法的主流程圖;圖8為本發明圖像目標類別識別裝置的方框圖; 圖9為一具體的電腦離線自動圖像識別的示例;圖10為包含本發明的圖像目標類別識別裝置的圖像識別系統的方框圖。
為了使本發明的目的、技術方案及優點更加清楚明白,以下結合附圖及具體實施例,對本發明作進一步詳細說明。附圖中僅示出了本發明的典型實施方式,本發明可以不同的形式來實施,且不應理解為局限於這裡示出或說明的各種具體實施方式。提供這些實施方式,只是使得該公開更加充分和全面。全文中,同樣的附圖標記對應同樣的元件或要素。對於每個附圖中相同的要素將不再重複說明。如在本文中所使用的“包含”和“包括”以及其變形的使用意味著包括其後列出的元素和其等同物以及額外的元素。
另外,應理解的是,本發明的實施例包括硬體、軟體、固件和電子部件或模組等,它們為論述的目的可圖示且描述為使部件的大部分唯一地實施在硬體內。然而,本領域普通技術人員基於在此的詳細描述將認識到在至少一個實施例中,基於電子器件的本發明的某一方面可以以軟體或固件的方式實施。也應注意的是,多個基於硬體、軟體和固件的裝置以及多個不同的結構部件可用于實施本發明。此外,如在隨後的段落中所描述的,在附圖中圖示的特定的機械構造詣在例證本發明的實施例,且其他替代的構造也是可能的。
本領域技術人員使用在此提供的教導和程式設計語言及工具,諸如Java、Pascal、C++、C、資料庫語言、API、SDK、彙編、固件、微碼和/或其他語言及工具,能夠容易地提供用於協助實現本發明的適當軟體環境。
下面將具體結合影像處理的實施方式描述本發明的優選實 施例。在實際應用中,本發明可以對彩色、黑白或灰度等各種圖像進行處理。
本申請的方法可以分成兩大部分。第一部分為電腦自主訓 練學習過程,第二部分為自動類別識別過程。這兩部分都可以是離線或線上執行或實施的。這裡所指的離線是指脫離網路系統,由電腦對圖像進行目標類別的自主學習過程;而線上是指在實際應用中,特別是在網路應用環境中,對已經獲得的待分類圖像進行自動目標類別識別的過程。這兩部分可以各自獨立地分別執行。
在第一部分中,首先,從已經明確劃分了已知類別(例如N 個已知類別)的已知樣本圖像(產品或商品等)集中分別選取出針對每個類別具有代表性的樣本圖像集,每個樣本圖像集中都包括至少一幅包含有該已知類別典型特徵的樣本圖像。通過讓電腦分別對這些具有代表性的樣本圖像集進行解析,從中提取出每個已知類別樣本圖像集的特徵共性,進而建立起已知類別-樣本圖像-特徵共性這三者之間的對應關係,並依據這種對應關係,讓電腦自主地搜尋(計算)出各個目標類別樣本圖像集的共性特徵或其平均量圖像。
在第二部分中,以第一部分中所獲得的每個目標類別的共 性特徵或其平均量圖像作為參與線上目標類別識別過程所使用的對照基準,從而對待分類圖像進行自動類別識別。如果借助其他方法已經獲得了每個目標類別樣本圖像集的共性特徵,則可以省略第一部分,而直接執行第二部分的自動識別過程。
以下將詳述每個部分的具體實施方式。
圖1為本發明的圖像目標類別識別方法中第一部分的主流程圖。
在第一部分中,主要目的在於讓電腦進行自主學習,從而自已知樣本圖像集中提取出每一類已知樣本圖像集的共性特徵。該第一部 分主要包括但不限於以下各步驟:圖像特徵提取步驟;聚類分析步驟;以及目標類別確定和共性特徵點集搜索步驟等(參見圖1)。
首先,已經借助人工或其他方式確定了N個(N為大於1 的自然數)已知類別的圖像集中的每個具體類別(例如電視、冰箱等),並且每個類別都有各自的圖像集。每個圖像集都包含至少一幅樣本圖像。由此可以構建出每個已知類別與各樣本圖像集乃至每幅圖像之間的對應關係(後文稱“已知類別-樣本圖像集對應關係表”)。
由於人眼對某一幅圖像的主觀判斷和識別過程與電腦對同 一幅圖像的判斷和識別原理完全不同,因此,兩者的識別結果可能相去甚遠。為了能夠讓電腦獲得與人眼類似的識別效果,需要首先對電腦進行“訓練”,讓它能“學會”自主地對圖像進行分類和識別。
為了訓練電腦自主地學習每個已知類別圖像集的共性特 徵,獲得對每一已知類別圖像的精確描述,本發明首先針對每一類樣本圖像集進行電腦分析,尋找(計算)出每一類已知樣本圖像集中每幅圖像的特徵描述。為此,本發明的第一部分可以包括但不限於如下步驟。
預處理步驟
在進行圖像分析之前,為了減少計算量和/或去除圖像中的雜訊,往往需要先對圖像進行必要的預處理。但預處理步驟並非是必須的,只要待分析的圖像能夠滿足特徵提取的要求,就可以省略該預處理步驟。請參見圖2,以彩色圖像為例,本實施例的圖像預處理步驟包括但不限於:對圖像進行等比縮放以減小計算量;利用濾波等手段去除部分或全部雜訊;以及灰度化處理等。而在處理黑白圖像時可以省略對圖像的灰度化處理等步驟。
具體的預處理步驟可以採取如下子步驟來實現:步驟S001:根據公式(1.1)完成彩色圖像的等比縮放:
其中W,H代表縮放前原圖像的寬度和高度,W 'H '代表等比縮放後圖像的寬度和高度,scale代表縮放比例,T是進行等比縮放的閾值。在本發明中,當以像素為單位時,可以設置閾值T [500,800]。經過多次試驗,發明人發現當閾值位於這個範圍內時,其結果最優;特別是,當T=600時,能夠將圖像縮放到合適的大小,且對進一步的影像處理和識別不會產生影響,同時還提高了計算的效率。
然後根據公式(1.2)對原圖像進行x方向的線性插值,再根據公式(1.3)進行y方向的線性插值,得到等比縮放後的圖像:
其中,R 1R 2表示進行X方向線性插值後的像素點,x、y、x1、y1、x2、y2都表示圖像中的像素點的座標,f(*,*)表示像素的顏色值,Q 11=(x 1,y 1),Q 12=(x 1,y 2),Q 21=(x 2,y 1),Q 22=(x 2,y 2),它們表示參與縮放計算的原圖像中的四個點,P表示經過Y方向線性插值後的點。在本實施例中,經過Y方向的線性插值之後即得到等比縮放後的圖像。
步驟S002:對經過步驟S001等比縮放後的圖像根據公式(1.4)進行如下的雙邊濾波處理:
其中f(x)為輸入圖像,h(x)為輸出圖像,c(ξ,x)度量臨 域中心x與其相鄰點ξ的幾何臨近程度,s(f(ξ),f(x))度量了臨域中心x與其相鄰點ξ像素的光度相似性,k為歸一化參數,在平滑的區域,雙邊濾波器表現為標準的網域濾波器,通過平滑處理過濾掉雜訊,例如去除掉圖像中顯著的突變孤立像素點等。
然後根據公式(1.5)對彩色輸入圖像進行灰度化操作。該步驟在不使用SIFT演算法時,可以省略。
Y=0.299*R+0.587*G+0.114*B (1.5)
其中Y表示當前像素在轉換後的像素值,R表示當前像素的紅色值,G表示當前像素的綠色值,B表示當前像素的藍色值。
可以採用現有技術中任何可以滿足圖像特徵提取要求的預處理方法或裝置來實現對圖像的任何形式的預處理。
特徵提取步驟S1
在選擇性地對圖像進行預處理之後,進入步驟S1(參見圖1及圖3):提取出每一類已知樣本圖像集中每幅圖像各自的特徵描述。
具體到本發明的實施例,可以採用底層視覺特徵提取的方法(參見圖3),提取出(步驟S101)每個樣本圖像集的每幅圖像中的每個關鍵特徵點並計算出(獲取)(步驟S102)每個關鍵特徵點的向量描述--即描述子。在本實施例中,以SIFT演算法為例描述了圖像底層視覺特徵的提取過程。
底層視覺特徵提取步驟可以通過以下幾個子步驟來實現:步驟S101:對經預處理後的圖像進行圖像底層視覺特徵的提取--例如,可以使用SIFT(Scale Invariant Feature Transform,尺度不變特性變換)演算法進行底層視覺特徵提取。SIFT演算法是由D.G.Lowe 1999年提出,2004年完善總結,論文發表在2004年的IJCV上:David G.Lowe,"Distinctive image features from scale-invariant kevpoints",International Journal of Computer Vision,60,2(2004),pp.91-110。在此通過引用和參考將其全部內容併入本文。
可以採用公知公用的方法來計算SIFT關鍵特徵點以及關鍵 特徵點的描述子(即特徵點的向量表達),而且步驟S101和S102可以在一個計算步驟或功能單元中一次完成。
通過底層視覺特徵的提取,電腦借助相應的演算法,例如 SIFT演算法,可以尋找(即計算)出每幅圖像中具有顯著特性的每個關鍵特徵點以及與之相應的描述子。隨後,基於先前已經建立的“已知類別-樣本圖像集”對應關係表,進一步建立(步驟S103)“已知類別-樣本圖像集-關鍵特徵點(即描述子)”三者之間的對應關係(參見表1)。依據該對應關係(表),電腦可以確定每個類別乃至每幅樣本圖像中所包含的關鍵特徵點及描述子的數量以及彼此之間的對應關係。該對應關係表也可以在計算每個關鍵特徵點的同時或之後建立,因此,步驟S103也可以和步驟S101和/或步驟S102並行或順次執行,並可以根據需要將該對應關係表存放在相應的記憶體中。
其中,C n 表示第n個目標類別,C 1...C n (n N);表示第n個目標類別中的第j幅圖像(j是目標類別C n 中圖像的數目);F nj1...F njf 表示每幅圖像I nj 中第f個SIFT關鍵特徵點,f為大於等於1的自然數。
在此,作為SIFT演算法的替選方案,還可以使用其他的圖 像特徵提取方法,例如SURF演算法或PCA(Principal Component Analysis)-SIFT演算法等,這些演算法均可以適用于本發明。
聚類分析步驟S2
在提取出每幅樣本圖像的特徵--底層視覺特徵之後,進入步驟S2(參見圖1):聚類分析步驟。對已經從所有類別的全部樣本圖像集中提取出的所有的關鍵特徵點(即描述子)進行聚類分析並構建樹狀結構。可以使用k叉樹的結構來構建該樹狀結構。步驟S2可以通過如下具體方法來實現,參見圖4。
借助聚類演算法,將已經獲得的所有目標類別的全部樣本圖像中包含的所有SIFT關鍵特徵點聚類為預定數量的簇(步驟S201)。聚類的過程就是自我調整地尋找出每個類別的普遍共性,同時也能將不同類別進行較大程度的區分。這裡可以採用公知公用的聚類演算法,例如k-means(k-均值)來實現。對於k-means聚類演算法,可以參見以下文獻:MacQueen,J.B.,Some methods for classification and analysis of multivariate observations,in Proc.5th Berkeley Symp.Mathematical Statistics and Probability,1967,pp.281-297.。還可以參見以下各網址中的詳細介紹,這些內容在此通過引用而併入本文。
1. http://www.cnblogs.com/jerrylead/archive/2011/04/06/2006910.html
2. http://wenku.***.com/view/179d21a4f524ccbff1218482.html
或者也可以採用其他聚類方法,只要能夠在空間上將相鄰的資料劃分為同一類別的聚類方法都可以適用于本發明。可替選的聚類演算法包括但不限於:k-modes演算法,k-Prototype演算法,分層次聚類法、最大距離樣本法、蟻群聚類演算法、模糊聚類演算法等。
在此,本發明以k-means演算法為例來描述聚類過程。k-means演算法根據預先設定的k值,將n個資料物件劃分為k個聚類,即k個簇,以便使得所獲得的聚類滿足:同一聚類中的物件相似度較高;而不 同聚類中的物件相似度較低。聚類相似度是借助各聚類中資料物件的均值所獲得的一個“中心物件”(引力中心)來進行計算的。例如,本發明中,已知並預先設定的目標類別數為N,則k的範圍為k(1,N),或k小於參與聚類的總特徵點數。在本實施例中選擇k(1,10),通常不大於10。k的選取,可以根據實際需求通過經驗或者試驗調整獲得的最佳值來確定。
k-means演算法的工作過程如下:首先從x個資料物件任意 選擇k個物件作為初始聚類中心;而對剩下的其它資料物件,則根據它們與這些聚類中心的相似度(空間距離),分別將它們分配給與其最相似的(空間距離最接近的)聚類中心。
具體到本發明的實施例來說,對從所有圖像中提取出的全 部關鍵特徵點的描述子的集合進行聚類分析。這裡,在k-means聚類的起始階段,可以先隨機地確定聚類中心,例如當選取k=2時,隨機地任意選擇兩個關鍵特徵點的描述子作為初始的聚類中心。可以通過計算新近加入的關鍵特徵點的描述子與預先選定的兩個初始聚類中心之間的歐式距離,將新近加入的關鍵特徵點的描述子歸屬到具有最小歐式距離的一類(即簇)中。如此,例如通過反覆運算的方法,遍歷所有的特徵點,直到所有的特徵點或描述子都參與了聚類為止,最終將提取出的全部關鍵特徵點分別以這兩個初始的聚類中心聚類為兩個簇。然後,分別對這兩個簇重新計算各簇中所有描述子的均值(描述子向量的均值),從而獲得新的聚類中心。進一步,將新獲得的聚類中心與之前(相鄰的前一次)的聚類中心進行比較,計算兩者之間的差(例如方差),當差值為0或達到預定的閾值時,則可以終止聚類的過程。否則,可以以當前反覆運算過程所確定的新的聚類中心作為下一次反覆運算的初始聚類中心來不斷地重新調整聚類中心。重複上述反覆運算或聚類過程,直到聚類中心不再變化或變化很小(即滿足預設的閾值)為止。
具體地,可以使用標準測度函數來確定反覆運算過程是否 滿足收斂條件,來判斷反覆運算過程是否可以終止。在本發明的實施例中,當k=2時,可以將標準測度函式定義為:對每個SIFT描述子分量與所得到的聚類中心描述子各對應分量之間差的絕對值求和,當總和大於某值或者聚類反覆運算次數大於預定的次數時,聚類反覆運算過程終止。
為了減少計算的時間複雜度,還可以選擇標準測度函數 為:計算每個類別當前的聚類中心與上一次聚類中心的差的絕對值,然後計算所有類別差的絕對值的和,當這個和小於某一閾值時,反覆運算終止。
可以在執行聚類演算法的同時或之後構建關鍵特徵點(或 描述子)的樹狀結構(步驟S202),即k叉樹的構建。因此,可以在具體實施例中將步驟S201和S202合併在一個步驟或功能模組中來實現步驟S2的聚類分析功能。
具體到一實施例,以k=2(即二叉樹)為例,將所有目標類 別的樣本圖像的底層視覺特徵--即上述實施例中的SIFT關鍵特徵點構成為二叉樹的根節點n1,並對n1中的所有關鍵特徵點進行如上所述的聚類分析。
將聚類後節點n1中關鍵特徵點數較多的聚類集合作為根節 點n1的左孩子n2,而將該節點中關鍵特徵點數較少的聚類集合作為n1的右孩子n3。以此類推,分別對n2和n3執行進一步的聚類分析,直到二叉樹的葉子節點數等於已知且預先設定的目標類別的總數N,即,使得最終葉子節點的數目為N。換句話說,將所有目標類別中的所有圖像的全部關鍵特徵點劃分為N個子集
以k=2為例,最終所構建的二叉樹結構圖如下所示:
假定經過步驟S2所構建的k叉樹的各節點的表達如下:ni(C 1,I 11,F 111...F 11f ,f 11,...,I 1j ,F 1j1...F 1jf ,f 1j ;...;C n ,I n1,F n11...F n1f ,f n1,...,I nj ,F nj1...F njf ,f nj )
其中ni表示k叉樹的第i個葉子節點,節點中所存儲的SIFT關鍵特徵點所表示的目標類別為C 1...C n (n N),每個目標類別中的圖像表示為I n1...I nj (j是目標類別C n 中圖像的數目),每幅圖像I nj 中聚類為節點ni的SIFT關鍵特徵點為F nj1...F njf ,f nj 為第n(1nN)個目標類別(即C n )中第j幅圖像中被聚類為第ni個葉子節點的SIFT關鍵特徵點數。
如此,已經將所有樣本圖像中的全部關鍵特徵點分配到或劃分成這N個葉子節點或子集中。這N個葉子節點之間彼此不含重複的關鍵特徵點,即兩兩葉子節點之間沒有交集,但每一葉子節點中可能混雜或包含了其他類別圖像的關鍵特徵點。
目標類別確定和共性特徵點集搜索步驟S3
為了能從各個節點ni中去除不屬於該類別的圖像,以便準確地限定樣本圖像的所屬類別,本發明還包括了確定目標類別和搜索每個目標類別中所包含的各圖像的共性特徵的步驟S3(參見圖1)。
以下將結合圖5描述步驟S3的具體實現方法或步驟。
步驟S3(目標類別的確定):結合在前面的步驟中已經獲得的“已知類別-樣本圖像集-關鍵特徵點及描述子”對應關係表,對前述步驟 S2中所獲得的樹狀結構的每個葉子節點或子集進行分析,確定每個葉子節點應當歸屬的類別,以便從中去除不屬於該目標類別的那些圖像。
具體實現過程如下:根據在先前的步驟中獲得的“已知類 別-樣本圖像集-關鍵特徵點或描述子對應關係(表1)”,對每個葉子節點分別計算或統計出分配在第ni個葉子節點中分屬於不同已知類別的SIFT關鍵特徵點總數(S301): class_number_SIFT(C n )=f n1+f n2+...+f nj
再次對照已知類別-樣本圖像集-關鍵特徵點及描述子對應關係,獲得每個葉子節點中SIFT關鍵特徵點總數最多的類別為: node_class_label(ni)=max(class_number_SIFT(C n ))
用該葉子節點中關鍵特徵點總數最多的類別標記或確定該目標類別C n (S302)。若該類別之前已經被標記或已經分配給了其他的葉子節點,則選擇SIFT關鍵特徵點總數次多的類別進行標記。以此類推,分別對每個葉子節點進行類別的標記。例如,假定某一葉子節點中所涉及的已知類別編號為1.5.8.9,這些相應類別中所對應包含的圖像SIFT特徵點總數分別為10.25.15.35,則根據SIFT特徵點總數排序後為9(35).5(25).8(15).1(10)。由此,將特徵點數最多的類別編號(即“9”)分配給或標記該葉子節點。但是,如果類別編號9已經在之前分配給了其它的葉子節點,那麼這裡就順次地將類別編號5(即關鍵特徵點總數次多)分配給當前的葉子節點,假設編號5也已經被分配給了其它的葉子節點,則選擇編號8標記該葉子節點。依此類推,直到對所有的葉子節點都進行了標記。
現在已經為每個目標類別C n 標記或確定了其所歸屬的類別,然而,在實際應用中,常常會出現目標類別的圖像子集中包含了不止一幅圖像,而且某幅樣本圖像包含了某些冗餘的特徵元素。例如,在已經 訓練獲得的“電腦”類的樣本圖像集中,與其他“電腦”樣本圖像不同的是,在其中的一幅“電腦”樣本圖像中還包含了“音箱”的冗餘特徵元素。即,在經過聚類分析的過程中,在每個目標類別中都不可避免地混入了某些不能代表該目標類別主要特徵的一些冗餘的關鍵特徵點或元素。此外,即使對於同一類別中的圖像,由於拍攝角度、光線等因素的干擾,使得對相同特徵點的描述也存在差異。而這些因素都會影響電腦對圖像的正確分類和自動識別。為此,電腦還必須明確每一類別圖像的共性特徵,以盡可能地消除這些干擾因素的影響。
為此,本發明進一步包括步驟S4:獲取每個目標類別C n 中 所包含的各圖像之間的共性特徵。
結合圖6描述步驟S4。具體地,步驟S4至少包括:提取出 每個目標類別C n 的各圖像之間具有共性特徵的共有特徵點的集合(以下稱共有特徵點集)(步驟S401)、和/或進一步借助“已知類別-樣本圖像集-關鍵特徵點及描述子”對應關係表映射出與這些共性特徵相對應的具有代表性的典型圖像(步驟S402),從而不僅能夠使得電腦明確每個目標類別C n 的共性特徵,為人工確認該目標類別C n 的電腦自主識別是否正確提供了依據,還能夠為此後的線上目標類別的精確識別提供更準確且最優化的比對基準,同時大大減少了計算量。
首先,選擇每個葉子節點中標記為類別C n 所對應的圖像 集,這個圖像集的表達方式如下: I(C n )={I n1,I n2,...,I nj }
步驟S401:尋找出每個目標類別C n 中的共性特徵。當選用圖像的底層視覺特徵作為圖像的描述時,可以通過選擇每個目標類別C n 中各幅圖像之間共有的關鍵特徵點的集合來表達該目標類別的共性特徵。為了減少計算或搜索量,可以通過如下步驟先確定每個目標類別C n 中需要搜 尋的共有特徵點的最少數量。
各圖像對應的SIFT關鍵特徵點以及特徵點數的數量表示如下:I(C n )={I n1,F n11...F n1f ,f n1,...,I nj ,F nj1...F njf ,f nj }
其中f nj 為圖像I nj 中被標記為C n 的SIFT關鍵特徵點的數量。
由於每一目標類別C n 中各幅圖像之間的共有特徵點的數量必然小於或等於具有最少特徵點數的那副圖像中所包含的特徵點的數量,因此可以通過如下簡化的方式來實現對共有特徵點數量最小值K(C n )的確定。例如,結合“已知類別-樣本圖像集-關鍵特徵點及描述子對應關係”,統計出每個目標類別C n 中每幅圖像被標記為類別C n 的SIFT關鍵特徵點數的數量,然後取其中的最小值:K(C n )=min(f n1,f n2,...,f nj )
由此可以先從數量上確定該目標類別(或圖像集I(C n ))中具有共性特徵的關鍵特徵點的數量範圍。然而,通過以上步驟僅僅能明確每個類別C n 中所包含的共有特徵點的數量,還無法確定這些特徵點以及它們各自所歸屬的圖像。
可以借助搜索演算法,例如可以採用KNN(k-Nearest Neighbor algorithm)最鄰近搜索演算法(Hastie,T.and Tibshirani,R.1996.Discriminant Adaptive Nearest Neighbor Classification.IEEE Trans.Pattern Anal.Mach.Intell.(TPAMI).18,6(Jun.1996),607-616.,在此通過引用併入本文),尋找出每個目標類別C n 中所包含各圖像之間具有共性特徵的共有特徵點集以及這些共有特徵點所對應的圖像集合。
以KNN搜索演算法為例的具體實現步驟如下。假設,在上述步驟中所獲得的代表圖像集I(C n )={I n1,I n2,...,I nj }中已經標記為類別C n 中所包含的所有SIFT特徵點集的向量中心為centre(C n )。可以通過計算代表圖像集中被標記的所有SIFT特徵點描述子的平均向量來獲得該向量中心:
計算(步驟S401)目標類別的代表圖像集中被標記的SIFT關鍵特徵點的描述子與向量中心centre(C n )的歐式距離Dis(F njf ,centre(C n ));可以採用公知公用的KNN最鄰近搜索演算法、或其他常用的排序演算法來獲得距離向量中心centre(C n )最近的K(C n )個SIFT關鍵特徵點,記為KNN(F),從而尋找出最靠近向量中心centre(C n )的K(C n )個特徵點。借助先前獲得的“已知類別-樣本圖像集-關鍵特徵點及描述子”對應關係,就可以確定並找到這K(C n )個關鍵特徵點以及它們分屬的各樣本圖像。
至此,通過以上演算法,就可以獲得每個目標類別C n 中包含的各幅圖像之間具有共性特徵的共有特徵點的集合(或稱目標類別C n 的共有特徵點集)。可以直接將這些集合作為後續步驟S5中的比對依據或基礎。
然而,有時為了驗證電腦自主學習的正確性,或者為了直觀地比對圖像等目的,需要找出對應於K(C n )個關鍵特徵點的各樣本圖像的集合或其最大子集。為此,本發明還包括步驟S402:基於已經在上述步驟中找出的K(C n )個關鍵特徵點和“已知類別-樣本圖像-特徵點對應關係”,從所述目標類別C n 的樣本圖像集中進一步尋找出包含所述K(C n )個特徵點的圖像的集合或其最大子集,從而將包含這K(C n )個關鍵特徵點最大子集的樣本圖像作為機器自主學習得到的該目標類別的平均量圖像或圖像集。
此外,但並非必要的是,還可以獲取這K(C n )個共有特徵點中距離該目標類別的向量中心centre(C n )的最小距離(min_dis(Cn)),以該最小距離作為後續步驟S5中用於界定比對圖像相似度閾值範圍的依據。其中 距離表示空間中各點之間的相近程度,而最小距離表示該圖像最能描述該目標類別的普遍共性。該最小距離表示為: min_dis(C n )=min(Dis(F njf ,centre(ni)))
通過以上第一部分的離線處理,借助對一定量的已知圖像進行離線樣本訓練,電腦已經自主地完成了對目標類別的識別過程,並從所有樣本圖像中提取出了每個目標類別C n 中所包含的各圖像之間具有共性特徵的共有特徵點的集合、以及相應的平均量圖像或圖像集。這些平均量圖像或圖像集將作為後面的線上目標類別識別(即第二部分)過程的基礎和依據。
第二部分:線上圖像識別和分類。圖7示出了步驟S5的一種實施方式。
在已經獲得了每個目標類別C n 中所包含的各圖像之間的共有特徵點集、或者相應的平均量圖像或圖像集之後,可以將該共有特徵點集或平均量圖像連接到相應的網路上或放在任何需要的平臺或位置,來進一步實現對待分類圖像的自動識別。
舉例來說,假設通過網路或通過其他手段獲得了一幅新的待分類圖像,該新的圖像還沒有被分類或被識別出所應歸屬的類別,而希望將該待分類的圖像自動歸類為上述已知的N類圖像(或N種商品)中。
為此,本發明首先對該新的待分類圖像執行與上述第一部分處理中的預處理步驟和圖像特徵提取步驟S1相同的處理。具體來說,參見圖7,可選地執行步驟S501:如果需要,則對該新的圖像執行與前述步驟S001-S003相同的預處理。
步驟S502:利用與第一部分的步驟S1中使用的相同的圖像特徵提取方法從該待分類的圖像中提取出底層視覺特徵,即提取出待分類的圖像的關鍵特徵點及描述子。
步驟S503:將待分類圖像與通過上述第一部分獲得的每個 目標類別的共性特徵進行比對,分別確定(計算)它們之間的相似度。隨後將待分類的圖像分配給(歸屬於)具有最大相似度的目標類別(步驟S504)。
具體來說,可以將所提取出的待分類的圖像的關鍵特徵點 及描述子與先前獲得的各目標類別的共有特徵點集直接比對、或與每個目標類別的平均量圖像中的關鍵特徵點進行比對,度量出待分類的圖像與每個樣本圖像之間的相似度,並將該待分類的圖像分配到具有最大相似度的類別中。
具體到本發明,如果使用的是SIFT演算法並利用歐式距離 來度量相似度,並且當選取各目標類別的共有特徵點集作為比對的基礎時,則將從待分類圖像中提取出的所有SIFT關鍵特徵點與各目標類別的共有特徵點集中包含的每個SIFT關鍵特徵點逐一地進行比對、計算它們之間的歐式距離Dis(F Ri ,F Ai ),其中F Ri 是待識別圖像中第i個SIFT關鍵特徵點,F Ai 是目標類別的共有特徵點集中的第i個SIFT關鍵特徵點。
直接選取各目標類別的共有特徵點集作為比對基礎的優點 在於,可以大大減少計算量,縮短計算時間。然而,問題在於,由於共有特徵點集是對該目標類別共有特性的精煉化的描述,因此,很可能去除了大量本應當屬於該類別的特徵點。例如,由於拍攝角度、光線等因素的干擾,使得對圖像中本屬於相同特徵的特徵點的描述存在差異,而這些特徵點並未納入共有特徵點集中,進而會影響到電腦對待分類圖像的正確分類和識別。
因此,本發明優選的是將待分類圖像與每個目標類別的平 均量圖像或圖像集進行比較,而不是使用各目標類別的共有特徵點集作為比對基礎。這時將從待分類圖像中提取出的所有SIFT關鍵特徵點與各目標類別中的平均量圖像中每幅圖像中的全部SIFT關鍵特徵點(即每幅圖像中 的關鍵特徵點的全集)逐一進行比對、並計算它們之間的歐式距離Dis(F Ri ,F Ai ),其中F Ri 是待識別圖像中第i個SIFT關鍵特徵點,F Ai 是目標類別的平均量圖像中第i個SIFT關鍵特徵點。
隨後統計滿足閾值條件的關鍵特徵點的數目,滿足預定條件的特徵點數最多的類別即可以確定為該待分類圖像所歸屬的類別。
具體實現過程可以表示如下:
(1)對於第n個目標類別C n ,若Dis(F Ri ,F Ai )<T1,其中T1為預設的閾值,則該類別的得分值score(C n )加1,其中T1=ε*min_dis(C n )。在此,ε表示權重,該權重值主要是為了減少計算量而設定的,因此權重值ε並非是必要的,只要計算量不是很大,就可以省略ε;而min_dis(Cn)是先前在步驟S402之後獲得的距離向量中心centre(C n )的最小距離。本發明中是根據實驗獲取權重ε的最佳值。實驗的過程中發現當ε [1.5,2.3]時,達到的效果較好。在本發明的更優選實施例中,當選取ε=1.8時,能得到較高的識別精度。
(2)而後對每個目標類別,若score(C n )>K(C n )時,則該類別即作為待識別圖像的候選識別類別。最後對score(C n )進行降冪排列,排在最前面的目標列別即為待識別圖像中目標物件的類別。
還可以選用以其他方式預先設定或獲取的其他最小距離來替換與向量中心centre(C n )的最小距離min_dis(Cn),作為上述距離比較的基準。例如,可以選取待分類圖像中的每個特徵點與共有特徵點集中的每個特徵點或平均量圖像中的每個特徵點中歐式距離Dis(F Ri ,F Ai )的最小值來替換min_dis(Cn),該最小值可以為0或非零的值。
只要能夠精確地度量出圖像之間的相似度,也可以使用其他度量圖像相似度的方法。例如,可以選擇馬氏距離、城市距離等來替換前面提及的歐氏距離計算方法。
圖8示出了本發明相應的圖像目標類別識別裝置實施方式 的一個實施例。該圖像目標類別識別裝置1包括:圖像特徵提取單元2,被構造為利用特徵點提取方法提取出已知N個類別中的所有樣本圖像的特徵點,其中N為大於1的自然數,每一類別都包含至少一幅樣本圖像,並建立已知類別-樣本圖像-特徵點對應關係;聚類分析單元3,被構造為利用聚類演算法對提取出的全部特徵點進行聚類分析,並將這些特徵點劃分為N個子集;確定單元4,被構造為為每個所述子集確定目標類別C n ;獲取單元5,利用搜索演算法搜尋出每個目標類別C n 中所包含的各圖像之間的共性特徵,其中C n 為第n個目標類別,n為小於等於N的正整數。
此外,所述確定單元4被構造為至少包括以下模組:統計模組41,用於對所述N個子集的每個子集中分屬於不同已知類別的特徵點的數量進行統計;以及確定模組42,將包含特徵點數最多的已知類別確定為該目標類別C n
獲取單元5被構造為至少包括以下模組:搜索模組51,用於借助搜索演算法尋找出每個目標類別C n 中所包含的各圖像之間具有共性特徵的所述共有特徵點集,從而去除不屬於該目標類別C n 的冗餘特徵點。
優選地,所述獲取單元5還被構造為包括:映射模組52,用於借助所述已知類別-樣本圖像-特徵點對應關係,從所述每個目標類別C n 中映射出包含所述共有特徵點集中的共有特徵點的數量最多的那些樣本圖像,將這些圖像作為該目標類別C n 的平均量圖像。
圖9示出了一個具體的圖像識別的示意性比對結果,其中包含了人工和電腦識別結果。本發明第一部分的圖像目標類別識別過程與之類似。其中最上排從左至右的三個方框所代表的區域分別是:1.需要電腦自主進行目標類別識別的圖像(包含背景的飛機),2.人工識別該圖像的 類別及特徵(關鍵字)提取結果,3.通過電腦演算法自主學習而識別出的目標類別及相應的特徵(關鍵字)提取結果。
圖10示出了包括本發明上述圖像目標類別識別裝置的圖像 識別系統100的一種示例性實施方式的框圖。該系統100至少包括:圖像特徵提取單元200、聚類分析單元300、確定單元400、以及獲取單元500,其中確定單元400可以包括至少如下功能模組:統計模組和確定模組。獲取單元可以包括至少:搜索模組和/或映射模組等。這些單元或模組分別實現了如圖8中所示的各單元的功能,在此不再重複說明。
此外,為了實現本發明第二部分的自動類別識別功能,上 述圖像識別系統100還可以包括:比對計算單元600,利用圖像相似度度量演算法將由所述圖像特徵提取單元200從待分類圖像中提取出的特徵點與每個目標類別中的共用特徵點集或與每個目標類別的平均量圖像中的各特徵點逐一比對,計算待分類圖像中的特徵點與每個目標類別中的特徵點之間的相似度;以及歸類單元700,用於將待分類的圖像歸屬於具有最大相似度的目標類別C n
所述系統100至少包括一處理器,所述處理器可以被程式 設計用以執行上述所述的圖像目標類別識別方法。或者所述處理器可以包含實現上述各功能模組和/或這些功能模組之間的組合的軟體、固件或硬體和/或它們的組合。
本發明的實施例已經在Windows提供的visual studio 2010編 譯平臺完全實現。可以用於網路行銷等目的的應用,或者其他需要對圖像進行分類的應用中。
以上所述僅為本發明的優選實施例,並非用以限制本發 明,凡在本發明的精神和原則之內所作的任何修改、等同替換和改進等,均應包含在本發明的保護範圍之內。
S1~S4‧‧‧步驟

Claims (15)

  1. 一種圖像目標類別識別方法,包括如下步驟:(S1)圖像特徵提取,利用特徵點提取方法提取出已知N個類別中所有樣本圖像的特徵點,其中N為大於1的自然數,每一類別都包含至少一幅樣本圖像,並建立已知類別-樣本圖像-特徵點對應關係;(S2)聚類分析,利用聚類演算法對提取出的全部特徵點進行聚類分析,並將這些特徵點劃分為N個子集;(S3)確定目標類別,為每個所述子集確定目標類別C n ;(S4)獲取共性特徵,利用搜索演算法獲取每個目標類別C n 中的各圖像之間的共性特徵,其中C n 為第n個目標類別,n為小於等於N的正整數;其中,所述步驟S4至少包括如下子步驟:S401:借助搜索演算法搜尋出每個目標類別C n 中所包含的各圖像之間具有共性特徵的共有特徵點集;以及S402:借助所述已知類別-樣本圖像-特徵點對應關係,根據搜尋出的所述共有特徵點集,從所述每個目標類別C n 中進一步映射出包含所述共有特徵點集中的共有特徵點的數量最多的那些樣本圖像,將這些樣本圖像作為該目標類別C n 的平均量圖像。
  2. 如請求項1所述的方法,其中,所述步驟S1至少包括如下子步驟:S101,提取每幅樣本圖像的底層視覺特徵中的所述特徵點;S102,獲取每個所述特徵點的向量描述;S103,建立已知類別-樣本圖像-特徵點對應關係。
  3. 如請求項2所述的方法,其中,所述步驟S2至少包括如 下子步驟:S201:借助所述聚類演算法將提取出的所有特徵點聚類為預定數量的簇;S202:將這些簇構建為k叉樹結構,其中k為正整數,且k(1,N)。
  4. 如請求項3所述的方法,其中,所述步驟S3至少包括如下子步驟:S301:對所述N個子集的每個子集中分屬於不同已知類別的特徵點的數量進行統計;S302:將包含特徵點數最多的已知類別確定為該目標類別C n
  5. 如請求項4所述的方法,其中所述共有特徵點集中的共有特徵點的數量(K(C n ))是根據該目標類別C n 中具有最少特徵點數的圖像的特徵點數來確定的。
  6. 如請求項1-5之任一項所述的方法,其中在步驟S4之後還包括:線上圖像識別和分類步驟S5,用於對待分類的圖像進行識別和自動分類,所述線上圖像識別和分類步驟S5包括:S502:對待分類的圖像執行如步驟S1同樣的圖像特徵提取處理,提取出待分類圖像的特徵點;S503:將所提取出的待分類圖像中的特徵點與所述n個目標類別中的所述每個目標類別C n 的每個所述共性特徵進行比對,分別計算出待分類圖像與每個目標類別之間的相似度;S504:將待分類的圖像歸屬於具有最大相似度的目標類別 C n
  7. 如請求項1-5之任一項所述的方法,其中在所述步驟S4之後還包括:線上圖像識別和分類步驟S5,用於對待分類的圖像進行識別和自動分類,所述線上圖像識別和分類步驟S5包括:S502:對待分類的圖像執行如步驟S1同樣的圖像特徵提取處理,提取出待分類圖像的特徵點;S503’:將所提取出的待分類圖像中的各特徵點與所述目標類別的平均量圖像中的各特徵點進行逐一比對,計算待分類圖像與每個目標類別的平均量圖像之間的相似度;S504:將待分類的圖像歸屬於具有最大相似度的目標類別C n
  8. 如請求項1-5之任一項所述的方法,其中,在步驟S1之前還包括對每幅圖像進行圖像預處理的步驟,所述圖像預處理步驟包括:S001,對圖像進行等比縮放;S002,對等比縮放後的圖像進行濾波處理,以去除雜訊;S003,對濾波處理後的圖像進行灰度化處理。
  9. 如請求項1-5之任一項所述的方法,其中,所述特徵點提取方法是SIFT演算法,通過SIFT演算法提取出每幅圖像的SIFT關鍵特徵點以及各個關鍵特徵點的SIFT描述子;所述聚類演算法是k-means演算法,並通過構建k叉樹來將所述關鍵特徵點劃分為所述N個子集,其中k為正整數,且k (1,N);所述搜索演算法是KNN最鄰近搜索演算法。
  10. 一種圖像目標類別識別裝置,包括:圖像特徵提取單元,被構造為:利用特徵點提取方法提取出已知N個類別中的所有樣本圖像的特徵點,其中N為大於1的自然數,每一類別都包含至少一幅樣本圖像,並建立已知類別-樣本圖像-特徵點對應關係;聚類分析單元,被構造為:利用聚類演算法對提取出的全部特徵點進行聚類分析、並將這些特徵點劃分為N個子集;確定單元,為每個所述子集確定目標類別C n 獲取單元,利用搜索演算法搜獲取每個目標類別C n 中包含各圖像之間的共性特徵,其中C n 為第n個目標類別,n為小於等於N的正整數;其中,獲取單元至少包括以下子模組:搜索模組,用於借助搜索演算法搜尋出每個目標類別C n 中所包含的各圖像之間具有共性特徵的共有特徵點集;以及映射模組,用於借助所述已知類別-樣本圖像-特徵點對應關係,從所述每個目標類別C n 中映射出包含所述共有特徵點集中的共有特徵點的數量最多的那些樣本圖像,將這些圖像作為該目標類別C n 的平均量圖像。
  11. 如請求項10所述的裝置,其中,確定單元至少包括以下子模組:統計模組,用於對所述N個子集的每個子集中分屬於不同已知類別的特徵點的數量進行統計; 確定模組,將包含特徵點數最多的已知類別確定為該目標類別C n
  12. 一種利用如請求項1所述的圖像目標類別識別方法對待分類圖像進行自動分類的方法,包括如下步驟:提取步驟,對待分類的圖像經歷與所述步驟S1相同的處理,提取出待分類圖像的底層視覺特徵;比對計算步驟,利用圖像相似度度量演算法將所提取出的待分類圖像中的各特徵點與每個目標類別中的共用特徵點集或與每個目標類別的平均量圖像中的各特徵點逐一進行比對,計算待分類圖像中的特徵點與每個目標類別中的特徵點之間的相似度;歸類步驟,將待分類的圖像歸屬於具有最大相似度的目標類別。
  13. 一種圖像識別系統,至少包括處理器,所述處理器被構造為至少包括如下功能單元:圖像特徵提取單元,被構造為利用特徵點提取方法提取出已知N個類別中的所有樣本圖像的特徵點,其中N為大於1的自然數,每一類別都包含至少一幅樣本圖像,並建立已知類別-樣本圖像-特徵點對應關係;聚類分析單元,被構造為利用聚類演算法對提取出的全部特徵點進行聚類分析,將這些特徵點劃分為N個子集;確定單元,為每個所述子集確定目標類別C n ;獲取單元,利用搜索演算法搜尋出每個目標類別C n 中包含各圖像之間的共性特徵,其中C n 為第n個目標類別,n為小於等於N的正整數; 其中,所述獲取單元被構造為至少包括以下模組:搜索模組,用於借助搜索演算法尋找出每個目標類別C n 中所包含的各圖像之間具有共性特徵的所述共有特徵點集;以及映射模組,借助所述已知類別-樣本圖像-特徵點對應關係,根據搜索出的所述共有特徵點集,從所述每個目標類別C n 中進一步映射出包含所述共有特徵點集中的共有特徵點的數量最多的那些樣本圖像,將這些樣本圖像作為該目標類別C n 的平均量圖像。
  14. 如請求項13所述的系統,其中,所述確定單元被構造為至少包括以下模組:統計模組,用於對所述N個子集的每個子集中分屬於不同目標類別C n 的特徵點的數量進行統計;確定模組,以包含特徵點數最多的目標類別標記該目標類別C n
  15. 如請求項13-14之任一項所述的系統,其中所述圖像特徵提取單元還用於提取待分類圖像中的特徵點;所述處理器被構造為還包括:比對計算單元,利用圖像相似度度量演算法將所提取出的待分類圖像中的各特徵點與每個目標類別中的共用特徵點集或與每個目標類別的平均量圖像中的各特徵點逐一進行比對,計算待分類圖像中的特徵點與每個目標類別中的特徵點之間的相似度;以及歸類單元:用於將待分類的圖像歸屬於具有最大相似度的目 標類別C n
TW103137992A 2013-11-04 2014-11-03 圖像目標類別識別方法及裝置 TWI537841B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310537562.5A CN103559504B (zh) 2013-11-04 2013-11-04 图像目标类别识别方法及装置

Publications (2)

Publication Number Publication Date
TW201523462A TW201523462A (zh) 2015-06-16
TWI537841B true TWI537841B (zh) 2016-06-11

Family

ID=50013745

Family Applications (1)

Application Number Title Priority Date Filing Date
TW103137992A TWI537841B (zh) 2013-11-04 2014-11-03 圖像目標類別識別方法及裝置

Country Status (7)

Country Link
US (1) US10013636B2 (zh)
CN (1) CN103559504B (zh)
AU (1) AU2014344497B2 (zh)
CA (1) CA2929180C (zh)
RU (1) RU2648946C2 (zh)
TW (1) TWI537841B (zh)
WO (1) WO2015062384A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI822162B (zh) * 2021-12-10 2023-11-11 日商鎧俠股份有限公司 資訊處理裝置以及控制資訊處理裝置的方法

Families Citing this family (59)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103559504B (zh) * 2013-11-04 2016-08-31 北京京东尚科信息技术有限公司 图像目标类别识别方法及装置
CN103868935A (zh) * 2014-02-14 2014-06-18 中国科学院合肥物质科学研究院 基于计算机视觉的烟支外观质量检测方法
WO2015197029A1 (zh) * 2014-06-27 2015-12-30 北京奇虎科技有限公司 一种人脸相似度识别方法和***
US10031928B2 (en) * 2014-07-02 2018-07-24 BicDroid Inc. Display, visualization, and management of images based on content analytics
CN104778951A (zh) * 2015-04-07 2015-07-15 华为技术有限公司 语音增强的方法和装置
CN106203461B (zh) * 2015-05-07 2020-02-25 ***通信集团公司 一种图像处理方法及装置
CN105021888B (zh) * 2015-07-06 2018-09-18 广州供电局有限公司 基于数据聚类的谐波数据监测方法
CN106649296B (zh) * 2015-07-20 2020-07-14 阿里巴巴集团控股有限公司 提供拍照提示信息、业务对象搜索方法及装置
CN106909931B (zh) * 2015-12-23 2021-03-16 阿里巴巴集团控股有限公司 一种用于机器学习模型的特征生成方法、装置和电子设备
US11157798B2 (en) 2016-02-12 2021-10-26 Brainchip, Inc. Intelligent autonomous feature extraction system using two hardware spiking neutral networks with spike timing dependent plasticity
CN107229518B (zh) * 2016-03-26 2020-06-30 阿里巴巴集团控股有限公司 一种分布式集群训练方法和装置
CN105975971A (zh) * 2016-04-22 2016-09-28 安徽大学 一种低内存的图像特征描述算法
CN106096009A (zh) * 2016-06-23 2016-11-09 北京小米移动软件有限公司 消息生成方法及装置
CN106354850A (zh) * 2016-08-31 2017-01-25 广州精点计算机科技有限公司 一种基于k‑近邻分类的图像识别方法
CN106650580B (zh) * 2016-09-23 2020-04-17 南京理工大学 基于图像处理的货架快速清点方法
US10860898B2 (en) * 2016-10-16 2020-12-08 Ebay Inc. Image analysis and prediction based visual search
CN106599051B (zh) * 2016-11-15 2020-02-07 北京航空航天大学 一种基于生成图像标注库的图像自动标注的方法
US11205103B2 (en) 2016-12-09 2021-12-21 The Research Foundation for the State University Semisupervised autoencoder for sentiment analysis
CN108229509B (zh) * 2016-12-16 2021-02-26 北京市商汤科技开发有限公司 用于识别物体类别的方法及装置、电子设备
CN108230232B (zh) * 2016-12-21 2021-02-09 腾讯科技(深圳)有限公司 一种图像处理的方法以及相关装置
TWI614723B (zh) * 2016-12-29 2018-02-11 大仁科技大學 基於人體動作影像的分析系統
CN106778914A (zh) * 2017-01-16 2017-05-31 湖南财政经济学院 一种大数据图像分类方法
US10534964B2 (en) * 2017-01-30 2020-01-14 Blackberry Limited Persistent feature descriptors for video
US11151441B2 (en) 2017-02-08 2021-10-19 Brainchip, Inc. System and method for spontaneous machine learning and feature extraction
CN108460389B (zh) 2017-02-20 2021-12-03 阿里巴巴集团控股有限公司 一种识别图像中对象的类型预测方法、装置及电子设备
CN108288208B (zh) 2017-08-11 2020-08-28 腾讯科技(深圳)有限公司 基于图像内容的展示对象确定方法、装置、介质及设备
CN108304435B (zh) * 2017-09-08 2020-08-25 腾讯科技(深圳)有限公司 信息推荐方法、装置、计算机设备及存储介质
CN109558887A (zh) * 2017-09-27 2019-04-02 北京京东尚科信息技术有限公司 一种预测行为的方法和装置
TWI647658B (zh) * 2017-09-29 2019-01-11 樂達創意科技有限公司 影像特徵自動辨識裝置、系統及方法
CN107748899B (zh) * 2017-11-03 2020-09-11 哈尔滨工业大学深圳研究生院 一种基于lstm的二维图像的目标类别判识方法
US11042975B2 (en) * 2018-02-08 2021-06-22 Flaschebottle Technologies Inc. Estimating a number of containers by digital image analysis
CN110622213B (zh) * 2018-02-09 2022-11-15 百度时代网络技术(北京)有限公司 利用3d语义地图进行深度定位和分段的***和方法
CN108737379A (zh) * 2018-04-19 2018-11-02 河海大学 一种大数据传输处理算法
US11409985B2 (en) * 2018-04-30 2022-08-09 Bank Of America Corporation Computer architecture for emulating a correlithm object converter in a correlithm object processing system
US11615208B2 (en) 2018-07-06 2023-03-28 Capital One Services, Llc Systems and methods for synthetic data generation
CN109190748B (zh) * 2018-09-14 2021-09-17 上海哥瑞利软件股份有限公司 一种cp测试探针最佳路径的算法
CN109472307A (zh) * 2018-11-07 2019-03-15 郑州云海信息技术有限公司 一种训练图像分类模型的方法和装置
CN109455527B (zh) * 2018-11-29 2021-02-02 合肥泰禾智能科技集团股份有限公司 一种货物拆垛方法及装置
CN111382760B (zh) * 2018-12-28 2023-08-25 Tcl科技集团股份有限公司 图片类别的识别方法、装置及计算机可读存储介质
CN111382635B (zh) * 2018-12-29 2023-10-13 杭州海康威视数字技术股份有限公司 一种商品类别识别方法、装置及电子设备
CN111626082A (zh) * 2019-02-28 2020-09-04 佳能株式会社 检测装置和方法及图像处理装置和***
CN110097011A (zh) * 2019-05-06 2019-08-06 北京邮电大学 一种信号识别方法及装置
CN110119815B (zh) * 2019-05-21 2021-08-13 深圳市腾讯网域计算机网络有限公司 模型训练方法、装置、存储介质及设备
US10998007B2 (en) * 2019-09-30 2021-05-04 Adobe Inc. Providing context aware video searching
CN112696372A (zh) * 2019-10-22 2021-04-23 佛山市云米电器科技有限公司 风扇调节方法、风扇和存储介质
CN110888638A (zh) * 2019-10-24 2020-03-17 泰康保险集团股份有限公司 一种用于绘制互联网界面的方法和***
US11816149B2 (en) * 2020-02-11 2023-11-14 Samsung Electronics Co., Ltd. Electronic device and control method thereof
RU2737600C1 (ru) * 2020-03-19 2020-12-01 Общество с ограниченной ответственностью «ИНСПЕКТОР КЛАУД» Способ сбора размеченного набора данных
WO2021189328A1 (zh) * 2020-03-25 2021-09-30 华为技术有限公司 一种雷达目标聚类方法及装置
US11709917B2 (en) * 2020-05-05 2023-07-25 Nanjing University Point-set kernel clustering
CN113627455A (zh) * 2020-05-09 2021-11-09 阿里巴巴集团控股有限公司 图像类别确定方法及装置
CN111723820A (zh) * 2020-06-10 2020-09-29 中天智导科技有限公司 一种图像处理方法及装置
CN111860588B (zh) * 2020-06-12 2024-06-21 华为技术有限公司 一种用于图神经网络的训练方法以及相关设备
US11645733B2 (en) 2020-06-16 2023-05-09 Bank Of America Corporation System and method for providing artificial intelligence architectures to people with disabilities
CN111898550B (zh) * 2020-07-31 2023-12-29 平安科技(深圳)有限公司 建立表情识别模型方法、装置、计算机设备及存储介质
CN112364843A (zh) * 2021-01-11 2021-02-12 中国科学院自动化研究所 插拔式航拍图像目标定位检测方法、***、设备
CN112766427A (zh) * 2021-04-06 2021-05-07 浙江口碑网络技术有限公司 图像识别模型的训练方法、装置及设备
CN112886589B (zh) * 2021-04-09 2022-09-20 华中科技大学 基于社区挖掘的供电分区方法、***、终端、介质及配电网
CN115223018B (zh) * 2022-06-08 2023-07-04 东北石油大学 伪装对象协同检测方法及装置、电子设备和存储介质

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6895104B2 (en) * 2001-02-16 2005-05-17 Sac Technologies, Inc. Image identification system
US7580952B2 (en) * 2005-02-28 2009-08-25 Microsoft Corporation Automatic digital image grouping using criteria based on image metadata and spatial information
JP5365065B2 (ja) * 2008-05-13 2013-12-11 富士通株式会社 辞書作成装置
CN102077580B (zh) * 2009-04-30 2013-11-06 索尼公司 显示控制设备、显示控制方法
JP5588165B2 (ja) * 2009-12-24 2014-09-10 キヤノン株式会社 画像処理装置、画像処理方法およびプログラム
CN101807259B (zh) * 2010-03-25 2012-08-22 复旦大学 一种基于视觉词汇本集体的不变性识别方法
CN101833672B (zh) * 2010-04-02 2012-02-29 清华大学 基于约束采样与形状特征的稀疏表示人脸识别方法
US9317783B2 (en) * 2010-06-01 2016-04-19 Hewlett-Packard Development Company, L.P. Clustering images
WO2012006578A2 (en) * 2010-07-08 2012-01-12 The Regents Of The University Of California End-to-end visual recognition system and methods
US20120082385A1 (en) * 2010-09-30 2012-04-05 Sharp Laboratories Of America, Inc. Edge based template matching
US9026536B2 (en) * 2010-10-17 2015-05-05 Canon Kabushiki Kaisha Systems and methods for cluster comparison
CN102073738B (zh) * 2011-01-20 2013-04-17 清华大学 基于智能检索视图选择的三维对象检索方法和装置
US8374386B2 (en) * 2011-01-27 2013-02-12 Polytechnic Institute Of New York University Sensor fingerprint matching in large image and video databases
US8712157B2 (en) * 2011-04-19 2014-04-29 Xerox Corporation Image quality assessment
CN102609719B (zh) * 2012-01-19 2013-07-31 北京工业大学 基于改进概率主题模型的地点图像识别方法
CN102663092B (zh) * 2012-04-11 2015-01-28 哈尔滨工业大学 一种基于服装组图的风格元素挖掘和推荐方法
US8837820B2 (en) * 2012-05-25 2014-09-16 Xerox Corporation Image selection based on photographic style
CN102968618A (zh) * 2012-10-24 2013-03-13 浙江鸿程计算机***有限公司 一种融合BoF模型和谱聚类算法的静态手势识别方法
CN102930296B (zh) * 2012-11-01 2015-08-26 长沙纳特微视网络科技有限公司 一种图像识别方法及装置
CN103345645B (zh) * 2013-06-27 2016-09-28 复旦大学 面向网购平台的商品图像类别预测方法
CN103559504B (zh) 2013-11-04 2016-08-31 北京京东尚科信息技术有限公司 图像目标类别识别方法及装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI822162B (zh) * 2021-12-10 2023-11-11 日商鎧俠股份有限公司 資訊處理裝置以及控制資訊處理裝置的方法

Also Published As

Publication number Publication date
TW201523462A (zh) 2015-06-16
AU2014344497B2 (en) 2018-07-05
WO2015062384A1 (zh) 2015-05-07
CA2929180C (en) 2020-09-22
CA2929180A1 (en) 2015-05-07
RU2648946C2 (ru) 2018-03-28
RU2016122051A (ru) 2017-12-11
CN103559504B (zh) 2016-08-31
US10013636B2 (en) 2018-07-03
AU2014344497A1 (en) 2016-05-26
CN103559504A (zh) 2014-02-05
US20160267359A1 (en) 2016-09-15

Similar Documents

Publication Publication Date Title
TWI537841B (zh) 圖像目標類別識別方法及裝置
US10438091B2 (en) Method and apparatus for recognizing image content
CN108132968B (zh) 网络文本与图像中关联语义基元的弱监督学习方法
CN111079639B (zh) 垃圾图像分类模型构建的方法、装置、设备及存储介质
CN106682696B (zh) 基于在线示例分类器精化的多示例检测网络及其训练方法
CN104966104B (zh) 一种基于三维卷积神经网络的视频分类方法
CN111126482B (zh) 一种基于多分类器级联模型的遥感影像自动分类方法
CN109086654B (zh) 手写模型训练方法、文本识别方法、装置、设备及介质
JP6897749B2 (ja) 学習方法、学習システム、および学習プログラム
WO2014205231A1 (en) Deep learning framework for generic object detection
WO2022062419A1 (zh) 基于非督导金字塔相似性学习的目标重识别方法及***
CN109033978B (zh) 一种基于纠错策略的cnn-svm混合模型手势识别方法
US20200320440A1 (en) System and Method for Use in Training Machine Learning Utilities
CN110008365B (zh) 一种图像处理方法、装置、设备及可读存储介质
CN110796260B (zh) 一种基于类扩张学习的神经网络模型优化方法
CN104077408B (zh) 大规模跨媒体数据分布式半监督内容识别分类方法及装置
CN109255377A (zh) 仪器识别方法、装置、电子设备及存储介质
US11983171B2 (en) Using multiple trained models to reduce data labeling efforts
Khelifi et al. Mc-SSM: nonparametric semantic image segmentation with the ICM algorithm
Villamizar et al. Online learning and detection of faces with low human supervision
CN111353538B (zh) 基于深度学习的相似图像匹配方法
CN114022698A (zh) 一种基于二叉树结构的多标签行为识别方法及装置
JP2020181265A (ja) 情報処理装置、システム、情報処理方法及びプログラム
US20230289531A1 (en) Deep Learning Systems and Methods to Disambiguate False Positives in Natural Language Processing Analytics
CN113505783B (zh) 基于少次学习的甲骨文单字识别方法和装置