TWI677852B

TWI677852B - 一種圖像特徵獲取方法及裝置、電子設備、電腦可讀存儲介質

Info

Publication number: TWI677852B
Application number: TW107110540A
Authority: TW
Inventors: 康麗萍; Liping Kang
Original assignee: 大陸商北京三快在線科技有限公司; Beijing Sankuai Online Technology Co., Ltd
Priority date: 2017-07-20
Filing date: 2018-03-27
Publication date: 2019-11-21
Also published as: JP6862579B2; TW201909112A; JP2020522077A; CN107688823A; KR20190140031A; CA3066029A1; WO2019015246A1; US20200293840A1; CN107688823B; EP3657392A4; US11282295B2; KR102252081B1; EP3657392A1

Abstract

本申請提供了一種圖像特徵獲取方法及相應的裝置。根據所述方法的一個示例，可利用預設類別的訓練圖像訓練分類模型，並可基於所述訓練圖像確定相似圖像對；通過利用驗證圖像對所述分類模型的分類結果進行測試，可確定所述不相似圖像對；基於所述相似圖像對和所述不相似圖像對，優化所述分類模型。這樣，可以通過優化後的所述分類模型來獲取圖像的特徵。

Description

一種圖像特徵獲取方法及裝置、電子設備、電腦可讀存儲介質

本申請涉及圖像特徵的獲取。

產品的圖像特徵可用於業務邏輯或參與相關模型的訓練，在檢索、推薦等不同業務中獲得了廣泛應用。獲取產品的圖像特徵的主要方法是分類模型訓練。例如，可將分類模型的特徵表達層提取的特徵作為圖像特徵。在產品圖像所屬類別的數目較大的情況下，分類模型的準確率降低，從而使得所提取的圖像特徵對不同類別產品圖像的表達能力可能減弱。

本申請提供一種方法，以儘量提高所獲取的圖像特徵對圖像的表達能力。

為了解決上述問題，根據本發明的第一方面，提供了一種圖像特徵獲取方法，包括：利用預設類別的訓練圖像訓練分類模型；通過利用驗證圖像對所述分類模型的分類結果進行測試，來確定不相似圖像對；基於所述訓練圖像確定相似圖像對；基於所述相似圖像對和所述不相似圖像對，優化所述分類模型；利用所述優化後分類模型獲取圖像特徵。

根據本發明的第二方面，提供了一種圖像特徵獲取裝置，包括：分類模型訓練模組，用於利用預設類別的訓練圖像訓練分類模型；不相似圖像對確定模組，用於通過利用驗證圖像對所述分類模型訓練模組訓練出的分類模型的分類結果進行測試，確定不相似圖像對；相似圖像對確定模組，用於基於所述訓練圖像確定相似圖像對；分類模型優化模組，用於基於所述相似圖像對和所述不相似圖像對，優化所述分類模型；圖像特徵獲取模組，用於利用優化後的所述分類模型獲取圖像特徵。

根據本發明的協力廠商面，提供了一種電子設備，包括記憶體、處理器及存儲在所述記憶體上並可在處理器上運行的電腦程式，其特徵在於，所述處理器執行所述電腦程式時實現上述圖像特徵獲取方法。

根據本發明的第四方面，提供了一種電腦可讀存儲介質，其上存儲有電腦程式，其特徵在於，該程式被處理器執行時實現上述圖像特徵獲取方法的步驟。

本發明實施例公開的圖像特徵獲取方法，通過利用預設類別的訓練圖像來訓練分類模型，並利用所述訓練圖像確定相似圖像對；利用驗證圖像對所述分類模型的分類結果進行測試，以確定所述分類模型相對容易混淆的不相似圖像對；基於所述相似圖像對和不相似圖像對，優化所述分類模型，並利用優化後的所述分類模型獲取圖像特徵，可有效提高所獲取的圖像特徵的圖像表達能力。通過基於初步訓練的分類模型對驗證圖像的分類結果來確定容易混淆的產品圖像類別，並基於容易混淆的產品圖像類別構建不相似圖像對，使得可以結合相似圖像對和不相似圖像對作為訓練樣本來對所述初步訓練的分類模型進行調優，從而可以獲得產品圖像更準確的特徵表達。

label‧‧‧圖像的類別標籤

image‧‧‧產品圖像

F‧‧‧混淆矩陣

3101‧‧‧混淆矩陣獲取單元

3102‧‧‧易混淆類別確定單元

3103‧‧‧不相似圖像對構建單元

210‧‧‧驗證圖像的真實類別標籤

230‧‧‧矩陣元素

300‧‧‧分類模型訓練模組

310‧‧‧不相似圖像對確定模組

320‧‧‧相似圖像對確定模組

330‧‧‧分類模型優化模組

340‧‧‧圖像特徵獲取模組

220‧‧‧通過分類模型對驗證圖像進行識別得到的預測類別標籤

100、101、102、103、104、110、120、130、140‧‧‧步驟

為了更清楚地說明本申請實施例的技術方案，下面將對實施例或現有技術描述中所需要使用的附圖作簡單地介紹，顯而易見地，下面描述中的附圖僅僅是本申請的一些實施例，對於本領域普通技術人員來講，在不付出創造性勞動性的前提下，還可以根據這些附圖獲得其他的附圖。

第1圖是本申請一實施例的圖像特徵獲取方法流程圖。

第2圖是本申請一實施例中生成的混淆矩陣示意圖。

第3圖是本申請一實施例的圖像特徵獲取裝置的結構示意圖。

第4圖是本申請另一實施例的圖像特徵獲取裝置的結構示意圖。

下面將結合本發明實施例中的附圖，對本發明實施例中的技術方案進行清楚、完整地描述，顯然，所描述的實施例是本發明一部分實施例，而不是全部的實施例。基於本申請中的實施例，本領域普通技術人員在沒有作出創造性勞動前提下所獲得的所有其他實施例，都屬於本申請保護的範圍。

本實施例公開的一種圖像特徵獲取方法，如第1圖所示，可包括步驟100至步驟140。

步驟100，通過預設類別的訓練圖像訓練分類模型。

例如，可基於深度卷積神經網路的模型，來訓練分類模型。分類模型是基於產品圖像對產品的類別進行識別的模型。在訓練分類模型時，可將大量類別的產品圖像作為訓練圖像。所述產品圖像可以為點餐平臺的菜品圖像、也可以為服裝銷售平臺的服裝圖像，還可以為旅遊諮詢平臺的景點圖像等。基於深度卷積神經網路的模型的訓練圖像的格式可為(label，image)。其中，label為圖像的類別標籤，image為產品圖像。基於深度卷積神經網路對不同類別的圖像進行學習，可訓練出產品類模型的參數，並得到每幅訓練圖像的最優特徵表達。進一步的，可以利用訓練得到的分類模型來對其他待識別圖像進行分類。

步驟110，通過利用驗證圖像對所述分類模型的分類結果進行測試，來確定所述分類模型相對容易混淆的不相似圖像對。

訓練得到的分類模型可以用於對輸入的產品圖像進行分類。但是，由於訓練所述分類模型時使用的訓練圖像採用人工設置類別標籤，或者由使用者上傳產品圖像時設置類別標籤，可能存在標籤不準確的情況。加之，訓練分類模型時僅考慮了類間方差最大化。因此，訓練得到的分類模型可能存在分類不準確的現象，可能需要利用驗證資料對所述分類模型進行優化。

所述驗證圖像可與訓練圖像具有同樣的類別，如5000類。每個類別可包括多幅產品圖像，每幅產品圖像可設置有真實類別標籤。將設置有真實類別標籤的驗證圖像輸入至在步驟100中訓練得到的分類模型，通過所述分類模型識別每幅驗證圖像的類別。然後，可分析所述分類模型輸出的每個類別的分類結果，構建混淆矩陣。混淆矩陣的每一列代表了預測類別，每一列的總數表示被識別為該預測類別的產品圖像的數目；每一行代表了產品圖像的真實類別，每一行的總數表示屬於該真實類別的產品圖像的數目。每一列中的數值表示真實類別被識別為該預測類別的數目。混淆矩陣中記錄了分類模型混淆的類別。

進一步的，通過對混淆矩陣中的資料進行聚類分析，可以得出所述分類模型容易混淆的類別。然後，從所述分類模型相對容易混淆的類別中選擇圖像，兩兩構成不相似圖像對。例如，可選擇相對容易混淆的兩個類別中的驗證圖像構成不相似圖像對。

步驟120，基於所述預設類別的訓練圖像確定相似圖像對。

可以基於訓練分類模型時使用的訓練圖像來獲得相似圖像對。例如，從每個類別的所述訓練圖像中分別隨機選擇多幅圖像，兩兩構成相似圖像對。

步驟130，基於所述相似圖像對和所述不相似圖像對，優化所述分類模型。

以所述相似圖像對和所述不相似圖像對作為輸入，可基於類間方差最大化且類內方差最小化對所述分類模型進行優化。例如，可構建基於Inception和siamese網路的多工模型，利用所述相似圖像對和所述不相似圖像對對基於Inception網路的分類模型的參數進行微調，以優化所述分類模型的具有特徵表達能力的各層，如特徵表達層fc1層或類別輸出層fc2層。當完成模型訓練任務時，Inception網路的各層參數可最優。換言之，基於Inception網路的分類模型的特徵表達層(即fc1層)或類別輸出層(即fc2層)能夠最好地表達產品圖像的特徵。

步驟140，利用優化後的所述分類模型獲取圖像特徵。

若將待處理圖像、即待提取特徵的圖像輸入至優化後的所述分類模型，經過所述分類模型進行識別處理後，分類模型的各層將輸出相應的參數，從而可以根據具有特徵表達能力的某一層的參數確定所述待處理圖像的圖像特徵。

本發明實施例公開的圖像特徵獲取方法，通過利用預設類別的訓練圖像來訓練分類模型，利用驗證圖像對所述分類模型的分類結果進行測試，確定所述分類模型相對容易混淆的不相似圖像對，基於所述訓練圖像確定相似圖像對，並基於所述相似圖像對和所述不相似圖像對優化所述分類模型，使得可利用優化後的所述分類模型來獲取圖像特徵，從而可有效提高所獲取的圖像特徵對圖像的表達能力。其中，通過基於對驗證圖像的分類結果來確定初步訓練的分類模型混淆的產品圖像，並基於相對容易混淆的產品圖像類別來構建不相似圖像對，使得可以結合不相似圖像對和相似圖像對一起對所述初步訓練的分類模型進行調優，以能夠獲得產品圖像更準確的特徵表達。

通過預設類別的訓練圖像來訓練分類模型，可包括：基於類間方差最大化的思想，利用預設類別的訓練圖像來訓練基於深度卷積神經網路的分類模型。

例如，可以取5000類訓練圖像，每類訓練圖像包括10000幅產品圖像。在每幅產品圖像人工設置類別標籤後，可將設置有類別標籤的產品圖像生成訓練資料，例如格式為：(label，image)的訓練資料，以作為深度卷積神經網路的輸入。

同時，可基於類間方差最大化的思想來構建基於深度卷積的神經網路的多工模型，以訓練分類模型。例如，可以採用基於Inception深度學習網路的多工模型來訓練分類模型，選用SoftmaxLoss作為類別識別的損失函數，從增大類間方差的角度來對圖像特徵進行描述。在這種情況下，可將5000類訓練圖像構成的訓練資料作為輸入，來訓練分類模型。每一幅訓練圖像經過該分類模型可以得到各層的參數。其中，fc1層可以作為特徵表達層，例如可為21841維向量，fc2層可以為作為類別輸出層，例如可為5000維向量。每個維度代表該訓練圖像分類為該類別的概率大小。基於Inception深度學習網路的多工模型來訓練分類模型的具體方法，可參見本領域技術人員熟知的任意相關技術，此處不再贅述。

在前述步驟110中，通過利用驗證圖像對所述分類模型的分類結果進行測試，來確定所述分類模型相對容易混淆的不相似圖像對，可包括：通過利用所述分類模型對驗證圖像進行分類，來得到混淆矩陣；對混淆矩陣進行聚類分析，確定易混淆的類別；以及，基於所確定的易混淆的類別，構建不相似圖像對。

通過利用所述分類模型對驗證圖像進行分類，來得到混淆矩陣，可包括：通過利用所述分類模型對驗證圖像進行分類，得到每幅驗證圖像的預測類別；根據所有驗證圖像的真實類別和預測類別，構建混淆矩陣。其中，所述混淆矩陣的每一行中的各數值為該行對應的類別的驗證圖像被劃分到不同類別的數量。

所述驗證圖像可包括與訓練圖像的類別數同樣的類別，每個類別中包括多幅產品圖像，每幅產品圖像設置有真實類別標籤。以訓練圖像包括5000個類別為例，驗證圖像包括同樣的5000個類別，每個類別有40幅圖像，每幅圖像都設置有真實類別標籤。可將設置有真實類別標籤的驗證圖像輸入至初步訓練好的分類模型，以通過所述分類模型識別每幅驗證圖像的預測類別。

接著，可分析每個類別中驗證圖像的分類結果，以構建混淆矩陣。如果驗證圖像包括N個類別，則所述混淆矩陣為一個N*N的矩陣。混淆矩陣的每一列代表了預測類別，每一列的總數表示識別為該預測類別的驗證圖像的數目；每一行代表了驗證圖像的真實類別，每一行的總數表示該類別的驗證圖像的數目。每一列中的數值可表示真實類別被識別為該預測類別的數目。

以驗證圖像包括5000個類別，類別標籤為1至5000為例。假設每個類別中包括40幅驗證圖像，如第2圖所示，混淆矩陣為一個5000*5000的矩陣。其中，列210代表的是驗證圖像的真實類別標籤，行220代表的是通過分類模型對驗證圖像進行識別得到的預測類別標籤。因為每個類別共40個驗證圖像，所以每行的和為40。如矩陣元素230表示：真實類別為1，預測類別為1的驗證圖像的數目為25個。混淆矩陣記錄了分類模型混淆的類別。

對混淆矩陣進行聚類分析，以確定易混淆的類別，可包括：通過譜聚類的方法對所述混淆矩陣進行聚類，得到多個簇。其中，譜聚類的基本思想是利用樣本資料之間的相似矩陣(拉普拉斯矩陣)進行特徵分解。每個簇中包括至少一個類別，並可將包括至少兩個類別的簇中的類別確定為相互易混淆的類別。

以混淆矩陣F為例，具體說明對混淆矩陣進行聚類分析的過程如下。首先，可利用混淆矩陣F構建距離矩陣M，公式如下：

其中，I為單位矩陣。

然後，可利用距離矩陣M構建拉普拉斯矩陣(Laplacian Matrix)L。

在構建拉普拉斯矩陣L時，可先利用距離矩陣M構建鄰接矩陣W，如下：

其中，t代表僅保留距離矩陣M中距離值最小的前t個位置的資訊，其他均置為0。距離值越小，對應到混淆矩陣F中的值越大，意味著被分類模型混淆的概率越大，例如真實類別A被識別為預測類別B的樣本數較多。

然後，可將鄰接矩陣W的每一列元素加起來得到N個數。其中，N等於訓練分類模型時使用的訓練圖像的類別數量。把這N個數放在度矩陣D的對角線上，並將度矩陣D的其他位置的元素均置為0，從而得到一個N×N的對角矩陣。

接著，可由鄰接矩陣W和度矩陣D構建得到拉普拉斯矩陣L，公式如下：L=D-W。

之後，對拉普拉斯矩陣L進行特徵分解，可求出L的前k個特徵值

及對應的特徵向量

。將k個特徵向量排列在一起組成一個N×k的矩陣，將其中每一行看作k維空間中的一個向量，即每一行作為一個K維向量，N個特徵向量排列在一起將得到N個K維向量。其中，N是拉普拉斯矩陣L的行數，等於訓練分類模型時使用的訓練圖像的類別數。

對拉普拉斯矩陣進行特徵分解時，可利用降維方式進行降維。最大特徵值對應的特徵向量方向上包含最多的信息量。如果某幾個特徵向量方向上的信息量很小，則可以進行降維。例如，可以刪除特徵值小的特徵向量方向上的資料，只保留大特徵值的特徵向量方向上的資料，這樣有用的資訊量變化不大。然後，可使用K-means演算法對N個K維向量進行聚類，以將最初的N個類別映射到不同的簇中。

經過對混淆矩陣進行譜聚類分析，可將圖像容易混淆的類別聚為一類。以聚類結果為230個簇為例，每個簇中包括至少一個類別。每個簇中的類別就是在識別產品圖像時相互之間容易混淆的類別。例如：某個簇中包括類別1、類別500，那麼，類別1的產品圖像很容易被分類模型識別為類別500。

基於所確定的易混淆的類別，構建不相似圖像對。

利用譜聚類的方法對混淆矩陣進行聚類分析，可得到多個簇的聚類結果，如230個簇。每個簇中的類別為對產品圖像進行分類識別時容易相互混淆的類別，因此，可利用屬於同一個簇中易混淆的類別的驗證圖像來構建不相似圖像對。

以聚類得到的簇包括簇1、簇2和簇3，簇1中包括1個類別，簇2中包括4個類別，簇3中包括5個類別為例，說明構建不相似圖像對可能出現的以下兩種情況。

第一種情況，對於類別數目大於2的簇，可選擇該簇中不同類別的圖像構建不相似圖像對。例如，可以首先選擇該簇中不同類別構建類別對，然後，為每個類別隨機選取至少一幅驗證圖像，由不同類別的兩幅驗證圖像構建一個不相似圖像對。如果簇2中包括的4個類別為類別3、類別4、類別7、類別30，則對於簇2可得到6個類別對(3、4)、(3、7)、(3、30)、(4、7)、(4、30)和(7、30)。然後，對於得到的6個類別對，分別取其中每個類別對應的至少一幅驗證圖像，不同類別的兩幅驗證圖像構建一個不相似圖像對。例如，對於類別對(3、4)，可取驗證圖像中類別3的圖像1和圖像2、取驗證圖像中類別4的圖像15和圖像8，然後，由圖像1和圖像15構成一個不相似圖像對，由圖像2和圖像8構成一個不相似圖像對。

第二種情況，對於只包含一個類別的簇，可選擇該簇中的類別與其它簇中隨機選取的Q個類別的圖像構建不相似圖像對。其中，Q可根據具體需要確定。例如，若某個簇中少於Q個類別，則可取該簇中的全部類別。以Q為10為例。假設簇1包括類別5，可選擇簇1中類別5的驗證圖像和簇2中類別3、類別4、類別7、類別30的驗證圖像分別構建不相似圖像對。

在前述步驟120中，基於所述訓練圖像確定相似圖像對時，可以從所述每個類別的訓練圖像中隨機選擇多幅圖像兩兩構成相似圖像對。仍以訓練圖像包括5000個類別為例，每個類別中隨機選取60幅圖像，兩兩構成相似圖像對，每個類別可以得到30個相似圖像對。基於5000類訓練圖像就可以得到150000個相似圖像對。

然後，可以利用所述相似圖像對和所述不相似圖像對優化所述分類模型，以通過優化後的所述分類模型獲取圖像特徵。

在前述步驟130中，基於所述相似圖像對和所述不相似圖像對優化所述分類模型，可包括：利用所述相似圖像對和所示不相似圖像對，基於類間方差最大化且類內方差最小化的思想對所述分類模型進行優化。可首先構建基於圖像對的深度卷積神經網路模型，例如基於Inception和siamese網路的多工模型。softmaxLoss應用於分類，可衡量得到的預測類別和圖像的真實類別之間的距離。例如，Inception模型的初始參數可為所述分類模型的參數。ContrastiveLoss可應用於siamese網路，以衡量圖像對的預測類別相似度和真實類似相似度之間的距離。Inception網路模型可選用SoftmaxLoss作為類別識別的損失函數，以從增大類間方差的角度對圖像特徵進行描述。

siamese網路模型的基本模型仍然是inception網路，因此，siamese網路模型的部分層的初始參數可與Inception模型的初始參數相同，siamese網路模型獨有的層的初始參數可隨機初始化。siamese網路模型可利用ContrastiveLoss損失函數，從而在對不相似圖像對的距離進行度量之外，還對相似圖像對的距離進行了度量。與只利用SoftmaxLoss對不同類別之間的圖像距離進行度量的Inception網路模型相比，Siamese網路模型可以從減小類內方差的角度對圖像之間的相似度進行進一步描述。

優化所述分類模型的過程可認為是在所述分類模型得到的各層參數基礎上進行二次訓練的過程，即對所述分類模型的各層參數進行進一步訓練、調優的過程。例如，可將每個相似圖像對和每個不相似圖像對分別生成如格式(img1,label1；img2,label2；if_similar)的訓練資料，輸入基於Inception網路和siamese網路的多工模型。其中，所述多工模型的任務是使得Inception網路的損失函數SoftmaxLoss和siamese網路的損失函數ContrastiveLoss最小。

當完成模型訓練任務時，Inception網路的各層參數可達到最優。其中，Inception網路模型的特徵表達層(即fc1層)的參數實現最優，可表示Inception網路模型的特徵表達層輸出的特徵向量對產品圖像的特徵表達能力最強。Inception網路模型的類別輸出層(即fc2層)的參數實現最優，可表示Inception網路模型的類別輸出層輸出的特徵向量表達的產品圖像分類結果為最優。

在上述步驟140中，利用優化後的所述分類模型獲取圖像特徵，可包括：將待處理圖像作為優化後的分類模型的輸入，基於所述優化後的分類模型具有特徵表達能力的層次的輸出獲取所述待處理圖像的特徵。可以根據優化後的所述分類模型的具有特徵表達能力的某個層次的輸出來確定輸入圖像的圖像特徵。例如，以5000類圖像對作為輸入為例，當完成模型訓練任務時，如果選擇根據fc1層的輸出來確定輸入圖像的圖像特徵，則可以將Inception網路的fc1層輸出的21841維特徵向量作為輸入圖像的圖像特徵；如果選擇根據fc2層的輸出來確定輸入圖像的圖像特徵，則可以將fc2層輸出的5000維特徵向量，作為輸入圖像的圖像特徵。所述5000維特徵向量的每個維度代表輸入圖像被分類為該類別的概率大小。此外，根據具體業務需求，可以選擇根據Inception網路的fc1層或fc2層的輸出來確定產品的圖像特徵。

本申請實施例公開的圖像特徵獲取方法，首先，利用大規模產品圖像預訓練基於深度卷積神經網路的分類模型，以得到有較大類間方差的圖像特徵表達；然後，通過對利用預訓練的分類模型在驗證資料集上的分類結果而構建的混淆矩陣進行譜聚類分析，可將容易混淆的產品類別聚為一簇，並利用同一簇中易混淆的產品類別構建不相似圖像對，利用同一個類別的訓練圖像構建相似圖像對；接著，可利用相似圖像對和不相似圖像對進行用於分類及相似度比較的多工模型的聯合優化。這樣，在進一步增大易混淆類別的類間方差的同時，可利用相似圖像對實現對深度卷積神經網路的共用參數的更新學習，從而可有效減小類內方差，並提升分類模型對於圖像的特徵表達能力。

本實施例公開的一種圖像特徵獲取裝置，如第3圖所示，所述裝置包括：分類模型訓練模組300，用於基於預設類別的訓練圖像訓練分類模型；不相似圖像對確定模組310，用於通過利用驗證圖像對所述分類模型訓練模組300訓練出的分類模型的分類結果進行測試，來確定所述分類模型相對容易混淆的不相似圖像對；相似圖像對確定模組320，用於基於所述訓練圖像確定相似圖像對；分類模型優化模組330，用於基於所述相似圖像對和所述不相似圖像對來優化所述分類模型；圖像特徵獲取模組340，利用優化後的所述分類模型獲取輸入圖像的圖像特徵。

如第4圖所示，所述不相似圖像對確定模組310可包括：混淆矩陣獲取單元3101，用於通過利用所述分類模型對驗證圖像進行分類，得到混淆矩陣；易混淆類別確定單元3102，用於對混淆矩陣進行聚類分析，以確定易混淆的類別；不相似圖像對構建單元3103，用於基於屬於所述易混淆的類別的驗證圖像，來構建不相似圖像對。

所述混淆矩陣獲取單元3101可進一步用於：通過利用所述分類模型對驗證圖像進行分類，得到每幅驗證圖像的預測類別；根據所有驗證圖像的真實類別和預測類別，構建混淆矩陣，其中，所述混淆矩陣的每一行中各列的數值為該行對應的類別的驗證圖像被劃分到不同類別的數量。

所述易混淆類別確定單元3102可進一步用於：對所述混淆矩陣進行聚類，得到多個簇，其中，每個簇中包括至少一個類別；將包括至少兩個類別的簇中的類別確定為相互易混淆的類別。

所述分類模型優化模組330可進一步用於：利用所述相似圖像對和所述不相似圖像對，基於類間方差最大化且類內方差最小化的思想對所述分類模型進行優化。

所述分類模型訓練模組300可進一步用於：基於類間方差最大化的思想，利用預設類別的訓練圖像來訓練基於深度卷積神經網路的分類模型。

所述圖像特徵獲取模組340可進一步用於：將待處理圖像作為優化後的分類模型的輸入，獲取所述優化後的分類模型中具有特徵表達能力的層次的輸出作為所述待處理圖像的特徵。

本發明實施例公開的圖像特徵獲取裝置，通過利用預設類別的訓練圖像訓練分類模型，利用驗證圖像對所述分類模型的分類結果進行測試以確定所述分類模型相對容易混淆的不相似圖像對，並基於利用所述訓練圖像確定的相似圖像對和所述不相似圖像對優化所述分類模型，從而可利用優化後的所述分類模型獲取圖像特徵，進而有效提高所獲取的圖像特徵對圖像的表達能力。

本發明實施例公開的圖像特徵獲取裝置，通過利用大規模的產品圖像預訓練基於深度卷積神經網路的分類模型，可以得到有較大類間方差的圖像特徵表達。通過對利用基於深度卷積神經網路的分類模型在驗證資料集上的分類結果而構建的混淆矩陣進行譜聚類分析，將容易混淆的產品類別聚為一簇，並利用同一簇中易混淆的產品類別構建不相似圖像對，可基於利用同一個類別的訓練圖像構建的相似圖像對和所述不相似圖像對進行多工模型聯合優化，從而可在進一步增大易混淆類別的類間方差的同時減小類內方差，進而可有效提升分類模型對於圖像的特徵表達能力。

相應的，本申請還公開了一種電子設備，包括記憶體、處理器及存儲在所述記憶體上並可在處理器上運行的電腦程式，所述處理器執行所述電腦程式時實現如上所述的圖像特徵獲取方法。所述電子設備可以為PC機、移動終端、個人數位助理、平板電腦等。

本發明還公開了一種電腦可讀存儲介質，其上存儲有電腦程式，該程式被處理器執行時實現如上所述的圖像特徵獲取方法的步驟。

本說明書中的各個實施例均採用遞進的方式描述，每個實施例重點說明的都是與其他實施例的不同之處，各個實施例之間相同相似的部分互相參見即可。對於裝置實施例而言，由於其與方法實施例基本相似，所以描述的比較簡單，相關之處參見方法實施例的部分說明即可。

以上對本申請提供的一種圖像特徵獲取方法及裝置進行了詳細介紹，本文中應用了具體個例對本申請的原理及實施方式進行了闡述，以上實施例的說明只是用於幫助理解本申請的方法及其核心思想；同時，對於本領域的一般技術人員，依據本申請的思想，在具體實施方式及應用範圍上均會有改變之處，綜上所述，本說明書內容不應理解為對本申請的限制。

通過以上的實施方式的描述，本領域的技術人員可以清楚地瞭解到各實施方式可借助軟體加必需的通用硬體平臺的方式來實現，當然也可以通過硬體實現。基於這樣的理解，上述技術方案本質上或者說對現有技術做出貢獻的部分可以以軟體產品的形式體現出來，該電腦軟體產品可以存儲在電腦可讀存儲介質中，如ROM/RAM、磁碟、光碟等，包括若干指令用以使得一台電腦設備(可以是個人電腦，伺服器，或者網路設備等)執行各個實施例或者實施例的某些部分所述的方法。

Claims

一種圖像特徵獲取方法，包括：利用預設類別的訓練圖像訓練分類模型；通過利用驗證圖像對所述分類模型的分類結果進行測試，來確定不相似圖像對；基於所述訓練圖像確定相似圖像對；基於所述相似圖像對和所述不相似圖像對，優化所述分類模型；利用所述優化後分類模型獲取圖像特徵。
如申請專利範圍第1項所述的方法，其特徵在於，通過利用所述驗證圖像對所述分類模型的分類結果進行測試，來確定不相似圖像對，包括：通過利用所述分類模型對所述驗證圖像進行分類，得到混淆矩陣；對所述混淆矩陣進行聚類分析，以確定易混淆的類別；基於屬於所述易混淆的類別的所述驗證圖像，構建所述不相似圖像對。
如申請專利範圍第2項所述的方法，其特徵在於，通過利用所述分類模型對所述驗證圖像進行分類，得到所述混淆矩陣，包括：通過利用所述分類模型對所述驗證圖像進行分類，得到每幅所述驗證圖像的預測類別；根據每幅所述驗證圖像的真實類別和預測類別，構建所述混淆矩陣，其中，所述混淆矩陣的每一行中各列的數值為該行對應的類別的驗證圖像被劃分到不同類別的數量。
如申請專利範圍第2項所述的方法，其特徵在於，對所述混淆矩陣進行聚類分析，以確定所述易混淆的類別的步驟，包括：通過對所述混淆矩陣進行譜聚類分析，得到多個簇，其中，每個簇中包括至少一個類別；將包括至少兩個類別的簇中的類別確定為所述易混淆的類別。
如申請專利範圍第1項所述的方法，其特徵在於，基於所述相似圖像對和所述不相似圖像對，優化所述分類模型，包括：基於類間方差最大化且類內方差最小化的思想，利用所述相似圖像對和所述不相似圖像對所述分類模型進行優化。
如申請專利範圍第1項所述的方法，其特徵在於，利用預設類別的所述訓練圖像訓練所述分類模型，包括：基於類間方差最大化的思想，利用預設類別的所述訓練圖像訓練基於深度卷積神經網路的分類模型。
如申請專利範圍第1項所述的方法，其特徵在於，利用所述優化後分類模型獲取圖像特徵，包括：將待處理圖像作為所述優化後分類模型的輸入，獲取所述優化後分類模型中具有特徵表達能力的層次的輸出作為所述待處理圖像的特徵。
一種圖像特徵獲取裝置，包括：分類模型訓練模組，用於利用預設類別的訓練圖像訓練分類模型；不相似圖像對確定模組，用於通過利用驗證圖像對所述分類模型訓練模組訓練出的分類模型的分類結果進行測試，確定不相似圖像對；相似圖像對確定模組，用於基於所述訓練圖像確定相似圖像對；分類模型優化模組，用於基於所述相似圖像對和所述不相似圖像對，優化所述分類模型；圖像特徵獲取模組，用於利用優化後的所述分類模型獲取圖像特徵。
一種電子設備，包括記憶體、處理器及存儲在所述記憶體上並可在處理器上運行的電腦程式，其特徵在於，所述處理器執行所述電腦程式時實現請求項1至7任意一項所述的圖像特徵獲取方法。
一種電腦可讀存儲介質，其上存儲有電腦程式，其特徵在於，該程式被處理器執行時實現如申請專利範圍第1項至第7項任意一項所述的圖像特徵獲取方法的步驟。