TWI480809B - Image feature extraction method and device - Google Patents

Image feature extraction method and device Download PDF

Info

Publication number
TWI480809B
TWI480809B TW098129245A TW98129245A TWI480809B TW I480809 B TWI480809 B TW I480809B TW 098129245 A TW098129245 A TW 098129245A TW 98129245 A TW98129245 A TW 98129245A TW I480809 B TWI480809 B TW I480809B
Authority
TW
Taiwan
Prior art keywords
image
sub
difference
sum
original image
Prior art date
Application number
TW098129245A
Other languages
English (en)
Other versions
TW201108126A (en
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to TW098129245A priority Critical patent/TWI480809B/zh
Publication of TW201108126A publication Critical patent/TW201108126A/zh
Application granted granted Critical
Publication of TWI480809B publication Critical patent/TWI480809B/zh

Links

Landscapes

  • Image Analysis (AREA)

Description

圖像特徵提取方法及裝置
本申請案係關於圖像處理技術領域,特別關於一種圖像特徵提取方法及裝置。
圖像特徵包括顏色、紋理、形狀這三方面的特徵。本篇申請案主要涉及圖像的形狀特徵。基於形狀的圖像特徵提取演算法,是將圖像中能夠反映物體形狀的特徵透過數學方式提取並表達出來。
圖像特徵提取的應用十分廣泛。例如在圖像搜尋領域,需要由負責提供圖像搜尋的搜尋引擎將圖片資料庫中的圖片與接收到的請求搜尋的圖片進行比較,從而找出圖片資料庫中與請求搜尋的圖片相接近的圖片。而這類搜尋中,進行比較的是請求搜尋的圖片的圖像特徵與資料庫中的圖片的圖像特徵,那麼,預先對圖片進行圖像特徵提取就成為必不可少的一步。
關於基於形狀的圖像特徵提取,現有技術中較常用的方法是基於Hough變換來實現的。Hough變換是將圖像平面上的點對應到參數平面上的線,最後透過統計特性來提取圖像特徵。其原理可以描述如下:直線的方程可以用y=k*x+b來表示,其中k和b是參數,分別是斜率和截距。過某一點(x0 ,y0 )的所有直線的參數都滿足方程y0 =k*x0 +b。對目標圖像平面(x,y)中的亮度滿足預設條件的點,利用b=y-k*x求出(k,b)平面上對應的直線,把這直線上的所有點都賦值為1,並設該n條直線相交於一點時,該點的值賦為所經過的直線的個數。則對於圖像平面上的直線,按照上述過程,可以在參數平面上(k,b)得到一族直線,則參數平面上這些直線的相交的點,其值最高,則該點可以表示目標平面上的一條直線,從而,透過上述過程,透過統計參數平面上最高值的點可以檢測目標平面上存在的直線。
多條直線,依此類推。對於計算圓和弧的,與其類似。
為了更清楚的說明現有技術的上述原理,下面以圖1作為目標圖像來說明,為了簡單說明,圖1中為10*10像素大小的圖片,其中存在一條直線,以圖片的左下角為座標原點,該直線可以表示為y=5。設該圖片背景亮度較低,而這一條直線上的點的亮度較高。採用Hough變換檢測這條直線的方法如下:
S1:按照座標檢測圖1中的每一個點;
S2:當檢測到目標圖像上的點(設該點的座標為(x0 ,y0 ))亮度大於預定閾值時,在參數平面(如圖2所示)上標識一條b=y0 -k*x0 直線,為該標識的直線上的每一點賦值為1(如命名為α值);
S3:對於參數平面上標識出的直線的相交點,設定該相交點的α值為經過該點的直線的個數。實際上,相交點的α值,也可以表示為該點上所有經過的所有直線在這一點上的α值之和,與前述設定該相交點的α值為經過該點的直線的個數的表達,實質上是同一道理。
經過上述處理,對於圖1所示目標圖像中y=5的直線,在圖2所示的參數平面上,可以標識出一個點,即k=0,b=5的點,該點的α值最高,則該參數平面上的(0,5)這一點,可以表示目標圖像上的y=5這一條直線。而參數平面上的(0,5)這一點,即0和5正好分別是目標平面上y=5的斜率與截距,說明參數平面上標識出的這一點,檢測出了目標平面上存在的y=5的這條直線。
上述以一個實例說明了現有Hough變換方法對於檢測目標平面中一條直線的方法。而對於目標平面中存在多條直線的情況,按照上述方法,可以在參數平面上得到多個高賦值的點,從而由參數平面上高賦值的這些點可以表示目標平面上的多條直線。
對於目標圖像中圓形、弧形等其他形狀的檢測,原理與上述過程類似。
在對現有技術的研究和實踐過程中,發明人發現現有技術中存在以下問題:上述採用Hough變換方法特徵提取,會不可避免的涉及浮點運算,例如直線的斜率存在浮點運算的情況,當然,對於更為複雜的圓、弧形的特徵提取,將涉及更多的浮點運算。而本領域技術人員知道,浮點運算對CPU等硬體的計算能力提出了較高的要求,同樣的硬體配置下,對於涉及浮點運算的現有Hough方法,計算速度較低。
本申請案實施例的目的是提供一種圖像特徵提取方法及裝置,以提高圖像特徵提取的速度。
為解決上述技術問題,本申請案實施例提供一種圖像特徵提取方法及裝置是這樣實現的:一種圖像特徵提取方法,包括:從原始圖像中摳出所含物體的圖像;將所述摳出的圖像用單一顏色為背景填充邊界,並使得填充後的圖像成為最小正方形;將正方形圖像全圖等比縮放為第一預定大小的圖像,將縮放後的圖像分割為互不重疊的第二預定大小的子圖像塊;分別計算水平、垂直、正45°、負45°方向上相鄰像素的亮度導數,將分別在四個方向導數極值點的個數、以及位於子圖像塊四個邊界上極值點的總個數作為該子圖像塊的特徵向量;將所有子圖像塊的特徵向量作為原始圖像的特徵向量。
一種圖像特徵提取裝置,包括:摳取單元,用於從原始圖像中摳出所含物體的圖像;填充單元,將所述摳出的圖像用單一顏色為背景填充邊界,並使得填充後的圖像成為最小正方形;歸一化處理單元,包括縮放單元和分割單元,縮放單元用於將正方形圖像全圖等比縮放為第一預定大小的圖像,分割單元用於將縮放後的圖像分割為互不重疊的第二預定大小的子圖像塊;亮度導數計算和統計單元,用於分別計算水平、垂直、正45°、負45°方向上相鄰像素的亮度導數,並將分別在四個方向導數極值點的個數、以及位於子圖像塊四個邊界上極值點的總個數作為該子圖像塊的特徵向量;合成單元,將所有子圖像塊的特徵向量作為原始圖像的特徵向量。
由以上本申請案實施例提供的技術方案可見,從原始圖像中摳出所含物體的圖像,將所述摳出的圖像用單一顏色為背景填充邊界,並使得填充後的圖像成為最小正方形,將正方形圖像全圖等比縮放為第一預定大小的圖像,將縮放後的圖像分割為互不重疊的第二預定大小的子圖像塊,分別計算水平、垂直、正45°、負45°方向上相鄰像素的亮度導數,將分別在四個方向導數極值點的個數、以及位於子圖像塊四個邊界上極值點的總個數作為該子圖像塊的特徵向量,將所有子圖像塊的特徵向量作為原始圖像的特徵向量,經過上述處理,可以提取圖像的形狀特徵,並且,由於這些處理只涉及整形運算,並不涉及浮點運算,因此,同樣的硬體配置下,相比現有技術,可以大大提高處理速度。
本申請案實施例提供一種圖像特徵提取方法及裝置。
為了使本技術領域的人員更好地理解本申請案中的技術方案,下面將結合本申請案實施例中的附圖,對本申請案實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本申請案一部分實施例,而不是全部的實施例。基於本申請案中的實施例,本領域普通技術人員在沒有作出創造性勞動前提下所獲得的所有其他實施例,都應當屬於本發明保護的範圍。
如圖3所示,本申請案圖像特徵提取方法實施例的流程如下:
S310:從原始圖像中摳出所含物體的圖像。
將原始圖像匯總的物體所在圖像摳取出來的方法有若干種,以下給出一些介紹。
原始圖像中,往往有物體和背景,而背景一般佔據原始圖像的週邊部分,物體一般佔據原始圖像中的中間部分。而且,在原始圖像中,物體邊緣與背景的像素存在著較大的灰度差異,因此,可以利用這一特點將原始圖像中物體所在的圖像摳出,即:可以根據物體邊緣與背景存在的灰度差異從原始圖像中摳出所含物體的圖像。
以下給出該步驟的一個具體例子,先來看找出原始圖像中物體所在區域的左右邊界,包括以下步驟:
A1:統計原始圖像所有像素每一列上灰度值之和。
例如一個10*10像素的圖像,每個像素都具有灰度值屬性。該步驟中,即是計算每一列上所有像素的灰度值之和,作為該列像素的灰度值。
為了便於電腦軟硬體的處理,通常可以統計的每一列灰度值之和存放在陣列中。
A2:從左至右計算原始圖像相鄰兩列灰度值的差值,並記錄差值大於閾值的結果時右側列的橫座標xa
例如,從左至右掃描A1中保存在陣列中的各列的灰度值,並依次計算陣列中相鄰值的差值,當掃描到差值大於閾值時,如掃描到第2列與第3列的灰度值差值為50,大於預設的閾值30,記錄第3列的橫座標x3 ,對應陣列中第3個元素的下標。
這樣,找到了原始圖像中的表明物體所在位置的左邊界。
需要指出的是,當掃描到差值大於閥值時,也可以是記錄差值大於閾值的結果時左側列的橫座標,如掃描到第2列與第3列的灰度值差值為50,大於預設的閾值30,也可以是記錄第2列的橫座標x2 ,對應陣列中第2個元素的下標。該方式與前面所述只差1個像素的列寬,並不影響方法的整體效果。
A3:從右至左計算原始圖像相鄰兩列灰度值之和的差值,並記錄差值大於閾值的結果時左側列的橫座標xb
該步驟與A2類似,掃描並計算陣列,記錄下標xb ,這樣,找到了原始圖像中的表明物體所在位置的右邊界。
上述A2、A3中閾值的設置可以根據經驗值設置,如一般情況下當大於某一值時,背景與物體邊界會有較明顯的區別,這時,可以將該值設定為閾值。
再來看找出原始圖像中物體所在區域的上下邊界,原理與上述A1至A3類似,包括以下步驟:
B1:統計原始圖像所有像素每一行上灰度值之和。
B2:從上至下計算原始圖像相鄰兩列灰度值的差值,並記錄差值大於閾值的結果時下側行的縱座標ya
B3:從下至上原始圖像相鄰兩列灰度值之和的差值,並記錄差值大於閾值的結果時上側行的縱座標yb
這樣,找到了原始圖像中的表明物體所在位置的上、下邊界,分別為ya 、yb
則(xa ,xb ,ya ,yb )範圍內的圖像即為從原始圖像上摳出的物體圖像。
上述方式,是將原始圖像中物體所在的矩形圖像摳出,該方式最簡單易行。當然,還存在其他略為複雜的方式,如在上述方式的基礎上,增加兩個對角線方向上的灰度值差值的計算,從而找出物體在兩個對角線方向上的邊界,進而找出原始圖像中物體所在的八邊形圖像。當然,進一步的增加方向,還可以得出物體所在的16邊形、32邊形的圖像,不再贅述。
另外,還可以是將原始圖像分為水平方向的幾個子區域,利用前述方式找出每個子區域上物體的左右邊界;對應地,將原始圖像分為垂直方向的幾個子區域,利用前述方式找出每個子區域上物體的上下邊界。這樣,可以得到物體所在的多邊形區域。當然,這類方式會比較複雜。
S320:將所述摳出的圖像用單一顏色為背景填充邊界,使得摳出的圖像成為最小正方形。
所述單一顏色,例如可以是採取RGB為(0,0,0)的顏色,當然也可以是其他RGB顏色。一般地,採取填充RGB為(0,0,0)的顏色,速度快,也不構成干擾,從而有利於後續亮度導數的計算。
用單一顏色填充邊界,使摳出的圖像成為最小的正方形,目的是在後續步驟中,便於將包括物體的圖像分割為預定大小的子圖像塊。圖4示出了填充摳出的圖像為最小正方形的示意圖。
S330:將正方形圖像全圖等比縮放為第一預定大小的圖像,將縮放後的圖像分割為互不重疊的第二預定大小的子圖像塊。
將正方形圖像全圖等比縮放為第一預定大小的圖像,例如,可以將正方形圖像全圖等比縮放為64*64像素大小的圖像。當然,也可以是等比縮放為128*128像素大小的圖像。等比縮放,指的是將長、寬按照等比例縮放。
將縮放後的圖像分割為互不重疊的第二預定大小的子圖像塊,可以是16*16像素的圖像,也可以是8*8像素大小的圖像,或者是32*32像素大小的圖像。
該步驟的處理,是為了將包括物體的正方形圖像做歸一化處理,以使後續處理標準化、簡單化。第一預定大小和第二預定大小,可以是預先設定,設定的大小只要在合理範圍內,不存在質的區別。
以下以第一預定大小為64*64像素、第二預定大小為16*16像素為例加以說明。第二預定大小採取16*16像素時,第一預定大小64*64像素的包括物體的圖像,將被分割為4*4塊子圖像塊。
此外,需要指出的是,也可以將縮放後的圖像分割為有重疊情況的第二預定大小的子圖像塊,這樣的做法可能會使計算過程稍微繁瑣,也可能會增加最後輸出的特徵向量的維度,但仍不失為一種可行的方案。
S340:分別計算水平、垂直、正45°、負45°方向上相鄰像素的亮度導數,將分別在四個方向導數極值點的個數、以及位於子圖像塊四個邊界上極值點的總個數作為該子圖像塊的特徵向量。
首先介紹這裏引入的表明圖像塊特徵的特徵向量。可以視為一個五元向量,即M(a,b,c,d,e),該五元向量,在按照S340進行處理時,在執行該處理的電腦系統中,會被初始化,則初始化後,子圖像塊的五元向量為M(a,b,c,d,e)=M(0,0,0,0,0)。
其次介紹亮度導數。亮度導數的定義為:亮度導數=亮度差/像素間距。一般可以使用人眼敏感曲線的演算法求出亮度值。這個演算法為本領域技術公知內容。一種方案是:亮度L=116/3*(0.212649*R/255+0.715169*G/255+0.072182*B/255),其中RGB代表顏色值。亮度值一般是1表示全亮,0表示暗。但是在處理上一般將0~1的浮點值對應到1到255的整數範圍上。可見,亮度導數可以表示像素間亮度的變化情況。而對於提取圖像形狀特徵來講,一般地,根據圖像中物體邊緣或輪廓與其他部分圖像內容的亮度差異較明顯這一屬性,來找出物體在圖像中的邊緣或輪廓,從而用數學的形式描述出圖像中物體的形狀。
上述屬性,可以用亮度導數的極值來描述,具體的,可以在某一方向上逐一計算每個相鄰像素的亮度導數極值表達。當某一方向上逐一計算每個相鄰像素的亮度導數極值過程中,某一像素位置前後的亮度導數發生符號變化,即為亮度導數的極值點。從物理意義上講,在計算得到極值點的地方,很可能就是圖像中物體與其他部分的邊緣,或者是圖像中可以表明物體上某一部分不同於其他部分形狀的特徵。可見,這些特徵,都是能夠表明物體本身形狀特性的特徵,因此,可以用來作為表示物體形狀特徵的量。
對於分別計算水平、垂直、正45°、負45°方向上相鄰像素的亮度導數,以下給出一種具體計算方式的介紹:
計算子圖像塊在水平方向上的亮度導數,如果存在亮度導數極值,並且落在子圖像塊之內的,則對b加1,如果存在多個極值,則b即為極值的個數;如果極值存在於子圖像塊邊界上,則a加1。需要指出的是,這裏計算的可以是相鄰兩列的像素的亮度導數。
計算子圖像塊在垂直方向上的亮度導數,如果存在亮度導數極值,並且落在子圖像塊之內,則對c加1,如果存在多個極值,則c即為極值的個數;如果極值存在於子圖像塊邊界上,則a加1。需要指出的是,這裏計算的可以是相鄰兩行的像素的亮度導數。
計算子圖像塊在正45°方向上的亮度導數,如果存在亮度導數極值,並且落在子圖像塊之內,則對d加1,如果存在多個極值,則d即為極值的個數;如果極值存在於子圖像塊邊界上,則a加1。需要指出的是,這裏計算的是相鄰兩列像素上的亮度導數。需要指出的是,這裏計算的可以是正45°方向上相鄰兩像素上的亮度導數。
計算子圖像塊在負45°方向上的亮度導數,如果存在亮度導數極值,並且落在子圖像塊之內,則對e加1,如果存在多個極值,則e即為極值的個數;如果極值存在於子圖像塊邊界上,則a加1。需要指出的是,這裏計算的可以是負45°方向上相鄰兩像素上的亮度導數。
可見,經過上述處理後,該子圖像塊對應的五元向量中,a為表示該圖像塊中的物體邊界位於圖像塊四周邊界上的情況。除a的情況外,即除落在子圖像塊邊界上的情況外,b表示子圖像塊內部物體在水平方向上的存在具有形狀特徵的邊緣個數,c表示子圖像塊內部物體在垂直方向上的存在具有形狀特徵的邊緣個數,d表示子圖像塊內部物體在正45°方向上的存在具有形狀特徵的邊緣個數,e表示子圖像塊內部物體在負45°方向上的存在具有形狀特徵的邊緣個數。
由上述這些統計出的特徵,可以用來較好的表示圖像中物體形狀的特徵。
當然,上述統計方式並非唯一方式,本領域技術人員在看到上述給出的方式後,應當會容易想到其他的可行的方式,例如,對a、b、c、d、e的統計處理,可以具有靈活的方式。
S350:將所有子圖像塊的特徵向量作為原始圖像的特徵向量。
上述S340中,得到一個子圖像塊的五元向量組,該五元向量組可以表達該子圖像塊的形狀特徵。
由於S330中,將圖像分割為了若干互不重疊的子圖像塊,因此,S350中,需要用所有分割的子圖像塊的五元向量組來表示該圖像的形狀特徵。
例如將經過S320處理後的64*64像素的圖像分割為16*16像素的互不重疊的塊,則分為了4*4塊。表示每一塊子圖像塊形狀特徵的一個五元向量組,則這16塊子圖像塊,排列起來,成為16個五元向量組,或者說是一共為80元的向量組。而這個80元向量組,可以用來表明該圖像的形狀特徵。
另外,還可以包括以下歸一化處理:
S311:比較圖像的長和寬,如果長大於寬,則將圖像順時針旋轉90度。
旋轉是保證所有圖像都在一個基本形狀。比如一支筆,在圖片中的形狀有豎著放置,也會有橫放置。為了統一對比各圖片中筆的形狀,最好將圖片按同一方向放置。
此外,也可以是逆時針旋轉90度。
需要指出的是,S311中處理的物件可以是S310步驟中從原始圖像中摳出的圖像。
另外,還可以包括以下歸一化處理:
S312:比較所述摳出圖像或所述最小正方形圖像上半部分和下半部分灰度值總和,如果上半部分的灰度值總和大於下半部分灰度值總和,則將所述摳出圖像或所述最小正方形圖像倒置。
與上面的旋轉類似,該步驟也是為了使圖像中的物體有統一的方向。例如一個圖像中顯示一個蘋果,這個蘋果是倒放的。而大多數顯示蘋果的圖片中,蘋果都是正放的,因此,最好將倒放蘋果的圖片進行倒置,以便於與其他圖片進行比較。顯然地,對於上大下小的物體,其圖像中,上半部分圖像的灰度值之和要大於下半部分的灰度值之和;相反的,對於上小下大的物體,其圖像中,下半部分圖像的灰度值之和要大於上半部分的灰度值之和。上述處理過程,只涉及整形運算,並不涉及浮點運算,因此,同樣的硬體配置下,相比現有技術,可以大大提高處理速度。
從實際中搜尋引擎的角度考慮,按照每天更新100萬產品圖形計算,每秒必須要處理12張圖片,每張圖片100ms以內處理完成。這個只是考慮平均的情況,考慮到每天有4小時的產品更新的峰值,以及訪問磁片和網路的開銷,按設計要求每秒必須處理50張圖片,每張圖片特徵在20ms內完成。如果採用現有技術中的Hough變換,對一張200X200像素的圖像識別直線,用標準的四核伺服器,大約要20ms。僅僅Hough直線變換本身就已經不夠時間了。如果識別圓形,所用時間更長。
而採用本申請案實施例中對圖片分塊處理的辦法,由於不涉及浮點運算,因此可以加快處理速度。並且,對分塊後圖像的處理,還可以充分利用現有的多核處理器的優勢。同樣對於一個200X200的圖片,利用本申請案實施例中的方法,全部處理過程可以在10ms之內完成。
以下介紹本申請案中一種圖像特徵提取裝置實施例,圖5示出了該裝置實施例的框圖,如圖5所示,該裝置實施例包括:摳取單元51,用於從原始圖像中摳出所含物體的圖像;填充單元52,將所述摳出的圖像用單一顏色為背景填充邊界,並使得填充後的圖像成為最小正方形;歸一化處理單元53,包括縮放單元531和分割單元532,縮放單元531用於將正方形圖像全圖等比縮放為第一預定大小的圖像,分割單元532用於將縮放後的圖像分割為互不重疊的第二預定大小的子圖像塊;亮度導數計算和統計單元54,用於分別計算水平、垂直、正45°、負45°方向上相鄰像素的亮度導數,並將分別在四個方向導數極值點的個數、以及位於子圖像塊四個邊界上極值點的總個數作為該子圖像塊的特徵向量;合成單元55,將所有子圖像塊的特徵向量作為原始圖像的特徵向量。
較佳地,所述的裝置實施例中,所述歸一化處理單元53還可以包括:
旋轉單元533,用於比較所述摳出圖像的長和寬,如果長大於寬,則將填充後的圖像順時針旋轉90度。如圖6所示。
較佳地,所述的裝置實施例中,所述歸一化處理單元53還可以包括:
倒置單元534,用於比較所述摳出圖像上半部分和下半部分灰度值總和,如果上半圖像的灰度值總和大於下半部分灰度值總和,則將填充後的圖像倒置。如圖7所示。
當然,所述歸一化處理單元53也可以同時包括旋轉單元533和倒置單元534,如圖8所示。
如前述方法實施例中所述,該裝置實施例中,所述摳取單元51從原始圖像中摳出所含物體的圖像,具體可以是根據物體邊緣與背景存在較大灰度差異從原始圖像中摳出所含物體的圖像。
更進一步地,所述摳取單元51根據物體邊緣與背景存在較大灰度差異從原始圖像中摳出所含物體的圖像,包括:統計原始圖像所有像素每一列上灰度值之和;從左至右計算原始圖像相鄰兩列灰度值的差值,並記錄差值大於閾值的結果時右側列的橫座標xa ;從右至左原始圖像相鄰兩列灰度值之和的差值,並記錄差值大於閾值時左側列的橫座標xb ;統計原始圖像所有像素每一行上灰度值之和;從上至下計算原始圖像相鄰兩行灰度值的差值,並記錄差值大於閾值時下側行的縱座標ya ;從下至上原始圖像相鄰兩行灰度值之和的差值,並記錄差值大於閾值時上側行的縱座標yb ;則(xa ,xb ,ya ,yb )範圍內的圖像即為從原始圖像上摳出的物體圖像。
該裝置實施例可以位於電腦系統中,由硬體、硬體或軟硬體的結合來實現,並且較佳地,所述裝置可以位於實現搜尋引擎功能的電腦系統中。
由以上實施例可見,從原始圖像中摳出所含物體的圖像,將所述摳出的圖像用單一顏色為背景填充邊界,並使得填充後的圖像成為最小正方形,將正方形圖像全圖等比縮放為第一預定大小的圖像,將縮放後的圖像分割為互不重疊的第二預定大小的子圖像塊,分別計算水平、垂直、正45°、負45°方向上相鄰像素的亮度導數,將分別在四個方向導數極值點的個數、以及位於子圖像塊四個邊界上極值點的總個數作為該子圖像塊的特徵向量,將所有子圖像塊的特徵向量作為原始圖像的特徵向量,經過上述處理,可以提取圖像的形狀特徵,並且,由於這些處理只涉及整形運算,並不涉及浮點運算,因此,同樣的硬體配置下,相比現有技術,可以大大提高處理速度。
為了描述的方便,描述以上裝置時以功能分為各種單元分別描述。當然,在實施本發明時可以把各單元的功能在同一個或多個軟體和/或硬體中實現。
透過以上的實施方式的描述可知,本領域的技術人員可以清楚地瞭解到本發明可借助軟體加必需的通用硬體平臺的方式來實現。基於這樣的理解,本發明的技術方案本質上或者說對現有技術做出貢獻的部分可以以軟體產品的形式體現出來,該電腦軟體產品可以儲存在儲存媒體中,如ROM/RAM、磁碟、光碟等,包括若干指令用以使得一台電腦設備(可以是個人電腦,伺服器,或者網路設備等)執行本發明各個實施例或者實施例的某些部分所述的方法。
本說明書中的各個實施例均採用遞進的方式描述,各個實施例之間相同相似的部分互相參見即可,每個實施例重點說明的都是與其他實施例的不同之處。尤其,對於系統實施例而言,由於其基本相似於方法實施例,所以描述的比較簡單,相關之處參見方法實施例的部分說明即可。
本發明可用於眾多通用或專用的計算系統環境或配置中。例如:個人電腦、伺服器電腦、手持設備或可擕式設備、平板型設備、多處理器系統、基於微處理器的系統、機上盒、可程式化的消費電子設備、網路PC、小型電腦、大型電腦、包括以上任何系統或設備的分散式計算環境等等。
本發明可以在由電腦執行的電腦可執行指令的一般上下文中描述,例如程式模組。一般地,程式模組包括執行特定任務或實現特定抽象資料類型的常式、程式、物件、元件、資料結構等等。也可以在分散式計算環境中實踐本發明,在這些分散式計算環境中,由透過通訊網路而被連接的遠端處理設備來執行任務。在分散式計算環境中,程式模組可以位於包括儲存設備在內的本地和遠端電腦儲存媒體中。
雖然透過實施例描繪了本發明,本領域普通技術人員知道,本發明有許多變形和變化而不脫離本發明的精神,希望所附的申請專利範圍包括這些變形和變化而不脫離本發明的精神。
51...摳取單元
52...填充單元
53...歸一化處理單元
531...縮放單元
532...分割單元
54...亮度導數計算和統計單元
55...合成單元
533...旋轉單元
534...倒置單元
為了更清楚地說明本申請案實施例或現有技術中的技術方案,下面將對實施例或現有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本申請案中記載的一些實施例,對於本領域普通技術人員來講,在不付出創造性勞動性的前提下,還可以根據這些附圖獲得其他的附圖。
圖1為現有技術Hough變換中的目標圖像;圖2為現有技術Hough變換中的參數平面;圖3為本申請案方法實施例的流程圖;圖4為本申請案實施例中填充摳出的圖像為最小正方形的示意圖;圖5為本申請案實施例中填充摳出的圖像為最小正方形的示意圖;圖6為本申請案裝置實施的框圖;圖7為本申請案裝置實施的框圖;圖8為本申請案裝置實施的框圖。

Claims (11)

  1. 一種圖像特徵提取方法,包含:從原始圖像中摳出所含物體的圖像;將該摳出的圖像用單一顏色為背景填充邊界,並使得填充後的圖像成為最小正方形;將正方形圖像全圖等比縮放為第一預定大小的圖像,將縮放後的圖像分割為第二預定大小的子圖像塊;分別計算子圖像塊水平、垂直、正45°、負45°方向上相鄰像素的亮度導數,將分別在四個方向導數極值點的個數、以及位於子圖像塊四個邊界上極值點的總個數作為該子圖像塊的特徵向量;將所有子圖像塊的特徵向量作為原始圖像的特徵向量。
  2. 如申請專利範圍第1項所述的方法,其中,從原始圖像中摳出所含物體的圖像,包括:根據物體邊緣與背景存在的灰度差異從原始圖像中摳出所含物體的圖像。
  3. 如申請專利範圍第2項所述的方法,其中,根據物體邊緣與背景存在的灰度差異從原始圖像中摳出所含物體的圖像,包括:統計原始圖像所有像素每一列上灰度值之和;從左至右計算原始圖像相鄰兩列灰度值的差值,並記錄差值大於閾值時右側列的橫座標xa ;從右至左原始圖像相鄰兩列灰度值之和的差值,並記錄差值大於閾值時左側列的橫座標xb ;統計原始圖像所有像素每一行上灰度值之和;從上至下計算原始圖像相鄰兩列灰度值的差值,並記錄差值大於閾值的結果時下側行的縱座標ya ;從下至上原始圖像相鄰兩列灰度值之和的差值,並記錄差值大於閾值時上側行的縱座標yb ;則(xa ,xb ,ya ,yb )範圍內的圖像即為從原始圖像上摳出的包含物體的圖像。
  4. 如申請專利範圍第1項所述的方法,其中,將該摳出的圖像用單一顏色為背景填充邊界,包括:將該摳出的圖像用RGB(0,0,0)的顏色為背景填充邊界。
  5. 如申請專利範圍第1項所述的方法,其中,將縮放後的圖像分割為第二預定大小的子圖像塊,包括:將縮放後的圖像分割為互不重疊的第二預定大小的子圖像塊。
  6. 如申請專利範圍第1項所述的方法,更包含:比較該摳出圖像的長和寬,如果長大於寬,則將該摳出圖像順時針旋轉90度。
  7. 如申請專利範圍第1項所述的方法,更包含:比較該摳出圖像或該最小正方形圖像上半部分和下半部分灰度值總和,如果上半部分的灰度值總和大於下半部分灰度值總和,則將該摳出圖像或該最小正方形圖像倒置。
  8. 一種圖像特徵提取裝置,包含:摳取單元,用於從原始圖像中摳出所含物體的圖像;填充單元,將該摳出的圖像用單一顏色為背景填充邊界,並使得填充後的圖像成為最小正方形;歸一化處理單元,包括縮放單元和分割單元,該縮放單元用於將正方形圖像全圖等比縮放為第一預定大小的圖像,該分割單元用於將縮放後的圖像分割為第二預定大小的子圖像塊;亮度導數計算和統計單元,用於分別計算水平、垂直、正45°、負45°方向上相鄰像素的亮度導數,並將分別在四個方向導數極值點的個數、以及位於子圖像塊四個邊界上極值點的總個數作為該子圖像塊的特徵向量;合成單元,將所有子圖像塊的特徵向量作為原始圖像的特徵向量。
  9. 如申請專利範圍第8項所述的裝置,其中,該歸一化處理單元更包含:旋轉單元,用於比較該摳出圖像的長和寬,如果長大於寬,則將該填充後的圖像順時針旋轉90度。
  10. 如申請專利範圍第8項所述的裝置,其中,該歸一化處理單元更包含:倒置單元,用於比較該摳出圖像上半部分和下半部分灰度值總和,如果上半圖像的灰度值總和大於下半部分灰度值總和,則將該填充後的圖像倒置。
  11. 如申請專利範圍第8至10項中任一項所述的裝置,其中,所述裝置位於實現搜尋引擎功能的電腦系統中。
TW098129245A 2009-08-31 2009-08-31 Image feature extraction method and device TWI480809B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
TW098129245A TWI480809B (zh) 2009-08-31 2009-08-31 Image feature extraction method and device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW098129245A TWI480809B (zh) 2009-08-31 2009-08-31 Image feature extraction method and device

Publications (2)

Publication Number Publication Date
TW201108126A TW201108126A (en) 2011-03-01
TWI480809B true TWI480809B (zh) 2015-04-11

Family

ID=44835529

Family Applications (1)

Application Number Title Priority Date Filing Date
TW098129245A TWI480809B (zh) 2009-08-31 2009-08-31 Image feature extraction method and device

Country Status (1)

Country Link
TW (1) TWI480809B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI698841B (zh) * 2018-07-27 2020-07-11 香港商阿里巴巴集團服務有限公司 地圖區域合併的資料處理方法及裝置

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI496111B (zh) * 2013-06-19 2015-08-11 Inventec Corp 針腳彎曲檢測方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1273486A (zh) * 1999-04-21 2000-11-15 王海 无荫罩彩色显象管及其数字寻址扫描电路
US6430307B1 (en) * 1996-06-18 2002-08-06 Matsushita Electric Industrial Co., Ltd. Feature extraction system and face image recognition system
US6483943B1 (en) * 1998-10-02 2002-11-19 International Business Machines Corporation Feature value extraction methods and apparatus for image recognition and storage medium for storing image analysis program
US7110568B2 (en) * 2000-06-27 2006-09-19 Solystic Segmentation of a postal object digital image by Hough transform
TW200809268A (en) * 2006-06-30 2008-02-16 Kodak Graphic Comm Canada Co Methods and apparatus for selecting and applying non-contiguous features in a pattern
US7406212B2 (en) * 2005-06-02 2008-07-29 Motorola, Inc. Method and system for parallel processing of Hough transform computations
US7440636B2 (en) * 2002-07-01 2008-10-21 Mitsubishi Denki Kabushiki Kaisha Method and apparatus for image processing
TW200846943A (en) * 2007-05-22 2008-12-01 Inventec Besta Co Ltd Method of searching information by graphic features

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6430307B1 (en) * 1996-06-18 2002-08-06 Matsushita Electric Industrial Co., Ltd. Feature extraction system and face image recognition system
US6483943B1 (en) * 1998-10-02 2002-11-19 International Business Machines Corporation Feature value extraction methods and apparatus for image recognition and storage medium for storing image analysis program
CN1273486A (zh) * 1999-04-21 2000-11-15 王海 无荫罩彩色显象管及其数字寻址扫描电路
US7110568B2 (en) * 2000-06-27 2006-09-19 Solystic Segmentation of a postal object digital image by Hough transform
US7440636B2 (en) * 2002-07-01 2008-10-21 Mitsubishi Denki Kabushiki Kaisha Method and apparatus for image processing
US7406212B2 (en) * 2005-06-02 2008-07-29 Motorola, Inc. Method and system for parallel processing of Hough transform computations
TW200809268A (en) * 2006-06-30 2008-02-16 Kodak Graphic Comm Canada Co Methods and apparatus for selecting and applying non-contiguous features in a pattern
TW200846943A (en) * 2007-05-22 2008-12-01 Inventec Besta Co Ltd Method of searching information by graphic features

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI698841B (zh) * 2018-07-27 2020-07-11 香港商阿里巴巴集團服務有限公司 地圖區域合併的資料處理方法及裝置

Also Published As

Publication number Publication date
TW201108126A (en) 2011-03-01

Similar Documents

Publication Publication Date Title
CN101477692B (zh) 图像特征提取方法及装置
CN109978839B (zh) 晶圆低纹理缺陷的检测方法
WO2022148192A1 (zh) 图像处理方法、图像处理装置以及非瞬时性存储介质
CN105678806B (zh) 一种基于Fisher判别的生猪行为轨迹自动跟踪方法
CN107103320B (zh) 嵌入式医疗数据图像识别及集成方法
WO2015027953A1 (en) Method, apparatus and terminal device for dynamic image processing
US8442327B2 (en) Application of classifiers to sub-sampled integral images for detecting faces in images
US10467765B2 (en) Dense optical flow processing in a computer vision system
WO2016018422A1 (en) Virtual changes to a real object
WO2019205945A1 (zh) 确定广告***位置的方法、计算机设备和存储介质
TWI480809B (zh) Image feature extraction method and device
Chen et al. Preserving motion-tolerant contextual visual saliency for video resizing
JP2014106713A (ja) プログラム、方法、及び情報処理装置
CN117593264A (zh) 一种改进的联合YOLOv5和知识蒸馏的汽车发动机缸孔内壁检测方法
CN113570615A (zh) 一种基于深度学习的图像处理方法、电子设备及存储介质
CN116740375A (zh) 一种图像特征提取方法、***及介质
CN111508045B (zh) 一种图片合成的方法及装置
EP4315254A1 (en) Arranging digital images
CN114648751A (zh) 一种处理视频字幕的方法、装置、终端及存储介质
CN113222990A (zh) 一种基于图像数据增强的芯片计数方法
CN110674778A (zh) 一种高分辨视频图像目标检测方法及装置
CN116777905B (zh) 基于长尾分布数据的智能工业旋转检测方法及***
CN104331696A (zh) 一种基于图形处理单元的图像特征快速提取方法
Chuang et al. Target-preserving content-aware image resizing
Tian et al. Image Nonlinear Resizing Algorithm Based on Salient Region

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees