TW201730813A

TW201730813A - 具有深度資訊之影像處理方法及其電腦程式產品

Info

Publication number: TW201730813A
Application number: TW105105845A
Authority: TW
Inventors: 郭峻因; 簡柏宇
Original assignee: 國立交通大學
Priority date: 2016-02-26
Filing date: 2016-02-26
Publication date: 2017-09-01
Also published as: US20170249503A1; US9824263B2

Abstract

本發明提供一種具有深度資訊之影像處理方法，其是利用一過濾模板，擷取出一手勢區域並過濾影像；同時依據目前手勢區域內多個像素的色調值來調整過濾模板的自適應性門檻值，以及依據前一個時間點以及目前時間點間之景深值來調整下一個時間點過濾模板的模板大小。同時揭露一種具有深度資訊之影像處理電腦程式產品。

Description

具有深度資訊之影像處理方法及其電腦程式產品

本發明是有關一種手勢追蹤的影像處理方法，特別是一種在複雜背景中具深度資訊之影像處理方法及其電腦程式產品。

目前一般具深度資訊之手勢追蹤方法通常使用較高單價之影像擷取裝置或高度雜度之演算法，而無法用一般的相機鏡頭與較低複雜度的演算法以達到所要求之任務。此外，目前大部分的手勢追蹤演算法採用固定門檻值的膚色過濾模板做為前處理步驟，但僅僅使用傳統的膚色過濾模板無法在含有相近膚色的背景下維持系統的準確性及功能性。例如，在複雜背景中原木地板的顏色，可能被誤判為使用者的手部區域，而影響正確的手勢追蹤與辨識結果。

綜上所述，如何在複雜的背景或含有近似膚色區塊的背景下進行手勢追蹤與影像處理便是目前極需努力的目標。

本發明提供一種具有深度資訊之影像處理方法及其電腦程式產品，其是利用一過濾模板，擷取出一手勢區域並過濾影像；同時依據目前手勢區域內多個像素的色調值來調整過濾模板的自適應性門檻值，以及依據前一個時間點以及目前時間點間之景深值來調整下一個時間點過濾模板的模板大小，此影像處理方法有效截取手勢區域，提高後續應用的可能性。

本發明一實施例之一種具有深度資訊之影像處理方法，用以辨識來自一手勢之一第一影像以及一第二影像，影像處理方法包含：取得第一影像及第二影像中多個特徵點，並校正該第一影像及該第二影像，以產生一第一校正影像以及一第二校正影像；判斷第一校正影像以及第二校正影像中的一膚色存在區塊及一膚色可能存在區塊，並利用一過濾模版進行一過濾區塊分配，對第一校正影像與第二校正影像進行一二值化步驟以產生一第一二值化影像以及一第二二值化影像；偵測並追蹤第一二值化影像中的一第一移動區域以及偵測並追蹤第二二值化影像的一第二移動區域，以分別計算出第一移動區域與第二移動區域的一第一位置座標集合及一第二位置座標集合；比對第一位置座標集合及第二位置座標集合，以計算手勢之一深度值；以及比對當前的深度值與前一個時間點的深度值，以調整過濾模版於下一時間點之一模版大小。

本發明另一實施例之內儲具有深度資訊之影像處理程式之電腦程式產品，當電腦載入電腦程式可執行一影像處理方法。影像處理方法包含：取得第一影像及第二影像中多個特徵點，並校正該第一影像及該第二影像，以產生一第一校正影像以及一第二校正影像；判斷第一校正影像以及第二校正影像中的一膚色存在區塊及一膚色可能存在區塊，並利用一過濾模版進行一過濾區塊分配，對第一校正影像與第二校正影像進行一二值化步驟以產生一第一二值化影像以及一第二二值化影像；偵測並追蹤第一二值化影像中的一第一移動區域以及偵測並追蹤第二二值化影像的一第二移動區域，以分別計算出第一移動區域與第二移動區域的一第一位置座標集合及一第二位置座標集合；比對第一位置座標集合及第二位置座標集合，以計算手勢之一深度值；以及依據當前的深度值與前一個時間點的深度值間之一深度差值，調整過濾模版於下一時間點之一模版大小。

以下藉由具體實施例配合所附的圖式詳加說明，當更容易瞭解本發明之目的、技術內容、特點及其所達成之功效。

以下將詳述本發明之各實施例，並配合圖式作為例示。除了這些詳細說明之外，本發明亦可廣泛地施行於其它的實施例中，任何所述實施例的輕易替代、修改、等效變化都包含在本發明之範圍內，並以申請專利範圍為準。在說明書的描述中，為了使讀者對本發明有較完整的瞭解，提供了許多特定細節；然而，本發明可能在省略部分或全部特定細節的前提下，仍可實施。此外，眾所周知的步驟或元件並未描述於細節中，以避免對本發明形成不必要之限制。圖式中相同或類似之元件將以相同或類似符號來表示。特別注意的是，圖式僅為示意之用，並非代表元件實際之尺寸或數量，有些細節可能未完全繪出，以求圖式之簡潔。

請參照圖1，顯示本發明之一實施例之一種具有深度資訊之影像處理方法，用以辨識來自一手勢之一第一影像以及一第二影像。影響處理方法包含：首先，取得第一影像及第二影像中多個特徵點，並校正該第一影像及該第二影像，以產生一第一校正影像以及一第二校正影像(S11)；其次，判斷第一校正影像以及第二校正影像中的一膚色存在區塊及一膚色可能存在區塊，並利用一過濾模版進行一過濾區塊分配，對第一校正影像與第二校正影像進行一二值化步驟以產生一第一二值化影像以及一第二二值化影像(S12)；再來，偵測並追蹤第一二值化影像中的一第一移動區域以及偵測並追蹤第二二值化影像的一第二移動區域，以分別計算出第一移動區域與第二移動區域的一第一位置座標集合及一第二位置座標集合(S13)；接著，比對第一位置座標集合及第二位置座標集合，以計算手勢之一深度值(S14)；最後，比對當前的深度值與前一個時間點的深度值，以調整過濾模版於下一時間點之一模版大小(S15)。上述步驟之技術內容及其他實施例說明如下。

請參照圖2，用以說明圖1中影像校正步驟(S11)之詳細內容。於一實施例中，影像校正步驟包含先擷取第一影像以及第二影像(S111)。舉例而言，第一影像擷取裝置以及第二影像擷取裝置為左右並排設置的左視攝影機以及右視攝影機，藉由第一影像擷取裝置以及第二影像擷取裝置同時擷取一操作背景以產生第一影像以及第二影像。接著，依據第一影像及第二影像中多個像素之多個亮度值，求得二個影像中相似的多個特徵點(S112)。舉例而言，在第一影像中，依據多個像素之多個亮度值，藉由尺度不變特徵轉換法(Scale-invariant feature transform)，計算出多個特徵點；同理，在第二影中，可計算出多個特徵點。再來，將第一影像的多個特徵點與第二影像的多個特徵點進行配對(S113)。接著，藉由透視轉換法(Perspective Transform) 計算出轉換矩陣，將配對後多個特徵點投影到一二維參考平面(two-dimensional reference plane)上，並判斷多個投影特徵點位置座標之偏差程度來進行校正，以產生互相平行之第一校正影像及第二校正影像(S114)。

為了得到較好的影像處理效果，並同時降低環境亮度（luminance）的干擾，可經由一色調轉換步驟，將畫面中多個像素的RGB色彩空間座標值轉換為HSV色彩空間座標值，其中H代表色調(Hue)、S代表飽和度（Saturation）、V代表明度(Value)，並以色調資訊作為後續影像處理所需之參數。

請參照圖3所示不同之影像(a)至(d)，用以說明圖1中二值化影像步驟(S12)之詳細內容。於一實施例中，圖3左上方影像顯示一第一校正影像(a)，其中使用者臉部、操作背景中接近膚色的物件或背景中原木地板顏色，均屬膚色可能存在區塊，然而只有使用者手勢才是須要被追蹤及辨識的處理區域，因此使用者手勢區域屬於膚色存在區域。

請一併參照圖3以及圖6，其中圖6為本發明一實施例之影像處理方法所產生一色調累積直方圖，於此實施例中，圖中灰色部分顯示第一校正影像或該第二校正影像的全影像色調累積直方圖；而圖中黑色部分顯示第一校正影像中或該第二校正影像中移動區域的色調累積直方圖。如圖所示，第一校正影像(如圖3中的影像(a))經上述色調轉換步驟處理後，再透過一全景色調(Hue)過濾器對全景畫面進行膚色過濾後可得一全景二值化影像(如圖3中的影像(b))，其中全景色調過濾器的具有一組固定門檻值包含一色調上限值G1以及一色調下限值G2，可過濾出全景畫面中的膚色可能存在區域，其不僅包含了使用者手勢區域(即膚色存在區域)，也包含了地板顏色或部分背景物件。因此，若僅使用全景色調過濾器將增加演算的複雜度與處理時間，例如地板影像是不需要被追蹤及辨識的處理區域。

為了克服上述問題，如圖3中的影像(c)所示之一實施例中，可藉由一像素差值過濾步驟，從影像畫面中過濾出一移動區域，作為後續膚色過濾的處理區域，以下說明像素差值過濾步驟的技術內容及其效果。相對於使用者臉部或地板影像等靜止影像，使用者手勢是一變動影像。因此，可透過比較前後時間點間之影像畫面差異，以判斷一移動區域，即對應為手勢位置。舉例而言，請參照圖3中所示的第一校正影像(如圖3中的影像(a))，假設一像素在不同時間點 t 的色度座標值以 P (x, y, t)表示，亦即紅綠藍像素值，將前一個時間點與當前時間點之色度座標值相減，其差異若大於一預設閥值T，表示該像素屬於一變動畫面，其差異若小於預設閥值T，則表示該像素屬於一靜止畫面。亦即，透過畫面相減，可以判斷一移動區域B (x, y)，其判斷公式如下：；。其中移動區域B (x, y)值等於1的畫面區域，即是需要進行膚色過濾的處理區域。相較於對全景影像進行膚色過濾，經由像素值過濾找出變動畫面後，再進行後續影像處理步驟，將可大幅降低演算的複雜度與處理時間。

接著，請參照圖4，於一實施例中，提供過濾模板進行一過濾區塊分配，並使第一過濾模板及第二過濾模板分別對應於膚色存在區塊及膚色可能存在區塊(S121)。過濾模板可包含但不限於一第一過濾模板及一第二過濾模板，其中第一過濾模板域定義為膚色存在區塊，第二過濾模板定義為膚色可能存在區塊，且第一過濾模板與第二過濾模板至少一部分重疊。完成過濾區塊分配後，即可進行後續的二值化影像步驟。可以理解的是，過濾模板之模板位置會隨著時間移動，因此需要針對第二模板內的多個像素進行像素值過濾以找出變動畫面，而第一模板內的多個像素僅需進行膚色過濾，以產生對應手勢的二值化影像。亦即，根據過濾模板所分配的區塊，針對位於第一過濾模板之第一校正影像以及第二校正影像進行膚色過濾步驟；及針對位於第二過濾模板之第一校正影像以及第二校正影像進行像素差值過濾步驟及膚色過濾步驟，以產生第一二值化影像及第二二值化影像(S122)。較佳者，請參照圖5，於一實施例中，過濾模板20的第一過濾模板21為橢圓形，且第二過濾模板22之面積大於第一過濾模板的面積，其中橢圓形區塊是透過共變異數矩陣計算而得，其具有一長軸、一短軸以及一旋轉角度，並以橢圓形區域近似一二值化影像之外廓。

然而，傳統的色調過濾器，僅能透過內建的固定門檻值進行膚色過濾，而使用者的膚色可能因人而異。為了減少誤判，通常會放寬固定門檻值的色調範圍，則需要辨識處理的膚色可能存在區域將被過度放大，導致處理時間冗長；反之，若縮小固定門檻值的色調範圍，可能無法判斷完整的膚色存在區域，而無法擷取出完整的手勢影像。於一極端實施例中，若使用者穿戴一異於膚色的手套進行手勢控制，則傳統的膚色過濾器可能無法藉由內建的固定門檻值正確地過濾出所謂的膚色存在區域。

為了克服上述問題，於一實施例中，過濾模板包含一自適應性門檻，可正確過濾出所謂的膚色存在區域，其中自適應性門檻值可依據手勢追蹤的情況與背景光線的亮度而作自適應性調整。請一併參照圖3、圖4及圖6，於一實施例中，過濾模板依據移動區域中多個像素的多個色調值，調整二個自適應性門檻值A1、A2 (S123)。較佳者，過濾模板是依據多個色調值中之一色調最大值MH，決定自適應性門檻值A1、A2，但不以此為限。可以理解的是，針對第一校正影像進行像素值過濾步驟，可以得到一第一移動區域以及一第一二值化影像；同理，針對第二校正影像進行像素值過濾步驟，可以得到一第二移動區域以及一第二二值化影像，同時計算出第一移動區域一第一位置座標集合以及第二移動區域的一第二位置座標集合，如圖3中的影像(c)所示。因此，可依據第一移動區域內及第二移動區域內多個像素的色調值，調整一組自適應性門檻值A1、A2 (S123)，以提高第一二值化影像及第二二值化影像的手勢影像完整度及辨識度，如圖3中的影像(d)所示。需要說明的是，圖6僅為例示性說明，自適應性門檻值A1、A2雖然位於固定門檻值G1、G2之色調範圍內，但不以此為限。於另一實施例中，本發明之影像處理方法僅需自適應性門檻值即可有效過濾膚色，而無需傳統膚色過濾器的固定門檻值，因此可以克服上述使用者膚色變異的問題。亦即，透過自適應性門檻值進行膚色過濾，可完整過濾出一手勢區域 F (x, y)，其判斷公式如下：；。其中，A1為可自適應性調整的一膚色上限值，A2為一膚色下限值，h(x,y)表示校正影像中位於某一座標位置之像素所具有的色調值(Hue)。集合手勢區域 F (x, y)值等於1的像素，即可完整且清晰地顯示手勢之二值化影像，如圖3中影像(d)所示。相較於對全景影像進行膚色過濾，經由像素值過濾找出變動畫面後，再進行後續影像處理步驟，將可大幅降低演算的複雜度與處理時間。

一般而言，當使用者的手勢動作經過一具有與手勢相同膚色的背景物件時，例如使用者的臉部，將可能使過濾模板困在(Stuck)背景物件上，而造成影像追蹤及辨識的誤判。因此，本發明可藉由預測過濾模板之移動軌跡以及調整過濾模板之模板大小，以提高手勢追蹤及辨識的正確度，詳細說明如下。

請繼續參照圖1，於一實施例中，偵測並追蹤移動區域的步驟(S13)包含：比對當前第一二值化影像與前一個時間點所計算出的第一二值化影像，以預測下一個時間點過濾模版的位置；以及比對當前第二二值化影像與前一個時間點所計算出的第二二值化影像，以預測下一個時間點過濾模版的位置。藉由預測下一個時間點過濾模版的位置，即可預測一物件(例如手勢)在下一個時間點畫面的可能出現範圍。接著，依據不同時間的過濾模板的位置變化量，亦即移動區域的位置坐標集合的變化量，可以計算出物件的移動速度，據以調整及控制過濾模板的大小。舉例而言，當過濾模板的移動速度越大，則過濾模板的模版大小越小。因此，當一手勢區域移動經過臉部區域，雖然兩者區域具有相同的膚色，但是過濾模板的大小並不會因此被放大至整體臉部的範圍而困在臉部區域；事實上，過濾模板是依據物件的移動速度，以調整下一個時間點的過濾模板之模板大小並預測可能位置，達成有效區別手勢區域以及臉部區域的效果。

於又一實施例中，過濾模板也可依據物件深度調整模板大小。其中，物件深度的計算，是藉由視差原理，將第一二值化影像以及第二二值化影像間之位移轉換為深度值，因此可以得到手勢的一空間座標值，包含水平座標值，垂直座標值以及深度值。因此，過濾模板可比對當前的深度值與前一個時間點的深度值，以調整該過濾模版於下一時間點之一模版大小。舉例而言，當過濾模板的景深值越來越深，則過濾模板的模版大小越來越小。因此，當一手勢區域移動經過臉部區域，雖然兩者區域具有相同的膚色，但是過濾模板的大小並不會被放大至整體臉部的範圍而困在臉部區域。

於再一實施例中，影像處理方法更包含一手勢辨識步驟：依據手勢之深度值、一移動資訊以及一轉動角度值至少其中之一，輸出對應手勢之一辨識值。舉例而言，由圖1所示追蹤並計算步驟(S13)以及計算手勢深度值步驟(S14)，即可得知手勢之歷史追蹤紀錄當作後續辨識資訊；以圖5所示橢圓形近似手勢之外廓，藉由計算該橢圓形的旋轉角度，即可近似手勢之旋轉角度，但不以此為限。因此，使用者可藉由上述手勢辨識步驟，產生一辨識值，以控制一電子裝置或使用者介面。舉例而言，單純左右揮動手勢可將想操控之數值上下調整，向左揮動數值向上增加，向右揮動則數值向下減少；而利用深度值也可為辨識方式，深度值的大小可決定所想操控何種數值，如電視之音量與頻道的切換；此外將手勢快速搖晃為一啟動機制，此啟動機制可快速調整切換欲想操控之信號，啟動後，信號將判斷手勢之角度，依照手勢角度與垂直線之夾角大小決定變動速度，越大的夾角變動越快，反之則越慢。

特別說明的是，影像處理方法可客製化設定一控制深度範圍，用以避免使用者以外的手勢干擾。於另一實施例中，依據一控制深度範圍，當一手勢之深度值超出控制深度範圍，影像處理方法將停止輸出此手勢的該辨識值。舉例而言，為了在行車環境中有效辨識駕駛的手勢控制，只有駕駛位置的使用者所動作的手勢將被視為有意義的辨識資訊，而後座乘客的手勢動作，將因超出允許的控制深度範圍，而不能產生一辨識值。

可以理解的是，在網路發達的時代，本發明之具有深度資訊之影像處理方法不以儲存於一電腦多媒體（例如：光碟片）為限，亦可為一電腦程式產品以供使用者自網路下載並內儲於一載具中以執行如圖1所示之具有深度資訊之影像處理方法，載具可為一平板電腦、一智慧型手機、一筆記型電腦、一桌上型電腦或一車用系統，但不以此為限。其中圖1所示之具有深度資訊之影像處理方法之步驟及相關實施例已如前所述，在此不再贅述。

綜合上述，本發明之具有深度資訊之影像處理方法及其電腦程式產品，其是利用一過濾模板，擷取出一手勢區域並過濾影像，以大幅降低演算的複雜度與處理時間；同時依據目前手勢區域內多個像素的色調值來調整過濾模板的自適應性門檻值，以避免過濾模板困在背景物件上導致影像追蹤及辨識的誤判；以及依據前一個時間點以及目前時間點間之景深值來調整下一個時間點過濾模板的模板大小，達成有效區別手勢區域以及臉部區域的效果。此外，更可客製化設定一控制深度範圍，用以過濾使用者背景的干擾。

以上所述之實施例僅是為說明本發明之技術思想及特點，其目的在使熟習此項技藝之人士能夠瞭解本發明之內容並據以實施，當不能以之限定本發明之專利範圍，即大凡依本發明所揭示之精神所作之均等變化或修飾，仍應涵蓋在本發明之專利範圍內。

20‧‧‧過濾模板
21‧‧‧第一過濾模板
22‧‧‧第二過濾模板
S11~S15,S111~S114,S121~S123‧‧‧步驟
A1,A2‧‧‧自適應性門檻值
G1,G2‧‧‧固定門檻值
MH‧‧‧色調最大值

圖1為一流程圖，顯示本發明一實施例之影像處理方法之步驟。圖2為一流程圖，顯示本發明另一實施例之影像處理方法之步驟。圖3為一示意圖，顯示本發明一實施例之影像處理方法在不同步驟之影像。圖4為一流程圖，顯示本發明另一實施例之影像處理方法之步驟。圖5為一示意圖，顯示本發明一實施例之影像處理方法之過濾模板。圖6為一色調累積直方圖，顯示本發明一實施例之影像處理方法所產生之色調圖。

S11~S15‧‧‧步驟

Claims

一種具有深度資訊之影像處理方法，用以辨識來自一手勢之一第一影像以及一第二影像，該影像處理方法包含：取得該第一影像及該第二影像中多個特徵點，並校正該第一影像及該第二影像，以產生一第一校正影像以及一第二校正影像；判斷該第一校正影像以及該第二校正影像中的一膚色存在區塊及一膚色可能存在區塊，並利用一過濾模版進行一過濾區塊分配，對該第一校正影像與該第二校正影像進行一二值化步驟以產生一第一二值化影像以及一第二二值化影像；偵測並追蹤該第一二值化影像中的一第一移動區域以及偵測並追蹤該第二二值化影像的一第二移動區域，以分別計算出該第一移動區域與該第二移動區域的一第一位置座標集合及一第二位置座標集合；比對該第一位置座標集合及該第二位置座標集合，以計算該手勢之一深度值；以及比對當前的該深度值與前一個時間點的該深度值，以調整該過濾模版於下一時間點之一模版大小。
如請求項1所述之影像處理方法，更包含：以一第一影像擷取裝置以及一第二影像擷取裝置，擷取該第一影像以及該第二影像。
如請求項1所述之影像處理方法，其中取得該多個特徵點並校正該第一影像及該第二影像的步驟，包含：依據該第一影像及該第二影像中多個像素之多個亮度值，求得該多個特徵點。
如請求項3所述之影像處理方法，其中取得該多個特徵點並校正該第一影像及該第二影像的步驟，包含：將該第一影像的該多個特徵點與該第二影像的該多個特徵點進行配對。
如請求項4所述之影像處理方法，其中取得該多個特徵點並校正該第一影像及該第二影像的步驟，包含：以一透視轉換方法，投影該多個特徵點到一二維參考平面上，使該第一校正影像及該第二校正影像互相平行。
如請求項1所述之影像處理方法，其中該過濾模板包含一第一過濾模板及一第二過濾模板，該第一過濾模板域定義為該膚色存在區塊，該第二過濾模板定義為該膚色可能存在區塊，且該第一過濾模板與該第二過濾模板至少一部分重疊。
如請求項6所述之影像處理方法，其中該第一過濾模板為橢圓形，且該第二過濾模板之面積大於該第一過濾模板的面積。
如請求項6所述之影像處理方法，其中對位於該第一過濾模板之該第一校正影像以及該第二校正影像進行膚色過濾步驟；及對位於該第二過濾模板之該第一校正影像以及該第二校正影像進行像素差值過濾步驟及膚色過濾步驟。
如請求項1所述之影像處理方法，其中該二值化步驟中二值化時使用一自適應性門檻值，該過濾模板依據該第一移動區域及該第二移動區域中至少其中之一者，以及該第一校正影像與該第二校正影像中至少其中之一者的多個色調值調整該自適應性門檻值。
如請求項1所述之影像處理方法，其中偵測並追蹤該第一二值化影像中的該第一移動區域的步驟包含比對當前該第一二值化影像與前一個時間點所計算出的第一二值化影像進行比較以預測下一個時間點該過濾模版的位置；及偵測並追蹤該第二二值化影像中的該第二移動區域的步驟包含比對當前該第二二值化影像與前一個時間點所計算出的第二二值化影像進行比較以預測下一個時間點該過濾模版的位置。
如請求項1所述之影像處理方法，更包含：依據該手勢之該深度值、一移動資訊以及一轉動角度值至少其中之一，輸出對應該手勢之一辨識值。
如請求項11所述之影像處理方法，其中輸出對應該手勢之該辨識值之步驟更包含：依據一控制深度範圍，當該手勢之該深度值超出該控制深度範圍，停止輸出該辨識值。
一種內儲具有深度資訊之影像處理程式之電腦程式產品，當電腦載入該電腦程式並執行後，可完成請求項1至12其中之一所述之影像處理方法。