TWI424360B - Multi-directional face detection method - Google Patents
Multi-directional face detection method Download PDFInfo
- Publication number
- TWI424360B TWI424360B TW096151599A TW96151599A TWI424360B TW I424360 B TWI424360 B TW I424360B TW 096151599 A TW096151599 A TW 096151599A TW 96151599 A TW96151599 A TW 96151599A TW I424360 B TWI424360 B TW I424360B
- Authority
- TW
- Taiwan
- Prior art keywords
- face
- tested
- sub
- detection method
- image block
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Description
一種人臉偵測方法,特別有關於一種人臉偵測方法用以偵測不同轉置位置的待測圖片中的人臉。
人類臉部辨識系統在近幾年廣泛受到研究學者與產業界的高度重視,亦深切期盼對於治安或門禁系統上能有優異的表現,可是這類系統常會受到光線或複雜的紋理等外在因素所影響,因而降低其辨識的成功率。
為了能解決上述外在因素的影響,所以有人提出利用不同的影像特徵如何有效地偵測出待測圖片中的人臉。一般而言,最常用的人臉偵測方法係利用一學習模型將多筆的待測圖片輸入於其中,學習模型會根據所預先設定的影像特徵(feature)來學習如何分辨出待測圖片中是否包含有預先設定的影像特徵。無論是主動式學習架構例如:類神經網路(neural network)、專家系統、模糊系統(fuzzy)或者是分類式的學習架構例如:支持向量機(Support Vector Machine,SVM)、主軸元件分析(Principal Components Analysis,PCA)、Snow法、Boosting法均需要依據所設定的影像特徵才能進行學習的行為。所以要如何建立學習模型與選取適當的影像特徵是影響判斷人臉偵測的關鍵。
為了區別待測圖片中人臉與背景的區別,經常利用Haar-like
演算法來進行人臉特徵的擷取。Haar-like演算法係為一種針對區塊(pattern)的紋理方向性進行特徵處理的方法。因此Haar-like演算法可以有效地區別出人臉與複雜背景的不同。也因為Haar-like演算法係依賴待測圖片中的紋理方向性,所以當待測圖片被轉置成不同方向時(例如,將待測圖片轉置90度、180度或270度),就會造成原本Haar-like演算法所得出的訓練樣本會無法適用在被轉置後的待測圖片。
為了能偵測待測圖片在不同轉置位置中的人臉,所以就要重新利用Haar-like演算法分別對不同轉置位置的待測圖片進行學習訓練。如此一來除了需要耗費大量的記憶體空間外,也會耗費數倍的運算時間。
此外,為了能判斷人臉的大小,一般會利用橢圓樣版(Ellipse mask)選取方法來確認人臉在待測圖片中所佔的區域大小。因此在檢測質量良好的邊緣圖像中,人的臉部和頭部輪廓可以看作近似的橢圓形。在習知技術的橢圓樣版中的長短軸比例是固定的,所以無論是用大的橢圓樣版或是小的橢圓樣版都會出現”所圈選的區域不完整”的問題,請參考「第1a圖」與「第1b圖」所示。當待測圖片100中的人臉120愈大的話,就使用較大橢圓樣版110來選取人臉120;同理,若是待測圖片100中的人臉120愈小的話,就使用較小的橢圓樣版110來選取。
鑒於以上的問題,本發明的主要目的在於提供一種多方向的人臉偵測方法,用以偵測不同轉置位置的待測圖片中的人臉。
為達上述目的,本發明所揭露之多方向的人臉偵測方法包括下列步驟:設定選取框,用以依序從該待測圖片中選取出不同的子影像區塊;計算臉部權重,根據當前所選取的選取框所選取的子影像區塊中的每一像素的特徵值計算臉部權重;計算臉部邊緣權重,根據當前所選取的選取框所選取的子影像區塊中的每一像素的邊界值計算待測圖片此一部份區域中是否具有臉部邊界;執行外形偵測手段,分別將具有臉部邊界的子影像區塊,利用複數個弧線區段分別標記出子影像區塊中的臉部邊界。
本發明係利用各子影像區塊中所包含的臉部特徵與臉部邊緣的權重來判斷出待測圖片中是否為人臉的可能性,再利用外形偵測手段來標記出待測圖片中人臉的外觀。使得待測圖片在經過轉置處理後,仍然可以依據先前訓練結果來套用於其中,不需重新對轉置後的待測圖片進行訓練就可以進行偵測待測圖片中的人臉。
有關本發明的特徵與實作,茲配合圖示作最佳實施例詳細說明如下。
本發明提供一種多方向的人臉偵測方法,用以偵測待測圖片在不同轉置位置時的人臉所在區域。其中,待測圖片的轉置在本
實施例中分別是將待測圖片轉置90度、180度與270度,在此合先敘明。在本發明的較佳實施例中包括以下步驟:
設定選取框,用以依序從待測圖片中選取出不同的子影像區塊。請參考「第2圖」所示,其係為待測圖片之示意圖。為了方便解說本發明之此一步驟,所以把「第2圖」的待測圖片240表示成重疊的子影像區塊230,在依照選取框220所在的位置來決定當前子影像區塊230的特徵計算順序。在本實施例中假設待測圖片240係為96*96像素大小,其中人臉210大小為24*24。而選取框220與每一個子影像區塊230的大小設定為24*24像素大小,選取框220可以依據不同實施態樣中作不同範圍的變化。所以待測圖片240在選取框220由左而右,由上而下漸進的掃描之後,將比對到一個最接近人臉210的選取框220。
計算臉部權重,其係根據選取框220中的每一像素的特徵值計算臉部權重。
計算臉部邊緣權重,其係根據當前所選取的選取框220中的每一像素的顏色值計算待測圖片240此一部份區域中是否具有臉部邊界。
其中計算臉部權重與臉部邊緣權重此一步驟前都會進行一訓
練手段,其係利用Boosting演算法來對多份不同的待測圖片之特徵值進行排序訓練,並且根據訓練結果得到一訓練樣本。根據此訓練樣本用以對其他待測圖片240進行特徵值的優先順序排列。
在本實施例中係利用顏色作為說明,若是利用灰階值的深淺變化作為對待測圖片240之各子影像區塊230之特徵值的話。當前選取框220中若是具有較多的人臉210特徵的話,就會得到較高的特徵值排名。在每一個子影像區塊230中具有24*24像素大小,意即子影像區塊230就有576個像素。若是以每一個像素顏色的深淺變化作為特徵值的話,則在一個子影像區中就有576各特徵值。請參考「第3a圖」與「第3b圖」所示,其係為人臉對各子影像區塊與特徵值排序之對應關係圖。「第3a圖」與「第3b圖」的左方代表的是子影像區塊230;右方係為特徵值排序,越上方的代表對應的特徵值越高,反之亦然。「第3a圖」與「第3b圖」係為包含人臉210的選取框220,但因為「第3a圖」中人臉210位於選取框220的正中間,所以使得其特徵值排序結果比「第3b圖」的特徵值排序結果高。
執行外形偵測手段,分別將具有臉部邊界的子影像區塊230,利用複數個弧線區段410分別標記出子影像區塊230中的臉部邊界。因為人臉210可以被近似地看作橢圓形,但若以習知的橢圓樣版進行圈選的話,會有部分的人臉210區域無法被圈選的。所
以本發明係將橢圓曲線劃分為複數個弧線區段410,將相鄰的臉部邊界的子影像區塊230利用弧線區段410連接起來,請參考「第4a圖」與「第4b圖」所示。
為能更清楚說明本發明之運作流程,請參考「第5圖」所示,其係為本發明之運作流程圖。首先,輸入待測圖片(步驟S510)。設定選取框(步驟S520),用以選取待測圖片240的各子影像區塊230。根據訓練樣本計算選取框中的臉部權重(步驟S530)。計算選取框中的臉部邊緣權重(步驟S540)。執行外形偵測手段(步驟S550),用以標記子影像區塊230的臉部邊界。判斷是否為最後一個子影像區塊(步驟S560),若是最後一個子影像區塊的話,則結束計算(步驟S570);若不為最後一個子影像區塊230的話,則進行步驟S520。
本發明係利用各子影像區塊230中所包含的臉部權重與臉部邊緣權重來判斷出待測圖片中人臉210所佔的區域,再利用外形偵測手段來標記出待測圖片240中人臉210的外觀。使得待測圖片240在經過轉置處理後,仍然可以依據先前訓練結果來套用於其中,不需重新對轉置後的待測圖片240進行訓練就可以進行偵測待測圖片240中的人臉210。
雖然本發明以前述之較佳實施例揭露如上,然其並非用以限定本發明,任何熟習相像技藝者,在不脫離本發明之精神和範圍內,當可作些許之更動與潤飾,因此本發明之專利保護範圍須視
本說明書所附之申請專利範圍所界定者為準。
100‧‧‧待測圖片
110‧‧‧橢圓樣版
120‧‧‧人臉
210‧‧‧人臉
220‧‧‧選取框
230‧‧‧子影像區塊
240‧‧‧待測圖片
410‧‧‧弧線區段
第1a圖係為習知技術之利用橢圓樣版圈選人臉之示意圖。
第1b圖係為習知技術之利用橢圓樣版圈選人臉之示意圖。
第2圖係為待測圖片之示意圖。
第3a圖係為人臉對各子影像區塊與特徵值排序之對應關係圖。
第3b圖係為人臉對各子影像區塊與特徵值排序之對應關係圖。
第4a圖係為本發明之利用弧線區段圈選人臉之示意圖。
第4b圖係為本發明之利用弧線區段圈選人臉之示意圖。
第5圖係為本發明之運作流程圖。
Claims (5)
- 一種多方向的人臉偵測方法,用以選取出在不同轉置(transpose)位置的待測圖片中的人臉,該人臉偵測方法包括下列步驟:設定一選取框,用以依序從該待測圖片中選取出不同的一子影像區塊;計算一臉部權重,根據該選取框所選取的該子影像區塊中的每一像素的特徵值計算該臉部權重,藉以判斷該子影像區塊中是否包括有人臉;計算一臉部邊緣權重,根據當前所選取的該選取框所選取的該子影像區塊中的每一像素的顏色值計算該待測圖片此一部份區域中是否具有臉部邊界;及執行一外形偵測手段,將具有臉部邊界的該些子影像區塊,利用複數個弧線區段分別標記出該些子影像區塊中的臉部邊界。
- 如申請專利範圍第1項所述之多方向的人臉偵測方法,其中該臉部權重計算手段前包括下列步驟:進行一訓練手段,用以判斷該選取框中的每一像素之特徵值的優先權值。
- 如申請專利範圍第2項所述之多方向的人臉偵測方法,其中該特徵值學習手段係為一Boosting演算法。
- 如申請專利範圍第1項所述之多方向的人臉偵測方法,其中該 選取框之大小係為m*m個像素之區域。
- 如申請專利範圍第1項所述之多方向的人臉偵測方法,其中該些弧線區段的組合區域構成一橢圓區域。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW096151599A TWI424360B (zh) | 2007-12-31 | 2007-12-31 | Multi-directional face detection method |
US12/328,891 US8325998B2 (en) | 2007-12-31 | 2008-12-05 | Multidirectional face detection method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW096151599A TWI424360B (zh) | 2007-12-31 | 2007-12-31 | Multi-directional face detection method |
Publications (2)
Publication Number | Publication Date |
---|---|
TW200929008A TW200929008A (en) | 2009-07-01 |
TWI424360B true TWI424360B (zh) | 2014-01-21 |
Family
ID=40798511
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW096151599A TWI424360B (zh) | 2007-12-31 | 2007-12-31 | Multi-directional face detection method |
Country Status (2)
Country | Link |
---|---|
US (1) | US8325998B2 (zh) |
TW (1) | TWI424360B (zh) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8331685B2 (en) | 2008-05-28 | 2012-12-11 | Apple Inc. | Defining a border for an image |
US8452105B2 (en) * | 2008-05-28 | 2013-05-28 | Apple Inc. | Selecting a section of interest within an image |
US8280171B2 (en) * | 2008-05-28 | 2012-10-02 | Apple Inc. | Tools for selecting a section of interest within an image |
US8548251B2 (en) | 2008-05-28 | 2013-10-01 | Apple Inc. | Defining a border for an image |
JP5371685B2 (ja) * | 2009-10-20 | 2013-12-18 | キヤノン株式会社 | 情報処理装置及び制御方法、プログラム |
WO2012030869A2 (en) | 2010-08-30 | 2012-03-08 | Apple Inc. | Multi-image face-based image processing |
US8891864B2 (en) | 2011-02-16 | 2014-11-18 | Apple Inc. | User-aided image segmentation |
TWI511056B (zh) * | 2011-09-20 | 2015-12-01 | Altek Corp | 特徵資料壓縮裝置、多方向人臉偵測系統及其偵測方法 |
KR101582153B1 (ko) * | 2012-02-06 | 2016-01-04 | 네이버 주식회사 | 이미지 자동 보정을 위한 구도 기반 노출 측정 방법 및 장치 |
US9275467B2 (en) | 2012-03-29 | 2016-03-01 | Analog Devices, Inc. | Incremental contour-extraction scheme for binary image segments |
US9177383B2 (en) | 2013-08-29 | 2015-11-03 | Analog Devices Global | Facial detection |
CN105205437B (zh) * | 2014-06-16 | 2018-12-07 | 浙江宇视科技有限公司 | 基于头部轮廓验证的侧脸检测方法及装置 |
JP6201938B2 (ja) * | 2014-09-09 | 2017-09-27 | カシオ計算機株式会社 | 画像補正装置、画像補正方法及びプログラム |
CN106156692B (zh) | 2015-03-25 | 2019-12-13 | 阿里巴巴集团控股有限公司 | 一种用于人脸边缘特征点定位的方法及装置 |
CN117037343B (zh) * | 2023-10-09 | 2023-12-12 | 深圳市高盾电子有限公司 | 一种全自动人脸生物识别智能锁解锁方法及*** |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI245205B (en) * | 2001-09-11 | 2005-12-11 | I-Chang Jou | Fake withdrawing prevention and early warning monitoring system for ATM based on neural network |
TW200612756A (en) * | 2004-06-14 | 2006-04-16 | Monolith Co Ltd | Moving picture encoding method, and moving picture decoding method |
TW200710765A (en) * | 2005-05-31 | 2007-03-16 | Objectvideo Inc | Human detection and tracking for security applications |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB9201006D0 (en) * | 1992-01-17 | 1992-03-11 | Philip Electronic And Associat | Classifying faces |
US5550928A (en) * | 1992-12-15 | 1996-08-27 | A.C. Nielsen Company | Audience measurement system and method |
US5629752A (en) * | 1994-10-28 | 1997-05-13 | Fuji Photo Film Co., Ltd. | Method of determining an exposure amount using optical recognition of facial features |
US6016148A (en) * | 1997-06-06 | 2000-01-18 | Digital Equipment Corporation | Automated mapping of facial images to animation wireframes topologies |
US6173069B1 (en) * | 1998-01-09 | 2001-01-09 | Sharp Laboratories Of America, Inc. | Method for adapting quantization in video coding using face detection and visual eccentricity weighting |
US6529630B1 (en) * | 1998-03-02 | 2003-03-04 | Fuji Photo Film Co., Ltd. | Method and device for extracting principal image subjects |
JP2001357404A (ja) * | 2000-06-14 | 2001-12-26 | Minolta Co Ltd | 画像抽出装置 |
AUPR541801A0 (en) * | 2001-06-01 | 2001-06-28 | Canon Kabushiki Kaisha | Face detection in colour images with complex background |
US7130446B2 (en) * | 2001-12-03 | 2006-10-31 | Microsoft Corporation | Automatic detection and tracking of multiple individuals using multiple cues |
US7916897B2 (en) * | 2006-08-11 | 2011-03-29 | Tessera Technologies Ireland Limited | Face tracking for controlling imaging parameters |
-
2007
- 2007-12-31 TW TW096151599A patent/TWI424360B/zh active
-
2008
- 2008-12-05 US US12/328,891 patent/US8325998B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI245205B (en) * | 2001-09-11 | 2005-12-11 | I-Chang Jou | Fake withdrawing prevention and early warning monitoring system for ATM based on neural network |
TW200612756A (en) * | 2004-06-14 | 2006-04-16 | Monolith Co Ltd | Moving picture encoding method, and moving picture decoding method |
TW200710765A (en) * | 2005-05-31 | 2007-03-16 | Objectvideo Inc | Human detection and tracking for security applications |
Also Published As
Publication number | Publication date |
---|---|
TW200929008A (en) | 2009-07-01 |
US8325998B2 (en) | 2012-12-04 |
US20090169066A1 (en) | 2009-07-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI424360B (zh) | Multi-directional face detection method | |
US7577297B2 (en) | Pattern identification method, device thereof, and program thereof | |
JP4708909B2 (ja) | デジタル画像の対象物検出方法および装置並びにプログラム | |
JP4799105B2 (ja) | 情報処理装置及びその制御方法、コンピュータプログラム、記憶媒体 | |
CN106056064B (zh) | 一种人脸识别方法及人脸识别装置 | |
JP4799104B2 (ja) | 情報処理装置及びその制御方法、コンピュータプログラム、記憶媒体 | |
US8811725B2 (en) | Learning device, learning method, identification device, identification method, and program | |
JP4624889B2 (ja) | 顔検出方法および装置並びにプログラム | |
US20110211233A1 (en) | Image processing device, image processing method and computer program | |
US8103058B2 (en) | Detecting and tracking objects in digital images | |
US8995772B2 (en) | Real-time face detection using pixel pairs | |
US20160364601A1 (en) | Image processing apparatus image processing method, and control program to perform face-detection processing | |
WO2007074844A1 (ja) | 顔パーツの位置の検出方法及び検出システム | |
CN109670501B (zh) | 基于深度卷积神经网络的物体识别与抓取位置检测方法 | |
US8873839B2 (en) | Apparatus of learning recognition dictionary, and method of learning recognition dictionary | |
US20140050392A1 (en) | Method and apparatus for detecting and tracking lips | |
WO2022199710A1 (zh) | 图像融合方法、装置、计算机设备和存储介质 | |
WO2022083123A1 (zh) | 证件定位方法 | |
JP2005309765A (ja) | 画像認識装置、画像抽出装置、画像抽出方法及びプログラム | |
JP5768719B2 (ja) | 学習装置、識別装置、学習識別システム及び学習識別装置 | |
CN100377164C (zh) | 用于检测图像中的人脸肤色区域的方法、装置和存储介质 | |
CN101488181B (zh) | 多方向的人脸检测方法 | |
CN111881732B (zh) | 一种基于svm的人脸质量评价方法 | |
JP4775599B2 (ja) | 目の位置の検出方法 | |
Rahman et al. | Real-time face-based auto-focus for digital still and cell-phone cameras |