KR102330322B1 - 영상 특징 추출 방법 및 장치 - Google Patents

영상 특징 추출 방법 및 장치 Download PDF

Info

Publication number
KR102330322B1
KR102330322B1 KR1020140122597A KR20140122597A KR102330322B1 KR 102330322 B1 KR102330322 B1 KR 102330322B1 KR 1020140122597 A KR1020140122597 A KR 1020140122597A KR 20140122597 A KR20140122597 A KR 20140122597A KR 102330322 B1 KR102330322 B1 KR 102330322B1
Authority
KR
South Korea
Prior art keywords
value
pixel
current pixel
image feature
determining
Prior art date
Application number
KR1020140122597A
Other languages
English (en)
Other versions
KR20160032466A (ko
Inventor
이창교
유병인
김남준
한재준
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020140122597A priority Critical patent/KR102330322B1/ko
Priority to US14/812,252 priority patent/US9773159B2/en
Publication of KR20160032466A publication Critical patent/KR20160032466A/ko
Application granted granted Critical
Publication of KR102330322B1 publication Critical patent/KR102330322B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/751Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/467Encoded features or binary features, e.g. local binary patterns [LBP]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Data Mining & Analysis (AREA)
  • Probability & Statistics with Applications (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

영상 특징 추출 방법 및 장치가 개시된다. 일 실시예에 따르면, 영상 특징 추출 장치는 확률 모델에 기초하여 픽셀의 영상 특징 정보를 결정할 수 있다. 영상 특징 추출 장치는 입력 영상의 일정 영역에 포함된 픽셀들의 픽셀 값들에 기초하여 확률 모델을 결정하고, 확률 모델에 기초하여 현재 픽셀의 확률 값을 결정할 수 있다. 그 후, 영상 특징 추출 장치는 현재 픽셀의 확률 값에 기초하여 이전에 결정된 현재 픽셀의 영상 특징 정보를 변경할지 여부를 결정할 수 있다.

Description

영상 특징 추출 방법 및 장치{METHOD AND APPARATUS FOR EXTRACTING IMAGE FEATURE}
아래의 설명은 영상을 처리하는 기술에 관한 것이다.
일반적으로, 입력 영상에서 정보를 인식하는 과정은 영상으로부터 영상 특징이 추출되고, 인식기가 영상 특징에 기초하여 입력 영상에서 정보를 인식하는 단계를 포함한다. 영상으로부터 추출되는 영상 특징으로는 SIFT(Scale Invariant Feature Transform), HOG(Histogram of Oriented Gradient), Haar, Ferns, LBP(Local Binary Pattern), 또는 MCT(Modified Census Transform) 등이 있다. 위 영상 특징들은 입력 영상의 동일한 패턴에 대해 동일한 특징 값을 나타내고, 인식기는 위와 같은 특성에 기초하여 영상 인식을 수행한다.
일 실시예에 따른 영상 특징 추출 방법은, 커널에 포함된 픽셀들의 픽셀 값들에 기초하여 확률 모델을 결정하는 단계; 상기 커널에 포함된 현재 픽셀의 영상 특징 정보를 결정하는 단계; 및 상기 확률 모델에 기초하여 결정된 상기 현재 픽셀의 확률 값을 랜덤 값과 비교하여 상기 현재 픽셀의 영상 특징 정보를 변경할지 여부를 결정하는 단계를 포함할 수 있다.
일 실시예에 따른 영상 특징 추출 방법에서, 상기 확률 모델을 결정하는 단계는, 상기 커널 내에 중심에 위치하는 중심 픽셀의 픽셀 값과 상기 커널에 포함된 각 픽셀들의 픽셀 값 간의 차이에 기초하여 확률 파라미터를 결정하는 단계; 및 상기 확률 파라미터를 확률 분포 함수에 적용하여 상기 확률 모델을 결정하는 단계를 포함할 수 있다.
일 실시예에 따른 영상 특징 추출 방법에서, 상기 현재 픽셀의 확률 값은, 상기 커널의 중심에 위치하는 중심 픽셀의 픽셀 값과 상기 현재 픽셀의 픽셀 값 간의 차이 값 및 가중치가 상기 확률 모델에 적용되어 결정될 수 있다.
일 실시예에 따른 영상 특징 추출 방법에서, 상기 확률 모델을 결정하는 단계는, 상기 커널에 포함된 픽셀들의 평균 픽셀 값과 상기 커널에 포함된 각 픽셀들의 픽셀 값 간의 차이에 기초하여 확률 파라미터를 결정하는 단계; 및 상기 확률 파라미터를 확률 분포 함수에 적용하여 상기 확률 모델을 결정하는 단계를 포함할 수 있다.
일 실시예에 따른 영상 특징 추출 방법에서, 상기 현재 픽셀의 확률 값은, 상기 커널에 포함된 픽셀들의 평균 픽셀 값과 상기 현재 픽셀의 픽셀 값 간의 차이 값 및 가중치가 상기 확률 모델에 적용되어 결정될 수 있다.
일 실시예에 따른 영상 특징 추출 방법에서, 상기 현재 픽셀의 영상 특징 정보를 변경할지 여부를 결정하는 단계는, 상기 현재 픽셀의 확률 값이 상기 랜덤 값보다 크면, 상기 현재 픽셀의 영상 특징 정보를 변경하고, 상기 현재 픽셀의 확률 값이 상기 랜덤 값보다 크지 않으면, 상기 현재 픽셀의 영상 특징 정보를 유지하는 것으로 결정할 수 있다.
다른 실시예에 따른 영상 특징 추출 방법은, 현재 픽셀의 그라디언트 각도 및 그라디언트 크기를 결정하는 단계; HOG(histogram of Orientation Gradient) 특징을 결정하기 위한 히스토그램에서 상기 그라디언트 각도에 대응하는 빈(bin)을 결정하는 단계; 및 상기 그라디언트 크기가 적용된 확률 모델의 확률 값에 기초하여 상기 현재 픽셀의 그라디언트 각도에 대응하는 빈을 다시 결정할지 여부를 결정하는 단계를 포함할 수 있다.
다른 실시예에 따른 영상 특징 추출 방법에서, 상기 빈을 다시 결정할지 여부를 결정하는 단계는, 상기 확률 값을 랜덤 값과 비교하여 상기 현재 픽셀의 그라디언트 각도에 대응하는 빈을 다시 결정할지 여부를 결정하는 단계를 포함할 수 있다.
다른 실시예에 따른 영상 특징 추출 방법에서, 상기 빈을 다시 결정할지 여부를 결정하는 단계는, 상기 확률 값이 상기 랜덤 값보다 큰 경우, 정규 랜덤 편차(normal random deviate)를 이용하여 상기 현재 픽셀의 그라디언트 각도에 대응하는 빈을 다시 결정하는 단계를 포함할 수 있다.
일 실시예에 따른 얼굴 인식 방법은, 입력 영상으로부터 얼굴의 랜드마크(facial landmark)를 검출하는 단계; 확률 모델에 기초하여 상기 검출된 랜드마크의 영상 특징 정보를 결정하는 단계; 및 상기 랜드마크의 영상 특징 정보에 기초하여 얼굴 인식을 수행하는 단계를 포함할 수 있다.
일 실시예에 따른 얼굴 인식 방법에서, 상기 랜드마크의 영상 특징 정보를 결정하는 단계는, 상기 랜드마크의 영역에 포함된 픽셀의 픽셀 값에 기초하여 상기 랜드마크의 영상 특징 정보를 결정하는 단계; 및 상기 확률 모델에 기초하여 결정된 확률 값을 랜덤 값과 비교하여 상기 결정된 영상 특징 정보를 변경할지 여부를 결정하는 단계를 포함할 수 있다.
일 실시예에 따른 얼굴 인식 방법에서, 상기 영상 특징 정보를 변경할지 여부를 결정하는 단계는, 상기 확률 값이 상기 랜덤 값보다 큰 경우, 상기 랜드마크의 영상 특징 정보를 변경하는 것으로 결정하고, 상기 확률 값이 상기 랜덤 값보다 크지 않은 경우, 상기 랜드마크에 대해 결정된 영상 특징 정보를 그대로 유지하는 것으로 결정하는 단계를 포함할 수 있다.
일 실시예에 따른 영상 특징 추출 장치는, 입력 영상에 포함된 현재 픽셀에 적용할 확률 모델을 결정하는 확률 모델 결정부; 및 상기 확률 모델에 기초하여 상기 현재 픽셀의 영상 특징 정보를 결정하는 영상 특징 결정부를 포함할 수 있다.
일 실시예에 따른 영상 특징 추출 장치에서, 상기 영상 특징 결정부는 상기 확률 모델에 기초하여 결정된 상기 현재 픽셀의 확률 값을 랜덤 값과 비교하여 상기 현재 픽셀의 영상 특징 정보를 변경할지 여부를 결정할 수 있다.
일 실시예에 따른 영상 특징 추출 장치에서, 상기 확률 모델 결정부는 커널에 포함된 픽셀들의 픽셀 값들에 기초하여 상기 확률 모델을 결정할 수 있고, 상기 영상 특징 결정부는 상기 커널의 중심에 위치하는 중심 픽셀의 픽셀 값과 상기 현재 픽셀의 픽셀 값 간의 차이 값에 기초하여 상기 현재 픽셀의 확률 값을 결정할 수 있다.
일 실시예에 따른 영상 특징 추출 장치에서, 상기 확률 모델 결정부는 커널에 포함된 픽셀들의 픽셀 값들에 기초하여 상기 확률 모델을 결정할 수 있고, 상기 영상 특징 결정부는 상기 커널에 포함된 픽셀들의 평균 픽셀 값과 상기 현재 픽셀의 픽셀 값 간의 차이 값에 기초하여 상기 현재 픽셀의 확률 값을 결정할 수 있다.
일 실시예에 따른 영상 특징 추출 장치에서, 상기 영상 특징 결정부는 상기 현재 픽셀의 그라디언트 각도 및 그라디언트 크기를 결정하고, HOG 영상 특징을 결정하기 위한 히스토그램에서 상기 그라디언트 각도에 대응하는 빈을 결정하고, 상기 그라디언트 크기가 적용된 확률 모델의 확률 값에 기초하여 상기 현재 픽셀의 그라디언트 각도에 대응하는 빈을 다시 결정할지 여부를 결정할 수 있다.
도 1은 일 실시예에 따른 영상 특징 추출 장치의 구성을 도시한 도면이다.
도 2는 일 실시예에 따른 커널의 크기에 따른 영역 샘플링을 설명하기 위한 도면이다.
도 3은 일 실시예에 따른 가중치가 적용된 확률 모델의 일례를 도시한 도면이다.
도 4는 일 실시예에 따른 LBP 영상 특징을 추출하기 위한 확률 모델을 결정하는 일례를 설명하기 위한 도면이다.
도 5는 일 실시예에 따른 MCT 영상 특징을 추출하기 위한 확률 모델을 결정하는 일례를 설명하기 위한 도면이다.
도 6은 일 실시예에 따른 영상 특징 추출 방법의 동작을 설명하기 위한 흐름도이다.
도 7은 다른 실시예에 따른 영상 특징 추출 방법의 동작을 설명하기 위한 흐름도이다.
도 8은 일 실시예에 따른 얼굴 인식 방법의 동작을 설명하기 위한 흐름도이다.
이하, 실시예들을 첨부된 도면을 참조하여 상세하게 설명한다. 아래의 특정한 구조적 내지 기능적 설명들은 단지 발명의 실시예들을 설명하기 위한 목적으로 예시된 것으로, 발명의 범위가 본문에 설명된 실시예들에 한정되는 것으로 해석되어서는 안된다. 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다. 또한, 각 도면에 제시된 동일한 참조 부호는 동일한 부재를 나타내며, 공지된 기능 및 구조는 생략하도록 한다.
도 1은 일 실시예에 따른 영상 특징 추출 장치의 구성을 도시한 도면이다.
영상 특징 추출 장치(100)는 입력 영상으로부터 영상 특징(image feature)을 추출한다. 입력 영상은 컬러 영상 또는 그레이 영상(gray image)일 수 있다. 컬러 영상이 영상 특징 추출 장치(100)에 입력된 경우, 영상 특징 추출 장치(100)는 컬러 영상을 각 컬러 공간(color space)에 따라 다양한 채널 영상으로 변환하고, 채널 영상에 기반하여 영상 특징을 추출할 수 있다. 예를 들어, 컬러 영상은 그레이, 블루, 그린, 또는 레드 채널 영상으로 변환될 수 있다.
일 실시예에 따르면, 영상 특징 추출 장치(100)는 입력 영상으로부터 MCT, LBP, 또는 HOG 등의 영상 특징(image feature) 정보를 추출할 수 있다. 영상 특징 추출 장치(100)에 의해 추출된 영상 특징 정보는 영상으로부터 다양한 정보를 인식하는데 이용될 수 있다. 예를 들어, 영상 특징 정보는 얼굴 인식, 객체 인식, 자세 인식, 또는 장면 인식에 이용될 수 있다.
일반적으로, 영상으로부터 정보를 인식하는 과정은 입력 영상으로부터 영상 특징을 추출하고, 인식기가 추출된 영상 특징에 기초하여 정보를 인식하는 단계를 포함한다. 또한, 인식기를 학습시키는 과정에서도 학습 영상으로부터 영상 특징을 추출하고, 인식기가 추출된 영상 특징에 기초하여 인식기를 학습시키는 단계를 포함한다. 위 과정들에서, 입력 영상 또는 학습 영상으로부터 영상 특징을 추출하기 위해 영상 특징 추출 장치(100)가 이용될 수 있다.
영상 특징 추출 장치(100)는 통계적 모델링을 이용하여 영상으로부터 픽셀 수준의 형태 특징을 추출할 수 있다. 예를 들어, 영상 특징 추출 장치(100)는 가우시안 확률 분포 함수(Gaussian Probability Distribution Function; Gaussian PDF) 또는 정규 분포 함수(normal distribution function) 등에 기초한 확률 모델을 이용하여 영상으로부터 LBP, MCT, 또는 HOG 등의 영상 특징을 추출할 수 있다.
영상 특징 추출 장치(100)는 통계적 모델링을 이용함으로써 다양한 학습 데이터를 생성할 수 있고, 실제 인식 과정에서 발생할 수 있는 노이즈를 모델링하여 인식기의 인식률을 개선시킬 수 있다. 영상 특징이 통계적 모델링을 이용하여 추출됨으로써, 입력 영상의 패턴에 따라 다양한 영상 특징이 추출될 수 있다. 영상 특징 추출 장치(100)에 의해 픽셀 수준의 영상 특징이 추출될 때, 영상 특징의 추출 결과가 특정한 분포를 따르는 확률 모델에 의해 변경될 수 있다.
도 1을 참조하면, 영상 특징 추출 장치(100)는 확률 모델 결정부(110) 및 영상 특징 결정부(120)를 포함한다.
확률 모델 결정부(110)는 입력 영상에 포함된 현재 픽셀에 적용할 확률 모델을 결정한다. 예를 들어, 확률 모델 결정부(110)는 가우시안 확률 분포 함수 및 정규 분포 함수 등을 포함하는 다양한 확률 모델 중에서 현재 픽셀에 적용할 확률 모델을 결정할 수 있다. 현재 픽셀은 입력 영상에 포함된 전체 픽셀들 중 영상 특징의 추출 대상이 되는 픽셀을 나타낸다. 확률 모델 결정부(110)는 확률 모델에 가중치를 적용하여 확률 모델이 가질 수 있는 최대 확률 값을 조정할 수 있다.
영상 특징 결정부(120)는 확률 모델에 기초하여 현재 픽셀의 영상 특징 정보를 결정한다. 예를 들어, 영상 특징 결정부(120)는 현재 픽셀의 픽셀 값에 기초하여 LBP, MCT, 또는 HOG의 영상 특징에 대한 영상 특징 정보를 결정할 수 있다. 그 후, 영상 특징 결정부(120)는 이미 결정된 현재 픽셀의 영상 특징 정보를 변경할지 여부를 결정할 수 있다. 예를 들어, 영상 특징 결정부(120)는 확률 모델에 기초하여 결정된 현재 픽셀의 확률 값과 랜덤 값을 비교하여 현재 픽셀의 영상 특징 정보를 변경할 수 있다. 랜덤 값은 균등 분포(uniform distribution)에 기초하여 랜덤하게 결정될 수 있고, 0과 확률 모델이 가질 수 있는 최대 확률 값 사이의 범위 내에서 결정될 수 있다.
LBP 영상 특징은 현재 픽셀에 대한 주변 영역의 상대적인 밝기 변화를 이진수로 코딩한 인덱스 값으로, 커널의 중심 픽셀의 픽셀 값과 주변 픽셀의 픽셀 값 간의 차이를 비교하여 1 또는 0을 맵핑한 영상 특징 정보이다. MCT 영상 특징은 현재 픽셀의 밝기 값과 현재 픽셀을 포함하는 로컬 영역의 평균 밝기 값 간의 차이를 이진수로 코딩한 인덱스 값으로, 커널에 포함된 픽셀들의 평균 픽셀 값과 주변 픽셀의 픽셀 값 간의 차이를 비교하여 1 또는 0을 맵핑한 영상 특징 정보이다. HOG 영상 특징은 대상 영역을 일정 크기의 셀(cell)들로 분할하고, 각 셀마다 에지 픽셀(edge pixel)들의 방향(orientation)에 대한 히스토그램을 획득한 후, 히스토그램들의 빈(bin) 값을 일렬로 연결한 벡터를 나타낸다. 여기서, 에지 픽셀은 그라디언트 크기(gradient magnitude)가 일정 크기 이상인 픽셀을 나타낸다.
이하에서는, 영상 특징 추출 장치(100)가 입력 영상으로부터 LBP, MCT, 및 HOG의 영상 특징을 결정하는 각 과정을 구별하여 설명하도록 한다.
<영상 특징 추출 장치(100)가 LBP의 영상 특징을 결정하는 실시예>
확률 모델 결정부(110)는 입력 영상이 입력되면, 일정 영역 샘플링에 기초하여 통계적 모델로서 확률 모델을 결정할 수 있다. 일정 영역 샘플링을 위해 커널(kernel)이 이용될 수 있다. 확률 모델 결정부(110)는 커널에 포함된 픽셀들의 픽셀 값들에 기초하여 확률 모델을 결정할 수 있다. 커널은 복수의 픽셀들을 포함하는 영역으로 정의될 수 있다. 커널을 통해 입력 영상으로부터 확률 모델이 생성되는데 이용될 영역이 샘플링될 수 있다. 커널은 하나의 영상에 대해 설정되거나 또는 복수의 영상들에 대해 설정될 수 있다. 이에 대한 보다 자세한 설명은 도 2의 관련 설명을 참고할 수 있다.
확률 모델 결정부(110)는 커널 내에 중심에 위치하는 중심 픽셀의 픽셀 값과 커널에 포함된 각 픽셀들의 픽셀 값 간의 차이에 기초하여 확률 파라미터를 결정하고, 결정된 확률 파라미터를 확률 분포 함수에 적용하여 현재 픽셀에 적용할 확률 모델을 결정할 수 있다. 확률 파라미터는 확률 모델에 적용될 평균 및 표준 편차를 포함한다. 확률 모델의 형태는 확률 파라미터에 의해 결정될 수 있다.
확률 모델 결정부(110)는 커널에 포함된 픽셀들 중 중심에 위치하는 중심 픽셀의 픽셀 값과 커널에 포함된 픽셀들의 픽셀 값 간의 차이(또는, 거리) 값을 계산하고, 계산된 차이 값들에 대한 평균과 표준 편차를 계산할 수 있다. 차이 값들에 대한 평균 및 표준 편차는 관련 기술 분야에서 널리 이용되는 일반적인 방법에 의해 계산될 수 있다. 확률 모델 결정부(110)는 차이 값들에 대한 평균과 표준 편차를 다음의 수학식 1과 같은 가우시안 PDF에 적용하여 현재 픽셀에 적용할 확률 모델을 결정할 수 있다.
Figure 112014087528021-pat00001
수학식 1에서,
Figure 112014087528021-pat00002
는 차이 값들에 대한 평균을 나타내고,
Figure 112014087528021-pat00003
는 차이 값들에 대한 표준 편차를 나타낸다.
Figure 112014087528021-pat00004
는 평균이
Figure 112014087528021-pat00005
이고, 표준 편차가
Figure 112014087528021-pat00006
일 때, 확률 변수 x가 가지는 확률 값을 나타낸다.
예를 들어, 도 4와 같이 9개의 픽셀들을 포함하는 커널 영역이 설정된 경우, 확률 모델 결정부(110)는 커널 영역에 포함된 픽셀들 중 중심 픽셀의 픽셀 값과 커널 내 픽셀들의 픽셀 값 간의 차이를 계산할 수 있다. 도 4의 (a)와 같이 커널 내 9개의 픽셀들의 픽셀 값이 주어졌다고 가정하면, 확률 모델 결정부(110)는 중심 픽셀(410)의 픽셀 값인 50과 커널 내 픽셀들의 픽셀 값 간의 차이 값을 계산할 수 있다. 도 4의 (b)는 커널 내 픽셀들의 픽셀 값으로부터 중심 픽셀(410)의 픽셀 값인 50을 뺀 결과 값들을 나타낸다. 확률 모델 결정부(110)는 커널 내 픽셀들에 대한 차이 값들 {30, 50, -30, 60, 0, 160, -10, -30, 50}에 대해 평균 및 표준 편차를 계산하고, 계산된 평균 및 표준 편차를 수학식 1과 같은 확률 분포 함수에 적용하여 확률 모델을 결정할 수 있다.
도 1로 돌아오면, 확률 모델 결정부(110)는 가중치를 확률 모델에 적용하여 해당 확률 모델이 가질 수 있는 최대 확률 값을 제어할 수 있다. 예를 들어, 확률 모델 결정부(110)는 수학식 1에 임의의 상수인 가중치를 곱하여 확률 모델의 최대 확률 값을 조정할 수 있다. 이에 대한 보다 자세한 설명은 도 3의 관련 설명을 참고할 수 있다.
영상 특징 결정부(120)는 LBP 영상 특징에 대한 현재 픽셀의 영상 특징 정보를 결정할 수 있다. 영상 특징 결정부(120)는 커널의 중심에 위치하는 중심 픽셀의 픽셀 값과 현재 픽셀의 픽셀 값을 비교하여 현재 픽셀의 영상 특징 정보를 결정할 수 있다. 예를 들어, 영상 특징 결정부(120)는 현재 픽셀의 픽셀 값이 중심 픽셀의 픽셀 값보다 크면, 현재 픽셀의 영상 특징 정보를 1로 설정하고, 현재 픽셀의 픽셀 값이 중심 픽셀의 픽셀 값보다 크지 않으면, 현재 픽셀의 영상 특징 정보를 0으로 설정할 수 있다.
현재 픽셀에 대한 영상 특징 정보가 결정된 후, 영상 특징 결정부(120)는 확률 모델 결정부(110)에 의해 결정된 확률 모델에 기초하여 현재 픽셀에 대해 결정된 영상 특징 정보를 변경할지 여부를 결정할 수 있다. 확률 모델로부터 결정된 현재 픽셀에 대한 확률 값이 일정한 조건을 만족시키는 경우, 영상 특징 결정부(120)는 현재 픽셀에 대해 결정된 영상 특징 정보를 변경하고, 해당 조건을 만족시키지 않는 경우, 현재 픽셀의 영상 특징 정보를 그대로 유지할 수 있다.
일 실시예에 따르면, 영상 특징 결정부(120)는 확률 모델에 기초하여 결정된 현재 픽셀의 확률 값을 랜덤 값과 비교하여 현재 픽셀의 영상 특징 정보를 변경할지 여부를 결정할 수 있다. 현재 픽셀의 확률 값은 커널 내 중심 픽셀의 픽셀 값과 현재 픽셀의 픽셀 값 간의 차이 값 및 가중치가 확률 모델에 적용되어 결정될 수 있다. 예를 들어, 커널 내 중심 픽셀의 픽셀 값과 현재 픽셀의 픽셀 값 간의 차이 값이 확률 변수 x로서 수학식 1에 입력되고, 수학식 1의 결과 값에 가중치가 곱해진 결과 값이 현재 픽셀에 대한 확률 값으로 결정될 수 있다.
현재 픽셀의 확률 값이 랜덤 값보다 큰 경우, 영상 특징 결정부(120)는 현재 픽셀에 대해 결정된 영상 특징 정보를 변경할 수 있다. 반대로, 현재 픽셀의 확률 값이 랜덤 값보다 크지 않은 경우, 영상 특징 결정부(120)는 현재 픽셀에 대해 결정된 영상 특징 정보를 그대로 유지하는 것으로 결정할 수 있다. 예를 들어, 현재 픽셀에 대해 결정된 LBP 영상 특징의 영상 특징 정보가 1이고, 확률 모델에 기초하여 결정된 현재 픽셀의 확률 값이 랜덤 값보다 큰 경우, 영상 특징 결정부(120)는 현재 픽셀의 영상 특징 정보를 반대인 0으로 변경할 수 있다. 반대로, 현재 픽셀의 확률 값이 랜덤 값보다 크지 않은 경우, 영상 특징 결정부(120)는 현재 픽셀의 영상 특징 정보 1을 유지하고, 다른 픽셀을 대상으로 LBP 영상 특징을 결정하는 과정을 수행할 수 있다.
현재 픽셀에 대한 LBP 영상 특징이 결정된 경우, 영상 특징 추출 장치(100)는 커널 내 다른 픽셀들에 대해 LBP 영상 특징을 결정할 수 있다. 커널 내 모든 픽셀에 대해 LBP 영상 특징이 결정된 경우, 영상 특징 추출 장치(100)는 다른 커널에 포함된 픽셀들에 대해 LBP 영상 특징을 결정할 수 있다.
<영상 특징 추출 장치(100)가 MCT의 영상 특징을 결정하는 실시예>
확률 모델 결정부(110)는 입력 영상이 입력되면, 일정 영역 샘플링에 기초하여 통계적 모델로서 확률 모델을 결정할 수 있다. MCT 영상 특징을 추출하는 과정에서도 일정 영역 샘플링을 위해 커널이 이용될 수 있다. 확률 모델 결정부(110)는 커널에 포함된 픽셀들의 픽셀 값들에 기초하여 확률 모델을 결정할 수 있다. 커널은 하나의 영상에 대해 설정되거나 또는 복수의 영상들에 대해 설정될 수 있다. 이에 대한 보다 자세한 설명은 도 2의 관련 설명을 참고할 수 있다.
확률 모델 결정부(110)는 커널에 포함된 픽셀들의 평균 픽셀 값과 커널에 포함된 각 픽셀들의 픽셀 값 간의 차이에 기초하여 확률 파라미터를 결정할 수 있다. 확률 파라미터는 확률 모델에 적용될 평균 및 표준 편차를 포함한다. 확률 모델 결정부(110)는 결정된 확률 파라미터를 확률 분포 함수에 적용하여 현재 픽셀에 적용할 확률 모델을 결정할 수 있다.
확률 모델 결정부(110)는 커널에 포함된 픽셀들의 평균 픽셀 값과 커널에 포함된 픽셀들의 픽셀 값 간의 차이(또는, 거리) 값을 계산하고, 계산된 차이 값들에 대한 평균과 표준 편차를 계산할 수 있다. 차이 값들에 대한 평균 및 표준 편차는 관련 기술 분야에서 널리 이용되는 일반적인 방법에 의해 계산될 수 있다. 확률 모델 결정부(110)는 차이 값들에 대한 평균과 표준 편차를 수학식 1과 같은 가우시안 PDF에 적용하여 현재 픽셀에 적용할 확률 모델을 결정할 수 있다.
예를 들어, 도 5와 같이 9개의 픽셀들을 포함하는 커널 영역이 설정된 경우, 확률 모델 결정부(110)는 커널에 포함된 픽셀들의 평균 픽셀 값과 커널 내 픽셀들의 픽셀 값 간의 차이를 계산할 수 있다. 도 5의 (a)와 같이 커널 내 9개의 픽셀들의 픽셀 값이 주어졌다고 가정하면, 확률 모델 결정부(110)는 커널에 포함된 픽셀들의 평균 픽셀 값인 81과 커널 내 픽셀들의 픽셀 값 간의 차이 값을 계산할 수 있다. 도 5의 (b)는 커널 내 픽셀들의 픽셀 값으로부터 커널 내 픽셀 들의 평균 픽셀 값인 81을 뺀 결과 값들을 나타낸다. 확률 모델 결정부(110)는 커널 내 픽셀들에 대한 차이 값들 {-1, 19, -61, 29, -31, 129, -41, -61, 18}에 대해 평균 및 표준 편차를 계산하고, 계산된 평균 및 표준 편차를 수학식 1과 같은 확률 분포 함수에 적용하여 확률 모델을 결정할 수 있다.
도 1로 돌아오면, 확률 모델 결정부(110)는 가중치를 확률 모델에 적용하여 해당 확률 모델이 가질 수 있는 최대 확률 값을 제어할 수 있다. 예를 들어, 확률 모델 결정부(110)는 수학식 1에 임의의 상수인 가중치를 곱하여 확률 모델의 최대 확률 값을 조정할 수 있다. 이에 대한 보다 자세한 설명은 도 3의 관련 설명을 참고할 수 있다.
영상 특징 결정부(120)는 MCT 영상 특징에 대한 현재 픽셀의 영상 특징 정보를 결정할 수 있다. 영상 특징 결정부(120)는 커널에 포함된 픽셀들의 평균 픽셀 값과 현재 픽셀의 픽셀 값을 비교하여 현재 픽셀의 영상 특징 정보를 결정할 수 있다. 예를 들어, 영상 특징 결정부(120)는 현재 픽셀의 픽셀 값이 커널에 포함된 픽셀들의 평균 픽셀 값보다 크면, 현재 픽셀의 영상 특징 정보를 1로 설정하고, 현재 픽셀의 픽셀 값이 커널에 포함된 픽셀들의 평균 픽셀 값보다 크지 않으면, 현재 픽셀의 영상 특징 정보를 0으로 설정할 수 있다.
현재 픽셀에 대한 영상 특징 정보가 결정된 후, 영상 특징 결정부(120)는 확률 모델 결정부(110)에 의해 결정된 확률 모델에 기초하여 현재 픽셀에 대해 결정된 영상 특징 정보를 변경할지 여부를 결정할 수 있다. 확률 모델로부터 결정된 현재 픽셀에 대한 확률 값이 일정한 조건을 만족시키는 경우, 영상 특징 결정부(120)는 현재 픽셀에 대해 결정된 영상 특징 정보를 변경하고, 해당 조건을 만족시키지 않는 경우, 현재 픽셀의 영상 특징 정보를 그대로 유지할 수 있다.
일 실시예에 따르면, 영상 특징 결정부(120)는 확률 모델에 기초하여 결정된 현재 픽셀의 확률 값을 랜덤 값과 비교하여 현재 픽셀의 영상 특징 정보를 변경할지 여부를 결정할 수 있다. 현재 픽셀의 확률 값은 커널에 포함된 픽셀들의 평균 픽셀 값과 현재 픽셀의 픽셀 값 간의 차이 값 및 가중치가 확률 모델에 적용되어 결정될 수 있다. 예를 들어, 커널에 포함된 픽셀들의 평균 픽셀 값과 현재 픽셀의 픽셀 값 간의 차이 값이 확률 변수 x로서 수학식 1에 입력되고, 수학식 1의 결과 값에 가중치가 곱해진 결과 값이 현재 픽셀에 대한 확률 값으로 결정될 수 있다.
현재 픽셀의 확률 값이 랜덤 값보다 큰 경우, 영상 특징 결정부(120)는 현재 픽셀에 대해 결정된 영상 특징 정보를 변경할 수 있다. 반대로, 현재 픽셀의 확률 값이 랜덤 값보다 크지 않은 경우, 영상 특징 결정부(120)는 현재 픽셀에 대해 결정된 영상 특징 정보를 그대로 유지하는 것으로 결정할 수 있다. 예를 들어, 현재 픽셀에 대해 결정된 MCT 영상 특징의 영상 특징 정보가 1이고, 확률 모델에 기초하여 결정된 현재 픽셀의 확률 값이 랜덤 값보다 큰 경우, 영상 특징 결정부(120)는 현재 픽셀의 영상 특징 정보를 0으로 변경할 수 있다. 반대로, 현재 픽셀의 확률 값이 랜덤 값보다 크지 않은 경우, 영상 특징 결정부(120)는 현재 픽셀의 영상 특징 정보를 1로 유지하고, 다른 픽셀에 대해 MCT 영상 특징을 결정하는 과정을 수행할 수 있다.
현재 픽셀에 대한 MCT 영상 특징이 결정된 경우, 영상 특징 추출 장치(100)는 커널 내 다른 픽셀들에 대해 MCT 영상 특징을 결정할 수 있다. 커널 내 모든 픽셀에 대해 MCT 영상 특징이 결정된 경우, 영상 특징 추출 장치(100)는 다른 커널에 포함된 픽셀들에 대해 MCT 영상 특징을 결정할 수 있다.
<영상 특징 추출 장치(100)가 HOG의 영상 특징을 결정하는 실시예>
확률 모델 결정부(110)는 현재 픽셀에 적용할 확률 모델을 결정할 수 있다. 예를 들어, 확률 모델 결정부(110)는 평균이 0이고, 표준 편차가 1인 가우시안 PDF 또는 정규 분포 함수 등을 현재 픽셀에 적용할 확률 모델로 결정할 수 있다. 예를 들어, 확률 모델 결정부(110)는 수학식 1에 평균 0, 표준 편차 1을 입력하여 현재 픽셀에 적용할 확률 모델을 결정할 수 있다. 확률 모델 결정부(110)는 가중치를 확률 모델에 적용하여 해당 확률 모델이 가질 수 있는 최대 확률 값을 제어할 수 있다. 예를 들어, 확률 모델 결정부(110)는 수학식 1에 임의의 상수인 가중치를 곱하여 확률 모델의 최대 확률 값을 조정할 수 있다. 이에 대한 보다 자세한 설명은 도 3의 관련 설명을 참고할 수 있다.
영상 특징 결정부(120)는 입력 영상으로부터 HOG 영상 특징을 추출할 수 있다. 영상 특징 결정부(120)는 현재 픽셀에 포함하는 입력 영상에 적용할 마스크의 크기를 결정할 수 있다. 예를 들어, 영상 특징 결정부(120)는 1D(dimensional) centered 타입, 1D uncentered 타입, 1D cubic-corrected 타입, 2x2 diagonal 타입, 및 3X3 Sobel 타입 등의 마스크 타입들 중에서 입력 영상에 적용할 어느 하나의 마스크 타입을 결정할 수 있다.
영상 특징 결정부(120)는 마스크의 크기를 결정한 후, 입력 영상과 마스크 간의 컨볼루션(convolution) 결과에 기초하여 현재 픽셀의 그라디언트 각도(gradient angle) 및 그라디언트 크기(gradient magnitude)를 결정할 수 있다. 예를 들어, 영상 특징 결정부(120)는 X 방향 및 Y 방향에 대한 3X3 Sobel 마스크를 이용하여 현재 픽셀의 휘도 값에 대한 그라디언트 각도 및 그라디언트 크기를 결정할 수 있다. 현재 픽셀의 그라디언트 각도 및 그라디언트 크기는 벡터로 표현될 수 있다. 예를 들어, 현재 픽셀의 그라디언트 각도 및 그라디언트 크기는, 현재 픽셀의 위치를 기준으로 그라디언트 각도를 수평 방향(x축)에 대한 각도로 하고, 그라디언트 크기를 벡터의 크기로 하는 벡터로 표현될 수 있다.
예를 들어, 영상 특징 결정부(120)는 다음의 수학식 2에 기초하여 현재 픽셀의 그라디언트 크기를 결정할 수 있고, 수학식 3에 기초하여 현재 픽셀의 그라디언트 각도를 결정할 수 있다.
Figure 112014087528021-pat00007
Figure 112014087528021-pat00008
수학식 2에서, magnitude(x,y)는 입력 영상 내 (x,y) 위치에 존재하는 현재 픽셀의 그라디언트 크기를 나타낸다. dx(x,y)는 현재 픽셀에서 x 방향에 대한 그라디언트를 나타내고, dy(x,y)는 현재 픽셀에서 y방향에 대한 그라디언트를 나타낸다. 수학식 3에서,
Figure 112014087528021-pat00009
는 입력 영상 내 (x,y) 위치에 존재하는 현재 픽셀의 그라디언트 각도를 나타낸다.
Figure 112014087528021-pat00010
는 0에서
Figure 112014087528021-pat00011
(radian)사이의 각도를 가진다.
영상 특징 결정부(120)는 HOG 영상 특징을 결정하기 위한 히스토그램(histogram)에서 현재 픽셀의 그라디언트 각도에 대응하는 빈(bin)(또는, 계급)을 결정할 수 있다. 복수의 픽셀들에 대해 결정된 그라디언트 크기 및 그라디언트 각도에 기초하여 히스토그램이 생성될 수 있고, 히스토그램에서 횡축은 그라디언트 각도를 나타내고, 종축은 그라디언트 크기의 빈도를 나타낼 수 있다. 히스토그램에서 표현되는 그라디언트 각도 범위(0 에서
Figure 112014087528021-pat00012
(radian)사이의 구간)는 일정한 수의 구간(즉, 빈)들로 구분될 수 있다. 예를 들어, 그라디언트 각도가 8개의 빈들로 양자화된 구간을 횡축하고, 이 양자화된 그라디언트 각도에 대한 그라디언트 크기의 합계치를 종축으로 하는 히스토그램이 생성될 수 있다. 영상 특징 결정부(120)는 생성된 히스토그램에서 그라디언트 각도에 대한 빈들 중에서 현재 픽셀의 그라디언트 각도에 해당하는 빈을 결정할 수 있다.
그 후, 영상 특징 결정부(120)는 확률 모델에 기초하여 현재 픽셀에 대응하는 빈을 다시 결정할지 여부를 결정할 수 있다. 영상 특징 결정부(120)는 현재 픽셀의 그라디언트 크기가 적용된 확률 모델의 확률 값에 기초하여 현재 픽셀의 그라디언트 각도에 대응하는 빈을 다시 결정할지 여부를 결정할 수 있다. 여기서, 현재 픽셀이 가지는 확률 값은 가중치가 적용된 값일 수 있다. 예를 들어, 현재 픽셀의 확률 값은, 평균이 0이고, 표준 편차가 1인 가우시안 PDF에 확률 변수로서 현재 픽셀의 그라디언트 크기가 입력된 결과 값에 가중치가 곱해진 값일 수 있다.
영상 특징 결정부(120)는 현재 픽셀의 확률 값을 랜덤 값과 비교하여 현재 픽셀의 그라디언트 각도에 대응하는 빈을 다시 결정할지 여부를 결정할 수 있다. 영상 특징 결정부(120)는 현재 픽셀의 확률 값이 랜덤 값보다 큰 경우, 정규 랜덤 편차(normal random deviate)를 이용하여 현재 픽셀의 그라디언트 각도에 대응하는 빈을 다시 결정할 수 있다. 반대로, 영상 특징 결정부(120)는 현재 픽셀의 확률 값이 랜덤 값보다 크지 않은 경우, 현재 픽셀의 그라디언트 각도에 대응하는 빈을 유지할 수 있다.
현재 픽셀의 그라디언트 각도에 대응하는 빈이 최종적으로 결정된 경우, 영상 특징 결정부(120)는 입력 영상 내 다른 픽셀들에 대해 HOG 영상 특징을 결정할 수 있다. 입력 영상의 복수의 영역들에서 생성된 히스토그램들은 대응하는 에지 강도 분포를 나타내는 선분들로 표시될 수 있고, 선분들을 통해 입력 영상의 에지 강도 분포가 식별될 수 있다.
도 2는 일 실시예에 따른 커널의 크기에 따른 영역 샘플링을 설명하기 위한 도면이다.
영상 특징 추출 장치는 입력 영상(210)으로부터 확률 모델을 결정하기 위해 커널을 이용할 수 있다. 커널을 통해 확률 모델이 생성되는데 이용될 영역이 샘플링될 수 있다. 여기서, 커널의 크기에 따라 (a)와 같이 입력 영상(210)에서 패치(patch)단위로 샘플링되거나, (b)와 같이 입력 영상(210)에서 국부 영역(local region)이 샘플링될 수 있다. 또는, (c)와 같이 입력 하나의 영상 전체가 샘플링되거나, (d)와 같이 입력 영상(210)을 포함한 복수의 영상들(예를 들어, 동영상에 포함된 복수의 영상 프레임들)이 샘플링될 수도 있다. 복수의 영상들이 샘플링되는 경우, 복수의 영상들에 포함되는 픽셀들의 픽셀 값에 기초하여 확률 모델에 적용될 평균과 표준 편차가 결정될 수 있다.
도 3은 일 실시예에 따른 가중치가 적용된 확률 모델의 일례를 도시한 도면이다.
가중치에 기초하여 확률 모델이 가질 수 있는 최대 확률 값이 결정될 수 있다. 예를 들어, 확률 모델이 확률 변수 x가 평균
Figure 112014087528021-pat00013
일 때 최대 확률 값을 가지는 가우시안 PDF라고 가정하면, 확률 모델에 적용되는 가중치 G의 값에 따라 가우시안 PDF의 최대 확률 값이 달라질 수 있다. 가중치 G의 값이 작아질수록 가우시안 PDF의 최대 확률 값이 작아질 수 있다. 확률 모델에 기초하여 입력 영상의 영상 특징 정보가 결정되므로, 각 경우마다 가중치 G의 값이 동일하다 하더라도 결정된 영상 특징 정보는 동일하지 않을 수 있다.
도 6은 일 실시예에 따른 영상 특징 추출 방법의 동작을 설명하기 위한 흐름도이다.
단계(610)에서, 영상 특징 추출 장치는 현재 픽셀에 적용할 확률 모델을 결정할 수 있다. 영상 특징 추출 장치는 커널에 기초하여 일정 영역 샘플링을 수행하고, 커널에 포함된 픽셀들의 픽셀 값에 기초하여 확률 모델을 결정할 수 있다. 영상 특징 추출 장치는 확률 모델에 가중치를 적용하여 확률 모델이 가질 수 있는 최대 확률 값을 조정할 수 있다.
예를 들어, 영상 특징 추출 장치가 입력 영상으로부터 LBP 영상 특징을 추출하는 경우, 영상 특징 추출 장치는 커널 내에 중심에 위치하는 중심 픽셀의 픽셀 값과 커널에 포함된 각 픽셀들의 픽셀 값 간의 차이에 기초하여 확률 파라미터를 결정하고, 결정된 확률 파라미터를 가우시안 PDF 또는 정규 분포 함수 등의 확률 분포 함수에 적용하여 현재 픽셀에 적용할 확률 모델을 결정할 수 있다.
다른 예로, 영상 특징 추출 장치가 입력 영상으로부터 MCT 영상 특징을 추출하는 경우, 영상 특징 추출 장치는 커널에 포함된 픽셀들의 평균 픽셀 값과 커널에 포함된 픽셀들의 픽셀 값 간의 차이 값에 기초하여 확률 파라미터를 결정하고, 결정된 확률 파라미터를 가우시안 PDF 또는 정규 분포 함수 등의 확률 분포 함수에 적용하여 현재 픽셀에 적용할 확률 모델을 결정할 수 있다.
단계(620)에서, 영상 특징 추출 장치는 현재 픽셀의 영상 특징 정보를 결정할 수 있다.
예를 들어, 영상 특징 추출 장치가 LBP 영상 특징을 추출하는 경우, 영상 특징 추출 장치는 커널의 중심에 위치하는 중심 픽셀의 픽셀 값과 현재 픽셀의 픽셀 값을 비교하여 현재 픽셀의 영상 특징 정보를 결정할 수 있다. 영상 특징 추출 장치는 현재 픽셀의 픽셀 값이 중심 픽셀의 픽셀 값보다 크면, 현재 픽셀의 영상 특징 정보를 1로 설정하고, 그 이외의 경우에는 현재 픽셀의 영상 특징 정보를 0으로 설정할 수 있다.
다른 예로, 영상 특징 추출 장치가 MCT 영상 특징을 추출하는 경우, 영상 특징 추출 장치는 커널에 포함된 픽셀들의 평균 픽셀 값과 현재 픽셀의 픽셀 값을 비교하여 현재 픽셀의 영상 특징 정보를 결정할 수 있다. 영상 특징 추출 장치는 현재 픽셀의 픽셀 값이 커널에 포함된 픽셀들의 평균 픽셀 값보다 크면, 현재 픽셀의 영상 특징 정보를 1로 설정하고, 그 이외의 경우에는 현재 픽셀의 영상 특징 정보를 0으로 설정할 수 있다.
단계(630)에서, 영상 특징 추출 장치는 랜덤 값을 결정할 수 있다. 랜덤 값은 균등 분포에 기초하여 결정될 수 있고, 0과 확률 모델이 가질 수 있는 최대 확률 값 사이의 범위 내에서 결정될 수 있다.
단계(640)에서, 영상 특징 추출 장치는 현재 픽셀의 확률 값을 랜덤 값과 비교하여 현재 픽셀의 영상 특징 정보를 변경할지 여부를 결정할 수 있다.
현재 픽셀의 확률 값이 랜덤 값보다 크지 않은 경우, 단계(650)에서 영상 특징 추출 장치는 현재 픽셀의 영상 특징 정보를 유지할 수 있다. 현재 픽셀의 확률 값이 랜덤 값보다 큰 경우, 단계(660)에서 영상 특징 추출 장치는 현재 픽셀의 영상 특징 정보를 변경할 수 있다. 일 실시예에 따르면, 영상 특징 추출 장치는 현재 픽셀의 영상 특징 정보를 이전에 결정된 값의 반대의 값으로 변경할 수 있다. 예를 들어, 현재 픽셀에 대해 설정된 영상 특징 정보가 0이라면, 영상 특징 추출 장치는 현재 픽셀의 영상 특징 정보를 1로 변경하고, 현재 픽셀에 대해 설정된 영상 특징 정보가 1이라면, 영상 특징 추출 장치는 현재 픽셀의 영상 특징 정보를 0으로 변경할 수 있다.
단계(670)에서, 영상 특징 추출 장치는 커널 내 모든 픽셀에 대해 단계(610) 내지 단계(670)의 과정이 수행되었는지 여부를 판단할 수 있다. 커널 내 모든 픽셀에 대해 픽셀 값이 결정되지 않은 경우, 단계(680)에서, 영상 특징 추출 장치는 커널 내 다음 픽셀로 이동하여 위 단계(610) 내지 단계(670)의 과정을 다시 수행할 수 있다.
도 7은 다른 실시예에 따른 영상 특징 추출 방법의 동작을 설명하기 위한 흐름도이다.
단계(710)에서, 영상 특징 추출 장치는 현재 픽셀의 그라디언트 각도 및 그라디언트 크기를 결정할 수 있다. 영상 특징 장치는 입력 영상과 마스크 간의 컨볼루션 결과에 기초하여 현재 픽셀의 그라디언트 각도와 그라디언트 크기를 결정할 수 있다.
단계(720)에서, 영상 특징 추출 장치는 HOG 영상 특징을 결정하기 위한 히스토그램에서 현재 픽셀의 그라디언트 각도에 대응하는 빈을 결정할 수 있다.
단계(730)에서, 영상 특징 추출 장치는 랜덤 값을 결정할 수 있다. 랜덤 값은 균등 분포에 기초하여 결정될 수 있고, 0과 확률 모델이 가질 수 있는 최대 확률 값 사이의 범위 내에서 결정될 수 있다.
단계(740)에서, 영상 특징 추출 장치는 현재 픽셀의 확률 값을 랜덤 값과 비교하여 현재 픽셀의 그라디언트 각도에 대응하는 빈을 다시 결정할지 여부를 결정할 수 있다.
현재 픽셀의 확률 값이 랜덤 값보다 크지 않은 경우, 단계(750)에서, 영상 특징 추출 장치는 현재 픽셀의 그라디언트 각도에 대응하는 현재 빈을 계속 유지할 수 있다. 현재 픽셀의 확률 값이 랜덤 값보다 큰 경우, 단계(760)에서, 영상 특징 추출 장치는 현재 픽셀의 그라디언트 각도에 대응하는 빈을 다시 결정할 수 있다. 예를 들어, 영상 특징 추출 장치는 정규 랜덤 편차를 이용하여 히스토그램에서 현재 픽셀의 그라디언트 각도에 대응하는 빈을 다시 결정할 수 있다.
단계(770)에서, 영상 특징 추출 장치는 입력 영상 내 모든 픽셀에 대해 단계(710) 내지 단계(760)의 과정이 수행되었는지 여부를 판단할 수 있다. 입력 영상에서 단계(710) 내지 단계(760)의 과정이 수행되지 않은 픽셀이 존재하는 경우, 단계(780)에서, 영상 특징 추출 장치는 다음 픽셀로 이동하여 단계(710) 내지 단계(770)의 과정을 다시 수행할 수 있다.
도 8은 일 실시예에 따른 도 1의 영상 특징 추출 장치(100)를 포함하는 인식기에 의해 수행되는 얼굴 인식 방법의 동작을 설명하기 위한 흐름도이다.
단계(810)에서, 인식기는 입력 영상으로부터 얼굴의 랜드마크(facial landmark)를 검출할 수 있다. 인식기는 입력 영상으로부터 사용자의 얼굴 영역을 검출하고, 얼굴 영역으로부터 랜드마크를 검출할 수 있다. 얼굴의 랜드마크는 얼굴의 국부적인(local) 특징으로서, 눈의 양쪽 끝, 눈썹의 양쪽 끝, 코 끝, 또는 입 꼬리 등을 포함할 수 있다.
단계(820)에서, 인식기는 확률 모델에 기초하여 단계(810)에서 검출된 랜드마크의 영상 특징 정보를 결정할 수 있다. 예를 들어, 인식기는 가우시안 PDF 또는 정규 분포 함수 등에 기초한 확률 모델을 이용하여 LBP, MCT, 또는 HOG 등과 같은 랜드마크의 영상 특징 정보를 결정할 수 있다.
일 실시예에 따르면, 인식기는 랜드마크의 영역에 포함된 픽셀의 픽셀 값에 기초하여 랜드마크에 대한 LBP, MCT, 또는 HOG 등의 영상 특징 정보를 결정한 후, 확률 모델에 기초하여 위 결정된 영상 특징 정보를 변경할지 여부를 결정할 수 있다. 인식기는 확률 모델에 기초하여 현재 랜드마크에 대한 확률 값을 결정하고, 결정된 확률 값과 랜덤 값을 비교하여 현재 랜드마크에 대해 결정된 영상 특징 정보를 결정할지 여부를 결정할 수 있다. 결정된 확률 값이 랜덤 값보다 큰 경우, 인식기는 랜드마크의 영상 특징 정보를 변경하는 것으로 결정하고, 해당 확률 값이 랜덤 값보다 크지 않은 경우, 랜드마크에 대해 결정된 영상 특징 정보를 그대로 유지하는 것으로 결정할 수 있다. 예를 들어, 현재 랜드마크에 대해 처음에 결정된 LBP의 영상 특징 정보가 1의 값을 가진 것으로 결정되었으나, 확률 모델에 기초한 확률 값이 랜덤 값보다 큰 경우, 인식기는 해당 랜드마크의 영상 특징 정보를 1에서 0으로 변경할 수 있다. 인식기는 확률 모델에 가중치를 적용하여 확률 모델이 가질 수 있는 최대 확률 값을 조정할 수 있고, 랜덤 값은 균등 분포에 기초하여 랜덤하게 결정될 수 있다.
랜드마크의 영상 특징 정보를 결정하는 과정은 인식기에 포함된 영상 특징 추출 장치(100)에 의해 수행될 수 있으며, 여기에 기재되지 않은 설명은 도 1 내지 도 7의 관련 설명을 참조할 수 있다.
단계(830)에서, 인식기는 랜드마크의 영상 특징 정보에 기초하여 얼굴 인식을 수행할 수 있다. 인식기는 단계(820)의 과정을 거쳐 결정된 랜드마크들의 영상 특징 정보와 미리 저장된 사용자 정보를 비교하여 입력 영상에 나타난 사용자의 얼굴을 인식할 수 있다. 예를 들어, 인식기는 입력 영상으로부터 결정된 랜드마크들의 영상 특징 정보와 미리 저장된 사용자의 영상 특징 정보 간의 유사도를 계산하고, 계산된 유사도가 미리 설정된 조건보다 큰 경우에는 입력 영상에 나타난 얼굴 인식을 성공한 것으로 결정하고, 그 이외의 경우에는 얼굴 인식을 실패한 것으로 결정할 수 있다.
이상에서 설명된 실시예들은 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치, 방법 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPGA(field programmable gate array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 애플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.
소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 또는 컴퓨터 저장 매체 또는 장치에 영구적으로, 또는 일시적으로 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.
삭제
실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다. 그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.

Claims (24)

  1. 커널에 포함된 픽셀들의 픽셀 값들에 기초하여 확률 모델을 결정하는 단계;
    상기 커널에 포함된 현재 픽셀의 영상 특징 정보를 결정하는 단계; 및
    상기 확률 모델에 기초하여 결정된 상기 현재 픽셀의 확률 값을 랜덤 값과 비교하여 상기 현재 픽셀의 영상 특징 정보를 변경할지 여부를 결정하는 단계
    를 포함하는 영상 특징 추출 방법.
  2. 제1항에 있어서,
    상기 확률 모델을 결정하는 단계는,
    상기 커널 내에 중심에 위치하는 중심 픽셀의 픽셀 값과 상기 커널에 포함된 각 픽셀들의 픽셀 값 간의 차이에 기초하여 확률 파라미터를 결정하는 단계; 및
    상기 확률 파라미터를 확률 분포 함수에 적용하여 상기 확률 모델을 결정하는 단계
    를 포함하는 영상 특징 추출 방법.
  3. 제1항에 있어서,
    상기 현재 픽셀의 확률 값은,
    상기 커널의 중심에 위치하는 중심 픽셀의 픽셀 값과 상기 현재 픽셀의 픽셀 값 간의 차이 값 및 가중치가 상기 확률 모델에 적용되어 결정되는, 영상 특징 추출 방법.
  4. 제1항에 있어서,
    상기 영상 특징 정보를 결정하는 단계는,
    상기 커널의 중심에 위치하는 중심 픽셀의 픽셀 값과 상기 현재 픽셀의 픽셀 값을 비교하여 상기 현재 픽셀의 영상 특징 정보를 결정하는 단계
    를 포함하는 영상 특징 추출 방법.
  5. 제1항에 있어서,
    상기 확률 모델을 결정하는 단계는,
    상기 커널에 포함된 픽셀들의 평균 픽셀 값과 상기 커널에 포함된 각 픽셀들의 픽셀 값 간의 차이에 기초하여 확률 파라미터를 결정하는 단계; 및
    상기 확률 파라미터를 확률 분포 함수에 적용하여 상기 확률 모델을 결정하는 단계
    를 포함하는 영상 특징 추출 방법.
  6. 제1항에 있어서,
    상기 현재 픽셀의 확률 값은,
    상기 커널에 포함된 픽셀들의 평균 픽셀 값과 상기 현재 픽셀의 픽셀 값 간의 차이 값 및 가중치가 상기 확률 모델에 적용되어 결정되는, 영상 특징 추출 방법.
  7. 제1항에 있어서,
    상기 영상 특징 정보를 결정하는 단계는,
    상기 커널에 포함된 픽셀들의 평균 픽셀 값과 상기 현재 픽셀의 픽셀 값을 비교하여 상기 현재 픽셀의 영상 특징 정보를 결정하는 단계
    를 포함하는 영상 특징 추출 방법.
  8. 제1항에 있어서,
    상기 현재 픽셀의 영상 특징 정보를 변경할지 여부를 결정하는 단계는,
    상기 현재 픽셀의 확률 값이 상기 랜덤 값보다 크면, 상기 현재 픽셀의 영상 특징 정보를 변경하는 단계
    를 포함하는 영상 특징 추출 방법.
  9. 제1항에 있어서,
    상기 현재 픽셀의 영상 특징 정보를 변경할지 여부를 결정하는 단계는,
    상기 현재 픽셀의 확률 값이 상기 랜덤 값보다 크지 않으면, 상기 현재 픽셀의 영상 특징 정보를 유지하는 것으로 결정하는 단계
    를 포함하는 영상 특징 추출 방법.
  10. 제1항에 있어서,
    상기 확률 모델을 결정하는 단계는,
    가우시안 확률 분포 함수 및 정규 분포 함수 중 어느 하나를 이용하여 상기 현재 픽셀에 적용할 확률 모델을 결정하는 단계
    를 포함하는 영상 특징 추출 방법.
  11. 제1항 내지 제10항 중 어느 한 항의 방법을 실행하기 위한 프로그램이 기록된 컴퓨터에서 판독 가능한 기록 매체.
  12. 현재 픽셀의 그라디언트 각도 및 그라디언트 크기를 결정하는 단계;
    HOG(histogram of Orientation Gradient) 특징을 결정하기 위한 히스토그램에서 상기 그라디언트 각도에 대응하는 빈(bin)을 결정하는 단계; 및
    상기 그라디언트 크기가 적용된 확률 모델의 확률 값에 기초하여 상기 현재 픽셀의 그라디언트 각도에 대응하는 빈을 다시 결정할지 여부를 결정하는 단계
    를 포함하는 영상 특징 추출 방법.
  13. 제12항에 있어서,
    상기 빈을 다시 결정할지 여부를 결정하는 단계는,
    상기 확률 값을 랜덤 값과 비교하여 상기 현재 픽셀의 그라디언트 각도에 대응하는 빈을 다시 결정할지 여부를 결정하는 단계
    를 포함하는 영상 특징 추출 방법.
  14. 제13항에 있어서,
    상기 빈을 다시 결정할지 여부를 결정하는 단계는,
    상기 확률 값이 상기 랜덤 값보다 큰 경우, 정규 랜덤 편차(normal random deviate)를 이용하여 상기 현재 픽셀의 그라디언트 각도에 대응하는 빈을 다시 결정하는 단계
    를 포함하는 영상 특징 추출 방법.
  15. 제13항에 있어서,
    상기 빈을 다시 결정할지 여부를 결정하는 단계는,
    상기 현재 픽셀의 확률 값이 상기 랜덤 값보다 크지 않은 경우, 상기 현재 픽셀의 그라디언트 각도에 대응하는 빈을 유지하는 단계
    를 포함하는 영상 특징 추출 방법.
  16. 제12항에 있어서,
    상기 현재 픽셀의 그라디언트 각도 및 그라디언트 크기를 결정하는 단계는,
    상기 현재 픽셀을 포함하는 입력 영상에 적용할 마스크의 크기를 결정하는 단계; 및
    상기 입력 영상과 상기 마스크 간의 컨볼루션 결과에 기초하여 상기 현재 픽셀의 그라디언트 크기 및 그라디언트 각도를 결정하는 단계
    를 포함하는 영상 특징 추출 방법.
  17. 제13항에 있어서,
    상기 랜덤 값은, 균등 분포에 기초하여 결정되고,
    가중치에 기초하여 상기 확률 모델이 가질 수 있는 최대 확률 값이 결정되는, 영상 특징 추출 방법.
  18. 입력 영상으로부터 얼굴의 랜드마크(facial landmark)를 검출하는 단계;
    확률 모델에 기초하여 상기 검출된 랜드마크의 영상 특징 정보를 결정하는 단계; 및
    상기 랜드마크의 영상 특징 정보에 기초하여 얼굴 인식을 수행하는 단계
    를 포함하는 얼굴 인식 방법.
  19. 제18항에 있어서,
    상기 랜드마크의 영상 특징 정보를 결정하는 단계는,
    상기 랜드마크의 영역에 포함된 픽셀의 픽셀 값에 기초하여 상기 랜드마크의 영상 특징 정보를 결정하는 단계; 및
    상기 확률 모델에 기초하여 결정된 확률 값을 랜덤 값과 비교하여 상기 결정된 영상 특징 정보를 변경할지 여부를 결정하는 단계
    를 포함하는 얼굴 인식 방법.
  20. 제19항에 있어서,
    상기 영상 특징 정보를 변경할지 여부를 결정하는 단계는,
    상기 확률 값이 상기 랜덤 값보다 큰 경우, 상기 랜드마크의 영상 특징 정보를 변경하는 것으로 결정하고,
    상기 확률 값이 상기 랜덤 값보다 크지 않은 경우, 상기 랜드마크에 대해 결정된 영상 특징 정보를 그대로 유지하는 것으로 결정하는 단계
    를 포함하는 얼굴 인식 방법.
  21. 입력 영상에 포함된 현재 픽셀에 적용할 확률 모델을 결정하는 확률 모델 결정부; 및
    상기 확률 모델에 기초하여 상기 현재 픽셀의 영상 특징 정보를 결정하는 영상 특징 결정부를 포함하고,
    상기 영상 특징 결정부는,
    상기 확률 모델에 기초하여 결정된 상기 현재 픽셀의 확률 값을 랜덤 값과 비교하여 상기 현재 픽셀의 영상 특징 정보를 변경할지 여부를 결정하는, 영상 특징 추출 장치.
  22. 제21항에 있어서,
    상기 확률 모델 결정부는,
    커널에 포함된 픽셀들의 픽셀 값들에 기초하여 상기 확률 모델을 결정하고,
    상기 영상 특징 결정부는,
    상기 커널의 중심에 위치하는 중심 픽셀의 픽셀 값과 상기 현재 픽셀의 픽셀 값 간의 차이 값에 기초하여 상기 현재 픽셀의 확률 값을 결정하는, 영상 특징 추출 장치.
  23. 제21항에 있어서,
    상기 확률 모델 결정부는,
    커널에 포함된 픽셀들의 픽셀 값들에 기초하여 상기 확률 모델을 결정하고,
    상기 영상 특징 결정부는,
    상기 커널에 포함된 픽셀들의 평균 픽셀 값과 상기 현재 픽셀의 픽셀 값 간의 차이 값에 기초하여 상기 현재 픽셀의 확률 값을 결정하는, 영상 특징 추출 장치.
  24. 제21항에 있어서,
    상기 영상 특징 결정부는,
    상기 현재 픽셀의 그라디언트 각도 및 그라디언트 크기를 결정하고, HOG(histogram of Orientation Gradient) 특징을 결정하기 위한 히스토그램에서 상기 그라디언트 각도에 대응하는 빈을 결정하고, 상기 그라디언트 크기가 적용된 확률 모델의 확률 값에 기초하여 상기 현재 픽셀의 그라디언트 각도에 대응하는 빈을 다시 결정할지 여부를 결정하는, 영상 특징 추출 장치.
KR1020140122597A 2014-09-16 2014-09-16 영상 특징 추출 방법 및 장치 KR102330322B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020140122597A KR102330322B1 (ko) 2014-09-16 2014-09-16 영상 특징 추출 방법 및 장치
US14/812,252 US9773159B2 (en) 2014-09-16 2015-07-29 Method and apparatus for extracting image feature

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020140122597A KR102330322B1 (ko) 2014-09-16 2014-09-16 영상 특징 추출 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20160032466A KR20160032466A (ko) 2016-03-24
KR102330322B1 true KR102330322B1 (ko) 2021-11-24

Family

ID=55455035

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020140122597A KR102330322B1 (ko) 2014-09-16 2014-09-16 영상 특징 추출 방법 및 장치

Country Status (2)

Country Link
US (1) US9773159B2 (ko)
KR (1) KR102330322B1 (ko)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105812799B (zh) * 2014-12-31 2019-03-08 阿里巴巴集团控股有限公司 视频帧内预测模式的快速选择方法及其装置
JP6898546B2 (ja) * 2016-07-25 2021-07-07 キヤノンマーケティングジャパン株式会社 情報処理装置、制御方法、及びプログラム
US10621446B2 (en) * 2016-12-22 2020-04-14 Texas Instruments Incorporated Handling perspective magnification in optical flow processing
JP7072765B2 (ja) * 2017-01-31 2022-05-23 株式会社アイシン 画像処理装置、画像認識装置、画像処理プログラム、及び画像認識プログラム
US11080228B2 (en) 2017-03-13 2021-08-03 International Business Machines Corporation Distributed random binning featurization with hybrid two-level parallelism
KR20180130778A (ko) * 2017-05-30 2018-12-10 주식회사 트위니 화장품 추천 방법, 이를 구현하기 위한 프로그램이 저장된 기록매체, 이를 구현하기 위해 매체에 저장된 컴퓨터프로그램 및 화장품 추천 시스템
CN107463667A (zh) * 2017-08-02 2017-12-12 大连理工大学 基于邻居像素点的共生局部三值模式的图像检索方法
CN108182442B (zh) * 2017-12-29 2022-03-15 惠州华阳通用电子有限公司 一种图像特征提取方法
KR102075745B1 (ko) * 2018-01-10 2020-02-10 국방과학연구소 방위각 추정 장치 및 방법
KR102257883B1 (ko) * 2018-10-15 2021-05-27 명홍철 얼굴 인식 방법 및 장치
WO2020152487A1 (en) 2018-11-13 2020-07-30 The Nielsen Compy (Us), Llc Methods and apparatus to perform image analyses in a computing environment
US11151425B2 (en) 2018-11-13 2021-10-19 Nielsen Consumer Llc Methods and apparatus to perform image analyses in a computing environment
KR20200110064A (ko) 2019-03-15 2020-09-23 삼성전자주식회사 변환 모델을 이용한 인증 방법 및 장치
KR20220109622A (ko) * 2021-01-29 2022-08-05 서강대학교산학협력단 동영상 기반 행동인식 장치 및 이의 동작방법
KR102422235B1 (ko) * 2022-05-26 2022-07-15 (주)에스엔테크 터널 내 지능형 차량 정체 알림 시스템

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110235910A1 (en) 2009-06-30 2011-09-29 Omri Soceanu Method circuit and system for matching an object or person present within two or more images
US20130044958A1 (en) 2011-08-19 2013-02-21 Jonathan W. Brandt Methods and Apparatus for Automated Facial Feature Localization
US20130129233A1 (en) 2010-09-21 2013-05-23 Stephen N. Schiller System and Method for Classifying the Blur State of Digital Image Pixels

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6711293B1 (en) 1999-03-08 2004-03-23 The University Of British Columbia Method and apparatus for identifying scale invariant features in an image and use of same for locating an object in an image
US7202791B2 (en) 2001-09-27 2007-04-10 Koninklijke Philips N.V. Method and apparatus for modeling behavior using a probability distrubution function
JP2006310999A (ja) 2005-04-27 2006-11-09 Sony Corp 画像処理装置および方法、並びにプログラム
US8705810B2 (en) * 2007-12-28 2014-04-22 Intel Corporation Detecting and indexing characters of videos by NCuts and page ranking
US8831293B2 (en) * 2008-04-21 2014-09-09 Mts Investments Inc. System and method for statistical mapping between genetic information and facial image data
US8160365B2 (en) 2008-06-30 2012-04-17 Sharp Laboratories Of America, Inc. Methods and systems for identifying digital image characteristics
JP5258664B2 (ja) 2009-04-14 2013-08-07 株式会社エヌ・ティ・ティ・ドコモ 画像符号化装置、方法およびプログラム、並びに、画像復号装置、方法およびプログラム
US8712109B2 (en) * 2009-05-08 2014-04-29 Microsoft Corporation Pose-variant face recognition using multiscale local descriptors
KR20110006030A (ko) 2009-07-13 2011-01-20 삼성전자주식회사 모델 학습 기반의 실시간 영상 모델링 방법 및 그 장치
JP2011034178A (ja) 2009-07-30 2011-02-17 Sony Corp 画像処理装置および画像処理方法、並びにプログラム
TWI413024B (zh) * 2009-11-19 2013-10-21 Ind Tech Res Inst 物件偵測方法及系統
WO2011148562A1 (ja) * 2010-05-26 2011-12-01 パナソニック株式会社 画像情報処理装置
KR101326230B1 (ko) 2010-09-17 2013-11-20 한국과학기술원 사용자 동적 기관 제스처 인식 방법 및 인터페이스와, 이를 사용하는 전기 사용 장치
JP2013114518A (ja) 2011-11-29 2013-06-10 Sony Corp 画像処理装置、および画像処理方法、並びにプログラム
KR101178333B1 (ko) 2012-02-20 2012-08-29 주식회사 에스엠이씨 웨이블릿 기반의 중심대칭-국부이진 패턴과 계층적 랜덤 포레스트를 이용한 사람 검출 방법

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110235910A1 (en) 2009-06-30 2011-09-29 Omri Soceanu Method circuit and system for matching an object or person present within two or more images
US20130129233A1 (en) 2010-09-21 2013-05-23 Stephen N. Schiller System and Method for Classifying the Blur State of Digital Image Pixels
US20130044958A1 (en) 2011-08-19 2013-02-21 Jonathan W. Brandt Methods and Apparatus for Automated Facial Feature Localization

Also Published As

Publication number Publication date
US20160078282A1 (en) 2016-03-17
KR20160032466A (ko) 2016-03-24
US9773159B2 (en) 2017-09-26

Similar Documents

Publication Publication Date Title
KR102330322B1 (ko) 영상 특징 추출 방법 및 장치
KR102357326B1 (ko) 얼굴 특징 추출 방법 및 장치, 얼굴 인식 방법 및 장치
KR102290392B1 (ko) 얼굴 등록 방법 및 장치, 얼굴 인식 방법 및 장치
KR101997500B1 (ko) 개인화된 3d 얼굴 모델 생성 방법 및 장치
CN108122239B (zh) 使用深度分割的图像数据中的对象检测
EP3327616A1 (en) Object classification in image data using machine learning models
KR102357340B1 (ko) 얼굴 인식 방법 및 장치
WO2019136894A1 (en) Methods and systems for face alignment
KR102234936B1 (ko) 차량 번호판을 실시간으로 인식하는 장치 및 방법
CN114627543A (zh) 用于脸部识别的方法和设备
KR102476758B1 (ko) 영상 정규화 장치 및 방법
KR101997479B1 (ko) 사용자 인증을 위한 생체 영역을 검출하는 방법 및 장치
KR102369412B1 (ko) 홍채 인식 장치 및 방법
KR102434574B1 (ko) 이미지에 포함된 특징 포인트의 시간 또는 공간의 움직임에 기초하여 이미지에 존재하는 피사체를 인식하는 장치 및 방법
KR102415507B1 (ko) 영상 처리 방법 및 영상 처리 장치
KR20220087180A (ko) 개체 이미지의 패턴에 의한 개체 인식 식별 방법 및 시스템
KR101592087B1 (ko) 배경 영상의 위치를 이용한 관심맵 생성 방법 및 이를 기록한 기록 매체
KR101853211B1 (ko) 모바일 gpu 환경에서 차영상 정보를 이용한 sift 알고리즘의 복잡도 감소 기법
KR102182540B1 (ko) 시차맵과 보행자 상하단 인식을 이용한 정밀한 보행자 검출 방법 및 장치
KR102027786B1 (ko) 다수의 얼굴 이미지를 동시에 사용하는 얼굴 인식 및 인증 방법 및 시스템
KR20210157052A (ko) 객체 인식 방법 및 객체 인식 장치
KR102564477B1 (ko) 객체 검출 방법 및 장치
KR101627974B1 (ko) 영상 블러에 강인한 영상 특징 기술자 생성 방법 및 장치
KR20210079138A (ko) 사용자 동작 인식 시스템 및 그 방법
KR20190065813A (ko) 기여도에 기초하여 특징을 추출하는 방법 및 장치

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant