KR20080079443A - 영상으로부터의 객체 검출 방법 및 장치 - Google Patents

영상으로부터의 객체 검출 방법 및 장치 Download PDF

Info

Publication number
KR20080079443A
KR20080079443A KR1020070019591A KR20070019591A KR20080079443A KR 20080079443 A KR20080079443 A KR 20080079443A KR 1020070019591 A KR1020070019591 A KR 1020070019591A KR 20070019591 A KR20070019591 A KR 20070019591A KR 20080079443 A KR20080079443 A KR 20080079443A
Authority
KR
South Korea
Prior art keywords
array
image
color component
texture information
values
Prior art date
Application number
KR1020070019591A
Other languages
English (en)
Inventor
김종성
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Priority to KR1020070019591A priority Critical patent/KR20080079443A/ko
Publication of KR20080079443A publication Critical patent/KR20080079443A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/40Analysis of texture
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/90Determination of colour characteristics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/40Tree coding, e.g. quadtree, octree
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20021Dividing image into blocks, subimages or windows

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

본 발명은 영상으로부터의 객체 검출 방법 및 장치에 관한 것으로서, 입력 영상에서 객체의 후보 영역을 선정하여 특징적인 질감 정보를 추출하고, 추출한 질감 정보를 이진 분류 나무를 통해 원하는 객체를 검출하게 된다. 본 발명에 의하면, 사용자가 추출하고자 하는 객체의 종류를 선택 지정하여 사용자의 요구에 맞는 객체를 추출할 수 있다. 또한, SGLD(Spatial Gray Level Dependency) 질감 정보와 CART(Classification And Regress Tree) 분류를 이용하여 객체 추출을 위한 분류 성능을 크게 향상시킬 수 있다. 그리고, 사용자가 지정한 객체로부터 특징 값을 추출하여 또 다른 객체를 분류할 수 있는 분류기로 활용할 수 있다.
객체 검출, SGLD, CART, 이진 분류 나무, 특징 값, 후보 영역, 질감 정보

Description

영상으로부터의 객체 검출 방법 및 장치{Method and apparatus for extracting object from image}
도 1은 본 발명의 실시예에 따른 객체 검출 장치의 내부 구성을 개략적으로 나타낸 구성도,
도 2는 본 발명의 실시예에 따른 영상으로부터의 객체 검출 방법을 설명하기 위한 동작 흐름도를 나타낸 도면,
도 3은 이진 분류 나무를 통한 분류 과정을 설명하기 위한 도면,
도 4는 피사체를 촬영하여 얻은 입력 영상을 나타낸 도면,
도 5는 객체의 후보 영역을 선정하는 화면을 나타낸 도면,
도 6은 객체의 후보 영역 선정을 위한 영상 데이터의 블록화를 나타낸 도면,
도 7은 블록 내의 색상 정보를 객체의 색상 정보로 필터링하는 화면을 나타낸 도면,
도 8은 이진화 필터링하여 얻은 영상에서 후보 영역을 설정하는 화면을 나타낸 도면, 그리고
도 9는 후보 영역 블록 내의 밝기 정보를 색공간에서의 Y 정보로 변경한 화면을 나타낸 도면이다.
< 도면의 주요 부분에 대한 부호의 설명 >
100 : 객체 검출 장치 110 : 영상 취득부
120 : 저장부 130 : 표시부
140 : 객체 추출부 142 : 전처리부
144 : SGLD 처리부 146 : CART 처리부
150 : 제어부 160 : 입력부
170 : 통신부
본 발명은 영상으로부터의 객체 검출 방법 및 장치에 관한 것이다.
휴대용 단말기가 카메라를 통해 획득한 정지 영상이나 동영상에서 객체를 검출하는 기법에는 사용자의 관심이 높은 얼굴이나, 자동차, 자연물 등에 대한 객체 검출 기법 등이 있다.
이러한 객체 검출 기법에서는 분류기(Classifier)를 이용하여 특정 객체의 고유한 성질을 분석하거나 질감(Texture) 정보, 형태(Shape) 정보 등을 추출한다. 주로 사용되는 분류기로는 신경 회로망, SVM(Support Vector Machine) 등이 사용되었다.
한편, 대부분의 휴대용 단말기는 신경 회로망이나 SVM 등의 분류기를 채용하고 있지 않으며, 휴대용 단말기에서 카메라를 통해 획득한 영상은 카메라 렌즈의 한계로 인하여 해상도가 낮으며, 그에 따라 선명도(Sharpness)가 떨어져 객체 검출에 어려움이 있는 문제점이 있었다.
또한, 전술한 분류기를 통해 질감 정보나 형태 정보를 추출할 때 그 복잡도가 높아 중앙 처리부(CPU)의 처리 속도가 제한적인 휴대용 단말기나 휴대용 멀티미디어 기기에서는 응용되기가 불가능하다는 문제점이 있었다.
그리고, 전술한 분류기를 휴대용 단말기에 적용한다고 해도 전술한 분류기의 학습 방법이 복잡하여, 다양한 객체와 카메라 모듈에 의존하는 각각의 분류기를 생성하는데 많은 어려움이 있다는 문제점이 있었다.
상기 문제점을 해결하기 위해 본 발명은, 입력 영상에서 객체의 후보 영역을 선정하여 특징적인 질감 정보를 추출하고, 추출한 질감 정보를 이진 분류 나무를 통해 원하는 객체를 검출하는, 영상으로부터의 객체 검출 방법 및 장치를 제공함에 그 목적이 있다.
상기 목적을 달성하기 위한 본 발명에 따른 영상으로부터의 객체 검출 방법은, 피사체로부터 영상을 취득하는 단계; 상기 취득한 영상에서 검출하고자 하는 객체의 후보 영역을 선정하는 단계; 상기 선정된 후보 영역에서 고유한 특성이 되는 질감 정보 특징 값을 추출하는 단계; 및 상기 추출된 질감 정보 특징 값을 분류하여 상기 객체를 추출하는 단계를 포함한다.
또한, 상기 후보 영역을 선정하는 단계는, 상기 객체의 고유한 색상 성분에 대해 일정한 범위 내에 존재하는 평균 값들을 필터링하고, 필터링된 영역에서 상기 객체의 색상 성분에 해당하는 영역들을 선정하게 된다.
또한, 상기 후보 영역을 선정하는 단계는, 상기 취득한 영상을 일정한 블록 크기로 분할하고, 분할된 블록 내에서 색상 성분들 값의 평균값을 계산하게 된다.
또한, 상기 질감 정보 특징 값을 추출하는 단계는, SGLD(Spatial Gray Level Dependency) 매트릭스를 이용하여 상기 질감 정보 특징 값을 추출하게 된다.
또한, 상기 SGLD 매트릭스는 관성(Inertial) 배열, 역차(Inverse Difference) 배열, 상관(Correlation) 배열, 에너지(Energy) 배열 및 엔트로피(Entropy) 배열을 포함한다.
여기서, 상기 관성 배열은 근접한 두 픽셀 값의 변화량 정도를 나타내고, 상기 역차 배열은 색상 성분 내의 국부 영역이 동질의 픽셀로 구성된 경우에 배열의 요소 값이 증가하며, 이질의 픽셀로 구성될 경우에 배열의 요소 값이 감소하게 된다.
또한, 상기 상관 배열은, 상기 색상 성분에 있는 각 픽셀의 전체 영역에 대한 상관도를 나타낸다.
그리고, 상기 객체를 추출하는 단계는, 상기 추출된 질감 정보 특징 값에서 이진 분류 나무(CART:Classification And Regress Tree)를 통해 표준 오차가 최소가 되는 상기 객체를 추출하게 된다.
한편, 상기 목적을 달성하기 위한 본 발명에 따른 객체 검출 장치는, 피사체로부터 영상을 획득하는 영상 취득부; 상기 취득한 영상에서 검출하고자 하는 객체의 후보 영역을 선정하는 전처리부; 상기 선정된 후보 영역에서 고유한 특성이 되는 질감 정보 특징 값을 추출하는 SGLD(Spatial Gray Level Dependency) 처리부; 상기 추출된 질감 정보 특징 값을 분류하여 상기 객체를 추출하는 CART(Classification And Regress Tree) 처리부; 및 상기 영상 취득부를 통해 상기 영상을 취득하고, 취득한 영상으로부터 상기 객체가 추출되도록 상기 전처리부와 상기 SGLD 처리부 및 상기 CART 처리부를 제어하는 제어부를 포함한다.
또한, 상기 제어부는, 상기 전처리부를 통해 상기 객체의 고유한 색상 성분에 대해 일정한 범위 내에 존재하는 평균 값들을 필터링하고, 필터링된 영역에서 상기 객체의 색상 성분에 해당하는 영역들을 선정하게 된다.
또한, 상기 제어부는, 상기 영상 취득부를 통해 취득한 상기 영상을 상기 전처리부를 통해 일정한 블록 크기로 분할하고, 분할된 블록 내에서 색상 성분들 값의 평균값을 계산하게 된다.
또한, 상기 제어부는, 상기 SGLD 처리부를 통해 SGLD 매트릭스를 이용하여 상기 질감 정보 특징 값을 추출하게 된다.
또한, 상기 SGLD 매트릭스는 관성(Inertial) 배열, 역차(Inverse Difference) 배열, 상관(Correlation) 배열, 에너지(Energy) 배열 및 엔트로 피(Entropy) 배열을 포함한다.
여기서, 상기 관성 배열은 근접한 두 픽셀 값의 변화량 정도를 나타내고, 상기 역차 배열은 색상 성분 내의 국부 영역이 동질의 픽셀로 구성된 경우에 배열의 요소 값이 증가하며, 이질의 픽셀로 구성될 경우에 배열의 요소 값이 감소하게 된다.
또한, 상기 상관 배열은, 상기 색상 성분에 있는 각 픽셀의 전체 영역에 대한 상관도를 나타낸다.
그리고, 상기 제어부는, 상기 추출된 질감 정보 특징 값에서 상기 CART 처리부를 통해 이진 분류 나무(CART)를 이용하여 표준 오차가 최소가 되는 상기 객체를 추출하게 된다.
이하, 본 발명의 바람직한 실시예를 첨부된 도면들을 참조하여 상세히 설명한다.
우선 각 도면의 구성요소들에 참조부호를 부가함에 있어서, 동일한 구성요소들에 대해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 부호를 가지도록 하고 있음에 유의해야 한다.
또한, 본 발명을 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명은 생략한다.
도 1은 본 발명의 실시예에 따른 객체 검출 장치의 내부 구성을 개략적으로 나타낸 구성도이다.
도 1을 참조하면, 본 발명에 따른 객체 검출 장치(100)는 영상 취득부(110), 저장부(120), 표시부(130), 객체 추출부(140), 제어부(150), 입력부(160) 및 통신부(170)를 포함한다.
여기서, 객체 추출부(140)는 전처리부(142), SGLD(Spatial Gray Level Dependency) 처리부(144), CART(Classification And Regress Tree) 처리부(146)를 포함한다.
영상 취득부(110)는 소형 카메라를 구비하여, 카메라를 통해 피사체를 촬영하여 영상 데이터를 획득한다.
저장부(120)는 영상 취득부(110)에 의해 획득한 영상 데이터를 저장한다.
표시부(130)는 획득한 영상 데이터를 디스플레이하거나, 객체 추출부(140)를 통해 추출한 객체 영상을 디스플레이한다.
객체 추출부(140)는 영상 데이터에서 추출하고자 하는 객체의 후보 영역을 선정하여 특징적인 질감 정보를 추출하고, 추출한 질감 정보에서 이진 분류 나무(CART)를 통해 사용자에 의해 선택된 객체를 검출한다.
전처리부(142)는 영상 데이터에서 검출하고자 하는 객체의 후보 영역을 선정한다. 즉, 전처리부(142)는 영상 데이터를 예컨대, 8×8 또는 16×16 등의 일정한 블록 크기로 분할하고, 분할된 블록 내에서 색상 성분 Cb, Cr 값의 평균값을 계산한다. 그리고, 전처리부(142)는 검출하고자 하는 객체의 고유한 색상 성분에 대해 일정한 범위 내에 존재하는 평균 값들을 필터링한다. 이때, 필터링된 영역에서 객 체의 색상 성분이라고 판별된 영역들이 객체의 후보군이라 할 수 있다.
SGLD 처리부(144)는 검출하고자 하는 객체의 후보 영역에서 고유한 특성인 질감 정보 특징 값을 추출한다. SGLD 처리부(144)는 이러한 질감 정보 특징 값을 추출하기 위하여 SGLD 매트릭스(Matrix)를 사용하는데, SGLD 매트릭스에 대해서는 후술하기로 한다.
CART 처리부(146)는 추출된 질감 정보 특징 값에서 이진 분류 나무(CART)를 통해 표준 오차가 최소가 되는 객체를 추출하게 된다. 여기서, 이진 분류 나무는 후술하기로 한다.
제어부(150)는 사용자로부터 입력부(160)를 통한 객체 추출 명령에 따라 객체 추출부(140)를 통해 객체가 추출되도록 제어한다. 또한, 제어부(150)는 표시부(130)를 통해 객체의 추출 과정을 표시하거나, 추출된 객체를 표시할 수 있다.
입력부(160)는 사용자의 조작 명령을 입력하여 제어부(150)로 전달한다. 즉, 입력부(160)는 피사체를 촬영하는 명령을 입력하거나, 획득된 영상 데이터로부터 객체를 추출하는 명령을 입력한다.
통신부(170)는 단말기가 통신망을 통해 다른 단말기와 전화 통화에 관한 음성 신호 또는 데이터 등을 송수신한다.
도 2는 본 발명의 실시예에 따른 영상으로부터의 객체 검출 방법을 설명하기 위한 동작 흐름도를 나타낸 도면이다.
먼저, 본 발명에 따른 객체 검출 장치(100)의 SGLD 처리부(144)에서 이용하 는 SGLD 매트릭스에 대하여 설명한다.
SGLD 매트릭스는 픽셀 (i, j) 위치에서의 [0, L-1]의 범위를 갖는 픽셀 값을 l(i, j)로 했을 경우 벡터 (m, n) (단, m=1, 2, ..., M, n=1, 2, ..., N)에 대해 이웃하는 픽셀 값들의 발생 빈도 Pab(m, n)를 다음 수학식 1로부터 구할 수 있다.
Figure 112007016913034-PAT00001
여기서, #은 집합 {a, b}에 대한 발생 빈도를 나타내며, W는 영상의 폭(Width), H는 영상의 높이(High)를 나타낸다.
수학식 1에 의해 얻어진 Pab(m, n)를 근사화하고 정규화하면 수학식 2와 같은 정규화된 특징 값을 얻을 수 있다.
Figure 112007016913034-PAT00002
한편, SGLD 매트릭스는 관성(Inertial) 배열, 역차(Inverse Difference) 배열, 상관(Correlation) 배열, 에너지(Energy) 배열 및 엔트로피(Entropy) 배열에 관한 특징들을 이용한다.
여기서, 관성 배열 BI(m, n)은 다음 수학식 3과 같이 나타낼 수 있다.
Figure 112007016913034-PAT00003
이때, 관성 배열은 근접한 두 픽셀(a, b) 값의 변화량의 정도를 나타낸다.
또한, 역차 배열 BD(m, n)은 다음 수학식 4와 같이 나타낼 수 있다.
Figure 112007016913034-PAT00004
이때, 역차 배열은 m, n 내에 있는 국부 영역에 대한 동질성을 나타낸다. 즉, m, n 내의 국부 영역이 동질의 픽셀로 구성될 경우 BD(m, n) 배열의 요소 값은 증가하며, 이질의 픽셀로 구성될 경우 BD(m, n) 배열의 요소 값은 감소하게 된다. 역차 배열은 [0, 1]의 범위를 가지며 0일 경우 동질의 정도가 최소임을 의미한다.
또한, 상관 배열 BC(m, n)은 다음 수학식 5와 같이 나타낼 수 있다.
Figure 112007016913034-PAT00005
이때, 상관 배열은 영상의 전체 영역에 대한 상관도를 의미한다. BC(m, n)은 m, n 내에 있는 a, b가 전체 영상에 대하여 상관도가 높을수록 +1, 상관도가 낮을 수록 0, 음에 관한 상관도가 높을수록 -1의 값을 갖는다. 수학식 5에서 μ는 영상 전체에 대한 평균을 나타내며, σ는 영상 전체에 대한 표준편차를 나타낸다.
한편, 에너지(Energy) 배열은 다음 수학식 6과 같이 나타낼 수 있다.
Figure 112007016913034-PAT00006
또한, 엔트로피(Entropy) 배열은 다음 수학식 7과 같이 나타낼 수 있다.
Figure 112007016913034-PAT00007
한편, 본 발명에 따른 객체 검출 장치(100)의 CART 처리부(146)에서 이용하는 이진 분류 나무(CART)에 대하여 설명한다.
CART는 Breiman, Friedman, Olshen과 Stone 등에 의해서 처음 제안된 의사 결정 나무(Decision Tree)의 나무 형성 알고리즘이다. CART는 데이터 내의 숨겨진 패턴, 규칙, 관계 등의 정보를 탐색하고 찾아내는 나무 구조의 데이터 마이닝(Mining) 기술로서, 복잡한 의사 결정 규칙 뿐만 아니라 나무 구조로 도표화하여 분류(Classification)와 예측(Prediction)을 수행하는 분석 방법이다.
데이터의 전체 수가 N 개일 때, 각 시퀀스 집합을 S라 하고, 각 시퀀스에 상응하는 M 개의 특징 추출 벡터를 X라 하면, 시퀀스 집합 S와 특징 추출 벡터 X는 다음 수학식 8과 같이 나타낼 수 있다.
Figure 112007016913034-PAT00008
분류 데이터에서 얻어진 특징 벡터는 분류 규칙을 생성하기 위한 조건 1과 이 결과에서 얻어진 부분 집합의 조건 2를 만족해야 한다.
여기서, 조건 1은 분류 규칙이 특징 벡터(X)에 대한 분류 함수 d(X)를 수행한 결과가 전체 클래스 1, 2, ..., J 중 반드시 한 클래스에 속하는 부분 집합 Aj를 획득한다.
이러한 조건 1에 의해 각 단계를 거칠 때마다 비디오 시퀀스가 부분 집합과 나머지 집합들로 나누어지게 된다. 여기서, 나머지 집합들 내에 여러가지 클래스들이 포함된 것으로 조건 1을 반복 수행하므로 부분 집합을 생성하게 된다. 그리고 각 부분 집합은 조건 2를 만족하게 된다.
조건 2는 부분 집합 A1, A2, ..., Aj의 조건이 다음 수학식 9와 같을 때, J 클래스에 대하여 X ∈ Aj이다.
Figure 112007016913034-PAT00009
전술한 바와 같은 조건에 의해 생성된 의사 결정 나무는 도 3에 도시된 바와 같이 하나의 뿌리 노드를 가지며, 하나 혹은 그 이상의 노드와 가지(Branches)로 구성된다. 각 노드는 내부 혹은 최종 노드들로 나타난다. 도 3은 이진 분류 나무를 통한 분류 과정을 설명하기 위한 도면이다. 내부 노드는 두 개의 자식 노드를 가지며, 최종 노드는 자식 노드를 가질 수 없다. 또한, 최종 노드는 각 노드가 포함된 특징 데이터의 속성에 의해 클래스 레이블(Class Label)이 결정된다. 즉, 임의의 데이터는 반드시 최종 노드에 도달하게 되며, 그 데이터가 속해있는 최종 노드의 클래스 레이블 결정시 다수결의 원칙에 의하여 잘 못 분류된 결과는 오분류율로 표시된다.
의사 결정 나무를 사용하기 위해 임의의 특징 값(Xm)이 분류 규칙으로 정의되면 각 데이터는 정의된 규칙을 만족할 때 왼쪽 자식 노드로 이동하게 되고 만족하지 않을 경우에 오른쪽 자식 노드로 이동하게 된다. 도 3에 도시된 이진 분류 나무를 통한 분류 과정의 예는 후술하기로 한다.
도 1 내지 도 9를 참조하면, 객체 검출 장치(100)에서 제어부(150)는 사용자로부터 입력부(160)를 통해 영상 취득 명령을 입력받는다(S202).
이에 따라, 제어부(150)는 영상 취득부(110)를 통해 피사체를 촬영하여 도 4에 도시된 바와 같은 영상을 획득한다(S204). 도 4는 피사체를 촬영하여 얻은 입력 영상을 나타낸 도면이다.
즉, 영상 취득부(110)는 피사체를 촬영하여 영상 신호를 얻고, 영상 신호를 디지털 형태의 영상 데이터로 변환하여 제어부(150)로 전달한다.
제어부(150)는 영상 취득부(110)로부터 전달받은 영상 데이터를 저장부(120)에 저장함과 더불어, 표시부(130)를 통해 영상 데이터를 디스플레이한다.
이어, 제어부(150)는 취득한 영상 데이터에서 검출하고자 하는 객체의 후보 영역을 선정한다(S206).
즉, 제어부(150)는 표시부(130)를 통해 디스플레이되고 있는 영상 데이터에 대해 도 5에 도시된 바와 같이 객체의 후보 영역을 선정하기 위한 선택 표시자(Choosing Indicator)(510)를 표시부(130)의 영상 데이터 상으로 표시한다. 도 5는 객체의 후보 영역을 선정하는 화면을 나타낸 도면이다.
이에 따라, 사용자는 입력부(160)에 구비된 방향 버튼을 통해 선택 표시자(510)를 객체의 후보 영역으로 선정하고자 하는 곳으로 이동시켜 객체의 후보 영역을 선정한다. 이때, 입력부(160)에 후보 영역의 선정에 관한 특정키를 구비할 수 있고, 사용자로 하여금 선택 표시자가 위치한 곳에서 선택키(OK 버튼)를 입력하거나 특정키를 입력하여 객체의 후보 영역을 선정할 수 있다.
또한, 제어부(150)는 취득한 영상에 대하여 객체 추출부(140)의 전처리부(142)를 통해 검출하고자 하는 객체의 후보 영역을 선정할 수 있다.
이를 위해, 제어부(150)는 영상 데이터에 대하여 전처리부(142)를 통해 도 6에 도시된 바와 같이 8×8 또는 16×16 블록화를 수행한다. 도 6은 객체의 후보 영역 선정을 위한 영상 데이터의 블록화를 나타낸 도면이다.
이어, 제어부(150)는 블록화된 영역 내의 색상 정보인 Cb, Cr에 대한 평균 값을 산출하여, 블록 내의 평균 색상 정보를 추출한다. 이를 위해, 제어부(150)는 블록화된 영역 내의 색상 정보에 대하여 도 7에 도시된 바와 같이 검출 객체의 색상 정보로 필터링한다. 이때, 제어부(150)는 블록화된 영역 내의 색상 정보를 이진화하여 필터링하게 된다. 도 7은 블록 내의 색상 정보를 객체의 색상 정보로 필터링하는 화면을 나타낸 도면이다.
그리고, 제어부(150)는 블록화된 영역 내의 색상 정보를 이진화 필터링하여 얻은 영상 데이터로부터 도 8에 도시된 바와 같이 후보 영역을 선정하게 된다. 도 8은 이진화 필터링하여 얻은 영상에서 후보 영역을 선정하는 화면을 나타낸 도면이다. 제어부(150)는 선정된 후보 영역에 대한 좌표값을 저장부(120)에 각각 저장한다.
이후, 제어부(150)는 선정된 후보 영역에서 SGLD 처리부(144)를 통해 고유한 특성이 되는 질감 정보 특징 값을 추출한다(S208).
즉, 제어부(150)는 SGLD 처리부(144)를 통해 후보 영역에 대해 8×8 또는 16×16 블록화를 수행하고, 블록화 영역 내 밝기(Y) 색상 정보의 평균 값을 추출한다. 즉, 제어부(150)는 SGLD 처리부(144)를 통해 후보 영역 블록 내의 밝기 정보를 도 9에 도시된 바와 같이 YcbCr 색공간에서의 Y 정보로 변경한다. 도 9는 후보 영 역 블록 내의 밝기 정보를 색공간에서의 Y 정보로 변경한 화면을 나타낸 도면이다.
이어, 제어부(150)는 블록화 영역 내의 밝기 정보에 대한 색공간의 Y 정보에서 SGLD 매트릭스에 따라 질감 정보인 SGLD 값을 추출한다. 여기서, SGLD 매트릭스는 M×N의 2차원으로서 다음 수학식 10과 같이 나타낼 수 있다.
Figure 112007016913034-PAT00010
즉, 수학식 10에 나타낸 바와 같이 SGLD 매트릭스는 전술한 바와 같이 관성 배열(BI)과 역차 배열(BD) 및 상관 배열(BC)을 이용한다.
제어부(150)는 SGLD 처리부(144)를 통해 SGLD 매트릭스로부터 1차원의 특징 값을 추출하여 SGLD 질감 정보를 얻게 된다.
그리고, 제어부(150)는 추출된 질감 정보 특징 값을 CART 처리부(146)에서 이용하는 이진 분류 나무를 통해 분류하여 원하는 객체를 추출하게 된다(S210).
즉, CART 처리부(146)는 분류 학습을 위한 가중치를 설정하고, 이진 분류 나무의 가지마다 가중치를 적용한 후, 분류 나무 내의 분류 조건에 대한 정보를 수정하여, 도 3에 도시된 이진 분류 과정으로 원하는 객체를 추출하게 된다.
추출된 질감 정보 특징 값을 도 3의 이진 분류 나무에 적용하는 경우, 질감 정보 특징 값이 제1 노드에서 가중치 "2"보다 더 큰 경우 제3 노드로 진행하고, 제 3 노드에서 질감 정보 특징 값이 가중치 "5"보다 작은 경우 제4 노드로 진행한다.
제4 노드에서 질감 정보 특징 값이 가중치 "7"보다 더 큰 경우에 제6 노드로 진행하여 제1 클래스를 얻고, 질감 정보 특징 값이 가중치 "7"보다 작은 경우에 제7 노드로 진행하여 제2 클래스를 얻게 되는 것이다. 제어부(150)는 이러한 과정으로 학습된 이진 분류 나무에 의한 분류 조건을 저장부(120)에 저장한다.
제어부(150)는 전술한 과정으로 제1 클래스에 해당하는 영상 또는 제2 클래스에 해당하는 영상을 얻게 된다. 따라서, 객체 검출 장치(100)는 정지 영상 또는 동영상에 대하여 이러한 과정을 반복하여 다양한 클래스의 객체를 얻을 수 있게 된다.
본 발명에서는 사용자가 객체 검출 장치(100)로부터 취득된 영상에 대해서 향후 자동 추출하고자 하는 객체 타입 및 객체 영역을 지정하여 내장된 분류기의 성능을 향상시키거나, 존재하지 않는 분류기의 생성이 가능하다. 이러한 적응적 분류기는 다양한 객체 추출에 대한 사용자의 요구를 만족시킬 수 있으며, 자동 객체 추출을 통한 영상물에 대한 데이터베이스화가 가능하다.
전술한 바와 같이 본 발명에 의하면, 입력 영상에서 객체의 후보 영역을 선정하여 특징적인 질감 정보를 추출하고, 추출한 질감 정보를 이진 분류 나무를 통해 원하는 객체를 검출하는, 영상으로부터의 객체 검출 방법 및 장치를 실현할 수 있다.
이상의 설명은 본 발명의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명의 본질 적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다.
따라서, 본 발명에 개시된 실시예들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다.
본 발명의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.
이상에서 설명한 바와 같이 본 발명에 의하면, 사용자가 추출하고자 하는 객체의 종류를 선택 지정하여 사용자의 요구에 맞는 객체를 추출할 수 있다. 또한, SGLD 질감 정보와 CART 분류를 이용하여 객체 추출을 위한 분류 성능을 크게 향상시킬 수 있다. 또한, 사용자가 지정한 객체로부터 특징 값을 추출하여 또 다른 객체를 분류할 수 있는 분류기로 활용할 수 있다. 그리고, 질감 정보나 형태 정보를 추출하는 멀티미디어 응용 기기를 실현할 수 있다.

Claims (18)

  1. 피사체로부터 영상을 취득하는 단계;
    상기 취득한 영상에서 검출하고자 하는 객체의 후보 영역을 선정하는 단계;
    상기 선정된 후보 영역에서 고유한 특성이 되는 질감 정보 특징 값을 추출하는 단계; 및
    상기 추출된 질감 정보 특징 값을 분류하여 상기 객체를 추출하는 단계;
    를 포함하는 영상으로부터의 객체 검출 방법
  2. 제 1 항에 있어서,
    상기 후보 영역을 선정하는 단계는, 상기 객체의 고유한 색상 성분에 대해 일정한 범위 내에 존재하는 평균 값들을 필터링하고, 필터링된 영역에서 상기 객체의 색상 성분에 해당하는 영역들을 선정하는 것을 특징으로 하는 영상으로부터의 객체 검출 방법.
  3. 제 1 항에 있어서,
    상기 후보 영역을 선정하는 단계는, 상기 취득한 영상을 일정한 블록 크기로 분할하고, 분할된 블록 내에서 색상 성분들 값의 평균값을 계산하는 것을 특징으로 하는 영상으로부터의 객체 검출 방법.
  4. 제 1 항에 있어서,
    상기 질감 정보 특징 값을 추출하는 단계는, SGLD(Spatial Gray Level Dependency) 매트릭스를 이용하여 상기 질감 정보 특징 값을 추출하는 것을 특징으로 하는 영상으로부터의 객체 검출 방법.
  5. 제 4 항에 있어서,
    상기 SGLD 매트릭스는 관성(Inertial) 배열, 역차(Inverse Difference) 배열, 상관(Correlation) 배열, 에너지(Energy) 배열 및 엔트로피(Entropy) 배열을 포함하는 것을 특징으로 하는 영상으로부터의 객체 검출 방법.
  6. 제 5 항에 있어서,
    상기 관성 배열은, 근접한 두 픽셀 값의 변화량 정도를 나타내는 것을 특징으로 하는 영상으로부터의 객체 검출 방법.
  7. 제 5 항에 있어서,
    상기 역차 배열은, 색상 성분 내의 국부 영역이 동질의 픽셀로 구성된 경우에 배열의 요소 값이 증가하며, 이질의 픽셀로 구성될 경우에 배열의 요소 값이 감소하는 것을 특징으로 하는 영상으로부터의 객체 검출 방법.
  8. 제 5 항에 있어서,
    상기 상관 배열은, 상기 색상 성분에 있는 각 픽셀의 전체 영역에 대한 상관도를 나타내는 것을 특징으로 하는 영상으로부터의 객체 검출 방법.
  9. 제 1 항에 있어서,
    상기 객체를 추출하는 단계는, 상기 추출된 질감 정보 특징 값에서 이진 분류 나무(CART:Classification And Regress Tree)를 통해 표준 오차가 최소가 되는 상기 객체를 추출하는 것을 특징으로 하는 영상으로부터의 객체 검출 방법.
  10. 피사체로부터 영상을 획득하는 영상 취득부;
    상기 취득한 영상에서 검출하고자 하는 객체의 후보 영역을 선정하는 전처리부;
    상기 선정된 후보 영역에서 고유한 특성이 되는 질감 정보 특징 값을 추출하는 SGLD(Spatial Gray Level Dependency) 처리부;
    상기 추출된 질감 정보 특징 값을 분류하여 상기 객체를 추출하는 CART(Classification And Regress Tree) 처리부; 및
    상기 영상 취득부를 통해 상기 영상을 취득하고, 취득한 영상으로부터 상기 객체가 추출되도록 상기 전처리부와 상기 SGLD 처리부 및 상기 CART 처리부를 제어하는 제어부;
    를 포함하는 객체 검출 장치.
  11. 제 10 항에 있어서,
    상기 제어부는, 상기 전처리부를 통해 상기 객체의 고유한 색상 성분에 대해 일정한 범위 내에 존재하는 평균 값들을 필터링하고, 필터링된 영역에서 상기 객체의 색상 성분에 해당하는 영역들을 선정하는 것을 특징으로 하는 객체 검출 장치.
  12. 제 10 항에 있어서,
    상기 제어부는, 상기 영상 취득부를 통해 취득한 상기 영상을 상기 전처리부를 통해 일정한 블록 크기로 분할하고, 분할된 블록 내에서 색상 성분들 값의 평균값을 계산하는 것을 특징으로 하는 객체 검출 장치.
  13. 제 10 항에 있어서,
    상기 제어부는, 상기 SGLD 처리부를 통해 SGLD 매트릭스를 이용하여 상기 질감 정보 특징 값을 추출하는 것을 특징으로 하는 객체 검출 장치.
  14. 제 13 항에 있어서,
    상기 SGLD 매트릭스는 관성(Inertial) 배열, 역차(Inverse Difference) 배열, 상관(Correlation) 배열, 에너지(Energy) 배열 및 엔트로피(Entropy) 배열을 포함하는 것을 특징으로 하는 객체 검출 장치.
  15. 제 14 항에 있어서,
    상기 관성 배열은, 근접한 두 픽셀 값의 변화량 정도를 나타내는 것을 특징으로 하는 객체 검출 장치.
  16. 제 14 항에 있어서,
    상기 역차 배열은, 색상 성분 내의 국부 영역이 동질의 픽셀로 구성된 경우에 배열의 요소 값이 증가하며, 이질의 픽셀로 구성될 경우에 배열의 요소 값이 감소하는 것을 특징으로 하는 객체 검출 장치.
  17. 제 14 항에 있어서,
    상기 상관 배열은, 상기 색상 성분에 있는 각 픽셀의 전체 영역에 대한 상관도를 나타내는 것을 특징으로 하는 객체 검출 장치.
  18. 제 10 항에 있어서,
    상기 제어부는, 상기 추출된 질감 정보 특징 값에서 상기 CART 처리부를 통해 이진 분류 나무(CART)를 이용하여 표준 오차가 최소가 되는 상기 객체를 추출하는 것을 특징으로 하는 객체 검출 장치.
KR1020070019591A 2007-02-27 2007-02-27 영상으로부터의 객체 검출 방법 및 장치 KR20080079443A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020070019591A KR20080079443A (ko) 2007-02-27 2007-02-27 영상으로부터의 객체 검출 방법 및 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020070019591A KR20080079443A (ko) 2007-02-27 2007-02-27 영상으로부터의 객체 검출 방법 및 장치

Publications (1)

Publication Number Publication Date
KR20080079443A true KR20080079443A (ko) 2008-09-01

Family

ID=40020371

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020070019591A KR20080079443A (ko) 2007-02-27 2007-02-27 영상으로부터의 객체 검출 방법 및 장치

Country Status (1)

Country Link
KR (1) KR20080079443A (ko)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110018850A (ko) * 2009-08-18 2011-02-24 제너럴 일렉트릭 캄파니 카메라 기반 피사체 분석 시스템, 방법 및 프로그램 제품
KR101034117B1 (ko) * 2009-11-13 2011-05-13 성균관대학교산학협력단 영상에서 관심 영역 지정 및 윤곽선 영상을 이용한 객체 인식 방법 및 장치
KR101064952B1 (ko) * 2009-11-23 2011-09-16 한국전자통신연구원 신체 관심영역 탐지 방법 및 장치
KR101108491B1 (ko) * 2010-07-13 2012-01-31 한국과학기술연구원 영상 내의 관심 영역에서의 물체 추출 장치 및 그 방법
WO2012020927A1 (ko) * 2010-08-09 2012-02-16 에스케이텔레콤 주식회사 통합 영상 검색 시스템 및 그 서비스 방법
KR20200120403A (ko) * 2019-04-12 2020-10-21 대한민국(산림청 국립산림과학원장) 원격탐사 기반 수종 분류 시스템 및 방법

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110018850A (ko) * 2009-08-18 2011-02-24 제너럴 일렉트릭 캄파니 카메라 기반 피사체 분석 시스템, 방법 및 프로그램 제품
KR101034117B1 (ko) * 2009-11-13 2011-05-13 성균관대학교산학협력단 영상에서 관심 영역 지정 및 윤곽선 영상을 이용한 객체 인식 방법 및 장치
KR101064952B1 (ko) * 2009-11-23 2011-09-16 한국전자통신연구원 신체 관심영역 탐지 방법 및 장치
US8620091B2 (en) 2009-11-23 2013-12-31 Electronics And Telecommunications Research Institute Method and apparatus for detecting specific external human body parts from texture energy maps of images by performing convolution
KR101108491B1 (ko) * 2010-07-13 2012-01-31 한국과학기술연구원 영상 내의 관심 영역에서의 물체 추출 장치 및 그 방법
WO2012020927A1 (ko) * 2010-08-09 2012-02-16 에스케이텔레콤 주식회사 통합 영상 검색 시스템 및 그 서비스 방법
US9576195B2 (en) 2010-08-09 2017-02-21 Sk Planet Co., Ltd. Integrated image searching system and service method thereof
US10380170B2 (en) 2010-08-09 2019-08-13 Sk Planet Co., Ltd. Integrated image searching system and service method thereof
KR20200120403A (ko) * 2019-04-12 2020-10-21 대한민국(산림청 국립산림과학원장) 원격탐사 기반 수종 분류 시스템 및 방법

Similar Documents

Publication Publication Date Title
EP3333768A1 (en) Method and apparatus for detecting target
JP5010905B2 (ja) 顔認証装置
US12002259B2 (en) Image processing apparatus, training apparatus, image processing method, training method, and storage medium
KR101410489B1 (ko) 얼굴 식별 방법 및 그 장치
KR20180065889A (ko) 타겟의 검측 방법 및 장치
JP4098021B2 (ja) シーン識別方法および装置ならびにプログラム
KR20200130440A (ko) 이미지 내 객체를 식별하기 위한 방법 및 상기 방법을 실행하기 위한 모바일 디바이스(method for identifying an object within an image and mobile device for executing the method)
KR20160136391A (ko) 정보처리장치 및 정보처리방법
JP2014041476A (ja) 画像処理装置、画像処理方法及びプログラム
CN104036284A (zh) 基于Adaboost算法的多尺度行人检测方法
CN106650615A (zh) 一种图像处理方法及终端
KR20080079443A (ko) 영상으로부터의 객체 검출 방법 및 장치
JP5578816B2 (ja) 画像処理装置
CN112149533A (zh) 一种基于改进ssd模型的目标检测方法
CN108205657A (zh) 视频镜头分割的方法、存储介质和移动终端
CN113269010A (zh) 一种人脸活体检测模型的训练方法和相关装置
JP2009123234A (ja) オブジェクト識別方法および装置ならびにプログラム
KR101515308B1 (ko) 얼굴 자세 추정 장치 및 그 방법
JP4285640B2 (ja) オブジェクト識別方法および装置ならびにプログラム
KR101681233B1 (ko) 저 에너지/해상도 가지는 얼굴 검출 방법 및 장치
CN116721288A (zh) 一种基于YOLOv5的安全帽检测方法及***
CN110795995A (zh) 数据处理方法、装置及计算机可读存储介质
JP5625196B2 (ja) 特徴点検出装置、特徴点検出方法、特徴点検出プログラム及び記録媒体
CN110363192A (zh) 物件影像辨识***及物件影像辨识方法
JP4186541B2 (ja) 画像処理装置

Legal Events

Date Code Title Description
WITN Withdrawal due to no request for examination