KR102594694B1 - 다수의 카메라에서 촬영된 영상에서 동일인물 인식 방법 및 이를 수행하기 위한 기록 매체 및 장치 - Google Patents

다수의 카메라에서 촬영된 영상에서 동일인물 인식 방법 및 이를 수행하기 위한 기록 매체 및 장치 Download PDF

Info

Publication number
KR102594694B1
KR102594694B1 KR1020210088010A KR20210088010A KR102594694B1 KR 102594694 B1 KR102594694 B1 KR 102594694B1 KR 1020210088010 A KR1020210088010 A KR 1020210088010A KR 20210088010 A KR20210088010 A KR 20210088010A KR 102594694 B1 KR102594694 B1 KR 102594694B1
Authority
KR
South Korea
Prior art keywords
image
pose
comparison
image sequence
representative
Prior art date
Application number
KR1020210088010A
Other languages
English (en)
Other versions
KR20230007141A (ko
Inventor
안희준
Original Assignee
서울과학기술대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 서울과학기술대학교 산학협력단 filed Critical 서울과학기술대학교 산학협력단
Priority to KR1020210088010A priority Critical patent/KR102594694B1/ko
Priority to PCT/KR2021/018160 priority patent/WO2023282410A1/ko
Publication of KR20230007141A publication Critical patent/KR20230007141A/ko
Application granted granted Critical
Publication of KR102594694B1 publication Critical patent/KR102594694B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/28Determining representative reference patterns, e.g. by averaging or distorting; Generating dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/001
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2210/00Indexing scheme for image generation or computer graphics
    • G06T2210/12Bounding box

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

본 발명의 동일인물 인식 장치에 의해 수행되는 동일인물 인식 방법은, 적어도 하나의 카메라로부터 동영상을 입력받는 단계; 입력된 동영상에 기초하여 이미지 시퀀스가 획득되는 이미지 시퀀스 획득단계; 상기 이미지 시퀀스에서 동일인물 인식을 위한 기준인물의 이미지 시퀀스를 쿼리 이미지 시퀀스로 하고, 상기 쿼리 이미지 시퀀스에 포함된 이미지의 포즈에 기초하여 상기 쿼리 이미지 시퀀스 중에서 기설정된 수만큼의 대표 이미지가 선택되는 대표 이미지 선택단계; 상기 이미지 시퀀스에서 상기 동일인물 인식을 위한 비교 대상이 되는 인물의 이미지 시퀀스를 비교 이미지 시퀀스로 하고, 상기 비교 이미지 시퀀스에 포함된 비교 이미지와 상기 대표 이미지를 매칭하여 비교대상 쌍을 선정하는 비교대상 쌍 선정단계; 변형 알고리즘을 통해 상기 비교대상 쌍에서 쌍을 이루는 상기 대표 이미지 또는 비교 이미지 중 적어도 하나의 이미지의 포즈를 변형 목표 포즈로 보정하는 포즈 보정단계; 상기 포즈 보정단계를 거친 상기 비교 이미지 및 상기 대표 이미지의 특징을 추출하는 특징 추출단계; 및 상기 추출된 특징 간의 유사도 및 거리를 산출하는 산출단계를 포함한다. 이에 의해 다중 카메라 시스템에서 인물 재탐지의 성능과 신뢰성을 높여 동일인물을 인식하는 정확도를 향상시킬 수 있다.

Description

다수의 카메라에서 촬영된 영상에서 동일인물 인식 방법 및 이를 수행하기 위한 기록 매체 및 장치{METHOD AND APPARATUS OF THE SAME PERSON IDENTIFICATION AMONG VIDEO SEQUENCES FROM MULTIPLE CAMERAS, RECORDING MEDIUM AND DEVICE FOR PERFORMING THE SAME}
본 발명은 다수의 카메라에서 촬영된 영상에서 동일인물 인식 방법 및 이를 수행하기 위한 기록 매체 및 장치에 관한 것으로, 보다 상세하게는 특정 카메라에서 발견된 인물을 다른 카메라에서 촬영된 영상 속의 인물과 동일인물인지를 확인할 수 있는 다수의 카메라에서 촬영된 영상에서 동일인물 인식 방법 및 이를 수행하기 위한 기록 매체 및 장치에 관한 것이다.
건물의 방재 카메라(CCTV) 시스템이나 자율주행과 같은 산업분야에서는 객체를 자동으로 검출함에 있어서, 다수의 카메라에서 촬영된 영상이나, 하나의 카메라에서 다른 시각에서 촬영된 인물이 동일인물인지를 확인하거나 동일인물을 영상에서 검색하는 기술이 사용된다. 이 때 일반적으로는 인물로 고려되는 영역을 추출하고 이 인물 사진 간의 유사도를 알고리즘에 의해서 또는 인공지능 학습법에 의하여 특징을 추출하고, 이들을 비교하여 유사도를 판별하는 방식을 사용한다.
하지만 추출된 이미지의 정보가 인물의 포즈, 카메라 위치 및 조명 등에 따라 매우 상이하기 때문에 동일한 인물을 확인하는 것이 쉽지 않다.
이러한 문제를 해결하기 위하여 인물 전체가 아닌 인물을 각 부분으로 나누고, 각 부분별로 비교하는 방법을 사용하는 알고리즘이 개발되고 있지만, 이러한 방법은 파트별 특성을 고려할 수는 있지만, 전체적인 신체 비율과 구조 등을 고려할 수 없다는 단점을 갖는다.
또한 한 장의 이미지에서 얻을 수 있는 방안은 제한적이므로 다수의 이미지를 이용한 매칭 방법도 개발되고 있지만, 동영상에서 추출되는 이미지의 수가 매우 많으므로 이를 효과적으로 줄이는 방법을 필요로 하나, 현재 개발된 방법은 비교 대상 영상과의 관계를 고려하지 않고 독립적으로 이미지를 선별하는 방법을 사용하기 때문에 동인인물을 감지하기에는 효과적이지 못한다는 문제가 여전히 존재한다. 특히 다수의 이미지를 이용한 매칭 방법의 경우에는 두 개의 이미지에 포함된 인물의 유사도를 계산할 때 인물의 파트를 검출하고, 각 파트별로 비교하는 방식을 사용하기 때문에 계산량이 과도하게 만하지기 때문에 실적용이 어렵다는 문제가 있다.
대한민국공개특허 제10-2012-0108319호
본 발명은 상기와 같은 문제를 해결하기 위해 안출된 것으로, 본 발명의 목적은 다중 카메라 시스템에서 인물 재탐지의 성능과 신뢰성을 높여 동일인물을 인식하는 정확도를 향상시킬 수 있는 다수의 카메라에서 촬영된 영상에서 동일인물 인식 방법 및 이를 수행하기 위한 기록 매체 및 장치를 제공하는 것이다.
또한 본 발명의 다른 목적은 동영상에서 대표적인 이미지를 선별하여 사용함으로써 종래의 이미지를 비교하는 연산보다 검색 속도를 향상시킬 수 있는 다수의 카메라에서 촬영된 영상에서 동일인물 인식 방법 및 이를 수행하기 위한 기록 매체 및 장치를 제공하는 것이다.
상기 목적을 달성하기 위한 본 발명의 일 실시예에 따른 동일인물 인식 장치에 의해 수행되는 동일인물 인식 방법은, 적어도 하나의 카메라로부터 동영상을 입력받는 단계; 입력된 동영상에 기초하여 이미지 시퀀스가 획득되는 이미지 시퀀스 획득단계; 상기 이미지 시퀀스에서 동일인물 인식을 위한 기준인물의 이미지 시퀀스를 쿼리 이미지 시퀀스로 하고, 상기 쿼리 이미지 시퀀스에 포함된 이미지의 포즈에 기초하여 상기 쿼리 이미지 시퀀스 중에서 기설정된 수만큼의 대표 이미지가 선택되는 대표 이미지 선택단계; 상기 이미지 시퀀스에서 상기 동일인물 인식을 위한 비교 대상이 되는 인물의 이미지 시퀀스를 비교 이미지 시퀀스로 하고, 상기 비교 이미지 시퀀스에 포함된 비교 이미지와 상기 대표 이미지를 매칭하여 비교대상 쌍을 선정하는 비교대상 쌍 선정단계; 변형 알고리즘을 통해 상기 비교대상 쌍에서 쌍을 이루는 상기 대표 이미지 또는 비교 이미지 중 적어도 하나의 이미지의 포즈를 변형 목표 포즈로 보정하는 포즈 보정단계; 상기 포즈 보정단계를 거친 상기 비교 이미지 및 상기 대표 이미지의 특징을 추출하는 특징 추출단계; 및 상기 추출된 특징 간의 유사도 및 거리를 산출하는 산출단계를 포함한다.
여기서 상기 이미지 시퀀스 획득단계는, 상기 입력된 동영상에서 인물영역을 검출하고 추적하여 인물에 대한 바운딩 박스를 포함하는 이미지 시퀀스를 획득하는 단계이고 상기 이미지 시퀀스 획득단계는, 상기 이미지 시퀀스에 포함된 각 이미지로부터 조인트를 추출하여 상기 이미지의 포즈를 추정하는 포즈 추정단계를 포함할 수도 있다.
그리고 상기 대표 이미지 선택단계는, 상기 포즈 추정단계를 통해 추정된 포즈에 기초하여 군집 알고리즘을 통해 상기 쿼리 이미지 시퀀스에 포함된 각 이미지들의 포즈 벡터를 찾아 군집화를 수행한 후 각 군집의 무게중심을 찾고, 상기 쿼리 이미지 시퀀스에 포함된 이미지 중 상기 군집의 무게중심과 가장 가까운 포즈를 갖는 이미지를 상기 대표 이미지로 선택할 수도 있다.
또한, 상기 비교대상 쌍 선정단계는, 상기 비교 이미지 시퀀스 중에서 상기 대표 이미지의 포즈와 가장 유사한 포즈를 갖는 이미지를 비교 이미지로써 상기 대표 이미지와 매칭하여 상기 대표 이미지와 상기 비교 이미지가 쌍을 이루도록 할 수도 있다.
그리고, 상기 포즈 보정단계에서는, 상기 비교대상 쌍에서 쌍을 이루는 상기 대표 이미지의 포즈 또는 상기 비교 이미지의 포즈 중 한 이미지의 포즈를 상기 변형 목표 포즈로 하고, 다른 한 이미지의 포즈를 상기 변형 목표 포즈로 보정할 수도 있다.
또한, 상기 포즈 보정단계에서는, 상기 비교대상 쌍에서 쌍을 이루는 상기 대표 이미지의 포즈 및 상기 비교 이미지의 포즈의 중간포즈를 상기 변형 목표 포즈로 하고, 상기 대표 이미지의 포즈 및 상기 비교 이미지의 포즈를 상기 변형 목표 포즈로 보정할 수도 있다.
한편, 상기한 본 발명의 다른 목적을 실현하기 위한 일 실시예에 따른 컴퓨터로 판독 가능한 기록 매체에는, 상기 동일인물 인식 방법을 수행하기 위한, 컴퓨터 프로그램이 기록되어 있다.
상기한 본 발명의 또 다른 목적을 실현하기 위한 일 실시예에 따른 동일인물 인식 장치는, 적어도 하나의 카메라로부터 동영상을 입력받는 입력부; 입력된 동영상에 기초하여 이미지 시퀀스를 획득하는 사전처리부; 상기 이미지 시퀀스에서 동일인물 인식을 위한 기준인물의 이미지 시퀀스를 쿼리 이미지 시퀀스로 하고, 상기 쿼리 이미지 시퀀스에 포함된 이미지의 포즈에 기초하여 상기 쿼리 이미지 시퀀스 중에서 기설정된 수만큼의 대표 이미지를 선택하는 대표 이미지 선택부; 상기 이미지 시퀀스에서 상기 동일인물 인식을 위한 비교 대상이 되는 인물의 이미지 시퀀스를 비교 이미지 시퀀스로 하고, 상기 비교 이미지 시퀀스에 포함된 비교 이미지와 상기 대표 이미지를 매칭하여 비교대상 쌍을 선정하는 비교대상 선정부; 변형 알고리즘을 통해 상기 비교대상 쌍에서 쌍을 이루는 상기 대표 이미지 또는 비교 이미지 중 적어도 하나의 이미지의 포즈를 변형 목표 포즈로 보정하는 이미지 보정부; 상기 포즈 보정부를 통해 포즈 보정을 거친 상기 대표 이미지 및 상기 비교 이미지의 특징을 추출하는 추출부; 및 상기 추출된 특징 간의 유사도 및 거리를 산출하는 산출부를 포함한다.
여기서 상기 이미지 보정부는, 상기 비교대상 쌍에서 쌍을 이루는 상기 대표 이미지의 포즈 또는 상기 비교 이미지의 포즈 중 한 이미지의 포즈를 상기 변형 목표 포즈로 하고, 다른 한 이미지의 포즈를 상기 변형 목표 포즈로 보정할 수도 있다.
그리고 상기 이미지 보정부는, 상기 비교대상 쌍에서 쌍을 이루는 상기 대표 이미지의 포즈 및 상기 비교 이미지의 포즈의 중간포즈를 상기 변형 목표 포즈로 하고, 상기 대표 이미지의 포즈 및 상기 비교 이미지의 포즈를 상기 변형 목표 포즈로 보정할 수도 있다.
상술한 본 발명의 일측면에 따르면, 본 발명의 다수의 카메라에서 촬영된 영상에서 동일인물 인식 방법 및 이를 수행하기 위한 기록 매체 및 장치를 제공함으로써, 다중 카메라 시스템에서 인물 재탐지의 성능과 신뢰성을 높여 동일인물을 인식하는 정확도를 향상시킬 수 있다.
또한, 동영상에서 대표적인 이미지를 선별하여 사용함으로써 종래의 이미지를 비교하는 연산보다 검색 속도를 향상시킬 수 있다. 특히 종래의 이미지 한장 한장을 서로 매칭하여 동일인물을 인식하는 것이 아닌 동영상의 트래킹을 기반으로 함으로써 대표 이미지 한 두장으로 동일인물을 검색하는 종래의 기술을 고도화시킬 수 있게 된다.
도 1은 본 발명의 일 실시예에 따른 동일인물 인식장치의 구성을 설명하기 위한 블록도,
도 2는 본 발명의 일 실시예에 따라 입력된 동영상에서 객체를 검출하는 모습을 설명하기 위한 도면,
도 3은 본 발명의 일 실시예에 따른 이미지 시퀀스를 설명하기 위한 도면,
도 4는 본 발명의 일 실시예에 따라 이미지 시퀀스에 포함된 이미지로부터 인물의 포즈를 추정하는 모습을 설명하기 위한 도면,
도 5는 본 발명의 일 실시예에 따른 이미지 시퀀스에 포함된 이미지의 포즈 변화를 설명하기 위한 도면,
도 6은 본 발명의 일 실시예에 따라 쿼리 이미지 시퀀스에서 대표 이미지 선정을 위한 군집화 및 대표 이미지를 선택하는 모습을 설명하기 위한 도면,
도 7은 본 발명의 일 실시예에 따라 대표 이미지와 비교 이미지를 매칭하여 비교대상 쌍을 선정하는 모습을 설명하기 위한 도면,
도 8은 본 발명의 일 실시예에 따라 대표 이미지의 포즈를 변형 목표 포즈로 정하여 비교 이미지의 포즈를 대표 이미지의 포즈와 일치시켜 이미지의 특징을 추출하고 특징의 유사도 및 거리를 산출하는 모습을 설명하기 위한 도면,
도 9는 본 발명의 일 실시예에 따른 동일인물 인식 방법을 설명하기 위한 흐름도, 그리고,
도 10은 본 발명의 일 실시예에 따른 동일인물 인식 방법에 따라 동일인물을 인식한 결과를 설명하기 위한 도면이다.
후술하는 본 발명에 대한 상세한 설명은, 본 발명이 실시될 수 있는 특정 실시예를 예시로서 도시하는 첨부 도면을 참조한다. 이들 실시예는 당업자가 본 발명을 실시할 수 있기에 충분하도록 상세히 설명된다. 본 발명의 다양한 실시예는 서로 다르지만 상호 배타적일 필요는 없음이 이해되어야 한다. 예를 들어, 여기에 기재되어 있는 특정 형상, 구조 및 특성은 일 실시예와 관련하여 본 발명의 정신 및 범위를 벗어나지 않으면서 다른 실시예로 구현될 수 있다. 또한, 각각의 개시된 실시예 내의 개별 구성요소의 위치 또는 배치는 본 발명의 정신 및 범위를 벗어나지 않으면서 변경될 수 있음이 이해되어야 한다. 따라서, 후술하는 상세한 설명은 한정적인 의미로서 취하려는 것이 아니며, 본 발명의 범위는, 적절하게 설명된다면, 그 청구항들이 주장하는 것과 균등한 모든 범위와 더불어 첨부된 청구항에 의해서만 한정된다. 도면에서 유사한 참조부호는 여러 측면에 걸쳐서 동일하거나 유사한 기능을 지칭한다.
이하에서는 도면들을 참조하여 본 발명의 바람직한 실시예들을 보다 상세하게 설명하기로 한다.
도 1은 본 발명의 일 실시예에 따른 동일인물 인식장치(100)의 구성을 설명하기 위한 블록도, 도 2는 본 발명의 일 실시예에 따라 입력된 동영상에서 객체를 검출(O1, O2, O3, O4)하는 모습을 설명하기 위한 도면이고, 도 3은 본 발명의 일 실시예에 따른 이미지 시퀀스(10)를 설명하기 위한 도면, 그리고 도 4는 본 발명의 일 실시예에 따라 이미지 시퀀스(10)에 포함된 이미지(10-1, 10-2)로부터 인물의 포즈(10-1', 10-2')를 추정하는 모습을 설명하기 위한 도면이다.
본 실시예에 따른 동일인물 인식장치(100)는 적어도 하나 이상의 카메라에서 촬영되는 동영상으로부터 획득된 이미지로부터 동일인물을 인식하기 위해 마련된다. 이를 위해 본 발명의 동일인물 인식장치(100)는 도 1에서와 같이 통신부(110), 입력부(130), 메모리(150), 출력부(170) 및 프로세서(190)를 포함하여 마련될 수 있다. 그리고 본 발명의 동일인물 인식 방법은 동일인물 인식 방법을 수행하기 위한 소프트웨어(어플리케이션)가 설치되어 실행될 수 있으며, 통신부(110), 입력부(130), 메모리(150), 출력부(170) 및 프로세서(190)의 구성은 동일인물 인식 장치(100)에서 실행되는 소프트웨어에 의해 제어될 수 있다.
통신부(110)는 외부 기기 또는 외부 네트워크로부터 필요한 정보를 송수신하기 위해 마련되는 것으로, 통신부(110)를 통해 적어도 하나의 카메라에서 촬영된 동영상을 네트워크를 통해 전달받을 수도 있다.
입력부(130)는 사용자 명령을 입력받기 위한 입력 수단으로 카메라에서 촬영된 영상을 입력받거나, 동일인물을 찾기 위한 검색의 기준대상 또는 비교대상이 되는 영상에 대한 정보 등을 입력받을 수 있다.
메모리(150)는 동일인물 인식 방법을 수행하기 위한 프로그램이 기록되고, 프로세서(190)가 동작함에 있어 필요한 저장 공간을 제공하여 프로세서(190)가 처리하는 데이터를 일시적 또는 영구적으로 저장하며, 휘발성 저장매체 또는 비휘발성 저장매체를 포함할 수 있으나, 본 발명의 범위가 이에 한정되는 것은 아니다. 또한 메모리(150)는 동일인물 인식 방법을 수행하면서 누적되는 데이터가 저장될 수 있다.
그리고 출력부(170)는 동일인물 인식 방법에 대한 과정 및 결과를 표시하기 위한 것으로 디스플레이를 포함할 수 있다.
한편 프로세서(190)는 상술한 동일인물 인식 방법을 수행하기 위해 사전처리부(191), 대표 이미지 선택부(192), 비교대상 선정부(193), 이미지 보정부(194), 추출부(195) 및 산출부(196)의 구성을 포함하여 마련될 수 있다.
사전처리부(191)는 적어도 하나의 카메라를 통해 입력된 동영상에 기초하여 이미지 시퀀스를 획득할 수 있다. 구체적으로 사전처리부(191)는 도 2에 도시된 바와 같이 적어도 하나의 카메라에서 촬영된 동영상 내에서 인물, 즉 객체를 검출(O1, O2, O3, O4) 및 추적(트래킹)을 직접 수행하거나 외부 기기로부터 전달받고, 이를 통해 사전처리부(191)는 인물에 대한 위치 정보, 즉 바운딩 박스(bounding box)를 포함하는 이미지 시퀀스(10)를 도 3에서와 같이 확보할 수 있다. 사전처리부(191)는 복수의 카메라로부터 동영상이 입력되는 경우에는 카메라 c개의 이미지 시퀀스(10)를 확보할 수 있다. 이러한 객체 검출 또는 트래킹은 딥 러닝 기반의 종래 객체 탐지 기술을 사용하거나 이로부터 유추가능한 바, 이와 관련한 구체적인 설명은 생략하기로 한다.
그리고 사전처리부(191)는 동영상으로부터 획득한 이미지 시퀀스(10)에 포함된 각 인물의 이미지들(10-1 내지 10-Tc)을 2차원 또는 3차원 자세예측 기법에 의하여 신체의 랜드마크 또는 조인트를 추출할 수 있다. 이러한 사전처리부(191)는 바운딩 박스를 포함하는 이미지 시퀀스(10)의 각 이미지들(10-1 내지 10-Tc)의 분석을 통하여 인물 이미지의 골격 추정으로 랜드마크 또는 조인트를 추출할 수 있으며, 추출되는 랜드마크 또는 조인트의 위치는, 얼굴중앙(코), 좌우 어깨, 좌우 팔꿈치, 좌우 손목, 좌우 골반중심, 좌우 무릎 및 좌우 발목을 포함할 수 있다. 도 4에 도시된 도면을 예로 들면, 사전처리부(191)는 이미지 시퀀스(10)에 포함되는 각 이미지들 중 2차원 포즈에 해당하는 도 4 (a)의 제1 이미지(10-1)를 2차원 자세예측 기법에 기초하여 추정한 포즈는 제1 포즈추정(10-1')와 같고, 3차원 포즈에 해당하는 도 4 (b)의 제2 이미지(10-2)를 3차원 자세예측 기법에 기초하여 추정한 포즈는 제2 포즈추정(10-2')과 같을 수 있다. 이러한 랜드마크 또는 조인트를 추출하여 이미지 속 인물의 포즈를 추정하는 것은 이미 일반화되어 있는 기술을 적용할 수도 있다.
그리고 도 3에 도시된 이미지 시퀀스(10)는 하나의 카메라에서 촬영된 동영상을 기준으로 하기에 이미지의 크기가 모두 동일하게 도시되었다. 하지만 복수의 카메라에서 촬영된 동영상의 경우에는 인물의 각도나 카메라 간의 위치 또는 해상도에 따라 이미지 시퀀스(10)에 포함된 각 인물 이미지들(10-1 내지 10-Tc)의 크기가 서로 다르다. 이에 본 발명에서 사전처리부(191)가 랜드마크 또는 조인트를 추출하여 인물의 포즈를 추정함에 있어서, 랜드마크 또는 조인트의 좌표 값을 픽셀 값 단위를 사용하지 않고, 각 이미지의 크기로 나누어 정규화하여 사용하거나, 카메라 간의 거리를 측정하거나 사전에 알고 있는 경우에는, 실제 물리적인 단위인 미터 등의 기준단위를 사용할 수 있다.
이렇게 사전처리부(191)에서 동영상으로부터 이미지 시퀀스(10)를 획득하고, 이미지 시퀀스(10)에 포함된 인물의 각 이미지에 기초하여 랜드마크 또는 조인트를 추출하여 인물의 포즈를 추정할 수 있다. 그리고 본 실시예에서 사전처리부(191)가 바운딩 박스를 포함하는 이미지 시퀀스(10)를 포함하고, 이미지 시퀀스(10)에 포함되는 각 이미지의 랜드마크 또는 조인트를 추출하여 인물의 포즈를 추정하는 것은 통신부(110) 또는 입력부(130)를 통해 입력되는 모든 동영상에 대해서 수행될 수 있다.
도 5는 본 발명의 일 실시예에 따른 쿼리 이미지 시퀀스(Q10)에 포함된 이미지의 포즈 변화를 설명하기 위한 도면이다. 도 5에 도시된 바와 같이 동영상에서 한 인물의 포즈는 시간의 흐름에 따라 변하게 되고 사전처리부(191)를 통해 인물의 포즈 변화를 추정할 수 있다. 이에 도 5에서와 같이 이미지 시퀀스(10) 중에서 기준인물의 이미지 시퀀스인 쿼리 이미지 시퀀스(Q10)로부터 기준인물의 포즈 변화를 추정할 수 있다.
한편 대표 이미지 선택부(192)는 이미지 시퀀스(10)에서 동일인물 인식을 위한 기준인물에 대한 쿼리 이미지 시퀀스(Q10)로부터 기설정된 개수만큼의 대표 이미지(Q)를 선택하기 위해 마련된다. 이하에서는 C개의 카메라에서 촬영된 동영상으로부터 획득된 C개의 이미지 시퀀스(10)들 중에서 동일인물 인식을 위한 기준인물에 대응되는 이미지 시퀀스를 쿼리 이미지 시퀀스(Q10)로 정의하여 설명하기로 하며, 여기서 기준인물이라 함은 다수의 카메라에서 촬영된 동영상 들로부터 사용자가 찾고자 하는 인물을 의미한다.
그리고 대표 이미지 선택부(192)에서 대표 이미지(Q)를 선택함에 있어서 사용하는 쿼리 이미지 시퀀스(Q10)는 도 5에 도시된 바와 같이 사전처리부(191)를 통해 포즈 추정이 완료된 상태일 수 있다.
대표 이미지 선택부(192)는 사용자에 의해 동일인물 인식을 위한 기준인물에 대한 정보, 즉 쿼리 이미지 시퀀스(Q10)가 별도로 입력되거나 이미지 시퀀스(10)들 중에서 선택되면 대표 이미지 선택부(192)는 군집 알고리즘을 통해 쿼리 이미지 시퀀스(Q10)에 포함된 각 이미지들의 포즈 벡터를 찾아 군집화를 수행한다.
도 6은 본 발명의 일 실시예에 따라 쿼리 이미지 시퀀스(Q10)에서 대표 이미지(101-Q 내지 105-Q) 선정을 위한 군집화(101 내지 105) 및 대표이미지(101-Q 내지 105-Q)를 선택하는 모습을 설명하기 위한 도면이다.
도시된 바와 같이 대표 이미지 선택부(192)는 도 5에 도시된 바와 같이 사전처리부(191)를 통해 포즈 추정이 완료된 상태의 쿼리 이미지 시퀀스(Q10)의 포즈에 기초하여 적어도 하나의 대표 이미지(101-Q 내지 105-Q)를 선택하게 된다. 선택되는 대표 이미지의 개수는 사용자에 의해 입력되는 시스템의 설정 변수로서, K개의 대표 이미지를 사용하여 후술할 도 7의 비교 이미지(101-S, 102-S, 103-S)와 비교하여 매칭하도록 설정될 수 있다.
보다 구체적으로 대표 이미지 선택부(192)는 통신부(110) 또는 입력부(130)를 통해 입력된 설정값이 5인 경우에는, 도 6에 도시된 바와 같이 쿼리 이미지 시퀀스(Q10)의 포즈에 기초하여 5개의 대표 이미지(101-Q 내지 105-Q)가 선택되는 것이다. 이를 위해 대표 이미지 선택부(192)는 군집 알고리즘으로 K-mean 알고리즘을 사용할 수 있다.
대표 이미지 선택부(192)는 쿼리 이미지 시퀀스(Q10)에 포함된 각 이미지들의 포즈와 뷰(각도) 정보를 바탕으로 군집 알고리즘으로 해당 포즈 벡터를 찾고, 그 중에서 각 군집((101 내지 105), 즉 클러스터의 무게 중심을 찾는다.
그리고 대표 이미지 선택부(192)는 군집(101 내지 105)의 무게 중심과 가장 가까운 포즈를 대표 포즈로 하고, 해당 포즈의 이미지를 대표 이미지(101-Q 내지 105-Q)로 선택할 수 있다.
본 실시예에 따른 대표 이미지 선택부(192)가 대표 이미지(101-Q 내지 105-Q)를 선택하는 것은 종래의 이미지 매칭 방식에서 과도한 계산양을 요구하는 문제를 해결하기 위한 것으로, 구체적으로 설명하면 1분체 촬영되는 동영상 내의 이미지가 초당 30 프레임으로 촬영된다고 가정하면, 30X60으로 총 1,800장의 이미지가 생성되는데, 해당 이미지들을 모두 비교하여 매칭하기에는 과도한 계산양을 필요로 한다. 이에 본 발명에서는 이미지들 중에서 대표가 되는 대표 이미지를 선택하고, 선택된 대표 이미지를 기준으로 하여 비교 이미지와 비교하여 동일인물인지를 분석함으로써 종래의 이미지 비교방식보다도 적은 계산양으로 동일인물을 인식할 수 있도록 한다.
한편 도 7은 본 발명의 일 실시예에 따른 비교대상 선정부(193)에서 대표 이미지(101-Q 내지 103-Q)와 비교 이미지(101-S 내지 103-S)를 매칭하여 비교대상 쌍((101-P 내지 103-P)을 선정하는 모습을 설명하기 위한 도면으로, 도면에서는 3개의 대표 이미지가 선택되는 경우이다. 비교대상 선정부(193)는 비교 이미지 시퀀스(S10)에 포함된 비교 이미지와 선택된 대표 이미지(101-Q 내지 103-Q)를 매칭하여 비교대상 쌍을 선정하기 위해 마련될 수 있다. 여기서 비교 이미지 시퀀스(S10)는 이미지 시퀀스(10)에서 동일인물 인식을 위한 비교 대상이 되는 인물의 이미지 시퀀스를 의미하고, 쿼리 이미지 시퀀스(Q10)와 마찬가지로 비교 이미지 시퀀스(S10) 역시 사전처리부(191)를 통해 이미지에 포함된 인물의 포즈 추정이 완료된 이미지 시퀀스일 수 있다.
비교대상 선정부(193)는 대표 이미지 선택부(192)를 통해 대표 이미지(101-Q, 102-Q, 103-Q)가 선택되면, 비교 이미지 시퀀스(S10) 중에서 선택된 대표 이미지(101-Q, 102-Q, 103-Q)의 포즈와 가장 유사한 포즈를 갖는 이미지를 비교 이미지(101-S, 102-S, 103-S)로 선택한다.
이후 비교대상 선정부(193)는 선택된 대표 이미지(101-Q, 102-Q, 103-Q) 와 선택된 비교 이미지(101-S, 102-S, 103-S)를 각각 매칭하여 서로 하나의 쌍을 이루도록 하여 비교대상 쌍(101-P, 102-P, 103-P)을 선정할 수 있다. 여기서 비교대상 쌍은 대표 이미지(101-Q, 102-Q, 103-Q)의 개수에 대응되는 수로 선정되는데, 도 7은 대표 이미지(101-Q, 102-Q, 103-Q)가 3개 선택되도록 설정된 경우의 예시적 사항이다. 도 7에 도시된 바와 같이 비교 이미지 시퀀스(S10)에 포함된 다수의 이미지들 중에서 3개의 대표 이미지(101-Q, 102-Q, 103-Q)의 포즈와 가장 유사한 이미지를 비교 이미지(101-S, 102-S, 103-S)로 선택하고, 가장 유사한 포즈를 갖는 이미지들끼리 매칭하여 비교대상 쌍(101-P, 102-P, 103-P)으로 선정할 수 있다.
그리고 본 실시예에서의 비교대상 선정부(193)는 비교대상 쌍(101-P, 102-P, 103-P)을 선정하기 위해 가중 유클리디안 거리를 사용하여 가장 유사한 포즈를 갖는 이미지를 서로 매칭하여 쌍을 선정할 수 있다. 본 실시예에서는 가장 유사한 뷰와 포즈에 해당하는 두 개의 이미지를 매칭함에 있어서 상대적으로 쉽고 안정적으로 추정이 가능한 가중 유클리디안 거리를 사용하는 것으로 상정하였지만, 꼭 이 방식에 한정되는 것은 아니며 다른 방식으로도 두 포즈 간의 거리를 구할 수 있음은 물론이다.
한편 이미지 보정부(194)는 변형 알고리즘을 통해 비교대상 쌍에서 쌍을 이루는 대표 이미지 또는 비교 이미지 중 적어도 하나의 이미지의 포즈를 변형 목표 포즈로 보정하기 위해 마련된다.
비교대상 쌍을 선정함에 있어서 대표 이미지(102-Q)와 가장 유사한 포즈와 뷰를 갖는 비교 이미지(102-S)를 매칭하더라도 도 7에 도시된 바와 같이 한 쌍(102-P)에 포함되는 두 이미지(102-Q, 102-S)의 포즈와 뷰가 정확히 일치하지 않을 수 있다. 이를 위해 본 실시예에서는 이미지 보정부(194)를 통해 비교 이미지(102-S)의 포즈(102-S')와 대표 이미지(102-Q)의 포즈(102-Q')를 일치시키는 과정을 수행할 수 있다.
구체적으로 이미지 보정부(194)는 한 쌍의 비교대상 쌍(102-P)에 포함되는 대표 이미지(102-Q)의 포즈(102-Q') 및 비교 이미지(102-S)의 포즈(102-S') 중 적어도 하나의 이미지의 포즈를 변형 목표 포즈로 보정함에 있어서는 두 가지 방식 중 하나를 선택하여 보정할 수 있다. 하나의 방식은 대표 이미지의 포즈(102-Q') 또는 비교 이미지의 포즈(102-S′) 중 한 이미지의 포즈를 변형 목표 포즈로 정하여, 다른 한 이미지의 포즈만을 변형 목표 포즈로 보정할 수 있다. 나머지 하나의 방식은 대표 이미지의 포즈(102-Q') 및 비교 이미지의 포즈(102-S')의 중간 포즈를 변형 목표 포즈로 정하여, 두 이미지의 포즈((102-Q', 102-S')를 모두 변형 목표 포즈로 보정할 수 있다.
도 8은 본 발명의 일 실시예에 따라 대표 이미지(102-Q)의 포즈(102-Q')를 변형 목표 포즈로 정하여 비교 이미지의 포즈(102-S')를 대표 이미지의 포즈(102-Q')와 일치시켜 이미지의 특징을 추출하고 특징의 유사도 및 거리를 산출하는 모습을 설명하기 위한 도면이다.
만약 변형 목표 포즈가 대표 이미지의 포즈(102-Q')로 설정된 경우에는 도 8에 도시된 바와 같이 사전처리부(191)를 통해 추정된 포즈에 기초하여 이미지 보정부(194)는 비교 이미지의 포즈(102-S')를 변형 목표 포즈인 기준 이미지의 포즈(102-Q')와 동일해지도록 보정한다. 이를 통해 이미지 보정부(194)는 비교 이미지(102-S)가 변형 목표 포즈와 동일해지도록 보정된 보정 이미지(102-SC)를 생성할 수 있다.
반면, 도 8과는 달리 본 발명의 변형 목표 포즈가 대표 이미지의 포즈(102-Q')와 비교 이미지의 포즈(102-S')의 중간 포즈로 설정된 경우라면, 이미지 보정부(194)는 대표 이미지((102-Q)와 비교 이미지((102-S) 모두 중간 포즈와 동일한 포즈를 갖도록 보정하여 보정된 대표 이미지(미도시)와 보정된 비교 이미지(미도시)를 생성할 수 있을 것이다.
이러한 이미지 보정부(194)를 통해 본 발명에는 종래의 DPM(Deformable Part Model)과 같이 각 신체 부위별로 비교하는 방식이 아닌 포즈 일치를 통해 전체 구조를 반영할 수 있는 것은 물론, DPM과 같은 많은 계산양을 요하지 않는다는 장점이 있다.
그리고 이미지 보정부(194)는 변형 목표 포즈를 정함에 있어 조인트 정보를 이용하여 non-rigid 기하변환 방식을 사용하거나 신경망을 이용한 방법으로 수행될 수 있으며, 이와 동일한 기능을 제공하는 방식이라면 어떤 방식이던 활용이 가능하다. Non-rigid 기하변환 방식의 일 예로는 Thin plate Spline 방식이나 ARAP(As Rigid as possible) 방식일 수 있다.
한편 추출부(195)는 이미지 보정부(194)를 통해 포즈 보정을 거친 비교 이미지인 보정 이미지(102-SC) 및 대표 이미지(102-Q)의 특징을 추출할 수 있다.
도 8에 도시된 바와 같이 변형 목표 포즈가 대표 이미지의 포즈(102-Q')로 정해져 비교 이미지의 포즈(102-S')만이 보정되어 보정 이미지(102-SC)가 생성되면, 추출부(195)는 보정 이미지(102-SC)와 대표 이미지((102-Q)의 특징을 추출하는데, 이 때 합성곱 신경망이나 정해진 함수에 따라 특징을 추출할 수 있다.
만약 변형 목표 포즈가 중간 포즈인 경우에는 추출부(195)는 보정된 대표 이미지와 보정된 비교 이미지의 특징을 추출할 수 있다.
산출부(196)는 추출부(195)에서 추출된 특징에 기초하여 대표 이미지(102-Q)의 특징값과 보정된 비교 이미지인 보정 이미지(102-SC)의 특징값 간의 거리를 계산하는 함수에 기초하여 두 특징값 간의 거리를 계산할 수 있다. 여기서 특징값 간의 거리를 계산하는 알고리즘은 역코사인 유사성 (invers cosine similarity)을 사용하거나 신경회로망을 통한 학습에 의하여 얻을 수 있다.
그리고 산출부(196)은 산출한 유사도의 결과를 유사도에 따라 가장 근접한 비교대상의 쌍을 K개까지 선택하는 Rank-K 알고리즘을 통해 유사도가 가장 근접한 K개의 검색 결과를 출력하도록 할 수 있다. 여기서 K개의 개수는 사용자의 선택에 따라 설정되는 값일 수 있으며, K개의 검색 결과를 사용자가 확인할 수 있도록 출력부(170)를 통해 출력할 수 있다. 그러면 사용자는 출력부(170)를 통해 출력된 결과물을 육안으로 확인하여 동일인물인지 아닌지를 판단할 수 있게 된다.
한편, 도 9는 본 발명의 일 실시예에 따른 동일인물 인식 방법을 설명하기 위한 흐름도, 그리고, 도 10은 본 발명의 일 실시예에 따른 동일인물 인식 방법에 따라 동일인물을 인식한 결과를 설명하기 위한 도면이다.
본 발명의 동일인물 인식 방법은 다수의 카메라에서 촬영된 영상이나, 하나의 카메라에서 다른 각도로 촬영된 인물이 동일인물인지를 검색 또는 확인하기 위해 마련되는 것으로, 상술한 본 발명의 동일인물 인식 장치에 의해서 수행된다.
먼저 본 발명에 따른 동일인물 인식 방법은, 동일인물 인식 장치(100)가 적어도 하나의 카메라로부터 동영상을 입력받는다(S110).
그러면 동일인물 인식 장치(100)는 입력된 동영상에 기초하여 인물영역을 검출하고 추적하여 인물에 대한 바운딩 박스를 포함하는 이미지 시퀀스(10)를 획득할 수 있다(S120).
구체적으로 도 2에 도시된 바와 같이 동일인물 인식 장치(100)는 입력된 동영상 내에서 인물, 즉 객체를 검출(O1, O2, O3, O4) 및 추적(트래킹)을 직접 수행하거나 외부 기기로부터 전달받을 수 있다. 이를 통해 동일인물 인식 장치(100)는 인물에 대한 위치 정보, 즉 바운딩 박스(bounding box)를 포함하는 이미지 시퀀스(10)를 도 3에서와 같이 확보할 수 있다. 객체 검출 또는 트래킹은 딥 러닝 기반의 종래 객체 탐지 기술을 사용하거나 이로부터 유추가능한 바, 이와 관련한 구체적인 설명은 생략하기로 한다.
이 때 C개의 이미지 시퀀스(10)를 로 표현할 수 있다. 여기서 는 이미지 시퀀스(10) c의 모든 프레임 이미지들의 순서있는 집합이고, 는 이미지 시퀀스(10) c의 프레임의 개수를 의미한다. 그리고 c는 고려하는 인물 이미지 시퀀스(10)의 개수, 즉 인물이 촬영되는 카메라의 수를 의미하며, t는 시간적인 순서를 의미한다. 이 때 c개의 각 이미지 시퀀스(10)의 해상도와 크기는 각각 다를 수 있다.
이후 동일인물 인식 장치(100)는 이미지 시퀀스(10)에 포함된 각 이미지로부터 조인트를 추출하여 각 이미지의 포즈를 추정할 수 있다(S130).
본 발명의 동일인물 인식 장치(100)는 상술한 바와 같이 획득한 이미지 시퀀스(10)에 포함된 각 인물의 이미지를 2차원 또는 3차원 자세예측 기법에 의하여 중요한 신체의 랜드마크 또는 조인트를 추출할 수 있다. 여기서 랜드마크 또는 조인트의 위치는 얼굴중앙(코), 좌우 어깨, 좌우 팔꿈치, 좌우 손목, 좌우 골반중심, 좌우 무릎 및 좌우 발목을 포함할 수 있다. 그리고 이렇게 추출된 랜드마크 또는 조인트를 로 표시할 수 있다. 또한 랜드마크 또는 조인트를 추출함에 있어서, 이미지 시퀀스(10)에 포함된 인물의 이미지들 중 도 4 (a)에 도시된 바와 같이 2차원 포즈에 해당하는 제1 이미지(10-1)인 경우에는 하기의 수학식 2에 의해 산출함으로써 제1 포즈추정(10-1')을 할 수 있고, 도 4 (b)와 같이 3차원 포즈에 해당하는 제2 이미지(10-2)는 하기의 수학식 1에 의해 산출함으로써 제2 포즈추정(10-2')을 할 수 있다.
[수학식 1]
[수학식 2]
이상의 수학식에서 는 이미지 시퀀스(10) c의 시점 t에 해당하는 인물 이미지의 J개의 랜드마크 또는 조인트들의 3차원 또는 2차원 좌표값 또는 정규화된 좌표값을 의미하며, 이상의 수학식을 통해 2차원 또는 3차원으로 추출된 조인트는 도 4에 도시된 바와 같다. 이러한 랜드마크 또는 조인트를 추출하여 이미지 속 인물의 포즈를 추정하는 것은 이미 일반화되어 있는 기술을 적용할 수도 있다.
그리고 도 3에 도시된 이미지 시퀀스(10)는 하나의 카메라에서 촬영된 동영상을 기준으로 하기에 이미지의 크기가 모두 동일하게 도시되었다. 하지만 복수의 카메라에서 촬영된 동영상의 경우에는 인물의 각도나 카메라 간의 위치 또는 해상도에 따라 이미지 시퀀스(10)에 포함된 각 인물 이미지들(10-1 내지 10-Tc)의 크기가 c개의 이미지 시퀀스(10)마다 서로 다를 수 있다. 이에 본 동일인물 인식 방법은 랜드마크 또는 조인트를 추출하여 인물의 포즈를 추정함에 있어서, 랜드마크 또는 조인트의 좌표 값을 픽셀 값 단위를 사용하지 않고, 각 이미지의 크기로 나누어 정규화하여 사용하거나, 카메라 간의 거리를 측정하거나 사전에 알고 있는 경우에는, 실제 물리적인 단위인 미터 등의 기준단위를 사용할 수 있다.
이렇게 동영상으로부터 이미지 시퀀스(10)를 획득하고, 이미지 시퀀스(10)에 포함된 인물의 각 이미지에 기초하여 랜드마크 또는 조인트를 추출하여 인물의 포즈를 추정할 수 있다. 그리고 본 실시예에서 바운딩 박스를 포함하는 이미지 시퀀스(10)를 획득(S120)하고, 이미지 시퀀스(10)에 포함되는 각 이미지의 랜드마크 또는 조인트를 추출하여 인물의 포즈를 추정하는 단계(S130)는 동영상이 입력되는 단계(S110)를 통해 입력되는 모든 동영상에 대해서 수행될 수 있다.
이후 동일인물 인식 장치(100)는 쿼리 이미지 시퀀스(Q10)에 포함된 이미지의 포즈에 기초하여 쿼리 이미지 시퀀스(Q10) 중에서 기설정된 수만큼의 대표 이미지(101-Q 내지 105-Q)를 선택한다(S140). 이 때 C개의 카메라에서 촬영된 동영상으로부터 획득된 C개의 이미지 시퀀스(10)들 중에서 동일인물 인식을 위한 기준인물에 대응되는 이미지 시퀀스를 쿼리 이미지 시퀀스(Q10)로 정의하여 설명하기로 하며, 여기서 기준인물이라 함은 다수의 카메라에서 촬영된 동영상 들로부터 사용자가 찾고자 하는 인물을 의미한다.
여기서 선택되는 대표 이미지의 기설정된 개수는 사용자가 시스템의 설정 변수로서, 사용자가 설정한 설정값이 5인 경우에는 5개의 대표 이미지(101-Q 내지 105-Q)를 선택할 수 있다.
그리고 선택되는 대표 이미지(101-Q 내지 105-Q)는 쿼리 이미지 시퀀스 (Q10)중에서 독립적인 정보가 가장 큰 이미지가 선택될 수 있는데, 본 발명에서는 각 이미지의 포즈를 추정하는 단계(S130)에서 추정된 인물의 포즈와 카메라의 뷰(각도)에 기초하여 대표 이미지(101-Q 내지 105-Q)를 선택할 수 있다.
도 5에와 같이 포즈 추정이 완료된 쿼리 이미지 시퀀스(Q10)를 보면 시간의 흐름에 따라 인물의 포즈가 변화하게 된다. 이에 본 실시예에서는 쿼리 이미지 시퀀스(Q10)에서 대표 이미지를 선정하기 위해 군집화를 수행하고, 각 군집(101 내지 105)에 포함된 이미지들 중 하나를 대표 이미지(101-Q 내지 105-Q)로 선정하게 되며, 이는 도 6에 도시된 바와 같다.
대표 이미지 선택하는 단계(S140)에서 동일인물 인식 장치(100)는 각 이미지의 포즈를 추정하는 단계(S120)를 통해 추정된 포즈에 기초하여 군집 알고리즘을 통해 쿼리 이미지 시퀀스(Q10)에 포함된 각 이미지들의 포즈 벡터를 찾아 군집화를 수행한 후 각 군집의 무게중심을 찾는다.
이를 위해 동일인물 인식 장치(100)는 하기의 수학식 3에 기초하여 각 군집(101 내지 105), 즉 클러스터의 무게 중심을 찾을 수 있으며, 여기서 군집 알고리즘으로는 K-mean 알고리즘을 사용할 수 있다.
[수학식 3]
수학식 3에서 q는 쿼리 이미지 시퀀스를 의미하고, 는 쿼리 이미지 시퀀스 q의 포즈 벡터들로부터 군집화를 통하여 얻은 군집 k의 무게중심 값을 의미한다.
그리고 하기의 수학식 4에 기초하여 군집 알고리즘을 통해 찾은 각 군집(101 내지 105)의 무게 중심과 가장 가까운 포즈를 갖는 이미지를 대표 이미지(101-Q 내지 105-Q)로 선택할 수 있다.
[수학식 4]
여기서 는 쿼리 이미지 시퀀스 q에서 군집 k의 무게중심 값인 를 대표하는 포즈 벡터를 갖는 이미지의 시점을 의미한다.
본 발명의 동일인물 인식 방법에서 이와 같이 대표 이미지(101-Q 내지 105-Q)를 선택하는 것은 종래의 이미지 매칭 방식에서 과도한 계산량을 요구하는 문제를 해결하기 위함이다. 구체적으로 설명하자면 1분에 촬영되는 동영상 내의 이미지가 초당 30 프레임으로 촬영된다고 가정하면, 30X60으로 총 1,800장의 이미지가 생성되는데 해당 이미지들을 모두 비교하여 매칭하기에는 어려움이 있기에 본 발명에서는 해당 이미지 중에서 대표가 되는 대표 이미지를 선택하는 것이며, 선택된 대표 이미지를 기준 이미지로 사용하는 것이다.
이렇게 대표 이미지(101-Q 내지 105-Q)가 선택되고 나면, 이후 동일인물 인식 장치(100)는 비교 이미지 시퀀스(S10)에 포함된 비교 이미지와 대표 이미지를 매칭하여 비교대상 쌍을 선정한다(S150). 여기서 비교 이미지 시퀀스(S10)는 C개의 이미지 시퀀스 중에서 동일인물 인식을 위한 비교 대상이 되는 인물의 이미지 시퀀스를 의미한다.
비교대상 쌍 선정단계(S150)는, 도 7에서와 같이 비교 이미지 시퀀스(S10) 중에서 선택된 대표 이미지(101-Q, 102-Q, 103-Q)의 포즈와 가장 유사한 포즈를 갖는 이미지를 비교 이미지(101-S, 102-S, 103-S)로 선택할 수 있다. 그리고나면 동일인물 인식 장치(100)는 선택된 비교 이미지(101-S, 102-S, 103-S)를 대표 이미지(101-Q, 102-Q, 103-Q)와 각각 매칭하여 서로 하나의 쌍(101-P, 102-P, 103P)을 이루도록 할 수 있다.
그리고 동일인물 인식 장치(100)는 하기의 수학식 5에 기초하여 비교대상 쌍을 선정할 수 있다.
[수학식 5]
이상의 식에서 는 쿼리 이미지 시퀀스의 시점 에 해당하는 포즈와 가장 유사한 포즈를 취하고 있는 비교 이미지 시퀀스에서의 시점을 의미하고, 는 대표 이미지의 포즈와 가장 유사한 포즈를 갖는 비교 이미지의 쌍들의 집합, 즉 비교대상 쌍의 집합이다.
여기서 대표 이미지의 포즈와 비교 이미지의 포즈 간의 거리는 포즈와 뷰의 차이를 측정하는 여러 가지 방식을 통해 산출할 수 있는데, 본 실시예에서는 하기의 수학식 6에서와 같이 가중 유클리디안 거리를 사용하여 산출하고 이 때 가중치 는 실험적으로 구하거나 사용자가 선택하여 결정할 수 있다.
[수학식 6]
이상의 수학식 6에서 는 쿼리 이미지 시퀀스 q와 비교 이미지 시퀀스 s의 임의 시점에서의 인물 포즈에서 j번째 조인트에 대한 정규화된 2차원 또는 3차원의 좌표값을 의미한다.
이상에서와 같이 가중 유클리디안 거리를 사용하는 것은 상대적으로 쉽고 안정적으로 추정이 가능하기 때문으로 본 실시예에서는 가중 유클리디안을 사용하는 것으로 상정하였지만, 꼭 이 방식에 한정되는 것은 아니며 다른 방식으로도 두 포즈 간의 거리를 구할 수 있을 것이다.
이 후 동일인물 인식 장치(100)는 도 8에 도시된 바와 같이 변형 알고리즘을 통해 비교대상 쌍(102-P)에서 쌍을 이루는 대표 이미지(102-Q) 또는 비교 이미지(102-S) 중 적어도 하나의 이미지의 포즈를 변형 목표 포즈로 보정할 수 있다(S160).
이렇게 비교대상의 쌍을 선정하는 단계(S150) 이후 변형 알고리즘을 통해 대표 이미지(102-Q) 또는 비교 이미지(102-S) 중 적어도 하나의 포즈를 변형 목표 포즈로 보정하여 보정 이미지를 생성하는 것은, 상술한 바와 같이 S150에서 유사한 포즈와 뷰를 갖는 대표 이미지(102-Q)와 비교 이미지(102-S)를 서로 매칭하여 비교대상의 쌍(102-P)을 선정하더라도 쌍을 이루는 대표 이미지(102-Q)와 비교 이미지(102-S) 간의 포즈와 뷰가 정확히 정확히 일치하는 것은 아니기 때문에 수행하는 단계이다.
종래에는 이미지를 매칭함에 있어서 DPM(deformable part Model)과 같이 각 신체 부위별로 비교하는 방식을 사용하고 있지만, 이 경우에는 DPM을 하기 위한 알고리즘을 실행하는데 많은 계산량을 필요로 하고, 파트별 비교가 전체 구조를 반영하지 못한다는 문제가 있다.
이에 따라 본 발명에서는 이처럼 많은 계산량을 요구하지 않으면서 전체 구조를 반영하기 위하여 대표 이미지와 비교 이미지의 포즈를 일치시키는 단계를 포함할 수 있다.
그리고 변형 목표 포즈를 정하고 변형 목표 포즈와 동일하게 이미지의 포즈를 변형시키는 방법은 조인트 정보를 이용하여 non-rigid 기하변환 방식을 사용하거나 신경망을 이용한 방법으로 수행될 수 있으며, 이와 동일한 기능을 하는 방식이라면 어떤 방식이던 활용이 가능하다. 비신경망 방식의 Non-rigid 기하변환 방식의 일 예로는 Thin plate Spline 방식이나 ARAP(As Rigid as possible) 방식일 수 있다. 이러한 변형 목표 포즈는 하기의 수학식 7 및 수학식 8에 기초하여 생성될 수 있다.
[수학식 7]
[수학식 8]
여기서 는 변형 알고리즘에 따른 대표 이미지인 의 보정 이미지이고, 는 변형 알고리즘에 따른 비교 이미지인 의 보정 이미지이다.
그리고 이상의 식에서 는 현재 포즈 인 비교대상 쌍에 포함되는 대표 이미지 또는 비교 이미지인 를 변형 목표 포즈 로 변형해주는 변형 알고리즘을 의미하고, 는 쿼리 이미지 시퀀스의 시간 에서의 변형 목표 포즈를 의미한다. 는 각각 보정 후 이미지 에서의 사람의 포즈이다.
본 발명에서의 포즈 보정단계(S160)는, 두 가지 방식 중 하나를 선택하여 포즈 보정을 수행함으로써 보정 이미지를 생성할 수 있다. 이러한 두 가지 방식 중 먼저 하나의 방식은 하기의 수학식 9에서와 같이 비교대상 쌍(102-P)에서 쌍을 이루는 대표 이미지(102-Q)의 포즈 또는 비교 이미지(102-S)의 포즈 중 한 이미지의 포즈를 변형 목표 포즈로 하고, 다른 한 이미지의 포즈를 변형 목표 포즈로 보정하여 보정 이미지를 생성하는 방식일 수 있다.
[수학식 9]
여기서 는 쿼리 이미지 시퀀스의 시간 와 비교 대상인 비교 이미지 시퀀스의 시간 에서의 변형 목표 포즈를 의미한다.
도 8은 상술한 바와 같이 대표 이미지(102-Q)의 포즈를 변형 목표 포즈로 정하고, 비교 이미지(102-S)의 포즈를 대표 이미지(102-Q)의 포즈와 동일하게 보정하여 보정 이미지(102-SC)를 생성함으로써 두 이미지의 포즈를 일치시키는 경우의 도면이다. 이와는 반대로 비교 이미지(102-S)의 포즈를 변형 목표 포즈로 정하고 대표 이미지(102-Q)의 포즈를 변형 목표 포즈인 비교 이미지(102-S)의 포즈와 동일해지도록 보정하여 보정 이미지를 생성하여 두 이미지의 포즈를 일치시킬 수 있음은 물론이다.
한편 나머지 하나의 방식은 하기의 수학식 10을 이용해 비교대상 쌍(102-P)에서 쌍을 이루는 대표 이미지(102-Q)의 포즈 및 비교 이미지(102-S)의 포즈의 중간포즈를 변형 목표 포즈로 하고, 대표 이미지(102-Q)의 포즈 및 비교 이미지(102-S)의 포즈를 모두 변형 목표 포즈로 보정하여 2개의 보정 이미지, 즉 보정된 대표 이미지 및 보정된 비교 이미지를 생성하여 두 이미지의 포즈를 일치시키는 방식일 수 있다.
[수학식 10]
따라서 본 발명의 동일인물 인식 장치(100)는 이상의 수학식들을 통해 변형 목표 포즈를 생성하고, 이렇게 생성된 변형 목표 포즈에 기반하여 비교 이미지(102-S)의 포즈 또는 대표 이미지(102-Q)의 포즈를 변형시켜 서로의 포즈를 일치시키게 된다.
그리고 동일인물 인식 장치(100)는 포즈 보정단계(S160)를 거친 대표 이미지 및 비교 이미지의 특징을 추출할 수 있다(S170). 여기서는 설명의 편의를 위해 도 8에 도시된 도면을 기준으로 설명하며, 도면에 도시된 바와 같이 특징을 추출하는 단계에서는 대표 이미지(102-Q)의 특징과 보정된 비교 이미지, 즉 보정 이미지(102-SC)의 특징을 추출할 수 있다.
대표 이미지(102-Q)와 보정 이미지(102-SC) 간의 유사도를 계산하기 위하여 합성곱 신경망(CNN) 방식이나 종래의 고전적인 방식으로 특징값을 추출할 수 있는데 이를 수식화하면 하기의 수학식 11과 같다.
[수학식 11]
이상에서 는 이미지에서 특징을 추출하기 위한 신경망 또는 정해진 함수이다.
이상에서는 변형 목표 포즈가 대표 이미지(102-Q)의 포즈인 경우로 설명하였기에 보정된 비교 이미지인 보정 이미지(102-SC)의 특징과 대표 이미지102-의 특징을 추출한다고 설명하였으나, 이에 한정되는 것은 아니다.
구체적으로 만약 변형 목표 포즈가 중간 포즈로 설정된 경우라면, 변형 목표 포즈로 보정된 대표 이미지의 특징과 보정된 비교 이미지의 특징을 추출하게 되는 것이다.
이렇게 특징이 추출되고 나면 동일인물 인식 장치(100)는, 추출된 특징 간의 유사도 및 거리를 산출할 수 있다(S180).
도면에 도시된 바와 같이 대표 이미지(102-Q)의 특징값과 보정된 비교 이미지인 보정 이미지(102-SC)의 특징값 간의 거리를 하기의 수학식 12 또는 수학식 13과 같이 두 특징값 간의 거리를 계산하는 함수에 기초하여 비교대상 쌍(102-P)의 거리의 합 등을 유사도로 사용할 수 있다. 특징값 간의 거리를 계산하는 알고리즘은 역코사인 유사성(invers cosine similarity)을 사용하거나 신경회로망을 통한 학습에 의하여 얻을 수 있다.
[수학식 12]
[수학식 13]
여기서 는 쿼리 이미지 시퀀스의 인물의 시점 t에서의 대표 이미지의 특징(feature) 벡터 값이고 는 해당 시점에 대응되는 보정된 비교 이미지의 특징 벡터 값이며, 는 이 특징 벡터들 간의 거리(차이)이다. 즉 대표 이미지의 집합 과 비교 이미지의 집합 간의 거리를 서로 매칭되어 한 쌍을 이루는 이미지들 간의 거리의 합 또는 이들 거리 중에서 가장 적은 거리로 정의하여 사용할 수 있다.
이렇게 산출된 유사도의 결과를 유사도에 따라 가장 가까운 Rank-K, 즉 가장 근접한 비교 대상 쌍 K개까지 선택하는 알고리즘을 통해 유사도가 가장 근접한 K개의 검색 결과를 출력하여 사용자가 확인할 수 있도록 하여 사용자에 의해 동일인물인지를 판별할 수 있도록 한다. 여기서 K개의 개수는 사용자의 선택에 따라 달라질 수 있다.
한편, 도 10은 본 발명의 일 실시예에 따른 동일인물 인식 방법에 따라 동일인물을 인식한 결과를 설명하기 위한 도면으로, 도 10 (a)에 표시된 이미지 시퀀스는 쿼리 이미지 시퀀스(Q20, Q30, Q40)로 동일인물 인식을 위한 기준인물의 이미지 시퀀스이고, 도 10 (b)에 표시된 이미지 시퀀스는 출력된 결과물이다.
도시된 바와 같이 복수의 카메라에서 촬영된 동영상에 기초하여 획득한 이미지 시퀀스 중에서 동일인물을 인식하기 위한 기준인물의 이미지 시퀀스인 쿼리 이미지 시퀀스(Q20, Q30, Q40)가 선택되거나 입력되면, 동일인물 인식 장치(100)는 동일인물 인식 방법을 수행하여 유사도를 산출하고 이로부터 유사도가 가장 높은 10개의 이미지 시퀀스를 출력하도록 설정되면 도시된 바와 같이 10개의 결과물이 출력될 수 있다. 그러면 사용자는 출력된 결과물을 확인하여 출력된 결과물 중 대표 이미지 시퀀스에 포함된 기준인물과 동일한 인물을 포함하는 동영상인지 아닌지를 육안으로 확인하여 판별할 수 있다.
도시된 도면에서 빨간색으로 표시된 인물 이미지 시퀀스는 찾고자하는 인물과는 다른 인물로 판별된 이미지이고, 초록색으로 표시된 인물 이미지 시퀀스는 동일인물로 인식된 이미지이다. 이처럼 종래의 인물 이미지를 통째로 비교하거나 파트별로 구분하는 대신 이처럼 본 발명의 동일인물 인식 방법에 따라 이미지를 포즈로 일치시킨 후 비교함으로써 도시된 바와 같이 인물의 뷰, 즉 촬영각도와 포즈가 다르더라도 동일한 인물인 것으로 판별할 수 있다. 이에 다중 방재카메라 시스템에서 인물 재탐지 성능과 신뢰성을 높일 수 있고 동영상에서 대표적인 이미지를 선별함으로서 검색 속도를 높일 수 있게 됨은 물론이다.
이와 같은 본 발명의 동일인물 인식 방법은 다양한 컴퓨터 구성요소를 통하여 수행될 수 있는 프로그램 명령어의 형태로 구현되어 컴퓨터 판독 가능한 기록 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능한 기록 매체는 프로그램 명령어, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다.
상기 컴퓨터 판독 가능한 기록 매체에 기록되는 프로그램 명령어는 본 발명을 위하여 특별히 설계되고 구성된 것은 물론, 컴퓨터 소프트웨어 분야의 당업자에게 공지되어 사용 가능한 것일 수도 있다.
컴퓨터 판독 가능한 기록 매체의 예에는, 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM, DVD 와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 ROM, RAM, 플래시 메모리 등과 같은 프로그램 명령어를 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다.
프로그램 명령어의 예에는, 컴파일러에 의해 만들어지는 것과 같은 기계어 코드 뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드도 포함된다. 상기 하드웨어 장치는 본 발명에 따른 처리를 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상에서는 본 발명의 다양한 실시예에 대하여 도시하고 설명하였지만, 본 발명은 상술한 특정의 실시예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 의해 다양한 변형실시가 가능한 것은 물론이고, 이러한 변형실시들은 본 발명의 기술적 사상이나 전망으로부터 개별적으로 이해되어져서는 안될 것이다.
100 : 동일인물 인식 장치 110 : 통신부
130 : 입력부 150 : 메모리
170 : 출력부 190 : 프로세서
191 : 사전처리부 192 : 대표 이미지 선택부
193 : 비교대상 선정부 194 : 이미지 보정부
195 : 추출부 196 : 산출부

Claims (10)

  1. 동일인물 인식 장치에 의해 수행되는 동일인물 인식 방법에 있어서,
    적어도 하나의 카메라로부터 동영상을 입력받는 단계;
    입력된 동영상에 기초하여 이미지 시퀀스가 획득되는 이미지 시퀀스 획득단계;
    상기 이미지 시퀀스에서 동일인물 인식을 위한 기준인물의 이미지 시퀀스를 쿼리 이미지 시퀀스로 하고, 상기 쿼리 이미지 시퀀스에 포함된 이미지의 포즈에 기초하여 상기 쿼리 이미지 시퀀스 중에서 기설정된 수만큼의 대표 이미지가 선택되는 대표 이미지 선택단계;
    상기 이미지 시퀀스에서 상기 동일인물 인식을 위한 비교 대상이 되는 인물의 이미지 시퀀스를 비교 이미지 시퀀스로 하고, 상기 비교 이미지 시퀀스에 포함된 비교 이미지와 상기 대표 이미지를 매칭하여 비교대상 쌍을 선정하는 비교대상 쌍 선정단계;
    변형 알고리즘을 통해 상기 비교대상 쌍에서 쌍을 이루는 상기 대표 이미지 또는 비교 이미지 중 적어도 하나의 이미지의 포즈를 변형 목표 포즈로 보정하는 포즈 보정단계;
    상기 포즈 보정단계를 거친 상기 비교 이미지 및 상기 대표 이미지의 특징을 추출하는 특징 추출단계; 및
    상기 추출된 특징 간의 유사도 및 거리를 산출하는 산출단계를 포함하고,
    상기 이미지 시퀀스 획득단계는,
    상기 입력된 동영상에서 인물영역을 검출하고 추적하여 인물에 대한 바운딩 박스를 포함하는 이미지 시퀀스를 획득하는 단계이고
    상기 이미지 시퀀스 획득단계는,
    상기 이미지 시퀀스에 포함된 각 이미지로부터 조인트를 추출하여 상기 이미지의 포즈를 추정하는 포즈 추정단계를 포함하며,
    상기 대표 이미지 선택단계는,
    상기 포즈 추정단계를 통해 추정된 포즈에 기초하여 군집 알고리즘을 통해 상기 쿼리 이미지 시퀀스에 포함된 각 이미지들의 포즈 벡터를 찾아 군집화를 수행한 후 각 군집의 무게중심을 찾고, 상기 쿼리 이미지 시퀀스에 포함된 이미지 중 상기 군집의 무게중심과 가장 가까운 포즈를 갖는 이미지를 상기 대표 이미지로 선택하고,
    상기 대표 이미지 선택단계에서 선택한 상기 대표 이미지는,
    상기 포즈 추정단계가 완료된 상기 쿼리 이미지 시퀀스로부터 시간의 흐름에 따라 변화하는 상기 기준인물의 포즈별로 선택한 이미지인 것을 특징으로 하는 동일인물 인식 방법.
  2. 삭제
  3. 삭제
  4. 제1항에 있어서,
    상기 비교대상 쌍 선정단계는,
    상기 비교 이미지 시퀀스 중에서 상기 대표 이미지의 포즈와 가장 유사한 포즈를 갖는 이미지를 비교 이미지로써 상기 대표 이미지와 매칭하여 상기 대표 이미지와 상기 비교 이미지가 쌍을 이루도록 하는 단계인 것을 특징으로 하는 동일인물 인식 방법.
  5. 제1항에 있어서,
    상기 포즈 보정단계에서는,
    상기 비교대상 쌍에서 쌍을 이루는 상기 대표 이미지의 포즈 또는 상기 비교 이미지의 포즈 중 한 이미지의 포즈를 상기 변형 목표 포즈로 하고, 다른 한 이미지의 포즈를 상기 변형 목표 포즈로 보정하는 것을 특징으로 하는 동일인물 인식 방법.
  6. 제1항에 있어서,
    상기 포즈 보정단계에서는,
    상기 비교대상 쌍에서 쌍을 이루는 상기 대표 이미지의 포즈 및 상기 비교 이미지의 포즈의 중간 포즈를 상기 변형 목표 포즈로 하고, 상기 대표 이미지의 포즈 및 상기 비교 이미지의 포즈를 상기 변형 목표 포즈로 보정하는 것을 특징으로 하는 동일인물 인식 방법.
  7. 제1항에 따른 상기 동일인물 인식 방법을 수행하기 위한, 컴퓨터 프로그램이 기록된 컴퓨터로 판독 가능한 기록 매체.
  8. 적어도 하나의 카메라로부터 동영상을 입력받는 입력부;
    입력된 동영상에 기초하여 이미지 시퀀스를 획득하는 사전처리부;
    상기 이미지 시퀀스에서 동일인물 인식을 위한 기준인물의 이미지 시퀀스를 쿼리 이미지 시퀀스로 하고, 상기 쿼리 이미지 시퀀스에 포함된 이미지의 포즈에 기초하여 상기 쿼리 이미지 시퀀스 중에서 기설정된 수만큼의 대표 이미지를 선택하는 대표 이미지 선택부;
    상기 이미지 시퀀스에서 상기 동일인물 인식을 위한 비교 대상이 되는 인물의 이미지 시퀀스를 비교 이미지 시퀀스로 하고, 상기 비교 이미지 시퀀스에 포함된 비교 이미지와 상기 대표 이미지를 매칭하여 비교대상 쌍을 선정하는 비교대상 선정부;
    변형 알고리즘을 통해 상기 비교대상 쌍에서 쌍을 이루는 상기 대표 이미지 또는 비교 이미지 중 적어도 하나의 이미지의 포즈를 변형 목표 포즈로 보정하는 이미지 보정부;
    상기 이미지 보정부를 통해 포즈 보정을 거친 상기 비교 이미지 및 대표 비교 이미지의 특징을 추출하는 추출부; 및
    상기 추출된 특징 간의 유사도 및 거리를 산출하는 산출부를 포함하고,
    상기 사전처리부는,
    상기 입력된 동영상에서 인물영역을 검출하고 추적하여 인물에 대한 바운딩 박스를 포함하는 이미지 시퀀스를 획득하고,
    상기 이미지 시퀀스에 포함된 각 이미지로부터 조인트를 추출하여 상기 이미지의 포즈를 추정하며,
    상기 대표 이미지 선택부는,
    상기 추정된 포즈에 기초하여 군집 알고리즘을 통해 상기 쿼리 이미지 시퀀스에 포함된 각 이미지들의 포즈 벡터를 찾아 군집화를 수행한 후 각 군집의 무게중심을 찾고, 상기 쿼리 이미지 시퀀스에 포함된 이미지 중 상기 군집의 무게중심과 가장 가까운 포즈를 갖는 이미지를 상기 대표 이미지로 선택하고,
    상기 대표 이미지 선택부가 선택한 상기 대표 이미지는,
    상기 포즈 추정이 완료된 상기 쿼리 이미지 시퀀스로부터 시간의 흐름에 따라 변화하는 상기 기준인물의 포즈별로 선택한 이미지인 동일인물 인식 장치.
  9. 제8항에 있어서,
    상기 이미지 보정부는,
    상기 비교대상 쌍에서 쌍을 이루는 상기 대표 이미지의 포즈 또는 상기 비교 이미지의 포즈 중 한 이미지의 포즈를 상기 변형 목표 포즈로 하고, 다른 한 이미지의 포즈를 상기 변형 목표 포즈로 보정하는 것을 특징으로 하는 동일인물 인식 장치.
  10. 제8항에 있어서,
    상기 이미지 보정부는,
    상기 비교대상 쌍에서 쌍을 이루는 상기 대표 이미지의 포즈 및 상기 비교 이미지의 포즈의 중간 포즈를 상기 변형 목표 포즈로 하고, 상기 대표 이미지의 포즈 및 상기 비교 이미지의 포즈를 상기 변형 목표 포즈로 보정하는 것을 특징으로 하는 동일인물 인식 장치.

KR1020210088010A 2021-07-05 2021-07-05 다수의 카메라에서 촬영된 영상에서 동일인물 인식 방법 및 이를 수행하기 위한 기록 매체 및 장치 KR102594694B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020210088010A KR102594694B1 (ko) 2021-07-05 2021-07-05 다수의 카메라에서 촬영된 영상에서 동일인물 인식 방법 및 이를 수행하기 위한 기록 매체 및 장치
PCT/KR2021/018160 WO2023282410A1 (ko) 2021-07-05 2021-12-02 다수의 카메라에서 촬영된 영상에서 동일인물 인식 방법 및 이를 수행하기 위한 기록 매체 및 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210088010A KR102594694B1 (ko) 2021-07-05 2021-07-05 다수의 카메라에서 촬영된 영상에서 동일인물 인식 방법 및 이를 수행하기 위한 기록 매체 및 장치

Publications (2)

Publication Number Publication Date
KR20230007141A KR20230007141A (ko) 2023-01-12
KR102594694B1 true KR102594694B1 (ko) 2023-10-26

Family

ID=84801821

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210088010A KR102594694B1 (ko) 2021-07-05 2021-07-05 다수의 카메라에서 촬영된 영상에서 동일인물 인식 방법 및 이를 수행하기 위한 기록 매체 및 장치

Country Status (2)

Country Link
KR (1) KR102594694B1 (ko)
WO (1) WO2023282410A1 (ko)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109190470A (zh) * 2018-07-27 2019-01-11 北京市商汤科技开发有限公司 行人重识别方法及装置
CN111723611A (zh) * 2019-03-20 2020-09-29 北京沃东天骏信息技术有限公司 行人再识别方法、装置及存储介质
CN112966652A (zh) * 2021-03-26 2021-06-15 北京市商汤科技开发有限公司 轨迹汇聚方法、装置、计算机设备及存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120108319A (ko) 2011-03-23 2012-10-05 주식회사 캐프 얼굴인식 시스템을 활용한 인물검색 시스템
KR101592262B1 (ko) * 2014-04-11 2016-02-18 주식회사 제론헬스케어 다중 구역에 대한 카메라 영상파일 통합 시스템
KR101902192B1 (ko) * 2016-03-07 2018-10-01 한국전자통신연구원 3차원 기반의 유사 안무 검색 방법 및 이를 이용한 장치
KR101784600B1 (ko) * 2016-04-11 2017-10-13 인하대학교 산학협력단 다중 카메라 환경에서의 배회 인식 방법 및 시스템
KR20190068000A (ko) * 2017-12-08 2019-06-18 이의령 다중 영상 환경에서의 동일인 재식별 시스템
KR102129771B1 (ko) * 2020-04-27 2020-07-03 (주)투비소프트 Cctv 카메라를 통해 촬영된 영상으로부터 영상 내 촬영 대상자의 행위 인식을 수행하는 cctv 관리 시스템 장치 및 그 동작 방법

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109190470A (zh) * 2018-07-27 2019-01-11 北京市商汤科技开发有限公司 行人重识别方法及装置
CN111723611A (zh) * 2019-03-20 2020-09-29 北京沃东天骏信息技术有限公司 行人再识别方法、装置及存储介质
CN112966652A (zh) * 2021-03-26 2021-06-15 北京市商汤科技开发有限公司 轨迹汇聚方法、装置、计算机设备及存储介质

Also Published As

Publication number Publication date
WO2023282410A1 (ko) 2023-01-12
KR20230007141A (ko) 2023-01-12

Similar Documents

Publication Publication Date Title
US20230274577A1 (en) Device and method with image matching
US9286694B2 (en) Apparatus and method for detecting multiple arms and hands by using three-dimensional image
US20180005018A1 (en) System and method for face recognition using three dimensions
KR101764845B1 (ko) 다중 이동 물체의 겹침 제거 및 추적을 위한 영상 감시 장치 및 방법
Bak et al. Improving person re-identification by viewpoint cues
Jüngling et al. View-invariant person re-identification with an implicit shape model
US20130121535A1 (en) Detection device and method for transition area in space
KR101917354B1 (ko) 모바일 환경 객체 신뢰도 평가와 학습을 통한 융합 객체 추적 시스템 및 방법
US9256802B2 (en) Object or shape information representation method
CN103218799A (zh) 用于相机跟踪的方法和设备
KR101558547B1 (ko) 얼굴 포즈 변화에 강한 연령 인식방법 및 시스템
KR101460313B1 (ko) 시각 특징과 기하 정보를 이용한 로봇의 위치 추정 장치 및 방법
WO2021084972A1 (ja) 物体追跡装置および物体追跡方法
US9836846B2 (en) System and method of estimating 3D facial geometry
US11544926B2 (en) Image processing apparatus, method of processing image, and storage medium
KR100526018B1 (ko) 물체 인식 및 추적방법
CN112257617B (zh) 多模态目标识别方法和***
KR102594694B1 (ko) 다수의 카메라에서 촬영된 영상에서 동일인물 인식 방법 및 이를 수행하기 위한 기록 매체 및 장치
Kavimandan et al. Human action recognition using prominent camera
JP7374632B2 (ja) 情報処理装置、情報処理方法及びプログラム
CN114581875A (zh) 一种封闭场景下slam自主导航识别方法
KR20230060029A (ko) 평면 검출 장치 및 방법
Verlekar et al. Walking direction identification using perceptual hashing
WO2017042852A1 (en) Object recognition appratus, object recognition method and storage medium
JP6055307B2 (ja) 対応点探索装置およびカメラ姿勢推定装置ならびにこれらのプログラム

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant