KR102540290B1 - 이종 센서 카메라 기반 사람 재식별 장치 및 방법 - Google Patents

이종 센서 카메라 기반 사람 재식별 장치 및 방법 Download PDF

Info

Publication number
KR102540290B1
KR102540290B1 KR1020210006683A KR20210006683A KR102540290B1 KR 102540290 B1 KR102540290 B1 KR 102540290B1 KR 1020210006683 A KR1020210006683 A KR 1020210006683A KR 20210006683 A KR20210006683 A KR 20210006683A KR 102540290 B1 KR102540290 B1 KR 102540290B1
Authority
KR
South Korea
Prior art keywords
warping
feature map
feature
map
loss
Prior art date
Application number
KR1020210006683A
Other languages
English (en)
Other versions
KR20220104426A (ko
Inventor
함범섭
박현종
이상훈
Original Assignee
연세대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 연세대학교 산학협력단 filed Critical 연세대학교 산학협력단
Priority to KR1020210006683A priority Critical patent/KR102540290B1/ko
Publication of KR20220104426A publication Critical patent/KR20220104426A/ko
Application granted granted Critical
Publication of KR102540290B1 publication Critical patent/KR102540290B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/70Multimodal biometrics, e.g. combining information from different biometric modalities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06T3/0093
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/18Image warping, e.g. rearranging pixels individually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Medical Informatics (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
  • Studio Devices (AREA)
  • Cameras Adapted For Combination With Other Photographic Or Optical Apparatuses (AREA)
  • Image Analysis (AREA)

Abstract

본 발명은 이종 센서 카메라에서 획득된 이미지들에서 추출된 특징맵과 함께 특징맵에서 서로 대응하는 픽셀을 와핑한 와핑 특징맵을 기반으로 학습을 수행하며, 특히 특징맵과 와핑 특징맵에 대한 밀집 삼중 손실을 계산하여 학습에 반영함으로써, 정렬되지 않은 이미지들에서도 세분화된 로컬 정보를 추출할 수 있어 다양한 카메라에서 매우 상이한 조건에서 획득된 이미지로부터도 사람을 정확하게 재식별할 수 있는 사람 재식별 장치 및 방법을 제공할 수 있다.

Description

이종 센서 카메라 기반 사람 재식별 장치 및 방법{Apparatus and Method for Person Re-Identification based on Heterogeneous Sensor Camera}
본 발명은 사람 재식별 장치 및 방법에 관한 것으로, 이종 센서 카메라 기반 사람 재식별 장치 및 방법에 관한 것이다.
서로 다른 환경에서 촬영된 동일한 사람을 탐색할 수 있는 사람 재식별(Person Re-identification: reID 라고 함) 기술에 대한 연구가 활발하게 이루어지고 있다.
도 1은 사람 재식별의 개념을 나타내고, 도 2는 사람 재식별을 이용하는 분야 중 하나로 사람 추적 기술의 일 예를 나타낸다.
도 1에 도시된 바와 같이, 사람 재식별은 서로 다른 조건에서 촬영된 동일한 사람을 식별하여 검출하는 기법으로서, 자세의 변화, 배경의 변화, 조명의 변화, 촬영 거리 및 각도 변화와 같이 여러 환경 조건이 변화하여도 동일한 사람이 포함된 이미지를 정확하게 검출하는 것을 목적으로 한다.
이러한 사람 재식별 기술은 도 2에 도시된 바와 같이, 실종자 탐색 또는 범죄자 추적 등 다수의 이미지에서 특정인을 탐색 및 추적하는 다양한 분야에 이용될 수 있다.
이러한 사람 재식별 기술은 이미지로부터 주로 인공 신경망을 이용하여 개인을 식별하기 위해 사람의 특정 부분이 아닌 정체성을 나타내는 특징을 추출하고, 추출된 특징을 기반으로 동일한 사람을 식별할 수 있도록 한다. 즉 사람의 얼굴 형태나 특정한 자세, 배경, 촬영 각도, 조명 등에 한정되지 않고 개개인 각각의 정체성을 나타내는 특징을 추출하여 사람을 재식별함으로써, 서로 다른 다수의 이미지에서 동일한 사람을 검출할 수 있도록 한다. 다만 기존의 사람 재식별은 주로 동일한 종류의 센서 카메라에서 획득된 이미지에서 동일한 사람을 재식별하기 위해 집중되어 있었다.
도 3은 이종 센서 카메라에서 획득된 이미지의 일 예를 나타내고, 도 4는 이종 센서 카메라 기반 사람 재식별 개념을 나타낸다.
도 3과 상단 3개의 이미지 중 왼쪽 2개의 이미지 각각 일반적인 가시 카메라(RGB camera 또는 Visible camera)에서 주간 및 야간에 획득된 이미지이고, 오른쪽 이미지는 적외선(Infrared: 이하 IR) 카메라에서 야간에 획득된 이미지를 나타낸다.
가운데 좌측 이미지는 주간에 가시 카메라에서 획득된 이미지로부터 추출된 사람 영역을 나타내고, 우측 다수의 이미지는 재식별을 위해 비교 대상이 되는 이미지를 나타낸다. 그리고 하단 우측 이미지는 야간에 IR 카메라에서 획득된 이미지로부터 추출된 사람 영역을 나타내고, 좌측 다수의 이미지는 재식별을 위해 비교 대상이 되는 이미지를 나타낸다.
도 3에 도시된 바와 같이, 가시 카메라는 주간에 이미지를 획득하는 경우, 사람 식별이 가능한 수준의 이미지를 획득할 수 있으나, 야간에는 주변 환경과 구분되지 않아 사람 식별이 불가능하다. 그에 반해, 가시 카메라와 다른 IR 센서를 이용하는 IR 카메라를 이용하는 경우, 야간에 사람을 정확하게 식별할 수 있다.
따라서 도 4에 도시된 바와 같이, 환경 변화에 무관하게 사람을 식별하고 추적할 수 있도록 하기 위해서는 서로 다른 이종 센서 카메라에서 획득된 이미지에서 사람을 재식별할 수 있어야 한다.
도 5은 사람 재식별에서의 오정렬 문제를 설명하기 위한 도면이다.
도 5에서 상단과 하단에서 동일한 행에 위치한 이미지는 동일한 객체, 즉 동일한 사람에 대한 이미지이다. 도 5에 도시된 바와 같이, 동일한 가시 카메라로 획득된 이미지에서도 사람은 여러 조건에 따라 매우 상이한 형태로 나타날 수 있으며, 이로 인해 각 이미지에서 동일한 사람이 식별하기 어렵게 될 수 있다. 다만 동일한 가시 카메라에서 획득된 이미지의 경우, 컬러 분포 등에 따른 특징을 기반으로도 사람을 재식별할 수도 있다.
그러나 가시 카메라와 달리 IR 카메라의 경우, 색상 정보가 포함되지 않으므로 가시 카메라에서 획득된 컬러 이미지의 특징과 IR 카메라에서 획득된 IR 이미지의 특징 사이의 비교가 용이하지 않다. 즉 재식별을 위해 서로 비교할 수 특징이 제한된다. 이와 같은 모달리티 차이를 극복하기 위해 기존에는 RGB 이미지와 IR 이미지를 모두 가상의 특징 공간(common feature space)에 임베딩(embedding)하고, 특징 공간에 임베딩된 특징을 이미지 또는 파트 수준으로 추출하여 비교하는 방식으로 학습을 수행한다. 그러나 이와 같은 공통 특징 공간에 임베딩하는 방식에서는 특징점들에 대한 밀집 정합 오류로 인한 객체 오정렬(misalignment)에 의한 문제가 발생할 수 있다.
기존에는 서로 다른 이종 센서 카메라에서 획득된 이미지에서 사람을 재식별하는 경우, 각 이미지에 포함된 사람이 서로 정렬되어 있다고 가정하여 이미지 또는 파트 수준에서의 특징을 학습하는데 집중하였다. 즉 두 이미지가 개략적일지라도 서로 일정 수준 이상 정렬된 것으로 가정하여 학습을 수행하였다. 일 예로 이미지를 기지정된 횡방향 그리드로 구분하고 두 이미지에서 각 그리드에 포함되는 신체 부위(예를 들면, 어깨, 무릎 등)가 서로 대응하도록 정렬된 것으로 가정하여 학습된다.
그러나 도 5와 같이 비록 동일 객체에 대한 이미지일지라도 실제로 이미지 내에서 객체의 위치, 크기, 포즈 등은 매우 상이한 경우가 많으며, 이와 같이 두 이미지가 정렬되지 않은 상태에서 학습이 수행되면 오정렬로 인해 학습이 정상적으로 수행되지 않아 사람 재식별 오차가 크게 발생하는 문제가 발생할 수 있다. 상기한 바와 같이, 이러한 오정렬 문제는 특히 특성이 다른 두 모달리티 간 영상의 객체 재식별에서 문제가 더 크게 나타날 수 있다.
또한 공통 특징 공간에 임베딩하는 방식에서는 객체 재식별에 크게 도움이 될 수 있는 세분화된 로컬 정보가 간과되는 경향이 있어 재식별 성능에 한계가 있다.
한국 공개 특허 제10-2019-0078270호 (2019.07.04 공개)
본 발명의 목적은 이종 센서 카메라에서 획득된 이미지로부터 사람을 정확하게 재식별할 수 있는 사람 재식별 장치 및 방법을 제공하는데 있다.
본 발명의 다른 목적은 정렬되지 않은 이미지에서도 교차 모달리티 객체 이미지간 밀집 정합을 이용하여 정확하게 사람을 재식별할 수 있는 사람 재식별 장치 및 방법을 제공하는데 있다.
상기 목적을 달성하기 위한 본 발명의 일 실시예에 따른 사람 재식별 장치는 서로 다른 이종의 센서를 이용하여 획득된 제1 및 제2 이미지를 인가받아 학습되는 방식에 따라 특징을 추출하여 제1 및 제2 특징맵을 획득하고, 기지정된 방식으로 풀링하여 제1 및 제2 표현자를 획득하는 특징 풀링부; 학습 시에 구비되어, 상기 제1 및 제2 특징맵을 인가받아 서로 대응하는 픽셀을 추정하고, 추정된 대응 픽셀의 위치를 기반으로 상호 와핑을 수행하여, 상기 제2 특징맵이 상기 제1 특징맵에 대응하도록 와핑된 제1 와핑 특징맵과 상기 제1 특징맵이 상기 제2 특징맵에 대응하도록 와핑된 제2 와핑 특징맵 획득하며, 상기 제1 및 제2 와핑 특징맵을 풀링하여 제1 및 제2 와핑 표현자를 획득하는 교차 모달 정렬부; 학습되는 방식에 따라 상기 제1 및 제2 표현자와 상기 제1 및 제2 와핑 표현자 각각이 기지정된 다수의 클래스 각각에 대응하는 확률을 나타내는 제1 및 제2 스코어맵과 제1 및 제2 와핑 스코어맵을 획득하고, 획득된 제1 및 제2 스코어맵에서 가장 높은 확률의 클래스의 식별자를 획득하는 재식별부; 및 학습 시에 구비되어, 상기 제1 특징맵과 상기 제1 와핑 특징맵 사이의 차이와 상기 제2 특징맵과 상기 제2 와핑 특징맵 사이의 차이를 동일한 식별자인 경우의 포지티브와 서로 다른 식별자인 경우의 네거티브로 구분하여 밀집 삼중 손실을 계산하는 손실 계산부를 포함한다.
상기 교차 모달 정렬부는 기지정된 방식에 따라 상기 제1 및 제2 특징맵 사이의 픽셀간 유사도를 계산하여 유사도맵을 획득하는 유사도 측정부; 상기 유사도 맵을 기반으로 상기 제1 및 제2 특징맵의 각 픽셀별 매칭 확률을 계산하여 매칭 확률맵을 획득하는 매칭 확률 추정부; 상기 매칭 확률맵을 이용하여 상기 제1 및 제2 특징맵 각각의 픽셀들이 상대 특징맵의 각 픽셀에 매칭될 확률을 가중 집계하여 상대 특징맵으로 와핑함으로써 상기 제1 및 제2 와핑 특징맵을 획득하는 소프트 와핑부; 및 상기 제1 및 제2 와핑 특징맵을 기지정된 방식으로 풀링하여 제1 및 제2 와핑 표현자를 획득하는 와핑 풀링부를 포함할 수 있다.
상기 교차 모달 정렬부는 상기 제1 및 제2 특징맵의 각 위치별 픽셀의 크기를 정규화하여 제1 및 제2 마스크를 획득하는 마스크 제공부를 더 포함할 수 있다.
상기 소프트 와핑부는 상기 제1 및 제2 마스크를 인가받아 상기 제1 및 제2 특징맵 각각의 픽셀들이 상대 특징맵의 각 픽셀에 매칭될 확률을 가중 집계하고, 가중 집계된 와핑 픽셀값에 마스크의 픽셀값을 추가로 가중하여 와핑할 수 있다.
상기 손실 계산부는 상기 제1 및 제2 이미지 모두에서 모두 확인 가능한 사람 영역을 강조하는 제1 및 제2 공통 주의맵을 획득하고, 상기 제1 공통 주의맵에서 앵커인 상기 제1 특징맵의 식별자와 동일한 식별자로 추정되는 제1 와핑 특징맵인 포지티브 및 서로 다른 식별자로 추정되는 제1 와핑 특징맵인 네거티브 각각의 사이의 차이와 상기 제2 공통 주의맵에서 앵커인 상기 제2 특징맵의 식별자와 동일한 식별자로 추정되는 포지티브 및 서로 다른 식별자로 추정되는 제2 와핑 특징맵인 네거티브 각각의 사이의 차이를 누적하여 상기 밀집 삼중 손실을 계산할 수 있다.
상기 손실 계산부는 상기 제1 및 제2 스코어맵 각각과 학습 시에 상기 제1 및 제2 이미지에 레이블되어 인가되는 식별자 사이의 차이에 따른 식별 손실과 상기 제1 및 제2 스코어맵과 상기 제1 및 제2 와핑 스코어맵 사이의 차이에 따른 일관성 손실을 더 계산하고, 상기 식별 손실과 상기 일관성 손실 및 상기 밀집 삼중 손실을 가중합하여 계산되는 총 손실을 역전파하여 학습을 수행할 수 있다.
상기 손실 계산부는 상기 제1 및 제2 스코어맵과 상기 제1 및 제2 이미지에 레이블되어 인가되는 식별자 사이의 음의 크로스 엔트로피를 계산하여 상기 식별 손실을 획득하고, 상기 제1 및 제2 스코어맵 각각과 상기 제1 및 제2 와핑 스코어맵 중 대응하는 와핑 스코어맵 사이의 음의 크로스 엔트로피를 계산하여 상기 일관성 손실을 계산할 수 있다.
상기 목적을 달성하기 위한 본 발명의 다른 실시예에 따른 사람 재식별 방법은 학습 단계; 및 인공 신경망을 이용하여, 서로 다른 이종의 센서를 이용하여 획득된 이미지들을 인가받아 각 이미지에 포함된 사람에 대한 식별자를 획득하는 사람 재식별 단계를 포함하고, 상기 학습 단계는 학습 데이터로서 서로 다른 이종의 센서를 이용하여 획득되고 식별자가 미리 레이블된 제1 및 제2 이미지를 인가받아 학습되는 방식에 따라 특징을 추출하여 제1 및 제2 특징맵을 획득하고, 기지정된 방식으로 풀링하여 제1 및 제2 표현자를 획득하는 단계; 상기 제1 및 제2 특징맵을 인가받아 서로 대응하는 픽셀을 추정하고, 추정된 대응 픽셀의 위치를 기반으로 상호 와핑을 수행하여, 상기 제2 특징맵이 상기 제1 특징맵에 대응하도록 와핑된 제1 와핑 특징맵과 상기 제1 특징맵이 상기 제2 특징맵에 대응하도록 와핑된 제2 와핑 특징맵 획득하며, 상기 제1 및 제2 와핑 특징맵을 풀링하여 제1 및 제2 와핑 표현자를 획득하는 단계; 상기 제1 및 제2 표현자와 상기 제1 및 제2 와핑 표현자 각각이 기지정된 다수의 클래스 각각에 대응하는 확률을 나타내는 제1 및 제2 스코어맵과 제1 및 제2 와핑 스코어맵을 획득하고, 획득된 제1 및 제2 스코어맵에서 가장 높은 확률의 클래스의 식별자를 획득하는 단계; 및 상기 제1 특징맵과 상기 제1 와핑 특징맵 사이의 차이와 상기 제2 특징맵과 상기 제2 와핑 특징맵 사이의 차이를 동일한 식별자인 경우의 포지티브와 서로 다른 식별자인 경우의 네거티브로 구분하여 손실을 계산하는 단계를 포함한다.
따라서, 본 발명의 실시예에 따른 사람 재식별 장치 및 방법은 이종 센서 카메라에서 획득된 이미지들에서 추출된 특징맵과 함께 특징맵에서 서로 대응하는 픽셀을 와핑한 와핑 특징맵을 기반으로 학습을 수행하며, 특히 특징맵과 와핑 특징맵에 대한 밀집 삼중 손실을 계산하여 학습에 반영함으로써, 정렬되지 않은 이미지들에서도 세분화된 로컬 정보를 추출할 수 있어 다양한 카메라에서 매우 상이한 조건에서 획득된 이미지로부터도 사람을 정확하게 재식별할 수 있다.
도 1은 사람 재식별의 개념을 나타낸다.
도 2는 사람 재식별을 이용하는 분야 중 하나로 사람 추적 기술의 일 예를 나타낸다.
도 3은 이종 센서 카메라에서 획득된 이미지의 일 예를 나타낸다.
도 4는 이종 센서 카메라 기반 사람 재식별 개념을 나타낸다.
도 5는 사람 재식별에서의 오정렬 문제를 설명하기 위한 도면이다.
도 6은 본 발명의 일 실시예에 따른 이종 센서 카메라 기반 사람 재식별 장치의 개략적 구조를 나타낸다.
도 7은 도 6의 사람 재식별 장치의 동작을 설명하기 위한 도면이다.
도 8은 공통 주의맵을 설명하기 위한 도면이다.
도 9는 사람 재식별 장치의 손실 설정에 따른 성능 변화를 나타낸다.
도 10은 본 실시예에 따른 사람 재식별 장치의 성능을 시뮬레이션한 결과를 나타낸다.
도 11은 본 발명의 일 실시예에 따른 이종 센서 카메라 기반 사람 재식별 방법을 나타낸다.
본 발명과 본 발명의 동작상의 이점 및 본 발명의 실시에 의하여 달성되는 목적을 충분히 이해하기 위해서는 본 발명의 바람직한 실시예를 예시하는 첨부 도면 및 첨부 도면에 기재된 내용을 참조하여야만 한다.
이하, 첨부한 도면을 참조하여 본 발명의 바람직한 실시예를 설명함으로써, 본 발명을 상세히 설명한다. 그러나, 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며, 설명하는 실시예에 한정되는 것이 아니다. 그리고, 본 발명을 명확하게 설명하기 위하여 설명과 관계없는 부분은 생략되며, 도면의 동일한 참조부호는 동일한 부재임을 나타낸다.
명세서 전체에서, 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라, 다른 구성요소를 더 포함할 수 있는 것을 의미한다. 또한, 명세서에 기재된 "...부", "...기", "모듈", "블록" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어나 소프트웨어 또는 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다.
도 6은 본 발명의 일 실시예에 따른 이종 센서 카메라 기반 사람 재식별 장치의 개략적 구조를 나타내고, 도 7은 도 6의 사람 재식별 장치의 동작을 설명하기 위한 도면이며, 도 8은 공통 주의맵을 설명하기 위한 도면이다.
도 6 및 도 7을 참조하면, 본 실시예의 이종 센서 카메라 기반 사람 재식별 장치는 이종 이미지 획득부(100), 특징 추출부(200), 풀링부(300), 재식별부(400), 교차 모달 정렬부(500) 및 손실 계산부(600)를 포함할 수 있다.
이종 이미지 획득부(100)는 서로 다른 센서 카메라에서 획득된 이종 이미지를 획득한다. 이종 이미지 획득부(100)는 제1 이미지와 제2 이미지를 획득할 수 있으며, 여기서는 일 예로 제1 이미지는 가시 카메라를 이용하여 획득된 RGB 이미지이고, 제2 이미지는 IR 카메라를 이용하여 획득된 IR 이미지인 것으로 가정하여 설명한다. 이종 이미지 획득부(100)는 제1 이미지를 획득하는 제1 이미지 획득부(110)와 제2 이미지를 획득하는 제2 이미지 획득부(120)를 포함할 수 있다. 다만 본 실시예의 이종 센서 카메라 기반 사람 재식별 장치는 가시 카메라나 IR 카메라 이외에 다른 종류의 센서 카메라를 이용하여 이미지를 획득할 수도 있다. 이때, 제1 이미지와 제2 이미지는 각각 단일 프레임의 이미지일 수도 있으나, 다수 프레임으로 구성된 이미지일 수 있으며, 동일한 사람이 포함되거나 다른 사람이 포함된 이미지일 수 있다.
제1 이미지 획득부(110)와 제2 이미지 획득부(120)는 각각 서로 다른 센서를 포함하는 이종 센서 카메라로 구현되거나, 이종 센서 카메라를 이용하여 획득된 이미지를 저장하는 저장 장치 또는 외부에서 이종 센서 카메라를 이용하여 획득된 이미지를 인가받는 통신 모듈 등으로 구현될 수도 있다.
특징 추출부(200)는 이종 이미지 획득부(100)에서 획득된 이종 이미지 각각으로부터 특징을 추출하여 특징맵을 획득한다. 특징 추출부(200)는 각각 CNN(Convolutional neural network)과 같은 인공 신경망으로 구현되는 제1 특징 추출부(210)와 제2 특징 추출부(220)를 포함할 수 있다. 제1 특징 추출부(210)는 제1 이미지 획득부(110)에서 획득된 제1 이미지를 인가받아 미리 학습된 방식에 따라 특징을 추출하여 제1 특징맵(fRGB)을 획득하고, 제2 특징 추출부(220)는 제2 이미지 획득부(120)에서 획득된 제2 이미지를 인가받아 미리 학습된 방식에 따라 특징을 추출하여 제2 특징맵(fIR)을 획득한다.
이때 제1 특징맵(fRGB
Figure 112021006247859-pat00001
)과 제2 특징맵(fIR
Figure 112021006247859-pat00002
)은 동일한 높이(h)와 폭(w) 및 채널(d)을 갖는 h × w × d 크기로 추출될 수 있다.
풀링부(300)는 특징 추출부(200)에서 획득된 제1 및 제2 특징맵(fRGB, fIR)을 인가받아 각각 미리 지정된 방식으로 풀링하여, 제1 및 제2 표현자를 획득한다. 풀링부(300)는 제1 풀링부(310)와 제2 풀링부(320)를 포함할 수 있다. 제1 풀링부(310)는 제1 특징맵(fRGB)을 인가받아 풀링하여 제1 표현자(ø(fRGB))를 획득하고, 제2 풀링부(320)는 제2 특징맵(fIR)을 인가받아 풀링하여 제2 표현자(ø(fIR))를 획득할 수 있다. 여기서 제1 및 제2 표현자(ø(fRGB), ø(fIR))각각은 채널(d) 길이에 대응하는 1차원 벡터 형태를 갖고, 이미지에 포함된 사람을 식별할 수 있도록 하는 특징 표현자로 볼 수 있다.
여기서 특징 추출부(200)와 풀링부(300)는 특징 풀링부로 통합될 수 있다.
재식별부(400)는 이미지에 포함된 사람의 특징 표현자인 제1 및 제2 표현자(ø(fRGB), ø(fIR))를 인가받아, 제1 및 제2 이미지에 포함된 사람을 재식별한다. 재식별부(400)는 일 예로 제1 및 제2 표현자(ø(fRGB), ø(fIR)) 사이의 유사도를 측정하여 제1 및 제2 이미지에 포함된 사람이 동일한 사람이지 여부를 판별할 수 있다. 그러나 재식별부(400)는 미리 지정된 다수의 사람에 대응하도록 설정된 다수의 클래스 중 제1 및 제2 표현자(ø(fRGB), ø(fIR))에 대응하는 클래스를 확인하여 식별자를 획득하도록 구성될 수도 있다. 즉 재식별부(400)는 이종 이미지 각각에 포함된 사람의 식별자를 획득하여 동일한 사람인지 여부를 확인할 수 있다.
여기서 재식별부(400)는 일 예로 소프트 맥스와 같은 활성화 함수와 완전 연결 레이어(Fully Connected Layer)를 포함하는 구성되는 인공 신경망으로 구현되어, 제1 및 제2 표현자(ø(fRGB), ø(fIR)) 각각이 기지정된 다수의 클래스 각각에 대응하는 확률을 나타내는 스코어맵을 획득하고, 획득된 스코어맵에서 가장 높은 확률의 클래스를 확인하여 식별자를 선택할 수 있다.
도 6에서는 설명의 편의를 위하여 특징 추출부(200)와 풀링부(300) 및 재식별부(400)를 별도의 구성으로 도시하였으나, 특징 추출부(200)와 풀링부(300) 및 재식별부(400)는 사람을 재식별하기 위한 재식별 인공 신경망에서 서로 다른 기능을 수행하는 레이어들로 구성될 수 있다.
사람 재식별 장치는 실제 적용 시에 이종 이미지 획득부(100), 특징 추출부(200), 풀링부(300) 및 재식별부(400)만으로 구성될 수 있다. 다만, 사람 재식별 장치는 실제 적용되기 이전에 인공 신경망으로 구성되는 특징 추출부(200), 풀링부(300) 및 재식별부(400) 등이 학습되어야만 한다. 이에 본 실시예의 사람 재식별 장치는 학습을 수행하는 동안 교차 모달 정렬부(500) 및 손실 계산부(600)를 더 포함할 수 있으며, 학습이 완료되면 제외할 수 있다.
교차 모달 정렬부(500)는 서로 다른 이종 이미지에서 추출된 제1 및 제2 특징맵(fRGB, fIR)을 인가받고, 인가된 제1 특징맵(fRGB)과 제2 특징맵(fIR)의 픽셀간 유사도에 기반하여 서로 대응하는 픽셀을 추정하고, 추정된 대응 픽셀의 위치를 기반으로 상호 와핑을 수행하여, 제1 및 제2 와핑 특징맵(
Figure 112021006247859-pat00003
,
Figure 112021006247859-pat00004
)을 획득한다. 여기서 제1 와핑 특징맵(
Figure 112021006247859-pat00005
)은 제2 이미지에서 추출된 제2 특징맵(fIR)을 와핑하여 획득되는 특징맵이고, 제2 와핑 특징맵(
Figure 112021006247859-pat00006
)은 제1 이미지에서 추출된 제1 특징맵(fRGB)을 와핑하여 획득되는 특징맵이다. 즉 제1 및 제2 와핑 특징맵(
Figure 112021006247859-pat00007
,
Figure 112021006247859-pat00008
)은 서로 상대의 이종 이미지로부터 추출된 특징맵을 와핑하여 모달리티를 교차하여 획득된다.
구체적으로 살펴보면, 교차 모달 정렬부(500)는 유사도 측정부(510), 매칭 확률 추정부(520), 마스크 제공부(530), 소프트 와핑부(540) 및 와핑 풀링부(550)를 포함할 수 있다.
유사도 측정부(510)는 제1 및 제2 특징맵(fRGB, fIR)을 인가받고, 인가된 제1 및 제2 특징맵(fRGB, fIR) 사이의 픽셀간 유사도를 계산하여 유사도맵(C(p,q))을 획득한다. 유사도 측정부(510)는 제1 특징맵(fRGB)의 h × w 평면 상에서 각 위치(p)별 채널 방향 길이(d)를 갖는 1차원 벡터인 픽셀 벡터와 제2 특징맵(fIR)의 h × w 평면 상에서 각 위치(q)별 채널 방향 길이(d)를 갖는 1차원 벡터인 픽셀 벡터 사이의 유사도를 수학식 1과 같이 코사인 유사도를 기반으로 계산하여 유사도맵(C(p,q))을 획득할 수 있다.
Figure 112021006247859-pat00009
여기서 fRGB(p)는 제1 특징맵(fRGB)의 위치(p)별 픽셀 벡터를 나타내고, fIR(q)는 제2 특징맵(fIR)의 위치(q)별 픽셀 벡터를 나타내며, ∥·∥2는 L2 놈 함수를 나타내며, T는 전치 행렬를 나타낸다.
매칭 확률 추정부(520)는 유사도 측정부(510)에서 획득된 유사도맵(C(p,q))을 인가받아 각 픽셀별 일치 확률을 계산한다. 매칭 확률 추정부(520)는 제1 특징맵(fRGB)과 제2 특징맵(fIR)의 각 픽셀 벡터 사이의 유사성을 기반으로 제1 특징맵(fRGB)과 제2 특징맵(fIR)의 픽셀 위치별 매칭 확률을 나타내는 h × w × h × w의 크기의 매칭 확률맵(P(p,q))을 수학식 2에 따라 계산하여 획득한다.
Figure 112021006247859-pat00010
여기서 β는 온도 파라미터이다.
마스크 제공부(530)는 제1 및 제2 특징맵(fRGB, fIR)을 인가받아, 제1 특징맵(fRGB)에 대응하는 제1 마스크(MRGB)와 제2 특징맵(fIR)에 대응하는 제2 마스크(MIR)를 획득하여 소프트 와핑부(540)로 출력한다.
마스크 제공부(530)는 학습이 수행됨에 따라 제1 및 제2 이미지에서 사람에 해당하는 영역, 즉 전경이 나머지 영역에 비해 특징이 두드러진다는 가정 하에, 실제 사람 영역에 대한 레이블이 없는 제1 이미지에서 획득된 제1 특징맵(fRGB)으로부터 사람 영역이 강조된 제1 마스크(MRGB)를 수학식 3에 따라 획득할 수 있다.
Figure 112021006247859-pat00011
여기서 f는 수학식 4로 정의되는 최대-최소 정규화 함수이다.
Figure 112021006247859-pat00012
이와 유사하게 마스크 제공부(530)는 제2 이미지에서 획득된 제2 특징맵(fIR)으로부터 사람 영역에 대응하는 제2 마스크(MIR) 또한 획득할 수 있다.
즉 마스크 제공부(530)는 제1 및 제2 특징맵(fRGB, fIR)의 각 위치별 픽셀 벡터의 크기를 정규화하여 마스크를 획득한다. 만일 마스크 제공부(530)가 이진 마스크를 이용하는 경우, 전경과 배경이 명확하게 구분될 수 있는 경우에는 유효하지만 명확하게 구분되지 않는 경우에는 오히려 큰 오차를 유발할 수 있게 된다. 이러한 오차가 발생되는 것을 방지하기 위해, 본 실시예의 마스크 제공부(530)는 제1 및 제2 특징맵(fRGB, fIR)의 각 위치별 픽셀 벡터의 크기를 정규화하여 전경 영역이 배경 영역에 비해 강조되는 제1 및 제2 마스크(MRGB, MIR)를 획득한다.
한편 소프트 와핑부(540)는 수학식 2에 따라 획득된 픽셀간 매칭 확률맵(P(p,q))을 기반으로 제1 및 제2 특징맵(fRGB, fIR)의 각 픽셀을 서로 대응하는 픽셀의 위치로 소프트 와핑함으로써 제1 및 제2 와핑 특징맵(
Figure 112021006247859-pat00013
,
Figure 112021006247859-pat00014
)을 획득한다.
이때 소프트 와핑부(540)는 마스크 제공부(530)로부터 제공되는 제1 및 제2 마스크(MRGB, MIR)를 이용하여, 제1 및 제2 특징맵(fRGB, fIR)에서 사람에 해당하는 전경 영역에 집중적으로 와핑을 수행할 수 있다.
소프트 와핑부(540)는 제2 특징맵(fIR)의 각 픽셀이 제1 특징맵(fRGB)의 사람에 해당하는 전경 영역이 강조되어 와핑되도록 수학식 5에 따라 제1 마스크(MRGB)를 이용하여 소프트 와핑을 수행함으로써 제1 와핑 특징맵(
Figure 112021006247859-pat00015
)을 획득할 수 있다.
Figure 112021006247859-pat00016
여기서 W는 수학식 6으로 정의되는 소프트 와핑 함수이다.
Figure 112021006247859-pat00017
수학식 5 및 6에 따르면, 소프트 와핑부(540)는 소프트 와핑 함수(W)를 이용하여 제2 특징맵(fIR)의 각 위치(q)별 픽셀 벡터를 매칭 확률에 따라 가중 집계하여 제1 특징맵(fRGB)의 대응하는 픽셀 위치(p)로 와핑하되, 제1 마스크(MRGB)에 의해 지정되는 사람 영역에 제2 특징맵(fIR)의 매칭 확률 가중 집계된 픽셀 벡터가 강조되어 와핑되도록 하고, 나머지 영역은 제1 특징맵(fRGB)의 픽셀 벡터가 가급적 유지되도록 한다. 즉 제1 특징맵(fRGB)에서 사람에 해당하는 전경 영역은 제2 특징맵(fIR)에서 매칭 확률에 따라 가중 집계되어 와핑된 픽셀 벡터가 강조되는 반면, 나머지 배경 영역은 제1 특징맵(fRGB)의 픽셀 벡터가 강조되도록 하여 제1 와핑 특징맵(
Figure 112021006247859-pat00018
)을 획득한다.
또한 소프트 와핑부(540)는 수학식 5 및 6과 유사하게 소프트 와핑 함수와 제2 마스크(MIR)를 이용하여, 제2 특징맵(fIR)에서 사람에 해당하는 전경 영역은 제1 특징맵(fRGB)에서 와핑된 픽셀 벡터가 강조되고, 나머지 배경 영역은 제2 특징맵(fIR)의 픽셀 벡터가 강조되도록 하여 제2 와핑 특징맵(
Figure 112021006247859-pat00019
)을 획득한다.
본 실시예에서 교차 모달 정렬부(500)가 소프트 와핑 함수(W)를 이용하는 것은 서로 다른 이미지에서 픽셀간 매칭을 위해 일반적으로 사용되는 argmax 함수를 이용하는 경우, 매우 하드하게 픽셀간 매칭이 수행되기 때문에 명시적인 대응 픽셀을 설정할 수 있는 반면, 서로 다른 이미지의 질감이나 폐색 등으로 인해 대응점이 조밀하지 않고 분산되거나 대응점이 존재하지 않는 경우가 빈번하게 발생될 수 있기 때문이다. 특히 본 실시예에서와 같이 이종의 이미지에서 추출된 제1 및 제2 특징맵(fRGB, fIR) 사이의 대응 픽셀을 검출하고자 하는 경우, 이미지의 색상이나 질감과 같은 디테일한 특징보다 이미지의 개략적 형상 변화에 더욱 치중되어야 한다. 이에 본 실시예에서는 argmax 함수가 아닌 소프트 와핑 함수(W)를 이용하여 이종 이미지에서 서로 대응하는 픽셀의 위치로 와핑을 수행한다.
와핑 풀링부(550)는 제1 및 제2 풀링부(310, 320)와 동일한 방식으로 소프트 와핑부(540)에서 획득된 제1 와핑 특징맵(
Figure 112021006247859-pat00020
)과 제2 와핑 특징맵(
Figure 112021006247859-pat00021
) 각각을 풀링하여 제1 와핑 표현자(ø(
Figure 112021006247859-pat00022
))과 제2 와핑 표현자(ø(
Figure 112021006247859-pat00023
))를 획득한다.
그리고 재식별부(400)는 제1 및 제2 표현자(ø(fRGB), ø(fIR))과 마찬가지로, 제1 및 제2 와핑 표현자(ø(
Figure 112021006247859-pat00024
), ø(
Figure 112021006247859-pat00025
))을 인가받아 제1 및 제2 표현자(ø(fRGB), ø(fIR))에 대한 식별자를 추출할 수 있다.
손실 계산부(600)는 학습 과정에서 발생하는 손실을 기지정된 방식으로 계산하고, 계산된 손실을 역전파함으로써, 특징 추출부(200), 풀링부(300), 재식별부(400) 및 교차 모달 정렬부(500)를 학습시킨다.
본 실시예에서 손실 계산부(600)는 식별 손실(Identity loss)(LID)과 일관성 손실(Identity Consistency loss)(LIC) 및 밀집 삼중 손실(Dense Triplet loss)(LDT)를 각각 계산하고, 계산된 식별 손실(LID)과 일관성 손실(LIC) 및 밀집 삼중 손실(LDT)을 결합하여 계산되는 총 손실(L)을 역전파함으로써 학습을 수행할 수 있다.
손실 계산부(600)는 우선 제1 및 제2 표현자(ø(fRGB), ø(fIR))을 기반으로 식별 손실(LID)을 획득할 수 있다. 여기서 식별 손실(LID)은 제1 및 제2 표현자(ø(fRGB), ø(fIR))으로부터 획득되는 제1 및 제2 스코어맵과 학습시에 입력되는 제1 및 제2 이미지에 미리 레이블된 사람에 대한 식별자 사이의 차이를 기반으로 계산되어 획득될 수 있다. 즉 본 실시예의 사람 재식별 장치는 학습 시에 사람에 대한 식별자가 미리 레이블된 이종 이미지를 학습 데이터로 인가받아 지도 학습(Supervised Learning) 방식으로 학습이 수행될 수 있다.
손실 계산부(600)는 제1 및 제2 스코어맵과 학습 데이터로서 인가된 식별자 사이의 음의 크로스 엔트로피(negative cross-entropy)를 계산하여 식별 손실(LID)을 계산할 수 있다. 여기서 음의 크로스 엔트로피를 기반으로 식별 손실(LID)을 계산하는 방법은 공지된 기술이므로 여기서는 상세하게 설명하지 않는다.
한편, 손실 계산부(600)는 교차 모달 정렬부(500)에 의해 이종 이미지에서 획득된 제1 및 제2 특징맵(fRGB, fIR)의 전경 영역이 정상적으로 와핑되었다면, 제1 및 제2 스코어맵로부터 추출되는 식별자와 제1 및 제2 와핑 스코어맵에서 추출되는 식별자가 동일해야 한다는 일관성 손실(LIC)을 계산한다.
이때 손실 계산부(600)는 학습에 의해 최종적으로는 제1 및 제2 스코어맵에서 추출되는 식별자가 학습 데이터에 레이블된 식별자와 동일해지므로, 제1 및 제2 스코어맵으로부터 식별 손실(LID)을 계산하는 방식과 동일하게 제1 및 제2 스코어맵과 학습 데이터에 레이블된 식별자를 기반으로 일관성 손실(LIC)을 계산할 수 있다.
그러나 일관성 손실(LIC)은 실제 이미지에 대한 식별자보다는 제1 및 제2 스코어맵로부터 추출되는 식별자와 제1 및 제2 와핑 스코어맵에서 추출되는 식별자의 차이를 나타내므로, 손실 계산부(600)는 제1 및 제2 스코어맵과 제1 및 제2 와핑 스코어맵 사이의 음의 크로스 엔트로피로 일관성 손실(LIC)을 계산할 수 있다.
한편 특징 추출부(200)에서 획득된 제1 및 제2 특징맵(fRGB, fIR)과 소프트 와핑부(540)에서 획득된 제1 및 제2 와핑 특징맵(
Figure 112021006247859-pat00026
,
Figure 112021006247859-pat00027
)을 인가받고, 이중 서로 대응하는 특징맵과 와핑 특징맵을 기반으로 제1 및 제2 공통 주의맵(co-attention map)을 획득하고, 획득된 제1 및 제2 공통 주의맵을 이용하여 밀집 삼중 손실(LDT)을 계산한다.
제1 및 제2 특징맵(fRGB, fIR)과 소프트 와핑되어 재구성된 제1 및 제2 와핑 특징맵(
Figure 112021006247859-pat00028
,
Figure 112021006247859-pat00029
) 사이의 오차를 계산하는 가장 직접적인 방식은 L2 놈 함수를 적용하여 대응하는 픽셀간 L2 거리를 계산하는 것이다. 그러나, 이는 폐색 영역 등을 고려하지 않는다는 한계가 있다. 이에 본 실시예에서 손실 계산부(600)는 이종의 이미지 양측에서 모두 확인 가능한 사람 영역을 강조하는 공통 주의맵을 획득하고, 공통 주의맵 상에서 특징맵과 와핑 특징맵 사이의 오차를 계산하여 밀집 삼중 손실(LDT)을 획득한다.
우선 제1 이미지에 대한 제1 공통 주의맵(ARGB)은 수학식 7에 따라 획득될 수 있다.
Figure 112021006247859-pat00030
수학식 7을 살펴보면, 제1 공통 주의맵(ARGB(p))은 제1 마스크(MRGB)와 와핑된 제2 마스크(MIR) 사이의 교차점으로 구성되는 맵을 나타낸다.
마찬가지로 제2 이미지에 대한 제2 공통 주의맵(AIR) 또한 동일한 방식으로 획득될 수 있다.
도 8에서 왼쪽 그림은 제2 마스크(MIR)를 나타내고, 오른쪽 그림은 제1 마스크(MRGB)를 나타내며, 가운데 그림은 제2 공통 주의맵(AIR)을 나타낸다. 도 8에 도시된 바와 같이, 제2 마스크(MIR)와 와핑된 제1 마스크(MRGB) 사이의 교차점을 나타내는 제2 공통 주의맵(AIR)은 비록 제1 이미지에 포함된 사람의 일부 영역이 가려져 있음에도 제1 및 제2 이미지에서 공통적으로 표시되는 역역만이 강조되고, 적어도 하나의 이미지에서 표시되지 않은 영역(예를 들면 무릎)은 억제되도록 할 수 있다.
제1 및 제2 공통 주의맵(ARGB, AIR)이 획득되면, 손실 계산부(600)는 앵커를 기준으로 동일한 식별자에 대한 특징맵을 나타내는 포지티브와 다른 식별자에 대한 특징맵을 나타내는 네거티브를 비교하는 삼중(triplet) 학습 방식을 이용하여 손실을 계산한다. 여기서 포지티브 및 네거티브는 앵커와 다른 이종의 이미지(예를 들면, 앵커가 제1 이미지일 때, 포지티브 및 네거티브 쌍은 이종의 제2 이미지)에서 획득된다.
일 예로 제1 특징맵(fRGB)이 앵커(fa RGB)인 경우, 포지티브(
Figure 112021006247859-pat00031
)는 앵커(fa RGB)와 동일한 식별자를 갖는 포지티브 제2 특징맵(fp IR)을 와핑하여 재구성된 제1 와핑 특징맵(
Figure 112021006247859-pat00032
)을 나타내고, 네거티브(
Figure 112021006247859-pat00033
)는 앵커(fa RGB)와 다른 식별자를 갖는 네거티브 제2 특징맵(fn IR)을 와핑하여 재구성된 제1 와핑 특징맵(
Figure 112021006247859-pat00034
)을 나타낸다.
유사하게 제2 특징맵(fIR)이 앵커(fa IR)인 경우, 포지티브(
Figure 112021006247859-pat00035
)는 앵커(fa IR)와 동일한 식별자를 갖는 포지티브 제1 특징맵(fp RGB)을 와핑하여 재구성된 제2 와핑 특징맵(
Figure 112021006247859-pat00036
)을 나타내고, 네거티브(
Figure 112021006247859-pat00037
)는 앵커(fa IR)와 다른 식별자를 갖는 네거티브 제1 특징맵(fn RGB)을 와핑하여 재구성된 제2 와핑 특징맵(
Figure 112021006247859-pat00038
)을 나타낸다.
이에 손실 계산부(600)는 제1 및 제2 공통 주의맵(Ai, i ∈ {RGB, IR}) 각각을 기반으로 밀집 삼중 손실(LDT)을 수학식 8에 따라 계산할 수 있다.
Figure 112021006247859-pat00039
여기서 α는 미리 정의된 마진을 나타내고, di +(p)와 di -(p)는 각각 수학식 9에 따라 계산되는 앵커와 포지티브 사이의 오차 및 앵커와 네거티브 각각 사이의 오차를 나타낸다.
Figure 112021006247859-pat00040
식별 손실(LIC)과 일관성 손실(LIC) 및 밀집 삼중 손실(LDT)이 계산되면, 손실 계산부(600)는 수학식 10에 따라 총 손실(L)을 계산하고 역전파함으로써, 학습을 수행할 수 있다.
Figure 112021006247859-pat00041
여기서 λIC, λDT 는 각각 일관성 손실 가중치 및 밀집 삼중 손실 가중치이다.
도 9는 사람 재식별 장치의 손실 설정에 따른 성능 변화를 나타낸다.
도 9에서 (a)는 식별 손실(LIC)만을 적용하여 학습을 수행한 경우, 이종 이미지에서 상호 매칭되는 픽셀을 나타내고, (b)는 식별 손실(LIC)과 일관성 손실(LIC)을 적용하여 학습을 수행한 경우, 이종 이미지에서 상호 매칭되는 픽셀을 나타낸다. 그리고 (c)는 식별 손실(LIC)과 일관성 손실(LIC) 및 밀집 삼중 손실(LDT)을 적용하여 학습을 수행한 경우, 상호 매칭되는 픽셀을 나타낸다.
도 9의 (c)에 도시된 바와 같이, 식별 손실(LIC)과 일관성 손실(LIC) 및 밀집 삼중 손실(LDT)을 적용하여 학습을 수행하는 경우, 이종 이미지에서 사람 영역의 각 픽셀이 서로 대응하는 위치에 정확하게 매칭됨을 알 수 있다. 그리고 이는 본 실시예의 사람 재식별 장치가 매우 높은 정확도로 사람을 재식별할 수 있음을 나타낸다.
도 10은 본 실시예에 따른 사람 재식별 장치의 성능을 시뮬레이션한 결과를 나타낸다.
상기한 바와 같이, 이종 이미지에서 사람 영역의 각 픽셀이 서로 대응하는 위치에 정확하게 매칭시킬 수 있으며, 도 10의 (a)에 도시된 바와 같이 서로 다른 스케일이나 (b)의 시점 변화 및 (c)와 같이 여러 사람이 포함된 이미지에서도 정확하게 대응하는 픽셀을 매칭시킬 수 있어 사람을 재식별 할 수 있도록 한다.
도 11은 본 발명의 일 실시예에 따른 이종 센서 카메라 기반 사람 재식별 방법을 나타낸다.
도 11을 참조하면, 본 실시예에 따른 이종 센서 카메라 기반 사람 재식별 방법은 크게 학습 단계(S10)와 이종 이미지 사람 재식별 단계(S20)로 구분될 수 있다. 도 6 및 도 7을 참조하여, 우선 학습 단계(S10)를 설명하면, 이종 센서 카메라에서 획득되고, 각각 포함된 사람의 식별자가 레이블된 이종 이미지인 제1 및 제2 이미지를 학습 데이터로서 획득한다(S11). 이때, 제1 이미지와 제2 이미지는 각각 단일 프레임의 이미지일 수도 있으며, 다수 프레임으로 구성된 이미지일 수 있다. 또한 동일한 사람이 포함된 이미지이거나 서로 다른 사람이 포함된 이미지일 수도 있다.
그리고 학습되는 방식에 따라 제1 및 제2 이미지 각각의 특징을 추출하여 제1 및 제2 학습 특징맵을 획득한다(S12). 이후 획득된 제1 및 제2 학습 특징맵 사이의 기지정된 방식으로 픽셀간 유사도를 계산하여 유사도맵(C(p,q))을 획득한다(S14). 여기서 유사도맵(C(p,q))은 일 예로 코사인 유사도를 기반으로 수학식 1에 따라 계산할 수 있다.
유사도맵(C(p,q))이 획득되면, 획득된 유사도맵(C(p,q))을 기반으로 제1 및 제2 학습 특징맵에서 픽셀 위치별 매칭 확률을 수학식 2에 따라 계산하여 매칭 확률맵(P(p,q))을 획득한다(S15). 그리고 매칭 확률맵(P(p,q))을 이용하여 제1 및 제2 학습 특징맵에서 서로 대응하는 픽셀을 소프트 와핑하여 와핑 특징맵을 획득한다(S15). 이때 소프트 와핑은 제1 및 제2 학습 특징맵 각각에서 미리 사람 영역이 강조된 제1 및 제2 마스크를 수학식 3 및 4에 따라 획득하고, 수학식 5 및 6으로 나타난 바와 같이, 획득된 제1 및 제2 마스크 중 대응하는 마스크를 이용하여 픽셀이 와핑되는 특징맵의 사람 영역에 집중되어 와핑되도록 하고 나머지 영역은 기존 특징맵의 픽셀이 유지되도록 수행된다. 즉 제1 학습 특징맵의 픽셀은 제2 마스크를 이용하여 제2 특징맵의 사람 영역에 해당하는 위치로 와핑되고, 나머지 영역은 제2 학습 특징맵의 픽셀이 유지되어 제2 와핑 특징맵이 획득된다. 그리고 제2 학습 특징맵의 픽셀은 제1 마스크를 이용하여 제1 특징맵의 사람 영역에 해당하는 위치로 와핑되고, 나머지 영역은 제2 학습 특징맵의 픽셀이 유지되어 제1 와핑 특징맵이 획득된다. 제1 및 제2 와핑 특징맵이 획득되면, 제1 및 제2 학습 특징맵과 제1 및 제2 와핑 특징맵 각각을 풀링하여, 제1 및 제2 표현자와 제1 및 제2 와핑 표현자를 획득한다(S16).
이후 획득된 제1 및 제2 표현자와 제1 및 제2 와핑 표현자 각각을 기반으로 기지정된 클래스별 대응확률을 나타내는 클래스를 분류를 수행하여 각각에 대응하는 식별자를 획득한다(S17). 일 예로 식별자는 제1 및 제2 표현자와 제1 및 제2 와핑 표현자 각각이 기지정된 다수의 클래스 각각에 대응할 확률을 나타내는 제1 및 제2 스코어맵과 제1 및 제2 와핑 스코어맵을 획득하고, 획득된 제1 및 제2 스코어맵과 제1 및 제2 와핑 스코어맵 각각을 기반으로 가장 높은 확률을 나타내는 클래스의 식별자를 추출하여 획득할 수 있다.
그리고 식별자가 획득되면, 획득된 제1 및 제2 스코어맵과 제1 및 제2 와핑 스코어맵 그리고 제1 및 제2 학습 이미지에 레이블된 식별자를 이용하여 식별 손실(LID)과 일관성 손실(LIC)을 계산하고, 제1 및 제2 특징맵과 제1 및 제2 와핑 특징맵을 이용하여 밀집 삼중 손실(LDT)을 계산하여 총 손실을 계산하고 역전파한다(S18).
여기서 식별 손실(LID)은 제1 및 제2 표현자에서 획득된 제1 및 제2 스코어맵과 제1 및 제2 학습 이미지에 레이블된 식별자 사이의 차이로 계산되며, 일 예로 제1 및 제2 스코어맵과 레이블된 식별자들 사이의 음의 크로스 엔트로피로 계산될 수 있다.
그리고 일관성 손실(LIC)은 제1 및 제2 스코어맵과 제1 및 제2 와핑 스코어맵 사이의 음의 크로스 엔트로피를 계산하여 획득될 수 있다.
한편, 밀집 삼중 손실(LDT)은 제1 및 제2 학습 특징맵과 제1 및 제2 와핑 특징맵에서 서로 대응하는 학습 특징맵과 와핑 특징맵을 기반으로 이종의 학습 이미지 양측에서 모두 확인 가능한 사람 영역을 강조하는 제1 및 제2 공통 주의맵을 획득하고 공통 주의맵 상에서 학습 특징맵인 앵커와 앵커의 식별자와 동일한 식별자에 대한 와핑 특징맵인 포지티브와 다른 식별자에 대한 와핑 특징맵인 네거티브 사이의 오차를 계산하여 밀집 삼중 손실(LDT)을 획득한다.
그리고 계산된 식별 손실(LIC)과 일관성 손실(LIC) 및 밀집 삼중 손실(LDT)을 가중합하여 총 손실을 계산하고 역전파하여 학습을 수행한다. 학습은 기지정된 횟수로 수행되거나 총 손실이 기지정된 기준 손실이 이하가 될 때까지 반복 수행될 수 있다.
한편, 학습이 완료되면, 실제 사람 재식별을 위해 적용되어 이종 이미지 사람 재식별 단계(S20)를 수행한다.
이종 이미지 사람 재식별 단계에서는 우선 사람 재식별이 수행되어야 하는 이종의 제1 및 제2 이미지를 획득한다(S21). 그리고 학습 단계에서 학습된 방식에 따라 획득된 제1 및 제2 이미지 각각에서 특징을 추출하여 제1 및 제2 특징맵을 획득한다(S22). 이후 제1 및 제2 특징맵을 기지정된 방식으로 풀링하여 제1 및 제2 표현자를 획득한다(S23). 제1 및 제2 표현자가 획득되면, 획득된 제1 및 제2 표현자가 재식별 대상이 되는 다수의 사람에 대응하도록 기지정된 다수의 클래스 각각에 대응하는 확률을 나타내는 제1 및 제2 스코어맵을 획득하고, 획득된 스코어맵을 기반으로 가장 높은 확률의 클래스에 대응하는 식별자를 추출함으로써 사람을 재식별한다.
본 발명에 따른 방법은 컴퓨터에서 실행시키기 위한 매체에 저장된 컴퓨터 프로그램으로 구현될 수 있다. 여기서 컴퓨터 판독가능 매체는 컴퓨터에 의해 액세스 될 수 있는 임의의 가용 매체일 수 있고, 또한 컴퓨터 저장 매체를 모두 포함할 수 있다. 컴퓨터 저장 매체는 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보의 저장을 위한 임의의 방법 또는 기술로 구현된 휘발성 및 비휘발성, 분리형 및 비분리형 매체를 모두 포함하며, ROM(판독 전용 메모리), RAM(랜덤 액세스 메모리), CD(컴팩트 디스크)-ROM, DVD(디지털 비디오 디스크)-ROM, 자기 테이프, 플로피 디스크, 광데이터 저장장치 등을 포함할 수 있다.
본 발명은 도면에 도시된 실시예를 참고로 설명되었으나 이는 예시적인 것에 불과하며, 본 기술 분야의 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다.
따라서, 본 발명의 진정한 기술적 보호 범위는 첨부된 청구범위의 기술적 사상에 의해 정해져야 할 것이다.
100: 이종 이미지 획득부 110: 제1 이미지 획득부
120: 제2 이미지 획득부 200: 특징 추출부
210: 제1 특징 추출부 220: 제2 특징 추출부
300: 풀링부 310: 제1 풀링부
320: 제2 풀링부 400: 재식별부
500: 교차 모달 정렬부 510: 유사도 측정부
520: 매칭 확률 추정부 530: 마스크 제공부
540: 소프트 와핑부 550: 와핑 풀링부
600: 손실 계산부

Claims (20)

  1. 서로 다른 이종의 센서를 이용하여 획득된 제1 및 제2 이미지를 인가받아 학습되는 방식에 따라 특징을 추출하여 제1 및 제2 특징맵을 획득하고, 기지정된 방식으로 풀링하여 제1 및 제2 표현자를 획득하는 특징 풀링부;
    학습 시에 구비되어, 상기 제1 및 제2 특징맵을 인가받아 서로 대응하는 픽셀을 추정하고, 추정된 대응 픽셀의 위치를 기반으로 상호 와핑을 수행하여, 상기 제2 특징맵이 상기 제1 특징맵에 대응하도록 와핑된 제1 와핑 특징맵과 상기 제1 특징맵이 상기 제2 특징맵에 대응하도록 와핑된 제2 와핑 특징맵 획득하며, 상기 제1 및 제2 와핑 특징맵을 풀링하여 제1 및 제2 와핑 표현자를 획득하는 교차 모달 정렬부;
    학습되는 방식에 따라 상기 제1 및 제2 표현자와 상기 제1 및 제2 와핑 표현자 각각이 기지정된 다수의 클래스 각각에 대응하는 확률을 나타내는 제1 및 제2 스코어맵과 제1 및 제2 와핑 스코어맵을 획득하고, 획득된 제1 및 제2 스코어맵에서 가장 높은 확률의 클래스의 식별자를 획득하는 재식별부; 및
    학습 시에 구비되어, 상기 제1 특징맵과 상기 제1 와핑 특징맵 사이의 차이와 상기 제2 특징맵과 상기 제2 와핑 특징맵 사이의 차이를 동일한 식별자인 경우의 포지티브와 서로 다른 식별자인 경우의 네거티브로 구분하여 밀집 삼중 손실을 계산하는 손실 계산부를 포함하되,
    상기 교차 모달 정렬부는
    기지정된 방식에 따라 상기 제1 및 제2 특징맵 사이의 픽셀간 유사도를 계산하여 유사도맵을 획득하는 유사도 측정부;
    상기 유사도 맵을 기반으로 상기 제1 및 제2 특징맵의 각 픽셀별 매칭 확률을 계산하여 매칭 확률맵을 획득하는 매칭 확률 추정부;
    상기 매칭 확률맵을 이용하여 상기 제1 및 제2 특징맵 각각의 픽셀들이 상대 특징맵의 각 픽셀에 매칭될 확률을 가중 집계하여 상대 특징맵으로 와핑함으로써 상기 제1 및 제2 와핑 특징맵을 획득하는 소프트 와핑부; 및
    상기 제1 및 제2 와핑 특징맵을 기지정된 방식으로 풀링하여 제1 및 제2 와핑 표현자를 획득하는 와핑 풀링부를 포함하는 사람 재식별 장치.
  2. 삭제
  3. 제1항에 있어서, 상기 교차 모달 정렬부는
    상기 제1 및 제2 특징맵의 각 위치별 픽셀의 크기를 정규화하여 제1 및 제2 마스크를 획득하는 마스크 제공부를 더 포함하는 사람 재식별 장치.
  4. 제3항에 있어서, 상기 소프트 와핑부는
    상기 제1 및 제2 마스크를 인가받아 상기 제1 및 제2 특징맵 각각의 픽셀들이 상대 특징맵의 각 픽셀에 매칭될 확률을 가중 집계하고, 가중 집계된 와핑 픽셀값에 마스크의 픽셀값을 추가로 가중하여 와핑하는 사람 재식별 장치.
  5. 제4항에 있어서, 상기 마스크 제공부는
    상기 제1 특징맵(fRGB)으로부터 상기 제1 마스크(MRGB)를 수학식
    Figure 112021006247859-pat00042

    (여기서 ∥·∥2는 L2 놈 함수이고, f는 최대-최소 정규화 함수이다.)
    에 따라 획득하고,
    상기 소프트 와핑부는
    상기 제1 특징맵(fRGB)과 상기 제2 특징맵(fIR), 상기 제1 마스크(MRGB)로부터 상기 제1 와핑 특징맵(
    Figure 112021006247859-pat00043
    )을 수학식
    Figure 112021006247859-pat00044

    (여기서 W는 매칭 확률맵(P(p,q))에 따라
    Figure 112021006247859-pat00045
    로 나타나는 소프트 와핑 함수이다.)
    에 따라 획득하는 사람 재식별 장치.
  6. 제4항에 있어서, 상기 손실 계산부는
    상기 제1 및 제2 이미지 모두에서 모두 확인 가능한 사람 영역을 강조하는 제1 및 제2 공통 주의맵을 획득하고, 상기 제1 공통 주의맵에서 앵커인 상기 제1 특징맵의 식별자와 동일한 식별자로 추정되는 제1 와핑 특징맵인 포지티브 및 서로 다른 식별자로 추정되는 제1 와핑 특징맵인 네거티브 각각의 사이의 차이와 상기 제2 공통 주의맵에서 앵커인 상기 제2 특징맵의 식별자와 동일한 식별자로 추정되는 포지티브 및 서로 다른 식별자로 추정되는 제2 와핑 특징맵인 네거티브 각각의 사이의 차이를 누적하여 상기 밀집 삼중 손실을 계산하는 사람 재식별 장치.
  7. 제6항에 있어서, 상기 손실 계산부는
    상기 제1 및 제2 공통 주의맵(Ai, i ∈ {RGB, IR})을 기반으로 상기 밀집 삼중 손실(LDT)을 수학식
    Figure 112021006247859-pat00046

    (여기서 α는 미리 정의된 마진을 나타내고, di +(p)와 di -(p)는 각각
    Figure 112021006247859-pat00047
    로 계산되는 앵커(fi a)와 포지티브(fi p) 사이의 오차 및 앵커(fi a)와 네거티브(fi n) 각각 사이의 오차를 나타낸다.)
    에 따라 계산하는 사람 재식별 장치.
  8. 제7항에 있어서, 상기 손실 계산부는
    상기 제1 및 제2 스코어맵 각각과 학습 시에 상기 제1 및 제2 이미지에 레이블되어 인가되는 식별자 사이의 차이에 따른 식별 손실과 상기 제1 및 제2 스코어맵과 상기 제1 및 제2 와핑 스코어맵 사이의 차이에 따른 일관성 손실을 더 계산하고, 상기 식별 손실과 상기 일관성 손실 및 상기 밀집 삼중 손실을 가중합하여 계산되는 총 손실을 역전파하여 학습을 수행하는 사람 재식별 장치.
  9. 제8항에 있어서, 상기 손실 계산부는
    상기 제1 및 제2 스코어맵과 상기 제1 및 제2 이미지에 레이블되어 인가되는 식별자 사이의 음의 크로스 엔트로피를 계산하여 상기 식별 손실을 획득하고, 상기 제1 및 제2 스코어맵 각각과 상기 제1 및 제2 와핑 스코어맵 중 대응하는 와핑 스코어맵 사이의 음의 크로스 엔트로피를 계산하여 상기 일관성 손실을 계산하는 사람 재식별 장치.
  10. 제1항에 있어서, 상기 제1 이미지는 가시 카메라에서 획득된 RGB 이미지이고 상기 제2 이미지는 IR 카메라에서 획득된 IR 이미지인 사람 재식별 장치.
  11. 학습 단계; 및
    인공 신경망을 이용하여, 서로 다른 이종의 센서를 이용하여 획득된 이미지들을 인가받아 각 이미지에 포함된 사람에 대한 식별자를 획득하는 사람 재식별 단계를 포함하고,
    상기 학습 단계는
    학습 데이터로서 서로 다른 이종의 센서를 이용하여 획득되고 식별자가 미리 레이블된 제1 및 제2 이미지를 인가받아 학습되는 방식에 따라 특징을 추출하여 제1 및 제2 특징맵을 획득하고, 기지정된 방식으로 풀링하여 제1 및 제2 표현자를 획득하는 단계;
    상기 제1 및 제2 특징맵을 인가받아 서로 대응하는 픽셀을 추정하고, 추정된 대응 픽셀의 위치를 기반으로 상호 와핑을 수행하여, 상기 제2 특징맵이 상기 제1 특징맵에 대응하도록 와핑된 제1 와핑 특징맵과 상기 제1 특징맵이 상기 제2 특징맵에 대응하도록 와핑된 제2 와핑 특징맵 획득하며, 상기 제1 및 제2 와핑 특징맵을 풀링하여 제1 및 제2 와핑 표현자를 획득하는 단계;
    상기 제1 및 제2 표현자와 상기 제1 및 제2 와핑 표현자 각각이 기지정된 다수의 클래스 각각에 대응하는 확률을 나타내는 제1 및 제2 스코어맵과 제1 및 제2 와핑 스코어맵을 획득하고, 획득된 제1 및 제2 스코어맵에서 가장 높은 확률의 클래스의 식별자를 획득하는 단계; 및
    상기 제1 특징맵과 상기 제1 와핑 특징맵 사이의 차이와 상기 제2 특징맵과 상기 제2 와핑 특징맵 사이의 차이를 동일한 식별자인 경우의 포지티브와 서로 다른 식별자인 경우의 네거티브로 구분하여 손실을 계산하는 단계를 포함하되,
    상기 제1 및 제2 와핑 표현자를 획득하는 단계는
    기지정된 방식에 따라 상기 제1 및 제2 특징맵 사이의 픽셀간 유사도를 계산하여 유사도맵을 획득하는 단계;
    상기 유사도 맵을 기반으로 상기 제1 및 제2 특징맵의 각 픽셀별 매칭 확률을 계산하여 매칭 확률맵을 획득하는 단계;
    상기 매칭 확률맵을 이용하여 상기 제1 및 제2 특징맵 각각의 픽셀들이 상대 특징맵의 각 픽셀에 매칭될 확률을 가중 집계하여 상대 특징맵으로 와핑함으로써 상기 제1 및 제2 와핑 특징맵을 획득하는 단계; 및
    제1 및 제2 와핑 표현자를 획득하기 위해 기지정된 방식으로 상기 제1 및 제2 와핑 특징맵을 풀링하는 단계를 포함하는 사람 재식별 방법.
  12. 삭제
  13. 제11항에 있어서, 상기 제1 및 제2 와핑 표현자를 획득하는 단계는
    상기 제1 및 제2 특징맵의 각 위치별 픽셀의 크기를 정규화하여 제1 및 제2 마스크를 획득하는 단계를 더 포함하는 사람 재식별 방법.
  14. 제13항에 있어서, 상기 제1 및 제2 와핑 특징맵을 획득하는 단계는
    상기 제1 및 제2 마스크를 인가받아 상기 제1 및 제2 특징맵 각각의 픽셀들이 상대 특징맵의 각 픽셀에 매칭될 확률을 가중 집계하는 단계; 및
    가중 집계된 와핑 픽셀값에 마스크의 픽셀값을 추가로 가중하여 와핑하는 단계를 포함하는 사람 재식별 방법.
  15. 제14항에 있어서, 상기 마스크를 획득하는 단계는
    상기 제1 특징맵(fRGB)으로부터 상기 제1 마스크(MRGB)를 수학식
    Figure 112021006247859-pat00048

    (여기서 ∥·∥2는 L2 놈 함수이고, f는 최대-최소 정규화 함수이다.)
    에 따라 획득하고,
    상기 추가로 가중하여 와핑하는 단계는
    상기 제1 특징맵(fRGB)과 상기 제2 특징맵(fIR), 상기 제1 마스크(MRGB)로부터 상기 제1 와핑 특징맵(
    Figure 112021006247859-pat00049
    )을 수학식
    Figure 112021006247859-pat00050

    (여기서 W는 매칭 확률맵(P(p,q))에 따라
    Figure 112021006247859-pat00051
    로 나타나는 소프트 와핑 함수이다.)
    에 따라 획득하는 사람 재식별 방법.
  16. 제14항에 있어서, 상기 손실을 계산하는 단계는
    상기 제1 및 제2 이미지 모두에서 모두 확인 가능한 사람 영역을 강조하는 제1 및 제2 공통 주의맵을 획득하는 단계; 및
    상기 제1 공통 주의맵에서 앵커인 상기 제1 특징맵의 식별자와 동일한 식별자로 추정되는 제1 와핑 특징맵인 포지티브 및 서로 다른 식별자로 추정되는 제1 와핑 특징맵인 네거티브 각각의 사이의 차이와 상기 제2 공통 주의맵에서 앵커인 상기 제2 특징맵의 식별자와 동일한 식별자로 추정되는 포지티브 및 서로 다른 식별자로 추정되는 제2 와핑 특징맵인 네거티브 각각의 사이의 차이를 누적하여 계산되는 밀집 삼중 손실을 획득하는 단계를 포함하는 사람 재식별 방법.
  17. 제16항에 있어서, 상기 밀집 삼중 손실을 획득하는 단계는
    상기 제1 및 제2 공통 주의맵(Ai, i ∈ {RGB, IR})을 기반으로 상기 밀집 삼중 손실(LDT)을 수학식
    Figure 112021006247859-pat00052

    (여기서 α는 미리 정의된 마진을 나타내고, di +(p)와 di -(p)는 각각
    Figure 112021006247859-pat00053
    로 계산되는 앵커(fi a)와 포지티브(fi p) 사이의 오차 및 앵커(fi a)와 네거티브(fi n) 각각 사이의 오차를 나타낸다.)
    에 따라 계산하는 사람 재식별 방법.
  18. 제17항에 있어서, 상기 손실을 계산하는 단계는
    상기 제1 및 제2 스코어맵 각각과 학습 시에 상기 제1 및 제2 이미지에 레이블되어 인가되는 식별자 사이의 차이에 따른 식별 손실을 계산하는 단계;
    상기 제1 및 제2 스코어맵과 상기 제1 및 제2 와핑 스코어맵 사이의 차이에 따른 일관성 손실을 계산하는 단계; 및
    상기 식별 손실과 상기 일관성 손실 및 상기 밀집 삼중 손실을 가중합하여 계산되는 총 손실을 역전파하는 단계를 더 포함하는 사람 재식별 방법.
  19. 제18항에 있어서, 상기 식별 손실을 계산하는 단계는
    상기 제1 및 제2 스코어맵과 상기 제1 및 제2 이미지에 레이블되어 인가되는 식별자 사이의 음의 크로스 엔트로피를 계산하여 상기 식별 손실을 획득하고,
    상기 일관성 손실을 계산하는 단계는
    상기 제1 및 제2 스코어맵 각각과 상기 제1 및 제2 와핑 스코어맵 중 대응하는 와핑 스코어맵 사이의 음의 크로스 엔트로피를 계산하여 상기 일관성 손실을 계산하는 사람 재식별 방법.
  20. 제11항에 있어서, 상기 사람 재식별 단계는
    상기 학습 단계에서 미리 학습된 방식에 따라 인가되는 이종 이미지 각각의 특징을 추출하여 특징맵을 획득하는 단계;
    이종 이미지 각각으로부터 획득된 특징맵을 기지정된 방식으로 풀링하여 대응하는 표현자를 획득하는 단계; 및
    미리 학습된 방식에 따라 획득된 표현자 각각에 대응하는 스코어맵을 획득하고, 획득된 스코어맵을 기반으로 인가된 이종 이미지 각각에 포함된 사람에 대한 식별자를 획득하는 단계를 포함하는 사람 재식별 방법.
KR1020210006683A 2021-01-18 2021-01-18 이종 센서 카메라 기반 사람 재식별 장치 및 방법 KR102540290B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020210006683A KR102540290B1 (ko) 2021-01-18 2021-01-18 이종 센서 카메라 기반 사람 재식별 장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210006683A KR102540290B1 (ko) 2021-01-18 2021-01-18 이종 센서 카메라 기반 사람 재식별 장치 및 방법

Publications (2)

Publication Number Publication Date
KR20220104426A KR20220104426A (ko) 2022-07-26
KR102540290B1 true KR102540290B1 (ko) 2023-06-02

Family

ID=82609460

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210006683A KR102540290B1 (ko) 2021-01-18 2021-01-18 이종 센서 카메라 기반 사람 재식별 장치 및 방법

Country Status (1)

Country Link
KR (1) KR102540290B1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20240080529A (ko) 2022-11-30 2024-06-07 연세대학교 산학협력단 비디오 재인식 장치 및 방법

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012098170A (ja) * 2010-11-02 2012-05-24 Shimizu Corp 画像データ処理システム
US20200242333A1 (en) * 2017-11-20 2020-07-30 Google Llc Generating object embeddings from images

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102198809B1 (ko) 2017-12-26 2021-01-05 한국자동차연구원 객체 추적 시스템 및 방법
KR102166117B1 (ko) * 2019-01-31 2020-10-15 연세대학교 산학협력단 시멘틱 매칭 장치 및 방법

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012098170A (ja) * 2010-11-02 2012-05-24 Shimizu Corp 画像データ処理システム
US20200242333A1 (en) * 2017-11-20 2020-07-30 Google Llc Generating object embeddings from images

Also Published As

Publication number Publication date
KR20220104426A (ko) 2022-07-26

Similar Documents

Publication Publication Date Title
CN111310731B (zh) 基于人工智能的视频推荐方法、装置、设备及存储介质
CN110414432B (zh) 对象识别模型的训练方法、对象识别方法及相应的装置
Happy et al. Fuzzy histogram of optical flow orientations for micro-expression recognition
US7869657B2 (en) System and method for comparing images using an edit distance
CN110853033B (zh) 基于帧间相似度的视频检测方法和装置
Almasawa et al. A survey on deep learning-based person re-identification systems
JP6544900B2 (ja) オブジェクト識別装置、オブジェクト識別方法及びプログラム
JP2004199669A (ja) 顔検出
JP2004192637A (ja) 顔検出
CN111368672A (zh) 一种用于遗传病面部识别模型的构建方法及装置
KR20170006355A (ko) 모션벡터 및 특징벡터 기반 위조 얼굴 검출 방법 및 장치
MX2012010602A (es) Aparato para el reconocimiento de la cara y metodo para el reconocimiento de la cara.
Demirkus et al. Hierarchical temporal graphical model for head pose estimation and subsequent attribute classification in real-world videos
CN115050064A (zh) 人脸活体检测方法、装置、设备及介质
Gupta et al. An efficient descriptor for gait recognition using spatio-temporal cues
CN112541403A (zh) 一种利用红外摄像头的室内人员跌倒检测方法
Hsu et al. Human body motion parameters capturing using kinect
Liu et al. Gait recognition using deep learning
KR102540290B1 (ko) 이종 센서 카메라 기반 사람 재식별 장치 및 방법
CN112836682B (zh) 视频中对象的识别方法、装置、计算机设备和存储介质
CN113706550A (zh) 图像场景识别和模型训练方法、装置和计算机设备
CN111104857A (zh) 一种基于步态能量图的身份识别方法及***
Lei et al. Convolutional restricted Boltzmann machines learning for robust visual tracking
KR20230060029A (ko) 평면 검출 장치 및 방법
Reddy et al. Comparison of HOG and fisherfaces based face recognition system using MATLAB

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant