KR102285427B1 - 물체 레이블을 활용한 Visual SLAM에서의 영상 특징점 강화 방법 및 장치 - Google Patents

물체 레이블을 활용한 Visual SLAM에서의 영상 특징점 강화 방법 및 장치 Download PDF

Info

Publication number
KR102285427B1
KR102285427B1 KR1020190039736A KR20190039736A KR102285427B1 KR 102285427 B1 KR102285427 B1 KR 102285427B1 KR 1020190039736 A KR1020190039736 A KR 1020190039736A KR 20190039736 A KR20190039736 A KR 20190039736A KR 102285427 B1 KR102285427 B1 KR 102285427B1
Authority
KR
South Korea
Prior art keywords
frame
visual
word vector
image
point
Prior art date
Application number
KR1020190039736A
Other languages
English (en)
Other versions
KR20200063949A (ko
Inventor
장병탁
이충연
이현도
황인준
Original Assignee
서울대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 서울대학교산학협력단 filed Critical 서울대학교산학협력단
Priority to PCT/KR2019/016641 priority Critical patent/WO2020111844A2/ko
Publication of KR20200063949A publication Critical patent/KR20200063949A/ko
Application granted granted Critical
Publication of KR102285427B1 publication Critical patent/KR102285427B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0268Control of position or course in two dimensions specially adapted to land vehicles using internal positioning means
    • G05D1/0274Control of position or course in two dimensions specially adapted to land vehicles using internal positioning means using mapping information stored in a memory device
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0231Control of position or course in two dimensions specially adapted to land vehicles using optical position detecting means
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0231Control of position or course in two dimensions specially adapted to land vehicles using optical position detecting means
    • G05D1/0246Control of position or course in two dimensions specially adapted to land vehicles using optical position detecting means using a video camera in combination with image processing means
    • G06K9/46
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/41Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/70Labelling scene content, e.g. deriving syntactic or semantic representations

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Remote Sensing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Automation & Control Theory (AREA)
  • Electromagnetism (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

물체 레이블을 활용한 Visual SLAM에서의 영상 특징점 강화 방법 및 장치를 제시하며, 물체 레이블을 활용한 Visual SLAM에서의 영상 특징점 강화 방법 및 장치는 카메라를 통해 획득된 영상을 구성하는 프레임으로부터 특징점을 추출하고, 추출된 특징점의 특성에 대한 정보를 포함하는 기술자의 분포를 기록한 시각적 단어 벡터를 생성하는 시각적특징처리부, 상기 프레임으로부터 상기 특징점 영역에 위치한 물체를 인식하고, 인식된 물체에 대한 의미정보를 추출하는 의미적특징처리부 및 상기 시각적 단어 벡터에 상기 의미정보가 추가된 시각적 의미 단어 벡터를 기초로 현재 위치가 기 방문한 지점인지 식별하는 위치추정부를 포함할 수 있다.

Description

물체 레이블을 활용한 Visual SLAM에서의 영상 특징점 강화 방법 및 장치{METHOD AND APPARATUS OF VISUAL FEATURE AUGMENTATION FOR VISUAL SLAM USING OBJECT LABELS}
본 명세서에서 개시되는 실시예들은 물체 레이블을 활용한 Visual SLAM(Simultaneous Localization and Mapping)에서의 영상 특징점 강화 방법 및 장치에 관한 것으로, 보다 상세하게는 카메라 영상 기반으로 미지의 공간에서 로봇이 주행하기 위해 지도를 생성하는 동시에 자신의 위치를 추정하는 방법 및 장치에 관한 것이다.
일반적으로 사람이 공간 인식 과정에서 주변 환경에 배치된 물체의 종류와 색상 등 다양한 의미적 특징들을 기억하고 활용하는 것과 달리, Visual SLAM은 카메라의 영상으로부터 인식 가능한 특징점들을 추출하여 3차원 지도에 매핑하는 방식을 사용하며, 현재 시점의 영상 특징점들을 기존 지도와 비교하여 매칭 결과가 가장 높은 지점으로 현재 위치를 추정한다.
하지만 영상처리 기반의 방법은 처리 속도가 빠른 장점이 있지만, 영상으로부터 추출 가능한 정보량이 부족한 태생적인 한계를 지닌다.
즉, 특정 픽셀과 그 주변 픽셀들의 밝기값으로부터 추출된 국소적인 정보만을 사용하기 때문에 모바일 로봇의 움직임에 따른 영상 변화에 민감하며, 이로 인해 충분한 영상 특징점이 추출되지 않는 경우 위치 추정에 실패하고, 이전에 방문한 장소를 올바로 인식하지 못하게 되는 문제가 있다.
관련하여 선행기술 문헌인 한국특허공개번호 제 10-2016-0111008 호에서는 카메라가 파노라마 SLAM(simultaneous localization and mapping)을 수행하고 있는 동안, 적어도 하나의 모션 센서를 사용하여 카메라의 움직임에서 병진 모션을 검출하고 유한 피쳐들의 추적을 위해 3차원 맵을 초기화하는 것에 기초하는 단안 시각적 SLAM을 위한 기술들을 제시할 뿐, 상술된 문제점을 해결하지 못한다.
따라서 상술된 문제점을 해결하기 위한 기술이 필요하게 되었다.
한편, 전술한 배경기술은 발명자가 본 발명의 도출을 위해 보유하고 있었거나, 본 발명의 도출 과정에서 습득한 기술 정보로서, 반드시 본 발명의 출원 전에 일반 공중에게 공개된 공지기술이라 할 수는 없다.
본 명세서에서 개시되는 실시예들은, 물체 레이블을 활용한 Visual SLAM에서의 영상 특징점 강화 방법 및 장치를 제시하는 데 목적이 있다.
본 명세서에서 개시되는 실시예들은, 물체 인식을 기반으로 물체의 의미적 정보를 추출하여 영상의 특징점에 결합하는 물체 레이블을 활용한 Visual SLAM에서의 영상 특징점 강화 방법 및 장치를 제시하는 데 목적이 있다.
본 명세서에서 개시되는 실시예들은, 물체의 의미적 정보를 추가적으로 이용함으로써 이전 방문 장소의 인식 성능을 향상시키는 물체 레이블을 활용한 Visual SLAM에서의 영상 특징점 강화 방법 및 장치를 제시하는 데 목적이 있다.
상술한 기술적 과제를 달성하기 위한 기술적 수단으로서, 일 실시예에 따르면, SLAM에서 영상의 특징점을 강화하는 장치에 있어서, 카메라를 통해 획득된 영상을 구성하는 프레임으로부터 특징점을 추출하고, 추출된 특징점의 특성에 대한 정보를 포함하는 기술자의 분포를 기록한 시각적 단어 벡터를 생성하는 시각적특징처리부, 상기 프레임으로부터 상기 특징점 영역에 위치한 물체를 인식하고, 인식된 물체에 대한 의미정보를 추출하는 의미적특징처리부 및 상기 시각적 단어 벡터에 상기 의미정보가 추가된 시각적 의미 단어 벡터를 기초로 현재 위치가 기 방문한 지점인지 식별하는 위치추정부를 포함할 수 있다.
다른 실시예에 따르면, 영상특징점강화장치가 SLAM에서 영상의 특징점을 강화하는 방법에 있어서, 카메라를 통해 획득된 영상을 구성하는 프레임으로부터 특징점을 추출하고, 추출된 특징점의 특성에 대한 정보를 포함하는 기술자의 분포를 기록한 시각적 단어 벡터를 생성하는 단계, 상기 프레임으로부터 상기 특징점 영역에 위치한 물체를 인식하고, 인식된 물체에 대한 의미정보를 추출하는 단계 및 상기 시각적 단어 벡터에 상기 의미정보가 추가된 시각적 의미 단어 벡터를 기초로 현재 위치가 기 방문한 지점인지 식별하는 단계를 포함할 수 있다.
또 다른 실시예에 따르면, 영상특징점강화방법을 수행하는 프로그램이 기록된 컴퓨터 판독이 가능한 기록매체로서, 상기 영상특징점강화방법은, 카메라를 통해 획득된 영상을 구성하는 프레임으로부터 특징점을 추출하고, 추출된 특징점의 특성에 대한 정보를 포함하는 기술자의 분포를 기록한 시각적 단어 벡터를 생성하는 단계, 상기 프레임으로부터 상기 특징점 영역에 위치한 물체를 인식하고, 인식된 물체에 대한 의미정보를 추출하는 단계 및 상기 시각적 단어 벡터에 상기 의미정보가 추가된 시각적 의미 단어 벡터를 기초로 현재 위치가 기 방문한 지점인지 식별하는 단계를 포함할 수 있다.
다른 실시예에 따른면, 영상특징점강화장치에 의해 수행되며, 상기 영상특징점강화방법을 수행하기 위해 기록매체에 저장된 컴퓨터프로그램으로서, 상기 영상특징점강화방법은, 카메라를 통해 획득된 영상을 구성하는 프레임으로부터 특징점을 추출하고, 추출된 특징점의 특성에 대한 정보를 포함하는 기술자의 분포를 기록한 시각적 단어 벡터를 생성하는 단계, 상기 프레임으로부터 상기 특징점 영역에 위치한 물체를 인식하고, 인식된 물체에 대한 의미정보를 추출하는 단계 및 상기 시각적 단어 벡터에 상기 의미정보가 추가된 시각적 의미 단어 벡터를 기초로 현재 위치가 기 방문한 지점인지 식별하는 단계를 포함할 수 있다.
전술한 과제 해결 수단 중 어느 하나에 의하면, 물체 레이블을 활용한 Visual SLAM에서의 영상 특징점 강화 방법 및 장치를 제시할 수 있다.
전술한 과제 해결 수단 중 어느 하나에 의하면, 영상의 특징점이 추출되지 않는 경우라도 물체의 의미적 정보를 이용하여 방문장소를 올바르게 인식하는 물체 레이블을 활용한 Visual SLAM에서의 영상 특징점 강화 방법 및 장치를 제시할 수 있다.
전술한 과제 해결 수단 중 어느 하나에 의하면, 물체의 의미적 정보를 추가적으로 이용함으로써 이전 방문 장소의 인식 성능을 향상시키는 물체 레이블을 활용한 Visual SLAM에서의 영상 특징점 강화 방법 및 장치를 제시할 수 있다.
개시되는 실시예들에서 얻을 수 있는 효과는 이상에서 언급한 효과들로 제한되지 않으며, 언급하지 않은 또 다른 효과들은 아래의 기재로부터 개시되는 실시예들이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
도 1 은 일 실시예에 따른 영상특징점강화장치를 도시한 블록도이다.
도 2 및 도 3 은 일 실시예에 따른 영상특징점강화방법을 설명하기 위한 순서도이다.
아래에서는 첨부한 도면을 참조하여 다양한 실시예들을 상세히 설명한다. 아래에서 설명되는 실시예들은 여러 가지 상이한 형태로 변형되어 실시될 수도 있다. 실시예들의 특징을 보다 명확히 설명하기 위하여, 이하의 실시예들이 속하는 기술분야에서 통상의 지식을 가진 자에게 널리 알려져 있는 사항들에 관해서 자세한 설명은 생략하였다. 그리고, 도면에서 실시예들의 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
명세서 전체에서, 어떤 구성이 다른 구성과 "연결"되어 있다고 할 때, 이는 ‘직접적으로 연결’되어 있는 경우뿐 아니라, ‘그 중간에 다른 구성을 사이에 두고 연결’되어 있는 경우도 포함한다. 또한, 어떤 구성이 어떤 구성을 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한, 그 외 다른 구성을 제외하는 것이 아니라 다른 구성들을 더 포함할 수도 있음을 의미한다.
이하 첨부된 도면을 참고하여 실시예들을 상세히 설명하기로 한다.
다만 이를 설명하기에 앞서, 아래에서 사용되는 용어들의 의미를 먼저 정의한다.
‘SLAM(Simultaneous Localization and Mapping)’이란 미지의 공간에서 로봇이 주행하기 위해 지도를 생성하는 동시에 자신의 위치를 추정하는 기술이다. 그리고 카메라 영상 기반의 SLAM을 Visual SLAM 이라고 한다.
‘키프레임’은 로봇에 구비된 카메라를 통해 획득된 영상을 구성하는 프레임 중 로봇의 현재 위치를 식별하는데 이용되는 프레임이다.
‘단어의 가방(Bag Of Words)’은 복수의 텍스트가 그룹핑된 그룹을 이용하여 입력되는 텍스트를 숫자로 변환하는 기법이다.
‘특징점’은 카메라를 통해 촬영된 영상에서 주변 점들과 강도(intensity)값 차이가 큰 점이다.
위에 정의한 용어 이외에 설명이 필요한 용어는 아래에서 각각 따로 설명한다.
도 1은 일 실시예에 따른 영상특징점강화장치(10)를 설명하기 위한 블럭도이다.
영상특징점강화장치(10)는 네트워크(N)를 통해 원격지의 서버에 접속하거나, 타 단말 및 서버와 연결 가능한 컴퓨터나 휴대용 단말기, 텔레비전, 웨어러블 디바이스(Wearable Device) 등으로 구현될 수 있다. 여기서, 컴퓨터는 예를 들어, 웹 브라우저(WEB Browser)가 탑재된 노트북, 데스크톱(desktop), 랩톱(laptop)등을 포함하고, 휴대용 단말기는 예를 들어, 휴대성과 이동성이 보장되는 무선 통신 장치로서, PCS(Personal Communication System), PDC(Personal Digital Cellular), PHS(Personal Handyphone System), PDA(Personal Digital Assistant), GSM(Global System for Mobile communications), IMT(International Mobile Telecommunication)-2000, CDMA(Code Division Multiple Access)-2000, W-CDMA(W-Code Division Multiple Access), Wibro(Wireless Broadband Internet), 스마트폰(Smart Phone), 모바일 WiMAX(Mobile Worldwide Interoperability for Microwave Access) 등과 같은 모든 종류의 핸드헬드(Handheld) 기반의 무선 통신 장치를 포함할 수 있다. 또한, 텔레비전은 IPTV(Internet Protocol Television), 인터넷 TV(Internet Television), 지상파 TV, 케이블 TV 등을 포함할 수 있다. 나아가 웨어러블 디바이스는 예를 들어, 시계, 안경, 액세서리, 의복, 신발 등 인체에 직접 착용 가능한 타입의 정보처리장치로서, 직접 또는 다른 정보처리장치를 통해 네트워크를 경유하여 원격지의 서버에 접속하거나 타 단말과 연결될 수 있다.
도 1 을 참조하면, 일 실시예에 따른 영상특징점강화장치(10)는, 입출력부(110), 제어부(120), 통신부(130) 및 메모리(140)를 포함할 수 있다.
우선, 입출력부(110)는 사용자로부터 입력을 수신하기 위한 입력부와, 작업의 수행 결과 또는 영상특징점강화장치(10)의 상태 등의 정보를 표시하기 위한 출력부를 포함할 수 있다. 예를 들어, 입출력부(110)는 사용자 입력을 수신하는 조작 패널(operation panel) 및 화면을 표시하는 디스플레이 패널(display panel) 등을 포함할 수 있다.
구체적으로, 입력부는 키보드, 물리 버튼, 터치 스크린, 카메라 또는 마이크 등과 같이 다양한 형태의 사용자 입력을 수신할 수 있는 장치들을 포함할 수 있다. 예를 들어, 카메라 센서는 로봇에 구비되어 로봇의 주위를 촬영할 수 있다.
또한, 출력부는 디스플레이 패널 또는 스피커 등을 포함할 수 있다. 다만, 이에 한정되지 않고 입출력부(110)는 다양한 입출력을 지원하는 구성을 포함할 수 있다.
제어부(120)는 영상특징점강화장치(10)의 전체적인 동작을 제어하며, CPU 등과 같은 프로세서를 포함할 수 있다. 제어부(120)는 입출력부(110)를 통해 수신한 사용자 입력에 대응되는 동작을 수행하도록 영상특징점강화장치(10)에 포함된 다른 구성들을 제어할 수 있다.
예를 들어, 제어부(120)는 메모리(140)에 저장된 프로그램을 실행시키거나, 메모리(140)에 저장된 파일을 읽어오거나, 새로운 파일을 메모리(140)에 저장할 수도 있다.
이러한 제어부(120)는 시각적특징처리부(121), 의미적특징처리부(122), 위치추정부(123) 또는 지도갱신부(124)를 포함할 수 있다.
우선, 시각적특징처리부(121)는 입출력부(110)에서 의해 촬영된 영상의 프레임으로부터 프레임의 특징점을 추출할 수 있고, 추출된 특징점 각각에 대해 기술자(descriptor)를 계산하여 각 특징점의 특성을 저장할 수 있다.
이를 위해, 시각적특징처리부(121)는 기술자를 K-means 클러스터링으로 그룹핑하여 단어의 가방에 포함되는 시각적 단어(Visual vocabulary)를 생성하여 영상의 프레임별 기술자의 분포를 기록한 시각적 단어 벡터(Visual vocabulary vector)를 생성할 수 있고, 생성된 시각적 단어 벡터를 통해 각 프레임의 특성을 저장할 수 있다.
그리고 의미적특징처리부(122)는 특징점이 속한 영역의 물체 레이블인 의미 정보를 기술자의 시각적 단어 벡터에 추가하여 시각적 의미 단어 벡터(visual-semantic vocabulary vector)를 생성할 수 있다.
이때, 시각적 의미 단어 벡터(visual-semantic vocabulary vector)를 수식으로 나타내면 아래와 같다.
프레임 f 에 포함된 의미 단어(semantic vocabulary)와 시각적 단어(visual vocabulary)의 집합을 각각
Figure 112019034850611-pat00001
,
Figure 112019034850611-pat00002
로 두고, f에 포함된 특징점들 중 의미 단어 l을 가지는 집합을
Figure 112019034850611-pat00003
, 시각적 단어 i 를 가지는 집합을
Figure 112019034850611-pat00004
로 두었을 때, 시각적 의미 단어 벡터(visual-semantic vocabulary vector)
Figure 112019034850611-pat00005
를 아래의 수식과 같이 나타낼 수 있다.
[수학식 1]
Figure 112019034850611-pat00006
여기서
Figure 112019034850611-pat00007
는 단어의 가방에서 단어 i의 가중치이고,
Figure 112019034850611-pat00008
는 시각적 단어 벡터와 의미 단어 벡터간의 가중치를 조절하는 상수이다.
그리고 위치추정부(123)는 촬영된 영상의 프레임을 이용하여 현재 위치에서 촬영된 영상의 프레임이 이전에 방문한 지점인지를 식별하기 위해 프레임간 유사도를 계산할 수 있다.
이때, 위치추정부(123)는 현재 위치의 프레임과 유사도를 비교할 후보 키 프레임(key frame)을 선택할 수 있으며, 키 프레임의 시각적 의미 단어 벡터를 비교하여 현재 프레임과 비슷한 단어 분포를 가진 키 프레임을 유사도를 비교할 키 프레임으로 선택할 수 있다.
우선, 위치추정부(123)는 촬영된 영상의 모든 키 프레임 각각과 현재 위치의 프레임 f간 공통된 물체 레이블의 수를 카운팅할 수 있고, 프레임 f와의 공통된 레이블의 수가 0이 아니면, 키 프레임 k 를 제 1 후보프레임으로 설정할 수 있다.
그리고 위치추정부(123)는 제 1 후보프레임에 포함된 키 프레임 k 중 현재 위치의 프레임 f와 공통된 물체 레이블의 수를 기초로 기 설정된 비율의 키 프레임 k를 추출하여 제 2 후보프레임으로 설정할 수 있다.
예를 들어, 위치추정부(123)는 제 1 후보프레임에 포함된 키 프레임 k 에서 현재 위치의 프레임 f와 공통된 물체 레이블의 수를 기준으로 키 프레임 k를 제 2 후보프레임으로 설정할 수 있으며, 이를 수식으로 나타내면 아래와 같다.
[수학식 2]
Figure 112019034850611-pat00009
C1 : 제 1 후보프레임, C2 : 제 2 후보프레임
그리고 위치추정부(123)는 제 2 후보프레임에 속한 키 프레임 k의 이웃프레임
Figure 112019034850611-pat00010
로 설정하고, 이웃프레임
Figure 112019034850611-pat00011
에 속하는 키 프레임 k’ 중 현재 프레임 f와 유사한 프레임을 제 3 후보프레임으로 설정할 수 있다.
예를 들어, 위치추정부(123)는 이웃프레임
Figure 112019034850611-pat00012
에 속하는 프레임 k’에 대해 현재 프레임 f 에 속하는 시각적 의미 단어 벡터와 프레임 k’ 에 속하는 시각적 의미 단어 벡터간 동일여부를 L1_norm을 이용하여 계산하여 현재 프레임 f와 가장 유사한 프레임 k’을 제 3 후보프레임으로 설정할 수 있다.
이후, 위치추정부(123)는 제 3 후보프레임에 속한 키 프레임 중 현재 프레임 f와의 벡터와 유사한 프레임을 후보 키 프레임으로 설정할 수 있다.
이와 같이 위치추정부(123)가 현재 위치를 식별하기 위해 현재 프레임과 유사도를 비교할 후보프레임을 선택하는 알고리즘을 수도코드로 표시하면 아래와 같다.
Figure 112019034850611-pat00013
이와 같이 현재 프레임과 유사도를 비교할 후보 키 프레임을 시각적 단어 벡터를 이용하여 선택함으로써 기존에 지도상에 저장된 모든 키 프레임(key frame)에 대하여 현재 프레임과의 유사도를 비교하지 않아 계산량을 줄일 수 있다.
그리고 위치추정부(123)는 선택된 후보 키 프레임을 기준으로 현재 프레임과의 유사도를 계산할 수 있다.
즉, 위치추정부(123)는 현재 프레임과 선택된 후보 키 프레임 각각에서 추출된 특징점의 기술자의 시각적 의미 단어 벡터를 이용하여 기술자간 유사도를 계산함으로써 프레임간 유사도를 계산할 수 있다.
예를 들어, 위치추정부(123)는 해밍거리(Hamming distance) 방법을 이용하되, 두 기술자의 시각적 의미 단어 벡터에 포함된 물체 레이블이 다르면 패널티
Figure 112019034850611-pat00014
를 곱함으로써 기술자간 유사도를 아래의 수식에 따라 계산할 수 있다.
[수학식 3]
Figure 112019034850611-pat00015
그리고 위치추정부(123)는 현재 프레임과 후보 키 프레임간의 유사도를 기초로 현재 위치가 이전에 방문했던 지점인지 여부를 식별할 수 있다.
이를 통해, 프레임의 특징점이 위치한 영역의 물체를 인식하여 의미 정보를 포함한 시각적 의미 단어 벡터를 이용하여 프레임간의 유사여부를 식별함으로써 계산량을 줄이면서도 이전 방문 지점인지 여부를 정확하게 판단할 수 있다.
한편, 지도갱신부(124)는 촬영된 영상에 기초하여 지도를 생성하고, 현재 위치가 기 방문한 지점으로 식별되면 지도를 갱신할 수 있다.
예를 들어, 현재 위치에서 촬영된 영상의 프레임이 기 저장된 영상의 프레임과 유사하여 기 방문 지점으로 판단되면, 지도갱신부(124)는 지도상의 회귀점을 폐쇄하여 지도를 갱신할 수 있다.
통신부(130)는 다른 디바이스 또는 네트워크와 유무선 통신을 수행할 수 있다. 이를 위해, 통신부(130)는 다양한 유무선 통신 방법 중 적어도 하나를 지원하는 통신 모듈을 포함할 수 있다. 예를 들어, 통신 모듈은 칩셋(chipset)의 형태로 구현될 수 있다.
통신부(130)가 지원하는 무선 통신은, 예를 들어 Wi-Fi(Wireless Fidelity), Wi-Fi Direct, 블루투스(Bluetooth), UWB(Ultra Wide Band) 또는 NFC(Near Field Communication) 등일 수 있다. 또한, 통신부(130)가 지원하는 유선 통신은, 예를 들어 USB 또는 HDMI(High Definition Multimedia Interface) 등일 수 있다.
메모리(140)에는 파일, 어플리케이션 및 프로그램 등과 같은 다양한 종류의 데이터가 설치 및 저장될 수 있다. 제어부(120)는 메모리(140)에 저장된 데이터에 접근하여 이를 이용하거나, 또는 새로운 데이터를 메모리(140)에 저장할 수도 있다. 또한, 제어부(120)는 메모리(140)에 설치된 프로그램을 실행할 수도 있다.
이러한 메모리(140)는 입출력부(110)에 의해 촬영된 영상을 저장할 수 있다.
도 2 는 일 실시예에 따른 영상특징점강화방법을 설명하기 위한 순서도이다.
도 2 에 도시된 실시예에 따른 영상특징점강화방법은 도 1 에 도시된 영상특징점강화장치(10)에서 시계열적으로 처리되는 단계들을 포함한다. 따라서, 이하에서 생략된 내용이라고 하더라도 도 1 에 도시된 영상특징점강화장치(10)에 관하여 이상에서 기술한 내용은 도 2 에 도시된 실시예에 따른 영상특징점강화방법에도 적용될 수 있다.
우선, 영상특징점강화장치(10)는 카메라센서를 통해 영상을 획득할 수 있고, 획득된 영상으로부터 특징점을 추출할 수 있다(S2001).
예를 들어, 영상특징점강화장치(10)는 영상을 구성하는 각 프레임 내에서 주변의 지점과 밝기 등의 차이가 있는 지점을 특징점으로 추출할 수 있다.
그리고 영상특징점강화장치(10)는 추출된 특징점의 특성에 대한 정보를 포함하는 기술자의 분포를 기록한 시각적 단어 벡터를 생성할 수 있다(S2002).
예를 들어, 영상특징점강화장치(10)는 기술자를 K-means 클러스터링하여 단어의 가방(Bag of words) 개념의 시각적 단어(visual vocabulary)를 생성할 수 있다. 그리고 영상특징점강화장치(10)는 프레임 상의 특징점에 대응되는 기술자를 시각적 단어에 매칭할 수 있고, 매칭된 시각적 단어에 대응되는 값으로 시각적 단어 벡터를 생성하여 프레임의 특성을 저장할 수 있다.
그리고 영상특징점강화장치(10)는 프레임에서 특징점 영역에 위치한 물체를 인식하고, 인식된 물체에 대한 레이블인 의미정보를 시각적 단어 벡터에 추가하여 시각적 의미 단어 벡터를 생성할 수 있다(S2003).
예를 들어, 영상특징점강화장치(10)는 특징점을 기준으로 기 설정된 반경 내에 위치한 물체를 인식할 수 있고, 기 저장된 레이블 중 인식된 물체에 대응되는 레이블을 의미정보로 설정할 수 있다. 그리고 영상특징점강화장치(10)는 물체가 위치한 영역의 특징점에 대한 기술자의 마지막 값으로 물체 레이블을 포함시킴으로써 시각적 단어 벡터에 의미정보가 포함된 시각적 의미 단어 벡터를 생성할 수 있다.
이후, 영상특징점강화장치(10)는 현재 위치가 기 방문한 위치인지 여부를 식별하기 위해 시각적 의미 단어 벡터를 기초로 현재 프레임과 기 저장된 영상에 포함된 프레임의 유사도를 계산할 수 있으며, 이를 위해, 영상특징점강화장치(10)는 현재 프레임과의 유사도를 계산할 후보 키 프레임을 결정할 수 있다(S2004).
도 3 은 후보 키 프레임을 결정하는 순서를 도시한 순서도이다. 도 3 을 참조하면, 영상특징점강화장치(10)는 현재 프레임의 물체 레이블에 기초하여 기 저장된 영상의 키 프레임에서 제 1 후보프레임을 설정할 수 있다(S3001).
예를 들어, 영상특징점강화장치(10)는 기 저장된 영상의 키 프레임 중 현재 프레임에 포함된 물체 레이블과 동일한 적어도 하나의 물체 레이블을 포함하고 있는 프레임을 제 1 후보프레임으로 설정할 수 있다.
그리고 영상특징점강화장치(10)는 제 1 후보프레임 중 현재 프레임의 물체 레이블과 동일한 물체 레이블을 포함하는 수가 기 설정된 수를 초과하는 프레임을 제 2 후보프레임으로 설정할 수 있다(S3002).
예를 들어, 영상특징점강화장치(10)는 현재 프레임의 물체 레이블과 동일한 물체 레이블의 포함 개수를 기준으로 제 1 후보프레임에서 상위 20% 내에 속하는 제 1 후보프레임을 제 2 후보프레임으로 설정할 수 있다.
이후, 영상특징점강화장치(10)는 제 2 후보프레임의 이웃 프레임 중 현재 프레임 각각의 시각적 단어 벡터의 크기를 기초로 현재 프레임과 유사한 제 2 후보프레임의 이웃 프레임을 제 3 후보프레임으로 설정할 수 있다(S3003).
예를 들어, 영상특징점강화장치(10)는 제 2 후보프레임의 이웃프레임과 현재 프레임간 L1_Norm 값인 벡터크기가 가장 큰 이웃 프레임을 제 3 후보프레임으로 설정할 수 있다.
그리고 영상특징점강화장치(10)는 제 3 후보프레임으로부터 현재 프레임과 시각적 의미 단어 벡터의 크기를 이용하여 최종적으로 후보 키 프레임을 설정할 수 있다(S3004).
예를 들어, 영상특징점강화장치(10)는 현재 프레임과 이웃 프레임의 L1_Norm 값을 기초로 제 3 후보프레임을 정렬할 수 있고, 현재 프레임과의 시각적 의미 단어 벡터의 크기가 기 설정된 값을 초과하는 제 3 후보프레임을 후보 키 프레임을 선택할 수 있다.
이후, 영상특징점강화장치(10)는 결정된 후보 키 프레임과 현재 위치의 프레임 각각의 시각적 의미 단어 벡터를 구성하는 값의 차이를 기초로 유사도를 계산하여 현재 위치가 기 방문한 지점인지 식별할 수 있다(S2005).
예를 들어, 영상특징점강화장치(10)는 현재 프레임의 시각적 의미 단어 벡터와 후보 키 프레임의 시각적 의미 단어 벡터간의 해밍거리(Hamming distance)를 계산하여 현재 프레임과 후보 키 프레임간의 유사도를 계산할 수 있다.
그리고 현재 위치가 상기 기 방문한 지점으로 식별되면, 영상특징점강화장치(10)는 영상을 기초로 생성된 지도를 갱신할 수 있다(S2006).
예를 들어, 영상특징점강화장치(10)는 촬영된 영상을 기초로 지도를 생성할 수 있고, S2005단계에서 현재 위치가 기 방문한 위치인지 여부에 따라 회귀점을 검출할 수 있고, 회귀점을 폐쇄하여 지도를 갱신할 수 있다.
이상의 실시예들에서 사용되는 '~부'라는 용어는 소프트웨어 또는 FPGA(field programmable gate array) 또는 ASIC 와 같은 하드웨어 구성요소를 의미하며, '~부'는 어떤 역할들을 수행한다. 그렇지만 '~부'는 소프트웨어 또는 하드웨어에 한정되는 의미는 아니다. '~부'는 어드레싱할 수 있는 저장 매체에 있도록 구성될 수도 있고 하나 또는 그 이상의 프로세서들을 재생시키도록 구성될 수도 있다. 따라서, 일 예로서 '~부'는 소프트웨어 구성요소들, 객체지향 소프트웨어 구성요소들, 클래스 구성요소들 및 태스크 구성요소들과 같은 구성요소들과, 프로세스들, 함수들, 속성들, 프로시저들, 서브루틴들, 프로그램특허 코드의 세그먼트들, 드라이버들, 펌웨어, 마이크로코드, 회로, 데이터, 데이터베이스, 데이터 구조들, 테이블들, 어레이들, 및 변수들을 포함한다.
구성요소들과 '~부'들 안에서 제공되는 기능은 더 작은 수의 구성요소들 및 '~부'들로 결합되거나 추가적인 구성요소들과 '~부'들로부터 분리될 수 있다.
뿐만 아니라, 구성요소들 및 '~부'들은 디바이스 또는 보안 멀티미디어카드 내의 하나 또는 그 이상의 CPU 들을 재생시키도록 구현될 수도 있다.
도 2 및 도 3 을 통해 설명된 실시예에 따른 영상특징점강화방법은 컴퓨터에 의해 실행 가능한 명령어 및 데이터를 저장하는, 컴퓨터로 판독 가능한 매체의 형태로도 구현될 수 있다. 이때, 명령어 및 데이터는 프로그램 코드의 형태로 저장될 수 있으며, 프로세서에 의해 실행되었을 때, 소정의 프로그램 모듈을 생성하여 소정의 동작을 수행할 수 있다. 또한, 컴퓨터로 판독 가능한 매체는 컴퓨터에 의해 액세스될 수 있는 임의의 가용 매체일 수 있고, 휘발성 및 비휘발성 매체, 분리형 및 비분리형 매체를 모두 포함한다. 또한, 컴퓨터로 판독 가능한 매체는 컴퓨터 기록 매체일 수 있는데, 컴퓨터 기록 매체는 컴퓨터 판독 가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보의 저장을 위한 임의의 방법 또는 기술로 구현된 휘발성 및 비휘발성, 분리형 및 비분리형 매체를 모두 포함할 수 있다.예를 들어, 컴퓨터 기록 매체는 HDD 및 SSD 등과 같은 마그네틱 저장 매체, CD, DVD 및 블루레이 디스크 등과 같은 광학적 기록 매체, 또는 네트워크를 통해 접근 가능한 서버에 포함되는 메모리일 수 있다.
또한 도 2 및 도 3 을 통해 설명된 실시예에 따른 영상특징점강화방법은 컴퓨터에 의해 실행 가능한 명령어를 포함하는 컴퓨터 프로그램(또는 컴퓨터 프로그램 제품)으로 구현될 수도 있다. 컴퓨터 프로그램은 프로세서에 의해 처리되는 프로그래밍 가능한 기계 명령어를 포함하고, 고레벨 프로그래밍 언어(High-level Programming Language), 객체 지향 프로그래밍 언어(Object-oriented Programming Language), 어셈블리 언어 또는 기계 언어 등으로 구현될 수 있다. 또한 컴퓨터 프로그램은 유형의 컴퓨터 판독가능 기록매체(예를 들어, 메모리, 하드디스크, 자기/광학 매체 또는 SSD(Solid-State Drive) 등)에 기록될 수 있다.
따라서 도 2 및 도 3 을 통해 설명된 실시예에 따른 영상특징점강화방법은 상술한 바와 같은 컴퓨터 프로그램이 컴퓨팅 장치에 의해 실행됨으로써 구현될 수 있다. 컴퓨팅 장치는 프로세서와, 메모리와, 저장 장치와, 메모리 및 고속 확장포트에 접속하고 있는 고속 인터페이스와, 저속 버스와 저장 장치에 접속하고 있는 저속 인터페이스 중 적어도 일부를 포함할 수 있다. 이러한 성분들 각각은 다양한 버스를 이용하여 서로 접속되어 있으며, 공통 머더보드에 탑재되거나 다른 적절한 방식으로 장착될 수 있다.
여기서 프로세서는 컴퓨팅 장치 내에서 명령어를 처리할 수 있는데, 이런 명령어로는, 예컨대 고속 인터페이스에 접속된 디스플레이처럼 외부 입력, 출력 장치상에 GUI(Graphic User Interface)를 제공하기 위한 그래픽 정보를 표시하기 위해 메모리나 저장 장치에 저장된 명령어를 들 수 있다. 다른 실시예로서, 다수의 프로세서 및(또는) 다수의 버스가 적절히 다수의 메모리 및 메모리 형태와 함께 이용될 수 있다. 또한 프로세서는 독립적인 다수의 아날로그 및(또는) 디지털 프로세서를 포함하는 칩들이 이루는 칩셋으로 구현될 수 있다.
또한 메모리는 컴퓨팅 장치 내에서 정보를 저장한다. 일례로, 메모리는 휘발성 메모리 유닛 또는 그들의 집합으로 구성될 수 있다. 다른 예로, 메모리는 비휘발성 메모리 유닛 또는 그들의 집합으로 구성될 수 있다. 또한 메모리는 예컨대, 자기 혹은 광 디스크와 같이 다른 형태의 컴퓨터 판독 가능한 매체일 수도 있다.
그리고 저장장치는 컴퓨팅 장치에게 대용량의 저장공간을 제공할 수 있다. 저장 장치는 컴퓨터 판독 가능한 매체이거나 이런 매체를 포함하는 구성일 수 있으며, 예를 들어 SAN(Storage Area Network) 내의 장치들이나 다른 구성도 포함할 수 있고, 플로피 디스크 장치, 하드 디스크 장치, 광 디스크 장치, 혹은 테이프 장치, 플래시 메모리, 그와 유사한 다른 반도체 메모리 장치 혹은 장치 어레이일 수 있다.
상술된 실시예들은 예시를 위한 것이며, 상술된 실시예들이 속하는 기술분야의 통상의 지식을 가진 자는 상술된 실시예들이 갖는 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 상술된 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.
본 명세서를 통해 보호 받고자 하는 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태를 포함하는 것으로 해석되어야 한다.
10: 영상특징점강화장치
110: 입출력부
120: 제어부
121: 시각적특징처리부 122: 의미적특징처리부
123: 위치추정부 124: 지도갱신부
130: 통신부
140: 메모리

Claims (16)

  1. SLAM에서 영상의 특징점을 강화하는 장치에 있어서,
    카메라를 통해 획득된 영상을 구성하는 프레임으로부터 특징점을 추출하고, 추출된 특징점의 특성에 대한 정보를 포함하는 기술자(descriptor)의 분포를 기록한 시각적 단어 벡터를 생성하는 시각적특징처리부;
    상기 프레임으로부터 상기 특징점 영역에 위치한 물체를 인식하고, 인식된 물체에 대한 의미정보를 추출하는 의미적특징처리부; 및
    상기 시각적 단어 벡터에 상기 의미정보가 추가된 시각적 의미 단어 벡터를 기초로 현재 위치가 기 방문한 지점인지 식별하는 위치추정부를 포함하며,
    상기 위치추정부는 상기 물체의 레이블 및 상기 시각적 의미 단어 벡터를 이용하여 기 저장된 영상의 키 프레임 중 후보 키 프레임을 결정하고, 상기 후보 키 프레임과 현재 위치의 프레임 간 유사도를 계산하여 현재 위치가 기 방문한 지점인지 식별하는, 영상특징점강화장치.
  2. 제 1 항에 있어서,
    상기 의미적특징처리부는,
    기 저장된 레이블에서 상기 인식된 물체에 대응되는 레이블을 의미정보로써 설정하고, 상기 프레임 내의 물체 레이블의 분포를 상기 시각적 단어 벡터에 추가하여 상기 시각적 의미 단어 벡터를 생성하는, 영상특징점강화장치.
  3. 삭제
  4. 제 1 항에 있어서,
    상기 위치추정부는,
    상기 현재 위치의 프레임에 포함된 물체의 레이블을 이용하여 상기 기 저장된 영상의 키 프레임 중 유사도를 계산할 후보프레임을 추출하는, 영상특징점강화장치.
  5. 제 4 항에 있어서,
    상기 위치추정부는,
    추출된 후보프레임 중 상기 현재 위치의 프레임의 시각적 의미 단어 벡터와의 유사도에 기초하여 후보 키 프레임을 결정하는, 영상특징점강화장치.
  6. 제 5 항에 있어서,
    상기 위치추정부는,
    상기 결정된 후보 키 프레임과 상기 현재 위치의 프레임 각각의 시각적 의미 단어 벡터를 구성하는 값의 차이를 기초로 유사도를 계산하여 현재 위치가 기 방문한 지점인지 식별하는, 영상특징점강화장치.
  7. 제 6 항에 있어서,
    상기 영상특징점강화장치는,
    상기 현재 위치가 상기 기 방문한 지점으로 식별되면, 상기 영상을 기초로 생성된 지도를 갱신하는 지도갱신부를 더 포함하는, 영상특징점강화장치.
  8. 영상특징점강화장치가 SLAM에서 영상의 특징점을 강화하는 방법에 있어서,
    카메라를 통해 획득된 영상을 구성하는 프레임으로부터 특징점을 추출하고, 추출된 특징점의 특성에 대한 정보를 포함하는 기술자의 분포를 기록한 시각적 단어 벡터를 생성하는 단계;
    상기 프레임으로부터 상기 특징점 영역에 위치한 물체를 인식하고, 인식된 물체에 대한 의미정보를 추출하는 단계; 및
    상기 시각적 단어 벡터에 상기 의미정보가 추가된 시각적 의미 단어 벡터를 기초로 현재 위치가 기 방문한 지점인지 식별하는 단계를 포함하며,
    상기 현재 위치가 기 방문한 지점인지 식별하는 단계는,
    상기 물체의 레이블 및 상기 시각적 의미 단어 벡터를 이용하여 기 저장된 영상의 키 프레임 중 후보 키 프레임을 결정하는 단계; 및
    상기 후보 키 프레임과 현재 위치의 프레임 간 유사도를 계산하여 현재 위치가 기 방문한 지점인지 식별하는 단계를 포함하는, 영상특징점강화방법.
  9. 제 8 항에 있어서,
    상기 의미정보를 추출하는 단계는,
    기 저장된 레이블에서 상기 인식된 물체에 대응되는 레이블을 의미정보로써 설정하는 단계; 및
    상기 프레임 내의 물체 레이블의 분포를 상기 시각적 단어 벡터에 추가하여 상기 시각적 의미 단어 벡터를 생성하는 단계를 포함하는, 영상특징점강화방법.
  10. 삭제
  11. 제 8 항에 있어서,
    상기 후보 키 프레임을 결정하는 단계는,
    상기 현재 위치의 프레임에 포함된 물체의 레이블을 이용하여 상기 기 저장된 영상의 키 프레임 중 유사도를 계산할 후보프레임을 추출하는 단계; 및
    상기 추출된 후보프레임 중 상기 현재 위치의 프레임의 시각적 의미 단어 벡터와의 유사도에 기초하여 후보 키 프레임을 결정하는 단계를 포함하는, 영상특징점강화방법.
  12. 삭제
  13. 제 11 항에 있어서,
    상기 유사도를 계산하여 현재 위치가 기 방문한 지점인지 식별하는 단계는,
    상기 결정된 후보 키 프레임과 상기 현재 위치의 프레임 각각의 시각적 의미 단어 벡터를 구성하는 값의 차이를 기초로 유사도를 계산하여 현재 위치가 기 방문한 지점인지 식별하는 것을 특징으로 하는, 영상특징점강화방법.
  14. 제 13 항에 있어서,
    상기 영상특징점강화방법은,
    상기 현재 위치가 상기 기 방문한 지점으로 식별되면, 상기 영상을 기초로 생성된 지도를 갱신하는 단계를 더 포함하는, 영상특징점강화방법.
  15. 제 8 항에 기재된 방법을 수행하는 프로그램이 기록된 컴퓨터 판독 가능한 기록 매체.
  16. 영상특징점강화장치에 의해 수행되며, 제 8 항에 기재된 방법을 수행하기 위해 기록매체에 저장된 컴퓨터 프로그램.
KR1020190039736A 2018-11-28 2019-04-04 물체 레이블을 활용한 Visual SLAM에서의 영상 특징점 강화 방법 및 장치 KR102285427B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
PCT/KR2019/016641 WO2020111844A2 (ko) 2018-11-28 2019-11-28 물체 레이블을 활용한 비주얼 슬램에서의 영상 특징점 강화 방법 및 장치

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020180149674 2018-11-28
KR20180149674 2018-11-28

Publications (2)

Publication Number Publication Date
KR20200063949A KR20200063949A (ko) 2020-06-05
KR102285427B1 true KR102285427B1 (ko) 2021-08-03

Family

ID=71089287

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190039736A KR102285427B1 (ko) 2018-11-28 2019-04-04 물체 레이블을 활용한 Visual SLAM에서의 영상 특징점 강화 방법 및 장치

Country Status (1)

Country Link
KR (1) KR102285427B1 (ko)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101708659B1 (ko) * 2014-06-17 2017-02-22 주식회사 유진로봇 이동 로봇의 맵을 업데이트하기 위한 장치 및 그 방법

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101976424B1 (ko) * 2017-01-25 2019-05-09 엘지전자 주식회사 이동 로봇

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101708659B1 (ko) * 2014-06-17 2017-02-22 주식회사 유진로봇 이동 로봇의 맵을 업데이트하기 위한 장치 및 그 방법

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Jing Zhang et al., Multilabel Image Annotation Based on Double-Layer PLSA Model, The Scientific World Journal Vol. 2014, Article ID 494387, 9 pages, http://dx.doi.org/10.1155/2014/494387, 4 June 2014*

Also Published As

Publication number Publication date
KR20200063949A (ko) 2020-06-05

Similar Documents

Publication Publication Date Title
US10824916B2 (en) Weakly supervised learning for classifying images
US9710698B2 (en) Method, apparatus and computer program product for human-face features extraction
US10789622B2 (en) Generating and providing augmented reality representations of recommended products based on style compatibility in relation to real-world surroundings
Roy et al. Deep learning based hand detection in cluttered environment using skin segmentation
US9665962B2 (en) Image distractor detection and processng
US9305240B2 (en) Motion aligned distance calculations for image comparisons
WO2011061709A1 (en) Method and apparatus for tracking and recognition with rotation invariant feature descriptors
US10217221B2 (en) Place recognition algorithm
US20150269441A1 (en) Context-aware tracking of a video object using a sparse representation framework
KR101986307B1 (ko) 시각 대화를 통해 객체의 위치를 알아내기 위한 주의 기억 방법 및 시스템
US20180082428A1 (en) Use of motion information in video data to track fast moving objects
US10204284B2 (en) Object recognition utilizing feature alignment
KR102108460B1 (ko) 상품 벡터를 이용한 상품 분류 방법 및 장치
WO2018082308A1 (zh) 一种图像处理方法及终端
CN110427915B (zh) 用于输出信息的方法和装置
Choi et al. Sparse seam-carving for structure preserving image retargeting
WO2020111844A2 (ko) 물체 레이블을 활용한 비주얼 슬램에서의 영상 특징점 강화 방법 및 장치
KR102285427B1 (ko) 물체 레이블을 활용한 Visual SLAM에서의 영상 특징점 강화 방법 및 장치
CN116129228B (zh) 图像匹配模型的训练方法、图像匹配方法及其装置
Hastürk et al. DUDMap: 3D RGB-D mapping for dense, unstructured, and dynamic environment
US9697608B1 (en) Approaches for scene-based object tracking
KR102082430B1 (ko) 의약품 검색을 위한 낱알 식별 장치 및 낱알 식별 방법
Kostusiak The comparison of keypoint detectors and descriptors for registration of RGB-D data
KR102275585B1 (ko) 기계학습을 이용한 이미지코드를 인식하는 장치 및 방법
US20190347510A1 (en) Systems and Methods for Performing Facial Alignment for Facial Feature Detection

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant