WO2024071516A1

WO2024071516A1 - 객체 고정이 가능한 객체 트래킹 제공 방법 및 그를 위한 휴대 단말

Info

Publication number: WO2024071516A1
Application number: PCT/KR2022/019010
Authority: WO
Inventors: 김켄; 정지욱
Original assignee: 주식회사 쓰리아이
Priority date: 2022-09-30
Filing date: 2022-11-29
Publication date: 2024-04-04

Abstract

본 발명의 일 기술적 측면에 따른 객체 고정이 가능한 트래킹 제공 방법은, 휴대 단말에서 수행되며, 휴대 단말의 전방에 대하여 촬영된 촬영 영상에 대한 객체 트래킹 기능을 제공하는 방법으로서, 추적 객체를 설정하는 단계, 제1 인공지능 모델을 이용하여, 상기 촬영 영상의 프레임 이미지 내에 존재하는 객체-상기 객체는 상기 추적 객체와 동일한 종류임-를 식별하여 탐색 객체를 설정하는 단계 및 상기 제1 인공지능 모델과 다른 방식으로 트레이닝 된 제2 인공지능 모델을 이용하여, 상기 제1 인공지능 모델에 의해 설정된 상기 탐색 객체와 상기 추적 객체가 동일한 객체인지 판단하는 단계를 포함한다.

Description

객체 고정이 가능한 객체 트래킹 제공 방법 및 그를 위한 휴대 단말

본 발명은 객체 고정이 가능한 객체 트래킹 제공 방법 및 그를 위한 휴대 단말에 관한 것이다.

휴대 단말의 발전에 따라 휴대 단말의 소형화 및 휴대성이 증진되고 있으며, 사용자에게 보다 친화적인 컴퓨팅 환경이 개발되고 있다.

이러한 컴퓨팅 환경에서 사용자의 주요 관심으로서, 촬영 중인 영상에서 관심의 대상이 되는 추적 객체에 대한 트래킹 기능이 있다.

종래의 경우, 객체 트래킹을 위해서는, 객체를 식별하여 카메라의 지향 방향을 객체의 이동에 따라 변경시켜주는 별도의 장치가 필요하다. 이러한 종래 기술의 예로서, 한국공개특허 제10-2020-0001419호 등이 있다.

그러나, 이러한 종래 기술의 경우에는, 여러 사람이 동시에 하나의 화면 안에 들어오는 경우 또는 트래킹 대상이 되는 일시적으로 화면 밖에 나가는 등의 경우에서, 트래킹 대상이 되는 사람 객체가 변동되는 한계가 있으며, 그에 따라 실질적으로 객체 트래킹이 실패되는 문제가 발생한다.

본 출원의 일 기술적 측면은 상기한 종래 기술의 문제점을 해결하기 위한 것으로, 본 출원에 개시되는 일 실시예에 따르면, 각각 개별 학습된 딥 러닝된 객체 인식 모델과 딥 러닝된 객체 식별 모델을 이용하여, 객체의 식별 및 동일성의 판단을 보다 빠르고 정확하게 수행하여 트래킹을 보다 효과적으로 제공하는 것을 목적으로 한다.

본 출원에 개시되는 일 실시예에 따르면, 객체 식별 모델에서 도출된 객체 식별자에 대한 유사도 비교를 기초로 동일 객체를 판단하므로, 보다 빠르고 적은 리소스로 객체 동일성 판을 수행하는 것을 목적으로 한다.

본 출원의 과제들은 이상에서 언급한 과제들로 제한되지 않으며, 언급되지 않은 또 다른 과제들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.

본 출원의 일 기술적 측면은 객체 고정이 가능한 트래킹 제공 방법을 제안한다. 상기 객체 고정이 가능한 트래킹 제공 방법은, 휴대 단말에서 수행되며, 휴대 단말의 전방에 대하여 촬영된 촬영 영상에 대한 객체 트래킹 기능을 제공하는 방법으로서, 추적 객체를 설정하는 단계, 제1 인공지능 모델을 이용하여, 상기 촬영 영상의 프레임 이미지 내에 존재하는 객체-상기 객체는 상기 추적 객체와 동일한 종류임-를 식별하여 탐색 객체를 설정하는 단계 및 상기 제1 인공지능 모델과 다른 방식으로 트레이닝 된 제2 인공지능 모델을 이용하여, 상기 제1 인공지능 모델에 의해 설정된 상기 탐색 객체와 상기 추적 객체가 동일한 객체인지 판단하는 단계를 포함한다.

본 출원의 다른 일 기술적 측면은 휴대 단말을 제안한다. 상기 휴대 단말은, 하나 이상의 인스트럭션을 저장하는 메모리 및 상기 메모리에 저장된 상기 하나 이상의 인스트럭션을 실행하는 적어도 하나의 프로세서를 포함한다. 상기 적어도 하나의 프로세서는, 상기 하나 이상의 인스트럭션을 실행함으로써, 상기 카메라 모듈로부터 제1 해상도로 촬영된 탐색 프레임 이미지를 제공받고, 추적 객체를 설정하고, 제1 인공지능 모델을 이용하여, 상기 촬영 영상의 프레임 이미지 내에 존재하는 객체를 식별하여 탐색 객체를 설정하고, 상기 제1 인공지능 모델과 다른 방식으로 트레이닝 된 제2 인공지능 모델을 이용하여, 상기 제1 인공지능 모델에 의해 설정된 상기 탐색 객체와 상기 추적 객체가 동일한 객체인지 판단한다.

본 출원의 다른 일 기술적 측면은 저장 매체를 제안한다. 상기 저장 매체는, 컴퓨터 판독 가능한 인스트럭션들(instructions)을 저장하고 있는 저장 매체이다. 상기 인스트럭션들은, 휴대 단말에 의해 실행될 때, 상기 휴대 단말로 하여금, 추적 객체를 설정하는 동작, 제1 인공지능 모델을 이용하여, 상기 촬영 영상의 프레임 이미지 내에 존재하는 객체-상기 객체는 상기 추적 객체와 동일한 종류임-를 식별하여 탐색 객체를 설정하는 동작 및 상기 제1 인공지능 모델과 다른 방식으로 트레이닝 된 제2 인공지능 모델을 이용하여, 상기 제1 인공지능 모델에 의해 설정된 상기 탐색 객체와 상기 추적 객체가 동일한 객체인지 판단하는 동작; 을 수행하도록 한다.

상기한 과제의 해결 수단은, 본 출원의 특징을 모두 열거한 것은 아니다. 본 출원의 과제 해결을 위한 다양한 수단들은 이하의 상세한 설명의 구체적인 실시형태를 참조하여 보다 상세하게 이해될 수 있을 것이다.

본 출원에 개시되는 일 실시예에 따르면, 각각 개별 학습된 딥 러닝된 객체 인식 모델과 딥 러닝된 객체 식별 모델을 이용하여, 객체의 식별 및 동일성의 판단을 보다 빠르고 정확하게 수행하여 트래킹을 보다 효과적으로 제공할 수 있는 효과가 있다.

본 출원에 개시되는 일 실시예에 따르면, 객체 식별 모델에서 도출된 객체 식별자에 대한 유사도 비교를 기초로 동일 객체를 판단하므로, 보다 빠르고 적은 리소스로 객체 동일성 판을 수행할 수 있는 효과가 있다.

도 1은 본 출원의 일 실시예에 따른 객체 고정이 가능한 객체 트래킹 기술을 설명하는 도면이다.

도 2는 본 출원의 일 실시예에 따른 휴대 단말의 예시적인 컴퓨팅 환경을 설명하는 도면이다.

도 3은 본 출원의 일 실시예에 따른 객체 고정이 가능한 객체 트래킹 제공 방법을 설명하는 순서도이다.

도 4는 본 출원의 일 실시예에 따른 객체 고정이 가능한 객체 트래킹 제공 방법을 설명하는 도면이다.

도 5 내지 도 7은 도 3에 도시된 객체 고정이 가능한 객체 트래킹 제공 방법을 설명하기 위한 도면이다.

도 8은 본 출원의 일 실시예에 따른 추적 객체를 설정하는 일 실시예를 설명하는 순서도이다.

도 9은 본 출원의 일 실시예에 따른 탐색 객체를 설정하는 일 실시예를 설명하는 순서도이다.

도 10은 본 출원의 일 실시예에 따른 탐색 객체와 추적 객체의 동일성을 판단하는 일 실시예를 설명하는 순서도이다.

도 11은 본 출원의 일 실시예에 따른 단말기 거치대를 설명하는 블록 구성도이다.

도 12는 본 출원의 일 실시예에 따른 단말기 거치대를 이용한 추적 객체 트래킹 방법을 설명하는 도면이다.

도 13은 본 출원의 일 실시예에 따른 소프트웨어 기반의 트래킹 방법을 설명하는 도면이다.

도 14는 본 출원의 일 실시예에 따른 뷰잉 윈도우의 설정에 대한 일 실시예를 설명하는 도면이다.

도 15 및 도 16은 소프트웨어 트래킹을 설명하는 도면이다.

이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시 형태들을 설명한다.

그러나, 본 발명의 실시형태는 여러 가지 다른 형태로 변형될 수 있으며, 본 발명의 범위가 이하 설명하는 실시 형태로 한정되는 것은 아니다. 또한, 본 발명의 실시형태는 당해 기술분야에서 평균적인 지식을 가진 자에게 본 발명을 더욱 완전하게 설명하기 위해서 제공되는 것이다.

즉, 전술한 목적, 특징 및 장점은 첨부된 도면을 참조하여 상세하게 후술되며, 이에 따라 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명의 기술적 사상을 용이하게 실시할 수 있을 것이다. 본 발명을 설명함에 있어서 본 발명과 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 상세한 설명을 생략한다. 이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 실시예를 상세히 설명하기로 한다. 도면에서 동일한 참조부호는 동일 또는 유사한 구성요소를 가리키는 것으로 사용된다.

또한, 본 명세서에서 사용되는 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "구성된다" 또는 "포함한다" 등의 용어는 명세서 상에 기재된 여러 구성 요소들, 또는 여러 단계들을 반드시 모두 포함하는 것으로 해석되지 않아야 하며, 그 중 일부 구성 요소들 또는 일부 단계들은 포함되지 않을 수도 있고, 또는 추가적인 구성 요소 또는 단계들을 더 포함할 수 있는 것으로 해석되어야 한다.

또한, 이하에서 본 발명에 따른 시스템을 설명하기 위하여 다양한 구성요소 및 그의 하부 구성요소에 대하여 설명하고 있다. 이러한 구성요소 및 그의 하부 구성요소들은, 하드웨어, 소프트웨어 또는 이들의 조합 등 다양한 형태로서 구현될 수 있다. 예컨대, 각 요소들은 해당 기능을 수행하기 위한 전자적 구성으로 구현되거나, 또는 전자적 시스템에서 구동 가능한 소프트웨어 자체이거나 그러한 소프트웨어의 일 기능적인 요소로 구현될 수 있다. 또는, 전자적 구성과 그에 대응되는 구동 소프트웨어로 구현될 수 있다.

본 명세서에 설명된 다양한 기법은 하드웨어 또는 소프트웨어와 함께 구현되거나, 적합한 경우에 이들 모두의 조합과 함께 구현될 수 있다. 본 명세서에 사용된 바와 같은 "부(Unit)", "서버(Server)" 및 "시스템(System)" 등의 용어는 마찬가지로 컴퓨터 관련 엔티티(Entity), 즉 하드웨어, 하드웨어 및 소프트웨어의 조합, 소프트웨어 또는 실행 시의 소프트웨어와 등가로 취급할 수 있다. 또한, 본 발명의 시스템에서 실행되는 각 기능은 모듈단위로 구성될 수 있고, 하나의 물리적 메모리에 기록되거나, 둘 이상의 메모리 및 기록매체 사이에 분산되어 기록될 수 있다.

본 출원의 다양한 실시 예들은 기기(machine)-예를 들어, 휴대 단말(100)이나 휴대 단말(300)-에 의해 읽을 수 있는 저장 매체(storage medium)에 저장된 하나 이상의 명령어들을 포함하는 소프트웨어(예를 들어, 프로그램)로서 구현될 수 있다. 예를 들면, 프로세서(301)는, 저장 매체로부터 저장된 하나 이상의 명령어들 중 적어도 하나의 명령을 호출하고, 그것을 실행할 수 있다. 이것은 장치가 상기 호출된 적어도 하나의 명령어에 따라 적어도 하나의 기능을 수행하도록 운영되는 것을 가능하게 한다. 상기 하나 이상의 명령어들은 컴파일러에 의해 생성된 코드 또는 인터프리터에 의해 실행될 수 있는 코드를 포함할 수 있다. 기기로 읽을 수 있는 저장매체는, 비일시적(non-transitory) 저장매체의 형태로 제공될 수 있다. 여기서, '비일시적'은 저장매체가 실재(tangible)하는 장치이고, 신호(signal)(예를 들어, 전자기파)를 포함하지 않는다는 것을 의미할 뿐이며, 이 용어는 데이터가 저장매체에 반영구적으로 저장되는 경우와 임시적으로 저장되는 경우를 구분하지 않는다.

본 발명의 실시형태를 설명하기 위하여 다양한 순서도가 개시되고 있으나, 이는 각 단계의 설명의 편의를 위한 것으로, 반드시 순서도의 순서에 따라 각 단계가 수행되는 것은 아니다. 즉, 순서도에서의 각 단계는, 서로 동시에 수행되거나, 순서도에 따른 순서대로 수행되거나, 또는 순서도에서의 순서와 반대의 순서로도 수행될 수 있다.

도 1을 참조하면, 휴대 단말(100)은 전방 방향으로 촬영 영상을 촬영하고, 이러한 촬영 영상에서 객체를 식별한다. 휴대 단말(100)은 식별된 객체가 촬영 영상 내에서 위치되도록 트래킹을 수행한다.

휴대 단말(100)은 촬영 영상 내의 다양한 탐색 객체 중에서, 추적 객체를 식별하고 추적 객체만을 트래킹 할 수 있다. 인공지능 모델을 이용하여 객체를 식별하는 경우, 객체 식별의 속도가 빠르고 정확한 점에서 장점이 있으나, 각 객체를 특정하지 않고 식별하는 점에서 단독 객체만을 추적하는 것은 어려움이 있다. 예컨대, 사람 객체를 추적하는 경우, 사람 객체를 탐색하는 인공지능 모델만을 사용하는 경우, 여러 사람이 나타나거나 사람이 잠시 화면에서 나가는 등의 상황이 발생할 때, 추적하던 사람이 변동되는 문제가 발생한다. 본 출원의 일 실시예에서는, 서로 다르게 트레이닝 된 인공지능 모델들을 이용함으로써, 탐색된 객체들을 추적 객체와 동일성 여부를 판단할 수 있으며, 이에 따라 추적 객체만을 트래킹하도록 할 수 있다.

트래킹의 실시는 다양하게 구현 가능하다.

일 예로, 도 1에 도시된 예와 같이, 휴대 단말(100)이 단말기 거치대(200)의 구동을 제어하여 휴대 단말(100)의 전방이 객체를 지행하도록 제어함으로써 트래킹을 실시할 수 있다.

다른 예로, 도 13 이하를 참조하여 후술하는 바와 같이, 휴대 단말(100)의 촬영 해상도 보다 낮은 해상도로 설정된 표시용 윈도우(뷰잉 윈도우라 칭함)를 촬영 영상에서 부분적으로 변경하여 설정함으로써, 소프트웨어 기반으로 사용자에게 마치 트래킹이 일어나는 것과 동일하게 트래킹 기능을 제공할 수 있다.

이러한, 휴대 단말(100)은 카메라를 포함하며, 사용자가 휴대 가능한 전자 기기일 수 있다. 예를 들어, 휴대 단말(100)은 스마트 폰(smart phone), 휴대폰, 노트북 컴퓨터(laptop computer), 디지털방송용 단말기, PDA(personal digital assistants), PMP(portable multimedia player), 네비게이션, 슬레이트 PC(slate PC), 태블릿 PC(tablet PC), 울트라북(ultrabook), 웨어러블 디바이스(wearable device, 예를들어, 워치형 단말기 (smartwatch), 글래스형 단말기 (smart glass), HMD(head mounted display)) 등 일 수 있다.

이러한 휴대 단말(100) 및 그에 의하여 수행되는 객체 고정이 가능한 객체 트래킹 제공 방법에 대하여 이하 도 2 내지 도 16을 참조하여 설명한다.

도 2는 본 출원의 일 실시예에 따른 휴대 단말의 예시적인 컴퓨팅 운영 환경을 설명하는 도면이다.

도 2를 참조하면, 휴대 단말(100)은 통신부(110), 카메라부(120), 출력부(130), 메모리(140), 전원 공급부(150) 및 프로세서(160)를 포함한다. 도 2에 도시된 구성요소들은 휴대 단말이기를 구현하는데 있어서 필수적인 것은 아니어서, 본 명세서 상에서 설명되는 휴대 단말이기는 위에서 열거된 구성요소들 보다 많거나, 또는 적은 구성요소들을 가질 수 있다.

통신부(110)는, 휴대 단말(100)와 무선 통신 시스템 사이, 휴대 단말(100)와 다른 휴대 단말 사이 등의 통신을 가능하게 하는 하나 이상의 모듈을 포함할 수 있다. 이러한 통신부(110)는, 이동통신 모듈(211), 무선 인터넷 모듈(212) 및 근거리 통신모듈(213)을 포함할 수 있다. 근거리 통신모듈(213)은 유선 또는 무선으로 단말기 거치대(100)과 통신 연결을 수행할 수 있다. 예컨대, 근거리 통신모듈(213)은 블루투스등의 근거리 무선통신 모듈 또는 RS232와 같은 유선 통신모듈을 포함할 수 있다.

카메라부(120) 또는 카메라 모듈은 적어도 하나의 카메라를 포함할 수 있다. 카메라부(120)는 하나 이상의 렌즈들, 이미지 센서들, 이미지 시그널 프로세서들, 또는 플래시들을 포함할 수 있다.

일 예로, 카메라부(120)는 제1 카메라(221) 내지 제2 카메라(222)를 포함할수 있다. 제1 카메라(221) 또는 제2 카메라(222)는 휴대 단말(100)의 전방 영상을 촬영할 수 있다.

출력부(130)는 시각, 청각 또는 촉각 등과 관련된 출력을 발생시키기 위한 것으로, 디스플레이(131) 및 스피커(132)를 포함할 수 있다. 디스플레이(131)는 터치 센서와 상호 레이어 구조를 이루거나 일체형으로 형성됨으로써, 터치 스크린을 구현할 수 있다. 이러한 터치 스크린은, 휴대 단말(100)와 사용자 사이의 입력 인터페이스를 제공하는 사용자 입력부로써 기능함과 동시에, 휴대 단말(100)와 사용자 사이의 출력 인터페이스를 제공할 수 있다.

전원공급부(150)는 프로세서(160)의 제어 하에서, 외부의 전원 또는 내부의 전원을 인가 받아 휴대 단말(100)에 포함된 각 구성요소들에 전원을 공급한다. 이러한 전원공급부(150)는 배터리를 포함하며, 배터리는 내장형 배터리 또는 교체가능한 형태의 배터리가 될 수 있다.

프로세서(160)는 메모리(140)에 저장된 응용 프로그램, 즉, 어플리 케이션을 구동하기 위하여, 도 2와 함께 살펴본 구성요소들 중 적어도 일부를 제어할 수 있다. 나아가, 프로세서(160)는 응용 프로그램의 구동을 위하여, 휴대 단말(100)에 포함된 구성요소들 중 적어도 둘 이상을 서로 조합하여 동작시킬 수있다.

프로세서(160)는 메모리(140)에 저장된 인스트럭션들(instructions)을 실행하여 어플리케이션을 구동할 수 있다. 이하에서는, 프로세서(160)가 어플리케이션을 구동하여 제어, 지시 또는 기능의 주체로서 표현하나, 이는, 프로세서(160)가 메모리(140)에 저장된 인스트럭션 또는 어플리케이션을 구동하여 동작하는 것을 의미한다.

상술한 각 구성요소들 중 적어도 일부는, 이하에서 설명되는 다양한실시 예들에 따른 휴대 단말(100)의 동작, 제어 또는 제어방법을 구현하기 위하여 서로 협력하여 동작할 수 있다. 또한, 휴대 단말(100)의 동작, 제어, 또는 제어방법은 메모리(140)에 저장된 적어도 하나의 응용 프로그램의 구동에 의하여 휴대 단말 상에서 구현 될 수 있다.

프로세서(160)는 응용 프로그램과 관련된 동작 외에도, 통상적으로 휴대 단말(100)의 전반적인 동작을 제어한다. 프로세서(260)는 위에서 살펴본 구성요소들을 통해 입력 또는 출력되는 신호, 데이터, 정보 등을 처리하거나 메모리(240)에 저장된 응용 프로그램을 구동함으로써, 사용자에게 적절한 정보 또는 기능을 제공 또는 처리할 수 있다. 프로세서(160)는 하나의 프로세서 또는 복수의 프로세서로 구현 가능하다.

이하에서 설명하는 도 7의 구성요소들은 메모리(140)에 저장된 인스트럭션에 따라 프로세서(160)에서 구현되는 기능 또는 소프트웨어 모듈일 수 있다.

한편, 상술한 실시예에 따른 휴대 단말(100)에서 수행되는 제어 방법은 프로그램으로 구현되어 휴대 단말(100)에 제공될 수 있다. 예컨대, 휴대 단말(100)의 제어 방법을 포함하는 프로그램은 비일시적 판독 가능 매체(non-transitory computer readable medium)에 저장되어 제공될 수 있다.

도 3은 본 출원의 일 실시예에 따른 객체 고정이 가능한 객체 트래킹 제공 방법을 설명하는 순서도이고, 도 3에 도시된 객체 트래킹 제공 방법은 도 2에 도시된 휴대 단말(100)의 프로세서(160)의 구동에 의하여 수행되는 각 단계로 설명된다.

도 4는 본 출원의 일 실시예에 따른 객체 고정이 가능한 객체 트래킹 제공 방법을 설명하는 도면으로서, 제1 및 제2 인공지능 모델을 이용하여 추적 객체를 특정하는 것을 설명한다.

이하, 도 3 내지 도 4를 참조하여 설명한다.

도 4를 참조하면, 휴대 단말(100)은 제1 및 제2 인공지능 모델을 준비할 수 있다.

일 예로, 메모리(110)는 본 개시의 다양한 실시 예에 따른 인공지능 모델을 저장할 수 있다.

일 실시 예에 따른 인공지능 모델은 인공지능 알고리즘 기반으로 복수의 영상에 기초하여 학습된 판단 모델로서, 신경망(Neural Network)을 기반으로 하는 모델일 수 있다. 학습된 판단 모델은 인간의 뇌 구조를 컴퓨터 상에서 모의하도록 설계될 수 있으며 인간의 신경망의 뉴런(neuron)을 모의하는, 가중치를 가지는 복수의 네트워크 노드들을 포함할 수 있다. 복수의 네트워크 노드들은 뉴런이 시냅스(synapse)를 통하여 신호를 주고 받는 뉴런의 시냅틱(synaptic) 활동을 모의하도록 각각 연결 관계를 형성할 수 있다. 또한 학습된 판단 모델은, 일 예로, 기계 학습(Machine Learning) 모델, 신경망 모델, 또는 신경망 모델에서 발전한 딥 러닝(Deep Learning) 모델을 포함할 수 있다. 딥 러닝 모델에서 복수의 네트워크 노드들은 서로 다른 깊이(또는, 레이어)에 위치하면서 컨볼루션(convolution) 연결 관계에 따라 데이터를 주고 받을 수 있다.

일 예로, 인공지능 모델은 영상에 기초하여 학습된 CNN(Convolution Neural Network, 컨벌루션 신경망) 모델일 수 있다. CNN은 음성처리, 이미지 처리 등을 위해 고안된 특수한 연결구조를 가진 다층신경망이다. 한편, 인공지능 모델은 CNN에 한정되지 않음은 물론이다. 예를 들어, 학습 네트워크 모델은 RNN(Recurrent

Neural Network), LSTM(Long Short Term Memory Network), GRU(Gated Recurrent Units) 또는 GAN(Generative Adversarial Networks) 중 적어도 하나의 DNN(Deep Neural Network) 모델로 구현될 수 있다.

한편, 본 개시의 일 실시 예에 따른 메모리(110)는 동종(同種) 또는 이종(異種)의 복수의 학습 네트워크 모델들을 저장할 수도 있다. 다만, 다른 실시 예에 따르면 본 개시의 다양한 실시 예에 따른 적어도 하나의 학습 네트워크 모델은 외부 장치 또는 외부 서버 중 적어도 하나에 저장될 수도 있음은 물론이다.

제1 인공지능 모델(410)은 추적 객체의 종류가 표시되어 있는 이미지로 학습되어, 이미지 내에서 탐색 객체의 종류가 있으면 이를 식별할 수 있다. 즉, 제1 인공지능 모델(410)은 추적 객체의 종류를 포함하는 복수의 학습 이미지 세트들로 딥 러닝되어, 프레임 이미지 내에 존재하는 추적 객체의 종류에 대응되는 객체를 식별하는 인공 지능 모델일 수 있다. 예컨대, 추적 객체로 사람을 예를 들면, 제1 인공지능 모델은 사람의 다양한 모습이 표시된 복수의 학습 이미지를 제공받고, 이미지 내에서 사람 객체를 식별하여 구분하도록 학습된 인공신경망 모델일 수 있다.

제2 인공지능 모델(410)은 식별된 사람 객체에서의 동일성을 판단할 수 있도록 학습된 모델일 수 있다.

일 실시예에서, 제2 인공지능 모델(410)은 기본 이미지와 상기 기본 이미지를 기초로 변형된 학습 이미지를 대상으로 기본 이미지와 학습 이미지 간의 동일성에 대한 특징 데이터를 생성하도록 학습된 인공 지능 모델일 수 있다.

일 예로, 제2 인공지능 모델(410)은 기준 객체-추적 객체-와 비교 객체-탐색 객체-를 입력받고, 기준 객체에 대한 유사도 데이터-예컨대, 특징 벡터-를 생성할 수 있다. 생성된 유사도 데이터는, 비교 객체와 기준 객체의 유사 여부를 판단하는데 사용될 수 있다.

다른 예로, 제2 인공지능 모델(420)은 기준 객체-추적 객체-와 비교 객체-탐색 객체-를 입력받고, 각각의 객체에 대한 특징 데이터-예컨대, 특징 벡터-를 생성할 수 있다. 제2 인공지능 모델(420)은 기준 객체에 대한 제1 특징 벡터와, 비교 객체에 대한 제2 특징 벡터를 각각 생성할 수 있다. 기준 객체에 대한 제1 특징 벡터와 비교 객체에 대한 제2 특징 벡터는, 비교 객체와 기준 객체의 유사 여부를 판단하는데 사용될 수 있다.

프로세서(160)는 메모리에 저장된 인공지능 모델(410, 420)을 구동시킬 수 있으며, 이러한 인공지능 모델들을 기초로 객체를 고정한 트래킹 기능을 제공할 수 있다.

도 3을 참조하여 더 설명하면, 프로세서(160)는, 추적 객체를 설정할 수 있다(S310).

일 예로, 추적 객체는, 프레임 이미지에서 식별된 탐색 객체를 대상으로서, 사용자의 선택에 의하여 결정될 수 있다.

다른 예로, 프로세서(160)는, 프레임 이미지에서 최초로 식별된 탐색 객체를 추적 객체로서 자동으로 설정할 수 있다.

프로세서(160)는, 제1 인공지능 모델(410)을 이용하여, 촬영 영상의 프레임 이미지 내에 존재하는 객체를 식별하여 탐색 객체를 설정할 수 있다(S320). 여기에서, 탐색 객체는 이미지 프레임 내에 존재하는 객체로서, 추적 객체와 동일한 종류에 해당하는 객체이다. 예컨대, 추적 객체가 사람인 경우, 이미지 프레임 내에 있는 모든 사람 객체가 탐색 객체로서 식별될 수 있다.

프로세서(160)는 제2 인공지능 모델(430)을 이용하여, 제1 인공지능 모델에 의해 설정된 탐색 객체와 추적 객체가 동일한 객체인지 판단할 수 있다(S330).

일 실시예에서, 프로세서(160)는 제2 인공지능 모델(430)에서 생성된 탐색 객체와 추적 객체 간의 유사도 데이터가, 기 설정된 유사도 범위 내에 속하는지를 기초로 탐색 객체와 추적 객체가 동일 객체인지 판단할 수 있다.

일 실시예에서, 프로세서(160)는 제2 인공지능 모델(430)에서 생성된 탐색 객체에 대한 제1 특징 벡터와, 추적 객체에 대한 제2 특징 벡터 간의 유사도를 기초로 탐색 객체와 추적 객체가 동일 객체인지 판단할 수 있다.

프로세서(160)는 탐색 객체가 추적 객체와 동일한 객체로 판단되면, 동일하게 판단된 탐색 객체를 트래킹 하도록 할 수 있다.

일 예로, 프로세서(160)는 탐색 객체가 추적 객체와 동일한 객체로 판단되면, 탐색 객체를 추적 객체로 재 설정하고(S340), 재 설정된 추적 객체를 기초로 객체 트래킹을 수행할 수 있다(S350). 다만, 실시예에 따라, 추적 객체의 재 설정 없이, 추적 객체와 동일한 탐색 객체를 트래킹 대상으로 하는 실시예 또한 가능하다.

프로세서(160)는 탐색 객체가 추적 객체와 상이한 객체로 판단되면, 이전 프레임 이미지에서의 탐색 객체의 위치를 기준으로 객체 트래킹을 수행할 수 있다. 즉, 이전 프레임 이미지에서의 촬영 방향 또는 뷰잉 윈도우를 그대로 유지할 수 있다.

도 1에 도시된 예와 같이, 단말기 거치대(200)를 사용하는 경우, 프로세서(160)는 추적 객체에 대한 객체 트래킹을 위한 트래킹 제어(430)를 수행할 수 있으며, 즉, 트래킹을 위한 단말기 거치대(200)의 회전 제어를 수행할 수 있다. 이를 위하여, 프로세서(160)는 트래킹 제어 신호를 생성하고, 이를 단말기 거치대(200)에 제공할 수 있다.

도 5 내지 도 7은 도 3에 도시된 객체 고정이 가능한 객체 트래킹 제공 방법을 예시하는 도면으로서, 도 5를 참조하면, 휴대 단말(100)은 전방 영상을 촬영하고 추적 객체(51)를 추적하여 사용자 디스플레이 인터페이스(520)를 통하여 디스플레이 하는 예를 도시한다. 도 5의 예에서, 추적 객체(51)가 설정되어 있는 예를 도시한다. 도 6에서는, 프레임 이미지에 촬영되는 영역(610)에 새로운 탐색 객체(62)가 추가된 예를 도시한다. 도 6의 예에서, 프로세서(160)는 제1 인공지능 모델을 이용하여, 제1 탐색 객체(61)와 제2 탐색 객체(62)를 각각 식별할 수 있다. 이후, 프로세서(160)는 제2 인공지능 모델을 이용하여, 추적 객체(51)와 제1 탐색 객체(61) 간의 유사 판단과, 추적 객체(51)와 제2 탐색 객체(62) 간의 유사 판단을 수행할 수 있다. 프로세서(160)는 제1 탐색 객체(61)는 추적 객체(51)와 유사하게 판단하는 반면, 제2 탐색 객체(62)는 추적 객체(51)와 비유사한 것으로 판단할 것이며, 그에 따라, 제1 탐색 객체(61)를 계속 추적할 수 있다. 마찬가지로, 도 7의 예에서, 프레임 이미지에 촬영되는 영역(710)에 검색된 탐색 객체(71)를 탐색하고, 이를 추적 객체와 동일한지 판단하여 트래킹을 수행할 수 있다.

도 8은 본 출원의 일 실시예에 따른 추적 객체를 설정하는 일 실시예를 설명하는 순서도이다. 도 8에 도시된 일 실시예는, 추적 객체의 최초 설정을 설명하는 실시예이다.

도 8을 참조하면, 프로세서(160)는 기 설정된 프레임 레이트로 촬영된 촬영 영상을 수신한다(S810). 프로세서(160)는 제1 인공지능 모델을 이용하여 촬영 영상의 프레임 이미지 내에 존재하는 객체를 식별하고(S820), 최초로 탐색된 탐색 객체를 추적 객체로서 설정할 수 있다(S830). 이러한 실시예는, 최초 식별된 객체-예컨대, 최초 식별된 사람 객체-를 트래킹 대상으로 자동설정 할 수 있으므로 편리하게 자동 객체 추적을 수행할 수 있다.

도 9를 참조하면, 프로세서(160)는 제1 인공지능 모델을 이용하여, 촬영 영상의 프레임 이미지 내의 탐색 객체 식별할 수 있다(S910).

프로세서(160)는 탐색 객체에 대하여 바운딩 박스를 표시하고(S920), 바운딩 박스를 잘라내어 제2 인공지능 모델에 입력할 수 있다(S930). 도 5에 도시된 객체 51는 바운딩 박스가 1점 쇄선으로 표시되어 있다. 이러한 바운딩 박스는 사용자 인터페이스를 통해 표시될 수도 있고, 또는 바운딩 박스의 표시가 생략될 수도 있다. 도 6에서는 탐색된 두 객체 61, 62에 대해 각각 바운딩 박스가 설정된 예가 도시되어 있다.

도 10은 본 출원의 일 실시예에 따른 탐색 객체와 추적 객체의 동일성을 판단하는 일 실시예를 설명하는 순서도이다. 도 10을 참조하면, 프로세서(160)는 제2 인공지능 모델을 이용하여 탐색 객체를 포함하는 제1 바운딩 박스에 대한 제1 특징 데이터를 생성할 수 있다(S1010).

프로세서(160)는 제2 인공지능 모델을 이용하여 추적 객체를 포함하는 제2 바운딩 박스에 대한 제2 특징 데이터를 생성할 수 있다(S1020).

프로세서(160)는 제1 특징 데이터와 제2 특징 데이터를 비교하여, 탐색 객체와 추적 객체의 동일성을 판단할 수 있다(S1030).

일 실시예에서, 특징 데이터는 특징 벡터일 수 있고, 프로세서(160)는 제2 인공지능 모델(430)에서 생성된 탐색 객체에 대한 제1 특징 벡터와, 추적 객체에 대한 제2 특징 벡터 간의 유사도를 기초로 탐색 객체와 추적 객체가 동일 객체인지 판단할 수 있다.

일 실시예에서, 프로세서(160)는 탐색 객체에 대한 제1 특징 벡터와 추적 객체에 대한 제2 특징 벡터에 대해 서로 다른 방식으로 도출되는 복수의 유사도 값을 산출하고, 복수의 유사도 값 각각에 대하여 유사도 범위를 설정할 수 있다. 예컨대, 프로세서(160)는 상기 제1 특징 벡터와 상기 제2 특징 벡터 간의 코사인거리 값과 유클리디언 거리값을 각각 산출하고, 산출된 두 값이 각각 기 설정된 코사인거리값의 유사도 임계범위와 기 설정된 유클리디언 거리값의 유사도 임계범위-상기 임계범위들은 각각 학습 과정을 기초로 설정될 수 있음- 내에 해당되는지 판단할 수 있다. 복수의 유사도 값 중 모두가 유사도 범위 이내이면, 프로세서(160)는 탐색 객체와 추적 객체가 동일한 것으로 판단할 수 있다. 복수의 유사도 값 중 적어도 하나가 유사도 범위를 초과하는 경우, 프로세서(160)는 탐색 객체와 추적 객체가 동일하지 않은 것으로 판단할 수 있다.

도 11 및 도 12는, 휴대 단말을 거치하고 휴대 단말의 촬영 방향을 회전시킬 수 있는 단말기 거치대를 이용하여 트래킹하는 일 실시예에 관한 것이다.

도 11은 본 출원의 일 실시예에 따른 단말기 거치대를 설명하는 블록 구성도이고, 도 12는 본 출원의 일 실시예에 따른 단말기 거치대를 이용한 추적 객체 트래킹 방법을 설명하는 도면이다.

도 11을 참조하면, 단말기 거치대(200)는 회전부(210) 및 본체부(220)를 포함할 수 있다.

회전부(210)에는 휴대 단말(200)가 거치되고, 모터부(221)의 동작에 의하여 회전부(210)가 회전될 수 있다. 회전부(210)의 회전에 따라 휴대 단말(100)의 촬영 방향이 변경될 수 있다. 즉, 휴대 단말(100)에서 제공된 제어 신호에 따라 회전부(210)가 회전하여, 회전부(210)에 거치된 휴대 단말(100)의 촬영 방향이 추적 객체를 추종하도록 동작할 수 있다. 회전부(210)의 회전 방향 및 회전 속도는 모터부(221)의 구동에 따라 변경될 수 있다.

일 예로, 회전부(210)는 고정대, 조이개 및 회전대를 포함할 수 있다. 고정대 및 조이개는 회전대 상에 배치될 수 있다. 고정대와 조이개는 휴대 단말(100)을 고정할 수 있다. 회전대는 모터부(221)의 동작에 따라 회전할 수 있으며, 이를 위해 회전대는 모터부(221)와 기계적으로 연결될 수 있다.

본체부(220)는 모터부(221), 제어부(222) 및 통신부(223)를 포함할 수 있다. 제어부(222)는 본체부(220)의 구성요소들을 제어하여 단말기 거치대(200)의 동작을 제어할 수 있다.

통신부(223)는 휴대 단말(100)과 통신 연결을 수행하고, 휴대 단말(100)로부터 단말기 거치대(200)를 구동시키기 위한 제어 신호를 제공받을 수 있다. 일 예로, 통신부(223)는 근거리 통신 모듈 또는 유선 통신을 이용하여 휴대 단말(100)과 통신 연결을 형성할 수 있다.

제어부(222)는 통신부(223)를 통하여 수신된 제어 신호에 대응하여, 모터부(221)를 구동하여, 회전부(210)의 구동을 제어할 수 있다.

도 12를 참조하면, 프로세서(160)는 근거리 통신모듈(113)을 제어하여 단말기 거치대(200)와의 통신 연결을 형성할 수 있다(S1201).

프로세서(160)는 카메라부(120)를 제어하여, 휴대 단말(100)의 전방에 대한 촬영 영상을 획득하고, 촬영 영상에서 탐색 객체를 식별한 후, 추적 객체인지 여부를 판단할 수 있다. 즉, 전술한 바와 같이 촬영 영상에서 추적 객체를 설정할 수 있다(S1202).

프로세서(160)는 추적 객체를 트래킹 하도록 단말기 거치대를 제어할 수 있다(S1203). 이를 위하여 프로세서(160)는, 추적 객체가 프레임 이미지의 특정 위치에 위치하도록 단말기 거치대(200)의 회전을 제어할 수 있다. 예컨대, 추적 객체가 프레임 이미지의 중앙부분에 위치되도록 단말기 거치대의 회전 제어 신호 생성할 수 있다(S1203).

단말기 거치대(200)의 제어부(222)는, 수신한 회전 제어 신호에 따라 회전부(210)를 구동하도록 제어함으로써, 휴대 단말의 전방이 추적 객체를 따라가도록 함으로써 트래킹을 제공할 수 있다.

도 13 내지 도 16은, 휴대 단말의 전방 위치가 고정된 상태에서 소프트웨어적으로 트래킹의 효과를 제공하는 소프트웨어 기반의 트래킹 방법을 설명한다.

도 13을 참조하면, 프로세서(160)는, 카메라부(120)을 제어하여 전방 방향에 대한 프레임 이미지를 생성하도록 하여 이를 제공받는다(S1310). 카메라부(120)는 추적 객체의 존재 및 이동 여부에 무관하게 기 설정된 전방 방향으로 고정되어 제1 해상도로 촬영하여 프레임 이미지를 생성할 수 있다.

프로세서(160)는, 카메라부(120)에서 촬영되는 제1 해상보다 낮은 해상도를 가지도록 뷰잉 윈도우(도 15의 1503)의 제2 해상도를 설정할 수 있다(S1320).

일 예로, 뷰잉 윈도우의 해상도는 사용자의 입력을 기초로 결정될 수 있다.

다른 예로, 프로세서(160)는, 추적 객체의 프레임 이미지에서의 크기에 따라 객체 트래킹 기능의 제공 중에 뷰잉 윈도우의 해상도를 동적으로 변경할 수 있다. 예컨대, 추적 객체의 바운딩 박스의 크기에 대응하여 뷰잉 윈도우의 해상도를 동적으로 변경할 수 있다. 바운딩 박스가 일정 크기보다 작은 경우 뷰잉 윈도우의 해상도를 그에 대응하여 낮추고, 바운딩 박스가 일정 크기보다 큰 경우 뷰잉 윈도우의 해상도를 그에 대응하여 크게 설정할 수 있다. 이는, 뷰잉 윈도우가 사용자에게 디스플레이 되는 이미지 영역이므로, 추적 객체의 크기(바운딩 박스의 크기)가 일정한 범위 내에서 변동되도록 하기 위함이다.

프로세서(160)는, 프레임 이미지 내의 추적 객체를 식별하고, 프레임 이미지 내에서의 추적 객체의 위치를 기초로, 추적 객체를 포함하는 프레임 이미지의 일부 영역을 뷰잉 윈도우로서 설정할 수 있다(S1340). 도 15에서, 프레임 이미지(1501) 내에서 추적 객체(1502)를 식별한 후에, 이러한 추적 개체를 중심으로 사용자 디스플레이 인터페이스를 통하여 표시될 윈도우인 뷰잉 윈도우(1503)를 설정할 수 있다.

도 14는 본 출원의 일 실시예에 따른 뷰잉 윈도우의 설정에 대한 일 실시예를 설명하는 도면으로서, 도 14를 더 참조하여 뷰잉 윈도우의 설정을 설명한다.

도 14를 참조하면, 프로세서(160)는, 프레임 이미지 내에서의 추적 객체의 위치를 확인한다(S1410). 프로세서(160)는, 추적 객체의 위치를 기준으로, 제2 해상도에 해당하는 프레임 이미지의 일부 영역을 추출할 수 있다(S1420). 예컨대, 추적 객체를 제2 해상도 영역의 중심으로 설정할 수 있다. 프로세서(160)는, 추출된 프레임 이미지의 일부 영역을 뷰잉 윈도우로서 설정할 수 있다(S1430).

다시 도 13을 참조하면, 프로세서(160)는, 사용자 디스플레이 인터페이스를 이용하여 뷰잉 윈도우를 표시 할 수 있다(S1350). 즉, 사용자 디스플레이 인터페이스를 통하여 뷰잉 윈도우(503)만 표시되고, 촬영된 프레임 이미지의 전체인 제1 해상도 모두가 표시되는 것이 아니다. 즉, 뷰잉 윈도우를 제외한 나머지 영역(1505)은 사용자 디스플레이 인터페이스에 표시되지 않는다.

프로세서(160)는, 카메라 모듈에서 촬영되는 연속되는 프레임 이미지-이를 촬영 프레임 이미지라 함-의 전체 또는 적어도 일부에 대하여 뷰잉 윈도우를 설정하는 상술한 과정을 반복적으로 수행할 수 있다. 도 16은 도 15에서 일정 시간이 흐른 뒤에 촬영된 촬영 프레임 이미지(1601)를 도시하며, 도 15와 도 16을 비교하면 추적 객체(1602)가 위치 A에서 위치 B로 이동한 것을 알 수 있다. 프로세서(160)는, 추적 객체(1602)의 이동에 대응하여 뷰잉 윈도우(1603)의 위치를 재 설정할 수 있다. 도시된 예에서는 추적 객체(1602)를 중심으로 뷰잉 윈도우를 오른쪽으로 이동시켜 설정할 수 있다. 그에 따라 도 15의 뷰잉 윈도우(1503)와 도 16의 뷰잉 윈도우(1603)가 다르게 설정된 것을 알 수 있다.

이상에서 설명한 본 발명은 전술한 실시예 및 첨부된 도면에 의해 한정되는 것이 아니고 후술하는 특허청구범위에 의해 한정되며, 본 발명의 구성은 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 그 구성을 다양하게 변경 및 개조할 수 있다는 것을 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 쉽게 알 수 있다.

[사사]

본 발명은 대한민국 정부가 지원한 다음 연구과제의 지원을 받아 창작된 것이다.

연구과제 정보

부처명 : 한국관광공사

연구사업명: 관광 글로벌 선도기업 후속지원

과제명 : 스마트폰 연동형 사람/사물 자동인식 및 트래킹 촬영기기

주관기관:(주)쓰리아이

연구기간:2022.03.04~2022.12.31

본 출원에 개시되는 일 실시예에 따르면, 각각 개별 학습된 딥 러닝된 객체 인식 모델과 딥 러닝된 객체 식별 모델을 이용하여, 객체의 식별 및 동일성의 판단을 보다 빠르고 정확하게 수행하여 트래킹을 보다 효과적으로 제공할 수 있는 효과가 있어 산업상 이용가능성이 있다.

본 출원에 개시되는 일 실시예에 따르면, 객체 식별 모델에서 도출된 객체 식별자에 대한 유사도 비교를 기초로 동일 객체를 판단하므로, 보다 빠르고 적은 리소스로 객체 동일성 판을 수행할 수 있는 효과가 있어 산업상 이용가능성이 있다.

Claims

휴대 단말에서 수행되며, 휴대 단말의 전방에 대하여 촬영된 촬영 영상에 대한 객체 트래킹 기능을 제공하는 방법으로서,

추적 객체를 설정하는 단계;

제1 인공지능 모델을 이용하여, 상기 촬영 영상의 프레임 이미지 내에 존재하는 객체-상기 객체는 상기 추적 객체와 동일한 종류임-를 식별하여 탐색 객체를 설정하는 단계; 및

상기 제1 인공지능 모델과 다른 방식으로 트레이닝 된 제2 인공지능 모델을 이용하여, 상기 제1 인공지능 모델에 의해 설정된 상기 탐색 객체와 상기 추적 객체가 동일한 객체인지 판단하는 단계; 를 포함하는,

객체 고정이 가능한 객체 트래킹 제공 방법.
제1항에 있어서, 상기 제1 인공지능 모델은,

상기 추적 객체의 종류에 대응되는 복수의 학습 이미지 세트들로 딥 러닝되어, 프레임 이미지 내에 존재하는 상기 추적 객체의 종류에 대응되는 객체를 식별하는 인공 지능 모델인,

객체 고정이 가능한 객체 트래킹 제공 방법.
제2항에 있어서, 상기 제2 인공지능 모델은,

기본 이미지와 상기 기본 이미지를 기초로 변형된 학습 이미지를 대상으로 상기 기본 이미지와 상기 학습 이미지 간의 동일성에 대한 특징 데이터를 생성하도록 학습된 인공 지능 모델인,

객체 고정이 가능한 객체 트래킹 제공 방법.
제3항에 있어서, 상기 탐색 객체를 설정하는 단계는,

상기 제1 인공지능 모델에 의하여 식별된 상기 탐색 객체에 대하여 바운딩 박스를 표시하는 단계; 및

상기 바운딩 박스를 잘라내어 상기 제2 인공지능 모델에 입력하는 단계; 를 포함하는,

객체 고정이 가능한 객체 트래킹 제공 방법.
제4항에 있어서, 상기 추적 객체가 동일한 객체인지 판단하는 단계는,

상기 제2 인공지능 모델을 이용하여 상기 탐색 객체를 포함하는 제1 바운딩 박스에 대한 제1 특징 데이터를 생성하는 단계; 및

상기 제2 인공지능 모델을 이용하여 상기 추적 객체를 포함하는 제2 바운딩 박스에 대한 제2 특징 데이터를 생성하는 단계; 를 포함하는,

객체 고정이 가능한 객체 트래킹 제공 방법.
제5항에 있어서, 상기 추적 객체가 동일한 객체인지 판단하는 단계는,

상기 제1 특징 데이터와 상기 제2 특징 데이터를 비교하여, 상기 탐색 객체와 상기 추적 객체의 동일성을 판단하는 단계;를 더 포함하는,

객체 고정이 가능한 객체 트래킹 제공 방법.
제3항에 있어서,

상기 기본 이미지 및 상기 학습 이미지는 사람의 전신 외형에 대한 이미지인,

객체 고정이 가능한 객체 트래킹 제공 방법.
제1항에 있어서, 상기 객체 트래킹 제공 방법은,

상기 탐색 객체가 상기 추적 객체와 동일한 객체이면, 상기 탐색 객체를 추적 객체로 재 설정하고, 재 설정된 추적 객체를 기초로 객체 트래킹을 수행하는 단계; 를 더 포함하는,

객체 고정이 가능한 객체 트래킹 제공 방법.
제8항에 있어서, 상기 재 설정된 추적 객체를 기초로 객체 트래킹을 수행하는 단계는,

상기 프레임 이미지의 제1 해상도 보다 낮은 제2 해상도를 가지도록 뷰잉 윈도우의 해상도를 설정하는 단계; 및

상기 재 설정된 추적 객체를 기준으로, 상기 재 설정된 추적 객체를 포함하는 상기 탐색 프레임 이미지의 일부 영역을 상기 뷰잉 윈도우로서 설정하는 단계; 를 포함하는,

객체 고정이 가능한 객체 트래킹 제공 방법.
제9항에 있어서, 상기 재 설정된 추적 객체를 기초로 객체 트래킹을 수행하는 단계는,

사용자 디스플레이 인터페이스를 이용하여 상기 뷰잉 윈도우를 표시하는 단계; 를 더 포함하는,

객체 고정이 가능한 객체 트래킹 제공 방법.
휴대 단말로서,

하나 이상의 인스트럭션을 저장하는 메모리; 및

상기 메모리에 저장된 상기 하나 이상의 인스트럭션을 실행하는 적어도 하나의 프로세서를 포함하고,

상기 적어도 하나의 프로세서는, 상기 하나 이상의 인스트럭션을 실행함으로써,

상기 카메라 모듈로부터 제1 해상도로 촬영된 탐색 프레임 이미지를 제공받고,

추적 객체를 설정하고,

제1 인공지능 모델을 이용하여, 상기 촬영 영상의 프레임 이미지 내에 존재하는 객체를 식별하여 탐색 객체를 설정하고,

상기 제1 인공지능 모델과 다른 방식으로 트레이닝 된 제2 인공지능 모델을 이용하여, 상기 제1 인공지능 모델에 의해 설정된 상기 탐색 객체와 상기 추적 객체가 동일한 객체인지 판단하는,

휴대 단말.
제11항에 있어서, 상기 제1 인공지능 모델은,

상기 추적 객체의 종류에 대응되는 복수의 학습 이미지 세트들로 딥 러닝되어, 프레임 이미지 내에 존재하는 상기 추적 객체의 종류에 대응되는 객체를 식별하는 인공 지능 모델인,

휴대 단말.
제12항에 있어서, 상기 제2 인공지능 모델은,

기본 이미지와 상기 기본 이미지를 기초로 변형된 학습 이미지를 대상으로 상기 기본 이미지와 상기 학습 이미지 간의 동일성에 대한 특징 데이터를 생성하도록 학습된 인공 지능 모델인,

휴대 단말.
제13항에 있어서, 상기 휴대 단말은, 상기 탐색 객체를 설정함에 있어서,

상기 제1 인공지능 모델에 의하여 식별된 상기 탐색 객체에 대하여 바운딩 박스를 표시하고,

상기 바운딩 박스를 잘라내어 상기 제2 인공지능 모델에 입력하는,

휴대 단말.
제14항에 있어서, 상기 휴대 단말은, 상기 추적 객체가 동일한 객체인지 판단함에 있어서,

상기 제2 인공지능 모델을 이용하여 상기 탐색 객체를 포함하는 제1 바운딩 박스에 대한 제1 특징 데이터를 생성하고,

상기 제2 인공지능 모델을 이용하여 상기 추적 객체를 포함하는 제2 바운딩 박스에 대한 제2 특징 데이터를 생성하는,

휴대 단말.
제15항에 있어서, 상기 휴대 단말은, 상기 추적 객체가 동일한 객체인지 판단함에 있어서,

상기 제1 특징 데이터와 상기 제2 특징 데이터를 비교하여, 상기 탐색 객체와 상기 추적 객체의 동일성을 판단하는,

휴대 단말.
제13항에 있어서,

상기 기본 이미지 및 상기 학습 이미지는 사람의 전신 외형에 대한 이미지인,

휴대 단말.
제11항에 있어서, 상기 휴대 단말은,

상기 탐색 객체가 상기 추적 객체와 동일한 객체이면, 상기 탐색 객체를 추적 객체로 재 설정하고, 재 설정된 추적 객체를 기초로 객체 트래킹을 수행하는,

휴대 단말.
제18항에 있어서, 상기 휴대 단말은, 재 설정된 추적 객체를 기초로 객체 트래킹을 수행함에 있어서,

상기 프레임 이미지의 제1 해상도 보다 낮은 제2 해상도를 가지도록 뷰잉 윈도우의 해상도를 설정하고,

상기 재 설정된 추적 객체를 기준으로, 상기 재 설정된 추적 객체를 포함하는 상기 탐색 프레임 이미지의 일부 영역을 상기 뷰잉 윈도우로서 설정하는,

휴대 단말.
컴퓨터 판독 가능한 인스트럭션들(instructions)을 저장하고 있는 저장 매체에 있어서,

상기 인스트럭션들은, 휴대 단말에 의해 실행될 때, 상기 휴대 단말로 하여금,

추적 객체를 설정하는 동작;

제1 인공지능 모델을 이용하여, 상기 촬영 영상의 프레임 이미지 내에 존재하는 객체-상기 객체는 상기 추적 객체와 동일한 종류임-를 식별하여 탐색 객체를 설정하는 동작; 및

상기 제1 인공지능 모델과 다른 방식으로 트레이닝 된 제2 인공지능 모델을 이용하여, 상기 제1 인공지능 모델에 의해 설정된 상기 탐색 객체와 상기 추적 객체가 동일한 객체인지 판단하는 동작; 을 수행하도록 하는,

저장 매체.