KR20200090315A - 영상을 처리하는 방법 및 디바이스 - Google Patents

영상을 처리하는 방법 및 디바이스 Download PDF

Info

Publication number
KR20200090315A
KR20200090315A KR1020190007131A KR20190007131A KR20200090315A KR 20200090315 A KR20200090315 A KR 20200090315A KR 1020190007131 A KR1020190007131 A KR 1020190007131A KR 20190007131 A KR20190007131 A KR 20190007131A KR 20200090315 A KR20200090315 A KR 20200090315A
Authority
KR
South Korea
Prior art keywords
objects
virtual
image
light
depth information
Prior art date
Application number
KR1020190007131A
Other languages
English (en)
Inventor
제나디 키스
안드리 부기오브
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020190007131A priority Critical patent/KR20200090315A/ko
Priority to EP20741300.6A priority patent/EP3893499A4/en
Priority to US17/423,753 priority patent/US20220114811A1/en
Priority to PCT/KR2020/000853 priority patent/WO2020149692A1/ko
Publication of KR20200090315A publication Critical patent/KR20200090315A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/20Scenes; Scene-specific elements in augmented reality scenes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/30Image reproducers
    • H04N13/332Displays for viewing with the aid of special glasses or head-mounted displays [HMD]
    • H04N13/344Displays for viewing with the aid of special glasses or head-mounted displays [HMD] with head-mounted left-right displays
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/30Image reproducers
    • H04N13/366Image reproducers using viewer tracking
    • GPHYSICS
    • G02OPTICS
    • G02BOPTICAL ELEMENTS, SYSTEMS OR APPARATUS
    • G02B27/00Optical systems or apparatus not provided for by any of the groups G02B1/00 - G02B26/00, G02B30/00
    • G02B27/01Head-up displays
    • G02B27/017Head mounted
    • G02B27/0172Head mounted characterised by optical features
    • GPHYSICS
    • G02OPTICS
    • G02BOPTICAL ELEMENTS, SYSTEMS OR APPARATUS
    • G02B30/00Optical systems or apparatus for producing three-dimensional [3D] effects, e.g. stereoscopic images
    • G02B30/20Optical systems or apparatus for producing three-dimensional [3D] effects, e.g. stereoscopic images by providing first and second parallax images to an observer's left and right eyes
    • G02B30/26Optical systems or apparatus for producing three-dimensional [3D] effects, e.g. stereoscopic images by providing first and second parallax images to an observer's left and right eyes of the autostereoscopic type
    • G02B30/27Optical systems or apparatus for producing three-dimensional [3D] effects, e.g. stereoscopic images by providing first and second parallax images to an observer's left and right eyes of the autostereoscopic type involving lenticular arrays
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T19/00Manipulating 3D models or images for computer graphics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T19/00Manipulating 3D models or images for computer graphics
    • G06T19/006Mixed reality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/50Depth or shape recovery
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/50Depth or shape recovery
    • G06T7/55Depth or shape recovery from multiple images
    • G06T7/571Depth or shape recovery from multiple images from focus
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition
    • G06V10/12Details of acquisition arrangements; Constructional details thereof
    • G06V10/14Optical characteristics of the device performing the acquisition or on the illumination arrangements
    • G06V10/141Control of illumination
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition
    • G06V10/12Details of acquisition arrangements; Constructional details thereof
    • G06V10/14Optical characteristics of the device performing the acquisition or on the illumination arrangements
    • G06V10/147Details of sensors, e.g. sensor lenses
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/60Extraction of image or video features relating to illumination properties, e.g. using a reflectance or lighting model
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/30Image reproducers
    • H04N13/302Image reproducers for viewing without the aid of special glasses, i.e. using autostereoscopic displays
    • H04N13/322Image reproducers for viewing without the aid of special glasses, i.e. using autostereoscopic displays using varifocal lenses or mirrors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/30Image reproducers
    • H04N13/332Displays for viewing with the aid of special glasses or head-mounted displays [HMD]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/30Image reproducers
    • H04N13/366Image reproducers using viewer tracking
    • H04N13/383Image reproducers using viewer tracking for tracking with gaze detection, i.e. detecting the lines of sight of the viewer's eyes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/30Image reproducers
    • H04N13/398Synchronisation thereof; Control thereof

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computer Graphics (AREA)
  • Computer Hardware Design (AREA)
  • General Engineering & Computer Science (AREA)
  • Optics & Photonics (AREA)
  • Vascular Medicine (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • User Interface Of Digital Computer (AREA)
  • Processing Or Creating Images (AREA)

Abstract

본 개시의 실시예에 따르면, 디바이스에 인식된 영상에 포함된 복수의 실세계 객체 또는 복수의 가상 객체를 식별하고, 식별된 복수의 객체 각각의 깊이 정보를 획득하며, 복수의 객체 각각의 깊이 정보에 기초하여, 식별된 복수의 객체에 대응되는 가상 영상의 광을 출력하는 영상 처리 방법이 개시된다.

Description

영상을 처리하는 방법 및 디바이스{METHOD AND DEVICE FOR PROCESSING IMAGE}
개시된 실시예는 영상을 처리하는 방법 및 디바이스에 관한 것으로, 보다 구체적으로는 가상 현실 또는 증강 현실을 구현할 수 있는 영상을 처리하는 방법 및 디바이스에 관한 것이다.
가상 현실(virtual reality, VR)은 가상의 대상이나 정보를 사용자에게 제공하여 실세계와는 분리된 완전 가상 세계를 체험할 수 있도록 하는 기술로서, 이를 구현할 수 있는 전자기기 및 디스플레이 장치가 개발되면서, 가상 현실의 구현에 대한 관심이 높아지고 있다. 또한, 가상 현실(VR)의 다음 단계로 증강 현실(augmented reality, AR)을 실현할 수 있는 기술(방안)도 연구되고 있다.
증강 현실(AR)은, 완전 가상 세계를 전제로 하는 가상 현실(VR)과는 달리, 현실 세계의 환경 위에 가상의 대상이나 정보를 겹치거나 결합하여 보여줌으로써 현실의 효과를 더욱 증가시키는 디스플레이 기술이다. 가상 현실(VR)이 게임이나 가상 체험과 같은 분야에 한정적으로 적용이 가능했다면, 증강 현실(AR)은 다양한 현실 환경에 응용이 가능하다는 장점이 있다. 특히, 증강 현실(AR)은 유비쿼터스(ubiquitous) 환경이나 사물 인터넷(internet of things, IoT) 환경에 적합한 차세대 디스플레이 기술로 주목받고 있다.
본 개시의 실시예들은 가상 현실 또는 증강 현실의 구현 시, 몰입감을 떨어뜨리거나 사용자의 눈에 피로도를 유발할 수 있는 조절-수렴 불일치 현상을 해결하기 위한 영상을 처리하는 방법 및 디바이스를 제시한다.
일 실시예에 따른 영상을 처리하는 방법은, 디바이스에 인식된 영상에 포함된 복수의 실세계 객체 또는 복수의 가상 객체를 식별하는 단계; 식별된 복수의 객체 각각의 깊이 정보를 획득하는 단계; 및 복수의 객체 각각의 깊이 정보에 기초하여, 식별된 복수의 객체에 대응되는 가상 영상의 광을 출력하는 단계를 포함할 수 있다.
일 실시예에 따른 영상을 처리하는 디바이스는, 디스플레이; 하나 이상의 인스트럭션을 저장하는 메모리; 및 메모리에 저장된 하나 이상의 인스트럭션을 실행하는 적어도 하나의 프로세서를 포함하고, 적어도 하나의 프로세서는, 하나 이상의 인스트럭션을 실행함으로써, 인식된 영상에 포함된 복수의 실세계 객체 또는 복수의 가상 객체를 식별하고, 식별된 복수의 객체 각각의 깊이 정보를 획득하며,
복수의 객체 각각의 깊이 정보에 기초하여, 식별된 복수의 객체에 대응되는 가상 영상의 광을 출력하도록 디스플레이를 제어할 수 있다.
일 실시예에 따른 컴퓨터 프로그램 제품은, 디바이스에 인식된 영상에 포함된 복수의 실세계 객체 또는 복수의 가상 객체를 식별하는 동작; 식별된 복수의 객체 각각의 깊이 정보를 획득하는 동작; 및 복수의 객체 각각의 깊이 정보에 기초하여, 식별된 복수의 객체에 대응되는 가상 영상의 광을 출력하는 동작을 수행하도록 하는 프로그램이 저장된 기록매체를 포함할 수 있다.
도 1은 사용자가 가상 영상을 인식하는 과정에서 발생하는 수렴-조절 불일치 현상을 설명하기 위한 도면이다.
도 2는 일 실시예에 따른 영상 처리 방법을 설명하기 위한 개념도이다.
도 3은 일 실시예에 따른 영상 처리 방법을 설명하기 위한 흐름도이다.
도 4는 일 실시예에 따른 디바이스가 VR 모드에서 가상 영상의 광을 출력하는 방법을 설명하기 위한 도면이다.
도 5는 일 실시예에 따른 디바이스가 AR 모드에서 가상 영상의 광을 출력하는 방법을 설명하기 위한 도면이다.
도 6은 일 실시예에 따른 AR 모드에서의 영상 처리 방법을 보다 구체적으로 설명하기 위한 도면이다.
도 7은 일 실시예에 따른 디스플레이 모드에 따라 디바이스를 착용한 사용자의 모습을 도시한 도면이다.
도 8은 일 실시예에 따른 디바이스가 가상 영상의 처리를 위해 가상 영상의 광을 투사하는 렌즈를 이동시키는 방법을 설명하기 위한 도면이다.
도 9 및 도 10은 일 실시예에 따른 디바이스의 구성을 설명하기 위한 블록도이다.
아래에서는 첨부한 도면을 참조하여 본 개시가 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본 개시의 실시 예를 상세히 설명한다. 그러나 본 개시는 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시 예에 한정되지 않는다. 또한, 도면에서 본 개시를 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
본 개시에서 사용되는 용어는, 본 개시에서 언급되는 기능을 고려하여 현재 사용되는 일반적인 용어로 기재되었으나, 이는 당 분야에 종사하는 기술자의 의도 또는 판례, 새로운 기술의 출현 등에 따라 다양한 다른 용어를 의미할 수 있다. 따라서 본 개시에서 사용되는 용어는 용어의 명칭만으로 해석되어서는 안되며, 용어가 가지는 의미와 본 개시의 전반에 걸친 내용을 토대로 해석되어야 한다.
또한, 제1, 제2 등의 용어는 다양한 구성 요소들을 설명하는데 사용될 수 있지만, 구성 요소들은 이 용어들에 의해 한정되어서는 안 된다. 이 용어들은 하나의 구성 요소를 다른 구성 요소로부터 구별하는 목적으로 사용된다.
또한, 본 개시에서 사용된 용어는 단지 특정한 실시 예를 설명하기 위해 사용된 것이며, 본 개시를 한정하려는 의도로 사용되는 것이 아니다. 단수의 표현은 문맥상 명백하게 단수를 뜻하지 않는 한, 복수의 의미를 포함한다. 또한, 명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 "전기적으로 연결"되어 있는 경우도 포함한다. 또한 어떤 부분이 어떤 구성 요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성 요소를 제외하는 것이 아니라 다른 구성 요소를 더 포함할 수 있는 것을 의미한다.
본 명세서 전반에 걸쳐 사용된 “상기” 및 이와 유사한 지시어는 단수 및 복수 모두를 지시하는 것일 수 있다. 또한, 본 개시에 따른 방법을 설명하는 단계들의 순서를 명백하게 지정하는 기재가 없다면, 기재된 단계들은 적당한 순서로 행해질 수 있다. 기재된 단계들의 기재 순서에 따라 본 개시가 한정되는 것은 아니다.
본 명세서에서 다양한 곳에 등장하는 "일부 실시 예에서" 또는 "일 실시 예에서" 등의 어구는 반드시 모두 동일한 실시 예를 가리키는 것은 아니다.
본 개시의 일 실시 예는 기능적인 블록 구성들 및 다양한 처리 단계들로 나타내어질 수 있다. 이러한 기능 블록들의 일부 또는 전부는, 특정 기능들을 실행하는 다양한 개수의 하드웨어 및/또는 소프트웨어 구성들로 구현될 수 있다. 예를 들어, 본 개시의 기능 블록들은 하나 이상의 마이크로프로세서들에 의해 구현되거나, 소정의 기능을 위한 회로 구성들에 의해 구현될 수 있다. 또한, 예를 들어, 본 개시의 기능 블록들은 다양한 프로그래밍 또는 스크립팅 언어로 구현될 수 있다. 기능 블록들은 하나 이상의 프로세서들에서 실행되는 알고리즘으로 구현될 수 있다. 또한, 본 개시는 전자적인 환경 설정, 신호 처리, 및/또는 데이터 처리 등을 위하여 종래 기술을 채용할 수 있다. “매커니즘”, “요소”, “수단” 및 “구성”등과 같은 용어는 넓게 사용될 수 있으며, 기계적이고 물리적인 구성들로서 한정되는 것은 아니다.
또한, 도면에 도시된 구성 요소들 간의 연결 선 또는 연결 부재들은 기능적인 연결 및/또는 물리적 또는 회로적 연결들을 예시적으로 나타낸 것일 뿐이다. 실제 장치에서는 대체 가능하거나 추가된 다양한 기능적인 연결, 물리적인 연결, 또는 회로 연결들에 의해 구성 요소들 간의 연결이 나타내어질 수 있다.
이하 첨부된 도면을 참고하여 본 개시를 상세히 설명하기로 한다.
도 1은 사용자가 가상 영상을 인식하는 과정에서 발생하는 수렴-조절 불일치 현상을 설명하기 위한 도면이다.
도 1을 참조하면, 가상 현실 또는 증강 현실의 구현을 위해, 사용자의 눈과 근접한 거리에 위치한 디스플레이(110)에서 가상 영상의 광이 출력될 수 있다. 여기에서, 디스플레이(110)는 가상 영상을 구성하는 신호들을 광의 형태로 출력할 수 있는 복수의 발광 장치들(예를 들어, 112, 114, 116, 118)을 포함할 수 있다. 복수의 발광 장치들(예를 들어, 112, 114, 116, 118)은 가상 영상을 구성하는 픽셀 별로 존재할 수 있으나, 이는 일 예일 뿐, 복수의 픽셀이 포함된 픽셀 그룹 단위로 발광 장치가 존재할 수도 있다.
디스플레이(110)에서 출력되는 가상 영상의 광은 각각 사용자의 양안의 전면에 위치한 렌즈(122, 124)를 투사하여 사용자의 양안에 인식될 수 있다.
한편, 가상 영상의 광이 디스플레이(110)에서 출력되는 경우, 디스플레이 (110)의 위치가 고정됨에 따라, 가상 영상 내에서 가까운 거리에 위치하는 제 1 객체(10) 및 먼 거리에 위치하는 제 2 객체(20)의 초점 거리가 동일하게 인식되는 수렴-조절 불일치 (vergence-accommodation conflict) 현상이 발생할 수 있다. 여기에서, 수렴이란 객체에 대해 하나의 융합된 이미지를 획득하기 위해 두 눈이 서로 반대 방향으로 움직이는 융합(fusion) 과정을 의미한다. 또한, 조절이란 특정 거리에 위치한 객체에 초점을 맞추기 위해 수정체(lens)의 모양과 두께를 조정하는 포커싱 (focusing) 과정을 의미한다. 본 개시에서, 초점 거리는 조절 거리와 동일한 의미로 사용될 수 있다.
사람의 눈의 경우 일반적으로는 수렴 거리와 조절 거리가 일치한다. 다만, 3차원의 가상 영상을 시청하는 경우에는 양안이 디스플레이(110)에 초점을 맞추고 있으면서도, 가상 영상 내에 존재하는 서로 다른 깊이의 객체들(10, 20)을 인식하려고 함에 따라 수렴 거리와 조절 거리 간에 괴리가 발생할 수 있다. 즉, 조절 거리는 눈과 디스플레이(110) 사이의 거리로 동일한데 반해, 수렴 거리가 디스패리티(disparity)의 정도의 크기에 따라 계속 바뀌게 된다. 예를 들어, 도 1에서, 가까운 거리에 위치하는 제 1 객체(10)와 먼 거리에 위치하는 제 2 객체(20)의 경우, 수렴 거리는 서로 상이한 반면에, 조절 거리는 눈과 디스플레이 (110) 사이의 거리로 동일함을 확인할 수 있다.
이에 따라, 눈과 뇌가 혼란을 느끼면서 가상 영상 내에서의 객체의 거리와 사용자가 인식하는 거리 간에 괴리가 발생함에 따라, 사용자의 가상 현실 체험 시 몰입도가 저하될 뿐만 아니라, 사용자의 피로가 유발될 수 있다.
일 실시예에 따른 영상 처리 방법은, 가상 영상 제공 시 조절 거리와 수렴 거리를 일치시킬 수 있도록 객체의 깊이 정보를 고려하여, 가상 영상의 광을 출력할 수 있다. 구체적인 영상 처리 방법에 대해서는, 도 2 내지 도 10을 참조하여 후술하도록 한다.
도 2는 일 실시예에 따른 영상 처리 방법을 설명하기 위한 개념도이다.
도 2를 참조하면, 가상 현실 또는 증강 현실의 구현을 위해, 디스플레이(210)에서 가상 영상의 광이 출력될 수 있다. 여기에서, 디스플레이(210)는 일 실시예에 따른 영상 처리 방법을 수행하는 디바이스의 구성 요소로서, 디바이스는 스마트 글래스(Smart Glass), HMD(Head Mounted Display), 근안 디스플레이(near-eye display), 3차원 디스플레이 등이 있을 수 있으나, 이는 일 실시예일 뿐, 디바이스가 이에 한정되는 것은 아니다.
또한, 디스플레이(210)는 가상 영상을 구성하는 신호들을 광의 형태로 출력할 수 있는 복수의 발광 장치들(예를 들어, 212, 214, 216, 218)을 포함할 수 있다. 복수의 발광 장치들(예를 들어, 212, 214, 216, 218)은 가상 영상을 구성하는 픽셀 별로 존재할 수 있으나, 이는 일 예일 뿐, 복수의 픽셀을 포함한 픽셀 그룹 단위로 발광 장치가 존재할 수도 있다. 본 실시예에서는, 복수의 발광 장치들 중 제 1 발광 장치(212), 제 2 발광 장치(214), 제 3 발광 장치(216) 및 제 4 발광 장치(218)에서 출력되는 광을 예로 들어 디바이스의 동작에 대해 설명하도록 한다.
일 실시예에 따른 디바이스는 가상 영상에 포함된 객체들(10, 20)에 대한 수렴 거리를 결정하기 위해, 객체들(10, 20) 각각의 깊이 정보를 획득할 수 있다. 사용자가 가상 영상에서 가까운 거리에 위치한 제 1 객체(10)를 시청하는 경우, 제 1 객체(10)에 대한 수렴 거리와 조절 거리가 일치되기 위해서는 우안에 제 1 방향으로 제 1 객체(10)의 광이 입사되어야 하고, 좌안에 제 2 방향으로 제 1 객체(10)의 광이 입사되어야 한다. 디바이스는 디스플레이(210)에서, 제 1 객체(10)로부터 제 1 방향에 위치한 제 1 발광 장치(212)가 제 1 방향으로 광을 출력하도록 제어할 수 있다. 이에 따라, 사용자의 시선이 제 1 객체(10)를 향하는 경우, 제 1 방향의 광 및 제 2 방향의 광이 사용자의 우안 및 좌안의 수정체의 중심에 입사되어, 사용자는 제 1 객체(10)를 인식할 수 있다.
한편, 일 실시예에 따른 디바이스에서 출력되는 가상 영상의 광은 디스플레이 모드에 따라 결정될 수 있다. 구체적으로, 디바이스는 VR 모드에서는 가상 현실 구현을 위해 제공되는 가상 영상에 포함된 가상 객체의 깊이 정보에 기초하여 가상 영상을 출력하고, AR 모드에서는 증강 현실 구현을 위해 인식된 실세계 장면에 포함된 실세계 객체의 깊이 정보에 기초하여 가상 영상을 출력할 수 있다. 특히, AR 모드의 경우, 사용자의 시선이 객체를 따라 이동함을 고려하여, 실세계 객체 별로 가상 정보가 표시될 수 있도록 생성된 가상 영상의 광이 출력될 수 있다. 이에 대해서는, 도 4 및 도 5를 참조하여 보다 구체적으로 설명하도록 한다.
일 실시예에 따른 디바이스에서 디스플레이(210)를 통해 출력한 광은 렌티큘러 렌즈(220)를 투사할 수 있다. 렌티큘러 렌즈(220)는 사용자의 시선에 따라 서로 다른 집합의 픽셀들을 시청할 수 있도록 하는 광학 장치이다. 렌티큘러 렌즈(220)를 통해, 사용자가 시선에 따라 제 1 객체(10)를 시청하는 경우, 제 1 객체(10)의 광 이외의 다른 광이 양안에 인식되는 것을 방지할 수 있다.
여기에서, 렌티큘러 렌즈(220)는 일 실시예에 따른 영상 처리 방법을 수행하는 디바이스의 구성 요소일 수도 있고, 디바이스와 독립적인 독립형 장치(standalone device)일 수도 있다. 예를 들어, 디바이스가 웨어러블 글래스(wearable glass) 형태인 경우, 렌티큘러 렌즈(220)는 디바이스의 구성 요소일 수 있다. 다른 예에 따라, 디바이스가 컨테이너(예를 들어, HMD(head mounted display) 장치)에 결합되어 가상 현실 또는 증강 현실을 구현하는 단말기인 경우, 렌티큘러 렌즈(220)는 컨테이너의 구성 요소일 수 있다.
또한, 디바이스는 제 1 발광 장치(212)에서 출력되는 광의 방향 뿐만 아니라 광의 파장을 제어할 수도 있다. 뿐만 아니라, 디바이스는 객체들(10, 20)의 깊이 정보에 따라, 이에 대응되어 표시되는 가상 영상에 포함된 가상 객체들의 크기를 조정할 수도 있다.
일 실시예에 따라, 디스플레이(210)에서 출력되는 가상 영상의 광은 각각 사용자의 양안의 전면에 위치한 렌즈(232, 234)를 투사하여 사용자의 양안에 인식될 수 있다. 여기에서, 렌즈(232, 234)는 일 실시예에 따른 영상 처리 방법을 수행하는 디바이스의 구성 요소일 수도 있고, 디바이스와 독립적인 독립형 장치의 구성 요소일 수도 있다.
도 3은 일 실시예에 따른 영상 처리 방법을 설명하기 위한 흐름도이다.
단계 S310에서, 디바이스는 인식된 영상에 포함된 복수의 실세계 객체 또는 복수의 가상 객체를 식별할 수 있다.
일 실시예에 따른 디바이스는 디스플레이 모드에 따라, 인식된 영상에 포함된 복수의 실세계 객체 또는 복수의 가상 객체를 식별할 수 있다. 여기에서, 디스플레이 모드는 VR (virtual reality) 모드 및 AR (augmented reality) 모드를 포함할 수 있다. VR 모드는 사용자의 외부 시야가 차단된 상태에서 디바이스의 디스플레이에 가상 영상이 제공되는 동작 방식을 의미하며, AR 모드는 현실 세계에 중첩하여 가상 영상이 제공되는 동작 방식을 의미한다. 다만, 이는 일 예일 뿐, 다른 예에 따라, 디스플레이 모드는 MR (mixed reality) 모드를 포함할 수도 있다.
일 예로, 디바이스가 VR 모드로 동작하는 경우, 가상 현실 제공을 위해 디바이스는 가상 영상을 인식할 수 있다. 디바이스는 인식된 가상 영상에 포함된 복수의 가상 객체를 식별할 수 있다. 다른 예로, 디바이스가 AR 모드로 동작하는 경우, 디바이스는 현실 세계에 중첩하여 가상 객체를 표시하기 위해, 실세계 영상을 인식할 수 있다. 디바이스는 인식된 실세계 영상에 포함된 복수의 실세계 객체를 식별할 수 있다.
한편, 디스플레이 모드는 사용자 입력에 기초하여 결정될 수 있다. 이 때, 사용자 입력은 터치 입력 또는 호버링 입력 등의 형태일 수 있으나, 이는 일 예일 뿐, 사용자 입력의 형태가 전술한 예에 한정되는 것은 아니다.
단계 S320에서, 디바이스는 식별된 복수의 객체 각각의 깊이 정보를 획득할 수 있다. 객체의 깊이 정보는 디바이스의 디스플레이 또는 기 설정된 지점을 기준으로 한 객체의 거리 정보를 나타낸다.
일 실시예에 따른 디바이스는 VR 모드에서 식별된 복수의 가상 객체 각각의 깊이 정보를 획득할 수 있다. 예를 들어, 디바이스는 가상 영상으로부터 식별된 제 1 객체와 디스플레이 간의 거리가 d_v1에 해당하고, 가상 영상으로부터 식별된 제 2 객체와 디스플레이 간의 거리가 d_v2에 해당함을 나타내는 깊이 정보를 획득할 수 있다.
다른 실시예에 따른 디바이스는 AR 모드에서 식별된 복수의 실세계 객체 각각의 깊이 정보를 획득할 수 있다. 예를 들어, 디바이스는 실세계 영상으로부터 식별된 제 1 객체와 디스플레이 간의 거리가 d_a1에 해당하고, 실세계 영상으로부터 식별된 제 2 객체와 디스플레이 간의 거리가 d_a2에 해당함을 나타내는 깊이 정보를 획득할 수 있다.
단계 S330에서, 디바이스는 복수의 객체 각각의 깊이 정보에 기초하여, 식별된 복수의 객체에 대응되는 가상 영상의 광을 출력할 수 있다.
일 실시예에 따른 디바이스는 복수의 객체 각각에 대한 초점 거리가 획득한 깊이 정보에 대응될 수 있도록 가상 영상의 광을 출력할 수 있다.
디바이스는 제 1 객체에 대한 조절 거리와 수렴 거리가 일치하도록, 디스플레이에서 제 1 객체와 대응되는 영역에 포함된 발광 장치에서 출력되는 광의 방향을 결정할 수 있다. 또한, 디바이스는 제 1 객체 이외의 다른 객체에 대해서도 조절 거리와 수렴 거리가 일치하도록, 광의 방향을 제어할 수 있다.
일 실시예에 따른 디바이스는 결정된 광의 방향에 따라 가상 영상의 광을 출력할 수 있다. 디바이스로부터 출력된 가상 영상의 광은 렌티큘러 렌즈를 통해 사용자의 눈에 전달될 수 있다. 렌티큘러 렌즈는 사용자의 시선 방향에 따라 서로 다른 집합의 픽셀들을 관측하게 함으로써, 사용자가 시선 방향에 따라 서로 다른 가상 정보를 시청하게 하거나, 특정 시선 방향에 대응되는 가상 정보만을 시청하도록 할 수 있다.
도 4는 일 실시예에 따른 디바이스가 VR 모드에서 가상 영상의 광을 출력하는 방법을 설명하기 위한 도면이다.
도 4를 참조하면, 디바이스는 VR 모드로 설정됨에 따라, 복수의 가상 객체들(430, 442, 444, 446)을 포함한 가상 영상을 인식할 수 있다. 일 실시예에 따른 디바이스는 복수의 가상 객체들(430, 442, 444, 446) 각각의 깊이 정보를 고려하여, 조절 거리와 수렴 거리가 일치하도록 각 가상 객체에 대응되는 디스플레이(412, 414)의 영역의 광 출력 방향을 결정할 수 있다. 한편, 이 때, 가상 영상의 배경에 해당하는 제 1 객체(430)의 경우, 가상 영상의 전 영역에 위치함에 따라, 광 출력 방향이 기존의 광 출력 방향과 동일하게 설정될 수 있다.
일 실시예에 따른 디바이스는, 제 2 객체(442)의 깊이 정보를 획득할 수 있다. 디바이스는 획득한 깊이 정보를 기초로 제 2 객체(442)에 대해 수렴 거리와 조절 거리를 일치시키기 위한 광의 출력 방향을 결정할 수 있다. 예를 들어, 광의 출력 방향은, 우안 및 좌안에 대해, 제 2 객체(442)로부터 사용자의 우안 및 좌안의 중심을 연결한 직선의 방향인 제 1 방향 및 제 2 방향일 수 있다. 디바이스는 우안의 디스플레이(412) 상에서 제 2 객체(442)로부터 제 1 방향에 위치한 픽셀의 발광 장치가 제 1 방향으로 제 2 객체(442)의 광을 출력하도록 제어할 수 있다. 또한, 디바이스는 좌안의 디스플레이(414) 상에서 제 2 객체로부터 제 2 방향에 위치한 픽셀의 발광 장치가 제 2 방향으로 제 2 객체(442)의 광을 출력하도록 제어할 수 있다.
전술한 방식은 다른 깊이 값의 지점에 위치하는 제 3 객체(444) 및 제 4 객체(446)에도 동일하게 적용될 수 있다.
한편, 디스플레이(412, 414)에서 출력되는 가상 영상의 광은 각각 사용자의 양안의 전면에 위치한 렌즈(422, 424)를 투사하여 사용자의 양안에 인식될 수 있다.
도 5는 일 실시예에 따른 디바이스가 AR 모드에서 가상 영상의 광을 출력하는 방법을 설명하기 위한 도면이다.
도 5를 참조하면, 디바이스는 AR 모드로 설정됨에 따라, 복수의 실세계 객체들(530, 540)을 포함한 실세계 영상을 인식할 수 있다. 일 실시예에 따른 디바이스는 복수의 실세계 객체들(530, 540) 각각의 깊이 정보를 고려하여, 조절 거리와 수렴 거리가 일치하도록 각 실세계 객체에 대응되는 디스플레이(412, 414)의 영역의 광 출력 방향을 결정할 수 있다. 디바이스는 일반적으로 사용자의 시선은 객체를 향한다는 점을 이용하여, 사용자의 시선을 추적하는 시선 추적 장치 없이도, 실세계 객체의 위치에 가상 정보를 표시하여, 증강 현실을 구현할 수 있다.
예를 들어, 디바이스는, 실세계 영상에 포함된 제 1 객체(530) 및 제 2 객체(540)의 깊이 정보를 획득할 수 있다. 이 때, 제 1 객체(530) 및 제 2 객체(540)의 깊이 정보는 각각 d1 및 d2인 것으로 가정한다. 디바이스는 실세계 객체들(530, 540) 각각의 대해 깊이 정보를 고려하여, 해당 깊이 정보에서 가상 정보가 인식될 수 있도록 가상 영상의 광을 출력할 수 있다.
본 실시예에서, 디바이스는 제 1 객체(530)의 경우, 깊이 정보 d1을 기초로 조절 거리와 수렴 거리가 일치되기 위한 광의 출력 방향을 우안 및 좌안에 대해 각각 제 1 방향 및 제 2 방향으로 결정할 수 있다. 또한, 디바이스는 제 2 객체(540)의 경우, 깊이 정보 d2를 기초로 조절 거리와 수렴 거리가 일치되기 위한 광의 출력 방향을 우안 및 좌안에 대해 각각 제 3 방향 및 제 4 방향으로 결정할 수 있다.
이에 따라, 디바이스는 디스플레이(412, 414)에서 제 1 객체(530)로부터 각각 제 1 방향 및 제 2 방향에 위치한 픽셀의 발광 장치가 제 1 방향 및 제 2 방향으로 가상 정보의 광을 출력하도록 제어할 수 있다. 또한, 디바이스는 디스플레이(412, 414)에서 제 2 객체(540)로부터 각각 제 3 방향 및 제 4 방향에 위치한 발광 장치가 제 3 방향 및 제 4 방향으로 가상 정보의 광을 출력하도록 제어할 수 있다.
한편, 일 실시예에 따른 제 1 객체(530) 및 제 2 객체(540)에 대해 모두 동일한 가상 정보를 포함한 가상 영상의 광이 출력되도록 디스플레이(412, 414)를 제어할 수 있다. 이에 따라, 눈이 가상 객체들을 인식하기 위해 단속성 운동을 수행하는 경우에도 실세계 객체 별로 가상 정보를 표시할 수 있어, 사용자의 증강 현실에 대한 몰입도를 향상시킬 수 있다.
한편, 디스플레이(412, 414)에서 출력되는 가상 영상의 광은 각각 사용자의 양안의 전면에 위치한 렌즈(422, 424)를 투사하여 사용자의 양안에 인식될 수 있다.
도 6은 일 실시예에 따른 AR 모드에서의 영상 처리 방법을 보다 구체적으로 설명하기 위한 도면이다.
도 6을 참조하면, 일 실시예에 따른 영상 처리 시스템은, 디바이스(620), 입력 프리즘(630), 렌티큘러 렌즈(640), 확대 렌즈(650) 및 투명 거울(660)을 포함할 수 있다.
일 실시예에 따른 디바이스(620)는 카메라를 통해 실세계 영상을 인식할 수 있다. 여기에서, 디바이스(620)는 도 5를 참조하여 전술한 디바이스의 동작을 수행할 수 있다. 디바이스(620)는 인식된 실세계 영상에 포함된 객체들의 깊이 정보를 결정할 수 있다. 예를 들어, 디바이스(620)는 실세계 영상에 포함된 차량(610)의 깊이 정보를 dx로 결정할 수 있다.
디바이스(620)는 일반적으로 사용자의 시선이 객체를 향하는 점을 고려하여, 차량(610)의 깊이 정보와 대응되는 위치에 가상 정보를 포함하는 가상 영상의 광을 출력할 수 있다. 또한, 디바이스(620)는 차량(610)의 깊이 정보와 대응되는 위치에 가상 정보를 표시하면서, 가상 정보에 대한 조절 거리와 수렴 거리가 일치되도록 광의 출력 방향을 제어할 수 있다. 예를 들어, 디바이스(620)는 가상 정보로, "car"라는 가상 정보(670)를 표시하고자 하는 경우, "car"라는 가상 정보(670)의 조절 거리와 수렴 거리가 차량(610)의 깊이 정보인 dx에 대응되도록 광의 출력 방향을 제어할 수 있다. 구체적으로, 디바이스(620)는 차량(610)으로부터 사용자의 양안의 중심을 연결한 직선의 방향으로 광의 출력 방향을 결정할 수 있다.
일 실시예에 따른 디바이스(620)는 결정된 광의 출력 방향에 기초하여 가상 정보인 "car"라는 가상 정보(670)를 포함한 가상 영상의 광을 출력할 수 있다. 한편, 본 개시에서는 하나의 실세계 객체에 대해서 가상 정보를 표시하는 방법에 대해 설명하였으나, 일 실시예에 따른 디바이스는 실세계 장면에 복수의 실세계 객체가 존재하는 경우, 각 실세계 객체에 대해 모두 대응되는 위치에 "car"라는 가상 정보(670)가 표시되도록 광의 출력 방향을 제어할 수 있다.
디바이스(620)에서 출력된 광은 입력 프리즘(630)을 통해 렌티큘러 렌즈(640)에 전달될 수 있다. 렌티큘러 렌즈(640)를 통해, 사용자의 시선에 대응되는 위치에 표시되는 가상 정보 만이 사용자에게 인식될 수 있다.
한편, 렌티큘러 렌즈(640)를 투과한 광은 확대 렌즈(650) 및 투명 거울(660)을 통해 사용자의 양안에 입사될 수 있다. 이에 따라, 사용자는 실세계 객체인 차량(610)의 깊이 정보와 대응되는 위치에 "car"라는 가상 정보(670)를 차량(610)과 함께 인식할 수 있다.
도 7은 일 실시예에 따른 디스플레이 모드에 따라 디바이스를 착용한 사용자의 모습을 도시한 도면이다.
일 실시예에 따른 영상 시스템(700)은 증강 현실을 구현하는 AR 모드 및 가상 현실을 구현하는 VR 모드를 모두 지원할 수 있다. 한편, 영상 시스템(700)은 디바이스(710) 및 컨테이너(720)를 포함할 수 있다. 본 실시예의 디바이스(710)는 도 2 내지 도 6을 참조하여 전술한 디바이스에 대응될 수 있다.
일 실시예에 따른 영상 시스템(700)이 VR 모드로 동작하는 경우, 사용자의 외부 시야를 차단하기 위해, 디바이스(710)가 컨테이너(720)의 전면을 덮도록 배치될 수 있다. 이에 따라, 영상 시스템(700)을 이용하는 사용자는 외부 시야가 차단된 채로, 디바이스(710)의 디스플레이를 통해 가상 영상을 시청함에 따라 가상 현실을 체험할 수 있다.
한편, 다른 실시예에 따라 영상 시스템(700)이 AR 모드로 동작하는 경우에는 실세계에 중첩하여 가상 영상을 표시하기 위해, 컨테이너의 전면이 개방되도록 디바이스(710)는 컨테이너(720)에 수평하게 배치될 수 있다. 이에 따라, 영상 시스템(700)을 이용하는 사용자는 실세계를 인지하면서도, 실세계와 중첩되어 가상 영상을 시청함으로써 증강 현실을 체험할 수 있다.
도 8은 일 실시예에 따른 디바이스가 가상 영상의 처리를 위해 가상 영상의 광을 투사하는 렌즈(822, 824)를 이동시키는 방법을 설명하기 위한 도면이다.
도 8을 참조하면, 일 실시예에 따른 디바이스는 식별된 객체의 깊이 정보에 따라 가상 영상의 광을 투사하는 렌즈(822, 824)의 위치를 결정할 수 있다. 예를 들어, 디바이스는, 제 1 객체(830)의 깊이 정보와 현재의 제 1 렌즈(822) 및 제 2 렌즈(824)의 위치를 기초로, 제 1 렌즈(822) 및 제 2 렌즈(824)를 투사한 제 1 객체(830)의 광이 사용자의 양안에 포커싱되는지 여부를 판단할 수 있다. 디바이스는 제 1 객체(830)의 광이 사용자의 양안에 포커싱되지 않는다고 판단함에 따라, 제 1 렌즈(822) 및 제 2 렌즈(824)의 위치를 조정할 수 있다.
다른 예에 따라, 디바이스는, 제 2 객체(840)의 깊이 정보와 현재의 제 1 렌즈(822) 및 제 2 렌즈(824)의 위치를 기초로, 제 1 렌즈(822) 및 제 2 렌즈(824)를 투사한 제 2 객체(840)의 광이 사용자의 양안에 포커싱되는지 여부를 판단할 수 있다. 디바이스는 제 2 객체(840)의 광이 사용자의 좌안에 포커싱되지 않는다고 판단함에 따라, 제 1 렌즈(822) 및 제 2 렌즈(824) 중 제 2 렌즈(824)의 위치를 선택적으로 조정할 수 있다.
한편, 일 실시예에 따른 렌즈(822, 824)는 디바이스의 내부에 포함될 수도 있고, 디바이스와 독립적인 장치에 포함될 수 있다. 예를 들어, 디바이스가 컨테이너에 결합되어 사용자에게 증강 현실 또는 가상 현실을 제공하는 경우, 렌즈(822, 824)는 컨테이너에 포함될 수도 있다. 컨테이너의 일 예로는 도 7을 참조하여 전술한 바와 같이, HMD 디스플레이가 포함될 수 있다.
도 9 및 도 10은 일 실시예에 따른 디바이스(900)의 구성을 설명하기 위한 블록도이다.
도 9에 도시된 바와 같이, 일 실시예에 따른 디바이스(900)는, 출력부(910), 적어도 하나의 프로세서(920) 및 메모리(970)를 포함할 수 있다. 그러나 도시된 구성요소 모두가 필수구성요소인 것은 아니다. 도시된 구성요소보다 많은 구성요소에 의해 디바이스(900)가 구현될 수도 있고, 그보다 적은 구성요소에 의해서도 디바이스(900)는 구현될 수 있다. 예를 들어, 도 10에 도시된 바와 같이, 일 실시예에 따른 디바이스(900)는, 출력부(910), 적어도 하나의 프로세서(920) 및 메모리(970) 이외에 센서(930), 통신부(950), 사용자 입력부(960) 및 메모리(970)를 더 포함할 수도 있다.
이하 상기 구성요소들에 대해 차례로 살펴본다.
출력부(910)는, 오디오 신호 또는 비디오 신호 또는 진동 신호의 출력을 위한 것으로, 이에는 디스플레이(911)와 음향 출력부(912), 진동 모터(913) 등이 포함될 수 있다.
디스플레이(911)는 디바이스(900)에서 처리되는 정보를 표시 출력한다. 예를 들어, 디스플레이(911)는 가상 영상 또는 실세계 영상을 출력할 수 있다. 또한, 디스플레이(911)는 정보를 광의 형태로 출력하기 위해 적어도 하나의 발광 장치를 포함할 수 있다. 예를 들어, 디스플레이(911)에 가상 영상의 광이 출력되는 경우, 디스플레이(911)에는 픽셀 단위로 발광 장치가 존재할 수 있다.
일 실시예에 의하면, 디스플레이(911)는, 투명 디스플레이일 수 있다. 투명 디스플레이란 정보를 표시하는 스크린의 뒷면이 비치는 형태의 정보 표시 장치를 말한다. 투명 디스플레이는 투명 소자로 구성되고, 투명 소자에 대한 광 투과율을 조절하여 투명도를 조절하거나 각 픽셀의 RGB값을 조절하여 투명도를 조절할 수 있다.
한편, 디스플레이(911)와 터치패드가 레이어 구조를 이루어 터치 스크린으로 구성되는 경우, 디스플레이(911)는 출력 장치 이외에 입력 장치로도 사용될 수 있다.
디스플레이(911)는, 액정 디스플레이(liquid crystal display), 박막 트랜지스터 액정 디스플레이(thin film transistor-liquid crystal display), 유기 발광 다이오드(organic light-emitting diode), 플렉시블 디스플레이(flexible display), 3차원 디스플레이(3D display), 전기영동 디스플레이(electrophoretic display) 중에서 적어도 하나를 포함할 수 있다. 그리고 디바이스(900)의 구현 형태에 따라 디바이스(900)는 디스플레이(911)를 2개 이상 포함할 수도 있다.
음향 출력부(912)는 통신부(950)로부터 수신되거나 메모리(970)에 저장된 오디오 데이터를 출력할 수 있다. 또한, 음향 출력부(912)는 디바이스(900)에서 수행되는 기능(예를 들어, 진정 사용자의 손 식별, 애플리케이션 실행, 호신호 수신음, 메시지 수신음 등)과 관련된 음향 신호를 출력한다. 이러한 음향 출력부(912)에는 스피커(speaker), 버저(Buzzer) 등이 포함될 수 있다.
진동 모터(913)는 진동 신호를 출력할 수 있다. 예를 들어, 진동 모터(913)는 오디오 데이터 또는 비디오 데이터(예컨대, 호신호 수신음, 메시지 수신음 등)의 출력에 대응하는 진동 신호를 출력할 수 있다. 또한, 진동 모터(913)는, 사용자 입력이 발생되는 경우, 이에 대응하는 진동 신호를 출력할 수도 있다.
프로세서(920)는, 통상적으로 디바이스(900)의 전반적인 동작을 제어한다. 예를 들어, 프로세서(920)는, 메모리(970)에 저장된 프로그램들을 실행함으로써, 출력부(910), 적어도 하나의 센서(930), 통신부(950), 사용자 입력부(960) 및 메모리(970) 등을 전반적으로 제어할 수 있다.
일 실시예에 따른 프로세서(920)는 영상을 인식할 수 있다. 예를 들어, 프로세서(920)는 VR 모드로 동작하는 경우, 가상 현실의 구현을 위해 적어도 하나의 가상 영상을 인식할 수 있다. 다른 예에 따라, 프로세서(920)는 VR 모드로 동작하는 경우, 증강 현실의 구현을 위해 적어도 하나의 실세계 영상을 인식할 수 있다.
프로세서(920)는 인식된 영상에 포함된 복수의 실세계 객체 또는 복수의 가상 객체를 식별할 수 있다. 예를 들어, 프로세서(920)는 VR 모드로 동작하는 경우, 인식된 가상 영상에 포함된 복수의 가상 객체를 식별할 수 있다. 다른 예에 따라, 프로세서(920)는 AR 모드로 동작하는 경우, 인식된 실세계 영상에 포함된 복수의 실세계 객체를 식별할 수 있다.
프로세서(920)는 식별된 복수의 객체 각각의 깊이 정보를 획득할 수 있다. 또한, 프로세서(920)는 복수의 객체 각각의 깊이 정보에 기초하여, 식별된 복수의 객체에 대응되는 가상 영상의 광을 출력하도록 디스플레이(911)를 제어할 수 있다. 예를 들어, 프로세서(920)는 가상 영상을 구성하는 각 픽셀에 대한 광 출력 방향을 획득된 복수의 객체 각각의 깊이 정보에 기초하여 결정할 수 있다. 프로세서(920)는 결정된 광 출력 방향에 따라 광을 출력하도록 디스플레이(911)를 제어할 수 있다.
보다 구체적으로, 프로세서(920)는 디스플레이 모드가 VR 모드로 결정된 경우, 복수의 가상 객체 각각의 깊이 정보를 기초로 가상 영상에서 복수의 가상 객체 각각에 대응되는 위치의 픽셀의 초점 거리를 결정할 수 있다. 프로세서(920)는 결정된 초점 거리에 따라 광을 출력하도록 디스플레이(911)를 제어할 수 있다.
다른 예에 따라, 프로세서(920)는 디스플레이 모드가 AR 모드로 결정된 경우, 복수의 실세계 객체 각각의 깊이 정보를 기초로 초점 거리를 결정할 수 있다. 프로세서(920)는 결정된 초점 거리 별로 광을 출력하도록 디스플레이(911)를 제어할 수 있다.
일 실시예에 따른 프로세서(920)는 디스플레이(911)를 통해 출력되는 광이 투사되는 렌즈의 위치를 제어할 수 있다. 예를 들어, 프로세서(920)는 획득된 복수의 객체 각각의 깊이 정보에 기초하여, 복수의 객체 각각에 대한 조절 거리와 수렴 거리가 일치되는 렌즈의 위치를 결정할 수 있다. 프로세서(920)는 결정된 위치에 따라 렌즈를 이동시킬 수 있다.
적어도 하나의 센서(930)는, 디바이스(900)의 상태 또는 디바이스(900)의 주변의 상태를 감지하고, 감지된 정보를 프로세서(920)로 전달할 수 있다.
일 실시예에 의하면, 적어도 하나의 센서(930)는, 지자기 센서(931), 초음파 센서(932), IMU 센서(933), 적외선 센서(934), 위치 센서(935), 깊이 센서(936), 근접 센서(937), 광 센서(938), 자이로스코프 센서(939), 카메라(이미지 센서)(940), 마이크로폰(941)을 포함할 수 있으나, 이에 한정되는 것은 아니다. 각 센서들의 기능은 그 명칭으로부터 당업자가 직관적으로 추론할 수 있으므로, 구체적인 설명은 생략하기로 한다.
통신부(950)는, 디바이스(900)와 외부 장치(2000)(예컨대, 서버 장치, 모바일 단말 등) 간의 통신을 하게 하는 하나 이상의 구성요소를 포함할 수 있다. 예를 들어, 통신부(950)는, 근거리 통신부(951), 이동 통신부(952) 및 방송 수신부(953)를 포함할 수 있다.
근거리 통신부(short-range wireless communication unit)(951)는, 블루투스 통신부, BLE(Bluetooth Low Energy) 통신부, 근거리 무선 통신부(Near Field Communication unit), WLAN(와이파이) 통신부, 지그비(Zigbee) 통신부, 적외선(IrDA, infrared Data Association) 통신부, WFD(Wi-Fi Direct) 통신부, UWB(ultra wideband) 통신부, Ant+ 통신부 등을 포함할 수 있으나, 이에 한정되는 것은 아니다.
이동 통신부(952)는, 이동 통신망 상에서 기지국, 외부의 단말, 서버 중 적어도 하나와 무선 신호를 송수신한다. 여기에서, 무선 신호는, 영상 신호, 음성 호 신호, 화상 통화 호 신호 또는 문자/멀티미디어 메시지 송수신에 따른 다양한 형태의 데이터를 포함할 수 있다.
방송 수신부(953)는, 방송 채널을 통하여 외부로부터 방송 신호 및/또는 방송 관련된 정보를 수신한다. 방송 채널은 위성 채널, 지상파 채널을 포함할 수 있다. 구현 예에 따라서 디바이스(900)는 방송 수신부(953)를 포함하지 않을 수도 있다.
사용자 입력부(960)는, 사용자가 디바이스(900)를 제어하기 위한 데이터를 입력하는 수단을 의미한다. 예를 들어, 사용자 입력부(960)에는 키 패드(key pad), 돔 스위치 (dome switch), 터치 패드(접촉식 정전 용량 방식, 압력식 저항막 방식, 적외선 감지 방식, 표면 초음파 전도 방식, 적분식 장력 측정 방식, 피에조 효과 방식 등), 조그 휠, 조그 스위치 등이 있을 수 있으나, 이에 한정되는 것은 아니다.
일 실시예에 의하면, 사용자 입력부(960)는 터치 입력 또는 호버링 입력 등의 사용자 입력을 검출할 수 있다. 또한, 구현 예에 따라, 사용자 입력부(960)는 사용자의 제스처를 검출하는 제스처 검출부를 포함할 수도 있다. 예를 들어, 사용자 입력부(960)는 디스플레이 모드를 결정하기 위한 사용자 입력을 검출할 수 있다.
메모리(970)는, 프로세서(920)의 처리 및 제어를 위한 프로그램을 저장할 수도 있고, 입/출력되는 데이터들(예컨대, 가상 영상, 실세계 영상 등)을 저장할 수도 있고, 하나 이상의 인스트럭션을 저장할 수도 있다.
메모리(970)는 플래시 메모리 타입(flash memory type), 하드디스크 타입(hard disk type), 멀티미디어 카드 마이크로 타입(multimedia card micro type), 카드 타입의 메모리(예를 들어 SD 또는 XD 메모리 등), 램(RAM, Random Access Memory) SRAM(Static Random Access Memory), 롬(ROM, Read-Only Memory), EEPROM(Electrically Erasable Programmable Read-Only Memory), PROM(Programmable Read-Only Memory), 자기 메모리, 자기 디스크, 광디스크 중 적어도 하나의 타입의 저장매체를 포함할 수 있다. 메모리(970)에 저장된 프로그램들은 그 기능에 따라 복수 개의 모듈들로 분류할 수 있다.
한편, 본 개시의 상세한 설명에서는 구체적인 실시 예에 관해 설명하였으나, 본 개시의 범위에서 벗어나지 않는 한도 내에서 여러 가지 변형이 가능함은 물론이다. 그러므로, 본 개시의 범위는 설명된 실시 예에 국한되어 정해져서는 안되며 후술하는 특허청구의 범위뿐만 아니라 이 특허청구의 범위와 균등한 것들에 의해 정해져야 한다.
본 개시에서 개시된 블록도들은 본 개시의 원리들을 구현하기 위한 회로를 개념적으로 표현한 형태라고 당업자에게 해석될 수 있을 것이다. 유사하게, 임의의 흐름 차트, 흐름도, 상태 전이도, 의사코드 등은 컴퓨터 판독가능 매체에서 실질적으로 표현되어, 컴퓨터 또는 프로세서가 명시적으로 도시되든지 아니든지 간에 이러한 컴퓨터 또는 프로세서에 의해 실행될 수 있는 다양한 프로세스를 나타낸다는 것이 당업자에게 인식될 것이다. 따라서, 상술한 본 개시의 실시예들은 컴퓨터에서 실행될 수 있는 프로그램으로 작성가능하고, 컴퓨터로 읽을 수 있는 기록매체를 이용하여 상기 프로그램을 동작시키는 범용 디지털 컴퓨터에서 구현될 수 있다. 상기 컴퓨터로 읽을 수 있는 기록매체는 마그네틱 저장매체(예를 들면, 롬, 플로피 디스크, 하드디스크 등), 광학적 판독 매체(예를 들면, 시디롬, 디브이디 등)와 같은 저장매체를 포함한다.
도면들에 도시된 다양한 요소들의 기능들은 적절한 소프트웨어와 관련되어 소프트웨어를 실행할 수 있는 하드웨어뿐만 아니라 전용 하드웨어의 이용을 통해 제공될 수 있다. 프로세서에 의해 제공될 때, 이런 기능은 단일 전용 프로세서, 단일 공유 프로세서, 또는 일부가 공유될 수 있는 복수의 개별 프로세서에 의해 제공될 수 있다. 또한, 용어 "프로세서" 또는 "제어부"의 명시적 이용은 소프트웨어를 실행할 수 있는 하드웨어를 배타적으로 지칭하는 것으로 해석되지 말아야 하며, 제한 없이, 디지털 신호 프로세서(DSP) 하드웨어, 소프트웨어를 저장하기 위한 판독 전용 메모리(ROM), 랜덤 액세스 메모리(RAM), 및 비휘발성 저장장치를 묵시적으로 포함할 수 있다.
본 명세서의 청구항들에서, 특정 기능을 수행하기 위한 수단으로서 표현된 요소는 특정 기능을 수행하는 임의의 방식을 포괄하고, 이러한 요소는 특정 기능을 수행하는 회로 요소들의 조합, 또는 특정 기능을 수행하기 위한 소프트웨어를 수행하기 위해 적합한 회로와 결합된, 펌웨어, 마이크로코드 등을 포함하는 임의의 형태의 소프트웨어를 포함할 수 있다.
본 명세서에서 본 개시의 원리들의 '일 실시예'와 이런 표현의 다양한 변형들의 지칭은 이 실시예와 관련되어 특정 특징, 구조, 특성 등이 본 개시의 원리의 적어도 하나의 실시예에 포함된다는 것을 의미한다. 따라서, 표현 '일 실시예에서'와, 본 명세서 전체를 통해 개시된 임의의 다른 변형례들은 반드시 모두 동일한 실시예를 지칭하는 것은 아니다.
본 명세서에서, 'A와 B 중 적어도 하나'의 경우에서 '~중 적어도 하나'의 표현은, 첫 번째 옵션 (A)의 선택만, 또는 두 번째 열거된 옵션 (B)의 선택만, 또는 양쪽 옵션들 (A와 B)의 선택을 포괄하기 위해 사용된다. 추가적인 예로 'A, B, 및 C 중 적어도 하나'의 경우는, 첫 번째 열거된 옵션 (A)의 선택만, 또는 두 번째 열거된 옵션 (B)의 선택만, 또는 세 번째 열거된 옵션 (C)의 선택만, 또는 첫 번째와 두 번째 열거된 옵션들 (A와 B)의 선택만, 또는 두 번째와 세 번째 열거된 옵션 (B와 C)의 선택만, 또는 모든 3개의 옵션들의 선택(A와 B와 C)이 포괄할 수 있다. 더 많은 항목들이 열거되는 경우에도 당업자에게 명백하게 확장 해석될 수 있다.
이제까지 본 개시에 대하여 그 바람직한 실시예들을 중심으로 살펴보았다.
본 명세서를 통해 개시된 모든 실시예들과 조건부 예시들은, 본 개시의 기술 분야에서 통상의 지식을 가진 당업자가 독자가 본 개시의 원리와 개념을 이해하도록 돕기 위한 의도로 기술된 것으로, 당업자는 본 개시가 본 개시의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 개시의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 개시에 포함된 것으로 해석되어야 할 것이다.

Claims (15)

  1. 디바이스에 인식된 영상에 포함된 복수의 실세계 객체(Real-world Object) 또는 복수의 가상 객체(Virtual Object)를 식별하는 단계;
    상기 식별된 복수의 객체 각각의 깊이 정보를 획득하는 단계; 및
    상기 복수의 객체 각각의 깊이 정보에 기초하여, 상기 식별된 복수의 객체에 대응되는 가상 영상의 광을 출력하는 단계를 포함하는, 영상을 처리하는 방법.
  2. 제 1항에 있어서, 상기 출력하는 단계는,
    상기 가상 영상을 구성하는 각 픽셀에 대한 광 출력 방향을 상기 복수의 객체 각각의 깊이 정보에 기초하여 결정하는 단계; 및
    상기 결정된 광 출력 방향에 따라, 상기 광을 출력하는 단계를 포함하는, 영상을 처리하는 방법.
  3. 제 2항에 있어서,
    상기 출력된 광은, 상기 디바이스에 구비된 렌티큘러 렌즈를 통해 상기 디바이스를 착용한 사용자의 눈에 전달되는, 영상을 처리하는 방법.
  4. 제 1항에 있어서,
    상기 디바이스의 디스플레이 모드를 결정하는 단계를 더 포함하고,
    상기 식별하는 단계는,
    상기 디스플레이 모드가 VR(virtual reality) 모드인 경우, 상기 인식된 영상에 포함된 복수의 가상 객체를 식별하고,
    상기 디스플레이 모드가 AR(augmented reality) 모드인 경우, 상기 인식된 영상에 포함된 복수의 실세계 객체를 식별하는, 영상을 처리하는 방법.
  5. 제 4항에 있어서, 상기 출력하는 단계는,
    상기 디스플레이 모드가 상기 VR 모드로 결정됨에 따라, 상기 복수의 가상 객체 각각의 깊이 정보를 기초로 상기 가상 영상에서 상기 복수의 가상 객체 각각에 대응되는 위치의 픽셀의 초점 거리를 결정하는 단계; 및
    상기 결정된 초점 거리에 따라 상기 광을 출력하는 단계를 포함하는, 영상을 처리하는 방법.
  6. 제 4항에 있어서, 상기 출력하는 단계는,
    상기 디스플레이 모드가 상기 AR 모드로 결정됨에 따라, 상기 복수의 실세계 객체 각각의 깊이 정보를 기초로 초점 거리를 결정하는 단계; 및
    상기 결정된 초점 거리 별로 상기 광을 출력하는 단계를 포함하는, 영상을 처리하는 방법.
  7. 제 1항에 있어서,
    상기 복수의 객체 각각의 깊이 정보에 기초하여, 상기 디바이스에서 상기 광을 투사하는 렌즈의 위치를 결정하는 단계; 및
    상기 결정된 위치에 따라 상기 렌즈를 이동시키는 단계를 더 포함하는, 영상을 처리하는 방법.
  8. 디스플레이;
    하나 이상의 인스트럭션을 저장하는 메모리; 및
    상기 메모리에 저장된 상기 하나 이상의 인스트럭션을 실행하는 적어도 하나의 프로세서를 포함하고,
    상기 적어도 하나의 프로세서는, 상기 하나 이상의 인스트럭션을 실행함으로써,
    인식된 영상에 포함된 복수의 실세계 객체 또는 복수의 가상 객체를 식별하고,
    상기 식별된 복수의 객체 각각의 깊이 정보를 획득하며,
    상기 복수의 객체 각각의 깊이 정보에 기초하여, 상기 식별된 복수의 객체에 대응되는 가상 영상의 광을 출력하도록 상기 디스플레이를 제어하는, 영상을 처리하는 디바이스.
  9. 제 8항에 있어서, 상기 적어도 하나의 프로세서는, 상기 하나 이상의 인스트럭션을 실행함으로써,
    상기 가상 영상을 구성하는 각 픽셀에 대한 광 출력 방향을 상기 복수의 객체 각각의 깊이 정보에 기초하여 결정하고,
    상기 결정된 광 출력 방향에 따라 상기 광을 출력하도록 상기 디스플레이를 제어하는, 영상을 처리하는 디바이스.
  10. 제 8항에 있어서,
    렌티큘러 렌즈를 더 포함하고,
    상기 출력된 광은, 상기 렌티큘러 렌즈를 통해 상기 디바이스를 착용한 사용자의 눈에 전달되는, 영상을 처리하는 디바이스.
  11. 제 8항에 있어서, 상기 적어도 하나의 프로세서는, 상기 하나 이상의 인스트럭션을 실행함으로써,
    디스플레이 모드를 결정하고,
    상기 디스플레이 모드가 VR(virtual reality) 모드인 경우, 상기 인식된 영상에 포함된 복수의 가상 객체를 식별하며,
    상기 디스플레이 모드가 AR(augmented reality) 모드인 경우, 상기 인식된 영상에 포함된 복수의 실세계 객체를 식별하는, 영상을 처리하는 디바이스.
  12. 제 11항에 있어서, 상기 적어도 하나의 프로세서는, 상기 하나 이상의 인스트럭션을 실행함으로써,
    상기 디스플레이 모드가 상기 VR 모드로 결정됨에 따라, 상기 복수의 가상 객체 각각의 깊이 정보를 기초로 상기 가상 영상에서 상기 복수의 가상 객체 각각에 대응되는 위치의 픽셀의 초점 거리를 결정하고,
    상기 결정된 초점 거리에 따라 상기 광을 출력하도록 상기 디스플레이를 제어하는, 영상을 처리하는 디바이스.
  13. 제 11항에 있어서, 상기 적어도 하나의 프로세서는, 상기 하나 이상의 인스트럭션을 실행함으로써,
    상기 디스플레이 모드가 상기 AR 모드로 결정됨에 따라, 상기 복수의 실세계 객체 각각의 깊이 정보를 기초로 초점 거리를 결정하고,
    상기 결정된 초점 거리 별로 상기 광을 출력하도록 상기 디스플레이를 제어하는, 영상을 처리하는 디바이스.
  14. 제 11항에 있어서, 상기 적어도 하나의 프로세서는, 상기 하나 이상의 인스트럭션을 실행함으로써,
    상기 복수의 객체 각각의 깊이 정보에 기초하여, 상기 렌즈의 위치를 결정하고,
    상기 결정된 위치에 따라 상기 렌즈를 이동시키는, 영상을 처리하는 디바이스.
  15. 디바이스에 인식된 영상에 포함된 복수의 실세계 객체 또는 복수의 가상 객체를 식별하는 동작;
    상기 식별된 복수의 객체 각각의 깊이 정보를 획득하는 동작; 및
    상기 복수의 객체 각각의 깊이 정보에 기초하여, 상기 식별된 복수의 객체에 대응되는 가상 영상의 광을 출력하는 동작을 수행하도록 하는 프로그램이 저장된 기록매체를 포함하는, 컴퓨터 프로그램 제품.
KR1020190007131A 2019-01-18 2019-01-18 영상을 처리하는 방법 및 디바이스 KR20200090315A (ko)

Priority Applications (4)

Application Number Priority Date Filing Date Title
KR1020190007131A KR20200090315A (ko) 2019-01-18 2019-01-18 영상을 처리하는 방법 및 디바이스
EP20741300.6A EP3893499A4 (en) 2019-01-18 2020-01-17 METHOD AND DEVICE FOR PROCESSING IMAGES
US17/423,753 US20220114811A1 (en) 2019-01-18 2020-01-17 Method and device for processing image
PCT/KR2020/000853 WO2020149692A1 (ko) 2019-01-18 2020-01-17 영상을 처리하는 방법 및 디바이스

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190007131A KR20200090315A (ko) 2019-01-18 2019-01-18 영상을 처리하는 방법 및 디바이스

Publications (1)

Publication Number Publication Date
KR20200090315A true KR20200090315A (ko) 2020-07-29

Family

ID=71613820

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190007131A KR20200090315A (ko) 2019-01-18 2019-01-18 영상을 처리하는 방법 및 디바이스

Country Status (4)

Country Link
US (1) US20220114811A1 (ko)
EP (1) EP3893499A4 (ko)
KR (1) KR20200090315A (ko)
WO (1) WO2020149692A1 (ko)

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102005009437A1 (de) * 2005-03-02 2006-09-07 Kuka Roboter Gmbh Verfahren und Vorrichtung zum Einblenden von AR-Objekten
US9183676B2 (en) * 2012-04-27 2015-11-10 Microsoft Technology Licensing, Llc Displaying a collision between real and virtual objects
US9405122B2 (en) * 2014-01-29 2016-08-02 Ricoh Co., Ltd Depth-disparity calibration of a binocular optical augmented reality system
US10175492B2 (en) * 2015-04-24 2019-01-08 Eon Reality, Inc. Systems and methods for transition between augmented reality and virtual reality
US10025060B2 (en) * 2015-12-08 2018-07-17 Oculus Vr, Llc Focus adjusting virtual reality headset
CA3017930A1 (en) * 2016-03-25 2017-09-28 Magic Leap, Inc. Virtual and augmented reality systems and methods
US10271033B2 (en) * 2016-10-31 2019-04-23 Verizon Patent And Licensing Inc. Methods and systems for generating depth data by converging independently-captured depth maps
US10241329B2 (en) * 2017-07-13 2019-03-26 Google Llc Varifocal aberration compensation for near-eye displays

Also Published As

Publication number Publication date
US20220114811A1 (en) 2022-04-14
WO2020149692A1 (ko) 2020-07-23
EP3893499A1 (en) 2021-10-13
EP3893499A4 (en) 2022-03-09

Similar Documents

Publication Publication Date Title
US10645374B2 (en) Head-mounted display device and display control method for head-mounted display device
US10338389B2 (en) Head mounted display device for displaying image and method thereof
US9360671B1 (en) Systems and methods for image zoom
US11809623B2 (en) Head-mounted display device and operating method of the same
US20130088413A1 (en) Method to Autofocus on Near-Eye Display
US11378802B2 (en) Smart eyeglasses
US20150153572A1 (en) Adjustment of Location of Superimposed Image
CN107870715B (zh) 用于提供增强现实图像的方法和装置以及记录介质
WO2015200406A1 (en) Digital action in response to object interaction
WO2019187487A1 (ja) 情報処理装置、情報処理方法、およびプログラム
KR20190089627A (ko) Ar 서비스를 제공하는 디바이스 및 그 동작 방법
US11869156B2 (en) Augmented reality eyewear with speech bubbles and translation
KR20210150881A (ko) 전자 장치 및 그 동작 방법
KR101873805B1 (ko) 스마트 글래스를 통한 스마트 정보 표시 방법
US11422622B2 (en) Electronic device and operating method thereof
KR20200090315A (ko) 영상을 처리하는 방법 및 디바이스
JP2019066564A (ja) 表示装置、表示制御方法、及びプログラム
KR20230063667A (ko) 전자 장치 및 그 동작 방법
US20230085129A1 (en) Electronic device and operating method thereof
US20210217243A1 (en) Method and electronic device for displaying content
EP4350417A1 (en) Augmented reality apparatus and method for providing vision measurement and vision correction
EP4202617A1 (en) Wearable device, method, and non-transitory computer-readable storage medium for displaying multimedia content
US11960643B2 (en) Head mounted display apparatus, method for operating the same, and computer-readable recording medium
CN112368668B (zh) 用于混合现实头戴式耳机的便携式电子设备
US20240134492A1 (en) Digital assistant interactions in extended reality