WO2021230474A1

WO2021230474A1 - 전자 장치, 시스템 및 그 제어 방법

Info

Publication number: WO2021230474A1
Application number: PCT/KR2021/002367
Authority: WO
Inventors: 정현준; 이의윤
Original assignee: 삼성전자주식회사
Priority date: 2020-05-15
Filing date: 2021-02-25
Publication date: 2021-11-18
Also published as: KR20210141222A

Abstract

전자 장치가 개시된다. 전자 장치는, 카메라, 디스플레이, 회로를 포함하는 통신 인터페이스 및 카메라를 통해 수신된 라이브 이미지를 디스플레이하도록 디스플레이를 제어하고, 디스플레이된 라이브 이미지를 외부 디스플레이 장치로 전송하도록 통신 인터페이스를 제어하는 프로세서를 포함한다.

Description

전자 장치, 시스템 및 그 제어 방법

본 발명은 전자 장치, 시스템 및 그 제어 방법에 관한 것으로, 보다 상세하게는 카메라를 포함하는 전자 장치, 시스템 및 그 제어 방법에 관한 것이다.

최근 전자 기술의 발전에 따라 다양한 유형의 전자 장치가 개발 및 보급되고 있는 실정이다. 특히, 신체적 불편함을 겪고 있는 사용자들을 위해 이러한 불편함을 줄여주기 위한 전자 장치가 개발 및 보급되고 있다.

전자 확대경(Electronic Magnifier)은 저 시력자와 같이 물체나 글자를 인지하기 어려운 사용자들을 위해 물체, 글자를 저 시력자가 인지할 수 있을 정도의 크기로 확대시켜 디스플레이한다는 점에서 시각 장애를 가진 많은 사용자들에게 필요한 전자 장치에 해당한다.

다만, 종래의 전자 확대경은 물체, 글자 등을 인식하기 위한 카메라와 디스플레이가 일체화되어 있어, 확대시키고자 하는 물체를 전자 확대경에 구비된 카메라의 위치까지 이동시켜야하는 불편함이 존재하였다.

또한, 전자 확대경에 구비된 디스플레이의 크기 이상으로 물체, 글자 등을 확대시키는 것이 불가하다는 한계가 있었다.

따라서, 확대시키고자 하는 물체의 이동 없이도 편리하게 해당 물체를 확대시켜 디스플레이하는 확대경(Magnifier)에 대한 요구가 있었다.

본 개시는 상술한 필요성에 따른 것으로, 본 개시의 목적은 카메라를 구비하는 전자 장치를 이용하여 확대시키고자 하는 물체를 용이하게 촬영하고, 상대적으로 큰 사이즈의 화면을 이용하여 확대된 물체, 글자를 디스플레이하는 전자 장치, 시스템 및 그 제어 방법을 제공함에 있다.

본 개시의 상술한 목적을 달성하기 위한 일 실시 예에 따르면 전자 장치는, 카메라, 디스플레이, 회로를 포함하는 통신 인터페이스 및 상기 카메라를 통해 수신된 라이브 이미지를 디스플레이하도록 상기 디스플레이를 제어하고, 상기 디스플레이된 라이브 이미지를 외부 디스플레이 장치로 전송하도록 상기 통신 인터페이스를 제어하는 프로세서를 포함하고, 상기 프로세서는, 상기 라이브 이미지 내에서 텍스트를 포함하는 텍스트 영역이 상기 라이브 이미지의 엣지 영역에 위치하면, 상기 카메라의 촬영 방향 변경을 가이드하는 UI를 상기 라이브 이미지 상에 디스플레이하도록 상기 디스플레이를 제어하고, 상기 UI를 포함하는 상기 라이브 이미지를 상기 외부 디스플레이 장치로 전송하도록 상기 통신 인터페이스를 제어한다.

여기서, 상기 프로세서는, 상기 라이브 이미지에 포함된 상기 텍스트 영역이 상기 디스플레이의 화면 내에서 임계 비율 이상이 되도록 상기 텍스트 영역을 확대시켜 디스플레이하도록 상기 디스플레이를 제어하고, 상기 확대된 텍스트 영역을 포함하는 상기 라이브 이미지를 상기 외부 디스플레이 장치로 전송하도록 상기 통신 인터페이스를 제어할 수 있다.

또한, 상기 프로세서는, 확대 비율을 설정하기 위한 UI를 디스플레이하도록 상기 디스플레이를 제어하고, 상기 확대 비율을 설정하기 위한 UI를 통해 설정된 확대 비율에 기초하여 상기 텍스트 영역을 확대시켜 디스플레이하도록 상기 디스플레이를 제어할 수 있다.

또한, 전자 장치는, 스피커를 더 포함하고, 상기 프로세서는, 상기 텍스트 영역에 포함된 상기 텍스트를 식별하고, 상기 식별된 텍스트에 TTS(Text to Speech)를 적용하여 상기 텍스트에 대응되는 음성 정보를 획득하고, 상기 음성 정보에 기초하여 사운드를 출력하도록 상기 스피커를 제어할 수 있다.

또한, 상기 프로세서는, 상기 획득된 음성 정보를 상기 외부 디스플레이 장치로 전송하도록 상기 통신 인터페이스를 제어할 수 있다.

또한, 상기 프로세서는, 상기 텍스트 영역에 포함된 상기 텍스트를 식별하고, 상기 식별된 텍스트를 포함하는 정보를 상기 외부 디스플레이 장치로 전송하도록 상기 통신 인터페이스를 제어할 수 있다.

또한, 상기 프로세서는, 사용자 명령에 따라 편집(edit) 모드가 실행되면, 상기 텍스트 영역에 포함된 상기 텍스트를 식별하여 상기 식별된 텍스트를 포함하는 편집 UI를 디스플레이하도록 상기 디스플레이를 제어하고, 상기 편집 UI 상에서 상기 텍스트에 대한 편집이 수행되면, 상기 편집된 텍스트를 디스플레이하도록 상기 디스플레이를 제어하고, 상기 편집된 텍스트를 포함하는 상기 디스플레이의 화면 이미지를 상기 외부 디스플레이 장치로 전송하도록 상기 통신 인터페이스를 제어할 수 있다.

또한, 상기 프로세서는, 상기 라이브 이미지가 상기 외부 디스플레이 장치로 전송되는 동안, 사용자 명령에 따라 상기 디스플레이된 라이브 이미지가 캡쳐되면, 상기 라이브 이미지의 전송을 중단하고, 상기 캡쳐된 이미지를 상기 외부 디스플레이 장치로 전송하도록 상기 통신 인터페이스를 제어할 수 있다.

또한, 상기 외부 디스플레이 장치는, 상기 디스플레이의 화면보다 큰 사이즈의 화면을 가지는 디스플레이를 구비하는 장치일 수 있다.

본 개시의 상술한 목적을 달성하기 위한 일 실시 예에 따르면 전자 장치 및 디스플레이 장치를 포함하는 시스템은, 카메라를 통해 수신된 수신된 라이브 이미지 내에서 텍스트를 포함하는 텍스트 영역이 상기 라이브 이미지의 엣지 영역에 위치하면, 상기 카메라의 촬영 방향 변경을 가이드하는 UI를 포함하는 상기 라이브 이미지를 디스플레이하고, 상기 UI를 포함하는 상기 라이브 이미지를 상기 디스플레이 장치로 전송하는 전자 장치 및 상기 전자 장치로부터 수신된 상기 UI를 포함하는 라이브 이미지를 디스플레이하는 디스플레이 장치를 포함한다.

여기서, 상기 디스플레이 장치는, 상기 라이브 이미지에 포함된 상기 텍스트 영역이 상기 디스플레이 장치의 화면 내에서 임계 비율 이상이 되도록 상기 텍스트 영역을 확대시켜 디스플레이할 수 있다.

또한, 상기 디스플레이 장치는, 확대 비율을 설정하기 위한 UI를 디스플레이하고, 상기 확대 비율을 설정하기 위한 UI를 통해 설정된 확대 비율에 기초하여 상기 텍스트 영역을 확대시켜 디스플레이할 수 있다.

또한, 상기 디스플레이 장치는, 상기 텍스트 영역에 포함된 상기 텍스트가 식별되면, 상기 식별된 텍스트에 기초하여 출력 레이아웃을 식별하고, 상기 식별된 출력 레이아웃에 따라 상기 텍스트를 디스플레이할 수 있다.

본 개시의 상술한 목적을 달성하기 위한 일 실시 예에 따르면 전자 장치의 제어 방법은, 카메라를 통해 수신된 라이브 이미지를 디스플레이하는 단계, 상기 라이브 이미지 내에서 텍스트를 포함하는 텍스트 영역이 상기 라이브 이미지의 엣지 영역에 위치하면, 상기 카메라의 촬영 방향 변경을 가이드하는 UI를 상기 라이브 이미지 상에 디스플레이하는 단계 및 상기 UI를 포함하는 상기 라이브 이미지를 외부 디스플레이 장치로 전송하는 단계를 포함한다.

여기서, 상기 라이브 이미지를 디스플레이하는 단계는, 상기 라이브 이미지에 포함된 상기 텍스트 영역이 화면 내에서 임계 비율 이상이 되도록 상기 텍스트 영역을 확대시켜 디스플레이하는 단계를 포함하고, 상기 전송하는 단계는, 상기 확대된 텍스트 영역을 포함하는 상기 라이브 이미지를 상기 외부 디스플레이 장치로 전송하는 단계를 포함할 수 있다.

또한, 제어 방법은, 확대 비율을 설정하기 위한 UI를 디스플레이하는 단계를 더 포함하고, 상기 라이브 이미지를 디스플레이하는 단계는, 상기 확대 비율을 설정하기 위한 UI를 통해 설정된 확대 비율에 기초하여 상기 텍스트 영역을 확대시켜 디스플레이하는 단계를 포함할 수 있다.

또한, 제어 방법은, 상기 텍스트 영역에 포함된 상기 텍스트를 식별하는 단계, 상기 식별된 텍스트에 TTS(Text to Speech)를 적용하여 상기 텍스트에 대응되는 음성 정보를 획득하는 단계 및 상기 음성 정보에 기초하여 사운드를 출력하는 단계를 더 포함할 수 있다.

여기서, 제어 방법은, 상기 획득된 음성 정보를 상기 외부 디스플레이 장치로 전송하는 단계를 더 포함할 수 있다.

또한, 제어 방법은, 사용자 명령에 따라 편집(edit) 모드가 실행되면, 상기 텍스트 영역에 포함된 상기 텍스트를 식별하여 상기 식별된 텍스트를 포함하는 편집 UI를 디스플레이하는 단계, 상기 편집 UI 상에서 상기 텍스트에 대한 편집이 수행되면, 상기 편집된 텍스트를 디스플레이하는 단계 및 상기 편집된 텍스트를 포함하는 상기 디스플레이의 화면 이미지를 상기 외부 디스플레이 장치로 전송하는 단계를 더 포함할 수 있다.

또한, 상기 전송하는 단계는, 상기 라이브 이미지가 상기 외부 디스플레이 장치로 전송되는 동안, 사용자 명령에 따라 상기 디스플레이된 라이브 이미지가 캡쳐되면, 상기 라이브 이미지의 전송을 중단하고, 상기 캡쳐된 이미지를 상기 외부 디스플레이 장치로 전송하는 단계를 포함할 수 있다.

본 개시의 다양한 실시 예들에 따르면, 휴대가 용이한 전자 장치에 구비된 카메라를 이용하여 확대시키고자 하는 물체를 용이하게 촬영할 수 있다.

라이브 이미지 상에 포함된 텍스트를 확대시켜 사용자에게 디스플레이할 수 있다.

텍스트의 오인식율을 줄일 수 있으며, 텍스트에 TTS를 적용하여 텍스트에 대응되는 사운드를 출력할 수 있다.

정보 매체에 포함된 텍스트 형태의 정보를 사운드로 변환하여 출력할 수 있으며, 저 시력자 또는 시각 장애인들이 사운드를 통해 해당 정보를 용이하게 습득할 수 있다.

도 1은 본 개시의 일 실시 예에 따른 시스템의 구성을 개략적으로 설명하기 위한 도면이다.

도 2는 본 개시의 일 실시 예에 따른 전자 장치의 구성을 개략적으로 설명하기 위한 도면이다.

도 3은 본 개시의 일 실시 예에 따른 전자 장치의 구성을 설명하기 위한 블록도이다.

도 4는 본 개시의 일 실시 예에 따른 텍스트 영역을 설명하기 위한 도면이다.

도 5는 본 개시의 일 실시 예에 따른 확대된 텍스트 영역을 설명하기 위한 도면이다.

도 6은 본 개시의 일 실시 예에 따른 확대 비율을 설명하기 위한 도면이다.

도 7은 본 개시의 일 실시 예에 따른 음성 정보를 설명하기 위한 도면이다.

도 8은 본 개시의 일 실시 예에 따른 디스플레이 장치를 통해 제공되는 텍스트를 설명하기 위한 도면이다.

도 9는 본 개시의 일 실시 예에 따른 편집 모드를 설명하기 위한 도면이다.

도 10은 본 개시의 일 실시 예에 따른 캡쳐된 이미지를 설명하기 위한 도면이다.

도 11은 본 개시의 일 실시 예에 따른 출력 레이아웃을 설명하기 위한 도면이다.

도 12는 본 개시의 일 실시 예에 따른 전자 장치의 제어 방법을 설명하기 위한 흐름도이다.

-

본 명세서에서 사용되는 용어에 대해 간략히 설명하고, 본 개시에 대해 구체적으로 설명하기로 한다.　

본 개시의 실시 예에서 사용되는 용어는 본 개시에서의 기능을 고려하면서 가능한 현재 널리 사용되는 일반적인 용어들을 선택하였으나, 이는 당 분야에 종사하는 기술자의 의도 또는 판례, 새로운 기술의 출현 등에 따라 달라질 수 있다. 또한, 특정한 경우는 출원인이 임의로 선정한 용어도 있으며, 이 경우 해당되는 개시의 설명 부분에서 상세히 그 의미를 기재할 것이다. 따라서 본 개시에서 사용되는 용어는 단순한 용어의 명칭이 아닌, 그 용어가 가지는 의미와 본 개시의 전반에 걸친 내용을 토대로 정의되어야 한다.

본 개시의 실시 예들은 다양한 변환을 가할 수 있고 여러 가지 실시 예를 가질 수 있는바, 특정 실시 예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나 이는 특정한 실시 형태에 대해 범위를 한정하려는 것이 아니며, 개시된 사상 및 기술 범위에 포함되는 모든 변환, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 실시 예들을 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 요지를 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다.

제1, 제2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 구성요소들은 용어들에 의해 한정되어서는 안 된다. 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다.

단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "구성되다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.

본 개시에서 "모듈" 혹은 "부"는 적어도 하나의 기능이나 동작을 수행하며, 하드웨어 또는 소프트웨어로 구현되거나 하드웨어와 소프트웨어의 결합으로 구현될 수 있다. 또한, 복수의 "모듈" 혹은 복수의 "부"는 특정한 하드웨어로 구현될 필요가 있는 "모듈" 혹은 "부"를 제외하고는 적어도 하나의 모듈로 일체화되어 적어도 하나의 프로세서(미도시)로 구현될 수 있다.

아래에서는 첨부한 도면을 참고하여 본 개시의 실시 예에 대하여 본 개시가 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다.　그러나 본 개시는 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시 예에 한정되지 않는다. 그리고 도면에서 본 개시를 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.

도 1에 도시된 바에 따르면, 본 개시의 일 실시 예에 따른 시스템(1000)은 전자 장치(100) 및 디스플레이 장치(200)를 포함한다.

여기서, 전자 장치(100) 및 디스플레이 장치(200) 각각은, 예를 들면, 스마트폰, 태블릿 PC, 이동 전화기, 영상 전화기, 전자책 리더기, 데스크탑 PC, 랩탑 PC, 넷북 컴퓨터, 워크스테이션, 서버, PDA, PMP(portable multimedia player), MP3 플레이어, 의료기기, 카메라, 가상 현실(virtual reality(VR)) 구현 장치 또는 웨어러블 장치 중 적어도 하나를 포함할 수 있다. 여기서, 웨어러블 장치는 액세서리형(예: 시계, 반지, 팔찌, 발찌, 목걸이, 안경, 콘택트 렌즈, 또는 머리 착용형 장치(head-mounted-device(HMD)), 직물 또는 의류 일체형(예: 전자 의복), 신체 부착형(예: 스킨 패드 또는 문신), 또는 생체 이식형 회로 중 적어도 하나를 포함할 수 있다. 어떤 실시 예들에서, 전자 장치(100) 및 디스플레이 장치(200) 각각은, 예를 들면, 텔레비전, DVD(digital video disk) 플레이어, 오디오, 냉장고, 에어컨, 청소기, 오븐, 전자레인지, 세탁기, 공기 청정기, 셋톱 박스, 홈 오토매이션 컨트롤 패널, 보안 컨트롤 패널, 미디어 박스(예: 삼성 HomeSyncTM, 애플TVTM, 또는 구글 TVTM), 게임 콘솔(예: XboxTM, PlayStationTM), 전자 사전, 전자 키, 캠코더, 또는 전자 액자 중 적어도 하나를 포함할 수 있다.

다른 실시 예에서, 전자 장치(100) 및 디스플레이 장치(200) 각각은, 각종 의료기기(예: 각종 휴대용 의료측정기기(혈당 측정기, 심박 측정기, 혈압 측정기, 또는 체온 측정기 등), MRA(magnetic resonance angiography), MRI(magnetic resonance imaging), CT(computed tomography), 촬영기, 또는 초음파기 등), 네비게이션 장치, 위성 항법 시스템(GNSS(global navigation satellite system)), EDR(event data recorder), FDR(flight data recorder), 자동차 인포테인먼트 장치, 선박용 전자 장비(예: 선박용 항법 장치, 자이로 콤파스 등), 항공 전자기기(avionics), 보안 기기, 차량용 헤드 유닛(head unit), 산업용 또는 가정용 로봇, 드론(drone), 금융 기관의 ATM, 상점의 POS(point of sales), 또는 사물 인터넷 장치 (예: 전구, 각종 센서, 스프링클러 장치, 화재 경보기, 온도조절기, 가로등, 토스터, 운동기구, 온수탱크, 히터, 보일러 등) 중 적어도 하나를 포함할 수 있다.

본 개시의 일 실시 예에 따른 전자 장치(100) 및 디스플레이 장치(100) 각각은 다양한 유형의 컨텐츠를 디스플레이할 수 있다. 일 실시 예에 따라 전자 장치(100)는 사용자 단말 장치로 구현될 수 있고, 디스플레이 장치(200)는 TV로 구현될 수 있으나, 이에 한정되지 않음은 물론이다. 예를 들어, 디스플레이 장치(200)는 비디오 월(video wall), LFD(large format display), Digital Signage(디지털 간판), DID(Digital Information Display), 프로젝터 디스플레이 등과 같이 디스플레이 기능을 갖춘 장치라면 한정되지 않고 적용 가능하다. 또한, 디스플레이 장치(100)는 LCD(liquid crystal display), OLED(organic light-emitting diode), LCoS(Liquid Crystal on Silicon), DLP(Digital Light Processing), QD(quantum dot) 디스플레이 패널, QLED(quantum dot light-emitting diodes) μLED(Micro light-emitting diodes), Mini LED 등과 같은 다양한 형태의 디스플레이로 구현될 수 있다. 한편, 전자 장치(100) 및 디스플레이 장치(100) 각각은 터치 센서와 결합된 터치 스크린, 플렉시블 디스플레이(flexible display), 롤러블 디스플레이(rollable display), 3차원 디스플레이(3D display), 복수의 디스플레이 모듈이 물리적으로 연결된 디스플레이 등으로 구현될 수도 있다.

이하에서는 설명의 편의를 위해 전자 장치(100)가 사용자 단말 장치로 구현되고, 디스플레이 장치(200)가 TV로 구현되는 경우를 상정하여 설명하도록 한다. 본 개시의 일 실시 예에 따른 전자 장치(100)와 디스플레이 장치(200)는 통신을 수행하고, 디스플레이 장치(200)는 전자 장치(100)로부터 수신된 다양한 유형의 컨텐츠를 디스플레이할 수 있다.

예를 들어, 디스플레이 장치(200)는 전자 장치(100)로부터 컨텐츠 데이터를 수신하고, 수신된 컨텐츠 데이터에 기초하여 컨텐츠를 디스플레이할 수 있다. 다른 예로, 전자 장치(100)와 디스플레이 장치(200)는 무선으로 통신을 수행하고, 디스플레이 장치(200)는 스크린 미러링(screen mirroring)을 통해 전자 장치(100)에 디스플레이되는 화면과 동일한 화면을 자체적으로 구비된 디스플레이를 통해 디스플레이할 수도 있음은 물론이다.

도 1을 참조하면, 전자 장치(100)는 전자 장치(100)에 구비된 카메라를 통해 주변에 대한 라이브 이미지(10)를 획득 및 디스플레이할 수 있다. 전자 장치(100)와 통신을 수행하는 디스플레이 장치(200)는 스크린 미러링 기능을 통해 전자 장치(100)를 통해 디스플레이되는 라이브 이미지(10)를 자체적으로 디스플레이할 수 있다.

일 실시 예에 따른 전자 장치(100)는 텍스트를 포함하는 책, 문서, 신문 등을 촬영한 라이브 이미지(10)를 획득할 수 있고, 획득된 라이브 이미지(10)를 디스플레이 장치(200)로 전송할 수 있다.

여기서, 디스플레이 장치(200)는 전자 장치(100)에 구비된 디스플레이 보다 상대적으로 큰 디스플레이를 구비할 수 있고, 디스플레이 장치(200)는 상대적으로 큰 디스플레이를 통해 전자 장치(100)로부터 수신된 라이브 이미지를 디스플레이할 수 있다.

이하에서는 전자 장치(100)를 통해 획득된 라이브 이미지(10)에서 특정 영역을 확대시키고 디스플레이 장치(200)를 통해 확대된 특정 영역을 디스플레이하는 다양한 실시 예에 대해 설명하도록 한다.

도 2를 참조하면, 전자 장치(100)는 카메라로부터 실시간 수신되는 라이브 이미지 내에서 텍스트를 포함하는 텍스트 영역을 식별할 수 있다.

일 예로, 전자 장치(100)는 라이브 이미지(10)에 포함된 적어도 하나의 오브젝트 등에 OCR(Optical Character Recognition)을 수행하여 텍스트를 포함하는 텍스트 영역을 식별할 수 있다. 다만, 이는 일 실시 예로 전자 장치(100)는 다양한 방법으로 라이브 이미지(10) 내에서 텍스트를 포함하는 텍스트 영역을 식별할 수 있다.

예를 들어, 전자 장치(100)는 라이브 이미지(10)를 인공 지능 모델에 입력하여 라이브 이미지(10) 내에서 텍스트를 포함하는 텍스트 영역을 식별할 수 있다. 여기서, 실시 예에 따른 인공 지능 모델은 인공지능 알고리즘 기반으로 복수의 영상에 기초하여 학습된 판단 모델로서, 신경망(Neural Network)을 기반으로 하는 모델일 수 있다. 학습된 판단 모델은 인간의 뇌 구조를 컴퓨터 상에서 모의하도록 설계될 수 있으며 인간의 신경망의 뉴런(neuron)을 모의하는, 가중치를 가지는 복수의 네트워크 노드들을 포함할 수 있다. 복수의 네트워크 노드들은 뉴런이 시냅스(synapse)를 통하여 신호를 주고 받는 뉴런의 시냅틱(synaptic) 활동을 모의하도록 각각 연결 관계를 형성할 수 있다. 또한 학습된 판단 모델은, 일 예로, 기계 학습(Machine Learning) 모델, 신경망 모델, 또는 신경망 모델에서 발전한 딥 러닝(Deep Learning) 모델을 포함할 수 있다. 딥 러닝 모델에서 복수의 네트워크 노드들은 서로 다른 깊이(또는, 레이어)에 위치하면서 컨볼루션(convolution) 연결 관계에 따라 데이터를 주고 받을 수 있다.

일 예로, 인공 지능 모델은 영상에 기초하여 학습된 CNN(Convolution Neural Network, 컨벌루션 신경망) 모델일 수 있다. CNN은 음성처리, 이미지 처리 등을 위해 고안된 특수한 연결구조를 가진 다층신경망이다. 한편, 인공 지능 모델은 CNN에 한정되지 않음은 물론이다. 예를 들어, 인공 지능 모델은 RNN(Recurrent Neural Network), LSTM(Long Short Term Memory Network), GRU(Gated Recurrent Units) 또는 GAN(Generative Adversarial Networks) 중 적어도 하나의 DNN(Deep Neural Network) 모델로 구현될 수 있다.

본 개시의 일 실시 예에 따른 전자 장치(100)는 텍스트를 인식하기 전에, 텍스트를 포함하는 것으로 예측되는 텍스트 영역을 식별할 수 있다. 일 예로, 전자 장치(100)는 라이브 이미지(10)에 OCR(Optical Character Recognition)을 수행하여 텍스트를 포함하는 것으로 예측되는 텍스트 영역을 식별할 수 있다. 다른 예로, 전자 장치(100)는 라이브 이미지(10)를 인공 지능 모델에 입력하여 라이브 이미지(10) 내에서 텍스트를 포함하는 것으로 예측되는 텍스트 영역을 식별할 수도 있음은 물론이다.

도 2를 참조하면, 본 개시의 일 실시 예에 따른 전자 장치(100)는 텍스트 영역이 라이브 이미지(10)의 엣지(edge) 영역에 위치하면, 카메라의 촬영 방향 변경을 가이드하는 UI(20)를 라이브 이미지(10) 상에 디스플레이할 수 있다.

여기서, 엣지 영역은 라이브 이미지 상의 가장자리 영역, 모서리 영역을 의미할 수 있다. 예를 들어, 도 2에 도시된 바와 같이 텍스트 영역(10)이 라이브 이미지(10)의 모서리 영역에 위치하면, 텍스트 영역(10)에 포함된 텍스트의 일부가 전자 장치(100)에 구비된 디스플레이 상에 디스플레이되지 않거나, 텍스트의 일부가 잘라지고 나머지만 디스플레이될 수 있다. 이 경우, 전자 장치(100)가 텍스트 영역(10)에 포함된 텍스트를 오인식할 확률이 증가하며, 사용자에게 해당 텍스트와 관련된 잘못된 정보, 피드백(예를 들어, 시각적 또는 청각적 피드백)을 제공할 우려가 있다.

예를 들어, 도 2에 도시된 바와 같이 전자 장치(100)는 라이브 이미지(10) 내에 포함된 신문 기사 상의 텍스트 ‘Samsung ran more ~’에서 일부가 잘린 것으로 식별되거나 또는 라이브 이미지(10)의 엣지 영역에서 텍스트가 감지되면, 신문 기사 상의 텍스트에 대한 인식율이 낮아질 우려가 있다.

본 개시의 일 실시 예에 따른 전자 장치(100)는 텍스트 영역이 라이브 이미지(10)의 엣지 영역에 위치하는 것으로 식별되면, 카메라의 촬영 방향 변경을 가이드 하는 UI(20)를 디스플레이할 수 있다. 이 경우, 카메라의 촬영 방향이 변경되면, 전자 장치(100)는 실시간으로 카메라를 통해 수신되는 변경된 라이브 이미지(10’)를 디스플레이할 수 있다. 여기서, 변경된 라이브 이미지(10’)는 텍스트 영역이 엣지 영역이 아닌 가운데 영역에 위치하는 이미지일 수 있다. 여기서, 가운데 영역은 텍스트 영역(10)에 포함된 텍스트 전체가 전자 장치(100)에 구비된 디스플레이를 통해 디스플레이되며, 전자 장치(100)의 해당 텍스트에 대한 오인식 확률이 현저하게 낮아지는 영역을 의미할 수 있다.

한편, 도 1에 도시된 바와 같이, 전자 장치(100)와 유선 또는 무선 통신을 수행하는 디스플레이 장치(200)는 전자 장치(100)로부터 수신된 라이브 이미지(10)를 디스플레이 장치(200)에 구비된 디스플레이를 통해 디스플레이할 수 있다.

본 개시의 일 실시 예에 따른 디스플레이 장치(200)는 전자 장치(100)로부터 수신된 촬영 방향 변경을 가이드하는 UI(20)를 포함하는 라이브 이미지를 디스플레이할 수 있다. 한편, 도 2에서는 촬영 방향 변경을 가이드하는 UI(20)가 ‘WARNING: Text on edge detected.’와 같은 텍스트를 포함하는 것으로 상정하여 설명하였으나, 이는 설명의 편의를 위한 것으로 이에 한정되지 않음은 물론이다. 예를 들어, 촬영 방향 변경을 가이드하는 UI(20)는 촬영 방향을 인디케이팅하는 화살표를 포함할 수도 있고, 라이브 이미지(10) 내에서 텍스트 일부가 잘린 상태임을 노티하는 다양한 형태의 오브젝트를 포함할 수 있음은 물론이다.

도 3을 참조하면, 본 개시의 일 실시 예에 따른 전자 장치(100)는 카메라(110), 디스플레이(120), 통신 인터페이스(130) 및 프로세서(140)를 포함할 수 있다.

카메라(110)는 전자 장치(100)의 주변 일 영역을 스캔하여 전기적 신호로 변환하여 프로세서(140)로 전송할 수 있다.

일 실시 예에 따른 카메라(110)는 광학 신호를 전기적 신호로 변환하는 복수의 광 다이오드를 포함할 수 있으며, 복수의 광 다이오드는 2차원으로 배치될 수 있다. 카메라(170)는 복수의 광 다이오드가 2차원으로 배치된 CCD (Charge-Coupled Device) 영상 센서 또는 CMOS (Complementary Metal Oxide Semiconductor) 영상 센서를 포함할 수 있다.

일 실시 예에 따른 카메라(110)는 촬영 방향 예를 들어, 앵글(angle)에 대응되는 주변 일 영역을 스캔하여 획득한 광학 신호를 전기적 신호로 변환하여 실시간으로 프로세서(140)로 전송할 수 있다. 이어서, 프로세서(140)는 카메라(110)로부터 수신된 전기적 신호에 대응되는 라이브 이미지(10)를 디스플레이하도록 디스플레이(120)를 제어할 수 있다.

한편, 도 1 및 도 2에서는 설명의 편의를 위해 카메라(110)가 텍스트 영역을 다수 포함하는 신문 기사 등을 스캔하는 경우를 상정하여 설명하였으나, 이는 일 예시에 불과하며 카메라(110)는 사용자 제어에 따라 카메라(110)의 주변 일 영역을 스캔할 수 있음은 물론이다.

디스플레이(120)는 자발광 소자를 포함하는 디스플레이 또는, 비자발광 소자 및 백라이트를 포함하는 디스플레이로 구현될 수 있다. 예를 들어, LCD(Liquid Crystal Display), OLED(Organic Light Emitting Diodes) 디스플레이, LED(Light Emitting Diodes), 마이크로 LED(micro LED), Mini LED, PDP(Plasma Display Panel), QD(Quantum dot) 디스플레이, QLED(Quantum dot light-emitting diodes) 등과 같은 다양한 형태의 디스플레이로 구현될 수 있다. 디스플레이(120) 내에는 a-si TFT, LTPS(low temperature poly silicon) TFT, OTFT(organic TFT) 등과 같은 형태로 구현될 수 있는 구동 회로, 백라이트 유닛 등도 함께 포함될 수 있다. 한편, 디스플레이(120)는 터치 센서와 결합된 터치 스크린, 플렉시블 디스플레이(flexible display), 롤러블 디스플레이(rollable display), 3차원 디스플레이(3D display), 복수의 디스플레이 모듈이 물리적으로 연결된 디스플레이 등으로 구현될 수 있다. 본 개시의 일 실시 예에 따른 디스플레이(120)는 프로세서(140)의 제어에 따라 다양한 유형의 컨텐츠를 디스플레이할 수 있다. 특히, 디스플레이(120)는 프로세서(140)의 제어에 따라 카메라(110)를 통해 수신된 라이브 이미지(10)를 디스플레이할 수 있다.

본 개시의 일 실시 예에 따른 통신 인터페이스(130)는 다양한 타입의 컨텐츠를 입력받는다. 예를 들어 통신 인터페이스(130)는 AP 기반의 Wi-Fi(와이파이, Wireless LAN 네트워크), 블루투스(Bluetooth), 지그비(Zigbee), 유/무선 LAN(Local Area Network), WAN(Wide Area Network), 이더넷(Ethernet), IEEE 1394, HDMI(High-Definition Multimedia Interface), USB(Universal Serial Bus), MHL(Mobile High-Definition Link), AES/EBU(Audio Engineering Society/ European Broadcasting Union), 옵티컬(Optical), 코액셜(Coaxial) 등과 같은 통신 방식을 통해 외부 장치(예를 들어, 소스 장치), 외부 저장 매체(예를 들어, USB 메모리), 외부 서버(예를 들어 웹 하드) 등으로부터 다양한 유형의 컨텐츠를 입력받을 수 있다. 여기서, 컨텐츠는 영상 신호, 기사, 텍스트 정보, 게시물 등을 포함할 수 있다.

특히, 본 개시의 일 실시 예에 따른 통신 인터페이스(130)는 디스플레이 장치(200)와 통신을 수행할 수 있다. 일 실시 예에 따른 통신 인터페이스(130)는 프로세서(140)의 제어에 따라 디스플레이 장치(200)로 라이브 이미지(10)를 전송할 수 있다. 예를 들어, 전자 장치(100)는 통신 인터페이스(130)를 통해 디스플레이 장치(200)와 미러링(Mirroring)을 수행하고, 전자 장치(100)에 구비된 디스플레이(120)를 통해 디스플레이 되는 라이브 이미지(10)는 디스플레이 장치(200)에도 동일하게 디스플레이될 수 있다.

프로세서(140)는 전자 장치(100)의 전반적인 동작을 제어한다. 여기서, 프로세서(140)는 하나 또는 복수의 프로세서로 구성될 수 있다. 구체적으로, 프로세서(140)는 메모리(130)에 저장된 적어도 하나의 인스트럭션(instruction)을 실행함으로써, 본 개시의 다양한 실시 예에 따른 전자 장치(100)의 동작을 수행할 수 있다.

일 실시 예에 따라 프로세서(140)는 디지털 영상 신호를 처리하는 디지털 시그널 프로세서(digital signal processor(DSP), 마이크로 프로세서(microprocessor), GPU(Graphics Processing Unit), AI(Artificial Intelligence) 프로세서, NPU (Neural Processing Unit), TCON(Time controller)으로 구현될 수 있다. 다만, 이에 한정되는 것은 아니며, 중앙처리장치(central processing unit(CPU)), MCU(Micro Controller Unit), MPU(micro processing unit), 컨트롤러(controller), 어플리케이션 프로세서(application processor(AP)), 또는 커뮤니케이션 프로세서(communication processor(CP)), ARM 프로세서 중 하나 또는 그 이상을 포함하거나, 해당 용어로 정의될 수 있다. 또한, 프로세서(140)는 프로세싱 알고리즘이 내장된 SoC(System on Chip), LSI(large scale integration)로 구현될 수도 있고, ASIC(application specific integrated circuit), FPGA(Field Programmable gate array) 형태로 구현될 수도 있다.

본 개시의 일 실시 예에 따른 프로세서(140)는 도 2에 도시된 바와 같이, 라이브 이미지(10) 내에서 텍스트를 포함하는 텍스트 영역이 라이브 이미지(10)의 엣지 영역에 위치하면, 카메라(110)의 촬영 방향 변경을 가이드하는 UI를 라이브 이미지(10) 상에 디스플레이하도록 디스플레이(120)를 제어할 수 있다.

일 실시 예에 따른 프로세서(140)는 UI를 포함하는 라이브 이미지(10)를 디스플레이 장치(200)로 전송하도록 통신 인터페이스(130)를 제어할 수 있다.

본 개시의 일 실시 예에 따른 프로세서(140)는 라이브 이미지(10)에 포함된 텍스트 영역이 디스플레이의 화면 내에서 임계 비율 이상이 되도록 텍스트 영역을 확대시켜 디스플레이할 수 있다. 이에 대한 구체적인 설명은 도 4 및 도 5를 참조하여 하도록 한다.

도 4를 참조하면, 프로세서(140)는 라이브 이미지(10) 내에서 텍스트 영역을 식별할 수 있다. 예를 들어, 프로세서(140)는 라이브 이미지(10)에 포함된 적어도 하나의 오브젝트에 대해 OCR을 수행하여, 해당 오브젝트가 텍스트를 포함하는지 여부를 식별할 수 있다. 다른 예로, 프로세서(140)는 라이브 이미지(10)를 인공 지능 모델에 입력하여 라이브 이미지(10) 내에 텍스트 영역이 포함되어 있는지 여부, 해당 텍스트 영역의 위치, 텍스트가 엣지 영역에 위치하는지 여부 등에 대한 정보를 획득할 수 있다. 다만, 이는 일 예시로 이에 한정되지 않음은 물론이다. 예를 들어, 프로세서(140)는 이미지 내에서 텍스트 영역을 식별하는 공지의 알고리즘을 이용하여 라이브 이미지(10) 내에서 텍스트 영역을 식별할 수도 있음은 물론이다.

일 실시 예에 따라 프로세서(140)는 라이브 이미지(10) 내에서 텍스트를 포함하는 텍스트 영역을 식별하고, 해당 텍스트 영역이 디스플레이 장치(200)에서 디스플레이 되도록 해당 텍스트 영역에 대한 정보를 디스플레이 장치(200)로 전송할 수 있다. 예를 들어, 프로세서(140)는 라이브 이미지(10)를 디스플레이 장치(200)로 전송하고, 이어서 디스플레이 장치(200)는 수신된 라이브 이미지(10) 내에서 텍스트 영역을 식별하고, 식별된 텍스트 영역을 디스플레이할 수 있다.

다른 예로, 프로세서(140)는 라이브 이미지(10) 내에서 텍스트 영역을 식별하고, 식별된 텍스트 영역에 대응되는 이미지를 디스플레이 장치(200)로 전송할 수 있다. 이어서, 디스플레이 장치(200)는 수신된 이미지를 디스플레이할 수 있다. 여기서, 디스플레이 장치(200)에 구비된 디스플레이는 전자 장치(100)에 구비된 디스플레이(120) 보다 상대적으로 크기가 클 수 있다. 따라서, 디스플레이 장치(200)를 통해 텍스트 영역을 디스플레이한다면, 사용자는 전자 장치(100)에 구비된 디스플레이(120)를 통해서 텍스트를 제공받을 때 보다 디스플레이 장치(200)를 통해 텍스트를 상대적으로 편리하고 용이하게 인식할 수 있는 효과가 있다.

도 5를 참조하면, 프로세서(140)는 라이브 이미지(10) 내에서 텍스트 영역을 식별하고, 식별된 텍스트 영역을 디스플레이(120)의 화면 내에서 임계 비율 이상이 되도록 확대시켜 디스플레이할 수 있다.

예를 들어, 프로세서(140)는 라이브 이미지(10)에 포함된 적어도 하나의 오브젝트를 분석하여 해당 오브젝트를 텍스트, 그림 또는 사진 등으로 분류할 수 있다. 이어서, 프로세서(140)는 텍스트로 분류된 오브젝트를 포함하는 일 영역을 텍스트 영역으로 식별할 수 있다.

일 실시 예에 따른 프로세서(140)는 텍스트 영역이 화면 내에서 임계 비율 이상이 되도록 텍스트 영역을 확대시켜 디스플레이할 수 있다. 여기서, 임계 비율은 디스플레이(120)의 크기를 의미할 수 있다. 예를 들어, 프로세서(140)는 라이브 이미지(10) 내에서 텍스트 영역만을 디스플레이(120)의 크기에 기초하여 디스플레이(120)의 전체 화면에 대응되도록 확대시켜 디스플레이할 수 있다. 도 5를 참조하면, 프로세서(140)는 라이브 이미지(10)에서 사진, 그림 등을 포함하는 일 영역은 제외하고, 텍스트 영역만을 디스플레이하도록 디스플레이(120)를 제어할 수 있다.

다만, 이는 일 예시로 이에 한정되지 않음은 물론이다. 예를 들어, 프로세서(140)는 라이브 이미지(10) 내에서 특정 오브젝트를 포함하는 일 영역을 식별하고, 해당 일 영역을 확대시켜 디스플레이할 수도 있음은 물론이다. 일 예로, 프로세서(140)는 라이브 이미지(10) 내에서 사진을 포함하는 일 영역을 식별하고, 텍스트 등은 제외하고 사진만을 확대시켜 디스플레이할 수도 있음은 물론이다. 다른 예로, 프로세서(140)는 라이브 이미지(10) 내에서 특정 텍스트(예를 들어, 특정 단어)를 식별하고, 해당 특정 텍스트만을 확대시켜 디스플레이할 수도 있음은 물론이다.

본 개시의 일 실시 예에 따른 임계 비율은 사용자 명령에 따라 설정된 비율일 수 있다. 예를 들어, 프로세서(140)는 사용자 명령에 대응되는 비율로 텍스트 영역을 확대시켜 디스플레이할 수 있다. 일 예로, 사용자 명령에 따라 1배 내지 8배 내에서 특정 비율(또는, 배율)이 선택되면, 프로세서(140)는 선택된 비율(또는, 배율(magnification))에 기초하여 텍스트 영역을 확대시켜 디스플레이할 수 있다. 여기서, 구체적인 숫자는 설명의 편의를 위한 일 예시에 불과하며 선택 가능한 비율의 범위는 다양하게 변경될 수 있음은 물론이다. 예를 들어, 프로세서(140)는 사용자의 핀치(pinch) 터치 입력 또는 스프레드(spread) 터치 입력에 대응되는 비율을 식별하고, 식별된 비율을 임계 비율로 하여 텍스트 영역을 확대시킬 수 있다. 한편, 본 개시의 다양한 실시 예에 따른 비율은 확대 배율의 의미를 포함할 수 있다.

도 6을 참조하면, 본 개시의 일 실시 예에 따른 프로세서(140)는 확대 비율을 설정하기 위한 UI를 디스플레이하도록 디스플레이를 제어할 수 있다. 본 개시의 일 실시 예에 따른 프로세서(140)는 확대 비율을 설정하기 위한 UI를 통해 1배 내지 4배(예를 들어, 1X 내지 4X) 중 어느 하나의 배율을 선택하기 위한 사용자 명령이 수신되면, 사용자 명령에 대응되는 배율로 텍스트 영역을 확대시킬 수 있다.

이어서, 프로세서(140)는 확대된 텍스트 영역을 포함하는 라이브 이미지(10)를 디스플레이 장치(200)로 전송할 수 있다.

사용자 명령에 따라 확대 비율이 설정되면, 프로세서(140)는 설정된 확대 비율에 기초하여 텍스트 영역을 확대시킬 수 있고, 디스플레이 장치(200)가 전자 장치(100)로부터 수신하여 디스플레이 중인 텍스트 영역도 자동으로 확대될 수 있다. 예를 들어, 디스플레이 장치(200)는 전자 장치(100)와 미러링 통신을 수행하여 텍스트 영역을 디스플레이 중이므로, 전자 장치(100)가 디스플레이 중인 텍스트 영역을 설정된 확대 비율에 따라 확대시키면, 디스플레이 장치(200)가 디스플레이 중인 텍스트 영역도 동시에 확대될 수 있음은 물론이다.

도 3으로 돌아와서, 본 개시의 일 실시 예에 따른 전자 장치(100) 및 디스플레이 장치(200) 각각은 스피커(미도시)를 구비할 수 있다.

여기서, 스피커는 오디오 신호를 출력하는 기능을 한다. 예를 들어, 스피커는 적어도 하나의 스피커 유닛(또는 오디오 앰프(audio amplifier))을 포함할 수 있다.

구체적으로, 스피커는 저음역(woofer) 스피커, 중음역(midrange) 스피커 및 고음역(tweeter) 스피커 중 적어도 하나를 포함할 수 있다. 다만, 이에 한정되는 것은 아니며, 스피커는 복수의 스피커를 이용하여 다양한 음역대의 사운드 신호를 출력할 수 있다.

특히, 본 개시의 일 실시 예에 따른 프로세서(140)는 텍스트 영역에 포함된 텍스트를 식별하고, 식별된 텍스트에 TTS(Text to Speech)를 적용하여 텍스트에 대응되는 음성 정보를 획득하고, 음성 정보에 기초하여 사운드를 출력하도록 스피커를 제어할 수 있다. 이에 대한 구체적인 설명은 도 7을 참조하여 하도록 한다.

도 7을 참조하면, 본 개시의 일 실시 예에 따른 프로세서(140)는 텍스트 영역에 포함된 텍스트를 식별할 수 있다. 예를 들어, 프로세서(140)는 텍스트 영역에 OCR을 수행하거나, 텍스트 영역을 인공 지능 모델에 입력하여 텍스트 영역에 포함된 텍스트를 식별할 수 있다.

이어서, 프로세서(140)는 TTS 엔진을 이용하여 식별된 텍스트에 대응되는 음성 정보 예를 들어, 사운드 신호를 획득할 수 있다. 이어서, 프로세서(140)는 사운드 신호를 출력하도록 스피커를 제어할 수 있다.

이에 따라, 전자 장치(100)는 사용자에게 라이브 이미지(10) 내에 포함된 텍스트에 대응되는 음성을 제공할 수 있다. 텍스트를 인식하기 어려운 저 시력자 또는 시각 장애인들은 전자 장치(100)가 출력하는 음성을 통해 신문, 책 등 텍스트가 주를 이루는 정보 매체(information media)에 포함된 정보를 습득할 수 있다.

한편, 도 7을 참조하면, 전자 장치(100)가 텍스트에 대응되는 사운드를 출력할 수도 있고, 디스플레이 장치(200)가 텍스트에 대응되는 사운드를 출력할 수도 있다.

예를 들어, 전자 장치(100)는 식별된 텍스트에 TTS를 적용하여 텍스트에 대응되는 음성 정보를 획득하고, 획득된 음성 정보를 디스플레이 장치(200)로 전송할 수 있다. 이어서, 디스플레이 장치(200)는 수신된 음성 정보에 기초하여 디스플레이 장치(200)에 구비된 스피커를 통해 사운드를 출력할 수 있다.

다른 예로, 디스플레이 장치(200)가 텍스트 영역에 포함된 텍스트를 식별하고, 식별된 텍스트에 TTS를 적용하여 텍스트에 대응되는 음성 정보를 획득할 수도 있음은 물론이다. 이 경우, 디스플레이 장치(200)는 자체적으로 TTS 엔진을 이용하여 텍스트에 대응되는 음성 정보를 획득하고, 획득된 음성 정보에 대응되는 사운드를 출력할 수 있다.

도 8을 참조하면, 본 개시의 일 실시 예에 따른 전자 장치(100)는 텍스트 영역에 포함된 텍스트를 식별하고, 식별된 텍스트를 포함하는 정보를 디스플레이 장치(200)로 전송할 수 있다. 일 예로, 전자 장치(100)는 라이브 이미지(10)를 실시간으로 디스플레이 장치(200)로 전송할 수도 있고, 라이브 이미지(10)에 포함된 텍스트 영역에 대응되는 이미지만을 디스플레이 장치(200)로 전송할 수도 있다. 다른 예로, 전자 장치(100)는 텍스트 영역에 포함된 텍스트를 식별하고, 식별된 텍스트를 포함하는 정보를 디스플레이 장치(200)로 전송할 수 있다. 여기서, 텍스트를 포함하는 정보는 텍스트, 텍스트의 폰트(font), 텍스트의 크기 등을 포함할 수 있다.

본 개시의 일 실시 예에 따른 디스플레이 장치(200)는 수신된 텍스트 정보에 기초하여 텍스트를 디스플레이할 수 있다. 이 경우, 디스플레이 장치(200)는 라이브 이미지(10)에 포함된 사진, 그림 등 타 오브젝트는 디스플레이하지 않을 수 있다. 한편, 이는 일 실시 예로 이에 한정되지 않음은 물론이다.

본 개시의 일 실시 예에 따른 디스플레이 장치(200)는 수신된 텍스트 정보에 기초하여 텍스트를 특정 배율로 확대시키고, 확대된 텍스트를 디스플레이할 수 있다.

도 8을 참조하면, 디스플레이 장치(200)는 전자 장치(100)로부터 라이브 이미지(10) 내에 포함된 텍스트에 대한 정보를 수신하고, 수신된 텍스트에 대한 정보에 기초하여 텍스트를 디스플레이할 수 있다. 예를 들어, 디스플레이 장치(200)는 ‘Samsung ran more than ~’을 디스플레이할 수 있다. 여기서, 디스플레이 장치(200)는 텍스트를 특정 배율로 확대시킨 뒤 디스플레이할 수 있다.

도 8은 설명의 편의를 위해 디스플레이 장치(200)가 특정 개수의 문자(예를 들어, 3개의 알파벳)가 디스플레이 장치(200)에 구비된 디스플레이의 전체 화면을 차지하도록 텍스트를 확대시켜 디스플레이하는 경우를 상정하였다. 다만, 이는 일 예시로 이에 한정되지 않음은 물론이다. 예를 들어, 디스플레이 장치(200)는 하나의 문자가 디스플레이 장치(200)에 구비된 디스플레이의 전체 화면을 차지하도록 텍스트를 확대시킬 수도 있다. 저 시력자는 스마트 폰, 사용자 단말 장치와 같은 상대적으로 작은 사이즈의 화면을 가지는 전자 장치(100)를 통해 텍스트를 제공받는 것이 아니라, TV와 같은 상대적으로 큰 사이즈의 화면을 가지는 디스플레이 장치(200)를 통해 텍스트를 제공받을 수 있으므로, 저 시력자도 텍스트를 용이하게 인식할 수 있는 효과가 있다.

도 9를 참조하면, 본 개시의 일 실시 예에 따른 전자 장치(100)는 식별된 텍스트를 편집하기 위한 편집 모드(edit mode)를 제공할 수 있다.

예를 들어, 사용자 명령에 따라 편집 모드가 실행되면, 프로세서(140)는 텍스트 영역에 포함된 텍스트를 식별하고, 식별된 텍스트를 포함하는 편집 UI를 디스플레이할 수 있다. 여기서, 편집 UI는 새로운 텍스트의 추가, 식별된 텍스트의 수정 또는 삭제, 텍스트의 폰트 변경, 텍스트의 크기 변경 등을 제어하기 위한 복수의 UI를 포함할 수 있다.

본 개시의 일 실시 예에 따라 프로세서(140)는 편집 UI 상에서 텍스트에 대한 편집이 수행되면, 편집된 텍스트를 실시간으로 디스플레이하도록 디스플레이(120)를 제어할 수 있다. 도 9는 설명의 편의를 위해 편집 UI를 통해 ‘NEWS’텍스트(30)를 추가한 경우를 상정한 것이다. 다만, 이는 일 예시로서, 프로세서(140)는 편집 UI에 대한 사용자 명령에 따라 식별된 텍스트 중 일부 텍스트를 삭제 또는 수정할 수도 있음은 물론이다.

한편, 본 개시의 일 실시 예에 따라 프로세서(140)는 편집된 텍스트 예를 들어, 라이브 이미지(10)로부터 식별된 텍스트 외에 사용자 명령에 따라 새롭게 추가된 ‘NEWS’텍스트(30)를 포함하는 디스플레이(120)의 화면 이미지를 디스플레이 장치(200)로 전송하도록 통신 인터페이스(130)를 제어할 수 있다.

일 실시 예에 따라 디스플레이 장치(200)와 전자 장치(100)는 미러링 통신을 수행 중이고, 전자 장치(100)를 통해 텍스트에 대한 편집이 수행되면, 디스플레이 장치(200)는 편집된 텍스트를 포함하는 전자 장치(100)의 화면 이미지를 실시간으로 수신하여 디스플레이할 수 있다.

도 9를 참조하면, 디스플레이 장치(200)는 전자 장치(100)로부터 ‘NEWS’텍스트(30)를 포함하는 디스플레이(120)의 화면 이미지를 수신하여 디스플레이할 수 있다. 도 9는 설명의 편의를 위해 디스플레이 장치(100)가 전자 장치(100)로부터 수신된 화면 이미지를 일정 배율(예를 들어, 사용자 명령에 따라 설정된 배율)로 확대 시킨 뒤 디스플레이하는 경우를 상정하여 도시한 것이다.

도 10을 참조하면, 본 개시의 일 실시 예에 따른 프로세서(140)는 라이브 이미지(10)가 디스플레이 장치(200)로 전송되는 동안, 사용자 명령에 따라 디스플레이된 라이브 이미지(10)가 캡쳐되면, 라이브 이미지(10)의 전송을 중단할 수 있다.

예를 들어, 전자 장치(100)를 파지하고 있는 사용자의 손이 고정되어 있지 않으면, 카메라(110)를 통해 수신된 라이브 이미지(10)가 끊임 없이 변경되므로 사용자 또는 프로세서(140)가 텍스트 등을 인식하기 어려운 문제가 있다.

프로세서(140)는 사용자 명령에 따라 디스플레이된 라이브 이미지(10)를 캡쳐할 수 있다. 이 경우, 프로세서(140)는 디스플레이 장치(200)로 실시간 전송 중인 라이브 이미지(10)의 전송을 중단할 수 있다, 이어서, 프로세서(140)는 캡쳐된 이미지를 디스플레이 장치(200)로 전송하도록 통신 인터페이스(130)를 전송할 수 있다. 여기서, 캡쳐된 이미지는 프리징된(freezing) 이미지, 고정된 이미지 등으로 불릴 수 있으나, 설명의 편의를 위해 캡쳐된 이미지로 통칭하도록 한다.

디스플레이 장치(200)는 전자 장치(100)로부터 수신된 캡쳐된 이미지를 디스플레이할 수 있다. 이 경우, 전자 장치(100)에 구비된 카메라(110)가 전송하는 라이브 이미지(10)가 변경되어도, 전자 장치(100) 및 디스플레이 장치(200)는 캡쳐된 이미지를 디스플레이할 수 있다. 다만, 이는 일 예시이고, 전자 장치(100)는 카메라(110)로부터 전송된 라이브 이미지(10)를 디스플레이하고, 디스플레이 장치(200)는 캡쳐된 이미지를 디스플레이할 수도 있음은 물론이다.

일 실시 예에 따른 디스플레이 장치(200)는 캡쳐된 이미지에 포함된 텍스트를 식별하고, 식별된 텍스트를 임계 비율로 확대시켜 디스플레이할 수 있다.

본 개시의 일 실시 예에 따른 디스플레이 장치(200)는 확대 비율을 설정하기 위한 UI를 디스플레이할 수 있다. 예를 들어, 디스플레이 장치(200)는 확대 비율을 설정하기 위한 UI에 대한 사용자 명령에 따라 설정된 확대 비율에 기초하여 텍스트 영역 또는 식별된 텍스트를 확대시킨 뒤 디스플레이할 수 있다.

또한, 디스플레이 장치(200)는 식별된 텍스트에 TTS를 적용하여 텍스트에 대응되는 음성 정보를 획득할 수도 있다.

도 11을 참조하면, 본 개시의 일 실시 예에 따른 디스플레이 장치(200)는 전자 장치(100)로부터 수신된 라이브 이미지(10) 내에서 텍스트 영역을 식별하고, 식별된 텍스트 영역에 포함된 텍스트를 식별할 수 있다.

이어서, 디스플레이 장치(200)는 식별된 텍스트에 기초하여 출력 레이아웃을 식별할 수 있다. 일 예로, 디스플레이 장치(200)는 식별된 텍스트의 텍스트 수가 임계 값 이상인지 여부를 식별할 수 있다. 이어서, 디스플레이 장치(200)는 식별된 텍스트의 개수가 임계 값 이상이면, 상대적으로 많은 텍스트를 디스플레이하기에 적합한 출력 레이아웃을 식별할 수 있다.

예를 들어, 디스플레이 장치(200)는 저 시력자가 텍스트를 용이하게 인식하도록 한개 내지 열개의 문자만이 화면에 디스플레이되도록 텍스트를 확대시킬 수 있다. 한편, 텍스트 수가 임계 값 이상이면, 사용자가 모든 텍스트를 인식하기까지 많은 시간이 소요되는 문제가 있다. 일 실시 예에 따른 디스플레이 장치(200)는 화면 내 여백을 최소화하면서 텍스트의 확대 비율을 최대화시키기 위해 화면을 이등분하고 화면의 왼쪽 및 오른쪽 각각에 일정 개수의 텍스트를 확대시켜 디스플레이할 수 있다.

도 11을 참조하면, 출력 레이아웃은 One page layout 또는 Two page layout을 포함할 수 있다. 다만, 이는 일 예시로 이에 한정되지 않음은 물론이다. 예를 들어, 화면을 왼쪽과 오른쪽으로 이등분하는 Two page layout을 포함할 수도 있고, 화면을 상단과 하단으로 이등분하는 Two page layout을 포함할 수도 있음은 물론이다.

다른 예로, 디스플레이 장치(200)는 라이브 이미지(10) 내에서 복수의 텍스트 영역을 식별하면, 출력 레이아웃으로 Two page layout을 식별할 수 있다. 이어서, 제1 텍스트 영역에 포함된 텍스트를 화면 상 왼쪽 레이아웃에 디스플레이하고, 제2 텍스트 영역에 포하된 텍스트를 화면 상 오른쪽 레이아웃에 디스플레이할 수 있다.

본 개시의 일 실시 예에 따른 전자 장치의 제어 방법은 우선, 카메라를 통해 수신된 라이브 이미지를 디스플레이한다(S1210).

이어서, 라이브 이미지 내에서 텍스트를 포함하는 텍스트 영역이 라이브 이미지의 엣지 영역에 위치하면, 카메라의 촬영 방향 변경을 가이드하는 UI를 라이브 이미지 상에 디스플레이한다(S1220).

이어서, UI를 포함하는 라이브 이미지를 외부 디스플레이 장치로 전송한다(S1230).

본 개시의 일 실시 예에 따른 라이브 이미지를 디스플레이하는 S1210 단계는, 라이브 이미지에 포함된 텍스트 영역이 화면 내에서 임계 비율 이상이 되도록 텍스트 영역을 확대시켜 디스플레이하는 단계를 포함하고, 전송하는 S1230 단계는, 확대된 텍스트 영역을 포함하는 라이브 이미지를 외부 디스플레이 장치로 전송하는 단계를 포함할 수 있다.

일 실시 예에 따른 제어 방법은, 확대 비율을 설정하기 위한 UI를 디스플레이하는 단계를 더 포함하고, 라이브 이미지를 디스플레이하는 S1210 단계는, 확대 비율을 설정하기 위한 UI를 통해 설정된 확대 비율에 기초하여 텍스트 영역을 확대시켜 디스플레이하는 단계를 포함할 수 있다.

본 개시의 일 실시 예에 따른 제어 방법은, 텍스트 영역에 포함된 텍스트를 식별하는 단계, 식별된 텍스트에 TTS(Text to Speech)를 적용하여 텍스트에 대응되는 음성 정보를 획득하는 단계 및 음성 정보에 기초하여 사운드를 출력하는 단계를 더 포함할 수 있다.

본 개시의 일 실시 예에 따른 제어 방법은, 획득된 음성 정보를 외부 디스플레이 장치로 전송하는 단계를 더 포함할 수 있다.

본 개시의 일 실시 예에 따른 제어 방법은, 사용자 명령에 따라 편집(edit) 모드가 실행되면, 텍스트 영역에 포함된 텍스트를 식별하여 식별된 텍스트를 포함하는 편집 UI를 디스플레이하는 단계, 편집 UI 상에서 텍스트에 대한 편집이 수행되면, 편집된 텍스트를 디스플레이하는 단계 및 편집된 텍스트를 포함하는 디스플레이의 화면 이미지를 외부 디스플레이 장치로 전송하는 단계를 더 포함할 수 있다.

본 개시의 일 실시 예에 따른 전송하는 S1230 단계는, 라이브 이미지가 외부 디스플레이 장치로 전송되는 동안, 사용자 명령에 따라 디스플레이된 라이브 이미지가 캡쳐되면, 라이브 이미지의 전송을 중단하고, 캡쳐된 이미지를 외부 디스플레이 장치로 전송하는 단계를 포함할 수 있다.

다만, 본 개시의 다양한 실시 예들은 전자 장치 뿐 아니라, 디스플레이를 구비하는 모든 유형의 전자 장치에 적용될 수 있음은 물론이다.

한편, 이상에서 설명된 다양한 실시 예들은 소프트웨어(software), 하드웨어(hardware) 또는 이들의 조합을 이용하여 컴퓨터(computer) 또는 이와 유사한 장치로 읽을 수 있는 기록 매체 내에서 구현될 수 있다. 일부 경우에 있어 본 명세서에서 설명되는 실시 예들이 프로세서 자체로 구현될 수 있다. 소프트웨어적인 구현에 의하면, 본 명세서에서 설명되는 절차 및 기능과 같은 실시 예들은 별도의 소프트웨어 모듈들로 구현될 수 있다. 소프트웨어 모듈들 각각은 본 명세서에서 설명되는 하나 이상의 기능 및 동작을 수행할 수 있다.

한편, 상술한 본 개시의 다양한 실시 예들에 따른 전자 장치(100)의 프로세싱 동작을 수행하기 위한 컴퓨터 명령어(computer instructions)는 비일시적 컴퓨터 판독 가능 매체(non-transitory computer-readable medium) 에 저장될 수 있다. 이러한 비일시적 컴퓨터 판독 가능 매체에 저장된 컴퓨터 명령어는 특정 기기의 프로세서에 의해 실행되었을 때 상술한 다양한 실시 예에 따른 전자 장치(100)에서의 처리 동작을 특정 기기가 수행하도록 한다.

비일시적 컴퓨터 판독 가능 매체란 레지스터, 캐쉬, 메모리 등과 같이 짧은 순간 동안 데이터를 저장하는 매체가 아니라 반영구적으로 데이터를 저장하며, 기기에 의해 판독(reading)이 가능한 매체를 의미한다. 비일시적 컴퓨터 판독 가능 매체의 구체적인 예로는, CD, DVD, 하드 디스크, 블루레이 디스크, USB, 메모리카드, ROM 등이 있을 수 있다.

이상에서는 본 개시의 바람직한 실시 예에 대하여 도시하고 설명하였지만, 본 개시는 상술한 특정의 실시 예에 한정되지 아니하며, 청구범위에서 청구하는 본 개시의 요지를 벗어남이 없이 당해 개시에 속하는 기술분야에서 통상의 지식을 가진자에 의해 다양한 변형실시가 가능한 것은 물론이고, 이러한 변형실시들은 본 개시의 기술적 사상이나 전망으로부터 개별적으로 이해되어져서는 안될 것이다.

Claims

카메라;

디스플레이;

회로를 포함하는 통신 인터페이스; 및

상기 카메라를 통해 수신된 라이브 이미지를 디스플레이하도록 상기 디스플레이를 제어하고,

상기 디스플레이된 라이브 이미지를 외부 디스플레이 장치로 전송하도록 상기 통신 인터페이스를 제어하는 프로세서;를 포함하고,

상기 프로세서는,

상기 라이브 이미지 내에서 텍스트를 포함하는 텍스트 영역이 상기 라이브 이미지의 엣지 영역에 위치하면, 상기 카메라의 촬영 방향 변경을 가이드하는 UI를 상기 라이브 이미지 상에 디스플레이하도록 상기 디스플레이를 제어하고,

상기 UI를 포함하는 상기 라이브 이미지를 상기 외부 디스플레이 장치로 전송하도록 상기 통신 인터페이스를 제어하는, 전자 장치.
제1항에 있어서,

상기 프로세서는,

상기 라이브 이미지에 포함된 상기 텍스트 영역이 상기 디스플레이의 화면 내에서 임계 비율 이상이 되도록 상기 텍스트 영역을 확대시켜 디스플레이하도록 상기 디스플레이를 제어하고,

상기 확대된 텍스트 영역을 포함하는 상기 라이브 이미지를 상기 외부 디스플레이 장치로 전송하도록 상기 통신 인터페이스를 제어하는, 전자 장치.
제1항에 있어서,

상기 프로세서는,

확대 비율을 설정하기 위한 UI를 디스플레이하도록 상기 디스플레이를 제어하고,

상기 확대 비율을 설정하기 위한 UI를 통해 설정된 확대 비율에 기초하여 상기 텍스트 영역을 확대시켜 디스플레이하도록 상기 디스플레이를 제어하는, 전자 장치.
제1항에 있어서,

스피커;를 더 포함하고,

상기 프로세서는,

상기 텍스트 영역에 포함된 상기 텍스트를 식별하고, 상기 식별된 텍스트에 TTS(Text to Speech)를 적용하여 상기 텍스트에 대응되는 음성 정보를 획득하고, 상기 음성 정보에 기초하여 사운드를 출력하도록 상기 스피커를 제어하는, 전자 장치.
제4항에 있어서,

상기 프로세서는,

상기 획득된 음성 정보를 상기 외부 디스플레이 장치로 전송하도록 상기 통신 인터페이스를 제어하는, 전자 장치.
제1항에 있어서,

상기 프로세서는,

상기 텍스트 영역에 포함된 상기 텍스트를 식별하고,

상기 식별된 텍스트를 포함하는 정보를 상기 외부 디스플레이 장치로 전송하도록 상기 통신 인터페이스를 제어하는, 전자 장치.
제1항에 있어서,

상기 프로세서는,

사용자 명령에 따라 편집(edit) 모드가 실행되면, 상기 텍스트 영역에 포함된 상기 텍스트를 식별하여 상기 식별된 텍스트를 포함하는 편집 UI를 디스플레이하도록 상기 디스플레이를 제어하고,

상기 편집 UI 상에서 상기 텍스트에 대한 편집이 수행되면, 상기 편집된 텍스트를 디스플레이하도록 상기 디스플레이를 제어하고,

상기 편집된 텍스트를 포함하는 상기 디스플레이의 화면 이미지를 상기 외부 디스플레이 장치로 전송하도록 상기 통신 인터페이스를 제어하는, 전자 장치.
제1항에 있어서,

상기 프로세서는,

상기 라이브 이미지가 상기 외부 디스플레이 장치로 전송되는 동안, 사용자 명령에 따라 상기 디스플레이된 라이브 이미지가 캡쳐되면, 상기 라이브 이미지의 전송을 중단하고, 상기 캡쳐된 이미지를 상기 외부 디스플레이 장치로 전송하도록 상기 통신 인터페이스를 제어하는, 전자 장치.
제1항에 있어서,

상기 외부 디스플레이 장치는,

상기 디스플레이의 화면보다 큰 사이즈의 화면을 가지는 디스플레이를 구비하는 장치인, 전자 장치.
전자 장치 및 디스플레이 장치를 포함하는 시스템에 있어서,

카메라를 통해 수신된 수신된 라이브 이미지 내에서 텍스트를 포함하는 텍스트 영역이 상기 라이브 이미지의 엣지 영역에 위치하면, 상기 카메라의 촬영 방향 변경을 가이드하는 UI를 포함하는 상기 라이브 이미지를 디스플레이하고, 상기 UI를 포함하는 상기 라이브 이미지를 상기 디스플레이 장치로 전송하는 전자 장치; 및

상기 전자 장치로부터 수신된 상기 UI를 포함하는 라이브 이미지를 디스플레이하는 디스플레이 장치;를 포함하는, 시스템.
제10항에 있어서,

상기 디스플레이 장치는,

상기 라이브 이미지에 포함된 상기 텍스트 영역이 상기 디스플레이 장치의 화면 내에서 임계 비율 이상이 되도록 상기 텍스트 영역을 확대시켜 디스플레이하는, 시스템.
제10항에 있어서,

상기 디스플레이 장치는,

확대 비율을 설정하기 위한 UI를 디스플레이하고,

상기 확대 비율을 설정하기 위한 UI를 통해 설정된 확대 비율에 기초하여 상기 텍스트 영역을 확대시켜 디스플레이하는, 시스템.
제10항에 있어서,

상기 디스플레이 장치는,

상기 텍스트 영역에 포함된 상기 텍스트가 식별되면, 상기 식별된 텍스트에 기초하여 출력 레이아웃을 식별하고,

상기 식별된 출력 레이아웃에 따라 상기 텍스트를 디스플레이하는, 시스템.
전자 장치의 제어 방법에 있어서,

카메라를 통해 수신된 라이브 이미지를 디스플레이하는 단계;

상기 라이브 이미지 내에서 텍스트를 포함하는 텍스트 영역이 상기 라이브 이미지의 엣지 영역에 위치하면, 상기 카메라의 촬영 방향 변경을 가이드하는 UI를 상기 라이브 이미지 상에 디스플레이하는 단계; 및

상기 UI를 포함하는 상기 라이브 이미지를 외부 디스플레이 장치로 전송하는 단계;를 포함하는 제어 방법.
제14항에 있어서,

상기 라이브 이미지를 디스플레이하는 단계는,

상기 라이브 이미지에 포함된 상기 텍스트 영역이 화면 내에서 임계 비율 이상이 되도록 상기 텍스트 영역을 확대시켜 디스플레이하는 단계;를 포함하고,

상기 전송하는 단계는,

상기 확대된 텍스트 영역을 포함하는 상기 라이브 이미지를 상기 외부 디스플레이 장치로 전송하는 단계;를 포함하는, 제어 방법.