WO2021230474A1 - 전자 장치, 시스템 및 그 제어 방법 - Google Patents

전자 장치, 시스템 및 그 제어 방법 Download PDF

Info

Publication number
WO2021230474A1
WO2021230474A1 PCT/KR2021/002367 KR2021002367W WO2021230474A1 WO 2021230474 A1 WO2021230474 A1 WO 2021230474A1 KR 2021002367 W KR2021002367 W KR 2021002367W WO 2021230474 A1 WO2021230474 A1 WO 2021230474A1
Authority
WO
WIPO (PCT)
Prior art keywords
text
display
live image
display device
electronic device
Prior art date
Application number
PCT/KR2021/002367
Other languages
English (en)
French (fr)
Inventor
정현준
이의윤
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Publication of WO2021230474A1 publication Critical patent/WO2021230474A1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/462Content or additional data management, e.g. creating a master electronic program guide from data received from the Internet and a Head-end, controlling the complexity of a video stream by scaling the resolution or bit-rate based on the client capabilities
    • H04N21/4621Controlling the complexity of the content stream or additional data, e.g. lowering the resolution or bit-rate of the video stream for a mobile client with a small screen
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/21Server components or server architectures
    • H04N21/218Source of audio or video content, e.g. local disk arrays
    • H04N21/2187Live feed
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/414Specialised client platforms, e.g. receiver in car or embedded in a mobile appliance
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/414Specialised client platforms, e.g. receiver in car or embedded in a mobile appliance
    • H04N21/41407Specialised client platforms, e.g. receiver in car or embedded in a mobile appliance embedded in a portable device, e.g. video client on a mobile phone, PDA, laptop
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/431Generation of visual interfaces for content selection or interaction; Content or additional data rendering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/431Generation of visual interfaces for content selection or interaction; Content or additional data rendering
    • H04N21/4312Generation of visual interfaces for content selection or interaction; Content or additional data rendering involving specific graphical features, e.g. screen layout, special fonts or colors, blinking icons, highlights or animations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/436Interfacing a local distribution network, e.g. communicating with another STB or one or more peripheral devices inside the home
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/436Interfacing a local distribution network, e.g. communicating with another STB or one or more peripheral devices inside the home
    • H04N21/43615Interfacing a Home Network, e.g. for connecting the client to a plurality of peripherals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/462Content or additional data management, e.g. creating a master electronic program guide from data received from the Internet and a Head-end, controlling the complexity of a video stream by scaling the resolution or bit-rate based on the client capabilities

Definitions

  • the present invention relates to an electronic device, a system, and a control method thereof, and more particularly, to an electronic device including a camera, a system, and a control method thereof.
  • Electronic magnifiers are useful for many users with visual impairments in that they enlarge and display objects and letters to a size that low-vision people can recognize for users who have difficulty recognizing objects or letters such as those with low vision. It corresponds to the required electronic device.
  • the present disclosure is in accordance with the above-mentioned necessity, and an object of the present disclosure is to easily photograph an object to be enlarged by using an electronic device having a camera, and to display enlarged objects and letters using a relatively large screen.
  • An object of the present invention is to provide an electronic device, a system for displaying, and a method for controlling the same.
  • an electronic device controls the display to display a live image received through a camera, a display, a communication interface including a circuit, and the camera, and the displayed and a processor for controlling the communication interface to transmit a live image to an external display device, wherein the processor is configured to: when a text area including text in the live image is located in an edge area of the live image, the camera is captured The display is controlled to display a UI for guiding a direction change on the live image, and the communication interface is controlled to transmit the live image including the UI to the external display device.
  • the processor controls the display to enlarge and display the text area so that the text area included in the live image is equal to or greater than a threshold ratio within the screen of the display, and includes the enlarged text area.
  • the communication interface may be controlled to transmit a live image to the external display device.
  • the processor controls the display to display a UI for setting the magnification ratio, and controls the display to enlarge and display the text area based on the magnification ratio set through the UI for setting the magnification ratio can do.
  • the electronic device further includes a speaker
  • the processor identifies the text included in the text area, applies Text to Speech (TTS) to the identified text, and generates voice information corresponding to the text. and control the speaker to output sound based on the voice information.
  • TTS Text to Speech
  • the processor may control the communication interface to transmit the acquired voice information to the external display device.
  • the processor may control the communication interface to identify the text included in the text area and transmit information including the identified text to the external display device.
  • the processor identifies the text included in the text area and controls the display to display an editing UI including the identified text, and When editing of the text is performed on the UI, control the display to display the edited text, and control the communication interface to transmit a screen image of the display including the edited text to the external display device can
  • the processor stops transmitting the live image, and displays the captured image to the external display device. It is possible to control the communication interface to transmit to.
  • the external display device may be a device having a display having a screen having a size larger than that of the display screen.
  • a text area including text in a received live image received through a camera is an edge area of the live image
  • an electronic device that displays the live image including a UI for guiding a change in the shooting direction of the camera transmits the live image including the UI to the display device, and the UI received from the electronic device It includes a display device for displaying a live image comprising a.
  • the display apparatus may enlarge and display the text area such that the text area included in the live image is equal to or greater than a threshold ratio within the screen of the display apparatus.
  • the display device may display a UI for setting the magnification ratio, and enlarge and display the text area based on the magnification ratio set through the UI for setting the magnification ratio.
  • the display device may identify an output layout based on the identified text and display the text according to the identified output layout.
  • a method of controlling an electronic device includes displaying a live image received through a camera, wherein a text area including text in the live image is displayed on the live image.
  • a UI for guiding a change in the shooting direction of the camera on the live image, and transmitting the live image including the UI to an external display device.
  • the step of displaying the live image includes enlarging and displaying the text area so that the text area included in the live image is equal to or greater than a threshold ratio in a screen, and the transmitting includes:
  • the method may include transmitting the live image including the displayed text area to the external display device.
  • control method further includes displaying a UI for setting a magnification ratio, wherein the displaying of the live image includes the text area based on the magnification ratio set through the UI for setting the magnification ratio. It may include the step of enlarging the display.
  • control method may include: identifying the text included in the text area; obtaining voice information corresponding to the text by applying Text to Speech (TTS) to the identified text; and based on the voice information
  • TTS Text to Speech
  • the method may further include outputting a sound.
  • control method may further include transmitting the acquired voice information to the external display device.
  • control method includes, when an edit mode is executed according to a user command, identifying the text included in the text area and displaying an editing UI including the identified text, the text on the editing UI
  • the method may further include displaying the edited text and transmitting a screen image of the display including the edited text to the external display device.
  • the transmitting step when the displayed live image is captured according to a user command while the live image is transmitted to the external display device, the transmission of the live image is stopped, and the captured image is transferred to the external device. It may include transmitting to the display device.
  • an object to be enlarged may be easily photographed using a camera provided in a portable electronic device.
  • the text included on the live image may be enlarged and displayed to the user.
  • a text misrecognition rate can be reduced, and a sound corresponding to the text can be output by applying the TTS to the text.
  • Information in the form of text included in the information medium can be converted into sound and output, and low-vision or visually impaired people can easily acquire the information through sound.
  • FIG. 1 is a diagram schematically illustrating the configuration of a system according to an embodiment of the present disclosure.
  • FIG. 2 is a diagram schematically illustrating a configuration of an electronic device according to an embodiment of the present disclosure.
  • FIG. 3 is a block diagram illustrating a configuration of an electronic device according to an embodiment of the present disclosure.
  • FIG. 4 is a diagram for describing a text area according to an embodiment of the present disclosure.
  • FIG. 5 is a diagram for explaining an enlarged text area according to an embodiment of the present disclosure.
  • FIG. 6 is a view for explaining an enlargement ratio according to an embodiment of the present disclosure.
  • FIG. 7 is a diagram for explaining voice information according to an embodiment of the present disclosure.
  • FIG. 8 is a diagram for explaining text provided through a display device according to an embodiment of the present disclosure.
  • FIG. 9 is a diagram for explaining an editing mode according to an embodiment of the present disclosure.
  • FIG. 10 is a diagram for explaining a captured image according to an embodiment of the present disclosure.
  • FIG. 11 is a diagram for describing an output layout according to an embodiment of the present disclosure.
  • FIG. 12 is a flowchart illustrating a method of controlling an electronic device according to an embodiment of the present disclosure.
  • Embodiments of the present disclosure may apply various transformations and may have various embodiments, and specific embodiments will be illustrated in the drawings and described in detail in the detailed description. However, this is not intended to limit the scope of the specific embodiments, and it should be understood to include all transformations, equivalents and substitutions included in the spirit and scope of the disclosure. In describing the embodiments, if it is determined that a detailed description of a related known technology may obscure the subject matter, the detailed description thereof will be omitted.
  • a “module” or “unit” performs at least one function or operation, and may be implemented as hardware or software, or a combination of hardware and software.
  • a plurality of “modules” or a plurality of “units” are integrated into at least one module and implemented with at least one processor (not shown) except for “modules” or “units” that need to be implemented with specific hardware.
  • FIG. 1 is a diagram schematically illustrating a configuration of a system according to an embodiment of the present disclosure.
  • a system 1000 includes an electronic device 100 and a display device 200 .
  • each of the electronic device 100 and the display device 200 is, for example, a smartphone, a tablet PC, a mobile phone, a video phone, an e-book reader, a desktop PC, a laptop PC, a netbook computer, a workstation, a server, It may include at least one of a PDA, a portable multimedia player (PMP), an MP3 player, a medical device, a camera, a virtual reality (VR) implementation device, or a wearable device.
  • the wearable device may be an accessory type (eg, watch, ring, bracelet, anklet, necklace, eyeglasses, contact lens, or head-mounted-device (HMD)), a textile or an integrated garment (eg, electronic garment).
  • each of the electronic device 100 and the display device 200 may include, for example, , televisions, digital video disk (DVD) players, audio, refrigerators, air conditioners, vacuums, ovens, microwaves, washing machines, air purifiers, set-top boxes, home automation control panels, security control panels, media boxes (e.g. Samsung HomeSyncTM) , Apple TVTM, or Google TVTM), a game console (eg, XboxTM, PlayStationTM), an electronic dictionary, an electronic key, a camcorder, or an electronic picture frame.
  • DVD digital video disk
  • each of the electronic device 100 and the display device 200 may include various medical devices (eg, various portable medical measuring devices (eg, a blood glucose meter, a heart rate monitor, a blood pressure monitor, or a body temperature monitor), magnetic resonance (MRA), etc.). angiography), magnetic resonance imaging (MRI), computed tomography (CT), imagers, or ultrasound machines, etc.), navigation devices, global navigation satellite system (GNSS), EDR (event data recorder), FDR (flight data) recorder), automotive infotainment devices, marine electronic equipment (e.g.
  • marine navigation systems gyro compasses, etc.
  • avionics security devices
  • vehicle head units industrial or domestic robots
  • drones drones
  • ATMs in financial institutions point of sales (POS) in stores
  • POS point of sales
  • Internet of Things devices e.g. light bulbs, sensors, sprinkler devices, fire alarms, thermostats, street lights, toasters, exercise equipment, hot water tanks, heaters, boilers, etc.
  • POS point of sales
  • Internet of Things devices e.g. light bulbs, sensors, sprinkler devices, fire alarms, thermostats, street lights, toasters, exercise equipment, hot water tanks, heaters, boilers, etc.
  • POS point of sales
  • Internet of Things devices e.g. light bulbs, sensors, sprinkler devices, fire alarms, thermostats, street lights, toasters, exercise equipment, hot water tanks, heaters, boilers, etc.
  • Each of the electronic device 100 and the display device 100 may display various types of content.
  • the electronic device 100 may be implemented as a user terminal device, and the display device 200 may be implemented as a TV, but the present invention is not limited thereto.
  • the display device 200 is a device having a display function such as a video wall, a large format display (LFD), a digital signage, a digital information display (DID), a projector display, etc.
  • the display device 100 is a liquid crystal display (LCD), organic light-emitting diode (OLED), liquid crystal on silicon (LCoS), digital light processing (DLP), QD (quantum dot) display panel, QLED (quantum) dot light-emitting diodes) It can be implemented in various types of displays, such as micro light-emitting diodes ( ⁇ LEDs) and mini LEDs.
  • each of the electronic device 100 and the display device 100 includes a touch screen coupled with a touch sensor, a flexible display, a rollable display, a three-dimensional display, and a plurality of display modules. It may be implemented as a physically connected display or the like.
  • the electronic device 100 is implemented as a user terminal device and the display device 200 is implemented as a TV.
  • the electronic device 100 and the display device 200 according to an embodiment of the present disclosure may communicate, and the display device 200 may display various types of content received from the electronic device 100 .
  • the display apparatus 200 may receive content data from the electronic device 100 and display the content based on the received content data.
  • the electronic device 100 and the display device 200 communicate wirelessly, and the display device 200 automatically displays the same screen as the screen displayed on the electronic device 100 through screen mirroring. It goes without saying that the display may be displayed through a display provided as a .
  • the electronic device 100 may acquire and display a live image 10 of the surroundings through a camera provided in the electronic device 100 .
  • the display device 200 communicating with the electronic device 100 may autonomously display the live image 10 displayed through the electronic device 100 through a screen mirroring function.
  • the electronic device 100 may acquire a live image 10 obtained by photographing a book, document, newspaper, etc. including text, and transmit the acquired live image 10 to the display device 200 .
  • the display device 200 may include a display that is relatively larger than the display included in the electronic device 100 , and the display device 200 has a live image received from the electronic device 100 through the relatively large display. can be displayed.
  • FIG. 2 is a diagram schematically illustrating a configuration of an electronic device according to an embodiment of the present disclosure.
  • the electronic device 100 may identify a text area including text in a live image received from a camera in real time.
  • the electronic device 100 may identify a text area including text by performing OCR (Optical Character Recognition) on at least one object included in the live image 10 .
  • OCR Optical Character Recognition
  • the electronic device 100 may identify a text area including text in the live image 10 in various ways.
  • the electronic device 100 may input the live image 10 into the artificial intelligence model to identify a text area including text in the live image 10 .
  • the artificial intelligence model according to the embodiment is a judgment model learned based on a plurality of images based on an artificial intelligence algorithm, and may be a model based on a neural network.
  • the learned judgment model may be designed to simulate a human brain structure on a computer and may include a plurality of network nodes having weights that simulate neurons of a human neural network.
  • the plurality of network nodes may each form a connection relationship so that the neuron simulates a synaptic activity of a neuron that transmits and receives a signal through a synapse.
  • the learned judgment model may include, for example, a machine learning model, a neural network model, or a deep learning model developed from a neural network model.
  • a deep learning model a plurality of network nodes may exchange data according to a convolutional connection relationship while being located at different depths (or layers).
  • the artificial intelligence model may be a convolutional neural network (CNN) model learned based on an image.
  • CNN is a multi-layer neural network with a special connection structure designed for speech processing and image processing.
  • an artificial intelligence model is not limited to CNNs.
  • an artificial intelligence model is implemented as a Deep Neural Network (DNN) model of at least one of Recurrent Neural Network (RNN), Long Short Term Memory Network (LSTM), Gated Recurrent Units (GRU), or Generative Adversarial Networks (GAN).
  • DNN Deep Neural Network
  • RNN Recurrent Neural Network
  • LSTM Long Short Term Memory Network
  • GRU Gated Recurrent Units
  • GAN Generative Adversarial Networks
  • the electronic device 100 may identify a text area predicted to include the text. For example, the electronic device 100 may perform Optical Character Recognition (OCR) on the live image 10 to identify a text area predicted to include text. As another example, the electronic device 100 may input the live image 10 into the artificial intelligence model to identify a text area predicted to include text in the live image 10 .
  • OCR Optical Character Recognition
  • a UI 20 for guiding a change in the photographing direction of the camera may be displayed on the live image 10 .
  • the edge area may mean an edge area or a corner area on the live image.
  • the text area 10 when the text area 10 is located in the corner area of the live image 10 , a part of the text included in the text area 10 is displayed on the electronic device 100 . It may not be displayed on the screen, or part of the text may be cut off and only the rest may be displayed. In this case, the probability that the electronic device 100 will erroneously recognize the text included in the text area 10 increases, and it is possible to provide the user with erroneous information and feedback (eg, visual or auditory feedback) related to the text. There are concerns.
  • the electronic device 100 identifies that a part of the text 'Samsung ran more ⁇ ' on a newspaper article included in the live image 10 is cut off or an edge of the live image 10 .
  • the recognition rate of the text on the newspaper article is lowered.
  • the electronic device 100 may display the UI 20 for guiding a change in the photographing direction of the camera.
  • the electronic device 100 may display the changed live image 10 ′ received through the camera in real time.
  • the changed live image 10 ′ may be an image in which the text area is located in the center area instead of the edge area.
  • the middle area means an area in which the entire text included in the text area 10 is displayed through a display provided in the electronic device 100 , and the probability of misrecognition of the corresponding text by the electronic device 100 is significantly lowered. can do.
  • the display device 200 performing wired or wireless communication with the electronic device 100 includes the live image 10 received from the electronic device 100 in the display device 200 . It can be displayed through the displayed display.
  • the display apparatus 200 may display a live image including the UI 20 for guiding a change in the shooting direction received from the electronic device 100 .
  • the UI 20 for guiding the change of the shooting direction has been described as including text such as 'WARNING: Text on edge detected.' am.
  • the UI 20 for guiding the change of the shooting direction may include an arrow indicating the shooting direction, and includes various types of objects notifying that a part of the text in the live image 10 is cut. Of course you can.
  • FIG. 3 is a block diagram illustrating a configuration of an electronic device according to an embodiment of the present disclosure.
  • the electronic device 100 may include a camera 110 , a display 120 , a communication interface 130 , and a processor 140 .
  • the camera 110 may scan an area around the electronic device 100 , convert it into an electrical signal, and transmit it to the processor 140 .
  • the camera 110 may include a plurality of photodiodes that convert an optical signal into an electrical signal, and the plurality of photodiodes may be arranged in two dimensions.
  • the camera 170 may include a charge-coupled device (CCD) image sensor or a complementary metal oxide semiconductor (CMOS) image sensor in which a plurality of photodiodes are disposed in two dimensions.
  • CCD charge-coupled device
  • CMOS complementary metal oxide semiconductor
  • the camera 110 may convert an optical signal obtained by scanning a peripheral area corresponding to a photographing direction, for example, an angle, into an electrical signal, and transmit the converted optical signal to the processor 140 in real time. Subsequently, the processor 140 may control the display 120 to display the live image 10 corresponding to the electrical signal received from the camera 110 .
  • the camera 110 scans a newspaper article including a plurality of text areas for convenience of explanation, but this is only an example and the camera 110 is controlled by the user Of course, it is possible to scan an area around the camera 110 according to the .
  • the display 120 may be implemented as a display including a self-luminous device or a display including a non-light-emitting device and a backlight.
  • a display including a self-luminous device or a display including a non-light-emitting device and a backlight.
  • LCD Liquid Crystal Display
  • OLED Organic Light Emitting Diodes
  • LEDs Light Emitting Diodes
  • micro LEDs micro LEDs
  • Mini LEDs Plasma Display Panel (PDP)
  • Quantum dot (QD) displays may be implemented in various types of displays.
  • the display 120 may also include a driving circuit, a backlight unit, and the like, which may be implemented in the form of an a-si TFT, a low temperature poly silicon (LTPS) TFT, or an organic TFT (OTFT).
  • LTPS low temperature poly silicon
  • OFT organic TFT
  • the display 120 is implemented as a touch screen combined with a touch sensor, a flexible display, a rollable display, a three-dimensional display (3D display), a display in which a plurality of display modules are physically connected, etc. can be
  • the display 120 may display various types of content under the control of the processor 140 .
  • the display 120 may display the live image 10 received through the camera 110 under the control of the processor 140 .
  • the communication interface 130 receives various types of content.
  • the communication interface 130 is AP-based Wi-Fi (Wi-Fi, Wireless LAN network), Bluetooth (Bluetooth), Zigbee (Zigbee), wired / wireless LAN (Local Area Network), WAN (Wide Area Network), Ethernet, IEEE 1394, HDMI (High-Definition Multimedia Interface), USB (Universal Serial Bus), MHL (Mobile High-Definition Link), AES/EBU (Audio Engineering Society/ European Broadcasting Union),
  • Optical various types of content from an external device (eg, a source device), an external storage medium (eg, a USB memory), or an external server (eg, a web hard drive) through a communication method such as , coaxial, etc. can be input.
  • the content may include a video signal, an article, text information, a post, and the like.
  • the communication interface 130 may communicate with the display apparatus 200 .
  • the communication interface 130 may transmit the live image 10 to the display apparatus 200 under the control of the processor 140 .
  • the electronic device 100 performs mirroring with the display device 200 through the communication interface 130, and a live image displayed through the display 120 provided in the electronic device 100 ( 10) may be displayed in the same manner on the display device 200 .
  • the processor 140 controls the overall operation of the electronic device 100 .
  • the processor 140 may be composed of one or a plurality of processors.
  • the processor 140 may perform the operation of the electronic device 100 according to various embodiments of the present disclosure by executing at least one instruction stored in the memory 130 .
  • the processor 140 may include a digital signal processor (DSP), a microprocessor (microprocessor), a graphics processing unit (GPU), an artificial intelligence (AI) processor, a neural network (NPU) for processing a digital image signal.
  • DSP digital signal processor
  • microprocessor microprocessor
  • GPU graphics processing unit
  • AI artificial intelligence
  • NPU neural network
  • Processing Unit TCON (Time controller), but is not limited thereto, Central processing unit (CPU), MCU (Micro Controller Unit), MPU (micro processing unit), controller (controller), application processor (application processor (AP)), communication processor (communication processor (CP)), may include one or more of an ARM processor, or may be defined by the term.
  • SoC system on chip
  • LSI large scale integration
  • ASIC application specific integrated circuit
  • FPGA field programmable gate array
  • the processor 140 is configured to, when a text area including text in the live image 10 is located in an edge area of the live image 10 , the camera 110 ), the display 120 may be controlled to display a UI for guiding the change of the shooting direction on the live image 10 .
  • the processor 140 may control the communication interface 130 to transmit the live image 10 including the UI to the display apparatus 200 .
  • the processor 140 may enlarge and display the text area so that the text area included in the live image 10 is equal to or greater than a threshold ratio within the screen of the display. A detailed description thereof will be made with reference to FIGS. 4 and 5 .
  • FIG. 4 is a diagram for describing a text area according to an embodiment of the present disclosure.
  • the processor 140 may identify a text area within the live image 10 .
  • the processor 140 may perform OCR on at least one object included in the live image 10 to identify whether the corresponding object includes text.
  • the processor 140 inputs the live image 10 into the artificial intelligence model to determine whether a text area is included in the live image 10, the position of the corresponding text area, whether the text is located in the edge area, etc. information can be obtained.
  • processor 140 may identify text areas within live image 10 using known algorithms for identifying text areas within images.
  • the processor 140 identifies a text area including text in the live image 10 , and displays information on the text area on the display apparatus 200 so that the text area is displayed on the display apparatus 200 . ) can be transmitted. For example, the processor 140 transmits the live image 10 to the display device 200 , and then the display device 200 identifies a text area within the received live image 10 , and the identified text area can be displayed.
  • the processor 140 may identify a text area in the live image 10 and transmit an image corresponding to the identified text area to the display apparatus 200 . Subsequently, the display apparatus 200 may display the received image.
  • the display provided in the display apparatus 200 may have a relatively larger size than the display 120 provided in the electronic apparatus 100 . Accordingly, if the text area is displayed through the display apparatus 200 , the user can view the text through the display apparatus 200 relatively conveniently and It has an easily recognizable effect.
  • FIG. 5 is a diagram for explaining an enlarged text area according to an embodiment of the present disclosure.
  • the processor 140 may identify a text area within the live image 10 , and enlarge and display the identified text area within a screen of the display 120 to be greater than or equal to a threshold ratio.
  • the processor 140 may analyze at least one object included in the live image 10 and classify the object into text, a picture, or a photo. Subsequently, the processor 140 may identify an area including an object classified as text as a text area.
  • the processor 140 may enlarge and display the text area so that the text area exceeds a threshold ratio in the screen.
  • the threshold ratio may mean the size of the display 120 .
  • the processor 140 may enlarge and display only the text area in the live image 10 to correspond to the entire screen of the display 120 based on the size of the display 120 .
  • the processor 140 may control the display 120 to display only a text area in the live image 10 , excluding one area including a photo, a picture, and the like.
  • the processor 140 may identify a region including a specific object in the live image 10 and enlarge and display the region.
  • the processor 140 may identify a region including a photo in the live image 10 , and display only the photo while excluding text and the like.
  • the processor 140 may identify a specific text (eg, a specific word) in the live image 10 and display only the specific text in an enlarged manner.
  • the threshold ratio according to an embodiment of the present disclosure may be a ratio set according to a user command.
  • the processor 140 may enlarge and display the text area at a rate corresponding to the user command.
  • a specific ratio or magnification
  • the processor 140 enlarges the text area based on the selected ratio (or magnification) to display it.
  • the specific number is only an example for convenience of description, and it goes without saying that the range of selectable ratios may be variously changed.
  • the processor 140 may identify a ratio corresponding to the user's pinch touch input or spread touch input, and use the identified ratio as a threshold ratio to enlarge the text area.
  • the ratio according to various embodiments of the present disclosure may include the meaning of a magnification.
  • FIG. 6 is a view for explaining an enlargement ratio according to an embodiment of the present disclosure.
  • the processor 140 may control the display to display a UI for setting an enlargement ratio.
  • the processor 140 receives a user command for selecting any one magnification from 1x to 4x (eg, 1X to 4X) through the UI for setting the magnification ratio, , the text area can be enlarged at a magnification corresponding to the user command.
  • the processor 140 may transmit the live image 10 including the enlarged text area to the display apparatus 200 .
  • the processor 140 may magnify the text area based on the set magnification ratio, and the display apparatus 200 automatically displays the text area received from the electronic device 100 as well. can be enlarged.
  • the display apparatus 200 is displaying a text area by performing mirroring communication with the electronic apparatus 100 , when the electronic apparatus 100 enlarges the displayed text area according to a set magnification ratio, the display apparatus 200 Of course, the text area in which ) is being displayed may also be enlarged at the same time.
  • each of the electronic device 100 and the display device 200 may include a speaker (not shown).
  • the speaker functions to output an audio signal.
  • the speaker may include at least one speaker unit (or an audio amplifier).
  • the speaker may include at least one of a woofer speaker, a midrange speaker, and a tweeter speaker.
  • the present invention is not limited thereto, and the speaker may output sound signals of various sound ranges using a plurality of speakers.
  • the processor 140 identifies text included in a text area, applies Text to Speech (TTS) to the identified text, and obtains voice information corresponding to the text, and voice information
  • TTS Text to Speech
  • the speaker may be controlled to output sound based on the . A detailed description thereof will be made with reference to FIG. 7 .
  • FIG. 7 is a diagram for describing voice information according to an embodiment of the present disclosure.
  • the processor 140 may identify text included in a text area.
  • the processor 140 may perform OCR on the text area or input the text area into an artificial intelligence model to identify text included in the text area.
  • the processor 140 may obtain voice information, for example, a sound signal, corresponding to the identified text using the TTS engine. Subsequently, the processor 140 may control the speaker to output a sound signal.
  • the electronic device 100 may provide the user with a voice corresponding to the text included in the live image 10 .
  • People with low visual acuity or the visually impaired who have difficulty recognizing text may acquire information included in information media mainly composed of text, such as newspapers and books, through the voice output from the electronic device 100 .
  • the electronic device 100 may output a sound corresponding to the text
  • the display device 200 may output a sound corresponding to the text.
  • the electronic device 100 may obtain voice information corresponding to the text by applying the TTS to the identified text, and transmit the acquired voice information to the display apparatus 200 . Subsequently, the display apparatus 200 may output sound through a speaker provided in the display apparatus 200 based on the received voice information.
  • the display apparatus 200 may identify text included in the text area and obtain voice information corresponding to the text by applying the TTS to the identified text.
  • the display apparatus 200 may obtain voice information corresponding to the text by itself using the TTS engine and output a sound corresponding to the acquired voice information.
  • FIG. 8 is a diagram for explaining text provided through a display device according to an embodiment of the present disclosure.
  • the electronic device 100 may identify text included in a text area and transmit information including the identified text to the display device 200 .
  • the electronic device 100 may transmit the live image 10 to the display apparatus 200 in real time, or may transmit only an image corresponding to a text area included in the live image 10 to the display apparatus 200 . have.
  • the electronic device 100 may identify text included in the text area and transmit information including the identified text to the display device 200 .
  • the information including the text may include text, a font of the text, and the size of the text.
  • the display apparatus 200 may display text based on received text information.
  • the display apparatus 200 may not display other objects, such as photos and pictures, included in the live image 10 .
  • this is an exemplary embodiment and not limited thereto.
  • the display apparatus 200 may enlarge the text to a specific magnification based on the received text information and display the enlarged text.
  • the display apparatus 200 may receive information on text included in the live image 10 from the electronic device 100 and display the text based on the received text information. For example, the display apparatus 200 may display 'Samsung ran more than ⁇ '. Here, the display apparatus 200 may display the text after magnifying it to a specific magnification.
  • FIG. 8 is a case in which the display apparatus 200 enlarges and displays the text so that a specific number of characters (eg, three alphabets) occupy the entire screen of the display provided in the display apparatus 200 for convenience of explanation. was assumed. However, this is of course not limited thereto as an example.
  • the display apparatus 200 may enlarge the text so that one character occupies the entire screen of the display provided in the display apparatus 200 .
  • a person with low vision does not receive text through the electronic device 100 having a relatively small screen, such as a smart phone or a user terminal device, but uses the display device 200 having a relatively large screen, such as a TV. Since the text can be provided through the user interface, there is an effect that even a person with low vision can easily recognize the text.
  • FIG. 9 is a diagram for explaining an editing mode according to an embodiment of the present disclosure.
  • the electronic device 100 may provide an edit mode for editing the identified text.
  • the processor 140 may identify text included in the text area and display an editing UI including the identified text.
  • the editing UI may include a plurality of UIs for controlling addition of new text, correction or deletion of identified text, change of font of text, change of size of text, and the like.
  • the processor 140 may control the display 120 to display the edited text in real time.
  • FIG. 9 assumes a case in which the 'NEWS' text 30 is added through the editing UI for convenience of explanation. However, this is an example, and of course, the processor 140 may delete or modify some of the identified texts according to a user command for the editing UI.
  • the processor 140 displays the edited text, for example, the text identified from the live image 10 , and the 'NEWS' text 30 newly added according to a user command.
  • the communication interface 130 may be controlled to transmit the screen image of 120 to the display apparatus 200 .
  • the display device 200 and the electronic device 100 are performing mirroring communication, and when editing of text is performed through the electronic device 100, the display device 200 includes the edited text.
  • a screen image of the electronic device 100 may be received and displayed in real time.
  • the display apparatus 200 may receive and display the screen image of the display 120 including the 'NEWS' text 30 from the electronic device 100 .
  • FIG. 9 illustrates a case in which the display apparatus 100 enlarges a screen image received from the electronic device 100 at a predetermined magnification (eg, a magnification set according to a user command) and then displays the enlarged image for convenience of explanation. did it
  • FIG. 10 is a diagram for explaining a captured image according to an embodiment of the present disclosure.
  • the processor 140 captures the displayed live image 10 according to a user command while the live image 10 is transmitted to the display device 200, Transmission of the live image 10 may be stopped.
  • the live image 10 received through the camera 110 is constantly changed, so that the user or the processor 140 displays text, etc. There is a problem that is difficult to recognize.
  • the processor 140 may capture the displayed live image 10 according to a user command. In this case, the processor 140 may stop the transmission of the live image 10 being transmitted in real time to the display device 200 . Then, the processor 140 communicates to transmit the captured image to the display device 200 . Interface 130 may be transmitted.
  • the captured image may be referred to as a frozen image, a fixed image, or the like, but for convenience of description, the captured image is collectively referred to as a captured image.
  • the display device 200 may display the captured image received from the electronic device 100 .
  • the electronic device 100 and the display device 200 may display the captured image.
  • the electronic device 100 may display the live image 10 transmitted from the camera 110
  • the display device 200 may display the captured image.
  • the display apparatus 200 may identify text included in a captured image, and display the identified text by magnifying it at a threshold ratio.
  • the display apparatus 200 may display a UI for setting an enlargement ratio.
  • the display apparatus 200 may display the text area or the identified text after enlarging the text area or the identified text based on the magnification ratio set according to a user command for the UI for setting the magnification ratio.
  • the display apparatus 200 may obtain voice information corresponding to the text by applying the TTS to the identified text.
  • FIG. 11 is a diagram for describing an output layout according to an embodiment of the present disclosure.
  • the display apparatus 200 identifies a text area within the live image 10 received from the electronic device 100 and displays the text included in the identified text area. can be identified.
  • the display apparatus 200 may identify the output layout based on the identified text. For example, the display apparatus 200 may identify whether the number of identified texts is equal to or greater than a threshold value. Then, when the number of identified texts is equal to or greater than a threshold value, the display apparatus 200 may identify an output layout suitable for displaying a relatively large number of texts.
  • the display apparatus 200 may enlarge the text so that only one to ten characters are displayed on the screen so that the low-vision person can easily recognize the text.
  • the display apparatus 200 may divide the screen in half to maximize the magnification ratio of the text while minimizing the blank space within the screen, and may enlarge and display a predetermined number of texts on the left and right sides of the screen.
  • the output layout may include a one page layout or a two page layout.
  • this is of course not limited thereto as an example.
  • the display apparatus 200 may identify a two page layout as an output layout. Subsequently, the text included in the first text area may be displayed on the left layout on the screen, and the text included in the second text area may be displayed on the right layout on the screen.
  • FIG. 12 is a flowchart illustrating a method of controlling an electronic device according to an embodiment of the present disclosure.
  • a live image received through a camera is displayed ( S1210 ).
  • a UI for guiding a change in the camera's shooting direction is displayed on the live image (S1220).
  • the live image including the UI is transmitted to the external display device (S1230).
  • Step S1210 of displaying the live image includes enlarging and displaying the text area so that the text area included in the live image is greater than or equal to a threshold ratio within the screen, and the step of transmitting S1230 includes: , transmitting the live image including the enlarged text area to an external display device.
  • the control method further includes displaying a UI for setting a magnification ratio, and the step of displaying the live image S1210 includes text based on the magnification ratio set through the UI for setting the magnification ratio. It may include the step of enlarging and displaying the area.
  • a control method includes the steps of: identifying text included in a text area; obtaining voice information corresponding to the text by applying Text to Speech (TTS) to the identified text; The method may further include outputting a sound based on the sound.
  • TTS Text to Speech
  • the control method according to an embodiment of the present disclosure may further include transmitting the acquired voice information to an external display device.
  • the control method includes, when an edit mode is executed according to a user command, identifying text included in a text area and displaying an editing UI including the identified text, on the editing UI
  • the method may further include displaying the edited text and transmitting a screen image of the display including the edited text to an external display device.
  • step S1230 of transmitting when a live image displayed according to a user command is captured while the live image is transmitted to the external display device, the transmission of the live image is stopped, and the captured image is transferred to an external device. It may include transmitting to the display device.
  • the various embodiments described above may be implemented in a recording medium readable by a computer or a similar device using software, hardware, or a combination thereof.
  • the embodiments described herein may be implemented by the processor itself.
  • embodiments such as the procedures and functions described in this specification may be implemented as separate software modules. Each of the software modules may perform one or more functions and operations described herein.
  • computer instructions for performing the processing operation of the electronic device 100 according to various embodiments of the present disclosure described above may be stored in a non-transitory computer-readable medium. have.
  • the specific device performs the processing operation in the electronic device 100 according to the various embodiments described above.
  • the non-transitory computer-readable medium refers to a medium that stores data semi-permanently, rather than a medium that stores data for a short moment, such as a register, cache, memory, etc., and can be read by a device.
  • Specific examples of the non-transitory computer-readable medium may include a CD, DVD, hard disk, Blu-ray disk, USB, memory card, ROM, and the like.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • User Interface Of Digital Computer (AREA)
  • Controls And Circuits For Display Device (AREA)

Abstract

전자 장치가 개시된다. 전자 장치는, 카메라, 디스플레이, 회로를 포함하는 통신 인터페이스 및 카메라를 통해 수신된 라이브 이미지를 디스플레이하도록 디스플레이를 제어하고, 디스플레이된 라이브 이미지를 외부 디스플레이 장치로 전송하도록 통신 인터페이스를 제어하는 프로세서를 포함한다.

Description

전자 장치, 시스템 및 그 제어 방법
본 발명은 전자 장치, 시스템 및 그 제어 방법에 관한 것으로, 보다 상세하게는 카메라를 포함하는 전자 장치, 시스템 및 그 제어 방법에 관한 것이다.
최근 전자 기술의 발전에 따라 다양한 유형의 전자 장치가 개발 및 보급되고 있는 실정이다. 특히, 신체적 불편함을 겪고 있는 사용자들을 위해 이러한 불편함을 줄여주기 위한 전자 장치가 개발 및 보급되고 있다.
전자 확대경(Electronic Magnifier)은 저 시력자와 같이 물체나 글자를 인지하기 어려운 사용자들을 위해 물체, 글자를 저 시력자가 인지할 수 있을 정도의 크기로 확대시켜 디스플레이한다는 점에서 시각 장애를 가진 많은 사용자들에게 필요한 전자 장치에 해당한다.
다만, 종래의 전자 확대경은 물체, 글자 등을 인식하기 위한 카메라와 디스플레이가 일체화되어 있어, 확대시키고자 하는 물체를 전자 확대경에 구비된 카메라의 위치까지 이동시켜야하는 불편함이 존재하였다.
또한, 전자 확대경에 구비된 디스플레이의 크기 이상으로 물체, 글자 등을 확대시키는 것이 불가하다는 한계가 있었다.
따라서, 확대시키고자 하는 물체의 이동 없이도 편리하게 해당 물체를 확대시켜 디스플레이하는 확대경(Magnifier)에 대한 요구가 있었다.
본 개시는 상술한 필요성에 따른 것으로, 본 개시의 목적은 카메라를 구비하는 전자 장치를 이용하여 확대시키고자 하는 물체를 용이하게 촬영하고, 상대적으로 큰 사이즈의 화면을 이용하여 확대된 물체, 글자를 디스플레이하는 전자 장치, 시스템 및 그 제어 방법을 제공함에 있다.
본 개시의 상술한 목적을 달성하기 위한 일 실시 예에 따르면 전자 장치는, 카메라, 디스플레이, 회로를 포함하는 통신 인터페이스 및 상기 카메라를 통해 수신된 라이브 이미지를 디스플레이하도록 상기 디스플레이를 제어하고, 상기 디스플레이된 라이브 이미지를 외부 디스플레이 장치로 전송하도록 상기 통신 인터페이스를 제어하는 프로세서를 포함하고, 상기 프로세서는, 상기 라이브 이미지 내에서 텍스트를 포함하는 텍스트 영역이 상기 라이브 이미지의 엣지 영역에 위치하면, 상기 카메라의 촬영 방향 변경을 가이드하는 UI를 상기 라이브 이미지 상에 디스플레이하도록 상기 디스플레이를 제어하고, 상기 UI를 포함하는 상기 라이브 이미지를 상기 외부 디스플레이 장치로 전송하도록 상기 통신 인터페이스를 제어한다.
여기서, 상기 프로세서는, 상기 라이브 이미지에 포함된 상기 텍스트 영역이 상기 디스플레이의 화면 내에서 임계 비율 이상이 되도록 상기 텍스트 영역을 확대시켜 디스플레이하도록 상기 디스플레이를 제어하고, 상기 확대된 텍스트 영역을 포함하는 상기 라이브 이미지를 상기 외부 디스플레이 장치로 전송하도록 상기 통신 인터페이스를 제어할 수 있다.
또한, 상기 프로세서는, 확대 비율을 설정하기 위한 UI를 디스플레이하도록 상기 디스플레이를 제어하고, 상기 확대 비율을 설정하기 위한 UI를 통해 설정된 확대 비율에 기초하여 상기 텍스트 영역을 확대시켜 디스플레이하도록 상기 디스플레이를 제어할 수 있다.
또한, 전자 장치는, 스피커를 더 포함하고, 상기 프로세서는, 상기 텍스트 영역에 포함된 상기 텍스트를 식별하고, 상기 식별된 텍스트에 TTS(Text to Speech)를 적용하여 상기 텍스트에 대응되는 음성 정보를 획득하고, 상기 음성 정보에 기초하여 사운드를 출력하도록 상기 스피커를 제어할 수 있다.
또한, 상기 프로세서는, 상기 획득된 음성 정보를 상기 외부 디스플레이 장치로 전송하도록 상기 통신 인터페이스를 제어할 수 있다.
또한, 상기 프로세서는, 상기 텍스트 영역에 포함된 상기 텍스트를 식별하고, 상기 식별된 텍스트를 포함하는 정보를 상기 외부 디스플레이 장치로 전송하도록 상기 통신 인터페이스를 제어할 수 있다.
또한, 상기 프로세서는, 사용자 명령에 따라 편집(edit) 모드가 실행되면, 상기 텍스트 영역에 포함된 상기 텍스트를 식별하여 상기 식별된 텍스트를 포함하는 편집 UI를 디스플레이하도록 상기 디스플레이를 제어하고, 상기 편집 UI 상에서 상기 텍스트에 대한 편집이 수행되면, 상기 편집된 텍스트를 디스플레이하도록 상기 디스플레이를 제어하고, 상기 편집된 텍스트를 포함하는 상기 디스플레이의 화면 이미지를 상기 외부 디스플레이 장치로 전송하도록 상기 통신 인터페이스를 제어할 수 있다.
또한, 상기 프로세서는, 상기 라이브 이미지가 상기 외부 디스플레이 장치로 전송되는 동안, 사용자 명령에 따라 상기 디스플레이된 라이브 이미지가 캡쳐되면, 상기 라이브 이미지의 전송을 중단하고, 상기 캡쳐된 이미지를 상기 외부 디스플레이 장치로 전송하도록 상기 통신 인터페이스를 제어할 수 있다.
또한, 상기 외부 디스플레이 장치는, 상기 디스플레이의 화면보다 큰 사이즈의 화면을 가지는 디스플레이를 구비하는 장치일 수 있다.
본 개시의 상술한 목적을 달성하기 위한 일 실시 예에 따르면 전자 장치 및 디스플레이 장치를 포함하는 시스템은, 카메라를 통해 수신된 수신된 라이브 이미지 내에서 텍스트를 포함하는 텍스트 영역이 상기 라이브 이미지의 엣지 영역에 위치하면, 상기 카메라의 촬영 방향 변경을 가이드하는 UI를 포함하는 상기 라이브 이미지를 디스플레이하고, 상기 UI를 포함하는 상기 라이브 이미지를 상기 디스플레이 장치로 전송하는 전자 장치 및 상기 전자 장치로부터 수신된 상기 UI를 포함하는 라이브 이미지를 디스플레이하는 디스플레이 장치를 포함한다.
여기서, 상기 디스플레이 장치는, 상기 라이브 이미지에 포함된 상기 텍스트 영역이 상기 디스플레이 장치의 화면 내에서 임계 비율 이상이 되도록 상기 텍스트 영역을 확대시켜 디스플레이할 수 있다.
또한, 상기 디스플레이 장치는, 확대 비율을 설정하기 위한 UI를 디스플레이하고, 상기 확대 비율을 설정하기 위한 UI를 통해 설정된 확대 비율에 기초하여 상기 텍스트 영역을 확대시켜 디스플레이할 수 있다.
또한, 상기 디스플레이 장치는, 상기 텍스트 영역에 포함된 상기 텍스트가 식별되면, 상기 식별된 텍스트에 기초하여 출력 레이아웃을 식별하고, 상기 식별된 출력 레이아웃에 따라 상기 텍스트를 디스플레이할 수 있다.
본 개시의 상술한 목적을 달성하기 위한 일 실시 예에 따르면 전자 장치의 제어 방법은, 카메라를 통해 수신된 라이브 이미지를 디스플레이하는 단계, 상기 라이브 이미지 내에서 텍스트를 포함하는 텍스트 영역이 상기 라이브 이미지의 엣지 영역에 위치하면, 상기 카메라의 촬영 방향 변경을 가이드하는 UI를 상기 라이브 이미지 상에 디스플레이하는 단계 및 상기 UI를 포함하는 상기 라이브 이미지를 외부 디스플레이 장치로 전송하는 단계를 포함한다.
여기서, 상기 라이브 이미지를 디스플레이하는 단계는, 상기 라이브 이미지에 포함된 상기 텍스트 영역이 화면 내에서 임계 비율 이상이 되도록 상기 텍스트 영역을 확대시켜 디스플레이하는 단계를 포함하고, 상기 전송하는 단계는, 상기 확대된 텍스트 영역을 포함하는 상기 라이브 이미지를 상기 외부 디스플레이 장치로 전송하는 단계를 포함할 수 있다.
또한, 제어 방법은, 확대 비율을 설정하기 위한 UI를 디스플레이하는 단계를 더 포함하고, 상기 라이브 이미지를 디스플레이하는 단계는, 상기 확대 비율을 설정하기 위한 UI를 통해 설정된 확대 비율에 기초하여 상기 텍스트 영역을 확대시켜 디스플레이하는 단계를 포함할 수 있다.
또한, 제어 방법은, 상기 텍스트 영역에 포함된 상기 텍스트를 식별하는 단계, 상기 식별된 텍스트에 TTS(Text to Speech)를 적용하여 상기 텍스트에 대응되는 음성 정보를 획득하는 단계 및 상기 음성 정보에 기초하여 사운드를 출력하는 단계를 더 포함할 수 있다.
여기서, 제어 방법은, 상기 획득된 음성 정보를 상기 외부 디스플레이 장치로 전송하는 단계를 더 포함할 수 있다.
또한, 제어 방법은, 사용자 명령에 따라 편집(edit) 모드가 실행되면, 상기 텍스트 영역에 포함된 상기 텍스트를 식별하여 상기 식별된 텍스트를 포함하는 편집 UI를 디스플레이하는 단계, 상기 편집 UI 상에서 상기 텍스트에 대한 편집이 수행되면, 상기 편집된 텍스트를 디스플레이하는 단계 및 상기 편집된 텍스트를 포함하는 상기 디스플레이의 화면 이미지를 상기 외부 디스플레이 장치로 전송하는 단계를 더 포함할 수 있다.
또한, 상기 전송하는 단계는, 상기 라이브 이미지가 상기 외부 디스플레이 장치로 전송되는 동안, 사용자 명령에 따라 상기 디스플레이된 라이브 이미지가 캡쳐되면, 상기 라이브 이미지의 전송을 중단하고, 상기 캡쳐된 이미지를 상기 외부 디스플레이 장치로 전송하는 단계를 포함할 수 있다.
본 개시의 다양한 실시 예들에 따르면, 휴대가 용이한 전자 장치에 구비된 카메라를 이용하여 확대시키고자 하는 물체를 용이하게 촬영할 수 있다.
라이브 이미지 상에 포함된 텍스트를 확대시켜 사용자에게 디스플레이할 수 있다.
텍스트의 오인식율을 줄일 수 있으며, 텍스트에 TTS를 적용하여 텍스트에 대응되는 사운드를 출력할 수 있다.
정보 매체에 포함된 텍스트 형태의 정보를 사운드로 변환하여 출력할 수 있으며, 저 시력자 또는 시각 장애인들이 사운드를 통해 해당 정보를 용이하게 습득할 수 있다.
도 1은 본 개시의 일 실시 예에 따른 시스템의 구성을 개략적으로 설명하기 위한 도면이다.
도 2는 본 개시의 일 실시 예에 따른 전자 장치의 구성을 개략적으로 설명하기 위한 도면이다.
도 3은 본 개시의 일 실시 예에 따른 전자 장치의 구성을 설명하기 위한 블록도이다.
도 4는 본 개시의 일 실시 예에 따른 텍스트 영역을 설명하기 위한 도면이다.
도 5는 본 개시의 일 실시 예에 따른 확대된 텍스트 영역을 설명하기 위한 도면이다.
도 6은 본 개시의 일 실시 예에 따른 확대 비율을 설명하기 위한 도면이다.
도 7은 본 개시의 일 실시 예에 따른 음성 정보를 설명하기 위한 도면이다.
도 8은 본 개시의 일 실시 예에 따른 디스플레이 장치를 통해 제공되는 텍스트를 설명하기 위한 도면이다.
도 9는 본 개시의 일 실시 예에 따른 편집 모드를 설명하기 위한 도면이다.
도 10은 본 개시의 일 실시 예에 따른 캡쳐된 이미지를 설명하기 위한 도면이다.
도 11은 본 개시의 일 실시 예에 따른 출력 레이아웃을 설명하기 위한 도면이다.
도 12는 본 개시의 일 실시 예에 따른 전자 장치의 제어 방법을 설명하기 위한 흐름도이다.
-
본 명세서에서 사용되는 용어에 대해 간략히 설명하고, 본 개시에 대해 구체적으로 설명하기로 한다. 
본 개시의 실시 예에서 사용되는 용어는 본 개시에서의 기능을 고려하면서 가능한 현재 널리 사용되는 일반적인 용어들을 선택하였으나, 이는 당 분야에 종사하는 기술자의 의도 또는 판례, 새로운 기술의 출현 등에 따라 달라질 수 있다. 또한, 특정한 경우는 출원인이 임의로 선정한 용어도 있으며, 이 경우 해당되는 개시의 설명 부분에서 상세히 그 의미를 기재할 것이다. 따라서 본 개시에서 사용되는 용어는 단순한 용어의 명칭이 아닌, 그 용어가 가지는 의미와 본 개시의 전반에 걸친 내용을 토대로 정의되어야 한다.
본 개시의 실시 예들은 다양한 변환을 가할 수 있고 여러 가지 실시 예를 가질 수 있는바, 특정 실시 예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나 이는 특정한 실시 형태에 대해 범위를 한정하려는 것이 아니며, 개시된 사상 및 기술 범위에 포함되는 모든 변환, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 실시 예들을 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 요지를 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다.
제1, 제2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 구성요소들은 용어들에 의해 한정되어서는 안 된다. 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다.
단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "구성되다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
본 개시에서 "모듈" 혹은 "부"는 적어도 하나의 기능이나 동작을 수행하며, 하드웨어 또는 소프트웨어로 구현되거나 하드웨어와 소프트웨어의 결합으로 구현될 수 있다. 또한, 복수의 "모듈" 혹은 복수의 "부"는 특정한 하드웨어로 구현될 필요가 있는 "모듈" 혹은 "부"를 제외하고는 적어도 하나의 모듈로 일체화되어 적어도 하나의 프로세서(미도시)로 구현될 수 있다.
아래에서는 첨부한 도면을 참고하여 본 개시의 실시 예에 대하여 본 개시가 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그러나 본 개시는 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시 예에 한정되지 않는다. 그리고 도면에서 본 개시를 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
도 1은 본 개시의 일 실시 예에 따른 시스템의 구성을 개략적으로 설명하기 위한 도면이다.
도 1에 도시된 바에 따르면, 본 개시의 일 실시 예에 따른 시스템(1000)은 전자 장치(100) 및 디스플레이 장치(200)를 포함한다.
여기서, 전자 장치(100) 및 디스플레이 장치(200) 각각은, 예를 들면, 스마트폰, 태블릿 PC, 이동 전화기, 영상 전화기, 전자책 리더기, 데스크탑 PC, 랩탑 PC, 넷북 컴퓨터, 워크스테이션, 서버, PDA, PMP(portable multimedia player), MP3 플레이어, 의료기기, 카메라, 가상 현실(virtual reality(VR)) 구현 장치 또는 웨어러블 장치 중 적어도 하나를 포함할 수 있다. 여기서, 웨어러블 장치는 액세서리형(예: 시계, 반지, 팔찌, 발찌, 목걸이, 안경, 콘택트 렌즈, 또는 머리 착용형 장치(head-mounted-device(HMD)), 직물 또는 의류 일체형(예: 전자 의복), 신체 부착형(예: 스킨 패드 또는 문신), 또는 생체 이식형 회로 중 적어도 하나를 포함할 수 있다. 어떤 실시 예들에서, 전자 장치(100) 및 디스플레이 장치(200) 각각은, 예를 들면, 텔레비전, DVD(digital video disk) 플레이어, 오디오, 냉장고, 에어컨, 청소기, 오븐, 전자레인지, 세탁기, 공기 청정기, 셋톱 박스, 홈 오토매이션 컨트롤 패널, 보안 컨트롤 패널, 미디어 박스(예: 삼성 HomeSyncTM, 애플TVTM, 또는 구글 TVTM), 게임 콘솔(예: XboxTM, PlayStationTM), 전자 사전, 전자 키, 캠코더, 또는 전자 액자 중 적어도 하나를 포함할 수 있다.
다른 실시 예에서, 전자 장치(100) 및 디스플레이 장치(200) 각각은, 각종 의료기기(예: 각종 휴대용 의료측정기기(혈당 측정기, 심박 측정기, 혈압 측정기, 또는 체온 측정기 등), MRA(magnetic resonance angiography), MRI(magnetic resonance imaging), CT(computed tomography), 촬영기, 또는 초음파기 등), 네비게이션 장치, 위성 항법 시스템(GNSS(global navigation satellite system)), EDR(event data recorder), FDR(flight data recorder), 자동차 인포테인먼트 장치, 선박용 전자 장비(예: 선박용 항법 장치, 자이로 콤파스 등), 항공 전자기기(avionics), 보안 기기, 차량용 헤드 유닛(head unit), 산업용 또는 가정용 로봇, 드론(drone), 금융 기관의 ATM, 상점의 POS(point of sales), 또는 사물 인터넷 장치 (예: 전구, 각종 센서, 스프링클러 장치, 화재 경보기, 온도조절기, 가로등, 토스터, 운동기구, 온수탱크, 히터, 보일러 등) 중 적어도 하나를 포함할 수 있다.
본 개시의 일 실시 예에 따른 전자 장치(100) 및 디스플레이 장치(100) 각각은 다양한 유형의 컨텐츠를 디스플레이할 수 있다. 일 실시 예에 따라 전자 장치(100)는 사용자 단말 장치로 구현될 수 있고, 디스플레이 장치(200)는 TV로 구현될 수 있으나, 이에 한정되지 않음은 물론이다. 예를 들어, 디스플레이 장치(200)는 비디오 월(video wall), LFD(large format display), Digital Signage(디지털 간판), DID(Digital Information Display), 프로젝터 디스플레이 등과 같이 디스플레이 기능을 갖춘 장치라면 한정되지 않고 적용 가능하다. 또한, 디스플레이 장치(100)는 LCD(liquid crystal display), OLED(organic light-emitting diode), LCoS(Liquid Crystal on Silicon), DLP(Digital Light Processing), QD(quantum dot) 디스플레이 패널, QLED(quantum dot light-emitting diodes) μLED(Micro light-emitting diodes), Mini LED 등과 같은 다양한 형태의 디스플레이로 구현될 수 있다. 한편, 전자 장치(100) 및 디스플레이 장치(100) 각각은 터치 센서와 결합된 터치 스크린, 플렉시블 디스플레이(flexible display), 롤러블 디스플레이(rollable display), 3차원 디스플레이(3D display), 복수의 디스플레이 모듈이 물리적으로 연결된 디스플레이 등으로 구현될 수도 있다.
이하에서는 설명의 편의를 위해 전자 장치(100)가 사용자 단말 장치로 구현되고, 디스플레이 장치(200)가 TV로 구현되는 경우를 상정하여 설명하도록 한다. 본 개시의 일 실시 예에 따른 전자 장치(100)와 디스플레이 장치(200)는 통신을 수행하고, 디스플레이 장치(200)는 전자 장치(100)로부터 수신된 다양한 유형의 컨텐츠를 디스플레이할 수 있다.
예를 들어, 디스플레이 장치(200)는 전자 장치(100)로부터 컨텐츠 데이터를 수신하고, 수신된 컨텐츠 데이터에 기초하여 컨텐츠를 디스플레이할 수 있다. 다른 예로, 전자 장치(100)와 디스플레이 장치(200)는 무선으로 통신을 수행하고, 디스플레이 장치(200)는 스크린 미러링(screen mirroring)을 통해 전자 장치(100)에 디스플레이되는 화면과 동일한 화면을 자체적으로 구비된 디스플레이를 통해 디스플레이할 수도 있음은 물론이다.
도 1을 참조하면, 전자 장치(100)는 전자 장치(100)에 구비된 카메라를 통해 주변에 대한 라이브 이미지(10)를 획득 및 디스플레이할 수 있다. 전자 장치(100)와 통신을 수행하는 디스플레이 장치(200)는 스크린 미러링 기능을 통해 전자 장치(100)를 통해 디스플레이되는 라이브 이미지(10)를 자체적으로 디스플레이할 수 있다.
일 실시 예에 따른 전자 장치(100)는 텍스트를 포함하는 책, 문서, 신문 등을 촬영한 라이브 이미지(10)를 획득할 수 있고, 획득된 라이브 이미지(10)를 디스플레이 장치(200)로 전송할 수 있다.
여기서, 디스플레이 장치(200)는 전자 장치(100)에 구비된 디스플레이 보다 상대적으로 큰 디스플레이를 구비할 수 있고, 디스플레이 장치(200)는 상대적으로 큰 디스플레이를 통해 전자 장치(100)로부터 수신된 라이브 이미지를 디스플레이할 수 있다.
이하에서는 전자 장치(100)를 통해 획득된 라이브 이미지(10)에서 특정 영역을 확대시키고 디스플레이 장치(200)를 통해 확대된 특정 영역을 디스플레이하는 다양한 실시 예에 대해 설명하도록 한다.
도 2는 본 개시의 일 실시 예에 따른 전자 장치의 구성을 개략적으로 설명하기 위한 도면이다.
도 2를 참조하면, 전자 장치(100)는 카메라로부터 실시간 수신되는 라이브 이미지 내에서 텍스트를 포함하는 텍스트 영역을 식별할 수 있다.
일 예로, 전자 장치(100)는 라이브 이미지(10)에 포함된 적어도 하나의 오브젝트 등에 OCR(Optical Character Recognition)을 수행하여 텍스트를 포함하는 텍스트 영역을 식별할 수 있다. 다만, 이는 일 실시 예로 전자 장치(100)는 다양한 방법으로 라이브 이미지(10) 내에서 텍스트를 포함하는 텍스트 영역을 식별할 수 있다.
예를 들어, 전자 장치(100)는 라이브 이미지(10)를 인공 지능 모델에 입력하여 라이브 이미지(10) 내에서 텍스트를 포함하는 텍스트 영역을 식별할 수 있다. 여기서, 실시 예에 따른 인공 지능 모델은 인공지능 알고리즘 기반으로 복수의 영상에 기초하여 학습된 판단 모델로서, 신경망(Neural Network)을 기반으로 하는 모델일 수 있다. 학습된 판단 모델은 인간의 뇌 구조를 컴퓨터 상에서 모의하도록 설계될 수 있으며 인간의 신경망의 뉴런(neuron)을 모의하는, 가중치를 가지는 복수의 네트워크 노드들을 포함할 수 있다. 복수의 네트워크 노드들은 뉴런이 시냅스(synapse)를 통하여 신호를 주고 받는 뉴런의 시냅틱(synaptic) 활동을 모의하도록 각각 연결 관계를 형성할 수 있다. 또한 학습된 판단 모델은, 일 예로, 기계 학습(Machine Learning) 모델, 신경망 모델, 또는 신경망 모델에서 발전한 딥 러닝(Deep Learning) 모델을 포함할 수 있다. 딥 러닝 모델에서 복수의 네트워크 노드들은 서로 다른 깊이(또는, 레이어)에 위치하면서 컨볼루션(convolution) 연결 관계에 따라 데이터를 주고 받을 수 있다.
일 예로, 인공 지능 모델은 영상에 기초하여 학습된 CNN(Convolution Neural Network, 컨벌루션 신경망) 모델일 수 있다. CNN은 음성처리, 이미지 처리 등을 위해 고안된 특수한 연결구조를 가진 다층신경망이다. 한편, 인공 지능 모델은 CNN에 한정되지 않음은 물론이다. 예를 들어, 인공 지능 모델은 RNN(Recurrent Neural Network), LSTM(Long Short Term Memory Network), GRU(Gated Recurrent Units) 또는 GAN(Generative Adversarial Networks) 중 적어도 하나의 DNN(Deep Neural Network) 모델로 구현될 수 있다.
본 개시의 일 실시 예에 따른 전자 장치(100)는 텍스트를 인식하기 전에, 텍스트를 포함하는 것으로 예측되는 텍스트 영역을 식별할 수 있다. 일 예로, 전자 장치(100)는 라이브 이미지(10)에 OCR(Optical Character Recognition)을 수행하여 텍스트를 포함하는 것으로 예측되는 텍스트 영역을 식별할 수 있다. 다른 예로, 전자 장치(100)는 라이브 이미지(10)를 인공 지능 모델에 입력하여 라이브 이미지(10) 내에서 텍스트를 포함하는 것으로 예측되는 텍스트 영역을 식별할 수도 있음은 물론이다.
도 2를 참조하면, 본 개시의 일 실시 예에 따른 전자 장치(100)는 텍스트 영역이 라이브 이미지(10)의 엣지(edge) 영역에 위치하면, 카메라의 촬영 방향 변경을 가이드하는 UI(20)를 라이브 이미지(10) 상에 디스플레이할 수 있다.
여기서, 엣지 영역은 라이브 이미지 상의 가장자리 영역, 모서리 영역을 의미할 수 있다. 예를 들어, 도 2에 도시된 바와 같이 텍스트 영역(10)이 라이브 이미지(10)의 모서리 영역에 위치하면, 텍스트 영역(10)에 포함된 텍스트의 일부가 전자 장치(100)에 구비된 디스플레이 상에 디스플레이되지 않거나, 텍스트의 일부가 잘라지고 나머지만 디스플레이될 수 있다. 이 경우, 전자 장치(100)가 텍스트 영역(10)에 포함된 텍스트를 오인식할 확률이 증가하며, 사용자에게 해당 텍스트와 관련된 잘못된 정보, 피드백(예를 들어, 시각적 또는 청각적 피드백)을 제공할 우려가 있다.
예를 들어, 도 2에 도시된 바와 같이 전자 장치(100)는 라이브 이미지(10) 내에 포함된 신문 기사 상의 텍스트 ‘Samsung ran more ~’에서 일부가 잘린 것으로 식별되거나 또는 라이브 이미지(10)의 엣지 영역에서 텍스트가 감지되면, 신문 기사 상의 텍스트에 대한 인식율이 낮아질 우려가 있다.
본 개시의 일 실시 예에 따른 전자 장치(100)는 텍스트 영역이 라이브 이미지(10)의 엣지 영역에 위치하는 것으로 식별되면, 카메라의 촬영 방향 변경을 가이드 하는 UI(20)를 디스플레이할 수 있다. 이 경우, 카메라의 촬영 방향이 변경되면, 전자 장치(100)는 실시간으로 카메라를 통해 수신되는 변경된 라이브 이미지(10’)를 디스플레이할 수 있다. 여기서, 변경된 라이브 이미지(10’)는 텍스트 영역이 엣지 영역이 아닌 가운데 영역에 위치하는 이미지일 수 있다. 여기서, 가운데 영역은 텍스트 영역(10)에 포함된 텍스트 전체가 전자 장치(100)에 구비된 디스플레이를 통해 디스플레이되며, 전자 장치(100)의 해당 텍스트에 대한 오인식 확률이 현저하게 낮아지는 영역을 의미할 수 있다.
한편, 도 1에 도시된 바와 같이, 전자 장치(100)와 유선 또는 무선 통신을 수행하는 디스플레이 장치(200)는 전자 장치(100)로부터 수신된 라이브 이미지(10)를 디스플레이 장치(200)에 구비된 디스플레이를 통해 디스플레이할 수 있다.
본 개시의 일 실시 예에 따른 디스플레이 장치(200)는 전자 장치(100)로부터 수신된 촬영 방향 변경을 가이드하는 UI(20)를 포함하는 라이브 이미지를 디스플레이할 수 있다. 한편, 도 2에서는 촬영 방향 변경을 가이드하는 UI(20)가 ‘WARNING: Text on edge detected.’와 같은 텍스트를 포함하는 것으로 상정하여 설명하였으나, 이는 설명의 편의를 위한 것으로 이에 한정되지 않음은 물론이다. 예를 들어, 촬영 방향 변경을 가이드하는 UI(20)는 촬영 방향을 인디케이팅하는 화살표를 포함할 수도 있고, 라이브 이미지(10) 내에서 텍스트 일부가 잘린 상태임을 노티하는 다양한 형태의 오브젝트를 포함할 수 있음은 물론이다.
도 3은 본 개시의 일 실시 예에 따른 전자 장치의 구성을 설명하기 위한 블록도이다.
도 3을 참조하면, 본 개시의 일 실시 예에 따른 전자 장치(100)는 카메라(110), 디스플레이(120), 통신 인터페이스(130) 및 프로세서(140)를 포함할 수 있다.
카메라(110)는 전자 장치(100)의 주변 일 영역을 스캔하여 전기적 신호로 변환하여 프로세서(140)로 전송할 수 있다.
일 실시 예에 따른 카메라(110)는 광학 신호를 전기적 신호로 변환하는 복수의 광 다이오드를 포함할 수 있으며, 복수의 광 다이오드는 2차원으로 배치될 수 있다. 카메라(170)는 복수의 광 다이오드가 2차원으로 배치된 CCD (Charge-Coupled Device) 영상 센서 또는 CMOS (Complementary Metal Oxide Semiconductor) 영상 센서를 포함할 수 있다.
일 실시 예에 따른 카메라(110)는 촬영 방향 예를 들어, 앵글(angle)에 대응되는 주변 일 영역을 스캔하여 획득한 광학 신호를 전기적 신호로 변환하여 실시간으로 프로세서(140)로 전송할 수 있다. 이어서, 프로세서(140)는 카메라(110)로부터 수신된 전기적 신호에 대응되는 라이브 이미지(10)를 디스플레이하도록 디스플레이(120)를 제어할 수 있다.
한편, 도 1 및 도 2에서는 설명의 편의를 위해 카메라(110)가 텍스트 영역을 다수 포함하는 신문 기사 등을 스캔하는 경우를 상정하여 설명하였으나, 이는 일 예시에 불과하며 카메라(110)는 사용자 제어에 따라 카메라(110)의 주변 일 영역을 스캔할 수 있음은 물론이다.
디스플레이(120)는 자발광 소자를 포함하는 디스플레이 또는, 비자발광 소자 및 백라이트를 포함하는 디스플레이로 구현될 수 있다. 예를 들어, LCD(Liquid Crystal Display), OLED(Organic Light Emitting Diodes) 디스플레이, LED(Light Emitting Diodes), 마이크로 LED(micro LED), Mini LED, PDP(Plasma Display Panel), QD(Quantum dot) 디스플레이, QLED(Quantum dot light-emitting diodes) 등과 같은 다양한 형태의 디스플레이로 구현될 수 있다. 디스플레이(120) 내에는 a-si TFT, LTPS(low temperature poly silicon) TFT, OTFT(organic TFT) 등과 같은 형태로 구현될 수 있는 구동 회로, 백라이트 유닛 등도 함께 포함될 수 있다. 한편, 디스플레이(120)는 터치 센서와 결합된 터치 스크린, 플렉시블 디스플레이(flexible display), 롤러블 디스플레이(rollable display), 3차원 디스플레이(3D display), 복수의 디스플레이 모듈이 물리적으로 연결된 디스플레이 등으로 구현될 수 있다. 본 개시의 일 실시 예에 따른 디스플레이(120)는 프로세서(140)의 제어에 따라 다양한 유형의 컨텐츠를 디스플레이할 수 있다. 특히, 디스플레이(120)는 프로세서(140)의 제어에 따라 카메라(110)를 통해 수신된 라이브 이미지(10)를 디스플레이할 수 있다.
본 개시의 일 실시 예에 따른 통신 인터페이스(130)는 다양한 타입의 컨텐츠를 입력받는다. 예를 들어 통신 인터페이스(130)는 AP 기반의 Wi-Fi(와이파이, Wireless LAN 네트워크), 블루투스(Bluetooth), 지그비(Zigbee), 유/무선 LAN(Local Area Network), WAN(Wide Area Network), 이더넷(Ethernet), IEEE 1394, HDMI(High-Definition Multimedia Interface), USB(Universal Serial Bus), MHL(Mobile High-Definition Link), AES/EBU(Audio Engineering Society/ European Broadcasting Union), 옵티컬(Optical), 코액셜(Coaxial) 등과 같은 통신 방식을 통해 외부 장치(예를 들어, 소스 장치), 외부 저장 매체(예를 들어, USB 메모리), 외부 서버(예를 들어 웹 하드) 등으로부터 다양한 유형의 컨텐츠를 입력받을 수 있다. 여기서, 컨텐츠는 영상 신호, 기사, 텍스트 정보, 게시물 등을 포함할 수 있다.
특히, 본 개시의 일 실시 예에 따른 통신 인터페이스(130)는 디스플레이 장치(200)와 통신을 수행할 수 있다. 일 실시 예에 따른 통신 인터페이스(130)는 프로세서(140)의 제어에 따라 디스플레이 장치(200)로 라이브 이미지(10)를 전송할 수 있다. 예를 들어, 전자 장치(100)는 통신 인터페이스(130)를 통해 디스플레이 장치(200)와 미러링(Mirroring)을 수행하고, 전자 장치(100)에 구비된 디스플레이(120)를 통해 디스플레이 되는 라이브 이미지(10)는 디스플레이 장치(200)에도 동일하게 디스플레이될 수 있다.
프로세서(140)는 전자 장치(100)의 전반적인 동작을 제어한다. 여기서, 프로세서(140)는 하나 또는 복수의 프로세서로 구성될 수 있다. 구체적으로, 프로세서(140)는 메모리(130)에 저장된 적어도 하나의 인스트럭션(instruction)을 실행함으로써, 본 개시의 다양한 실시 예에 따른 전자 장치(100)의 동작을 수행할 수 있다.
일 실시 예에 따라 프로세서(140)는 디지털 영상 신호를 처리하는 디지털 시그널 프로세서(digital signal processor(DSP), 마이크로 프로세서(microprocessor), GPU(Graphics Processing Unit), AI(Artificial Intelligence) 프로세서, NPU (Neural Processing Unit), TCON(Time controller)으로 구현될 수 있다. 다만, 이에 한정되는 것은 아니며, 중앙처리장치(central processing unit(CPU)), MCU(Micro Controller Unit), MPU(micro processing unit), 컨트롤러(controller), 어플리케이션 프로세서(application processor(AP)), 또는 커뮤니케이션 프로세서(communication processor(CP)), ARM 프로세서 중 하나 또는 그 이상을 포함하거나, 해당 용어로 정의될 수 있다. 또한, 프로세서(140)는 프로세싱 알고리즘이 내장된 SoC(System on Chip), LSI(large scale integration)로 구현될 수도 있고, ASIC(application specific integrated circuit), FPGA(Field Programmable gate array) 형태로 구현될 수도 있다.
본 개시의 일 실시 예에 따른 프로세서(140)는 도 2에 도시된 바와 같이, 라이브 이미지(10) 내에서 텍스트를 포함하는 텍스트 영역이 라이브 이미지(10)의 엣지 영역에 위치하면, 카메라(110)의 촬영 방향 변경을 가이드하는 UI를 라이브 이미지(10) 상에 디스플레이하도록 디스플레이(120)를 제어할 수 있다.
일 실시 예에 따른 프로세서(140)는 UI를 포함하는 라이브 이미지(10)를 디스플레이 장치(200)로 전송하도록 통신 인터페이스(130)를 제어할 수 있다.
본 개시의 일 실시 예에 따른 프로세서(140)는 라이브 이미지(10)에 포함된 텍스트 영역이 디스플레이의 화면 내에서 임계 비율 이상이 되도록 텍스트 영역을 확대시켜 디스플레이할 수 있다. 이에 대한 구체적인 설명은 도 4 및 도 5를 참조하여 하도록 한다.
도 4는 본 개시의 일 실시 예에 따른 텍스트 영역을 설명하기 위한 도면이다.
도 4를 참조하면, 프로세서(140)는 라이브 이미지(10) 내에서 텍스트 영역을 식별할 수 있다. 예를 들어, 프로세서(140)는 라이브 이미지(10)에 포함된 적어도 하나의 오브젝트에 대해 OCR을 수행하여, 해당 오브젝트가 텍스트를 포함하는지 여부를 식별할 수 있다. 다른 예로, 프로세서(140)는 라이브 이미지(10)를 인공 지능 모델에 입력하여 라이브 이미지(10) 내에 텍스트 영역이 포함되어 있는지 여부, 해당 텍스트 영역의 위치, 텍스트가 엣지 영역에 위치하는지 여부 등에 대한 정보를 획득할 수 있다. 다만, 이는 일 예시로 이에 한정되지 않음은 물론이다. 예를 들어, 프로세서(140)는 이미지 내에서 텍스트 영역을 식별하는 공지의 알고리즘을 이용하여 라이브 이미지(10) 내에서 텍스트 영역을 식별할 수도 있음은 물론이다.
일 실시 예에 따라 프로세서(140)는 라이브 이미지(10) 내에서 텍스트를 포함하는 텍스트 영역을 식별하고, 해당 텍스트 영역이 디스플레이 장치(200)에서 디스플레이 되도록 해당 텍스트 영역에 대한 정보를 디스플레이 장치(200)로 전송할 수 있다. 예를 들어, 프로세서(140)는 라이브 이미지(10)를 디스플레이 장치(200)로 전송하고, 이어서 디스플레이 장치(200)는 수신된 라이브 이미지(10) 내에서 텍스트 영역을 식별하고, 식별된 텍스트 영역을 디스플레이할 수 있다.
다른 예로, 프로세서(140)는 라이브 이미지(10) 내에서 텍스트 영역을 식별하고, 식별된 텍스트 영역에 대응되는 이미지를 디스플레이 장치(200)로 전송할 수 있다. 이어서, 디스플레이 장치(200)는 수신된 이미지를 디스플레이할 수 있다. 여기서, 디스플레이 장치(200)에 구비된 디스플레이는 전자 장치(100)에 구비된 디스플레이(120) 보다 상대적으로 크기가 클 수 있다. 따라서, 디스플레이 장치(200)를 통해 텍스트 영역을 디스플레이한다면, 사용자는 전자 장치(100)에 구비된 디스플레이(120)를 통해서 텍스트를 제공받을 때 보다 디스플레이 장치(200)를 통해 텍스트를 상대적으로 편리하고 용이하게 인식할 수 있는 효과가 있다.
도 5는 본 개시의 일 실시 예에 따른 확대된 텍스트 영역을 설명하기 위한 도면이다.
도 5를 참조하면, 프로세서(140)는 라이브 이미지(10) 내에서 텍스트 영역을 식별하고, 식별된 텍스트 영역을 디스플레이(120)의 화면 내에서 임계 비율 이상이 되도록 확대시켜 디스플레이할 수 있다.
예를 들어, 프로세서(140)는 라이브 이미지(10)에 포함된 적어도 하나의 오브젝트를 분석하여 해당 오브젝트를 텍스트, 그림 또는 사진 등으로 분류할 수 있다. 이어서, 프로세서(140)는 텍스트로 분류된 오브젝트를 포함하는 일 영역을 텍스트 영역으로 식별할 수 있다.
일 실시 예에 따른 프로세서(140)는 텍스트 영역이 화면 내에서 임계 비율 이상이 되도록 텍스트 영역을 확대시켜 디스플레이할 수 있다. 여기서, 임계 비율은 디스플레이(120)의 크기를 의미할 수 있다. 예를 들어, 프로세서(140)는 라이브 이미지(10) 내에서 텍스트 영역만을 디스플레이(120)의 크기에 기초하여 디스플레이(120)의 전체 화면에 대응되도록 확대시켜 디스플레이할 수 있다. 도 5를 참조하면, 프로세서(140)는 라이브 이미지(10)에서 사진, 그림 등을 포함하는 일 영역은 제외하고, 텍스트 영역만을 디스플레이하도록 디스플레이(120)를 제어할 수 있다.
다만, 이는 일 예시로 이에 한정되지 않음은 물론이다. 예를 들어, 프로세서(140)는 라이브 이미지(10) 내에서 특정 오브젝트를 포함하는 일 영역을 식별하고, 해당 일 영역을 확대시켜 디스플레이할 수도 있음은 물론이다. 일 예로, 프로세서(140)는 라이브 이미지(10) 내에서 사진을 포함하는 일 영역을 식별하고, 텍스트 등은 제외하고 사진만을 확대시켜 디스플레이할 수도 있음은 물론이다. 다른 예로, 프로세서(140)는 라이브 이미지(10) 내에서 특정 텍스트(예를 들어, 특정 단어)를 식별하고, 해당 특정 텍스트만을 확대시켜 디스플레이할 수도 있음은 물론이다.
본 개시의 일 실시 예에 따른 임계 비율은 사용자 명령에 따라 설정된 비율일 수 있다. 예를 들어, 프로세서(140)는 사용자 명령에 대응되는 비율로 텍스트 영역을 확대시켜 디스플레이할 수 있다. 일 예로, 사용자 명령에 따라 1배 내지 8배 내에서 특정 비율(또는, 배율)이 선택되면, 프로세서(140)는 선택된 비율(또는, 배율(magnification))에 기초하여 텍스트 영역을 확대시켜 디스플레이할 수 있다. 여기서, 구체적인 숫자는 설명의 편의를 위한 일 예시에 불과하며 선택 가능한 비율의 범위는 다양하게 변경될 수 있음은 물론이다. 예를 들어, 프로세서(140)는 사용자의 핀치(pinch) 터치 입력 또는 스프레드(spread) 터치 입력에 대응되는 비율을 식별하고, 식별된 비율을 임계 비율로 하여 텍스트 영역을 확대시킬 수 있다. 한편, 본 개시의 다양한 실시 예에 따른 비율은 확대 배율의 의미를 포함할 수 있다.
도 6은 본 개시의 일 실시 예에 따른 확대 비율을 설명하기 위한 도면이다.
도 6을 참조하면, 본 개시의 일 실시 예에 따른 프로세서(140)는 확대 비율을 설정하기 위한 UI를 디스플레이하도록 디스플레이를 제어할 수 있다. 본 개시의 일 실시 예에 따른 프로세서(140)는 확대 비율을 설정하기 위한 UI를 통해 1배 내지 4배(예를 들어, 1X 내지 4X) 중 어느 하나의 배율을 선택하기 위한 사용자 명령이 수신되면, 사용자 명령에 대응되는 배율로 텍스트 영역을 확대시킬 수 있다.
이어서, 프로세서(140)는 확대된 텍스트 영역을 포함하는 라이브 이미지(10)를 디스플레이 장치(200)로 전송할 수 있다.
사용자 명령에 따라 확대 비율이 설정되면, 프로세서(140)는 설정된 확대 비율에 기초하여 텍스트 영역을 확대시킬 수 있고, 디스플레이 장치(200)가 전자 장치(100)로부터 수신하여 디스플레이 중인 텍스트 영역도 자동으로 확대될 수 있다. 예를 들어, 디스플레이 장치(200)는 전자 장치(100)와 미러링 통신을 수행하여 텍스트 영역을 디스플레이 중이므로, 전자 장치(100)가 디스플레이 중인 텍스트 영역을 설정된 확대 비율에 따라 확대시키면, 디스플레이 장치(200)가 디스플레이 중인 텍스트 영역도 동시에 확대될 수 있음은 물론이다.
도 3으로 돌아와서, 본 개시의 일 실시 예에 따른 전자 장치(100) 및 디스플레이 장치(200) 각각은 스피커(미도시)를 구비할 수 있다.
여기서, 스피커는 오디오 신호를 출력하는 기능을 한다. 예를 들어, 스피커는 적어도 하나의 스피커 유닛(또는 오디오 앰프(audio amplifier))을 포함할 수 있다.
구체적으로, 스피커는 저음역(woofer) 스피커, 중음역(midrange) 스피커 및 고음역(tweeter) 스피커 중 적어도 하나를 포함할 수 있다. 다만, 이에 한정되는 것은 아니며, 스피커는 복수의 스피커를 이용하여 다양한 음역대의 사운드 신호를 출력할 수 있다.
특히, 본 개시의 일 실시 예에 따른 프로세서(140)는 텍스트 영역에 포함된 텍스트를 식별하고, 식별된 텍스트에 TTS(Text to Speech)를 적용하여 텍스트에 대응되는 음성 정보를 획득하고, 음성 정보에 기초하여 사운드를 출력하도록 스피커를 제어할 수 있다. 이에 대한 구체적인 설명은 도 7을 참조하여 하도록 한다.
도 7은 본 개시의 일 실시 예에 따른 음성 정보를 설명하기 위한 도면이다.
도 7을 참조하면, 본 개시의 일 실시 예에 따른 프로세서(140)는 텍스트 영역에 포함된 텍스트를 식별할 수 있다. 예를 들어, 프로세서(140)는 텍스트 영역에 OCR을 수행하거나, 텍스트 영역을 인공 지능 모델에 입력하여 텍스트 영역에 포함된 텍스트를 식별할 수 있다.
이어서, 프로세서(140)는 TTS 엔진을 이용하여 식별된 텍스트에 대응되는 음성 정보 예를 들어, 사운드 신호를 획득할 수 있다. 이어서, 프로세서(140)는 사운드 신호를 출력하도록 스피커를 제어할 수 있다.
이에 따라, 전자 장치(100)는 사용자에게 라이브 이미지(10) 내에 포함된 텍스트에 대응되는 음성을 제공할 수 있다. 텍스트를 인식하기 어려운 저 시력자 또는 시각 장애인들은 전자 장치(100)가 출력하는 음성을 통해 신문, 책 등 텍스트가 주를 이루는 정보 매체(information media)에 포함된 정보를 습득할 수 있다.
한편, 도 7을 참조하면, 전자 장치(100)가 텍스트에 대응되는 사운드를 출력할 수도 있고, 디스플레이 장치(200)가 텍스트에 대응되는 사운드를 출력할 수도 있다.
예를 들어, 전자 장치(100)는 식별된 텍스트에 TTS를 적용하여 텍스트에 대응되는 음성 정보를 획득하고, 획득된 음성 정보를 디스플레이 장치(200)로 전송할 수 있다. 이어서, 디스플레이 장치(200)는 수신된 음성 정보에 기초하여 디스플레이 장치(200)에 구비된 스피커를 통해 사운드를 출력할 수 있다.
다른 예로, 디스플레이 장치(200)가 텍스트 영역에 포함된 텍스트를 식별하고, 식별된 텍스트에 TTS를 적용하여 텍스트에 대응되는 음성 정보를 획득할 수도 있음은 물론이다. 이 경우, 디스플레이 장치(200)는 자체적으로 TTS 엔진을 이용하여 텍스트에 대응되는 음성 정보를 획득하고, 획득된 음성 정보에 대응되는 사운드를 출력할 수 있다.
도 8은 본 개시의 일 실시 예에 따른 디스플레이 장치를 통해 제공되는 텍스트를 설명하기 위한 도면이다.
도 8을 참조하면, 본 개시의 일 실시 예에 따른 전자 장치(100)는 텍스트 영역에 포함된 텍스트를 식별하고, 식별된 텍스트를 포함하는 정보를 디스플레이 장치(200)로 전송할 수 있다. 일 예로, 전자 장치(100)는 라이브 이미지(10)를 실시간으로 디스플레이 장치(200)로 전송할 수도 있고, 라이브 이미지(10)에 포함된 텍스트 영역에 대응되는 이미지만을 디스플레이 장치(200)로 전송할 수도 있다. 다른 예로, 전자 장치(100)는 텍스트 영역에 포함된 텍스트를 식별하고, 식별된 텍스트를 포함하는 정보를 디스플레이 장치(200)로 전송할 수 있다. 여기서, 텍스트를 포함하는 정보는 텍스트, 텍스트의 폰트(font), 텍스트의 크기 등을 포함할 수 있다.
본 개시의 일 실시 예에 따른 디스플레이 장치(200)는 수신된 텍스트 정보에 기초하여 텍스트를 디스플레이할 수 있다. 이 경우, 디스플레이 장치(200)는 라이브 이미지(10)에 포함된 사진, 그림 등 타 오브젝트는 디스플레이하지 않을 수 있다. 한편, 이는 일 실시 예로 이에 한정되지 않음은 물론이다.
본 개시의 일 실시 예에 따른 디스플레이 장치(200)는 수신된 텍스트 정보에 기초하여 텍스트를 특정 배율로 확대시키고, 확대된 텍스트를 디스플레이할 수 있다.
도 8을 참조하면, 디스플레이 장치(200)는 전자 장치(100)로부터 라이브 이미지(10) 내에 포함된 텍스트에 대한 정보를 수신하고, 수신된 텍스트에 대한 정보에 기초하여 텍스트를 디스플레이할 수 있다. 예를 들어, 디스플레이 장치(200)는 ‘Samsung ran more than ~’을 디스플레이할 수 있다. 여기서, 디스플레이 장치(200)는 텍스트를 특정 배율로 확대시킨 뒤 디스플레이할 수 있다.
도 8은 설명의 편의를 위해 디스플레이 장치(200)가 특정 개수의 문자(예를 들어, 3개의 알파벳)가 디스플레이 장치(200)에 구비된 디스플레이의 전체 화면을 차지하도록 텍스트를 확대시켜 디스플레이하는 경우를 상정하였다. 다만, 이는 일 예시로 이에 한정되지 않음은 물론이다. 예를 들어, 디스플레이 장치(200)는 하나의 문자가 디스플레이 장치(200)에 구비된 디스플레이의 전체 화면을 차지하도록 텍스트를 확대시킬 수도 있다. 저 시력자는 스마트 폰, 사용자 단말 장치와 같은 상대적으로 작은 사이즈의 화면을 가지는 전자 장치(100)를 통해 텍스트를 제공받는 것이 아니라, TV와 같은 상대적으로 큰 사이즈의 화면을 가지는 디스플레이 장치(200)를 통해 텍스트를 제공받을 수 있으므로, 저 시력자도 텍스트를 용이하게 인식할 수 있는 효과가 있다.
도 9는 본 개시의 일 실시 예에 따른 편집 모드를 설명하기 위한 도면이다.
도 9를 참조하면, 본 개시의 일 실시 예에 따른 전자 장치(100)는 식별된 텍스트를 편집하기 위한 편집 모드(edit mode)를 제공할 수 있다.
예를 들어, 사용자 명령에 따라 편집 모드가 실행되면, 프로세서(140)는 텍스트 영역에 포함된 텍스트를 식별하고, 식별된 텍스트를 포함하는 편집 UI를 디스플레이할 수 있다. 여기서, 편집 UI는 새로운 텍스트의 추가, 식별된 텍스트의 수정 또는 삭제, 텍스트의 폰트 변경, 텍스트의 크기 변경 등을 제어하기 위한 복수의 UI를 포함할 수 있다.
본 개시의 일 실시 예에 따라 프로세서(140)는 편집 UI 상에서 텍스트에 대한 편집이 수행되면, 편집된 텍스트를 실시간으로 디스플레이하도록 디스플레이(120)를 제어할 수 있다. 도 9는 설명의 편의를 위해 편집 UI를 통해 ‘NEWS’텍스트(30)를 추가한 경우를 상정한 것이다. 다만, 이는 일 예시로서, 프로세서(140)는 편집 UI에 대한 사용자 명령에 따라 식별된 텍스트 중 일부 텍스트를 삭제 또는 수정할 수도 있음은 물론이다.
한편, 본 개시의 일 실시 예에 따라 프로세서(140)는 편집된 텍스트 예를 들어, 라이브 이미지(10)로부터 식별된 텍스트 외에 사용자 명령에 따라 새롭게 추가된 ‘NEWS’텍스트(30)를 포함하는 디스플레이(120)의 화면 이미지를 디스플레이 장치(200)로 전송하도록 통신 인터페이스(130)를 제어할 수 있다.
일 실시 예에 따라 디스플레이 장치(200)와 전자 장치(100)는 미러링 통신을 수행 중이고, 전자 장치(100)를 통해 텍스트에 대한 편집이 수행되면, 디스플레이 장치(200)는 편집된 텍스트를 포함하는 전자 장치(100)의 화면 이미지를 실시간으로 수신하여 디스플레이할 수 있다.
도 9를 참조하면, 디스플레이 장치(200)는 전자 장치(100)로부터 ‘NEWS’텍스트(30)를 포함하는 디스플레이(120)의 화면 이미지를 수신하여 디스플레이할 수 있다. 도 9는 설명의 편의를 위해 디스플레이 장치(100)가 전자 장치(100)로부터 수신된 화면 이미지를 일정 배율(예를 들어, 사용자 명령에 따라 설정된 배율)로 확대 시킨 뒤 디스플레이하는 경우를 상정하여 도시한 것이다.
도 10은 본 개시의 일 실시 예에 따른 캡쳐된 이미지를 설명하기 위한 도면이다.
도 10을 참조하면, 본 개시의 일 실시 예에 따른 프로세서(140)는 라이브 이미지(10)가 디스플레이 장치(200)로 전송되는 동안, 사용자 명령에 따라 디스플레이된 라이브 이미지(10)가 캡쳐되면, 라이브 이미지(10)의 전송을 중단할 수 있다.
예를 들어, 전자 장치(100)를 파지하고 있는 사용자의 손이 고정되어 있지 않으면, 카메라(110)를 통해 수신된 라이브 이미지(10)가 끊임 없이 변경되므로 사용자 또는 프로세서(140)가 텍스트 등을 인식하기 어려운 문제가 있다.
프로세서(140)는 사용자 명령에 따라 디스플레이된 라이브 이미지(10)를 캡쳐할 수 있다. 이 경우, 프로세서(140)는 디스플레이 장치(200)로 실시간 전송 중인 라이브 이미지(10)의 전송을 중단할 수 있다, 이어서, 프로세서(140)는 캡쳐된 이미지를 디스플레이 장치(200)로 전송하도록 통신 인터페이스(130)를 전송할 수 있다. 여기서, 캡쳐된 이미지는 프리징된(freezing) 이미지, 고정된 이미지 등으로 불릴 수 있으나, 설명의 편의를 위해 캡쳐된 이미지로 통칭하도록 한다.
디스플레이 장치(200)는 전자 장치(100)로부터 수신된 캡쳐된 이미지를 디스플레이할 수 있다. 이 경우, 전자 장치(100)에 구비된 카메라(110)가 전송하는 라이브 이미지(10)가 변경되어도, 전자 장치(100) 및 디스플레이 장치(200)는 캡쳐된 이미지를 디스플레이할 수 있다. 다만, 이는 일 예시이고, 전자 장치(100)는 카메라(110)로부터 전송된 라이브 이미지(10)를 디스플레이하고, 디스플레이 장치(200)는 캡쳐된 이미지를 디스플레이할 수도 있음은 물론이다.
일 실시 예에 따른 디스플레이 장치(200)는 캡쳐된 이미지에 포함된 텍스트를 식별하고, 식별된 텍스트를 임계 비율로 확대시켜 디스플레이할 수 있다.
본 개시의 일 실시 예에 따른 디스플레이 장치(200)는 확대 비율을 설정하기 위한 UI를 디스플레이할 수 있다. 예를 들어, 디스플레이 장치(200)는 확대 비율을 설정하기 위한 UI에 대한 사용자 명령에 따라 설정된 확대 비율에 기초하여 텍스트 영역 또는 식별된 텍스트를 확대시킨 뒤 디스플레이할 수 있다.
또한, 디스플레이 장치(200)는 식별된 텍스트에 TTS를 적용하여 텍스트에 대응되는 음성 정보를 획득할 수도 있다.
도 11은 본 개시의 일 실시 예에 따른 출력 레이아웃을 설명하기 위한 도면이다.
도 11을 참조하면, 본 개시의 일 실시 예에 따른 디스플레이 장치(200)는 전자 장치(100)로부터 수신된 라이브 이미지(10) 내에서 텍스트 영역을 식별하고, 식별된 텍스트 영역에 포함된 텍스트를 식별할 수 있다.
이어서, 디스플레이 장치(200)는 식별된 텍스트에 기초하여 출력 레이아웃을 식별할 수 있다. 일 예로, 디스플레이 장치(200)는 식별된 텍스트의 텍스트 수가 임계 값 이상인지 여부를 식별할 수 있다. 이어서, 디스플레이 장치(200)는 식별된 텍스트의 개수가 임계 값 이상이면, 상대적으로 많은 텍스트를 디스플레이하기에 적합한 출력 레이아웃을 식별할 수 있다.
예를 들어, 디스플레이 장치(200)는 저 시력자가 텍스트를 용이하게 인식하도록 한개 내지 열개의 문자만이 화면에 디스플레이되도록 텍스트를 확대시킬 수 있다. 한편, 텍스트 수가 임계 값 이상이면, 사용자가 모든 텍스트를 인식하기까지 많은 시간이 소요되는 문제가 있다. 일 실시 예에 따른 디스플레이 장치(200)는 화면 내 여백을 최소화하면서 텍스트의 확대 비율을 최대화시키기 위해 화면을 이등분하고 화면의 왼쪽 및 오른쪽 각각에 일정 개수의 텍스트를 확대시켜 디스플레이할 수 있다.
도 11을 참조하면, 출력 레이아웃은 One page layout 또는 Two page layout을 포함할 수 있다. 다만, 이는 일 예시로 이에 한정되지 않음은 물론이다. 예를 들어, 화면을 왼쪽과 오른쪽으로 이등분하는 Two page layout을 포함할 수도 있고, 화면을 상단과 하단으로 이등분하는 Two page layout을 포함할 수도 있음은 물론이다.
다른 예로, 디스플레이 장치(200)는 라이브 이미지(10) 내에서 복수의 텍스트 영역을 식별하면, 출력 레이아웃으로 Two page layout을 식별할 수 있다. 이어서, 제1 텍스트 영역에 포함된 텍스트를 화면 상 왼쪽 레이아웃에 디스플레이하고, 제2 텍스트 영역에 포하된 텍스트를 화면 상 오른쪽 레이아웃에 디스플레이할 수 있다.
도 12는 본 개시의 일 실시 예에 따른 전자 장치의 제어 방법을 설명하기 위한 흐름도이다.
본 개시의 일 실시 예에 따른 전자 장치의 제어 방법은 우선, 카메라를 통해 수신된 라이브 이미지를 디스플레이한다(S1210).
이어서, 라이브 이미지 내에서 텍스트를 포함하는 텍스트 영역이 라이브 이미지의 엣지 영역에 위치하면, 카메라의 촬영 방향 변경을 가이드하는 UI를 라이브 이미지 상에 디스플레이한다(S1220).
이어서, UI를 포함하는 라이브 이미지를 외부 디스플레이 장치로 전송한다(S1230).
본 개시의 일 실시 예에 따른 라이브 이미지를 디스플레이하는 S1210 단계는, 라이브 이미지에 포함된 텍스트 영역이 화면 내에서 임계 비율 이상이 되도록 텍스트 영역을 확대시켜 디스플레이하는 단계를 포함하고, 전송하는 S1230 단계는, 확대된 텍스트 영역을 포함하는 라이브 이미지를 외부 디스플레이 장치로 전송하는 단계를 포함할 수 있다.
일 실시 예에 따른 제어 방법은, 확대 비율을 설정하기 위한 UI를 디스플레이하는 단계를 더 포함하고, 라이브 이미지를 디스플레이하는 S1210 단계는, 확대 비율을 설정하기 위한 UI를 통해 설정된 확대 비율에 기초하여 텍스트 영역을 확대시켜 디스플레이하는 단계를 포함할 수 있다.
본 개시의 일 실시 예에 따른 제어 방법은, 텍스트 영역에 포함된 텍스트를 식별하는 단계, 식별된 텍스트에 TTS(Text to Speech)를 적용하여 텍스트에 대응되는 음성 정보를 획득하는 단계 및 음성 정보에 기초하여 사운드를 출력하는 단계를 더 포함할 수 있다.
본 개시의 일 실시 예에 따른 제어 방법은, 획득된 음성 정보를 외부 디스플레이 장치로 전송하는 단계를 더 포함할 수 있다.
본 개시의 일 실시 예에 따른 제어 방법은, 사용자 명령에 따라 편집(edit) 모드가 실행되면, 텍스트 영역에 포함된 텍스트를 식별하여 식별된 텍스트를 포함하는 편집 UI를 디스플레이하는 단계, 편집 UI 상에서 텍스트에 대한 편집이 수행되면, 편집된 텍스트를 디스플레이하는 단계 및 편집된 텍스트를 포함하는 디스플레이의 화면 이미지를 외부 디스플레이 장치로 전송하는 단계를 더 포함할 수 있다.
본 개시의 일 실시 예에 따른 전송하는 S1230 단계는, 라이브 이미지가 외부 디스플레이 장치로 전송되는 동안, 사용자 명령에 따라 디스플레이된 라이브 이미지가 캡쳐되면, 라이브 이미지의 전송을 중단하고, 캡쳐된 이미지를 외부 디스플레이 장치로 전송하는 단계를 포함할 수 있다.
다만, 본 개시의 다양한 실시 예들은 전자 장치 뿐 아니라, 디스플레이를 구비하는 모든 유형의 전자 장치에 적용될 수 있음은 물론이다.
한편, 이상에서 설명된 다양한 실시 예들은 소프트웨어(software), 하드웨어(hardware) 또는 이들의 조합을 이용하여 컴퓨터(computer) 또는 이와 유사한 장치로 읽을 수 있는 기록 매체 내에서 구현될 수 있다. 일부 경우에 있어 본 명세서에서 설명되는 실시 예들이 프로세서 자체로 구현될 수 있다. 소프트웨어적인 구현에 의하면, 본 명세서에서 설명되는 절차 및 기능과 같은 실시 예들은 별도의 소프트웨어 모듈들로 구현될 수 있다. 소프트웨어 모듈들 각각은 본 명세서에서 설명되는 하나 이상의 기능 및 동작을 수행할 수 있다.
한편, 상술한 본 개시의 다양한 실시 예들에 따른 전자 장치(100)의 프로세싱 동작을 수행하기 위한 컴퓨터 명령어(computer instructions)는 비일시적 컴퓨터 판독 가능 매체(non-transitory computer-readable medium) 에 저장될 수 있다. 이러한 비일시적 컴퓨터 판독 가능 매체에 저장된 컴퓨터 명령어는 특정 기기의 프로세서에 의해 실행되었을 때 상술한 다양한 실시 예에 따른 전자 장치(100)에서의 처리 동작을 특정 기기가 수행하도록 한다.
비일시적 컴퓨터 판독 가능 매체란 레지스터, 캐쉬, 메모리 등과 같이 짧은 순간 동안 데이터를 저장하는 매체가 아니라 반영구적으로 데이터를 저장하며, 기기에 의해 판독(reading)이 가능한 매체를 의미한다. 비일시적 컴퓨터 판독 가능 매체의 구체적인 예로는, CD, DVD, 하드 디스크, 블루레이 디스크, USB, 메모리카드, ROM 등이 있을 수 있다.
이상에서는 본 개시의 바람직한 실시 예에 대하여 도시하고 설명하였지만, 본 개시는 상술한 특정의 실시 예에 한정되지 아니하며, 청구범위에서 청구하는 본 개시의 요지를 벗어남이 없이 당해 개시에 속하는 기술분야에서 통상의 지식을 가진자에 의해 다양한 변형실시가 가능한 것은 물론이고, 이러한 변형실시들은 본 개시의 기술적 사상이나 전망으로부터 개별적으로 이해되어져서는 안될 것이다.

Claims (15)

  1. 카메라;
    디스플레이;
    회로를 포함하는 통신 인터페이스; 및
    상기 카메라를 통해 수신된 라이브 이미지를 디스플레이하도록 상기 디스플레이를 제어하고,
    상기 디스플레이된 라이브 이미지를 외부 디스플레이 장치로 전송하도록 상기 통신 인터페이스를 제어하는 프로세서;를 포함하고,
    상기 프로세서는,
    상기 라이브 이미지 내에서 텍스트를 포함하는 텍스트 영역이 상기 라이브 이미지의 엣지 영역에 위치하면, 상기 카메라의 촬영 방향 변경을 가이드하는 UI를 상기 라이브 이미지 상에 디스플레이하도록 상기 디스플레이를 제어하고,
    상기 UI를 포함하는 상기 라이브 이미지를 상기 외부 디스플레이 장치로 전송하도록 상기 통신 인터페이스를 제어하는, 전자 장치.
  2. 제1항에 있어서,
    상기 프로세서는,
    상기 라이브 이미지에 포함된 상기 텍스트 영역이 상기 디스플레이의 화면 내에서 임계 비율 이상이 되도록 상기 텍스트 영역을 확대시켜 디스플레이하도록 상기 디스플레이를 제어하고,
    상기 확대된 텍스트 영역을 포함하는 상기 라이브 이미지를 상기 외부 디스플레이 장치로 전송하도록 상기 통신 인터페이스를 제어하는, 전자 장치.
  3. 제1항에 있어서,
    상기 프로세서는,
    확대 비율을 설정하기 위한 UI를 디스플레이하도록 상기 디스플레이를 제어하고,
    상기 확대 비율을 설정하기 위한 UI를 통해 설정된 확대 비율에 기초하여 상기 텍스트 영역을 확대시켜 디스플레이하도록 상기 디스플레이를 제어하는, 전자 장치.
  4. 제1항에 있어서,
    스피커;를 더 포함하고,
    상기 프로세서는,
    상기 텍스트 영역에 포함된 상기 텍스트를 식별하고, 상기 식별된 텍스트에 TTS(Text to Speech)를 적용하여 상기 텍스트에 대응되는 음성 정보를 획득하고, 상기 음성 정보에 기초하여 사운드를 출력하도록 상기 스피커를 제어하는, 전자 장치.
  5. 제4항에 있어서,
    상기 프로세서는,
    상기 획득된 음성 정보를 상기 외부 디스플레이 장치로 전송하도록 상기 통신 인터페이스를 제어하는, 전자 장치.
  6. 제1항에 있어서,
    상기 프로세서는,
    상기 텍스트 영역에 포함된 상기 텍스트를 식별하고,
    상기 식별된 텍스트를 포함하는 정보를 상기 외부 디스플레이 장치로 전송하도록 상기 통신 인터페이스를 제어하는, 전자 장치.
  7. 제1항에 있어서,
    상기 프로세서는,
    사용자 명령에 따라 편집(edit) 모드가 실행되면, 상기 텍스트 영역에 포함된 상기 텍스트를 식별하여 상기 식별된 텍스트를 포함하는 편집 UI를 디스플레이하도록 상기 디스플레이를 제어하고,
    상기 편집 UI 상에서 상기 텍스트에 대한 편집이 수행되면, 상기 편집된 텍스트를 디스플레이하도록 상기 디스플레이를 제어하고,
    상기 편집된 텍스트를 포함하는 상기 디스플레이의 화면 이미지를 상기 외부 디스플레이 장치로 전송하도록 상기 통신 인터페이스를 제어하는, 전자 장치.
  8. 제1항에 있어서,
    상기 프로세서는,
    상기 라이브 이미지가 상기 외부 디스플레이 장치로 전송되는 동안, 사용자 명령에 따라 상기 디스플레이된 라이브 이미지가 캡쳐되면, 상기 라이브 이미지의 전송을 중단하고, 상기 캡쳐된 이미지를 상기 외부 디스플레이 장치로 전송하도록 상기 통신 인터페이스를 제어하는, 전자 장치.
  9. 제1항에 있어서,
    상기 외부 디스플레이 장치는,
    상기 디스플레이의 화면보다 큰 사이즈의 화면을 가지는 디스플레이를 구비하는 장치인, 전자 장치.
  10. 전자 장치 및 디스플레이 장치를 포함하는 시스템에 있어서,
    카메라를 통해 수신된 수신된 라이브 이미지 내에서 텍스트를 포함하는 텍스트 영역이 상기 라이브 이미지의 엣지 영역에 위치하면, 상기 카메라의 촬영 방향 변경을 가이드하는 UI를 포함하는 상기 라이브 이미지를 디스플레이하고, 상기 UI를 포함하는 상기 라이브 이미지를 상기 디스플레이 장치로 전송하는 전자 장치; 및
    상기 전자 장치로부터 수신된 상기 UI를 포함하는 라이브 이미지를 디스플레이하는 디스플레이 장치;를 포함하는, 시스템.
  11. 제10항에 있어서,
    상기 디스플레이 장치는,
    상기 라이브 이미지에 포함된 상기 텍스트 영역이 상기 디스플레이 장치의 화면 내에서 임계 비율 이상이 되도록 상기 텍스트 영역을 확대시켜 디스플레이하는, 시스템.
  12. 제10항에 있어서,
    상기 디스플레이 장치는,
    확대 비율을 설정하기 위한 UI를 디스플레이하고,
    상기 확대 비율을 설정하기 위한 UI를 통해 설정된 확대 비율에 기초하여 상기 텍스트 영역을 확대시켜 디스플레이하는, 시스템.
  13. 제10항에 있어서,
    상기 디스플레이 장치는,
    상기 텍스트 영역에 포함된 상기 텍스트가 식별되면, 상기 식별된 텍스트에 기초하여 출력 레이아웃을 식별하고,
    상기 식별된 출력 레이아웃에 따라 상기 텍스트를 디스플레이하는, 시스템.
  14. 전자 장치의 제어 방법에 있어서,
    카메라를 통해 수신된 라이브 이미지를 디스플레이하는 단계;
    상기 라이브 이미지 내에서 텍스트를 포함하는 텍스트 영역이 상기 라이브 이미지의 엣지 영역에 위치하면, 상기 카메라의 촬영 방향 변경을 가이드하는 UI를 상기 라이브 이미지 상에 디스플레이하는 단계; 및
    상기 UI를 포함하는 상기 라이브 이미지를 외부 디스플레이 장치로 전송하는 단계;를 포함하는 제어 방법.
  15. 제14항에 있어서,
    상기 라이브 이미지를 디스플레이하는 단계는,
    상기 라이브 이미지에 포함된 상기 텍스트 영역이 화면 내에서 임계 비율 이상이 되도록 상기 텍스트 영역을 확대시켜 디스플레이하는 단계;를 포함하고,
    상기 전송하는 단계는,
    상기 확대된 텍스트 영역을 포함하는 상기 라이브 이미지를 상기 외부 디스플레이 장치로 전송하는 단계;를 포함하는, 제어 방법.
PCT/KR2021/002367 2020-05-15 2021-02-25 전자 장치, 시스템 및 그 제어 방법 WO2021230474A1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2020-0058608 2020-05-15
KR1020200058608A KR20210141222A (ko) 2020-05-15 2020-05-15 전자 장치, 시스템 및 그 제어 방법

Publications (1)

Publication Number Publication Date
WO2021230474A1 true WO2021230474A1 (ko) 2021-11-18

Family

ID=78524828

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2021/002367 WO2021230474A1 (ko) 2020-05-15 2021-02-25 전자 장치, 시스템 및 그 제어 방법

Country Status (2)

Country Link
KR (1) KR20210141222A (ko)
WO (1) WO2021230474A1 (ko)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110123115A1 (en) * 2009-11-25 2011-05-26 Google Inc. On-Screen Guideline-Based Selective Text Recognition
KR20130050608A (ko) * 2011-11-08 2013-05-16 삼성전자주식회사 휴대단말기의 이미지 표현장치 및 방법
US20160078291A1 (en) * 2014-09-02 2016-03-17 Samsung Electronics Co., Ltd. Image data processing method and electronic device supporting the same
KR20180037923A (ko) * 2015-08-06 2018-04-13 엘지전자 주식회사 이동단말기 및 그 제어방법
KR20190021066A (ko) * 2017-08-22 2019-03-05 삼성전자주식회사 전자 장치 및 그의 문자 인식 방법

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110123115A1 (en) * 2009-11-25 2011-05-26 Google Inc. On-Screen Guideline-Based Selective Text Recognition
KR20130050608A (ko) * 2011-11-08 2013-05-16 삼성전자주식회사 휴대단말기의 이미지 표현장치 및 방법
US20160078291A1 (en) * 2014-09-02 2016-03-17 Samsung Electronics Co., Ltd. Image data processing method and electronic device supporting the same
KR20180037923A (ko) * 2015-08-06 2018-04-13 엘지전자 주식회사 이동단말기 및 그 제어방법
KR20190021066A (ko) * 2017-08-22 2019-03-05 삼성전자주식회사 전자 장치 및 그의 문자 인식 방법

Also Published As

Publication number Publication date
KR20210141222A (ko) 2021-11-23

Similar Documents

Publication Publication Date Title
WO2018128472A1 (en) Virtual reality experience sharing
WO2021101087A1 (en) Electronic apparatus and controlling method thereof
WO2018124633A1 (ko) 전자 장치 및 그의 메시지 전달 방법
WO2018155824A1 (en) Display apparatus and control method thereof
WO2015012495A1 (en) User terminal device and the control method thereof
WO2021101134A1 (en) Electronic apparatus and control method thereof
WO2017047913A1 (en) Display device, controlling method thereof and computer-readable recording medium
WO2020017890A1 (en) System and method for 3d association of detected objects
WO2021071155A1 (en) Electronic apparatus and control method thereof
EP3659329A1 (en) Electronic device and control method thereof
WO2022014790A1 (en) Guided backpropagation-gradient updating for image processing task using redundant information from image
WO2014088125A1 (ko) 영상 촬영 장치 및 그 방법
WO2022131488A1 (ko) 전자 장치 및 그 제어 방법
WO2019151689A1 (ko) 전자 장치 및 이의 제어 방법
WO2021137507A1 (en) Display apparatus and controlling method thereof
WO2021049730A1 (ko) 영상 인식 모델을 학습하는 전자 장치 및 그 동작 방법
WO2018080204A1 (ko) 영상처리장치, 영상처리방법 및 컴퓨터 판독가능 기록 매체
WO2019004754A1 (en) ADVERTISEMENTS WITH INCREASED REALITY ON OBJECTS
WO2021230474A1 (ko) 전자 장치, 시스템 및 그 제어 방법
WO2022092487A1 (ko) 전자 장치 및 그 제어 방법
WO2022108008A1 (en) Electronic apparatus and controlling method thereof
WO2021256702A1 (ko) 전자 장치 및 이의 제어 방법
WO2021261619A1 (ko) 영상에서 평면을 검출하는 전자 장치 및 그 동작 방법
WO2020226264A1 (ko) 영상에 기초하여 위치 정보를 획득하는 전자 장치 및 그 동작 방법
WO2022086028A1 (ko) 전자 장치 및 이의 제어 방법

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 21803318

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 21803318

Country of ref document: EP

Kind code of ref document: A1