WO2018080204A1 - 영상처리장치, 영상처리방법 및 컴퓨터 판독가능 기록 매체 - Google Patents

영상처리장치, 영상처리방법 및 컴퓨터 판독가능 기록 매체 Download PDF

Info

Publication number
WO2018080204A1
WO2018080204A1 PCT/KR2017/011932 KR2017011932W WO2018080204A1 WO 2018080204 A1 WO2018080204 A1 WO 2018080204A1 KR 2017011932 W KR2017011932 W KR 2017011932W WO 2018080204 A1 WO2018080204 A1 WO 2018080204A1
Authority
WO
WIPO (PCT)
Prior art keywords
image
input
image processing
processing apparatus
input image
Prior art date
Application number
PCT/KR2017/011932
Other languages
English (en)
French (fr)
Inventor
안일준
남우현
조기흠
박용섭
이태미
천민수
Original Assignee
삼성전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자 주식회사 filed Critical 삼성전자 주식회사
Priority to EP17866051.0A priority Critical patent/EP3511899A1/en
Priority to US16/345,616 priority patent/US11257186B2/en
Priority to CN201780066614.1A priority patent/CN109891459B/zh
Publication of WO2018080204A1 publication Critical patent/WO2018080204A1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4007Scaling of whole images or parts thereof, e.g. expanding or contracting based on interpolation, e.g. bilinear interpolation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4053Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4053Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution
    • G06T3/4069Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution by subpixel displacements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/50Image enhancement or restoration using two or more images, e.g. averaging or subtraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20172Image enhancement details
    • G06T2207/20182Noise reduction or smoothing in the temporal domain; Spatio-temporal filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20212Image combination
    • G06T2207/20221Image fusion; Image merging

Definitions

  • the present disclosure relates to an image processing apparatus, an image processing method, and a computer readable recording medium, and more particularly, to an image processing apparatus, an image processing method, and a computer readable recording medium for generating a high quality image.
  • AI Artificial Intelligence
  • AI technology is composed of elementary technologies that utilize machine learning (deep learning) and machine learning.
  • Machine learning is an algorithm technology that classifies / learns characteristics of input data by itself
  • element technology is a technology that simulates the functions of human brain cognition and judgment by using machine learning algorithms such as deep learning. It consists of technical areas such as understanding, reasoning / prediction, knowledge representation, and motion control.
  • Linguistic understanding is a technology for recognizing and applying / processing human language / characters and includes natural language processing, machine translation, dialogue system, question and answer, speech recognition / synthesis, and the like.
  • Visual understanding is a technology that recognizes and processes objects as human vision, and includes object recognition, object tracking, image retrieval, person recognition, scene understanding, spatial understanding, and image enhancement.
  • Inference Prediction is a technique for judging, logically inferring, and predicting information. It includes knowledge / probability-based inference, optimization prediction, preference-based planning, and recommendation.
  • Knowledge expression is a technology that automatically processes human experience information into knowledge data, and includes knowledge construction (data generation / classification) and knowledge management (data utilization).
  • Motion control is a technology for controlling autonomous driving of a vehicle and movement of a robot, and includes motion control (navigation, collision, driving), operation control (action control), and the like.
  • VDSR very deep convolutional networks
  • the present disclosure is in accordance with the above-described needs, an object of the present disclosure, an image processing apparatus, an image processing method, and a computer-readable recording medium capable of generating a high quality image by using an input low quality image without using an external database. In providing.
  • An image processing apparatus may include an input unit for receiving an image, extracting a visual feature by reducing the input image, and generating a high quality image by reflecting the extracted visual feature in the input image. It includes a processor.
  • the processor may reduce the input image using a preset scale factor.
  • the processor may perform preprocessing to improve the image quality of the input image, and generate the high quality image by reflecting the visual feature extracted by reducing the preprocessed image to the preprocessed image.
  • the storage unit may further include a storage unit configured to store a plurality of scale factors corresponding to a plurality of deterioration degrees of the image, and the processor may be configured based on an image quality improvement rate of the preprocessed image measured in comparison with the input image.
  • the deterioration degree of the input image may be determined, and the input image may be reduced by using a scale factor corresponding to the determined deterioration degree among the plurality of stored scale factors.
  • the processor may arrange a plurality of the reduced images to correspond to the size of the input image, and extract a visual feature from the arranged images.
  • the processor may generate a high quality image by reflecting the extracted visual feature only on a portion of the input image.
  • the frequency of the image signal may be greater than or equal to a predetermined value in the partial region.
  • the display apparatus may further include a display unit displaying the generated high quality image.
  • the apparatus may further include a communication unit configured to transmit the generated high quality image to a display device.
  • the image processing method the step of receiving an image, the step of reducing the input image, extracting a visual feature from the reduced image and the extracted image Generating a high quality image by reflecting a visual characteristic.
  • the input image may be reduced by using a preset scale factor.
  • the method may further include performing a preprocessing to improve the image quality of the input image, and the reducing may reduce the preprocessed image.
  • the method may further include storing a plurality of scale factors corresponding to a plurality of deterioration degrees of the image, and the reducing may be performed based on an image quality improvement rate of the image quality-enhanced image measured compared to the input image.
  • the deterioration degree of the input image may be determined based on the size of the input image, and the input image may be reduced using a scale factor corresponding to the determined deterioration degree among the plurality of stored scale factors.
  • the extracting may include arranging a plurality of the reduced images to correspond to the size of the input image and extracting a visual feature from the arranged images.
  • the generating may include generating a high quality image by reflecting the extracted visual feature only in a partial region of the input image.
  • the frequency of the image signal may be greater than or equal to a predetermined value in the partial region.
  • the method may further include displaying the generated high quality image.
  • the method may further include transmitting the generated high quality image to a display device.
  • the image processing method includes: receiving an image, reducing the input image, Extracting a visual feature from the reduced image and generating a high-quality image by reflecting the extracted visual feature to the input image.
  • FIG. 1 is a block diagram illustrating a brief configuration of an image processing apparatus according to an embodiment of the present disclosure
  • FIG. 2 is a block diagram illustrating a detailed configuration of an image processing apparatus according to an embodiment of the present disclosure
  • FIG. 3 is a flowchart schematically illustrating an image processing method according to an exemplary embodiment of the present disclosure
  • FIG. 4 is a flowchart illustrating a method of determining a scale factor according to an embodiment of the present disclosure
  • FIG. 5 is a flowchart illustrating a method of determining a scale factor according to another embodiment of the present disclosure
  • FIG. 6 is a view for explaining an image in which regions are classified according to an embodiment of the present disclosure.
  • FIG. 7 is a flowchart illustrating an image processing method of the drawing illustrated in FIG. 6.
  • Embodiments of the present disclosure may be variously modified and have various embodiments, and specific embodiments will be illustrated in the drawings and described in detail in the written description. However, this is not intended to limit the scope to the specific embodiment, it should be understood to include all transformations, equivalents, and substitutes included in the spirit and technical scope of the invention. In describing the embodiments, when it is determined that the detailed description of the related known technology may obscure the gist, the detailed description thereof will be omitted.
  • first and second may be used to describe various components, but the components should not be limited by the terms. The terms are only used to distinguish one component from another.
  • the 'module' or 'unit' performs at least one function or operation, and may be implemented in hardware or software or in a combination of hardware and software.
  • a plurality of 'modules' or a plurality of 'units' may be integrated into at least one module except for 'modules' or 'units' that need to be implemented by specific hardware, and may be implemented as at least one processor.
  • FIG. 1 is a block diagram illustrating a brief configuration of an image processing apparatus according to an exemplary embodiment.
  • the image processing apparatus 100 includes an input unit 110 and a processor 120.
  • the image processing apparatus 100 may be implemented in the form of a set-top box and a server for processing the input image and transmitting it to a separate display device.
  • the present invention is not limited thereto, and may be a display device such as a TV, a PC, a mobile device, and the like having a display unit that can be displayed on the device itself.
  • the input unit 110 may receive a low quality image.
  • the input unit 110 may receive an image to be wired or wirelessly received from the outside or an image to be processed by a user's selection among a plurality of stored images.
  • the input unit 110 may receive an image through an antenna or a cable, or may receive an image selected by a user from a storage unit (not shown).
  • the processor 120 may generate a high quality image by up-scaling an image input by the input unit 110.
  • the processor 120 may extract the visual features of the reduced image by reducing the input low quality image, and generate a high quality image by reflecting the visual features extracted in the input low quality image.
  • upscaling means to correct an enlarged pixel in order to realize a high quality image in a low quality image, and when the screen size is the same, a clearer and clearer image can be obtained than the original screen. It is possible to obtain an image with no deterioration in image quality.
  • the visual feature is a feature that can be recognized when the user sees the image visually, as well as the attributes of the image such as brightness, color, contrast, saturation, and contrast of the image, as well as the frequency form of the image signal of each region in the image, It may include a texture feature representing a texture felt from the shape and density of the edges included in the image, the arrangement of colors, and the like.
  • a high quality image may be generated using a visual feature extracted by reducing a low quality image without an external database, thereby reducing the memory used.
  • the image quality of the texture region which is composed of the existing high frequency region and has a slight upscaling effect, is also improved.
  • the processor 120 may reduce the input image by using a preset scale factor.
  • the scale factor is a factor that determines the degree of reduction of the input image and may be between 0 and 1.
  • the preset scale factor may be a value determined through machine learning in advance. For example, when there is a high quality original image, the processor 120 may determine the scale factor such that the image obtained by processing the original image and the low quality image of the original image is most similar. In this case, the processor 120 may determine the scale factor for processing the low quality image to be most similar to the original image by performing the same operation on the plurality of original images. A detailed method of determining the scale factor using the similarity will be described in detail with reference to FIG. 4.
  • the processor 120 may determine the scale factor according to the degree of deterioration of the low quality image.
  • the image processing apparatus 100 may previously store a plurality of scale factor information corresponding to a plurality of deterioration degrees of an image, and in this case, the plurality of scale factor information may be stored in the form of a lookup table.
  • the scale factor determination method according to the degree of deterioration of the image will be described in detail with reference to FIG.
  • the processor 120 may improve the image quality of the input image before reducing the input image.
  • the processor 120 may perform image processing for improving image quality according to an embodiment of the present disclosure after first improving the image quality of the image according to an algorithm that has been used to improve the existing image quality.
  • the processor 120 may extract the visual feature from the reduced image itself, but is not limited thereto.
  • the processor 120 may extract the visual feature from an image in which a plurality of the reduced images are arranged to correspond to the size of the input image. .
  • the processor 120 arranges the reduced image in 2 ⁇ 2 so as to correspond to the size of the input image, and then displays visual features in the arranged image. Can be extracted.
  • the visual feature of the corresponding pixel may be reflected without additional scaling step, thereby reducing an error generated.
  • the processor 120 may generate a high quality image by reflecting the visual feature extracted from the reduced image to the input image.
  • the processor 120 may divide the input image into a plurality of areas having a size corresponding to the reduced image, and generate a high quality image by applying the extracted visual feature to each divided area.
  • the processor 120 may repeatedly apply the extracted visual feature to the input image to generate a high quality image.
  • the processor 120 may generate a high quality image by reflecting the extracted visual feature only on a part of the input image. This will be described in detail with reference to FIGS. 6 and 7.
  • FIG. 2 is a block diagram illustrating a detailed configuration of an image processing apparatus according to an exemplary embodiment.
  • the image processing apparatus 100 includes an input unit 110, a processor 120, a storage unit 130, a display unit 140, a communication unit 150, a video processor 160, and an audio processor 170. ), A button 126, a microphone 180, an imaging unit 185, and an audio output unit 190.
  • the input unit 110 and the processor 120 are the same as the configuration shown in FIG. 1, and thus redundant descriptions are omitted.
  • the storage unit 130 may store various programs and data necessary for the operation of the image processing apparatus 100.
  • the storage unit 130 may store a scale factor for reducing the input image.
  • the stored scale factor is calculated by the manufacturer through machine learning, and may be pre-stored at the time of shipment or updated through periodic firmware upgrades.
  • the storage unit 130 may store an algorithm for deriving a scale factor.
  • the storage unit 130 may store a plurality of low quality images to be upscaled to a high quality image.
  • the processor 120 may generate a high quality image of the low quality image selected by the user among a plurality of stored low quality images.
  • the storage unit 130 may store information on a scale factor corresponding to the degree of deterioration of the image.
  • the scale factor according to the degree of deterioration may be stored in the form of a lookup table.
  • the storage unit 130 may store a program and data for upscaling the low quality image.
  • the processor 120 may generate a high quality image from the low quality image input by using the program and data stored in the storage 130, and may determine the scale factor used in the upscaling process in some cases.
  • the display unit 140 may display the generated high quality image.
  • the display unit 140 may be implemented as various types of displays such as a liquid crystal display (LCD), an organic light emitting diodes (OLED) display, a plasma display panel (PDP), and the like.
  • the display unit 140 may also include a driving circuit, a backlight unit, and the like, which may be implemented in the form of an a-si TFT, a low temperature poly silicon (LTPS) TFT, an organic TFT (OTFT), or the like.
  • the display 140 may be implemented as a flexible display.
  • the display 140 may include a touch sensor for detecting a user's touch gesture.
  • the touch sensor may be implemented as various types of sensors such as capacitive, pressure sensitive, and piezoelectric.
  • the electrostatic type is a method of calculating touch coordinates by detecting fine electricity excited by the user's human body when a part of the user's body is touched on the surface of the display unit 140 by using a dielectric coated on the surface of the display unit.
  • the pressure-sensitive type includes two electrode plates embedded in the display unit 140, and when the user touches the screen, the touch plate calculates touch coordinates by detecting that the upper and lower plates of the touched point are in contact with current.
  • the display 140 may detect a user gesture using an input means such as a pen in addition to the user's finger.
  • the input means is a stylus pen including a coil therein
  • the image processing apparatus 100 may include a magnetic field sensing sensor capable of detecting a magnetic field changed by a coil inside the stylus pen. Accordingly, not only a touch gesture but also a proximity gesture, that is, hovering can be detected.
  • the display function and the gesture detection function have been described above in the same configuration, but may be performed in different configurations.
  • the display 140 may not be provided in the image processing apparatus 100.
  • the communication unit 150 is configured to communicate with various types of external devices according to various types of communication methods.
  • the communicator 150 includes a Wi-Fi chip 151, a Bluetooth chip 152, a wireless communication chip 153, and an NFC chip 154.
  • the processor 120 communicates with various external devices using the communication unit 150.
  • the communication unit 150 may receive a low quality image from an external device and transmit the high quality image generated by the processor 120 to an external device such as a separate display device.
  • the Wi-Fi chip 151 and the Bluetooth chip 152 communicate with each other by WiFi and Bluetooth.
  • various connection information such as SSID and session key may be transmitted and received first, and then various communication information may be transmitted and received using the same.
  • the wireless communication chip 153 refers to a chip that performs communication according to various communication standards such as IEEE, Zigbee, 3rd Generation (3G), 3rd Generation Partnership Project (3GPP), Long Term Evoloution (LTE), and the like.
  • the NFC chip 154 refers to a chip operating in a near field communication (NFC) method using a 13.56 MHz band among various RF-ID frequency bands such as 135 kHz, 13.56 MHz, 433 MHz, 860-960 MHz, 2.45 GHz, and the like.
  • NFC near field communication
  • the processor 120 may include a RAM 121, a ROM 122, a CPU 123, a graphic processing unit (GPU) 124, and a bus 125.
  • the RAM 121, the ROM 122, the CPU 123, the graphics processing unit (GPU) 124, and the like may be connected to each other through the bus 125.
  • the CPU 123 accesses the storage 130 and performs booting using the operating system stored in the storage 130.
  • the controller 130 performs various operations using various programs, contents, data, and the like stored in the storage 130.
  • the ROM 122 stores a command set for system booting.
  • the CPU 123 copies the O / S stored in the storage 140 to the RAM 121 and executes O / S according to the command stored in the ROM 122.
  • the CPU 123 copies various programs stored in the storage 140 to the RAM 121 and executes the programs copied to the RAM 121 to perform various operations.
  • the GPU 124 displays a UI on the display unit 140.
  • the GPU 124 may generate a screen including various objects such as an icon, an image, and a text using a calculator (not shown) and a renderer (not shown).
  • the calculator calculates attribute values such as coordinates, shapes, sizes, and colors for displaying the objects according to the layout of the screen.
  • the renderer generates screens of various layouts including objects based on the attribute values calculated by the calculator.
  • the screen (or user interface window) generated by the rendering unit is provided to the display unit 140 and displayed on the main display area and the sub display area, respectively.
  • the video processor 160 is a component for processing video data included in content received through the communication unit 150 or content stored in the storage unit 130.
  • the video processor 160 may perform various image processing such as decoding, scaling, noise filtering, frame rate conversion, resolution conversion, and the like on the video data.
  • the audio processor 170 is a component for processing audio data included in content received through the communication unit 150 or content stored in the storage unit 130.
  • the audio processor 170 may perform various processing such as decoding, amplification, noise filtering, and the like on the audio data.
  • the processor 120 may drive the video processor 160 and the audio processor 170 to play the corresponding content.
  • the display 140 may display the image frame generated by the video processor 160 in at least one of the main display area and the sub display area.
  • the audio output unit 190 outputs audio data generated by the audio processor 170.
  • the button 126 may be various types of buttons such as a mechanical button, a touch pad, a wheel, and the like formed in an arbitrary area such as a front part, a side part, a back part, etc. of the main body of the image processing apparatus 100.
  • the microphone unit 180 is a component for receiving a user voice or other sound and converting the same into audio data.
  • the processor 120 may use the user's voice input through the microphone unit 180 in a call process or convert the user's voice into audio data and store it in the storage unit 130.
  • the microphone unit 180 may be configured as a stereo microphone that receives a sound input at a plurality of locations.
  • the imaging unit 185 is a component for capturing a still image or a moving image under the control of a user.
  • the imaging unit 185 may be implemented in plurality, such as a front camera and a rear camera. As described above, the imaging unit 185 may be used as a means for obtaining an image of the user in an embodiment for tracking the gaze of the user.
  • the processor 120 When the imaging unit 185 and the microphone unit 180 are provided, the processor 120 performs a control operation according to a user voice input through the microphone unit 180 or a user motion recognized by the imaging unit 185. It may be. That is, the image processing apparatus 100 may operate in a motion control mode or a voice control mode. When operating in the motion control mode, the processor 120 activates the imaging unit 185 to capture a user, track a user's motion change, and perform a control operation corresponding thereto. When operating in the voice control mode, the processor 120 may operate in a voice recognition mode that analyzes a user voice input through the microphone unit 180 and performs a control operation according to the analyzed user voice.
  • a voice recognition technique or a motion recognition technique may be used in the above-described various embodiments. For example, when a user takes a motion as if selecting an object displayed on a home screen or pronounces a voice command corresponding to the object, it may be determined that the object is selected and a control operation matched to the object may be performed. .
  • various external inputs for connecting to a USB port through which a USB connector may be connected in the image processing apparatus 100 or various external terminals such as a headset, a mouse, and a LAN may be used.
  • Ports, DMB chips for receiving and processing Digital Multimedia Broadcasting (DMB) signals, and various sensors may be further included.
  • DMB Digital Multimedia Broadcasting
  • FIG. 3 is a flowchart schematically illustrating an image processing method according to an exemplary embodiment.
  • an image processing apparatus may receive an image (S310).
  • the input image may be received from an external device or may be an image selected by a user among a plurality of images stored in the image processing apparatus.
  • the image processing apparatus may perform pre-processing to improve the image quality of the input image.
  • the image processing apparatus may perform preprocessing on the input image by using the upscaling method of the existing image.
  • the image processing apparatus may detect an edge based on a signal change of the image, and process the image to include a sharper edge by reducing the width or increasing the intensity of the detected area. This is only an example, and the image processing apparatus may perform preprocessing to improve the image quality of the input image in various ways.
  • the upscaling effect of the texture area where the signal in the image is composed of high frequency may be insignificant.
  • the image quality of the texture area may be improved through image processing according to the present disclosure.
  • the image processing apparatus may reduce the input image (S320).
  • the image processing apparatus may reduce the input image by using the scale factor.
  • the scale factor may be a preset value or a value determined according to the input image. Meanwhile, when the scale factor is a preset value, a method for deriving the scale factor will be described in detail with reference to FIG. 4. Meanwhile, when the scale factor is a value determined according to the input image, a method for deriving the scale factor will be described in detail with reference to FIG. 5.
  • the image processing apparatus may reduce the preprocessed image by using the scale factor.
  • the image processing apparatus may extract a visual feature from the reduced image (S330).
  • the image processing apparatus may not only attributes of the image such as brightness, color, contrast, saturation, and contrast of the reduced image, but also the frequency form of the image signal of each region in the image, the shape and density of the edges included in the image, and the color.
  • the texture features representing the textures felt from the arrays, etc. can be extracted.
  • the image processing apparatus may arrange a plurality of reduced images so as to correspond to the size of the input image before extracting the visual feature, and extract the visual feature from the arranged image.
  • the reduced image is a preprocessed image
  • the image processing apparatus may extract visual features from the reduced image after the preprocessing is performed.
  • the image processing apparatus may generate a high quality image by reflecting the extracted visual features (S340).
  • the image processing apparatus may generate a high quality image by dividing an input image into a plurality of regions having a size corresponding to the reduced image, and applying a visual feature extracted from the reduced image to each divided region. have.
  • the image processing apparatus may generate a high quality image by applying visual features to positions corresponding to the arranged images among the input images. In this case, the image processing apparatus may generate a high quality image by repeatedly applying the extracted visual features to the input image.
  • the image processing apparatus may generate a high quality image by reflecting the visual feature extracted from the preprocessed image.
  • a high quality image may be generated using a visual feature extracted by reducing a low quality image without an external database, thereby reducing the memory and time used for upscaling.
  • the image quality of the texture region which is composed of the existing high frequency region and has a slight upscaling effect, is also improved.
  • the image processing apparatus may further include receiving or storing the original image and the low quality image of the original image.
  • the image processing apparatus may extract a plurality of visual features from the reduced image using a plurality of scale factors (S410).
  • the image processing apparatus may reduce the input low quality image by using a plurality of scale factors to extract visual features from each of the reduced images.
  • the image processing apparatus may extract visual features from a plurality of reduced images by using five scale factors such as 0.1, 0.3, 0.5, 0.7, and 0.9. Next, the image processing apparatus may generate five images by reflecting the visual features extracted from the input image, respectively.
  • the image processing apparatus may arrange a plurality of images reduced in each scale factor so as to correspond to the size of the input image, and extract a visual feature from each of the arranged images.
  • the image processing apparatus may arrange an image having a size corresponding to the input image by using a plurality of images reduced in a scale factor of 0.1, and extract visual features from the arranged images.
  • the image processing apparatus may extract visual features for each of the scale factors of 0.3, 0.5, 0.7, and 0.9.
  • the scale factor is not limited to the values described in the above examples, and the number of scale factors may also be four or less and six or more.
  • the image processing apparatus may compare the extracted plurality of visual features and the visual features of the original image, respectively (S420).
  • the image processing apparatus may calculate a feature map of various sizes for each of the visual features of the original image and the extracted plurality of visual features by using a multi-layer technique.
  • the layer is associated with the size of the image. As the layer index increases, the size of the entire image decreases. For example, if the layer index is small, the feature map for the local range in the image is calculated. If the layer index is large, the feature map for the wider range in the image is calculated.
  • l is the index of the layer
  • i and j are the index of the feature map
  • k is the pixel index
  • the image processing apparatus needs to display the original image on each layer L as shown in Equation (2). Difference between Visual Features and Gram Matrix of Extracted Visual Features )
  • the image processing apparatus uses the average of the difference between the gram matrix of the pixels corresponding to the visual features of the original image and the extracted visual features, as shown in Equation (3). ) Can be calculated.
  • the image processing apparatus may determine a scale factor corresponding to the visual feature having the highest similarity with the visual feature of the original image among the extracted plurality of visual features (S430).
  • the highest similarity means that the average of the gram matrix differences is the minimum. That is, the image processing apparatus may determine a scale factor corresponding to a visual feature having a minimum average of the visual feature of the original image and the gram matrix difference among the plurality of scale factors as a scale factor to be used for subsequent reduction of the input image.
  • the most suitable scale factor may be determined to generate a high quality image similar to the original image through machine learning which repeats the above process several times.
  • the image processing apparatus may store the determined scale factor (S440). In some cases, the process of storing the scale factor may be omitted.
  • the preset scale factor used to reduce the input low quality image is described as being performed in the image processing apparatus, the above process may be performed in an external apparatus such as a server, and the image processing apparatus may be an external apparatus. It may be implemented in the form of receiving and using the scale factor determined in.
  • the scale factor that can generate a high quality image most similar to the original image is determined. It is possible to generate high quality images that are well represented.
  • the image processing apparatus may further include storing a scale factor corresponding to the degree of degradation of the image as a lookup table.
  • the image processing apparatus may perform preprocessing to improve image quality on an input image (S510).
  • the image processing apparatus may perform preprocessing on the input image by using the upscaling method of the existing image.
  • the image processing apparatus may detect an edge based on a signal change of the image, and process the image to include a sharper edge by reducing the width or increasing the intensity of the detected area. This is only an example, and the image processing apparatus may perform preprocessing to improve the image quality of the input image in various ways.
  • the image processing apparatus may measure the improvement rate of the image quality of the preprocessed image by comparing with the input image (S520).
  • the image processing apparatus may measure the image quality improvement rate of the preprocessed image by comparing the image quality performance of the input image with the image quality performance of the preprocessed image.
  • the image processing apparatus may determine the degree of deterioration of the image quality of the input image (S530).
  • the image processing apparatus may determine the degree of deterioration of the image quality of the input image using the measured image quality improvement rate of the preprocessed image. For example, the image processing apparatus may determine that the higher the image quality improvement rate of the preprocessed image, the more severe the image quality deterioration degree of the input image.
  • the image processing apparatus may determine a scale factor corresponding to the determined degree of image quality degradation (S540).
  • the image processing apparatus may determine a scale factor corresponding to the degree of deterioration of the image quality determined in the stored lookup table as the scale factor to be used to reduce the input image.
  • FIG. 6 is a diagram for describing an image in which regions are classified according to an embodiment of the present disclosure.
  • an example of the input image 60 includes a zebra 62 standing on the grass 61.
  • the edge of the image 61 is a relatively high frequency compared to the grass 61 region, which is a region where the image signal is high frequency, so that the image signal is low frequency, zebra 62. It can include an area.
  • the image processing apparatus may generate a high quality image by reflecting the visual feature extracted from the reduced image only to a part of the input image 60.
  • the image processing apparatus may distinguish a region in which an image signal is high frequency from a region having a relatively low frequency, and perform different image processing. This will be described in detail with reference to FIG. 7.
  • FIG. 7 is a flowchart illustrating an image processing method of the drawing illustrated in FIG. 6.
  • the image processing apparatus may first divide an input image into a plurality of regions according to the frequency of the image signal. In detail, the image processing apparatus may determine whether the frequency of the image signal of the input image is greater than or equal to a preset value (S701).
  • the image processing apparatus may reduce the input image (S702).
  • the image processing apparatus may reduce the input image by using a preset scale factor or a scale factor determined according to the degree of deterioration of the input image.
  • the image processing apparatus may reduce the preprocessed image after performing preprocessing to improve the image quality of the input image.
  • the image processing apparatus may extract a visual feature from the reduced image (S703). Detailed description thereof is already described in the description of FIGS. 1 and 3, and thus redundant descriptions thereof will be omitted.
  • the image processing apparatus may perform a process of improving the image quality of the input image (S704).
  • the image processing apparatus may extract a visual feature from the image having the quality improvement process. Since the detailed operation thereof is substantially the same as the operation of extracting the visual feature from the reduced image, duplicate description thereof will be omitted.
  • the image processing apparatus may generate a high quality image by reflecting the visual feature extracted from the input image (S706).
  • the image processing apparatus applies a visual feature extracted from the reduced image to a region in which the frequency of the image signal is greater than or equal to a preset frequency among the input images, and applies a region in which the frequency of the image signal is less than the preset frequency among the input images.
  • the visual feature extracted from the image having improved quality may be applied.
  • the input image is classified into two regions, and the image is processed in the form of applying or not applying the scale factor.
  • the image may be implemented in the form of applying different scale factors.
  • the image may be processed by being classified into three or more areas.
  • a high quality image may be generated using a visual feature extracted by reducing a low quality image without an external database, thereby reducing the memory and time used for upscaling.
  • the image quality of the texture region which is composed of the existing high frequency region and the upscaling effect is minimal, can be expected to be improved.
  • the various embodiments described above may be implemented in a recording medium readable by a computer or a similar device by using software, hardware, or a combination thereof.
  • the embodiments described in the present disclosure may include application specific integrated circuits (ASICs), digital signal processors (DSPs), digital signal processing devices (DSPDs), programmable logic devices (PLDs), and field programmable gate arrays (FPGAs). ), Processors, controllers, micro-controllers, microprocessors, and other electrical units for performing other functions.
  • the embodiments described herein may be implemented in the processor 120 itself.
  • embodiments such as the procedures and functions described herein may be implemented as separate software modules. Each of the software modules may perform one or more functions and operations described herein.
  • control method of the display apparatus may be stored in a non-transitory readable medium.
  • Such non-transitory readable media can be mounted and used in a variety of devices.
  • the non-transitory readable medium refers to a medium that stores data semi-permanently and is readable by a device, not a medium storing data for a short time such as a register, a cache, a memory, and the like.
  • programs for performing the above-described various methods may be stored and provided in a non-transitory readable medium such as a CD, a DVD, a hard disk, a Blu-ray disk, a USB, a memory card, or a ROM.

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • General Engineering & Computer Science (AREA)
  • Image Processing (AREA)

Abstract

영상처리장치가 개시된다. 본 영상처리장치는, 영상을 입력받는 입력부, 입력된 영상을 축소하여 시각적 특징을 추출하고, 입력된 영상에 추출된 시각적 특징을 반영하여 고화질 영상을 생성하는 프로세서를 포함한다. 본 개시는 딥러닝 등의 기계 학습 알고리즘을 활용하여 인간 두뇌의 인지, 판단 등의 기능을 모사하는 인공지능(AI) 시스템 및 그 응용에 관련된 것이다.

Description

영상처리장치, 영상처리방법 및 컴퓨터 판독가능 기록 매체
본 개시는 영상처리장치, 영상처리방법 및 컴퓨터 판독가능 기록 매체에 대한 것으로, 보다 상세하게는, 고화질 영상을 생성하기 위한 영상처리장치, 영상처리방법 및 컴퓨터 판독가능 기록 매체에 관한 것이다.
인공지능(Artificial Intelligence, AI) 시스템은 인간 수준의 지능을 구현하는 컴퓨터 시스템이며, 기존 Rule 기반 스마트 시스템과 달리 기계가 스스로 학습하고 판단하며 똑똑해지는 시스템이다. 인공지능 시스템은 사용할수록 인식률이 향상되고 사용자 취향을 보다 정확하게 이해할 수 있게 되어, 기존 Rule 기반 스마트 시스템은 점차 딥러닝 기반 인공지능 시스템으로 대체되고 있다.
인공지능 기술은 기계학습(딥러닝) 및 기계학습을 활용한 요소 기술들로 구성된다.
기계학습은 입력 데이터들의 특징을 스스로 분류/학습하는 알고리즘 기술이며, 요소기술은 딥러닝 등의 기계학습 알고리즘을 활용하여 인간 두뇌의 인지, 판단 등의 기능을 모사하는 기술로서, 언어적 이해, 시각적 이해, 추론/예측, 지식 표현, 동작 제어 등의 기술 분야로 구성된다.
인공지능 기술이 응용되는 다양한 분야는 다음과 같다. 언어적 이해는 인간의 언어/문자를 인식하고 응용/처리하는 기술로서, 자연어 처리, 기계 번역, 대화시스템, 질의 응답, 음성 인식/합성 등을 포함한다. 시각적 이해는 사물을 인간의 시각처럼 인식하여 처리하는 기술로서, 객체 인식, 객체 추적, 영상 검색, 사람 인식, 장면 이해, 공간 이해, 영상 개선 등을 포함한다. 추론 예측은 정보를 판단하여 논리적으로 추론하고 예측하는 기술로서, 지식/확률 기반 추론, 최적화 예측, 선호 기반 계획, 추천 등을 포함한다. 지식 표현은 인간의 경험정보를 지식데이터로 자동화 처리하는 기술로서, 지식 구축(데이터 생성/분류), 지식 관리(데이터 활용) 등을 포함한다. 동작 제어는 차량의 자율 주행, 로봇의 움직임을 제어하는 기술로서, 움직임 제어(항법, 충돌, 주행), 조작 제어(행동 제어) 등을 포함한다.
한편, 정량적 화질평가에서 일반적으로 많이 사용되는 PSNR (peak signal-to-noise ratio), SSIM (structural similarity) 등의 관점에서 화질을 개선하는 연구들은 많이 진행되어 왔다. 하지만, 영상의 화질은 인간의 감성이나 기호 등의 다양한 요소들의 영향을 받기 때문에, 현재까지 개발된 기술들을 이용하여 인지적 관점에서 화질을 개선하는데 한계가 있다.
최근 화질 개선 기술들을 살펴 보면 크게 외부 데이터베이스(database)를 사용하지 않는 방법과 사용하는 방법 이렇게 두 가지 범주로 나눌 수 있다. 외부 데이터베이스를 사용하지 않는 방법에서는 VDSR (super-resolution using very deep convolutional networks)이 개발되었다. 그러나, 풀(grass), 천(fabric) 등과 같이, 질감을 표현할 수 있으나 고주파 성분이 많은 텍스쳐(texture) 영역에서의 성능은 여전히 부족한 실정이다. 외부 데이터베이스를 사용하는 기술들은 텍스쳐 영역에서도 화질이 어느 정도 개선되지만, 200 MB 이상의 메모리를 사용하기 때문에 TV나 모바일 단말에 적용하기에는 어려움이 있다.
따라서, 외부 데이터베이스를 사용하지 않으면서, 영상의 텍스쳐 영역의 화질을 개선할 수 있는 기술의 필요성이 대두되었다.
본 개시는 상술한 필요성에 따른 것으로, 본 개시의 목적은, 외부 데이터베이스를 사용하지 않고, 입력된 저화질 영상을 이용하여 고화질 영상을 생성할 수 있는 영상처리장치, 영상처리방법 및 컴퓨터 판독가능 기록 매체를 제공함에 있다.
본 개시의 일 실시 예에 따른 영상처리장치는, 영상을 입력받는 입력부, 상기 입력된 영상을 축소하여 시각적 특징을 추출하고, 상기 입력된 영상에 상기 추출된 시각적 특징을 반영하여 고화질 영상을 생성하는 프로세서를 포함한다.
이 경우, 상기 프로세서는, 기설정된 스케일 팩터를 이용하여 상기 입력된 영상을 축소할 수 있다.
한편, 상기 프로세서는, 상기 입력된 영상의 화질을 향상시키기 위한 전처리를 수행하고, 상기 전처리된 영상에 상기 전처리된 영상을 축소하여 추출한 시각적 특징을 반영하여 상기 고화질 영상을 생성할 수 있다.
이 경우, 영상의 복수의 열화 정도에 대응되는 복수의 스케일 팩터를 저장하는 저장부를 더 포함하고, 상기 프로세서는, 상기 입력된 영상과 비교하여 측정된, 상기 전처리된 영상의 화질 개선률에 기초하여 상기 입력된 영상의 열화 정도를 결정하고, 상기 저장된 복수의 스케일 팩터 중 상기 결정된 열화 정도에 대응되는 스케일 팩터를 이용하여 상기 입력된 영상을 축소할 수 있다.
한편, 상기 프로세서는, 복수의 상기 축소된 영상을 상기 입력된 영상의 크기에 대응되도록 배열하고, 상기 배열된 영상에서 시각적 특징을 추출할 수 있다.
한편, 상기 프로세서는, 상기 입력된 영상 중 일부 영역에만 상기 추출된 시각적 특징을 반영하여 고화질 영상을 생성할 수 있다.
이 경우, 상기 일부 영역은, 영상 신호의 주파수가 기설정된 값 이상일 수 있다.
한편, 상기 생성된 고화질 영상을 표시하는 디스플레이부를 더 포함할 수 있다.
한편, 상기 생성된 고화질 영상을 디스플레이 장치에 전송하는 통신부를 더 포함할 수 있다.
한편, 본 개시의 일 실시 예에 따른 영상처리방법은, 영상을 입력받는 단계, 상기 입력된 영상을 축소하는 단계, 상기 축소된 영상에서 시각적 특징을 추출하는 단계 및 상기 입력된 영상에 상기 추출된 시각적 특징을 반영하여 고화질 영상을 생성하는 단계를 포함한다.
이 경우, 상기 축소하는 단계는, 기설정된 스케일 팩터를 이용하여 상기 입력된 영상을 축소할 수 있다.
한편, 상기 입력된 영상의 화질을 향상시키기 위한 전처리를 수행하는 단계를 더 포함하고, 상기 축소하는 단계는, 상기 전처리된 영상을 축소할 수 있다.
이 경우, 영상의 복수의 열화 정도에 대응되는 복수의 스케일 팩터를 저장하는 단계를 더 포함하고, 상기 축소하는 단계는, 상기 입력된 영상과 비교하여 측정된, 상기 화질 향상된 영상의 화질 개선률에 기초하여 상기 입력된 영상의 열화 정도를 결정하고, 상기 저장된 복수의 스케일 팩터 중 상기 결정된 열화 정도에 대응되는 스케일 팩터를 이용하여 상기 입력된 영상을 축소할 수 있다.
한편, 상기 추출하는 단계는, 복수의 상기 축소된 영상을 상기 입력된 영상의 크기에 대응되도록 배열하고, 상기 배열된 영상에서 시각적 특징을 추출할 수 있다.
한편, 상기 생성하는 단계는, 상기 입력된 영상 중 일부 영역에만 상기 추출된 시각적 특징을 반영하여 고화질 영상을 생성할 수 있다.
이 경우, 상기 일부 영역은, 영상 신호의 주파수가 기설정된 값 이상일 수 있다.
한편, 상기 생성된 고화질 영상을 표시하는 단계를 더 포함할 수 있다.
한편, 상기 생성된 고화질 영상을 디스플레이 장치에 전송하는 단계를 더 포함할 수 있다.
한편, 본 개시의 일 실시 예에 따른 영상처리방법을 실행하기 위한 프로그램을 포함하는 컴퓨터 판독가능 기록 매체에 있어서, 상기 영상처리방법은, 영상을 입력받는 단계, 상기 입력된 영상을 축소하는 단계, 상기 축소된 영상에서 시각적 특징을 추출하는 단계 및 상기 입력된 영상에 상기 추출된 시각적 특징을 반영하여 고화질 영상을 생성하는 단계를 포함한다.
도 1은 본 개시의 일 실시 예에 따른 영상처리장치의 간략한 구성을 설명하기 위한 블럭도,
도 2는 본 개시의 일 실시 예에 따른 영상처리장치의 구체적인 구성을 설명하기 위한 블럭도,
도 3은 본 개시의 일 실시 예에 따른 영상처리방법을 개략적으로 나타낸 흐름도,
도 4는 본 개시의 일 실시 예에 따른 스케일 팩터 결정 방법을 나타내는 흐름도,
도 5는 본 개시의 다른 실시 예에 따른 스케일 팩터 결정 방법을 나타내는 흐름도,
도 6은 본 개시의 일 실시 예에 따라 영역이 분류된 영상을 설명하기 위한 도면, 그리고,
도 7은 도 6에 도시된 도면의 영상처리방법을 설명하기 위한 흐름도이다.
본 명세서에서 사용되는 용어에 대해 간략히 설명하고, 본 개시에 대해 구체적으로 설명하기로 한다.
본 개시의 실시 예에서 사용되는 용어는 본 개시에서의 기능을 고려하면서 가능한 현재 널리 사용되는 일반적인 용어들을 선택하였으나, 이는 당 분야에 종사하는 기술자의 의도 또는 판례, 새로운 기술의 출현 등에 따라 달라질 수 있다. 또한, 특정한 경우는 출원인이 임의로 선정한 용어도 있으며, 이 경우 해당되는 개시의 설명 부분에서 상세히 그 의미를 기재할 것이다. 따라서 본 발명에서 사용되는 용어는 단순한 용어의 명칭이 아닌, 그 용어가 가지는 의미와 본 개시의 전반에 걸친 내용을 토대로 정의되어야 한다.
본 개시의 실시 예들은 다양한 변환을 가할 수 있고 여러 가지 실시 예를 가질 수 있는바, 특정 실시 예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나 이는 특정한 실시 형태에 대해 범위를 한정하려는 것이 아니며, 발명된 사상 및 기술 범위에 포함되는 모든 변환, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 실시 예들을 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 요지를 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다.
제1, 제2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 구성요소들은 용어들에 의해 한정되어서는 안 된다. 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다.
단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "구성되다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
본 개시의 실시 예에서 '모듈' 혹은 '부'는 적어도 하나의 기능이나 동작을 수행하며, 하드웨어 또는 소프트웨어로 구현되거나 하드웨어와 소프트웨어의 결합으로 구현될 수 있다. 또한, 복수의 '모듈' 혹은 복수의 '부'는 특정한 하드웨어로 구현될 필요가 있는 '모듈' 혹은 '부'를 제외하고는 적어도 하나의 모듈로 일체화되어 적어도 하나의 프로세서로 구현될 수 있다.
아래에서는 첨부한 도면을 참고하여 본 개시의 실시 예에 대하여 본 개시가 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그러나 본 개시는 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시 예에 한정되지 않는다. 그리고 도면에서 본 개시를 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
이하에서는 도면을 참조하여 본 발명에 대해 더욱 상세히 설명하기로 한다.
도 1은 본 개시의 일 실시 예에 따른 영상처리장치의 간략한 구성을 설명하기 위한 블럭도이다.
도 1을 참조하면, 영상처리장치(100)는 입력부(110) 및 프로세서(120)를 포함한다. 여기서, 영상처리장치(100)는 입력된 영상을 처리하여 별도의 디스플레이 장치로 전송하는 셋탑박스, 서버 형태로 구현될 수 있다. 그러나, 이에 한정되지 않고, 장치 자체에서 표시할 수 있는 디스플레이부를 구비한 TV, PC, 모바일 장치 등의 디스플레이 장치일 수 있다.
입력부(110)는 저화질 영상을 입력받을 수 있다. 구체적으로, 입력부(110)는 외부로부터 유선 또는 무선으로 영상을 입력받거나, 저장된 복수의 영상 중 사용자의 선택에 의해 처리될 영상을 입력받을 수 있다. 예를 들어, 입력부(110)는 안테나 또는 케이블을 통하여 영상을 입력받거나, 저장부(미도시)로부터 사용자가 선택한 영상을 입력받을 수 있다.
프로세서(120)는 입력부(110)에 의해 입력된 영상을 업스케일링(up-scaling)한 고화질 영상을 생성할 수 있다. 구체적으로, 프로세서(120)는 입력된 저화질 영상을 축소하여 축소된 영상의 시각적 특징을 추출하고, 입력된 저화질 영상에 추출된 시각적 특징을 반영하여 고화질 영상을 생성할 수 있다.
여기서, 업스케일링은 저화질 영상에서 고화질 영상 구현을 위해 늘어난 화소를 보정하는 것을 의미하며, 화면의 크기가 동일한 경우 원래 화면보다 선명하고 뚜렷한 영상을 얻을 수 있으며, 화면의 크기가 커지는 경우에도 원래 화면보다 화질이 저하되지 않은 영상을 얻을 수 있다.
그리고, 시각적 특징은 사용자가 영상을 눈으로 보았을 때 인지할 수 있는 특징으로, 영상의 밝기, 색감, 명암, 채도, 대비 등의 영상의 속성 뿐만 아니라, 영상 내 각 영역의 영상 신호의 주파수 형태, 영상에 포함된 에지의 형태 및 밀도, 색상의 배열 등으로부터 느껴지는 질감을 나타내는 텍스쳐(texture) 특징을 포함할 수 있다.
이와 같이, 본 개시에 따르면 외부 데이터베이스 없이 저화질 영상을 축소하여 추출된 시각적 특징을 이용하여 고화질 영상을 생성할 수 있어 사용되는 메모리가 감소될 수 있다. 그리고, 기존 고주파 영역으로 구성되어 업스케일링 효과가 미미했던 텍스쳐 영역의 화질 또한 향상되는 효과가 있다.
프로세서(120)는 기설정된 스케일 팩터를 이용하여 입력된 영상을 축소할 수 있다. 여기서, 스케일 팩터는 입력된 영상의 축소 정도를 결정하는 인자로, 0과 1 사이일 수 있다. 이때, 기설정된 스케일 팩터는 미리 기계 학습을 통해 결정된 값일 수 있다. 예를 들어, 고화질의 원본 영상이 존재하는 경우, 프로세서(120)는 원본 영상과 원본 영상의 저화질 영상을 처리하여 얻어진 영상이 가장 유사하도록 스케일 팩터를 결정할 수 있다. 이때, 프로세서(120)는 복수의 원본 영상에 대하여 동일한 동작을 수행하여 원본 영상과 가장 유사하도록 저화질 영상을 처리하기 위한 스케일 팩터를 결정할 수 있다. 유사도를 이용하여 스케일 팩터를 결정하는 구체적인 방법은 이하 도 4를 참조하여 자세히 설명한다.
한편, 프로세서(120)는 저화질 영상의 열화 정도에 따라 스케일 팩터를 결정할 수 있다. 구체적으로, 영상처리장치(100)는 영상의 복수의 열화 정도에 각각 대응되는 복수의 스케일 팩터 정보를 미리 저장하고 있을 수 있으며, 이때, 복수의 스케일 팩터 정보는 룩업테이블 형태로 저장되어 있을 수 있다. 한편, 영상의 열화 정도에 따른 스케일 팩터 결정 방법은 이하 도 5를 참조하여 자세히 설명한다.
한편, 프로세서(120)는 입력된 영상을 축소하기 전에 입력된 영상의 화질을 향상시킬 수 있다. 구체적으로, 프로세서(120)는 기존 화질 향상을 위해 사용되었던 알고리즘에 따라, 영상의 화질을 1차적으로 향상시킨 후 본 개시의 일 실시 예에 따라 화질 개선을 위한 영상 처리를 수행할 수 있다.
한편, 프로세서(120)는 축소된 영상 자체에서 시각적 특징을 추출할 수 있지만, 이에 한정되지 않고, 축소된 영상 복수 개를 입력된 영상의 크기에 대응되도록 배열한 영상에서 시각적 특징을 추출할 수 있다. 예를 들어, 프로세서(120)는 입력된 영상을 스케일 팩터 0.5를 이용하여 축소하는 경우, 축소된 영상을 입력된 영상의 크기에 대응되도록 2 x 2로 배열한 뒤, 배열된 영상에서 시각적 특징을 추출할 수 있다.
이로 인해, 입력된 영상에 추출된 시각적 특징을 적용하여 고화질 영상을 생성하는 과정에서 추가적인 스케일링 단계 없이, 각각 대응되는 픽셀의 시각적 특징을 반영할 수 있어, 발생되는 오차를 감소시킬 수 있다.
한편, 프로세서(120)는 축소된 영상에서 추출된 시각적 특징을 입력된 영상에 반영하여 고화질 영상을 생성할 수 있다. 이때, 프로세서(120)는 입력된 영상을 축소된 영상에 대응되는 크기의 복수의 영역으로 분할하고, 분할된 각 영역에 추출된 시각적 특징을 적용하는 형태로 고화질 영상을 생성할 수 있다.
한편, 프로세서(120)는 추출된 시각적 특징을 입력된 영상에 반복적으로 적용하여 고화질 영상을 생성할 수도 있다.
한편, 프로세서(120)는 추출된 시각적 특징을 입력된 영상 중 일부 영역에만 반영하여 고화질 영상을 생성할 수 있다. 이에 대해서는 이하 도 6 및 도 7을 참조하여 자세히 설명한다.
도 2는 본 개시의 일 실시 예에 따른 영상처리장치의 구체적인 구성을 설명하기 위한 블럭도이다.
도 2를 참조하면, 영상처리장치(100)는 입력부(110), 프로세서(120), 저장부(130), 디스플레이부(140), 통신부(150), 비디오 프로세서(160), 오디오 프로세서(170), 버튼(126), 마이크부(180), 촬상부(185), 오디오 출력부(190)를 포함할 수 있다. 여기서, 입력부(110) 및 프로세서(120)는 도 1에 도시된 구성과 동일한 바, 중복된 기재는 생략한다.
저장부(130)는 영상처리장치(100)의 동작에 필요한 각종 프로그램 및 데이터를 저장할 수 있다. 구체적으로는, 저장부(130)에는 입력된 영상을 축소하는데 사용하기 위한 스케일 팩터가 저장될 수 있다. 이때, 저장되는 스케일 팩터는 제조사가 기계 학습을 통해 계산해낸 것으로, 출고시에 기저장되었거나, 주기적인 펌웨어 업그레이드를 통해 갱신될 수 있다. 한편, 저장부(130)는 스케일 팩터를 도출하기 위한 알고리즘을 저장할 수도 있다.
그리고, 저장부(130)는 고화질 영상으로 업스케일링 될 복수의 저화질 영상을 저장할 수 있다. 프로세서(120)는 저장된 복수의 저화질 영상 중 사용자에 의해 선택된 저화질 영상에 대한 고화질 영상을 생성할 수 있다.
그리고, 저장부(130)는 영상의 열화 정도에 대응되는 스케일 팩터에 대한 정보가 저장될 수 있다. 이때, 열화 정도에 따른 스케일 팩터는 룩업테이블 형태로 저장될 수 있다.
그리고, 저장부(130)는 저화질 영상을 업스케일링 하기 위한 프로그램 및 데이터 등을 저장할 수 있다. 이로 인해, 프로세서(120)는 저장부(130)에 저장된 프로그램 및 데이터를 이용하여 입력된 저화질 영상으로 고화질 영상을 생성할 수 있고, 경우에 따라 업스케일링 과정에서 이용되는 스케일 팩터를 결정할 수 있다.
디스플레이부(140)는 생성된 고화질 영상을 표시할 수 있다. 디스플레이부(140)는 LCD(Liquid Crystal Display), OLED(Organic Light Emitting Diodes) 디스플레이, PDP(Plasma Display Panel) 등과 같은 다양한 형태의 디스플레이로 구현될 수 있다. 디스플레이부(140) 내에는 a-si TFT, LTPS(low temperature poly silicon) TFT, OTFT(organic TFT) 등과 같은 형태로 구현될 수 있는 구동 회로, 백라이트 유닛 등도 함께 포함될 수 있다. 또한, 디스플레이부(140)은 플렉서블 디스플레이로 구현될 수도 있다.
그리고, 디스플레이부(140)는 사용자의 터치 제스처를 감지하기 위한 터치 센서를 포함할 수 있다. 터치 센서는 정전식이나, 감압식, 압전식 등과 같은 다양한 유형의 센서로 구현될 수 있다. 정전식은 디스플레이부 표면에 코팅된 유전체를 이용하여, 사용자의 신체 일부가 디스플레이부(140) 표면에 터치되었을 때 사용자의 인체로 여기되는 미세 전기를 감지하여 터치 좌표를 산출하는 방식이다. 감압식은 디스플레이부(140)에 내장된 두 개의 전극 판을 포함하여, 사용자가 화면을 터치하였을 경우, 터치된 지점의 상하 판이 접촉되어 전류가 흐르게 되는 것을 감지하여 터치 좌표를 산출하는 방식이다. 이 밖에도, 영상처리장치(100)가 펜 입력 기능도 지원하는 경우, 디스플레이부(140)은 사용자의 손가락 이외에도 펜과 같은 입력 수단을 이용한 사용자 제스처도 감지할 수 있다. 입력 수단이 내부에 코일을 포함하는 스타일러스 펜일 경우, 영상처리장치(100)는 스타일러스 펜 내부의 코일에 의해 변화되는 자기장을 감지할 수 있는 자기장 감지 센서를 포함할 수도 있다. 이에 따라, 터치 제스처뿐만 아니라 근접 제스처, 즉, 호버링(hovering)도 감지할 수 있게 된다.
한편, 이상에서는 표시 기능과 제스처 감지 기능이 동일한 구성에서 수행되는 것으로 설명하였지만, 서로 다른 구성에서 수행될 수도 있다. 그리고, 다양한 실시 형태에 따라, 영상처리장치(100)에 디스플레이부(140)는 구비되지 않을 수도 있다.
통신부(150)는 다양한 유형의 통신방식에 따라 다양한 유형의 외부 기기와 통신을 수행하는 구성이다. 통신부(150)는 와이파이칩(151), 블루투스 칩(152), 무선 통신 칩(153), NFC 칩(154)을 포함한다. 프로세서(120)는 통신부(150)를 이용하여 각종 외부 기기와 통신을 수행한다.
구체적으로, 통신부(150)는 외부 장치로부터 저화질 영상을 수신하고, 프로세서(120)에 의해 생성된 고화질 영상을 별도의 디스플레이 장치와 같은 외부 장치로 전송할 수 있다.
와이파이 칩(151), 블루투스 칩(152)은 각각 WiFi 방식, 블루투스 방식으로 통신을 수행한다. 와이파이 칩(151)이나 블루투스 칩(152)을 이용하는 경우에는 SSID 및 세션 키 등과 같은 각종 연결 정보를 먼저 송수신하여, 이를 이용하여 통신 연결한 후 각종 정보들을 송수신할 수 있다. 무선 통신 칩(153)은 IEEE, 지그비, 3G(3rd Generation), 3GPP(3rd Generation Partnership Project), LTE(Long Term Evoloution) 등과 같은 다양한 통신 규격에 따라 통신을 수행하는 칩을 의미한다. NFC 칩(154)은 135kHz, 13.56MHz, 433MHz, 860~960MHz, 2.45GHz 등과 같은 다양한 RF-ID 주파수 대역들 중에서 13.56MHz 대역을 사용하는 NFC(Near Field Communication) 방식으로 동작하는 칩을 의미한다.
프로세서(120)는 RAM(121), ROM(122), CPU(123), GPU(Graphic Processing Unit)(124), 버스(125)를 포함할 수 있다. RAM(121), ROM(122), CPU(123), GPU(Graphic Processing Unit)(124) 등은 버스(125)를 통해 서로 연결될 수 있다.
CPU(123)는 저장부(130)에 액세스하여, 저장부(130)에 저장된 O/S를 이용하여 부팅을 수행한다. 그리고 저장부(130)에 저장된 각종 프로그램, 컨텐츠, 데이터 등을 이용하여 다양한 동작을 수행한다.
ROM(122)에는 시스템 부팅을 위한 명령어 세트 등이 저장된다. 턴-온 명령이 입력되어 전원이 공급되면, CPU(123)는 ROM(122)에 저장된 명령어에 따라 저장부(140)에 저장된 O/S를 RAM(121)에 복사하고, O/S를 실행시켜 시스템을 부팅시킨다. 부팅이 완료되면, CPU(123)는 저장부(140)에 저장된 각종 프로그램을 RAM(121)에 복사하고, RAM(121)에 복사된 프로그램을 실행시켜 각종 동작을 수행한다.
GPU(124)는 영상처리장치(100)의 부팅이 완료되면, 디스플레이부(140)에 UI를 디스플레이한다. 구체적으로는, GPU(124)는 연산부(미도시) 및 렌더링부(미도시)를 이용하여 아이콘, 이미지, 텍스트 등과 같은 다양한 객체를 포함하는 화면을 생성할 수 있다. 연산부는 화면의 레이아웃에 따라 각 객체들이 표시될 좌표값, 형태, 크기, 컬러 등과 같은 속성값을 연산한다. 렌더링부는 연산부에서 연산한 속성값에 기초하여 객체를 포함하는 다양한 레이아웃의 화면을 생성한다. 렌더링부에서 생성된 화면(또는 사용자 인터페이스 창)은 디스플레이부(140)로 제공되어, 메인 표시 영역 및 서브 표시 영역에 각각 표시된다.
비디오 프로세서(160)는 통신부(150)를 통해 수신된 컨텐츠 또는, 저장부(130)에 저장된 컨텐츠에 포함된 비디오 데이터를 처리하기 위한 구성요소이다. 비디오 프로세서(160)에서는 비디오 데이터에 대한 디코딩, 스케일링, 노이즈 필터링, 프레임 레이트 변환, 해상도 변환 등과 같은 다양한 이미지 처리를 수행할 수 있다.
오디오 프로세서(170)는 통신부(150)를 통해 수신된 컨텐츠 또는, 저장부(130)에 저장된 컨텐츠에 포함된 오디오 데이터를 처리하기 위한 구성요소이다. 오디오 프로세서(170)에서는 오디오 데이터에 대한 디코딩이나 증폭, 노이즈 필터링 등과 같은 다양한 처리가 수행될 수 있다.
프로세서(120)는 멀티미디어 컨텐츠에 대한 재생 애플리케이션이 실행되면 비디오 프로세서(160) 및 오디오 프로세서(170)를 구동시켜, 해당 컨텐츠를 재생할 수 있다. 이때, 디스플레이부(140)는 비디오 프로세서(160)에서 생성한 이미지 프레임을 메인 표시 영역, 서브 표시 영역 중 적어도 하나의 영역에 디스플레이할 수 있다.
오디오 출력부(190)는 오디오 프로세서(170)에서 생성한 오디오 데이터를 출력한다.
버튼(126)은 영상처리장치(100)의 본체 외관의 전면부나 측면부, 배면부 등의 임의의 영역에 형성된 기계적 버튼, 터치 패드, 휠 등과 같은 다양한 유형의 버튼이 될 수 있다.
마이크부(180)는 사용자 음성이나 기타 소리를 입력받아 오디오 데이터로 변환하기 위한 구성이다. 프로세서(120)는 마이크부(180)를 통해 입력되는 사용자 음성을 통화(call) 과정에서 이용하거나, 오디오 데이터로 변환하여 저장부(130)에 저장할 수 있다. 한편, 마이크부(180)는 복수의 위치에서 소리 입력을 받는 스테레오 마이크로 구성될 수 있다.
촬상부(185)는 사용자의 제어에 따라 정지 영상 또는 동영상을 촬상하기 위한 구성이다. 촬상부(185)는 전면 카메라, 후면 카메라와 같이 복수 개로 구현될 수 있다. 상술한 바와 같이, 촬상부(185)는 사용자의 시선 추적을 위한 실시 예에서 사용자의 이미지를 획득하기 위한 수단으로 사용될 수 있다.
촬상부(185) 및 마이크부(180)가 마련된 경우, 프로세서(120)는 마이크부(180)를 통해 입력되는 사용자 음성이나 촬상부(185)에 의해 인식되는 사용자 모션에 따라 제어 동작을 수행할 수도 있다. 즉, 영상처리장치(100)는 모션 제어 모드나 음성 제어 모드로 동작할 수 있다. 모션 제어 모드로 동작하는 경우, 프로세서(120)는 촬상부(185)를 활성화시켜 사용자를 촬상하고, 사용자의 모션 변화를 추적하여 그에 대응되는 제어 동작을 수행한다. 음성 제어 모드로 동작하는 경우 프로세서(120)는 마이크부(180)를 통해 입력된 사용자 음성을 분석하고, 분석된 사용자 음성에 따라 제어 동작을 수행하는 음성 인식 모드로 동작할 수도 있다.
모션 제어 모드나 음성 제어 모드가 지원되는 영상처리장치(100)에서는, 음성 인식 기술 또는 모션 인식 기술이 상술한 다양한 실시 예에 사용될 수 있다. 가령, 사용자가 홈 화면에 표시된 오브젝트를 선택하는 듯한 모션을 취하거나, 그 오브젝트에 대응되는 음성 명령어를 발음하는 경우, 해당 오브젝트가 선택된 것으로 판단하고, 그 오브젝트에 매칭된 제어 동작을 수행할 수 있다.
그 밖에, 도 3에 도시하지는 않았으나, 실시 예에 따라서는, 영상처리장치(100) 내에 USB 커넥터가 연결될 수 있는 USB 포트나, 헤드셋, 마우스, LAN 등과 같은 다양한 외부 단자와 연결하기 위한 다양한 외부 입력 포트, DMB(Digital Multimedia Broadcasting) 신호를 수신하여 처리하는 DMB 칩, 다양한 센서 등을 더 포함할 수 있음은 물론이다.
도 3은 본 개시의 일 실시 예에 따른 영상처리방법을 개략적으로 나타낸 흐름도이다.
도 3을 참조하면, 우선 영상처리장치는 영상을 입력받을 수 있다(S310). 구체적으로, 입력받는 영상은 외부 장치로부터 수신된 것이거나, 영상처리장치에 저장된 복수의 영상 중 사용자에 의해 선택된 영상일 수 있다.
그 다음, 도시되지는 않았지만, 영상처리장치는 입력된 영상의 화질을 향상시키기 위한 전처리(pre-processing)를 수행할 수 있다. 구체적으로, 영상처리장치는 기존 영상의 업스케일링 방식을 이용하여 입력된 영상에 전처리를 수행할 수 있다. 예를 들어, 영상처리장치는 영상의 신호 변화에 기초하여 에지(edge)를 검출하고, 검출된 영역의 폭을 줄이거나 세기를 증가시켜 보다 선명한 에지를 포함하도록 영상을 처리할 수 있다. 이는 일 실시 예에 불과하며, 영상처리장치는 다양한 방식으로 입력된 영상의 화질을 향상시키는 전처리를 수행할 수 있다.
한편, 기존 업스케일링 방식에 의하면 영상 내 신호가 고주파로 구성된 텍스쳐 영역의 업스케일링 효과가 미미할 수 있다. 이에 대해서는 이하 본 개시에 따른 영상 처리를 통해 텍스쳐 영역의 화질도 향상시킬 수 있다.
그 다음, 영상처리장치는 입력된 영상을 축소할 수 있다(S320). 구체적으로, 영상처리장치는 스케일 팩터를 이용하여 입력된 영상을 축소할 수 있다. 이때, 스케일 팩터는 기설정된 값이거나, 입력된 영상에 따라 결정되는 값일 수 있다. 한편, 스케일 팩터가 기설정된 값인 경우, 이를 도출하기 위한 방법은 이하 도 4를 참조하여 자세히 설명한다. 한편, 스케일 팩터가 입력된 영상에 따라 결정되는 값인 경우, 이를 도출하기 위한 방법은 이하 도 5를 참조하여 자세히 설명한다.
한편, 입력된 영상의 화질 향상을 위한 전처리가 수행된 경우, 영상처리장치는 스케일 팩터를 이용하여 전처리된 영상을 축소할 수 있다.
그 다음, 영상처리장치는 축소된 영상에서 시각적 특징을 추출할 수 있다(S330). 구체적으로, 영상처리장치는 축소된 영상의 밝기, 색감, 명암, 채도, 대비 등의 영상의 속성 뿐만 아니라, 영상 내 각 영역의 영상 신호의 주파수 형태, 영상에 포함된 에지의 형태 및 밀도, 색상의 배열 등으로부터 느껴지는 질감을 나타내는 텍스쳐 특징을 추출할 수 있다.
한편, 도시되지는 않았으나, 영상처리장치는 시각적 특징을 추출하는 단계 이전에, 축소된 영상 복수 개를 입력된 영상의 크기에 대응되도록 배열하여, 배열된 영상에서 시각적 특징을 추출할 수도 있다.
한편, 입력된 영상의 화질 향상을 위한 전처리가 수행된 경우, 축소된 영상은 전처리된 영상이며, 영상처리장치는 전처리가 수행된 후 축소된 영상에서 시각적 특징을 추출할 수도 있다.
그 다음, 영상처리장치는 추출된 시각적 특징을 반영하여 고화질 영상을 생성할 수 있다(S340). 구체적으로, 영상처리장치는 입력된 영상을 축소된 영상에 대응되는 크기의 복수의 영역으로 분할하고, 축소된 영상에서 추출된 시각적 특징을 분할된 각 영역에 적용하는 형태로 고화질 영상을 생성할 수 있다. 한편, 축소된 영상 복수 개가 배열된 영상에서 시각적 특징을 추출한 경우, 영상처리장치는 입력된 영상 중 배열된 영상에 각각 대응되는 위치에 시각적 특징을 적용하여 고화질 영상을 생성할 수도 있다. 이때, 영상처리장치는 입력된 영상에 추출된 시각적 특징을 반복적으로 적용하여 고화질 영상을 생성할 수도 있다.
한편, 입력된 영상의 화질 향상을 위한 전처리가 수행된 경우, 영상처리장치는 전처리된 영상에 추출된 시각적 특징을 반영하여 고화질 영상을 생성할 수도 있다.
이와 같이, 본 개시에 따르면 외부 데이터베이스 없이 저화질 영상을 축소하여 추출된 시각적 특징을 이용하여 고화질 영상을 생성할 수 있어 업스케일링에 사용되는 메모리 및 시간이 감소될 수 있다. 그리고, 기존 고주파 영역으로 구성되어 업스케일링 효과가 미미했던 텍스쳐 영역의 화질 또한 향상되는 효과가 있다.
도 4는 본 개시의 일 실시 예에 따른 스케일 팩터 결정 방법을 나타내는 흐름도이다. 여기서, 도 4에 도시되지는 않았지만, 우선적으로 영상처리장치는 원본 영상 및 원본 영상의 저화질 영상을 수신 또는 저장하는 단계가 더 포함될 수 있다.
도 4를 참조하면, 영상처리장치는 복수의 스케일 팩터를 이용하여 축소된 영상에서 복수의 시각적 특징을 추출할 수 있다(S410). 구체적으로, 영상처리장치는 입력된 저화질 영상을 복수의 스케일 팩터를 이용하여 각각 축소하여, 축소된 각 영상에서 시각적 특징을 추출할 수 있다.
예를 들어, 영상처리장치는 0.1, 0.3, 0.5, 0.7, 0.9와 같은 5개의 스케일 팩터를 이용하여 축소된 복수의 축소된 영상에서 시각적 특징을 추출할 수 있다. 그 다음, 영상처리장치는 입력된 영상에 추출된 시각적 특징을 각각 반영하여 5개의 영상을 생성할 수 있다.
이때, 영상처리장치는 각 스케일 팩터로 축소된 영상 복수 개를 입력된 영상의 크기에 대응되도록 배열하고, 배열된 각 영상에서 시각적 특징을 추출할 수 있다. 예를 들어, 영상처리장치는 0.1의 스케일 팩터로 축소된 영상 복수 개를 이용하여 입력된 영상과 대응되는 크기로 배열하고, 배열된 영상에서 시각적 특징을 추출할 수 있다. 동일하게, 영상처리장치는 0.3, 0.5, 0.7, 0.9의 스케일 팩터 각각에 대한 시각적 특징을 추출할 수 있다. 한편, 실제 구현시에는 스케일 팩터가 이상의 예시에 기재된 값들에 한정되지 않으며, 스케일 팩터의 개수 또한 4개 이하 6개 이상일 수 있다.
그 다음, 영상처리장치는 추출된 복수의 시각적 특징 및 원본 영상의 시각적 특징을 각각 비교할 수 있다(S420). 구체적으로, 영상처리장치는 멀티-레이어(multi-layer)기법을 이용하여 원본 영상의 시각적 특징 및 추출된 복수의 시각적 특징 각각에 대한 다양한 크기의 특징 맵(feature map)을 계산할 수 있다. 여기서, 레이어는 영상의 크기와 연관된 것으로, 레이어 지수가 증가할수록 전체 영상의 크기는 작아진다. 예를 들어, 레이어 지수가 작으면, 영상 내 국소 범위에 대한 특징 맵이 계산되고, 레이어 지수가 크면, 영상 내 보다 넓은 범위에 대한 특징 맵이 계산된다.
그리고, 계산된 특징 맵에 기초하여 각각의 레이어 상에서 식(1)과 같은 특징 맵 간의 연관 관계를 측정하는 그램 매트릭스(Gram matrix,
Figure PCTKR2017011932-appb-I000001
)를 계산할 수 있다.
Figure PCTKR2017011932-appb-I000002
(1)
여기서, l은 레이어의 지수(index), ij는 특징 맵의 지수, k는 픽셀 지수를 의미한다.
축소된 영상에서 추출된 시각적 특징이 원본 영상의 시각적 특징과 유사하기 위해서는, 각 레이어에서 구한 그램 매트릭스가 유사해야하는 바, 우선 영상처리장치는 식(2)와 같이 각 레이어(L) 상에서 원본 영상의 시각적 특징과 추출된 시각적 특징의 그램 매트릭스의 차이(
Figure PCTKR2017011932-appb-I000003
)를 구한다.
Figure PCTKR2017011932-appb-I000004
(2)
여기서,
Figure PCTKR2017011932-appb-I000005
Figure PCTKR2017011932-appb-I000006
은 각각 원본 영상의 시각적 특징과 추출된 시각적 특징의 L번째 레이어 상에서의 그램 매트릭스를 나타낸다.
그 다음, 영상처리장치는 식(3)과 같이 원본 영상의 시각적 특징과 추출된 시각적 특징의 상호 대응되는 픽셀의 그램 매트릭스의 차이의 평균(
Figure PCTKR2017011932-appb-I000007
)을 계산할 수 있다.
Figure PCTKR2017011932-appb-I000008
(3)
여기서,
Figure PCTKR2017011932-appb-I000009
Figure PCTKR2017011932-appb-I000010
는 각각 원본 영상의 시각적 특징과 추출된 시각적 특징의 픽셀 위치를 나타낸다.
그 다음, 영상처리장치는 추출된 복수의 시각적 특징 중 원본 영상의 시각적 특징과 유사도가 가장 높은 시각적 특징에 대응되는 스케일 팩터를 결정할 수 있다(S430). 여기서, 유사도가 가장 높다는 것은, 그램 매트릭스 차이의 평균이 최소임을 의미한다. 즉, 영상처리장치는 복수의 스케일 팩터 중 원본 영상의 시각적 특징과 그램 매트릭스 차이의 평균이 최소인 시각적 특징에 대응되는 스케일 팩터를 이후 입력된 영상의 축소에 이용할 스케일 팩터로 결정할 수 있다.
한편, 실제 구현시에는 이상의 과정을 여러 번 반복하는 기계 학습을 통하여 원본 영상과 유사한 고화질 영상을 생성하는데 가장 적합한 스케일 팩터를 결정할 수 있다.
그 다음, 영상처리장치는 결정된 스케일 팩터를 저장할 수 있다(S440). 한편, 경우에 따라 스케일 팩터를 저장하는 과정은 생략될 수 있다.
한편, 이상에서는 입력된 저화질 영상을 축소하는데 사용되는 기설정된 스케일 팩터가 영상처리장치에서 수행되는 것으로 기재하였으나, 실제로는 서버와 같은 외부 장치에서 상기 과정이 수행될 수 있으며, 영상처리장치가 외부 장치에서 결정된 스케일 팩터를 수신하여 이용하는 형태로 구현될 수도 있다.
이상에 기재한 바와 같이 반복적으로 원본 영상과 비교하는 기계 학습을 통하여, 원본 영상과 가장 유사한 고화질 영상을 생성할 수 있는 스케일 팩터를 결정함으로써, 이후 저화질 영상 입력시 외부 데이터베이스를 사용하지 않고 질감이 가장 잘 표현된 고화질 영상을 생성할 수 있게 된다.
도 5는 본 개시의 다른 실시 예에 따른 스케일 팩터 결정 방법을 나타내는 흐름도이다. 여기서, 도 5에 도시되지는 않았지만, 우선적으로 영상처리장치는 영상의 열화 정도에 대응되는 스케일 팩터를 룩업테이블로 저장하는 단계를 더 포함할 수 있다.
도 5를 참조하면, 영상처리장치는 입력 영상에 화질 향상을 위한 전처리를 수행할 수 있다(S510). 구체적으로, 영상처리장치는 기존 영상의 업스케일링 방식을 이용하여 입력된 영상에 전처리를 수행할 수 있다. 예를 들어, 영상처리장치는 영상의 신호 변화에 기초하여 에지를 검출하고, 검출된 영역의 폭을 줄이거나 세기를 증가시켜, 보다 선명한 에지를 포함하도록 영상을 처리할 수 있다. 이는 일 실시 예에 불과하며, 영상처리장치는 다양한 방식으로 입력된 영상의 화질을 향상시키는 전처리를 수행할 수 있다.
그 다음, 영상처리장치는 입력 영상과 비교하여 전처리된 영상의 화질 개선률을 측정할 수 있다(S520). 구체적으로, 영상처리장치는 입력 영상의 화질 성능과 전처리된 영상의 화질 성능을 비교하여, 전처리된 영상의 화질 개선률을 측정할 수 있다.
그 다음, 영상처리장치는 입력 영상의 화질 열화 정도를 결정할 수 있다(S530). 구체적으로, 영상처리장치는 측정된 전처리된 영상의 화질 개선률을 이용하여 입력 영상의 화질 열화 정도를 결정할 수 있다. 예를 들어, 영상처리장치는 전처리된 영상의 화질 개선률이 좋을수록, 입력 영상의 화질 열화 정도가 심한 것으로 결정할 수 있다.
그 다음, 영상처리장치는 결정된 화질 열화 정도에 대응되는 스케일 팩터를 결정할 수 있다(S540). 구체적으로, 영상처리장치는 저장된 룩업테이블에서 결정된 화질 열화 정도에 대응되는 스케일 팩터를 입력된 영상의 축소에 이용할 스케일 팩터로 결정할 수 있다.
이상에 기재한 바와 같이, 다양한 입력 영상의 다양한 화질 열화 정도에 따라 스케일 팩터를 결정함으로써, 외부 데이터베이스를 사용하지 않고도 질감이 가장 잘 표현된 고화질 영상을 생성할 수 있게 된다.
도 6은 본 개시의 일 실시 예에 따라 영역이 분류된 영상을 설명하기 위한 도면이다.
도 6을 참조하면, 입력된 영상(60)의 예시는 풀밭(61)에 서 있는 얼룩말(62)을 포함하고 있다. 구체적으로, 입력된 영상(60)은, 에지가 많고 명확한 구분이 어려우므로, 영상 신호가 고주파인 영역인 풀밭(61) 영역과 상대적으로 에지가 선명하므로 영상 신호가 저주파인 영역인 얼룩말(62) 영역을 포함할 수 있다.
이 경우, 영상처리장치는 입력된 영상(60)의 일부 영역에만 축소된 영상으로부터 추출된 시각적 특징을 반영하여 고화질 영상을 생성할 수 있다. 구체적으로, 영상처리장치는 영상 신호가 고주파인 영역과 상대적으로 저주파인 영역을 구분하여 각각 다른 영상 처리를 수행할 수 있다. 이에 대해서는 이하 도 7을 참조하여 자세히 설명한다.
도 7은 도 6에 도시된 도면의 영상처리방법을 설명하기 위한 흐름도이다.
도 7을 참조하면, 우선 영상처리장치는 입력된 영상을 영상 신호의 주파수에 따라 복수의 영역으로 구분할 수 있다. 구체적으로, 영상처리장치는 입력된 영상의 영상 신호의 주파수가 기설정된 값 이상인지 판단할 수 있다(S701).
영상 신호의 주파수가 기설정된 값 이상인 영역으로 판단되면(S701-Y), 영상처리장치는 입력된 영상을 축소할 수 있다(S702). 이때, 영상처리장치는 기설정된 스케일 팩터 또는 입력된 영상의 열화 정도에 따라 결정된 스케일 팩터를 이용하여 입력된 영상을 축소할 수 있다.
한편, 도시되지는 않았지만, 영상처리장치는 입력된 영상의 화질을 향상하는 전처리를 수행한 후 전처리된 영상을 축소할 수도 있다.
그 다음, 영상처리장치는 축소된 영상에서 시각적 특징을 추출할 수 있다(S703). 이에 대한 구체적인 설명은 도 1 및 도 3에 의한 설명에 이미 기재된 바, 중복된 설명은 생략한다.
한편, 영상처리장치는 영상 신호의 주파수가 기설정된 값 미만인 영역으로 판단되면(S701-N), 영상처리장치는 입력된 영상의 화질을 향상하는 처리를 수행할 수 있다(S704).
그 다음, 영상처리장치는 화질 향상 처리된 영상에서 시각적 특징을 추출할 수 있다(S705). 이에 대한 구체적인 동작은 축소된 영상에서 시각적 특징을 추출하는 동작과 실질적으로 동일한 바, 중복된 설명은 생략한다.
그 다음, 영상처리장치는 입력된 영상에 추출된 시각적 특징을 반영하여 고화질 영상을 생성할 수 있다(S706). 구체적으로, 영상처리장치는 입력된 영상 중 영상 신호의 주파수가 기설정된 주파수 이상인 영역에 대해서는 축소된 영상에서 추출된 시각적 특징을 적용하고, 입력된 영상 중 영상 신호의 주파수가 기설정된 주파수 미만인 영역에 대해서는 화질 향상 처리된 영상에서 추출된 시각적 특징을 적용할 수 있다.
한편, 이상에서는 입력된 영상을 두 영역으로 분류하여 스케일 팩터를 적용 또는 미적용하는 형태로 영상을 처리하였으나, 실제 구현시에는, 각각 다른 스케일 팩터를 적용하는 형태로 구현될 수도 있으며, 입력된 영상을 세 영역 이상으로 분류하여 영상을 처리할 수도 있다.
또한, 프레임 별로 다른 스케일 팩터를 적용하는 형태로 구현될 수도 있을 것이다.
이상에 기재한 바와 같이, 영상의 특징에 따라 다양한 스케일 팩터를 적용함으로써, 질감을 나타내는 텍스쳐 영역과 비 텍스쳐 영역이 혼합된 저화질 영상이 입력되더라도 전체적으로 보다 고화질인 영상을 생성할 수 있게 된다.
이상에 기재한 다양한 실시 예에 따라, 외부 데이터베이스 없이 저화질 영상을 축소하여 추출된 시각적 특징을 이용하여 고화질 영상을 생성할 수 있어 업스케일링에 사용되는 메모리 및 시간이 감소될 수 있다. 그리고, 기존 고주파 영역으로 구성되어 업스케일링 효과가 미미했던 텍스쳐 영역의 화질 또한 향상되는 효과를 기대할 수 있다.
한편, 이상에서 설명된 다양한 실시 예들은 소프트웨어(software), 하드웨어(hardware) 또는 이들의 조합된 것을 이용하여 컴퓨터(computer) 또는 이와 유사한 장치로 읽을 수 있는 기록 매체 내에서 구현될 수 있다. 하드웨어적인 구현에 의하면, 본 개시에서 설명되는 실시 예들은 ASICs(Application Specific Integrated Circuits), DSPs(digital signal processors), DSPDs(digital signal processing devices), PLDs(programmable logic devices), FPGAs(field programmable gate arrays), 프로세서(processors), 제어기(controllers), 마이크로 컨트롤러(micro-controllers), 마이크로 프로세서(microprocessors), 기타 기능 수행을 위한 전기적인 유닛(unit) 중 적어도 하나를 이용하여 구현될 수 있다. 일부의 경우에 본 명세서에서 설명되는 실시 예들이 프로세서(120) 자체로 구현될 수 있다. 소프트웨어적인 구현에 의하면, 본 명세서에서 설명되는 절차 및 기능과 같은 실시 예들은 별도의 소프트웨어 모듈들로 구현될 수 있다. 상기 소프트웨어 모듈들 각각은 본 명세서에서 설명되는 하나 이상의 기능 및 작동을 수행할 수 있다.
한편, 상술한 본 개시의 다양한 실시 예들에 따른 디스플레이 장치의 제어방법은 비일시적 판독 가능 매체(non-transitory readable medium) 에 저장될 수 있다. 이러한 비일시적 판독 가능 매체는 다양한 장치에 탑재되어 사용될 수 있다.
비일시적 판독 가능 매체란 레지스터, 캐쉬, 메모리 등과 같이 짧은 순간 동안 데이터를 저장하는 매체가 아니라 반영구적으로 데이터를 저장하며, 기기에 의해 판독(reading)이 가능한 매체를 의미한다. 구체적으로는, 상술한 다양한 방법을 수행하기 위한 프로그램들은 CD, DVD, 하드 디스크, 블루레이 디스크, USB, 메모리카드, ROM 등과 같은 비일시적 판독 가능 매체에 저장되어 제공될 수 있다.
또한, 이상에서는 본 개시의 바람직한 실시 예에 대하여 도시하고 설명하였지만, 본 개시는 상술한 특정의 실시 예에 한정되지 아니하며, 청구범위에서 청구하는 본 개시의 요지를 벗어남이 없이 당해 개시가 속하는 기술분야에서 통상의 지식을 가진자에 의해 다양한 변형실시가 가능한 것은 물론이고, 이러한 변형실시들은 본 개시의 기술적 사상이나 전망으로부터 개별적으로 이해되어서는 안될 것이다.

Claims (15)

  1. 영상처리장치에 있어서,
    영상을 입력받는 입력부; 및
    상기 입력된 영상을 축소하여 시각적 특징을 추출하고, 상기 입력된 영상에 상기 추출된 시각적 특징을 반영하여 고화질 영상을 생성하는 프로세서;를 포함하는 영상처리장치.
  2. 제1항에 있어서,
    상기 프로세서는,
    기설정된 스케일 팩터를 이용하여 상기 입력된 영상을 축소하는 영상처리장치.
  3. 제1항에 있어서,
    상기 프로세서는,
    상기 입력된 영상의 화질을 향상시키기 위한 전처리를 수행하고, 상기 전처리된 영상에 상기 전처리된 영상을 축소하여 추출한 시각적 특징을 반영하여 상기 고화질 영상을 생성하는 영상처리장치.
  4. 제3항에 있어서,
    영상의 복수의 열화 정도에 대응되는 복수의 스케일 팩터를 저장하는 저장부;를 더 포함하고,
    상기 프로세서는,
    상기 입력된 영상과 비교하여 측정된, 상기 전처리된 영상의 화질 개선률에 기초하여 상기 입력된 영상의 열화 정도를 결정하고, 상기 저장된 복수의 스케일 팩터 중 상기 결정된 열화 정도에 대응되는 스케일 팩터를 이용하여 상기 입력된 영상을 축소하는 영상처리장치.
  5. 제1항에 있어서,
    상기 프로세서는,
    복수의 상기 축소된 영상을 상기 입력된 영상의 크기에 대응되도록 배열하고, 상기 배열된 영상에서 시각적 특징을 추출하는 영상처리장치.
  6. 제1항에 있어서,
    상기 프로세서는,
    상기 입력된 영상 중 일부 영역에만 상기 추출된 시각적 특징을 반영하여 고화질 영상을 생성하는 영상처리장치.
  7. 제6항에 있어서,
    상기 일부 영역은,
    영상 신호의 주파수가 기설정된 값 이상인 영상처리장치.
  8. 제1항에 있어서,
    상기 생성된 고화질 영상을 표시하는 디스플레이부;를 더 포함하는 영상처리장치.
  9. 제1항에 있어서,
    상기 생성된 고화질 영상을 디스플레이 장치에 전송하는 통신부;를 더 포함하는 영상처리장치.
  10. 영상처리방법에 있어서,
    영상을 입력받는 단계;
    상기 입력된 영상을 축소하는 단계;
    상기 축소된 영상에서 시각적 특징을 추출하는 단계; 및
    상기 입력된 영상에 상기 추출된 시각적 특징을 반영하여 고화질 영상을 생성하는 단계;를 포함하는 영상처리방법.
  11. 제10항에 있어서,
    상기 축소하는 단계는,
    기설정된 스케일 팩터를 이용하여 상기 입력된 영상을 축소하는 영상처리방법.
  12. 제10항에 있어서,
    상기 입력된 영상의 화질을 향상시키기 위한 전처리를 수행하는 단계;를 더 포함하고,
    상기 축소하는 단계는,
    상기 전처리된 영상을 축소하는 영상처리방법.
  13. 제12항에 있어서,
    영상의 복수의 열화 정도에 대응되는 복수의 스케일 팩터를 저장하는 단계;를 더 포함하고,
    상기 축소하는 단계는,
    상기 입력된 영상과 비교하여 측정된, 상기 화질 향상된 영상의 화질 개선률에 기초하여 상기 입력된 영상의 열화 정도를 결정하고, 상기 저장된 복수의 스케일 팩터 중 상기 결정된 열화 정도에 대응되는 스케일 팩터를 이용하여 상기 입력된 영상을 축소하는 영상처리방법.
  14. 제10항에 있어서,
    상기 추출하는 단계는,
    복수의 상기 축소된 영상을 상기 입력된 영상의 크기에 대응되도록 배열하고, 상기 배열된 영상에서 시각적 특징을 추출하는 영상처리방법.
  15. 제10항에 있어서,
    상기 생성하는 단계는,
    상기 입력된 영상 중 일부 영역에만 상기 추출된 시각적 특징을 반영하여 고화질 영상을 생성하는 영상처리방법.
PCT/KR2017/011932 2016-10-26 2017-10-26 영상처리장치, 영상처리방법 및 컴퓨터 판독가능 기록 매체 WO2018080204A1 (ko)

Priority Applications (3)

Application Number Priority Date Filing Date Title
EP17866051.0A EP3511899A1 (en) 2016-10-26 2017-10-26 Image processing apparatus, image processing method, and computer-readable recording medium
US16/345,616 US11257186B2 (en) 2016-10-26 2017-10-26 Image processing apparatus, image processing method, and computer-readable recording medium
CN201780066614.1A CN109891459B (zh) 2016-10-26 2017-10-26 图像处理装置及图像处理方法

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2016-0140237 2016-10-26
KR1020160140237A KR102384234B1 (ko) 2016-10-26 2016-10-26 영상처리장치, 영상처리방법 및 컴퓨터 판독가능 기록 매체

Publications (1)

Publication Number Publication Date
WO2018080204A1 true WO2018080204A1 (ko) 2018-05-03

Family

ID=62023755

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2017/011932 WO2018080204A1 (ko) 2016-10-26 2017-10-26 영상처리장치, 영상처리방법 및 컴퓨터 판독가능 기록 매체

Country Status (5)

Country Link
US (1) US11257186B2 (ko)
EP (1) EP3511899A1 (ko)
KR (1) KR102384234B1 (ko)
CN (1) CN109891459B (ko)
WO (1) WO2018080204A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210166348A1 (en) * 2019-11-29 2021-06-03 Samsung Electronics Co., Ltd. Electronic device, control method thereof, and system

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102442449B1 (ko) 2017-09-01 2022-09-14 삼성전자주식회사 영상 처리 장치, 영상 처리 방법 및 컴퓨터 판독가능 기록 매체
CN112488916B (zh) * 2019-09-12 2023-12-26 武汉Tcl集团工业研究院有限公司 一种图像超分重建模型的训练方法和计算机设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110049570A (ko) * 2009-11-05 2011-05-12 홍익대학교 산학협력단 경계선 성분 분류 기반 신경회로망 모델을 이용한 영상 화질 개선방법
KR20140028516A (ko) * 2012-08-29 2014-03-10 주식회사 실리콘웍스 학습방식의 부화소기반 영상축소방법
KR20150004167A (ko) * 2013-07-02 2015-01-12 삼성전자주식회사 영상 화질 개선 방법, 장치 및 기록 매체
KR20150129897A (ko) * 2014-05-12 2015-11-23 주식회사 칩스앤미디어 이미지 패치를 이용한 해상도 스케일링 장치 및 그 방법
KR20160033419A (ko) * 2014-09-18 2016-03-28 삼성전자주식회사 영상 처리 장치 및 영상 처리 장치의 제어 방법

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101174130B1 (ko) 2005-08-03 2012-08-14 삼성전자주식회사 초해상도 향상 처리장치 및 방법
CN102238314B (zh) * 2006-04-28 2013-06-12 松下电器产业株式会社 视觉处理装置、视觉处理方法、程序、存储介质、显示装置及集成电路
JP5092469B2 (ja) * 2007-03-15 2012-12-05 ソニー株式会社 撮像装置、画像処理装置、および画像表示制御方法、並びにコンピュータ・プログラム
JP4382837B2 (ja) * 2007-06-07 2009-12-16 シャープ株式会社 表示システムおよび画像処理装置
WO2010122502A1 (en) * 2009-04-20 2010-10-28 Yeda Research And Development Co. Ltd. Super-resolution from a single signal
JP5397190B2 (ja) * 2009-11-27 2014-01-22 ソニー株式会社 画像処理装置、画像処理方法、およびプログラム
KR101632917B1 (ko) 2010-02-08 2016-07-04 삼성전자주식회사 고화질 영상 획득을 위한 학습 기반 고해상도 향상 장치 및 방법
JP5706177B2 (ja) * 2010-02-09 2015-04-22 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America 超解像処理装置及び超解像処理方法
JP5159844B2 (ja) * 2010-09-03 2013-03-13 株式会社東芝 画像処理装置
KR20120088350A (ko) 2011-01-31 2012-08-08 한국전자통신연구원 고해상도 영상 생성 장치
US8687923B2 (en) * 2011-08-05 2014-04-01 Adobe Systems Incorporated Robust patch regression based on in-place self-similarity for image upscaling
US8483516B2 (en) 2011-08-16 2013-07-09 National Taiwan University Super resolution system and method with database-free texture synthesis
EP2680221B1 (en) 2012-06-28 2016-05-11 Alcatel Lucent Method and system for generating a high-resolution video stream
WO2015180053A1 (zh) * 2014-05-28 2015-12-03 北京大学深圳研究生院 一种快速超分辨率图像重建方法和装置
WO2016132153A1 (en) * 2015-02-19 2016-08-25 Magic Pony Technology Limited Offline training of hierarchical algorithms
CN108027962B (zh) * 2016-04-01 2020-10-09 华为技术有限公司 一种图像处理方法、电子设备以及存储介质
KR102271285B1 (ko) * 2016-11-09 2021-07-01 삼성전자주식회사 영상처리장치 및 영상처리방법

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110049570A (ko) * 2009-11-05 2011-05-12 홍익대학교 산학협력단 경계선 성분 분류 기반 신경회로망 모델을 이용한 영상 화질 개선방법
KR20140028516A (ko) * 2012-08-29 2014-03-10 주식회사 실리콘웍스 학습방식의 부화소기반 영상축소방법
KR20150004167A (ko) * 2013-07-02 2015-01-12 삼성전자주식회사 영상 화질 개선 방법, 장치 및 기록 매체
KR20150129897A (ko) * 2014-05-12 2015-11-23 주식회사 칩스앤미디어 이미지 패치를 이용한 해상도 스케일링 장치 및 그 방법
KR20160033419A (ko) * 2014-09-18 2016-03-28 삼성전자주식회사 영상 처리 장치 및 영상 처리 장치의 제어 방법

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP3511899A4 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210166348A1 (en) * 2019-11-29 2021-06-03 Samsung Electronics Co., Ltd. Electronic device, control method thereof, and system
US11978178B2 (en) * 2019-11-29 2024-05-07 Samsung Electronics Co., Ltd. Electronic device, control method thereof, and system

Also Published As

Publication number Publication date
KR20180045645A (ko) 2018-05-04
US20190272621A1 (en) 2019-09-05
EP3511899A4 (en) 2019-07-17
CN109891459B (zh) 2023-06-30
KR102384234B1 (ko) 2022-04-07
EP3511899A1 (en) 2019-07-17
US11257186B2 (en) 2022-02-22
CN109891459A (zh) 2019-06-14

Similar Documents

Publication Publication Date Title
WO2018088806A1 (ko) 영상처리장치 및 영상처리방법
WO2019164232A1 (ko) 전자 장치, 이의 영상 처리 방법 및 컴퓨터 판독가능 기록 매체
WO2020017875A1 (en) Electronic apparatus, method for processing image and computer-readable recording medium
EP3649612A1 (en) Image processing apparatus, method for processing image and computer-readable recording medium
WO2019164239A1 (ko) 전자 장치, 영상 처리 방법 및 컴퓨터 판독가능 기록 매체
WO2018080204A1 (ko) 영상처리장치, 영상처리방법 및 컴퓨터 판독가능 기록 매체
WO2019066273A1 (ko) 전자칠판 및 그 제어방법
US11006108B2 (en) Image processing apparatus, method for processing image and computer-readable recording medium
WO2022108008A1 (en) Electronic apparatus and controlling method thereof
KR20200036092A (ko) 전자 장치 및 그 제어 방법
CN113902760B (zh) 视频分割中物体边缘优化方法、***、装置及存储介质
WO2024090745A1 (ko) 전자 장치 및 그 터치 좌표 획득 방법
CN111679737B (zh) 手部分割方法和电子设备
TWI715252B (zh) 電子裝置及其利用觸控資料的物件資訊辨識方法
WO2024014870A1 (en) Method and electronic device for interactive image segmentation
WO2022131617A1 (ko) 필기 입력을 처리하는 전자 장치 및 그 작동 방법
CN116797955A (zh) 目标区域识别方法、装置、终端和存储介质
CN114067322A (zh) 图像文字检测方法、***及电子设备
CN115238884A (zh) 图像处理方法、装置、存储介质、设备以及模型训练方法

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 17866051

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2017866051

Country of ref document: EP

Effective date: 20190410

NENP Non-entry into the national phase

Ref country code: DE