WO2023075335A1 - 복수의 렌즈들을 구비하는 전자 장치 및 그 제어 방법 - Google Patents

복수의 렌즈들을 구비하는 전자 장치 및 그 제어 방법 Download PDF

Info

Publication number
WO2023075335A1
WO2023075335A1 PCT/KR2022/016279 KR2022016279W WO2023075335A1 WO 2023075335 A1 WO2023075335 A1 WO 2023075335A1 KR 2022016279 W KR2022016279 W KR 2022016279W WO 2023075335 A1 WO2023075335 A1 WO 2023075335A1
Authority
WO
WIPO (PCT)
Prior art keywords
camera
image
processor
view
angle
Prior art date
Application number
PCT/KR2022/016279
Other languages
English (en)
French (fr)
Inventor
오양근
윤성욱
손병준
안성주
박지윤
Original Assignee
삼성전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자 주식회사 filed Critical 삼성전자 주식회사
Priority to US18/150,010 priority Critical patent/US20230156337A1/en
Publication of WO2023075335A1 publication Critical patent/WO2023075335A1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/63Control of cameras or camera modules by using electronic viewfinders
    • H04N23/631Graphical user interfaces [GUI] specially adapted for controlling image capture or setting capture parameters
    • H04N23/632Graphical user interfaces [GUI] specially adapted for controlling image capture or setting capture parameters for displaying or modifying preview images prior to image capturing, e.g. variety of image resolutions or capturing parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/69Control of means for changing angle of the field of view, e.g. optical zoom objectives or electronic zooming
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/695Control of camera direction for changing a field of view, e.g. pan, tilt or based on tracking of objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/62Extraction of image or video features relating to a temporal dimension, e.g. time-based feature extraction; Pattern tracking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/52Surveillance or monitoring of activities, e.g. for recognising suspicious objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/45Cameras or camera modules comprising electronic image sensors; Control thereof for generating image signals from two or more image sensors being of different type or operating in different modes, e.g. with a CMOS sensor for moving images in combination with a charge-coupled device [CCD] for still images
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/50Constructional details
    • H04N23/55Optical parts specially adapted for electronic image sensors; Mounting thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/57Mechanical or electrical details of cameras or camera modules specially adapted for being embedded in other devices
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/61Control of cameras or camera modules based on recognised objects
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/61Control of cameras or camera modules based on recognised objects
    • H04N23/611Control of cameras or camera modules based on recognised objects where the recognised objects include parts of the human body
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/63Control of cameras or camera modules by using electronic viewfinders
    • H04N23/631Graphical user interfaces [GUI] specially adapted for controlling image capture or setting capture parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/63Control of cameras or camera modules by using electronic viewfinders
    • H04N23/633Control of cameras or camera modules by using electronic viewfinders for displaying additional information relating to control or operation of the camera
    • H04N23/635Region indicators; Field of view indicators
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/90Arrangement of cameras or camera modules, e.g. multiple cameras in TV studios or sports stadiums
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/222Studio circuitry; Studio devices; Studio equipment
    • H04N5/262Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
    • H04N5/268Signal distribution or switching
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/18Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast
    • H04N7/181Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast for receiving images from a plurality of remote sources

Definitions

  • the present disclosure relates to an electronic device including a plurality of cameras and a method performed by the electronic device.
  • An electronic device equipped with a camera such as a digital camera, a digital camcorder, or a smart phone, is being actively spread.
  • An electronic device equipped with such a camera has a function of tracking a person, animal, object, etc. in an image being photographed using the camera, and displaying the tracked area in a designated size.
  • an electronic device equipped with a camera detects a region of interest such as a person, animal, or object in an image being captured using the camera in real time, and zooms in/out based on the detection result to reduce the region of interest to a designated size. It is equipped with a function that allows it to be displayed.
  • a single camera can track an object and display it on the screen, but when multiple cameras are used, it may be difficult to naturally track the same object according to camera switching. Due to a difference in field of view and a difference in an area to which a zoom operation is applied, screen disconnection may occur during conversion. Also, when an object is manually selected again, screen transitions may not be natural.
  • An aspect of the present disclosure is to address at least the problems and/or disadvantages noted above and provide at least the advantages noted below. Accordingly, an aspect of the present disclosure is to provide an apparatus, method, and the like in which the same object is continuously tracked even when a camera is switched, and auto framing continuously continues.
  • An electronic device includes a plurality of cameras, a display, and at least one processor, wherein the at least one processor executes an application supporting photography using the plurality of cameras, and the plurality of cameras
  • a first image having a first angle of view is obtained through a first camera among the images, and a preview using the first image is displayed on the display in a state in which the magnification of the photographing is set to the first magnification, and the first image is displayed.
  • a preview using the first image displayed on the display is changed to include the at least one object, and the at least one object is located in a designated area of the first view angle.
  • the magnification of the photographing is changed to a second magnification, and a second image having a second angle of view is acquired through a second camera among the plurality of cameras, wherein the second magnification is the first angle of view, It is determined based on the second view angle and the position of the at least one object with respect to the first view angle, and at least a part of the second image is displayed as a preview on the display in a state in which the magnification of the photographing is set to the second magnification. can be displayed
  • An operating method of an electronic device includes an operation of executing an application supporting photography using a plurality of cameras, and an operation of obtaining a first image having a first angle of view through a first camera among the plurality of cameras. , Displaying a preview using the first image on a display in a state in which the magnification of the photographing is set to the first magnification, including at least one object identified in the first image as it moves. An operation of changing a preview using the first image displayed on the display as much as possible, and an operation of changing the magnification of the photographing to a second magnification based on the location of the at least one object in a designated area of the first view angle.
  • FIG. 1 is a block diagram of an electronic device according to an exemplary embodiment.
  • FIG. 2 illustrates a concept of controlling a function for displaying a preview image by switching a camera in an electronic device according to an embodiment.
  • FIG. 3 is a flowchart of an operation of switching a camera according to movement of an object by an electronic device according to an exemplary embodiment.
  • FIG. 4 is a flowchart of an operation of switching a camera when an object is located in a designated area by an electronic device according to an exemplary embodiment.
  • FIG. 5 is a flowchart of an operation of an electronic device tracking the same object in a first camera and a second camera according to an embodiment.
  • 6A illustrates a transition area at a first view angle when the view angle of a first camera is smaller than the view angle of a second camera in an electronic device according to an embodiment.
  • 6B illustrates a transition area at a first view angle when the view angle of the first camera is greater than the view angle of the second camera in the electronic device according to an embodiment.
  • FIG. 7 is a flowchart of an operation of obtaining category information of an object tracked by a first camera in an electronic device according to an embodiment.
  • 8A and 8B illustrate extracting zoom information according to movement of an object when the angle of view of a first camera is smaller than that of a second camera in an electronic device according to an embodiment.
  • 9A and 9B illustrate extraction of zoom information according to movement of an object when the angle of view of a first camera is greater than that of a second camera in an electronic device according to an embodiment.
  • FIG. 10 is a flowchart illustrating tracking of the same object by a second camera based on category information of the object being tracked by the electronic device according to an embodiment.
  • 11A is a flowchart illustrating tracking of the same object by a second camera when the object to be tracked by the electronic device is a person according to an embodiment.
  • 11B is a flowchart illustrating tracking of the same object by a second camera when the object to be tracked by the electronic device is an animal, according to an embodiment.
  • FIG. 12 is a flowchart illustrating recalculation of a zoom area in an electronic device according to an exemplary embodiment.
  • 13A illustrates that a second ROI is determined when an angle of view of a first camera is smaller than an angle of view of a second camera in an electronic device according to an embodiment.
  • 13B illustrates that a second ROI is determined when the angle of view of the first camera is greater than the angle of view of the second camera in the electronic device according to an embodiment.
  • FIG. 14 is a block diagram of an electronic device in a network environment according to an embodiment.
  • 15 is a block diagram illustrating a camera module, according to an embodiment.
  • FIG. 1 is a block diagram of an electronic device according to an exemplary embodiment.
  • an electronic device 100 may include a processor 110, a camera 120, a display 130, and a memory 140.
  • the electronic device 100 may include additional components in addition to the components shown in FIG. 1 or may omit at least one of the components shown in FIG. 1 .
  • the processor 110 may execute calculations or data processing related to control and/or communication of at least one other element of the electronic device 100 using instructions stored in the memory 140 .
  • the processor 110 may include a central processing unit (CPU), a graphics processing unit (GPU), a micro controller unit (MCU), a sensor hub, a supplementary processor, a communication processor, and an application. It may include at least one of a processor, an application specific integrated circuit (ASIC), and a field programmable gate array (FPGA), and may have a plurality of cores.
  • CPU central processing unit
  • GPU graphics processing unit
  • MCU micro controller unit
  • ASIC application specific integrated circuit
  • FPGA field programmable gate array
  • the processor 110 may obtain an image through the camera 120 .
  • the processor 110 may provide an image acquired through the camera 120 to the display 130 in the form of a preview.
  • the processor 110 may obtain a plurality of image frames using the camera 120 .
  • the processor 110 may use the camera 120 to identify at least one object included in a plurality of image frames, or to estimate or track a motion of the object. For example, the processor 110 may identify in the current frame the same object as at least one object identified in the previous frame and track the movement of the object.
  • the processor 110 may switch the camera 120 based on the size and/or coordinates of the object to be tracked. For example, the processor 110 may switch from a camera with a large angle of view to a camera with a small angle of view when it is determined that zooming in is required based on the size and/or coordinates of the object to be tracked. Also, for example, the processor 110 may switch from a camera with a small angle of view to a camera with a large angle of view when it is determined that zooming out is required based on the size and/or coordinates of the object being tracked. Switching from one camera to another camera may include switching from using a camera to preview to using another camera to preview, switching from using a camera to capture an image to using another camera to capture the image.
  • switching from using a camera for an image processing function e.g. tracking
  • switching to using another camera and switching from using the camera to perform an operation by the processor to using another camera to perform an operation by the processor.
  • the camera 120 may acquire (or capture) images (eg, still images and moving images).
  • the image signal processor electrically connected to the camera 120 can distinguish objects (eg, people, animals, objects) included in an image (eg, a preview image or an image stored in the memory 140) and a background.
  • the image signal processor may be separated from the camera 120 or implemented as part of the processor 110 .
  • the camera 120 may include an image sensor (eg, the image sensor 1530 of FIG. 15 ).
  • the image sensor may acquire and/or process color information.
  • the camera 120 may include a plurality of lenses, and each of the plurality of lenses may have different zoom levels.
  • the plurality of lenses may include at least two of an ultra-wide lens, a wide lens, and a tele lens.
  • the camera 120 may include a first camera 121 and a second camera 122 .
  • the first camera 121 and the second camera 122 may have different lenses.
  • the first camera 121 may have a wide lens and the second camera 122 may have an ultra wide lens.
  • the first camera 121 may have an ultra wide lens and the second camera 122 may have a wide lens.
  • the first camera 121 may have a tele lens and the second camera 122 may have a wide lens.
  • the first camera 121 may have a wide lens and the second camera 122 may have a tele lens.
  • the display 130 may display a first image having a first angle of view obtained through the first camera 121 of the cameras 120 . According to an embodiment, the display 130 may display a preview of a first image having a first view angle in a state in which a photographing magnification is set to the first magnification. According to an embodiment, the display 130 may display a second image having a second angle of view acquired through the second camera 122 of the cameras 120 . According to an embodiment, the display 130 may display a preview of a second image having a second view angle in a state in which a photographing magnification is set to the second magnification.
  • the display 130 may generate a driving signal by converting an image signal, a data signal, an on screen display (OSD) signal, a control signal, and the like processed by the processor 110 .
  • the display 130 may be implemented as a plasma display panel (PDP), liquid crystal display (LCD), organic light emitting diode (OLED), flexible display, etc. It can be implemented as a display (3D display).
  • the display 130 is composed of a touch screen and can be used as an input device in addition to an output device.
  • the memory 140 may mean one or more memory sets. According to an embodiment, the memory 140 may store data and/or commands received from or generated by other components (eg, the processor 110 or the display 130).
  • FIG. 2 illustrates a concept of controlling a function for displaying a preview image by switching a camera in an electronic device according to an embodiment.
  • an application 200 supporting shooting using a plurality of cameras in an electronic device 100 includes an object detection and tracking module 210, a zoom area calculation module 220, and camera switching. Determination module 230, tracking information and zoom information extraction module 240, tracking information and zoom information delivery module 250, object re-tracking module 260, zoom area matching and recalculation module 270, and camera switching module (280).
  • the electronic device 100 may include additional components other than those shown in FIG. 2 or may omit at least one of the components shown in FIG. 2 .
  • the object detection and tracking module 210 may operate in an object detection mode and/or tracking mode. According to an embodiment, the object detection and tracking module 210 automatically detects an object (or object) in a preview of an image acquired by the camera 120 in the object detection mode or receives a user input (e.g. : in response to receiving a touch input). According to one embodiment, the object detection and tracking module 210 may track the detected object. According to an embodiment, the object detection and tracking module 210 may detect (or identify) a face of a person, a part or all of the body, an animal or an object as an object, and one or a plurality of objects to be tracked may be detected. there is. According to an embodiment, the object detection and tracking module 210 detects (or identifies) a human face, a part or the whole body, an animal, or an object as an object in response to receiving a user input (eg, a touch input). can
  • the object detection and tracking module 210 may continuously track at least one object detected in the tracking mode and transmit the coordinates of the at least one object to the zoom area calculation module 220 . For example, when there are a plurality of detected objects, the object detection and tracking module 210 may transfer the coordinates of each object to the zoom area calculation module 220 .
  • the zoom area calculation module 220 may calculate an area to be zoomed in or zoomed out based on the coordinates of at least one object transmitted from the object detection and tracking module 210 .
  • a zoom area may refer to an area displayed on the display 130 after zoom-in or zoom-out is applied.
  • a zoom region may be referred to as a region of interest (ROI).
  • the zoom area may be a partial area within the preview, and a zoom-out effect may occur on the display 130 as the zoom area becomes larger.
  • a zoom-in effect may occur on the display 130 .
  • the zoom area may be an area including coordinates of all objects or an area including only some objects.
  • the zoom area may be the entire preview area or a partial area.
  • some objects may be excluded from the zoom area according to object coordinate positions in the preview. For example, when the location of object coordinates is in an outer area within the preview, the object may be excluded from the zoom area.
  • the outer area within the preview may be determined as a specific percentage of the entire preview area.
  • the minimum size of the zoom area may be determined as a size that minimizes image degradation.
  • the minimum size of the zoom area may be determined as a predetermined ratio of the entire preview area.
  • the camera changeover determination module 230 may operate according to the size and coordinates of the object being tracked, and the size and position of the zoom area. According to an embodiment, there is a minimum size of a zoom region for each camera lens that minimizes deterioration in image quality, and there is an area within a preview in which the zoom region can be moved.
  • the camera switch determination module 230 determines whether the object being tracked moves to an outer area within the preview, whether the size of the zoom area is the same as the size of the preview, or whether the size of the zoom area is greater than or equal to a specified size. can judge According to an embodiment, the camera changeover determination module 230 is configured to determine whether the object being tracked moves to an outer area within the preview, when the size of the zoom area is the same as the size of the preview, or when the size of the zoom area is greater than or equal to a specified size, the size of the current camera is larger than that of the current camera. It can be judged that it is necessary to switch to a camera with a wide angle of view.
  • the camera switching determination module 230 may determine whether the tracked object exists in an area where the preview of the first camera and the preview of the second camera overlap, whether the area of the zoom area is the minimum size, or whether the area of the zoom area is the minimum size or zoom area. It may be determined whether the size of the region is less than a threshold. According to an embodiment, an area where the preview of the first camera and the preview of the second camera overlap may be obtained through calibration information.
  • the camera switching determination module 230 determines that the area of the zoom area is the minimum size when the tracked object exists in an area where the preview of the first camera and the preview of the second camera overlap. It can be judged that it is necessary to switch to a camera with a narrower angle of view than the current camera. According to an embodiment, the camera switching determination module 230 determines that the size of the zoom area is less than a threshold value when the tracked object exists in an area where the preview of the first camera and the preview of the second camera overlap. It can be judged that it is necessary to switch to a camera with a narrower angle of view than the current camera.
  • the threshold value may be calculated based on the current camera's field of view value.
  • the camera switching determination module 230 may activate a camera to be switched when it is determined that the camera should be switched.
  • the camera switching determination module 230 may deactivate a camera to be switched when the object coordinates and the zoom region are moved out of a designated region.
  • an area where an object is located for the camera change determination module 230 to determine that the camera will be changed may be referred to as a designated area or a change area.
  • a camera before conversion or a current camera may be referred to as a first camera
  • a camera after conversion or a camera to be switched may be referred to as a second camera.
  • an area (or a transition area) designated with object coordinates and a zoom area (eg, an area outside the preview) is selected. If it deviates, the camera switching determination module 230 may deactivate the camera to be switched. For another example, when the camera switching determination module 230 determines that the camera should be switched to a camera having a narrower angle of view than the current camera, and the object coordinates and zoom area are out of the designated area (or transition area) (eg, the preview center area). , the camera switching determination module 230 may deactivate the camera to be switched.
  • the tracking information and zoom information extraction module 240 may operate in a tracking information extraction mode and/or a zoom information extraction mode. According to an embodiment, the tracking information and zoom information extraction module 240 may extract tracking information from when object tracking starts in a tracking information extraction mode, and the object tracking area and the zoom area exist in the transition area. Tracking information can be extracted when the camera to be switched is activated. According to one embodiment, the extracted tracking information may be updated.
  • the tracking information may include at least one of the size and coordinates of a tracked object, the texture of the object, the color of the object, and the texture of an area surrounding the object.
  • tracking information may include tracking information of a plurality of objects.
  • the tracking information may include category information on a tracked object.
  • a category for a tracked object may include people, animals, or objects.
  • the tracking information and zoom information extraction module 240 may extract at least one of camera view angle information, a preview size, a zoom region size, and a zoom region position within the entire preview in a zoom information extraction mode.
  • the tracking information and zoom information transmission module 250 may transmit tracking information and zoom information to a camera to be switched.
  • tracking information and zoom information are stored in the memory 140, and a camera to be switched may obtain the tracking information and/or zoom information from the memory 140.
  • a camera before conversion and a camera after conversion may share tracking information and zoom information.
  • the object re-tracking module 260 may track the same object as the object tracked by the camera before switching. According to an embodiment, the object re-tracking module 260 may use transmitted (or obtained) tracking information to identify the same object as the object tracked by the camera before switching in the switched camera. According to one embodiment, the object re-tracking module 260 previews the image acquired from the camera to be switched based on at least one of the preview size of the image acquired from the camera before conversion, object coordinates in the preview, object size, and calibration data. The position of the same object can be predicted from According to an embodiment, a plurality of objects may exist in the same object expected area.
  • a tracked object may include a person, an animal, and an object, and a person, animal, or object may exist in the same object expected area.
  • the object re-tracking module 260 may detect only objects included in a corresponding category based on the acquired category information.
  • the object re-tracking module 260 may extract tracking information from the detected object and compare the extracted information with the received tracking information to identify the same object.
  • the object re-tracking module 260 may start object tracking in a camera to be switched after finding the same object.
  • the zoom area matching and recalculation module 270 may calculate a zoom area so that the camera can be switched smoothly when the camera is switched. According to an embodiment, the zoom area matching and recalculation module 270 may determine the same area as the zoom area of the camera before switching based on the position and size of the tracking object in the preview of the image obtained from the camera to be switched. For example, the zoom area matching and recalculation module 270 may calculate a zoom area based on a ratio occupied by an object area in the zoom area. According to an embodiment, the relative position and relative size of the tracking object within the zoom area before camera switching may be the same as or correspond to the relative position and relative size of the tracking object within the zoom area after switching, respectively.
  • the camera switching module 280 may deactivate the camera before switching after the zoom region is calculated, and display the zoom region on the display 130 in an image acquired by the camera after switching. According to an embodiment, the camera switching module 280 may naturally switch by applying a blur effect to an area around an object during conversion as distortion occurs due to a difference in camera view angles before and after conversion.
  • FIG. 3 is a flowchart of an operation of switching a camera according to movement of an object by an electronic device (eg, the electronic device 100 of FIG. 1 ) according to an embodiment.
  • an electronic device eg, the electronic device 100 of FIG. 1
  • a processor eg, the processor 110 of FIG. 1
  • executes an application eg, the application 200 of FIG. 2
  • the application 200 supporting photography may include a camera application.
  • the processor 110 may output an execution screen of the application 200 through a display (eg, the display 130 of FIG. 1 ).
  • the processor 110 may obtain a first image having a first angle of view through a first camera (eg, the first camera 121 of FIG. 1 ) among a plurality of cameras. .
  • the processor 110 may obtain a first image having a first angle of view through the first camera 121 in a state in which the application 200 supporting photography is executed.
  • the first camera may be one of a tele camera, a wide camera, and an ultra wide camera.
  • the processor 110 may display a preview of the first image on the display 130 in a state in which the magnification of the photographing is set to the first magnification.
  • the processor 110 may display an image received at a zoom level of the first camera 121 on a display as a preview.
  • the processor 110 may display an image received at a zoom level of a tele camera on the display 130 as a preview.
  • the processor 110 may display an image received at a zoom level of a wide camera on the display 130 as a preview.
  • the processor 110 may display an image received at a zoom level of an ultra-wide camera on the display 130 as a preview.
  • the processor 110 may change the preview of the first image displayed on the display 130 to include the at least one object. there is. According to an embodiment, the processor 110 may change the preview of the first image as the object identified in the first image moves, so that the user can check the object through the display 130 .
  • the processor 110 changes the magnification to the second magnification in response to the location of at least one object in the designated area of the first view angle, and changes the magnification to a second camera among the plurality of cameras (eg, : A second image having a second angle of view may be obtained through the second camera 122 of FIG. 1 .
  • the second magnification may mean any magnification different from the first magnification.
  • the processor 110 may determine whether at least one object identified in the first image is located in a designated area of the first view angle.
  • the processor 110 may determine whether the central point of at least one object identified in the first image is included in an area adjacent to an edge of the first view angle. More specifically, for example, the processor 110 may determine whether the central point of at least one object identified in the first image is included within about 10% of the edge of the first view angle.
  • the designated area is an area within about 10% of the edge of the first angle of view is only an example, and the designated area varies from about 10% to about 90% from the edge of the first angle of view. can be defined as
  • the processor 110 determines whether the central point of at least one object identified in the first image overlaps with the second angle of view or is included in an area smaller than the second angle of view. can determine whether Also, for example, the processor 110 may determine whether the central point of at least one object identified in the first image is included in an area where the preview of the first camera and the preview of the second camera overlap. More specifically, for example, the processor 110 may determine whether the central point of at least one object identified in the first image is included within about 10% of the center of the first view angle.
  • the fact that the designated area is an area within about 10% of the center of the first angle of view is only an example, and the designated area ranges from about 10% to about 90% from the center of the first angle of view. can be defined as
  • the processor 110 responds to the location of at least one object identified in the first image in a designated area of the first angle of view, and in a state in which the application 200 supporting photography is executed, the second A second image having a second angle of view may be obtained through the camera 122 .
  • the first camera may be one of a tele camera, a wide camera, and an ultra wide camera.
  • the processor 110 may display at least a part of the second image as a preview on the display 130 in a state in which the shooting magnification is set to the second magnification.
  • the processor 110 may display an image received at a zoom level of the second camera 122 on a display as a preview.
  • the processor 110 may display an image received at a zoom level of a tele camera on the display 130 as a preview.
  • the processor 110 may display an image received at a zoom level of a wide camera on the display 130 as a preview.
  • the processor 110 may display an image received at a zoom level of an ultra-wide camera on the display 130 as a preview.
  • the processor 110 may change the preview displayed on the display 130 from the first image to at least a partial region of the second image.
  • the processor 110 displays the first image acquired through the first camera as the magnification is gradually changed from the first magnification to the second magnification, displayed on the display 130.
  • a preview may be changed to at least a partial area of the second image acquired through the second camera.
  • FIG. 4 is a flowchart of an operation of switching a camera when an object is located in a designated area by an electronic device according to an exemplary embodiment.
  • contents overlapping or corresponding to the above-described contents are simplified or omitted.
  • the processor 110 may detect and track an object in the first image in operation 410 .
  • the processor 110 may automatically detect a human head, a part or whole body, an animal, or an object from the preview of the first image.
  • the processor 110 displays the first image in response to receiving a user input (eg, a touch input) to the display 130 while a preview of the first image is displayed on the display 130.
  • a user input eg, a touch input
  • Objects to be tracked can be detected. For example, one object or a plurality of objects may be detected.
  • the processor 110 may calculate a first ROI in the first image in operation 420. According to an embodiment, the processor 110 may calculate the first ROI based on the coordinates of the object detected in the first image. According to an embodiment, the processor 110 may calculate the first ROI to include the entire object or only a part of the object. According to an embodiment, the processor 110 may calculate the first ROI to be the entire preview or a partial region of the preview.
  • the processor 110 may zoom in or zoom out using the first camera 121 in operation 430 .
  • the processor 110 may determine the size of the first ROI based on the size of the detected object.
  • the processor 110 may perform a zoom-in or zoom-out operation using the first camera according to the size of the first ROI. For example, when the size of the first ROI decreases, the processor 110 may perform a zoom-in operation using the first camera 121 . For another example, when the size of the zoom area increases, the processor 110 may perform a zoom-out operation using the first camera 121 .
  • the minimum size of the first ROI may be the size at which image quality degradation is minimal, and the image quality degradation criterion may be defined by a user.
  • the processor 110 may determine whether the object is located in a designated area of the first view angle. According to one embodiment, the processor 110 may track the detected object. According to an embodiment, the processor 110 may determine an object area corresponding to the detected object and track the object area. For example, the object area may include a larger margin area than the detected object. The processor 110 may prevent the preview image from shaking by including a margin area in the object area and ignoring motion such as minute vibration of the object.
  • the tracked object may be one or a plurality of objects.
  • the designated area when the first view angle is smaller than the second view angle may refer to an area adjacent to an edge of the first view angle.
  • the designated area when the first view angle is greater than the second view angle may mean an area where the preview of the first camera and the preview of the second camera overlap.
  • the processor 110 may determine the designated area based on the moving speed of the tracked object. For example, the processor 110 may determine the size of the designated area as the moving speed of the tracked object increases. Also, for example, the processor 110 may determine the size of the designated area to be smaller as the moving speed of the tracked object is slower. However, it is not limited thereto, and the processor 110 may determine the size of the designated area in various ways.
  • the processor 110 may zoom in or zoom out using the first camera 121 in operation 450 .
  • the processor 110 adjusts the size of the first ROI so that the camera is switched smoothly when the camera is switched, and displays the image through the display 130.
  • a zoom-in or zoom-out effect may be provided. For example, when the first view angle is greater than the second view angle, the processor 110 may reduce the size of the first ROI to provide a zoom-in effect. For another example, when the first view angle is greater than the second view angle, the processor 110 may increase the size of the first ROI to provide a zoom-out effect.
  • the processor 110 may provide a smooth switching effect when switching to the second camera by performing a zoom-in or zoom-out operation before switching the camera to the second camera.
  • the processor 110 may return to operation 410 when it is determined that the object is not located in the designated area of the first view angle.
  • the processor 110 may determine whether the object exists in the designated area of the first view angle for a designated period of time or longer.
  • the processor 110 may calculate a second ROI in the second image in operation 470 when it is determined that the object exists in the specified area of the first view angle for a specified period of time or longer.
  • the second ROI may refer to an area including the same object as the object tracked by the first camera 121 .
  • the processor 110 may calculate the second ROI in the second image when the time for which the tracked object is included in the designated area of the first view angle is equal to or greater than a threshold value.
  • the processor 110 may determine the second ROI based on the position of the object within the first ROI or the ratio of the size of the object to the first ROI.
  • the ratio of the position of the object in the first ROI and the size of the object to the first ROI may correspond to the position of the object in the second ROI and the ratio of the size of the object to the second ROI, respectively. there is.
  • the processor 110 may return to operation 440 when it is not determined that the object exists in the designated area of the first view angle for a specified period of time or longer. For example, the processor 110 may return to operation 440 when the object moves to the designated area of the first view angle and leaves the designated area after a time less than the threshold value has elapsed.
  • the processor 110 may change the preview displayed on the display 130 in operation 480. According to an embodiment, when the second ROI is determined, the processor 110 may display a preview image based on the second ROI on the display 130 .
  • FIG. 5 is a flowchart of an operation of an electronic device tracking the same object in a first camera and a second camera according to an embodiment. Operations 510 to 540 of FIG. 5 may be performed together with operation 460 of FIG. 4 .
  • the processor 110 may acquire tracking information and zoom information in operation 510 .
  • the processor 110 may extract (or acquire) tracking information and zoom information to be transmitted to the second camera.
  • the processor 110 may extract different tracking information according to the category of the tracked object. For example, if the category of the tracked object is a person, the processor 110 may perform facial information (eg, face outline, eyes, nose, mouth, eyebrows), hair color, hairline, hairstyle, whether or not glasses are worn, clothes ( Example: At least one of color, clothing Mooney texture, and shoe texture may be extracted.
  • the processor 110 may extract at least one of the animal type (eg, dog or cat), fur color, fur pattern, and texture.
  • the processor 110 may extract at least one of the object type, color, texture, outline, and silience map of the object.
  • the zoom information obtained by the processor 110 includes width and height of the first camera preview, coordinates of the object, size of the object, coordinates of the first ROI, location information of the object within the first ROI, It may include at least one of the area occupied by the object compared to the first ROI.
  • the processor 110 may store the acquired tracking information and zoom information in the memory 140 .
  • the processor 110 may activate the second camera 122 in operation 520 .
  • the processor 110 activates the second camera 122 before switching from the first camera 121 to the second camera 122 and uses the activated second camera 122 to generate a background image. You can track objects in
  • the processor 110 may transmit tracking information and zoom information in operation 530. According to an embodiment, the processor 110 may transmit (or forward) tracking information and zoom information stored in the memory 140 to the second camera 122 . According to an embodiment, tracking information and zoom information may be transferred to the second camera 122 through a camera system path or a framework path.
  • the processor 110 may track the object using the second camera 122 in operation 540 .
  • the processor 110 uses the second camera 122 based on the tracking information and the zoom information received from the second camera 122 to determine the same as the object tracked by the first camera 121. Objects can be tracked.
  • 6A illustrates a transition area at a first view angle when a first view angle of a first camera is smaller than a second view angle of a second camera in an electronic device according to an embodiment.
  • the processor 110 may determine a transition area 615 as an area adjacent to an edge of the first view angle 610 .
  • the processor 110 may determine an area within a range of about 10% from the edge of the first view angle 610 as the transition area 615 .
  • the example in which the transition area 615 is within about 10% of the edge of the first view angle 610 is only an example, and the transition area 615 is about 10% from the edge of the first view angle 610. It can be defined variously within 10% to about 90%.
  • 6B illustrates a transition area at a first view angle when the view angle of the first camera is greater than the view angle of the second camera in the electronic device according to an embodiment.
  • the processor 110 may determine the transition area 625 as an area where the preview of the first camera and the preview of the second camera overlap. For example, the processor 110 may determine an area within about 10% of the center of the first view angle 620 as the transition area 625 . However, the example in which the transition area 625 is within about 10% of the center of the first view angle 620 is only an example, and the transition area 625 is about 10% from the center of the first view angle 620. It can be defined variously within 10% to about 90%.
  • the processor 110 may be determined in various ways according to the moving speed of the tracked object, calibration data, or setting values.
  • FIG. 7 is a flowchart of an operation of obtaining category information of an object tracked by a first camera in an electronic device according to an embodiment.
  • contents corresponding to or overlapping with the foregoing contents are simplified or omitted.
  • the processor 110 may detect an object in the first image in operation 710 .
  • the processor 110 may automatically detect at least one object in the preview of the first image.
  • the processor 110 selects at least one object in response to receiving a user input (eg, a touch input) on the display 130 while the preview of the first image is displayed on the display 130. can be detected.
  • a user input eg, a touch input
  • the processor 110 may determine whether the object detected in the first image is a person. According to an embodiment, when there are a plurality of objects detected in the first image, the processor 110 may determine whether each of the plurality of objects is a person.
  • the processor 110 may extract face, hair and/or clothing information of the object in operation 730 .
  • the processor 110 may determine whether the object detected in operation 740 is an animal. According to an embodiment, when there are a plurality of objects detected in the first image, the processor 110 may determine whether each of the plurality of objects is an animal.
  • the processor 110 may extract the type, color, pattern, and/or texture of the object in operation 750 .
  • the processor 110 extracts the type, color, texture, outline, or saliency map of the object in operation 760. can do.
  • the processor 110 may extract zoom information in operation 770.
  • the processor 110 may include the width and height of the first camera preview, the coordinates of the object, the size of the object, the coordinates of the first ROI, location information of the object within the first ROI, and the first ROI contrast. Zoom information including at least one of the areas occupied by the object may be obtained.
  • 8A and 8B illustrate extracting zoom information according to movement of an object when the angle of view of a first camera is smaller than that of a second camera in an electronic device according to an embodiment.
  • the processor 110 identifies an object 800 within a first view angle 610 and determines a first ROI 810 corresponding to the identified object 800. can According to an embodiment, the processor 110 may determine a transition area 615 within the first view angle 610 .
  • the processor 110 may change the first ROI 810 as the identified object 800 moves. According to an embodiment, the processor 110 may determine the first ROI 810 based on the coordinates of the identified object 800 .
  • the processor 110 may obtain zoom information as the first ROI 810 is determined. According to an embodiment, the processor 110 may obtain zoom information including a size of the first ROI 810 and a position of the first ROI 810 in the preview. For example, the size of the first ROI 810 may be determined by a height 811 of the first ROI and a width 813 of the first ROI. Also, for example, the position of the first ROI in the preview may be determined by the coordinates 815 and 817 of the first ROI.
  • the processor 110 obtains zoom information including a size ratio of the object 800 to the first ROI 810 and a position of the object 800 within the first ROI 810. can do.
  • the ratio of the size of the object 800 to the first ROI 810 may be determined based on the height 821 and the width 823 of the object 800 .
  • the position of the object 800 within the first ROI 810 may be determined by the coordinates 825 and 827 of the object.
  • 9A and 9B illustrate extraction of zoom information according to movement of an object when the angle of view of a first camera is greater than that of a second camera in an electronic device according to an embodiment.
  • the processor 110 identifies an object 800 within a first view angle 620 and determines a first ROI 910 corresponding to the identified object 800. can According to an embodiment, the processor 110 may determine a transition area 625 within the first view angle 620 .
  • the processor 110 may change the first ROI 910 as the identified object 800 moves. According to an embodiment, the processor 110 may determine the first ROI 910 based on the coordinates of the identified object 800 .
  • the processor 110 may obtain zoom information as the first ROI 910 is determined. According to an embodiment, the processor 110 may obtain zoom information including a size of the first ROI 910 and a position of the first ROI 910 in the preview. For example, the size of the first ROI 910 may be determined by a height 911 of the first ROI and a width 913 of the first ROI. Also, for example, the location of the first ROI in the preview may be determined by coordinates 915 and 917 of the first ROI.
  • the processor 110 obtains zoom information including a size ratio of the object 800 to the first ROI 910 and a position of the object 800 within the first ROI 910. can do.
  • the ratio of the size of the object 800 to the first ROI 910 may be determined based on the height 921 and the width 923 of the object 800 .
  • the position of the object 800 within the first ROI 910 may be determined by the coordinates 925 and 927 of the object.
  • FIG. 10 is a flowchart illustrating tracking of the same object by a second camera (eg, the second camera 122 of FIG. 1 ) based on category information of the object being tracked by an electronic device according to an embodiment.
  • a second camera eg, the second camera 122 of FIG. 1
  • the processor 110 may obtain category information on a tracking object in operation 1010 .
  • the processor 110 may obtain category information on a tracking object based on tracking information acquired from the memory 140 by the second camera 122 .
  • the processor 110 may determine whether the category of the tracked object is a person in operation 1020. According to an embodiment, when it is determined that the category of the tracked object is a person, the processor 110 may detect the face and body of the object from the preview of the second camera. This will be described later with reference to FIG. 11a.
  • the processor 110 may determine whether the category of the tracking object is an animal in operation 1030 . According to an embodiment, when it is determined that the category of the tracked object is an animal, the processor 110 may detect the animal from the preview of the second camera. This will be described later with reference to FIG. 11b.
  • the processor 110 may extract a silience map from the preview of the second camera 122 in operation 1040.
  • the processor 110 may detect the same object as the tracked object in the preview of the second camera 122 by comparing the texture and outline with the tracked object in operation 1050 . According to an embodiment, the processor 110 may detect the same object as the tracked object by comparing the texture and outline with the tracked object based on the silience map extracted from the preview of the second camera 122. .
  • the processor 110 may track an object detected using the second camera in operation 1060. According to an embodiment, the processor 110 may track the same object as the object tracked by the first camera 121 using the second camera 122 based on the category information acquired from the memory 140. there is.
  • 11A is a diagram in which an object tracked by an electronic device (eg, the electronic device 100 of FIG. 1 ) according to an embodiment is a person, and a second camera (eg, the second camera 122 of FIG. 1 ) tracks the same object. It is a flow chart showing what to do.
  • an electronic device eg, the electronic device 100 of FIG. 1
  • a second camera eg, the second camera 122 of FIG. 1
  • the processor 110 determines that the category of the tracked object is a person in operation 1020 of FIG. can be detected.
  • the processor 110 may determine whether a plurality of people are included in the preview of the second camera 122 in operation 1120 . According to an embodiment, the processor 110 determines whether a plurality of people are included in the preview of the second camera 122 based on the detection of faces and/or bodies in the preview of the second camera 122. can do.
  • the processor 110 uses the second camera in operation 1150 to identify an object identified in the preview of the second camera (eg: person) can be tracked. According to an embodiment, when it is determined that there is only one person included in the preview of the second camera 122, the processor 110 may track the person using the second camera 122.
  • an object identified in the preview of the second camera eg: person
  • the processor 110 may track the person using the second camera 122.
  • the processor 110 when it is determined that a plurality of people are included in the preview of the second camera 122, the processor 110 performs operation 1130 on the facial features of each of the plurality of people (eg, eyes, nose, mouth, Eyebrows, face outline), hair, or clothing and shoe information can be extracted.
  • facial features of each of the plurality of people eg, eyes, nose, mouth, Eyebrows, face outline
  • hair, or clothing and shoe information can be extracted.
  • the processor 110 may compare the information extracted in operation 1140 to detect the same object in the second image. According to an embodiment, the processor 110 compares the information extracted from the preview of the second camera 122 with the tracking information and zoom information obtained from the memory 140, and compares the object tracked by the first camera 121 with the zoom information. The same object can be determined in the second image.
  • the processor 110 may track an object using the second camera 122 in operation 1150 . According to an embodiment, the processor 110 may track the object determined to be the same object in operation 1140.
  • 11B is a flowchart illustrating tracking of the same object by a second camera when the object to be tracked by the electronic device is an animal, according to an embodiment.
  • the processor 110 may detect the animal in the preview of the second camera 122 in operation 1115 . there is.
  • the processor 110 may determine whether a plurality of animals are included in the preview of the second camera. According to an embodiment, the processor 110 may determine whether a plurality of animals are included in the preview of the second camera 122 based on the detection of animals in the preview of the second camera 122 .
  • the processor 110 uses the second camera 122 in operation 1155 to detect the second camera 122.
  • the identified object e.g. animal
  • the processor 110 may track one animal using the second camera 122.
  • the processor 110 when it is determined that a plurality of animals are included in the preview of the second camera 122, the processor 110 extracts information on fur color, pattern, and texture of each of the plurality of animals in operation 1135. can do.
  • the processor 110 may compare the information extracted in operation 1145 to detect the same object in the second image. According to an embodiment, the processor 110 compares the information extracted from the preview of the second camera 122 with the tracking information and zoom information obtained from the memory 140, and compares the object tracked by the first camera 121 with the zoom information. The same object can be determined in the second image.
  • the processor 110 may use the second camera to track the object determined to be the same object in operation 1145. According to an embodiment, the processor 110 may track the object determined to be the same object in operation 1140.
  • FIG. 12 is a flowchart illustrating recalculation of a zoom area in an electronic device according to an exemplary embodiment.
  • the processor 110 may track an object with a second camera (eg, the second camera 122 of FIG. 1 ) in operation 1210 .
  • the processor 110 may use the second camera 122 to track the same object as the object tracked by the first camera (eg, the first camera 121 of FIG. 1 ).
  • the processor 110 detects the same object as the object tracked by the first camera 121 in the preview of the second camera 122 based on the tracking information and zoom information stored in the memory 140 and can be traced
  • the processor 110 may determine whether the ratio of the size of an object before switching the camera is the same as the ratio of the size of the object after switching the camera. According to an embodiment, the processor 110 determines the size ratio of the object to the ROI in the preview of the first camera 121 and the size ratio of the object in the preview of the second camera 122 based on the zoom information stored in the memory 140. It may be determined whether the size ratio of the object to the ROI is the same.
  • a region of interest in a preview of the first camera 121 may be referred to as a first region of interest
  • a region of interest in a preview of the second camera 122 may be referred to as a second region of interest.
  • the processor 110 may update the ROI information to have the same ratio in operation 1230 .
  • the processor 110 determines the size of the object to the first ROI.
  • the ROI information may be updated so that the ratio and the size ratio of the object to the second ROI are the same.
  • the ROI information may include at least one of size information and location information of the ROI.
  • the processor 110 recalculates (or determines) the size and/or position of the second ROI such that the size ratio of the object to the second ROI is the same as the size ratio of the object to the first ROI. )can do.
  • the processor 110 may obtain size magnification information between objects in operation 1240 when it is determined that the ratio of the size of an object before switching the camera is the same as the ratio of the size of the object after switching. According to an embodiment, when it is determined that the size ratio of the object to the first ROI and the size ratio of the object to the second ROI are the same, the processor 110 determines that the object identified in the first image and the second image Information on the size magnification between the objects identified in can be obtained.
  • the processor 110 may update ROI information and object location information based on the magnification information acquired in operation 1250.
  • the processor 110 may update ROI information and object location information based on information about a size magnification between the object identified in the first image and the object identified in the second image.
  • the location information of the object may include information about coordinates of the object within the region of interest.
  • the processor 110 may determine the size and/or location of the ROI and the size of the object within the ROI based on information on the size magnification between the object identified in the first image and the object identified in the second image. Information about location can be updated (or updated).
  • the processor 110 may determine the second ROI based on the updated ROI information and object location information.
  • FIG. 13A illustrates that a second ROI is determined when an angle of view of a first camera is smaller than an angle of view of a second camera in an electronic device (eg, the electronic device 100 of FIG. 1 ) according to an embodiment.
  • an electronic device eg, the electronic device 100 of FIG. 1
  • contents corresponding to or overlapping with the above contents are simplified or omitted.
  • the processor 110 may determine a second ROI 1312 within a second view angle 1310 . According to an embodiment, the processor 110 may determine the second ROI 1312 within the second view angle 1310 based on tracking information and zoom information stored in the memory 140 .
  • the processor 110 determines that the ratio of the size of the object 1300 to the second region of interest 1312 is the object to the first region of interest (eg, the first region of interest 810 of FIG. 8 ).
  • the size of the second ROI 1312 may be determined to be the same as the ratio of the size of the object 800 of FIG. 8 .
  • the ratio of the size of the object 1300 to the second region of interest 1312 may be determined based on the height 1311 and the width 1313 of the object 1300 .
  • the processor 110 sets the second region of interest 1312 such that the position of the object 1300 within the second region of interest 1312 is the same as the position of the object 800 within the first region of interest 810. position can be determined.
  • the location of the object 1300 within the second region of interest 1312 may be determined by coordinates 1315 and 1317 of the object.
  • the object 800 included in the first ROI 810 and the object 1300 included in the second ROI 1312 are the same object.
  • FIG. 13B illustrates that a second ROI is determined when the angle of view of the first camera is greater than the angle of view of the second camera in the electronic device according to an embodiment.
  • contents corresponding to or overlapping with the above descriptions are simplified or omitted.
  • the processor 110 may determine a second ROI 1322 within a second view angle 1320 . According to an embodiment, the processor 110 may determine the second ROI 1322 within the second view angle 1320 based on tracking information and zoom information stored in the memory 140 .
  • the processor 110 determines that the ratio of the size of the object 1300 to the second region of interest 1322 is the object to the first region of interest (eg, the first region of interest 910 of FIG. 9 ).
  • the size of the second ROI 1322 may be determined to be the same as the ratio of the size of the object 800 of FIG. 9 (eg, the object 800 of FIG. 9 ).
  • the ratio of the size of the object 1300 to the second region of interest 1322 may be determined based on the height 1321 and the width 1323 of the object 1300 .
  • the processor 110 sets the second region of interest 1322 such that the position of the object 1300 within the second region of interest 1322 is the same as the position of the object 800 within the first region of interest 910. position can be determined. For example, the location of the object 1300 within the second region of interest 1322 may be determined by coordinates 1325 and 1327 of the object. In this case, the object 800 included in the first ROI 910 and the object 1300 included in the second ROI 1322 are the same object.
  • FIG. 14 is a block diagram of an electronic device in a network environment according to an embodiment.
  • an electronic device 1401 communicates with an electronic device 1402 through a first network 1498 (eg, a short-range wireless communication network) or through a second network 1499. It may communicate with at least one of the electronic device 1404 or the server 1408 through (eg, a long-distance wireless communication network). According to an embodiment, the electronic device 1401 may communicate with the electronic device 1404 through the server 1408 . According to an embodiment, the electronic device 1401 includes a processor 1410 (eg, the processor 110 of FIG. 1 ), a memory 1430, an input module 1450, a sound output module 1455, and a display module 1460.
  • a processor 1410 eg, the processor 110 of FIG. 1
  • a memory 1430 e.g, the input module 1450, a sound output module 1455, and a display module 1460.
  • audio module 1470 is integrated into a single component (eg, display module 1460). It can be.
  • the processor 1420 executes software (eg, the program 1440) to cause at least one other component (eg, hardware or software component) of the electronic device 1401 connected to the processor 1420. It can control and perform various data processing or calculations. According to one embodiment, as at least part of data processing or operation, the processor 1420 transfers instructions or data received from other components (e.g., sensor module 1476 or communication module 1490) to volatile memory 1432. , process commands or data stored in the volatile memory 1432, and store resultant data in the non-volatile memory 1434.
  • software eg, the program 1440
  • the processor 1420 transfers instructions or data received from other components (e.g., sensor module 1476 or communication module 1490) to volatile memory 1432. , process commands or data stored in the volatile memory 1432, and store resultant data in the non-volatile memory 1434.
  • the processor 1420 may include a main processor 1421 (eg, a central processing unit or an application processor) or an auxiliary processor 1423 (eg, a graphic processing unit, a neural network processing unit ( NPU: neural processing unit (NPU), image signal processor, sensor hub processor, or communication processor).
  • a main processor 1421 e.g, a central processing unit or an application processor
  • auxiliary processor 1423 e.g, a graphic processing unit, a neural network processing unit ( NPU: neural processing unit (NPU), image signal processor, sensor hub processor, or communication processor.
  • NPU neural network processing unit
  • the co-processor 1423 may use less power than the main processor 1421 or be set to be specialized for a designated function.
  • the auxiliary processor 1423 may be implemented separately from or as part of the main processor 1421 .
  • the secondary processor 1423 may, for example, take the place of the main processor 1421 while the main processor 1421 is in an inactive (eg, sleep) state, or when the main processor 1421 is active (eg, running an application). ) state, together with the main processor 1421, at least one of the components of the electronic device 1401 (eg, the display module 1460, the sensor module 1476, or the communication module 1490) It is possible to control at least some of the related functions or states.
  • the coprocessor 1423 eg, image signal processor or communication processor
  • may be implemented as part of other functionally related components eg, camera module 1480 or communication module 1490). there is.
  • the auxiliary processor 1423 may include a hardware structure specialized for processing an artificial intelligence model.
  • AI models can be created through machine learning. Such learning may be performed, for example, in the electronic device 1401 itself where the artificial intelligence model is performed, or may be performed through a separate server (eg, the server 1408).
  • the learning algorithm may include, for example, supervised learning, unsupervised learning, semi-supervised learning or reinforcement learning, but in the above example Not limited.
  • the artificial intelligence model may include a plurality of artificial neural network layers.
  • Artificial neural networks include deep neural networks (DNNs), convolutional neural networks (CNNs), recurrent neural networks (RNNs), restricted boltzmann machines (RBMs), deep belief networks (DBNs), bidirectional recurrent deep neural networks (BRDNNs), It may be one of deep Q-networks or a combination of two or more of the foregoing, but is not limited to the foregoing examples.
  • the artificial intelligence model may include, in addition or alternatively, software structures in addition to hardware structures.
  • the memory 1430 may store various data used by at least one component (eg, the processor 1420 or the sensor module 1476) of the electronic device 1401 .
  • the data may include, for example, input data or output data for software (eg, the program 1440) and commands related thereto.
  • the memory 1430 may include a volatile memory 1432 or a non-volatile memory 1434 .
  • the program 1440 may be stored as software in the memory 1430 and may include, for example, an operating system 1442 , middleware 1444 , or an application 1446 .
  • the input module 1450 may receive a command or data to be used by a component (eg, the processor 1420) of the electronic device 1401 from an outside of the electronic device 1401 (eg, a user).
  • the input module 1450 may include, for example, a microphone, a mouse, a keyboard, a key (eg, a button), or a digital pen (eg, a stylus pen).
  • the sound output module 1455 may output sound signals to the outside of the electronic device 1401 .
  • the sound output module 1455 may include, for example, a speaker or receiver.
  • the speaker can be used for general purposes such as multimedia playback or recording playback.
  • a receiver may be used to receive an incoming call. According to one embodiment, the receiver may be implemented separately from the speaker or as part of it.
  • the display module 1460 can visually provide information to the outside of the electronic device 1401 (eg, a user).
  • the display module 1460 may include, for example, a display, a hologram device, or a projector and a control circuit for controlling the device.
  • the display module 1460 may include a touch sensor configured to detect a touch or a pressure sensor configured to measure the intensity of force generated by the touch.
  • the audio module 1470 may convert sound into an electrical signal or vice versa. According to an embodiment, the audio module 1470 acquires sound through the input module 1450, the sound output module 1455, or an external electronic device connected directly or wirelessly to the electronic device 1401 (eg: Sound may be output through the electronic device 1402 (eg, a speaker or a headphone).
  • the audio module 1470 acquires sound through the input module 1450, the sound output module 1455, or an external electronic device connected directly or wirelessly to the electronic device 1401 (eg: Sound may be output through the electronic device 1402 (eg, a speaker or a headphone).
  • the sensor module 1476 detects an operating state (eg, power or temperature) of the electronic device 1401 or an external environmental state (eg, a user state), and generates an electrical signal or data value corresponding to the detected state. can do.
  • the sensor module 1476 may include, for example, a gesture sensor, a gyro sensor, an air pressure sensor, a magnetic sensor, an acceleration sensor, a grip sensor, a proximity sensor, a color sensor, an infrared (IR) sensor, a bio sensor, It may include a temperature sensor, humidity sensor, or light sensor.
  • the interface 1477 may support one or more specified protocols that may be used to directly or wirelessly connect the electronic device 1401 to an external electronic device (eg, the electronic device 1402).
  • the interface 1477 may include, for example, a high definition multimedia interface (HDMI), a universal serial bus (USB) interface, an SD card interface, or an audio interface.
  • HDMI high definition multimedia interface
  • USB universal serial bus
  • SD card interface Secure Digital Card interface
  • audio interface audio interface
  • connection terminal 1478 may include a connector through which the electronic device 1401 may be physically connected to an external electronic device (eg, the electronic device 1402).
  • the connection terminal 1478 may include, for example, an HDMI connector, a USB connector, an SD card connector, or an audio connector (eg, a headphone connector).
  • the haptic module 1479 may convert electrical signals into mechanical stimuli (eg, vibration or motion) or electrical stimuli that a user can perceive through tactile or kinesthetic senses.
  • the haptic module 1479 may include, for example, a motor, a piezoelectric element, or an electrical stimulation device.
  • the camera module 1480 may capture still images and moving images. According to one embodiment, the camera module 1480 may include one or more lenses, image sensors, image signal processors, or flashes.
  • the power management module 1488 may manage power supplied to the electronic device 1401 .
  • the power management module 1488 may be implemented as at least part of a power management integrated circuit (PMIC), for example.
  • PMIC power management integrated circuit
  • the battery 1489 may supply power to at least one component of the electronic device 1401 .
  • the battery 1489 may include, for example, a non-rechargeable primary cell, a rechargeable secondary cell, or a fuel cell.
  • the communication module 1490 is a direct (eg, wired) communication channel or a wireless communication channel between the electronic device 1401 and an external electronic device (eg, the electronic device 1402, the electronic device 1404, or the server 1408). Establishment and communication through the established communication channel may be supported.
  • the communication module 1490 may include one or more communication processors that operate independently of the processor 1420 (eg, an application processor) and support direct (eg, wired) communication or wireless communication.
  • the communication module 1490 may be a wireless communication module 1492 (eg, a cellular communication module, a short-range wireless communication module, or a global navigation satellite system (GNSS) communication module) or a wired communication module 1494 (eg, a : a local area network (LAN) communication module or a power line communication module).
  • a wireless communication module 1492 eg, a cellular communication module, a short-range wireless communication module, or a global navigation satellite system (GNSS) communication module
  • GNSS global navigation satellite system
  • wired communication module 1494 eg, a : a local area network (LAN) communication module or a power line communication module.
  • a corresponding communication module is a first network 1498 (eg, a short-range communication network such as Bluetooth, wireless fidelity (WiFi) direct, or infrared data association (IrDA)) or a second network 1499 (eg, legacy It may communicate with the external electronic device 1404 through a cellular network, a 5G network, a next-generation communication network, the Internet, or a telecommunications network such as a computer network (eg, LAN or WAN).
  • a cellular network eg, a 5G network, a next-generation communication network, the Internet, or a telecommunications network such as a computer network (eg, LAN or WAN).
  • the wireless communication module 1492 uses subscriber information (eg, International Mobile Subscriber Identifier (IMSI)) stored in the subscriber identification module 1496 within a communication network such as the first network 1498 or the second network 1499.
  • subscriber information eg, International Mobile Subscriber Identifier (IMSI)
  • IMSI International Mobile Subscriber Identifier
  • the electronic device 1401 may be identified or authenticated.
  • the wireless communication module 1492 may support a 5G network after a 4G network and a next-generation communication technology, for example, NR access technology (new radio access technology).
  • NR access technologies include high-speed transmission of high-capacity data (enhanced mobile broadband (eMBB)), minimization of terminal power and access of multiple terminals (massive machine type communications (mMTC)), or high reliability and low latency (ultra-reliable and low latency (URLLC)). -latency communications)) can be supported.
  • the wireless communication module 1492 may support a high frequency band (eg, mmWave band) to achieve a high data rate, for example.
  • a high frequency band eg, mmWave band
  • the wireless communication module 1492 uses various technologies for securing performance in a high frequency band, such as beamforming, massive multiple-input and multiple-output (MIMO), and full-dimensional multiplexing. Technologies such as input/output (FD-MIMO: full dimensional MIMO), array antenna, analog beam-forming, or large scale antenna may be supported.
  • the wireless communication module 1492 may support various requirements defined for the electronic device 1401, an external electronic device (eg, the electronic device 1404), or a network system (eg, the second network 1499).
  • the wireless communication module 1492 may be used for realizing peak data rate (eg, 20 Gbps or more) for realizing eMBB, loss coverage for realizing mMTC (eg, less than or equal to 164 dB), or U-plane latency (for realizing URLLC).
  • peak data rate eg, 20 Gbps or more
  • loss coverage for realizing mMTC (eg, less than or equal to 164 dB)
  • U-plane latency for realizing URLLC.
  • DL downlink
  • UL uplink
  • each of 0.5 ms or less, or round trip 1 ms or less may be supported.
  • the antenna module 1497 may transmit or receive signals or power to the outside (eg, an external electronic device).
  • the antenna module 1497 may include an antenna including a radiator formed of a conductor or a conductive pattern formed on a substrate (eg, PCB).
  • the antenna module 1497 may include a plurality of antennas (eg, an array antenna). In this case, at least one antenna suitable for a communication method used in a communication network such as the first network 1498 or the second network 1499 is selected from the plurality of antennas by, for example, the communication module 1490. can be chosen A signal or power may be transmitted or received between the communication module 1490 and an external electronic device through the selected at least one antenna.
  • other components eg, a radio frequency integrated circuit (RFIC) may be additionally formed as a part of the antenna module 1497 in addition to the radiator.
  • RFIC radio frequency integrated circuit
  • the antenna module 1497 may form a mmWave antenna module.
  • the mmWave antenna module includes a printed circuit board, an RFIC disposed on or adjacent to a first surface (eg, a lower surface) of the printed circuit board and capable of supporting a designated high frequency band (eg, mmWave band); and a plurality of antennas (eg, array antennas) disposed on or adjacent to a second surface (eg, a top surface or a side surface) of the printed circuit board and capable of transmitting or receiving signals of the designated high frequency band. can do.
  • peripheral devices eg, a bus, general purpose input and output (GPIO), serial peripheral interface (SPI), or mobile industry processor interface (MIPI)
  • signal e.g. commands or data
  • commands or data may be transmitted or received between the electronic device 1401 and the external electronic device 1404 through the server 1408 connected to the second network 1499 .
  • Each of the external electronic devices 1402 or 1004 may be the same as or different from the electronic device 1401 .
  • all or part of operations executed in the electronic device 1401 may be executed in one or more external electronic devices among the external electronic devices 1402 , 1004 , or 1008 .
  • the electronic device 1401 when the electronic device 1401 needs to perform a certain function or service automatically or in response to a request from a user or another device, the electronic device 1401 instead of executing the function or service by itself.
  • one or more external electronic devices may be requested to perform the function or at least part of the service.
  • One or more external electronic devices receiving the request may execute at least a part of the requested function or service or an additional function or service related to the request, and deliver the execution result to the electronic device 1401 .
  • the electronic device 1401 may provide the result as at least part of a response to the request as it is or additionally processed.
  • cloud computing distributed computing, mobile edge computing (MEC), or client-server computing technology may be used.
  • the electronic device 1401 may provide an ultra-low latency service using, for example, distributed computing or mobile edge computing.
  • the external electronic device 1404 may include an internet of things (IoT) device.
  • Server 1408 may be an intelligent server using machine learning and/or neural networks.
  • the external electronic device 1404 or server 1408 may be included in the second network 1499 .
  • the electronic device 1401 may be applied to intelligent services (eg, smart home, smart city, smart car, or health care) based on 5G communication technology and IoT-related technology.
  • Electronic devices may be devices of various types.
  • the electronic device may include, for example, a portable communication device (eg, a smart phone), a computer device, a portable multimedia device, a portable medical device, a camera, a wearable device, or a home appliance.
  • a portable communication device eg, a smart phone
  • a computer device e.g., a smart phone
  • a portable multimedia device e.g., a portable medical device
  • a camera e.g., a portable medical device
  • a camera e.g., a portable medical device
  • a camera e.g., a portable medical device
  • a camera e.g., a camera
  • a wearable device e.g., a smart bracelet
  • first, second, or first or secondary may simply be used to distinguish a given component from other corresponding components, and may be used to refer to a given component in another aspect (eg, importance or order) is not limited.
  • a (e.g., first) component is said to be “coupled” or “connected” to another (e.g., second) component, with or without the terms “functionally” or “communicatively.”
  • the certain component may be connected to the other component directly (eg by wire), wirelessly, or through a third component.
  • module used in various embodiments of this document may include a unit implemented in hardware, software, or firmware, and is interchangeable with terms such as, for example, logic, logical blocks, parts, or circuits.
  • a module may be an integrally constructed component or a minimal unit of components or a portion thereof that performs one or more functions.
  • the module may be implemented in the form of an application-specific integrated circuit (ASIC).
  • ASIC application-specific integrated circuit
  • a storage medium eg, internal memory 1436 or external memory 1438
  • a machine eg, electronic device 1401
  • It may be implemented as software (eg, the program 1440) including them.
  • a processor eg, the processor 1420
  • a device eg, the electronic device 1401
  • the one or more instructions may include code generated by a compiler or code executable by an interpreter.
  • the device-readable storage medium may be provided in the form of a non-transitory storage medium.
  • the storage medium is a tangible device and does not contain a signal (e.g. electromagnetic wave), and this term refers to the case where data is stored semi-permanently in the storage medium. It does not discriminate when it is temporarily stored.
  • a signal e.g. electromagnetic wave
  • the method according to various embodiments disclosed in this document may be included and provided in a computer program product.
  • Computer program products may be traded between sellers and buyers as commodities.
  • a computer program product is distributed in the form of a device-readable storage medium (e.g. compact disc read only memory (CD-ROM)), or through an application store (e.g. Play Store TM ) or on two user devices (e.g. It can be distributed (eg downloaded or uploaded) online, directly between smart phones.
  • a device e.g. compact disc read only memory (CD-ROM)
  • an application store e.g. Play Store TM
  • It can be distributed (eg downloaded or uploaded) online, directly between smart phones.
  • at least part of the computer program product may be temporarily stored or temporarily created in a storage medium readable by a device such as a manufacturer's server, an application store server, or a relay server's memory.
  • each component (eg, module or program) of the above-described components may include a single object or a plurality of entities, and some of the plurality of entities may be separately disposed in other components. there is.
  • one or more components or operations among the aforementioned corresponding components may be omitted, or one or more other components or operations may be added.
  • a plurality of components eg modules or programs
  • the integrated component may perform one or more functions of each of the plurality of components identically or similarly to those performed by a corresponding component of the plurality of components prior to the integration. .
  • the actions performed by a module, program, or other component are executed sequentially, in parallel, iteratively, or heuristically, or one or more of the actions are executed in a different order, or omitted. or one or more other actions may be added.
  • a camera module 1480 includes a lens assembly 1510, a flash 1520, an image sensor 1530, an image stabilizer 1540, a memory 1550 (eg, a buffer memory), or an image signal processor. (1560).
  • the lens assembly 1510 may collect light emitted from a subject that is an image capture target.
  • Lens assembly 1510 may include one or more lenses.
  • the camera module 1480 may include a plurality of lens assemblies 1510 . In this case, the camera module 1480 may form, for example, a dual camera, a 360-degree camera, or a spherical camera.
  • Some of the plurality of lens assemblies 1510 may have the same lens properties (eg, angle of view, focal length, auto focus, f number, or optical zoom), or at least one lens assembly may have the same lens properties as another lens assembly. may have one or more lens properties different from the lens properties of .
  • the lens assembly 1510 may include, for example, a wide-angle lens or a telephoto lens.
  • the flash 1520 may emit light used to enhance light emitted or reflected from a subject.
  • the flash 1520 may include one or more light emitting diodes (eg, a red-green-blue (RGB) LED, a white LED, an infrared LED, or an ultraviolet LED), or a xenon lamp.
  • the image sensor 1530 may obtain an image corresponding to the subject by converting light emitted or reflected from the subject and transmitted through the lens assembly 1510 into an electrical signal.
  • the image sensor 1530 is, for example, an image sensor selected from among image sensors having different properties, such as an RGB sensor, a black and white (BW) sensor, an IR sensor, or a UV sensor, It may include a plurality of image sensors having a property, or a plurality of image sensors having other properties.
  • Each image sensor included in the image sensor 1530 may be implemented using, for example, a charged coupled device (CCD) sensor or a complementary metal oxide semiconductor (CMOS) sensor.
  • CCD charged coupled device
  • CMOS complementary metal oxide semiconductor
  • the image stabilizer 1540 may move at least one lens or image sensor 1530 included in the lens assembly 1510 in a specific direction in response to movement of the camera module 1480 or the electronic device 1401 including the same. Operation characteristics of the image sensor 1530 may be controlled (eg, read-out timing is adjusted, etc.). This makes it possible to compensate at least part of the negative effect of the movement on the image being taken.
  • the image stabilizer 1540 may include a gyro sensor (not shown) or an acceleration sensor (not shown) disposed inside or outside the camera module 1480. Such a movement of the camera module 1480 or the electronic device 1401 may be detected using .
  • the image stabilizer 1540 may be implemented as, for example, an optical image stabilizer.
  • the memory 1550 may at least temporarily store at least a portion of an image acquired through the image sensor 1530 for a next image processing task. For example, when image acquisition is delayed according to the shutter, or a plurality of images are acquired at high speed, the acquired original image (eg, a Bayer-patterned image or a high-resolution image) is stored in the memory 1550 and , a copy image (eg, a low resolution image) corresponding thereto may be previewed through the display module 1460 . Thereafter, when a specified condition is satisfied (eg, a user input or a system command), at least a part of the original image stored in the memory 1550 may be acquired and processed by, for example, the image signal processor 1560 . According to one embodiment, the memory 1550 may be configured as at least a part of the memory 1430 or as a separate memory operated independently of the memory 1430 .
  • a specified condition eg, a user input or a system command
  • the image signal processor 1560 may perform one or more image processes on an image acquired through the image sensor 1530 or an image stored in the memory 1550 .
  • the one or more image processes for example, depth map generation, 3D modeling, panorama generation, feature point extraction, image synthesis, or image compensation (eg, noise reduction, resolution adjustment, brightness adjustment, blurring ( blurring, sharpening, or softening.
  • the image signal processor 1560 may include at least one of the components included in the camera module 1480 (eg, an image sensor). 1530) may be controlled (eg, exposure time control, read-out timing control, etc.)
  • the image processed by the image signal processor 1560 is stored again in the memory 1550 for further processing.
  • the image signal processor 1560 may be configured as at least a part of the processor 1420 or may be configured as a separate processor that operates independently of the processor 1420.
  • the image signal processor 1560 may be configured as a processor 1420 When configured as a separate processor, at least one image processed by the image signal processor 1560 may be displayed through the display module 1460 as it is or after additional image processing by the processor 1420.
  • the electronic device 1401 may include a plurality of camera modules 1480 each having different properties or functions.
  • at least one of the plurality of camera modules 1480 may be a wide-angle camera and at least the other may be a telephoto camera.
  • at least one of the plurality of camera modules 1480 may be a front camera and at least the other may be a rear camera.
  • an electronic device eg, the electronic device 100 of FIG. 1
  • the at least one processor executes an application that supports shooting using the plurality of cameras, and the plurality of cameras
  • a first image having a first angle of view is obtained through a first camera of the above, and a preview using the first image is displayed on the display in a state in which the magnification of the photographing is set to the first magnification, and in the first image Changing a preview using the first image displayed on the display so that the at least one identified object is included as the at least one identified object moves, and the at least one object is located in a designated area of the first view angle.
  • the magnification of the photographing is changed to a second magnification, and a second image having a second angle of view is acquired through a second camera among the plurality of cameras, and the second magnification is the first angle of view, the second image It is determined based on a second angle of view and the position of the at least one object with respect to the first angle of view, and in a state in which the magnification of the photographing is set to the second magnification, at least a part of the second image is displayed as a preview on the display. can do.
  • the at least one processor 110 determines that the at least one object is located in a designated area of the first view angle for a designated period of time or longer, and the first camera through the first camera.
  • the acquisition of the image may be switched to the acquisition of the second image through the second camera.
  • the at least one processor 110 before switching from acquiring the first image through the first camera to acquiring the second image through the second camera, the second camera may be activated, and the at least one object may be tracked with the activated second camera.
  • the at least one processor 110 after switching from acquiring the first image through the first camera to acquiring the second image through the second camera, the at least one processor 110 At least a portion of the second image to which the blur effect is applied to at least a partial area of the area excluding the object may be displayed as a preview on the display.
  • the at least one processor 110 obtains category information of at least one object identified in the first image, and uses the second camera based on the acquired category information to determine the at least one object.
  • One object may be detected, and at least one detected object may be tracked using the second camera.
  • the electronic device 100 further includes a memory (eg, the memory 140 of FIG. 1 ), and the at least one processor 110 includes a first region of interest including the at least one object. determine a location of the at least one object in the first ROI and first information including information about a ratio of a size of the at least one object to the first ROI, stored in the memory; can be saved
  • the at least one processor 110 may determine the first ROI based on the coordinates of the at least one object.
  • the at least one processor 110 may perform the processing of the at least one object according to a change in a position of the at least one object within the first ROI or a size ratio of the at least one object to the first ROI.
  • the first information may be updated.
  • the at least one processor 110 determines a second region of interest including the at least one object based on the first information stored in the memory, and determines a region of interest within the first region of interest.
  • the ratio of the position of the at least one object and the size of the at least one object with respect to the first region of interest is the position of the at least one object in the second region of interest and the ratio of the size of the at least one object with respect to the second region of interest. It corresponds to the ratio of the size of the object, and the first camera may be deactivated based on the determination of the second ROI.
  • the at least one processor 110 may determine the size of the designated area of the first view angle based on the moving speed of at least one object identified in the first image.
  • the at least one processor 110 may determine an area adjacent to an edge of the first view angle as a designated area of the first view angle.
  • the at least one processor 110 sets an area that overlaps the second angle of view or is smaller than the second angle of view to a designated area of the first angle of view. can be determined by
  • each of the first camera and the second camera may be one of a tele camera, a wide camera, and an ultra-wide camera.
  • a method performed by an electronic device performs photographing using a plurality of cameras (eg, the camera 120 of FIG. 1 ).
  • An operation of executing a supporting application an operation of obtaining a first image having a first angle of view through a first camera among the plurality of cameras, and an operation of capturing the first image in a state in which the magnification of the photographing is set to the first magnification.
  • An operation of displaying the used preview on a display eg, the display 130 of FIG. 1 ), as the at least one object identified in the first image moves, the second displayed on the display so that the at least one object is included.
  • An operation of changing a preview using 1 image an operation of changing the magnification of the photographing to a second magnification based on the location of the at least one object in a designated area of the first view angle, an operation of changing a first magnification of the plurality of cameras, Obtaining a second image having a second angle of view through 2 cameras, wherein the second magnification is determined based on the first angle of view, the second angle of view and the position of the at least one object with respect to the first angle of view, and , displaying at least a part of the second image as a preview on the display in a state in which the magnification of the photographing is set to the second magnification.
  • the second camera based on determining that the at least one object is located in a designated area of the first view angle for a designated period of time or longer, the second camera is detected from obtaining the first image through the first camera. It may further include an operation of switching to acquisition of the second image through
  • the second camera is activated before switching from acquisition of the first image through the first camera to acquisition of the second image through the second camera, and the activated second camera An operation of tracking an object identical to the at least one object may be further included.
  • the operation of displaying at least a portion of the second image as a preview on the display may include obtaining the second image through the second camera from acquiring the first image through the first camera. After conversion, an operation of displaying the preview by applying a blur effect to at least a partial area of the area excluding the at least one object may be included.
  • an operation of obtaining category information of at least one object identified in the first image, an operation of detecting the at least one object using the second camera based on the acquired category information, and An operation of tracking the at least one detected object using the second camera may be further included.
  • an operation of determining a first region of interest including the at least one object, a position of the at least one object in the first region of interest, and a location of the at least one object with respect to the first region of interest An operation of storing first information including information about a size ratio in a memory may be further included.
  • the ratio of the size of the at least one object to the first region of interest corresponds to the ratio of the position of the at least one object in the second region of interest and the size of the at least one object to the second region of interest, and the The method may further include inactivating the first camera based on the determination of the second ROI.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Studio Devices (AREA)

Abstract

일 실시 예에 따른 전자 장치는, 복수의 카메라들, 디스플레이 및 적어도 하나의 프로세서를 포함하고, 상기 적어도 하나의 프로세서는 상기 복수의 카메라들을 이용하는 촬영을 지원하는 어플리케이션을 실행하고, 상기 복수의 카메라들 중 제1 카메라를 통해 제1 화각을 갖는 제1 이미지를 획득하고, 상기 촬영의 배율이 제1 배율로 설정된 상태에서, 상기 제1 이미지를 이용한 프리뷰를 상기 디스플레이에 표시하고, 상기 제1 이미지에서 식별된 적어도 하나의 객체가 이동함에 따라 상기 적어도 하나의 객체가 포함되도록 상기 디스플레이에 표시되는 상기 제1 이미지를 이용한 프리뷰를 변경하고, 상기 제1 화각의 지정된 영역에 상기 적어도 하나의 객체가 위치하는 것에 기반하여, 상기 촬영의 배율을 제2 배율로 변경하고, 상기 복수의 카메라들 중 제2 카메라를 통해 제2 화각을 갖는 제2 이미지를 획득하고, 상기 제2 배율은 상기 제1 화각, 상기 제2 화각 및 상기 제1 화각에 대한 상기 적어도 하나의 객체의 위치에 기반하여 결정되며, 상기 촬영의 배율이 제2 배율로 설정된 상태에서, 상기 제2 이미지의 적어도 일부를 상기 디스플레이에 프리뷰로 표시할 수 있다.

Description

복수의 렌즈들을 구비하는 전자 장치 및 그 제어 방법
본 개시는 복수의 카메라들을 포함하는 전자 장치 및 상기 전자 장치에 의해 수행되는 방법에 관한 것이다.
디지털 카메라, 디지털 캠코더, 또는 스마트 폰과 같이 카메라가 장착된 전자 장치의 보급이 활발히 이루어지고 있다. 이러한 카메라가 장착된 전자 장치는 카메라를 이용하여 촬영 중인 영상 내의 인물, 동물, 사물 등을 추적하고, 추적된 영역을 지정된 크기로 표시하는 기능을 탑재하고 있다.
또한, 카메라가 장착된 전자 장치는 카메라를 이용하여 촬영 중인 영상 내의 인물, 동물, 사물 등 관심 영역을 실시간으로 검출하고, 검출 결과를 바탕으로 줌 인/아웃 동작을 수행하여 관심 영역이 지정된 크기로 표시되도록 하는 기능을 탑재하고 있다.
한편, 단일 카메라에서는 물체를 추적하여 화면에 표시할 수 있지만 다중 카메라를 사용하는 경우 카메라 전환에 따라 자연스럽게 동일 물체를 추적하는 것은 어려울 수 있다. 화각(field of view)의 차이 및 줌 동작이 적용되는 영역의 차이로 인해 전환 시 화면 끊김이 발생할 수 있다. 또한 물체를 수동으로 다시 선택하는 경우 화면 전환이 자연스럽지 않을 수 있다.
또한, 관심 영역을 검출하여 화면에 표시할 수 있지만 단일 카메라 사용에 따른 화각 제한으로 인해 더 넓은 배경을 프레이밍 하기 어렵고, 과도한 줌 인으로 인해 화질 저하가 발생할 수 있다.
본 개시의 양태는 적어도 위에서 언급된 문제 및/또는 단점을 다루고, 적어도 아래에서 언급되는 이점을 제공하는 것이다. 따라서, 본 개시의 양태는 카메라 전환 시에도 동일한 물체가 지속적으로 추적되며, 자동 프레이밍(auto framing)이 끊임없이 지속되는 장치 및 방법 등을 제공하는 것이다.
일 실시 예에 따른 전자 장치는, 복수의 카메라들, 디스플레이, 및 적어도 하나의 프로세서를 포함하고, 상기 적어도 하나의 프로세서는 상기 복수의 카메라들을 이용하는 촬영을 지원하는 어플리케이션을 실행하고, 상기 복수의 카메라들 중 제1 카메라를 통해 제1 화각을 갖는 제1 이미지를 획득하고, 상기 촬영의 배율이 제1 배율로 설정된 상태에서, 상기 제1 이미지를 이용한 프리뷰를 상기 디스플레이에 표시하고, 상기 제1 이미지에서 식별된 적어도 하나의 객체가 이동함에 따라 상기 적어도 하나의 객체가 포함되도록 상기 디스플레이에 표시되는 상기 제1 이미지를 이용한 프리뷰를 변경하고, 상기 제1 화각의 지정된 영역에 상기 적어도 하나의 객체가 위치하는 것에 기반하여, 상기 촬영의 배율을 제2 배율로 변경하고, 상기 복수의 카메라들 중 제2 카메라를 통해 제2 화각을 갖는 제2 이미지를 획득하고, 상기 제2 배율은 상기 제1 화각, 상기 제2 화각 및 상기 제1 화각에 대한 상기 적어도 하나의 객체의 위치에 기반하여 결정되며, 상기 촬영의 배율이 제2 배율로 설정된 상태에서, 상기 제2 이미지의 적어도 일부를 상기 디스플레이에 프리뷰로 표시할 수 있다.
일 실시 예에 따른 전자 장치의 동작 방법은, 복수의 카메라들을 이용하는 촬영을 지원하는 어플리케이션을 실행하는 동작, 상기 복수의 카메라들 중 제1 카메라를 통해 제1 화각을 갖는 제1 이미지를 획득하는 동작, 상기 촬영의 배율이 제1 배율로 설정된 상태에서, 상기 제1 이미지를 이용한 프리뷰를 디스플레이에 표시하는 동작, 상기 제1 이미지에서 식별된 적어도 하나의 객체가 이동함에 따라 상기 적어도 하나의 객체가 포함되도록 상기 디스플레이에 표시되는 상기 제1 이미지를 이용한 프리뷰를 변경하는 동작, 상기 제1 화각의 지정된 영역에 상기 적어도 하나의 객체가 위치하는 것에 기반하여, 상기 촬영의 배율을 제2 배율로 변경하는 동작, 상기 복수의 카메라들 중 제2 카메라를 통해 제2 화각을 갖는 제2 이미지를 획득하는 동작, 상기 제2 배율은 상기 제1 화각, 상기 제2 화각 및 상기 제1 화각에 대한 상기 적어도 하나의 객체의 위치에 기반하여 결정되며, 상기 촬영의 배율이 제2 배율로 설정된 상태에서, 상기 제2 이미지의 적어도 일부를 상기 디스플레이에 프리뷰로 표시하는 동작을 포함할 수 있다.
본 문서에 개시된 다양한 실시 예에 따르면, 자연스럽게 카메라 전환을 함으로써 끊김없이 물체를 추적하고 자동 프레이밍을 지속할 수 있다.
본 문서에 개시된 다양한 실시 예에 따르면, 다중 카메라를 활용함에 따라 사용자로 하여금 더 넓은 화각 및 고화질의 동영상을 획득하게 할 수 있다.
이 외에, 본 문서를 통해 직접적 또는 간접적으로 파악되는 다양한 효과들이 제공될 수 있다.
도 1은 일 실시 예에 따른 전자 장치의 블록도이다.
도 2는 일 실시 예에 따른 전자 장치에서 카메라를 전환하여 프리뷰 이미지를 표시하기 위한 기능을 제어하는 개념을 나타낸다.
도 3은 일 실시 예에 따른 전자 장치가 객체의 이동에 따라 카메라를 전환하는 동작의 흐름도이다.
도 4는 일 실시 예에 따른 전자 장치가 객체가 지정된 영역에 위치함에 따라 카메라를 전환하는 동작의 흐름도이다.
도 5는 일 실시 예에 따른 전자 장치가 제1 카메라 및 제2 카메라에서 동일한 객체를 추적하는 동작의 흐름도이다.
도 6a는 일 실시 예에 따른 전자 장치에서 제1 카메라의 화각이 제2 카메라의 화각보다 작은 경우 제1 화각에서의 전환 영역을 도시한다.
도 6b는 일 실시 예에 따른 전자 장치에서 제1 카메라의 화각이 제2 카메라의 화각보다 큰 경우 제1 화각에서의 전환 영역을 도시한다.
도 7은 일 실시 예에 따른 전자 장치에서 제1 카메라로 추적하는 객체의 카테고리 정보를 획득하는 동작의 흐름도이다.
도 8a 및 도 8b는 일 실시 예에 따른 전자 장치에서 제1 카메라의 화각이 제2 카메라의 화각보다 작은 경우 객체의 이동에 따라 줌 정보를 추출하는 것을 도시한다.
도 9a 및 도 9b는 일 실시 예에 따른 전자 장치에서 제1 카메라의 화각이 제2 카메라의 화각보다 큰 경우 객체의 이동에 따라 줌 정보를 추출하는 것을 도시한다.
도 10은 일 실시 예에 따른 전자 장치가 추적하는 객체의 카테고리 정보에 기반하여 제2 카메라에서 동일 객체를 추적하는 것을 나타낸 흐름도이다.
도 11a는 일 실시 예에 따른 전자 장치에서 추적하는 객체가 사람인 경우 제2 카메라에서 동일 객체를 추적하는 것을 나타낸 흐름도이다.
도 11b는 일 실시 예에 따른 전자 장치에서 추적하는 객체가 동물인 경우 제2 카메라에서 동일 객체를 추적하는 것을 나타낸 흐름도이다.
도 12는 일 실시 예에 따른 전자 장치에서 줌 영역을 재계산하는 것을 나타낸 흐름도이다.
도 13a는 일 실시 예에 따른 전자 장치에서 제1 카메라의 화각이 제2 카메라의 화각보다 작은 경우 제2 관심 영역이 결정된 것을 도시한다.
도 13b는 일 실시 예에 따른 전자 장치에서 제1 카메라의 화각이 제2 카메라의 화각보다 큰 경우 제2 관심 영역이 결정된 것을 도시한다.
도 14는 일 실시 예들에 따른 네트워크 환경 내의 전자 장치의 블록도이다.
도 15는 일 실시 예에 따른, 카메라 모듈을 예시하는 블록도이다.
도면의 설명과 관련하여, 동일 또는 유사한 구성요소에 대해서는 동일 또는 유사한 참조 부호가 사용될 수 있다.
이하, 본 발명의 다양한 실시 예가 첨부된 도면을 참조하여 기재된다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 실시 예의 다양한 변경(modification), 균등물(equivalent), 및/또는 대체물(alternative)을 포함하는 것으로 이해되어야 한다.
도 1은 일 실시 예에 따른 전자 장치의 블록도이다.
도 1을 참조하면, 일 실시 예에 따른 전자 장치(100)는, 프로세서(110), 카메라(120), 디스플레이(130) 및 메모리(140)를 포함할 수 있다. 다양한 실시 예에서, 전자 장치(100)는 도 1에 도시된 구성요소 외에 추가적인 구성요소를 포함하거나, 도 1에 도시된 구성요소 중 적어도 하나를 생략할 수 있다.
일 실시 예에 따르면, 프로세서(110)는 메모리(140)에 저장된 인스트럭션들을 이용하여 전자 장치(100)의 적어도 하나의 다른 구성요소들의 제어 및/또는 통신에 관한 연산이나 데이터 처리를 실행할 수 있다. 일 실시 예에 따르면, 프로세서(110)는 중앙처리장치(CPU), 그래픽처리장치(GPU), MCU(micro controller unit), 센서 허브, 보조프로세서(supplementary processor), 통신프로세서(communication processor), 애플리케이션 프로세서(application processor), ASIC(application specific integrated circuit), FPGA(field programmable gate arrays) 중 적어도 하나를 포함할 수 있으며, 복수의 코어들을 가질 수 있다.
일 실시 예에 따르면, 프로세서(110)는 카메라(120)를 통해 이미지를 획득할 수 있다. 일 실시 예에 따르면, 프로세서(110)는 카메라(120)를 통해 획득한 이미지를 디스플레이(130)에 프리뷰 형태로 제공할 수 있다. 일 실시 예에 따르면, 프로세서(110)는 카메라(120)를 이용하여 복수의 이미지 프레임들을 획득할 수 있다. 일 실시 예에 따르면, 프로세서(110)는 카메라(120)를 이용하여 복수의 이미지 프레임들에 포함된 적어도 하나의 객체를 식별하거나, 또는 그 물체의 움직임을 추정 또는 추적할 수 있다. 예를 들어, 프로세서(110)는 이전 프레임에서 식별된 적어도 하나의 객체와 동일한 객체를 현재 프레임에서 식별하여 객체의 움직임을 추적할 수 있다.
일 실시 예에 따르면, 프로세서(110)는 추적되는 물체의 크기 및/또는 물체의 좌표에 기반하여 카메라(120)를 전환할 수 있다. 예를 들어, 프로세서(110)는 추적되는 물체의 크기 및/또는 물체의 좌표에 기반하여 줌 인 되어야 하는 것으로 판단되는 경우 화각이 큰 카메라에서 화각이 작은 카메라로 전환할 수 있다. 또한 예를 들어, 프로세서(110)는 추적되는 물체의 크기 및/또는 물체의 좌표에 기반하여 줌 아웃 되어야 하는 것으로 판단되는 경우 화각이 작은 카메라에서 화각이 큰 카메라로 전환할 수 있다. 카메라에서 다른 카메라로의 전환은, 프리뷰를 위해 카메라를 이용하는 것으로부터 상기 프리뷰를 위해 다른 카메라를 이용하는 것으로의 전환, 이미지 캡처를 위해 카메라를 이용하는 것으로부터 상기 이미지 캡처를 위해 다른 카메라를 이용하는 것으로의 전환, 이미지 처리 기능(예: 트래킹)을 위해 카메라를 이용하는 것으로부터 상기 이미지 처리 기능을 위해 다른 카메라를 이용하는 것으로의 전환, 이미지 또는 카메라 관련 기능을 위해 카메라를 이용하는 것으로부터 상기 이미지 또는 카메라 관련 기능을 위해 다른 카메라를 이용하는 것으로의 전환, 및 프로세서에 의한 동작을 수행하기 위해 카메라를 이용하는 것으로부터 상기 프로세서에 의한 동작을 수행하기 위해 다른 카메라를 이용하는 것으로의 전환 중 적어도 하나를 포함할 수 있다.
프로세서(110)의 동작과 관련된 구체적인 내용은 도 3 내지 도 5, 도 7, 도 10, 도 11a, 도 11b 및 도 12를 참조하여 후술한다.
일 실시 예에 따르면, 카메라(120)는 영상(예: 정지 영상 및 동영상)을 획득(acquire)(또는 촬영)할 수 있다. 예를 들면, 카메라(120)와 전기적으로 연결되는 이미지 시그널 프로세서는, 영상(예: 프리뷰 영상 또는 메모리(140)에 저장된 영상)에 포함된 객체(예: 사람, 동물, 사물)와 배경을 구분할 수 있다. 일 실시 예에 따르면, 이미지 시그널 프로세서는 카메라(120)로부터 분리되거나, 프로세서(110)의 일부로서 구현될 수 있다. 일 실시 예에 따르면, 카메라(120)는 이미지 센서(예: 도 15의 이미지 센서(1530))를 포함할 수 있다. 일 실시 예에 따르면, 이미지 센서는 색상 정보를 획득 및/또는 처리할 수 있다.
일 실시 예에 따르면, 카메라(120)는 복수의 렌즈들을 포함하고, 상기 복수의 렌즈들 각각은 서로 상이한 줌 레벨을 가지고 있을 수 있다. 예를 들어, 상기 복수의 렌즈들은 울트라 와이드 렌즈(ultra-wide lens), 와이드 렌즈(wide lens) 및 텔레 렌즈(tele lens) 중 적어도 두 개를 포함할 수 있다. 일 실시 예에 따르면, 카메라(120)는 제1 카메라(121) 및 제2 카메라(122)을 포함할 수 있다. 일 실시 예에 따르면, 제1 카메라(121) 및 제2 카메라(122)는 서로 상이한 렌즈를 가질 수 있다. 예를 들어, 제1 카메라(121)가 와이드 렌즈를 가지고 제2 카메라(122)가 울트라 와이드 렌즈를 가질 수 있다. 또한 예를 들어, 제1 카메라(121)가 울트라 와이드 렌즈를 가지고 제2 카메라(122)가 와이드 렌즈를 가질 수 있다. 또한, 예를 들어, 제1 카메라(121)가 텔레 렌즈를 가지고 제2 카메라(122)가 와이드 렌즈를 가질 수 있다. 또한 예를 들어, 제1 카메라(121)가 와이드 렌즈를 가지고 제2 카메라(122)가 텔레 렌즈를 가질 수 있다.
일 실시 예에 따르면, 디스플레이(130)는 카메라(120) 중 제1 카메라(121)를 통해 획득한 제1 화각을 갖는 제1 이미지를 표시할 수 있다. 일 실시 예에 따르면, 디스플레이(130)는 촬영 배율이 제1 배율로 설정된 상태에서, 제1 화각을 갖는 제1 이미지의 프리뷰를 표시할 수 있다. 일 실시 예에 따르면, 디스플레이(130)는 카메라(120) 중 제2 카메라(122)를 통해 획득한 제2 화각을 갖는 제2 이미지를 표시할 수 있다. 일 실시 예에 따르면, 디스플레이(130)는 촬영 배율이 제2 배율로 설정된 상태에서, 제2 화각을 갖는 제2 이미지의 프리뷰를 표시할 수 있다.
일 실시 예에 따르면, 디스플레이(130)는, 프로세서(110)에서 처리된 영상 신호, 데이터 신호, OSD(on screen display) 신호, 제어 신호 등을 변환하여 구동 신호를 생성할 수 있다. 일 실시 예에 따르면, 디스플레이(130)는 PDP(plasma display panel), LCD(liquid crystal display), OLED(organic light emitting diode), 플렉서블 디스플레이(flexible display) 등으로 구현될 수 있으며, 또한, 3차원 디스플레이(3D display)로 구현될 수 있다. 일 실시 예에 따르면, 디스플레이(130)는, 터치 스크린으로 구성되어 출력 장치 이외에 입력 장치로 사용될 수 있다.
일 실시 예에 따르면, 메모리(140)는, 하나 이상의 메모리 집합을 의미할 수 있다. 일 실시 예에 따르면, 메모리(140)는, 다른 구성 요소들(예: 프로세서(110), 디스플레이(130))로부터 수신되거나 다른 구성요소들에 의해 생성된 데이터 및/또는 명령을 저장할 수 있다.
도 2는 일 실시 예에 따른 전자 장치에서 카메라를 전환하여 프리뷰 이미지를 표시하기 위한 기능을 제어하는 개념을 나타낸다.
도 2를 참조하면, 일 실시 예에 따른 전자 장치(100)에서 복수의 카메라들을 이용하는 촬영을 지원하는 어플리케이션(200)은 객체 검출 및 추적 모듈(210), 줌 영역 계산 모듈(220), 카메라 전환 판단 모듈(230), 추적 정보 및 줌 정보 추출 모듈(240), 추적 정보 및 줌 정보 전달 모듈(250), 객체 재추적 모듈(260), 줌 영역 매칭 및 재계산 모듈(270) 및 카메라 전환 모듈(280)을 포함할 수 있다. 다양한 실시 예에서, 전자 장치(100)는 도 2에 도시된 구성요소 외에 추가적인 구성요소를 포함하거나, 도 2에 도시된 구성요소 중 적어도 하나를 생략할 수 있다.
일 실시 예에 따르면, 객체 검출 및 추적 모듈(210)은 객체 검출 모드 및/또는 추적 모드에서 동작할 수 있다. 일 실시 예에 따르면, 객체 검출 및 추적 모듈(210)은 객체 검출 모드에서 카메라(120)로 획득한 이미지의 프리뷰에서 객체(또는 물체)를 자동으로 검출하거나 디스플레이(130)에 대한 사용자 입력(예: 터치 입력)을 수신하는 것에 응답하여 수동으로 검출할 수 있다. 일 실시 예에 따르면, 객체 검출 및 추적 모듈(210)은 검출된 객체를 추적할 수 있다. 일 실시 예에 따르면, 객체 검출 및 추적 모듈(210)은 사람의 얼굴, 신체 일부 또는 전체, 동물 또는 사물을 객체로 검출(또는 식별)할 수 있고, 추적 대상 객체는 한 개 또는 복수 개가 될 수 있다. 일 실시 예에 따르면, 객체 검출 및 추적 모듈(210)은 사용자 입력(예: 터치 입력)을 수신하는 것에 응답하여 사람의 얼굴, 신체 일부 또는 전체, 동물 또는 사물을 객체로 검출(또는 식별)할 수 있다.
일 실시 예에 따르면, 객체 검출 및 추적 모듈(210)은 추적모드에서 검출된 적어도 하나의 객체를 지속적으로 추적하고, 적어도 하나의 객체의 좌표를 줌 영역 계산 모듈(220)로 전달할 수 있다. 예를 들어, 객체 검출 및 추적 모듈(210)은 검출된 객체가 복수개인 경우 객체 각각의 좌표를 줌 영역 계산 모듈(220)로 전달할 수 있다.
일 실시 예에 따르면, 줌 영역 계산 모듈(220)은 객체 검출 및 추적 모듈(210)로부터 전달받은 적어도 하나의 객체의 좌표에 기반하여 줌 인 또는 줌 아웃을 적용할 영역을 계산할 수 있다. 본 문서에서 줌 영역은 줌 인 또는 줌 아웃이 적용되어 디스플레이(130)에 표시되는 영역을 의미할 수 있다. 본 문서에서 줌 영역은 관심 영역(ROI, region of interest)으로 참조될 수 있다. 일 실시 예에 따르면, 줌 영역은 프리뷰 내 일부 영역일 수 있고, 줌 영역이 점점 커질수록 디스플레이(130)에서 줌 아웃 효과가 발생할 수 있다. 일 실시 예에 따르면, 줌 영역이 점점 작아질수록 디스플레이(130)에서 줌 인 효과가 발생할 수 있다.
일 실시 예에 따르면, 줌 영역은 모든 객체의 좌표를 포함하는 영역이 될 수 있고, 일부 객체만 포함하는 영역이 될 수 있다. 일 실시 예에 따르면, 줌 영역은 프리뷰 전체 영역이 될 수 있으며, 일부 영역이 될 수 있다. 일 실시 예에 따르면, 프리뷰 내 객체 좌표 위치에 따라 일부 객체는 줌 영역에서 제외될 수 있다. 예를 들어, 객체 좌표의 위치가 프리뷰 내의 외곽 영역에 있는 경우, 객체는 줌 영역에서 제외될 수 있다. 일 실시 예에 따르면, 프리뷰 내의 외곽 영역은 전체 프리뷰 면적의 특정 퍼센트로 결정될 수 있다. 일 실시 예에 따르면, 줌 영역의 최소 크기는 화질 저하를 최소로 하는 크기로 결정될 수 있다. 일 실시 예에 따르면, 줌 영역의 최소 크기는 전체 프리뷰 면적의 일정 비율로 결정될 수 있다.
일 실시 예에 따르면, 카메라 전환 판단 모듈(230)은 추적되고 있는 객체의 크기와 좌표, 줌 영역 크기 및 위치에 따라 동작할 수 있다. 일 실시 예에 따르면, 각 카메라 렌즈 마다 화질 저하를 최소로 하는 최소 줌 영역 크기가 존재하고, 프리뷰 내 줌 영역이 이동될 수 있는 영역이 존재한다.
일 실시 예에 따르면, 카메라 전환 판단 모듈(230)은 추적하고 있는 객체가 프리뷰 내 외곽 영역으로 이동하는지 여부, 줌 영역 크기가 프리뷰 크기와 동일한지 여부 또는 줌 영역의 크기가 지정된 크기 이상인지 여부를 판단할 수 있다. 일 실시 예에 따르면, 카메라 전환 판단 모듈(230)은 추적하고 있는 객체가 프리뷰 내 외곽 영역으로 이동하는 경우, 줌 영역 크기가 프리뷰 크기와 동일한 경우 또는 줌 영역의 크기가 지정된 크기 이상인 경우 현재 카메라보다 화각이 넓은 카메라로 전환해야 하는 것으로 판단할 수 있다.
일 실시 예에 따르면, 카메라 전환 판단 모듈(230)은 추적하고 있는 객체가 제1 카메라의 프리뷰와 제2 카메라의 프리뷰가 중첩된 영역에 존재하는지 여부, 줌 영역의 면적이 최소 크기인지 여부 또는 줌 영역의 크기가 임계값(threshold) 미만인지 여부를 판단할 수 있다. 일 실시 예에 따르면, 제1 카메라의 프리뷰와 제2 카메라의 프리뷰가 중첩된 영역은 캘리브레이션 정보를 통해 획득될 수 있다.
일 실시 예에 따르면, 카메라 전환 판단 모듈(230)은 추적하고 있는 객체가 제1 카메라의 프리뷰와 제2 카메라의 프리뷰가 중첩된 영역에 존재하는 경우, 줌 영역의 면적이 최소 크기인 것으로 판단되면 현재 카메라보다 화각이 좁은 카메라로 전환해야 하는 것으로 판단할 수 있다. 일 실시 예에 따르면, 카메라 전환 판단 모듈(230)은 추적하고 있는 객체가 제1 카메라의 프리뷰와 제2 카메라의 프리뷰가 중첩된 영역에 존재하는 경우, 줌 영역의 크기가 임계값 미만인 것으로 판단되면 현재 카메라보다 화각이 좁은 카메라로 전환해야 하는 것으로 판단할 수 있다.
일 실시 예에 따르면, 임계값은 현재 카메라의 화각 값에 기반하여 계산될 수 있다. 일 실시 예에 따르면, 카메라 전환 판단 모듈(230)은 카메라를 전환해야 하는 것으로 판단되면, 전환될 카메라를 활성화할 수 있다. 일 실시 예에 따르면, 카메라 전환 판단 모듈(230)은 객체 좌표 및 줌 영역이 지정된 영역 밖으로 이동하는 경우, 전환될 카메라를 비활성화 할 수 있다. 본 문서에서, 카메라 전환 판단 모듈(230)이 카메라를 전환할 것으로 판단하기 위해 객체가 위치하는 영역은 지정된 영역 또는 전환 영역으로 참조될 수 있다. 본 문서에서, 전환 전 카메라 또는 현재 카메라는 제1 카메라로, 전환 후 카메라 또는 전환될 카메라는 제2 카메라로 참조될 수 있다.
일 실시 예에 따르면, 카메라 전환 판단 모듈(230)이 현재 카메라보다 화각이 넓은 카메라로 전환해야 하는 것으로 판단한 후 객체 좌표 및 줌 영역이 지정된 영역(또는 전환 영역)(예: 프리뷰 내 외곽 영역)을 벗어나는 경우, 카메라 전환 판단 모듈(230)은 전환될 카메라를 비활성화 할 수 있다. 다른 예를 들어, 카메라 전환 판단 모듈(230)이 현재 카메라보다 화각이 좁은 카메라로 전환해야 하는 것으로 판단한 후 객체 좌표 및 줌 영역이 지정된 영역(또는 전환 영역)(예: 프리뷰 중심 영역)을 벗어나는 경우, 카메라 전환 판단 모듈(230)은 전환될 카메라를 비활성화 할 수 있다.
일 실시 예에 따르면, 추적 정보 및 줌 정보 추출 모듈(240)은 추적 정보 추출 모드 및/또는 줌 정보 추출 모드에서 동작할 수 있다. 일 실시 예에 따르면, 추적 정보 및 줌 정보 추출 모듈(240)은 추적 정보 추출 모드에서, 객체 추적이 시작되었을 때부터 추적 정보를 추출할 수 있고, 객체 추적 영역 및 줌 영역이 전환 영역에 존재하여 전환될 카메라가 활성화되었을 때 추적 정보를 추출할 수 있다. 일 실시 예에 따르면, 추출된 추적 정보는 갱신될 수 있다. 예를 들어, 추적 정보는 추적되는 객체의 크기, 좌표, 객체의 텍스처, 객체의 색 및 객체를 둘러싼 영역의 텍스처 중 적어도 하나를 포함할 수 있다. 또한 예를 들어, 추적되는 객체가 사람인 경우 추적 정보는 헤어 스타일, 눈, 코, 입, 눈썹, 얼굴 정보, 옷의 텍스처, 신발의 텍스처, 사일리언스 맵(saliency map), 현재 카메라의 화각 및 캘리브레이션 데이터 중 적어도 하나를 포함할 수 있다. 일 실시 예에 따르면, 추적 정보는 복수 개의 객체의 추적 정보를 포함할 수 있다. 일 실시 예에 따르면, 추적 정보는 추적되는 객체에 대한 카테고리 정보를 포함할 수 있다. 예를 들어, 추적되는 객체에 대한 카테고리는 사람, 동물 또는 사물을 포함할 수 있다. 일 실시 예에 따르면, 추적 정보 및 줌 정보 추출 모듈(240)은 줌 정보 추출 모드에서 카메라 화각 정보, 프리뷰 크기, 줌 영역 크기 및 전체 프리뷰 내 줌 영역 위치 중 적어도 하나를 추출할 수 있다.
일 실시 예에 따르면, 추적 정보 및 줌 정보 전달 모듈(250)은 전환될 카메라에 추적 정보 및 줌 정보를 전달할 수 있다. 일 실시 예에 따르면, 추적 정보 및 줌 정보는 메모리(140)에 저장이 되며, 전환될 카메라는 메모리(140)로부터 추적 정보 및/또는 줌 정보를 획득할 수 있다. 일 실시 예에 따르면, 전환되기 전 카메라와 전환된 후 카메라는 추적 정보 및 줌 정보를 공유할 수 있다.
일 실시 예에 따르면, 객체 재추적 모듈(260)은 전환 전 카메라에서 추적하던 객체와 동일한 객체를 추적할 수 있다. 일 실시 예에 따르면, 객체 재추적 모듈(260)은 전환된 카메라에서 전환 전 카메라에서 추적하던 객체와 동일한 객체를 식별하기 위하여 전달된(또는 획득한) 추적 정보를 사용할 수 있다. 일 실시 예에 따르면, 객체 재추적 모듈(260)은 전환 전 카메라에서 획득한 이미지의 프리뷰 크기, 프리뷰 내 객체 좌표, 객체 크기 및 캘리브레이션 데이터 중 적어도 하나를 기반으로 전환될 카메라에서 획득한 이미지의 프리뷰에서 동일 객체의 위치를 예측할 수 있다. 일 실시 예에 따르면, 동일 객체 예상 영역에는 복수의 객체가 존재할 수 있다. 예를 들어, 추적되는 객체에는 사람과 동물, 사물이 모두 포함될 수 있고, 동일 객체 예상 영역에서 사람, 동물 또는 사물이 존재할 수 있다. 일 실시 예에 따르면, 객체 재추적 모듈(260)은 획득한 카테고리 정보에 기반하여 해당 카테고리에 포함되는 객체만 검출할 수 있다. 일 실시 예에 따르면, 객체 재추적 모듈(260)은 검출된 객체에서 추적 정보를 추출할 수 있고, 추출된 정보를 전달받은 추적 정보와 비교하여 동일 객체를 식별할 수 있다. 일 실시 예에 따르면, 객체 재추적 모듈(260)은 동일 객체를 찾은 후 전환될 카메라에서 객체 추적을 시작할 수 있다.
일 실시 예에 따르면, 줌 영역 매칭 및 재계산 모듈(270)은 카메라 전환 시 부드럽게 전환될 수 있도록 줌 영역을 계산할 수 있다. 일 실시 예에 따르면, 줌 영역 매칭 및 재계산 모듈(270)은 전환될 카메라에서 획득한 이미지의 프리뷰에서 추적 객체의 위치 및 크기에 기반하여 전환 전 카메라의 줌 영역과 동일한 영역을 결정할 수 있다. 예를 들어, 줌 영역 매칭 및 재계산 모듈(270)은 줌 영역에서 객체의 영역이 차지하는 비율(ratio)에 기반하여 줌 영역을 계산할 수 있다. 일 실시 예에 따르면, 카메라 전환 전 줌 영역 내에서의 추적 객체의 상대적 위치 및 상대적 크기는 전환 후의 줌 영역 내에서의 추적 객체의 상대적 위치 및 상대적 크기와 각각 동일하거나 대응될 수 있다.
일 실시 예에 따르면, 카메라 전환 모듈(280)은 줌 영역이 계산된 후 전환 전 카메라를 비활성화하고 전환 후 카메라로 획득한 이미지에서 줌 영역을 디스플레이(130)에 표시할 수 있다. 일 실시 예에 따르면, 카메라 전환 모듈(280)은 전환되기 전과 후의 카메라 화각 차이로 인한 왜곡이 발생함에 따라, 전환 시 객체 주변 영역에 블러 효과를 적용하여 자연스럽게 전환할 수 있다.
도 3은 일 실시 예에 따른 전자 장치(예: 도 1의 전자 장치(100))가 객체의 이동에 따라 카메라를 전환하는 동작의 흐름도이다.
도 3을 참조하면, 일 실시 예에 따른 프로세서(예: 도 1의 프로세서(110))는 동작 310에서 복수의 카메라들을 이용하는 촬영을 지원하는 어플리케이션(예: 도 2의 어플리케이션(200))을 실행할 수 있다. 예를 들어, 촬영을 지원하는 어플리케이션(200)은 카메라 어플리케이션을 포함할 수 있다. 일 실시 예에 따르면, 프로세서(110)는 어플리케이션(200)의 실행화면을 디스플레이(예: 도 1의 디스플레이(130))를 통해 출력할 수 있다.
일 실시 예에 따르면, 프로세서(110)는 동작 320에서 복수의 카메라들 중 제1 카메라(예: 도 1의 제1 카메라(121))를 통해 제1 화각을 갖는 제1 이미지를 획득할 수 있다. 일 실시 예에 따르면, 프로세서(110)는 촬영을 지원하는 어플리케이션(200)이 실행된 상태에서 제1 카메라(121)를 통해 제1 화각을 갖는 제1 이미지를 획득할 수 있다. 예를 들어, 제1 카메라는 텔레 카메라, 와이드 카메라 및 울트라 와이드 카메라 중 하나일 수 있다.
일 실시 예에 따르면, 프로세서(110)는 동작 330에서 촬영의 배율이 제1 배율로 설정된 상태에서, 제1 이미지의 프리뷰를 디스플레이(130)에 표시할 수 있다. 일 실시 예에 따르면, 일 실시 예에 따르면, 프로세서(110)는 제1 카메라(121)의 줌 레벨로 수신된 이미지를 프리뷰로 디스플레이에 표시할 수 있다. 예를 들어, 프로세서(110)는 텔레 카메라의 줌 레벨로 수신된 이미지를 프리뷰로 디스플레이(130)에 표시할 수 있다. 또한 예를 들어, 프로세서(110)는 와이드 카메라의 줌 레벨로 수신된 이미지를 프리뷰로 디스플레이(130)에 표시할 수 있다. 또한 예를 들어, 프로세서(110)는 울트라 와이드 카메라의 줌 레벨로 수신된 이미지를 프리뷰로 디스플레이(130)에 표시할 수 있다.
일 실시 예에 따르면, 프로세서(110)는 동작 340에서 제1 이미지에서 식별된 적어도 하나의 객체가 이동함에 따라 적어도 하나의 객체가 포함되도록 디스플레이(130)에 표시되는 제1 이미지의 프리뷰를 변경할 수 있다. 일 실시 예에 따르면, 프로세서(110)는 제1 이미지에서 식별되는 객체가 움직임에 따라 제1 이미지의 프리뷰를 변경함으로써 사용자가 디스플레이(130)를 통해 객체를 확인할 수 있도록 할 수 있다.
일 실시 예에 따르면, 프로세서(110)는 동작 350에서 제1 화각의 지정된 영역에 적어도 하나의 객체가 위치하는 것에 응답하여, 배율을 제2 배율로 변경하며 복수의 카메라들 중 제2 카메라(예: 도 1의 제2 카메라(122))를 통해 제2 화각을 갖는 제2 이미지를 획득할 수 있다. 예를 들어, 제2 배율은 제1 배율과 구별되는 임의의 배율을 의미할 수 있다. 일 실시 예에 따르면, 프로세서(110)는 제1 이미지에서 식별되는 적어도 하나의 객체가 제1 화각의 지정된 영역에 위치하는지 여부를 판단할 수 있다.
예를 들어, 제1 화각이 제2 화각보다 작은 경우, 프로세서(110)는 제1 이미지에서 식별되는 적어도 하나의 객체의 중심점이 제1 화각의 가장자리에 인접한 영역 내에 포함되는지 판단할 수 있다. 더 구체적으로 예를 들면, 프로세서(110)는 제1 이미지에서 식별되는 적어도 하나의 객체의 중심점이 제1 화각의 가장자리로부터 약 10% 범위 내에 포함되는지 판단할 수 있다. 다만, 상기 지정된 영역이 제1 화각의 가장자리로부터 약 10% 이내인 영역으로 예시를 든 것은 일 예시에 불과하며, 상기 지정된 영역은 상기 제1 화각의 가장자리로부터 약 10% ~ 약 90% 내에서 다양하게 정의될 수 있다.
다른 예를 들어, 제1 화각이 제2 화각보다 큰 경우, 프로세서(110)는 제1 이미지에서 식별되는 적어도 하나의 객체의 중심점이, 제2 화각과 중첩되거나 제2 화각보다 작은 영역에 포함되는지 여부를 판단할 수 있다. 또한 예를 들어, 프로세서(110)는 제1 이미지에서 식별되는 적어도 하나의 객체의 중심점이 제1 카메라의 프리뷰와 제2 카메라의 프리뷰가 중첩된 영역 내에 포함되는지 판단할 수 있다. 더 구체적으로 예를 들면, 프로세서(110)는 제1 이미지에서 식별되는 적어도 하나의 객체의 중심점이 제1 화각의 중심으로부터 약 10% 범위 내에 포함되는지 판단할 수 있다. 다만, 상기 지정된 영역이 제1 화각의 중심으로부터 약 10% 이내인 영역으로 예시를 든 것은 일 예시에 불과하며, 상기 지정된 영역은 상기 제1 화각의 중심으로부터 약 10% ~ 약 90% 내에서 다양하게 정의될 수 있다.
일 실시 예에 따르면, 프로세서(110)는 제1 이미지에서 식별된 적어도 하나의 객체가 제1 화각의 지정된 영역에 위치하는 것에 응답하여, 촬영을 지원하는 어플리케이션(200)이 실행된 상태에서 제2 카메라(122)를 통해 제2 화각을 갖는 제2 이미지를 획득할 수 있다. 예를 들어, 제1 카메라는 텔레 카메라, 와이드 카메라 및 울트라 와이드 카메라 중 하나일 수 있다.
일 실시 예에 따르면, 프로세서(110)는 동작 360에서 촬영의 배율이 제2 배율로 설정된 상태에서, 제2 이미지의 적어도 일부를 디스플레이(130)에 프리뷰로 표시할 수 있다. 일 실시 예에 따르면, 일 실시 예에 따르면, 프로세서(110)는 제2 카메라(122)의 줌 레벨로 수신된 이미지를 프리뷰로 디스플레이에 표시할 수 있다. 예를 들어, 프로세서(110)는 텔레 카메라의 줌 레벨로 수신된 이미지를 프리뷰로 디스플레이(130)에 표시할 수 있다. 또한 예를 들어, 프로세서(110)는 와이드 카메라의 줌 레벨로 수신된 이미지를 프리뷰로 디스플레이(130)에 표시할 수 있다. 또한 예를 들어, 프로세서(110)는 울트라 와이드 카메라의 줌 레벨로 수신된 이미지를 프리뷰로 디스플레이(130)에 표시할 수 있다.
일 실시 예에 따르면, 프로세서(110)는 디스플레이(130)에 표시되는 프리뷰를 제1 이미지에서 제2 이미지의 적어도 일부 영역으로 변경할 수 있다. 일 실시 예에 따르면, 프로세서(110)는 제1 카메라를 통해 획득된 제1 이미지를 표시한 상태에서, 배율이 제1 배율에서 제2 배율로 점진적으로 변경됨에 따라, 디스플레이(130)에 표시되는 프리뷰를 제2 카메라를 통해 획득된 제2 이미지의 적어도 일부 영역으로 변경할 수 있다.
도 4는 일 실시 예에 따른 전자 장치가 객체가 지정된 영역에 위치함에 따라 카메라를 전환하는 동작의 흐름도이다. 도 4의 내용과 관련하여 전술한 내용과 중복되거나 대응되는 내용은 간략히 하거나 생략한다.
도 4를 참조하면, 일 실시 예에 따른 프로세서(110)는 동작 410에서 제1 이미지에서 객체를 검출하고 추적할 수 있다. 일 실시 예에 따르면, 프로세서(110)는 제1 이미지의 프리뷰에서 사람 머리, 신체 일부 또는 전체, 동물 또는 사물을 자동으로 검출할 수 있다. 일 실시 예에 따르면, 프로세서(110)는 디스플레이(130)에 제1 이미지의 프리뷰가 표시된 상태에서, 디스플레이(130)에 대한 사용자 입력(예: 터치 입력)을 수신하는 것에 응답하여 제1 이미지에서 추적할 객체를 검출할 수 있다. 예를 들어, 검출되는 객체는 한 개 또는 복수 개일 수 있다.
일 실시 예에 따르면, 프로세서(110)는 동작 420에서 제1 이미지 내의 제1 관심 영역을 계산할 수 있다. 일 실시 예에 따르면, 프로세서(110)는 제1 이미지에서 검출된 객체의 좌표를 기반으로 제1 관심 영역을 계산할 수 있다. 일 실시 예에 따르면, 프로세서(110)는 객체 전부를 포함하거나 객체의 일부만 포함하도록 제1 관심 영역을 계산할 수 있다. 일 실시 예에 따르면, 프로세서(110)는 프리뷰 전체가 되거나 프리뷰의 일부 영역이 되도록 제1 관심 영역을 계산할 수 있다.
일 실시 예에 따르면, 프로세서(110)는 동작 430에서 제1 카메라(121)를 이용하여 줌 인 또는 줌 아웃할 수 있다. 일 실시 예에 따르면, 프로세서(110)는 검출된 객체의 크기에 기반하여 제1 관심 영역의 크기를 결정할 수 있다. 일 실시 예에 따르면, 프로세서(110)는 제1 관심 영역의 크기에 따라 제1 카메라를 이용하여 줌 인 또는 줌 아웃 동작을 수행할 수 있다. 예를 들어, 제1 관심 영역의 크기가 작아지면 프로세서(110)는 제1 카메라(121)를 이용하여 줌 인 동작을 수행할 수 있다. 다른 예를 들어, 줌 영역의 크기가 커지면 프로세서(110)는 제1 카메라(121)를 이용하여 줌 아웃 동작을 수행할 수 있다. 제1 관심 영역의 최소 크기는 화질 열화가 최소인 크기일 수 있으며, 화질 열화 기준은 사용자에 의해 정의될 수 있다.
일 실시 예에 따르면, 프로세서(110)는 동작 440에서 객체가 제1 화각의 지정된 영역에 위치하는지 여부를 판단할 수 있다. 일 실시 예에 따르면, 프로세서(110)는 검출된 객체를 추적할 수 있다. 일 실시 예에 따르면, 프로세서(110)는 검출된 객체에 대응되는 객체 영역을 결정하고, 객체 영역을 추적할 수 있다. 예를 들어, 객체 영역은 검출된 객체보다 큰 마진 영역을 포함할 수 있다. 프로세서(110)는 객체 영역에 마진 영역을 포함시켜 객체의 미세한 떨림과 같은 움직임이 있는 경우, 이를 무시하여 프리뷰 이미지가 흔들리는 것을 방지할 수 있다.
일 실시 예에 따르면, 추적되는 객체가 제1 화각의 지정된 영역(또는 전환 영역)으로 이동하는지 여부를 판단할 수 있다. 이 때, 추적되는 객체는 한 개 또는 복수 개일 수 있다. 예를 들어, 제1 화각이 제2 화각보다 작은 경우의 지정된 영역은 제1 화각의 가장자리에 인접한 영역을 의미할 수 있다. 다른 예를 들어, 제1 화각이 제2 화각보다 큰 경우의 지정된 영역은 제1 카메라의 프리뷰와 제2 카메라의 프리뷰가 중첩된 영역을 의미할 수 있다.
일 실시 예에 따르면, 프로세서(110)는 추적되는 객체의 이동 속도에 기반하여 지정된 영역을 결정할 수 있다. 예를 들어, 프로세서(110)는 추적되는 객체의 이동 속도가 빠를수록 지정된 영역의 크기를 크게 결정할 수 있다. 또한 예를 들어, 프로세서(110)는 추적되는 객체의 이동속도가 느릴수록 지정된 영역의 크기를 작게 결정할 수 있다. 다만, 이에 제한되지 않으며, 프로세서(110)는 지정된 영역의 크기를 다양하게 결정할 수 있다.
일 실시 예에 따르면, 프로세서(110)는 객체가 제1 화각의 지정된 영역에 위치하는 것으로 판단되는 경우 동작 450에서 제1 카메라(121)를 이용하여 줌 인 또는 줌 아웃을 할 수 있다. 일 실시 예에 따르면, 프로세서(110)는 추적되는 객체가 제1 화각의 지정된 영역으로 이동한 것으로 판단되는 경우, 카메라 전환 시 부드럽게 전환되도록 제1 관심 영역의 크기를 조절하여 디스플레이(130)를 통해 줌 인 또는 줌 아웃 효과를 제공할 수 있다. 예를 들어, 제1 화각이 제2 화각보다 큰 경우 프로세서(110)는 제1 관심 영역의 크기를 줄여 줌 인 효과를 제공할 수 있다. 다른 예를 들어, 제1 화각이 제2 화각보다 큰 경우 프로세서(110)는 제1 관심 영역의 크기를 키워 줌 아웃 효과를 제공할 수 있다.
상술한 실시 예에 따르면, 프로세서(110)는 카메라를 제2 카메라로 전환하기 전에 줌 인 또는 줌 아웃 동작을 수행함으로써, 제2 카메라로 전환 시 부드럽게 전환되는 효과를 제공할 수 있다.
일 실시 예에 따르면, 프로세서(110)는 객체가 제1 화각의 지정된 영역에 위치하지 않는 것으로 판단되는 경우 동작 410으로 돌아갈 수 있다.
일 실시 예에 따르면, 프로세서(110)는 동작 460에서 객체가 제1 화각의 지정된 영역에 지정된 시간 이상 존재하는지 여부를 판단할 수 있다.
일 실시 예에 따르면, 프로세서(110)는 객체가 제1 화각의 지정된 영역에 지정된 시간 이상 존재하는 것으로 판단되는 경우, 동작 470에서 제2 이미지 내의 제2 관심 영역을 계산할 수 있다. 예를 들어, 제2 관심 영역은 제1 카메라(121)에서 추적된 객체와 동일한 객체를 포함하는 영역을 의미할 수 있다. 일 실시 예에 따르면, 프로세서(110)는 추적되는 객체가 제1 화각의 지정된 영역에 포함되는 시간이 임계 값 이상인 경우 제2 이미지 내의 제2 관심 영역을 계산할 수 있다. 일 실시 예에 따르면, 프로세서(110)는 제1 관심 영역 내 객체의 위치 또는 제1 관심 영역에 대한 객체의 크기의 비율에 기반하여 제2 관심 영역을 결정할 수 있다. 예를 들어, 제1 관심 영역 내 객체의 위치 및 제1 관심 영역에 대한 객체의 크기의 비율은 제2 관심 영역 내 객체의 위치 및 제2 관심 영역에 대한 객체의 크기의 비율에 각각 대응될 수 있다.
일 실시 예에 따르면, 프로세서(110)는 객체가 제1 화각의 지정된 영역에 지정된 시간 이상 존재하는 것으로 판단되지 않는 경우, 동작 440으로 돌아갈 수 있다. 예를 들어, 프로세서(110)는 객체가 제1 화각의 지정된 영역으로 이동하고 임계 값 미만의 시간 경과 후 지정된 영역을 벗어난 경우, 동작 440로 돌아갈 수 있다.
일 실시 예에 따르면, 프로세서(110)는 동작 480에서 디스플레이(130)에 표시되는 프리뷰를 변경할 수 있다. 일 실시 예에 따르면, 프로세서(110)는 제2 관심 영역이 결정되면 제2 관심 영역에 기반한 프리뷰 이미지를 디스플레이(130)에 표시할 수 있다.
도 5는 일 실시 예에 따른 전자 장치가 제1 카메라 및 제2 카메라에서 동일한 객체를 추적하는 동작의 흐름도이다. 도 5의 동작 510 내지 동작 540은 도 4의 동작 460과 함께 수행될 수 있다.
도 5를 참조하면, 도 4의 동작 450에서 프로세서(110)가 제1 카메라를 이용하여 줌 인 또는 줌 아웃한 후, 프로세서(110)는 동작 510에서 추적 정보 및 줌 정보를 획득할 수 있다. 일 실시 예에 따르면, 프로세서(110)는 제2 카메라로 전달될 추적 정보 및 줌 정보를 추출(또는 획득)할 수 있다. 일 실시 예에 따르면, 프로세서(110)는 추적되는 객체의 카테고리에 따라 다른 추적 정보를 추출할 수 있다. 예를 들어, 추적되는 객체의 카테고리가 사람인 경우 프로세서(110)는 얼굴 정보(예: 얼굴 외곽 라인, 눈, 코, 입, 눈썹), 헤어 색, 헤어 라인, 헤어스타일, 안경 착용 여부, 의상(예: 상의, 하의) 색상, 의상 무니 텍스처 및 신발 텍스처 중 적어도 하나를 추출할 수 있다. 또한 예를 들어, 추적되는 객체의 카테고리가 동물인 경우 프로세서(110)는 동물 종류(예: 개, 고양이), 털 색, 털 무늬 및 텍스처 중 적어도 하나를 추출할 수 있다. 일 실시 예에 따르면, 추적되는 객체의 카테고리가 사물인 경우, 프로세서(110)는 사물의 종류, 사물의 색, 텍스처, 아웃라인 및 사일리언스 맵 중 적어도 하나를 추출할 수 있다.
일 실시 예에 따르면, 프로세서(110)가 획득하는 줌 정보는 제1 카메라 프리뷰의 너비, 높이, 객체의 좌표, 객체의 크기, 제1 관심 영역의 좌표, 제1 관심 영역 내 객체의 위치 정보, 제1 관심 영역 대비 객체가 차지하는 면적 중 적어도 하나를 포함할 수 있다.
일 실시 예에 따르면, 프로세서(110)는 획득한 추적 정보 및 줌 정보를 메모리(140)에 저장할 수 있다.
일 실시 예에 따르면, 프로세서(110)는 동작 520에서 제2 카메라(122)를 활성화할 수 있다. 일 실시 예에 따르면, 프로세서(110)는 제1 카메라(121)에서 제2 카메라(122)로 전환되기 이전에 제2 카메라(122)를 활성화시키고 활성화된 제2 카메라(122)를 이용하여 백그라운드에서 객체를 추적할 수 있다.
일 실시 예에 따르면, 프로세서(110)는 동작 530에서 추적 정보 및 줌 정보를 전송할 수 있다. 일 실시 예에 따르면, 프로세서(110)는 메모리(140)에 저장된 추적 정보 및 줌 정보를 제2 카메라(122)로 전송(또는 전달)할 수 있다. 일 실시 예에 따르면, 추적 정보 및 줌 정보는 카메라 시스템 패스 또는 프레임워크 패스를 통해 제2 카메라(122)로 전달될 수 있다.
일 실시 예에 따르면, 프로세서(110)는 동작 540에서 제2 카메라(122)를 이용하여 객체를 추적할 수 있다. 일 실시 예에 따르면, 프로세서(110)는 제2 카메라(122)에서 수신된 추적 정보 및 줌 정보에 기반하여, 제2 카메라(122)를 이용하여 제1 카메라(121)에서 추적된 객체와 동일한 객체를 추적할 수 있다.
도 6a는 일 실시 예에 따른 전자 장치에서 제1 카메라의 제1 화각이 제2 카메라의 제2 화각보다 작은 경우 제1 화각에서의 전환 영역을 도시한다.
도 6a를 참조하면, 제1 화각이 제2 화각보다 작은 경우, 프로세서(110)는 전환 영역(615)을 제1 화각(610)의 가장자리에 인접한 영역으로 결정할 수 있다. 예를 들면, 프로세서(110)는 제1 화각(610)의 가장자리로부터 약 10% 범위 이내인 영역을 전환 영역(615)으로 결정할 수 있다. 다만, 전환 영역(615)이 제1 화각(610)의 가장자리로부터 약 10% 이내인 영역으로 예시를 든 것은 일 예시에 불과하며, 전환 영역(615)은 제1 화각(610)의 가장자리로부터 약 10% ~ 약 90% 내에서 다양하게 정의될 수 있다.
도 6b는 일 실시 예에 따른 전자 장치에서 제1 카메라의 화각이 제2 카메라의 화각보다 큰 경우 제1 화각에서의 전환 영역을 도시한다.
도 6b를 참조하면, 제1 화각이 제2 화각보다 큰 경우, 프로세서(110)는 전환 영역(625)을 제1 카메라의 프리뷰와 제2 카메라의 프리뷰가 중첩된 영역으로 결정할 수 있다. 예를 들면, 프로세서(110)는 제1 화각(620)의 중심으로부터 약 10% 범위 이내인 영역을 전환 영역(625)으로 결정할 수 있다. 다만, 전환 영역(625)이 제1 화각(620)의 중심으로부터 약 10% 이내인 영역으로 예시를 든 것은 일 예시에 불과하며, 전환 영역(625)은 제1 화각(620)의 중심으로부터 약 10% ~ 약 90% 내에서 다양하게 정의될 수 있다.
다양한 실시 예들에 따르면, 프로세서(110)는 추적되는 객체의 이동 속도, 캘리브레이션 데이터 또는 설정 값에 따라 다양하게 결정될 수 있다.
도 7은 일 실시 예에 따른 전자 장치에서 제1 카메라로 추적하는 객체의 카테고리 정보를 획득하는 동작의 흐름도이다. 도 7의 설명과 관련하여 전술한 내용과 대응되거나 중복되는 내용은 간략히 하거나 생략한다.
도 7을 참조하면, 일 실시 예에 따른 프로세서(110)는 동작 710에서 제1 이미지에서 객체를 검출할 수 있다. 일 실시 예에 따르면, 프로세서(110)는 제1 이미지의 프리뷰에서 적어도 하나의 객체를 자동으로 검출할 수 있다. 다른 실시 예에 따르면, 프로세서(110)는 디스플레이(130)에 제1 이미지의 프리뷰가 표시된 상태에서, 디스플레이(130)에 대한 사용자 입력(예: 터치 입력)을 수신하는 것에 응답하여 적어도 하나의 객체를 검출할 수 있다.
일 실시 예에 따르면, 프로세서(110)는 동작 720에서 제1 이미지에서 검출한 객체가 사람인지 여부를 판단할 수 있다. 일 실시 예에 따르면, 프로세서(110)는 제1 이미지에서 검출한 객체가 복수 개인 경우, 복수 개의 객체 각각에 대하여 사람인지 여부를 판단할 수 있다.
일 실시 예에 따르면, 프로세서(110)는 제1 이미지에서 검출한 객체가 사람인 것으로 판단되는 경우 동작 730에서 객체의 얼굴, 헤어 및/또는 의상 정보를 추출할 수 있다.
일 실시 예에 따르면, 프로세서(110)는 제1 이미지에서 검출한 객체가 사람인 것으로 판단되지 않는 경우 동작 740에서 검출한 객체가 동물인지 여부를 판단할 수 있다. 일 실시 예에 따르면, 프로세서(110)는 제1 이미지에서 검출한 객체가 복수 개인 경우, 복수 개의 객체 각각에 대하여 동물인지 여부를 판단할 수 있다.
일 실시 예에 따르면, 프로세서(110)는 제1 이미지에서 검출한 객체가 동물인 것으로 판단되는 경우 동작 750에서 객체의 종류, 색, 무늬 및/또는 텍스처를 추출할 수 있다.
일 실시 예에 따르면, 프로세서(110)는 제1 이미지에서 검출한 객체가 동물인 것으로 판단되지 않는 경우 동작 760에서 객체의 종류, 색, 텍스처, 아웃라인 또는 사일리언스 맵(saliency map)을 추출할 수 있다.
일 실시 예에 따르면, 프로세서(110)는 동작 770에서 줌 정보를 추출할 수 있다. 일 실시 예에 따르면, 프로세서(110)는 제1 카메라 프리뷰의 너비, 높이, 객체의 좌표, 객체의 크기, 제1 관심 영역의 좌표, 제1 관심 영역 내 객체의 위치 정보, 제1 관심 영역 대비 객체가 차지하는 면적 중 적어도 하나를 포함하는 줌 정보를 획득할 수 있다.
도 8a 및 도 8b는 일 실시 예에 따른 전자 장치에서 제1 카메라의 화각이 제2 카메라의 화각보다 작은 경우 객체의 이동에 따라 줌 정보를 추출하는 것을 도시한다.
도 8a를 참조하면, 일 실시 예에 따른 프로세서(110)는 제1 화각(610) 내에서 객체(800)를 식별하고, 식별된 객체(800)에 대응되는 제1 관심 영역(810)을 결정할 수 있다. 일 실시 예에 따르면, 프로세서(110)는 제1 화각(610) 내의 전환 영역(615)을 결정할 수 있다.
도 8b를 참조하면, 일 실시 예에 따른 프로세서(110)는 식별된 객체(800)가 이동함에 따라, 제1 관심 영역(810)을 변경할 수 있다. 일 실시 예에 따르면, 프로세서(110)는 식별된 객체(800)의 좌표를 기반으로 제1 관심 영역(810)을 결정할 수 있다.
일 실시 예에 따르면, 프로세서(110)는 제1 관심 영역(810)이 결정됨에 따라 줌 정보를 획득할 수 있다. 일 실시 예에 따르면, 프로세서(110)는 제1 관심 영역(810)의 크기 및 제1 관심 영역(810)의 프리뷰 내 위치를 포함하는 줌 정보를 획득할 수 있다. 예를 들어, 제1 관심 영역(810)의 크기는 제1 관심 영역의 높이(811) 및 제1 관심 영역의 너비(813)에 의해 결정될 수 있다. 또한 예를 들어, 제1 관심 영역의 프리뷰 내 위치는 제1 관심 영역의 좌표(815, 817)에 의해 결정될 수 있다.
일 실시 예에 따르면, 프로세서(110)는 제1 관심 영역(810)에 대한 객체(800)의 크기의 비율 및 제1 관심 영역(810) 내 객체(800)의 위치를 포함하는 줌 정보를 획득할 수 있다. 예를 들어, 제1 관심 영역(810)에 대한 객체(800)의 크기의 비율은 객체(800)의 높이(821) 및 객체(800)의 너비(823)에 기반하여 결정될 수 있다. 또한 예를 들어, 제1 관심 영역(810) 내 객체(800)의 위치는 객체의 좌표(825, 827)에 의해 결정될 수 있다.
도 9a 및 도 9b는 일 실시 예에 따른 전자 장치에서 제1 카메라의 화각이 제2 카메라의 화각보다 큰 경우 객체의 이동에 따라 줌 정보를 추출하는 것을 도시한다.
도 9a를 참조하면, 일 실시 예에 따른 프로세서(110)는 제1 화각(620) 내에서 객체(800)를 식별하고, 식별된 객체(800)에 대응되는 제1 관심 영역(910)을 결정할 수 있다. 일 실시 예에 따르면, 프로세서(110)는 제1 화각(620) 내의 전환 영역(625)을 결정할 수 있다.
도 9b를 참조하면, 일 실시 예에 따른 프로세서(110)는 식별된 객체(800)가 이동함에 따라, 제1 관심 영역(910)을 변경할 수 있다. 일 실시 예에 따르면, 프로세서(110)는 식별된 객체(800)의 좌표를 기반으로 제1 관심 영역(910)을 결정할 수 있다.
일 실시 예에 따르면, 프로세서(110)는 제1 관심 영역(910)이 결정됨에 따라 줌 정보를 획득할 수 있다. 일 실시 예에 따르면, 프로세서(110)는 제1 관심 영역(910)의 크기 및 제1 관심 영역(910)의 프리뷰 내 위치를 포함하는 줌 정보를 획득할 수 있다. 예를 들어, 제1 관심 영역(910)의 크기는 제1 관심 영역의 높이(911) 및 제1 관심 영역의 너비(913)에 의해 결정될 수 있다. 또한 예를 들어, 제1 관심 영역의 프리뷰 내 위치는 제1 관심 영역의 좌표(915, 917)에 의해 결정될 수 있다.
일 실시 예에 따르면, 프로세서(110)는 제1 관심 영역(910)에 대한 객체(800)의 크기의 비율 및 제1 관심 영역(910) 내 객체(800)의 위치를 포함하는 줌 정보를 획득할 수 있다. 예를 들어, 제1 관심 영역(910)에 대한 객체(800)의 크기의 비율은 객체(800)의 높이(921) 및 객체(800)의 너비(923)에 기반하여 결정될 수 있다. 또한 예를 들어, 제1 관심 영역(910) 내 객체(800)의 위치는 객체의 좌표(925, 927)에 의해 결정될 수 있다.
도 10은 일 실시 예에 따른 전자 장치가 추적하는 객체의 카테고리 정보에 기반하여 제2 카메라(예: 도 1의 제2 카메라(122))에서 동일 객체를 추적하는 것을 나타낸 흐름도이다.
도 10을 참조하면, 일 실시 예에 따른 프로세서(110)는 동작 1010에서 추적 객체에 대한 카테고리 정보를 획득할 수 있다. 일 실시 예에 따르면, 프로세서(110)는 제2 카메라(122)에서 메모리(140)로부터 획득한 추적 정보에 기반하여, 추적 객체에 대한 카테고리 정보를 획득할 수 있다.
일 실시 예에 따르면, 프로세서(110)는 동작 1020에서 추적 객체에 대한 카테고리가 사람인지 여부를 판단할 수 있다. 일 실시 예에 따르면, 프로세서(110)는 추적 객체에 대한 카테고리가 사람인 것으로 판단되는 경우, 제2 카메라의 프리뷰에서 객체의 얼굴 및 몸을 검출할 수 있다. 이에 대해서는 도면 11a를 참조하여 후술하기로 한다.
일 실시 예에 따르면, 프로세서(110)는 추적 객체에 대한 카테고리가 사람인 것으로 판단되지 않는 경우, 동작 1030에서 추적 객체에 대한 카테고리가 동물인지 여부를 판단할 수 있다. 일 실시 예에 따르면, 프로세서(110)는 추적 객체에 대한 카테고리가 동물인 것으로 판단되는 경우, 제2 카메라의 프리뷰에서 동물을 검출할 수 있다. 이에 대해서는 도면 11b를 참조하여 후술하기로 한다.
일 실시 예에 따르면, 프로세서(110)는 추적 객체에 대한 카테고리가 동물인 것으로 판단되지 않는 경우, 동작 1040에서 제2 카메라(122)의 프리뷰에서 사일리언스 맵을 추출할 수 있다.
일 실시 예에 따르면, 프로세서(110)는 동작 1050에서 추적 객체와 텍스처 및 아웃라인을 비교함으로써 제2 카메라(122)의 프리뷰에서 추적 객체와 동일한 객체를 검출할 수 있다. 일 실시 예에 따르면, 프로세서(110)는 제2 카메라(122)의 프리뷰에서 추출된 사일리언스 맵에 기반하여, 추적 객체와 텍스처 및 아웃라인을 비교하여 추적 객체와 동일한 객체를 검출할 수 있다.
일 실시 예에 따르면, 프로세서(110)는 동작 1060에서 제2 카메라를 이용하여 검출한 객체를 추적할 수 있다. 일 실시 예에 따르면, 프로세서(110)는 메모리(140)로부터 획득한 카테고리 정보에 기반하여, 제2 카메라(122)를 이용하여 제1 카메라(121)에서 추적된 객체와 동일한 객체를 추적할 수 있다.
도 11a는 일 실시 예에 따른 전자 장치(예: 도 1의 전자 장치(100))에서 추적하는 객체가 사람인 경우 제2 카메라(예: 도 1의 제2 카메라(122))에서 동일 객체를 추적하는 것을 나타낸 흐름도이다.
도 11a를 참조하면, 도 10의 동작 1020에서 프로세서(110)가 추적 객체의 카테고리가 사람인 것으로 판단하면, 프로세서(110)는 동작 1110에서 제2 카메라(122)의 프리뷰에서 얼굴 및/또는 몸을 검출할 수 있다.
일 실시 예에 따르면, 프로세서(110)는 동작 1120에서 제2 카메라(122)의 프리뷰에 다수의 사람이 포함되어 있는지 여부를 판단할 수 있다. 일 실시 예에 따르면, 프로세서(110)는 제2 카메라(122)의 프리뷰에서 얼굴 및/또는 몸을 검출한 것에 기반하여 제2 카메라(122)의 프리뷰에 다수의 사람이 포함되어 있는지 여부를 판단할 수 있다.
일 실시 예에 따르면, 프로세서(110)는 제2 카메라의 프리뷰에 다수의 사람이 포함되어 있는 것으로 판단되지 않는 경우 동작 1150에서 제2 카메라를 이용하여 제2 카메라의 프리뷰에서 식별된 객체(예: 사람)를 추적할 수 있다. 일 실시 예에 따르면, 프로세서(110)는 제2 카메라(122)의 프리뷰에 포함된 사람이 한명인 것으로 판단되는 경우, 제2 카메라(122)를 이용하여 한 명의 사람을 추적할 수 있다.
일 실시 예에 따르면, 프로세서(110)는 제2 카메라(122)의 프리뷰에 다수의 사람이 포함되어 있는 것으로 판단되는 경우 동작 1130에서 다수의 사람 각각의 얼굴 특징(예: 눈, 코, 입, 눈썹, 얼굴 외곽 라인), 헤어 또는 의상 신발 정보를 추출할 수 있다.
일 실시 예에 따르면, 프로세서(110)는 동작 1140에서 추출한 정보를 비교하여 제2 이미지 내에서 동일 객체를 검출할 수 있다. 일 실시 예에 따르면, 프로세서(110)는 제2 카메라(122)의 프리뷰에서 추출한 정보와 메모리(140)로부터 획득한 추적 정보 및 줌 정보를 비교하여, 제1 카메라(121)에서 추적된 객체와 동일한 객체를 제2 이미지 내에서 결정할 수 있다.
일 실시 예에 따르면, 프로세서(110)는 동작 1150에서 제2 카메라(122)를 이용하여 객체를 추적할 수 있다. 일 실시 예에 따르면, 프로세서(110)는 동작 1140에서 동일한 객체로 결정된 객체를 추적할 수 있다.
도 11b는 일 실시 예에 따른 전자 장치에서 추적하는 객체가 동물인 경우 제2 카메라에서 동일 객체를 추적하는 것을 나타낸 흐름도이다.
도 11b를 참조하면, 도 10의 동작 1030에서 프로세서(110)가 추적 객체의 카테고리가 동물인 것으로 판단하면, 프로세서(110)는 동작 1115에서 제2 카메라(122)의 프리뷰에서 동물을 검출할 수 있다.
일 실시 예에 따르면, 프로세서(110)는 동작 1125에서 제2 카메라의 프리뷰에 다수의 동물이 포함되어 있는지 여부를 판단할 수 있다. 일 실시 예에 따르면, 프로세서(110)는 제2 카메라(122)의 프리뷰에서 동물을 검출한 것에 기반하여 제2 카메라(122)의 프리뷰에 다수의 동물이 포함되어 있는지 여부를 판단할 수 있다.
일 실시 예에 따르면, 프로세서(110)는 제2 카메라(122)의 프리뷰에 다수의 동물이 포함되어 있는 것으로 판단되지 않는 경우 동작 1155에서 제2 카메라(122)를 이용하여 제2 카메라(122)의 프리뷰에서 식별된 객체(예: 동물)를 추적할 수 있다. 일 실시 예에 따르면, 프로세서(110)는 제2 카메라(122)의 프리뷰에 포함된 동물이 하나인 것으로 판단되는 경우, 제2 카메라(122)를 이용하여 하나의 동물을 추적할 수 있다.
일 실시 예에 따르면, 프로세서(110)는 제2 카메라(122)의 프리뷰에 다수의 동물이 포함되어 있는 것으로 판단되는 경우 동작 1135에서 다수의 동물 각각의 털 색, 무늬 및 텍스처에 대한 정보를 추출할 수 있다.
일 실시 예에 따르면, 프로세서(110)는 동작 1145에서 추출한 정보를 비교하여 제2 이미지 내에서 동일 객체를 검출할 수 있다. 일 실시 예에 따르면, 프로세서(110)는 제2 카메라(122)의 프리뷰에서 추출한 정보와 메모리(140)로부터 획득한 추적 정보 및 줌 정보를 비교하여, 제1 카메라(121)에서 추적된 객체와 동일한 객체를 제2 이미지 내에서 결정할 수 있다.
일 실시 예에 따르면, 프로세서(110)는 동작 1155에서 제2 카메라를 이용하여, 동작 1145에서 동일한 객체로 결정된 객체를 추적할 수 있다. 일 실시 예에 따르면, 프로세서(110)는 동작 1140에서 동일한 객체로 결정된 객체를 추적할 수 있다.
도 12는 일 실시 예에 따른 전자 장치에서 줌 영역을 재계산하는 것을 나타낸 흐름도이다.
도 12를 참조하면, 일 실시 예에 따르면, 프로세서(110)는 동작 1210에서 제2 카메라(예: 도 1의 제2 카메라(122))로 객체를 추적할 수 있다. 일 실시 예에 따르면, 프로세서(110)는 제2 카메라(122)를 이용하여, 제1 카메라(예: 도 1의 제1 카메라(121))로 추적한 객체와 동일한 객체를 추적할 수 있다. 일 실시 예에 따르면, 프로세서(110)는 메모리(140)에 저장된 추적 정보 및 줌 정보에 기반하여 제1 카메라(121)로 추적한 객체와 동일한 객체를 제2 카메라(122)의 프리뷰에서 검출하고 추적할 수 있다.
일 실시 예에 따르면, 프로세서(110)는 동작 1220에서 카메라 전환 전 객체 크기의 비율과 전환 후 객체 크기의 비율이 동일한지 여부를 판단할 수 있다. 일 실시 예에 따르면, 프로세서(110)는 메모리(140)에 저장된 줌 정보에 기반하여, 제1 카메라(121)의 프리뷰 내 관심 영역에 대한 객체의 크기 비율과 제2 카메라(122)의 프리뷰 내 관심 영역에 대한 객체의 크기 비율이 동일한지 여부를 판단할 수 있다. 본 문서에서, 제1 카메라(121)의 프리뷰 내 관심 영역은 제1 관심 영역으로 참조될 수 있고, 제2 카메라(122)의 프리뷰 내 관심 영역은 제2 관심 영역으로 참조될 수 있다.
일 실시 예에 따르면, 프로세서(110)는 카메라 전환 전 객체 크기의 비율과 전환 후 객체 크기의 비율이 동일하지 않은 것으로 판단되는 경우 동작 1230에서 동일한 비율이 되도록 관심 영역 정보를 업데이트 할 수 있다. 일 실시 예에 따르면, 프로세서(110)는 제1 관심 영역에 대한 객체의 크기 비율과 제2 관심 영역에 대한 객체의 크기 비율이 동일하지 않은 것으로 판단되는 경우, 제1 관심 영역에 대한 객체의 크기 비율과 제2 관심 영역에 대한 객체의 크기 비율이 동일하도록 관심 영역 정보를 업데이트할 수 있다. 예를 들어, 관심 영역 정보는 관심 영역의 크기 정보 및 위치 정보 중 적어도 하나를 포함할 수 있다. 예를 들어, 프로세서(110)는 제2 관심 영역에 대한 객체의 크기 비율이 제1 관심 영역에 대한 객체의 크기 비율과 동일해지도록 제2 관심 영역의 크기 및/또는 위치를 다시 계산(또는 결정)할 수 있다.
일 실시 예에 따르면, 프로세서(110)는 카메라 전환 전 객체 크기의 비율과 전환 후 객체 크기의 비율이 동일한 것으로 판단되는 경우 동작 1240에서 객체 간 크기 배율 정보를 획득할 수 있다. 일 실시 예에 따르면, 프로세서(110)는 제1 관심 영역에 대한 객체의 크기 비율과 제2 관심 영역에 대한 객체의 크기 비율이 동일한 것으로 판단되는 경우, 제1 이미지에서 식별된 객체와 제2 이미지에서 식별된 객체 간 크기 배율에 대한 정보를 획득할 수 있다.
일 실시 예에 따르면, 프로세서(110)는 동작 1250에서 획득된 배율 정보에 기반하여 관심 영역 정보 및 객체의 위치 정보를 업데이트할 수 있다. 일 실시 예에 따르면, 프로세서(110)는 제1 이미지에서 식별된 객체와 제2 이미지에서 식별된 객체 간 크기 배율에 대한 정보에 기반하여, 관심 영역 정보 및 객체의 위치 정보를 업데이트할 수 있다. 예를 들어, 객체의 위치 정보는 관심 영역 내 객체의 좌표에 대한 정보를 포함할 수 있다. 일 실시 예에 따르면, 프로세서(110)는 제1 이미지에서 식별된 객체와 제2 이미지에서 식별된 객체 간 크기 배율에 대한 정보에 기반하여, 관심 영역의 크기 및/또는 위치와 관심 영역 내 객체의 위치에 대한 정보를 업데이트(또는 갱신)할 수 있다. 일 실시 예에 따르면, 프로세서(110)는 갱신된 관심 영역 정보 및 객체의 위치 정보에 기반하여 제2 관심 영역을 결정할 수 있다.
도 13a는 일 실시 예에 따른 전자 장치(예: 도 1의 전자 장치(100))에서 제1 카메라의 화각이 제2 카메라의 화각보다 작은 경우 제2 관심 영역이 결정된 것을 도시한다. 도 13a와 관련된 설명 중 전술한 내용에 대응되거나 중복되는 내용은 간략히 하거나 생략한다.
도 13a를 참조하면, 일 실시 예에 따른 프로세서(110)는 제2 화각(1310) 내의 제2 관심 영역(1312)을 결정할 수 있다. 일 실시 예에 따르면, 프로세서(110)는 메모리(140)에 저장된 추적 정보 및 줌 정보에 기반하여 제2 화각(1310) 내의 제2 관심 영역(1312)를 결정할 수 있다.
일 실시 예에 따르면, 프로세서(110)는 제2 관심 영역(1312)에 대한 객체(1300)의 크기의 비율이 제1 관심 영역(예: 도 8의 제1 관심 영역(810))에 대한 객체(예: 도 8의 객체(800))의 크기의 비율과 동일하도록 제2 관심 영역(1312)의 크기를 결정할 수 있다. 예를 들어, 제2 관심 영역(1312)에 대한 객체(1300)의 크기의 비율은 객체(1300)의 높이(1311) 및 객체(1300)의 너비(1313)에 기반하여 결정될 수 있다.
일 실시 예에 따르면, 프로세서(110)는 제2 관심 영역(1312) 내 객체(1300)의 위치가 제1 관심 영역(810) 내 객체(800)의 위치와 동일하도록 제2 관심 영역(1312)의 위치를 결정할 수 있다. 예를 들어, 제2 관심 영역(1312) 내 객체(1300)의 위치는 객체의 좌표(1315, 1317)에 의해 결정될 수 있다. 이 때, 제1 관심 영역(810)에 포함된 객체(800)와 제2 관심 영역(1312)에 포함된 객체(1300)는 동일한 객체이다.
도 13b는 일 실시 예에 따른 전자 장치에서 제1 카메라의 화각이 제2 카메라의 화각보다 큰 경우의 제2 관심 영역이 결정된 것을 도시한다. 도 13b와 관련된 설명 중 전술한 내용에 대응되거나 중복되는 내용은 간략히 하거나 생략한다.
도 13b를 참조하면, 일 실시 예에 따른 프로세서(110)는 제2 화각(1320) 내의 제2 관심 영역(1322)을 결정할 수 있다. 일 실시 예에 따르면, 프로세서(110)는 메모리(140)에 저장된 추적 정보 및 줌 정보에 기반하여 제2 화각(1320) 내의 제2 관심 영역(1322)를 결정할 수 있다.
일 실시 예에 따르면, 프로세서(110)는 제2 관심 영역(1322)에 대한 객체(1300)의 크기의 비율이 제1 관심 영역(예: 도 9의 제1 관심 영역(910))에 대한 객체(예: 도 9의 객체(800))의 크기의 비율과 동일하도록 제2 관심 영역(1322)의 크기를 결정할 수 있다. 예를 들어, 제2 관심 영역(1322)에 대한 객체(1300)의 크기의 비율은 객체(1300)의 높이(1321) 및 객체(1300)의 너비(1323)에 기반하여 결정될 수 있다.
일 실시 예에 따르면, 프로세서(110)는 제2 관심 영역(1322) 내 객체(1300)의 위치가 제1 관심 영역(910) 내 객체(800)의 위치와 동일하도록 제2 관심 영역(1322)의 위치를 결정할 수 있다. 예를 들어, 제2 관심 영역(1322) 내 객체(1300)의 위치는 객체의 좌표(1325, 1327)에 의해 결정될 수 있다. 이 때, 제1 관심 영역(910)에 포함된 객체(800)와 제2 관심 영역(1322)에 포함된 객체(1300)는 동일한 객체이다.
도 14은 일 실시 예에 따른 네트워크 환경 내의 전자 장치의 블록도이다.
도 14을 참조하면, 네트워크 환경(1400)에서 전자 장치(1401)는 제 1 네트워크(1498)(예: 근거리 무선 통신 네트워크)를 통하여 전자 장치(1402)와 통신하거나, 또는 제 2 네트워크(1499)(예: 원거리 무선 통신 네트워크)를 통하여 전자 장치(1404) 또는 서버(1408) 중 적어도 하나와 통신할 수 있다. 일 실시예에 따르면, 전자 장치(1401)는 서버(1408)를 통하여 전자 장치(1404)와 통신할 수 있다. 일 실시예에 따르면, 전자 장치(1401)는 프로세서(1410)(예: 도 1의 프로세서(110)), 메모리(1430), 입력 모듈(1450), 음향 출력 모듈(1455), 디스플레이 모듈(1460), 오디오 모듈(1470), 센서 모듈(1476), 인터페이스(1477), 연결 단자(1478), 햅틱 모듈(1479), 카메라 모듈(1480), 전력 관리 모듈(1488), 배터리(1489), 통신 모듈(1490), 가입자 식별 모듈(1496), 또는 안테나 모듈(1497)을 포함할 수 있다. 어떤 실시예에서는, 전자 장치(1401)에는, 이 구성요소들 중 적어도 하나(예: 연결 단자(1478))가 생략되거나, 하나 이상의 다른 구성요소가 추가될 수 있다. 어떤 실시예에서는, 이 구성요소들 중 일부들(예: 센서 모듈(1476), 카메라 모듈(1480), 또는 안테나 모듈(1497))은 하나의 구성요소(예: 디스플레이 모듈(1460))로 통합될 수 있다.
프로세서(1420)는, 예를 들면, 소프트웨어(예: 프로그램(1440))를 실행하여 프로세서(1420)에 연결된 전자 장치(1401)의 적어도 하나의 다른 구성요소(예: 하드웨어 또는 소프트웨어 구성요소)를 제어할 수 있고, 다양한 데이터 처리 또는 연산을 수행할 수 있다. 일 실시예에 따르면, 데이터 처리 또는 연산의 적어도 일부로서, 프로세서(1420)는 다른 구성요소(예: 센서 모듈(1476) 또는 통신 모듈(1490))로부터 수신된 명령 또는 데이터를 휘발성 메모리(1432)에 저장하고, 휘발성 메모리(1432)에 저장된 명령 또는 데이터를 처리하고, 결과 데이터를 비휘발성 메모리(1434)에 저장할 수 있다. 일 실시예에 따르면, 프로세서(1420)는 메인 프로세서(1421)(예: 중앙 처리 장치 또는 어플리케이션 프로세서) 또는 이와는 독립적으로 또는 함께 운영 가능한 보조 프로세서(1423)(예: 그래픽 처리 장치, 신경망 처리 장치(NPU: neural processing unit), 이미지 시그널 프로세서, 센서 허브 프로세서, 또는 커뮤니케이션 프로세서)를 포함할 수 있다. 예를 들어, 전자 장치(1401)가 메인 프로세서(1421) 및 보조 프로세서(1423)를 포함하는 경우, 보조 프로세서(1423)는 메인 프로세서(1421)보다 저전력을 사용하거나, 지정된 기능에 특화되도록 설정될 수 있다. 보조 프로세서(1423)는 메인 프로세서(1421)와 별개로, 또는 그 일부로서 구현될 수 있다.
보조 프로세서(1423)는, 예를 들면, 메인 프로세서(1421)가 인액티브(예: 슬립) 상태에 있는 동안 메인 프로세서(1421)를 대신하여, 또는 메인 프로세서(1421)가 액티브(예: 어플리케이션 실행) 상태에 있는 동안 메인 프로세서(1421)와 함께, 전자 장치(1401)의 구성요소들 중 적어도 하나의 구성요소(예: 디스플레이 모듈(1460), 센서 모듈(1476), 또는 통신 모듈(1490))와 관련된 기능 또는 상태들의 적어도 일부를 제어할 수 있다. 일 실시예에 따르면, 보조 프로세서(1423)(예: 이미지 시그널 프로세서 또는 커뮤니케이션 프로세서)는 기능적으로 관련 있는 다른 구성요소(예: 카메라 모듈(1480) 또는 통신 모듈(1490))의 일부로서 구현될 수 있다. 일 실시예에 따르면, 보조 프로세서(1423)(예: 신경망 처리 장치)는 인공지능 모델의 처리에 특화된 하드웨어 구조를 포함할 수 있다. 인공지능 모델은 기계 학습을 통해 생성될 수 있다. 이러한 학습은, 예를 들어, 인공지능 모델이 수행되는 전자 장치(1401) 자체에서 수행될 수 있고, 별도의 서버(예: 서버(1408))를 통해 수행될 수도 있다. 학습 알고리즘은, 예를 들어, 지도형 학습(supervised learning), 비지도형 학습(unsupervised learning), 준지도형 학습(semi-supervised learning) 또는 강화 학습(reinforcement learning)을 포함할 수 있으나, 전술한 예에 한정되지 않는다. 인공지능 모델은, 복수의 인공 신경망 레이어들을 포함할 수 있다. 인공 신경망은 심층 신경망(DNN: deep neural network), CNN(convolutional neural network), RNN(recurrent neural network), RBM(restricted boltzmann machine), DBN(deep belief network), BRDNN(bidirectional recurrent deep neural network), 심층 Q-네트워크(deep Q-networks) 또는 상기 중 둘 이상의 조합 중 하나일 수 있으나, 전술한 예에 한정되지 않는다. 인공지능 모델은 하드웨어 구조 이외에, 추가적으로 또는 대체적으로, 소프트웨어 구조를 포함할 수 있다.
메모리(1430)는, 전자 장치(1401)의 적어도 하나의 구성요소(예: 프로세서(1420) 또는 센서 모듈(1476))에 의해 사용되는 다양한 데이터를 저장할 수 있다. 데이터는, 예를 들어, 소프트웨어(예: 프로그램(1440)) 및, 이와 관련된 명령에 대한 입력 데이터 또는 출력 데이터를 포함할 수 있다. 메모리(1430)는, 휘발성 메모리(1432) 또는 비휘발성 메모리(1434)를 포함할 수 있다.
프로그램(1440)은 메모리(1430)에 소프트웨어로서 저장될 수 있으며, 예를 들면, 운영 체제(1442), 미들 웨어(1444) 또는 어플리케이션(1446)을 포함할 수 있다.
입력 모듈(1450)은, 전자 장치(1401)의 구성요소(예: 프로세서(1420))에 사용될 명령 또는 데이터를 전자 장치(1401)의 외부(예: 사용자)로부터 수신할 수 있다. 입력 모듈(1450)은, 예를 들면, 마이크, 마우스, 키보드, 키(예: 버튼), 또는 디지털 펜(예: 스타일러스 펜)을 포함할 수 있다.
음향 출력 모듈(1455)은 음향 신호를 전자 장치(1401)의 외부로 출력할 수 있다. 음향 출력 모듈(1455)은, 예를 들면, 스피커 또는 리시버를 포함할 수 있다. 스피커는 멀티미디어 재생 또는 녹음 재생과 같이 일반적인 용도로 사용될 수 있다. 리시버는 착신 전화를 수신하기 위해 사용될 수 있다. 일 실시예에 따르면, 리시버는 스피커와 별개로, 또는 그 일부로서 구현될 수 있다.
디스플레이 모듈(1460)은 전자 장치(1401)의 외부(예: 사용자)로 정보를 시각적으로 제공할 수 있다. 디스플레이 모듈(1460)은, 예를 들면, 디스플레이, 홀로그램 장치, 또는 프로젝터 및 해당 장치를 제어하기 위한 제어 회로를 포함할 수 있다. 일 실시예에 따르면, 디스플레이 모듈(1460)은 터치를 감지하도록 설정된 터치 센서, 또는 상기 터치에 의해 발생되는 힘의 세기를 측정하도록 설정된 압력 센서를 포함할 수 있다.
오디오 모듈(1470)은 소리를 전기 신호로 변환시키거나, 반대로 전기 신호를 소리로 변환시킬 수 있다. 일 실시예에 따르면, 오디오 모듈(1470)은, 입력 모듈(1450)을 통해 소리를 획득하거나, 음향 출력 모듈(1455), 또는 전자 장치(1401)와 직접 또는 무선으로 연결된 외부 전자 장치(예: 전자 장치(1402))(예: 스피커 또는 헤드폰)를 통해 소리를 출력할 수 있다.
센서 모듈(1476)은 전자 장치(1401)의 작동 상태(예: 전력 또는 온도), 또는 외부의 환경 상태(예: 사용자 상태)를 감지하고, 감지된 상태에 대응하는 전기 신호 또는 데이터 값을 생성할 수 있다. 일 실시예에 따르면, 센서 모듈(1476)은, 예를 들면, 제스처 센서, 자이로 센서, 기압 센서, 마그네틱 센서, 가속도 센서, 그립 센서, 근접 센서, 컬러 센서, IR(infrared) 센서, 생체 센서, 온도 센서, 습도 센서, 또는 조도 센서를 포함할 수 있다.
인터페이스(1477)는 전자 장치(1401)가 외부 전자 장치(예: 전자 장치(1402))와 직접 또는 무선으로 연결되기 위해 사용될 수 있는 하나 이상의 지정된 프로토콜들을 지원할 수 있다. 일 실시예에 따르면, 인터페이스(1477)는, 예를 들면, HDMI(high definition multimedia interface), USB(universal serial bus) 인터페이스, SD카드 인터페이스, 또는 오디오 인터페이스를 포함할 수 있다.
연결 단자(1478)는, 그를 통해서 전자 장치(1401)가 외부 전자 장치(예: 전자 장치(1402))와 물리적으로 연결될 수 있는 커넥터를 포함할 수 있다. 일 실시예에 따르면, 연결 단자(1478)는, 예를 들면, HDMI 커넥터, USB 커넥터, SD 카드 커넥터, 또는 오디오 커넥터(예: 헤드폰 커넥터)를 포함할 수 있다.
햅틱 모듈(1479)은 전기적 신호를 사용자가 촉각 또는 운동 감각을 통해서 인지할 수 있는 기계적인 자극(예: 진동 또는 움직임) 또는 전기적인 자극으로 변환할 수 있다. 일 실시예에 따르면, 햅틱 모듈(1479)은, 예를 들면, 모터, 압전 소자, 또는 전기 자극 장치를 포함할 수 있다.
카메라 모듈(1480)은 정지 영상 및 동영상을 촬영할 수 있다. 일 실시예에 따르면, 카메라 모듈(1480)은 하나 이상의 렌즈들, 이미지 센서들, 이미지 시그널 프로세서들, 또는 플래시들을 포함할 수 있다.
전력 관리 모듈(1488)은 전자 장치(1401)에 공급되는 전력을 관리할 수 있다. 일 실시예에 따르면, 전력 관리 모듈(1488)은, 예를 들면, PMIC(power management integrated circuit)의 적어도 일부로서 구현될 수 있다.
배터리(1489)는 전자 장치(1401)의 적어도 하나의 구성요소에 전력을 공급할 수 있다. 일 실시예에 따르면, 배터리(1489)는, 예를 들면, 재충전 불가능한 1차 전지, 재충전 가능한 2차 전지 또는 연료 전지를 포함할 수 있다.
통신 모듈(1490)은 전자 장치(1401)와 외부 전자 장치(예: 전자 장치(1402), 전자 장치(1404), 또는 서버(1408)) 간의 직접(예: 유선) 통신 채널 또는 무선 통신 채널의 수립, 및 수립된 통신 채널을 통한 통신 수행을 지원할 수 있다. 통신 모듈(1490)은 프로세서(1420)(예: 어플리케이션 프로세서)와 독립적으로 운영되고, 직접(예: 유선) 통신 또는 무선 통신을 지원하는 하나 이상의 커뮤니케이션 프로세서를 포함할 수 있다. 일 실시예에 따르면, 통신 모듈(1490)은 무선 통신 모듈(1492)(예: 셀룰러 통신 모듈, 근거리 무선 통신 모듈, 또는 GNSS(global navigation satellite system) 통신 모듈) 또는 유선 통신 모듈(1494)(예: LAN(local area network) 통신 모듈, 또는 전력선 통신 모듈)을 포함할 수 있다. 이들 통신 모듈 중 해당하는 통신 모듈은 제 1 네트워크(1498)(예: 블루투스, WiFi(wireless fidelity) direct 또는 IrDA(infrared data association)와 같은 근거리 통신 네트워크) 또는 제 2 네트워크(1499)(예: 레거시 셀룰러 네트워크, 5G 네트워크, 차세대 통신 네트워크, 인터넷, 또는 컴퓨터 네트워크(예: LAN 또는 WAN)와 같은 원거리 통신 네트워크)를 통하여 외부의 전자 장치(1404)와 통신할 수 있다. 이런 여러 종류의 통신 모듈들은 하나의 구성요소(예: 단일 칩)로 통합되거나, 또는 서로 별도의 복수의 구성요소들(예: 복수 칩들)로 구현될 수 있다. 무선 통신 모듈(1492)은 가입자 식별 모듈(1496)에 저장된 가입자 정보(예: 국제 모바일 가입자 식별자(IMSI))를 이용하여 제 1 네트워크(1498) 또는 제 2 네트워크(1499)와 같은 통신 네트워크 내에서 전자 장치(1401)를 확인 또는 인증할 수 있다.
무선 통신 모듈(1492)은 4G 네트워크 이후의 5G 네트워크 및 차세대 통신 기술, 예를 들어, NR 접속 기술(new radio access technology)을 지원할 수 있다. NR 접속 기술은 고용량 데이터의 고속 전송(eMBB(enhanced mobile broadband)), 단말 전력 최소화와 다수 단말의 접속(mMTC(massive machine type communications)), 또는 고신뢰도와 저지연(URLLC(ultra-reliable and low-latency communications))을 지원할 수 있다. 무선 통신 모듈(1492)은, 예를 들어, 높은 데이터 전송률 달성을 위해, 고주파 대역(예: mmWave 대역)을 지원할 수 있다. 무선 통신 모듈(1492)은 고주파 대역에서의 성능 확보를 위한 다양한 기술들, 예를 들어, 빔포밍(beamforming), 거대 배열 다중 입출력(massive MIMO(multiple-input and multiple-output)), 전차원 다중입출력(FD-MIMO: full dimensional MIMO), 어레이 안테나(array antenna), 아날로그 빔형성(analog beam-forming), 또는 대규모 안테나(large scale antenna)와 같은 기술들을 지원할 수 있다. 무선 통신 모듈(1492)은 전자 장치(1401), 외부 전자 장치(예: 전자 장치(1404)) 또는 네트워크 시스템(예: 제 2 네트워크(1499))에 규정되는 다양한 요구사항을 지원할 수 있다. 일 실시예에 따르면, 무선 통신 모듈(1492)은 eMBB 실현을 위한 Peak data rate(예: 20Gbps 이상), mMTC 실현을 위한 손실 Coverage(예: 164dB 이하), 또는 URLLC 실현을 위한 U-plane latency(예: 다운링크(DL) 및 업링크(UL) 각각 0.5ms 이하, 또는 라운드 트립 1ms 이하)를 지원할 수 있다.
안테나 모듈(1497)은 신호 또는 전력을 외부(예: 외부의 전자 장치)로 송신하거나 외부로부터 수신할 수 있다. 일 실시예에 따르면, 안테나 모듈(1497)은 서브스트레이트(예: PCB) 위에 형성된 도전체 또는 도전성 패턴으로 이루어진 방사체를 포함하는 안테나를 포함할 수 있다. 일 실시예에 따르면, 안테나 모듈(1497)은 복수의 안테나들(예: 어레이 안테나)을 포함할 수 있다. 이런 경우, 제 1 네트워크(1498) 또는 제 2 네트워크(1499)와 같은 통신 네트워크에서 사용되는 통신 방식에 적합한 적어도 하나의 안테나가, 예를 들면, 통신 모듈(1490)에 의하여 상기 복수의 안테나들로부터 선택될 수 있다. 신호 또는 전력은 상기 선택된 적어도 하나의 안테나를 통하여 통신 모듈(1490)과 외부의 전자 장치 간에 송신되거나 수신될 수 있다. 어떤 실시예에 따르면, 방사체 이외에 다른 부품(예: RFIC(radio frequency integrated circuit))이 추가로 안테나 모듈(1497)의 일부로 형성될 수 있다.
다양한 실시예에 따르면, 안테나 모듈(1497)은 mmWave 안테나 모듈을 형성할 수 있다. 일 실시예에 따르면, mmWave 안테나 모듈은 인쇄 회로 기판, 상기 인쇄 회로 기판의 제 1 면(예: 아래 면)에 또는 그에 인접하여 배치되고 지정된 고주파 대역(예: mmWave 대역)을 지원할 수 있는 RFIC, 및 상기 인쇄 회로 기판의 제 2 면(예: 윗 면 또는 측 면)에 또는 그에 인접하여 배치되고 상기 지정된 고주파 대역의 신호를 송신 또는 수신할 수 있는 복수의 안테나들(예: 어레이 안테나)을 포함할 수 있다.
상기 구성요소들 중 적어도 일부는 주변 기기들간 통신 방식(예: 버스, GPIO(general purpose input and output), SPI(serial peripheral interface), 또는 MIPI(mobile industry processor interface))을 통해 서로 연결되고 신호(예: 명령 또는 데이터)를 상호간에 교환할 수 있다.
일 실시예에 따르면, 명령 또는 데이터는 제 2 네트워크(1499)에 연결된 서버(1408)를 통해서 전자 장치(1401)와 외부의 전자 장치(1404)간에 송신 또는 수신될 수 있다. 외부의 전자 장치(1402, 또는 1004) 각각은 전자 장치(1401)와 동일한 또는 다른 종류의 장치일 수 있다. 일 실시예에 따르면, 전자 장치(1401)에서 실행되는 동작들의 전부 또는 일부는 외부의 전자 장치들(1402, 1004, 또는 1008) 중 하나 이상의 외부의 전자 장치들에서 실행될 수 있다. 예를 들면, 전자 장치(1401)가 어떤 기능이나 서비스를 자동으로, 또는 사용자 또는 다른 장치로부터의 요청에 반응하여 수행해야 할 경우에, 전자 장치(1401)는 기능 또는 서비스를 자체적으로 실행시키는 대신에 또는 추가적으로, 하나 이상의 외부의 전자 장치들에게 그 기능 또는 그 서비스의 적어도 일부를 수행하라고 요청할 수 있다. 상기 요청을 수신한 하나 이상의 외부의 전자 장치들은 요청된 기능 또는 서비스의 적어도 일부, 또는 상기 요청과 관련된 추가 기능 또는 서비스를 실행하고, 그 실행의 결과를 전자 장치(1401)로 전달할 수 있다. 전자 장치(1401)는 상기 결과를, 그대로 또는 추가적으로 처리하여, 상기 요청에 대한 응답의 적어도 일부로서 제공할 수 있다. 이를 위하여, 예를 들면, 클라우드 컴퓨팅, 분산 컴퓨팅, 모바일 에지 컴퓨팅(MEC: mobile edge computing), 또는 클라이언트-서버 컴퓨팅 기술이 이용될 수 있다. 전자 장치(1401)는, 예를 들어, 분산 컴퓨팅 또는 모바일 에지 컴퓨팅을 이용하여 초저지연 서비스를 제공할 수 있다. 다른 실시예에 있어서, 외부의 전자 장치(1404)는 IoT(internet of things) 기기를 포함할 수 있다. 서버(1408)는 기계 학습 및/또는 신경망을 이용한 지능형 서버일 수 있다. 일 실시예에 따르면, 외부의 전자 장치(1404) 또는 서버(1408)는 제 2 네트워크(1499) 내에 포함될 수 있다. 전자 장치(1401)는 5G 통신 기술 및 IoT 관련 기술을 기반으로 지능형 서비스(예: 스마트 홈, 스마트 시티, 스마트 카, 또는 헬스 케어)에 적용될 수 있다.
본 문서에 개시된 다양한 실시예들에 따른 전자 장치는 다양한 형태의 장치가 될 수 있다. 전자 장치는, 예를 들면, 휴대용 통신 장치(예: 스마트폰), 컴퓨터 장치, 휴대용 멀티미디어 장치, 휴대용 의료 기기, 카메라, 웨어러블 장치, 또는 가전 장치를 포함할 수 있다. 본 문서의 실시예에 따른 전자 장치는 전술한 기기들에 한정되지 않는다.
본 문서의 다양한 실시예들 및 이에 사용된 용어들은 본 문서에 기재된 기술적 특징들을 특정한 실시예들로 한정하려는 것이 아니며, 해당 실시예의 다양한 변경, 균등물, 또는 대체물을 포함하는 것으로 이해되어야 한다. 도면의 설명과 관련하여, 유사한 또는 관련된 구성요소에 대해서는 유사한 참조 부호가 사용될 수 있다. 본 문서에서, "A 또는 B", "A 및 B 중 적어도 하나", "A 또는 B 중 적어도 하나", "A, B 또는 C", "A, B 및 C 중 적어도 하나", 및 "A, B, 또는 C 중 적어도 하나"와 같은 문구들 각각은 그 문구들 중 해당하는 문구에 함께 나열된 항목들 중 어느 하나, 또는 그들의 모든 가능한 조합을 포함할 수 있다. "제 1", "제 2", 또는 "첫째" 또는 "둘째"와 같은 용어들은 단순히 해당 구성요소를 다른 해당 구성요소와 구분하기 위해 사용될 수 있으며, 해당 구성요소들을 다른 측면(예: 중요성 또는 순서)에서 한정하지 않는다. 어떤(예: 제 1) 구성요소가 다른(예: 제 2) 구성요소에, "기능적으로" 또는 "통신적으로"라는 용어와 함께 또는 이런 용어 없이, "커플드" 또는 "커넥티드"라고 언급된 경우, 그것은 상기 어떤 구성요소가 상기 다른 구성요소에 직접적으로(예: 유선으로), 무선으로, 또는 제 3 구성요소를 통하여 연결될 수 있다는 것을 의미한다.
본 문서의 다양한 실시예들에서 사용된 용어 "모듈"은 하드웨어, 소프트웨어 또는 펌웨어로 구현된 유닛을 포함할 수 있으며, 예를 들면, 로직, 논리 블록, 부품, 또는 회로와 같은 용어와 상호 호환적으로 사용될 수 있다. 모듈은, 일체로 구성된 부품 또는 하나 또는 그 이상의 기능을 수행하는, 상기 부품의 최소 단위 또는 그 일부가 될 수 있다. 예를 들면, 일 실시예에 따르면, 모듈은 ASIC(application-specific integrated circuit)의 형태로 구현될 수 있다.
본 문서의 다양한 실시예들은 기기(machine)(예: 전자 장치(1401)) 의해 읽을 수 있는 저장 매체(storage medium)(예: 내장 메모리(1436) 또는 외장 메모리(1438))에 저장된 하나 이상의 명령어들을 포함하는 소프트웨어(예: 프로그램(1440))로서 구현될 수 있다. 예를 들면, 기기(예: 전자 장치(1401))의 프로세서(예: 프로세서(1420))는, 저장 매체로부터 저장된 하나 이상의 명령어들 중 적어도 하나의 명령을 호출하고, 그것을 실행할 수 있다. 이것은 기기가 상기 호출된 적어도 하나의 명령어에 따라 적어도 하나의 기능을 수행하도록 운영되는 것을 가능하게 한다. 상기 하나 이상의 명령어들은 컴파일러에 의해 생성된 코드 또는 인터프리터에 의해 실행될 수 있는 코드를 포함할 수 있다. 기기로 읽을 수 있는 저장 매체는, 비일시적(non-transitory) 저장 매체의 형태로 제공될 수 있다. 여기서, ‘비일시적’은 저장 매체가 실재(tangible)하는 장치이고, 신호(signal)(예: 전자기파)를 포함하지 않는다는 것을 의미할 뿐이며, 이 용어는 데이터가 저장 매체에 반영구적으로 저장되는 경우와 임시적으로 저장되는 경우를 구분하지 않는다.
일 실시예에 따르면, 본 문서에 개시된 다양한 실시예들에 따른 방법은 컴퓨터 프로그램 제품(computer program product)에 포함되어 제공될 수 있다. 컴퓨터 프로그램 제품은 상품으로서 판매자 및 구매자 간에 거래될 수 있다. 컴퓨터 프로그램 제품은 기기로 읽을 수 있는 저장 매체(예: compact disc read only memory(CD-ROM))의 형태로 배포되거나, 또는 어플리케이션 스토어(예: 플레이 스토어TM)를 통해 또는 두 개의 사용자 장치들(예: 스마트 폰들) 간에 직접, 온라인으로 배포(예: 다운로드 또는 업로드)될 수 있다. 온라인 배포의 경우에, 컴퓨터 프로그램 제품의 적어도 일부는 제조사의 서버, 어플리케이션 스토어의 서버, 또는 중계 서버의 메모리와 같은 기기로 읽을 수 있는 저장 매체에 적어도 일시 저장되거나, 임시적으로 생성될 수 있다.
다양한 실시예들에 따르면, 상기 기술한 구성요소들의 각각의 구성요소(예: 모듈 또는 프로그램)는 단수 또는 복수의 개체를 포함할 수 있으며, 복수의 개체 중 일부는 다른 구성요소에 분리 배치될 수도 있다. 다양한 실시예들에 따르면, 전술한 해당 구성요소들 중 하나 이상의 구성요소들 또는 동작들이 생략되거나, 또는 하나 이상의 다른 구성요소들 또는 동작들이 추가될 수 있다. 대체적으로 또는 추가적으로, 복수의 구성요소들(예: 모듈 또는 프로그램)은 하나의 구성요소로 통합될 수 있다. 이런 경우, 통합된 구성요소는 상기 복수의 구성요소들 각각의 구성요소의 하나 이상의 기능들을 상기 통합 이전에 상기 복수의 구성요소들 중 해당 구성요소에 의해 수행되는 것과 동일 또는 유사하게 수행할 수 있다. 다양한 실시예들에 따르면, 모듈, 프로그램 또는 다른 구성요소에 의해 수행되는 동작들은 순차적으로, 병렬적으로, 반복적으로, 또는 휴리스틱하게 실행되거나, 상기 동작들 중 하나 이상이 다른 순서로 실행되거나, 생략되거나, 또는 하나 이상의 다른 동작들이 추가될 수 있다.
도 15는, 다양한 실시예들에 따른, 카메라 모듈(1480)을 예시하는 블록도(1500)이다. 도 15를 참조하면, 카메라 모듈(1480)은 렌즈 어셈블리(1510), 플래쉬(1520), 이미지 센서(1530), 이미지 스태빌라이저(1540), 메모리(1550)(예: 버퍼 메모리), 또는 이미지 시그널 프로세서(1560)를 포함할 수 있다. 렌즈 어셈블리(1510)는 이미지 촬영의 대상인 피사체로부터 방출되는 빛을 수집할 수 있다. 렌즈 어셈블리(1510)는 하나 또는 그 이상의 렌즈들을 포함할 수 있다. 일 실시예에 따르면, 카메라 모듈(1480)은 복수의 렌즈 어셈블리(1510)들을 포함할 수 있다. 이런 경우, 카메라 모듈(1480)은, 예를 들면, 듀얼 카메라, 360도 카메라, 또는 구형 카메라(spherical camera)를 형성할 수 있다. 복수의 렌즈 어셈블리(1510)들 중 일부는 동일한 렌즈 속성(예: 화각, 초점 거리, 자동 초점, f 넘버(f number), 또는 광학 줌)을 갖거나, 또는 적어도 하나의 렌즈 어셈블리는 다른 렌즈 어셈블리의 렌즈 속성들과 다른 하나 이상의 렌즈 속성들을 가질 수 있다. 렌즈 어셈블리(1510)는, 예를 들면, 광각 렌즈 또는 망원 렌즈를 포함할 수 있다.
플래쉬(1520)는 피사체로부터 방출 또는 반사되는 빛을 강화하기 위하여 사용되는 빛을 방출할 수 있다. 일 실시예에 따르면, 플래쉬(1520)는 하나 이상의 발광 다이오드들(예: RGB(red-green-blue) LED, white LED, infrared LED, 또는 ultraviolet LED), 또는 xenon lamp를 포함할 수 있다. 이미지 센서(1530)는 피사체로부터 방출 또는 반사되어 렌즈 어셈블리(1510)를 통해 전달된 빛을 전기적인 신호로 변환함으로써, 상기 피사체에 대응하는 이미지를 획득할 수 있다. 일 실시예에 따르면, 이미지 센서(1530)는, 예를 들면, RGB 센서, BW(black and white) 센서, IR 센서, 또는 UV 센서와 같이 속성이 다른 이미지 센서들 중 선택된 하나의 이미지 센서, 동일한 속성을 갖는 복수의 이미지 센서들, 또는 다른 속성을 갖는 복수의 이미지 센서들을 포함할 수 있다. 이미지 센서(1530)에 포함된 각각의 이미지 센서는, 예를 들면, CCD(charged coupled device) 센서 또는 CMOS(complementary metal oxide semiconductor) 센서를 이용하여 구현될 수 있다.
이미지 스태빌라이저(1540)는 카메라 모듈(1480) 또는 이를 포함하는 전자 장치(1401)의 움직임에 반응하여, 렌즈 어셈블리(1510)에 포함된 적어도 하나의 렌즈 또는 이미지 센서(1530)를 특정한 방향으로 움직이거나 이미지 센서(1530)의 동작 특성을 제어(예: 리드 아웃(read-out) 타이밍을 조정 등)할 수 있다. 이는 촬영되는 이미지에 대한 상기 움직임에 의한 부정적인 영향의 적어도 일부를 보상하게 해 준다. 일 실시예에 따르면, 이미지 스태빌라이저(1540)는, 일 실시예에 따르면, 이미지 스태빌라이저(1540)는 카메라 모듈(1480)의 내부 또는 외부에 배치된 자이로 센서(미도시) 또는 가속도 센서(미도시)를 이용하여 카메라 모듈(1480) 또는 전자 장치(1401)의 그런 움직임을 감지할 수 있다. 일 실시예에 따르면, 이미지 스태빌라이저(1540)는, 예를 들면, 광학식 이미지 스태빌라이저로 구현될 수 있다. 메모리(1550)는 이미지 센서(1530)를 통하여 획득된 이미지의 적어도 일부를 다음 이미지 처리 작업을 위하여 적어도 일시 저장할 수 있다. 예를 들어, 셔터에 따른 이미지 획득이 지연되거나, 또는 복수의 이미지들이 고속으로 획득되는 경우, 획득된 원본 이미지(예: Bayer-patterned 이미지 또는 높은 해상도의 이미지)는 메모리(1550)에 저장이 되고, 그에 대응하는 사본 이미지(예: 낮은 해상도의 이미지)는 표시 모듈(1460)을 통하여 프리뷰될 수 있다. 이후, 지정된 조건이 만족되면(예: 사용자 입력 또는 시스템 명령) 메모리(1550)에 저장되었던 원본 이미지의 적어도 일부가, 예를 들면, 이미지 시그널 프로세서(1560)에 의해 획득되어 처리될 수 있다. 일 실시예에 따르면, 메모리(1550)는 메모리(1430)의 적어도 일부로, 또는 이와는 독립적으로 운영되는 별도의 메모리로 구성될 수 있다.
이미지 시그널 프로세서(1560)는 이미지 센서(1530)를 통하여 획득된 이미지 또는 메모리(1550)에 저장된 이미지에 대하여 하나 이상의 이미지 처리들을 수행할 수 있다. 상기 하나 이상의 이미지 처리들은, 예를 들면, 깊이 지도(depth map) 생성, 3차원 모델링, 파노라마 생성, 특징점 추출, 이미지 합성, 또는 이미지 보상(예: 노이즈 감소, 해상도 조정, 밝기 조정, 블러링(blurring), 샤프닝(sharpening), 또는 소프트닝(softening)을 포함할 수 있다. 추가적으로 또는 대체적으로, 이미지 시그널 프로세서(1560)는 카메라 모듈(1480)에 포함된 구성 요소들 중 적어도 하나(예: 이미지 센서(1530))에 대한 제어(예: 노출 시간 제어, 또는 리드 아웃 타이밍 제어 등)를 수행할 수 있다. 이미지 시그널 프로세서(1560)에 의해 처리된 이미지는 추가 처리를 위하여 메모리(1550)에 다시 저장되거나 카메라 모듈(1480)의 외부 구성 요소(예: 메모리(1430), 표시 모듈(1460), 전자 장치(1402), 전자 장치(1404), 또는 서버(1408))로 제공될 수 있다. 일 실시예에 따르면, 이미지 시그널 프로세서(1560)는 프로세서(1420)의 적어도 일부로 구성되거나, 프로세서(1420)와 독립적으로 운영되는 별도의 프로세서로 구성될 수 있다. 이미지 시그널 프로세서(1560)가 프로세서(1420)와 별도의 프로세서로 구성된 경우, 이미지 시그널 프로세서(1560)에 의해 처리된 적어도 하나의 이미지는 프로세서(1420)에 의하여 그대로 또는 추가의 이미지 처리를 거친 후 표시 모듈(1460)을 통해 표시될 수 있다.
일 실시예에 따르면, 전자 장치(1401)는 각각 다른 속성 또는 기능을 가진 복수의 카메라 모듈(1480)들을 포함할 수 있다. 이런 경우, 예를 들면, 상기 복수의 카메라 모듈(1480)들 중 적어도 하나는 광각 카메라이고, 적어도 다른 하나는 망원 카메라일 수 있다. 유사하게, 상기 복수의 카메라 모듈(1480)들 중 적어도 하나는 전면 카메라이고, 적어도 다른 하나는 후면 카메라일 수 있다.
상술한 바와 같이, 일 실시 예에 따른 전자 장치(예: 도 1의 전자 장치(100))는, 복수의 카메라들(예: 도 1의 카메라(120)), 디스플레이(예: 도 1의 디스플레이(130)) 및 적어도 하나의 프로세서(예: 도 1의 프로세서(110))를 포함하고, 상기 적어도 하나의 프로세서는 상기 복수의 카메라들을 이용하는 촬영을 지원하는 어플리케이션을 실행하고, 상기 복수의 카메라들 중 제1 카메라를 통해 제1 화각을 갖는 제1 이미지를 획득하고, 상기 촬영의 배율이 제1 배율로 설정된 상태에서, 상기 제1 이미지를 이용한 프리뷰를 상기 디스플레이에 표시하고, 상기 제1 이미지에서 식별된 적어도 하나의 객체가 이동함에 따라 상기 적어도 하나의 객체가 포함되도록 상기 디스플레이에 표시되는 상기 제1 이미지를 이용한 프리뷰를 변경하고, 상기 제1 화각의 지정된 영역에 상기 적어도 하나의 객체가 위치하는 것에 기반하여, 상기 촬영의 배율을 제2 배율로 변경하고, 상기 복수의 카메라들 중 제2 카메라를 통해 제2 화각을 갖는 제2 이미지를 획득하고, 상기 제2 배율은 상기 제1 화각, 상기 제2 화각 및 상기 제1 화각에 대한 상기 적어도 하나의 객체의 위치에 기반하여 결정되며, 상기 촬영의 배율이 제2 배율로 설정된 상태에서, 상기 제2 이미지의 적어도 일부를 상기 디스플레이에 프리뷰로 표시할 수 있다.
일 실시 예에 따르면, 상기 적어도 하나의 프로세서(110)는 상기 제1 화각의 지정된 영역에 상기 적어도 하나의 객체가 지정된 시간 이상 위치하는 것으로 판단하는 것에 기반하여, 상기 제1 카메라를 통한 상기 제1 이미지의 획득으로부터 상기 제2 카메라를 통한 상기 제2 이미지의 획득으로 전환할 수 있다.
일 실시 예에 따르면, 상기 적어도 하나의 프로세서(110)는, 상기 제1 카메라를 통한 상기 제1 이미지의 획득으로부터 상기 제2 카메라를 통한 상기 제2 이미지의 획득으로 전환되기 이전에 상기 제2 카메라를 활성화시키고, 상기 활성화된 제2 카메라로 상기 적어도 하나의 객체를 추적할 수 있다.
일 실시 예에 따르면, 상기 적어도 하나의 프로세서(110)는, 상기 제1 카메라를 통한 상기 제1 이미지의 획득으로부터 상기 제2 카메라를 통한 상기 제2 이미지의 획득으로 전환된 후, 상기 적어도 하나의 객체를 제외한 영역 중 적어도 일부 영역에 블러 효과를 적용한 상기 제2 이미지의 적어도 일부를 상기 디스플레이에 프리뷰로 표시할 수 있다.
일 실시 예에 따르면, 상기 적어도 하나의 프로세서(110)는 상기 제1 이미지에서 식별된 적어도 하나의 객체의 카테고리 정보를 획득하고, 상기 획득된 카테고리 정보에 기반하여 상기 제2 카메라를 이용하여 상기 적어도 하나의 객체를 검출하고, 상기 제2 카메라를 이용하여 상기 검출된 적어도 하나의 객체를 추적할 수 있다.
일 실시 예에 따르면, 전자 장치(100)는 메모리(예: 도 1의 메모리(140))를 더 포함하고, 상기 적어도 하나의 프로세서(110)는 상기 적어도 하나의 객체를 포함하는 제1 관심 영역을 결정하고, 상기 제1 관심 영역 내 상기 적어도 하나의 객체의 위치 및 상기 제1 관심 영역에 대한 상기 적어도 하나의 객체의 크기의 비율(ratio)에 대한 정보를 포함하는 제1 정보를 상기 메모리에 저장할 수 있다.
일 실시 예에 따르면, 상기 적어도 하나의 프로세서(110)는 상기 적어도 하나의 객체의 좌표를 기반으로 상기 제1 관심 영역을 결정할 수 있다.
일 실시 예에 따르면, 상기 적어도 하나의 프로세서(110)는 상기 제1 관심 영역 내 상기 적어도 하나의 객체의 위치 또는 상기 제1 관심 영역에 대한 상기 적어도 하나의 객체의 크기의 비율이 변함에 따라 상기 제1 정보를 업데이트할 수 있다.
일 실시 예에 따르면, 상기 적어도 하나의 프로세서(110)는, 상기 메모리에 저장된 상기 제1 정보에 기반하여, 상기 적어도 하나의 객체를 포함하는 제2 관심 영역을 결정하고, 상기 제1 관심 영역 내 상기 적어도 하나의 객체의 위치 및 상기 제1 관심 영역에 대한 상기 적어도 하나의 객체의 크기의 비율은 상기 제2 관심 영역 내 상기 적어도 하나의 객체의 위치 및 상기 제2 관심 영역에 대한 상기 적어도 하나의 객체의 크기의 비율에 대응되며, 상기 제2 관심 영역이 결정되는 것에 기반하여 상기 제1 카메라를 비활성화할 수 있다.
일 실시 예에 따르면, 상기 적어도 하나의 프로세서(110)는 상기 제1 이미지에서 식별된 적어도 하나의 객체의 이동 속도에 기반하여 상기 제1 화각의 지정된 영역의 크기를 결정할 수 있다.
일 실시 예에 따르면, 상기 제1 화각이 상기 제2 화각보다 작은 경우, 상기 적어도 하나의 프로세서(110)는 상기 제1 화각의 가장자리에 인접한 영역을 상기 제1 화각의 지정된 영역으로 결정할 수 있다.
일 실시 예에 따르면, 상기 제1 화각이 상기 제2 화각보다 큰 경우, 상기 적어도 하나의 프로세서(110)는 상기 제2 화각과 중첩되거나 상기 제2 화각보다 작은 영역을 상기 제1 화각의 지정된 영역으로 결정할 수 있다.
일 실시 예에 따르면, 상기 제1 카메라 및 상기 제2 카메라는 각각 텔레 카메라, 와이드 카메라 또는 울트라 와이드 카메라 중 하나일 수 있다.
상술한 바와 같이, 일 실시 예에 따른 전자 장치(예: 도 1의 전자 장치(100))에 의해 수행되는 방법은, 복수의 카메라들(예: 도 1의 카메라(120))을 이용하는 촬영을 지원하는 어플리케이션을 실행하는 동작, 상기 복수의 카메라들 중 제1 카메라를 통해 제1 화각을 갖는 제1 이미지를 획득하는 동작, 상기 촬영의 배율이 제1 배율로 설정된 상태에서, 상기 제1 이미지를 이용한 프리뷰를 디스플레이(예: 도 1의 디스플레이(130))에 표시하는 동작, 상기 제1 이미지에서 식별된 적어도 하나의 객체가 이동함에 따라 상기 적어도 하나의 객체가 포함되도록 상기 디스플레이에 표시되는 상기 제1 이미지를 이용한 프리뷰를 변경하는 동작, 상기 제1 화각의 지정된 영역에 상기 적어도 하나의 객체가 위치하는 것에 기반하여, 상기 촬영의 배율을 제2 배율로 변경하는 동작, 상기 복수의 카메라들 중 제2 카메라를 통해 제2 화각을 갖는 제2 이미지를 획득하는 동작, 상기 제2 배율은 상기 제1 화각, 상기 제2 화각 및 상기 제1 화각에 대한 상기 적어도 하나의 객체의 위치에 기반하여 결정되며, 상기 촬영의 배율이 제2 배율로 설정된 상태에서, 상기 제2 이미지의 적어도 일부를 상기 디스플레이에 프리뷰로 표시하는 동작을 포함할 수 있다.
일 실시 예에 따르면, 상기 제1 화각의 지정된 영역에 상기 적어도 하나의 객체가 지정된 시간 이상 위치하는 것으로 판단하는 것에 기반하여, 상기 제1 카메라를 통한 상기 제1 이미지의 획득으로부터 상기 제2 카메라를 통한 상기 제2 이미지의 획득으로 전환하는 동작을 더 포함할 수 있다.
일 실시 예에 따르면, 상기 제1 카메라를 통한 상기 제1 이미지의 획득으로부터 상기 제2 카메라를 통한 상기 제2 이미지의 획득으로 전환되기 이전에 상기 제2 카메라를 활성화시키고, 상기 활성화된 제2 카메라로 상기 적어도 하나의 객체와 동일한 객체를 추적하는 동작을 더 포함할 수 있다.
일 실시 예에 따르면, 상기 제2 이미지의 적어도 일부를 상기 디스플레이에 프리뷰로 표시하는 동작은, 상기 제1 카메라를 통한 상기 제1 이미지의 획득으로부터 상기 제2 카메라를 통한 상기 제2 이미지의 획득으로 전환된 후 상기 적어도 하나의 객체를 제외한 영역 중 적어도 일부 영역에 블러 효과를 적용하여 상기 프리뷰를 표시하는 동작을 포함할 수 있다.
일 실시 예에 따르면, 상기 제1 이미지에서 식별된 적어도 하나의 객체의 카테고리 정보를 획득하는 동작, 상기 획득된 카테고리 정보에 기반하여 상기 제2 카메라를 이용하여 상기 적어도 하나의 객체를 검출하는 동작 및 상기 제2 카메라를 이용하여 상기 검출된 적어도 하나의 객체를 추적하는 동작을 더 포함할 수 있다.
일 실시 예에 따르면, 상기 적어도 하나의 객체를 포함하는 제1 관심 영역을 결정하는 동작 및 상기 제1 관심 영역 내 상기 적어도 하나의 객체의 위치 및 상기 제1 관심 영역에 대한 상기 적어도 하나의 객체의 크기의 비율에 대한 정보를 포함하는 제1 정보를 메모리에 저장하는 동작을 더 포함할 수 있다.
일 실시 예에 따르면, 상기 메모리에 저장된 상기 제1 정보에 기반하여, 상기 적어도 하나의 객체를 포함하는 제2 관심 영역을 결정하는 동작, 상기 제1 관심 영역 내 상기 적어도 하나의 객체의 위치 및 상기 제1 관심 영역에 대한 상기 적어도 하나의 객체의 크기의 비율은 상기 제2 관심 영역 내 상기 적어도 하나의 객체의 위치 및 상기 제2 관심 영역에 대한 상기 적어도 하나의 객체의 크기의 비율에 대응되며 상기 제2 관심 영역이 결정되는 것에 기반하여 상기 제1 카메라를 비활성화하는 동작을 더 포함할 수 있다.

Claims (15)

  1. 전자 장치에 있어서,
    복수의 카메라들;
    디스플레이; 및
    적어도 하나의 프로세서를 포함하고,
    상기 적어도 하나의 프로세서는:
    상기 복수의 카메라들을 이용하는 촬영을 지원하는 어플리케이션을 실행하고,
    상기 복수의 카메라들 중 제1 카메라를 통해 제1 화각(field of view)을 갖는 제1 이미지를 획득하고,
    상기 촬영의 배율이 제1 배율로 설정된 상태에서, 상기 제1 이미지를 이용한 프리뷰를 상기 디스플레이에 표시하고,
    상기 제1 이미지에서 식별된 적어도 하나의 객체가 이동함에 따라 상기 적어도 하나의 객체가 포함되도록 상기 디스플레이에 표시되는 상기 제1 이미지를 이용한 프리뷰를 변경하고,
    상기 제1 화각의 지정된 영역에 상기 적어도 하나의 객체가 위치하는 것에 기반하여, 상기 촬영의 배율을 제2 배율로 변경하고,
    상기 복수의 카메라들 중 제2 카메라를 통해 제2 화각을 갖는 제2 이미지를 획득하고, 상기 제2 배율은 상기 제1 화각, 상기 제2 화각 및 상기 제1 화각에 대한 상기 적어도 하나의 객체의 위치에 기반하여 결정되고,
    상기 촬영의 배율이 제2 배율로 설정된 상태에서, 상기 제2 이미지의 적어도 일부를 상기 디스플레이에 프리뷰로 표시하도록 구성된, 전자 장치.
  2. 청구항 1에 있어서,
    상기 적어도 하나의 프로세서는, 상기 제1 화각의 지정된 영역에 상기 적어도 하나의 객체가 지정된 시간 이상 위치하는 것으로 판단하는 것에 기반하여, 상기 제1 카메라를 통한 상기 제1 이미지의 획득으로부터 상기 제2 카메라를 통한 상기 제2 이미지의 획득으로 전환하도록 더 구성된, 전자 장치.
  3. 청구항 2에 있어서,
    상기 적어도 하나의 프로세서는, 상기 제1 카메라를 통한 상기 제1 이미지의 획득으로부터 상기 제2 카메라를 통한 상기 제2 이미지의 획득으로 전환하기 이전에 상기 제2 카메라를 활성화시키고, 상기 활성화된 제2 카메라로 상기 적어도 하나의 객체를 추적하도록 더 구성된, 전자 장치.
  4. 청구항 2에 있어서,
    상기 적어도 하나의 프로세서는, 상기 제1 카메라를 통한 상기 제1 이미지의 획득으로부터 상기 제2 카메라를 통한 상기 제2 이미지의 획득으로 전환한 후, 상기 적어도 하나의 객체를 제외한 영역 중 적어도 일부 영역에 블러 효과를 적용한 상기 제2 이미지의 적어도 일부를 상기 디스플레이에 프리뷰로 표시하도록 더 구성된, 전자 장치.
  5. 청구항 1에 있어서,
    상기 적어도 하나의 프로세서는:
    상기 제1 이미지에서 식별된 적어도 하나의 객체의 카테고리 정보를 획득하고,
    상기 획득된 카테고리 정보에 기반하여 상기 제2 카메라를 이용하여 상기 적어도 하나의 객체를 검출하고,
    상기 제2 카메라를 이용하여 상기 검출된 적어도 하나의 객체를 추적하도록 더 구성된, 전자 장치.
  6. 청구항 1에 있어서,
    메모리를 더 포함하고,
    상기 적어도 하나의 프로세서는:
    상기 적어도 하나의 객체를 포함하는 제1 관심 영역을 결정하고,
    상기 제1 관심 영역 내 상기 적어도 하나의 객체의 위치 및 상기 제1 관심 영역에 대한 상기 적어도 하나의 객체의 크기의 비율(ratio)에 대한 정보를 포함하는 제1 정보를 상기 메모리에 저장하도록 더 구성된, 전자 장치.
  7. 청구항 6에 있어서,
    상기 적어도 하나의 프로세서는, 상기 적어도 하나의 객체의 좌표를 기반으로 상기 제1 관심 영역을 결정하도록 더 구성된, 전자 장치.
  8. 청구항 6에 있어서,
    상기 적어도 하나의 프로세서는, 상기 제1 관심 영역 내 상기 적어도 하나의 객체의 위치, 또는 상기 제1 관심 영역에 대한 상기 적어도 하나의 객체의 크기의 비율이 변함에 따라 상기 제1 정보를 업데이트하도록 더 구성된, 전자 장치.
  9. 청구항 6에 있어서,
    상기 적어도 하나의 프로세서는,
    상기 메모리에 저장된 상기 제1 정보에 기반하여, 상기 적어도 하나의 객체를 포함하는 제2 관심 영역을 결정하고, 상기 제1 관심 영역 내 상기 적어도 하나의 객체의 위치 및 상기 제1 관심 영역에 대한 상기 적어도 하나의 객체의 크기의 비율은, 상기 제2 관심 영역 내 상기 적어도 하나의 객체의 위치 및 상기 제2 관심 영역에 대한 상기 적어도 하나의 객체의 크기의 비율에 대응되고,
    상기 제2 관심 영역이 결정되는 것에 기반하여 상기 제1 카메라를 비활성화하도록 더 구성된, 전자 장치.
  10. 청구항 1에 있어서,
    상기 적어도 하나의 프로세서는,
    상기 제1 이미지에서 식별된 적어도 하나의 객체의 이동 속도에 기반하여 상기 제1 화각의 지정된 영역의 크기를 결정하도록 더 구성된, 전자 장치.
  11. 청구항 1에 있어서,
    상기 제1 화각이 상기 제2 화각보다 작은 경우,
    상기 적어도 하나의 프로세서는, 상기 제1 화각의 가장자리에 인접한 영역을 상기 제1 화각의 상기 지정된 영역으로 결정하도록 더 구성된, 전자 장치.
  12. 청구항 1에 있어서,
    상기 제1 화각이 상기 제2 화각보다 큰 경우,
    상기 적어도 하나의 프로세서는, 상기 제2 화각과 중첩되거나 상기 제2 화각보다 작은 영역을 상기 제1 화각의 상기 지정된 영역으로 결정하도록 더 구성된, 전자 장치.
  13. 청구항 1에 있어서,
    상기 제1 카메라 및 상기 제2 카메라는 각각 텔레 카메라, 와이드 카메라 또는 울트라 와이드 카메라 중 하나인, 전자 장치.
  14. 전자 장치에 의해 수행되는 방법에 있어서,
    복수의 카메라들을 이용하는 촬영을 지원하는 어플리케이션을 실행하는 동작;
    상기 복수의 카메라들 중 제1 카메라를 통해 제1 화각을 갖는 제1 이미지를 획득하는 동작;
    상기 촬영의 배율이 제1 배율로 설정된 상태에서, 상기 제1 이미지를 이용한 프리뷰를 디스플레이에 표시하는 동작,
    상기 제1 이미지에서 식별된 적어도 하나의 객체가 이동함에 따라 상기 적어도 하나의 객체가 포함되도록 상기 디스플레이에 표시되는 상기 제1 이미지를 이용한 프리뷰를 변경하는 동작;
    상기 제1 화각의 지정된 영역에 상기 적어도 하나의 객체가 위치하는 것에 기반하여, 상기 촬영의 배율을 제2 배율로 변경하는 동작;
    상기 복수의 카메라들 중 제2 카메라를 통해 제2 화각을 갖는 제2 이미지를 획득하는 동작, 상기 제2 배율은 상기 제1 화각, 상기 제2 화각 및 상기 제1 화각에 대한 상기 적어도 하나의 객체의 위치에 기반하여 결정되고; 및
    상기 촬영의 배율이 제2 배율로 설정된 상태에서, 상기 제2 이미지의 적어도 일부를 상기 디스플레이에 프리뷰로 표시하는 동작을 포함하는, 전자 장치에 의해 수행되는 방법.
  15. 청구항 14에 있어서,
    상기 적어도 하나의 객체를 포함하는 제1 관심 영역을 결정하는 동작; 및
    상기 제1 관심 영역 내 상기 적어도 하나의 객체의 위치 및 상기 제1 관심 영역에 대한 상기 적어도 하나의 객체의 크기의 비율에 대한 정보를 포함하는 제1 정보를 메모리에 저장하는 동작을 더 포함하는, 전자 장치에 의해 수행되는 방법.
PCT/KR2022/016279 2021-10-27 2022-10-24 복수의 렌즈들을 구비하는 전자 장치 및 그 제어 방법 WO2023075335A1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US18/150,010 US20230156337A1 (en) 2021-10-27 2023-01-04 Electronic device having a plurality of lenses and controlling method thereof

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2021-0144893 2021-10-27
KR1020210144893A KR20230060304A (ko) 2021-10-27 2021-10-27 복수의 렌즈들을 구비하는 전자 장치 및 그 제어 방법

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US18/150,010 Continuation US20230156337A1 (en) 2021-10-27 2023-01-04 Electronic device having a plurality of lenses and controlling method thereof

Publications (1)

Publication Number Publication Date
WO2023075335A1 true WO2023075335A1 (ko) 2023-05-04

Family

ID=86159578

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2022/016279 WO2023075335A1 (ko) 2021-10-27 2022-10-24 복수의 렌즈들을 구비하는 전자 장치 및 그 제어 방법

Country Status (3)

Country Link
US (1) US20230156337A1 (ko)
KR (1) KR20230060304A (ko)
WO (1) WO2023075335A1 (ko)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170230585A1 (en) * 2016-02-08 2017-08-10 Qualcomm Incorporated Systems and methods for implementing seamless zoom function using multiple cameras
KR20180081918A (ko) * 2017-01-09 2018-07-18 삼성전자주식회사 전자 장치 및 전자 장치의 영상 촬영 방법
KR20180092621A (ko) * 2017-02-10 2018-08-20 엘지전자 주식회사 단말기 및 그 제어 방법
KR20190014638A (ko) * 2017-08-03 2019-02-13 엘지전자 주식회사 전자 기기 및 전자 기기의 제어 방법
KR20210059800A (ko) * 2019-07-31 2021-05-25 코어포토닉스 리미티드 카메라 패닝 또는 모션에서 배경 블러링을 생성하는 시스템 및 방법

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170230585A1 (en) * 2016-02-08 2017-08-10 Qualcomm Incorporated Systems and methods for implementing seamless zoom function using multiple cameras
KR20180081918A (ko) * 2017-01-09 2018-07-18 삼성전자주식회사 전자 장치 및 전자 장치의 영상 촬영 방법
KR20180092621A (ko) * 2017-02-10 2018-08-20 엘지전자 주식회사 단말기 및 그 제어 방법
KR20190014638A (ko) * 2017-08-03 2019-02-13 엘지전자 주식회사 전자 기기 및 전자 기기의 제어 방법
KR20210059800A (ko) * 2019-07-31 2021-05-25 코어포토닉스 리미티드 카메라 패닝 또는 모션에서 배경 블러링을 생성하는 시스템 및 방법

Also Published As

Publication number Publication date
US20230156337A1 (en) 2023-05-18
KR20230060304A (ko) 2023-05-04

Similar Documents

Publication Publication Date Title
WO2020171512A1 (en) Electronic device for recommending composition and operating method thereof
WO2020091262A1 (ko) 인공 신경망을 이용한 이미지 처리 방법 및 이를 지원하는 전자 장치
WO2022030838A1 (ko) 프리뷰 이미지를 제어하는 전자 장치 및 방법
WO2022114801A1 (ko) 복수의 카메라를 포함하는 전자 장치 및 그 전자 장치의 제어 방법
WO2020071823A1 (en) Electronic device and gesture recognition method thereof
WO2022010122A1 (ko) 영상을 제공하는 방법 및 이를 지원하는 전자 장치
WO2022108235A1 (ko) 슬로우 셔터를 제공하기 위한 방법, 장치 및 저장 매체
WO2022139262A1 (ko) 관심 객체를 이용하여 비디오를 편집하는 전자 장치 및 그 동작 방법
WO2022092706A1 (ko) 복수의 카메라를 이용한 사진 촬영 방법 및 그 장치
WO2021145667A1 (ko) 카메라 이동 제어 방법 및 장치
WO2023018201A1 (ko) 이미지 안정화를 수행하는 전자 장치 및 그의 동작 방법
WO2023033333A1 (ko) 복수의 카메라를 포함하는 전자 장치 및 그 동작 방법
WO2022149812A1 (ko) 카메라 모듈을 포함하는 전자 장치 및 그 전자 장치의 동작 방법
WO2021256709A1 (ko) 전자 장치 및 전자 장치의 동작 방법
WO2023075335A1 (ko) 복수의 렌즈들을 구비하는 전자 장치 및 그 제어 방법
WO2022154168A1 (ko) 자동 초점 조절이 가능한 전자 장치 및 그 동작 방법
WO2024076176A1 (ko) 카메라를 제어하는 방법 및 전자 장치
WO2024085493A1 (ko) 프리뷰 이미지를 표시하기 위한 전자 장치 및 방법
WO2024034856A1 (ko) 이미지를 제공하는 방법 및 이를 지원하는 전자 장치
WO2023063520A1 (ko) 전자 장치 및 전자 장치에서 촬영 기능을 수행하는 방법
WO2022031050A1 (ko) 이미지를 생성하는 전자 장치 및 방법
WO2023017981A1 (ko) 언더 디스플레이 카메라를 포함하는 전자 장치 및 그 동작 방법
WO2022191495A1 (ko) 전자 장치 및 그의 얼굴 인식 방법
WO2024053824A1 (ko) 이미지를 제공하는 전자 장치 및 그의 동작 방법
WO2024117587A1 (ko) 필터 기능을 제공하는 전자 장치 및 그 동작 방법

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 22887531

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE