CN106416217A - 照相机的深度辅助场景识别 - Google Patents

照相机的深度辅助场景识别 Download PDF

Info

Publication number
CN106416217A
CN106416217A CN201480079238.6A CN201480079238A CN106416217A CN 106416217 A CN106416217 A CN 106416217A CN 201480079238 A CN201480079238 A CN 201480079238A CN 106416217 A CN106416217 A CN 106416217A
Authority
CN
China
Prior art keywords
scene
depth
objects
digital
digital depth
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201480079238.6A
Other languages
English (en)
Inventor
D·林纳克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of CN106416217A publication Critical patent/CN106416217A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/20Image signal generators
    • H04N13/271Image signal generators wherein the generated image signals comprise depth maps or disparity maps
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/222Studio circuitry; Studio devices; Studio equipment
    • H04N5/2224Studio circuitry; Studio devices; Studio equipment related to virtual studio applications
    • H04N5/2226Determination of depth image, e.g. for foreground/background separation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/667Camera operation mode switching, e.g. between still and video, sport and normal or high- and low-resolution modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/61Control of cameras or camera modules based on recognised objects
    • H04N23/611Control of cameras or camera modules based on recognised objects where the recognised objects include parts of the human body

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Studio Devices (AREA)

Abstract

通过计算数字照相机接收的场景的数字深度图来操作照相机。基于场景的数字深度图,自动选择可用场景模式设置中的一个。描述了相关的方法、设备、和/或计算机程序产品。

Description

照相机的深度辅助场景识别
技术领域
此处描述的多种实施方式涉及对照相机进行操作,更具体而言,涉及对照相机接收的图像进行处理。
背景技术
普通用户和专业摄影师都使用数字照相机。数字照相机可以包括例如自动对焦和人脸识别的特征以辅助进行操作用来获得更好质量的图片。照相机可以包括操作者选择例如微距、风景、肖像、背光等模式的设置。然而,照相机用户需要以更少的操作者控制设置和更自动化的功能使得用户更加无需知晓照相机的技术操作来获得更高质量的图片。
可以寻求在本节中描述的方法,但这并不是先前已经构思或寻求的方法。因此,除非此处另有说明,否则在本节中描述的方法并非是本申请以及要求本身前的优先权的任何申请中权利要求书的现有技术,并且虽然包含在本节内但并不视为现有技术。
发明内容
根据此处描述的多种实施方式,对照相机操作可包括计算由该照相机接收的场景的数字深度图。基于所述场景的所述数字深度图,可以自动选择所述场景的多个场景模式设置中的一个。
在一些实施方式中,可以在自动选择多个场景模式设置中的一个之前,基于与场景有关的非深度信息在多个场景模式设置中确定初始场景模式设置。可以基于场景的数字深度图自动改变初始场景模式设置。
根据一些实施方式,可以进一步基于非深度信息自动选择多个场景模式设置中的一个。
在一些实施方式中,所述场景可以包括多个像素。计算所述数字深度图可以包括:计算所述场景中所述多个像素中的一个或更多个的深度值。
根据一些实施方式,所述照相机可以包括多个独立图像拍摄***。计算所述场景的数字深度图可以包括计算来自多个独立图像拍摄***中至少两个的场景的数字深度图。在一些实施方式中,可以仅使用多个独立图像拍摄***中的两个来执行场景的数字深度图的计算。
根据一些实施方式,计算所述数字深度图可以包括:计算多个数字深度图,该多个数字深度图中的每一个与所述场景的相应帧有关;自动选择所述多个场景模式设置中的一个可以包括基于所述多个数字深度图自动选择所述多个场景模式设置中的一个。
在一些实施方式中,计算所述数字深度图可以包括:计算多个数字深度图,该多个数字深度图中的每一个与所述场景的相应帧有关。基于所述场景的所述数字深度图自动选择所述场景的所述多个场景模式设置中的一个可以包括:比较所述多个数字深度图中的一个或更多个以确定所述场景中运动的存在。基于所述多个数字深度图中的至少一个以及在所述场景中存在运动,可自动选择所述场景模式设置。
根据一些实施方式,基于所述场景的所述数字深度图自动选择所述多个场景模式设置中的一个可以包括:基于所述数字深度图识别所述场景中的一个或更多个对象。可以将深度值指派给所述场景中的对象中的一个或更多个中的每一个。可以基于所指派的深度值对场景中的一个或更多个对象进行加权。基于所述对象的相应加权,可以自动选择所述场景模式设置。
根据一些实施方式,基于所述数字深度图识别所述场景中的所述一个或更多个对象包括:基于所述数字深度图将所述场景中多个像素中的一个或更多个分类为深度范围。基于将所述场景中的所述多个像素中的一个或更多个分类为深度范围,可以识别场景中的一个或更多个对象。
在一些实施方式中,基于所指派的深度值对场景中的一个或更多个对象进行加权包括:确定场景中一个或更多个对象中每一个的相应类型。基于场景中一个或更多个对象中每一个的所确定的类型,对场景中的一个或更多个对象指派优先级。基于指派给一个或更多个对象的优先级,对场景中的该一个或更多个对象进行加权。
根据一些实施方式,基于所述场景的所述数字深度图自动选择所述多个场景模式设置中的一个包括:基于所述数字深度图将所述场景中多个像素中的一个或更多个分类为深度范围。基于将所述多个像素中的一个或更多个分类为深度范围,对场景中的一个或更多个像素进行加权。基于所述一个或更多个像素的加权,可以自动选择所述场景模式设置。
在一些实施方式中,场景模式设置可以包括运动模式、微距模式、电影模式、夜晚模式、雪景模式、文档模式、沙滩模式、食物模式、焰火模式、微笑检测模式、稳定拍摄模式、风景模式、肖像模式、光圈优先模式、快门优先模式和/或感光度优先模式。基于场景的数字深度图自动选择场景的多个场景模式设置中的一个可以包括:设置与快门速度、光圈、白平衡、色彩饱和度、焦距和/或曝光有关的参数。
应当理解的是,上面以对照相机进行操作的方法的形式描述了多种实施方式。根据此处描述的实施方式中的任意一个,可以为例如照相机的设备提供类似的实施方式。例如,照相机可以包括配置为执行例如计算数字深度图以及自动选择场景模式设置之类操作的计算单元和/或选择单元。根据此处描述的实施方式中的任意一个,可以为计算机程序产品提供类似的实施方式。例如,计算机程序产品可以包括计算机可读程序代码,该计算机可读程序代码配置为计算场景的数字深度图和/或基于场景的数字深度图自动选择多个场景模式设置中的一个。
在浏览以下附图和详细描述之后,根据本发明的实施方式的其他电子设备、方法和/或计算机程序产品对于本领域技术人员而言将是明显的或者将变得明显。旨在将所有这种附加电子设备、方法和/或计算机程序代码包括在说明书中,落在本发明的范围内,并受到所附权利要求书的保护。此外,此处公开的所有实施方式旨在可以单独地或者以任何方式组合和/或组合来实现。
附图说明
附图被包括进来以提供对本发明的进一步理解,并且被并入而构成了本申请的一部分,附图例示了本发明的特定实施方式。在附图中:
[图1]图1是根据此处描述的多种实施方式的可以由照相机、设备、方法和/或计算机程序产品进行分析的场景的简化框图。
[图2]图2是根据此处描述的多种实施方式的可以由照相机、设备、方法和/或计算机程序产品进行分析的场景的多个帧的简化框图。
[图3A]图3A是根据此处描述的多种实施方式的可以由照相机、设备、方法和/或计算机程序产品进行分析的场景的简化框图。
[图3B]图3B是包括照相机和显示所拍摄场景的屏幕的简化框图。
[图3C]图3C是包括照相机的设备的简化框图。
[图3D]图3D是根据此处描述的多种实施方式的接口连接至照相机、方法和/或计算机程序产品的设备的简化框图。
[图4]图4是照相机的简化框图。
[图5]图5是根据此处描述的多种实施方式的可以由***、方法、设备和/或计算机程序产品执行以对照相机进行操作用来基于数字深度图自动选择场景模式设置的操作的流程图。
[图6]图6是根据此处描述的多种实施方式的可以由***、方法、设备和/或计算机程序产品执行以基于数字深度图自动选择场景模式设置的操作的流程图。
[图7]图7是根据此处描述的多种实施方式的可以由***、方法、设备和/或计算机程序产品执行以计算场景的数字深度图的操作的流程图。
[图8]图8是根据此处描述的多种实施方式的可以由***、方法、设备和/或计算机程序产品执行以计算场景的数字深度图的操作的流程图。
[图9]图9是根据此处描述的多种实施方式的可以由***、方法、设备和/或计算机程序产品执行以计算场景的数字深度图的操作的流程图。
[图10]图10是根据此处描述的多种实施方式的可以由***、方法、设备和/或计算机程序产品执行以基于数字深度图自动选择场景模式设置的操作的流程图。
[图11]图11是根据此处描述的多种实施方式的可以由***、方法、设备和/或计算机程序产品执行以基于数字深度图自动选择场景模式设置的操作的流程图。
[图12]图12是根据此处描述的多种实施方式的可以由***、方法、设备和/或计算机程序产品执行以基于数字深度图自动选择场景模式设置的操作的流程图。
[图13]图13是根据此处描述的多种实施方式的可以由***、方法、设备和/或计算机程序产品执行以基于数字深度图识别场景中的一个或更多个对象的操作的流程图。
[图14]图14是根据此处描述的多种实施方式的可以由***、方法、设备和/或计算机程序产品执行以基于指派的深度值对场景中的一个或更多个对象进行加权的操作的流程图。
[图15]图15是根据此处描述的多种实施方式的可以由***、方法、设备和/或计算机程序产品执行以基于数字深度图自动选择场景模式设置的操作的流程图。
[图16]图16是根据此处描述的多种实施方式的可以由***、方法、设备和/或计算机程序产品执行以基于数字深度图自动选择场景模式设置的操作的流程图。
具体实施方式
此处描述的多种实施方式可以提供用于对照相机进行操作的***、方法和设备。可以特别利用例如移动电话或独立照相机的移动设备来使用此处描述的多种实施方式。
下面将参照示出了多种实施方式的例子的附图更充分地描述多种实施方式。然而,本发明可以用许多不同的形式来具体实施,并且不应当解释为限于此处所阐述的实施方式。而是提供这些实施方式是为了使公开充分和完整,并向本领域技术人员充分转达本发明的范围。应当注意的是,这些实施方式不是互斥的。一个实施方式的部件默认假设在另一个实施方式中存在/使用。
仅出于例示和解释的目的,此处在对照相机进行操作的上下文中描述这些和其他实施方式。然而,应当理解的是,本发明不限于这种实施方式,并且通常可以在得益于包含了照相机的任何类型设备中具体实施。如此处所使用的,照相机可以包括接收图像和/或场景数据的任何设备,并且可以包括但不限于移动设备(“蜂窝”电话)、膝上型/便携式计算机、口袋计算机、手持计算机、桌面计算机、机机(M2M)或MTC型设备、具有通信接口的传感器、监视***传感器、独立照相机(直接拍摄式、单镜反光式(SLR)等)、望远镜、电视照相机等。此外,该设备可以记录或存储图像以供处理。在其他实施方式中,该设备不一定记录或存储图像,但可以拍摄和处理图像并将处理后的图像转发到另一个设备。照相机的例子可以包括具有以多种配置而设置的多个子照相机的阵列照相机。照相机可以包括具有两个照相机的立体照相机。根据此处描述的多种实施方式,必须具有最少两个照相机来拍摄深度信息。还应当理解的是,照相机可以包括处理器、存储器,以及适当缩放以容许用于对此处讨论的深度图进行计算和处理所需的大量处理的其他资源。
深度图是用于以数学方式表达空间中的表面的值的二维(2D)阵列,其中,该阵列的行和列对应于该表面的x和y位置信息,阵列元素是从给定点或照相机位置到该表面的深度或距离读数。深度图可以视为对象的灰度图,只是在对象的表面上各点处用深度信息代替了强度和颜色信息、或像素。可以由深度图估计对象的图形表达。然而,深度图的精度会随着到对象的距离增大而下降。
图1是根据此处描述的多种实施方式的可以由照相机***、方法和/或计算机程序产品进行分析的场景的简化框图。如图1所示,例示了可以由照相机拍摄的场景101。根据此处描述的多种实施方式,照相机可以包括一个或更多个图像拍摄***和/或子照相机。图1的场景101例如可以包括多种对象,例如汽车106、处于场景中距离图像拍摄***不同距离处的人107-109、可位于前景中的花110-114和位于场景的背景中的云102-105。
图2是根据此处描述的多种实施方式的可以由照相机、方法和/或计算机程序产品进行分析的场景的多个帧的简化框图。取决于照相机的能力和/或所选择的设置,可以以多种帧时间间隔来拍摄多个帧201-204。帧之间的时间间隔对于例如视频的应用可以是恒定值,或者可以基于对所拍摄场景的分析而改变。例如,场景中的运动的指示可以表明在所拍摄各个场景的帧之间具有较小的时间间隔。场景中的少许运动指示可以允许更大的时间间隔以减少处理时间和照相机所使用的存储器资源。
图3A是根据此处描述的多种实施方式的可以由照相机、设备、方法和/或计算机程序产品进行分析的场景的简化框图。图3A例示了可以配置为拍摄场景101的移动设备301。移动设备301可以包括一个或更多个图像拍摄***。场景101可以由图像拍摄***拍摄,或者发送到移动设备进行处理。
图3B是包括照相机和显示所拍摄场景的显示屏幕的简化框图。图3B例示了包括显示屏幕302和照相机303的移动设备301。照相机可以是单镜头照相机、阵列照相机、立体照相机或者能够记录深度信息的任何其他类型的照相机***。虽然照相机303和显示屏幕302被例示为在移动设备301的前侧,但照相机和显示屏幕可以位于设备的任何位置,包括背侧。
图3C是包括照相机的设备的简化框图。图3C例示了包括照相机304的移动设备301。根据一些实施方式,移动设备可以是单独照相机。照相机可以包括一个或更多个独立图像拍摄***。图像拍摄***可以包括单镜头照相机、照相机阵列或立体照相机。例如,该图像拍摄***可以包括16个图像拍摄***。根据此处描述的多种实施方式,可以使用更少或更多的独立图像拍摄***。虽然照相机304被例示为在移动设备301的背侧,但照相机可以位于设备的任何位置,包括前侧。
图3D是根据此处描述的多种实施方式的方法、设备和/或计算机程序产品的的简化框图。所例示的移动设备301可以表示包括硬件、软件、固件和/或电路以及独立照相机的任何适当组合的设备。如图3D所示,示例性的移动设备301包括处理器308、存储器309、收发器307和天线305。收发器可以包括用于提供无线或有线数据传输的电路。照相机306可以位于移动设备301内部、位于移动设备301外部,或者可以与移动设备301远程通信。在特定实施方式中,移动设备所提供的上述功能的一些或全部可以由执行存储在例如图3D中所示存储器309之类计算机可读介质中的指令的处理器308来提供。该设备的另选实施方式可以包括除了图3D中所示部件以外可以负责提供移动设备的功能的特定方面的附加部件,这些功能包括任何上述功能和/或支持上述方案所必须的任何功能。
图4是照相机的简化框图。图4例示了与处理器308和一个或更多个图像拍摄***403通信的计算单元401和选择单元402。在一些实施方式中,计算单元401和选择单元402可以包括硬件、软件、固件和/或电路的任何适当组合。根据一些实施方式,计算单元401和选择单元402可以实现在处理器308中。一个或更多个图像处理***403可以位于照相机内部或外部,或者可以位于图3的移动设备301内部或外部。
图5是根据此处描述的多种实施方式的可以由***、方法和/或计算机程序产品执行以对照相机进行操作用来基于数字深度图自动选择场景模式设置的操作的流程图。参照图5,耦合至移动设备的照相机或独立照相机可以在方框501处操作,其例如可以具体实现为图3A-3D的移动设备301。例如,该照相机可以是独立照相机、移动通信设备的一部分,或者位于该设备远距离处。该照相机可以拍摄、采集、记录、存储或者处理场景。可以在方框502处计算照相机可用的场景的数字深度图。如此处所使用的,“计算”可以包括计算、算数运算、逻辑运算、接收具有数字深度图和/或相关信息的数据结构、选择表示数字深度图的数据值和/或表查找。在方框503,可以基于场景的数字深度图自动选择多个场景模式设置中的一个场景模式设置。此外,场景模式设置的自动选择可以包括其他因素,例如面部识别、曝光等级、背光、对象识别和/或颜色渲染等。
场景模式设置可以包括运动模式、微距模式、电影模式、使得选择不同图像质量参数的电影质量指示模式、夜晚模式、雪景模式、文档模式、沙滩模式、食物模式、焰火模式、微笑检测模式、稳定拍摄模式、风景模式、肖像模式、光圈优先模式、快门优先模式和/或感光度优先模式。通常,场景模式设置可以由照相机的用户通过照相机中的拨盘或者其他用户输入来手动设定。在拍摄照片或视频之前,照相机的用户应当确定最适于当前条件的模式类型。
此处描述的多种实施方式可来源于如下认识:照相机的用户的手动设置基于用户感知到的条件,并且还可能随着条件的快速变化(即,条件在几帧之内变化)而用户难以并且缓慢改变。强烈对比的是,此处描述的模式的自动选择使得用户对照相机的技术操作更加不了解,并且具有极其大量模式允许在几帧或甚至连续帧之间的模式设置有多种条件、精度和快速改变。
图6是可以执行用于基于数字深度图自动选择场景模式设置(可以对应于图5的方框503)的操作的流程图。参照图6,在方框601,自动选择多个场景模式设置中的一个之前,可以基于与场景有关的非深度信息在多个场景模式设置中确定初始场景模式设置。非深度信息可以包括直方图数据、颜色信息、白平衡、面部检测和/或焦点位置。非深度信息可以用于确定场景模式。在方框602,可以基于场景的数字深度图自动改变初始场景模式设置。
图7是可以执行用于计算场景的数字深度图的操作的流程图,其可以对应于图5的方框502。参照图7,在方框701,可以计算场景中多个像素中的一个或更多个像素的深度值。每个像素的单独深度值可以是场景中特定点的距离的表示。根据一些实施方式,可以进一步基于非深度信息自动选择多个场景模式设置中的一个。
图8是可以执行用于计算场景的数字深度图的操作的流程图,其可以对应于图5的方框502。参照图8,在方框801,可以使用与多个独立成像***中的至少两个相关联的深度值来计算数字深度图。例如,立体照相机是具有两个或更多个镜头且每个镜头具有单独图像传感器的一种照相机/成像***。该多个镜头使得照相机能够模拟人的双眼视觉,因此能够拍摄三维图像,即,计算深度图。图像拍摄***可以包括两个或更多个子照相机,每个子照相机具有单独图像传感器来获得与场景有关的信息,例如,如图3C所例示的。在方框802,可以仅使用多个独立图像拍摄***中的两个来计算数字深度图。
图9是可以执行用于计算场景的数字深度图的操作的流程图,其可以对应于图5的方框502。参照图9,在方框901,可以计算多个数字深度图,其中各个数字深度图与场景中相应的帧有关。根据一些实施方式,可以对每一帧计算数字深度图。在一些实施方式中,可以对每第N帧或者对在经过给定时间间隔以后的帧计算数字深度图。
图10是可以执行用于基于数字深度图自动选择场景模式设置(可以对应于图5的方框503)的操作的流程图。参照图10,在方框1001,可以使用多个数字深度图自动选择场景模式设置。
图11是可以执行用于基于数字深度图自动选择场景模式设置(可以对应于图5的方框503)的操作的流程图。参照图11,在方框1101,对多个数字深度图中的一个或更多个进行比较以确定在场景中运动的存在。然后,在方框1102,基于多个数字深度图中的至少一个和场景中存在运动来自动选择场景模式设置。在选择场景模式设置时,可以考虑例如场景中一个或更多个对象的运动速率、运动对象的数量和场景中不同对象的运动速率的差别之类的因素。在做出改变模式设置的决策之前,可以在多帧上对深度图求平均。在给定数量帧之后或者给定数量时间间隔之后可以应用模式设置的变化,使得模式设置不会改变得过于频繁。可以每第N帧对深度图进行采样以减小计算需求。
图12是可以执行用于基于数字深度图自动选择场景模式设置(可以对应于图5的方框503)的操作的流程图。参照图12,在方框1201,可以基于数字深度图来识别场景中的一个或更多个对象。在方框1202,将深度值指派给场景中一个或更多个对象中的每一个。在方框1203,基于所指派的深度值对场景中的一个或更多个对象进行加权。在方框1204,基于对象的相应权重自动选择场景模式设置。
根据一些实施方式,可以使用深度图来提供用于判定应当使用的正确场景模式的统计基础。例如,初始自动场景识别算法可以选择风景作为正确场景进行选择。深度图可以用于确定所选择的风景模式是否为适当的选择。如果深度图统计表明在照相机附近存在许多对象,则风景模式可能不是场景模式选择的适当选择。在该情况下,深度图可以改善场景识别的精度。在另一个示例性实施方式中,初始场景模式设置可以指示食物模式。在统计上来说,可能期望场景中的一个或更多个对象距离照相机一米距离。如果根据深度图一个或更多个对象并未被发现在一米以内,则食物模式可能是不正确的,并且可以选择一个不同的模式。
根据一些实施方式,可以在其他类型信息中加权深度图信息以确定更精确的场景模式设置。换言之,可以结合其他非深度信息使用深度信息来选择场景模式设置。在一些实施方式中,可以将深度信息和非深度信息一起加权来选择场景模式设置。
图13是可以执行用于基于数字深度图识别场景中的一个或更多个对象(可以对应于图12的方框1201)的操作的流程图。参照图13,在方框1301,可以基于数字深度图将场景中多个像素中的一个或更多个分类为范围。然后,在方框1302,基于将场景中多个像素中的一个或更多个分类为范围,识别场景中的一个或更多个对象。具有相似深度范围的像素可以识别为与相似对象有关,而具有不同深度范围的像素可以识别为与不同对象有关。
图14是可以执行用于基于所指派的深度值对场景中的一个或更多个对象进行加权(可以对应于图12的方框1203)的操作的流程图。参照图14,在方框1401,可以对场景中一个或更多个对象的各个对象确定相应的类型。例如,第一范围内的像素可以识别为第一对象,而第二范围内的像素可以识别为场景中的第二对象。然后,在方框1402,对场景中被识别为这些对象中每一个的所确定的相应类型的一个或更多个对象指派优先级。然后,在方框1403,基于指派给该一个或更多个对象的优先级完成对场景中该一个或更多个对象的加权。
图15是可以执行用于基于数字深度图自动选择场景模式设置(可以对应于图5的方框503)的操作的流程图。参照图15,在方框1501,可以基于数字深度图将场景中多个像素中的一个或更多个分类为深度范围。然后,在方框1502,基于将像素分类为深度范围对场景中的一个或更多个对象进行加权。在方框1503,基于像素的加权来自动选择场景模式设置。
图16是可以执行用于基于数字深度图自动选择场景模式设置(可以对应于图5的方框503)的操作的流程图。参照图16,在方框1601,可以调节与快门速度、光圈、白平衡、色彩饱和度、焦距和/或曝光有关的参数。
本领域技术人员应当认识到,基于数字深度图自动选择场景模式设置不同于一些照相机的自动对焦功能(即,“自动对焦”特征)。自动对焦大多通过两种方法实现:主动自动对焦和被动自动对焦。主动自动对焦使用超声和/或红外波来测量到对象的距离。超声或红外波到达拍摄对象并反弹回来。对超声或红外波返回照相机的时段进行测量以估计到对象的距离。基于测得的距离,可以应用自动对焦设置。相比于主动自动对焦,被动自动对焦通常使用来自镜头不同部分的两个图像来分析光强度图案以计算分离误差。针对多种对焦设置计算该分离误差。照相机确定具有由相邻像素之间的分离误差所指示的最大强度差的对焦设置,并选择相应的对焦设置。换言之,被动自动对焦尝试多种对焦设置,并选择最佳的一个,类似于在数字自动对焦照相机的使用变得普遍之前摄影师使用的手动对焦。
与主动和被动自动对焦功能形成强烈对比的是,使用此处描述的实施方式包括计算照相机接收的场景的数字深度图。深度图包括来自多个图像拍摄***的数字信息,以确定从给定点或照相机位置到表面的深度或距离读数。主动自动对焦使用超声或红外波反射的时间测量,而被动自动对焦对许多对焦设置进行测试并使像素之间的强度差最大化。然而,主动或被动自动对焦都不使用数字深度图来自动选择场景模式设置,如上所述。
这里参照附图说明本公开的实施方式。其他实施方式可以采取许多不同的形式,并且不应当解释为限于此处所阐述的实施方式。通篇用相同的附图标记表示相同的元件。
将会理解的是,当一个元件被称作“连接至”、“耦合至”、“响应于”(或者其变型方式)另一个元件时,它可以直接连接至、耦合至或响应于另一个元件,或者可以存在中间元件。相反,当一个元件被称作“直接连接至”、“直接耦合至”、“直接响应于”(或以变型方式)另一个元件时,不存在中间元件。此外,此处使用的“耦合”、“连接”、“响应”或其变型可以包括无线方式耦合、连接或响应。通篇用相同的附图标记表示相同的元件。此处使用的术语仅是出于描述具体实施方式的目的,而不是为了限定发明构思。此处所使用的单数形式的“一”、“一个”和“该”旨在还包括复数形式,除非上下文清楚地表明了相反的情形。出于简洁和/或清楚的目的,并未详细描述公知的功能或构造。
应当理解的是,虽然此处可以使用术语第一、第二等描述不同的元件,但这些元件不应受限于这些术语。这些术语只是用于将一个元件与另一个元件区分开。例如,第一元件可以称为第二元件,类似地,第二元件可以称为第一元件,而不会脱离本发明构思的范围。此外,如此处所使用的,术语“和/或”包括一个或更多个相关联列出的项目的任意和全部组合。
除非另有限定,否则此处使用的所有术语(包括技术和科学术语)具有与本发明构思所属技术领域一个普通技术人员一般理解的含义相同的含义。进一步将理解,例如在常用词典中所限定的术语之类的术语应当解释为具有与本说明书和相关技术的上下文中的含义一致的含义,并且不应当以此处所限定的含义理想化或过于形式化地解释。
如此处所使用的,术语“包括”、“包含”、“具有”或其变型是开放式的,并且包括一个或更多个所阐述的特征、整体、元件、步骤、部件或功能,但不排除存在或附加一个或更多个其他的特征、整体、元件、步骤、部件、功能或其组合。此外,如果在此处使用来源于拉丁语短语exempli gratia的常用缩写“等”(e.g.),其可以用于引入或指定前述项的一个或多个一般性例子,而不是旨在限于这种项。如果在此处使用来源于拉丁语短语id est的常用缩写“亦即”(i.e.),其可以用于指定来自于更一般性引用的特定项。
此处参照计算机实现的方法、装置(***和/或设备)和/或计算机程序产品的框图和/或流程图示例描述示例性实施方式。应当理解的是,框图和/或流程图示例的方框以及框图和/或流程图示例中的方框的组合可以用一个或更多个计算机电路执行的计算机程序指令来实现。这些计算机程序指令可以提供给通用计算机电路、例如数字处理器的专用计算机电路和/或其他可编程数据处理电路的处理器电路,来产生一个机器,使得通过计算机和/或其他可编程数据处理装置的处理器执行的指令对晶体管、存储在存储器位置中的值以及位于这种电路中的其他硬件部件进行变换和控制,以实现该框图和/或流程图方框中指定的功能/动作,由此创建用于实现在该框图和/或流程图方框中指定的功能/动作的装置(功能性)和/或结构。这些计算机程序指令还可以存储在指示计算机或其他可编程数据处理装置以特定方式运行的计算机可读介质中,使得存储在计算机可读介质中的指令产生包括实现了框图和/或流程图方框中指定的功能/动作的指令的制品。
实体的非短时计算机可读介质可以包括电、磁、光、电磁或半导体数据存储***、装置或设备。计算机可读介质的更具体例子包括以下例子:便携式计算机磁盘、随机存取存储器(RAM)电路、只读存储器(ROM)电路、可擦除可编程只读存储器(EPROM或闪存)电路、便携式压缩盘只读存储器(CD-ROM)、和便携式数字视频盘只读存储器(DVD/蓝光)。
这些计算机程序指令还可以载入到计算机和/或其他可编程数据处理装置上,使得在该计算机或其他可编程数据处理装置上执行一系列操作步骤以产生计算机实现的过程,从而在该计算机和/或其他可编程数据处理装置上执行的指令提供了用于实现在框图和/或流程图一个或多个方框中指定的功能/动作的步骤。
因而,本发明构思的实施方式可以具体实现在运行在统称为“电路”、“模块”、“单元”或其变型的例如数字信号处理器之类处理器上的硬件和/或软件(包括固件、驻留软件、微码等)中。
应理解的是在一些另选实施方式中,方框中注明的功能/动作可以不按照流程图中所示的顺序执行。例如,取决于所涉及的功能/动作,连续地示出的两个方框实际上可以大致同时地执行,或者这两个方框有时候可以按相反顺序执行。此外,流程图和/或框图的给定方框的功能可以分解为多个框图,和/或流程图和/或框图的两个或多个方框的功能可以至少部分地结合在一起。最后,在所例示的方框之间可以增加/***其他方框。此外,虽然某些图包括通信路径上的箭头以示出通信的主要方向,但应理解的是,该通信可以按与所示箭头相反的方向进行。
此处结合下文的说明和附图公开了许多不同的实施方式。应当理解的是,在字面上描述和例示这些实施方式的每一个组合和子组合会造成不必要的重复和混淆。因而,包括附图的本说明书将解释为构成了此处描述的实施方式、制作和使用这些实施方式的方式和过程的所有组合和子组合的完整书面说明,并且将支持任何这种组合和子组合的权利要求。
如此处所使用的,术语“移动设备”包括具有或没有多线显示器的蜂窝和/或卫星无线电话;可能将无线电话与数据处理、传真和/或数据通信功能组合起来的个人通信***(PCS)终端;包括无线电频率收发机和寻呼机、互联网/内部网接入、网页浏览器、组织器、日历和/或全球定位***(GPS)接收器的个人数字助理(PDA)或智能电话;和/或包括无线电频率收发机的常规膝上型(笔记本)和/或掌上型(上网本)计算机或其他装置。如此处使用的,术语“移动设备”还包括可以具有时变或固定地理坐标和/或可以是便携式、可输送的、安装在车辆中(航空、航海或陆地)和/或位于和/或构造成在本地操作和/或分布在一个或更多个陆地和/或地球以外位置上的任何其他辐射用户设备。如此处使用的,术语“移动设备”还包括主要功能是拍摄图片和视频的单独的照相机。
在附图和说明文件中,公开了本发明构思的实施方式,并且虽然采用了特定术语,但这些术语仅是在一般的和描述性的意义上使用而不是出于限制目的,本发明构思的范围由所附权利要求书限定。

Claims (20)

1.一种操作照相机的方法,所述方法包括:
计算(502)照相机接收的场景(101)的数字深度图;以及
基于所述场景(101)的所述数字深度图自动选择(503)所述场景的多个场景模式设置中的一个。
2.根据权利要求1所述的方法,
其中,在自动选择(503)所述多个场景模式设置中的一个之前,基于与所述场景(101)有关的非深度信息在所述多个场景模式设置中确定(601)初始场景模式设置;并且
其中,自动选择(503)所述多个场景模式设置中的一个包括基于所述场景的所述数字深度图自动改变(602)所述初始场景模式设置。
3.根据权利要求1所述的方法,
其中,自动选择(503)所述多个场景模式设置中的一个包括:基于所述场景的所述数字深度图并进一步基于非深度信息自动选择所述场景的多个场景模式设置中的一个。
4.根据权利要求1所述的方法,
其中,所述场景(101)包括多个像素,并且
其中,计算(502)所述数字深度图包括:计算(701)所述场景中所述多个像素中的一个或更多个的深度值。
5.根据权利要求1所述的方法,
其中,所述照相机包括多个独立图像拍摄***(304);并且
其中,计算(502)所述数字深度图包括:计算(801)来自所述多个独立图像拍摄***(304)中至少两个的场景(101)的数字深度图。
6.根据权利要求5所述的方法,其中,使用所述多个独立图像拍摄***中的仅两个执行所述计算(502)。
7.根据权利要求1所述的方法,
其中,计算(502)所述数字深度图包括:计算(901)多个数字深度图,所述多个数字深度图中的每一个与所述场景的相应帧有关;并且
其中,自动选择(503)所述多个场景模式设置中的一个包括:基于所述多个数字深度图自动选择(1001)所述多个场景模式设置中的一个。
8.根据权利要求1所述的方法,
其中,计算(502)所述数字深度图包括:计算(901)多个数字深度图,所述多个数字深度图中的每一个与所述场景的相应帧有关;
其中,自动选择(503)所述多个场景模式设置中的一个包括:比较(1101)所述多个数字深度图中的两个或更多个,以确定所述场景中存在运动;并且
其中,自动选择(503)所述多个场景模式设置中的一个进一步包括:基于所述多个数字深度图中的至少一个和所述场景中存在运动,自动选择(1102)场景模式设置。
9.根据权利要求1所述的方法,其中,基于所述场景的所述数字深度图自动选择(503)所述场景的所述多个场景模式设置中的一个包括:
基于所述数字深度图识别(1201)所述场景中的一个或更多个对象;
将深度值指派给(1202)所述场景中的所述一个或更多个对象中的每一个;
基于所指派的深度值对所述场景中的所述一个或更多个对象进行加权(1203);以及
基于所述一个或更多个对象的相应加权自动选择(1204)场景模式设置。
10.根据权利要求9所述的方法,其中,基于所述数字深度图识别(1201)所述场景中的所述一个或更多个对象包括:
基于所述数字深度图将所述场景中多个像素中的一个或更多个分类(1301)为深度范围;以及
基于将所述场景中所述多个像素中的所述一个或更多个分类为深度范围而识别(1302)所述场景中的所述一个或更多个对象。
11.根据权利要求9所述的方法,其中,基于所指派的深度值对所述场景中的所述一个或更多个对象进行加权(1203)包括:
确定(1401)所述场景中的所述一个或更多个对象中各个对象的相应类型;
基于所述场景中的所述一个或更多个对象中各个对象的所确定的相应类型,为所述场景中识别出的所述一个或更多个对象指派(1402)优先级;以及
基于指派给所述场景中的所述一个或更多个对象的优先级对所述一个或更多个对象进行加权(1403)。
12.根据权利要求1所述的方法,其中,基于所述场景的所述数字深度图自动选择(503)所述场景的所述多个场景模式设置中的一个包括:
基于所述数字深度图将所述场景中多个像素中的一个或更多个分类(1501)为深度范围;
基于将所述多个像素中的所述一个或更多个分类为深度范围而对所述场景中的一个或更多个像素进行加权(1502);以及
基于所述一个或更多个像素的加权自动选择(1503)场景模式设置。·
13.根据权利要求1所述的方法,其中,所述场景模式设置包括:运动模式、微距模式、电影模式、夜晚模式、稳定拍摄模式、风景模式、肖像模式、雪景模式、文档模式、沙滩模式、食物模式和/或焰火模式。
14.根据权利要求1所述的方法,其中,基于所述场景的所述数字深度图自动选择(503)所述场景的所述多个场景模式设置中的一个包括:
设置(1601)与快门速度、光圈、白平衡、色彩饱和度、焦距和/或曝光有关的参数。
15.一种用于操作照相机的设备(301),所述设备(301)包括:
计算单元(401),所述计算单元(401)配置为计算照相机接收的场景的数字深度图;以及
选择单元(402),所述选择单元(402)配置为基于所述场景的所述数字深度图自动选择所述场景的多个场景模式设置中的一个。
16.根据权利要求15所述的设备,
其中,所述选择单元(402)进一步配置为在自动选择所述多个场景模式设置中的一个之前,基于与所述场景有关的非深度信息在所述多个场景模式设置中确定初始场景模式设置;并且
其中,所述选择单元(402)进一步配置为通过基于所述场景的所述数字深度图自动改变所述初始场景模式设置而自动选择所述多个场景模式设置中的一个。
17.根据权利要求15所述的设备,其中,所述选择单元(402)进一步配置为:
基于所述数字深度图识别所述场景中的一个或更多个对象;
将深度值指派给所述场景中的所述一个或更多个对象中的每一个;
基于所指派的深度值对所述场景中的所述一个或更多个对象进行加权;以及
基于所述一个或更多个对象的相应加权自动选择所述场景模式设置。
18.根据权利要求17所述的设备,其中,所述选择单元(402)进一步配置为:
基于所述数字深度图将所述场景中多个像素中的一个或更多个分类为深度范围;以及
基于将所述场景中所述多个像素中的所述一个或更多个分类为深度范围而识别所述场景中的所述一个或更多个对象。
19.根据权利要求17所述的设备,其中,所述选择单元(402)进一步配置为:
确定所述场景中的所述一个或更多个对象中各个对象的相应类型;
基于所述场景中的所述一个或更多个对象中各个对象的所确定的相应类型,为所述场景中识别出的所述一个或更多个对象指派优先级;以及
基于指派给所述一个或更多个对象的优先级对所述场景中的所述一个或更多个对象进行加权。
20.一种用于操作照相机的计算机程序产品,所述计算机程序产品包括其中具体实现有计算机可读程序代码的计算机可读存储介质,所述计算机可读程序代码包括:
配置为计算(502)照相机接收的场景的数字深度图的计算机可读程序代码;以及
配置为基于所述场景的所述数字深度图自动选择(503)所述场景的多个场景模式设置中的一个的计算机可读程序代码。
CN201480079238.6A 2014-04-17 2014-04-17 照相机的深度辅助场景识别 Pending CN106416217A (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2014/002191 WO2015159323A1 (en) 2014-04-17 2014-04-17 Depth assisted scene recognition for a camera

Publications (1)

Publication Number Publication Date
CN106416217A true CN106416217A (zh) 2017-02-15

Family

ID=50687548

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201480079238.6A Pending CN106416217A (zh) 2014-04-17 2014-04-17 照相机的深度辅助场景识别

Country Status (4)

Country Link
US (1) US20160277724A1 (zh)
EP (1) EP3132598A1 (zh)
CN (1) CN106416217A (zh)
WO (1) WO2015159323A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108881706A (zh) * 2017-05-16 2018-11-23 北京三星通信技术研究有限公司 控制多媒体设备工作的方法及装置
CN110049234A (zh) * 2019-03-05 2019-07-23 努比亚技术有限公司 一种成像方法、移动终端及存储介质

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9544485B2 (en) * 2015-05-27 2017-01-10 Google Inc. Multi-mode LED illumination system
AU2017382721B2 (en) 2016-12-23 2022-09-29 Magic Leap, Inc. Techniques for determining settings for a content capture device
US20180241927A1 (en) * 2017-02-23 2018-08-23 Motorola Mobility Llc Exposure Metering Based On Depth Map
US10325354B2 (en) * 2017-04-28 2019-06-18 Qualcomm Incorporated Depth assisted auto white balance
CN109688351B (zh) * 2017-10-13 2020-12-15 华为技术有限公司 一种图像信号处理方法、装置及设备
US20230054623A1 (en) * 2019-12-17 2023-02-23 Nec Corporation Image processing method
US11503204B2 (en) 2019-12-19 2022-11-15 Magic Leap, Inc. Gradient-based exposure and gain control techniques
EP3979618A1 (en) * 2020-10-01 2022-04-06 Axis AB A method of configuring a camera
JP2022096313A (ja) * 2020-12-17 2022-06-29 キヤノン株式会社 情報処理装置、情報処理方法、およびプログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6301440B1 (en) * 2000-04-13 2001-10-09 International Business Machines Corp. System and method for automatically setting image acquisition controls
CN102724399A (zh) * 2011-03-25 2012-10-10 索尼公司 基于场景深度图的缩放、孔径和快门速度的自动设定
CN102891960A (zh) * 2011-07-19 2013-01-23 安讯士有限公司 用于确定图像调整参数的方法和相机

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4943824A (en) * 1987-11-12 1990-07-24 Minolta Camera Kabushiki Kaisha Device for measuring object distance used for camera
US6441817B1 (en) * 1999-11-29 2002-08-27 Xerox Corporation Methods and apparatuses for performing Z-buffer granularity depth calibration in graphics displays of three-dimensional scenes
US6940545B1 (en) * 2000-02-28 2005-09-06 Eastman Kodak Company Face detecting camera and method
US7274800B2 (en) * 2001-07-18 2007-09-25 Intel Corporation Dynamic gesture recognition from stereo sequences
US20030235338A1 (en) * 2002-06-19 2003-12-25 Meetrix Corporation Transmission of independently compressed video objects over internet protocol
US8711204B2 (en) * 2009-11-11 2014-04-29 Disney Enterprises, Inc. Stereoscopic editing for video production, post-production and display adaptation
US8229172B2 (en) * 2009-12-16 2012-07-24 Sony Corporation Algorithms for estimating precise and relative object distances in a scene
KR20110124473A (ko) * 2010-05-11 2011-11-17 삼성전자주식회사 다중시점 영상을 위한 3차원 영상 생성 장치 및 방법
US20120056982A1 (en) * 2010-09-08 2012-03-08 Microsoft Corporation Depth camera based on structured light and stereo vision
US9066086B2 (en) * 2010-12-08 2015-06-23 Industrial Technology Research Institute Methods for generating stereoscopic views from monoscopic endoscope images and systems using the same
US9098908B2 (en) * 2011-10-21 2015-08-04 Microsoft Technology Licensing, Llc Generating a depth map
US8953024B2 (en) * 2012-02-21 2015-02-10 Intellectual Ventures Fund 83 Llc 3D scene model from collection of images
TWI489326B (zh) * 2012-06-05 2015-06-21 Wistron Corp 操作區的決定方法與系統
US9064295B2 (en) * 2013-02-04 2015-06-23 Sony Corporation Enhanced video encoding using depth information
US20140363097A1 (en) * 2013-06-06 2014-12-11 Etron Technology, Inc. Image capture system and operation method thereof
TWI538508B (zh) * 2014-08-15 2016-06-11 光寶科技股份有限公司 一種可獲得深度資訊的影像擷取系統與對焦方法
US10404969B2 (en) * 2015-01-20 2019-09-03 Qualcomm Incorporated Method and apparatus for multiple technology depth map acquisition and fusion

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6301440B1 (en) * 2000-04-13 2001-10-09 International Business Machines Corp. System and method for automatically setting image acquisition controls
CN102724399A (zh) * 2011-03-25 2012-10-10 索尼公司 基于场景深度图的缩放、孔径和快门速度的自动设定
CN102891960A (zh) * 2011-07-19 2013-01-23 安讯士有限公司 用于确定图像调整参数的方法和相机

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108881706A (zh) * 2017-05-16 2018-11-23 北京三星通信技术研究有限公司 控制多媒体设备工作的方法及装置
CN108881706B (zh) * 2017-05-16 2023-10-10 北京三星通信技术研究有限公司 控制多媒体设备工作的方法及装置
CN110049234A (zh) * 2019-03-05 2019-07-23 努比亚技术有限公司 一种成像方法、移动终端及存储介质

Also Published As

Publication number Publication date
EP3132598A1 (en) 2017-02-22
US20160277724A1 (en) 2016-09-22
WO2015159323A1 (en) 2015-10-22

Similar Documents

Publication Publication Date Title
CN106416217A (zh) 照相机的深度辅助场景识别
US10944901B2 (en) Real time assessment of picture quality
CN107087107B (zh) 基于双摄像头的图像处理装置及方法
JP5150651B2 (ja) 多様なモードにおいて操作可能なマルチレンズカメラ
EP3248374B1 (en) Method and apparatus for multiple technology depth map acquisition and fusion
KR101612727B1 (ko) 리포커싱을 실행하는 방법 및 전자 기기
CN100550986C (zh) 具有多个分辨率的方法和照相机
US9313419B2 (en) Image processing apparatus and image pickup apparatus where image processing is applied using an acquired depth map
CN107690673B (zh) 图像处理方法、装置及服务器
JP6218377B2 (ja) 画像処理装置及び画像処理方法
CN103837129B (zh) 一种终端中的测距方法、装置及终端
JP2010521005A (ja) 改善された焦点調節機能を備えたマルチレンズカメラ
CN106030366B (zh) 摄像装置及对焦控制方法
KR20170005009A (ko) 3d 라돈 이미지의 생성 및 사용
US8339477B2 (en) Digital camera capable of detecting name of captured landmark and method thereof
CN102647449A (zh) 基于云服务的智能摄影方法、装置及移动终端
JP5901782B2 (ja) 画像処理装置、撮像装置、画像処理方法及び画像処理プログラム
US20190253593A1 (en) Photographing Method for Terminal and Terminal
US9332195B2 (en) Image processing apparatus, imaging apparatus, and image processing method
CN104412298B (zh) 用于变换图像的方法和设备
CN106204554A (zh) 基于多聚焦图像的景深信息获取方法、***及拍摄终端
JP2017135538A (ja) 電子機器、電子機器の制御方法、制御プログラム並びに制御装置
CN112017137A (zh) 图像处理方法、装置、电子设备及计算机可读存储介质
US20230033956A1 (en) Estimating depth based on iris size
KR101755599B1 (ko) 디지털 촬영 장치 및 그의 이미지 제공 방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170215