CN106101540A - 对焦点确定方法及装置 - Google Patents
对焦点确定方法及装置 Download PDFInfo
- Publication number
- CN106101540A CN106101540A CN201610493585.4A CN201610493585A CN106101540A CN 106101540 A CN106101540 A CN 106101540A CN 201610493585 A CN201610493585 A CN 201610493585A CN 106101540 A CN106101540 A CN 106101540A
- Authority
- CN
- China
- Prior art keywords
- focusing
- significance
- prediction
- picture
- region
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 239000000284 extract Substances 0.000 claims abstract description 18
- 238000009499 grossing Methods 0.000 claims description 5
- 238000013528 artificial neural network Methods 0.000 claims description 4
- 230000001537 neural effect Effects 0.000 claims description 3
- 210000004218 nerve net Anatomy 0.000 claims 2
- 238000010586 diagram Methods 0.000 description 8
- 238000001514 detection method Methods 0.000 description 5
- 230000007935 neutral effect Effects 0.000 description 5
- 238000004590 computer program Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 238000000429 assembly Methods 0.000 description 2
- 230000000712 assembly Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 241000209140 Triticum Species 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 238000001574 biopsy Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000000151 deposition Methods 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000009394 selective breeding Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/462—Salient features, e.g. scale invariant feature transforms [SIFT]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/61—Control of cameras or camera modules based on recognised objects
- H04N23/611—Control of cameras or camera modules based on recognised objects where the recognised objects include parts of the human body
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/67—Focus control based on electronic image sensor signals
- H04N23/675—Focus control based on electronic image sensor signals comprising setting of focusing regions
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/80—Camera processing pipelines; Components thereof
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Studio Devices (AREA)
- Image Analysis (AREA)
Abstract
提供了一种对焦点确定方法及装置。所述对焦点确定方法包括:获取取景范围的取景图像;识别取景图像中的显著性区域;以及在所识别的显著性区域中提取至少一个对焦点。通过识别取景图像中的显著性区域以及在所识别的显著性区域中提取至少一个对焦点,可以在一定程度上保证所选择的对焦点的准确性,从而保证对焦的准确性。
Description
技术领域
本发明涉及自动对焦技术领域,更具体地涉及一种对焦点确定方法及装置。
背景技术
目前,大多数的数码相机以及诸如智能手机和平板电脑等配备摄像头的便携式智能设备都具有自动对焦装置,其通过利用对比度等方法,使得在用户指定的对焦点区域附近的图像更锐利。
然而,由于对焦点是用户根据经验事先指定,往往导致在用户经验不足的情况下所拍摄的图像质量并不理想。此外,由于不同的构图要求不同的对焦点,因此用户需要在不同的对焦设置间进行切换,这严重影响了用户的抓拍等操作。此外,在抓拍一些快速运动物体的时候,用户也很难在非常短的时间内完成对焦操作。此外,在对焦一些比较远且较小的物体时,很容易出现用户指定的对焦点不精确的情况。
因此,需要一种能够准确地确定对焦点的方法及装置。
发明内容
考虑到上述问题而提出了本发明。本发明提供了一种活体检测方法及装置,通过采用随机动作序列并且通过组合图像传感器采集的图像和非图像传感器采集的信息,可以提高活体检测的精度。
根据本发明一方面,提供了一种对焦点确定方法,包括:获取取景范围的取景图像;识别取景图像中的显著性区域;以及在所识别的显著性区域中提取至少一个对焦点。
根据本发明另一方面,提供了一种对焦点确定装置,包括:图像获取部件,用于获取取景范围的取景图像;显著性区域识别部件,用于识别取景图像中的显著性区域;以及对焦点提取部件,用于在所识别的显著性区域中提取至少一个对焦点。
根据本发明又一方面,提供了一种电子设备,包括:处理器、存储有程序指令的存储装置、输入装置以及摄像头,其中,所述输入装置接收拍摄指令,所述摄像头响应于所述拍摄指令采集取景范围的取景图像,所述存储装置中存储的程序指令在被所述处理器执行时,获取取景范围的取景图像;识别取景图像中的显著性区域;以及在所识别的显著性区域中提取至少一个对焦点,所述摄像头按照所述至少一个对焦点执行对焦操作并拍摄图像。
根据本发明再一方面,提供了一种存储介质,在所述存储介质上存储了程序指令,在所述程序指令被计算机或处理器运行时用于执行本发明实施例的对焦点确定方法,并且用于实现根据本发明实施例的对焦点确定装置。
根据本发明实施例的对焦点确定方法及装置,通过识别取景图像中的显著性区域以及在所识别的显著性区域中提取至少一个对焦点,可以在一定程度上保证所选择的对焦点的准确性,从而保证对焦的准确性。进一步地,本发明通过利用神经网络自动确定对焦点,避免了繁琐的对焦点选择或切换操作,有利于用户进行抓拍等操作,并且可以避免由于用户误操作造成的对焦错误。
附图说明
通过结合附图对本发明实施例进行更详细的描述,本发明的上述以及其它目的、特征和优势将变得更加明显。附图用来提供对本发明实施例的进一步理解,并且构成说明书的一部分,与本发明实施例一起用于解释本发明,并不构成对本发明的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
图1是根据本发明实施例的对焦点确定方法的示意性流程图;
图2是根据本发明实施例的识别取景图像中的显著性区域的示意性流程图;
图3是根据本发明第一实施例的在连续拍摄图像的情况下提取对焦点的示意性流程图;
图4A、图4B、图4C和图4D分别是根据本发明实施例中的取景图像、显著性识别图片、二值化的显著性图片以及对焦点确定图片;
图5是根据本发明实施例的对焦点确定装置的示意性框图;
图6是根据本发明实施例的显著性区域识别部件的示意性框图;
图7是根据本发明实施例的对焦点提取部件的示意性框图;以及
图8是根据本发明实施例的电子设备800的示意性框图。
具体实施方式
为了使得本发明的目的、技术方案和优点更为明显,下面将参照附图详细描述根据本发明的示例实施例。显然,所描述的实施例仅仅是本发明的一部分实施例,而不是本发明的全部实施例,应理解,本发明不受这里描述的示例实施例的限制。基于本发明中描述的本发明实施例,本领域技术人员在没有付出创造性劳动的情况下所得到的所有其它实施例都应落入本发明的保护范围之内。
首先,参照图1来描述用于实现本发明实施例的对焦点确定方法100。根据本发明实施例,所述对焦点确定方法可以在云端实现或者可以在配备有摄像头的便携式智能设备处实现。
在步骤S110,获取取景范围的取景图像。如图4A所示,示出了根据本发明实施例的对焦点确定方法100所获取的取景图像,即输入图像。
在步骤S120,识别取景图像中的显著性区域。根据本发明实施例的一个示例,利用机器学习模型识别取景图像中的显著性区域,例如,利用神经网络识别取景图像中的显著性区域。通过模型训练,使得神经网络能够学习到图片中哪些物体的显著性更高,例如通常认为人、车要比墙壁、天空、草地、远处建筑物的显著性更高。此外,还可以利用其他方法(例如关键区域聚焦方法等)识别显著性区域,在此并不进行限定。其中,采用机器学习模型例如神经网络识别显著性区域,相对于其他识别显著性区域的方法,可以使识别更加智能。
此外,根据本发明实施例,还可以依据不同的显著性定义训练多种模型供用户选择,例如“人脸优先”的显著性模型、“文字优先”的显著性模型等。
在步骤S130,在所识别的显著性区域中提取至少一个对焦点。
在所述对焦点确定方法在便携式智能设备处实现的情况下,在所述便携式智能设备上配备的摄像头采集取景范围的取景图像,然后所述摄像头利用在步骤S130处提取的对焦点对所述取景范围进行对焦并拍摄图像。
在所述对焦点确定方法在云端实现的情况下,在所述便携式智能设备上配备的摄像头采集取景范围的取景图像,所述便携式智能设备将所述取景图像传送到云端,即云端在步骤S110获取取景范围的取景图像,云端将在步骤S130中提取的对焦点传送至所述便携式智能设备,然后由便携式智能设备上配备的摄像头按照所述对焦点进行对焦并拍摄图像。
在本发明实施例中,在利用在提取的对焦点对所述取景范围进行对焦并拍摄图像的过程中,对焦点的选择可以由智能设备自动实现。通过自动选择对焦点,可以避免繁琐的对焦点选择或切换操作,有利于拍摄者进行抓拍等操作,并避免拍摄者误操作造成的对焦错误。然而,在一个具体示例中,对焦点可以由拍摄者通过操作进行选择。通过人为选择对焦点,可以让操作者根据实际需要或个人喜好选择对焦点,有利于拍摄出令拍摄者满意的图像。
根据本发明实施例,通过自动确定对焦点,避免了繁琐的对焦点选择或切换操作,有利于用户进行抓拍等操作,并且可以避免由于用户误操作造成的对焦错误。
图2示出了根据本发明实施例的识别取景图像中的显著性区域的示意性流程图。
在步骤S210,利用取景图像生成显著性识别图片。在所述显著性识别图片中,每个像素的灰度值代表该像素的显著性。
根据本发明实施例,可以利用神经网络计算取景图像的图像域梯度,然后根据所述图像域梯度,生成所述显著性识别图片。
如图4B所示,示出了根据本发明实施例的利用图4A所示的取景图像生成的显著性识别图片。
在步骤S220,将所述显著性识别图片二值化,得到二值化的显著性图片。如图4C所示,示出了根据本发明实施例的利用图4A所示的取景图像生成的二值化的显著性图片。
在步骤S230,将所述二值化的显著性图片中的至少一个连通区域作为显著性区域。在如图4C所示的二值化的显著性图片中包括三个连通区域,将这三个连通区域作为如图4A所示的取景图像中的显著性区域。
在识别出取景图像中的显著性区域之后,对于所述二值化的显著性图片中的每个连通区域,提取一个对焦点。作为示例,对于所述二值化的显著性图片中的每个连通区域,对该连通区域中的各点坐标求平均值,并将所述平均值作为该连通区域所对应的对焦点的坐标。如图4D所示,示出了根据本发明实施例的利用图4A所示的取景图像提取的对焦点。
根据本发明实施例,在连续拍摄图像的情况下,对于每帧图像都要先确定对焦点然后再按照所确定的对焦点进行对焦。在此情况下,可以利用历史对焦点信息对当前预测的对焦点进行平滑操作。
如图3所示,示出了在连续拍摄图像的情况下提取对焦点的示意性流程图。
在步骤S310,在所识别的显著性区域中提取至少一个预测对焦点。作为示例,所识别的显著性区域包括至少一个连通区域,在每个连通区域中提取一个预测对焦点,例如,可以对该连通区域中的各点坐标求平均值,并将所述平均值作为该连通区域所对应的预测对焦点的坐标。
在步骤S320,对于每个预测对焦点,在预定半径的邻域中查找与该预测对焦点对应的历史对焦点,所述历史对焦点为上一次拍摄的对焦点。
在步骤S330,对于每个预测对焦点,利用与该预测对焦点对应的历史对焦点对该预测对焦点进行平滑处理,从而得到与该预测对焦点对应的对焦点。
作为示例,在当前的取景图像中提取了n个预测对焦点q1、q2、…、qn,在最近一次拍摄中采用了m个对焦点p1、p2、…、pm。对于每个预测对焦点qi,在半径为r的邻域中查找与其对应的历史对焦点。如果对于一个预测对焦点在半径为r的邻域中没有找到与其对应的历史对焦点,则将该预测对焦点直接作为对焦点。如果对于一个预测对焦点在半径为r的邻域中查找到与其对应的历史对焦点,则利用该历史对焦点对该预测对焦点进行平滑处理。
例如,对于预测对焦点qi,在半径为r的邻域中查找到与其对应的历史对焦点pj,可以按照以下方式进行平滑处理:qi’=a*qi+(1-a)*pj,其中a为平滑系数,其可以在1到0.7的范围内取值,例如a的具体取值可以为例如0.9、0.8等。
根据本发明实施例,基于神经网络给出的显著性区域进行对焦点选择,不仅可以实现基于人脸检测的对焦点选择,而且还可以实现基于文字检测的对焦点选择、基于物体检测的对焦点选择等等。
图5示出了根据本发明实施例的对焦点确定装置的示意性框图。根据本发明实施例的对焦点确定装置可以在配备有摄像头的便携式智能设备处实现,或者可以在云端实现。
根据本发明实施例的对焦点确定装置500包括图像获取部件510、显著性区域识别部件520以及对焦点提取部件530。
所述图像获取部件510用于获取取景范围的取景图像。所述图像获取部件510可以从便携式智能设备配备的摄像头处获取该取景图像。
所述显著性区域识别部件520用于识别取景图像中的显著性区域。根据本发明实施例,所述显著性区域识别部件520利用机器学习模型识别取景图像中的显著性区域,作为示例,所述显著性区域识别部件520利用神经网络识别取景图像中的显著性区域。
对焦点提取部件530用于在所识别的显著性区域中提取至少一个对焦点。
在所述对焦点确定装置500在便携式智能设备处实现的情况下,在所述便携式智能设备上配备的摄像头采集取景范围的取景图像,所述图像获取部件510获取所述摄像头采集的取景图像,并且所述对焦点提取部件530将所提取的至少一个对焦点反馈给所述摄像头,然后所述摄像头利用所述至少一个对焦点对所述取景范围进行对焦并拍摄图像。
在所述对焦点确定装置500在云端实现的情况下,在所述便携式智能设备上配备的摄像头采集取景范围的取景图像,所述便携式智能设备将所述取景图像传送到在云端实现的所述图像获取部件510,云端将所述对焦点确定装置530提取的至少一个对焦点传送至所述便携式智能设备,然后由便携式智能设备上配备的摄像头按照所述至少一个对焦点进行对焦并拍摄图像。
图6示出了根据本发明实施例的显著性区域识别部件的示意性框图。
所述显著性区域识别部件520包括显著性图片生成部件5210、二值化部件5220以及显著性区域提取部件5230。
所述显著性图片生成部件5210用于利用取景图像生成显著性识别图片,其中,在所述显著性识别图片中,每个像素的灰度值代表该像素的显著性。
根据本发明实施例,所述显著性图片生成部件5210可以利用神经网络计算取景图像的图像域梯度,并且根据所述图像域梯度生成所述显著性识别图片。如图4B所示,示出了所述显著性图片生成部件5210利用图4A所示的取景图像生成的显著性识别图片。
所述二值化部件5220用于将所述显著性识别图片二值化,得到二值化的显著性图片。如图4C所示,示出了二值化的显著性图片。
所述显著性区域提取部件5230用于将所述二值化的显著性图片中的至少一个连通区域作为显著性区域。在如图4C所示的二值化的显著性图片中包括三个连通区域,将这三个连通区域作为如图4A所示的取景图像中的显著性区域。
对于所述二值化的显著性图片中的每个连通区域,对焦点提取部件530提取一个对焦点。作为示例,对于所述二值化的显著性图片中的每个连通区域,对焦点提取部件530对该连通区域中的各点坐标求平均值,并将所述平均值作为该连通区域所对应的对焦点的坐标。如图4D所示,示出了从取景图像中提取的对焦点。
根据本发明实施例,在连续拍摄图像的情况下,对于每帧图像都要先确定对焦点然后再按照所确定的对焦点进行对焦。在此情况下,可以利用历史对焦点信息对当前预测的对焦点进行平滑操作。
如图7所示,示出了根据本发明实施例的对焦点提取部件的示意性框图。
所述对焦点提取部件530包括预测对焦点提取部件5310、历史对焦点查找部件5320、以及平滑处理部件5330。
预测对焦点提取部件5310用于在所识别的显著性区域中提取至少一个预测对焦点。作为示例,所识别的显著性区域包括至少一个连通区域,预测对焦点提取部件5310在每个连通区域中提取一个预测对焦点。所识别的显著性区域可以为在二值化的显著性图片中识别的显著性区域。例如,对于每个连通区域,预测对焦点提取部件5310可以对该连通区域中的各点坐标求平均值,并将所述平均值作为该连通区域所对应的预测对焦点的坐标。
历史对焦点查找部件5320用于对于每个预测对焦点,在以该预测对焦点为中心的预定半径的邻域中查找与该预测对焦点对应的历史对焦点,所述历史对焦点为上一次拍摄的对焦点。
对于每个预测对焦点,在查找到与该预测对焦点对应的历史对焦点的情况下,平滑处理部件5330利用与该预测对焦点对应的历史对焦点对该预测对焦点进行平滑处理,从而得到与该预测对焦点对应的对焦点。
作为示例,在当前的取景图像中提取了n个预测对焦点q1、q2、…、qn,在最近一次拍摄中采用了m个对焦点p1、p2、…、pm。对于每个预测对焦点qi,在半径为r的邻域中查找与其对应的历史对焦点。如果对于一个预测对焦点在半径为r的邻域中没有找到与其对应的历史对焦点,则将该预测对焦点直接作为对焦点。如果对于一个预测对焦点在半径为r的邻域中查找到与其对应的历史对焦点,则利用该历史对焦点对该预测对焦点进行平滑处理。
例如,对于预测对焦点qi,在半径为r的邻域中查找到与其对应的历史对焦点pj,可以按照以下方式进行平滑处理:qi’=a*qi+(1-a)*pj,其中a为平滑系数,其可以在1到0.7的范围内取值,例如a的具体取值可以为例如0.9、0.8等。
根据本发明实施例,基于神经网络给出的显著性区域进行对焦点选择,不仅可以实现基于人脸检测的对焦点选择,而且还可以实现基于文字检测的对焦点选择、基于物体检测的对焦点选择等等。
如图8所示,示出了根据本发明实施例的电子设备800的示意性框图。
电子设备800包括一个或多个处理器802、一个或多个存储装置804、输入装置806、输出装置808、摄像头810,这些组件通过总线***812和/或其它形式的连接机构(未示出)互连。应当注意,图8所示的便携式智能设备800的组件和结构只是示例性的,而非限制性的,根据需要,所述电子设备也可以具有其他组件和结构。
所述处理器802可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其它形式的处理单元,并且可以控制所述电子设备100中的其它组件以执行期望的功能。
所述存储装置804可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器802可以运行所述程序指令,以实现上文所述的本发明实施例中(由处理器实现)的对焦点确定功能以及/或者其它期望的功能。在所述计算机可读存储介质中还可以存储各种应用程序和各种数据,例如所述应用程序使用和/或产生的各种数据等。
所述输入装置806可以是用户用来输入指令的装置,并且可以包括键盘、鼠标、麦克风和触摸屏等中的一个或多个。
所述输出装置808可以向外部(例如用户)输出各种信息(例如图像或声音),并且可以包括显示器、扬声器等中的一个或多个。
所述摄像头810可以拍摄图像,并且将所拍摄的图像存储在所述存储装置804中以供其它组件使用。
根据本发明实施例,用户通过输入装置806向摄像头810发出要拍摄的指令,然后由所述摄像头810采集取景范围的取景图像。
根据本发明实施例,通过处理器802运行在存储器804中存储的程序指令来执行根据本发明实施例的对焦点确定方法100,并且实现根据本发明实施例的对焦点确定装置500。
根据本发明实施例,在每次拍摄过程中确定了对焦点之后,都将所确定的对焦点存储在所述存储装置804中,以供在下次拍摄中对焦点平滑处理使用,即,对于下次拍摄提供该下次拍摄的上一次拍摄的历史对焦点信息。
所述电子设备800可以为照相机,或者可以为配备有摄像头的便携式智能设备,例如智能手机、平板电脑、笔记本电脑等。
此外,根据本发明实施例,还提供了一种云端设备,该云端设备包括一个或多个处理器以及一个或多个存储装置,在所述存储装置中存储了程序指令,在所述程序指令被所述处理器运行时用于执行本发明实施例的对焦点确定方法的相应步骤,并且用于实现根据本发明实施例的对焦点确定装置中的相应模块。
此外,根据本发明实施例,还提供了一种存储介质,在所述存储介质上存储了程序指令,在所述程序指令被计算机或处理器运行时用于执行本发明实施例的对焦点确定方法的相应步骤,并且用于实现根据本发明实施例的对焦点确定装置中的相应模块。所述存储介质例如可以包括智能电话的存储卡、平板电脑的存储部件、个人计算机的硬盘、只读存储器(ROM)、可擦除可编程只读存储器(EPROM)、便携式紧致盘只读存储器(CD-ROM)、USB存储器、或者上述存储介质的任意组合。
根据本发明实施例的对焦点确定方法及装置、电子设备以及存储介质,通过识别取景图像中的显著性区域以及在所识别的显著性区域中提取至少一个对焦点,相对于传统的事先人为指定对焦点的方法,可以在一定程度上保证所选择的对焦点的准确性,从而保证对焦的准确性。并且,可以通过利用神经网络自动确定对焦点,避免了繁琐的对焦点选择或切换操作,有利于用户进行抓拍等操作,并且可以避免由于用户误操作造成的对焦错误。
尽管这里已经参考附图描述了示例实施例,应理解上述示例实施例仅仅是示例性的,并且不意图将本发明的范围限制于此。本领域普通技术人员可以在其中进行各种改变和修改,而不偏离本发明的范围和精神。所有这些改变和修改意在被包括在所附权利要求所要求的本发明的范围之内。
Claims (20)
1.一种对焦点确定方法,包括:
获取取景范围的取景图像;
识别取景图像中的显著性区域;以及
在所识别的显著性区域中提取至少一个对焦点。
2.如权利要求1所述的对焦点确定方法,其中,利用神经网络识别取景图像中的显著性区域。
3.如权利要求1所述的对焦点确定方法,其中,识别取景图像中显著性区域包括:
利用取景图像生成显著性识别图片,其中,在所述显著性识别图片中,每个像素的灰度值代表该像素的显著性;
将所述显著性识别图片二值化,得到二值化的显著性图片;以及
将所述二值化的显著性图片中的至少一个连通区域作为显著性区域。
4.如权利要求3所述的对焦点确定方法,其中,利用取景图像生成显著性识别图片包括:
利用神经网络计算取景图像的图像域梯度;以及
根据所述图像域梯度,生成所述显著性识别图片。
5.如权利要求3所述的对焦点确定方法,其中,在所识别的显著性区域中提取至少一个对焦点包括:
对于所述二值化的显著性图片中的每个连通区域,提取一个对焦点。
6.如权利要求5所述的对焦点确定方法,其中,对于所述二值化的显著性图片中的每个连通区域,对该连通区域中的各点坐标求平均值,并将所述平均值作为该连通区域所对应的对焦点的坐标。
7.如权利要求1所述的对焦点确定方法,其中,在所识别的显著性区域中提取至少一个对焦点包括:
在所识别的显著性区域中提取至少一个预测对焦点;
对于每个预测对焦点,在以该预测对焦点为中心的预定半径的邻域中查找与该预测对焦点对应的历史对焦点,所述历史对焦点为上一次拍摄的对焦点;
对于每个预测对焦点,在查找到与该预测对焦点对应的历史对焦点的情况下,利用与该预测对焦点对应的历史对焦点对该预测对焦点进行平滑处理,从而得到与该预测对焦点对应的对焦点。
8.如权利要求7所述的对焦点确定方法,其中,在所识别的显著性区域中提取至少一个预测对焦点包括:
对于所述二值化的显著性图片中的每个连通区域,提取一个预测对焦点。
9.如权利要求8所述的对焦点确定方法,其中,对于所述二值化的显著性图片中的每个连通区域,对该连通区域中的各点坐标求平均值,并将所述平均值作为该连通区域所对应的预测对焦点的坐标。
10.如权利要求1至9所述的对焦点确定方法,其中,利用所提取的对焦点对所述取景范围进行对焦并拍摄图像。
11.一种对焦点确定装置,包括:
图像获取部件,用于获取取景范围的取景图像;
显著性区域识别部件,用于识别取景图像中的显著性区域;以及
对焦点提取部件,用于在所识别的显著性区域中提取至少一个对焦点。
12.如权利要求11所述的对焦点确定装置,其中,所述显著性区域识别部件利用神经网络识别取景图像中的显著性区域。
13.如权利要求11所述的对焦点确定装置,其中,所述显著性区域识别部件包括:
显著性图片生成部件,用于利用取景图像生成显著性识别图片,其中,在所述显著性识别图片中,每个像素的灰度值代表该像素的显著性;
二值化部件,用于将所述显著性识别图片二值化,得到二值化的显著性图片;以及
显著性区域提取部件,用于将所述二值化的显著性图片中的至少一个连通区域作为显著性区域。
14.如权利要求13所述的对焦点确定装置,其中,所述显著性图片生成部件利用神经网络计算取景图像的图像域梯度,并且根据所述图像域梯度生成所述显著性识别图片。
15.如权利要求13所述的对焦点确定装置,其中,对于所述二值化的显著性图片中的每个连通区域,所述对焦点提取部件提取一个对焦点。
16.如权利要求15所述的对焦点确定装置,其中,对于所述二值化的显著性图片中的每个连通区域,所述对焦点提取部件对该连通区域中的各点坐标求平均值,并将所述平均值作为该连通区域所对应的对焦点的坐标。
17.如权利要求11所述的对焦点确定装置,其中,所述对焦点提取部件包括:
预测对焦点提取部件,用于在所识别的显著性区域中提取至少一个预测对焦点;
历史对焦点查找部件,用于对于每个预测对焦点,在以该预测对焦点为中心的预定半径的邻域中查找与该预测对焦点对应的历史对焦点,所述历史对焦点为上一次拍摄的对焦点;以及
平滑处理部件,用于对于每个预测对焦点,在查找到与该预测对焦点对应的历史对焦点的情况下,利用与该预测对焦点对应的历史对焦点对该预测对焦点进行平滑处理,从而得到与该预测对焦点对应的对焦点。
18.如权利要求17所述的对焦点确定装置,其中,对于所述二值化的显著性图片中的每个连通区域,所述预测对焦点提取部件提取一个预测对焦点。
19.如权利要求18所述的对焦点确定装置,其中,对于所述二值化的显著性图片中的每个连通区域,所述预测对焦点提取部件对该连通区域中的各点坐标求平均值,并将所述平均值作为该连通区域所对应的预测对焦点的坐标。
20.如权利要求11所述的对焦点确定装置,其中,利用所提取的对焦点对所述取景范围进行对焦并拍摄图像。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610493585.4A CN106101540B (zh) | 2016-06-28 | 2016-06-28 | 对焦点确定方法及装置 |
US15/443,666 US10291838B2 (en) | 2016-06-28 | 2017-02-27 | Focusing point determining method and apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610493585.4A CN106101540B (zh) | 2016-06-28 | 2016-06-28 | 对焦点确定方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106101540A true CN106101540A (zh) | 2016-11-09 |
CN106101540B CN106101540B (zh) | 2019-08-06 |
Family
ID=57213743
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610493585.4A Active CN106101540B (zh) | 2016-06-28 | 2016-06-28 | 对焦点确定方法及装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US10291838B2 (zh) |
CN (1) | CN106101540B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109639976A (zh) * | 2018-12-24 | 2019-04-16 | 北京百度网讯科技有限公司 | 焦点确定方法和装置 |
CN109698901A (zh) * | 2017-10-23 | 2019-04-30 | 广东顺德工业设计研究院(广东顺德创新设计研究院) | 自动对焦方法、装置、存储介质和计算机设备 |
CN109712164A (zh) * | 2019-01-17 | 2019-05-03 | 上海携程国际旅行社有限公司 | 图像智能剪裁方法、***、设备及存储介质 |
CN110312069A (zh) * | 2018-03-20 | 2019-10-08 | 青岛海信移动通信技术股份有限公司 | 拍摄过程中的对焦方法及装置 |
WO2021057652A1 (zh) * | 2019-09-29 | 2021-04-01 | Oppo广东移动通信有限公司 | 对焦方法和装置、电子设备、计算机可读存储介质 |
CN113448428A (zh) * | 2020-03-24 | 2021-09-28 | 中移(成都)信息通信科技有限公司 | 一种视线焦点的预测方法、装置、设备及计算机存储介质 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110298380A (zh) * | 2019-05-22 | 2019-10-01 | 北京达佳互联信息技术有限公司 | 图像处理方法、装置及电子设备 |
US11961598B1 (en) | 2020-06-26 | 2024-04-16 | Express Scripts Strategic Development, Inc. | Machine learning systems for error detection in data processing systems and related methods |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101071252A (zh) * | 2006-05-10 | 2007-11-14 | 佳能株式会社 | 焦点调节方法、焦点调节设备及其控制方法 |
JP2009239754A (ja) * | 2008-03-27 | 2009-10-15 | Sanyo Electric Co Ltd | 画像処理装置、画像処理プログラム、画像処理システム及び画像処理方法 |
CN103955718A (zh) * | 2014-05-15 | 2014-07-30 | 厦门美图之家科技有限公司 | 一种图像主体对象的识别方法 |
CN105574813A (zh) * | 2015-12-31 | 2016-05-11 | 青岛海信移动通信技术股份有限公司 | 一种图像处理方法和装置 |
CN105657240A (zh) * | 2015-06-29 | 2016-06-08 | 宇龙计算机通信科技(深圳)有限公司 | 一种拍照方法及装置 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6266442B1 (en) * | 1998-10-23 | 2001-07-24 | Facet Technology Corp. | Method and apparatus for identifying objects depicted in a videostream |
US8553037B2 (en) * | 2002-08-14 | 2013-10-08 | Shawn Smith | Do-It-Yourself photo realistic talking head creation system and method |
JP4581924B2 (ja) * | 2004-09-29 | 2010-11-17 | 株式会社ニコン | 画像再生装置、および画像再生プログラム |
JP4463792B2 (ja) * | 2006-09-29 | 2010-05-19 | 富士フイルム株式会社 | 撮影装置 |
US7634187B2 (en) * | 2007-01-04 | 2009-12-15 | Qualcomm Incorporated | Dynamic auto-focus window selection that compensates for hand jitter |
JP5374065B2 (ja) * | 2008-04-07 | 2013-12-25 | キヤノン株式会社 | 撮像装置及びその制御方法 |
JP5368723B2 (ja) * | 2008-04-09 | 2013-12-18 | キヤノン株式会社 | 撮像装置及びその制御方法 |
US9131141B2 (en) * | 2008-05-12 | 2015-09-08 | Sri International | Image sensor with integrated region of interest calculation for iris capture, autofocus, and gain control |
US8036425B2 (en) * | 2008-06-26 | 2011-10-11 | Billy Hou | Neural network-controlled automatic tracking and recognizing system and method |
WO2015060897A1 (en) * | 2013-10-22 | 2015-04-30 | Eyenuk, Inc. | Systems and methods for automated analysis of retinal images |
-
2016
- 2016-06-28 CN CN201610493585.4A patent/CN106101540B/zh active Active
-
2017
- 2017-02-27 US US15/443,666 patent/US10291838B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101071252A (zh) * | 2006-05-10 | 2007-11-14 | 佳能株式会社 | 焦点调节方法、焦点调节设备及其控制方法 |
JP2009239754A (ja) * | 2008-03-27 | 2009-10-15 | Sanyo Electric Co Ltd | 画像処理装置、画像処理プログラム、画像処理システム及び画像処理方法 |
CN103955718A (zh) * | 2014-05-15 | 2014-07-30 | 厦门美图之家科技有限公司 | 一种图像主体对象的识别方法 |
CN105657240A (zh) * | 2015-06-29 | 2016-06-08 | 宇龙计算机通信科技(深圳)有限公司 | 一种拍照方法及装置 |
CN105574813A (zh) * | 2015-12-31 | 2016-05-11 | 青岛海信移动通信技术股份有限公司 | 一种图像处理方法和装置 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109698901A (zh) * | 2017-10-23 | 2019-04-30 | 广东顺德工业设计研究院(广东顺德创新设计研究院) | 自动对焦方法、装置、存储介质和计算机设备 |
CN109698901B (zh) * | 2017-10-23 | 2020-07-10 | 广东顺德工业设计研究院(广东顺德创新设计研究院) | 自动对焦方法、装置、存储介质和计算机设备 |
CN110312069A (zh) * | 2018-03-20 | 2019-10-08 | 青岛海信移动通信技术股份有限公司 | 拍摄过程中的对焦方法及装置 |
CN109639976A (zh) * | 2018-12-24 | 2019-04-16 | 北京百度网讯科技有限公司 | 焦点确定方法和装置 |
CN109712164A (zh) * | 2019-01-17 | 2019-05-03 | 上海携程国际旅行社有限公司 | 图像智能剪裁方法、***、设备及存储介质 |
WO2021057652A1 (zh) * | 2019-09-29 | 2021-04-01 | Oppo广东移动通信有限公司 | 对焦方法和装置、电子设备、计算机可读存储介质 |
CN113448428A (zh) * | 2020-03-24 | 2021-09-28 | 中移(成都)信息通信科技有限公司 | 一种视线焦点的预测方法、装置、设备及计算机存储介质 |
CN113448428B (zh) * | 2020-03-24 | 2023-04-25 | 中移(成都)信息通信科技有限公司 | 一种视线焦点的预测方法、装置、设备及计算机存储介质 |
Also Published As
Publication number | Publication date |
---|---|
US10291838B2 (en) | 2019-05-14 |
CN106101540B (zh) | 2019-08-06 |
US20170374268A1 (en) | 2017-12-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106101540A (zh) | 对焦点确定方法及装置 | |
CN107087107B (zh) | 基于双摄像头的图像处理装置及方法 | |
JP6730690B2 (ja) | シーン内に存在する不要なオブジェクトの除去に基づくシーンの画像の動的生成 | |
CN107787463B (zh) | 优化对焦堆栈的捕获 | |
CN105578026B (zh) | 一种拍摄方法及用户终端 | |
US9665962B2 (en) | Image distractor detection and processng | |
CN106134176B (zh) | 用于多焦点成像的***和方法 | |
CN105847674A (zh) | 一种基于移动终端的预览图像处理方法及移动终端 | |
CN110378165A (zh) | 二维码识别方法、二维码定位识别模型建立方法及其装置 | |
CN107194323A (zh) | 车辆定损图像获取方法、装置、服务器和终端设备 | |
CN105933589A (zh) | 一种图像处理方法及终端 | |
CN102096805B (zh) | 注册用于脸部识别的多个脸部图像的装置和方法 | |
US9477138B2 (en) | Autofocus | |
CN105933607A (zh) | 一种移动终端的拍照效果调整方法及移动终端 | |
CN103973978A (zh) | 一种实现重对焦的方法和电子设备 | |
CN104917967A (zh) | 一种拍照方法及终端 | |
CN110278382A (zh) | 一种聚焦方法、装置、电子设备及存储介质 | |
CN103188434A (zh) | 一种图像采集方法和设备 | |
CN110290324A (zh) | 设备成像方法、装置、存储介质及电子设备 | |
CN106303234A (zh) | 拍照处理方法及装置 | |
CN109068118B (zh) | 双摄模组的基线距离调整方法、装置及双摄模组 | |
CN108156384A (zh) | 图像处理方法、装置、电子设备及介质 | |
CN106412435B (zh) | 对焦方法、装置及移动终端 | |
US9451155B2 (en) | Depth-segmenting peak tracking autofocus | |
CN114390201A (zh) | 对焦方法及其装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: 100190 room 313, block A, 2 South Road, Haidian District Academy of Sciences, Beijing, China Applicant after: MEGVII INC. Applicant after: Beijing maigewei Technology Co., Ltd. Address before: 100080 room A, block, No. 2 South Road, Haidian District Academy of Sciences, Beijing, China Applicant before: MEGVII INC. Applicant before: Beijing aperture Science and Technology Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |