CN115567778A - 自动对焦方法、装置、电子设备及存储介质 - Google Patents
自动对焦方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN115567778A CN115567778A CN202110742860.2A CN202110742860A CN115567778A CN 115567778 A CN115567778 A CN 115567778A CN 202110742860 A CN202110742860 A CN 202110742860A CN 115567778 A CN115567778 A CN 115567778A
- Authority
- CN
- China
- Prior art keywords
- sample image
- lens
- definition
- focusing
- preset
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Automatic Focus Adjustment (AREA)
Abstract
本申请实施例涉及自动对焦技术领域,提供了一种自动对焦方法、装置、电子设备及存储介质,所述方法包括:按照第一预设步长在预设对焦范围内多次移动镜头,获取每次移动镜头后采集的第一样本图像;计算每一第一样本图像的清晰度,得到清晰度最大的第一样本图像对应的镜头所处的初始对焦位置;以初始对焦位置为起始点、并以第二预设步长在起始点的预设范围内多次移动镜头,得到每次移动镜头后的第二样本图像,直至满足预设条件停止移动所述镜头,最终得到多张第二样本图像;将清晰度最大的第二样本图像对应的镜头所处的位置确定为最终对焦位置。本申请实施例能够可以又快又准确地实现对焦。
Description
技术领域
本申请涉及自动对焦技术领域,具体而言,涉及一种自动对焦方法、装置、电子设备及存储介质。
背景技术
自动对焦技术是计算机视觉和各类成像***的关键技术之一,在照相机、摄像机、显微镜、内窥镜等成像***中有着广泛的用途。
近年来,智能家居的迅猛发展,摄像头在智能家居中应用也越来越多,例如,对于带摄像头的智能门锁,当有人走进智能门锁时,需要自动对焦。
现有的自动对焦技术无法兼顾对焦准确性和对焦效率。
发明内容
本申请实施例提供一种自动对焦方法、装置、电子设备及存储介质,以解决对焦准确性和对焦效率无法兼顾的问题。
第一方面,本申请实施例提供了一种自动对焦方法,所述方法包括:按照第一预设步长在预设对焦范围内多次移动镜头,获取每次移动镜头后采集的第一样本图像;计算每一所述第一样本图像的清晰度,得到清晰度最大的所述第一样本图像对应的所述镜头所处的初始对焦位置;以所述初始对焦位置为起始点、并以第二预设步长在所述起始点的预设范围内多次移动所述镜头,得到每次移动所述镜头后的第二样本图像,直至满足预设条件停止移动所述镜头,最终得到多张所述第二样本图像;将清晰度最大的所述第二样本图像对应的所述镜头所处的位置确定为最终对焦位置。
第二方面,本申请实施例提供了一种自动对焦装置,所述装置包括:获取模块,用于按照第一预设步长在预设对焦范围内多次移动镜头,获取每次移动镜头后采集的第一样本图像;计算模块,用于计算每一所述第一样本图像的清晰度,得到清晰度最大的所述第一样本图像对应的所述镜头所处的初始对焦位置;对焦模块,用于以所述初始对焦位置为起始点、并以第二预设步长在所述起始点的预设范围内多次移动所述镜头,得到每次移动所述镜头后的第二样本图像,直至满足预设条件停止移动所述镜头,最终得到多张所述第二样本图像,其中,所述第二预设步长小于所述第一预设步长;对焦模块,还用于将清晰度最大的所述第二样本图像对应的所述镜头所处的位置确定为最终对焦位置。
第三方面,本申请实施例提供一种电子设备,所述电子设备包括镜头、处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如上述的自动对焦方法的步骤。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如上述的自动对焦方法的步骤。
在本申请实施例中,通过首先采用第一预设步长,快速确定初始对焦位置,在确定初始对焦位置后,再采用第二预设步长在初始对焦位置的预设范围内进行精细对焦,最终能够可以又快又准确地实现对焦。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了一种适用于本申请实施例的应用环境示意图。
图2示出了另一种适用于本申请实施例的应用环境示意图。
图3示出了单峰场景下爬山搜索过程中调焦镜头位置和调焦评价函数值之间的变化关系的示例图。
图4示出了双峰场景下爬山搜索过程中调焦镜头位置和调焦评价函数值之间的变化关系的示例图。
图5示出本申请实施例提供的一种自动对焦方法的流程图。
图6示出了利用自动对焦方法时调焦镜头位置和调焦评价函数值之间的变化关系的示例图。
图7示出本申请实施例提供的另一种自动对焦方法的流程图。
图8示出本申请实施例提供的另一种自动对焦方法的流程图。
图9示出本申请实施例提供的自动对焦方法的处理流程示例图。
图10示出本申请实施例提供的自动对焦装置的方框示例图。
图11示出本申请实施例提供的电子设备的硬件结构框图。
图标:10-智能家居***;100-网关设备;200-家居设备;200a-门窗传感器;200b-智能开关;200c-灯泡;200d-智能门锁;200e-智能空调;300-服务器;400-终端设备;500-路由器;1100-电子设备;1110-处理器;1120-存储介质;1121-操作***;1122-数据;1123-应用程序;1130-存储器;1140-输入输出接口;1150-有线或无线网络接口;2100-自动对焦装置;2101-获取模块;2102-计算模块;2103-对焦模块。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
在本申请的描述中,需要说明的是,若出现术语“上”、“下”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,或者是该发明产品使用时惯常摆放的方位或位置关系,仅是为了便于描述本申请和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本申请的限制。
此外,若出现术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
需要说明的是,在不冲突的情况下,本申请的实施例中的特征可以相互结合。
下面将对本申请所涉及的一种应用环境进行介绍。
请参阅图1,图1为适用于本申请实施例的一种应用环境示意图。其中,图1提供了一种智能家居***10,该智能家居***10包括网关设备100、与网关设备100连接的家居设备200以及与网关设备100连接的服务器300。其中,网关设备100的数量可以为至少一个,家居设备200的数量可以为至少一个。另外,网关设备100的数量为多个时,不同网关设备100之间也可以进行通信连接。
在本申请实施例中,网关设备100可以为智能家居控制的智能网关,可以实现***信息的采集、信息输入、信息输出、集中控制、远程控制、联动控制等功能。网关设备可以负责具体的安防报警,家电控制,用电信息采集。网关设备100还可以通过无线方式与智能交互终端等产品进行信息交互。网关设备100还具备有无线路由功能,优良的无线性能,网络安全和覆盖面积。
在本申请实施例中,家居设备200可以包括设置于室内空间中的多种智能家电设备、传感设备以及检测设备等,例如智能电视、智能冰箱、智能空调、温湿度传感器、压力传感器、烟雾传感器、人体传感器、门窗传感器、智能开关、插座、电灯、红外发射装置、摄像头装置等。与网关设备100连接的家居设备200,可以与网关设备100之间进行信息以及指令的交互。网关设备100与家居设备200可以通过蓝牙、WiFi(Wireless-Fidelity,无线保真)、ZigBee(紫峰技术)等通信方式连接,当然,网关设备100与家居设备200连接方式在本申请实施例中可以不作为限定。
在本申请实施例中,服务器300可以是本地服务器、云服务器等服务器,具体的服务器类型在本申请实施例中可以不作为限定。与网关设备100连接的服务器300,可以通过无线方式与网关设备100之间进行信息的交互。设置于不同的室内空间的网关设备100都可以通过网络与同一个服务器300进行通信连接,以进行服务器300和网关设备100之间的信息交互。
进一步地,上述智能家居***10还可以包括终端设备400。其中,终端设备400可以包括个人电脑(personal computer,PC)、平板电脑、智能手机、个人数字助理(personaldigital assistant,PDA)等,在此不做限定。终端设备400可以通过2G/3G/4G/5G/WiFi等无线方式与服务器300之间进行信息的交互。当然,终端设备400与服务器300之间的连接方式在本申请实施例中可以不作为限定。在一些实施方式中,该终端设备400也可用于与用户之间进行交互,方便用户通过终端设备400可以基于路由器500与网关设备100进行无线通信。另外,用户可以在网关设备100和终端设备400同时添加一个账号信息,通过该账号信息实现网关设备100和终端设备400的信息同步。
在一些实施例中,用户可以通过终端设备400的应用程序(Application,APP)设置不同的触发场景或者自动化联动。作为一种方式,终端设备400可以将场景配置信息或者自动化方案上传至服务器300,以在达到该触发场景或者自动化的触发条件时,服务器300可根据存储的场景配置信息或者自动化方案,找到与该场景配置信息或者自动化方案中的执行动作对应的设备,以通知该设备进行执行动作以满足触发场景或自动化的执行结果。作为另一种方式,服务器300也可以将场景配置信息或者自动化方案发送给网关设备100,由网关设备100根据存储的场景配置信息或者自动化方案,找到与该场景配置信息或者自动化方案中的执行动作对应的设备。同时,网关设备100可以将设备的执行情况反馈回服务器300。
例如,请参阅图2,作为一种实施方式,用户通过终端设备400的APP设置的自动化方案为“门窗打开自动开灯”时,该自动化方案的触发条件为“门窗打开”,执行动作为“智能开关控制灯泡开灯”。此时基于此自动化方案,触发设备为门窗传感器200a,执行设备为与灯泡200c连接的智能开关200b。其中,自动化方案可以存储于网关设备100,也可以存储于服务器300,执行自动化联动的路径可以通过局域网,也可以通过广域网。
若通过局域网路径,在网关设备100本地进行自动化执行,则门窗传感器200a感应到门窗打开,将门窗打开的信息事件上报给网关设备100,网关设备100接收到该信息事件后,可根据存储的自动化方案,找到与该自动化方案中的执行动作对应的设备,在本例中为智能开关200b,并通知智能开关200b控制开灯,从而实现门窗打开自动开灯的自动化联动。
若通过广域网路径,在服务器300进行自动化执行,则门窗传感器200a感应到门窗打开,将门窗打开的信息事件上报给网关设备100,网关设备100接收到该事件后,将该事件上报给服务器300,服务器300根据存储的自动化方案,找到与该自动化方案中的执行动作对应的设备,在本例中为智能开关200b,并通过网关设备100通知智能开关200b控制开灯,从而实现门窗打开自动开灯的自动化联动。
进一步地,开灯后,可以将成功开灯的执行结果反馈给网关设备100,网关设备100接收到该信息后,可以将当前时间、自动化方案的标识符(ID,Identity document)以及该自动化方案的执行结果上报服务器300,由服务器300进行存储。其中,ID可以是唯一标识自动化方案的符号,可以是数字、文字等,在此不作限定。
作为另一种实施方式,终端设备400包括摄像头(或者称镜头),用户通过终端设备400的摄像头输入人脸图像,并进行人脸识别,以达到控制门窗传感器200a或者智能开关200b的目的,作为再一种实施方式,家居设备200还可以包括带摄像头的智能门锁200d,智能门锁200d和网关设备100通信连接,通过智能门锁200d输入人脸图像或者进行人脸识别,人脸识别通过后打开门锁,作为再一种实施方式,家居设备200还可以包括带摄像头的智能空调200e,智能空调200e和网关设备100通信连接,通过智能空调200e获取室内的用户的图像并通过服务器300对该图像进行识别,根据识别结果做出判断,若判定用户在睡眠过程中踢开了被子,则适当地调节智能空调200e的风速或者温度。
在通过终端设备400或者智能门锁200d输入人脸图像时,需要首先进行对焦,对焦成功后才可以得到清晰的人脸图像,进而对人脸图像进行识别。
现有的对焦技术是调节镜头和电荷耦合元件CCD(charge coupled device,CCD)之间的距离,使得像平面落在CCD的成像表面。从基本原理来说,自动对焦技术可以分成两大类:一类是基于镜头与被拍摄目标之间距离测量的测距自动对焦,另一类是基于对焦屏上成像清晰的聚焦检测自动对焦。对于后者,为了在对焦过程中快速地找到满足清晰度要求的对焦位置,通常采用的搜索方式包括穷举搜索和爬山搜索。
对于穷举搜索而言,在整个对焦过程中以一定的步长控制镜头移动,根据清晰度寻找最清晰的对焦位置,该方法的优点是,不容易陷入局部最优点,能够很好的找到最优解,但因为要走完对焦路程上的所有的点,因此计算量较大,耗费时间。
对于爬山搜索而言,模拟爬山的过程,随机选择一个位置爬山,每次朝着更高的方向移动,直到到达山顶,即每次都在临近的空间中选择最优解作为当前解,直到局部最优解。这种算法会陷入局部最优解,能否得到全局最优解取决于初始点的位置。初始点若选择在全局最优解附近,则就可能得到全局最优解。爬山算法是一种局部择优的方法,采用启发式方法,是对深度优先搜索的一种改进,它利用反馈信息帮助生成解的决策。该方法的优点是,避免遍历,通过启发选择部分节点,从而达到提高效率的目的。该方法的缺点是因为不是全面搜索,所以结果可能不是全局最佳。
为了更形象地说明爬山搜索的过程,请参照图3,图3示出了单峰场景下爬山搜索过程中调焦镜头位置和调焦评价函数值(即清晰度)之间的变化关系的示例图,在图3中,调焦镜头位置从最左的位置开始,在达到B点之前,由于清晰度的值一直逐渐增大,则镜头一直向右移动,越过B点后,清晰度的值则一直减小,减小到一定程度后,则改变镜头的移动方向,开始向左移动,最终得到B点为最终对焦位置,即图像清晰度最高的镜头位置。
请参照图4,图4示出了双峰场景下爬山搜索过程中调焦镜头位置和调焦评价函数值之间的变化关系的示例图,在图4中,将A点作为爬山搜索的起始位置,逐渐地向右移动镜头位置,到达B点,B点的清晰度高于A点,因此,继续向右调整镜头位置进行搜索,到达C点,发现C点的清晰度小于B点,则改变调整方向,向左调整镜头位置,到达D点,D点的清晰度高于C点,则继续向右调整镜头位置,直至最终达到P1点,P1点对应的镜头位置则为最终对焦位置,由图4可以看出,事实上,P1点并不是最佳的最终对焦位置,P点才是最佳的最终对焦位置,由于爬山搜索算法的局限性,导致了最终得到的P1是一个局部最优解,而非全局最优解。
需要说明的是,针对双峰或者多峰场景下也可以采用穷举搜索法,在对焦精度要求较高的情况下,穷举搜索的计算量会很大,在双峰或者多峰场景下,计算量更会激增,若要减小计算量,势必会影响对焦精度。
针对上述两种方式的优劣点,本申请实施例采取了一种将两者进行结合的方式,既可以同时利用两者的优点,又可以一定程度弱化两者的缺点,通过采用第一预设步长,粗粒度地确定一个较佳点,避免了穷举搜索存在的计算量大的缺点,再以该较佳点作为爬山算法的起始点采用第二预设步长进行搜索,以避免陷入局部最优解,最终能够既准确又快速对焦,实现了准确性和对焦效率的兼顾,下面将对其进行详细描述。
请参考图5,图5示出本申请实施例提供的一种自动对焦方法的流程图,该方法包括以下步骤:
步骤S100,按照第一预设步长在预设对焦范围内多次移动镜头,获取每次移动镜头后采集的第一样本图像。
在本实施例中,预设对焦范围为镜头对焦时可以调节的焦距的范围,随着镜头的移动,不断地调节焦距,可以得到不同焦距下在对焦窗口内清晰度不同的第一样本图像。
在本实施例中,对焦窗口可以根据需要确定,例如,对焦窗口可以是拍摄图像的中心50*50的区域,或者在拍摄图像右下角60*60的区域,对焦窗口可以为一个,也可以为多个,例如,将拍摄图像的中50*50的区域和拍摄图像右下角60*60的区域同时作为对焦窗口。
在本实施例中,作为一种具体实施方式,可以从焦距最小的镜头位置开始,按照第一预设步长多次移动镜头,直至到达焦距最大的镜头位置。作为另一种具体实施方式,也可以从焦距最大的镜头位置开始,直至到达焦距最小的镜头位置。为了避免穷举导致的数据量大,此处第一预设步长可以根据实际需要进行设置,例如,将第一预设步长设置的稍大,以减少数据量,此处只需要粗粒度地找到一个距离最佳对焦位置比较近的位置。
步骤S110,计算每一第一样本图像的清晰度,得到清晰度最大的第一样本图像对应的镜头所处的初始对焦位置。
在本实施例中,第一样本图像的清晰度是衡量第一样本图像质量优劣的重要指标,可以通过各种函数计算图像的清晰度,以对图像的清晰度进行评价,计算图像的清晰度的函数可以采用、但不限于梯度函数、灰度方差函数、熵函数等。
在本实施例中,初始对焦位置是按照第一预设步长移动镜头后确定的清晰度最大的第一样本图像对应的镜头的位置,因此,初始对焦位置只是一个距离最终对焦位置比较接近的粗略位置。也就是说,最终对焦位置必然在初始对焦位置附近。
步骤S120,以初始对焦位置为起始点、并以第二预设步长在起始点的预设范围内多次移动镜头,得到每次移动镜头后的第二样本图像,直至满足预设条件停止移动镜头,最终得到多张第二样本图像。
在本实施例中,由于最终对焦位置在初始对焦位置附近,作为一种较优的实现方式,以初始对焦位置为起始点,在其附近预设范围内、采用比第一预设步长更细的粒度(即第二预设步长小于第一预设步长)多次移动镜头,最终可以得到满足要求的最终对焦位置。
在一种实施例中,预设条件可以是用户根据实际需要预先确定的移动镜头的次数,正常情况下,移动镜头的次数越多,则最终对焦位置越理想,同时,其对焦的效率也会下降,用户可以根据实际需要,设置可以达到预期、在接受范围内的预设条件。在另一种实施例中,预设条件也可以是第二样本图像中清晰度最大值满足预设范围,或者达到预设值等。
步骤S130,将清晰度最大的第二样本图像对应的镜头所处的位置确定为最终对焦位置。
在本实施例中,第二样本图像的清晰度的计算方式可以和第一样本图像的清晰度的计算方式相同或者不同。
本申请实施例提供的上述方法,通过首先采用第一预设步长,快速确定初始对焦位置,缩小了精细对焦的范围,再采用第二预设步长在初始对焦位置的预设范围内进行精细对焦,最终能够可以又快又准确地实现对焦。
为了便于和现有技术做对比,本发明实施例还提供了利用自动对焦方法时调焦镜头位置和调焦评价函数值之间的变化关系的示例图,请参照图6,图6示出了利用自动对焦方法时调焦镜头位置和调焦评价函数值之间的变化关系的示例图。
在本实施例中,若第一样本图像存在噪点,尤其是噪点的梯度很大时,只通过梯度计算图像清晰度,通常会将梯度很大的噪点判断为梯度很大的边缘,降低了图像清晰度的判断的准确性。为了更准确的判断图像清晰度,在图5的基础上,本申请实施例还提供了一种计算第一样本图像的清晰度的实现方式,请参照图7,图7示出本申请实施例提供的另一种自动对焦方法的流程图,步骤S110包括以下子步骤:
子步骤S1101,计算每一第一样本图像中每一个像素点的梯度值。
在本实施例中,第一样本图像包括多个像素点,对于任意一张第一样本图像,作为一种具体实施方式,计算其中每一像素点的梯度值的方法可以是:
首先,预先设置横向和纵向的掩模模板,例如,横向和纵向的掩模模板分别设置为:
其次,将掩模模板与第一样本图像进行卷积,求出每一像素点的梯度。
对于可以采用如下公式:
H1=image*F1,H2=image*F2,其中,H1为横向梯度,H2为纵向梯度。image表示像素点的像素值。
最后,根据每一像素点的横向梯度和纵向梯度,得到每一像素点的梯度值。
子步骤S1102,根据每一第一样本图像中所有像素点的梯度值,计算每一第一样本图像的梯度变化率。
在本实施例中,梯度变化率用于表征梯度的变化程度,每一第一样本图像均对应一个梯度变化率。
子步骤S1103,根据每一第一样本图像中所有像素点的梯度值的最大值及每一第一样本图像的梯度变化率,计算每一第一样本图像的清晰度。
在本实施例中,对于任意一张第一样本图像,该第一样本图像中所有像素点的梯度值的最大值及该第一样本图像的梯度变化率,计算该第一样本图像的清晰度。
本申请实施例提供的上述方法,通过根据梯度和梯度变化率计算第一样本图像的清晰度,使得图像清晰度的判断更准确,同时避免了极端条件下只通过梯度判断图像清晰度出现的误判。
在本实施例中,为了使梯度变化率的值更加合理,本申请实施例还提供了一种计算梯度变化率的具体实现方式:
首先,计算每一第一样本图像中所有像素点的梯度值的平均值。
其次,获取每一第一样本图像中所有像素点的梯度值的最大值和最小值。
最后,根据每一第一样本图像的最大值、最小值和平均值,计算每一第一样本图像的梯度变化率。
在本实施例中,作为一种具体实现方式,对于任一第一样本图像的梯度变化率,可以通过如下公式计算:
本申请实施例提供的上述方法,根据最大值、最小值及平均值,计算梯度变化率,可以使计算得到的梯度变化率更加合理,最终使得根据梯度和梯度变化率计算的图像清晰度也更准确。
在本实施例中,在根据最大值和梯度变化率计算清晰度时,为了更好地平衡梯度和梯度变化率对清晰度的影响权重,本申请实施例还提供了一种具体的计算公式,对于任一第一样本图像,其清晰度可以使用如下公式计算得到:
对于任一第一样本图像而言,根据第一样本图像中所有像素点的梯度值的最大值及梯度变化率,利用公式IQA=GαVG (1-α),计算该第一样本图像的清晰度,其中,IQA表示第一样本图像的清晰度,G表示每一第一样本图像中所有像素点的梯度值的最大值,VG表示梯度变化率,α表示权重因子。
在本实施例中,该公式结合了梯度的最大值和梯度变化率,α和α-1分别是最大值的指数和梯度变化率的指数,这两个的指数和为1,意思梯度的最大值的权重多一点,那梯度变化率的权重就少一点。
在本实施例中,α可以根据实验验证得到,例如,本申请实施例中,α=0.61时,通过上述公式计算得到的清晰度,可以用该清晰度较好地评价第一样本图像的清晰程度或者图像质量。
本申请实施例提供的上述方法,引入权重因子,可以适当地平衡梯度和梯度变化率在计算清晰度时各自占用的权重,以适应不同的应用场景。
在本实施例中,为了在得到初始对焦位置后,在初始对焦位置的预设范围内进行更细粒度的对焦,本申请实施例还提供了一种以初始对焦位置为起始点,并以第二预设步长在起始点的预设范围内进行对焦,得到多张第二样本图像的具体实现方式,请参照图8,图8示出本申请实施例提供的另一种自动对焦方法的流程图,步骤S120包括以下子步骤:
子步骤S1201,将第二预设步长作为目标步长、将预设移动方向作为目标方向、并将镜头处于起始点时采集的第二样本图像的清晰度作为目标清晰度,其中,第二预设步长小于第一预设步长。
在本实施例中,作为一种具体实施方式,预设移动方向可以是向左旋转移动镜头,也可以是向右旋转移动镜头。
在本实施例中,第二样本图像的清晰度的计算方法可以与第一样本图像的清晰度的计算方式相同,也可以不同,例如,为了达到上述步骤S110或者步骤S110的子步骤对应的技术效果,计算第二样本图像的清晰度也可以使用上述步骤S110或者步骤S110的子步骤描述的方式来实现,具体实现过程可以参考上述描述,此处不再赘述。
子步骤S1202,按照目标步长及目标方向在预设范围内移动一次镜头,将移动后采集的第二样本图像作为当前图像。
在本实施例中,由于第二预设步长小于第一预设步长,因此,预设范围必然落在预设对焦范围内、且在初始对焦位置的附近。
子步骤S1203,根据目标清晰度及当前图像的当前清晰度,确定镜头下一次移动的新的目标方向、新的目标步长及新的目标清晰度。
在本实施例中,目标清晰度为当前第二样本图像中清晰度的最大值。若目标清晰度大于或者等于当前清晰度,则无需更新目标清晰度,否则,需要将当前清晰度作为新的目标清晰度,以确保目标清晰度总是为已采集的第二样本图像中清晰度的最大值。
在本实施例中,为了更精细地控制自动对焦,使得镜头每次移动的更合理,得到的第二样本图像的清晰度越高,每次镜头移动的目标方向和目标步长可以根据当前镜头移动后得到当前图像的清晰度动态变化。
子步骤S1204,按照新的目标方向、新的目标步长及新的目标清晰度继续移动镜头,直至满足预设条件停止移动镜头,最终得到多张第二样本图像。
在本实施例中,按照新的目标方向及新的目标步长再次移动镜头,得到移动后采集的新的当前图像,利用新的目标清晰度和新的当前图像的清晰度继续确定下一次移动镜头的新的目标方向、新的目标步长及新的目标清晰度,直至满足预设条件。例如,预设条件为100次,则最终可以得到100张第二样本图像。
本申请实施例提供的上述方法,根据当前图像的当前清晰度和目标清晰度确定镜头下一次移动的新的目标方向、新的目标步长,使得镜头每次移动的更合理,可以使得到的第二样本图像更清晰,最终可以根据清晰度最高的第二样本图像的位置,确定自动对焦效果最好的最终对焦位置。
在本实施例中,根据当前清晰度和目标清晰度之间的关系的不同,确定出的新的目标方向、新的目标步长及新的目标清晰度也会有区别,本申请实施例还提供了一种具体确定出的新的目标方向、新的目标步长及新的目标清晰度的实现方式:
首先,若当前清晰度大于或者等于目标清晰度,则将目标方向作为新的目标方向、将目标步长作为新的目标步长、并将当前清晰度作为新的目标清晰度。
在本实施例中,若当前清晰度大于或者等于目标清晰度,意味着沿着当前的目标方向移动镜头还可以再找到比目标清晰度更大的位置,此时,无需改变目标方向、也不改变目标步长,将当前清晰度作为新的目标清晰度,继续移动镜头,以找到比新的目标清晰度更大的位置。
其次,若当前清晰度小于目标清晰度,则将与目标方向相反的方向作为新的目标方向、将目标步长减小预设值,将减小后的目标步长作为新的目标步长、并将目标清晰度作为新的目标清晰度。
在本实施例中,若当前清晰度小于目标清晰度,意味着比目标清晰度大的位置在与目标方向相反的方向,下一次再移动镜头时,需要按照与目标方向相反的方向移动,即与目标方向相反的方向作为新的目标方向,而且,为了避免向相反的方向移动时错过比目标清晰度大的位置,因此,将目标步长减小预设值,即在目标步长的基础上减小预设值,以便以更细粒度控制对焦,其中,预设值可以是一个固定值,也可以是根据预设函数确定的值。
在本实施例中,由于当前清晰度小于目标清晰度,此时目标清晰度不需要更新,故直接将目标清晰度作为新的目标清晰度。
本申请实施例提供的上述方法,当前清晰度小于目标清晰度时,改变镜头的移动方向,同时减少目标步长,否则按照当前移动方向、当前步长继续移动镜头,可以实现更精细地对焦控制。
为了从整体上清楚地说明自动对焦方法的处理流程,本发明实施例还给出了一种自动对焦方法的处理流程示例图,请参照图9,图9示出了本申请实施例提供的自动对焦方法的处理流程示例图。
为了更具体地说明上述自动对焦方法在具体场景中的应用,本申请实施例以图2的应用场景为例进行说明,电子设备1100为图2中的智能门锁200d,当用户走进智能门锁200d时,智能门锁200d控制其上的摄像头自动在预设对焦范围内多次移动镜头,获取每次移动镜头采集的用户人脸图像,将其作为第一样本图像,智能门锁200d计算每一第一样本图像的清晰度,得到初始对焦位置,智能门锁200d将初始对焦位置作为起始点,控制其上的摄像头多次移动镜头,得到每次移动镜头后采集的用户人脸图像,将此时的用户人脸图像作为第二样本图像,直至满足预设条件,得到多张第二样本图像,最终,将清晰度最大的第二样本图像对应的镜头所处的位置确定为最终对焦位置,在确定最终对焦位置后,智能门锁200d控制摄像头在最终对焦位置处再次采集用户的人脸图像,并对人脸图像进行识别,在识别通过后,智能门锁200d自动开启。在上述应用场景中,利用上述自动对焦方法可以快速、准确地进行对焦并得到清晰度较高的用户的人脸图像,使得后续人脸图像的识别的准确性大大提高,增加了智能门锁的安全性和可靠性。
为了执行上述实施例及各个可能的实施方式中的相应步骤,下面给出一种自动对焦装置2100的实现方式。请参照图10,图10示出了本申请实施例提供的自动对焦装置2100的方框示意图。需要说明的是,本实施例所提供的自动对焦装置2100,其基本原理及产生的技术效果和上述实施例相同,为简要描述,本实施例部分未提及指出。
自动对焦装置2100包括获取模块2101、计算模块2102及对焦模块2103。
获取模块2101,用于按照第一预设步长在预设对焦范围内多次移动镜头,获取每次移动镜头后采集的第一样本图像。
计算模块2102,用于计算每一第一样本图像的清晰度,得到清晰度最大的第一样本图像对应的镜头所处的初始对焦位置。
作为一种具体实施方式,第一样本图像包括多个像素点,计算模块2102具体用于:计算第一样本图像中每一个像素点的梯度值;根据第一样本图像中所有像素点的梯度值,计算梯度变化率;根据所有像素点的梯度值的最大值及所述梯度变化率,计算第一样本图像的清晰度。
作为一种具体实施方式,计算模块2102根据第一样本图像中所有像素点的梯度值,计算梯度变化率时,具体用于:计算第一样本图像中所有像素点的梯度值的平均值;获取第一样本图像中所有像素点的梯度值的最大值和最小值;根据最大值、最小值和平均值,计算梯度变化率。
作为一种具体实施方式,计算模块2102根据所有像素点的梯度值的最大值及梯度变化率,计算第一样本图像的清晰度时,具体用于:根据每一第一样本图像中所有像素点的梯度值的最大值及梯度变化率,利用公式IQA=GαVG (1-α),计算每一第一样本图像的清晰度,其中,IQA表示第一样本图像的清晰度,G表示每一第一样本图像中所有像素点的梯度值的最大值,VG表示梯度变化率,α表示权重因子。
对焦模块2103,用于以初始对焦位置为起始点、并以第二预设步长在起始点的预设范围内多次移动镜头,得到每次移动镜头后的第二样本图像,直至满足预设条件停止移动镜头,最终得到多张第二样本图像,其中,第二预设步长小于第一预设步长;以及用于将清晰度最大的第二样本图像对应的镜头所处的位置确定为最终对焦位置。
作为一种具体实施方式,对焦模块2103具体用于:将第二预设步长作为目标步长、将预设移动方向作为目标方向、并将镜头处于起始点时采集的第二样本图像的清晰度作为目标清晰度,其中,所述第二预设步长小于所述第一预设步长;按照目标步长及目标方向在预设范围内移动一次镜头,将移动后采集的第二样本图像作为当前图像;根据目标清晰度及当前图像的当前清晰度,确定镜头下一次移动的新的目标方向、新的目标步长及新的目标清晰度;按照新的目标方向、新的目标步长及新的目标清晰度继续移动镜头,直至满足预设条件停止移动镜头,最终得到多张第二样本图像。
作为一种具体实施方式,对焦模块2103根据目标清晰度及当前图像的当前清晰度,确定镜头下一次移动的新的目标方向、新的目标步长及新的目标清晰度时,具体用于:若当前清晰度大于或者等于目标清晰度,则将目标方向作为新的目标方向、将目标步长作为新的目标步长、并将当前清晰度作为新的目标清晰度;若当前清晰度小于目标清晰度,则将与目标方向相反的方向作为新的目标方向、将目标步长减小预设值,将减小后的目标步长作为新的目标步长、并将目标清晰度作为新的目标清晰度。
本申请实施例提供的自动对焦装置2100,能够实现图5、图7-图9的方法实施例中自动对焦方法实现的各个过程,为避免重复,这里不再赘述。
本申请实施例提供了一种电子设备1100,该电子设备1100可以是图1中的带有摄像头或者具备摄像功能或者拍照功能的家居设备200或者终端设备400,也可以是图2中的智能门锁200d或者终端设备400,电子设备1100包括处理器和存储器,该存储器中存储有至少一条指令、至少一段程序、代码集或指令集,该至少一条指令、该至少一段程序、该代码集或指令集由该处理器加载并执行以实现如上述方法实施例所提供的自动对焦方法。
存储器可用于存储软件程序以及模块,处理器通过运行存储在存储器的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作***、功能所需的应用程序等;存储数据区可存储根据所述设备的使用所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器还可以包括存储器控制器,以提供处理器对存储器的访问。
图11是本申请实施例提供的一种实现自动对焦方法的电子设备的硬件结构框图。如图11所示,该电子设备1100可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(ProcessingUnits,CPU)1110(处理器1110可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器1130,一个或一个以上存储应用程序1123或数据1122的存储介质1120(例如一个或一个以上海量存储设备)。其中,存储器1130和存储介质1120可以是短暂存储或持久存储。存储在存储介质1120的程序可以包括一个或一个以上模块,每个模块可以包括对服务器中的一系列指令操作。更进一步地,处理器1110可以设置为与存储介质1120通信,在电子设备1100上执行存储介质1120中的一系列指令操作。电子设备1100还可以包括一个或一个以上电源1160,一个或一个以上有线或无线网络接口1150,一个或一个以上输入输出接口1140,和/或,一个或一个以上操作***1121,例如WindowsServerTM,MacOSXTM,UnixTM,LinuxTM,FreeBSDTM等等。
输入输出接口1140可以用于经由一个网络接收或者发送数据。上述的网络具体实例可包括电子设备1100的通信供应商提供的无线网络。在一个实例中,输入输出接口1140包括一个网络适配器(NetworkInterfaceController,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,输入输出接口1140可以为射频(RadioFrequency,RF)模块,其用于通过无线方式与互联网进行通讯。
本领域普通技术人员可以理解,图11所示的结构仅为示意,其并不对上述电子设备1100的结构造成限定。例如,电子设备1100还可包括比图11中所示更多或者更少的组件,或者具有与图11所示不同的配置。
本申请实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述自动对焦方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(Read-OnlyMemory,简称ROM)、随机存取存储器(RandomAccessMemory,简称RAM)、磁碟或者光盘等。
综上所述,本申请实施例提供了一种自动对焦方法、装置、电子设备及存储介质,所述方法包括:按照第一预设步长在预设对焦范围内多次移动镜头,获取每次移动镜头后采集的第一样本图像;计算每一第一样本图像的清晰度,得到清晰度最大的第一样本图像对应的镜头所处的初始对焦位置;以初始对焦位置为起始点、并以第二预设步长在起始点的预设范围内多次移动镜头,得到每次移动镜头后的第二样本图像,直至满足预设条件停止移动镜头,最终得到多张第二样本图像,其中,第二预设步长小于第一预设步长;将清晰度最大的第二样本图像对应的镜头所处的位置确定为最终对焦位置。与现有技术相比,本申请实施例通过首先采用第一预设步长,快速确定初始对焦位置,在确定初始对焦位置后,再采用第二预设步长在初始对焦位置的预设范围内进行精细对焦,最终能够可以又快又准确地实现对焦。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例所述的方法。
上面结合附图对本申请的实施例进行了描述,但是本申请并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本申请的启示下,在不脱离本申请宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本申请的保护之内。
Claims (10)
1.一种自动对焦方法,其特征在于,所述方法包括:
按照第一预设步长在预设对焦范围内多次移动镜头,获取每次移动镜头后采集的第一样本图像;
计算每一所述第一样本图像的清晰度,得到清晰度最大的所述第一样本图像对应的所述镜头所处的初始对焦位置;
以所述初始对焦位置为起始点、并以第二预设步长在所述起始点的预设范围内多次移动所述镜头,得到每次移动所述镜头后的第二样本图像,直至满足预设条件停止移动所述镜头,最终得到多张所述第二样本图像;
将清晰度最大的所述第二样本图像对应的所述镜头所处的位置确定为最终对焦位置。
2.如权利要求1所述的自动对焦方法,其特征在于,所述第一样本图像包括多个像素点,所述计算每一所述第一样本图像的清晰度的步骤包括:
计算每一所述第一样本图像中每一个像素点的梯度值;
根据每一所述第一样本图像中所有像素点的梯度值,计算每一所述第一样本图像的梯度变化率;
根据每一所述第一样本图像中所述所有像素点的梯度值的最大值及每一所述第一样本图像的梯度变化率,计算每一所述第一样本图像的清晰度。
3.如权利要求2所述的自动对焦方法,其特征在于,所述根据每一所述第一样本图像中所有像素点的梯度值,计算每一所述第一样本图像的梯度变化率的步骤包括:
计算每一所述第一样本图像中所有像素点的梯度值的平均值;
获取每一所述第一样本图像中所有像素点的梯度值的最大值和最小值;
根据每一所述第一样本图像的所述最大值、所述最小值和所述平均值,计算每一所述第一样本图像的梯度变化率。
4.如权利要求2所述的自动对焦方法,其特征在于,所述根据每一所述第一样本图像中所述所有像素点的梯度值的最大值及每一所述第一样本图像的梯度变化率,计算每一所述第一样本图像的清晰度的步骤包括:
根据每一所述第一样本图像中所有像素点的梯度值的所述最大值及所述梯度变化率,利用公式IQA=GαVG (1-α),计算每一所述第一样本图像的清晰度,其中,IQA表示所述第一样本图像的清晰度,G表示每一所述第一样本图像中所有像素点的梯度值的最大值,VG表示所述梯度变化率,α表示权重因子。
5.如权利要求1所述的自动对焦方法,其特征在于,所述以所述初始对焦位置为起始点,并以第二预设步长在所述起始点的预设范围内多次移动所述镜头,得到每次移动所述镜头后的第二样本图像,直至满足预设条件停止移动所述镜头,最终得到多张所述第二样本图像的步骤包括:
将所述第二预设步长作为目标步长、将预设移动方向作为目标方向、并将所述镜头处于所述起始点时采集的第二样本图像的清晰度作为目标清晰度,其中,所述第二预设步长小于所述第一预设步长;
按照所述目标步长及所述目标方向在所述预设范围内移动一次所述镜头,将移动后采集的第二样本图像作为当前图像;
根据所述目标清晰度及所述当前图像的当前清晰度,确定所述镜头下一次移动的新的目标方向、新的目标步长及新的目标清晰度;
按照新的目标方向、新的目标步长及新的目标清晰度继续移动所述镜头,直至满足所述预设条件停止移动所述镜头,最终得到多张所述第二样本图像。
6.如权利要求5所述的自动对焦方法,其特征在于,所述根据所述目标清晰度及所述当前图像的当前清晰度,确定所述镜头下一次移动的新的目标方向、新的目标步长及新的目标清晰度的步骤包括:
若所述当前清晰度大于或者等于所述目标清晰度,则将所述目标方向作为所述新的目标方向、将所述目标步长作为新的目标步长、并将所述当前清晰度作为新的目标清晰度;
若所述当前清晰度小于所述目标清晰度,则将与所述目标方向相反的方向作为新的目标方向、将所述目标步长减小预设值,将减小后的目标步长作为新的目标步长、并将所述目标清晰度作为新的目标清晰度。
7.一种自动对焦装置,其特征在于,所述装置包括:
获取模块,用于按照第一预设步长在预设对焦范围内多次移动镜头,获取每次移动镜头后采集的第一样本图像;
计算模块,用于计算每一所述第一样本图像的清晰度,得到清晰度最大的所述第一样本图像对应的所述镜头所处的初始对焦位置;
对焦模块,用于以所述初始对焦位置为起始点、并以第二预设步长在所述起始点的预设范围内多次移动所述镜头,得到每次移动所述镜头后的第二样本图像,直至满足预设条件停止移动所述镜头,最终得到多张所述第二样本图像;
对焦模块,还用于将清晰度最大的所述第二样本图像对应的所述镜头所处的位置确定为最终对焦位置。
8.如权利要求7所述的自动对焦装置,其特征在于,所述第一样本图像包括多个像素点,所述计算模块具体用于:
计算每一所述第一样本图像中每一个像素点的梯度值;
根据每一所述第一样本图像中所有像素点的梯度值,计算每一所述第一样本图像的梯度变化率;
根据每一所述第一样本图像中所述所有像素点的梯度值的最大值及每一所述第一样本图像的梯度变化率,计算每一所述第一样本图像的清晰度。
9.一种电子设备,其特征在于,所述电子设备包括镜头、处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至6中任一项所述的自动对焦方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述的自动对焦方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110742860.2A CN115567778A (zh) | 2021-07-01 | 2021-07-01 | 自动对焦方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110742860.2A CN115567778A (zh) | 2021-07-01 | 2021-07-01 | 自动对焦方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115567778A true CN115567778A (zh) | 2023-01-03 |
Family
ID=84737793
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110742860.2A Pending CN115567778A (zh) | 2021-07-01 | 2021-07-01 | 自动对焦方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115567778A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116320748A (zh) * | 2023-05-22 | 2023-06-23 | 深圳明锐理想科技有限公司 | 自动对焦方法、装置、电子设备及自动光学检测设备 |
CN117782998A (zh) * | 2024-02-27 | 2024-03-29 | 宁德时代新能源科技股份有限公司 | 电池检测方法及*** |
-
2021
- 2021-07-01 CN CN202110742860.2A patent/CN115567778A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116320748A (zh) * | 2023-05-22 | 2023-06-23 | 深圳明锐理想科技有限公司 | 自动对焦方法、装置、电子设备及自动光学检测设备 |
CN117782998A (zh) * | 2024-02-27 | 2024-03-29 | 宁德时代新能源科技股份有限公司 | 电池检测方法及*** |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101794056B (zh) | 摄影设定控制方法及摄影装置 | |
CN115567778A (zh) | 自动对焦方法、装置、电子设备及存储介质 | |
KR102099635B1 (ko) | 카메라의 가이드 제공 방법 및 그 전자 장치 | |
US20130271618A1 (en) | Camera apparatus and control method thereof | |
CN105376487B (zh) | 一种对焦方法和装置 | |
CN104349056A (zh) | 图像处理设备、图像处理方法和程序 | |
CN104125395A (zh) | 一种实现自动拍摄的方法及装置 | |
CN108496352B (zh) | 拍摄方法及装置、图像处理方法及装置 | |
CN101387732A (zh) | 成像装置、成像装置控制方法和计算机程序 | |
CN111107276B (zh) | 信息处理设备及其控制方法、存储介质以及摄像*** | |
JP2010074735A (ja) | 操作入力装置、操作入力方法、プログラム | |
US10135631B2 (en) | Electric equipment management apparatus, electric equipment management method, and electric equipment management system | |
CN102891960A (zh) | 用于确定图像调整参数的方法和相机 | |
CN103501393B (zh) | 一种移动终端及其拍摄方法 | |
JP2018112996A (ja) | 映像認識装置、映像認識方法及びプログラム | |
CN104243796B (zh) | 摄影装置、摄影方法、模板创建装置和模板创建方法 | |
CN108702457B (zh) | 用于自动图像校正的方法、装置和计算机可读存储媒体 | |
CN105306806A (zh) | 一种移动终端及其拍照的方法 | |
CN108600610A (zh) | 拍摄辅助方法和装置 | |
Torres et al. | Optimal camera exposure for video surveillance systems by predictive control of shutter speed, aperture, and gain | |
CN112887610A (zh) | 拍摄方法、装置、电子设备及存储介质 | |
US11463617B2 (en) | Information processing apparatus, information processing system, image capturing apparatus, information processing method, and memory | |
CN109829393B (zh) | 一种移动物体探测方法、装置及存储介质 | |
CN112219218A (zh) | 用于推荐图像捕获模式的方法和电子设备 | |
KR20190134101A (ko) | 인공지능에 기반하여 영역을 인식하고 공기조화기를 제어하는 서버 및 공기조화기 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |