CN116757940A - 镜面反射区域的消除方法、装置、设备及介质 - Google Patents
镜面反射区域的消除方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN116757940A CN116757940A CN202310512900.3A CN202310512900A CN116757940A CN 116757940 A CN116757940 A CN 116757940A CN 202310512900 A CN202310512900 A CN 202310512900A CN 116757940 A CN116757940 A CN 116757940A
- Authority
- CN
- China
- Prior art keywords
- reflection area
- specular reflection
- picture
- ambient light
- pictures
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 67
- 238000012549 training Methods 0.000 claims description 51
- 238000001514 detection method Methods 0.000 claims description 27
- 238000002372 labelling Methods 0.000 claims description 20
- 238000003860 storage Methods 0.000 claims description 19
- 238000004590 computer program Methods 0.000 claims description 18
- 230000004044 response Effects 0.000 claims description 4
- 230000008030 elimination Effects 0.000 abstract description 7
- 238000003379 elimination reaction Methods 0.000 abstract description 7
- 238000005516 engineering process Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 15
- 230000006870 function Effects 0.000 description 13
- 238000012545 processing Methods 0.000 description 11
- 238000004891 communication Methods 0.000 description 6
- 230000004927 fusion Effects 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 6
- 230000008439 repair process Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 3
- 230000004075 alteration Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 239000011521 glass Substances 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/50—Image enhancement or restoration using two or more images, e.g. averaging or subtraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
Landscapes
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Studio Devices (AREA)
Abstract
本发明提供一种镜面反射区域的消除方法、装置、设备及介质,用以解决相关技术中照片高光反光消除质量低,不能完全满足证件拍照需要的技术问题,该方法包括:获取至少两张包含目标物体的图片,其中至少一张所述图片中包含镜面反射区域;识别出至少一张所述图片对应的镜面反射区域;在其他至少一张图片中,获取所述镜面反射区域对应位置的漫反射区域,并利用所述漫反射区域修复所述镜面反射区域,得到至少一张不包含镜面反射区域的图片。
Description
技术领域
本发明涉及照片处理领域、深度学习领域等技术领域,尤其涉及一种镜面反射区域的消除方法、装置、设备及介质。
背景技术
近年来,随着证件的普及化和数字化,人们对证件照片的质量要求逐渐提高。然而,在拍摄证件照片时,经常会发现照片中存在反光问题,导致照片模糊或无法辨认。
在相关技术中,一种解决反光问题的做法是使用“偏振镜”,将摄像机和闪光灯配备偏振镜滤镜,可以有效降低反光问题。另一种是通过应用程序提供的消除反光功能,其本质是通过软件处理算法对图像进行处理,达到去除反光的效果,例如拍照中的美颜功能。
然而,上述解决方法存在着一些弊端。首先,使用偏光镜可以降低反光问题,但是也会产生其他问题,例如折射不均匀等,从而影响照片质量。其次,消除反光的软件处理算法需要对图像进行大量计算和处理,因此可能会降低拍摄速度和图像质量。同时,由于证件照的需求非常精准,软件处理结果不稳定,容易出现误差,并不能完全满足证件拍照的需要。
因此,在消除证件照中的反光问题方面,还需要进一步研究和创新,提供更加可靠、有效的解决方案,以满足人们日益增长的需求。
发明内容
本发明提供一种镜面反射区域的消除方法、装置、设备及介质,用以解决相关技术中照片高光反光消除质量低,不能完全满足证件拍照需要的技术问题。
第一方面,本发明实施例提供一种镜面反射区域的消除方法,该方法包括:
获取至少两张包含目标物体的图片,其中至少一张图片中包含镜面反射区域;
识别出至少一张图片对应的镜面反射区域;
在其他至少一张图片中,获取镜面反射区域对应位置的漫反射区域,并利用漫反射区域修复镜面反射区域,得到至少一张不包含镜面反射区域的图片。
在一种可能实施的方式中,本发明实施例提供的方法中,获取至少两张包含目标物体的图片,包括:
指示用户通过调整拍摄角度的方式拍摄至少两张不同拍摄角度的图片。
在一种可能实施的方式中,本发明实施例提供的方法中,获取至少两张包含目标物体的图片,包括:
指示用户调节闪光灯状态,拍摄不同闪光灯状态下的至少两张图片;/或自动调节闪光灯状态并连续自动拍摄不同闪光灯状态下的至少两张图片。
在一种可能实施的方式中,本发明实施例提供的方法中,在拍摄至少两张图片之前,方法还包括:
根据当前拍摄环境确定当前的环境光状态;
根据环境光状态,指示用户拍摄至少两张包含目标物体的图片。
在一种可能实施的方式中,本发明实施例提供的方法中,环境光状态包括强环境光状态和弱环境光状态,根据当前拍摄环境确定当前的环境光状态,包括:
在环境光的光强低于预设阈值时,确定环境光状态为弱环境光状态;
在环境光的光强高于或等于预设阈值时,确定环境光状态为强环境光状态。
在一种可能实施的方式中,本发明实施例提供的方法中,根据环境光状态,指示用户拍摄至少两张包含目标物体的图片,包括:
在环境光状态为弱环境光状态时,指示用户调整拍摄角度的方式拍摄至少两张不同拍摄角度的图片;和/或
在环境光状态为强环境光状态时,拍摄不同闪光灯状态下的至少两张图片。
在一种可能实施的方式中,本发明实施例提供的方法中,识别出至少一张图片的镜面反射区域,包括:
选取至少一张图片为目标图片;
将目标图片输入至镜面反射区域检测模型,得到镜面反射区域。
在一种可能实施的方式中,本发明实施例提供的方法中,选取至少一张图片为目标图片,包括:
选取至少一张符合预设条件的图片为目标图片;/或
向用户展示图片,并根据用户的选取操作确定目标图片。
在一种可能实施的方式中,本发明实施例提供的方法中,镜面反射区域检测模型是通过如下方式训练生成:
获取多个包含图片和标注结果的训练样本;
以多个训练样本中的每个图片作为输入,将每个训练样本对应输出的镜面反射区域与训练样本的标注结果做比对,基于每个训练样本对应输出的镜面反射区域与训练样本的标注结果的差异训练生成镜面反射区域检测模型,标注结果是预先在训练样本中标注的镜面反射区域。
在一种可能实施的方式中,本发明实施例提供的方法中,方法还包括:
向用户展示镜面反射区域;
响应于用户的操作,修正镜面反射区域。
在一种可能实施的方式中,本发明实施例提供的方法中,获取至少两张包含目标物体的图片,包括:
识别目标物体是否为卡证,当目标物体为卡证时,获取至少两张包含目标物体的图片。
第二方面,本发明实施例提供一种镜面反射区域的消除装置,其特征在于,包括:
获取单元,用于获取至少两张包含目标物体的图片,其中至少一张图片中包含镜面反射区域;
识别单元,用于识别出至少一张图片对应的镜面反射区域;
修复单元,用于在其他至少一张图片中,获取镜面反射区域对应位置的漫反射区域,并利用漫反射区域修复镜面反射区域,得到至少一张不包含镜面反射区域的图片。
在一种可能实施的方式中,本发明实施例提供的装置中,获取单元具体用于:
指示用户通过调整拍摄角度的方式拍摄至少两张不同拍摄角度的图片。
在一种可能实施的方式中,本发明实施例提供的装置中,获取单元具体用于:
指示用户调节闪光灯状态,拍摄不同闪光灯状态下的至少两张图片;/或自动调节闪光灯状态并连续自动拍摄不同闪光灯状态下的至少两张图片。
在一种可能实施的方式中,本发明实施例提供的装置中,获取单元还用于:
根据当前拍摄环境确定当前的环境光状态;
根据环境光状态,指示用户拍摄至少两张包含目标物体的图片。
在一种可能实施的方式中,本发明实施例提供的装置中,环境光状态包括强环境光状态和弱环境光状态,获取单元还用于:
在环境光的光强低于预设阈值时,确定环境光状态为弱环境光状态;
在环境光的光强高于或等于预设阈值时,确定环境光状态为强环境光状态。
在一种可能实施的方式中,本发明实施例提供的装置中,获取单元具体用于:
在环境光状态为弱环境光状态时,指示用户调整拍摄角度的方式拍摄至少两张不同拍摄角度的图片;和/或
在环境光状态为强环境光状态时,拍摄不同闪光灯状态下的至少两张图片。
在一种可能实施的方式中,本发明实施例提供的装置中,识别单元具体用于:
选取至少一张图片为目标图片;
将目标图片输入至镜面反射区域检测模型,得到镜面反射区域。
在一种可能实施的方式中,本发明实施例提供的装置中,识别单元具体用于:
选取至少一张符合预设条件的图片为目标图片;/或
向用户展示图片,并根据用户的选取操作确定目标图片。
在一种可能实施的方式中,本发明实施例提供的装置中,识别单元具体用于通过如下方式训练生成镜面反射区域检测模型:
获取多个包含图片和标注结果的训练样本;
以多个训练样本中的每个图片作为输入,将每个训练样本对应输出的镜面反射区域与训练样本的标注结果做比对,基于每个训练样本对应输出的镜面反射区域与训练样本的标注结果的差异训练生成镜面反射区域检测模型,标注结果是预先在训练样本中标注的镜面反射区域。
在一种可能实施的方式中,本发明实施例提供的装置中,识别单元还用于:
向用户展示镜面反射区域;
响应于用户的操作,修正镜面反射区域。
在一种可能实施的方式中,本发明实施例提供的装置中,获取单元还用于:
识别目标物体是否为卡证,当目标物体为卡证时,获取至少两张包含目标物体的图片。
第三方面,本发明实施例提供一种电子设备,包括:至少一个处理器、至少一个存储器以及存储在存储器中的计算机程序指令,当计算机程序指令被处理器执行时实现如本发明实施例第一方面所提供的方法。
第四方面,本发明实施例提供一种计算机可读存储介质,其上存储有计算机程序指令,当计算机程序指令被处理器执行时实现如本发明实施例第一方面所提供的方法。
本发明实施例中,首先获取至少两张包含目标物体的图片,然后识别出至少一张图片对应的镜面反射区域,最后在其他至少一张图片中,获取镜面反射区域对应位置的漫反射区域,并利用漫反射区域修复镜面反射区域,得到至少一张不包含镜面反射区域的图片。与相关技术相比,解决了照片高光反光消除质量低,不能完全满足证件拍照需要的问题,可以利用多张图片消除镜面反射区域,使得最终得到的图片更加清晰且不丢失信息,满足证件拍照的需要,提升用户体验。
附图说明
图1为本发明实施例提供的一种镜面反射区域的消除方法的流程示意图;
图2为本发明实施例提供的一种镜面反射区域的消除方法的具体流程示意图;
图3为本发明实施例提供的镜面反射区域检测模型的训练方法的流程示意图;
图4为本发明实施例提供的镜面反射区域检测模型的结构示意图;
图5为本发明实施例提供的另一种镜面反射区域的消除方法的具体流程示意图;
图6为本发明实施例提供的弱环境光状态的拍摄示意图;
图7为本发明实施例提供的一种拍摄方式下的图片示例;
图8为本发明实施例提供的强环境光状态的拍摄示意图;
图9为本发明实施例提供的另一种拍摄方式下的图片示例;
图10为本发明实施例提供的一种图片预览的界面示意图;
图11为本发明实施例提供的一种手机操作的界面示意图;
图12为本发明实施例提供的一种镜面区域修复后的图片示例;
图13为本发明实施例提供的一种镜面反射区域的消除装置的结构示意图;
图14为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部份实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
下面对文中出现的一些词语进行解释:
1、本发明实施例中术语“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
2、本发明实施例中术语“镜面反射”,是指光线在物体表面产生的明亮反射,通常发生在平整、光滑的表面上,如水面、玻璃面等。在拍摄过程中,相机镜头一般会捕捉到物体表面的镜面反射部分,这部分通常呈现出比较强的亮度和对比度。相机拍摄时为了保持场景的真实感和质感,需要处理相片中的镜面反射,通常可以通过调整曝光时间、光圈大小、iso等参数来控制拍摄时的光源和环境条件,也可以通过后期处理来增强或削弱镜面反射的强度,达到理想的效果。
近年来,随着证件的普及化和数字化,人们对证件照片的质量要求逐渐提高。然而,在拍摄证件照片时,经常会发现照片中存在反光问题,导致照片模糊或无法辨认。
在相关技术中,一种解决反光问题的做法是使用“偏振镜”,将摄像机和闪光灯配备偏振镜或滤镜,可以有效降低反光问题。另一种是通过应用程序提供的消除反光功能,其本质是通过软件处理算法对图像进行处理,达到去除反光的效果,例如拍照中的美颜功能。
然而,上述解决方法存在着一些弊端。首先,使用偏光镜可以降低反光问题,但是也会产生其他问题,例如折射不均匀等,从而影响照片质量。其次,消除反光的软件处理算法需要对图像进行大量计算和处理,因此可能会降低拍摄速度和图像质量。同时,由于证件照的需求非常精准,软件处理结果不稳定,容易出现误差,并不能完全满足证件拍照的需要。
因此,在消除证件照中的反光问题方面,还需要进一步研究和创新,提供更加可靠、有效的解决方案,以满足人们日益增长的需求。
本技术方案提供一种镜面反射区域的消除方法,下面结合附图和实施例对本发明提供的镜面反射区域的消除方法、装置、设备及介质进行更详细地说明。
本发明实施例提供一种镜面反射区域的消除方法,如图1所示,包括:
步骤S101,获取至少两张包含目标物体的图片。
具体实施时,获取至少两张图片,每张图片中均包含有目标物体,至少一张图片中包含镜面反射区域。镜面反射是指光线在物体表面产生的明亮反射,通常发生在平整、光滑的表面上,如水面、玻璃面等。在拍摄过程中,相机镜头一般会捕捉到物体表面的镜面反射部分,这部分通常呈现出比较强的亮度和对比度,除镜面反射部分之外的部分呈现相对较弱的亮度可被认为是漫反射区域。目标物体可以是任意需要拍摄的且表面会出现镜面反射部分的物体,例如证件照、人像等,具体获取时,可以指示用户通过调整拍摄角度的方式来拍摄多张不同拍摄角度的图片,旨在使每张图片的镜面反射区域不一致,如通过水平翻转或垂直翻转或其他形式的调整,获得不同拍摄角度的图片;也可以指示用户调节闪光灯状态,或自动调节闪光灯状态,得到不同闪光灯状态下的多种图片,如闪光灯开启状态、闪光灯关闭状态、闪光灯设定亮度值的状态等多种状态下的图片。当然也可以通过判断当前拍摄时的环境光状态,来决定拍摄不同角度的照片或者拍摄不同闪光灯状态的照片,具体拍摄规则可以按需求自行设定。在获取图片之前,还可以检测目标物体是否为卡证,当目标物体为卡证时,再去获取两张包含目标物体的图片,防止正常拍摄具有反射面的物体,例如车的车灯、太阳等物体时,不必要的进入多张照片拍摄界面,造成操作复杂。通过识别卡证,可以仅在拍卡证,例如证件照、名片、银行卡、身份证等卡片物体时执行镜面反射区域的消除方法,使用户操作简单,体验感更好。
步骤S102,识别出至少一张图片对应的镜面反射区域。
具体实施时,在确定镜面反射区域时,首先在获得的图片中选取至少一张为目标图片,然后将目标图片输入至镜面反射区域检测模型中,通过模型来确定镜面反射区域,在选取目标图片时,可以根据用户对图片的主动选择来选取,也可以选取符合预设条件的图片,如图片参数(例如曝光度、亮度、图片分辨率等)在一定范围内,或者是图片中目标物体的清晰可见程度等,具体条件可以根据需求自行设定。
镜面反射区域检测模型是通过如下方式训练生成:
首先获取多个包含图片和标注结果的训练样本,然后以多个训练样本中的每个图片作为输入,将每个训练样本对应输出的镜面反射区域与训练样本的标注结果做比对,基于每个训练样本对应输出的镜面反射区域与训练样本的标注结果的差异训练生成镜面反射区域检测模型,标注结果是预先在训练样本中标注的镜面反射区域。
在确定出镜面反射区域后,还可以向用户展示该镜面反射区域,用户可以根据自己观察到的界面去调节该镜面反射区域的大小位置,也可以再将图片中其他显示不清晰或有强光反光的位置也设置为镜面反射区域,使得镜面反射区域的判断更为准确,更加符合用户的需求。
步骤S103,在其他至少一张图片中,获取镜面反射区域对应位置的漫反射区域,并利用漫反射区域修复镜面反射区域,得到至少一张不包含镜面反射区域的图片。
具体实施时,在其他至少一张图片中,也即非目标图片中,获取到目标图片中镜面反射区域所在位置处对应的漫反射区域,然后利用该漫反射区域对镜面反射区域进行修复,得到至少一张不包含镜面反射区域的图片。
下面结合图2,对本发明实施例中的镜面反射区域的消除方法进行详细说明,如图2所示,本发明实施例提供的镜面反射区域的消除方法,可以包括如下具体步骤:
步骤S201,根据当前拍摄环境确定当前的环境光状态。
具体实施时,环境光状态包括强环境光状态和弱环境光状态,在环境光的光强低于预设阈值时,确定环境光状态为弱环境光状态,在环境光的光强高于或等于预设阈值时,确定环境光状态为强环境光状态。该预设阈值可以根据需求自行设定,环境光状态可以通过设置在用户的拍摄设备上的传感器进行确定,也可以根据预览图片的亮度判断,也可以由用户进行选择,本发明实施例对此不作限定,通过确定环境光状态进而确定拍摄方式,提高了获得图片的质量。
步骤S202,根据环境光状态,指示用户拍摄至少两张包含目标物体的图片。
具体实施时,在环境光状态为弱环境光状态时,指示用户调整拍摄角度的方式拍摄至少两张不同拍摄角度的图片,如通过水平翻转或垂直翻转或其他形式的调整,获得不同拍摄角度的图片。在环境光状态为强环境光状态时,拍摄不同闪光灯状态下的至少两张图片,即获得以下类型中至少两种:闪光灯开启时拍摄的图片、闪光灯关闭时拍摄的图片以及不同闪光灯亮度时拍摄的图片。
步骤S203,选取至少一张图片为目标图片。
具体实施时,可以根据用户对图片的主动选择来选取,也可以选取符合预设条件的图片,如图片参数(例如曝光度、亮度、图片分辨率等)在一定范围内,或者是图片中目标物体的清晰可见程度等,具体条件可以根据需求自行设定。
步骤S204,将目标图片输入至镜面反射区域检测模型,得到镜面反射区域。
具体实施时,将目标图片输入至镜面反射区域检测模型中,确定出目标图片对应的镜面反射区域,在本步骤中,还可以通过用户操作来修正镜面反射区域,使得该区域划分更为准确。
步骤S205,在其他至少一张图片中,获取镜面反射区域对应位置的漫反射区域,并利用漫反射区域修复镜面反射区域,得到至少一张不包含镜面反射区域的图片。
具体实施时,在其他至少一张图片中,也即非目标图片中,获取到目标图片中镜面反射区域所在位置处对应的漫反射区域,然后利用该漫反射区域对镜面反射区域进行修复,得到至少一张不包含镜面反射区域的图片。修复时,借助单应性变换将多次拍摄同一物体不同角度的图片进行配准,再借助泊松融合算法,实现目标图片中的镜面反射区域和其他图片对应的漫反射区域的拼接融合,完成高光消除,并尽可能保证融合部分的图像自然平滑。
下面结合图3,对步骤S204中的镜面反射区域检测模型的训练进行详细说明,具体镜面反射区域检测模型的训练步骤如下:
步骤S301,采集训练数据。
具体实施时,通过网络搜索等方式,收集真实图片,要求图片中物体的表面人像、背景纹理和文字信息清晰可见,且物体表面不存在镜面反射区域。
步骤S302,处理训练数据。
具体实施时,通过合成的方式给采集的图片添加高光效果。具体采用像素级加法将原始图片和圆形高光mask直接相加构成高光图像,相加后饱和的像素点需进行截断,高光mask的强度由中心向外逐渐降低。
步骤S303,利用训练数据训练镜面反射区域检测模型。
具体实施时,利用训练数据训练镜面反射区域检测模型,训练后的镜面反射区域检测模型如图4所示,为U型网络结构,借助结构相似性检测高光。
下面结合图5,以拍摄两张图片为例,结合用户使用手机拍摄证件的操作,对本发明实施例中的镜面反射区域的消除方法进行详细说明,如图5所示,本发明实施例提供的镜面反射区域的消除方法,可以包括如下具体步骤:
步骤S501,根据当前拍摄环境确定当前的环境光状态,若环境光状态为弱环境光状态则执行步骤S502,若环境光状态为强环境光状态则执行步骤S503。
步骤S502,指示用户调整拍摄角度的方式拍摄两张不同拍摄角度的图片,然后执行步骤S504。
具体实施时,在拍摄时,还可以先检测目标物体是否为卡证等具有反射膜的物体,避免拍摄不必要的两张照片,在环境光状态为弱环境光状态时,即环境光很弱、需要手机闪光灯常亮进行补光而产生高光的情况,拍摄方式如图6所示,为水平翻转设备拍摄两张不同角度的卡证照片,在一个示例中,拍摄的图片如图7所示,两张图片中卡证上的镜面反射区域不重叠。
步骤S503,拍摄不同闪光灯状态下的两张图片,然后执行步骤S504。
具体实施时,在拍摄时,还可以先检测目标物体是否为卡证等具有反射膜的物体,避免拍摄不必要的两张照片,在环境光状态为强环境光状态时,即环境光较强、由环境光产生片状或点状高光的情况,拍摄方式如图8所示,为按下一次快门自动连续拍摄两张不同闪光灯状态下的照片,在一个示例中,拍摄的图片如图9所示,其中拍摄第一张照片时不开启闪光灯而拍摄第二张照片时开启闪光灯,拍摄时保持两次拍摄时手机位置尽可能相同。
步骤S504,选取一张图片为目标图片。
具体实施时,可以根据用户对图片的主动选择来选取,也可以选取符合预设条件的图片,如图片参数(例如曝光度、亮度、图片分辨率等)在一定范围内,或者是图片中目标物体的清晰可见程度等,具体条件可以根据需求自行设定。
在选取目标图片之前,还可以将步骤S502或步骤S503中拍摄的两张照片展示给用户,如图10所示,在用户的手机1001中的预览区域1002里展示拍摄的两张照片,在展示时,还可以对不符合拍摄方法要求的图片输出提示,提示重新拍摄,图10中示出的为垂直排列展示两种照片,当然也可以以水平展示的形式或其他任意形式进行展示,本发明实施例对此不做限定。
步骤S505,将目标图片输入至镜面反射区域检测模型中,确定目标图片的镜面反射区域。
具体实施时,将目标图片输入至镜面反射区域检测模型中,确定出目标图片的镜面反射区域,在本步骤中,还可以通过用户操作来修正镜面反射区域,使得该区域划分更为准确,如图11所示,在用户的手机1101上显示的图片1102里,经镜面反射区域检测模型检测后图片的镜面反射区域1103,用户可以自行对该区域进行修改。
步骤S506,利用另一张图片中镜面反射区域所在位置处对应的漫反射区域,修复目标图片的镜面反射区域。
具体实施时,借助单应性变换对两张图片进行配准,并通过泊松融合实现目标图片中的镜面反射区域和另一张图片的对应区域的拼接融合,完成高光消除,并尽可能保证融合部分的图像自然平滑,最终输出无高光的卡证图片,使用本发明实施例提供的方法,既可以利用深度学***衡,提升拍摄体验。如上述示例中拍摄的图7和图9的图片,最终得到如图12所示的修复后的图片。
如图13所示,基于镜面反射区域的消除方法同样的发明构思,本发明还提供一种镜面反射区域的消除装置,包括:
获取单元1301,用于获取至少两张包含目标物体的图片,其中至少一张图片中包含镜面反射区域;
识别单元1302,用于识别出至少一张图片对应的镜面反射区域;
修复单元1303,用于在其他至少一张图片中,获取镜面反射区域对应位置的漫反射区域,并利用漫反射区域修复镜面反射区域,得到至少一张不包含镜面反射区域的图片。
在一种可能实施的方式中,本发明实施例提供的装置中,获取单元1301具体用于:
指示用户通过调整拍摄角度的方式拍摄至少两张不同拍摄角度的图片。
在一种可能实施的方式中,本发明实施例提供的装置中,获取单元1301具体用于:
指示用户调节闪光灯状态,拍摄不同闪光灯状态下的至少两张图片;/或自动调节闪光灯状态并连续自动拍摄不同闪光灯状态下的至少两张图片。
在一种可能实施的方式中,本发明实施例提供的装置中,获取单元1301还用于:
根据当前拍摄环境确定当前的环境光状态;
根据环境光状态,指示用户拍摄至少两张包含目标物体的图片。
在一种可能实施的方式中,本发明实施例提供的装置中,环境光状态包括强环境光状态和弱环境光状态,获取单元1301还用于:
在环境光的光强低于预设阈值时,确定环境光状态为弱环境光状态;
在环境光的光强高于或等于预设阈值时,确定环境光状态为强环境光状态。
在一种可能实施的方式中,本发明实施例提供的装置中,获取单元1301具体用于:
在环境光状态为弱环境光状态时,指示用户调整拍摄角度的方式拍摄至少两张不同拍摄角度的图片;和/或
在环境光状态为强环境光状态时,拍摄不同闪光灯状态下的至少两张图片。
在一种可能实施的方式中,本发明实施例提供的装置中,识别单元1302具体用于:
选取至少一张图片为目标图片;
将目标图片输入至镜面反射区域检测模型,得到镜面反射区域。
在一种可能实施的方式中,本发明实施例提供的装置中,识别单元1302具体用于:
选取至少一张符合预设条件的图片为目标图片;/或
向用户展示图片,并根据用户的选取操作确定目标图片。
在一种可能实施的方式中,本发明实施例提供的装置中,识别单元1302具体用于通过如下方式训练生成镜面反射区域检测模型:
获取多个包含图片和标注结果的训练样本;
以多个训练样本中的每个图片作为输入,将每个训练样本对应输出的镜面反射区域与训练样本的标注结果做比对,基于每个训练样本对应输出的镜面反射区域与训练样本的标注结果的差异训练生成镜面反射区域检测模型,标注结果是预先在训练样本中标注的镜面反射区域。
在一种可能实施的方式中,本发明实施例提供的装置中,识别单元1302还用于:
向用户展示镜面反射区域;
响应于用户的操作,修正镜面反射区域。
在一种可能实施的方式中,本发明实施例提供的装置中,获取单元1301还用于:
识别目标物体是否为卡证,当目标物体为卡证时,获取至少两张包含目标物体的图片。
另外,结合图1-图13描述的本申请实施例的镜面反射区域的消除方法和装置可以由电子设备来实现。图14示出了本申请实施例提供的电子设备的硬件结构示意图。
如图14所示,电子设备1400可以包括处理装置(例如中央处理器、图形处理器等)1401,其可以根据存储在只读存储器(ROM)1402中的程序或者从存储装置1408加载到随机访问存储器(RAM)1403中的程序而执行各种适当的动作和处理以实现如本公开所述的实施例的镜面反射区域的消除方法。在RAM 1403中,还存储有电子设备1400操作所需的各种程序和数据。处理装置1401、ROM 1402以及RAM 1403通过总线1404彼此相连。输入/输出(I/O)接口1405也连接至总线1404。
通常,以下装置可以连接至I/O接口1405:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置1406;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置1407;包括例如磁带、硬盘等的存储装置1408;以及通信装置1409。通信装置1409可以允许电子设备1400与其他设备进行无线或有线通信以交换数据。虽然图14示出了具有各种装置的电子设备1400,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在非暂态计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码,从而实现如上所提及的方法。在这样的实施例中,该计算机程序可以通过通信装置1409从网络上被下载和安装,或者从存储装置1408被安装,或者从ROM 1402被安装。在该计算机程序被处理装置1401执行时,执行本公开实施例的方法中限定的上述功能。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
在一些实施方式中,客户端、服务器可以利用诸如HTTP(HyperText TransferProtocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“LAN”),广域网(“WAN”),网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任何当前已知或未来研发的网络。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:
获取至少两张包含目标物体的图片,其中至少一张图片中包含镜面反射区域;
识别出至少一张图片对应的镜面反射区域;
在其他至少一张图片中,获取镜面反射区域对应位置的漫反射区域,并利用漫反射区域修复镜面反射区域,得到至少一张不包含镜面反射区域的图片。
可选的,当上述一个或者多个程序被该电子设备执行时,该电子设备还可以执行上述实施例所提及的其他步骤。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括但不限于面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上***(SOC)、复杂可编程逻辑设备(CPLD)等等。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行***、装置或设备使用或与指令执行***、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体***、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
本发明实施例中,首先获取至少两张包含目标物体的图片,然后识别出至少一张图片对应的镜面反射区域,最后在其他至少一张图片中,获取镜面反射区域对应位置的漫反射区域,并利用漫反射区域修复镜面反射区域,得到至少一张不包含镜面反射区域的图片。与相关技术相比,解决了照片高光反光消除质量低,不能完全满足证件拍照需要的问题,可以利用多张图片消除镜面反射区域,使得最终得到的图片更加清晰且不丢失信息,满足证件拍照的需要,提升用户体验。
本领域内的技术人员应明白,本申请的实施例可提供为方法、***、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (14)
1.一种镜面反射区域的消除方法,其特征在于,包括:
获取至少两张包含目标物体的图片,其中至少一张所述图片中包含镜面反射区域;
识别出至少一张所述图片对应的镜面反射区域;
在其他至少一张图片中,获取所述镜面反射区域对应位置的漫反射区域,并利用所述漫反射区域修复所述镜面反射区域,得到至少一张不包含镜面反射区域的图片。
2.根据权利要求1所述的方法,其特征在于,所述获取至少两张包含目标物体的图片,包括:
指示用户通过调整拍摄角度的方式拍摄至少两张不同拍摄角度的所述图片。
3.根据权利要求1所述的方法,其特征在于,所述获取至少两张包含目标物体的图片,包括:
指示用户调节闪光灯状态,拍摄不同闪光灯状态下的至少两张所述图片;/或
自动调节闪光灯状态并连续自动拍摄不同闪光灯状态下的至少两张所述图片。
4.根据权利要求2或3所述的方法,其特征在于,在拍摄所述至少两张所述图片之前,所述方法还包括:
根据当前拍摄环境确定当前的环境光状态;
根据所述环境光状态,指示所述用户拍摄至少两张包含目标物体的图片。
5.根据权利要求4所述的方法,其特征在于,所述环境光状态包括强环境光状态和弱环境光状态,所述根据当前拍摄环境确定当前的环境光状态,包括:
在环境光的光强低于预设阈值时,确定所述环境光状态为弱环境光状态;
在所述环境光的光强高于或等于预设阈值时,确定所述环境光状态为强环境光状态。
6.根据权利要求5所述的方法,其特征在于,所述根据所述环境光状态,指示所述用户拍摄至少两张包含目标物体的图片,包括:
在所述环境光状态为弱环境光状态时,指示所述用户调整拍摄角度的方式拍摄至少两张不同拍摄角度的所述图片;和/或
在所述环境光状态为强环境光状态时,拍摄不同闪光灯状态下的至少两张所述图片。
7.根据权利要求1所述的方法,其特征在于,所述识别出至少一张所述图片的镜面反射区域,包括:
选取至少一张所述图片为目标图片;
将所述目标图片输入至所述镜面反射区域检测模型,得到所述镜面反射区域。
8.根据权利要求7所述的方法,其特征在于,所述选取至少一张所述图片为目标图片,包括:
选取至少一张符合预设条件的图片为所述目标图片;/或
向用户展示所述图片,并根据所述用户的选取操作确定所述目标图片。
9.根据权利要求7所述的方法,其特征在于,所述镜面反射区域检测模型是通过如下方式训练生成:
获取多个包含图片和标注结果的训练样本;
以多个所述训练样本中的每个图片作为输入,将每个所述训练样本对应输出的镜面反射区域与所述训练样本的标注结果做比对,基于每个所述训练样本对应输出的镜面反射区域与所述训练样本的标注结果的差异训练生成所述镜面反射区域检测模型,所述标注结果是预先在所述训练样本中标注的所述镜面反射区域。
10.根据权利要求7所述的方法,其特征在于,所述方法还包括:
向用户展示所述镜面反射区域;
响应于所述用户的操作,修正所述镜面反射区域。
11.根据权利要求1所述的方法,其特征在于,所述获取至少两张包含目标物体的图片,包括:
识别所述目标物体是否为卡证,当所述目标物体为卡证时,获取至少两张包含目标物体的图片。
12.一种镜面反射区域的消除装置,其特征在于,包括:
获取单元,用于获取至少两张包含目标物体的图片,其中至少一张所述图片中包含镜面反射区域;
识别单元,用于识别出至少一张所述图片对应的镜面反射区域;
修复单元,用于在其他至少一张图片中,获取所述镜面反射区域对应位置的漫反射区域,并利用所述漫反射区域修复所述镜面反射区域,得到至少一张不包含镜面反射区域的图片。
13.一种电子设备,其特征在于,包括:至少一个处理器、至少一个存储器以及存储在所述存储器中的计算机程序指令,当所述计算机程序指令被所述处理器执行时实现如权利要求1-11中任一项所述的方法。
14.一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,当所述计算机程序指令被处理器执行时实现如权利要求1-11中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310512900.3A CN116757940A (zh) | 2023-05-08 | 2023-05-08 | 镜面反射区域的消除方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310512900.3A CN116757940A (zh) | 2023-05-08 | 2023-05-08 | 镜面反射区域的消除方法、装置、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116757940A true CN116757940A (zh) | 2023-09-15 |
Family
ID=87954072
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310512900.3A Pending CN116757940A (zh) | 2023-05-08 | 2023-05-08 | 镜面反射区域的消除方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116757940A (zh) |
-
2023
- 2023-05-08 CN CN202310512900.3A patent/CN116757940A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102126300B1 (ko) | 올-인-포커스 이미지를 생성하기 위한 방법 및 장치 | |
US9600741B1 (en) | Enhanced image generation based on multiple images | |
US9591237B2 (en) | Automated generation of panning shots | |
US20220350405A1 (en) | Image changes based on facial appearance | |
US9838616B2 (en) | Image processing method and electronic apparatus | |
US10165201B2 (en) | Image processing method and apparatus and terminal device to obtain a group photo including photographer | |
CN108337505B (zh) | 信息获取方法和装置 | |
WO2017114399A1 (zh) | 逆光拍照方法和装置 | |
CN110062157B (zh) | 渲染图像的方法、装置、电子设备和计算机可读存储介质 | |
CN111163265A (zh) | 图像处理方法、装置、移动终端及计算机存储介质 | |
US20170351932A1 (en) | Method, apparatus and computer program product for blur estimation | |
CN111325698A (zh) | 图像处理方法、装置及***、电子设备 | |
WO2023071933A1 (zh) | 相机拍摄参数调整方法、装置及电子设备 | |
CN115311178A (zh) | 图像拼接方法、装置、设备及介质 | |
CN108289176B (zh) | 一种拍照搜题方法、搜题装置及终端设备 | |
CN112508959B (zh) | 视频目标分割方法、装置、电子设备及存储介质 | |
CN114022662A (zh) | 图像识别方法、装置、设备及介质 | |
CN110349108B (zh) | 处理图像的方法、装置、电子设备、及存储介质 | |
US11810336B2 (en) | Object display method and apparatus, electronic device, and computer readable storage medium | |
CN111385460A (zh) | 图像处理方法和装置 | |
CN116757940A (zh) | 镜面反射区域的消除方法、装置、设备及介质 | |
CN111654623B (zh) | 拍照方法、装置和电子设备 | |
KR20140134844A (ko) | 객체 기반 사진 촬영 방법 및 장치 | |
CN113379624A (zh) | 图像生成方法、图像生成模型的训练方法、装置及设备 | |
CN110971813B (zh) | 一种对焦方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |