CN112950528A - 证件姿态确定方法、模型训练方法、装置、服务器及介质 - Google Patents

证件姿态确定方法、模型训练方法、装置、服务器及介质 Download PDF

Info

Publication number
CN112950528A
CN112950528A CN201911249237.2A CN201911249237A CN112950528A CN 112950528 A CN112950528 A CN 112950528A CN 201911249237 A CN201911249237 A CN 201911249237A CN 112950528 A CN112950528 A CN 112950528A
Authority
CN
China
Prior art keywords
certificate
determining
image
angle
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911249237.2A
Other languages
English (en)
Inventor
陈志军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Labs Singapore Pte Ltd
Original Assignee
Alipay Labs Singapore Pte Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Labs Singapore Pte Ltd filed Critical Alipay Labs Singapore Pte Ltd
Priority to CN201911249237.2A priority Critical patent/CN112950528A/zh
Publication of CN112950528A publication Critical patent/CN112950528A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • G06V10/243Aligning, centring, orientation detection or correction of the image by compensating for image skew or non-uniform image deformations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20112Image segmentation details
    • G06T2207/20164Salient point detection; Corner detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Quality & Reliability (AREA)
  • Image Analysis (AREA)

Abstract

本说明书实施例公开一种证件姿态确定方法、模型训练方法、装置、服务器及介质,所述证件姿态确定方法中,通过对证件图像进行角点检测,获得证件图像中证件区域的角点位置,并基于角点位置确定出目标证件沿空间坐标系的各个方向发生偏移的多维偏移参数,进而确定目标证件的空间姿态。上述方案提供了一种有效的确定证件姿态偏移的方法,且实现简单、易于操作。

Description

证件姿态确定方法、模型训练方法、装置、服务器及介质
技术领域
本说明书实施例涉及计算机技术领域,尤其涉及一种证件姿态确定方法、模型训练方法、装置、服务器及介质。
背景技术
随着科学技术的不断发展,电子技术也得到了飞速的发展,电子设备能够实现的功能也越来越丰富。现有技术中,证件检测被应用到很多场景中,例如通过对用户的证件信息进行检测来核实用户的身份,通过对银行卡进行检测来自动填写用户的银行卡信息等。在进行证件检测时,通常需要用户使用电子设备对证件进行扫描或拍照,再对得到的图像进行证件检测,由于图像中的证件通常会出现倾斜,导致后续的证件检测不准确。因此,如何在证件图像中准确的确定出证件姿态,对于证件检测是至关重要的。
发明内容
本说明书实施例提供及一种证件姿态确定方法、模型训练方法、装置、服务器及介质。
第一方面,本说明书实施例提供一种证件姿态确定方法,包括:
对证件图像进行角点检测,确定出所述证件图像中证件区域的每个角点的角点位置,其中,所述证件区域为目标证件所在区域;
根据所述证件区域的每个角点的角点位置,确定出多维偏移参数,所述多维偏移参数用于表征所述目标证件沿所在空间坐标系的横轴方向、纵轴方向以及竖轴方向发生偏移的偏移程度;
基于所述多维偏移参数,确定所述目标证件的空间姿态。
第二方面,本说明书实施例提供一种证件姿态识别模型训练方法,包括:
获取多幅证件图像;
根据第一方面提供的证件姿态确定方法,确定所述多幅证件图像中每幅证件图像对应的证件空间姿态;
基于所述每幅证件图像对应的证件空间姿态,对所述每幅证件图像进行证件姿态标注;
基于证件姿态标注后的每幅证件图像,对初始的证件姿态识别模型进行训练,得到已训练的证件姿态识别模型,所述已训练的证件姿态识别模型用于对输入的证件图像进行证件姿态识别,并输出对应的证件空间姿态。
第三方面,本说明书实施例提供一种证件姿态确定装置,所述装置包括:
角点确定模块,用于对证件图像进行角点检测,确定出所述证件图像中证件区域的每个角点的角点位置,其中,所述证件区域为目标证件所在区域;
偏移参数确定模块,用于根据所述证件区域的每个角点的角点位置,确定出多维偏移参数,所述多维偏移参数用于表征所述目标证件沿所在空间坐标系的横轴方向、纵轴方向以及竖轴方向发生偏移的偏移程度;
姿态确定模块,用于基于所述多维偏移参数,确定所述目标证件的空间姿态。
第四方面,本说明书实施例提供一种证件姿态识别模型训练方法,包括:
获取模块,用于获取多幅证件图像;
角度确定模块,用于根据第一方面提供的证件姿态确定方法,确定所述多幅证件图像中每幅证件图像对应的
空间姿态;
角度标注模块,用于基于所述每幅证件图像对应的空间姿态,对所述每幅证件图像进行证件姿态标注;
模型训练模块,用于基于证件姿态标注后的每幅证件图像,对初始的证件姿态识别模型进行训练,得到已训练的证件姿态识别模型,所述已训练的证件姿态识别模型用于对输入的证件图像进行证件姿态识别,并输出对应的空间姿态。
第五方面,本说明书实施例提供一种服务器,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行上述任一项所述方法的步骤。
第六方面,本说明书实施例提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任一项所述方法的步骤。
本说明书实施例有益效果如下:
在本说明书实施例提供的证件姿态确定方法中,获取证件图像中包含的证件区域的每个角点的角点位置,并根据每个角点的角点位置,确定出用于表征目标证件沿横轴方向、纵轴方向以及竖直方向偏移程度的多维偏移参数,进而根据多维偏移参数,确定出目标证件的空间姿态。可见,本说明书实施例通过对二维图像进行处理,即可获得目标证件在三维空间中的空间姿态,提供了一种有效的证件姿态确定方式,另外,由于证件图像中的目标证件的角点位置易于获取,因此,通过角点位置确定证件姿态便于操作,易实现。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本说明书的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1为本说明书实施例第一方面提供的一种证件姿态确定方法的流程图;
图2为本说明书实施例示出的证件图像中的证件区域的角点示意图;
图3为本说明书实施例示出的目标证件的空间坐标系的示意图;
图4为本说明书实施例第二方面提供的证件姿态识别模型训练方法的流程图;
图5为本说明书实施例第三方面提供的证件姿态确定装置的示意图;
图6为本说明书实施例第四方面提供的证件姿态识别模型训练装置的示意图;
图7为本说明书实施例第五方面提供的服务器的示意图。
具体实施方式
为了更好的理解上述技术方案,下面通过附图以及具体实施例对本说明书实施例的技术方案做详细的说明,应当理解本说明书实施例以及实施例中的具体特征是对本说明书实施例技术方案的详细的说明,而不是对本说明书技术方案的限定,在不冲突的情况下,本说明书实施例以及实施例中的技术特征可以相互组合。
第一方面,本说明书实施例提供一种证件姿态确定方法,如图1所示,为本说明书实施例提供的证件姿态确定方法的流程图,该方法包括以下步骤:
步骤S11:对证件图像进行角点检测,确定出所述证件图像中证件区域的每个角点的角点位置,其中,所述证件区域为目标证件所在区域;
步骤S12:根据所述证件区域的每个角点的角点位置,确定出多维偏移参数,所述多维偏移参数用于表征所述目标证件沿所在空间坐标系的横轴方向、纵轴方向以及竖轴方向发生偏移的偏移程度;
步骤S13:基于所述多维偏移参数,确定所述目标证件的空间姿态。
本说明书实施例提供的证件姿态确定方法,可以应用于电子设备终端,也可以应用于服务器。例如,可以应用于能够采集证件图像的手机、电脑、证件采集装置中,也可以通过电子设备终端对证件进行扫描或拍照,将得到的图像发送给对应的服务器,使服务器对接收到的图像进行处理,以得到证件姿态,这里不做限定。
目标证件可以是用户的身份证、银行卡等,通过电子设备对目标证件进行扫描或拍摄,即可获得证件图像。证件图像中包含有证件区域,证件区域即为目标证件的图像信息所在区域,即证件区域中不包含背景图像,证件区域的区域边缘与目标证件图像信息的边缘重合。在进行证件扫描或拍摄时,为了保证得到的证件图像中的证件区域便于后续的姿态确定以及证件识别,可以通过在扫描或拍摄界面显示提示信息来规范证件区域在证件图像中的位置和大小。例如,可以在扫描或拍摄界面显示矩形框,并显示提示信息提示用户调整证件的位置,使得采集到的证件位于矩形框内;再或者,对于身份证等证件,可以在扫描或拍摄界面中显示矩形框,在矩形框内显示头像区域,以提示用户调整证件位置,使得采集到的证件位于矩形框内,且身份证上的头像位于头像区域处。当然,提示信息还可以包含其他信息,例如用于提示集证件的正面或反面的信息等,这里就不一一列举了。
在获得了证件图像之后,通过步骤S11,确定证件图像中证件区域的每个角点的角点位置。确定角点位置可以采用多种方式,例如通过Harris角点检测、CNN(ConvolutionalNeural Network,卷积神经网络)角点定位检测等。如图2所示,证件区域的四个角点分别为A、B、C、D,通过对证件图像进行角点检测,获得证件区域的四个角点的角点信息,具体的,角点位置可以是角点坐标等位置信息。
在进行目标证件的扫描或拍摄时,在理想情况下,是将目标证件放置在水平面上,且进行扫描或拍摄的摄像头的镜头与目标证件平行,这样,得到的证件图像中的证件区域为矩形,即互为对边的上边和下边长度相同,且互为对边的左边和下边长度相同。但是,由于目标证件放置的位置不同,或镜头与目标证件呈一定的角度,会导致证件图像中的证件区域相对于理想情况下拍摄出的证件区域出现偏移或倾斜,这样得到的证件图像中的证件区域就会出现变形,不是标准的矩形。本说明书实施例中,通过步骤S12来确定目标证件发生偏移的偏移参数。
目标证件的偏移是相对于目标证件所在空间坐标系来说的,空间坐标系包含有横轴方向(X轴方向)、纵轴方向(Y轴方向)以及竖直方向(Z轴方向),由于目标证件有可能出现各个方向上的倾斜或偏移,因此,本说明书实施例中,为了准确获取目标证件的证件姿态,需要确定出目标证件沿各个方向的多维偏移参数。多维偏移参数可以是用于表征目标证件相对于空间坐标系各个方向产生的偏移程度的偏移比例、偏移位移等参数。
在获取到多维偏移参数之后,进一步确定目标证件的空间姿态。目标证件的空间姿态,可以是目标证件与空间坐标系各方向的夹角,也可以是沿空间坐标系各方向的偏移角度,这里不做限定。确定目标证件的空间姿态可以根据实际需要来选择,例如,通过从预先构建的偏移参数与角度之间的映射关系中查找,或者通过仿真计算来确定等。在得到目标证件的空间姿态之后,可以根据姿态角度对证件图像进行图像校正或者证件防伪操作等。
可见,本说明书实施例提供的证件姿态确定方法,能够通过目标证件在证件图像中的角点位置,确定出目标证件沿各个方向的多维偏移参数,进而确定出目标证件的空间姿态,提供了一种有效的证件姿态确定方式,另外,由于证件图像中的证件区域的角点位置易于获取,因此,本说明书实施例提供的证件姿态确定方法易实现,且获取证件空间姿态的速度快,耗时短。
本说明书实施例中,在确定多维偏移参数时,可以采用以下方式:根据所述证件区域的每个角点的角点位置,确定出所述证件区域的每条边的长度;基于所述证件区域的每条边的长度,确定所述证件区域的任意两条边之间的长度比值,并基于任意两条边之间的长度比值,确定所述多维偏移参数
在具体实施过程中,如图2所示,在确定了证件区域的四个角点A、B、C、D的角点位置之后,可以根据四个角点的角点位置分别计算四条边AB、CD、AC、BD的长度,以角点位置为角点坐标为例,边长的计算方式可以采用欧式距离或其他方式,这里不做限定。应理解的是,证件区域的各边长度可以反映出目标证件在空间上的偏移状态。如图3所示,为目标证件建立空间坐标系,如果目标证件相对于X轴发生了旋转,则证件图像中证件区域的AB边和CD边的长度不相同;如果目标证件相对于Y轴发生了旋转,则证件图像中证件区域的AC边和BD边的长度不相同;如果目标证件相对于Z轴发生了旋转,则证件图像中证件区域的AC边与BD边之间的比例与目标证件的两边实际比例也会不同。
因此,本说明书实施例中,在基于每条边的长度确定多维偏移参数时,可以采用以下方式:所述证件区域包含有互为对边的第一边和第二边,以及互为对边的第三边和第四边;基于所述第一边的第一长度与所述第二边的第二长度之间的第一比值,确定所述目标证件沿所述横轴方向的第一偏移参数;基于所述第三边的第三长度与所述第四边的第四长度之间的第二比值,确定所述目标证件沿所述纵轴方向的第二偏移参数;基于所述第一边的第一长度与所述第三边的第三长度之间的第三比值,确定所述目标证件沿所述竖轴方向的第三偏移参数。
在具体实施过程中,第一边和第二边可以分别对应图2中的AB边和CD边,第三边和第四边可以分别对应图2中的AC边和BD边,或者,第一边和第二边分别对应图2中的AC边和BD边,第三边和第四边可以分别对应图2中的AB边和CD边,这里不做限定。为了便于说明,以第一边对应AB边,第二边对应CD边,第三边对应AC边,第四边对应BD边为例。第一边的第一长度为LAB,第二边的第二长度为LCD,第三边的第三长度为LAC,第四边的第四长度为LBD。那么,第一比值为LAB/LCD,第二比值为LAC/LBD,第三比值为LAB/LAC
本说明书实施例中,可以直接将计算得到第一比值作为第一偏移参数,将第二比值作为第二偏移参数,将第三比值作为第三偏移参数,还可以对各个比值进行处理,得到对应的偏移参数。在具体实施过程中,可以采用以下方式对各个比值进行处理:在证件与边长比值的预设对应关系中,确定出与所述目标证件对应的第一对边边长比值、第二对边边长比值以及相邻两边边长比值;基于所述第一对边边长比值对所述第一比值进行归一化处理,确定出所述第一偏移参数;基于所述第二对边边长比值对所述第二比值进行归一化处理,确定出所述第二偏移参数;基于所述相邻两边边长比值对所述第三比值进行归一化处理,确定出所述第三偏移参数。
应说明的是,证件与边长比值的预设对应关系,是指证件与证件实际的两边边长比值之间的对应关系。举例来讲,证件与边长比值的预设对应关系可以为证件名称、证件类型、证件的第一对边边长比值、证件的第二对边边长比值、证件的相邻两边边长比值之间的对应关系。基于证件名称或证件类型,可以确定出对应的各个边长比值。
通常来讲,证件的形状为矩形,因此,证件包含的两组对边中,每组对边包含的两条对边边长相等,即,矩形证件的第一对边边长比值以及第二对边边长比值均为1。证件相邻两边边长比值根据各类证件的尺寸不同,可能存在差异,例如,身份证的相邻两边边长比值为1.58。当然,如果证件形状不为矩形时,可以依次获取该证件的第一对边边长比值、第二对边边长比值、相邻两边边长比值,并且将上述边长比值与该证件进行关联。进一步的,如果证件形状为其他多边形时,可以根据需要确定每相邻两边的边长比值,并与证件进行关联,这里不做限定。
证件与边长比值的预设对应关系可以保存在电子设备或服务器中,这样,在对目标证件进行扫描或拍摄时,可以根据目标证件的名称或类型在上述对应关系中确定出目标证件的第一对边边长比值、第二对边边长比值以及相邻两边边长比值。进一步的,根据目标证件的第一对边边长比值、第二对边边长比值以及相邻两边边长比值对上述第一比值、第二比值以及第三比值进行归一化处理,并将归一化处理后的结果作为对应的偏移参数。以目标证件的第一对边边长比值、第二对边边长比值以及相邻两边边长比值为1、1、1.58为例,得到的第一偏移参数为LAB/LCD-1,第二偏移参数为LAC/LBD-1,第三偏移为LAB/LAC-1。本说明书实施例中,目标证件的第一对边边长比值、第二对边边长比值以及相邻两边边长比值能够反映目标证件无偏移时的状态,即目标证件与X轴、Y轴、Z轴之间不存在偏移夹角。因此,归一化处理后得到的偏移参数能够表征目标证件相对于无偏移状态,在三个轴向上的偏移量。应理解的是,对于对边相等的证件来说,归一化后得到的偏移参数的取值范围为[-1,1],如果超出这个范围,则认为获得的证件图像不可用,可以提示用户重新扫描或拍摄。
进一步的,在获得了偏移参数之后,基于偏移参数来确定目标证件的空间姿态,本说明书实施例中,可以采用以下来确定目标证件的空间姿态:基于偏移参数与姿态角度的预设映射关系,确定出所述目标证件对应的姿态角度,所述姿态角度包括所述目标证件的俯仰角、偏航角以及翻滚角。
在具体实施过程中,偏移参数与姿态角度的预设映射关系可以根据实际需要来进行设定,例如,本说明书实施例中的映射关系,可以包含有第一偏移参数与俯仰角的映射关系、第二偏移参数与偏航角的映射关系、以及第三偏移参数与翻滚角的映射关系。其中,俯仰角(pitch)为围绕X轴旋转形成的角度,偏航角(yaw)为围绕Y轴旋转形成的角度,翻滚角(roll)为围绕Z轴旋转形成的角度。
偏移参数与姿态角度的预设映射关系可以通过统计来获得,例如,已知目标证件当前姿态相对于各个方向的偏移角度,再测量当前姿态对应的证件图像中证件区域的各个边长,根据两边之间的比值确定出对应的偏移参数,将偏移参数与姿态角度(即偏移角度)进行关联,这样,通过对偏移角度的遍历,得到偏移参数与姿态角度的预设映射关系。
另外,所述偏移参数与姿态角度的预设映射关系为通过对目标证件的基准图像进行三维仿射变换构建的映射关系,其中,所述基准图像为所述目标证件相对于所述空间坐标系无偏移的图像。本说明书实施例中,基准图像可以为理想状态下获取的证件图像,即基准图像中的证件区域相对于各个方向均不存在偏移。三维仿射变换包括将证件图像进行空间上的平移、旋转、缩放等变换。在具体实施过程中,可以将基准图像通过仿射变换,得到变化任意角度后的图像,记录下沿空间坐标系的各个方向变换的角度,并获取变换后的图像中证件区域的相邻两边以及对边之间的边长比值,计算对应的偏移参数,并将偏移参数与记录的角度进行关联,以得到偏移参数与姿态角度的预设映射关系。
当然,除了上述方式,还可以通过其他方式来确定目标证件的空间姿态,例如,再获取到证件区域的每个角点的角点位置之后,可以根据每个角点的角点位置,进行仿射变换,将证件图像中的证件区域映射到一个标准图像中,该标准图像的尺寸为固定的,且该标准图像为相对于空间坐标系的各个方向无偏移的图像,然后基于旋转矩阵对标准图像进行旋转,以得到与目标证件相同的姿态,并记录下旋转角度,该旋转角度就可以作为目标证件的证件姿态。
进一步的,本说明书实施例中的方案,在得到姿态角度之后,可以根据姿态角度对证件图像中的证件区域进行校正,便于后续的证件识别或证件防伪检测。以证件防伪检测为例,有些证件上存在防伪标志,防伪标志在不同角度下会产生呈现不同的颜色,例如在第一角度呈现第一颜色,在第二角度呈现第二颜色,因此,可以根据证件姿态角度与防伪标志颜色的对应关系来进行证件防伪。
另外,本说明书实施例中,还可以通过得到的姿态角度对证件图像进行打标,用来训练证件姿态识别模型。即,所述确定所述目标证件的姿态角度之后,所述方法还包括:基于所述姿态角度对所述目标图像进行角度标注;基于角度标注后的目标图像,构建训练样本集合,并基于所述训练样本集合对初始的证件姿态识别模型进行训练,得到已训练的证件姿态识别模型,其中,所述已训练的证件姿态识别模型用于对输入图像进行证件姿态识别,输出对应的证件姿态角度。
在具体实施过程中,通过上述方法得到证件图像对应的目标证件的姿态角度,使用姿态角度对证件图像进行角度标注,即打标操作,将角度标注后的证件图像作为训练样本。应理解的是,可以通过这种方法对大量的证件图像进行角度标注,以得到一定数量的训练样本集合,来对构建好的初始证件姿态识别模型进行训练。初始的证件姿态识别模型可以根据实际需要进行选择,例如,采用CNN模型、RNN(Recurrent Neural Network,循环神经网络)模型等。初始的证件姿态识别模型的输入可以为待姿态识别的证件图像,输出为输入图像对应的证件的姿态角度。在得到训练好的证件姿态角度模型之后,可以将训练好的证件姿态识别模型应用到各种场景中,例如证件姿态检测、证件姿态校正等。
第二方面,基于同一发明构思,本说明书实施例提供一种证件姿态识别模型训练方法,请参考图4,该方法包括:
步骤S41:获取多幅证件图像;
步骤S42:根据第一方面提供的证件姿态确定方法,确定所述多幅证件图像中每幅证件图像对应的证件空间姿态;
步骤S43:基于所述每幅证件图像对应的空间姿态,对所述每幅证件图像进行证件姿态标注;
步骤S44:基于证件姿态标注后的每幅证件图像,对初始的证件姿态识别模型进行训练,得到已训练的证件姿态识别模型,所述已训练的证件姿态识别模型用于对输入的证件图像进行证件姿态识别,并输出对应的空间姿态。
本说明书实施例中,多幅证件图像可以是通过对各种证件进行扫描或拍摄获得的图像,也可以是来源与网络或各类数据库中的图像。通过本说明书实施例第一方面提供的证件姿态确定方法,对每幅证件图像进行处理,获得每幅证件图像的证件空间姿态,并将证件空间姿态标注在对应的证件图像上,以形成模型训练样本。以证件空间姿态为证件姿态角度举例,可以将证件沿空间坐标系发生偏移的俯仰角、偏航角以及翻滚角标注在对应的证件图像中。
初始的证件姿态识别模型可以根据实际需要进行选择,例如采用CNN模型、RNN模型等,网络模型的层数以及每层的神经元数可以根据实际需要进行设置,这里不做限定。对于初始的证件姿态识别模型来说,输入为证件图像,输出为证件图像对应的空间姿态,如俯仰角、偏航角以及翻滚角。在训练过程中,可以根据证件图像标注的空间姿态来对模型参数进行不断的调整,直到模型输出的正确率达到预设值,或者模型的训练次数达到预设次数,得到已训练好的证件姿态角度模型。已训练的证件姿态识别模型应用到各种场景中,例如证件姿态检测、证件姿态校正、证件防伪等场景中。
关于上述方法,其中各个步骤的具体实现可以参考本说明书实施例第一方面提供的证件姿态确定方法中的细描述,此处将不做详细阐述说明。
第三方面,基于同一发明构思,本说明书实施例提供一种证件姿态确定装置,请参考图5,该装置包括:
角点确定模块51,用于对证件图像进行角点检测,确定出所述证件图像中证件区域的每个角点的角点位置,其中,所述证件区域为目标证件所在区域;
偏移参数确定模块52,用于根据所述证件区域的每个角点的角点位置,确定出多维偏移参数,所述多维偏移参数用于表征所述目标证件沿所在空间坐标系的横轴方向、纵轴方向以及竖轴方向发生偏移的偏移程度;
姿态确定模块53,用于基于所述多维偏移参数,确定所述目标证件的空间姿态。
在一种可选实现方式中,偏移参数确定模块52,用于:
根据所述证件区域的每个角点的角点位置,确定出所述证件区域的每条边的长度;
基于所述证件区域的每条边的长度,确定所述证件区域的任意两条边之间的长度比值,并基于任意两条边之间的长度比值,确定所述多维偏移参数。
在一种可选实现方式中,所述证件区域包含有互为对边的第一边和第二边,以及互为对边的第三边和第四边,偏移参数确定模块52,用于:
基于所述第一边的第一长度与所述第二边的第二长度之间的第一比值,确定所述目标证件沿所述横轴方向的第一偏移参数;
基于所述第三边的第三长度与所述第四边的第四长度之间的第二比值,确定所述目标证件沿所述纵轴方向的第二偏移参数;
基于所述第一边的第一长度与所述第三边的第三长度之间的第三比值,确定所述目标证件沿所述竖轴方向的第三偏移参数。
在一种可选实现方式中,偏移参数确定模块52,用于:
在证件与边长比值的预设对应关系中,确定出与所述目标证件对应的第一对边边长比值、第二对边边长比值以及相邻两边边长比值;
基于所述第一对边边长比值对所述第一比值进行归一化处理,确定出所述第一偏移参数;
基于所述第二对边边长比值对所述第二比值进行归一化处理,确定出所述第二偏移参数;
基于所述相邻两边边长比值对所述第三比值进行归一化处理,确定出所述第三偏移参数。
在一种可选实现方式中,姿态确定模块53,用于:
基于偏移参数与姿态角度的预设映射关系,确定出所述目标证件对应的姿态角度,所述姿态角度包括所述目标证件的俯仰角、偏航角以及翻滚角。
在一种可选实现方式中,所述偏移参数与姿态角度的预设映射关系为通过对所述目标证件的基准图像进行三维仿射变换构建的映射关系,其中,所述基准图像为所述目标证件相对于所述空间坐标系无偏移的图像。
在一种可选实现方式中,所述装置还包括:
角度标注模块,用于基于所述姿态角度对所述证件图像进行角度标注;
模型训练模块,用于基于角度标注后的证件图像,构建训练样本集合,并基于所述训练样本集合对预设的证件姿态识别模型进行训练,得到已训练的证件姿态识别模型,其中,所述已训练的证件姿态识别模型用于对输入图像进行证件姿态识别,输出对应的证件姿态角度。
关于上述装置,其中各个模块的具体功能已经在本说明书实施例提供的证件姿态确定方法的实施例中进行了详细描述,此处将不做详细阐述说明。
第四方面,基于同一发明构思,本说明书实施例提供一种证件姿态识别模型训练装置,请参考图6,该装置包括:
获取模块61,用于获取多幅证件图像;
角度确定模块62,用于根据第一方面提供的证件姿态确定方法,确定所述多幅证件图像中每幅证件图像对应的证件空间姿态;
角度标注模块63,用于基于所述每幅证件图像对应的证件空间姿态,对所述每幅证件图像进行证件姿态标注;
模型训练模块64,用于基于证件姿态标注后的每幅证件图像,对初始的证件姿态识别模型进行训练,得到已训练的证件姿态识别模型,所述已训练的证件姿态识别模型用于对输入的证件图像进行证件姿态识别,并输出对应的证件空间姿态。
关于上述装置,其中各个模块的具体功能已经在本说明书实施例提供的证件姿态确定方法以及证件姿态识别模型训练方法的实施例中进行了详细描述,此处将不做详细阐述说明。
第五方面,基于与前述实施例中证件姿态确定方法以及证件姿态识别模型训练方法同样的发明构思,本说明书实施例还提供一种服务器,如图7所示,包括存储器404、处理器402及存储在存储器404上并可在处理器402上运行的计算机程序,所述处理器402执行所述程序时实现前文所述证件姿态确定方法以及证件姿态识别模型训练方法中的任一方法的步骤。
其中,在图7中,总线架构(用总线400来代表),总线400可以包括任意数量的互联的总线和桥,总线400将包括由处理器402代表的一个或多个处理器和存储器404代表的存储器的各种电路链接在一起。总线400还可以将诸如***设备、稳压器和功率管理电路等之类的各种其他电路链接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口406在总线400和接收器401和发送器403之间提供接口。接收器401和发送器403可以是同一个元件,即收发机,提供用于在传输介质上与各种其他装置通信的单元。处理器402负责管理总线400和通常的处理,而存储器404可以被用于存储处理器402在执行操作时所使用的数据。
第六方面,基于与前述实施例中基于证件姿态确定方法以及证件姿态识别模型训练方法的发明构思,本说明书实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现前文所述基于证件姿态确定方法以及证件姿态识别模型训练方法中的任一方法的步骤。
本说明书是参照根据本说明书实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的设备。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令设备的制造品,该指令设备实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本说明书的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本说明书范围的所有变更和修改。
显然,本领域的技术人员可以对本说明书进行各种改动和变型而不脱离本说明书的精神和范围。这样,倘若本说明书的这些修改和变型属于本说明书权利要求及其等同技术的范围之内,则本说明书也意图包含这些改动和变型在内。

Claims (18)

1.一种证件姿态确定方法,所述方法包括:
对证件图像进行角点检测,确定出所述证件图像中证件区域的每个角点的角点位置,其中,所述证件区域为目标证件所在区域;
根据所述证件区域的每个角点的角点位置,确定出多维偏移参数,所述多维偏移参数用于表征所述目标证件沿所在空间坐标系的横轴方向、纵轴方向以及竖轴方向发生偏移的偏移程度;
基于所述多维偏移参数,确定所述目标证件的空间姿态。
2.根据权利要求1所述的方法,所述根据所述证件区域的每个角点的角点位置,确定出多维偏移参数,包括:
根据所述证件区域的每个角点的角点位置,确定出所述证件区域的每条边的长度;
基于所述证件区域的每条边的长度,确定所述证件区域的任意两条边之间的长度比值,并基于任意两条边之间的长度比值,确定所述多维偏移参数。
3.根据权利要求2所述的方法,所述证件区域包含有互为对边的第一边和第二边,以及互为对边的第三边和第四边,所述基于所述证件区域的每条边的长度,确定所述证件区域的任意两条边之间的长度比值,并基于任意两条边之间的长度比值,确定所述多维偏移参数,包括:
基于所述第一边的第一长度与所述第二边的第二长度之间的第一比值,确定所述目标证件沿所述横轴方向的第一偏移参数;
基于所述第三边的第三长度与所述第四边的第四长度之间的第二比值,确定所述目标证件沿所述纵轴方向的第二偏移参数;
基于所述第一边的第一长度与所述第三边的第三长度之间的第三比值,确定所述目标证件沿所述竖轴方向的第三偏移参数。
4.根据权利要求3所述的方法,所述基于任意两条边之间的长度比值,确定所述多维偏移参数,包括:
在证件与边长比值的预设对应关系中,确定出与所述目标证件对应的第一对边边长比值、第二对边边长比值以及相邻两边边长比值;
基于所述第一对边边长比值对所述第一比值进行归一化处理,确定出所述第一偏移参数;
基于所述第二对边边长比值对所述第二比值进行归一化处理,确定出所述第二偏移参数;
基于所述相邻两边边长比值对所述第三比值进行归一化处理,确定出所述第三偏移参数。
5.根据权利要求1所述的方法,所述基于多维偏移参数,确定所述目标证件的空间姿态,包括:
基于偏移参数与姿态角度的预设映射关系,确定出所述目标证件对应的姿态角度,所述姿态角度包括所述目标证件的俯仰角、偏航角以及翻滚角。
6.根据权利要求5所述的方法,所述偏移参数与姿态角度的预设映射关系为通过对所述目标证件的基准图像进行三维仿射变换构建的映射关系,其中,所述基准图像为所述目标证件相对于所述空间坐标系无偏移的图像。
7.根据权利要求5所述的方法,所述确定所述目标证件的空间姿态之后,所述方法还包括:
基于所述姿态角度对所述证件图像进行角度标注;
基于角度标注后的证件图像,构建训练样本集合,并基于所述训练样本集合对初始的证件姿态识别模型进行训练,得到已训练的证件姿态识别模型,其中,所述已训练的证件姿态识别模型用于对输入图像进行证件姿态识别,输出对应的证件姿态角度。
8.一种证件姿态识别模型训练方法,所述方法包括:
获取多幅证件图像;
根据权利要求1-6中任一项所述的证件姿态确定方法,确定所述多幅证件图像中每幅证件图像对应的证件空间姿态;
基于所述每幅证件图像对应的证件空间姿态,对所述每幅证件图像进行证件姿态标注;
基于证件姿态标注后的每幅证件图像,对初始的证件姿态识别模型进行训练,得到已训练的证件姿态识别模型,所述已训练的证件姿态识别模型用于对输入的证件图像进行证件姿态识别,并输出对应的证件空间姿态。
9.一种证件姿态确定装置,所述装置包括:
角点确定模块,用于对证件图像进行角点检测,确定出所述证件图像中证件区域的每个角点的角点位置,其中,所述证件区域为目标证件所在区域;
偏移参数确定模块,用于根据所述证件区域的每个角点的角点位置,确定出多维偏移参数,所述多维偏移参数用于表征所述目标证件沿所在空间坐标系的横轴方向、纵轴方向以及竖轴方向发生偏移的偏移程度;
姿态确定模块,用于基于所述多维偏移参数,确定所述目标证件的空间姿态。
10.根据权利要求9所述的装置,所述偏移参数确定模块,用于:
根据所述证件区域的每个角点的角点位置,确定出所述证件区域的每条边的长度;
基于所述证件区域的每条边的长度,确定所述证件区域的任意两条边之间的长度比值,并基于任意两条边之间的长度比值,确定所述多维偏移参数。
11.根据权利要求10所述的装置,所述证件区域包含有互为对边的第一边和第二边,以及互为对边的第三边和第四边,所述偏移参数确定模块,用于:
基于所述第一边的第一长度与所述第二边的第二长度之间的第一比值,确定所述目标证件沿所述横轴方向的第一偏移参数;
基于所述第三边的第三长度与所述第四边的第四长度之间的第二比值,确定所述目标证件沿所述纵轴方向的第二偏移参数;
基于所述第一边的第一长度与所述第三边的第三长度之间的第三比值,确定所述目标证件沿所述竖轴方向的第三偏移参数。
12.根据权利要求11所述的装置,所述偏移参数确定模块,用于:
在证件与边长比值的预设对应关系中,确定出与所述目标证件对应的第一对边边长比值、第二对边边长比值以及相邻两边边长比值;
基于所述第一对边边长比值对所述第一比值进行归一化处理,确定出所述第一偏移参数;
基于所述第二对边边长比值对所述第二比值进行归一化处理,确定出所述第二偏移参数;
基于所述相邻两边边长比值对所述第三比值进行归一化处理,确定出所述第三偏移参数。
13.根据权利要求9所述的装置,所述姿态确定模块,用于:
基于偏移参数与姿态角度的预设映射关系,确定出所述目标证件对应的姿态角度,所述姿态角度包括所述目标证件的俯仰角、偏航角以及翻滚角。
14.根据权利要求13所述的装置,所述偏移参数与姿态角度的预设映射关系为通过对所述目标证件的基准图像进行三维仿射变换构建的映射关系,其中,所述基准图像为所述目标证件相对于所述空间坐标系无偏移的图像。
15.根据权利要求13所述的装置,所述装置还包括:
角度标注模块,用于基于所述姿态角度对所述证件图像进行角度标注;
模型训练模块,用于基于角度标注后的证件图像,构建训练样本集合,并基于所述训练样本集合对预设的证件姿态识别模型进行训练,得到已训练的证件姿态识别模型,其中,所述已训练的证件姿态识别模型用于对输入图像进行证件姿态识别,输出对应的证件姿态角度。
16.一种证件姿态识别模型训练装置,所述装置包括:
获取模块,用于获取多幅证件图像;
角度确定模块,用于根据权利要求1-6中任一项所述的证件姿态确定方法,确定所述多幅证件图像中每幅证件图像对应的证件空间姿态;
角度标注模块,用于基于所述每幅证件图像对应的证件空间姿态,对所述每幅证件图像进行证件姿态标注;
模型训练模块,用于基于证件姿态标注后的每幅证件图像,对初始的证件姿态识别模型进行训练,得到已训练的证件姿态识别模型,所述已训练的证件姿态识别模型用于对输入的证件图像进行证件姿态识别,并输出对应的证件空间姿态。
17.一种服务器,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现权利要求1-8任一项所述方法的步骤。
18.一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现权利要求1-8任一项所述方法的步骤。
CN201911249237.2A 2019-12-09 2019-12-09 证件姿态确定方法、模型训练方法、装置、服务器及介质 Pending CN112950528A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911249237.2A CN112950528A (zh) 2019-12-09 2019-12-09 证件姿态确定方法、模型训练方法、装置、服务器及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911249237.2A CN112950528A (zh) 2019-12-09 2019-12-09 证件姿态确定方法、模型训练方法、装置、服务器及介质

Publications (1)

Publication Number Publication Date
CN112950528A true CN112950528A (zh) 2021-06-11

Family

ID=76225142

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911249237.2A Pending CN112950528A (zh) 2019-12-09 2019-12-09 证件姿态确定方法、模型训练方法、装置、服务器及介质

Country Status (1)

Country Link
CN (1) CN112950528A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113743396A (zh) * 2021-08-31 2021-12-03 支付宝(杭州)信息技术有限公司 在证件识别过程中识别注入攻击的方法及装置
CN114897999A (zh) * 2022-04-29 2022-08-12 美的集团(上海)有限公司 物***姿识别方法、电子设备、存储介质和程序产品
CN117237682A (zh) * 2023-10-17 2023-12-15 支付宝(杭州)信息技术有限公司 一种证件验证方法、装置、存储介质及电子设备

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113743396A (zh) * 2021-08-31 2021-12-03 支付宝(杭州)信息技术有限公司 在证件识别过程中识别注入攻击的方法及装置
CN113743396B (zh) * 2021-08-31 2023-11-10 支付宝(杭州)信息技术有限公司 在证件识别过程中识别注入攻击的方法及装置
CN114897999A (zh) * 2022-04-29 2022-08-12 美的集团(上海)有限公司 物***姿识别方法、电子设备、存储介质和程序产品
CN114897999B (zh) * 2022-04-29 2023-12-08 美的集团(上海)有限公司 物***姿识别方法、电子设备、存储介质和程序产品
CN117237682A (zh) * 2023-10-17 2023-12-15 支付宝(杭州)信息技术有限公司 一种证件验证方法、装置、存储介质及电子设备

Similar Documents

Publication Publication Date Title
CN109754426B (zh) 一种用于摄像标定参数验证的方法、***和装置
US10726580B2 (en) Method and device for calibration
CN111127422A (zh) 图像标注方法、装置、***及主机
CN108701234A (zh) 车牌识别方法及云***
JP6688277B2 (ja) プログラム、学習処理方法、学習モデル、データ構造、学習装置、および物体認識装置
CN112950528A (zh) 证件姿态确定方法、模型训练方法、装置、服务器及介质
CN111145271B (zh) 相机参数的精确度的确定方法、装置、存储介质及终端
CN106570907B (zh) 一种相机标定方法及装置
CN111860527A (zh) 图像校正方法、图像校正装置、计算机设备及存储介质
CN113329179B (zh) 拍摄对位方法、装置、设备及存储介质
CN113129383B (zh) 手眼标定方法、装置、通信设备及存储介质
CN111667398A (zh) 图像处理方法、装置和计算机可读存储介质
CN112734832B (zh) 一种即时获得线上物体实际尺寸测量方法
CN107610097A (zh) 仪表定位方法、装置和终端设备
CN111681186A (zh) 图像处理方法、装置、电子设备及可读存储介质
CN110443245A (zh) 一种非限制场景下的车牌区域的定位方法、装置及设备
Dinh et al. Rectification using different types of cameras attached to a vehicle
CN115937003A (zh) 图像处理方法、装置、终端设备和可读存储介质
CN109949249B (zh) 一种柱面图像校正方法及***
US20220084291A1 (en) Augmented reality display method and device for chip structure, and readable storage medium
CN115187612A (zh) 一种基于机器视觉的平面面积测量方法、装置及***
CN114998447A (zh) 多目视觉标定方法及***
CN111260574B (zh) 一种***照片矫正的方法、终端及计算机可读存储介质
CN115965697A (zh) 基于沙姆定律的投影仪标定方法、标定***及装置
CN112365399B (zh) 基于深度学习的风机叶片图像全景拼接方法和***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination