CN116129456B

CN116129456B - 一种产权权属信息识别录入方法及***

Info

Publication number: CN116129456B
Application number: CN202310096347.XA
Authority: CN
Inventors: 刘润东; 陈瑞波; 潘婵玲; 梅树红; 耿栋; 刘清; 覃苑
Original assignee: Guangxi Remote Sensing Spatial Information Technology Co ltd; Guangxi Institute Of Natural Resources Remote Sensing
Current assignee: Guangxi Remote Sensing Spatial Information Technology Co ltd; Guangxi Institute Of Natural Resources Remote Sensing
Priority date: 2023-02-09
Filing date: 2023-02-09
Publication date: 2023-07-25
Anticipated expiration: 2043-02-09
Also published as: CN116129456A

Abstract

本发明公开了一种产权权属信息识别录入方法及***，属于图像识别技术领域，该方法包括如下步骤：首先获取证件图像集，对证件区域和文字区域分别进行分割成二分类标签，制作分割训练数据集；然后设计双分支U‑Net分割网络，并使用损失函数计算分割预测结果和对应标签的损失，在Pytorch框架中进行训练；再将待识别的证件图形输入双分支U‑Net分割网络获取证件区域分割预测结果和文字区域预测结果，结合分割预测结果中的角点对图形进行校正；最后基于分割结果结合CRNN+CTC文字识别模型对权属人信息进行提取，并将权属人证件信息录入***。本发明能够提高复杂拍摄环境下证件信息的识别效率和识别准确率。

Description

一种产权权属信息识别录入方法及***

技术领域

本发明属于图像识别技术领域，具体涉及一种产权权属信息识别录入方法及***。

背景技术

自然资源和不动产登记关系国计民生，社会影响巨大。近年，我国积极推进相关工作，通过调查明晰产权，使权源信息更完整准确。为维护国民合法权益，在自然资源和不动产登记等工作的外业调查中，产权权属信息快速录入成为提高工作效率的关键环节，为解决这一问题，需要开发快速准确的权属人信息识别录入***。传统的权属信息是通过人工识别手动输入的方法获得，是一种较为耗时且准确率受操作人员状态所影响的方法。

目前图像识别领域对权属人证件信息提取识别研究应用相对较少，现有研究多集中于对理想情况下证件的信息提取，如证件必须位于规定框线内，拍摄视角不能发生较大的变动，且对光线要求也不低，这样对拍摄者的拍照技巧也有一定的要求。而产权属性录入时证件信息识别精度较低主要有以下两个方面的影响：一方面，权属人大多没有较为熟练的拍摄技巧，拍摄时由于光照、角度、背景和对焦等因素无法控制，导致对权属信息的识别变得困难；另一方面，部分证件上有着特殊的花纹，提高了识别的难度，降低了识别的准确性，导致识别的结果不理想。鉴于权属信息录入时效性和有限人力资源，建立高效智能证件信息提取模型对于提高权属信息入库效率、降低人工时间成本具有重要意义。

发明内容

本发明旨在解决上述背景技术中提出的技术问题，提供了一种权属人证件信息识别录入方法，能够提高复杂拍摄环境下证件信息的识别效率和识别准确率。

本发明的目的是通过以下技术方案实现：

一种产权权属信息识别录入方法，该方法包括如下步骤：

步骤1、获取证件图像集，将证件图像集进行标准化预处理以制作成分割训练数据集；

步骤2、构建双分支U-Net分割网络，将训练数据集输入双分支U-Net分割网络中进行训练验证以获取关于证件和文字预测结果的分割网络模型，并对分割网络模型进行优化调整训练；

步骤3、将待识别的证件图像输入训练好的分割网络模型中，获取证件区域分割预测结果和文字区域预测结果，分别对证件区域分割预测结果和文字区域预测结果进行后处理操作，再进行矫正操作，以获取矫正后的证件图像以及文字检测框；

步骤4、制作文字识别数据集，建立CRNN+CTC文字识别模型，根据文字检测框提取出证件中的文字，输入CRNN+CTC文字识别模型，得到文字识别结果，再根据文字检测框坐标确定该文字对应的信息，获得权属人证件信息；

步骤5、从所述权属人证件信息中提取各个属性信息，自动录入预设模板表格中对应各个属性信息的位置。

作为本发明的进一步改进，所述步骤1中，将证件图像集进行标准化预处理以制作成分割训练数据集的具体步骤如下：

首先，***区域分割二分类标签及文字分割二分类标签，其中，文字分割二分类标签只勾画证件中的文字，忽略背景中的干扰字样；

然后，将证件图像集中的证件原始照片、证件区域分割二分类标签及文字分割二分类标签保持长宽比并缩放为固定尺寸，制作成分割训练数据集，分割训练数据集包括证件分割训练数据集和文字分割训练数据集。

作为本发明的进一步改进，所述步骤2中，对分割网络模型参数进行优化训练的具体方法为：

根据证件和文字预测结果对应标签的损失进行计算得到分割网络模型的整体损失函数，整体损失函数为：loss＝loss_证件+γ*loss_文字，其中，γ为权重；通过所述整体损失函数对分割网络模型的参数进行优化更新，直至所述整体损失函数符合预设标准，完成对所述分割网络模型的优化训练。

作为本发明的进一步改进，所述步骤3中，对证件区域分割预测结果和文字区域预测结果进行后处理操作的具体方法为：

对证件分割预测结果，使用OpenCV进行后处理，将证件分割预测结果使用先腐蚀后膨胀的形态学操作优化分割边界并进行空洞填补，获取证件分割区域轮廓，并根据轮廓大小、长宽比排除误分割区域，获得处理后的证件分割区域，并计算出证件分割区域的四个角点坐标；

对文字分割预测结果，同样的，使用OpenCV进行后处理，使用先腐蚀后膨胀的形态学操作优化分割边界并进行空洞填补，获取文字检测框轮廓，利用文字检测框的几何特征滤除冗余检测框，获得处理后的文字检测框，并计算出文字检测框的四个角点坐标，得到文字检测框的轮廓大小和坐标位置；

作为本发明的进一步改进，所述步骤3中，矫正操作的具体方法为：根据文字检测框的坐标位置和轮廓大小，以证件先验知识为依据，对证件分割区域的四个角点坐标进行排序，并根据排序后的四个证件角点坐标使用OpenCV进行透视变换，得到矫正后的证件图像以及文字检测框。

作为本发明的进一步改进，所述权属人证件信息包括权属人姓名、性别、身份证号、地址、民族的属性信息。

本发明还提供一种产权权属信息识别录入***，包括分割训练数据集制作模块、分割网络训练模块、分割结果获取及矫正模块、证件信息识别及提取模块和信息录入模块；

所述分割训练数据集制作模块，用于将证件图像集进行标准化预处理以制作成分割训练数据集；

所述分割网络训练模块，用于将训练数据集输入双分支U-Net分割网络中进行训练验证，优化分割网络参数，获取用于证件和文字分割预测的神经网络模型；

所述分割结果获取及矫正模块，用于将待识别的证件图像输入训练好的分割网络模型中，获取证件区域分割预测结果和文字区域预测结果，分别对证件区域分割预测结果和文字区域预测结果进行后处理操作，再进行矫正操作，以获取矫正后的证件图像以及文字检测框；

所述证件信息识别及提取模块，用于制作文字识别数据集，建立文字识别模型，根据文字检测框提取出证件中的文字，输入文字识别模型，得到文字识别结果，再根据文字检测框坐标确定该文字对应的信息，获得权属人证件信息；

所述信息录入模块，用于从所述权属人证件信息中提取各个属性信息，自动录入预设模板表格中对应各个属性信息的位置。

与现有技术相比，本发明具有以下有益效果：

1.本发明的产权权属人证件信息识别录入方法具有识别速度快，识别准确率高的特点。首先获取待处理的证件原始图像；之后针对证件区域和文字区域分别制作二分类分割标签，***分割训练数据集和文字分割训练数据集；然后设计双分支U-Net分割网络，并使用损失函数计算分割预测结果和对应标签的损失，在Pytorch框架中进行训练；再将待识别的证件图形输入双分支U-Net分割网络获取证件区域分割预测结果和文字区域预测结果，结合分割预测结果中的角点对图形进行校正；最后基于文字分割结果使用CRNN+CTC文字识别模型对权属人身份信息进行提取。该方法根据权属人证件的特点使用了双分支U-Net分割网络对权属人证件图形进行分割操作，使用CRNN+CTC文字识别模型对证件信息进行提取，解决了普通用户使用手机拍照时，因照片受到背景、光照、噪声、模糊等因素影响导致传统方法识别效果不理想的问题，提高权属人证件信息的识别效率，还解决了人工录入证件信息效率低的问题。

2.本发明通过构建双分支U-Net分割网络，将其运用于证件图像分割问题上，以证件图像集制作分割数据集进行训练、验证、测试，得到识别准确率较高的分割网络模型。

3.本发明对证件区域分割预测结果和文字区域预测结果分别进行后处理操作，能够提高图像的容差性，保证证件识别的准确度。预测结果通过先腐蚀后膨胀的形态学操作，使预测结果连通为一个类似矩形区，腐蚀能够消除连通域的边界点以及细小区域，使边界内缩，而膨胀则将与物体接触的所有背景点合并到该物体中，使边界向外部扩张。分割结果通过腐蚀操作，可以去除离线的细小误分割噪点，平滑分割边界，通过膨胀操作将因腐蚀而内缩的分割结果外扩还原。通过后处理操作够有效解决因光照强度不均匀而影响U-Net分割网络对证件图像的证件区域和文字区域的识别定位以及分割精度的问题。

4.本发明的产权权属人证件信息识别录入***具有泛用性好，识别快，识别准确率高的特点，本***能够将证件信息从背景复杂、光照不均、拍摄模糊等情况下识别出来，解决了普通用户使用手机拍照时，因照片受到背景、光照、噪声、模糊等因素影响导致识别效果不理想的问题。

附图说明

图1是本发明一种产权权属人证件信息识别录入方法的具体流程图；

图2是本发明双分支U-Net分割网络的结构示意图；

图3是本发明实施例中待识别的身份证图像；

图4是本发明实施例中矫正操作后的身份证图像,；

图5是本发明一种产权权属人证件信息识别录入***的结构示意图；

具体实施方式

下面结合附图与实施例对本发明作进一步说明。需要说明的是，本发明的具体实施例只是为了能更清楚的描述技术方案，而不能作为本发明保护范围的一种限制。

请参阅图1-图4，一种产权权属人证件信息识别录入方法，该方法包括如下步骤：

步骤1、获取证件图像集，将证件图像集进行标准化预处理以制作成分割训练数据集；以作为训练阶段的输入，具体步骤如下：

然后，将证件图像集中的证件原始照片、证件区域分割二分类标签及文字分割二分类标签保持长宽比并缩放为固定尺寸，制作成分割训练数据集，分割训练数据集包括证件分割训练数据集和文字分割训练数据集；

步骤2、构建双分支U-Net分割网络，将训练数据集输入双分支U-Net分割网络中进行训练验证，优化分割网络参数，获取用于证件和文字分割预测的神经网络模型，利用训练好的分割网络模型对待识别的证件图像进行识别分割。对分割网络模型进行优化调整训练的具体方法为：

根据证件和文字预测结果对应标签的损失进行计算得到分割网络模型的整体损失函数，整体损失函数为：loss＝loss_证件+γ*loss_文字，其中，γ为权重；本实施中，为提高文字分割准确率，γ＝2。通过所述整体损失函数对分割网络模型的参数进行调整，直至所述整体损失函数符合预设标准，完成对所述分割网络模型的优化调整训练，获得训练好的证件背景分割和文字分割网络。

步骤3、基于Pytorch框架训练，图3为待识别的证件图像(证件里面的个人信息做了模糊处理)，将待识别的证件图像使用与制作成分割训练数据集相同的方式，缩放为固定尺寸，输入训练好的分割网络模型中，获取证件区域分割预测结果和文字区域预测结果，分别对证件区域分割预测结果和文字区域预测结果进行后处理操作，再进行矫正操作，以获取矫正后的证件图像以及文字检测框；其中：

对证件区域分割预测结果和文字区域预测结果进行后处理操作的具体方法为：

对证件分割预测结果，使用OpenCV进行后处理，将证件分割预测结果使用先腐蚀后膨胀的形态学操作并进行空洞填补，能够提高图像边缘处的分割精度，获取更好的分割结果，得到更好的证件分割区域轮廓，并根据轮廓大小、长宽比排除误分割区域，获得处理后的证件分割区域，并计算出证件分割区域的四个角点坐标；

对文字分割预测结果，同样的，使用OpenCV进行后处理，使用先腐蚀后膨胀的形态学操作优化分割边界并进行空洞填补，获取文字检测框轮廓，利用文字检测框的几何特征滤除冗余检测框，获得处理后的文字检测框，并计算出文字检测框的四个角点坐标，得到文字检测框的轮廓大小和坐标位置。

本发明对证件区域分割预测结果和文字区域预测结果分别进行后处理操作，能够提高图像的容差性，保证证件识别的准确度。预测结果通过先腐蚀后膨胀的形态学操作，使预测结果连通为一个类似矩形区，腐蚀能够消除连通域的边界点以及细小区域，使边界内缩，而膨胀则将与物体接触的所有背景点合并到该物体中，使边界向外部扩张。分割结果通过腐蚀操作，可以去除离线的细小误分割噪点，平滑分割边界，通过膨胀操作将因腐蚀而内缩的分割结果外扩还原。通过后处理操作够有效解决因光照强度不均匀而影响U-Net分割网络对证件图像的证件区域和文字区域的识别定位以及分割精度的问题。

矫正操作的具体方法为：根据文字检测框的坐标位置和轮廓大小，以证件先验知识为依据，对证件分割区域的四个角点坐标进行排序，并根据排序后的四个证件角点坐标使用OpenCV进行透视变换，得到正投影下的证件图像，得到矫正后的证件图像以及文字检测框，以身份证为例，图4为矫正后的身份证图像。

步骤4、收集大量文字图片，将文字剪裁出并将所包含的文字写入文档中作为标签，制作文字识别数据集，文字识别使用CRNN+CTC文字识别模型，基于Pytorch框架训练，输入图像统一缩放为高32像素。根据文字检测框提取出证件中的文字，缩放为高32像素，输入训练好的CRNN+CTC文字识别模型，得到文字识别结果，再根据文字检测框坐标确定该文字对应的信息，获得产权权属人证件信息，以key：value格式输出。

步骤5、从所述产权权属人证件信息中提取各个属性信息，所述权属人证件信息包括权属人相关的姓名、性别、身份证号、地址、民族等属性信息；产权权属人信息自动录入预设模板表格中对应各个属性信息的位置，获得产权权属人信息表格并存储至产权信息***的信息数据库中。

由于证件照拍摄背景复杂导致U-Net分割网络直接用于证件图像的分割时其网络分类性能较低，网络预测精度较低。为了解决上述技术问题，如图2所示，本发明提供了一种改进的双分支U-Net分割网络，双分支U-Net分割网络包括结构相同的证件背景分支网络和文字分支网络，利用证件背景分支网络对图像中的证件整体背景进行分类，以及利用文字分支网络对图像中的文字进行分类，然后对二者的分类结果进行融合等操作即可将图像划分为证件背景部分和文字部分。构建双分支U-Net分割网络具体的方法为：

(1)取w×h×3的图像，经过卷积操作提取特征，获得w×h×64的特征图F1，再经过四次卷积特征提取层下采样提取特征后，得到w/2×h/2×128的特征图F2、w/4×h/4×256的特征图F3，w/8×h/8×512的特征图F4，w/16×h/16×1024的特征图F5；

(2)将F5上采样一倍与F4融合并通过卷积提取特征获得w/8×h/8×512的特征图F4*，将F4*上采样一倍与F3融合并通过卷积提取特征获得w/4×h/4×256的特征图F3*，将F3*上采样一倍与F2融合并通过卷积提取特征获得w/2×h/2×128的特征图F2*，将F2*上采样一倍与F1融合并通过卷积提取特征获得w×h×64的特征图F1*；

(3)w/4×h/4×256的特征图F3*通过1×1的卷积得到w/4×h/4×2的特征图，使用插值进行两倍上采样，经softmax激活函数得到证件分割预测结果；w×h×64的特征图F1*通过1×1的卷积得到w×h×2的特征图，经softmax激活函数得到文字分割预测结果，其W和H分别为输入图像的宽度和高度。

本发明采用双分支U-Net分割网络对输入的证件图像进行不同尺度的下采样、融合及上采样，能够提高网络预测精度。本发明通过构建双分支U-Net分割网络，将其运用于证件图像分割问题上，以证件图像集作为样本数据集进行训练、验证、测试，便于得到识别准确率较高的分割网络模型。

如图5，本发明还提供一种产权权属人证件信息识别录入***，包括分割训练数据集制作模块、分割网络训练模块、分割结果获取及矫正模块、证件信息识别及提取模块和信息录入模块；

所述分割网络训练模块，用于将训练数据集输入双分支U-Net分割网络中进行训练验证以获取关于证件和文字预测结果的分割网络模型，并对分割网络模型进行优化调整训练；

证件信息识别及提取模块，用于制作文字识别数据集，建立CRNN+CTC文字识别模型，根据文字检测框提取出证件中的文字，输入CRNN+CTC文字识别模型，得到文字识别结果，再根据文字检测框坐标确定该文字对应的信息，获得产权权属人证件信息；

信息录入模块，用于从所述产权权属人证件信息中提取各个属性信息，自动录入预设模板表格中对应各个属性信息的位置。

本发明的产权权属人证件信息识别录入***适用的证件类型包括：身份证、户口本、士官证、学生证、驾驶证、护照、港澳通行证等多种证件，具有泛用性好，识别快，识别准确率高的特点，本发明将证件信息从背景复杂、光照不均、拍摄模糊等情况下识别出来，解决了普通用户使用手机拍照时，因照片受到背景、光照、噪声、模糊等因素影响导致识别效果不理想的问题。

上述说明是针对本发明较佳可行实施例的详细说明，但实施例并非用以限定本发明的专利申请范围，凡本发明所提示的技术精神下所完成的同等变化或修饰变更，均应属于本发明所涵盖专利范围。

Claims

1.一种产权权属信息识别录入方法，其特征在于，包括如下步骤：

2.根据权利要求1所述的一种产权权属证件信息识别录入方法，其特征在于，所述步骤1中，将证件图像集进行标准化预处理以制作成分割训练数据集的具体步骤如下：

3.根据权利要求1所述的一种产权权属证件信息识别录入方法，其特征在于，所述步骤2中，对分割网络模型进行优化调整训练的具体方法为：

根据证件和文字预测结果对应标签的损失进行计算得到分割网络模型的整体损失函数，整体损失函数为：loss＝loss_证件+γ*loss_文字，其中，γ为权重；通过所述整体损失函数对分割网络模型的参数进行调整，直至所述整体损失函数符合预设标准，完成对所述分割网络模型的优化调整训练。

4.根据权利要求1所述的一种产权权属信息识别录入方法，其特征在于，所述步骤3中，对证件区域分割预测结果和文字区域预测结果进行后处理操作的具体方法为：

5.根据权利要求1所述的一种产权权属信息识别录入方法，其特征在于，所述步骤3中，矫正操作的具体方法为：根据文字检测框的坐标位置和轮廓大小，以证件先验知识为依据，对证件分割区域的四个角点坐标进行排序，并根据排序后的四个证件角点坐标使用OpenCV进行透视变换，得到矫正后的证件图像以及文字检测框。

6.根据权利要求1所述的一种产权权属信息识别录入方法，其特征在于，所述权属人证件信息包括权属人姓名、性别、身份证号、地址、民族的属性信息。

7.一种产权权属信息识别录入***，其特征在于，包括分割训练数据集制作模块、分割网络训练模块、分割结果获取及矫正模块、证件信息识别及提取模块和信息录入模块；

所述证件信息识别及提取模块，用于制作文字识别数据集，建立CRNN+CTC文字识别模型，根据文字检测框提取出证件中的文字，输入CRNN+CTC文字识别模型，得到文字识别结果，再根据文字检测框坐标确定该文字对应的信息，获得产权权属人证件信息；