CN114049686A - 签名识别模型训练方法、装置及电子设备 - Google Patents

签名识别模型训练方法、装置及电子设备 Download PDF

Info

Publication number
CN114049686A
CN114049686A CN202111345986.2A CN202111345986A CN114049686A CN 114049686 A CN114049686 A CN 114049686A CN 202111345986 A CN202111345986 A CN 202111345986A CN 114049686 A CN114049686 A CN 114049686A
Authority
CN
China
Prior art keywords
sample
signature
utilized
picture
name
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111345986.2A
Other languages
English (en)
Inventor
王晓燕
黄聚
钦夏孟
范森
吕鹏原
章成全
姚锟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202111345986.2A priority Critical patent/CN114049686A/zh
Publication of CN114049686A publication Critical patent/CN114049686A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本公开提供了签名识别模型训练方法、装置及电子设备,涉及人工智能技术领域,具体为深度学习、计算机视觉技术领域。具体方案为:从预定的样本库中,获取待利用样本以及对应的姓名标注信息;其中,所述样本库包括第一类样本和对应的姓名标注信息;第一类样本为在基于该签名识别模型进行签名识别时,经反馈识别结果错误的签名图片;获取待利用样本对应的文本行图片,其中,文本行图片为待利用样本中的签名区域;基于待利用样本对应的文本行图片和姓名标注信息,对签名识别模型进行更新训练。通过本方案,可以自动进行训练迭代签名识别模型,大大减少了迭代签名识别模型的人力成本。

Description

签名识别模型训练方法、装置及电子设备
技术领域
本公开涉及人工智能技术领域,尤其涉及深度学习、计算机视觉技术领域,具体涉及签名识别模型训练方法、装置及电子设备。
背景技术
对于数字化企业而言,对于手写签名的智能识别具有较高的需求。所谓的对于手写签名的智能识别即自动化地识别手写签名的签名内容。
利用签名识别模型,对包含有手写签名的签名图片进行识别,是一种常见的识别手段。为了保证签名识别模型的精度,需要对签名识别模型进行迭代,即对模型进行更新训练。相关技术中,通过人工方式更新训练模型,例如:人工选取新的签名图片作为样本,对样本中的签名区域以及姓名信息进行人工标注等。
发明内容
本公开提供了一种用于签名识别模型训练方法、装置及电子设备。
根据本公开的一方面,提供了一种签名识别模型训练方法,所述方法包括:
从预定的样本库中,获取待利用样本以及对应的姓名标注信息;其中,所述样本库包括第一类样本和对应的姓名标注信息;所述第一类样本为在基于所述签名识别模型进行签名识别时,经反馈识别结果错误的签名图片;
获取所述待利用样本对应的文本行图片,其中,所述文本行图片为所述待利用样本中的签名区域;
基于所述待利用样本对应的文本行图片和姓名标注信息,对所述签名识别模型进行更新训练。
根据本公开的另一方面,提供了一种信息处理***,包括:签名识别子***和模型训练子***;
签名识别子***,用于当接收到用户针对待识别图片反馈识别结果错误时,获取待识别图片的姓名,将所述待识别图片作为第一类样本,以及将所述姓名作为对应的姓名标注信息存储入预定的样本库中;其中,所述识别结果为基于预先训练完成的签名识别模型,对所述待识别图片进行识别,所得到的结果;
所述模型训练子***,用于从预定的样本库中,获取待利用样本以及对应的姓名标注信息;获取所述待利用样本对应的文本行图片;基于所述待利用样本对应的文本行图片和姓名标注信息,对所述签名识别模型进行更新训练。
根据本公开的另一方面,提供了一种签名识别模型训练装置,所述装置包括:
第一获取模块,用于从预定的样本库中,获取待利用样本以及对应的姓名标注信息;其中,所述样本库至少包括第一类样本和对应的姓名标注信息;所述第一类样本为在基于所述签名识别模型进行签名识别时,经反馈识别结果错误的签名图片;
第二获取模块,用于获取所述待利用样本对应的文本行图片,其中,所述文本行图片为所述待利用样本中的签名区域;
训练模块,用于基于所述待利用样本对应的文本行图片和姓名标注信息,对所述签名识别模型进行更新训练。
根据本公开的另一方面,提供了一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述签名识别模型训练方法。
根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行上述签名识别模型训练方法的步骤。
根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现上述签名识别模型训练方法的步骤。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1是本公开实施例所提供的签名识别模型训练方法的流程图;
图2(a)是本公开实施例中的待利用样本,图2(b)是本公开实施例中包含签名文字的最小外接矩形;
图3是本公开实施例所提供的信息处理***的结构示意图;
图4是本公开实施例所提供的签名识别模型训练装置的结构示意图;
图5是用来实现本公开实施例的签名识别模型训练方法的电子设备的框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
目前,在金融、政务、办公等各个领域的合同、确认文件上都需要办理人手写签名,之后,需要审核办理人手写签名与本人真实姓名是否一致。
相关技术中,采用人工审核方式进行签名识别,即识别办理人的手写签名是否与本人真实姓名一致。但是,对于产生大量签名的签名场景而言,需要大量的人工参与审核,效率低。并且,人工审核的方式中,需要频繁沟通、等待审核等,会影响签名用户的使用体验。
基于此,签名识别服务应运而生。签名识别服务可以实现识别手写签名的文字内容,并参与个人身份校验,能够节省90%以上的业务处理时间,例如合同签署时间。并且,减少人工指导,不仅可以节省工作人员的工作量;还能减少干扰,提升用户的签名体验。
针对签名识别服务而言,签名识别模型是实现服务的重要手段。针对签名识别模型而言,在采集包含手写签名的签名图片后,可以对签名图片进行姓名标注,然后,有监督地训练签名识别模型,以通过训练完成的签名识别模型来识别签名图片中的文字内容,即手写签名。可以理解的是,每个人的笔迹风格不同,签名图片特征分布较分散,并且,识别精度受标注数据量的限制。这样使得模型训练时需要大量的签名图片,且签名图片还需要被一一标注,其中,该大量的签名图片覆盖多种类型的手写数据,该多种类型的手写数据即多种文字内容和笔迹风格。
然而,签名识别模型往往只对训练集中可以覆盖或相似的样本有精度保证。为了保证签名识别模型的精度,需要对签名识别模型进行迭代,即对模型进行更新训练。相关技术中,通过人工方式更新训练模型,例如:人工选取大量新的签名图片作为样本,对样本中的签名区域以及姓名信息进行人工标注等,来作为模型的新的训练集,不断地迭代模型。
可见,通过人工方式,更新训练签名识别模型,需要耗费大量人力成本。
为了解决上述问题,实现对签名识别模型的自动化地更新训练,本公开实施例提供了一种签名识别模型训练方法、***、装置、设备及存储介质。
下面首先对本公开实施例所提供的一种签名识别模型训练方法进行介绍。
其中,本公开实施例所提供的一种签名识别模型训练方法,应用于电子设备中。在实际应用中,该电子设备可以为服务器或终端设备,这都是合理的。另外,该签名识别模型训练方法所应用的场景可以为,柜台签名场景、入职签名场景,OCR(Optical CharacterRecognition,光学字符识别)场景等,但不限于此。
本公开实施例提供的一种签名识别模型训练方法,可以包括如下步骤:
从预定的样本库中,获取待利用样本以及对应的姓名标注信息;其中,所述样本库至少包括第一类样本和对应的姓名标注信息;所述第一类样本为在基于所述签名识别模型进行签名识别时,经反馈识别结果错误的签名图片;
获取所述待利用样本对应的文本行图片,其中,所述文本行图片为所述待利用样本中的签名区域;
基于所述待利用样本对应的文本行图片和姓名标注信息,对所述签名识别模型进行更新训练。
本实施例中,预定的样本库中包括有第一类样本,即基于签名识别模型识别错误的签名图片,以及对应的姓名标注信息;从样本库中获取待利用样本和对应的姓名标注信息;进而,获取所述待利用样本对应的文本行图片,其中,所述文本行图片为所述待利用样本中的签名区域;最终,基于待利用样本对应的文本行图片和姓名标注信息,对签名识别模型进行更新训练。可见,本方案,无需人工选取新的训练集以及人工标注签名区域等,因此,通过本方案可以实现对签名识别模型的自动化地更新训练,大大减少了人工迭代签名识别模型的人力成本。
下面结合附图,对本公开所提供的一种签名识别模型训练方法进行介绍。
如图1所示,本公开所提供的一种签名识别模型训练方法,可以包括如下步骤:
S101,从预定的样本库中,获取待利用样本以及对应的姓名标注信息;其中,所述样本库至少包括第一类样本和对应的姓名标注信息;所述第一类样本为在基于所述签名识别模型进行签名识别时,经反馈识别结果错误的签名图片;
该签名识别模型为基于一定数量级的(如一百万个)签名图片样本以及姓名标注信息,预先训练得到的人工智能模型。该签名识别模型可以通过对任一种深度学习模型训练得到,深度学习模型的结构可以根据实际情况设定。
在签名识别模型训练完成后,为了提升签名识别的精度,可以对签名识别模型进行迭代,即对签名识别模型进行更新训练。为了对签名识别模型进行更新训练,可以预先设定针对签名识别模型的模型更新条件,这样,当满足针对签名识别模型的更新条件时,可以开启针对模型的更新训练。示例性的,模型更新条件可以为,每间隔预定的时间;收集的样本达到预定的数量等,这都是可以的。
并且,样本库是一个数据库,即一个长期存储在计算机内的、有组织的、统一管理的大量数据的集合,用于存储作为样本的签名图片及其对应的姓名标注信息,其中,签名图片即包括书写签名的图片。本实施例中,预定的样本库中包括有多个第一类样本以及对应的姓名标注信息。这样,从预定的样本库中所获取的待利用样本可以包括第一类样本。可以理解的是,待利用样本的数量可以为多个,针对每一待利用样本的处理过程均相同。
可以理解的是,将初步训练好的签名识别模型应用于提供签名识别服务的签名识别子***中,这样,签名识别子***可以利用训练完成的签名识别模型来识别签名信息。而为了构建预定的样本库,该签名识别子***还具备确认反馈功能,用于记录用户反馈该签名识别模型,识别正确或错误的签名图片及姓名标注信息;进而,可以将经反馈识别结果错误的签名图片,作为第一类样本,并将第一类样本及其对应的姓名标注信息,会自动地存入样本库中。另外,在一种实现方式中,该签名识别子***还可以记录识别正确或错误的签名图片所对应的标签,这样,就可以根据标签找到用户反馈识别错误的签名图片及对应的姓名标注信息。
需要说明的是,姓名标注信息即该签名图片所对应的签名人真实姓名,第一类样本的姓名标注信息的确定方式可以存在多种,例如:在用户反馈针对签名图片识别错误的识别结果时,指示用户手动输入真实姓名,或者,获取数据库中预先记录用户的姓名。
可选地,所述样本库还包括第二类样本和对应的姓名标注信息;其中,所述第二类样本为在预定时间段内所生成的、关于预定签名场景的签名图片。
其中,预定的签名场景可以包括但不局限于:入职签名、柜台签名等。可以理解的是,在这些场景下会产生有超大规模的签名图片,且在不断地更新,因此,可以采集预定签名场景内,在预定时间段内所生成的签名图片以及对应的标注信息,添加到预定的样本库中。
这样,预定样本库中除了包括用户反馈识别错误的第一类样本,还可以包括第二类样本,即不断收集的关于预定签名场景的新样本。
可见,第一类样本和第二类样本都是不断更新的样本,将第一类样本和第二类样本及其对应的姓名标注信息不断存入样本库中,可以不断更新和充实样本库,充分利用预定的签名场景中产生的签名图片,从而避免了数据浪费,提升了样本库所覆盖的手写数据类型的范围。
S102,获取所述待利用样本对应的文本行图片,其中,所述文本行图片为所述待利用样本中的签名区域;
由于待利用样本中可能包含非签名区域,例如:空白区域,而签名识别模型的训练仅仅需要利用签名区域内的文字内容,因此,在获取到待利用样本后,要提取待利用样本签名区域的文本行图片。
在一种实现方式中,获取所述待利用样本对应的文本行图片,可以包括步骤A1-A2:
A1,对待利用样本进行签名区域检测,得到检测结果;
其中,检测结果可以为签名区域的坐标信息,如图2(a)为待利用样本,图2(b)为包含签名文字的最小外接矩形。该坐标信息可以根据签名文字的最小外接矩形的四个端点生成,此时,该坐标信息能够唯一表征出签名区域。对所述待利用样本进行签名区域检测的方式可以存在多种。
示例性的,所述对所述待利用样本进行签名区域检测,得到检测结果,可以包括:
对所述待利用样本进行二值化处理,并确定二值化处理后的样本中,包含各个文字区域的最小外接矩形,得到签名区域的检测结果;
或者,
基于预先训练的用于检测签名区域的文字检测模型,检测所述待利用样本中的签名区域,得到检测结果。
为了节省人工的标注成本,可以通过对待利用样本二值化进行处理或使用预先训练的文字检测模型检测待利用样本中的签名区域,来得到检测结果。
可以理解的是,二值化处理的具体过程,即是将待利用样本的彩色图片先进行灰度化处理,得到灰度图像,再将得到的灰度图像的各个像素分为两个等级。示例性的,可以针对灰度图像设置一个合适的阈值,以确定某像素是目标还是背景,将超过阈值的像素点设置为1,低于阈值的像素点设置为0,从而获得二值化的图像。之后,再确定二值化处理后的样本中,包含各个文字区域的最小外接矩形,得到签名区域的检测结果。
并且,文字检测模型为基于各个样本以及文字标注信息,预先训练得到的用于定位文字区域的模型,本公开并不对文字检测模型的具体训练过程进行限定。其中,各个样本对应的文字标注信息,可以通过人工标注获得,也可以通过对样本进行二值化处理的方式所获得,这都是合理的。示例性地,在一种实现方式中,可以选取一定数量的(如五千张)签名图片,并设置标签label,标注出这些签名图片中文字外接矩形的4个角点坐标,从而基于这些签名图片及其4角点坐标的标签label,训练出该文字检测模型。
A2,基于所述检测结果,从所述待利用样本中提取签名区域,作为所述待利用样本对应的文本行图片。
若提取到的签名区域为包含各个文字区域的最小外接矩形,考虑该矩形往往都是倾斜的,可以在提取签名区域后,对该签名区域进行仿射变换,以将倾斜的矩形调正,方便签名识别模型的识别,从而更好地对该签名识别模型进行训练。
可以理解的是,上述生成文本行图片的步骤,可以在满足针对签名识别模型的模型更新条件时,获取待利用样本之后再执行,此时获取所述待利用样本对应的文本行图片的步骤包括步骤A1-A2。此外,为了提高更新训练该签名识别模型的效率,还可以在待利用样本存入样本库时,就自动生成对应文本行图片,并将该文本行图片储存在样本库中,当满足针对签名识别模型的模型更新条件时,直接中样本库中获取生成好的文本行图片即可。
S103,基于所述待利用样本对应的文本行图片和姓名标注信息,对所述签名识别模型进行更新训练。
在一种实现方式中,对该签名识别模型进行更新训练可以包括:将待利用样本对应的文本行图片输入签名识别模型,得到该签名识别模型针对待利用样本识别的输出结果;基于输出结果和待利用样本的姓名标注信息,确定损失值;不断调整训练中的签名识别模型的模型参数,继续进行训练,从而不断降低模型的损失值,达到更新迭代的目的。
另外,在对最初构建好的基础签名识别模型进行训练时,也可以将收集到的签名图片样本进行签名区域检测,并提取其签名区域作为基础文本行图片,再将基础文本行图片及其姓名标注信息作为最初构建的签名识别模型的训练集。
在具体实现过程中,针对基础签名识别模型的训练,可以从数据库中抽取一定数量的带签字人姓名信息的签名图片,并提取这些签名图片中的签名区域作为基础文本行图片。通过选取带签字人姓名信息的签名图片,可以避免人工对签名图片进行姓名信息的标注。当然,若数据库中的带签字人姓名信息的签名图片的数量不足,也可以选取一定量的未带签字人姓名信息的签名图片,通过人工标注的方式,对该一定量的签名图片进行姓名信息的标注,例如,为未带签字人姓名信息的签名图片设置标签label,标注出这些签名图片中的文字,即签字人的实际姓名。
本实施例中,预定的样本库中包括有第一类样本,即基于签名识别模型识别错误的签名图片,以及对应的姓名标注信息;从样本库中获取待利用样本和对应的姓名标注信息;进而,获取所述待利用样本对应的文本行图片,其中,所述文本行图片为所述待利用样本中的签名区域;最终,基于待利用样本对应的文本行图片和姓名标注信息,对签名识别模型进行更新训练。可见,本方案,无需人工选取新的训练集以及人工标注签名区域等,因此,通过本方案可以实现对签名识别模型的自动化地更新训练,大大减少了人工迭代签名识别模型的人力成本。
可选地,在另一实施例中,所述待利用样本的数量为多个;所述基于所述待利用样本对应的文本行图片和姓名标注信息,对所述签名识别模型进行更新训练之前,还包括步骤B1-B4:
B1,统计各个待利用样本相对应的姓名标注信息中,各个文字的出现频率;
由于签名中会出现频率不同的各种文字,如常用字出现频率高,生僻字出现频率少,各文字出现的频率呈现长尾分布的状态,即有大量的文字出现频率较低,而只有各类型文字的样本足够充足时,才能使得签名识别模型达到一个较高的识别精度。因此,可以统计各个待利用样本相对应的姓名标注信息中,各个文字的出现频率,对低频的文字做相应的处理,从而提高签名识别模型对低频文字的识别精度。
B2,检测出现频率低于预定频率阈值的目标文字;
将统计结果中频率低于阈值的文字作为目标文字。
B3,确定所对应姓名标注信息中包含所述目标文字的待利用样本,作为待处理样本;
包含该目标文字的待利用样本,即出现频率低于预定频率阈值的文字所在的样本,都可以作为待处理样本。
B4,将所述待处理样本对应的文本行图片,进行数据增强处理,得到目标图片;
示例性的,数据增强处理可以针对待处理样本对应的文本行图片进行图片大小调整(resize)、图片旋转(rotate)、增加各边像素(padding)等处理。此外,也可以针对低频文字人工收集样本,或者由人工撰写出不同字迹类型的低频文字作为目标样本,并提取人工收集、撰写的样本的文本行图片,这也是可以的。
在包含B1-B4的基础上,相应的,所述基于所述待利用样本对应的文本行图片和姓名标注信息,对所述签名识别模型进行更新训练,可以包括:
基于所述待利用样本对应的文本行图片和姓名标注信息,以及所述目标样本和对应的姓名标注信息,对所述签名识别模型进行更新训练;其中,所述目标样本对应的姓名标注信息为:所述待处理样本对应的姓名标注信息。
此时,对签名识别模型进行更新训练时所使用的样本包括,待利用样本对应的文本行图片和姓名标注信息、针对低频文字所对应的待处理样本做数据增强处理后得到的目标样本,和对应的姓名标注信息,其中,姓名标注信息即指定样本对应的姓名标注信息。
此外,还可以统计用户反馈识别错误的第一类样本中文字的出现频率,对第一类样本中的低频文字执行上述步骤,针对模型识别出错的文字中的低频文字,更加精准地训练该签名识别模型。
同样的,在对最初构建的基础签名识别模型进行训练时,也可以统计训练集中的低频文字,针对低频文字所对应的待处理样本做数据增强处理后得到的基础目标样本,再将基础目标样本的及其姓名标注信息作为最初构建的签名识别模型的训练集,训练基础签名识别模型,从而改善训练集中不同文字出现频率的长尾分布。
本实施例中,针对出现频率低于预定频率阈值的目标文字的待利用样本作为待处理样本,对待处理样本做数据增强处理,得到目标样本,并基于待利用样本对应的文本行图片和姓名标注信息,以及所述目标样本和对应的姓名标注信息,对所述签名识别模型进行更新训练。可见,通过本实施例的方案可以提高签名识别模型的识别精度。
可见,通过本公开所提供的签名识别模型训练方法,可以不断补充更新该签名识别模型识别错误的第一类样本,以及导入新的第二类样本,并基于第一类样本和第二类样本所对应的文本行图片和姓名标注信息,自动更新训练签名识别模型,减少了人工收集训练集、人工标注、人工迭代的成本,同时,保证了训练过程中能够充分利用真实数据。因此,随着数据量不断覆盖更多的签名笔迹及文字样本,该签名识别模型的泛化性和识别精度会不断提升,达到线上使用的效果。
本公开的技术方案中,所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。
根据本公开的实施例,本公开还提供了一种信息处理***,如图3所示,该***包括:签名识别子***310和模型训练子***320;
签名识别子***310,用于当接收到用户针对待识别图片反馈识别结果错误时,获取待识别图片的姓名,将所述待识别图片作为第一类样本,以及将所述姓名作为对应的姓名标注信息存储入预定的样本库中;其中,所述识别结果为基于预先训练完成的签名识别模型,对所述待识别图片进行识别,所得到的结果;
所述模型训练子***320,用于从预定的样本库中,获取待利用样本以及对应的姓名标注信息;获取所述待利用样本对应的文本行图片;基于所述待利用样本对应的文本行图片和姓名标注信息,对所述签名识别模型进行更新训练。
其中,关于模型训练子***的各个功能的具体实现,可以参见上述方法实施例中的相应内容,在此不做赘述。
本实施例中,签名识别子***接收到用户针对待识别图片反馈识别结果错误时,获取待识别图片的姓名,将所述待识别图片作为第一类样本,以及将所述姓名作为对应的姓名标注信息存储入预定的样本库中;模型训练子***从预定的样本库中,获取待利用样本以及对应的姓名标注信息;并基于待利用样本对应的文本行图片和姓名标注信息,对所述签名识别模型进行更新训练。可见,本方案中,自动对用户反馈的错误样本存入样本库中,并基于待利用样本对应的文本行图片和姓名标注信息,自动对签名识别模型进行更新训练。因此,通过本方案,可以自动进行训练迭代签名识别模型,大大减少了迭代签名识别模型的人力成本。
根据本公开的实施例,本公开还提供了一种签名识别模型训练装置,如图4所示,该装置包括:
第一获取模块410,用于从预定的样本库中,获取待利用样本以及对应的姓名标注信息;其中,所述样本库至少包括第一类样本和对应的姓名标注信息;所述第一类样本为在基于所述签名识别模型进行签名识别时,经反馈识别结果错误的签名图片;
第二获取模块420,用于获取所述待利用样本对应的文本行图片,其中,所述文本行图片为所述待利用样本中的签名区域;
训练模块430,用于基于所述待利用样本对应的文本行图片和姓名标注信息,对所述签名识别模型进行更新训练。
可选地,所述样本库还包括第二类样本和对应的姓名标注信息;其中,所述第二类样本为在预定时间段内所采集的、关于预定签名场景的签名图片。
可选地,所述第二获取模块420,包括:
检测子模块,用于对所述待利用样本进行签名区域检测,得到检测结果;
提取子模块,用于基于所述检测结果,从所述待利用样本中提取签名区域,作为所述待利用样本对应的文本行图片。
可选地,所述检测子模块对所述待利用样本进行签名区域检测,得到检测结果,包括:
对所述待利用样本进行二值化处理,并确定二值化处理后的样本中,包含各个文字区域的最小外接矩形,得到签名区域的检测结果;
或者,
基于预先训练的用于检测签名区域的文字检测模型,检测所述待利用样本中的签名区域,得到检测结果。
可选地,所述待利用样本的数量为多个;所述装置还包括:
统计模块,用于统计各个待利用样本相对应的姓名标注信息中,各个文字的出现频率;
检测模块,用于检测出现频率低于预定频率阈值的目标文字;
确定模块,用于确定所对应姓名标注信息中包含所述目标文字的待利用样本,作为指定样本;
增强模块,用于将所述指定样本对应的文本行图片,进行数据增强处理,得到目标图片;
所述训练模块具体用于:
基于所述待利用样本对应的文本行图片和姓名标注信息,以及所述目标图片和对应的姓名标注信息,对所述签名识别模型进行更新训练;
其中,所述目标图片对应的姓名标注信息为:所述指定样本对应的姓名标注信息。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
本公开所提供的一种电子设备,可以包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述的签名识别模型训练方法的步骤。
本公开所提供的一种计算机可读存储介质,该计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述签名识别模型训练方法的步骤。
在本公开提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中上述的签名识别模型训练方法的步骤。
图5示出了可以用来实施本公开的实施例的示例电子设备500的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图5所示,设备500包括计算单元501,其可以根据存储在只读存储器(ROM)502中的计算机程序或者从存储单元508加载到随机访问存储器(RAM)503中的计算机程序,来执行各种适当的动作和处理。在RAM 503中,还可存储设备500操作所需的各种程序和数据。计算单元501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
设备500中的多个部件连接至I/O接口505,包括:输入单元506,例如键盘、鼠标等;输出单元507,例如各种类型的显示器、扬声器等;存储单元508,例如磁盘、光盘等;以及通信单元509,例如网卡、调制解调器、无线通信收发机等。通信单元509允许设备500通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元501可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元501的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元501执行上文所描述的各个方法和处理。例如,在一些实施例中,签名识别模型训练方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元508。在一些实施例中,计算机程序的部分或者全部可以经由ROM 502和/或通信单元509而被载入和/或安装到设备500上。当计算机程序加载到RAM503并由计算单元501执行时,可以执行上文描述的签名识别模型训练方法的一个或多个步骤。备选地,在其他实施例中,计算单元501可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行签名识别模型训练方法。
本文中以上描述的***和技术的各种实施方式可以在数字电子电路***、集成电路***、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上***的***(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程***上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储***、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储***、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行***、装置或设备使用或与指令执行***、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体***、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的***和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的***和技术实施在包括后台部件的计算***(例如,作为数据服务器)、或者包括中间件部件的计算***(例如,应用服务器)、或者包括前端部件的计算***(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的***和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算***中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将***的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机***可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式***的服务器,或者是结合了区块链的服务器。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

Claims (14)

1.一种签名识别模型训练方法,所述方法包括:
从预定的样本库中,获取待利用样本以及对应的姓名标注信息;其中,所述样本库包括第一类样本和对应的姓名标注信息;所述第一类样本为在基于所述签名识别模型进行签名识别时,经反馈识别结果错误的签名图片;
获取所述待利用样本对应的文本行图片,其中,所述文本行图片为所述待利用样本中的签名区域;
基于所述待利用样本对应的文本行图片和姓名标注信息,对所述签名识别模型进行更新训练。
2.根据权利要求1所述的方法,其中,所述样本库还包括第二类样本和对应的姓名标注信息;其中,所述第二类样本为在预定时间段内所生成的、关于预定签名场景的签名图片。
3.根据权利要求1或2所述的方法,其中,获取所述待利用样本对应的文本行图片,包括:
对所述待利用样本进行签名区域检测,得到检测结果;
基于所述检测结果,从所述待利用样本中提取签名区域,作为所述待利用样本对应的文本行图片。
4.根据权利要求3所述的方法,其中,所述对所述待利用样本进行签名区域检测,得到检测结果,包括:
对所述待利用样本进行二值化处理,并确定二值化处理后的样本中,包含各个文字区域的最小外接矩形,得到签名区域的检测结果;
或者,
基于预先训练的用于检测签名区域的文字检测模型,检测所述待利用样本中的签名区域,得到检测结果。
5.根据权利要求1或2所述的方法,其中,所述待利用样本的数量为多个;所述基于所述待利用样本对应的文本行图片和姓名标注信息,对所述签名识别模型进行更新训练之前,还包括:
统计各个待利用样本相对应的姓名标注信息中,各个文字的出现频率;
检测出现频率低于预定频率阈值的目标文字;
确定所对应姓名标注信息中包含所述目标文字的待利用样本,作为待处理样本;
将所述所述待处理样本对应的文本行图片,进行数据增强处理,得到目标样本;
所述基于所述待利用样本对应的文本行图片和姓名标注信息,对所述签名识别模型进行更新训练,包括:
基于所述待利用样本对应的文本行图片和姓名标注信息,以及所述目标样本和对应的姓名标注信息,对所述签名识别模型进行更新训练;
其中,所述目标样本对应的姓名标注信息为:所述待处理样本对应的姓名标注信息。
6.一种信息处理***,包括:签名识别子***和模型训练子***;
签名识别子***,用于当接收到用户针对待识别图片反馈识别结果错误时,获取待识别图片的姓名,将所述待识别图片作为第一类样本,以及将所述姓名作为对应的姓名标注信息存储入预定的样本库中;其中,所述识别结果为基于预先训练完成的签名识别模型,对所述待识别图片进行识别,所得到的结果;
所述模型训练子***,用于从预定的样本库中,获取待利用样本以及对应的姓名标注信息;获取所述待利用样本对应的文本行图片;基于所述待利用样本对应的文本行图片和姓名标注信息,对所述签名识别模型进行更新训练。
7.一种签名识别模型训练装置,所述装置包括:
第一获取模块,用于从预定的样本库中,获取待利用样本以及对应的姓名标注信息;其中,所述样本库至少包括第一类样本和对应的姓名标注信息;所述第一类样本为在基于所述签名识别模型进行签名识别时,经反馈识别结果错误的签名图片;
第二获取模块,用于获取所述待利用样本对应的文本行图片,其中,所述文本行图片为所述待利用样本中的签名区域;
训练模块,用于基于所述待利用样本对应的文本行图片和姓名标注信息,对所述签名识别模型进行更新训练。
8.根据权利要求7所述的装置,其中,所述样本库还包括第二类样本和对应的姓名标注信息;其中,所述第二类样本为在预定时间段内所生成的、关于预定签名场景的签名图片。
9.根据权利要求7或8所述的装置,其中,所述第二获取模块,包括:
检测子模块,用于对所述待利用样本进行签名区域检测,得到检测结果;
提取子模块,用于基于所述检测结果,从所述待利用样本中提取签名区域,作为所述待利用样本对应的文本行图片。
10.根据权利要求9所述的装置,其中,所述检测子模块对所述待利用样本进行签名区域检测,得到检测结果,包括:
对所述待利用样本进行二值化处理,并确定二值化处理后的样本中,包含各个文字区域的最小外接矩形,得到签名区域的检测结果;
或者,
基于预先训练的用于检测签名区域的文字检测模型,检测所述待利用样本中的签名区域,得到检测结果。
11.根据权利要求7或8所述的装置,其中,所述待利用样本的数量为多个;所述装置还包括:
统计模块,用于统计各个待利用样本相对应的姓名标注信息中,各个文字的出现频率;
检测模块,用于检测出现频率低于预定频率阈值的目标文字;
确定模块,用于确定所对应姓名标注信息中包含所述目标文字的待利用样本,作为指定样本;
增强模块,用于将所述指定样本对应的文本行图片,进行数据增强处理,得到目标图片;
所述训练模块具体用于:
基于所述待利用样本对应的文本行图片和姓名标注信息,以及所述目标图片和对应的姓名标注信息,对所述签名识别模型进行更新训练;
其中,所述目标图片对应的姓名标注信息为:所述指定样本对应的姓名标注信息。
12.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-5中任一项所述的方法。
13.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-5中任一项所述的方法。
14.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-5中任一项所述的方法。
CN202111345986.2A 2021-11-15 2021-11-15 签名识别模型训练方法、装置及电子设备 Pending CN114049686A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111345986.2A CN114049686A (zh) 2021-11-15 2021-11-15 签名识别模型训练方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111345986.2A CN114049686A (zh) 2021-11-15 2021-11-15 签名识别模型训练方法、装置及电子设备

Publications (1)

Publication Number Publication Date
CN114049686A true CN114049686A (zh) 2022-02-15

Family

ID=80208948

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111345986.2A Pending CN114049686A (zh) 2021-11-15 2021-11-15 签名识别模型训练方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN114049686A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116305076A (zh) * 2023-03-30 2023-06-23 重庆傲雄在线信息技术有限公司 基于签名的身份信息注册样本在线更新方法、***及存储介质

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180060704A1 (en) * 2016-08-30 2018-03-01 Baidu Online Network Technology (Beijing) Co., Ltd. Method And Apparatus For Image Character Recognition Model Generation, And Vertically-Oriented Character Image Recognition
CN110135414A (zh) * 2019-05-16 2019-08-16 京北方信息技术股份有限公司 语料库更新方法、装置、存储介质及终端
JP2019528520A (ja) * 2016-08-31 2019-10-10 富士通株式会社 文字認識のための分類ネットワークの訓練装置、文字認識装置及び方法
CN111444906A (zh) * 2020-03-24 2020-07-24 腾讯科技(深圳)有限公司 基于人工智能的图像识别方法和相关装置
CN111461238A (zh) * 2020-04-03 2020-07-28 讯飞智元信息科技有限公司 模型训练方法、字符识别方法、装置、设备及存储介质
CN111626279A (zh) * 2019-10-15 2020-09-04 西安网算数据科技有限公司 一种负样本标注训练方法及高度自动化的票据识别方法
CN112200312A (zh) * 2020-09-10 2021-01-08 北京达佳互联信息技术有限公司 文字识别模型的训练方法、装置及存储介质
CN112418304A (zh) * 2020-11-19 2021-02-26 北京云从科技有限公司 Ocr模型训练方法、***及装置
CN113313022A (zh) * 2021-05-27 2021-08-27 北京百度网讯科技有限公司 文字识别模型的训练方法和识别图像中文字的方法
CN113378833A (zh) * 2021-06-25 2021-09-10 北京百度网讯科技有限公司 图像识别模型训练方法、图像识别方法、装置及电子设备
CN113569916A (zh) * 2021-06-30 2021-10-29 佛山喀视科技有限公司 瓷砖标签识别模型训练方法及瓷砖标签识别方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180060704A1 (en) * 2016-08-30 2018-03-01 Baidu Online Network Technology (Beijing) Co., Ltd. Method And Apparatus For Image Character Recognition Model Generation, And Vertically-Oriented Character Image Recognition
JP2019528520A (ja) * 2016-08-31 2019-10-10 富士通株式会社 文字認識のための分類ネットワークの訓練装置、文字認識装置及び方法
CN110135414A (zh) * 2019-05-16 2019-08-16 京北方信息技术股份有限公司 语料库更新方法、装置、存储介质及终端
CN111626279A (zh) * 2019-10-15 2020-09-04 西安网算数据科技有限公司 一种负样本标注训练方法及高度自动化的票据识别方法
CN111444906A (zh) * 2020-03-24 2020-07-24 腾讯科技(深圳)有限公司 基于人工智能的图像识别方法和相关装置
CN111461238A (zh) * 2020-04-03 2020-07-28 讯飞智元信息科技有限公司 模型训练方法、字符识别方法、装置、设备及存储介质
CN112200312A (zh) * 2020-09-10 2021-01-08 北京达佳互联信息技术有限公司 文字识别模型的训练方法、装置及存储介质
CN112418304A (zh) * 2020-11-19 2021-02-26 北京云从科技有限公司 Ocr模型训练方法、***及装置
CN113313022A (zh) * 2021-05-27 2021-08-27 北京百度网讯科技有限公司 文字识别模型的训练方法和识别图像中文字的方法
CN113378833A (zh) * 2021-06-25 2021-09-10 北京百度网讯科技有限公司 图像识别模型训练方法、图像识别方法、装置及电子设备
CN113569916A (zh) * 2021-06-30 2021-10-29 佛山喀视科技有限公司 瓷砖标签识别模型训练方法及瓷砖标签识别方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
贾建忠;: "基于小波变换和CPN网络的手写签名鉴别", 计算机与现代化, no. 07, 15 July 2020 (2020-07-15) *
贾真;冶忠林;尹红风;何大可;: "基于Tri-training与噪声过滤的弱监督关系抽取", 中文信息学报, no. 04, 15 July 2016 (2016-07-15) *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116305076A (zh) * 2023-03-30 2023-06-23 重庆傲雄在线信息技术有限公司 基于签名的身份信息注册样本在线更新方法、***及存储介质
CN116305076B (zh) * 2023-03-30 2024-03-08 重庆亲笔签数字科技有限公司 基于签名的身份信息注册样本在线更新方法、***及存储介质

Similar Documents

Publication Publication Date Title
KR102171220B1 (ko) 클레임 서류의 문자 인식 방법, 장치, 서버 및 저장매체
CN107330471B (zh) 反馈内容的问题定位方法和装置、计算机设备、存储介质
CN106980856B (zh) 公式识别方法及***和符号推理计算方法及***
CN113705554A (zh) 图像识别模型的训练方法、装置、设备及存储介质
CN113382279B (zh) 直播推荐方法、装置、设备、存储介质以及计算机程序产品
CN107491536B (zh) 一种试题校验方法、试题校验装置及电子设备
CN110826494A (zh) 标注数据质量评价方法、装置、计算机设备及存储介质
US11341319B2 (en) Visual data mapping
CN110909123A (zh) 一种数据提取方法、装置、终端设备及存储介质
CN113780098A (zh) 文字识别方法、装置、电子设备以及存储介质
CN113657395A (zh) 文本识别方法、视觉特征提取模型的训练方法及装置
CN113221918A (zh) 目标检测方法、目标检测模型的训练方法及装置
CN113963364A (zh) 目标化验单生成方法、装置、电子设备及存储介质
CN114092948B (zh) 一种票据识别方法、装置、设备以及存储介质
CN111625567A (zh) 数据模型匹配方法、装置、计算机***及可读存储介质
CN113313114B (zh) 证件信息获取方法、装置、设备以及存储介质
CN114638501A (zh) 一种业务数据处理方法、装置、计算机设备及存储介质
CN114626457A (zh) 一种目标检测方法、装置及电子设备
CN114386013A (zh) 学籍自动认证方法、装置、计算机设备及存储介质
CN114090601A (zh) 一种数据筛选方法、装置、设备以及存储介质
CN114049686A (zh) 签名识别模型训练方法、装置及电子设备
CN112613367A (zh) 票据信息文本框获取方法、***、设备及存储介质
CN115934928A (zh) 一种信息抽取方法、装置、设备及存储介质
CN112801016B (zh) 一种选票数据统计方法、装置、设备和介质
CN115116070A (zh) 一种精准切割pdf的方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination