CN111985936A - 一种商户证件信息的检验方法、装置及设备 - Google Patents

一种商户证件信息的检验方法、装置及设备 Download PDF

Info

Publication number
CN111985936A
CN111985936A CN202010825756.5A CN202010825756A CN111985936A CN 111985936 A CN111985936 A CN 111985936A CN 202010825756 A CN202010825756 A CN 202010825756A CN 111985936 A CN111985936 A CN 111985936A
Authority
CN
China
Prior art keywords
information
certificate
certificate information
field
merchant
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010825756.5A
Other languages
English (en)
Inventor
田昆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN202010825756.5A priority Critical patent/CN111985936A/zh
Publication of CN111985936A publication Critical patent/CN111985936A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/018Certifying business or products
    • G06Q30/0185Product, service or business identity fraud
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Multimedia (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Finance (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本说明书实施例公开了一种商户证件信息的检验方法、装置及设备。该方案可以应用于监管或者合规领域。该方案可以包括:利用光学字符识别技术对包含商户的待检验证件信息的图像进行识别处理,得到第一证件信息;利用从可信机构处获取的该商户的与该第一证件信息的类别一致的第二证件信息,对第一证件信息进行检验,得到检验结果。

Description

一种商户证件信息的检验方法、装置及设备
技术领域
本申请涉及合规检验技术领域,尤其涉及一种商户证件信息的检验方法、装置及设备。
背景技术
目前,在对商户进行合规检查时,通常需要对商户当前使用的证件信息进行检查,以识别商户在经营过程中是否存在使用虚***信息或者进行非法经营活动等违规问题。由于商户在经营过程中通常会使用权威部门颁发的证件的图像信息,从而在进行合规检查时,通常需要人工对商户使用的证件图像信息进行合规检验。
基于此,需要更为高效的针对商户证件信息的检验方法。
发明内容
本说明书实施例提供一种商户证件信息的检验方法、装置及设备,以解决现有的针对商户证件信息的检验方法存在的消耗的人力资源量较大的问题。
为解决上述技术问题,本说明书实施例是这样实现的:
本说明书实施例提供的一种商户证件信息的检验方法,包括:
获取包含商户的待检验证件信息的图像;
利用光学字符识别技术对所述图像进行处理,得到第一证件信息;
从可信机构处获取所述商户的第二证件信息;所述第二证件信息的类别与所述第一证件信息的类别一致;
根据所述第二证件信息,对所述第一证件信息进行检验,得到检验结果。
本说明书实施例提供的一种商户证件信息的检验装置,包括:
第一获取模块,用于获取包含商户的待检验证件信息的图像;
图像处理模块,用于利用光学字符识别技术对所述图像进行处理,得到第一证件信息;
第二获取模块,用于从可信机构处获取所述商户的第二证件信息;所述第二证件信息的类别与所述第一证件信息的类别一致;
检验模块,用于根据所述第二证件信息,对所述第一证件信息进行检验,得到检验结果。
本说明书实施例提供的一种商户证件信息的检验设备,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:
获取包含商户的待检验证件信息的图像;
利用光学字符识别技术对所述图像进行处理,得到第一证件信息;
从可信机构处获取所述商户的第二证件信息;所述第二证件信息的类别与所述第一证件信息的类别一致;
根据所述第二证件信息,对所述第一证件信息进行检验,得到检验结果。
本说明书中提供的至少一个实施例能够实现以下有益效果:
通过利用光学字符识别技术对包含商户的待检验证件信息的图像进行识别处理,得到第一证件信息;利用从可信机构处获取的该商户的与该第一证件信息的类别一致的第二证件信息,与第一证件信息进行自动比对,从而可以自动生成针对包含商户的待检验证件信息的图像的合规检验结果。而无需人工进行审核,有利于减少审核商户证件信息时所需消耗的人力资源。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本说明书实施例提供的一种商户证件信息的检验方法的流程示意图;
图2为本说明书实施例提供的一种证件采集图像的示意图;
图3为本说明书实施例提供的一种非证件采集图像的示意图;
图4为本说明书实施例提供的对应于图1的一种商户证件信息的检验装置的结构示意图;
图5为本说明书实施例提供的对应于图1的一种商户证件信息的检验设备的结构示意图。
具体实施方式
为使本说明书一个或多个实施例的目的、技术方案和优点更加清楚,下面将结合本说明书具体实施例及相应的附图对本说明书一个或多个实施例的技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本说明书的一部分实施例,而不是全部的实施例。基于本说明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本说明书一个或多个实施例保护的范围。
以下结合附图,详细说明本说明书各实施例提供的技术方案。
图1为本说明书实施例提供的一种商户证件信息的检验方法的流程示意图。从程序角度而言,流程的执行主体可以为用于检验商户证件信息的设备或该设备中搭载的程序。
如图1所示,该流程可以包括以下步骤:
步骤102:获取包含商户的待检验证件信息的图像。
在本说明书实施例中,在对商户进行合规检查时,需对包含商户的待检验证件信息的图像进行检验,以确定该商户使用的证件信息是否存在造假问题。其中,包含商户的待检验证件信息的图像的类别可以包括证件采集图像及非证件采集图像。
在本说明书实施例中,证件采集图像可以指对权威机构颁发的证书进行图像采集而得到的图像。因此,通常情况下,一张证件采集图像中包含的各个证件信息归属于同一种证件。例如,针对营业执照的扫描图像,针对商户上传的食品经营许可证的截图等。图2为本说明书实施例提供的一种证件采集图像的示意图;如图2所示,证件采集图像中除了包含证件信息以外,还可以包含登记部门的公章图案等。
而非证件采集图像可以指对包含证书中的证件信息的页面进行图像采集而得到的图像。例如,针对商户的店铺页面中标注的商户经营范围信息的截图,或者,针对商户的产品页面中标注的食品经营许可证的许可证编号信息的截图等。在实际应用中,非证件采集图像中可以包含一种或多种证件中的证件信息,非证件采集图像除了包含证件信息以外,还可以包含不属于证件中的信息。图3为本说明书实施例提供的一种非证件采集图像的示意图;如图3所示,该非证件采集图像中包含有“食品经营许可证编号”及“食品生成许可证编号”等证件信息,该非证件采集图像中还包含有“厂名”、“配料表”及“保质期”等非证件信息。
在本说明书实施例中,商户的待检验证件信息所属的证件可以有多种,例如,营业执照、企业法人营业执照、税务登记证、食品流通许可证、食品经营许可证、医疗器械经营许可证、专利证书等,对此不作具体限定。
步骤104:利用光学字符识别技术对所述图像进行处理,得到第一证件信息。
在本说明书实施例中,光学字符识别技术OCR(Optical Character Recognition)可以指利用电子设备通过检测图像上的暗、亮区域,以确定字符形状,然后用字符识别方法将形状翻译成计算机文字的过程;即采用光学的方式识别图像中的文字,并转换成文本格式的技术。
在本说明书实施例中,步骤104:具体可以包括:利用光学字符识别技术识别所述图像中的字符;将识别出的字符转化为文本信息,得到第一证件信息。
步骤106:从可信机构处获取所述商户的第二证件信息;所述第二证件信息的类别与所述第一证件信息的类别一致。
在本说明书实施例中,通常需要采用商户的可信的证件信息去与商户当前使用的证件信息进行比对,以判断该商户当前使用的证件信息是否为虚***信息。因此,需要从可信机构处获取所述商户的与第一证件信息的类别一致的第二证件信息。
在本说明书实施例中,从可信机构处获取的证件信息通常具有高可信度。该可信机构既可以是向商户颁发证件的权威机构,也可以是权威机构授权进行证件信息管理机构,对此不作具体限定。
步骤108:根据所述第二证件信息,对所述第一证件信息进行检验,得到检验结果。
在本说明书实施例中,可以使用商户的可信的第二证件信息与商户当前使用的第一证件信息进行比对,若一致,则可以表示商户使用了自身的真实的证件信息,符合合规要求。若不一致,则可以表示该商户则存在使用虚***信息的可能性,从而存在不符合合规要求的风险。
应当理解,本说明书一个或多个实施例所述的方法其中部分步骤的顺序可以根据实际需要相互交换,或者其中的部分步骤也可以省略或删除。
图1中的方法,利用从可信机构处获取的该商户的可信的第二证件信息,与从包含商户的待检验证件信息的图像中提取的第一证件信息,进行自动比对,以自动生成针对商户的待检验证件信息的检验结果。而无需人工进行审核,有利于降低审核商户证件信息时所需消耗的人力资源。
基于图1的方法,本说明书实施例还提供了该方法的一些具体实施方案,下面进行说明。
在本说明书实施例中,在去可信机构处获取证件信息时,需要预先确定需要获取哪种证件的证件信息。
因此,在从可信机构处获取所述商户的第二证件信息之前,还可以包括:识别所述第一证件信息中的关键文本信息。根据所述关键文本信息,确定所述第一证件信息对应的证件类别。
对应的,所述从可信机构处获取所述商户的第二证件信息,具体可以包括:从可信机构处获取所述商户的第二证件信息,所述第二证件信息对应的证件类别与所述第一证件信息对应的证件类别一致。
在本说明书实施例中,可以预先针对每种证件去指定对应的关键文本信息。若第一证件信息中包含了某种关键文本信息,则可以确定该第一证件信息对应的证件类别为与该关键文本信息对应的证件。在实际应用中,一种证件对应的关键文本信息既可以有一种,也可以有多种,对此不作具体限定。例如,营业执照这一证件中的关键文本信息可以为“营业执照”,而税务登记证这一证件中的关键文本信息则可以包含“税务登记证”及“纳税人名称”等信息。
为便于理解,对于确定第一证件信息对应的证件类别的实现方式进行举例说明。例如,假定,第一证件信息为:“营业执照;名称XX公司;法定代表人XXX;经营范围文具用品、办公用品”等文本信息。通过查询可知,第一证件信息中包含“营业执照”这一关键文本信息。因此,可以确定第一证件信息对应的证件类别为营业执照。
而若第一证件信息为:“营业执照;名称XX公司;纳税人名称YY”等文本信息。通过查询可知,第一证件信息中既包含了“营业执照”这一关键文本信息,还包含了“纳税人名称”这一关键文本信息。因此,可以确定第一证件信息对应的证件类别为多种,即分别为营业执照与税务登记证。从而使得需从可信机构处采集的第二证件信息对应的证件也应该包括营业执照及税务登记证。即从可信机构处采集的第二证件信息可以包括该商户的营业执照的证件信息及税务登记证的证件信息。
在本说明书实施例中,在去可信机构处获取证件信息时,还需要明确获取哪个商户的证件信息。
因此,从可信机构处获取所述商户的第二证件信息之前,还可以包括:根据所述商户在商务平台处的商户登记信息,确定所述商户的商户标识信息。
对应的,从可信机构处获取所述商户的第二证件信息,具体可以包括:从可信机构处获取所述商户标识信息所指示的商户的第二证件信息。
在本说明书实施例中,商户通常需要在商务平台处进行入驻登记操作,并填写商户登记信息,若商务平台对商户填写的商户登记信息验证通过,则商户才能在商务平台中进行经营活动。因此,可以将商户登记信息中填写的商户名称、统一社会信用代码等可以唯一标识商户的信息作为该商户的商户标识信息,以根据该商户的商户标识信息,去从可信机构处获取该商户的证件信息。从而保证从可信机构处获取的商户的第二证件信息的可靠性及准确性。
在本说明书实施例中,步骤108:根据所述第二证件信息,对所述第一证件信息进行检验,得到检验结果,具体可以包括:
针对所述第一证件信息中的每个第一字段,从所述第二证件信息中确定与所述第一字段的内容类型一致的第二字段。
检验所述第一字段的内容信息与所述第二字段的内容信息是否匹配,得到检验结果。
为便理解,在此针对对于第一证件信息的检验方式进行举例说明。假定,第一证件信息对应的证件为营业执照,根据实际情况,可知,营业执照这一证件中包含的字段的内容类型可以包括:证件名称、企业名称、企业类型、法定代表人信息、经营范围信息、注册资本信息、成立日期信息、营业期限信息、住所信息、登记部门信息、统一社会信用代码信息等。
在进行检验时,需针对第一证件信息与第二证件信息中的同一种内容类别的字段的内容信息进行匹配检验,以得到检验结果。例如,当对第一证件信息中的经营范围信息进行检验时,需从第二证件信息中查找到经营范围信息,以比较第一证件信息中的经营范围信息与第二证件信息中的经营范围信息是否匹配。或者,当对第一证件信息中的企业名称信息进行检验时,需从第二证件信息中查找到企业名称信息,以比较第一证件信息中的企业名称信息与第二证件信息中的企业名称信息是否匹配。
在实际应用中,在对第一证件信息与第二证件信息中的同一种内容类型的字段的内容信息进行匹配检验时,可以在两个字段中的内容信息100%一致时,即两个字段中的文本完全相同时,再令检验结果表示这两个字段匹配。例如,当第一证件信息中的第一字段的文本内容为“经营范围文具用品、办公用品”时,只有第二证件信息中的第二字段的文本内容也为“经营范围文具用品、办公用品”时,才能生成表示这两个字段匹配的检验结果。
或者,也可以对第一证件信息与第二证件信息中的同一种内容类型的字段中的内容进行模糊匹配,在两个字段中的内容信息的匹配度大于预设阈值(例如,80%)时,既可以令检验结果表示这两个字段匹配。例如,假定,第一证件信息中的第一字段的文本内容为“经营范围文具用品、办公用品”,若第二证件信息中的与该第一字段的内容类型一致的第二字段的文本内容为“经营范围文具品、办公用品”,尽管第二字段中的“文件品”与第一字段中的“文具用品”并不一致,但该第一字段与第二字段的匹配度大于预设阈值,因此,也可以生成表示这两个字段匹配的检验结果。
在本说明书实施例中,由于包含待识别证件信息的图像的采集光照影响,或者该图像中的字符体积大小的影响,以及商户使用伪造证件图像等因素的影响,可能使得根据该图像识别出的第一证件信息中的某些内容类型的字段缺失。因此,除了对第一证件信息中包含的字段进行匹配性检验以外,还需要检验第一证件信息中缺少哪些字段。
从而,在检验所述第一字段的内容信息与所述第二字段的内容信息是否匹配之后,还可以包括:
针对所述第二证件信息中包含的每个内容类型的第二字段,检验所述第一证件信息中是否缺少与所述第二字段的内容类型一致的第一字段,得到检验结果。
在本说明书实施例中,还可以根据第一证件信息中缺少的字段及第一证件信息中包含的与第二证件信息不匹配的字段,去对商户进行风险控制。
具体的,所述根据所述第二证件信息,对所述第一证件信息进行检验,得到检验结果之后,还可以包括:
根据所述检验结果,判断所述第一证件信息中是否缺少指定内容类型的字段,得到第一判断结果。
根据所述检验结果,判断所述第一证件信息中所述指定内容类型的字段的内容信息与所述第二证件信息中所述指定内容类型的字段的内容信息是否匹配,得到第二判断结果。
若所述第一判断结果表示所述第一证件信息中缺少指定内容类型的字段和/或所述第二判断结果表示所述第一证件信息中所述指定内容类型的字段的内容信息与所述第二证件信息中所述指定内容类型的字段的内容信息不匹配,则可以生成用于表示所述商户存在风险的风险提示信息。
在本说明书实施例中,可以针对各个类型的证件预先设置对应的指定内容类型的字段,一种证件对应的指定内容类型的字段既可以是一个也可以是多个。而不同类别的证件对应的指定内容类型的字段也可以是不同的。通常该指定内容类型的字段应该为证件信息中的重要性较高的内容类型的字段。例如,证件中的商户名称信息、证件编号信息、证件有效期信息等。对此不作具体限定。
其中,生成的用于表示商户存在风险的风险提示信息,可以具体提示哪种证件中的哪个内容类型的字段存在何种问题,例如,可以提示营业执照中的企业名称字段缺失、营业期限字段不匹配等。以便于商户根据该风险提示信息对其使用的证件进行检查、更正。
在实际应用中,证件中可能存在一些重要性较低的内容类型的字段,例如,危险化学品经营许可证中的经营方式字段,食品经营许可证中的投诉举报电话字段等。当这类字段存在缺失或不匹配的问题,通常是无法反应商户是否存在合规问题的,因此,若根据第一判断结果及第二判断结果,确定第一证件信息中的非指定内容类型的字段存在缺失或不匹配问题,而第一证件信息中的指定内容类型的字段不存在缺失或不匹配问题,则可以认为该商户存在合规问题的风险较低,此时,可以无需生成表示商户存在风险的风险提示信息。
在本说明书实施例中,在确定是否生成用于表示商户存在风险的风险提示信息之前,还可以包括:识别所述图像的类别;所述图像的类别包括证件采集图像及非证件采集图像。
在本说明书实施例中,由于证件采集图像中通常需包含权威机构颁发的证件中的全部内容类型的字段,因此,当识别出的所述图像的类别为证件采集图像时,需要既判断所述第一证件信息中是否缺少指定内容类型的字段,去得到第一判断结果;又判断所述第一证件信息中所述指定内容类型的字段的内容信息与所述第二证件信息中所述指定内容类型的字段的内容信息是否匹配,去得到第二判断结果。以同时结合第一判断结果及第二判断结果,去确定是否生成用于表示商户存在风险的风险提示信息。
而由于非证件采集图像中通常并不会包含权威机构颁发的证件中的全部内容类型的字段,因此,当识别出的所述图像的类别为非证件采集图像时,可以只判断所述第一证件信息中指定内容类型的字段的内容信息与所述第二证件信息中所述指定内容类型的字段的内容信息是否匹配,得到第二判断结果。以根据第二判断结果,去确定是否生成用于表示商户存在风险的风险提示信息。而无需去判断所述第一证件信息中是否缺少指定内容类型的字段。既有利于节省计算资源,又有利于提升生成的风险提示信息的准确性。
在本说明书实施例中,所述识别所述图像的类别,具体可以包括:
利用神经网络模型对所述图像进行分类处理,得到所述图像的类别信息;所述神经网络模型是使用证件采集图像样本及非证件采集图像样本进行训练得到的;或者,获取所述图像的类别标识信息;所述图像是根据所述类别标识信息进行图像采集时所采集到的所述商户的图像。
在本说明书实施例中,由于证件采集图像中通过会携带公章等图案,而非证件采集图像中则通常并不会携带公章等图案,因此,可以预先使用证件采集图像样本及非证件采集图像样本对神经网络模型,以使用训练后的神经网络模型对包含商户的待检验证件信息的图像进行分类。其中,神经网络模型的实现方式可以有多种,例如利用卷积神经网络模型搭建的图像分类模型、利用支持向量机搭建的图像分类模型等,对此不作具体限定。
或者,可以获取所述图像的类别标识信息,以识别所述图像的类别;所述图像是根据所述类别标识信息进行图像采集时所采集到的商户的图像。
在实际应用中,可以依序对证件采集图像及非证件采集图像进行采集。因此,可以为在执行针对证件采集图像的采集操作时所采集到的图像,设置表示该图像为证件采集图像的标识信息,而为在执行针对非证件采集图像的采集操作时所采集到的图像,设置表示该图像为非证件采集图像的标识信息。以根据包含待检测证件信息的图像的类别标识信息,识别所述图像的类别。
基于同样的思路,本说明书实施例还提供了上述方法对应的装置。图4为本说明书实施例提供的对应于图1的一种商户证件信息的检验装置的结构示意图。如图4所示,该装置可以包括:
第一获取模块402,用于获取包含商户的待检验证件信息的图像。
图像处理模块404,用于利用光学字符识别技术对所述图像进行处理,得到第一证件信息。
第二获取模块406,用于从可信机构处获取所述商户的第二证件信息;所述第二证件信息的类别与所述第一证件信息的类别一致。
检验模块408,用于根据所述第二证件信息,对所述第一证件信息进行检验,得到检验结果。
基于图4的装置,本说明书实施例还提供了该方法的一些具体实施方案,下面进行说明。
可选的,图4中的装置,还可以包括:
关键文本信息识别模块,用于识别所述第一证件信息中的关键文本信息。
第一确定模块,用于根据所述关键文本信息,确定所述第一证件信息对应的证件类别。
所述第二获取模块,具体可以用于:从可信机构处获取所述商户的第二证件信息,所述第二证件信息对应的证件类别与所述第一证件信息对应的证件类别一致。
可选的,图4中的装置,还可以包括:
第二确定模块,用于根据所述商户在商务平台处的商户登记信息,确定所述商户的商户标识信息。
所述第二获取模块,具体可以用于:从可信机构处获取所述商户标识信息所指示的商户的第二证件信息。
可选的,图4中的装置,所述检验模块408,具体可以用于:
针对所述第一证件信息中的每个第一字段,从所述第二证件信息中确定与所述第一字段的内容类型一致的第二字段。
检验所述第一字段的内容信息与所述第二字段的内容信息是否匹配,得到检验结果。
可选的,图4中的装置,所述检验模块408,具体可以用于:
针对所述第二证件信息中包含的每个内容类型的第二字段,检验所述第一证件信息中是否缺少与所述第二字段的内容类型一致的第一字段,得到检验结果。
可选的,图4中的装置,还可以包括:
第一判断模块,用于根据所述检验结果,判断所述第一证件信息中是否缺少指定内容类型的字段,得到第一判断结果。
第二判断模块,用于根据所述检验结果,判断所述第一证件信息中所述指定内容类型的字段的内容信息与所述第二证件信息中所述指定内容类型的字段的内容信息是否匹配,得到第二判断结果。
风险提示信息生成模块,用于若所述第一判断结果表示所述第一证件信息中缺少指定内容类型的字段,或者所述第二判断结果表示所述第一证件信息中所述指定内容类型的字段的内容信息与所述第二证件信息中所述指定内容类型的字段的内容信息不匹配,则生成用于表示所述商户存在风险的风险提示信息。
可选的,图4中的装置,还可以包括:图像类别识别模块,用于识别所述图像的类别;所述图像的类别包括证件采集图像及非证件采集图像。
所述第一判断模块,具体可以用于:当识别出的所述图像的类别为证件采集图像时,判断所述第一证件信息中是否缺少指定内容类型的字段。
所述第二判断模块,具体可以用于:当识别出的所述图像的类别为证件采集图像时,判断所述第一证件信息中所述指定内容类型的字段的内容信息与所述第二证件信息中所述指定内容类型的字段的内容信息是否匹配。
可选的,图4中的装置,所述第二判断模块,具体可以用于:当识别出的所述图像的类别为非证件采集图像时,判断所述第一证件信息中指定内容类型的字段的内容信息与所述第二证件信息中所述指定内容类型的字段的内容信息是否匹配。
可选的,图4中的装置,所述图像类别识别模块,具体可以用于:利用神经网络模型对所述图像进行分类处理,得到所述图像的类别信息;所述神经网络模型是使用证件采集图像样本及非证件采集图像样本进行训练得到的;或者,获取所述图像的类别标识信息;所述图像是根据所述类别标识信息进行图像采集时所采集到的所述商户的图像。
基于同样的思路,本说明书实施例还提供了上述方法对应的设备。
图5为本说明书实施例提供的对应于图1的一种商户证件信息的检验设备的结构示意图。如图5所示,设备500可以包括:
至少一个处理器510;以及,
与所述至少一个处理器通信连接的存储器530;其中,
所述存储器530存储有可被所述至少一个处理器510执行的指令520,所述指令被所述至少一个处理器510执行,以使所述至少一个处理器510能够:
获取包含商户的待检验证件信息的图像。
利用光学字符识别技术对所述图像进行处理,得到第一证件信息。
从可信机构处获取所述商户的第二证件信息;所述第二证件信息的类别与所述第一证件信息的类别一致。
根据所述第二证件信息,对所述第一证件信息进行检验,得到检验结果。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于图5所示的商户证件信息的检验设备而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字符***“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的***、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字符助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本发明的实施例可提供为方法、***、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字符多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、***或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (20)

1.一种商户证件信息的检验方法,包括:
获取包含商户的待检验证件信息的图像;
利用光学字符识别技术对所述图像进行处理,得到第一证件信息;
从可信机构处获取所述商户的第二证件信息;所述第二证件信息的类别与所述第一证件信息的类别一致;
根据所述第二证件信息,对所述第一证件信息进行检验,得到检验结果。
2.根据权利要求1所述的方法,所述从可信机构处获取所述商户的第二证件信息之前,还包括:
识别所述第一证件信息中的关键文本信息;
根据所述关键文本信息,确定所述第一证件信息对应的证件类别;
所述从可信机构处获取所述商户的第二证件信息,具体包括:
从可信机构处获取所述商户的第二证件信息,所述第二证件信息对应的证件类别与所述第一证件信息对应的证件类别一致。
3.根据权利要求1或2所述的方法,所述从可信机构处获取所述商户的第二证件信息之前,还包括:
根据所述商户在商务平台处的商户登记信息,确定所述商户的商户标识信息;
所述从可信机构处获取所述商户的第二证件信息,具体包括:
从可信机构处获取所述商户标识信息所指示的商户的第二证件信息。
4.根据权利要求1所述的方法,所述利用光学字符识别技术对所述图像进行处理,得到第一证件信息,具体包括:
利用光学字符识别技术识别所述图像中的字符;
将识别出的字符转化为文本信息,得到第一证件信息。
5.根据权利要求4所述的方法,所述根据所述第二证件信息,对所述第一证件信息进行检验,得到检验结果,具体包括:
针对所述第一证件信息中的每个第一字段,从所述第二证件信息中确定与所述第一字段的内容类型一致的第二字段;
检验所述第一字段的内容信息与所述第二字段的内容信息是否匹配,得到检验结果。
6.根据权利要求5所述的方法,所述检验所述第一字段的内容信息与所述第二字段的内容信息是否匹配之后,还包括:
针对所述第二证件信息中包含的每个内容类型的第二字段,检验所述第一证件信息中是否缺少与所述第二字段的内容类型一致的第一字段,得到检验结果。
7.根据权利要求6所述的方法,所述根据所述第二证件信息,对所述第一证件信息进行检验,得到检验结果之后,还包括:
根据所述检验结果,判断所述第一证件信息中是否缺少指定内容类型的字段,得到第一判断结果;
根据所述检验结果,判断所述第一证件信息中所述指定内容类型的字段的内容信息与所述第二证件信息中所述指定内容类型的字段的内容信息是否匹配,得到第二判断结果;
若所述第一判断结果表示所述第一证件信息中缺少所述指定内容类型的字段,或者,所述第二判断结果表示所述第一证件信息中所述指定内容类型的字段的内容信息与所述第二证件信息中所述指定内容类型的字段的内容信息不匹配,则生成用于表示所述商户存在风险的风险提示信息。
8.根据权利要求7所述的方法,还包括:
识别所述图像的类别;所述图像的类别包括证件采集图像及非证件采集图像;
所述判断所述第一证件信息中是否缺少指定内容类型的字段,具体包括:
当识别出的所述图像的类别为证件采集图像时,判断所述第一证件信息中是否缺少指定内容类型的字段;
所述判断所述第一证件信息中所述指定内容类型的字段的内容信息与所述第二证件信息中所述指定内容类型的字段的内容信息是否匹配,具体包括:
当识别出的所述图像的类别为证件采集图像时,判断所述第一证件信息中所述指定内容类型的字段的内容信息与所述第二证件信息中所述指定内容类型的字段的内容信息是否匹配。
9.根据权利要求8所述的方法,所述判断所述第一证件信息中所述指定内容类型的字段的内容信息与所述第二证件信息中所述指定内容类型的字段的内容信息是否匹配,具体包括:
当识别出的所述图像的类别为非证件采集图像时,判断所述第一证件信息中所述指定内容类型的字段的内容信息与所述第二证件信息中所述指定内容类型的字段的内容信息是否匹配。
10.根据权利要求8所述的方法,所述识别所述图像的类别,具体包括:
利用神经网络模型对所述图像进行分类处理,得到所述图像的类别信息;所述神经网络模型是使用证件采集图像样本及非证件采集图像样本进行训练得到的;
或者,获取所述图像的类别标识信息;所述图像是根据所述类别标识信息进行图像采集时所采集到的所述商户的图像。
11.一种商户证件信息的检验装置,包括:
第一获取模块,用于获取包含商户的待检验证件信息的图像;
图像处理模块,用于利用光学字符识别技术对所述图像进行处理,得到第一证件信息;
第二获取模块,用于从可信机构处获取所述商户的第二证件信息;所述第二证件信息的类别与所述第一证件信息的类别一致;
检验模块,用于根据所述第二证件信息,对所述第一证件信息进行检验,得到检验结果。
12.根据权利要求11所述的装置,还包括:
关键文本信息识别模块,用于识别所述第一证件信息中的关键文本信息;
第一确定模块,用于根据所述关键文本信息,确定所述第一证件信息对应的证件类别;
所述第二获取模块,具体用于:
从可信机构处获取所述商户的第二证件信息,所述第二证件信息对应的证件类别与所述第一证件信息对应的证件类别一致。
13.根据权利要求11或12所述的装置,还包括:
第二确定模块,用于根据所述商户在商务平台处的商户登记信息,确定所述商户的商户标识信息;
所述第二获取模块,具体用于:
从可信机构处获取所述商户标识信息所指示的商户的第二证件信息。
14.根据权利要求11所述的装置,所述检验模块,具体用于:
针对所述第一证件信息中的每个第一字段,从所述第二证件信息中确定与所述第一字段的内容类型一致的第二字段;
检验所述第一字段的内容信息与所述第二字段的内容信息是否匹配,得到检验结果。
15.根据权利要求14所述的装置,所述检验模块,具体用于:
针对所述第二证件信息中包含的每个内容类型的第二字段,检验所述第一证件信息中是否缺少与所述第二字段的内容类型一致的第一字段,得到检验结果。
16.根据权利要求15所述的装置,还包括:
第一判断模块,用于根据所述检验结果,判断所述第一证件信息中是否缺少指定内容类型的字段,得到第一判断结果;
第二判断模块,用于根据所述检验结果,判断所述第一证件信息中所述指定内容类型的字段的内容信息与所述第二证件信息中所述指定内容类型的字段的内容信息是否匹配,得到第二判断结果;
风险提示信息生成模块,用于若所述第一判断结果表示所述第一证件信息中缺少所述指定内容类型的字段,或者,所述第二判断结果表示所述第一证件信息中所述指定内容类型的字段的内容信息与所述第二证件信息中所述指定内容类型的字段的内容信息不匹配,则生成用于表示所述商户存在风险的风险提示信息。
17.根据权利要求16所述的装置,还包括:
图像类别识别模块,用于识别所述图像的类别;所述图像的类别包括证件采集图像及非证件采集图像;
所述第一判断模块,具体用于:
当识别出的所述图像的类别为证件采集图像时,判断所述第一证件信息中是否缺少指定内容类型的字段;
所述第二判断模块,具体用于:
当识别出的所述图像的类别为证件采集图像时,判断所述第一证件信息中所述指定内容类型的字段的内容信息与所述第二证件信息中所述指定内容类型的字段的内容信息是否匹配。
18.根据权利要求17所述的装置,所述第二判断模块,具体用于:
当识别出的所述图像的类别为非证件采集图像时,判断所述第一证件信息中指定内容类型的字段的内容信息与所述第二证件信息中所述指定内容类型的字段的内容信息是否匹配。
19.根据权利要求17所述的装置,所述图像类别识别模块,具体用于:
利用神经网络模型对所述图像进行分类处理,得到所述图像的类别信息;所述神经网络模型是使用证件采集图像样本及非证件采集图像样本进行训练得到的;
或者,获取所述图像的类别标识信息;所述图像是根据所述类别标识信息进行图像采集时所采集到的所述商户的图像。
20.一种商户证件信息的检验设备,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:
获取包含商户的待检验证件信息的图像;
利用光学字符识别技术对所述图像进行处理,得到第一证件信息;
从可信机构处获取所述商户的第二证件信息;所述第二证件信息的类别与所述第一证件信息的类别一致;
根据所述第二证件信息,对所述第一证件信息进行检验,得到检验结果。
CN202010825756.5A 2020-08-17 2020-08-17 一种商户证件信息的检验方法、装置及设备 Pending CN111985936A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010825756.5A CN111985936A (zh) 2020-08-17 2020-08-17 一种商户证件信息的检验方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010825756.5A CN111985936A (zh) 2020-08-17 2020-08-17 一种商户证件信息的检验方法、装置及设备

Publications (1)

Publication Number Publication Date
CN111985936A true CN111985936A (zh) 2020-11-24

Family

ID=73435167

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010825756.5A Pending CN111985936A (zh) 2020-08-17 2020-08-17 一种商户证件信息的检验方法、装置及设备

Country Status (1)

Country Link
CN (1) CN111985936A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112487982A (zh) * 2020-11-30 2021-03-12 乐刷科技有限公司 商户信息的审核方法、***和存储介质
CN112613891A (zh) * 2020-12-24 2021-04-06 支付宝(杭州)信息技术有限公司 一种店铺注册信息验证方法、装置及设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109377240A (zh) * 2018-08-21 2019-02-22 中国平安人寿保险股份有限公司 基于神经网络的商户管理方法、装置、计算机设备及存储介质
CN110163204A (zh) * 2019-04-15 2019-08-23 平安国际智慧城市科技股份有限公司 基于图像识别的商家监管方法、装置及存储介质
CN111241367A (zh) * 2019-12-27 2020-06-05 航天信息股份有限公司 一种基于自定义规则对网络餐饮平台进行监管的方法及***

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109377240A (zh) * 2018-08-21 2019-02-22 中国平安人寿保险股份有限公司 基于神经网络的商户管理方法、装置、计算机设备及存储介质
CN110163204A (zh) * 2019-04-15 2019-08-23 平安国际智慧城市科技股份有限公司 基于图像识别的商家监管方法、装置及存储介质
CN111241367A (zh) * 2019-12-27 2020-06-05 航天信息股份有限公司 一种基于自定义规则对网络餐饮平台进行监管的方法及***

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112487982A (zh) * 2020-11-30 2021-03-12 乐刷科技有限公司 商户信息的审核方法、***和存储介质
CN112613891A (zh) * 2020-12-24 2021-04-06 支付宝(杭州)信息技术有限公司 一种店铺注册信息验证方法、装置及设备
CN112613891B (zh) * 2020-12-24 2023-10-03 支付宝(杭州)信息技术有限公司 一种店铺注册信息验证方法、装置及设备

Similar Documents

Publication Publication Date Title
CN112199506B (zh) 一种应用程序的信息检测方法、装置及设备
CN112214418B (zh) 一种应用程序的合规检测方法、装置和电子设备
US20160140026A1 (en) Systems and Methods for Selection of Test Cases for Payment Terminals
CN112257114A (zh) 一种应用程序隐私合规检测方法、装置、设备和介质
CN110909363A (zh) 基于大数据的软件第三方组件漏洞应急响应***及方法
CN110674360B (zh) 一种用于数据的溯源方法和***
CN111353488B (zh) 识别码图像中的风险的方法、装置以及设备
CN111985936A (zh) 一种商户证件信息的检验方法、装置及设备
CN114416714B (zh) 数据治理***
CN112287071A (zh) 一种文本关系提取方法、装置及电子设备
CN110750297B (zh) 一种基于程序分析和文本分析的Python代码参考信息生成方法
CN109492401B (zh) 一种内容载体风险检测方法、装置、设备及介质
Fischbach et al. Cira: A tool for the automatic detection of causal relationships in requirements artifacts
Rohaime et al. Integrated Invoicing Solution: A Robotic Process Automation with AI and OCR Approach
CN111985935A (zh) 一种商户信息的检验方法、装置及设备
CN111639903A (zh) 一种针对架构变更的评审处理方法及相关设备
CN114443834A (zh) 一种证照信息提取的方法、装置及存储介质
CN114638597A (zh) 政务智能办应用***、方法、终端及介质
CN114625633A (zh) 用于接口测试的方法、***和存储介质
CN114092119A (zh) 供应关系获取方法、装置、存储介质及电子设备
CN113935748A (zh) 一种抽检对象的筛选方法、装置、设备及介质
CN112966671A (zh) 一种合同检测方法、装置、电子设备及存储介质
CN109146395B (zh) 一种数据处理的方法、装置及设备
CN112580334A (zh) 一种文案处理方法、装置、服务器及存储介质
CN113010573A (zh) 一种关联关系提取方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20201124