CN115018513A - 数据巡检方法、装置、设备及存储介质 - Google Patents

数据巡检方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN115018513A
CN115018513A CN202210585690.6A CN202210585690A CN115018513A CN 115018513 A CN115018513 A CN 115018513A CN 202210585690 A CN202210585690 A CN 202210585690A CN 115018513 A CN115018513 A CN 115018513A
Authority
CN
China
Prior art keywords
merchant
data
inspection
target
task
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210585690.6A
Other languages
English (en)
Inventor
彭云胜
刘成
潘奋全
梅敏君
罗纳
王旭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Bank Co Ltd
Original Assignee
Ping An Bank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Bank Co Ltd filed Critical Ping An Bank Co Ltd
Priority to CN202210585690.6A priority Critical patent/CN115018513A/zh
Publication of CN115018513A publication Critical patent/CN115018513A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/018Certifying business or products
    • G06Q30/0185Product, service or business identity fraud
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/40Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
    • G06Q20/401Transaction verification
    • G06Q20/4016Transaction verification involving fraud or risk level assessment in transaction processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/19173Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Finance (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Evolutionary Computation (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Graphics (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Geometry (AREA)
  • Technology Law (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及互联网技术领域,公开了一种数据巡检方法、装置、设备及存储介质。本方法包括:基于查询的商户交易数据和商户状态数据,确定与待巡检商户的巡检任务以及巡检任务对应的地理位置数据;基于地理位置数据选定执行巡检任务的巡检终端,并将巡检任务发送至巡检终端上;根据确定的巡检项目获取商户上传的图像数据,并将图像数据输入OCR识别模型进行识别,得到目标商户数据;将目标商户数据输入图神经网络进行特征提取,得到数据的目标特征向量;将目标特征向量输入分类模型的预测层进行风险预测,得到商户的巡检结果。本发明通过定期生成巡检工单并完成自动派发,提高商户巡检工作的及时性,解决了商户信息采集效准确率和效率低下的技术问题。

Description

数据巡检方法、装置、设备及存储介质
技术领域
本发明涉及互联网技术领域,尤其涉及一种数据巡检方法、装置、设备及存储介质。
背景技术
与传统的现金交易、银行转账等传统支付方式相比,网络支付在效率和便捷性等方面都具有明显的优势。在网络支付场景中,支付机构应当具备必要的技术手段,确保支付业务的及时性、准确性和安全性,因此,支付机构需要设计合理的风控规则以实现对支付业务的风险管控。
目前,随着商户数量的增加,为商户提供服务的支付机构,面临对商户进行风险管控的要求传统银行商户收单业务的巡检任务是与银行合作的巡检公司,线下到商户门店,收集商户的纸质材料。以核实商户是否在正常运营,证件是否齐全。无法保证巡检人员巡检的真实性、巡检时效,人力成本也相对较高。因此,如何保证巡检的真实性,同时提高巡检效率成了本领域技术人员需要解决的技术问题。
发明内容
本发明的主要目的在于通过服务器定期生成巡检工单并完成自动派发,提高了商户巡检工作的及时性,以解决商户信息采集效准确率和效率低下的技术问题。
本发明第一方面提供了数据巡检方法,包括:在确定待巡检商户后,从预置数据库中查询出所述待巡检商户的商户交易数据和商户状态数据;基于所述商户交易数据和所述商户状态数据,确定与所述待巡检商户的巡检任务以及所述巡检任务对应的地理位置数据;基于所述地理位置数据选定执行所述巡检任务的巡检终端,并将所述巡检任务发送至所述巡检终端上;确定所述巡检任务中预设的待巡检项目,根据所述巡检项目获取所述待巡检商户上传的图像数据,并将所述图像数据输入预设OCR识别模型进行识别,得到所述待巡查商户的目标商户数据;将所述目标商户数据输入预设图神经网络进行特征提取,得到所述目标商户数据的目标特征向量;将所述目标特征向量输入预置分类模型的预测层进行风险预测,得到所述待巡检商户的巡检结果。
可选地,在本发明第一方面的第一种实现方式中,在所述基于所述商户交易数据和所述商户状态数据,确定与所述待巡检商户的巡检任务以及所述巡检任务对应的地理位置数据之前,还包括:对所述待巡检商户进行黑名单核查;若所述待巡检商户不在预设的黑名单中,则生成与所述待巡检商户对应的巡检任务;若所述待巡检商户位于所述黑名单中,则输出错误提示。
可选地,在本发明第一方面的第二种实现方式中,所述基于所述地理位置数据选定执行所述巡检任务的巡检终端,并将所述巡检任务发送至所述巡检终端上包括:将所述巡检任务的任务信息发布至满足设定的巡检条件的所有巡检终端;若接收到所述巡检终端返回的关于所述任务信息的终端应答信息,则将最早接收到的所述终端应答信息所对应的所述巡检终端确定为目标终端,将所述巡检任务发送至所述目标终端。
可选地,在本发明第一方面的第三种实现方式中,在所述基于所述地理位置数据选定执行所述巡检任务的巡检终端,并将所述巡检任务发送至所述巡检终端上之后,还包括:获取待巡检商户的预设种类风险表征信息;基于所述风险表征信息,确定与所述待巡检商户关联的风险量化标签;根据所述风险量化标签,确定所述待巡检商户的待巡检项目。
可选地,在本发明第一方面的第四种实现方式中,所述将所述图像数据输入预设OCR识别模型进行识别,得到所述待巡查商户的目标商户数据包括:对所述图像数据进行分割,得到多个图像块;对所述多个图像块进行降噪处理,得到每个图像块对应的去噪图像块;分别将所述图像块输入预设OCR识别模型进行识别,得到每个图像块的识别结果;根据所述每个图像块的识别结果,得到所述待巡查商户的目标商户数据。
可选地,在本发明第一方面的第五种实现方式中,在所述图神经网络包括采样层和卷积层,所述将所述目标商户数据输入预设图神经网络进行特征提取,得到所述目标商户数据的目标特征向量之前,还包括:获取样本训练数据,并将所述样本训练数据作为训练集,其中,所述样本训练集中包括样本商户对应的风险量化标签;基于所述样本训练数据,生成样本异构关系网络图的样本邻接矩阵和样本交易属性特征矩阵;将所述样本邻接矩阵和所述样本交易属性特征矩阵输入初始图神经网络进行特征提取,得到所述样本商户的初始目标特征向量;基于所述初始目标特征向量对应的风险识别类别和所述风险量化标签的交叉熵,确定损失函数;基于所述损失函数,确定下降梯度;基于所述下降梯度和预设学习率更新所述初始图神经网络的网络参数,得到更新后的图神经网络。
可选地,在本发明第一方面的第六种实现方式中,在所述根据所述目标特征向量预测所述待巡检商户是否存在风险,得到所述待巡检商户的巡检结果之后,还包括:获取所述巡检结果对应的验证信息;对所述验证信息的真实性进行验证,当所述验证信息的真实性通过验证后,对所述验证信息进行校验;当对所述验证信息的校验通过后,将所述巡检结果上报至后台管理***。
本发明第二方面提供了一种数据巡检装置,包括:查询模块,用于在确定待巡检商户后,从预置数据库中查询出所述待巡检商户的商户交易数据和商户状态数据;第一确定模块,用于基于所述商户交易数据和所述商户状态数据,确定与所述待巡检商户的巡检任务以及所述巡检任务对应的地理位置数据;发送模块,用于基于所述地理位置数据选定执行所述巡检任务的巡检终端,并将所述巡检任务发送至所述巡检终端上;识别模块,用于确定所述巡检任务中预设的待巡检项目,根据所述巡检项目获取所述待巡检商户上传的图像数据,并将所述图像数据输入预设OCR识别模型进行识别,得到所述待巡查商户的目标商户数据;第一特征提取模块,用于将所述目标商户数据输入预设图神经网络进行特征提取,得到所述目标商户数据的目标特征向量;预测模块,用于将所述目标特征向量输入预置分类模型的预测层进行风险预测,得到所述待巡检商户的巡检结果。
可选地,在本发明第二方面的第一种实现方式中,所述数据巡检装置还包括:核查模块,用于对所述待巡检商户进行黑名单核查;第一生成模块,用于若所述待巡检商户不在预设的黑名单中,则生成与所述待巡检商户对应的巡检任务;若所述待巡检商户位于所述黑名单中,则输出错误提示。
可选地,在本发明第二方面的第二种实现方式中,所述发送模块具体用于:将所述巡检任务的任务信息发布至满足设定的巡检条件的所有巡检终端;若接收到所述巡检终端返回的关于所述任务信息的终端应答信息,则将最早接收到的所述终端应答信息所对应的所述巡检终端确定为目标终端,将所述巡检任务发送至所述目标终端。
可选地,在本发明第二方面的第三种实现方式中,所述数据巡检装置还包括:第一获取模块,用于获取待巡检商户的预设种类风险表征信息;第一确定模块,用于基于所述风险表征信息,确定与所述待巡检商户关联的风险量化标签;根据所述风险量化标签,确定所述待巡检商户的待巡检项目。
可选地,在本发明第二方面的第四种实现方式中,所述识别模块包括:分割单元,用于对所述图像数据进行分割,得到多个图像块;降噪单元,用于对所述多个图像块进行降噪处理,得到每个图像块对应的去噪图像块;识别单元,用于分别将所述图像块输入预设OCR识别模型进行识别,得到每个图像块的识别结果;根据所述每个图像块的识别结果,得到所述待巡查商户的目标商户数据。
可选地,在本发明第二方面的第五种实现方式中,所述数据巡检装置还包括:第二生成模块,用于获取样本训练数据,并将所述样本训练数据作为训练集,其中,所述样本训练集中包括样本商户对应的风险量化标签;基于所述样本训练数据,生成样本异构关系网络图的样本邻接矩阵和样本交易属性特征矩阵;第二特征提取模块,用于将所述样本邻接矩阵和所述样本交易属性特征矩阵输入初始图神经网络进行特征提取,得到所述样本商户的初始目标特征向量;第三确定模块,用于基于所述初始目标特征向量对应的风险识别类别和所述风险量化标签的交叉熵,确定损失函数;基于所述损失函数,确定下降梯度;更新模块,用于基于所述下降梯度和预设学习率更新所述初始图神经网络的网络参数,得到更新后的图神经网络。
可选地,在本发明第二方面的第六种实现方式中,所述数据巡检装置还包括:第二获取模块,用于获取所述巡检结果对应的验证信息;验证模块,用于对所述验证信息的真实性进行验证,当所述验证信息的真实性通过验证后,对所述验证信息进行校验;当对所述验证信息的校验通过后,将所述巡检结果上报至后台管理***。
本发明第三方面提供了数据巡检设备,包括:存储器和至少一个处理器,所述存储器中存储有指令,所述存储器和所述至少一个处理器通过线路互连;
所述至少一个处理器调用所述存储器中的所述指令,以使得所述数据巡检设备执行上述的数据巡检方法的步骤。
本发明的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述的数据巡检方法的步骤。
本发明提供的技术方案中,通过在确定待巡检商户后,从预置数据库中查询出待巡检商户的商户交易数据和商户状态数据;基于商户交易数据和商户状态数据,确定与待巡检商户的巡检任务以及巡检任务对应的地理位置数据;基于巡检任务对应的地理位置数据,将巡检任务发送至对应的巡检终端;确定巡检任务中预设的待巡检项目,根据巡检项目获取待巡检商户上传的图像数据,并将图像数据输入预设OCR识别模型进行识别,得到待巡查商户的目标商户数据;将目标商户数据输入预设图神经网络进行特征提取,得到目标商户数据的目标特征向量;将目标特征向量输入预置分类模型的预测层进行风险预测,根据目标特征向量预测待巡检商户是否存在风险,得到待巡检商户的巡检结果。本发明通过对商户巡检流程的全线上化管理,实现商户巡检全行覆盖。解决商户巡检效率低的技术问题。
附图说明
图1为本发明提供的数据巡检方法的第一个实施例示意图;
图2为本发明提供的数据巡检方法的第二个实施例示意图;
图3为本发明提供的数据巡检方法的第三个实施例示意图;
图4为本发明提供的数据巡检方法的第四个实施例示意图;
图5为本发明提供的数据巡检方法的第五个实施例示意图;
图6为本发明提供的数据巡检装置的第一个实施例示意图;
图7为本发明提供的数据巡检装置的第二个实施例示意图;
图8为本发明提供的数据巡检设备的一个实施例示意图。
具体实施方式
本发明实施例提供的数据巡检方法、装置、设备及存储介质,先通过在确定待巡检商户后,从预置数据库中查询出待巡检商户的商户交易数据和商户状态数据;基于商户交易数据和商户状态数据,确定与待巡检商户的巡检任务以及巡检任务对应的地理位置数据;基于巡检任务对应的地理位置数据,将巡检任务发送至对应的巡检终端;确定巡检任务中预设的待巡检项目,根据巡检项目获取待巡检商户上传的图像数据,并将图像数据输入预设OCR识别模型进行识别,得到待巡查商户的目标商户数据;将目标商户数据输入预设图神经网络进行特征提取,得到目标商户数据的目标特征向量;将目标特征向量输入预置分类模型的预测层进行风险预测,根据目标特征向量预测待巡检商户是否存在风险,得到待巡检商户的巡检结果。本发明通过对商户巡检流程的全线上化管理,实现商户巡检全行覆盖。解决商户巡检效率低的技术问题。
本发明的说明书和权利要求书及上述附中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”或“具有”及其任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为便于理解,下面对本发明实施例的具体流程进行描述,请参阅图1,本发明实施例中数据巡检方法的第一个实施例包括:
101、在确定待巡检商户后,从预置数据库中查询出待巡检商户的商户交易数据和商户状态数据;
本实施例中,这里主要针对待巡检商户交易前后及交易发生时的数据进行采集,用于后续判断待巡检商户交易时的状态。
可选地,可以在商户每次进行交易时针对待巡检商户交易前后及交易发生时的数据进行采集,在后续需要对商户进行识别时,调用预先采集的商户数据来作判断。
例如,所述商户状态数据包括商户健康状态数据和商户定位状态数据中的至少一种;其中,所述商户健康状态数据可包括步数信息、心率信息、体温信息中的至少一种。例如,所述商户定位状态数据可以是基于移动位置服务(Location Based Service,简称LBS)的信息。
102、基于商户交易数据和商户状态数据,确定与待巡检商户的巡检任务以及巡检任务对应的地理位置数据;
本实施例中,收单商户线上化巡检模型采用巡检工单线上化管理,分行可以根据自身情况制定分行巡检频次、巡检时效、巡检机构等信息,动态生成年度(季度/月度)巡检单;可以根据分行特殊场景生产临时巡检工单;利用风控***结合大数据,分析商户交易及商户状态动态,生成风险巡检工单。
103、基于地理位置数据选定执行巡检任务的巡检终端,并将巡检任务发送至巡检终端上;
本实施例中,将商户巡检的过程进行线上化及远程化,首先,在服务端生成与待巡检商户对应的巡检任务,将巡检任务分配给巡检终端,该巡检终端为至少两个巡检客户端中的一个,巡检客户端为预先设置的用于执行巡检任务的终端,由上门调查的巡检人员持有。巡检终端的确定方式可为在所有巡检客户端中随机确定,可指定某个巡检客户端作为巡检终端,或者应用其他的确定方式,本发明实施例对此不做限定。
104、确定巡检任务中预设的待巡检项目,根据巡检项目获取待巡检商户上传的图像数据,并将图像数据输入预设OCR识别模型进行识别,得到待巡查商户的目标商户数据;
本实施例中,在巡检任务中设置至少两个待巡检项目,并确定待巡检商户的与待巡检项目对应的登记数据,为了便于说明,在本发明实施例中假设待巡检项目包括法人图片、统一社会信用代码、营业执照、企业办公地址、员工人数、企业评分、年营收额以及年营收增益。待巡检项目下的登记数据可在服务端进行手动添加,可在待巡检商户向银行提供的申请单(尽职调查申请单)中识别出登记数据并进行添加,也可将待巡检商户的名称以及待巡检项目共同作为关键词,在银行数据库、互联网或工商部门数据库中进行搜索,得到登记数据。值得一提的是,本步骤并非限定每个待巡检项目下都必须添加登记数据。
本实施例中,巡检人员可以使用巡检小程序登录后查看巡检工单,认领巡检任务;巡检人员需要在巡检周期内上门商户的门店,按照巡检工单要求提供影像资料及线上数据信息。根据所述巡检项目获取所述待巡检商户上传的图像数据,并将所述图像数据输入预设OCR识别模型进行识别,得到所述待巡查商户的目标商户数据。
本实施例中,OCR识别又叫光学字符识别(Optical Character Recognition,OCR)是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。通常,图像信息通过扫描仪、照相机、电子传真软件等设备获取并存储在图像文件中,然后OCR软件读取、分析图像文件并通过字符识别提取出其中的字符串。其中,在OCR技术中,图像预处理通常是针对图像的成像问题进行修正。输入文本经过扫描仪进入计算机后,由于纸张的厚薄、光洁度和印刷质量都会造成文字畸变,产生断笔、粘连和污点等干扰,所以在进行文字识别之前,要对带有噪声的文字图像进行处理。
具体地,文本识别是在文本检测的基础上,对文本内容进行识别,主要识别每个文字是什么。对一个文字图像,提取出特征,丢给分类器,分类器就对其进行分类,告诉你这个特征该识别成哪个文字。分类器的设计方法一般有:模板匹配法、判别函数法、神经网络分类法、基于规则推理法等。在进行实际识别前,往往还要对分类器进行训练,这是一个监督学习的过程。成熟的分类器也有很多,有SVM,CNN等。将图像中的文本信息转化为文本信息。
105、将目标商户数据输入预设图神经网络进行特征提取,得到目标商户数据的目标特征向量;
本实施例中,图神经网络可以包括GraphSAGE(Graph SAmple and aggreGatE,图采样与聚合),GraphSAGE是一种通过对邻居节点采样和特征聚合来对目标节点特征信息进行更新的归纳式(inductive)学习的图神经网络。具体的实施例中,目标特征信息可以为目标特征向量,利用图神经网络进行目标商户节点的邻居节点采样,并对采样得到的邻居节点的交易属性特征向量进行聚合处理从而得到目标特征向量。
106、将目标特征向量输入预置分类模型的预测层进行风险预测,得到待巡检商户的巡检结果。
本实施例中,上述分类模型可以包括但不限于神经网络、决策树,分类模型的风险识别类别可以包括:待巡检商户为风险商户或待巡检商户为非风险商户。具体的实施例中,将目标特征信息输入分类模型进行商户风险识别,得到待巡检商户识别为风险商户的第一识别概率和待巡检商户识别为非风险商户的第二识别概率。在实际应用中,第一识别概率与第二识别概率之和可以为1。
具体的,将上述第一识别概率作为上述风险识别指标数据;当上述第一概率大于预设阈值时,待巡检商户对应的待巡检商户节点的风险识别类别为风险商户;当上述第一概率小于预设阈值时,待巡检商户对应的待巡检商户节点的风险识别类别为非风险商户。在实际应用中,上述预设阈值可以结合实际应用中商户风险识别的准确度进行设置。
本实施例中,将聚合层输出的目标特征向量输入预置分类模型的预测层,由预测层根据风险特征向量预测线上商户是否存在非法平台风险。
由于在预测线上商户进行非法平台风险时考虑了多模态风险数据的时序信息,通过将多模态风险数据序列数据中的时序信息进行双向融合,使得各模态间的信息得到更加充分的利用和融合。因此避免了风险信息的缺失。故而,能够提高识别线上商户是否存在非法平台风险的准确性,从而更大程度识别出线上商户的非法平台风险,进而,能够更好的完成对线上商户的非法交易、非法投融资、禁限售行为的巡检,以优化对线上商户的监管。
本发明实施例中,通过在确定待巡检商户后,从预置数据库中查询出待巡检商户的商户交易数据和商户状态数据;基于商户交易数据和商户状态数据,确定与待巡检商户的巡检任务以及巡检任务对应的地理位置数据;基于巡检任务对应的地理位置数据,将巡检任务发送至对应的巡检终端;确定巡检任务中预设的待巡检项目,根据巡检项目获取待巡检商户上传的图像数据,并将图像数据输入预设OCR识别模型进行识别,得到待巡查商户的目标商户数据;将目标商户数据输入预设图神经网络进行特征提取,得到目标商户数据的目标特征向量;将目标特征向量输入预置分类模型的预测层进行风险预测,根据目标特征向量预测待巡检商户是否存在风险,得到待巡检商户的巡检结果。本发明通过对商户巡检流程的全线上化管理,实现商户巡检全行覆盖。解决商户巡检效率低的技术问题。
请参阅图2,本发明实施例中数据巡检方法的第二个实施例包括:
201、在确定待巡检商户后,从预置数据库中查询出待巡检商户的商户交易数据和商户状态数据;
202、对待巡检商户进行黑名单核查;
本实施例中,在分配巡检任务之前,服务端可对待巡检商户进行黑名单核查,具体可将待巡检商户的名称作为搜索条件在预设的黑名单中进行搜索,该黑名单可为银行内部的黑名单,也可为国家企业信息公示***提供的失信企业名单或经营异常名单等,本发明实施例对此不做限定。
203、若待巡检商户不在预设的黑名单中,则生成与待巡检商户对应的巡检任务;
本实施例中,若待巡检商户的名称不位于黑名单中,证明与待巡检商户对应的巡检任务是有效的,故在服务端生成与待巡检商户对应的巡检任务。
204、若待巡检商户位于黑名单中,则输出错误提示;
本实施例中,若待巡检商户的名称位于黑名单中,则为了防止因执行无效的巡检任务导致的人力资源浪费,输出错误提示,供相关人员进一步核查。
205、基于商户交易数据和商户状态数据,确定与待巡检商户的巡检任务以及巡检任务对应的地理位置数据;
206、基于巡检任务对应的地理位置数据,将巡检任务的任务信息发布至满足设定的巡检条件的所有巡检终端;
本实施例中,将巡检任务的任务信息发布至满足设定的巡检条件的所有巡检终端,具体可为不同巡检终端设置不同的巡检等级,并将巡检条件设置为特定等级;也可预先为巡检终端设置客户端状态,客户端状态包括不可巡检状态和可巡检状态,并将巡检条件设置成客户端状态为可巡检状态。其中,任务信息包括但不限于待巡检商户的企业名称及待巡检商户的地理位置。
207、若接收到巡检终端返回的关于任务信息的终端应答信息,则将最早接收到的终端应答信息所对应的巡检终端确定为目标终端,将巡检任务发送至目标终端;
本实施例中,在将任务信息发布至满足巡检条件的巡检终端后,持有巡检终端的巡检人员便可根据任务信息判断是否通过巡检终端向服务端返回客户端应答信息。若服务端接收到巡检终端关于任务信息的客户端应答信息,则将最早接收到的客户端应答信息所对应的巡检终端确定为巡检终端,将巡检任务分配至巡检终端,上述过程相当于将巡检任务分配至应答最快的巡检终端。
208、获取待巡检商户的预设种类风险表征信息;
本实施例中,获取待巡检商户的风险表征信息,风险表征信息包括以下至少之一:商户主体信息、财务科目信息、公司产品信息、用途与优先级和政策扶持内容。商户主体信息例如可以包括商户注册地区、商户经营时长等信息,财务科目信息例如可以包括商户注册资本、商户经营流水等信息,公司产品信息例如可以包括公司产品类型、产品规模等信息,用途与优先级例如可以包括公司产品用途、所处行业类型等信息,政策扶持内容例如可以包括国家信贷放宽、收紧、扶持等政策内容。
风险表征信息用于对待巡检商户初步进行风险分类与风险量化评估,风险表征信息可以是网络信贷业务的部分待巡检项目。获取风险表征信息的方法具体可以由待巡检商户通过线上数据传输方式传递给巡检服务器,也可以由巡检服务器从国家商户信息公示***等线上数据源中获取。
209、基于风险表征信息,确定与待巡检商户关联的风险量化标签;
本实施例中,基于获取的风险表征信息,对待巡检商户进行打标签分类,实现对待巡检商户进行风险类别划分和风险量化评估,得到用于表征待巡检商户的信贷风险信息的至少一个风险量化标签。
210、根据风险量化标签,确定待巡检商户的待巡检项目;
本实施例中,根据确定出的至少一个风险量化标签,确定用于对待巡检商户进行线上巡检的待巡检项目。待巡检项目为用于进行放贷风险评估和授信额度确定的巡检信息集合,具体可以包括待巡检商户的多维度数据,例如可以包括待巡检商户的商户主体信息、资产负债信息、财务科目信息、商户业务信息、上下游商家信息等。
具体地,商户主体信息例如可以包括待巡检商户的司法数据、工商数据、商户股东数据、商户人力资源数据等信息,资产负债信息例如可以包括待巡检商户的商户资产信息、商户负债信息、损失率资产特征等信息,财务科目信息例如可以包括商户资产表、商户利润表、商户负债表等信息,商户业务信息例如可以包括商户订单数据、***数据、流水数据、库存数额等信息,上下游商家信息例如可以包括与待巡检商户存在上下游业务关系的商家信息、订单数据、流水金额等信息。
211、确定巡检任务中预设的待巡检项目,根据巡检项目获取待巡检商户上传的图像数据,并将图像数据输入预设OCR识别模型进行识别,得到待巡查商户的目标商户数据;
212、将目标商户数据输入预设图神经网络进行特征提取,得到目标商户数据的目标特征向量;
213、将目标特征向量输入预置分类模型的预测层进行风险预测,得到待巡检商户的巡检结果。
本实施例中步骤201-202、210-212与第一实施例中的步骤101-106类似,此处不再赘述。
本发明实施例中,通过在确定待巡检商户后,从预置数据库中查询出待巡检商户的商户交易数据和商户状态数据;基于商户交易数据和商户状态数据,确定与待巡检商户的巡检任务以及巡检任务对应的地理位置数据;基于巡检任务对应的地理位置数据,将巡检任务发送至对应的巡检终端;确定巡检任务中预设的待巡检项目,根据巡检项目获取待巡检商户上传的图像数据,并将图像数据输入预设OCR识别模型进行识别,得到待巡查商户的目标商户数据;将目标商户数据输入预设图神经网络进行特征提取,得到目标商户数据的目标特征向量;将目标特征向量输入预置分类模型的预测层进行风险预测,根据目标特征向量预测待巡检商户是否存在风险,得到待巡检商户的巡检结果。本发明通过对商户巡检流程的全线上化管理,实现商户巡检全行覆盖。解决商户巡检效率低的技术问题。
请参阅图3,本发明实施例中数据巡检方法的第三个实施例包括:
301、在确定待巡检商户后,从预置数据库中查询出待巡检商户的商户交易数据和商户状态数据;
302、基于商户交易数据和商户状态数据,确定与待巡检商户的巡检任务以及巡检任务对应的地理位置数据;
303、基于巡检任务对应的地理位置数据,将巡检任务发送至对应的巡检终端;
304、对图像数据进行分割,得到多个图像块;
本实施例中,获取商户上传的图像数据等线上数据信息,对图像数据的切割方式可以是横向切割、纵向切割或者横纵结合切割,本申请实施例不做限定。其中,电子设备针对图像数据的切割模式可以包括商户干预切割模式和非商户干预切割模式,在商户干预切割模式下,电子设备可以通过检测商户指令在图像数据上显示切割线,并以所显示的切割线为依据对图像数据进行切割;在非商户干预切割模式下,电子设备可以按照预设方式对图像数据进行切割,其中,预设方式可以是等分切割,还可以是非等分切割,本申请实施例不做限定。
基于上述描述,对图像数据进行切割,得到多个图像块可以包括:确定电子设备的当前切割模式;在当前切割模式为商户干预切割模式时,输出切割线选择界面,以供商户选择切割线的线条特征,该线条特征可以包括线条宽度、颜色和方向;按照商户输入的切割轨迹以及商户确定出的切割线的线条特征,在图像数据上显示切割线;并按照所显示的切割线对图像数据进行切割,得到多个图像块;在当前的切割模式为非商户干预切割模式时,对图像数据进行预设次数的等分切割,得到多个图像块。通过实施该方法,可以实现图像数据的灵活切割。
305、对多个图像块进行降噪处理,得到每个图像块对应的去噪图像块;
本实施例中,对上述多个图像块进行降噪处理的算法可以是空域像素特征去噪算法、变换域去噪算法或者BM3D去噪算法,本实施例不做限定。其中,空域像素特征去噪算法是针对随机噪声的。那么什么是随机噪声呢?相比于图像的真实信号来讲随机噪声就是一种或高或低呈现出不肯定变化的一种信号,全部的随机噪声信号求和后结果为0。基于空域像素特征的方法,是经过分析在必定大小的窗口内,中心像素和其余相邻像素之间在灰度空间的直接联系,来获取新的中心像素值的方法。
本实施例中,噪声是图像干扰的重要原因。一幅图像在实际应用中可能存在各种各样的噪声,这些噪声可能在传输中产生,也可能在量化等处理中产生。根据噪声和信号的关系可将其分为三种形式:(f(x,y)表示给定原始图像,g(x,y)表示图像信号,n(x,y)表示噪声。)
1)加性噪声,此类噪声与输入图像信号无关,含噪图像可表示为f(x,y)=g(x,y)+n(x,y),信道噪声及光导摄像管的摄像机扫描图像时产生的噪声就属这类噪声。
2)乘性噪声,此类噪声与图像信号有关,含噪图像可表示为f(x,y)=g(x,y)+n(x,y)g(x,y),飞点扫描器扛描图像时的噪声,电视图像中的相干噪声,胶片中的颗粒噪声就属于此类噪声。
3)量化噪声,此类噪声与输入图像信号无关,是量化过程存在量化误差,再反映到接收端而产生。
具体地,椒盐噪声是由图像传感器,传输信道,解码处理等产生的黑白相间的亮暗点噪声。椒盐噪声往往由图像切割弓|起。去除脉冲干扰及椒盐噪声最常用的算法是中值滤波。路面图像属于结构光图像,使用区域分割技术中的阈值分割法消除白噪声及部分椒盐噪声,而不能使用中值滤波对白噪声及椒盐噪声进行滤波,因为滤波模板在图像中漫游时会改变光条中像素的真实灰度分布,给随后的重心法细化过程带来负面影响。
306、分别将图像块输入预设OCR识别模型进行识别,得到每个图像块的识别结果;
本实施例中,OCR识别模型的主要训练过程包括获取有标签数据的第一类图像样本;采用所述第一类图像样本对预设的OCR识别模型进行模型训练,以获取初始的OCR识别模型;利用所述初始的OCR识别模型对无标签数据的第二类图像样本进行OCR识别;根据OCR识别的结果生成所述第二类图像样本的标签数据,并且根据生成的标签数据对所述第二类图像样本进行标签标注;采用所述第一类图像样本以及经所述标签标注后的第二类图像样本,对所述初始的OCR识别模型进行模型训练,以获取最终的OCR识别模型。
具体地,图像识别区域指的是包含了待识别信息的图像区域,即对第一类图像样本进行OCR识别的目标区域。业务数据指的是图像识别区域记录的数据,这些数据是对第一类图像样本进行OCR识别的目标数据。第一类图像样本设置完成后,需要使用第一类图像样本对预设的OCR识别模型进行第一次训练,以使预设的OCR识别模型具备一定的OCR识别能力。需要说明的是,在本发明实施例中可以采用OCR技术领域中常规的OCR识别模型的模型结构,构建上述预设的OCR识别模型。
经过训练的初始的OCR识别模型可以对待识别的第二类图像样本进行一定程度的识别,通过使用初始的OCR识别模型对无标签数据的第二类样本进行识别,获得初始OCR识别模型的识别结果。根据OCR识别的结果生成第二类图像样本的标签数据,并且根据生成的标签数据对第二类图像样本进行标签标注。
通过带有人工标注的真实信息的图像样本以及初始的OCR识别模型的识别结果的图像样本,对初始的OCR识别模型进行训练。初始的OCR识别模型的识别结果可以包括识别的位置、类别、具体内容等等,例如,真实样本的类别是身份证,而识别结果是银行卡,这即是明显的类别的识别错误,又例如,识别结果的位置是身份证的出生日期栏,而真实的位置也是身份证的出生日期栏,即是识别位置的正确。
307、根据每个图像块的识别结果,得到待巡查商户的待巡检商户数据;
本实施例中,电子设备还可记录每一图像块在上述图像数据的位置标识,上述根据每一图像块的识别结果,得到上述图像数据的识别结果,可以包括:根据每一图像块的识别结果和其对应的位置标识,得到上述图像数据的识别结果,根据每个图像块的识别结果,得到待巡查商户的待巡检商户数据。
308、将目标商户数据输入预设图神经网络进行特征提取,得到目标商户数据的目标特征向量;
309、将目标特征向量输入预置分类模型的预测层进行风险预测,得到待巡检商户的巡检结果。
本实施例中步骤301-303、308-309与第一实施例中的步骤101-103、105-106类似,此处不再赘述。
本发明实施例中,通过在确定待巡检商户后,从预置数据库中查询出待巡检商户的商户交易数据和商户状态数据;基于商户交易数据和商户状态数据,确定与待巡检商户的巡检任务以及巡检任务对应的地理位置数据;基于巡检任务对应的地理位置数据,将巡检任务发送至对应的巡检终端;确定巡检任务中预设的待巡检项目,根据巡检项目获取待巡检商户上传的图像数据,并将图像数据输入预设OCR识别模型进行识别,得到待巡查商户的目标商户数据;将目标商户数据输入预设图神经网络进行特征提取,得到目标商户数据的目标特征向量;将目标特征向量输入预置分类模型的预测层进行风险预测,根据目标特征向量预测待巡检商户是否存在风险,得到待巡检商户的巡检结果。本发明通过对商户巡检流程的全线上化管理,实现商户巡检全行覆盖。解决商户巡检效率低的技术问题。
请参阅图4,本发明实施例中数据巡检方法的第四个实施例包括:
401、在确定待巡检商户后,从预置数据库中查询出待巡检商户的商户交易数据和商户状态数据;
402、基于商户交易数据和商户状态数据,确定与待巡检商户的巡检任务以及巡检任务对应的地理位置数据;
403、基于巡检任务对应的地理位置数据,将巡检任务发送至对应的巡检终端;
404、确定巡检任务中预设的待巡检项目,根据巡检项目获取待巡检商户上传的图像数据,并将图像数据输入预设OCR识别模型进行识别,得到待巡查商户的目标商户数据;
405、获取样本训练数据,并将样本训练数据作为训练集,其中,样本训练集中包括样本商户对应的风险量化标签;
本实施例中,在进行图神经网络的训练学习之前,可以先确定样本训练数据,具体的,本实施例中可以获取样本异构关系网络图和样本异构关系网络图中样本商户节点对应的风险量化标签作为训练数据。
本实施例中,可以从支付交易日志中获取样本活跃商户对应的样本交易对象的样本交易数据;基于对应的样本交易对象的样本交易数据,生成样本活跃商户的样本异构关系网络图。样本活跃商户可以结合实际应用中业务***的交易情况进行抽取,在可选的实施例中,样本活跃商户可以为在三年内存在交易记录的商户。具体的,这里基于对应的样本交易对象的样本交易数据。
406、基于样本训练数据,生成样本异构关系网络图的样本邻接矩阵和样本交易属性特征矩阵;
本实施例中,交易统计信息可以包括但不限于对应节点在多个时间窗口下的交易次数和交易金额,该多个时间窗口可以结合实际应用中的交易支付业务量和商户风险识别需求进行设定。具体的,可以从目标商户对应的交易对象的交易数据中获取每个交易对象对应的交易统计信息即每个节点对应的交易统计信息。
具体的,节点交易属性特征矩阵可以为用于表征异构关系网络图中每个节点的多个交易属性特征的矩阵,其中,多个交易属性特征分别用于表征对应节点在多个时间窗口下的交易统计量,交易统计量可以包括交易次数和交易金额。
407、将样本邻接矩阵和样本交易属性特征矩阵输入初始图神经网络进行特征提取,得到样本商户的初始目标特征向量;
本实施例中,基于节点标识信息与目标序号之间的映射关系,生成节点映射文件。基于上述节点映射文件和上述邻接信息,生成上述异构关系网络图的邻接表。其中,邻接表可以为存储每个节点的邻接信息的链表结构,对上述邻接表的邻接关系进行特征提取,基于节点之间边的权重,相应的邻接矩阵。具体地,基于节点的邻接信息,生成邻接矩阵,能够实现对节点邻接关系的特征提取。
408、基于初始目标特征向量对应的风险识别类别和风险量化标签的交叉熵,确定损失函数,并基于损失函数,确定下降梯度;
本实施例中,可以将初始目标特征信息输入到分类模型进行商户风险识别,得到样本商户节点的风险识别类别,计算样本商户节点的风险识别类别和风险类别标签的交叉熵,将交叉熵作为损失函数,并基于链式求导法则对损失函数进行计算,得到下降梯度。
本实施例中,链式求导法则又叫链式法则,是微积分中的求导法则,用于求一个复合函数的导数,是在微积分的求导运算中一种常用的方法。复合函数的导数将是构成复合这有限个函数在相应点的导数的乘积,就像锁链一样一环套一环,故称链式法则。
409、基于下降梯度和预设学习率更新初始图神经网络的网络参数,得到更新后的图神经网络;
本实施例中,基于小批量梯度下降法(Mini-Batch GradientDescent,MBGD)对图神经网络进行训练,。
具体地,对所述初始图神经网络进行损失函数计算,将当前计算得到的损失函数与预设数据库中存储的历史损失函数进行比较;当所述当前计算得到的损失函数与所述历史损失函数之间的差值小于或等于预设值时,则判断所述联合的初始图神经网络处于收敛状态;当所述当前计算得到的损失函数与所述历史损失函数之间的差值大于所述预设值时,则判断所述联合的初始图神经网络尚未处于收敛状态,并利用当前计算得到的损失函数更新所述预设数据库中存储的历史损失函数。
当所述初始图神经网络尚未收敛时,将所述联合的初始图神经网络发送至客户端,通过所述客户端中的所述特征向量,对所述联合的初始图神经网络进行进一步的训练,得到更新后的初始图神经网络,并将更新后的初始图神经网络作为目标图神经网络。
收敛成功,利用所述收敛的损失函数更新本地医院的所述图神经网络的模型损失函数,可以利用更新后的模型损失函数在本地完成所述图神经网络的构建,得到所述图神经网络。
410、将目标商户数据输入预设图神经网络进行特征提取,得到目标商户数据的目标特征向量;
411、将目标特征向量输入预置分类模型的预测层进行风险预测,得到待巡检商户的巡检结果。
本实施例中步骤401-404、410-411与第一实施例中的步骤101-106类似,此处不再赘述。
在本发明实施例中,通过在确定待巡检商户后,从预置数据库中查询出待巡检商户的商户交易数据和商户状态数据;基于商户交易数据和商户状态数据,确定与待巡检商户的巡检任务以及巡检任务对应的地理位置数据;基于巡检任务对应的地理位置数据,将巡检任务发送至对应的巡检终端;确定巡检任务中预设的待巡检项目,根据巡检项目获取待巡检商户上传的图像数据,并将图像数据输入预设OCR识别模型进行识别,得到待巡查商户的目标商户数据;将目标商户数据输入预设图神经网络进行特征提取,得到目标商户数据的目标特征向量;将目标特征向量输入预置分类模型的预测层进行风险预测,根据目标特征向量预测待巡检商户是否存在风险,得到待巡检商户的巡检结果。本发明通过对商户巡检流程的全线上化管理,实现商户巡检全行覆盖。解决商户巡检效率低的技术问题。
请参阅图5,本发明实施例中数据巡检方法的第五个实施例包括:
501、在确定待巡检商户后,从预置数据库中查询出待巡检商户的商户交易数据和商户状态数据;
502、基于商户交易数据和商户状态数据,确定与待巡检商户的巡检任务以及巡检任务对应的地理位置数据;
503、基于巡检任务对应的地理位置数据,将巡检任务发送至对应的巡检终端;
504、确定巡检任务中预设的待巡检项目,根据巡检项目获取待巡检商户上传的图像数据,并将图像数据输入预设OCR识别模型进行识别,得到待巡查商户的目标商户数据;
505、将目标商户数据输入预设图神经网络进行特征提取,得到目标商户数据的目标特征向量;
506、将目标特征向量输入预置分类模型的预测层进行风险预测,得到待巡检商户的巡检结果;
507、获取巡检结果对应的验证信息;
本实施例中,终端设备接收到巡检任务后,在终端设备的显示界面进行展示。由相关工作人员根据显示界面展示的巡检任务进行巡检,并将在显示界面上进行操作,最终得到一个巡检结果。基于该巡检结果,由至少两个工作人员进行确认,得到至少两个验证信息。对至少两个验证信息的真实性进行验证,示例地,当至少两个工作人员对巡检结果进行确认后,通过签字、人脸识别、或账号授权等方式提交巡检确定的验证信息后,终端设备或后台管理***对上述签字、人脸识别、或账号授权等进行验证,验证上述信息是否真实,是否与对应的工作人员相匹配。
508、对验证信息的真实性进行验证,当验证信息的真实性通过验证后,对验证信息进行校验;
本实施例中,当验证信息的真实性通过验证后,在至少两个验证信息都是真实的情况下,对至少两个验证信息进行校验,检查至少两个验证信息是否为对一个巡检任务生成的,若是,则认为至少两个验证信息的校验通过,确定至少两个验证信息都是基于上述巡检任务的情况下,将巡检结果上报至后台管理***,以完成整个巡检任务执行和处理的过程。
509、当对验证信息的校验通过后,将巡检结果上报至后台管理***。
本实施例中,响应于巡检任务上的操作,生成巡检结果;获取巡检结果对应的至少两个验证信息;对验证信息的真实性进行验证,当验证信息的真实性通过验证后,对至少两个验证信息进行校验;当对至少两个验证信息的校验通过后,上报巡检结果至后台管理***。从而能够完成从巡检任务接收、巡检任务执行到生成巡检结果的步骤,进一步对巡检结果对应的至少两个验证信息进行验证,并将巡检结果上报至后台管理***,完成整个巡检任务的执行和处理的过程。
本实施例中步骤501-506第一实施例中的步骤101-106类似,此处不再赘述。
本发明实施例中,通过在确定待巡检商户后,从预置数据库中查询出待巡检商户的商户交易数据和商户状态数据;基于商户交易数据和商户状态数据,确定与待巡检商户的巡检任务以及巡检任务对应的地理位置数据;基于巡检任务对应的地理位置数据,将巡检任务发送至对应的巡检终端;确定巡检任务中预设的待巡检项目,根据巡检项目获取待巡检商户上传的图像数据,并将图像数据输入预设OCR识别模型进行识别,得到待巡查商户的目标商户数据;将目标商户数据输入预设图神经网络进行特征提取,得到目标商户数据的目标特征向量;将目标特征向量输入预置分类模型的预测层进行风险预测,根据目标特征向量预测待巡检商户是否存在风险,得到待巡检商户的巡检结果。本发明通过对商户巡检流程的全线上化管理,实现商户巡检全行覆盖。解决商户巡检效率低的技术问题。
上面对本发明实施例中数据巡检方法进行了描述,下面对本发明实施例中数据巡检装置进行描述,请参阅图6,本发明实施例中数据巡检装置的第一个实施例包括:
查询模块601,用于在确定待巡检商户后,从预置数据库中查询出所述待巡检商户的商户交易数据和商户状态数据;
第一确定模块602,用于基于所述商户交易数据和所述商户状态数据,确定与所述待巡检商户的巡检任务以及所述巡检任务对应的地理位置数据;
发送模块603,用于基于所述地理位置数据选定执行所述巡检任务的巡检终端,并将所述巡检任务发送至所述巡检终端上;
识别模块604,用于确定所述巡检任务中预设的待巡检项目,根据所述巡检项目获取所述待巡检商户上传的图像数据,并将所述图像数据输入预设OCR识别模型进行识别,得到所述待巡查商户的目标商户数据;
第一特征提取模块605,用于将所述目标商户数据输入预设图神经网络进行特征提取,得到所述目标商户数据的目标特征向量;
预测模块606,用于将所述目标特征向量输入预置分类模型的预测层进行风险预测,得到所述待巡检商户的巡检结果。
本发明实施例中,通过在确定待巡检商户后,从预置数据库中查询出待巡检商户的商户交易数据和商户状态数据;基于商户交易数据和商户状态数据,确定与待巡检商户的巡检任务以及巡检任务对应的地理位置数据;基于巡检任务对应的地理位置数据,将巡检任务发送至对应的巡检终端;确定巡检任务中预设的待巡检项目,根据巡检项目获取待巡检商户上传的图像数据,并将图像数据输入预设OCR识别模型进行识别,得到待巡查商户的目标商户数据;将目标商户数据输入预设图神经网络进行特征提取,得到目标商户数据的目标特征向量;将目标特征向量输入预置分类模型的预测层进行风险预测,根据目标特征向量预测待巡检商户是否存在风险,得到待巡检商户的巡检结果。本发明通过对商户巡检流程的全线上化管理,实现商户巡检全行覆盖。解决商户巡检效率低的技术问题。
请参阅图7,本发明实施例中数据巡检装置的第二个实施例,该数据巡检装置具体包括:
查询模块601,用于在确定待巡检商户后,从预置数据库中查询出所述待巡检商户的商户交易数据和商户状态数据;
第一确定模块602,用于基于所述商户交易数据和所述商户状态数据,确定与所述待巡检商户的巡检任务以及所述巡检任务对应的地理位置数据;
发送模块603,用于基于所述地理位置数据选定执行所述巡检任务的巡检终端,并将所述巡检任务发送至所述巡检终端上;
识别模块604,用于确定所述巡检任务中预设的待巡检项目,根据所述巡检项目获取所述待巡检商户上传的图像数据,并将所述图像数据输入预设OCR识别模型进行识别,得到所述待巡查商户的目标商户数据;
第一特征提取模块605,用于将所述目标商户数据输入预设图神经网络进行特征提取,得到所述目标商户数据的目标特征向量;
预测模块606,用于将所述目标特征向量输入预置分类模型的预测层进行风险预测,得到所述待巡检商户的巡检结果。
在本实施例中,所述数据巡检装置还包括:
核查模块607,用于对所述待巡检商户进行黑名单核查;
第一生成模块608,用于若所述待巡检商户不在预设的黑名单中,则生成与所述待巡检商户对应的巡检任务;若所述待巡检商户位于所述黑名单中,则输出错误提示。
在本实施例中,所述发送模块603具体用于:
将所述巡检任务的任务信息发布至满足设定的巡检条件的所有巡检终端;
若接收到所述巡检终端返回的关于所述任务信息的终端应答信息,则将最早接收到的所述终端应答信息所对应的所述巡检终端确定为目标终端,将所述巡检任务发送至所述目标终端。
在本实施例中,所述数据巡检装置还包括:
第一获取模块609,用于获取待巡检商户的预设种类风险表征信息;
第二确定模块610,用于基于所述风险表征信息,确定与所述待巡检商户关联的风险量化标签;根据所述风险量化标签,确定所述待巡检商户的待巡检项目。
在本实施例中,所述识别模块604包括:
分割单元6041,用于对所述图像数据进行分割,得到多个图像块;
降噪单元6042,用于对所述多个图像块进行降噪处理,得到每个图像块对应的去噪图像块;
识别单元6043,用于分别将所述图像块输入预设OCR识别模型进行识别,得到每个图像块的识别结果;根据所述每个图像块的识别结果,得到所述待巡查商户的目标商户数据。
在本实施例中,所述数据巡检装置还包括:
第二生成模块611,用于获取样本训练数据,并将所述样本训练数据作为训练集,其中,所述样本训练集中包括样本商户对应的风险量化标签;基于所述样本训练数据,生成样本异构关系网络图的样本邻接矩阵和样本交易属性特征矩阵;
第二特征提取模块612,用于将所述样本邻接矩阵和所述样本交易属性特征矩阵输入初始图神经网络进行特征提取,得到所述样本商户的初始目标特征向量;
第三确定模块613,用于基于所述初始目标特征向量对应的风险识别类别和所述风险量化标签的交叉熵,确定损失函数;基于所述损失函数,确定下降梯度;
更新模块614,用于基于所述下降梯度和预设学习率更新所述初始图神经网络的网络参数,得到更新后的图神经网络。
在本实施例中,所述数据巡检装置还包括:
第二获取模块615,用于获取所述巡检结果对应的验证信息;
验证模块616,用于对所述验证信息的真实性进行验证,当所述验证信息的真实性通过验证后,对所述验证信息进行校验;当对所述验证信息的校验通过后,将所述巡检结果上报至后台管理***。
本发明实施例中,通过在确定待巡检商户后,从预置数据库中查询出待巡检商户的商户交易数据和商户状态数据;基于商户交易数据和商户状态数据,确定与待巡检商户的巡检任务以及巡检任务对应的地理位置数据;基于巡检任务对应的地理位置数据,将巡检任务发送至对应的巡检终端;确定巡检任务中预设的待巡检项目,根据巡检项目获取待巡检商户上传的图像数据,并将图像数据输入预设OCR识别模型进行识别,得到待巡查商户的目标商户数据;将目标商户数据输入预设图神经网络进行特征提取,得到目标商户数据的目标特征向量;将目标特征向量输入预置分类模型的预测层进行风险预测,根据目标特征向量预测待巡检商户是否存在风险,得到待巡检商户的巡检结果。本发明通过对商户巡检流程的全线上化管理,实现商户巡检全行覆盖。解决商户巡检效率低的技术问题。
上面图6和图7从模块化功能实体的角度对本发明实施例中的数据巡检装置进行详细描述,下面从硬件处理的角度对本发明实施例中数据巡检设备进行详细描述。
图8是本发明实施例提供的数据巡检设备的结构示意图,该数据巡检设备800可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(centralprocessing units,CPU)810(例如,一个或一个以上处理器)和存储器820,一个或一个以上存储应用程序833或数据832的存储介质830(例如一个或一个以上海量存储设备)。其中,存储器820和存储介质830可以是短暂存储或持久存储。存储在存储介质830的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对数据巡检设备800中的一系列指令操作。更进一步地,处理器810可以设置为与存储介质830通信,在数据巡检设备800上执行存储介质830中的一系列指令操作,以实现上述各方法实施例提供的数据巡检方法的步骤。
数据巡检设备800还可以包括一个或一个以上电源840,一个或一个以上有线或无线网络接口850,一个或一个以上输入输出接口860,和/或,一个或一个以上操作***831,例如Windows Serve,Mac OS X,Unix,Linux,FreeBSD等等。本领域技术人员可以理解,图8示出的数据巡检设备结构并不构成对本申请提供的数据巡检设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
本发明还提供一种计算机可读存储介质,该计算机可读存储介质可以为非易失性计算机可读存储介质,该计算机可读存储介质也可以为易失性计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在计算机上运行时,使得计算机执行上述数据巡检方法的步骤。
所述领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的***,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种数据巡检方法,其特征在于,所述数据巡检方法包括:
在确定待巡检商户后,从预置数据库中查询出所述待巡检商户的商户交易数据和商户状态数据;
基于所述商户交易数据和所述商户状态数据,确定与所述待巡检商户的巡检任务以及所述巡检任务对应的地理位置数据;
基于所述地理位置数据选定执行所述巡检任务的巡检终端,并将所述巡检任务发送至所述巡检终端上;
确定所述巡检任务中预设的待巡检项目,根据所述巡检项目获取所述待巡检商户上传的图像数据,并将所述图像数据输入预设OCR识别模型进行识别,得到所述待巡查商户的目标商户数据;
将所述目标商户数据输入预设图神经网络进行特征提取,得到所述目标商户数据的目标特征向量;
将所述目标特征向量输入预置分类模型的预测层进行风险预测,得到所述待巡检商户的巡检结果。
2.根据权利要求1所述的数据巡检方法,其特征在于,在所述基于所述商户交易数据和所述商户状态数据,确定与所述待巡检商户的巡检任务以及所述巡检任务对应的地理位置数据之前,还包括:
对所述待巡检商户进行黑名单核查;
若所述待巡检商户不在预设的黑名单中,则生成与所述待巡检商户对应的巡检任务;
若所述待巡检商户位于所述黑名单中,则输出错误提示。
3.根据权利要求1所述的数据巡检方法,其特征在于,所述基于所述地理位置数据选定执行所述巡检任务的巡检终端,并将所述巡检任务发送至所述巡检终端上包括:
将所述巡检任务的任务信息发布至满足设定的巡检条件的所有巡检终端;
若接收到所述巡检终端返回的关于所述任务信息的终端应答信息,则将最早接收到的所述终端应答信息所对应的所述巡检终端确定为目标终端,将所述巡检任务发送至所述目标终端。
4.根据权利要求3所述的数据巡检方法,其特征在于,在所述基于所述地理位置数据选定执行所述巡检任务的巡检终端,并将所述巡检任务发送至所述巡检终端上之后,还包括:
获取待巡检商户的预设种类风险表征信息;
基于所述风险表征信息,确定与所述待巡检商户关联的风险量化标签;
根据所述风险量化标签,确定所述待巡检商户的待巡检项目。
5.根据权利要求1所述的数据巡检方法,其特征在于,所述将所述图像数据输入预设OCR识别模型进行识别,得到所述待巡查商户的目标商户数据包括:
对所述图像数据进行分割,得到多个图像块;
对所述多个图像块进行降噪处理,得到每个图像块对应的去噪图像块;
分别将所述图像块输入预设OCR识别模型进行识别,得到每个图像块的识别结果;
根据所述每个图像块的识别结果,得到所述待巡查商户的目标商户数据。
6.根据权利要求1所述的数据巡检方法,其特征在于,在所述图神经网络包括采样层和卷积层,所述将所述目标商户数据输入预设图神经网络进行特征提取,得到所述目标商户数据的目标特征向量之前,还包括:
获取样本训练数据,并将所述样本训练数据作为训练集,其中,所述样本训练集中包括样本商户对应的风险量化标签;
基于所述样本训练数据,生成样本异构关系网络图的样本邻接矩阵和样本交易属性特征矩阵;
将所述样本邻接矩阵和所述样本交易属性特征矩阵输入初始图神经网络进行特征提取,得到所述样本商户的初始目标特征向量;
基于所述初始目标特征向量对应的风险识别类别和所述风险量化标签的交叉熵,确定损失函数;
基于所述损失函数,确定下降梯度;
基于所述下降梯度和预设学习率更新所述初始图神经网络的网络参数,得到更新后的图神经网络。
7.根据权利要求1所述的数据巡检方法,其特征在于,在所述根据所述目标特征向量预测所述待巡检商户是否存在风险,得到所述待巡检商户的巡检结果之后,还包括:
获取所述巡检结果对应的验证信息;
对所述验证信息的真实性进行验证,当所述验证信息的真实性通过验证后,对所述验证信息进行校验;
当对所述验证信息的校验通过后,将所述巡检结果上报至后台管理***。
8.一种数据巡检装置,其特征在于,所述数据巡检装置包括:
查询模块,用于在确定待巡检商户后,从预置数据库中查询出所述待巡检商户的商户交易数据和商户状态数据;
第一确定模块,用于基于所述商户交易数据和所述商户状态数据,确定与所述待巡检商户的巡检任务以及所述巡检任务对应的地理位置数据;
发送模块,用于基于所述地理位置数据选定执行所述巡检任务的巡检终端,并将所述巡检任务发送至所述巡检终端上;
识别模块,用于确定所述巡检任务中预设的待巡检项目,根据所述巡检项目获取所述待巡检商户上传的图像数据,并将所述图像数据输入预设OCR识别模型进行识别,得到所述待巡查商户的目标商户数据;
第一特征提取模块,用于将所述目标商户数据输入预设图神经网络进行特征提取,得到所述目标商户数据的目标特征向量;
预测模块,用于将所述目标特征向量输入预置分类模型的预测层进行风险预测,得到所述待巡检商户的巡检结果。
9.一种数据巡检设备,其特征在于,所述数据巡检设备包括:存储器和至少一个处理器,所述存储器中存储有指令,所述存储器和所述至少一个处理器通过线路互连;
所述至少一个处理器调用所述存储器中的所述指令,以使得所述数据巡检设备执行如权利要求1-7中任一项所述的数据巡检方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-7中任一项所述的数据巡检方法的步骤。
CN202210585690.6A 2022-05-27 2022-05-27 数据巡检方法、装置、设备及存储介质 Pending CN115018513A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210585690.6A CN115018513A (zh) 2022-05-27 2022-05-27 数据巡检方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210585690.6A CN115018513A (zh) 2022-05-27 2022-05-27 数据巡检方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN115018513A true CN115018513A (zh) 2022-09-06

Family

ID=83070207

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210585690.6A Pending CN115018513A (zh) 2022-05-27 2022-05-27 数据巡检方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN115018513A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117010601A (zh) * 2023-09-28 2023-11-07 武汉吧哒科技股份有限公司 数据处理方法、装置、计算机设备及计算机可读存储介质
WO2024066038A1 (zh) * 2022-09-27 2024-04-04 深圳先进技术研究院 一种基于多模态数据集成的建筑工人实时安全监控方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024066038A1 (zh) * 2022-09-27 2024-04-04 深圳先进技术研究院 一种基于多模态数据集成的建筑工人实时安全监控方法
CN117010601A (zh) * 2023-09-28 2023-11-07 武汉吧哒科技股份有限公司 数据处理方法、装置、计算机设备及计算机可读存储介质
CN117010601B (zh) * 2023-09-28 2024-01-19 武汉吧哒科技股份有限公司 数据处理方法、装置、计算机设备及计算机可读存储介质

Similar Documents

Publication Publication Date Title
US20220084186A1 (en) Automated inspection system and associated method for assessing the condition of shipping containers
CN110892442A (zh) 用于自适应评分以检测商务卡的误用或滥用的***、方法和设备
CN110414927B (zh) 一种票据处理自动生成凭证的方法及装置
CN111178219A (zh) 票据识别管理方法、装置、存储介质及电子设备
TW202027007A (zh) 電腦執行的車輛定損方法及裝置
CN113011973B (zh) 基于智能合约数据湖的金融交易监管模型的方法及设备
CN115018513A (zh) 数据巡检方法、装置、设备及存储介质
CN108108744B (zh) 用于辐射图像辅助分析的方法及其***
US11574003B2 (en) Image search method, apparatus, and device
CN111985937A (zh) 交易商价值信息评估方法、***、存储介质、计算机设备
CN112150298A (zh) 数据处理方法、***、设备及可读介质
Ghosh et al. Automated detection and classification of pavement distresses using 3D pavement surface images and deep learning
Clintworth et al. Financial risk assessment in shipping: a holistic machine learning based methodology
CN115545886A (zh) 逾期风险识别方法、装置、设备及存储介质
CN114971294A (zh) 数据采集方法、装置、设备及存储介质
CN115456745A (zh) 小微企业画像构建方法及装置
CN117196630A (zh) 交易风险预测方法、装置、终端设备以及存储介质
CN117132383A (zh) 一种信贷数据处理方法、装置、设备及可读存储介质
CN113781201B (zh) 电子金融活动的风险评估方法和装置
Domashova et al. Detection of non-typical users of the electronic marketplace" Freight transportation" to prevent the competitive intelligence
CN115618926A (zh) 一种面向纳税人企业分类的重要因子提取方法及装置
CN113627997A (zh) 数据处理方法、装置、电子设备及存储介质
CN114495224A (zh) 一种信贷风险确定方法及装置
CN113870007A (zh) 一种产品推荐方法、装置、设备及介质
Srivastava et al. Hyperautomation in transforming underwriting operation in the life insurance industry

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination