CN109858927A - 一种商户审核方法、装置、计算机可读存储介质及服务器 - Google Patents
一种商户审核方法、装置、计算机可读存储介质及服务器 Download PDFInfo
- Publication number
- CN109858927A CN109858927A CN201910041444.2A CN201910041444A CN109858927A CN 109858927 A CN109858927 A CN 109858927A CN 201910041444 A CN201910041444 A CN 201910041444A CN 109858927 A CN109858927 A CN 109858927A
- Authority
- CN
- China
- Prior art keywords
- trade company
- audit
- sample
- merchant information
- dimension
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明属于计算机技术领域,尤其涉及一种商户审核方法、装置、计算机可读存储介质及服务器。所述方法接收商户的终端设备发送的商户审核申请,并从所述商户审核申请中提取所述商户的商户标识;根据所述商户标识分别从各个预设的数据源中获取所述商户在各个预设的审核维度上的商户信息,其中,每个数据源均对应至少一个审核维度上的商户信息;根据各个审核维度上的商户信息构造所述商户的商户信息向量;使用预设的审核模型对所述商户的商户信息向量进行计算,得到所述商户的审核结果,在无需审核人员干预的情况下,既可自动对商户进行审核,大大提高了审核效率,且无需依赖审核人员的个人经验,保证了审核结果的公正客观。
Description
技术领域
本发明属于计算机技术领域,尤其涉及一种商户审核方法、装置、计算机可读存储介质及服务器。
背景技术
随着移动互联网技术的不断发展,各种为商户提供服务的应用平台层出不穷,例如,当前市场上有为商户提供外卖服务的外卖平台,还有为商户提供收款服务的支付平台等等。为了杜绝不合规的商户加入到应用平台中,给应用平台造成不良的社会影响,这些应用平台一般会对要加入的商户进行审核,只有审核通过的商户才能加入到应用平台中。但是目前的商户审核,一般需要设置专门的审核人员根据自己的经验对商户进行人工审核,审核效率低,且严重依赖审核人员的个人经验,难以保证公正客观。
发明内容
有鉴于此,本发明实施例提供了一种商户审核方法、装置、计算机可读存储介质及服务器,以解决现有的人工审核方式效率低,且严重依赖审核人员的个人经验,难以保证公正客观的问题。
本发明实施例的第一方面提供了一种商户审核方法,可以包括:
接收商户的终端设备发送的商户审核申请,并从所述商户审核申请中提取所述商户的商户标识;
根据所述商户标识分别从各个预设的数据源中获取所述商户在各个预设的审核维度上的商户信息,其中,每个数据源均对应至少一个审核维度上的商户信息;
根据各个审核维度上的商户信息构造所述商户的商户信息向量;
使用预设的审核模型对所述商户的商户信息向量进行计算,得到所述商户的审核结果,所述审核模型为经过预设的样本集合训练的机器学习模型,所述样本集合中包括审核结果为通过的正样本以及审核结果为不通过的负样本,每个样本均对应于预设的数据库中的一条历史商户审核记录。
本发明实施例的第二方面提供了一种商户审核装置,可以包括:
商户审核申请接收模块,用于接收商户的终端设备发送的商户审核申请,并从所述商户审核申请中提取所述商户的商户标识;
商户信息获取模块,用于根据所述商户标识分别从各个预设的数据源中获取所述商户在各个预设的审核维度上的商户信息,其中,每个数据源均对应至少一个审核维度上的商户信息;
商户信息向量构造模块,用于根据各个审核维度上的商户信息构造所述商户的商户信息向量;
审核模型计算模块,用于使用预设的审核模型对所述商户的商户信息向量进行计算,得到所述商户的审核结果,所述审核模型为经过预设的样本集合训练的机器学习模型,所述样本集合中包括审核结果为通过的正样本以及审核结果为不通过的负样本,每个样本均对应于预设的数据库中的一条历史商户审核记录。
本发明实施例的第三方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可读指令,所述计算机可读指令被处理器执行时实现如下步骤:
接收商户的终端设备发送的商户审核申请,并从所述商户审核申请中提取所述商户的商户标识;
根据所述商户标识分别从各个预设的数据源中获取所述商户在各个预设的审核维度上的商户信息,其中,每个数据源均对应至少一个审核维度上的商户信息;
根据各个审核维度上的商户信息构造所述商户的商户信息向量;
使用预设的审核模型对所述商户的商户信息向量进行计算,得到所述商户的审核结果,所述审核模型为经过预设的样本集合训练的机器学习模型,所述样本集合中包括审核结果为通过的正样本以及审核结果为不通过的负样本,每个样本均对应于预设的数据库中的一条历史商户审核记录。
本发明实施例的第四方面提供了一种服务器,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令,所述处理器执行所述计算机可读指令时实现如下步骤:
接收商户的终端设备发送的商户审核申请,并从所述商户审核申请中提取所述商户的商户标识;
根据所述商户标识分别从各个预设的数据源中获取所述商户在各个预设的审核维度上的商户信息,其中,每个数据源均对应至少一个审核维度上的商户信息;
根据各个审核维度上的商户信息构造所述商户的商户信息向量;
使用预设的审核模型对所述商户的商户信息向量进行计算,得到所述商户的审核结果,所述审核模型为经过预设的样本集合训练的机器学习模型,所述样本集合中包括审核结果为通过的正样本以及审核结果为不通过的负样本,每个样本均对应于预设的数据库中的一条历史商户审核记录。
本发明实施例与现有技术相比存在的有益效果是:本发明实施例在接收到商户的终端设备发送的商户审核申请后,从所述商户审核申请中提取所述商户的商户标识,根据所述商户标识分别从各个预设的数据源中获取所述商户在各个预设的审核维度上的商户信息,并根据各个审核维度上的商户信息构造所述商户的商户信息向量,最后使用预设的审核模型对所述商户的商户信息向量进行计算,得到所述商户的审核结果。由于所述审核模型预先经过了大量的样本训练,通过机器学习从历史商户审核记录中得到了通用的审核模式,在无需审核人员干预的情况下,既可自动对商户进行审核,大大提高了审核效率,且无需依赖审核人员的个人经验,保证了审核结果的公正客观。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1为本发明实施例中一种商户审核方法的一个实施例流程图;
图2为根据商户标识分别从各个预设的数据源中获取商户在各个预设的审核维度上的商户信息的示意流程图;
图3本发明实施例中一种商户审核装置的一个实施例结构图;
图4本发明实施例中一种服务器的示意框图。
具体实施方式
为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本发明一部分实施例,而非全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
请参阅图1,本发明实施例中一种商户审核方法的一个实施例可以包括:
步骤S101、接收商户的终端设备发送的商户审核申请,并从所述商户审核申请中提取所述商户的商户标识。
当商户想要加入到应用平台中时,可以通过手机、平板电脑、笔记本电脑等终端设备向负责进行商户审核的执行服务器发送商户审核申请,在该商户审核申请中携带着其商户标识,该商户标识可以是商户的工商登记号码、法人身份证号码或者其它可以唯一代表该商户的标识。
所述执行服务器在接收到该商户审核申请后,即可从中提取出所述商户的商户标识。
步骤S102、根据所述商户标识分别从各个预设的数据源中获取所述商户在各个预设的审核维度上的商户信息。
其中,每个数据源均对应至少一个审核维度上的商户信息。
这些商户信息包括但不限于:工商登记信息、法人信用信息、税务记录信息、各大网站及论坛关于该商户的正、负面信息等等审核维度。
这些商户信息可以是从多个不同的数据源获取的,例如,工商行政机关的服务器中存储的该商户的工商登记信息、银行的服务器中存储的该商户的法人信用信息、税务行政机关的服务器中存储的该商户的税务记录信息、各大网站及论坛的服务器中存储的该商户的正、负面信息等等。
如图2所示,步骤S102具体可以包括如下过程:
步骤S1021、向所述商户的终端设备发送数据授权请求。
所述数据授权请求中包括所述执行服务器的设备标识,所述设备标识为唯一代表所述执行服务器的标识。
步骤S1022、接收所述商户的终端设备反馈的所述商户的授权信息。
所述商户的终端设备在接收到数据授权请求后,会记录下所述执行服务器的设备标识,并向所述执行服务器反馈所述商户的授权信息。
步骤S1023、从预设的服务器列表中选取与第s个数据源对应的服务器作为数据服务器。
其中,1≤s≤SourceNum,SourceNum为数据源的总数。
所述执行服务器列表记录了各个数据源与各个数据服务器之间的对应关系,具体如下表所示:
步骤S1024、向所述数据服务器发送数据请求。
所述数据请求中包括所述商户的商户标识和授权信息,还包括所述执行服务器的设备标识。
步骤S1025、接收所述数据服务器发送的所述商户的商户信息。
所述数据服务器在接收到所述数据请求后,对所述授权信息进行核对,若核对无误,则根据所述商户标识在本地数据库中查找到所述商户的商户信息,并向所述执行服务器发送所述商户的商户信息。
通过以上过程,在获得商户授权的前提下,再从各个数据服务器中获取客户的信息,保证了商户信息的安全性。当获得了所述商户在各个预设的审核维度上的商户信息后,则可根据这些商户信息进行审核。
步骤S103、根据各个审核维度上的商户信息构造所述商户的商户信息向量。
由于步骤S102中获取的商户信息并不是数值化的信息,不利于进行分析计算,因此,需要首先对各个审核维度的商户信息进行数值化处理。
例如,对于工商登记信息这一审核维度,将从工商行政机关的服务器中获取的登记信息与商户提供的信息进行比对,例如,可以通过OCR识别来对工商登记执照进行比对,计算两者之间的相似度,该相似度的取值区间为[0,1],最后将该相似度作为商户在工商登记信息这一审核维度上的取值。
对于法人信用信息这一审核维度,统计其中的不良记录(例如,失信、违约等记录)次数,并设置不良记录的阈值,若超过该阈值,则将法人信用信息这一审核维度数值化为1,若小于该阈值,则计算不良记录次数与该阈值的比值,将该比值作为数值化处理后的结果。特殊地,若不良记录次数为0,则将法人信用信息这一审核维度数值化为0。
对于税务记录信息这一审核维度,统计其中的不良记录(例如,偷税漏税等记录)次数,并设置不良记录的阈值,若超过该阈值,则将税务记录信息这一审核维度数值化为1,若小于该阈值,则计算不良记录次数与该阈值的比值,将该比值作为数值化处理后的结果。特殊地,若不良记录次数为0,则将税务记录信息这一审核维度数值化为0。
对于各大网站及论坛关于该商户的正、负面信息这一审核维度,可以根据下式计算数值化后的结果:
其中,w为网站(论坛)的序号,1≤w≤WN,WN为网站(论坛)的总数,Weightw为第w个网站(论坛)的权重,可以根据实际情况进行设置,一般地,将影响力较大的网站(论坛)设置较高的权重,将影响力较小的网站(论坛)设置较低的权重,Posw为第w个网站(论坛)关于该商户的正面信息的个数,Negw为第w个网站(论坛)关于该商户的负面信息的个数,Neuw为第w个网站(论坛)关于该商户的中性信息的个数,Val为这一审核维度的数值化结果。
在进行完数值化处理之后,即可将这些商户信息构造为如下所示的商户信息向量:
InfoVec=(InfoEm1,InfoEm2,...,InfoEmdn,...,InfoEmDN)
其中,dn为审核维度的序号,1≤dn≤DN,DN为审核维度的总数,InfoEmdn为第dn个审核维度上的商户信息,InfoVec为所述商户的商户信息向量。
步骤S104、使用预设的审核模型对所述商户的商户信息向量进行计算,得到所述商户的审核结果。
所述审核模型为经过预设的样本集合训练的机器学习模型,所述样本集合中包括审核结果为通过的正样本以及审核结果为不通过的负样本,每个样本均对应于预设的数据库中的一条历史商户审核记录。
所述审核模型的构建过程可以包括:
首先,从所述数据库中获取各条历史商户审核记录,并根据所述历史商户审核记录构造样本集合。
其中,所述样本集合中的任一样本均包括商户信息向量和审核结果。为了保证结果的准确性,应尽量增加所述样本集合中的样本数目,例如,可以将样本数目设置为5000、10000、50000或者其它取值。
所述样本集合中的正样本的数目与负样本的数目应满足一定的限制条件,例如:
其中,PN为所述样本集合中的正样本的总数,NgN为所述样本集合中的负样本的总数,Thresh为预设的阈值,该阈值可以根据实际情况进行设置,例如,可以将其设置为0.1、0.01、0.001或者其它取值。
特殊地,可以保持正样本的数目与负样本的数目一致。例如,若共选取10000个样本,则其中正样本和负样本各5000个,以此保证分析结果的平衡性。
然后,构造如下所示的审核模型:
其中,WtEmdn为第dn个审核维度上的商户信息的权重系数,Result为模型输出的审核结果。
最后,使用所述样本集合对所述审核模型进行训练,直至误差值小于预设的误差阈值为止。
具体的训练过程可以包括:
根据下式对所述审核模型进行第tn次样本训练:
其中,sn为所述样本集合中的样本序号,1≤sn≤SN,SN为所述样本集合中的样本总数,SampleVecsn为第sn个样本的商户信息向量,且SampleVecsn=(SpEmsn,1,SpEmsn,2,...,SpEmsn,dn,...,SpEmsn,DN),SpEmsn,dn为第sn个样本的商户信息向量在第dn个审核维度上的取值,tn为样本训练的次数序号,WeightVectn为第tn次样本训练的权重向量,且WeightVectn=(WtEmtn,1,WtEmtn,2,...,WtEmtn,dn,...,WtEmtn,DN),WtEmtn,dn为WeightVectn在第dn个审核维度上的取值,T为转置符号,EsResultVectn为第tn次样本训练的结果向量,且EsResultVectn=(EsValtn,1,EsValtn,2,...,EsValtn,sn,...,EsValtn,SN),特殊地,第1次样本训练的权重向量可以根据实际情况进行设置,例如,可以将其设置为全1向量,即WeightVec1=(1,1,...,1,...,1)。
根据下式计算第tn次样本训练的误差向量:
Errortn=EsResultVectn-SpResultVec
其中,SpResultVec为目标结果向量,且SpResultVec=(SpVal1,SpVal2,...,SpValsn,...,SpValSN),SpValsn为第sn个样本的审核结果(例如,若审核结果为通过,则用1来表示,若审核结果为不通过,则用0来表示),Errortn为第tn次样本训练的误差向量,且Errortn=(ErrEmtn,1,ErrEmtn,2,...,ErrEmtn,sn,...,ErrEmtn,SN),ErrEmtn,sn=SpValsn-EsValtn,sn。
在此基础上,还可以进一步根据下式计算第tn次样本训练的误差值:
其中,ErrValtn即为第tn次样本训练的误差值。
若第tn次样本训练的误差值大于或等于所述误差阈值,则对所述权重向量进行更新,并对所述审核模型进行第tn+1次样本训练。
所述误差阈值可以根据实际情况进行设置,例如,可以将其设置为5、10、20或者其它取值。
所述权重向量的更新过程如下式所示:
WeightVectn+1 T=WeightVectn T-λ×SpMatrixT×Errortn T
其中,λ为预设的更新系数,可以根据实际情况进行设置,例如,可以将其设置为0.1、0.01、0.001或者其它取值,
若第tn次样本训练的误差值小于所述误差阈值,则可认为所述审核模型已训练完毕,结束对所述审核模型的训练。
在所述审核模型训练完成后,使用所述审核模型对所述商户的商户信息向量进行计算,即可得到所述商户的审核结果。
该审核结果若大于预设的结果阈值,则可以判定该商户审核通过,该审核结果若小于或等于该结果阈值,则可以判定该商户审核不通过。所述结果阈值可以根据实际情况进行设置,例如,可以将其设置为0.4、0.5、0.6或者其它取值,在本实施例中,优选将其设置为0.5。
综上所述,本发明实施例在接收到商户的终端设备发送的商户审核申请后,从所述商户审核申请中提取所述商户的商户标识,根据所述商户标识分别从各个预设的数据源中获取所述商户在各个预设的审核维度上的商户信息,并根据各个审核维度上的商户信息构造所述商户的商户信息向量,最后使用预设的审核模型对所述商户的商户信息向量进行计算,得到所述商户的审核结果。由于所述审核模型预先经过了大量的样本训练,通过机器学习从历史商户审核记录中得到了通用的审核模式,在无需审核人员干预的情况下,既可自动对商户进行审核,大大提高了审核效率,且无需依赖审核人员的个人经验,保证了审核结果的公正客观。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
对应于上文实施例所述的一种商户审核方法,图3出了本发明实施例提供的一种商户审核装置的一个实施例结构图。
本实施例中,一种商户审核装置可以包括:
商户审核申请接收模块301,用于接收商户的终端设备发送的商户审核申请,并从所述商户审核申请中提取所述商户的商户标识;
商户信息获取模块302,用于根据所述商户标识分别从各个预设的数据源中获取所述商户在各个预设的审核维度上的商户信息,其中,每个数据源均对应至少一个审核维度上的商户信息;
商户信息向量构造模块303,用于根据各个审核维度上的商户信息构造所述商户的商户信息向量;
审核模型计算模块304,用于使用预设的审核模型对所述商户的商户信息向量进行计算,得到所述商户的审核结果,所述审核模型为经过预设的样本集合训练的机器学习模型,所述样本集合中包括审核结果为通过的正样本以及审核结果为不通过的负样本,每个样本均对应于预设的数据库中的一条历史商户审核记录。
进一步地,所述商户审核装置还可以包括:
样本集合构造模块,用于从所述数据库中获取各条历史商户审核记录,并根据所述历史商户审核记录构造样本集合,其中,所述样本集合中的任一样本均包括商户信息向量和审核结果;
审核模型构造模块,用于构造如下所示的审核模型:
其中,WtEmdn为第dn个审核维度上的商户信息的权重系数,1≤dn≤DN,DN为审核维度的总数,InfoEmdn为第dn个审核维度上的商户信息,Result为模型输出的审核结果;
样本训练模块,用于使用所述样本集合对所述审核模型进行训练,直至误差值小于预设的误差阈值为止。
进一步地,所述样本训练模块可以包括:
样本训练单元,用于根据下式对所述审核模型进行第tn次样本训练:
其中,sn为所述样本集合中的样本序号,1≤sn≤SN,SN为所述样本集合中的样本总数,SampleVecsn为第sn个样本的商户信息向量,且SampleVecsn=(SpEmsn,1,SpEmsn,2,...,SpEmsn,dn,...,SpEmsn,DN),SpEmsn,dn为第sn个样本的商户信息向量在第dn个审核维度上的取值,tn为样本训练的次数序号,WeightVectn为第tn次样本训练的权重向量,且WeightVectn=(WtEmtn,1,WtEmtn,2,...,WtEmtn,dn,...,WtEmtn,DN),WtEmtn,dn为WeightVectn在第dn个审核维度上的取值,T为转置符号,EsResultVectn为第tn次样本训练的结果向量,且EsResultVectn=(EsValtn,1,EsValtn,2,...,EsValtn,sn,...,EsValtn,SN),
误差向量计算单元,用于根据下式计算第tn次样本训练的误差向量:
Errortn=EsResultVectn-SpResultVec
其中,SpResultVec为目标结果向量,且SpResultVec=(SpVal1,SpVal2,...,SpValsn,...,SpValSN),SpValsn为第sn个样本的审核结果,Errortn为第tn次样本训练的误差向量,且Errortn=(ErrEmtn,1,ErrEmtn,2,...,ErrEmtn,sn,...,ErrEmtn,SN),ErrEmtn,sn=SpValsn-EsValtn,sn;
误差值计算单元,用于根据下式计算第tn次样本训练的误差值:
其中,ErrValtn即为第tn次样本训练的误差值;
权重向量更新单元,用于若第tn次样本训练的误差值大于或等于所述误差阈值,则对所述权重向量进行更新;
结束训练单元,用于若第tn次样本训练的误差值小于所述误差阈值,则结束对所述审核模型的训练。
进一步地,所述权重向量更新单元具体用于根据下式对所述权重向量进行更新:
WeightVectn+1 T=WeightVectn T-λ×SpMatrixT×Errortn T
其中,λ为预设的更新系数,
进一步地,所述商户信息获取模块可以包括:
数据授权请求发送单元,用于向所述商户的终端设备发送数据授权请求;
授权信息接收单元,用于接收所述商户的终端设备反馈的所述商户的授权信息;
数据服务器选取单元,用于从预设的服务器列表中选取与第s个数据源对应的服务器作为数据服务器,所述服务器列表记录了各个数据源与各个服务器之间的对应关系,1≤s≤SourceNum,SourceNum为数据源的总数;
数据请求发送单元,用于向所述数据服务器发送数据请求,所述数据请求中包括所述商户的商户标识和授权信息;
商户信息接收单元,用于接收所述数据服务器发送的所述商户的商户信息。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置,模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
图4示出了本发明实施例提供的一种服务器的示意框图,为了便于说明,仅示出了与本发明实施例相关的部分。
在本实施例中,所述服务器4可以包括:处理器40、存储器41以及存储在所述存储器41中并可在所述处理器40上运行的计算机可读指令42,例如执行上述的商户审核方法的计算机可读指令。所述处理器40执行所述计算机可读指令42时实现上述各个商户审核方法实施例中的步骤,例如图1所示的步骤S101至S104。或者,所述处理器40执行所述计算机可读指令42时实现上述各装置实施例中各模块/单元的功能,例如图3所示模块301至304的功能。
示例性的,所述计算机可读指令42可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器41中,并由所述处理器40执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机可读指令段,该指令段用于描述所述计算机可读指令42在所述服务器4中的执行过程。
所述处理器40可以是中央处理单元(Central Processing Unit,CPU),还可以是其它通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器41可以是所述服务器4的内部存储单元,例如服务器4的硬盘或内存。所述存储器41也可以是所述服务器4的外部存储设备,例如所述服务器4上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器41还可以既包括所述服务器4的内部存储单元也包括外部存储设备。所述存储器41用于存储所述计算机可读指令以及所述服务器4所需的其它指令和数据。所述存储器41还可以用于暂时地存储已经输出或者将要输出的数据。
在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干计算机可读指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储计算机可读指令的介质。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种商户审核方法,其特征在于,包括:
接收商户的终端设备发送的商户审核申请,并从所述商户审核申请中提取所述商户的商户标识;
根据所述商户标识分别从各个预设的数据源中获取所述商户在各个预设的审核维度上的商户信息,其中,每个数据源均对应至少一个审核维度上的商户信息;
根据各个审核维度上的商户信息构造所述商户的商户信息向量;
使用预设的审核模型对所述商户的商户信息向量进行计算,得到所述商户的审核结果,所述审核模型为经过预设的样本集合训练的机器学习模型,所述样本集合中包括审核结果为通过的正样本以及审核结果为不通过的负样本,每个样本均对应于预设的数据库中的一条历史商户审核记录。
2.根据权利要求1所述的商户审核方法,其特征在于,所述审核模型的构建过程包括:
从所述数据库中获取各条历史商户审核记录,并根据所述历史商户审核记录构造样本集合,其中,所述样本集合中的任一样本均包括商户信息向量和审核结果;
构造如下所示的审核模型:
其中,WtEmdn为第dn个审核维度上的商户信息的权重系数,1≤dn≤DN,DN为审核维度的总数,InfoEmdn为第dn个审核维度上的商户信息,Result为模型输出的审核结果;
使用所述样本集合对所述审核模型进行训练,直至误差值小于预设的误差阈值为止。
3.根据权利要求2所述的商户审核方法,其特征在于,所述使用所述样本集合对所述审核模型进行训练包括:
根据下式对所述审核模型进行第tn次样本训练:
其中,sn为所述样本集合中的样本序号,1≤sn≤SN,SN为所述样本集合中的样本总数,SampleVecsn为第sn个样本的商户信息向量,且SampleVecsn=(SpEmsn,1,SpEmsn,2,...,SpEmsn,dn,...,SpEmsn,DN),SpEmsn,dn为第sn个样本的商户信息向量在第dn个审核维度上的取值,tn为样本训练的次数序号,WeightVectn为第tn次样本训练的权重向量,且WeightVectn=(WtEmtn,1,WtEmtn,2,...,WtEmtn,dn,...,WtEmtn,DN),WtEmtn,dn为WeightVectn在第dn个审核维度上的取值,T为转置符号,EsResultVectn为第tn次样本训练的结果向量,且EsResultVectn=(EsValtn,1,EsValtn,2,...,EsValtn,sn,...,EsValtn,SN),
根据下式计算第tn次样本训练的误差向量:
Errortn=EsResultVectn-SpResultVec
其中,SpResultVec为目标结果向量,且SpResultVec=(SpVal1,SpVal2,...,SpValsn,...,SpValSN),SpValsn为第sn个样本的审核结果,Errortn为第tn次样本训练的误差向量,且Errortn=(ErrEmtn,1,ErrEmtn,2,...,ErrEmtn,sn,...,ErrEmtn,SN),ErrEmtn,sn=SpValsn-EsValtn,sn;
根据下式计算第tn次样本训练的误差值:
其中,ErrValtn即为第tn次样本训练的误差值;
若第tn次样本训练的误差值大于或等于所述误差阈值,则对所述权重向量进行更新,并对所述审核模型进行第tn+1次样本训练;
若第tn次样本训练的误差值小于所述误差阈值,则结束对所述审核模型的训练。
4.根据权利要求3所述的商户审核方法,其特征在于,所述对所述权重向量进行更新包括:
根据下式对所述权重向量进行更新:
WeightVectn+1 T=WeightVectn T-λ×SpMatrixT×Errortn T
其中,λ为预设的更新系数,
5.根据权利要求1至4中任一项所述的商户审核方法,其特征在于,所述根据所述商户标识分别从各个预设的数据源中获取所述商户在各个预设的审核维度上的商户信息包括:
向所述商户的终端设备发送数据授权请求;
接收所述商户的终端设备反馈的所述商户的授权信息;
从预设的服务器列表中选取与第s个数据源对应的服务器作为数据服务器,所述服务器列表记录了各个数据源与各个服务器之间的对应关系,1≤s≤SourceNum,SourceNum为数据源的总数;
向所述数据服务器发送数据请求,所述数据请求中包括所述商户的商户标识和授权信息;
接收所述数据服务器发送的所述商户的商户信息。
6.一种商户审核装置,其特征在于,包括:
商户审核申请接收模块,用于接收商户的终端设备发送的商户审核申请,并从所述商户审核申请中提取所述商户的商户标识;
商户信息获取模块,用于根据所述商户标识分别从各个预设的数据源中获取所述商户在各个预设的审核维度上的商户信息,其中,每个数据源均对应至少一个审核维度上的商户信息;
商户信息向量构造模块,用于根据各个审核维度上的商户信息构造所述商户的商户信息向量;
审核模型计算模块,用于使用预设的审核模型对所述商户的商户信息向量进行计算,得到所述商户的审核结果,所述审核模型为经过预设的样本集合训练的机器学习模型,所述样本集合中包括审核结果为通过的正样本以及审核结果为不通过的负样本,每个样本均对应于预设的数据库中的一条历史商户审核记录。
7.根据权利要求6所述的商户审核装置,其特征在于,还包括:
样本集合构造模块,用于从所述数据库中获取各条历史商户审核记录,并根据所述历史商户审核记录构造样本集合,其中,所述样本集合中的任一样本均包括商户信息向量和审核结果;
审核模型构造模块,用于构造如下所示的审核模型:
其中,WtEmdn为第dn个审核维度上的商户信息的权重系数,1≤dn≤DN,DN为审核维度的总数,InfoEmdn为第dn个审核维度上的商户信息,Result为模型输出的审核结果;
样本训练模块,用于使用所述样本集合对所述审核模型进行训练,直至误差值小于预设的误差阈值为止。
8.根据权利要求7所述的商户审核装置,其特征在于,所述样本训练模块包括:
样本训练单元,用于根据下式对所述审核模型进行第tn次样本训练:
其中,sn为所述样本集合中的样本序号,1≤sn≤SN,SN为所述样本集合中的样本总数,SampleVecsn为第sn个样本的商户信息向量,且SampleVecsn=(SpEmsn,1,SpEmsn,2,...,SpEmsn,dn,...,SpEmsn,DN),SpEmsn,dn为第sn个样本的商户信息向量在第dn个审核维度上的取值,tn为样本训练的次数序号,WeightVectn为第tn次样本训练的权重向量,且WeightVectn=(WtEmtn,1,WtEmtn,2,...,WtEmtn,dn,...,WtEmtn,DN),WtEmtn,dn为WeightVectn在第dn个审核维度上的取值,T为转置符号,EsResultVectn为第tn次样本训练的结果向量,且EsResultVectn=(EsValtn,1,EsValtn,2,...,EsValtn,sn,...,EsValtn,SN),
误差向量计算单元,用于根据下式计算第tn次样本训练的误差向量:
Errortn=EsResultVectn-SpResultVec
其中,SpResultVec为目标结果向量,且SpResultVec=(SpVal1,SpVal2,...,SpValsn,...,SpValSN),SpValsn为第sn个样本的审核结果,Errortn为第tn次样本训练的误差向量,且Errortn=(ErrEmtn,1,ErrEmtn,2,...,ErrEmtn,sn,...,ErrEmtn,SN),ErrEmtn,sn=SpValsn-EsValtn,sn;
误差值计算单元,用于根据下式计算第tn次样本训练的误差值:
其中,ErrValtn即为第tn次样本训练的误差值;
权重向量更新单元,用于若第tn次样本训练的误差值大于或等于所述误差阈值,则对所述权重向量进行更新;
结束训练单元,用于若第tn次样本训练的误差值小于所述误差阈值,则结束对所述审核模型的训练。
9.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可读指令,其特征在于,所述计算机可读指令被处理器执行时实现如权利要求1至5中任一项所述的商户审核方法的步骤。
10.一种服务器,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令,其特征在于,所述处理器执行所述计算机可读指令时实现如权利要求1至5中任一项所述的商户审核方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910041444.2A CN109858927A (zh) | 2019-01-16 | 2019-01-16 | 一种商户审核方法、装置、计算机可读存储介质及服务器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910041444.2A CN109858927A (zh) | 2019-01-16 | 2019-01-16 | 一种商户审核方法、装置、计算机可读存储介质及服务器 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109858927A true CN109858927A (zh) | 2019-06-07 |
Family
ID=66894929
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910041444.2A Pending CN109858927A (zh) | 2019-01-16 | 2019-01-16 | 一种商户审核方法、装置、计算机可读存储介质及服务器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109858927A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110766340A (zh) * | 2019-10-31 | 2020-02-07 | 支付宝(杭州)信息技术有限公司 | 一种业务审核方法、装置及设备 |
CN111178203A (zh) * | 2019-12-20 | 2020-05-19 | 江苏常熟农村商业银行股份有限公司 | 签名审核方法、装置、计算机设备和存储介质 |
CN111586448A (zh) * | 2020-01-20 | 2020-08-25 | 全息空间(深圳)智能科技有限公司 | 直播平台主播预筛选方法、装置及存储介质 |
CN113313279A (zh) * | 2020-02-27 | 2021-08-27 | 北京沃东天骏信息技术有限公司 | 一种单据审核方法和装置 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104077700A (zh) * | 2014-06-09 | 2014-10-01 | 中国建设银行股份有限公司 | 用于电商平台的任务处理方法、装置及*** |
CN104077701A (zh) * | 2014-06-09 | 2014-10-01 | 中国建设银行股份有限公司 | 用于电商平台的任务处理方法及装置 |
US20150161620A1 (en) * | 2013-12-06 | 2015-06-11 | Cube, Co. | System and method for risk and fraud mitigation for merchant on-boarding |
WO2017028630A1 (zh) * | 2015-08-20 | 2017-02-23 | ***股份有限公司 | 一种验证方法及服务器 |
CN107123010A (zh) * | 2016-08-26 | 2017-09-01 | 北京小度信息科技有限公司 | 商户筛选方法、建立商户评价模型的方法及相关装置 |
CN107622432A (zh) * | 2017-07-28 | 2018-01-23 | 阿里巴巴集团控股有限公司 | 商户评价方法及*** |
CN108090817A (zh) * | 2018-01-02 | 2018-05-29 | 吉林师范大学 | 旅游背景下的诚信平台及其使用方法 |
CN108509458A (zh) * | 2017-02-28 | 2018-09-07 | 阿里巴巴集团控股有限公司 | 一种业务对象识别方法及装置 |
CN108564386A (zh) * | 2018-04-28 | 2018-09-21 | 腾讯科技(深圳)有限公司 | 商户识别方法及装置、计算机设备及存储介质 |
CN108647977A (zh) * | 2018-04-25 | 2018-10-12 | 合肥上城信息技术有限公司 | 一种商户审核评测平台及其方法 |
CN108665364A (zh) * | 2018-05-11 | 2018-10-16 | 深圳市买买提信息科技有限公司 | 销售提单审核方法及终端设备 |
CN108960782A (zh) * | 2018-07-10 | 2018-12-07 | 北京木瓜移动科技股份有限公司 | 内容审核方法以及装置 |
-
2019
- 2019-01-16 CN CN201910041444.2A patent/CN109858927A/zh active Pending
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150161620A1 (en) * | 2013-12-06 | 2015-06-11 | Cube, Co. | System and method for risk and fraud mitigation for merchant on-boarding |
CN104077700A (zh) * | 2014-06-09 | 2014-10-01 | 中国建设银行股份有限公司 | 用于电商平台的任务处理方法、装置及*** |
CN104077701A (zh) * | 2014-06-09 | 2014-10-01 | 中国建设银行股份有限公司 | 用于电商平台的任务处理方法及装置 |
WO2017028630A1 (zh) * | 2015-08-20 | 2017-02-23 | ***股份有限公司 | 一种验证方法及服务器 |
CN107123010A (zh) * | 2016-08-26 | 2017-09-01 | 北京小度信息科技有限公司 | 商户筛选方法、建立商户评价模型的方法及相关装置 |
CN108509458A (zh) * | 2017-02-28 | 2018-09-07 | 阿里巴巴集团控股有限公司 | 一种业务对象识别方法及装置 |
CN107622432A (zh) * | 2017-07-28 | 2018-01-23 | 阿里巴巴集团控股有限公司 | 商户评价方法及*** |
CN108090817A (zh) * | 2018-01-02 | 2018-05-29 | 吉林师范大学 | 旅游背景下的诚信平台及其使用方法 |
CN108647977A (zh) * | 2018-04-25 | 2018-10-12 | 合肥上城信息技术有限公司 | 一种商户审核评测平台及其方法 |
CN108564386A (zh) * | 2018-04-28 | 2018-09-21 | 腾讯科技(深圳)有限公司 | 商户识别方法及装置、计算机设备及存储介质 |
CN108665364A (zh) * | 2018-05-11 | 2018-10-16 | 深圳市买买提信息科技有限公司 | 销售提单审核方法及终端设备 |
CN108960782A (zh) * | 2018-07-10 | 2018-12-07 | 北京木瓜移动科技股份有限公司 | 内容审核方法以及装置 |
Non-Patent Citations (1)
Title |
---|
孙权;赵金涛;: "基于数据挖掘的商户风险评分方法和***", 软件产业与工程, no. 01 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110766340A (zh) * | 2019-10-31 | 2020-02-07 | 支付宝(杭州)信息技术有限公司 | 一种业务审核方法、装置及设备 |
CN111178203A (zh) * | 2019-12-20 | 2020-05-19 | 江苏常熟农村商业银行股份有限公司 | 签名审核方法、装置、计算机设备和存储介质 |
CN111586448A (zh) * | 2020-01-20 | 2020-08-25 | 全息空间(深圳)智能科技有限公司 | 直播平台主播预筛选方法、装置及存储介质 |
CN113313279A (zh) * | 2020-02-27 | 2021-08-27 | 北京沃东天骏信息技术有限公司 | 一种单据审核方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109858927A (zh) | 一种商户审核方法、装置、计算机可读存储介质及服务器 | |
CN108009915A (zh) | 一种欺诈用户社区的标记方法及相关装置 | |
CN108665159A (zh) | 一种风险评估方法、装置、终端设备及存储介质 | |
CN108763277B (zh) | 一种数据分析方法、计算机可读存储介质及终端设备 | |
WO2007044763A2 (en) | System and method for detecting fraudulent transactions | |
CN112712429A (zh) | 汇款业务审核方法、装置、计算机设备和存储介质 | |
CN110610431A (zh) | 基于大数据的智能理赔方法及智能理赔*** | |
CN110796539A (zh) | 一种征信评估方法及装置 | |
CN111428217A (zh) | 欺诈团伙识别方法、装置、电子设备及计算机可读存储介质 | |
CN109711733A (zh) | 用于生成聚类模型的方法、电子设备和计算机可读介质 | |
CN110119310A (zh) | ***资源分配方法、装置、计算机可读存储介质及服务器 | |
CN111181757B (zh) | 信息安全风险预测方法、装置以及计算设备、存储介质 | |
CN115578027A (zh) | 一种数据质量评估方法、装置、电子设备及存储介质 | |
CN112702410B (zh) | 一种基于区块链网络的评估***、方法及相关设备 | |
CN113935738B (zh) | 交易数据处理方法、装置、存储介质及设备 | |
CN107644045A (zh) | 投保资料数据的处理方法和装置 | |
CN111209403A (zh) | 数据处理方法、装置、介质及电子设备 | |
CN116596277A (zh) | 任务规划的方法、装置、设备以及存储介质 | |
CN112446777A (zh) | 一种信用评估方法、装置、设备及存储介质 | |
CN115358894A (zh) | 一种知识产权生命周期托管管理方法、装置、设备及介质 | |
CN113052692A (zh) | 数据处理的方法、装置、电子设备及计算机可读存储介质 | |
CN113506172A (zh) | 一种风险预警方法及其相关设备 | |
CN109379334B (zh) | 网络安全风险评估指标权重自适应构建方法及装置 | |
CN112116356B (zh) | 资产特征信息处理方法及装置 | |
CN109726882A (zh) | 一种对对象进行评价的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |