具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例1
根据本发明实施例,还提供了一种用户行为的风险评估方法的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机***中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本申请实施例一所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。以运行在计算机终端上为例,图1是本发明实施例的一种用户行为的风险评估方法的计算机终端的硬件结构框图。如图1所示,计算机终端10可以包括一个或多个(图中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器104、以及用于通信功能的传输装置106。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算机终端10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
存储器104可用于存储应用软件的软件程序以及模块,如本发明实施例中的用户行为的风险评估方法对应的程序指令/模块,处理器102通过运行存储在存储器104内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的应用程序的漏洞检测方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端10的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(Network Interface Controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
在上述运行环境下,本申请提供了如图2所示的用户行为的风险评估方法。图2是根据本发明实施例一的用户行为的风险评估方法的流程图。
如图2所示,该用户行为的风险评估方法可以包括如下实现步骤:
步骤S202,获取第一账户在第一预设时间段内执行第一行为所对应的用户行为频率。
本申请上述步骤S202中第一行为即用户行为,可以包括用户在网站上发生的所有行为,如搜索、浏览、打分、点评、加入购物车、取出购物筐、加入期待列表(WishList)、购买、使用减价券和退货等;甚至可以包括在第三方网站上的相关行为,如比价、看相关评测、参与讨论、社交媒体上的交流、与好友互动等。
其中,本发明实施例的用户行为的风险评估装置在对第一账户进行用户行为的风险评估时,可以按天、周、月或任意时间区间获取第一账户的行为数据,即获取第一账户在第一预设时间段内执行的第一行为,这里的第一行为实质上可以是一个事件组合,即包括具体行为和对象,如第一行为可以是购买-生活用品或浏览-页面等。
用户行为的风险评估装置在获取了第一账户在第一预设时间段内执行的第一行为之后,可以计算其对应的用户行为频率(Behaviour Frequency,BF)。对于第一账户,用户行为频率是指时间窗口内的一个行为出现的次数除以时间窗口内的该第一账户的所有行为的总数,其中,时间窗口即上述的第一预设时间段。
以第一行为包括“购买-生活用品”为例,第一账户在第一预设时间内的所有行为的总数是100个,而在第一预设时间段内“购买-生活用品”出现了3次,那么“购买-生活用品”的用户行为频率为3/100=0.03。
步骤S204,获取用户行为频率对应的反转行为频率,其中,反转行为频率是根据第一总数和第二总数得到的,第一总数是指在第一预设时间段内所有账户的第一行为的数量,第二总数是指在第一预设时间段内所有账户的所有行为的数量。
本申请上述步骤S204中,反转行为频率(Inverse Behaviour Frequency,IBF)是指时间窗口内所有账户执行“购买-生活用品”的数量,除以时间窗口内所有账户的所有行为的总数。
仍旧以第一行为包括“购买-生活用品”为例,在第一预设时间段内,如果“购买-生活用品”出现过1,000次,而该第一预设时间段内的所有账户的所有行为的总数是10,000,000个的话,其反转行为频率为lg(10,000,000/1,000)=4。
步骤S206,根据用户行为频率以及反转行为频率,得到第一行为对应的第一特征值。
本申请上述步骤S206中,第一特征值可以作为第一账户的分类或者聚类的重要特征,本发明实施例中,可以通过将上述得到的用户行为频率乘以上述得到的反转行为频率,进而得到第一行为对应的第一特征值,其中,第一特征值越大,则说明该第一行为越明显。
仍以第一行为包括“购买-生活用品”为例,根据上述得出的用户行为频率为0.03,反转行为频率为4,得到第一特征值为BF*IBF=0.03*4=0.12。
需要说明的是,这里只是以第一行为包括“购买-生活用品”为例进行说明,当第一行为还包括其他行为时,如“浏览-页面”,其计算方法与上述方法相同,此处不做赘述。
步骤S208,根据第一行为对应的第一特征值,计算第一特征值在所有账户的所有行为的特征值中所占的特征比例。
本申请上述步骤S208中,用户行为的风险评估装置在基于用户行为频率以及反转行为频率得到第一行为对应的第一特征值之后,需要计算出第一特征值在所有账户的所有行为的特征值中所占的特征比例,以便后续作为风险评估的输入参数。
其中,上述的所有账户的所有行为的特征值均可以按照上述步骤S202至步骤S206所述的方法进行计算,此处不再赘述。
步骤S210,基于特征比例以及预先获取的用户行为参数,得到第一账户在第一预设时间段内执行第一行为的风险评估结果。
本申请上述步骤S210中,预先获取的用户行为参数可以包括条件概率参数以及分类比例,其中,条件概率参数以及分类比例是通过预先创建训练样本集合,并基于朴素贝叶斯模型得到的,具体方法后续实施例中会进行详细描述。
本发明实施例的用户行为的风险评估装置基于特征比例以及预先获取的用户行为参数,即可以对第一账户在第一预设时间段内执行第一行为进行风险评估。
由上可知,本申请上述实施例一所提供的方案,通过获取第一账户的用户行为频率以及反转行为频率,得到第一行为的特征比例,进而基于预先获取的用户行为参数得到第一行为的风险评估结果,达到了准确对用户行为进行风险评估的目的,从而实现了增加风险评估正确率的技术效果,进而解决了现有技术由于仅基于用户行为频率进行用户行为的风险评估,造成的在一些特殊的情况下,风险评估结果错误率较高的技术问题。
本申请上述实施例提供的一种可选方案中,上述步骤S202,获取第一账户在第一预设时间段内执行第一行为所对应的用户行为频率,可以包括:
S20,确定第三总数和第四总数,其中,第三总数是指第一账户在第一预设时间段内执行第一行为的数量,第四总数是指第一账户在第一预设时间段内的所有行为的数量。
本申请上述步骤S20中,用户行为的风险评估装置在要获取第一账户在第一时间段内执行第一行为所对应的用户行为频率时,需要获得两个数据,其一为第一账户在第一预设时间段内执行第一行为的数量,即第三总数,其二为第一账户在第一预设时间段内的所有行为的数量,即第四总数。
仍旧以第一行为包括“购买-生活用品”为例,第一账户在第一预设时间段内执行第一行为的数量,即第三总数为3,第一账户在第一预设时间段内的所有行为的数量,即第四总数为100。
S22,依据第三总数和第四总数,计算用户行为频率。
本申请上述步骤S20中,用户行为的风险评估装置在确定了第一账户在第一预设时间段内执行第一行为的数量以及第一账户在第一预设时间段内的所有行为的数量之后,可以依据该第一账户在第一预设时间段内执行第一行为的数量以及第一账户在第一预设时间段内的所有行为的数量计算用户行为频率。
仍旧以第一行为包括“购买-生活用品”为例,由于用户行为的风险评估装置确定第一账户在第一预设时间段内执行第一行为的数量,即第三总数为3,第一账户在第一预设时间段内的所有行为的数量,即第四总数为100,那么用户行为频率即为3/100=0.03。
本申请上述实施例提供的一种可选方案中,上述步骤S204,获取用户行为频率对应的反转行为频率,可以包括:
S30,确定第一总数和第二总数。
本申请上述步骤S30中,用户行为的风险评估装置在要获取用户行为频率对应的反转行为频率时,需要获得两个数据,其一为在第一预设时间段内所有账户的第一行为的数量,即第一总数,其二为在第一预设时间段内所有账户的所有行为的数量,即第二总数。
仍旧以第一行为包括“购买-生活用品”为例,在第一预设时间段内,如果“购买-生活用品”出现过1,000次,而该第一预设时间段内的所有账户的所有行为的总数是10,000,000个,那么在第一预设时间段内所有账户的第一行为的数量,即第一总数为1,000,在第一预设时间段内所有账户的所有行为的数量,即第二总数为10,000,000。
S32,通过公式I=lg(k/q),计算反转行为频率,其中,I表示反转行为频率,k表示第二总数,q表示第一总数。
本申请上述步骤S20中,用户行为的风险评估装置在确定了在第一预设时间段内所有账户的第一行为的数量以及在第一预设时间段内所有账户的所有行为的数量之后,可以依据该在第一预设时间段内所有账户的第一行为的数量以及在第一预设时间段内所有账户的所有行为的数量计算反转行为频率。
仍旧以第一行为包括“购买-生活用品”为例,由于用户行为的风险评估装置确定在第一预设时间段内所有账户的第一行为的数量,即第一总数为1,000,在第一预设时间段内所有账户的所有行为的数量,即第二总数为10,000,000,那么用户行为频率即为lg(10,000,000/1,000)=4。
本申请上述实施例提供的一种可选方案中,上述步骤S206,根据第一行为对应的第一特征值,计算第一特征值在所有账户的所有行为的特征值中所占的特征比例,可以包括:
通过公式
得到第一特征值在所有账户的所有行为的特征值中所占的特征比例,其中,a
j表示第一特征值,P(a
j)用于表示a
j在所有账户的所有行为的特征值所占的特征比例,j为大于0的整数。
可选地,依据第三总数和第四总数,计算用户行为频率,包括:将第三总数除以第四总数,得到用户行为频率。
可选地,根据用户行为频率以及反转行为频率,得到第一行为对应的第一特征值,包括:将用户行为频率乘以反转行为频率,得到第一行为对应的第一特征值。
本申请上述实施例提供的一种可选方案中,如图3所示,在预先获取的用户行为参数包括条件概率参数以及分类比例的情况下,获取条件概率参数以及分类比例的步骤可以包括:
S302,创建训练样本集合,其中,训练样本集合至少包括一个样本特征值以及至少一个样本特征值对应的风险评估标签。
本申请上述步骤S302中,用户行为的风险评估装置在对第一账户在第一预设时间段内执行的第一行为进行风险评估之前,可以创建训练样本集合,建立基于朴素贝叶斯的模型。
其中,训练样本集合至少包括一个样本特征值以及至少一个样本特征值对应的风险评估标签,与上述第一特征值的计算过程类似的,训练样本集合中的至少一个样本特征值也可以是由样本账户的样本行为对应的样本用户行为频率以及样本用户行为频率对应的样本反转行为频率得到的。可选地,风险评估标签可以是0或1,例如0表示无风险,1表示有风险。
可选地,上述步骤S302创建训练样本集合,其中,训练样本集合至少包括一个样本特征值以及至少一个样本特征值对应的风险评估标签,可以包括:
S40,获取在第二预设时间段内至少一个样本账户的至少一个样本用户行为。
本申请上述步骤S40中,用户行为的风险评估装置所创建的训练样本集合,也是基于某一时间段的某些用户的行为,为了上述第一账户、第一行为进行区分,这里我们将训练样本集合中的账户称为样本账户,将行为称为样本用户行为,其中,样本用户行为同样可以包括用户在网站上发生的所有行为,如搜索、浏览、打分、点评、加入购物车、取出购物筐、加入期待列表、购买、使用减价券和退货等;甚至可以包括在第三方网站上的相关行为,如比价、看相关评测、参与讨论、社交媒体上的交流、与好友互动等。
S42,计算至少一个样本用户行为的样本用户行为频率,以及样本用户行为频率对应的样本反转行为频率,其中,样本反转行为频率是根据第五总数和第六总数得到的,第五总数是指在第二预设时间段内所有账户的至少一个样本用户行为的数量以及在第二预设时间段内所有账户的所有行为的总数得到的。
本申请上述步骤S42中,与上述过程类似的,用户行为的风险评估装置在获取了在第二预设时间段内至少一个样本账户的至少一个样本用户行为之后,需要计算至少一个样本用户行为的样本用户行为频率,以及样本用户行为频率对应的样本反转行为频率,其中,样本反转行为频率是根据第五总数和第六总数得到的,第五总数是指在第二预设时间段内所有账户的至少一个样本用户行为的数量以及在第二预设时间段内所有账户的所有行为的总数得到的。
可选地,计算至少一个样本用户行为的样本用户行为频率,以及样本用户行为频率对应的样本反转行为频率,可以包括:
在第二预设时间段内至少一个样本账户的至少一个样本用户行为的数量除以在第二预设时间段内至少一个样本账户的所有行为的数量,得到至少一个样本用户行为的样本用户行为频率;以及通过公式I′=lg(k′/q′),计算样本反转行为频率,其中,I′表示样本反转行为频率,k′表示第五总数,q′表示第六总数。
S44,根据样本用户行为频率以及样本反转行为频率,得到至少一个样本特征值。
本申请上述步骤S44中,与上述过程类似的,用户行为的风险评估装置在计算出至少一个样本用户行为的样本用户行为频率,以及样本用户行为频率对应的样本反转行为频率之后,可以根据样本用户行为频率以及样本反转行为频率,得到至少一个样本特征值。
可选地,根据样本用户行为频率以及样本反转行为频率,得到至少一个样本特征值,包括:将样本用户行为频率乘以样本反转行为频率,得到至少一个样本特征值。
S46,依据至少一个样本特征值以及至少一个样本特征值对应的风险评估标签创建训练样本集合。
本申请上述步骤S46中,用户行为的风险评估装置在得到上述至少一个样本特征值之后,基于至少一个样本特征值以及至少一个样本特征值对应的风险评估标签创建训练样本集合。
需要补充的是,在得到至少一个样本特征值以及至少一个样本特征值对应的风险评估标签之后,用户行为的风险评估装置还可以对该至少一个样本特征值以及至少一个样本特征值对应的风险评估标签进行优化,即可以在至少一个样本特征值以及至少一个样本特征值对应的风险评估标签所构成的集合中先有放回的抽取T份数据,每份数据包括N个样本特征值及其对应的风险评估标签,再对每份数据无放回抽取M个样本特征值及其对应的风险评估标签,M=Z1/2,其中Z为总的样本特征值的数量,T的值略大于Z的值,例如Z=400,T=500,进而得到上述训练样本集合,然而,本发明实施例对此并不做限定。
S304,根据至少一个样本特征值以及至少一个样本特征值对应的风险评估标签,得到条件概率参数以及分类比例。
本申请上述步骤S304中,与上述过程类似的,用户行为的风险评估装置在得到至少一个样本特征值以及至少一个样本特征值对应的风险评估标签之后,可以根据至少一个样本特征值以及至少一个样本特征值对应的风险评估标签,得到上述条件概率参数以及分类比例。
可选地,步骤S304根据至少一个样本特征值以及至少一个样本特征值对应的风险评估标签,得到条件概率参数以及分类比例,可以包括:
通过公式
得到条件概率参数,其中,P(a′
j|c
i)用于表示a′
j属于c
i的条件概率参数,a′
j表示样本特征值,c
i表示风险评估标签,Count(a′
j|c
i)表示属于c
i出现a′
j的次数,Count(c
i)表示属于c
i的次数,其中,0<j<n,n为训练样本集合中的样本总数,0<i<m,m为风险评估标签的种类数,i,j均为整数;以及
通过公式
得到分类比例,其中,P(c
i)用于表示c
i在所有风险评估标签中所占的分类比例。
本申请上述实施例提供的一种可选方案中,上述步骤S210,基于特征比例以及预先获取的用户行为参数,得到第一账户在第一预设时间段内执行第一行为的风险评估结果,可以包括:
S50,通过公式
得到第一账户在第一预设时间段内执行第一行为的风险评估结果,其中,c
MAP为第一账户在第一预设时间段内执行第一行为的风险评估结果。
本申请上述步骤S50中,用户行为的风险评估装置在得到P(aj)之后,基于通过训练样本集合得到的P(a′j|cj)和P(ci),得到第一账户在第一预设时间段内执行第一行为的风险评估结果cMAP。
下面结合图4,对本发明实施例的用户行为的风险评估方法进行描述:
步骤A,采集第二预设时间段内的样本账户的样本行为。
其中,用户行为的风险评估装置所创建的训练样本集合,也是基于某一时间段的某些用户的行为,为了上述第一账户、第一行为进行区分,这里我们将训练样本集合中的账户称为样本账户,将行为称为样本用户行为,其中,样本用户行为同样可以包括用户在网站上发生的所有行为,如搜索、浏览、打分、点评、加入购物车、取出购物筐、加入期待列表、购买、使用减价券和退货等;甚至可以包括在第三方网站上的相关行为,如比价、看相关评测、参与讨论、社交媒体上的交流、与好友互动等。
步骤B,计算样本BF和样本IBF。
其中,在第二预设时间段内至少一个样本账户的至少一个样本用户行为的数量除以在第二预设时间段内至少一个样本账户的所有行为的数量,得到至少一个样本用户行为的样本用户行为频率;以及通过公式I′=lg(k′/q′),计算样本反转行为频率,其中,I′表示样本反转行为频率,k′表示第五总数,q′表示第六总数。
步骤C,汇总样本BF*样本IBF及其对应的风险评估标签,创建训练样本集合。
其中,用户行为的风险评估装置在计算出至少一个样本用户行为的样本用户行为频率,以及样本用户行为频率对应的样本反转行为频率之后,可以根据样本用户行为频率以及样本反转行为频率,得到至少一个样本特征值。
可选地,根据样本用户行为频率以及样本反转行为频率,得到至少一个样本特征值,包括:将样本用户行为频率乘以样本反转行为频率,得到至少一个样本特征值。
用户行为的风险评估装置在得到上述至少一个样本特征值之后,基于至少一个样本特征值以及至少一个样本特征值对应的风险评估标签创建训练样本集合。
步骤D,基于训练样本集得到用户行为参数。
其中,用户行为参数包括条件概率参数以及分类比例。
具体地,通过公式
得到条件概率参数,其中,P(a′
j|c
i)用于表示a′
j属于c
i的条件概率参数,a′
j表示样本特征值,c
i表示风险评估标签,Count(a′
j|c
i)表示属于c
i出现a′
j的次数,Count(c
i)表示属于c
i的次数,其中,0<j<n,n为训练样本集合中的样本总数,0<i<m,m为风险评估标签的种类数,i,j均为整数;以及
通过公式
得到分类比例,其中,P(c
i)用于表示c
i在所有风险评估标签中所占的分类比例。
步骤E,对第一账户在第一预设时间段第一行为进行风险评估。
其中,与上述步骤S202至步骤S210相同的,用户行为的风险评估装置可以对第一账户在第一预设时间段第一行为进行风险评估,得到第一账户在第一预设时间段第一行为的风险评估结果。
在本发明实施例中,采用获取第一账户在第一预设时间段内执行第一行为所对应的用户行为频率;获取用户行为频率对应的反转行为频率,其中,反转行为频率是根据第一总数和第二总数得到的,第一总数是指在第一预设时间段内所有账户的第一行为的数量,第二总数是指在第一预设时间段内所有账户的所有行为的数量;根据用户行为频率以及反转行为频率,得到第一行为对应的第一特征值;根据第一行为对应的第一特征值,计算第一特征值在所有账户的所有行为的特征值中所占的特征比例;基于特征比例以及预先获取的用户行为参数,得到第一账户在第一预设时间段内执行第一行为的风险评估结果的方式,通过获取第一账户的用户行为频率以及反转行为频率,得到第一行为的特征比例,进而基于预先获取的用户行为参数得到第一行为的风险评估结果,达到了准确对用户行为进行风险评估的目的,从而实现了增加风险评估正确率的技术效果,进而解决了现有技术由于仅基于用户行为频率进行用户行为的风险评估,造成的在一些特殊的情况下,风险评估结果错误率较高的技术问题。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
实施例2
根据本发明实施例,还提供了一种用于实施上述方法实施例的装置实施例,本申请上述实施例所提供的装置可以在计算机终端上运行。
图5是根据本申请实施例的用户行为的风险评估装置的结构示意图。
如图5所示,该用户行为的风险评估装置可以包括第一获取单元502、第二获取单元504、处理单元506、第一计算单元508以及风险评估单元510。
其中,第一获取单元502,用于获取第一账户在第一预设时间段内执行第一行为所对应的用户行为频率;第二获取单元504,用于获取所述用户行为频率对应的反转行为频率,其中,所述反转行为频率是根据第一总数和第二总数得到的,所述第一总数是指在所述第一预设时间段内所有账户的第一行为的数量,所述第二总数是指在所述第一预设时间段内所有账户的所有行为的数量;处理单元506,用于根据所述用户行为频率以及所述反转行为频率,得到所述第一行为对应的第一特征值;第一计算单元508,用于根据所述第一行为对应的所述第一特征值,计算所述第一特征值在所有账户的所有行为的特征值中所占的特征比例;风险评估单元510,用于基于所述特征比例以及预先获取的用户行为参数,得到所述第一账户在所述第一预设时间段内执行所述第一行为的风险评估结果。
由上可知,本申请上述实施例一所提供的方案,通过获取第一账户的用户行为频率以及反转行为频率,得到第一行为的特征比例,进而基于预先获取的用户行为参数得到第一行为的风险评估结果,达到了准确对用户行为进行风险评估的目的,从而实现了增加风险评估正确率的技术效果,进而解决了现有技术由于仅基于用户行为频率进行用户行为的风险评估,造成的在一些特殊的情况下,风险评估结果错误率较高的技术问题。
此处需要说明的是,上述第一获取单元502、第二获取单元504、处理单元506、第一计算单元508以及风险评估单元510对应于实施例一中的步骤S202至步骤S210,五个模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例一所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例一提供的计算机终端10中,可以通过软件实现,也可以通过硬件实现。
可选地,如图6所示,所述第一获取单元502可以包括:第一确定子单元602和第一计算子单元604。
其中,第一确定子单元602,用于确定第三总数和第四总数,其中,所述第三总数是指所述第一账户在所述第一预设时间段内执行所述第一行为的数量,所述第四总数是指所述第一账户在所述第一预设时间段内的所有行为的数量;第一计算子单元604,用于依据所述第三总数和所述第四总数,计算所述用户行为频率。
此处需要说明的是,上述第一确定子单元602和第一计算子单元604对应于实施例一中的步骤S20至步骤S22,两个模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例一所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例一提供的计算机终端10中,可以通过软件实现,也可以通过硬件实现。
可选地,如图7所示,所述第二获取单元504可以包括:第二确定子单元702和第二计算子单元704。
第二确定子单元702,用于确定所述第一总数和所述第二总数;第二计算子单元704,用于通过公式I=lg(k/q),计算所述反转行为频率,其中,I表示所述反转行为频率,k表示所述第二总数,q表示所述第一总数。
此处需要说明的是,上述第二确定子单元702和第二计算子单元704对应于实施例一中的步骤S30至步骤S32,两个模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例一所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例一提供的计算机终端10中,可以通过软件实现,也可以通过硬件实现。
可选地,第一计算单元508用于执行以下步骤根据所述第一行为对应的所述第一特征值,计算所述第一特征值在所有账户的所有行为的特征值中所占的特征比例:通过公式
得到所述第一特征值在所有账户的所有行为的特征值中所占的特征比例,其中,a
j表示所述第一特征值,P(a
j)用于表示a
j在所有账户的所有行为的特征值所占的所述特征比例,j为大于0的整数。
可选地,第一计算子单元604用于执行以下步骤依据所述第三总数和所述第四总数,计算所述用户行为频率:将所述第三总数除以所述第四总数,得到所述用户行为频率;
处理单元506用于执行以下步骤根据所述用户行为频率以及所述反转行为频率,得到所述第一行为对应的第一特征值:将所述用户行为频率乘以所述反转行为频率,得到所述第一行为对应的第一特征值。
可选地,如图8所示,在所述预先获取的用户行为参数包括条件概率参数以及分类比例的情况下,用户行为的风险评估装置还可以包括:创建单元802和第二计算单元804。
其中,创建单元802,用于创建训练样本集合,其中,所述训练样本集合至少包括一个样本特征值以及所述至少一个样本特征值对应的风险评估标签;第二计算单元804,用于根据所述至少一个样本特征值以及所述至少一个样本特征值对应的所述风险评估标签,得到所述条件概率参数以及所述分类比例。
此处需要说明的是,上述创建单元802和第二计算单元804对应于实施例一中的步骤S302至步骤S304,两个模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例一所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例一提供的计算机终端10中,可以通过软件实现,也可以通过硬件实现。
可选地,如图9所示,所述创建单元802可以包括:获取子单元902、第三计算子单元904、第四计算子单元906以及创建子单元908。
其中,获取子单元902,用于获取在第二预设时间段内至少一个样本账户的至少一个样本用户行为;第三计算子单元904,用于计算所述至少一个样本用户行为的样本用户行为频率,以及所述样本用户行为频率对应的样本反转行为频率,其中,所述样本反转行为频率是根据第五总数和第六总数得到的,所述第五总数是指在所述第二预设时间段内所有账户的所述至少一个样本用户行为的数量以及在第二预设时间段内所有账户的所有行为的总数得到的;第四计算子单元906,用于根据所述样本用户行为频率以及所述样本反转行为频率,得到所述至少一个样本特征值;创建子单元908,用于依据所述至少一个样本特征值以及所述至少一个样本特征值对应的风险评估标签创建所述训练样本集合。
此处需要说明的是,上述获取子单元902、第三计算子单元904、第四计算子单元906以及创建子单元908对应于实施例一中的步骤S40至步骤S46,四个模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例一所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例一提供的计算机终端10中,可以通过软件实现,也可以通过硬件实现。
可选地,第三计算子单元904用于执行以下步骤计算所述至少一个样本用户行为的样本用户行为频率,以及所述样本用户行为频率对应的样本反转行为频率:
将在所述第二预设时间段内所述至少一个样本账户的所述至少一个样本用户行为的数量除以在所述第二预设时间段内所述至少一个样本账户的所有行为的数量,得到所述至少一个样本用户行为的所述样本用户行为频率;以及
通过公式I′=lg(k′/q′),计算所述样本反转行为频率,其中,I′表示所述样本反转行为频率,k′表示所述第五总数,q′表示所述第六总数。
可选地,第二计算单元804用于执行以下步骤根据所述至少一个样本特征值以及所述至少一个样本特征值对应的所述风险评估标签,得到所述条件概率参数以及所述分类比例:
通过公式
得到所述条件概率参数,其中,所述P(a′
j|c
i)用于表示a′
j属于c
i的所述条件概率参数,a′
j表示样本特征值,c
i表示所述风险评估标签,Coumt(a′
j|c
i)表示属于c
i出现a′
j的次数,Count(c
i)表示属于c
i的次数,其中,0<j<n,n为所述训练样本集合中的样本总数,0<i<m,m为风险评估标签的种类数,i,j均为整数;以及
通过公式
得到所述分类比例,其中,P(c
i)用于表示c
i在所有风险评估标签中所占的所述分类比例。
可选地,风险评估单元510用于执行以下步骤基于所述特征比例以及预先获取的用户行为参数,得到所述第一账户在所述第一预设时间段内执行所述第一行为的风险评估结果:通过公式
得到所述第一账户在所述第一预设时间段内执行所述第一行为的所述风险评估结果,其中,c
MAP为所述第一账户在所述第一预设时间段内执行所述第一行为的所述风险评估结果。
在本发明实施例中,采用获取第一账户在第一预设时间段内执行第一行为所对应的用户行为频率;获取用户行为频率对应的反转行为频率,其中,反转行为频率是根据第一总数和第二总数得到的,第一总数是指在第一预设时间段内所有账户的第一行为的数量,第二总数是指在第一预设时间段内所有账户的所有行为的数量;根据用户行为频率以及反转行为频率,得到第一行为对应的第一特征值;根据第一行为对应的第一特征值,计算第一特征值在所有账户的所有行为的特征值中所占的特征比例;基于特征比例以及预先获取的用户行为参数,得到第一账户在第一预设时间段内执行第一行为的风险评估结果的方式,通过获取第一账户的用户行为频率以及反转行为频率,得到第一行为的特征比例,进而基于预先获取的用户行为参数得到第一行为的风险评估结果,达到了准确对用户行为进行风险评估的目的,从而实现了增加风险评估正确率的技术效果,进而解决了现有技术由于仅基于用户行为频率进行用户行为的风险评估,造成的在一些特殊的情况下,风险评估结果错误率较高的技术问题。
实施例3
本发明的实施例还提供了一种存储介质。可选地,在本实施例中,上述存储介质可以用于保存上述实施例一所提供的用户行为的风险评估方法所执行的程序代码。
可选地,在本实施例中,上述存储介质可以位于计算机网络中计算机终端群中的任意一个计算机终端中,或者位于移动终端群中的任意一个移动终端中。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:获取第一账户在第一预设时间段内执行第一行为所对应的用户行为频率;获取所述用户行为频率对应的反转行为频率,其中,所述反转行为频率是根据第一总数和第二总数得到的,所述第一总数是指在所述第一预设时间段内所有账户的第一行为的数量,所述第二总数是指在所述第一预设时间段内所有账户的所有行为的数量;根据所述用户行为频率以及所述反转行为频率,得到所述第一行为对应的第一特征值;根据所述第一行为对应的所述第一特征值,计算所述第一特征值在所有账户的所有行为的特征值中所占的特征比例;基于所述特征比例以及预先获取的用户行为参数,得到所述第一账户在所述第一预设时间段内执行所述第一行为的风险评估结果。
可选地,存储介质还被设置为存储用于执行以下步骤的程序代码:确定第三总数和第四总数,其中,所述第三总数是指所述第一账户在所述第一预设时间段内执行所述第一行为的数量,所述第四总数是指所述第一账户在所述第一预设时间段内的所有行为的数量;依据所述第三总数和所述第四总数,计算所述用户行为频率。
可选地,存储介质还被设置为存储用于执行以下步骤的程序代码:确定所述第一总数和所述第二总数;通过公式I=lg(k/q),计算所述反转行为频率,其中,I表示所述反转行为频率,k表示所述第二总数,q表示所述第一总数。
可选地,存储介质还被设置为存储用于执行以下步骤的程序代码:通过公式
得到所述第一特征值在所有账户的所有行为的特征值中所占的特征比例,其中,a
j表示所述第一特征值,P(a
j)用于表示a
j在所有账户的所有行为的特征值所占的所述特征比例,j为大于0的整数。
可选地,存储介质还被设置为存储用于执行以下步骤的程序代码:将所述第三总数除以所述第四总数,得到所述用户行为频率。
可选地,存储介质还被设置为存储用于执行以下步骤的程序代码:将所述用户行为频率乘以所述反转行为频率,得到所述第一行为对应的第一特征值。
可选地,存储介质还被设置为存储用于执行以下步骤的程序代码:创建训练样本集合,其中,所述训练样本集合至少包括一个样本特征值以及所述至少一个样本特征值对应的风险评估标签;根据所述至少一个样本特征值以及所述至少一个样本特征值对应的所述风险评估标签,得到所述条件概率参数以及所述分类比例。
可选地,存储介质还被设置为存储用于执行以下步骤的程序代码:获取在第二预设时间段内至少一个样本账户的至少一个样本用户行为;计算所述至少一个样本用户行为的样本用户行为频率,以及所述样本用户行为频率对应的样本反转行为频率,其中,所述样本反转行为频率是根据第五总数和第六总数得到的,所述第五总数是指在所述第二预设时间段内所有账户的所述至少一个样本用户行为的数量以及在第二预设时间段内所有账户的所有行为的总数得到的;根据所述样本用户行为频率以及所述样本反转行为频率,得到所述至少一个样本特征值;依据所述至少一个样本特征值以及所述至少一个样本特征值对应的风险评估标签创建所述训练样本集合。
可选地,存储介质还被设置为存储用于执行以下步骤的程序代码:将在所述第二预设时间段内所述至少一个样本账户的所述至少一个样本用户行为的数量除以在所述第二预设时间段内所述至少一个样本账户的所有行为的数量,得到所述至少一个样本用户行为的所述样本用户行为频率;以及通过公式I′=lg(k′/q′),计算所述样本反转行为频率,其中,I′表示所述样本反转行为频率,k′表示所述第五总数,q′表示所述第六总数。
可选地,存储介质还被设置为存储用于执行以下步骤的程序代码:通过公式
得到所述条件概率参数,其中,所述P(a′
j|c
i)用于表示a′
j属于ci的所述条件概率参数,a′
j表示样本特征值,c
i表示所述风险评估标签,Count(a′
j|c
i)表示属于c
i出现a′
j的次数,Count(c
i)表示属于c
i的次数,其中,0<j<n,n为所述训练样本集合中的样本总数,0<i<m,m为风险评估标签的种类数,i,j均为整数;以及通过公式
得到所述分类比例,其中,P(c
i)用于表示c
i在所有风险评估标签中所占的所述分类比例。
可选地,存储介质还被设置为存储用于执行以下步骤的程序代码:通过公式
得到所述第一账户在所述第一预设时间段内执行所述第一行为的所述风险评估结果,其中,c
MAP为所述第一账户在所述第一预设时间段内执行所述第一行为的所述风险评估结果。
可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
可选地,本实施例中的具体示例可以参考上述实施例中所描述的示例,本实施例在此不再赘述。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。