CN108985559A - 风控数据处理方法、装置、计算机设备及存储介质 - Google Patents
风控数据处理方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN108985559A CN108985559A CN201810585015.7A CN201810585015A CN108985559A CN 108985559 A CN108985559 A CN 108985559A CN 201810585015 A CN201810585015 A CN 201810585015A CN 108985559 A CN108985559 A CN 108985559A
- Authority
- CN
- China
- Prior art keywords
- air control
- data
- event
- scene
- similarity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 32
- 238000012545 processing Methods 0.000 claims description 21
- 238000004590 computer program Methods 0.000 claims description 18
- 238000012790 confirmation Methods 0.000 claims description 14
- 238000001914 filtration Methods 0.000 claims description 6
- 230000001960 triggered effect Effects 0.000 claims description 6
- 238000012544 monitoring process Methods 0.000 claims description 4
- 238000012216 screening Methods 0.000 claims description 4
- 238000013481 data capture Methods 0.000 claims description 2
- 238000000034 method Methods 0.000 abstract description 16
- 206010063659 Aversion Diseases 0.000 abstract description 4
- 238000005516 engineering process Methods 0.000 abstract description 3
- 230000006978 adaptation Effects 0.000 description 12
- 230000000694 effects Effects 0.000 description 9
- 230000006870 function Effects 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000001105 regulatory effect Effects 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- 230000001737 promoting effect Effects 0.000 description 2
- 238000010414 shopping Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000010485 coping Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- Educational Administration (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及计算机技术领域,提供了一种风控数据处理方法、装置、计算机设备及存储介质,所述方法包括:获取风控数据,将规则集合为空的风控数据作为目标数据,将规则集合不为空的风控数据作为基础数据;计算目标数据中的场景信息与每个基础数据中的场景信息之间的信息相似度,获取该信息相似度对应的场景信息所在的基础数据作为待推荐数据;计算每个目标数据中的场景事件与每个待推荐数据中的场景事件之间的事件相似度;获取数值最大的事件相似度对应的待推荐数据,并将该待推荐数据中的风控规则,推荐给目标数据对应的专业公司。低成本地实现将有效预防风险的风控规则及时推荐给没有配置风控规则的专业公司,提高专业公司的风险预防水平。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种风控数据处理方法、装置、计算机设备及存储介质。
背景技术
目前,在许多网络购物、网络交易等业务场景进行的过程中,容易出现各种漏洞、风险或***现象,往往需要针对各类业务场景类型,配置适配的风控规则,对容易高频发生风险的业务场景的情况,其更需要配置风控规则来保护业务场景安全,预防风险,减少经济损失。
传统技术中,通常采用人工方式对每个专业公司的各类业务场景进行针对性分析,开发相应的风控规则,但是,这种方式开发周期长,投入成本高,并且不能及时提供有效预防风险的风控规则。
发明内容
基于此,有必要针对上述技术问题,提供一种可以低成本的将有效预防风险的风控规则及时推荐给没有配置风控规则的专业公司,提高专业公司的风险预防水平的风控数据处理方法、装置、计算机设备及存储介质。
一种风控数据处理方法,包括:
获取风控数据库中每个专业公司的风控数据,其中,所述风控数据包括场景信息,每个所述场景信息对应的场景事件,每个所述场景事件对应的包含风控规则的规则集合,以及每个所述风控规则对应的风控命中率;
从所述风控数据中筛选出所述规则集合为空的风控数据,作为目标数据,并将所述规则集合不为空的风控数据作为基础数据;
针对每个所述目标数据,计算该目标数据中的场景信息与每个所述基础数据中的场景信息之间的信息相似度,若所述信息相似度大于或等于预设的相似度阈值,则获取该信息相似度对应的场景信息所在的基础数据,并将该基础数据作为待推荐数据;
计算每个所述目标数据中的场景事件与每个所述待推荐数据中的场景事件之间的事件相似度;
获取所述事件相似度中数值最大的事件相似度对应的待推荐数据,并将该待推荐数据中的风控规则,推荐给所述目标数据对应的专业公司。
一种风控数据处理装置,包括:
数据获取模块,用于获取风控数据库中每个专业公司的风控数据,其中,所述风控数据包括场景信息,每个所述场景信息对应的场景事件,每个所述场景事件对应的包含风控规则的规则集合,以及每个所述风控规则对应的风控命中率;
数据筛选模块,用于从所述风控数据中筛选出所述规则集合为空的风控数据,作为目标数据,并将所述规则集合不为空的风控数据作为基础数据;
信息计算模块,用于针对每个所述目标数据,计算该目标数据中的场景信息与每个所述基础数据中的场景信息之间的信息相似度,若所述信息相似度大于或等于预设的相似度阈值,则获取该信息相似度对应的场景信息所在的基础数据,并将该基础数据作为待推荐数据;
事件计算模块,用于计算每个所述目标数据中的场景事件与每个所述待推荐数据中的场景事件之间的事件相似度;
规则推荐模块,用于获取所述事件相似度中数值最大的事件相似度对应的待推荐数据,并将该待推荐数据中的风控规则,推荐给所述目标数据对应的专业公司。
一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述风控数据处理方法的步骤。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述风控数据处理方法的步骤。
上述风控数据处理方法、装置、计算机设备及存储介质,通过获取风控数据库中每个专业公司的风控数据,筛选出规则集合为空的风控数据,确定为没有配置风控规则的目标数据,并将规则集合不为空的风控数据作为基础数据,从而有利于后续有针对性的为目标数据寻找适配的风控规则,同时,针对每个目标数据,计算该目标数据中的场景信息与每个基础数据中的场景信息之间的信息相似度,若信息相似度大于或等于预设的相似度阈值,则获取该信息相似度对应的场景信息所在的基础数据,并将该基础数据作为待推荐数据,通过待推荐数据能够找到目标数据适配的风控规则的范围和方向,有利于后续从待推荐数据中筛选出最优的推荐结果,进一步地,计算每个目标数据中的场景事件与每个待推荐数据中的场景事件之间的事件相似度,获取数值最大的事件相似度对应的待推荐数据,并将该待推荐数据中的风控规则,推荐给目标数据对应的专业公司,低成本地实现为没有配置风控规则的专业公司及时推荐适配的风控规则,提高专业公司的风险预防水平。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例中风控数据处理方法的一应用环境示意图;
图2是本发明一实施例中风控数据处理方法的一流程图;
图3是本发明一实施例中风控数据处理方法中对风控数据进行获取的一流程图;
图4是本发明一实施例中风控数据处理方法中步骤S5的一实现流程图;
图5是本发明一实施例中风控数据处理方法中对风控数据库进行更新的一流程图;
图6是本发明一实施例中风控数据处理装置的一示意图;
图7是本发明一实施例中计算机设备的一示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1示出了本发明实施例提供的应用环境,该应用环境包括服务端和客户端,其中,服务端和客户端之间通过网络进行连接,客户端用于接收专业公司发送的推荐请求,并且将接收到的专业公司的推荐请求发送到服务端,客户端具体可以但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备;服务端用于对风控数据进行处理,服务端具体可以用独立的服务器或者多个服务器组成的服务器集群实现。本发明实施例提供的风控数据处理方法应用于服务端。
请参阅图2,图2示出本实施例提供的风控数据处理方法的实现流程。详述如下:
S1:获取风控数据库中每个专业公司的风控数据,其中,风控数据包括场景信息,每个场景信息对应的场景事件,每个场景事件对应的包含风控规则的规则集合,以及每个风控规则对应的风控命中率。
在本实施例中,获取风控数据的方式具体可以是实时从风控数据库中获取,也可以是每隔预定的时间从风控数据库中获取,具体可以根据实际应用的需要进行设置,此处不做限制。
具体地,风控数据包括场景信息、场景事件、规则集合和风控命中率,其中,场景信息与场景事件的对应关系可以是一一对应的关系,也可以是一对多的关系;场景事件与规则集合是一一对应的关系;规则集合可以为空,也可以包含一个或多个风控规则;每个风控规则与风控命中率是一一对应的关系,风控命中率是每个场景事件命中其对应的风控规则的次数占该场景事件发生的总次数的百分比,用于表示每个场景事件的命中程度。
例如,专业公司A的风控数据中,有一个场景信息“登录”,该场景信息“登录”对应有一个场景事件“用户IP的登录交易界面”,该场景事件对应的规则集合中有一个风控规则“一个用户IP,在同一时间可以连续登录的次数,小于等于预设次数,否则限制该用户IP登录”。
S2:从风控数据中筛选出规则集合为空的风控数据,作为目标数据,并将规则集合不为空的风控数据作为基础数据。
在本实施例中,目标数据是没有配置风控规则的风控数据,基础数据是已经配置有风控规则的风控数据。
具体地,遍历步骤S1中获取的风控数据中的规则集合,若检索到规则集合为空,则将该规则集合所在的风控数据标记为目标数据,若检索到规则集合不为空,则将该规则集合所在的风控数据标记为基础数据。
从获取到的大量风控数据中,明确区分出没有配置风控规则的目标数据,和已经配置了风控规则基础数据,有利于后续在基础数据中,寻找目标数据适配的风控规则。
S3:针对每个目标数据,计算该目标数据中的场景信息与每个基础数据中的场景信息之间的信息相似度,若信息相似度大于或等于预设的相似度阈值,则获取该信息相似度对应的场景信息所在的基础数据,并将该基础数据作为待推荐数据。
在本实施例中,信息相似度具体可以通过计算基础数据中的场景信息中的单词在目标数据中的场景信息中出现的次数与目标数据中的场景信息的单词总个数之间的比值得到,计算信息相似度的过程详述如下:
分别对目标数据中的场景信息和每个基础数据中的场景信息进行分词处理,得到目标场景信息词汇集合和每个基础场景信息词汇集合,若基础场景信息词汇集合中的单词在目标场景信息词汇集合中出现一次,则标记为“1”,出现两次则标记为“2”,同理,出现N次则标记为“N”,没有出现,则标记为“0”,最终获取每个基础场景信息词汇集合中的单词在目标场景信息词汇集合中出现的总次数,并计算每个总次数与目标场景信息词汇集合中单词总个数的比值。示例如下:
假设一个基础数据的场景信息为“折扣优惠活动”,对这个场景信息进行分词得到的基础场景信息词汇集合为unit1:折扣/优惠/活动,一个目标数据中的场景信息为“促销优惠大酬宾活动”,对目标数据中的场景信息分词后的目标场景信息词汇集合为unit2:促销/优惠/大酬宾/活动,则unit1中的单词在unit2中出现的总次数为2,目标场景信息词汇集合中单词总个数为4,该总次数与目标场景信息词汇集合中单词总个数的比值为50%,即该场景信息与目标数据的场景信息之间的信息相似度为50%。
具体地,若计算得到的信息相似度大于或等于预设的相似度阈值,则获取该信息相似度对应的场景信息所在的基础数据,并将该基础数据作为待推荐数据。
例如,假设预设的相似度阈值为50%,沿用上述示例,基础数据的场景信息为“折扣优惠活动”与目标数据的场景信息为“促销优惠大酬宾活动”的信息相似度为50%,该信息相似度等于预设的相似度阈值,则获取该场景信息所在的基础数据,并将该基础数据作为待推荐数据。
需要说明的是,分词处理可以采用具有分词功能的工具,此处不做限制。预设的相似度阈值具体可以根据实际业务需求进行设置,此处不做限制。计算信息相似度还可以采用杰卡德相似度公式进行计算,或是其他相似度计算方式,此处不做限制。
S4:计算每个目标数据中的场景事件与每个待推荐数据中的场景事件之间的事件相似度。
在本实施例中,计算事件相似度的过程详述如下:
对目标数据中的场景事件和每个基础数据中的场景事件进行分词处理,得到目标场景事件词汇集合和每个基础场景事件词汇集合;
将目标场景事件词汇集合分别和每个基础场景事件词汇集合,进行去重合并,得到目标数据中的场景事件和每个基础场景事件合并后的总事件词汇集合,例如,假设目标数据A包含1个场景事件,根据步骤S3得到的目标数据A对应的待推荐数据的场景事件共有10个,则可得到10个总事件词汇集合;
计算目标场景事件词汇集合中的每个单词,在每个总事件词汇集合中的词频,得到目标场景事件词汇集合在每个总事件词汇集合中的词频向量,以及计算每个基础场景事件词汇集合中的每个单词,在其对应的总事件词汇集合中的词频,得到每个基础场景事件词汇集合各自的词频向量;
计算目标场景事件词汇集合的词频向量和每个基础场景事件词汇集合的词频向量之间的余弦相似度,余弦相似度的值越大则表示该值对应的场景事件与目标数据中的场景事件越相似,该余弦相似度即事件相似度。
为了更好地理解本步骤,现举例说明如下:
假设一个基础场景事件为“用户IP的登录交易界面”,对这个基础场景事件进行分词得到的基础场景事件词汇集合为unit3:用户/IP/的/登录/交易/界面,一个目标数据中的场景事件为“用户使用账号密码登入交易界面”,对目标数据中的场景事件分词后的目标场景事件词汇集合为unit4:用户/使用/账号/密码/登入/交易/界面,将unit3和unit4进行去重合并,得到目标场景事件词汇集合和基础场景事件词汇集合,合并后的总事件词汇集合unit5:用户/IP/的/登录/交易/界面/使用/账号/密码/登入,计算unit3中的单词在unit5的词频:用户1,IP1,的1,登录1,交易1,界面1,使用0,账号0,密码0,登入0,计算unit4中的单词在unit5的词频:用户1,IP0,的0,登录0,交易1,界面1,使用1,账号1,密码1,登入1,可以得到基础场景事件词汇集合的词频向量为(1,1,1,1,1,1,0,0,0,0),目标场景事件词汇集合的词频向量为(1,0,0,0,1,1,1,1,1,1),根据余弦相似度公式,计算目标场景事件词汇集合的词频向量和基础场景事件词汇集合的词频向量间的余弦相似度,得到的余弦值为0.463,即该场景事件与该目标数据中的场景事件之间的事件相似度为0.463。
需要说明的是,余弦相似度公式为其中,xi表示基础场景事件词汇集合在其对应的总事件词汇集合中的词频向量的分量,yi表示目标场景事件词汇集合在每个总事件词汇集合中的词频向量的分量,p表示余弦相似度的值,n表示总事件词汇集合中的单词的总个数,计算事件相似度还可以采用simhash海量相似度算法进行计算,或是其他相似度计算方式,此处不做限制。
S5:获取事件相似度中数值最大的事件相似度对应的待推荐数据,并将该待推荐数据中的风控规则,推荐给目标数据对应的专业公司。
具体地,从步骤S4中计算得到目标数据中的场景事件与每个待推荐数据的场景事件之间的事件相似度中,选择数值最大的事件相似度,获取该事件相似度对应的待推荐数据,并将该待推荐数据中的风控规则,推荐给目标数据对应的专业公司。
需要说明的是,推荐的方式具体可以是邮件或即时消息,也可以是其他方式,具体可以根据实际应用的需要进行设置,此处不做限制。
本实施例中,通过获取风控数据库中每个专业公司的风控数据,筛选出规则集合为空的风控数据,确定为没有配置风控规则的目标数据,并将规则集合不为空的风控数据作为基础数据,从而有利于后续有针对性的为该目标数据寻找适配的风控规则,同时,针对每个目标数据,计算每个目标数据中的场景信息与每个基础数据中的场景信息之间的信息相似度,若信息相似度大于或等于预设的相似度阈值,则获取该信息相似度对应的场景信息所在的基础数据,并将该基础数据作为待推荐数据,通过待推荐数据能够找到目标数据适配的风控规则的范围和方向,有利于后续从待推荐数据中筛选出最优的推荐结果,且计算相似度的方法,简单快捷,易于操作,进一步地,计算每个目标数据中的场景事件与每个待推荐数据中的场景事件之间的事件相似度,获取数值最大的事件相似度对应的待推荐数据,并将该待推荐数据中的风控规则,推荐给目标数据对应的专业公司,针对目标数据中场景事件,找到适用于该场景事件的风控规则,低成本地实现为没有配置风控规则的目标数据对应的专业公司及时推荐适配的风控规则,有利于提高专业公司的风险预防水平。
在一实施例中,在步骤S2之后,并且在步骤S3之前,该风控数据处理方法还包括如下步骤:
S6:若接收到专业公司的风控推荐请求,则根据风控推荐请求更新目标数据。
具体地,接收风控数据未被收录在风控数据库中的专业公司的风控推荐请求,获取该专业公司的风控数据,并将该风控数据作为更新后的目标数据,保存到风控数据库中。
在本实施例中,接收到风控数据未被收录在风控数据库中的专业公司的风控推荐请求,根据该风控推荐请求,可以在风控数据库中,为该专业公司查找适配的风控规则,并将找到的适配的风控规则推荐给该专业公司,体现出实用性和广泛适用性。
在一实施例中,如图3所示,在步骤S1之前,该风控数据处理方法还包括如下步骤:
S7:监控每个专业公司的每个场景事件,若检测到场景事件被触发并且命中该场景事件对应的规则集合中的风控规则,则记录该场景事件的命中信息,其中,命中信息包括该场景事件的发生时间,以及该场景事件命中的风控规则。
在本实施例中,场景事件命中该场景事件对应的规则集合中的风控规则,是指该场景事件中发生的情形违背了配置的风控规则中的约束条件,或超过了风控规则中的限制条件。
例如,假设有一场景事件为“用户可在领券折扣活动中,领取商家优惠券”,配置的风控规则为“一个用户IP只能领取一次优惠券,否则,限制该IP的使用”,场景事件具体发生过程为用户在商家软件中登录,点击领取优惠券按钮,若检测到同一用户IP在同一时间内,点击领取了100次优惠券,则可能是有用户通过欺诈软件对商家进行优惠券的不合理占有,确认与该场景事件配置的风控规则相违背,并将限制该用户IP在商家软件中的使用,即场景事件命中该场景事件对应的规则集合中的风控规则。
具体地,监控每个专业公司的每个场景事件,将检测到的场景事件被触发时的发生时间,以及场景事件在触发时,是否命中该场景事件对应的规则集合中的风控规则,记录在风控数据库的风控日志中,可以直观反映每个场景事件的命中情况,有利于后续对风控数据的分析和计算。
S8:每隔预定的时间间隔,根据命中信息,统计每个场景事件在预设时间段的数据量,其中,数据量包括场景事件发生的次数和该场景事件对应的规则集合中每个风控规则被命中的次数。
具体地,每隔预定的时间间隔,根据步骤S7中记录在风控日志中的命中信息,统计每个场景事件在预设时间段内的该场景事件发生的次数和该场景事件对应的规则集合中每个风控规则被命中的次数。
例如,假设预设时间段为“1月份的1号至15号”,继续使用步骤S7中的示例,如统计得到“1月份的1号至15号”中,场景事件“用户可在领券折扣活动中,领取商家优惠券”发生的次数为500次,命中其对应的风控规则的次数为5次。
需要说明的是,预定的时间间隔和预设时间段,具体可以根据实际业务需求进行设置,此处不做限制。
S9:根据数据量,计算每个场景事件的风控命中率。
在本实施例中,每个场景事件的风控命中率是每个场景事件在预设时间段内的该场景事件对应的规则集合中每个风控规则被命中的次数和该场景事件发生的次数的比值,命中率越高,则表示该场景事件越容易发生风险。
继续使用步骤S8中的示例,如场景事件“用户可在领券折扣活动中,领取商家优惠券”在“1月份的1号至15号”的时间段内的风控命中率为1%。
在本实施例中,监控每个专业公司的每个场景事件,将检测到的场景事件被触发时的发生时间,以及场景事件触发时,是否命中该场景事件对应的规则集合中的风控规则,记录风控数据库的风控日志中,可以直观反映每个场景事件的命中情况,有利于后续对风控数据的分析和计算,从而通过统计每个场景事件在预设时间段内的该场景事件发生的次数和该场景事件对应的规则集合中每个风控规则被命中的次数,可以计算出每个场景事件的风控命中率,可以充分体现每个场景事件的易发生风险的程度。
在一实施例中,如图4所示,步骤S5中,即获取事件相似度中数值最大的事件相似度对应的待推荐数据,并将该待推荐数据中的风控规则,推荐给目标数据对应的专业公司具体包括如下步骤:
S501:获取事件相似度中数值最大的事件相似度对应的待推荐数据,作为标准数据。
具体地,从步骤S4中得到的每个目标数据的场景事件和每个待推荐数据的场景事件之间的事件相似度中,选取数值最大的事件相似度,并将该事件相似度对应的风控数据作为待推荐给专业公司的标准数据。
S502:从标准数据中,筛选出数值最大的风控命中率,并将该风控命中率对应的风控规则,推荐给目标数据对应的专业公司。
具体地,根据步骤S9中经统计和计算到的每个场景事件的风控命中率,在标准数据中,筛选出数值最大的风控命中率,并将该风控命中率对应的风控规则,作为最适配目标数据的风控规则,推荐给目标数据对应的专业公司。
例如,在标准数据中,有一场景事件“在购物平台,进行购物交易”,该场景事件对应有风控规则一“每笔交易金额不能超过2万元,否则,停止交易”,且风控命中率为5%,有风控规则二“每天的交易次数不得超过20次,否则,停止交易”,且风控命中率为2%,则选取风控命中率为5%对应的风控规则一,推荐给目标数据对应的专业公司。
在本实施例中,通过选取数值最大的事件相似度,并将该事件相似度对应的风控数据作为待推荐给专业公司的标准数据,同时,从标准数据中,筛选出数值最大的风控命中率,并将该风控命中率对应的风控规则,作为最适配目标数据的风控规则,推荐给目标数据对应的专业公司,风控命中率可以直观反映出其对应的场景事件易发生风险的程度,有利于提高该目标数据的场景事件预防风险的水平。
在一实施例中,如图5所示,在步骤S5之后,该风控数据处理方法还包括如下步骤:
S10:根据目标数据对应的专业公司反馈的确认信息,获取确认信息中该专业公司确认的目标风控规则。
具体地,接收到目标数据对应的专业公司反馈的确认信息,确认信息中包含了该专业公司确认使用的推荐的风控规则,其中,该被确认使用的风控规则,作为目标风控规则。
S11:在风控数据库中,将目标风控规则配置到目标数据对应的规则集合中。
具体地,根据步骤S10中获取到的目标风控规则,更新风控数据库中的风控数据,即将目标风控规则配置到目标数据对应的规则集合中。
在本实施例中,根据目标数据对应的专业公司反馈的确认信息,获取确认信息中该专业公司确认的目标风控规则,并在风控数据库中,将目标风控规则配置到目标数据对应的规则集合中,对风控数据进行更新,一方面可以充分体现配置了风控规则的目标数据的命中情况,另一方面,可以利用风控数据,为与该目标数据有相似或相同场景,却没有配置风控规则的其他专业公司,进行风控规则推荐,有利于提高各个专业公司预防风险的水平。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
在一实施例中,提供一种风控数据处理装置,该风控数据处理装置与上述实施例中风控数据处理方法一一对应。如图6所示,该风控数据处理装置包括数据获取模块601、数据筛选模块602、信息计算模块603、事件计算模块604和规则推荐模块605。各功能模块详细说明如下:
数据获取模块601,用于获取风控数据库中每个专业公司的风控数据,其中,风控数据包括场景信息,每个场景信息对应的场景事件,每个场景事件对应的包含风控规则的规则集合,以及每个风控规则对应的风控命中率;
数据筛选模块602,用于从风控数据中筛选出规则集合为空的风控数据,作为目标数据,并将规则集合不为空的风控数据作为基础数据;
信息计算模块603,用于针对每个目标数据,计算该目标数据中的场景信息与每个基础数据中的场景信息之间的信息相似度,若信息相似度大于或等于预设的相似度阈值,则获取该信息相似度对应的场景信息所在的基础数据,并将该基础数据作为待推荐数据;
事件计算模块604,用于计算每个目标数据中的场景事件与每个待推荐数据中的场景事件之间的事件相似度;
规则推荐模块605,用于获取事件相似度中数值最大的事件相似度对应的待推荐数据,并将该待推荐数据中的风控规则,推荐给目标数据对应的专业公司。
进一步地,该风控数据处理装置还包括:
请求接收模块606,用于若接收到专业公司的风控推荐请求,则根据风控推荐请求更新目标数据。
进一步地,该风控数据处理装置还包括:
命中记录模块607,用于监控每个专业公司的每个场景事件,若检测到场景事件被触发并且命中该场景事件对应的规则集合中的风控规则,则记录该场景事件的命中信息,其中,命中信息包括该场景事件的发生时间,以及该场景事件命中的风控规则;
数据统计模块608,用于每隔预定的时间间隔,根据命中信息,统计每个场景事件在预设时间段的数据量,其中,数据量包括场景事件发生的次数和该场景事件对应的规则集合中每个风控规则被命中的次数;
命中计算模块609,用于根据数据量,计算每个场景事件的风控命中率。
进一步地,规则推荐模块605包括:
数据获取单元6051,用于获取事件相似度中数值最大的事件相似度对应的待推荐数据,作为标准数据;
规则推荐单元6052,用于从标准数据中,筛选出数值最大的风控命中率,并将该风控命中率对应的风控规则,推荐给目标数据对应的专业公司。
进一步地,该风控数据处理装置还包括:
信息反馈模块610,用于根据目标数据对应的专业公司反馈的确认信息,获取确认信息中该专业公司确认的目标风控规则;
规则配置模块611,用于在风控数据库中,将目标风控规则配置到目标数据对应的规则集合中。
关于风控数据处理装置的具体限定可以参见上文中对于风控数据处理方法的限定,在此不再赘述。上述风控数据处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图7所示。该计算机设备包括通过***总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***、计算机程序和数据库。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的数据库用于保存风控数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种风控数据处理方法。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述实施例风控数据处理方法的步骤,例如图2所示的步骤S1至步骤S5。或者,处理器执行计算机程序时实现上述实施例中风控数据处理装置的各模块/单元的功能,例如图6所示模块601至模块605的功能。为避免重复,这里不再赘述。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述方法实施例中风控数据处理方法,或者,该计算机程序被处理器执行时实现上述装置实施例中风控数据处理装置中各模块/单元的功能。为避免重复,这里不再赘述。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。
Claims (10)
1.一种风控数据处理方法,其特征在于,所述风控数据处理方法包括:
获取风控数据库中每个专业公司的风控数据,其中,所述风控数据包括场景信息,每个所述场景信息对应的场景事件,每个所述场景事件对应的包含风控规则的规则集合,以及每个所述风控规则对应的风控命中率;
从所述风控数据中筛选出所述规则集合为空的风控数据,作为目标数据,并将所述规则集合不为空的风控数据作为基础数据;
针对每个所述目标数据,计算该目标数据中的场景信息与每个所述基础数据中的场景信息之间的信息相似度,若所述信息相似度大于或等于预设的相似度阈值,则获取该信息相似度对应的场景信息所在的基础数据,并将该基础数据作为待推荐数据;
计算每个所述目标数据中的场景事件与每个所述待推荐数据中的场景事件之间的事件相似度;
获取所述事件相似度中数值最大的事件相似度对应的待推荐数据,并将该待推荐数据中的风控规则,推荐给所述目标数据对应的专业公司。
2.如权利要求1所述的风控数据处理方法,其特征在于,在从所述风控数据中筛选出所述规则集合为空的风控数据,作为目标数据,并将所述规则集合不为空的风控数据作为基础数据之后,并且在所述针对每个所述目标数据,计算该目标数据中的场景信息与每个所述基础数据中的场景信息之间的信息相似度,若所述信息相似度大于或等于预设的相似度阈值,则获取该信息相似度对应的场景信息所在的基础数据,并将该基础数据作为待推荐数据之前,所述风控数据处理方法还包括:
若接收到专业公司的风控推荐请求,则根据所述风控推荐请求更新所述目标数据。
3.如权利要求1或2所述的风控数据处理方法,其特征在于,在所述获取风控数据库中每个专业公司的风控数据之前,所述风控数据处理方法还包括:
监控每个所述专业公司的每个所述场景事件,若检测到所述场景事件被触发并且命中该场景事件对应的规则集合中的风控规则,则记录该场景事件的命中信息,其中,所述命中信息包括该场景事件的发生时间,以及该场景事件命中的风控规则;
每隔预定的时间间隔,根据所述命中信息,统计每个所述场景事件在预设时间段的数据量,其中,所述数据量包括所述场景事件发生的次数和该场景事件对应的规则集合中每个风控规则被命中的次数;
根据所述数据量,计算每个所述场景事件的风控命中率。
4.如权利要求1或2所述的风控数据处理方法,其特征在于,所述获取所述事件相似度中数值最大的事件相似度对应的待推荐数据,并将该待推荐数据中的风控规则,推荐给所述目标数据对应的专业公司包括:
获取所述事件相似度中数值最大的事件相似度对应的待推荐数据,作为标准数据;
从所述标准数据中,筛选出数值最大的所述风控命中率,并将该风控命中率对应的所述风控规则,推荐给所述目标数据对应的专业公司。
5.如权利要求1或2所述的风控数据处理方法,其特征在于,在所述获取所述事件相似度中数值最大的事件相似度对应的待推荐数据,并将该待推荐数据中的风控规则,推荐给所述目标数据对应的专业公司之后,所述风控数据处理方法还包括:
根据所述目标数据对应的专业公司反馈的确认信息,获取所述确认信息中该专业公司确认的目标风控规则;
在所述风控数据库中,将所述目标风控规则配置到所述目标数据对应的规则集合中。
6.一种风控数据处理装置,其特征在于,所述风控数据处理装置包括:
数据获取模块,用于获取风控数据库中每个专业公司的风控数据,其中,所述风控数据包括场景信息,每个所述场景信息对应的场景事件,每个所述场景事件对应的包含风控规则的规则集合,以及每个所述风控规则对应的风控命中率;
数据筛选模块,用于从所述风控数据中筛选出所述规则集合为空的风控数据,作为目标数据,并将所述规则集合不为空的风控数据作为基础数据;
信息计算模块,用于针对每个所述目标数据,计算该目标数据中的场景信息与每个所述基础数据中的场景信息之间的信息相似度,若所述信息相似度大于或等于预设的相似度阈值,则获取该信息相似度对应的场景信息所在的基础数据,并将该基础数据作为待推荐数据;
事件计算模块,用于计算每个所述目标数据中的场景事件与每个所述待推荐数据中的场景事件之间的事件相似度;
规则推荐模块,用于获取所述事件相似度中数值最大的事件相似度对应的待推荐数据,并将该待推荐数据中的风控规则,推荐给所述目标数据对应的专业公司。
7.如权利要求6所述的风控数据处理装置,其特征在于,在所述数据获取模块之前,所述风控数据处理装置还包括:
命中记录模块,用于监控每个所述专业公司的每个所述场景事件,若检测到所述场景事件被触发并且命中该场景事件对应的规则集合中的风控规则,则记录该场景事件的命中信息,其中,所述命中信息包括该场景事件的发生时间,以及该场景事件命中的风控规则;
数据统计模块,用于每隔预定的时间间隔,根据所述命中信息,统计每个所述场景事件在预设时间段的数据量,其中,所述数据量包括所述场景事件发生的次数和该场景事件对应的规则集合中每个风控规则被命中的次数;
命中计算模块,用于根据所述数据量,计算每个所述场景事件的风控命中率。
8.如权利要求6所述的风控数据处理装置,其特征在于,所述规则推荐模块包括:
数据获取单元,用于获取所述事件相似度中数值最大的事件相似度对应的待推荐数据,作为标准数据;
规则推荐单元,用于从所述标准数据中,筛选出数值最大的所述风控命中率,并将该风控命中率对应的所述风控规则,推荐给所述目标数据对应的专业公司。
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5任一项所述风控数据处理方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述风控数据处理方法的步骤。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810585015.7A CN108985559A (zh) | 2018-06-08 | 2018-06-08 | 风控数据处理方法、装置、计算机设备及存储介质 |
PCT/CN2018/092327 WO2019232821A1 (zh) | 2018-06-08 | 2018-06-22 | 风控数据处理方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810585015.7A CN108985559A (zh) | 2018-06-08 | 2018-06-08 | 风控数据处理方法、装置、计算机设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108985559A true CN108985559A (zh) | 2018-12-11 |
Family
ID=64541033
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810585015.7A Pending CN108985559A (zh) | 2018-06-08 | 2018-06-08 | 风控数据处理方法、装置、计算机设备及存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN108985559A (zh) |
WO (1) | WO2019232821A1 (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110322139A (zh) * | 2019-06-28 | 2019-10-11 | 阿里巴巴集团控股有限公司 | 策略推荐方法及装置 |
WO2019232821A1 (zh) * | 2018-06-08 | 2019-12-12 | 平安科技(深圳)有限公司 | 风控数据处理方法、装置、计算机设备及存储介质 |
CN113112363A (zh) * | 2021-04-09 | 2021-07-13 | 上海中汇亿达金融信息技术有限公司 | 用于辅助交易准入审核的方法、装置和介质 |
CN114625747A (zh) * | 2022-05-13 | 2022-06-14 | 杭银消费金融股份有限公司 | 基于信息安全的风控更新方法及*** |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010113389A (ja) * | 2008-11-04 | 2010-05-20 | Fuji Xerox Co Ltd | 情報処理装置及び情報処理プログラム |
CN106897807A (zh) * | 2015-12-18 | 2017-06-27 | 阿里巴巴集团控股有限公司 | 一种业务风险控制方法及设备 |
WO2017128999A1 (zh) * | 2016-01-27 | 2017-08-03 | 阿里巴巴集团控股有限公司 | 一种风险控制方法和设备 |
CN107424069A (zh) * | 2017-08-17 | 2017-12-01 | 阿里巴巴集团控股有限公司 | 一种风控特征的生成方法、风险监控方法及设备 |
CN107767021A (zh) * | 2017-09-12 | 2018-03-06 | 阿里巴巴集团控股有限公司 | 一种风险控制方法及设备 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8135605B2 (en) * | 2006-04-11 | 2012-03-13 | Bank Of America Corporation | Application risk and control assessment tool |
CN107291922B (zh) * | 2017-06-29 | 2018-11-27 | 深圳市佰仟金融服务有限公司 | 一种数据分配方法及装置 |
CN107688948A (zh) * | 2017-07-24 | 2018-02-13 | 平安科技(深圳)有限公司 | 理赔数据处理方法、装置、计算机设备和存储介质 |
CN108985559A (zh) * | 2018-06-08 | 2018-12-11 | 平安科技(深圳)有限公司 | 风控数据处理方法、装置、计算机设备及存储介质 |
-
2018
- 2018-06-08 CN CN201810585015.7A patent/CN108985559A/zh active Pending
- 2018-06-22 WO PCT/CN2018/092327 patent/WO2019232821A1/zh active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010113389A (ja) * | 2008-11-04 | 2010-05-20 | Fuji Xerox Co Ltd | 情報処理装置及び情報処理プログラム |
CN106897807A (zh) * | 2015-12-18 | 2017-06-27 | 阿里巴巴集团控股有限公司 | 一种业务风险控制方法及设备 |
WO2017128999A1 (zh) * | 2016-01-27 | 2017-08-03 | 阿里巴巴集团控股有限公司 | 一种风险控制方法和设备 |
CN107424069A (zh) * | 2017-08-17 | 2017-12-01 | 阿里巴巴集团控股有限公司 | 一种风控特征的生成方法、风险监控方法及设备 |
CN107767021A (zh) * | 2017-09-12 | 2018-03-06 | 阿里巴巴集团控股有限公司 | 一种风险控制方法及设备 |
Non-Patent Citations (1)
Title |
---|
刘国志 等编: "《线性代数及其MATLAB实现》", 30 September 2015 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019232821A1 (zh) * | 2018-06-08 | 2019-12-12 | 平安科技(深圳)有限公司 | 风控数据处理方法、装置、计算机设备及存储介质 |
CN110322139A (zh) * | 2019-06-28 | 2019-10-11 | 阿里巴巴集团控股有限公司 | 策略推荐方法及装置 |
CN110322139B (zh) * | 2019-06-28 | 2023-11-28 | 创新先进技术有限公司 | 策略推荐方法及装置 |
CN113112363A (zh) * | 2021-04-09 | 2021-07-13 | 上海中汇亿达金融信息技术有限公司 | 用于辅助交易准入审核的方法、装置和介质 |
CN114625747A (zh) * | 2022-05-13 | 2022-06-14 | 杭银消费金融股份有限公司 | 基于信息安全的风控更新方法及*** |
Also Published As
Publication number | Publication date |
---|---|
WO2019232821A1 (zh) | 2019-12-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6743141B2 (ja) | サービス処理方法及び装置 | |
CN108985559A (zh) | 风控数据处理方法、装置、计算机设备及存储介质 | |
EP3690763A1 (en) | Machine learning model training method and device, and electronic device | |
CN104915879B (zh) | 基于金融数据的社会关系挖掘的方法及装置 | |
RU2635275C1 (ru) | Система и способ выявления подозрительной активности пользователя при взаимодействии пользователя с различными банковскими сервисами | |
CN110442712B (zh) | 风险的确定方法、装置、服务器和文本审理*** | |
CN105337928B (zh) | 用户身份识别方法、安全保护问题生成方法及装置 | |
CN109615524B (zh) | 洗钱犯罪团伙的识别方法、装置、计算机设备及存储介质 | |
CN111784348A (zh) | 账户风险识别方法及装置 | |
CN109308615B (zh) | 基于统计序列特征的实时欺诈交易检测方法、***、存储介质及电子终端 | |
CN110474871A (zh) | 一种异常账号检测方法、装置、计算机设备及存储介质 | |
CN103294752A (zh) | 日志传送物理复制环境中备用数据库的在线验证方法和*** | |
CN108243191A (zh) | 风险行为识别方法、存储介质、设备及*** | |
CN112330355B (zh) | 消费券交易数据处理方法、装置、设备及存储介质 | |
CN104954342A (zh) | 一种安全评估方法,及装置 | |
CN109376981B (zh) | 数据处理方式的确定方法、装置、服务器和数据处理方法 | |
CN113379530A (zh) | 用户风险的确定方法、装置和服务器 | |
CN109523124A (zh) | 资产数据处理方法、装置、计算机设备和存储介质 | |
CN112819611A (zh) | 欺诈识别方法、装置、电子设备和计算机可读存储介质 | |
CN108038692B (zh) | 角色识别方法、装置及服务器 | |
CN114841705B (zh) | 一种基于场景识别的反欺诈监测方法 | |
CN109858735A (zh) | 用户风险评分评定方法、装置、计算机设备及存储介质 | |
CN112750038A (zh) | 交易风险的确定方法、装置和服务器 | |
CN105991609B (zh) | 一种风险事件确定方法及装置 | |
CN109508994B (zh) | 业务风险控制方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20181211 |
|
RJ01 | Rejection of invention patent application after publication |