CN111428971A - 业务数据的处理方法、装置和服务器 - Google Patents

业务数据的处理方法、装置和服务器 Download PDF

Info

Publication number
CN111428971A
CN111428971A CN202010147284.2A CN202010147284A CN111428971A CN 111428971 A CN111428971 A CN 111428971A CN 202010147284 A CN202010147284 A CN 202010147284A CN 111428971 A CN111428971 A CN 111428971A
Authority
CN
China
Prior art keywords
data
target service
service data
risk
relation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010147284.2A
Other languages
English (en)
Inventor
王经宇
熊涛
周庆岳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN202010147284.2A priority Critical patent/CN111428971A/zh
Publication of CN111428971A publication Critical patent/CN111428971A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • Tourism & Hospitality (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Technology Law (AREA)
  • Quality & Reliability (AREA)
  • Game Theory and Decision Science (AREA)
  • Educational Administration (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本说明书提供了业务数据的处理方法、装置和服务器。在一个实施例中,该业务数据的处理方法,通过先获取并根据目标业务数据,以及与目标业务数据相关的多维度的关联数据,建立针对目标业务数据的关系属性数据;再利用包含有多种风险场景的关系属性数据的预设的风险场景知识库,根据上述目标业务数据的关系属性数据,确定出目标业务数据是否存在风险,以及目标业务数据所属的具体风险场景。从而能够较为准确、全面地识别出多种不同风险场景中存在风险的业务数据。

Description

业务数据的处理方法、装置和服务器
技术领域
本说明书属于互联网技术领域,尤其涉及业务数据的处理方法、装置和服务器。
背景技术
在不同的网络业务处理场景中,常常存在许多违规者通过某些具有风险的业务数据,实施违规行为,以获取利益,并对其他用户的权益造成损害。
因此,亟需一种能够较为准确、全面地识别出不同风险场景中存在风险的业务数据的方法。
发明内容
本说明书提供了一种业务数据的处理方法、装置和服务器,以能较为准确、全面地识别出多种不同风险场景中存在风险的业务数据。
本说明书提供的一种业务数据的处理方法、装置和服务器是这样实现的:
一种业务数据的处理方法,包括:获取目标业务数据,以及与目标业务数据相关的关联数据;根据所述目标业务数据、所述关联数据,建立针对目标业务数据的关系属性数据;根据预设的风险场景知识库,和目标业务数据的关系属性数据,确定所述目标业务数据是否存在风险,以及目标业务数据所属的风险场景,其中,所述预设的风险场景知识库包含有多种风险场景的关系属性数据。
一种业务数据的处理装置,包括:获取模块,用于获取目标业务数据,以及与目标业务数据相关的关联数据;建立模块,用于根据所述目标业务数据、所述关联数据,建立针对目标业务数据的关系属性数据;确定模块,用于根据预设的风险场景知识库,和目标业务数据的关系属性数据,确定所述目标业务数据是否存在风险,以及目标业务数据所属的风险场景,其中,所述预设的风险场景知识库包含有多种风险场景的关系属性数据。
一种服务器,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器执行所述指令时实现获取目标业务数据,以及与目标业务数据相关的关联数据;根据所述目标业务数据、所述关联数据,建立针对目标业务数据的关系属性数据;根据预设的风险场景知识库,和目标业务数据的关系属性数据,确定所述目标业务数据是否存在风险,以及目标业务数据所属的风险场景,其中,所述预设的风险场景知识库包含有多种风险场景的关系属性数据。
一种计算机可读存储介质,其上存储有计算机指令,所述指令被执行时实现获取目标业务数据,以及与目标业务数据相关的关联数据;根据所述目标业务数据、所述关联数据,建立针对目标业务数据的关系属性数据;根据预设的风险场景知识库,和目标业务数据的关系属性数据,确定所述目标业务数据是否存在风险,以及目标业务数据所属的风险场景,其中,所述预设的风险场景知识库包含有多种风险场景的关系属性数据。
本说明书提供的一种业务数据的处理方法、装置和服务器,通过先获取并根据目标业务数据,以及与目标业务数据相关的多维度的关联数据,建立针对目标业务数据的关系属性数据;再利用包含有多种风险场景的关系属性数据的预设的风险场景知识库,根据上述目标业务数据的关系属性数据,基于目标业务数据的关系特征,确定出目标业务数据是否存在风险,以及目标业务数据所属的具体风险场景。从而能够较为准确、全面地识别出多种不同风险场景中存在风险的业务数据。
附图说明
为了更清楚地说明本说明书实施例,下面将对实施例中所需要使用的附图作简单地介绍,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是应用本说明书实施例提供的业务数据的处理方法的***结构组成的一个实施例的示意图;
图2是在一个场景示例中,应用本说明书实施例提供的业务数据的处理方法的一种实施例的示意图;
图3是在一个场景示例中,应用本说明书实施例提供的业务数据的处理方法的一种实施例的示意图;
图4是本说明书的一个实施例提供的业务数据的处理方法的流程示意图;
图5是本说明书的一个实施例提供的服务器的结构组成示意图;
图6是本说明书的一个实施例提供的业务数据的处理装置的结构组成示意图。
具体实施方式
为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。
本说明书实施例提供一种业务数据的处理方法,所述业务数据的处理方法具体可以应用于包含有服务器和数据采集设备的***中。
具体可以参阅图1所示。数据采集设备具体可以连接多个不同的数据渠道(或链路),例如渠道1、渠道2……渠道N。进而上述数据采集设备可以从多个不同的数据渠道(或链路)采集与目标业务数据相关的关联数据,并将所采集到的与目标业务数据相关的关联数据,以及目标业务数据发送至服务器。服务器具体可以用于根据所述目标业务数据、所述关联数据,建立针对目标业务数据的关系属性数据;根据预设的风险场景知识库,和目标业务数据的关系属性数据,确定所述目标业务数据是否存在风险,以及目标业务数据所属的风险场景,其中,所述预设的风险场景知识库包含有多种风险场景的关系属性数据。进一步,服务器在确定目标业务数据存在风险后,可以根据目标业务数据所对应的具体的风险场景,有针对性地对该目标业务数据进行相应处理。
在本实施例中,所述服务器具体可以包括一种应用于业务平台一侧,能够实现数据传输、数据处理等功能的后台负责数据处理的服务器。具体的,所述服务器例如可以为一个具有数据运算、存储功能以及网络交互功能的电子设备。或者,所述服务器也可以为运行于该电子设备中,为数据处理、存储和网络交互提供支持的软件程序。在本实施例中,并不具体限定所述服务器的数量。所述服务器具体可以为一个服务器,也可以为几个服务器,或者,由若干服务器形成的服务器集群。
在本实施例中,所述数据采集设备具体可以包括一种布设于网络一侧,能够针对网络中出现的业务数据,及关联数据进行数据采集、数据传输等功能的前端设备或者插件程序等。
在一个具体的场景示例中,可以参阅图2所示,TB购物网的风险监控平台的监控服务器可以应用本说明书实施例提供的业务数据的处理方法监控TB购物网上出现的交易数据,并及时地识别、发现对应不同风险场景的存在风险的交易数据。
在本场景示例中,监控服务器在监测到TB购物网上出现的交易数据a后,会先通过数据采集设备从多种渠道或链路采集得到多种与交易数据a相关的关联数据。
其中,上述关联数据具体可以理解为一种通过多种不同的渠道、链路获取的与交易数据a所涉及到的不同因素(例如包括交易数据a的发起方、接收方、数据环境、数据内容等)相关的数据。
具体的,监控服务器可以先对交易数据a进行解析处理,确定出交易数据a的发起方为用户甲、接收方为用户乙。进一步,监控服务器可以将上述交易数据a,以及所确定出与交易数据a相关的发起方、接收方的信息发送至数据采集设备。以便数据采集设备可以根据交易数据a,以及交易数据a的发起方、接收方的信息,采集获取与交易数据a的发起方、接收方,和交易数据a的数据环境相关的特征数据,作为关联数据。
数据采集设备在得到上述交易数据a,以及交易数据a的发起方、接收方的信息后,可以通过TB购物网的服务器、发起方使用的介质设备(例如发起方发起交易数据a时使用的手机等)、接收方使用的介质设备(例如接收方接收交易数据a时使用的笔记本电脑等),以及与TB购物网关联或存在合作关系的第三方的服务器等多种渠道、链路来采集关联数据。
其中,上述第三方的服务器具体可以是TB购物网的子业务应用的服务器。例如,TB购物网旗下的购物聊天软件的服务器。上述第三方的服务器也可以是独立与TB购物网,但与TB购物网存在合作关系的其他网站平台的服务器。例如,PDD购物网的服务器。上述第三方的服务器还可以是一种支持数据查询、共享的机构平台的服务器。例如,某支持居民信用情况查询平台的服务器。
在本场景示例中,上述数据采集设备可以通过上述多种渠道、链路来采集与交易数据a的发起方用户甲、接收方用户乙,以及该交易数据的数据环境相关的特征数据作为针对交易数据a的关联数据。
具体的,数据采集设备可以通过多个渠道、链路来采集与发起方用户甲相关的特征数据,以及与接收方用户乙相关的特征数据。
例如,数据采集设备可以通过查询用户甲在TB购物网,以及在PDD购物网的转账记录,整理得到用户甲总的转账记录。可以通过获取用户甲在购物聊天软件中的好友名单,建立得到针对用户甲的通讯录。
同时,还可以通过查询用户甲在TB购物网、PDD购物网,以其他机构平台注册时登机的信息数据,结合查询某支持居民信用情况查询平台所得到的针对用户甲的信用数据等,建立可以较为全面地反映用户甲的静态属性特征的用户属性信息。进而可以将上述用户甲的通讯录、转账记录,以及用户甲的用户属性信息作为与发起方用户甲相关的特征数据。
其中,上述用户属性信息具体可以包括:用户的姓名、用户的身份证信息、用户的信用评价、用户的职业、用户的注册地信息等等。当然,需要说明的是,上述所列举的用户的属性信息只是一种示意性说明。具体实施时,根据具体的应用场景和处理要求,上述用户的属性信息还可以包含其他类型的信息数据。例如,还可以包括用户的性别、学历等等。对此,本说明书不作限定。
按照类似的方式,数据采集设备还可以获取用户乙的转账记录、通讯录,以及用户乙的用户属性信息。进而可以将上述用户乙的转账记录、通讯录,以及用户乙的用户属性信息作为与接收方用户乙相关的特征数据。
此外,数据采集设备还可以通过多个渠道、链路来采集与交易数据a的数据环境相关的特征数据。
例如,上述数据采集设备可以确定出用户甲在发起交易数据a时使用的手机,并从该手机中获取手机的使用记录。进一步,可以通过读取手机的使用记录,确定出用户甲在使用该手机发起交易数据a时所在地址的信息,作为交易数据a的发起地址。还可以通过读取手机的使用记录,确定出用户甲在使用该手机发起交易数据a时所连接使用的网络信息(例如,所连接WIFI的IP地址等)、以及手机的MAC地址等作为发起交易数据a的网络特征。此外,数据采集设备还可以通过读取手机的使用记录确定出用户甲在该手机上登录使用的其他账号信息,以及用户甲在使用手机时人脸识别失败和/或指纹识别失败的记录等作为该手机的使用特征。
同时,数据采集设备可以确定出用户乙在接收交易数据a时使用的笔记本电脑,并从笔记本电脑中获取笔记本电脑的使用记录。进一步,可以通过读取笔记本电脑的使用记录,确定出用户乙在使用该笔记本电脑接收该交易数据a时所在地址的信息,作为交易数据a的接收地址。还可以通过读取笔记本电脑的使用记录,确定出用户乙在使用该笔记本电脑时所连接使用的网络信息、以及笔记本电脑的MAC地址等作为接收交易数据a的网络特征。此外,数据采集设备还可以通过读取笔记本电脑的使用记录确定出用户乙在该笔记本电脑上登录使用的其他账号信息,以及用户乙在使用笔记本电脑时密码和/或验证信息输入失败的记录等作为该手机的使用特征。
进一步,可以将上述采集得到的交易数据a的发起地址、发起交易数据a的网络特征、交易数据a的接收地址、接收交易数据a的网络特征、发起交易数据a的手机的使用特征,以及接收交易数据a的笔记本电脑的使用特征等,作为与交易数据a的数据环境相关的特征数据。
当然,需要说明的是,上述所列举的与数据环境相关的特征数据只是一种示意性说明。具体实施时,根据具体的应用场景和处理要求,还可以获取其他类型的相关数据作为上述与数据环境相关的特征数据。
数据采集设备在按照上述方式采集得到针对交易数据a的关联数据后,可以通过有线或无线的方式,将上述交易数据a的关联数据发送至监控服务器。
监控服务器可以综合上述交易数据a的关联数据,以及交易数据a,基于多个维度类型,确定出能较为全面地反映出交易数据a在多个不同类型维度上的关系特征的关系属性数据。
具体的,监控服务器可以区分并针对交易维度、介质设备维度、行为维度,以及社交维度等多个不同类型维度,有针对性地从上述交易数据a,以及交易数据a的关联数据中分别提取出对应不同类型维度的关系特征。进而可以根据各个类型维度的关系特征,确定出不同类型维度下的源节点元素(可以记为src)、终结点元素(可以记为dst)和边属性元素(可以记为edge_property)。进一步,可以根据每一个类型维度下的源节点元素、终结点元素和边属性元素,建立能够描述所对应的类型维度的关系特征的关系元素组,可以记为:[src,dst,edge_property]。从而可以得到多个分别对应不同类型维度的关系元素组,再将上述多个关系元素组作为交易数据a的关系属性数据。
其中,上述源节点元素和终结点元素可以用于分别表征所对应的类型维度的关系中存在相互关联的两个特征对象,上述边属性元素可以用于表征在所对应的类型维度的关系中两个特征对象之间的关系属性。
例如,以基于交易维度为例,可以基于交易资金在转移途径上的关系特征,将交易资金的支付账户确定为源节点元素,记为src1,将交易资金的收账账户确定为终结点元素,记为dst1,将交易资金的转移途径,例如,通过微信红包转移,确定为边属性元素,记为edge_property1。进而可以根据上述三种元素构建针对交易维度的关系元素组,即[src1,dst1,edge_property1],用以表征交易维度的关系特征。
对于同一个类型维度,具体还可以采用多种不同方式来从多个角度描述出该类型维度的关系特征。因此,为了更加细化地描述出各个维度类型的关系特征,根据具体情况,可以建立多个不同的关系元素组来表征同一个维度类型的关系特征。
例如,对于上述交易维度,还可以基于交易资金的用途上的关系特征,将交易数据所涉及的交易资金的用途,例如,购买鞋子,作为边属性元素,记为edge_property2。将发起方在该交易中的身份信息,例如,买家,确定为始节点元素,记为src2。将接收方在该交易中的身份信息,例如,卖家,确定为终节点元素,记为dst2。进而可以建立对应的关系元素组,:[src2,dst2,edge_property2]。进一步,可以将该基于交易资金用途特征所建立的关系元素组,和之前基于交易资金的转移途径挺正常所建立的关系元素组[src1,dst1,edge_property1],共同作为对应交易维度的关系元素组,从而能够更加精细、全面地表征出交易维度上的关系特征。当然,上述所列举的建立对应的维度类型的关系元素组的方式,只是一种示意性说明。具体实施时,根据具体情况,还可以采用其他合适的方式来分别建立对应各个维度类型的关系元素组。对此,本说明书不作限定。
在本场景示例中,监控服务器在按照上述方式确定出针对交易数据a对应多个不同维度类型的关系元素组后,进一步,可以综合多个不同维度类型的关系元素组,得到针对交易数据a的关系属性数据。
其中,关系属性数据具体包括多个维度类型的关系元素组,通过关系属性数据可以从多个不同的维度类型来描述交易数据a的关系特征。
在确定出交易数据a的关系属性数据后,监控服务器可以调用预设的风险场景知识库,通过将交易数据a的关系属性数据与预设的风险场景知识库中的数据进行匹配,来确定交易数据a是否存在风险,以及交易数据a所属的风险场景。
其中,上述预设的风险场景知识库具体可以理解为一种预先通过对大量不同风险场景的风险业务数据的关系特征进行学习、训练所建立的,包含有分别对应多种不同风险场景的风险业务数据的关系属性数据的数据库。
上述多种风险场景具体可以包括:购物风险场景、借贷风险场景、理财风险场景等等。当然需要说明的是,上述所列举的风险场景只是一种示意性说明。具体实施时,根据具体的应用场景和处理需要,还可以引入其他类型的风险场景。例如,针对违规行为的风险场景。其中,上述违规行为具体可以是赌博行为、诈骗行为、洗钱行为等等。
在本场景示例中,具体匹配时,监控服务器可以根据预设的风险场景知识库,计算出交易数据a的关系属性数据与预设的风险场景知识库中多种风险场景的匹配度。再根据交易数据a的关系属性数据与多种风险场景的匹配度的数值排序,将按数值由大到小排序最高前的匹配度所对应的风险场景确定为交易数据a所属的风险场景。再通过比较交易数据a与所属的风险场景的匹配度和预设的匹配度阈值之间的带下关系,进一步确定交易数据a是否存在所属的风险场景中的风险。
例如,监控服务器按照上述方式确定出数值最大、排序最靠前的匹配度所对应的风险场景为购物风险场景。因此,可以将交易数据a所属的风险场景确定为购物风险场景。进一步,再将交易数据a与购物风险场景之间的匹配度,与预设的匹配度阈值进行比较,发现交易数据a与购物风险场景之间的匹配度数值大于预设的匹配度阈值。因此,可以判断交易数据a存在购物风险场景中的风险。例如,根据购物风险场景的风险特点,可以判断交易数据a可能会涉及到购买到假货,或所购商品质量不合格等风险。
进而监控服务器可以根据购物风险场景的风险特点,结合交易数据a的关系特征,有针对性地向买家,即交易数据的发起方用户甲生成并发送警示信息,以提醒用户甲所发起的交易数据a可能存在风险,并有针对性地对该笔交易数据a,以及交易数据a的接收方用户乙进行监控。
从而能够及时、准确地多种风险场景中识别确定出交易数据a所属的风险场景,以及该交易数据a在所属风险场景中所存在的风险。并且,还能基于所属的风险场景具体的风险特点,有针对性地采用合适的处理策略进行相应处理,以避免风险或者减少风险用户利益的损害。
在另一个场景示例中,可以参阅图3所示。监控服务器在按照上述利用预设的风险场景知识库,对出现在TB购物网上的各个交易数据进行所属风险场景识别,以及所存在风险进行判断的过程中,会记录并存储下没有准确识别出所属风险场景,和/或,没有识别是否存在风险的交易数据,作为被召回的交易数据,例如,基于新出现的攻击手段存在风险的交易数据。
进一步,每隔预设的预设时间段(例如,2天等),监控服务器会获取该预设的时间段内被召回的交易数据。并且,针对该批被召回的交易数据,监控服务器除了通过数据采集设备采集获取被召回的交易数据的关联数据外,还会控制数据采集设备通过扩展数据采集渠道、链路,和/或,扩展数据采集范围,采集被召回的交易数据的扩展数据。
其中,上述被召回的交易数据的扩展数据具体可以理解为区别于关联数据,通过扩展的数据采集渠道、链路,和/或,扩展的数据采集范围,采集得到的与被召回的交易数据相关数据。
例如,在本场景示例中,数据采集设备可以针对这类被召回的交易数据,通过花费一定的成本,购买之前无法直接使用的某平台数据库中,与该批被召回的交易数据相关联的业务数据作为扩展数据。也可以通过之前获取关联数据时使用的渠道、链路,获取之前没有获取的与接收方、发起方,和/或数据环境相关的特征数据作为扩展数据。例如,监控服务器可以通过TB购物网的数据库中存储的交易数据的数据生成时间作为一种扩展数据。当然,需要说明的是,上述所列举的扩展数据,以及获取扩展数据的方式只是一种示意性说明。具体实施时,根据具体的应用场景和处理要求,还可以采用其他合适的获取方式,获取其他类型的数据作为扩展数据。对此,本说明书不作限定。
数据采集设备在采集得到上述被召回的交易数据的关联数据,和扩展数据后,将上述被召回的交易数据的关联数据,和扩展数据通过有线或无线的方式发送至监控服务器。
监控服务器进而可以对综合被召回的业务数据,以及被召回的业务数据的关联数据、扩展数据,进行特征挖掘。具体的,可以利用特征提取子网络从上述被召回的业务数据,以及被召回的业务数据的关联数据、扩展数据中提取出多个维度类型的关系特征,作为特征挖掘结果。再根据特征挖掘结果,建立针对这类被召回的交易数据的关系属性数据,作为一种更新的关系属性数据。进而可以利用上述更新的关系属性数据,更新预设的风险场景知识库,从而可以使得预设的风险场景知识库及时地学习、掌握新出现的风险特征。
这样后续就可以利用更新后的预设的风险场景知识库,准确地识别出基于新出现的攻击手段存在风险的交易数据,从而能够提高风险场景的判断,以及风险确定的准确率。
在再一个场景示例中,TB购物网的数据处理***可以事先训练出能够实现根据交易数据、交易数据的关联数据,建立对应的关系属性数据;并根据预设的风险场景知识库,和交易数据的关系属性数据,确定出交易数据是否存在风险,以及交易数据所属的风险场景的风险处理模型。并将该风险处理模型提供给监控服务器。
这样,监控服务器在接收到数据采集设备反馈的交易数据a的关联数据后,可以将交易数据a和交易数据a的关联数据作为模型输入,输入至上述风险处理模型中,并运行该风险处理模型。风险处理模型具体运行时,可以根据交易数据a,和关联数据确定出交易数据a的关系属性数据;进一步,再通过调用预设的风险场景知识库,对交易数据a的关系属性数据进行匹配,确定出交易数据a存在风险的概率值,以及交易数据a所属的风险场景作为处理结果输出模型。
监控服务器可以根据上述处理结果,高效地确定出交易数据a所属的风险场景,以及交易数据a是否存在风险,提高了监控服务器的处理效率。
参阅图4所示,本说明书实施例提供了一种业务数据的处理方法。其中,该方法具体应用于服务器一侧。具体实施时,该方法可以包括以下内容。
S401:获取目标业务数据,以及与目标业务数据相关的关联数据。
在一些实施例中,上述目标业务数据具体可以理解为一种待确定是否存在风险,和/或,待识别所属的风险场景的业务数据。具体的,上述目标业务数据可以是一种交易数据,也可以是一种邮件数据,还可以是一种推送信息、广告数据等等。当然,上述所列举的目标业务数据只是一种示意性说明。具体实施时,根据具体的应用场景,还可以引入其他类型、内容的数据作为目标业务数据。对此,本说明书不作限定。
在一些实施例中,上述关联数据具体可以理解为一种通过多种不同的渠道、链路获取的与目标业务数据所涉及到的不同因素(例如目标业务数据的发起方、接收方、数据环境、数据内容等)相关的数据。
在一些实施例中,服务器可以根据目标业务数据,有针对性地通过多种不同渠道、链路,获取与目标业务数据的发起方、接收方,和/或,数据环境等因素相关的特征数据,作为目标业务数据的关联数据。
具体的,上述获取与目标业务数据相关的关联数据,可以包括以下内容:通过解析目标业务数据,确定出目标业务数据的发起方、接收方,以及目标业务数据的数据环境;有针对性地采集与所述发起方、接收方,和/或数据环境相关的特征数据,作为所述关联数据。
在一些实施例中,上述采集与所述发起方、接收方相关的特征数据,具体实施时,可以包括以下内容:采集发起方的通讯录、转账记录,和/或发起方的用户属性信息作为与所述发起方相关的特征数据;采集接收方的通讯录、转账记录,和/或接收方的用户属性信息作为与所述接收方相关的特征数据。
在一些实施例中,上述用户属性信息具体可以包括:用户的姓名、用户的身份证信息、用户的信用评价、用户的职业、用户的注册地信息等等。当然,需要说明的是,上述所列举的用户的属性信息只是一种示意性说明。具体实施时,根据具体的应用场景和处理要求,上述用户的属性信息还可以包含其他类型的信息数据。例如,还可以包括用户的性别、学历等等。对此,本说明书不作限定。
需要说明的是,上述所列举的与发起方、接收方相关的特征数据,以及获取与发起方、接收方相关的特征数据的获取方式只是一种示意性说明。具体实施时,根据具体的应用场景和处理要求,还可以获取采用其他合适的获取方式,获取其他类型、内容的数据作为与发起方、接收方相关的特征数据。对此,本说明书不作限定。
在一些实施例中,上述采集与数据环境相关的特征数据,具体实施时,可以包括以下内容:确定发起方发起目标业务数据时使用的第一介质设备,以及接收方接收目标业务数据时使用的第二介质设备;获取第一介质设备的使用记录、第二介质设备的使用记录;根据所述第一介质设备的使用记录、第二介质设备的使用记录,确定出所述目标业务数据的发起地址、发起目标业务数据的网络特征、目标业务数据的接收地址、接收目标业务数据的网络特征、第一介质设备的使用特征、第二介质设备的使用特征;将所述目标业务数据的发起地址、发起目标业务数据的网络特征、目标业务数据的接收地址、接收目标业务数据的网络特征、第一介质设备的使用特征、第二介质设备的使用特征中的一种或多种作为所述与数据环境相关的特征数据。
在一些实施例中,上述第一介质设备具体可以包括发起方在发起目标业务数据时登录使用的介质设备,例如,发起方使用的手机、电脑等设备。类似的,上述第二介质设备具体可以包括接收方在接收目标业务数据时登录使用的介质设备。
在一些实施例中,上述发起目标业务数据的网络特征具体可以包括发起方通过第一介质设备发起目标业务数据所使用的网络信息(例如,所连接的手机网,或WIFI的IP地址等),以及第一介质设备的MAC地址,用户在使用第一介质设备时身份识别失败(例如,人脸识别失败、登录密码验证失败等)的记录数据等等。相应的,上述接收目标业务数据的网络地址具体可以包括接收方通过第二介质设备接收目标业务数据所使用的网络信息,以及第二介质设备的MAC地址,用户在使用第二介质设备时身份识别失败的记录数据等等。当然,需要说明的是,上述所列举的发起目标业务数据的网络特征、接收目标业务数据的网络特征只是一种示意性说明。具体实施时,根据具体的应用场景和处理要求,上述发起目标业务数据的网络特征、接收目标业务数据的网络特征还可以包括其他类型、内容与网络相关的数据。对此,本说明书不作限定。
在一些实施例中,具体实施时,可以将上述获取得到的与发起方相关的特征数据、与接收方相关的特征数据、与数据环境相关的特征数据中的一种或多种的组合作为目标业务数据的关联数据。
S403:根据所述目标业务数据、所述关联数据,建立针对目标业务数据的关系属性数据。
在一些实施例中,上述关系属性数据具体可以理解为一种能够基于多个不同类型的维度能较为全面地描述目标业务数据的关系特征的属性数据。
在一些实施例中,上述维度类型具体可以包括以下所列举的维度中的一种或多种:交易维度、介质设备维度、行为维度,以及社交维度等。当然,需要说明的是,上述所列举的多个维度类型只是一种示意性说明。具体实施时,根据具体情况,还可以包括其他合适的维度类型。对此,本说明书不作限定。
在一些实施例中,具体实施时,可以根据目标业务数据、关联数据,提取对应多个不同维度类型的多个关系特征;再根据多个关系特征,建立对应多个不同维度类型的关系元素组;进而可以将所述多个关系元素组作为目标业务数据的关系属性数据。
在一些实施例中,具体实施时,可以利用预先训练好的针对多个不同的维度类型的特征提取子网络,分别对目标业务数据和关联数据进行处理,以提取得到对应不同维度类型的多个关系特征。
在一些实施例中,具体的,目标业务数据的关系属性数据可以包括多个不同的关系元素组。其中,一个关系元素组具体可以用于表征所对应的一个维度类型的关系特征。
在一些实施例中,一个关系元素组(例如,[src,dst,edge_property])具体可以包括源节点元素(可以记为src)、终结点元素(可以记为dst)和边属性元素(可以记为edge_property)三个不同的元素,通过上述源节点元素、终结点元素和边属性元素的组合可以表征出目标业务数据在所对应的维度类型上的关系特征。
其中,上述源节点元素和终结点元素可以用于分别表征所对应的类型维度的关系中存在相互关联的两个特征对象,上述边属性元素可以用于表征在所对应的类型维度的关系中两个特征对象之间的关系属性。需要补充的是,根据具体的应用场景,上述源节点元素和终结点元素具体可以是两个相互之间不分主次、地位同等的涉及目标业务数据的特征对象。
在一些实施例中,一个维度类型的关系特征具体可以通过多个不同的关系元素组从不同的角度得到的关系特征进行表征。例如,对应同一个维度类型的关系特征,可以通过以下两种不同的关系元素组进行表征:[src1,dst1,edge_property1]和[src2,dst2,edge_property2]。
S405:根据预设的风险场景知识库,和目标业务数据的关系属性数据,确定所述目标业务数据是否存在风险,以及目标业务数据所属的风险场景,其中,所述预设的风险场景知识库包含有多种风险场景的关系属性数据。
其中,上述预设的风险场景知识库具体可以理解为一种预先通过对大量不同风险场景的风险业务数据的关系特征进行学习、训练所建立的,包含有分别对应多种不同风险场景的风险业务数据的关系属性数据的数据库。
上述多种风险场景具体可以包括:购物风险场景、借贷风险场景、理财风险场景等等。当然需要说明的是,上述所列举的风险场景只是一种示意性说明。具体实施时,根据具体的应用场景和处理需要,还可以引入其他类型的风险场景。例如,针对违规行为的风险场景。其中,上述违规行为具体可以是赌博行为、诈骗行为、洗钱行为等等。
在一些实施例中,具体实施时,可以将根据预设的风险场景知识库,和目标业务数据的关系属性数据,分别计算出目标业务数据的关系属性数据与各个风险场景的匹配度;进而可以根据匹配度,确定出目标业务数据所属的风险场景,以及确定目标业务数据在所属的风险场景中是否存在风险。
在一些实施例中,具体实施时,可以根据预设的风险场景知识库,分别计算目标业务数据的关系属性数据与多种风险场景中各种风险场景所对应的关系属性数据之间的特征距离,进而可以将所计算出的特征距离作为目标业务数据的关系属性数据与多种风险场景的匹配度。
在一些实施例中,具体实施时,还可以采用graph embedding法(例如,node2vecdeepwalk等),或者基于路径的度量方式(例如,最短路径法等)确定出目标业务数据的关系属性数据与预设的风险场景知识库中的各个风险场景的匹配度。当然,上述所列举的确定匹配度的方式只是一种示意性说明。具体实施时,根据具体的应用场景,还可以采用其他合适的方式,例如,回归分类法等来确定匹配度。对此,本说明书不作限定。
在一些实施例中,在确定出目标业务数据的关系属性数据与预设的风险场景知识库中各个风险场景的匹配度后,可以按照匹配度的数值由大到小的进行排序,将排序最靠前,对应与目标业务数据的关系属性数据的匹配度数值最大的风险场景,确定为目标业务数据所属的风险场景。
进一步,可以比较目标业务数据的关系属性数据与所属的风险场景的匹配度,与预设的匹配度阈值的数值大小。如果目标业务数据的关系属性数据与所属的风险场景的匹配度大于预设的匹配度阈值,则可以确定目标业务数据在所属的风险场景中存在风险。如果目标业务数据的关系属性数据与所属的风险场景的匹配度小于等于预设的匹配度阈值,则可以确定目标业务数据在所属的风险场景中不存在风险。其中,上述预设的匹配度阈值的具体取值可以根据精度要求,灵活设置。对于预设的匹配度阈值的具体数值,本说明书不作限定。
在一些实施例中,如果服务器在按照上述方式确定出目标业务数据不存在风险后,可以对该目标业务数据不作处理,开始对下一个业务数据是否存在风险,以及所属的风险场景进行确定。
如果服务器在按照上述方式确定出目标业务数据存在风险后,可以生成对应的警示信息,并对该存在风险的业务数据进行相应处理。
具体的,服务器可以根据存在风险的目标业务数据所属的风险场景的场景特点,采用与所属风险场景匹配的处理方式,进行针对性的处理。例如,可以生成针对目标业务数据的警示信息,并根据目标业务数据所属的风险场景,对目标业务数据的发起方和/或接收方进行针对性的监控处理,或提示处理等。
在本实施例中,通过先获取并根据目标业务数据,以及与目标业务数据相关的多维度的关联数据,建立针对目标业务数据的关系属性数据;再利用包含有多种风险场景的关系属性数据的预设的风险场景知识库,根据上述目标业务数据的关系属性数据,基于目标业务数据的关系特征,确定出目标业务数据是否存在风险,以及目标业务数据所属的具体风险场景。从而能够较为准确、全面地识别出多种不同风险场景中存在风险的业务数据。
在一些实施例中,具体实施时,还可以事先通过对训练样本进行学习,建立能够实现根据业务数据、业务数据的关联数据,建立对应的关系属性数据;并根据预设的风险场景知识库,和业务数据的关系属性数据,确定出业务数据是否存在风险,以及业务数据所属的风险场景的风险处理模型。其中,上述风险处理模型具体可以宝库一种基于神经网络学习得到的模型。
这样在对目标业务数据进行具体处理时,可以获取目标业务数据的关联数据;将目标业务数据以及关联数据作为模型输入,输入至上述风险处理模型中,并运行风险处理模型。风险处理模型具体运行时,可以先根据目标业务数据、目标业务数据的关联数据,建立对应的关系属性数据;并根据预设的风险场景知识库,和目标业务数据的关系属性数据,确定出目标业务数据是否存在风险,以及目标业务数据所属的风险场景,得到对应的处理结果,输出模型。进而可以根据上述处理结果,确定目标业务数据是否存在风险,和/或,目标业务数据所属的风险场景。从而可以提高处理效率。
在一些实施例中,上述获取与目标业务数据相关的关联数据,具体实施时,可以包括以下内容:确定目标业务数据的发起方、接收方,以及目标业务数据的数据环境;采集与所述发起方、接收方,和/或数据环境相关的特征数据,作为所述关联数据。
在一些实施例中,上述采集与所述发起方、接收方相关的特征数据,具体实施时,可以包括以下内容:采集发起方的通讯录、转账记录,和/或发起方的用户属性信息作为与所述发起方相关的特征数据;采集接收方的通讯录、转账记录,和/或接收方的用户属性信息作为与所述接收方相关的特征数据。
在一些实施例中,上述采集与数据环境相关的特征数据,具体实施时,可以包括以下内容:确定发起方发起目标业务数据时使用的第一介质设备,以及接收方接收目标业务数据时使用的第二介质设备;获取第一介质设备的使用记录、第二介质设备的使用记录;根据所述第一介质设备的使用记录、第二介质设备的使用记录,确定出所述目标业务数据的发起地址、发起目标业务数据的网络特征、目标业务数据的接收地址、接收目标业务数据的网络特征、第一介质设备的使用特征、第二介质设备的使用特征;将所述目标业务数据的发起地址、发起目标业务数据的网络特征、目标业务数据的接收地址、接收目标业务数据的网络特征、第一介质设备的使用特征、第二介质设备的使用特征中的一种或多种作为所述与数据环境相关的特征数据。
在一些实施例中,上述根据所述目标业务数据、所述关联数据,建立针对目标业务数据的关系属性数据,具体实施时,可以包括以下内容:根据所述目标业务数据、所述关联数据,确定目标业务数据多个维度类型的关系特征;根据所述目标业务数据多个维度类型的关系特征,建立对应的多个关系元素组,作为目标业务数据的关系属性数据,其中,所述关系元素组通过所包含的源节点元素、终节点元素和边属性元素描述所对应的一个维度类型的关系特征。
在一些实施例中,所述维度类型具体可以包括以下至少之一:交易维度、介质设备维度、行为维度、社交维度等等。
在一些实施例中,上述根据预设的风险场景知识库,和目标业务数据的关系属性数据,确定所述目标业务数据是否存在风险,以及目标业务数据所属的风险场景,具体实施时,可以包括以下内容:根据预设的风险场景知识库,确定目标业务数据的关系属性数据与多种风险场景的匹配度;根据目标业务数据的关系属性数据与多种风险场景的匹配度的数值排序,确定出目标业务数据的所属的风险场景;根据目标业务数据与所属的风险场景的匹配度,与预设的匹配度阈值之间的大小关系,确定所述目标业务数据是否存在风险。
在一些实施例中,上述根据预设的风险场景知识库,确定目标业务数据的关系属性数据与多种风险场景的匹配度,具体实施时,可以包括以下内容:根据预设的风险场景知识库,分别计算目标业务数据的关系属性数据与多种风险场景中各种风险场景所对应的关系属性数据之间的特征距离,作为目标业务数据的关系属性数据与多种风险场景的匹配度。
在一些实施例中,具体实施时,可以按照以下方式建立所述预设的风险场景知识库:获取多种风险场景中存在风险的业务数据作为样本数据;获取与样本数据相关的关联数据;分别对各种风险场景中的样本数据和关联数据进行多维度类型的聚类处理,以建立得到对应各种风险场景的关系属性数据。
在本实施例中,具体实施时,可以通过对各种风险场景中的样本数据和关联数据进行多维度类型的聚类处理;进而再对聚类结果进行特征提取,得到对应各种风险场景的风险业务数据不同维度类型的关系特征;进一步,可以根据各种风险场景的风险数据不同维度类型的关系特征,确定出对应各种风险场景的关系属性数据。组合多种风险场景的关系属性数据,建立得到预设的风险场景知识库。
在一些实施例中,所述方法具体实施时,还可以包括以下内容:间隔预设时间段,获取被召回的业务数据;获取与被召回的业务数据相关的关联数据,和扩展数据;对所述被召回的业务数据,以及被召回的业务数据的关联数据、扩展数据进行特征挖掘;根据特征挖掘结果,建立更新的关系属性数据;利用所述更新的关系属性数据,更新预设的风险场景知识库。
在本实施例中,通过上述方式可以使得预设的风险场景知识库能够自动、及时地学习新出现的风险特征,并对预设的风险场景知识库进行相应更新。这样后续就可以利用更新后的预设的风险场景知识库,准确地识别出基于新出现的攻击手段存在风险的业务数据,从而能够提高风险场景的判断,以及风险确定的准确率。
由上可见,本说明书实施例提供的业务数据的处理方法,通过先获取并根据目标业务数据,以及与目标业务数据相关的多维度的关联数据,建立针对目标业务数据的关系属性数据;再利用包含有多种风险场景的关系属性数据的预设的风险场景知识库,根据上述目标业务数据的关系属性数据,确定出目标业务数据是否存在风险,以及目标业务数据所属的具体风险场景。从而能够较为准确、全面地识别出多种不同风险场景中存在风险的业务数据。还通过在建立目标业务数据的关系属性数据时,先确定出目标业务数据多个维度类型的关系属性特征;再分别根据上述多个维度类型中的各个维度类型的关系属性特征,使用相应的源节点元素、终节点元素和边属性元素来构建用于描述所对应的维度类型的关系属性特征的关系元素组,得到了多个关系元素作为目标业务数据的关系属性数据,从而能够得到更加全面、精准地表征出目标业务数据的关系特征的关系属性数据,进而后续可以利用上述关系属性数据,进一步更精准地确定出目标业务数据是否存在风险,以及所属的具体风险场景。还通过每间隔预设时间段,获取被召回的业务数据,并针对被召回的业务数据,以及被召回的业务数据的关联数据、扩展数据进行特征挖掘和学习,以便能够及时更新所使用的预设的风险场景知识库,从而可以不断地学习新出现的风险特征,利用更新后的预设的风险场景知识库识别出新出现的风险,更加精准地对目标业务数据是否存在风险,以及所属的风险场景进行判断确定。
本说明书实施例还提供一种服务器,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器具体实施时可以根据指令执行以下步骤:获取目标业务数据,以及与目标业务数据相关的关联数据;根据所述目标业务数据、所述关联数据,建立针对目标业务数据的关系属性数据;根据预设的风险场景知识库,和目标业务数据的关系属性数据,确定所述目标业务数据是否存在风险,以及目标业务数据所属的风险场景,其中,所述预设的风险场景知识库包含有多种风险场景的关系属性数据。
为了能够更加准确地完成上述指令,参阅图5所示,本说明书实施例还提供了另一种具体的服务器,其中,所述服务器包括网络通信端口501、处理器502以及存储器503,上述结构通过内部线缆相连,以便各个结构可以进行具体的数据交互。
其中,所述网络通信端口501,具体可以用于获取目标业务数据,以及与目标业务数据相关的关联数据。
所述处理器502,具体可以用于根据所述目标业务数据、所述关联数据,建立针对目标业务数据的关系属性数据;根据预设的风险场景知识库,和目标业务数据的关系属性数据,确定所述目标业务数据是否存在风险,以及目标业务数据所属的风险场景,其中,所述预设的风险场景知识库包含有多种风险场景的关系属性数据。
所述存储器503,具体可以用于存储相应的指令程序。
在本实施例中,所述网络通信端口501可以是与不同的通信协议进行绑定,从而可以发送或接收不同数据的虚拟端口。例如,所述网络通信端口可以是负责进行web数据通信的80号端口,也可以是负责进行FTP数据通信的21号端口,还可以是负责进行邮件数据通信的25号端口。此外,所述网络通信端口还可以是实体的通信接口或者通信芯片。例如,其可以为无线移动网络通信芯片,如GSM、CDMA等;其还可以为Wifi芯片;其还可以为蓝牙芯片。
在本实施例中,所述处理器502可以按任何适当的方式实现。例如,处理器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式等等。本说明书并不作限定。
在本实施例中,所述存储器503可以包括多个层次,在数字***中,只要能保存二进制数据的都可以是存储器;在集成电路中,一个没有实物形式的具有存储功能的电路也叫存储器,如RAM、FIFO等;在***中,具有实物形式的存储设备也叫存储器,如内存条、TF卡等。
本说明书实施例还提供了一种基于上述业务数据的处理方法的计算机存储介质,所述计算机存储介质存储有计算机程序指令,在所述计算机程序指令被执行时实现:获取目标业务数据,以及与目标业务数据相关的关联数据;根据所述目标业务数据、所述关联数据,建立针对目标业务数据的关系属性数据;根据预设的风险场景知识库,和目标业务数据的关系属性数据,确定所述目标业务数据是否存在风险,以及目标业务数据所属的风险场景,其中,所述预设的风险场景知识库包含有多种风险场景的关系属性数据。
在本实施例中,上述存储介质包括但不限于随机存取存储器(Random AccessMemory,RAM)、只读存储器(Read-Only Memory,ROM)、缓存(Cache)、硬盘(Hard DiskDrive,HDD)或者存储卡(Memory Card)。所述存储器可以用于存储计算机程序指令。网络通信单元可以是依照通信协议规定的标准设置的,用于进行网络连接通信的接口。
在本实施例中,该计算机存储介质存储的程序指令具体实现的功能和效果,可以与其它实施方式对照解释,在此不再赘述。
参阅图6所示,在软件层面上,本说明书实施例还提供了一种业务数据的处理装置,该装置具体可以包括以下的结构模块。
获取模块601,具体可以用于获取目标业务数据,以及与目标业务数据相关的关联数据;
建立模块603,具体可以用于根据所述目标业务数据、所述关联数据,建立针对目标业务数据的关系属性数据;
确定模块605,具体可以用于根据预设的风险场景知识库,和目标业务数据的关系属性数据,确定所述目标业务数据是否存在风险,以及目标业务数据所属的风险场景,其中,所述预设的风险场景知识库包含有多种风险场景的关系属性数据。
在一些实施例中,所述获取模块601具体可以包括以下结构单元:
第一确定单元,具体可以用于确定目标业务数据的发起方、接收方,以及目标业务数据的数据环境;
采集单元,具体可以用于采集与所述发起方、接收方,和/或数据环境相关的特征数据,作为所述关联数据。
在一些实施例中,所述采集单元具体实施时,可以用于采集发起方的通讯录、转账记录,和/或发起方的用户属性信息作为与所述发起方相关的特征数据;采集接收方的通讯录、转账记录,和/或接收方的用户属性信息作为与所述接收方相关的特征数据。
在一些实施例中,所述采集单元具体实施时,还可以用于确定发起方发起目标业务数据时使用的第一介质设备,以及接收方接收目标业务数据时使用的第二介质设备;获取第一介质设备的使用记录、第二介质设备的使用记录;根据所述第一介质设备的使用记录、第二介质设备的使用记录,确定出所述目标业务数据的发起地址、发起目标业务数据的网络特征、目标业务数据的接收地址、接收目标业务数据的网络特征、第一介质设备的使用特征、第二介质设备的使用特征;将所述目标业务数据的发起地址、发起目标业务数据的网络特征、目标业务数据的接收地址、接收目标业务数据的网络特征、第一介质设备的使用特征、第二介质设备的使用特征中的一种或多种作为所述与数据环境相关的特征数据。
在一些实施例中,所述建立模块603具体可以包括以下结构单元:
第二确定单元,具体可以用于根据所述目标业务数据、所述关联数据,确定目标业务数据多个维度类型的关系特征;
第一建立单元,具体可以用于根据所述目标业务数据多个维度类型的关系特征,建立对应的多个关系元素组,作为目标业务数据的关系属性数据,其中,所述关系元素组通过所包含的源节点元素、终节点元素和边属性元素描述所对应的一个维度类型的关系特征。
在一些实施例中,所述维度类型具体可以包括以下至少之一:交易维度、介质设备维度、行为维度、社交维度等等。
在一些实施例中,所述确定模块605具体可以包括以下结构单元:
第三确定单元,具体可以用于根据预设的风险场景知识库,确定目标业务数据的关系属性数据与多种风险场景的匹配度;
第四确定单元,具体可以用于根据目标业务数据的关系属性数据与多种风险场景的匹配度的数值排序,确定出目标业务数据的所属的风险场景;
第五确定单元,具体可以用于根据目标业务数据与所属的风险场景的匹配度,与预设的匹配度阈值之间的大小关系,确定所述目标业务数据是否存在风险。
在一些实施例中,所述第三确定单元具体可以用于根据预设的风险场景知识库,分别计算目标业务数据的关系属性数据与多种风险场景中各种风险场景所对应的关系属性数据之间的特征距离,作为目标业务数据的关系属性数据与多种风险场景的匹配度。
在一些实施例中,所述装置具体还可以包括预设的风险场景知识库的构建模块,用于建立预设的风险场景知识库。其中,上述预设的风险场景知识库的构建模块具体可以包括以下结构单元:
第一获取单元,具体可以用于获取多种风险场景中存在风险的业务数据作为样本数据;
第二获取单元,具体可以用于获取与样本数据相关的关联数据;
第二建立单元,具体可以用于分别对各种风险场景中的样本数据和关联数据进行多维度类型的聚类处理,以建立得到对应各种风险场景的关系属性数据。
在一些实施例中,所述装置具体还可以包括更新模块,具体可以用于更新预设的风险场景知识库。其中,上述更新模块具体可以包括以下结构单元:
第三获取单元,具体可以用于间隔预设时间段,获取被召回的业务数据;
第四获取单元,具体可以用于获取与被召回的业务数据相关的关联数据,和扩展数据;
挖掘单元,具体可以用于对所述被召回的业务数据,以及被召回的业务数据的关联数据、扩展数据进行特征挖掘;
第三建立单元,具体可以用于根据特征挖掘结果,建立更新的关系属性数据;
更新单元,具体可以用于利用所述更新的关系属性数据,更新预设的风险场景知识库。
需要说明的是,上述实施例阐明的单元、装置或模块等,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。为了描述的方便,描述以上装置时以功能分为各种模块分别描述。当然,在实施本说明书时可以把各模块的功能在同一个或多个软件和/或硬件中实现,也可以将实现同一功能的模块由多个子模块或子单元的组合实现等。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
由上可见,本说明书实施例提供的业务数据的处理,通过获取模块和建立模块先获取并根据目标业务数据,以及与目标业务数据相关的多维度的关联数据,并建立针对目标业务数据的关系属性数据;再通过确定模块利用包含有多种风险场景的关系属性数据的预设的风险场景知识库,根据上述目标业务数据的关系属性数据,确定出目标业务数据是否存在风险,以及目标业务数据所属的具体风险场景。从而能够较为准确、全面地识别出多种不同风险场景中存在风险的业务数据。
虽然本说明书提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的手段可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的装置或客户端产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境,甚至为分布式数据处理环境)。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、产品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、产品或者设备所固有的要素。在没有更多限制的情况下,并不排除在包括所述要素的过程、方法、产品或者设备中还存在另外的相同或等同要素。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内部包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构、类等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
通过以上的实施例的描述可知,本领域的技术人员可以清楚地了解到本说明书可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本说明书的技术方案本质上可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,移动终端,服务器,或者网络设备等)执行本说明书各个实施例或者实施例的某些部分所述的方法。
本说明书中的各个实施例采用递进的方式描述,各个实施例之间相同或相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。本说明书可用于众多通用或专用的计算机***环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器***、基于微处理器的***、置顶盒、可编程的电子设备、网络PC、小型计算机、大型计算机、包括以上任何***或设备的分布式计算环境等等。
虽然通过实施例描绘了本说明书,本领域普通技术人员知道,本说明书有许多变形和变化而不脱离本说明书的精神,希望所附的权利要求包括这些变形和变化而不脱离本说明书的精神。

Claims (22)

1.一种业务数据的处理方法,包括:
获取目标业务数据,以及与目标业务数据相关的关联数据;
根据所述目标业务数据、所述关联数据,建立针对目标业务数据的关系属性数据;
根据预设的风险场景知识库,和目标业务数据的关系属性数据,确定所述目标业务数据是否存在风险,以及目标业务数据所属的风险场景,其中,所述预设的风险场景知识库包含有多种风险场景的关系属性数据。
2.根据权利要求1所述的方法,获取与目标业务数据相关的关联数据,包括:
确定目标业务数据的发起方、接收方,以及目标业务数据的数据环境;
采集与所述发起方、接收方,和/或数据环境相关的特征数据,作为所述关联数据。
3.根据权利要求2所述的方法,采集与所述发起方、接收方相关的特征数据,包括:
采集发起方的通讯录、转账记录,和/或发起方的用户属性信息作为与所述发起方相关的特征数据;
采集接收方的通讯录、转账记录,和/或接收方的用户属性信息作为与所述接收方相关的特征数据。
4.根据权利要求2所述的方法,采集与数据环境相关的特征数据,包括:
确定发起方发起目标业务数据时使用的第一介质设备,以及接收方接收目标业务数据时使用的第二介质设备;
获取第一介质设备的使用记录、第二介质设备的使用记录;
根据所述第一介质设备的使用记录、第二介质设备的使用记录,确定出所述目标业务数据的发起地址、发起目标业务数据的网络特征、目标业务数据的接收地址、接收目标业务数据的网络特征、第一介质设备的使用特征、第二介质设备的使用特征;
将所述目标业务数据的发起地址、发起目标业务数据的网络特征、目标业务数据的接收地址、接收目标业务数据的网络特征、第一介质设备的使用特征、第二介质设备的使用特征中的一种或多种作为所述与数据环境相关的特征数据。
5.根据权利要求1所述的方法,根据所述目标业务数据、所述关联数据,建立针对目标业务数据的关系属性数据,包括:
根据所述目标业务数据、所述关联数据,确定目标业务数据多个维度类型的关系特征;
根据所述目标业务数据多个维度类型的关系特征,建立对应的多个关系元素组,作为目标业务数据的关系属性数据,其中,所述关系元素组通过所包含的源节点元素、终节点元素和边属性元素描述所对应的一个维度类型的关系特征。
6.根据权利要求5所述的方法,所述维度类型包括以下至少之一:交易维度、介质设备维度、行为维度、社交维度。
7.根据权利要求1所述的方法,根据预设的风险场景知识库,和目标业务数据的关系属性数据,确定所述目标业务数据是否存在风险,以及目标业务数据所属的风险场景,包括:
根据预设的风险场景知识库,确定目标业务数据的关系属性数据与多种风险场景的匹配度;
根据目标业务数据的关系属性数据与多种风险场景的匹配度的数值排序,确定出目标业务数据的所属的风险场景;
根据目标业务数据与所属的风险场景的匹配度,与预设的匹配度阈值之间的大小关系,确定所述目标业务数据是否存在风险。
8.根据权利要求7所述的方法,根据预设的风险场景知识库,确定目标业务数据的关系属性数据与多种风险场景的匹配度,包括:
根据预设的风险场景知识库,分别计算目标业务数据的关系属性数据与多种风险场景中各种风险场景所对应的关系属性数据之间的特征距离,作为目标业务数据的关系属性数据与多种风险场景的匹配度。
9.根据权利要求1所述的方法,所述预设的风险场景知识库按照以下方式建立:
获取多种风险场景中存在风险的业务数据作为样本数据;
获取与样本数据相关的关联数据;
分别对各种风险场景中的样本数据和关联数据进行多维度类型的聚类处理,以建立得到对应各种风险场景的关系属性数据。
10.根据权利要求1所述的方法,所述方法还包括:
间隔预设时间段,获取被召回的业务数据;
获取与被召回的业务数据相关的关联数据,和扩展数据;
对所述被召回的业务数据,以及被召回的业务数据的关联数据、扩展数据进行特征挖掘;
根据特征挖掘结果,建立更新的关系属性数据;
利用所述更新的关系属性数据,更新预设的风险场景知识库。
11.一种业务数据的处理装置,包括:
获取模块,用于获取目标业务数据,以及与目标业务数据相关的关联数据;
建立模块,用于根据所述目标业务数据、所述关联数据,建立针对目标业务数据的关系属性数据;
确定模块,用于根据预设的风险场景知识库,和目标业务数据的关系属性数据,确定所述目标业务数据是否存在风险,以及目标业务数据所属的风险场景,其中,所述预设的风险场景知识库包含有多种风险场景的关系属性数据。
12.根据权利要求11所述的装置,所述获取模块包括:
第一确定单元,用于确定目标业务数据的发起方、接收方,以及目标业务数据的数据环境;
采集单元,用于采集与所述发起方、接收方,和/或数据环境相关的特征数据,作为所述关联数据。
13.根据权利要求12所述的装置,所述采集单元具体用于采集发起方的通讯录、转账记录,和/或发起方的用户属性信息作为与所述发起方相关的特征数据;采集接收方的通讯录、转账记录,和/或接收方的用户属性信息作为与所述接收方相关的特征数据。
14.根据权利要求12所述的装置,所述采集单元具体还用于确定发起方发起目标业务数据时使用的第一介质设备,以及接收方接收目标业务数据时使用的第二介质设备;获取第一介质设备的使用记录、第二介质设备的使用记录;根据所述第一介质设备的使用记录、第二介质设备的使用记录,确定出所述目标业务数据的发起地址、发起目标业务数据的网络特征、目标业务数据的接收地址、接收目标业务数据的网络特征、第一介质设备的使用特征、第二介质设备的使用特征;将所述目标业务数据的发起地址、发起目标业务数据的网络特征、目标业务数据的接收地址、接收目标业务数据的网络特征、第一介质设备的使用特征、第二介质设备的使用特征中的一种或多种作为与数据环境相关的特征数据。
15.根据权利要求11所述的装置,所述建立模块包括:
第二确定单元,用于根据所述目标业务数据、所述关联数据,确定目标业务数据多个维度类型的关系特征;
第一建立单元,用于根据所述目标业务数据多个维度类型的关系特征,建立对应的多个关系元素组,作为目标业务数据的关系属性数据,其中,所述关系元素组通过所包含的源节点元素、终节点元素和边属性元素描述所对应的一个维度类型的关系特征。
16.根据权利要求15所述的装置,所述维度类型包括以下至少之一:交易维度、介质设备维度、行为维度、社交维度。
17.根据权利要求11所述的装置,所述确定模块包括:
第三确定单元,用于根据预设的风险场景知识库,确定目标业务数据的关系属性数据与多种风险场景的匹配度;
第四确定单元,用于根据目标业务数据的关系属性数据与多种风险场景的匹配度的数值排序,确定出目标业务数据的所属的风险场景;
第五确定单元,用于根据目标业务数据与所属的风险场景的匹配度,与预设的匹配度阈值之间的大小关系,确定所述目标业务数据是否存在风险。
18.根据权利要求17所述的装置,所述第三确定单元具体用于根据预设的风险场景知识库,分别计算目标业务数据的关系属性数据与多种风险场景中各种风险场景所对应的关系属性数据之间的特征距离,作为目标业务数据的关系属性数据与多种风险场景的匹配度。
19.根据权利要求11所述的装置,所述装置还包括预设的风险场景知识库的构建模块,包括:
第一获取单元,用于获取多种风险场景中存在风险的业务数据作为样本数据;
第二获取单元,用于获取与样本数据相关的关联数据;
第二建立单元,用于分别对各种风险场景中的样本数据和关联数据进行多维度类型的聚类处理,以建立得到对应各种风险场景的关系属性数据。
20.根据权利要求11所述的装置,所述装置还包括更新模块,包括:
第三获取单元,用于间隔预设时间段,获取被召回的业务数据;
第四获取单元,用于获取与被召回的业务数据相关的关联数据,和扩展数据;
挖掘单元,用于对所述被召回的业务数据,以及被召回的业务数据的关联数据、扩展数据进行特征挖掘;
第三建立单元,用于根据特征挖掘结果,建立更新的关系属性数据;
更新单元,用于利用所述更新的关系属性数据,更新预设的风险场景知识库。
21.一种服务器,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器执行所述指令时实现权利要求1至10中任一项所述方法的步骤。
22.一种计算机可读存储介质,其上存储有计算机指令,所述指令被执行时实现权利要求1至10中任一项所述方法的步骤。
CN202010147284.2A 2020-03-05 2020-03-05 业务数据的处理方法、装置和服务器 Pending CN111428971A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010147284.2A CN111428971A (zh) 2020-03-05 2020-03-05 业务数据的处理方法、装置和服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010147284.2A CN111428971A (zh) 2020-03-05 2020-03-05 业务数据的处理方法、装置和服务器

Publications (1)

Publication Number Publication Date
CN111428971A true CN111428971A (zh) 2020-07-17

Family

ID=71551491

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010147284.2A Pending CN111428971A (zh) 2020-03-05 2020-03-05 业务数据的处理方法、装置和服务器

Country Status (1)

Country Link
CN (1) CN111428971A (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104978618A (zh) * 2014-04-08 2015-10-14 汕头市海西信息科技有限公司 一种电子商务风险监控方法
CN106878236A (zh) * 2015-12-11 2017-06-20 阿里巴巴集团控股有限公司 一种用户请求处理方法和设备
CN107016473A (zh) * 2016-01-27 2017-08-04 阿里巴巴集团控股有限公司 一种风险控制方法和设备
CN109086317A (zh) * 2018-06-28 2018-12-25 招联消费金融有限公司 风险控制方法和相关装置
CN109767226A (zh) * 2018-12-20 2019-05-17 平安科技(深圳)有限公司 基于大数据的可疑交易统计视图生成方法和装置
CN110009192A (zh) * 2019-03-06 2019-07-12 阿里巴巴集团控股有限公司 基于用户关系的风险管控方法、***和装置
CN110222880A (zh) * 2019-05-20 2019-09-10 阿里巴巴集团控股有限公司 业务风险的确定方法、模型训练方法和数据处理方法
CN110390465A (zh) * 2019-06-18 2019-10-29 深圳壹账通智能科技有限公司 业务数据的风控分析处理方法、装置和计算机设备
CN110705851A (zh) * 2019-09-19 2020-01-17 腾讯科技(深圳)有限公司 交易风险控制方法、装置及电子设备

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104978618A (zh) * 2014-04-08 2015-10-14 汕头市海西信息科技有限公司 一种电子商务风险监控方法
CN106878236A (zh) * 2015-12-11 2017-06-20 阿里巴巴集团控股有限公司 一种用户请求处理方法和设备
CN107016473A (zh) * 2016-01-27 2017-08-04 阿里巴巴集团控股有限公司 一种风险控制方法和设备
CN109086317A (zh) * 2018-06-28 2018-12-25 招联消费金融有限公司 风险控制方法和相关装置
CN109767226A (zh) * 2018-12-20 2019-05-17 平安科技(深圳)有限公司 基于大数据的可疑交易统计视图生成方法和装置
CN110009192A (zh) * 2019-03-06 2019-07-12 阿里巴巴集团控股有限公司 基于用户关系的风险管控方法、***和装置
CN110222880A (zh) * 2019-05-20 2019-09-10 阿里巴巴集团控股有限公司 业务风险的确定方法、模型训练方法和数据处理方法
CN110390465A (zh) * 2019-06-18 2019-10-29 深圳壹账通智能科技有限公司 业务数据的风控分析处理方法、装置和计算机设备
CN110705851A (zh) * 2019-09-19 2020-01-17 腾讯科技(深圳)有限公司 交易风险控制方法、装置及电子设备

Similar Documents

Publication Publication Date Title
CN106384273B (zh) 恶意刷单检测***及方法
CN111401416B (zh) 异常网站的识别方法、装置和异常对抗行为的识别方法
CN110442712B (zh) 风险的确定方法、装置、服务器和文本审理***
US20110246426A1 (en) Method and apparatus for information recovery using snapshot database
CN109949154B (zh) 客户信息分类方法、装置、计算机设备和存储介质
CN109086317B (zh) 风险控制方法和相关装置
CN110516173B (zh) 一种非法网站识别方法、装置、设备及介质
CN110298662B (zh) 交易重复提交的自动化检测方法及装置
CN112132676B (zh) 联合训练目标模型的贡献度的确定方法、装置和终端设备
WO2019136414A1 (en) System, method, and computer program product for determining fraud rules
CN105721629A (zh) 用户标识匹配方法和装置
CN110197426B (zh) 一种信用评分模型的建立方法、装置及可读存储介质
CN112328802A (zh) 数据处理方法、装置和服务器
CN111949702A (zh) 异常交易数据的识别方法、装置及设备
CN112750030A (zh) 风险模式识别方法、装置、设备及计算机可读存储介质
CN112632409A (zh) 同一用户识别方法、装置、计算机设备和存储介质
CN111126071A (zh) 提问文本数据的确定方法、装置和客服群的数据处理方法
CN115563600A (zh) 数据审核方法和装置、电子设备及存储介质
CN112910953B (zh) 业务数据的推送方法、装置和服务器
EP3451611B1 (en) Method and apparatus for setting mobile device identifier
CN111027065B (zh) 一种勒索病毒识别方法、装置、电子设备及存储介质
CN115760390A (zh) 业务数据处理方法、装置和网点终端设备
CN111428971A (zh) 业务数据的处理方法、装置和服务器
CN110808978B (zh) 实名认证方法以及装置
CN111126503B (zh) 一种训练样本的生成方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200717