CN116228391A - 一种风险识别方法、装置、存储介质及电子设备 - Google Patents

一种风险识别方法、装置、存储介质及电子设备 Download PDF

Info

Publication number
CN116228391A
CN116228391A CN202211696378.0A CN202211696378A CN116228391A CN 116228391 A CN116228391 A CN 116228391A CN 202211696378 A CN202211696378 A CN 202211696378A CN 116228391 A CN116228391 A CN 116228391A
Authority
CN
China
Prior art keywords
user
relationship
risk
sample
relation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211696378.0A
Other languages
English (en)
Inventor
赵英龙
孙冠东
赵凤
乔占稳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN202211696378.0A priority Critical patent/CN116228391A/zh
Publication of CN116228391A publication Critical patent/CN116228391A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/40Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
    • G06Q20/401Transaction verification
    • G06Q20/4016Transaction verification involving fraud or risk level assessment in transaction processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2468Fuzzy queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Fuzzy Systems (AREA)
  • Computational Linguistics (AREA)
  • General Business, Economics & Management (AREA)
  • Probability & Statistics with Applications (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Automation & Control Theory (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Computer Security & Cryptography (AREA)
  • Animal Behavior & Ethology (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Control Or Security For Electrophotography (AREA)

Abstract

本说明书公开了一种风险识别方法、装置、存储介质及电子设备,其中,方法包括:获取用户关系图谱数据并确定至少一个黑种子用户,从用户关系图谱数据中确定每个黑种子用户关联的至少一个参考用户,参考用户与黑种子用户存在至少一度参考用户关系边,基于参考用户关系边对至少一个参考用户进行至少一度风险传导预测,以确定参考用户是否为风险行为用户。

Description

一种风险识别方法、装置、存储介质及电子设备
技术领域
本说明书涉及计算机技术领域,尤其涉及一种风险识别方法、装置、存储介质及电子设备。
背景技术
随着计算机技术的快速发展,涉及到风险控制的场景也越来越多,风险控制是指采取各种措施和方法消灭或减少风险行为发生的可能性,或减少风险行为发生时造成的损失。在金融事务、线上购物事务等日常事务中,涉及到很多交易支付行为、线上信贷行为、数据担保行为等,为了降低日常事务中的用户风险,并提前做出风险控制以及风险应对,常会涉及到对用户进行风险识别。
发明内容
本说明书提供了一种风险识别方法、装置、存储介质及电子设备,所述技术方案如下:
第一方面,本说明书提供了一种风险识别方法,所述方法包括:
获取用户关系图谱数据并确定至少一个黑种子用户,所述用户关系图谱数据中包括多个用户以及连接所述用户的用户关系边构成;
从所述用户关系图谱数据中确定每个所述黑种子用户关联的至少一个参考用户,所述参考用户与所述黑种子用户存在至少一度参考用户关系边,
基于所述参考用户关系边采用风险传导模型对所述参考用户进行至少一度风险传导预测,以确定所述参考用户是否为风险行为用户。
第二方面,本说明书提供了一种风险识别装置,所述装置包括:
用户获取模块,用于获取用户关系图谱数据并确定至少一个黑种子用户,所述用户关系图谱数据中包括多个用户以及连接两两所述用户的用户关系边构成;
数据确定模块,用于从所述用户关系图谱数据中确定每个所述黑种子用户关联的至少一个参考用户,所述参考用户与所述黑种子用户存在至少一度参考用户关系边,
风险检测模块,用于基于所述参考用户关系边采用风险传导模型对所述参考用户进行至少一度风险传导预测,以确定所述参考用户是否为风险行为用户。
第三方面,本说明书提供一种计算机存储介质,所述计算机存储介质存储有多条指令,所述指令适于由处理器加载并执行上述的方法步骤。
第四方面,本说明书提供一种电子设备,可包括:处理器和存储器;其中,所述存储器存储有计算机程序,所述计算机程序适于由所述处理器加载并执行上述的方法步骤。
本说明书一些实施例提供的技术方案带来的有益效果至少包括:
在本说明书一个或多个实施例中,电子设备可通过获取用户关系图谱数据并确定至少一个黑种子用户,从用户关系图谱数据中确定每个黑种子用户关联的至少一个参考用户,参考用户与黑种子用户存在至少一度参考用户关系边,基于参考用户关系边对至少一个参考用户进行至少一度风险传导预测就可以确定参考用户是否为风险行为用户。可避免过于依赖用户过往历史行为特征或数据,可以适配新用户“冷启动”的事务应用场景,通过黑种子用户采用用户间的参考关系边来进行风险识别,可以预测识别更多风险行为用户,提升了识别准确率。
附图说明
为了更清楚地说明本说明书或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本说明书提供的一种风险识别***的场景示意图;
图2是本说明书提供的一种风险识别方法的流程示意图;
图3是本说明书提供的一种用户图谱数据的示意图;
图4是本说明书提供的一种用户关系图谱确定过程的流程示意图;
图5是本说明书提供的一种参考用户关系边确定过程的流程示意图;
图6是本说明书提供的一种关系传导挖掘的示意图;
图7是本说明书提供的一种风险识别方法的流程示意图;
图8是本说明书提供的一种风险识别的场景示意图;
图9是本说明书提供的一种风险传导模型训练过程的流程示意图;
图10是本说明书提供的一种确定样本的示意图;
图11是本说明书提供的一种风险识别装置的结构示意图;
图12是本说明书提供的一种数据确定模块的结构示意图;
图13是本说明书提供的一种风险检测模块的结构示意图;
图14是本说明书提供的一种电子设备的结构示意图;
图15是本说明书提供的操作***和用户空间的结构示意图;
图16是图15中安卓操作***的架构图;
图17是图15中IOS操作***的架构图。
具体实施方式
下面将结合本说明书中的附图,对本说明书中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本说明书保护的范围。
在本说明书的描述中,需要理解的是,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。在本说明书的描述中,需要说明的是,除非另有明确的规定和限定,“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、***、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本说明书中的具体含义。此外,在本说明书的描述中,除非另有说明,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
在相关技术中,涉及金融事务、线上购物事务等日常事务中,针对一个用户预测未来是否发生诸如金融事务下的套现行为、欺诈行为等风险行为,大多是基于用户的静态特征(或称基础属性特征)和行为特征,再通过专家经验定义的套现标签来进行二分类模型的学习。然而实际应用中,存在以下情形中的至少其一:1、依赖专家经验很难定义全部的风险行为模式,2、风险行为用户的二分类学习依赖历史行为数据,对于一些未发生风险行为的用户,其历史行为数据较少,难以准确预测,3、由于部分标签样本数量较少会导致过拟合、识别不准确等情形;基于此,可见相关技术中的风险识别方法存在较大的局限性。
下面结合具体的实施例对本说明书进行详细说明。
请参见图1,为本说明书提供的一种风险识别***的场景示意图。如图1所示,所述风险识别***至少可以包括客户端集群和服务平台100。
所述客户端集群可以包括至少一个客户端,如图1所示,具体包括用户1对应的客户端1、用户2对应的客户端2、…、用户n对应的客户端n,n为大于0的整数。
客户端集群中的各客户端可以是具备通信功能的电子设备,该电子设备包括但不限于:可穿戴设备、手持设备、个人电脑、平板电脑、车载设备、智能手机、计算设备或连接到无线调制解调器的其它处理设备等。在不同的网络中电子设备可以叫做不同的名称,例如:用户设备、接入终端、用户单元、用户站、移动站、移动台、远方站、远程终端、移动设备、用户终端、终端、无线通信设备、用户代理或用户装置、蜂窝电话、无绳电话、个人数字处理(personal digital assistant,PDA)、5G网络或未来演进网络中的电子设备等。
所述服务平台100可以是单独的服务器设备,例如:机架式、刀片、塔式、或者机柜式的服务器设备,或采用工作站、大型计算机等具备较强计算能力硬件设备;也可以是采用多个服务器组成的服务器集群,所述服务集群中的各服务器可以是以对称方式组成的,其中每台服务器在事务链路中功能等价、地位等价,各服务器均可单独对外提供服务,所述单独提供服务可以理解为无需另外的服务器的辅助。
在本说明书的一个或多个实施例中,服务平台100与客户端集群中的至少一个客户端可建立通信连接,基于该通信连接完成风险识别过程中数据的交互,如,服务平台100可从客户端上获取用户的用户事实数据,进而基于多个用户的用户事实数据来构建用户关系图谱数据;又如服务平台100可基于本说明书的风险识别方法采用风险传导模型实现对参考用户的风险识别;又如,服务平台100可将风险传导模型部署至至少一个客户端,由客户端执行本说明书一个或多个实施例的风险识别方法等等;
需要说明的是,服务平台100与客户端集群中的至少一个客户端通过网络建立通信连接进行交互通信,其中,网络可以是无线网络,也可以是有线网络,无线网络包括但不限于蜂窝网络、无线局域网、红外网络或蓝牙网络,有线网络包括但不限于以太网、通用串行总线(universal serial bus,USB)或控制器局域网络。在说明书一个或多个实施例中,使用包括超文本标记语言(Hyper Text Mark-up Language,HTML)、可扩展标记语言(Extensible Markup Language,XML)等的技术和/或格式来代表通过网络交换的数据(如目标压缩包)。此外还可以使用诸如安全套接字层(Secure Socket Layer,SSL)、传输层安全(Transport Layer Security,TLS)、虚拟专用网络(Virtual Private Network,VPN)、网际协议安全(Internet Protocol Security,IPsec)等常规加密技术来加密所有或者一些链路。在另一些实施例中,还可以使用定制和/或专用数据通信技术取代或者补充上述数据通信技术。
本说明书所提供的风险识别***实施例与一个或多个实施例中的所述风险识别方法属于同一构思,在说明书一个或多个实施例涉及的所述风险识别方法对应的执行主体可以是上述服务平台100;在说明书一个或多个实施例涉及的所述风险识别方法对应的执行主体也可以是客户端所对应的电子设备,具体基于实际应用环境确定。风险识别***实施例其体现实现过程可详见下述的方法实施例,这里不再赘述。
基于图1所示的场景示意图,下面对本说明书一个或多个实施例提供的风险识别方法进行详细介绍。
请参见图2,为本说明书一个或多个实施例提供了一种风险识别方法的流程示意图,该方法可依赖于计算机程序实现,可运行于基于冯诺依曼体系的风险识别装置上。该计算机程序可集成在应用中,也可作为独立的工具类应用运行。所述风险识别装置可以为服务平台。
具体的,该风险识别方法包括:
S102:获取用户关系图谱数据并确定至少一个黑种子用户,所述用户关系图谱数据中包括多个用户以及连接所述用户的用户关系边构成;
示意性的,如图3所示,图3示出了一种用户图谱数据的示意图,用户关系图谱数据由多个用户以及连接所述用户的用户关系边构成,具体而言,每个用户在用户关系图谱中可对应一个用户节点,如图3中所示出的用户节点A、用户节点B、用户节点D、用户节点E...,用户节点之间通过用户关系边连接,用户关系边表示两两用户之间存在一定关联关系而形成的连接边,该连接边也即称为用户关系边。
所述用户关系边用于表征两个用户之间一度或多度的关系数据特征;
用户关系边对应的关系数据特征源于用户(原始)事实数据,用户(原始)事实数据与单用户维度的用户的静态特征(或称基础属性特征)和行为特征不同,用户(原始)事实数据可以用于表征两两用户之间的关系特征;
在一些实施例中,用户关系边对应的关系数据特征包括但不限于交易数据维度特征、转账数据维度特征、设备数据维度特征、网络连接数据维度特征(如wifi网络连接维度)、好友关系数据维度特征、联系方式数据维度特征、强弱关系数据维度特征等其中的一种或多种的拟合;
示意性的,每一关系数据特征维度下对应一度或多度关系数据,例如转账数据维度特征,关系数据特征的一度关系包括转账金额特征、笔数特征...,关系数据特征的二度关系包括共同转账接收人数量、共同转账用户....等。
需要说明的是,每一关系数据特征维度下对应一度或多度关系数据基于实际应用情况设置,此处关系数据特征维度下对应一度或多度关系数据的类别不做限定。
所述黑种子用户为用户关系图谱数据已经确定属于黑种子类别标签的用户,在用户关系图谱数据中除黑种子用户之外其他的用户没有明确的类别标签。所述黑种子用户可以理解为已经确认存在或发送目标风险行为的用户,确定存在目标风险行为的用户可理解为黑种子用户。
可选的,多个用户中可将已知风险行为用户(如风险行为商户)可作为黑种子用户,在实际应用中,黑种子用户的数量通常是少量的,可制定黑种子用户判定规则,将高得分的商户作为黑种子。黑种子用户判定规则所使用的规则可包括但不限于例如异常的资金流动、异常的商户宣传、异常的产品、异常的用户评价等等,示意性的,风险行为用户可以是一些数据转移场景下所定义的套现数据转移行为用户(在实际应用中又称之为套现交易行为用户)、欺诈行为用户等等。
在本说明书一个或多个实施例中,电子设备可以预先设置的关系图谱配置规则,基于关系图谱配置规则实时或周期性生成用户关系图谱数据,或在历史用户图谱数据基础上进行数据更新(如更新用户节点、更新用户关系边)以得到用户关系图谱数据,并对用户关系图谱数据进行保存,以便于在实际事务应用阶段,可获取到已保存的用户关系图谱数据。
可选的,关系图谱配置规则可结合实际应用下的事务场景按需设置所需纳入参考的用户(原始)事实数据的数据类型,然后基于用户(原始)事实数据更新或生成连接两两用户之间的用户关系边。
S104:从所述用户关系图谱数据中确定每个所述黑种子用户关联的至少一个参考用户,所述参考用户与所述黑种子用户存在至少一度参考用户关系边,
所述参考用户可以理解为在用户关系图片数据中与黑种子用户存在一度或多度参考用户关系边的用户。
示意性的,参考用户关系边可用关系传导度衡量与黑种子用户的关联用户关系;
例如黑种子用户与关联用户存在一度参考用户关系边,此时黑种子用户与关联用户仅通过参考用户关系边连接中间不涉及到其他关联用户,参考用户为黑种子用户一度传导的关联用户;
例如黑种子用户与关联用户存在i度(i为大于1的整数)参考用户关系边,此时黑种子用户与关联用户通过“i”个参考用户关系边连接,黑种子用户与关联用户中间涉及到“i-1”个其他关联用户,参考用户为黑种子用户“i”度传导的关联用户;
可以理解的,同一关系传导链上黑种子用户存在通过一度/多度参考用户关系边连接的参考用户,该关系传导链以所述黑种子用户为参考节点,不在关系传导链上的用户不为黑种子用户的参考用户。
可以理解的,参考用户是否为风险行为用户当前是未知的,参考用户通常未发生风险行为,采用在本说明书一个或多个实施例中的所述风险识别方法可对参考用户进行风险行为用户进行预测。
在本说明书一个或多个实施例中,可以向从所述用户关系图谱数据中确定每个所述黑种子用户对应的黑种子用户节点,然后以黑种子用户节点为参考沿与黑种子用户节点的关系边进行路径挖掘,路径挖掘可以确定与黑种子用户节点关联的一个乃至多个参考用户,而参考用户与黑种子用户之间存在直接相连接的一度参考用户关系边或存在通过一个或多个其他用户节点相连接的多度参考用户关系边。基于此,按照前述方式在黑种子用户为多个的情况下,即可确定与黑种子用户每个所述黑种子用户关联的至少一个参考用户,以及确定参考用户与所述黑种子用户存在的至少一度参考用户关系边。
S106:基于所述参考用户关系边对所述至少一个参考用户进行至少一度风险传导预测,以确定所述参考用户是否为风险行为用户。
所述风险传导预测可以理解为基于参考用户关系边进行风险传导预测处理。所述至少一度风险传导预测与参考用户关系边的风险传导度数相关;
示意性的,若参考用户关系边为某黑种子用户的一度风险传导关系边,则对基于参考用户关系边对其所连接的参考用户进行一度风险传导预测,该参考用户可称之为某黑种子用户关联的一度风险传导用户;
示意性的,若参考用户关系边为某黑种子用户的“i”(i为大于1的整数)度风险传导关系边,则对基于参考用户关系边对其所连接的参考用户进行i(i为大于1的整数)度风险传导预测;
在一种可行的实施方式中,可以采用预先设置的量化处理方式基于所述参考用户关系边对参考用户进行风险传导量化处理,得到量化评分,基于量化评分确定参考用户是否为风险行为用户。
可选的,量化处理方式可以是采用预先训练好的风险传导模型对参考用户关系边进行风险传导量化处理,输出量化评分,基于量化评分确定参考用户是否为风险行为用户。
所述风险传导模型为预先创建且训练好的机器学习模型,所述机器学习模型可以是基于神经网络、决策树网络、分类器网络、贝叶斯网络、支持向量机网络等网络模型中的一种或多种机器学习模型的拟合得到。
可选的,参考用户关系边在实际应用阶段通常以参考用户关系特征的形式表征,可以是以参考用户关系特征向量、参考用户关系矩阵等特征表示形式存在,也即预先提取出相应特征维度的参考用户关系特征向量、参考用户关系矩阵。
可以理解的,在本说明书一个或多个实施例中,不采用基于各个用户节点的用户行为特征来进行二分类实现风险评测,诸如套现行为等风险行为用户的二分类学习依赖用户自身的历史行为和数据等特征,对于一些未发生诸如套现交易行为等风险行为的新商户、买家等用户而言,其历史行为数据较少,在风险行为为发生之前难以进行准确的预测,基于此,通过改良风险识别方式基于黑种子用户,采用用户与用户之间的参考关系边来实现风险识别,可以预测和识别更多风险行为用户,识别准确率更高,
在本说明书一个或多个实施例中,电子设备可通过获取用户关系图谱数据并确定至少一个黑种子用户,从用户关系图谱数据中确定每个黑种子用户关联的至少一个参考用户,参考用户与黑种子用户存在至少一度参考用户关系边,基于参考用户关系边对至少一个参考用户进行至少一度风险传导预测就可以确定参考用户是否为风险行为用户。可避免过于依赖用户过往历史行为特征或数据,可以适配新用户“冷启动”的事务应用场景,通过黑种子用户采用用户间的参考关系边来进行风险识别,可以预测识别更多风险行为用户,提升了识别准确率。
示例性的,在本说明书一个或多个实施例中,图4涉及一种示例性的用户关系图谱确定过程的流程示意图。可选的,基于上述一个或多个实施例,上述采用所述获取用户关系图谱数据之前,还可以包括以下方案:
S1002:根据多个用户的用户事实数据,确定两两所述用户之间的用户关系向量;
S1004:基于所述用户关系向量确定两两所述用户之间的用户关系边,基于所述用户关系边和所述多个用户确定用户关系图谱数据。
在本说明书一个或多个实施例中,通过获取多个用户的用户事实数据,基于多个用户的用户事实数据挖掘两两用户之间的多度关系进而确定用户关系边,从而构造用户之间的(多度)关系图片数据。
具体的,获取多个用户的用户事实数据,多个用户的用户事实数据可以源于实际事务场景(如消金事务场景、线上购物事务场景等)下的真实用户数据,根据多个用户的用户事实数据,进行用户之间关系数据特征的抽取,确定两两用户之间的多度关系数据。
在一些实施例中,关系数据特征包括但不限于交易数据维度特征、转账数据维度特征、设备数据维度特征、网络连接数据维度特征(如wifi网络连接维度)、好友关系数据维度特征、联系方式数据维度特征、强弱关系数据维度特征等其中的一种或多种的拟合;
示意性的,每一关系数据特征维度下对应一度或多度关系数据,例如转账数据维度特征,关系数据特征的一度关系包括转账金额特征、笔数特征...,关系数据特征的二度关系包括共同转账接收人数量、共同转账用户....等。
需要说明的是,每一关系数据特征维度下对应一度或多度关系数据基于实际应用情况设置,此处关系数据特征维度下对应一度或多度关系数据的类别不做限定。
在一种可行的实施方式中,所述基于所述用户关系向量确定两两所述用户之间的用户关系边,基于所述用户关系边和所述多个用户确定用户关系图谱数据,可以是:基于所述用户关系向量确定每个所述用户之间的多度关系数据,基于所述多度关系数据确定两两所述用户之间的用户关系边;
通过每个所述用户关系边对所述多个用户进行连接处理,得到用户关系图谱数据。
示意性的,例如可以基于交易数据维度特征、转账数据维度特征、设备数据维度特征、网络连接数据维度特征(如wifi网络连接维度)、好友关系数据维度特征、联系方式数据维度特征、强弱关系数据维度中任意7个维度的用户事实数据可以构建两个用户之间的用户关系向量,用户关系向量可以记为如下形式,如下:
用户关系向量可记为R=[a1,a2,a3,…,am,b1,b2,b3,…,bn,…,gt],其中a,b,…,g代表该关联关系所属的维度,m,n,…,t表示该维度下关系的个数。
这些用户关系向量的集合可以组成所有商户之间的多度关系数据,基于多度关系数据可以构建用户关系边,进而可以共同构成用户户的关系图谱数据,多度关系数据可表示为[R1,R2,R3,…,Rn]T(n表示用户构成的关系边总个数)。通过多度关系数据和多个用户对应的用户节点就可以构建用户关系图谱数据,用户关系图谱数据不仅可以描述用户与用户之间的直接关系,如交易或好友关系,同时可以描述用户与用户之间的间接关系,如共同好友个数、和公共交易对象的交易金额等多度关系,前述形式的用户关系图谱数据将极大的有利于挖掘和描述用户与用户之间相对隐匿的关系,以便于后续进行风险识别。
示例性的,在本说明书一个或多个实施例中,图5示出了实例性的参考用户关系边确定过程的流程示意图。可选的,基于上述一个或多个实施例,上述所述从所述用户关系图谱数据中确定每个所述黑种子用户关联的至少一个参考用户,所述参考用户与所述黑种子用户存在至少一度参考用户关系边,包括以下方案:
S1012:以每个所述黑种子用户为参考节点,确定所述黑种子用户对应的至少一条关系传导链;
S1014:确定所述关系传导链上的至少一个参考用户,所述黑种子用户与所述参考用户之间通过至少一度参考用户关系边连接。
可以理解的关系传导链是由黑种子用户节点、若干参考用户节点以及连接两两节点的参考用户关系边构成的链式无环特征结构,关系传导链的基准节点为黑种子用户对应的参考节点。
在本说明书一个或多个实施例中,可以对用户关系图谱数据以每个所述黑种子用户为参考节点,进行传导路径链拆解,可得到若干黑种子关系传导路径分别对应的关系传导链,也就是说可以得到若干关系传导链,可以理解的,一条黑种子关系传导路径对应的若干特征路径节点即为关系传导节点,两两关系传导节点连接的关系边也即参考用户关系边。
可选的,关系传导链可以是一种有向无环特征结构,也即从黑种子用户为参考节点沿参考用户关系边指向下一参考用户节点。
示意性的,如图6所示,图6示出了一种关系传导挖掘的示意图,图5中用户图谱数据所包含的黑种子用户对应的参考节点至少为用户节点A用户图谱数据经传导路径链拆解后,得到了若干关系传导链,例如,由黑种子用户对应的用户节点A-用户节点B-用户节点E-用户节点Y构成的关系传导链、由黑种子用户对应的用户节点A-用户节点C-用户节点D-用户节点Y构成的关系传导链、由黑种子用户对应的用户节点A-用户节点C-用户节点D-用户节点E-用户节点Y构成的关系传导链...。
可以理解的,通过上述方式可从用户图谱数据中深度挖掘出包含隐含用户关系的关系传导链,可有效抵抗反风险识别机制,以便于后续风险识别的准确性。
请参见图7,图7是本说明书一个或多个实施例提出的一种风险识别方法的另一种实施例的流程示意图。具体的:
S202:获取用户关系图谱数据并确定至少一个黑种子用户,所述用户关系图谱数据中包括多个用户以及连接所述用户的用户关系边构成;
S204:从所述用户关系图谱数据中确定每个所述黑种子用户关联的至少一个参考用户,所述参考用户与所述黑种子用户存在至少一度参考用户关系边;
具体可参考本说明书一个或多个实施例其他步骤的释义,此处不再赘述。
S206:基于所述参考用户关系边采用风险传导模型对所述至少一个参考用户进行至少一度风险传导预测,确定所述参考用户关系边的关系边传导类型;
在本说明书的一个或多个实施例中,所述风险传导模型可以是一种基于机器学习网络的风险传导模型;示意性的,例如风险传导模型可以是由许多节点中各节点的简单非线性模拟处理要素密集互连配置而成的,是一种模仿了生物神经元的***模型。风险传导模型通过使至少一个节点的输入与每一个节点的输出连接形成,类似于真实神经元的突触连接。每个神经元表达了一种特定的输出函数,即激励函数,每两个神经元之间的连接都包含一个连接强度,即作用于通过该连接的信号的加权值。
可选的,所述风险传导模型可以是基于卷积神经网络(Convolutional NeuralNetwork,CNN)模型,深度神经网络(Deep Neural Network,DNN)模型、循环神经网络(Recurrent Neural Networks,RNN)、模型、嵌入(embedding)模型、梯度提升决策树(Gradient Boosting Decision Tree,GBDT)模型、逻辑回归(Logistic Regression,LR)模型等机器学习模型中的一种或多种的拟合实现的。
示意性的,风险传导模型以参考用户关系边作为模型输入,通过风险传导模型基于参考用户关系边进行风险传导量化处理,输出风险传导分(也可称之为量化评分)。
在一种可行的实施方式中,所述基于所述参考用户关系边采用风险传导模型对所述至少一个参考用户进行至少一度风险传导预测,以确定所述参考用户关系边的关系边传导类型,可以是:
电子设备将各所述参考用户关系边输入至风险传导模型,分别输出针对所述至少一个参考用户关系边的风险传导分;
电子设备可以确定所述参考用户关系边对应的风险传导分阈值,基于所述风险传导分阈值和所述风险传导分确定所述参考用户关系边的关系边传导类型。
可以理解的,基于黑种子用户进行关系传导预测,参考用户关系对应不同的风险传导程度,例如黑种子用户与关联用户存在i度(i为大于1的整数)参考用户关系边,此时黑种子用户与关联用户通过“i”个参考用户关系边连接,黑种子用户与关联用户中间涉及到“i-1”个其他关联用户,参考用户为黑种子用户“i”度传导的关联用户;
基于此,可针对用户关系边设置不同关系传导度对应的参考阈值,基于不同参考阈值来衡量参考用户关系边的关系边传导类型,通常关系传导度越高,参考用户关系所隐含的潜在风险越不容易被模型所识别到,因此需要基于相应关系传导度对用户关系边来设置参考阈值。
可选的,可以建立针对用户关系边对应至少一个关系传导度与其对应的参考阈值的阈值映射关系,实际应用阶段,通过确定参考用户关系边的风险传导度,然后基于阈值映射关系获取风险传导度对的风险传导分阈值。
进一步的,所述确定所述参考用户关系边对应的风险传导分阈值,可以是:电子设备获取所述参考用户与所述黑种子用户之间的用户关系边数量,基于所述用户关系边数量确定风险关系传导度,获取所述风险关系传导度对应的风险传导分阈值。
用户关系边数量可以理解为黑种子用户与参考用户之间通过多少个用户关系边相连接,用户关系边数量的值对应关系传导度的值。
进一步的,确定风险传导分和风险传导分阈值之后,比较风险传导分和风险传导分阈值若所述风险传导分大于所述风险传导分阈值,则确定所述参考用户关系边为有风险传导性类型;若所述风险传导分小于或等于所述风险传导分阈值,则确定所述参考用户关系边为无风险传导性类型。
示意性的,如图8所示,图8是本说明书涉及的一种风险识别的场景示意图,采用风险传导模型对待预测的一度及多度参考用户关系边关系进行风险传导预测处理,得到风险传导分,如下:
a)一度传导预测
风险传导模型对应的风险传导分超过设定阈值的边关系即为有风险传导性类型,有风险传导性类型的参考用户关系边连接的右节点用户可确定为风险行为用户。如中间数据转移套现模式中,黑种子s1和商户s2所对应的参考用户关系边指示有共同数据转移转接收用户5个、和共同数据接收用户的转账总数据量为10万、共用Wi-Fi数量4个,采用风险传导模型得到对应的风险传导分0.9大于设定阈值,则商户s2同样为中间方控制的风险行为用户。此外,用户的风险程度和风险传导分得分呈正相关的趋势。
b)多度传导预测
经之前至少一度传导预测可以得到异常行为用户集合D,异常行为用户集合D可以包括前述风险行为用户。
对于之前至少一度传导预测得到的异常行为用户集合D,在当前第i度传导预测时:进一步预测异常行为用户集合D采用风险传导模型基于用户与用户的参考用户关系边预测风险传导分,同时获取第i度传导预测时对应的风险传导分阈值,风险传导分超过风险传导分阈值(通常)的参考用户关系边确定为有风险传导性类型,有风险传导性类型的参考用户关系边所连接的右端用户可预测为风险行为商户。
在本说明书一个或多个实施例中,通过学习黑种子用户之间的边关系得到风险传导模型,采用风险传导模型将黑种子和其他用户之间的边关系划分为具有风险传导性和无风险传导性的两类,进而从特征关系维度量化了具有风险传导的边关系和特征,也即量化释义了何种类型的边关系和特征具有高风险传导的可能。
S208:基于所述关系边传导类型确定所述参考用户关系边对应的参考用户是否为风险行为用户。
示意性的,若所述关系边传导类型为有风险传导性类型,则确定所述参考用户关系边连接的参考用户为风险行为用户;
示意性的,若所述关系边传导类型为无风险传导性类型,则确定所述参考用户关系边连接的参考用户为正常行为用户。
在本说明书一个或多个实施例中,电子设备可通过获取用户关系图谱数据并确定至少一个黑种子用户,从用户关系图谱数据中确定每个黑种子用户关联的至少一个参考用户,参考用户与黑种子用户存在至少一度参考用户关系边,基于参考用户关系边对至少一个参考用户进行至少一度风险传导预测就可以确定参考用户是否为风险行为用户。可避免过于依赖用户过往历史行为特征或数据,可以适配新用户“冷启动”的事务应用场景,通过黑种子用户采用用户间的参考关系边来进行风险识别,可以预测识别更多风险行为用户,提升了识别准确率。
示例性的,在本说明书一个或多个实施例中,图9示出了实例性的风险传导模型训练过程的流程示意图。可选的,基于上述一个或多个实施例,上述所述风险识别方法,还包括以下方案:
S2002:获取用户关系图谱样本数据并确定至少一个黑种子样本用户,所述用户关系图谱样本数据中包括多个样本用户以及连接两两所述样本用户的样本用户关系边构成;
所述用户关系图谱样本数据可以理解为模型训练阶段所使用的用户关系图谱样本。
所述用户关系图谱样本数据与前述用户关系图谱数据的图谱特征结构相似。
所述样本用户关系边为模型训练阶段所用于表征两个样本用户之间一度或多度的关系数据特征;
在一些实施例中,基于实际事务场景可先进行黑种子用户的挖掘和定义,例如在套现风险事务场景为例,黑种子用户定义为所关注的事务场景中处于高风险段的头部用户。对应套现事务场景中为某种类型的套现行为中(如中介参与的套现)数据套现率较高、套现交易对应买家逾期比例高的商户,也即黑商户,该黑商户可作为黑种子用户。
S2004:基于所述用户关系图谱样本数据和所述黑种子样本用户从所述样本用户关系边中确定至少一类样本关系边;
所述黑种子样本用户是模型训练阶段所涉及到的黑种子用户。
进一步的,所述基于所述用户关系图谱样本数据和所述黑种子样本用户从所述样本用户关系边中确定至少一类样本关系边,可以是:
在所述用户关系图谱样本数据中,获取两个所述黑种子样本用户之间对应的第一样本关系边,将所述第一样本关系边作为正样本关系边;
在所述用户关系图谱样本数据中,获取所述黑种子样本用户与非黑种子样本用户之间的第二样本关系边,将所述第二样本关系边作为负样本关系边;
将所有所述样本用户关系边中除所述第一样本关系边和所述第二样本关系表之外的第三样本关系边,将所述第三样本关系边作为待预测样本数据。
示意性的,如图10所示,图10是一种确定样本的示意图,在图10中,黑种子样本用户与黑种子样本用户之间的边关系也即第一样本关系边,第一样本关系边定义为正样本关系边,正样本关系边即表征具有风险传导的关系(黑种子-黑种子);
示意性的,黑种子样本用户与非黑种子样本用户之间的边关系也即第二样本关系边,所述非黑种子样本用户可以是白种子样本用户,白种子样本用户可以基于实际事务场景中的用户行为进行定义,例如在套现交易事务场景中,白种子样本用户可以是非黑种子样本用户具有某数据借款交易行为但无套现交易行为的样本用户,黑种子用户与白种子样本用户之间的边关系也即第二样本关系边定义为负样本关系边;
示意性的,将其他类型的边关系为待预测样本(黑种子-待预测商户),也即将所有所述样本用户关系边中除所述第一样本关系边和所述第二样本关系表之外的第三样本关系边,将所述第三样本关系边作为待预测样本数据;
例如,黑种子用户与待预测用户之间的边关系可定义为一度传导样本关系边,又例如,待预测用户与待预测用户之间的边关系可定义为多度传导样本关系边。一度传导样本关系边和多度传导样本关系边可视作待预测样本数据。
可以理解的,通过前述方式,考虑到事务运营初始阶段直接基于用户维度定义黑种子样本实际样本数量较少,在模型训练时不适合作为一类样本标签,采用本说明书一个或多个实施例的风险识别方法,将针对用户二分类环节转换为了关注用户与用户之间的关系边类型,以及黑种子的边关系的构造可利用介质使用痕迹、社交等关系特征类型数据,对于未发生风险行为用户可以有较好的风险预测效果;以及,构建黑种子之间的边关系使得正样本数量迅速膨胀,即N个黑种子最大边关系数量为N*N个,这将大幅解决模型训练阶段模型监督信号不足的情形,可以使得模型得到更好的训练效果。
S2006:采用各类所述样本关系边对初始风险传导模型进行模型训练,得到训练后的风险传导模型。
示意性的,将各类所述样本关系边输入至初始风险传导模型进行训练,初始风险传导模型可以提取样本关系边的关系特征,并对这些关系特征进行检测识别,有效识别到风险。在训练过程中并结合样本关系边的样本标签对初始风险传导模型进行模型误差调整,直至满足模型训练条件完成模型训练,在训练完成之后,可以得到训练之后的风险传导模型,该风险传导模型具有风险识别过程中对关系传导特征抽取、关系传导风险知识概括、风险传导识别、特征学习记忆的能力,通常模型学习到的信息或知识储存在每个单元节点之间的连接矩阵上。
示意性的,样本关系边的样本标签可以理解为正样本关系边的正样本标签和负样本关系边的负样本标签;
在本说明书一个或多个实施例中,可对风险传导模型进行优化整合处理,处理后的风险传导模型的输入可以是用户关系图谱数据且标注了黑种子用户,基于风险传导模型可以对输入的用户关系图谱数据执行所述“从用户关系图谱数据中确定每个黑种子用户关联的至少一个参考用户和参考用户与黑种子用户存在的至少一度参考用户关系边,基于参考用户关系边采用风险传导模型对参考用户进行至少一度风险传导预测,以确定参考用户是否为风险行为用户”的步骤,从而输出风险行为用户。
可以理解的,采用本说明书一个或多个实施例的风险识别方法,从黑种子出发,通过学习黑种子之间的边关系得到了风险传导模型,通过风险传导模型实行将黑种子和其他用户之间的边关系划分为具有风险传导性和无风险传导性的两类,进而从数据层面量化了何种类型的边关系和特征具有风险传导的可能。
在一些实施例中,通过有监督学习得到的风险传导模型可以对输入数据数据进行快速传导得到具有类似风险的用户,从而避免了传统方法依赖用户过往历史行为特征的方法,可以解决很多新用户“冷启动”的现象,在用户发生风险行为之前预测并识别到,提高风险预警能力。
下面将结合图11,对本说明书提供的风险识别装置进行详细介绍。需要说明的是,图11所示的风险识别装置,用于执行本说明书图1~图10所示实施例的方法,为了便于说明,仅示出了与本说明书相关的部分,具体技术细节未揭示的,请参照本说明书图1~图10所示的实施例。
请参见图11,其示出本说明书的风险识别装置的结构示意图。该风险识别装置1可以通过软件、硬件或者两者的结合实现成为用户终端的全部或一部分。根据一些实施例,该风险识别装置1包括风险识别模块11、风险识别模块12和风险识别模块13,具体用于:
用户获取模块11,用于获取用户关系图谱数据并确定至少一个黑种子用户,所述用户关系图谱数据中包括多个用户以及连接两两所述用户的用户关系边构成;
数据确定模块12,用于从所述用户关系图谱数据中确定每个所述黑种子用户关联的至少一个参考用户,所述参考用户与所述黑种子用户存在至少一度参考用户关系边;
风险检测模块13,用于基于所述参考用户关系边采用风险传导模型对所述参考用户进行至少一度风险传导预测,以确定所述参考用户是否为风险行为用户。
可选的,所述装置1,还用于:
根据多个用户的用户事实数据,确定两两所述用户之间的用户关系向量;
基于所述用户关系向量确定两两所述用户之间的用户关系边,基于所述用户关系边和所述多个用户确定用户关系图谱数据。
可选的,所述装置1,还用于:
基于所述用户关系向量确定每个所述用户之间的多度关系数据,基于所述多度关系数据确定两两所述用户之间的用户关系边;
通过每个所述用户关系边对所述多个用户进行连接处理,得到用户关系图谱数据。
可选的,如图12所示,所述数据确定模块12,包括:
传导确定单元121,用于以每个所述黑种子用户为参考节点,确定所述黑种子用户对应的至少一条关系传导链;
用户确定单元122,用于确定所述关系传导链上的至少一个参考用户,所述黑种子用户与所述参考用户之间通过至少一度参考用户关系边连接。
可选的,如图13所示,所述风险检测模块13,用于:
传导预测单元131,用于基于所述参考用户关系边采用风险传导模型对所述至少一个参考用户进行至少一度风险传导预测,确定所述参考用户关系边的关系边传导类型;
风险确定单元132,用于基于所述关系边传导类型确定所述参考用户关系边对应的参考用户是否为风险行为用户。
可选的,传导预测单元131,用于:
将各所述参考用户关系边输入至风险传导模型,分别输出针对所述至少一个参考用户关系边的风险传导分;
确定所述参考用户关系边对应的风险传导分阈值,基于所述风险传导分阈值和所述风险传导分确定所述参考用户关系边的关系边传导类型。
可选的,传导预测单元131,用于:获取所述参考用户与所述黑种子用户之间的用户关系边数量,基于所述用户关系边数量确定风险关系传导度;
获取所述风险关系传导度对应的风险传导分阈值。
可选的,传导预测单元131,用于:若所述风险传导分大于所述风险传导分阈值,则确定所述参考用户关系边为有风险传导性类型;
若所述风险传导分小于或等于所述风险传导分阈值,则确定所述参考用户关系边为无风险传导性类型。
可选的,风险确定单元132,用于:
若所述关系边传导类型为有风险传导性类型,则确定所述参考用户关系边连接的参考用户为风险行为用户;
若所述关系边传导类型为无风险传导性类型,则确定所述参考用户关系边连接的参考用户为正常行为用户。
可选的,所述装置1,还用于:
获取用户关系图谱样本数据并确定至少一个黑种子样本用户,所述用户关系图谱样本数据中包括多个样本用户以及连接两两所述样本用户的样本用户关系边构成;
基于所述用户关系图谱样本数据和所述黑种子样本用户从所述样本用户关系边中确定至少一类样本关系边;
采用各类所述样本关系边对初始风险传导模型进行模型训练,得到训练后的风险传导模型。
可选的,所述装置1,还用于:
在所述用户关系图谱样本数据中,获取两个所述黑种子样本用户之间对应的第一样本关系边,将所述第一样本关系边作为正样本关系边;
在所述用户关系图谱样本数据中,获取所述黑种子样本用户与非黑种子样本用户之间的第二样本关系边,将所述第二样本关系边作为负样本关系边;
将所有所述样本用户关系边中除所述第一样本关系边和所述第二样本关系表之外的第三样本关系边,将所述第三样本关系边作为待预测样本数据。
需要说明的是,上述实施例提供的风险识别装置在执行风险识别方法时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的风险识别装置与风险识别方法实施例属于同一构思,其体现实现过程详见方法实施例,这里不再赘述。
上述本说明书序号仅仅为了描述,不代表实施例的优劣。
在本说明书一个或多个实施例中,电子设备可通过获取用户关系图谱数据并确定至少一个黑种子用户,从用户关系图谱数据中确定每个黑种子用户关联的至少一个参考用户,参考用户与黑种子用户存在至少一度参考用户关系边,基于参考用户关系边对至少一个参考用户进行至少一度风险传导预测就可以确定参考用户是否为风险行为用户。可避免过于依赖用户过往历史行为特征或数据,可以适配新用户“冷启动”的事务应用场景,通过黑种子用户采用用户间的参考关系边来进行风险识别,可以预测识别更多风险行为用户,提升了识别准确率。
本说明书还提供了一种计算机存储介质,所述计算机存储介质可以存储有多条指令,所述指令适于由处理器加载并执行如上述图1~图10所示实施例的所述风险识别方法,具体执行过程可以参见图1~图10所示实施例的具体说明,在此不进行赘述。
本说明书还提供了一种计算机程序产品,该计算机程序产品存储有至少一条指令,所述至少一条指令由所述处理器加载并执行如上述图1~图10所示实施例的所述风险识别方法,具体执行过程可以参见图1~图10所示实施例的具体说明,在此不进行赘述。
请参考图14,其示出了本说明书一个示例性实施例提供的电子设备的结构方框图。本说明书中的电子设备可以包括一个或多个如下部件:处理器110、存储器120、输入装置130、输出装置140和总线150。处理器110、存储器120、输入装置130和输出装置140之间可以通过总线150连接。
处理器110可以包括一个或者多个处理核心。处理器110利用各种接口和线路连接整个电子设备内的各个部分,通过运行或执行存储在存储器120内的指令、程序、代码集或指令集,以及调用存储在存储器120内的数据,执行电子设备100的各种功能和处理数据。可选地,处理器110可以采用数字信号处理(digital signal processing,DSP)、现场可编程门阵列(field-programmable gate array,FPGA)、可编程逻辑阵列(programmable logicArray,PLA)中的至少一种硬件形式来实现。处理器110可集成中心处理器(centralprocessing unit,CPU)、图像处理器(graphics processing unit,GPU)和调制解调器等中的一种或几种的组合。其中,CPU主要处理操作***、用户界面和应用程序等;GPU用于负责显示内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器110中,单独通过一块通信芯片进行实现。
存储器120可以包括随机存储器(random Access Memory,RAM),也可以包括只读存储器(read-only memory,ROM)。可选地,该存储器120包括非瞬时性计算机可读介质(non-transitory computer-readable storage medium)。存储器120可用于存储指令、程序、代码、代码集或指令集。存储器120可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作***的指令、用于实现至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现下述各个方法实施例的指令等,该操作***可以是安卓(Android)***,包括基于Android***深度开发的***、苹果公司开发的IOS***,包括基于IOS***深度开发的***或其它***。存储数据区还可以存储电子设备在使用中所创建的数据比如电话本、音视频数据、聊天记录数据,等。
参见图15所示,存储器120可分为操作***空间和用户空间,操作***即运行于操作***空间,原生及第三方应用程序即运行于用户空间。为了保证不同第三方应用程序均能够达到较好的运行效果,操作***针对不同第三方应用程序为其分配相应的***资源。然而,同一第三方应用程序中不同应用场景对***资源的需求也存在差异,比如,在本地资源加载场景下,第三方应用程序对磁盘读取速度的要求较高;在动画渲染场景下,第三方应用程序则对GPU性能的要求较高。而操作***与第三方应用程序之间相互独立,操作***往往不能及时感知第三方应用程序当前的应用场景,导致操作***无法根据第三方应用程序的具体应用场景进行针对性的***资源适配。
为了使操作***能够区分第三方应用程序的具体应用场景,需要打通第三方应用程序与操作***之间的数据通信,使得操作***能够随时获取第三方应用程序当前的场景信息,进而基于当前场景进行针对性的***资源适配。
以操作***为Android***为例,存储器120中存储的程序和数据如图16所示,存储器120中可存储有Linux内核层320、***运行时库层340、应用框架层360和应用层380,其中,Linux内核层320、***运行库层340和应用框架层360属于操作***空间,应用层380属于用户空间。Linux内核层320为电子设备的各种硬件提供了底层的驱动,如显示驱动、音频驱动、摄像头驱动、蓝牙驱动、Wi-Fi驱动、电源管理等。***运行库层340通过一些C/C++库来为Android***提供了主要的特性支持。如SQLite库提供了数据库的支持,OpenGL/ES库提供了3D绘图的支持,Webkit库提供了浏览器内核的支持等。在***运行时库层340中还提供有安卓运行时库(Android runtime),它主要提供了一些核心库,能够允许开发者使用Java语言来编写Android应用。应用框架层360提供了构建应用程序时可能用到的各种API,开发者也可以通过使用这些API来构建自己的应用程序,比如活动管理、窗口管理、视图管理、通知管理、内容提供者、包管理、通话管理、资源管理、定位管理。应用层380中运行有至少一个应用程序,这些应用程序可以是操作***自带的原生应用程序,比如联系人程序、短信程序、时钟程序、相机应用等;也可以是第三方开发者所开发的第三方应用程序,比如游戏类应用程序、即时通信程序、相片美化程序等。
以操作***为IOS***为例,存储器120中存储的程序和数据如图17所示,IOS***包括:核心操作***层420(Core OS layer)、核心服务层440(Core Services layer)、媒体层460(Media layer)、可触摸层480(Cocoa Touch Layer)。核心操作***层420包括了操作***内核、驱动程序以及底层程序框架,这些底层程序框架提供更接近硬件的功能,以供位于核心服务层440的程序框架所使用。核心服务层440提供给应用程序所需要的***服务和/或程序框架,比如基础(Foundation)框架、账户框架、广告框架、数据存储框架、网络连接框架、地理位置框架、运动框架等等。媒体层460为应用程序提供有关视听方面的接口,如图形图像相关的接口、音频技术相关的接口、视频技术相关的接口、音视频传输技术的无线播放(AirPlay)接口等。可触摸层480为应用程序开发提供了各种常用的界面相关的框架,可触摸层480负责用户在电子设备上的触摸交互操作。比如本地通知服务、远程推送服务、广告框架、游戏工具框架、消息用户界面接口(User Interface,UI)框架、用户界面UIKit框架、地图框架等等。
在图17所示出的框架中,与大部分应用程序有关的框架包括但不限于:核心服务层440中的基础框架和可触摸层480中的UIKit框架。基础框架提供许多基本的对象类和数据类型,为所有应用程序提供最基本的***服务,和UI无关。而UIKit框架提供的类是基础的UI类库,用于创建基于触摸的用户界面,iOS应用程序可以基于UIKit框架来提供UI,所以它提供了应用程序的基础架构,用于构建用户界面,绘图、处理和用户交互事件,响应手势等等。
其中,在IOS***中实现第三方应用程序与操作***数据通信的方式以及原理可参考Android***,本说明书在此不再赘述。
其中,输入装置130用于接收输入的指令或数据,输入装置130包括但不限于键盘、鼠标、摄像头、麦克风或触控设备。输出装置140用于输出指令或数据,输出装置140包括但不限于显示设备和扬声器等。在一个示例中,输入装置130和输出装置140可以合设,输入装置130和输出装置140为触摸显示屏,该触摸显示屏用于接收用户使用手指、触摸笔等任何适合的物体在其上或附近的触摸操作,以及显示各个应用程序的用户界面。触摸显示屏通常设置在电子设备的前面板。触摸显示屏可被设计成为全面屏、曲面屏或异型屏。触摸显示屏还可被设计成为全面屏与曲面屏的结合,异型屏与曲面屏的结合,本说明书对此不加以限定。
除此之外,本领域技术人员可以理解,上述附图所示出的电子设备的结构并不构成对电子设备的限定,电子设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。比如,电子设备中还包括射频电路、输入单元、传感器、音频电路、无线保真(wireless fidelity,WiFi)模块、电源、蓝牙模块等部件,在此不再赘述。
在本说明书中,各步骤的执行主体可以是上文介绍的电子设备。可选地,各步骤的执行主体为电子设备的操作***。操作***可以是安卓***,也可以是IOS***,或者其它操作***,本说明书对此不作限定。
本说明书的电子设备,其上还可以安装有显示设备,显示设备可以是各种能实现显示功能的设备,例如:阴极射线管显示器(cathode ray tubedisplay,简称CR)、发光二极管显示器(light-emitting diode display,简称LED)、电子墨水屏、液晶显示屏(liquidcrystal display,简称LCD)、等离子显示面板(plasma display panel,简称PDP)等。用户可以利用电子设备101上的显示设备,来查看显示的文字、图像、视频等信息。所述电子设备可以是智能手机、平板电脑、游戏设备、AR(Augmented Reality,增强现实)设备、汽车、数据存储装置、音频播放装置、视频播放装置、笔记本、桌面计算设备、可穿戴设备诸如电子手表、电子眼镜、电子头盔、电子手链、电子项链、电子衣物等设备。
在图14所示的电子设备中,处理器110可以用于调用存储器120中存储的应用程序,并具体执行以下操作:
获取用户关系图谱数据并确定至少一个黑种子用户,所述用户关系图谱数据中包括多个用户以及连接所述用户的用户关系边构成;
从所述用户关系图谱数据中确定每个所述黑种子用户关联的至少一个参考用户,所述参考用户与所述黑种子用户存在至少一度参考用户关系边;
基于所述参考用户关系边对所述至少一个参考用户进行至少一度风险传导预测,以确定所述参考用户是否为风险行为用户。
在一个实施例中,所述处理器110在执行所述获取用户关系图谱数据之前,还执行以下步骤:
根据多个用户的用户事实数据,确定两两所述用户之间的用户关系向量;
基于所述用户关系向量确定两两所述用户之间的用户关系边,基于所述用户关系边和所述多个用户确定用户关系图谱数据。
在一个实施例中,所述处理器110在执行所述基于所述用户关系向量确定两两所述用户之间的用户关系边,基于所述用户关系边和所述多个用户确定用户关系图谱数据,执行以下步骤:
基于所述用户关系向量确定每个所述用户之间的多度关系数据,基于所述多度关系数据确定两两所述用户之间的用户关系边;
通过每个所述用户关系边对所述多个用户进行连接处理,得到用户关系图谱数据。
在一个实施例中,所述处理器110在执行所述从所述用户关系图谱数据中确定每个所述黑种子用户关联的至少一个参考用户,所述参考用户与所述黑种子用户存在至少一度参考用户关系边,执行以下步骤:
以每个所述黑种子用户为参考节点,确定所述黑种子用户对应的至少一条关系传导链;
确定所述关系传导链上的至少一个参考用户,所述黑种子用户与所述参考用户之间通过至少一度参考用户关系边连接。
在一个实施例中,所述处理器110在执行所述基于所述参考用户关系边对所述至少一个参考用户进行至少一度风险传导预测,以确定所述参考用户是否为风险行为用户,执行以下步骤:
基于所述参考用户关系边采用风险传导模型对所述至少一个参考用户进行至少一度风险传导预测,确定所述参考用户关系边的关系边传导类型;
基于所述关系边传导类型确定所述参考用户关系边对应的参考用户是否为风险行为用户。
在一个实施例中,所述处理器110在执行所述基于所述参考用户关系边采用风险传导模型对所述至少一个参考用户进行至少一度风险传导预测,以确定所述参考用户关系边的关系边传导类型,执行以下步骤:
将各所述参考用户关系边输入至风险传导模型,分别输出针对所述至少一个参考用户关系边的风险传导分;
确定所述参考用户关系边对应的风险传导分阈值,基于所述风险传导分阈值和所述风险传导分确定所述参考用户关系边的关系边传导类型。
在一个实施例中,所述处理器110在执行所述确定所述参考用户关系边对应的风险传导分阈值,执行以下步骤:
获取所述参考用户与所述黑种子用户之间的用户关系边数量,基于所述用户关系边数量确定风险关系传导度;
获取所述风险关系传导度对应的风险传导分阈值。
在一个实施例中,所述处理器110在执行所述基于所述风险传导分阈值和所述风险传导分确定所述参考用户关系边的关系边传导类型,执行以下步骤:
若所述风险传导分大于所述风险传导分阈值,则确定所述参考用户关系边为有风险传导性类型;
若所述风险传导分小于或等于所述风险传导分阈值,则确定所述参考用户关系边为无风险传导性类型。
在一个实施例中,所述处理器110在执行所述基于所述关系边传导类型确定所述参考用户关系边对应的参考用户是否为风险行为用户,执行以下步骤:
若所述关系边传导类型为有风险传导性类型,则确定所述参考用户关系边连接的参考用户为风险行为用户;
若所述关系边传导类型为无风险传导性类型,则确定所述参考用户关系边连接的参考用户为正常行为用户。
在一个实施例中,所述处理器110在执行所述风险识别方法,还执行以下步骤:
获取用户关系图谱样本数据并确定至少一个黑种子样本用户,所述用户关系图谱样本数据中包括多个样本用户以及连接两两所述样本用户的样本用户关系边构成;
基于所述用户关系图谱样本数据和所述黑种子样本用户从所述样本用户关系边中确定至少一类样本关系边;
采用各类所述样本关系边对初始风险传导模型进行模型训练,得到训练后的风险传导模型。
在一个实施例中,所述处理器110在执行所述基于所述用户关系图谱样本数据和所述黑种子样本用户从所述样本用户关系边中确定至少一类样本关系边,执行以下步骤:
在所述用户关系图谱样本数据中,获取两个所述黑种子样本用户之间对应的第一样本关系边,将所述第一样本关系边作为正样本关系边;
在所述用户关系图谱样本数据中,获取所述黑种子样本用户与非黑种子样本用户之间的第二样本关系边,将所述第二样本关系边作为负样本关系边;
将所有所述样本用户关系边中除所述第一样本关系边和所述第二样本关系表之外的第三样本关系边,将所述第三样本关系边作为待预测样本数据。
在本说明书一个或多个实施例中,电子设备可通过获取用户关系图谱数据并确定至少一个黑种子用户,从用户关系图谱数据中确定每个黑种子用户关联的至少一个参考用户,参考用户与黑种子用户存在至少一度参考用户关系边,基于参考用户关系边对至少一个参考用户进行至少一度风险传导预测就可以确定参考用户是否为风险行为用户。可避免过于依赖用户过往历史行为特征或数据,可以适配新用户“冷启动”的事务应用场景,通过黑种子用户采用用户间的参考关系边来进行风险识别,可以预测识别更多风险行为用户,提升了识别准确率。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体或随机存储记忆体等。
需要说明的是,本说明书实施例所涉及的信息(包括但不限于用户设备信息、用户个人信息等)、数据(包括但不限于用于分析的数据、存储的数据、展示的数据等)以及信号,均为经用户授权或者经过各方充分授权的,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。例如,本说明书中涉及的用户关系图谱数据、用户事实数据、用户关系图谱样本数据等都是在充分授权的情况下获取的。
以上所揭露的仅为本说明书较佳实施例而已,当然不能以此来限定本说明书之权利范围,因此依本说明书权利要求所作的等同变化,仍属本说明书所涵盖的范围。

Claims (15)

1.一种风险识别方法,所述方法包括:
获取用户关系图谱数据并确定至少一个黑种子用户,所述用户关系图谱数据中包括多个用户以及连接所述用户的用户关系边构成;
从所述用户关系图谱数据中确定每个所述黑种子用户关联的至少一个参考用户,所述参考用户与所述黑种子用户存在至少一度参考用户关系边;
基于所述参考用户关系边对所述至少一个参考用户进行至少一度风险传导预测,以确定所述参考用户是否为风险行为用户。
2.根据权利要求1所述的方法,所述获取用户关系图谱数据之前,还包括:
根据多个用户的用户事实数据,确定两两所述用户之间的用户关系向量;
基于所述用户关系向量确定两两所述用户之间的用户关系边,基于所述用户关系边和所述多个用户确定用户关系图谱数据。
3.根据权利要求2所述的方法,所述基于所述用户关系向量确定两两所述用户之间的用户关系边,基于所述用户关系边和所述多个用户确定用户关系图谱数据,包括:
基于所述用户关系向量确定每个所述用户之间的多度关系数据,基于所述多度关系数据确定两两所述用户之间的用户关系边;
通过每个所述用户关系边对所述多个用户进行连接处理,得到用户关系图谱数据。
4.根据权利要求1所述的方法,所述从所述用户关系图谱数据中确定每个所述黑种子用户关联的至少一个参考用户,所述参考用户与所述黑种子用户存在至少一度参考用户关系边,包括:
以每个所述黑种子用户为参考节点,确定所述黑种子用户对应的至少一条关系传导链;
确定所述关系传导链上的至少一个参考用户,所述黑种子用户与所述参考用户之间通过至少一度参考用户关系边连接。
5.根据权利要求1所述的方法,所述基于所述参考用户关系边对所述至少一个参考用户进行至少一度风险传导预测,以确定所述参考用户是否为风险行为用户,包括:
基于所述参考用户关系边采用风险传导模型对所述至少一个参考用户进行至少一度风险传导预测,确定所述参考用户关系边的关系边传导类型;
基于所述关系边传导类型确定所述参考用户关系边对应的参考用户是否为风险行为用户。
6.根据权利要求5所述的方法,所述基于所述参考用户关系边采用风险传导模型对所述至少一个参考用户进行至少一度风险传导预测,以确定所述参考用户关系边的关系边传导类型,包括:
将各所述参考用户关系边输入至风险传导模型,分别输出针对所述至少一个参考用户关系边的风险传导分;
确定所述参考用户关系边对应的风险传导分阈值,基于所述风险传导分阈值和所述风险传导分确定所述参考用户关系边的关系边传导类型。
7.根据权利要求6所述的方法,所述确定所述参考用户关系边对应的风险传导分阈值,包括:
获取所述参考用户与所述黑种子用户之间的用户关系边数量,基于所述用户关系边数量确定风险关系传导度;
获取所述风险关系传导度对应的风险传导分阈值。
8.根据权利要求6所述的方法,所述基于所述风险传导分阈值和所述风险传导分确定所述参考用户关系边的关系边传导类型,包括:
若所述风险传导分大于所述风险传导分阈值,则确定所述参考用户关系边为有风险传导性类型;
若所述风险传导分小于或等于所述风险传导分阈值,则确定所述参考用户关系边为无风险传导性类型。
9.根据权利要求5所述的方法,所述基于所述关系边传导类型确定所述参考用户关系边对应的参考用户是否为风险行为用户,包括:
若所述关系边传导类型为有风险传导性类型,则确定所述参考用户关系边连接的参考用户为风险行为用户;
若所述关系边传导类型为无风险传导性类型,则确定所述参考用户关系边连接的参考用户为正常行为用户。
10.根据权利要求1所述的方法,所述方法还包括:
获取用户关系图谱样本数据并确定至少一个黑种子样本用户,所述用户关系图谱样本数据中包括多个样本用户以及连接两两所述样本用户的样本用户关系边构成;
基于所述用户关系图谱样本数据和所述黑种子样本用户从所述样本用户关系边中确定至少一类样本关系边;
采用各类所述样本关系边对初始风险传导模型进行模型训练,得到训练后的风险传导模型。
11.根据权利要求10所述的方法,所述基于所述用户关系图谱样本数据和所述黑种子样本用户从所述样本用户关系边中确定至少一类样本关系边,包括:
在所述用户关系图谱样本数据中,获取两个所述黑种子样本用户之间对应的第一样本关系边,将所述第一样本关系边作为正样本关系边;
在所述用户关系图谱样本数据中,获取所述黑种子样本用户与非黑种子样本用户之间的第二样本关系边,将所述第二样本关系边作为负样本关系边;
将所有所述样本用户关系边中除所述第一样本关系边和所述第二样本关系表之外的第三样本关系边,将所述第三样本关系边作为待预测样本数据。
12.一种风险识别装置,所述装置包括:
用户获取模块,用于获取用户关系图谱数据并确定至少一个黑种子用户,所述用户关系图谱数据中包括多个用户以及连接两两所述用户的用户关系边构成;
数据确定模块,用于从所述用户关系图谱数据中确定每个所述黑种子用户关联的至少一个参考用户,所述参考用户与所述黑种子用户存在至少一度参考用户关系边;
风险检测模块,用于基于所述参考用户关系边采用风险传导模型对所述参考用户进行至少一度风险传导预测,以确定所述参考用户是否为风险行为用户。
13.一种计算机存储介质,所述计算机存储介质存储有多条指令,所述指令适于由处理器加载并执行如权利要求1~11任意一项的方法步骤。
14.一种计算机程序产品,该计算机程序产品存储有至少一条指令,所述至少一条指令由所述处理器加载并执行如权利要求1~11任意一项的方法步骤。
15.一种电子设备,包括:处理器和存储器;其中,所述存储器存储有计算机程序,所述计算机程序适于由所述处理器加载并执行如权利要求1~11任意一项的方法步骤。
CN202211696378.0A 2022-12-28 2022-12-28 一种风险识别方法、装置、存储介质及电子设备 Pending CN116228391A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211696378.0A CN116228391A (zh) 2022-12-28 2022-12-28 一种风险识别方法、装置、存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211696378.0A CN116228391A (zh) 2022-12-28 2022-12-28 一种风险识别方法、装置、存储介质及电子设备

Publications (1)

Publication Number Publication Date
CN116228391A true CN116228391A (zh) 2023-06-06

Family

ID=86584970

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211696378.0A Pending CN116228391A (zh) 2022-12-28 2022-12-28 一种风险识别方法、装置、存储介质及电子设备

Country Status (1)

Country Link
CN (1) CN116228391A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116777606A (zh) * 2023-07-05 2023-09-19 无锡锡商银行股份有限公司 一种基于关系图谱的银行信贷智能反欺诈***及方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116777606A (zh) * 2023-07-05 2023-09-19 无锡锡商银行股份有限公司 一种基于关系图谱的银行信贷智能反欺诈***及方法
CN116777606B (zh) * 2023-07-05 2024-01-23 无锡锡商银行股份有限公司 一种基于关系图谱的银行信贷智能反欺诈***及方法

Similar Documents

Publication Publication Date Title
CN112837099B (zh) 潜在流失用户识别方法、装置、存储介质及电子设备
WO2024099457A1 (zh) 一种信息推荐方法、装置、存储介质及电子设备
CN115049068A (zh) 一种模型处理方法、装置、存储介质及电子设备
CN112070310A (zh) 基于人工智能的流失用户预测方法、装置及电子设备
CN116228391A (zh) 一种风险识别方法、装置、存储介质及电子设备
CN116798129A (zh) 一种活体检测方法、装置、存储介质及电子设备
CN116129534A (zh) 一种图像活体检测方法、装置、存储介质及电子设备
CN116956204A (zh) 多任务模型的网络结构确定方法、数据预测方法及装置
CN115858556A (zh) 一种数据处理方法、装置、存储介质及电子设备
CN114240339A (zh) 背景调查方法、装置、存储介质及电子设备
CN115329320A (zh) 风险应用识别方法、装置、存储介质以及电子设备
CN111770510A (zh) 网络体验状态确定方法、装置、存储介质及电子设备
CN116152403B (zh) 一种形象生成方法、装置、存储介质及电子设备
CN116071527B (zh) 一种对象处理方法、装置、存储介质及电子设备
CN117725219A (zh) 企业实体间关系预测方法、装置、存储介质及电子设备
CN116522996A (zh) 一种推荐模型的训练方法、推荐方法以及相关装置
CN116246014B (zh) 一种形象生成方法、装置、存储介质及电子设备
CN116168451A (zh) 一种图像活体检测方法、装置、存储介质及电子设备
CN117688484A (zh) 数据异常检测方法、装置、存储介质及电子设备
CN116229585A (zh) 一种图像活体检测方法、装置、存储介质及电子设备
CN117972513A (zh) 数据分类模型训练方法及数据分类方法、装置及存储介质
CN116881465A (zh) 一种企业关系图谱生成方法、装置、存储介质及电子设备
CN116934395A (zh) 一种特征处理方法、装置、存储介质及电子设备
CN117217379A (zh) 跨场景预测模型训练方法及预测方法、装置及存储介质
CN116934490A (zh) 一种信息处理方法、装置、存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination