CN114168805B - 数据处理方法、装置、设备及介质 - Google Patents
数据处理方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN114168805B CN114168805B CN202210119110.4A CN202210119110A CN114168805B CN 114168805 B CN114168805 B CN 114168805B CN 202210119110 A CN202210119110 A CN 202210119110A CN 114168805 B CN114168805 B CN 114168805B
- Authority
- CN
- China
- Prior art keywords
- directed
- degree
- target
- subgraph
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9024—Graphs; Linked lists
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种数据处理方法、装置、设备及介质,涉及数据处理领域。该方法包括:获取目标有向带权图,目标有向带权图中包括至少两个数据节点,至少两个数据节点之间包括带权重的有向边;基于有向边在至少两个数据节点之间的指向关系,确定至少两个数据节点分别对应的出度数和入度数;以至少两个数据节点为基础,在预设度数的范围内提取有向带权图中的目标子图;基于目标子图中的有向边分布情况,确定至少两个数据节点之间的数据关联度。通过以上方式,在预设度数的范围内对目标有向带权图进行分析,借助有向边的权重,确定全局范围内数据关联度相对较高的情况。本申请可应用于云技术、人工智能、智慧交通等各种场景。
Description
技术领域
本申请实施例涉及数据处理领域,特别涉及一种数据处理方法、装置、设备及介质。
背景技术
对数据关联度进行分析,是数据挖掘领域中一项基础又重要的技术,用于在大型数据库中发现数据之间的关联关系,从而挖掘隐藏在数据中的相互关系,也有利于提高数据利用的效率。
相关技术中,通常采用图表分析、协方差矩阵、回归分析等方法,对数据之间的关联度进行分析,例如:对两个变量数据采用一元回归方法,根据两个变量数据之间的变化情况,确定回归系数,进而对变量数据的价值进行分析。
然而,采用上述方法对数据进行关联度分析时,分析结果受到数据数量的影响较大,且已分析数据的关联性较为固定,无法准确利用数据之间的关联度,对数据价值进行挖掘。
发明内容
本申请实施例提供了一种数据处理方法、装置、设备及介质,能够避免仅对部分数据节点进行分析时的局限性。所述技术方案如下。
一方面,提供了一种数据处理方法,所述方法包括:
获取目标有向带权图,所述目标有向带权图中包括至少两个数据节点,所述至少两个数据节点之间包括带权重的有向边,所述权重用于指示所述至少两个数据节点之间的有向关联度;
基于所述有向边在所述至少两个数据节点之间的指向关系,确定所述至少两个数据节点分别对应的出度数和入度数;所述入度数表示指向所述数据节点的有向边的数量,所述出度数表示从所述数据节点指出的有向边的数量;
以所述至少两个数据节点为基础,在预设度数的范围内提取所述有向带权图中的目标子图;
基于所述目标子图中的有向边分布情况,确定所述至少两个数据节点之间的数据关联度。
另一方面,提供了一种数据处理方法,所述方法包括:
构建角色关系图,所述角色关系图中以至少两个虚拟角色为节点,所述节点之间包括带权重的有向边,所述权重用于指示所述至少两个虚拟角色之间有向的亲密度强度关系;
基于所述有向边在所述至少两个虚拟角色之间的指向关系,确定所述至少两个虚拟角色分别对应的入度数和出度数,所述入度数用于指示指向所述虚拟角色的有向边数量,所述出度数用于指示从所述虚拟角色指出的有向边数量;
以所述至少两个虚拟角色为基础,在预设度数的范围内提取所述角色关系图中的目标关系图;
基于所述关系图中的有向边分布情况,确定所述至少两个虚拟角色之间的亲密度分析结果。
另一方面,提供了一种数据处理装置,所述装置包括:
获取模块,用于获取目标有向带权图,所述目标有向带权图中包括至少两个数据节点,所述至少两个数据节点之间包括带权重的有向边,所述权重用于指示所述至少两个数据节点之间的有向关联度;
度数确定模块,用于基于所述有向边在所述至少两个数据节点之间的指向关系,确定所述至少两个数据节点分别对应的出度数和入度数;所述入度数表示指向所述数据节点的有向边的数量,所述出度数表示从所述数据节点指出的有向边的数量;
提取模块,用于以所述至少两个数据节点为基础,在预设度数的范围内提取所述有向带权图中的目标子图;
关联度确定模块,用于基于所述目标子图中的有向边分布情况,确定所述至少两个数据节点之间的数据关联度。
另一方面,提供了一种数据处理装置,所述装置包括:
构建模块,用于构建角色关系图,所述角色关系图中以至少两个虚拟角色为节点,所述节点之间包括带权重的有向边,所述权重用于指示所述至少两个虚拟角色之间有向的亲密度强度关系;
度数确定模块,用于基于所述有向边在所述至少两个虚拟角色之间的指向关系,确定所述至少两个虚拟角色分别对应的入度数和出度数,所述入度数用于指示指向所述虚拟角色的有向边数量,所述出度数用于指示从所述虚拟角色指出的有向边数量;
提取模块,用于以所述至少两个虚拟角色为基础,在预设度数的范围内提取所述角色关系图中的目标关系图;
结果分析模块,用于基于所述关系图中的有向边分布情况,确定所述至少两个虚拟角色之间的亲密度分析结果。
另一方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上述本申请实施例中任一所述数据处理方法。
另一方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如上述本申请实施例中任一所述的数据处理方法。
另一方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述实施例中任一所述的数据处理方法。
本申请实施例提供的技术方案带来的有益效果至少包括:
基于目标有向带权图中有向边的指向关系,确定每个数据节点对应的出度数和入度数,基于目标有向带权图对应的数据节点,在预设度数范围内,从目标有向带权图中确定数据节点之间关联度较大的目标子图。通过上述方法,可以借助目标有向带权图中有向边的权重和方向,在保持数据节点不变的基础上,对目标有向带权图进行更细致地分析。同时,预设度数包括预设出度数以及预设入度数,在预设度数的范围内对目标有向带权图进行分析,也有利于实现对每一个数据节点进行分析的过程。基于有向边确定目标子图,也有利于借助有向边的权重,确定全局范围内关联度相对较高的目标子图,从而避免仅对部分数据节点进行分析时的局限性,使得目标子图的全局关联度更强,进而更好地确定目标有向带权图中数据节点之间的数据关联度,提高数据转化率以及互动比例。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一个示例性实施例提供的实施环境示意图;
图2是本申请一个示例性实施例提供的数据处理方法的流程图;
图3是本申请一个示例性实施例提供的有向带权图的示意图;
图4是本申请另一个示例性实施例提供的数据处理方法的流程图;
图5是本申请一个示例性实施例提供的子图集合示意图;
图6是本申请另一个示例性实施例提供的数据处理方法的流程图;
图7是本申请一个示例性实施例提供的角色关系的示意图;
图8是本申请另一个示例性实施例提供的数据处理方法的流程图;
图9是本申请一个示例性实施例提供的对玩家数据进行分析的流程图;
图10是本申请一个示例性实施例提供的游戏界面示意图;
图11是本申请另一个示例性实施例提供的游戏界面示意图;
图12是本申请一个示例性实施例提供的游戏动效的界面示意图;
图13是本申请另一个示例性实施例提供的游戏动效的界面示意图;
图14是本申请另一个示例性实施例提供的游戏界面示意图;
图15是本申请另一个示例性实施例提供的游戏道具获取途径的界面示意图;
图16是本申请一个示例性实施例提供的数据处理装置的结构框图;
图17是本申请另一个示例性实施例提供的数据处理装置的结构框图;
图18是本申请另一个示例性实施例提供的数据处理装置的结构框图;
图19是本申请一个示例性实施例提供的服务器的结构框图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
相关技术中,通常采用图表分析、协方差矩阵、回归分析等方法,对数据之间的关联度进行分析,例如:对两个变量数据采用一元回归方法,根据两个变量数据之间的变化情况,确定回归系数,进而对变量数据的价值进行分析。然而,采用上述方法对数据进行关联度分析时,分析结果受到数据数量的影响较大,且已分析数据的关联性较为固定,无法准确利用数据之间的关联度,对数据价值进行挖掘。
本申请实施例中,提供了一种数据处理方法,在保持数据节点不变的基础上,借助有向边的权重,基于目标子图更好地确定数据节点之间的数据关联度。针对本申请训练得到的数据处理方法,在应用时包括如下场景中的至少一种。
一、应用于游戏好友亲密度分析场景下
在游戏场景中,常常涉及多个玩家之间的互动过程,通过在虚拟游戏场景中的互动,可以提高游戏的趣味性,增强游戏的活跃度。示意性的,采用上述数据处理方法,以多个玩家操控的虚拟角色为数据节点,不同虚拟角色之间的亲密度为带有权重的有向边,其中,权重指示虚拟角色之间的亲密程度;方向指示虚拟角色之间的亲密指向,如:A玩家喜欢B玩家,则由A玩家指向B玩家。之后,根据有向边的指向确定虚拟角色对应的入度数和出度数,其中,入度数为指向虚拟角色的有向边的数量,如:虚拟角色的粉丝人数;出度数为从虚拟角色指出的有向边的数量,如:虚拟角色的关注人数等。以至少两个数据节点为基础,在预设度数的范围内,确定目标有向带权图对应的目标子图,进而确定虚拟角色之间的关联度,从而避免仅对部分虚拟角色之间进行分析时可能造成的局限性,从更全面的角度分析不同玩家之间的相对亲密度关系。可选地,基于相对亲密度关系确定的亲密度关系排行榜,有利于帮助提升好友的互动比例及转化率,进而增加游戏的活跃度。
二、应用于事件关联度分析场景下
在市场运行场景下,存在许多具有关联性但整体关联度较不清晰的情况。例如:多个子事件之间具有一定的关联性,但多个子事件从属于不同的领域。通常情况下,为提高关联度分析准确性,会对相同领域的子事件进行分析,而较少进行跨领域的分析过程。示意性的,采用上述数据处理方法,以多个子事件为数据节点,不同子事件之间的关联度为有向边,在确定每个子事件对应的入度数和出度数后,以至少两个子事件为基础,在预设度数的范围内,确定目标有向带权图对应的目标子图,进而确定子事件之间的关联度,根据子事件之间的关联度,可以跨领域地对不同数据进行更全局性地观测,进而获得更有价值的数据处理结果,不仅避免仅对相同领域内子事件之间进行分析时的局限性,还能够多角度地分析不同领域中不同子事件之间的关联性,提高数据挖掘价值。
值得注意的是,上述应用场景仅为示意性的举例,本实施例提供的数据处理方法还可以应用于其他场景中,本申请实施例对此不加以限定。
可以理解的是,在本申请的具体实施方式中,涉及到用户信息等相关的数据,当本申请以上实施例运用到具体产品或技术中时,需要获得用户许可或者同意,且相关数据的收集、使用和处理需要守相关国家和地区的相关法律法规和标准。
其次,对本申请实施例中涉及的实施环境进行说明,示意性的,请参考图1,该实施环境中涉及终端110、服务器120,终端110和服务器120之间通过通信网络130连接。
在一些实施例中,终端110中安装有具有数据获取功能的应用程序。在一些实施例中,终端110用于向服务器120发送数据。服务器120可以对数据进行关联度分析,通过数据处理模型121确定数据之间的全局关联度分析结果,并将关联度分析结果反馈至终端110进行显示。
其中,数据处理模型121的一个示意性应用方法如下所示:以数据为数据节点,以数据之间的有向关联度为具有权重的有向边,基于数据节点和有向边,获取得到目标有向带权图。基于不同数据节点之间有向边的指向情况,确定每一个数据节点的出度数以及入度数。以至少两个数据节点为基础,在预设度数范围内,从目标有向带权图中提取对应的目标子图,并确定数据之间的全局关联度分析结果,即得到数据节点之间的相对关联度分析情况。上述过程是数据处理模型应用过程的不唯一情形的举例。
值得注意的是,上述终端包括但不限于手机、平板电脑、便携式膝上笔记本电脑、智能语音交互设备、智能家电、车载终端等移动终端,也可以实现为台式电脑等;上述服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式***,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
其中,云技术(Cloud technology)是指在广域网或局域网内将硬件、应用程序、网络等系列资源统一起来,实现数据的计算、储存、处理和共享的一种托管技术。云技术基于云计算商业模式应用的网络技术、信息技术、整合技术、管理平台技术、应用技术等的总称,可以组成资源池,按需所用,灵活便利。云计算技术将变成重要支撑。技术网络***的后台服务需要大量的计算、存储资源,如视频网站、图片类网站和更多的门户网站。伴随着互联网行业的高度发展和应用,将来每个物品都有可能存在自己的识别标志,都需要传输到后台***进行逻辑处理,不同程度级别的数据将会分开处理,各类行业数据皆需要强大的***后盾支撑,只能通过云计算来实现。
在一些实施例中,上述服务器还可以实现为区块链***中的节点。
结合上述名词简介和应用场景,对本申请提供的数据处理方法进行说明,以该方法应用于服务器为例,如图2所示,该方法包括如下步骤210至步骤240。
步骤210,获取目标有向带权图。
其中,目标有向带权图中包括至少两个数据节点,至少两个数据节点之间包括带权重的有向边。
示意性的,“向”用于指示方向,“权”用于指示权重。方向用于指示至少两个数据节点之间的指向关系,如:表示“喜欢”、“关注”等含义;权重用于指示至少两个数据节点之间的有向关联度。
如图3所示,为有向带权图的一种表示方式,该有向带权图中的包括三个节点(节点310、节点311、节点312),以及连接在三个节点上的边(边320、边321、边322、边323),其中,每条边具有对应的方向和权重,方向用于指示节点之间的关联走向,呈现为图3中不同节点之间的指向;权重用于指示节点之间的关联程度,采用图3中数字的数值大小表示。例如:连接在节点310与节点311之间的边存在两条,包括从节点310指向节点311且权重为7的边321,以及从节点311指向节点310且权重为6的边320。
可选地,在有向带权图中,根据节点所指示的不同含义,节点对应的边(包括边的方向和权重)以及有向带权图会有不同的表达含义。示意性的,节点为游戏场景下不同玩家对应的身份标识(ID,Identity Document)数据,例如:A玩家、B玩家、C玩家等;节点之间连接的带权重的有向边为玩家之间的亲密程度,例如:A玩家“喜欢”B玩家(如:A玩家与B玩家的消息互动次数较多,或者A玩家向B玩家发送游戏组队邀请的次数较多等),则在该有向带权图中,A玩家指向B玩家,且权重值较大。可选地,以A玩家为例,若A玩家与B玩家的消息互动次数最多,或者A玩家向B玩家发送游戏组队邀请的次数最多,则在该有向带权图中,A玩家指向其他玩家(包括B玩家)的“边”中,A玩家指向B玩家的“边”的权重最大,如,权重数值最大。
示意性的,目标有向带权图为待进行数据关联度分析的图,该目标有向带权图包括待进行数据关联度分析的数据节点,不同数据节点之间连接有带权重的有向边。
在一个可选的实施例中,获取参与关联度分析的至少两个数据节点;基于至少两个数据节点之间的关联度关系,确定至少两个数据节点分别对应的有向边。
示意性的,至少两个数据节点为含义相同的节点,在至少两个数据节点之间存在关联度关系。例如:在对一款社交应用程序中的好友关联度进行分析时,数据节点代表好友名称,其中包括好友1、好友2与好友3,基于好友之间的聊天频率与时长,综合确定至少两个数据节点之间的关联度关系,并确定至少两个数据节点分别对应的带有权重的有向边,关联度关系越强,权重越大。可选地,以至少两个数据节点和有向边为基础,构建目标有向带权图。
值得注意的是,以上仅为示意性的举例,本申请实施例对此不加以限定。
步骤220,基于有向边在至少两个数据节点之间的指向关系,确定至少两个数据节点分别对应的出度数和入度数。
其中,入度数表示指向数据节点的有向边的数量,出度数表示从数据节点指出的有向边的数量。
在一个可选的实施例中,获取得到目标有向带权图后,不同的数据节点对应的出度数和入度数会存在差异。可选地,出度数或入度数中可能存在一个为0的情况,例如:出度数为0用于指示该数据节点并未指向其他数据节点;入度数为0用于指示并未有其他数据节点指向该数据节点。
示意性的,将图3所示的有向带权图作为获取得到的目标有向带权图,对该目标有向带权图进行关联度分析。例如,以节点310为例,对节点310对应的出度数和入度数进行确定。其中,入度数表示指向节点310的有向边的数量,如图3所示,节点310对应的入度数为1,用于指示从节点311指向节点310的有向边;出度数表示从节点310指出的有向边的数量,如图3所示,节点310对应的出度数为2,用于指示从节点310指向节点311的有向边,以及从节点310指向节点312的有向边。
示意性的,基于上述方法,对节点311以及节点312分别对应的出度数和入度数进行确定,如图3所示,节点311对应的入度数为1(用于指示从节点310指向节点311的有向边)、节点311对应的出度数为1(用于指示从节点311指向节点312的有向边);节点312对应的入度数为2(用于指示从节点310指向节点312的有向边,以及从节点311指向节点312的有向边)、节点312对应的出度数为0(用于指示节点312并未指向其他节点)。
步骤230,以至少两个数据节点为基础,在预设度数的范围内提取目标有向带权图中的目标子图。
可选地,以至少两个数据节点为基础,用于指示对目标有向带权图中的数据节点进行保留。
示意性的,预设度数包括预设入度数和预设出度数。预设度数的范围用于指示预设入度数范围以及预设出度数范围。在预设度数的范围内提取目标有向带权图中的目标子图,用于指示在保留目标有向带权图中的数据节点的基础上,对目标有向带权图中的数据节点之间的有向边进行处理后得到的目标子图的过程。
在一个可选的实施例中,当目标有向带权图中每一个数据节点对应的有向边的数量符合预设度数的范围,将该目标有向带权图作为一个子图。
示意性的,在基于数据节点对数据节点之间的有向边进行裁剪时,得到目标有向带权图对应的多个子图,将多个子图中符合标准的子图确定为目标子图。例如:以有向边的权重作为判断条件,当子图中有向边的权重之和最大时,将该子图确定为目标子图。示意性的,目标子图对应的子图有向边的权重之和最大,用于指示目标子图中各个数据节点之间的全局相对关联性强,有利于从更全面的角度,对各个数据节点之间的关联性进行更精准的确定。
步骤240,基于目标子图中的有向边分布情况,确定至少两个数据节点之间的数据关联度。
在一个可选的实施例中,对目标子图中每一个数据节点对应的目标子图有向边的权值进行排序,确定权值序列;基于权值序列的排序情况,确定至少两个数据节点之间的数据关联度。
其中,排序情况根据数据节点对应的有向边进行确定。
示意性的,从目标子图中任意选择一个数据节点进行分析,数据节点1的出度数为2,则依据从数据节点1指出的两个有向边的权重,对两个有向边进行关联度排序;或者,数据节点1的入度数为3,则依据指向数据节点1的三个有向边的权重,对三个有向边进行关联度排序;或者,将数据节点1中入度数对应的有向边的权重和出度数对应的有向边的权重进行综合排序,得到数据节点1对应的关联度排序情况等。
可选地,对于不同的数据节点,关联度分析结果既可能相同,也可能不同。示意性的,当对于不同的数据节点,关联度分析结果相同时,对数据节点1而言,数据节点2为其关联度最高的节点;对于数据节点2而言,数据节点1也为其关联度最高的节点;或者,当对于不同的数据节点,关联度分析结果不同时,对数据节点1而言,数据节点2为其关联度最高的节点;但对于数据节点2而言,数据节点1为其关联度第二高的节点等。
值得注意的是,以上仅为示意性的举例,本申请实施例对此不加以限定。
综上所述,根据目标有向带权图中有向边的指向关系,确定每个数据节点对应的出度数和入度数,基于目标有向带权图对应的数据节点,在预设度数范围内,从目标有向带权图中确定目标子图。通过上述方法,可以借助目标有向带权图中有向边的权重和方向,在保持数据节点不变的基础上,对目标有向带权图进行更细致地分析,同时,预设度数包括预设出度数以及预设入度数,在预设度数的范围内对目标有向带权图进行分析,也有利于对每一个数据节点与其他数据节点之间的关系进行分析。基于有向边确定目标子图,借助有向边的权重,确定全局范围内关联度相对较高的情况,从而避免仅对部分数据节点进行分析时的局限性,使得目标子图的全局关联度更强,进而更好地确定目标有向带权图中数据节点之间的数据关联度,提高数据转化率以及互动比例。
在一个可选的实施例中,在预设度数的范围内提取有向带权图中目标子图的过程,是通过有向带权图中有向边的权重实现的。示意性的,如图4所示,上述图2所示出的实施例中的步骤230还可以实现为如下步骤410至步骤430。
步骤410,以至少两个数据节点为基础,在预设度数的范围内,确定目标有向带权图对应的至少一个子图。
示意性的,确定目标有向带权图后,在从目标有向带权图中确定与目标有向带权图对应的至少一个子图时,将构成目标有向带权图的数据节点进行保留,即:至少一个子图对应的数据节点与目标有向带权图对应的数据节点是相同的。
可选地,基于至少两个数据节点,在从目标有向带权图中确定至少一个子图时,对至少两个数据节点之间的有向边进行处理,使得有向边的数量位于预设度数的范围内,即:实现在预设度数的范围内,确定目标有向带权图对应的至少一个子图的过程。
在一个可选的实施例中,在预设度数的范围内,对至少两个数据节点中每一个数据节点对应的有向边进行裁剪,得到至少一个子图对应的子图有向边。
可选地,每一个数据节点对应的有向边是不同的,以目标有向带权图中每一个数据节点为分析对象,确定该数据节点对应的有向边,包括指向该数据节点的有向边与指出该数据节点的有向边。
示意性的,预设度数包括预设出度数和预设入度数,其中,预设入度数和预设出度数为预先设定的数值,二者既可以相同,也可以不同。例如:设定预设入度数与预设出度数均为4,则预设度数的范围用于指示每一个数据节点对应的入度数小于等于4(预设入度数),每一个数据节点对应的出度数小于等于4(预设出度数),如一个数据节点的入度数为3,出度数为2,则该数据节点对应的出度数与入度数符合上述预设度数的范围,该数据节点对应的有向边的数量符合预设度数范围对应的条件;或者,设定预设入度数为4,预设出度数为3,则预设度数的范围用于指示每一个数据节点对应的入度数小于等于4(预设入度数),每一个数据节点对应的出度数小于等于3(预设出度数),如一个数据节点的入度数为4,出度数为4,则该数据节点对应的出度数不符合上述预设度数的范围。可选地,为使得该数据节点的出度数位于预设度数的范围内,对指出该数据节点的有向边进行裁剪。
在一个可选的实施例中,在预设度数的范围内,对至少两个数据节点中每一个数据节点对应的有向边进行裁剪包括:在预设出度数的范围内,对从数据节点指出的有向边进行裁剪;在预设入度数的范围内,对指向数据节点的有向边进行裁剪。
示意性的,在对数据节点对应的有向边进行裁剪时,可以采用如下至少一种方法实现裁剪过程。
1、采用贪心算法,对数据节点对应的有向边进行裁剪。
其中,贪心算法是指,在对问题进行求解时,总是做出在当前看来的最好选择,即:不从整体最优上加以考虑,而是做出某种程度上的局部最优解。
可选地,基于有向边对应的权重情况,对有向边进行裁剪。示意性的,对有向边对应的权重进行排序,在预设度数的范围内,保留符合预设度数的权重较大的有向边,而对其他有向边进行裁剪;或者,保留权重最大的有向边,而对其他权重的有向边进行裁剪等。通过贪心算法对有向边进行裁剪,有利于提高对有向边的裁剪效率,减轻服务器的计算负担。
例如:设定预设入度数与预设出度数为4,对每一个数据节点进行分析,基于有向边对应的权重,对每一个数据节点对应有向边的权重进行从大到小的排序。在对有向边进行裁剪时,在预设入度数范围内,对每一个数据节点对应的指向该数据节点的有向边的权重进行排序,将权重排序中前四个权重对应的四条有向边进行保留;在预设出度数范围内,对每一个数据节点对应的从该数据节点指出的有向边的权重进行排序,将权重排序中前四个权重对应的四条有向边进行保留。
2、采用遍历法,对数据节点对应的有向边进行裁剪。
其中,遍历法是指,沿着某条搜索路径,依次对目标有向带权图中的每个数据节点均做一次且仅做一次访问。
示意性的,以目标有向带权图中任意一个数据节点为起点,依据不同数据节点之间的有向边,对目标有向带权图进行遍历,其中,遍历的方向并不受有向边指向的干扰。可选地,遍历的终点为目标有向带权图中最后一个被经过的数据节点。通过遍历法对数据节点对应的有向边进行裁剪时,有利于对有向边进行更全面、细致地搜索,进而在预设度数的范围内,得到目标有向带权图对应的有向边的各种排列组合情况。
以上仅为示意性的举例,本申请实施例对此不加以限定。
在一个可选的实施例中,基于至少两个数据节点和子图有向边,得到目标有向带权图对应的至少一个子图。
示意性的,将目标有向带权图中的所有数据节点作为构成子图的节点,基于在预设度数的范围内对有向边进行裁剪后的结果,得到目标有向带权图对应的至少一个子图。
例如:预设度数中预设出度数与预设入度数为4,在构成子图时,控制每一个数据节点的出度数与入度数不大于4,即:控制每一个数据节点的出度数小于等于4且控制每一个数据节点的入度数小于等于4。可选地,存在节点数据的出度数为0或者入度数为0的情况(出度数为0且入度数为0,数据之间不具有关联度);或者,存在节点数据的出度数为3,入度数为2的情况;或者,存在节点数据的出度数为4,入度数为4的情况等。
步骤420,基于目标有向带权图中的有向边对应的权重,确定至少一个子图分别对应的全局权值。
示意性的,权值用于指示权重对应的数值,全局权值是基于子图中子图有向边对应权值得到的。
在一个可选的实施例中,基于有向边对应的权重,确定子图有向边对应的权重。
示意性的,基于至少两个数据节点以及裁剪后得到的子图有向边,得到目标有向带权图对应的至少一个子图,子图对应的子图有向边具有的权重和方向,与目标有向带权图中对应的有向边的权重和方向相同。
在一个可选的实施例中,对第i个子图中子图有向边对应的权重进行求和,确定第i个子图对应的全局权值。其中,i为正整数。
可选地,目标有向带权图如图3所示,设定预设入度数与预设出度数为1,即:预设入度数与预设出度数的数值小于等于1。例如:保持目标有向带权图中的数据节点不变,仍为数据节点310、数据节点311以及数据节点312,对每一个数据节点对应的有向边进行裁剪,使得每一个数据节点对应的出度数与入度数均处于预设度数范围内。示意性的,如图5所示,对目标有向带权图的有向边进行裁剪后,得到三个子图,子图中子图有向边对应的权重与目标有向带权图中对应的有向边的权重相同。
示意性的,对子图510中子图有向边对应的权重进行求和,得到子图510对应的全局权值,为15(7+8);对子图520中子图有向边对应的权重进行求和,得到子图520对应的全局权值,为13(5+8);对子图530中子图有向边对应的权重进行求和,得到子图530对应的全局权值,为14(6+8)。
步骤430,基于全局权值,从至少一个子图中确定目标子图。
在一个可选的实施例中,从全局权值中,确定符合预设标准的目标全局权值。
示意性的,从目标有向带权图中确定多个子图,对每一个子图的全局权值进行求解,得到每一个子图对应的全局权值,以全局权值为判断标准,确定目标子图。
在一个可选的实施例中,将全局权值中的最大权值作为目标全局权值;将目标全局权值对应的子图确定为目标子图。
示意性的,在确定每一个子图对应的全局权值后,对全局权值的数值大小进行比较,确定全局权值中的最大权值,将该最大权值作为目标全局权值。示意性的,如图5所示,将子图510对应的全局权值作为目标全局权值。
可选地,将目标全局权值对应的子图确定为目标子图,即,将子图510确定为目标子图。
在一个可选的实施例中,从目标有向带权图获取到的多个子图中,存在多个子图对应的全局权值相同的情况。示意性的,将目标全局权值对应的至少一个子图构成候选子图集合。
例如:对每一个子图对应的全局权值进行数值比较后,确定目标全局权值为18,该目标全局权值对应的子图存在多个,将多个子图构成候选子图集合。
可选地,从候选子图集合中,确定目标子图。示意性的,从候选子图集合中,随机选择一个候选子图,作为目标子图,即:以等概率的方式,从候选子图集合中确定目标子图;或者,从候选子图集合中,将有向边数量最多的子图,确定为目标子图等。
值得注意的是,以上仅为示意性的举例,本申请实施例对此不加以限定。
综上所述,基于目标有向带权图中有向边的指向关系,确定每个数据节点对应的出度数和入度数,基于目标有向带权图对应的数据节点,在预设度数范围内,从目标有向带权图中确定数据节点之间关联度最大的目标子图。通过上述方法,可以借助目标有向带权图中有向边的权重和方向,在保持数据节点不变的基础上,对目标有向带权图进行更细致地分析,也有利于借助有向边的权重,确定全局范围内关联度相对较高的目标子图,从而避免仅对部分数据节点进行分析时的局限性,使得目标子图的全局关联度更强。
在本申请实施例中,以至少两个数据节点为基础,在预设度数的范围内,确定目标有向带权图对应的至少一个子图,基于目标有向带权图中有向边对应的权重,对子图中子图有向边对应的权重进行求和,确定每一个子图对应的全局权值,基于全局权值,从至少一个子图中确定目标子图。通过对数据节点的保留以及对目标有向带权图中有向边的裁剪,可以更好地确定目标有向带权图中数据节点之间的数据关联度,进而有利于从整体上对数据的相对关联度进行更准确地划分,提高数据转化率以及互动比例。
在一个可选的实施例中,将上述数据处理方法应用于游戏应用场景中,示意性的,如图6所示,上述图2所示出的实施例中的步骤还可以实现为如下步骤610至步骤640。
步骤610,构建角色关系图。
其中,角色关系图中以至少两个虚拟角色为节点,节点之间包括带权重的有向边,权重用于指示至少两个虚拟角色之间有向的亲密度强度关系。
虚拟角色是指虚拟世界中的可活动对象,该可活动对象可以是虚拟角色、虚拟动物、动漫人物等,可选地,虚拟角色是基于动画骨骼技术创建的三维立体模型。在将虚拟角色作为角色关系图中的节点时,既可以将虚拟角色对应的ID作为节点,也可以将虚拟角色对应的角色形象作为节点,还可以将虚拟角色对应的头像作为节点等,即:将能够对至少两个虚拟角色进行区别的特性作为角色关系图中的节点。
示意性的,如图7所示,为一个示意性的角色关系图。其中,节点A710用于指示A玩家,节点B720用于指示B玩家,节点C730用于指示C玩家。
可选地,节点之间包括带权重的有向边,权重用于指示至少两个虚拟角色之间有向的亲密度强度关系。
如图7所示,权重采用***数字表示,数字越大,权重越高,表示两个虚拟角色之间有向的亲密度强度关系越强;数字越小,权重越低,表示两个虚拟角色之间有向的亲密度强度关系越低。方向用于指示两个虚拟角色之间的亲密度方向,如:节点A710指向节点C730,用于指示A玩家“喜欢”C玩家等。
示意性的,在角色关系图中,综合节点以及有向边的方向和权重,能够确定B玩家“喜欢”A玩家,且亲密度程度为9;A玩家“喜欢”C玩家,且亲密度程度为11。
步骤620,基于有向边在至少两个虚拟角色之间的指向关系,确定至少两个虚拟角色分别对应的入度数和出度数。
入度数用于指示指向虚拟角色的有向边数量,出度数用于指示从虚拟角色指出的有向边数量。
示意性的,对每一个虚拟角色进行分析。例如:在图7中,节点A710对应的入度数为3,出度数为3;节点B720对应的入度数为0,出度数为2;节点C730对应的入度数为2,出度数为0等。通过对每一个虚拟角色的入度数和出度数进行确定,可以知悉不同虚拟角色与其他虚拟角色的关系,从而在对一个虚拟角色进行分析时,更高效地确定与之相关联的其他虚拟角色,以及该虚拟角色与其他虚拟角色之间的关联方向和亲密程度等信息。
步骤630,以至少两个虚拟角色为基础,在预设度数的范围内提取角色关系图中的目标关系图。
示意性的,保持角色关系图中每一个虚拟角色不变,在预设出度数与预设入度数范围内,对角色关系图进行裁剪,得到多个子关系图。
例如:预设出度数与预设入度数为4,对角色关系图进行裁剪的结果需要满足如下条件:
1、每个节点的出度数≤4,每个节点的入度数≥4;
2、每个子关系图包含若干条有向边,且有向边覆盖所有节点。
在一个可选的实施例中,基于多个子关系图,确定每个子关系图对应的全局权值,全局权值用于指示子关系图中有向边对应权重的数值之和。
可选地,从多个子关系图中确定全局权值最大的子关系图,将该子关系图确定为目标关系图。示意性的,全局权值最大的目标关系图可以更好地体现不同虚拟角色之间的全局相对亲密程度,进而更均衡地为不同玩家推荐亲密度高且互动性较好的其他玩家。
步骤640,基于目标关系图中的有向边分布情况,确定至少两个虚拟角色之间的亲密度分析结果。
示意性的,目标关系图为根据角色关系图获取得到的,用于反映不同玩家中总体相对亲密的关系程度,例如:在确定目标关系图后,根据有向边的指向情况,确定每个虚拟角色相对亲密好友的排行榜,基于排行榜,对游戏互动过程进行完善,或者,基于排行榜,提示玩家进行游戏互动等。
综上所述,基于目标有向带权图中有向边的指向关系,确定每个数据节点对应的出度数和入度数,基于目标有向带权图对应的数据节点,在预设度数范围内,从目标有向带权图中确定数据节点之间关联度最大的目标子图。通过上述方法,可以借助目标有向带权图中有向边的权重和方向,在保持数据节点不变的基础上,对目标有向带权图进行更细致地分析,也有利于借助有向边的权重,确定全局范围内关联度相对较高的情况,从而避免仅对部分数据节点进行分析时的局限性,使得目标子图的全局关联度更强。
在本申请实施例中,将上述数据处理方法应用于游戏应用场景中。基于至少两个虚拟角色以及至少两个虚拟角色之间的亲密度关系,建立角色关系图,基于有向边的指向关系,确定至少两个虚拟角色分别对应的入度数与出度数,以入度数和出度数确定与任意一个虚拟角色相关联的其他虚拟角色,以及其他虚拟角色与该虚拟角色之间的关联方向和亲密程度等信息。在预设度数范围内,从角色关系图中提取得到目标关系图,通过目标关系图,确定不同虚拟角色之间的亲密度分析结果,例如:亲密度排行榜等。通过上述方法,可以对不同玩家之间的亲密度关系进行更全局性地分析,进而更均衡有效地为玩家推荐适合与之游戏的其他玩家,增加玩家在游戏中的互动性,提高游戏的趣味性。
在一个可选的实施例中,将上述数据处理方法应用于一款卡牌游戏场景中,示意性的,如图8所示,对卡牌游戏中数据分析过程进行说明,分析过程包括如下步骤810至步骤840。
步骤810,计算玩家数据项。
可选地,基于玩家游戏数据量,计算每个玩家在游戏中一段时间内的亲密度值和具有的每种卡牌的数据等,并将计算得到的数据作为每个用户的基础数据。
示意性的,如图9所示,计算A玩家的数据项、B玩家的数据项、C玩家的数据项以及D玩家的数据项等。
步骤820,生成卡池。
示意性的,以A玩家为例进行分析,如图9所示,卡池包括个人自抽卡池910以及赠送卡池920。其中,个人自抽卡池910是根据A玩家的个人数据得到的多个卡牌的集合,个人数据包括如下至少一种:(1)玩家段位;(2)玩家比赛战绩;(3)玩家比赛次数等。可选地,个人自抽卡池910中包括个人人设卡,个人隐私卡以及好友关系卡。
可选地,赠送卡池920是基于上述数据处理方法得到的,其中,将玩家作为角色关系图的节点,将不同玩家之间的亲密度作为边,生成整体的角色关系图,进而在限定每个玩家的出度数与入度数的前提下,得到全局权值最大的目标关系图,进而得到每个玩家的亲密度排行榜,实现以全局最优的角度构建每个人的相对最佳好友。
步骤830,判断卡牌是否可以转化为好友的赠送卡。
示意性的,赠送卡的本质为好友的个人人设卡以及好友关系卡,也即:个人人设卡以及好友关系卡可以转化为赠送卡,并赠送至好友。
示意性的,向每个玩家显示其对应的亲密度排行榜,由玩家自行选择是否向好友赠送卡牌;或者,由***根据每个玩家对应的亲密度排行榜,向亲密度排行榜中的部分或全部好友发送赠送卡牌。
可选地,判断赠送卡牌的方式包括:个人人设卡以及好友关系卡的数量是否符合赠送条件;被赠送的好友是否为亲密度排行榜中的好友等。
步骤840,放入玩家卡牌池。
可选地,如图9所示,在判断卡牌可以转化为好友赠送卡的条件下,按照关系链条件以及预设比例,将赠送卡放入其选择的玩家的赠送卡池中,如,放入B玩家、C玩家或者D玩家的赠送卡池中;或者,放入B玩家、C玩家以及D玩家的赠送卡池中等。
步骤850,判断个人卡牌数量。
示意性的,在将个人人设卡以及好友关系卡中的部分卡牌转化为赠送卡牌并放入被赠送好友的赠送卡牌池后,判断个人卡的数量。当个人卡的数量小于下限时,需要补充大盘卡至下限,使得个人卡的数量达到下限(如图9所示,M张为下限);当个人卡的数量大于下限时,从个人卡中随机选取小于上限数量的卡牌,或者,基于卡牌的顺序,从个人卡中随机选取小于上限数量的卡牌(如图9所示,N张为上限或者小于上限的数值)等,实现在保证个人卡充足且不会超过上限的前提下,通过上述数据处理方法,给出最佳好友推荐,使得在A玩家赠送给B玩家卡牌的基础上,B玩家回赠的概率更大,以达到全局最大互动率和转赠率的效果。
在一个可选的实施例中,如图9所示,A玩家的赠送卡池中包括B玩家、C玩家、D玩家等多个玩家的人设卡和关系卡。示意性的,以周期性检查的方式,对A玩家赠送卡池中的卡牌数量进行检查;或者,以实时检查的方式,对A玩家赠送卡池中的卡牌数量进行检查等。当A玩家赠送卡池中的卡牌数量超过上限后,基于亲密度关系对A玩家赠送卡池中的卡牌进行筛选,例如:对亲密度高的玩家的赠送卡牌进行保留,对亲密度较低的玩家的赠送卡牌进行过滤等。可选地,当A玩家不存在关系链时,赠送卡池中的卡牌数量可以为0,例如:A玩家不存在游戏好友。
可选地,卡牌游戏为一款独立游戏,或者,卡牌游戏为一款大型游戏中的小游戏板块。示意性的,如图10所示,为一款内置卡牌游戏的游戏界面图,玩家可以通过触发游戏界面上的“XX签”控件1010,进入卡牌游戏。示意性的,在玩家第一次进入卡牌游戏时,播放开场视频,并在开场视频播放完毕后,自动关闭。
可选地,在进入卡牌游戏后,显示如图11所示的界面,玩家可以通过触发界面上的“抽签”控件1110进入如图12所示的抽卡界面,在抽卡界面中,镜头向前推进,玩家既可以点击左上角的返回控件1210返回到如图11所示的抽卡活动主页面,也可以对抽卡界面上的鼓进行敲击,实现对虚拟模型1220(如图12所示的虎神像)进行充能的过程,待到能量快充满时,虚拟模型1220手中的卡牌抖动。
示意性的,在玩家敲击鼓面时,界面中显示敲击和飞入特效。例如:在玩家敲击鼓面时,鼓面上发出亮光,或者,界面上显示有“音符”特效等;示意性的,界面上显示的“音符”特效向虚拟模型1220飞去,用于指示对虚拟模型1220进行充能的过程。示意性的,在敲击过程中,“音符”特效向虚拟模型1220飞去的同时,虚拟模型1220变得越来越亮,并在到达最亮时呈现动效反馈,从虚拟模型1220的手中显示为呼之欲出的摇动,最后从虚拟模型1220的手中飞离,如图13所示,虚拟模型手中的卡牌1310飞向界面的中央位置。
示意性的,在玩家敲击鼓面时,界面中反馈相应的音效,例如:游戏对应的终端发出敲击鼓面的声音,或者,游戏对应的终端产生敲击对应的震动等。可选地,对不同的鼓敲击可以产生不同的音效,如图14所示,为一架组合鼓,其中,不同的鼓或者鼓的位置对应不同的音效。例如,该架组合鼓包括6种音色,分别为3个小鼓1410、一个大鼓1420、一个鼓边1430以及一个锣1440。对该架组合鼓中任意一个鼓进行长按操作后,播放一段完整的音乐,如:对不同的鼓敲击后产生“喜庆”、“欢快”等符合场景氛围(如:新年场景、生日场景)的声音等;或者,同时长按不同的鼓,则播放两个乐器叠加的音乐等。示意性的,音乐时长与召唤卡牌的进度时长相同,例如:预先设置为6秒等。
可选地,在如图11所示的界面中,当对界面中的获取控件1120进行触发后,呈现为如图15所示获取途径界面,用于指示对卡牌的获取途径1510。例如:累计登录一天,可以领取对应数量的卡牌;分享给好友,可以获得对应数量的卡牌等。
在一个可选的实施例中,将上述数据处理方法称为“有权带向图中限定度的全局最大权子图匹配算法”(MWMG,Maximum Weight Match Graph of directed weightedgraph with limited degree),该算法属于图计算科学领域。示意性的,将该算法应用于卡牌赠送互动过程中,在限定一定数量互赠卡的要求下,可以提取出赠送率最高的目标子图。
示意性的,对该算法原理进行介绍。
首先,规定目标有向带权图为G,需要裁剪的每个节点的出度为m,入度为n,即:保证每个节点的出度数小于等于m,入度数小于等于n。节点之间的边具有方向和权重,权重可以是某个关键特征,例如:匹配次数、游戏时长、亲密度关系等。之后,在从目标有向带权图中确定全局权值最大的目标图时,保留目标有向带权图G中的每一个节点,对目标有向带权图G中的边进行裁剪,提取玩家关系相对亲密的N个好友,基于全局权值最大,确定全局的亲密度关系最大。
步骤1:将全部点集Vall构建两个节点集,分别为入度集Vin以及Vout,其中:
1.入度集Vin=Map(nid,n),id∈Vall
2.出度集Vout=Map(nid,m),id∈Vall
3.构造目标边集合E final=EmptyList[]。
步骤2:将所有边从大到小遍历,令当前边ecur=<nin,nout>
If Vin[nin]>0 and Vout[nout]>0 【边界条件】
1. E final.append(ecur)
2. Vin[nin]-=1
3. Vout[nout]-=1。
其中,Vall代表表示整个目标有向带权图中所有数据节点的集合;Vin代表当前目标有向带权图中每条有向边的出发数据节点集合;Vout代表当前目标有向带权图中每条有向边的终点数据节点集合;nid代表当前数据节点的id;E finel代表通过本算法最终得到的在子图中需要保留的边的集合;Nin代表当前有向边的出发节点id;Nout代表当前边的终止节点id;ecur代表当前遍历到的边。
在一个可选的实施例中,将获取得到的卡牌作为个人卡牌,基于个人卡牌,采用上述的有权带向图中限定度的全局最大权子图匹配算法,确定玩家的亲密度排行榜,计算出全局最优的赠送方案,从而在玩家赠送卡牌的过程中,为玩家提供互动建议,尽可能地使得玩家在将卡牌赠送至其他好友后,可以得到其他好友的回赠卡牌,提高游戏的互动效率,提升全局的赠送比例。
综上所述,基于目标有向带权图中有向边的指向关系,确定每个数据节点对应的出度数和入度数,基于目标有向带权图对应的数据节点,在预设度数范围内,从目标有向带权图中确定数据节点之间关联度最大的目标子图。通过上述方法,可以借助目标有向带权图中有向边的权重和方向,在保持数据节点不变的基础上,对目标有向带权图进行更细致地分析,也有利于借助有向边的权重,确定全局范围内玩家之间的亲密度关系相对较高的亲密度排行榜,为玩家推荐可能会有回赠卡牌的其他游戏玩家,从而提高卡牌之间的互赠概率,增加玩家在游戏中的互动性,增强游戏的趣味性。
图16是本申请一个示例性实施例提供的数据处理装置的结构框图,如图16所示,该装置包括如下部分:
获取模块1610,用于获取目标有向带权图,所述目标有向带权图中包括至少两个数据节点,所述至少两个数据节点之间包括带权重的有向边,所述权重用于指示所述至少两个数据节点之间的有向关联度;
度数确定模块1620,用于基于所述有向边在所述至少两个数据节点之间的指向关系,确定所述至少两个数据节点分别对应的出度数和入度数;所述入度数表示指向所述数据节点的有向边的数量,所述出度数表示从所述数据节点指出的有向边的数量;
提取模块1630,用于以所述至少两个数据节点为基础,在预设度数的范围内提取所述有向带权图中的目标子图;
关联度确定模块1640,用于基于所述目标子图中的有向边分布情况,确定所述至少两个数据节点之间的数据关联度。
如图17所示,在一个可选的实施例中,所述提取模块1630包括:
子图确定单元1631,用于以所述至少两个数据节点为基础,在所述预设度数的范围内,确定所述目标有向带权图对应的至少一个子图;
权值确定单元1632,用于基于所述目标有向带权图中的有向边对应的权重,确定所述至少一个子图分别对应的全局权值;
目标子图确定单元1633,用于基于所述全局权值,从所述至少一个子图中确定目标子图。
在一个可选的实施例中,所述子图确定单元1631还用于在所述预设度数的范围内,对所述至少两个数据节点中每一个数据节点对应的有向边进行裁剪,得到所述至少一个子图对应的子图有向边;基于所述至少两个数据节点和所述子图有向边,得到所述目标有向带权图对应的所述至少一个子图。
在一个可选的实施例中,所述预设度数包括预设出度数和预设入度数;
所述子图确定单元1631还用于在所述预设出度数的范围内,对从所述数据节点指出的有向边进行裁剪;在所述预设入度数的范围内,对指向所述数据节点的有向边进行裁剪。
在一个可选的实施例中,所述权值确定单元1632还用于基于所述目标有向带权图中的有向边对应的权重,确定所述子图有向边对应的权重;对第i个子图中子图有向边对应的权重进行求和,确定所述第i个子图对应的全局权值,其中,i为正整数。
在一个可选的实施例中,所述关联度确定模块1640还用于对所述目标子图中每一个数据节点对应的目标子图有向边的权值进行排序,确定权值序列;基于所述权值序列的排序情况,确定所述至少两个数据节点之间的数据关联度。
在一个可选的实施例中,所述获取模块1610还用于获取参与关联度分析的至少两个数据节点;基于所述至少两个数据节点之间的关联度关系,确定所述至少两个数据节点分别对应的有向边;以所述至少两个数据节点和所述有向边为基础,构建所述目标有向带权图。
在一个可选的实施例中,所述目标子图确定单元1633还用于从所述全局权值中,确定符合预设标准的目标全局权值;将所述目标全局权值对应的子图确定为所述目标子图。
在一个可选的实施例中,所述目标子图确定单元1633还用于将所述全局权值中的最大权值作为所述目标全局权值。
在一个可选的实施例中,所述目标子图确定单元1633还用于将所述目标全局权值对应的至少一个子图构成候选子图集合;从所述候选子图集合中,确定所述目标子图。
在一个可选的实施例中,所述目标子图确定单元1633还用于从所述候选子图集合中,随机选择一个所述候选子图,作为所述目标子图。
图18是本申请另一个示例性实施例提供的数据处理装置的结构框图,如图18所示,该装置包括如下部分:
构建模块1810,用于构建角色关系图,所述角色关系图中以至少两个虚拟角色为节点,所述节点之间包括带权重的有向边,所述权重用于指示所述至少两个虚拟角色之间有向的亲密度强度关系;
度数确定模块1820,用于基于所述有向边在所述至少两个虚拟角色之间的指向关系,确定所述至少两个虚拟角色分别对应的入度数和出度数,所述入度数表示指向所述虚拟角色的有向边数量,所述出度数表示从所述虚拟角色指出的有向边数量;
提取模块1830,用于以所述至少两个虚拟角色为基础,在预设度数的范围内提取所述角色关系图中的目标关系图;
结果分析模块1840,用于基于所述角色关系图中的有向边分布情况,确定所述至少两个虚拟角色之间的亲密度分析结果。
综上所述,基于目标有向带权图中有向边的指向关系,确定每个数据节点对应的出度数和入度数,基于目标有向带权图对应的数据节点,在预设度数范围内,从目标有向带权图中确定数据节点之间关联度最大的目标子图。通过上述装置,可以借助目标有向带权图中有向边的权重和方向,在保持数据节点不变的基础上,对目标有向带权图进行更细致地分析。同时,预设度数包括预设出度数以及预设入度数,在预设度数的范围内对目标有向带权图进行分析,也有利于实现对每一个数据节点进行分析的过程。基于有向边确定目标子图,也有利于借助有向边的权重,确定全局范围内关联度相对较高的情况,从而避免仅对部分数据节点进行分析时的局限性,使得目标子图的全局关联度更强,进而更好地确定目标有向带权图中数据节点之间的数据关联度,提高数据转化率以及互动比例。
需要说明的是:上述实施例提供的数据处理装置,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的数据处理装置与数据处理方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
图19示出了本申请一个示例性实施例提供的服务器的结构示意图。该服务器1900包括中央处理单元(Central Processing Unit,CPU)1901、包括随机存取存储器(RandomAccess Memory,RAM)1902和只读存储器(Read Only Memory,ROM)1903的***存储器1904,以及连接***存储器1904和中央处理单元1901的***总线1905。服务器1900还包括用于存储操作***1913、应用程序1914和其他程序模块1915的大容量存储设备1906。
大容量存储设备1906通过连接到***总线1905的大容量存储控制器(未示出)连接到中央处理单元1901。大容量存储设备1906及其相关联的计算机可读介质为服务器1900提供非易失性存储。也就是说,大容量存储设备1906可以包括诸如硬盘或者紧凑型光盘只读存储器(Compact Disc Read Only Memory,CD-ROM)驱动器之类的计算机可读介质(未示出)。
不失一般性,计算机可读介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括RAM、ROM、可擦除可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、带电可擦可编程只读存储器(Electrically Erasable Programmable Read Only Memory,EEPROM)、闪存或其他固态存储技术,CD-ROM、数字通用光盘(Digital Versatile Disc,DVD)或其他光学存储、磁带盒、磁带、磁盘存储或其他磁性存储设备。当然,本领域技术人员可知计算机存储介质不局限于上述几种。上述的***存储器1904和大容量存储设备1906可以统称为存储器。
根据本申请的各种实施例,服务器1900还可以通过诸如因特网等网络连接到网络上的远程计算机运行。也即服务器1900可以通过连接在***总线1905上的网络接口单元1911连接到网络1912,或者说,也可以使用网络接口单元1911来连接到其他类型的网络或远程计算机***(未示出)。
上述存储器还包括一个或者一个以上的程序,一个或者一个以上程序存储于存储器中,被配置由CPU执行。
本申请的实施例还提供了一种计算机设备,该计算机设备包括处理器和存储器,该存储器中存储有至少一条指令、至少一段程序、代码集或指令集,至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行以实现上述各方法实施例提供的数据处理方法。
本申请的实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有至少一条指令、至少一段程序、代码集或指令集,至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行,以实现上述各方法实施例提供的数据处理方法。
本申请的实施例还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述实施例中任一所述的数据处理方法。
可选地,该计算机可读存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、固态硬盘(SSD,Solid State Drives)或光盘等。其中,随机存取记忆体可以包括电阻式随机存取记忆体(ReRAM,Resistance RandomAccess Memory)和动态随机存取存储器(DRAM,Dynamic Random Access Memory)。上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本申请的可选实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (15)
1.一种数据处理方法,其特征在于,所述方法包括:
获取目标有向带权图,所述目标有向带权图中包括至少两个数据节点,所述至少两个数据节点之间包括带权重的有向边,所述权重用于指示所述至少两个数据节点之间的有向关联度;
基于所述有向边在所述至少两个数据节点之间的指向关系,确定所述至少两个数据节点分别对应的出度数和入度数;所述入度数表示指向所述数据节点的有向边的数量,所述出度数表示从所述数据节点指出的有向边的数量;
以所述至少两个数据节点为基础,对所述有向边对应的权重进行排序,在预设度数的范围内保留权重最大的符合所述预设度数的有向边,并对其他有向边进行裁剪,确定至少一个子图;
基于所述目标有向带权图中的有向边对应的权重,确定所述至少一个子图分别对应的全局权值,并基于所述全局权值,从所述至少一个子图中确定目标子图;
基于所述目标子图中的有向边分布情况,确定所述至少两个数据节点之间的数据关联度。
2.根据权利要求1所述的方法,其特征在于,所述在预设度数的范围内保留权重最大的符合所述预设度数的有向边,并对其他有向边进行裁剪,确定至少一个子图,包括:
在所述预设度数的范围内,保留所述至少两个数据节点中每一个数据节点对应的权重最大的符合所述预设度数的有向边,并对其他有向边进行裁剪,得到所述至少一个子图对应的子图有向边;
基于所述至少两个数据节点和所述子图有向边,得到所述目标有向带权图对应的所述至少一个子图。
3.根据权利要求2所述的方法,其特征在于,所述预设度数包括预设出度数和预设入度数;
所述对其他有向边进行裁剪,包括:
对从所述数据节点指出的有向边进行裁剪;
对指向所述数据节点的有向边进行裁剪。
4.根据权利要求1所述的方法,其特征在于,所述基于所述目标有向带权图中的有向边对应的权重,确定所述至少一个子图分别对应的全局权值,包括:
基于所述目标有向带权图中的有向边对应的权重,确定所述子图有向边对应的权重;
对第i个子图中子图有向边对应的权重进行求和,确定所述第i个子图对应的全局权值,其中,i为正整数。
5.根据权利要求4所述的方法,其特征在于,所述基于所述目标子图中的有向边分布情况,确定所述至少两个数据节点之间的数据关联度,包括:
对所述目标子图中每一个数据节点对应的目标子图有向边的权值进行排序,确定权值序列;
基于所述权值序列的排序情况,确定所述至少两个数据节点之间的数据关联度。
6.根据权利要求1至5任一所述的方法,其特征在于,所述获取目标有向带权图,包括:
获取参与关联度分析的至少两个数据节点;
基于所述至少两个数据节点之间的关联度关系,确定所述至少两个数据节点分别对应的有向边;
以所述至少两个数据节点和所述有向边为基础,构建所述目标有向带权图。
7.根据权利要求1至5任一所述的方法,其特征在于,所述基于所述全局权值,从所述至少一个子图中确定目标子图,包括:
从所述全局权值中,确定符合预设标准的目标全局权值;
将所述目标全局权值对应的子图确定为所述目标子图。
8.根据权利要求7所述的方法,其特征在于,所述从所述全局权值中,确定符合预设标准的目标全局权值,包括:
将所述全局权值中的最大权值作为所述目标全局权值。
9.根据权利要求7所述的方法,其特征在于,所述将所述目标全局权值对应的子图确定为所述目标子图,包括:
将所述目标全局权值对应的至少一个子图构成候选子图集合;
从所述候选子图集合中,确定所述目标子图。
10.根据权利要求9所述的方法,其特征在于,所述从所述候选子图集合中,确定所述目标子图,包括:
从所述候选子图集合中,随机选择一个所述候选子图,作为所述目标子图。
11.一种数据处理方法,其特征在于,所述方法包括:
构建角色关系图,所述角色关系图中以至少两个虚拟角色为节点,所述节点之间包括带权重的有向边,所述权重用于指示所述至少两个虚拟角色之间有向的亲密度强度关系;
基于所述有向边在所述至少两个虚拟角色之间的指向关系,确定所述至少两个虚拟角色分别对应的入度数和出度数,所述入度数表示指向所述虚拟角色的有向边数量,所述出度数表示从所述虚拟角色指出的有向边数量;
以所述至少两个虚拟角色为基础,对所述有向边对应的权重进行排序,在预设度数的范围内保留权重最大的符合所述预设度数的有向边,并对其他有向边进行裁剪,确定至少一个子图;
基于所述角色关系图中的有向边对应的权重,确定所述至少一个子图分别对应的全局权值,并基于所述全局权值,从所述至少一个子图中确定目标关系图;
基于所述角色关系图中的有向边分布情况,确定所述至少两个虚拟角色之间的亲密度分析结果。
12.一种数据处理装置,其特征在于,所述装置包括:
获取模块,用于获取目标有向带权图,所述目标有向带权图中包括至少两个数据节点,所述至少两个数据节点之间包括带权重的有向边,所述权重用于指示所述至少两个数据节点之间的有向关联度;
度数确定模块,用于基于所述有向边在所述至少两个数据节点之间的指向关系,确定所述至少两个数据节点分别对应的出度数和入度数;所述入度数表示指向所述数据节点的有向边的数量,所述出度数表示从所述数据节点指出的有向边的数量;
提取模块,包括:
子图确定单元,用于以所述至少两个数据节点为基础,对所述有向边对应的权重进行排序,在预设度数的范围内保留权重最大的符合所述预设度数的有向边,并对其他有向边进行裁剪,确定至少一个子图;
权值确定单元,用于基于所述目标有向带权图中的有向边对应的权重,确定所述至少一个子图分别对应的全局权值;
目标子图确定单元,用于基于所述全局权值,从所述至少一个子图中确定目标子图;
关联度确定模块,用于基于所述目标子图中的有向边分布情况,确定所述至少两个数据节点之间的数据关联度。
13.一种数据处理装置,其特征在于,所述装置包括:
构建模块,用于构建角色关系图,所述角色关系图中以至少两个虚拟角色为节点,所述节点之间包括带权重的有向边,所述权重用于指示所述至少两个虚拟角色之间有向的亲密度强度关系;
度数确定模块,用于基于所述有向边在所述至少两个虚拟角色之间的指向关系,确定所述至少两个虚拟角色分别对应的入度数和出度数,所述入度数表示指向所述虚拟角色的有向边数量,所述出度数表示从所述虚拟角色指出的有向边数量;
提取模块,用于以所述至少两个虚拟角色为基础,对所述有向边对应的权重进行排序,在预设度数的范围内保留权重最大的符合所述预设度数的有向边,并对其他有向边进行裁剪,确定至少一个子图;基于所述角色关系图中的有向边对应的权重,确定所述至少一个子图分别对应的全局权值,并基于所述全局权值,从所述至少一个子图中确定目标关系图;
结果分析模块,用于基于所述角色关系图中的有向边分布情况,确定所述至少两个虚拟角色之间的亲密度分析结果。
14.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如权利要求1至11任一所述的数据处理方法。
15.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如权利要求1至11任一所述的数据处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210119110.4A CN114168805B (zh) | 2022-02-08 | 2022-02-08 | 数据处理方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210119110.4A CN114168805B (zh) | 2022-02-08 | 2022-02-08 | 数据处理方法、装置、设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114168805A CN114168805A (zh) | 2022-03-11 |
CN114168805B true CN114168805B (zh) | 2022-05-20 |
Family
ID=80489508
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210119110.4A Active CN114168805B (zh) | 2022-02-08 | 2022-02-08 | 数据处理方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114168805B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107193896A (zh) * | 2017-05-09 | 2017-09-22 | 华中科技大学 | 一种基于簇的图数据划分方法 |
WO2018149292A1 (zh) * | 2017-02-14 | 2018-08-23 | 腾讯科技(深圳)有限公司 | 一种对象聚类方法和装置 |
CN112990987A (zh) * | 2021-05-11 | 2021-06-18 | 腾讯科技(深圳)有限公司 | 信息推广方法、装置、电子设备及存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11227190B1 (en) * | 2021-06-29 | 2022-01-18 | Alipay (Hangzhou) Information Technology Co., Ltd. | Graph neural network training methods and systems |
-
2022
- 2022-02-08 CN CN202210119110.4A patent/CN114168805B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018149292A1 (zh) * | 2017-02-14 | 2018-08-23 | 腾讯科技(深圳)有限公司 | 一种对象聚类方法和装置 |
CN107193896A (zh) * | 2017-05-09 | 2017-09-22 | 华中科技大学 | 一种基于簇的图数据划分方法 |
CN112990987A (zh) * | 2021-05-11 | 2021-06-18 | 腾讯科技(深圳)有限公司 | 信息推广方法、装置、电子设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
加权有向网络中心节点识别的分解算法研究;刘臣 等;《计算机应用研究》;20190131;第36卷(第1期);第37-40页 * |
Also Published As
Publication number | Publication date |
---|---|
CN114168805A (zh) | 2022-03-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108184144B (zh) | 一种直播方法、装置、存储介质及电子设备 | |
US11803564B2 (en) | Method and system for keyword search using messaging service | |
KR102489339B1 (ko) | 위치 데이터가 포함된 컨텐츠를 이용한 추천 방법 및 그 시스템 | |
JP7273100B2 (ja) | ゲームコミュニケーションの写しからのテキストタグの生成 | |
CN110061908A (zh) | 应用程序推荐、装置、电子设备及介质 | |
WO2018196553A1 (zh) | 标识的获取方法及装置、存储介质以及电子装置 | |
CN109729377B (zh) | 一种主播信息的推送方法、装置、计算机设备和存储介质 | |
CN113779381B (zh) | 资源推荐方法、装置、电子设备和存储介质 | |
US20190089765A1 (en) | Computer system for network node review for actionable item | |
US9058090B1 (en) | Collaborative information sharing in a virtual world | |
KR20200096935A (ko) | 다중 프로필을 제공하는 방법 및 시스템 | |
KR101929649B1 (ko) | 채팅로그 키워드 추출을 통한 관심사 관련 오픈 채팅방 추천 시스템 및 방법 | |
CN113742580B (zh) | 目标类型数据的召回方法、装置、电子设备及存储介质 | |
CN111144936A (zh) | 基于用户标签的相似人群扩展方法及装置 | |
CN111767473B (zh) | 一种对象选取方法及计算机可读存储介质 | |
CN105099727B (zh) | 添加群组成员的方法及装置 | |
CN110188123A (zh) | 用户匹配方法及设备 | |
CN114168805B (zh) | 数据处理方法、装置、设备及介质 | |
KR101383695B1 (ko) | 자동 게임방 생성 방법 및 장치 | |
JP2022087835A (ja) | コミュニティ分類方法、コンピュータプログラム、およびコンピュータ装置 | |
CN114418120A (zh) | 联邦树模型的数据处理方法、装置、设备及存储介质 | |
CN116150470A (zh) | 内容推荐方法、装置、设备、存储介质及程序产品 | |
TW202219880A (zh) | 使用聊天機器人推薦內容的方法及系統 | |
CN110215704A (zh) | 游戏开启方法、装置、电子设备及存储介质 | |
CN112396151A (zh) | 谣言事件的分析方法、装置、设备及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |