CN115134247A

CN115134247A - 节点识别方法、装置、电子设备及计算机可读存储介质

Info

Publication number: CN115134247A
Application number: CN202210379035.5A
Authority: CN
Inventors: 荣钰; 马凯丽; 李蓝青
Original assignee: Shenzhen Tencent Computer Systems Co Ltd
Current assignee: Shenzhen Tencent Computer Systems Co Ltd
Priority date: 2022-04-12
Filing date: 2022-04-12
Publication date: 2022-09-30
Anticipated expiration: 2042-04-12
Also published as: CN115134247B

Abstract

本申请实施例公开了一种节点识别方法、装置、电子设备及计算机可读存储介质，该方法包括：获取待测网络中节点间的连接关系；根据连接关系确定待测网络中每个节点的节点影响参数，节点影响参数用于表征移除节点对待测网络的网络结构影响程度；根据每个节点的节点影响参数，从待测网络中选取网络结构影响程度达到预设程度的目标节点。其中，根据节点在移除后对网络结构的影响程度大小可筛选出网络的关键节点，即，影响程度越大，节点越关键，通过对网络关键节点的识别，便于对网络的分析和维护。

Description

节点识别方法、装置、电子设备及计算机可读存储介质

技术领域

本申请实施例涉及计算机技术领域，具体涉及一种节点识别方法、装置、电子设备及计算机可读存储介质。

背景技术

随着计算机技术的快速发展，网络中节点的数量或者节点间连接关系的增多使得网络的复杂度也在不断提升，识别出网络中的关键节点对网络的理解、应用和维护具有重要意义。

目前，主要依赖各个节点与网络中最高维父节点的连接远近确定关键节点，但是，最高维父节点对网络的影响片面，因此，根据最高维父节点选取关键节点存在关键节点选取不准确的情况。

发明内容

本申请实施例提供一种节点识别方法、装置、电子设备及计算机可读存储介质，可以实现对网络结构影响较大的关键节点的选取。

第一方面，本申请实施例提供了一种节点识别方法，包括：

获取待测网络中节点间的连接关系；

根据所述连接关系确定所述待测网络中每个节点的节点影响参数，所述节点影响参数用于表征移除所述节点对所述待测网络的网络结构影响程度；

根据每个所述节点的节点影响参数，从所述待测网络中选取网络结构影响程度达到预设程度的目标节点。

第二方面，本申请实施例还提供了一种节点识别装置，包括：

获取模块，用于获取待测网络中节点间的连接关系；

确定模块，用于根据所述连接关系确定所述待测网络中每个节点的节点影响参数，所述节点影响参数用于表征移除所述节点对所述待测网络的网络结构影响程度；

选取模块，用于根据每个所述节点的节点影响参数，从所述待测网络中选取网络结构影响程度达到预设程度的目标节点。

其中，在本申请的一些实施例中，所述确定模块包括：

第一确定单元，用于根据所述连接关系确定所述待测网络中每个节点的连接关系特征；

第二确定单元，用于将每个所述节点的连接关系特征分别输入到已训练的节点参数模型，得到每个节点对应的节点影响参数。

其中，在本申请的一些实施例中，该装置还包括训练模块，训练模块包括：

获取单元，用于获取训练样本组，所述训练样本组包括样本网络、节点移除策略、网络状态变化量和奖励值，所述网络状态变化量为执行所述节点移除策略对应的动作后所述网络状态前后的变化量，所述奖励值在执行所述节点移除策略对应的动作后产生；

训练单元，用于根据所述训练样本组中的样本网络、节点移除策略、网络状态变化量和奖励值对预设节点参数模型进行训练，直至满足预设停止条件，得到已训练的节点参数模型。

其中，在本申请的一些实施例中，获取单元包括：

获取子单元，用于获取与所述待测网络的网络类型相同的样本网络；

第一确定子单元，用于确定所述样本网络中每个节点在移除时所述样本网络对应的节点减少数量；

第二确定子单元，用于根据所述样本网络中每个节点对应的节点减少数量，从所述样本网络中确定待移除节点；

生成子单元，用于根据所述待移除节点生成节点移除策略；

第三确定子单元，用于将移除所述待移除节点后所述样本网络的变化量作为所述节点移除策略在执行后的网络状态变化量；

第四确定子单元，用于根据所述待移除节点在移除时对应的节点减少数量确定所述节点移除策略对应的奖励值；

生成子单元，用于根据所述样本网络、所述节点移除策略、所述网络状态变化量和所述奖励值，得到训练样本组。

其中，在本申请的一些实施例中，待移除节点包括两个，第二确定子单元具体用于：

从所述样本网络中选取节点减少数量满足第一预设条件的一个节点，将所述节点作为第一参考节点；

从所述样本网络中移除所述第一参考节点，得到所述样本网络对应的样本子网络；

从所述样本子网络中选取节点减少数量满足所述第一预设条件的一个节点，将所述节点作为第二参考节点；

将所述第一参考节点和所述第二参考节点分别作为待移除节点。

从所述样本网络中选取节点减少数量满足第二预设条件的至少两个节点，将至少两个所述节点分别作为第一参考节点；

针对每个所述第一参考节点，从所述样本网络中移除所述第一参考节点，得到所述样本网络对应的样本子网络，并根据所述样本子网络和所述第一参考节点构建网络树分支组；

针对每个样本子网络，从所述样本子网络中选取节点减少数量满足所述第二预设条件的至少两个节点，将至少两个所述节点作为第二参考节点；

针对每个网络树分支组，将所述网络树分支组中第一参考节点与每个第二参考节点分别建立节点组，并统计每个节点组中第一参考节点对应的节点减少数量与第二参考节点对应的节点减少数量的和，得到每个节点组对应的节点减少数量和；

根据所有网络树分支组分别对应的至少两个节点减少数量和，筛选出节点减少数量和满足第三预设要求的目标节点减少数量和；

将所述目标节点减少数量和对应的节点组中的第一参考节点和第二参考节点分别作为待移除节点。

其中，在本申请的一些实施例中，第三确定子单元具体用于：

将移除所述第一参考节点后所述样本网络的变化量，作为所述第一参考节点对应的节点移除策略在执行后的网络状态变化量，并将移除所述第二参考节点后所述样本子网络的变化量，作为所述第二参考节点对应的节点移除策略在执行后的网络状态变化量；

第四确定子单元具体用于：

计算所述第一参考节点对应的节点减少数量与所述第二参考节点对应的节点减少数量的和，得到节点累计减少数量；

将所述节点累计减少数量作为所述第一参考节点对应的节点移除策略的奖励值，并将所述第二参考节点对应的节点减少数量作为所述第二参考节点对应的节点移除策略的奖励值；

生成子单元具体用于：

根据所述样本网络、所述第一参考节点对应的节点移除策略、所述第一参考节点对应的节点移除策略在执行后的网络状态变化量、所述第一参考节点对应的节点移除策略在执行后的奖励值，以及，所述样本子网络、所述第二参考节点对应的节点移除策略、所述第二参考节点对应的节点移除策略在执行后的网络状态变化量、所述第二参考节点对应的节点移除策略在执行后的奖励值，得到训练样本组。

其中，在本申请的一些实施例中，训练单元包括：

第五确定子单元，用于确定所述预设节点参数模型在训练时的第一个训练样本组以及当前训练样本组；

第一选取子单元，用于根据所述第一个训练样本组的表征信息、所述前训练样本组的表征信息以及所述当前训练样本组对应的节点移除策略的表征信息从所述训练样本组中选取下一时刻的待执行训练样本组；

训练子单元，用于根据所述待执行训练样本组中的样本网络、节点移除策略、网络状态变化量和奖励值对所述预设节点参数模型进行训练，直至满足预设停止条件，得到已训练的节点参数模型。

其中，在本申请的一些实施例中，训练样本组包括第一样本组和第二样本组，所述第二样本组的数据质量高于所述第一样本组的数据质量，训练单元包括：

根据第一样本组中的样本网络、节点移除策略、网络状态变化量和奖励值对预设节点参数模型进行训练；

根据第一样本组和第二样本组中的样本网络、节点移除策略、网络状态变化量和奖励值对预设节点参数模型进行训练；

根据第二样本组中的样本网络、节点移除策略、网络状态变化量和奖励值对预设节点参数模型进行训练，直至满足预设停止条件，得到已训练的节点参数模型。

其中，在本申请的一些实施例中，该装置还包括第二目标节点选取单元，第二目标节点选取单元包括：

移除子单元，用于从所述待测网络中移除所述目标节点，得到所述待测网络对应的待测子网络；

第二选取子单元，用于根据所述待测子网络中每个节点的节点影响参数，从所述待测子网络中选取网络结构影响程度达到预设程度的第二目标节点。

第三方面，本申请实施例还提供了一种电子设备，电子设备包括存储器、处理器及存储在存储器中并可在处理器上运行的计算机程序，处理器执行计算机程序时实现上述的节点识别方法中的步骤。

第四方面，本申请实施例还提供了一种计算机可读存储介质，计算机可读存储介质上存储有计算机程序，计算机程序被处理器执行时实现上述的节点识别方法中的步骤。

其中，本申请实施例通过待测网络中节点间的连接关系，确定待测网络中每个节点的节点影响参数，根据节点影响参数表征的节点移除对网络结构的影响程度，筛选出对待测网络结构影响程度较大的目标节点，实现对网络关键节点的识别。其中，由于节点的连接关系反映了网络中与该节点建立连接的节点数量，而与该节点连接的节点数量越多，则说明该节点构成的连接关系占网络结构中的比重越高，即该节点对网络结构的影响越大，而当与其他节点连接数量较多的节点从网络结构中移除时，则对该网络结构的影响较大，因此，在本申请实施例中，可以通过移除节点后对网络结构的影响程度来筛选关键节点。而从对网络结构的整体影响程度选取关键节点，使得关键节点在选取时考虑的因素更全面，关键节点的选取更准确。

附图说明

为了更清楚地说明本申请中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的节点识别方法的场景示意图；

图2是本申请实施例提供的节点识别方法的流程示意图；

图3是本申请实施例提供的网络结构示意图；

图4是本申请实施例提供的训练样本组的数据结构示意图；

图5是本申请实施例提供的社交网络中关键对象识别方法的流程示意图；

图6是本申请实施例提供的社交网络中关键对象识别方法中模型训练的进度示意图；

图7是本申请实施例提供的节点识别装置的结构示意图；

图8是本申请实施例提供的电子设备的结构示意图。

具体实施方式

下面将结合本申请中的附图，对本申请中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本申请实施例提供一种节点识别方法、装置、电子设备及计算机可读存储介质。具体地，本申请实施例提供适用于电子设备的节点识别装置，其中，电子设备包括终端或者服务器等设备，其中，终端可以为计算机、个人计算机或者手机等设备，服务器可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式***，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(CDN，Content Delivery Network)、以及大数据和人工智能平台等基础云计算服务的云服务器，服务器可以通过有线或无线通信方式进行直接或间接地连接。

本申请实施例可以单独由终端设备执行节点识别方法，或者可以单独有服务器执行节点识别方法，或者由终端和服务器共同执行节点识别方法，请参阅图1，以终端设备和服务器共同执行节点识别方法为例，其中，节点识别方法的具体执行过程如下：

终端设备10获取到待测网络中节点间的连接关系，将待测网络中节点间的连接关系发送给服务器11，由服务器11对节点间的连接关系进行运算处理和分析。

服务器11在接收到终端设备10发送过来的待测网络中节点间的连接关系后，根据节点间的连接关系确定待测网络中每个节点的节点影响参数，根据节点影响参数选取目标节点，并将目标节点的节点信息返回给终端设备10。

终端设备10在接收到服务器11返回的目标节点的节点信息后，将目标节点的节点信息展示在终端设备10的可视界面中，便于通过终端设备10的可视界面查看目标节点的节点信息。

其中，在本申请实施例中，节点影响参数用于表征移除节点对待测网络的网络结构影响程度。其中，通过移除后对网络结构影响程度选取目标节点，使得可以选取出在移除后对网络结构影响程度较大的目标节点，即，选取出待测网络中的关键节点，实现对待测网络关键节点的识别。

其中，在本申请实施例中，节点间的连接关系可以根据节点之间的连接情况来获取。

其中，在本申请实施例中，通过待测网络中节点间的连接关系，确定待测网络中每个节点的节点影响参数，根据节点影响参数表征的节点移除对网络结构的影响程度，筛选出对待测网络结构影响程度较大的目标节点，实现对网络关键节点的识别。其中，由于节点的连接关系反映了网络中与该节点建立连接的节点数量，而与该节点连接的节点数量越多，则说明该节点构成的连接关系占网络结构中的比重越高，即该节点对网络结构的影响越大，而当与其他节点连接数量较多的节点从网络结构中移除时，则对该网络结构的影响较大，因此，在本申请实施例中，可以通过移除节点后对网络结构的影响程度来筛选关键节点。而从对网络结构的整体影响程度选取关键节点，使得关键节点在选取时考虑的因素更全面，关键节点的选取更准确。

以下分别进行详细说明。需说明的是，以下实施例的描述顺序不作为对实施例优先顺序的限定。

请参阅图2，图2为本申请实施例提供的节点识别方法的流程示意图。该节点识别方法的具体流程可以如下：

101、获取待测网络中节点间的连接关系。

其中，在本申请实施例中，网络是由若干节点和连接这些节点的链路构成，表示诸多对象及其相互联系，把许多的网络节点用通信线路连接起来，形成一定的几何关系，这就是网络拓扑。其中，网络可以包括社交网络、身份关系网络、对象关联关系网络等等。

其中，节点是网络的组成元素，各个节点以及节点之间的链路构成网络，其中，节点可以包括工作站、基站或者个人计算机，比如，针对基站分布网络，基站分布网络中每个基站对应一个节点，每个基站之间的通信通道对应节点之间的链路，当两个基站之间存在通信关系，则两个基站对应的节点之间存在链路。其中，节点还可以包括客户或者对象，比如，针对社交网络，社交网络中每个对象或者成员对应一个节点，对象或者成员之间的关联关系对应节点之间的链路，当两个对象之间存在关联关系时，则两个对象对应的节点之间存在链路。

其中，在本申请实施例中，节点间的连接关系反映节点间的连接情况，连接关系用于表征节点之间是否建立连接、是否连通，即，节点之间是否存在链路。其中，在本申请实施例中，可以根据各个节点之间的连接情况，确定待测网络中节点间的连接关系。

102、根据所述连接关系确定所述待测网络中每个节点的节点影响参数，所述节点影响参数用于表征移除所述节点对所述待测网络的网络结构影响程度。

其中，在本申请实施例中，节点影响参数用于表征移除所述节点对所述待测网络的网络结构影响程度，其中，在本申请实施例中，节点影响参数可以包括具体的数值或者反映影响程度的标量。即，各个节点对应的节点影响参数不同，根据节点影响参数可以明确区分不同节点在移除后对待测网络的网络结构影响情况，以便于根据节点影响参数筛选出对网络结构影响较大的节点。

其中，在本申请实施例中，网络结构由若干节点和节点之间的链路构成，当网络中节点移除或者节点之间的链路断开时，则网络对应的网络结构发生变化，比如，当网络中节点移除数量较多时，或者节点间断开的链路较多时，网络的结构变化较大，同样的，当节点与网络中其他节点的链路越多时，该节点的移除使得网络中链路的数量减少越多，即，网络结构的变化越大，因此，可以根据节点的连接关系确定节点对网络结构的影响参数。

其中，在本申请实施例中，可以通过模拟原网络中每个节点的移除得到原网络对应的子网络，以及，根据移除后得到子网络与原网络的差异，得到每个节点的移除对网络结构的影响情况，根据原网络中节点的数量以及节点之间链路的数量与子网络中节点的数量和节点之间的链路确定每个节点移除对原网路结构的影响数据，但是，针对网络结构复杂，节点数量较多，且节点之间连接关系复杂的网络，通过模拟每个节点移除来获取每个节点对网络结构的影响情况存在关键节点识别效率较低、且操作复杂度较高的问题。

例如，请参阅图3，图3是本申请实施例提供的网络结构示意图，以k-core作为衡量关键节点的网络结构为例，假设我们对节点4和11进行重要性评估，当我们用有移除待评估节点导致的移除节点总量作为指标时，我们统计移除节点的原因时会遇到以下几种情况：1、单个节点移除导致的其他节点移除，如节点1，3，5，6的移除是由节点4移除导致的，节点14、15的移除是由节点11移除导致的；2、某些节点的移除可以独立地由多个节点中的一个节点移除导致，如节点2可以由节点4或者11被移除导致；3、某些节点的移除需要由多个节点移除共同导致，如节点12由节点4和11被移除导致。根据情况2，3我们发现，节点的重要性评估与节点集合中其他节点是耦合的，比如当评估节点4的重要性时需要考虑与其组成节点集合的节点集{11}，这导致我们在评估移除单个节点影响时忽略了可能的节点集共同的影响或者过度重视了一些导致重复移除其他节点的节点。因此，难以通过统计或者固定启发式的算法获取到网络中的关键节点。

因此，在本申请实施例中，可以通过机器学习模型对节点间的连接关系进行分析，以自回归的方法，预测得到每个节点对应的节点影响参数，即，可选的，在本申请的一些实施例中，步骤“根据所述连接关系确定所述待测网络中每个节点的节点影响参数”，包括：

根据所述连接关系确定所述待测网络中每个节点的连接关系特征；

将每个所述节点的连接关系特征分别输入到已训练的节点参数模型，得到每个节点对应的节点影响参数。

其中，在本申请实施例中，可以通过每个节点与其他节点的连接关系，得到每个节点的连接关系特征。其中，在本申请实施例中，可以通过特征提取算法或者模型对网络节点的连接关系特征进行提取，例如，通过图网络或图神经网络(Graph neural networks)根据网络图中节点之间的信息传递来捕捉图中的依赖关系。

其中，通过已训练的节点参数模型对节点连接关系特征的识别和分析，得到每个节点对应的节点影响参数，实现对节点对应的节点影响参数的快速获取。

其中，在本申请实施例中，节点参数模型是根据样本数据训练后得到的，通过对模型的训练，提升模型预测的准确性，即，可选的，在本申请的一些实施例中，步骤“将每个所述节点的连接关系特征分别输入到已训练的节点参数模型，得到每个节点对应的节点影响参数”之前，该方法还包括：

获取训练样本组，所述训练样本组包括样本网络、节点移除策略、网络状态变化量和奖励值，所述网络状态变化量为执行所述节点移除策略对应的动作后所述网络状态前后的变化量，所述奖励值在执行所述节点移除策略对应的动作后产生；

根据所述训练样本组中的样本网络、节点移除策略、网络状态变化量和奖励值对预设节点参数模型进行训练，直至满足预设停止条件，得到已训练的节点参数模型。

其中，在本申请实施例中，可以通过强化学习的方式对模型进行训练，即，通过提取样本数据中的动作策略、状态变化量、以及奖励值，对模型进行训练，其中，动作策略对应本申请实施例中样本数据中的节点移除策略，状态变化量对应节点移除策略执行后网络状态的变化量，奖励值在节点移除策略执行时对应产生。其中，在本申请实施例中，通过强化学习使得模型能够通过接收环境对动作的奖励(反馈)获得学习信息并更新模型参数。

其中，在本申请实施例中，通过模型预测的结果与样本数据的表现来计算交叉熵损失函数(CrossEntropy loss)，进而反馈到模型参数的调整。

其中，在本申请实施例中，训练样本组的数据可以通过对样本数据的提取来获取，即，可选的，在本申请的一些实施例中，步骤“获取训练样本组”，包括：

获取与所述待测网络的网络类型相同的样本网络；

确定所述样本网络中每个节点在移除时所述样本网络对应的节点减少数量；

根据所述样本网络中每个节点对应的节点减少数量，从所述样本网络中确定待移除节点；

根据所述待移除节点生成节点移除策略；

将移除所述待移除节点后所述样本网络的变化量作为所述节点移除策略在执行后的网络状态变化量；

根据所述待移除节点在移除时对应的节点减少数量确定所述节点移除策略对应的奖励值；

根据所述样本网络、所述节点移除策略、所述网络状态变化量和所述奖励值，得到训练样本组。

其中，根据待测网络的类型选取样本网络，使得选取的样本网络与待测网络的类型保持一致，而网络类型一致的情况下，可提升模型训练时样本数据的可靠性和可参考性。其中，在本申请实施例中，可以根据无标度网络生成模型(Barabási–Albert)随机产生无尺度网络，进而选取与待测网络类型相同的样本网络。

其中，在本申请实施例中，节点减少数量为样本网络中节点在移除后样本网络对应的节点减少的数量，该节点减少数量由待移除节点在移除后根据网络中节点减少数量统计得来，例如，当节点仅与待移除节点保持链路关系，而待移除节点的移除，使得该节点在网络中处于孤立状态，此时，可以将该节点作为待移除节点从网络中移除后，样本网络对应的减少节点，通过对各个减少节点的统计，得到待移除节点在移除网络中，样本网络的节点减少数量。

其中，在本申请实施例中，样本网络中每个节点对应的节点减少数量可以通过模拟样本网络中每个节点的移除来得到，例如，通过模拟样本网络中每个节点的移除，得到每个节点在移除后样本网络对应的子网络，根据样本网络与子网络的差异，得到每个节点在移除后，样本网络对应的节点减少数量。

其中，在本申请实施例中，节点移除时样本网络对应的节点减少数量反映了该节点对网络结构的重要情况和影响情况，因此，可以根据每个节点对应的节点减少数量，选取出对网络结构影响较大的节点来作为待移除节点，即，在根据节点减少数量选取对网络结构影响较大的待移除节点后，该待移除节点可以理解为样本网络对应的关键节点。

其中，在本申请实施例中，节点移除策略指移除节点的动作策略，其中，在本申请实施例中，针对待移除节点生成的节点移除策略，在执行后可实现对待移除节点的移除，即，通过根据待移除节点生成节点移除策略，使得在执行生成的节点移除策略后，能够执行对待移除节点的移除动作。其中，针对每个训练样本组中的节点移除策略，可以将该节点移除策略作为强化学习的动作策略对模型进行训练。

其中，由于选取的待移除节点对应的节点减少数量较大，即，选取的待移除节点对网络结构的影响较大，因此，当根据节点减少数量得到移除节点对应的奖励值时，可在一定程度上保证节点移除策略在执行后具备一个较大的奖励值。例如，在本申请实施例中，可以将每个节点对应的节点减少数量作为该节点在移除时对应的奖励值。

其中，通过将节点减少数量最大的节点(即样本网络的关键节点)作为待移除节点，并根据该待移除节点对应的动作策略以及动作策略在执行时的奖励值对模型进行强化学习训练，使得模型在训练过程中，能够学习样本数据中动作策略、奖励值以及关键节点之间的关系信息，例如，节点越关键，移除节点对应的奖励值越大，使得训练后的模型也能够预测和识别出待测网络中的关键节点，例如，当在已训练的节点参数模型中输入待测网络和较大的期望奖励值时，也能够根据每个节点在移除时的实际奖励值和输入的期望奖励值筛选出待测网络中的关键节点。其中，模型预测时的期望奖励值可以是一个数据较大的先验值。

其中，在本申请实施例中，样本网络对应的待移除节点可以包括多个，通过多个待移除节点，以及每个待移除节点对应的网络、网络状态变化量，节点移除策略和奖励值对模型的训练，可提升训练后模型预测的准确性，以下以待移除节点为两个为例，描述两个待移除节点的获取方法或者过程。即，可选的，在本申请的一些实施例中，步骤“根据所述样本网络中每个节点对应的节点减少数量，从所述样本网络中确定待移除节点”，包括：

其中，在本申请实施例中，第一预设条件包括当前网络中节点减少数量最大的条件，通过将样本网络中节点减少数量最大的节点作为第一参考节点，使得选取的第一参考节点能够满足属于样本网络中最关键的节点的需求。

其中，在样本网络移除第一参考节点，得到样本子网络后，通过将样本子网络中节点减少数量最大的节点作为第二参考节点，使得选取的第二参考节点能够满足属于样本子网络中最关键的节点的需求。

其中，在本申请实施例中，上述选取方式以贪心算法(greedy algorithm)为例，通过选取每一个网络状态对应的最好选择，实现局部最优解，克服了第二参考节点在选取时由第一参考节点带来的影响，符合对关键节点依次选取的需求，如，与模型每次输出一个最关键节点，并从剩余网络中选取次关键节点的期望相符合。

其中，在本申请实施例中，为了增加选取的多样性，在每个网络状态选取节点时，还可以根据随机概论选择节点的选取方法，例如，在本申请实施例中，可以根据各个节点对应的节点减少数量选取节点减少数量最大的节点作为待移除节点，也可以通过随机的方式选取节点作为待移除节点，针对上述两种方法，在每个网络状态选取待移除节点时，可以随机选取两个方法中的任一个来获取待移除节点。其中，该随机性增加了节点选取的多样性，在一定程度上丰富了模型训练的样本数据。

其中，在本申请实施例中，也可以在每个网络状态中选取两个或者多个关键节点，并根据每个关键节点对应的分支网络选取下一个网络状态中的关键节点，即，可选的，在本申请的一些实施例中，步骤“待移除节点包括两个，所述根据所述样本网络中每个节点对应的节点减少数量，从所述样本网络中确定待移除节点”，包括：

其中，在本申请实施例中，该每个网络状态选取多个节点的方法以束搜索(beamsearch)算法为例。其中，由于每一个网络状态中选取至少两个节点，相较于每一个网络状态中选取一个节点，提升了搜索和选取的空间，提升了所选取节点的多样性，同时，也避免每个网络状态选取一个时容易出现选错情况的发生，一定程度上保证了准确性。

其中，通过最终每个分组中节点减少数量和的比较，筛选出相对更优的结果，提升选取的准确性。

其中，在本申请实施例中，针对待移除节点是三个的需求，可以通过从样本子网络中移除第二参考节点，得到样本子网络对应的样本子子网络，从样本子子网络中根据每个节点的节点减少数量选取第三参考节点。其中，针对第三参考节点为单个的情况，可以直接将该第三参考节点作为待移除节点，针对第三参考节点为多个的情况，可以根据每个节点组对应的节点减少数量和来选取节点减少数量和最大的节点组作为待移除节点。

其中，在本申请实施例中，针对两个待移除节点的情况，每个节点在移除前后的网络状态变化量根据该节点移除前后网络状态的变化信息确定，即，可选的，在本申请的一些实施例中，步骤“将移除所述待移除节点后所述样本网络的变化量作为所述节点移除策略在执行后的网络状态变化量”，包括：

将移除所述第一参考节点后所述样本网络的变化量，作为所述第一参考节点对应的节点移除策略在执行后的网络状态变化量，并将移除所述第二参考节点后所述样本子网络的变化量，作为所述第二参考节点对应的节点移除策略在执行后的网络状态变化量。

其中，通过每个节点在移除前后网络状态信息的比较，可实现对每个节点在移除操作后网络状态变化量的获取，即，得到每个节点对应的节点移除策略在执行后的网络状态变化量。

其中，在本申请实施例中，由于是根据节点对应的节点减少数量选取节点，因此，在先选取的节点理论上节点减少数量要大于在后选取的节点的节点减少数量，例如，通过多个网络状态的节点的选取后，第一参考节点对应的节点减少数量要大于第二参考节点对应的节点减少数量。即，表现出节点减少数量越大，节点越关键的特点，因此，在本申请实施例中，可以将每个节点对应的节点减少数量作为该节点移除操作的奖励值，实现每个节点奖励值的获取，其中，由于每个节点的节点减少数量不同，关键节点的节点减少数量要高于次关键节点的节点减少数量，因此，也同样呈现出奖励值越大，节点越关键的特点。便于模型学习到该特点，将移除节点时奖励值最大的节点做为最关键节点。

其中，在本申请实施例中，在对模型训练过程中，可以通过最大化累计奖励值的方式来提升每个节点在移除时的奖励值，即，可选的，在本申请的一些实施例中，步骤“根据所述待移除节点在移除时对应的节点减少数量确定所述节点移除策略对应的奖励值”，包括：

将所述节点累计减少数量作为所述第一参考节点对应的节点移除策略的奖励值，并将所述第二参考节点对应的节点减少数量作为所述第二参考节点对应的节点移除策略的奖励值。

其中，通过将当前节点的奖励值上叠加当前节点对应的次关键节点以及次关键节点对应的次次关键节点的奖励值，实现对节点奖励值的累计，实现奖励值的最大化。例如，当关键节点为三个时，即第一参考节点、第二参考节点和第三参考节点时，可以将第一参考节点、第二参考节点和第三参考节点对应的节点减少数量的和作为第一参考节点的奖励值，将第二参考节点和第三参考节点对应的节点减少数量的和作为第二参考节点的奖励值，将第三参考节点对应的节点减少数量的和作为第三参考节点的奖励值。

其中，通过不同关键程度的节点对应的奖励值大小的分层设置，使得模型能够学习到奖励值大小与节点关键程度之间的关系，以及通过最大化累计奖励值，提升了关键节点对应的奖励值的大小，使得模型能够学习到奖励值越大，动作策略执行越恰当的特点，即，奖励值越大，关键节点移除、选取或者识别的动作的越准确。

其中，在本申请实施例中，针对待移除节点为多个(两个以上)的情况，可以将多个节点对应的网络、网络状态变化量、节点移除策略和奖励值进行合并，作为整体的训练样本组数据。其中，以待移除节点为两个为例，描述单个样本网络中两个待移除节点构建训练样本组的过程，即，可选的，在本申请的一些实施例中，步骤“根据所述样本网络、所述节点移除策略、所述网络状态变化量和所述奖励值，得到训练样本组”，包括：

其中，通过对每个网络中的多个待移除节点以及对应的多个网络状态变化信息、节点移除策略和奖励值之间关系的学习，提升了模型训练数据的多样性，也更有利于学习网络状态变化与节点移除策略和奖励值之间的关系。

例如，请参阅图4，图4是本申请实施例提供的训练样本组的数据结构示意图，其中，每个训练样本组中包含原始样本网络及三个关键节点信息，每个关键节点信息包括移除该节点前的网络状态、移除该节点对应的节点移除动作策略，以及相应节点移除动作策略对应的奖励值。将原始样本网络及对应的三个关键节点信息作为一个训练样本组，便于模型在训练过程中通过环境对动作策略执行的奖励(反馈)获得学习信息并更新模型参数。

其中，在本申请实施例中，当包含多个训练样本组，且选取下一个训练样本组进行模型训练时，则可以根据当前模型训练结果的表征确定下一时刻的待执行训练样本组，以提升模型训练过程的稳定性，即，可选的，在本申请的一些实施例中，步骤“根据所述训练样本组中的样本网络、节点移除策略、网络状态变化量和奖励值对预设节点参数模型进行训练，直至满足预设停止条件，得到已训练的节点参数模型”，包括：

确定所述预设节点参数模型在训练时的第一个训练样本组以及当前训练样本组；

根据所述第一个训练样本组的表征信息、所述前训练样本组的表征信息以及所述当前训练样本组对应的节点移除策略的表征信息从所述训练样本组中选取下一时刻的待执行训练样本组；

根据所述待执行训练样本组中的样本网络、节点移除策略、网络状态变化量和奖励值对所述预设节点参数模型进行训练，直至满足预设停止条件，得到已训练的节点参数模型。

其中，在本申请实施例中，数据的表征信息是数据整体或者总体的表现信息，反映数据的整体特点。通过第一个训练样本组、当前训练样本组以及当前训练样本组对应的节点移动策略的表征信息选取下一时刻的待执行训练样本组，使得选取的待执行训练样本组的表征信息与第一个训练样本组、当前训练样本组以及当前训练样本组对应的节点移除策略的表征信息能够保持一致，即呈现出训练方向一致和稳定的特点，提升模型训练效率。

其中，在本申请实施例中，节点参数模型可以包括决策转换器模型(decisiontransformer)，并采用编码(encoder)和解码(decoder)的框架来求解这个自回归过程，具体的：在编码阶段，采用图神经网络来表征状态(网络状态)和动作(节点移除策略)，用多层感知机(MLP)来表征节点移除动作策略对应的累计奖励值。在解码阶段，首先经过决策转换器得到预测的结果表征，然后对于每个状态，我们将最初始的网络表征，当前网络表征与上一步节点移除策略的表征作为语义表征，用该语义表征与剩余子网络中的动作表征进行注意力机制计算，以此来选择下一步的节点移除策略，即选取下一个训练数据。

其中，在本申请实施例中，可以根据训练样本组的来源或者数据整体质量情况，设置模型在不同训练阶段对应的不同的训练数据，即，可选的，在本申请的一些实施例中，训练样本组包括第一样本组和第二样本组，所述第二样本组的数据质量高于所述第一样本组的数据质量，则步骤“根据所述训练样本组中的样本网络、节点移除策略、网络状态变化量和奖励值对预设节点参数模型进行训练，直至满足预设停止条件，得到已训练的节点参数模型”，包括：

其中，在本申请实施例中，数据来源不同可以理解为训练数据采集的方法不同，即，通过不同的算法从历史数据中提取训练用的样本数据，其中，数据质量的不同也可以根据采集样本数据所对应的算法的不同来划分，例如，通过更优的算法提取得到的样本数据在数据质量上要高于通过普通算法提取的样本数据。例如，在本申请实施例中，针对样本数据的需求，可以将束搜索算法得到的训练样本组作为第二样本组，将贪心算法提取得到的训练样本组作为第一样本组。

其中，在本申请实施例中，通过在模型训练过程中不断提升模型数据的可靠性或者质量，提升模型的优化效果，实现模型的不断优化。而通过第一样本组数据和第二样本组数据的混合训练，实现模型训练数据的过渡，保证模型训练过程的稳定性。

其中，在本申请实施例中，当需要从待测网络中提取至少两个关键节点时，可以在第一个关键节点识别后，将第一个关键节点从网络中移除，基于移除后的网络选取第二个关键节点，以此类推，选取满足数量需求的多个关键节点，即，可选的，在本申请的一些实施例中，步骤“根据每个所述节点的节点影响参数，从所述待测网络中选取网络结构影响程度达到预设程度的目标节点”之后，该方法还包括：

从所述待测网络中移除所述目标节点，得到所述待测网络对应的待测子网络；

根据所述待测子网络中每个节点的节点影响参数，从所述待测子网络中选取网络结构影响程度达到预设程度的第二目标节点。

其中，该基于剩余网络选取次关键节点的方法也与训练数据的采集过程或者方法相符合，同样可避免第二个关键节点在选取时，第一个关键节点对选取过程的影响。

其中，在本申请实施例中，基于模型训练时奖励值的累计策略(参考上述样本数据奖励值累计部分)，在从待测子网络选取第二目标节点时，可以将期望奖励值和第一个目标节点的节点减少数量之间的差值作为第二目标节点选取时输入的第二期望奖励值，根据第二期望奖励值，从待测子网络中选取第二目标节点，即第二关键节点。

其中，在本申请实施例中，当需要三个关键节点时，第三个关键节点可以根据待测子网络在移除第二目标节点后的待测子子网络中筛选，例如，根据第二目标节点的第二期望奖励值和第二目标节点对应的节点减少数量的差值得到第三个目标节点输入的第三奖励值，根据第三奖励值和待测子子网络，得到待测子子网络中的第三关键节点。其中，不同关键程度的节点对应的奖励值的大小不同，根据奖励值的相对大小，实现相对关键的节点的获取。

103、根据每个所述节点的节点影响参数，从所述待测网络中选取网络结构影响程度达到预设程度的目标节点。

其中，由于节点移除后对网络结构影响越大，说明该节点在网络结构中的重要性越高，因此，在本申请实施例中，可以根据节点在移除后对网络结构影响程度的高低来筛选网络中的目标节点，实现对网络关键节点的选取。

其中，通过对网络关键节点的识别，便于对网络的分析、理解、应用或者维护，预防网络结构的突然崩塌或者大范围破坏，例如，在社交网络中通过检查关键节点的动态来预测网络的走向，以及对关键节点进行保护降低基础设施网络发生崩溃现象。

结合上述介绍，下面将对本申请实施例中社交网络关键对象识别方法进行介绍，请参阅图5，本申请实施例中社交网络关键对象识别方法的一个实施例包括：

201、获取社交网络中对象间的关联关系。

其中，网络由多个节点及节点之间的链路构成，社交网络由多个对象及对象之间的关联关系建立，其中，社交网络中的对象可以包括用户、账号或者与用户标签等，用户、账号或者标签对应网络中的节点，对象之间的关联关系对应网络节点之间的链路，比如，当两个对象之间存在关联关系时，该两个对象对应的节点之间存在链路。其中，在本申请实施例中，社交网络可以由游戏好友建立的网络，例如，针对同一款游戏，根据该游戏中各个玩家之间的关联关系，得到针对该游戏的社交网络。

202、根据所述关联关系确定所述社交网络中每个对象的对象影响参数，所述对象影响参数用于表征分离所述对象对所述社交网络的网络结构影响程度。

其中，在本申请实施例中，对象影响参数用于表征分离该对象对社交网络的网络结构影响程度。其中，在本申请实施中，对象影响参数可以包括具体的数值或者反映影响程度的标量，每个对象对应的对象影响参数不同，因此，可以通过每个对象对应的对象影响参数筛选出对社交网络影响较大的对象，即，筛选出社交网络中的关键对象。

其中，由于每个对象的关联关系不同，而关联关系较多的对象反映到社交网络中则表现为与该对象节点存在较多的连接链路，即，多个其他对象节点与该对象节点建立连接，即，多个其他对象节点与该对象节点存在连接关系。其中，由于对象的关联关系越多，则说明与该对象存在联系的对象越多，即，该对象所能影响的对象越多，例如，针对游戏中高段位玩家、专业玩家或者高频玩家，该玩家的好友较多，该玩家与多个其他玩家(如多个好友)存在联系，当该玩家离开游戏时，容易存在多名玩家下线的情况(好友也下线)，或者当该玩家从该游戏中注销时，容易引起多个其他玩家的游戏注销行为(例如，经常组队的队友注销账号，则该组队中的其他队友也容易受影响而进行账号注销)，因此，关联关系越多的对象，在社交网络中的重要程度越高，影响越大，因此，可以根据每个对象的关联关系得到该对象对社交网络结构的影响参数或者影响程度。

其中，当通过对象在脱离网络后导致的其他对象脱离总量作为对象重要程度分析指标时，对其他对象脱离总量的统计存在以下问题：1、单个对象从网络结构中移除，会造成其他多个对象从网络中脱离，2、单个对象的脱离由其他单个对象或者多个对象的脱离造成，3、某些对象的移除由多个对象的移除共同导致。因此，由于对象的移除所受影响的情况多种多样，因此，难以通过统计或者固定启发式的算法获取到网络中每个节点在脱离后对应的其他对象脱离总量，即难以确定社交网络结构中的关键对象。

因此，在本申请实施例中，可以采用机器学习模型对每个对象的关联关系进行分析，以自回归的方式，预测得到每个对象对社交网络的影响程度，即，可选的，在本申请的一些实施例中，步骤“根据所述关联关系确定所述社交网络中每个对象的对象影响参数”，包括：

根据所述关联关系确定所述社交网络中每个对象的关联关系特征；

将每个所述对象的关联关系特征分别输入到已训练的影响参数模型，得到每个对象对应的对象影响参数。

其中，每个对象的关联关系特征可以根据与该对象存在的多个关联关系得到，也可以根据图神经网络提取社交网络图中每个对象节点之间的依赖关系，得到每个对象节点对应的对象的关联关系特征。

其中，在根据影响参数模型进行对象影响参数预测之前，还需要先对模型进行训练，以提升模型预测的准确性，即，可选的，在本申请的一些实施例中，步骤“将每个所述对象的关联关系特征分别输入到已训练的影响参数模型，得到每个对象对应的对象影响参数”之前，该方法还包括：

获取训练样本组，所述训练样本组包括样本社交网络、对象分离策略、网络状态变化量和奖励值，所述网络状态变化量为执行所述对象分离策略对应的动作后所述网络状态前后的变化量，所述奖励值在执行所述对象分离策略对应的动作后产生；

根据所述训练样本组中的样本社交网络、对象分离策略、网络状态变化量和奖励值对预设对象参数模型进行训练，直至满足预设停止条件，得到已训练的对象参数模型。

其中，在本申请实施例中，可以通过强化学习的方式对模型进行训练，即，通过提取样本数据中的动作策略、状态变化量、以及奖励值，对模型进行训练，其中，动作策略对应本申请实施例中样本数据中的对象分离策略，状态变化量对应对象分离策略执行后网络状态的变化量，奖励值在对象分离策略执行时对应产生。其中，在本申请实施例中，通过强化学习使得模型能够通过接收环境对对象分离策略对应的动作的奖励(反馈)获得学习信息并更新模型参数。

其中，在模型训练过程中，可以通过模型预测结果和样本数据的表现计算交叉熵损失函数(CrossEntropy loss)，进而反馈到模型参数的调整。

其中，可以通过从历史数据中采集模型训练用的样本数据，利用样本数据对模型进行训练，即，可选的，在本申请的一些实施例中，步骤“获取训练样本组”，包括：

获取与所述社交网络的网络类型相同的样本社交网络；

确定所述样本社交网络中每个对象在移除时所述样本社交网络对应的对象减少数量；

根据所述样本社交网络中每个对象对应的对象减少数量，从所述样本社交网络中确定待分离对象；

根据所述待分离对象生成对象分离策略；

将分离所述待分离对象后所述样本社交网络的变化量作为所述对象分离策略在执行后的网络状态变化量；

根据所述待分离对象在分离后对应的对象减少数量确定所述对象分离策略对应的奖励值；

根据所述样本网络、所述对象分离策略、所述网络状态变化量和所述奖励值，得到训练样本组。

其中，根据社交网络的类型选取样本社交网络，使得选取的样本社交网络与社交网络的类型保持一致，而网络类型一致的情况下，可提升模型训练时样本数据的可靠性和可参考性。

其中，在本申请实施例中，社交网络和样本社交网络均可以定义为：G＝(V,E)，每个节点v的相邻节点记为N(v)＝{u|(u,v)∈E}，节点v的度定义为deg(v)＝|N(v)|，网络的子图(k-core)定义为

其中，C_k(G)所有节点的度大于等于k。我们定义关键节点集合S为

其中，C_r(S)定义为从集合V中移除S前后k-core子图节点数量的减少值：C_k(V)-C_K(V\S)，其中，V\S是移除关键节点集合的内聚子图(如社交网络对应的社交子网络，样本社交网络对应的样本社交子网络)。

其中，由于是根据每个对象在分离时对应的对象减少数量选取待分离对象，即，选取对象减少数量最大的对象作为待分离对象，因此，选取的待分离对象对应的对象减少数量较大，即，选取的待分离对象对网络结构的影响较大，因此，当根据对象减少数量得到分离对象对应的奖励值时，可在一定程度上保证对象分离策略在执行后具备一个较大的奖励值。例如，在本申请实施例中，可以将每个对象对应的对象减少数量作为该对象在从社交网络中分离时对应的奖励值。

其中，通过将对象减少数量最大的对象(即样本社交网络的关键对象)作为待分离对象，并根据该待分离对象对应的动作策略以及动作策略在执行时的奖励值对模型进行强化学习训练，使得模型在训练过程中，能够学习样本数据中动作策略、奖励值以及关键对象之间的关系信息，例如，对象越关键，分离对象对应的奖励值越大，使得训练后的模型也能够预测和识别出待测社交网络中的关键节点，例如，当在已训练的影响参数模型中输入待测社交网络和较大的期望奖励值时，也能够根据每个对象在分离时的实际奖励值和输入的期望奖励值筛选出待测社交网络中的关键对象，通过模型模拟每个对象从待测社交网络中分离，得到每个对象在分离时对应的实际奖励值，根据实际奖励值是否够大，是否接近期望奖励值筛选出关键对象。其中，模型预测时的期望奖励值可以是一个数据较大的先验值。

其中，在本申请实施例中，样本社交网络中待分离对象可以包括多个，通过多个待分离对象，以及每个待分离对象对应的网络、网络状态变化量，对象分离策略和奖励值对模型的训练，可提升训练后模型预测的准确性，以下以待分离对象为两个为例，描述两个待分离对象的获取方法或者过程。即，可选的，在本申请的一些实施例中，待分离对象包括两个，步骤“根据所述样本社交网络中每个对象对应的对象减少数量，从所述样本社交网络中确定待分离对象”，包括：

从所述样本社交网络中选取对象减少数量满足第一预设条件的一个对象，将所述对象作为第一参考对象；

从所述样本社交网络中移除所述第一参考对象，得到所述样本社交网络对应的样本社交子网络；

从所述样本社交子网络中选取对象减少数量满足所述第一预设条件的一个对象，将所述对象作为第二参考对象；

将所述第一参考对象和所述第二参考对象分别作为待分离对象。

其中，该过程以贪心算法(greedy algorithm)为例，即，在每个网络状态中选取一个最佳的结果，作为每一个时间步的优选结果，确保每一次均是最佳选择。

相应的，在每个网络状态中，也可以选取多个对象，从多个网络状态中选取最有的组合，作为最终选取的关键对象，即，可选的，在本申请的一些实施例中，步骤“待分离对象包括两个，所述根据所述样本社交网络中每个对象对应的对象减少数量，从所述样本社交网络中确定待分离对象”，包括：

从所述样本社交网络中选取对象减少数量满足第二预设条件的至少两个对象，将至少两个所述对象分别作为第一参考对象；

针对每个所述第一参考对象，从所述样本社交网络中移除所述第一参考对象，得到所述样本社交网络对应的样本社交子网络，并根据所述样本社交子网络和所述第一参考对象构建网络树分支组；

针对每个样本社交子网络，从所述样本社交子网络中选取对象减少数量满足所述第二预设条件的至少两个对象，将至少两个所述对象作为第二参考对象；

针对每个网络树分支组，将所述网络树分支组中第一参考对象与每个第二参考对象分别建立对象组，并统计每个对象组中第一参考对象对应的对象减少数量与第二参考对象对应的对象减少数量的和，得到每个对象组对应的对象减少数量和；

根据所有网络树分支组分别对应的至少两个对象减少数量和，筛选出对象减少数量和满足第三预设要求的目标对象减少数量和；

将所述目标对象减少数量和对应的对象组中的第一参考对象和第二参考对象分别作为待分离对象。

其中，该对象选取方法以束搜索(beam search)算法为例。其中，由于每一个网络状态中选取至少两个节点，相较于每一个网络状态中选取一个节点，提升了搜索和选取的空间，提升了所选取节点的多样性，同时，也避免每个网络状态选取一个时容易出现选错情况的发生，一定程度上保证了准确性。

其中，在本申请实施例中，针对待分离对象是三个的需求，可以通过从样本社交子网络中分离第二参考对象，得到样本社交子网络对应的样本社交子子网络，从样本社交子子网络中根据每个对象的对象减少数量选取第三参考对象。其中，针对第三参考对象为单个的情况，可以直接将该第三参考对象作为待分离对象，针对第三参考对象为多个的情况，可以根据每个对象组对应的对象减少数量和，来选取对象减少数量和最大的对象组中的对象作为待分离对象。

其中，针对每个待分离对象对应的网络状态变化量，可以根据该分离对象在分离前后网络状态的变化量来获取，即，可选的，在本申请的一些实施例中，步骤“将分离所述待分离对象后所述样本网络的变化量作为所述对象分离策略在执行后的网络状态变化量”，包括：

将分离所述第一参考对象后所述样本网络的变化量，作为所述第一参考对象对应的对象分离策略在执行后的网络状态变化量，并将分离所述第二参考对象后所述样本子网络的变化量，作为所述第二参考对象对应的对象分离策略在执行后的网络状态变化量。

其中，通过每个对象在分离前后网络状态信息的比较，可实现对每个对象在分离操作后网络状态变化量的获取，即，得到每个对象对应的对象分离策略在执行后的网络状态变化量。

其中，可以通过最大化奖励值的方式来提升关键对象对应的奖励值，即，可选的，在本申请的一些实施例中，步骤“根据所述待分离对象在分离时对应的对象减少数量确定所述对象移除策略对应的奖励值”，包括：

计算所述第一参考对象对应的对象减少数量与所述第二参考对象对应的对象减少数量的和，得到对象累计减少数量；

将所述对象累计减少数量作为所述第一参考对象对应的对象移除策略的奖励值，并将所述第二参考对象对应的对象减少数量作为所述第二参考对象对应的对象移除策略的奖励值。

其中，通过将当前对象的奖励值上叠加当前对象对应的次关键对象以及次关键对象对应的次次关键对象的奖励值，实现对对象奖励值的累计，实现奖励值的最大化。例如，当关键对象为三个时，即第一参考对象、第二参考对象和第三参考对象时，可以将第一参考对象、第二参考对象和第三参考对象对应的对象减少数量的和作为第一参考对象的奖励值，将第二参考对象和第三参考对象对应的对象减少数量的和作为第二参考对象的奖励值，将第三参考对象对应的对象减少数量的和作为第三参考对象的奖励值。

其中，通过不同关键程度的对象对应的奖励值大小的分层设置，使得模型能够学习到奖励值大小与对象关键程度之间的关系，以及通过最大化累计奖励值，提升了关键对象对应的奖励值的大小，使得模型能够学习到奖励值越大，动作策略执行越恰当的特点，即，奖励值越大，关键对象分离、选取或者识别的动作的越准确。

其中，在本申请实施例中，针对待分离对象为多个(两个以上)的情况，可以将多个对象对应的网络、网络状态变化量、对象分离策略和奖励值进行合并，作为整体的训练样本组数据。其中，以待分离对象为两个为例，描述单个样本社交网络中两个待分离对象构建训练样本组的过程，即，可选的，在本申请的一些实施例中，步骤“根据所述样本社交网络、所述对象分离策略、所述网络状态变化量和所述奖励值，得到训练样本组”，包括：

根据所述样本社交网络、所述第一参考对象对应的对象分离策略、所述第一参考对象对应的对象分离策略在执行后的网络状态变化量、所述第一参考对象对应的对象分离策略在执行后的奖励值，以及，所述样本子网络、所述第二参考对象对应的对象分离策略、所述第二参考对象对应的对象分离策略在执行后的网络状态变化量、所述第二参考对象对应的对象分离策略在执行后的奖励值，得到训练样本组。

其中，通过对每个网络中的多个待分离对象以及对应的多个网络状态变化信息、对象分离策略和奖励值之间关系的学习，提升了模型训练数据的多样性，也更有利于学习网络状态变化与对象分离策略和奖励值之间的关系。

其中，在本申请实施例中，可以通过模型当前训练结果的表征选取下一个待训练的样本数据，确保模型训练过程的稳定性，即，可选的，在本申请的一些实施例中，步骤“根据所述训练样本组中的样本网络、对象分离策略、网络状态变化量和奖励值对预设对象参数模型进行训练，直至满足预设停止条件，得到已训练的对象参数模型”，包括：

确定所述预设对象参数模型在训练时的第一个训练样本组以及当前训练样本组；

根据所述待执行训练样本组中的样本网络、对象分离策略、网络状态变化量和奖励值对所述预设对象参数模型进行训练，直至满足预设停止条件，得到已训练的对象参数模型。

其中，在本申请实施例中，数据的表征信息是数据整体或者总体的表现信息，反映数据的整体特点。通过第一个训练样本组、当前训练样本组以及当前训练样本组对应的节点移动策略的表征信息选取下一时刻的待执行训练样本组，使得选取的待执行训练样本组的表征信息与第一个训练样本组、当前训练样本组以及当前训练样本组对应的对象分离策略的表征信息能够保持一致，即呈现出训练方向一致和稳定的特点，提升模型训练效率。

其中，在本申请实施例中，可以通过不同的算法提取样本数据，针对不同方式获取的数据，可以在模型不同的训练阶段选取不同的样本数据对模型进行训练，即，可选的，在本申请的一些实施例中，训练样本组包括第一样本组和第二样本组，所述第二样本组的数据质量高于所述第一样本组的数据质量，则步骤“根据所述训练样本组中的样本网络、对象分离策略、网络状态变化量和奖励值对预设对象参数模型进行训练，直至满足预设停止条件，得到已训练的对象参数模型”，包括：

根据第一样本组中的样本网络、对象分离策略、网络状态变化量和奖励值对预设对象参数模型进行训练；

根据第一样本组和第二样本组中的样本网络、对象分离策略、网络状态变化量和奖励值对预设对象参数模型进行训练；

根据第二样本组中的样本网络、对象分离策略、网络状态变化量和奖励值对预设对象参数模型进行训练，直至满足预设停止条件，得到已训练的对象参数模型。

其中，在本申请实施例中，数据来源不同可以理解为训练数据采集的方法不同，即，通过不同的算法从历史数据中提取训练用的样本数据，其中，数据质量的不同也可以根据采集样本数据所对应的算法的不同来划分，例如，通过更优的算法提取得到的样本数据在数据质量上要高于通过普通算法提取的样本数据。例如，请参阅图6，图6是本申请实施例提供的社交网络关键对象识别方法中模型训练的进度示意图，在本申请实施例中，针对样本数据的需求，可以将束搜索算法得到的训练样本组作为第二样本组，将贪心算法提取得到的训练样本组作为第一样本组，在训练开始使用贪心算法产生的数据进行训练，训练到一定的阶段之后混合贪心算法和束搜索算法产生的数据继续训练，最后，使用束搜索算法产生的数据训练。其中，训练过程的数据也会随之增加。

其中，当需要获取到待测社交网络中的多个关键对象时，可以通过从待测社交网络中分离在先选取的关键对象，得到待测社交子网络，从待测社交子网络中选取次关键对象，即，可选的，在本申请的一些实施例中，步骤“根据每个所述对象的对象影响参数，从所述社交网络中选取网络结构影响程度达到预设程度的目标节点”之后，该方法还包括：

从所述社交网络中分离所述目标对象，得到所述社交网络对应的社交子网络；

根据所述社交子网络中每个对象的对象影响参数，从所述社交子网络中选取网络结构影响程度达到预设程度的第二目标对象。

其中，该基于剩余网络选取次关键对象的方法也与训练数据的采集过程或者方法相符合，同样可避免第二个关键对象在选取时，第一个关键对象对选取过程的影响。

其中，在本申请实施例中，基于模型训练时奖励值的累计策略(参考上述样本数据奖励值累计部分)，在从社交子网络选取第二目标对象时，可以将期望奖励值和第一个目标对象的对象减少数量之间的差值作为第二目标对象选取时输入的第二期望奖励值，根据第二期望奖励值，从社交子网络中选取第二目标对象，即第二关键对象。

其中，在本申请实施例中，当需要三个关键对象时，第三个关键对象可以根据社交子网络在移除第二目标对象后的社交子子网络中筛选，例如，根据第二目标对象的第二期望奖励值和第二目标对象对应的对象减少数量的差值得到第三个目标对象输入的第三奖励值，根据第三奖励值和社交子子网络，得到社交子子网络中的第三关键对象。其中，不同关键程度的对象对应的奖励值的大小不同，根据奖励值的相对大小，实现相对关键的对象的获取。

203、根据每个所述对象的对象影响参数，从所述社交网络中选取网络结构影响程度达到预设程度的目标对象。

其中，由于对象分离后对网络结构影响越大，说明该对象在网络结构中的重要性越高，因此，在本申请实施例中，可以根据对象在分离后对网络结构影响程度的高低来筛选网络中的目标对象，实现对网络关键对象的选取。

其中，本申请实施例通过社交网络中对象间的关联关系，确定社交网络中每个对象的对象影响参数，根据对象影响参数表征的对象分离对网络结构的影响程度，筛选出对社交网络结构影响程度较大的目标对象，实现对网络关键对象的识别。其中，通过对社交网络关键对象的识别，便于对社交网络的分析、理解、应用或者维护，预防网络结构的突然崩塌或者大范围破坏，例如，在社交网络中通过检查关键对象的动态来预测网络的走向。

为便于更好的实施本申请的节点识别方法，本申请还提供一种基于上述节点识别方法的节点识别装置。其中第三目标词语的含义与上述节点识别方法中相同，具体实现细节可以参考方法实施例中的说明。

请参阅图7，图7为本申请提供的节点识别装置的结构示意图，其中，该节点识别装置可以包括：

获取模块301，用于获取待测网络中节点间的连接关系；

确定模块302，用于根据所述连接关系确定所述待测网络中每个节点的节点影响参数，所述节点影响参数用于表征移除所述节点对所述待测网络的网络结构影响程度；

选取模块303，用于根据每个所述节点的节点影响参数，从所述待测网络中选取网络结构影响程度达到预设程度的目标节点。

其中，在本申请的一些实施例中，所述确定模块302包括：

其中，在本申请的一些实施例中，获取单元包括：

生成子单元，用于根据所述待移除节点生成节点移除策略；

第四确定子单元具体用于：

生成子单元具体用于：

其中，在本申请的一些实施例中，训练单元包括：

本申请实施例由获取模块301获取待测网络中节点间的连接关系，接着，由确定模块302根据所述连接关系确定所述待测网络中每个节点的节点影响参数，所述节点影响参数用于表征移除所述节点对所述待测网络的网络结构影响程度，然后，由选取模块303根据每个所述节点的节点影响参数，从所述待测网络中选取网络结构影响程度达到预设程度的目标节点。

此外，本申请还提供一种电子设备，如图8所示，其示出了本申请所涉及的电子设备的结构示意图，具体来讲：

该电子设备可以包括一个或者一个以上处理核心的处理器401、一个或一个以上计算机可读存储介质的存储器402、电源403和输入单元404等部件。本领域技术人员可以理解，图8中示出的电子设备结构并不构成对电子设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。其中：

处理器401是该电子设备的控制中心，利用各种接口和线路连接整个电子设备的各个部分，通过运行或执行存储在存储器402内的软件程序和/或模块，以及调用存储在存储器402内的数据，执行电子设备的各种功能和处理数据。可选的，处理器401可包括一个或多个处理核心；优选的，处理器401可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作***、对象界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器401中。

存储器402可用于存储软件程序以及模块，处理器401通过运行存储在存储器402的软件程序以及模块，从而执行各种功能应用以及数据处理。存储器402可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作***、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据电子设备的使用所创建的数据等。此外，存储器402可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地，存储器402还可以包括存储器控制器，以提供处理器401对存储器402的访问。

电子设备还包括给各个部件供电的电源403，优选的，电源403可以通过电源管理***与处理器401逻辑相连，从而通过电源管理***实现管理充电、放电、以及功耗管理等功能。电源403还可以包括一个或一个以上的直流或交流电源、再充电***、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。

该电子设备还可包括输入单元404，该输入单元404可用于接收输入的数字或字符信息，以及产生与对象设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。

尽管未示出，电子设备还可以包括显示单元等，在此不再赘述。具体在本实施例中，电子设备中的处理器401会按照如下的指令，将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器402中，并由处理器401来运行存储在存储器402中的应用程序，从而实现本申请所提供的任一种节点识别方法中的步骤。

本申请实施例通过待测网络中节点间的连接关系，确定待测网络中每个节点的节点影响参数，根据节点影响参数表征的节点移除对网络结构的影响程度，筛选出对待测网络结构影响程度较大的目标节点，实现对网络关键节点的识别。其中，由于节点的连接关系反映了网络中与该节点建立连接的节点数量，而与该节点连接的节点数量越多，则说明该节点构成的连接关系占网络结构中的比重越高，即该节点对网络结构的影响越大，而当与其他节点连接数量较多的节点从网络结构中移除时，则对该网络结构的影响较大，因此，在本申请实施例中，可以通过移除节点后对网络结构的影响程度来筛选关键节点。而从对网络结构的整体影响程度选取关键节点，使得关键节点在选取时考虑的因素更全面，关键节点的选取更准确。

本领域普通技术人员可以理解，上述实施例的各种方法中的全部或部分步骤可以通过指令来完成，或通过指令控制相关的硬件来完成，该指令可以存储于一计算机可读存储介质中，并由处理器进行加载和执行。

为此，本申请提供一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序能够被处理器进行加载，以执行本申请所提供的任一种节点识别方法中的步骤。

其中，该计算机可读存储介质可以包括：只读存储器(ROM，Read Only Memory)、随机存取记忆体(RAM，Random Access Memory)、磁盘或光盘等。

由于该计算机可读存储介质中所存储的指令，可以执行本申请所提供的任一种节点识别方法中的步骤，因此，可以实现本申请所提供的任一种节点识别方法所能实现的有益效果，详见前面的实施例，在此不再赘述。

以上对本申请所提供的一种节点识别方法、装置、电子设备以及计算机可读存储介质进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上，本说明书内容不应理解为对本发明的限制。

其中，可以理解的是，在本申请的具体实施方式中，涉及到用户信息、对象间关联关系、好友关系、游戏行为等相关的数据，当本申请以上实施例运用到具体产品或技术中时，需要获得用户许可或者同意，且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。

Claims

1.一种节点识别方法，其特征在于，包括：

获取待测网络中节点间的连接关系；

2.根据权利要求1所述的方法，其特征在于，所述根据所述连接关系确定所述待测网络中每个节点的节点影响参数，包括：

3.根据权利要求2所述的方法，其特征在于，所述将每个所述节点的连接关系特征分别输入到已训练的节点参数模型，得到每个节点对应的节点影响参数之前，所述方法还包括：

4.根据权利要求3所述的方法，其特征在于，所述获取训练样本组，包括：

获取与所述待测网络的网络类型相同的样本网络；

根据所述待移除节点生成节点移除策略；

5.根据权利要求4所述的方法，其特征在于，所述待移除节点包括两个，所述根据所述样本网络中每个节点对应的节点减少数量，从所述样本网络中确定待移除节点，包括：

6.根据权利要求4所述的方法，其特征在于，所述待移除节点包括两个，所述根据所述样本网络中每个节点对应的节点减少数量，从所述样本网络中确定待移除节点，包括：

7.根据权利要求5或6任一项所述的方法，其特征在于，所述将移除所述待移除节点后所述样本网络的变化量作为所述节点移除策略在执行后的网络状态变化量，包括：

所述根据所述待移除节点在移除时对应的节点减少数量确定所述节点移除策略对应的奖励值，包括：

所述根据所述样本网络、所述节点移除策略、所述网络状态变化量和所述奖励值，得到训练样本组，包括：

8.根据权利要求3所述的方法，其特征在于，所述根据所述训练样本组中的样本网络、节点移除策略、网络状态变化量和奖励值对预设节点参数模型进行训练，直至满足预设停止条件，得到已训练的节点参数模型，包括：

9.根据权利要求3所述的方法，其特征在于，所述训练样本组包括第一样本组和第二样本组，所述第二样本组的数据质量高于所述第一样本组的数据质量，所述根据所述训练样本组中的样本网络、节点移除策略、网络状态变化量和奖励值对预设节点参数模型进行训练，直至满足预设停止条件，得到已训练的节点参数模型，包括：

10.根据权利要求1所述的方法，其特征在于，所述根据每个所述节点的节点影响参数，从所述待测网络中选取网络结构影响程度达到预设程度的目标节点之后，所述方法还包括：

11.一种节点识别装置，其特征在于，包括：

获取模块，用于获取待测网络中节点间的连接关系；

12.一种电子设备，其特征在于，所述电子设备包括存储器、处理器及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如权利要求1-10任一项所述节点识别方法的步骤。

13.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1-10任一项所述节点识别方法的步骤。