CN111047453A - 基于高阶张量分解大规模社交网络社区的检测方法及装置 - Google Patents
基于高阶张量分解大规模社交网络社区的检测方法及装置 Download PDFInfo
- Publication number
- CN111047453A CN111047453A CN201911228464.7A CN201911228464A CN111047453A CN 111047453 A CN111047453 A CN 111047453A CN 201911228464 A CN201911228464 A CN 201911228464A CN 111047453 A CN111047453 A CN 111047453A
- Authority
- CN
- China
- Prior art keywords
- social network
- community
- network
- module
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 25
- 238000000034 method Methods 0.000 claims abstract description 37
- 238000000354 decomposition reaction Methods 0.000 claims abstract description 24
- 238000004458 analytical method Methods 0.000 claims abstract description 23
- 230000006835 compression Effects 0.000 claims abstract description 23
- 238000011156 evaluation Methods 0.000 claims abstract description 21
- 238000007906 compression Methods 0.000 claims abstract description 17
- 239000011159 matrix material Substances 0.000 claims description 18
- 238000005070 sampling Methods 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 9
- 238000012545 processing Methods 0.000 claims description 6
- 238000013075 data extraction Methods 0.000 claims description 5
- 238000007418 data mining Methods 0.000 claims description 5
- 230000010365 information processing Effects 0.000 claims description 5
- 238000012546 transfer Methods 0.000 claims description 5
- 238000004519 manufacturing process Methods 0.000 claims description 3
- 238000005065 mining Methods 0.000 claims description 3
- 238000012549 training Methods 0.000 claims description 3
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明属于社交网络社区的检测技术领域,公开了一种基于高阶张量分解大规模社交网络社区的检测方法及装置,所述基于高阶张量分解大规模社交网络社区的检测装置包括:网络信息采集模块、中央控制模块、社区搜索模块、社区共享模块、网络压缩模块、社区分析模块、影响力评估模块、显示模块。本发明通过网络压缩模块采用块项张量分解方法来构造块项张量层,以替换原始社交网络中的全连接层,利用块项张量层具有的“对称”和“指数表达能力”的特性,不仅能够大幅压缩全连接层的参数量还能够保持原网络的分类精度;同时,通过社区分析模块可以较好地利用网络拓扑结构,分析准确性高;及实现对核心节点的类型进行区分。
Description
技术领域
本发明属于社交网络社区的检测技术领域,尤其涉及一种基于高阶张量分解大规模社交网络社区的检测方法及装置。
背景技术
社交网络涵盖以人类社交为核心的所有网络服务形式,互联网是一个能够相互交流,相互沟通,相互参与的互动平台,互联网的发展早已超越了当初ARPANET的军事和技术目的,社交网络使得互联网从研究部门、学校、政府、商业应用平台扩展成一个人类社交的工具。网络社交更是把其范围拓展到移动手机平台领域,借助手机的普遍性和无线网络的应用,利用各种交友/即时通讯/邮件收发器等软件,使手机成为新的社交网络的载体。社交网络,也就是网络+社交的意思。通过网络这一载体把人们连接起来,从而形成具有某一特点的团体。然而,现有社交网络压缩能力低;同时,现有的动态社交网络社区演化分析没有较好地利用网络拓扑结构,准确性有待提高;不同的核心节点拥有不同的特性,对演化事件检测的贡献不同,但是现有技术没有对核心节点的类型进行区分。
综上所述,现有技术存在的问题是:
现有社交网络压缩能力低;同时,现有的动态社交网络社区演化分析没有较好地利用网络拓扑结构,准确性有待提高;不同的核心节点拥有不同的特性,对演化事件检测的贡献不同,但是现有技术没有对核心节点的类型进行区分。
发明内容
针对现有技术存在的问题,本发明提供了一种基于高阶张量分解大规模社交网络社区的检测方法及装置。
本发明是这样实现的,一种基于高阶张量分解大规模社交网络社区的检测方法,包括以下步骤:
步骤一,通过研究真实网络拓扑结构特性和假设的网络模型之间的差异,借用贝叶斯推断等数学工具,通过最大化似然概率,实现社区及发现;
步骤二,确定社交网络社区信息的搜索特征,即需要采集哪些社交网络社区特征因子;根据确定的社交网络社区特征因子,利用一定在程序对不同的社交网络对象进行相应的数据,利用相应的程序调用到应用平台上;
步骤三,对采集的数据利用PathSim算法通过元路径对网络信息模块采集的相关信息进行相似性搜索,挖掘社交异构信息网络中隐含的丰富语意;并且对社交网络社区演化进行分析,通过评估程序对社交网络社区影响力进行评估;
步骤四,将上述搜索的数据和评估数据结果,对社交网络进行压缩处理;通过显示器显示采集的社交网络社区信息、搜索结果、共享信息、分析结果、评估结果;同时通过共享程序对社交网络社区信息资源进行共享;
所述步骤四中,社交网络进行压缩处理,具体过程如下:
A、通过压缩程序获取社交网络框架;
B、将社交网络的全连接层中的权重矩阵W和输入向量x分别转化为高阶张量W和高阶张量X;
C、对步骤B中的高阶张量W进行块项张量分解处理;
D、根据步骤B中的高阶张量X和步骤C中块项张量分解后的高阶张量W将社交网络的全连接层替换为块项张量层;
E、采用后向传播算法对步骤D中替换后的社交网络进行训练;
所述步骤B中将社交网络的全连接层中的权重矩阵W转化为高阶张量W具体为:将权重矩阵W的行维度和列维度进行均匀分割,表示为层次分块矩阵形式,再将分割后的权重矩阵W转化为高阶张量W。
进一步,所述步骤B中将社交网络的全连接层中的输入向量x转化为高阶张量X具体为:将输入向量x的维度表示为张量形式,再转化为高阶张量X。
进一步,所述步骤C对步骤B中的高阶张量W进行块项张量分解处理具体为:对高阶张量W的维度进行重新排列,使得行维度和列维度对应的输入和输出以成对形式耦合排列,再将高阶张量W分解为若干个塔克分解的和。
进一步,所述步骤D根据步骤B中的高阶张量X和步骤C中块项张量分解后的高阶张量W将社交网络的全连接层替换为块项张量层具体为:将高阶张量X和块项张量分解后的高阶张量W相乘,替换社交网络的全连接层为块项张量层。
进一步,所述步骤三中,对社交网络社区演化进行分析方法如下:
(1)通过分析程序针对给定的动态社交网络,从第一个时间片开始,对每个时间片划分该时间片网络对应的社区结构;
(2)根据社区结构划分结果,计算每个时间片网络的superspreader集合和该时间片网络对应的每个社区的superblocker集合;
(3)针对上述superspreader集合,确定每一社区的演化事件1类型;所述演化事件1可能的类型包括产生、合并和扩张事件;
(4)针对上述superblocker集合,确定每一社区的演化事件2类型:所述演化事件2可能的类型包括消失、***和缩减事件。
进一步,所述针对给定的动态社交网络、从第一个时间片开始、对每个时间片划分该时间片网络对应的社区结构,包括如下步骤:
针对给定的动态社交网络,从第一个时间片开始,获得每个时间片网络中各个节点之间的邻居关系;
根据上述邻居关系,通过QCA算法,划分每个时间片网络对应的社区结构。
进一步,所述计算每个时间片网络的superspreader集合和该时间片网络对应的每个社区的superblocker集合,包括如下步骤:
通过DegreeDiscount算法,得到每个时间片网络的superspreader集合;
通过CoreHD算法,得到每个时间片网络对应的每个社区的superblocker集合;
所述针对上述superspreader集合、确定每一社区的演化事件1类型,包括如下步骤:
根据产生事件的计算模型进行演化事件1类型判断,若当前时间片t的superspreader节点在前一个时间片t-1不存在或者不是superspreader集合中的节点,则判定演化事件1为产生事件,该superspreader节点所代表的社区为当前时间片t新生成的社区;
根据合并事件的计算模型进行演化事件1类型判断,若当前时间片t的同一个社区内的两个superspreader节点在前一个时间片t-1分别属于不同的社区,则判定演化事件1为合并事件,所述两个superspreader节点所代表的社区在当前时间片t发生合并;
根据扩张事件的计算模型进行演化事件1类型判断,若当前时间片t的某个社区内superspreader节点规模大于前一个时间片t-1对应社区的superspreader节点规模,则判定演化事件1为扩展事件,所述社区在当前时间片t发生扩张。
进一步,所述步骤二中,采集社交网络社区信息数据的网络信息采集模块采集社交网络社区信息数据的具体过程如下:
首先,确定社交网络社区信息的搜索特征,即需要采集哪些社交网络社区特征因子;
根据确定的社交网络社区特征因子,利用一定在程序对不同的社交网络对象进行相应的数据;
在采集社交网络数据信息过程中,进行调度采集,与相应的节点同步更新和数据采集;
将上述采集的社交网络数据异构到同构中,利用相应的程序调用到应用平台上。
进一步,所述步骤四中,对社区影响力进行评估的方法,如下:
根据***其它模块搜索到的各个社交网络社区信息数据,对社交网络社区信息数据中的对社区不利的数据进行剔除;
对社交网络社区信息数据中,用户的转载量和用户的评论进行数据挖掘提取,得出用户的影响力;
根据用户的影响力,计算一个社交网络的规模和用户量;对一定规模的社交网络中的信息进行抽样,并对一个社交网络的影响力进行估算;
根据一个社交网络的影响力,进行抽样估算高一层次的社交网络影响力。
本发明提供的另一目的在于提供一种实施所述的基于高阶张量分解大规模社交网络社区的检测方法的基于高阶张量分解大规模社交网络社区的检测装置,所述基于高阶张量分解大规模社交网络社区的检测装置包括:
网络信息采集模块,与中央控制模块连接,确定社交网络社区信息的搜索特征,即需要采集哪些社交网络社区特征因子;根据确定的社交网络社区特征因子,利用一定在程序对不同的社交网络对象进行相应的数据;在采集社交网络数据信息过程中,进行调度采集,与相应的节点同步更新和数据采集;将上述采集的社交网络数据异构到同构中,利用相应的程序调用到应用平台上;
异构网络信息处理模块,与中央控制模块连接,用于利用PathSim算法通过元路径对网络信息模块采集的相关信息进行相似性搜索,挖掘社交异构信息网络中隐含的丰富语意;
中央控制模块,与网络信息采集模块、社区搜索模块、社区共享模块、网络压缩模块、社区分析模块、影响力评估模块、显示模块连接,用于通过主机控制各个模块正常工作;
社区搜索模块,与中央控制模块连接,通过研究真实网络拓扑结构特性和假设的网络模型之间的差异,借用贝叶斯推断等数学工具,通过最大化似然概率,实现社区及发现;
社区共享模块,与中央控制模块连接,用于通过共享程序对社交网络社区信息资源进行共享;
网络压缩模块,与中央控制模块连接,用于通过压缩程序对社交网络进行压缩处理;
社区分析模块,与中央控制模块连接,用于对社交网络社区演化进行分析;
影响力评估模块,与中央控制模块连接,根据***其它模块搜索到的各个社交网络社区信息数据,对社交网络社区信息数据中的对社区不利的数据进行剔除;对社交网络社区信息数据中,用户的转载量和用户的评论进行数据挖掘提取,得出用户的影响力;根据用户的影响力,计算一个社交网络的规模和用户量;对一定规模的社交网络中的信息进行抽样,并对一个社交网络的影响力进行估算;根据一个社交网络的影响力,进行抽样估算高一层次的社交网络影响力;
显示模块,与中央控制模块连接,用于通过显示器显示采集的社交网络社区信息、搜索结果、共享信息、分析结果、评估结果。
本发明的优点及积极效果为:
本发明通过网络压缩模块采用块项张量分解方法来构造块项张量层,以替换原始社交网络中的全连接层,利用块项张量层具有的“对称”和“指数表达能力”的特性,不仅能够大幅压缩全连接层的参数量还能够保持原网络的分类精度;同时,通过社区分析模块可以较好地利用网络拓扑结构,分析准确性高;及实现对核心节点的类型进行区分。本发明用于采集社交网络社区信息数据的网络信息采集模块采集社交网络社区信息数据的方法,能够根据社交网络社区的层次进行扩大采集范围,提高社交网络社区信息数据的全面性。本发明通过评估程序对社交网络社区影响力进行评估的影响力评估模块对社区影响力进行评估的方法,可以提高社交网络社区影响力评估的正确性。
附图说明
图1是本发明实施例提供的基于高阶张量分解大规模社交网络社区的检测方法流程图。
图2是本发明实施例提供的基于高阶张量分解大规模社交网络社区的检测装置结构框图。
图2中:1、网络信息采集模块;2、异构网络信息处理模块;3、中央控制模块;4、社区搜索模块;5、社区共享模块;6、网络压缩模块;7、社区分析模块;8、影响力评估模块;9、显示模块。
具体实施方式
为能进一步了解本发明的发明内容、特点及功效,兹例举以下实施例,并配合附图详细说明如下。
下面结合附图对本发明的结构作详细的描述。
如图1所示,本发明实施例提供的基于高阶张量分解大规模社交网络社区的检测方法包括以下步骤:
S101:通过研究真实网络拓扑结构特性和假设的网络模型之间的差异,借用贝叶斯推断等数学工具,通过最大化似然概率,实现社区及发现。
S102:确定社交网络社区信息的搜索特征,即需要采集哪些社交网络社区特征因子;根据确定的社交网络社区特征因子,利用一定在程序对不同的社交网络对象进行相应的数据,利用相应的程序调用到应用平台上。
S103:对采集的数据利用PathSim算法通过元路径对网络信息模块采集的相关信息进行相似性搜索,挖掘社交异构信息网络中隐含的丰富语意;并且对社交网络社区演化进行分析,通过评估程序对社交网络社区影响力进行评估。
S104:将上述搜索的数据和评估数据结果,对社交网络进行压缩处理;通过显示器显示采集的社交网络社区信息、搜索结果、共享信息、分析结果、评估结果;同时通过共享程序对社交网络社区信息资源进行共享。
如图2所示,本发明实施例提供的基于高阶张量分解大规模社交网络社区的检测装置包括:网络信息采集模块1、异构网络信息处理模块2、中央控制模块3、社区搜索模块4、社区共享模块5、网络压缩模块6、社区分析模块7、影响力评估模块8、显示模块9。
网络信息采集模块1,与中央控制模块3连接,用于采集社交网络社区信息数据。
异构网络信息处理模块2,与中央控制模块3连接,用于利用PathSim算法通过元路径对网络信息模块采集的相关信息进行相似性搜索,挖掘社交异构信息网络中隐含的丰富语意。
中央控制模块3,与网络信息采集模块1、社区搜索模块4、社区共享模块5、网络压缩模块6、社区分析模块7、影响力评估模块8、显示模块9连接,用于通过主机控制各个模块正常工作。
社区搜索模块4,与中央控制模块3连接,通过研究真实网络拓扑结构特性和假设的网络模型之间的差异,借用贝叶斯推断等数学工具,通过最大化似然概率,实现社区及发现。
社区共享模块5,与中央控制模块3连接,用于通过共享程序对社交网络社区信息资源进行共享。
网络压缩模块6,与中央控制模块3连接,用于通过压缩程序对社交网络进行压缩处理。
社区分析模块7,与中央控制模块3连接,用于对社交网络社区演化进行分析。
影响力评估模块8,与中央控制模块3连接,用于通过评估程序对社交网络社区影响力进行评估。
显示模块9,与中央控制模块3连接,用于通过显示器显示采集的社交网络社区信息、搜索结果、共享信息、分析结果、评估结果。
本发明提供的与中央控制模块3连接,用于采集社交网络社区信息数据的网络信息采集模块采集社交网络社区信息数据的具体过程如下:
首先,确定社交网络社区信息的搜索特征,即需要采集哪些社交网络社区特征因子;
根据确定的社交网络社区特征因子,利用一定在程序对不同的社交网络对象进行相应的数据;
在采集社交网络数据信息过程中,进行调度采集,与相应的节点同步更新和数据采集;
将上述采集的社交网络数据异构到同构中,利用相应的程序调用到应用平台上。
本发明实施例提供的网络压缩模块6压缩方法如下:
A、通过压缩程序获取社交网络框架;
B、将社交网络的全连接层中的权重矩阵W和输入向量x分别转化为高阶张量W和高阶张量X;
C、对步骤B中的高阶张量W进行块项张量分解处理;
D、根据步骤B中的高阶张量X和步骤C中块项张量分解后的高阶张量W将社交网络的全连接层替换为块项张量层;
E、采用后向传播算法对步骤D中替换后的社交网络进行训练。
本发明实施例提供的步骤B中将社交网络的全连接层中的权重矩阵W转化为高阶张量W具体为:将权重矩阵W的行维度和列维度进行均匀分割,表示为层次分块矩阵形式,再将分割后的权重矩阵W转化为高阶张量W。
本发明实施例提供的步骤B中将社交网络的全连接层中的输入向量x转化为高阶张量X具体为:将输入向量x的维度表示为张量形式,再转化为高阶张量X。
本发明实施例提供的步骤C对步骤B中的高阶张量W进行块项张量分解处理具体为:对高阶张量W的维度进行重新排列,使得行维度和列维度对应的输入和输出以成对形式耦合排列,再将高阶张量W分解为若干个塔克分解的和。
本发明实施例提供的步骤D根据步骤B中的高阶张量X和步骤C中块项张量分解后的高阶张量W将社交网络的全连接层替换为块项张量层具体为:将高阶张量X和块项张量分解后的高阶张量W相乘,替换社交网络的全连接层为块项张量层。
本发明实施例提供的社区分析模块7分析方法如下:
(1)通过分析程序针对给定的动态社交网络,从第一个时间片开始,对每个时间片划分该时间片网络对应的社区结构;
(2)根据社区结构划分结果,计算每个时间片网络的superspreader集合和该时间片网络对应的每个社区的superblocker集合;
(3)针对上述superspreader集合,确定每一社区的演化事件1类型;所述演化事件1可能的类型包括产生、合并和扩张事件;
(4)针对上述superblocker集合,确定每一社区的演化事件2类型:所述演化事件2可能的类型包括消失、***和缩减事件。
本发明实施例提供的针对给定的动态社交网络、从第一个时间片开始、对每个时间片划分该时间片网络对应的社区结构,包括如下步骤:
针对给定的动态社交网络,从第一个时间片开始,获得每个时间片网络中各个节点之间的邻居关系;
根据上述邻居关系,通过QCA算法,划分每个时间片网络对应的社区结构。
本发明实施例提供的计算每个时间片网络的superspreader集合和该时间片网络对应的每个社区的superblocker集合,包括如下步骤:
通过DegreeDiscount算法,得到每个时间片网络的superspreader集合;
通过CoreHD算法,得到每个时间片网络对应的每个社区的superblocker集合。
本发明实施例提供的针对上述superspreader集合、确定每一社区的演化事件1类型,包括如下步骤:
根据产生事件的计算模型进行演化事件1类型判断,若当前时间片t的superspreader节点在前一个时间片t-1不存在或者不是superspreader集合中的节点,则判定演化事件1为产生事件,该superspreader节点所代表的社区为当前时间片t新生成的社区;
根据合并事件的计算模型进行演化事件1类型判断,若当前时间片t的同一个社区内的两个superspreader节点在前一个时间片t-1分别属于不同的社区,则判定演化事件1为合并事件,所述两个superspreader节点所代表的社区在当前时间片t发生合并;
根据扩张事件的计算模型进行演化事件1类型判断,若当前时间片t的某个社区内superspreader节点规模大于前一个时间片t-1对应社区的superspreader节点规模,则判定演化事件1为扩展事件,所述社区在当前时间片t发生扩张。
本发明提供的与中央控制模块3连接,用于通过评估程序对社交网络社区影响力进行评估的影响力评估模块8对社区影响力进行评估的方法,如下:
根据***其它模块搜索到的各个社交网络社区信息数据,对社交网络社区信息数据中的对社区不利的数据进行剔除;
对社交网络社区信息数据中,用户的转载量和用户的评论进行数据挖掘提取,得出用户的影响力;
根据用户的影响力,计算一个社交网络的规模和用户量;对一定规模的社交网络中的信息进行抽样,并对一个社交网络的影响力进行估算;
根据一个社交网络的影响力,进行抽样估算高一层次的社交网络影响力。
以上所述仅是对本发明的较佳实施例而已,并非对本发明作任何形式上的限制,凡是依据本发明的技术实质对以上实施例所做的任何简单修改,等同变化与修饰,均属于本发明技术方案的范围内。
Claims (10)
1.一种如权利要求1所述的基于高阶张量分解大规模社交网络社区的检测方法,其特征在于,所述基于高阶张量分解大规模社交网络社区的检测方法,包括以下步骤:
步骤一,通过研究真实网络拓扑结构特性和假设的网络模型之间的差异,借用贝叶斯推断等数学工具,通过最大化似然概率,实现社区及发现;
步骤二,确定社交网络社区信息的搜索特征,即需要采集哪些社交网络社区特征因子;根据确定的社交网络社区特征因子,利用一定在程序对不同的社交网络对象进行相应的数据,利用相应的程序调用到应用平台上;
步骤三,对采集的数据利用PathSim算法通过元路径对网络信息模块采集的相关信息进行相似性搜索,挖掘社交异构信息网络中隐含的丰富语意;并且对社交网络社区演化进行分析,通过评估程序对社交网络社区影响力进行评估;
步骤四,将上述搜索的数据和评估数据结果,对社交网络进行压缩处理;通过显示器显示采集的社交网络社区信息、搜索结果、共享信息、分析结果、评估结果;同时通过共享程序对社交网络社区信息资源进行共享;
所述步骤四中,社交网络进行压缩处理,具体过程如下:
A、通过压缩程序获取社交网络框架;
B、将社交网络的全连接层中的权重矩阵W和输入向量x分别转化为高阶张量W和高阶张量X;
C、对步骤B中的高阶张量W进行块项张量分解处理;
D、根据步骤B中的高阶张量X和步骤C中块项张量分解后的高阶张量W将社交网络的全连接层替换为块项张量层;
E、采用后向传播算法对步骤D中替换后的社交网络进行训练;
所述步骤B中将社交网络的全连接层中的权重矩阵W转化为高阶张量W具体为:将权重矩阵W的行维度和列维度进行均匀分割,表示为层次分块矩阵形式,再将分割后的权重矩阵W转化为高阶张量W。
2.如权利要求1所述基于基于高阶张量分解大规模社交网络社区的检测方法,其特征在于,所述步骤B中将社交网络的全连接层中的输入向量x转化为高阶张量X具体为:将输入向量x的维度表示为张量形式,再转化为高阶张量X。
3.如权利要求1所述基于高阶张量分解大规模社交网络社区的检测方法,其特征在于,所述步骤C对步骤B中的高阶张量W进行块项张量分解处理具体为:对高阶张量W的维度进行重新排列,使得行维度和列维度对应的输入和输出以成对形式耦合排列,再将高阶张量W分解为若干个塔克分解的和。
4.如权利要求1所述基于高阶张量分解大规模社交网络社区的检测方法,其特征在于,所述步骤D根据步骤B中的高阶张量X和步骤C中块项张量分解后的高阶张量W将社交网络的全连接层替换为块项张量层具体为:将高阶张量X和块项张量分解后的高阶张量W相乘,替换社交网络的全连接层为块项张量层。
5.如权利要求1所述基于高阶张量分解大规模社交网络社区的检测方法,其特征在于,所述步骤三中,对社交网络社区演化进行分析方法如下:
(1)通过分析程序针对给定的动态社交网络,从第一个时间片开始,对每个时间片划分该时间片网络对应的社区结构;
(2)根据社区结构划分结果,计算每个时间片网络的superspreader集合和该时间片网络对应的每个社区的superblocker集合;
(3)针对上述superspreader集合,确定每一社区的演化事件1类型;所述演化事件1可能的类型包括产生、合并和扩张事件;
(4)针对上述superblocker集合,确定每一社区的演化事件2类型:所述演化事件2可能的类型包括消失、***和缩减事件。
6.如权利要求5所述基于高阶张量分解大规模社交网络社区的检测方法,其特征在于,所述针对给定的动态社交网络、从第一个时间片开始、对每个时间片划分该时间片网络对应的社区结构,包括如下步骤:
针对给定的动态社交网络,从第一个时间片开始,获得每个时间片网络中各个节点之间的邻居关系;
根据上述邻居关系,通过QCA算法,划分每个时间片网络对应的社区结构。
7.如权利要求5所述基于高阶张量分解大规模社交网络社区的检测方法,其特征在于,所述计算每个时间片网络的superspreader集合和该时间片网络对应的每个社区的superblocker集合,包括如下步骤:
通过DegreeDiscount算法,得到每个时间片网络的superspreader集合;
通过CoreHD算法,得到每个时间片网络对应的每个社区的superblocker集合;
所述针对上述superspreader集合、确定每一社区的演化事件1类型,包括如下步骤:
根据产生事件的计算模型进行演化事件1类型判断,若当前时间片t的superspreader节点在前一个时间片t-1不存在或者不是superspreader集合中的节点,则判定演化事件1为产生事件,该superspreader节点所代表的社区为当前时间片t新生成的社区;
根据合并事件的计算模型进行演化事件1类型判断,若当前时间片t的同一个社区内的两个superspreader节点在前一个时间片t-1分别属于不同的社区,则判定演化事件1为合并事件,所述两个superspreader节点所代表的社区在当前时间片t发生合并;
根据扩张事件的计算模型进行演化事件1类型判断,若当前时间片t的某个社区内superspreader节点规模大于前一个时间片t-1对应社区的superspreader节点规模,则判定演化事件1为扩展事件,所述社区在当前时间片t发生扩张。
8.如权利要求1所述基于高阶张量分解大规模社交网络社区的检测方法,其特征在于,所述步骤二中,采集社交网络社区信息数据的网络信息采集模块采集社交网络社区信息数据的具体过程如下:
首先,确定社交网络社区信息的搜索特征,即需要采集哪些社交网络社区特征因子;
根据确定的社交网络社区特征因子,利用一定在程序对不同的社交网络对象进行相应的数据;
在采集社交网络数据信息过程中,进行调度采集,与相应的节点同步更新和数据采集;
将上述采集的社交网络数据异构到同构中,利用相应的程序调用到应用平台上。
9.如权利要求1所述基于高阶张量分解大规模社交网络社区的检测方法,其特征在于,所述步骤四中,对社区影响力进行评估的方法,如下:
根据***其它模块搜索到的各个社交网络社区信息数据,对社交网络社区信息数据中的对社区不利的数据进行剔除;
对社交网络社区信息数据中,用户的转载量和用户的评论进行数据挖掘提取,得出用户的影响力;
根据用户的影响力,计算一个社交网络的规模和用户量;对一定规模的社交网络中的信息进行抽样,并对一个社交网络的影响力进行估算;
根据一个社交网络的影响力,进行抽样估算高一层次的社交网络影响力。
10.一种实施如权利要求1-9所述的基于高阶张量分解大规模社交网络社区的检测方法的基于高阶张量分解大规模社交网络社区的检测装置,其特征在于,所述基于高阶张量分解大规模社交网络社区的检测装置包括:
网络信息采集模块,与中央控制模块连接,确定社交网络社区信息的搜索特征,即需要采集哪些社交网络社区特征因子;根据确定的社交网络社区特征因子,利用一定在程序对不同的社交网络对象进行相应的数据;在采集社交网络数据信息过程中,进行调度采集,与相应的节点同步更新和数据采集;将上述采集的社交网络数据异构到同构中,利用相应的程序调用到应用平台上;
异构网络信息处理模块,与中央控制模块连接,用于利用PathSim算法通过元路径对网络信息模块采集的相关信息进行相似性搜索,挖掘社交异构信息网络中隐含的丰富语意;
中央控制模块,与网络信息采集模块、社区搜索模块、社区共享模块、网络压缩模块、社区分析模块、影响力评估模块、显示模块连接,用于通过主机控制各个模块正常工作;
社区搜索模块,与中央控制模块连接,通过研究真实网络拓扑结构特性和假设的网络模型之间的差异,借用贝叶斯推断等数学工具,通过最大化似然概率,实现社区及发现;
社区共享模块,与中央控制模块连接,用于通过共享程序对社交网络社区信息资源进行共享;
网络压缩模块,与中央控制模块连接,用于通过压缩程序对社交网络进行压缩处理;
社区分析模块,与中央控制模块连接,用于对社交网络社区演化进行分析;
影响力评估模块,与中央控制模块连接,根据***其它模块搜索到的各个社交网络社区信息数据,对社交网络社区信息数据中的对社区不利的数据进行剔除;对社交网络社区信息数据中,用户的转载量和用户的评论进行数据挖掘提取,得出用户的影响力;根据用户的影响力,计算一个社交网络的规模和用户量;对一定规模的社交网络中的信息进行抽样,并对一个社交网络的影响力进行估算;根据一个社交网络的影响力,进行抽样估算高一层次的社交网络影响力;
显示模块,与中央控制模块连接,用于通过显示器显示采集的社交网络社区信息、搜索结果、共享信息、分析结果、评估结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911228464.7A CN111047453A (zh) | 2019-12-04 | 2019-12-04 | 基于高阶张量分解大规模社交网络社区的检测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911228464.7A CN111047453A (zh) | 2019-12-04 | 2019-12-04 | 基于高阶张量分解大规模社交网络社区的检测方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111047453A true CN111047453A (zh) | 2020-04-21 |
Family
ID=70234588
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911228464.7A Pending CN111047453A (zh) | 2019-12-04 | 2019-12-04 | 基于高阶张量分解大规模社交网络社区的检测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111047453A (zh) |
Citations (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070239707A1 (en) * | 2006-04-03 | 2007-10-11 | Collins John B | Method of searching text to find relevant content |
US20100185935A1 (en) * | 2009-01-21 | 2010-07-22 | Nec Laboratories America, Inc. | Systems and methods for community detection |
CN102946331A (zh) * | 2012-10-10 | 2013-02-27 | 北京交通大学 | 一种社交网络僵尸用户检测方法及装置 |
CN103325061A (zh) * | 2012-11-02 | 2013-09-25 | 中国人民解放军国防科学技术大学 | 一种社区发现方法和*** |
CN103631970A (zh) * | 2013-12-20 | 2014-03-12 | 百度在线网络技术(北京)有限公司 | 挖掘属性和实体关联关系的方法和装置 |
CN103810260A (zh) * | 2014-01-27 | 2014-05-21 | 西安理工大学 | 基于拓扑特性的复杂网络社团发现方法 |
CN104268629A (zh) * | 2014-09-15 | 2015-01-07 | 西安电子科技大学 | 一种基于先验信息和网络固有信息的复杂网络社区检测方法 |
CN104484825A (zh) * | 2014-12-05 | 2015-04-01 | 上海师范大学 | 社交网络社区影响力评估算法 |
CN105095988A (zh) * | 2015-07-01 | 2015-11-25 | 中国科学院计算技术研究所 | 社交网络信息爆发检测方法与*** |
CN105677844A (zh) * | 2016-01-06 | 2016-06-15 | 北京摩比万思科技有限公司 | 一种移动广告大数据的定向推送及用户跨屏识别方法 |
CN105825430A (zh) * | 2016-01-08 | 2016-08-03 | 南通弘数信息科技有限公司 | 一种基于异构社会网络的检测方法 |
CN106682142A (zh) * | 2016-12-21 | 2017-05-17 | 兰州交通大学 | 特定事件情境下网络用户情感挖掘与传播特征分析方法 |
CN106789285A (zh) * | 2016-12-28 | 2017-05-31 | 西安交通大学 | 一种在线社会网络多尺度社区发现方法 |
CN106778537A (zh) * | 2016-11-28 | 2017-05-31 | 中国科学院心理研究所 | 一种基于图像处理的动物社交网络结构采集及分析***及其方法 |
CN106780053A (zh) * | 2015-11-20 | 2017-05-31 | 香港中文大学深圳研究院 | 一种基于节点连接偏好的重叠社区发现方法及*** |
CN106802956A (zh) * | 2017-01-19 | 2017-06-06 | 山东大学 | 一种基于加权异构信息网络的电影推荐方法 |
CN107153713A (zh) * | 2017-05-27 | 2017-09-12 | 合肥工业大学 | 社交网络中基于节点间相似性的重叠社区检测方法及*** |
CN107527295A (zh) * | 2017-08-24 | 2017-12-29 | 中南大学 | 基于时态合著网络的学术团队动态社区发现方法及其质量评估方法 |
CN107944556A (zh) * | 2017-12-12 | 2018-04-20 | 电子科技大学 | 基于块项张量分解的深度神经网络压缩方法 |
CN108062360A (zh) * | 2017-11-29 | 2018-05-22 | 广东技术师范学院 | 一种大规模复杂网络社区结构检测的方法、***及装置 |
CN108304496A (zh) * | 2018-01-11 | 2018-07-20 | 上海交通大学 | 异构信息网中基于组合元路径的节点相似关系检测方法 |
CN108334580A (zh) * | 2018-01-25 | 2018-07-27 | 重庆邮电大学 | 一种结合链接和属性信息的社区发现方法 |
CN108899898A (zh) * | 2018-07-12 | 2018-11-27 | 四川大学 | 一种无功电压分区方法 |
CN109460299A (zh) * | 2018-11-08 | 2019-03-12 | 中山大学 | 一种分布式并行多源社交网络数据采集***和方法 |
CN109493246A (zh) * | 2018-11-22 | 2019-03-19 | 中国矿业大学 | 一种动态社交网络社区演化分析方法及其*** |
CN109829089A (zh) * | 2018-12-12 | 2019-05-31 | 中国科学院计算技术研究所 | 基于关联图谱的社交网络用户异常检测方法和*** |
CN110334264A (zh) * | 2019-06-27 | 2019-10-15 | 北京邮电大学 | 一种针对异构动态信息网络的社区检测方法及装置 |
CN110443265A (zh) * | 2018-05-04 | 2019-11-12 | 北京京东尚科信息技术有限公司 | 一种基于社团的行为检测方法和装置 |
-
2019
- 2019-12-04 CN CN201911228464.7A patent/CN111047453A/zh active Pending
Patent Citations (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070239707A1 (en) * | 2006-04-03 | 2007-10-11 | Collins John B | Method of searching text to find relevant content |
US20100185935A1 (en) * | 2009-01-21 | 2010-07-22 | Nec Laboratories America, Inc. | Systems and methods for community detection |
CN102946331A (zh) * | 2012-10-10 | 2013-02-27 | 北京交通大学 | 一种社交网络僵尸用户检测方法及装置 |
CN103325061A (zh) * | 2012-11-02 | 2013-09-25 | 中国人民解放军国防科学技术大学 | 一种社区发现方法和*** |
CN103631970A (zh) * | 2013-12-20 | 2014-03-12 | 百度在线网络技术(北京)有限公司 | 挖掘属性和实体关联关系的方法和装置 |
CN103810260A (zh) * | 2014-01-27 | 2014-05-21 | 西安理工大学 | 基于拓扑特性的复杂网络社团发现方法 |
CN104268629A (zh) * | 2014-09-15 | 2015-01-07 | 西安电子科技大学 | 一种基于先验信息和网络固有信息的复杂网络社区检测方法 |
CN104484825A (zh) * | 2014-12-05 | 2015-04-01 | 上海师范大学 | 社交网络社区影响力评估算法 |
CN105095988A (zh) * | 2015-07-01 | 2015-11-25 | 中国科学院计算技术研究所 | 社交网络信息爆发检测方法与*** |
CN106780053A (zh) * | 2015-11-20 | 2017-05-31 | 香港中文大学深圳研究院 | 一种基于节点连接偏好的重叠社区发现方法及*** |
CN105677844A (zh) * | 2016-01-06 | 2016-06-15 | 北京摩比万思科技有限公司 | 一种移动广告大数据的定向推送及用户跨屏识别方法 |
CN105825430A (zh) * | 2016-01-08 | 2016-08-03 | 南通弘数信息科技有限公司 | 一种基于异构社会网络的检测方法 |
CN106778537A (zh) * | 2016-11-28 | 2017-05-31 | 中国科学院心理研究所 | 一种基于图像处理的动物社交网络结构采集及分析***及其方法 |
CN106682142A (zh) * | 2016-12-21 | 2017-05-17 | 兰州交通大学 | 特定事件情境下网络用户情感挖掘与传播特征分析方法 |
CN106789285A (zh) * | 2016-12-28 | 2017-05-31 | 西安交通大学 | 一种在线社会网络多尺度社区发现方法 |
CN106802956A (zh) * | 2017-01-19 | 2017-06-06 | 山东大学 | 一种基于加权异构信息网络的电影推荐方法 |
CN107153713A (zh) * | 2017-05-27 | 2017-09-12 | 合肥工业大学 | 社交网络中基于节点间相似性的重叠社区检测方法及*** |
CN107527295A (zh) * | 2017-08-24 | 2017-12-29 | 中南大学 | 基于时态合著网络的学术团队动态社区发现方法及其质量评估方法 |
CN108062360A (zh) * | 2017-11-29 | 2018-05-22 | 广东技术师范学院 | 一种大规模复杂网络社区结构检测的方法、***及装置 |
CN107944556A (zh) * | 2017-12-12 | 2018-04-20 | 电子科技大学 | 基于块项张量分解的深度神经网络压缩方法 |
CN108304496A (zh) * | 2018-01-11 | 2018-07-20 | 上海交通大学 | 异构信息网中基于组合元路径的节点相似关系检测方法 |
CN108334580A (zh) * | 2018-01-25 | 2018-07-27 | 重庆邮电大学 | 一种结合链接和属性信息的社区发现方法 |
CN110443265A (zh) * | 2018-05-04 | 2019-11-12 | 北京京东尚科信息技术有限公司 | 一种基于社团的行为检测方法和装置 |
CN108899898A (zh) * | 2018-07-12 | 2018-11-27 | 四川大学 | 一种无功电压分区方法 |
CN109460299A (zh) * | 2018-11-08 | 2019-03-12 | 中山大学 | 一种分布式并行多源社交网络数据采集***和方法 |
CN109493246A (zh) * | 2018-11-22 | 2019-03-19 | 中国矿业大学 | 一种动态社交网络社区演化分析方法及其*** |
CN109829089A (zh) * | 2018-12-12 | 2019-05-31 | 中国科学院计算技术研究所 | 基于关联图谱的社交网络用户异常检测方法和*** |
CN110334264A (zh) * | 2019-06-27 | 2019-10-15 | 北京邮电大学 | 一种针对异构动态信息网络的社区检测方法及装置 |
Non-Patent Citations (2)
Title |
---|
李立: "基于元路径选择和融合的异构信息网络社区挖掘算法研究" * |
陈硕: ""基于张量分解的微博社区发现研究" * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107229708B (zh) | 一种个性化出行服务大数据应用***及方法 | |
Ranshous et al. | Anomaly detection in dynamic networks: a survey | |
CN103678670B (zh) | 一种微博热词与热点话题挖掘***及方法 | |
JP5092165B2 (ja) | データ構築方法とシステム | |
CN104820708B (zh) | 一种基于云计算平台的大数据聚类方法和装置 | |
CN111611488A (zh) | 基于人工智能的信息推荐方法、装置、电子设备 | |
CN110555172A (zh) | 用户关系挖掘方法及装置、电子设备和存储介质 | |
CN110647995A (zh) | 规则训练方法、装置、设备及存储介质 | |
CN116455861B (zh) | 一种基于大数据的计算机网络安全监测***及方法 | |
CN113011471A (zh) | 一种社交群体的划分方法、划分***及相关装置 | |
CN115795329B (zh) | 一种基于大数据网格下的用电异常行为分析方法和装置 | |
CN116881430B (zh) | 一种产业链识别方法、装置、电子设备及可读存储介质 | |
CN111831706A (zh) | 一种应用之间关联规则的挖掘方法、装置及存储介质 | |
Souravlas et al. | Probabilistic community detection in social networks | |
CN112765313B (zh) | 一种基于原文和评论信息分析算法的虚假信息检测方法 | |
CN108345620B (zh) | 品牌信息处理方法、装置、存储介质及电子设备 | |
CN105512270B (zh) | 一种确定相关对象的方法和装置 | |
CN115329078B (zh) | 文本数据处理方法、装置、设备以及存储介质 | |
CN116450938A (zh) | 一种基于图谱的工单推荐实现方法及*** | |
Song et al. | Inferring explicit and implicit social ties simultaneously in mobile social networks | |
CN111047453A (zh) | 基于高阶张量分解大规模社交网络社区的检测方法及装置 | |
CN111107493B (zh) | 一种移动用户位置预测方法与*** | |
CN113987126A (zh) | 基于知识图谱的检索方法及装置 | |
CN114003803A (zh) | 一种社交平台上特定地域的媒体账号发现方法及*** | |
CN112446542A (zh) | 基于注意力神经网络的社交网络链路预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200421 |