CN111651565A

CN111651565A - 一种社交媒体平台虚假信息识别***

Info

Publication number: CN111651565A
Application number: CN202010609485.XA
Authority: CN
Inventors: 杨良斌; 于腊梅
Original assignee: International Relations, University of
Current assignee: International Relations, University of
Priority date: 2020-06-29
Filing date: 2020-06-29
Publication date: 2020-09-11

Abstract

本发明公开了一种社交媒体平台虚假信息识别***，涉及虚假信息识别技术领域，包括采集模块和识别模块，所述采集模块采集社交媒体平台特征信息并传输至所述识别模块，所述识别模块进行对社交媒体平台特征信息进行识别并确定虚假信息输出，所述识别模块包括虚假信息检测单元，所述虚假信息检测单元包括词水平语义情感分析和句子水平语义情感分析。本发明社交媒体平台虚假信息识别***，通过对输入特征信息进行定义词水平语义情感分析和句子水平语义情感分析，实现虚假信息检测识别并过滤，提高虚假信息识别的准确度和提高虚假信息识别的泛化能力，应用范围广。

Description

一种社交媒体平台虚假信息识别***

技术领域

本发明涉及虚假信息识别技术领域，具体来说，涉及一种社交媒体平台虚假信息识别***。

背景技术

社交媒体平台给我们工作和日常生活带来方便的同时，也产生了很多负面问题，特别是谣言和虚假信息众多，而且通过社交媒体平台，新鲜的消息不再以口耳相传的方式进行传播，通过网络传播的成本大大降低，很多媒体为了造成高影响力而雇佣水军进行转发，这样的转发不仅没有质量，而且容易造成误导，给人们生活带来严重的困扰。因此，对社交媒体平台的虚假信息进行准确快速的识别是非常必要的。

目前识别社交媒体平台虚假信息的方法大都采用统计学***台的全局信息进行虚假识别，这样当数据规模比较大的时候，其识别速度非常慢，也很难满足实时性的要求。

针对相关技术中的问题，目前尚未提出有效的解决方案。

发明内容

针对相关技术中的问题，本发明提出一种社交媒体平台虚假信息识别***，以克服现有相关技术所存在的上述技术问题。

本发明的技术方案是这样实现的：

一种社交媒体平台虚假信息识别***，包括采集模块和识别模块，其中，所述采集模块采集社交媒体平台特征信息并传输至所述识别模块，所述识别模块进行对社交媒体平台特征信息进行识别并确定虚假信息输出，其中；所述识别模块包括虚假信息检测单元，所述虚假信息检测单元包括词水平语义情感分析和句子水平语义情感分析，其中；

所述词水平语义情感分析，包括：

其嵌入矩阵W_e，将单词w_it映射到一个向量y_it中，表示如下：

y_it＝W_ew_it,t∈[1,L_w]；

以

来结合

和

获取包含以单词w_it为中心的所有信息；

其中一个句子中的单词数量为w个，每个单词的权值依赖于情感信息h_it，其注意力权值计算公式如下：

其中，c_it是情感权值h_it的隐式表示，c^w是与c_it同一维度的随机向量，c^w可以在模型训练的过程中学习得到；

所述句子水平语义情感分析，包括：

每条评论中的句子数量为s个，表示为：

以

来结合

和

获取包含以句子s_i为中心的所有信息，

获取评论中每个句子的权值，因为每条评论中的句子数量为s个，具体公式如下：

其中，v是包含了评论中所有信息的向量。

进一步的，所述识别模块进一步包括虚假信息分析单元和推荐单元。

进一步的，所述虚假信息分析单元，包括获取媒体平台信息ot_ui和标记虚假信息r_ui，过滤恶意虚假信息，并确定d_ui作为恶意虚假信息交互行为指示符，表示如下：

{d_ui|d_ui＝1,|ot_ui―r_ui|≥α；d_ui＝0,|ot_ui―r_ui∣<α}；

其中，标定恶意虚假信息交互行为指示符d_ui构建用户项目交互指示矩阵R_in,R_in∈R^m*n；

指示符d_ui，恶意虚假信息用户集合u^s的计算函数，表示为：

进一步的，所述推荐单元包括将词水平包含的信息与句子水平上包含的信息进行了整合，得到的评论水平上的向量；获取计算评论意见水平ot，表示为：

ot＝F(softmax(W_vv+b_v))。

进一步的，所述采集模块包括数据信息采集单元、音频信息采集单元和图像信息采集单元，其中，

所述数据信息采集单元，用于社交媒体平台数据信息进行采集；

所述音频信息采集单元，用于社交媒体平台音频信息进行采集；

所述图像信息采集单元，用于社交媒体平台图像信息进行采集。

本发明的有益效果：

本发明社交媒体平台虚假信息识别***，通过采集模块采集社交媒体平台特征信息并传输至所述识别模块，而识别模块进行对社交媒体平台特征信息进行识别并确定虚假信息输出，通过对输入特征信息进行定义词水平语义情感分析和句子水平语义情感分析，实现虚假信息检测识别并过滤，提高虚假信息识别的准确度和提高虚假信息识别的泛化能力，应用范围广。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是根据本发明实施例的一种社交媒体平台虚假信息识别***的原理框图；

图2是根据本发明实施例的一种社交媒体平台虚假信息识别***的识别模块模型示意图。

图中：

1、采集模块；2、识别模块。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员所获得的所有其他实施例，都属于本发明保护的范围。

根据本发明的实施例，提供了一种社交媒体平台虚假信息识别***。

如图1-图2所示，根据本发明实施例的社交媒体平台虚假信息识别***，包括采集模块1和识别模块2，其中，所述采集模块1采集社交媒体平台特征信息并传输至所述识别模块2，所述识别模块2进行对社交媒体平台特征信息进行识别并确定虚假信息输出，其中；所述识别模块2包括虚假信息检测单元，所述虚假信息检测单元包括词水平语义情感分析和句子水平语义情感分析，其中；

所述词水平语义情感分析，包括：

y_it＝W_ew_it,t∈[1,L_w]；

以

来结合

和

获取包含以单词w_it为中心的所有信息；

所述句子水平语义情感分析，包括：

每条评论中的句子数量为s个，表示为：

以

来结合

和

获取包含以句子s_i为中心的所有信息，

其中，v是包含了评论中所有信息的向量。

借助于上述方案，通过采集模块1采集社交媒体平台特征信息并传输至所述识别模块2，而识别模块2进行对社交媒体平台特征信息进行识别并确定虚假信息输出，通过对输入特征信息进行定义词水平语义情感分析和句子水平语义情感分析，实现虚假信息检测识别并过滤，提高虚假信息识别的准确度和提高虚假信息识别的泛化能力，应用范围广。

其中，所述识别模块2进一步包括虚假信息分析单元和推荐单元。

其中，所述虚假信息分析单元，包括获取媒体平台信息ot_ui和标记虚假信息r_ui，过滤恶意虚假信息，并确定d_ui作为恶意虚假信息交互行为指示符，表示如下：

{d_ui|d_ui＝1,∣ot_ui―r_ui∣≥α；d_ui＝0,∣ot_ui―r_ui∣<α}；

指示符d_ui，恶意虚假信息用户集合u^s的计算函数，表示为：

其中，所述推荐单元包括将词水平包含的信息与句子水平上包含的信息进行了整合，得到的评论水平上的向量；获取计算评论意见水平ot，表示为：

ot＝F(softmax(W_vv+b_v))。

其中，所述采集模块1包括数据信息采集单元、音频信息采集单元和图像信息采集单元，其中，

另外，采集模块1，以社交媒体平台中的无标签数据为输入，利用Word2vec词嵌套技术映射成长度为u的一维输入向量，然后输入到去噪自编码器(DAE，DenoisingAutoEncoder)中实现无标签数据的特征提取。在去噪自编码器中，我们随机产生长度为u的一维随机噪声向量，该噪声向量的各分量取值只能为0或1，并将它与一维输入向量做位与操作得到一个新的带噪声的一维向量。

综上所述，借助于本发明的上述技术方案，通过采集模块1采集社交媒体平台特征信息并传输至所述识别模块2，而识别模块2进行对社交媒体平台特征信息进行识别并确定虚假信息输出，通过对输入特征信息进行定义词水平语义情感分析和句子水平语义情感分析，实现虚假信息检测识别并过滤，提高虚假信息识别的准确度和提高虚假信息识别的泛化能力，应用范围广。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种社交媒体平台虚假信息识别***，其特征在于，包括采集模块(1)和识别模块(2)，其中，所述采集模块(1)采集社交媒体平台特征信息并传输至所述识别模块(2)，所述识别模块(2)进行对社交媒体平台特征信息进行识别并确定虚假信息输出，其中；所述识别模块(2)包括虚假信息检测单元，所述虚假信息检测单元包括词水平语义情感分析和句子水平语义情感分析，其中；

所述词水平语义情感分析，包括：

y_it＝W_ew_it,t∈[1,L_w]；