CN112988959A - 基于证据推断网络的虚假新闻可解释性检测***及方法 - Google Patents

基于证据推断网络的虚假新闻可解释性检测***及方法 Download PDF

Info

Publication number
CN112988959A
CN112988959A CN202110045012.6A CN202110045012A CN112988959A CN 112988959 A CN112988959 A CN 112988959A CN 202110045012 A CN202110045012 A CN 202110045012A CN 112988959 A CN112988959 A CN 112988959A
Authority
CN
China
Prior art keywords
sequence
false news
news
false
sequences
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110045012.6A
Other languages
English (en)
Other versions
CN112988959B (zh
Inventor
饶元
吴连伟
兰玉乾
孙菱
郑鹏怡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian Jiaotong University
Original Assignee
Xian Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian Jiaotong University filed Critical Xian Jiaotong University
Priority to CN202110045012.6A priority Critical patent/CN112988959B/zh
Publication of CN112988959A publication Critical patent/CN112988959A/zh
Application granted granted Critical
Publication of CN112988959B publication Critical patent/CN112988959B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本发明公开了一种基于证据推断网络的虚假新闻可解释性检测***及方法,包括:输入虚假新闻内容序列、所有相关文章的拼接序列以及若干不同的单个相关文章序列;使虚假新闻内容序列与所有的相关文章特征进行交互,捕获两种类型的序列特征;将整体观点序列与每个相关文章的序列进行互相交互,探索每个相关文章中细粒度的潜在的序列冲突;将核心序列片段与潜在的序列冲突进行一致性建模,脾胃围绕虚假新闻的核心序列片段的冲突,进行可解释性虚假新闻的检测。本发明细粒度地聚焦待检测新闻的虚假核心语义片段,从相关文章中探索可解释的证据,从而提升虚假新闻检测的可解释性。不仅提高了假新闻检测性能,还提供了有效的证据实现检测结果的可解释性。

Description

基于证据推断网络的虚假新闻可解释性检测***及方法
技术领域
本发明涉及一种基于证据推断网络的虚假新闻可解释性检测***及方法。
背景技术
研究显示,尽管虚假新闻的占比只相当于所有媒体新闻总消费的1%,但在 社交媒体中虚假新闻的与所有推文新闻的比值高达6%。因此,对社交媒体上的 虚假新闻进行准确高效地检测,阻止他们的传播与扩散,并寻找到相关的证据对 他们进行辟谣,是当前社交媒体分析领域一项非常关键的任务。
虚假新闻检测是当今工业界和学术界面临的一项艰巨而富有挑战性的任务。 以前的研究致力于围绕待检测新闻的文本内容以及其相关的元数据特征来抽取 各种丰富的语言语义特征以及人工提取的特征,其已经实现了比较出色的性能。 但是,这些方法存在着普遍的缺陷,即很难对虚假新闻的检测结果提供有效的解释,通俗的讲,也就是为什么将一个新闻检测为假,其究竟哪里出错了?对于这 个问题,当前的研究开始聚焦于可解释性的虚假新闻检测,其通过构建虚假新闻 及其相关文章之间的交互,并寻求他们之间的冲突或质疑语义来作为证据,并解 释相应的检测结果。当前探索构建一个交互模型来解决可解释性虚假新闻检测任 务是一个比较合理的思路,主要原因在于:不同的相关文章,作为不同用户对具 体新闻的意见,即使有时无法具体地揭示出为什么这个新闻是虚假的,但往往容 易对虚假新闻的错误部分提出质疑,这些相关文章类似于“众包”辟谣。然而, 这些方法通常忽略了这样一个事实,也就是捕获的冲突语义并不都是围绕虚假新 闻的虚假部分而展开的,也包含了对一些新闻的非虚假的部分的质疑语义,这就 使得通过很多冲突或质疑语义作为证据来解释虚假新闻的检测结果是不够细粒 度的。因此,如何捕获虚假新闻与相关文章之间的冲突语义从而聚焦虚假新闻中 细粒度的核心虚假部分,这也是虚假新闻可解释性研究的核心问题。
发明内容
本发明的目的在于解决现有技术中的问题,提供一种基于证据推断网络的虚 假新闻可解释性检测***及方法,
为达到上述目的,本发明采用以下技术方案予以实现:
基于证据推断网络的虚假新闻可解释性检测方法,包括以下步骤:
步骤1,输入虚假新闻内容序列、所有相关文章的拼接序列以及若干不同的 单个相关文章序列,通过BiLSTM分别捕获三者内部的上下文隐层序列表示;
步骤2,使虚假新闻内容序列与所有的相关文章特征进行交互,捕获两种类 型的序列特征,聚焦虚假新闻内容中用户关心的核心序列片段,学习相关文章中 所有用户的整体观点序列;
步骤3,将整体观点序列与每个相关文章的序列进行互相交互,探索每个相 关文章中细粒度的潜在的序列冲突;
步骤4,将核心序列片段与潜在的序列冲突进行一致性建模,脾胃围绕虚假 新闻的核心序列片段的冲突,从而进行可解释性虚假新闻的检测。
本发明进一步的改进在于:
所述步骤1的具体方法如下:
BiLSTM模型对输入虚假新闻内容序列、所有相关文章的拼接序列以及若干 不同的单个相关文章序列进行编码,并采用最后一个步骤的隐藏层向量ei作为每 个序列的上下文表示;
虚假新闻内容序列、所有相关文章的拼接序列以及若干不同的单个相关文章 序列,针对每个包含k个单词的序列,这三个序列均能够表示为X={x1,x2,…,xk}, 每个单词的嵌入表示
Figure BDA0002896892890000031
是一个d维的向量,其可通过预训练词嵌入向量进行 初始化;
虚假新闻的编码特征、所有相关文章的编码特征以及每个相关文章的编码特 征分别表示为ec
Figure BDA0002896892890000032
以及
Figure BDA0002896892890000033
其中1≤j≤R。
所述步骤2中,通过交叉注意力单元以及两个门控仿射吸收单元使每个虚假 新闻内容与所有相关文章互相交互,筛选出适应于各自的有价值特征。
所述交叉注意力单元中,使用自注意力网络作为交叉注意力三元来显式地捕 获序列中词与词之间的依赖特征并学习内在结构信息,确保两个序列之间的深层 交互,具体方法如下:
Figure BDA0002896892890000034
其中,H为自注意力网络的结果,Q,K,V分别为查询、键以及值矩阵;
Figure BDA0002896892890000035
以及K=V=ec,T为转置操作,dk是阶段1中BiLSTM的隐藏层大小,其值为 2h;
自注意力网络为多头注意力网络,用于对Q,K,V进行m次的线性映射,然后 并行地执行点乘注意力;多头注意力网络headi
Figure BDA0002896892890000041
Hs=MultiHead(Q,K,V)=Concat(head1,head2,…,headm)Wo (3)
其中,
Figure BDA0002896892890000042
Figure BDA0002896892890000043
Figure BDA0002896892890000044
以及
Figure BDA0002896892890000045
都为可 训练的参数,d1的尺度大小为2h/m以及Hs的大小为
Figure BDA0002896892890000046
Hs是虚假新闻与所有 相关文章的交互特征。
所述门控仿射吸收单元用于捕获有利于各自序列的特征,以至于自适应地聚 焦虚假新闻序列中显著的序列片段特征,并聚焦相关文章序列中的用户整体观点 序列;所述门控仿射吸收单元的结构为:
tc=tanh(WcHc+bc) (4)
ts=tanh(WsHs+bs) (5)
α(ec)=Wαtc+bα (6)
β(Hs)=Wβts+bβ (7)
γ(Hs)=Wγts+bγ (8)
Figure BDA0002896892890000047
其中,tc为基于新闻序列的变换结果,c为新闻序列,tanh为激活函数,ts为 基于相关文章序列的变换结果,s为所有相关文章拼接序列,Hc为基于新闻序列 的隐藏层表示,Hs为基于相关文章序列的隐藏层表示,α()为基于新闻序列的 仿射结果,β()为第一种基于相关文章序列的仿射结果,γ()为第二种基于相关 文章序列的仿射结果,所有的W和b都为可学习的参数,⊙表示元素与元素之间 的点乘操作;针对所有相关文章的门控G2与针对虚假新闻的门控G1的结构是 相同的,且
Figure BDA0002896892890000048
Figure BDA0002896892890000049
分别为门控G1和G2所对应的输出特征,分别为虚假新闻中 的核心序列片段以及所有相关文章中的整体观点序列。
所述步骤3中,通过交叉注意力单元用于将整体观点序列
Figure BDA0002896892890000051
与局部单个相关 文章语义
Figure BDA0002896892890000052
充分交互与融合;交叉注意力网络为:
Figure BDA0002896892890000053
其中,
Figure BDA0002896892890000054
表示针对第i个相关文章捕获的冲突语义。
所述步骤4的具体方法如下:
使用两个BiLSTM模块来分别编码虚假新闻的核心序列片段
Figure BDA0002896892890000055
以及每个相 关文章的冲突语义
Figure BDA0002896892890000056
并借助BiLSTM的隐藏层输出来作为其上下文表示,分 别表示为
Figure BDA0002896892890000057
Figure BDA0002896892890000058
借助注意力机制来匹配虚假新闻以及每个相关文章的显著特征,对于第i个 相关文章中的第j个词,注意力机制为:
Figure BDA0002896892890000059
Figure BDA00028968928900000510
其中,
Figure BDA00028968928900000511
是第i个文章的冲突
Figure BDA00028968928900000512
的第j个词,
Figure BDA00028968928900000513
以及
Figure BDA00028968928900000514
分别是冲突的第j个词对整个虚假新闻序列的原始归一化关联度测量;
通过整个虚假新闻的序列与相关文章的冲突序列交互,能够得到虚假新闻指 导的冲突表示
Figure BDA00028968928900000515
Figure BDA00028968928900000516
构建元素之间的求和计算来整合虚假新闻指导的冲突与编码冲突的整体序 列:
Figure BDA00028968928900000517
其中,
Figure BDA0002896892890000061
是第i个相关文章的冲突复合表示,
Figure BDA0002896892890000062
是元素之间的求和计算操作;
Figure BDA0002896892890000063
Figure BDA0002896892890000064
进行拼接,然后将其输入仅一个全连接层来得到一个低维的预测 向量,作为虚假新闻的核心片段与相关文章的冲突之间的一致性表示
Figure BDA0002896892890000065
Figure BDA0002896892890000066
对于不同的单个相关文章,以类似的操作得到各自的一致性预测向量,即
Figure BDA0002896892890000067
通过拼接操作整合相关文章的一致性预测向量,并通过下列公式预测其概率 分布p:
Figure BDA0002896892890000068
其中,Wp与bp皆为可训练的参数。
通过交叉熵误差的最小化来训练模型:
loss=-∑ylogp (17)
其中,y为基于真值标签。
基于证据推断网络的虚假新闻可解释性检测***,包括:
输入编码模块,所述输入编码模块用于输入虚假新闻内容序列、所有相关文 章的拼接序列以及若干不同的单个相关文章序列,通过BiLSTM分别捕获三者内 部的上下文隐层序列表示;
互相交互共享模块,所述互相交互共享模块用于使虚假新闻内容序列与所有 的相关文章特征进行交互,捕获两种类型的序列特征,聚焦虚假新闻内容中用户 关心的核心序列片段,学习相关文章中所有用户的整体观点序列;
细粒度冲突发掘模块,所述细粒度冲突发掘模块用于将整体观点序列与每个 相关文章的序列进行互相交互,探索每个相关文章中细粒度的潜在的序列冲突;
基于证据的一致性模块,所述基于证据的一致性模块用于将核心序列片段与 潜在的序列冲突进行一致性建模,脾胃围绕虚假新闻的核心序列片段的冲突,从 而进行可解释性虚假新闻的检测。
与现有技术相比,本发明具有以下有益效果:
本发明细粒度地聚焦待检测新闻的虚假核心语义片段,从相关文章中探索可 解释的证据,从而提升虚假新闻检测的可解释性。不仅提高了假新闻检测性能, 还提供了有效的证据实现检测结果的可解释性。本发明作为一个创新的细粒度可 解释性虚假新闻检测框架,能够捕获哪些质疑虚假新闻的核心内容的冲突作为证 据,从而验证虚假新闻检测的结果。本发明提出的互相交互共享模块借助门控仿 射吸收模块能够分别自适应地聚焦虚假新闻的核心语义片段以及相关文章的整 体观点语义。本发明提出的基于证据的一致性模块借助一致性建模能够有效地匹 配质疑虚假新闻核心内容的冲突特征。本发明在两个流行的虚假新闻检测数据集 上证实了其有效性以及可解释性。
附图说明
为了更清楚的说明本发明实施例的技术方案,下面将对实施例中所需要使用 的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此 不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳 动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明的架构图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实 施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所 描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中 描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求 保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施 例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例, 都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一 项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
在本发明实施例的描述中,需要说明的是,若出现术语“上”、“下”、“水平”、 “内”等指示的方位或位置关系为基于附图所示的方位或位置关系,或者是该发 明产品使用时惯常摆放的方位或位置关系,仅是为了便于描述本发明和简化描述, 而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和 操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”等仅用于 区分描述,而不能理解为指示或暗示相对重要性。
此外,若出现术语“水平”,并不表示要求部件绝对水平,而是可以稍微倾 斜。如“水平”仅仅是指其方向相对“竖直”而言更加水平,并不是表示该结构 一定要完全水平,而是可以稍微倾斜。
在本发明实施例的描述中,还需要说明的是,除非另有明确的规定和限定, 若出现术语“设置”、“安装”、“相连”、“连接”应做广义理解,例如,可以是固 定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连 接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连 通。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明 中的具体含义。
下面结合附图对本发明做进一步详细描述:
参见图1,本发明实施例公开了一种基于证据推断网络的虚假新闻可解释性 检测***,包括:
模块1.输入编码模块:模型借助虚假新闻内容、所有相关文章的整体语义 以及不同的单个相关文章等三种类型的输入,通过BiLSTM分别捕获其内部的上 下文隐层语义表示。
模块2.互相交互共享模块:该模块使相关新闻内容语义与所有的相关文章 特征进行交互,从而自适应地捕获两种类型的语义特征,一方面聚焦虚假新闻内 容中用户广泛关心的核心语义片段,一方面学习相关文章中所有用户的整体观点 语义。
模块3.细粒度冲突发掘模块:借助模块2获得的整体观点语义与每个相关 文章的语义进行互相交互,从而探索每个文章中细粒度的潜在的语义冲突。
模块4.基于证据的一致性模块:为了从模块3中筛选能够成为真正证据的 冲突,该模块构建虚假新闻的核心语义片段(模块2获得的)与潜在的语义冲突 (模块3得到的)进行一致性建模,进而匹配围绕虚假新闻核心语义的冲突,从 而借助这些冲突进行可解释性虚假新闻检测。
本发明实施例还公开了一种基于证据推断网络的虚假新闻可解释性检测方 法,包括以下步骤:
步骤0:给定数量为N的数据集
Figure BDA0002896892890000091
其中xi指一条待检测可 信度的新闻,Ri为包含m条相关文章的集合Ri={R1,R3,…,Rm},yi表示真假二分 类标签;
步骤1:该模型包含三种类型的输入序列,分别是虚假新闻内容序列xi,所 有的相关文章(数量为R)的拼接序列以及不同的单个相关文章序列。在这三种 序列中,针对每个包含k个单词的序列,该序列可表示为X={x1,x2,…,xk},每个 单词的嵌入表示
Figure BDA0002896892890000101
是一个d维的向量,其可通过预训练词嵌入向量进行初始 化。紧接着,借助BiLSTM模型对这三种序列进行编码,并采用最后一个步骤的 隐藏层向量ei作为每个序列的上下文表示。这样,虚假新闻的编码特征,所有相 关文章的编码特征以及每个相关文章的编码特征分别表示为ec
Figure BDA0002896892890000102
以及
Figure BDA0002896892890000103
(1≤j≤R)。
步骤2:为了使得模型能够分别聚焦虚假新闻的核心语义片段以及所有相关 文章中的整体语义特征,本发明构建了互相交互共享模块,其由一个交叉注意力 单元以及两个门控仿射吸收单元构成,他们使得每个虚假新闻内容与所有相关文 章互相交互从而筛选出适应于他们各自的有价值特征。
步骤3:在交叉注意力单元中,本发明使用自注意力网络作为交叉注意力三 元来显式地捕获序列中词与词之间的依赖特征并学习他们的内在结构信息,从而 确保两个序列之间的深层交互,其可公式化为:
Figure BDA0002896892890000104
其中,Q,K,V分别为查询、键以及值矩阵。在本发明中,
Figure BDA0002896892890000105
以及 K=V=ec,dk是阶段1中BiLSTM的隐藏层大小,其值为2h。
步骤4:为了增强网络的并行性,自注意力网络设计了多头注意力网络对 Q,K,V进行m次的线性映射,然后并行地执行点乘注意力。多头注意力的结构可 公式化为:
Figure BDA0002896892890000111
Hs=MultiHead(Q,K,V)=Concat(head1,head2,…,headm)Wo (3)
其中,
Figure BDA0002896892890000112
Figure BDA0002896892890000113
Figure BDA0002896892890000114
以及
Figure BDA0002896892890000115
都为可 训练的参数,d1的尺度大小为2h/m以及Hs的大小为
Figure BDA0002896892890000116
Hs是虚假新闻与所有 相关文章的交互特征。
步骤5:在门控仿射吸收单元中,考虑到步骤4捕获的Hs属于虚假新闻序列 与所有相关文章序列捕获的共享的交互特征,他们缺乏针对于各自序列对象的特 定上下文语义,本发明设计了门控仿射吸收单元来使得模型捕获有利于各自序列 的特征,以至于自适应地聚焦虚假新闻序列中显著的语义片段特征,并聚焦相关 文章序列中的用户整体观点语义。具体地,门控仿射吸收单元的结构可公式化为:
tc=tanh(WcHc+bc) (4)
ts=tanh(WsHs+bs) (5)
α(ec)=Wαtc+bα (6)
β(Hs)=Wβts+bβ (7)
γ(Hs)=Wγts+bγ (8)
Figure BDA0002896892890000117
其中,所有的W和b都为可学习的参数,⊙表示元素与元素之间的点乘操作。 特别地,针对所有相关文章的门控G2与针对虚假新闻的门控G1的结构是相同 的,且
Figure BDA0002896892890000118
Figure BDA0002896892890000119
分别为门控G1和G2所对应的输出特征,也就是分别为虚假新闻 中的显著特征以及所有相关文章中的整体观点语义。
步骤6:为了探索针对每个相关文章中的聚义的语义冲突,本发明设计了细 粒度的冲突发掘模块,其结构同样是一个交叉注意力单元,能够实现阶段2获得 的用户整体观点
Figure BDA0002896892890000121
与局部单个相关文章语义
Figure BDA0002896892890000122
的充分交互与融合。特别地,交叉 注意力网络已经在阶段2中介绍,其可简化为:
Figure BDA0002896892890000123
其中,
Figure BDA0002896892890000124
表示针对第i个相关文章捕获的冲突语义。
步骤7:为了消除所有相关文章捕获的冲突中与虚假新闻内容不相关的噪声 特征,并推断虚假新闻中的哪些核心语义被质疑,本发明构建了基于证据的一致 性模块来测量虚假新闻的核心语义片段与阶段3获得的每个相关文章的潜在冲突 语义进行一致性比较。
步骤8:在该模块中,首先使用两个BiLSTM模块来分别编码虚假新闻的核 心语义片段
Figure BDA0002896892890000125
以及每个相关文章的冲突语义
Figure BDA0002896892890000126
并借助BiLSTM的隐藏层输出 来作为他们的上下文表示,其可分别表示为
Figure BDA0002896892890000127
Figure BDA0002896892890000128
步骤9:然后,本发明借助注意力机制来匹配虚假新闻以及每个相关文章的 显著特征,对于第i个相关文章中的第j个词,注意力机制可形式化为:
Figure BDA0002896892890000129
Figure BDA00028968928900001210
其中,
Figure BDA00028968928900001211
是第i个文章的冲突
Figure BDA00028968928900001212
的第j个词,
Figure BDA00028968928900001213
以及
Figure BDA00028968928900001214
分别是冲突的第j个词对整个虚假新闻序列的原始归一化关联度测量。
步骤10:这样,通过整个虚假新闻的语义与相关文章的冲突语义交互,本发 明能够得到一个虚假新闻指导的冲突表示
Figure BDA00028968928900001215
其可公式化为:
Figure BDA00028968928900001216
步骤11:为了强化与虚假新闻的核心语义片段相关的冲突语义特征,本发明 构建了元素之间的求和计算来整合虚假新闻指导的冲突与编码冲突的整体语义。
Figure BDA0002896892890000131
其中,
Figure BDA0002896892890000132
是第i个相关文章的冲突复合表示,
Figure BDA0002896892890000133
是元素之间的求和计算操作。
步骤12:本发明将
Figure BDA0002896892890000134
与步骤8获得的
Figure BDA0002896892890000135
进行拼接,然后将其输入仅一个全 连接层来得到一个低维的预测向量,作为虚假新闻的核心片段与相关文章的冲突 之间的一致性表示。
Figure BDA0002896892890000136
步骤13:对于不同的单个相关文章,本发明以类似的操作能够得到他们各自 的一致性预测向量,即
Figure BDA0002896892890000137
步骤14:最后,通过拼接操作来整合这些相关文章的一致性预测向量,并通 过下列公式预测其概率分布。
Figure BDA0002896892890000138
其中,Wp与bp皆为可训练的参数。
步骤15:基于真值标签y,通过交叉熵误差的最小化来训练模型:
loss=-∑ylogp (17)
本发明适用于社交网络环境,且能够提供广泛讨论虚假新闻的相关文章的社 交媒体网络环境中。
本发明(EVIN)在两个具有竞争力的数据集Snopes和PolitiFact上证实了发 明的性能的优越性,如表1所示:
表1本发明在Snopes和PolitiFact两个数据集下的实验性能
Figure BDA0002896892890000141
并证实了其不同的分离模块的有效性,如表2所示:
表2本发明的不同模块在Snopes和PolitiFact两个数据集下的分离性能对比
Figure BDA0002896892890000142
其中,-shared表示移除互相交互共享模块,-gate表示移除门控仿射吸收单 元,-G1表示移除基于虚假新闻的门控仿射吸收单元,-G2表示移除基于相关文 章的门控仿射吸收单元,-conflict表示移除细粒度冲突发掘模块,-coherence表示 移除基于证据的一致性模块。
以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技 术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所 作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.基于证据推断网络的虚假新闻可解释性检测方法,其特征在于,包括以下步骤:
步骤1,输入虚假新闻内容序列、所有相关文章的拼接序列以及若干不同的单个相关文章序列,通过BiLSTM分别捕获三者内部的上下文隐层序列表示;
步骤2,使虚假新闻内容序列与所有的相关文章特征进行交互,捕获两种类型的序列特征,聚焦虚假新闻内容中用户关心的核心序列片段,学习相关文章中所有用户的整体观点序列;
步骤3,将整体观点序列与每个相关文章的序列进行互相交互,探索每个相关文章中细粒度的潜在的序列冲突;
步骤4,将核心序列片段与潜在的序列冲突进行一致性建模,脾胃围绕虚假新闻的核心序列片段的冲突,从而进行可解释性虚假新闻的检测。
2.根据权利要求1所述的基于证据推断网络的虚假新闻可解释性检测方法,其特征在于,所述步骤1的具体方法如下:
BiLSTM模型对输入虚假新闻内容序列、所有相关文章的拼接序列以及若干不同的单个相关文章序列进行编码,并采用最后一个步骤的隐藏层向量ei作为每个序列的上下文表示;
虚假新闻内容序列、所有相关文章的拼接序列以及若干不同的单个相关文章序列,针对每个包含k个单词的序列,这三个序列均能够表示为X={x1,x2,...,xk},每个单词的嵌入表示
Figure FDA0002896892880000011
是一个d维的向量,其可通过预训练词嵌入向量进行初始化;
虚假新闻的编码特征、所有相关文章的编码特征以及每个相关文章的编码特征分别表示为ec
Figure FDA0002896892880000012
以及
Figure FDA0002896892880000013
其中1≤j≤R。
3.根据权利要求1所述的基于证据推断网络的虚假新闻可解释性检测方法,其特征在于,所述步骤2中,通过交叉注意力单元以及两个门控仿射吸收单元使每个虚假新闻内容与所有相关文章互相交互,筛选出适应于各自的有价值特征。
4.根据权利要求3所述的基于证据推断网络的虚假新闻可解释性检测方法,其特征在于,所述交叉注意力单元中,使用自注意力网络作为交叉注意力三元来显式地捕获序列中词与词之间的依赖特征并学习内在结构信息,确保两个序列之间的深层交互,具体方法如下:
Figure FDA0002896892880000021
其中,H为自注意力网络的结果,Q,K,V分别为查询、键以及值矩阵;
Figure FDA0002896892880000022
以及K=V=ec,T为转置操作,dk是阶段1中BiLSTM的隐藏层大小,其值为2h;
自注意力网络为多头注意力网络,用于对Q,K,V进行m次的线性映射,然后并行地执行点乘注意力;多头注意力网络headi
Figure FDA0002896892880000023
Figure FDA0002896892880000024
其中,
Figure FDA0002896892880000025
以及
Figure FDA0002896892880000026
都为可训练的参数,d1的尺度大小为2h/m以及Hs的大小为
Figure FDA0002896892880000027
Hs是虚假新闻与所有相关文章的交互特征。
5.根据权利要求3所述的基于证据推断网络的虚假新闻可解释性检测方法,其特征在于,所述门控仿射吸收单元用于捕获有利于各自序列的特征,以至于自适应地聚焦虚假新闻序列中显著的序列片段特征,并聚焦相关文章序列中的用户整体观点序列;所述门控仿射吸收单元的结构为:
tc=tanh(WcHc+bc) (4)
ts=tanh(WsHs+bs) (5)
α(ec)=Wαtc+bα (6)
β(Hs)=Wβts+bβ (7)
γ(Hs)=Wγts+bγ (8)
Figure FDA0002896892880000031
其中,tc为基于新闻序列的变换结果,c为新闻序列,tanh为激活函数,ts为基于相关文章序列的变换结果,s为所有相关文章拼接序列,Hc为基于新闻序列的隐藏层表示,Hs为基于相关文章序列的隐藏层表示,α()为基于新闻序列的仿射结果,β()为第一种基于相关文章序列的仿射结果,γ()为第二种基于相关文章序列的仿射结果,所有的W和b都为可学习的参数,⊙表示元素与元素之间的点乘操作;针对所有相关文章的门控G2与针对虚假新闻的门控G1的结构是相同的,且
Figure FDA0002896892880000032
Figure FDA0002896892880000033
分别为门控G1和G2所对应的输出特征,分别为虚假新闻中的核心序列片段以及所有相关文章中的整体观点序列。
6.根据权利要求1所述的基于证据推断网络的虚假新闻可解释性检测方法,其特征在于,所述步骤3中,通过交叉注意力单元用于将整体观点序列
Figure FDA0002896892880000034
与局部单个相关文章语义
Figure FDA0002896892880000035
充分交互与融合;交叉注意力网络为:
Figure FDA0002896892880000036
其中,
Figure FDA0002896892880000037
表示针对第i个相关文章捕获的冲突语义。
7.根据权利要求1所述的基于证据推断网络的虚假新闻可解释性检测方法,其特征在于,所述步骤4的具体方法如下:
使用两个BiLSTM模块来分别编码虚假新闻的核心序列片段
Figure FDA0002896892880000038
以及每个相关文章的冲突语义
Figure FDA0002896892880000041
并借助BiLSTM的隐藏层输出来作为其上下文表示,分别表示为
Figure FDA0002896892880000042
Figure FDA0002896892880000043
借助注意力机制来匹配虚假新闻以及每个相关文章的显著特征,对于第i个相关文章中的第j个词,注意力机制为:
Figure FDA0002896892880000044
Figure FDA0002896892880000045
其中,
Figure FDA0002896892880000046
是第i个文章的冲突
Figure FDA0002896892880000047
的第j个词,
Figure FDA0002896892880000048
以及
Figure FDA0002896892880000049
分别是冲突的第j个词对整个虚假新闻序列的原始归一化关联度测量;
通过整个虚假新闻的序列与相关文章的冲突序列交互,能够得到虚假新闻指导的冲突表示
Figure FDA00028968928800000410
Figure FDA00028968928800000411
构建元素之间的求和计算来整合虚假新闻指导的冲突与编码冲突的整体序列:
Figure FDA00028968928800000412
其中,
Figure FDA00028968928800000413
是第i个相关文章的冲突复合表示,
Figure FDA00028968928800000414
是元素之间的求和计算操作;
Figure FDA00028968928800000415
Figure FDA00028968928800000416
进行拼接,然后将其输入仅一个全连接层来得到一个低维的预测向量,作为虚假新闻的核心片段与相关文章的冲突之间的一致性表示
Figure FDA00028968928800000417
Figure FDA00028968928800000418
对于不同的单个相关文章,以类似的操作得到各自的一致性预测向量,即
Figure FDA00028968928800000419
通过拼接操作整合相关文章的一致性预测向量,并通过下列公式预测其概率分布p:
Figure FDA0002896892880000051
其中,Wp与bp皆为可训练的参数。
通过交叉熵误差的最小化来训练模型:
loss=-∑ylogp (17)
其中,y为基于真值标签。
8.基于证据推断网络的虚假新闻可解释性检测***,其特征在于,包括:
输入编码模块,所述输入编码模块用于输入虚假新闻内容序列、所有相关文章的拼接序列以及若干不同的单个相关文章序列,通过BiLSTM分别捕获三者内部的上下文隐层序列表示;
互相交互共享模块,所述互相交互共享模块用于使虚假新闻内容序列与所有的相关文章特征进行交互,捕获两种类型的序列特征,聚焦虚假新闻内容中用户关心的核心序列片段,学习相关文章中所有用户的整体观点序列;
细粒度冲突发掘模块,所述细粒度冲突发掘模块用于将整体观点序列与每个相关文章的序列进行互相交互,探索每个相关文章中细粒度的潜在的序列冲突;
基于证据的一致性模块,所述基于证据的一致性模块用于将核心序列片段与潜在的序列冲突进行一致性建模,脾胃围绕虚假新闻的核心序列片段的冲突,从而进行可解释性虚假新闻的检测。
CN202110045012.6A 2021-01-13 2021-01-13 基于证据推断网络的虚假新闻可解释性检测***及方法 Active CN112988959B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110045012.6A CN112988959B (zh) 2021-01-13 2021-01-13 基于证据推断网络的虚假新闻可解释性检测***及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110045012.6A CN112988959B (zh) 2021-01-13 2021-01-13 基于证据推断网络的虚假新闻可解释性检测***及方法

Publications (2)

Publication Number Publication Date
CN112988959A true CN112988959A (zh) 2021-06-18
CN112988959B CN112988959B (zh) 2023-07-14

Family

ID=76345298

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110045012.6A Active CN112988959B (zh) 2021-01-13 2021-01-13 基于证据推断网络的虚假新闻可解释性检测***及方法

Country Status (1)

Country Link
CN (1) CN112988959B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113849599A (zh) * 2021-09-03 2021-12-28 北京中科睿鉴科技有限公司 基于模式信息和事实信息的联合虚假新闻检测方法
CN116579337A (zh) * 2023-07-07 2023-08-11 南开大学 一种融合证据可信度的虚假新闻检测方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020061578A1 (en) * 2018-09-21 2020-03-26 Arizona Board Of Regents On Behalf Of Arizona State University Method and apparatus for collecting, detecting and visualizing fake news
KR20200064943A (ko) * 2018-11-29 2020-06-08 고려대학교 산학협력단 한국어 문법 변환 기반 가짜 뉴스 탐지 서버 및 그 방법
CN111581980A (zh) * 2020-05-06 2020-08-25 西安交通大学 基于决策树与共同注意力协作的假新闻检测***及方法
CN111581979A (zh) * 2020-05-06 2020-08-25 西安交通大学 基于证据感知分层交互注意网络的假新闻检测***及方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020061578A1 (en) * 2018-09-21 2020-03-26 Arizona Board Of Regents On Behalf Of Arizona State University Method and apparatus for collecting, detecting and visualizing fake news
KR20200064943A (ko) * 2018-11-29 2020-06-08 고려대학교 산학협력단 한국어 문법 변환 기반 가짜 뉴스 탐지 서버 및 그 방법
CN111581980A (zh) * 2020-05-06 2020-08-25 西安交通大学 基于决策树与共同注意力协作的假新闻检测***及方法
CN111581979A (zh) * 2020-05-06 2020-08-25 西安交通大学 基于证据感知分层交互注意网络的假新闻检测***及方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
BERNHARD LUTZ等: "Identifying Linguistic Cues of Fake News Associated with Cognitive and Affective Processing: Evidence from NeuroIS", 《NEUROIS 2020: INFORMATION SYSTEMS AND NEUROSCIENCE》 *
於张闲等: "基于深度学习的虚假健康信息识别", 《软件导刊》 *
楼靓: "社交网络虚假新闻识别方法", 《浙江交通职业技术学院学报》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113849599A (zh) * 2021-09-03 2021-12-28 北京中科睿鉴科技有限公司 基于模式信息和事实信息的联合虚假新闻检测方法
CN116579337A (zh) * 2023-07-07 2023-08-11 南开大学 一种融合证据可信度的虚假新闻检测方法
CN116579337B (zh) * 2023-07-07 2023-10-10 南开大学 一种融合证据可信度的虚假新闻检测方法

Also Published As

Publication number Publication date
CN112988959B (zh) 2023-07-14

Similar Documents

Publication Publication Date Title
Yang et al. Tree-augmented cross-modal encoding for complex-query video retrieval
Guo et al. Deep multimodal representation learning: A survey
Abbasiantaeb et al. Text‐based question answering from information retrieval and deep neural network perspectives: A survey
Mudgal et al. Deep learning for entity matching: A design space exploration
Niu et al. Multi-modal multi-scale deep learning for large-scale image annotation
Lopez et al. Deep Learning applied to NLP
Hassan et al. Sentiment analysis on bangla and romanized bangla text using deep recurrent models
Lin et al. Moment retrieval via cross-modal interaction networks with query reconstruction
Du et al. Gated attention fusion network for multimodal sentiment classification
Chen et al. CAAN: Context-aware attention network for visual question answering
Zeng et al. Tag-assisted multimodal sentiment analysis under uncertain missing modalities
Shen et al. Video retrieval with similarity-preserving deep temporal hashing
Galanopoulos et al. Attention mechanisms, signal encodings and fusion strategies for improved ad-hoc video search with dual encoding networks
CN111581981A (zh) 基于评价对象强化和带约束标签嵌入的方面类别检测***及方法
CN112988959A (zh) 基于证据推断网络的虚假新闻可解释性检测***及方法
CN116561305A (zh) 基于多模态和transformer的假新闻检测方法
Tajrobehkar et al. Align R-CNN: A pairwise head network for visual relationship detection
Gouthaman et al. Linguistically-aware attention for reducing the semantic gap in vision-language tasks
Zhong et al. A tree-based structure-aware transformer decoder for image-to-markup generation
Deng et al. Multimodal affective computing with dense fusion transformer for inter-and intra-modality interactions
Hou et al. Semantic alignment network for multi-modal emotion recognition
Liu et al. FeatInter: exploring fine-grained object features for video-text retrieval
Ly et al. An end-to-end multi-task learning model for image-based table recognition
Feng et al. Towards bridged vision and language: Learning cross-modal knowledge representation for relation extraction
CN117112786A (zh) 一种基于图注意力网络的谣言检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant