CN113869431B

CN113869431B - 虚假信息检测方法、***、计算机设备及可读存储介质

Info

Publication number: CN113869431B
Application number: CN202111156357.5A
Authority: CN
Inventors: 舒畅; 陈又新
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2021-09-30
Filing date: 2021-09-30
Publication date: 2024-05-07
Anticipated expiration: 2041-09-30
Also published as: WO2023050670A1; CN113869431A

Abstract

本发明公开了一种虚假信息检测方法，包括：获取包括待检测源信息以及待检测源信息在当前时刻的待检测回复信息待检测数据；对待检测数据进行向量化处理，得到待检测源信息对应的待检测源特征向量及待检测回复信息对应的待检测回复特征向量；通过预先训练好的虚假信息分类模型的编码层对待检测数据的特征向量进行编码处理，得到待检测数据的特征编码；通过训练好的深度强化学习模型对待检测数据的特征编码进行分类预判断，以判定是否需要对待检测数据进行分类处理；若需要，则通过虚假信息分类模型的分类层根据待检测源特征编码和待检测回复特征编码对待检测数据进行分类，得到待检测数据对应的第一分类结果。本发明可以对待检测数据进行实时检测。

Description

虚假信息检测方法、***、计算机设备及可读存储介质

技术领域

本发明实施例涉及数据处理技术领域，尤其涉及一种虚假信息检测方法、***、计算机设备及可读存储介质。

背景技术

随着互联网与自媒体行业的迅速发展，人们每天都要接收与发出不计其数的信息，进入了信息***的时代，这些信息无时无刻不在影响着人们的生活。然而正如人们在传统的口头交流中那样，互联网所传递的信息并不是完全真实与可信的。在铺天盖地的信息中总会包含那么一些虚假的、对人的认知、思想与行为产生误导的信息，这便是网络谣言，即虚假信息。

网络平台如推特、微信、微博和贴吧等充斥大量虚假信息，随之而来的是大量的转发和回复等等。目前虽然有识别是否虚假信息的算法，但不满足时效性要求，无法快速的识别出虚假信息。

发明内容

有鉴于此，本发明实施例的目的是提供一种虚假信息检测方法、***、计算机设备及可读存储介质，用以解决虚假信息检测不够实时性的问题。

为实现上述目的，本发明实施例提供了一种虚假信息检测方法，包括：

获取待检测数据，其中，所述待检测数据包括检测源信息以及所述待检测源信息在当前时刻对应的待检测回复信息；

对所述待检测数据进行向量化处理，得到所述待检测源信息对应的待检测源特征向量以及所述待检测回复信息对应的待检测回复特征向量；

通过预先训练好的虚假信息分类模型中的编码层对所述待检测源特征向量以及所述待检测回复特征向量进行编码处理，得到所述待检测源信息对应的待检测源特征编码以及所述待检测回复信息对应的待检测回复特征编码；

通过训练好的深度强化学习模型对所述待检测源特征编码以及待检测回复特征编码进行分类预判断，以判定是否需要对所述待检测数据进行分类处理；及

若判定出需要对所述待检测数据进行分类处理，则通过所述虚假信息分类模型的分类层根据所述待检测源特征编码和所述待检测回复特征编码对所述待检测数据进行分类，得到所述待检测数据对应的第一分类结果。

进一步地，所述通过训练好的深度强化学习模型对所述待检测源特征编码以及待检测回复特征编码进行分类预判断，以判定是否需要对所述待检测数据进行分类处理之后，还包括：

若判定出不需要对所述待检测数据进行分类处理，则返回执行所述获取待检测数据的步骤。

进一步地，所述对所述待检测数据进行向量化处理，得到所述待检测源信息对应的待检测源特征向量以及所述待检测回复信息对应的待检测回复特征向量包括：

获取所述待检测源信息中的第一文本数据与第一图片数据；

将所述第一文本数据通过第一向量化模型进行向量化处理，得到第一特征向量；并，将所述第一图片数据通过第二向量化模型进行向量化处理，得到第二特征向量；

将所述第一特征向量与所述第二特征向量进行拼接，得到所述待检测源信息对应的待检测源特征向量；

获取所述待检测回复信息中的第二文本数据与第二图片数据；

将所述第二文本数据通过所述第一向量化模型进行向量化处理，得到第三特征向量；并，将所述第二图片数据通过所述第二向量化模型进行向量化处理，得到第四特征向量；及

将所述第三特征向量与所述第四特征向量进行拼接，得到所述待检测回复信息对应的待检测回复特征向量。

进一步地，所述虚假信息分类模型为神经网络模型。

进一步地，所述深度强化学习模型的训练步骤包括：

获取多个训练样本集，每一个训练样本集包括样本源信息的第一特征编码及所述样本源信息在不同的时间步值对应的样本回复信息的第二特征编码，其中，样本源信息对应的时间步值小于对应的样本回复信息的时间步值；

将每一个训练样本集中的第一特征编码与各个第二特征编码按照时间步值大小依次输入至预设的强化模型中，并通过所述强化模型判断是否停止将第二特征编码输入至所述强化模型中；

若判定出停止将第二特征编码输入至所述强化模型中，则将最后时刻输入至所述强化模型中的第二特征编码输入至所述虚假信息分类模型中，以通过所述虚假信息分类模型输出每一个训练样本集的第二分类结果；

判断所述第二分类结果与所述每一个训练样本集的真实分类结果是否相同；

若不同，则更新所述强化模型的奖惩值，得到第一更新奖惩值，并根据所述第一更新奖惩值计算所述强化模型的损失函数，得到第一更新函数；及

根据所述第一更新函数对所述强化模型的模型参数进行更新，直至满足预设条件，得到训练好的深度强化学习模型。

进一步地，所述判断所述第二分类结果与所述每一个训练样本集的真实分类结果是否相同之后，所述方法还包括：

若相同，则更新所述强化模型的奖惩值，得到第二更新奖惩值，并根据所述第二更新奖惩值计算所述强化模型的损失函数，得到第二更新函数；及

根据所述第二更新函数对所述强化模型的模型参数进行更新，直至满足预设条件，得到训练好的深度强化学习模型。

进一步地，所述通过所述强化模型判断是否停止将第二特征编码输入至所述强化模型中之后，所述方法还包括：

若判定出继续将第二特征编码输入至所述强化模型中，则更新所述强化模型的奖惩值，得到第三更新奖惩值，并根据所述第三更新奖惩值计算所述强化模型的损失函数，得到第三更新函数；

根据所述第三更新函数对所述强化模型的模型参数进行更新，得到更新后的强化模型；及

将每一个训练样本集中的第一特征编码与各个第二特征编码按照时间步值大小依次输入至更新后的强化模型中，并通过所述更新后的强化模型判断是否停止将第二特征编码输入至所述强化模型中，直至判定出停止将第二特征编码输入至所述强化模型。

为实现上述目的，本发明实施例提供了一种虚假信息检测***，包括：

获取模块，用于获取待检测数据，其中，所述待检测数据包括待检测源信息以及所述待检测源信息在当前时刻对应的待检测回复信息；

向量化模块，用于对所述待检测数据进行向量化处理，得到所述待检测源信息对应的待检测源特征向量以及所述待检测回复信息对应的待检测回复特征向量；

编码模块，用于通过预先训练好的虚假信息分类模型中的编码层对所述待检测源特征向量以及所述待检测回复特征向量进行编码处理，得到所述待检测源信息对应的待检测源特征编码以及所述待检测回复信息对应的待检测回复特征编码；

判断模块，用于通过训练好的深度强化学习模型对所述待检测源特征编码以及待检测回复特征编码进行分类预判断，以判定是否需要对所述待检测数据进行分类处理；及

分类模块，用于若判定出需要对所述待检测数据进行分类处理，则通过所述虚假信息分类模型的分类层根据所述待检测源特征编码和所述待检测回复特征编码对所述待检测数据进行分类，得到所述待检测数据对应的第一分类结果。

为实现上述目的，本发明实施例提供了一种计算机设备，所述计算机设备包括存储器、处理器，所述存储器上存储有可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现上述的虚假信息检测方法的步骤。

为实现上述目的，本发明实施例提供了一种计算机可读存储介质，所述计算机可读存储介质内存储有计算机程序，所述计算机程序可被至少一个处理器所执行，以使所述至少一个处理器执行上述的虚假信息检测方法的步骤。

本发明实施例提供的虚假信息检测方法、***、计算机设备及可读存储介质，获取待检测源信息以及在当前时刻对应的待检测回复信息，对待检测源信息以及其对应的待检测回复信息进行向量化处理和编码处理，在将特征待检测源信息以及其对应的待检测回复信息编码输入至预先训练的深度强化学习模型中，对待检测源信息以及其对应的待检测回复信息是否进行分类处理的判断，当进行分类处理时，通过虚假信息分类模型待检测源信息以及其对应的待检测回复信息进行分类，得到对应的分类信息，以实现对待检测源信息以及其对应的待检测回复信息的实时检测，若判定出需要对待检测数据进行分类处理，则对待检测数据的特征编码进行分类判断，不要再次获取待检测数据中的待检测回复信息进行分类处理，提高了虚假信息检测的效率。

附图说明

图1为本发明虚假信息检测方法实施例一的流程图。

图2为本发明虚假信息检测***实施例二的模块示意图。

图3为本发明计算机设备实施例三的硬件结构示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例一

参阅图1，示出了本发明实施例一之虚假信息检测方法的步骤流程图。可以理解，本方法实施例中的流程图不用于对执行步骤的顺序进行限定。下面以计算机设备2为执行主体进行示例性描述。具体如下。

步骤S100、获取待检测数据，其中，所述待检测数据包括待检测源信息以及所述待检测源信息在当前时刻对应的待检测回复信息。

具体地，为了达到对检测虚假信息的实时性，实时监测并获取待检测数据，待检测源信息为需要进行虚假信息检测的源头信息，待检测回复信息为对该源头信息进行回复的信息。由于是实时获取待检测源信息以及待检测回复信息，因此，待检测源信息以及待检测回复信息具有时序性。

步骤S102、对所述待检测数据进行向量化处理，得到所述待检测源信息对应的待检测源特征向量以及所述待检测回复信息对应的待检测回复特征向量。

具体地，通过预设的向量化模型对待检测数据进行向量化处理，得到待检测源信息对应的待检测源特征向量以及待检测回复信息对应的待检测回复特征向量，向量化模型为visual(Bert+ImageNet)模型。

示例性地，所述步骤S102包括：

步骤S1021、获取所述待检测源信息中的第一文本数据，将所述第一文本数据通过第一向量化模型进行向量化处理，得到第一特征向量。步骤S1022、获取所述待检测源信息中的第一图片数据，将所述第一图片数据通过第二向量化模型进行向量化处理，得到第二特征向量。步骤S1023、将所述第一特征向量与所述第二特征向量进行拼接，得到所述待检测源信息对应的待检测源特征向量。

具体地，当待检测源信息中包括有文本数据以及图表数据时，分别通过第一向量化模型与第二向量化模型进行向量化处理，其中，第一向量化模型为visual Bert模型，第二向量化模型为visual ImageNet模型。visual ImageNet模型为对图像进行向量化处理的模型，该模型通过对ImageNet图像库进行向量化训练后得到，模型的精确度更加准确。再将处理后的第一特征向量以及第二特征向量进行拼接，得到待检测源信息对应的待检测源特征向量。

示例性地，所述步骤S102包括：

步骤S102A、获取所述待检测回复信息中的第二文本数据，将所述第二文本数据通过所述第一向量化模型进行向量化处理，得到第三特征向量。步骤S102B、获取所述待检测回复信息中的第二图片数据，将所述第二图片数据通过所述第二向量化模型进行向量化处理，得到第四特征向量。步骤S102C、将所述第三特征向量与所述第四特征向量进行拼接，得到所述待检测回复信息对应的待检测回复特征向量。

具体地，当待检测回复信息中包括有文本数据以及图表数据时，分别通过第一向量化模型与第二向量化模型进行向量化处理，其中，第一向量化模型为visual Bert模型，第二向量化模型为visual ImageNet模型。再将处理后的第三特征向量以及第四特征向量进行拼接，得到待检测回复信息对应的待检测回复特征向量。

步骤S104、通过预先训练好的虚假信息分类模型中的编码层对所述待检测源特征向量以及所述待检测回复特征向量进行编码处理，得到所述待检测源信息对应的待检测源特征编码以及所述待检测回复信息对应的待检测回复特征编码。

具体地，虚假信息分类模型包括编码层，编码层为LSTM(Long Short-TermMemory，长短期记忆)神经网络模型的结构，可以对待检测源特征向量以及待检测回复特征向量进行编码处理，得到每一时间步的状态向量States_t＝LSTM(feature_t)，每一回复信息为一个时间步t，状态向量用于描述当前的环境。LSTM模型的输入是每个回复文本，LSTM的输出是这个文本的向量特征，这个向量代表这个文本的信息，其中t＝0时表示源头的新闻/推特/微博/帖子。由于LSTM模型具有记忆功能，当前时刻以及当前时刻之前的待检测数据存储于LSTM模型之中，若获取到最新时刻的待检测回复信息，只需对最新时刻的待检测回复信息进行编码处理。

步骤S106、通过训练好的深度强化学习模型对所述待检测源特征编码以及待检测回复特征编码进行分类预判断，以判定是否需要对所述待检测数据进行分类处理。所述虚假信息分类模型为神经网络模型。

具体地，深度强化学习模型为Dueling-DQN(Deep Q Network)网络模型，可以对输入的待检测源特征编码以及待检测回复特征编码进行预测，预测当前时刻输入的待检测数据是否可以进行后续的分类处理。通过深度强化学习模型，可以减少后续数据处理的步骤，提高虚假信息识别效率。当深度强化学习模型预测出当前时刻可以进行分类处理时，启动虚假信息分类模型对待检测数据进行分类处理。Dueling-DQN网络模型包括状态(state)、奖励(Reward)、行为(Action)，Q即为Q(s，a)就是在某一时刻的s状态下(s∈S)，采取动作a(a∈A)动作能够获得收益的期望，环境会根据agent的动作反馈相应的回报reward r，如果Agent判断当前状态足够分类器进行高置信度的分类，则停止读取回复，让分类器做分类；否则继续读取下一个回复。动作选择时加入一定的随机性，即有∈＝1％的概率随机选择一种动作k＝random(K)。

步骤S108、若判定出需要对所述待检测数据进行分类处理，则通过所述虚假信息分类模型的分类层根据所述待检测源特征编码和所述待检测回复特征编码对所述待检测数据进行分类，得到所述待检测数据对应的第一分类结果。

具体地，虚假信息分类模型中设有Classifier分类器，即softmax损失函数，对待检测数据进行分类处理，得到相应的第一分类结果。第一分类结果用于表示待检测数据是否为虚假信息，该分类器可以为二分类分类器，输出的第一分类结果为0或1，0表示不是虚假信息，1表示是虚假信息。针对新闻、推特、微博、帖子、微信文章和群聊的虚假信息假资讯，可以在回复信息的传播量增长前，及时更快速地判断出是否是虚假信息假资讯，并让用户及早做出删除屏蔽等舆情控制措施。

示例性地，所述步骤S108之后，还包括：

具体地，若判断出不能进行分类处理，则获取下一时刻的待检测回复信息，并重复步骤S102至步骤S106，对下一时刻的待检测回复信息进行向量化和编码处理，再输入至深度强化学校模型中进行预判断，直至判定出需要对待检测数据进行分类处理。当深度强化学校模型进行分类预判断时，需要对所有的待检测数据进行预测。即，待检测数据包括待检测源信息、当前时刻之前的待检测回复信息、当前时刻的待检测回复信息、下一时刻的待检测回复信息；若还是判定出不需要对待检测数据进行分类处理，再获取下一时刻的待检测回复数据。

示例性地，所述深度强化学习模型的训练步骤包括：

获取多个训练样本集，每一个训练样本集包括样本源信息的第一特征编码及所述样本源信息在不同的时间步值对应的样本回复信息的第二特征编码，其中，样本源信息对应的时间步值小于对应的样本回复信息的时间步值。训练样本集中的第一特征编码以及第二特征编码是：将样本源信息以及样本回复信息进行向量化处理再编码后得到的。每一个时间步值对应的第二特征编码包括样本源信息对应的第一特征编码以及当前时刻所有的样本回复信息的特征编码，以便于强化模型根据该第一特征编码或者第二特征编码进行分类预处理。

将每一个训练样本集中的第一特征编码与各个第二特征编码按照时间步值大小依次输入至预设的强化模型中，并通过所述强化模型判断是否停止将第二特征编码输入至所述强化模型中。为了更好的对样本源信息以及样本源信息对应的样本回复信息进行检测，对每一个时间步值对应的特征编码进行分类处理。强化模型对每个时间步的特征编码都进行预判断，基于强化模型Dueling-DQN中的Q值判断，Q值越大，表示可以进行分类处理的可能性越大，当Q值大于预设阈值时，即表示进行分类处理。若当前强化模型计算的Q值小于预设阈值，则继续获取样本回复信息的特征编码，生成下一个第二特征编码，输入至强化模型中进行判断。

若判定出停止将第二特征编码输入至所述强化模型中，则将最后时刻输入至所述强化模型中的第二特征编码输入至所述虚假信息分类模型中，以通过所述虚假信息分类模型输出每一个训练样本集的第二分类结果。若强化模型判断出停止将第二特征编码输入至强化模型中，则表示强化模型判断出当前的第二特征编码可以进行虚假信息分类，将其输入至虚假信息分类模型中进行分类处理。其中，若强化模型通过样本源信息的第一特征编码即可判断出不需要读取样本回复信息的第二特征编码，则将第一特征编码输入至虚假信息分类模型中进行虚假信息分类预测，得到第二分类结果。

判断所述第二分类结果与所述每一个训练样本集的真实分类结果是否相同。训练样本集的真实分类结果预先得到的，与训练样本集进行关联。

若不同，则更新所述强化模型的奖惩值，得到第一更新奖惩值，并根据所述第一更新奖惩值计算所述强化模型的损失函数，得到第一更新函数。根据所述第一更新函数对所述强化模型的模型参数进行更新，直至满足预设条件，得到训练好的深度强化学习模型。

具体地，当虚假信息分类模型预测的结果不准确时，给与惩罚r_t＝-100，得到第一更新奖惩值，根据第一更新奖惩值计算损失函数进行反向传播更新网络权重。

示例性地，所述判断所述第二分类结果与所述每一个训练样本集的真实分类结果是否相同之后，所述方法还包括：

若相同，则更新所述强化模型的奖惩值，得到第二更新奖惩值，并根据所述第二更新奖惩值计算所述强化模型的损失函数，得到第二更新函数；根据所述第二更新函数对所述强化模型的模型参数进行更新，直至满足预设条件，得到训练好的深度强化学习模型。如果当前虚假信息分类器Classifier的输出结果和实际标签一致，则给予奖励r_t＝1+log(M)，得到第二更新奖惩值，其中M表示Agent累计成功获得奖励(r＞0)的次数。

示例性地，所述通过所述强化模型判断是否停止将第二特征编码输入至所述强化模型中之后，所述方法还包括：

若判定出继续将第二特征编码输入至所述强化模型中，则更新所述强化模型的奖惩值，得到第三更新奖惩值，并根据所述第三更新奖惩值计算所述强化模型的损失函数，得到第三更新函数；根据所述第三更新函数对所述强化模型的模型参数进行更新，得到更新后的强化模型；将每一个训练样本集中的第一特征编码与各个第二特征编码按照时间步值大小依次输入至更新后的强化模型中，并通过所述更新后的强化模型判断是否停止将第二特征编码输入至所述强化模型中，直至判定出停止将第二特征编码输入至所述强化模型。如果选择继续读取回复，则给予一个很小的惩罚r_t＝0.05，得到第三更新奖惩值，以限制Agent不断让回复增长。

示例性地，为了全面的了解虚假信息检测的过程，通过以下实施例进行再一次的描述：

整个检测过程分为两个模块，一个是分类模块(虚假信息分类模型)，一个是控制模块(深度强化学习模型)。针对一个源头新闻/推特/微博/帖子(待检测源信息)都会按照时间顺序产生若干个待检测回复信息，每产生一个待检测回复信息的时候，都会使用虚假信息分类模块的LSTM对待检测回复信息进行编码，编码后会将编码信息输入给控制模块，控制模块是一个深度强化学习模型，会对输入的编码信息进行action的判断，判断是停止或者继续获取下一个待检测回复信息。如果判断action为停止，则会触发虚假信息分类模块对当前的状态信息(特征编码)进行分类，判断是否为虚假信息；如果判断action为继续，则不会触发分类模块进行分类，从而允许下一个回复的信息输入进LSTM进行编码，把最新的编码信息输入给控制模块，再次判断action，以此类推。因为LSTM是一个循环神经网络结构的网络，所以具有对历史信息整体编码的能力，当判断为继续时，只需获取下一个待检测回复信息。深度强化学习模型每次都会对整体信息的特征编码进行action的判断。

在训练深度强化学习模型的时候，action一旦被判断为停止，则触发分类器开始分类，所以分类器分类结果会出现分对和分错两种，如果是分类正确，则控制模块会得到奖励，如果分类错误，则控制模块得到惩罚。如果action一直判断为继续，则控制模型也会得到一个惩罚，只是这个惩罚会非常小。

实施例二

请继续参阅图2，示出了本发明虚假信息检测***实施例二的程序模块示意图。在本实施例中，虚假信息检测***20可以包括或被分割成一个或多个程序模块，一个或者多个程序模块被存储于存储介质中，并由一个或多个处理器所执行，以完成本发明，并可实现上述虚假信息检测方法。本发明实施例所称的程序模块是指能够完成特定功能的一系列计算机程序指令段，比程序本身更适合于描述虚假信息检测***20在存储介质中的执行过程。以下描述将具体介绍本实施例各程序模块的功能：

获取模块200，用于获取待检测数据，其中，所述待检测数据包括待检测源信息以及所述待检测源信息在当前时刻对应的待检测回复信息。

向量化模块202，用于对所述待检测数据进行向量化处理，得到所述待检测源信息对应的待检测源特征向量以及所述待检测回复信息对应的待检测回复特征向量。

示例性地，所述向量化模块202还用于：

获取所述待检测源信息中的第一文本数据，将所述第一文本数据通过第一向量化模型进行向量化处理，得到第一特征向量；获取所述待检测源信息中的第一图片数据，将所述第一图片数据通过第二向量化模型进行向量化处理，得到第二特征向量；将所述第一特征向量与所述第二特征向量进行拼接，得到所述待检测源信息对应的待检测源特征向量。

示例性地，所述向量化模块202还用于：

获取所述待检测回复信息中的第二文本数据，将所述第二文本数据通过所述第一向量化模型进行向量化处理，得到第三特征向量；获取所述待检测回复信息中的第二图片数据，将所述第二图片数据通过所述第二向量化模型进行向量化处理，得到第四特征向量；将所述第三特征向量与所述第四特征向量进行拼接，得到所述待检测回复信息对应的待检测回复特征向量。

编码模块204，用于通过预先训练好的虚假信息分类模型中的编码层对所述待检测源特征向量以及所述待检测回复特征向量进行编码处理，得到所述待检测源信息对应的待检测源特征编码以及所述待检测回复信息对应的待检测回复特征编码。

判断模块206，用于通过训练好的深度强化学习模型对所述待检测源特征编码以及待检测回复特征编码进行分类预判断，以判定是否需要对所述待检测数据进行分类处理。

分类模块208，用于若判定出需要对所述待检测数据进行分类处理，则通过所述虚假信息分类模型的分类层根据所述待检测源特征编码和所述待检测回复特征编码对所述待检测数据进行分类，得到所述待检测数据对应的第一分类结果。

示例性地，所述分类模块208还用于：

实施例三

参阅图3，是本发明实施例三之计算机设备的硬件架构示意图。本实施例中，所述计算机设备2是一种能够按照事先设定或者存储的指令，自动进行数值计算和/或信息处理的设备。该计算机设备2可以是机架式服务器、刀片式服务器、塔式服务器或机柜式服务器(包括独立的服务器，或者多个服务器所组成的服务器集群)等。服务器可以是独立的服务器，也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network，CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。如图3所示，所述计算机设备2至少包括，但不限于，可通过***总线相互通信连接存储器21、处理器22、网络接口23、以及虚假信息检测***20。其中：

本实施例中，存储器21至少包括一种类型的计算机可读存储介质，所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如，SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中，存储器21可以是计算机设备2的内部存储单元，例如该计算机设备2的硬盘或内存。在另一些实施例中，存储器21也可以是计算机设备2的外部存储设备，例如该计算机设备2上配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)等。当然，存储器21还可以既包括计算机设备2的内部存储单元也包括其外部存储设备。本实施例中，存储器21通常用于存储安装于计算机设备2的操作***和各类应用软件，例如实施例二的虚假信息检测***20的程序代码等。此外，存储器21还可以用于暂时地存储已经输出或者将要输出的各类数据。

处理器22在一些实施例中可以是中央处理器(Central Processing Unit，CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器22通常用于控制计算机设备2的总体操作。本实施例中，处理器22用于运行存储器21中存储的程序代码或者处理数据，例如运行虚假信息检测***20，以实现实施例一的虚假信息检测方法。

所述网络接口23可包括无线网络接口或有线网络接口，该网络接口23通常用于在所述服务器2与其他电子装置之间建立通信连接。例如，所述网络接口23用于通过网络将所述服务器2与外部终端相连，在所述服务器2与外部终端之间的建立数据传输通道和通信连接等。所述网络可以是企业内部网(Intranet)、互联网(Internet)、全球移动通讯***(Global System of Mobile communication，GSM)、宽带码分多址(Wideband CodeDivision Multiple Access，WCDMA)、4G网络、5G网络、蓝牙(Bluetooth)、Wi-Fi等无线或有线网络。需要指出的是，图3仅示出了具有部件20-23的计算机设备2，但是应理解的是，并不要求实施所有示出的部件，可以替代的实施更多或者更少的部件。在本实施例中，存储于存储器21中的所述虚假信息检测***20还可以被分割为一个或者多个程序模块，所述一个或者多个程序模块被存储于存储器21中，并由一个或多个处理器(本实施例为处理器22)所执行，以完成本发明。

例如，图2示出了所述实现虚假信息检测***20实施例二的程序模块示意图，该实施例中，所述虚假信息检测***20可以被划分为所述获取模块200、所述向量化模块202、所述编码模块204、所述判断模块206以及所述分类模块208。其中，本发明所称的程序模块是指能够完成特定功能的一系列计算机程序指令段，比程序更适合于描述所述虚假信息检测***20在所述计算机设备2中的执行过程。所述程序模块200-208的具体功能在实施例二中已有详细描述，在此不再赘述。

实施例四

本实施例还提供一种计算机可读存储介质，如闪存、硬盘、多媒体卡、卡型存储器(例如，SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘、服务器、App应用商城等等，其上存储有计算机程序，程序被处理器执行时实现相应功能。本实施例的计算机可读存储介质用于计算机程序，被处理器执行时实现实施例一的虚假信息检测方法。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种虚假信息检测方法，其特征在于，包括：

获取待检测数据，其中，所述待检测数据包括待检测源信息以及所述待检测源信息在当前时刻对应的待检测回复信息；

通过预先训练好的虚假信息分类模型中的编码层对所述待检测源特征向量以及所述待检测回复特征向量进行编码处理，得到所述待检测源信息对应的待检测源特征编码以及所述待检测回复信息对应的待检测回复特征编码，所述虚假信息分类模型为神经网络模型；

若判定出需要对所述待检测数据进行分类处理，则通过所述虚假信息分类模型的分类层根据所述待检测源特征编码和所述待检测回复特征编码对所述待检测数据进行分类，得到所述待检测数据对应的第一分类结果；

所述对所述待检测数据进行向量化处理，得到所述待检测源信息对应的待检测源特征向量以及所述待检测回复信息对应的待检测回复特征向量包括：

获取所述待检测源信息中的第一文本数据与第一图片数据；

将所述第一文本数据通过第一向量化模型进行向量化处理，得到第一特征向量；并将所述第一图片数据通过第二向量化模型进行向量化处理，得到第二特征向量；

将所述第二文本数据通过所述第一向量化模型进行向量化处理，得到第三特征向量；并将所述第二图片数据通过所述第二向量化模型进行向量化处理，得到第四特征向量；及

将所述第三特征向量与所述第四特征向量进行拼接，得到所述待检测回复信息对应的待检测回复特征向量；

所述深度强化学习模型的训练步骤包括：

2.根据权利要求1所述的虚假信息检测方法，其特征在于，所述通过训练好的深度强化学习模型对所述待检测源特征编码以及待检测回复特征编码进行分类预判断，以判定是否需要对所述待检测数据进行分类处理之后，还包括：

3. 根据权利要求1所述的虚假信息检测方法，其特征在于，所述判断所述第二分类结果与所述每一个训练样本集的真实分类结果是否相同之后，所述方法还包括：

4.根据权利要求1所述的虚假信息检测方法，其特征在于，所述通过所述强化模型判断是否停止将第二特征编码输入至所述强化模型中之后，所述方法还包括：

5.一种虚假信息检测***，其特征在于，包括：

编码模块，用于通过预先训练好的虚假信息分类模型中的编码层对所述待检测源特征向量以及所述待检测回复特征向量进行编码处理，得到所述待检测

源信息对应的待检测源特征编码以及所述待检测回复信息对应的待检测回复特征编码，所述虚假信息分类模型为神经网络模型；

分类模块，用于若判定出需要对所述待检测数据进行分类处理，则通过所述虚假信息分类模型的分类层根据所述待检测源特征编码和所述待检测回复特征编码对所述待检测数据进行分类，得到所述待检测数据对应的第一分类结果；

所述向量化模块，还用于：

获取所述待检测源信息中的第一文本数据与第一图片数据；

所述深度强化学习模型的训练步骤包括：

6.一种计算机设备，其特征在于，所述计算机设备包括存储器、处理器，所述存储器上存储有可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现如权利要求1-4中任一项所述的虚假信息检测方法的步骤。

7.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质内存储有计算机程序，所述计算机程序可被至少一个处理器所执行，以使所述至少一个处理器执行如权利要求1-4中任一项所述的虚假信息检测方法的步骤。