CN111783422A

CN111783422A - 一种文本序列生成方法、装置、设备和介质

Info

Publication number: CN111783422A
Application number: CN202010591970.9A
Authority: CN
Inventors: 李航; 乔超; 伊曾飒
Original assignee: Beijing ByteDance Network Technology Co Ltd
Current assignee: Beijing ByteDance Network Technology Co Ltd
Priority date: 2020-06-24
Filing date: 2020-06-24
Publication date: 2020-10-16
Anticipated expiration: 2040-06-24
Also published as: EP4174714A1; CN111783422B; WO2021259205A1; US11669679B2; EP4174714A4; JP2023525731A; US20220382965A1

Abstract

本公开实施例公开了一种文本序列生成方法、装置、设备和介质。该方法包括：获取初始文本序列，从所述初始文本序列中提取初始文本特征；获取结构化文本序列，从所述结构化文本序列中提取结构化特征；其中，所述结构化文本序列与所述初始文本序列中的事实相关联；根据所述初始文本特征和所述结构化特征，融合生成目标文本序列。本公开实施例所提供的技术方案，通过对具有事实相关联的不同类型序列匹配后进行融合，以生成新的文本序列，从而提高了目标文本准确性与流畅性。

Description

一种文本序列生成方法、装置、设备和介质

技术领域

本公开实施例涉及人工智能领域，尤其涉及一种文本序列生成方法、装置、设备和介质。

背景技术

随着资讯类应用软件的流行，需要处理大量资讯类数据，提供给用户。资讯类数据可以以各种形式呈现，例如文本、图片、和视频等。基于文本形成的文章是一种资讯展示的重要形式。

由于要处理的文章众多，所以目前已经采用了各种各样的自动化文本转化技术来生成或转换文章，以便把原始文本素材，转换为符合当前需求的文本文章。这种技术用于不同语种的语言之间或不同文本形式之间的转换就是机器翻译，用于文章和摘要之间的转换就是文章自动摘要。

但是，现有的文本转化技术会存在事实错误或疏漏的情况，并且转化后得到文本文章一般比较生硬、不流畅。

发明内容

本公开实施例提供一种文本序列生成方法、装置、设备和介质，以实现优化作为文本序列的文本文章的生成方法，提高文本文章的准确性和流畅度。

第一方面，本公开实施例提供了一种文本序列的生成方法，包括：

获取初始文本序列，从所述初始文本序列中提取初始文本特征；

获取结构化文本序列，从所述结构化文本序列中提取结构化特征；其中，所述结构化文本序列与所述初始文本序列中的事实相关联；

根据所述初始文本特征和所述结构化特征，融合生成目标文本序列。

第二方面，本公开实施例还提供了一种文本序列的生成装置，该装置包括：

初始文本特征提取模块：用于提取初始文本序列的初始文本特征；

结构化特征提取模块：用于提取结构化文本序列的结构化特征；

融合模块：用于根据所述初始文本特征和所述结构化特征，融合生成目标文本序列。

第三方面，本公开实施例还提供了一种电子设备，包括：

一个或多个处理器；

存储器，用于存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如本公开任意实施例所提供的文本序列的生成方法。

第四方面，本公开实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如本公开任意实施例所提供的文本序列的生成方法。

本公开实施例通过一种文本序列的生成方案，结合了文本序列和结构化文本序列，以文本序列来提升所生成目标文本序列的流畅度，以结构化文本序列来提升目标文本序列的事实准确性，解决了文本转化技术会存在事实错误或疏漏的情况，与转化后得到文本文章生硬、不流畅等技术问题，提高了文本编辑的准确性与流畅性。

附图说明

结合附图并参考以下具体实施方式，本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中，相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的，原件和元素不一定按照比例绘制。

图1是本公开实施例一提供的一种文本序列生成方法的流程图；

图2A是本公开实施例二提供的一种文本序列生成方法的流程图；

图2B是本公开实施例二提供的一种文本序列生成方法的结构示意图；

图2C是本公开实施例二提供的一种文本序列生成方法的结构示意图；

图3是本公开实施例三提供的一种文本序列生成方法的流程图；

图4A是本公开实施例五提供的一种文本序列生成方法的示意图；

图4B是本公开实施例五提供的一种文本序列生成方法的示意图；

图4C是本公开实施例五提供的一种文本序列生成方法的示意图；

图5是本公开实施例六提供的一种文本序列生成装置的结构示意图；

图6是本公开实施例提供的一种电子设备的结构示意图。

具体实施方式

下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例，然而应当理解的是，本公开可以通过各种形式来实现，而且不应该被解释为限于这里阐述的实施例，相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是，本公开的附图及实施例仅用于示例性作用，并非用于限制本公开的保护范围。

应当理解，本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行，和/或并行执行。此外，方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。

本文使用的术语“包括”及其变形是开放性包括，即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”；术语“另一实施例”表示“至少一个另外的实施例”；术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。

需要注意，本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分，并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。

需要注意，本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的，本领域技术人员应当理解，除非在上下文另有明确指出，否则应该理解为“一个或多个”。

本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的，而并不是用于对这些消息或信息的范围进行限制。

相关技术中，一般会采用文本自动转化技术或者表到文本转化技术，其中，

文本自动转化技术，通常将不同语种的语言之间的转化或者对特定文本格式进行转化，例如：中文文本转化为英文文本、文章转化为摘要；其中，表到文本转化技术，基于结构化数据的信息表，经过对各个行、列、表框之间关联关系进行设定，在需要的地方设置一定的标点符号，去掉表框后获得具有标点符号的表框内容，相当于对表框中的内容进行罗列***符号。上述两种技术方案并不能针对文本内容对文本进行编辑，无法对文本内容的准确性与流畅性修正，导致用户在使用转化后文本存在事实性错误和语序错乱。

本公开实施例的技术方案提供一种文本序列的生成方法，可以应用于各种资讯编辑***。该文本序列的生成方法可以应用于文本编辑***中，该文本编辑***包括一个或多个存储区域。其中，一个或多个存储区域通过算法对序列进行融合。通过对具有事实相关联的不同类型序列匹配后进行过滤，将过滤完的序列进行融合生成新的序列。其中，文本编辑***的一个或多个存储区域可以为各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备、服务器和或者是多个服务器组成的服务器集群来实现。

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。

实施例一

图1为本公开实施例一提供的一种文本序列的生成方法的流程图，该方法可以适用于各种文本编辑场景中，基于已有文本序列生成新的文本序列。该方法由文本序列的生成装置来执行，该装置可以通过软件和/或硬件的方式来实现，并具体可继承于具备存储和计算能力来进行文本处理的电子设备中。

如图1所示，提供一种文本序列的生成方法，包括：

步骤110、获取初始文本序列，从所述初始文本序列中提取初始文本特征；

初始文本序列为已有文本序列，相当于源文本序列，是用于生成新的目标文本序列的素材。初始文本序列可以是包括几个、十几个词汇的一个独立语句，也可以是包括多个独立语句的整篇文章。序列中的每个元素对应于一个词汇。从所述初始文本序列中提取的初始文本特征，是能够表征各词汇特点的特征序列，初始文本特征可以是词汇序列，也可以是词汇所对应编码值的向量。提取初始文本特征的方式有多种，例如，可以将所述初始文本序列输入双向长短记忆循环神经网络，以提取所述初始文本特征。

其中，所述初始文本序列为至少一个初始文本中词汇编码值的向量，输入双向长短记忆循环神经网络中，可提取所述初始文本特征。双向长短记忆循环神经网络为提取所述初始文本特征的一种方法。示例的，将所述初始文本序列输入双向长短记忆循环神经网络，可以是利用双向长短记忆循环神经网络对所述初始文本序列分类，生成各类别相关特征参数，以获取初始文本特征。

步骤120、获取结构化文本序列，从所述结构化文本序列中提取结构化特征；其中，所述结构化文本序列与所述初始文本序列中的事实相关联；

结构化文本序列为已有事实文本序列，相当于事实源文本序列，是用于对所述初始文本序列进行对照纠正。结构化文本序列为结构化数据，可以是包括几个、十几个词汇的一个单元格，也可以是包括多个单元格的完整表格。序列中的每个元素对应于一个词汇。

从所述结构化文本序列中提取的结构化特征，是能够表征事实的特征序列，结构化特征可以是词汇序列，也可以是词汇所对应编码值的向量。

其中，所述结构化文本序列与所述初始文本序列中的事实相关联，为所述结构化文本序列与所述初始文本序列的事实内容有关联关系，例如，可以是所述初始文本序列中词汇检索到的所有事实结构化词汇，检索到的所有事实结构化词汇在实质内容上与所述初始文本序列有关联关系。

具体的，提取结构化特征的方式有很多种，例如，可以将所述结构化文本序列确定至少一个事实三元组，而后将经语义拼接的多个所述事实三元组，输入全连接神经网络，提取作为该结构化文本序列的结构化特征。实质上，是将多个所述事实三元组进行拼接，得到所述结构化文本序列的整体事实三元组序列，利用全连接神经网络进行分类、层级关联，以获得所述结构化特征。

获取结构化文本序列，从所述结构化文本序列中提取结构化特征的操作具体可以为：根据所述结构化文本序列确定至少一个事实三元组，所述事实三元组包括主语、谓语和宾语；将所述事实三元组输入全连接神经网络，以拼接形成事实三元组序列，作为所述结构化特征。

根据所述结构化文本序列确定至少一个事实三元组，示例如，当所述结构化文本序列为一个表格时，确定这个表格的事实三元组，确定表格的关键词汇为第一个元素，确定表格的列为第二个元素，确定表格的列对应内容为第三个元素，以这样的方式确定这个表格的多个事实三元组，将事实三元组中主语、谓语和宾语拼接，并输入到全连接神经网络，形成事实三元组序列，作为所述结构化特征。

例如，结构化文本序列如下表所示：

类别

姓名

身高

祖籍

出生地

运动项目

曾属球队

人物

姚明

2.26米

江苏

上海

篮球

上海大鲨鱼、休斯敦火箭队

则从中提取的事实三元组例如为，<姚明，出生地，上海>。可类似提取多个事实三元组，拼接形成该信息表的结构化特征。

步骤130、根据所述初始文本特征和所述结构化特征，融合生成目标文本序列。

其中，所述初始文本特征和所述结构化特征，融合生成目标文本序列，可以是利用所述初始文本特征和所述结构化特征，将所述初始文本序列与所述结构化文本序列，融合生成目标文本序列。

其中，利用所述初始文本特征和所述结构化特征，对所述初始文本序列与所述结构化文本序列融合生成目标文本序列，可以是根据所述结构化特征与所述初始文本特征，以确认目标文本特征，从而根据所述目标文本特征生成所述目标文本序列。

上述文本序列的生成方法中，利用所述初始文本序列和所述结构化文本序列融合技术，实现了事实相关联的不同类型文本序列融合，解决了文本到文本转化技术会存在事实错误或疏漏的情况与表到文本转化技术得到的文本生硬、不流畅等技术问题，提高了文本编辑的准确性与流畅性。

实施例二

图2A为本公开实施例二提供的一种文本序列的生成方法的流程图。本实施例的技术方案在上述技术方案的基础上进一步细化，具体主要包括如下步骤：

步骤210、获取初始文本序列，从所述初始文本序列中提取初始文本特征；

步骤220、获取结构化文本序列，从所述结构化文本序列中提取结构化特征；其中，所述结构化文本序列与所述初始文本序列中的事实相关联；

步骤230、根据所述结构化特征对所述初始文本特征进行过滤，且根据所述结构化特征对所述初始文本特征的文本内容进行纠正，以融合生成所述目标文本序列；

结构化文本序列中所体现的事实一般准确性较高且精炼，而初始文本序列中的事实表达有可能不准确，且存在各种冗余信息，因此，可借助结构化特征对初始文本特征进行过滤和文本内容的纠正，由此将两种内容融合，以生成目标文本序列。

融合生成目标文本序列的过程可以有多种方式来实现，具体的：

如图2B所示，可以将文章初稿作为初始文本序列，输入能够提取初始文本特征的模块A中进行处理，以生成初始文本特征，可作为文章初稿的表示；将信息表作为结构化文本序列输入模块B中进行处理，以生成结构化特征，可作为信息表的表示；而后将初始文本特征和结构化特征在模块C中进行拼接，形成结合的向量化特征，可作为文章的标识，相当于，根据所述初始文本特征和所述结构化特征，融合生成目标文本序列之前，还包括：将所述初始文本特征和所述结构化特征输入全连接神经网络，以进行特征拼接生成目标文本特征；而后将拼接的目标文本特征输入模块D，以生成目标文本序列，作为目标文章。上述各模块可由作为深度学习模型的神经网络来实现，从而构建一个整体的初始文本序列+结构化文本序列向目标文本序列转换的文本转换模型，可利用大量的《文章初稿、文章、信息表》等三元组的数据样本对文本转换模型进行训练。对文本转换模型通过随机梯度下降及反向传播进行学习更新。

或者，如图2C所示，可以将文章初稿作为初始文本序列，输入能够提取初始文本特征的模块A中进行处理，以生成初始文本特征，可作为文章初稿的表示；将信息表作为结构化文本序列输入模块B中进行处理，以生成结构化特征，可作为信息表的表示；而后将初始文本特征和结构化特征分别输入模块D，以生成目标文本序列，作为目标文章。上述各模块可由作为深度学习模型的神经网络来实现，从而构建一个整体的初始文本序列+结构化文本序列向目标文本序列转换的文本转换模型，可利用大量的《文章初稿、文章、信息表》等三元组的数据样本对文本转换模型进行训练。

本公开实施例的技术方案，能够对已有文本序列进行编辑，不需要直接从结构化的信息表中生成目标文章，只需要少量的数据样本就可以训练构建文本转换模型，更易于实现，且转换的目标文章事实表达更准确，文本更为流畅、自然。

实施例三

图3为本公开实施例三提供的一种文本序列生成方法的流程图。本实施例以前述实施例为基础，进一步介绍基于初始文本特征和结构化特征来融合生成目标文本序列的实现方式。该方法包括：

步骤310、获取初始文本序列，从所述初始文本序列中提取初始文本特征；

步骤320、获取结构化文本序列，从所述结构化文本序列中提取结构化特征；其中，所述结构化文本序列与所述初始文本序列中的事实相关联；

步骤330、分别将每个初始文本特征作为当前初始文本特征；

本实施例可以对序列化的初始文本特征逐一进行处理，例如一篇已有文章实际上包括顺序的多个初始文本序列，每个初始文本序列的初始文本特征可逐一作为当前初始文本特征来进行处理。

步骤340、将所述当前初始文本特征与所述结构化特征进行事实匹配，并根据事实匹配结果确定对所述当前初始文本特征的执行动作；

以文章为例，文章中可能包括对事实的描述，也有可能包括其他辅助的描写，本实施例转换的目标文本序列主要需包括事实描述文本，因此，可将非事实描述的文本进行过滤。过滤的具体方式，可以是将当前初始文本特征，与各个结构化特征进行事实匹配，以结构化特征中的事实来过滤掉非事实描述的初始文本特征。通过确定不同的执行动作来完成过滤操作。

对于步骤340的事实匹配的操作，具体可以是：将所述当前初始文本特征与所述结构化特征输入长短记忆循环神经网络进行事实匹配，并根据事实匹配结果确定对所述当前初始文本特征的执行动作。该操作相当于将当前初始文本特征在各结构化特征中进行遍历匹配。

步骤350、根据所述执行动作，对所述当前初始文本特征进行处理，以生成所述目标文本序列。

具体的执行动作可用于实现对非事实描述文本特征的过滤，以及对实时文本特征的纠正，优选是执行动作可包括丢弃、保留和生成。

在本公开实施例中，可选的执行如下操作来根据事实匹配结果确定对所述当前初始文本特征的执行动作，以及对应的执行方式：

如果存在与当前初始文本特征匹配的结构化特征，且所述当前初始文本特征和匹配的结构化特征的文本内容匹配，则执行动作为保留；

如果存在与当前初始文本特征匹配的结构化特征，且所述当前初始文本特征和匹配的结构化特征的文本内容不一致，则执行动作为拼接生成；

如果不存在与当前初始文本特征匹配的结构化特征，则执行动作为丢弃；

相应的，根据所述执行动作，对所述当前初始文本特征进行处理，以生成所述目标文本序列包括：

如果执行动作为保留，则保留所述当前初始文本特征为所述目标文本特征；

如果执行动作为拼接生成，则根据所述当前初始文本特征和匹配的结构化特征，拼接生成为所述目标文本特征。

如果执行动作为丢弃，则过滤丢弃当前初始文本特征；

根据所述目标文本特征生成所述目标文本序列。

可通过对初始文本特征执行相应动作来丢弃非实时描述文本，或保留事实描述文本，或基于初始文本特征和匹配的结构化特征来生成更为流畅的目标文本序列。并且，可以通过执行动作先生成目标文本特征，再由目标文本特征恢复生成目标文本序列。

本公开实施例的技术方案，能够针对每个初始文本序列，采用不同的执行动作来基于结构化文本序列对初始文本序列进行筛选、纠正和融合，来生成事实描述准确、表达自然流畅的目标文本序列。

实施例四

本公开实施例四提供的一种文本序列生成方法，本实施例以上述实施例一至三为基础，进一步介绍文本序列生成方法的具体实现方式。该方法包括：

分别将每个初始文本特征作为当前初始文本特征；

将所述当前初始文本特征与所述结构化特征进行事实匹配，并根据事实匹配结果确定对所述当前初始文本特征的执行动作；

其中，将所述当前初始文本特征与所述结构化特征进行事实匹配，并根据事实匹配结果确定对所述当前初始文本特征的执行动作，其根据事实匹配结果确定对所述当前初始文本特征的执行动作算法的具体实现如下：

基于如下公式计算当前事实向量

其中，α_t,j按照如下公式确定：

其中，所述W_α和所述

为待训练参数，模型的待训练参数可如前所述的文本转换模型在训练过程中学习来确定；b_t为当前初始文本特征；s_t为当前目标文本特征；下标t为文本特征的序号；t_j为结构化特征，1≤j≤M，M为结构化特征的数量；exp()为指数函数，tanh()为双曲正切函数；

其中，t_j可按照如下公式确定：

其中，W_t和a_t为待训练参数；

为所述结构化特征的主语、谓语和宾语的语义词向量；其中[；]表示向量的连接；

将b_t，s_t以及t_t输入全连接网络，以按照如下公式得到动作选择判断向量z_t；

其中，W_z和a_z为待训练参数。

上述公式(1)，具体是以当前时刻的为当前初始文本特征b_t及当前目标文本特征s_t作为查询(query)，以所有结构化特征t_j，作为键值(key)，使用注意力机制计算当前时刻的事实向量

根据所述动作选择判断向量z_t与动作选择参数W_a的相乘结果，确定对当前初始文本特征所执行动作的动作确定概率p(action|z_t)；

其中，W_a为待训练参数，动作(action)包括预设的三种：丢弃、保留和生成。

根据动作确定概率，确定所述当前初始文本序列的执行动作。

根据所述执行动作，对所述当前初始文本特征进行处理，以生成所述目标文本序列。

即文本转换模型通过一个时间序列长短记忆循环神经网络来完成对结构化特征的遍历操作，每一时刻，模型可以执行保留、丢弃以及生成三个执行动作中的一个。

对于丢弃、保留和生成的执行动作，丢弃是可以丢弃掉当前初始文本特征，不再将其纳入目标文本特征中；保留可以是保留当前初始文本特征，直接作为目标文本特征；生成的操作更为复杂，需要基于结构化特征来纠正当前初始文本特征。下面对生成动作进行具体介绍如下：

可选的，根据所述当前初始文本特征和匹配的结构化特征，拼接生成为所述目标文本特征包括：

将词汇库中的词汇和所述结构化文本序列中的词汇作为候选词汇，计算各候选词汇作为新词汇的生成概率，并根据所述生成概率确定新词汇；

将所述新词汇映射生成序列向量，并与当前事实向量

进行拼接，以生成目标文本特征。

上述技术方案，具体是基于原结构化文本序列中的词汇，以及额外的词汇库中的其他词汇，共同选择生成哪些新词汇来生成目标文本序列。词汇库包括了大量的可用词汇，不限于结构化文本序列和初始文本序列中的词汇。

表示新词汇的向量可经投影矩阵W_p映射生成序列向量，以作为代表新词汇的文本特征。该投影矩阵W_p同样作为模型的待训练参数。

上述过程中，可选的是，将词汇库中的词汇和所述结构化文本序列中的词汇作为候选词汇，计算各候选词汇作为新词汇的生成概率，并根据所述生成概率确定新词汇包括：

按照如下公式计算新词汇来源为词汇库或结构化文本序列的来源概率p_gate：

其中，

和a_g为待训练参数；sigmoid()为激活函数；

按照如下公式计算所述词汇库候选词汇的产生概率p_gen(y_t|z_t)：

p_gen(y_t|z_t)＝softmax(W_y·z_t) 公式(6)

其中，W_y为待训练参数，y_t为待生成新词汇；softmax()为回归算法的代价函数；

按照如下公式计算所述结构化文本序列中候选词汇的拷贝概率p_copy为：

p_copy＝(o_j|z_t)∝exp(v_c·tanh(W_c·[z_t；t_j])) 公式(7)

其中，v_c和W_c为待训练参数，o_j为候选词汇的事实三元组；

根据所述来源概率、产生概率和拷贝开率计算新词汇的生成概率为：

根据所述生成概率从各候选词汇中确定新词汇。

上述概率计算过程中，首先计算了来源概率，即应该从词汇库中生成一个全新的词汇，还是应该从结构化文本序列中拷贝一个词汇的概率。产生概率表达从词汇库中候选词汇被选择的概率，拷贝概率表达从结构化文本序列中候选词汇被选择的概率。最后计算总的生成概率。

实施例五

本公开实施例五提供了一种文本序列生成方法，该实施例以前序实施例为基础，具体介绍通过缓存区的设置来顺序执行文本词汇的处理过程。

可选的，可通过设置多个缓存区来对初始文本序列、初始文本特征、结构化文本序列、结构化特征、目标文本特征和目标文本序列等向量化数据进行存储和顺序处理。即，该方法可选的还包括：

将提取的所述初始文本特征存储至初始缓存区；

将提取的所述结构化特征存储至事实缓存区；

相应的，根据所述初始文本特征和所述结构化特征，融合生成目标文本序列包括：

从所述初始缓存区依次提取当前待处理的初始文本特征，与所述事实缓存区的结构化特征，融合生成目标文本序列。

具体的，可对应于图2B或2C，设置三个缓存区：

初始缓存区：用来保存初始文本序列以及初始文本特征b_t；在初始缓存区中，初始文本序列通过一个双向长短记忆循环神经网络来计算得到初始文本特征；

事实缓存区：用来保存表示事实的三元组：〈主语、谓语、宾语〉即结构化文本序列，以及保存对应的结构化特征t_j，1≤j≤M；在事实存储区中，事实三元组的向量表示由主语、谓语及宾语的向量表示拼接之后，通过一个全连接神经网络得到结构化特征；

编辑缓存区：用于存储编辑数据流，即保存目标文本序列以及目标文本特征s_t。在编辑缓存区中，对于初始的目标文本特征，可采用初始缓存区中的所有向量平均后加上事实存储区中的所有向量平均后，经过另一个全连接神经网络得到。而后每一个时刻的文本特征通过长短记忆循环神经网络来计算得到。

在模型计算的过程中，可顺序从初始缓存区提取当前初始文本特征，并从所述事实缓存区中提取当前事实向量

将所述当前初始文本特征向量b_t与所述当前事实向量

进行匹配，即，将所述当前初始文本特征向量b_t与所述当前事实向量

比对实质特征内容。根据比对实质内容的结果，得到所述执行动作；基于执行动作进行文本处理后的目标文本特征，再存储到编辑缓存区中。

下面结合附图介绍三种执行步骤基于缓存区的处理过程：

1)保留，也可称为拷贝：是将初始缓存区的当前初始文本特征b_t及当前事实向量

送入编辑数据流对应的长短记忆循环神经网络中，计算出新的当前目标文本特征s_t，并将初始缓存区的扫描指针向后移动一次，以便准备开始下一个初始文本特征的处理。

如图4A所示，初始缓存区(Buffer)中缓存所述初始文本特征，从所述初始文本特征中提取所述当前初始文本特征向量b_t，并从所述结构化特征中提取所述当前事实向量

将所述当前初始文本特征向量b_t与所述当前事实向量

比对实质特征内容，且所述当前初始文本特征向量b_t与所述当前事实向量

实质特征内容一致，得到所述执行动作实质执行信息保留，将所述当前初始文本特征向量b_t复制在当前目标文本特征s_t中。

2)丢弃，也可称为删除：如图4B所示，初始缓存区(Buffer)中缓存所述初始文本特征，从所述初始文本特征中提取所述当前初始文本特征向量b_t，并从所述结构化特征中提取所述当前事实向量

发现不存在所述当前事实向量

即，无与所述初始文本特征相关联的所述结构化特征，不存在对结果，得到所述执行动作实质执行信息丢弃，则跳过所述当前初始文本特征向量b_t进行下一时刻，从所述初始文本特征中提取所述当前初始文本特征向量b_t+1，并重复上述操作。编辑数据流的当前目标文本特征维持不变。

3)生成，如图4C所示，缓存区(Buffer)中缓存所述初始文本特征，从所述初始文本特征中提取所述当前初始文本特征向量b_t，并从所述结构化特征中提取所述当前事实向量

将所述当前初始文本特征向量b_t与所述当前事实向量

实质特征内容不一致，得到所述执行动作实质执行信息拼接生成，需要进行计算，将新生成的词汇，与当前事实向量

拼接，再幅值给当前目标文本特征s_t。

上述文本序列的生成方法中，根据多个神经网络对所述初始文本序列与所述结构化文本序列，分别提取所述初始文本特征与所述结构化特征，并将所述初始文本特征与所述结构化特征匹配，获取执行动作，根据执行动作生成目标文本序列，解决了文本到文本转化技术会存在事实错误或疏漏的情况与表到文本转化技术得到的文本生硬、不流畅等技术问题，提高了文本编辑的准确性与流畅性。

实施例六

图5为本公开实施例六提供的一种文本序列生成装置的结构示意图。该装置包括：初始文本特征提取模块510、结构化特征提取模块520和融合模块530。

其中，初始文本特征提取模块510：用于提取初始文本序列的初始文本特征；结构化特征提取模块520：用于提取结构化文本序列的结构化特征；融合模块530：用于根据所述初始文本特征和所述结构化特征，融合生成目标文本序列。

本公开实施例通过一种文本序列的生成方案，结合了文本序列和结构化文本序列，以文本序列来提升所生成目标文本序列的流畅度，以结构化文本序列来提升目标文本序列的事实准确性，解决了文本到文本转化技术会存在事实错误或疏漏的情况，与结构化数据到文本转化技术得到的文本生硬、不流畅等技术问题，提高了文本编辑的准确性与流畅性。

可选的是，所述初始文本特征提取模块510包括特征提取单元

特征提取单元，用于获取初始文本序列，输入双向长短记忆循环神经网络，以提取所述初始文本特征。

进一步的，所述结构化特征提取模块520包括事实三元组确定单元；

事实三元组确定单元，用于根据所述结构化文本序列确定至少一个事实三元组，所述事实三元组包括主语、谓语和宾语；将所述事实三元组输入全连接神经网络，以拼接形成事实三元组序列，作为所述结构化特征。

进一步的，融合模块530包括过滤单元和纠正单元；

过滤单元，用于根据所述结构化特征对所述初始文本特征进行过滤，以融合生成目标文本序列；

纠正单元，用于根据所述结构化特征对所述初始文本特征的文本内容进行纠正，以融合生成目标文本序列；

进一步的，所述过滤单元和纠正单元包括当前子单元、执行动作确定单元、目标序列生成单元；

当前子单元，用于分别将每个初始文本特征作为当前初始文本特征；

执行动作确定单元，用于将所述当前初始文本特征与所述结构化特征进行事实匹配，并根据事实匹配结果确定对所述当前初始文本特征的执行动作；

目标序列生成单元，用于根据所述执行动作，对所述当前初始文本特征进行处理，以生成所述目标文本序列。

进一步的，所述执行动作确定单元，具体用于如果存在与当前初始文本特征匹配的结构化特征，且所述当前初始文本特征和匹配的结构化特征的文本内容匹配，则执行动作为保留；

或者，将所述当前初始文本特征与所述结构化特征输入长短记忆循环神经网络进行事实匹配，并根据事实匹配结果确定对所述当前初始文本特征的执行动作。

进一步的，所述目标序列生成单元，具体用于如果执行动作为保留，则保留所述当前初始文本特征为所述目标文本特征；如果执行动作为拼接生成，则根据所述当前初始文本特征和匹配的结构化特征，拼接生成为所述目标文本特征。如果执行动作为丢弃，则过滤丢弃当前初始文本特征；根据所述目标文本特征生成所述目标文本序列。

可选择的，所述执行动作确定单元，具体用于基于如下公式计算当前事实向量

其中，α_t,j按照如下公式确定：

其中，W_α和

为待训练参数；b_t为当前初始文本特征；s_t为当前目标文本特征，下标t为文本特征的序号；t_j为结构化特征，1≤j≤M，M为结构化特征的数量；exp()为指数函数，tanh()为双曲正切函数；

其中，t_j按照如下公式确定：

其中，W_t和a_t为待训练参数；

将b_t,s_t以及

输入全连接网络，以按照如下公式得到动作选择判断向量z_t；

其中，W_z和a_z为待训练参数；

进一步的，所述目标序列生成单元包括拼接生成子单元；

拼接生成子单元，用于将词汇库中的词汇和所述结构化文本序列中的词汇作为候选词汇，计算各候选词汇作为新词汇的生成概率，并根据所述生成概率确定新词汇；将所述新词汇映射生成序列向量，并与当前事实向量

进行拼接，以生成目标文本特征。

进一步的，所述拼接生成子单元，具体用于按照如下公式计算新词汇来源为词汇库或结构化文本序列的来源概率p_gate：

其中，

和a_g为待训练参数；sigmoid()为激活函数；

p_gen(y_t|z_t)＝softmax(W_y·z_t)

p_copy＝(o_j|z_t)∝exp(v_c·tanh(W_c·[z_t；t_j]))

其中，v_c和W_c为待训练参数，o_j为候选词汇的事实三元组；

根据所述生成概率从各候选词汇中确定新词汇。

进一步的，所述装置还包括至少一个缓存区，用于将提取的所述初始文本特征存储至初始缓存区；将提取的所述结构化特征存储至事实缓存区；相应的，根据所述初始文本特征和所述结构化特征，融合生成目标文本序列包括：从所述初始缓存区依次提取当前待处理的初始文本特征，与所述事实缓存区的结构化特征，融合生成目标文本序列。

进一步的，所述装置在融合模块530装置之前还包括特征拼接模块；

特征拼接模块，用于将所述初始文本特征和所述结构化特征输入全连接神经网络，以进行特征拼接。

上述实施例中提供的文本序列生成装置可执行本申请任意实施例所提供的文本序列生成方法，具备执行该方法相应的功能模块和有益效果。

下面参考图6，其示出了适于用来实现本公开实施例的电子设备600的结构示意图。

如图6所示，电子设备600可以包括处理装置(例如中央处理器、图形处理器等)601，其可以根据存储在只读存储器(ROM)602中的程序或者从存储装置606加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中，还存储有电子设备600操作所需的各种程序和数据。处理装置601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。

通常，以下装置可以连接至I/O接口605：包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置606；包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置607；包括例如磁带、硬盘等的存储装置606；以及通信装置609。通信装置609可以允许电子设备600与其他设备进行无线或有线通信以交换数据。虽然图6示出了具有各种装置的电子设备600，但是应理解的是，并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。

特别地，根据本公开的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本公开的实施例包括一种计算机程序产品，其包括承载在非暂态计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信装置609从网络上被下载和安装，或者从存储装置606被安装，或者从ROM602被安装。在该计算机程序被处理装置601执行时，执行本公开实施例的方法中限定的上述功能。

需要说明的是，本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行***、装置或者器件使用或者与其结合使用。而在本公开中，计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读信号介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：电线、光缆、RF(射频)等等，或者上述的任意合适的组合。

在一些实施方式中，客户端、服务器可以利用诸如HTTP(HyperText TransferProtocol，超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信，并且可以与任意形式或介质的数字数据通信(例如，通信网络)互连。通信网络的示例包括局域网(“LAN”)，广域网(“WAN”)，网际网(例如，互联网)以及端对端网络(例如，ad hoc端对端网络)，以及任何当前已知或未来研发的网络。

上述计算机可读介质可以是上述电子设备中所包含的；也可以是单独存在，而未装配入该电子设备中。

上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被该电子设备执行时，使得该电子设备：获取至少两个网际协议地址；向节点评价设备发送包括所述至少两个网际协议地址的节点评价请求，其中，所述节点评价设备从所述至少两个网际协议地址中，选取网际协议地址并返回；接收所述节点评价设备返回的网际协议地址；其中，所获取的网际协议地址指示内容分发网络中的边缘节点。

或者，上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被该电子设备执行时，使得该电子设备：接收包括至少两个网际协议地址的节点评价请求；从所述至少两个网际协议地址中，选取网际协议地址；返回选取出的网际协议地址；其中，接收到的网际协议地址指示内容分发网络中的边缘节点。

可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码，上述程序设计语言包括但不限于面向对象的程序设计语言—诸如Java、Smalltalk、C++，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

附图中的流程图和框图，图示了按照本公开各种实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的***来实现，或者可以用专用硬件与计算机指令的组合来实现。

描述于本公开实施例中所涉及到的单元可以通过软件的方式实现，也可以通过硬件的方式来实现。其中，单元的名称在某种情况下并不构成对该单元本身的限定，例如，第一获取单元还可以被描述为“获取至少两个网际协议地址的单元”。

本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如，非限制性地，可以使用的示范类型的硬件逻辑部件包括：现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上***(SOC)、复杂可编程逻辑设备(CPLD)等等。

在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行***、装置或设备使用或与指令执行***、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体***、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

根据本公开的一个或多个实施例提供一种文本序列的生成方法，该方法包括：

根据本公开的一个或多个实施例，上述方法中，根据所述初始文本特征和所述结构化特征，融合生成目标文本序列包括：

根据所述结构化特征对所述初始文本特征进行过滤，且根据所述结构化特征对所述初始文本特征的文本内容进行纠正，以融合生成所述目标文本序列。

根据本公开的一个或多个实施例，上述方法中，根据所述结构化特征对所述初始文本特征进行过滤，且根据所述结构化特征对所述初始文本特征的文本内容进行纠正，以融合生成所述目标文本序列包括：

分别将每个初始文本特征作为当前初始文本特征；

根据本公开的一个或多个实施例，上述方法中，根据事实匹配结果确定对所述当前初始文本特征的执行动作包括：

如果执行动作为丢弃，则过滤丢弃当前初始文本特征；

根据所述目标文本特征生成所述目标文本序列。

根据本公开的一个或多个实施例，上述方法中，将所述当前初始文本特征与所述结构化特征进行事实匹配，并根据事实匹配结果确定对所述当前初始文本特征的执行动作包括：

将所述当前初始文本特征与所述结构化特征输入长短记忆循环神经网络进行事实匹配，并根据事实匹配结果确定对所述当前初始文本特征的执行动作。

根据本公开的一个或多个实施例，上述方法中，获取初始文本序列，从所述初始文本序列中提取初始文本特征包括：

获取初始文本序列，输入双向长短记忆循环神经网络，以提取所述初始文本特征。

根据本公开的一个或多个实施例，上述方法中，获取结构化文本序列，从所述结构化文本序列中提取结构化特征包括：

根据所述结构化文本序列确定至少一个事实三元组，所述事实三元组包括主语、谓语和宾语；

将所述事实三元组输入全连接神经网络，以拼接形成事实三元组序列，作为所述结构化特征。

基于如下公式计算当前事实向量

其中，α_t,j按照如下公式确定：

其中，W_α和

其中，t_j按照如下公式确定：

其中，W_t和a_t为待训练参数；

将b_t，s_t以及

其中，W_z和a_z为待训练参数；

根据本公开的一个或多个实施例，上述方法中，根据所述当前初始文本特征和匹配的结构化特征，拼接生成为所述目标文本特征包括：

将所述新词汇映射生成序列向量，并与当前事实向量

进行拼接，以生成目标文本特征。

根据本公开的一个或多个实施例，上述方法中，将词汇库中的词汇和所述结构化文本序列中的词汇作为候选词汇，计算各候选词汇作为新词汇的生成概率，并根据所述生成概率确定新词汇包括：按照如下公式计算新词汇来源为词汇库或结构化文本序列的来源概率p_gate：

其中，

和a_g为待训练参数；sigmoid()为激活函数；

p_gen(y_t|z_t)＝softmax(W_y·z_t)

p_copy＝(o_j|z_t)∝exp(v_c·tanh(W_c·[z_t；t_j]))

其中，v_c和W_c为待训练参数，o_j为候选词汇的事实三元组；

根据所述生成概率从各候选词汇中确定新词汇。

根据本公开的一个或多个实施例，还包括：

将提取的所述初始文本特征存储至初始缓存区；

将提取的所述结构化特征存储至事实缓存区；

根据本公开的一个或多个实施例，上述方法中，根据所述初始文本特征和所述结构化特征，融合生成目标文本序列之前，还包括：

将所述初始文本特征和所述结构化特征输入全连接神经网络，以进行特征拼接。

根据本公开的一个或多个实施例提供了一种文本序列的生成装置，该装置包括：

根据本公开的一个或多个实施例，上述方法中一种电子设备，包括：

一个或多个处理器；

存储器，用于存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器如公开任一实施例所述的文本序列的生成方法。

根据本公开的一个或多个实施例，上述方法中一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如公开任一实施例所述的文本序列的生成方法。

以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解，本公开中所涉及的公开范围，并不限于上述技术特征的特定组合而成的技术方案，同时也应涵盖在不脱离上述公开构思的情况下，由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

此外，虽然采用特定次序描绘了各操作，但是这不应当理解为要求这些操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下，多任务和并行处理可能是有利的。同样地，虽然在上面论述中包含了若干具体实现细节，但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地，在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。

尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题，但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反，上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。