CN110738061A

CN110738061A - 古诗词生成方法、装置、设备及存储介质

Info

Publication number: CN110738061A
Application number: CN201910987761.3A
Authority: CN
Inventors: 刘艳鹏; 张引
Original assignee: Beijing Sohu Internet Information Service Co Ltd
Current assignee: Beijing Sohu Internet Information Service Co Ltd
Priority date: 2019-10-17
Filing date: 2019-10-17
Publication date: 2020-01-31
Anticipated expiration: 2039-10-17
Also published as: CN110738061B

Abstract

本发明提供的古诗词生成方法、装置、设备及存储介质，通过对多模态信息进行关键词提取，实现了多模态信息的规范化处理，进而能够接受更多种模态信息，支持更广泛的实际应用场景，充分反映用户意图；然后通过各模态信息的概率统计结果，为多模态信息的处理提供了数据基础；利用古诗词映射知识图谱，解决了现代汉语与古汉语之间的映射问题；最后，将得到的预设数目个古诗词关键词确定为古诗词主题词，并利用预先训练好的古诗词生成模型，生成与所述古诗词主题词相对应的目标古诗词，从而在古诗词生成过程中，充分融合了多模态信息，更全面的体现了用户意图，有效提升了古诗词生成质量。

Description

古诗词生成方法、装置、设备及存储介质

技术领域

本发明涉及自然语言处理技术领域，更具体的说，涉及古诗词生成方法、装置、设备及存储介质。

背景技术

自然语言生成(NLG)技术在工业应用中越来越广泛，伴随自然语言处理(NLP)技术的快速发展，根据给定主题(结构化数据)生成连贯的自然语言话语成为一个热门的新兴话题，而且使用机器学习让计算机进行古诗词的创作也成为可能。

现有的古诗词生成方案，一般是以单一模态信息(如文本或图像)来生成古诗词，但是单模态信息会存在给定信息不足的问题，据此生成的古诗词可能会与用户真实意图不符，导致古诗词生成质量较差。另一方面，在实际应用中，对于古诗词的生成，用户给定的信息通常会是多模态的，比如用户可能会同时给出文本、图像、视频与音频等多种类型的信息，而如何通过融合多模态信息来提升古诗词生成质量，目前并没有很好的解决方案。

因此，目前迫切需要一种切实有效的古诗词生成方案，以融合多模态信息来提升古诗词生成结果的质量。

发明内容

有鉴于此，本发明提供了一种古诗词生成方法及装置，以解决基于单一模态信息生成古诗词质量较差，而目前又难以融合多模态信息来提升古诗词生成结果的质量的技术问题。

为实现上述目的，本发明提供如下技术方案：

一种古诗词生成方法，包括：

获取用户输入的多模态信息，所述多模态信息包括图像、视频、文本与音频中的至少两种；

对所述多模态信息中各模态信息分别进行关键词提取，获得所述各模态信息分别对应的现代汉语关键词，作为目标现代汉语关键词；

根据历史模态信息统计数据，获取所述各模态信息的出现概率；

根据预先构建的古诗词映射知识图谱，获取与所述目标现代汉语关键词的相关度最高的古汉语关键词，作为目标古汉语关键词；

根据所述目标古汉语关键词与所述目标现代汉语关键词之间的相关度，以及所述各模态信息的出现概率，确定所述目标古汉语关键词的权重；

将所述目标古汉语关键词中权重最大的预设数目个古汉语关键词，确定为古诗词主题词；

利用预先训练好的古诗词生成模型，生成与所述古诗词主题词相对应的目标古诗词。

优选的，所述对所述多模态信息中各模态信息分别进行关键词提取，得到所述各模态信息分别对应的现代汉语关键词，作为目标现代汉语关键词包括：

当所述多模态信息中包括文本时，使用命名实体识别技术识别所述文本中的关键词，得到所述文本对应的现代汉语关键词，作为目标现代汉语关键词；

当所述多模态信息中包括音频时，先使用语音识别技术将所述音频中的语音转换成语音识别文本，再使用命名实体识别技术识别所述语音识别文本中的关键词，得到所述音频对应的现代汉语关键词，作为目标现代汉语关键词；

当所述多模态信息中包括图像时，先使用图像识别技术识别所述图像的内容信息，再根据所述图像的内容信息，确定所述图像对应的现代汉语关键词，作为目标现代汉语关键词；

当所述多模态信息中包括视频时，先使用视频理解技术识别所述视频中的关键帧图像，再使用图像识别技术识别所述关键帧图像的内容信息，然后根据所述关键帧图像的内容信息，确定所述视频对应的现代汉语关键词，作为目标现代汉语关键词。

优选的，所述根据历史模态信息统计数据，获取所述各模态信息的出现概率包括：

利用以下公式，计算目标模态信息Bi的出现概率P(B_i)：

P(B_i)＝COUNT(B_i)/COUNT(B)，i∈[1,n]，B＝∑B_i；

其中，COUNT(B_i)表示所述多模态信息中目标模态信息B_i在历史模态信息中出现的次数；COUNT(B)表示所述多模态信息中所有模态信息B在历史模态信息中出现的总次数。

优选的，所述多模态信息中模态信息的表现形式包括单模态信息与多模态组合信息。

优选的，所述根据所述目标古汉语关键词与所述目标现代汉语关键词之间的相关度，以及所述各模态信息的出现概率，确定所述目标古汉语关键词的权重包括：

根据所述各模态信息与所述目标现代汉语关键词的对应关系，所述目标现代汉语关键词与所述目标古汉语关键词的关联关系，以及所述各模态信息的出现概率，确定所述目标古汉语关键词对应的概率；

将所述目标古汉语关键词对应的相关度与概率的乘积，作为所述目标古汉语关键词的权重。

优选的，所述将所述目标古汉语关键词中权重最大的预设数目个古汉语关键词，确定为古诗词主题词包括：

当所述目标古汉语关键词的个数大于或等于预设数目时，将所述古汉语关键词中权重最大的预设数目个古汉语关键词，作为古诗词主题词；

当所述目标古汉语关键词的个数小于所述预设数目时，使用通过主题词嵌入技术Topical Word Embedding预先训练好的古汉语词向量对所述目标古汉语关键词进行扩展，得到预设数目个目标古汉语关键词，作为古诗词主题词。

优选的，所述利用预先训练好的古诗词生成模型，生成与所述古诗词主题词相对应的目标古诗词包括：

获取预先训练好的古诗词生成模型；

将所述古诗词主题词输入至所述古诗词生成模型，获取所述古诗词生成模型输出的目标古诗词。

一种古诗词生成装置，包括：

输入信息获取单元，用于获取用户输入的多模态信息，所述多模态信息包括图像、视频、文本与音频中的至少两种；

现代词汇提取单元，用于对所述多模态信息中各模态信息分别进行关键词提取，获得所述各模态信息分别对应的现代汉语关键词，作为目标现代汉语关键词；

模态概率获取单元，用于根据历史模态信息统计数据，获取所述各模态信息的出现概率；

古语词汇匹配单元，用于根据预先构建的古诗词映射知识图谱，获取与所述目标现代汉语关键词的相关度最高的古汉语关键词，作为目标古汉语关键词；

古语权重确定单元，用于根据所述目标古汉语关键词与所述目标现代汉语关键词之间的相关度，以及所述各模态信息的出现概率，确定所述目标古汉语关键词的权重；

诗词主题确定单元，用于将所述目标古汉语关键词中权重最大的预设数目个古汉语关键词，确定为古诗词主题词；

目标诗词生成单元，用于利用预先训练好的古诗词生成模型，生成与所述古诗词主题词相对应的目标古诗词。

一种古诗词生成设备，包括处理器与存储器；

所述存储器，用于存储程序；

所述处理器，用于执行所述存储器中存储的程序，以实现前面所述的古诗词生成方法。

一种计算机可读存储介质，所述计算机可读存储介质中存储有程序，所述程序在被处理器执行时实现前面所述的古诗词生成方法。

从上述的技术方案可以看出，本发明提供的古诗词生成方法、装置、设备及存储介质，通过对多模态信息进行关键词提取，实现了多模态信息的规范化处理，进而能够接受更多种模态信息，支持更广泛的实际应用场景，充分反映用户意图；然后通过各模态信息的概率统计结果，为多模态信息的处理提供了数据基础；利用古诗词映射知识图谱，解决了现代汉语与古汉语之间的映射问题；最后，将得到的预设数目个古诗词关键词确定为古诗词主题词，并利用预先训练好的古诗词生成模型，生成与所述古诗词主题词相对应的目标古诗词，从而在古诗词生成过程中，充分融合了多模态信息，更全面的体现了用户意图，有效提升了古诗词生成质量。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1为本发明实施例提供的古诗词生成方法的一种流程图；

图2为本发明实施例提供的古诗词生成方法的另一种流程图；

图3为本发明实施例提供的古诗词映射知识图谱的示例图；

图4为本发明实施例提供的古诗词生成***的处理流程示意图；

图5为本发明实施例提供的古诗词生成装置的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明提供了基于多模态信息进行古诗词生成的技术方案，该方案可支持将更多模态信息作为用户输入信息，该方案主要包括多模态信息的规范化处理、融合处理、以及从现代汉语到古汉语的映射处理，此外还提供了在主题词不足时能够保证主题一致性的主题词扩展方案。

请参阅图1，图1为本发明实施例提供的古诗词生成方法的一种流程图。

如图1所示，本实施例的古诗词生成方法可包括：

S101：获取用户输入的多模态信息，所述多模态信息包括图像、视频、文本与音频中的至少两种。

用户输入的多模态信息是用于生成古诗词的初始素材。所述多模态信息中模态信息的表现形式可包括单模态信息与多模态组合信息。其中，单独存在的图像、视频、文本和音频等均属于是单模态信息；当不同的单模态信息相互融合在一起时，就属于是多模态组合信息，例如，文本与图像信息、文本与短视频信息、音频与图像信息等。多个单模态信息，和/或，至少一个多模态组合信息，均属于多模态信息的范畴。

S102：对所述多模态信息中各模态信息分别进行关键词提取，获得所述各模态信息分别对应的现代汉语关键词，作为目标现代汉语关键词。

由于多模态信息中各模态信息之间具有多样性，所以为了统一不同的模态信息，需要对各模态信息先进行规范化处理，而这里的规范化处理是指，提取各模态信息对应的现代汉语关键词，并将这些现代汉语关键词作为各模态信息的规范化处理结果。

在执行规范化处理时，需要分别对不同的模态信息进行处理，在实际场景中主要涉及的模态信息有图像、视频、文本、音频等，主要可包括以下A1～A4这四种处理方式：

A1、当所述多模态信息中包括文本时，使用命名实体识别技术识别所述文本中的关键词，得到所述文本对应的现代汉语关键词，作为目标现代汉语关键词。

例如，针对白话文文本，进行命名实体识别，以获取白话文文本中的实体关键字信息，并将其加入到主题关键词集合。

A2、当所述多模态信息中包括音频时，先使用语音识别技术将所述音频中的语音转换成语音识别文本，再使用命名实体识别技术识别所述语音识别文本中的关键词，得到所述音频对应的现代汉语关键词，作为目标现代汉语关键词。

例如，针对音频，可先使用深度学习模型将音频中的语音转写成文本，后续处理过程与白话文文本的处理过程一致，获取相应的实体关键字信息加入到主题关键词集合。

A3、当所述多模态信息中包括图像时，先使用图像识别技术识别所述图像的内容信息，再根据所述图像的内容信息，确定所述图像对应的现代汉语关键词，作为目标现代汉语关键词。

其中，图像的内容信息可包括对象及场景等信息。

例如，针对图像，执行图像目标及场景识别，获取相应现代汉语关键词及置信度，并将其加入到主题关键词集合。

A4、当所述多模态信息中包括视频时，先使用视频理解技术识别所述视频中的关键帧图像，再使用图像识别技术识别所述关键帧图像的内容信息，然后根据所述关键帧图像的内容信息，确定所述视频对应的现代汉语关键词，作为目标现代汉语关键词(或其他基于时序的视频理解技术进行内容理解)。

例如，针对视频，首先进行关键帧识别，实现动态视频到静态图像的转换，获取关键帧图像及帧频，然后按照图像的处理方法，识别相应的现代汉语关键词及置信度，并将其加入到主题关键词集合。

S103：根据历史模态信息统计数据，获取所述各模态信息的出现概率。

可根据大数定律，获取各模态信息在历史模态信息中出现的概率。

S104：根据预先构建的古诗词映射知识图谱，获取与所述目标现代汉语关键词的相关度最高的古汉语关键词，作为目标古汉语关键词。

古汉语与现代汉语之间存在意义差异鸿沟，为了解决古汉语与现代汉语之间映射问题，本发明预先构建了古诗词映射知识图谱(PMKG，Poetry Mapping Knowledge graph)，其在本发明中的作用是提供古汉语关键词与现代汉语关键词之间的映射关系。

关于古诗词映射知识图谱，可参见图3所示的具体示例，图3中有底纹圆形表示现代汉语词汇，无底纹圆形表示古汉语词汇，现代汉语词汇与古汉语词汇间的相关度可使用TF-IDF(词频-逆文本频率，term frequency–inverse document frequency)技术计算得到。在此需要注意的是，图3所示的只是本发明中古诗词映射知识图谱的其中一个示例，而本发明提供的古诗词映射知识图谱还可涵盖更多词汇数据，而并不局限于图3所示的内容。其中，古诗词映射知识图谱的词汇数据主要可来源于中文***以及汉文学网等。

根据预先创建的古诗映射知识图谱，可以依次获取与所述目标现代汉语关键词最相关的古汉语关键词，作为目标古汉语关键词。

S105：根据所述目标古汉语关键词与所述目标现代汉语关键词之间的相关度，以及所述各模态信息的出现概率，确定所述目标古汉语关键词的权重。

在一示例中，可将目标古汉语关键词对应的相关度与概率的乘积，作为目标古汉语关键词的权重。其中，古汉语关键词对应的概率，实际上就是对应模态信息的出现概率。

此外，可将古汉语关键词及其权重添加到关键词字典中。

S106：将所述目标古汉语关键词中权重最大的预设数目个古汉语关键词，确定为古诗词主题词。

预设数目是指用于生成古诗词所需要的古汉语关键词的数量。

S107：利用预先训练好的古诗词生成模型，生成与所述古诗词主题词相对应的目标古诗词。

古诗词生成模型，具体可以是根据古诗词主题词样本训练得到的Seq2Seq模型。

本实施例提供的古诗词生成方法，通过对多模态信息进行关键词提取，实现了多模态信息的规范化处理，进而能够接受更多种模态信息，支持更广泛的实际应用场景，充分反映用户意图；然后通过各模态信息的概率统计结果，为多模态信息的处理提供了数据基础；利用古诗词映射知识图谱，解决了现代汉语与古汉语之间的映射问题；最后，将得到的预设数目个古诗词关键词确定为古诗词主题词，并利用预先训练好的古诗词生成模型，生成与所述古诗词主题词相对应的目标古诗词，从而在古诗词生成过程中，充分融合了多模态信息，更全面的体现了用户意图，有效提升了古诗词生成质量。

请参阅图2，图2为本发明实施例提供的古诗词生成方法的另一种流程图。

如图2所示，本实施例的古诗词生成方法包括：

S201：获取用户输入的多模态信息。

所述多模态信息包括图像、视频、文本与音频中的至少两种。

S202：提取目标现代汉语关键词。

对所述多模态信息中各模态信息分别进行关键词提取，获得所述各模态信息分别对应的现代汉语关键词，作为目标现代汉语关键词。

其中，步骤S201-S202与前述实施例中的步骤S101-S102相一致，在此不再赘述。

S203：计算各模态信息的出现概率。

具体地，根据大数定律，可利用以下公式，计算目标模态信息Bi的出现概率P(B_i)：

P(B_i)＝COUNT(B_i)/COUNT(B)，i∈[1,n]，B＝∑B_i；

其中，COUNT(B_i)表示所述多模态信息中目标模态信息B_i在历史模态信息中出现的次数；COUNT(B)表示所述多模态信息中所有模态信息B在历史模态信息中出现的总次数。所述目标模态信息B_i为所述所有模态信息B中的任一模态信息。

S204：获取目标古汉语关键词。

根据预先构建的古诗词映射知识图谱，获取与所述目标现代汉语关键词的相关度最高的古汉语关键词，作为目标古汉语关键词。

其中，步骤S204与前述实施例中的步骤S104相一致，在此不再赘述。

S205：获取目标古汉语关键词的权重。

将所述目标古汉语关键词对应的相关度与概率的乘积，作为所述目标古汉语关键词的权重；

其中，目标古汉语关键词对应的相关度，就是目标古汉语关键词与所述目标现代汉语关键词之间的相关度；目标古汉语关键词对应的概率，就是目标古汉语关键词对应的模态信息的出现概率。

具体地，在步骤S205之前，还可包括：根据所述各模态信息与所述目标现代汉语关键词的对应关系，所述目标现代汉语关键词与所述目标古汉语关键词的关联关系，以及所述各模态信息的出现概率，确定所述目标古汉语关键词对应的概率。也就是说，根据上述对应关系与关联关系，就可以找到目标古汉语关键词与模态信息之间的对应关系，进而将模态信息的出现概率作为相应的目标古汉语关键词对应的概率。

S206：判断COUNT(D)≥K是否成立，若是，执行S207；若否，执行S208。

判断COUNT(D)≥K是否成立，即为判断目标古汉语关键词的个数是否大于或等于预设数目。

其中，COUNT(D)表示目标古汉语关键词的个数，D表示目标古汉语关键词，K为预设数目。K值可以是人为设定的，也可以是根据历史经验自动确定的，只需要K值能够满足生成古诗词的词汇量需求即可。

S207：对目标古汉语关键词去冗余，得到古诗词主题词。

将所述古汉语关键词中权重最大的预设数目个古汉语关键词，作为古诗词主题词。

也就是说，当所述目标古汉语关键词的个数大于或等于预设数目时，将所述古汉语关键词中权重最大的预设数目个古汉语关键词，作为古诗词主题词。

在一示例中，可以先根据目标古汉语关键词的权重对目标古汉语关键词进行排序，如果COUNT(D)≥K，则选取D中的Top-K的古汉语关键词，作为古诗词主题词，Top-K表示排序最靠前的K个。

通过步骤该S207，就可以在获取古诗词主题词时，有效滤除权重较低的冗余的目标古汉语关键词，进而解决目标古汉语关键词的冗余问题。

S208：对目标古汉语关键词进行扩展，得到古诗词主题词。

使用通过主题词嵌入技术Topical Word Embedding预先训练好的古汉语词向量对所述目标古汉语关键词进行扩展，得到预设数目个目标古汉语关键词，作为古诗词主题词。

主题词嵌入技术Topical Word Embedding，是基于词和主题来学习词向量，使得生成的同一主题的词向量距离更近，本发明使用这一技术能够确保扩展的关键词在主题上的一致性。

也就是说，当所述目标古汉语关键词的个数小于所述预设数目时，使用通过主题词嵌入技术Topical Word Embedding预先训练好的古汉语词向量对所述目标古汉语关键词进行扩展，得到预设数目个目标古汉语关键词，作为古诗词主题词。

在一示例中，可以在Topical Word Embedding训练的古汉语词向量中，对得到的目标古汉语关键词求取(COUNT(D)-K)个最近邻，其中，以余弦相似度作为量纲，从而实现对目标古汉语关键词的扩展，并能够保证古诗词主题词的主题一致性，进而有效提升古诗词生成质量。

S209：生成目标古诗词。

在一示例中，步骤S209可具体包括：获取预先训练好的古诗词生成模型；将所述古诗词主题词输入至所述古诗词生成模型，获取所述古诗词生成模型输出的目标古诗词。

具体地，可根据古诗词主题词样本训练Seq2Seq古诗词生成模型，再通过此处获取的古诗词主题词作为主题编码输入，并解码生成目标古诗词。

本实施例提供的古诗词生成方法，根据大数定律，计算所述各模态信息的出现概率，为多模态信息的处理提供了充分的数据基础，并且根据获得的目标古汉语关键词的个数多少，来分别执行相应的去冗余处理或扩展处理，从而解决了古诗词主题词的冗余问题与缺失问题；而且，在去冗余处理时，滤除了权重低的目标古汉语关键词，确保了古诗词主题词的准确性；在扩展处理时，采用古汉语词向量对目标古汉语关键词进行扩展，保证了扩展出来的古汉语关键词与目标古汉语关键词具有较高的主题一致性，从而有效提升了生成的古诗词的质量。

请参阅图4，图4为本发明实施例提供的古诗词生成***的处理流程示意图。

本发明的古诗词生成过程的基本流程主要包括：“规范化—>融合—>映射—>扩展”。

如图4所示，首先，获取多模态信息，多模态信息包括图像、短视频、白话文文本与语音。

其次，利用信息处理模块对多模态信息进行用户意图识别与规范化处理，其中包括对图像进行图像识别，对短视频进行关键帧识别后再进行图像识别，对白话文文本进行命名实体识别，以及对语音进行文本转写后再进行命名实体识别；借助便能够得到规范化后输出的现代汉语关键词，并据此反映出用户意图。

然后，利用信息处理模块对规范化输出结果进行内容选择和组织，其中包括关键词融合及映射，即获取规范化后输出的现代汉语关键词，并据其进行古汉语关键词映射，得到生成古诗词所需的古汉语关键词；还包括主题一致性规划，即对映射得到的古汉语关键词进行选择或扩充，得到古诗词主题词。

最后，利用古诗词生成模型，生成与古诗词主题词相对应的古诗词。

其中，在古诗词生成模型训练时，可以预先采集古诗词数据集，并对古诗词数据集进行文本清洗、文本筛选、分词、韵律提取的预处理过程，得到古诗词主题词样本，然后利用古诗词主题词样本来训练得到古诗词生成模型。

本实施例提供的古诗词生成***的处理流程，从***层面上给出了更加全面、完整的古诗词生成的处理流程，其同样通过对多模态信息进行关键词提取，实现了多模态信息的规范化处理，进而能够接受更多种模态信息，支持更广泛的实际应用场景；通过各模态信息的概率统计结果，为多模态信息的处理提供了数据基础；通过古诗词映射知识图谱解决了现代汉语与古汉语之间的映射问题，最后将预设数目个古诗词关键词确定为古诗词主题词，并利用预先训练好的古诗词生成模型，生成与所述古诗词主题词相对应的目标古诗词，从而在古诗词生成过程中，充分融合了多模态信息，有效提高了生成的古诗词的质量。

本发明实施例还提供了古诗词生成装置，所述古诗词生成装置用于实施本发明实施例提供的古诗词生成方法，下文描述的古诗词生成装置的技术内容，可与上文描述的古诗词生成方法的技术内容与相互对应参照，相同或类似内容不再赘述。

请参阅图5，图5为本发明实施例提供的古诗词生成装置的一种结构示意图。

如图5所示，所述装置包括：输入信息获取单元100、现代词汇提取单元200、模态概率获取单元300、古语词汇匹配单元400、古语权重确定单元500、诗词主题确定单元600与目标诗词生成单元700。

输入信息获取单元100，用于获取用户输入的多模态信息，所述多模态信息包括图像、视频、文本与音频中的至少两种。

所述多模态信息中模态信息的表现形式包括单模态信息与多模态组合信息。

现代词汇提取单元200，用于对所述多模态信息中各模态信息分别进行关键词提取，获得所述各模态信息分别对应的现代汉语关键词，作为目标现代汉语关键词。

模态概率获取单元300，用于根据历史模态信息统计数据，获取所述各模态信息的出现概率。

古语词汇匹配单元400，用于根据预先构建的古诗词映射知识图谱，获取与所述目标现代汉语关键词的相关度最高的古汉语关键词，作为目标古汉语关键词。

古语权重确定单元500，用于根据所述目标古汉语关键词与所述目标现代汉语关键词之间的相关度，以及所述各模态信息的出现概率，确定所述目标古汉语关键词的权重。

诗词主题确定单元600，用于将所述目标古汉语关键词中权重最大的预设数目个古汉语关键词，确定为古诗词主题词。

目标诗词生成单元700，用于利用预先训练好的古诗词生成模型，生成与所述古诗词主题词相对应的目标古诗词。

在一示例中，现代词汇提取单元200具体用于：

当所述多模态信息中包括图像时，先使用图像识别技术识别所述图像的内容信息，再根据所述图像的内容信息，确定所述图像对应的现代汉语关键词，作为目标现代汉语关键词；图像的内容信息可包括对象及场景等信息。

当所述多模态信息中包括视频时，先使用视频理解技术识别所述视频中的关键帧图像，再使用图像识别技术识别所述关键帧图像的内容信息，然后根据所述关键帧图像的内容信息，确定所述视频对应的现代汉语关键词，作为目标现代汉语关键词(或其他基于时序的视频理解技术进行内容理解)。

在一示例中，模态概率获取单元300具体用于：

所述根据历史模态信息统计数据，获取所述各模态信息的出现概率包括：

利用以下公式，计算目标模态信息Bi的出现概率P(B_i)：

P(B_i)＝COUNT(B_i)/COUNT(B)，i∈[1,n]，B＝∑B_i；

在一示例中，古语权重确定单元500具体用于：

在一示例中，诗词主题确定单元600具体用于：

在一示例中，目标诗词生成单元700具体用于：

所述利用预先训练好的古诗词生成模型，生成与所述古诗词主题词相对应的目标古诗词包括：

获取预先训练好的古诗词生成模型；

本实施例提供的古诗词生成装置，通过对多模态信息进行关键词提取，实现了多模态信息的规范化处理，进而能够接受更多种模态信息，支持更广泛的实际应用场景，充分反映用户意图；然后通过各模态信息的概率统计结果，为多模态信息的处理提供了数据基础；利用古诗词映射知识图谱，解决了现代汉语与古汉语之间的映射问题；最后，将得到的预设数目个古诗词关键词确定为古诗词主题词，并利用预先训练好的古诗词生成模型，生成与所述古诗词主题词相对应的目标古诗词，从而在古诗词生成过程中，充分融合了多模态信息，更全面的体现了用户意图，有效提升了古诗词生成质量。

并且，根据大数定律，计算所述各模态信息的出现概率，为多模态信息的处理提供了充分的数据基础，并且根据获得的目标古汉语关键词的个数多少，来分别执行相应的去冗余处理或扩展处理，从而解决了古诗词主题词的冗余问题与缺失问题；而且，在去冗余处理时，滤除了权重低的目标古汉语关键词，确保了古诗词主题词的准确性；在扩展处理时，采用古汉语词向量对目标古汉语关键词进行扩展，保证了扩展出来的古汉语关键词与目标古汉语关键词具有较高的主题一致性，从而有效提升了生成的古诗词的质量。

本发明实施例提供的古诗词生成装置，包括处理器和存储器，上述输入信息获取单元100、现代词汇提取单元200、模态概率获取单元300、古语词汇匹配单元400、古语权重确定单元500、诗词主题确定单元600与目标诗词生成单元700等均作为程序单元存储在存储器中，由处理器执行存储在存储器中的上述程序单元来实现相应的功能。

处理器中包含内核，由内核去存储器中调取相应的程序单元。内核可以设置一个或以上，通过调整内核参数来实现前述的古诗词生成方法。

存储器可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flashRAM)，存储器包括至少一个存储芯片。

本发明实施例提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有程序，所述程序在被处理器执行时实现前述的古诗词生成方法的步骤。

本发明实施例提供了一种处理器，所述处理器用于运行程序，其中，所述程序运行时执行前述的古诗词生成方法的步骤。

本发明实施例提供了一种古诗词生成设备，其包括处理器、存储器，以及存储在存储器上并可在处理器上运行的程序，处理器执行该程序时实现前述的古诗词生成方法的步骤。

本文中的设备可以是服务器、PC、PAD、手机等。

本申请还提供了一种计算机程序产品，当在数据处理设备上执行时，适于执行初始化有前述的古诗词生成方法的步骤的程序。

最后，还需要说明的是，在本文中，诸如第一和第一等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式来实现。基于这样的理解，本申请的技术方案对背景技术做出贡献的全部或者部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的一般技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处。综上所述，本说明书内容不应理解为对本申请的限制。

Claims

1.一种古诗词生成方法，其特征在于，包括：

2.如权利要求1所述的方法，其特征在于，所述对所述多模态信息中各模态信息分别进行关键词提取，得到所述各模态信息分别对应的现代汉语关键词，作为目标现代汉语关键词包括：

3.如权利要求1所述的方法，其特征在于，所述根据历史模态信息统计数据，获取所述各模态信息的出现概率包括：

利用以下公式，计算目标模态信息Bi的出现概率P(B_i)：

P(B_i)＝COUNT(B_i)/COUNT(B)，i∈[1,n]，B＝∑B_i；

4.如权利要求1所述的方法，其特征在于，所述多模态信息中模态信息的表现形式包括单模态信息与多模态组合信息。

5.如权利要求1所述的方法，其特征在于，所述根据所述目标古汉语关键词与所述目标现代汉语关键词之间的相关度，以及所述各模态信息的出现概率，确定所述目标古汉语关键词的权重包括：

6.如权利要求1所述的方法，其特征在于，所述将所述目标古汉语关键词中权重最大的预设数目个古汉语关键词，确定为古诗词主题词包括：

7.如权利要求1所述的方法，其特征在于，所述利用预先训练好的古诗词生成模型，生成与所述古诗词主题词相对应的目标古诗词包括：

获取预先训练好的古诗词生成模型；

8.一种古诗词生成装置，其特征在于，包括：

9.一种古诗词生成设备，其特征在于，包括处理器与存储器；

所述存储器，用于存储程序；

所述处理器，用于执行所述存储器中存储的程序，以实现如权利要求1～7任一项所述的古诗词生成方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有程序，所述程序在被处理器执行时实现如权利要求1～7任一项所述的古诗词生成方法。