CN113420553A - 文本生成方法、装置、存储介质及电子设备 - Google Patents
文本生成方法、装置、存储介质及电子设备 Download PDFInfo
- Publication number
- CN113420553A CN113420553A CN202110825851.XA CN202110825851A CN113420553A CN 113420553 A CN113420553 A CN 113420553A CN 202110825851 A CN202110825851 A CN 202110825851A CN 113420553 A CN113420553 A CN 113420553A
- Authority
- CN
- China
- Prior art keywords
- text
- information
- current
- preset
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 47
- 238000004590 computer program Methods 0.000 claims description 10
- 230000003993 interaction Effects 0.000 abstract description 9
- 238000004891 communication Methods 0.000 description 11
- 239000011159 matrix material Substances 0.000 description 11
- 238000010586 diagram Methods 0.000 description 10
- 238000013473 artificial intelligence Methods 0.000 description 9
- 238000012545 processing Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 230000001133 acceleration Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Machine Translation (AREA)
Abstract
本公开涉及一种文本生成方法、装置、存储介质及电子设备,所述方法包括:确定当前文本中的多个预设角色对应的第一角色特征词、以及多个预设角色之间的第一角色关系,所述当前文本包括已生成的故事片段对应的文本;确定所述当前文本对应的第一文本背景信息和文本情节信息;根据所述第一角色特征词、所述第一角色关系、所述第一文本背景信息以及所述文本情节信息,生成所述当前文本的下一文本;根据所述当前文本和所述下一文本,生成目标文本。这样,能够融合角色之间的交互,体现角色与文本背景、角色与文本情节之间的关系,使得文本的逻辑性和连贯性更好,从而提高了生成的文本的质量。
Description
技术领域
本公开涉及自然语言处理领域,尤其涉及一种文本生成方法、装置、存储介质及电子设备。
背景技术
随着互联网、信息通讯以及AI(Artificial Intelligence,人工智能)技术的发展,电子设备越来越多的应用于人们的生活,AI创作也逐渐走入大众的视野,例如:AI写诗、AI画画、AI生成歌曲、AI唱歌、AI生成故事等。
在AI生成故事方面,通常会通过预先设置的故事中的人物以及每个人物的心理状态,生成对应的故事。
发明内容
为克服相关技术中存在的问题,本公开提供一种文本生成方法、装置、存储介质及电子设备。
根据本公开实施例的第一方面,提供一种文本生成方法,包括:
确定当前文本中的多个预设角色对应的第一角色特征词、以及多个所述预设角色之间的第一角色关系,所述当前文本包括已生成的故事片段对应的文本;
确定所述当前文本对应的第一文本背景信息和文本情节信息;
根据所述第一角色特征词、所述第一角色关系、所述第一文本背景信息以及所述文本情节信息,生成所述当前文本的下一文本;
根据所述当前文本和所述下一文本,生成目标文本。
在一些实施例中,所述根据所述当前文本和所述下一文本,生成目标文本包括:
确定拼接文本对应的文本信息,所述拼接文本包括所述当前文本和所述下一文本拼接后的文本;
在所述文本信息满足预设文本生成终止条件的情况下,将所述拼接文本作为所述目标文本。
在一些实施例中,所述方法还包括:
在所述文本信息不满足所述预设文本生成终止条件的情况下,用所述拼接文本替换所述当前文本,并根据所述拼接文本重新执行确定所述拼接文本中的多个预设角色对应的第一角色特征词、以及多个所述预设角色之间的第一角色关系的步骤,至根据所述拼接文本和所述下一文本,生成目标文本的步骤。
在一些实施例中,所述文本信息包括生成文本的时长和文本语句数量;所述预设文本生成终止条件包括:
所述时长大于或等于预设时长阈值;和/或,
所述文本语句数量大于或等于预设数量阈值。
在一些实施例中,所述获取所述当前文本对应的第一文本背景信息和文本情节信息包括:
确定第一文本对应的第二文本背景信息,所述第一文本包括所述当前文本中除第二文本之外的文本,所述第二文本为所述当前文本中最后一次生成的文本;
将所述第二文本和所述第二文本背景信息输入预先训练的背景获取模型,得到所述第一文本背景信息;
将所述第一文本背景信息输入预先训练的情节获取模型,得到所述文本情节信息。
在一些实施例中,所述根据所述第一角色特征词、所述第一角色关系、所述第一文本背景信息以及所述文本情节信息,生成所述当前文本的下一文本包括:
将所述第一角色特征词、所述第一角色关系、所述第一文本背景信息以及所述文本情节信息输入预先训练的文本生成模型,得到所述当前文本的下一文本。
在一些实施例中,所述文本生成模型包括角色信息获取子模型和文本生成子模型;所述将所述第一角色特征词、所述第一角色关系、所述第一文本背景信息以及所述文本情节信息输入预先训练的文本生成模型,得到所述当前文本的下一文本包括:
将所述第一角色特征词、所述第一角色关系以及所述第一文本背景信息输入所述角色信息获取子模型,得到角色信息;
将所述角色信息、所述第一文本背景信息以及所述文本情节信息输入所述文本生成子模型,得到所述当前文本的下一文本。
在一些实施例中,所述角色特征词包括预先设置的与所述预设角色相关的词,和/或,所述当前文本中与所述预设角色相关的词。
根据本公开实施例的第二方面,提供一种文本生成装置,包括:
特征词确定模块,被配置为确定当前文本中的多个预设角色对应的第一角色特征词、以及多个所述预设角色之间的第一角色关系,所述当前文本包括已生成的故事片段对应的文本;
信息确定模块,被配置为确定所述当前文本对应的第一文本背景信息和文本情节信息;
第一文本生成模块,被配置为根据所述第一角色特征词、所述第一角色关系、所述第一文本背景信息以及所述文本情节信息,生成所述当前文本的下一文本;
第二文本生成模块,被配置为根据所述当前文本和所述下一文本,生成目标文本。
在一些实施例中,所述第二文本生成模块,还被配置为:
确定拼接文本对应的文本信息,所述拼接文本包括所述当前文本和所述下一文本拼接后的文本;
在所述文本信息满足预设文本生成终止条件的情况下,将所述拼接文本作为所述目标文本。
在一些实施例中,所述第二文本生成模块,还被配置为:
在所述文本信息不满足所述预设文本生成终止条件的情况下,用所述拼接文本替换所述当前文本,并根据所述拼接文本重新执行确定所述拼接文本中的多个预设角色对应的第一角色特征词、以及多个所述预设角色之间的第一角色关系的步骤,至根据所述拼接文本和所述下一文本,生成目标文本的步骤。
在一些实施例中,所述文本信息包括生成文本的时长和文本语句数量;所述预设文本生成终止条件包括:
所述时长大于或等于预设时长阈值;和/或,
所述文本语句数量大于或等于预设数量阈值。
在一些实施例中,所述信息确定模块,还被配置为:
确定第一文本对应的第二文本背景信息,所述第一文本包括所述当前文本中除所述第二文本之外的文本,所述第二文本为所述当前文本中最后一次生成的文本;
将所述第二文本和所述第二文本背景信息输入预先训练的背景获取模型,得到所述第一文本背景信息;
将所述第一文本背景信息输入预先训练的情节获取模型,得到所述文本情节信息。
在一些实施例中,所述第一文本生成模块,还被配置为:
将所述第一角色特征词、所述第一角色关系、所述第一文本背景信息以及所述文本情节信息输入预先训练的文本生成模型,得到所述当前文本的下一文本。
在一些实施例中,所述文本生成模型包括角色信息获取子模型和文本生成子模型;所述第一文本生成模块,还被配置为:
将所述第一角色特征词、所述第一角色关系以及所述第一文本背景信息输入所述角色信息获取子模型,得到角色信息;
将所述角色信息、所述第一文本背景信息以及所述文本情节信息输入所述文本生成子模型,得到所述当前文本的下一文本。
在一些实施例中,所述角色特征词包括预先设置的与所述预设角色相关的词,和/或,所述当前文本中与所述预设角色相关的词。
根据本公开实施例的第三方面,提供一种计算机可读存储介质,其上存储有计算机程序指令,该程序指令被处理器执行时实现本公开第一方面所提供的文本生成方法的步骤。
根据本公开实施例的第四方面,提供一种电子设备,包括:
存储器,其上存储有计算机程序;
处理器,用于执行所述存储器中的所述计算机程序,以实现本公开第一方面所提供的文本生成方法的步骤。
本公开的实施例提供的技术方案可以包括以下有益效果:在生成目标文本时,可以结合当前文本中的多个预设角色对应的第一角色特征词、多个预设角色之间的第一角色关系以及当前文本对应的第一文本背景信息和文本情节信息,这样,在生成目标文本过程中,能够更加全面地融合角色之间的交互,体现角色与文本背景、角色与文本情节之间的关系,使得文本的逻辑性和连贯性更好,从而提高了生成的文本的质量。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1是根据本公开一示例性实施例示出的一种文本生成方法的流程图;
图2是根据本公开一示例性实施例示出的另一种文本生成方法的流程图;
图3是根据本公开一示例性实施例示出的一种角色信息获取子模型的示意图;
图4是根据本公开一示例性实施例示出的一种文本生成子模型的示意图;
图5是根据本公开一示例性实施例示出的一种文本生成装置的框图;
图6是根据本公开一示例性实施例示出的一种电子设备的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
首先,对本公开的应用场景进行说明。目前,在生成故事时,会预先设定故事中的角色,并根据设定角色的不同来设定相应的心理状态,进而根据该心理状态的程度指定相对应的分数,之后,将多个角色的心理状态分数拼接成心理分数矩阵,将该心理分数矩阵与可训练的心理状态词向量矩阵相乘,得到多个角色的心理状态矩阵,最后,将历史故事信息和该心理状态矩阵输入解码器进行解码,生成的故事语句。
本公开的发明人发现,上述生成故事过程中,只考虑了角色的情感、事实状态(例如自身的客观属性),未考虑角色之间的交互(他人对主人公、主人公对他人之间的相互影响,产生的因果等等)和故事的背景信息(比如科幻背景、现代背景、古代背景),这种情况下生成的故事连贯性较差,从而导致故事的质量较低。
为了克服以上相关技术中存在的技术问题,本公开提供了一种文本生成方法、装置、存储介质及电子设备,在生成文本时,可以结合当前文本中的多个预设角色对应的第一角色特征词、多个预设角色之间的第一角色关系以及当前文本对应的第一文本背景信息和文本情节信息,这样,在生成文本过程中,能够更加全面地融合角色之间的交互,体现角色与文本背景、角色与文本情节之间的关系,使得文本的逻辑性和连贯性更好,从而提高了生成的文本的质量。
下面结合具体实施例对本公开进行说明。
图1是根据本公开一示例性实施例示出的一种文本生成方法的流程图,如图1所示,该方法可以包括:
S101、确定当前文本中的多个预设角色对应的第一角色特征词、以及多个预设角色之间的第一角色关系。
其中,该当前文本可以包括已生成的故事片段对应的文本,示例地,该当前文本可以是预先设置的基础文本,例如,该当前文本可以是“我昨天去公园玩了”,该当前文本也可以包括该基础文本和根据该基础文本生成的文本,例如,该当前文本可以是“我昨天去公园玩了,遇到了我的同学小花”,其中“我昨天去公园玩了”是该基础文本,“遇到了我的同学小花”是根据该从基础文本生成的文本。
该多个预设角色可以是用户预先设置的多个角色。该角色特征词可以包括预先设置的与该预设角色相关的词,和/或,该当前文本中与该预设角色相关的词,其中,相关的词可以包括属性词和动词。示例地,该预先设置的与该预设角色相关的词可以包括该预设角色对应的属性词,例如预设角色的性别、年龄、职业等,该当前文本中与该预设角色相关的词也可以是该预设角色对应的动词,例如,若该当前文本为“我昨天去公园玩了,遇到了我的同学小花”,则该角色特征词可以包括“去”、“遇到”。
需要说明的是,上述对该角色特征词的解释只是举例说明,该角色特征词也可以是其它预先设置的与该预设角色相关的词,以及该当前文本中与该预设角色相关的词,本公开对此不作限定。
在本步骤中,在获取该当前文本后,可以通过现有技术的方法提取该当前文本中的多个预设角色对应的第一角色特征词、以及多个预设角色之间的第一角色关系,此处不再赘述。其中,针对每个预设角色,该第一角色关系可以包括该预设角色与其它预设角色中每个预设角色之间的关系。
示例地,可以通过角色矩阵表示该角色特征词,针对每个预设角色,该预设角色对应的角色特征词可以是一个1*d维的向量,d为该预设角色对应的角色特征词的数量,该多个第一角色特征词对应的第一角色矩阵可以是一个N*d维的矩阵,N为该预设角色的数量。另外,可以通过邻接矩阵表示该角色关系,例如,Xij表示预设角色i与预设角色j之间的关系,Xij的维度为N*N,若预设角色i与预设角色j之间有关系,则Xij的取值为1,若预设角色i与预设角色j之间没有关系,则Xij的取值为0。需要说明的是,由于多个预设角色之间的关系可以包括多种,例如家人关系、朋友关系、同学关系等,因此,最终得到的邻接矩阵可以是一个矩阵集合,集合中的每个邻接矩阵对应一种类型的关系。
S102、确定该当前文本对应的第一文本背景信息和文本情节信息。
其中,该文本背景信息可以包括文本的背景、时间线、历史线等,该文本情节信息可以包括文本情节的发展走向与趋势、文本氛围等信息,用于指导下一刻的文本生成,相当于下一时刻的文本大纲。
在另一种可能的实现方式中,也可以通过相关技术中已有的语义分析方法,获取该当前文本对应的第一文本背景信息和文本情节信息。
S103、根据该第一角色特征词、该第一角色关系、该第一文本背景信息以及该文本情节信息,生成该当前文本的下一文本。
在本步骤中,在获取该第一角色特征词、该第一角色关系、该第一文本背景信息以及该文本情节信息后,可以将该第一角色特征词、该第一角色关系、该第一文本背景信息以及该文本情节信息输入预先训练的文本生成模型,得到该当前文本的下一文本。其中,该文本生成模型可以是通过相关技术中已有的模型训练方法训练得到的模型,此处不再赘述。
S104、根据该当前文本和该下一文本,生成目标文本。
在本步骤中,在得到该当前文本的下一文本后,可以确定拼接文本对应的文本信息,该拼接文本包括该当前文本和该下一文本拼接后的文本,在该文本信息满足预设文本生成终止条件的情况下,将该拼接文本作为该目标文本;在该文本信息不满足该预设文本生成终止条件的情况下,用该拼接文本替换该当前文本,并根据该拼接文本重新执行确定该拼接文本中的多个预设角色对应的第一角色特征词、以及多个该预设角色之间的第一角色关系的步骤,至根据该拼接文本和该下一文本,生成目标文本的步骤。
采用上述方法,在生成文本时,可以结合当前文本中的多个预设角色对应的第一角色特征词、多个预设角色之间的第一角色关系以及当前文本对应的第一文本背景信息和文本情节信息,这样,在生成文本过程中,能够更加全面地融合角色之间的交互,体现角色与文本背景、角色与文本情节之间的关系,使得文本的逻辑性和连贯性更好,从而提高了生成的文本的质量。
图2是根据本公开一示例性实施例示出的另一种文本生成方法的流程图,如图2所示,该方法可以包括:
S201、确定当前文本中的多个预设角色对应的第一角色特征词、以及多个预设角色之间的第一角色关系。
其中,该当前文本可以包括已生成的故事片段对应的文本,示例地,该当前文本可以是预先设置的基础文本,例如,该当前文本可以是“我昨天去公园玩了”,该当前文本也可以包括该基础文本和根据该基础文本生成的文本,例如,该当前文本可以是“我昨天去公园玩了,遇到了我的同学小花”,其中“我昨天去公园玩了”是该基础文本,“遇到了我的同学小花”是根据该从基础文本生成的文本。
该多个预设角色可以是用户预先设置的多个文本角色。该角色特征词可以包括预先设置的与该预设角色相关的词,以及该当前文本中与该预设角色相关的词,其中,相关的词可以包括属性词和动词。示例地,该预先设置的与该预设角色相关的词可以包括该预设角色对应的属性词,例如预设角色的性别、年龄、职业等,该当前文本中与该预设角色相关的词也可以是该预设角色对应的动词,例如,若该当前文本为“我昨天去公园玩了,遇到了我的同学小花”,则该角色特征词可以包括“去”、“遇到”。
需要说明的是,上述对该角色特征词的解释只是举例说明,该角色特征词也可以是其它预先设置的与该预设角色相关的词,以及该当前文本中与该预设角色相关的词,本公开对此不作限定。
S202、确定第一文本对应的第二文本背景信息。
其中,该第一文本包括该当前文本中除第二文本之外的文本,该第二文本可以是该当前文本中最后一次生成的文本。
S203、将该第二文本和该第二文本背景信息输入预先训练的背景获取模型,得到该第一文本背景信息。
S204、将该第一文本背景信息输入预先训练的情节获取模型,得到该文本情节信息。
S205、将该第一角色特征词、该第一角色关系、该第一文本背景信息以及该文本情节信息输入预先训练的文本生成模型,得到该当前文本的下一文本。
其中,该文本生成模型可以包括角色信息获取子模型和文本生成子模型,该角色信息获取子模型可以是基于GCN(Graph Convolutional Network,图卷积网络)模型和ReLu(Rectified Linear Unit,线性整流函数)模型,通过现有技术的模型训练方法训练得到的模型,该文本生成子模型可以是基于seq2seq模型,通过现有技术的模型训练方法训练得到的模型。
图3是根据本公开一示例性实施例示出的一种角色信息获取子模型的示意图,如图3所示,该角色信息获取子模型的输入为Xt、Ct以及St,输出为Ht,Xt为该第一角色关系,Ct为该第一角色特征词,St为该第一文本背景信息,Ht为该角色信息,该角色信息获取子模型包括多个GCN模型和多个ReLu模型。
图4是根据本公开一示例性实施例示出的一种文本生成子模型的示意图,如图4所示,该文本生成子模型的输入为Ht、St以及plant,输出为Yt+1,plant为该文本情节信息,Yt+1为该当前文本的下一文本。
在本步骤中,可以将该第一角色特征词、该第一角色关系以及该第一文本背景信息输入该角色信息获取子模型,得到角色信息,并将该角色信息、该第一文本背景信息以及该文本情节信息输入该文本生成子模型,得到该当前文本的下一文本。示例地,可以将Xt、Ct以及St输入该角色信息获取子模型,得到Ht,之后,再将Ht、St以及plant输入该文本生成子模型,得到当前文本的下一文本Yt+1。
S206、确定拼接文本对应的文本信息。
其中,该拼接文本包括该当前文本和该下一文本拼接后的文本。
S207、确定该文本信息是否满足预设文本生成终止条件,在该文本信息满足预设文本生成终止条件的情况下,执行步骤S208,在该文本信息不满足预设文本生成终止条件的情况下,执行步骤S209~步骤S210。
其中,该文本信息可以包括生成文本的时长和文本语句数量,生成文本的时长可以从生成基础文本的下一文本时开始计时,示例地,该当前文本的下一文本即为一个文本语句。该所述预设文本生成终止条件包括:该时长大于或等于预设时长阈值;和/或,该文本语句数量大于或等于预设数量阈值。
S208、将该拼接文本作为该目标文本。
在本步骤中,在该文本信息满足预设文本生成终止条件的情况下,表示该拼接文本已经满足了用户的需求,停止生成新的文本,并将该拼接文本作为该目标文本。
S209、用该拼接文本替换该当前文本。
在本步骤中,在该文本信息不满足预设文本生成终止条件的情况下,表示该拼接文本不满足了用户的需求,可继续生成新的文本,继而用该拼接文本替换该当前文本。
S210、根据该拼接文本重新执行确定该拼接文本中的多个预设角色对应的第一角色特征词、以及多个该预设角色之间的第一角色关系的步骤,至根据该拼接文本和该下一文本,生成目标文本的步骤。
在本步骤中,在用该拼接文本替换该当前文本后,可以参照上述步骤S201~步骤S207的方法,生成目标文本,此处不再赘述。
采用上述方法,可以将第一文本对应的第二文本背景信息、当前文本中的多个预设角色对应的第一角色特征词、多个预设角色之间的第一角色关系以及当前文本对应的文本情节信息结合,生成该当前文本的下一文本,这样,在生成文本过程中,能够更加全面地融合角色之间的交互,体现角色与文本背景、角色与文本情节之间的关系,使得文本的逻辑性和连贯性更好,从而提高了生成的文本的质量。
图5是根据本公开一示例性实施例示出的一种文本生成装置的框图,如图5所示,该装置可以包括:
特征词确定模块501,被配置为确定当前文本中的多个预设角色对应的第一角色特征词、以及多个预设角色之间的第一角色关系,该当前文本包括已生成的故事片段对应的文本;
信息确定模块502,被配置为确定该当前文本对应的第一文本背景信息和文本情节信息;
第一文本生成模块503,被配置为根据该第一角色特征词、该第一角色关系、该第一文本背景信息以及该文本情节信息,生成该当前文本的下一文本;
第二文本生成模块504,被配置为根据该当前文本和该下一文本,生成目标文本。
在一些实施例中,该第二文本生成模块504,还被配置为:
确定拼接文本对应的文本信息,该拼接文本包括该当前文本和该下一文本拼接后的文本;
在该文本信息满足预设文本生成终止条件的情况下,将该拼接文本作为该目标文本。
在一些实施例中,该第二文本生成模块504,还被配置为:
在该文本信息不满足该预设文本生成终止条件的情况下,将该拼接文本作为新的当前文本,并根据新的当前文本重新执行获取当前文本中的多个预设角色对应的第一角色特征词、以及多个该预设角色之间的第一角色关系的步骤,至根据该当前文本和该下一文本,生成目标文本的步骤。
在一些实施例中,该文本信息包括生成文本的时长和文本语句数量;该预设文本生成终止条件包括:
该时长大于或等于预设时长阈值;和/或,
该文本语句数量大于或等于预设数量阈值。
在一些实施例中,该信息确定模块502,还被配置为:
确定第一文本对应的第二文本背景信息,该第一文本包括该当前文本中除第二文本之外的文本,该第二文本为该当前文本中最后一次生成的文本;
将该第二文本和该第二文本背景信息输入预先训练的背景获取模型,得到该第一文本背景信息;
将该第一文本背景信息输入预先训练的情节获取模型,得到该文本情节信息。
在一些实施例中,该文本生成模块503,还被配置为:
将该第一角色特征词、该第一角色关系、该第一文本背景信息以及该文本情节信息输入预先训练的文本生成模型,得到该当前文本的下一文本。
在一些实施例中,该文本生成模型包括角色信息获取子模型和文本生成子模型;该文本生成模块503,还被配置为:
将该第一角色特征词、该第一角色关系以及该第一文本背景信息输入该角色信息获取子模型,得到角色信息;
将该角色信息、该第一文本背景信息以及该文本情节信息输入该文本生成子模型,得到该当前文本的下一文本。
在一些实施例中,该角色特征词包括预先设置的与该预设角色相关的词,和/或,该当前文本中与该预设角色相关的词。
通过上述装置,在生成目标文本时,可以结合当前文本中的多个预设角色对应的第一角色特征词、多个预设角色之间的第一角色关系以及当前文本对应的第一文本背景信息和文本情节信息,这样,在生成文本过程中,能够更加全面地融合角色之间的交互,体现角色与文本背景、角色与文本情节之间的关系,使得文本的逻辑性和连贯性更好,从而提高了生成的文本的质量。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
本公开还提供一种计算机可读存储介质,其上存储有计算机程序指令,该程序指令被处理器执行时实现本公开提供的文本生成方法的步骤。
图6是根据本公开一示例性实施例示出的一种电子设备600的框图。例如,电子设备600可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图6,电子设备600可以包括以下一个或多个组件:处理组件602,存储器604,电力组件606,多媒体组件608,音频组件610,输入/输出(I/O)的接口612,传感器组件614,以及通信组件616。
处理组件602通常控制电子设备600的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件602可以包括一个或多个处理器620来执行指令,以完成上述的文本生成方法的全部或部分步骤。此外,处理组件602可以包括一个或多个模块,便于处理组件602和其他组件之间的交互。例如,处理组件602可以包括多媒体模块,以方便多媒体组件608和处理组件602之间的交互。
存储器604被配置为存储各种类型的数据以支持在电子设备600的操作。这些数据的示例包括用于在电子设备600上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器604可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电力组件606为电子设备600的各种组件提供电力。电力组件606可以包括电源管理***,一个或多个电源,及其他与为电子设备600生成、管理和分配电力相关联的组件。
多媒体组件608包括在所述电子设备600和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件608包括一个前置摄像头和/或后置摄像头。当电子设备600处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜***或具有焦距和光学变焦能力。
音频组件610被配置为输出和/或输入音频信号。例如,音频组件610包括一个麦克风(MIC),当电子设备600处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器604或经由通信组件616发送。在一些实施例中,音频组件610还包括一个扬声器,用于输出音频信号。
I/O接口612为处理组件602和***接口模块之间提供接口,上述***接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件614包括一个或多个传感器,用于为电子设备600提供各个方面的状态评估。例如,传感器组件614可以检测到电子设备600的打开/关闭状态,组件的相对定位,例如所述组件为电子设备600的显示器和小键盘,传感器组件614还可以检测电子设备600或电子设备600一个组件的位置改变,用户与电子设备600接触的存在或不存在,电子设备600方位或加速/减速和电子设备600的温度变化。传感器组件614可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件614还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件614还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件616被配置为便于电子设备600和其他设备之间有线或无线方式的通信。电子设备600可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件616经由广播信道接收来自外部广播管理***的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件616还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,电子设备600可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述文本生成方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器604,上述指令可由电子设备600的处理器620执行以完成上述文本生成方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
在另一示例性实施例中,还提供一种计算机程序产品,该计算机程序产品包含能够由可编程的装置执行的计算机程序,该计算机程序具有当由该可编程的装置执行时用于执行上述的文本生成方法的代码部分。
本领域技术人员在考虑说明书及实践本公开后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
Claims (11)
1.一种文本生成方法,其特征在于,包括:
确定当前文本中的多个预设角色对应的第一角色特征词、以及多个所述预设角色之间的第一角色关系,所述当前文本包括已生成的故事片段对应的文本;
确定所述当前文本对应的第一文本背景信息和文本情节信息;
根据所述第一角色特征词、所述第一角色关系、所述第一文本背景信息以及所述文本情节信息,生成所述当前文本的下一文本;
根据所述当前文本和所述下一文本,生成目标文本。
2.根据权利要求1所述的方法,其特征在于,所述根据所述当前文本和所述下一文本,生成目标文本包括:
确定拼接文本对应的文本信息,所述拼接文本包括所述当前文本和所述下一文本拼接后的文本;
在所述文本信息满足预设文本生成终止条件的情况下,将所述拼接文本作为所述目标文本。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
在所述文本信息不满足所述预设文本生成终止条件的情况下,用所述拼接文本替换所述当前文本,并根据所述拼接文本重新执行确定所述拼接文本中的多个预设角色对应的第一角色特征词、以及多个所述预设角色之间的第一角色关系的步骤,至根据所述拼接文本和所述下一文本,生成目标文本的步骤。
4.根据权利要求2所述的方法,其特征在于,所述文本信息包括生成文本的时长和文本语句数量;所述预设文本生成终止条件包括:
所述时长大于或等于预设时长阈值;和/或,
所述文本语句数量大于或等于预设数量阈值。
5.根据权利要求1所述的方法,其特征在于,所述确定所述当前文本对应的第一文本背景信息和文本情节信息包括:
确定第一文本对应的第二文本背景信息,所述第一文本包括所述当前文本中除第二文本之外的文本,所述第二文本为所述当前文本中最后一次生成的文本;
将所述第二文本和所述第二文本背景信息输入预先训练的背景获取模型,得到所述第一文本背景信息;
将所述第一文本背景信息输入预先训练的情节获取模型,得到所述文本情节信息。
6.根据权利要求1所述的方法,其特征在于,所述根据所述第一角色特征词、所述第一角色关系、所述第一文本背景信息以及所述文本情节信息,生成所述当前文本的下一文本包括:
将所述第一角色特征词、所述第一角色关系、所述第一文本背景信息以及所述文本情节信息输入预先训练的文本生成模型,得到所述当前文本的下一文本。
7.根据权利要求6所述的方法,其特征在于,所述文本生成模型包括角色信息获取子模型和文本生成子模型;所述将所述第一角色特征词、所述第一角色关系、所述第一文本背景信息以及所述文本情节信息输入预先训练的文本生成模型,得到所述当前文本的下一文本包括:
将所述第一角色特征词、所述第一角色关系以及所述第一文本背景信息输入所述角色信息获取子模型,得到角色信息;
将所述角色信息、所述第一文本背景信息以及所述文本情节信息输入所述文本生成子模型,得到所述当前文本的下一文本。
8.根据权利要求1-7任一项所述的方法,其特征在于,所述角色特征词包括预先设置的与所述预设角色相关的词,和/或,所述当前文本中与所述预设角色相关的词。
9.一种文本生成装置,其特征在于,包括:
特征词确定模块,被配置为确定当前文本中的多个预设角色对应的第一角色特征词、以及多个所述预设角色之间的第一角色关系,所述当前文本包括已生成的故事片段对应的文本;
信息确定模块,被配置为确定所述当前文本对应的第一文本背景信息和文本情节信息;
第一文本生成模块,被配置为根据所述第一角色特征词、所述第一角色关系、所述第一文本背景信息以及所述文本情节信息,生成所述当前文本的下一文本;
第二文本生成模块,被配置为根据所述当前文本和所述下一文本,生成目标文本。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-8中任一项所述方法的步骤。
11.一种电子设备,其特征在于,包括:
存储器,其上存储有计算机程序;
处理器,用于执行所述存储器中的所述计算机程序,以实现权利要求1-8中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110825851.XA CN113420553A (zh) | 2021-07-21 | 2021-07-21 | 文本生成方法、装置、存储介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110825851.XA CN113420553A (zh) | 2021-07-21 | 2021-07-21 | 文本生成方法、装置、存储介质及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113420553A true CN113420553A (zh) | 2021-09-21 |
Family
ID=77717989
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110825851.XA Pending CN113420553A (zh) | 2021-07-21 | 2021-07-21 | 文本生成方法、装置、存储介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113420553A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117033934A (zh) * | 2023-08-02 | 2023-11-10 | 中信联合云科技有限责任公司 | 一种基于人工智能的内容生成方法及装置 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160225187A1 (en) * | 2014-11-18 | 2016-08-04 | Hallmark Cards, Incorporated | Immersive story creation |
US20170139955A1 (en) * | 2015-11-16 | 2017-05-18 | Adobe Systems Incorporated | Converting a text sentence to a series of images |
KR20170137972A (ko) * | 2016-06-03 | 2017-12-14 | 조선대학교산학협력단 | 스토리텔링 저작지원 장치 및 그 방법 |
CN108986785A (zh) * | 2018-08-08 | 2018-12-11 | 科大讯飞股份有限公司 | 一种文本改编方法及装置 |
CN109408786A (zh) * | 2018-09-27 | 2019-03-01 | 武汉旖旎科技有限公司 | 智能小说辅助创作*** |
CN109948159A (zh) * | 2019-03-15 | 2019-06-28 | 合肥讯飞数码科技有限公司 | 一种文本数据生成方法、装置、设备及可读存储介质 |
KR20190094314A (ko) * | 2019-05-21 | 2019-08-13 | 엘지전자 주식회사 | 콘텐츠 기반의 스타일을 갖는 텍스트 또는 음성을 생성하는 인공 지능 장치 및 그 방법 |
CN110209803A (zh) * | 2019-06-18 | 2019-09-06 | 腾讯科技(深圳)有限公司 | 故事生成方法、装置、计算机设备及存储介质 |
CN110782900A (zh) * | 2018-07-12 | 2020-02-11 | 迪斯尼企业公司 | 协作ai讲故事 |
CN111742560A (zh) * | 2017-09-29 | 2020-10-02 | 华纳兄弟娱乐公司 | 响应于用户情绪状态的影视内容的制作和控制 |
WO2020258948A1 (zh) * | 2019-06-24 | 2020-12-30 | 北京大米科技有限公司 | 文本生成方法、装置、存储介质和电子设备 |
CN112685534A (zh) * | 2020-12-23 | 2021-04-20 | 上海掌门科技有限公司 | 在创作过程中生成已创作内容的脉络信息的方法与设备 |
-
2021
- 2021-07-21 CN CN202110825851.XA patent/CN113420553A/zh active Pending
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160225187A1 (en) * | 2014-11-18 | 2016-08-04 | Hallmark Cards, Incorporated | Immersive story creation |
US20170139955A1 (en) * | 2015-11-16 | 2017-05-18 | Adobe Systems Incorporated | Converting a text sentence to a series of images |
KR20170137972A (ko) * | 2016-06-03 | 2017-12-14 | 조선대학교산학협력단 | 스토리텔링 저작지원 장치 및 그 방법 |
CN111742560A (zh) * | 2017-09-29 | 2020-10-02 | 华纳兄弟娱乐公司 | 响应于用户情绪状态的影视内容的制作和控制 |
CN110782900A (zh) * | 2018-07-12 | 2020-02-11 | 迪斯尼企业公司 | 协作ai讲故事 |
CN108986785A (zh) * | 2018-08-08 | 2018-12-11 | 科大讯飞股份有限公司 | 一种文本改编方法及装置 |
CN109408786A (zh) * | 2018-09-27 | 2019-03-01 | 武汉旖旎科技有限公司 | 智能小说辅助创作*** |
CN109948159A (zh) * | 2019-03-15 | 2019-06-28 | 合肥讯飞数码科技有限公司 | 一种文本数据生成方法、装置、设备及可读存储介质 |
KR20190094314A (ko) * | 2019-05-21 | 2019-08-13 | 엘지전자 주식회사 | 콘텐츠 기반의 스타일을 갖는 텍스트 또는 음성을 생성하는 인공 지능 장치 및 그 방법 |
CN110209803A (zh) * | 2019-06-18 | 2019-09-06 | 腾讯科技(深圳)有限公司 | 故事生成方法、装置、计算机设备及存储介质 |
WO2020258948A1 (zh) * | 2019-06-24 | 2020-12-30 | 北京大米科技有限公司 | 文本生成方法、装置、存储介质和电子设备 |
CN112685534A (zh) * | 2020-12-23 | 2021-04-20 | 上海掌门科技有限公司 | 在创作过程中生成已创作内容的脉络信息的方法与设备 |
Non-Patent Citations (3)
Title |
---|
MIRELLA LAPATA: "Neil McIntyre:Plot Induction and Evolutionary Search for Story Generation", 《PROCEEDINGS OF THE 48TH ANNUAL MEETING OF THE ASSOCIATION FOR COMPUTATIONAL LINGUISTICS》, 31 December 2010 (2010-12-31) * |
王丹力;詹志征;戴国忠;: "儿童交互式智能讲故事***", 计算机辅助设计与图形学学报, no. 07, 15 July 2011 (2011-07-15) * |
谭红叶: "迈向创造性语言生成:汉语幽默自动生成的探索", 《中国科学:信息科学》, 21 November 2018 (2018-11-21) * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117033934A (zh) * | 2023-08-02 | 2023-11-10 | 中信联合云科技有限责任公司 | 一种基于人工智能的内容生成方法及装置 |
CN117033934B (zh) * | 2023-08-02 | 2024-04-19 | 中信联合云科技有限责任公司 | 一种基于人工智能的内容生成方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107133354B (zh) | 图像描述信息的获取方法及装置 | |
CN111831806B (zh) | 语义完整性确定方法、装置、电子设备和存储介质 | |
CN107564526B (zh) | 处理方法、装置和机器可读介质 | |
CN107341509B (zh) | 卷积神经网络的训练方法、装置及可读存储介质 | |
CN111696538B (zh) | 语音处理方法、装置和介质 | |
EP3734472A1 (en) | Method and device for text processing | |
US11335348B2 (en) | Input method, device, apparatus, and storage medium | |
CN111898018B (zh) | 一种虚拟资源的发送方法、装置、电子设备及存储介质 | |
CN109685041B (zh) | 图像分析方法及装置、电子设备和存储介质 | |
CN110764627A (zh) | 一种输入方法、装置和电子设备 | |
CN115273831A (zh) | 语音转换模型训练方法、语音转换方法和装置 | |
CN111797262A (zh) | 诗词生成方法、装置、电子设备和存储介质 | |
CN112445906A (zh) | 一种生成回复消息的方法及装置 | |
CN109977424B (zh) | 一种机器翻译模型的训练方法及装置 | |
CN113920293A (zh) | 信息识别方法、装置、电子设备及存储介质 | |
CN113920559A (zh) | 一种虚拟角色的面部表情、肢体动作的生成方法和装置 | |
CN113420553A (zh) | 文本生成方法、装置、存储介质及电子设备 | |
CN113923517B (zh) | 一种背景音乐生成方法、装置及电子设备 | |
CN114356068B (zh) | 一种数据处理方法、装置和电子设备 | |
CN113901832A (zh) | 人机对话方法、装置、存储介质及电子设备 | |
CN114462410A (zh) | 实体识别方法、装置、终端及存储介质 | |
CN114550691A (zh) | 一种多音字消歧方法、装置、电子设备及可读存储介质 | |
CN113254611A (zh) | 提问推荐方法及装置、电子设备及存储介质 | |
CN113674731A (zh) | 语音合成处理方法、装置和介质 | |
CN114818675A (zh) | 一种诗词生成方法、装置和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |