CN114416921A - 剧情文本生成的方法、装置、终端和存储介质 - Google Patents

剧情文本生成的方法、装置、终端和存储介质 Download PDF

Info

Publication number
CN114416921A
CN114416921A CN202210050963.7A CN202210050963A CN114416921A CN 114416921 A CN114416921 A CN 114416921A CN 202210050963 A CN202210050963 A CN 202210050963A CN 114416921 A CN114416921 A CN 114416921A
Authority
CN
China
Prior art keywords
scenario
text
candidate result
word
words
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210050963.7A
Other languages
English (en)
Inventor
张林箭
王佳安
邹北琪
张聪
汪硕芃
宋有伟
范长杰
胡志鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Netease Hangzhou Network Co Ltd
Original Assignee
Netease Hangzhou Network Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Netease Hangzhou Network Co Ltd filed Critical Netease Hangzhou Network Co Ltd
Priority to CN202210050963.7A priority Critical patent/CN114416921A/zh
Publication of CN114416921A publication Critical patent/CN114416921A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3334Selection or weighting of terms from queries, including natural language queries
    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63FCARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
    • A63F13/00Video games, i.e. games using an electronically generated display having two or more dimensions
    • A63F13/45Controlling the progress of the video game
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3346Query execution using probabilistic model

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Artificial Intelligence (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例公开了剧情文本生成的方法、装置、终端和存储介质;本申请实施例的获取剧情上文,以及用于表征角色属性的离散数值;获取离散数值对应的描述文本,其中,描述文本中包括关键词;确定关键词对应的候选结果词;根据候选结果词、剧情上文以及描述文本生成剧情上文对应的剧情下文。在本申请实施例中,可以灵活生成剧情文本。

Description

剧情文本生成的方法、装置、终端和存储介质
技术领域
本申请涉及计算机领域,具体涉及剧情文本生成的方法、装置、终端和存储介质。
背景技术
在视觉小说游戏中,玩家通过与众多非玩家角色(Non-Person Character,简称NPC)之间进行交互而影响故事剧情的发展,从而推进整个故事线的进行。
游戏剧情由多个上下承接的剧情文本组成,游戏中剧情的发展由玩家执行的任务确定,每个任务可以对接多个不同方向的剧情发展,每个剧情发展对应一个剧情文本。然而,预先设定的剧情文本需要人为设置,增加了制作游戏的难度以及工作量。
发明内容
本申请实施例提供一种剧情文本生成的方法、装置、终端和存储介质,可以灵活生成剧情文本。
本申请实施例提供一种剧情文本生成的方法,包括:
获取剧情上文,以及用于表征角色属性的离散数值;
获取所述离散数值对应的描述文本,其中,描述文本中包括关键词;
确定关键词对应的候选结果词;
根据候选结果词、剧情上文以及描述文本生成剧情上文对应的剧情下文本。
本申请实施例还提供一种剧情文本生成的装置,包括:
第一获取单元,用于获取剧情上文,以及用于表征角色属性的离散数值;
第二获取单元,用于获取所述离散数值对应的描述文本,其中,描述文本中包括关键词;
确定单元,用于确定关键词对应的候选结果词;
剧情文本生成单元,用于根据候选结果词、剧情上文以及描述文本生成剧情上文对应的剧情下文。
在一些实施例中,根据候选结果词、剧情上文以及描述文本生成剧情上文对应的剧情下文,包括:
从候选结果词中筛选出符合预设条件的结果词,作为目标结果词;
根据目标结果词、剧情上文以及描述文本生成剧情上文对应的剧情下文。
在一些实施例中,从候选结果词中筛选出满足预设条件的结果词,包括:
针对候选结果词中每一结果词,确定剧情上文和结果词之间存在蕴含关系的概率;
预设条件包括:剧情上文和结果词之间存在蕴含关系的概率大于预设阈值。
在一些实施例中,确定剧情上文和结果词之间存在蕴含关系的概率,包括:
分别提取剧情上文对应的词向量和结果词的对应的词向量;
对剧情上文对应的词向量和结果词对应的词向量进行相似度计算,得到剧情上文与结果词之间的相似度;
根据相似度,确定剧情上文和结果词之间存在蕴含关系的概率。
在一些实施例中,根据候选结果词、剧情上文以及描述文本生成剧情上文对应的剧情下文,包括:
根据每个候选结果词以及每个候选结果词对应的概率,获得关键词的额外信息,概率是指剧情上文和候选结果词之间存在蕴含关系的概率;
将关键词更新为额外信息;
确定更新后的所述关键词对应的候选结果词;
根据所述候选结果词、所述剧情上文以及所述描述文本生成剧情上文对应的剧情下文。
在一些实施例中,根据每个候选结果词以及每个候选结果词对应的概率,获得关键词的额外信息,包括:
将每个候选结果词对应的概率作为对应的候选结果词的权重,对每个候选结果词乘以对应的权重后进行求和,获得的求和结果作为关键词的额外信息。
在一些实施例中,获取剧情上文,以及用于表征角色属性的离散数值,包括:
获取输入文本;
从输入文本中提取第一预设字段中的文本内容,作为剧情上文;
从输入文本中提取第二预设字段中的文本内容,作为用于表征角色属性的离散数值。
在一些实施例中,以第三预设字段对候选结果词进行标记。
本申请实施例还提供一种终端,包括存储器存储有多条指令;所述处理器从所述存储器中加载指令,以执行本申请实施例所提供的任一种故事下文生成的方法中的步骤。
本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有多条指令,所述指令适于处理器进行加载,以执行本申请实施例所提供的任一种故事下文生成的方法中的步骤。
本申请实施例可以获取剧情上文,以及用于表征角色属性的离散数值;获取所述离散数值对应的描述文本,其中,描述文本中包括关键词;确定关键词对应的候选结果词;根据候选结果词、剧情上文以及描述文本生成剧情上文对应的剧情下文。
在本申请中,依据剧情上文以及表征角色属性的离散数值生成剧情上文对应的剧情下文,如此,可以使本方案无需在游戏中预先设定剧情文本,故可以减少游戏公司对剧情文本的制作,同时,还可以根据表征角色属性的离散数值来灵活生成剧情文本。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1a是现有的剧情文本的选择示意图。
图1b是本申请实施例提供的剧情文本生成的方法在实际应用过程中的流程示意图;
图1c是本申请实施例提供的剧情文本生成的方法的流程示意图;
图2a是本申请实施例提供的剧情文本生成的方法应用在视觉小说游戏中的示意图;
图2b是本申请实施例提供的剧情文本生成的方法的生成示意图。
图3是本申请实施例提供的剧情文本生成的装置的第一种结构示意图;
图4是本申请实施例提供的电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提供剧情文本生成的方法、装置、终端和存储介质。
其中,该剧情文本生成装置具体可以集成在电子设备中,该电子设备可以为终端、服务器等设备。其中,终端可以为手机、平板电脑、智能蓝牙设备、笔记本电脑、或者个人电脑(Personal Computer,PC)等设备;服务器可以是单一服务器,也可以是由多个服务器组成的服务器集群。
在一些实施例中,该剧情文本生成装置还可以集成在多个电子设备中,比如,剧情文本生成装置可以集成在多个服务器中,由多个服务器来实现本申请的故事下文生成方法。
在一些实施例中,服务器也可以以终端的形式来实现。
参见图1a,目前的剧情下文是通过玩家在剧情上文中执行任务得到下文,具体是从剧情上文对应的多个剧情文本中选取与所执行任务对应的剧情文本作为剧情下文。如剧情发展中出现A和B两种选项,选项A和选项B对应两个不同的剧情发展,若玩家选择A,则剧情下文为A对应的剧情文本,而剧情A对应的剧情文本在剧情发展中会出现a`和a``两种选项,a`和a``对应两个不同的剧情文本,玩家选择B,则剧情下文为B对应的剧情文本,而剧情A对应的剧情文本在剧情发展中会出现b`和b``两种选项,b`和b``对应两个不同的剧情文本,而A、B、a`、a``、b`以及b``对应的剧情文本需要人为制作和输入。
由于目前通过上述方式获取的剧情文本需要使游戏制作公司制作剧情文本,增加了游戏制作公司的工作量,因此,本申请实施例提出获取剧情上文,以及用于表征角色属性的离散数值;获取离散数值对应的描述文本,其中,描述文本中包括关键词;确定关键词对应的候选结果词;根据候选结果词、剧情上文以及描述文本生成剧情上文对应的剧情下文。
然后,参考图1b,获取离散数值对应的描述文本,例如,若离散数值是喜爱度等于0,则对应的描述文本可以是NPC讨厌这位玩家。对描述文本中的关键词进行识别,其中,关键词可以是讨厌。得到讨厌对应的候选结果词,候选结果词可以是生气、结束和击杀,经过筛选后得到生气、结束两个关键词等。然后根据生气、结束、剧情上文以及NPC讨厌这位玩家来灵活的生成剧情上文对应的剧情下文。
以下分别进行详细说明。需说明的是,以下实施例的序号不作为对实施例优选顺序的限定。
在本实施例中,提供了一种剧情文本生成的方法,如图1c所示,该剧情文本生成的方法的具体流程可以如下:
110、获取剧情上文,以及用于表征角色属性的离散数值。
其中,剧情上文可以是在剧情下文之前的故事文本。例如,剧情上文可以是游戏剧情结尾的前一剧情文本,还可以是游戏中已播放的剧情文本。
其中,玩家角色可以是游戏中由玩家控制的角色。
其中,非玩家角色(Non-Player Character,简称NPC)可以是游戏中不受真人玩家操纵的游戏角色。
其中,角色属性可以用于描述游戏中的角色,比如,可以描述游戏中的NPC,还可以描述游戏中的玩家角色,还可以玩家角色与NPC之间的交互。
其中,离散数值为用数值的方式描述游戏中的角色所对应的属性。比如,离散数值可以描述玩家与NPC之间的亲密度,还可以描述玩家与NPC之间的聊天交互时长,还可以描述玩家与NPC之间的聊天情感分布,也可以是NPC自身的当前力量数值、敏捷数值、金钱数值,等等。
比如,离散数值描述玩家与NPC之间的喜爱度当喜爱度为0,表示NPC不喜欢玩家角色,当喜爱度可以是5时,表示NPC喜爱玩家角色。离散数值具体可以表示玩家与NPC之间的交互,该交互具体可以是正面交互、对立交互和中立交互。例如,离散数值可以描述NPC对玩家角色的亲爱度、喜爱度、欣赏度、忠诚度、背叛度、仇视度,等等。
例如,玩家角色执行的某个任务,导致NPC对玩家角色的喜爱度降低,以致于剧情上文中包含玩家角色弄哭NPC。
在一些实施例中,考虑到从输入文本中得到生成剧情下文的信息,获取剧情上文,以及用于表征角色属性的离散数值,包括:
获取输入文本;
从输入文本中提取第一预设字段中的文本内容,作为剧情上文;
从输入文本中提取第二预设字段中的文本内容,作为用于表征角色属性的离散数值。
其中,输入文本可以是输入到剧情生成模型中的文本,比如,输入文本可以是在当前之前所有已经播出过的剧情文本以及当前的离散数值。
其中,第一预设字段可以用于从输入文本中定位出所需要的剧情上文,比如,第一预设字段可以从所有已经播出过的剧情文本中定位出剧情下文的上一节点的剧情文本。
其中,第二预设字段可以从输入文本中定位出所需要的数据,比如,从输入文本中存在多个数值,需要从多个数值中确定出表征角色属性的离散数值。
120、获取离散数值对应的描述文本,其中,描述文本中包括关键词。
其中,描述文本可以是描述游戏中当前离散数值所对应的文本。
离散数值用于量化游戏中的角色在当前所对应的属性。
其中,离散数值和描述文本存在映射关系,离散数值在映射到描述文本上时,可以是一个数,或者是一个数字区间。还可以是角色当前的属性和描述文本之间存在映射关系。例如,离散数值用于表示NPC对玩家角色的喜爱度时,离散数值和描述文本之间的映射关系可以是[0,NPC]讨厌这位玩家,[1,NPC]对这位玩家无感,[2,NPC]与这位玩家是普通朋友,[3,NPC]喜欢这位玩家。还可以是[0,20]-仇视关系-NPC讨厌这位玩家,[20,40]-一般关系-NPC对这位玩家无感,[40,60]-普通关系-NPC与这位玩家是普通朋友,[60,100]-普通关系-NPC喜欢这位玩家。
其中,关键词可以是突出描述文本中表述人物属性的词,关键词可以是一个,还可以是多个。例如,离散数值用于表示NPC对玩家角色的喜爱度时,关键词可以是讨厌、无感、普通以及喜欢,等等。
例如,玩家角色执行的某个任务,导致NPC对玩家角色的喜爱度降低,以致于剧情上文中包含玩家角色弄哭NPC。此时需要生成故事下文,获得此时离散数值NPC对玩家角色的喜爱度,查询得到的喜爱度为“0”,根据喜爱度“0”对应的描述文本,得到“NPC讨厌这位玩家”,“讨厌”为其中的关键词。
130、确定关键词对应的候选结果词。
其中,候选结果词可以是和关键词具有有向关系的词。有向关系在ConceptNet知识库中为指向关系。例如,关键词为“讨厌”,从讨厌”出发,箭头指向的词有“生气”、“结束”、“击杀”,等等,而箭头表示关键词和关联词之间的有向关系。
其中,确定关键词对应的候选结果词可以采用语义知识库得到。语义知识库可以是关系型知识构成的知识库,关系型知识为有指向关系的词。例如,语义知识库可以是ConceptNet知识库(一种语义网络,有助于计算机理解人类的意图)或是常识知识库(knowledge base,简称KB)。ConceptNet知识库使用三元组的形式存储人类常识,例如,“<看漫画,Causes,有趣>”三元组表示看漫画会让人们感到有趣。Causes是ConceptNet知识库中预定义的一种有向关系。
例如,关键词可以是讨厌,通过语义知识库,对关键词“讨厌”进行检索,可以得到“<讨厌,Causes,生气>”、“<讨厌,Causes,结束>以及<讨厌,Causes,击杀>等三元组,即生气、结束和击杀是讨厌对应的候选结果词。
在一些实施例中,考虑到便于根据候选结果词来生成剧情上文对应的剧情下文,方法还包括:
以第三预设字段对候选结果词进行标记。
其中,第三预设字段用于标记候选结果词,比如,第三预设字段可以是字符标识,该字符标识可以是罗马数字、字母、单词,等等。
比如,需要依据候选结果词、剧情上文以及描述文本生成剧情上文对应的剧情下文,而为了从候选结果词、剧情上文以及描述文本中精准定位出候选结果词,即可以通过第三预设字段标记候选结果词,使在生成剧情下文需要用到候选结果词时,可以精准提取出候选结果词。
140、根据候选结果词、剧情上文以及描述文本生成剧情上文对应的剧情下文。
其中,剧情下文可以是和剧情上文承接的剧情文本。
剧情下文的生成可以采用无监督自然语言处理模型,具体可以是GPT-2(Generative Pre-trained Transformers2.0)模型,BERT(Bidirectional EncoderRepresentation from Transformers)模型,等等。
在一些实施例中,考虑到候选结果词中有与剧情上文不相关的词,从而影响剧情下文的生成,根据候选结果词、剧情上文以及描述文本生成剧情上文对应的剧情下文,包括:
从候选结果词中筛选出符合预设条件的结果词,作为目标结果词;
根据目标结果词、剧情上文以及描述文本生成剧情上文对应的剧情下文。
其中,预设条件可以用于限制不符合游戏剧情的候选结果词,从而使目标结果词与剧情上文相关。
其中,预设条件根据游戏剧情设定,在此不做特别设定。
例如,预设条件可以是选取候选结果词中剧情上文和结果词之间存在蕴含关系的概率大于0.5的词。当剧情上文和结果词之间存在蕴含关系的概率大于0.5时,则剧情上文和该结果词之间存在蕴含关系。当剧情上文和结果词之间存在蕴含关系的概率小于0.5,但大于0.3时,则剧情上文和该结果词之间存在中立关系。当剧情上文和结果词之间存在蕴含关系的概率小于0.3时,则剧情上文和该结果词之间存在矛盾关系。
其中,蕴含关系是指一对文本之间存在有向推理关系,例如,通过剧情上文的语义可以推理出结果词的语义,则存在蕴含关系。
其中,目标结果词可以是和剧情上文语义所表达的意思相关的词。
例如,剧情上文可以是描述角色之间温馨生活的游戏剧情,而候选结果词有生气、结束和击杀,而候选结果词中存在不符合温馨生活类的词,容易导致剧情不合常理,存在撕裂感,所以对结果词根据预设条件进行筛选,排除不符合剧情上文的击杀,留下生气和结束。
在一些实施例中,为了起到从候选结果词中筛选出符合剧情上文的结果词的效果,从候选结果词中筛选出满足预设条件的结果词,包括:
针对候选结果词中每一结果词,确定剧情上文和结果词之间存在蕴含关系的概率;
预设条件包括:剧情上文和结果词之间存在蕴含关系的概率大于预设阈值。
其中,剧情上文和结果词之间存在蕴含关系的概率可以是指通过剧情上文可以推理出结果词的概率。剧情上文和结果词之间存在蕴含关系可以通过自然语言推理模型中的文本蕴含识别(Recognizing Textual Entailment,简称RTE)得到。
例如,剧情上文为“一只狗在雪地中接飞盘玩”,而结果词为“动物”,狗可以推出动物,则“一只狗在雪地中接飞盘玩”和“动物”之间存在蕴含关系。剧情上文和结果词之间存在蕴含关系的概率可以通过自然语言推理模型(Natural Language Inference,简称NLI)对剧情上文和结果词对应的词向量进行语言推理,输出剧情上文和结果词之间存在蕴含关系的概率,其中,自然语言推理模型判断两个句子或者两个词之间的语义关系。
其中,预设阈值可以用于排除剧情上文和候选结果词之间存在蕴含关系的概率较小的结果词。当剧情上文和结果词之间存在蕴含关系的概率较小时,可能存在剧情上文和结果词之间存在冲突关系或中立关系。例如,剧情上文为“一只狗在雪地中接飞盘玩”,而结果词为“猫”,此时存在冲突关系。中立关系为剧情上文和结果词之间既不蕴含也不冲突。
在一些实施例中,为了起到获取剧情上文和结果词之间存在蕴含关系的概率,确定剧情上文和结果词之间存在蕴含关系的概率,该装置用于:
分别提取剧情上文和结果词的对应的词向量;
对剧情上文对应的词向量和结果词对应的词向量进行相似度计算,得到剧情上文与结果词之间的相似度;
根据相似度,确定剧情上文和结果词之间存在蕴含关系的概率。
其中,相似度用于表征两个向量之间的相似程度。相似度计算可以使用欧几里得距离算法、皮尔逊相关系数算法、余弦相似度算法、Tanimoto系数,等等。
其中,对相似度进行归一化处理,得到剧情上文和结果词之间存在蕴含关系的概率。
在一些实施例中,为了起到可以提升剧情下文与剧情上文的衔接性,使剧情下文的内容不突兀,根据候选结果词、剧情上文以及描述文本生成剧情上文对应的剧情下文,包括:
根据每个候选结果词以及每个候选结果词对应的概率,获得关键词的额外信息,概率是指剧情上文和候选结果词之间存在蕴含关系的概率;
将关键词更新为额外信息;
确定更新后的关键词对应的候选结果词;
根据候选结果词、剧情上文以及描述文本生成剧情上文对应的剧情下文。
其中,额外信息可以表征候选结果词、以及剧情上文和候选结果词之间的蕴含关系。比如,额外信息可以包括候选结果词A、候选结果词B、候选结果词C,还包括候选结果词A与剧情上文之间存在蕴含关系的概率a,候选结果词B与剧情上文之间存在蕴含关系的概率b,以及候选结果词C与剧情上文之间存在蕴含关系的概率c。
其中,更新后的关键词可以是额外信息。比如,关键词是关键词I,由上述例子可知额外信息的内容,更新后的关键词可以是候选结果词A、候选结果词B、候选结果词C,还包括候选结果词A与剧情上文之间存在蕴含关系的概率a,候选结果词B与剧情上文之间存在蕴含关系的概率b,以及候选结果词C与剧情上文之间存在蕴含关系的概率c。
由上可以知,剧情下文生成时,需要候选结果词A、候选结果词B、候选结果词C、候选结果词A与剧情上文之间存在蕴含关系的概率a、候选结果词B与剧情上文之间存在蕴含关系的概率b、候选结果词C与剧情上文之间存在蕴含关系的概率c、剧情上文以及描述文本。
在一些实施例中,为了考虑候选结果词对应的概率会影响剧情下文与剧情上文的衔接性,根据每个候选结果词以及每个候选结果词对应的概率,获得关键词的额外信息,包括:
将每个候选结果词对应的概率作为对应的候选结果词的权重,对每个候选结果词乘以对应的权重后进行求和,获得的求和结果作为关键词的额外信息。
其中,权重可以是表征候选结果词在生成剧情下文时占的比重。比如,候选结果词A对应的概率为概率a,则将该概率a的数值a作为候选结果词A的权重,等等。
比如,候选结果词A与剧情上文之间存在蕴含关系的概率a,则候选结果词A的权重为a,候选结果词B与剧情上文之间存在蕴含关系的概率b,则候选结果词B的权重为b,候选结果词C与剧情上文之间存在蕴含关系的概率c,则候选结果词C的权重为c,关键词的额外信息=关键词A*a+关键词B*b+关键词C*c。
额外信息的计算方法还可以是:
根据每个候选结果词对应的概率,组成概率向量,概率是指剧情上文与候选结果词之间存在的概率;
提取候选结果词的词向量;
将候选结果词对应的词向量置入预设的向量空间中,得到向量空间的空间矩阵;
将概率向量乘以空间矩阵,得到额外信息,额外信息中的元素用于表征候选结果词与关键词的关联度。
其中,概率向量由每个候选结果词对应的概率组成,概率向量中可以是包含一个元素或者是多个元素,概率向量中元素的数量和候选结果词的数量对应。
其中,额外信息可以是一个向量,该向量中的元素可以标准候选结果词与关键词的关联度。
在一些实施例中,对剧情下文进行显示和/或播放。
例如,在视觉小说游戏中,在生成剧情下文后,对剧情下文进行显示,还可以用语音的方式对剧情下文进行播放。
在一些实施例中,确定和剧情下文对应的游戏场景,并对游戏场景进行显示。
例如,在视觉小说游戏中,生成和剧情下文对应的游戏场景,并对该游戏场景进行显示,有利于增加用户的沉浸感。
本申请实施例提供的剧情文本生成方案可以应用在各种文本生成场景中。比如,以视觉小说游戏,具体为视觉小说游戏中每章的结尾剧情文本为例,获取剧情上文,以及用于表征角色属性的离散数值;获取离散数值对应的描述文本,其中,描述文本中包括关键词;确定关键词对应的候选结果词;根据候选结果词、剧情上文以及描述文本生成剧情上文对应的剧情下文。采用本申请实施例提供的方案能够减少设置剧情文本的工作量,同时还可以灵活生成剧情文本。
由上可知,本申请实施例可以灵活生成剧情文本。由此本方案可以提高玩家在游戏中的沉浸感,有利于提高用户的留存率。
根据上述实施例所描述的方法,以下将作进一步详细说明。
本申请实施例提供的剧情文本生成的方案可以应用在各种电子游戏场景中。比如,以视觉小说游戏为例,对本申请实施例的方法进行详细说明。
在本申请实施例提供的剧情文本生成方案中,可以根据剧情上文和表征角色属性的离散数值来灵活生成当前故事文本。参见图2a,该剧情文本生成的方案的具体流程如下:
(一)获取表征角色属性的离散数值。
(二)根据离散数值与描述文本的映射关系,获取离散数值对应的描述文本,描述文本中包括关键词。
在一些实施例中,离散数值具体可以表示玩家与NPC之间的交互,该交互具体可以是正面交互、对立交互和中立交互。
例如,离散数值可以描述NPC对玩家角色的亲爱度、喜爱度、欣赏度、忠诚度、背叛度、仇视度,等等。
例如,离散数值用于表征NPC对玩家的喜爱度,离散数值与描述文本的映射关系具体可以是:
‘0’:‘NPC讨厌这位玩家,其中,讨厌为关键词’;
‘1’:‘NPC对这位玩家无感,其中,无感为关键词’;
‘2’:‘NPC与这位玩家是普通朋友,其中,普通为关键词’;
‘3’:‘NPC喜欢这位玩家,其中,喜欢为关键词’。
(三)采用ConceptNet语义知识库,确定关键词在ConceptNet语义知识库中所对应的候选结果词。
例如,对关键词“讨厌”进行检索时,可以得到“<讨厌,Causes,生气>”以及“<讨厌,Causes,结束>”等三元组,从而得到讨厌所对应的关联词(生气和结束)。
(四)对候选结果词进行筛选,得到满足预设条件的目标结果词。
在一些实施例中,将剧情上文和候选结果词中的每一个结果词输入到自然语言推理模型中,输出三个类别的概率,所述三个类别的概率中包括剧情上文和结果词之间存在蕴含关系的概率;
从所述候选结果词中选出概率大于预设阈值的关联词。
在一些实施例中,按照剧情上文和结果词之间存在蕴含关系的概率,对候选结果词中每一个结果词进行排序。
在一些实施例中,三个类别的概率还包括剧情上文和结果词之间存在冲突关系的概率、剧情上文和结果词之间存在中立关系的概率。
其中,自然语言推理任务所采用的训练数据为开源的数据集OCNLI(OriginalChinese Natural Language Inference),模型可以为roberta-wwm(Robust optimizebert approach-Whole Word Masking,用于预测下一个词的概率)。在具体计算蕴含关系时,我们会将剧情上文和候选关联词通过分隔符拼接,比如“[CLS]东、中、西部地区要加强多种形式的合作,在协调发展中逐步实现共同富裕[SEP]东、中、西部地区发展存在不协调[SEP]”,输入到roberta-wwm中,经过线性层+softmax得到三分类的概率,只看“蕴含关系”这一类的概率值。
(五)参见图2b,将剧情上文、描述文本以及目标结果词输入到剧情生成模型中,生成剧情下文。
在一些实施例中,将剧情上文、描述文本以及目标结果词输入到剧情生成模型中,生成剧情下文,包括:
根据每个目标结果词以及每个目标结果词对应的概率,获得关键词的额外信息,概率是指剧情上文和目标结果词之间存在蕴含关系的概率;
将关键词更新为额外信息;
确定更新后的关键词对应的目标结果词;
根据目标结果词、剧情上文以及描述文本生成剧情下文。
其中,将剧情上文和描述文本输入在Token Embeddings(指令嵌入)中,且剧情上文的开头加上了[CLS],剧情上文和描述文本之间以及描述文本的结尾加入了[SEP],用于表示剧情上文的开始和结束,同时也表示关系描述文本的开始和结束,便于剧情生成模型对剧情上文和关系描述文本进行识别。
其中,Type embedding(类型嵌入)中设定了三个Type(类型)来暗示每个Token的类型,其中有“CTX”代表剧情上文中的Token;“CTL”代表描述文本中非关键词Token,“KEY”代表描述文本中关键词Token。
其中,剧情生成模型(roberta-wwm)加入了Consequence Embeddings(结果嵌入)字段来引入关键词对应的候选结果词。具体地,对于关键词“讨厌”,从ConceptNet语义知识库中检索到的结果词s1,s2,…,sm(例如关联词“生气”、“结束”和“击杀”等是通过关键词“讨厌”在ConceptNet语义知识库中检索得到的),再计算剧情上文与这些结果词之间存在蕴含关系的概率p1,p2,...pm,选出剧情上文与结果词之间存在蕴含关系的概率大于预设阈值的目标结果词,共同产生对于关键词的额外信息:
info=p1*s1+p2*s2+…+pm*sm
其中,info为额外信息,p为剧情上文与这些候选结果词之间存在蕴含关系的概率,S为候选结果词,m用于将P与S配对。
随后info作为关键词对应的Consequence Embeddings中的CON位置。
由上可知,本申请利用表征角色属性的离散数值的描述文本,深入探索了离散数值对生成剧情下文的作用,使用语义知识库,引入了和关键词对应的符合人类认知的候选结果词,对候选结果词进行筛选得到目标结果词使得生成的剧情下文与当前的离散数值相符。依据目标结果词、剧情上文以及描述文本生成剧情上文对应的剧情下文,提升了生成剧情下文的质量。
为了更好地实施以上方法,本申请实施例还提供一种剧情文本生成的装置,该剧情文本生成装置具体可以集成在电子设备中,该电子设备可以为终端、服务器等设备。其中,终端可以为手机、平板电脑、智能蓝牙设备、笔记本电脑、个人电脑等设备;服务器可以是单一服务器,也可以是由多个服务器组成的服务器集群。
比如,在本实施例中,将以剧情文本生成的装置具体集成在一种终端为例,对本申请实施例的方法进行详细说明。
例如,如图3所示,该剧情文本生成的装置可以包括第一获取单元、第二获取单元、确定单元以及剧情文本生成单元,如下:
(一)、第一获取单元310;
第一获取单元310,用于获取剧情上文,以及用于表征角色属性的离散数值。
(二)、第二获取单元320;
第二获取单元320,用于获取离散数值对应的描述文本,其中,描述文本中包括关键词。
(三)、确定单元330;
确定单元330,用于确定关键词对应的候选结果词。
(四)、剧情文本生成单元340;
剧情文本生成单元340,用于根据候选结果词、剧情上文以及描述文本生成剧情上文对应的剧情下文。
在一些实施例中,根据候选结果词、剧情上文以及描述文本生成剧情上文对应的剧情下文,包括:
从候选结果词中筛选出符合预设条件的结果词,作为目标结果词;
根据目标结果词、剧情上文以及描述文本生成剧情上文对应的剧情下文。
在一些实施例中,从候选结果词中筛选出满足预设条件的结果词,包括:
针对候选结果词中每一结果词,确定剧情上文和结果词之间存在蕴含关系的概率;
预设条件包括:剧情上文和结果词之间存在蕴含关系的概率大于预设阈值。
在一些实施例中,确定剧情上文和结果词之间存在蕴含关系的概率,包括:
分别提取剧情上文对应的词向量和结果词的对应的词向量;
对剧情上文对应的词向量和结果词对应的词向量进行相似度计算,得到剧情上文与结果词之间的相似度;
根据相似度,确定剧情上文和结果词之间存在蕴含关系的概率。
在一些实施例中,根据候选结果词、剧情上文以及描述文本生成剧情上文对应的剧情下文,包括:
根据每个候选结果词以及每个候选结果词对应的概率,获得关键词的额外信息,概率是指剧情上文和候选结果词之间存在蕴含关系的概率;
将关键词更新为额外信息;
确定更新后的关键词对应的候选结果词;
根据候选结果词、剧情上文以及描述文本生成剧情上文对应的剧情下文。
在一些实施例中,根据每个候选结果词以及每个候选结果词对应的概率,获得关键词的额外信息,包括:
将每个候选结果词对应的概率作为对应的候选结果词的权重,对每个候选结果词乘以对应的权重后进行求和,获得的求和结果作为关键词的额外信息。
在一些实施例中,获取剧情上文,以及用于表征角色属性的离散数值,包括:
获取输入文本;
从输入文本中提取第一预设字段中的文本内容,作为剧情上文;
从输入文本中提取第二预设字段中的文本内容,作为用于表征角色属性的离散数值。
在一些实施例中,方法还包括:
以第三预设字段对候选结果词进行标记。
具体实施时,以上各个单元可以作为独立的实体来实现,也可以进行任意组合,作为同一或若干个实体来实现,以上各个单元的具体实施可参见前面的方法实施例,在此不再赘述。
由上可知,本实施例的剧情文本生成装置由第一获取单元获取剧情上文,以及用于表征角色属性的离散数值;由第二获取单元获取离散数值对应的描述文本,其中,描述文本中包括关键词;由确定单元确定关键词对应的候选结果词;由剧情文本生成单元根据候选结果词、剧情上文以及描述文本生成剧情上文对应的剧情下文。
由此,本申请实施例可以灵活生成剧情文本。
相应的,本申请实施例还提供一种电子设备,该电子设备可以为终端或服务器,该终端可以为智能手机、平板电脑、笔记本电脑、触控屏幕、游戏机、个人计算机、个人数字助理(Personal Digital Assistant,PDA)等终端设备。
如图4所示,图4为本申请实施例提供的电子设备的结构示意图,该电子设备400包括有一个或者一个以上处理核心的处理器410、有一个或一个以上计算机可读存储介质的存储器420及存储在存储器420上并可在处理器上运行的计算机程序。其中,处理器410与存储器420电性连接。本领域技术人员可以理解,图中示出的电子设备结构并不构成对电子设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
处理器410是电子设备400的控制中心,利用各种接口和线路连接整个电子设备400的各个部分,通过运行或加载存储在存储器420内的软件程序和/或模块,以及调用存储在存储器420内的数据,执行电子设备400的各种功能和处理数据,从而对电子设备400进行整体监控。
在本申请实施例中,电子设备400中的处理器410会按照如下的步骤,将一个或一个以上的应用程序的进程对应的指令加载到存储器420中,并由处理器410来运行存储在存储器420中的应用程序,从而实现各种功能:
获取剧情上文,以及用于表征角色属性的离散数值;
获取离散数值对应的描述文本,其中,描述文本中包括关键词;
确定关键词对应的候选结果词;
根据候选结果词、剧情上文以及描述文本生成剧情上文对应的剧情下文。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
可选的,如图4所示,电子设备400还包括:触控显示屏430、射频电路440、音频电路450、输入单元460以及电源470。其中,处理器410分别与触控显示屏430、射频电路440、音频电路450、输入单元460以及电源470电性连接。本领域技术人员可以理解,图4中示出的电子设备结构并不构成对电子设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
触控显示屏430可用于显示图形用户界面以及接收用户作用于图形用户界面产生的操作指令。触控显示屏430可以包括显示面板和触控面板。其中,显示面板可用于显示由用户输入的信息或提供给用户的信息以及电子设备的各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。可选的,可以采用液晶显示器(LCD,Liquid Crystal Display)、有机发光二极管(OLED,Organic Light-Emitting Diode)等形式来配置显示面板。触控面板可用于收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板上或在触控面板附近的操作),并生成相应的操作指令,且操作指令执行对应程序。可选的,触控面板可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器410,并能接收处理器410发来的命令并加以执行。触控面板可覆盖显示面板,当触控面板检测到在其上或附近的触摸操作后,传送给处理器410以确定触摸事件的类型,随后处理器410根据触摸事件的类型在显示面板上提供相应的视觉输出。在本申请实施例中,可以将触控面板与显示面板集成到触控显示屏430而实现输入和输出功能。但是在某些实施例中,触控面板与触控面板可以作为两个独立的部件来实现输入和输出功能。即触控显示屏430也可以作为输入单元460的一部分实现输入功能。
在本申请实施例中,通过处理器410执行游戏应用程序在触控显示屏430上生成图形用户界面,图形用户界面上的虚拟场景中包含至少一个技能控制区域,技能控制区域中包含至少一个技能控件。该触控显示屏430用于呈现图形用户界面以及接收用户作用于图形用户界面产生的操作指令。
射频电路440可用于收发射频信号,以通过无线通信与网络设备或其他电子设备建立无线通讯,与网络设备或其他电子设备之间收发信号。
音频电路450可以用于通过扬声器、传声器提供用户与电子设备之间的音频接口。音频电路450可将接收到的音频数据转换后的电信号,传输到扬声器,由扬声器转换为声音信号输出;另一方面,传声器将收集的声音信号转换为电信号,由音频电路450接收后转换为音频数据,再将音频数据输出处理器410处理后,经射频电路440以发送给比如另一电子设备,或者将音频数据输出至存储器420以便进一步处理。音频电路450还可能包括耳塞插孔,以提供外设耳机与电子设备的通信。
输入单元460可用于接收输入的数字、字符信息或用户特征信息(例如指纹、虹膜、面部信息等),以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。
电源470用于给电子设备400的各个部件供电。可选的,电源470可以通过电源管理***与处理器410逻辑相连,从而通过电源管理***实现管理充电、放电、以及功耗管理等功能。电源470还可以包括一个或一个以上的直流或交流电源、再充电***、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
尽管图4中未示出,电子设备400还可以包括摄像头、传感器、无线保真模块、蓝牙模块等,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
由上可知,本实施例提供的电子设备可以灵活生成剧情文本。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
为此,本申请实施例提供一种计算机可读存储介质,其中存储有多条计算机程序,该计算机程序能够被处理器进行加载,以执行本申请实施例所提供的任一种剧情文本生成中的步骤。例如,该计算机程序可以执行如下步骤:
获取剧情上文,以及用于表征角色属性的离散数值;
获取离散数值对应的描述文本,其中,描述文本中包括关键词;
确定关键词对应的候选结果词;
根据候选结果词、剧情上文以及描述文本生成剧情上文对应的剧情下文。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
其中,该存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。
由于该存储介质中所存储的计算机程序,可以执行本申请实施例所提供的任一种剧情文本生成中的步骤,因此,可以实现本申请实施例所提供的任一种剧情文本生成的方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
以上对本申请实施例所提供的一种剧情文本生成的方法、装置、存储介质及电子设备进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (11)

1.一种剧情文本生成的方法,其特征在于,所述方法包括:
获取剧情上文,以及用于表征角色属性的离散数值;
获取所述离散数值对应的描述文本,其中,所述描述文本中包括关键词;
确定所述关键词对应的候选结果词;
根据所述候选结果词、所述剧情上文以及所述描述文本生成所述剧情上文对应的剧情下文。
2.如权利要求1所述的方法,其特征在于,所述根据所述候选结果词、所述剧情上文以及所述描述文本生成所述剧情上文对应的剧情下文,包括:
从所述候选结果词中筛选出符合预设条件的结果词,作为目标结果词;
根据所述目标结果词、所述剧情上文以及所述描述文本生成所述剧情上文对应的剧情下文。
3.如权利要求2所述的方法,其特征在于,所述从所述候选结果词中筛选出满足预设条件的结果词,包括:
针对所述候选结果词中每一结果词,确定所述剧情上文和所述结果词之间存在蕴含关系的概率;
所述预设条件包括:所述剧情上文和所述结果词之间存在蕴含关系的概率大于预设阈值。
4.如权利要求2所述的方法,其特征在于,所述确定所述剧情上文和所述结果词之间存在蕴含关系的概率,包括:
分别提取所述剧情上文对应的词向量和所述结果词的对应的词向量;
对所述剧情上文对应的词向量和所述结果词对应的词向量进行相似度计算,得到所述剧情上文与所述结果词之间的相似度;
根据所述相似度,确定所述剧情上文和所述结果词之间存在蕴含关系的概率。
5.如权利要求1所述的方法,其特征在于,所述根据所述候选结果词、所述剧情上文以及所述描述文本生成所述剧情上文对应的剧情下文,包括:
根据每个所述候选结果词以及每个所述候选结果词对应的概率,获得所述关键词的额外信息,所述概率是指所述剧情上文和所述候选结果词之间存在蕴含关系的概率;
将所述关键词更新为所述额外信息;
确定更新后的所述关键词对应的候选结果词;
根据所述候选结果词、所述剧情上文以及所述描述文本生成剧情上文对应的剧情下文。
6.如权利要求5所述的方法,其特征在于,所述根据每个所述候选结果词以及每个所述候选结果词对应的概率,获得所述关键词的额外信息,包括:
将每个所述候选结果词对应的概率作为对应的候选结果词的权重,对每个所述候选结果词乘以对应的权重后进行求和,获得的求和结果作为所述关键词的额外信息。
7.根据权利要求1所述的方法,其特征在于,所述获取剧情上文,以及用于表征角色属性的离散数值,包括:
获取输入文本;
从所述输入文本中提取第一预设字段中的文本内容,作为所述剧情上文;
从所述输入文本中提取第二预设字段中的文本内容,作为所述用于表征角色属性的离散数值。
8.根据权利要求7所述的方法,其特征在于,所述方法还包括:
以第三预设字段对所述候选结果词进行标记。
9.一种剧情文本生成的装置,其特征在于,包括:
第一获取单元,用于获取剧情上文,以及用于表征角色属性的离散数值;
第二获取单元,用于获取所述离散数值对应的描述文本,其中,所述描述文本中包括关键词;
确定单元,用于确定所述关键词对应的候选结果词;
剧情文本生成单元,用于根据所述候选结果词、所述剧情上文以及所述描述文本生成所述剧情上文对应的剧情下文。
10.一种终端,其特征在于,包括处理器和存储器,所述存储器存储有多条指令;所述处理器从所述存储器中加载指令,以执行如权利要求1~8任一项所述的剧情文本生成的方法中的步骤。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有多条指令,所述指令适于处理器进行加载,以执行权利要求1~8任一项所述的剧情文本生成的方法中的步骤。
CN202210050963.7A 2022-01-17 2022-01-17 剧情文本生成的方法、装置、终端和存储介质 Pending CN114416921A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210050963.7A CN114416921A (zh) 2022-01-17 2022-01-17 剧情文本生成的方法、装置、终端和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210050963.7A CN114416921A (zh) 2022-01-17 2022-01-17 剧情文本生成的方法、装置、终端和存储介质

Publications (1)

Publication Number Publication Date
CN114416921A true CN114416921A (zh) 2022-04-29

Family

ID=81273546

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210050963.7A Pending CN114416921A (zh) 2022-01-17 2022-01-17 剧情文本生成的方法、装置、终端和存储介质

Country Status (1)

Country Link
CN (1) CN114416921A (zh)

Similar Documents

Publication Publication Date Title
CN111309886B (zh) 一种信息交互方法、装置和计算机可读存储介质
CN110334344A (zh) 一种语义意图识别方法、装置、设备及存储介质
CN111672098A (zh) 虚拟对象标记方法、装置、电子设备以及存储介质
CN113344184B (zh) 用户画像预测方法、装置、终端和计算机可读存储介质
CN112221139B (zh) 一种游戏的信息交互方法、装置和计算机可读存储介质
CN110852047A (zh) 一种文本配乐方法、装置、以及计算机存储介质
CN115083434A (zh) 一种情绪识别方法、装置、计算机设备及存储介质
CN111324409B (zh) 基于人工智能的互动方法和相关装置
CN111314771A (zh) 一种视频播放方法及相关设备
CN115204185A (zh) 交互问题生成方法、装置、存储介质及计算机设备
CN112307166B (zh) 一种智能问答方法、装置、存储介质以及计算机设备
JP2012189624A (ja) 学習支援装置、学習支援方法、及びプログラム
CN111767386A (zh) 对话处理方法、装置、电子设备及计算机可读存储介质
CN114416921A (zh) 剧情文本生成的方法、装置、终端和存储介质
CN112426726B (zh) 游戏事件抽取方法、装置、存储介质及服务器
CN116637375A (zh) 智能剧情生成方法及装置
CN113332718B (zh) 一种交互元素查询方法、装置、电子设备和存储介质
CN115068941A (zh) 游戏画质的推荐方法、装置、计算机设备及存储介质
CN116415624A (zh) 模型训练方法及装置、内容推荐方法及装置
CN113741930A (zh) 应用升级方法、装置、电子设备及计算机可读存储介质
CN113413607A (zh) 一种信息推荐方法、装置、计算机设备及存储介质
CN111760290B (zh) 一种信息处理方法、装置、计算机设备和存储介质
CN113807403B (zh) 模型训练的方法、装置、计算机设备及存储介质
CN113468429B (zh) 牌组优化方法、装置、存储介质及计算机设备
CN113536270B (zh) 一种信息验证的方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination