CN113705198A

CN113705198A - 场景图生成方法、装置、电子设备及存储介质

Info

Publication number: CN113705198A
Application number: CN202111224754.1A
Authority: CN
Inventors: 李志航; 刘锦龙; 王华彦
Original assignee: Beijing Dajia Internet Information Technology Co Ltd
Current assignee: Beijing Dajia Internet Information Technology Co Ltd
Priority date: 2021-10-21
Filing date: 2021-10-21
Publication date: 2021-11-26
Anticipated expiration: 2041-10-21
Also published as: CN113705198B

Abstract

本公开关于一种场景图生成方法、装置、电子设备及存储介质，该方法包括获取目标中文语句的分词序列和分词序列中词语的词性信息；将分词序列和词性信息输入句法依存模型进行句法依存分析，得到包括具有依存关系的词语对和对应依存关系的词语关系数据；根据词性信息，识别分词序列中属于实体的词语；根据词语关系数据，确定依存关系为定中关系的第一目标词语对和依存关系为目标依存关系的第二目标词语对；基于第一目标词语对和属于实体的词语，生成实体属性信息；基于第二目标词语对，生成表征实体间关联关系的实体关系信息；基于实体属性信息和实体关系信息，生成目标中文语句对应的场景图。利用本公开实施例可以快速准确的生成中文语句的场景图。

Description

场景图生成方法、装置、电子设备及存储介质

技术领域

本公开涉及计算机视觉技术领域，尤其涉及一种场景图生成方法、装置、电子设备及存储介质。

背景技术

随着计算机视觉技术的发展，人们对场景的理解从分类、检测、分割发展到自然语言的描述，这对视觉场景有更高层次的理解和推理。不同于非结构化自然语言，场景图是对场景的结构化表示，更便于机器学习模型的处理。

相关技术中，往往先从英文句子生成句法依存树，再根据英文语法，将句法依存树中的关系转化为场景图中所需要的关系，但相关技术中提取场景图时所使用的规则都是基于英文的语法，不适用于中文。因此，需要一种针对中文语句生成场景图的方法。

发明内容

本公开提供一种场景图生成方法、装置、电子设备及存储介质，以至少解决相关技术中无法生成中文语句的场景图的问题。本公开的技术方案如下：

根据本公开实施例的第一方面，提供一种场景图生成方法，包括：

获取目标中文语句的分词序列和所述分词序列中词语的词性信息；

将所述分词序列和所述词性信息输入句法依存模型进行句法依存分析，得到词语关系数据，所述词语关系数据包括具有依存关系的词语对和所述词语对对应的依存关系；

根据所述词性信息，识别所述分词序列中属于实体的词语；

根据所述词语关系数据，确定依存关系为定中关系的第一目标词语对和依存关系为目标依存关系的第二目标词语对；所述目标依存关系为对应的词语对包含实体关联词的依存关系，所述实体关联词为表征实体间关联关系的词语；

基于所述第一目标词语对和所述属于实体的词语，生成实体属性信息；

基于所述第二目标词语对，生成实体关系信息，所述实体关系信息表征两两实体间的关联关系；

基于所述实体属性信息和所述实体关系信息，生成所述目标中文语句对应的场景图。

可选的，所述第一目标词语对包括：包含核心词和依存词的词语对；所述基于所述第一目标词语对和所述属于实体的词语，生成实体属性信息包括：

根据所述属于实体的词语，从所述第一目标词语对中确定依存词属于实体的第三目标词语对；

以所述第三目标词语对中依存词为实体，所述第三目标词语对中核心词为对应实体的属性，生成所述实体属性信息。

可选的，所述关联关系包括动作关联关系，所述目标依存关系包括：主谓关系和动宾关系；第二目标词语对包括：依存关系为主谓关系的包含核心词和依存词的第一子词语对和依存关系为动宾关系的包含核心词和依存词的第二子词语对；

所述基于所述第二目标词语对，生成实体关系信息包括：

将每一第一子词语对中依存词与每一第二子词语对中核心词进行匹配处理，得到匹配词语对组，所述匹配词语对组包含的第一子词语对中的依存词和所述匹配词语对组包含的第二子词语对中的核心词一致；

以所述匹配词语对组包含的第一子词语对中核心词和所述匹配词语对组包含的第二子词语中依存词为第一实体对，所述匹配词语对组包含的第一子词语对中依存词或所述匹配词语对组包含的第二子词语中核心词为所述第一实体对对应的动作关联关系，生成所述实体关系信息。

可选的，所述关联关系包括位置关联关系，所述目标依存关系包括：介宾关系；第二目标词语对包括：依存关系为介宾关系的包含核心词和依存词的词语对；

所述基于所述第二目标词语对，生成实体关系信息包括：

根据所述词语关系数据，确定依存词为所述第二目标词语对中依存词的第四目标词语对，以及依存词为所述第二目标词语对中核心词的第五目标词语对；

以所述第四目标词语对中核心词和所述第五目标词语对中核心词为第二实体对，所述第二目标词语对中核心词为所述第二实体对对应的位置关联关系，生成所述实体关系信息。

可选的，所述实体属性信息包括实体和所述实体的属性，所述实体关系信息包括实体对和所述实体对对应的关联关系；所述基于所述实体属性信息和所述实体关系信息，生成所述目标中文语句对应的场景图包括：

将所述实体属性信息中实体作为第一类型节点，所述实体属性信息中实体的属性作为第二类型节点；

以所述实体关系信息中实体对对应的关联关系为相应的第一类型节点间的边，实体和实体的属性间的依存关系为相应的第一类型节点和第二类型节点间的边，构建所述场景图。

可选的，所述方法还包括：

获取待处理中文文本；

基于待匹配字符为预设标点符号的正则表达式，将所述待处理中文文本划分为多个语句；

将所述多个语句中的任意一个语句作为所述目标中文语句。

可选的，所述分词序列中词语的词性信息包括采用下述方式获取：

将所述分词序列输入词性识别模型进行词性识别处理，得到所述分词序列中词语的词性信息。

根据本公开实施例的第二方面，提供一种场景图生成装置，包括：

信息获取模块，被配置为执行获取目标中文语句的分词序列和所述分词序列中词语的词性信息；

句法依存分析模块，被配置为执行将所述分词序列和所述词性信息输入句法依存模型进行句法依存分析，得到词语关系数据，所述词语关系数据包括具有依存关系的词语对和所述词语对对应的依存关系；

实体识别模块，被配置为执行根据所述词性信息，识别所述分词序列中属于实体的词语；

目标词语对确定模块，被配置为执行根据所述词语关系数据，确定依存关系为定中关系的第一目标词语对和依存关系为目标依存关系的第二目标词语对；所述目标依存关系为对应的词语对包含实体关联词的依存关系，所述实体关联词为表征实体间关联关系的词语；

实体属性信息生成模块，被配置为执行基于所述第一目标词语对和所述属于实体的词语，生成实体属性信息；

实体关系信息生成模块，被配置为执行基于所述第二目标词语对，生成实体关系信息，所述实体关系信息表征两两实体间的关联关系；

场景图生成模块，被配置为执行基于所述实体属性信息和所述实体关系信息，生成所述目标中文语句对应的场景图。

可选的，所述第一目标词语对包括：包含核心词和依存词的词语对；所述实体属性信息生成模块包括：

第三目标词语对确定单元，被配置为执行根据所述属于实体的词语，从所述第一目标词语对中确定依存词属于实体的第三目标词语对；

实体属性信息生成单元，被配置为执行以所述第三目标词语对中依存词为实体，所述第三目标词语对中核心词为对应实体的属性，生成所述实体属性信息。

所述实体关系信息生成模块包括：

词语对匹配单元，被配置为执行将每一第一子词语对中依存词与每一第二子词语对中核心词进行匹配处理，得到匹配词语对组，所述匹配词语对组包含的第一子词语对中的依存词和所述匹配词语对组包含的第二子词语对中的核心词一致；

第一实体关系信息生成单元，被配置为执行以所述匹配词语对组包含的第一子词语对中核心词和所述匹配词语对组包含的第二子词语中依存词为第一实体对，所述匹配词语对组包含的第一子词语对中依存词或所述匹配词语对组包含的第二子词语中核心词为所述第一实体对对应的动作关联关系，生成所述实体关系信息。

所述实体关系信息生成模块包括：

目标词语对确定单元，被配置为执行根据所述词语关系数据，确定依存词为所述第二目标词语对中依存词的第四目标词语对，以及依存词为所述第二目标词语对中核心词的第五目标词语对；

第二实体关系信息生成单元，被配置为执行以所述第四目标词语对中核心词和所述第五目标词语对中核心词为第二实体对，所述第二目标词语对中核心词为所述第二实体对对应的位置关联关系，生成所述实体关系信息。

可选的，所述实体属性信息包括实体和所述实体的属性，所述实体关系信息包括实体对和所述实体对对应的关联关系；所述场景图生成模块包括：

节点确定单元，被配置为执行将所述实体属性信息中实体作为第一类型节点，所述实体属性信息中实体的属性作为第二类型节点；

场景图构建单元，被配置为执行以所述实体关系信息中实体对对应的关联关系为相应的第一类型节点间的边，实体和实体的属性间的依存关系为相应的第一类型节点和第二类型节点间的边，构建所述场景图。

可选的，所述装置还包括：

待处理中文文本获取模块，被配置为执行获取待处理中文文本；

语句划分模块，被配置为执行基于待匹配字符为预设标点符号的正则表达式，将所述待处理中文文本划分为多个语句；

目标中文语句确定模块，被配置为执行将所述多个语句中的任意一个语句作为所述目标中文语句。

可选的，所述信息获取模块包括：

词性识别处理单元，被配置为执行将所述分词序列输入词性识别模型进行词性识别处理，得到所述分词序列中词语的词性信息。

根据本公开实施例的第三方面，提供一种电子设备，包括：处理器；用于存储所述处理器可执行指令的存储器；其中，所述处理器被配置为执行所述指令，以实现如上述第一方面中任一项所述的方法。

根据本公开实施例的第四方面，提供一种计算机可读存储介质，当所述存储介质中的指令由电子设备的处理器执行时，使得所述电子设备能够执行本公开实施例的第一方面中任一项所述方法。

根据本公开实施例的第五方面，提供一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行本公开实施例的第一方面中任一项所述方法。

本公开的实施例提供的技术方案至少带来以下有益效果：

结合目标中文语句的分词序列和词性信息进行句法依存分析，可以得到目标中文语句中具有依存关系的词语对和所述词语对对应的依存关系，并结合词性信息定位出属于实体的词语，然后，基于句法依存分析的结果，生成实体属性信息和表征两两实体间的关联关系的实体关系信息，可以准确的将自然语言中实体、属性以及实体之间的关系由非结构化的数据转化为结构化的数据，进而实现对目标中文语句中场景的精准刻画，提升对场景描述的准确性和生动性，也为下游任务的处理提供数据支持。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理，并不构成对本公开的不当限定。

图1是根据一示例性实施例示出的一种场景图生成方法的流程图；

图2是根据一示例性实施例示出的一种基于第一目标词语对和属于实体的词语，生成实体属性信息的流程图；

图3是根据一示例性实施例示出的一种基于第二目标词语对，生成实体关系信息的流程图；

图4是根据一示例性实施例示出的另一种基于第二目标词语对，生成实体关系信息的流程图；

图5是根据一示例性实施例示出的一种基于实体属性信息和实体关系信息，生成目标中文语句对应的场景图的流程图；

图6是根据一示例性实施例提供的一种场景图的示意图；

图7是根据一示例性实施例提供的另一种场景图的示意图；

图8是根据一示例性实施例示出的一种场景图生成装置框图；

图9是根据一示例性实施例示出的一种用于场景图生成的电子设备的框图；

图10是根据一示例性实施例示出的另一种用于场景图生成的电子设备的框图。

具体实施方式

为了使本领域普通人员更好地理解本公开的技术方案，下面将结合附图，对本公开实施例中的技术方案进行清楚、完整地描述。

需要说明的是，本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

需要说明的是，本公开所涉及的用户信息（包括但不限于用户设备信息、用户个人信息等）和数据（包括但不限于用于展示的数据、分析的数据等），均为经用户授权或者经过各方充分授权的信息和数据。

请参阅图1，图1是根据一示例性实施例示出的一种场景图生成方法的流程图，如图1所示，该场景图生成方法用于终端、服务器电子设备中，包括以下步骤。

在步骤S101中，获取目标中文语句的分词序列和分词序列中词语的词性信息。

在实际应用中，目标中文语句可以为任一需要生成相应场景图的中文句子。可选的，目标中文语句可以为中某一中文文本中提取的句子。相应的，在一个可选的实施例中，上述方法还可以包括：

获取待处理中文文本；

基于待匹配字符为预设标点符号的正则表达式，将待处理中文文本划分为多个语句；

将多个语句中的任意一个语句作为目标中文语句。

在一个可选的实施例中，待处理中文文本可以为任意中文文本，具体的，例如小说、新闻等。预设标点符号可以为中文标点符号。具体的，在基于待匹配字符为预设标点符号的正则表达式，将待处理中文文本划分为多个语句过程中，可以从待处理中文文本中匹配预设标点符号，可选的，若在待处理中文文本中匹配到预设标点符号，可以将当前匹配到的预设标签符号的上一个预设标签符号至当前匹配到的预设标签符号间的中文字符作为一个语句。

上述实施例中，结合待匹配字符为预设标点符号的正则表达式，可以快速准确的将待处理中文文本划分为多个语句，进而便于后续生成不同语句的场景图。

在一个可选的实施例中，上述分词序列可以包括目标中文语句中的多个词语，具体的，任一词语可以包括至少一个字。可选的，可以结合结巴分词工具、HanLP（HanLanguage Processing 汉语言处理包）等结合分词工具对目标中文语句进行分词处理，得到分词序列。

在一个可选的实施例中，上述分词序列中词语的词性信息可以包括采用下述方式获取：

将分词序列输入词性识别模型进行词性识别处理，得到分词序列中词语的词性信息。

在一个可选的实施例中，词性识别模型可以为预先基于样本分词序列和样本分词序列对应的词性信息对预设深度学习模型进行训练得到的。

在一个具体的实施例中，假设上述分词序列为：

，其中，

为分词序列中的n个词语。相应的，词性识别模型输出的词性信息可以为：

其中，

分别为

对应的词性信息。

上述实施例中，结合词性识别模型对分词序列进行词性识别处理，可以快速准确的识别出分词序列中词语的词性信息，进而为后续进行场景图生成提供数据支持。

在步骤S103中，将分词序列和词性信息输入句法依存模型进行句法依存分析，得到词语关系数据。

本说明书实施例中，上述词语关系数据可以包括具有依存关系的词语对和词语对对应的依存关系。在一个具体的实施例中，词语关系数据可以为三元组形式的数据，例如，

其中，

表示词语

与词语

之间的依存关系为

，可选的，

为核心词，

（与

具有依存关系的词语）为依存词。

在一个具体的实施例中，词语对对应的依存关系可以为词语对中两个词语间的依存关系，具体的，依存关系可以包括但不限于主谓关系、动宾关系、介宾关系、状中关系、定中关系、并列关系等。

在一个具体的实施例中，句法依存模型可以为预先基于样本分词序列、对应的词性信息和样本分词序列对应的词语关系数据对预设深度学习模进行训练得到的。

在步骤S105中，根据词性信息，识别分词序列中属于实体的词语；

在一个具体的实施例中，可以将词性信息为名词的词语作为实体。具体的，名词可以包括但不限于普通名词、其他专名等。

在一个具体的实施例中，实体可以为某一场景中的对象，该对象可以为人、物等构成场景的信息。

在步骤S107中，根据词语关系数据，确定依存关系为定中关系的第一目标词语对和依存关系为目标依存关系的第二目标词语对。

本说明书实施例中，目标依存关系为对应的词语对包含实体关联词的依存关系，具体的，上述实体关联词可以为表征实体间关联关系的词语。

在一个具体的实施例中实体间关联关系可以包括但不限于动作关联关系、位置关联关系中的至少一种。具体的，具有动作关联关系的实体间存在基于某一动作建立的联系；具有位置关联关系的实体间存在基于某一位置关系建立的联系。

在一个具体的实施例中，在关联关系包括动作关联关系的情况下，目标依存关系可以为主谓关系和动宾关系。相应的，上述第二目标词语对可以包括：依存关系为主谓关系的包含核心词和依存词的第一子词语对和依存关系为动宾关系的包含核心词和依存词的第二子词语对。

在一个具体的实施例中，在关联关系包括位置关联关系的情况下，目标依存关系可以为介宾关系。相应的，上述第二目标词语对可以包括：依存关系为介宾关系的包含核心词和依存词的词语对。

在步骤S109中，基于第一目标词语对和属于实体的词语，生成实体属性信息；

在一个可选的实施例中，上述第一目标词语对可以包括：包含核心词和依存词的词语对；可选的，如图2所示，上述基于第一目标词语对和属于实体的词语，生成实体属性信息可以包括以下步骤：

在步骤S1091中，根据属于实体的词语，从第一目标词语对中确定依存词属于实体的第三目标词语对；

在步骤S1093中，以第三目标词语对中依存词为实体，第三目标词语对中核心词为对应实体的属性，生成实体属性信息。

在一个具体的实施例中，实体属性信息可以包括实体和实体的属性。具体的，实体的属性可以为用于修饰该实体的词语。具体的，可以结合属于实体的词语，确定第一目标词语对中，依存词属于实体的第三目标词语对，并以第三目标词语对中依存词为实体，相应的核心词作为用于修饰该实体的属性。

上述实施例中，从具有定中关系的第一目标词语对中，确定依存词属于实体的第三目标词语对，进而可以将定中关系中用于修饰依存词的核心词作为该实体（依存词）的属性，实现对场景中实体的精准描述。

在步骤S111中，基于第二目标词语对，生成实体关系信息。

本说明书实施例中，上述实体关系信息可以表征两两实体间的关联关系；在一个具体的实施例中，上述实体关系信息包括实体对和实体对对应的关联关系；

在一个可选的实施例中，在关联关系包括动作关联关系的情况下，目标依存关系包括：主谓关系和动宾关系；第二目标词语对包括：依存关系为主谓关系的包含核心词和依存词的第一子词语对和依存关系为动宾关系的包含核心词和依存词的第二子词语对；相应的，如图3所示，上述基于第二目标词语对，生成实体关系信息可以包括以下步骤：

在步骤S301中，将每一第一子词语对中依存词与每一第二子词语对中核心词进行匹配处理，得到匹配词语对组，所述匹配词语对组包含的第一子词语对中的依存词和所述匹配词语对组包含的第二子词语对中的核心词一致；

在步骤S303中，以匹配词语对组包含的第一子词语对中核心词和匹配词语对组包含的第二子词语中依存词为第一实体对，匹配词语对组包含的第一子词语对中依存词或匹配词语对组包含的第二子词语中核心词为第一实体对对应的动作关联关系，生成实体关系信息。

在一个具体的实施例中，目标中文语句为：我吃了一个苹果，第一子词语对为：[我，吃]，第二子词语对为：[吃，苹果]。其中，第一子词语对中的依存词“吃”和第二子词语对中的核心词“吃”相匹配（一致），相应的，第一子词语对：[我，吃]和第二子词语对：[吃，苹果]为两两匹配的第一子词语对和第二子词语对（即匹配词语对组），进一步的，可以以“我”和“苹果”为第一实体对，“吃”为第一实体对“我”和“苹果”的对应的动作关联关系；相应的，实体关系信息可以为“我-吃-苹果”。

上述实施例中，通过对依存关系为主谓关系的第一子词语对中依存词和依存关系为动宾关系的第二子词语对中核心词间的匹配，可以准确提取能够表征实体间动作关联关系的词语，进而构建出可以精准描述场景中实体间动作关联关系的实体关系信息。

在一个可选的实施例中，在上述关联关系包括位置关联关系的情况下，目标依存关系包括：介宾关系；第二目标词语对包括：依存关系为介宾关系的包含核心词和依存词的词语对；相应的，如图4所示，上述基于第二目标词语对，生成实体关系信息可以包括：

在步骤S401中，根据词语关系数据，确定依存词为第二目标词语对中依存词的第四目标词语对，以及依存词为第二目标词语对中核心词的第五目标词语对；

在步骤S403中，以第四目标词语对中核心词和第五目标词语对中核心词为第二实体对，第二目标词语对中核心词为第二实体对对应的位置关联关系，生成实体关系信息。

在一个具体的实施例中，假设目标中文语句为“一本书在桌子上”，相应的，第二目标词语对可以为：[上，在]，然后遍历“一本书在桌子上”对应的具有依存关系的词语对，确定出依存词为“在”的第四目标词语对：[书，在] ，和依存词为“上”第五目标词语对：[桌子，上]；相应的，可以将第四目标词语对：[书，在]中的核心词“书”以及第五目标词语对：[桌子，上]中的核心词“桌子”为第二实体对象，并以“上”为“桌子”和“书”的位置关联关系，得到实体关系信息：“桌子-上-书”。

上述实施例中，通过对依存关系为介宾关系的第二目标词语对中依存词和核心词，分别匹配出第四目标词语对和第五目标词语对，并精准确定出以第二目标词语对中核心词为位置关联关系的两个实体，进而构建出可以精准描述场景中实体间位置关联关系的实体关系信息。

在步骤S113中，基于实体属性信息和实体关系信息，生成目标中文语句对应的场景图。

在一个具体的实施例中，场景图（scene graph）是对场景的结构化表示，可以用于描述场景中的实体、属性以及实体之间的关系。相应的，上述目标中文语句对应的场景图可以以结构化的数据表征目标中文语句对应场景中的实体、属性以及实体之间的关系。

在一个可选的实施例中，如图5所示，上述基于实体属性信息和实体关系信息，生成目标中文语句对应的场景图可以包括以下步骤：

在步骤S501中，将实体属性信息中实体作为第一类型节点，实体属性信息中实体的属性作为第二类型节点；

在步骤S503中，以实体关系信息中实体对对应的关联关系为相应的第一类型节点间的边，实体和实体的属性间的依存关系为相应的第一类型节点和第二类型节点间的边，构建场景图。

在一个具体的实施例中，第一类型节点可以为实体对应的节点，第二类型节点可以为实体的属性对应的节点。可选的，实体间的边可以为有向边，具体的，可以结合两个实体间的关联关系来确定边的指向。实体与属性间的边，可以由实体指向属性。

在一个具体的实施例中，如图6所示，图6是根据一示例性实施例提供的一种场景图的示意图，具体的，以上述“我吃了一个苹果”为例，第一类型节点包括实体“我”和实体“苹果”，第二类型节点包括实体“苹果”的属性“一个”；实体“我”和实体“苹果”间的边（吃）的指向可以为由“我”指向“苹果”；实体“苹果”和属性“一个”间的边可以由书”指向“一本”。

在一个具体的实施例中，如图7所示，图7是根据一示例性实施例提供的另一种场景图的示意图，具体的，以上述“一本书在桌子上”为例，第一类型节点包括实体“桌子”和实体“书”，第二类型节点包括实体“书”的属性“一本”；实体“桌子”与实体“书”间的边（上）的指向可以为由“桌子”指向“书”；实体“书”和属性“一本”间的边可以由书”指向“一本”。

上述实施例中，结合包括实体和实体的属性的实体属性信息，以及包括实体对和实体对对应的关联关系的实体关系信息，可以准确的将自然语言中实体、属性以及实体之间的关系由非结构化的数据转化为结构化的数据，进而实现对目标中文语句中场景的精准刻画，为下游任务的处理提供数据支持。

在一个可选的实施例中，可以结合图像生成模型，将上述场景图转换成相应的场景图像，进而在相关应用中生成动画或小视频等更生动体现场景的信息。

在一个可选的实施例中，也可以结合上述某一领域的大量语句对应的场景图生成相应的知识图谱，为后续应用提供进一步的数据支持。

由以上本说明书实施例提供的技术方案可见，本说明书结合目标中文语句的分词序列和词性信息进行句法依存分析，可以得到目标中文语句中具有依存关系的词语对和词语对对应的依存关系，并结合词性信息定位出属于实体的词语，然后，基于句法依存分析的结果，生成实体属性信息和表征两两实体间的关联关系的实体关系信息，可以准确的将自然语言中实体、属性以及实体之间的关系由非结构化的数据转化为结构化的数据，进而实现对目标中文语句中场景的精准刻画，提升对场景描述的准确性和生动性，也为下游任务的处理提供数据支持。

图8是根据一示例性实施例示出的一种场景图生成装置框图。参照图8，该装置包括：

信息获取模块810，被配置为执行获取目标中文语句的分词序列和分词序列中词语的词性信息；

句法依存分析模块820，被配置为执行将分词序列和词性信息输入句法依存模型进行句法依存分析，得到词语关系数据，词语关系数据包括具有依存关系的词语对和词语对对应的依存关系；

实体识别模块830，被配置为执行根据词性信息，识别分词序列中属于实体的词语；

目标词语对确定模块840，被配置为执行根据词语关系数据，确定依存关系为定中关系的第一目标词语对和依存关系为目标依存关系的第二目标词语对；目标依存关系为对应的词语对包含实体关联词的依存关系，实体关联词为表征实体间关联关系的词语；

实体属性信息生成模块850，被配置为执行基于第一目标词语对和属于实体的词语，生成实体属性信息；

实体关系信息生成模块860，被配置为执行基于第二目标词语对，生成实体关系信息，实体关系信息表征两两实体间的关联关系；

场景图生成模块870，被配置为执行基于实体属性信息和实体关系信息，生成目标中文语句对应的场景图。

可选的，第一目标词语对包括：包含核心词和依存词的词语对；实体属性信息生成模块850包括：

第三目标词语对确定单元，被配置为执行根据属于实体的词语，从第一目标词语对中确定依存词属于实体的第三目标词语对；

实体属性信息生成单元，被配置为执行以第三目标词语对中依存词为实体，第三目标词语对中核心词为对应实体的属性，生成实体属性信息。

可选的，关联关系包括动作关联关系，目标依存关系包括：主谓关系和动宾关系；第二目标词语对包括：依存关系为主谓关系的包含核心词和依存词的第一子词语对和依存关系为动宾关系的包含核心词和依存词的第二子词语对；

实体关系信息生成模块860包括：

可选的，关联关系包括位置关联关系，目标依存关系包括：介宾关系；第二目标词语对包括：依存关系为介宾关系的包含核心词和依存词的词语对；

实体关系信息生成模块860包括：

目标词语对确定单元，被配置为执行根据词语关系数据，确定依存词为第二目标词语对中依存词的第四目标词语对，以及依存词为第二目标词语对中核心词的第五目标词语对；

第二实体关系信息生成单元，被配置为执行以第四目标词语对中核心词和第五目标词语对中核心词为第二实体对，第二目标词语对中核心词为第二实体对对应的位置关联关系，生成实体关系信息。

可选的，实体属性信息包括实体和实体的属性，实体关系信息包括实体对和实体对对应的关联关系；场景图生成模块870包括：

节点确定单元，被配置为执行将实体属性信息中实体作为第一类型节点，实体属性信息中实体的属性作为第二类型节点；

场景图构建单元，被配置为执行以实体关系信息中实体对对应的关联关系为相应的第一类型节点间的边，实体和实体的属性间的依存关系为相应的第一类型节点和第二类型节点间的边，构建场景图。

可选的，上述装置还包括：

语句划分模块，被配置为执行基于待匹配字符为预设标点符号的正则表达式，将待处理中文文本划分为多个语句；

目标中文语句确定模块，被配置为执行将多个语句中的任意一个语句作为目标中文语句。

可选的，信息获取模块810包括：

词性识别处理单元，被配置为执行将分词序列输入词性识别模型进行词性识别处理，得到分词序列中词语的词性信息。

关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

图9是根据一示例性实施例示出的一种用于场景图生成的电子设备的框图，该电子设备可以是终端，其内部结构图可以如图9所示。该电子设备包括通过***总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中，该电子设备的处理器用于提供计算和控制能力。该电子设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***和计算机程序。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该电子设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种场景图生成方法。该电子设备的显示屏可以是液晶显示屏或者电子墨水显示屏，该电子设备的输入装置可以是显示屏上覆盖的触摸层，也可以是电子设备外壳上设置的按键、轨迹球或触控板，还可以是外接的键盘、触控板或鼠标等。

图10是根据一示例性实施例示出的另一种用于场景图生成的电子设备的框图，该电子设备可以是服务器，其内部结构图可以如图10所示。该电子设备包括通过***总线连接的处理器、存储器和网络接口。其中，该电子设备的处理器用于提供计算和控制能力。该电子设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***和计算机程序。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该电子设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种场景图生成方法。

本领域技术人员可以理解，图9或图10中示出的结构，仅仅是与本公开方案相关的部分结构的框图，并不构成对本公开方案所应用于其上的电子设备的限定，具体的电子设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在示例性实施例中，还提供了一种电子设备，包括：处理器；用于存储该处理器可执行指令的存储器;其中，该处理器被配置为执行该指令，以实现如本公开实施例中的场景图生成方法。

在示例性实施例中，还提供了一种计算机可读存储介质，当该存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行本公开实施例中的场景图生成方法。

在示例性实施例中，还提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行本公开实施例中的场景图生成方法。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，该计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims

1.一种场景图生成方法，其特征在于，包括：

根据所述词性信息，识别所述分词序列中属于实体的词语；

2.根据权利要求1所述的场景图生成方法，其特征在于，所述第一目标词语对包括：包含核心词和依存词的词语对；所述基于所述第一目标词语对和所述属于实体的词语，生成实体属性信息包括：

3.根据权利要求1所述的场景图生成方法，其特征在于，所述关联关系包括动作关联关系，所述目标依存关系包括：主谓关系和动宾关系；第二目标词语对包括：依存关系为主谓关系的包含核心词和依存词的第一子词语对和依存关系为动宾关系的包含核心词和依存词的第二子词语对；

所述基于所述第二目标词语对，生成实体关系信息包括：

4.根据权利要求1所述的场景图生成方法，其特征在于，所述关联关系包括位置关联关系，所述目标依存关系包括：介宾关系；第二目标词语对包括：依存关系为介宾关系的包含核心词和依存词的词语对；

所述基于所述第二目标词语对，生成实体关系信息包括：

5.根据权利要求1所述的场景图生成方法，其特征在于，所述实体属性信息包括实体和所述实体的属性，所述实体关系信息包括实体对和所述实体对对应的关联关系；所述基于所述实体属性信息和所述实体关系信息，生成所述目标中文语句对应的场景图包括：

6.根据权利要求1至5任一所述的场景图生成方法，其特征在于，所述方法还包括：

获取待处理中文文本；

将所述多个语句中的任意一个语句作为所述目标中文语句。

7.一种场景图生成装置，其特征在于，包括：

8.根据权利要求7所述的场景图生成装置，其特征在于，所述第一目标词语对包括：包含核心词和依存词的词语对；所述实体属性信息生成模块包括：

9.根据权利要求7所述的场景图生成装置，其特征在于，所述关联关系包括动作关联关系，所述目标依存关系包括：主谓关系和动宾关系；第二目标词语对包括：依存关系为主谓关系的包含核心词和依存词的第一子词语对和依存关系为动宾关系的包含核心词和依存词的第二子词语对；

所述实体关系信息生成模块包括：

10.根据权利要求7所述的场景图生成装置，其特征在于，所述关联关系包括位置关联关系，所述目标依存关系包括：介宾关系；第二目标词语对包括：依存关系为介宾关系的包含核心词和依存词的词语对；

所述实体关系信息生成模块包括：

11.根据权利要求7所述的场景图生成装置，其特征在于，所述实体属性信息包括实体和所述实体的属性，所述实体关系信息包括实体对和所述实体对对应的关联关系；所述场景图生成模块包括：

12.根据权利要求7至11任一所述的场景图生成装置，其特征在于，所述装置还包括：

13.一种电子设备，其特征在于，包括：

处理器；

用于存储所述处理器可执行指令的存储器；

其中，所述处理器被配置为执行所述指令，以实现如权利要求1至6中任一项所述的场景图生成方法。

14.一种计算机可读存储介质，其特征在于，当所述存储介质中的指令由电子设备的处理器执行时，使得所述电子设备能够执行如权利要求1至6中任一项所述的场景图生成方法。

15.一种计算机程序产品，包括计算机指令，其特征在于，所述计算机指令被处理器执行时实现权利要求1至6中任一项所述的场景图生成方法。