CN115438673A - 一种以事件为核心的语义表示方法 - Google Patents

一种以事件为核心的语义表示方法 Download PDF

Info

Publication number
CN115438673A
CN115438673A CN202211156388.5A CN202211156388A CN115438673A CN 115438673 A CN115438673 A CN 115438673A CN 202211156388 A CN202211156388 A CN 202211156388A CN 115438673 A CN115438673 A CN 115438673A
Authority
CN
China
Prior art keywords
event
semantic
entity
core
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211156388.5A
Other languages
English (en)
Inventor
荀恩东
王贵荣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEIJING LANGUAGE AND CULTURE UNIVERSITY
Original Assignee
BEIJING LANGUAGE AND CULTURE UNIVERSITY
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING LANGUAGE AND CULTURE UNIVERSITY filed Critical BEIJING LANGUAGE AND CULTURE UNIVERSITY
Priority to CN202211156388.5A priority Critical patent/CN115438673A/zh
Publication of CN115438673A publication Critical patent/CN115438673A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Machine Translation (AREA)

Abstract

本发明提供一种以事件为核心的语义表示方法,是一种句子的语义表示方法,从形式来看,语义图主要由节点和边组成,节点表示句子中的词语或概念,边表示它们之间的关系;从内容来看,语义图主要由两部分构成:事件结构与实体结构。所述事件结构与实体结构表示的内容抽象为单元、关系、属性三个方面,通过构建单元、单元属性以及单元间关系的语义图,来实现机器对自然语言的理解。本发明既能够对语言现象进行一致性表示,同时,具有可计算的操作路径,并能够便捷地进行落地应用。

Description

一种以事件为核心的语义表示方法
技术领域
本发明涉及一种中文句子表示方法,尤其是涉及一种以事件为核心的语义表示方法。
背景技术
语义是语言形式对现实世界进行表示时所对应的意义内容,体现了人类对世界的认识。随着自然语言处理的发展,语言计算开始从句法层面向语义层面转型,语义分析逐渐成为了自然语言处理领域研究的重点与难点。如何实现自然语言的语义分析和理解是自然语言处理的终极目标之一,也是各类语言智能应用落地的关键。为了能够让计算机更好地理解自然语言所表达的语义信息,首要解决的是自然语言的语义表示问题。
语义表示指的是将自然语言句子转化为反映这个句子意义的某种形式化表示,即将人类能够理解的自然语言转化为计算机能够理解和执行的形式语言。语义表示一般分为符号表示和分布式表示,符号表示更直观,也更具解释性和操作性,但现有的符号表示方法有的对语言现象表示不充分,有的语义关系类型众多,可计算性差,与应用场景对接困难;分布式语义表示则利用词语的上下文来表示词语含义,描述的是上下文的概率分布,具有更强大的表示能力和自由度。随着深度学习技术的发展,分布式语义表示已经成为当前主流的语义表示方法,但目前只能通过特定任务下的数据学习,建立满足特定需求的语义表示,一方面缺少可解释性,鲁棒性差,另一方面通用性和迁移性也不足。本专利提供的语义表示方法为符号表示方法,但在可计算性和应用方面进行了优化。
发明内容
本发明提供了一种以事件为核心的语义表示方法,是以事件为核心的中文语义表示方法。该方法实现了句子从语言符号序列到语义图的转化,既能对不同语言现象体现的语义关系进行一致性表示,同时,具有可计算的操作路径,并能够便捷地进行落地应用,解决了现有语义表征方法不可解释、可计算性差、应用困难的问题。其技术方案如下所述:
一种以事件为核心的语义表示方法,包括以下步骤:
S1:确定语义图中的事件结构与实体结构,事件结构和实体结构分别对应谓词性成分和体词性成分在句法位置上的语义功能,用事件结构表示谓词性成分的陈述功能,对特定的过程、性质或状态进行断言;用实体结构表示名词等体词性成分的指称功能,指特定的事物概念;
S2:所述事件结构通过事件词作为形式代表,事件词对应的核心要素包括核心论元、边缘论元、属性信息;
S3:确定事件节点与其核心要素之间的语义关系,语义关系的具体类别在弧上进行说明;
S4:确定实体结构的属性信息,以有向弧指向事件节点。
进一步的,步骤S1中,所述语义图为单根有向图,设置有一个ROOT根节点,句子中的核心谓词与根节点连接,节点对应承载实体和事件的语言单元,边为有向边,表示事件与实体、事件与事件、实体与实体之间的语义关系,有向边上标出关系标签或属性名,由被支配节点指向支配节点。
进一步的,步骤S2中,在事件结构中,所述核心论元指在句法上占据主/宾语位置,在语义上与事件直接相关的语义角色,事件词的核心论元采用左方向的输入。
进一步的,步骤S2中,在事件结构中,所述边缘论元信息用介词、方位词格标记引导,事件词的边缘论元采用上方向的输入。
进一步的,步骤S2中,在事件结构中,所述情态信息以句法成分为单位,事件词的情态信息采用下方向的输入。
进一步的,步骤S2中,在事件结构中,还包括事件词的事件外结构,采用右方向的输出,所述事件外结构是指当前事件词充当其他事件词的输入,其它事件词有四种类型,一是ROOT节点作事件词,二是能够带谓主、谓宾事件词,三是表示事件关系的事件词,四是表示隐式关系的事件词。
进一步的,所述ROOT节点作事件词的类型中,若当前谓词为核心事件谓词,其右侧则与ROOT节点连接,核心事件谓词是指句子中充当述语的核心谓词。
进一步的,步骤S4中,实体结构包括实体内结构与实体外结构,实体内结构由句子中实体及其修饰性成分构成,由主宾语的中心语来充当;实体外结构承载该实体与其他实体或事件之间的关系,充当事件谓词的论元。
进一步的,所述语义表示方法具有可计算路径,通过构建单元、单元属性以及单元间关系来生成最终语义图或语义子图。主要包括以下几个步骤:
S11:输入文本进行网格初始化;
S12:利用组块依存模型对输入文本进行组块分析,并将分析结果添加到网格中;
S13:利用词典型数据表为网格单元添加与应用场景相关的属性信息;
S14:利用关系型数据表构建候选语义三元组;
S15:利用事件论元模型构建候选语义三元组;
S16:利用有限状态自动机、语言学规则和数据表为三元组构建特征集;
S17:利用多元特征决策模型对候选三元组进行打分,优选分数较高的三元组;
S18:根据应用需求,输出完整的语义表示图或其子图。
进一步的,所述事件结构是小句的核心,一个小句中有一个或多个核心事件谓词,当语义图用来表示段落或篇章的语言单位的语义时,段落或篇章中每个小句的根节点也看做一个事件谓词。
所述以事件为核心的语义表示方法,内容上可以将语义图分成事件结构与实体结构,进而对应将语义表示的内容抽象为单元、关系、属性三个方面,事件结构和实体结构是由单元、属性和关系组成,所述事件结构描述的是事件的属性以及它与其它词的语义关系,实体结构描述的则是实体的属性以及它与其他词的语义关系,单元包括事件词和实体词以及其它句子中出现过的词语(对应语义图中的节点),单元关系就是事件关系和实体关系(对应语义图中的边),通过构建单元、单元属性以及单元间关系的语义图,来实现机器对自然语言的理解。
附图说明
图1是所述语义图的抽象表示示意图;
图2是所述语义关系层级体系示意图;
图3是事件结构抽象表示示意图;
图4是所述语义表示示例1;
图5是所述语义表示示例2;
图6是所述语义表示示例3;
图7是所述语义表示示例4;
图8是所述语义表示示例5;
图9是所述语义表示示例6;
图10是所述语义表示示例7;
图11是所述语义表示示例8;
图12是实体结构抽象表示示意图;
图13是所述语义表示示例9;
图14是所述语义表示示例10;
图15是语义分析框架图;
图16是“我用毛笔画了一幅画”的语义图。
具体实施方式
为了使语义表示方法更具可解释性、可计算性、可应用性,本专利提供一种以事件为核心的语义表示方法,事件是人类理解现实世界的基本语义单元,且事件具有强的表达能力,以事件为中心进行语义表示,更符合人类对语言的普遍认知。
在自然语言理解的过程中,首先需要制定一个完善的语言语义表征方案,即本专利中的语义图表征方法;其次,需要围绕该表征方案设计计算路径和算法、准备计算所需语言知识;最后,通过计算框架对句子进行语义分析,生成句子对应的语义图,即语义分析。如图1所示的语义图的抽象表示示意图,为单根有向图,图中节点对应承载实体和事件的语言单元,边为有向边,可表示事件与实体、事件与事件、实体与实体之间的语义关系。图中有一个ROOT根节点,句子中的核心谓词与根节点连接,便于把握句子的核心语义信息。在图中,事件节点用圆角矩形来表示,这里将句子根节点看作一种特殊的事件词,也用圆角矩形表示,其他节点统一用方角矩形来表示。实体与实体、实体与事件、事件与事件之间的语义关系用有向边表示,有向边上标出关系标签或属性名,由被支配节点指向支配节点。
从形式来看,语义图主要由节点和边组成,节点表示句子中的词语或概念,边表示它们之间的关系;从内容来看,语义图主要由两部分构成:事件结构与实体结构。事件结构和实体结构分别对应谓词性成分和体词性成分在特定句法位置上的“语义功能”,即用事件结构表示谓词性成分的“陈述”功能,指对特定的过程、性质或状态进行断言;用实体结构来表示名词等体词性成分的“指称”功能,指特定的事物概念。事件结构是小句的核心,表示事件或状态的变化,一个小句中可以有一个或多个核心事件谓词,一般简单句中有一个核心事件谓词,而连谓、兼语句等复杂句中则有多个核心事件谓词;当语义图用来表示段落或篇章等更大的语言单位的语义时,每个小句的根节点也看做一个事件谓词;事件结构内部包含有论元信息、情态信息等内容。实体结构往往作为事件谓词的论元成分出现,不能单独存在,包括核心论元和非核心论元两种类型;同样的,实体结构内部也包含实体内关系部分,即实体的属性和属性值信息。事件结构包括事件词和其周边依存于事件词的词语,主要包括充当论元的词语、表示情态的词语以及其它事件词,它是以事件词为核心,事件词周边的其它节点与事件词之间的语义关系称之为事件关系。
如图2所示,本专利提供的以事件为核心的语义表示方法,以事件为核心定义了多层级的语义表示体系。从整体角度看,该语义图为承载事件实体信息的语义网络。本发明将句子语义分为事件关系和实体关系,事件关系又分为事件内语义关系和事件外语义关系,论元词和情态词与事件词之间的关系分别是论元关系和情态关系,是事件内语义关系,不同事件词之间的关系是事件外语义关系。
可见,事件内语义关系分为论元关系、情态关系,进一步的,论元关系又分为核心论元和边缘论元,事件外语义关系则是事件与事件之间的关系(对应下文的事件外结构);实体关系分为实体内关系和实体外关系,实体内关系包括实体的属性-属性值,实体外关系则是实体和实体之间的关系。
本方法能够对不同层级的语言单元的语义结构进行一致性表示。语言具有层次性,具有不同层级的语言单位,比如词、短语、句子、段落、篇章等。本方法不仅可以用事件结构和实体结构来表示句子一级的语义,也可表示更高层级语言单位的语义。具体来看,即将句内的语义内容表示成事件结构,重点用事件-论元结构、事件-情态结构表示语义,同时又将句子抽象为以根节点为核心的复杂事件,根节点之间也是事件关系,这样,一个或多个复杂事件构成段落语义,由此层层递进,可以将句内、句间、段落甚至篇章内的语义关系以事件为核心进行一致性的表示,这样篇章中的多个事件结构就形成了事件链,也符合人类理解语言时层层组装的认知过程。同时,在复句和篇章中,实体之间可以有多种关系,包括代词的指代关系、实体链接关系、属性宿主关系和整体部分关系等等。
一 事件结构
如图3所示,为事件结构的抽象表示,即以事件词作为事件结构的形式代表,句子中称为事件词,事件词在语义图中表示为节点,围绕事件词定义事件结构的核心构成要素,包括核心论元、边缘论元、情态以及事件关系等;事件词可以是显式的,也可以是隐式的,显式事件词一般在输入文本中有语言符号与之对应,直观地表达了语言中的核心语义;隐式事件词是人为定义的隐性事件类型,表达的语义信息更深入细致。
在语义表示图中,用圆角矩形来表示事件结构中的事件词,事件词周围用有向边关联与其相关的语义信息,其中,上、下、左方向表示的是事件内结构,是事件词的输入,右方向表示的是事件外结构,是事件词的输出。下文分别介绍事件词四个方向的语义内容。
1)核心论元
在事件结构中,左方向的输入一般为事件词的核心论元。核心论元通常指在句法上占据主/宾语位置,在语义上与事件直接相关的语义角色。谓词与核心论元之间的语义关系用A0、A1、A2来表示,边由核心论元指向事件谓词。如图4所示,下例中的双宾句表示为语义图之后:
eg:我送给他一束花。
2)边缘论元
在事件结构中,上方向的输入一般为该事件词的边缘论元信息,通常用介词、方位词等格标记引导。如下例,“毛笔”是“画”的边缘论元,用介词格标记“用”引入。如图5所示,语义图中,“毛笔”在事件谓词“画”上方表示。
eg:我用毛笔画了一幅画。
3)情态信息
在事件结构中,下方向的输入一般为该事件词的情态信息。表示时,以句法成分为单位,而不是以词语为单位。句法成分是语言学的基础概念,指的是句法结构的组成成分,包括主语、谓语、宾语等。如图6所示,“非常严厉”整体作为一个节点与事件谓词关联。
eg:警察非常严厉地打击了***行为。
4)事件外结构
在事件结构中,右方向充当其他事件词的输入,其它事件词有四种类型,一是ROOT节点作事件词,二是可以带谓主、谓宾事件词,三是表示事件关系的事件词,四是表示隐式关系的事件词。
①ROOT节点作事件词
若当前谓词为核心事件谓词,其右侧与ROOT节点连接。核心事件谓词是指句子中充当述语的核心谓词,如“我哭肿了眼睛”,这句话中有“哭”“肿”两个事件谓词,但核心事件谓词是“哭”,即“哭”这个事件节点需要与ROOT根节点连接,而“肿”这个事件节点不需要与根节点连接。这种表示方法更有利于我们掌握句子的主干信息。
eg:我哭肿了眼睛。
②带谓主、谓宾事件词
在图8中,“吃苹果”是“喜欢”的谓词性宾语,在语义图中,事件谓词“吃”充当核心事件谓词“喜欢”的核心论元。
eg:他喜欢吃苹果。
如图9所示,例句中,“打扫教室”是动宾结构,是“是”的谓词性主语,在语义图中,事件谓词“打扫”充当核心事件谓词“是”的核心论元。
eg:打扫教室是值日生的任务。
③表示事件关系的事件词
例句的前后小句存在转折关系,如图10所示的语义图中,“黑”和“发现”分别充当事件关系“转折”的输入。
eg:尽管天很黑,敌人还是被我们发现了。
④表示隐式关系的事件词
此外,如图11所示的语义图中定义了隐式事件词来表示一些特殊的关系,比如用“Ref”表示同指等,隐式事件词的输入可以是实体,也可以是事件。下例中,“紧张”右边充当“Ref”的输入,表示“现象”的具体内容。
eg:降价后的宝马已经出现货源紧张的现象。
二 实体结构
如图12所示,为实体结构的抽象语义表示图。实体结构包括实体内结构与实体外结构,实体内结构由句子中实体及其修饰性成分构成,实体外结构承载该实体与其他实体或事件之间的关系。与事件结构不同,实体结构只有下输入与右输出,下文分别介绍实体词两个方向的语义内容。
1)实体内关系
在实体结构中,下方向的输入一般为该实体词的属性信息,实体的属性信息除“时间、地点、数量”外,都标记为“mod”,不做细化。与事件结构相同,在语义图中以句法成分为单位进行表示,而不是以词语为单位。实体结构的核心节点一般由主宾语的中心语来充当。比如图13中的实体结构有两个:她们、漂亮的容颜,“她们”作为谓词的主体论元的核心节点,“容颜”作为谓词客体论元的核心节点。
eg:她们都有漂亮的容颜。
除此之外,需要注意以下几种特殊情况:
①含有谓词的专名作中心语的修饰语时,整体处理为实体节点,不将其内部动词、形容词作为事件谓词,如“外贸投资公司”。
②中心语为动词时,若是类似“法制建设”的NV搭配,则将中心语的动词看作实体,若是类似“这种情况的出现”的“……的V”搭配,则不将中心语的动词看作实体。
2)实体外关系
在实体结构中,右方向为实体词的输出,语义上一般充当事件谓词的论元,可以是核心论元,也可以是非核心论元。
例如图14中,“我”与“花”分别充当事件谓词“喜欢”的核心论元。
eg:我喜欢玫瑰花。
三 可计算路径
本方法提供的语义表示方法具有可计算路径。语义表示是语义分析的起点,也是终点,也就是说首先需要有语义表示方案,然后根据该方案确定计算路径,最后分析生成的结果也要与语义表示的内容保持一致,这样一个好的语义表示方法必须具有可计算路径,才能在实际应用中,通过对语料进行语义分析得到相应的语义表示结果,基于分析结果,为后续的任务提供丰富的知识。本专利设计了以符号计算为中心的组合策略进行语义分析,可以得到基于上述语义表示方案的语义图,整体分析框架如图15所示。其中,符号计算指的是与目前主流的深度学习相对的一种方法,以符号表示和语言知识计算为主的***。
该分析方法以符号计算为中心,且在分析过程中利用了大量语言知识,具有更好的可解释性和可控性。同时,语义分析是一个复杂任务,该分析方法采取分而治之的策略,将这一复杂任务按照语义表示的层次体系分解为多个子问题,综合利用符号计算与参数计算各自的优势,且可在具体应用场景下,对各个子问题定向定制研发方案,使得整个分析过程具有更好的鲁棒性。
具体来看,上述语义表示方案将句子表示的语义内容抽象为单元、关系、属性三个方面,可计算路径是生成语义图的计算方法,语义图是以节点和边组成,每个节点有自己的内容,也就是单元、关系和属性,故本专利提供的语义分析方法通过构建单元、单元属性以及单元间关系来生成最终语义图或语义子图。主要包括以下几个步骤:
S1:输入文本进行网格初始化;
S2:利用组块依存模型对输入文本进行组块分析,并将分析结果添加到网格中;
S3:利用词典型数据表为网格单元添加与应用场景相关的属性信息;
S4:利用关系型数据表构建候选语义三元组;
S5:利用事件论元模型构建候选语义三元组;
S6:利用有限状态自动机、语言学规则和数据表为三元组构建特征集;
S7:利用多元特征决策模型对候选三元组进行打分,优选分数较高的三元组;
S8:根据应用需求,输出完整的语义表示图或其子图。
具体地,步骤S1、S2属于构建语言单元,步骤S3属于为语言单元添加属性信息,步骤S4-S8属于构建语言单元之间的关系,其中步骤S4、S5是为语言单元构建所有可能的关系集合,步骤S6是为候选关系构建关系特征,步骤S7利用步骤S6中构建的特征通过模型进行关系择优,最终确定两个语言单元之间的最优关系类型,并输出语义图。
本专利提供的语义表示方法在应用方面具有高覆盖面和强针对性的特点。一方面,该方法中的实体结构和事件结构,能够与目前主流的知识图谱和事理图谱对接,即可以对语篇或段落进行语义分析生成本方法中的语义表示图,在此基础上进行推理,得到相应的知识图谱和事件链,当对大批量领域数据进行语义分析时,也可得到领域本体图谱与事理图谱。同时本方法中语义表示图也可以为其他下游应用提供基础,比如实体关系抽取、情感分析等。另一方面,汉语是一种高度意合的分析型语言,对语境依赖较强,语义关系的表达与衔接缺乏显式标记。同时,汉语语序灵活,同样的语义内容可由不同的语言形式表达。以往事先制定详细复杂语义体系的方法,不但需要耗费大量的人力物力,而且不能很好地与应用对接。因此,本方法在语义表示时只给出粗粒度的语义关系,不对其进行细致地分类,在具体应用场景中再根据实际需求对其细化,使得在应用中更为便捷、高效。
四 实施例
如图16所示,是“我用毛笔画了一幅画”的语义图,以此为例进行语义表示方法的具体说明。
首先确定事件结构的核心,即事件节点;本方法是以事件为核心进行语义表示的,故首先确定语义图中的事件结构,而事件词是事件结构的核心,故先确定事件节点。这里的事件节点即图中的“ROOT”“画”两个节点,其中“ROOT”表示句子的根节点,“画”是句子中出现的事件词;
确定事件结构中事件节点周边的核心要素,即核心论元、边缘论元、属性信息。“ROOT”节点表示句子的根节点,无须填充这些信息。“画”是句子中事件词,根据句子可知,其有自己的核心论元、边缘论元和情态信息。方角矩形节点“我”“画”是实体节点,充当事件词“画”的核心论元,方角矩形节点“毛笔”充当事件词“画”的边缘论元,方角矩形节点“了”为事件词节点的情态信息。
确定事件节点与其核心要素之间的语义关系。事件节点是事件词,围绕事件词定义事件结构的核心要素,包括核心论元、边缘论元、情态以及事件关系等。语义关系在图中以有向弧的形式进行表示,由依存节点指向被依存节点,语义关系的具体类别在弧上进行说明。在该示例中,“我”“画”分别与事件词“画”分别是论元关系A0(主体)、A1(客体),即“我”是“画”的主体,实体“画”是“画”的客体;“毛笔”与“画”是论元关系“工具”,即毛笔是画的工具;“了”是“画”的属性信息,具体表示完成的时态信息,以有向弧指向事件词节点。
确定实体结构的属性信息。在该示例中,方角矩形节点“画”为实体节点,同时有自己的属性结构,节点“一幅”为“画”的属性信息,具体为表示“画”这一实体的数量,以有向弧指向事件词节点。
本方法将句子表示为事件结构和实体结构,将句间、段落甚至篇章内的语义关系也以事件为核心进行了一致性的表示,符合人类理解语言的认知过程,而且在构建语言单元关系时采用两步走策略,即在通用表示中只对语义关系粗分类,落地应用时再结合场景进行关系细化,既减少了语义表示的难度,与应用对接也更加直接便捷。同时,将语义分析这一复杂任务简单化,抽象为确定语言单元、构建语言单元属性和语言单元间关系三个步骤,整体采用以符号计算为中心的专家***,由它接收输入、输出结果,在计算过程中调度各个参数计算模型和语言知识模块,协同完成任务,分析过程具有更好的可控性、可解释性。该方法将大数据与专家知识相结合,利用符号计算和参数计算各自的优势来完成不同任务,同时各个模块以协同的方式来为决策模型提供语义关系的多源特征,避免了错误级联的问题。

Claims (10)

1.一种以事件为核心的语义表示方法,包括以下步骤:
S1:确定语义图中的事件结构与实体结构,事件结构和实体结构分别对应谓词性成分和体词性成分在句法位置上的语义功能,用事件结构表示谓词性成分的陈述功能,对特定的过程、性质或状态进行断言;用实体结构表示名词等体词性成分的指称功能,指特定的事物概念;
S2:所述事件结构通过事件词作为形式代表,事件词对应的核心要素包括核心论元、边缘论元、属性信息;
S3:确定事件节点与其核心要素之间的语义关系,语义关系的具体类别在弧上进行说明;
S4:确定实体结构的属性信息,以有向弧指向事件节点。
2.根据权利要求1所述的以事件为核心的语义表示方法,其特征在于:步骤S1中,所述语义图为单根有向图,设置有一个ROOT根节点,句子中的核心谓词与根节点连接,节点对应承载实体和事件的语言单元,边为有向边,表示事件与实体、事件与事件、实体与实体之间的语义关系,有向边上标出关系标签或属性名,由被支配节点指向支配节点。
3.根据权利要求1所述的以事件为核心的语义表示方法,其特征在于:步骤S2中,在事件结构中,所述核心论元指在句法上占据主/宾语位置,在语义上与事件直接相关的语义角色,事件词的核心论元采用左方向的输入。
4.根据权利要求1所述的以事件为核心的语义表示方法,其特征在于:步骤S2中,在事件结构中,所述边缘论元信息用介词、方位词格标记引导,事件词的边缘论元采用上方向的输入。
5.根据权利要求1所述的以事件为核心的语义表示方法,其特征在于:步骤S2中,在事件结构中,所述情态信息以句法成分为单位,事件词的情态信息采用下方向的输入。
6.根据权利要求1所述的以事件为核心的语义表示方法,其特征在于:步骤S2中,在事件结构中,还包括事件词的事件外结构,采用右方向的输出,所述事件外结构是指当前事件词充当其他事件词的输入,其它事件词有四种类型,一是ROOT节点作事件词,二是能够带谓主、谓宾的事件词,三是表示事件关系的事件词,四是表示隐式关系的事件词。
7.根据权利要求6所述的以事件为核心的语义表示方法,其特征在于:所述ROOT节点作事件词的类型中,若当前谓词为核心事件谓词,其右侧则与ROOT节点连接,核心事件谓词是指句子中充当述语的核心谓词。
8.根据权利要求1所述的以事件为核心的语义表示方法,其特征在于:步骤S4中,实体结构包括实体内结构与实体外结构,实体内结构由句子中实体及其修饰性成分构成,由主宾语的中心语来充当;实体外结构承载该实体与其他实体或事件之间的关系,充当事件谓词的论元。
9.根据权利要求1所述的以事件为核心的语义表示方法,其特征在于:所述语义表示方法具有可计算路径,通过构建单元、单元属性以及单元间关系来生成最终语义图或语义子图。主要包括以下几个步骤:
S11:输入文本进行网格初始化;
S12:利用组块依存模型对输入文本进行组块分析,并将分析结果添加到网格中;
S13:利用词典型数据表为网格单元添加与应用场景相关的属性信息;
S14:利用关系型数据表构建候选语义三元组;
S15:利用事件论元模型构建候选语义三元组;
S16:利用有限状态自动机、语言学规则和数据表为三元组构建特征集;
S17:利用多元特征决策模型对候选三元组进行打分,优选分数较高的三元组;
S18:根据应用需求,输出完整的语义表示图或其子图。
10.根据权利要求1所述的以事件为核心的语义表示方法,其特征在于:所述事件结构是小句的核心,一个小句中有一个或多个核心事件谓词,当语义图用来表示段落或篇章的语言单位的语义时,段落或篇章中每个小句的根节点也看做一个事件谓词。
CN202211156388.5A 2022-09-19 2022-09-19 一种以事件为核心的语义表示方法 Pending CN115438673A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211156388.5A CN115438673A (zh) 2022-09-19 2022-09-19 一种以事件为核心的语义表示方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211156388.5A CN115438673A (zh) 2022-09-19 2022-09-19 一种以事件为核心的语义表示方法

Publications (1)

Publication Number Publication Date
CN115438673A true CN115438673A (zh) 2022-12-06

Family

ID=84248703

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211156388.5A Pending CN115438673A (zh) 2022-09-19 2022-09-19 一种以事件为核心的语义表示方法

Country Status (1)

Country Link
CN (1) CN115438673A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116719974A (zh) * 2023-08-11 2023-09-08 江西财经大学 基于依存关系结构增强的事件检测方法及***

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116719974A (zh) * 2023-08-11 2023-09-08 江西财经大学 基于依存关系结构增强的事件检测方法及***
CN116719974B (zh) * 2023-08-11 2023-10-31 江西财经大学 基于依存关系结构增强的事件检测方法及***

Similar Documents

Publication Publication Date Title
Cimiano et al. Towards portable natural language interfaces to knowledge bases–The case of the ORAKEL system
Shamsfard et al. The state of the art in ontology learning: a framework for comparison
Valente Types and roles of legal ontologies
Paredes-Valverde et al. ONLI: an ontology-based system for querying DBpedia using natural language paradigm
Kremer Visual languages for knowledge representation
Cuteri et al. A logic-based question answering system for cultural heritage
Francisco et al. Ontological reasoning for improving the treatment of emotions in text
CN115438673A (zh) 一种以事件为核心的语义表示方法
Pasin et al. Ontological requirements for annotation and navigation of philosophical resources
Huang et al. Explanation generation for a math word problem solver
Pavlic et al. Adjective representation with the method Nodes of Knowledge
Rohil et al. Natural language interfaces to domain specific knowledge bases: an illustration for querying elements of the periodic table
Di Maro et al. Graph databases for designing high-performance speech recognition grammars
Spiliopoulou et al. Coupling information extraction and data mining for ontology learning in PARMENIDES
González et al. Semantic representations for knowledge modelling of a Natural Language Interface to Databases using ontologies
Arbizu Extracting knowledge from documents to construct concept maps
Mukanova et al. Applying the Ontological Approach to Electronic Guide Development
Xiao Research on the Comparison between Human Computer Translation Based on Neural Network Algorithm and Traditional Translation
Paredes-Valverde et al. A natural language interface to ontology-based knowledge bases
Kulkarni et al. Computational Intelligence Model for Code Generation from Natural Language Problem Statement
Panesar An evaluation of a linguistically motivated conversational software agent framework
Zárate et al. A portable natural language interface for diverse databases using ontologies
Sithole et al. Towards the Internet of Things Patterns Dictionary
Svátek et al. Adapting ontologies to best-practice artifacts using transformation patterns: Method, implementation and use cases
Zeng et al. Combining Syntactic Information Enhancement and Graph Convolutional Network for Aspect-level Sentiment Analysis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination