CN106445990A - 事件本体构建方法 - Google Patents
事件本体构建方法 Download PDFInfo
- Publication number
- CN106445990A CN106445990A CN201610470527.XA CN201610470527A CN106445990A CN 106445990 A CN106445990 A CN 106445990A CN 201610470527 A CN201610470527 A CN 201610470527A CN 106445990 A CN106445990 A CN 106445990A
- Authority
- CN
- China
- Prior art keywords
- event
- relation
- ontology
- class
- classification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Abstract
本发明涉及一种事件本体构建方法。本方法主要包括以下几个步骤:(1) 获取相关领域的文档,(2) 构建CEC语料库,(3) 通过学习语料库,从文本中抽取事件以及事件各要素,(4) 事件类分类以及非分类关系的抽取,(5) 从归纳得到的事件类、事件类要素、事件类关系,抽象得到其形式化的描述语言,(6) 实现基于事件本体的事件分类关系推理。本发明克服传统本体难以表示动态知识的缺陷,不仅适合于表示静态知识,而且适合于表示动态知识,降低本体中非分类关系的繁杂性,为计算文本语义提供了有效的支持。
Description
技术领域
本发明属于自然语言处理领域,涉及一种事件本体的构建方法,具体地说是一种事件本体的体系结构和构建的建模方法。
背景技术
目前本体最流行的定义是Studer在Knowledge engineer,principles andmethors(该文作者是R.Studer,V.R.Benjamins,D.Fensel,发表在1998年出版的期刊:Dataand Knowledge Engineerings第25卷161页到197页)中给出的“共享概念模型的明确的形式化规范说明”,且很多人接受本体是某些应用领域的概念以及概念间关系的预先定义形式。所以,大部分本体被构造成概念和概念之间关系的***。更直接的,来自语言学领域的研究者,很自然地构造出词汇与词汇之间关联的***,例如WordNet、HowNet。
传统本体体系结构能够较好地反映客观世界中静态事物的存在规律,特别是事物的分类与非分类关系,但也存在着明显的不足:(1)传统本体以概念层次结构为主线来组织,因而使得其中的非分类关系异常复杂。(2)传统本体定义为概念以及它们之间的关系,而概念定义为具有共同属性的对象的集合,对象由属性表示,这对于表示静态概念的方法是合适的。但事件是动态的,是状态变化的。在传统本体中,事件只是作为概念的一类或关系的一类。用表示概念的方法表示事件类,忽视了事件类的动态特性。而用表示关系的方法表示事件类,不仅忽略了其动态特性,也忽略了事件的其它要素。
发明内容
本发明的目的在于克服以上所述现有技术存在的问题和不足,提供一种事件本体构建方法,不仅可以方便地表示事件类的静态概念,而且适合表示动态概念,并且提高表达能力和降低了非分类关系的繁杂性。
为了达到上述目的,本发明的构思是:
事件本体的体系结构在于以事件类的层次结构为主线进行组织基于事件的知识,具体定义如下:
图1是本发明中事件本体的体系结构图
参照图1,本发明中的事件本体的体系结构定义如下:
事件类层次结构:事件类之间按照分类关系可以构成一个格结构,是事件类层次结构的严格形式。格的节点是事件类。另外,事件类之间还存在非分类关系。
对象概念层次结构:每个事件类中的对象中的各个角色都有其所属概念和数量,这些概念按照分类关系构成概念格,这个概念格称为对象概念格。概念之间还存在非分类关系。
工具概念层次结构:事件类的动作要素中可能涉及所使用的工具类,全部事件类的工具类按照分类关系构成工具概念格。工具类之间还存在非分类关系。
方式方法概念层次结构:方式方法概念层次结构与工具概念层次结构形式类似。
组成流程图:复杂事件类由多个成员事件类组成,组成关系分为跟随、伴随、并发、选择、循环等,成员事件类和这些组成关系构成组成流程图。
时间区间粒度概念层次结构:每个事件类中的时间要素要描述这个事件类的时间区间粒度,这个粒度是时间区间粒度格中的一个节点。
环境概念层次结构:每个事件类的发生都会有特定的环境概念,例如交通事故类一般发生在公共道路上。与对象概念类似,这些环境概念依据它们自身的范围包含关系,组成了一个环境概念的格结构,称为环境概念格。每个事件类的环境要素对应这个格的一个节点。环境概念之间同样存在非分类关系。
事件类(Event Class):指具有共同特征的事件的集合,用EC表示:
EC=(E,A,O,T,V,P,L)
其中,E是事件的集合,A,O,T,V,P,L称为事件类要素,分别是E中的每个事件在对应要素(参看下面事件定义)上具有的共同特性的集合。六要素的形式化定义参照表1。
表1
事件(Event):在某个特定的时候和环境下发生的、由若干角色参与、表现出若干动作特征的一件事情。形式上,事件可表示为e,定义为一个六元组:
e=(a,o,t,v,p,l)
其中,事件六元组中的元素称为事件要素,分别表示动作、对象、时间、环境、断言、语言表现。a(动作):事件的变化过程及其特征,是对程度、方式、方法、工具等的描述。o(对象):事件的参与对象,它是参与者集合,包括参与事件的所有角色,这些角色的数目称为对象序列长度。对象可以分别是动作的施动者(主体)和受动者(客体)。t(时间):事件发生的时间段,从事件发生的起点到事件结束的终点,分为绝对时间段和相对时间段两类。v(环境):事件发生的场所及其特征等。p(断言):由事件发生的持久断言、前置断言、中间断言以及后置断言构成。持久断言是指事件期间各要素始终满足的条件;前置断言指为进行该事件,各要素应当或可能满足的约束条件,它们可以是事件发生的触发条件;中间断言指事件发生过程的中间状态各要素满足的条件;后置断言指在事件发生后事件各要素满足的条件。L(语言表现):事件的语言表现规律,包括核心词集合、核心词表现、关键词搭配、各要素称谓等。核心词是描述事件的句子中常用的标志性词汇。核心词表现是指在句子中各要素的表示与核心词之间的位置关系。核心词搭配是指核心词与其他词汇的固有的搭配。事件可以有不同语言种类的表现,例如中文、英文、法文等等。
根据上述发明构思,本发明采用下述技术方案。
一种事件本体构建方法,主要包括以下几个步骤;
(1)获取相关领域的文档。
A.选择中文突发事件领域新闻文本作为研究内容。
B.通过人工的方式在人民网、新浪、搜狐三家网站挑选上述领域的新闻文本。
C.去除相关HTML文本中的标记,只保留标题和正文内容,并且用XML格式进行描述。
(2)构建CEC语料库。
A.通过上海大学语义智能实验室开发的事件本体语料标注工具Event Annotator对领域文档进行半自动标注。
B.通过与相关领域专家进行合作,对半自动标注的文档进行手工调整,最终形成有较高权威性和专业性的标注文档。
C.将标注好的文档汇总形成CEC语料库。
(3)通过学习语料库,从文本中抽取事件以及事件各要素。
A.对标注的语料中的事件以及各要素的特征进行统计分析,这些特征主要包括单词特征、构词特征、关键词特征、上下文特征、词性特征、词典特征、语法特征、位置特征、词频特征、语义特征。
B.通过统计结果构建事件以及相关要素的特征映射表,表的键为要素字符,值为二进制特征向量。
C.通过对训练语料中的事件以及相关要素进行深度学习分类训练,生成稳定的识别网络,最后对测试语料中文档中的事件及其要素进行识别。
D.根据事件及相关要素的定义,对识别结果进行人工修改。
(4)事件类分类以及非分类关系的抽取。
A.给出事件类关系作出详细的定义。
B.分类关系:两个事件类,如果它们外延存在包含关系,则它们的内涵必定存在反向包含关系。我们说它们之间存在继承关系,又称分类关系。外延大的是被继承者,称为父类,小的是继承者,称为子类。
C.事件之间可以存在许多类非分类关系。定义如下表所示。
表2:事件非分类关系
D.根据事件类的分类以及非分类关系的定义,制定事件关系的抽取规则,并且实现自动化的抽取及标注。
E.通过人工的方式对自动标注的结果进行更正,并对所有的事件关系的标注展开专家座谈讨论,确定最终的抽取结果。
(5)从归纳得到的事件类、事件类要素、事件类关系,抽象得到其形式化的描述语言。
A.通过对现有的形式化语言如描述逻辑、Z语言等进行综合分析,最终确定使用描述逻辑作为事件本体的形式化描述基础。
B.通过定义事件本体的关键字将基于语义文本描述的事件相关要素转为基于关键字描述。
C.对已有语料中的事件类、事件要素和事件关系进行形式化描述,并且以XML文档的格式存入事件本体中。
(6)实现基于事件本体的事件分类关系推理。
A.首先需要对事件本体中的基于XML描述的候选事件及其要素进行形式化的描述,形式化的描述语言EO-SROIQ。
B.两个事件之间是否为分类关系,可以通过基于Tableau算法的实例检测在事件本体中找到相关的事件类,并通过事件类之间的关系进行推理,如果两者在事件本体中找到对应的事件类,那么两者之间的事件关系就可以用事件本体中的事件类之间关系表示。
C.如果两个事件类之间没有在事件本体中有对应的事件类,那么就需要通过事件要素来综合分析两者之间是否有分类关系。在同领域的不同事件中,事件的要素在事件中的权重基本相同;但同一个事件中,不同的要素权重不同。通过对相关元素之间的关系进行分析,综合给出事件关系的评价。从而判断两个事件的分类关系。
本发明的事件本体的体系结构和构建方法与现有技术相比较,具有以下显而易见的突出实质性特点和显著技术进步:本发明的事件本体体系结构以事件为知识的基本单元,更适合表示动态知识;以事件类的层次结构为主线组织知识,使知识结构更加清晰,且降低了该事件类间非分类关系的繁杂性。同时该体系结构可以实现基本的推理功能。
附图说明
图1是事件本体结构示意图。
图2是事件本体的构建程序框图。
具体实施方式
本发明的优选实施例结合附图详述如下:
实施例一:
参见图1和图2,本事件本体的构建方法主要包括以下几个步骤:
(1)获取相关领域的文档,
(2)构建CEC语料库,
(3)通过学习语料库,从文本中抽取事件以及事件各要素,
(4)事件类分类以及非分类关系的抽取,
(5)从归纳得到的事件类、事件类要素、事件类关系,抽象得到其形式化的描述语言,
(6)实现基于事件本体的事件分类关系推理。
实施例二:
本实施例与实施例一基本相同,特别之处如下:
(1)获取相关领域的文档:
(1-1).选择中文突发事件领域的新闻文本作为研究内容;
(1-2).通过人工的方式在网站挑选上述领域的新闻文本,其中地震63篇、火灾75篇、交通事故85篇、食物中毒61篇、恐怖袭击49篇,总共333篇文章;
(1-3).去除相关HTML文本中的标记,只保留标题和正文内容,并且用XML格式进行描述。
(2)构建CEC语料库:
(2-1).通过上海大学语义智能实验室开发的事件本体语料标注工具Event Annotator对领域文档进行半自动标注;
(2-2).通过与相关领域专家进行合作,对半自动标注的文档进行手工调整,最终形成有较高权威性和专业性的标注文档;
(2-3).将标注好的文档汇总形成CEC语料库。
(3)通过学习语料库,从文本中抽取事件以及事件各要素:
(3-1).对标注的语料中的事件以及各要素的特征进行统计分析,这些特征主要包括单词特征、构词特征、关键词特征、上下文特征、词性特征、词典特征、语法特征、位置特征、词频特征、语义特征;
(3-2).通过统计结果构建事件以及相关要素的特征映射表,表的键为要素字符,值为二进制特征向量;
(3-3).通过对训练语料中的事件以及相关要素进行深度学习分类训练,生成稳定的识别网络,最后对测试语料中文档中的事件及其要素进行识别;
(3-4).根据事件及相关要素的定义,对识别结果进行人工修改。
(4)事件类分类以及非分类关系的抽取:
(4-1).给出事件类关系作出详细的定义;
(4-2).分类关系:两个事件类,如果它们外延存在包含关系,则它们的内涵必定存在反向包含关系;它们之间存在继承关系,又称分类关系;外延大的是被继承者,称为父类,小的是继承者,称为子类;
(4-3).事件之间存在许多类非分类关系,定义如下表所示:
表2:事件非分类关系
(4-4).根据事件类的分类以及非分类关系的定义,制定事件关系的抽取规则,并且实现自动化的抽取及标注;
(4-5).通过人工的方式对自动标注的结果进行更正,并对所有的事件关系的标注展开专家座谈讨论,确定最终的抽取结果。
(5)从归纳得到的事件类、事件类要素、事件类关系,抽象得到其形式化的描述语言:
(5-1).通过对现有的形式化语言如描述逻辑、Z语言等进行综合分析,最终确定使用描述逻辑作为事件本体的形式化描述基础;
(5-2).通过定义事件本体的关键字将基于语义文本描述的事件相关要素转为基于关键字描述;
(5-3).对已有语料中的事件类、事件要素和事件关系进行形式化描述,并且以XML文档的格式存入事件本体中。
(6)实现基于事件本体的事件分类关系推理:
(6-1).首先需要对事件本体中的基于XML描述的候选事件及其要素进行形式化的描述,形式化的描述语言EO-SROIQ;
(6-2).两个事件之间是否为分类关系,通过基于Tableau算法的实例检测在事件本体中找到相关的事件类,并通过事件类之间的关系进行推理,如果两者在事件本体中找到对应的事件类,那么两者之间的事件关系就用事件本体中的事件类之间关系表示;
(6-3).如果两个事件类之间没有在事件本体中有对应的事件类,那么就需要通过事件要素来综合分析两者之间是否有分类关系;在同领域的不同事件中,事件的要素在事件中的权重基本相同;但同一个事件中,不同的要素权重不同,通过对相关元素之间的关系进行分析,综合给出事件关系的评价,从而判断两个事件的分类关系。
Claims (7)
1.事件本体构建方法,根据事件本体体系结构特点,概括事件本体的构建方法主要包括以下几个步骤:
获取相关领域的文档,
构建CEC语料库,
通过学习语料库,从文本中抽取事件以及事件各要素,
事件类分类以及非分类关系的抽取,
从归纳得到的事件类、事件类要素、事件类关系,抽象得到其形式化的描述语言,
实现基于事件本体的事件分类关系推理。
2.根据权利要求1所述的事件本体构建方法,其特征在于所述步骤:
(1)获取相关领域的文档:
(1-1).选择中文突发事件领域的新闻文本作为研究内容;
(1-2).通过人工的方式在网站挑选上述领域的新闻文本;
(1-3).去除相关HTML文本中的标记,只保留标题和正文内容,并且用XML格式进行描述。
3.根据权利要求1所述的事件本体构建方法,其特征在于所述步骤:
(2)构建CEC语料库:
(2-1).通过语义智能实验室开发的事件本体语料标注工具Event Annotator对领域文档进行半自动标注;
(2-2).通过与相关领域专家进行合作,对半自动标注的文档进行手工调整,最终形成有较高权威性和专业性的标注文档;
(2-3).将标注好的文档汇总形成CEC语料库。
4.根据权利要求1所述的事件本体构建方法,其特征在于所述步骤:
(3)通过学习语料库,从文本中抽取事件以及事件各要素:
(3-1).对标注的语料中的事件以及各要素的特征进行统计分析,这些特征主要包括单词特征、构词特征、关键词特征、上下文特征、词性特征、词典特征、语法特征、位置特征、词频特征、语义特征;
(3-2).通过统计结果构建事件以及相关要素的特征映射表,表的键为要素字符,值为二进制特征向量;
(3-3).通过对训练语料中的事件以及相关要素进行深度学习分类训练,生成稳定的识别网络,最后对测试语料中文档中的事件及其要素进行识别;
(3-4).根据事件及相关要素的定义,对识别结果进行人工修改。
5.根据权利要求1所述的事件本体构建方法,其特征在于所述步骤:
事件类分类以及非分类关系的抽取:
(4-1).给出事件类关系作出详细的定义;
(4-2).分类关系:两个事件类,如果它们外延存在包含关系,则它们的内涵必定存在反向包含关系;它们之间存在继承关系,又称分类关系;外延大的是被继承者,称为父类,小的是继承者,称为子类;
(4-3).事件之间存在许多类非分类关系,定义如下表所示:
表1:事件非分类关系
(4-4).根据事件类的分类以及非分类关系的定义,制定事件关系的抽取规则,并且实现自动化的抽取及标注;
(4-5).通过人工的方式对自动标注的结果进行更正,并对所有的事件关系的标注展开专家座谈讨论,确定最终的抽取结果。
6.根据权利要求1所述的事件本体构建方法,其特征在于所述步骤:
从归纳得到的事件类、事件类要素、事件类关系,抽象得到其形式化的描述语言:
(5-1).通过对现有的形式化语言如描述逻辑、Z语言等进行综合分析,最终确定使用描述逻辑作为事件本体的形式化描述基础;
(5-2).通过定义事件本体的关键字将基于语义文本描述的事件相关要素转为基于关键字描述;
(5-3).对已有语料中的事件类、事件要素和事件关系进行形式化描述,并且以XML文档的格式存入事件本体中。
7.根据权利要求1所述的事件本体构建方法,其特征在于所述步骤:
(6)实现基于事件本体的事件分类关系推理:
(6-1).首先需要对事件本体中的基于XML描述的候选事件及其要素进行形式化的描述,形式化的描述语言EO-SROIQ;
(6-2).两个事件之间是否为分类关系,通过基于Tableau算法的实例检测在事件本体中找到相关的事件类,并通过事件类之间的关系进行推理,如果两者在事件本体中找到对应的事件类,那么两者之间的事件关系就用事件本体中的事件类之间关系表示;
(6-3).如果两个事件类之间没有在事件本体中有对应的事件类,那么就需要通过事件要素来综合分析两者之间是否有分类关系;在同领域的不同事件中,事件的要素在事件中的权重基本相同;但同一个事件中,不同的要素权重不同,通过对相关元素之间的关系进行分析,综合给出事件关系的评价,从而判断两个事件的分类关系。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610470527.XA CN106445990B (zh) | 2016-06-25 | 2016-06-25 | 事件本体构建方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610470527.XA CN106445990B (zh) | 2016-06-25 | 2016-06-25 | 事件本体构建方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106445990A true CN106445990A (zh) | 2017-02-22 |
CN106445990B CN106445990B (zh) | 2019-10-11 |
Family
ID=58183691
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610470527.XA Expired - Fee Related CN106445990B (zh) | 2016-06-25 | 2016-06-25 | 事件本体构建方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106445990B (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107392811A (zh) * | 2017-09-01 | 2017-11-24 | 安徽教育网络出版有限公司 | 一种面向教育出版领域的本体构建方法 |
CN107480137A (zh) * | 2017-08-10 | 2017-12-15 | 北京亚鸿世纪科技发展有限公司 | 用语义迭代提取网络突发事件并识别外延事件关系的方法 |
CN108170709A (zh) * | 2017-11-27 | 2018-06-15 | 上海精密计量测试研究所 | 事件格生成方法 |
CN109033200A (zh) * | 2018-06-29 | 2018-12-18 | 北京百度网讯科技有限公司 | 事件抽取的方法、装置、设备及计算机可读介质 |
CN109409523A (zh) * | 2018-10-10 | 2019-03-01 | 上海精密计量测试研究所 | 事件实例与事件类之间关系的判定方法 |
CN109635272A (zh) * | 2018-10-24 | 2019-04-16 | 中国电子科技集团公司第二十八研究所 | 一种空中交通管理领域的本体交互模型构建方法 |
CN110717034A (zh) * | 2018-06-26 | 2020-01-21 | 杭州海康威视数字技术股份有限公司 | 一种本体构建方法及装置 |
WO2020108641A1 (zh) * | 2018-11-30 | 2020-06-04 | 杭州海康威视数字技术股份有限公司 | 本体建立方法、装置及存储介质 |
CN111414482A (zh) * | 2020-03-20 | 2020-07-14 | 北京百度网讯科技有限公司 | 一种事件论元抽取方法、装置以及电子设备 |
CN111985152A (zh) * | 2020-07-28 | 2020-11-24 | 浙江大学 | 一种基于二分超球面原型网络的事件分类方法 |
CN113168416A (zh) * | 2018-11-29 | 2021-07-23 | 皇家飞利浦有限公司 | 用于根据通用领域语料库来创建领域特异性训练语料库的方法和*** |
CN113158681A (zh) * | 2021-03-24 | 2021-07-23 | 鹏城实验室 | 突发事件本体模型构建方法、装置、设备及存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101782897A (zh) * | 2010-03-17 | 2010-07-21 | 上海大学 | 基于事件的中文语料标注方法 |
CN101957812A (zh) * | 2010-09-21 | 2011-01-26 | 上海大学 | 基于事件本体的动词语义信息提取方法 |
-
2016
- 2016-06-25 CN CN201610470527.XA patent/CN106445990B/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101782897A (zh) * | 2010-03-17 | 2010-07-21 | 上海大学 | 基于事件的中文语料标注方法 |
CN101957812A (zh) * | 2010-09-21 | 2011-01-26 | 上海大学 | 基于事件本体的动词语义信息提取方法 |
Non-Patent Citations (2)
Title |
---|
仲兆满 等: "事件本体模型及事件类排序", 《北京大学学报(自然科学版)》 * |
刘宗田 等: "面向事件的本体研究", 《计算机科学》 * |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107480137A (zh) * | 2017-08-10 | 2017-12-15 | 北京亚鸿世纪科技发展有限公司 | 用语义迭代提取网络突发事件并识别外延事件关系的方法 |
CN107392811A (zh) * | 2017-09-01 | 2017-11-24 | 安徽教育网络出版有限公司 | 一种面向教育出版领域的本体构建方法 |
CN108170709A (zh) * | 2017-11-27 | 2018-06-15 | 上海精密计量测试研究所 | 事件格生成方法 |
CN110717034A (zh) * | 2018-06-26 | 2020-01-21 | 杭州海康威视数字技术股份有限公司 | 一种本体构建方法及装置 |
CN109033200B (zh) * | 2018-06-29 | 2021-03-02 | 北京百度网讯科技有限公司 | 事件抽取的方法、装置、设备及计算机可读介质 |
CN109033200A (zh) * | 2018-06-29 | 2018-12-18 | 北京百度网讯科技有限公司 | 事件抽取的方法、装置、设备及计算机可读介质 |
CN109409523A (zh) * | 2018-10-10 | 2019-03-01 | 上海精密计量测试研究所 | 事件实例与事件类之间关系的判定方法 |
CN109635272A (zh) * | 2018-10-24 | 2019-04-16 | 中国电子科技集团公司第二十八研究所 | 一种空中交通管理领域的本体交互模型构建方法 |
CN113168416A (zh) * | 2018-11-29 | 2021-07-23 | 皇家飞利浦有限公司 | 用于根据通用领域语料库来创建领域特异性训练语料库的方法和*** |
CN111259161A (zh) * | 2018-11-30 | 2020-06-09 | 杭州海康威视数字技术股份有限公司 | 本体建立方法、装置及存储介质 |
WO2020108641A1 (zh) * | 2018-11-30 | 2020-06-04 | 杭州海康威视数字技术股份有限公司 | 本体建立方法、装置及存储介质 |
CN111259161B (zh) * | 2018-11-30 | 2022-02-08 | 杭州海康威视数字技术股份有限公司 | 本体建立方法、装置及存储介质 |
CN111414482A (zh) * | 2020-03-20 | 2020-07-14 | 北京百度网讯科技有限公司 | 一种事件论元抽取方法、装置以及电子设备 |
US11880397B2 (en) | 2020-03-20 | 2024-01-23 | Beijing Baidu Netcom Science Technology Co., Ltd. | Event argument extraction method, event argument extraction apparatus and electronic device |
CN111414482B (zh) * | 2020-03-20 | 2024-02-20 | 北京百度网讯科技有限公司 | 一种事件论元抽取方法、装置以及电子设备 |
CN111985152A (zh) * | 2020-07-28 | 2020-11-24 | 浙江大学 | 一种基于二分超球面原型网络的事件分类方法 |
CN111985152B (zh) * | 2020-07-28 | 2022-09-13 | 浙江大学 | 一种基于二分超球面原型网络的事件分类方法 |
CN113158681A (zh) * | 2021-03-24 | 2021-07-23 | 鹏城实验室 | 突发事件本体模型构建方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN106445990B (zh) | 2019-10-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106445990A (zh) | 事件本体构建方法 | |
CN109960786A (zh) | 基于融合策略的中文词语相似度计算方法 | |
CN102298642B (zh) | 文本信息抽取方法和*** | |
CN103544242A (zh) | 面向微博的情感实体搜索*** | |
CN104765779A (zh) | 一种基于YAGO2s的专利文档查询扩展方法 | |
Naser-Karajah et al. | Current trends and approaches in synonyms extraction: Potential adaptation to arabic | |
CN102779119B (zh) | 一种抽取关键词的方法及装置 | |
Trnavac et al. | Discourse relations and evaluation | |
Fu et al. | Improving distributed word representation and topic model by word-topic mixture model | |
Zhang et al. | Sentiment analysis of China's education policy online opinion based on text mining | |
Collantes et al. | Simpatico: A text simplification system for senate and house bills | |
Kanev et al. | Metagraph knowledge base and natural language processing pipeline for event extraction and time concept analysis | |
CN112860781A (zh) | 一种词汇搭配提取和语义分类相结合的挖掘和展示方法 | |
Al-Anzi et al. | A micro-word based approach for arabic sentiment analysis | |
Liu et al. | Domain ontology concept extraction method based on text | |
CN109871429B (zh) | 融合Wikipedia分类及显式语义特征的短文本检索方法 | |
Tang et al. | Tourism domain ontology construction from the unstructured text documents | |
Zouaq et al. | Semantic analysis using dependency-based grammars and upper-level ontologies. | |
Liu et al. | Keyword extraction using PageRank on synonym networks | |
Zheng et al. | Architecture Descriptions Analysis Based on Text Mining and Crawling Technology | |
Gao et al. | A hybrid GCN and RNN structure based on attention mechanism for text classification | |
Di et al. | Text classification of COVID-19 reviews based on pre-training language model | |
Kardana et al. | A novel approach for keyword extraction in learning objects using text mining and WordNet | |
Soudani et al. | A hybrid approach for standardized Dictionary-based knowledge extraction for Arabic morpho-semantic retrieval | |
Wen et al. | Event-based knowledge acquisition for ontology learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20180531 Address after: No. 99, Baoshan District Road, Shanghai, Shanghai Applicant after: Shanghai University Applicant after: SHANGHAI FEDERATION OF SCIENCE AND TECHNOLOGY ENTERPRISES Address before: No. 99, Baoshan District Road, Shanghai, Shanghai Applicant before: Shanghai University |
|
TA01 | Transfer of patent application right | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20191011 |
|
CF01 | Termination of patent right due to non-payment of annual fee |