CN105138507A - 一种基于模式自学习的中文开放式关系抽取方法 - Google Patents
一种基于模式自学习的中文开放式关系抽取方法 Download PDFInfo
- Publication number
- CN105138507A CN105138507A CN201510475450.0A CN201510475450A CN105138507A CN 105138507 A CN105138507 A CN 105138507A CN 201510475450 A CN201510475450 A CN 201510475450A CN 105138507 A CN105138507 A CN 105138507A
- Authority
- CN
- China
- Prior art keywords
- entity
- relation
- tuple
- statement
- relationship
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Machine Translation (AREA)
Abstract
开放式中文实体关系抽取是指在不限定语料领域和关系类别的前提下,自动地从中文语料中抽取出实体间的关系信息,得到实体关系元组。本发明公开了一种基于模式自学习的中文开放式关系抽取方法,包括如下三个主要步骤:首先,基于已有知识库获取高质量的实体关系元组和相应的句子作为训练语料,通过本发明提出的模式学习方法得到实体和关系词之间的依存路径模式;然后,对待抽取文本进行分词、词性标注和依存分析等预处理,并借助之前学习得到的关系模式进行实体关系抽取;最后,采用机器学习的方法对从中文语料中自动抽取出的实体关系进行质量评估,得到高质量的实体关系元组。
Description
技术领域
本发明涉及自然语言处理领域,特别是涉及中文信息抽取和开放式中文关系抽取。
背景技术
开放式关系抽取是指自动地从文本中抽取出实体以及实体间的语义关系,其不需预先定义关系类型,直接使用文本中的词汇作为关系元组中的实体和关系词。例如,从如下例句“奥巴马毕业于哥伦比亚大学”中,可以抽取出如下的三元关系元组:(奥巴马,毕业,哥伦比亚大学)。开放式实体关系抽取是知识库构建的基础,对于智能信息检索和应用有十分重要的实际应用价值。
开放式关系抽取方法主要分为三种类型,分别是基于词性的方法,基于语义角色标注的方法,和基于依存分析的方法。基于词性的关系抽取方法的主要问题在于它仅能够抽取关系词和实体相连的关系元组,难于抽取实体和关系词存在一定距离的关系元组。基于语义角色标注的关系抽取准确率相对较高,但这类方法的计算复杂度较高,难以适应实际大规模数据处理需求。采用基于依存分析的关系抽取方法可以较好地解决上述问题。依存分析是指利用依存语法将句子分析成描述各词语间依存关系的依存句法树,即指出了词语间的句法搭配关系,这种搭配关系是与语义相关联的。现有的一些基于依存分析的关系抽取方法主要是预先定义有限的关系模式然后抽取关系元组,因此抽取的关系元组召回率难以满足实际应用。同时也存在一些开放式关系抽取***,学习和使用大量依存关系模式抽取关系元组,但在学习的过程寻找关系元组对应的语句容易产生错误,降低了关系模式的准确性。
发明内容
本发明提供了一种开放式中文关系抽取方法。该方法能够从已有知识中自动学习得出实体间的依存关系模式,进而实现无需限定关系类别的开放式关系抽取。该方法的主要特点在于模式学习的过程不依赖于特定的人工标注语料,可有效提高面向开放域的中文实体关系抽取的准确率和召回率。
本发明提出的基于模式自学习的中文开放式关系抽取方法,包括:基于已有知识库获取高质量的实体关系元组和相应的句子作为训练语料,通过本专利提出的模式学习方法得到实体和关系词之间的依存路径模式;对待抽取文本进行分词、词性标注和依存分析等预处理,并借助之前学习得到的关系模式进行实体关系抽取;采用机器学习的方法对从中文语料中自动抽取出的实体关系进行质量评估,得到高质量的实体关系元组。
其中,所述的关系模式学习方法,包括:
通过已有知识库或者百科网页信息框获取高质量的实体关系元组和相应的语句作为训练语料,同时也可以利用中文关系抽取***抽取并选择高质量的关系元组,以构建包含关系元组和相应语句的训练语料;利用自然语言处理工具对训练文本进行分词、词性标注和依存分析预处理;利用大规模高质量训练语料的依存分析结果和高质量的关系元组,学习得到实体和关系词间的依存路径模式。
其中,所述的利用学习得到的关系模式进行实体关系抽取的方法,包括:
利用语句的依存分析树进行候选实体核心词识别以及对实体进行扩展;对待抽取语句选择合适的模式抽取关系元组;对抽取的关系核心词进行扩展以及将抽取的二元关系进行多元扩展。
本发明的发明目的是这样实现的:本发明首先通过高质量的实体关系元组和相应的句子语料学习得到大量依存路径关系模式,然后使用关系模式抽取大量的关系元组,最终对抽取的关系元组进行质量评估选并择其中高质量的关系元组。
与现有技术相比,本发明的有益效果主要有以下几点:
本发明能够在不限定关系类别的情况下实现开放式中文关系抽取,实体关系抽取准确率和召回率比现有技术要好。
本发明提出的依存路径模式学习方法具有独创性,通过学习得到的依存路径模式不仅考虑到实体所在上下文的词法和句法信息,而且包含词汇的语义信息。与相关技术相比,该方法更为先进,关系抽取结果也更为可靠。
附图说明
图1为本发明提出的基于模式自学习的中文开放式关系抽取方法
的总体流程图。
图2为本发明中关于依存路径模式自学习方法的流程图。
图3为本发明中基于模式匹配关系抽取的流程图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明的一个实施例,即本发明公开的一种基于模式自学习的中文开放式关系抽取方法的总体流程图。如图1所示,本实施例提供的开放式关系抽取方法,具体可以包括如下步骤:首先利用高质量的实体关系元组和相应的句子的语料,学习得到大量实体和关系词之间的依存路径模式;然后对待抽取文本进行自然语言预处理,并利用学习得到的关系模式进行实体关系抽取;最后采用机器学习的方法对从中文语料中自动抽取出的实体关系进行质量评估,得到高质量的实体关系元组。为便于理解,首先对下文中使用的英文符号进行说明:
(1)词性标注标签:v表示动词,n表示名词,p表示介词,j表示缩写词、i表示习语、nr表示人名、ns表示地点名、nt表示组织名、nz表示其他名词、r表示代词。
(2)依存分析标签:SBV(subject)表示主语,Root(rootofsentence)表示句子的核心词,VOB(directobject)表示直接宾语,CMP(complement)表示补足语。
步骤101、训练语料关系模式学习:
利用大规模高质量关系元组和对应语句的训练语料,通过学习得到实体和关系词之间的依存路径模式。关系模式学习的具体步骤如图2所示,包括如下三个步骤:获取训练语料,对训练语料进行预处理,学习得到依存路径模式。
步骤201、训练语料的获取:
本发明采用如下两种方法获取训练语料。一种方法是利用知识库中已有的高质量关系元组和百科页面信息框中的关系元组,通过网络爬虫获得包含每个关系元组中实体和关系词的对应语句,以构建关系元组和相应语句的训练语料用于模式学习。另一种方法是采用已有的中文关系抽取***,从大规模开放语料中抽取实体关系,选择其中置信度较高的关系元组和其对应语句构建训练数据。一条训练语料包括两个部分:关系元组和相应的原始语句。例如:从如下语句“巴育当选为总理”中可以抽取出如下的实体关系元组(巴育,当选,总统),该关系元组和该条语句共同构成本发明所使用的一条训练语料。
步骤202、对训练文本进行自然语言预处理:
利用已有的自然语言处理工具(例如Zpar或ICTCLAS等开源工具)对训练语料进行分词和词性标注。例如,对上文中使用的例句“巴育当选为总理”进行处理,得到的结果为“巴育_nr当选_v为_v总统_n”。其中,分词的结果以空格分隔,单词后面的下划线之后所跟的符号表示该单词的词性。得到分词结果之后,使用依存分析工具对分词和词性标注结果进行依存分析。
步骤203、依存路径模式学习:
利用步骤201获取的高质量训练语料,经步骤202得到依存分析结果,可以实现已知关系元组和相应语句的依存分析结果之间的匹配,从而自动地学习到各种实体和关系词之间的依存路径模式。本发明学习得到的模式定义为:训练语句依存分析结果中的实体和关系词间的依存路径以及路径中词汇的词性。例如,对于上文中使用的例句“巴育当选为总理”,得到的依存路径和词性模式为“SBV(nr)-Root(v)-VOB(n)”,其中Root(v)表示关系,SBV(nr)和VOB(n)表示关系元组中的实体。考虑到通过大规模学习得到的依存路径模式可能存在分歧和矛盾(例如某些具有细微差别的模式其实具有相同的语法含义),本发明提出进一步根据词性,对学习得到的模式进行聚类,以提高模式对复杂自然语言环境的适用性和覆盖率。由于关系元组中的实体是名词性成分,因此本方法主要将模式中名词性成分进行聚合,具体实施方法是将词性标签为j、i、nr、ns、nt、nz、r等类型的单词聚合为n。对于给定例句而言,由于nr表示人名,根据上述聚合方法,最终得到的模式是“SBV(n)-Root(v)-VOB(n)”。
步骤102、待抽取文本进行模式匹配和实体关系元组抽取:
首先对待抽取语句按照步骤202所述,使用自然语言处理工具进行分词、词性标注和依存分析等操作。然后使用经步骤101学习得到的关系模式,对待抽取语句进行模式匹配,得到目标关系元组。基于模式匹配实现关系抽取的流程图如图3所示,包括如下步骤:候选实体识别、关系模式选择与关系抽取、关系扩展。
步骤301、候选实体识别:
为识别待抽取语句的中候选实体短语,首先选择其中的动词作为候选关系词。将该候选关系词视为依存关系树中的一个结点,若其左子树结点为名词,则将其作为候选实体的核心词。同理可以通过右子树识别候选关系词的另一候选实体的核心词。通过依存关系分析得到的仅仅是实体的核心词,为丰富候选实体的信息,需要将实体核心词和所在子树中名词性成分进行合并以实现实体扩展。
步骤302、关系模式选择和关系抽取:
在基于模式匹配实现关系抽取的过程中,会出现对于同一待抽取语句,可能存在多个模式同时适用的情况。针对这种情况,本发明根据先验概率进行模式选择。具体方法是,在步骤101的执行阶段,在进行模式学习的同时,统计所学习到的模式在训练语料中的出现频率,经归一化处理后作为模式的先验概率。当出现多个模式同时匹配某一语句的情况时,选择先验概率较高的模式作为关系抽取依据,从目标语句中抽取实体关系元组。
步骤303、关系扩展:
本步骤的主要任务是对抽取的动词性关系核心词进行扩展,同时可以将基于模式匹配抽取得到的二元关系扩展为多元关系。具体实现方法描述如下。
若待抽取语句中存在某个动词的依存分析角色为补足语(CMP),且该动词和抽取得到的关系元组中的核心动词间存在一条依存路径直接相连,则将该动词和关系元组中的核心动词进行合并。若待抽取语句中包含介词,而且有抽取得到的关系元组之外的实体与该介词相连,则将该二元关系扩展为多元关系。
步骤103、使用机器学习的方法对抽取的关系元组进行质量评估:
采用机器学习的方法对从中文语料中自动抽取出的实体关系进行质量评估,得到高质量的实体关系元组。本方法中使用逻辑斯蒂分类器进行质量评估,分类器采用浅层词法特征和语义特征进行构造,典型特征包括句子的长短、实体和关系词间的距离、实体和关系词的依存语义角色等。对该分类器采用人工构造的训练样本进行训练,训练样本通过应用本发明提出的实体关系抽取方法,对开放语料进行关系抽取而得到。样本经专家人工判别后分为两类,一类是正样本,表示关系抽取的结果正确,一类是负样本,表示关系抽取的结果不正确。经过训练的逻辑斯蒂分类模型将被用于质量评估,根据用户选定的置信区间,对本发明提出的关系抽取方法的输出结果进行自动评估,并过滤掉低置信度的结果。
本发明公布的一种基于模式自学习的中文开放式关系抽取方法具有以下特点:本发明通过高质量的实体关系元组和相应的句子语料学习得到依存路径关系模式,并用于抽取关系元组。本方法学习得到的依存路径模式中包含词汇的语义信息,相对于仅包含词法、句法信息的模式,提高了关系抽取的准确率和召回率。同时为减少关系抽取的信息损失,方法通过依存树对抽取的实体核心词进行扩展以及通过介词将二元关系扩展为多元关系。
尽管上面对本发明说明性的具体实施方式进行了描述,以便于本技术领的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
Claims (9)
1.一种基于依存关系模式的开放式中文实体关系抽取方法,其特征在于,包括:
基于大量高质量的实体关系元组和相应语句的训练语料,通过本专利提出的模式学习方法得到实体和关系词之间的依存路径模式;
对待抽取文本进行分词、词性标注和依存分析等预处理,并使用之前学习得到的关系模式进行实体关系抽取;
采用机器学习的方法对从中文语料中自动抽取出的实体关系进行质量评估,得到高质量的实体关系元组。
2.根据权利要求1所述的方法,其特征在于大量高质量的实体关系元组和相应语句的训练语料构建,所述方法包括:
利用知识库中已有大量高质量关系元组和百科页面信息框中关系元组,通过网络爬虫获得包含每个关系元组中实体和关系词的对应语句,以构建关系元组和相应语句的训练语料,用于模式学习。
利用中文开放式关系抽取***关系抽取并选择高质量的关系元组,以构建包含关系元组和相应语句的训练语料,用于模式学习。
3.根据权利要求1所述的方法,其特征在于利用大量高质量的实体关系元组和相应语句的训练语料学习得到实体和关系词之间的依存路径模式,所述方法包括:
利用自然语言处理工具对语句进行分词、词性标注和依存分析。结合训练语句依存分析结果和对应的高质量关系元组进行匹配学习得到实体和关系词之间的依存路径模式。
4.根据权利要求3所述的方法,其特征在于对抽取的大量关系依存路径模式进行聚类:
通过训练语料学习得到的大量依存路径模式中,存在一些模式表示的实际含义相同但形式不同。因此,本发明依据词性对模型进行聚类以提高模式的覆盖率和粒度。
5.根据权利要求1所述的方法,其特征在于,对待抽取文本进行预处理并使用学习得到的关系模式进行实体关系抽取,所述方法包括:
对待抽取文本进行分词、词性标注、依存分析,然后识别候选实体核心词和候选关系核心词,最后使用学习得到的模式抽取关系元组。
对同一待抽取语句有多个模式同时符合的情况,本发明选择其中高频率的二元关系模式抽取关系元组。然后对待抽取语句中包含介词的,通过介词扩展为多元关系。
6.根据权利要求5所述的方法,其特征在于,识别语句中候选实体核心词以及通过依存分析树对候选实体进行扩展,所述方法包括
首先选择其中词性为动词的词汇作为候选关系词。若其依存左子树结点为名词,则将其作为候选实体的核心词。同理识别关系词的另一个候选实体的核心词。
为丰富关系元组中实体的信息,对识别的实体核心词进行实体扩展。具体的是将实体核心词和其所在的子树中名词性成分进行合并。
7.根据权利要求5所述的方法,其特征在于,对初步抽取的关系元组中关系核心词进行扩展,所述方法包括
若语句中有动词的依存分析角色为CMP(complement),且其和关系词在依存树中是直接相连的,则合并该动词和关系元组中核心动词。
若语句中有动词和关系词直接相连,则合并该动词和关系元组中核心动词。
8.根据权利要求5所述的方法,其特征在于,对抽取的二元关系元组进行多元扩展,所述方法包括
对于抽取关系元组的语句,若其中包含介词,而且有新的实体和介词相连,则将该实体作为关系元组新的实体,达到多元扩展的效果。
9.根据权利要求1所述的方法,其特征在于,对抽取的关系元组进行质量评估,所述方法包括
对抽取的关系元组采用机器学习的方法对抽取出的实体关系进行质量评估,得到高质量的实体关系元组。本方法结合使用了浅层词法特征和语义特征。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510475450.0A CN105138507A (zh) | 2015-08-06 | 2015-08-06 | 一种基于模式自学习的中文开放式关系抽取方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510475450.0A CN105138507A (zh) | 2015-08-06 | 2015-08-06 | 一种基于模式自学习的中文开放式关系抽取方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105138507A true CN105138507A (zh) | 2015-12-09 |
Family
ID=54723858
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510475450.0A Pending CN105138507A (zh) | 2015-08-06 | 2015-08-06 | 一种基于模式自学习的中文开放式关系抽取方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105138507A (zh) |
Cited By (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105678327A (zh) * | 2016-01-05 | 2016-06-15 | 北京信息科技大学 | 一种面向中文专利的实体间非分类关系抽取方法 |
CN106339412A (zh) * | 2016-08-12 | 2017-01-18 | 中国电子科技集团公司第二十八研究所 | 一种中文国际政治事件的参与者关系抽取方法 |
CN106844413A (zh) * | 2016-11-11 | 2017-06-13 | 南京缘长信息科技有限公司 | 实体关系抽取的方法及装置 |
CN107291687A (zh) * | 2017-04-27 | 2017-10-24 | 同济大学 | 一种基于依存语义的中文无监督开放式实体关系抽取方法 |
CN107544960A (zh) * | 2017-08-29 | 2018-01-05 | 中国科学院自动化研究所 | 一种基于变量绑定和关系激活的推理方法 |
CN107783960A (zh) * | 2017-10-23 | 2018-03-09 | 百度在线网络技术(北京)有限公司 | 用于抽取信息的方法、装置和设备 |
CN107798136A (zh) * | 2017-11-23 | 2018-03-13 | 北京百度网讯科技有限公司 | 基于深度学习的实体关系抽取方法、装置及服务器 |
CN108363816A (zh) * | 2018-03-21 | 2018-08-03 | 北京理工大学 | 基于句义结构模型的开放式实体关系抽取方法 |
CN108427717A (zh) * | 2018-02-06 | 2018-08-21 | 北京航空航天大学 | 一种基于逐步扩展的字母类语系医疗文本关系抽取方法 |
CN108491512A (zh) * | 2018-03-23 | 2018-09-04 | 北京奇虎科技有限公司 | 新闻标题的摘要方法及装置 |
WO2018174815A1 (en) * | 2017-03-24 | 2018-09-27 | Agency For Science, Technology And Research | Method and apparatus for semantic coherence analysis of texts |
CN108763376A (zh) * | 2018-05-18 | 2018-11-06 | 浙江大学 | 融合关系路径、类型、实体描述信息的知识表示学习方法 |
CN109002498A (zh) * | 2018-06-29 | 2018-12-14 | 北京百度网讯科技有限公司 | 人机对话方法、装置、设备及存储介质 |
CN109271392A (zh) * | 2018-10-30 | 2019-01-25 | 长威信息科技发展股份有限公司 | 快速判别和抽取关系型数据库实体及属性的方法及设备 |
CN110119510A (zh) * | 2019-05-17 | 2019-08-13 | 浪潮软件集团有限公司 | 一种基于传递依存关系和结构助词的关系抽取方法及装置 |
CN110414008A (zh) * | 2019-08-09 | 2019-11-05 | 深巨科技(北京)有限公司 | 一种基于深度学习的关系抽取***及其方法 |
CN110866389A (zh) * | 2018-08-17 | 2020-03-06 | 北大方正集团有限公司 | 信息价值评估方法、装置、设备及计算机可读存储介质 |
CN111027324A (zh) * | 2019-12-05 | 2020-04-17 | 电子科技大学广东电子信息工程研究院 | 一种基于句法模式和机器学习的开放式关系的抽取方法 |
CN111241827A (zh) * | 2020-01-10 | 2020-06-05 | 同方知网(北京)技术有限公司 | 一种基于句子检索模式的属性抽取方法 |
CN111259669A (zh) * | 2018-11-30 | 2020-06-09 | 阿里巴巴集团控股有限公司 | 信息标注方法、信息处理方法及装置 |
CN111859966A (zh) * | 2020-06-12 | 2020-10-30 | 中国科学院信息工程研究所 | 一种面向网络威胁情报的标注语料生成方法及电子装置 |
CN112036151A (zh) * | 2020-09-09 | 2020-12-04 | 平安科技(深圳)有限公司 | 基因疾病关系知识库构建方法、装置和计算机设备 |
CN112528045A (zh) * | 2020-12-23 | 2021-03-19 | 中译语通科技股份有限公司 | 基于开放百科图谱的领域图谱关系的判定方法及*** |
CN113392217A (zh) * | 2021-06-24 | 2021-09-14 | 广东电网有限责任公司 | 一种电力设备故障缺陷实体关系的抽取方法及装置 |
CN114528418A (zh) * | 2022-04-24 | 2022-05-24 | 杭州同花顺数据开发有限公司 | 一种文本处理方法、***和存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103034693A (zh) * | 2012-12-03 | 2013-04-10 | 哈尔滨工业大学 | 开放式实体及其类型识别方法 |
CN103530281A (zh) * | 2013-10-15 | 2014-01-22 | 苏州大学 | 一种论元抽取方法和*** |
CN104331480A (zh) * | 2014-11-07 | 2015-02-04 | 苏州大学 | 一种中文事件触发词的抽取***及方法 |
-
2015
- 2015-08-06 CN CN201510475450.0A patent/CN105138507A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103034693A (zh) * | 2012-12-03 | 2013-04-10 | 哈尔滨工业大学 | 开放式实体及其类型识别方法 |
CN103530281A (zh) * | 2013-10-15 | 2014-01-22 | 苏州大学 | 一种论元抽取方法和*** |
CN104331480A (zh) * | 2014-11-07 | 2015-02-04 | 苏州大学 | 一种中文事件触发词的抽取***及方法 |
Non-Patent Citations (2)
Title |
---|
刘方驰 等: "基于机器学习的实体关系抽取方法", 《兵工自动化》 * |
黄勋 等: "关系抽取技术研究综述", 《知识组织与知识管理》 * |
Cited By (40)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105678327A (zh) * | 2016-01-05 | 2016-06-15 | 北京信息科技大学 | 一种面向中文专利的实体间非分类关系抽取方法 |
CN106339412A (zh) * | 2016-08-12 | 2017-01-18 | 中国电子科技集团公司第二十八研究所 | 一种中文国际政治事件的参与者关系抽取方法 |
CN106339412B (zh) * | 2016-08-12 | 2019-09-10 | 中国电子科技集团公司第二十八研究所 | 一种中文国际政治事件的参与者关系抽取方法 |
CN106844413A (zh) * | 2016-11-11 | 2017-06-13 | 南京缘长信息科技有限公司 | 实体关系抽取的方法及装置 |
CN106844413B (zh) * | 2016-11-11 | 2020-12-08 | 南京柯基数据科技有限公司 | 实体关系抽取的方法及装置 |
WO2018174815A1 (en) * | 2017-03-24 | 2018-09-27 | Agency For Science, Technology And Research | Method and apparatus for semantic coherence analysis of texts |
CN107291687A (zh) * | 2017-04-27 | 2017-10-24 | 同济大学 | 一种基于依存语义的中文无监督开放式实体关系抽取方法 |
CN107544960A (zh) * | 2017-08-29 | 2018-01-05 | 中国科学院自动化研究所 | 一种基于变量绑定和关系激活的推理方法 |
CN107544960B (zh) * | 2017-08-29 | 2020-01-14 | 中国科学院自动化研究所 | 一种基于变量绑定和关系激活的自动问答方法 |
CN107783960A (zh) * | 2017-10-23 | 2018-03-09 | 百度在线网络技术(北京)有限公司 | 用于抽取信息的方法、装置和设备 |
US10664660B2 (en) | 2017-11-23 | 2020-05-26 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Method and device for extracting entity relation based on deep learning, and server |
CN107798136A (zh) * | 2017-11-23 | 2018-03-13 | 北京百度网讯科技有限公司 | 基于深度学习的实体关系抽取方法、装置及服务器 |
CN107798136B (zh) * | 2017-11-23 | 2020-12-01 | 北京百度网讯科技有限公司 | 基于深度学习的实体关系抽取方法、装置及服务器 |
CN108427717B (zh) * | 2018-02-06 | 2021-09-03 | 北京航空航天大学 | 一种基于逐步扩展的字母类语系医疗文本关系抽取方法 |
CN108427717A (zh) * | 2018-02-06 | 2018-08-21 | 北京航空航天大学 | 一种基于逐步扩展的字母类语系医疗文本关系抽取方法 |
CN108363816A (zh) * | 2018-03-21 | 2018-08-03 | 北京理工大学 | 基于句义结构模型的开放式实体关系抽取方法 |
CN108491512A (zh) * | 2018-03-23 | 2018-09-04 | 北京奇虎科技有限公司 | 新闻标题的摘要方法及装置 |
CN108763376A (zh) * | 2018-05-18 | 2018-11-06 | 浙江大学 | 融合关系路径、类型、实体描述信息的知识表示学习方法 |
CN108763376B (zh) * | 2018-05-18 | 2020-09-29 | 浙江大学 | 融合关系路径、类型、实体描述信息的知识表示学习方法 |
CN109002498A (zh) * | 2018-06-29 | 2018-12-14 | 北京百度网讯科技有限公司 | 人机对话方法、装置、设备及存储介质 |
CN110866389A (zh) * | 2018-08-17 | 2020-03-06 | 北大方正集团有限公司 | 信息价值评估方法、装置、设备及计算机可读存储介质 |
CN110866389B (zh) * | 2018-08-17 | 2021-12-17 | 北大方正集团有限公司 | 信息价值评估方法、装置、设备及计算机可读存储介质 |
CN109271392A (zh) * | 2018-10-30 | 2019-01-25 | 长威信息科技发展股份有限公司 | 快速判别和抽取关系型数据库实体及属性的方法及设备 |
CN109271392B (zh) * | 2018-10-30 | 2022-07-26 | 长威信息科技发展股份有限公司 | 快速判别和抽取关系型数据库实体及属性的方法及设备 |
CN111259669A (zh) * | 2018-11-30 | 2020-06-09 | 阿里巴巴集团控股有限公司 | 信息标注方法、信息处理方法及装置 |
CN111259669B (zh) * | 2018-11-30 | 2023-06-27 | 阿里巴巴集团控股有限公司 | 信息标注方法、信息处理方法及装置 |
CN110119510B (zh) * | 2019-05-17 | 2023-02-14 | 浪潮软件集团有限公司 | 一种基于传递依存关系和结构助词的关系抽取方法及装置 |
CN110119510A (zh) * | 2019-05-17 | 2019-08-13 | 浪潮软件集团有限公司 | 一种基于传递依存关系和结构助词的关系抽取方法及装置 |
CN110414008A (zh) * | 2019-08-09 | 2019-11-05 | 深巨科技(北京)有限公司 | 一种基于深度学习的关系抽取***及其方法 |
CN111027324A (zh) * | 2019-12-05 | 2020-04-17 | 电子科技大学广东电子信息工程研究院 | 一种基于句法模式和机器学习的开放式关系的抽取方法 |
CN111027324B (zh) * | 2019-12-05 | 2023-11-21 | 电子科技大学广东电子信息工程研究院 | 一种基于句法模式和机器学习的开放式关系的抽取方法 |
CN111241827B (zh) * | 2020-01-10 | 2022-05-20 | 同方知网(北京)技术有限公司 | 一种基于句子检索模式的属性抽取方法 |
CN111241827A (zh) * | 2020-01-10 | 2020-06-05 | 同方知网(北京)技术有限公司 | 一种基于句子检索模式的属性抽取方法 |
CN111859966A (zh) * | 2020-06-12 | 2020-10-30 | 中国科学院信息工程研究所 | 一种面向网络威胁情报的标注语料生成方法及电子装置 |
CN112036151A (zh) * | 2020-09-09 | 2020-12-04 | 平安科技(深圳)有限公司 | 基因疾病关系知识库构建方法、装置和计算机设备 |
CN112036151B (zh) * | 2020-09-09 | 2024-04-05 | 平安科技(深圳)有限公司 | 基因疾病关系知识库构建方法、装置和计算机设备 |
CN112528045A (zh) * | 2020-12-23 | 2021-03-19 | 中译语通科技股份有限公司 | 基于开放百科图谱的领域图谱关系的判定方法及*** |
CN112528045B (zh) * | 2020-12-23 | 2024-04-02 | 中译语通科技股份有限公司 | 基于开放百科图谱的领域图谱关系的判定方法及*** |
CN113392217A (zh) * | 2021-06-24 | 2021-09-14 | 广东电网有限责任公司 | 一种电力设备故障缺陷实体关系的抽取方法及装置 |
CN114528418A (zh) * | 2022-04-24 | 2022-05-24 | 杭州同花顺数据开发有限公司 | 一种文本处理方法、***和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105138507A (zh) | 一种基于模式自学习的中文开放式关系抽取方法 | |
CN109388795B (zh) | 一种命名实体识别方法、语言识别方法及*** | |
CN106294593B (zh) | 结合从句级远程监督和半监督集成学习的关系抽取方法 | |
Mairesse et al. | Spoken language understanding from unaligned data using discriminative classification models | |
CN110457689B (zh) | 语义处理方法及相关装置 | |
WO2019228466A1 (zh) | 命名实体识别的方法、装置、设备及存储介质 | |
CN106777275A (zh) | 基于多粒度语义块的实体属性和属性值提取方法 | |
CN104503998B (zh) | 针对用户查询句的类型识别方法及装置 | |
CN110598203A (zh) | 一种结合词典的军事想定文书实体信息抽取方法及装置 | |
CN111708869B (zh) | 人机对话的处理方法及装置 | |
CN102693279B (zh) | 一种快速计算评论相似度的方法、装置及*** | |
CN109388700A (zh) | 一种意图识别方法及*** | |
CN104050256A (zh) | 基于主动学习的问答方法及采用该方法的问答*** | |
CN108363704A (zh) | 一种基于统计短语表的神经网络机器翻译语料扩展方法 | |
CN109062904B (zh) | 逻辑谓词提取方法和装置 | |
CN103309926A (zh) | 基于条件随机场的中英文混合命名实体识别方法及*** | |
CN103678684A (zh) | 一种基于导航信息检索的中文分词方法 | |
CN104199965A (zh) | 一种语义信息检索方法 | |
CN110134949A (zh) | 一种基于教师监督的文本标注方法和设备 | |
CN110188359B (zh) | 一种文本实体抽取方法 | |
CN109460459A (zh) | 一种基于日志学习的对话***自动优化方法 | |
CN110119510A (zh) | 一种基于传递依存关系和结构助词的关系抽取方法及装置 | |
CN110532358A (zh) | 一种面向知识库问答的模板自动生成方法 | |
CN109190099B (zh) | 句模提取方法及装置 | |
CN114860942B (zh) | 文本意图分类方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20151209 |
|
WD01 | Invention patent application deemed withdrawn after publication |