CN111241840A - 一种基于知识图谱的命名实体识别方法 - Google Patents

一种基于知识图谱的命名实体识别方法 Download PDF

Info

Publication number
CN111241840A
CN111241840A CN202010071248.2A CN202010071248A CN111241840A CN 111241840 A CN111241840 A CN 111241840A CN 202010071248 A CN202010071248 A CN 202010071248A CN 111241840 A CN111241840 A CN 111241840A
Authority
CN
China
Prior art keywords
knowledge
relation
entity
relationship
graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010071248.2A
Other languages
English (en)
Inventor
刘华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhongke Shuguang Nanjing Computing Technology Co Ltd
Original Assignee
Zhongke Shuguang Nanjing Computing Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhongke Shuguang Nanjing Computing Technology Co Ltd filed Critical Zhongke Shuguang Nanjing Computing Technology Co Ltd
Priority to CN202010071248.2A priority Critical patent/CN111241840A/zh
Publication of CN111241840A publication Critical patent/CN111241840A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • G06N5/045Explanation of inference; Explainable artificial intelligence [XAI]; Interpretable artificial intelligence

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于知识图谱的命名实体识别方法,该方法基于已有知识图谱中实体关系三元组(h,r,t),对关系指示词r和尾实体t进行推理。在此基础上提出新的模型以用于开放领域知识库中提取的三元组实体关系间的表示学习,从而实现知识图谱中的关系发掘与知识推理,达到优化关联搜索与个性化推荐效果的作用。本发明相比于传统知识库,利用开放域知识库使用关系指示词代替关系类型,实体更为丰富,粒度更加细腻。

Description

一种基于知识图谱的命名实体识别方法
技术领域
本发明涉及一种命名实体识别方法,尤其涉及一种基于知识图谱的命名实体识别方法。
背景技术
在过去的十几年里,随着人工智能、云计算等技术不断发展,大规模的知识库构建已经有了很好的进展,已经广泛应用在电商、文化娱乐、金融、物流等行业客户的多项业务中,取得了良好的效果。
目前广泛应用于自然语言处理领域的“命名实体”最初于1996年在第六届信息理解会议(MUC-6)上提出,主要是从给定文本中抽取诸如公司活动和国防活动等特定的信息,这些文本可以是结构化、半结构化或非结构化的数据。在进行信息抽取任务时,把文本中某些具有特殊意义的实体,如人名、机构名称和地名及具有特殊意义的时间称为“命名实体识别”。
目前已有许多关于命名实体识别和知识图谱生成的研究,2015年Zhiheng Huang,Wei Xu,和Kai Yu发表于Computer Science的“Bidirectional LSTM-CRF Models forSequence Tagging”比较了NLP几个经典任务:词性标注,命名实体识别上的模型,包括CRF,LSTM,Bi-LSTM,LSTM-CRF,Bi-LSTM-CRF,Bi-LSTM-CRF在这几个任务上取得了最好的准确度和健壮性,对词语特征工程的依赖最小。2017年Suncong Zheng等人发表的“JointExtraction of Entities and Relations Based on a Novel Tagging Scheme”提出了一种新的处理实体识别和关系抽取的方法,传统的NER和RC任务是分离的,这样就忽视了实体和关系之间的关联,并且实体抽取标注中的错误会牵连到关系抽取。作者采用新的标注方法将实体和关系信息融合到一个标签里接着采用Bi-LSTM作为编码器,LSTM作为解码器,采用端到端模型对实体识别关系抽取任务进行训练。2018年Yanyao Shen等人发表的“DeepActive Learning for Named Entity Recognition”证明当深度学习与主动学习(activelearning)相结合时,标记的训练数据的量可以大大减少。
领域非结构化文本数据通过自然语言处理解析并转变为可以被计算机高效处理的结构化数据,它们组成的知识库通常以网状的拓扑结构组织起来,网络中每个节点代表实体,而每条连边则代表实体间的关系。为了利用这种网状知识库中的数据,往往需要专门设计复杂度较高的图算法。但是这些算法并不能很好的适用于知识推理,随着知识库的数据规模不断扩大,这些基于网状表示形式的算法存在以下两个问题:1、计算效率不足;2、针对稀疏数据无法获得很好的反馈。基于网状结构知识库的知识推理很难较好地满足实时计算的需求。以符号为基础的网状形式的知识库无法应对连续空间里的数值计算。单纯的符号和逻辑的表示使得知识库中的知识越来越离散化,知识之间无法很好的整合在一起,这也使得智能***无法更加灵活地使用知识库进行知识推理。
发明内容
发明目的:本发明提出一种改进的知识图谱中命名实体的表示学习知识推理方法,通过OWL语言对知识图谱中实体进行表述,然后将抽取的实体与关系进行向量化映射,然后通过训练集中已有的三元组关系优化映射的实体关系向量数据,从而进行实体知识推理与关系发掘,达到优化关联搜索与个性化推荐效果的作用。
技术方案:本发明所述的基于知识图谱的命名实体识别方法,包括以下步骤:
(1)从知识库中抽取命名实体,得到关系三元组集合;
(2)构造超平面对实体进行投影,得到改进的TransE模型;
(3)利用改进的TransE模型对关系三元组集合进行训练,得到领域知识推理模型;
(4)根据领域知识推理模型判断目标命名实体关系,给出关联搜索结果。
进一步地,所述知识库为开放域知识库。
进一步地,所述关系三元组集合用OWL语言表述。
进一步地,所述步骤(2)具体包括:
(21)对于不同的关系向量
Figure BDA0002377353540000021
基于n-1维向量
Figure BDA0002377353540000022
Figure BDA0002377353540000023
构造过
Figure BDA0002377353540000024
的不同的超平面Wi
(22)计算如下改进的TransE模型:
Figure BDA0002377353540000025
其中,(hi,ri,ti)为第i个关系三元组,hi、ri、ti分别为第i个头实体、关系向量、尾实体,均为n维向量;
Figure BDA0002377353540000026
分别为hi、ti在超平面Wi上的投影。
进一步地,所述步骤(3)具体包括:
(31)设置正采样训练集S与负采样训练集S′,其中,S为正确的关系三元组集合,S′随机替换了正确的关系三元组中任意两项得到的关系三元组集合;
(32)采用最大间隔法对改进的TransE模型进行训练,得到领域知识推理模型,损失函数L如下:
Figure BDA0002377353540000031
其中,γ是取值大于0的间隔距离参数,[F]+为正值函数,当F>0时,[F]+=F,当F<0时,[F]+=0,梯度更新时计算f(hi,ri,ti)和f(hi′,ri′,ti′)的值。
进一步地,步骤(31)中,所述随机替换的策略为:
对于1)每个头实体对应的尾实体的平均数量
Figure BDA0002377353540000032
2)每个尾实体对应的头实体的平均数量
Figure BDA0002377353540000033
Figure BDA0002377353540000034
Figure BDA0002377353540000035
时,则关系向量r表示一对一关系;当
Figure BDA0002377353540000036
Figure BDA0002377353540000037
时,则关系向量r表示一对多关系;当
Figure BDA0002377353540000038
Figure BDA0002377353540000039
时,则关系向量r表示多对一关系;当
Figure BDA00023773535400000310
Figure BDA00023773535400000311
时,则关系向量r表示多对多关系。
有益效果:本发明具有以下有益效果:
1、通过OWL语义描述,优化了提取实体的表现方式,使得训练集中的实体描述更加精确,从而提高知识图谱推理的准确性;
2、提出一种改进的TransE模型,通过构造超平面提高了推理准确性,同时优化了推理模型函数,降低了模型的复杂度提高训练效率;
3、优化了负采样数据集构造方式,相比以往方法更加科学的构造负采样数据集,从而提升了模型训练准确性。
附图说明
图1是本发明所述的方法流程图;
图2是本发明超平面构造示意图;
图3是本发明实体向量聚集示意图。
具体实施方式
下面结合附图和实施例对本发明的技术方案作进一步的说明。
如图1,其示出了本发明所述的基于知识图谱的命名实体识别方法。该方法包括以下步骤:
(1)从知识库中抽取命名实体,得到关系三元组集合;
在一个实施例中,选取中文知识库,如百度百科、***,在特定领域进行实体抽取,获取领域实体、关系数据,并以此建立特定领域实体关系三元组集合。
在一个实施例中,所述关系三元组集合用OWL语言表述。
OWL由个体和属性组成。个体代表领域中我们感兴趣的对象,OWL不使用唯一命名假设,即两个不同的名称可以对应一个个体(例如:“伊丽莎白女王”和“伊丽莎白温莎”是指同一个人)。在OWL中,必须明确表示个体之间是否相同,否则它们的关系是不明确的;属性是个体之间的二元关系。在描述逻辑中,它们就是角色(Role)的概念。
在使用一组术语之前,需要精确地指出哪些具体的词汇表将会用到。一个典型的OWL本体以命名空间声明开始,这些命名空间写到属性值是不具有命名空间的,在OWL里可以写出它们的完整URI。OWL是语义网活动的一个组成部分。这项工作的目的是通过对增加关于那些描述或提供网络内容的资源的信息,从而使网络资源能够更容易地被那些自动进程访问。
例如,下面OWL语言表述了艺人-两栖艺人-歌手、艺人-两栖艺人-演员两组三元组关系。
Figure BDA0002377353540000041
对每个实体与关系进行编号,随机初始化每个实体与关系的向量表示并存储在字典中,例如(艺人-两栖艺人-歌手)存储为((1,0,0),(0,1,0),(0,0,1))三个向量分别对应编号ID为1,2,3。
(2)构造超平面对实体进行投影,得到改进的TransE模型。
对于知识图谱实体关系的推理,广泛采用的做法是使用基于(欧式)距离的模型(Translational Distance Model)TransE,TransE是基于实体和关系的分布式向量表示,利用了词向量的平移不变现象。TransE模型在传统数据集下有不错表现,然而在开放领域数据集中,TransE模型也有一些缺点:1)处理自反关系,一对多关系以及多对一关系时存在不足,对于开放领域数据集,同一实体在不同关系中的表示常常是相同的,这就导致了图谱中可能出现大量自反关系、一对多关系、多对一关系,从而影响关系挖掘预测效果;2)传统训练方法中通过随机抽取的方式替换三元组(h,r,t)中的h和t构造负采样集,然而,对于一个尚未补全的真实知识图谱,这样的抽样方式可能会在训练中引入许多错的反例标签,导致负采样集失真,影响训练效果。
因此,对于每个三元组实例(h,r,t)(head,relation,tail),将其中的关系relation看作从实体head到实体tail的联系,通过不断调整h、r和t(head、relation和tail的向量),使(h+r)尽可能与t相等。
但是对于关系相近的实体,虽然实体本身在知识图谱中表示不同含义,但是由于关系相近,会使得用于表示实体的向量非常相近,如(周杰伦,出生于,台湾)、(蔡依林,出生于,台湾)这两者除出身地台湾比较相似外,其他方面有有较大差异,对于相同头尾实体,TransE无法分辨不同关系的差异,如果从这两个三元组学习知识表示,将会使周杰伦和蔡依林的向量变得相同,从而使得到的实体表示的区分度较低。
如图2所示,由此引入超平面,对于不同的关系向量
Figure BDA0002377353540000051
构造不同的超平面Wi,对于不同实体间通过不同的映射向量投影到与之相关关系的超平面上,从而保证了这两个实体通过不同的关系得以区分。其中,
Figure BDA0002377353540000052
为超平面内的向量。
在一个实施例中,所述步骤(2)具体包括:
(21)对于不同的关系向量
Figure BDA0002377353540000053
基于n-1维向量
Figure BDA0002377353540000054
Figure BDA0002377353540000055
构造过
Figure BDA0002377353540000056
的不同的超平面Wi
(22)计算如下改进的TransE模型:
Figure BDA0002377353540000057
其中,(hi,ri,ti)为第i个关系三元组,hi、ri、ti分别为第i个头实体、关系向量、尾实体,均为n维向量;
Figure BDA0002377353540000058
分别为hi、ti在超平面Wi上的投影。
正确的三元组关系应使
Figure BDA0002377353540000059
接近
Figure BDA00023773535400000510
例如,通过这样的处理,可以将周杰伦和蔡依林投影到不同的超平面中,根据不同的
Figure BDA00023773535400000511
Figure BDA00023773535400000512
定义特定的关系,从而区分两个实体,使关系特殊化,保证了知识表示的准确性。
(3)利用改进的TransE模型对关系三元组集合进行训练,得到领域知识推理模型;
在一个实施例中,所述步骤(3)具体包括:
(31)设置正采样训练集S与负采样训练集S′,其中,S为正确的关系三元组集合,S′随机替换了正确的关系三元组中任意两项得到的关系三元组集合;
(32)采用最大间隔法对改进的TransE模型进行训练,得到领域知识推理模型,损失函数L如下:
Figure BDA00023773535400000513
其中,γ是取值大于0的间隔距离参数,[F]+为正值函数,当F>0时,[F]+=F,当F<0时,[F]+=0,梯度更新时计算f(hi,ri,ti)和f(hi′,ri′,ti′)的值。
将三元组里的实体和关系h,r,t在字典里对应的序号找出并带入损失函数计算,当损失函数稳定(模型较优)后,将字典输出,获得相对准确的实体、关系对应的向量映射模型,形成知识图谱。
对于知识图谱数据集内的三元组,传统训练方法通过随机抽取正采样三元组(h,r,t)中的h和r构造错误三元组(h′,r,t′)生成负采样训练集。但是这种抽样方法在处理一对多、多对一和多对多的关系时,会出现原来正确的三元组替换后任然是正确三元组的情况,,对于一个尚未补全的真实开放领域知识图谱,这样简单的抽样方式可能会在训练中引入许多错误的负采样标签。为适应基于开放领域数据库生成的训练集,我们提出新的训练方法,在构造负采样训练集时,通过对不同数据集中三元组关系特点进行分析,根据实体关系特点以不同策略概率替换三元组中的头尾实体。
在一个实施例中,步骤(31)中,所述随机替换的策略为:
对于1)每个头实体对应的尾实体的平均数量
Figure BDA0002377353540000061
2)每个尾实体对应的头实体的平均数量
Figure BDA0002377353540000062
Figure BDA0002377353540000063
Figure BDA0002377353540000064
时,则关系向量r表示一对一关系;当
Figure BDA0002377353540000065
Figure BDA0002377353540000066
时,则关系向量r表示一对多关系;当
Figure BDA0002377353540000067
Figure BDA0002377353540000068
时,则关系向量r表示多对一关系;当
Figure BDA0002377353540000069
Figure BDA00023773535400000610
时,则关系向量r表示多对多关系。
相同类型的实体在向量空间中常常会聚集到比较相近的区域,如关系对应的头部实体h通常为人名,尾部实体t通常为地名,在向量空间中,人名会较为集中地分布在一个区域,地名则会集中分布在另一个区域。如图3所示,聚集在一个区域的实体往往较难区分,容易导致错误的预测。因此,我们在替换头尾实体时尽可能的选择语义相近的实体,以提高模型的区分度,这里我们通过开放领域数据库中的实体标签可以对实体类型进行准确分类,如:周杰伦-人物。
(4)根据领域知识推理模型判断目标命名实体关系,给出关联搜索结果。

Claims (6)

1.一种基于知识图谱的命名实体识别方法,其特征在于,包括以下步骤:
(1)从知识库中抽取命名实体,得到关系三元组集合;
(2)构造超平面对实体进行投影,得到改进的TransE模型;
(3)利用改进的TransE模型对关系三元组集合进行训练,得到领域知识推理模型;
(4)根据领域知识推理模型判断目标命名实体关系,给出关联搜索结果。
2.根据权利要求1所述的基于知识图谱的命名实体识别方法,其特征在于:所述知识库为开放域知识库。
3.根据权利要求1所述的基于知识图谱的命名实体识别方法,其特征在于:所述关系三元组集合用OWL语言表述。
4.根据权利要求1所述的基于知识图谱的命名实体识别方法,其特征在于,所述步骤(2)具体包括:
(21)对于不同的关系向量
Figure FDA0002377353530000013
基于n-1维向量
Figure FDA0002377353530000014
Figure FDA0002377353530000015
构造过
Figure FDA0002377353530000016
的不同的超平面Wi
(22)计算如下改进的TransE模型:
Figure FDA0002377353530000011
其中,(hi,ri,ti)为第i个关系三元组,hi、ri、ti分别为第i个头实体、关系向量、尾实体,均为n维向量;
Figure FDA0002377353530000017
分别为hi、ti在超平面Wi上的投影。
5.根据权利要求1所述的基于知识图谱的命名实体识别方法,其特征在于,所述步骤(3)具体包括:
(31)设置正采样训练集S与负采样训练集S′,其中,S为正确的关系三元组集合,S′随机替换了正确的关系三元组中任意两项得到的关系三元组集合;
(32)采用最大间隔法对改进的TransE模型进行训练,得到领域知识推理模型,损失函数L如下:
Figure FDA0002377353530000012
其中,γ是取值大于0的间隔距离参数,[F]+为正值函数,当F>0时,[F]+=F,当F<0时,[F]+=0,梯度更新时计算f(hi,ri,ti)和f(hi′,ri′,ti′)的值。
6.根据权利要求4所述的基于知识图谱的命名实体识别方法,其特征在于,步骤(31)中,所述随机替换的策略为:
对于1)每个头实体对应的尾实体的平均数量
Figure FDA0002377353530000018
2)每个尾实体对应的头实体的平均数量
Figure FDA0002377353530000019
Figure FDA00023773535300000110
Figure FDA00023773535300000111
时,则关系向量r表示一对一关系;当
Figure FDA00023773535300000112
Figure FDA00023773535300000113
时,则关系向量r表示一对多关系;当
Figure FDA00023773535300000114
Figure FDA00023773535300000115
时,则关系向量r表示多对一关系;当
Figure FDA0002377353530000021
Figure FDA0002377353530000022
时,则关系向量r表示多对多关系。
CN202010071248.2A 2020-01-21 2020-01-21 一种基于知识图谱的命名实体识别方法 Pending CN111241840A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010071248.2A CN111241840A (zh) 2020-01-21 2020-01-21 一种基于知识图谱的命名实体识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010071248.2A CN111241840A (zh) 2020-01-21 2020-01-21 一种基于知识图谱的命名实体识别方法

Publications (1)

Publication Number Publication Date
CN111241840A true CN111241840A (zh) 2020-06-05

Family

ID=70867403

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010071248.2A Pending CN111241840A (zh) 2020-01-21 2020-01-21 一种基于知识图谱的命名实体识别方法

Country Status (1)

Country Link
CN (1) CN111241840A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112035672A (zh) * 2020-07-23 2020-12-04 深圳技术大学 一种知识图谱补全方法、装置、设备以及存储介质
CN112069326A (zh) * 2020-09-03 2020-12-11 Oppo广东移动通信有限公司 知识图谱的构建方法、装置、电子设备及存储介质
CN112257417A (zh) * 2020-10-29 2021-01-22 重庆紫光华山智安科技有限公司 一种多任务命名实体识别训练方法、介质及终端
CN112468440A (zh) * 2020-10-28 2021-03-09 北京工业大学 基于知识图谱的工控***攻击线索发现***
CN112668719A (zh) * 2020-11-06 2021-04-16 北京工业大学 基于工程能力提升的知识图谱构建方法
CN112784066A (zh) * 2021-03-15 2021-05-11 中国平安人寿保险股份有限公司 基于知识图谱的信息反馈方法、装置、终端和存储介质
CN112966511A (zh) * 2021-02-08 2021-06-15 广州探迹科技有限公司 一种实体词识别方法及装置
CN114417845A (zh) * 2022-03-30 2022-04-29 支付宝(杭州)信息技术有限公司 一种基于知识图谱的相同实体识别方法和***

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180144252A1 (en) * 2016-11-23 2018-05-24 Fujitsu Limited Method and apparatus for completing a knowledge graph
CN109213872A (zh) * 2018-09-11 2019-01-15 中国电子科技集团公司第二十八研究所 基于知识表示学习的实体关系预测方法及预测***
CN110275959A (zh) * 2019-05-22 2019-09-24 广东工业大学 一种面向大规模知识库的快速学习方法
CN110378489A (zh) * 2019-07-30 2019-10-25 哈尔滨工程大学 基于实体超平面投影的知识表示学习模型

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180144252A1 (en) * 2016-11-23 2018-05-24 Fujitsu Limited Method and apparatus for completing a knowledge graph
CN109213872A (zh) * 2018-09-11 2019-01-15 中国电子科技集团公司第二十八研究所 基于知识表示学习的实体关系预测方法及预测***
CN110275959A (zh) * 2019-05-22 2019-09-24 广东工业大学 一种面向大规模知识库的快速学习方法
CN110378489A (zh) * 2019-07-30 2019-10-25 哈尔滨工程大学 基于实体超平面投影的知识表示学习模型

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ZHEN WANG 等: "Knowledge Graph Embedding by Translating on Hyperplanes", vol. 28, no. 28, pages 1112 - 1119 *
李继光 等著: "《大数据背景下数据挖掘及处理分析》", vol. 1, 中国海洋大学出版社, pages: 186 - 187 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112035672A (zh) * 2020-07-23 2020-12-04 深圳技术大学 一种知识图谱补全方法、装置、设备以及存储介质
CN112035672B (zh) * 2020-07-23 2023-05-09 深圳技术大学 一种知识图谱补全方法、装置、设备以及存储介质
CN112069326A (zh) * 2020-09-03 2020-12-11 Oppo广东移动通信有限公司 知识图谱的构建方法、装置、电子设备及存储介质
CN112468440A (zh) * 2020-10-28 2021-03-09 北京工业大学 基于知识图谱的工控***攻击线索发现***
CN112468440B (zh) * 2020-10-28 2022-11-15 北京工业大学 基于知识图谱的工控***攻击线索发现***
CN112257417A (zh) * 2020-10-29 2021-01-22 重庆紫光华山智安科技有限公司 一种多任务命名实体识别训练方法、介质及终端
CN112668719A (zh) * 2020-11-06 2021-04-16 北京工业大学 基于工程能力提升的知识图谱构建方法
CN112966511A (zh) * 2021-02-08 2021-06-15 广州探迹科技有限公司 一种实体词识别方法及装置
CN112966511B (zh) * 2021-02-08 2024-03-15 广州探迹科技有限公司 一种实体词识别方法及装置
CN112784066A (zh) * 2021-03-15 2021-05-11 中国平安人寿保险股份有限公司 基于知识图谱的信息反馈方法、装置、终端和存储介质
CN112784066B (zh) * 2021-03-15 2023-11-03 中国平安人寿保险股份有限公司 基于知识图谱的信息反馈方法、装置、终端和存储介质
CN114417845A (zh) * 2022-03-30 2022-04-29 支付宝(杭州)信息技术有限公司 一种基于知识图谱的相同实体识别方法和***

Similar Documents

Publication Publication Date Title
CN111241840A (zh) 一种基于知识图谱的命名实体识别方法
CN106934012B (zh) 一种基于知识图谱的自然语言问答实现方法和***
Leng et al. Mining and matching relationships from interaction contexts in a social manufacturing paradigm
CN107193882B (zh) RDF数据上基于图匹配的why-not查询回答方法
CN109804371B (zh) 用于语义知识迁移的方法和装置
CN108229578B (zh) 基于数据、信息和知识三层图谱架构的图像数据目标识别方法
Muslea et al. Online query relaxation via bayesian causal structures discovery
Kalo et al. Knowlybert-hybrid query answering over language models and knowledge graphs
CN113239143B (zh) 融合电网故障案例库的输变电设备故障处理方法及***
Ramezani Modern statistical modeling in machine learning and big data analytics: Statistical models for continuous and categorical variables
Sanprasit et al. Intelligent approach to automated star-schema construction using a knowledge base
Blockeel Data mining: from procedural to declarative approaches
Zhang et al. AVT-NBL: An algorithm for learning compact and accurate naive bayes classifiers from attribute value taxonomies and data
Sbai et al. Using Reverse Engineering for Building Ontologies with Deeper Taxonomies from Relational Databases.
WO2023278154A1 (en) Apparatus and method for transforming unstructured data sources into both relational entities and machine learning models that support structured query language queries
CN111723301B (zh) 基于层次化主题偏好语义矩阵的关注关系识别及标注方法
Liu et al. An Embedded Co-AdaBoost based construction of software document relation coupled resource spaces for cyber–physical society
Hou et al. Domain transformation on biological event extraction by learning methods
Sun et al. Few-Shot Ontology Alignment Model with Attribute Attentions
Komorniczak et al. torchosr—A PyTorch extension package for Open Set Recognition models evaluation in Python
Anam et al. Schema mapping using hybrid ripple-down rules
CN116226686B (zh) 一种表格相似性分析方法、装置、设备和存储介质
van Heerden Self-organizing feature maps for exploratory data analysis and data mining: A practical perspective
Beibei Automatic Integration Algorithm of Vocal Performance Learning Materials Based on Multidimensional Association Rules
US11983185B2 (en) Systems and methods for machine learning-based query context generation and query response handling

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200605

RJ01 Rejection of invention patent application after publication