CN109271530A - 一种疾病知识图谱构建方法和平台***、设备、存储介质 - Google Patents

一种疾病知识图谱构建方法和平台***、设备、存储介质 Download PDF

Info

Publication number
CN109271530A
CN109271530A CN201811205974.8A CN201811205974A CN109271530A CN 109271530 A CN109271530 A CN 109271530A CN 201811205974 A CN201811205974 A CN 201811205974A CN 109271530 A CN109271530 A CN 109271530A
Authority
CN
China
Prior art keywords
knowledge
entity
encyclopaedia
data
disease
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811205974.8A
Other languages
English (en)
Inventor
蒋小云
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Changsha Hanyun Information Technology Co Ltd
Original Assignee
Changsha Hanyun Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Changsha Hanyun Information Technology Co Ltd filed Critical Changsha Hanyun Information Technology Co Ltd
Priority to CN201811205974.8A priority Critical patent/CN109271530A/zh
Publication of CN109271530A publication Critical patent/CN109271530A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • G16H70/20ICT specially adapted for the handling or processing of medical references relating to practices or guidelines

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Epidemiology (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Bioethics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种疾病知识图谱构建方法及其***、设备、存储介质,属于疾病知识图谱技术领域。其中,疾病知识图谱构建方法,包括以下步骤:A、信息抽取:从多源数据库中提取或学***台***、设备和存储介质。针对现有技术中存在的问题,它从多个数据源中抽取实体、属性及其之间的关系,并进行融合、加工,可以快速构建规范化和标准化的疾病知识图谱。

Description

一种疾病知识图谱构建方法和平台***、设备、存储介质
技术领域
本发明涉及疾病知识图谱技术领域,尤其涉及一种疾病知识图谱构建方法及其***、设备、存储介质。
背景技术
知识图谱的前身是语义网,它吸收了语义网、本体在知识组织和表达方面的理念,使得知识更易于在计算机之间和计算机与人之间交换、流通和加工。具体来说,一个知识图谱由模式图、数据图及两者之间的关系组成:模式图对人类知识领域的概念层面进行描述,强调概念及概念关系的形式化表达,模式图中节点是概念实体,边是概念间的语义关系,如part-of;数据图对物理世界层面进行描述,强调一系列客观事实。数据图中的节点有两类,一是模式图中的概念实体,二是描述性字符串,数据图中的边是具体事实的语义描述;模式图和数据图之间的关系指数据图的实例与模式图的概念之间的对应,或者说模式图是数据图的模具。
著名的通用知识图谱中有,谷歌“Knowledge Graph”、搜狗“知立方”、YAGO、DBpedia等,它们具有规模大、领域宽,包含大量常识等特点。目前,医学是知识图谱应用最广的垂直领域之一,如上海曙光医院构建的中医药知识图谱、本体医疗知识库SNOMED-CT,IBM Watson Health等应用近两年也开始进入人们视线。
知识图谱是智能大数据的前沿研究问题,它以独有的技术优势顺应了信息化时代的发展,比如渐增式的数据模式设计;良好的数据集成;现有RDF、OWL等标准支持;语义搜索和知识推理能力等。在医学领域,随着区域卫生信息化及医疗信息***的发展,积累了海量的医学数据。如何从这些数据中提炼信息,并加以管理、共享及应用,是推进医学智能化的关键问题,是医学知识检索、临床诊断、医疗质量管理、电子病历及健康档案智能化处理的基础。
互联网和电子病例带来了医疗数据的***性增长,然而这些数据在语种、主题、存储等方面都存在较大差异,尤其在医学领域的疾病知识图谱需要具备专业性、准确性和可应用性等条件。现有的研究成果多集中在特定数据集上,普遍存在算法准确率低、限制条件多、扩展性差等问题,同时知识复用、实体消歧等问题也有待进一步研究。由于医学自身的专业性,现有通用领域的知识图谱构建技术应用到医学领域构建成本高,需要花费大量的时间和人力投入,并且还得不到能准确刻画疾病的知识图谱。疾病知识图谱的构建相对于通用领域的知识图谱具有构建难度大、效率低,难以应用到实际场景等特点,急需适用于医学领域的知识图谱构建框架。
中国发明专利申请,公开号:CN106776711A;公开日:2017年5月31日,公开了一种基于深度学习的中文医学知识图谱构建方法。包括:从数据源获取医疗领域相关数据;使用分词工具对非结构化数据进行分词,使用RNN完成序列标注任务以识别医疗相关的实体,实现知识单元的抽取;对实体进行特征向量的构建,使用RNN进行序列标注并完成知识单元间关系的识别;进行实体对齐后,利用提取的实体以及实体之间的关系构建知识图谱。本发明巧妙地将循环神经网络用于知识单元抽取和知识单元间关系识别,能很好地完成对非结构化数据的处理。该发明提出适用于医学领域的特征来进行网络的训练任务,相对于通用特征而言更能够代表医学实体,使得抽取出的知识单元和知识单元间的关系更加准确、全面。但仍存在信息学习过程中的知识冲突问题。
中国发明专利申请,公开号:CN108492887A,公开日:2018.09.04;公开了一种医疗知识图谱构建方法及装置,能够充分利用数据驱动和知识驱动来构建知识图谱,解决临床上相同类型的医疗实体间联系不紧密的技术问题。该方法包括:通过自然语言处理技术分词从医疗资料中抽取目标实体;根据Apriori算法确定指定类实体的频繁项集,得到所述指定类的实体组;将所述目标实体以及所述实体组作为知识图谱中的节点,计算每一节点之间的强度指标,得到医疗知识图谱;将构建的所述医疗知识图谱存储在Neo4j图数据库中。该专利中实体及属性关系抽取方法中,数据库的来源过于单一,在知识图谱的构建过程中,不可避免地会出现一些冲突,但该专利没有给出实体、概念或属性的冲突解决的方法,会限制其推广应用。
中国发明专利申请,公开号:CN107145744A;公开日:2017.09.08,公开一种医学知识图谱的构建方法、装置及辅助诊断方法,医学知识图谱的构建方法包括:根据医学数据库构建用户词典;处理电子病历数据并进行命名实体识别;将识别的各个实体建立关联关系;根据该关联关系,建立医学知识图谱。基于医学知识图谱的辅助诊断方法包括:获取患者的主诉数据和检查数据并进行处理,得到患者的症状实体和体征实体;在医学知识图谱中查找与症状实体和体征实体相关联的疾病实体,分别计算每个疾病实体在其对应的症状实体与体征实体构成的集合下的后验概率;输出后验概率最大的疾病实体及其关联节点对应的数据。该发明为临床医学提供智能化的辅助诊断,从而减轻医护人员工作负担,缓解医疗压力,降低医疗事故的发生。该专利的数据源来源过于单一,且该专利重点在于使用已经构建完成的医学知识图谱为患者进行诊断,存在信息学习过程中的知识冲突问题。
综上,现有技术中急需构建一种全面的、准确的、规范化和标准化的疾病知识图谱。
发明内容
1.发明要解决的技术问题
为了克服上述技术问题,本发明提供了一种疾病知识图谱构建方法及其***、设备、存储介质。它从多个数据源中抽取实体、属性及其之间的关系,并进行融合、加工,可以快速构建规范化和标准化的疾病知识图谱。
2.技术方案
为解决上述问题,本发明提供的技术方案为:
第一、本发明提出了一种疾病知识图谱构建方法,包括以下步骤:
A、信息抽取:从多源数据库中提取或学习实体、属性以及实体间的相互关系,形成本体化的知识表达;
B、知识融合:对知识进行整合,以消除矛盾和歧义;
C、知识加工:对于经过融合的知识,经过质量评估之后,加入到知识库中。
进一步地,步骤C之后还包括:D、知识图谱的更新。
第二、本发明提供了一种疾病知识图谱平台***,根据以上所述的一种疾病知识图谱构建方法,包括信息抽取模块,用于从多源数据库中提取或学习实体、属性以及实体间的相互关系,形成本体化的知识表达;知识融合模块:用于对知识进行整合,以消除矛盾和歧义;知识加工模块:用于对于经过融合的知识,经过质量评估之后,加入到知识库中。
第三、本发明提供了一种设备,所述设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行如以上所述的方法。
第四、本发明提供了一种存储有计算机程序的存储介质,该程序被处理器执行时实现如以上所述的方法。
3.有益效果
采用本发明提供的技术方案,与现有技术相比,具有如下有益效果:
(1)本发明通过整合医学本体技术,基于本体对各类医学实体的自动抽提、并辅以友好的人机交互,能极大的提高疾病知识图谱的构建效率和质量;
(2)本发明从多个数据源中抽取实体、属性及其之间的关系,并进行融合、加工,可以快速构建规范化和标准化的疾病知识图谱。
附图说明
图1为本发明实施例的流程图之一;
图2为本发明实施例的流程图之二;
图3为支持向量机示意图之一;
图4为支持向量机示意图之二;
图5为中文三大百科属性图;
图6为本发明实施例提供的一种设备的结构示意图;
图7为本发明实施例的流程图之三;
图8为本发明实施例的架构图。
具体实施方式
为进一步了解本发明的内容,结合附图及实施例对本发明作详细描述。
实施例1
一种疾病知识图谱构建方法,如图1所示,包括以下步骤:
A、信息抽取:从多源数据库中提取或学习实体、属性以及实体间的相互关系,形成本体化的知识表达;
B、知识融合:对知识进行整合,以消除矛盾和歧义;
C、知识加工:对于经过融合的知识,经过质量评估之后,加入到知识库中。
进一步地,如图2所示,步骤C之后还包括:D、知识图谱的更新。
如图7所示,E1、开始图谱构建;E2、进入疾病资料库;E3、选择待构建知识图谱的特定疾病;E4、算法构建疾病知识图谱雏形;E5、人工交互确认疾病知识图谱;E6、专家审核知识图谱构建质量;E7、判断审核是否通过;是,结束图谱构建;否,重复步骤E5-E7。
实施例2
本实施例的一种疾病知识图谱构建方法,基本步骤与实施例1的技术方案类似,其中,实施例1中的步骤A中所述的多源数据库为开放链接数据库和百科。步骤A中实体的学习或提取步骤包括:A101、实体抽取或学习,具体内容如下:
知识图谱构建的相关数据源,包括结构化数据、半结构化的数据以及非结构化数据。本发明中所述的开放链接数据和开放知识库严格而言属于半结构化的数据库,这些数据通常以图形式的数据结构存储。最知名的为YAGO、DBPedia和Freebase,这些数据源通常具备很高的覆盖面,同时在特定的领域也在相当数量的数据;因此,既可用于通用知识图谱的构建,也可以用于行业知识图谱的构建。
行业知识库和行业垂直网站也属于半结构化数据,它们描述的目标是特定的领域,虽然在描述范围方面比较窄,但正因为专注,因此在数据一致性和完整性方面较通用的知识库完善。这些知识库或垂直网站通常具备自己的结构,在抽取其中的知识时,通常仅需要按照其结构解析即可。
本发明的百科是指***、互动百科和百度百科;在线百科是互联网中存在公开存在的最大数量的用户生成数据集合,这些数据具备一定的结构,因此,也属于半结构化数据。最知名的当属***,中文领域则还有互动百科和百度百科。百科中的内容虽然是以HTML形式的网页存在中,但其中包含了许多结构化的信息,具体而言包括:文章标题、分类标签、分类***、信息模块、重定向、消歧、摘要、文本。
实体(概念)的提取方法为:1)从开放链接数据集中抽取概念和实体,这样做的好处是,在开放链接数据中,例如YAGO和DBPedia等,有丰富的概念和实体信息,而且还经常以一定的结构进行组织,因此,从这类数据源中抽取概念和实体非常方便,只需要直接把这些概念和实体解析成知识图谱形式的概念和实体即可。2)从百科中抽取概念和实体,这样做的好处是,本发明把百科文章的标题作为实体的候选,而把百科中的分类作为概念的候选,在百科中,存在同一标题对应多篇文章情形,这种情形使用消歧页面来表示,对于这类概念或实体,需要使用不同的释义标签对同名的概念或实体进行区分。
A102、实体对齐(同义关系)学习
关于知识图谱的实体(概念)对齐的目标是,先把从三类百科(***、互动百科和百度百科)中学习到的实体(概念)中描述同一目标的内容进行合并,再把经过合并后的结果实体集与从开放链接数据(YAGO和DBPedia等)中抽取的实体进行合并。
所述从百科中学习到的实体中描述同一目标的内容进行合并包括:基于百科结构化数据的百科实体对齐方法、基于自监督的百科实体对齐方法、基于语言学模式的方法和基于CRF的开放同义关系学习。
A1021、基于百科结构化数据的百科实体对齐:
百科实体对齐分为单个百科内的实体对齐和多个百科之间的实体对齐,本发明是采用讨论单个百科内的实体对齐方法。
同一百科中的实体对齐主要依赖于当前百科中的两类结构化数据,重定向页面和信息模块。重定向页面的用途即在于对当前百科中表示同一事物的不同文章进行合并,也就是文章对齐;使用重定向页面进行实体对齐时,仅需要遍历所有的页面,如果其中包括重定向标记,则把对应的源文章标题和重定向到的目标文章标题记录下来,标识它们是同一实体。
另外,在百科的信息模块中也包含了部分同义信息,这部分同义信息虽然是在同一个页面中,但如果其中描述的具备同义关系的实体对应了多篇文章,那么,这些文章对应的实体需要合并。具体而言,信息模块中包含的字段名为“别称”(百度百科中)、“中文别称”(互动百科中)等字段列举了当前文章对应实体的同义实体。
A1022、基于的自监督百科实体对齐方法
在进行百科之间的实体合并时,最直观的方法是把标题相同的文章对应的实体进行合并,以及把对应同义集合中有相同实体名的实体进行合并;然而这种做法的问题在于并非标题相同的文章一定代表同一实体,典型的例子就是具备多种释义(在百科中使用消歧页面表示)的文章。对于具备多个义项的文章,则需要一种理深层次的方法来判别它们是否指代同一实体。另一方面,并非标题不同的文章代表的就一定是不同的实体,可能是同一实体的不同名称,这种现象不仅在不同的百科之间存在,在同一百科中也有少量存在。因此,也同样需要一种更深层次的对齐方法。
一种可能的方式是对文章之间进行两两比较,以判别它们是否指代同一个实体。然而,这种做法显然是不现实的,因为任意文章间的两两对比意味着需要进行超过50万亿次比较;因此,在进行两两比较前,需要一种方法来减少比较的次数。
所述基于自监督的百科实体对齐方法包括以下步骤:选择候选实体,对每个候选实体进行特征选取,自动生成训练语料,语料构建完成后,训练模型,训练完成后,对目标数据修订本进行预测,目标数据集合的格式和训练文件的格式一致,使用命令svmpredict完成。
(1)候选实体选择
在对资源进行详细比较时,首先利用索引的方法得到相似度比较高的文章作为需要进行相似度比较的候选文章,以减少比较的次数。
候选文章选取的具体过程如下:首先对每篇文章的标题和内容建立倒排索引,选取候选文章时,把当前文章在倒排索引中进行检索,选择相似度高的一定数量的文章作为候选实体。
(2)特征选取
对于每个候选实体,都有一篇百科文章与之对应,其中包含了丰富的特征可用于辅助分类决策。本发明所使用的特征有:a、文章内容之间的相似度,使用余弦相似度计算,文章之间的相似度越高,它们越有可能指代同一目标。b、文章标题之间的余弦相似度:指代同一目标的不同文章的标题在大部分情形下是相似的。
(2)自动生成训练语料
特征选取完毕后,接下来构建训练模型需要的语料。通常,在监督机器学习方法中,需要人工标注训练语料,在大规模的互联网规模的应用中,人工标注语料非常困难,所标注的语料在特征覆盖面方面很容易具备片面性;因此,需要一种能够自动生成训练语料的方法。本发明借助于本科中的结构化信息以及一些通用的启发式规则来生成训练语料。
(3)模型训练
语料构建完毕后,接下来便可以训练模型了。使用的实现是libSVM,它是一个简单易用的软件包,可以解决分类问题、回归问题和分布估计问题等;同时,还提供了四种常用的核函数:线性核函数、多项式核函数、径向基核函数和函数核函数。包括训练数据文件生成、特征值缩放、训练等。
(4)判别
训练完成后,即可对目标数据修订本进行预测,目标数据集合的格式和训练文件的格式一致,使用命令svmpredict完成。
候选实体确定以后,接下来需要进行判别了;对于两个候选实体,它要么是同义实体,要么不是,这是一个典型的分类问题。因此,本发明采用机器学习分类算法来解决此问题,釆用的模型为支持向量机。
支持向量机由Christopher J.C.Burges于1998年提出,基本目标是把一堆n维空间里的点用n-1维的曲面分开来。为了详细说明,在n=2的情况,如图3和4所示,此时是一个线性分类器,对应的分割曲面是一条曲线;在图3中,需要寻求一个线性的分类器,把黑点和白点分开来;显然,直线H2和H3都可以完成这个划分任务,但是H3被最终选取的结果,因为根据这条边界划分,离边界最近的黑点和白点(被称为支持向量),离边界距离的总和达到最小。这个划分过程使用数学表达如以下公式所示,
在一个训练集合D中,xi是一个p维向量,yi可以是1或者-1,代表两个不同的类别。如果此数据集是线性可分的,则一定可以找到两类别的线性边缘wx-b=1和wx-b=-1,使得两个类别内的数据点完全分开,这样就可以基于这两个边缘定义一个离两个边缘等距离的分类器wx-b=0,如图4所示,其中w代表一个新的向量(训练得到),b/||w||代表边缘到分离器的距离。
在现实应用的数据中,可能不存在线性可分的边界,此时可以通过数学方法将它从低维空间转化为高维空间,然后它就变得存在线性可分的边界了。这个投影过程采取了一种叫核的技术,转换过程中使用的函数叫做核函数,常见的核函数有线性核函数、多项式核函数、径向基核函数和Sigmoid核函数等。
A1023、基于语言学模式的方法
在中文语言中,有一些固定的语言模式用于描述同义关系(实体对齐),例如:“X又名Y”、“X也叫Y”、“X别称Y”等。基于语言模式的方法非常简单,人工编写好模式后,把这些模式在海量的句子中进行匹配,即可得到大量的同义关系。这类方法的准确度通常比较高,但是召回率却非常低,因为不可能人工把所有的描述同义关系的语言模式都列举出来。
A1024、基于CRF的开放同义关系学习
前述使用语言学模式的方法提到,在中文语言中,有一些常用的句法模式是用来表达同义关系的;利用一些常用的规则,己经成功抽取了相当数量的同义实体。然而,手工编写句法模式是难以完全的,因此需要一种更加开放的学习方法。
在机器学习中,序列化标注问题指为一个观察序列中的每个组成单元赋予类别标签,其输入X是一个观测序列,输出Y是一些需要依据观测序列来推导的隐式状态;所有的输出yi形成一条链,每个y(i-1)至少和yi之间有一条边相连,这也保证了它们是遵守一阶马尔可夫假设的。常用的序列化模型有隐马尔可夫模型,最大熵马尔可夫模型和CRF;本发明采用的是CRF模型,中文翻译为条件随机场或条件随机域,是一种机器学习模型,在自然语言处理的词性标注、中文分词、命名实体识别等方面都有比较好的应用效果。CRF的理论是基于隐马尔可夫模型和最大熵马尔可夫模型。
基于CRF的开放式同义关系抽取/学习算法的过程,主要包括五步:选取作为同义关系的候选实体,标注机器学习所需要的语料,确定需要训练模型需要使用的特征,训练同义关系抽取模型,以及把学习的模型用于更丰富的句子中以抽取同义实体。本发明把从文本句子中抽取同义实体建模成序列化标注问题,并使用CRF作为机器学习模型。
实施例3
本实施例的一种疾病知识图谱构建方法,基本步骤与实施例1、2的技术方案类似,其中,步骤A中实体的学习或提取步骤还包括:A103、上下位关系学习和整合,包括从开放链接数据集中抽取上下位关系、从百科中抽取上下位关系、基于CRF的开放上下位关系学习和分类树整合。
A1031、从开放链接数据集中抽取上下位关系
在开放链接数据集中,上下位关系是使用明确的机制来描述的,因此,直接进行解析即可获取,针对每个数据集编写相应的规则即可。
A1032、从百科中抽取上下位关系
百科中描述了两种上下位关系,一种是类别之间,另一种是类别和文章之间,前者对应概念间的层次关系,后者对应实体和概念之间的从属关系。
中文***和互动百科均有比较完整的分类体系,从中可以直接获取一个原始的分类***;百度百科中也有相应的分类体系,但是这些分类是离散的,没有形成严格的分类体系。
A1033、基于开放上下位关系学习方法
基于CRF的开放上下位关系学习与基于CRF的开放同义关系学习非常相似;首先,需要验证开放学习的可行性,然后进行建模、特征选取、自动语料标注、模型训练和关系抽取。
A1034、分类树整合
学习/抽取了大量的上下位关系,接下来需要把它们组织成一个以层次结构组织的分类体系。组织的方法为:仅需把这些上下位关系两端的实体进行合并即可,对于两个实体A和B,如果A和B的名称相同,或者A和B同时位于某一实体的同义集合中,则把A和B进行合并。
实施例4
给概念添加属性属于数据模式层的构建,一个属性的定义包括几个部分,属性名、属性的定义域和属性的值域。当概念的属性被定义好,属于该概念的实体默认具备此属性,需要填充属性的值即可。概念属性的更改会影响到直接属于它的实体,以及它所有直接子概念、间接子概念以及这些概念所管辖的实体,因此,概念属性的定义非常重要,在现有的大部分的知识库中都是通过人工的方式定义的。
本实施例提出了一种疾病知识图谱构建方法,基本步骤与实施例1、2、3的技术方案类似。其中,步骤A中,属性的提取步骤为:首先,通过一系列的方法从开放链接数据集中获取概念的属性;然后,从在线百科中学习实体的属性,并对实体属性进行往上规约从而生成概念的属性。
A201、从开放链接数据集中获取实体的属性
在开放链接数据集中,每个概念都有相应的属性,而且这些属性都经过人工校验的,可靠性非常高,因此,直接把他们作为本文构建的知识图谱中的对应的概念的属性。而且,所使用的两个数据集,DBPedia和YAGO,它们之间已经做过对齐,因而合并后所有属性中并不会出现重复的属性。
A202、从在线百科中学习实体的属性,并对实体属性进行往上规约从而生成概念的属性。
百科中的信息模块中包含了大量以“属性值”对出现的信息,信息模块的示例如图3所示,(1)、(2)和(3)分别对应是百度百科、互动百科和***;实线框中的是属性名,虚线框中的为属性值。需要注意的是,百科中的信息模块虽然基于概念定义的,但是在概念对应的百科文章页面中并没有直接显示,而是在属于这些概念的实体中体现的。
进一步地,步骤A中,还包括规则和公理的学***台,由用户针对领域和应用场景添加相应的规则和公理。
实施例5
本实施例提出了一种疾病知识图谱构建方法,基本步骤与实施例1、2、3、4的技术方案类似。其中,步骤A中还包括学习过程中的冲突解决,所述的冲突解决包括冲突检测和冲突解决方法。
在知识图谱的构建过程中,不可避免地会出现一些冲突。这些冲突主要来自两个方面,不同数据源造成的冲突和不同构建方法造成的冲突。具体的冲突可能性分析如下:
(1)概念与实体的区分:有些数据集中认为某个事物为概念,而在其它的数据集中则认为是实体,此时即造成了真实意义上的冲突。
(2)上下位关系学习:造成冲突的示例如:对于两个实体或概念和在一些数据集中认为A是B的上位,而在另一些数据集中则认为B是A的上位,这也造成了冲突;更加复杂的还包括在层次结构图中形成了闭环。
(3)属性:主要体现在单值型属性下,如果学习到了不同的值,也表示存在冲突;对于多值型属性,通常仅需要把属性值合并。
所述的冲突检测(探测)的方法包括概念与实体的区分,上下位关系中的冲突和单值型属性冲突。针对可能产生冲突的发生点,本发明使用了特定的探测算法进行探测,所采用的探测方法如下:
(1)概念与实体的区分:因为主要产生于不同的数据源中,因此只需要对各数据源的实体和概念分开建立索引;然后,对于一个数据源中的实体和概念,在其它数据源的索引中查找;如果当前数据源中为实体,而在其它数据源中则作为概念,则检测到冲突;
(2)上下位关系中的冲突:由于层次结构图应该为一个有向无环图,其中不能存在闭环,因此本发明基于有向无环图中的闭环寻找算法来检测冲突。具体使用的方法基于拓扑排序的方法,基本过程如下:找到图中所有入度为零的顶点,删除该顶点及相关的出边,如此循环到无顶点输出;若能把整个图中的结点都删除,则说明图中不存在闭环,否则说明图中存在闭环。
(3)对于单值型属性进行遍历,如果有多个值,说明存在冲突。
所述冲突解决方法,主要釆用三种方法来解决学习过程中的冲突,一种是基于数据源可靠性的方法,第二种是基于支持因素数目的方法,第三种则是基于人工解决的方法。
(1)基于数据源可靠性的冲突解决方法
这种方法需要对知识图谱构建数据来源的结构化或半结构化数据源的可靠性进行评分,通常是基于统计的方法与基于人工的方法相结合。本发明最后确定的数据源可靠性从高到低依次为,DBpedia(0.8)、YAGO(0.75)、***(0.5),互动百科(0.3)和百度百科(0.25),括号中的数值为可信度。数据源可靠性确定以后,当冲突发生于数据源之间时,则按数据源的可靠性进行取舍。例如,当一个单值型属性的值在***中取值为A,而在百度百科中则取值为B,由于***的可靠性高于百度百科,因此应该选取A作为该属性的值。
(2)基于支持因素数目的冲突解决方法
对于从文本中通过机器学习所得的知识,由于无法依据数据源的可靠性进行取舍,因此需要使用其它的方法。在机器学习的方法中,对于每条知识都有支持其为真的依据,例如在基于CRF的开放同义关系学习中,对于一对学习到的同义实体,通常会有多个语言学模式来支持它,支持的数目即代表了一种可信度;因此,对于产生冲突的知识,可以依据支持的数目多少来进行裁决。
(3)基于人工的冲突解决方法
当自动的冲突解决方法无法完成判别时,需要人工的介入;或者在某些对于知识图谱的可靠性要求相当高的场景下,需要人工对自动解决方法的裁决结果进行校验和修正。
实施例6
本实施例提出了一种疾病知识图谱构建方法,基本步骤与实施例1、2、3、4、5的技术方案类似。其中,步骤D中所述知识图谱的更新包括数据模式层的更新和数据层的更新。
D101、数据模式层的更新
数据模式层的更新指概念层次的更新,包括概念的层次关系,同义关系和概念的属性定义等;这些更新主要来自两方面的驱动,一是在结构化和半结构化的数据源中的知识有更新,知识图谱也需要相应的更新;另一方面是因为使用的自动学习算法在语料添加、算法改进等方面变化时,所学习的知识发生变化,这些知识变化规约到数据模式层的变化。
对于数据模式层的变化,本发明通过对这些变更进行分类,对不同的分类使用不同的解决方法。
(1)对于概念的描述、图片及同义关系的变化,由于它们的变更所影响的仅为当前概念本身,因此,通常不需要进行额外处理,仅通过本发明前述中描述的构建方法进行更新即可。
(2)对于概念间的上下位关系的更新,由于会更新整个分类层次结构,因此需要谨慎处理;如果并未造成冲突,则不需要特殊处理,如果造成了闭环式的冲突,此时***检测到以后,由人工进行处理。
(3)对于概念的属性更新,如果是新的属性添加,依据本发明所述的方法进行处理即可;如果是对现有属性的更新,包括属性类型、值类型、值域的更新,***检测到后由人工进行处理;如果是对属性的删除,若属于当前概念的所有实体中该属性均已被移除,则可以把概念的属性直接移除,否则仍然需要人工确认。
D102、数据层的更新
依据在学习过程中所选取办法自动解决更新问题即可。
实施例7
本实施例提出了一种疾病知识图谱平台***,如图8为架构图,根据实施例1-6所述的一种疾病知识图谱构建方法,包括信息抽取模块,用于从多源数据库中提取或学习实体、属性以及实体间的相互关系,形成本体化的知识表达;知识融合模块:用于对知识进行整合,以消除矛盾和歧义;知识加工模块:用于对于经过融合的知识,经过质量评估之后,加入到知识库中。
进一步地,还包括知识图谱的更新模块,用于更新知识图谱的数据模式层和数据层。
实施例8
本实施例提出了一种设备,所述设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行如实施例1-6中任一项所述的方法。
本实施例还提出了一种存储有计算机程序的存储介质,该程序被处理器执行时实现如实施例1-6中任一项所述的方法。
图6为本发明一实施例提供的一种设备的结构示意图。
如图6所示,作为另一方面,本申请还提供了一种设备500,包括一个或多个中央处理单元(CPU)501,其可以根据存储在只读存储器(ROM)502中的程序或者从存储部分508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM503中,还存储有设备500操作所需的各种程序和数据。CPU501、ROM502以及RAM503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
以下部件连接至I/O接口505:包括键盘、鼠标等的输入部分506;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分507;包括硬盘等的存储部分508;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分509。通信部分509经由诸如因特网的网络执行通信处理。驱动器510也根据需要连接至I/O接口505。可拆卸介质511,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器510上,以便于从其上读出的计算机程序根据需要被安装入存储部分508。
特别地,根据本公开的实施例,上述任一实施例描述的方法可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括有形地包含在机器可读介质上的计算机程序,所述计算机程序包含用于执行上述任一实施例描述的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分509从网络上被下载和安装,和/或从可拆卸介质511被安装。
作为又一方面,本申请还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例的装置中所包含的计算机可读存储介质;也可以是单独存在,未装配入设备中的计算机可读存储介质。计算机可读存储介质存储有一个或者一个以上程序,该程序被一个或者一个以上的处理器用来执行描述于本申请的方法。
附图中的流程图和框图,图示了按照本发明各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这根据所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以通过执行规定的功能或操作的专用的基于硬件的***来实现,或者可以通过专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元或模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元或模块也可以设置在处理器中,例如,各所述单元可以是设置在计算机或移动智能设备中的软件程序,也可以是单独配置的硬件装置。其中,这些单元或模块的名称在某种情况下并不构成对该单元或模块本身的限定。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离本申请构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (10)

1.一种疾病知识图谱构建方法,其特征在于,包括以下步骤:
A、信息抽取:从多源数据库中提取或学习实体、属性以及实体间的相互关系,形成本体化的知识表达;
B、知识融合:对知识进行整合,以消除矛盾和歧义;
C、知识加工:对于经过融合的知识,经过质量评估之后,加入到知识库中。
2.根据权利要求1所述的一种疾病知识图谱构建方法,其特征在于,步骤C之后还包括:D、知识图谱的更新。
3.根据1所述的一种疾病知识图谱构建方法,其特征在于,步骤A中所述的多源数据库为开放链接数据库和百科,实体的提取步骤为:
A101、实体学习;
A102、实体对齐学习;
A103、上下位关系学习和整合;进一步地,
步骤A中,属性的提取步骤为:
A201、从开放链接数据集中获取实体的属性;
A202、从在线百科中学习实体的属性,并对实体属性进行往上规约从而生成概念的属性。
4.根据1所述的一种疾病知识图谱构建方法,其特征在于,步骤A中,还包括规则和公理的学习,所述的规则和公理的学习由用户针对领域和应用场景添加相应的规则和公理;优选地,步骤A还包括学习过程中的冲突解决,所述的冲突解决包括冲突检测和冲突解决方法。
5.根据权利要求3所述的一种疾病知识图谱构建方法,其特征在于,A102、实体对齐的学习方法为:先把从百科中学习到的实体中描述同一目标的内容进行合并,再把经过合并后的结果实体集与从开放链接数据中抽取的实体进行合并;优选地,步骤A103上下位关系学习和整合包括:从开放链接数据集中抽取上下位关系、从百科中抽取上下位关系、基于CRF的开放上下位关系学习和分类树整合;优选地,步骤D中所述知识图谱的更新包括数据模式层的更新和数据层的更新。
6.根据权利要求7所述的一种疾病知识图谱构建方法,其特征在于,所述从百科中学习到的实体中描述同一目标的内容进行合并包括:基于百科结构化数据的百科实体对齐方法、基于自监督的百科实体对齐方法、基于语言学模式的方法和基于CRF的开放同义关系学习;进一步地,所述基于自监督的百科实体对齐方法包括以下步骤:选择候选实体,对每个候选实体进行特征选取,自动生成训练语料,语料构建完成后,训练模型,训练完成后,采用支持向量机进行判别,对目标数据修订本进行预测,目标数据集合的格式和训练文件的格式一致,使用命令svmpredict完成。
7.根据权利要求6所述的一种疾病知识图谱构建方法,其特征在于,所述的冲突检测的方法包括概念与实体的区分,上下位关系中的冲突和单值型属性冲突;优选地,所述的冲突解决方法包括一种是基于数据源可靠性的方法,第二种是基于支持因素数目的方法,第三种则是基于人工解决的方法。
8.一种疾病知识图谱平台***,其特征在于,根据权利要求1-13所述的一种疾病知识图谱构建方法,包括信息抽取模块,用于从多源数据库中提取或学习实体、属性以及实体间的相互关系,形成本体化的知识表达;知识融合模块:用于对知识进行整合,以消除矛盾和歧义;知识加工模块:用于对于经过融合的知识,经过质量评估之后,加入到知识库中;优选地,还包括知识图谱的更新模块,用于更新知识图谱的数据模式层和数据层。
9.一种设备,其特征在于,所述设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行如权利要求1-7中任一项所述的方法。
10.一种存储有计算机程序的存储介质,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一项所述的方法。
CN201811205974.8A 2018-10-17 2018-10-17 一种疾病知识图谱构建方法和平台***、设备、存储介质 Pending CN109271530A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811205974.8A CN109271530A (zh) 2018-10-17 2018-10-17 一种疾病知识图谱构建方法和平台***、设备、存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811205974.8A CN109271530A (zh) 2018-10-17 2018-10-17 一种疾病知识图谱构建方法和平台***、设备、存储介质

Publications (1)

Publication Number Publication Date
CN109271530A true CN109271530A (zh) 2019-01-25

Family

ID=65196810

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811205974.8A Pending CN109271530A (zh) 2018-10-17 2018-10-17 一种疾病知识图谱构建方法和平台***、设备、存储介质

Country Status (1)

Country Link
CN (1) CN109271530A (zh)

Cited By (67)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109902828A (zh) * 2019-03-18 2019-06-18 中科院合肥技术创新工程院 基于多级知识单元的突发事件应急决策知识数据模型构建方法
CN109947950A (zh) * 2019-03-14 2019-06-28 长沙沃本智能科技有限公司 基于中间层核心本体的领域知识图谱的构建方法和装置
CN109960810A (zh) * 2019-03-28 2019-07-02 科大讯飞(苏州)科技有限公司 一种实体对齐方法及装置
CN110188147A (zh) * 2019-05-22 2019-08-30 厦门无常师教育科技有限公司 基于知识图谱的文献实体关系发现方法及***
CN110197280A (zh) * 2019-05-20 2019-09-03 中国银行股份有限公司 一种知识图谱构建方法、装置及***
CN110209839A (zh) * 2019-06-18 2019-09-06 卓尔智联(武汉)研究院有限公司 农业知识图谱构建装置、方法及计算机可读存储介质
CN110209589A (zh) * 2019-06-05 2019-09-06 北京百度网讯科技有限公司 知识库***测试方法、装置、设备和介质
CN110246590A (zh) * 2019-06-17 2019-09-17 上海米帝信息技术有限公司 一种血液病知识图谱数据库的构建方法
CN110245242A (zh) * 2019-06-20 2019-09-17 北京百度网讯科技有限公司 医学知识图谱构建方法、装置以及终端
CN110263183A (zh) * 2019-06-20 2019-09-20 珠海格力电器股份有限公司 一种智能家居决策支持***及决策支持方法
CN110289101A (zh) * 2019-07-02 2019-09-27 京东方科技集团股份有限公司 一种计算机设备、***及可读存储介质
CN110459321A (zh) * 2019-08-20 2019-11-15 山东众阳健康科技集团有限公司 一种基于证素的中医辅助诊断***
CN110457502A (zh) * 2019-08-21 2019-11-15 京东方科技集团股份有限公司 构建知识图谱方法、人机交互方法、电子设备及存储介质
CN110543573A (zh) * 2019-08-28 2019-12-06 珠海格力电器股份有限公司 一种基于知识图谱的垃圾分类方法及装置
CN110706772A (zh) * 2019-10-11 2020-01-17 北京百度网讯科技有限公司 一种排序方法及装置、电子设备、存储介质
CN110704630A (zh) * 2019-04-15 2020-01-17 中国石油大学(华东) 一种标识化关联图谱自优化机制
CN110781249A (zh) * 2019-10-16 2020-02-11 华电国际电力股份有限公司技术服务分公司 基于知识图谱的火电厂多源数据融合方法与装置
CN110807102A (zh) * 2019-09-19 2020-02-18 平安科技(深圳)有限公司 知识融合方法、装置、计算机设备和存储介质
CN110825721A (zh) * 2019-11-06 2020-02-21 武汉大学 大数据环境下高血压知识库构建与***集成方法
CN110838368A (zh) * 2019-11-19 2020-02-25 广州西思数字科技有限公司 一种基于中医临床知识图谱的机器人主动问诊方法
CN110888942A (zh) * 2019-11-05 2020-03-17 天津大学 一种基于线性规划的本体包含公理学习方法
CN110909168A (zh) * 2019-09-23 2020-03-24 腾讯科技(深圳)有限公司 知识图谱的更新方法和装置、存储介质及电子装置
CN110909975A (zh) * 2019-10-11 2020-03-24 广东省科技基础条件平台中心 科研平台效益评估方法、装置
CN111027832A (zh) * 2019-11-28 2020-04-17 卓尔智联(武汉)研究院有限公司 一种税务风险确定方法、装置及存储介质
CN111028952A (zh) * 2019-11-27 2020-04-17 云知声智能科技股份有限公司 一种中文医学蕴含知识图谱构建方法及装置
CN111048167A (zh) * 2019-10-31 2020-04-21 中电药明数据科技(成都)有限公司 一种层级式病例结构化方法及***
CN111090683A (zh) * 2019-11-29 2020-05-01 上海勘察设计研究院(集团)有限公司 一种工程领域知识图谱构建方法及其生成装置
CN111191050A (zh) * 2020-01-03 2020-05-22 中国建设银行股份有限公司 知识图谱本体模型构建的方法和装置
CN111341456A (zh) * 2020-02-21 2020-06-26 中南大学湘雅医院 糖尿病足知识图谱生成方法、装置及可读存储介质
CN111444351A (zh) * 2020-03-24 2020-07-24 清华苏州环境创新研究院 一种行业工艺领域知识图谱构建方法及装置
CN111475653A (zh) * 2019-12-30 2020-07-31 北京国双科技有限公司 油气勘探开发领域的知识图谱的构建方法及装置
CN111507827A (zh) * 2020-04-20 2020-08-07 上海商涌网络科技有限公司 一种健康风险评估的方法、终端及计算机存储介质
CN111563891A (zh) * 2020-05-09 2020-08-21 吾征智能技术(北京)有限公司 基于颜色认知的疾病预测***
CN111625607A (zh) * 2019-12-27 2020-09-04 北京国双科技有限公司 油气知识图谱的构建方法、装置、电子设备和存储介质
CN111667894A (zh) * 2020-06-03 2020-09-15 长沙瀚云信息科技有限公司 基于rete算法规则引擎的医院电子病历质量监控和管理***
CN111723215A (zh) * 2020-06-19 2020-09-29 国家计算机网络与信息安全管理中心 基于文本挖掘的生物技术信息知识图谱构建装置与方法
CN111798987A (zh) * 2020-07-07 2020-10-20 云知声智能科技股份有限公司 一种实体关系抽取方法和设备
CN111831908A (zh) * 2020-06-24 2020-10-27 平安科技(深圳)有限公司 医疗领域知识图谱构建方法、装置、设备及存储介质
CN111916146A (zh) * 2020-07-27 2020-11-10 苏州工业园区服务外包职业学院 ***癌本体及其构建方法
CN111949799A (zh) * 2019-05-15 2020-11-17 广东小天才科技有限公司 一种通过知识融合生成学习图谱的方法及***
CN111950285A (zh) * 2020-07-31 2020-11-17 合肥工业大学 多模态数据融合的医疗知识图谱智能自动构建***和方法
CN111986799A (zh) * 2020-07-06 2020-11-24 北京欧应信息技术有限公司 一种以关节运动功能为核心的骨科知识图谱的构建***
CN112015905A (zh) * 2020-08-05 2020-12-01 河北工程大学 一种疲劳标志疾病知识图谱的构建方法
CN112037920A (zh) * 2020-08-31 2020-12-04 康键信息技术(深圳)有限公司 医疗知识图谱构建方法、装置、设备及存储介质
CN112182204A (zh) * 2020-08-19 2021-01-05 广东汇银贸易有限公司 构建中文命名实体标注的语料库的方法、装置
CN112182241A (zh) * 2020-09-24 2021-01-05 四川大学 一种空管领域知识图谱的自动化构建方法
CN112527924A (zh) * 2020-12-18 2021-03-19 清华大学 动态更新的知识图谱扩展方法及装置
CN112650821A (zh) * 2021-01-20 2021-04-13 济南浪潮高新科技投资发展有限公司 一种融合Wikidata的实体对齐方法
CN112735556A (zh) * 2019-10-28 2021-04-30 北京中医药大学 一种用于诊治失眠病症的中医古籍数据处理方法
CN112906826A (zh) * 2021-03-30 2021-06-04 平安科技(深圳)有限公司 基于多维度的知识图谱的融合方法、装置及计算机设备
CN113010688A (zh) * 2021-03-05 2021-06-22 北京信息科技大学 知识图谱构建方法、装置、设备及计算机可读存储介质
CN113220951A (zh) * 2021-05-17 2021-08-06 鞠悦 一种基于智能内容的医学临床支持方法和***
CN113268608A (zh) * 2021-05-27 2021-08-17 清华大学 知识概念构建方法和装置
WO2021196520A1 (zh) * 2020-03-30 2021-10-07 西安交通大学 一种面向税务领域知识图谱的构建方法及***
CN113761971A (zh) * 2020-06-02 2021-12-07 中国人民解放军战略支援部队信息工程大学 一种遥感影像目标知识图谱构建方法及装置
CN113821702A (zh) * 2021-11-24 2021-12-21 中国电子科技集团公司第二十八研究所 一种城市多维空间多元异构信息数据处理方法
CN113849579A (zh) * 2021-09-27 2021-12-28 支付宝(杭州)信息技术有限公司 一种基于知识视图的知识图谱数据处理方法和***
CN113901233A (zh) * 2021-10-13 2022-01-07 智联(无锡)信息技术有限公司 一种查询数据修复方法、***、计算机设备及存储介质
CN114153992A (zh) * 2021-12-28 2022-03-08 安徽富驰信息技术有限公司 一种领域知识图谱构建设备及其方法
CN114328980A (zh) * 2022-03-14 2022-04-12 来也科技(北京)有限公司 结合rpa及ai的知识图谱构建方法、装置、终端及存储介质
CN114758749A (zh) * 2022-03-23 2022-07-15 清华大学 基于妊娠期的营养饮食管理图谱创建方法及装置
CN115017331A (zh) * 2022-06-07 2022-09-06 深圳伯德睿捷健康科技有限公司 健康感知与认知方法及装置
CN116313118A (zh) * 2022-06-07 2023-06-23 拉萨卓友峰科技有限公司 应用于医疗数据处理的知识图谱构建方法
CN116431835A (zh) * 2023-06-06 2023-07-14 中汽数据(天津)有限公司 汽车认证领域自动化知识图谱构建方法、设备和介质
CN116703441A (zh) * 2023-05-25 2023-09-05 云内控科技有限公司 一种基于知识图谱的医疗项目成本核算可视分析方法
CN116737945A (zh) * 2023-05-10 2023-09-12 百洋智能科技集团股份有限公司 一种患者emr知识图谱映射方法
CN113849579B (zh) * 2021-09-27 2024-06-28 支付宝(杭州)信息技术有限公司 一种基于知识视图的知识图谱数据处理方法和***

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108021718A (zh) * 2017-12-29 2018-05-11 中国电子科技集团公司信息科学研究院 物联网能力知识图谱及其构建方法
CN108509420A (zh) * 2018-03-29 2018-09-07 赵维平 古谱及古文化知识图谱自然语言处理方法
CN108664615A (zh) * 2017-05-12 2018-10-16 华中师范大学 一种面向学科教育资源的知识图谱构建方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108664615A (zh) * 2017-05-12 2018-10-16 华中师范大学 一种面向学科教育资源的知识图谱构建方法
CN108021718A (zh) * 2017-12-29 2018-05-11 中国电子科技集团公司信息科学研究院 物联网能力知识图谱及其构建方法
CN108509420A (zh) * 2018-03-29 2018-09-07 赵维平 古谱及古文化知识图谱自然语言处理方法

Cited By (96)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109947950A (zh) * 2019-03-14 2019-06-28 长沙沃本智能科技有限公司 基于中间层核心本体的领域知识图谱的构建方法和装置
CN109947950B (zh) * 2019-03-14 2023-01-06 长沙沃本智能科技有限公司 基于中间层核心本体的领域知识图谱的构建方法和装置
CN109902828A (zh) * 2019-03-18 2019-06-18 中科院合肥技术创新工程院 基于多级知识单元的突发事件应急决策知识数据模型构建方法
CN109960810A (zh) * 2019-03-28 2019-07-02 科大讯飞(苏州)科技有限公司 一种实体对齐方法及装置
CN110704630A (zh) * 2019-04-15 2020-01-17 中国石油大学(华东) 一种标识化关联图谱自优化机制
CN111949799B (zh) * 2019-05-15 2024-06-14 广东小天才科技有限公司 一种通过知识融合生成学习图谱的方法及***
CN111949799A (zh) * 2019-05-15 2020-11-17 广东小天才科技有限公司 一种通过知识融合生成学习图谱的方法及***
CN110197280A (zh) * 2019-05-20 2019-09-03 中国银行股份有限公司 一种知识图谱构建方法、装置及***
CN110197280B (zh) * 2019-05-20 2021-08-06 中国银行股份有限公司 一种知识图谱构建方法、装置及***
CN110188147A (zh) * 2019-05-22 2019-08-30 厦门无常师教育科技有限公司 基于知识图谱的文献实体关系发现方法及***
CN110209589B (zh) * 2019-06-05 2022-11-18 北京百度网讯科技有限公司 知识库***测试方法、装置、设备和介质
CN110209589A (zh) * 2019-06-05 2019-09-06 北京百度网讯科技有限公司 知识库***测试方法、装置、设备和介质
CN110246590A (zh) * 2019-06-17 2019-09-17 上海米帝信息技术有限公司 一种血液病知识图谱数据库的构建方法
CN110209839A (zh) * 2019-06-18 2019-09-06 卓尔智联(武汉)研究院有限公司 农业知识图谱构建装置、方法及计算机可读存储介质
CN110245242B (zh) * 2019-06-20 2022-01-18 北京百度网讯科技有限公司 医学知识图谱构建方法、装置以及终端
CN110245242A (zh) * 2019-06-20 2019-09-17 北京百度网讯科技有限公司 医学知识图谱构建方法、装置以及终端
CN110263183A (zh) * 2019-06-20 2019-09-20 珠海格力电器股份有限公司 一种智能家居决策支持***及决策支持方法
CN110289101A (zh) * 2019-07-02 2019-09-27 京东方科技集团股份有限公司 一种计算机设备、***及可读存储介质
CN110459321A (zh) * 2019-08-20 2019-11-15 山东众阳健康科技集团有限公司 一种基于证素的中医辅助诊断***
CN110457502A (zh) * 2019-08-21 2019-11-15 京东方科技集团股份有限公司 构建知识图谱方法、人机交互方法、电子设备及存储介质
CN110543573A (zh) * 2019-08-28 2019-12-06 珠海格力电器股份有限公司 一种基于知识图谱的垃圾分类方法及装置
CN110807102B (zh) * 2019-09-19 2023-09-29 平安科技(深圳)有限公司 知识融合方法、装置、计算机设备和存储介质
CN110807102A (zh) * 2019-09-19 2020-02-18 平安科技(深圳)有限公司 知识融合方法、装置、计算机设备和存储介质
CN110909168A (zh) * 2019-09-23 2020-03-24 腾讯科技(深圳)有限公司 知识图谱的更新方法和装置、存储介质及电子装置
CN110706772A (zh) * 2019-10-11 2020-01-17 北京百度网讯科技有限公司 一种排序方法及装置、电子设备、存储介质
CN110909975B (zh) * 2019-10-11 2022-11-29 广东省科技基础条件平台中心 科研平台效益评估方法、装置
CN110909975A (zh) * 2019-10-11 2020-03-24 广东省科技基础条件平台中心 科研平台效益评估方法、装置
CN110781249A (zh) * 2019-10-16 2020-02-11 华电国际电力股份有限公司技术服务分公司 基于知识图谱的火电厂多源数据融合方法与装置
CN112735556A (zh) * 2019-10-28 2021-04-30 北京中医药大学 一种用于诊治失眠病症的中医古籍数据处理方法
CN111048167A (zh) * 2019-10-31 2020-04-21 中电药明数据科技(成都)有限公司 一种层级式病例结构化方法及***
CN111048167B (zh) * 2019-10-31 2023-08-18 中电药明数据科技(成都)有限公司 一种层级式病例结构化方法及***
CN110888942A (zh) * 2019-11-05 2020-03-17 天津大学 一种基于线性规划的本体包含公理学习方法
CN110825721B (zh) * 2019-11-06 2023-05-02 武汉大学 大数据环境下高血压知识库构建与***集成方法
CN110825721A (zh) * 2019-11-06 2020-02-21 武汉大学 大数据环境下高血压知识库构建与***集成方法
CN110838368B (zh) * 2019-11-19 2022-11-15 广州西思数字科技有限公司 一种基于中医临床知识图谱的主动问诊机器人
CN110838368A (zh) * 2019-11-19 2020-02-25 广州西思数字科技有限公司 一种基于中医临床知识图谱的机器人主动问诊方法
CN111028952A (zh) * 2019-11-27 2020-04-17 云知声智能科技股份有限公司 一种中文医学蕴含知识图谱构建方法及装置
CN111028952B (zh) * 2019-11-27 2023-08-04 云知声智能科技股份有限公司 一种中文医学蕴含知识图谱构建方法及装置
CN111027832A (zh) * 2019-11-28 2020-04-17 卓尔智联(武汉)研究院有限公司 一种税务风险确定方法、装置及存储介质
CN111090683A (zh) * 2019-11-29 2020-05-01 上海勘察设计研究院(集团)有限公司 一种工程领域知识图谱构建方法及其生成装置
CN111090683B (zh) * 2019-11-29 2023-12-22 上海勘察设计研究院(集团)股份有限公司 一种工程领域知识图谱构建方法及其生成装置
CN111625607A (zh) * 2019-12-27 2020-09-04 北京国双科技有限公司 油气知识图谱的构建方法、装置、电子设备和存储介质
CN111475653A (zh) * 2019-12-30 2020-07-31 北京国双科技有限公司 油气勘探开发领域的知识图谱的构建方法及装置
CN111475653B (zh) * 2019-12-30 2021-03-02 北京国双科技有限公司 油气勘探开发领域的知识图谱的构建方法及装置
CN111191050B (zh) * 2020-01-03 2023-07-04 中国建设银行股份有限公司 知识图谱本体模型构建的方法和装置
CN111191050A (zh) * 2020-01-03 2020-05-22 中国建设银行股份有限公司 知识图谱本体模型构建的方法和装置
CN111341456B (zh) * 2020-02-21 2024-02-23 中南大学湘雅医院 糖尿病足知识图谱生成方法、装置及可读存储介质
CN111341456A (zh) * 2020-02-21 2020-06-26 中南大学湘雅医院 糖尿病足知识图谱生成方法、装置及可读存储介质
CN111444351B (zh) * 2020-03-24 2023-09-12 清华苏州环境创新研究院 一种行业工艺领域知识图谱构建方法及装置
CN111444351A (zh) * 2020-03-24 2020-07-24 清华苏州环境创新研究院 一种行业工艺领域知识图谱构建方法及装置
WO2021196520A1 (zh) * 2020-03-30 2021-10-07 西安交通大学 一种面向税务领域知识图谱的构建方法及***
CN111507827A (zh) * 2020-04-20 2020-08-07 上海商涌网络科技有限公司 一种健康风险评估的方法、终端及计算机存储介质
CN111563891B (zh) * 2020-05-09 2023-09-26 吾征智能技术(北京)有限公司 基于颜色认知的疾病预测***
CN111563891A (zh) * 2020-05-09 2020-08-21 吾征智能技术(北京)有限公司 基于颜色认知的疾病预测***
CN113761971B (zh) * 2020-06-02 2023-06-20 中国人民解放军战略支援部队信息工程大学 一种遥感影像目标知识图谱构建方法及装置
CN113761971A (zh) * 2020-06-02 2021-12-07 中国人民解放军战略支援部队信息工程大学 一种遥感影像目标知识图谱构建方法及装置
CN111667894A (zh) * 2020-06-03 2020-09-15 长沙瀚云信息科技有限公司 基于rete算法规则引擎的医院电子病历质量监控和管理***
CN111723215B (zh) * 2020-06-19 2022-10-04 国家计算机网络与信息安全管理中心 基于文本挖掘的生物技术信息知识图谱构建装置与方法
CN111723215A (zh) * 2020-06-19 2020-09-29 国家计算机网络与信息安全管理中心 基于文本挖掘的生物技术信息知识图谱构建装置与方法
WO2021139282A1 (zh) * 2020-06-24 2021-07-15 平安科技(深圳)有限公司 医疗领域知识图谱构建方法、装置、设备及存储介质
CN111831908A (zh) * 2020-06-24 2020-10-27 平安科技(深圳)有限公司 医疗领域知识图谱构建方法、装置、设备及存储介质
CN111986799B (zh) * 2020-07-06 2024-06-04 北京欧应信息技术有限公司 一种以关节运动功能为核心的骨科知识图谱的构建***
CN111986799A (zh) * 2020-07-06 2020-11-24 北京欧应信息技术有限公司 一种以关节运动功能为核心的骨科知识图谱的构建***
CN111798987A (zh) * 2020-07-07 2020-10-20 云知声智能科技股份有限公司 一种实体关系抽取方法和设备
CN111916146B (zh) * 2020-07-27 2023-09-15 苏州工业园区服务外包职业学院 ***癌本体及其构建方法
CN111916146A (zh) * 2020-07-27 2020-11-10 苏州工业园区服务外包职业学院 ***癌本体及其构建方法
CN111950285A (zh) * 2020-07-31 2020-11-17 合肥工业大学 多模态数据融合的医疗知识图谱智能自动构建***和方法
CN111950285B (zh) * 2020-07-31 2024-01-23 合肥工业大学 多模态数据融合的医疗知识图谱智能自动构建***和方法
CN112015905A (zh) * 2020-08-05 2020-12-01 河北工程大学 一种疲劳标志疾病知识图谱的构建方法
CN112182204A (zh) * 2020-08-19 2021-01-05 广东汇银贸易有限公司 构建中文命名实体标注的语料库的方法、装置
CN112037920A (zh) * 2020-08-31 2020-12-04 康键信息技术(深圳)有限公司 医疗知识图谱构建方法、装置、设备及存储介质
CN112182241A (zh) * 2020-09-24 2021-01-05 四川大学 一种空管领域知识图谱的自动化构建方法
CN112527924A (zh) * 2020-12-18 2021-03-19 清华大学 动态更新的知识图谱扩展方法及装置
CN112650821A (zh) * 2021-01-20 2021-04-13 济南浪潮高新科技投资发展有限公司 一种融合Wikidata的实体对齐方法
CN113010688A (zh) * 2021-03-05 2021-06-22 北京信息科技大学 知识图谱构建方法、装置、设备及计算机可读存储介质
CN112906826A (zh) * 2021-03-30 2021-06-04 平安科技(深圳)有限公司 基于多维度的知识图谱的融合方法、装置及计算机设备
CN113220951A (zh) * 2021-05-17 2021-08-06 鞠悦 一种基于智能内容的医学临床支持方法和***
CN113220951B (zh) * 2021-05-17 2023-08-22 鞠悦 一种基于智能内容的医学临床支持方法和***
CN113268608A (zh) * 2021-05-27 2021-08-17 清华大学 知识概念构建方法和装置
CN113849579A (zh) * 2021-09-27 2021-12-28 支付宝(杭州)信息技术有限公司 一种基于知识视图的知识图谱数据处理方法和***
CN113849579B (zh) * 2021-09-27 2024-06-28 支付宝(杭州)信息技术有限公司 一种基于知识视图的知识图谱数据处理方法和***
CN113901233A (zh) * 2021-10-13 2022-01-07 智联(无锡)信息技术有限公司 一种查询数据修复方法、***、计算机设备及存储介质
CN113901233B (zh) * 2021-10-13 2023-11-17 智联网聘信息技术有限公司 一种查询数据修复方法、***、计算机设备及存储介质
CN113821702A (zh) * 2021-11-24 2021-12-21 中国电子科技集团公司第二十八研究所 一种城市多维空间多元异构信息数据处理方法
CN114153992A (zh) * 2021-12-28 2022-03-08 安徽富驰信息技术有限公司 一种领域知识图谱构建设备及其方法
CN114328980A (zh) * 2022-03-14 2022-04-12 来也科技(北京)有限公司 结合rpa及ai的知识图谱构建方法、装置、终端及存储介质
CN114758749B (zh) * 2022-03-23 2023-08-25 清华大学 基于妊娠期的营养饮食管理图谱创建方法及装置
CN114758749A (zh) * 2022-03-23 2022-07-15 清华大学 基于妊娠期的营养饮食管理图谱创建方法及装置
CN115017331A (zh) * 2022-06-07 2022-09-06 深圳伯德睿捷健康科技有限公司 健康感知与认知方法及装置
CN116313118B (zh) * 2022-06-07 2023-11-14 拉萨卓友峰科技有限公司 应用于医疗数据处理的知识图谱构建方法
CN116313118A (zh) * 2022-06-07 2023-06-23 拉萨卓友峰科技有限公司 应用于医疗数据处理的知识图谱构建方法
CN116737945A (zh) * 2023-05-10 2023-09-12 百洋智能科技集团股份有限公司 一种患者emr知识图谱映射方法
CN116737945B (zh) * 2023-05-10 2024-05-07 百洋智能科技集团股份有限公司 一种患者emr知识图谱映射方法
CN116703441A (zh) * 2023-05-25 2023-09-05 云内控科技有限公司 一种基于知识图谱的医疗项目成本核算可视分析方法
CN116431835B (zh) * 2023-06-06 2023-09-15 中汽数据(天津)有限公司 汽车认证领域自动化知识图谱构建方法、设备和介质
CN116431835A (zh) * 2023-06-06 2023-07-14 中汽数据(天津)有限公司 汽车认证领域自动化知识图谱构建方法、设备和介质

Similar Documents

Publication Publication Date Title
CN109271530A (zh) 一种疾病知识图谱构建方法和平台***、设备、存储介质
CN112199511B (zh) 跨语言多来源垂直领域知识图谱构建方法
Chen et al. An automatic literature knowledge graph and reasoning network modeling framework based on ontology and natural language processing
CN105393265B (zh) 人机交互学习中的主动特征化
CN113779211A (zh) 一种基于自然语言实体关系的智能问答推理方法和***
Ling et al. Integrating extra knowledge into word embedding models for biomedical NLP tasks
Yang et al. Ontology learning for systems engineering body of knowledge
Guo et al. Research on high creative application of case-based reasoning system on engineering design
CN112559734A (zh) 简报生成方法、装置、电子设备及计算机可读存储介质
CN116127084A (zh) 基于知识图谱的微电网调度策略智能检索***及方法
Chiha et al. A complete framework for aspect-level and sentence-level sentiment analysis
Delaforge et al. EBBE-text: Explaining neural networks by exploring text classification decision boundaries
Zhu et al. Construction of transformer substation fault knowledge graph based on a depth learning algorithm
Rahul et al. Social media sentiment analysis for Malayalam
Melnikov et al. On usage of machine learning for natural language processing tasks as illustrated by educational content mining
Nabavi et al. Leveraging Natural Language Processing for Automated Information Inquiry from Building Information Models.
Hu et al. A classification model of power operation inspection defect texts based on graph convolutional network
Keakde et al. Study and analysis of various sentiment classification strategies: A challenging overview
Fakhrahmad et al. A new fuzzy rule-based classification system for word sense disambiguation
Chen et al. A Comprehensive Survey of Cognitive Graphs: Techniques, Applications, Challenges
Ning Research on the extraction of accounting multi-relationship information based on cloud computing and multimedia
Motallebi et al. Explaining decisions of black-box models using barbe
Vimercati Domain Adaptation in Fine-grained Entity Typing
AN et al. Scoring Impressions and Associations for Improved Concept Map Excavating from Dominion Text Demonstration
Prajapati et al. Cognitive Computing-Powered, NLP-Based, Autonomous Question-Answering System

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190125