CN110399497A - 一种基于深度学习技术的知识图谱自适应构建方法 - Google Patents

一种基于深度学习技术的知识图谱自适应构建方法 Download PDF

Info

Publication number
CN110399497A
CN110399497A CN201910587855.1A CN201910587855A CN110399497A CN 110399497 A CN110399497 A CN 110399497A CN 201910587855 A CN201910587855 A CN 201910587855A CN 110399497 A CN110399497 A CN 110399497A
Authority
CN
China
Prior art keywords
data
deep learning
knowledge mapping
building
learning model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910587855.1A
Other languages
English (en)
Inventor
刘家祥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiamen Useear Information Technology Co ltd
Original Assignee
Xiamen Useear Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiamen Useear Information Technology Co ltd filed Critical Xiamen Useear Information Technology Co ltd
Priority to CN201910587855.1A priority Critical patent/CN110399497A/zh
Publication of CN110399497A publication Critical patent/CN110399497A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computational Linguistics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种基于深度学习技术的知识图谱自适应构建方法,包括如下步骤:S1、获取数据,将数据分为深度学习用数据和知识图谱构建用数据,并将深度学习用数据分为训练数据和测试数据;S2、根据训练数据训练出深度学习模型,并利用测试数据对深度学习模型进行测试;S3、利用训练出的深度学习模型对知识图谱构建用数据进行知识图谱构建处理,知识图谱构建方式包括自上至下的构建方式和自下至上的构建方式共两种构建方式。本发明通过深度学习技术判断选用自上至下的构建方式和自下至上的构建方式中的何种方式进行数据的知识图谱构建过程,两种构建方式相互协调,更充分全面的表现知识图谱的完整性和多样性。

Description

一种基于深度学习技术的知识图谱自适应构建方法
技术领域
本发明涉及数据处理技术领域,尤其涉及一种基于深度学习技术的知识图谱自适应构建方法。
背景技术
知识图谱是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。知识图谱通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论。
现有知识图谱构建方式一般预先选定自上至下的构建方式和自下至上的构建方式中的一种进行知识图谱的构建过程,但是,单纯采用一种方式进行知识图谱的构建具有一定的局限性。
发明内容
(一)发明目的
为解决背景技术中存在的技术问题,本发明提出一种基于深度学习技术的知识图谱自适应构建方法,通过深度学习技术判断选用自上至下的构建方式和自下至上的构建方式中的何种方式进行数据的知识图谱构建过程,两种构建方式相互协调,更充分全面的表现知识图谱的完整性和多样性。
(二)技术方案
为解决上述问题,本发明提供了一种基于深度学习技术的知识图谱自适应构建方法,包括如下步骤:
S1、获取数据,将数据分为深度学习用数据和知识图谱构建用数据,并将深度学习用数据分为训练数据和测试数据;
S2、根据训练数据训练出深度学习模型,并利用测试数据对深度学习模型进行测试;
S3、利用训练出的深度学习模型对知识图谱构建用数据进行知识图谱构建处理,知识图谱构建方式包括自上至下的构建方式和自下至上的构建方式共两种构建方式:
自上至下的构建方式:先确定知识图谱的数据模型,并将数据模型按照具体数据的分类和属性以及具体数据之间的关系进行分类处理;再获取具体数据,并根据具体数据所属类型和具有的属性以及具体数据之间的关系,将具体数据填充至对应的数据模型中;
自下至上的构建方式:先获取具体数据,再根据具体数据内容,对具体数据进行整理、分析、归纳和总结,形成数据框架,并以该数据框架作为数据模型。
优选的,还包括:
S4、将根据自上至下的构建方式构建出的知识图谱和自下至上的构建方式构建出的知识图谱整合成一个知识图谱。
优选的,还包括:
S5、存储整合成的知识图谱,并对该知识图谱进行数据可视化表示。
优选的,在S1中,获取的数据包括结构化数据、半结构化数据和文本数据。
优选的,在S2中,预先设定深度学习能够应用于知识图谱构建的前提条件,利用测试数据对深度学习模型进行测试包括满足条件和未满足条件共两种测试结果:
测试结果表明深度学习模型满足条件时:直接将该深度学习模型应用于数据的知识图谱构建过程;
测试结果表明深度学习模型未满足条件时:重新根据训练数据训练出新的深度学习模型,并再次利用测试数据对深度学习模型进行测试。
优选的,循环进行深度学习模型的训练过程和测试过程,直至获得满足预先设定的能够应用于知识图谱构建的前提条件的深度学习模型。
优选的,在S3中的自下至上的知识图谱构建方式中,按照三元组的方式获取具体数据。
本发明的上述技术方案具有如下有益的技术效果:先利用训练数据训练出深度学习模型,再通过深度学习模型对知识图谱构建用数据进行知识图谱的构建处理过程。通过深度学习技术判断选用自上至下的构建方式和自下至上的构建方式中的何种方式进行数据的知识图谱构建过程,两种构建方式相互协调,更充分全面的表现知识图谱的完整性和多样性。
附图说明
图1为本发明提出的一种基于深度学习技术的知识图谱自适应构建方法的第一种方法流程示意图。
图2为本发明提出的一种基于深度学习技术的知识图谱自适应构建方法的第二种方法流程示意图。
图3为本发明提出的一种基于深度学习技术的知识图谱自适应构建方法的第三种方法流程示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明了,下面结合具体实施方式并参照附图,对本发明进一步详细说明。应该理解,这些描述只是示例性的,而并非要限制本发明的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本发明的概念。
如图1-3所示,本发明提出的一种基于深度学习技术的知识图谱自适应构建方法,包括如下步骤:
S1、获取数据,将数据分为深度学习用数据和知识图谱构建用数据,并将深度学习用数据分为训练数据和测试数据;
S2、根据训练数据训练出深度学习模型,并利用测试数据对深度学习模型进行测试;
S3、利用训练出的深度学习模型对知识图谱构建用数据进行知识图谱构建处理,知识图谱构建方式包括自上至下的构建方式和自下至上的构建方式共两种构建方式:
自上至下的构建方式:先确定知识图谱的数据模型,并将数据模型按照具体数据的分类和属性以及具体数据之间的关系进行分类处理;再获取具体数据,并根据具体数据所属类型和具有的属性以及具体数据之间的关系,将具体数据填充至对应的数据模型中;
自下至上的构建方式:先获取具体数据,再根据具体数据内容,对具体数据进行整理、分析、归纳和总结,形成数据框架,并以该数据框架作为数据模型。
本发明中,先利用训练数据训练出深度学习模型,再通过深度学习模型对知识图谱构建用数据进行知识图谱的构建处理过程。通过深度学习技术判断选用自上至下的构建方式和自下至上的构建方式中的何种方式进行数据的知识图谱构建过程,两种构建方式相互协调,更充分全面的表现知识图谱的完整性和多样性。
在一个可选的实施例中,还包括:
S4、将根据自上至下的构建方式构建出的知识图谱和自下至上的构建方式构建出的知识图谱整合成一个知识图谱。
需要说明的是,通过将自上至下的构建方式构建出的知识图谱和自下至上的构建方式共两种方式构建出的知识图谱进行整合,使得知识图谱的完整性更好,更能充分表现知识图谱数据。
在一个可选的实施例中,还包括:
S5、存储整合成的知识图谱,并对该知识图谱进行数据可视化表示。
需要说明的是,可视化表示知识图谱,方便知识图谱内容能更直观的展示出来,知识图谱内容的表现力更好。
在一个可选的实施例中,在S1中,获取的数据包括结构化数据、半结构化数据和文本数据。
需要说明的是,对多种数据进行知识图谱的构建,构建内容更全面充分。
在一个可选的实施例中,在S2中,预先设定深度学习能够应用于知识图谱构建的前提条件,利用测试数据对深度学习模型进行测试包括满足条件和未满足条件共两种测试结果:
测试结果表明深度学习模型满足条件时:直接将该深度学习模型应用于数据的知识图谱构建过程;
测试结果表明深度学习模型未满足条件时:重新根据训练数据训练出新的深度学习模型,并再次利用测试数据对深度学习模型进行测试。
需要说明的是,只有当深度学习模型达到应用条件时,才使用深度学习模型对知识图谱构建用数据进行知识图谱的构建处理,从而保证知识图谱构建的准确性和全面性。
在一个可选的实施例中,循环进行深度学习模型的训练过程和测试过程,直至获得满足预先设定的能够应用于知识图谱构建的前提条件的深度学习模型。
需要说明的是,循环进行深度学习模型的训练和测试,以保证深度学习模型的质量。
在一个可选的实施例中,在S3中的自下至上的知识图谱构建方式中,按照三元组的方式获取具体数据。
需要说明的是,利用三元组方式获取的具体数据表现效果更好。
应当理解的是,本发明的上述具体实施方式仅仅用于示例性说明或解释本发明的原理,而不构成对本发明的限制。因此,在不偏离本发明的精神和范围的情况下所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。此外,本发明所附权利要求旨在涵盖落入所附权利要求范围和边界、或者这种范围和边界的等同形式内的全部变化和修改例。

Claims (7)

1.一种基于深度学习技术的知识图谱自适应构建方法,其特征在于,包括如下步骤:
S1、获取数据,将数据分为深度学习用数据和知识图谱构建用数据,并将深度学习用数据分为训练数据和测试数据;
S2、根据训练数据训练出深度学习模型,并利用测试数据对深度学习模型进行测试;
S3、利用训练出的深度学习模型对知识图谱构建用数据进行知识图谱构建处理,知识图谱构建方式包括自上至下的构建方式和自下至上的构建方式共两种构建方式:
自上至下的构建方式:先确定知识图谱的数据模型,并将数据模型按照具体数据的分类和属性以及具体数据之间的关系进行分类处理;再获取具体数据,并根据具体数据所属类型和具有的属性以及具体数据之间的关系,将具体数据填充至对应的数据模型中;
自下至上的构建方式:先获取具体数据,再根据具体数据内容,对具体数据进行整理、分析、归纳和总结,形成数据框架,并以该数据框架作为数据模型。
2.根据权利要求1所述的一种基于深度学习技术的知识图谱自适应构建方法,其特征在于,还包括:
S4、将根据自上至下的构建方式构建出的知识图谱和自下至上的构建方式构建出的知识图谱整合成一个知识图谱。
3.根据权利要求2所述的一种基于深度学习技术的知识图谱自适应构建方法,其特征在于,还包括:
S5、存储整合成的知识图谱,并对该知识图谱进行数据可视化表示。
4.根据权利要求1所述的一种基于深度学习技术的知识图谱自适应构建方法,其特征在于,在S1中,获取的数据包括结构化数据、半结构化数据和文本数据。
5.根据权利要求1所述的一种基于深度学习技术的知识图谱自适应构建方法,其特征在于,在S2中,预先设定深度学习能够应用于知识图谱构建的前提条件,利用测试数据对深度学习模型进行测试包括满足条件和未满足条件共两种测试结果:
测试结果表明深度学习模型满足条件时:直接将该深度学习模型应用于数据的知识图谱构建过程;
测试结果表明深度学习模型未满足条件时:重新根据训练数据训练出新的深度学习模型,并再次利用测试数据对深度学习模型进行测试。
6.根据权利要求5所述的一种基于深度学习技术的知识图谱自适应构建方法,其特征在于,循环进行深度学习模型的训练过程和测试过程,直至获得满足预先设定的能够应用于知识图谱构建的前提条件的深度学习模型。
7.根据权利要求1所述的一种基于深度学习技术的知识图谱自适应构建方法,其特征在于,在S3中的自下至上的知识图谱构建方式中,按照三元组的方式获取具体数据。
CN201910587855.1A 2019-07-02 2019-07-02 一种基于深度学习技术的知识图谱自适应构建方法 Pending CN110399497A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910587855.1A CN110399497A (zh) 2019-07-02 2019-07-02 一种基于深度学习技术的知识图谱自适应构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910587855.1A CN110399497A (zh) 2019-07-02 2019-07-02 一种基于深度学习技术的知识图谱自适应构建方法

Publications (1)

Publication Number Publication Date
CN110399497A true CN110399497A (zh) 2019-11-01

Family

ID=68322670

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910587855.1A Pending CN110399497A (zh) 2019-07-02 2019-07-02 一种基于深度学习技术的知识图谱自适应构建方法

Country Status (1)

Country Link
CN (1) CN110399497A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113378564A (zh) * 2021-04-30 2021-09-10 上海适享文化传播有限公司 垂直领域细分场景结合知识图谱的分词方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106776711A (zh) * 2016-11-14 2017-05-31 浙江大学 一种基于深度学习的中文医学知识图谱构建方法
CN108595449A (zh) * 2017-11-23 2018-09-28 北京科东电力控制***有限责任公司 调度自动化***知识图谱的构建与应用方法
CN109697233A (zh) * 2018-12-03 2019-04-30 中电科大数据研究院有限公司 一种知识图谱体系搭建方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106776711A (zh) * 2016-11-14 2017-05-31 浙江大学 一种基于深度学习的中文医学知识图谱构建方法
CN108595449A (zh) * 2017-11-23 2018-09-28 北京科东电力控制***有限责任公司 调度自动化***知识图谱的构建与应用方法
CN109697233A (zh) * 2018-12-03 2019-04-30 中电科大数据研究院有限公司 一种知识图谱体系搭建方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
匿名: "知识图谱基础知识之二——知识图谱的构建方法", 《博客园》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113378564A (zh) * 2021-04-30 2021-09-10 上海适享文化传播有限公司 垂直领域细分场景结合知识图谱的分词方法

Similar Documents

Publication Publication Date Title
CN106595849B (zh) 汽车急加速时整车抖动的测试方法及装置
CN106089184A (zh) 一种井下抽油泵工况的诊断方法和装置
EP1791090A3 (en) Method for quantifying plant resources using GIS
MXPA04001369A (es) Metodos de interpretacion para la difusion de la resonancia magnetico-nuclear ("nmr")-mapas de relajamiento de difusion (mapas t2).
CN104612658A (zh) 用于水平井分段产液识别的试井分析控制***及方法
CN104500029B (zh) 一种判识油井示功图相似性的方法
CN103697929B (zh) 仪表指针运动状态的检测方法
CN105571866A (zh) 一种发动机振动图谱提取方法
CN104731694A (zh) 浏览器兼容性测试分析方法及浏览器兼容性测试分析***
CN107451368A (zh) 基于ansys平台的焊缝疲劳寿命评估方法
CN109902326B (zh) 一种有限元仿真实验效果测评方法
CN110399497A (zh) 一种基于深度学习技术的知识图谱自适应构建方法
CN106503407A (zh) 存在部分连通断层的线性水侵油藏的试井分析方法及装置
CN111159943A (zh) 一种动翼面封严结构的屈曲处理方法
Amah Challenge and hindrance stress relationship with job satisfaction and life satisfaction: The role of motivation-to-work and self-efficacy
CN106156530A (zh) 基于栈式自编码器的体检数据分析方法及装置
CN109264023A (zh) 基于不确定性分析的原始疲劳质量评估方法
CN103885341B (zh) 基于汽车性能模拟器的性能分析***和方法
CN106989939A (zh) 一种悬架k&c试验台测试对比分析的方法及***
CN112635048B (zh) 一种视觉任务脑力负荷量化评估方法及***
CN109918791A (zh) 一种核电站数字化主控室操纵员人因可靠性分析方法
CN107992690A (zh) 一种诱导应力干扰下多裂缝扩展形态均衡程度的评价方法
CN106407525B (zh) 高拱坝三轴受力结构安全度简易计算方法
CN109637138A (zh) 一种基于信息利用度的可变标志信息发布方法及***
CN103729287B (zh) 一种前端javascript组件的测试方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20191101

RJ01 Rejection of invention patent application after publication