CN116595188A - 一种基于人工智能和大数据的教育知识图谱*** - Google Patents

一种基于人工智能和大数据的教育知识图谱*** Download PDF

Info

Publication number
CN116595188A
CN116595188A CN202310522285.4A CN202310522285A CN116595188A CN 116595188 A CN116595188 A CN 116595188A CN 202310522285 A CN202310522285 A CN 202310522285A CN 116595188 A CN116595188 A CN 116595188A
Authority
CN
China
Prior art keywords
data
knowledge
teaching
module
knowledge graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310522285.4A
Other languages
English (en)
Inventor
陈琳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Beiwan Education Technology Co ltd
Original Assignee
Beijing Beiwan Education Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Beiwan Education Technology Co ltd filed Critical Beijing Beiwan Education Technology Co ltd
Priority to CN202310522285.4A priority Critical patent/CN116595188A/zh
Publication of CN116595188A publication Critical patent/CN116595188A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • G06Q50/205Education administration or guidance
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Educational Administration (AREA)
  • Tourism & Hospitality (AREA)
  • Strategic Management (AREA)
  • Educational Technology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于人工智能和大数据的教育知识图谱***,通过多源异构数据构建知识图谱,保证了数据的多样性以及覆盖性,并且通过自然语言处理对教学知识图谱进行分析以及更新,能够有效保证教学知识图谱的鲜活度,提升推荐的准确度。本发明通过数据挖掘以及人工智能分析,能够有效地分析学生用户的学习行为,并为其制定学习计划,实现高精度的知识点推荐。

Description

一种基于人工智能和大数据的教育知识图谱***
技术领域
本发明属于计算机技术以及教育技术领域,具体涉及一种基于人工智能和大数据的教育知识图谱***。
背景技术
在现有教学***中,学生可以通过输入关键词或浏览知识点来获取相关信息,并利用***提供的练习题以及测试等功能进行自我评估和巩固。同时,***还会根据学生的学习行为提供反馈,以便学生掌握核心概念和技能。
但是现有技术存在以下问题:
(1)现有技术的数据不足或质量不高,知识图谱的实用性受到限制。
(2)在现有技术中,由于知识图谱是在特定学科和领域中构建的,因此可能存在某些重要的知识点未被涵盖的情况。
(3)现有技术的个性化推荐主要依赖于数据标签推荐,其结果可能存在误差,需要进一步提高推荐的精度和准确性。
发明内容
本发明提供一种基于人工智能和大数据的教育知识图谱***,用以解决现有技术中存在的术问题。
一种基于人工智能和大数据的教育知识图谱***,包括多源异构数据融合模块、自然语言处理模块、数据挖掘模块以及人工智能分析模块;
所述多源异构数据融合模块用于从不同的数据源中采集教学原始数据,并根据所述教学原始数据构建教学知识图谱,采集教学知识图谱的修改操作,并根据修改操作对教学知识图谱进行修改;
所述自然语言处理模块用于采用自然语言处理方法对教学知识图谱进行更新,获取更新后的教学知识图谱,并基于更新后的教学知识图谱获取不同的应用场景数据;
所述数据挖掘模块用于根据更新后的教学知识图谱以及应用场景数据,为学生用户匹配与检索操作对应的知识点以及进行智能辅导学习;
所述人工智能分析模块用于对学生用户成绩进行智能分析,得到智能分析结果,并向老师用户以及学生用户对应的家长用户推荐该智能分析结果。
在一种可能的实施方式中,所述多源异构数据融合模块包括数据采集子模块、数据清洗子模块、知识图谱构建子模块以及关联修订子模块;
所述数据采集子模块用于,通过网络爬虫对公开的网页、公开数据库以及公开文档中的数据进行采集,得到教学原始数据,所述教学原始数据包括结构化数据以及非结构化数据;
所述数据清洗子子模块用于,对教学原始数据进行预处理,得到预处理后的教学原始数据;
所述知识图谱构建子模块用于,根据预处理后的教学原始数据,构建教学知识图谱;
所述关联修订子模块用于,接收包括新知识点以及关联匹配字符的修改操作,并根据关联匹配字符在教学知识图谱中匹配至少一个目标知识点;待匹配到至少一个目标知识点后,接受人机交互产生的目标知识点所对应的关联操作,将关联操作对应的目标知识点与新知识点关联,完成对教学知识图谱的修改。
在一种可能的实施方式中,所述数据采集子模块包括文本数据采集单元、图片数据采集单元、音频数据采集单元以及视频数据采集单元;
所述文本数据采集单元用于,通过网络爬虫对公开的网页、公开数据库以及公开文档中的文档进行采集,得到原始文档数据;
所述图片数据采集单元用于,通过网络爬虫对公开的网页、公开数据库以及公开文档中的图片进行采集,得到原始图片数据;
所述音频数据采集单元用于,通过网络爬虫对公开的网页、公开数据库以及公开文档中的音频进行采集,得到原始音频数据;
所述视频数据采集单元用于,通过网络爬虫对公开的网页、公开数据库以及公开文档中的视频进行采集,得到原始视频数据;
其中,原始文档数据、原始图片数据、原始音频数据以及原始视频数据共同作为教学原始数据。
在一种可能的实施方式中,所述数据清洗子模块包括重复值清洗单元以及异常值清洗单元;
所述重复值清洗单元用于,对教学原始数据中的重复数据进行清除;
所述异常值清洗单元用于,对教学原始数据中的异常数据进行清除,所述异常数据用于表征含义敏感词汇的数据或者无法识别的数据。
在一种可能的实施方式中,所述知识图谱构建子模块包括知识点抽取单元、关系抽取单元以及知识图谱构建单元;
所述知识点抽取单元用于,抽取预处理后的教学原始数据中的知识点;
所述关系抽取单元用于,从原始教学数据中抽取各个知识点之间的关系;
所述知识图谱构建单元用于,根据知识点抽取单元得到的知识点以及关系抽取单元得到的关系,构建知识图谱。
在一种可能的实施方式中,所述关联修订子模块包括新知识点获取单元、已存储知识点检索单元以及关联存储单元;
所述新知识点获取单元用于,接收包括新知识点以及关联匹配字符的修改操作;
所述已存储知识点检索单元用于,根据关联匹配字符,并采用神经网络算法在教学知识图谱中匹配至少一个目标知识点;
所述关联存储单元用于,待匹配到至少一个目标知识点后,接受人机交互产生的目标知识点所对应的关联操作,将关联操作对应的目标知识点与新知识点关联,完成对教学知识图谱的修改。
在一种可能的实施方式中,所述自然语言处理模块包括多模态语义理解子模块、知识图谱扩展模块以及深度融合场景模块;
所述多模态语义理解子模块用于,采用定时任务以及自然语言处理算法对已有知识点进行多模块语义理解,扩展教学知识图谱中已有知识点的关键词,得到扩展后的教学知识图谱,并将扩展后的教学知识图谱中的知识点推送给相同领域的教师,所述相同领域用于表征老师用户所教学领域与知识点所在领域相同;
所述知识图谱扩展模块用于,基于教学知识图谱中已有知识点的关键词,从指定数据源上爬取与已有知识点关键词相关的新知识点,并根据该相关的新知识点对扩展后的教学知识图谱进行更新,得到更新后的教学知识图谱;
所述深度融合场景模块用于,基于教学知识图谱中的已有知识点,获取不同应用场景的领域知识库,得到不同的应用场景数据,所述领域知识库包括与应用场景领域相同的至少一个已有知识点。
在一种可能的实施方式中,所述数据挖掘模块包括智能辅导子模块以及知识点精准匹配子模块;
所述智能辅导子模块用于,向学生用户提供其预设领域中相关知识点的练习题目,并记录学生用户答写练习题目的做题数据,所述做题数据至少包括正确率以及错误练习题目;
所述智能辅导子模块还用于,实时监控正确率,当该正确率下降至设定阈值之后,向学生用户推送错误练习题目对应的解析答案、学习思路以及关联知识点;其中,设定阈值用于表征老师用户为学生用户设定的最低正确率,练习题目对应的解析答案、学习思路以及关联知识点均为预先存储数据;
所述知识点精准匹配子模块用于,接受学生用户输入的问题字符串,并在教学知识图谱中匹配问题字符串所对应的知识点,并将该问题字符串所对应的知识点反馈给学生用户。
在一种可能的实施方式中,所述人工智能分析模块包括试卷测试子模块以及成绩分析子模块;
所述试卷测试子模块用于,为学生用户提供测试试卷,并记录学生用户的答题情况;
所述成绩分析子模块用于,基于学生用户的答题情况,分析学生用户在不同知识点上的掌握情况,并基于掌握情况生成学习计划建议,将掌握情况以及学习计划建议反馈给学生用户对应的家长用户以及老师用户。
在一种可能的实施方式中,还包括智能匹配模块,所述智能匹配模块用于,接受学生用户或者家长用户输入的目标条件,为学生用户或者家长用户匹配并推荐与目标条件对应的目标老师用户。
本发明的有益效果为:
(1)本发明提供的一种基于人工智能和大数据的教育知识图谱***,通过多源异构数据构建知识图谱,保证了数据的多样性以及覆盖性,并且通过自然语言处理对教学知识图谱进行分析以及更新,能够有效保证教学知识图谱的鲜活度,提升推荐的准确度。
(2)本发明通过数据挖掘以及人工智能分析,能够有效地分析学生用户的学习行为,并为其制定学习计划,实现高精度的知识点推荐。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1为本发明实施例提供的一种基于人工智能和大数据的教育知识图谱***的结构示意图。
通过上述附图,已示出本发明明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本发明构思的范围,而是通过参考特定实施例为本领域技术人员说明本发明的概念。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
下面结合附图详细说明本发明的实施例。
实施例1
如图1所示,一种基于人工智能和大数据的教育知识图谱***,包括多源异构数据融合模块、自然语言处理模块、数据挖掘模块以及人工智能分析模块。
所述多源异构数据融合模块用于从不同的数据源中采集教学原始数据,并根据所述教学原始数据构建教学知识图谱,采集教学知识图谱的修改操作,并根据修改操作对教学知识图谱进行修改。
所述自然语言处理模块用于采用自然语言处理方法对教学知识图谱进行更新,获取更新后的教学知识图谱,并基于更新后的教学知识图谱获取不同的应用场景数据。
所述数据挖掘模块用于根据更新后的教学知识图谱以及应用场景数据,为学生用户匹配与检索操作对应的知识点以及进行智能辅导学习。
所述人工智能分析模块用于对学生用户成绩进行智能分析,得到智能分析结果,并向老师用户以及学生用户对应的家长用户推荐该智能分析结果。
在一种可能的实施方式中,所述多源异构数据融合模块包括数据采集子模块、数据清洗子模块、知识图谱构建子模块以及关联修订子模块;
所述数据采集子模块用于,通过网络爬虫对公开的网页、公开数据库以及公开文档中的数据进行采集,得到教学原始数据,所述教学原始数据包括结构化数据以及非结构化数据。
所述数据清洗子子模块用于,对教学原始数据进行预处理,得到预处理后的教学原始数据。
所述知识图谱构建子模块用于,根据预处理后的教学原始数据,构建教学知识图谱。
所述关联修订子模块用于,接收包括新知识点以及关联匹配字符的修改操作,并根据关联匹配字符在教学知识图谱中匹配至少一个目标知识点;待匹配到至少一个目标知识点后,接受人机交互产生的目标知识点所对应的关联操作,将关联操作对应的目标知识点与新知识点关联,完成对教学知识图谱的修改。
本发明可以从多个不同的数据源中获取数据,并将这些数据进行有效整合和融合,形成更为完整、准确的知识图谱;首先,对于结构化和半结构化等类型的数据(如文本、图片以及视频等),根据数据类型将数据拆分成不同标准,例如:文本信息会根据关键词,以及上下文联系,切割成多个文字知识点;图片信息会自动识别其中的文案,并转化为文字知识点;视频信息会识别视频中的语音信息,根据前后语句关系,将视频切割成数个知识点视频,并提炼出视频中关键词,作为视频的标签存储。
传统的知识图谱往往只能建立在一个特定领域的知识基础上,难以有效地融合不同领域的知识资源。而本发明的知识图谱中,采用了一种跨领域知识融合方法,可以将不同领域的知识资源进行整合和分析,形成一个覆盖多个领域的综合性知识图谱。这样一来,用户就可以在一个平台上获取各个领域的知识,从而实现知识的横向和纵向扩展。
这些经过统一标准处理的数据,会归类到资源库,并建立数据类型、学科类型以及内容关键词等多种索引。后续教师在创建知识图谱的过程中,可以通过知识点类型匹配以及关键词匹配等形式,与新建知识点进行关联操作。例如:物理教师在创建知识点,需要引用到数学中某个公式,他可进行联想输入,***会将公式在资源库中搜索,并将符合的知识点自动关联。以便用户可以方便地获取和使用数据,为用户提供更加丰富、精准的知识服务,有效地提高目前知识图谱存在的完整性不高、准确性不强和可靠性差的问题。值得说明的是,在后续的知识点检索过程中,也可以使用该方法。
在本实施例中加入了循环神经网络(Recurrent Neural Network,RNN),它被用于实现基于知识点数据的语义相似度计算,以便在知识图谱中找到相关概念和知识点。
具体来说,使用RNN对知识点文本进行编码,将每个单词或短语表示为一个向量。这些向量可以通过RNN的隐藏状态传递信息,从而捕获上下文语义信息。然后,使用这些向量来计算文本之间的相似度。
在知识图谱中,可以将这种技术应用于不同的场景,例如:相关概念的推荐:根据用户输入的查询,使用RNN计算查询并与知识图谱中的知识点进行比较,找到与查询最相关的内容,并推荐给用户。知识点的归类:使用RNN计算每个知识点的关联量表示,并且使用聚类算法将相似的知识点分组到一个类别中,从而帮助学习者更好地理解和组织知识。知识点的推荐:根据学习者已经学过的知识点,使用RNN计算它们的关联量表示,并与未学习的知识点向量进行比较,找到与学习者已知知识最相关的未学习知识点,并推荐给学习者。
在一种可能的实施方式中,所述数据采集子模块包括文本数据采集单元、图片数据采集单元、音频数据采集单元以及视频数据采集单元;
所述文本数据采集单元用于,通过网络爬虫对公开的网页、公开数据库以及公开文档中的文档进行采集,得到原始文档数据。
所述图片数据采集单元用于,通过网络爬虫对公开的网页、公开数据库以及公开文档中的图片进行采集,得到原始图片数据。
所述音频数据采集单元用于,通过网络爬虫对公开的网页、公开数据库以及公开文档中的音频进行采集,得到原始音频数据。
所述视频数据采集单元用于,通过网络爬虫对公开的网页、公开数据库以及公开文档中的视频进行采集,得到原始视频数据。
其中,原始文档数据、原始图片数据、原始音频数据以及原始视频数据共同作为教学原始数据。
传统的知识图谱只能处理文本信息,无法有效地处理图片、音频以及视频等多媒体类型的数据。而本发明采用的是一种基于深度学习技术的多模态数据融合方法,可以将不同模态的数据进行整合和分析,提高了知识图谱的覆盖范围和深度。比如,在学科知识领域,本发明中知识图谱包含了文本资料和学术论文等传统的学科知识,还可以涵盖课程视频、教材图片以及实验数据等多种形式的学科资源,使得用户可以更加全面地了解学科知识。
在一种可能的实施方式中,所述数据清洗子模块包括重复值清洗单元以及异常值清洗单元。
所述重复值清洗单元用于,对教学原始数据中的重复数据进行清除。
所述异常值清洗单元用于,对教学原始数据中的异常数据进行清除,所述异常数据用于表征含义敏感词汇的数据或者无法识别的数据。
传统的知识图谱构建过程需要进行手工制作和标注,因此效率较低且成本较高。而本发明采用的是基于自动化技术的知识图谱构建方法,可以通过对公开网页、数据库、文档等各种来源的大量结构化和非结构化信息进行抓取、解析和分析,来获取相关的知识和信息。在构建知识图谱时,还可以采用有针对性的策略,比如引入领域专家进行指导和审核、利用机器学习算法进行数据清洗和去重等,从而提高了知识图谱的准确性和可用性。
可选的,数据清洗的流程可以包括:
A1、数据收集:从不同的数据源中收集数据,包括文本、图像、音频等多种形式的数据。
A2、数据预处理:对原始数据进行预处理,包括去除异常值、重复值等。(重复值,指的是重复的知识点、异常值指的是带有敏感内容,或无法识别的视频等)
A3、特征选择与提取:从原始数据中选择有用的特征,并将其转换为算法可接受的格式,如提取视频中的文字,转化为知识点。
A4、模型构建:根据问题需要,选择合适的机器学习算法并进行模型构建,如基于深度学习的分类算法、聚类算法等,将同一类型的知识点合并存储等。
A5、训练模型:使用部分数据进行训练,调整模型参数,使得模型能够更好地针对数据进行学习和识别。
A6、应用模型:将训练好的模型应用到知识图谱中进行数据清洗和去重任务。例如,在清洗文本数据时,可以使用自然语言处理技术和深度学习算法识别和纠正语法错误、拼写错误,并去除相似或重复的文本内容。这样可以提高知识图谱数据的质量和准确性,从而更好地支持学习和教育任务。
在一种可能的实施方式中,所述知识图谱构建子模块包括知识点抽取单元、关系抽取单元以及知识图谱构建单元。
所述知识点抽取单元用于,抽取预处理后的教学原始数据中的知识点。
所述关系抽取单元用于,从原始教学数据中抽取各个知识点之间的关系。
所述知识图谱构建单元用于,根据知识点抽取单元得到的知识点以及关系抽取单元得到的关系,构建知识图谱。
在一种可能的实施方式中,所述关联修订子模块包括新知识点获取单元、已存储知识点检索单元以及关联存储单元。
所述新知识点获取单元用于,接收包括新知识点以及关联匹配字符的修改操作。
所述已存储知识点检索单元用于,根据关联匹配字符,并采用神经网络算法在教学知识图谱中匹配至少一个目标知识点。
所述关联存储单元用于,待匹配到至少一个目标知识点后,接受人机交互产生的目标知识点所对应的关联操作,将关联操作对应的目标知识点与新知识点关联,完成对教学知识图谱的修改。
本发明采用了图数据库的技术,将各种教育数据转化为节点和边的形式,在此基础上建立知识点之间的关系模型。该模型可以表达知识点之间的语义关系,如同义词、反义词以及包含关系等,从而实现知识点之间的关联分析。实现了知识点之间的语义关联。这种关联分析不仅可以帮助学生更好地理解知识点之间的联系,还可以为教师提供更精确和有针对性的教学指导和评估。
建模过程如下:
B1、知识点抽取:从大量的教育资料和学习资源中,使用自然语言处理技术和机器学习算法,抽取出不同学科领域的知识点。这些知识点通常是以词语或短语的形式表示,例如“线性方程组”、“牛顿第二定律”等。
B2、关系类型定义:定义知识点之间的关系类型,例如层次结构、相关性和组成关系,以及每种关系类型的具体含义。例如,数学中的层次结构关系可以被定义为一个知识点是另一个知识点的父节点或子节点。
B3、关系抽取:使用自然语言处理技术和机器学习算法,从大量的教育资料中抽取出知识点之间的关系。例如,可以使用文本相似度计算来识别相关性关系,使用规则或统计模型来识别层次结构关系。
B4、关系存储:将抽取出的知识点和关系存储在知识图谱***中,并且使用图数据库等技术来支持知识点关系的查询和检索。例如,可以使用Neo4j图数据库来存储知识点之间的关系。
B5、关系验证和更新:定期对知识点关系进行验证和更新,以确保知识图谱的准确性和完整性。这可以通过人工审核和自动化算法来实现。
本发明可以根据用户的学***,还可以为教师提供有针对性的教学指导和反馈。
本发明可以对用户的互动行为、以及学习路径进行分析和评估,如讨论频率、质量以及互动程度等。通过这些分析行为数据,***可以帮助教师更好地了解学生的学习情况和表现,进而提供精准的教学指导和管理。
在一种可能的实施方式中,所述自然语言处理模块包括多模态语义理解子模块、知识图谱扩展模块以及深度融合场景模块。
所述多模态语义理解子模块用于,采用定时任务以及自然语言处理算法对已有知识点进行多模块语义理解,扩展教学知识图谱中已有知识点的关键词,得到扩展后的教学知识图谱,并将扩展后的教学知识图谱中的知识点推送给相同领域的教师,所述相同领域用于表征老师用户所教学领域与知识点所在领域相同。
本发明所提供的***不仅支持文本输入,还支持图片以及视频等多种形式的输入,并能够将这些不同形式的输入内容通过“多源异构数据融合”进行标准处理。同时,***会根据定时任务要求,定期对资源库数据进行更新维护,***会根据自然语言处理技术对其进行重新分析和交叉对比,不断完善现有知识点的关键词、视频切割准确度等。例如***对物理学某个知识点关键词“导热”,但经过***利用新的数据源对比,会扩展新的关键词,比如“热传导”、“导热系数”等,并推送给教研人员,供教研人员后续的对比更新。
所述知识图谱扩展模块用于,基于教学知识图谱中已有知识点的关键词,从指定数据源上爬取与已有知识点关键词相关的新知识点,并根据该相关的新知识点对扩展后的教学知识图谱进行更新,得到更新后的教学知识图谱。
本发明所提供的***采用可扩展的知识图谱架构,能够支持海量的语义数据存储和检索。同时,该***会根据知识点的关键词,主动去学科网站或指定的数据来源搜索与现有知识点相关联的内容,并补充至资源库,不断完善和丰富知识图谱。
所述深度融合场景模块用于,基于教学知识图谱中的已有知识点,获取不同应用场景的领域知识库,得到不同的应用场景数据,所述领域知识库包括与应用场景领域相同的至少一个已有知识点。
本发明所提供的***针对不同的应用场景(例如教育、医疗或者金融等),进行深度融合,提供相应的领域知识库和智能化服务,为用户提供更加精准的语义分析和智能应用。
在一种可能的实施方式中,所述数据挖掘模块包括智能辅导子模块以及知识点精准匹配子模块;
所述智能辅导子模块用于,向学生用户提供其预设领域中相关知识点的练习题目,并记录学生用户答写练习题目的做题数据,所述做题数据至少包括正确率以及错误练习题目。
所述智能辅导子模块还用于,实时监控正确率,当该正确率下降至设定阈值之后,向学生用户推送错误练习题目对应的解析答案、学习思路以及关联知识点;其中,设定阈值用于表征老师用户为学生用户设定的最低正确率,练习题目对应的解析答案、学习思路以及关联知识点均为预先存储数据。
针对学生在学***台中的习题是和多个知识点关联,当学生对题目的正确率低于教师设置数值后,学习助手会主动向学生推送知识点,督促学生巩固复习。同时,***还能够自动识别学生在学习过程中出现的问题,并针对性地给出相应的解答和建议,供更加个性化的学习路径。实时监测学生每日的学习数据,例如今日的学习时间很少,学习助手会根据学生今日学习计划,向其推送课程学习提醒。
所述知识点精准匹配子模块用于,接受学生用户输入的问题字符串,并在教学知识图谱中匹配问题字符串所对应的知识点,并将该问题字符串所对应的知识点反馈给学生用户。
对于学生来说,掌握知识点是学习的关键。而本发明所提供的***通过对知识点进行精准建模和匹配,能够快速定位学生所需的知识点,并为其提供相应的解释和举例说明。例如,***能够根据学生输入的问题,自动匹配相关的知识点,并给出相应的答案和解释,帮助学生更好地理解和掌握知识。这种个性化的知识点匹配方式,能够让学生更加高效地学习和成长。
在一种可能的实施方式中,所述人工智能分析模块包括试卷测试子模块以及成绩分析子模块。
所述试卷测试子模块用于,为学生用户提供测试试卷,并记录学生用户的答题情况。
所述成绩分析子模块用于,基于学生用户的答题情况,分析学生用户在不同知识点上的掌握情况,并基于掌握情况生成学习计划建议,将掌握情况以及学习计划建议反馈给学生用户对应的家长用户以及老师用户。
本发明所提供的***采用自然语言处理技术对学生的语言输入进行处理和分析,列举2点如下:1.语法纠错:自然语言处理技术可以识别和纠正学生语言输入中的语法错误和拼写错误。2.文本分类:可以将学生语言输入进行分类,如句子分类、主题分类等,从而更好地了解学生学习需求和行为特征。通过以上操作提高***对学生需求的理解和响应速度。***可以自动识别学生的问题或需求,并提供相应的答案或推荐学习资源,从而提高学生的学习效率和满意度。
在一种可能的实施方式中,还包括智能匹配模块,所述智能匹配模块用于,接受学生用户或者家长用户输入的目标条件,为学生用户或者家长用户匹配并推荐与目标条件对应的目标老师用户。
本发明所提供的***可以对学生的学习成绩进行分析和评估,从而为老师和家长提供更加详细的反馈和建议。***可以分析学生在不同知识点上的掌握情况和难点,识别学生的弱项和优势,并提供相应的改进建议和学习计划。
在使用***的过程中,***会根据用户的历史数据和兴趣爱好,为用户推荐符合需求的机构、师资和课程。用户可以输入自己的需求和条件,***能够在短时间内给出最符合用户需求的结果。本发明可以实现实时匹配,随着市场变化、需求变化等因素的不断变化,智能匹配算法也可以根据变化进行实时调整,保证匹配结果的准确性和及时性。
综上所述,本发明所提供的***在教育领域中,通过人工智能技术的应用创新,实现了对学生学习情况的精准分析和评估,以及个性化的智能辅导和教育服务。这种基于知识图谱的教育模式,能够更好地满足学生在学习过程中的个性化需求,提高学习效率和质量,助力其实现更好的学业成长。除了以上所述的几个方面,本发明所提供的***在教育领域中的应用还涵盖以下方面:
互动式学习工具:本发明所提供的***通过结合多媒体技术和互动式学习工具,让学生更加生动地学习和感受知识。例如,在课堂教学中,***可以通过视频、音频等多媒体形式来呈现知识点,让学生更加深入地理解和掌握知识。
学生学业管理:本发明所提供的***通过对学生学习情况的全面监测和分析,帮助学生制定有效的学习计划和目标,并为其提供相应的学业管理和指导服务。例如,在学习计划制定中,***能够根据学生的学习目标和时间分配情况,生成相应的学习计划,并进行智能调整和推荐。
教师教学辅助:本发明所提供的***通过对教师教学行为的监测和分析,为其提供相应的教学辅助和指导服务。例如,在课堂教学中,***能够自动记录教师的授课内容、学生反馈情况等信息,并进行智能分析和总结,帮助教师更好地调整和优化教学方式和方法。
本发明能够将大量散乱的数据进行整合和管理,从而提高在教学活动中的利用率;能够将不同领域的数据进行融合,实现跨领域的信息集成,为多维度的分析提供了支撑;能够对数据进行清洗、归一化和去重等操作,提高数据的准确性和可信度;能够快速地进行数据集成和建模,降低了数据集成和管理的成本。本繁忙可以提供可视化的展示界面,用户可以通过交互式查询和分析,快速获取所需的信息,提升了用户体验。
传统的知识图谱只能提供静态的知识节点和关系,无法实现交互式的问答和搜索功能。而本发明的知识图谱中,采用了一种基于自然语言处理和深度学习技术的智能问答和知识搜索方法,可以根据用户的自然语言输入,快速找到相关的知识节点和关系,并将其以可视化的方式呈现给用户。同时,本发明还引入了一些人机交互的策略,比如智能补全、热门问题推荐等,使得用户能够更加高效地获取所需的知识。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求书指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求书来限制。

Claims (10)

1.一种基于人工智能和大数据的教育知识图谱***,其特征在于,包括多源异构数据融合模块、自然语言处理模块、数据挖掘模块以及人工智能分析模块;
所述多源异构数据融合模块用于从不同的数据源中采集教学原始数据,并根据所述教学原始数据构建教学知识图谱,采集教学知识图谱的修改操作,并根据修改操作对教学知识图谱进行修改;
所述自然语言处理模块用于采用自然语言处理方法对教学知识图谱进行更新,获取更新后的教学知识图谱,并基于更新后的教学知识图谱获取不同的应用场景数据;
所述数据挖掘模块用于根据更新后的教学知识图谱以及应用场景数据,为学生用户匹配与检索操作对应的知识点以及进行智能辅导学习;
所述人工智能分析模块用于对学生用户成绩进行智能分析,得到智能分析结果,并向老师用户以及学生用户对应的家长用户推荐该智能分析结果。
2.根据权利要求1所述的基于人工智能和大数据的教育知识图谱***,其特征在于,所述多源异构数据融合模块包括数据采集子模块、数据清洗子模块、知识图谱构建子模块以及关联修订子模块;
所述数据采集子模块用于,通过网络爬虫对公开的网页、公开数据库以及公开文档中的数据进行采集,得到教学原始数据,所述教学原始数据包括结构化数据以及非结构化数据;
所述数据清洗子子模块用于,对教学原始数据进行预处理,得到预处理后的教学原始数据;
所述知识图谱构建子模块用于,根据预处理后的教学原始数据,构建教学知识图谱;
所述关联修订子模块用于,接收包括新知识点以及关联匹配字符的修改操作,并根据关联匹配字符在教学知识图谱中匹配至少一个目标知识点;待匹配到至少一个目标知识点后,接受人机交互产生的目标知识点所对应的关联操作,将关联操作对应的目标知识点与新知识点关联,完成对教学知识图谱的修改。
3.根据权利要求2所述的基于人工智能和大数据的教育知识图谱***,其特征在于,所述数据采集子模块包括文本数据采集单元、图片数据采集单元、音频数据采集单元以及视频数据采集单元;
所述文本数据采集单元用于,通过网络爬虫对公开的网页、公开数据库以及公开文档中的文档进行采集,得到原始文档数据;
所述图片数据采集单元用于,通过网络爬虫对公开的网页、公开数据库以及公开文档中的图片进行采集,得到原始图片数据;
所述音频数据采集单元用于,通过网络爬虫对公开的网页、公开数据库以及公开文档中的音频进行采集,得到原始音频数据;
所述视频数据采集单元用于,通过网络爬虫对公开的网页、公开数据库以及公开文档中的视频进行采集,得到原始视频数据;
其中,原始文档数据、原始图片数据、原始音频数据以及原始视频数据共同作为教学原始数据。
4.根据权利要求2所述的基于人工智能和大数据的教育知识图谱***,其特征在于,所述数据清洗子模块包括重复值清洗单元以及异常值清洗单元;
所述重复值清洗单元用于,对教学原始数据中的重复数据进行清除;
所述异常值清洗单元用于,对教学原始数据中的异常数据进行清除,所述异常数据用于表征含义敏感词汇的数据或者无法识别的数据。
5.根据权利要求2所述的基于人工智能和大数据的教育知识图谱***,其特征在于,所述知识图谱构建子模块包括知识点抽取单元、关系抽取单元以及知识图谱构建单元;
所述知识点抽取单元用于,抽取预处理后的教学原始数据中的知识点;
所述关系抽取单元用于,从原始教学数据中抽取各个知识点之间的关系;
所述知识图谱构建单元用于,根据知识点抽取单元得到的知识点以及关系抽取单元得到的关系,构建知识图谱。
6.根据权利要求2所述的基于人工智能和大数据的教育知识图谱***,其特征在于,所述关联修订子模块包括新知识点获取单元、已存储知识点检索单元以及关联存储单元;
所述新知识点获取单元用于,接收包括新知识点以及关联匹配字符的修改操作;
所述已存储知识点检索单元用于,根据关联匹配字符,并采用神经网络算法在教学知识图谱中匹配至少一个目标知识点;
所述关联存储单元用于,待匹配到至少一个目标知识点后,接受人机交互产生的目标知识点所对应的关联操作,将关联操作对应的目标知识点与新知识点关联,完成对教学知识图谱的修改。
7.根据权利要求1所述的基于人工智能和大数据的教育知识图谱***,其特征在于,所述自然语言处理模块包括多模态语义理解子模块、知识图谱扩展模块以及深度融合场景模块;
所述多模态语义理解子模块用于,采用定时任务以及自然语言处理算法对已有知识点进行多模块语义理解,扩展教学知识图谱中已有知识点的关键词,得到扩展后的教学知识图谱,并将扩展后的教学知识图谱中的知识点推送给相同领域的教师,所述相同领域用于表征老师用户所教学领域与知识点所在领域相同;
所述知识图谱扩展模块用于,基于教学知识图谱中已有知识点的关键词,从指定数据源上爬取与已有知识点关键词相关的新知识点,并根据该相关的新知识点对扩展后的教学知识图谱进行更新,得到更新后的教学知识图谱;
所述深度融合场景模块用于,基于教学知识图谱中的已有知识点,获取不同应用场景的领域知识库,得到不同的应用场景数据,所述领域知识库包括与应用场景领域相同的至少一个已有知识点。
8.根据权利要求7所述的基于人工智能和大数据的教育知识图谱***,其特征在于,所述数据挖掘模块包括智能辅导子模块以及知识点精准匹配子模块;
所述智能辅导子模块用于,向学生用户提供其预设领域中相关知识点的练习题目,并记录学生用户答写练习题目的做题数据,所述做题数据至少包括正确率以及错误练习题目;
所述智能辅导子模块还用于,实时监控正确率,当该正确率下降至设定阈值之后,向学生用户推送错误练习题目对应的解析答案、学习思路以及关联知识点;其中,设定阈值用于表征老师用户为学生用户设定的最低正确率,练习题目对应的解析答案、学习思路以及关联知识点均为预先存储数据;
所述知识点精准匹配子模块用于,接受学生用户输入的问题字符串,并在教学知识图谱中匹配问题字符串所对应的知识点,并将该问题字符串所对应的知识点反馈给学生用户。
9.根据权利要求8所述的基于人工智能和大数据的教育知识图谱***,其特征在于,所述人工智能分析模块包括试卷测试子模块以及成绩分析子模块;
所述试卷测试子模块用于,为学生用户提供测试试卷,并记录学生用户的答题情况;
所述成绩分析子模块用于,基于学生用户的答题情况,分析学生用户在不同知识点上的掌握情况,并基于掌握情况生成学习计划建议,将掌握情况以及学习计划建议反馈给学生用户对应的家长用户以及老师用户。
10.根据权利要求1所述的基于人工智能和大数据的教育知识图谱***,其特征在于,还包括智能匹配模块,所述智能匹配模块用于,接受学生用户或者家长用户输入的目标条件,为学生用户或者家长用户匹配并推荐与目标条件对应的目标老师用户。
CN202310522285.4A 2023-05-10 2023-05-10 一种基于人工智能和大数据的教育知识图谱*** Pending CN116595188A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310522285.4A CN116595188A (zh) 2023-05-10 2023-05-10 一种基于人工智能和大数据的教育知识图谱***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310522285.4A CN116595188A (zh) 2023-05-10 2023-05-10 一种基于人工智能和大数据的教育知识图谱***

Publications (1)

Publication Number Publication Date
CN116595188A true CN116595188A (zh) 2023-08-15

Family

ID=87593087

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310522285.4A Pending CN116595188A (zh) 2023-05-10 2023-05-10 一种基于人工智能和大数据的教育知识图谱***

Country Status (1)

Country Link
CN (1) CN116595188A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117235187A (zh) * 2023-11-14 2023-12-15 深圳市联特微电脑信息技术开发有限公司 一种基于网络教学资源的数据存储方法及***
CN117669718A (zh) * 2023-12-05 2024-03-08 广州鸿蒙信息科技有限公司 一种基于人工智能的消防知识训练模型及训练方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117235187A (zh) * 2023-11-14 2023-12-15 深圳市联特微电脑信息技术开发有限公司 一种基于网络教学资源的数据存储方法及***
CN117235187B (zh) * 2023-11-14 2024-03-22 深圳市联特微电脑信息技术开发有限公司 一种基于网络教学资源的数据存储方法及***
CN117669718A (zh) * 2023-12-05 2024-03-08 广州鸿蒙信息科技有限公司 一种基于人工智能的消防知识训练模型及训练方法

Similar Documents

Publication Publication Date Title
CN107230174B (zh) 一种基于网络的在线互动学习***和方法
CN109947915B (zh) 一种基于知识管理***的人工智能专家***及其构建方法
CN102262634B (zh) 一种自动问答方法及***
CN112395403B (zh) 一种基于知识图谱的问答方法、***、电子设备及介质
US20080126319A1 (en) Automated short free-text scoring method and system
CN116595188A (zh) 一种基于人工智能和大数据的教育知识图谱***
CN108509439B (zh) 一种代数教学***
US20150026184A1 (en) Methods and systems for content management
CN113886567A (zh) 一种基于知识图谱的教学方法及***
CN110968708A (zh) 一种教育信息资源属性标注方法及***
CN117150151B (zh) 一种基于大语言模型的错题分析及试题推荐***和方法
CN116821377A (zh) 基于知识图谱和大模型的小学语文自动评测***
Atapattu et al. Automated extraction of semantic concepts from semi-structured data: Supporting computer-based education through the analysis of lecture notes
CN115238199A (zh) 基于知识图谱的在线社区学习路径推荐方法、***及设备
Soares et al. Education question answering systems: a survey
CN116401341A (zh) 面向理解的互动答疑***
Tunde et al. Ontology-based model for E-learning management system (O-Bmems)
Riza et al. Natural language processing and levenshtein distance for generating error identification typed questions on TOEFL
US20210375148A1 (en) System and method for autonomous learning of contents using a machine learning algorithm
CN114297404A (zh) 一种领域评审专家行为轨迹的知识图谱构建方法
CN117171350A (zh) 一种基于知识图谱的个性化课程学习环境构建方法与装置
Reddy et al. A novel approach for similarity and indexing-based ontology for semantic web educational system
Smith et al. Professional education in expert search: A content model
Jänicke Teaching on the intersection of visualization and digital humanities
Alemán et al. A Proposal for Domain Ontological Learning.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination