智能化教育知识图谱构建***与方法
技术领域
本发明涉及智能教学的技术领域,特别涉及智能化教育知识图谱构建***与方法。
背景技术
智能化教育技术已经广泛应用于不同模式的知识教授和课程学习中,智能化教育能够帮助老师或者学生实现有针对性的和精准的教育知识数据加工以及高效的知识教授与学习。但是,在知识教育领域,相关的知识教育数据的数据量是巨大的并且数据结构较为复杂,为了提高教育知识学习的全面性,需要对教育知识数据进行准确的挖掘与关联,以此构建相应的教育知识图谱。但是,现有技术构建教育知识图谱的方式都只是局限于教育知识数据本身的文本属性,其并未针对不同教育知识数据之间的关联性进行构建,这不利于提高教育知识图谱的数据可溯性和数据可靠性。
发明内容
针对现有技术存在的缺陷,本发明提供智能化教育知识图谱构建***与方法,该智能化教育知识图谱构建***与方法通过对关于某一学科的教育知识点数据进行关于知识点内容的分类后,进行可识别文本转换处理和规范化处理,以此生成知识文本集合,并且还确定该知识点文本集合中不同文本元之间的实体关联性,最后再根据该实体关联性,对该知识点文本集合中的所有文本元进行重组排列和索引标注,以此构建形成关于所述某一学科的教育知识图谱;可见,该智能化教育知识图谱构建***与方法不仅能够对教育知识点数据本身进行有针对性的文本转换和纠错规范,以此提高该教育知识点数据的准确性和可靠性,并且还能够以文本元的形式对不同教育知识点数据之间的实体关联性进行有效地挖掘,以使构建得到的教育知识图谱更能够真实地和全面地反映不同教育知识点数据在知识层面上的关系,从而提高教育知识图谱的数据可溯性和数据可靠性。
本发明提供智能化教育知识图谱构建***,其特征在于:
所述智能化教育知识图谱构建***包括教育知识点数据分类模块、知识文本集合生成模块、文本元实体关联系确定模块和教育知识图谱构建模块;其中,
所述教育知识点数据分类模块用于对来自预设教育资源库的某一学科的教育知识点数据进行关于知识点内容的分类;
所述知识文本集合生成模块用于对所述分类后的不同教育知识点数据进行可识别文本转换处理和规范化处理,以此生成知识文本集合;
所述文本元实体关联系确定模块用于确定所述知识点文本集合中不同文本元之间的实体关联性;
所述教育知识图谱构建模块用于根据所述实体关联性,对所述知识点文本集合中的所有文本元进行重组排列和索引标注,以此构建形成关于所述某一学科的教育知识图谱;
进一步,所述教育知识点数据分类模块包括教育知识点数据获取子模块、知识难度值计算子模块和分类确定子模块;其中,
所述教育知识点数据获取子模块用于根据关于所述某一学科的教学课程框架,从所述预设教育资源库中获取关于所述某一学科的所述教育知识点数据;
所述知识难度值计算子模块用于通过预设学科知识神经网络模型,计算每一项所述教育知识点数据对应的知识内容难度值;
所述分类确定子模块用于根据所述知识内容难度值,将所有项教育知识点数据分类为具有不同难度等级的教育知识点数据;
进一步,所述知识文本集合生成模块包括可识别文本转换处理子模块、规范化处理子模块和知识文本集合组成子模块;其中,
所述可识别文本转换处理子模块用于对所述分类后的教育知识点数据进行关于分词和/或短句的可识别文本转换处理,以此获得初始化知识文本;
所述规范化处理子模块用于对所述初始化知识文本进行语法规范化、逻辑规范化和错别字规范化中的至少一者处理,以此将所述初始化知识文本转换为规范化知识文本;
所述知识文本集合组成子模块用于根据所述分类后的不同教育知识点数据各自的难度等级,将所有规范化文本组成具有多维矩阵形式的知识文本集合;
进一步,所述文本元实体关联系确定模块包括文本元生成子模块和实体关联性评价值计算子模块;其中,
所述文本元生成子模块用于根据所述知识点文本集合中的每一项知识点文本的文本语料和文本结构,将每一项知识点文本转换为相应的文本元;
所述实体关联性评价值计算子模块用于通过知识点文本实体关联性评价神经网络模型对所有文本元进行分析处理,以此计算不同文本元相互之间在文本实体语料和/或文本实体结构上的实体关联性评价值;
进一步,所述教育知识图谱构建模块包括重组排列子模块、索引标注子模块和图谱转化处理子模块;其中,
所述重组排列子模块用于根据所述实体关联性对应的实体关联性评价值,对所述知识点文本集合中的所有文本元进行关于评价值高低的重组排列,以此生成具有不同高低实体关联性表征状态的文本元结构树;
所述索引标注子模块用于对所述文本元结构树上的每一个文本元进行关于文本语义和/或文本查询路径的索引标注,以此获得索引标注化文本元结构树;
所述图谱转化处理子模块用于将所述索引标注化文本元结构树进行二维图谱的转化处理,以此构建形成关于所述某一学科的教育知识图谱;
进一步,所述文本元实体关联系确定模块用于确定所述知识点文本集合中不同文本元之间的实体关联性,其具体实现过程如下:
步骤A1,根据所述教育知识点数据获取子模块获取所述某一学科的所述教育知识点数据,通过预设学科知识神经网络模型以及下面公式(1),获取每一项所述教育知识点数据对应的知识内容难度值
在上述公式(1)中,P为所述各学科所含教育知识点数据的数量,p=1,2,3、、、P;k为所述知识点数据难度等级,其取值范围为[0,22],d
k为所述知识点数据难度等级为k所对应知识点数据复杂语法结构数量,o
k为所述知识点数据难度等级为k所对应知识点数据复杂文本结构数量,
为各项所述教育知识点数据中既有复杂语法结构及复杂文本结构的语句数量,j为知识点数据在考核中分数占比,w
j为知识点数据在考核中分数占比为j所对应的重要知识点排序,f(o
k,d)为根据各知识点数据的复杂语法结构和文本结构数量判断知识点的难易度,其判断阈值为0.6,即当知识点数据的复杂语法结构和文本结构数量超过总知识的0.6时,判断为较难知识点,反之,则为较易知识点,f(w
j,k)为根据知识点数据在考核中分数占比判断是否为重要知识点,其判断阈值为0.3,即考核中该知识点数据分数占比超过总分数的0.3,则判断为重要知识点,P(w
j,d
k,o
k)为获取每一项所述教育知识点数据对应的知识内容难度值;
步骤A2,根据步骤A1获取的每一项所述教育知识点数据对应的知识内容难度值以及下面公式(2),进行数据关联组合,获取多维矩阵形式的知识文本集合
在上述公式(2)中,Π为连乘,M为所述待组成具有多维矩阵形式的知识文本子集数量,i为所述各项教育知识点数据中所含单词数量,a
i为所述各项教育知识点数据中所含单词数量为i所对应的词组/短句总数,l为根据首字母进行组合的子集数量,b
l为根据首字母进行组合的子集数量为l所对应各子集索引标注信息,
为所述知识文本重组排列的次数,γ为将各文本词组按照首字母、次字母顺序进行多维矩阵排序,F(a
i,b
l)为获取多维矩阵形式的知识文本集合;
步骤A3,将步骤A2获取的多维矩阵形式的知识文本集合,通过所述知识点文本实体关联性评价神经网络模型对所有文本元以及下面公式(3)进行分析处理,根据评判结果,执行获得不同文本元相互之间在文本实体语料或文本实体结构上的实体关联性评价值的操作
在上述公式(3)中,N为所述文本元的总数,取值应大于2,h为随机两份文本元之间的相同文本实体文字占比,x为随机两份文本元之间相同文本实体语料占比,
为根据语言数据库随机匹配检索各不同文本元之间的词义相似度,g为随机两份文本元之间具有相同文本实体结构数量,y为随机两份文本元之间在词义上属于包含关系的文本占比,
为根据语言数据库随机匹配检索各不同文本元之间的关联度,f(a)为各文本元文本实体语料信息,f(b)为各文本元文本实体结构信息,当P(h,l)计算值大于1时,则表示所述不同文本元在文本实体语料或文本实体结构上存在一定关联,执行获得不同文本元相互之间在文本实体语料或文本实体结构上的实体关联性评价值的操作。
本发明还提供智能化教育知识图谱构建方法,其特征在于,所述智能化教育知识图谱构建方法包括如下步骤:
步骤S1,从预设教育资源库中获取关于某一学科的教育知识点数据,并对所述教育知识点数据进行关于知识点内容的分类;
步骤S2,对所述分类后的不同教育知识点数据进行可识别文本转换处理和规范化处理,以此生成知识文本集合;
步骤S3,确定所述知识点文本集合中不同文本元之间的实体关联性;
步骤S4,根据所述实体关联性,对所述知识点文本集合中的所有文本元进行重组排列和索引标注,以此构建形成关于所述某一学科的教育知识图谱;
进一步,在所述步骤S1中,从预设教育资源库中获取关于某一学科的教育知识点数据,并对所述教育知识点数据进行关于知识点内容的分类具体包括,
步骤S101,根据关于所述某一学科的教学课程框架,从所述预设教育资源库中获取关于所述某一学科的所述教育知识点数据;
步骤S102,通过预设学科知识神经网络模型,计算每一项所述教育知识点数据对应的知识内容难度值;
步骤S103,根据所述步骤S102计算得到的所述知识内容难度值,将所有项教育知识点数据分类为具有不同难度等级的教育知识点数据;
或者,
在所述步骤S2中,对所述分类后的不同教育知识点数据进行可识别文本转换处理和规范化处理,以此生成知识文本集合具体包括,
步骤S201,对所述分类后的教育知识点数据进行关于分词和/或短句的可识别文本转换处理,以此获得初始化知识文本;
步骤S202,对所述初始化知识文本进行语法规范化、逻辑规范化和错别字规范化中的至少一者处理,以此将所述初始化知识文本转换为规范化知识文本;
步骤S203,根据所述分类后的不同教育知识点数据各自的难度等级,将所有规范化文本组成具有多维矩阵形式的知识文本集合;
进一步,在所述步骤S3中,确定所述知识点文本集合中不同文本元之间的实体关联性具体包括,
步骤S301,根据所述知识点文本集合中的每一项知识点文本的文本语料和文本结构,将每一项知识点文本转换为相应的文本元;
步骤S302,构建并优化一知识点文本实体关联性评价神经网络模型,并通过所述知识点文本实体关联性评价神经网络模型对所有文本元进行分析处理,以此获得不同文本元相互之间在文本实体语料和/或文本实体结构上的实体关联性评价值;
进一步,在所述步骤S4中,根据所述实体关联性,对所述知识点文本集合中的所有文本元进行重组排列和索引标注,以此构建形成关于所述某一学科的教育知识图谱具体包括,
步骤S401,根据所述实体关联性对应的实体关联性评价值,对所述知识点文本集合中的所有文本元进行关于评价值高低的重组排列,以此生成具有不同高低实体关联性表征状态的文本元结构树;
步骤S402,对所述文本元结构树上的每一个文本元进行关于文本语义和/或文本查询路径的索引标注,以此获得索引标注化文本元结构树;
步骤S403,将所述索引标注化文本元结构树进行二维图谱的转化处理,以此构建形成关于所述某一学科的教育知识图谱。
相比于现有技术,该智能化教育知识图谱构建***与方法通过对关于某一学科的教育知识点数据进行关于知识点内容的分类后,进行可识别文本转换处理和规范化处理,以此生成知识文本集合,并且还确定该知识点文本集合中不同文本元之间的实体关联性,最后再根据该实体关联性,对该知识点文本集合中的所有文本元进行重组排列和索引标注,以此构建形成关于所述某一学科的教育知识图谱;可见,该智能化教育知识图谱构建***与方法不仅能够对教育知识点数据本身进行有针对性的文本转换和纠错规范,以此提高该教育知识点数据的准确性和可靠性,并且还能够以文本元的形式对不同教育知识点数据之间的实体关联性进行有效地挖掘,以使构建得到的教育知识图谱更能够真实地和全面地反映不同教育知识点数据在知识层面上的关系,从而提高教育知识图谱的数据可溯性和数据可靠性。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的智能化教育知识图谱构建***的结构示意图。
图2为本发明提供的智能化教育知识图谱构建方法的流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参阅图1,为本发明实施例提供的智能化教育知识图谱构建***的结构示意图。该智能化教育知识图谱构建***包括教育知识点数据分类模块、知识文本集合生成模块、文本元实体关联系确定模块和教育知识图谱构建模块;其中,该教育知识点数据分类模块用于对来自预设教育资源库的某一学科的教育知识点数据进行关于知识点内容的分类;
该知识文本集合生成模块用于对该分类后的不同教育知识点数据进行可识别文本转换处理和规范化处理,以此生成知识文本集合;
该文本元实体关联系确定模块用于确定该知识点文本集合中不同文本元之间的实体关联性;
该教育知识图谱构建模块用于根据该实体关联性,对该知识点文本集合中的所有文本元进行重组排列和索引标注,以此构建形成关于该某一学科的教育知识图谱。
该智能化教育知识图谱构建***有别于现有技术的其他知识图谱构建方式,其不仅对教育知识点数据本身进行难度等级分类、可识别文本转换和纠错规范等预处理来提高该教育知识点数据的正确性和可靠性,以此确保后续知识图谱构建的有效性,并且还通过文本元的形式对不同教育知识点数据之间的实体关联性进行评价,从而提高该教育知识图谱的构建效率和知识关联真实性。
优选地,该教育知识点数据分类模块包括教育知识点数据获取子模块、知识难度值计算子模块和分类确定子模块;其中,
该教育知识点数据获取子模块用于根据关于该某一学科的教学课程框架,从该预设教育资源库中获取关于该某一学科的该教育知识点数据;
该知识难度值计算子模块用于通过预设学科知识神经网络模型,计算每一项该教育知识点数据对应的知识内容难度值;
该分类确定子模块用于根据该知识内容难度值,将所有项教育知识点数据分类为具有不同难度等级的教育知识点数据。
该教育知识点数据分类模块通过以教育知识点数据的知识内容难度值作为基准来对所有的教育知识点数据进行分类能够实现对不同难度的教育知识点数据的区别处理,以此避免由于不同教育知识点数据本身在难度上的差异而导致后续的分析处理出现偏差,以及提高对不同教育知识点数据的处理针对性和有效性,从而降低后续文本转换和纠错规范等处理步骤的繁复性。
优选地,该知识文本集合生成模块包括可识别文本转换处理子模块、规范化处理子模块和知识文本集合组成子模块;其中,
该可识别文本转换处理子模块用于对该分类后的教育知识点数据进行关于分词和/或短句的可识别文本转换处理,以此获得初始化知识文本;
该规范化处理子模块用于对该初始化知识文本进行语法规范化、逻辑规范化和错别字规范化中的至少一者处理,以此将该初始化知识文本转换为规范化知识文本;
该知识文本集合组成子模块用于根据该分类后的不同教育知识点数据各自的难度等级,将所有规范化文本组成具有多维矩阵形式的知识文本集合。
该知识文本集合生成模块通过对该教育知识点数据进行可识别文本转换处理和规范化处理能够提高该教育知识点数据的标准化程度和降低错误率,以便于后续该教育知识点数据进行分析处理时不会出现无法识别或者编辑的情况,从而大大地降低该教育知识点数据的处理出错率。
优选地,该文本元实体关联系确定模块包括文本元生成子模块和实体关联性评价值计算子模块;其中,
该文本元生成子模块用于根据该知识点文本集合中的每一项知识点文本的文本语料和文本结构,将每一项知识点文本转换为相应的文本元;
该实体关联性评价值计算子模块用于通过知识点文本实体关联性评价神经网络模型对所有文本元进行分析处理,以此计算不同文本元相互之间在文本实体语料和/或文本实体结构上的实体关联性评价值。
该文本元实体关联系确定模块通过将知识点文本转换为与文办预料和文本结构相关的文本元,能够在有效地压缩该教育知识点数据的数据量的同时,最大限度地保留该教育知识点数据的有效数据部分,从而提高计算该实体关联性评价值的效率和准确性。
优选地,该教育知识图谱构建模块包括重组排列子模块、索引标注子模块和图谱转化处理子模块;其中,
该重组排列子模块用于根据该实体关联性对应的实体关联性评价值,对该知识点文本集合中的所有文本元进行关于评价值高低的重组排列,以此生成具有不同高低实体关联性表征状态的文本元结构树;
该索引标注子模块用于对该文本元结构树上的每一个文本元进行关于文本语义和/或文本查询路径的索引标注,以此获得索引标注化文本元结构树;
该图谱转化处理子模块用于将该索引标注化文本元结构树进行二维图谱的转化处理,以此构建形成关于该某一学科的教育知识图谱。
该教育知识图谱构建模块通过以实体关联性评价值为基准对所有文本元进行重组排列和索引标注,能够更加全面地反映不同教育知识点数据之间的实体关联高低程度,从而提高该教育知识图谱的数据可溯性和数据可靠性。
优选地,该文本元实体关联系确定模块用于确定该知识点文本集合中不同文本元之间的实体关联性,其具体实现过程如下:
步骤A1,根据该教育知识点数据获取子模块获取该某一学科的该教育知识点数据,通过预设学科知识神经网络模型以及下面公式(1),获取每一项该教育知识点数据对应的知识内容难度值
在上述公式(1)中,P为该各学科所含教育知识点数据的数量,p=1,2,3、、、P;k为该知识点数据难度等级,其取值范围为[0,22],d
k为该知识点数据难度等级为k所对应知识点数据复杂语法结构数量,o
k为该知识点数据难度等级为k所对应知识点数据复杂文本结构数量,
为各项该教育知识点数据中既有复杂语法结构及复杂文本结构的语句数量,j为知识点数据在考核中分数占比,w
j为知识点数据在考核中分数占比为j所对应的重要知识点排序,f(o
k,d)为根据各知识点数据的复杂语法结构和文本结构数量判断知识点的难易度,其判断阈值为0.6,即当知识点数据的复杂语法结构和文本结构数量超过总知识的0.6时,判断为较难知识点,反之,则为较易知识点,f(w
j,k)为根据知识点数据在考核中分数占比判断是否为重要知识点,其判断阈值为0.3,即考核中该知识点数据分数占比超过总分数的0.3,则判断为重要知识点,P(w
j,d
k,o
k)为获取每一项该教育知识点数据对应的知识内容难度值;
步骤A2,根据步骤A1获取的每一项该教育知识点数据对应的知识内容难度值以及下面公式(2),进行数据关联组合,获取多维矩阵形式的知识文本集合
在上述公式(2)中,Π为连乘,M为该待组成具有多维矩阵形式的知识文本子集数量,i为该各项教育知识点数据中所含单词数量,a
i为该各项教育知识点数据中所含单词数量为i所对应的词组/短句总数,l为根据首字母进行组合的子集数量,b
l为根据首字母进行组合的子集数量为l所对应各子集索引标注信息,
为该知识文本重组排列的次数,γ为将各文本词组按照首字母、次字母顺序进行多维矩阵排序,F(a
i,b
l)为获取多维矩阵形式的知识文本集合;
步骤A3,将步骤A2获取的多维矩阵形式的知识文本集合,通过该知识点文本实体关联性评价神经网络模型对所有文本元以及下面公式(3)进行分析处理,根据评判结果,执行获得不同文本元相互之间在文本实体语料或文本实体结构上的实体关联性评价值的操作
在上述公式(3)中,N为该文本元的总数,取值应大于2,h为随机两份文本元之间的相同文本实体文字占比,x为随机两份文本元之间相同文本实体语料占比,
为根据语言数据库随机匹配检索各不同文本元之间的词义相似度,g为随机两份文本元之间具有相同文本实体结构数量,y为随机两份文本元之间在词义上属于包含关系的文本占比,
为根据语言数据库随机匹配检索各不同文本元之间的关联度,f(a)为各文本元文本实体语料信息,f(b)为各文本元文本实体结构信息,当P(h,l)计算值大于1时,则表示该不同文本元在文本实体语料或文本实体结构上存在一定关联,执行获得不同文本元相互之间在文本实体语料或文本实体结构上的实体关联性评价值的操作。
上述该文本元实体关联系确定模块的计算过程以文本元的形式对不同教育知识点数据之间的实体关联性进行有效地挖掘提供了技术支持,通过智能化教育自主学习扩充所述教育知识图谱的内容,并通过构建得到的教育知识图谱真实地和全面地反映不同教育知识点数据在知识层面上的关系,进一步提高教育知识图谱的数据全面性、可追溯性和数据可靠性。
参阅图2,为本发明实施例提供的智能化教育知识图谱构建方法的流程示意图。该智能化教育知识图谱构建方法包括如下步骤:
步骤S1,从预设教育资源库中获取关于某一学科的教育知识点数据,并对该教育知识点数据进行关于知识点内容的分类;
步骤S2,对该分类后的不同教育知识点数据进行可识别文本转换处理和规范化处理,以此生成知识文本集合;
步骤S3,确定该知识点文本集合中不同文本元之间的实体关联性;
步骤S4,根据该实体关联性,对该知识点文本集合中的所有文本元进行重组排列和索引标注,以此构建形成关于该某一学科的教育知识图谱。
该智能化教育知识图谱构建方法有别于现有技术的其他知识图谱构建方式,其不仅对教育知识点数据本身进行难度等级分类、可识别文本转换和纠错规范等预处理来提高该教育知识点数据的正确性和可靠性,以此确保后续知识图谱构建的有效性,并且还通过文本元的形式对不同教育知识点数据之间的实体关联性进行评价,从而提高该教育知识图谱的构建效率和知识关联真实性。
优选地,在该步骤S1中,从预设教育资源库中获取关于某一学科的教育知识点数据,并对该教育知识点数据进行关于知识点内容的分类具体包括,
步骤S101,根据关于该某一学科的教学课程框架,从该预设教育资源库中获取关于该某一学科的该教育知识点数据;
步骤S102,通过预设学科知识神经网络模型,计算每一项该教育知识点数据对应的知识内容难度值;
步骤S103,根据该步骤S102计算得到的该知识内容难度值,将所有项教育知识点数据分类为具有不同难度等级的教育知识点数据。
通过以教育知识点数据的知识内容难度值作为基准来对所有的教育知识点数据进行分类能够实现对不同难度的教育知识点数据的区别处理,以此避免由于不同教育知识点数据本身在难度上的差异而导致后续的分析处理出现偏差,以及提高对不同教育知识点数据的处理针对性和有效性,从而降低后续文本转换和纠错规范等处理步骤的繁复性。
优选地,在该步骤S2中,对该分类后的不同教育知识点数据进行可识别文本转换处理和规范化处理,以此生成知识文本集合具体包括,
步骤S201,对该分类后的教育知识点数据进行关于分词和/或短句的可识别文本转换处理,以此获得初始化知识文本;
步骤S202,对该初始化知识文本进行语法规范化、逻辑规范化和错别字规范化中的至少一者处理,以此将该初始化知识文本转换为规范化知识文本;
步骤S203,根据该分类后的不同教育知识点数据各自的难度等级,将所有规范化文本组成具有多维矩阵形式的知识文本集合。
通过对该教育知识点数据进行可识别文本转换处理和规范化处理能够提高该教育知识点数据的标准化程度和降低错误率,以便于后续该教育知识点数据进行分析处理时不会出现无法识别或者编辑的情况,从而大大地降低该教育知识点数据的处理出错率。
优选地,在该步骤S3中,确定该知识点文本集合中不同文本元之间的实体关联性具体包括,
步骤S301,根据该知识点文本集合中的每一项知识点文本的文本语料和文本结构,将每一项知识点文本转换为相应的文本元;
步骤S302,构建并优化一知识点文本实体关联性评价神经网络模型,并通过该知识点文本实体关联性评价神经网络模型对所有文本元进行分析处理,以此获得不同文本元相互之间在文本实体语料和/或文本实体结构上的实体关联性评价值。
通过将知识点文本转换为与文办预料和文本结构相关的文本元,能够在有效地压缩该教育知识点数据的数据量的同时,最大限度地保留该教育知识点数据的有效数据部分,从而提高计算该实体关联性评价值的效率和准确性。
优选地,在该步骤S4中,根据该实体关联性,对该知识点文本集合中的所有文本元进行重组排列和索引标注,以此构建形成关于该某一学科的教育知识图谱具体包括,
步骤S401,根据该实体关联性对应的实体关联性评价值,对该知识点文本集合中的所有文本元进行关于评价值高低的重组排列,以此生成具有不同高低实体关联性表征状态的文本元结构树;
步骤S402,对该文本元结构树上的每一个文本元进行关于文本语义和/或文本查询路径的索引标注,以此获得索引标注化文本元结构树;
步骤S403,将该索引标注化文本元结构树进行二维图谱的转化处理,以此构建形成关于该某一学科的教育知识图谱。
通过以实体关联性评价值为基准对所有文本元进行重组排列和索引标注,能够更加全面地反映不同教育知识点数据之间的实体关联高低程度,从而提高该教育知识图谱的数据可溯性和数据可靠性。
从上述实施例的内容可知,该智能化教育知识图谱构建***与方法通过对关于某一学科的教育知识点数据进行关于知识点内容的分类后,进行可识别文本转换处理和规范化处理,以此生成知识文本集合,并且还确定该知识点文本集合中不同文本元之间的实体关联性,最后再根据该实体关联性,对该知识点文本集合中的所有文本元进行重组排列和索引标注,以此构建形成关于该某一学科的教育知识图谱;可见,该智能化教育知识图谱构建***与方法不仅能够对教育知识点数据本身进行有针对性的文本转换和纠错规范,以此提高该教育知识点数据的准确性和可靠性,并且还能够以文本元的形式对不同教育知识点数据之间的实体关联性进行有效地挖掘,以使构建得到的教育知识图谱更能够真实地和全面地反映不同教育知识点数据在知识层面上的关系,从而提高教育知识图谱的数据可溯性和数据可靠性。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。