CN111597356A - 智能化教育知识图谱构建***与方法 - Google Patents

智能化教育知识图谱构建***与方法 Download PDF

Info

Publication number
CN111597356A
CN111597356A CN202010458553.7A CN202010458553A CN111597356A CN 111597356 A CN111597356 A CN 111597356A CN 202010458553 A CN202010458553 A CN 202010458553A CN 111597356 A CN111597356 A CN 111597356A
Authority
CN
China
Prior art keywords
text
knowledge
education
knowledge point
entity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010458553.7A
Other languages
English (en)
Other versions
CN111597356B (zh
Inventor
崔炜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Yixue Education Technology Co Ltd
Original Assignee
Shanghai Yixue Education Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Yixue Education Technology Co Ltd filed Critical Shanghai Yixue Education Technology Co Ltd
Priority to CN202010458553.7A priority Critical patent/CN111597356B/zh
Publication of CN111597356A publication Critical patent/CN111597356A/zh
Application granted granted Critical
Publication of CN111597356B publication Critical patent/CN111597356B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/316Indexing structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • G06Q50/205Education administration or guidance

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Tourism & Hospitality (AREA)
  • Educational Administration (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Strategic Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Educational Technology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • General Business, Economics & Management (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了智能化教育知识图谱构建***与方法,该智能化教育知识图谱构建***与方法不仅能够对教育知识点数据本身进行有针对性的文本转换和纠错规范,以此提高该教育知识点数据的准确性和可靠性,并且还能够以文本元的形式对不同教育知识点数据之间的实体关联性进行有效地挖掘,以使构建得到的教育知识图谱更能够真实地和全面地反映不同教育知识点数据在知识层面上的关系,从而提高教育知识图谱的数据可溯性和数据可靠性。

Description

智能化教育知识图谱构建***与方法
技术领域
本发明涉及智能教学的技术领域,特别涉及智能化教育知识图谱构建***与方法。
背景技术
智能化教育技术已经广泛应用于不同模式的知识教授和课程学习中,智能化教育能够帮助老师或者学生实现有针对性的和精准的教育知识数据加工以及高效的知识教授与学习。但是,在知识教育领域,相关的知识教育数据的数据量是巨大的并且数据结构较为复杂,为了提高教育知识学习的全面性,需要对教育知识数据进行准确的挖掘与关联,以此构建相应的教育知识图谱。但是,现有技术构建教育知识图谱的方式都只是局限于教育知识数据本身的文本属性,其并未针对不同教育知识数据之间的关联性进行构建,这不利于提高教育知识图谱的数据可溯性和数据可靠性。
发明内容
针对现有技术存在的缺陷,本发明提供智能化教育知识图谱构建***与方法,该智能化教育知识图谱构建***与方法通过对关于某一学科的教育知识点数据进行关于知识点内容的分类后,进行可识别文本转换处理和规范化处理,以此生成知识文本集合,并且还确定该知识点文本集合中不同文本元之间的实体关联性,最后再根据该实体关联性,对该知识点文本集合中的所有文本元进行重组排列和索引标注,以此构建形成关于所述某一学科的教育知识图谱;可见,该智能化教育知识图谱构建***与方法不仅能够对教育知识点数据本身进行有针对性的文本转换和纠错规范,以此提高该教育知识点数据的准确性和可靠性,并且还能够以文本元的形式对不同教育知识点数据之间的实体关联性进行有效地挖掘,以使构建得到的教育知识图谱更能够真实地和全面地反映不同教育知识点数据在知识层面上的关系,从而提高教育知识图谱的数据可溯性和数据可靠性。
本发明提供智能化教育知识图谱构建***,其特征在于:
所述智能化教育知识图谱构建***包括教育知识点数据分类模块、知识文本集合生成模块、文本元实体关联系确定模块和教育知识图谱构建模块;其中,
所述教育知识点数据分类模块用于对来自预设教育资源库的某一学科的教育知识点数据进行关于知识点内容的分类;
所述知识文本集合生成模块用于对所述分类后的不同教育知识点数据进行可识别文本转换处理和规范化处理,以此生成知识文本集合;
所述文本元实体关联系确定模块用于确定所述知识点文本集合中不同文本元之间的实体关联性;
所述教育知识图谱构建模块用于根据所述实体关联性,对所述知识点文本集合中的所有文本元进行重组排列和索引标注,以此构建形成关于所述某一学科的教育知识图谱;
进一步,所述教育知识点数据分类模块包括教育知识点数据获取子模块、知识难度值计算子模块和分类确定子模块;其中,
所述教育知识点数据获取子模块用于根据关于所述某一学科的教学课程框架,从所述预设教育资源库中获取关于所述某一学科的所述教育知识点数据;
所述知识难度值计算子模块用于通过预设学科知识神经网络模型,计算每一项所述教育知识点数据对应的知识内容难度值;
所述分类确定子模块用于根据所述知识内容难度值,将所有项教育知识点数据分类为具有不同难度等级的教育知识点数据;
进一步,所述知识文本集合生成模块包括可识别文本转换处理子模块、规范化处理子模块和知识文本集合组成子模块;其中,
所述可识别文本转换处理子模块用于对所述分类后的教育知识点数据进行关于分词和/或短句的可识别文本转换处理,以此获得初始化知识文本;
所述规范化处理子模块用于对所述初始化知识文本进行语法规范化、逻辑规范化和错别字规范化中的至少一者处理,以此将所述初始化知识文本转换为规范化知识文本;
所述知识文本集合组成子模块用于根据所述分类后的不同教育知识点数据各自的难度等级,将所有规范化文本组成具有多维矩阵形式的知识文本集合;
进一步,所述文本元实体关联系确定模块包括文本元生成子模块和实体关联性评价值计算子模块;其中,
所述文本元生成子模块用于根据所述知识点文本集合中的每一项知识点文本的文本语料和文本结构,将每一项知识点文本转换为相应的文本元;
所述实体关联性评价值计算子模块用于通过知识点文本实体关联性评价神经网络模型对所有文本元进行分析处理,以此计算不同文本元相互之间在文本实体语料和/或文本实体结构上的实体关联性评价值;
进一步,所述教育知识图谱构建模块包括重组排列子模块、索引标注子模块和图谱转化处理子模块;其中,
所述重组排列子模块用于根据所述实体关联性对应的实体关联性评价值,对所述知识点文本集合中的所有文本元进行关于评价值高低的重组排列,以此生成具有不同高低实体关联性表征状态的文本元结构树;
所述索引标注子模块用于对所述文本元结构树上的每一个文本元进行关于文本语义和/或文本查询路径的索引标注,以此获得索引标注化文本元结构树;
所述图谱转化处理子模块用于将所述索引标注化文本元结构树进行二维图谱的转化处理,以此构建形成关于所述某一学科的教育知识图谱;
进一步,所述文本元实体关联系确定模块用于确定所述知识点文本集合中不同文本元之间的实体关联性,其具体实现过程如下:
步骤A1,根据所述教育知识点数据获取子模块获取所述某一学科的所述教育知识点数据,通过预设学科知识神经网络模型以及下面公式(1),获取每一项所述教育知识点数据对应的知识内容难度值
Figure BDA0002510133300000041
在上述公式(1)中,P为所述各学科所含教育知识点数据的数量,p=1,2,3、、、P;k为所述知识点数据难度等级,其取值范围为[0,22],dk为所述知识点数据难度等级为k所对应知识点数据复杂语法结构数量,ok为所述知识点数据难度等级为k所对应知识点数据复杂文本结构数量,
Figure BDA0002510133300000042
为各项所述教育知识点数据中既有复杂语法结构及复杂文本结构的语句数量,j为知识点数据在考核中分数占比,wj为知识点数据在考核中分数占比为j所对应的重要知识点排序,f(ok,d)为根据各知识点数据的复杂语法结构和文本结构数量判断知识点的难易度,其判断阈值为0.6,即当知识点数据的复杂语法结构和文本结构数量超过总知识的0.6时,判断为较难知识点,反之,则为较易知识点,f(wj,k)为根据知识点数据在考核中分数占比判断是否为重要知识点,其判断阈值为0.3,即考核中该知识点数据分数占比超过总分数的0.3,则判断为重要知识点,P(wj,dk,ok)为获取每一项所述教育知识点数据对应的知识内容难度值;
步骤A2,根据步骤A1获取的每一项所述教育知识点数据对应的知识内容难度值以及下面公式(2),进行数据关联组合,获取多维矩阵形式的知识文本集合
Figure BDA0002510133300000043
在上述公式(2)中,Π为连乘,M为所述待组成具有多维矩阵形式的知识文本子集数量,i为所述各项教育知识点数据中所含单词数量,ai为所述各项教育知识点数据中所含单词数量为i所对应的词组/短句总数,l为根据首字母进行组合的子集数量,bl为根据首字母进行组合的子集数量为l所对应各子集索引标注信息,
Figure BDA0002510133300000051
为所述知识文本重组排列的次数,γ为将各文本词组按照首字母、次字母顺序进行多维矩阵排序,F(ai,bl)为获取多维矩阵形式的知识文本集合;
步骤A3,将步骤A2获取的多维矩阵形式的知识文本集合,通过所述知识点文本实体关联性评价神经网络模型对所有文本元以及下面公式(3)进行分析处理,根据评判结果,执行获得不同文本元相互之间在文本实体语料或文本实体结构上的实体关联性评价值的操作
Figure BDA0002510133300000052
在上述公式(3)中,N为所述文本元的总数,取值应大于2,h为随机两份文本元之间的相同文本实体文字占比,x为随机两份文本元之间相同文本实体语料占比,
Figure BDA0002510133300000053
为根据语言数据库随机匹配检索各不同文本元之间的词义相似度,g为随机两份文本元之间具有相同文本实体结构数量,y为随机两份文本元之间在词义上属于包含关系的文本占比,
Figure BDA0002510133300000054
为根据语言数据库随机匹配检索各不同文本元之间的关联度,f(a)为各文本元文本实体语料信息,f(b)为各文本元文本实体结构信息,当P(h,l)计算值大于1时,则表示所述不同文本元在文本实体语料或文本实体结构上存在一定关联,执行获得不同文本元相互之间在文本实体语料或文本实体结构上的实体关联性评价值的操作。
本发明还提供智能化教育知识图谱构建方法,其特征在于,所述智能化教育知识图谱构建方法包括如下步骤:
步骤S1,从预设教育资源库中获取关于某一学科的教育知识点数据,并对所述教育知识点数据进行关于知识点内容的分类;
步骤S2,对所述分类后的不同教育知识点数据进行可识别文本转换处理和规范化处理,以此生成知识文本集合;
步骤S3,确定所述知识点文本集合中不同文本元之间的实体关联性;
步骤S4,根据所述实体关联性,对所述知识点文本集合中的所有文本元进行重组排列和索引标注,以此构建形成关于所述某一学科的教育知识图谱;
进一步,在所述步骤S1中,从预设教育资源库中获取关于某一学科的教育知识点数据,并对所述教育知识点数据进行关于知识点内容的分类具体包括,
步骤S101,根据关于所述某一学科的教学课程框架,从所述预设教育资源库中获取关于所述某一学科的所述教育知识点数据;
步骤S102,通过预设学科知识神经网络模型,计算每一项所述教育知识点数据对应的知识内容难度值;
步骤S103,根据所述步骤S102计算得到的所述知识内容难度值,将所有项教育知识点数据分类为具有不同难度等级的教育知识点数据;
或者,
在所述步骤S2中,对所述分类后的不同教育知识点数据进行可识别文本转换处理和规范化处理,以此生成知识文本集合具体包括,
步骤S201,对所述分类后的教育知识点数据进行关于分词和/或短句的可识别文本转换处理,以此获得初始化知识文本;
步骤S202,对所述初始化知识文本进行语法规范化、逻辑规范化和错别字规范化中的至少一者处理,以此将所述初始化知识文本转换为规范化知识文本;
步骤S203,根据所述分类后的不同教育知识点数据各自的难度等级,将所有规范化文本组成具有多维矩阵形式的知识文本集合;
进一步,在所述步骤S3中,确定所述知识点文本集合中不同文本元之间的实体关联性具体包括,
步骤S301,根据所述知识点文本集合中的每一项知识点文本的文本语料和文本结构,将每一项知识点文本转换为相应的文本元;
步骤S302,构建并优化一知识点文本实体关联性评价神经网络模型,并通过所述知识点文本实体关联性评价神经网络模型对所有文本元进行分析处理,以此获得不同文本元相互之间在文本实体语料和/或文本实体结构上的实体关联性评价值;
进一步,在所述步骤S4中,根据所述实体关联性,对所述知识点文本集合中的所有文本元进行重组排列和索引标注,以此构建形成关于所述某一学科的教育知识图谱具体包括,
步骤S401,根据所述实体关联性对应的实体关联性评价值,对所述知识点文本集合中的所有文本元进行关于评价值高低的重组排列,以此生成具有不同高低实体关联性表征状态的文本元结构树;
步骤S402,对所述文本元结构树上的每一个文本元进行关于文本语义和/或文本查询路径的索引标注,以此获得索引标注化文本元结构树;
步骤S403,将所述索引标注化文本元结构树进行二维图谱的转化处理,以此构建形成关于所述某一学科的教育知识图谱。
相比于现有技术,该智能化教育知识图谱构建***与方法通过对关于某一学科的教育知识点数据进行关于知识点内容的分类后,进行可识别文本转换处理和规范化处理,以此生成知识文本集合,并且还确定该知识点文本集合中不同文本元之间的实体关联性,最后再根据该实体关联性,对该知识点文本集合中的所有文本元进行重组排列和索引标注,以此构建形成关于所述某一学科的教育知识图谱;可见,该智能化教育知识图谱构建***与方法不仅能够对教育知识点数据本身进行有针对性的文本转换和纠错规范,以此提高该教育知识点数据的准确性和可靠性,并且还能够以文本元的形式对不同教育知识点数据之间的实体关联性进行有效地挖掘,以使构建得到的教育知识图谱更能够真实地和全面地反映不同教育知识点数据在知识层面上的关系,从而提高教育知识图谱的数据可溯性和数据可靠性。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的智能化教育知识图谱构建***的结构示意图。
图2为本发明提供的智能化教育知识图谱构建方法的流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参阅图1,为本发明实施例提供的智能化教育知识图谱构建***的结构示意图。该智能化教育知识图谱构建***包括教育知识点数据分类模块、知识文本集合生成模块、文本元实体关联系确定模块和教育知识图谱构建模块;其中,该教育知识点数据分类模块用于对来自预设教育资源库的某一学科的教育知识点数据进行关于知识点内容的分类;
该知识文本集合生成模块用于对该分类后的不同教育知识点数据进行可识别文本转换处理和规范化处理,以此生成知识文本集合;
该文本元实体关联系确定模块用于确定该知识点文本集合中不同文本元之间的实体关联性;
该教育知识图谱构建模块用于根据该实体关联性,对该知识点文本集合中的所有文本元进行重组排列和索引标注,以此构建形成关于该某一学科的教育知识图谱。
该智能化教育知识图谱构建***有别于现有技术的其他知识图谱构建方式,其不仅对教育知识点数据本身进行难度等级分类、可识别文本转换和纠错规范等预处理来提高该教育知识点数据的正确性和可靠性,以此确保后续知识图谱构建的有效性,并且还通过文本元的形式对不同教育知识点数据之间的实体关联性进行评价,从而提高该教育知识图谱的构建效率和知识关联真实性。
优选地,该教育知识点数据分类模块包括教育知识点数据获取子模块、知识难度值计算子模块和分类确定子模块;其中,
该教育知识点数据获取子模块用于根据关于该某一学科的教学课程框架,从该预设教育资源库中获取关于该某一学科的该教育知识点数据;
该知识难度值计算子模块用于通过预设学科知识神经网络模型,计算每一项该教育知识点数据对应的知识内容难度值;
该分类确定子模块用于根据该知识内容难度值,将所有项教育知识点数据分类为具有不同难度等级的教育知识点数据。
该教育知识点数据分类模块通过以教育知识点数据的知识内容难度值作为基准来对所有的教育知识点数据进行分类能够实现对不同难度的教育知识点数据的区别处理,以此避免由于不同教育知识点数据本身在难度上的差异而导致后续的分析处理出现偏差,以及提高对不同教育知识点数据的处理针对性和有效性,从而降低后续文本转换和纠错规范等处理步骤的繁复性。
优选地,该知识文本集合生成模块包括可识别文本转换处理子模块、规范化处理子模块和知识文本集合组成子模块;其中,
该可识别文本转换处理子模块用于对该分类后的教育知识点数据进行关于分词和/或短句的可识别文本转换处理,以此获得初始化知识文本;
该规范化处理子模块用于对该初始化知识文本进行语法规范化、逻辑规范化和错别字规范化中的至少一者处理,以此将该初始化知识文本转换为规范化知识文本;
该知识文本集合组成子模块用于根据该分类后的不同教育知识点数据各自的难度等级,将所有规范化文本组成具有多维矩阵形式的知识文本集合。
该知识文本集合生成模块通过对该教育知识点数据进行可识别文本转换处理和规范化处理能够提高该教育知识点数据的标准化程度和降低错误率,以便于后续该教育知识点数据进行分析处理时不会出现无法识别或者编辑的情况,从而大大地降低该教育知识点数据的处理出错率。
优选地,该文本元实体关联系确定模块包括文本元生成子模块和实体关联性评价值计算子模块;其中,
该文本元生成子模块用于根据该知识点文本集合中的每一项知识点文本的文本语料和文本结构,将每一项知识点文本转换为相应的文本元;
该实体关联性评价值计算子模块用于通过知识点文本实体关联性评价神经网络模型对所有文本元进行分析处理,以此计算不同文本元相互之间在文本实体语料和/或文本实体结构上的实体关联性评价值。
该文本元实体关联系确定模块通过将知识点文本转换为与文办预料和文本结构相关的文本元,能够在有效地压缩该教育知识点数据的数据量的同时,最大限度地保留该教育知识点数据的有效数据部分,从而提高计算该实体关联性评价值的效率和准确性。
优选地,该教育知识图谱构建模块包括重组排列子模块、索引标注子模块和图谱转化处理子模块;其中,
该重组排列子模块用于根据该实体关联性对应的实体关联性评价值,对该知识点文本集合中的所有文本元进行关于评价值高低的重组排列,以此生成具有不同高低实体关联性表征状态的文本元结构树;
该索引标注子模块用于对该文本元结构树上的每一个文本元进行关于文本语义和/或文本查询路径的索引标注,以此获得索引标注化文本元结构树;
该图谱转化处理子模块用于将该索引标注化文本元结构树进行二维图谱的转化处理,以此构建形成关于该某一学科的教育知识图谱。
该教育知识图谱构建模块通过以实体关联性评价值为基准对所有文本元进行重组排列和索引标注,能够更加全面地反映不同教育知识点数据之间的实体关联高低程度,从而提高该教育知识图谱的数据可溯性和数据可靠性。
优选地,该文本元实体关联系确定模块用于确定该知识点文本集合中不同文本元之间的实体关联性,其具体实现过程如下:
步骤A1,根据该教育知识点数据获取子模块获取该某一学科的该教育知识点数据,通过预设学科知识神经网络模型以及下面公式(1),获取每一项该教育知识点数据对应的知识内容难度值
Figure BDA0002510133300000111
在上述公式(1)中,P为该各学科所含教育知识点数据的数量,p=1,2,3、、、P;k为该知识点数据难度等级,其取值范围为[0,22],dk为该知识点数据难度等级为k所对应知识点数据复杂语法结构数量,ok为该知识点数据难度等级为k所对应知识点数据复杂文本结构数量,
Figure BDA0002510133300000112
为各项该教育知识点数据中既有复杂语法结构及复杂文本结构的语句数量,j为知识点数据在考核中分数占比,wj为知识点数据在考核中分数占比为j所对应的重要知识点排序,f(ok,d)为根据各知识点数据的复杂语法结构和文本结构数量判断知识点的难易度,其判断阈值为0.6,即当知识点数据的复杂语法结构和文本结构数量超过总知识的0.6时,判断为较难知识点,反之,则为较易知识点,f(wj,k)为根据知识点数据在考核中分数占比判断是否为重要知识点,其判断阈值为0.3,即考核中该知识点数据分数占比超过总分数的0.3,则判断为重要知识点,P(wj,dk,ok)为获取每一项该教育知识点数据对应的知识内容难度值;
步骤A2,根据步骤A1获取的每一项该教育知识点数据对应的知识内容难度值以及下面公式(2),进行数据关联组合,获取多维矩阵形式的知识文本集合
Figure BDA0002510133300000113
在上述公式(2)中,Π为连乘,M为该待组成具有多维矩阵形式的知识文本子集数量,i为该各项教育知识点数据中所含单词数量,ai为该各项教育知识点数据中所含单词数量为i所对应的词组/短句总数,l为根据首字母进行组合的子集数量,bl为根据首字母进行组合的子集数量为l所对应各子集索引标注信息,
Figure BDA0002510133300000121
为该知识文本重组排列的次数,γ为将各文本词组按照首字母、次字母顺序进行多维矩阵排序,F(ai,bl)为获取多维矩阵形式的知识文本集合;
步骤A3,将步骤A2获取的多维矩阵形式的知识文本集合,通过该知识点文本实体关联性评价神经网络模型对所有文本元以及下面公式(3)进行分析处理,根据评判结果,执行获得不同文本元相互之间在文本实体语料或文本实体结构上的实体关联性评价值的操作
Figure BDA0002510133300000122
在上述公式(3)中,N为该文本元的总数,取值应大于2,h为随机两份文本元之间的相同文本实体文字占比,x为随机两份文本元之间相同文本实体语料占比,
Figure BDA0002510133300000123
为根据语言数据库随机匹配检索各不同文本元之间的词义相似度,g为随机两份文本元之间具有相同文本实体结构数量,y为随机两份文本元之间在词义上属于包含关系的文本占比,
Figure BDA0002510133300000124
为根据语言数据库随机匹配检索各不同文本元之间的关联度,f(a)为各文本元文本实体语料信息,f(b)为各文本元文本实体结构信息,当P(h,l)计算值大于1时,则表示该不同文本元在文本实体语料或文本实体结构上存在一定关联,执行获得不同文本元相互之间在文本实体语料或文本实体结构上的实体关联性评价值的操作。
上述该文本元实体关联系确定模块的计算过程以文本元的形式对不同教育知识点数据之间的实体关联性进行有效地挖掘提供了技术支持,通过智能化教育自主学习扩充所述教育知识图谱的内容,并通过构建得到的教育知识图谱真实地和全面地反映不同教育知识点数据在知识层面上的关系,进一步提高教育知识图谱的数据全面性、可追溯性和数据可靠性。
参阅图2,为本发明实施例提供的智能化教育知识图谱构建方法的流程示意图。该智能化教育知识图谱构建方法包括如下步骤:
步骤S1,从预设教育资源库中获取关于某一学科的教育知识点数据,并对该教育知识点数据进行关于知识点内容的分类;
步骤S2,对该分类后的不同教育知识点数据进行可识别文本转换处理和规范化处理,以此生成知识文本集合;
步骤S3,确定该知识点文本集合中不同文本元之间的实体关联性;
步骤S4,根据该实体关联性,对该知识点文本集合中的所有文本元进行重组排列和索引标注,以此构建形成关于该某一学科的教育知识图谱。
该智能化教育知识图谱构建方法有别于现有技术的其他知识图谱构建方式,其不仅对教育知识点数据本身进行难度等级分类、可识别文本转换和纠错规范等预处理来提高该教育知识点数据的正确性和可靠性,以此确保后续知识图谱构建的有效性,并且还通过文本元的形式对不同教育知识点数据之间的实体关联性进行评价,从而提高该教育知识图谱的构建效率和知识关联真实性。
优选地,在该步骤S1中,从预设教育资源库中获取关于某一学科的教育知识点数据,并对该教育知识点数据进行关于知识点内容的分类具体包括,
步骤S101,根据关于该某一学科的教学课程框架,从该预设教育资源库中获取关于该某一学科的该教育知识点数据;
步骤S102,通过预设学科知识神经网络模型,计算每一项该教育知识点数据对应的知识内容难度值;
步骤S103,根据该步骤S102计算得到的该知识内容难度值,将所有项教育知识点数据分类为具有不同难度等级的教育知识点数据。
通过以教育知识点数据的知识内容难度值作为基准来对所有的教育知识点数据进行分类能够实现对不同难度的教育知识点数据的区别处理,以此避免由于不同教育知识点数据本身在难度上的差异而导致后续的分析处理出现偏差,以及提高对不同教育知识点数据的处理针对性和有效性,从而降低后续文本转换和纠错规范等处理步骤的繁复性。
优选地,在该步骤S2中,对该分类后的不同教育知识点数据进行可识别文本转换处理和规范化处理,以此生成知识文本集合具体包括,
步骤S201,对该分类后的教育知识点数据进行关于分词和/或短句的可识别文本转换处理,以此获得初始化知识文本;
步骤S202,对该初始化知识文本进行语法规范化、逻辑规范化和错别字规范化中的至少一者处理,以此将该初始化知识文本转换为规范化知识文本;
步骤S203,根据该分类后的不同教育知识点数据各自的难度等级,将所有规范化文本组成具有多维矩阵形式的知识文本集合。
通过对该教育知识点数据进行可识别文本转换处理和规范化处理能够提高该教育知识点数据的标准化程度和降低错误率,以便于后续该教育知识点数据进行分析处理时不会出现无法识别或者编辑的情况,从而大大地降低该教育知识点数据的处理出错率。
优选地,在该步骤S3中,确定该知识点文本集合中不同文本元之间的实体关联性具体包括,
步骤S301,根据该知识点文本集合中的每一项知识点文本的文本语料和文本结构,将每一项知识点文本转换为相应的文本元;
步骤S302,构建并优化一知识点文本实体关联性评价神经网络模型,并通过该知识点文本实体关联性评价神经网络模型对所有文本元进行分析处理,以此获得不同文本元相互之间在文本实体语料和/或文本实体结构上的实体关联性评价值。
通过将知识点文本转换为与文办预料和文本结构相关的文本元,能够在有效地压缩该教育知识点数据的数据量的同时,最大限度地保留该教育知识点数据的有效数据部分,从而提高计算该实体关联性评价值的效率和准确性。
优选地,在该步骤S4中,根据该实体关联性,对该知识点文本集合中的所有文本元进行重组排列和索引标注,以此构建形成关于该某一学科的教育知识图谱具体包括,
步骤S401,根据该实体关联性对应的实体关联性评价值,对该知识点文本集合中的所有文本元进行关于评价值高低的重组排列,以此生成具有不同高低实体关联性表征状态的文本元结构树;
步骤S402,对该文本元结构树上的每一个文本元进行关于文本语义和/或文本查询路径的索引标注,以此获得索引标注化文本元结构树;
步骤S403,将该索引标注化文本元结构树进行二维图谱的转化处理,以此构建形成关于该某一学科的教育知识图谱。
通过以实体关联性评价值为基准对所有文本元进行重组排列和索引标注,能够更加全面地反映不同教育知识点数据之间的实体关联高低程度,从而提高该教育知识图谱的数据可溯性和数据可靠性。
从上述实施例的内容可知,该智能化教育知识图谱构建***与方法通过对关于某一学科的教育知识点数据进行关于知识点内容的分类后,进行可识别文本转换处理和规范化处理,以此生成知识文本集合,并且还确定该知识点文本集合中不同文本元之间的实体关联性,最后再根据该实体关联性,对该知识点文本集合中的所有文本元进行重组排列和索引标注,以此构建形成关于该某一学科的教育知识图谱;可见,该智能化教育知识图谱构建***与方法不仅能够对教育知识点数据本身进行有针对性的文本转换和纠错规范,以此提高该教育知识点数据的准确性和可靠性,并且还能够以文本元的形式对不同教育知识点数据之间的实体关联性进行有效地挖掘,以使构建得到的教育知识图谱更能够真实地和全面地反映不同教育知识点数据在知识层面上的关系,从而提高教育知识图谱的数据可溯性和数据可靠性。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.智能化教育知识图谱构建***,其特征在于:
所述智能化教育知识图谱构建***包括教育知识点数据分类模块、知识文本集合生成模块、文本元实体关联系确定模块和教育知识图谱构建模块;其中,
所述教育知识点数据分类模块用于对来自预设教育资源库的某一学科的教育知识点数据进行关于知识点内容的分类;
所述知识文本集合生成模块用于对所述分类后的不同教育知识点数据进行可识别文本转换处理和规范化处理,以此生成知识文本集合;
所述文本元实体关联系确定模块用于确定所述知识点文本集合中不同文本元之间的实体关联性;
所述教育知识图谱构建模块用于根据所述实体关联性,对所述知识点文本集合中的所有文本元进行重组排列和索引标注,以此构建形成关于所述某一学科的教育知识图谱。
2.如权利要求1所述的智能化教育知识图谱构建***,其特征在于:
所述教育知识点数据分类模块包括教育知识点数据获取子模块、知识难度值计算子模块和分类确定子模块;其中,
所述教育知识点数据获取子模块用于根据关于所述某一学科的教学课程框架,从所述预设教育资源库中获取关于所述某一学科的所述教育知识点数据;
所述知识难度值计算子模块用于通过预设学科知识神经网络模型,计算每一项所述教育知识点数据对应的知识内容难度值;
所述分类确定子模块用于根据所述知识内容难度值,将所有项教育知识点数据分类为具有不同难度等级的教育知识点数据。
3.如权利要求1所述的智能化教育知识图谱构建***,其特征在于:
所述知识文本集合生成模块包括可识别文本转换处理子模块、规范化处理子模块和知识文本集合组成子模块;其中,
所述可识别文本转换处理子模块用于对所述分类后的教育知识点数据进行关于分词和/或短句的可识别文本转换处理,以此获得初始化知识文本;
所述规范化处理子模块用于对所述初始化知识文本进行语法规范化、逻辑规范化和错别字规范化中的至少一者处理,以此将所述初始化知识文本转换为规范化知识文本;
所述知识文本集合组成子模块用于根据所述分类后的不同教育知识点数据各自的难度等级,将所有规范化文本组成具有多维矩阵形式的知识文本集合。
4.如权利要求1所述的智能化教育知识图谱构建***,其特征在于:
所述文本元实体关联系确定模块包括文本元生成子模块和实体关联性评价值计算子模块;其中,
所述文本元生成子模块用于根据所述知识点文本集合中的每一项知识点文本的文本语料和文本结构,将每一项知识点文本转换为相应的文本元;
所述实体关联性评价值计算子模块用于通过知识点文本实体关联性评价神经网络模型对所有文本元进行分析处理,以此计算不同文本元相互之间在文本实体语料和/或文本实体结构上的实体关联性评价值。
5.如权利要求1所述的智能化教育知识图谱构建***,其特征在于:
所述教育知识图谱构建模块包括重组排列子模块、索引标注子模块和图谱转化处理子模块;其中,
所述重组排列子模块用于根据所述实体关联性对应的实体关联性评价值,对所述知识点文本集合中的所有文本元进行关于评价值高低的重组排列,以此生成具有不同高低实体关联性表征状态的文本元结构树;
所述索引标注子模块用于对所述文本元结构树上的每一个文本元进行关于文本语义和/或文本查询路径的索引标注,以此获得索引标注化文本元结构树;
所述图谱转化处理子模块用于将所述索引标注化文本元结构树进行二维图谱的转化处理,以此构建形成关于所述某一学科的教育知识图谱。
6.如权利要求1所述的智能化教育知识图谱构建***,其特征在于:
所述文本元实体关联系确定模块用于确定所述知识点文本集合中不同文本元之间的实体关联性,其具体实现过程如下:
步骤A1,根据所述教育知识点数据获取子模块获取所述某一学科的所述教育知识点数据,通过预设学科知识神经网络模型以及下面公式(1),获取每一项所述教育知识点数据对应的知识内容难度值
Figure FDA0002510133290000031
在上述公式(1)中,P为所述各学科所含教育知识点数据的数量,p=1,2,3、、、P;k为所述知识点数据难度等级,其取值范围为[0,22],dk为所述知识点数据难度等级为k所对应知识点数据复杂语法结构数量,ok为所述知识点数据难度等级为k所对应知识点数据复杂文本结构数量,
Figure FDA0002510133290000032
为各项所述教育知识点数据中既有复杂语法结构及复杂文本结构的语句数量,j为知识点数据在考核中分数占比,wj为知识点数据在考核中分数占比为j所对应的重要知识点排序,f(ok,d)为根据各知识点数据的复杂语法结构和文本结构数量判断知识点的难易度,其判断阈值为0.6,即当知识点数据的复杂语法结构和文本结构数量超过总知识的0.6时,判断为较难知识点,反之,则为较易知识点,f(wj,k)为根据知识点数据在考核中分数占比判断是否为重要知识点,其判断阈值为0.3,即考核中该知识点数据分数占比超过总分数的0.3,则判断为重要知识点,P(wj,dk,ok)为获取每一项所述教育知识点数据对应的知识内容难度值;
步骤A2,根据步骤A1获取的每一项所述教育知识点数据对应的知识内容难度值以及下面公式(2),进行数据关联组合,获取多维矩阵形式的知识文本集合
Figure FDA0002510133290000041
在上述公式(2)中,Π为连乘,M为所述待组成具有多维矩阵形式的知识文本子集数量,i为所述各项教育知识点数据中所含单词数量,ai为所述各项教育知识点数据中所含单词数量为i所对应的词组/短句总数,l为根据首字母进行组合的子集数量,bl为根据首字母进行组合的子集数量为l所对应各子集索引标注信息,
Figure FDA0002510133290000044
为所述知识文本重组排列的次数,γ为将各文本词组按照首字母、次字母顺序进行多维矩阵排序,F(ai,bl)为获取多维矩阵形式的知识文本集合;
步骤A3,将步骤A2获取的多维矩阵形式的知识文本集合,通过所述知识点文本实体关联性评价神经网络模型对所有文本元以及下面公式(3)进行分析处理,根据评判结果,执行获得不同文本元相互之间在文本实体语料或文本实体结构上的实体关联性评价值的操作
Figure FDA0002510133290000042
在上述公式(3)中,N为所述文本元的总数,取值应大于2,h为随机两份文本元之间的相同文本实体文字占比,x为随机两份文本元之间相同文本实体语料占比,
Figure FDA0002510133290000043
为根据语言数据库随机匹配检索各不同文本元之间的词义相似度,g为随机两份文本元之间具有相同文本实体结构数量,y为随机两份文本元之间在词义上属于包含关系的文本占比,
Figure FDA0002510133290000051
为根据语言数据库随机匹配检索各不同文本元之间的关联度,f(a)为各文本元文本实体语料信息,f(b)为各文本元文本实体结构信息,当P(h,l)计算值大于1时,则表示所述不同文本元在文本实体语料或文本实体结构上存在一定关联,执行获得不同文本元相互之间在文本实体语料或文本实体结构上的实体关联性评价值的操作。
7.智能化教育知识图谱构建方法,其特征在于,所述智能化教育知识图谱构建方法包括如下步骤:
步骤S1,从预设教育资源库中获取关于某一学科的教育知识点数据,并对所述教育知识点数据进行关于知识点内容的分类;
步骤S2,对所述分类后的不同教育知识点数据进行可识别文本转换处理和规范化处理,以此生成知识文本集合;
步骤S3,确定所述知识点文本集合中不同文本元之间的实体关联性;
步骤S4,根据所述实体关联性,对所述知识点文本集合中的所有文本元进行重组排列和索引标注,以此构建形成关于所述某一学科的教育知识图谱。
8.如权利要求7所述的智能化教育知识图谱构建方法,其特征在于:
在所述步骤S1中,从预设教育资源库中获取关于某一学科的教育知识点数据,并对所述教育知识点数据进行关于知识点内容的分类具体包括,
步骤S101,根据关于所述某一学科的教学课程框架,从所述预设教育资源库中获取关于所述某一学科的所述教育知识点数据;
步骤S102,通过预设学科知识神经网络模型,计算每一项所述教育知识点数据对应的知识内容难度值;
步骤S103,根据所述步骤S102计算得到的所述知识内容难度值,将所有项教育知识点数据分类为具有不同难度等级的教育知识点数据;
或者,
在所述步骤S2中,对所述分类后的不同教育知识点数据进行可识别文本转换处理和规范化处理,以此生成知识文本集合具体包括,
步骤S201,对所述分类后的教育知识点数据进行关于分词和/或短句的可识别文本转换处理,以此获得初始化知识文本;
步骤S202,对所述初始化知识文本进行语法规范化、逻辑规范化和错别字规范化中的至少一者处理,以此将所述初始化知识文本转换为规范化知识文本;
步骤S203,根据所述分类后的不同教育知识点数据各自的难度等级,将所有规范化文本组成具有多维矩阵形式的知识文本集合。
9.如权利要求7所述的智能化教育知识图谱构建方法,其特征在于:
在所述步骤S3中,确定所述知识点文本集合中不同文本元之间的实体关联性具体包括,
步骤S301,根据所述知识点文本集合中的每一项知识点文本的文本语料和文本结构,将每一项知识点文本转换为相应的文本元;
步骤S302,构建并优化一知识点文本实体关联性评价神经网络模型,并通过所述知识点文本实体关联性评价神经网络模型对所有文本元进行分析处理,以此获得不同文本元相互之间在文本实体语料和/或文本实体结构上的实体关联性评价值。
10.如权利要求7所述的智能化教育知识图谱构建方法,其特征在于:
在所述步骤S4中,根据所述实体关联性,对所述知识点文本集合中的所有文本元进行重组排列和索引标注,以此构建形成关于所述某一学科的教育知识图谱具体包括,
步骤S401,根据所述实体关联性对应的实体关联性评价值,对所述知识点文本集合中的所有文本元进行关于评价值高低的重组排列,以此生成具有不同高低实体关联性表征状态的文本元结构树;
步骤S402,对所述文本元结构树上的每一个文本元进行关于文本语义和/或文本查询路径的索引标注,以此获得索引标注化文本元结构树;
步骤S403,将所述索引标注化文本元结构树进行二维图谱的转化处理,以此构建形成关于所述某一学科的教育知识图谱。
CN202010458553.7A 2020-05-27 2020-05-27 智能化教育知识图谱构建***与方法 Active CN111597356B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010458553.7A CN111597356B (zh) 2020-05-27 2020-05-27 智能化教育知识图谱构建***与方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010458553.7A CN111597356B (zh) 2020-05-27 2020-05-27 智能化教育知识图谱构建***与方法

Publications (2)

Publication Number Publication Date
CN111597356A true CN111597356A (zh) 2020-08-28
CN111597356B CN111597356B (zh) 2021-05-11

Family

ID=72186305

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010458553.7A Active CN111597356B (zh) 2020-05-27 2020-05-27 智能化教育知识图谱构建***与方法

Country Status (1)

Country Link
CN (1) CN111597356B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112183728A (zh) * 2020-09-29 2021-01-05 上海松鼠课堂人工智能科技有限公司 基于深度学习的学习策略生成方法和***
CN114153360A (zh) * 2021-12-07 2022-03-08 华南理工大学 一种基于人工智能的人机交互***及方法
CN114637846A (zh) * 2022-03-11 2022-06-17 游密科技(深圳)有限公司 视频数据处理方法、装置、计算机设备和存储介质
CN115203441A (zh) * 2022-09-19 2022-10-18 江西风向标智能科技有限公司 高中数学公式的解析方法、***、存储介质及设备
CN115495593A (zh) * 2022-10-13 2022-12-20 中原工学院 基于大数据的数学知识图谱构建方法
CN116186020A (zh) * 2023-04-28 2023-05-30 中信证券股份有限公司 特征信息处理方法、装置、电子设备和计算机可读介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110137919A1 (en) * 2009-12-09 2011-06-09 Electronics And Telecommunications Research Institute Apparatus and method for knowledge graph stabilization
CN109783693A (zh) * 2019-01-18 2019-05-21 广东小天才科技有限公司 一种视频语义和知识点的确定方法及***
CN110059130A (zh) * 2019-05-13 2019-07-26 上海乂学教育科技有限公司 人工智能k12教育学习内容管理***
CN111046194A (zh) * 2019-12-31 2020-04-21 重庆和贯科技有限公司 构建多模态教学知识图谱的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110137919A1 (en) * 2009-12-09 2011-06-09 Electronics And Telecommunications Research Institute Apparatus and method for knowledge graph stabilization
CN109783693A (zh) * 2019-01-18 2019-05-21 广东小天才科技有限公司 一种视频语义和知识点的确定方法及***
CN110059130A (zh) * 2019-05-13 2019-07-26 上海乂学教育科技有限公司 人工智能k12教育学习内容管理***
CN111046194A (zh) * 2019-12-31 2020-04-21 重庆和贯科技有限公司 构建多模态教学知识图谱的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
朱福军: "基于学习元的领域知识图谱自动构建研究", 《中国优秀硕士学位论文全文数据库 社会科学Ⅱ辑》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112183728A (zh) * 2020-09-29 2021-01-05 上海松鼠课堂人工智能科技有限公司 基于深度学习的学习策略生成方法和***
CN114153360A (zh) * 2021-12-07 2022-03-08 华南理工大学 一种基于人工智能的人机交互***及方法
CN114637846A (zh) * 2022-03-11 2022-06-17 游密科技(深圳)有限公司 视频数据处理方法、装置、计算机设备和存储介质
CN115203441A (zh) * 2022-09-19 2022-10-18 江西风向标智能科技有限公司 高中数学公式的解析方法、***、存储介质及设备
CN115495593A (zh) * 2022-10-13 2022-12-20 中原工学院 基于大数据的数学知识图谱构建方法
CN116186020A (zh) * 2023-04-28 2023-05-30 中信证券股份有限公司 特征信息处理方法、装置、电子设备和计算机可读介质
CN116186020B (zh) * 2023-04-28 2023-07-04 中信证券股份有限公司 特征信息处理方法、装置、电子设备和计算机可读介质

Also Published As

Publication number Publication date
CN111597356B (zh) 2021-05-11

Similar Documents

Publication Publication Date Title
CN111597356B (zh) 智能化教育知识图谱构建***与方法
CN110147436B (zh) 一种基于教育知识图谱与文本的混合自动问答方法
CN110502621B (zh) 问答方法、问答装置、计算机设备及存储介质
CN100378724C (zh) 基于移动配置概念的句子结构分析方法及使用其的自然语言搜索方法
US9218339B2 (en) Computer-implemented systems and methods for content scoring of spoken responses
JP3856778B2 (ja) 複数言語を対象とした文書分類装置及び文書分類方法
CN110727779A (zh) 基于多模型融合的问答方法及***
CN113191148B (zh) 一种基于半监督学习和聚类的轨道交通实体识别方法
CN113806563A (zh) 面向多源异构建筑人文史料的建筑师知识图谱构建方法
CN110781681B (zh) 一种基于翻译模型的初等数学应用题自动求解方法及***
CN113495900A (zh) 基于自然语言的结构化查询语言语句获取方法及装置
CN112328800A (zh) 自动生成编程规范问题答案的***及方法
CN112380848B (zh) 文本生成方法、装置、设备及存储介质
CN110162651B (zh) 基于语义内容摘要的新闻内容图文不符鉴别***及鉴别方法
CN111368093A (zh) 信息获取方法、装置、电子设备及计算机可读存储介质
Alrehily et al. Intelligent electronic assessment for subjective exams
CN116383414A (zh) 一种基于碳核查知识图谱的智能文件评审***及方法
CN110807096A (zh) 一种小样本集上的信息对匹配方法及***
CN112949410B (zh) 人工智能理科文字题解题方法、装置、设备及存储介质
Patrick et al. Developing SNOMED CT subsets from clinical notes for intensive care service
CN111341404B (zh) 一种基于ernie模型的电子病历数据组解析方法及***
He et al. [Retracted] Application of Grammar Error Detection Method for English Composition Based on Machine Learning
Goonawardena et al. Automated spelling checker and grammatical error detection and correction model for sinhala language
Suta et al. Matching question and answer using similarity: an experiment with stack overflow
Chali et al. Learning good decompositions of complex questions

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 200237 9 / F and 10 / F, building 2, No. 188, Yizhou Road, Xuhui District, Shanghai

Applicant after: Shanghai squirrel classroom Artificial Intelligence Technology Co.,Ltd.

Address before: 200237 9 / F and 10 / F, building 2, No. 188, Yizhou Road, Xuhui District, Shanghai

Applicant before: SHANGHAI YIXUE EDUCATION TECHNOLOGY Co.,Ltd.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address

Address after: 200233 9 / F, 10 / F, building 2, 188 Yizhou Road, Xuhui District, Shanghai

Patentee after: SHANGHAI YIXUE EDUCATION TECHNOLOGY Co.,Ltd.

Address before: 9 / F and 10 / F, building 2, No. 188, Yizhou Road, Xuhui District, Shanghai, 200237

Patentee before: Shanghai squirrel classroom Artificial Intelligence Technology Co.,Ltd.

CP03 Change of name, title or address