CN113361867A - 一种基于学生答题记录的概念重要性判别方法及*** - Google Patents
一种基于学生答题记录的概念重要性判别方法及*** Download PDFInfo
- Publication number
- CN113361867A CN113361867A CN202110536080.2A CN202110536080A CN113361867A CN 113361867 A CN113361867 A CN 113361867A CN 202110536080 A CN202110536080 A CN 202110536080A CN 113361867 A CN113361867 A CN 113361867A
- Authority
- CN
- China
- Prior art keywords
- concept
- student
- importance
- graph
- answer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 53
- 230000019771 cognition Effects 0.000 claims abstract description 26
- 238000005295 random walk Methods 0.000 claims description 26
- 239000013598 vector Substances 0.000 claims description 15
- 238000003860 storage Methods 0.000 claims description 6
- 238000005065 mining Methods 0.000 claims description 4
- 230000006399 behavior Effects 0.000 description 25
- 238000011160 research Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 11
- 238000004458 analytical method Methods 0.000 description 8
- 230000000875 corresponding effect Effects 0.000 description 8
- 238000004590 computer program Methods 0.000 description 7
- 230000001149 cognitive effect Effects 0.000 description 6
- 238000003745 diagnosis Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000003780 insertion Methods 0.000 description 5
- 230000037431 insertion Effects 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 238000009826 distribution Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000006872 improvement Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 238000010276 construction Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 230000009191 jumping Effects 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000008450 motivation Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
- G06F16/24564—Applying rules; Deductive queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
- G06Q50/205—Education administration or guidance
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Educational Administration (AREA)
- General Engineering & Computer Science (AREA)
- Economics (AREA)
- Tourism & Hospitality (AREA)
- Computational Linguistics (AREA)
- Development Economics (AREA)
- Educational Technology (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Entrepreneurship & Innovation (AREA)
- Evolutionary Biology (AREA)
- Operations Research (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Game Theory and Decision Science (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Fuzzy Systems (AREA)
- Quality & Reliability (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本公开公开的一种基于学生答题记录的概念重要性判别方法及***,包括:获取学生答题记录;根据所有学生答题记录生成学生群体概念图;在学生群体概念图中添加学生节点,将学生节点与其已掌握的概念节点建立连边,形成个性化概念图;根据个性化概念图,确定学生对概念重要性的认知。实现了学生对概念重要性的个性化认知。
Description
技术领域
本发明涉及教育数据挖掘技术领域,尤其涉及一种基于学生答题记录的概念重要性判别方法及***。
背景技术
本部分的陈述仅仅是提供了与本公开相关的背景技术信息,不必然构成在先技术。
在“互联网+教育”时代,线上课程的推广和普及,使得学生不再受时间和空间的限制,可以随时随地接受高质量教育,丰富了学生的学***下降。
目前已有研究大都只关注如何利用机器学***,而关于概念重要性判别的相关研究还较少。例如,吴刚等依据本体的图结构特点,以Hub值作为概念重要性,并利用概念和关系相互增强的迭代方式计算概念重要性权重。王琛琛等在大学物理思维导图的基础上构建了大学物理的知识图谱,在构建的过程中采取专家问卷调查法和自然语言分析法获得各知识点概念重要程度。然而,现有的研究由于线上课堂等教学场景中学生人数众多,教师很难通过传统的专家分析方法,对每个学生的概念学习情况进行全面掌握,进而难以开展个性化教学。
因此,如何使教师准确掌握每个学生对于概念重要性的认知情况,为学生提供高水平的个性化教学,是当前线上学习亟需解决的主要问题之一。
发明内容
本公开为了解决上述问题,提出了一种基于学生答题记录的概念重要性判别方法及***,能够获取学生对于每个概念的重要性认知。
为实现上述目的,本公开采用如下技术方案:
第一方面,提出了一种基于学生答题记录的概念重要性判别方法,包括:
获取学生答题记录;
根据所有学生答题记录生成学生群体概念图;
在学生群体概念图中添加学生节点,将学生节点与其已掌握的概念节点建立连边,形成个性化概念图;
根据个性化概念图,确定学生对概念重要性的认知。
第二方面,提出了一种基于学生答题记录的概念重要性判别***,包括:
答题记录获取模块,用于获取学生答题记录;
学生群体概念图生成模块,用于根据所有学生答题记录生成学生群体概念图;
个性化概念图生成模块,用于在学生群体概念图中添加学生节点,将学生节点与其已掌握的概念节点建立连边,形成个性化概念图;
概念重要性确定模块,用于根据个性化概念图,确定学生对概念重要性的认知。
第三方面,提出了一种电子设备,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成一种基于学生答题记录的概念重要性判别方法所述的步骤。
第四方面,提出了一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成一种基于学生答题记录的概念重要性判别方法所述的步骤。
与现有技术相比,本公开的有益效果为:
1、本公开在学生群体概念图中加入学生节点,并将学生节点与其已掌握的概念节点建立连边,形成个性化概念图,进而依靠个性化概念图通过随机游走的方法确定了每个学生对概念重要性的个性化认知,解决了概念重要性判别时教师参与程度高难以适用于大规模线上课程以及无法体现学生对于概念掌握程度差异的问题。
本发明附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。
图1为本公开实施例1公开方法的流程图;
图2为本公开实施例1公开的基于答题记录的概念重要性判别模型框架;
图3为本公开实施例1公开的个性化概念图;
图4为本公开实施例1公开的概念与整体答题正确率之间的概率分布;
图5为本公开实施例1公开的不同维度下的基于答题记录的概念重要性判别模型准确率。
具体实施方式:
下面结合附图与实施例对本公开作进一步说明。
应该指出,以下详细说明都是例示性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
在本公开中,术语如“上”、“下”、“左”、“右”、“前”、“后”、“竖直”、“水平”、“侧”、“底”等指示的方位或位置关系为基于附图所示的方位或位置关系,只是为了便于叙述本公开各部件或元件结构关系而确定的关系词,并非特指本公开中任一部件或元件,不能理解为对本公开的限制。
本公开中,术语如“固接”、“相连”、“连接”等应做广义理解,表示可以是固定连接,也可以是一体地连接或可拆卸连接;可以是直接相连,也可以通过中间媒介间接相连。对于本领域的相关科研或技术人员,可以根据具体情况确定上述术语在本公开中的具体含义,不能理解为对本公开的限制。
实施例1
为了实现每个学生对概念重要性的个性化认知,在该实施例中公开了一种基于学生答题记录的概念重要性判别方法,包括:
获取学生答题记录;
根据所有学生答题记录生成学生群体概念图;
在学生群体概念图中添加学生节点,将学生节点与其已掌握的概念节点建立连边,形成个性化概念图;
根据个性化概念图,确定学生对概念重要性的认知。
进一步的,使用Apriori关联规则挖掘算法生成学生群体概念图。
进一步的,根据概念难度为学生群体概念图中的每个概念节点设置难度分级类别;
以最低难度类别中整体答题正确率最低的概念对应的整体答题正确率为阈值;
当学生对某一概念的答题正确率大于等于该阈值时,确定学生已掌握该概念;
将该学生节点与其对应的已掌握的概念节点连边。
进一步的,确定所有学生对每个概念的整体答题正确率;
根据每个概念的整体答题正确率确定每个概念难度。
进一步的,难度分级类别包括低难度概念类别、普通难度概念类别和高难度概念类别,其中,低难度概念类别为最低难度类别。
进一步的,通过随机游走算法在个性化概念图上计算从学生节点游走到每个概念节点的概率,确定学生对概念重要性的认知。
进一步的,在随机游走算法中加入r0向量,以确定以学生节点为游走的初始节点,在游走算法的S向量中融入概念的难度分类级别。
对本实施例公开的一种基于学生答题记录的概念重要性判别方法进行详细说明。
目前个性化教学的研究大都只关注如何利用机器学***,而关于概念重要性判别的相关研究还较少。例如,吴刚等依据本体的图结构特点,以Hub值作为概念重要性,并利用概念和关系相互增强的迭代方式计算概念重要性权重。王琛琛等在大学物理思维导图的基础上构建了大学物理的知识图谱,在构建的过程中采取专家问卷调查法和自然语言分析法获得各知识点概念重要程度。然而,现有的研究存在许多不足,一方面,线上课堂等教学场景中,由于学生人数众多,教师很难通过传统的专家分析方法,对每个学生的概念学习情况进行全面掌握,难以开展个性化教学;另一方面,答题记录作为学生进行练习或测试时产生的行为记录,客观记录了学生对每一道题目的答题情况,为研究每个学生对课程中相关概念的重要性认知,提供了新的研究契机。因此,本实施例提出了基于学生答题记录的概念重要性判别模型,以满足个性化教学任务中,教师对每个学生概念重要程度的认识,为进一步提高个性教学和指导提供理论基础。
学生答题记录具有客观性,且能够反映学生的个性化差异的特点,为个性化教学过程中了解学生对于各概念重要性的认知情况提供了一种新的研究思路。因此,通过对已有概念重要性判别模型和基于答题记录的学习诊断模型的相关研究成果进行分析,可为本实施例公开的一种基于学生答题记录的概念重要性判别方法提供参考。
①概念重要性判别模型是指使用一定的策略和方法判别知识点的重要程度。有的研究以教师教学实践为基础展开,如李明俊等通过聚焦知识点的发现逻辑,关联机理和思维导引,发现课程中的重要智慧点。姚国平从探究空间的创设、资源的选择,逻辑的定位及活动的设计四个角度,阐述在教学中如何实现重要概念的建构。有的则根据网络中心度研究进行创新,如安宁等基于知识关联关系构建领域知识网络,采用中心性与聚类性相关指标,跟踪并分析时间序列,发现重要知识和知识群簇。但是,现有的研究多面向课堂教学,教师较高的参与度使得方法主观性较强,不适用于大规模线上课程环境;而且学生之间具有不同的学习背景和学习习惯等问题,已有的方法很难发现每一位学生对课程中各概念重要性的认知情况。
②学***与用户规模不断提高,学生对于课程中各概念重要性的认知情况差异性日趋明显,而答题记录具有客观性和多样化的特点,以及其在学习诊断领域内的成功运用,故将答题记录应用于概念重要性判别模型的设计与开发过程具有潜在可能性。
基于此,本实施例以个性化教学为应用场景,以概念重要性判别模型为研究对象,以图上的随机游走算法为理论依据,创新性的提出了课程中概念重要性的个性化发现方法,首先利用学生的答题记录自适应生成学生群体概念图,为体现学生对不同类型概念(如基础概念和学***的个性化教学指导。
如图1所示,本实施例公开的一种基于学生答题记录的概念重要性判别方法,包括以下步骤:
S1:获取学生答题记录。
在具体实施时,获取网络课程平台上学生的答题记录。
S2:根据所有学生答题记录生成学生群体概念图。
利用学生的答题记录自适应生成学生群体概念图,生成的学生群体概念图从全局上反映了概念间的关系,节点表示知识概念,有向边表示知识概念之间的依赖性。
在具体实施时,学生群体概念图已应用于课堂教学中,在该实施例中采用Chen等提出的概念图生成方法构建学生群体概念图,该方法的合理性已得到验证。主要思想是分析答题记录中学生对任意两个题目对作答正误之间的置信度,将对应关系为正确-正确、错误-错误的两种模式视为存在关联性,将两两题目对应的知识概念建立频繁2项集,使用Apriori关联规则挖掘算法生成学生群体的概念图。
S3:在学生群体概念图中添加学生节点,将学生节点与其已掌握的概念节点建立连边,形成个性化概念图。
S31:对学生群体概念图中的各概念节点设置难度分级类别。
在具体实施时,在学生答题记录和学生群体概念图的基础上,计算所有学生对每个概念的整体答题正确率,根据整体答题正确率对学生群体概念图中的各概念节点设置难度分级类别。
在具体实施时,设置的概念的难度分级类别包括低难度概念类别、高难度概念类别和普通难度概念类别。其中,低难度概念类别为最低的概念难度类别。将各概念按照整体答题正确率进行排序后,概念与概念的整体答题正确率之间服从正态分布,如图4所示,将所有概念中整体答题正确率最高的前20%个概念、最低的20%个概念和中间60%个概念分别设置为低难度概念类别、高难度概念类别和普通难度概念类别。
S32:判断学生对各概念的掌握情况。
通过学生的答题记录可以推测出学生对概念的掌握情况。
在具体实施时,以最低难度类别(即低难度概念类别)中整体答题正确率最低的概念对应的整体答题正确率为阈值,记作μ;
计算每个学生对每个概念的答题正确率;
当答题正确率大于等于阈值μ时,确定该学生已掌握该概念。
S33:根据学生对各概念的掌握情况,将学生节点与其已掌握的概念节点建立连边,形成个性化概念图。
利用每个学生对每个概念的掌握情况,向已经完成概念分类的学生群体概念图中加入具体学生节点,构造学生节点指向其掌握程度较高的概念节点的有向边。
在具体实施时,掌握程度较高的概念节点为学生答题正确率大于等于阈值μ的概念节点,构造学生节点指向该学生答题正确率大于等于阈值μ的概念节点的有向边,从而将学生节点加入至学生群体概念图中,实现个性化概念图PCM的自适应生成,获取的个性化概念图如图3所示。
S4:根据个性化概念图,确定学生对概念重要性的认知。
利用网络课程平台上学生答题记录生成学生群体概念图,根据学生的答题情况,将不同概念分为三个等级(低难度、普通难度和高难度),并根据学生对概念的掌握情况,在学生群体概念图中加入学生节点,将学生节点与其已掌握的概念节点建立连边,形成个性化概念图PCM。新构建的个性化概念图PCM不仅从全局上反映了概念间的耦合关系,还体现了学生对不同概念的掌握情况,基于答题记录的概念重要性判别模型框架如图2所示。
在获得个性化概念图的基础上,采用改进的随机游走算法计算学生节点游走到每个概念节点的概率,确定学生对概念重要性的认知。
传统随机游走方法虽然能在PCM上通过计算到达概率的方式,计算每个概念节点的重要性,但忽略了概念本身的难易程度和不同学生的个性化差异,不能直接计算获得学生对概念重要性的个性化认知。因此,本实施例,对传统随机游走算法进行改进,提出了一种新型随机游走算法,即PTR算法。与传统的随机游走算法相比,本实施例提出的PTR算法,既能体现概念级别的差异性,又能反应学生对概念的个性化掌握程度。PTR算法求解概念重要度R的矩阵形式如公式(1)所示:
其中R(t)和R(t-1)分别是第t次和第t-1次迭代的概念重要度向量,初始时各节点重要度相同且和为1。M是PCM的转移矩阵。s向量是长度为PCM节点数的单位向量,与传统随机游走算法相比本实施例提出的PTR算法中的s向量融入学生整体对概念难易程度的分类,可以体现学生对不同难度类别概念掌握程度的差异性,|s|是s向量中1的个数。在PTR算法中,教师可以根据试题难度选择维度计算每个学生对每个概念的重要性得分,其中选择的维度对应着概念的3种概念类别。“了解”维度对应着低难度类别,“巩固”维度对应着普通难度类别,“提升”维度对应着高难度类别。维度选择不同s向量也不同,当教师选择了维度后,s向量中该维度所对应概念类别的概念节点位置为1,其余位置为0。r0是学生向量,长度为PCM节点数,针对不同学生r0也不同,与传统的随机游走算法相比加入r0向量起到了游走时不是随机选取节点作为起始节点,而是选取学生节点作为起始节点的作用,并在游走的过程中有几率跳回该学生节点,由于学生节点存在指向掌握程度较高的概念节点的有向边,游走时可以体现不同学生对各概念掌握程度的差异,r0向量中对应待生成概念重要性得分的学生位置为1,其余位置为0。q和α是游走时随机跳转的概率超参数,q和α分别决定了学生对不同难度类型概念掌握程度的差异性,以及学生对各概念掌握程度的差异性影响游走结果的大小。
PTR算法的游走策略是从待生成概念重要性得分的学生节点开始,以1-α-q的概率根据图的转移矩阵M(即有向边)随机游走;同时以q的概率随机跳到对应维度的s向量中值为1的概念节点,以α的概率跳到待生成概念重要性得分的学生节点,直到结果收敛后迭代结束。
针对学生对概念重要性的认知情况,为学生制订个性化学习策略,或向学生发送学业预警。
对本实施例公开的一种基于学生答题记录的概念重要性判别方法进行验证。
在验证时,选取某高校线上课程平台中2020年9月-11月的Python语言课程作为研究对象。该课程共144名学生参与学习,从这些学生的线上期中考试中选取了10656份答题记录进行概念重要度生成,选取了期中考试前的7056份学习行为记录作为验证数据集,并将上述数据按照6:4的比例分为训练数据集和测试数据集。依据关联规则挖掘生成的学生群体概念图包括39个概念节点和653条有向边。
为了避免置信度过小,关联规则不可信,对置信度小于0.5的关联规则进行过滤。
为概念设置难度分级类别得到8个低难度、8个高难度和23个普通难度概念,其中低难度概念中最低的整体答题正确率为0.882,记作μ。计算每一名具体学生对每一个概念的答题正确率,并构造该学生节点指向其做题正确率大于等于μ的概念节点的有向边,生成PCM图。
基于学习行为使用学生准确率来评价模型的有效性,即学习行为准确的学生个数占全部学生数的比值。具体来说,将学生的线上学习行为作为模型预测的基准值,即:学生如果认为某一概念较为重要,那么他在该概念上的有效行为投入就会比较高,这里有效行为投入是指与成绩具有显著相关性的行为投入。选取某学生重要性最高的前k个概念和后k个概念,比较这两种概念在有效行为投入上的差异。如果有效行为投入与成绩正相关,学生在前k个概念上的有效行为投入大于后k个概念则准确;如果有效行为投入与成绩负相关,学生在前k个概念上的有效行为投入小于后k个概念则准确。由于学生的答题记录自适应生成可以代表学生整体知识结构的学生群体概念图,在此基础上构造PCM并按策略随机游走,通过学习行为侧面验证模型的准确性,可知,本实施例方法计算的概念重要性分布比根据学习行为直接判断更符合逻辑性。
对基于答题记录的概念重要性判别模型的有效性进行验证,在相同方法和数据集下对PTR随机游走算法与其他3种传统随机游走算法进行比较分析。根据学生的线上学***均分数、回复的讨论数和发表的讨论数,其中,作业平均分数和回复的评论数与考试成绩具有正相关性;发表的评论数与考试成绩具有负相关性。对于该模型中的参数,取k为5,PTR算法中α和q的值取0.1-0.4之间的有限实数集进行训练,训练后得到α和q的最佳取值分别为0.2和0.3,利用得到的参数在测试集上对每一位学习者和每一个概念在3种不同维度上根据有效行为投入分析。作为对比实验的三种随机游走算法同样遵循上述训练与测试方式。
表1模型下PTR算法与其他3种随机游走算法的对比实验
准确率根据3种有效行为投入以及模型的3个维度展开,其中PageRank与RandomWalk with Restart因自身算法结构无法体现不同维度,故不分维度讨论,只根据有效行为投入评价。对比实验准确率结果如表1所示,PTR随机游走算法在3种有效行为投入以及不同维度下准确率普遍高于其他3种随机游走算法,与PageRank相比提升约为0.052-0.121,与Random Walk with Restart相比提升约为0.017-0.104,与Topic-Sensitive PageRank相比提升约为0.018-0.173。
PTR游走结果在不同学***均值约为0.91,其中发表的讨论数中“提升”维度准确率最高,为0.986,回复的讨论数中“提升”维度准确率最低,为0.819。
表2“了解”维度下部分学生对部分概念的重要性得分
在测试集中以“了解”维度为例,对58名学生重要性最高的5个概念与最低的5个概念进行分析。分析如下:①学生对于概念的重要性认知存在一定共性。发现有41名学生认为“for循环语句”概念以及34名学生认为“列表的***”概念处于前5重要位置,46名学生则认为“变量赋值”这一概念处于后5重要位置。教师可以针对学生对于概念重要性认知的共性诊断学生群体的集体认知偏差,调整教学策略。②学生对于概念的重要性认知存在一定差异。认为“列表的***”这一概念处于前5重要位置的34名学生中,只有4名认为“字典的***”概念也处于前5重要位置,而“算术运算符”概念只有1名学生认为处于前5重要位置。教师可以根据学生对于概念重要性认知的差异分析和反省教学过程,对部分学生进行学业预警。③同一学生对于不同概念的重要程度不同,且不同学生对于同一概念的重要程度也不同。如表2所示,学生87认为“列表的***”概念较为重要,而“列表推导式”相对不重要;学生87和学生144都认为列表的***这一概念较为重要,而学生88认为该概念相对不重要。教师可以根据不同学生的概念重要性认知情况,为每一位学生制订个性化学习策略。
本实施例公开的一种基于学生答题记录的概念重要性判别方法,利用学生答题记录自适应生成个性化概念图,并依靠个性化概念图通过随机游走的形式计算学生对概念重要性的认知。设计的个性化概念图PCM图以及PTR随机游走算法,解决了传统概念重要性判别模型教师参与程度高难以适用于大规模线上课程以及无法体现学生对于概念掌握程度差异的问题。实验结果表明,该方法可以自动判别每个学生对于概念重要性的认知情况,准确性较高,且PTR算法准确率普遍高于其他经典随机游走算法,可以帮助教师突破时间和空间限制,准确了解学生对于概念重要性的认知情况,从而为学生提供高水平的个性化教学指导。
实施例2
在该实施例中,公开了一种基于学生答题记录的概念重要性判别***,包括:
答题记录获取模块,用于获取学生答题记录;
学生群体概念图生成模块,用于根据所有学生答题记录生成学生群体概念图;
个性化概念图生成模块,用于在学生群体概念图中添加学生节点,将学生节点与其已掌握的概念节点建立连边,形成个性化概念图;
概念重要性确定模块,用于根据个性化概念图,确定学生对概念重要性的认知。
实施例3
在该实施例中,公开了一种电子设备,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成实施例1公开的一种基于学生答题记录的概念重要性判别方法所述的步骤。
实施例4
在该实施例中,公开了一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成实施例1公开的一种基于学生答题记录的概念重要性判别方法所述的步骤。
以上仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
本领域内的技术人员应明白,本申请的实施例可提供为方法、***、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。
Claims (10)
1.一种基于学生答题记录的概念重要性判别方法,其特征在于,包括:
获取学生答题记录;
根据所有学生答题记录生成学生群体概念图;
在学生群体概念图中添加学生节点,将学生节点与其已掌握的概念节点建立连边,形成个性化概念图;
根据个性化概念图,确定学生对概念重要性的认知。
2.如权利要求1所述的基于学生答题记录的概念重要性判别方法,其特征在于,使用Apriori关联规则挖掘算法生成学生群体概念图。
3.如权利要求1所述的基于学生答题记录的概念重要性判别方法,其特征在于,根据概念难度为学生群体概念图中的每个概念节点设置难度分级类别;
以最低难度类别中整体答题正确率最低的概念对应的整体答题正确率为阈值;
当学生对某一概念的答题正确率大于等于该阈值时,确定学生已掌握该概念;
将该学生节点与其对应的已掌握的概念节点连边。
4.如权利要求3所述的基于学生答题记录的概念重要性判别方法,其特征在于,确定所有学生对每个概念的整体答题正确率;
根据每个概念的整体答题正确率确定每个概念难度。
5.如权利要求3所述的基于学生答题记录的概念重要性判别方法,其特征在于,难度分级类别包括低难度概念类别、普通难度概念类别和高难度概念类别,其中,低难度概念类别为最低难度类别。
6.如权利要求1所述的基于学生答题记录的概念重要性判别方法,其特征在于,通过随机游走算法在个性化概念图上计算从学生节点游走到每个概念节点的概率,确定学生对概念重要性的认知。
7.如权利要求6所述的基于学生答题记录的概念重要性判别方法,其特征在于,在随机游走算法中加入r0向量,以确定以学生节点为游走的初始节点,在游走算法的S向量中融入概念的难度分类级别。
8.一种基于学生答题记录的概念重要性判别***,其特征在于,包括:
答题记录获取模块,用于获取学生答题记录;
学生群体概念图生成模块,用于根据所有学生答题记录生成学生群体概念图;
个性化概念图生成模块,用于在学生群体概念图中添加学生节点,将学生节点与其已掌握的概念节点建立连边,形成个性化概念图;
概念重要性确定模块,用于根据个性化概念图,确定学生对概念重要性的认知。
9.一种电子设备,其特征在于,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成权利要求1-7任一项所述的一种基于学生答题记录的概念重要性判别方法的步骤。
10.一种计算机可读存储介质,其特征在于,用于存储计算机指令,所述计算机指令被处理器执行时,完成权利要求1-7任一项所述的一种基于学生答题记录的概念重要性判别方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110536080.2A CN113361867A (zh) | 2021-05-17 | 2021-05-17 | 一种基于学生答题记录的概念重要性判别方法及*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110536080.2A CN113361867A (zh) | 2021-05-17 | 2021-05-17 | 一种基于学生答题记录的概念重要性判别方法及*** |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113361867A true CN113361867A (zh) | 2021-09-07 |
Family
ID=77526742
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110536080.2A Pending CN113361867A (zh) | 2021-05-17 | 2021-05-17 | 一种基于学生答题记录的概念重要性判别方法及*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113361867A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102708244A (zh) * | 2012-05-08 | 2012-10-03 | 清华大学 | 一种基于重要度度量的概念图自动布图方法 |
CN106205248A (zh) * | 2016-08-31 | 2016-12-07 | 北京师范大学 | 一种表征学习者在特定领域知识学习掌握状态的在线学习认知地图生成***及方法 |
CN107665472A (zh) * | 2016-07-27 | 2018-02-06 | 科大讯飞股份有限公司 | 学习路径规划方法和装置 |
CN109191345A (zh) * | 2018-09-17 | 2019-01-11 | 合肥工业大学 | 一种面向学生认知过程的认知诊断方法 |
CN109299282A (zh) * | 2018-08-16 | 2019-02-01 | 山东女子学院 | 基于文本分析及关联规则挖掘的概念图自动生成方法 |
CN109902185A (zh) * | 2019-03-05 | 2019-06-18 | 北京工业大学 | 一种基于DBpedia的水务领域概念知识图谱构建方法 |
-
2021
- 2021-05-17 CN CN202110536080.2A patent/CN113361867A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102708244A (zh) * | 2012-05-08 | 2012-10-03 | 清华大学 | 一种基于重要度度量的概念图自动布图方法 |
CN107665472A (zh) * | 2016-07-27 | 2018-02-06 | 科大讯飞股份有限公司 | 学习路径规划方法和装置 |
CN106205248A (zh) * | 2016-08-31 | 2016-12-07 | 北京师范大学 | 一种表征学习者在特定领域知识学习掌握状态的在线学习认知地图生成***及方法 |
CN109299282A (zh) * | 2018-08-16 | 2019-02-01 | 山东女子学院 | 基于文本分析及关联规则挖掘的概念图自动生成方法 |
CN109191345A (zh) * | 2018-09-17 | 2019-01-11 | 合肥工业大学 | 一种面向学生认知过程的认知诊断方法 |
CN109902185A (zh) * | 2019-03-05 | 2019-06-18 | 北京工业大学 | 一种基于DBpedia的水务领域概念知识图谱构建方法 |
Non-Patent Citations (1)
Title |
---|
李彦聪: ""基于概念图的自适应学习***的研究及应用"", 《中国优秀硕士学位论文全文数据库》 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Mueen et al. | Modeling and predicting students’ academic performance using data mining techniques | |
CN110941723A (zh) | 一种知识图谱的构建方法、***及存储介质 | |
Anoopkumar et al. | A Review on Data Mining techniques and factors used in Educational Data Mining to predict student amelioration | |
Thille et al. | The future of data-enriched assessment. | |
Vialardi et al. | A data mining approach to guide students through the enrollment process based on academic performance | |
CN110991645A (zh) | 一种基于知识模型的自适应学习方法、***及存储介质 | |
Pejić et al. | Predictive machine learning approach for complex problem solving process data mining | |
CN113851020A (zh) | 一种基于知识图谱的自适应学习平台 | |
Agustianto et al. | Design adaptive learning system using metacognitive strategy path for learning in classroom and intelligent tutoring systems | |
CN114491057A (zh) | 基于知识图谱的学习路径推荐方法、***、计算机及介质 | |
CN114372155A (zh) | 一种基于自扩展知识库和多模态画像的个性化学习平台 | |
Li et al. | Modeling student online learning using clustering | |
Liu et al. | Educational process mining for discovering students' problem-solving ability in computer programming education | |
CN113361867A (zh) | 一种基于学生答题记录的概念重要性判别方法及*** | |
Jiang et al. | Learning analytics in a blended computer education course | |
Mehra et al. | Data mining in educational systems for effective student mentoring | |
Bendjebar et al. | An improvement of a data mining technique for early detection of at-risk learners in distance learning environments | |
Han | An evaluation method of English online learning behaviour based on feature mining | |
Liu | Exploring the blended learning model of music teaching skills for teacher trainees based on teacher training professional certification in the context of big data | |
Sultan et al. | A Deep Learning Model for MOOC Dropout Prediction Using Learner's Course-relevant Activities | |
Hegde et al. | Personalized formative feedbacks and recommendations based on learning analytics to enhance the learning of Java Programming | |
Deepika et al. | Analyze and predicting the student academic performance using data mining tools | |
CN117556381B (zh) | 一种面向跨学科主观试题的知识水平深度挖掘方法及*** | |
CN117540108B (zh) | 基于考点数据分布式总结的智能推荐答题*** | |
Deviatiarova et al. | Analyzing Proficiency Patterns in Test Results Using Clustering and Augmentation Algorithms |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210907 |
|
RJ01 | Rejection of invention patent application after publication |