CN113361685A - 一种基于学习者知识状态演化表示的知识追踪方法及*** - Google Patents

一种基于学习者知识状态演化表示的知识追踪方法及*** Download PDF

Info

Publication number
CN113361685A
CN113361685A CN202110572170.7A CN202110572170A CN113361685A CN 113361685 A CN113361685 A CN 113361685A CN 202110572170 A CN202110572170 A CN 202110572170A CN 113361685 A CN113361685 A CN 113361685A
Authority
CN
China
Prior art keywords
knowledge
state
learner
evolution
answer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110572170.7A
Other languages
English (en)
Other versions
CN113361685B (zh
Inventor
孙建文
刘三女牙
蒋路路
张凯
邹睿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Central China Normal University
Original Assignee
Central China Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Central China Normal University filed Critical Central China Normal University
Priority to CN202110572170.7A priority Critical patent/CN113361685B/zh
Publication of CN113361685A publication Critical patent/CN113361685A/zh
Application granted granted Critical
Publication of CN113361685B publication Critical patent/CN113361685B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Biomedical Technology (AREA)
  • Algebra (AREA)
  • Probability & Statistics with Applications (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Tourism & Hospitality (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Operations Research (AREA)
  • Databases & Information Systems (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Educational Administration (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Educational Technology (AREA)
  • Evolutionary Biology (AREA)
  • Primary Health Care (AREA)
  • Development Economics (AREA)

Abstract

本发明提供一种基于学***缓变化,该目标通过定义损失函数来具化的。

Description

一种基于学习者知识状态演化表示的知识追踪方法及***
技术领域
本发明属于知识追踪领域,具体涉及基于学习者知识状态演化表示的知识追踪方法及***。
背景技术
知识追踪是一种重要的学***缓演化的。如何还原知识状态平缓变化的过程,是知识追踪任务的关键问题。
现有的知识追踪模型主要包括两类。第一类是概率知识追踪模型,以经典的贝叶斯知识追踪(BayesianKnowledge Tracing,BKT)为代表,使用具有特定语义的状态参数表示学***缓变化。第二类是深度学***缓变化。上述两类模型都在实际应用中取得了良好效果,是后续研究的坚实基础。然而,共同的不足是难以建模学***缓演化的过程,无法还原真实的学习场景。
发明内容
针对现有技术的以上缺陷或改进需求,本发明提供一种基于学***缓变化过程的目标,建模了真实的学习场景。该方法能够完成知识追踪任务,定义状态矩阵表示学习者的知识状态的状态矩阵,通过状态矩阵可以进一步预测出学习者的未来答题表现。
为实现上述目的,本发明提供一种基于学习者知识状态演化表示的知识追踪方法,包括如下步骤:
S1.获取统计的多个学习者对多个知识点样本的认知数据集;
S2.生成学习者的知识状态表示,搭建知识追踪模型,搭建的知识追踪模型中,长短期记忆神经网络和全连接神经网络的输入是认知数据集,输出是状态矩阵;
S3.生成学习者的未来答题表现的预测值,搭建的知识追踪模型中,贝叶斯知识追踪算法的输入是状态矩阵,输出是学习者的未来答题表现的预测值;
S4.生成演化项,将演化权重与知识状态的整体变化组合为演化项,以表示学习者在相邻答题中知识状态的准确变化;
S5.将演化项纳入损失函数并最优化,知识追踪模型的训练目标是生成准确的学***缓变化,该目标通过定义损失函数来具化的。
作为本发明的进一步改进,步骤S1中所述的认知数据集包括多个时间序列,一个时间序列包括多个时间步数据,多个时间步数据表示一个学习者在多个知识点上的答题情况;一个时间步数据是一个学习者在一个知识点上的答题情况。
作为本发明的进一步改进,步骤S2中所述的长短期记忆神经网络的输入是获取的认知数据集,输出是知识状态的低级特征表示-分布式向量;全连接神经网络的输入是分布式向量,输出是知识状态的高级特征表示-状态矩阵,状态矩阵是学习者知识状态的表示方法;状态矩阵ks中的行具体定义为状态行,是一个学习者对一个知识点的整体知识状态;状态矩阵ks中的列具体定义为状态列,是一个学习者对认知数据集中所有知识点的一种知识状态,状态矩阵ks表示为:
Figure BDA0003082954360000021
其中,kst是第t个时间步生成的状态矩阵,i∈{1,2,……n}是第t个时间步正在作答的知识点,n是认知数据集中的知识点总数,第i个状态行表示学习者对知识点i的知识状态,它包含知识点i对应的四个状态参数,分别为:pi(Lt)∈(0,1)为初始学习参数,表示学习者作答之前已经学会知识点i的概率值;pi(Tt)∈(0,1)为学习能力参数,表示学习者对知识点i从未学会到已学会的概率值;pi(Gt)∈(0,1)为猜测参数,表示学习者在未学会知识点i时猜对的概率值;pi(St)∈(0,1)为失误参数,表示学习者在已学会知识点i时失误答错的概率值,状态矩阵ks中的列具体定义为状态列,四个状态列分别为:Lt表示所有n个知识点的初始学习参数;Tt表示n个知识点的学习能力参数;Gt表示n个知识点的猜测参数;St表示n个知识点的失误参数。
作为本发明的进一步改进,步骤S3中将状态矩阵输入贝叶斯知识追踪算法,以计算学习者的未来答题表现的预测值,学习者在当前时间步t上,对未来第t+1个时间步上答题正确预测的概率向量p(Ct+1)的表达式为:
p(Ct+1)=Lt*(1-St)+(1-Lt)*Gt
其中,概率向量p(Ct+1)中的第i维是学习者在未来第t+1个时间步正确作答知识点i的概率值,概率向量p(Ct+1)会与第t+1个时间步作答的知识点向量进行点积运算,可计算出学习者下个时间步正确作答的概率值,此概率值大于等于0.95时,预测学习者将会正确作答;此概率值小于0.95时,预测学习者将会错误作答。
作为本发明的进一步改进,步骤S4中计算演化项,以表示学习者在相邻答题中知识状态的准确变化,具体为:利用搭建的知识追踪模型生成演化权重,以量化状态矩阵中每个状态列在整体变化中的作用,将演化权重与知识状态的整体变化组合为演化项,在当前时间步t上,演化项et的表达式为:
Figure BDA0003082954360000031
其中,wt=(w1,w2,w3,w4)∈(0,1)4是演化权重,Δkst是t个时间步与第t-1个时间步上知识状态的整体变化,是相邻时间步状态矩阵的差值,即相邻时间步状态列的差值,不同的状态列对知识状态整体变化的影响不同,演化权重准确建模了每个状态列的具体作用。
作为本发明的进一步改进,步骤S5中定义损失函数的步骤包括:计算未来答题表现的真实值和预测值之间的交叉熵,并且纳入演化项,可得到知识追踪模型的损失函数,通过最优化损失函数、使损失函数找到全局最小值或局部最小值,以实现知识追踪模型的训练目标,进一步使用领域内常用的随机梯度下降方法来最小化损失函数,使得知识追踪模型达到最优状态,知识追踪模型中,一个时间序列的损失函数为:
Figure BDA0003082954360000032
其中,f(·)为交叉熵函数,
Figure BDA0003082954360000033
为学习者未来答题表现的预测值,at+1是学习者未来答题表现的真实值,et是表示知识状态准确变化的演化项,E∈N*是该学习者序列的答题总数,N*是自然数集。
本发明还提供一种基于学习者知识状态演化表示的知识追踪***,包括:
统计认知数据模块,用于获取统计的多个学习者对多个知识点样本的认知数据集;
知识状态表示模块,生成学习者的知识状态表示,以长短期记忆神经网络、全连接神经网络、贝叶斯知识追踪算法为基础,搭建知识追踪模型;
预测模块,生成学习者的未来答题表现的预测值,搭建知识追踪模型,搭建的知识追踪模型中,贝叶斯知识追踪算法的输入是状态矩阵,输出是学习者的未来答题表现的预测值;
演化模块,生成演化项,计算相邻序列中状态矩阵的差值,以表示学习者在相邻答题中知识状态的整体变化;
优化模块,将演化项纳入损失函数并最优化,知识追踪模型的训练目标是生成准确的学***缓变化,该目标通过定义损失函数来具化的。
作为本发明的进一步改进,统计认知数据模块中所述的认知数据集包括多个时间序列,一个时间序列包括多个时间步数据,多个时间步数据表示一个学习者在多个知识点上的答题情况;一个时间步数据是一个学习者在一个知识点上的答题情况。
作为本发明的进一步改进,知识状态表示模块中所述的长短期记忆神经网络的输入是获取的认知数据集,输出是知识状态的低级特征表示-分布式向量;全连接神经网络的输入是分布式向量,输出是知识状态的高级特征表示-状态矩阵,状态矩阵是学习者知识状态的表示方法。
作为本发明的进一步改进,演化模块中,计算相邻序列中状态矩阵的差值,以表示学习者在相邻答题中知识状态的整体变化,具体为:利用搭建的知识追踪模型生成演化权重,以量化状态矩阵中每个状态列在整体变化中的作用,将演化权重与知识状态的整体变化组合为演化项,以表示学习者在相邻答题中知识状态的准确变化。
作为本发明的进一步改进,优化模块中定义损失函数的步骤包括:计算未来答题表现的真实值和预测值之间的交叉熵,并且纳入演化项,可得到知识追踪模型的损失函数,通过最优化损失函数、使损失函数找到全局最小值或局部最小值,以实现知识追踪模型的训练目标,进一步使用领域内常用的随机梯度下降方法来最小化损失函数,使得知识追踪模型达到最优状态。
作为本发明的进一步改进,状态矩阵ks中的行具体定义为状态行,是一个学习者对一个知识点的整体知识状态;状态矩阵ks中的列具体定义为状态列,是一个学习者对认知数据集中所有知识点的一种知识状态,状态矩阵ks表示为:
Figure BDA0003082954360000051
其中,kst是第t个时间步生成的状态矩阵,i∈{1,2,...,n}是第t个时间步正在作答的知识点,n是认知数据集中的知识点总数,第i个状态行表示学习者对知识点i的知识状态,它包含知识点i对应的四个状态参数,分别为:pi(Lt)∈(0,1)为初始学习参数,表示学习者作答之前已经学会知识点i的概率值;pi(Tt)∈(0,1)为学习能力参数,表示学习者对知识点i从未学会到已学会的概率值;pi(Gt)∈(0,1)为猜测参数,表示学习者在未学会知识点i时猜对的概率值;pi(St)∈(0,1)为失误参数,表示学习者在已学会知识点i时失误答错的概率值,状态矩阵ks中的列具体定义为状态列,四个状态列分别为:Lt表示所有n个知识点的初始学习参数;Tt表示n个知识点的学习能力参数;Gt表示n个知识点的猜测参数;St表示n个知识点的失误参数。
作为本发明的进一步改进,学习者在当前时间步t上,对未来第t+1个时间步上答题正确预测的概率向量p(ct+1)的表达式为:
p(Ct+1)=Lt*(1-St)+(1-Lt)*Gt
其中,概率向量p(Ct+1)中的第i维是学习者在未来第t+1个时间步正确作答知识点i的概率值,概率向量p(Ct+1)会与第t+1个时间步作答的知识点向量进行点积运算,可计算出学习者下个时间步正确作答的概率值,此概率值大于等于0.95时,预测学习者将会正确作答;此概率值小于0.95时,预测学习者将会错误作答。
作为本发明的进一步改进,在当前时间步t上,演化项et的表达式为:
Figure BDA0003082954360000052
其中,wt=(w1,w2,w3,w4)∈(0,1)4是演化权重,Δkst是t个时间步与第t-1个时间步上知识状态的整体变化,是相邻时间步状态矩阵的差值,即相邻时间步状态列的差值,不同的状态列对知识状态整体变化的影响不同,演化权重准确建模了每个状态列的具体作用。
作为本发明的进一步改进,知识追踪模型中,一个时间序列的损失函数为:
Figure BDA0003082954360000053
其中,f(·)为交叉熵函数,
Figure BDA0003082954360000061
为学习者未来答题表现的预测值,at+1是学习者未来答题表现的真实值,et是表示知识状态准确变化的演化项,E∈N*是该学习者序列的答题总数,N*是自然数集。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器运行所述计算机程序时,执行前述的一种基于学习者知识状态演化表示的知识追踪方法的步骤。
本发明还提供一种计算机可读存储介质,其存储计算机程序,所述计算机程序使得计算机执行前述公开的一种基于学习者知识状态演化表示的知识追踪方法的步骤。
总体而言,本发明与现有技术相比,具有以下有益技术效果:
本发明提供的一种基于学习者知识状态演化表示的知识追踪方法及***,利用长短期记忆网络神经网络在处理时序数据时所具有的“记忆”特性,生成的状态矩阵继承了学习者答题序列中隐含的特征,符合学习者答题时的学习规律,更加准确地表示了学习者在答题过程中的知识状态,更适合于用来预测学习者的未来答题表现。
本发明提供的一种基于学***缓变化、逐渐过渡的目标。该方法及***解决了经典知识追踪模型中的不足,还原了真实的学习过程,是建立准确的知识追踪模型的关键部分,能够更好地辅助具体的教学实践。
附图说明
图1是本发明的一种基于学习者知识状态演化表示的知识追踪方法的示意图;
图2是本发明的演化项的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图1-2,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。下面结合具体实施方式对本发明进一步详细说明。
图1是本发明的一种基于学习者知识状态演化表示的知识追踪方法的示意图。如图1所示,该方法包括以下步骤:
S1.获取统计的多个学习者对多个知识点样本的认知数据集。认知数据集包括多个时间序列,一个时间序列包括多个时间步数据,多个时间步数据表示一个学习者在多个知识点上的答题情况;一个时间步数据是一个学习者在一个知识点上的答题情况。
例如:认知数据集包括S个时间序列,S∈N*是数据集中不同学习者的人数,N*是自然数集;一个时间序列包括多个时间步数据,是一个学习者在多个知识点上的答题情况;一个时间步数据xt=(qt,at)是一个学习者s∈[1,S]在一个知识点i∈[1,n]上的答题情况,其中qt是当前作答知识点的向量表示,at是当前的作答结果,at=0表示作答错误,at=1表示作答正确。t∈[1,E],E∈N*是该学习者的答题总数,N*是自然数集,n是认知数据集中不同知识点的个数。
S2.生成学习者的知识状态表示,搭建知识追踪模型。搭建的知识追踪模型中,长短期记忆神经网络和全连接神经网络的输入是认知数据集,输出是状态矩阵;
所述的长短期记忆神经网络的输入是获取的认知数据集,输出是知识状态的低级特征表示-分布式向量;全连接神经网络的输入是分布式向量,输出是知识状态的高级特征表示-状态矩阵,状态矩阵是学习者知识状态的表示方法。
在第t个时间步上,将时间步数据xt输入到长短期记忆神经网络中,输出的是学习者s的知识状态的低级特征表示-分布式向量ht∈(0,1)N,其中N是隐藏节点数。ht表示了学习者s在当前时间步t上的知识状态,总结表示了学习者对n个知识点的知识状态,其中的每个维度没有具体含义。将分布式向量ht输入至全神经网络,输出的是学习者s的知识状态的高级特征表示-状态矩阵kst=|Lt,Tt,Gt,St|,其中的第i个状态行(pi(Lt),pi(Tt),pi(Gt),pi(St))∈(0,1)4是知识点i的四个状态参数,表示了学习者s关于知识点i的知识状态。状态列Lt表示学习者s对所有n个知识点的初始学习参数;Tt表示学习者s对n个知识点的学习能力参数;Gt表示学习者s对n个知识点的猜测参数;St表示学习者s对n个知识点的失误参数。在第t个时间步上,kst表示了学习者当前对每个知识点的知识状态,表达式如下:
Figure BDA0003082954360000071
S3.生成学习者的未来答题表现的预测值。搭建的知识追踪模型中,贝叶斯知识追踪算法的输入是状态矩阵,输出是学习者的未来答题表现的预测值。
在第t个时间步上,将状态矩阵kst输入至贝叶斯知识追踪算法中,利用算法中的预测概率计算公式,能够计算出学习者s在未来第t+1个时间步上答题正确的预测概率向量p(Ct+1),其计算公式为:
p(Ct+1)=Lt*(1-St)+(1-Lt)*Gt
其中,概率向量p(Ct+1)中的第i维是学习者s在未来第t+1个时间步正确作答知识点i的概率值。
进一步地,概率向量p(Ct+1)会与第t+1个时间步作答的知识点向量qt+1进行点积运算,可计算出学习者s下个时间步正确作答的概率值,此概率值大于等于0.95时,预测的作答结果
Figure BDA0003082954360000081
此概率值小于0.95时,预测的作答结果
Figure BDA0003082954360000082
例如,学习者s在第t+1个时间步作答知识点j,p(Ct+1)与qt+1进行点积运算的结果将会是pj(Ct+1),是学习者s在未来第t+1个时间步正确作答知识点j的概率值。当pj(Ct+1)≥0.95时,预测学习者s将会正确作答;当pj(Ct+1)<0.95时,预测学习者s将会正确错误作答。
S4.生成演化项,将演化权重与知识状态的整体变化组合为演化项,以表示学习者在相邻答题中知识状态的准确变化。
第t个时间步上,首先计算其与前一个时间步t-1上的知识状态的整体变化Δkst,计算公式为:
Figure BDA0003082954360000083
然后,利用全连接神经网络的输出演化权重wt=(w1,w2,w3,w4)∈(0,1)4。wt根据学习者数据特征生成,其中的每维权重表示的是每个状态列在整个知识状态变化过程中的作用。接着,将演化权重wt与知识状态的整体变化Δkst组合为演化项et∈(0,1),计算公式为:
Figure BDA0003082954360000084
图2是本发明实施例的演化项的示意图。演化项用来表示相邻答题过程中准确的知识状态的变化,每维权重表示的是每个状态列在整体知识状态变化中的作用。演化项的目的是建模知识追踪模型中知识状态的准确变化,它被具体应用在知识追踪模型的损失函数中,反向训练知识追踪模型,使得知识追踪模型生成的知识状态更加合理。
S5.将演化项纳入损失函数并最优化,知识追踪模型的训练目标是生成准确的学***缓变化,该目标通过定义损失函数来具化的。
模型的训练目标有两个,其一是生成准确的学***缓变化。因此其损失函数也包含两部分,其一是计算未来答题表现的真实值和预测值之间的交叉熵,其二是演化项。使用常用的随机梯度下降方法来最优化损失函数,使得其找到全局最小值或局部最小值,能够实现模型的两个训练目标。对于学习者s,一共作答的题目总数E∈N*,其损失函数为:
Figure BDA0003082954360000091
其中,f(·)为交叉熵函数,
Figure BDA0003082954360000092
为学习者s在未来第t+1个时间步上答题表现的预测值,at+1是学习者s在未来第t+1个时间步上答题表现的真实值,et是表示知识状态准确变化的演化项,E∈N*是该学习者序列的答题总数,N*是自然数集。
对于认知数据集中的所有学习者,其损失函数为:
Figure BDA0003082954360000093
其中,S∈N*是数据集中不同学习者的人数,N*是自然数集。
表1为本发明的知识追踪方法和现有技术方法对学习者未来答题情况预测结果。如表1所示,在三个认知数据集上进行了实验,分别为ASSIST2009,ASSIST2015,Statics2011。其中,对比的现有技术方法包括经典的贝叶斯知识追踪方法、深度知识追踪方法,实验结果的度量指标是Area Under Curve(AUC)。从表中可以看到,本发明实施例的技术方案的预测结果优于现有技术方案的预测结果。
表1为本发明的知识追踪方法和现有技术的方法对学习者答题情况预测结果
Figure BDA0003082954360000094
为使本发明的一种基于学习者知识状态演化表示的知识追踪方法表述更加清楚,以某个学习者为例,介绍该学习者在一个时间序列的基于学习者知识状态演化表示的知识追踪方法:
(1)认知数据集中包含多个时间序列,每个学习者的答题序列是一个时间序列。假如一个学习者共答题5次(共作答了3个不同的知识点),每个时间步输入一次答题数据,该时间序列的长度为5。在表2中,展示了该学习者的练习数据,第一行是该学习者练习的题目总数,共做了5道练习题;第二行是该学习者作答的知识点的标签,比如第一位学习者作答的第1道练习题是关于知识点3的,第2道是关于知识点1的练习题;第三行是该学习者答题的结果,0代表回答错误,1代表回答正确,比如第一位学习者作答第1道题目时回答错误,第2道题目回答错误等。
表2数据格式
Figure BDA0003082954360000101
(2)在第1个时间步上,输入数据为x1=(q1,a1)=(0,0,1,0)T,其中q1=(0,0,1)T是当前作答知识点的one-hot向量表示,表示该学生作答的是第三个知识点。a1=0是当前的作答结果,表示作答错误。
(3)知识追踪模型中的长短期记忆神经网络根据x1生成了知识状态的低级特征表示-分布式向量h1∈(0.1,0.4,0.2,0.1)T,其中假设神经网络的隐藏节点数为4,因此向量维度为4。
(4)知识追踪模型中的全神经网络根据h1生成了知识状态的高级特征表示-状态矩阵ks1=|L1,T1,G1,S1|如下:
Figure BDA0003082954360000102
其中,第一行是学习者对知识点1的知识状态,第二行是学习者对知识点2的知识状态,第三行是学习者对知识点3的知识状态。第一列是学习者对3个知识点的初始学习参数;第二列是学习者对3个知识点的学习能力参数;第三列是学习者对3个知识点的猜测参数,第四列是学习者对3个知识点的失误参数。
(5)知识追踪模型中的贝叶斯知识追踪算法根据ks1计算出学习者的第2次答题表现的预测值。
p(C2)=L1*(1-S1)+(1-L1)*G1
=(0.3,0.1,0.15)*(0.9,0.95,0.85)T+(0.7,0.9,0.85)*(0.1,0.05,0.15)T
=0.735
由于0.735<0.95,因此预测学习者第二次答题错误。
(6)知识追踪模型中的全连接神经网络生成演化权重w1=(0.2,0.3,0.1,0.4)T,将其与整体变化Δks1=(||L1-L0||,||T1-T0||,||G1-G0||,||S1-S0||)组合为演化项
Figure BDA0003082954360000111
Figure BDA0003082954360000112
(7)将演化项纳入损失函数
Figure BDA0003082954360000113
反向训练知识追踪模型至最优。其中,f(·)为常用的交叉熵损失函数。
(8)第2个时间步……(循环以上步骤2-7)。
本发明还提供一种基于学习者知识状态演化表示的知识追踪***,包括:
统计认知数据模块,用于获取统计的多个学习者对多个知识点样本的认知数据集;
知识状态表示模块,生成学习者的知识状态表示,以长短期记忆神经网络、全连接神经网络、贝叶斯知识追踪算法为基础,搭建知识追踪模型;
预测模块,生成学习者的未来答题表现的预测值,搭建知识追踪模型,搭建的知识追踪模型中,贝叶斯知识追踪算法的输入是状态矩阵,输出是学习者的未来答题表现的预测值;
演化模块,生成演化项,计算相邻序列中状态矩阵的差值,以表示学习者在相邻答题中知识状态的整体变化;
优化模块,将演化项纳入损失函数并最优化,知识追踪模型的训练目标是生成准确的学***缓变化,该目标通过定义损失函数来具化的。
作为本发明的进一步改进,统计认知数据模块中所述的认知数据集包括多个时间序列,一个时间序列包括多个时间步数据,多个时间步数据表示一个学习者在多个知识点上的答题情况;一个时间步数据是一个学习者在一个知识点上的答题情况。
作为本发明的进一步改进,知识状态表示模块中所述的长短期记忆神经网络的输入是获取的认知数据集,输出是知识状态的低级特征表示-分布式向量;全连接神经网络的输入是分布式向量,输出是知识状态的高级特征表示-状态矩阵,状态矩阵是学习者知识状态的表示方法。
作为本发明的进一步改进,演化模块中,计算相邻序列中状态矩阵的差值,以表示学习者在相邻答题中知识状态的整体变化,具体为:利用搭建的知识追踪模型生成演化权重,以量化状态矩阵中每个状态列在整体变化中的作用,将演化权重与知识状态的整体变化组合为演化项,以表示学习者在相邻答题中知识状态的准确变化。
作为本发明的进一步改进,优化模块中定义损失函数的步骤包括:计算未来答题表现的真实值和预测值之间的交叉熵,并且纳入演化项,可得到知识追踪模型的损失函数,通过最优化损失函数、使损失函数找到全局最小值或局部最小值,以实现知识追踪模型的训练目标,进一步使用领域内常用的随机梯度下降方法来最小化损失函数,使得知识追踪模型达到最优状态。
作为本发明的进一步改进,状态矩阵ks中的行具体定义为状态行,是一个学习者对一个知识点的整体知识状态;状态矩阵ks中的列具体定义为状态列,是一个学习者对认知数据集中所有知识点的一种知识状态,状态矩阵ks表示为:
Figure BDA0003082954360000121
其中,kst是第t个时间步生成的状态矩阵,i∈{1,2,...,n}是第t个时间步正在作答的知识点,n是认知数据集中的知识点总数,第i个状态行表示学习者对知识点i的知识状态,它包含知识点i对应的四个状态参数,分别为:pi(Lt)∈(0,1)为初始学习参数,表示学习者作答之前已经学会知识点i的概率值;pi(Tt)∈(0,1)为学习能力参数,表示学习者对知识点i从未学会到已学会的概率值;pi(Gt)∈(0,1)为猜测参数,表示学习者在未学会知识点i时猜对的概率值;pi(St)∈(0,1)为失误参数,表示学习者在已学会知识点i时失误答错的概率值,状态矩阵ks中的列具体定义为状态列,四个状态列分别为:Lt表示所有n个知识点的初始学习参数;Tt表示n个知识点的学习能力参数;Gt表示n个知识点的猜测参数;St表示n个知识点的失误参数。
作为本发明的进一步改进,学习者在当前时间步t上,对未来第t+1个时间步上答题正确预测的概率向量p(Ct+1)的表达式为:
p(Ct+1)=Lt*(1-St)+(1-Lt)*Gt
其中,概率向量p(Ct+1)中的第i维是学习者在未来第t+1个时间步正确作答知识点i的概率值,概率向量p(Ct+1)会与第t+1个时间步作答的知识点向量进行点积运算,可计算出学习者下个时间步正确作答的概率值,此概率值大于等于0.95时,预测学习者将会正确作答;此概率值小于0.95时,预测学习者将会错误作答。
作为本发明的进一步改进,在当前时间步t上,演化项et的表达式为:
Figure BDA0003082954360000131
其中,wt=(w1,w2,w3,w4)∈(0,1)4是演化权重,Δkst是t个时间步与第t-1个时间步上知识状态的整体变化,是相邻时间步状态矩阵的差值,即相邻时间步状态列的差值,不同的状态列对知识状态整体变化的影响不同,演化权重准确建模了每个状态列的具体作用。
作为本发明的进一步改进,知识追踪模型中,一个时间序列的损失函数为:
Figure BDA0003082954360000132
其中,f(·)为交叉熵函数,
Figure BDA0003082954360000133
为学习者未来答题表现的预测值,at+1是学习者未来答题表现的真实值,et是表示知识状态准确变化的演化项,E∈N*是该学习者序列的答题总数,N*是自然数集。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器运行所述计算机程序时,执行前述的一种基于学习者知识状态演化表示的知识追踪方法的步骤。
本发明还提供一种计算机可读存储介质,其存储计算机程序,所述计算机程序使得计算机执行前述公开的一种基于学习者知识状态演化表示的知识追踪方法的步骤。
以上所述仅为本发明的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本发明实施例可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种基于学习者知识状态演化表示的知识追踪方法,其特征在于,该方法包括如下步骤为:
S1.获取统计的多个学习者对多个知识点样本的认知数据集;
S2.生成学习者的知识状态表示,搭建知识追踪模型,搭建的知识追踪模型中,长短期记忆神经网络和全连接神经网络的输入是认知数据集,输出是状态矩阵;
S3.生成学习者的未来答题表现的预测值,搭建的知识追踪模型中,贝叶斯知识追踪算法的输入是状态矩阵,输出是学习者的未来答题表现的预测值;
S4.生成演化项,将演化权重与知识状态的整体变化组合为演化项,以表示学习者在相邻答题中知识状态的准确变化;
S5.将演化项纳入损失函数并最优化,知识追踪模型的训练目标是生成准确的学***缓变化,该目标通过定义损失函数来具化的。
2.根据权利要求1所述的一种基于学习者知识状态演化表示的知识追踪方法,其特征在于,步骤S1中所述的认知数据集包括多个时间序列,一个时间序列包括多个时间步数据,多个时间步数据表示一个学习者在多个知识点上的答题情况;一个时间步数据是一个学习者在一个知识点上的答题情况。
3.根据权利要求1所述的一种基于学习者知识状态演化表示的知识追踪方法,其特征在于,步骤S2中所述的长短期记忆神经网络的输入是获取的认知数据集,输出是知识状态的低级特征表示—分布式向量;全连接神经网络的输入是分布式向量,输出是知识状态的高级特征表示—状态矩阵,状态矩阵是学习者知识状态的表示方法;状态矩阵ks中的行具体定义为状态行,是一个学习者对一个知识点的整体知识状态;状态矩阵ks中的列具体定义为状态列,是一个学习者对认知数据集中所有知识点的一种知识状态,状态矩阵ks表示为:
Figure FDA0003082954350000011
其中,kst是第t个时间步生成的状态矩阵,i∈{1,2,……n}是第t个时间步正在作答的知识点,n是认知数据集中的知识点总数,第i个状态行表示学习者对知识点i的知识状态,它包含知识点i对应的四个状态参数,分别为:pi(Lt)∈(0,1)为初始学习参数,表示学习者作答之前已经学会知识点i的概率值;pi(Tt)∈(0,1)为学习能力参数,表示学习者对知识点i从未学会到已学会的概率值;pi(Gt)∈(0,1)为猜测参数,表示学习者在未学会知识点i时猜对的概率值;pi(St)∈(0,1)为失误参数,表示学习者在已学会知识点i时失误答错的概率值,状态矩阵ks中的列具体定义为状态列,四个状态列分别为:Lt表示所有n个知识点的初始学习参数;Tt表示n个知识点的学习能力参数;Gt表示n个知识点的猜测参数;Sr表示n个知识点的失误参数。
4.根据权利要求1所述的一种基于学习者知识状态演化表示的知识追踪方法,其特征在于,步骤S3中将状态矩阵输入贝叶斯知识追踪算法,以计算学习者的未来答题表现的预测值,学习者在当前时间步t上,对未来第t+1个时间步上答题正确预测的概率向量p(Ct+1)的表达式为:
p(Ct+1)=Lt*(1-St)+(1-Lt)*Gt
其中,概率向量p(Ct+1)中的第i维是学习者在未来第t+1个时间步正确作答知识点i的概率值,概率向量p(Ct+1)会与第t+1个时间步作答的知识点向量进行点积运算,可计算出学习者下个时间步正确作答的概率值,此概率值大于等于0.95时,预测学习者将会正确作答;此概率值小于0.95时,预测学习者将会错误作答。
5.根据权利要求1所述的一种基于学习者知识状态演化表示的知识追踪方法,其特征在于,步骤S4中计算演化项,以表示学习者在相邻答题中知识状态的准确变化,具体为:利用搭建的知识追踪模型生成演化权重,以量化状态矩阵中每个状态列在整体变化中的作用,将演化权重与知识状态的整体变化组合为演化项,在当前时间步t上,演化项et的表达式为:
Figure FDA0003082954350000021
其中,wt=(w1,w2,w3,w4)∈(0,1)4是演化权重,Δkst是t个时间步与第t-1个时间步上知识状态的整体变化,是相邻时间步状态矩阵的差值,即相邻时间步状态列的差值,不同的状态列对知识状态整体变化的影响不同,演化权重准确建模了每个状态列的具体作用。
6.根据权利要求1所述的一种基于学习者知识状态演化表示的知识追踪方法,其特征在于,步骤S5中定义损失函数的步骤包括:计算未来答题表现的真实值和预测值之间的交叉熵,并且纳入演化项,可得到知识追踪模型的损失函数,通过最优化损失函数、使损失函数找到全局最小值或局部最小值,以实现知识追踪模型的训练目标,进一步使用领域内常用的随机梯度下降方法来最小化损失函数,使得知识追踪模型达到最优状态,知识追踪模型中,一个时间序列的损失函数为:
Figure FDA0003082954350000022
其中,f(·)为交叉熵函数,
Figure FDA0003082954350000023
为学习者未来答题表现的预测值,at+1是学习者未来答题表现的真实值,et是表示知识状态准确变化的演化项,E∈N*是该学习者序列的答题总数,N*是自然数集。
7.一种基于学习者知识状态演化表示的知识追踪***,其特征在于,该***包括:
统计认知数据模块,用于获取统计的多个学习者对多个知识点样本的认知数据集;
知识状态表示模块,生成学习者的知识状态表示,以长短期记忆神经网络、全连接神经网络、贝叶斯知识追踪算法为基础,搭建知识追踪模型;
预测模块,生成学习者的未来答题表现的预测值,搭建知识追踪模型,搭建的知识追踪模型中,贝叶斯知识追踪算法的输入是状态矩阵,输出是学习者的未来答题表现的预测值;
演化模块,生成演化项,计算相邻序列中状态矩阵的差值,以表示学习者在相邻答题中知识状态的整体变化;
优化模块,将演化项纳入损失函数并最优化,知识追踪模型的训练目标是生成准确的学***缓变化,该目标通过定义损失函数来具化的。
8.一种电子设备,其特征在于:包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器运行所述计算机程序时,执行如权利要求1-7任一项所述的一种基于学习者知识状态演化表示的知识追踪方法的步骤。
9.一种计算机可读存储介质,其存储计算机程序,其特征在于,所述计算机程序使得计算机执行权利要求1-7任一项所述的一种基于学习者知识状态演化表示的知识追踪方法的步骤。
CN202110572170.7A 2021-05-25 2021-05-25 一种基于学习者知识状态演化表示的知识追踪方法及*** Active CN113361685B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110572170.7A CN113361685B (zh) 2021-05-25 2021-05-25 一种基于学习者知识状态演化表示的知识追踪方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110572170.7A CN113361685B (zh) 2021-05-25 2021-05-25 一种基于学习者知识状态演化表示的知识追踪方法及***

Publications (2)

Publication Number Publication Date
CN113361685A true CN113361685A (zh) 2021-09-07
CN113361685B CN113361685B (zh) 2022-08-19

Family

ID=77527486

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110572170.7A Active CN113361685B (zh) 2021-05-25 2021-05-25 一种基于学习者知识状态演化表示的知识追踪方法及***

Country Status (1)

Country Link
CN (1) CN113361685B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114723590A (zh) * 2022-03-30 2022-07-08 华南师范大学 面向群体的知识追踪方法、***、装置及存储介质
CN114781710A (zh) * 2022-04-12 2022-07-22 云南师范大学 一种综合学习过程及题目知识点难度特征的知识追踪方法
CN116578694A (zh) * 2023-04-21 2023-08-11 华南师范大学 解纠缠知识追踪方法、***、装置和介质
CN116976434A (zh) * 2023-07-05 2023-10-31 长江大学 一种基于知识点扩散表示的知识追踪方法及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19737939A1 (de) * 1997-08-30 1999-03-04 Steiner Ralf Dr Verfahren und Datenstruktur zur rechnergestützten Verwaltung von Entwicklungen
CN110688409A (zh) * 2019-09-19 2020-01-14 北京作业盒子科技有限公司 学习状态的挖掘方法、推荐方法及电子设备
CN110807469A (zh) * 2019-09-19 2020-02-18 华中师范大学 融合长短时记忆与贝叶斯网络的知识追踪方法及***
CN111538868A (zh) * 2020-04-28 2020-08-14 中国科学技术大学 知识追踪方法及习题推荐方法
CN112085168A (zh) * 2020-09-11 2020-12-15 浙江工商大学 一种基于动态键值门控循环网络的知识追踪方法及***

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19737939A1 (de) * 1997-08-30 1999-03-04 Steiner Ralf Dr Verfahren und Datenstruktur zur rechnergestützten Verwaltung von Entwicklungen
CN110688409A (zh) * 2019-09-19 2020-01-14 北京作业盒子科技有限公司 学习状态的挖掘方法、推荐方法及电子设备
CN110807469A (zh) * 2019-09-19 2020-02-18 华中师范大学 融合长短时记忆与贝叶斯网络的知识追踪方法及***
CN111538868A (zh) * 2020-04-28 2020-08-14 中国科学技术大学 知识追踪方法及习题推荐方法
CN112085168A (zh) * 2020-09-11 2020-12-15 浙江工商大学 一种基于动态键值门控循环网络的知识追踪方法及***

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CHENYANG WANG, ET AL.: "Temporal Cross-Effects in Knowledge Tracing", 《WSDM "21: PROCEEDINGS OF THE 14TH ACM INTERNATIONAL CONFERENCE ON WEB SEARCH AND DATA MINING》 *
郭章: "基于演化聚类的学习者知识跟踪模型研究", 《现代计算机》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114723590A (zh) * 2022-03-30 2022-07-08 华南师范大学 面向群体的知识追踪方法、***、装置及存储介质
CN114781710A (zh) * 2022-04-12 2022-07-22 云南师范大学 一种综合学习过程及题目知识点难度特征的知识追踪方法
CN114781710B (zh) * 2022-04-12 2022-12-23 云南师范大学 一种综合学习过程及题目知识点难度特征的知识追踪方法
CN116578694A (zh) * 2023-04-21 2023-08-11 华南师范大学 解纠缠知识追踪方法、***、装置和介质
CN116578694B (zh) * 2023-04-21 2024-01-09 华南师范大学 解纠缠知识追踪方法、***、装置和介质
CN116976434A (zh) * 2023-07-05 2023-10-31 长江大学 一种基于知识点扩散表示的知识追踪方法及存储介质
CN116976434B (zh) * 2023-07-05 2024-02-20 长江大学 一种基于知识点扩散表示的知识追踪方法及存储介质

Also Published As

Publication number Publication date
CN113361685B (zh) 2022-08-19

Similar Documents

Publication Publication Date Title
CN113361685B (zh) 一种基于学习者知识状态演化表示的知识追踪方法及***
EP3602413B1 (en) Projection neural networks
CN109992773B (zh) 基于多任务学习的词向量训练方法、***、设备及介质
Wang et al. Deep hierarchical knowledge tracing
CN112116092B (zh) 可解释性知识水平追踪方法、***和存储介质
CN111047482B (zh) 基于层次记忆网络的知识追踪***及方法
Tsutsumi et al. Deep-IRT with Independent Student and Item Networks.
CN113190688B (zh) 基于逻辑推理和图卷积的复杂网络链接预测方法及***
CN113360635B (zh) 一种基于自注意和预训练机制的智能教学方法及***
Dai et al. Hybrid deep model for human behavior understanding on industrial internet of video things
CN114385801A (zh) 一种基于分层细化lstm网络的知识追踪方法及***
CN111861013A (zh) 一种电力负荷预测方法及装置
CN114021722A (zh) 一种融合认知刻画的注意力知识追踪方法
CN114971066A (zh) 融合遗忘因素和学习能力的知识追踪方法及***
CN114548591A (zh) 一种基于混合深度学习模型和Stacking的时序数据预测方法及***
Sha et al. Neural knowledge tracing
CN109308316A (zh) 一种基于主题聚类的自适应对话生成***
CN113239699B (zh) 一种融合多特征的深度知识追踪方法及***
CN110134956A (zh) 基于blstm-crf的地名组织名识别方法
CN116611517A (zh) 融合图嵌入和注意力的知识追踪方法
CN116431821A (zh) 基于常识感知的知识图谱补全方法及问答***
CN112766513B (zh) 一种记忆协同的知识追踪方法及***
CN115293249A (zh) 一种基于动态时序预测的电力***典型场景概率预测方法
CN115423105A (zh) 一种预训练语言模型构建方法、***及装置
CN114861917A (zh) 贝叶斯小样本学习的知识图谱推理模型、***及推理方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant