CN111444432A - 领域自适应的深度知识追踪及个性化习题推荐方法 - Google Patents

领域自适应的深度知识追踪及个性化习题推荐方法 Download PDF

Info

Publication number
CN111444432A
CN111444432A CN202010248722.4A CN202010248722A CN111444432A CN 111444432 A CN111444432 A CN 111444432A CN 202010248722 A CN202010248722 A CN 202010248722A CN 111444432 A CN111444432 A CN 111444432A
Authority
CN
China
Prior art keywords
data
knowledge tracking
knowledge
domain
source
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010248722.4A
Other languages
English (en)
Inventor
刘淇
陈恩红
程松
苏喻
佟威
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Science and Technology of China USTC
Original Assignee
University of Science and Technology of China USTC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Science and Technology of China USTC filed Critical University of Science and Technology of China USTC
Priority to CN202010248722.4A priority Critical patent/CN111444432A/zh
Publication of CN111444432A publication Critical patent/CN111444432A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/088Non-supervised learning, e.g. competitive learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • G06Q50/205Education administration or guidance

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Educational Technology (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Educational Administration (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • General Business, Economics & Management (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种领域自适应的深度知识追踪及个性化习题推荐方法,相关知识追踪方法包括:获取学生的历史答题记录数据与相应的习题数据,并划分为源领域和目标领域数据;对于源领域数据,使用深度学习方法训练源领域的知识追踪模型;根据源领域的知识追踪模型,使用迁移学习方法实现源领域到目标领域的迁移,从而实现目标领域数据的知识追踪。该方法运用深度学习和迁移学习的方法,能够将源领域训练好的知识追踪模型迁移到目标领域中去,解决了领域数量多需要训练大量模型的问题,同时也解决了领域数据量少无法训练得到一个可靠知识追踪模型的问题。再配合相应的个性化习题推荐方法,可以给学生推荐合适的练习题,给学生提供个性化的测试方案。

Description

领域自适应的深度知识追踪及个性化习题推荐方法
技术领域
本发明涉及迁移学习领域和教育数据挖掘领域,尤其涉及一种领域自适应的深度知识追踪及个性化习题推荐方法。
背景技术
当前的大数据和数据挖掘技术快速发展,尤其是在教育领域,在线教育***不断的出现,知识追踪作为教育领域中基础且十分必要的任务,越来越重要。比如知识追踪的结果可以应用于个性化习题推荐,给学生推荐合适的练习题,来加强学生在知识点或者答题技巧上的熟练度,给学生提供个性化的测试方案。
传统的知识追踪方法仅仅针对某个特定的学校或学科建立模型,并不能运用到其他不同的学校和学科。然而,在现实中有很多的学校、学科以及年级,为不同的学校、学科和年级分别建立不同的知识追踪模型,会耗费大量的人力和物力。同时,还有很多学校并没有足够的数据来训练模型。
可见现有技术由于技术处理层面所存在的问题,无法获得较好的知识追踪模型,直接影响知识追踪的效果,进而影响到知识追踪结果的应用。
发明内容
本发明的目的是提供一种领域自适应的深度知识追踪及个性化习题推荐方法,可以很好的将一个领域(学科,学校,年级)上训练好的知识追踪模型迁移到另一个领域(学科,学校,年级)上,从而能够给学生推荐合适的练习题。
本发明的目的是通过以下技术方案实现的:
一种领域自适应的深度知识追踪方法,包括:
获取学生的历史答题记录数据与相应的习题数据构成的数据集,并通过训练的自编码器,将数据划分为源领域和目标领域数据;
对于源领域数据,使用深度学习方法训练源领域的知识追踪模型;
根据源领域的知识追踪模型,结合目标领域数据使用迁移学习方法实现源领域到目标领域的迁移,从而实现目标领域数据的知识追踪。
由上述本发明提供的技术方案可以看出,该方法运用深度学习和迁移学习的方法,能够将源领域训练好的知识追踪模型迁移到目标领域中去,解决了领域数量多需要训练大量模型的问题,同时也解决了领域数据量少无法训练得到一个可靠知识追踪模型的问题。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。
图1为本发明实施例提供的一种领域自适应的深度知识追踪及个性化习题推荐方法的流程图。
具体实施方式
下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明的保护范围。
本发明实施例提供一种领域自适应的深度知识追踪方法,如图1所示,包括:
步骤1、获取学生的历史答题记录数据与相应的习题数据构成的数据集,并通过训练的自编码器,将数据划分为源领域和目标领域数据。
学生的历史答题记录数据包含,学生对于每一习题的得分情况;习题数据包含了每一习题的文本数据。
本发明实施例中,对于获取到的数据,首先通过常规方式进行数据清洗,滤除信息不完整的数据,从而得到一个数据集。
然后,通过一个标准化单元,将数据使用统一的数学形式表示;学生的历史答题记录数据表示为:
Figure BDA0002434741940000021
其中
Figure BDA0002434741940000022
作为一条答题记录,包含第t道习题与相应的得分rt,t=1,2,...,T,T为习题总数;习题数据记为X={x1,x2,...,xT},xt表示第t道习题的文本,xt=(w1,w2,...,wL),wl表示习题文本中的第l个词,l=1,2,...,L,L表示文本的长度。
之后,通过最小化重构误差,共同预训练一个自编码器,重构误差定义为:
Figure BDA0002434741940000031
其中,
Figure BDA0002434741940000032
表示wl的重构结果,
Figure BDA0002434741940000033
表示x的重构结果;
为了选择对目标领域有利的源领域样本,最小化如下目标函数,从而在数据集中筛选出一部分数据,构成源领域数据集
Figure BDA00024347419400000318
,剩余数据则为目标领域数据集
Figure BDA00024347419400000319
,目标函数定义为:
Figure BDA0002434741940000034
其中,
Figure BDA0002434741940000035
Figure BDA0002434741940000036
分别表示源领域和目标领域的数据,
Figure BDA0002434741940000037
Figure BDA0002434741940000038
表示对应的重构数据,nS、nT分别表示源领域、目标领域的数据量,t、t′各自表示源领域和目标领域的习题序号;
Figure BDA0002434741940000039
是一个指示器,它的每个元素
Figure BDA00024347419400000310
表示源领域的数据
Figure BDA00024347419400000311
选择还是不选择,1表示选择,0表示不选择;
Figure BDA00024347419400000312
Figure BDA00024347419400000313
都是通过前面的式子
Figure BDA00024347419400000314
计算得到;π′e、πd′为自编码器中的编码器、解码器,实现方式将在后文进行介绍。
Figure BDA00024347419400000320
表示正则化项,为了防止uS中的每个元素都变为零,定义为:
Figure BDA00024347419400000315
其中,λ是正则化系数;
Figure BDA00024347419400000316
的取值是根据重构误差来决定:
Figure BDA00024347419400000317
步骤2、对于源领域数据,使用深度学习方法训练源领域的知识追踪模型。
源领域的知识追踪模型主要包含:自编码器、两个神经网络、长短期记忆网络、以及线性层(输出层)。
本发明实施例中,使用深度学习方法训练源领域的知识追踪模型,从而实现知识追踪。结合习题文本信息,并且引入猜测率和失误率两个教育的特征进行知识追踪。因为习题的文本包含了大量的信息,这些信息能够充分地反映习题的特征。因此为了能够得到更好的知识追踪效果,我们在知识追踪的过程中,利用习题的编码信息来表示每个习题。
本步骤的自编码器与步骤1中自编码器类似,区别在于,本步骤的自编码器是在习题数据上通过无监督的方式训练得到,然后利用自编码器对习题数据的编码结果来表示相应习题;自编码器(步骤1的自编码器也是如下形式)表示为:
encoder:q=πe(x)
Figure BDA00024347419400000411
其中,πe、πd分别表示自编码器中的编码器、解码器;q表示习题的编码信息,x表示相应习题的文本,
Figure BDA0002434741940000041
表示通过自编码器重构的习题文本得到的习题文本;通过
Figure BDA0002434741940000042
与x之间的差异来训练自编码器。
自编码器训练完毕后,对于输入的第t道习题的文本xt,获得对应的编码信息qt
本发明实施例中,编码器πe(以及步骤1中提到的编码器πe′)采用双向的LSTM(长短期记忆网络)模型实现,双向的LSTM模型表示为:
Figure BDA0002434741940000043
Figure BDA0002434741940000044
其中,
Figure BDA0002434741940000045
Figure BDA0002434741940000046
是正反两个方向的LSTM模型的输出,wl表示第l个输入的单词,
Figure BDA0002434741940000047
Figure BDA0002434741940000048
分别是正反两个LSTM模型的待学习参数;
将正反两个方向的LSTM模型的输出拼接成一个向量:
Figure BDA0002434741940000049
通过池化操作获得习题表示qt,qt中的每一个元素的获取方法表示为:
qti=max(η1i,η2i,...,ηLi)
上式中,i表示第i个维度;原理是:一个习题有L个单词,每个单词ηl是一个n维的向量,这个习题qt也是一个n维的向量,计算方式是:qt中第i维,都是所有L个单词对应维度上的值的最大值。
习题得分rt用1表示答对,0表示答错;通对习题表征qt拼接一个零向量:
Figure BDA00024347419400000410
其中,
Figure BDA00024347419400000412
是拼接操作,拼接两个向量,0=(0,0,...,0)是一个零向量,所有的元素全都为零。
对于解码器πd(以及步骤1中提到的解码器πd′),为了简单起见,仅采用LSTM模型实现,表示为:
Figure BDA0002434741940000051
Figure BDA0002434741940000052
其中,
Figure BDA0002434741940000053
表示LSTM模型输出,
Figure BDA0002434741940000054
Wdec和bdec都是LSTM模型的参数。
采用一个长短期记忆网络,每一时刻输入一个答题记录
Figure BDA0002434741940000059
获得对应时刻的状态ht
Figure BDA00024347419400000510
Figure BDA00024347419400000511
Figure BDA00024347419400000512
Figure BDA00024347419400000513
ht=ottanh(ct)
其中,it,ft,ct,ot分别表示长短期记忆网络循环神经网络中的输入门、遗忘门、记忆单元和输出门,W*,b*表示相应门中的权重与偏置项,其中每个式子中前一个W*表示答题记录
Figure 1
的权重,后一个W*表示上一时刻状态的权重。
对于失误率和猜测率的建模,这里是从习题文本中来学习。同样为了简便起见,引入猜测率和失误率两个特征进行知识追踪,描述为:
st=S(qt)
gt=G(qt)
其中,S和G分别表示学习失误率和猜测率的两个神经网络。
再结合失误率和猜测率,获得学生的知识状态:
Figure BDA0002434741940000055
其中,符号
Figure BDA00024347419400000515
表示向量按元素乘;
基于学生的知识状态,通过一个线性层来预测相应学生未来在习题上的表现情况:
Figure BDA0002434741940000056
yt=sigmoid(Wout·αt+bout)
其中,αt表示adaptation函数的输出,Θadp表示adaptation函数的参数;yt表示sigmoid函数输出的预测结果,Wout、bout分别表示sigmoid函数的权值和偏置。
训练源领域的知识追踪模型的目标函数,定义为:
Figure BDA0002434741940000057
其中,n表示学生的数目,
Figure BDA0002434741940000058
为模型预测的学生i在第t个习题上的得分,函数δ(·)表示将习题
Figure BDA0002434741940000061
转换为其索引值t,l(x,y)是一个函数,x与y相同则函数输出为1,否则输出为0。
3、根据源领域的知识追踪模型,结合目标领域数据使用迁移学习方法实现源领域到目标领域的迁移,从而实现目标领域数据的知识追踪。
本发明实施例中,使用了一种两步步策略,第一步是基于训练好的源领域的知识追踪模型,利用最大均值差异(MMD)缩小知识状态分布间的距离,来更新源领域的知识追踪模型中非输出层;第二步是,在完成第一步的基础上,计算学生认知水平,通过微调技术适配不同领域输出维度,从而更新源领域的知识追踪模型中的输出层。
本步骤优选实施方式如下:1)根据最大均值差异(maximum mean discrepancy,MMD)距离度量来缩小知识状态领域分布间的距离。
本发明实施例中,将目标领域数据输入至训练好的源领域的知识追踪模型中得到学生的知识状态,再计算最大均值差异距离。
最大均值差异距离度量形式化定义为:
Figure BDA0002434741940000062
其中,
Figure BDA0002434741940000063
Figure BDA0002434741940000064
分别表示通过源领域数据和目标领域数据计算的学生的知识状态,
Figure BDA0002434741940000065
是将目标领域数据输入至训练好的源领域的知识追踪模型中得到,nS、nT分别表示源领域、目标领域的数据量;函数
Figure BDA0002434741940000067
是从原特征空间到再生核希尔伯特空间的映射;通过最小化MMD距离可以缩小两个领域的差异。
则领域自适应的知识追踪总的目标函数表示为:
Figure BDA0002434741940000066
其中,γ是一个正则化系数,表示最大均值差异距离度量的重要程度。
这一部分将更新源领域的知识追踪模型中的,自编码器、两个神经网络与长短期记忆网络。
2)再通过微调技术使得不同领域模型输出一致。
本发明实施例中,将通过源领域数据集训练好的知识追踪模型的输出层去掉,固定输出层前的所有参数,更换一个与目标领域适配的输出层,利用目标领域数据集来训练这个新的输出层。
本领域技术人员可以理解,数据集中的数据都是带标签的数据,在训练阶段暂不考虑目标领域数据的标签,模型训练完毕后,可以利用目标领域数据集及对应的标签进行模型验证与测试。
本发明实施例上述方方案,运用深度学习和迁移学习的方法,能够将源领域训练好的知识追踪模型迁移到目标领域中去,解决了领域数量多需要训练大量模型的问题,同时也解决了领域数据量少无法训练得到一个可靠知识追踪模型的问题。
本发明另一实施例还提供一种个性化习题推荐方法,该方法利用前述的领域自适应的深度知识追踪方法实现学生的知识追踪,再根据知识追踪结果生成习题列表,并推荐给相应学生。
本发明实施例提供的个性化习题推荐方法,可以给学生推荐合适的练习题,来加强学生在知识点或者答题技巧上的熟练度,给学生提供个性化的测试方案。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例可以通过软件实现,也可以借助软件加必要的通用硬件平台的方式来实现。基于这样的理解,上述实施例的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求书的保护范围为准。

Claims (10)

1.一种领域自适应的深度知识追踪方法,其特征在于,包括:
获取学生的历史答题记录数据与相应的习题数据构成的数据集,并通过训练的自编码器,将数据划分为源领域和目标领域数据;
对于源领域数据,使用深度学习方法训练源领域的知识追踪模型;
根据源领域的知识追踪模型,结合目标领域数据使用迁移学习方法实现源领域到目标领域的迁移,从而实现目标领域数据的知识追踪。
2.根据权利要求1所述的一种领域自适应的深度知识追踪方法,其特征在于,通过训练的自编码器,将数据划分为源领域和目标领域数据包括:
通过一个标准化单元,将数据使用统一的数学形式表示;学生的历史答题记录数据表示为:
Figure FDA0002434741930000011
其中
Figure FDA0002434741930000012
作为一条答题记录,包含第t道习题与相应的得分rt,t=1,2,...,T,T为习题总数;习题数据记为X={x1,x2,...,xT},xt表示第t道习题的文本,xt=(w1,w2,...,wL),,wl表示习题文本中的第l个词,l=1,2,...,L,L表示文本的长度;
通过最小化重构误差,共同预训练一个自编码器,重构误差定义为:
Figure FDA0002434741930000013
其中,
Figure FDA0002434741930000014
表示wl的重构结果,
Figure FDA0002434741930000015
表示x的重构结果;
最小化如下目标函数,从而在数据集中筛选出一部分数据,构成源领域数据集
Figure FDA00024347419300000121
剩余数据则为目标领域数据集
Figure FDA0002434741930000017
目标函数定义为:
Figure FDA0002434741930000018
其中,
Figure FDA0002434741930000019
Figure FDA00024347419300000110
分别表示源领域和目标领域的数据,
Figure FDA00024347419300000111
Figure FDA00024347419300000112
表示对应的重构数据,ns、nT分别表示源领域、目标领域的数据量,t、t′各自表示源领域和目标领域的习题序号;
Figure FDA00024347419300000113
是一个指示器,它的每个元素
Figure FDA00024347419300000114
表示源领域的数据
Figure FDA00024347419300000115
选择还是不选择,1表示选择,0表示不选择;
Figure FDA00024347419300000116
Figure FDA00024347419300000117
都是通过前面的式子
Figure FDA00024347419300000118
计算得到;π′e、πd′为自编码器中的编码器、解码器;
Figure FDA00024347419300000119
表示正则化项,定义为:
Figure FDA00024347419300000120
其中,λ是正则化系数;
Figure FDA0002434741930000021
的取值是根据重构误差来决定:
Figure FDA0002434741930000022
3.根据权利要求1所述的一种领域自适应的深度知识追踪方法,其特征在于,
源领域的知识追踪模型包括:自编码器、两个神经网络、长短期记忆网络、以及线性层;
自编码器是在习题数据上通过无监督的方式训练得到,利用自编码器对习题数据的编码结果来表示相应习题;自编码器训练完毕后,对于输入的第t道习题的文本xt,获得对应的编码信息qt,对应的习题得分rt用1表示答对,0表示答错;通对习题表征qt拼接一个零向量:
Figure FDA0002434741930000023
其中,
Figure FDA0002434741930000024
是拼接操作,拼接两个向量,0=(0,0,...,0)是一个零向量,所有的元素全都为零;
采用一个长短期记忆网络,每一时刻输入一个答题记录
Figure FDA0002434741930000025
获得对应时刻的状态ht
Figure FDA0002434741930000026
Figure FDA0002434741930000027
Figure FDA0002434741930000028
Figure FDA0002434741930000029
ht=ottanh(ct)
其中,i*,f*,c*,o*分别表示循环神经网络中的输入门、遗忘门、记忆单元和输出门,W*,b*表示相应门中的权重与偏置项;
同时,结合qt,引入猜测率和失误率两个特征进行知识追踪,描述为:
st=S(qt)
gt=G(qt)
其中,S和G分别表示学习失误率和猜测率的两个神经网络;
再结合失误率和猜测率,获得学生的知识状态:
Figure FDA00024347419300000210
其中,符号
Figure FDA00024347419300000211
表示向量按元素乘;
基于学生的知识状态,通过一个线性层来预测相应学生未来在习题上的表现情况:
Figure FDA00024347419300000212
yt=sigmoid(Wout·αt+bout)
其中,αt表示adaptation函数的输出,Θadp表示adaptation函数的参数;yt表示sigmoid函数输出的预测结果,Wout、bout分别表示sigmoid函数的权值和偏置;
训练源领域的知识追踪模型的目标函数,定义为:
Figure FDA0002434741930000031
其中,n表示学生的数目,
Figure FDA0002434741930000032
为知识追踪模型预测的学生i在第t个习题上的得分,函数δ(·)表示将习题
Figure FDA0002434741930000033
转换为其索引值i,l(x,y)是一个函数,x与y相同则函数输出为1,否则输出为0。
4.根据权利要求3所述的一种领域自适应的深度知识追踪方法,其特征在于,自编码器表示为:
encoder:q=πe(x)
decoder:
Figure FDA0002434741930000034
其中,πe、πd分别表示自编码器中的编码器、解码器;q表示习题的编码信息,x表示相应习题的文本,
Figure FDA0002434741930000035
表示通过自编码器重构的习题文本得到的习题文本;通过
Figure FDA0002434741930000036
与x之间的重构误差来训练自编码器。
5.根据权利要求4所述的一种领域自适应的深度知识追踪方法,其特征在于,编码器πe采用双向的LSTM模型实现,双向的LSTM模型表示为:
Figure FDA0002434741930000037
Figure FDA0002434741930000038
其中,
Figure FDA0002434741930000039
Figure FDA00024347419300000310
是正反两个方向的LSTM模型的输出,wl表示第l个输入的单词,
Figure FDA00024347419300000311
Figure FDA00024347419300000312
分别是正反两个LSTM模型的待学习参数;
将正反两个方向的LSTM模型的输出拼接成一个向量:
Figure FDA00024347419300000313
通过池化操作获得习题表示qt,qt中的每一个元素的获取方法表示为:
qti=max(η1i,η2i,...,ηLi)
其中,i表示第i个维度。
6.根据权利要求4所述的一种领域自适应的深度知识追踪方法,其特征在于,解码器πd采用LSTM模型实现,表示为:
Figure FDA00024347419300000314
Figure FDA0002434741930000041
其中,
Figure FDA0002434741930000042
表示LSTM模型的输出,
Figure FDA0002434741930000043
Wdec和bdec都是LSTM模型的参数。
7.根据权利要求3所述的一种领域自适应的深度知识追踪方法,其特征在于,所述使用迁移学习方法实现源领域到目标领域的迁移,从而实现目标领域数据的知识追踪包括:
基于训练好的源领域的知识追踪模型,利用最大均值差异缩小知识状态分布间的距离,来更新源领域的知识追踪模型中非输出层;
通过微调技术适配不同领域输出维度,从而更新源领域的知识追踪模型中的输出层。
8.根据权利要求7所述的一种领域自适应的深度知识追踪方法,其特征在于,基于训练好的源领域的知识追踪模型,利用最大均值差异缩小知识状态分布间的距离,来更新源领域的知识追踪模型中非输出层包括:
将目标领域数据输入至训练好的源领域的知识追踪模型中得到学生的知识状态
Figure FDA0002434741930000044
再计算最大均值差异距离:
Figure FDA0002434741930000045
其中,
Figure FDA0002434741930000046
Figure FDA0002434741930000047
分别表示通过源领域数据和目标领域数据计算的学生的知识状态,ns、nT分别表示源领域、目标领域的数据量;函数
Figure FDA0002434741930000048
是从原特征空间到再生核希尔伯特空间的映射;
则领域自适应的知识追踪总的目标函数表示为:
Figure FDA0002434741930000049
其中,γ是一个正则化系数,表示最大均值差异距离度量的重要程度;
Figure FDA00024347419300000410
表示训练源领域的知识追踪的目标函数。
9.根据权利要求7所述的一种领域自适应的深度知识追踪方法,其特征在于,所述通过微调技术适配不同领域输出维度,从而更新源领域的知识追踪模型中的输出层包括:
将通过源领域数据集训练好的模型的知识追踪输出层去掉,固定输出层前的所有参数,更换一个与目标领域适配的输出层,利用目标领域数据集来训练这个新的输出层。
10.一种个性化习题推荐方法,其特征在于,利用权利要求1~9任一项所述的领域自适应的深度知识追踪方法实现学生的知识追踪,根据知识追踪结果生成习题列表,并推荐给相应学生。
CN202010248722.4A 2020-04-01 2020-04-01 领域自适应的深度知识追踪及个性化习题推荐方法 Pending CN111444432A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010248722.4A CN111444432A (zh) 2020-04-01 2020-04-01 领域自适应的深度知识追踪及个性化习题推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010248722.4A CN111444432A (zh) 2020-04-01 2020-04-01 领域自适应的深度知识追踪及个性化习题推荐方法

Publications (1)

Publication Number Publication Date
CN111444432A true CN111444432A (zh) 2020-07-24

Family

ID=71652708

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010248722.4A Pending CN111444432A (zh) 2020-04-01 2020-04-01 领域自适应的深度知识追踪及个性化习题推荐方法

Country Status (1)

Country Link
CN (1) CN111444432A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112015780A (zh) * 2020-08-24 2020-12-01 上海松鼠课堂人工智能科技有限公司 基于深度学习的命题智能分析处理方法和***
CN112182308A (zh) * 2020-09-29 2021-01-05 华中师范大学 基于多热编码的多特征融合深度知识追踪方法及***
CN112232430A (zh) * 2020-10-23 2021-01-15 浙江大华技术股份有限公司 神经网络模型测试方法、装置、存储介质及电子装置
CN112949929A (zh) * 2021-03-15 2021-06-11 华中师范大学 一种基于协同嵌入增强题目表示的知识追踪方法及***
CN112990464A (zh) * 2021-03-12 2021-06-18 东北师范大学 一种知识追踪方法及***
CN113094351A (zh) * 2021-03-26 2021-07-09 鹏城实验室 一种生产过程知识挖掘与迁移方法、智能终端及存储介质
CN117131022A (zh) * 2023-09-25 2023-11-28 广州东方电力有限公司 一种电力信息***的异构数据迁移方法
CN117743699A (zh) * 2024-02-20 2024-03-22 山东省计算中心(国家超级计算济南中心) 一种基于dkt与汤普森采样算法的习题推荐方法及***

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180357538A1 (en) * 2017-06-09 2018-12-13 Korea Advanced Institute Of Science And Technology Electronic apparatus and method for generating trained model
CN109902298A (zh) * 2019-02-13 2019-06-18 东北师范大学 一种自适应学***估测方法
CN110428010A (zh) * 2019-08-05 2019-11-08 中国科学技术大学 知识追踪方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180357538A1 (en) * 2017-06-09 2018-12-13 Korea Advanced Institute Of Science And Technology Electronic apparatus and method for generating trained model
CN109902298A (zh) * 2019-02-13 2019-06-18 东北师范大学 一种自适应学***估测方法
CN110428010A (zh) * 2019-08-05 2019-11-08 中国科学技术大学 知识追踪方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
SONG CHENG, QI LIU, ENHONG CHEN: ""Domain Adaption for Knowledge Tracing"", 《ARXIV》 *

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112015780B (zh) * 2020-08-24 2021-06-01 上海松鼠课堂人工智能科技有限公司 基于深度学习的命题智能分析处理方法和***
CN112015780A (zh) * 2020-08-24 2020-12-01 上海松鼠课堂人工智能科技有限公司 基于深度学习的命题智能分析处理方法和***
CN112182308A (zh) * 2020-09-29 2021-01-05 华中师范大学 基于多热编码的多特征融合深度知识追踪方法及***
CN112232430A (zh) * 2020-10-23 2021-01-15 浙江大华技术股份有限公司 神经网络模型测试方法、装置、存储介质及电子装置
CN112990464A (zh) * 2021-03-12 2021-06-18 东北师范大学 一种知识追踪方法及***
CN112949929B (zh) * 2021-03-15 2022-06-07 华中师范大学 一种基于协同嵌入增强题目表示的知识追踪方法及***
CN112949929A (zh) * 2021-03-15 2021-06-11 华中师范大学 一种基于协同嵌入增强题目表示的知识追踪方法及***
CN113094351A (zh) * 2021-03-26 2021-07-09 鹏城实验室 一种生产过程知识挖掘与迁移方法、智能终端及存储介质
CN113094351B (zh) * 2021-03-26 2024-02-06 鹏城实验室 一种工业自动化生产过程知识挖掘与迁移方法、智能终端及存储介质
CN117131022A (zh) * 2023-09-25 2023-11-28 广州东方电力有限公司 一种电力信息***的异构数据迁移方法
CN117131022B (zh) * 2023-09-25 2024-03-29 广州东方电力有限公司 一种电力信息***的异构数据迁移方法
CN117743699A (zh) * 2024-02-20 2024-03-22 山东省计算中心(国家超级计算济南中心) 一种基于dkt与汤普森采样算法的习题推荐方法及***
CN117743699B (zh) * 2024-02-20 2024-05-14 山东省计算中心(国家超级计算济南中心) 一种基于dkt与汤普森采样算法的习题推荐方法及***

Similar Documents

Publication Publication Date Title
CN111444432A (zh) 领域自适应的深度知识追踪及个性化习题推荐方法
CN110264091B (zh) 学生认知诊断方法
CN110929515B (zh) 基于协同注意力和自适应调整的阅读理解方法及***
Zhao et al. A memory-augmented neural model for automated grading
CN111724083A (zh) 金融风险识别模型的训练方法、装置、计算机设备及介质
Yeung et al. Incorporating features learned by an enhanced deep knowledge tracing model for stem/non-stem job prediction
US20140272914A1 (en) Sparse Factor Analysis for Learning Analytics and Content Analytics
CN112257966B (zh) 模型处理方法、装置、电子设备及存储介质
CN111047482B (zh) 基于层次记忆网络的知识追踪***及方法
CN111538868A (zh) 知识追踪方法及习题推荐方法
CN114254208A (zh) 薄弱知识点的识别方法、学习路径的规划方法与装置
CN112184089B (zh) 试题难度预测模型的训练方法、装置、设备及存储介质
CN114299349B (zh) 一种基于多专家***和知识蒸馏的众包图像学习方法
CN110377707B (zh) 基于深度项目反应理论的认知诊断方法
CN114254127A (zh) 学生能力画像方法、学习资源推荐方法及装置
CN114722182A (zh) 一种基于知识图谱的在线课推荐方法及***
CN112231491A (zh) 基于知识结构的相似试题识别方法
CN116012627A (zh) 一种基于超图聚类的因果时序双增强知识追踪方法
CN114971066A (zh) 融合遗忘因素和学习能力的知识追踪方法及***
CN113283488B (zh) 一种基于学习行为的认知诊断方法及***
Peeperkorn et al. Can recurrent neural networks learn process model structure?
CN114298299A (zh) 基于课程学习的模型训练方法、装置、设备及存储介质
CN115510932A (zh) 一种模型训练方法、装置、电子设备和存储介质
CN116484868A (zh) 一种基于生成扩散模型的跨域命名实体识别方法及装置
Arifin et al. Automatic essay scoring for Indonesian short answers using siamese Manhattan long short-term memory

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200724

RJ01 Rejection of invention patent application after publication