CN109272164A - 学习行为动态预测方法、装置、设备及存储介质 - Google Patents

学习行为动态预测方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN109272164A
CN109272164A CN201811144725.2A CN201811144725A CN109272164A CN 109272164 A CN109272164 A CN 109272164A CN 201811144725 A CN201811144725 A CN 201811144725A CN 109272164 A CN109272164 A CN 109272164A
Authority
CN
China
Prior art keywords
learning behavior
user
data
learning
dynamic prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811144725.2A
Other languages
English (en)
Other versions
CN109272164B (zh
Inventor
李秀
刘志鑫
门畅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Graduate School Tsinghua University
Original Assignee
Shenzhen Graduate School Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Graduate School Tsinghua University filed Critical Shenzhen Graduate School Tsinghua University
Priority to CN201811144725.2A priority Critical patent/CN109272164B/zh
Publication of CN109272164A publication Critical patent/CN109272164A/zh
Application granted granted Critical
Publication of CN109272164B publication Critical patent/CN109272164B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • G06Q50/205Education administration or guidance

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Educational Technology (AREA)
  • Biophysics (AREA)
  • Educational Administration (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种学习行为动态预测方法、装置、设备及存储介质,该预测方法包括步骤:基于用户在历史时间段的学习行为数据,采用长短时记忆循环神经网络作为预测模型进行训练,得到最优模型;获取该用户在第一时间段的学习行为数据,基于该最优模型,输出预测结果。本发明通过采用LSTM‑RNN作为预测模型来预测输出结果,能提高预测的准确度,并采用交互性可视分析方式展示用户信息数据,方便在***的后台查看、分析用户数据信息,从而帮助教师能及时、直观地获知数据分析结果,进而实现教学过程的“闭环”。本发明可广泛应用于各种学习行为预测***。

Description

学习行为动态预测方法、装置、设备及存储介质
技术领域
本发明涉及计算机数据分析领域,尤其涉及一种学习行为动态预测方法、装置、设备及存储介质。
背景技术
MOOC:massive open online courses的缩写,大规模开放式在线课程;
LSTM:Long Short-Term Memory的缩写,长短时记忆;
LSTM-RNN:Long Short-Term Memory-Recurrent Neural Networks的缩写,长短时记忆循环神经网络;
Adam算法:Adam这个名字来源于adaptive moment estimation,自适应矩估计,这是一种基于一阶梯度来优化随机目标函数的算法。
Logistic Sigmoid函数:取值范围为(0,1),在深度学习中经常用作激活函数,函数表达式为
AUC:Area Under Curve的缩写,ROC曲线下的面积;AUC值是一个概率值,当随机挑选一个正样本以及一个负样本,当前的分类算法根据计算得到的分值将这个正样本排在负样本前面的概率就是AUC值;
TensorFlow:是将复杂的数据结构传输至人工智能神经网中进行分析和处理过程的***;
Django:Django是一个开放源代码的Web应用框架,由Python写成。采用了MVC的框架模式,即模型M,视图V和控制器C;该框架是以比利时的吉普赛爵士吉他手DjangoReinhardt来命名;
SVG:Scalable Vector Graphics的缩写,指可伸缩矢量图形,是使用XML来描述二维图形和绘图程序的语言;
随机森林:随机森林指的是利用多棵树对样本进行训练并预测的一种分类器。
逻辑斯特回归模型:是一种分类模型,由条件概率分布表示,形式为参数化的逻辑斯谛分布。
自2012年起,MOOC开始在世界范围内获得了广泛得关注度。与之前的在线教育模式相比,MOOC为教师和用户提供了交互平台,同时增加了作业、考试等环节,更加贴近传统课堂的教学模式,因此MOCC很受用户的欢迎。
在MOOC课程中,线上教学形式和过多的学生数量使得教师很难收集学生的反馈。MOOC平台往往会记录用户的学习行为、收集日志数据,通过对这些数据的分析,能预测用户在下周会不会继续参与学习,以帮助MOOC达到更好的教学效果和提高用户的留存率,同时,数据分析结果可以辅助教师或者***对可能退课的用户进行干预,降低用户退课的概率。
对MOOC数据的研究已成为近年来的热点,现有的研究中存在如下问题:
1.预测准确度不高;
2.缺乏可视化的解决方案,不方便在MOCC后台进行管理。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本发明的一个目的是提供一种学习行为动态预测方法,能够提高预测准确度,并采用交互性可视分析方式展示用户信息数据。
本发明所采用的技术方案是:提供一种学习行为动态预测方法,该方法包括:基于用户在历史时间段的学习行为数据,采用长短时记忆循环神经网络作为预测模型进行训练,得到最优模型;获取该用户在第一时间段的学习行为数据,基于该最优模型,输出预测结果。
进一步地,该基于用户在历史时间段的历史学习行为数据,采用长短时记忆循环神经网络作为预测模型进行训练,得到最优模型的步骤包括:获取用户在历史时间段的学习行为数据;基于该学习行为数据提取学习特征向量[x1,x2,..,xK]和标签[y1,y2,..,yK],其中,xi为用户在所述历史时间段中第i个单位时间的学习行为数据对应的学习特征向量,yi用于表示用户在第i+1个单位时间是否有学习行为,如有学习行为,则yi=1,反之,则yi=0;其中,i=1、2、3······K,K≥1;以学习特征向量[x1,x2,..,xK]为输入,以[y1,y2,..,yK]为标签训练模型,得到该最优模型。
进一步地,该以学习特征向量[x1,x2,..,xK]为输入,[y1,y2,..,yK]为标签训练模型,得到该最优模型的步骤,具体包括:采用5折交叉验证法将多个用户按照4:1的比例分为训练集和验证集,并利用网格搜索方法进行参数调优,得到该最优模型。
进一步地,对该长短时记忆循环神经网络训练时,采用交叉熵函数作为损失函数。
进一步地,对该长短时记忆循环神经网络训练时,采用Adam方法进行参数优化。
进一步地,该参数包括权重向量和偏置向量,该权重向量初始化值为[-0.1,0.1]均匀分布,该偏置向量初始化值为零向量。
进一步地,采用Logistic Sigmoid函数作为该长短时记忆循环神经网络的激活函数。
进一步地,该方法还包括AUC验证步骤:选择至少一组基线模型;分别采用该基线模型和该最优模型对该验证集进行验证,获取各自的评价指标AUC。
进一步地,该方法还包括基于该学习行为数据和预测结果统计分析,得到用户信息数据;采用可视化***展示该用户信息数据。
进一步地,可视化***采用B/S架构实现,采用MySQL数据库存储数据,采用Django框架搭建网站,基于SVG元素在HTML网页中绘制图表。
进一步地,可视化***基于用户信息数据展示的视图包括学生信息视图、活跃日历视图、学习进展分布视图、个人脚印视图。
进一步地,该学生信息视图中采用饼状图来描述用户的性别、年龄或受教育分布。
进一步地,该活跃日历视图为在一个日历图上展示每天的活跃用户人数,该日历图中的每个矩形代表一天,一周内的七天被放置在同一列中,并且以课程资料更新日作为每一列的第一天,矩形颜色的深度与当天的活跃用户人数成正比例关系。
进一步地,该学习进展分布视图中每个用户的学习行为数据采用三个特征展示:作业数占比、累计学习小节占比、视频播放时间占比,并采用不同的颜色标记该用户的预测结果。
进一步地,该个人脚印视图通过在该学习进展分布视图中触发图形元素弹出,该个人脚印视图中采用堆叠柱状图的形式展示用户学习的投入程度,该用户学习的投入程度包括该用户在每周观看视频的个数和提交作业的个数。
本发明所采用的另一技术方案是:提供一种学习行为动态预测装置,该装置包括神经网络模型生成模块和学习行为动态预测模块,该神经网络模型生成模块用于基于用户在历史时间段的学习行为数据,采用长短时记忆循环神经网络作为预测模型进行训练,得到最优模型;该学习行为动态预测模块用于获取该用户在第一时间段的学习行为数据,基于该最优模型,输出预测结果。
进一步地,该装置还包括数据统计分析模型生成模块和可视***生成模块,该数据统计分析模型生成模块用于基于该学习行为数据和预测结果统计分析,得到用户信息数据;该可视***生成模块,用于采用可视化***展示该用户信息数据。
本发明所采用的又一技术方案是:提供一种学习行为动态预测***设备,该设备包括:至少一个处理器;以及与该至少一个处理器通信连接的存储器;其中,该存储器存储有可被该至少一个处理器执行的指令,该指令被该至少一个处理器执行,以使该至少一个处理器能够执行上述的方法。
本发明所采用的再一技术方案是:提供一种计算机可读存储介质,该计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令用于使计算机执行上述的方法。
本发明的有益效果是:
本发明采用长短时记忆循环神经网络作为预测模型进行训练及调优,得到最优模型,克服了现有技术中存在的学习行为预测准确度不高的技术问题,实现了一种预测准确度高的学习行为动态预测方法、装置、设备及存储介质。
此外,本发明还通过采用交互性可视分析方式展示用户信息数据,方便在***的后台查看、分析用户数据信息,从而帮助教师能及时、直观地获知数据分析结果,进而实现教学过程的“闭环”。
本发明可广泛应用于各种学习行为预测***。
附图说明
图1是本发明学习行为动态预测方法的一实施方式的流程示意图;
图2是图1中步骤S11的流程示意图;
图3是本发明学习行为动态预测方法的另一实施方式的流程示意图;
图4是图3实施方式在一应用场景下的流程示意图;
图5是学生信息视图一种实施例的局部示意图;
图6是活跃日历视图一种实施例的局部示意图;
图7(a)和图7(b)分别是学习进展分布视图一种实施例的局部示意图;
图8(a)和图8(b)分别是个人脚印视图一种实施例的局部示意图;
图9是本发明学习行为动态预测装置的一实施方式的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性的劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
请参阅图1,图1是本发明学习行为动态预测方法的一实施方式的流程示意图。该方法包括:
步骤S11:基于用户在历史时间段的学习行为数据,采用长短时记忆循环神经网络作为预测模型进行训练,得到最优模型。
其中,历史时间段可以为上个月、上一学期或上一年度等。该实施例以历史时间段为上一学期为例。
学习行为数据包括三类数据:活动日志、课程结构及个人信息。对于活动日志,本实施例只考虑与学习行为相关的事件类型:视频相关事件和习题相关事件。整理出的日志事件类型如表1所示:
表1日志时间类型
LSTM(长短期记忆网络)模型具体算法是通过三个门实现,每个门的含义是控制信息流入和留出的量。遗忘门表示遗弃哪些历史数据,输入门控制流入细胞状态的信息,输出门决定哪些信息流出。同时前一时刻的信息留出也将作为下一时刻的信息流入部分。因此LSTM模型可以实现长期记忆,且信息在其中流转传输时没有非线性的操作计算因而可以保持稳定不变。
步骤S12:获取用户在第一时间段的学习行为数据,基于最优模型,输出预测结果。
其中,第一时间段相应可以为本月、本学期或本年度。该实施例以第一时间段为本学期为例。
在本实施例中,采用LSTM-RNN模型作为预测模型,预测准确度高。随着用户学习课时的推进,步骤S12迭代进行,从而实现动态输出预测结果。
参阅图2,图2是图1中步骤S11的流程示意图,步骤S11:基于用户在历史时间段的学习行为数据,采用长短时记忆循环神经网络作为预测模型进行训练,得到最优模型具体包括:
S111:获取用户在历史时间段的学习行为数据。
其中,获取用户在历史时间段的学习行为数据的方法参考前述方法。该步骤的历史时间段以上一学期为例。
S112:基于该学习行为数据提取学习特征向量[x1,x2,..,xK]和标签[y1,y2,..,yK],其中,xi为用户在该历史时间段中第i个单位时间的学习行为数据对应的学习特征向量,yi用于表示用户在第i+1个单位时间是否有学习行为,如有学习行为,则yi=1,反之,则yi=0;其中,i=1、2、3······K,K≥1。
其中,以周为时间单位(1周为1个单位时间),若一个学期一门课程的课程周期为T周,对于一个特定的用户,以其第i周的学习行为画像为特征向量,记作xi,则全部T周的特征向量记为[x1,x2,..,xT],将第i+1周是否有学习行为记作yi(若有学习行为则yi=1,无则yi=0),则得到全部T周的标签[y1,y2,..,yT]。
S113:以学习特征向量[x1,x2,..,xK]为输入,以[y1,y2,..,yK]为标签训练模型,得到该最优模型。
其中,随着课程的推进,在第K周时,以截止到当前周次的特征[x1,x2,..,xK]为输入、[y1,y2,..,yK]为标签训练模型。
本实施例中,对所述长短时记忆循环神经网络训练时,采用交叉熵函数作为损失函数,并采用Adam方法进行参数优化,该参数包括权重向量和偏置向量。采用LogisticSigmoid函数作为所述长短时记忆循环神经网络的激活函数,激活函数的取值范围为(0,1),函数表达式为考虑到该函数在0附近接近线性,对应的梯度较大,权重向量的初始值应设在0附近,因此采用[-0.1,0.1]范围内的均匀分布对权重向量和偏执向量进行初始化。长短时记忆循环神经网络的隐藏层和输出层的偏执向量初始化为0。
在本步骤中,具体地,基于深度学习框架Tensorflow实现预测方法,在训练时,采用5折交叉验证法将多个用户按照8:2的比例分为训练集和验证集,并利用网格搜索方法进行参数调优,得到最优模型。
优选地,本步骤还包括AUC验证步骤:选择至少一组基线模型;分别采用该基线模型和该最优模型对该验证集进行验证,获取各自的评价指标AUC。
由于本实施例的预测结果是一个二分类问题,因此选择二分类常用的评价指标AUC来评价模型的优劣。本实施例选取了两种基线模型,分别为逻辑斯特回归模型(LR)和随机森林模型(RF)。如表2所示,表2对比列出了LSTM-RNN和两种基线模型在课程周期内每周的AUC分值。
Week LSTM-RNN LR RF
1 0.52 0.50 0.51
2 0.54 0.52 0.51
3 0.55 0.51 0.52
4 0.60 0.58 0.57
5 0.66 0.62 0.64
6 0.71 0.62 0.67
7 0.73 0.65 0.66
8 0.82 0.66 0.73
9 0.84 0.71 0.72
10 0.87 0.75 0.78
11 0.85 0.70 0.79
12 0.81 0.68 0.73
13 0.84 0.72 0.76
14 0.83 0.69 0.74
表2 LSTM-RNN模型及基线模型AUC值
从表2中可以发现:1)LSTM-RNN的AUC分值最高,表现最好。从第1周开始,LSTM-RNN就取得了最高分值,并且随着课程推进,相对于基线模型的优势变得更加明显;2)在前三周,三种预测方法的AUC分值在0.5~0.6之间,预测结果基本不具有参考价值;3)随着周次增加AUC分值逐渐提高,这是由于随着数据不断累积,可以发现更多学习行为规律,实现更加准确的预测。但在第10周之后,AUC分值就不再提高了,反而有所下降,这可能与课程即将结束有关。
在本实施例中,通过以用户历史时间段的各单位时间的学习特征向量[x1,x2,..,xK]为输入、各单位时间是否进行学习[y1,y2,..,yK]为标签训练模型,得到最优模型。并对模型的优劣采用AUC值进行评价,从而证明所训练的LSTM-RNN模型为最优模型。
请参阅图3,图3是本发明学习行为动态预测方法的另一实施方式的流程示意图。该方法包括:
步骤S21:基于用户在历史时间段(上学期)的学习行为数据,采用长短时记忆循环神经网络作为预测模型进行训练,得到最优模型。
其中,步骤S21的实施方法同步骤S11,在此不作赘述。
步骤S22:获取用户在第一时间段的学习行为数据,基于最优模型,输出预测结果。
其中,步骤S22的实施方法同步骤S12,在此不作赘述。
步骤S23:获取用户在第一时间段的学习行为数据,基于最优模型,输出预测结果。
其中,步骤S23的实施方法同步骤S13,在此不作赘述。
步骤S24:基于学习行为数据和预测结果统计分析,得到用户信息数据。
其中,用户信息数据包括学生信息视图、活跃日历视图、学习进展分布视图、个人脚印视图。
步骤S25:采用可视化***展示用户信息数据。
优选地,可视化***采用B/S架构实现,采用MySQL数据库存储数据,采用Django框架搭建网站,基于SVG元素在HTML网页中绘制图表。
可选地,步骤S24和步骤S25可穿插在步骤S21、步骤S22或步骤S23任一步骤之后。
在本实施例中,设计了一个交互性可视分析解决方案,可以同时展示历史数据统计结果和预测结果,提供给***后台或教师进行辅助判断。
请一并参阅图3至图8,如图4所示,图4是图3实施方式在一应用场景下的流程示意图。如图4所示,提取用户上一学期某一门课程的全课程周期学习行为数据,假设该课程的全部周期为N周,进行数据预处理,得到全部N周的学习行为特征向量。在第K周时,以学习特征向量[x1,x2,..,xK]为输入,以[y1,y2,..,yK](K>=1)为标签进行模型训练及调优,从而获得最优模型。当课程进展到本学期时,截止到当前日期,假设课程进展到第i周,获取用户本学期该课程的学习行为数据(现有数据),进行数据预处理,提取得到学习行为向量[x1,x2,..,xi](学习行为画像),以学习行为向量[x1,x2,..,xi]作为输入,[y1,y2,..,yi]作为标签,基于最优模型,从而预测用户在第i+1周(下周)是否学习(预测结果)。如图4所示,该应用场景还基于学习行为数据和预测结果统计分析,得到用户信息数据,并采用可视化***展示用户信息数据。可视化***基于用户信息数据展示的视图包括学生信息视图、活跃日历视图、学习进展分布视图、个人脚印视图。其中,学生信息视图可根据学习行为数据生成,活跃日历视图、学习进展分布视图、个人脚印视图可根据学习行为数据和预测结果统计分析生成。
如图5所示,图5是图4中学生信息视图的局部示意图。学生信息视图用于展示学习者的个人背景,满足教学团队对于“谁在学习我的课程”的好奇心。在该学生信息视图中,采用饼状图来描述用户的性别、年龄或受教育分布。图5所示为《财务分析与决策》课程的学生信息视图,从中可以看出有超过一版学生是男性(Male),几乎一半的学生是本科生(Bachelor),有超过四分之一的学生年龄在25岁到30岁之间。
如图6所示,图6是图4中活跃日历视图的局部示意图。活跃日历视图为在一个日历图上展示每天的活跃用户人数,该日历图中的每个矩形代表一天,一周内的七天被放置在同一列中(周五到下一周的周四分别用F、S、S、M、T、W、T表示),并且以课程资料更新日作为每一列的第一天,矩形颜色的深度与当天的活跃用户人数成正比例关系,颜色越深,表明活跃人数越多。由于空间狭小,还提供了悬浮提示框来展示具体数字。当鼠标悬浮在某一个矩形上方时,当天日期、周次、活跃人数会显示在提示框中,其颜色也会在图例中被强调,以显示该天的活跃人数在历史上的相对水平。具体如图6所示,通过移动两个手柄,在图例上选择某个范围,活跃人数在范围内的日期会以对应的颜色显示,而活跃人数在选择范围外的日期会显示为白色。
如图7(a)和图7(b)所示,图7(a)和图7(b)分别是图4中学习进展分布视图的局部示意图。学习进展分布视图用于看到全部学生在过去的每一周内的学习进展。在该学习进展分布视图中,每个用户的学习行为数据采用三个特征展示:作业数占比、累计学习小节占比、视频播放时间占比,并采用不同的颜色标记该用户的预测结果。
具体如图7(a)和图7(b)所示,学生在一周内的学***面上的圆,在(x,y)处的一个圆代表着累计学习小节占比x%,作业数占比y%的一个学生。圆的半径与视频播放时间比例正相关。颜色则表示对学生下周是否学习的预测结果,红色代表下周有学习行为,蓝色代表下周无学习行为。当前周次和本周活跃人数在背景中以较大字号标注,非常明显。当鼠标悬浮在圆上时,会出现一个悬浮提示框展示该学生当前的个人学习行为画像及预测结果。
在散点图右侧有一个时间线控制工具,用户通过单击时间线上的对应节点选择散点图所展示的周次。为了展示用户学习进展随时间的变化情况,时间线设计了播放功能。单击时间线下方的播放按钮,左侧的散点图会依次从第一周开始变化到当前的最后一周。
在散点图右上角提供了一个包含放大、还原、下载三个功能的工具箱,用户单击放大按钮后,可以在散点图中选择一个矩形区域,如图7(a)和图7(b)所示,选中后坐标轴的范围将被设定为该矩形区域的数值范围。这样,矩形区域就被放大了,在举行区域内的圆将变得分散,可以被更加清晰的观察到并选择,也可以下载当前周次的散点图。对于散点图的重叠问题采用两个技巧来缓解:第一个技巧是在横纵坐标上叠加一个很小的随机分量,这使得有同样的累计学习小节占比的学习者不会完全重叠。尽管这会影响圆的位置的准确性,但并不会影响圆的大致位置,也不会影响对于全体学生学习进展分布的整体印象,用户仍然可以通过未重叠的区域来选中该学习者各项特征的准确值。第二个技巧就是将圆的透明度设置为0.5,这会使重叠变成可见的。
如图8(a)和图8(b)所示,图8(a)和图8(b)是图4中个人脚印视图的局部示意图。个人脚印视图通过在图7(a)和图7(b)的学习进展分布视图中触发图形元素弹出,该个人脚印视图中采用堆叠柱状图的形式展示用户学习的投入程度,该用户学习的投入程度包括该用户在每周观看视频的个数和提交作业的个数。
如图8(a)所示,当鼠标悬停在某一个柱上方时,将会出现一个悬浮提示框展示用户在本周的动态特征。为了帮助用户了解学习者活跃程度的变化趋势,对观看视频个数和提交作业个数之和进行三次多项式拟合,将拟合曲线与柱状图叠加显示。如图8(b)所示,与学习进展分布视图一样,在右上角提供了一个工具箱,除了放大、还原、下载功能外,还增加了一个显示数据功能。通过单击“显示数据”按钮,可以进入数据视图,以表格形式列出柱状图展示的数据。
在该应用场景中,对数据分析的结果设计可视化的展现方式,并能可视分析。数据可视化将数据以用户易于感知的形式呈现,倾向于尽可能完整、真实、客观地呈现全部数据,甚至能够增强其中的某些细节。可视分析指的是在将数据可视化的基础上,通过提供交互性工具辅助用户自主探索并分析数据。
请参阅图9,图9是本发明学习行为动态预测装置的一实施方式的结构示意图。如图9所示,该学习行为动态预测装置包括神经网络模型生成模块90、学习行为动态预测模块91、数据统计分析模型生成模块92及可视***生成模块93。
神经网络模型生成模块90用于基于用户在历史时间段的学习行为数据,采用长短时记忆循环神经网络作为预测模型进行训练,得到最优模型。学习行为动态预测模块91用于用于获取该用户在第一时间段的学习行为数据,基于该最优模型,输出预测结果。数据统计分析模型生成模块92用于基于该学习行为数据和预测结果统计分析,得到用户信息数据。可视***生成模块93用于采用可视化***展示该用户信息数据。
其中,模块90和模块91一起成为最小工作单元,能够被执行以实现上述的学习行为动态预测方法,具体的模块90和模块91的工作方法可参见上述,在此不再赘述。模块92和模块93被执行以实现可视化分析方式展示用户数据,其工作方法也一并参见上述,在此不再重复。
本发明还提供一种学习行为动态预测***设备,该设备包括:至少一个处理器;以及与该至少一个处理器通信连接的存储器;其中,该存储器存储有可被该至少一个处理器执行的指令,该指令被该至少一个处理器执行,以使该至少一个处理器能够执行如上述的预测方法。
本发明还提供一种计算机可读存储介质,该计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令用于使计算机执行上述的预测方法。
综上所述,区别于现有技术的情况,本发明通过采用LSTM-RNN作为预测模型来预测输出结果,能提高预测的准确度,并采用交互性可视分析方式展示用户信息数据,方便在***的后台查看、分析用户数据信息,从而帮助教师能及时、直观地获知数据分析结果,进而实现教学过程的“闭环”。
以上是对本发明的较佳实施进行了具体说明,但本发明创造并不限于所述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。

Claims (19)

1.一种学习行为动态预测方法,其特征在于,包括:
基于用户在历史时间段的学习行为数据,采用长短时记忆循环神经网络作为预测模型进行训练,得到最优模型;
获取所述用户在第一时间段的学习行为数据,基于所述最优模型,输出预测结果。
2.根据权利要求1所述的学习行为动态预测方法,其特征在于,所述基于用户在历史时间段的历史学习行为数据,采用长短时记忆循环神经网络作为预测模型进行训练,得到最优模型的步骤包括:
获取用户在所述历史时间段的学习行为数据;
基于所述学习行为数据提取学习特征向量[x1,x,…,xK]和标签[y1,y,…,yK],其中,xi为用户在所述历史时间段中第i个单位时间的学习行为数据对应的学习特征向量,yi用于表示用户在第i+1个单位时间是否有学习行为,如有学习行为,则yi=1,反之,则yi=0;其中,i=1、2、3……K,K≥1;
以学习特征向量[x1,x2,…,xK]为输入,以[y1,y2,…,yK]为标签训练模型,得到所述最优模型。
3.根据权利要求2所述的学习行为动态预测方法,其特征在于,所述以学习特征向量[x1,x2,…,xK]为输入,[y1,y2,…,yK]为标签训练模型,得到所述最优模型的步骤,具体包括:
采用5折交叉验证法将多个用户按照4∶1的比例分为训练集和验证集,并利用网格搜索方法进行参数调优,得到所述最优模型。
4.根据权利要求2或3所述的学习行为动态预测方法,其特征在于,对所述长短时记忆循环神经网络训练时,采用交叉熵函数作为损失函数。
5.根据权利要求2或3所述的学习行为动态预测方法,其特征在于,对所述长短时记忆循环神经网络训练时,采用Adam方法进行参数优化。
6.根据权利要求5所述的学习行为动态预测方法,其特征在于,所述参数包括权重向量和偏置向量,所述权重向量初始化值为[-0.1,0.1]均匀分布,所述偏置向量初始化值为零向量。
7.根据权利要求2或3所述的学习行为动态预测方法,其特征在于,采用LogisticSigmoid函数作为所述长短时记忆循环神经网络的激活函数。
8.根据权利要求1、2、3或6所述的学习行为动态预测方法,其特征在于,还包括AUC验证步骤:
选择至少一组基线模型;
分别采用所述基线模型和所述最优模型对所述验证集进行验证,获取各自的评价指标AUC值。
9.根据权利要求1所述的学习行为动态预测方法,其特征在于,还包括:
基于所述学习行为数据和预测结果统计分析,得到用户信息数据;
采用可视化***展示所述用户信息数据。
10.根据权利要求9所述的学习行为动态预测方法,其特征在于,所述可视化***采用B/S架构实现,采用MySQL数据库存储数据,采用Django框架搭建网站,基于SVG元素在HTML网页中绘制图表。
11.根据权利要求9或10所述的学习行为动态预测方法,其特征在于,所述可视化***基于用户信息数据展示的视图包括学生信息视图、活跃日历视图、学习进展分布视图、个人脚印视图。
12.根据权利要求11所述的学习行为动态预测方法,其特征在于,所述学生信息视图中采用饼状图来描述用户的性别、年龄或受教育分布。
13.根据权利要求11所述的学习行为动态预测方法,其特征在于,所述活跃日历视图为在一个日历图上展示每天的活跃用户人数,所述日历图中的每个矩形代表一天,一周内的七天被放置在同一列中,并且以课程资料更新日作为每一列的第一天,矩形颜色的深度与当天的活跃用户人数成正比例关系。
14.根据权利要求11所述的学习行为动态预测方法,其特征在于,所述学习进展分布视图中每个用户的学习行为数据采用三个特征展示:作业数占比、累计学习小节占比、视频播放时间占比,并采用不同的颜色标记该用户的预测结果。
15.根据权利要求11所述的学习行为动态预测方法,其特征在于,所述个人脚印视图通过在所述学习进展分布视图中触发图形元素弹出,所述个人脚印视图中采用堆叠柱状图的形式展示用户学习的投入程度,所述用户学习的投入程度包括所述用户在每周观看视频的个数和提交作业的个数。
16.一种学习行为动态预测装置,其特征在于,包括:
神经网络模型生成模块,用于基于用户在历史时间段的学习行为数据,采用长短时记忆循环神经网络作为预测模型进行训练,得到最优模型;
学习行为动态预测模块,用于获取所述用户在第一时间段的学习行为数据,基于所述最优模型,输出预测结果。
17.根据权利要求16所述的学习行为动态预测装置,其特征在于,还包括:
数据统计分析模型生成模块,用于基于所述学习行为数据和预测结果统计分析,得到用户信息数据;
可视***生成模块,用于采用可视化***展示所述用户信息数据。
18.一种学习行为动态预测***设备,其特征在于,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至15任一项所述的方法。
19.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如权利要求1至15任一项所述的方法。
CN201811144725.2A 2018-09-29 2018-09-29 学习行为动态预测方法、装置、设备及存储介质 Active CN109272164B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811144725.2A CN109272164B (zh) 2018-09-29 2018-09-29 学习行为动态预测方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811144725.2A CN109272164B (zh) 2018-09-29 2018-09-29 学习行为动态预测方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN109272164A true CN109272164A (zh) 2019-01-25
CN109272164B CN109272164B (zh) 2021-09-28

Family

ID=65198830

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811144725.2A Active CN109272164B (zh) 2018-09-29 2018-09-29 学习行为动态预测方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN109272164B (zh)

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109816178A (zh) * 2019-02-21 2019-05-28 四川大学 心理状态预测方法、装置及电子设备
CN109858806A (zh) * 2019-01-30 2019-06-07 网易(杭州)网络有限公司 数据处理的方法、装置、介质和电子设备
CN110059716A (zh) * 2019-03-12 2019-07-26 西北大学 一种cnn-lstm-svm网络模型的构建及mooc辍学预测方法
CN110110939A (zh) * 2019-05-15 2019-08-09 杭州华网信息技术有限公司 基于深度学习学生序列化行为的学业成绩预测预警方法
CN110276246A (zh) * 2019-05-09 2019-09-24 威比网络科技(上海)有限公司 课程指数检测告警方法、装置、电子设备、存储介质
CN110705799A (zh) * 2019-10-10 2020-01-17 北京小米移动软件有限公司 一种智能提示梳洗相关信息的方法、装置及介质
CN111144368A (zh) * 2019-12-31 2020-05-12 重庆和贯科技有限公司 基于长短时记忆神经网络的学生行为检测方法
CN111436939A (zh) * 2020-03-17 2020-07-24 佛山市台风网络科技有限公司 健康监测方法、***、计算机设备及可读存储介质
CN111523738A (zh) * 2020-06-22 2020-08-11 之江实验室 基于用户在线学习行为模式预测学习效果的***及预测方法
CN111950892A (zh) * 2020-08-11 2020-11-17 华中师范大学 一种数据驱动的大学生个性化学习行为预测与干预方法
CN112049624A (zh) * 2019-06-06 2020-12-08 中国石油天然气股份有限公司 油井动态储量的预测方法、装置、设备及存储介质
CN112101553A (zh) * 2020-11-10 2020-12-18 鹏城实验室 网络结构搜索方法及装置、设备、存储介质
CN112137834A (zh) * 2019-06-27 2020-12-29 丰田自动车株式会社 学习***、复健辅助***、方法、程序及学习完毕模型
CN112734105A (zh) * 2021-01-08 2021-04-30 浙江工业大学 一种预防在线教育中辍学行为的方法
CN112825147A (zh) * 2019-11-21 2021-05-21 亿度慧达教育科技(北京)有限公司 学习路径规划方法、装置、设备和存储介质
CN114130038A (zh) * 2021-11-25 2022-03-04 浙江小族智能科技有限公司 游乐车及其控制方法、装置、存储介质、终端
CN114567815A (zh) * 2022-01-20 2022-05-31 清华大学 一种基于预训练的慕课自适应学习***构建方法和装置
CN116227729A (zh) * 2023-03-20 2023-06-06 广州工程技术职业学院 基于机器学习的学习评价方法及装置、设备
CN116362418A (zh) * 2023-05-29 2023-06-30 天能电池集团股份有限公司 一种高端电池智能工厂应用级制造能力在线预测方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130325560A1 (en) * 2012-06-05 2013-12-05 Rank Miner, Inc. System, Method and Apparatus for Voice Analytics of Recorded Audio
CN106886846A (zh) * 2017-04-26 2017-06-23 中南大学 一种基于长短期记忆循环神经网络的银行网点备付金预测方法
CN107180284A (zh) * 2017-07-07 2017-09-19 北京航空航天大学 一种基于学习行为特征的spoc学生每周表现预测方法及装置
CN107423442A (zh) * 2017-08-07 2017-12-01 火烈鸟网络(广州)股份有限公司 基于用户画像行为分析的应用推荐方法及***,储存介质及计算机设备
CN107622329A (zh) * 2017-09-22 2018-01-23 深圳市景程信息科技有限公司 基于多时间尺度长短时记忆神经网络的电力负荷预测方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130325560A1 (en) * 2012-06-05 2013-12-05 Rank Miner, Inc. System, Method and Apparatus for Voice Analytics of Recorded Audio
CN106886846A (zh) * 2017-04-26 2017-06-23 中南大学 一种基于长短期记忆循环神经网络的银行网点备付金预测方法
CN107180284A (zh) * 2017-07-07 2017-09-19 北京航空航天大学 一种基于学习行为特征的spoc学生每周表现预测方法及装置
CN107423442A (zh) * 2017-08-07 2017-12-01 火烈鸟网络(广州)股份有限公司 基于用户画像行为分析的应用推荐方法及***,储存介质及计算机设备
CN107622329A (zh) * 2017-09-22 2018-01-23 深圳市景程信息科技有限公司 基于多时间尺度长短时记忆神经网络的电力负荷预测方法

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109858806A (zh) * 2019-01-30 2019-06-07 网易(杭州)网络有限公司 数据处理的方法、装置、介质和电子设备
CN109816178A (zh) * 2019-02-21 2019-05-28 四川大学 心理状态预测方法、装置及电子设备
CN110059716A (zh) * 2019-03-12 2019-07-26 西北大学 一种cnn-lstm-svm网络模型的构建及mooc辍学预测方法
CN110276246A (zh) * 2019-05-09 2019-09-24 威比网络科技(上海)有限公司 课程指数检测告警方法、装置、电子设备、存储介质
CN110110939A (zh) * 2019-05-15 2019-08-09 杭州华网信息技术有限公司 基于深度学习学生序列化行为的学业成绩预测预警方法
CN112049624B (zh) * 2019-06-06 2024-04-30 中国石油天然气股份有限公司 油井动态储量的预测方法、装置、设备及存储介质
CN112049624A (zh) * 2019-06-06 2020-12-08 中国石油天然气股份有限公司 油井动态储量的预测方法、装置、设备及存储介质
CN112137834A (zh) * 2019-06-27 2020-12-29 丰田自动车株式会社 学习***、复健辅助***、方法、程序及学习完毕模型
CN110705799A (zh) * 2019-10-10 2020-01-17 北京小米移动软件有限公司 一种智能提示梳洗相关信息的方法、装置及介质
CN112825147B (zh) * 2019-11-21 2022-08-26 亿度慧达教育科技(北京)有限公司 学习路径规划方法、装置、设备和存储介质
CN112825147A (zh) * 2019-11-21 2021-05-21 亿度慧达教育科技(北京)有限公司 学习路径规划方法、装置、设备和存储介质
CN111144368A (zh) * 2019-12-31 2020-05-12 重庆和贯科技有限公司 基于长短时记忆神经网络的学生行为检测方法
CN111436939A (zh) * 2020-03-17 2020-07-24 佛山市台风网络科技有限公司 健康监测方法、***、计算机设备及可读存储介质
CN111523738A (zh) * 2020-06-22 2020-08-11 之江实验室 基于用户在线学习行为模式预测学习效果的***及预测方法
CN111950892B (zh) * 2020-08-11 2023-08-18 华中师范大学 一种数据驱动的大学生个性化学习行为预测与干预方法
CN111950892A (zh) * 2020-08-11 2020-11-17 华中师范大学 一种数据驱动的大学生个性化学习行为预测与干预方法
CN112101553A (zh) * 2020-11-10 2020-12-18 鹏城实验室 网络结构搜索方法及装置、设备、存储介质
CN112734105A (zh) * 2021-01-08 2021-04-30 浙江工业大学 一种预防在线教育中辍学行为的方法
CN114130038A (zh) * 2021-11-25 2022-03-04 浙江小族智能科技有限公司 游乐车及其控制方法、装置、存储介质、终端
CN114130038B (zh) * 2021-11-25 2023-08-22 浙江小族智能科技有限公司 游乐车及其控制方法、装置、存储介质、终端
CN114567815B (zh) * 2022-01-20 2023-05-02 清华大学 一种基于预训练的慕课自适应学习***构建方法和装置
CN114567815A (zh) * 2022-01-20 2022-05-31 清华大学 一种基于预训练的慕课自适应学习***构建方法和装置
CN116227729A (zh) * 2023-03-20 2023-06-06 广州工程技术职业学院 基于机器学习的学习评价方法及装置、设备
CN116227729B (zh) * 2023-03-20 2023-10-10 广州工程技术职业学院 基于机器学习的学习评价方法及装置、设备
CN116362418A (zh) * 2023-05-29 2023-06-30 天能电池集团股份有限公司 一种高端电池智能工厂应用级制造能力在线预测方法
CN116362418B (zh) * 2023-05-29 2023-08-22 天能电池集团股份有限公司 一种高端电池智能工厂应用级制造能力在线预测方法

Also Published As

Publication number Publication date
CN109272164B (zh) 2021-09-28

Similar Documents

Publication Publication Date Title
CN109272164A (zh) 学习行为动态预测方法、装置、设备及存储介质
Schlüter et al. A framework for mapping and comparing behavioural theories in models of social-ecological systems
An Modeling human decisions in coupled human and natural systems: Review of agent-based models
Glass Primary, secondary, and meta-analysis of research
Cortez et al. Using data mining to predict secondary school student performance
Matthews Blurring boundaries between humans and technology: postdigital, postphenomenology and actor-network theory in qualitative research
CN108596420A (zh) 一种基于行为的人才测评***及方法
Mao et al. Analysis of entrepreneurship education in colleges and based on improved decision tree algorithm and fuzzy mathematics
Jinfeng et al. Design of evaluation system of physical education based on machine learning algorithm and SVM
Antelmi et al. Analyzing, exploring, and visualizing complex networks via hypergraphs using SimpleHypergraphs. jl
Farahbakhsh et al. Modelling coupled human–environment complexity for the future of the biosphere: strengths, gaps and promising directions
Efrati et al. A data mining approach to the analysis of students’ learning styles in an e-learning community: A case study
Varade et al. Academic performance prediction of undergraduate students using decision tree algorithm
Wang [Retracted] Research on the Application of Genetic Algorithm in Physical Education
Oztekin et al. A business-analytic approach to identify critical factors in quantitative disciplines
Jiang et al. ATSA: An Adaptive Tree Seed Algorithm based on double-layer framework with tree migration and seed intelligent generation
Rahimi et al. Learning analytics dashboards in educational games
Wang et al. Analysis and Prediction of Satisfaction Index of Online Learning
Peng et al. Construction and Application of Farmers’ Practical Teaching System in Vocational Education Based on Big Data Mining Technology
Fernández et al. Exploring approaches to educational data mining and learning analytics, to measure the level of acquisition of student's learning outcome
Divasón et al. Artificial intelligence models for assessing the evaluation process of complex student projects
Pangarkar et al. Artificial intelligence based analysis of student’s involvement in edtech industry
Yu et al. Unsupervised Representations Predict Popularity of Peer-Shared Artifacts in an Online Learning Environment
Chesney et al. Agent-Based Modelling of Worker Exploitation
Dharme et al. Progressive Model for Student Behavior Analysis using Deep Learning Powered NLP: A Technical Review

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant