CN113902129A

CN113902129A - 多模态的统一智能学习诊断建模方法、***、介质、终端

Info

Publication number: CN113902129A
Application number: CN202111263507.2A
Authority: CN
Inventors: 王志锋; 严文星; 王艳凤; 左明章; 罗恒; 闵秋莎; 董石; 田元; 夏丹; 叶俊民
Original assignee: Central China Normal University
Current assignee: Central China Normal University
Priority date: 2021-10-28
Filing date: 2021-10-28
Publication date: 2022-01-07

Abstract

本发明属于教育大数据挖掘技术领域，公开了一种多模态的统一智能学习诊断建模方法、***、介质、终端，通过构建多通道的认知诊断模型，对学习者进行初步诊断，对学习资源进行参数估计，得到学习资源参数集与学习者参数集；对学习资源与学习者进行建模，获取深度表征特征；引入自注意力机制对学习者特征与学习资源特征进行融合；将融合特征作为用来预测学习者表现情况的数据基础，构建学习者表现预测网络得到对学习者作答正确概率的预测值；通过学习者与练习题目的特征信息诊断学习者的总体知识点掌握情况，获取练习题目的参数表征。本发明有利于融合多通道认知诊断模型的优点，并设计神经网络对学习者进行智能学习诊断，具有可扩展性。

Description

多模态的统一智能学习诊断建模方法、***、介质、终端

技术领域

本发明属于教育大数据挖掘技术领域，尤其涉及一种多模态的统一智能学习诊断建模方法、***、介质、终端。

背景技术

近年来，随着人工智能等信息技术的快速发展，教育行业也在不断地朝着智慧化、信息化方向飞跃，现代信息技术与传统教学模式以及教育方式相融合形成了“互联网+教育”服务新业态。互联网教育能够实现个性化导学、智能学习评价等新教学方式，为教师和学习者提供精准而有效的指导信息，提升教学与学习效果。

认知诊断评价是实现智慧教育的一种辅助方法，具体即通过分析学***进行挖掘与诊断，从而为学习者提出具有针对性的改进意见。目前，相关研究者从不同角度出发，提出了多种认知诊断模型，按其不同的理论基础可分为两大类：

(1)基于参数估计的认知诊断方法；

(2)基于非参数的人工智能方法。

基于参数估计的认知诊断方法以潜在特质模型、潜在分类模型为主要代表，潜在特征模型以项目反应理论为基础，假设学习者有一种“潜在特质”，一般是指连续的潜在能力，并且模型认为学习者在练习题目上的反应和成绩不仅与题目自身因素有关，还与学习者的潜在特质有特殊的关系，通过建模学习者潜在特征、题目因素与作答反应间的关系对学习者进行知识状态诊断；潜在分类模型假定能力值是不连续的，潜在知识空间由K个二分变量组成，共有2^K种掌握状态，并根据学习者的答题结果将学习者划分到这些掌握状态中去，从而区分其知识认知结构。潜在分类模型有时并不能完全拟合实际情况，经常会有一些学习者并不能准确地被划分在有限的假设类别中。

基于非参数的人工智能方法引入深度学习方法，以练习题目与学习者作答记录数据为基础，通过循环神经网络、卷积网络等建模学习者的学习过程以及其知识掌握状态，具有较高的准确性。但由于深度学习方法的黑盒特性，通常基于非参数的人工智能方法的可解释性不强，所得结果有时无法使人完全信服。

通过上述分析，现有技术存在的问题及缺陷为：

(1)传统认知诊断模型建模角度及参数较为单一，无法从多个不同维度运用不同方法进行综合考量，导致诊断结果较为片面，准确性不高。

(2)传统认知诊断模型对数据规模要求较为严格，规模小诊断结果准确性低，规模太大则效率也会大大降低。

(3)现有基于非参数的人工智能诊断方法属于黑盒方法，无法很好地赋予其结果以教育学上的解释意义，可用性受到了一定的限制。

解决以上问题及缺陷的难度为：

(1)如何灵活地集多种传统认知诊断模型的思想于一体，以构建一种包容性较强的诊断框架，从而在诊断结果准确性上实现提升。

(2)如何利用深度学习方法的高维空间表征性能，充分挖掘教育数据中的可用信息，对学习者及学习资源进行建模并实现准确的学习者学习诊断。

(3)如何将深度学习方法与基于统计的传统认知诊断方法进行有机地融合，各取所长，在提高诊断结果准确性的基础上兼顾其在教育领域的解释意义。

解决以上问题及缺陷的意义为：

(1)本发明充分挖掘了学习者学习数据中的潜在信息，能够深层全面地对学习者进行认知诊断与表现预测，为其后续学习提供参考及指导信息。

(2)本发明能够提供一种灵活的诊断方法，根据不同需要选用不同的诊断通道，适用于多种场景。

(3)本发明提出的一种多模态的统一智能学习诊断建模方法在传统认知诊断模型基础上，采用深度学习方法建模学习者与学习资源，提高了诊断结果准确性及诊断效率。

发明内容

针对现有技术存在的问题，本发明提供了一种多模态的统一智能学习诊断建模方法、***、介质、终端。

本发明是这样实现的，一种多模态的统一智能学习诊断建模方法，所述多模态的统一智能学习诊断建模方法包括以下步骤：

步骤一，基于学习者历史学习记录及学习资源信息，构建多通道的认知诊断模型，形成可扩展的诊断框架；在此框架内对学习者进行初步诊断，并对学习资源进行参数估计，得到学习资源参数集与学习者参数集；

步骤二，结合深度自编码器以构建学习者特征表征网络与学习资源特征表征网络，基于原始参数集分别对学习资源与学习者进行建模，并获取深度表征特征；

步骤三，引入自注意力机制对学习者特征与学习资源特征进行融合，挖掘各维度特征间的相关性及重要程度信息，根据不同重要程度予以不同权值，对最有效的部分特征予以更多关注；

步骤四，将融合特征作为用来预测学习者表现情况的数据基础，构建学习者表现预测网络得到对学习者作答正确概率的预测值；通过学习者与练习题目的特征信息诊断学习者的总体知识点掌握情况，获取练习题目的参数表征。

进一步，步骤一中，所述基于学习者历史学习记录及学习资源信息，构建多通道的认知诊断模型，形成可扩展的诊断框架；在此框架内对学习者进行初步诊断，并对学习资源进行参数估计，得到学习资源参数集与学习者参数集，包括：

(1)构建学习资源集合与学习者历史学习数据集合：

S＝{s₁，s₂，...，s_N}

E＝{e₁，e₂，...，e_M}

K＝{k₁，k₂，...，k_L}；

其中，S为学习者集合，E为练习题目集合，K为知识点集合。

(2)用答题矩阵R记录学生历史答题结果，每一行表示一个学生，每一列表示一道习题；如果学生 s答对习题e，则R_se＝1，否则R_se＝0；用习题-知识点矩阵Q表示习题和所考察的知识点之间的关系，每一行表示一道题目，每一列表示一个知识点；如果习题e考察知识点k，则Q_ek＝1，否则Q_ek＝0。

(3)构建多通道认知诊断模型，利用Q矩阵和R矩阵，估计学习者及学习资源参数，得到原始参数表征信息，并据此构建学习者及学习资源参数集；

其中，所述参数包括：学***参数，练习题目的难度、区分度、猜测率和失误率。

所述学习者参数集、学习资源参数集定义为：

STUDENT＝{SF₁，SF₂，...，SF_n}

EXERCISE＝{EF₁，EF₂，...，EF_m}；

其中，SF_i代表学习者的某项特征参数，EF_j代表学习资源的某项特征参数。

进一步，步骤二中，所述结合深度自编码器以构建学习者特征表征网络与学习资源特征表征网络，基于原始参数集分别对学习资源与学习者进行建模，并获取深度表征特征，包括：

(1)对学习者及学习资源参数进行预处理。首先对所有参数分别进行分段处理，将连续的参数值按其大小映射为若干离散值，再采用One-Hot方式编码，生成学习者及学习资源参数向量：

student_F＝(SF₁，SF₂，...，SF_n)

exercise_F＝(EF₁，EF₂，...，EF_m)；

其中，SF_i为学习者的某项参数经过One-Hot编码得到的特征向量；EF_j为学习资源的某项参数经过One-Hot编码得到的特征向量。

(2)设计学习者特征深度自编码器，由一个编码器与一个解码器构成，编码器把高维输入编码成低维的隐变量，学习最具信息量的特征；解码器把隐藏层的隐向量还原到初始维度，最佳状态就是解码器的输出能够完全地或者近似恢复为原来的输入，从而使隐向量表征输入信息，并达到降维作用。

(3)设计学习资源特征深度自编码器，所述学习资源特征深度自编码器的组成结构与学习者特征深度自编码器类似。

进一步，步骤(2)中，所述利用深度自编码器获取隐特征向量，包括：

2.1)构建编码器获取隐层学习者特征向量：

student_H1＝g(W_s1×student_F+b_s1)

student_H2＝g(W_s2×student_H1+b_s2)；

其中，g为tanh激活函数，W_s1，W_s2是编码层节点权重参数，b_s1，b_s2为相应的偏置参数；

2.2)构建解码器完成对编码特征的解码，得到输入特征的重构特征：

student_D1＝g(W_s3×student_H2+b_s3)

student_D2＝g(W_s4×student_D1+b_s4)；

其中，g为tanh激活函数，W_s1，W_s2是解码层节点权重参数，b_s1，b_s2为相应的偏置参数；

2.3)提取隐层的特征向量student_H2作为学习者深度表征特征。

步骤(3)中，所述设计学习资源特征深度自编码器，包括：

3.1)构建编码器获取隐层学习者特征向量：

exercise_H1＝g(W_e1×exercise_F+b_e1)

exercise_H2＝g(W_e2×exercise_H1+b_e2)；

其中，g为tanh激活函数，W_e1，W_e2是编码层节点权重参数，b_e1，b_e2为相应的偏置参数；

3.2)构建解码器完成对编码特征的解码，得到输入特征的重构特征：

exercise_D1＝g(W_e3×exercise_H2+b_e3)

exercise_D2＝g(W_e4×exercise_D1+b_e4)；

其中，g为tanh激活函数，W_e1，W_e2是解码层节点权重参数，b_e1，b_e2为相应的偏置参数；

3.3)提取隐层的特征向量exercise_H2作为学习资源深度表征特征。

进一步，步骤三中，所述引入自注意力机制对学习者特征与学习资源特征进行融合，挖掘各维度特征间的相关性及重要程度信息，根据不同重要程度予以不同权值，对最有效的部分特征予以更多关注，包括：

(1)拼接学习者与练习题目两个维度的特征：

F＝{student_D2，exercise_D}；

(2)结合自注意力机制对学习者与练习题目特征进行有效地融合；其中，所述结合自注意力机制进行特征融合，包括：

1)将拼接后的特征输入卷积核大小为1的卷积层获取查询向量矩阵Query、键向量矩阵Key和值向量矩阵Value：

Query＝Conv(F)

Key＝Conv(F)

Value＝Conv(F)；

2)通过计算查询向量矩阵与键向量矩阵间的点积的方式计算特征中的每一个数据的权值，该权值表示所要查询的任务与每一个输入数据之间的关联度：

similarity(Query，Key_i)＝Query·Key_i；

3)引入SoftMax对关联度进行数值转换；通过归一化将原始计算分值整理成权重之和为1的概率分布；通过SoftMax的内在机制突出重要元素的权重：

4)对输入数据进行加权求和得到融合后的特征数据：

进一步，步骤四中，所述将融合特征作为用来预测学习者表现情况的数据基础，构建学习者表现预测网络得到对学习者作答正确概率的预测值；通过学习者与练习题目的特征信息诊断学习者的总体知识点掌握情况，获取练习题目的参数表征，包括：

(1)构建卷积网络层预测学习者作答结果，将融合后的特征向量输入卷积层提取其空间信息，卷积核尺寸设为3，步长为1：

F_c＝Conv(F_a)；

(2)添加Relu激活函数，减少参数间依存关系，避免过拟合：

F_re＝Relu(F_c)；

(3)通过最大池化层降低特征维度：

F_p＝MaxPool(F_re)；

(4)将降维后的特征输入全连接层，预测学习者在特定学习任务下的作答结果：

p＝σ(W₃×F_p+b₃)；

其中，W₃，b₃表示要学习的参数，W₃是权重参数，b₃为相应的偏置参数；σ为sigmoid为激活函数。

(5)学习者知识点掌握情况评估方式为：

student_{knowledge-proficiency}＝σ(W₄×student_H+b₄)；

student_H为高维学习者特征向量，W₄，b₄表示要学习的权重与偏置参数，student_{knowledge-proficiency}为学习者知识点掌握情况评估结果。

(6)练习题目参数表征结果即为向量exercise。

本发明的另一目的在于提供一种应用所述的多模态的统一智能学习诊断建模方法的多模态的统一智能学习诊断建模***，所述多模态的统一智能学习诊断建模***包括：

参数集构建模块，用于基于学习者历史学习记录及学习资源信息，构建多通道的认知诊断模型，形成可扩展的诊断框架；在此框架内对学习者进行初步诊断，并对学习资源进行参数估计，得到学习资源参数集与学习者参数集；

特征表征网络构建模块，用于结合深度自编码器以构建学习者特征表征网络与学习资源特征表征网络，基于原始参数集分别对学习资源与学习者进行建模，并获取深度表征特征；

特征融合模块，用于引入自注意力机制对学习者特征与学习资源特征进行融合，挖掘各维度特征间的相关性及重要程度信息，根据不同重要程度予以不同权值，对最有效的部分特征予以更多关注；

学习诊断及参数表征模块，用于将融合特征作为用来预测学习者表现情况的数据基础，构建学习者表现预测网络得到对学习者作答正确概率的预测值；通过学习者与练习题目的特征信息诊断学习者的总体知识点掌握情况，获取练习题目的参数表征。

本发明的另一目的在于提供一种计算机设备，所述计算机设备包括存储器和处理器，所述存储器存储有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行如下步骤：

基于学习者历史学习记录及学习资源信息，构建多通道的认知诊断模型，形成可扩展的诊断框架；在此框架内对学习者进行初步诊断，并对学习资源进行参数估计，得到学习资源参数集与学习者参数集；结合深度自编码器以构建学习者特征表征网络与学习资源特征表征网络，基于原始参数集分别对学习资源与学习者进行建模，并获取深度表征特征；

引入自注意力机制对学习者特征与学习资源特征进行融合，挖掘各维度特征间的相关性及重要程度信息，根据不同重要程度予以不同权值，对最有效的部分特征予以更多关注；将融合特征作为用来预测学习者表现情况的数据基础，构建学习者表现预测网络得到对学习者作答正确概率的预测值；通过学习者与练习题目的特征信息诊断学习者的总体知识点掌握情况，获取练习题目的参数表征，为学习者的个性化学习提供参考。

本发明的另一目的在于提供一种计算机可读存储介质，存储有计算机程序，所述计算机程序被处理器执行时，使得所述处理器执行如下步骤：

本发明的另一目的在于提供一种信息数据处理终端，所述信息数据处理终端用于实现所述的多模态的统一智能学习诊断建模***。

结合上述的所有技术方案，本发明所具备的优点及积极效果为：

本发明提供的多模态的统一智能学习诊断建模方法，充分挖掘了学习者学习数据中的潜在信息，能够深层全面地对学习者进行认知诊断与表现预测，为其后续学习提供参考及指导信息；

本发明有利于融合多通道认知诊断模型的优点，能够制定灵活的诊断策略，从不同角度建模学习者与学习资源，适用于多种场景；

本发明提出的多模态的统一智能学习诊断建模方法在传统的基于统计方法认知诊断模型基础上，使用深度自编码器建模学习者与学习资源，并引入自注意力机制处理得到的深度特征，能够更加准确、高效地对学习者进行学习诊断；

本发明设计卷积神经网络来预测学习者作答情况，从学习者与学习资源的空间特征中抽取有效信息，据此获得对于学习者作答情况更加准确的预测值。

对比的技术效果或者实验效果，包括：

本发明将一种多模态的统一智能学习诊断建模方法与其他学习诊断分析方法进行对比，对比指标曲线下面积AUC和均方根误差RMSE。AUC和为学习者表现预测评估提供了可靠的指标，0.5的AUC值代表随机可获得的得分，越高的AUC分数代表预测结果越准确。均方根误差(Root Mean Square Error,RMSE) 用来衡量估计值与真实值之间的偏差，其值越小则表明挖掘结果越接近真实值。计算公式为：

本发明将本方法与传统学习诊断方法进行了比较。为了进行客观的比较，将所有方法都调整为最佳状态，一种多模态的统一智能学习诊断建模方法与传统学习诊断方法在数据集MATH下的AUC、RMSE对比结果如表1所示。

表1实验结果对比

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例中所需要使用的附图做简单的介绍，显而易见地，下面所描述的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的多模态的统一智能学习诊断建模方法流程图。

图2是本发明实施例提供的多模态的统一智能学习诊断建模方法原理图。

图3是本发明实施例提供的多模态的统一智能学习诊断建模***结构框图；

图中：1、参数集构建模块；2、特征表征网络构建模块；3、特征融合模块；4、学习诊断及参数表征模块。

图4是本发明实施例提供的实验结果对比图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

针对现有技术存在的问题，本发明提供了一种多模态的统一智能学习诊断建模方法及***，下面结合附图对本发明作详细的描述。

如图1所示，本发明实施例提供的多模态的统一智能学习诊断建模方法，包括以下步骤：

S101，基于学***)；

S102，结合深度自编码器以构建学习者特征表征网络与学习资源特征表征网络，基于原始参数集分别对学习资源与学习者进行建模，获取深度表征特征；

S103，引入自注意力机制对学习者特征与学习资源特征进行融合，挖掘各维度特征间的相关性及重要程度信息，根据不同重要程度予以不同权值，对最有效的部分特征予以更多关注；

S104，将融合特征作为用来预测学习者表现情况的数据基础，构建学习者表现预测网络得到对学习者作答正确概率的预测值；通过学习者与练习题目的特征信息诊断学习者的总体知识点掌握情况，获取练习题目的参数表征。

本发明实施例提供的多模态的统一智能学习诊断建模方法原理图见图2。

如图3所示，本发明实施例提供的多模态的统一智能学习诊断建模***，包括：

参数集构建模块1，用于基于学习者历史学习记录及学习资源信息，构建多通道的认知诊断模型，形成可扩展的诊断框架；在此框架内对学习者进行初步诊断，并对学习资源进行参数估计，得到学习资源参数集与学习者参数集；

特征表征网络构建模块2，用于结合深度自编码器以构建学习者特征表征网络与学习资源特征表征网络，基于原始参数集分别对学习资源与学习者进行建模，并获取深度表征特征；

特征融合模块3，用于引入自注意力机制对学习者特征与学习资源特征进行融合，挖掘各维度特征间的相关性及重要程度信息，根据不同重要程度予以不同权值，对最有效的部分特征予以更多关注；

学习诊断及参数表征模块4，用于将融合特征作为用来预测学习者表现情况的数据基础，构建学习者表现预测网络得到对学习者作答正确概率的预测值；通过学习者与练习题目的特征信息诊断学习者的总体知识点掌握情况，获取练习题目的参数表征。

下面结合具体实施例对本发明的技术方案作进一步描述。

实施例1

如图2所示，本发明实施例提供的多模态的统一智能学习诊断建模方法，包括以下步骤：

(1)基于学习者历史学习记录及学习资源信息，构建多通道的认知诊断模型，形成可扩展的诊断框架；在此框架内对学习者进行初步诊断，并对学习资源进行参数估计，得到学习资源参数集与学习者参数集；

(2)结合深度自编码器以构建学习者特征表征网络与学习资源特征表征网络，基于原始参数集分别对学习资源与学习者进行建模，获取深度表征特征；

(3)引入自注意力机制对学习者特征与学习资源特征进行融合，挖掘各维度特征间的相关性及重要程度信息，根据不同重要程度予以不同权值，对最有效的部分特征予以更多关注；

(4)将融合特征作为用来预测学习者表现情况的数据基础，构建学习者表现预测网络得到对学习者作答正确概率的预测值；通过学习者与练习题目的特征信息诊断学习者的总体知识点掌握情况，获取练习题目的参数表征。

步骤(1)中，本发明实施例提供的基于学习者历史学习记录及学习资源信息，构建多通道的认知诊断模型，形成可扩展的诊断框架。在此框架内对学习者进行初步诊断，并对学习资源进行参数估计，从而得到学习资源参数集与学习者参数集包括：

(1.1)构建学习资源集合与学习者历史学习数据集合：

S＝{s₁，s₂，...，s_N}

E＝{e₁，e₂，...，e_M}

K＝{k₁，k₂，...，k_L}

其中，S为学习者集合，E为练习题目集合，K为知识点集合。

(1.2)用答题矩阵R记录学生历史答题结果，其每一行表示一个学生，每一列表示一道习题，如果学生s答对习题e，那么R_se＝1，否则R_se＝0；用习题-知识点矩阵Q表示习题和所考察的知识点之间的关系，每一行表示一道题目，每一列表示一个知识点，如果习题e考察了知识点k，那么Q_ek＝1，否则Q_ek＝0。

(1.3)构建多通道认知诊断模型，利用Q矩阵和R矩阵，估计学习者及学习资源参数，得到原始参数表征信息，并据此构建学习者及学习资源参数集。本实施例中采用DINA与IRT模型构建多通道认知诊断模型。作为本发明实施例，可扩展的认知诊断框架中，以融合IRT模型与Dina模型为实例，其参数获取及网络构建具体方法为：

(1.2.1)DINA模型中，以Q矩阵和R矩阵为输入，估计学习者及试题参数。包括：学习者-对于各个知识点的掌握向量S_α；练习题-猜测率e_guess、失误率e_slip。

(1.2.2)将每个学生描述为一个知识点掌握程度向量，其中每一维对应一个知识点。在已知学生的知识点掌握向量的情况下，对于学生未作答的试题，可以根据下式获得学生对试题的潜在作答情况：

即当学生掌握了正确回答试题所需的全部知识点时，η_uv＝1。

(1.2.3)引入失误率s和猜测率g两种题目参数，其定义为：

学生掌握了回答试题所需的全部知识点，但是由于某些原因回答错误。即失误参数：

S_j＝P(R_uv＝0|η_uv＝1)

学生没有掌握回答试题所需的全部知识点，甚至一个知识点都没掌握，但是回答正确。即猜测参数：

g_j＝P(R_uv＝1|η_uv＝0)

(1.2.4)实际响应矩阵的概率模型为：

(1.2.5)由此得到DINA模型的总似然函数：

其中，L＝2^V。

(1.2.6)引入EM算法，采用极大边缘似然估计的方法求解：

M步：分别令

和

可得

其中

表示属于第l种知识点掌握模式的学生中缺乏至少一个第v题所需知识点的人数期望，

表示

中回答正确第v题的人数期望，

和

的含义与

和

相似，不同之处在于

与

是在学生掌握所有第v题所需知识点的情形下的期望。故可由E步中得到的估计，计算

和

的值，并由此得到新的s_v与g_v估计值。

(1.2.7)IRT模型中，根据R矩阵估计学习者及试题参数。包括：学习者-能力值sθ；练习题-难度e_difficulty、区分度e_{discrimination}。

(1.2.8)记题目v的参数为δ_v，学习者k的能力参数为π_k，另记总题目参数向量为δ，记所有学习者的能力参数π_k的取值集合为π，则学习者k作答反应为r_k的条件概率为：

其中，P(π_k|δ_j)为学习者k正确回答题目j的概率。

(1.2.9)由此得到IRT模型的总似然函数：

其中，p(π_k|π)为学习者能力值为π_k的概率。

(1.2.10)引入EM算法进行参数估计：

E步：利用上一轮迭代得到的δ与π计算能力水平为π_k的人数n_k以及水平为π_k的且答对题目的人数r_jk的期望值

M步：令

可得

令

即求解方程

可得

(1.2.11)将学习者与学习资源两类参数分别组合起来得到两个参数集student、exercise：

student＝{s_θ，s_α}

exercise＝{e_difficulty，e_{discrimin ation}，e_guess，e_slip}

步骤(2)中，本发明实施例提供的结合深度自编码器以构建学习者特征表征网络与学习资源特征表征网络，基于原始参数集分别对学习资源与学习者进行建模，并获取其深度表征特征：

(2.1)由学习者及学习资源参数集构建学习者参数向量及学习资源参数向量：

student_F＝(s_θ，s_α)

exercise_F＝(e_difficulty，e_{discrinmin ation}，e_guess，e_slip)

(2.2)对学习者及学习资源参数向量进行预处理。首先对所有参数分别进行分段处理，将连续的参数值按其大小映射为若干离散值，再采用One-Hot方式编码，生成64维学习者及40维学习资源参数向量：

student_F＝(SF₁，SF₂)

exercise_F＝(EF₁，EF₂，EF₃，EF₄)

(2.3)设计学习者特征深度自编码器，由一个编码器与一个解码器构成，编码器把高维输入编码成低维的隐变量，学习最具信息量的特征；解码器把隐藏层的隐向量还原到初始维度，最佳状态就是解码器的输出能够完全地或者近似恢复为原来的输入，从而使隐向量能够很好地表征输入信息，并达到降维作用：

所述利用深度自编码器获取隐特征向量具体包括：

(2.3.1)构建编码器获取隐层学习者特征向量：

student_H1＝g(W_s1×student_F+b_s1)

student_H2＝g(W_s2×student_H1+b_s2)

(2.3.2)构建解码器完成对编码特征的解码，得到输入特征的重构特征：

student_D1＝g(W_s3×student_H2+b_s3)

student_D2＝g(W_s4×student_D1+b_s4)

(2.3.3)提取隐层的32维特征向量student_H2作为学习者深度表征特征。

(2.4)同样地，设计学习资源特征深度自编码器，其组成结构与学习者特征深度自编码器类似：

(2.4.1)构建编码器获取隐层学习者特征向量：

exercise_H1＝g(W_e1×exercise_F+b_e1)

exercise_H2＝g(W_e2×exercise_H1+b_e2)

(2.4.2)构建解码器完成对编码特征的解码，得到输入特征的重构特征：

exercise_D1＝g(W_e3×exercise_H2+b_e3)

exercise_D2＝g(W_e4×exercise_D1+b_e4)

(2.4.3)提取隐层的32维特征向量exercise_H2作为学习资源深度表征特征。

进一步，S103中，本发明实施例提供的引入自注意力机制对学习者特征与学习资源特征进行有效地融合，充分挖掘各维度特征间的相关性及重要程度信息，根据不同重要程度对其予以不同权值，对最有效的一部分特征予以更多关注包括：

(3.1)拼接学习者与练习题目两个维度的特征，得到64维整体特征：

F＝{student_H2，exercise_H2}

(3.2)结合自注意力机制对学习者与练习题目特征进行有效地融合；

其中，所述结合自注意力机制进行特征融合的具体方法包括：

(3.2.1)将拼接后的特征输入卷积核大小为1的卷积层获取查询向量矩阵Query、键向量矩阵Key、值向量矩阵Value：

Query＝Conv(F)

Key＝Conv(F)

Value＝Cony(F)

(3.2.2)通过计算查询向量矩阵与键向量矩阵间的点积的方式计算特征中的每一个数据的权值，该权值表示所要查询的任务与每一个输入数据之间的关联度：

similarity(Query，Key_i)＝Query·Key_i

(3.2.3)引入SoftMax对关联度进行数值转换，一方面可以进行归一化，将原始计算分值整理成权重之和为1的概率分布；另一方面也可以通过SoftMax的内在机制更加突出重要元素的权重：

(3.2.4)对输入数据进行加权求和得到融合后的特征数据：

步骤(4)中，本发明实施例提供的将融合特征作为用来预测学习者表现情况的数据基础，构建学习者表现预测网络得到对学习者作答正确概率的预测值；通过学习者与练习题目的特征信息诊断学习者的总体知识点掌握情况，并获取练习题目的参数表征，为学习者的个性化学习提供参考包括：

(4.1)构建卷积网络层预测学习者作答结果，将融合后的特征向量输入卷积层提取其空间信息，卷积核尺寸设为3，步长为1：

F_c＝Conv(F_a)

(4.2)添加Relu激活函数，减少参数间依存关系，避免过拟合：

F_re＝Relu(F_c)

(4.3)通过最大池化层降低特征维度：

F_p＝MaxPool(F_re)

(4.4)将降维后的特征输入全连接层，预测学习者在特定学习任务下的作答结果：

p＝σ(W₃×F_p+b₃)

(4.5)学习者知识点掌握情况评估方式为：

student_{knowledge-proficiency}＝σ(W₄×student_H+b₄)

(4.6)练习题目参数表征结果即为向量exercise。

实施例2

本发明实施例提供的多模态的统一智能学习诊断建模方法具体包括：

(1)基于学习者历史学习记录及学习资源信息，构建多通道的认知诊断模型，形成可扩展的诊断框架。在此框架内对学习者进行初步诊断，并对学习资源进行参数估计，从而得到学习资源参数集与学习者参数集；

(2)结合深度自编码器以构建学习者特征表征网络与学习资源特征表征网络，基于原始参数集分别对学习资源与学习者进行建模，并获取其深度表征特征；

(3)引入自注意力机制对学习者特征与学习资源特征进行有效地融合，充分挖掘各维度特征间的相关性及重要程度信息，根据不同重要程度对其予以不同权值，对最有效的一部分特征予以更多关注；

(4)将融合特征作为用来预测学习者表现情况的数据基础，构建学习者表现预测网络得到对学习者作答正确概率的预测值；通过学习者与练习题目的特征信息诊断学习者的总体知识点掌握情况，并获取练习题目的参数表征，为学习者的个性化学习提供参考。

作为本发明优选实施例，基于学习者历史学习记录及学习资源信息，构建多通道的认知诊断模型，形成可扩展的诊断框架。在此框架内对学习者进行初步诊断，并对学习资源进行参数估计，从而得到学习资源参数集与学习者参数集包括：

(1.1)构建学习资源集合与学习者历史学习数据集合：

S＝{s₁，s₂，...，s_N}

E＝{e₁，e₂，...，e_M}

K＝{k₁，k₂，...，k_L}

其中，S为学习者集合，E为练习题目集合，K为知识点集合。

用答题矩阵R记录学生历史答题结果，其每一行表示一个学生，每一列表示一道习题，如果学生s答对习题e，那么R_se＝1，否则R_se＝0；用习题-知识点矩阵Q表示习题和所考察的知识点之间的关系，每一行表示一道题目，每一列表示一个知识点，如果习题e考察了知识点k，那么Q_ek＝1，否则 Q_ek＝0。

(1.2)根据Q矩阵和R矩阵以及多种认知诊断模型，估计学***参数等；练习题目的难度、区分度、猜测率、失误率等。

(1.3)采用从在线教育平台智学网中收集到的MATH数据集，其包含的数据信息如表2所示。

表2 MATH数据集描述

学生数	14209
		练习数	15(客观题)
知识点个数	11

作为本发明优选实施例，可扩展的认知诊断框架中，以融合IRT模型与Dina模型为实例，其参数获取及网络构建具体方法为：

(1.2.3)引入失误率s和猜测率g两种题目参数，其定义为：

S_j＝P(R_uv＝0|η_uv＝1)

g_j＝P(R_uv＝1|η_uv＝0)

(1.2.4)实际响应矩阵的概率模型为：

(1.2.5)由此得到DINA模型的总似然函数：

其中，L＝2^V。

(1.2.6)引入EM算法，采用极大边缘似然估计的方法求解：

M步：分别令

和

可得

其中

表示

中回答正确第v题的人数期望，

和

的含义与

和

相似，不同之处在于

与

和

的值，并由此得到新的s_v与g_v估计值。

(1.2.7)IRT模型中，根据R矩阵估计学习者及试题参数。包括：学习者-能力值S_θ；练习题-难度e_difficulty、区分度e_{discrimination}。

其中，P(π_k|δ_j)为学习者k正确回答题目j的概率。

(1.2.9)由此得到IRT模型的总似然函数：

其中，p(π_k|π)为学习者能力值为π_k的概率。

(1.2.10)引入EM算法进行参数估计：

M步：令

可得

令

即求解方程

可得

作为本发明优选实施例，结合深度自编码器以构建学习者特征表征网络与学习资源特征表征网络，基于原始参数集分别对学习资源与学习者进行建模，并获取其深度表征特征包括：

student_F＝(s_θ，s_α)

exercise_F＝(e_difficulty，e_{discrimin ation}，e_guess，e_slip)

(2.2)对学习者及学习资源参数向量进行预处理。首先对所有参数分别进行分段处理，将连续的参数值按其大小映射为若干离散值，再采用One-Hot方式编码，生成学习者及学习资源参数向量：

student_F＝(SF₁，SF₂)

exercise_F＝(EF₁，EF₂，EF₃，EF₄)

(2.3)设计学习者特征深度自编码器，由一个编码器与一个解码器构成，编码器把高维输入编码成低维的隐变量，学习最具信息量的特征；解码器把隐藏层的隐向量还原到初始维度，最佳状态就是解码器的输出能够完全地或者近似恢复为原来的输入，从而使隐向量能够很好地表征输入信息，并达到降维作用；所述利用深度自编码器获取隐特征向量具体包括：

(2.3.1)构建编码器获取隐层学习者特征向量：

student_H1＝g(W_s1×student_F+b_s1)

student_H2＝g(W_s2×student_H1+b_s2)

student_D1＝g(W_s3×student_H2+b_s3)

student_D2＝g(W_s4×student_D1+b_s4)

(2.3.3)提取隐层的特征向量student_H2作为学习者深度表征特征。

(2.4.1)构建编码器获取隐层学习者特征向量：

exercise_H1＝g(W_e1×exercise_F+b_e1)

exercise_H2＝g(W_e2×exercise_H1+b_e2)

exercise_D1＝g(W_e3×exercise_H2+b_e3)

exercise_D2＝g(W_e4×exercise_D1+b_e4)

(2.4.3)提取隐层的特征向量exercise_H2作为学习资源深度表征特征。

作为本发明优选实施例，引入自注意力机制对学习者特征与学习资源特征讲行有效地融合，充分挖掘各维度特征间的相关性及重要程度信息，根据不同重要程度对其予以不同权值，对最有效的一部分特征予以更多关注包括：

(3.1)拼接学习者与练习题目两个维度的特征：

F＝{student_H2，exercise_H2}

Query＝Conv(F)

Key＝Conv(F)

Value＝Conv(F)

similarity(Query，Key_i)＝Query·Key_i

(3.2.4)对输入数据进行加权求和得到融合后的特征数据：

作为本发明优选实施例，将融合特征作为用来预测学习者表现情况的数据基础，构建学习者表现预测网络得到对学习者作答正确概率的预测值；通过学习者与练习题目的特征信息诊断学习者的总体知识点掌握情况，并获取练习题目的参数表征，为学习者的个性化学习提供参考包括：

F_c＝Conv(F_a)

(4.2)添加Relu激活函数，减少参数间依存关系，避免过拟合：

F_re＝Relu(F_c)

(4.3)通过最大池化层降低特征维度：

F_p＝MaxPool(F_re)

p＝σ(W₃×F_p+b₃)

(4.5)学习者知识点掌握情况评估方式为：

student_{knowledge-proficiency}＝σ(W₄×student_H+b₄)

(4.6)练习题目参数表征结果即为向量exercise。

此外，实验平台采用Pycharm中的Pytorch框架，以及诸如numpy、pandas、skleam等工具包来实现数据的预处理、模型构建与训练及结果输出等功能。

本发明将本方法与传统学习诊断方法进行了对比。为了比较结果的客观性，将每种方法都调整到最佳的状态，一种多模态的统一智能学习诊断建模方法与传统学习诊断方法在数据集MATH下的AUC、对比结果如表3所示。

表3实验结果对比

由实验结果可以看出，本发明提出的多模态的统一智能学习诊断建模方法在数据集MATH上的AUC 较传统方法分别提升了7.67％、12.76％、10.01％，RMSE下降了0.0562、0.0052、0.04，比传统方法的准确性更高。说明本发明基于学习者历史学习记录及学习资源信息，在融合多个认知诊断模型的可扩展的诊断框架内，对学习者进行初步诊断，对练习题目进行参数估计，再从学习者与练习题目两个维度构建网络，即学习者参数网络和题目参数网络，能够更好地对练习题目与学习者进行建模，更加充分地挖掘二者的高维特征。结合自注意力机制对学习者与练习题目两方面特征进行有效地融合，从而更加精准地预测学习者表现情况，并准确地诊断学习者的知识掌握情况。

在本发明的描述中，除非另有说明，“多个”的含义是两个或两个以上；术语“上”、“下”、“左”、 “右”、“内”、“外”、“前端”、“后端”、“头部”、“尾部”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。此外，术语“第一”、 “第二”、“第三”等仅用于描述目的，而不能理解为指示或暗示相对重要性。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用全部或部分地以计算机程序产品的形式实现，所述计算机程序产品包括一个或多个计算机指令。在计算机上加载或执行所述计算机程序指令时，全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输)。所述计算机可读取存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如软盘、硬盘、磁带)、光介质(例如DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，都应涵盖在本发明的保护范围之内。

Claims

1.一种多模态的统一智能学习诊断建模方法，其特征在于，所述多模态的统一智能学习诊断建模方法包括以下步骤：

2.如权利要求1所述的多模态的统一智能学习诊断建模方法，其特征在于，步骤一中，所述基于学习者历史学习记录及学习资源信息，构建多通道的认知诊断模型，形成可扩展的诊断框架；在此框架内对学习者进行初步诊断，并对学习资源进行参数估计，得到学习资源参数集与学习者参数集，包括：

(1)构建学习资源集合与学习者历史学习数据集合：

S＝{s₁，s₂，...，s_N}

E＝{e₁，e₂，...，e_M}

K＝{k₁，k₂，...，k_L}；

其中，S为学习者集合，E为练习题目集合，K为知识点集合；

(2)用答题矩阵R记录学生历史答题结果，每一行表示一个学生，每一列表示一道习题；如果学生s答对习题e，则R_se＝1，否则R_se＝0；用习题-知识点矩阵Q表示习题和所考察的知识点之间的关系，每一行表示一道题目，每一列表示一个知识点；如果习题e考察知识点k，则Q_ek＝1，否则Q_ek＝0；

其中，所述参数包括：学***参数，练习题目的难度、区分度、猜测率和失误率；

所述学习者参数集、学习资源参数集定义为：

STUDENT＝{SF₁，SF₂，...，SF_n}

EXERCISE＝{EF₁，EF₂，...，EF_m}；

3.如权利要求1所述的多模态的统一智能学习诊断建模方法，其特征在于，步骤二中，所述结合深度自编码器以构建学习者特征表征网络与学习资源特征表征网络，基于原始参数集分别对学习资源与学习者进行建模，并获取深度表征特征，包括：

(1)对学习者及学习资源参数进行预处理；先对所有参数分别进行分段处理，将连续的参数值按其大小映射为若干离散值，再采用One-Hot方式编码，生成学习者及学习资源参数向量：

student_F＝(SF₁，SF₂，...，SF_n)

exercise_F＝(EF₁，EF₂，...，EF_m)；

其中，SF_i为学习者的某项参数经过One-Hot编码得到的特征向量；EF_j为学习资源的某项参数经过One-Hot编码得到的特征向量；

(2)设计学习者特征深度自编码器，由一个编码器与一个解码器构成，编码器把高维输入编码成低维的隐变量，学习最具信息量的特征；解码器把隐藏层的隐向量还原到初始维度，最佳状态就是解码器的输出能够完全地或者近似恢复为原来的输入，从而使隐向量表征输入信息，并达到降维作用；

4.如权利要求3所述的多模态的统一智能学习诊断建模方法，其特征在于，步骤(2)中，所述利用深度自编码器获取隐特征向量，包括：

2.1)构建编码器获取隐层学习者特征向量：

student_H1＝g(W_s1×student_F+b_s1)

student_H2＝g(W_s2×student_H1+b_s2)；

student_D1＝g(W_s3×student_H2+b_s3)

student_D2＝g(W_s4×student_D1+b_s4)；

其中，g为tanh激活函数，W_s3，W_s4是解码层节点权重参数，b_s3，b_s4为相应的偏置参数；

2.3)提取隐层的特征向量student_H2作为学习者深度表征特征；

步骤(3)中，所述设计学习资源特征深度自编码器，包括：

3.1)构建编码器获取隐层学习者特征向量：

exercise_H1＝g(W_e1×exercise_F+b_e1)

exercise_H2＝g(W_e2×exercise_H1+b_e2)；

exercise_D1＝g(W_e3×exercise_H2+b_e3)

exercise_D2＝g(W_e4×exercise_D1+b_e4)；

其中，g为tanh激活函数，W_e3，W_e4是解码层节点权重参数，b_e3，b_e4为相应的偏置参数；

5.如权利要求1所述的多模态的统一智能学习诊断建模方法，其特征在于，步骤三中，所述引入自注意力机制对学习者特征与学习资源特征进行融合，挖掘各维度特征间的相关性及重要程度信息，根据不同重要程度予以不同权值，对最有效的部分特征予以更多关注，包括：

(1)拼接学习者与练习题目两个维度的特征：

F＝{student_D2，exercise_D}；

Query＝Conv(F)

Key＝Conv(F)

Value＝Conv(F)；

similarity(Query，Key_i)＝Query·Key_i；

4)对输入数据进行加权求和得到融合后的特征数据：

6.如权利要求1所述的多模态的统一智能学习诊断建模方法，其特征在于，步骤四中，所述将融合特征作为用来预测学习者表现情况的数据基础，构建学习者表现预测网络得到对学习者作答正确概率的预测值；通过学习者与练习题目的特征信息诊断学习者的总体知识点掌握情况，获取练习题目的参数表征，包括：

F_c＝Conv(F_a)；

(2)添加Relu激活函数，减少参数间依存关系，避免过拟合：

F_re＝Relu(F_c)；

(3)通过最大池化层降低特征维度：

F_p＝MaxPool(F_re)；

p＝σ(W₃×F_p+b₃)；

其中，W₃，b₃表示要学习的参数，W₃是权重参数，b₃为相应的偏置参数；σ为sigmoid为激活函数；

(5)学习者知识点掌握情况评估方式为：

student_{knowledge-proficiency}＝σ(W₄×student_H+b₄)；

student_H为高维学习者特征向量，W₄，b₄表示要学习的权重与偏置参数，student_{knowledge-proficiency}为学习者知识点掌握情况评估结果；

(6)练习题目参数表征结果即为向量exercise。

7.一种应用如权利要求1～6任意一项所述的多模态的统一智能学习诊断建模方法的多模态的统一智能学习诊断建模***，其特征在于，所述多模态的统一智能学习诊断建模***包括：

8.一种计算机设备，其特征在于，所述计算机设备包括存储器和处理器，所述存储器存储有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行如下步骤：

9.一种计算机可读存储介质，存储有计算机程序，所述计算机程序被处理器执行时，使得所述处理器执行如下步骤：

10.一种信息数据处理终端，其特征在于，所述信息数据处理终端用于实现如权利要求7所述的多模态的统一智能学习诊断建模***。