CN109582864B - 基于大数据科学和动态权重调整的课程推荐方法及*** - Google Patents

基于大数据科学和动态权重调整的课程推荐方法及*** Download PDF

Info

Publication number
CN109582864B
CN109582864B CN201811376466.6A CN201811376466A CN109582864B CN 109582864 B CN109582864 B CN 109582864B CN 201811376466 A CN201811376466 A CN 201811376466A CN 109582864 B CN109582864 B CN 109582864B
Authority
CN
China
Prior art keywords
course
matrix
model
user
generating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811376466.6A
Other languages
English (en)
Other versions
CN109582864A (zh
Inventor
黄昌勤
张捷
朱佳
赵美华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China Normal University
Original Assignee
South China Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China Normal University filed Critical South China Normal University
Priority to CN201811376466.6A priority Critical patent/CN109582864B/zh
Publication of CN109582864A publication Critical patent/CN109582864A/zh
Application granted granted Critical
Publication of CN109582864B publication Critical patent/CN109582864B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了基于大数据科学和动态权重调整的课程推荐方法及***,方法包括:根据用户对课程的评分,生成用户课程矩阵;根据用户课程矩阵,生成学生的偏好信息;根据用户课程矩阵和学生的偏好信息,构建约束模型和独立评分模型;根据约束模型和独立评分模型,基于动态权重调整方法生成课程评分预测值;根据课程评分预测值进行课程推荐。本发明通过约束模型和独立评分模型来预测课程的评分,能够同时考虑全局信息和局部信息,且可以对预测的结果根据实际情况进行调整,效果稳定;另外,本发明在预测课程评分的时候,还采用了动态权重调整方法,大大提高了预测结果的准确性,可广泛应用于深度学习技术领域。

Description

基于大数据科学和动态权重调整的课程推荐方法及***
技术领域
本发明涉及深度学习技术领域,尤其是基于大数据科学和动态权重调整的课程推荐方法及***。
背景技术
当今社会,信息与通讯技术的进步以及普及,对教育环境产生了巨大的影响和发展,在线教育***作为其中发展最迅猛、扩散速度最快之一的领域,广泛地影响着我们的生活。随着在线教育***变得普及,***上的学生和课程的数量正在快速增长,那么如何让学生更好地挑选更感兴趣的、更适应学生特点的、知识量足、知识面全面的课程,已成为当今广受争议的问题:课程推荐问题、课程路径推荐问题。为了解决该问题,一个设计合理、效率保证且能够从大量的数据中根据学生的具体情况来推荐课程和课程路径的***是必不可少的。
在此大前提下,各种课程和课程路径推荐***层次不穷。这些***使用的方法大致可以这么分为两类:基于历史数据的推荐方法、基于内容的推荐方法。其中,基于历史数据的推荐方法:通过对历史数据进行过滤、处理来直接对用户进行课程的推荐,但同时缺少了对实际情况的考虑,对数据量的要求也比较大;基于内容的推荐方法:通过对用户的观察、测试、收集数据等方法把具体某个用户的特征保存在一个对应的数据集中,然后通过领域的方法和建模的方法来对用户进行课程的推荐,但其忽略了历史数据的价值,同时对噪声比较敏感;有一小部分的推荐***同时考虑了基于历史数据的方法和基于内容的方法,但是其多数采用统计的方法或者只是把其中一者作为参考来设计***,难以在数据量庞大时达到较好的效果,同时对数据的处理也相当困难;还有一部分***使用了大数据的方法来实现,但是其使用的方法和模型过于传统、简单,细节上存在着漏洞和不足,没有充分地利用大数据科学的优势,效果只能说是差强人意,因此也并不被广泛认可。此外,上述推荐***还面临两个困境:难以同时考虑全局信息和局部信息、难以对预测的结果根据实际情况进行调整。目前基于大数据技术的模型主要包括:BP神经网络模型(Back PropagationNeural Networks)和决策树模型(Decision Tree),决策树模型运用概率的思想来净现值的期望值大于等于零的概率,但其难以解决***的课程和用户的数量和性质会动态变化且变化速度大导致模型不精准的问题;BP神经网络运用深度学习的思想来实现目标值的预测,但其学习速度慢且输入的参数没有一个***的理论方法,预测效果不稳定。
发明内容
为解决上述技术问题,本发明的目的在于:提供一种准确度高且效果稳定的,基于大数据科学和动态权重调整的课程推荐方法及***。
本发明一方面所采取的技术方案为:
基于大数据科学和动态权重调整的课程推荐方法,包括以下步骤:
根据用户对课程的评分,生成用户课程矩阵;
根据用户课程矩阵,生成学生的偏好信息;
根据用户课程矩阵和学生的偏好信息,构建约束模型和独立评分模型;
根据约束模型和独立评分模型,基于动态权重调整方法生成课程评分预测值;
根据课程评分预测值进行课程推荐。
进一步,所述根据用户课程矩阵,生成学生的偏好信息这一步骤,包括以下步骤:
对用户课程矩阵进行运算,生成第一结果,所述第一结果包括课程共存矩阵和用户共存矩阵;
通过web日志对用户课程矩阵的运算结果进行信息提取,得到学生的偏好信息。
进一步,所述根据用户课程矩阵和学生的偏好信息,构建约束模型和独立评分模型这一步骤,包括以下步骤:
通过矩阵分解法对第一结果进行求解,得到第二结果;
通过正则化奇异值对第二结果进行求解,得到第三结果;
根据第三结果,构建得到约束模型和独立评分模型。
进一步,所述根据用户课程矩阵和学生的偏好信息,构建约束模型和独立评分模型这一步骤,还包括以下步骤:
通过约束模型和独立评分模型,建立多视图神经网络。
进一步,所述通过约束模型和独立评分模型,建立多视图神经网络这一步骤,包括以下步骤:
将约束模型的实时解输入全连接层进行第一训练;
将独立评分模型的实时解输入卷积层进行第二训练;
将约束模型的历史解输入全连接层进行第三训练;
将独立评分模型的历史解输入卷积层进行第四训练;
根据第一训练、第二训练、第三训练和第四训练的结果,建立多视图神经网络。
进一步,所述根据约束模型和独立评分模型,基于动态权重调整方法生成课程评分预测值这一步骤,包括以下步骤:
通过多视图神经网络生成第一预测分量;
通过学生偏好信息生成第二预测分量;
通过最近邻分类算法生成第三预测分量;
基于动态调整权重机制,分别对第一预测分量、第二预测分量和第三预测分量的权重进行配置;
根据权重配置结果,通过第一预测分量、第二预测分量和第三预测分量生成课程评分预测值。
进一步,所述根据课程评分预测值进行课程推荐这一步骤,包括以下步骤:
根据用户课程矩阵生成课程序列集合;
计算课程序列集合中每个课程序列的支持度,并获取支持度大于第一阈值的第一课程序列;
将第一课程序列作为当前课程序列,并根据第一课程序列和当前课程序列,生成课程序列矩阵;
计算课程序列矩阵中每个课程序列的支持度;
判断课程序列矩阵中是否存在课程序列的支持度大于第一阈值,若是,则将大于第一阈值的所有课程序列作为当前课程序列,并返回执行根据第一课程序列和当前课程序列,生成课程序列矩阵的步骤;反之,则执行下一步骤;
筛选课程矩阵中支持度大于第二阈值的课程序列,并将该课程序列作为课程推荐结果。
本发明另一方面所采取的技术方案是:
基于大数据科学和动态权重调整的课程推荐***,包括:
第一生成模块,用于根据用户对课程的评分,生成用户课程矩阵;
第二生成模块,用于根据用户课程矩阵,生成学生的偏好信息;
模型构建模块,用于根据用户课程矩阵和学生的偏好信息,构建约束模型和独立评分模型;
预测模块,用于根据约束模型和独立评分模型,基于动态权重调整方法生成课程评分预测值;
推荐模块,用于根据课程评分预测值进行课程推荐。
本发明另一方面所采取的技术方案是:
基于大数据科学和动态权重调整的课程推荐***,包括:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;
当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现所述的基于大数据科学和动态权重调整的课程推荐方法。
本发明的有益效果是:本发明通过约束模型和独立评分模型来预测课程的评分,相较于现有BP神经网络模型和决策树模型,本发明能够同时考虑全局信息和局部信息,且可以对预测的结果根据实际情况进行调整,效果稳定;另外,本发明在预测课程评分的时候,还采用了动态权重调整方法,大大提高了预测结果的准确性。
附图说明
图1为本发明实施例的步骤流程图;
图2为本发明实施例的多视图神经网络模型的结构示意图。
具体实施方式
下面结合说明书附图和具体实施例对本发明作进一步解释和说明。对于本发明实施例中的步骤编号,其仅为了便于阐述说明而设置,对步骤之间的顺序不做任何限定,实施例中的各步骤的执行顺序均可根据本领域技术人员的理解来进行适应性调整。
多视图神经网络(Multi-view Neural Networks),作为一种深度学习方法,同时具有全连接层和卷积层的特点,且预测速度比BP神经网络较快的优势,能有效克服考虑局部信息和全局信息之间的矛盾的推荐技术障碍。
本发明为了规避现有技术的种种缺陷,运用了大数据科学的特点,有针对性地对数据进行预处理,引入多视图神经网络,该网络包括由两种模型支撑,即:约束模型(Constraint Model,CM)、独立评分模型(Rating Independent Model,RIM)来同时考虑全局信息和局部信息,再使用基于历史数据和基于内容的方法参与建模,之后使用动态调整权重的方法来对模型预测的结果进行调整,配合数据挖掘科学来实现对学生推荐课程和课程路径。
参照图1,本发明实施例提供了一种基于大数据科学和动态权重调整的课程推荐方法,包括以下步骤:
S1、根据用户对课程的评分,生成用户课程矩阵;
具体地,本发明根据在线教育***的数据库得到某一个课程分类下的每一个用户对每一个课程的评分值,这里假定最低0分,最高5分,若用户没有上过某一门课程,则记为空值,并将这一些数据填入到用户-课程矩阵当中。
S2、根据用户课程矩阵,生成学生的偏好信息;
进一步作为步骤S2的优选实施方式,所述步骤S2包括以下步骤:
S21、对用户课程矩阵进行运算,生成第一结果,所述第一结果包括课程共存矩阵和用户共存矩阵;
S22、通过web日志对用户课程矩阵的运算结果进行信息提取,得到学生的偏好信息。
具体地,本实施例对用户课程矩阵进行运算之后,得到的所有第一结果如表1所示:
表1
Figure BDA0001870897520000051
Figure BDA0001870897520000061
另外,本发明通过通过web日志对用户课程矩阵的运算结果进行信息提取后,得到学生的偏好信息的内容如表2所示:
表2
参数 描述
A(t) 学生在选择课程t所属分类的课程占其所选择的总课程的百分比
B(t) 若学生把课程t放入书签、收藏,该值为1,否则该值为0
C(t) e<sup>-o</sup>,其中o个学生完成t课程所属分类课程的平均时间
S3、根据用户课程矩阵和学生的偏好信息,构建约束模型和独立评分模型;
进一步作为步骤S3的优选实施方式,所述步骤S3包括以下步骤:
S31、通过矩阵分解法对第一结果进行求解,得到第二结果;
S32、通过正则化奇异值对第二结果进行求解,得到第三结果;
S33、根据第三结果,构建得到约束模型和独立评分模型。
S34、通过约束模型和独立评分模型,建立多视图神经网络。
具体地,所述第一结果是指步骤S2中表1的结果,所述步骤S31中,对于约束模型的构建过程为:本实施例对表1中的课程共存矩阵
Figure BDA0001870897520000062
和用户共存矩阵
Figure BDA0001870897520000063
做矩阵分解,本实施例用log
Figure BDA0001870897520000064
替代
Figure BDA0001870897520000065
用log
Figure BDA0001870897520000066
替代
Figure BDA0001870897520000067
则有:
Figure BDA0001870897520000071
其中,
Figure BDA0001870897520000072
代表给第i个课程和第j个课程打相同分数的用户数量;
Figure BDA0001870897520000073
代表第i个和第j个用户打相同分数的课程数量;
因此,矩阵A和B的求解过程转化成求解di=[d1i,d2i]和ei=[e1i,e2i]。
对于独立评分模型的构建过程为:本实施例对表1中的Ak进行矩阵分解,即:
Figure BDA0001870897520000074
公式转换后得到:
Figure BDA0001870897520000075
Figure BDA0001870897520000076
其中,
Figure BDA0001870897520000077
代表给第i个课程打k1分和给第j个课程打k2分的用户数量;
Figure BDA0001870897520000078
代表第i个用户打k1分和给第j个用户打k2分的课程数量;
因此,Ak的最终解转化为:
Figure BDA0001870897520000079
上述对矩阵A、B以及Ak的求解转化过程,得到的结果即为第二结果。
所述步骤S32中,通过正则化奇异值对第二结果进行求解,得到第三结果:
具体地,由于
Figure BDA00018708975200000710
以此为依据构建逼近方程来求解d1i、d2j:设d1i Td2jij+μ=rij1,
Figure BDA00018708975200000711
其中β为课程偏差值,μ为全局评分均值,则预测公式为:rij1=rij2,
设目标函数为:
Figure BDA00018708975200000712
当该函数取得最小值时,则此时的rij1为所求的值。
其中Oij
Figure BDA00018708975200000713
不为0值为1,否则值为0,设置的目的是使得当两个课程没有人打过相同分数时不参与计算,以免影响结果精度。
其中f的定义为:
Figure BDA00018708975200000714
则各个参数的梯度如下所示:
Figure BDA00018708975200000715
Figure BDA0001870897520000081
Figure BDA0001870897520000082
Figure BDA0001870897520000083
Figure BDA0001870897520000084
其中,
Figure BDA0001870897520000085
代表μ的学习率;
Figure BDA00018708975200000817
代表μ的一阶导数;
Figure BDA00018708975200000818
代表f的一阶导数;
Figure BDA0001870897520000086
代表βi的学习率;
Figure BDA00018708975200000819
代表βi的代表βj的一阶导数;
с2代表正则化参数;
Figure BDA0001870897520000087
代表代表d1i的学习率;
Figure BDA0001870897520000088
代表代表d2j的学习率;
Figure BDA00018708975200000820
代表d1i的一阶代表正则化参数;
则参数公式更新为:
Figure BDA00018708975200000816
Figure BDA0001870897520000089
Figure BDA00018708975200000810
Figure BDA00018708975200000811
Figure BDA00018708975200000812
其中ε为学习率。
设各种参数通过以下公式进行初始化,使得函数一开始时候的变量具有初始值,并令其
处于求解难度不过大的初始状态:
Figure BDA00018708975200000813
Figure BDA00018708975200000814
Figure BDA00018708975200000815
d1i,k=(rand-0.5)*0.01,k=1,2,…,dim,其中dim为d1i,的维度。
d2i,k=(rand-0.5)*0.01,k=1,2,…,dim,其中dim为d2i,的维度。
其中rand为服从均匀分布[0,1]之间的随机值。
最终求解得到第三结果,并根据第三结果的值,生成约束模型和独立评分模型。
进一步作为步骤S34的优选实施方式,所述步骤S34包括以下步骤:
S341、将约束模型的实时解输入全连接层进行第一训练;
S342、将独立评分模型的实时解输入卷积层进行第二训练;
S343、将约束模型的历史解输入全连接层进行第三训练;
S344、将独立评分模型的历史解输入卷积层进行第四训练;
S345、根据第一训练、第二训练、第三训练和第四训练的结果,建立多视图神经网络。
如图2所示,CM模型(约束模型)得到的是整体的一个学生与课程的低维度嵌入向量,因此适合使用全连接层;而RIM模型(独立评分模型)则得到每一个评分的低维度嵌入向量,因此适合把结果放到卷积层当中。
具体地,所述第一训练过程中,本实施例所述约束模型的实时解,是指步骤S31中约束模型的解,即di=[d1i,d2i]和ei=[e1i,e2i],其与历史数据的解形成对应。
对于dj=[d1j,d2j]、ei=[e1i,e2i],
设Wd、We分别为dj、ei的权重矩阵,Bd、Be分别为dj、ei的偏差值矩阵,则全连接层可以表示如下:
Out(ui)=g(Weei+Be)
Out(tj)=g(Wddj+Bd),
其中,g代表神经网络层的核函数;权重矩阵用于对输入采取一定程度的接受;偏差值矩阵用于防止过拟合;
接着,所述第二训练过程中,使用实时数据的RIM模型的解作为卷积层的输入:
对于步骤S31中独立评分模型的解:
Figure BDA0001870897520000091
设Le、Le为dj k、ei k的权重矩阵,Jd、Je分别为dj k、ei k的偏差值矩阵,由于卷积神经网络共享权值,于是全连接层可以表示如下:
Out(ui,k)=g(Leei k+Je),
Out(tj,k)=g(Lddj k+Jd)。
然后,所述第三训练过程中,使用历史数据的CM模型的解作为全连接层的输入:
假设
Figure BDA0001870897520000101
是历史数据中被学生i打过分课程集合,
Figure BDA0001870897520000102
是历史数据中为课程j打过分的学生集合,
Figure BDA0001870897520000103
其中,h(ui)作为神经网络的用户历史数据的输入;h(tj)作为神经网络的课程历史数据的输入;
设Whu、Wht分别为h(ui)、h(tj)的权重矩阵,Bhu、Bht分别为h(ui)、h(tj)的偏差值矩阵,则全连接层可以表示如下:
Out(ui)=g(Whuh(ui)+Bhu),
Out(tj)=g(Whth(tj)+Bht)。
最后,所述第四训练过程中,使用历史数据的RIM模型的解作为卷积层的输入:
假设Ti k his是历史数据中被学生i打k分的课程集合,Uj k his是历史数据中为课程j打k分的学生集合,
Figure BDA0001870897520000104
设Lhu、Lht为hk(ui)、hk(tj)的权重矩阵,Jhu、Jht分别为hk(ui)、hk(tj)的偏差值矩阵,由于卷积神经网络共享权值,于是全连接层可以表示如下:
Out(ui)=g(Lhuhk(ui)+Jhu),
Out(tj)=g(Lhthk(tj)+Jht)。
S4、根据约束模型和独立评分模型,基于动态权重调整方法生成课程评分预测值;
进一步作为优选的实施方式,所述步骤S4包括以下步骤:
S41、通过多视图神经网络生成第一预测分量;
具体地,本实施例在训练得到多视图神经网络后,找到具体一个课程分类下所有用户对应的没有学过的课程,逐一使用多视图神经网络进行预测,将用户u对课程j的评分预测值记为
Figure BDA0001870897520000105
所述第一预测分量反应的是整体上用户和课程之间的潜在关系和主要关系。
S42、通过学生偏好信息生成第二预测分量;
具体地,本实施例计算第二预测分量的计算公式为:
Figure BDA0001870897520000106
所述第二预测分量反应的是用户的偏好与课程之间的关系。
S43、通过最近邻分类算法生成第三预测分量;
具体地,本实施例提出五种相似度计算方法:
1)、计算皮尔逊相关系数,所述皮尔逊相关系数Sim1(u,v)的计算公式为:
Figure BDA0001870897520000111
2)、计算余弦相似度,所述余弦相似度Sim2(u,v)的计算公式为:
Figure BDA0001870897520000112
3)、计算Jaccard系数,所述Jaccard系数Sim3(u,v)的计算公式为:
Figure BDA0001870897520000113
4)、计算学习风格相似度,所述学习风格相似度Sim4(u,v)的计算公式为:
Figure BDA0001870897520000114
5)、计算知识水平相似度,所述知识水平相似度Sim5(u,v)的计算公式为:
Figure BDA0001870897520000115
最终,根据上述5个相似度的计算结果,计算本实施例的总相似度,所述总相似度Sim(u,v)的计算公式为:
Figure BDA0001870897520000116
根据上式,由KNN(最近邻分类算法)得到与学生u最接近的k个学生stui
Figure BDA0001870897520000117
本实施例的第三预测分量反映的是学生与学生之间相似度和课程的关系。
S44、基于动态调整权重机制,分别对第一预测分量、第二预测分量和第三预测分量的权重进行配置;
具体地,由于课程的适应人群、难度、偏重点等各方面因素不一致,用户的偏好、个人学***、学习能力、关注点有所差别,因此各个预测分量的权重的值应该是动态调整的,才能更好的适应动态变化的整个学习***环境。
本实施例并不改变Wi的值,以免引起整个***的混乱,本实施例采用Wi*hi作为
Figure BDA0001870897520000118
的权重,通过改变hi的值来调整权重。
具体地,对应于
Figure BDA0001870897520000121
Figure BDA0001870897520000122
本实施例分别设置了h1、h2和h3
1)、h1的计算:
首先,对于第j门课程的评分方差s(j):
Figure BDA0001870897520000123
则:h1=1-0.01*s(j)。
2)、h2的计算:
首先,对于第j门课程的偏好预测评分方差:
Figure BDA0001870897520000124
则:
Figure BDA0001870897520000125
3)、h3的计算:
首先,对于第u个用户的评分方差:
Figure BDA0001870897520000126
则:h3=1-0.01*s(u)。
S45、根据权重配置结果,通过第一预测分量、第二预测分量和第三预测分量生成课程评分预测值。
具体地,计算规范化预测结果的过程如下:
首先,设
Figure BDA0001870897520000127
本发明通过设置权重之和WH,能够把预测结果规范在[0,5]的区间内;
则最终预测结果为:
Figure BDA0001870897520000128
S5、根据课程评分预测值进行课程推荐。
进一步作为步骤S5的优选实施方式,所述步骤S5包括以下步骤:
S51、根据用户课程矩阵生成课程序列集合;
S52、计算课程序列集合中每个课程序列的支持度,并获取支持度大于第一阈值的第一课程序列;
S53、将第一课程序列作为当前课程序列,并根据第一课程序列和当前课程序列,生成课程序列矩阵;
S54、计算课程序列矩阵中每个课程序列的支持度;
S55、判断课程序列矩阵中是否存在课程序列的支持度大于第一阈值,若是,则将大于第一阈值的所有课程序列作为第一课程序列,并返回执行步骤S53;反之,则执行步骤S56;
S56、筛选课程矩阵中支持度大于第二阈值的课程序列,并将该课程序列作为课程推荐结果。
具体地,本实施例首先从用户课程矩阵中找出学生u没有选过的,且预测值大于3.5分的课程放进集合T中,在学生中寻找除了u以外且对集合T中的课程评过分的学生作为序列,序列的元素是其学过的按照时间顺序学的且属于T的课程,将全部序列整合到一个表中,如表3所示。
表3
序列号 序列元素
1 abcde
2 acd
3 bacd
4 bcd
5 cabde
然后,将每一节课作为候选序列的一部分,并通过计算候选序列支持度,让支持度大于50%的候选序列作为第一轮的可选序列,计算结果如表4所示。
表4
候选序列 支持度
a 0.8
b 0.8
c 1
d 0.8
e 0.4
其中,支持度的计算方法是:候选序列在总序列表中按序列元素顺序出现的次数占总序列表中序列数量的百分比。由表4可知,当前可选序列为:a、b、c、d。
接着,生成下一轮的候选序列:本实施例以第一轮可选序列作为行标,上一轮的可选序列作为列表,生成一个矩阵,在第i行j列处填入由i作为j的前缀和后缀合并生成元素,并除去相同元素,具体如表5所示。
表5
a b c d
a ab,ba ac,ca ad,da
b ba,ab bc,cb bd,db
c ca,ac cb,bc cd,dc
d da,ad db,bd dc,cd
再接着,生成下一轮的可选序列,本实施例通过计算候选序列的支持度,让支持度大于50%的候选序列作为下一轮的可选序列,如表6所示:
表6
候选序列 支持度
ab 0.4
ac 0.6
ad 0.6
ba 0.2
bc 0.4
bd 0.8
ca 0.2
cb 0.2
cd 1
da 0
db 0
dc 0
由表6可知,当前可选序列为:ac、ad、bd、cd。
然后判断上一步骤是否生成的可选序列,若是,则继续执行生成下一轮的候选序列的步骤;反之,则执行下一步骤。
例如,当前候选序列为表7所示,当前候选序列的支持度为表8所示时,
表7
Figure BDA0001870897520000151
表8
Figure BDA0001870897520000152
Figure BDA0001870897520000161
由表7和表8可知,当前可选序列为:acd、bcd,因此,本实施例返回执行生成下一轮的候选序列的步骤。
而当前候选序列为表9所示,当前候选序列的支持度为表10所示时,
表9
Figure BDA0001870897520000162
表10
候选序列 支持度
abcd 0.2
bcda 0
acdb 0
bacd 0.2
由表9和表10可知,各个序列的支持度均小于0.5,因此不能生成可选序列,于是本实施例执行下一步骤,即:
对生成的候选序列中,筛选其支持度大于0的序列作为最终序列。
例如:在如表10所示的候选序列中,本实施例的最终序列为:abcd和bacd,则该序列即为最佳的可推荐的课程路径。
综上所述,由于现有技术中的大部分课程推荐***都具有以下局限性:
单一地考虑局部或全局的信息,具体表现为:只考虑对两个课程之间评分值一样的用户集合、两个用户评过一样分的课程集合(全局信息),或是只考虑对于某一个评分值再分别求对两个课程之间评分值一样的用户集合、两个用户评过一样分的课程集合(局部信息)。
其中,对于只考虑全局信息的缺陷,其对于整个***中相同偏好的用户、相同类型的课程有很好的表现性,易于捕获全局的倾向,但其忽略了具体用户的评分风格和课程之间的独特性,且容易陷入过拟合;
对于只考虑局部信息的缺陷,其能够很好地看出用户评分一致的课程具有的相同性、不同评分数量之间的差异,评分用户的评分风格等,但是难以从全局去做一个用户和课程相似度的考虑,预测的结果也不稳定。
其次,大部分推荐***使用传统的MF(Matrix Factorization)方法,直接使用用户-课程评分表作为输入数据进行建模,考虑的维度过于简单,预测的效果并不理想。
因此,本发明提出两种新的模型:约束模型(Constraint Model,CM)、独立评分模型(Rating Independent Model,RIM)来改善以上的问题,CM模型善于捕获全局的总体分布,而RIM模型则善于捕获局部的分布。本发明将该两个模型都将用户-课程评分表作为输入,并各输出一个低维嵌入向量,再将该两种低维嵌入向量作为输入,和历史数据一同输入到训练好的多视图神经网络中,并完成对具体某一个用户对某一门课程的评分预测。
另外,在预测用户对课程评分的过程中,本发明从三个角度(k近邻方法、多视图神经网络方法、用户潜在倾向)预测了用户对课程的评分,而在一个在线教育***中,用户对课程的评分并不一直遵循某一种规律进行,往往是动态的、变化的,因此本发明通过引入一种机制:动态调整这三个角度对整个评分的权重,来实现适应这种动态变化,使得预测值更加接近真实值。
本发明实施例还提供了一种基于大数据科学和动态权重调整的课程推荐***,包括:
第一生成模块,用于根据用户对课程的评分,生成用户课程矩阵;
第二生成模块,用于根据用户课程矩阵,生成学生的偏好信息;
模型构建模块,用于根据用户课程矩阵和学生的偏好信息,构建约束模型和独立评分模型;
预测模块,用于根据约束模型和独立评分模型,基于动态权重调整方法生成课程评分预测值;
推荐模块,用于根据课程评分预测值进行课程推荐。
本发明实施例还提供了一种基于大数据科学和动态权重调整的课程推荐***,包括:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;
当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现所述的基于大数据科学和动态权重调整的课程推荐方法。
上述方法实施例中的内容均适用于本***实施例中,本***实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法实施例所达到的有益效果也相同。
以上是对本发明的较佳实施进行了具体说明,但本发明并不限于所述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。

Claims (1)

1.基于大数据科学和动态权重调整的课程推荐方法,其特征在于:包括以下步骤:
根据用户对课程的评分,生成用户课程矩阵;
根据用户课程矩阵,生成学生的偏好信息;
根据用户课程矩阵和学生的偏好信息,构建约束模型和独立评分模型;
根据约束模型和独立评分模型,基于动态权重调整方法生成课程评分预测值;
根据课程评分预测值进行课程推荐;
所述根据用户课程矩阵,生成学生的偏好信息这一步骤,包括以下步骤:
对用户课程矩阵进行运算,生成第一结果,所述第一结果包括课程共存矩阵和用户共存矩阵;
通过web日志对用户课程矩阵的运算结果进行信息提取,得到学生的偏好信息;
所述根据用户课程矩阵和学生的偏好信息,构建约束模型和独立评分模型这一步骤,包括以下步骤:
通过矩阵分解法对第一结果进行求解,得到第二结果;
通过正则化奇异值对第二结果进行求解,得到第三结果;
根据第三结果,构建得到约束模型和独立评分模型;
所述根据用户课程矩阵和学生的偏好信息,构建约束模型和独立评分模型这一步骤,还包括以下步骤:
通过约束模型和独立评分模型,建立多视图神经网络;
所述通过约束模型和独立评分模型,建立多视图神经网络这一步骤,包括以下步骤:
将约束模型的实时解输入全连接层进行第一训练;
将独立评分模型的实时解输入卷积层进行第二训练;
将约束模型的历史解输入全连接层进行第三训练;
将独立评分模型的历史解输入卷积层进行第四训练;
根据第一训练、第二训练、第三训练和第四训练的结果,建立多视图神经网络;
所述根据约束模型和独立评分模型,基于动态权重调整方法生成课程评分预测值这一步骤,包括以下步骤:
通过多视图神经网络生成第一预测分量;
通过学生偏好信息生成第二预测分量;
通过最近邻分类算法生成第三预测分量;
基于动态调整权重机制,分别对第一预测分量、第二预测分量和第三预测分量的权重进行配置;
根据权重配置结果,通过第一预测分量、第二预测分量和第三预测分量生成课程评分预测值;
所述根据课程评分预测值进行课程推荐这一步骤,包括以下步骤:
根据用户课程矩阵生成课程序列集合;
计算课程序列集合中每个课程序列的支持度,并获取支持度大于第一阈值的第一课程序列;
将第一课程序列作为当前课程序列,并根据第一课程序列和当前课程序列,生成课程序列矩阵;
计算课程序列矩阵中每个课程序列的支持度;
判断课程序列矩阵中是否存在课程序列的支持度大于第一阈值,若是,则将大于第一阈值的所有课程序列作为当前课程序列,并返回执行根据第一课程序列和当前课程序列,生成课程序列矩阵的步骤;反之,则执行下一步骤;
筛选课程矩阵中支持度大于第二阈值的课程序列,并将该课程序列作为课程推荐结果。
CN201811376466.6A 2018-11-19 2018-11-19 基于大数据科学和动态权重调整的课程推荐方法及*** Active CN109582864B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811376466.6A CN109582864B (zh) 2018-11-19 2018-11-19 基于大数据科学和动态权重调整的课程推荐方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811376466.6A CN109582864B (zh) 2018-11-19 2018-11-19 基于大数据科学和动态权重调整的课程推荐方法及***

Publications (2)

Publication Number Publication Date
CN109582864A CN109582864A (zh) 2019-04-05
CN109582864B true CN109582864B (zh) 2020-11-10

Family

ID=65923118

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811376466.6A Active CN109582864B (zh) 2018-11-19 2018-11-19 基于大数据科学和动态权重调整的课程推荐方法及***

Country Status (1)

Country Link
CN (1) CN109582864B (zh)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111488400B (zh) * 2019-04-28 2021-03-30 北京京东尚科信息技术有限公司 数据分类方法、装置和计算机可读存储介质
CN110490786B (zh) * 2019-07-10 2024-01-05 广东工业大学 一种基于分布式智能图书站的图书更新方法
CN110580314A (zh) * 2019-07-16 2019-12-17 华南师范大学 基于图卷积神经网络和动态权重的课程推荐方法和***
CN110533971A (zh) * 2019-07-19 2019-12-03 山东至信信息科技有限公司 一种深入互动的智能教学***
CN111079002B (zh) * 2019-11-27 2023-09-22 北京哈沃在线科技有限公司 一种基于隐式反馈数据的偏好计算方法及数据生成装置
CN112925924B (zh) * 2019-12-05 2024-07-09 北京达佳互联信息技术有限公司 多媒体文件的推荐方法、装置、电子设备及存储介质
CN110929163B (zh) * 2019-12-09 2020-10-02 上海复深蓝软件股份有限公司 课程推荐方法、装置、计算机设备及存储介质
CN111062449A (zh) * 2019-12-26 2020-04-24 成都终身成长科技有限公司 预测模型的训练方法、兴趣度预测方法、装置和存储介质
EP3902314B1 (en) * 2020-04-21 2022-10-12 Rohde & Schwarz GmbH & Co. KG Method of training a test system for mobile network testing, test system as well as method of mobile testing
CN112657117B (zh) * 2020-12-23 2022-02-11 浙江好习惯科技有限公司 跳绳课程推荐方法及装置
CN112614029B (zh) * 2020-12-24 2024-04-12 江苏知途教育科技有限公司 一种选修课程推荐的方法和装置
CN112749805B (zh) * 2021-01-15 2024-02-13 浙江工业大学 一种基于多种实体关系的在线课程推荐方法
CN112948710A (zh) * 2021-03-22 2021-06-11 华南师范大学 基于图神经网络的朋辈教育推荐方法、***和存储介质
CN113887852B (zh) * 2021-05-21 2024-04-16 东北大学 一种基于异构图神经的人员推荐方法
CN113643781B (zh) * 2021-06-25 2023-07-04 合肥工业大学 基于时序预警信号的健康干预方案个性化推荐方法及***
CN117290398A (zh) * 2023-09-27 2023-12-26 广东科学技术职业学院 一种基于大数据的课程推荐方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105824897A (zh) * 2016-03-14 2016-08-03 湖南大学 基于卡尔曼滤波的混合推荐***及方法
CN107341204A (zh) * 2017-06-22 2017-11-10 电子科技大学 一种融合物品标签信息的协同过滤推荐方法及***
CN108268934A (zh) * 2018-01-10 2018-07-10 北京市商汤科技开发有限公司 基于深度学习的推荐方法和装置、电子设备、介质、程序
CN108573411A (zh) * 2018-04-17 2018-09-25 重庆理工大学 基于用户评论的深度情感分析和多源推荐视图融合的混合推荐方法
CN108647996A (zh) * 2018-04-11 2018-10-12 中山大学 一种基于Spark的个性化推荐方法及***

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170344556A1 (en) * 2016-05-31 2017-11-30 Linkedin Corporation Dynamic alteration of weights of ideal candidate search ranking model
US11188581B2 (en) * 2017-05-10 2021-11-30 Fmr Llc Identification and classification of training needs from unstructured computer text using a neural network

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105824897A (zh) * 2016-03-14 2016-08-03 湖南大学 基于卡尔曼滤波的混合推荐***及方法
CN107341204A (zh) * 2017-06-22 2017-11-10 电子科技大学 一种融合物品标签信息的协同过滤推荐方法及***
CN108268934A (zh) * 2018-01-10 2018-07-10 北京市商汤科技开发有限公司 基于深度学习的推荐方法和装置、电子设备、介质、程序
CN108647996A (zh) * 2018-04-11 2018-10-12 中山大学 一种基于Spark的个性化推荐方法及***
CN108573411A (zh) * 2018-04-17 2018-09-25 重庆理工大学 基于用户评论的深度情感分析和多源推荐视图融合的混合推荐方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
刘沛文.基于用户行为特征的动态权重混合推荐算法.《计算机应用与软件》.2017,第34卷(第4期),第316-321页. *
基于深度学习的推荐***研究综述;黄立威 等;《计算机学报》;20180731;第41卷(第7期);第4.1.1小节,图7 *
基于用户行为特征的动态权重混合推荐算法;刘沛文;《计算机应用与软件》;20170430;第34卷(第4期);第0节第4段、第1.1节、1.2节 *

Also Published As

Publication number Publication date
CN109582864A (zh) 2019-04-05

Similar Documents

Publication Publication Date Title
CN109582864B (zh) 基于大数据科学和动态权重调整的课程推荐方法及***
CN111368074B (zh) 一种基于网络结构和文本信息的链路预测方法
CN110880019B (zh) 通过无监督域适应训练目标域分类模型的方法
CN110929164A (zh) 一种基于用户动态偏好与注意力机制的兴趣点推荐方法
CN112581263A (zh) 一种基于灰狼算法优化广义回归神经网络的信用评估方法
CN106327240A (zh) 一种基于gru神经网络的推荐方法和***
CN108563755A (zh) 一种基于双向循环神经网络的个性化推荐***及方法
CN109871504B (zh) 一种基于异构信息网络与深度学习的课程推荐***
CN110083699B (zh) 基于深度神经网络的新闻流行度预测模型训练方法
CN115510963A (zh) 一种增量式设备故障诊断方法
CN107026755B (zh) 一种基于排序学习的服务推荐方法
CN116170328A (zh) 图形编码的使用带宽预测方法及装置
CN111832817A (zh) 基于mcp罚函数的小世界回声状态网络时间序列预测方法
CN110110447B (zh) 一种混合蛙跳反馈极限学习机带钢厚度预测方法
CN113361928B (zh) 一种基于异构图注意力网络的众包任务推荐方法
CN114625969A (zh) 一种基于交互近邻会话的推荐方法
CN113409157B (zh) 一种跨社交网络用户对齐方法以及装置
CN117727464A (zh) 基于医疗多视图疾病预测模型的训练方法及设备
CN117495511A (zh) 一种基于对比学习和社区感知的商品推荐***及方法
CN111861038A (zh) 一种基于机器学习算法的高考分数预测方法及***
Chai et al. Correlation analysis-based neural network self-organizing genetic evolutionary algorithm
Mu et al. AD-link: An adaptive approach for user identity linkage
CN115588487A (zh) 一种基于联邦学习和生成对抗网络的医学图像数据集制作方法
CN113704439A (zh) 一种基于多来源信息异构图的会话推荐方法
CN116992098B (zh) 引文网络数据处理方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant