CN111460249B - 一种基于学习者偏好建模的个性化学习资源推荐方法 - Google Patents
一种基于学习者偏好建模的个性化学习资源推荐方法 Download PDFInfo
- Publication number
- CN111460249B CN111460249B CN202010110899.8A CN202010110899A CN111460249B CN 111460249 B CN111460249 B CN 111460249B CN 202010110899 A CN202010110899 A CN 202010110899A CN 111460249 B CN111460249 B CN 111460249B
- Authority
- CN
- China
- Prior art keywords
- learner
- course
- learning
- courses
- historical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 238000013528 artificial neural network Methods 0.000 claims abstract description 16
- 230000007246 mechanism Effects 0.000 claims abstract description 6
- 239000013598 vector Substances 0.000 claims description 91
- 230000006870 function Effects 0.000 claims description 17
- 238000004364 calculation method Methods 0.000 claims description 8
- 230000008569 process Effects 0.000 claims description 8
- 230000006399 behavior Effects 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 230000009286 beneficial effect Effects 0.000 claims description 2
- 230000002159 abnormal effect Effects 0.000 claims 1
- 230000004927 fusion Effects 0.000 claims 1
- 238000012545 processing Methods 0.000 description 10
- 239000013604 expression vector Substances 0.000 description 7
- 239000011159 matrix material Substances 0.000 description 7
- 238000012549 training Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 230000004913 activation Effects 0.000 description 3
- 210000002569 neuron Anatomy 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 238000007418 data mining Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
- G06Q50/205—Education administration or guidance
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Educational Administration (AREA)
- Educational Technology (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- General Business, Economics & Management (AREA)
- Electrically Operated Instructional Devices (AREA)
Abstract
本发明提供的是一种基于学***台中获取学习者相关学习日志文件,包括学习者的历史课程注册记录、对应课程分数以及课程相关属性等数据作为输入数据,通过嵌入注意力机制来更好地获取学习者的历史课程偏好,将其作为自动编码器神经网络的编码输入,然后构建课程知识图谱获得课程先决知识关系,根据课程之间的关联性进行解码,最后计算出学习者学习目标课程的概率,根据概率由大到小来生成学习者的目标推荐列表,以此提高推荐结果的个性化和准确性。
Description
(一)技术领域
本发明涉及机器学习、推荐***以及数据挖掘等技术领域,具体是涉及一种面向学习资源推荐的学习者画像构建方法。
(二)背景技术
随着教育信息化深入发展,在线教育资源的数量呈现出指数级增长的趋势,如何帮助学***台来说至关重要。因此,如何根据学习者的历史注册课程来构建学习者的偏好特征,这是个性化学习资源推荐***的关键。以往的学习者偏好建模方法,大多数都是根据用户历史注册的课程记录,通过生成课程的特征向量来刻画学习者的偏好特征,进而给学习者生成个性化的学习资源推荐。然而,用户历史注册课程记录仅包含有限的特征信息,由于课程的特征生成的学习者偏好过于单一,无法全面地表示学习者的兴趣,不能很好地满足学习者个性化的要求,同时也没有考虑学习者--课程交互数据的稀疏性和冷启动问题,不能准确地根据学习者的偏好给学习者推荐所需要的信息。
目前已公布的发明专利“面向个性化学习的教育资源推荐方法及***”,公开号为CN106528693A,通过学习者的基本特征数据对学习者兴趣进行建模,并计算不同学习者之间以及不同学习资源之间的相似度,进而生成目标学习者的资源推荐结果。该发明没有考虑学习者历史课程学习对推荐服务的不同影响,也忽略了学习资源之间的关联性,没能较准确地给用户推荐服务。另外已公布的发明专利“一种基于思维地图的网络学习资源推荐方法”,公开号为CN103455576B,通过分析学习者访问基于知识图谱的网络学习***的学习行为日志,以点击流来评判学习时间,并根据学习路径挖掘出相关知识元图谱,从而反馈给学习者进行推荐服务。该发明考虑了学习资源的关联性,但是却忽略了学习者的历史偏好,根据学习时间不能很好地展现学习者的偏好。本发明描述的“一种基于学习者偏好建模的个性化学习资源推荐方法”将用户的历史访问项目输入到自动编码器(AE)中生成课程的特征向量,为了更好地刻画学习者的历史注册课程记录对目标推荐课程的不同影响以及表征学习者多样化的偏好,本发明设计了通过注意力网络编码来构建学习者的偏好向量,以及利用课程先决知识条件关系来构建课程知识图谱,并通过高斯径向基函数核(RBF)计算课程之间的关联度进行解码,最后通过得到学习者的偏好向量与课程间的先决关系来计算出学习者学习课程的概率,根据概率由大到小生成学习者的推荐列表,以此提高推荐结果的个性化和准确性。
(三)发明内容
本发明所要解决的是目前基于学习者偏好建模个性化推荐方法中,学习者-课程交互数据的稀疏性问题,学习者偏好无法合理地扩展以及没有考虑学习者历史注册课程记录对目标课程的不同影响以及课程关联语义信息等问题,提供了一种基于学习者偏好建模的个性化学习资源推荐方法。
为实现上述目的,本发明的具体方案如下:
一种基于学习者偏好建模的个性化学习资源推荐方法,包括以下步骤:
步骤一:获取在线学习平台上的学习者相关学习日志文件。由于采集到的原始数据不能直接用于之后的计算,需要对采集到的原始数据进行数据的预处理操作。
步骤二:学习者注册该课程且进行学习考试后得到这门课程的成绩,该结课成绩为百分制。则根据学习者历史注册课程的成绩信息,将该学习者已学习的课程分别划分为正例和负例。
步骤三:利用课程及其各种属性,构建课程的实体关系三元组,然后以实体关系三元组为基础单元构建相关的课程知识图谱,发掘出课程之间的关联性。
步骤四:为了刻画用户历史课程对目标课程的不同影响以及区分学习者对不同类型课程的偏好,引入注意力机制更好地获得学习者的历史偏好向量。
步骤五:将学习者历史偏好向量与课程之间关联度分别作为编码与解码输入至自动编码器神经网络中,获得学习者的目标课程推荐列表。
进一步的,所述步骤一中,学***台的网页日志中,可利用相关的爬虫工具技术爬取出学习者的学习行为记录,将其存储于数据库中。
进一步的,所述存储在数据库中的数据由于直接从网上爬取,并未进行数据清洗,数据存在不完整、格式不统一等问题,需要对数据进行相关的数据预处理操作。
进一步的,所述步骤二中,为了方便今后处理以及考虑学习者的隐私问题,对数据处理后的学习者的日志记录的各属性值进行相应方式编码,通过学习者的历史成绩将其划分为正负例,具体过程包括:
(1)遍历学习者的日志文件记录表,获得学习者每门课程对应的课程成绩;
(2)给每门课程分配一个标签,若学习者获得的课程成绩大于60分,将其作为用户会喜欢的项目(正例),并赋予标签为1,小于60分的为用户为不喜欢的项目(负例),赋予标签为0;
进一步的,所述步骤三中,使用网络表示学习方法学习课程知识图谱中的结点结构及其属性特征,将课程知识图谱中每个实体和关系表示为一个对应的低维特征向量,
进一步的,再根据每个实体的特征向量生成该实体的上下文特征向量,根据该课程实体之间的上下文特征向量利用高斯径向基函数(RBF)计算出课程相互之间的关联度;
进一步的,在步骤四中,将预处理后的学习者历史注册课程的多热向量中添加注意力系数,计算学习者对每个历史注册课程的影响权重,通过添加注意力系数计算学习者对历史注册课程向量表示并进行加权和,进而得到学习者对目标课程的偏好向量。
进一步的,在步骤五中,构建基于自动编码器神经网络的课程推荐模型,确定自动编码器的神经网络具有三层,即输入层、隐含层和输出层,自动编码器神经网络的各参数值得设置方法如下:
(1)确定自动编码器神经网络输入层神经元个数,设定输入层神经元个数为学习者对应课程标签的个数;
(2)确定自动编码器神经网络隐含层神经元个数;
(3)确定自动编码器神经网络各层的激活函数;
(4)确定自动编码器神经网络编码与解码的方法;
(5)确定自动编码器神经网络的训练方法;
(6)确定自动编码器神经网络的训练要求精度;
(7)确定自动编码器神经网络的学习率。
进一步的,所述步骤五中,将嵌入注意力机制获得学习者偏好向量作为自动编码器神经网络的编码输入,以及通过课程知识图谱获得的课程关联性作为自动编码器的解码。模型最后输出学习者的学习目标课程的概率,并将学习者不同目标课程的预测概率按大到小进行排列,取前K个课程获得学习者推荐目标课程列表。
本发明的有益效果:
与现有的技术相比,本发明具有如下优势:
1.本发明将根据课程的特征来构成三元组,并以三元组为单元来构建课程知识图谱。三元组的使用不仅简化了数据的存储,还保留了课程的重要属性;课程知识图谱的使用能够较为显著地展示出课程之间的关系,通过关系表现出不同课程的联系,使得推荐课程据更加丰富、准确和多样化。
2.本发明使用网络表示学习的方法,将课程知识图谱中的三元组向量化,即将课程关系三元组中的课程实体和关系映射到低维度向量空间中,将其表示成向量。该方法将繁杂的网络节点结构和属性数据表示为简单、低维的向量,不仅保留原来数据的特征,还极大地简化了计算,使课程之间的关联性结果变得更加合理化。
3.本发明在计算用户偏好向量表示时,使用自动编码器的框架下将学习者历史注册课程的实体向量作为输入,这充分利用了自动编码器能够较好地解决非线性数据的问题,使得生成的学习者偏好能够较好地表学习者的喜好。
4.本发明添加注意力系数来进行编码,能够很好地表示对学习者对不同历史注册课程中不同特征向量的权重,考虑了学习者对不同类型课程的多样化兴趣,从而保证了学习者画像的全面性与准确性。
(四)附图说明
图1为本发明的模型框架图。
图2为面向个性化学习资源推荐的学习者偏好建模整体流程图。
图3为数据采集和处理流程图。
图4为知识图谱中项目的向量化流程图。
图5为自动编码器AE框架结构示意图。
图6为学习者历史注册课程偏好向量生成流程图。
图7为课程先决关系影响向量及学习者学习目标课程概率生成流程图。
(五)具体实施方式
为使本发明的目的、技术方案和优点更加清楚,以下结合具体实例,并参照附图,对本发明进一步详细阐述。
本发明以基于学习者偏好建模的个性化学习资源推荐为实例描述本发明方法具体实施过程。本发明的模型框架如图1所示,个性化学习资源推荐的整体流程如图2所示。结合示意图说明具体步骤:
步骤1:利用爬虫技术从某一在线学习平台中采集相关学习者注册课程的历史记录信息,例如根据时间顺序获得学习者学习的课程(运筹学→数据挖掘→人工智能→线性代数→组合数学),以及学习者的结课成绩信息和相关课程特征属性数据,由于原始数据的学习者和课程名较为复杂,为了方便处理,将以数字编号进行相应的处理;
步骤2:由于学习者对所学课程的评分信息较少,不能完全说明学习者的偏好,因此将步骤1获得的学习者的对应课程成绩作为其对相应课程的隐式评分,成绩范围为0到100分。为了便于计算,将成绩大于等于60分的课程标记为1,作为学习者喜欢的课程(正例),小于60分的课程标记为0,作为学习者不喜欢的课程(负例);
步骤3:根据课程的相关属性信息,构建课程实体与关系的三元组,例如:“数据结构属于计算机类课程”,则可以用三元组<数据结构,类型,计算机>表示,其中“数据结构”为课程实体,“类型”为三元组的关系属性,“计算机”为课程的属性,将所有课程及其相关属性值表示成以上三元组的形式来构建课程知识图谱,并利用网络表示学习(如TransE)的方法来为知识图谱中的每一个课程、关系和课程属性映射为一个低维的课程特征向量;
步骤4:将学习者历史注册课程特征向量通过步骤2转换为多热编码向量,将其输入到AE输入层中,即将经过隐藏层的处理得到学习者历史注册课程的表示;为了表示学习者对历史注册课程不同的影响以及表征游客的不同偏好,将步骤4得到的学习者历史注册课程向量输入到注意力网络中,计算学习者对每门课程的影响权重,则最后得到学习者的课程偏好向量通过计算学习者历史注册课程向量表示的加权和;
步骤5:对于步骤3构建的课程知识图谱,可以根据课程三元组得到课程相互之间的关联度,比如,在学习线性代数之前需要先学习高等数学,这是考虑课程先决知识条件的因素。若未学习课程与学习过的课程之间有一定的关联,那么通过高斯径向基核函数可以计算得到两门课程之间的关联度;
步骤6:将步骤4得到的学习者对历史课程的偏好向量与步骤5获得课程之间的关联度输入到自动编码器中进行学习,计算出学习者对学习目标课程的概率,将不同目标课程的预测概率从大到小进行排序,取前N个课程作为向该学习者推荐的课程列表。
图3显示的是本实例数据采集和处理的流程图,具体的步骤包含:
步骤1:通过已有的网络爬虫工具,在中国慕课大学、网易云、Coursera等在线学习网站上爬取相关学习者的历史课程学习记录,对应课程成绩以及课程的相关特征属性,课程特征属性包括:课程类型、课程时长、课程的难易程度等。由于采集的原始数据会存在一些数据不完整、不规整等问题,无法直接用于往后的运算中,则需要对无用的数据进行数据清洗。比如,去除那些学习者已注册了课程,但中途却辍课没有结课成绩的课程记录信息。
步骤2:经过步骤1处理后的原始数据不能直接作为模型的输入,为了便于后续计算,需要为上述学习者、课程和课程属性值进行数字编号。即将步骤1处理后的学习者、课程和课程相关属性值都设置为唯一的数字ID,用该数字ID表示唯一的一个对象。例如,学习者“hs_356”的ID值设为0,学习者“tys08”的ID值设为1,课程“计算机导论”的ID值设为10,类似地,用该种编码方式对所有的学习者、课程和课程属性都分配一个匿名的编码后的数字ID值。
步骤3:由于所获得的学习者对注册课程的成绩属于隐式评分,其分值均在0到100分之间,为了便于处理和简化后续的计算,将学习者的课程成绩大于等于60分的课程标注为正例,表示学习者喜欢的课程,标记为1;将学习者对课程成绩小于60分的课程标注为负例,表示学习者不喜欢的课程,标记为0,同时正例和负例的数量比例是相同的。
步骤4:将上述步骤3处理后的数据以三元组(l,r,c)的形式表示,l,r,c分别为头实体,关系和尾实体,在本实施例中l,r,c分别为学习者,课程和标签。例如,学习者1在课程10中的成绩为86分,则可以表示为(1,10,1),其中1表示学习者的ID,10表示课程的ID,1为标签。将所有数据都表示成上述三元组的形式,三元组的形式可以清晰地表示学习者对历史注册课程的喜好程度,方便之后构建课程知识图谱。将三元组中的头实体和尾实体通过关系进行链接,形成课程的知识图谱,其中含有课程先决知识关系信息的有向语义网,即知识图谱由大量的课程实体、关系和课程属性组成。
步骤5:上述三元组中的实体和关系只是课程和关系属性的ID表示,无法直接作为模型的输入,因此需要利用网络表示学习的方法将课程知识图谱中的课程实体和关系属性表示成低维的特征向量。在本实施例使用网络表示学习中的TransE模型来处理知识图谱,为描述的三元组中的课程实体和关系分别学习为一个唯一的低维特征向量,向量化后的课程实体和关系仍以三元组的形式存在。
上述知识图谱中项目的向量化流程如图4所示,其中步骤包括:
步骤1:从构建好的课程知识图谱中抽取出相应三元组的课程实体、关系和属性ID值;
步骤2:利用均匀分布产生的随机值初始化实体表示向量、关系表示向量和属性表示向量的各个维度,在该实施例中表示向量的维度为N,由此得到课程实体表示向量l,关系表示向量r和属性表示向量c,初始化所有向量后需要对上述表示向量进行归一化操作,通过归一化控制表示向量的模长度;
步骤3:将归一化后的课程实体表示向量l、关系表示向量r和属性表示向量c在TransE模型下进行训练,使这三个表示向量在向量空间中满足l+r=c的距离性质,即课程实体表示向量l加上关系表示向量r等于属性表示向量c。其中,训练三元组并映射到向量空间的得分函数为:
fr(l,c)表示得分函数,L1/2表示得分函数可以使用L1范式或者L2范式进行运算,整个公式的含义是课程实体表示向量l和关系表示向量r相加所得的表示向量与属性表示向量c间地距离。在训练时使用随机梯度下降(Stochastic Gradient Descent,SGD)的方法更新课程实体表示向量l、关系表示向量r和属性表示向量c,使得上述表示向量间的关系满足得分函数fr(l,c)的要求,即fr(l,c)尽可能地趋近于0。
步骤4:在实际的模型训练过程中,为了将三元组中的课程实体,关系和属性分别学习一个唯一的低维表示向量,通过最小化下面的目标函数实现:
其中,S是正确的三元组的集合,S'是错误三元组的集合,max(x,y)的作用是返回的x和y中较大的值,γ为正确三元组得分和错误三元组的得分之间的间隔距离。TransE模型训练的过程也就是通过调整各个三元组中实体、关系及属性的表示向量,使得目标函数L取得最小,也即通过优化表示向量使得正例三元组得分fr(l,c)尽可能接近0,而负例三元组得分fr(l',c')尽可能偏离0。通过优化函数的计算,使得正例三元组中的课程实体表示向量l和关系表示向量r相加所得的向量越来越接近属性表示向量c,负例三元组的课程实体表示向量l'和关系表示向量r相加所得的表示向量越来越远离属性表示向量c'。
TransE模型中的正例三元组S由课程知识图谱中的客观事实构成,负例三元组S'则由算法通过替换正例三元组S中的实体h或属性t随机生成的,即构成与客观事实相反的三元组。例如,正例三元组<操作***,类型,计算机>,<操作***,课时,48课时>,则负例三元组分别可以为<操作***,类型,电子工程>、<操作***,课时,30课时>等。TransE模型通过正例三元组构建比例相等的负例三元组来完成课程知识图谱中各个实体,关系和属性表示向量的训练。
通过TransE模型向量化课程知识图谱中实体,关系和属性后,可以得到一个课程实体的表示向量。然而,一个课程实体除了自身的特征向量之外,还可以通过该实体的上下文实体来表示,即实体e还可以由它在知识图谱中周围的其它实体特征向量共同表示。实体e的上下文定义为在知识图谱中与e直接相连的实体集合C(e),即:
C(e)={ei|(e,r,ei)∈Gor(ei,r,e)∈G} (3)
其中r为关系,G为课程知识图谱。从语义和逻辑上看,上下文实体通常与当前实体具有紧密的相关性,上下文实体的使用可以提供更加完备的辅助信息,帮助增加实体的可辨识性。例如,课程“操作***”的上下文实体包括“计算机(课程类型)”,“48课时(课程课时)”,“基础(课程难易程度)”等。给定实体e的上下文,则实体e的上下文特征向量e'通过计算e上下文实体的平均得到:
其中ei为实体ei通过TransE学到的特征向量。
自动编码器AE的框架结构如图5所示,其结构为:输入层,隐含层,输出层。实体向量表示的维度为N,隐含层的嵌入维度表示为(H,N)。输入层接收输入的是将学习者历史学习课程的实体特征向量。首先经过AE的隐含层编码处理之后,得到历史学习课程的向量表示,由于历史学习课程对目标课程有不同的影响,为了得到用户多样化的兴趣,本发明提出利用注意力网络计算出不同历史学习课程的权重系数,根据历史注册课程的向量表示及相应的权重系数计算其加权和,以此得到学习者最后的偏好,再考虑课程先决知识关系因素,对其进行解码,通过输出层计算该学习者学习该课程的概率。
通过注意力网络计算学习者每个历史注册课程的影响权重,编码得到学习者对课程的偏好向量的流程如图6所示,具体的步骤如下:
步骤2:上述步骤1得到学习者的课程特征向量和自动编码器AE的权重矩阵W1进行选择和累加,得到学习者的隐含向量表示:
通过上述步骤得到课程的特征向量表示后,常见的方法是通过平均学习者所有历史注册课程的向量表示作为学习者对目标课程的偏好向量。但是,由于课程的类型等其他因素的影响,所以每个学习者对不同课程的偏好是不一样的,因此,需要考虑学习者是否会选择学习某一目标课程时,学习者的历史注册课程被认为对选择目标课程具有不同的权重。为了刻画学习者对学习资源多样化的兴趣,本发明提出加入注意力网络到自动编码器中进行编码,进一步建模学习者的历史注册课程对目标课程的不同影响。
步骤3:将步骤2经过隐含层后学习者的隐含向量由一个非线性变换函数tanh,再利用softmax归一化输出影响权重au;
构建课程知识图谱来考虑课程先决知识关系因素,通过高斯径向核基函数来计算课程之间的关联性,以及学习者学习目标课程的概率流程如图7所示,具体的步骤如下:
步骤1:首先考虑学习者已注册的课程对未注册课程的影响,而且课程与课程之间的关联性也会对学习者选择目标课程产生影响,因此,需要考虑课程之间是否具有一定的关联性。与计算学习者隐含向量相似,学习者u的注册课程表示为Cu={C1,…,Cn,},则对未注册课程向量的影响权重系数为:
Pu=W2·W1[Cu] (8)
其中Pu维度为(N,n),W2是权重系数矩阵。
步骤2:利用构建的课程知识图谱,通过高斯径向核基函数(RBF)来计算课程之间的关联度:
其中ci,cj表示的是两个课程之间的位置,γ作为超参数大于0且用来控制两个课程之间的关联度,K(ci,cj)的范围在0到1之间。
步骤3:将步骤2得到的课程关联度,可得到课程先决知识条件因素后影响权重向量为:
Pu=(W2·W1[Cu])⊙K[Cu] (10)
其中K[Cu]即为公式(5)的K(ci,cj),⊙表示为元素对的乘积。
步骤4:通过步骤3得到影响权重系数后,学习者的历史注册课程Cu对目标未注册课程cj的影响向量Pu通过计算课程先决知识条件Pu的加权和得到:
步骤5:经过上述步骤得到课程先决知识条件因素影响向量后,将隐藏层学习者偏好向量输入乘以权重矩阵加上偏置项b,其中权重矩阵W2的维度为(N,H),偏置项的维度为(H),再通过Relu函数对隐藏层的输出进行激活处理,然后利用sigmoid进行归一化得到最终的学习者对目标课程学习的概率:
当然,以上所述实例仅是本发明的较优实施例,本发明并非局限于上述实施例和实施例方法。相关技术领域的从业者可在本发明的技术思路许可的范围内进行不同的细节调整和实施,故凡依本发明专利申请范围所述的构造、特征及原理所做的等效变化或修饰,均包括于本发明专利申请。
Claims (5)
1.一种基于学习者偏好建模的个性化学习资源推荐方法,其特征是,包括以下步骤:
步骤一:获取在线学***台中的历史课程注册记录、课程分数和课程相关属性数据,利用相关的爬虫工具技术爬取出学习者的学习行为记录,或者与后台服务器直接连接,将所需信息存储于数据库中;
步骤二:学习者注册该课程且进行学习考试后会得到这门课程的成绩,该结课成绩为百分制;根据学习者历史注册课程的成绩信息,将该学习者历史学习课程分别划分为正例和负例;
步骤三:利用课程及其各种属性,构建课程的实体关系三元组,然后以实体关系三元组为基础单元构建相关的课程知识图谱,发掘出课程之间的关联性;使用网络表示学习方法、学习课程知识图谱中的结点结构及其属性特征,将课程知识图谱中每个实体和关系表示为一个对应的低维特征向量;
步骤四:为了刻画用户历史课程对目标课程的不同影响以及区分学习者对不同类型课程的偏好,引入注意力机制更好地获得学习者历史偏好向量;
步骤五:将学习者历史偏好向量融合和课程之间的关联度分别作为编码与解码输入至自动编码器神经网络中,获得学习者的目标课程推荐列表;利用注意力机制编码以及课程关联度解码的自动编码器神经网络;自动编码器神经网络能够解决数据的非线性关系,并且能够很好地抓取出项目的偏好特性,嵌入注意力机制编码可以更好地获得项目对用户的偏好特征,同时利用课程关联性解码,使在学习资源推荐模型过程中为学习者推荐目标课程更加精准,更具代表性。
2.根据权利要求1所述的一种基于学习者偏好建模的个性化学习资源推荐方法,其特征是,爬取到的数据中学习者可能存在课程成绩的缺失或者异常,需要对其进行数据的预处理,如对不完整或缺失数据记录进行删除,以及为保护学习者隐私,采用对学习者和课程进行数值编码的方式,规范化的数据更利于今后的操作。
3.根据权利要求1所述的一种基于学习者偏好建模的个性化学习资源推荐方法,其特征是,可采用某一分数为界限,对课程进行正负例划分,以区分学习者喜欢与不喜欢的课程,成绩分数越高表示学习者越喜欢这门课,并给课程进行打标签数字编号,1表示喜欢,反之0表示不喜欢。
4.根据权利要求1所述的一种基于学习者偏好建模的个性化学习资源推荐方法,其特征是,通过每个实体的特征向量生成该实体的上下文特征向量,根据该课程实体之间的上下文特征向量并利用高斯径向基函数(RBF)计算出课程相互之间的关联度。
5.根据权利要求1所述的一种基于学习者偏好建模的个性化学习资源推荐方法,其特征是,目标课程推荐列表为根据课程推荐模型输出学习者的学习目标课程的概率,将学习者不同目标课程的预测概率按大到小进行排列,取前K个课程,即获得推荐目标课程列表。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010110899.8A CN111460249B (zh) | 2020-02-24 | 2020-02-24 | 一种基于学习者偏好建模的个性化学习资源推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010110899.8A CN111460249B (zh) | 2020-02-24 | 2020-02-24 | 一种基于学习者偏好建模的个性化学习资源推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111460249A CN111460249A (zh) | 2020-07-28 |
CN111460249B true CN111460249B (zh) | 2022-09-09 |
Family
ID=71683220
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010110899.8A Active CN111460249B (zh) | 2020-02-24 | 2020-02-24 | 一种基于学习者偏好建模的个性化学习资源推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111460249B (zh) |
Families Citing this family (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112001656A (zh) * | 2020-09-01 | 2020-11-27 | 北京弘远博学科技有限公司 | 基于员工历史培训信息针对性进行培训课推荐的方法 |
CN112116030B (zh) * | 2020-10-13 | 2022-08-30 | 浙江大学 | 一种基于向量标准化和知识蒸馏的图像分类方法 |
CN112507132B (zh) * | 2020-12-14 | 2022-08-05 | 天津大学 | 一种基于知识图谱和注意力机制的推荐方法 |
CN112541846B (zh) * | 2020-12-22 | 2022-11-29 | 山东师范大学 | 一种基于注意力机制的高校选修课混合推荐方法及*** |
CN112614029B (zh) * | 2020-12-24 | 2024-04-12 | 江苏知途教育科技有限公司 | 一种选修课程推荐的方法和装置 |
CN112614032B (zh) * | 2020-12-28 | 2021-07-20 | 深圳市诺达教育股份有限公司 | 基于大数据的教育软件数据处理方法 |
CN112650926A (zh) * | 2020-12-30 | 2021-04-13 | 广东德诚科教有限公司 | 一种基于大数据技术的农民个性化课程资源的推荐方法 |
CN112749340A (zh) * | 2021-01-19 | 2021-05-04 | 敖客星云(北京)科技发展有限公司 | 基于大数据的课程推荐方法、***、移动终端及存储介质 |
CN113032415B (zh) * | 2021-03-03 | 2024-04-19 | 西北工业大学 | 一种基于用户偏好与知识图谱的个性化产品描述生成方法 |
CN113220895B (zh) * | 2021-04-23 | 2024-02-02 | 北京大数医达科技有限公司 | 基于强化学习的信息处理方法、装置、终端设备 |
CN113190747B (zh) * | 2021-04-29 | 2023-04-14 | 深圳采贝教育科技有限公司 | 一种基于学***的个性化资源推荐方法 |
CN113343100B (zh) * | 2021-06-25 | 2024-01-30 | 中关村智慧城市产业技术创新战略联盟 | 一种基于知识图谱的智慧城市资源推荐方法和*** |
CN113378076B (zh) * | 2021-06-29 | 2022-10-18 | 哈尔滨工业大学 | 面向在线教育的学习者协同学习社交关系构建方法 |
CN113254845B (zh) * | 2021-07-07 | 2021-09-21 | 江西交通职业技术学院 | 一种基于大数据的教育***及数据处理方法 |
CN113469819A (zh) * | 2021-07-15 | 2021-10-01 | 中国银行股份有限公司 | 基金产品的推荐方法、相关装置及计算机存储介质 |
CN113722591B (zh) * | 2021-08-31 | 2024-02-23 | 南京邮电大学 | 一种在线课程推荐方法 |
CN113742586B (zh) * | 2021-08-31 | 2023-10-24 | 华中师范大学 | 一种基于知识图谱嵌入的学习资源推荐方法及*** |
US12020592B2 (en) | 2021-10-22 | 2024-06-25 | International Business Machines Corporation | Efficiently manage and share resources during e-learning |
CN113987359B (zh) * | 2021-12-08 | 2024-06-18 | 福寿康智慧医疗养老服务(上海)有限公司 | 一种基于知识图谱评分预测的养老护理行业课程推荐方法 |
CN114429281B (zh) * | 2021-12-30 | 2022-11-15 | 华中师范大学 | 一种基于深度聚类算法的在线学习者活跃度测评方法 |
CN114567815B (zh) * | 2022-01-20 | 2023-05-02 | 清华大学 | 一种基于预训练的慕课自适应学习***构建方法和装置 |
CN114896512B (zh) * | 2022-06-09 | 2024-02-13 | 陕西师范大学 | 基于学习者偏好与群体偏好的学习资源推荐方法及*** |
CN116342335B (zh) * | 2023-02-03 | 2023-11-14 | 武汉博奥鹏程教育科技有限公司 | 一种课程的推荐方法和装置 |
CN116340625B (zh) * | 2023-03-15 | 2024-04-05 | 武汉博奥鹏程科技投资有限公司 | 结合学习状态适合度和课程搭配度的课程推荐方法及装置 |
CN117743985A (zh) * | 2023-12-21 | 2024-03-22 | 广州盈培教育科技有限公司 | 基于移动互联网的在线培训课程推荐方法及*** |
CN117910560B (zh) * | 2024-03-20 | 2024-06-07 | 徐州医科大学 | 一种基于学习偏好测评的多风格学习教程生成*** |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106528656A (zh) * | 2016-10-20 | 2017-03-22 | 杨瀛 | 一种基于学员历史和实时学习状态参量实现课程推荐的方法和*** |
CN109800853A (zh) * | 2018-11-30 | 2019-05-24 | 华南师范大学 | 融合卷积神经网络和显式反馈的矩阵分解方法、装置及电子设备 |
CN110555112A (zh) * | 2019-08-22 | 2019-12-10 | 桂林电子科技大学 | 一种基于用户正负偏好学习的兴趣点推荐方法 |
CN110659411A (zh) * | 2019-08-21 | 2020-01-07 | 桂林电子科技大学 | 一种基于神经注意力自编码器的个性化推荐方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9495514B2 (en) * | 2009-01-02 | 2016-11-15 | Cerner Innovation, Inc. | Predicting neonatal hyperbilirubinemia |
CN109213863B (zh) * | 2018-08-21 | 2022-05-24 | 北京航空航天大学 | 一种基于学习风格的自适应推荐方法及*** |
CN110362738B (zh) * | 2018-11-06 | 2021-12-21 | 杭州电子科技大学 | 一种基于深度学习的结合信任和影响力的个性化推荐方法 |
CN110288436A (zh) * | 2019-06-19 | 2019-09-27 | 桂林电子科技大学 | 一种基于游客偏好建模的个性化景点推荐方法 |
CN110609960B (zh) * | 2019-09-25 | 2022-02-22 | 华中师范大学 | 学习资源推荐方法、装置、数据处理设备及存储介质 |
-
2020
- 2020-02-24 CN CN202010110899.8A patent/CN111460249B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106528656A (zh) * | 2016-10-20 | 2017-03-22 | 杨瀛 | 一种基于学员历史和实时学习状态参量实现课程推荐的方法和*** |
CN109800853A (zh) * | 2018-11-30 | 2019-05-24 | 华南师范大学 | 融合卷积神经网络和显式反馈的矩阵分解方法、装置及电子设备 |
CN110659411A (zh) * | 2019-08-21 | 2020-01-07 | 桂林电子科技大学 | 一种基于神经注意力自编码器的个性化推荐方法 |
CN110555112A (zh) * | 2019-08-22 | 2019-12-10 | 桂林电子科技大学 | 一种基于用户正负偏好学习的兴趣点推荐方法 |
Non-Patent Citations (3)
Title |
---|
Attentional Autoencoder for Course Recommendation in MOOC with Course Relevance;Jindan Tan et al.;《2020 International Conference on Cyber-Enabled Distributed Computing and Knowledge Discovery (CyberC)》;20210127;190-196 * |
基于文本标签的个性化推荐算法研究;王家南;《中国优秀硕士学位论文全文数据库 信息科技辑》;20190115;I138-5004 * |
基于深度学习的个性化学习资源推荐算法研究;谭金丹;《中国优秀硕士学位论文全文数据库 信息科技辑》;20220215;I138-1357 * |
Also Published As
Publication number | Publication date |
---|---|
CN111460249A (zh) | 2020-07-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111460249B (zh) | 一种基于学习者偏好建模的个性化学习资源推荐方法 | |
CN110555112B (zh) | 一种基于用户正负偏好学习的兴趣点推荐方法 | |
Mondal et al. | A course recommendation system based on grades | |
El Mabrouk et al. | Towards an intelligent hybrid recommendation system for e-learning platforms using data mining | |
CN113343125B (zh) | 一种面向学术精准推荐的异质科研信息集成方法及*** | |
CN114201684A (zh) | 一种基于知识图谱的自适应学习资源推荐方法及*** | |
CN112148890A (zh) | 基于网络群体智能的教学知识点图谱*** | |
CN114021722A (zh) | 一种融合认知刻画的注意力知识追踪方法 | |
Lu et al. | CMKT: Concept map driven knowledge tracing | |
CN114722182A (zh) | 一种基于知识图谱的在线课推荐方法及*** | |
CN114385801A (zh) | 一种基于分层细化lstm网络的知识追踪方法及*** | |
CN113344053A (zh) | 一种基于试题异构图表征与学习者嵌入的知识追踪方法 | |
CN110704510A (zh) | 一种结合用户画像的题目推荐方法及*** | |
Zheng et al. | Evolutionary machine learning builds smart education big data platform: Data-driven higher education | |
CN113239209A (zh) | 基于RankNet-transformer的知识图谱个性化学习路径推荐方法 | |
Diao et al. | Personalized learning path recommendation based on weak concept mining | |
Nelyub et al. | Machine learning to identify key success indicators | |
CN115238169A (zh) | 一种慕课可解释推荐方法、终端设备及存储介质 | |
CN113449182A (zh) | 一种知识信息个性化推荐方法及*** | |
CN113283488A (zh) | 一种基于学习行为的认知诊断方法及*** | |
CN116186409A (zh) | 一种结合难度与薄弱知识点的多样化习题推荐方法、***及设备 | |
CN116226404A (zh) | 一种针对肠-脑轴的知识图谱构建方法及知识图谱*** | |
CN114358988B (zh) | 基于ai技术的教学方式推送方法及装置 | |
Zhang et al. | Deep knowledge tracing with concept trees | |
Latifah et al. | Prediction analysis of Student specialization suitability using artificial neural network algorithm |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |