CN109597937A - 网络课程推荐方法及装置 - Google Patents
网络课程推荐方法及装置 Download PDFInfo
- Publication number
- CN109597937A CN109597937A CN201811467499.1A CN201811467499A CN109597937A CN 109597937 A CN109597937 A CN 109597937A CN 201811467499 A CN201811467499 A CN 201811467499A CN 109597937 A CN109597937 A CN 109597937A
- Authority
- CN
- China
- Prior art keywords
- data
- sample data
- information
- sample
- characteristic information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 33
- 230000006399 behavior Effects 0.000 claims abstract description 58
- 241001269238 Data Species 0.000 claims abstract description 33
- 238000012360 testing method Methods 0.000 claims description 28
- 238000012549 training Methods 0.000 claims description 27
- 238000013480 data collection Methods 0.000 claims description 14
- 230000002159 abnormal effect Effects 0.000 claims description 9
- 238000010606 normalization Methods 0.000 claims description 6
- 238000012545 processing Methods 0.000 abstract description 7
- 238000010586 diagram Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 7
- 230000003542 behavioural effect Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000007689 inspection Methods 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000002360 explosive Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
- G06Q50/205—Education administration or guidance
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Tourism & Hospitality (AREA)
- Strategic Management (AREA)
- Educational Technology (AREA)
- Educational Administration (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Economics (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Electrically Operated Instructional Devices (AREA)
Abstract
本发明涉及数据处理技术领域,具体涉及一种网络课程推荐方法及装置,方法通过获取多个样本数据,其中,各样本数据包括学习者的人口统计学特征信息、课程资源信息数据以及针对一个网络课程的行为特征信息数据,对多个样本数据进行处理得到多个目标样本数据,并采用预设分类算法进行训练得到分类模型,接收用户输入的针对该用户的人口统计学特征信息,对该人口统计学特征信息采用分类模型进行处理得到与该用户的人口统计学特征信息对应的网络课程,并进行推送,以在用户需要进行网络课程学习时,仅需输入该用户的人口统计学特征信息即可实现快速对该用户进行精准地网络课程推荐,避免了用户在进行网络课程学习时需要进行查找造成不便的情况。
Description
技术领域
本发明涉及数据处理技术领域,具体而言,涉及一种网络课程推荐方法及装置。
背景技术
随着互联网技术教育的蓬勃发展,众多的在线学***台上不计其数、质量良莠不齐的课程资源时,由于网络课程资源丰富,因此容易导致学习者选择资源困难,使学习者产生信息迷航。
因此,提供一种便于用户在***式增长的网络课程资源中快速、精准地找到适合自身的网络课程是亟待解决的技术问题。
发明内容
有鉴于此,本发明的目的在于提供一种网络课程推荐方法及装置,以有效缓解上述技术问题。
为实现上述目的,本发明实施例采用如下技术方案:
一种网络课程推荐方法,包括:
获取多个样本数据,其中,各所述样本数据包括学习者的人口统计学特征信息、课程资源信息数据以及针对一个网络课程的行为特征信息数据;
对多个所述样本数据进行处理得到多个目标样本数据,并基于各所述目标样本数据中的人口统计学特征信息、行为特征信息数据以及课程资源信息数据采用预设分类算法进行训练得到分类模型;
接收用户输入的针对该用户的人口统计学特征信息,对该人口统计学特征信息采用所述分类模型进行处理得到与该用户的人口统计学特征信息对应的网络课程,并进行推送。
可选的,在上述网络课程推荐方法中,对多个所述样本数据进行处理得到多个目标样本数据的步骤包括:
判断各所述样本数据中包括的学习者的人口统计学特征信息、行为特征信息数据以及课程资源信息数据是否存在异常,并将多个样本数据中存在异常的样本数据进行剔除以得到多个第一样本数据;
对各第一样本数据中包括的学习者的行为特征信息数据进行归一化处理得到多个目标样本数据。
可选的,在上述网络课程推荐方法中,所述对各所述第一样本数据中包括的学习者的人口统计学特征信息、行为特征信息数据以及课程资源信息数据分别采用公式进行归一化处理得到多个目标样本数据,其中,xmin代表一项行为特征信息数据中单一属性特征值的最小值,xmax代表一项行为特征信息数据中单一属性特征值的最大值,x*代表归一化之后得到的数值,x代表原始数据。
可选的,在上述网络课程推荐方法中,基于各所述目标样本数据中的人口统计学特征信息、行为特征信息数据以及课程资源信息数据采用预设算法进行训练得到分类模型的步骤包括:
将多个所述目标样本数据划分得到训练样本数据集和测试样本数据集,其中,所述训练样本数据集和测试样本数据集分别包括多个所述目标样本数据;
将所述训练样本数据集中的各目标样本数据采用DBN算法进行训练得到初始模型;
将所述测试样本集中的各目标样本数据输入至所述初始模型中进行测试以得到分类模型。
可选的,在上述网络课程推荐方法中,所述多个样本数据中存在包括评分的样本数据,该评分为对应的样本数据中针对课程资源信息数据的评分,所述基于各所述目标样本数据中的人口统计学特征信息、行为特征信息数据以及课程资源信息数据采用预设算法进行训练得到分类模型的步骤包括:
将所述目标样本数据的评分作为决策项,基于存在评分的目标样本数据中的评分,各所述目标样本数据中的人口统计学特征信息、行为特征信息数据以及课程资源信息数据采用DBN进行训练得到分类模型。
可选的,在上述网络课程推荐方法中,获取多个样本数据的步骤包括:
获取网络学习平台上以表单的方式存储的多个样本数据。
本发明还提供一种网络课程推荐装置,包括:
样本获取模块,用于获取多个样本数据,其中,各所述样本数据包括学习者的人口统计学特征信息、课程资源信息数据以及针对一个网络课程的行为特征信息数据;
模型建立模块,用于对多个所述样本数据进行处理得到多个目标样本数据,并基于各所述目标样本数据中的人口统计学特征信息、行为特征信息数据以及课程资源信息数据采用预设分类算法进行训练得到分类模型;
课程资源推送模块,用于接收用户输入的针对该用户的人口统计学特征信息,对该人口统计学特征信息采用所述分类模型进行处理得到与该用户的人口统计学特征信息对应的网络课程,并进行推送。
可选的,在上述网络课程推荐装置中,模型建立模块包括:
数据清洗子模块,用于判断各所述样本数据中包括的学习者的人口统计学特征信息、行为特征信息数据以及课程资源信息数据是否存在异常,并将多个样本数据中存在异常的样本数据进行剔除以得到多个第一样本数据;
归一化处理子模块,用于对各第一样本数据中包括的学习者的行为特征信息数据进行归一化处理。
可选的,在上述网络课程推荐装置中,所述归一化处理子模块,还用于对各所述第一样本数据中包括的学习者的人口统计学特征信息、行为特征信息数据以及课程资源信息数据分别采用公式进行归一化处理得到多个目标样本数据,其中,xmin代表一项行为特征信息数据中单一属性特征值的最小值,xmax代表一项行为特征信息数据中单一属性特征值的最大值,x*代表归一化之后得到的数值,x代表原始数据。
可选的,在上述网络课程推荐装置中,所述模型建立模块还包括:
数据划分子模块,用于将多个所述目标样本数据划分得到训练样本数据集和测试样本数据集,其中,所述训练样本数据集和测试样本数据集分别包括多个所述目标样本数据;
训练子模块,用于将所述训练样本数据集中的各目标样本数据采用DBN算法进行训练得到初始模型;
测试子模块,用于将所述测试样本集中的各目标样本数据输入至所述初始模型中进行测试以得到分类模型。
本发明提供的一种网络课程推荐方法及装置,方法通过对获取的多个样本数据进行处理后得到多个目标样本数据,并基于该多个目标样本数据进行建模后得到一分类模型,以在用户需要进行网络课程学习时,仅需输入该用户的人口统计学特征信息即可实现快速对该用户进行精准地网络课程推荐,避免了用户在进行网络课程学习时需要进行查找造成不便的情况。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
图1为本发明实施例提供的电子设备的连接框图。
图2为本发明实施例提供的网络课程推荐方法的流程示意图。
图3为图2中步骤S120的流程示意图。
图4为图2中步骤S120的另一流程示意图。
图5为本发明实施例提供的网络课程推荐装置的连接框图。
图6为本发明实施例提供的模型建立模块的连接框图。
图7为本发明实施例提供的模型建立模块的另一连接框图。
图标:10-电子设备;12-存储器;14-处理器;100-网络课程推荐装置;110-样本获取模块;120-模型建立模块;121-数据清洗子模块;122-归一化处理子模块;123-数据划分子模块;124-训练子模块;125-测试子模块;130-课程资源推送模块。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例只是本发明的一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
如图1所示,本发明实施例提供了一种电子设备10,包括存储器12和处理器14,所述存储器12与所述处理器14之间直接或间接地电性连接,以实现数据的传输或交互。
具体的,所述存储器12中存储有以软件或固件(Firmware)的形式存储于所述存储器12中的软件功能模块,所述处理器14通过运行存储在存储器12内的软件程序以及模块,如本发明实施例中的网络课程推荐装置100,从而执行各种功能应用以及数据处理,即实现本发明实施例中的网络课程推荐方法。
所述存储器12可以是,但不限于,随机存取存储器12(Random Access Memory,RAM),只读存储器12(Read Only Memory,ROM),可编程只读存储器12(Programmable Read-Only Memory,PROM),可擦除只读存储器12(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器12(Electrically Erasable Programmable Read-OnlyMemory,EEPROM)等。其中,存储器12用于存储程序,所述处理器14在接收到执行指令后,执行所述程序。
所述处理器14可以是通用处理器14,包括中央处理器14(Central ProcessingUnit,CPU)、网络处理器14(Network Processor,NP)等,还可以是数字信号处理器14(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器14可以是微处理器14或者该处理器14也可以是任何常规的处理器14等。
可以理解,图1所示的结构仅为示意,所述电子设备10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。图1中所示的各组件可以采用硬件、软件或其组合实现。
请结合图2,本发明提供一种可应用于上述电子设备10的网络课程推荐方法,所述网络课程推荐方法应用于上述电子设备10时实现步骤S110-S130三个步骤。
步骤S110:获取多个样本数据,其中,各所述样本数据包括学习者的人口统计学特征信息、课程资源信息数据以及针对一个网络课程的行为特征信息数据。
其中,所述人口统计学特征信息至少包括学习者的姓名、教育程度以及年级,所述人口统计学特征信息还可以包括年龄、性别、学校以及专业等;所述行为特征信息数据至少包括针对一个网络课程的课程网页请求总次数、注册课程时长、视频课程播放时长、视频课程播放数量、完成习题总数目以及视频正常观看结束次数,所述行为特征信息数据还可以包括教材查看次数、活跃天数、在线时长、提交作业次数、检查作业次数、课程大纲请求次数、换视频播放速度次数、显示作业答案次数、论坛发帖数、回帖数、读帖数、论坛访问次数、帖子被回复的数量、帖子被阅读的数量、搜索讨论帖次数、是否收藏课程和/或是否分享课程;所述课程资源信息数据至少包括课程名称、课程所属学科以及课程所属年级,所述课程资源信息数据还可以包括课程知识点标注、课程创建者和/或课程所属学校。
可以理解,同一学***台同时进行多个网络课程的学习,则同一学习者针对每个课程分别对应有一个样本数据、即各所述样本数据对应的网络课程可以是相同的,也可以是不同的。
获取多个样本数据的方式可以是获取用户以表格方式输入的多个样本数据,也可以是获取网络学***台中的对应的样本数据中的行为特征信息数据,并从所述学籍网络对应的数据库中获取该样本数据中对应的课程资源信息数据以及人口统计特征数据,并进行映射得到样本数据,在此不作具体限定,根据实际需求进行设置即可。
为便于获取所述样本数据,以及保障获取的样本数据的准确性,在本实施例中,所述步骤S110可以是:获取网络学习平台上以表单的方式存储的多个样本数据。
步骤S120:对多个所述样本数据进行处理得到多个目标样本数据,并基于各所述目标样本数据中的人口统计学特征信息、行为特征信息数据以及课程资源信息数据采用预设分类算法进行训练得到分类模型。
其中,对多个所述样本数据进行处理得到多个目标样本数据的方式可以是,剔除所述样本数据中的学习者的人口统计学特征信息、行为特征信息数据以及课程资源信息数据中的异常数据,例如,当样本数据中的在线时长或视频课程播放时长大于注册课程时长时,则对应的样本数据为异常,并剔除该样本数据;当样本数据中的检查作业次数大于提交作业次数时,则对应的样本数据为异常,并剔除该样本数据。
可以理解,由于所述行为特征数据中的各项数据中的差异性角度,为便于后续基于所述样本数据训练分类模型,在本实施例中,对多个所述样本数据进行处理的方式还可以是对所述样本数据进行归一化处理。
所述分类算法可以是,但不限于深度置信网络算法(DBN算法)、卷积神经网络算法(Convolutional Neural Networks)、受限玻尔兹曼机算法(Restricted BoltzmannMachines)、深度玻尔兹曼机算法(Deep Boltzmann Machines),在此不作具体限定,只要能够基于目标样本数据生成分类模型即可。
步骤S130:接收用户输入的针对该用户的人口统计学特征信息,对该人口统计学特征信息采用所述分类模型进行处理得到与该用户的人口统计学特征信息对应的网络课程,并进行推送。
需要说明的是,得到的与该用户人口统计学特征信息对应的课程资源信息数据可以是一个,也可以是多个。
通过上述设置,以实现根据人口统计学特征信息、行为特征信息数据以及课程资源信息数据来构建学习者兴趣模型即本申请中的分类模型,以在用户进行网络课程学习时,仅需输入该用户的人口统计学特征信息,以快速精准地向用户推荐网络课程,如向用户推荐与该用户的人口统计学特征相似或相近的学习者人口统计学特征信息对应的网络课程,并避免用户进行查找造成不便的情况。
请结合图3,具体的,在本实施例中,步骤S120中,对多个所述样本数据进行处理得到多个目标样本数据包括:
步骤S121:判断各所述样本数据中包括的学习者的人口统计学特征信息、行为特征信息数据以及课程资源信息数据是否存在异常,并将多个样本数据中存在异常的样本数据进行剔除以得到多个第一样本数据。
需要说明的是,存在异常的数据通常为行为特征信息数据,通过将存在异常的数据对应的样本数据进行剔除,以避免因存在异常数据造成获得的分类模型不准确的情况。
步骤S122:对各第一样本数据中包括的学习者的行为特征信息数据进行归一化处理得到多个目标样本数据。
具体的,所述学习者的行为特征信息数据至少包括:课程网页请求总次数、注册课程时长、视频课程播放时长、视频课程播放数量、完成习题总数目和视频正常观看结束次数,还可以包括的教材查看次数、活跃天数、在线时长、提交作业次数、检查作业次数、课程大纲请求次数、换视频播放速度次数、显示作业答案次数、论坛发帖数、回帖数、读帖数、论坛访问次数、帖子被回复的数量、帖子被阅读的数量、搜索讨论帖次数、是否收藏课程和/或是否分享课程。
具体的,在本实施例中,所述步骤S122包括:对各所述第一样本数据中包括的学习者的人口统计学特征信息、行为特征信息数据以及课程资源信息数据分别采用公式进行归一化处理得到多个目标样本数据,其中,xmin代表一项行为特征信息数据中单一属性特征值的最小值,xmax代表一项行为特征信息数据中单一属性特征值的最大值,x*代表归一化之后得到的数值,x代表原始数据。
通过上述方法,以使获得的行为特征信息数据的取值范围为[0,1],进而避免因样本数据中的特征信息数据值过大,进而造成算法复杂的问题。
请结合图4,为使通过预设算法进行训练得到的分类模型更准确,在本实施例中,步骤S120中,基于各所述目标样本数据中的人口统计学特征信息、行为特征信息数据以及课程资源信息数据采用预设分类算法进行训练得到分类模型的步骤包括:
步骤S123:将多个所述目标样本数据划分得到训练样本数据集和测试样本数据集,其中,所述训练样本数据集和测试样本数据集分别包括多个所述目标样本数据。
步骤S124:将所述训练样本数据集中的各目标样本数据采用DBN算法进行训练得到初始模型。
步骤S125:将所述测试样本集中的各目标样本数据输入至所述初始模型中进行测试以得到分类模型。
其中,为使上述获得的分类模型更加准确,将多个所述目标样本数据进行划分得到的训练样本数据集和测试样本数据集中,训练样本数据集中包括的目标样本数据的数量与所述测试样本数据集中包括的目标样本数据的数量的比例可以是,但不限于7:3或8:2等,在此不作具体限定。
为实现对课程进行更精准的推荐,所述多个样本数据中存在包括评分的样本数据,该评分为对应的样本数据中针对课程资源信息数据的评分,所述基于各所述目标样本数据中的人口统计学特征信息、行为特征信息数据以及课程资源信息数据采用预设算法进行训练得到分类模型的步骤包括:
将所述目标样本数据的评分作为决策项,基于存在评分的目标样本数据中的评分,各所述目标样本数据中的人口统计学特征信息、行为特征信息数据以及课程资源信息数据采用DBN进行训练得到分类模型。
通过上述设置,以实现基于网络课程的评分对网络课程进行推荐,进而使推荐的网络课程均为评分较高的课程,进而达到更好的网络课程推荐效果。
可以理解,针对同一网络课程,还可以获取该网络课程在训练样本数据集的所有网络课程中所占的比例,以在进行模型训练时,根据该比例、存在评分的目标样本数据中的评分和各所述目标样本数据中的人口统计学特征信息、行为特征信息数据以及课程资源信息数据采用DBN进行训练得到分类模型。
请结合图5,在上述基础上,本发明还提供一种网络课程推荐装置100,包括样本获取模块110、模型建立模块120以及课程资源推送模块130。
所述样本获取模块110,用于获取多个样本数据,其中,各所述样本数据包括学习者的人口统计学特征信息、课程资源信息数据以及针对一个网络课程的行为特征信息数据。在本实施例中,所述样本获取模块110可用于执行图2所示的步骤S110,关于所述样本获取模块110的具体描述可以参照前文对步骤S110的描述。
所述模型建立模块120,用于对多个所述样本数据进行处理得到多个目标样本数据,并基于各所述目标样本数据中的人口统计学特征信息、行为特征信息数据以及课程资源信息数据采用预设分类算法进行训练得到分类模型。在本实施例中,所述模型建立模块120可用于执行图2所示的步骤S120,关于所述模型建立模块120的具体描述可以参照前文对步骤S120的描述。
所述课程资源推送模块130,用于接收用户输入的针对该用户的人口统计学特征信息,对该人口统计学特征信息采用所述分类模型进行处理得到与该用户的人口统计学特征信息对应的网络课程,并进行推送。在本实施例中,所述课程资源推送模块130可用于执行图2所示的步骤S130,关于所述课程资源推送模块130的具体描述可以参照前文对步骤S130的描述。
请结合图6,可选的,在本实施例中,模型建立模块120包括数据清洗子模块121和归一化处理子模块122。
所述数据清洗子模块121,用于判断各所述样本数据中包括的学习者的人口统计学特征信息、行为特征信息数据以及课程资源信息数据是否存在异常,并将多个样本数据中存在异常的样本数据进行剔除以得到多个第一样本数据。在本实施例中,所述数据清洗子模块121可用于执行图3所示的步骤S121,关于所述数据清洗子模块121的具体描述可以参照前文对步骤S121的描述。
所述归一化处理子模块122,用于对各第一样本数据中包括的学习者的行为特征信息数据进行归一化处理以得到多个目标样本数据。在本实施例中,所述归一化处理子模块122可用于执行图3所示的步骤S122,关于所述归一化处理子模块122的具体描述可以参照前文对步骤S122的描述。
可选的,在本实施例中,所述归一化处理子模块122,还用于对各所述第一样本数据中包括的学习者的人口统计学特征信息、行为特征信息数据以及课程资源信息数据分别采用公式进行归一化处理得到多个目标样本数据,其中,xmin代表一项行为特征信息数据中单一属性特征值的最小值,xmax代表一项行为特征信息数据中单一属性特征值的最大值,x*代表归一化之后得到的数值,x代表原始数据。
请结合图7,可选的,在本实施例中,所述模型建立模块120还包括数据划分子模块123、训练子模块124以及测试子模块125。
所述数据划分子模块123,用于将多个所述目标样本数据划分得到训练样本数据集和测试样本数据集,其中,所述训练样本数据集和测试样本数据集分别包括多个所述目标样本数据。在本实施例中,所述数据划分子模块123可用于执行图4所示的步骤S123,关于所述数据划分子模块123的具体描述可以参照前文对步骤S123的描述。
所述训练子模块124,用于将所述训练样本数据集中的各目标样本数据采用DBN算法进行训练得到初始模型。在本实施例中,所述训练子模块124可用于执行图4所示的步骤S124,关于所述训练子模块124的具体描述可以参照前文对步骤S124的描述。
所述测试子模块125,用于将所述测试样本集中的各目标样本数据输入至所述初始模型中进行测试以得到分类模型。在本实施例中,所述测试子模块125可用于执行图4所示的步骤S125,关于所述测试子模块125的具体描述可以参照前文对步骤S125的描述。
综上,本发明提供的一种网络课程推荐方法及装置,方法通过对获取的多个样本数据进行处理后得到多个目标样本数据,并基于该多个目标样本数据进行建模后得到一分类模型,以在用户需要进行网络课程学习时,仅需输入该用户的人口统计学特征信息即可实现快速对该用户进行精准地网络课程推荐,避免了用户在进行网络课程学习时需要进行查找造成不便的情况。
在本发明实施例所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置和方法实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种网络课程推荐方法,其特征在于,包括:
获取多个样本数据,其中,各所述样本数据包括学习者的人口统计学特征信息、课程资源信息数据以及针对一个网络课程的行为特征信息数据;
对多个所述样本数据进行处理得到多个目标样本数据,并基于各所述目标样本数据中的人口统计学特征信息、行为特征信息数据以及课程资源信息数据采用预设分类算法进行训练得到分类模型;
接收用户输入的针对该用户的人口统计学特征信息,对该人口统计学特征信息采用所述分类模型进行处理得到与该用户的人口统计学特征信息对应的网络课程,并进行推送。
2.根据权利要求1所述的网络课程推荐方法,其特征在于,对多个所述样本数据进行处理得到多个目标样本数据的步骤包括:
判断各所述样本数据中包括的学习者的人口统计学特征信息、行为特征信息数据以及课程资源信息数据是否存在异常,并将多个样本数据中存在异常的样本数据进行剔除以得到多个第一样本数据;
对各第一样本数据中包括的学习者的行为特征信息数据进行归一化处理得到多个目标样本数据。
3.根据权利要求2所述的网络课程推荐方法,其特征在于,所述对各第一样本数据中包括的学习者的行为特征信息数据进行归一化处理得到多个目标样本数据的步骤包括:
对各所述第一样本数据中包括的学习者的人口统计学特征信息、行为特征信息数据以及课程资源信息数据分别采用公式进行归一化处理得到多个目标样本数据,其中,xmin代表一项行为特征信息数据中单一属性特征值的最小值,xmax代表一项行为特征信息数据中单一属性特征值的最大值,x*代表归一化之后得到的数值,x代表原始数据。
4.根据权利要求1所述的网络课程推荐方法,其特征在于,基于各所述目标样本数据中的人口统计学特征信息、行为特征信息数据以及课程资源信息数据采用预设算法进行训练得到分类模型的步骤包括:
将多个所述目标样本数据划分得到训练样本数据集和测试样本数据集,其中,所述训练样本数据集和测试样本数据集分别包括多个所述目标样本数据;
将所述训练样本数据集中的各目标样本数据采用DBN算法进行训练得到初始模型;
将所述测试样本集中的各目标样本数据输入至所述初始模型中进行测试以得到分类模型。
5.根据权利要求1所述的网络课程推荐方法,其特征在于,所述多个样本数据中存在包括评分的样本数据,该评分为对应的样本数据中针对课程资源信息数据的评分,所述基于各所述目标样本数据中的人口统计学特征信息、行为特征信息数据以及课程资源信息数据采用预设算法进行训练得到分类模型的步骤包括:
将所述目标样本数据的评分作为决策项,基于存在评分的目标样本数据中的评分,各所述目标样本数据中的人口统计学特征信息、行为特征信息数据以及课程资源信息数据采用DBN进行训练得到分类模型。
6.根据权利要求1所述的网络课程推荐方法,其特征在于,获取多个样本数据的步骤包括:
获取网络学习平台上以表单的方式存储的多个样本数据。
7.一种网络课程推荐装置,其特征在于,包括:
样本获取模块,用于获取多个样本数据,其中,各所述样本数据包括学习者的人口统计学特征信息、课程资源信息数据以及针对一个网络课程的行为特征信息数据;
模型建立模块,用于对多个所述样本数据进行处理得到多个目标样本数据,并基于各所述目标样本数据中的人口统计学特征信息、行为特征信息数据以及课程资源信息数据采用预设分类算法进行训练得到分类模型;
课程资源推送模块,用于接收用户输入的针对该用户的人口统计学特征信息,对该人口统计学特征信息采用所述分类模型进行处理得到与该用户的人口统计学特征信息对应的网络课程,并进行推送。
8.根据权利要求7所述的网络课程推荐装置,其特征在于,模型建立模块包括:
数据清洗子模块,用于判断各所述样本数据中包括的学习者的人口统计学特征信息、行为特征信息数据以及课程资源信息数据是否存在异常,并将多个样本数据中存在异常的样本数据进行剔除以得到多个第一样本数据;
归一化处理子模块,用于对各第一样本数据中包括的学习者的行为特征信息数据进行归一化处理。
9.根据权利要求8所述的网络课程推荐装置,其特征在于,所述归一化处理子模块,还用于对各所述第一样本数据中包括的学习者的人口统计学特征信息、行为特征信息数据以及课程资源信息数据分别采用公式进行归一化处理得到多个目标样本数据,其中,xmin代表一项行为特征信息数据中单一属性特征值的最小值,xmax代表一项行为特征信息数据中单一属性特征值的最大值,x*代表归一化之后得到的数值,x代表原始数据。
10.根据权利要求7所述的网络课程推荐装置,其特征在于,所述模型建立模块还包括:
数据划分子模块,用于将多个所述目标样本数据划分得到训练样本数据集和测试样本数据集,其中,所述训练样本数据集和测试样本数据集分别包括多个所述目标样本数据;
训练子模块,用于将所述训练样本数据集中的各目标样本数据采用DBN算法进行训练得到初始模型;
测试子模块,用于将所述测试样本集中的各目标样本数据输入至所述初始模型中进行测试以得到分类模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811467499.1A CN109597937B (zh) | 2018-12-03 | 2018-12-03 | 网络课程推荐方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811467499.1A CN109597937B (zh) | 2018-12-03 | 2018-12-03 | 网络课程推荐方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109597937A true CN109597937A (zh) | 2019-04-09 |
CN109597937B CN109597937B (zh) | 2021-06-22 |
Family
ID=65960693
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811467499.1A Active CN109597937B (zh) | 2018-12-03 | 2018-12-03 | 网络课程推荐方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109597937B (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110046667A (zh) * | 2019-04-19 | 2019-07-23 | 华东交通大学 | 一种基于深度神经网络学习评分数据对的教学评价方法 |
CN110232646A (zh) * | 2019-06-11 | 2019-09-13 | 东华大学 | 基于深度置信网络的研究生就业推荐方法 |
CN110633415A (zh) * | 2019-09-05 | 2019-12-31 | 中国联合网络通信集团有限公司 | 网络课程推送的方法、装置、***、电子设备、存储介质 |
CN110942238A (zh) * | 2019-11-21 | 2020-03-31 | 中国联合网络通信集团有限公司 | 课程推荐设备及方法 |
CN111754370A (zh) * | 2020-07-01 | 2020-10-09 | 广州驰兴通用技术研究有限公司 | 一种基于人工智能的在线教育课程管理方法及*** |
CN112328646A (zh) * | 2021-01-04 | 2021-02-05 | 平安科技(深圳)有限公司 | 多任务课程推荐方法、装置、计算机设备及存储介质 |
CN112381291A (zh) * | 2020-11-13 | 2021-02-19 | 北京乐学帮网络技术有限公司 | 行为预测、信息推送方法及装置、电子设备及存储介质 |
CN113837322A (zh) * | 2021-11-04 | 2021-12-24 | 中国联合网络通信集团有限公司 | 课程的分类处理方法、装置、设备及介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101101662A (zh) * | 2006-07-07 | 2008-01-09 | 一零四资讯科技股份有限公司 | 提供求职者能力需求条件并推荐教育课程的*** |
CN101452546A (zh) * | 2007-12-07 | 2009-06-10 | 李郁贞 | 模拟作业程序学习与应用的方法 |
US20130246290A1 (en) * | 2012-03-16 | 2013-09-19 | Precision Litigation, LLC | Machine-Assisted Legal Assessments |
-
2018
- 2018-12-03 CN CN201811467499.1A patent/CN109597937B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101101662A (zh) * | 2006-07-07 | 2008-01-09 | 一零四资讯科技股份有限公司 | 提供求职者能力需求条件并推荐教育课程的*** |
CN101452546A (zh) * | 2007-12-07 | 2009-06-10 | 李郁贞 | 模拟作业程序学习与应用的方法 |
US20130246290A1 (en) * | 2012-03-16 | 2013-09-19 | Precision Litigation, LLC | Machine-Assisted Legal Assessments |
Non-Patent Citations (1)
Title |
---|
沈苗: "北京大学课程推荐引擎的设计和实现", 《智能***学报》 * |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110046667A (zh) * | 2019-04-19 | 2019-07-23 | 华东交通大学 | 一种基于深度神经网络学习评分数据对的教学评价方法 |
CN110046667B (zh) * | 2019-04-19 | 2022-08-12 | 华东交通大学 | 一种基于深度神经网络学习评分数据对的教学评价方法 |
CN110232646A (zh) * | 2019-06-11 | 2019-09-13 | 东华大学 | 基于深度置信网络的研究生就业推荐方法 |
CN110633415B (zh) * | 2019-09-05 | 2022-05-03 | 中国联合网络通信集团有限公司 | 网络课程推送的方法、装置、***、电子设备、存储介质 |
CN110633415A (zh) * | 2019-09-05 | 2019-12-31 | 中国联合网络通信集团有限公司 | 网络课程推送的方法、装置、***、电子设备、存储介质 |
CN110942238A (zh) * | 2019-11-21 | 2020-03-31 | 中国联合网络通信集团有限公司 | 课程推荐设备及方法 |
CN110942238B (zh) * | 2019-11-21 | 2022-05-31 | 中国联合网络通信集团有限公司 | 课程推荐设备及方法 |
CN111754370B (zh) * | 2020-07-01 | 2021-04-27 | 厦门致力于学在线教育科技有限公司 | 一种基于人工智能的在线教育课程管理方法及*** |
CN111754370A (zh) * | 2020-07-01 | 2020-10-09 | 广州驰兴通用技术研究有限公司 | 一种基于人工智能的在线教育课程管理方法及*** |
CN112381291A (zh) * | 2020-11-13 | 2021-02-19 | 北京乐学帮网络技术有限公司 | 行为预测、信息推送方法及装置、电子设备及存储介质 |
CN112328646A (zh) * | 2021-01-04 | 2021-02-05 | 平安科技(深圳)有限公司 | 多任务课程推荐方法、装置、计算机设备及存储介质 |
CN113837322A (zh) * | 2021-11-04 | 2021-12-24 | 中国联合网络通信集团有限公司 | 课程的分类处理方法、装置、设备及介质 |
CN113837322B (zh) * | 2021-11-04 | 2023-05-30 | 中国联合网络通信集团有限公司 | 课程的分类处理方法、装置、设备及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN109597937B (zh) | 2021-06-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109597937A (zh) | 网络课程推荐方法及装置 | |
Hussain et al. | Student Engagement Predictions in an e‐Learning System and Their Impact on Student Course Assessment Scores | |
Boumans | Science outside the laboratory: Measurement in field science and economics | |
Gnanadesikan et al. | An activity-based statistics course | |
CN105159924B (zh) | 学习资源推送方法和*** | |
US10643488B2 (en) | System and method of assessing depth-of-understanding | |
US20080057480A1 (en) | Multimedia system and method for teaching basal math and science | |
CN112395403B (zh) | 一种基于知识图谱的问答方法、***、电子设备及介质 | |
CN106570109A (zh) | 一种通过文本分析自动生成题库知识点的方法 | |
Currie et al. | Why experiments matter | |
CN106875770A (zh) | 一种少年学生创新能力测验评定装置 | |
Kaptein et al. | Statistics for Data Scientists | |
Ilić et al. | Intelligent techniques in e-learning: a literature review | |
CN108932593B (zh) | 一种认知影响因素分析方法及装置 | |
Zhang et al. | Formative evaluation of college students’ online English learning based on learning behavior analysis | |
US20220084151A1 (en) | System and method for determining rank | |
Christoforaki et al. | Step: A scalable testing and evaluation platform | |
Yigiter et al. | Computerized multistage testing: Principles, designs and practices with R | |
CN109800880B (zh) | 基于动态学习风格信息的自适应学习特征提取***及应用 | |
US20080147581A1 (en) | Processes for Generating Precise and Accurate Output from Untrusted Human Input | |
Carnero | Developing a fuzzy TOPSIS model combining MACBETH and fuzzy shannon entropy to select a gamification App | |
CN107358829A (zh) | 学习测验*** | |
Wesolowski | Predicting operational rater‐type classifications using rasch measurement theory and random forests: a music performance assessment perspective | |
CN109325552A (zh) | 个性化资源推荐模型建立方法及装置 | |
CN115984054A (zh) | 一种基于大数据平台的智慧教育方法及*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |