CN115830405B - 一种标签化的用户能力画像分析方法及*** - Google Patents
一种标签化的用户能力画像分析方法及*** Download PDFInfo
- Publication number
- CN115830405B CN115830405B CN202310102294.8A CN202310102294A CN115830405B CN 115830405 B CN115830405 B CN 115830405B CN 202310102294 A CN202310102294 A CN 202310102294A CN 115830405 B CN115830405 B CN 115830405B
- Authority
- CN
- China
- Prior art keywords
- learning
- training
- user
- label
- target user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Image Analysis (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种标签化的用户能力画像分析方法及***,根据历史课程数据提取出目标用户的历史学习特征,预测出目标用户的历史学习标签,基于目标用户的历史学习特征预测出目标用户的下一时间段学习特征,基于历史学习特征和下一时间段学习特征进行融合,得到综合学习特征,基于综合学习特征预测出目标用户的下一时间段学习标签,基于历史学习标签对下一时间段学习标签进行矫正,得到目标用户的学习能力标签。如此得到的目标用户的学习能力标签可以准确刻画和反应目标用户的学习能力和对相关知识的可接受程度,在此基础上,更进一步的对目标用户的学习能力标签进行优化和调整,得到的用户能力画像更加准确反应目标用户的真实情况。
Description
技术领域
本发明涉及计算机技术领域,具体而言,涉及一种标签化的用户能力画像分析方法及***。
背景技术
用户画像又称用户角色,作为一种勾画目标用户、联系用户诉求与设计方向的有效工具,用户画像在各领域得到了广泛的应用。用户画像是根据用户社会属性、生活习惯和行为等信息而抽象出的一个标签化的用户模型,用户画像包含了多个用户标签,用户标签用于表征用户的某种特性。在实际操作的过程中,往往会以最为浅显和贴近生活的话语将用户的属性、行为与期待的数据转化联结起来,作为实际用户的虚拟代表。
在高速发展的信息科技时代,用户的很多事情都是在网上完成,例如在网上学习、购物等等。根据用户的特性(用户画像)给用户推荐合适的产品、课程具有极大的社会意义和经济价值。
目前,主要以用户自己填写的基本属性信息标签来刻画用户的用户画像。但是事实上,一方面,用户填写的信息不一定准确,有可能是虚假的、随意填写的。另一方面,用户的基本信息并不一定能准确表征用户的特性,例如,一个学生的毕业学校是排名比较靠后的学校,但是该学生的能力很强、知识掌握程度很高,这个时候如果根据学校的属性去给该学生推荐较为基础的课程,那么推荐的课程对该学生来说是不适用的。
发明内容
本发明的目的在于提供了一种标签化的用户能力画像分析方法及***,用以解决现有技术中存在的上述问题。
第一方面,本发明实施例提供了一种标签化的用户能力画像分析方法,包括:
获得目标用户的基本属性信息和历史课程数据;所述基本属性信息包括学校信息、专业信息、大赛参赛信息;历史课程数据包括:目标用户选课科目、目标用户选课时间、目标用户学习时间集合、目标用户反复学习次数,所述目标用户学习时间集合包括多个目标学习时长;
将所述历史课程数据输入预先训练好的用户能力画像估计模型中,所述用户能力画像估计模型估计出所述目标用户的学习能力标签;
根据所述基本属性信息和所述学习能力标签,生成目标用户的用户能力画像;用户能力画像包括多个用户标签,不同的用户标签用于表征目标用户在不同维度的特性;
所述用户能力画像估计模型包括CNN网络、第一RNN网络、第二RNN网络,一个LSTM网络、混合金字塔结构网络和一个CTC loss层;CNN网络用于根据历史课程数据提取出目标用户的历史学习特征,第一RNN网络用于根据历史学习特征预测出目标用户的历史学习标签;LSTM网络用于基于目标用户的历史学习特征预测出目标用户的下一时间段学习特征;混合金字塔结构用于基于历史学习特征和下一时间段学习特征进行融合,得到综合学习特征;第二RNN网络用于基于综合学习特征预测出目标用户的下一时间段学习标签;CTC loss层用于基于历史学习标签对下一时间段学习标签进行矫正,得到目标用户的学习能力标签。
可选的,所述方法还包括:
基于所述用户能力画像,给所述目标用户推荐符合所述用户能力画像的课程。
可选的,所述用户能力画像估计模型的训练方法包括:
获得训练集,所述训练集包括多个训练用户对应的多个训练子集,每个用户对应一个训练子集,每个训练子集包括多个科目的训练数据,每个训练数据包括训练用户选课科目、训练用户选课时间、训练用户学习时间集合、训练用户反复学习次数;所述训练用户学习时间集合包括多个训练学习时长;
将多个训练子集输入CNN网络中,CNN网络基于每个训练用户的训练子集中的多个科目的训练数据,提取出训练用户的第一学习特征图,第一学习特征图包括多条第一学习特征序列,每条第一学习特征序列表征一个科目的学习特性;
通过第一RNN网络对多条第一学习特征序列进行学习,预测出训练用户的第一训练标签;
通过LSTM网络基于多条第一学习特征序列进行预测,对应得到多条第二学习特征序列;
将多条第二学习特征序列构成第二学习特征图;
通混合金字塔结构对第一学习特征图和第二学习特征图进行融合,得到第三学习特征图,第三学习特征图包括多条第三学习特征序列;
通过第二RNN网络对多条第三学习特征序列进行学习,预测出训练用户的第二训练标签;
通过CTC loss层基于第一训练标签和第二训练标签进行融合转录,得到预测标签;
当所述预测标签与所述第一训练标签的差异指数收敛,确定用户能力画像估计模型训练结束。
可选的,混合金字塔结构网络包括第一金字塔结构和第二金字塔结构;所述通混合金字塔结构对第一学习特征图和第二学习特征图进行融合,得到第三学习特征图,包括:
通过第一金字塔结构将第一学习特征图进行降维操作,得到第一降维特征图;
通过第二金字塔结构将第二学习特征图进行降维操作,得到第二降维特征图;
以第二降维特征图作为核,对第一降维特征图进行卷积操作,得到第三学习特征图。
可选的,所述通过CTC loss层基于第一训练标签和第二训练标签进行融合转录,得到预测标签,包括:
将第一训练标签和第二训练标签拼接,形成一个长度为M+N的融合标签;M为第一训练标签的长度,N为第二训练标签的长度;
通过CTC loss函数基于融合标签进行转录,得到预测标签。
第二方面,本发明实施例还提供了一种标签化的用户能力画像分析***,包括:
获得模块,用于获得目标用户的基本属性信息和历史课程数据;所述基本属性信息包括学校信息、专业信息、大赛参赛信息;历史课程数据包括:目标用户选课科目、目标用户选课时间、目标用户学习时间集合、目标用户反复学习次数,所述目标用户学习时间集合包括多个目标学习时长;
预测模块,用于将所述历史课程数据输入预先训练好的用户能力画像估计模型中,所述用户能力画像估计模型估计出所述目标用户的学习能力标签;
调整模块,用于根据所述基本属性信息和所述学习能力标签,生成目标用户的用户能力画像;用户能力画像包括多个用户标签,不同的用户标签用于表征目标用户在不同维度的特性;
所述用户能力画像估计模型包括CNN网络、第一RNN网络、第二RNN网络,一个LSTM网络、混合金字塔结构网络和一个CTC loss层;CNN网络用于根据历史课程数据提取出目标用户的历史学习特征,第一RNN网络用于根据历史学习特征预测出目标用户的历史学习标签;LSTM网络用于基于目标用户的历史学习特征预测出目标用户的下一时间段学习特征;混合金字塔结构用于基于历史学习特征和下一时间段学习特征进行融合,得到综合学习特征;第二RNN网络用于基于综合学习特征预测出目标用户的下一时间段学习标签;CTC loss层用于基于历史学习标签对下一时间段学习标签进行矫正,得到目标用户的学习能力标签。
可选的,所述***还包括:
推荐模块,用于基于所述用户能力画像,给所述目标用户推荐符合所述用户能力画像的课程。
所述用户能力画像估计模型的训练方法包括:
获得训练集,所述训练集包括多个训练用户对应的多个训练子集,每个用户对应一个训练子集,每个训练子集包括多个科目的训练数据,每个训练数据包括训练用户选课科目、训练用户选课时间、训练用户学习时间集合、训练用户反复学习次数;所述训练用户学习时间集合包括多个训练学习时长;
将多个训练子集输入CNN网络中,CNN网络基于每个训练用户的训练子集中的多个科目的训练数据,提取出训练用户的第一学习特征图,第一学习特征图包括多条第一学习特征序列,每条第一学习特征序列表征一个科目的学习特性;
通过第一RNN网络对多条第一学习特征序列进行学习,预测出训练用户的第一训练标签;
通过LSTM网络基于多条第一学习特征序列进行预测,对应得到多条第二学习特征序列;
将多条第二学习特征序列构成第二学习特征图;
通混合金字塔结构对第一学习特征图和第二学习特征图进行融合,得到第三学习特征图,第三学习特征图包括多条第三学习特征序列;
通过第二RNN网络对多条第三学习特征序列进行学习,预测出训练用户的第二训练标签;
通过CTC loss层基于第一训练标签和第二训练标签进行融合转录,得到预测标签;
当所述预测标签与所述第一训练标签的差异指数收敛,确定用户能力画像估计模型训练结束。
可选的,混合金字塔结构网络包括第一金字塔结构和第二金字塔结构;所述通混合金字塔结构对第一学习特征图和第二学习特征图进行融合,得到第三学习特征图,包括:
通过第一金字塔结构将第一学习特征图进行降维操作,得到第一降维特征图;
通过第二金字塔结构将第二学习特征图进行降维操作,得到第二降维特征图;
以第二降维特征图作为核,对第一降维特征图进行卷积操作,得到第三学习特征图。
可选的,所述通过CTC loss层基于第一训练标签和第二训练标签进行融合转录,得到预测标签,包括:
将第一训练标签和第二训练标签拼接,形成一个长度为M+N的融合标签;M为第一训练标签的长度,N为第二训练标签的长度;
通过CTC loss函数基于融合标签进行转录,得到预测标签。
相较于现有技术,本发明实施例达到了以下有益效果:
本发明实施例还提供了一种标签化的用户能力画像分析方法及***,所述方法包括:获得目标用户的基本属性信息和历史课程数据;所述基本属性信息包括学校信息、专业信息、大赛参赛信息;所述学校信息包括学校名称,所述专业信息包括专业名称,所述大赛参赛信息包括参赛时间、获奖情况;历史课程数据包括:目标用户选课科目、目标用户选课时间、目标用户学习时间集合、目标用户反复学习次数,所述目标用户学习时间集合包括多个目标学习时长;将所述历史课程数据输入预先训练好的用户能力画像估计模型中,所述用户能力画像估计模型估计出所述目标用户的学习能力标签;根据所述基本属性信息和所述学习能力标签,生成目标用户的用户能力画像;用户能力画像包括多个用户标签,不同的用户标签用于表征目标用户在不同维度的特性。
通过CNN网络用于根据历史课程数据提取出目标用户的历史学习特征,第一RNN网络用于根据历史学习特征预测出目标用户的历史学习标签;LSTM网络用于基于目标用户的历史学习特征预测出目标用户的下一时间段学习特征;混合金字塔结构用于基于历史学习特征和下一时间段学习特征进行融合,得到综合学习特征;第二RNN网络用于基于综合学习特征预测出目标用户的下一时间段学习标签;CTC loss层用于基于历史学习标签对下一时间段学习标签进行矫正,得到目标用户的学习能力标签,得到的目标用户的学习能力标签可以准确刻画和反应目标用户的学习能力和对相关知识的可接受程度,在此基础上,根据基本属性信息和所述学习能力标签生成目标用户的用户能力画像,更进一步的对目标用户的学习能力标签进行优化和调整,得到的用户能力画像更加准确反应目标用户的真实情况。用户能力画像包括多个学习能力标签,能从多方面、多维度刻画用户的能力特性。
附图说明
图1是本发明实施例提供的一种标签化的用户能力画像分析方法流程图;
图2是本发明实施例提供的一种用户能力画像估计模型的结构示意图;
图3是本发明实施例提供的一种电子设备的方框结构示意图。
图中标记:总线500;接收器501;处理器502;发送器503;存储器504;总线接口505。
具体实施方式
下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要说明的是,某些指示的方位或位置关系的词语,其仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
在本发明的描述中,需要说明的是,“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
下面通过具体的实施例子并结合附图对本发明做进一步的详细描述。
实施例1
如图1所示,本发明实施例提供了一种标签化的用户能力画像分析方法,包括:
S101:获得目标用户的基本属性信息和历史课程数据。
其中,所述基本属性信息包括学校信息、专业信息、大赛参赛信息。学校信息包括学校名称。可以根据学校名称进一步根据学校规模、学校排名等信息。专业信息包括专业名称,可以进一步根据专业名称获得该学校的该专业的排名信息。所述大赛参赛信息包括参赛时间、获奖情况。获奖情况包括未获奖、特等奖、一等奖、二等奖、三等奖、优秀奖。
历史课程数据包括目标用户选课科目、目标用户选课时间、目标用户学习时间集合、目标用户反复学习次数,所述目标用户学习时间集合包括多个目标学习时长,每个目标学习时长表示目标用户每一次持续学习的时间长度。S102:将历史课程数据输入预先训练好的用户能力画像估计模型中,用户能力画像估计模型估计出目标用户的学习能力标签。学习能力标签用于表征目标用户的学习情况和学习特性,例如学习能力标签是初级学员、高级学员,用于表征目标用户对某个课程或者某类课程的掌握程度和可接受程度。
S103:根据基本属性信息和所述学习能力标签,生成目标用户的用户能力画像。
其中,用户能力画像包括多个用户标签,不同的用户标签用于表征目标用户在不同维度的特性。例如,用户能力画像为:初级学员、费规模院校、大赛一等奖,初级学员、费规模院校、大赛一等奖都是用户标签,表示目标用户在课程掌握情况、学校情况、比赛情况等方面的特性。
在本发明实施例中,用户能力画像估计模型包括CNN网络、第一RNN网络、第二RNN网络、一个LSTM网络、混合金字塔结构网络和一个CTC loss层。CNN网络用于根据历史课程数据提取出目标用户的历史学习特征,第一RNN网络用于根据历史学习特征预测出目标用户的历史学习标签。LSTM网络用于基于目标用户的历史学习特征预测出目标用户的下一时间段学习特征。混合金字塔结构用于基于历史学习特征和下一时间段学习特征进行融合,得到综合学习特征;第二RNN网络用于基于综合学习特征预测出目标用户的下一时间段学习标签;CTC loss层用于基于历史学习标签对下一时间段学习标签进行矫正,得到目标用户的学习能力标签。如图2所示,图2示出了本发明实施例提供的用户能力画像估计模型的结构示意图。在图2中,标出了用户能力画像估计模型在使用阶段和训练阶段的数据走向。
其中,CNN为卷积神经网络 (Convolutional Neural Networks,CNN)、RNN循环神经网络(Recurrent Neural Network,RNN) 、LSTM是长短期记忆网络(Long Short-TermMemory,LSTM)、 CTC loss为连接时间分类函数(Connectionist TemporalClassification loss function, CTC loss)。通过采用以上的技术方案,通过CNN网络用于根据历史课程数据提取出目标用户的历史学习特征,第一RNN网络用于根据历史学习特征预测出目标用户的历史学习标签;LSTM网络用于基于目标用户的历史学习特征预测出目标用户的下一时间段学习特征;混合金字塔结构用于基于历史学习特征和下一时间段学习特征进行融合,得到综合学习特征;第二RNN网络用于基于综合学习特征预测出目标用户的下一时间段学习标签;CTC loss层用于基于历史学习标签对下一时间段学习标签进行矫正,得到目标用户的学习能力标签,得到的目标用户的学习能力标签可以准确刻画和反应目标用户的学习能力和对相关知识的可接受程度,在此基础上,根据基本属性信息和所述学习能力标签生成目标用户的用户能力画像,更进一步的对目标用户的学习能力标签进行优化,得到的用户能力画像更加准确反应目标用户的真实情况。用户能力画像包括多个学习能力标签,能从多方面、多维度刻画用户的能力特性。
可选的,在S103之后,所述的标签化的用户能力画像分析方法还包括:
S104:基于用户能力画像,给目标用户推荐符合用户能力画像的课程。
具体的,可以是从数据库中选择与用户能力画像中的学习能力标签对应的课程作为符合用户能力画像的课程,还可以是:若某个课程能够同时对应大于L个学习能力标签,则确定该课程为符合用户能力画像的课程,其中,L为一个设定阈值,L小于或者等于K的正整数,K表示用户能力画像包括的多个学习能力标签的数量,K为大于0的正整数。K=1,2,3,4,5,6,7,8,9,10。
在本发明实施例中,历史课程数据还可以包括挑战通过数据、大赛比赛数据、做题数据、测评考试数据等。历史课程数据存储在一个队列中,历史课程数据中的元素可以依次排序存入队列。历史课程数据和基本属性信息的数据格式可以是一个一维数组,历史课程数据中的元素存储在一维数据中,例如历史课程数据为[目标用户选课科目,目标用户选课时间,目标用户学习时间集合,目标用户反复学习次数],或者[目标用户选课科目,目标用户选课时间,目标用户学习时间集合,目标用户反复学习次数,挑战通过数据,大赛比赛数据,做题数据,测评考试数据]。目标用户的历史课程数据与训练集中每一个训练数据的数据格式相同。对于训练数据或者历史课程数据中的某个元素不存在,可以取值为0或者取值为空。
如此,可以通过用户能力画像估计模型从历史课程数据中提取出目标用户的有用的内隐信息,基于这样的内隐信息来生成用户标签和用户能力画像,使得用户标签和用户能力画像可以准确表征用户的能力强弱。
在此基础上,根据目标用户的用户能力画像给目标用户推荐匹配该目标用户的能力的课程,能够提高目标用户选择、学习该课程的概率,提高推荐的可靠性,提高***的运营效率。可选的,用户能力画像估计模型的训练方法包括:
获得训练集,训练集包括多个训练用户对应的多个训练子集,每个用户对应一个训练子集,每个训练子集包括多个科目的训练数据,每个训练数据包括训练用户选课科目、训练用户选课时间、训练用户学习时间集合、训练用户反复学习次数;所述训练用户学习时间集合包括多个训练学习时长。训练学习时长表示训练用户每次持续学习的时间长度。
将多个训练子集输入CNN网络中,CNN网络基于每个训练用户的训练子集中的多个科目的训练数据,提取出训练用户的第一学习特征图,第一学习特征图包括多条第一学习特征序列,每条第一学习特征序列表征一个科目的学习特性,每条第一学习特征序列表征包括一个或者多个学习特征,用于刻画训练用户对该科目的学习特性。
通过第一RNN网络对多条第一学习特征序列进行学习,预测出训练用户的第一训练标签。通过LSTM网络基于多条第一学习特征序列进行预测,对应得到多条第二学习特征序列。
将多条第二学习特征序列构成第二学习特征图。在本发明实施例中,按照第二学习特征序列对应的科目的序号,排序成第二学习特征图,即在第二学习特征图中,第一行为科目序号为1的课程的第二学习特征序列,第二行为科目序号为2的课程的第二学习特征序列,以此类推。
在本发明实施例中,每条第一学习特征序列表征包括一个或者多个第一学习特征,第一学习特征用于刻画训练用户对该科目的学习特性。每条第二学习特征序列表征包括一个或者多个第二学习特征,第二学习特征用于刻画训练用户对该科目的学习特性。每条第三学习特征序列表征包括一个或者多个第三学习特征,第三学习特征用于刻画训练用户对该科目的学习特性。
通混合金字塔结构对第一学习特征图和第二学习特征图进行融合,得到第三学习特征图,第三学习特征图包括多条第三学习特征序列。具体的,混合金字塔结构网络包括第一金字塔结构、第二金字塔结构,可选的还包括卷积结构。通混合金字塔结构对第一学习特征图和第二学习特征图进行融合,得到第三学习特征图,包括:
通过第一金字塔结构将第一学习特征图进行降维操作,得到第一降维特征图。
通过第二金字塔结构将第二学习特征图进行降维操作,得到第二降维特征图。
在本发明实施例中,降维操作可以是卷积操作。
以第二降维特征图作为核,对第一降维特征图进行卷积操作,得到第三学习特征图。可选的,此步骤通过卷积结构来实现,即通过卷积结构,以第二降维特征图作为核,对第一降维特征图进行卷积操作,得到第三学习特征图。
通过第二RNN网络对多条第三学习特征序列进行学习,预测出训练用户的第二训练标签。
在本发明实施例中,如果第三学习特征图的维度不符合第二RNN网络的输入的维度,适当的采用卷积或者池化的方式对第三学习特征图进行降维或者升维操作。使得第二RNN网络对多条第三学习特征序列进行学习预测出训练用户的第二训练标签。
通过CTC loss层基于第一训练标签和第二训练标签进行融合转录,得到预测标签。具体包括:将第一训练标签和第二训练标签拼接,形成一个长度为M+N的融合标签,融合标签包括第一训练标签和第二训练标签;M为第一训练标签的长度,N为第二训练标签的长度;通过CTC loss函数基于融合标签进行转录,得到预测标签。具体为:使用 CTC 损失函数,把从循环层(RNN)获取的一系列标签分布(第二RNN预测得到的第二训练标签的概率和第一RNN预测得到的第一训练标签的概率)转换成最终的标签序列,具体是找到具有最高概率组合的标签序列,可以是:在融合标签中,找到概率值最大的前H个目标标签为预测标签,目标标签为第一训练标签或者第二训练标签,H为大于0 的正整数,H=1,2,3,4,5,6,7,8,9,10。
当所述预测标签与第一训练标签的差异指数收敛,确定用户能力画像估计模型训练结束,得到训练好的户能力画像估计模型。
在本发明实施例中,差异指数是预测标签与第一训练标签的欧式距离,或者是预测标签构成的特征向量与第一训练标签构成的特征向量之间的夹角的余弦值。
在本发明实施例中,根据基本属性信息和所述学习能力标签生成目标用户的用户能力画像,可以是将基本属性信息输入预先训练好的CNN网络中,CNN提取出目标用户的基本情况特征,通过训练好的RNN基于基本情况特征预测出基本情况标签,将基本情况标签和学习能力标签构成一个标签组,通过CTC loss基于该标签向量组获得最终的可以准确反应目标用户学习特征(例如学习进度、学习能力、学习程度等)的学习能力标签,这些学习能力标签组成的标签向量就是用户能力画像。具体的可以参阅上述获得预测标签的实施方式,而且所采用的方法可以类似,只需替换输入以及对应调整模型和数据的维度即可。
通过采用以上方案,可以从多方面、多维度去获得目标用户的特性信息,挖掘出影响用户特性的深层信息,在多方面的信息相互融合、相互协调、相互影响下,提取出用户能力画像能准确表征用户的学习特性,例如,用户即便是毕业于排名比较靠后的学校,但是其学习时间比较长、反复学习次数多,所选的课程级别高,则表示该用户的学习能力较强,应该推荐较高级别的课程给他,以匹配他真正的需求。
实施例2
基于上述的一种标签化的用户能力画像分析方法,本发明实施例还提供了一种标签化的用户能力画像分析***,用于执行上述的标签化的用户能力画像分析方法,所述***包括:
获得模块,用于获得目标用户的基本属性信息和历史课程数据。所述基本属性信息包括学校信息、专业信息、大赛参赛信息。历史课程数据包括:目标用户选课科目、目标用户选课时间、目标用户学习时间集合、目标用户反复学习次数,所述目标用户学习时间集合包括多个目标学习时长。
预测模块,用于将所述历史课程数据输入预先训练好的用户能力画像估计模型中,所述用户能力画像估计模型估计出所述目标用户的学习能力标签。
调整模块,用于根据所述基本属性信息和所述学习能力标签,生成目标用户的用户能力画像。用户能力画像包括多个用户标签,不同的用户标签用于表征目标用户在不同维度的特性。
可选的,所述***还包括:
推荐模块,用于基于所述用户能力画像,给所述目标用户推荐符合所述用户能力画像的课程。
在此关于上述实施例中的***,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
本发明实施例还提供了一种电子设备,如图3所示,包括存储器504、处理器502及存储在存储器504上并可在处理器502上运行的计算机程序,所述处理器502执行所述程序时实现前文所述一种标签化的用户能力画像分析方法的任一方法的步骤。
其中,在图3中,总线架构(用总线500来代表),总线500可以包括任意数量的互联的总线和桥,总线500将包括由处理器502代表的一个或多个处理器和存储器504代表的存储器的各种电路链接在一起。总线500还可以将诸如***设备、稳压器和功率管理电路等之类的各种其他电路链接在一起,这些都是本领域所公知的,因此,本文不再对其进进一步描述。总线接口505在总线500和接收器501和发送器503之间提供接口。接收器501和发送器503可以是同一个元件,即收发机,提供用于在传输介质上与各种其他装置通信的单元。处理器502负责管理总线500和通常的处理,而存储器504可以被用于存储处理器502在执行操作时所使用的数据。
本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现前文所述一种标签化的用户能力画像分析方法的任一方法的步骤以及上述的所涉及的数据。
在此提供的算法和显示不与任何特定计算机、虚拟***或者其它设备固有相关。各种通用***也可以与基于在此的示教一起使用。根据上面的描述,构造这类***所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。
位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
Claims (8)
1.一种标签化的用户画像分析方法,其特征在于,包括:
获得目标用户的基本属性信息和历史课程数据;所述基本属性信息包括学校信息、专业信息、大赛参赛信息;历史课程数据包括:目标用户选课科目、目标用户选课时间、目标用户学习时间集合、目标用户反复学习次数,所述目标用户学习时间集合包括多个目标学习时长;
将所述历史课程数据输入预先训练好的用户画像估计模型中,所述用户画像估计模型估计出所述目标用户的学习标签;
根据所述基本属性信息和所述学习标签,生成目标用户的用户画像;用户画像包括多个用户标签,不同的用户标签用于表征目标用户在不同维度的特性;
基于所述用户画像,给所述目标用户推荐符合所述用户画像的课程;
所述用户画像估计模型包括CNN网络、第一RNN网络、第二RNN网络,一个LSTM网络、混合金字塔结构网络和一个CTC loss层;CNN网络用于根据历史课程数据提取出目标用户的历史学习特征,第一RNN网络用于根据历史学习特征预测出目标用户的历史学习标签;LSTM网络用于基于目标用户的历史学习特征预测出目标用户的下一时间段学习特征;混合金字塔结构用于基于历史学习特征和下一时间段学习特征进行融合,得到综合学习特征;第二RNN网络用于基于综合学习特征预测出目标用户的下一时间段学习标签;CTC loss层用于基于历史学习标签对下一时间段学习标签进行矫正,得到目标用户的学习标签。
2.根据权利要求1所述的方法,其特征在于,所述用户画像估计模型的训练方法包括:
获得训练集,所述训练集包括多个训练用户对应的多个训练子集,每个用户对应一个训练子集,每个训练子集包括多个科目的训练数据,每个训练数据包括训练用户选课科目、训练用户选课时间、训练用户学习时间集合、训练用户反复学习次数;所述训练用户学习时间集合包括多个训练学习时长;
将多个训练子集输入CNN网络中,CNN网络基于每个训练用户的训练子集中的多个科目的训练数据,提取出训练用户的第一学习特征图,第一学习特征图包括多条第一学习特征序列,每条第一学习特征序列表征一个科目的学习特性;
通过第一RNN网络对多条第一学习特征序列进行学习,预测出训练用户的第一训练标签;
通过LSTM网络基于多条第一学习特征序列进行预测,对应得到多条第二学习特征序列;
将多条第二学习特征序列构成第二学习特征图;
通过混合金字塔结构对第一学习特征图和第二学习特征图进行融合,得到第三学习特征图,第三学习特征图包括多条第三学习特征序列;
通过第二RNN网络对多条第三学习特征序列进行学习,预测出训练用户的第二训练标签;
通过CTC loss层基于第一训练标签和第二训练标签进行融合转录,得到预测标签;
当所述预测标签与所述第一训练标签的差异指数收敛,确定用户画像估计模型训练结束。
3.根据权利要求2所述的方法,其特征在于,混合金字塔结构网络包括第一金字塔结构和第二金字塔结构;所述通过混合金字塔结构对第一学习特征图和第二学习特征图进行融合,得到第三学习特征图,包括:
通过第一金字塔结构将第一学习特征图进行降维操作,得到第一降维特征图;
通过第二金字塔结构将第二学习特征图进行降维操作,得到第二降维特征图;
以第二降维特征图作为核,对第一降维特征图进行卷积操作,得到第三学习特征图。
4. 根据权利要求2所述的方法,其特征在于,所述通过CTC loss层基于第一训练标签和第二训练标签进行融合转录,得到预测标签,包括:
将第一训练标签和第二训练标签拼接,形成一个长度为M+N的融合标签;M为第一训练标签的长度,N为第二训练标签的长度;
通过CTC loss函数基于融合标签进行转录,得到预测标签。
5.一种标签化的用户画像分析***,其特征在于,包括:
获得模块,用于获得目标用户的基本属性信息和历史课程数据;所述基本属性信息包括学校信息、专业信息、大赛参赛信息;历史课程数据包括:目标用户选课科目、目标用户选课时间、目标用户学习时间集合、目标用户反复学习次数,所述目标用户学习时间集合包括多个目标学习时长;
预测模块,用于将所述历史课程数据输入预先训练好的用户画像估计模型中,所述用户画像估计模型估计出所述目标用户的学习标签;
调整模块,用于根据所述基本属性信息和所述学习标签,生成目标用户的用户画像;用户画像包括多个用户标签,不同的用户标签用于表征目标用户在不同维度的特性;
推荐模块,用于基于所述用户画像,给所述目标用户推荐符合所述用户画像的课程;
所述用户画像估计模型包括CNN网络、第一RNN网络、第二RNN网络,一个LSTM网络、混合金字塔结构网络和一个CTC loss层;CNN网络用于根据历史课程数据提取出目标用户的历史学习特征,第一RNN网络用于根据历史学习特征预测出目标用户的历史学习标签;LSTM网络用于基于目标用户的历史学习特征预测出目标用户的下一时间段学习特征;混合金字塔结构用于基于历史学习特征和下一时间段学习特征进行融合,得到综合学习特征;第二RNN网络用于基于综合学习特征预测出目标用户的下一时间段学习标签;CTC loss层用于基于历史学习标签对下一时间段学习标签进行矫正,得到目标用户的学习标签。
6.根据权利要求5所述的***,其特征在于,所述用户画像估计模型的训练方法包括:
获得训练集,所述训练集包括多个训练用户对应的多个训练子集,每个用户对应一个训练子集,每个训练子集包括多个科目的训练数据,每个训练数据包括训练用户选课科目、训练用户选课时间、训练用户学习时间集合、训练用户反复学习次数;所述训练用户学习时间集合包括多个训练学习时长;
将多个训练子集输入CNN网络中,CNN网络基于每个训练用户的训练子集中的多个科目的训练数据,提取出训练用户的第一学习特征图,第一学习特征图包括多条第一学习特征序列,每条第一学习特征序列表征一个科目的学习特性;
通过第一RNN网络对多条第一学习特征序列进行学习,预测出训练用户的第一训练标签;
通过LSTM网络基于多条第一学习特征序列进行预测,对应得到多条第二学习特征序列;
将多条第二学习特征序列构成第二学习特征图;
通过混合金字塔结构对第一学习特征图和第二学习特征图进行融合,得到第三学习特征图,第三学习特征图包括多条第三学习特征序列;
通过第二RNN网络对多条第三学习特征序列进行学习,预测出训练用户的第二训练标签;
通过CTC loss层基于第一训练标签和第二训练标签进行融合转录,得到预测标签;
当所述预测标签与所述第一训练标签的差异指数收敛,确定用户画像估计模型训练结束。
7.根据权利要求6所述的***,其特征在于,混合金字塔结构网络包括第一金字塔结构和第二金字塔结构;所述通过混合金字塔结构对第一学习特征图和第二学习特征图进行融合,得到第三学习特征图,包括:
通过第一金字塔结构将第一学习特征图进行降维操作,得到第一降维特征图;
通过第二金字塔结构将第二学习特征图进行降维操作,得到第二降维特征图;
以第二降维特征图作为核,对第一降维特征图进行卷积操作,得到第三学习特征图。
8. 根据权利要求6所述的***,其特征在于,所述通过CTC loss层基于第一训练标签和第二训练标签进行融合转录,得到预测标签,包括:
将第一训练标签和第二训练标签拼接,形成一个长度为M+N的融合标签;M为第一训练标签的长度,N为第二训练标签的长度;
通过CTC loss函数基于融合标签进行转录,得到预测标签。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310102294.8A CN115830405B (zh) | 2023-02-13 | 2023-02-13 | 一种标签化的用户能力画像分析方法及*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310102294.8A CN115830405B (zh) | 2023-02-13 | 2023-02-13 | 一种标签化的用户能力画像分析方法及*** |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115830405A CN115830405A (zh) | 2023-03-21 |
CN115830405B true CN115830405B (zh) | 2023-09-22 |
Family
ID=85521069
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310102294.8A Active CN115830405B (zh) | 2023-02-13 | 2023-02-13 | 一种标签化的用户能力画像分析方法及*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115830405B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107423442A (zh) * | 2017-08-07 | 2017-12-01 | 火烈鸟网络(广州)股份有限公司 | 基于用户画像行为分析的应用推荐方法及***,储存介质及计算机设备 |
KR102265573B1 (ko) * | 2020-09-29 | 2021-06-16 | 주식회사 팀기원매스 | 인공지능 기반 입시 수학 학습 커리큘럼 재구성 방법 및 시스템 |
CN114722281A (zh) * | 2022-04-07 | 2022-07-08 | 平安科技(深圳)有限公司 | 基于用户画像及用户选课行为的培训课程配置方法、装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114519143B (zh) * | 2022-02-18 | 2024-05-14 | 北京百度网讯科技有限公司 | 课程推荐模型的训练方法、课程推荐方法及装置 |
-
2023
- 2023-02-13 CN CN202310102294.8A patent/CN115830405B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107423442A (zh) * | 2017-08-07 | 2017-12-01 | 火烈鸟网络(广州)股份有限公司 | 基于用户画像行为分析的应用推荐方法及***,储存介质及计算机设备 |
KR102265573B1 (ko) * | 2020-09-29 | 2021-06-16 | 주식회사 팀기원매스 | 인공지능 기반 입시 수학 학습 커리큘럼 재구성 방법 및 시스템 |
CN114722281A (zh) * | 2022-04-07 | 2022-07-08 | 平安科技(深圳)有限公司 | 基于用户画像及用户选课行为的培训课程配置方法、装置 |
Non-Patent Citations (2)
Title |
---|
"DenseNet-CTC: An end-to-end RNN-free architecture for context-free string recognition";Hongjian Zhan等;《Computer Vision and Image Understanding》;第204卷;全文 * |
基于大数据和机器学习的大学生选课推荐模型研究;张海华;;信息***工程(第04期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN115830405A (zh) | 2023-03-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110147456B (zh) | 一种图像分类方法、装置、可读存储介质及终端设备 | |
US20210256354A1 (en) | Artificial intelligence learning-based user knowledge tracing system and operating method thereof | |
CN112116092B (zh) | 可解释性知识水平追踪方法、***和存储介质 | |
US20190354887A1 (en) | Knowledge graph based learning content generation | |
CN111209474A (zh) | 在线课程的推荐方法、装置、计算机设备和存储介质 | |
CN111369535B (zh) | 一种细胞检测方法 | |
CN111428448A (zh) | 文本生成方法、装置、计算机设备及可读存储介质 | |
Lu et al. | CMKT: Concept map driven knowledge tracing | |
CN114201684A (zh) | 一种基于知识图谱的自适应学习资源推荐方法及*** | |
CN111460101A (zh) | 知识点类型的识别方法、装置及处理器 | |
CN110222838A (zh) | 深度神经网络及其训练方法、装置、电子设备及存储介质 | |
CN115147353A (zh) | 缺陷检测模型的训练方法、装置、设备、介质及程序产品 | |
CN113705092B (zh) | 基于机器学习的疾病预测方法及装置 | |
CN115631008B (zh) | 商品推荐方法、装置、设备及介质 | |
CN113255701B (zh) | 一种基于绝对-相对学习架构的小样本学习方法和*** | |
CN115830405B (zh) | 一种标签化的用户能力画像分析方法及*** | |
CN112905750A (zh) | 一种优化模型的生成方法和设备 | |
Han et al. | Analyzing student response processes to evaluate success on a technology-based problem-solving task | |
CN116228361A (zh) | 基于特征匹配的课程推荐方法、装置、设备和存储介质 | |
CN113609402B (zh) | 一种基于大数据分析的行业交友交流信息智能推荐方法 | |
CN116108195A (zh) | 基于时序元学习的动态知识图谱预测方法和装置 | |
CN113742591B (zh) | 学习伙伴推荐方法和装置、电子设备、存储介质 | |
CN112231373A (zh) | 知识点数据的处理方法、装置、设备和计算机可读介质 | |
CN112597294A (zh) | 一种习题智能推送方法 | |
CN110334353A (zh) | 词序识别性能的分析方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |