CN111814051A - 一种资源类型确定方法及装置 - Google Patents

一种资源类型确定方法及装置 Download PDF

Info

Publication number
CN111814051A
CN111814051A CN202010652409.7A CN202010652409A CN111814051A CN 111814051 A CN111814051 A CN 111814051A CN 202010652409 A CN202010652409 A CN 202010652409A CN 111814051 A CN111814051 A CN 111814051A
Authority
CN
China
Prior art keywords
resource
vector
user
target user
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010652409.7A
Other languages
English (en)
Other versions
CN111814051B (zh
Inventor
赵汉卿
杜红光
何凯
罗华林
钟昊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing QIYI Century Science and Technology Co Ltd
Original Assignee
Beijing QIYI Century Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing QIYI Century Science and Technology Co Ltd filed Critical Beijing QIYI Century Science and Technology Co Ltd
Priority to CN202010652409.7A priority Critical patent/CN111814051B/zh
Publication of CN111814051A publication Critical patent/CN111814051A/zh
Application granted granted Critical
Publication of CN111814051B publication Critical patent/CN111814051B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供了一种资源类型确定方法及装置,可以对目标用户的用户标识进行映射处理,得到目标用户的第一用户向量;确定目标用户已访问的网络资源中的第一数目个第一网络资源;对第一网络资源各自的资源标识进行映射处理,得到第一网络资源各自的第一资源向量;基于预先训练的概率预测模型,对第一用户向量和各第一资源向量进行处理,得到概率预测模型输出的目标用户对预设各资源类型感兴趣的概率,基于目标用户对预设各资源类型感兴趣的概率,确定目标用户感兴趣的资源类型。基于上述处理,可以确定目标用户感兴趣的资源类型,基于目标用户感兴趣的资源类型,向目标用户进行网络资源推荐,可以提高推荐的网络资源的有效性。

Description

一种资源类型确定方法及装置
技术领域
本发明涉及计算机技术领域,特别是涉及一种资源类型确定方法及装置。
背景技术
随着计算机技术的发展,当今社会正处于一个信息爆发的时代,用户很难从海量的网络资源(例如、电影、音乐、新闻等)中快速的选择出自己感兴趣的网络资源。
现有技术中,可以向目标用户推荐网络资源,例如,针对预设的每一网络资源,可以确定在一段时间内(例如,一个星期)各用户访问该网络资源的总次数,然后,从预设的各网络资源中,确定访问次数较多的网络资源(可以称为目标网络资源),然后,可以根据目标网络资源,向目标用户进行网络资源推荐。
然而,目标网络资源为根据各用户访问网络资源的次数确定出的,可能不是目标用户感兴趣的网络资源,基于确定出的目标网络资源进行推荐,会导致推荐的网络资源的有效性较低。
发明内容
本发明实施例的目的在于提供一种资源类型确定方法及装置,可以确定目标用户感兴趣的资源类型,后续,根据目标用户感兴趣的资源类型,向目标用户进行网络资源推荐,可以提高推荐的网络资源的有效性。具体技术方案如下:
在本发明实施的第一方面,首先提供了一种资源类型确定方法,所述方法包括:
对目标用户的用户标识进行映射处理,得到所述目标用户的用户向量,作为第一用户向量;
确定所述目标用户已访问的网络资源中的第一数目个网络资源,作为第一网络资源;
对所述第一网络资源各自的资源标识进行映射处理,得到所述第一网络资源各自的资源向量,作为第一资源向量;
基于预先训练的概率预测模型,对所述第一用户向量和各所述第一资源向量进行处理,得到所述概率预测模型输出的所述目标用户对预设各资源类型感兴趣的概率;
基于所述目标用户对所述预设各资源类型感兴趣的概率,在所述预设各资源类型中,确定所述目标用户感兴趣的资源类型。
可选的,在所述基于预先训练的概率预测模型,对所述第一用户向量和各所述第一资源向量进行处理,得到所述概率预测模型输出的所述目标用户对预设各资源类型感兴趣的概率之前,所述方法还包括:
对样本用户的用户标识进行映射处理,得到所述样本用户的用户向量,作为第二用户向量;
基于预设的滑动窗口,从所述样本用户已访问的网络资源中,选取所述第一数目个网络资源,作为第二网络资源;其中,所述滑动窗口的长度为所述第一数目;
对所述第二网络资源各自的资源标识进行映射处理,得到所述第二网络资源各自的资源向量,作为第二资源向量;
按照访问时刻的先后顺序,确定访问时刻在所述第二网络资源的访问时刻之后的一个网络资源的资源类型,作为第一资源类型,其中,所述第一资源类型属于所述预设各资源类型;
将所述样本用户对所述第一资源类型感兴趣的概率设置为第一数值,所述样本用户对所述预设各资源类型中,除所述第一资源类型外的其他资源类型感兴趣的概率设置为第二数值,得到所述样本用户对所述预设各资源类型感兴趣的概率;
将所述第二用户向量和各所述第二资源向量,作为初始概率预测模型的输入数据,将所述样本用户对所述预设各资源类型感兴趣的概率,作为对应的所述初始概率预测模型的输出数据,对所述初始概率预测模型的模型参数进行调整,直至达到预设收敛条件。
可选的,所述概率预测模型包括:第一全连接层、循环门控单元、注意力层、自适应网络、第二全连接层、输出层;
所述基于预先训练的概率预测模型,对所述第一用户向量和各所述第一资源向量进行处理,得到所述概率预测模型输出的所述目标用户对预设各资源类型感兴趣的概率,包括:
基于包含所述第一全连接层的网络参数的第一映射矩阵,对所述第一用户向量进行映射处理,得到所述第一用户向量对应的特征向量,作为第一特征向量;
通过所述循环门控单元对各所述第一资源向量进行特征提取,得到所述第一网络资源各自的特征向量,作为第二特征向量;
通过所述注意力层对各所述第二特征向量进行加权处理,得到表示所述第一网络资源的特征向量,作为第三特征向量;
通过所述自适应网络对所述第一特征向量和所述第三特征向量进行加权处理,得到表示所述目标用户已访问的所述第一网络资源的特征向量,作为第四特征向量;
通过所述第二全连接层对所述第四特征向量进行映射处理,得到对应的向量,作为第五特征向量,其中,所述第五特征向量包含的元素的数目与所述预设各资源类型的数目相同;
通过所述输出层对所述第五特征向量进行归一化处理,得到所述目标用户对所述预设各资源类型感兴趣的概率。
可选的,所述通过所述注意力层对各所述第二特征向量进行加权处理,得到表示所述第一网络资源的特征向量,作为第三特征向量,包括:
基于第一预设公式,对各所述第二特征向量进行加权处理,得到表示所述第一网络资源的特征向量,作为第三特征向量,其中,所述第一预设公式为:
Figure BDA0002575464440000031
d表示所述第三特征向量,k表示所述第一数目,hj表示第j个所述第一网络资源的第二特征向量,ht表示第t个所述第一网络资源的第二特征向量,hi表示第i个所述第一网络资源的第二特征向量,σ()表示激活函数,W1表示第一权重矩阵,W2表示第二权重矩阵,m表示第一预设向量,T表示矩阵转置运算符。
可选的,所述通过所述自适应网络对所述第一特征向量和所述第三特征向量进行加权处理,得到表示所述目标用户已访问的所述第一网络资源的特征向量,作为第四特征向量,包括:
基于第二预设公式,对所述第一特征向量和所述第三特征向量进行加权处理,得到表示所述目标用户已访问的所述第一网络资源的特征向量,作为第四特征向量,其中,所述第二预设公式为:
Figure BDA0002575464440000041
c表示所述第四特征向量,s表示所述第一特征向量,d表示所述第三特征向量,W3表示第二映射矩阵,n表示第二预设向量,T表示矩阵转置运算符,σ()表示激活函数。
可选的,所述基于所述目标用户对所述预设各资源类型感兴趣的概率,在所述预设各资源类型中,确定所述目标用户感兴趣的资源类型,包括:
从所述预设各资源类型中,确定所述目标用户感兴趣的概率大于预设概率阈值的资源类型,作为所述目标用户感兴趣的资源类型;
或者,
从所述预设各资源类型中,确定第二数目个资源类型,作为所述目标用户感兴趣的资源类型,其中,所述目标用户对所述第二数目个资源类型感兴趣的概率,大于所述目标用户对所述预设各资源类型中,除所述第二数目个资源类型外的其他资源类型感兴趣的概率。
可选的,在基于所述目标用户对所述预设各资源类型感兴趣的概率,在所述预设各资源类型中,确定所述目标用户感兴趣的资源类型之后,所述方法还包括:
针对所述目标用户感兴趣的每一资源类型,计算所述目标用户对该资源类型感兴趣的概率与第三数目的乘积,作为第四数目,其中,所述第三数目为预置需要向所述目标用户推荐的网络资源的数目;
从该资源类型包含的网络资源中,选取所述第四数目个网络资源,向所述目标用户进行推荐。
在本发明实施的第二方面,还提供了一种资源类型确定装置,所述装置包括:
第一映射模块,用于对目标用户的用户标识进行映射处理,得到所述目标用户的用户向量,作为第一用户向量;
第一确定模块,用于确定所述目标用户已访问的网络资源中的第一数目个网络资源,作为第一网络资源;
第二映射模块,用于对所述第一网络资源各自的资源标识进行映射处理,得到所述第一网络资源各自的资源向量,作为第一资源向量;
预测模块,用于基于预先训练的概率预测模型,对所述第一用户向量和各所述第一资源向量进行处理,得到所述概率预测模型输出的所述目标用户对预设各资源类型感兴趣的概率;
第二确定模块,用于基于所述目标用户对所述预设各资源类型感兴趣的概率,在所述预设各资源类型中,确定所述目标用户感兴趣的资源类型。
可选的,所述装置还包括:
第三映射模块,用于对样本用户的用户标识进行映射处理,得到所述样本用户的用户向量,作为第二用户向量;
第三确定模块,用于基于预设的滑动窗口,从所述样本用户已访问的网络资源中,选取所述第一数目个网络资源,作为第二网络资源;其中,所述滑动窗口的长度为所述第一数目;
第四映射模块,用于对所述第二网络资源各自的资源标识进行映射处理,得到所述第二网络资源各自的资源向量,作为第二资源向量;
第四确定模块,用于按照访问时刻的先后顺序,确定访问时刻在所述第二网络资源的访问时刻之后的一个网络资源的资源类型,作为第一资源类型,其中,所述第一资源类型属于所述预设各资源类型;
第五确定模块,用于将所述样本用户对所述第一资源类型感兴趣的概率设置为第一数值,所述样本用户对所述预设各资源类型中,除所述第一资源类型外的其他资源类型感兴趣的概率设置为第二数值,得到所述样本用户对所述预设各资源类型感兴趣的概率;
调整模块,用于将所述第二用户向量和各所述第二资源向量,作为初始概率预测模型的输入数据,将所述样本用户对所述预设各资源类型感兴趣的概率,作为对应的所述初始概率预测模型的输出数据,对所述初始概率预测模型的模型参数进行调整,直至达到预设收敛条件。
可选的,所述概率预测模型包括:第一全连接层、循环门控单元、注意力层、自适应网络、第二全连接层、输出层;
所述预测模块,具体用于基于包含所述第一全连接层的网络参数的第一映射矩阵,对所述第一用户向量进行映射处理,得到所述第一用户向量对应的特征向量,作为第一特征向量;
通过所述循环门控单元对各所述第一资源向量进行特征提取,得到所述第一网络资源各自的特征向量,作为第二特征向量;
通过所述注意力层对各所述第二特征向量进行加权处理,得到表示所述第一网络资源的特征向量,作为第三特征向量;
通过所述自适应网络对所述第一特征向量和所述第三特征向量进行加权处理,得到表示所述目标用户已访问的所述第一网络资源的特征向量,作为第四特征向量;
通过所述第二全连接层对所述第四特征向量进行映射处理,得到对应的向量,作为第五特征向量,其中,所述第五特征向量包含的元素的数目与所述预设各资源类型的数目相同;
通过所述输出层对所述第五特征向量进行归一化处理,得到所述目标用户对所述预设各资源类型感兴趣的概率。
可选的,所述预测模块,具体用于基于第一预设公式,对各所述第二特征向量进行加权处理,得到表示所述第一网络资源的特征向量,作为第三特征向量,其中,所述第一预设公式为:
Figure BDA0002575464440000071
d表示所述第三特征向量,k表示所述第一数目,hj表示第j个所述第一网络资源的第二特征向量,ht表示第t个所述第一网络资源的第二特征向量,hi表示第i个所述第一网络资源的第二特征向量,σ()表示激活函数,W1表示第一权重矩阵,W2表示第二权重矩阵,m表示第一预设向量,T表示矩阵转置运算符。
可选的,所述预测模块,具体用于基于第二预设公式,对所述第一特征向量和所述第三特征向量进行加权处理,得到表示所述目标用户已访问的所述第一网络资源的特征向量,作为第四特征向量,其中,所述第二预设公式为:
Figure BDA0002575464440000072
c表示所述第四特征向量,s表示所述第一特征向量,d表示所述第三特征向量,W3表示第二映射矩阵,n表示第二预设向量,T表示矩阵转置运算符,σ()表示激活函数。
可选的,所述第二确定模块,具体用于从所述预设各资源类型中,确定所述目标用户感兴趣的概率大于预设概率阈值的资源类型,作为所述目标用户感兴趣的资源类型;
或者,
从所述预设各资源类型中,确定第二数目个资源类型,作为所述目标用户感兴趣的资源类型,其中,所述目标用户对所述第二数目个资源类型感兴趣的概率,大于所述目标用户对所述预设各资源类型中,除所述第二数目个资源类型外的其他资源类型感兴趣的概率。
可选的,所述装置还包括:
第六确定模块,用于针对所述目标用户感兴趣的每一资源类型,计算所述目标用户对该资源类型感兴趣的概率与第三数目的乘积,作为第四数目,其中,所述第三数目为预置需要向所述目标用户推荐的网络资源的数目;
推荐模块,用于从该资源类型包含的网络资源中,选取所述第四数目个网络资源,向所述目标用户进行推荐。
在本发明实施的又一方面,还提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现上述任一所述的资源类型确定方法步骤。
在本发明实施的又一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一所述的资源类型确定方法步骤。
在本发明实施的又一方面,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一所述的资源类型确定方法。
本发明实施例提供的一种资源类型确定方法,对目标用户的用户标识进行映射处理,得到目标用户的用户向量,作为第一用户向量;确定目标用户已访问的网络资源中的第一数目个网络资源,作为第一网络资源;对第一网络资源各自的资源标识进行映射处理,得到第一网络资源各自的资源向量,作为第一资源向量;基于预先训练的概率预测模型,对第一用户向量和各第一资源向量进行处理,得到概率预测模型输出的目标用户对预设各资源类型感兴趣的概率,基于目标用户对预设各资源类型感兴趣的概率,在预设各资源类型中,确定目标用户感兴趣的资源类型。
基于上述处理,由于第一网络资源为目标用户已访问的网络资源,目标用户的第一用户向量和第一网络资源的第一资源向量可以体现目标用户的真实兴趣,基于第一用户向量识和第一资源向量,确定出的目标用户对预设各资源类型感兴趣的概率也可以体现目标用户的真实兴趣,基于目标用户对预设各资源类型感兴趣的概率,确定出的目标用户感兴趣的资源类型的准确性较高,后续,可以基于目标用户感兴趣的资源类型,向目标用户进行网络资源推荐,可以提高推荐的网络资源的有效性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
图1为本发明实施例提供的一种资源类型确定方法的流程图;
图2为本发明实施例提供的一种概率预测模型的结构图;
图3为本发明实施例提供的一种概率预测模型训练方法的流程图;
图4为本发明实施例提供的一种资源类型确定方法的***框图;
图5为本发明实施例提供的一种资源类型确定装置的结构图;
图6为本发明实施例提供的一种电子设备的结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行描述。
参见图1,图1为本发明实施例提供的一种资源类型确定方法的流程图,该方法可以应用于电子设备,该电子设备可以为服务器,也可以为终端,该电子设备用于确定用户感兴趣的资源类型。
该方法可以包括以下步骤:
S101:对目标用户的用户标识进行映射处理,得到目标用户的用户向量,作为第一用户向量。
S102:确定目标用户已访问的网络资源中的第一数目个网络资源,作为第一网络资源。
S103:对第一网络资源各自的资源标识进行映射处理,得到第一网络资源各自的资源向量,作为第一资源向量。
S104:基于预先训练的概率预测模型,对第一用户向量和各第一资源向量进行处理,得到概率预测模型输出的目标用户对预设各资源类型感兴趣的概率。
S105:基于目标用户对预设各资源类型感兴趣的概率,在预设各资源类型中,确定目标用户感兴趣的资源类型。
基于本发明实施例提供的资源类型确定方法,由于第一网络资源为目标用户已访问的网络资源,目标用户的第一用户向量和第一网络资源的第一资源向量可以体现目标用户的真实兴趣,基于第一用户向量和第一资源向量,确定出的目标用户对预设各资源类型感兴趣的概率也可以体现目标用户的真实兴趣,基于目标用户对预设各资源类型感兴趣的概率,确定出的目标用户感兴趣的资源类型的准确性较高,后续,可以基于目标用户感兴趣的资源类型,向目标用户进行网络资源推荐,可以提高推荐的网络资源的有效性。
可以理解的是,针对每一推荐场景,预设各资源类型可以为该推荐场景中电子设备当前能够提供的网络资源(可以称为第三网络资源)的资源类型。例如,在电影推荐场景中,第三网络资源为电影资源,预设各资源类型可以包括:科幻类型、悬疑类型、喜剧类型等。或者,在音乐推荐场景中,第三网络资源为音乐资源,预设各资源类型可以包括:流行类型、民谣类型、摇滚类型等。
在步骤S101中,针对每一推荐场景,目标用户可以为该推荐场景中的任一用户。
电子设备可以获取目标用户的用户标识,目标用户的用户标识可以为表示目标用户唯一性的标识,例如,当目标用户为已注册的用户时,目标用户的用户标识可以用目标用户的注册账号表示,或者,目标用户的用户标识也可以用目标用户的用户名称表示。当目标用户为未注册的用户时,目标用户的用户标识可以用目标用户所使用的终端设备的设备ID表示。
一种实现方式中,电子设备可以基于独热编码(One-Hot Encoding)算法,对目标用户的用户标识进行映射处理,得到目标用户的用户向量(即第一用户向量)。
电子设备可以按照预设顺序对各用户进行排序,排序后的各用户的用户标识为各自的序号。
目标用户的第一用户向量包含的元素的数目与各用户的数目相同。电子设备可以将第一用户向量中序号与目标用户的序号相同的元素设置为1,其他元素设置为0,可以得到第一用户向量。
示例性的,如果各用户的数目为3,各用户的序号分别为:1、2、3。如果目标用户的序号为1,电子设备可以将第一用户向量中的第1个元素设置为1,其他元素设置为0,得到第一用户向量为[1,0,0]。同理,如果目标用户的序号为2,则第一用户向量为[0,1,0],如果目标用户的序号为3,则第一用户向量为[0,0,1]。
同理,如果样本用户的数目为5,电子设备可以确定序号为1的样本用户的第二用户向量为[1,0,0,0,0],序号为2的样本用户的第二用户向量为[0,1,0,0,0],序号为3的样本用户的第二用户向量为[0,0,1,0,0],序号为4的样本用户的第二用户向量为[0,0,0,1,0],序号为5的样本用户的第二用户向量为[0,0,0,0,1]。
可见,如果各用户的数目与样本用户的数目不同,会导致第一用户向量的向量长度,与第二用户向量的向量长度不同。一个向量的向量长度表示该向量包含的元素的数目。
后续,在基于训练好的概率预测模型对第一用户向量进行处理之前,需要再次对第一用户向量进行映射处理,以使得第一用户向量的向量长度,与第二用户向量的向量长度相同。
另外,当各用户的数目较大时,各用户的用户向量的向量长度较大,例如,各用户的数目为10000时,各用户的用户向量的向量长度均为10000,电子设备对向量长度较大的向量进行处理的计算复杂度较高,处理时间较长,会导致资源类型确定方法的效率较低。
另一种实现方式中,为了提高资源类型确定方法的效率,电子设备可以基于第一预设长度,对目标用户的用户标识进行哈希映射处理,得到向量长度为第一预设长度的第一用户向量。
其中,第一预设长度可以为第二用户向量的向量长度。
示例性的,如果样本用户的第二用户向量的向量长度为5,则电子设备可以通过Hash In Code(哈希映射)模块,按照向量长度5,对目标用户的用户标识进行哈希映射处理,得到向量长度为5的第一用户向量。
可见,基于哈希映射算法对各用户的用户标识进行映射处理,可以直接得到第一预设长度的各用户的用户向量,不需要在基于训练好的概率预测模型对第一用户向量进行处理之前,再次对各用户向量进行映射处理,以使得各用户向量的向量长度与第二用户向量的向量长度相同,进而,可以提高资源类型确定方法的效率。
在步骤S102中,电子设备还可以确定目标用户已访问的网络资源,进而,电子设备可以从目标用户已访问的网络资源中选取第一数目个网络资源(即第一网络资源)。
其中,第一数目可以由技术人员根据对初始概率预测模型进行训练时,训练样本包含的样本用户已访问的网络资源的数目进行设置,训练样本包含的样本用户已访问的网络资源的数目,可以由技术人员根据经验设置。
可以理解的是,在不同的推荐场景中,电子设备确定出的目标用户已访问的网络资源为与该推荐场景对应的网络资源,例如,在短视频资源推荐场景中,电子设备可以确定目标用户已访问的短视频资源,或者,在电影资源推荐场景中,电子设备可以确定目标用户已访问的电影资源。
一种实现方式中,电子设备可以随机从目标用户已访问的网络资源中,选取第一数目个网络资源,作为第一网络资源。
示例性的,第一数目可以为3。目标用户已访问的网络资源可以包括:网络资源1、网络资源2、网络资源3、网络资源4、网络资源5。电子设备可以确定网络资源1、网络资源4和网络资源5,作为第一网络资源。
另一种实现方式中,为了提高确定出的目标用户感兴趣的资源类型的准确性,电子设备可以按照访问时刻的先后顺序,从目标用户已访问的网络资源中,选取访问时刻距离当前时刻最近的第一数目个网络资源,作为第一网络资源。
示例性的,第一数目可以为3。目标用户已访问的网络资源可以包括:网络资源1、网络资源2、网络资源3、网络资源4、网络资源5。目标用户访问网络资源1的访问时刻为10:00,目标用户访问网络资源2的访问时刻为9:30,目标用户访问网络资源3的访问时刻为11:00,目标用户访问网络资源4的访问时刻为9:15,目标用户访问网络资源5的访问时刻为11:30。按照访问时刻的先后顺序,对目标用户已访问的网络资源进行排序,可以得到:网络资源4、网络资源2、网络资源1、网络资源3、网络资源5。电子设备可以确定网络资源1、网络资源3和网络资源5,为第一网络资源。
基于上述处理,目标用户已访问的网络资源中,距离当前时刻最近的第一数目个网络资源,可以体现目标用户访问网络资源的时序特征,进而,基于当前时刻最近的第一数目个网络资源,确定出的目标用户感兴趣的资源类型的准确性较高。
在步骤S103中,电子设备可以获取第一网络资源各自的资源标识。网络资源的资源标识可以为表示该网络资源唯一性的标识,例如,网络资源的资源标识可以用网络资源的名称表示,或者,可以按照同一规则对所有网络资源进行排序,网络资源的资源标识可以用排序后的网络资源对应的序号表示。
进而,电子设备可以对第一网络资源各自的资源标识进行映射处理,得到第一网络资源各自的资源向量(即第一资源向量)。
一种实现方式中,针对每一第一网络资源,电子设备可以基于独热编码算法,对该第一网络资源的资源标识进行映射处理,得到该第一网络资源的第一资源向量。
可以按照预设顺序对电子设备当前能够提供的网络资源(即第三网络资源)进行排序,排序后的各网络资源的资源标识为各自的序号。可以理解的是,电子设备当前能够提供的第三网络资源,包含目标用户已访问的第一网络资源。
针对每一第一网络资源,该第一网络资源的第一资源向量包含的元素的数目与第三网络资源的数目相同。电子设备可以将该第一网络资源的第一资源向量中序号与该第一网络资源的序号相同的元素设置为1,其他元素设置为0,可以得到该第一网络资源的第一资源向量。
示例性的,如果第三网络资源的数目为5,第三网络资源的序号分别为:1、2、3、4、5。如果序号为1的网络资源为第一网络资源,确定该第一网络资源的第一资源向量时,可以将该第一网络资源的第一资源向量中的第1个元素设置为1,将其他元素设置为0,可以得到该第一网络资源的第一资源向量为[1,0,0,0,0]。同理,如果序号为3的网络资源为第一网络资源,则该第一网络资源的第一资源向量为[0,0,1,0,0],如果序号为4的网络资源为第一网络资源,则该第一网络资源的第一资源向量为[0,0,0,1,0]。
同理,如果样本用户已访问的网络资源的数目为3,样本用户已访问的网络资源的序号分别为:1、2、3。如果序号为1和2的网络资源为第二网络资源,电子设备可以确定序号为1的第二网络资源的第二资源向量为[1,0,0],序号为2的第二网络资源的第二资源向量为[0,1,0]。
可见,如果第三网络资源的数目与样本用户已访问的网络资源的数目不同,会导致第一资源向量的向量长度,与第二资源向量的向量长度不同。后续,在基于训练好的概率预测模型对第一资源向量进行处理之前,需要再次对第一资源向量进行映射处理,以使得第一资源向量的向量长度与第二资源向量的向量长度相同。
另外,当第三网络资源的数目较多时,第一资源向量的向量长度较大,例如,当第三网络资源的数目为10000时,各第一资源向量的向量长度均为10000,电子设备对向量长度较大的向量进行处理的计算复杂度较高,处理时间较长,会导致资源类型确定方法的效率较低。
另一种实现方式中,为了提高资源类型确定方法的效率,针对每一第一网络资源,电子设备可以基于第二预设长度,对该第一网络资源的资源标识进行哈希映射处理,得到该第一网络资源的资源向量,作为第一资源向量,第一资源向量的向量长度为第二预设长度。
其中,第二预设长度可以为第二资源向量的向量长度。
示例性的,如果第二网络资源的第二资源向量的向量长度为3,则电子设备可以通过Hash In Code模块,按照向量长度3,对第一网络资源的资源标识进行哈希映射处理,得到向量长度为3的第一资源向量。
可见,基于哈希映射算法对各第一网络资源的资源标识进行映射处理,可以直接得到第二预设长度的各第一网络资源的资源向量,不需要在基于训练好的概率预测模型对第一资源向量进行处理之前,再次对各资源向量进行映射处理,以使第一资源向量的向量长度与第二资源向量的向量长度相同,进而,可以提高资源类型确定方法的效率。
在步骤S104中,在获取第一用户向量和各第一资源向量之后,电子设备可以基于预先训练的概率预测模型,对第一用户向量和各第一资源向量进行处理,得到概率预测模型输出的目标用户对预设各资源类型感兴趣的概率。
在本发明的一个实施例中,参见图2,图2为本发明实施例提供的一种概率预测模型的结构图,概率预测模型可以包括:第一全连接层、循环门控单元(Gated RecurrentUnit)、注意力层、自适应网络、第二全连接层、输出层。
相应的,步骤S104可以包括以下步骤:
步骤一,基于包含第一全连接层的网络参数的第一映射矩阵,对第一用户向量进行映射处理,得到第一用户向量对应的特征向量,作为第一特征向量。
第一全连接层可以基于第三预设公式和第一映射矩阵,对第一用户向量进行映射处理,得到目标用户的特征向量(即第一特征向量),并将第一特征向量输入至自适应网络。
s=OWs
s表示第一特征向量,O表示第一用户向量,Ws表示第一映射矩阵。
第一映射矩阵中的初始元素可以由技术人员根据经验设置,后续,可以在对初始概率预测模型进行训练的过程中,对第一映射矩阵中的初始元素进行调整。
步骤二,通过循环门控单元对各第一资源向量进行特征提取,得到第一网络资源各自的特征向量,作为第二特征向量。
针对每一第一网络资源,循环门控单元可以对该第一网络资源对应的第一资源向量进行特征提取,得到对应的特征向量(即第二特征向量),第二特征向量可以表示第一网络资源的时间特征,然后,可以将各第二特征向量输入至注意力层。一个第一网络资源的时间特征可以表示目标用户访问该第一网络资源的先后顺序,以及该第一网络资源与其他第一网络资源之间的相关性。
步骤三,通过注意力层对各第二特征向量进行加权处理,得到表示第一网络资源的特征向量,作为第三特征向量。
在本发明的一个实施例中,注意力层可以基于第一预设公式,对各第二特征向量进行加权处理,得到表示第一网络资源的特征向量,作为第三特征向量,并将第三特征向量输入至自适应网络。
其中,第一预设公式为:
Figure BDA0002575464440000161
d表示第三特征向量,k表示第一数目,hj表示第j个第一网络资源的第二特征向量,ht表示第t个第一网络资源的第二特征向量,hi表示第i个第一网络资源的第二特征向量,σ()表示激活函数,W1表示第一权重矩阵,W2表示第二权重矩阵,m表示第一预设向量,T表示矩阵转置运算符。
其中,激活函数可以由技术人员根据经验设置,例如,激活函数可以为sigmoid(S型函数)函数,激活函数也可以为ReLu(Rectified Linear Units,线性修正单元)函数,但并不限于此。
第一权重矩阵、第二权重矩阵和第一预设向量中的初始元素均可以由技术人员根据经验设置,后续,可以在对初始概率预测模型进行训练的过程中,对第一权重矩阵、第二权重矩阵和第一预设向量中的初始元素进行调整。
步骤四,通过自适应网络对第一特征向量和第三特征向量进行加权处理,得到表示目标用户已访问的第一网络资源的特征向量,作为第四特征向量。
在本发明的一个实施例中,自适应网络可以基于第二预设公式,对第一特征向量和第三特征向量进行加权处理,得到表示目标用户已访问的第一网络资源的特征向量,作为第四特征向量,并将第四特征向量输入至第二全连接层。
其中,第二预设公式为:
Figure BDA0002575464440000162
c表示第四特征向量,s表示第一特征向量,d表示第三特征向量,W3表示第二映射矩阵,n表示第二预设向量,T表示矩阵转置运算符,σ()表示激活函数。
第二映射矩阵和第二预设向量中的初始元素可以由技术人员根据经验设置,后续,可以在对初始概率预测模型进行训练的过程中,对第二映射矩阵和第二预设向量中的初始元素进行调整。
步骤五,通过第二全连接层对第四特征向量进行映射处理,得到对应的向量,作为第五特征向量。
其中,第五特征向量包含的元素的数目与预设各资源类型的数目相同。
由于第四特征向量包含的元素的数目,不一定与预设各资源类型的数目相同,第二全连接层可以对第四特征向量进行映射处理,得到包含的元素的数目与预设各资源类型的数目相同的特征向量(即第五特征向量),并将第五特征向量输入至输出层。
步骤六,通过输出层对第五特征向量进行归一化处理,得到目标用户对预设各资源类型感兴趣的概率。
输出层可以基于softmax(归一化指数函数)函数,对第五特征向量进行处理,得到表示目标用户对预设各资源类型感兴趣的概率的向量。
示例性的,预设各资源类型可以包括:资源类型A、资源类型B、资源类型C,如果概率预测模型输出的向量为:[0.5,0.3,0.2],则表示目标用户对资源类型A感兴趣的概率为0.5,目标用户对资源类型B感兴趣的概率为0.3,目标用户对资源类型C感兴趣的概率为0.2。
在基于训练好的概率预测模型,确定目标用户对预设各资源类型感兴趣的概率之前,电子设备还可以基于预设训练样本,对初始概率预测模型进行训练,得到训练好的概率预测模型。
预设训练样本可以包括:样本用户的用户向量、样本用户已访问的第一数目个第二网络资源各自的资源向量,以及样本用户对预设各资源类型感兴趣的概率。
在本发明的一个实施例中,参见图3,在步骤S102之前,该方法还可以包括以下步骤:
S301:对样本用户的用户标识进行映射处理,得到样本用户的用户向量,作为第二用户向量。
一种实现方式中,电子设备可以获取样本用户的用户标识,并对样本用户的用户标识进行哈希映射处理,得到样本用户的用户向量(即第二用户向量)。
S302:基于预设的滑动窗口,从样本用户已访问的网络资源中,选取第一数目个网络资源,作为第二网络资源。
其中,滑动窗口的长度为第一数目,第一数目可以由技术人员根据经验设置,例如,第一数目可以为5,或者,第一数目也可以为6,但并不限于此。滑动窗口的长度表示该滑动窗口包含的网络资源的数目。
一种实现方式中,电子设备可以确定样本用户已访问的网络资源,并基于预设的滑动窗口,从样本用户已访问的网络资源中选取第一数目个网络资源(即第二网络资源)。
示例性的,滑动窗口的长度可以为3,样本用户已访问的网络资源可以包括:网络资源1、网络资源2、网络资源3、网络资源4、网络资源5、网络资源6。
电子设备可以确定第二网络资源包括:网络资源1、网络资源2、网络资源3,或者,电子设备也可以确定第二网络资源包括:网络资源2、网络资源3、网络资源4,或者,电子设备还可以确定第二网络资源包括:网络资源3、网络资源4、网络资源5。
S303:对第二网络资源各自的资源标识进行映射处理,得到第二网络资源各自的资源向量,作为第二资源向量。
一种实现方式中,电子设备可以对第二网络资源各自的资源标识进行哈希映射处理,得到第二网络资源各自的资源向量(即第二资源向量)。
S304:按照访问时刻的先后顺序,确定访问时刻在第二网络资源的访问时刻之后的一个网络资源的资源类型,作为第一资源类型。
其中,第一资源类型属于预设各资源类型。
一种实现方式中,电子设备可以按照访问时刻的先后顺序,从访问时刻在第二网络资源的访问时刻之后的网络资源中,随机选取一个网络资源,并确定该网络资源的资源类型,作为第一资源类型。
示例性的,当上述滑动窗口包含的网络资源(即第二网络资源)为:网络资源1、网络资源2、网络资源3时,电子设备可以确定访问时刻在第二网络资源之后的一个网络资源为网络资源5,然后,电子设备可以确定网络资源5的资源类型,作为第一资源类型。当上述滑动窗口包含的网络资源为:网络资源2、网络资源3、网络资源4时,电子设备可以确定访问时刻在第二网络资源之后的第一个网络资源为网络资源6,然后,电子设备可以确定网络资源6的资源类型,作为第一资源类型。
另一种实现方式中,为了提高确定出的目标用户感兴趣的资源类型的准确性,电子设备可以按照访问时刻的先后顺序,确定访问时刻在第二网络资源的访问时刻之后的第一个网络资源的资源类型,作为第一资源类型。
示例性的,当上述滑动窗口包含的网络资源(即第二网络资源)为:网络资源1、网络资源2、网络资源3时,电子设备可以确定访问时刻在第二网络资源之后的第一个网络资源为网络资源4,然后,电子设备可以确定网络资源4的资源类型,作为第一资源类型。当上述滑动窗口包含的网络资源为:网络资源2、网络资源3、网络资源4时,电子设备可以确定访问时刻在第二网络资源之后的第一个网络资源为网络资源5,然后,电子设备可以确定网络资源5的资源类型,作为第一资源类型。
基于上述处理,第二网络资源和访问时刻在第二网络资源之后的第一个网络资源,可以体现用户访问网络资源时的时序特征,后续,基于第二网络资源和访问时刻在第二网络资源之后的第一个网络资源,对概率预模型进行训练,可以使得概率预测模型确定用户访问网络资源时的时序特征,进而,基于训练好的概率预测模型,确定出的目标用户感兴趣的资源类型的准确性较高。
S305:将样本用户对第一资源类型感兴趣的概率设置为第一数值,样本用户对预设各资源类型中,除第一资源类型外的其他资源类型感兴趣的概率设置为第二数值,得到样本用户对预设各资源类型感兴趣的概率。
其中,第一数值、第二数值均可以由技术人员根据经验设置,例如,第一数值可以为1,则第二数值可以为0,但并不限于此。一种实现方式中,第二数值小于第一数值。
示例性,第一数值可以为1,第二数值可以为0,样本用户已访问的网络资源可以为电影资源,预设各资源类型可以包括:科幻类型、悬疑类型、喜剧类型。当第一资源类型包括:科幻类型时,则电子设备可以将样本用户对科幻类型感兴趣的概率设置为1,将样本用户对悬疑类型和喜剧类型感兴趣的概率均设置为0,可以得到样本用户对预设各资源类型感兴趣的概率(可以称为第一概率)分别为:1、0、0。当第一资源类型包括:科幻类型、悬疑类型时,则电子设备可以将样本用户对科幻类型和悬疑类型感兴趣的概率均设置为1,将样本用户对喜剧类型感兴趣的概率设置为0,可以得到第一概率分别为:1、1、0。
S306:将第二用户向量和各第二资源向量,作为初始概率预测模型的输入数据,将样本用户对预设各资源类型感兴趣的概率,作为对应的初始概率预测模型的输出数据,对初始概率预测模型的模型参数进行调整,直至达到预设收敛条件。
其中,预设收敛条件可以由技术人员根据经验设置。
一种实现方式中,预设收敛条件可以为对初始概率预测模型的训练次数达到预设次数。
其中,预设次数可以由技术人员根据经验设置。
另一种实现方式中,为了提高训练好的概率预测模型确定出的目标用户对预设各资源类型感兴趣的概率的准确性,预设收敛条件可以为本次训练后计算得到的损失函数值,与前第五数目次计算得到的损失函数值的差值均小于第一差值。
其中,第五数目、第一差值均可以由技术人员根据经验设置。
电子设备可以将第二用户向量和第二资源向量,输入至初始概率预测模型,可以得到初始概率预测模型输出的样本用户对预设各资源类型感兴趣的概率(可以称为第二概率)。然后,电子设备可以计算表示第一概率与第二概率的差异性的损失函数值,并基于计算出的损失函数值,对初始概率预测模型的模型参数进行调整,直至达到预设收敛条件,得到训练好的概率预测模型。
一种实现方式中,步骤S105可以包括以下步骤:
从预设各资源类型中,确定目标用户感兴趣的概率大于预设概率阈值的资源类型,作为目标用户感兴趣的资源类型。
其中,预设概率阈值可以由技术人员根据经验设置。
另一种实现方式中,步骤S105可以包括以下步骤:
从预设各资源类型中,确定第二数目个资源类型,作为目标用户感兴趣的资源类型。
其中,目标用户对第二数目个资源类型感兴趣的概率,大于目标用户对预设各资源类型中,除第二数目个资源类型外的其他资源类型感兴趣的概率,第二数目可以由技术人员根据经验设置。
电子设备可以按照目标用户感兴趣的概率从大到小的顺序,对预设各资源类型进行排序,进而,电子设备可以从排序结果中,确定前第二数目个资源类型,作为目标用户感兴趣的资源类型。
在本发明的一个实施例中,在确定目标用户感兴趣的资源类型之后,该方法还可以包括以下步骤:
步骤1,针对目标用户感兴趣的每一资源类型,计算目标用户对该资源类型感兴趣的概率与第三数目的乘积,作为第四数目。
其中,第三数目为预置需要向目标用户推荐的网络资源的数目,第三数目可以由技术人员根据经验和业务需求设置。
示例性的,第三数目可以为10,在电影推荐场景中,预设各资源类型可以包括:科幻类型、悬疑类型、喜剧类型。如果目标用户对预设各资源类型感兴趣的概率分别为:0.5、0.3、0.2,则电子设备可以确定向目标用户推荐5个科幻类型的电影、3个悬疑类型的电影,以及2个喜剧类型的电影。
步骤2,从该资源类型包含的网络资源中,选取第四数目个网络资源,向目标用户进行推荐。
一种实现方式中,针对目标用户感兴趣的每一资源类型,电子设备可以从该资源类型包含的网络资源中,随机选取第四数目个网络资源,并向目标用户推荐该第四数目个网络资源。
基于上述处理,由于概率预测模型为基于样本用户已访问的第二网络资源,以及样本用户对预设各资源类型感兴趣的概率训练得到的,基于概率预测模型,以及目标用户已访问的第一网络资源,确定出的目标用户对预设各资源类型感兴趣的概率的准确性较高。
参见图4,图4为本发明实施例提供的一种资源类型确定方法的***框图。
电子设备可以获取目标用户的用户标识,并通过第一映射模块,对目标用户的用户标识进行哈希映射,得到第一用户向量。将第一用户向量输入至第一全连接层,并通过第一全连接层对第一用户向量进行映射处理,得到表示目标用户的静态兴趣的第一特征向量。然后,电子设备可以将第一特征向量输入至自适应网络。
电子设备还可以获取目标用户已访问的第一网络资源的资源标识,并通过第二映射模块,对第一网络资源各自的资源标识进行哈希映射处理,得到各第一资源向量。电子设备还可以将各第一资源向量输入至循环门控单元,并通过循环门控单元对各第一资源向量进行特征提取,得到第一网络资源各自的第二特征向量,并将各第二特征向量输入至注意力层。然后,电子设备可以通过注意力层对各第二特征向量进行加权处理,得到表示目标用户的动态兴趣的第三特征向量,并将第一用户特征向量输入至自适应网络。
进而,电子设备可以通过自适应网络对第一特征向量和第三特征向量进行加权处理,得到表示目标用户已访问的第一网络资源的第四特征向量。电子设备还可以通过第二全连接层对第四特征向量进行映射处理,得到对应的第五特征向量,并通过输出层对第五特征向量进行归一化处理,得到目标用户对预设各资源类型感兴趣的概率。
进而,电子设备可以根据目标用户对预设各资源类型感兴趣的概率,确定目标用户感兴趣的资源类型。
基于上述处理,由于第一网络资源为目标用户已访问的网络资源,目标用户的第一用户向量和第一网络资源的第一资源向量可以体现目标用户的真实兴趣,基于第一用户向量和第一资源向量,确定出的目标用户对预设各资源类型感兴趣的概率也可以体现目标用户的真实兴趣,基于目标用户对预设各资源类型感兴趣的概率,确定出的目标用户感兴趣的资源类型的准确性较高,后续,可以基于目标用户感兴趣的资源类型,向目标用户进行网络资源推荐,可以提高推荐的网络资源的有效性。
与图1的方法实施例相对应,参见图5,图5为本发明实施例提供的一种资源类型确定装置的结构图,所述装置包括:
第一映射模块501,用于对目标用户的用户标识进行映射处理,得到所述目标用户的用户向量,作为第一用户向量;
第一确定模块502,用于确定所述目标用户已访问的网络资源中的第一数目个网络资源,作为第一网络资源;
第二映射模块503,用于对所述第一网络资源各自的资源标识进行映射处理,得到所述第一网络资源各自的资源向量,作为第一资源向量;
预测模块504,用于基于预先训练的概率预测模型,对所述第一用户向量和各所述第一资源向量进行处理,得到所述概率预测模型输出的所述目标用户对预设各资源类型感兴趣的概率;
第二确定模块505,用于基于所述目标用户对所述预设各资源类型感兴趣的概率,在所述预设各资源类型中,确定所述目标用户感兴趣的资源类型。
可选的,所述装置还包括:
第三映射模块,用于对样本用户的用户标识进行映射处理,得到所述样本用户的用户向量,作为第二用户向量;
第三确定模块,用于基于预设的滑动窗口,从所述样本用户已访问的网络资源中,选取所述第一数目个网络资源,作为第二网络资源;其中,所述滑动窗口的长度为所述第一数目;
第四映射模块,用于对所述第二网络资源各自的资源标识进行映射处理,得到所述第二网络资源各自的资源向量,作为第二资源向量;
第四确定模块,用于按照访问时刻的先后顺序,确定访问时刻在所述第二网络资源的访问时刻之后的一个网络资源的资源类型,作为第一资源类型,其中,所述第一资源类型属于所述预设各资源类型;
第五确定模块,用于将所述样本用户对所述第一资源类型感兴趣的概率设置为第一数值,所述样本用户对所述预设各资源类型中,除所述第一资源类型外的其他资源类型感兴趣的概率设置为第二数值,得到所述样本用户对所述预设各资源类型感兴趣的概率;
调整模块,用于将所述第二用户向量和各所述第二资源向量,作为初始概率预测模型的输入数据,将所述样本用户对所述预设各资源类型感兴趣的概率,作为对应的所述初始概率预测模型的输出参数,对所述初始概率预测模型的模型参数进行调整,直至达到预设收敛条件。
可选的,所述概率预测模型包括:第一全连接层、循环门控单元、注意力层、自适应网络、第二全连接层、输出层;
所述预测模块504,具体用于基于包含所述第一全连接层的网络参数的第一映射矩阵,对所述第一用户向量进行映射处理,得到所述第一用户向量对应的特征向量,作为第一特征向量;
通过所述循环门控单元对各所述第一资源向量进行特征提取,得到所述第一网络资源各自的特征向量,作为第二特征向量;
通过所述注意力层对各所述第二特征向量进行加权处理,得到表示所述第一网络资源的特征向量,作为第三特征向量;
通过所述自适应网络对所述第一特征向量和所述第三特征向量进行加权处理,得到表示所述目标用户已访问的所述第一网络资源的特征向量,作为第四特征向量;
通过所述第二全连接层对所述第四特征向量进行映射处理,得到对应的向量,作为第五特征向量,其中,所述第五特征向量包含的元素的数目与所述预设各资源类型的数目相同;
通过所述输出层对所述第五特征向量进行归一化处理,得到所述目标用户对所述预设各资源类型感兴趣的概率。
可选的,所述预测模块504,具体用于基于第一预设公式,对各所述第二特征向量进行加权处理,得到表示所述第一网络资源的特征向量,作为第三特征向量,其中,所述第一预设公式为:
Figure BDA0002575464440000241
d表示所述第三特征向量,k表示所述第一数目,hj表示第j个所述第一网络资源的第二特征向量,ht表示第t个所述第一网络资源的第二特征向量,hi表示第i个所述第一网络资源的第二特征向量,σ()表示激活函数,W1表示第一权重矩阵,W2表示第二权重矩阵,m表示第一预设向量,T表示矩阵转置运算符。
可选的,所述预测模块504,具体用于基于第二预设公式,对所述第一特征向量和所述第三特征向量进行加权处理,得到表示所述目标用户已访问的所述第一网络资源的特征向量,作为第四特征向量,其中,所述第二预设公式为:
Figure BDA0002575464440000251
c表示所述第四特征向量,s表示所述第一特征向量,d表示所述第三特征向量,W3表示第二映射矩阵,n表示第二预设向量,T表示矩阵转置运算符,σ()表示激活函数。
可选的,所述第二确定模块505,具体用于从所述预设各资源类型中,确定所述目标用户感兴趣的概率大于预设概率阈值的资源类型,作为所述目标用户感兴趣的资源类型;
或者,
从所述预设各资源类型中,确定第二数目个资源类型,作为所述目标用户感兴趣的资源类型,其中,所述目标用户对所述第二数目个资源类型感兴趣的概率,大于所述目标用户对所述预设各资源类型中,除所述第二数目个资源类型外的其他资源类型感兴趣的概率。
可选的,所述装置还包括:
第六确定模块,用于针对所述目标用户感兴趣的每一资源类型,计算所述目标用户对该资源类型感兴趣的概率与第三数目的乘积,作为第四数目,其中,所述第三数目为预置需要向所述目标用户推荐的网络资源的数目;
推荐模块,用于从该资源类型包含的网络资源中,选取所述第四数目个网络资源,向所述目标用户进行推荐。
基于本发明实施例提供的资源类型确定装置,由于第一网络资源为目标用户已访问的网络资源,目标用户的第一用户向量和第一网络资源的第一资源向量可以体现目标用户的真实兴趣,基于第一用户向量和第一资源向量,确定出的目标用户对预设各资源类型感兴趣的概率也可以体现目标用户的真实兴趣,基于目标用户对预设各资源类型感兴趣的概率,确定出的目标用户感兴趣的资源类型的准确性较高,后续,可以基于目标用户感兴趣的资源类型,向目标用户进行网络资源推荐,可以提高推荐的网络资源的有效性。
本发明实施例还提供了一种电子设备,如图6所示,包括处理器601、通信接口602、存储器603和通信总线604,其中,处理器601,通信接口602,存储器603通过通信总线604完成相互间的通信,
存储器603,用于存放计算机程序;
处理器601,用于执行存储器603上所存放的程序时,实现如下步骤:
对目标用户的用户标识进行映射处理,得到所述目标用户的用户向量,作为第一用户向量;
确定所述目标用户已访问的网络资源中的第一数目个网络资源,作为第一网络资源;
对所述第一网络资源各自的资源标识进行映射处理,得到所述第一网络资源各自的资源向量,作为第一资源向量;
基于预先训练的概率预测模型,对所述第一用户向量和各所述第一资源向量进行处理,得到所述概率预测模型输出的所述目标用户对预设各资源类型感兴趣的概率;
基于所述目标用户对所述预设各资源类型感兴趣的概率,在所述预设各资源类型中,确定所述目标用户感兴趣的资源类型。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
基于本发明实施例提供的电子设备,由于第一网络资源为目标用户已访问的网络资源,目标用户的第一用户向量和第一网络资源的第一资源向量可以体现目标用户的真实兴趣,基于第一用户向量和第一资源向量,确定出的目标用户对预设各资源类型感兴趣的概率也可以体现目标用户的真实兴趣,基于目标用户对预设各资源类型感兴趣的概率,确定出的目标用户感兴趣的资源类型的准确性较高,后续,可以基于目标用户感兴趣的资源类型,向目标用户进行网络资源推荐,可以提高推荐的网络资源的有效性。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一所述的资源类型确定方法步骤。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的资源类型确定方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、电子设备、计算机可读存储介质、计算机程序产品实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (10)

1.一种资源类型确定方法,其特征在于,所述方法包括:
对目标用户的用户标识进行映射处理,得到所述目标用户的用户向量,作为第一用户向量;
确定所述目标用户已访问的网络资源中的第一数目个网络资源,作为第一网络资源;
对所述第一网络资源各自的资源标识进行映射处理,得到所述第一网络资源各自的资源向量,作为第一资源向量;
基于预先训练的概率预测模型,对所述第一用户向量和各所述第一资源向量进行处理,得到所述概率预测模型输出的所述目标用户对预设各资源类型感兴趣的概率;
基于所述目标用户对所述预设各资源类型感兴趣的概率,在所述预设各资源类型中,确定所述目标用户感兴趣的资源类型。
2.根据权利要求1所述的方法,其特征在于,在所述基于预先训练的概率预测模型,对所述第一用户向量和各所述第一资源向量进行处理,得到所述概率预测模型输出的所述目标用户对预设各资源类型感兴趣的概率之前,所述方法还包括:
对样本用户的用户标识进行映射处理,得到所述样本用户的用户向量,作为第二用户向量;
基于预设的滑动窗口,从所述样本用户已访问的网络资源中,选取所述第一数目个网络资源,作为第二网络资源;其中,所述滑动窗口的长度为所述第一数目;
对所述第二网络资源各自的资源标识进行映射处理,得到所述第二网络资源各自的资源向量,作为第二资源向量;
按照访问时刻的先后顺序,确定访问时刻在所述第二网络资源的访问时刻之后的一个网络资源的资源类型,作为第一资源类型,其中,所述第一资源类型属于所述预设各资源类型;
将所述样本用户对所述第一资源类型感兴趣的概率设置为第一数值,所述样本用户对所述预设各资源类型中,除所述第一资源类型外的其他资源类型感兴趣的概率设置为第二数值,得到所述样本用户对所述预设各资源类型感兴趣的概率;
将所述第二用户向量和各所述第二资源向量,作为初始概率预测模型的输入数据,将所述样本用户对所述预设各资源类型感兴趣的概率,作为对应的所述初始概率预测模型的输出数据,对所述初始概率预测模型的模型参数进行调整,直至达到预设收敛条件。
3.根据权利要求1所述的方法,其特征在于,所述概率预测模型包括:第一全连接层、循环门控单元、注意力层、自适应网络、第二全连接层、输出层;
所述基于预先训练的概率预测模型,对所述第一用户向量和各所述第一资源向量进行处理,得到所述概率预测模型输出的所述目标用户对预设各资源类型感兴趣的概率,包括:
基于包含所述第一全连接层的网络参数的第一映射矩阵,对所述第一用户向量进行映射处理,得到所述第一用户向量对应的特征向量,作为第一特征向量;
通过所述循环门控单元对各所述第一资源向量进行特征提取,得到所述第一网络资源各自的特征向量,作为第二特征向量;
通过所述注意力层对各所述第二特征向量进行加权处理,得到表示所述第一网络资源的特征向量,作为第三特征向量;
通过所述自适应网络对所述第一特征向量和所述第三特征向量进行加权处理,得到表示所述目标用户已访问的所述第一网络资源的特征向量,作为第四特征向量;
通过所述第二全连接层对所述第四特征向量进行映射处理,得到对应的向量,作为第五特征向量,其中,所述第五特征向量包含的元素的数目与所述预设各资源类型的数目相同;
通过所述输出层对所述第五特征向量进行归一化处理,得到所述目标用户对所述预设各资源类型感兴趣的概率。
4.根据权利要求3所述的方法,其特征在于,所述通过所述注意力层对各所述第二特征向量进行加权处理,得到表示所述第一网络资源的特征向量,作为第三特征向量,包括:
基于第一预设公式,对各所述第二特征向量进行加权处理,得到表示所述第一网络资源的特征向量,作为第三特征向量,其中,所述第一预设公式为:
Figure FDA0002575464430000031
d表示所述第三特征向量,k表示所述第一数目,hj表示第j个所述第一网络资源的第二特征向量,ht表示第t个所述第一网络资源的第二特征向量,hi表示第i个所述第一网络资源的第二特征向量,σ()表示激活函数,W1表示第一权重矩阵,W2表示第二权重矩阵,m表示第一预设向量,T表示矩阵转置运算符。
5.根据权利要求3所述的方法,其特征在于,所述通过所述自适应网络对所述第一特征向量和所述第三特征向量进行加权处理,得到表示所述目标用户已访问的所述第一网络资源的特征向量,作为第四特征向量,包括:
基于第二预设公式,对所述第一特征向量和所述第三特征向量进行加权处理,得到表示所述目标用户已访问的所述第一网络资源的特征向量,作为第四特征向量,其中,所述第二预设公式为:
Figure FDA0002575464430000032
c表示所述第四特征向量,s表示所述第一特征向量,d表示所述第三特征向量,W3表示第二映射矩阵,n表示第二预设向量,T表示矩阵转置运算符,σ()表示激活函数。
6.根据权利要求1所述的方法,其特征在于,所述基于所述目标用户对所述预设各资源类型感兴趣的概率,在所述预设各资源类型中,确定所述目标用户感兴趣的资源类型,包括:
从所述预设各资源类型中,确定所述目标用户感兴趣的概率大于预设概率阈值的资源类型,作为所述目标用户感兴趣的资源类型;
或者,
从所述预设各资源类型中,确定第二数目个资源类型,作为所述目标用户感兴趣的资源类型,其中,所述目标用户对所述第二数目个资源类型感兴趣的概率,大于所述目标用户对所述预设各资源类型中,除所述第二数目个资源类型外的其他资源类型感兴趣的概率。
7.根据权利要求1所述的方法,其特征在于,在基于所述目标用户对所述预设各资源类型感兴趣的概率,在所述预设各资源类型中,确定所述目标用户感兴趣的资源类型之后,所述方法还包括:
针对所述目标用户感兴趣的每一资源类型,计算所述目标用户对该资源类型感兴趣的概率与第三数目的乘积,作为第四数目,其中,所述第三数目为预置需要向所述目标用户推荐的网络资源的数目;
从该资源类型对应的网络资源中,选取所述第四数目个网络资源,向所述目标用户进行推荐。
8.一种资源类型确定装置,其特征在于,所述装置包括:
第一映射模块,用于对目标用户的用户标识进行映射处理,得到所述目标用户的用户向量,作为第一用户向量;
第一确定模块,用于确定所述目标用户已访问的网络资源中的第一数目个网络资源,作为第一网络资源;
第二映射模块,用于对所述第一网络资源各自的资源标识进行映射处理,得到所述第一网络资源各自的资源向量,作为第一资源向量;
预测模块,用于基于预先训练的概率预测模型,对所述第一用户向量和各所述第一资源向量进行处理,得到所述概率预测模型输出的所述目标用户对预设各资源类型感兴趣的概率;
第二确定模块,用于基于所述目标用户对所述预设各资源类型感兴趣的概率,在所述预设各资源类型中,确定所述目标用户感兴趣的资源类型。
9.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-7任一所述的方法步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-7任一所述的方法步骤。
CN202010652409.7A 2020-07-08 2020-07-08 一种资源类型确定方法及装置 Active CN111814051B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010652409.7A CN111814051B (zh) 2020-07-08 2020-07-08 一种资源类型确定方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010652409.7A CN111814051B (zh) 2020-07-08 2020-07-08 一种资源类型确定方法及装置

Publications (2)

Publication Number Publication Date
CN111814051A true CN111814051A (zh) 2020-10-23
CN111814051B CN111814051B (zh) 2023-07-28

Family

ID=72842953

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010652409.7A Active CN111814051B (zh) 2020-07-08 2020-07-08 一种资源类型确定方法及装置

Country Status (1)

Country Link
CN (1) CN111814051B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113609266A (zh) * 2021-07-09 2021-11-05 阿里巴巴新加坡控股有限公司 资源处理方法以及装置

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9311386B1 (en) * 2013-04-03 2016-04-12 Narus, Inc. Categorizing network resources and extracting user interests from network activity
CN106462626A (zh) * 2014-06-13 2017-02-22 微软技术许可有限责任公司 利用深度神经网络对兴趣度建模
CN108304441A (zh) * 2017-11-14 2018-07-20 腾讯科技(深圳)有限公司 网络资源推荐方法、装置、电子设备、服务器及存储介质
CN108366012A (zh) * 2018-03-08 2018-08-03 北京奇艺世纪科技有限公司 一种社交关系建立方法、装置及电子设备
US10140315B1 (en) * 2016-06-20 2018-11-27 Shutterstock, Inc. Identifying visual portions of visual media files responsive to visual portions of media files submitted as search queries
CN110413877A (zh) * 2019-07-02 2019-11-05 阿里巴巴集团控股有限公司 一种资源推荐方法、装置及电子设备
CN110765260A (zh) * 2019-10-18 2020-02-07 北京工业大学 一种基于卷积神经网络与联合注意力机制的信息推荐方法
CN110941727A (zh) * 2019-11-29 2020-03-31 北京达佳互联信息技术有限公司 一种资源推荐方法、装置、电子设备及存储介质
CN111369278A (zh) * 2020-02-19 2020-07-03 杭州电子科技大学 一种基于用户长短时期兴趣建模的点击率预测方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9311386B1 (en) * 2013-04-03 2016-04-12 Narus, Inc. Categorizing network resources and extracting user interests from network activity
CN106462626A (zh) * 2014-06-13 2017-02-22 微软技术许可有限责任公司 利用深度神经网络对兴趣度建模
US10140315B1 (en) * 2016-06-20 2018-11-27 Shutterstock, Inc. Identifying visual portions of visual media files responsive to visual portions of media files submitted as search queries
CN108304441A (zh) * 2017-11-14 2018-07-20 腾讯科技(深圳)有限公司 网络资源推荐方法、装置、电子设备、服务器及存储介质
CN108366012A (zh) * 2018-03-08 2018-08-03 北京奇艺世纪科技有限公司 一种社交关系建立方法、装置及电子设备
CN110413877A (zh) * 2019-07-02 2019-11-05 阿里巴巴集团控股有限公司 一种资源推荐方法、装置及电子设备
CN110765260A (zh) * 2019-10-18 2020-02-07 北京工业大学 一种基于卷积神经网络与联合注意力机制的信息推荐方法
CN110941727A (zh) * 2019-11-29 2020-03-31 北京达佳互联信息技术有限公司 一种资源推荐方法、装置、电子设备及存储介质
CN111369278A (zh) * 2020-02-19 2020-07-03 杭州电子科技大学 一种基于用户长短时期兴趣建模的点击率预测方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113609266A (zh) * 2021-07-09 2021-11-05 阿里巴巴新加坡控股有限公司 资源处理方法以及装置

Also Published As

Publication number Publication date
CN111814051B (zh) 2023-07-28

Similar Documents

Publication Publication Date Title
CN110825957A (zh) 基于深度学习的信息推荐方法、装置、设备及存储介质
CN107305611B (zh) 恶意账号对应的模型建立方法和装置、恶意账号识别的方法和装置
CN111818093B (zh) 用于进行风险评估的神经网络***、方法及装置
CN110351299B (zh) 一种网络连接检测方法和装置
CN111159563B (zh) 用户兴趣点信息的确定方法、装置、设备及存储介质
CN109214543B (zh) 数据处理方法及装置
CN111797320A (zh) 数据处理方法、装置、设备及存储介质
CN111310743B (zh) 人脸识别方法、装置、电子设备及可读存储介质
WO2023024408A1 (zh) 用户特征向量确定方法、相关设备及介质
CN114548118A (zh) 一种服务对话检测方法及***
CN111814051B (zh) 一种资源类型确定方法及装置
CN116805039B (zh) 特征筛选方法、装置、计算机设备和数据扰动方法
CN110162535B (zh) 用于执行个性化的搜索方法、装置、设备以及存储介质
CN110827078B (zh) 一种信息推荐方法、装置、设备及存储介质
CN115984734A (zh) 模型训练、视频召回方法、装置、电子设备及存储介质
CN113269259B (zh) 一种目标信息的预测方法及装置
CN111984867B (zh) 一种网络资源确定方法及装置
CN115907056A (zh) 预测模型训练方法、信息预测方法及相应装置
CN113609363A (zh) 一种用户搜索方法及装置
CN116708013B (zh) 一种DDoS防护方法及装置
CN113326385B (zh) 目标多媒体资源的获取方法、装置、电子设备和存储介质
CN116501993B (zh) 房源数据推荐方法及装置
CN117994611B (zh) 一种图像分类模型的训练方法、装置及电子设备
CN113672783B (zh) 特征处理方法、模型训练方法及媒体资源处理方法
CN115098793B (zh) 基于大数据的用户画像分析方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant