CN111178986B - 用户-商品偏好的预测方法及*** - Google Patents
用户-商品偏好的预测方法及*** Download PDFInfo
- Publication number
- CN111178986B CN111178986B CN202010098177.5A CN202010098177A CN111178986B CN 111178986 B CN111178986 B CN 111178986B CN 202010098177 A CN202010098177 A CN 202010098177A CN 111178986 B CN111178986 B CN 111178986B
- Authority
- CN
- China
- Prior art keywords
- user
- commodity
- data
- model
- prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0282—Rating or review of business operators or products
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- Engineering & Computer Science (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种用户‑商品偏好的预测方法及***,涉及计算机数据处理技术领域,其中预测***包括日志召回模块、数据预处理模块、参数控制模块、模型训练模块、预测结果生成模块和数据输出模块,该方法利用深度学习突出的表征能力,通过在预测模型中引入深度学习思想,利用其表征能力来挖掘用户和商品的隐含特征,从而提供准确的用户‑商品评分预测结果,为用户提供个性化、便捷的推荐服务;同时本发明还加入了并行计算来缩短训练时间,实现了在保证准确性的同时将模型的计算消耗限制在可接受的范围内,确保其具有商用价值,可泛用于各种推荐***。
Description
技术领域
本发明涉及计算机数据处理技术领域,具体而言,涉及一种使用并行计算的基于深度隐特征的用户-商品偏好的预测方法及***。
背景技术
随着互联网的发展,电商平台因其便捷性和丰富性已深入日常生活的各个方面,然而在面对种类繁多的商品时,多数的用户往往淹没在诸多的选择中,无法迅速便捷地找到自己喜欢的商品,这与便捷的初衷恰恰相反。因此针对用户个人条件和喜好进行定制化的推荐就显得十分必要。在多数的电商平台中,每天活跃着大量的用户,交易记录、浏览历史、评分评价数据等为平台推荐提供了最原始的数据积累。通常的做法是利用用户对商品的评分形成庞大的用户-商品评分矩阵,然后通过评分高低来预测用户对商品的青睐程度,由于***中用户群体庞大加之商品种类繁多,实际应用中每个用户又不可能对所有的商品一一评分,所以通常情况下用户-商品评分矩阵表现为极为稀疏的高维矩阵。
根据在电商平台的历史评分和行为数据,我们可以了解分析用户(商品)的偏好(特征),在此基础上建立有效的用户-商品喜好的预测模型。并通过用户的历史行为数据来仿真实验,从而为个性化的推荐策略提供重要的科学依据。
目前,已经有很多关于用户-商品偏好的预测方法。矩阵分解模型是推荐***中经典的协同过滤模型,其通过将用户和商品映射到低维向量空间,然后计算用户和商品的向量内积来预测新的未知评分。然而,在实际的场景中,用户对商品的评分记录并不容易获取,或者说评分数据只是推荐***中用户行为数据中非常小的一部分,大量的用户并不会对每个自己浏览过或者购买过的商品编写评价,所以单纯的评分数据并不能很好的建模用户和商品,对应的预测结果也就无法做到很高的准确度。
近年来,深度学***台中庞大的用户量和商品量将导致神经网络中的参数量、计算量和运行时内存消耗相对于经典算法以几何倍数增长,同时加之神经网络冗长的训练时间将进一步降低其实用价值。
发明内容
本发明在于提供一种用户-商品偏好的预测方法及***,其能够针对不同目标用户进行定制化的精准商品预测和推荐,以及在保证准确性的同时将模型的计算消耗限制在可接受的范围内,确保其具有商用价值。
本发明采取的技术方案如下:
第一方面,本发明提供了一种用户-商品偏好的预测方法,包括以下步骤:
S1、收集用户在购物平台上的日志文件,并从中获取用户的日常行为信息数据;
S2、对所述日常行为信息数据进行预处理,得到可直接使用的用户-商品评分数据;
S3、构建基于深度隐特征的用户-商品偏好预测模型,该模型为具有表征能力的分解模型,其能够挖掘用户和商品的隐含特征,初始化用户-商品偏好预测模型的权重参数,其中初始化迭代轮数T=0,定义最大迭代轮数为Tm;
S4、对于目标用户和商品,利用用户-商品偏好预测模型,并行的计算用户和商品的抽象隐特征向量,以及当前未知的用户-商品预测评分;
S5、计算当前未知的用户-商品预测评分相对于用户-商品评分数据的误差;
S6、若用户-商品偏好预测模型收敛或者T=Tm,则执行步骤S8,否则执行S7;
S7、根据误差进行反向传播,更新用户-商品偏好预测模型中的参数,T=T+1,跳转至步骤S4;
S8、根据当前用户-商品偏好预测模型计算得到的用户和商品的抽象隐特征向量,生成最终的用户-商品预测评分;
S9、输出最终的用户-商品预测评分,以及该最终的用户-商品预测评分所对应的用户和商品的抽象隐特征向量,完成用户-商品偏好的预测。
本技术方案的技术效果是:引入深度学习思想,仅利用模型的表征能力来完成对用户和商品隐含特征的抽象建模,同时加入并行计算来缩短训练时间,能够根据用户-商品的历史交互记录进行准确的用户和商品抽象,能够针对不同用户进行定制化的精准商品预测和推荐;在保证准确性的同时将模型的计算消耗限制在可接受的范围内,确保其具有商用价值。
可选地,所述日常行为信息数据包括用户在购物平台上的点击行为、浏览行为、收藏行为、购买行为和评论行为。
具体地,所述步骤S2具体包括:
将日常行为信息数据中的用户集合记为M,商品集合记为N;
由日常行为信息数据中直接的评分数据构成了一个|M|行、|N|列的用户-商品评分矩阵R;
将日常行为信息数据中不包含评分的数据补充到用户-商品评分矩阵R中,得到用户-商品交互评分矩阵X:
其中,i∈M,j∈N;
将用户-商品交互评分矩阵X作为所述可直接使用的用户-商品评分数据。
更具体地,所述步骤S4中,用户i的抽象隐特征向量mi和商品j的抽象隐特征向量nj表示如下:
其中为Vi和Vj为用户-商品嵌入网络输出的用户i和商品j的稠密向量表示,WU1和WI1分别为用户和商品感知器第1层的权重矩阵,bU1和bI1分别为用户和商品感知器第1层的偏执参数,φ表示ReLu激活函数。
更具体地,
其中,emb(Θ)表示嵌入运算,feai和idi分别表示用户i的属性和ID输入,feaj和idj分别表示商品j的属性和ID输入,Θ代表向量过程中的权重参数。
具体地,所述步骤S7中,使用利用梯度下降法对用户-商品偏好预测模型进行反向传播,更新模型的权重参数。
第二方面,本发明提供了一种用户-商品偏好预测***,包括:
日志召回模块,其用于收集用户在购物平台上的日志文件,并从中获取用户的日常行为信息数据;
数据预处理模块,其用于接收并预处理所述日常行为信息数据,得到模型训练过程中可直接使用的用户-商品评分数据;
参数控制模块,其用于初始化基于深度隐特征的用户-商品偏好预测模型的权重参数,并传递参数和控制用户-商品偏好预测模型的训练;
模型训练模块,其包括并行计算单元、线程通信单元和参数更新单元,所述并行计算单元用于并行的计算用户和商品的抽象隐特征向量和未知的用户-商品预测评分,所述线程通信单元用于使并行训练单元和参数更新单元的线程同步和数据交互,所述参数更新单元用于反向传播更新所述用户-商品偏好预测模型的权重参数;
预测结果生成模块,其用于生成最终未知的用户-商品预测评分;
数据输出模块,用于输出最终的用户-商品预测评分及其对应的用户和商品的抽象隐特征向量。
本技术方案的技术效果是:提供了一种实现用户-商品偏好预测方法的***,该***引入深度学习训练架构,模型训练模块设有并行计算单元,能够实现并行计算以缩短训练时间。
具体地,所述参数控制模块包括初始化单元和参数控制单元;所述初始化单元用于初始化基于深度隐特征的用户-商品偏好预测模型的权重参数,其包括并行的用户-商品的嵌入网络和后续的多层感知器层;所述参数控制单元用于传递参数和控制用户-商品偏好预测模型的训练。
更具体地,初始化单元配置为初始化模型参数,包括并行的用户-商品嵌入网络和多层用户-商品感知器层;用户-商品嵌入网络包括初始化用户和商品的嵌入层大小embed_size和初始稠密向量表示,embed_size为初始稠密表示的维度;多层感知器层的初始化层数小于10。
进一步地,该预测***还包括数据存储模块,其用于存储预测***中的数据。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举本发明实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1是实施例中所述用户-商品偏好的预测***示意框图;
图2是实施例中所述用户-商品偏好的预测方法流程示意图;
图3是实施例中通过用户i和商品j的隐特征来对未知评分值进行预测的过程示意图;
图4是实施例中前后数据分析过程中RMSE对比图,RMSE是预测误差的衡量尺度,RMSE越小精度越高。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
请参照图1,本实施例提供了一种用户-商品偏好预测***,包括:
日志召回模块,其用于收集用户在购物平台上的日志文件,并从中获取用户的日常行为信息数据;
数据预处理模块,其用于接收并预处理日常行为信息数据,得到模型训练过程中可直接使用的用户-商品评分数据;
参数控制模块,其包括初始化单元和参数控制单元,初始化单元用于初始化基于深度隐特征的用户-商品偏好的预测过程中涉及的相关参数;参数控制单元用于控制参数和模型的训练过程;
模型训练模块,其包括并行计算单元、线程通信单元和参数更新单元,并行计算单元用于并行的计算用户和商品的抽象隐特征向量和未知的用户-商品预测评分,线程通信单元用于使并行训练单元和参数更新单元的线程同步和数据交互,参数更新单元用于反向传播更新用户-商品偏好预测模型的权重参数;
预测结果生成模块,其用于生成最终未知的用户-商品预测评分,并将最终未知的用户-商品预测评分存入的数据存储模块,包括参数接收单元和预测结果生成单元;
数据输出模块,用于输出最终的用户-商品预测评分及其对应的用户和商品的抽象隐特征向量;
数据存储模块,其用于存储预测***中的数据。
用户在使用电商购物平台时会产生大量的与***交互的使用记录,在本实施例中,日志召回模块将在客户授权的情况下从客户端收集用户日常使用平台时产生的日志文件。
在本实施例中,日志召回模块将在客户授权的情况下从客户端收集用户日常使用平台时产生的日志文件。
在本实施例中,初始化单元配置为初始化模型参数,包括并行的用户、商品的嵌入网络和后续的多层感知器层。嵌入网络包括:初始化用户和商品的嵌入层大小embed_size,每个向量作为用户或商品的初始稠密表示,embed_size的大小即为初始的稠密向量的维度,使用标准正态分布进行初始化。多层感知器层包括:初始化多层感知器的层数layer_size,初始化为小于10的正整数;初始化多层感知器每一层的感知器数量ln(n=1,2…,layer_size),多层感知器最后一层感知器的数量即ln决定了最终用户和商品隐特征的维度,分别初始化递减的小于embed_size的正整数;初始化多层感知器的激活函数,默认初始化为ReLu。初始化整个模型的优化器optim,反向传播优化网络时使用的方法,默认初始化为SGD;初始化模型的学习率alpha,用于控制反向传播时的步长,初始化为较小的正数,默认为0.001;初始化dropout,训练中随机丢掉网络单元的比例,初始化为小于1的浮点数;初始化训练过程中停止训练的误差精度tol,tol是判断训练是否结束的参数,初始化为极小的正数。
实施例2
请参照图2,本实施例提供了一种用户-商品偏好的预测方法,其使用了实施例1所述用户-商品偏好的预测***,包括以下步骤:
S1、日志召回模块在用户允许的条件下,收集用户在购物平台上的日志文件,并从中获取用户的日常行为信息数据,提供给用户-商品偏好的预测***;
S2、利用用户-商品偏好的预测***的数据预处理模块接收日志召回模块收集的日常行为信息数据,将其处理成可直接使用的用户-商品评分数据并存入数据存储模块;
S3、结合预测***参数控制模块中的参数初始化单元进行用户-商品偏好预测模型的构建和初始化,其中初始化迭代轮数T=0,定义最大迭代轮数为Tm;
S4、对于目标用户和商品,利用用户-商品偏好预测模型的并行计算单元并行的计算用户和商品的抽象隐特征向量,以及当前未知的用户-商品预测评分;
S5、计算当前未知的用户-商品预测评分相对于用户-商品评分数据的误差;
S6、若用户-商品偏好预测模型收敛或者T=Tm,则执行步骤S8,否则执行S7;
S7、根据误差进行反向传播,更新用户-商品偏好预测模型中的参数,T=T+1,跳转至步骤S4;
S8、根据当前用户-商品偏好预测模型计算得到的用户和商品的抽象隐特征向量,生成最终的用户-商品预测评分;
S9、输出最终的用户-商品预测评分,以及该最终的用户-商品预测评分所对应的用户和商品的抽象隐特征向量,完成用户-商品偏好的预测。
用户在使用购物平台时会产生大量的与***交互的使用记录,在本实施例中,日常行为信息数据包括用户在购物平台上的点击行为、浏览行为、收藏行为、购买行为和评论行为。
在日常行为信息数据中,包括少量直接可用的评分数据,以及大量的不包含评分但从一定程度上反应了用户偏好的历史行为数据,因此在本实施例中,步骤S2具体包括:
将日常行为信息数据中的用户集合记为M,商品集合记为N;
由日常行为信息数据中直接的评分数据构成了一个|M|行、|N|列的用户-商品评分矩阵R;
将日常行为信息数据中不包含评分的数据补充到用户-商品评分矩阵R中,得到用户-商品交互评分矩阵X:
其中,i∈M,j∈N;
将用户-商品交互评分矩阵X作为可直接使用的用户-商品评分数据。
在本实施例中,步骤S3具体包括:构建如附图3所示的模型结构,初始化模型参数,包括并行的用户、商品的嵌入网络和后续的多层感知器层。嵌入网络包括:初始化用户和商品的嵌入层大小embed_size,每个向量作为用户或商品的初始稠密表示,embed_size的大小即为初始的稠密向量的维度,使用标准正态分布进行初始化。多层感知器层包括:初始化多层感知器的层数layer_size,初始化为小于10的正整数;初始化多层感知器每一层的感知器数量ln(n=1,2…,layer_size),多层干机器最后一层感知器的数量即ln决定了最终用户和商品隐特征的维度,分别初始化递减的小于embed_size的正整数;初始化多层感知器的激活函数,默认初始化为ReLu。初始化整个模型的优化器optim,反向传播优化网络时使用的方法,默认初始化为SGD;初始化模型的学习率alpha,用于控制反向传播时的步长,初始化为较小的正数,默认为0.001;初始化迭代轮数T=0,定义最大迭代轮数为Tm;初始化dropout,训练中随机丢掉网络单元的比例,初始化为小于1的浮点数;初始化训练过程中停止训练的误差精度tol,tol是判断训练是否结束的参数,初始化为极小的正数。
在本实施例中,步骤S4生成的评分结果为训练中的临时数据(用来更新用户-商品偏好预测模型中的参数),步骤S8生成的结果为训练好模型后输出的准确预测。
在本实施例的S4中,用户-商品偏好预测模型的输入包含2个部分,分别进行用户和商品的特征提取,输入分别为用户的属性数据、用户的ID和商品的属性数据、商品的ID。在嵌入层模型分为4个线程并行处理这些输入,针对连续型变量在该变量空间中进行标准化缩放:
使得所有变量落在(0,1)区间中;针对离散型变量则进行独热编码,转化为只包含0和1的向量。另外针对用户和商品ID这类极端稀疏的向量,模型在独热编码后紧接着添加了embedding layer来将这部分输入转化为稠密向量。Embedding的本质为一层全连接的神经网络:
Y=WX+b
其中X为经过独热编码的极端稀疏的用户(商品)ID向量,W为网络的权重系数矩阵(矩阵大小于输入向量的维度和上文所述emb_size参数决定),b为偏执(可根据使用环境决定是否需要),Y为网络的输出,即对用户(商品)ID进行embedding后得到的稠密向量。在嵌入层的最后,将4个线程分别处理得到的属性和ID向量两两进行拼接得到原始的用户和商品的稠密向量表示:
其中Vi和Vj分别为用户和商品的抽象向量表示,emb(Θ)表示嵌入运算,feai和idi分别表示用户i的属性和ID输入,feaj和idj分别表示商品j的属性和ID输入,Θ代表向量过程中的权重参数。
在上述4个线程分别对用户特征、用户ID、商品ID和商品属性进行处理的过程中,由于参数量和处理流程不同,在实际工作中对用户和商品属性相关的计算耗时会低于对ID相关的计算过程,此时将依赖本装置中线程通信单元阻塞率先完成的线程,并在所有线程完成计算后唤醒阻塞线程完成嵌入层最终的向量拼接工作。
得到用户和商品的向量表示后Vi和Vj,分别输入附图3所示模型结构的多层感知器层即MLP layer,运算得到最终的用户和商品的隐特征向量mi和nj:
其中为Vi和Vj为嵌入层输出的用户i和商品j的原始稠密向量,WU1和WI1分别为用户和商品感知器第1层的权重矩阵,bU2和bI2分别为用户和商品感知器第1层的偏执参数,φ表示ReLu激活函数,f表示后续多层中与第1层类似的运算。
在本实施例的S5中,当前未知的用户-商品预测评分相对于用户-商品评分数据的误差的计算具体为:
根据多层感知器输出的用户和商品的隐特征向量mi和nj,通过点击的方式计算对应的模型预测评分:
其中mi和nj分别为上述步骤中输出的用户和商品的隐特征向量,表示通过模型计算得到的用户i对商品j的评分或者称为偏好,区别于实际交互分数Xij,其间的误差将作为优化目标在反向传播中利用梯度下降法求解模型参数。在此过程中也将依赖线程通信单元完成多层感知器层用户和商品隐特征向量计算线程的同步工作。
在本实施例的步骤S6中,需比较误差L和允许误差tol,如果L小于tol,则说明模型收敛;如果L大于tol,则说明模型还未收敛,继续比较当前训练轮数T和最大迭代轮数Tm。
在本实施例的步骤S7中,根据误差L,使用参数控制模块的初始化单元中指定的优化器optim利用梯度下降法对模型进行反向传播,更新模型权重参数。
在本实施例的步骤S8中,预测结果生成模块的参数接收单元由参数控制模块传递的参数,结合模型训练模块构造和训练好的模型,预测结果生成模块利用用户和商品的隐特征向量对未知的评分做出预测:
生成的预测结果将存入装置所述的数据存储模块。图3为通过用户i和商品j的隐特征来对未知评分值进行预测的过程示意图。
由图4可以得出,应用本发明方法后,大大提高了模型在为用户进行个性化推荐时的准确度。在实际应用中,可以更好的为用户便捷且符合用户个性化需求的商品。具体地,由图4可以得到,运用了本发明的预测装置和方法后,推荐的准确率相较于之前提升了约5%。即运用本发明的预测装置和方法后,可以明显地提高用户的满意度。
通过以上预测方法与过程,可以提高模型对用户进行个性化推荐时的预测准确度,对平台产品的推销和用户的体验具有重要意义。
本发明所述的一种基于深度隐特征的用户-商品偏好的预测装置和方法,旨在利用深度学习突出的表征能力,通过在经典矩阵分解模型中引入深度学习思想,利用其表征能力来挖掘用户和商品的隐含特征,从而提供准确的用户-商品评分预测结果,为用户提供个性化、便捷的推荐服务;同时本发明还加入了并行计算来缩短训练时间,实现了在保证准确性的同时将模型的计算消耗限制在可接受的范围内,确保其具有商用价值,可泛用于各种推荐***。
以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种用户-商品偏好的预测方法,其特征在于,包括以下步骤:
S1、收集用户在购物平台上的日志文件,并从中获取用户的日常行为信息数据;
S2、对所述日常行为信息数据进行预处理,得到可直接使用的用户-商品评分数据;
S3、构建基于深度隐特征的用户-商品偏好预测模型,该模型为具有表征能力的分解模型,其能够挖掘用户和商品的隐含特征,初始化用户-商品偏好预测模型的权重参数,其中初始化迭代轮数T=0,定义最大迭代轮数为Tm;
S4、对于目标用户和商品,利用用户-商品偏好预测模型,并行的计算用户和商品的抽象隐特征向量,以及当前未知的用户-商品预测评分;
S5、计算当前未知的用户-商品预测评分相对于用户-商品评分数据的误差;
S6、若用户-商品偏好预测模型收敛或者T=Tm,则执行步骤S8,否则执行S7;
S7、根据误差进行反向传播,更新用户-商品偏好预测模型中的参数,T=T+1,跳转至步骤S4;
S8、根据当前用户-商品偏好预测模型计算得到的用户和商品的抽象隐特征向量,生成最终的用户-商品预测评分;
S9、输出最终的用户-商品预测评分,以及该最终的用户-商品预测评分所对应的用户和商品的抽象隐特征向量,完成用户-商品偏好的预测。
2.根据权利要求1所述用户-商品偏好的预测方法,其特征在于,所述日常行为信息数据包括用户在购物平台上的点击行为、浏览行为、收藏行为、购买行为和评论行为。
3.根据权利要求2所述用户-商品偏好的预测方法,其特征在于,所述步骤S2具体包括:
将日常行为信息数据中的用户集合记为M,商品集合记为N;
由日常行为信息数据中直接的评分数据构成了一个|M|行、|N|列的用户-商品评分矩阵R;
将日常行为信息数据中不包含评分的数据补充到用户-商品评分矩阵R中,得到用户-商品交互评分矩阵X:
其中,i∈M,j∈N;
将用户-商品交互评分矩阵X作为所述可直接使用的用户-商品评分数据。
4.根据权利要求3所述用户-商品偏好的预测方法,其特征在于,所述步骤S4中,用户i的抽象隐特征向量mi和商品j的抽象隐特征向量nj表示如下:
其中为Vi和Vj为用户-商品嵌入网络输出的用户i和商品j的稠密向量表示,WU1和WI1分别为用户和商品感知器第1层的权重矩阵,bU1和bI1分别为用户和商品感知器第1层的偏执参数,φ表示ReLu激活函数。
5.根据权利要求4所述用户-商品偏好的预测方法,其特征在于,
其中,emb(Θ)表示嵌入运算,feai和idi分别表示用户i的属性和ID输入,feaj和idj分别表示商品j的属性和ID输入,Θ代表向量过程中的权重参数。
6.根据权利要求1所述用户-商品偏好的预测方法,其特征在于,所述步骤S7中,使用利用梯度下降法对用户-商品偏好预测模型进行反向传播,更新模型的权重参数。
7.一种用户-商品偏好预测***,其特征在于,包括:
日志召回模块,其用于收集用户在购物平台上的日志文件,并从中获取用户的日常行为信息数据;
数据预处理模块,其用于接收并预处理所述日常行为信息数据,得到模型训练过程中可直接使用的用户-商品评分数据;
参数控制模块,其用于初始化基于深度隐特征的用户-商品偏好预测模型的权重参数,并传递参数和控制用户-商品偏好预测模型的训练;
模型训练模块,其包括并行计算单元、线程通信单元和参数更新单元,所述并行计算单元用于并行的计算用户和商品的抽象隐特征向量和未知的用户-商品预测评分,所述线程通信单元用于使并行训练单元和参数更新单元的线程同步和数据交互,所述参数更新单元用于反向传播更新所述用户-商品偏好预测模型的权重参数;
预测结果生成模块,其用于生成最终的用户-商品预测评分;
数据输出模块,用于输出最终的用户-商品预测评分及其对应的用户和商品的抽象隐特征向量。
8.根据权利要求7所述的用户-商品偏好的预测***,其特征在于,所述参数控制模块包括初始化单元和参数控制单元;所述初始化单元用于初始化基于深度隐特征的用户-商品偏好预测模型的权重参数,其包括并行的用户-商品的嵌入网络和后续的多层感知器层;所述参数控制单元用于传递参数和控制用户-商品偏好预测模型的训练。
9.根据权利要求7所述用户-商品偏好的预测方法,其特征在于,初始化单元配置为初始化模型参数,包括并行的用户-商品嵌入网络和多层用户-商品感知器层;用户-商品嵌入网络包括初始化用户和商品的嵌入层大小embed_size和初始稠密向量表示,embed_size为初始稠密表示的维度;多层感知器层的初始化层数小于10。
10.根据权利要求7所述的用户-商品偏好的预测***,其特征在于,该预测***还包括数据存储模块,其用于存储预测***中的数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010098177.5A CN111178986B (zh) | 2020-02-18 | 2020-02-18 | 用户-商品偏好的预测方法及*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010098177.5A CN111178986B (zh) | 2020-02-18 | 2020-02-18 | 用户-商品偏好的预测方法及*** |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111178986A CN111178986A (zh) | 2020-05-19 |
CN111178986B true CN111178986B (zh) | 2023-04-07 |
Family
ID=70654970
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010098177.5A Active CN111178986B (zh) | 2020-02-18 | 2020-02-18 | 用户-商品偏好的预测方法及*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111178986B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111651512B (zh) * | 2020-05-27 | 2022-06-10 | 福建博思软件股份有限公司 | 基于半监督学习的多源异构商品特征权重求解方法和装置 |
CN112132660B (zh) * | 2020-09-25 | 2023-12-26 | 尚娱软件(深圳)有限公司 | 商品推荐方法、***、设备及存储介质 |
CN112818256B (zh) * | 2021-02-05 | 2022-06-03 | 武汉大学 | 一种基于神经协同过滤的推荐方法 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015041121A (ja) * | 2013-08-20 | 2015-03-02 | 株式会社日立製作所 | 販売予測システム及び販売予測方法 |
CN104463637A (zh) * | 2014-12-23 | 2015-03-25 | 北京石油化工学院 | 一种基于电商平台的商品推荐方法、装置及服务器 |
CN106600302A (zh) * | 2015-10-19 | 2017-04-26 | 玺阅信息科技(上海)有限公司 | 基于Hadoop的商品推荐*** |
CN107016058A (zh) * | 2017-03-10 | 2017-08-04 | 浙江工业大学 | 一种基于属性信息偏好自学习的推荐预测方法 |
CN107563841A (zh) * | 2017-08-03 | 2018-01-09 | 电子科技大学 | 一种基于用户评分分解的推荐*** |
CN109857928A (zh) * | 2018-12-25 | 2019-06-07 | 北京交通大学 | 基于多元信用评估的用户偏好预测方法 |
JP6548771B1 (ja) * | 2018-04-05 | 2019-07-24 | 和則 藤沢 | 消費財調達支援システム |
CN110413878A (zh) * | 2019-07-04 | 2019-11-05 | 四川金赞科技有限公司 | 基于自适应弹性网络的用户-商品偏好的预测装置和方法 |
CN110460570A (zh) * | 2019-07-03 | 2019-11-15 | 湖南匡安网络技术有限公司 | 一种具有前向安全性的智能电网数据加密方法和解密方法 |
CN110490686A (zh) * | 2019-07-08 | 2019-11-22 | 西北大学 | 一种基于时间感知的商品评分模型构建、推荐方法及*** |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107730289A (zh) * | 2016-08-11 | 2018-02-23 | 株式会社理光 | 一种用户行为分析方法及用户行为分析装置 |
CN106530010B (zh) * | 2016-11-15 | 2017-12-12 | 平安科技(深圳)有限公司 | 融合时间因素的协同过滤方法和装置 |
-
2020
- 2020-02-18 CN CN202010098177.5A patent/CN111178986B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015041121A (ja) * | 2013-08-20 | 2015-03-02 | 株式会社日立製作所 | 販売予測システム及び販売予測方法 |
CN104463637A (zh) * | 2014-12-23 | 2015-03-25 | 北京石油化工学院 | 一种基于电商平台的商品推荐方法、装置及服务器 |
CN106600302A (zh) * | 2015-10-19 | 2017-04-26 | 玺阅信息科技(上海)有限公司 | 基于Hadoop的商品推荐*** |
CN107016058A (zh) * | 2017-03-10 | 2017-08-04 | 浙江工业大学 | 一种基于属性信息偏好自学习的推荐预测方法 |
CN107563841A (zh) * | 2017-08-03 | 2018-01-09 | 电子科技大学 | 一种基于用户评分分解的推荐*** |
JP6548771B1 (ja) * | 2018-04-05 | 2019-07-24 | 和則 藤沢 | 消費財調達支援システム |
CN109857928A (zh) * | 2018-12-25 | 2019-06-07 | 北京交通大学 | 基于多元信用评估的用户偏好预测方法 |
CN110460570A (zh) * | 2019-07-03 | 2019-11-15 | 湖南匡安网络技术有限公司 | 一种具有前向安全性的智能电网数据加密方法和解密方法 |
CN110413878A (zh) * | 2019-07-04 | 2019-11-05 | 四川金赞科技有限公司 | 基于自适应弹性网络的用户-商品偏好的预测装置和方法 |
CN110490686A (zh) * | 2019-07-08 | 2019-11-22 | 西北大学 | 一种基于时间感知的商品评分模型构建、推荐方法及*** |
Non-Patent Citations (2)
Title |
---|
冯兴杰 ; 曾云泽 ; .基于评分矩阵与评论文本的深度推荐模型.计算机学报.(05),全文. * |
蒋伟.推荐***若干关键技术研究.《中国优秀博硕士学位论文全文数据库(博士)信息科技辑》.2018,(第undefined期),I138-90. * |
Also Published As
Publication number | Publication date |
---|---|
CN111178986A (zh) | 2020-05-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112598462B (zh) | 基于协同过滤和深度学习的个性化推荐方法及*** | |
CN112529168B (zh) | 一种基于gcn的属性多层网络表示学习方法 | |
CN110717098B (zh) | 基于元路径的上下文感知用户建模方法、序列推荐方法 | |
WO2022057658A1 (zh) | 推荐模型训练方法、装置、计算机设备及存储介质 | |
CN111178986B (zh) | 用户-商品偏好的预测方法及*** | |
CN113987200B (zh) | 神经网络结合知识图谱的推荐方法、***、终端、介质 | |
CN114048331A (zh) | 一种基于改进型kgat模型的知识图谱推荐方法及*** | |
CN109313720A (zh) | 具有稀疏访问的外部存储器的增强神经网络 | |
CN110781409A (zh) | 一种基于协同过滤的物品推荐方法 | |
CN112631560B (zh) | 一种推荐模型的目标函数的构建方法及终端 | |
CN111737578A (zh) | 一种推荐方法及*** | |
Lu et al. | Learning from multi-view multi-way data via structural factorization machines | |
CN114417172A (zh) | 一种深度兴趣进化推荐方法、装置、设备和存储介质 | |
CN113345564B (zh) | 一种基于图神经网络的患者住院时长早期预测方法及装置 | |
Yuan et al. | Deep learning from a statistical perspective | |
CN116340635A (zh) | 物品推荐方法、模型训练方法、装置及设备 | |
CN115344794A (zh) | 一种基于知识图谱语义嵌入的旅游景点推荐方法 | |
CN115687757A (zh) | 融合层次注意与特征交互的推荐方法及其应用*** | |
CN115630219A (zh) | 推荐模型的训练方法、装置和计算机设备 | |
CN114565436A (zh) | 基于时序建模的车型推荐***、方法、设备及存储介质 | |
CN114443956A (zh) | 内容推荐方法以及相关设备 | |
CN115222177A (zh) | 业务数据处理方法、装置、计算机设备和存储介质 | |
CN113569130A (zh) | 内容推荐方法、装置、设备及可读存储介质 | |
Luo et al. | User dynamic preference construction method based on behavior sequence | |
CN117252665B (zh) | 业务推荐方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |