CN110837596A - 一种智能推荐方法、装置、计算机设备及存储介质 - Google Patents

一种智能推荐方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN110837596A
CN110837596A CN201910872210.2A CN201910872210A CN110837596A CN 110837596 A CN110837596 A CN 110837596A CN 201910872210 A CN201910872210 A CN 201910872210A CN 110837596 A CN110837596 A CN 110837596A
Authority
CN
China
Prior art keywords
item
exposure
convolution
vector
click
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910872210.2A
Other languages
English (en)
Other versions
CN110837596B (zh
Inventor
陈楚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Life Insurance Company of China Ltd
Original Assignee
Ping An Life Insurance Company of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Life Insurance Company of China Ltd filed Critical Ping An Life Insurance Company of China Ltd
Priority to CN201910872210.2A priority Critical patent/CN110837596B/zh
Publication of CN110837596A publication Critical patent/CN110837596A/zh
Application granted granted Critical
Publication of CN110837596B publication Critical patent/CN110837596B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0203Market surveys; Market polls
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/08Insurance

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Finance (AREA)
  • Theoretical Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Technology Law (AREA)
  • Game Theory and Decision Science (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例属于大数据的智能推荐技术领域,涉及一种智能推荐方法,包括获取项目的至少一个特征值和原始表征向量,该项目包括多个点击序列项目和待学习的曝光项目;将该至少一个特征值及原始表征向量进行拼接,得到各点击序列项目和该曝光项目的新表征向量;将该各点击序列项目和该曝光项目的新表征向量组合在一起,并进行卷积深度学习获取卷积特征;将该卷积特征与该原始表征向量的深度网络的处理结果拼接后输入推荐模型的输出层,得到曝光项目的点击机率;根据所述点击机率确定是否推荐所述曝光项目。本申请还提供一种智能推荐装置、计算机设备及存储介质。本申请可以提高推荐模型推荐的精准性。

Description

一种智能推荐方法、装置、计算机设备及存储介质
技术领域
本申请涉及大数据的智能推荐技术领域,尤其涉及一种智能推荐方法、装置、计算机设备及存储介质。
背景技术
随着网络技术的发展,个性化推荐已经成为人们网络生活中不可或缺的网络服务之一,也成为了互联网产品未来发展的重点。现有技术通常使用深度学习网络模型进行个性化的产品推荐,例如:电商在产品推荐时使用深度学习网络模型,一般采用wide&deep(宽度&深度)推荐模型,deep网络部分输入商品item(项目)的embedding(表征向量),包括点击序列和曝光商品的表征向量拼接后接入MLP(多层感知器),wide网络输入item的表征向量以外的特征,例如用户性别,商品价钱,商品购买率,场景ID等,然而,这种网络结构没有考虑点击序列和曝光商品之间的隐性特征,deep网络在训练时也没有考虑商品的其他属性特征,因此常出现推荐结果不够准确的现象,导致推荐结果与实际情况不符。
发明内容
本申请实施例的目的在于提出一种智能推荐方法、装置、计算机设备及存储介质,以解决现有技术使用深度学习网络推荐结果与实际情况不符的问题。
为了解决上述技术问题,本申请实施例提供一种智能推荐方法,采用了如下所述的技术方案:
获取项目的至少一个特征值和原始表征向量,所述项目包括多个点击序列项目和待学习的曝光项目;
将所述至少一个特征值及原始表征向量进行拼接,得到各点击序列项目和所述曝光项目的新表征向量;
将所述各点击序列项目和所述曝光项目的新表征向量组合在一起,并进行卷积深度学习获取卷积特征;
将所述项目的原始表征向量输入推荐模型的深度网络的输入层得到深度网络的处理结果;
将所述卷积特征与所述原始表征向量的深度网络的处理结果拼接后输入推荐模型的输出层,得到曝光项目的点击机率;
根据所述点击机率确定是否推荐所述曝光项目。
进一步的,所述将所述至少一个特征值及原始表征向量进行拼接,得到各点击序列项目和各曝光项目的新表征向量的步骤包括:
将所述至少一个特征值写入所述原始表征向量,构成新表征向量。
进一步的,所述将所述点击序列项目和所述曝光项目的新表征向量组合在一起,并进行卷积深度学习获取卷积特征的步骤包括:
将各点击序列项目和各曝光项目的新表征向量组合在一起,构成卷积图像;
根据预设的卷积核对卷积图像进行卷积计算,获取卷积特征。
进一步的,所述根据预设的卷积核对卷积图像进行卷积计算,获取卷积特征的步骤包括:
将由各点击序列项目和各曝光项目的新表征向量构成的二维向量写入卷积神经网络的输入层,以使卷积神经网络的进行卷积计算和处理,并输出所述卷积特征。
进一步的,所述将所述项目的原始表征向量输入推荐模型的深度网络的输入层得到深度网络处理结果的步骤包括:
将所述各点击序列项目与所述各曝光项目的原始表征向量一同输入深度网络计算得到降维表征向量。
进一步的,所述将所述卷积特征与所述深度网络的处理结果拼接后输入所述推荐模型的输出层,得到所述曝光项目的点击机率的步骤包括:
将所述降维表征向量与所述卷积特征进行拼接,构成组合表征向量;
将所述组合表征向量输入所述推荐模型的输出层,并利用sigmoid函数进行计算,得到所述曝光项目的点击机率。
进一步的,所述获取待学习的项目的至少一个特征值和原始表征向量的步骤包括:
从根据所述项目特征数据提取至少一个特征值;
获取所述项目的用户数据,并将所述用户数据转换为表征向量。
为了解决上述技术问题,本申请实施例还提供一种智能推荐装置,所述智能推荐装置包括:
向量获取模块,用于获取项目的至少一个特征值和原始表征向量,所述项目包括多个点击序列项目和待学习的曝光项目;
拼接模块,用于将所述至少一个特征值及原始表征向量进行拼接,得到各点击序列项目和所述曝光项目的新表征向量;
深度网络处理结果获取模块,用于将所述项目的原始表征向量输入推荐模型的深度网络的输入层得到深度网络的处理结果;
卷积特征获取模块,将所述各点击序列项目和所述曝光项目的新表征向量组合在一起,并进行卷积深度学习获取卷积特征;
点击率获取模块,将所述卷积特征与所述原始表征向量的深度网络的处理结果拼接后输入推荐模型的输出层,得到曝光项目的点击机率;
推荐模块,用于根据所述点击机率确定是否推荐所述曝光项目。
为了解决上述技术问题,本申请实施例还提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时实现如前所述的智能推荐方法的步骤。
为了解决上述技术问题,本申请实施例还提供一种计算机可读存储介质,采用了如下所述的技术方案:
所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如前所述的智能推荐方法的步骤。
与现有技术相比,本申请实施例主要有以下有益效果:
通过将项目(包括点击序列item和曝光item)的项目特征的特征值加入到原始表征向量(embedding向量)中生成新的embedding向量,使得新的embedding向量能反映出所述item的更丰富、更准确的属性,有利于模型的效果的提升。同时将点击序列item与曝光item组成卷积图并进行卷积深度学学习,可以把点击序列的item和曝光item之间的隐式特征学习出来,并加入到推荐模型的最后一层计算曝光项目的点击几率,从而对模型效果施加最直接的影响,提高推荐模型推荐的精准性。
附图说明
为了更清楚地说明本申请中的方案,下面将对本申请实施例描述中所需要使用的附图作一个简单介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请可以应用于其中的示例性***架构图;
图2根据本申请的智能推荐方法的一个实施例的流程图;
图3是点击序列项目和各曝光项目的新表征向量组合在一起构成卷积图像的示意图;
图4是将计算得到的卷积特征应用到推荐模型的示意图;
图5是根据本申请的智能推荐装置的一个实施例的结构示意图;
图6是根据本申请的计算机设备的一个实施例的结构示意图。
具体实施方式
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同;本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请;本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
为了使本技术领域的人员更好地理解本申请方案,下面将结合附图,对本申请实施例中的技术方案进行清楚、完整地描述。
如图1所示,***架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture ExpertsGroup Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving PictureExperts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上显示的页面提供支持的后台服务器。
需要说明的是,本申请实施例所提供的智能推荐方法一般由服务器执行,相应地,智能推荐装置一般设置于服务器中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
继续参考图2,示出了根据本申请的点击机率计算的方法的一个实施例的流程图。所述的智能推荐方法,包括以下步骤:
步骤201,获取项目的至少一个特征值和原始表征向量,所述项目包括多个点击序列项目和一个曝光项目。
本实施例中,曝光项目可以是指在网页曝光的项目,项目可以包括商品、文章、广告等。曝光项目也是需要预测点击机率的项目,其可以是已经曝光的项目,也可以是等待曝光的项目。根据不同的场景可以采用不同的曝光项目,例如在模型训练阶段选取已经曝光过的项目,在利用模型进行推荐时,则是待推荐的等待曝光的项目。
点击序列项目主要从日志中提取的已经曝光过的项目,其可以只包括被用户点击或浏览过的项目。
在本实施例中,智能推荐方法运行于其上的电子设备(例如图1所示的服务器)可以通过有线连接方式或者无线连接方式与终端设备连接。需要指出的是,上述无线连接方式可以包括但不限于3G/4G连接、WiFi连接、蓝牙连接、WiMAX连接、Zigbee连接、UWB(ultrawideband)连接、以及其他现在已知或将来开发的无线连接方式。
实际应用中,网页(或APP模块)会记录页面曝光的项目特征数据和用户对项目的行为数据,这些数据可以以日志的形式存储到指定的服务器中。当需要时,可以从服务器中提取相应的数据。
本实施例中,步骤201包括:
从网页日志中获取项目特征数据及用户数据;
从所述项目特征数据提取至少一个特征值;
将所述用户数据转换为表征向量。
本实施例中,项目特征是指与项目相关的特征。以商品为例,项目特征可以包括价格,种类,购买率,场景id等特征,这些特征以数值(即特征值)的方式进行表示,如种类为车险时,特征值设为1,为产险时,特征值设为2。
用户数据,是指与用户相关的特征,比如用户ID、用户位置、用户搜索关键字、购买记录等。
实际应用中,可以先将与一个项目相关的用户的数据,按时间先后顺序由左至右的排列出来获取一个序列化数据结构,然后通过embedding技术将所述序列化数据转化为embedding向量。
步骤202,将所述至少一个特征值及原始表征向量进行拼接,得到各点击序列项目和所述曝光项目的新表征向量。
在本实施例中,可以将所述至少一个特征值写入所述原始embedding向量之后,构成新embedding向量。即新embedding向量的构成为原始embedding向量+至少一个特征值。
现有技术中,embedding向量只是item的向量,不包含价格,种类,购买率等特征。本步骤拼接的方式就是把项目的特征值放在item embedding向量后面,假如embedding向量的维度是32维,那么把价格,种类,购买率,场景id写进去,这个item的新的embedding就变成36维。每个特征作为新的embedding向量的一个维度元素。拼接了其他特征后的embedding向量,能反映出item更丰富,更准确的属性,有利于模型的效果的提升。
步骤203,将所述各点击序列项目和所述曝光项目的新表征向量组合在一起,并进行卷积深度学习获取卷积特征。
在本实施例中,该步骤包括:
将各点击序列项目和各曝光项目的新表征向量组合在一起,构成卷积图像;
根据预设的卷积核对卷积图像进行卷积计算,获取卷积特征。
如图3所示,选择3个点击序列item(点击序列item1、点击序列item2、点击序列item3),和曝光item组成了卷积图像,卷积核size(大小)设置为4*3。
其中每个点击序列item包含了7向量,这7个向量由该点击序列item的原始embedding向量和特征值构成。曝光item也包含了7个向量,由该曝光item的原始embedding向量和特征值构成。曝光item直接拼接在3个item之上。由图3可以看出,其实际是一个4*7的二维向量,其中虚线表示卷积核size设置为4*3。
实际应用中,可以采用卷积神经网络(Convolutional Neural Network,CNN)进行卷积计算。
CNN由输入和输出层以及多个隐藏层组成,隐藏层可分为卷积层,池化层、和全连通层,其中卷积层和池化层可以循环任意次。
具体的,卷积层是CNN的核心,层的参数由一组可学习的滤波器(filter),滤波器的设计由卷积核决定,滤波器每次移动时在原图矩阵上覆盖的部分与卷积核做卷积,之后按照步长移动滤波器,直到覆盖整个矩阵。简单来说,卷积层是用来对输入层进行卷积,提取更高层次的特征。
池化层又称下采样,它的作用是减小数据处理量同时保留有用信息。具体操作是划分卷积层得到的小矩阵,每一个划分中用最大的元素代替,得到更小的新矩阵。
全连通层就是一个常规的神经网络,它的作用是对经过多次卷积层和多次池化层所得出来的高级特征进行全连接(全连接就是常规神经网络的性质),算出最后的预测值,即卷积特征。
输出层与全连通之间还可以设置激活函数层,其目的CNN算法加入非线性因素的,提高神经网络对模型的表达能力。
卷积神经网络进行卷积计算的步骤包括:
输入层接收点击序列item和曝光item构成的二维向量(如图3所示);
卷积层根据预设的卷积核对输入层进行卷积,提取高层次特征;
池化层对卷积层得到的高层次特征进行划分,得到新矩阵;
全连通层对新矩阵进行全连接,得到卷积特征;
输出层输出所述卷积特征。
步骤204、将所述项目的原始表征向量输入推荐模型的深度网络的输入层得到深度网络处理结果。
实际应用中,所述推荐模型是指计算曝光item的点击几率的模型,例如GRU(GatedRecurrent Unit,门控循环单元)深度神经网络模型就是一种常用的推荐模型,通过训练可以实现利用历史点击序列item和待曝光的项目的相关数据(如项目特征、embedding向量等)计算待曝光的item的点击机率,然后根据计算出的点击机率对待曝光的item进行排序,选择出排在前面的一个或多个待曝光的项目进行曝光,在页面进行显示。
实际应用中深度神经网络模型包含了一个deep网络,deep网络是一个前馈神经网络,如图4所示,左侧虚线部分即为deep网络,其输入包括点击序列item与所述曝光item的原始embedding向量,经过deep网络的RELU(Rectified Linear Unit,ReLU,修正线性单元)处理后,能够更好地挖掘点击序列item与曝光item的相关特征。
本实施例中,步骤204包括:
将所述各点击序列项目与所述各曝光项目的原始表征向量一同输入推荐模型的深度网络计算得到降维表征向量。
步骤205、将所述卷积特征与所述原始表征向量的深度网络的处理结果拼接后输入推荐模型的输出层,得到所述曝光项目的点击机率(Probablities)。
本实施例中,步骤205包括:
将所述降维表征向量与所述卷积特征进行拼接并输入推荐模型的输出层进行计算,得到所述曝光项目的点击机率。
将所述降维表征向量与所述卷积特征进行拼接,构成组合表征向量;
将所述组合表征向量输入所述推荐模型的输出层,并利用sigmoid函数进行计算,得到所述曝光项目的点击机率。
实际应用中,sigmoid函数也叫Logistic函数,是一个S形函数,它能够将向量映射到(0,1)的区间中。
步骤206,根据所述点击机率确定是否推荐所述曝光项目。
实际应用中,可以通过计算各曝光项目的点击机率,然后对各曝光项目的点击机率进行排序,根据排序结果确定需推荐的曝光项目;也可以设置一个预设的阈值,将点击机率超过所述阈值的曝光项目确定为推荐项目。
本实施例的智能推荐方法,通过将项目(包括点击序列item和曝光item)的项目特征的特征值加入到原始embedding向量中生成新的embedding向量,使得embedding向量能反映出所述item的更丰富、更准确的属性,有利于模型的效果的提升。同时将点击序列item与曝光item组成卷积图并进行卷积深度学学习,可以把点击序列的item和曝光item之间的隐式特征学习出来,并加入到推荐模型的最后一层计算曝光项目的点击几率,从而对模型效果施加最直接的影响,提高推荐模型推荐的精准性。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)等非易失性存储介质,或随机存储记忆体(Random Access Memory,RAM)等。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
进一步参考图5,作为对上述图2所示方法的实现,本申请提供了一种智能推荐装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图5所示,本实施例所述的智能推荐装置500包括:特征值获取模块501、向量获取模块502、拼接模块503、卷积特征获取模块504、深度网络处理结果获取模块505以及点击率获取模块506、推荐模块507。其中:
特征值获取模块501,用于获取项目的至少一个特征值,所述项目包括多个点击序列项目和待学习的曝光项目;
向量获取模块502,用于获取所述项目的原始表征向量;
拼接模块503,用于将所述至少一个特征值及原始表征向量进行拼接,得到各点击序列项目和所述曝光项目的新表征向量;
卷积特征获取模块504,将所述各点击序列项目和所述曝光项目的新表征向量组合在一起,并进行卷积深度学习获取卷积特征;
深度网络处理结果获取模块505,用于将所述项目的原始表征向量输入推荐模型的深度网络的输入层得到深度网络的处理结果;
点击率获取模块506,将所述卷积特征与所述原始表征向量的深度网络的处理结果拼接后输入推荐模型的输出层,得到曝光项目的点击机率;
推荐模块507,用于根据所述点击机率确定是否推荐所述曝光项目。
实际应用中,所述推荐模型是指计算曝光item的点击几率的模型,例如GRU(GatedRecurrent Unit,门控循环单元)深度神经网络模型就是一种常用的推荐模型,通过训练可以实现利用历史点击序列item和待曝光的项目的相关数据(如项目特征、embedding向量等)计算待曝光的item的点击机率,然后根据计算出的点击机率对待曝光的item进行排序,选择出排在前面的一个或多个待曝光的项目进行曝光,在页面进行显示。
实际应用中深度神经网络模型包含了一个deep网络,deep网络是一个前馈神经网络,如图4所示,左侧虚线部分即为deep网络,其输入包括点击序列item与所述曝光item的原始embedding向量,经过deep网络的RELU(Rectified linear unit,ReLU,修正线性单元)处理后,能够更好地挖掘点击序列item与曝光item的相关特征。
在本实施例的一些可选的实现方式中,所述特征值获取模块501包括:
数据获取子模块,用于从网页日志中获取项目特征数据及用户数据;
特征值提取子模块,用于从所述项目特征数据提取至少一个特征值;
转换子模块,用于将所述用户数据转换为表征向量。
具体的,项目特征是指与项目相关的特征。以商品为例,项目特征可以包括价格,种类,购买率,场景id等特征,这些特征以数值(即特征值)的方式进行表示,如种类为车险时,特征值设为1,为产险时,特征值设为2。
在本实施例的一些可选的实现方式中,所述向量获取模块502,还用于获取所述项目的用户数据,并将所述用户数据转换为表征向量。
具体的,用户数据是指与用户相关的特征,比如用户ID、用户位置、用户搜索关键字、购买记录等。
实际应用中,可以先将与一个项目相关的用户的数据,按时间先后顺序由左至右的排列出来获取一个序列化数据结构,然后通过embedding技术将所述序列化数据转化为embedding向量。
在本实施例的一些可选的实现方式中,所述拼接模块503还用于将所述至少一个特征值写入所述原始表征向量,构成新表征向量。
在本实施例中,可以将所述至少一个特征值写入所述原始embedding向量之后,构成新embedding向量。即新embedding向量的构成为原始embedding向量+至少一个特征值。
现有技术中,embedding向量只是item的向量,不包含价格,种类,购买率等特征。本步骤拼接的方式就是把项目的特征值放在item embedding向量后面,假如embedding向量的维度是32维,那么把价格,种类,购买率,场景id写进去,这个item的新的embedding就变成36维。每个特征作为新的embedding向量的一个维度元素。拼接了其他特征后的embedding向量,能反映出item更丰富,更准确的属性,有利于模型的效果的提升。
在本实施例的一些可选的实现方式中,所述卷积特征获取模块504包括:
卷积图像获取子模块,用于将各点击序列项目和各曝光项目的新表征向量组合在一起,构成卷积图像;
计算子模块,用于根据预设的卷积核对卷积图像进行卷积计算,获取卷积特征。
具体的,所述卷积特征计算子模块,还用于将由各点击序列项目和各曝光项目的新表征向量构成的二维向量写入卷积神经网络的输入层,以使卷积神经网络的进行卷积计算和处理,并输出所述卷积特征。
如图3所示,选择3个点击序列item,和曝光item组成了卷积图像,卷积核size(大小)设置为4*3。
其中每个点击序列item包含了7向量,这7个向量由该点击序列item的原始embedding向量和特征值构成。曝光item也包含了7给向量,由该曝光item的原始embedding向量和特征值构成。曝光item直接拼接在3个item之上。由图3可以看出,其实际是一个4*7的二维向量,其中虚线表示卷积核size设置为4*3。
实际应用中,可以采用卷积神经网络(Convolutional Neural Network,CNN)进行卷积计算。
CNN由输入和输出层以及多个隐藏层组成,隐藏层可分为卷积层,池化层、和全连通层,其中卷积层和池化层可以循环任意次。
在本实施例的一些可选的实现方式中,所述深度网络的处理结果获取模块505,还用于将所述各点击序列项目与所述各曝光项目的原始表征向量一同输入深度网络计算得到降维表征向量。
点击率获取模块506,还用于将所述降维表征向量与所述卷积特征进行拼接,构成组合表征向量;
将所述组合表征向量输入所述推荐模型的输出层,并利用sigmoid函数进行计算,得到所述曝光项目的点击机率。
在本实施例的一些可选的实现方式中,可以通过计算各曝光项目的点击机率,然后由推荐模块507对各曝光项目的点击机率进行排序,根据排序结果确定需推荐的曝光项目;也可以设置一个预设的阈值,由推荐模块507直接将点击机率超过所述阈值的曝光项目确定为推荐项目。
本实施例的智能推荐装置,通过将项目(包括点击序列item和曝光item)的项目特征的特征值加入到原始embedding向量中生成新的embedding向量,使得embedding向量能反映出所述item的更丰富、更准确的属性,有利于模型的效果的提升。同时将点击序列item与曝光item组成卷积图并进行卷积深度学学习,可以把点击序列的item和曝光item之间的隐式特征学习出来,并加入到推荐模型的最后一层计算曝光项目的点击几率,从而对模型效果施加最直接的影响,提高推荐模型推荐的精准性。
为解决上述技术问题,本申请实施例还提供计算机设备。具体请参阅图6,图6为本实施例计算机设备基本结构框图。
所述计算机设备6包括通过***总线相互通信连接存储器61、处理器62、网络接口63。需要指出的是,图中仅示出了具有组件61-63的计算机设备6,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。其中,本技术领域技术人员可以理解,这里的计算机设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(ApplicationSpecific Integrated Circuit,ASIC)、可编程门阵列(Field-Programmable GateArray,FPGA)、数字处理器(Digital Signal Processor,DSP)、嵌入式设备等。
所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。
所述存储器61至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器61可以是所述计算机设备6的内部存储单元,例如该计算机设备6的硬盘或内存。在另一些实施例中,所述存储器61也可以是所述计算机设备6的外部存储设备,例如该计算机设备6上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(FlashCard)等。当然,所述存储器61还可以既包括所述计算机设备6的内部存储单元也包括其外部存储设备。本实施例中,所述存储器61通常用于存储安装于所述计算机设备6的操作***和各类应用软件,例如智能推荐方法的程序代码等。此外,所述存储器61还可以用于暂时地存储已经输出或者将要输出的各类数据。
所述处理器62在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器62通常用于控制所述计算机设备6的总体操作。本实施例中,所述处理器62用于运行所述存储器61中存储的程序代码或者处理数据,例如运行所述智能推荐方法的程序代码。
所述网络接口63可包括无线网络接口或有线网络接口,该网络接口63通常用于在所述计算机设备6与其他电子设备之间建立通信连接。
本申请还提供了另一种实施方式,即提供一种计算机可读存储介质,所述计算机可读存储介质存储有点击机率计算程序,所述点击机率计算程序可被至少一个处理器执行,以使所述至少一个处理器执行如上述的智能推荐方法的步骤。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例所述的方法。
显然,以上所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例,附图中给出了本申请的较佳实施例,但并不限制本申请的专利范围。本申请可以以许多不同的形式来实现,相反地,提供这些实施例的目的是使对本申请的公开内容的理解更加透彻全面。尽管参照前述实施例对本申请进行了详细的说明,对于本领域的技术人员来而言,其依然可以对前述各具体实施方式所记载的技术方案进行修改,或者对其中部分技术特征进行等效替换。凡是利用本申请说明书及附图内容所做的等效结构,直接或间接运用在其他相关的技术领域,均同理在本申请专利保护范围之内。

Claims (10)

1.一种智能推荐方法,其特征在于,包括下述步骤:
获取项目的至少一个特征值和原始表征向量,所述项目包括多个点击序列项目和曝光项目;
将所述至少一个特征值及原始表征向量进行拼接,得到各点击序列项目和所述曝光项目的新表征向量;
将所述各点击序列项目和所述曝光项目的新表征向量组合在一起,并进行卷积深度学习获取卷积特征;
将所述项目的原始表征向量输入推荐模型的深度网络的输入层得到深度网络的处理结果;
将所述卷积特征与所述深度网络的处理结果拼接后输入所述推荐模型的输出层,得到所述曝光项目的点击机率;
根据所述点击机率确定是否推荐所述曝光项目。
2.根据权利要求1所述的智能推荐方法,其特征在于,所述将所述至少一个特征值及原始表征向量进行拼接,得到各点击序列项目和各曝光项目的新表征向量的步骤包括:
将所述至少一个特征值写入所述原始表征向量,构成新表征向量。
3.根据权利要求1所述的智能推荐方法,其特征在于,所述将所述点击序列项目和所述曝光项目的新表征向量组合在一起,并进行卷积深度学习获取卷积特征的步骤包括:
将各点击序列项目和各曝光项目的新表征向量组合在一起,构成卷积图像;
根据预设的卷积核对卷积图像进行卷积计算,获取卷积特征。
4.根据权利要求3所述的智能推荐方法,其特征在于,所述根据预设的卷积核对卷积图像进行卷积计算,获取卷积特征的步骤包括:
将由各点击序列项目和各曝光项目的新表征向量构成的二维向量写入卷积神经网络的输入层,以使卷积神经网络的进行卷积计算和处理,并输出所述卷积特征。
5.根据权利要求1所述的智能推荐方法,其特征在于,所述将所述项目的原始表征向量输入推荐模型的深度网络的输入层得到深度网络的处理结果的步骤包括:
将所述各点击序列项目与所述各曝光项目的原始表征向量一同输入所述深度网络计算得到降维表征向量作为所述深度网络处的理结果。
6.根据权利要求5所述的智能推荐方法,其特征在于,所述将所述卷积特征与所述深度网络的处理结果拼接后输入所述推荐模型的输出层,得到所述曝光项目的点击机率的步骤包括:
将所述降维表征向量与所述卷积特征进行拼接,构成组合表征向量;
将所述组合表征向量输入所述推荐模型的输出层,并利用sigmoid函数进行计算,得到所述曝光项目的点击机率。
7.根据权利要求1-6任意一项所述的智能推荐方法,其特征在于,所述获取项目的至少一个特征值和原始表征向量的步骤包括:
从网页日志中获取项目特征数据及用户数据;
从所述项目特征数据提取至少一个特征值;
将所述用户数据转换为原始表征向量。
8.一种推荐装置,其特征在于,包括:
特征值获取模块,用于获取项目的至少一个特征值,所述项目包括多个点击序列项目和待学习的曝光项目;
向量获取模块,用于获取所述项目的原始表征向量;
拼接模块,用于将所述至少一个特征值及原始表征向量进行拼接,得到各点击序列项目和所述曝光项目的新表征向量;
卷积特征获取模块,将所述各点击序列项目和所述曝光项目的新表征向量组合在一起,并进行卷积深度学习获取卷积特征;
深度网络处理结果获取模块,用于将所述项目的原始表征向量输入推荐模型的深度网络的输入层得到深度网络的处理结果;
点击率获取模块,将所述卷积特征与所述原始表征向量的深度网络的处理结果拼接后输入推荐模型的输出层,得到曝光项目的点击机率;
推荐模块,用于根据所述点击机率确定是否推荐所述曝光项目。
9.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述的智能推荐方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的智能推荐方法的步骤。
CN201910872210.2A 2019-09-16 2019-09-16 一种智能推荐方法、装置、计算机设备及存储介质 Active CN110837596B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910872210.2A CN110837596B (zh) 2019-09-16 2019-09-16 一种智能推荐方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910872210.2A CN110837596B (zh) 2019-09-16 2019-09-16 一种智能推荐方法、装置、计算机设备及存储介质

Publications (2)

Publication Number Publication Date
CN110837596A true CN110837596A (zh) 2020-02-25
CN110837596B CN110837596B (zh) 2023-02-03

Family

ID=69574704

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910872210.2A Active CN110837596B (zh) 2019-09-16 2019-09-16 一种智能推荐方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN110837596B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111967941A (zh) * 2020-08-20 2020-11-20 中国科学院深圳先进技术研究院 一种构建序列推荐模型的方法和序列推荐方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160217374A1 (en) * 2015-01-27 2016-07-28 Milq Inc. Method and system utilizing collaborative filtering
US20180121533A1 (en) * 2016-10-31 2018-05-03 Wal-Mart Stores, Inc. Systems, method, and non-transitory computer-readable storage media for multi-modal product classification
CN109241440A (zh) * 2018-09-29 2019-01-18 北京工业大学 一种基于深度学习的面向隐式反馈推荐方法
CN109299396A (zh) * 2018-11-28 2019-02-01 东北师范大学 融合注意力模型的卷积神经网络协同过滤推荐方法及***
CN109829116A (zh) * 2019-02-14 2019-05-31 北京达佳互联信息技术有限公司 一种内容推荐方法、装置、服务器及计算机可读存储介质
CN109902222A (zh) * 2018-11-30 2019-06-18 华为技术有限公司 一种推荐方法及装置
CN109960759A (zh) * 2019-03-22 2019-07-02 中山大学 基于深度神经网络的推荐***点击率预测方法
CN110008399A (zh) * 2019-01-30 2019-07-12 阿里巴巴集团控股有限公司 一种推荐模型的训练方法及装置、一种推荐方法及装置
US20190251446A1 (en) * 2018-02-15 2019-08-15 Adobe Inc. Generating visually-aware item recommendations using a personalized preference ranking network

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160217374A1 (en) * 2015-01-27 2016-07-28 Milq Inc. Method and system utilizing collaborative filtering
US20180121533A1 (en) * 2016-10-31 2018-05-03 Wal-Mart Stores, Inc. Systems, method, and non-transitory computer-readable storage media for multi-modal product classification
US20190251446A1 (en) * 2018-02-15 2019-08-15 Adobe Inc. Generating visually-aware item recommendations using a personalized preference ranking network
CN109241440A (zh) * 2018-09-29 2019-01-18 北京工业大学 一种基于深度学习的面向隐式反馈推荐方法
CN109299396A (zh) * 2018-11-28 2019-02-01 东北师范大学 融合注意力模型的卷积神经网络协同过滤推荐方法及***
CN109902222A (zh) * 2018-11-30 2019-06-18 华为技术有限公司 一种推荐方法及装置
CN110008399A (zh) * 2019-01-30 2019-07-12 阿里巴巴集团控股有限公司 一种推荐模型的训练方法及装置、一种推荐方法及装置
CN109829116A (zh) * 2019-02-14 2019-05-31 北京达佳互联信息技术有限公司 一种内容推荐方法、装置、服务器及计算机可读存储介质
CN109960759A (zh) * 2019-03-22 2019-07-02 中山大学 基于深度神经网络的推荐***点击率预测方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111967941A (zh) * 2020-08-20 2020-11-20 中国科学院深圳先进技术研究院 一种构建序列推荐模型的方法和序列推荐方法
CN111967941B (zh) * 2020-08-20 2024-01-05 中国科学院深圳先进技术研究院 一种构建序列推荐模型的方法和序列推荐方法

Also Published As

Publication number Publication date
CN110837596B (zh) 2023-02-03

Similar Documents

Publication Publication Date Title
CN110825957B (zh) 基于深度学习的信息推荐方法、装置、设备及存储介质
KR102122373B1 (ko) 사용자 포트레이트를 획득하는 방법 및 장치
CN107506402B (zh) 搜索结果的排序方法、装置、设备及计算机可读存储介质
CN110827112B (zh) 深度学习的商品推荐方法、装置、计算机设备及存储介质
CN110647696B (zh) 一种业务对象的排序方法及装置
CN112231569B (zh) 新闻推荐方法、装置、计算机设备及存储介质
CN110851699A (zh) 基于深度强化学习的信息流推荐方法、装置、设备及介质
CN113722438B (zh) 基于句向量模型的句向量生成方法、装置及计算机设备
CN110427453B (zh) 数据的相似度计算方法、装置、计算机设备及存储介质
CN109801101A (zh) 标签确定方法、装置、计算机设备和存储介质
CN116821475B (zh) 基于客户数据的视频推荐方法、装置及计算机设备
CN112417133A (zh) 排序模型的训练方法和装置
CN117217284A (zh) 一种数据处理方法及其装置
CN110837596B (zh) 一种智能推荐方法、装置、计算机设备及存储介质
CN110489563B (zh) 图结构的表示方法、装置、设备及计算机可读存储介质
CN114241411B (zh) 基于目标检测的计数模型处理方法、装置及计算机设备
CN113989618A (zh) 可回收物品分类识别方法
CN112307334A (zh) 信息推荐方法、信息推荐装置、存储介质与电子设备
CN114238583B (zh) 自然语言处理方法、装置、计算机设备及存储介质
CN116542779A (zh) 基于人工智能的产品推荐方法、装置、设备及存储介质
CN115186196A (zh) 一种内容推荐方法、装置、计算机设备及存储介质
CN118132875A (zh) 点击率预估方法和装置
CN113641900A (zh) 信息推荐方法及装置
CN117391812A (zh) 基于深度学习的推荐方法、装置、设备及介质
CN116756539A (zh) 项目推荐方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant