CN110533515A - 一种高吞吐低延迟的电商个性化推荐方法及装置 - Google Patents

一种高吞吐低延迟的电商个性化推荐方法及装置 Download PDF

Info

Publication number
CN110533515A
CN110533515A CN201910829746.6A CN201910829746A CN110533515A CN 110533515 A CN110533515 A CN 110533515A CN 201910829746 A CN201910829746 A CN 201910829746A CN 110533515 A CN110533515 A CN 110533515A
Authority
CN
China
Prior art keywords
user
feature
commodity
line
handling
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201910829746.6A
Other languages
English (en)
Inventor
张发恩
吴腾虎
周鹏程
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Innovation Qizhi Technology Co Ltd
Original Assignee
Shenzhen Innovation Qizhi Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Innovation Qizhi Technology Co Ltd filed Critical Shenzhen Innovation Qizhi Technology Co Ltd
Priority to CN201910829746.6A priority Critical patent/CN110533515A/zh
Publication of CN110533515A publication Critical patent/CN110533515A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种高吞吐低延迟的电商个性化推荐方法及装置,方法包括:线下离线计算出用户的特征或特征向量与商品的匹配程度,并存储在数据库中;线上获取用户画像特征;根据用户画像特征从数据库中获取匹配的商品数据集,得到若干个商品候选集结果;依据合并策略合并上述若干个商品候选集结果,得到推荐结果;装置包括线上部分和线下部分。本发明方法基本无计算的部分,有效降低了模型计算带来的延迟,解决了高吞吐量复杂模型的高延迟问题,利于电商的个性化推荐和发展。

Description

一种高吞吐低延迟的电商个性化推荐方法及装置
技术领域
本专利申请属于电商购物技术领域,更具体地说,是涉及一种高吞吐低延迟的电商个性化推荐方法及装置。
背景技术
现有的大数据下的电商用户个性化推荐流程大致如下:获取用户画像特征;根据用户画像和对应的个性化推荐模型,从海量商品中获取与所述用户画像特征匹配的商品数据集进行推荐。此种过程在大量用户同时访问的高并发场景下,使用复杂模型进行在线计算具有非常高的延时,带来用户体验的下降,不利于用户粘度的维系。
发明内容
本发明需要解决的技术问题是提供一种高吞吐低延迟的电商个性化推荐方法及装置,可以有效提升***的吞吐量,并降低时延。
为了解决上述问题,本发明所采用的技术方案是:
一种高吞吐低延迟的电商个性化推荐方法,步骤为:
步骤1、线下离线计算出用户的特征或特征向量与商品的匹配程度,并存储在数据库中;
步骤2、线上获取用户画像特征;
步骤3、根据用户画像特征从数据库中获取匹配的商品数据集,得到若干个商品候选集结果;
步骤4、依据合并策略合并上述若干个商品候选集结果,得到推荐结果。
本发明技术方案的进一步改进在于:步骤1中线下离线计算过程为:
将用户的特征或特征向量全部抽象为数值a或b,a或b分别对应于用户是否匹配该特征或特征向量对应的商品集,对于a或b的取值通过下述方法实现:
(1)统计法,计算用户对某特征下商品购买的频率,通过设定的频率阀值进行判断,超过或等于设定的频率阀值,则判定为a,否则为b;比如一个用户经常购买美妆特征下的商品,则该用户对于美妆的特征为a。或者
(2)协同过滤法,计算各个特征之间的关联度,通过设定的关联度阀值来确定特征之间是否有关联,如果一个用户经确认其某一特征为a,则与该特征有关联的其他特征也为a;比如经常浏览/购买美妆商品的用户,也经常购买首饰特征的商品,那么如果一个用户多次购买美妆商品,那么该用户的首饰特征也为1;或者
(3)机器学习建模法,对用户特征、商品特征、环境特征进行联合建模,预测用户购买某特征下商品的概率,如果概率计算值大于设定的预测阀值,则对该特征取a,否则为b。
本发明技术方案的进一步改进在于:步骤1中按匹配程度从高到低的顺序将匹配程度存储在数据库中。
本发明技术方案的进一步改进在于:步骤1中,数值a和b分别取值为1和0,其中0表示不匹配,1表示匹配。
本发明技术方案的进一步改进在于:机器学习建模法采用基于CTR预估的模型,包括FM、FFM、GBDT+LR、Wide&Deep或DeepFM算法。这些算法的思路是将用户特征、商品特征和环境特征拼接成特征向量(X),从历史数据中获得每个样本的标签y(转化或非转化)。然后利用监督式模型去学习X和y之间的联系。
本发明技术方案的进一步改进在于:步骤4中,合并策略包括特征更新时间策略或指标反馈类型策略。特征更新时间策略指的是按照特征更新的时间来排召回商品集的展示顺序,比如A策略更新时间比B策略的更接近当前时间,则A策略的实时性比B策略高。指标反馈类型策略是按照推荐结果分析指标来排召回商品集的展示顺序,具体的指标可以包括:转化率,点击率,营收额度等。
一种高吞吐低延迟的电商个性化推荐装置,包括线上部分和线下部分,线上部分包括与用户日志连接的数据构造模块、与数据构造模块连接的用户画像特征向量数据库和模型训练预测模块、与模型训练预测模块连接的特征推荐结果数据库和产品推荐结果数据库,用户画像特征向量数据库和模型训练预测模块之间也连接;
线下部分包括与用户请求和用户画像特征向量数据库均连接的用户画像特征拼接模块、与用户画像特征拼接模块和特征推荐结果数据库以及产品推荐结果数据库均连接的数据库查询合并模块,数据库查询合并模块连接最终推荐结果。
本发明技术方案的进一步改进在于:在模型训练预测模块、用户画像特征拼接模块、数据库查询合并模块中,模型训练预测模块:采用深度学习和矩阵分解算法,将稀疏的用户行为特征和商品的特征向量映射成致密的低维空间向量,该低维空间向量可以用来作为用户和商品的特征表征,同时亦可以作乘积来获取关联的程度;
用户画像特征拼接模块:线上支持高效拼接用户特征信息、商品特征信息、环境特征信息来作为样本预测的特征输入;
数据库查询合并模块:离线计算用户-商品或商品-商品的关联分数并存储成用户对应的商品列表或商品对应的用户列表,避免线上计算关联耗费大量的时间。
由于采用了上述技术方案,本发明取得的有益效果是:涉及的线下部分离线即可计算好对应特征或特征向量与商品的匹配程度,并按匹配度从高到低的顺序存储在数据库中,线上流程优化为:
1)获取用户画像特征;
2)根据用户画像特征从数据库中获取匹配的商品数据集;
3)依据一定的策略合并上述多个商品候选集的结果。
经过上述优化后,有效降低了模型计算带来的延迟(基本无计算的部分),解决了高吞吐量复杂模型的高延迟问题,利于电商的个性化推荐和发展,具有较高的推广应用价值。
附图说明
图1为本发明方法的流程示意图;
图2为本发明装置的结构框图。
具体实施方式
下面结合实施例对本发明做进一步详细说明。
本发明公开了一种高吞吐低延迟的电商个性化推荐方法,步骤为:
步骤1、线下离线计算出用户的特征或特征向量与商品的匹配程度,并存储在数据库中;
步骤2、线上获取用户画像特征;
步骤3、根据用户画像特征从数据库中获取匹配的商品数据集,得到若干个商品候选集结果;
步骤4、依据合并策略合并上述若干个商品候选集结果,得到推荐结果。
步骤1中线下离线计算过程为:
将用户的特征或特征向量全部抽象为数值a或b,a或b分别对应于用户是否匹配该特征或特征向量对应的商品集,对于a或b的取值通过下述方法实现:
(1)统计法,计算用户对某特征下商品购买的频率,通过设定的频率阀值进行判断,超过或等于设定的频率阀值,则判定为a,否则为b。比如一个用户经常购买美妆特征下的商品,则该用户对于美妆的特征为a。或者
(2)协同过滤法,计算各个特征之间的关联度,通过设定的关联度阀值来确定特征之间是否有关联,如果一个用户经确认其某一特征为a,则与该特征有关联的其他特征也为a;比如经常浏览/购买美妆商品的用户,也经常购买首饰特征的商品,那么如果一个用户多次购买美妆商品,那么该用户的首饰特征也为1,特征之间关联度的确定通过统计实现。或者
(3)机器学习建模法,对用户特征、商品特征、环境特征进行联合建模,预测用户购买某特征下商品的概率,如果概率计算值大于设定的预测阀值,则对该特征取a,否则为b。
步骤1中按匹配程度从高到低的顺序将匹配程度存储在数据库中。
步骤1中,数值a和b分别取值为1和0,其中0表示不匹配,1表示匹配。
机器学习建模法采用基于CTR预估的模型,包括FM、FFM、GBDT+LR、Wide&Deep或DeepFM算法。这些算法的思路是将用户特征、商品特征和环境特征拼接成特征向量(X),从历史数据中获得每个样本的标签y(转化或非转化)。然后利用监督式模型去学习X和y之间的联系。
步骤4中,合并策略包括特征更新时间策略或指标反馈类型策略。所谓特征更新时间策略指的是按照特征更新的时间来排召回商品集的展示顺序,比如A策略更新时间比B策略的更接近当前时间,则A策略的实时性比B策略高。所谓指标反馈类型策略是按照推荐结果分析指标来排召回商品集的展示顺序,具体的指标可以包括:转化率,点击率,营收额度等。
一种高吞吐低延迟的电商个性化推荐装置,包括线上部分和线下部分,线上部分包括与用户日志连接的数据构造模块、与数据构造模块连接的用户画像特征向量数据库和模型训练预测模块、与模型训练预测模块连接的特征推荐结果数据库和产品推荐结果数据库,用户画像特征向量数据库和模型训练预测模块之间也连接;
线下部分包括与用户请求和用户画像特征向量数据库均连接的用户画像特征拼接模块、与用户画像特征拼接模块和特征推荐结果数据库以及产品推荐结果数据库均连接的数据库查询合并模块,数据库查询合并模块连接最终推荐结果。
在模型训练预测模块、用户画像特征拼接模块、数据库查询合并模块中,模型训练预测模块:采用深度学习和矩阵分解算法,将稀疏的用户行为特征和商品的特征向量映射成致密的低维空间向量,该低维空间向量可以用来作为用户和商品的特征表征,同时亦可以作乘积来获取关联的程度;
用户画像特征拼接模块:线上支持高效拼接用户特征信息、商品特征信息、环境特征信息来作为样本预测的特征输入;
数据库查询合并模块:离线计算用户-商品或商品-商品的关联分数并存储成用户对应的商品列表或商品对应的用户列表,避免线上计算关联耗费大量的时间。
如图1所示,将用户画像特征构建为0-1形式并依次进行建模预测,推荐结果以{feature_index_1:products}形式存于数据库中,分别形成特征推荐结果数据库和产品推荐结果数据库;
新来的用户请求从用户画像特征向量数据中获取用户/商品特征向量描述并从特征推荐结果数据库和产品推荐结果数据库中获取推荐结果,经过合并策略(如特征更新时间策略或指标反馈类型策略等)进行合并得到最终的推荐结果以显示。

Claims (8)

1.一种高吞吐低延迟的电商个性化推荐方法,其特征在于步骤为:
步骤1、线下离线计算出用户的特征或特征向量与商品的匹配程度,并存储在数据库中;
步骤2、线上获取用户画像特征;
步骤3、根据用户画像特征从数据库中获取匹配的商品数据集,得到若干个商品候选集结果;
步骤4、依据合并策略合并上述若干个商品候选集结果,得到推荐结果。
2.根据权利要求1所述的一种高吞吐低延迟的电商个性化推荐方法,其特征在于:步骤1中线下离线计算过程为:
将用户的特征或特征向量全部抽象为数值a或b,a或b分别对应于用户是否匹配该特征或特征向量对应的商品集,对于a或b的取值通过下述方法实现:
(1)统计法,计算用户对某特征下商品购买的频率,通过设定的频率阀值进行判断,超过或等于设定的频率阀值,则判定为a,否则为b;或者
(2)协同过滤法,计算各个特征之间的关联度,通过设定的关联度阀值来确定特征之间是否有关联,如果一个用户经确认其某一特征为a,则与该特征有关联的其他特征也为a;或者
(3)机器学习建模法,对用户特征、商品特征、环境特征进行联合建模,预测用户购买某特征下商品的概率,如果概率计算值大于设定的预测阀值,则对该特征取a,否则为b。
3.根据权利要求2所述的一种高吞吐低延迟的电商个性化推荐方法,其特征在于:步骤1中按匹配程度从高到低的顺序将匹配程度存储在数据库中。
4.根据权利要求3所述的一种高吞吐低延迟的电商个性化推荐方法,其特征在于:步骤1中,数值a和b分别取值为1和0,其中0表示不匹配,1表示匹配。
5.根据权利要求4所述的一种高吞吐低延迟的电商个性化推荐方法,其特征在于:机器学习建模法采用基于CTR预估的模型,包括FM、FFM、GBDT+LR、Wide&Deep或DeepFM算法。
6.根据权利要求5所述的一种高吞吐低延迟的电商个性化推荐方法,其特征在于:步骤4中,合并策略包括特征更新时间策略或指标反馈类型策略。
7.一种高吞吐低延迟的电商个性化推荐装置,其特征在于:包括线上部分和线下部分,线上部分包括与用户日志连接的数据构造模块、与数据构造模块连接的用户画像特征向量数据库和模型训练预测模块、与模型训练预测模块连接的特征推荐结果数据库和产品推荐结果数据库,用户画像特征向量数据库和模型训练预测模块之间也连接;
线下部分包括与用户请求和用户画像特征向量数据库均连接的用户画像特征拼接模块、与用户画像特征拼接模块和特征推荐结果数据库以及产品推荐结果数据库均连接的数据库查询合并模块,数据库查询合并模块连接最终推荐结果。
8.根据权利要求7所述的一种高吞吐低延迟的电商个性化推荐装置,其特征在于:在模型训练预测模块、用户画像特征拼接模块、数据库查询合并模块中,模型训练预测模块:采用深度学习和矩阵分解算法,将稀疏的用户行为特征和商品的特征向量映射成致密的低维空间向量,该低维空间向量可以用来作为用户和商品的特征表征,同时亦可以作乘积来获取关联的程度;
用户画像特征拼接模块:线上支持高效拼接用户特征信息、商品特征信息、环境特征信息来作为样本预测的特征输入;
数据库查询合并模块:离线计算用户-商品或商品-商品的关联分数并存储成用户对应的商品列表或商品对应的用户列表,避免线上计算关联耗费大量的时间。
CN201910829746.6A 2019-09-04 2019-09-04 一种高吞吐低延迟的电商个性化推荐方法及装置 Withdrawn CN110533515A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910829746.6A CN110533515A (zh) 2019-09-04 2019-09-04 一种高吞吐低延迟的电商个性化推荐方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910829746.6A CN110533515A (zh) 2019-09-04 2019-09-04 一种高吞吐低延迟的电商个性化推荐方法及装置

Publications (1)

Publication Number Publication Date
CN110533515A true CN110533515A (zh) 2019-12-03

Family

ID=68666695

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910829746.6A Withdrawn CN110533515A (zh) 2019-09-04 2019-09-04 一种高吞吐低延迟的电商个性化推荐方法及装置

Country Status (1)

Country Link
CN (1) CN110533515A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111080413A (zh) * 2019-12-20 2020-04-28 深圳市华宇讯科技有限公司 电商平台商品的推荐方法、装置、服务器和存储介质
CN111191133A (zh) * 2019-12-31 2020-05-22 口口相传(北京)网络技术有限公司 业务搜索处理方法、装置及设备
WO2023078226A1 (zh) * 2021-11-04 2023-05-11 中兴通讯股份有限公司 推荐方法、装置、服务器和计算机可读存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106296242A (zh) * 2015-05-22 2017-01-04 苏宁云商集团股份有限公司 一种用于电子商务中商品推荐列表的生成方法及生成***
US20170236183A1 (en) * 2016-02-11 2017-08-17 Ebay Inc. System and method for detecting visually similar items
CN107424043A (zh) * 2017-06-15 2017-12-01 北京三快在线科技有限公司 一种产品推荐方法及装置,电子设备
CN107423442A (zh) * 2017-08-07 2017-12-01 火烈鸟网络(广州)股份有限公司 基于用户画像行为分析的应用推荐方法及***,储存介质及计算机设备
CN108021929A (zh) * 2017-11-16 2018-05-11 华南理工大学 基于大数据的移动端电商用户画像建立与分析方法及***
CN108960945A (zh) * 2017-05-18 2018-12-07 北京京东尚科信息技术有限公司 商品推荐方法和装置
CN109062994A (zh) * 2018-07-04 2018-12-21 平安科技(深圳)有限公司 推荐方法、装置、计算机设备和存储介质
CN109189904A (zh) * 2018-08-10 2019-01-11 上海中彦信息科技股份有限公司 个性化搜索方法及***
CN110110237A (zh) * 2017-12-19 2019-08-09 福建天泉教育科技有限公司 用户兴趣信息推荐方法、存储介质

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106296242A (zh) * 2015-05-22 2017-01-04 苏宁云商集团股份有限公司 一种用于电子商务中商品推荐列表的生成方法及生成***
US20170236183A1 (en) * 2016-02-11 2017-08-17 Ebay Inc. System and method for detecting visually similar items
CN108960945A (zh) * 2017-05-18 2018-12-07 北京京东尚科信息技术有限公司 商品推荐方法和装置
CN107424043A (zh) * 2017-06-15 2017-12-01 北京三快在线科技有限公司 一种产品推荐方法及装置,电子设备
CN107423442A (zh) * 2017-08-07 2017-12-01 火烈鸟网络(广州)股份有限公司 基于用户画像行为分析的应用推荐方法及***,储存介质及计算机设备
CN108021929A (zh) * 2017-11-16 2018-05-11 华南理工大学 基于大数据的移动端电商用户画像建立与分析方法及***
CN110110237A (zh) * 2017-12-19 2019-08-09 福建天泉教育科技有限公司 用户兴趣信息推荐方法、存储介质
CN109062994A (zh) * 2018-07-04 2018-12-21 平安科技(深圳)有限公司 推荐方法、装置、计算机设备和存储介质
CN109189904A (zh) * 2018-08-10 2019-01-11 上海中彦信息科技股份有限公司 个性化搜索方法及***

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111080413A (zh) * 2019-12-20 2020-04-28 深圳市华宇讯科技有限公司 电商平台商品的推荐方法、装置、服务器和存储介质
CN111191133A (zh) * 2019-12-31 2020-05-22 口口相传(北京)网络技术有限公司 业务搜索处理方法、装置及设备
CN111191133B (zh) * 2019-12-31 2023-12-01 口口相传(北京)网络技术有限公司 业务搜索处理方法、装置及设备
WO2023078226A1 (zh) * 2021-11-04 2023-05-11 中兴通讯股份有限公司 推荐方法、装置、服务器和计算机可读存储介质

Similar Documents

Publication Publication Date Title
CN110533515A (zh) 一种高吞吐低延迟的电商个性化推荐方法及装置
CN110222272A (zh) 一种潜在客户挖掘与推荐方法
CN104699711B (zh) 一种推荐方法及服务器
CN108022152A (zh) 基于图像识别的用户商品自动推荐***及推荐方法
CN110059271A (zh) 运用标签知识网络的搜索方法及装置
CN107239993A (zh) 一种基于拓展标签的矩阵分解推荐方法及***
CN110851699A (zh) 基于深度强化学习的信息流推荐方法、装置、设备及介质
EP4242955A1 (en) User profile-based object recommendation method and device
CN111949887A (zh) 物品推荐方法、装置及计算机可读存储介质
CN112650929B (zh) 一种融入评论信息的图神经网络推荐方法
CN109145193A (zh) 一种信息推送方法及***
CN108595493A (zh) 媒体内容的推送方法和装置、存储介质、电子装置
CN107944911A (zh) 一种基于文本分析的推荐***的推荐方法
CN107330727A (zh) 一种基于隐语义模型的个性化推荐方法
CN112801425B (zh) 信息点击率的确定方法、装置、计算机设备和存储介质
CN113643103A (zh) 基于用户相似度的产品推荐方法、装置、设备及存储介质
CN110110226A (zh) 一种推荐算法、推荐***及终端设备
CN106294676B (zh) 一种电子商务政务***的数据检索方法
CN110570279A (zh) 一种基于用户实时行为的策略化推荐方法及装置
CN112084307A (zh) 一种数据处理方法、装置、服务器及计算机可读存储介质
CN113420212A (zh) 基于深度特征学习的推荐方法、装置、设备及存储介质
CN114298783A (zh) 基于矩阵分解融合用户社交信息的商品推荐方法及***
CN114090880A (zh) 用于商品推荐的方法及装置、电子设备、存储介质
CN109146606A (zh) 一种品牌推荐方法、电子设备、存储介质及***
CN108876422A (zh) 用于信息推广的方法、装置、电子设备及计算机可读介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20191203