CN109493123A - 一种基于大数据的商品推荐方法及装置 - Google Patents
一种基于大数据的商品推荐方法及装置 Download PDFInfo
- Publication number
- CN109493123A CN109493123A CN201811233897.7A CN201811233897A CN109493123A CN 109493123 A CN109493123 A CN 109493123A CN 201811233897 A CN201811233897 A CN 201811233897A CN 109493123 A CN109493123 A CN 109493123A
- Authority
- CN
- China
- Prior art keywords
- commodity
- data
- user
- information
- big data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
Landscapes
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及大数据处理技术领域,具体涉及一种基于大数据的商品推荐方法及装置,通过收集已成交商品的商品数据和用户数据,形成特征样本,进而构建模型;通过获取新用户的行为记录数据,为新用户推荐排序后的商品数据,本发明能够对新用户提供较高准确度的商品推荐。
Description
技术领域
本发明涉及大数据处理技术领域,具体涉及一种基于大数据的商品推荐方法及装置。
背景技术
在家装领域,尤其是地板、瓷砖等用品,用户的复购率一般较低,难以通过用户的历史数据预测购买行为,而在销售过程中,如何准确把握用户的购买需求,进而推荐用户需要的商品是一个十分重要的环节。传统的推荐行为大多根据销售人员的行业经验来判断,而面对新用户时,不确定因素太多,导致推荐商品的准确度起伏较大。
基于大数据,通过对前期沉淀的消费者购买行为和商品信息形成比较稳定的购物模型,通过获取新用户的信息数据,形成用户画像,可以提供一种比较稳定的商品推荐方式,因此,如何利用大数据对新用户提供较高准确度的商品推荐成为值得解决的问题。
发明内容
本发明提供一种基于大数据的商品推荐方法及装置,能够对新用户提供较高准确度的商品推荐。
本发明提供的一种基于大数据的商品推荐方法,包括以下步骤:
步骤A、收集已成交商品的商品数据和用户数据,对所述用户数据进行预处理,形成包含商品数据和用户数据的特征样本;
步骤B、根据所述特征样本构建模型;
步骤C、获取新用户的行为记录数据;
步骤D、为新用户发送排序后的推荐商品数据。
进一步,所述步骤A中:
所述商品信息包括;商品的名称、型号、规格、价格;
所述用户数据包括:用户的个人基本信息、地理位置信息、浏览记录信息、消费记录信息、与所述浏览记录信息、消费记录信息对应的时间信息;
所述预处理包括:数据清洗、填充、归一化在内的操作。
进一步,所述步骤B具体包括:
步骤B1、设置使损失函数极小化的常数值,计算损失函数的负梯度在当前模型的值,作为残差值;
步骤B2、设置回归树的叶节点区域,拟合得出残差值;
步骤B3、利用线性搜索估计节点区域的值,使损失函数极小化;
步骤B4、更新回归树,得到输出的模型。
进一步,所述步骤C中新用户的行为记录数据具体包括:用户的个人基本信息、地理位置信息、浏览记录信息、与所述浏览记录信息对应的时间信息。
进一步,所述步骤D具体包括:
步骤D1、将所述新用户的行为记录数据与所述模型进行关联度匹配,按关联度排序;其中,对地理位置信息、浏览记录信息、与所述浏览记录信息对应的时间信息、用户的个人基本信息按由大到小的顺序赋予不同权重;
步骤D2、根据匹配的结果获取待推荐的商品信息;
步骤D3、将所述待推荐商品按照商品被购买的概率由大到小排列进行排序,生成推荐商品集合;
步骤D4、将所述推荐商品集合的商品数据发送给所述新用户。
进一步,所述步骤D3中商品被购买的概率由如下公式计算获得:
d表示用户购买商品的概率,u表示新用户,in(i)表示指向商品i的商品集合,out(j)表示商品j指向的商品集合,PR(j)表示商品j的被购买概率,PR(i)即为商品i的被购买概率。
进一步,所述商品集合根据大于支持度阈值的商品组成,所述支持度表示商品同时被购买的概率,由如下公式计算获得:
Freq(A∩B)表示商品A和商品B同时被购买的次数,N表示总销售笔数,Support(A∩B)为商品A和商品B同时被购买的概率,即为商品A和商品B的支持度。
本发明提供的一种基于大数据的商品推荐装置,包括计算机可读介质,所述介质存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现上述任一项所述的方法。
本发明的有益效果是:本发明公开一种基于大数据的商品推荐方法及装置,通过收集已成交商品的商品数据和用户数据,形成特征样本,进而构建模型;通过获取新用户的行为记录数据,为新用户推荐个性化的商品,并对所述商品进行排序,本发明能够对新用户提供较高准确度的商品推荐。
附图说明
下面结合附图和实例对本发明作进一步说明。
图1是本发明实施例一种基于大数据的商品推荐方法的流程图;
图2是本发明实施例一种基于大数据的商品推荐方法步骤B的流程图;
图3是本发明实施例一种基于大数据的商品推荐方法步骤D的流程图。
具体实施方式
参考图1~3,本发明实施例提供的一种基于大数据的商品推荐方法,其特征在于,包括以下步骤:
步骤A、收集已成交商品的商品数据和用户数据,对所述用户数据进行预处理,形成包含商品数据和用户数据的特征样本;
步骤B、根据所述特征样本构建模型;
步骤C、获取新用户的行为记录数据;
步骤D、为新用户发送排序后的推荐商品数据。
进一步,所述步骤A中:
所述商品信息包括;商品的名称、型号、规格、价格;
所述用户数据包括:用户的个人基本信息、地理位置信息、浏览记录信息、消费记录信息、与所述浏览记录信息、消费记录信息对应的时间信息,所述个人基本信息包括姓名、性别、年龄、电话。
所述预处理包括:数据清洗、填充、归一化在内的操作,所述数据清洗包括清除异常数据和无用数据。
进一步,所述步骤B具体包括:
步骤B1、设置使损失函数极小化的常数值,计算损失函数的负梯度在当前模型的值,作为残差值;
步骤B2、设置回归树的叶节点区域,拟合得出残差值;
步骤B3、利用线性搜索估计节点区域的值,使损失函数极小化;
步骤B4、更新回归树,得到输出的模型。
让损失函数沿着梯度方向的下降,利用损失函数的负梯度在当前模型的值作为回归问题提升树算法中的残差的近似值去拟合一个回归树,每轮迭代的时候,都去拟合损失函数在当前模型下的负梯度。
通过多轮迭代,每轮迭代产生一个弱分类器,每个分类器在上一轮分类器的残差基础上进行训练,对弱分类器的要求一般是足够简单,并且是低方差和高偏差的,因为训练的过程是通过降低偏差来不断提高最终分类器的精度。
进一步,所述步骤C中新用户的行为记录数据具体包括:用户的个人基本信息、地理位置信息、浏览记录信息、与所述浏览记录信息对应的时间信息。
进一步,所述步骤D具体包括:
步骤D1、将所述新用户的行为记录数据与所述模型进行关联度匹配,按关联度排序;其中,对地理位置信息、浏览记录信息、与所述浏览记录信息对应的时间信息、用户的个人基本信息按由大到小的顺序赋予不同权重;
步骤D2、根据匹配的结果获取待推荐的商品信息;
步骤D3、将所述待推荐商品按照商品被购买的概率由大到小排列进行排序,生成推荐商品集合;
步骤D4、将所述推荐商品集合的商品数据发送给所述新用户。
进一步,所述步骤D3中商品被购买的概率由如下公式计算获得:
d表示用户购买商品的概率,u表示新用户,in(i)表示指向商品i的商品集合,out(j)表示商品j指向的商品集合,PR(j)表示商品j的被购买概率,PR(i)即为商品i的被购买概率。
进一步,所述商品集合根据大于支持度阈值的商品组成,所述支持度表示商品同时被购买的概率,由如下公式计算获得:
Freq(A∩B)表示商品A和商品B同时被购买的次数,N表示总销售笔数,Support(A∩B)为商品A和商品B同时被购买的概率,即为商品A和商品B的支持度。
本发明实施例提供的一种基于大数据的商品推荐装置,包括计算机可读介质,所述介质存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现上述任一项所述的方法。
以上所述,只是本发明的较佳实施例而已,本发明并不局限于上述实施方式,只要其以相同的手段达到本发明的技术效果,都应属于本发明的保护范围。
Claims (9)
1.一种基于大数据的商品推荐方法,其特征在于,包括以下步骤:
步骤A、收集已成交商品的商品数据和用户数据,对所述用户数据进行预处理,形成包含商品数据和用户数据的特征样本;
步骤B、根据所述特征样本构建模型;
步骤C、获取新用户的行为记录数据;
步骤D、为新用户发送排序后的推荐商品数据。
2.根据权利要求1所述的一种基于大数据的商品推荐方法,其特征在于,所述步骤A中:
所述商品数据包括;商品的名称、型号、规格、价格;
所述用户数据包括:用户的个人基本信息、地理位置信息、浏览记录信息、消费记录信息、与所述浏览记录信息、消费记录信息对应的时间信息;
所述预处理包括:数据清洗、填充、归一化在内的操作。
3.根据权利要求1所述的一种基于大数据的商品推荐方法,其特征在于,所述步骤B具体包括:
步骤B1、设置使损失函数极小化的常数值,计算损失函数的负梯度在当前模型的值,作为残差值;
步骤B2、设置回归树的叶节点区域,拟合得出残差值;
步骤B3、利用线性搜索估计节点区域的值,使损失函数极小化;
步骤B4、更新回归树,得到输出的模型。
4.根据权利要求1所述的一种基于大数据的商品推荐方法,其特征在于,所述步骤C中新用户的行为记录数据具体包括:用户的个人基本信息、地理位置信息、浏览记录信息、与所述浏览记录信息对应的时间信息。
5.根据权利要求1所述的一种基于大数据的商品推荐方法,其特征在于,所述步骤D具体包括:
步骤D1、将所述新用户的行为记录数据与所述模型进行关联度匹配,按关联度排序;
步骤D2、根据匹配的结果获取待推荐的商品数据;
步骤D3、将所述待推荐商品按照商品被购买的概率由大到小排列进行排序,生成推荐商品集合;
步骤D4、将所述推荐商品集合的商品数据发送给所述新用户。
6.根据权利要求5所述的一种基于大数据的商品推荐方法,其特征在于,所述步骤D1还包括:
对所述新用户的行为记录数据的地理位置信息、浏览记录信息、与所述浏览记录信息对应的时间信息、用户的个人基本信息按由大到小的顺序赋予不同权重。
7.根据权利要求5所述的一种基于大数据的商品推荐方法,其特征在于,所述步骤D3中商品被购买的概率由如下公式计算获得:
d表示用户购买商品的概率,u表示新用户,in(i)表示指向商品i的商品集合,out(j)表示商品j指向的商品集合,PR(j)表示商品j的被购买概率,PR(i)即为商品i的被购买概率。
8.根据权利要求7所述的一种基于大数据的商品推荐方法,其特征在于,所述商品集合根据大于支持度阈值的商品组成,所述支持度表示商品同时被购买的概率,由如下公式计算获得:
Freq(A∩B)表示商品A和商品B同时被购买的次数,N表示总销售笔数,Support(A∩B)为商品A和商品B同时被购买的概率,即为商品A和商品B的支持度。
9.一种基于大数据的商品推荐装置,其特征在于,包括计算机可读介质,所述介质存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现如权利要求1~8中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811233897.7A CN109493123A (zh) | 2018-10-23 | 2018-10-23 | 一种基于大数据的商品推荐方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811233897.7A CN109493123A (zh) | 2018-10-23 | 2018-10-23 | 一种基于大数据的商品推荐方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109493123A true CN109493123A (zh) | 2019-03-19 |
Family
ID=65692373
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811233897.7A Pending CN109493123A (zh) | 2018-10-23 | 2018-10-23 | 一种基于大数据的商品推荐方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109493123A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111639274A (zh) * | 2020-06-01 | 2020-09-08 | 重庆锐云科技有限公司 | 线上商品智能排序方法、装置、计算机设备和存储介质 |
CN111899055A (zh) * | 2020-07-29 | 2020-11-06 | 亿达信息技术有限公司 | 大数据金融场景下的基于机器学习和深度学习的保险客户复购预测方法 |
CN112446764A (zh) * | 2020-11-30 | 2021-03-05 | 广州三七互娱科技有限公司 | 游戏商品推荐方法、装置及电子设备 |
CN113744019A (zh) * | 2021-01-12 | 2021-12-03 | 北京沃东天骏信息技术有限公司 | 一种商品推荐方法、装置、设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103020276A (zh) * | 2012-12-27 | 2013-04-03 | 新浪网技术(中国)有限公司 | 一种社交对象搜索方法及装置 |
CN106485562A (zh) * | 2015-09-01 | 2017-03-08 | 苏宁云商集团股份有限公司 | 一种基于用户历史行为的商品信息推荐方法及*** |
CN108628990A (zh) * | 2018-04-28 | 2018-10-09 | 京东方科技集团股份有限公司 | 推荐方法、计算机装置及可读存储介质 |
-
2018
- 2018-10-23 CN CN201811233897.7A patent/CN109493123A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103020276A (zh) * | 2012-12-27 | 2013-04-03 | 新浪网技术(中国)有限公司 | 一种社交对象搜索方法及装置 |
CN106485562A (zh) * | 2015-09-01 | 2017-03-08 | 苏宁云商集团股份有限公司 | 一种基于用户历史行为的商品信息推荐方法及*** |
CN108628990A (zh) * | 2018-04-28 | 2018-10-09 | 京东方科技集团股份有限公司 | 推荐方法、计算机装置及可读存储介质 |
Non-Patent Citations (1)
Title |
---|
王聪: "" 基于商品排序和用户偏好的个性化推荐模型及应用"", 《中国优秀硕士学位论文全文数据库(电子期刊)》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111639274A (zh) * | 2020-06-01 | 2020-09-08 | 重庆锐云科技有限公司 | 线上商品智能排序方法、装置、计算机设备和存储介质 |
CN111639274B (zh) * | 2020-06-01 | 2023-05-09 | 重庆锐云科技有限公司 | 线上商品智能排序方法、装置、计算机设备和存储介质 |
CN111899055A (zh) * | 2020-07-29 | 2020-11-06 | 亿达信息技术有限公司 | 大数据金融场景下的基于机器学习和深度学习的保险客户复购预测方法 |
CN112446764A (zh) * | 2020-11-30 | 2021-03-05 | 广州三七互娱科技有限公司 | 游戏商品推荐方法、装置及电子设备 |
CN113744019A (zh) * | 2021-01-12 | 2021-12-03 | 北京沃东天骏信息技术有限公司 | 一种商品推荐方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109493123A (zh) | 一种基于大数据的商品推荐方法及装置 | |
CN102902691B (zh) | 推荐方法及*** | |
CN109636545A (zh) | 一种电商平台商品推荐算法 | |
WO2019148817A1 (zh) | 电商商品推荐方法和电商平台服务器 | |
CN105701191B (zh) | 一种推送信息点击率估计方法和装置 | |
US11301905B2 (en) | Heuristic clustering | |
CN110489642B (zh) | 基于行为特征分析的商品推荐方法、***、设备及介质 | |
US20220383390A1 (en) | Determining brand affinity of users | |
CN108334592B (zh) | 一种基于内容与协同过滤相结合的个性化推荐方法 | |
CN107862566A (zh) | 一种商品推荐方法和*** | |
CN107329994A (zh) | 一种基于用户特征的改进协同过滤推荐方法 | |
JP2015528170A (ja) | 祭日用売れ筋商品を決定するための方法及びデバイス | |
CN110727859B (zh) | 一种推荐信息推送方法及其装置 | |
CN108109058B (zh) | 一种融合人格特质和物品标签的单分类协同过滤方法 | |
CN108664564A (zh) | 一种基于物品内容特征的改进协同过滤推荐方法 | |
CN115496566B (zh) | 基于大数据的地区特产推荐方法及*** | |
US20180150756A1 (en) | Method for enhancing association rules, apparatus using the same and computer readable medium therefor | |
CN118037406B (zh) | 一种用户积分数据兑换智能匹配推荐*** | |
JP6840446B2 (ja) | データ処理装置及びデータ処理方法 | |
US20210287275A1 (en) | Value based commodity selection | |
CN107239456B (zh) | 年龄段识别方法及装置 | |
CN109658195B (zh) | 一种商品展示决策方法 | |
CN116757777A (zh) | 一种用于电子商务信息直接发布与信息推广的***和方法 | |
CN108416611B (zh) | 一种超市路径推荐***及其方法 | |
CN109508421A (zh) | 一种基于词向量的文献推荐方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190319 |