CN105844302A - 基于深度学习的自动计算商品潮流指数的方法 - Google Patents

基于深度学习的自动计算商品潮流指数的方法 Download PDF

Info

Publication number
CN105844302A
CN105844302A CN201610211098.4A CN201610211098A CN105844302A CN 105844302 A CN105844302 A CN 105844302A CN 201610211098 A CN201610211098 A CN 201610211098A CN 105844302 A CN105844302 A CN 105844302A
Authority
CN
China
Prior art keywords
commodity
value
class
vector
calculate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610211098.4A
Other languages
English (en)
Inventor
牟川
王海强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Xinyili Culture Communication Co ltd
Original Assignee
Nanjing Xinyili Culture Communication Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Xinyili Culture Communication Co ltd filed Critical Nanjing Xinyili Culture Communication Co ltd
Priority to CN201610211098.4A priority Critical patent/CN105844302A/zh
Publication of CN105844302A publication Critical patent/CN105844302A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes
    • G06F18/24137Distances to cluster centroïds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0623Item investigation

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Finance (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于深度学***均值,得出商品的类别指数;步骤4:计算商品到各类中心的距离和加权系数,将步骤2中得出的类别中心向量值和商品任意的特征值,通过公式,算出两者之间的欧式距离和权重向量值;步骤5:将步骤4得出的权重向量W,乘步骤3得出的各个类的潮流指数,即商品最终的潮流指数。

Description

基于深度学习的自动计算商品潮流指数的方法
技术领域
本发明涉及一种基于深度学习的自动计算商品潮流指数的方法,尤其是在电子商务领域,方便商品潮流智能识别***快速计算出潮流指数。
背景技术
现在互联网已经成为人们购物的主要途径,尤其是年轻人群更愿意选择网上购物,在网上购物的时候如何根据个人喜好快速找到最新的潮流商品,越来越多地成为年轻人最大的需求。目前,针对视觉感受到的商品图案风格,转化为具体量化潮流指数的技术凤毛麟角,只能通过人工置顶的方式查找,在购买体验上需要花费更多的时间和精力。
发明内容
为了解决上述技术问题,本发明提供了一种基于深度学习的自动计算商品潮流指数的方法,该方法包括如下步骤:
步骤1:对网络平台出售的所有潮流商品,采用CNN深度学习模型对商品图片进行特征提取,将原始的图片数据转化为代表图片内容的向量特征。
步骤2:将商品按照图片特征进行聚类,根据步骤1得出的商品图片特征向量,用K-means算法进行聚类,划分出N个不同的类别(N≧1),每个图片的特征向量都归属到具体的一个类别中,相同类别的所有向量取算术平均值,即得出该类别的中心向量。
步骤3:计算商品的类别指数;
步骤4:计算商品到各类中心的距离;
步骤5:统计加权,将步骤4得出权重向量W,乘以步骤3得出的各个类的潮流指数,即可得出商品最终的潮流指数。
进一步地,步骤3所述的计算商品类别指数,具体步骤有:对各类别进行历史销量统计:统计所有商品的平均点击量和平均销量,最大点击量定义为:Xmax,最小点击量定义为:Xmin,利用公式:(X-Xmin)/(Xmax-Xmin)*100将商品值转化为百分制,得出各类别商品的潮流指数。
进一步地,步骤4所述的计算商品类别指数,具体步骤有:计算商品到各个类中心的距离R,并把所有1/R的值归为和为1的值,该值即为加权系数;将步骤2中得出的类别中心向量值和商品任一的特征值,通过公式r= sqrt( ∑(yi-xi)^2 )算出两者之间的欧式距离,通过公式wi=1/ri/(∑1/ri)算出权重向量值。
由上述技术方案可以看出,与现有技术相比,本申请的优点在于:将商品图片里面具体的内容根据电商用户的操作历史,完全量化位潮流指数。考虑了商品本身的特征,以及用户的喜好,以及众多商品的归类,改变了过去潮流风格完全无法量化,无法指数化的历史。
附图说明
下面结合附图的具体实施例方式作进一步详细的描述。
图1为本发明基于深度学习的自动计算商品潮流指数的方法示意图;
图2是衬衫的1024维的图像语义特征;
图3是衬衫的特征向量。
具体实施方式
为了更充分理解本发明的技术内容,下面结合具体实施例对本发明的技术方案进一步介绍和说明,但不局限于此。
参见附图1,步骤1:采用CNN深度学习模型对商品图片进行特征提取,设定商品1:{x1,x2,...x1024},每个商品根据图片内容提取1024维的图像语义特征,以衬衫为例,如图2所示;
步骤2:将商品按照图2中的特征进行聚类,根据步骤1得出的商品图片特征向量
用K-means算法进行聚类,划分出N个不同的类别(N≧1),每个图片的特征向量都归属到具体的一个类别中,相同类别的所有向量取算术平均值,即得出该类别的中心向量。如图3所示:
Class1:{x1,x2,...x1024},Class2:{x1,x2,...x1024};
步骤3:对各类别进行历史销量统计:统计所有商品的平均点击量和平均销量,最大点击量定义为:Xmax,最小点击量定义为:Xmin,利用公式(X-Xmin)/(Xmax-Xmin)*100将商品值转化为百分制,得出各类别商品的潮流指数。
步骤4:计算商品到各类中心的距离:首先计算商品到各个类中心的距离R,
并把所有1/R的值归为和为1的值,该值即为加权系数;将步骤2中得出的类别中心向量值和商品任一的特征值,通过公式r= sqrt( ∑(yi-xi)^2 )算出两者之间的欧式距离,通过公式wi=1/ri/(∑1/ri)算出权重向量值。
如下表所示:对于新的商品或者未在公司售卖过的商品,提取其特征X={x1,x2,...x1024},计算X与各个类别的计算权重
步骤5:统计加权,将步骤4得出权重向量W,乘以步骤3得出的各个类的潮流指数,即可得出商品最终的潮流指数。

Claims (3)

1.一种基于深度学习的自动计算商品潮流指数的方法,其特征在于:该方法
包括如下步骤:
步骤1:采用CNN深度学习模型对商品图片进行特征提取,将原始的图片数据转化为代表图片内容的向量特征;
步骤2:对步骤1的图片特征向量采用K-means算法进行聚类,划分出N个不同的类别(N≧1),每个图片的特征向量都归属到具体的一个类别中,相同类别的所有向量取算术平均值,得出该类别的中心向量;
步骤3:计算商品的类别指数;
步骤4:计算商品到各类中心的距离;
步骤5:统计加权,将步骤4得出权重向量W,乘以步骤3得出的各个类的潮流指数,得出商品最终的潮流指数。
2.根据权利要求1的基于深度学***均点击量和平均销量,最大点击量定义为:Xmax,最小点击量定义为:Xmin,利用公式(X-Xmin)/(Xmax-Xmin)*100将商品值转化为百分制,得出商品的类别指数。
3.根据权利要求1的基于深度学习的自动计算商品潮流指数的方法,其特征在于:步骤4所述的计算商品到各类中心的距离,具体步骤有:
计算商品到各个类中心的距离R,并把所有1/R的值归为和为1的值,该值为加权系数;将步骤2中得出的类别中心向量值和商品任意的特征值,通过公式r= sqrt( ∑(yi-xi)^2)算出两者之间的欧式距离,通过公式wi=1/ri/(∑1/ri)算出权重向量值。
CN201610211098.4A 2016-04-07 2016-04-07 基于深度学习的自动计算商品潮流指数的方法 Pending CN105844302A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610211098.4A CN105844302A (zh) 2016-04-07 2016-04-07 基于深度学习的自动计算商品潮流指数的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610211098.4A CN105844302A (zh) 2016-04-07 2016-04-07 基于深度学习的自动计算商品潮流指数的方法

Publications (1)

Publication Number Publication Date
CN105844302A true CN105844302A (zh) 2016-08-10

Family

ID=56598014

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610211098.4A Pending CN105844302A (zh) 2016-04-07 2016-04-07 基于深度学习的自动计算商品潮流指数的方法

Country Status (1)

Country Link
CN (1) CN105844302A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108022116A (zh) * 2016-11-01 2018-05-11 北京京东尚科信息技术有限公司 对用户建模的方法、***及终端设备
CN108268898A (zh) * 2018-01-19 2018-07-10 大象慧云信息技术有限公司 一种基于K-Means的电子***用户聚类方法
CN108470285A (zh) * 2017-02-23 2018-08-31 北京京东尚科信息技术有限公司 用于获取用户数据信息的方法、装置、电子设备和存储介质
CN108665300A (zh) * 2017-04-01 2018-10-16 北京京东尚科信息技术有限公司 一种提供数据的方法、装置、设备和存储介质
CN110020695A (zh) * 2019-04-19 2019-07-16 杭州电子科技大学 用于滤波器组多载波调制光通信***的K-means非均匀量化算法
CN114004605A (zh) * 2021-12-31 2022-02-01 北京中科闻歌科技股份有限公司 ***超限量申请审批方法、装置、设备和介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060093185A1 (en) * 2004-11-04 2006-05-04 Fuji Xerox Co., Ltd. Moving object recognition apparatus
CN102841946A (zh) * 2012-08-24 2012-12-26 北京国政通科技有限公司 商品数据检索排序及商品推荐方法和***
CN103092861A (zh) * 2011-11-02 2013-05-08 阿里巴巴集团控股有限公司 一种商品代表图的选取方法和***
CN103345645A (zh) * 2013-06-27 2013-10-09 复旦大学 面向网购平台的商品图像类别预测方法
CN103605765A (zh) * 2013-11-26 2014-02-26 电子科技大学 一种基于聚类紧凑特征的海量图像检索***
CN104142946A (zh) * 2013-05-08 2014-11-12 阿里巴巴集团控股有限公司 一种同款业务对象聚合、搜索的方法和***
CN104732249A (zh) * 2015-03-25 2015-06-24 武汉大学 基于流行学习和混沌粒子群的深度学习图像分类方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060093185A1 (en) * 2004-11-04 2006-05-04 Fuji Xerox Co., Ltd. Moving object recognition apparatus
CN103092861A (zh) * 2011-11-02 2013-05-08 阿里巴巴集团控股有限公司 一种商品代表图的选取方法和***
CN102841946A (zh) * 2012-08-24 2012-12-26 北京国政通科技有限公司 商品数据检索排序及商品推荐方法和***
CN104142946A (zh) * 2013-05-08 2014-11-12 阿里巴巴集团控股有限公司 一种同款业务对象聚合、搜索的方法和***
CN103345645A (zh) * 2013-06-27 2013-10-09 复旦大学 面向网购平台的商品图像类别预测方法
CN103605765A (zh) * 2013-11-26 2014-02-26 电子科技大学 一种基于聚类紧凑特征的海量图像检索***
CN104732249A (zh) * 2015-03-25 2015-06-24 武汉大学 基于流行学习和混沌粒子群的深度学习图像分类方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
图书情报工作杂志社: "《电子商务研究与实践进展》", 31 October 2013, 海军出版社 *
贾世杰: "基于内容的商品图像分类方法研究", 《中国博士学位论文全文数据库》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108022116A (zh) * 2016-11-01 2018-05-11 北京京东尚科信息技术有限公司 对用户建模的方法、***及终端设备
CN108022116B (zh) * 2016-11-01 2021-06-29 北京京东尚科信息技术有限公司 对用户建模的方法、***及终端设备
CN108470285A (zh) * 2017-02-23 2018-08-31 北京京东尚科信息技术有限公司 用于获取用户数据信息的方法、装置、电子设备和存储介质
CN108470285B (zh) * 2017-02-23 2021-11-12 北京京东尚科信息技术有限公司 用于获取用户数据信息的方法、装置、电子设备和存储介质
CN108665300A (zh) * 2017-04-01 2018-10-16 北京京东尚科信息技术有限公司 一种提供数据的方法、装置、设备和存储介质
CN108268898A (zh) * 2018-01-19 2018-07-10 大象慧云信息技术有限公司 一种基于K-Means的电子***用户聚类方法
CN110020695A (zh) * 2019-04-19 2019-07-16 杭州电子科技大学 用于滤波器组多载波调制光通信***的K-means非均匀量化算法
CN114004605A (zh) * 2021-12-31 2022-02-01 北京中科闻歌科技股份有限公司 ***超限量申请审批方法、装置、设备和介质

Similar Documents

Publication Publication Date Title
CN105844302A (zh) 基于深度学习的自动计算商品潮流指数的方法
CN106651546B (zh) 一种面向智慧社区的电子商务信息推荐方法
CN103093376B (zh) 基于奇异值分解算法的聚类协同过滤推荐***
Strehl et al. Relationship-based clustering and visualization for high-dimensional data mining
CN108334592B (zh) 一种基于内容与协同过滤相结合的个性化推荐方法
CN110674407A (zh) 基于图卷积神经网络的混合推荐方法
Ba et al. Clustering collaborative filtering recommendation system based on SVD algorithm
CN109947987B (zh) 一种交叉协同过滤推荐方法
CN108665323A (zh) 一种用于理财产品推荐***的集成方法
CN106203313B (zh) 一种基于图像内容的服装分类和推荐方法
CN103377296B (zh) 一种多指标评价信息的数据挖掘方法
CN105426528A (zh) 一种商品数据的检索排序方法及***
CN102968506A (zh) 一种基于扩展特征向量的个性化协同过滤推荐方法
CN106897914A (zh) 一种基于主题模型的商品推荐方法及***
CN102663026A (zh) 一种定向投放网络广告的实现方法
CN104298787A (zh) 一种基于融合策略的个性化推荐方法及装置
CN109903138A (zh) 一种个性化商品推荐方法
CN112102029B (zh) 一种基于知识图谱的长尾推荐计算方法
CN108287916A (zh) 一种资源推荐方法
CN102521420A (zh) 基于偏好模型的社会化过滤方法
CN108389113B (zh) 一种协同过滤推荐方法和***
CN110334278A (zh) 一种基于改进深度学习的web服务推荐方法
US20160171365A1 (en) Consumer preferences forecasting and trends finding
Zhao et al. Men also do laundry: Multi-attribute bias amplification
CN108984551A (zh) 一种基于多类别联合软聚类的推荐方法及***

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20160810