CN106202517A - 一种基于大数据的网上商品在网页上的排序方法 - Google Patents

一种基于大数据的网上商品在网页上的排序方法 Download PDF

Info

Publication number
CN106202517A
CN106202517A CN201610583106.8A CN201610583106A CN106202517A CN 106202517 A CN106202517 A CN 106202517A CN 201610583106 A CN201610583106 A CN 201610583106A CN 106202517 A CN106202517 A CN 106202517A
Authority
CN
China
Prior art keywords
commodity
data
user
buy
classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610583106.8A
Other languages
English (en)
Inventor
李易春
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Julian E-Commerce Co Ltd
Original Assignee
Guangdong Julian E-Commerce Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Julian E-Commerce Co Ltd filed Critical Guangdong Julian E-Commerce Co Ltd
Priority to CN201610583106.8A priority Critical patent/CN106202517A/zh
Publication of CN106202517A publication Critical patent/CN106202517A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Engineering & Computer Science (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Computational Linguistics (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种基于大数据的网上商品在网页上的排序方法,包括以下步骤:步骤S1,数据采集,步骤S2,数据分析,步骤S3,步骤S4,判断用户希望购买商品的分类以及用户希望购买商品的特征;步骤S5,商品排序,根据用户希望购买商品的分类以及用户希望购买商品的特征,在用户网上购物时,对商品进行排序;与现有技术相比,本发明具有如下的有益效果:在用户第一次搜索商品时,便通过排序的方式,向用户推送希望购买商品,避免了电子商务中用户搜索所需商品所产生的浏览中的大量无关信息,大大提高了电子商务的效率,同时大大改善了用户的使用体验,能有效的引导用户购物,满足用户购物体验。

Description

一种基于大数据的网上商品在网页上的排序方法
技术领域
本发明是一种基于大数据的网上商品在网页上的排序方法,属于电子商务领域。
背景技术
近年来,随着信息技术和互联网的不断迅速发展,电子商务在社会和生活中的地位越来越显著,电子商务***为用户提供越来越多的选择。与此同时,电子商务规模的急剧扩大使得用户耗费大量的时间浏览无关商品,对于销售商而言,以最合适的方式将商品推荐给用户是他们迫切希望的。随着大数据时代的到来,电子商务网站的商品以指数速度增长,不论其数量上还是种类上都是人们难以想象的,这更增大了迅速准确获取自己想要商品的难度。
互联网犹如一把双刃剑,虽然很大程度上它推动了电子商务的迅猛发展,使商家能够通过电子商务平台将自己的商品展示给消费者,消费者足不出户便可对商品信息完全掌握,并与商家达成交易,双方各取所需,但是随着电子商务规模的不断扩大,商品个数和种类快速增长,顾客需要花费大量的时间才能找到自己想买的商品。
这种浏览大量无关的信息和产品过程无疑会使淹没在信息过载问题中的消费者不断流失。同时随着电子商务***正处在不断的扩大化,***结构不断的复杂化,用户及商品的数量几乎呈直线上身,然而现阶段很多推荐算法由于自身的条件限制,存在两个方面的问题:稀疏性问题与扩展性问题,这严重的影响了推荐的质量。
在网上购物的时候,一般搜索一个商品,都是进入一个主的分类浏览页面,如果可以从分类浏览页面进行改进,那么商品则有望更快、更便利地推荐最适合用户的产品,以达到使得用户能够更便捷地找寻所需商品的目的,从而大大改善用户的使用体验。
发明内容
针对现有技术存在的不足,本发明目的是提供一种基于大数据的网上商品在网页上的排序方法,以解决上述背景技术中提出的问题。
为了实现上述目的,本发明是通过如下的技术方案来实现:一种基于大数据的网上商品在网页上的排序方法,包括以下步骤:
步骤S1,数据采集,利用多个大数据的数据库来接收发自客户端的数据,这个客户端数据是指用户在网上购物时,所留下来的操作记录,用户的操作记录对应地记录有用户的历史数据记录,用户的历史数据记录包括用户点击商品的记录以及用户在所点击商品中的停留时间;
步骤S2,数据分析,利用大数据的数据库,或者分布式计算集群来对存储于其内的海量数据进行普通的分析和分类汇总,将用户的操作记录以及用户的历史数据记录对应的进行分析;
步骤S3,导入和预处理数据,将来自前端分析后的数据导入到一个集中的大型分布式数据库,或者分布式存储集群,并且可以在导入基础上做清洗和预处理工作,将分析后的数据进行修剪,得到需要记录和储存的数据,通过数据清洗、数据转换、数据整合及数据加载中一种或者多种操作将基础数据转换为预处理后的数据;步骤S4,数据挖掘和分析,通过用于统计学习的SVM和用于分类的Naive Bayes对预处理后的数据进行挖掘和分析,判断用户希望购买商品的分类以及用户希望购买商品的特征;
步骤S5,商品排序,根据用户希望购买商品的分类以及用户希望购买商品的特征,在用户网上购物时,对商品进行排序。
进一步地,在步骤S1中,通过这些数据库来进行查询和处理工作,其中数据库指Redis、MongoDB以及NoSQL数据库,通过Redis、MongoDB以及NoSQL数据库用于数据的采集;或利用传统的关系型数据库MySQL和Oracle来进行查询和处理工作。
进一步地,在步骤S2中,通过利用大数据的数据库,将用户的操作记录以及用户的历史数据记录对应的进行分析,判断用户浏览商品时的一般排序方法,排序方法包括人气从高到底排序、人气从低到高排序、销量从高到底排序、销量从低到高排序、信用从高到底排序、信用从低到高排序、价格从高到底排序以及价格从低到高排序。
进一步地,在步骤S4中,用户希望购买商品的分类以及用户希望购买商品的特征指商品的属性特征,这个商品的属性特征包括商品的品牌、商品的成分、商品的产地、商品的用途以及商品的分类。
进一步地,在步骤S5中,通过用户希望购买商品的分类以及用户希望购买商品的特征在网上购物***中建立商品排序模型,通过商品排序模型对用户进行商品浏览时的排序。
本发明的有益效果:本发明的一种基于大数据的网上商品在网页上的排序方法,通过用户希望购买商品的分类以及用户希望购买商品的特征在网上购物***中建立商品排序模型,通过商品排序模型对用户进行商品浏览时的排序,在用户第一次搜索商品时,便通过排序的方式,向用户推送希望购买商品,避免了电子商务中用户搜索所需商品所产生的浏览中的大量无关信息,大大提高了电子商务的效率,同时大大改善了用户的使用体验,能有效的引导用户购物,满足用户购物体验。
具体实施方式
为使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,下面结合具体实施方式,进一步阐述本发明。
本发明提供一种技术方案:一种基于大数据的网上商品在网页上的排序方法,包括以下步骤:
步骤S1,数据采集,利用多个大数据的数据库来接收发自客户端的数据,这个客户端数据是指用户在网上购物时,所留下来的操作记录,用户的操作记录对应地记录有用户的历史数据记录,用户的历史数据记录包括用户点击商品的记录以及用户在所点击商品中的停留时间,在大数据的采集过程中,其主要特点和挑战是并发数高,因为同时有可能会有成千上万的用户来进行访问和操作,比如淘宝,它们并发的访问量在峰值时达到上百万,所以需要在采集端部署大量数据库才能支撑,通过这些数据库来进行查询和处理工作,其中数据库指Redis、MongoDB以及NoSQL数据库,通过Redis、MongoDB以及NoSQL数据库用于数据的采集;或利用传统的关系型数据库MySQL和Oracle来进行查询和处理工作。
步骤S2,数据分析,利用大数据的数据库,或者分布式计算集群来对存储于其内的海量数据进行普通的分析和分类汇总,将用户的操作记录以及用户的历史数据记录对应的进行分析;
步骤S3,导入和预处理数据,将来自前端分析后的数据导入到一个集中的大型分布式数据库,或者分布式存储集群,并且可以在导入基础上做清洗和预处理工作,将分析后的数据进行修剪,得到需要记录和储存的数据,通过数据清洗、数据转换、数据整合及数据加载中一种或者多种操作将基础数据转换为预处理后的数据;步骤S4,数据挖掘和分析,通过用于统计学习的SVM和用于分类的Naive Bayes对预处理后的数据进行挖掘和分析,判断用户希望购买商品的分类以及用户希望购买商品的特征;
步骤S5,商品排序,根据用户希望购买商品的分类以及用户希望购买商品的特征,在用户网上购物时,对商品进行排序。
在步骤S2中,通过利用大数据的数据库,将用户的操作记录以及用户的历史数据记录对应的进行分析,判断用户浏览商品时的一般排序方法,排序方法包括人气从高到底排序、人气从低到高排序、销量从高到底排序、销量从低到高排序、信用从高到底排序、信用从低到高排序、价格从高到底排序以及价格从低到高排序。
在步骤S4中,用户希望购买商品的分类以及用户希望购买商品的特征指商品的属性特征,这个商品的属性特征包括商品的品牌、商品的成分、商品的产地、商品的用途以及商品的分类。
在步骤S5中,通过用户希望购买商品的分类以及用户希望购买商品的特征在网上购物***中建立商品排序模型,通过商品排序模型对用户进行商品浏览时的排序。
做为本发明的一个实施例:本发明的一种基于大数据的网上商品在网页上的排序方法,通过用户希望购买商品的分类以及用户希望购买商品的特征在网上购物***中建立商品排序模型,通过商品排序模型对用户进行商品浏览时的排序,在用户第一次搜索商品时,便通过排序的方式,向用户推送希望购买商品,避免了电子商务中用户搜索所需商品所产生的浏览中的大量无关信息,大大提高了电子商务的效率,同时大大改善了用户的使用体验,能有效的引导用户购物,满足用户购物体验。
以上显示和描述了本发明的基本原理和主要特征和本发明的优点,对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。

Claims (5)

1.一种基于大数据的网上商品在网页上的排序方法,其特征在于:包括以下步骤:
步骤S1,数据采集,利用多个大数据的数据库来接收发自客户端的数据,这个客户端数据是指用户在网上购物时,所留下来的操作记录,用户的操作记录对应地记录有用户的历史数据记录,用户的历史数据记录包括用户点击商品的记录以及用户在所点击商品中的停留时间;
步骤S2,数据分析,利用大数据的数据库,或者分布式计算集群来对存储于其内的海量数据进行普通的分析和分类汇总,将用户的操作记录以及用户的历史数据记录对应的进行分析;
步骤S3,导入和预处理数据,将来自前端分析后的数据导入到一个集中的大型分布式数据库,或者分布式存储集群,并且可以在导入基础上做清洗和预处理工作,将分析后的数据进行修剪,得到需要记录和储存的数据,通过数据清洗、数据转换、数据整合及数据加载中一种或者多种操作将基础数据转换为预处理后的数据;步骤S4,数据挖掘和分析,通过用于统计学习的SVM和用于分类的Naive Bayes对预处理后的数据进行挖掘和分析,判断用户希望购买商品的分类以及用户希望购买商品的特征;
步骤S5,商品排序,根据用户希望购买商品的分类以及用户希望购买商品的特征,在用户网上购物时,对商品进行排序。
2.根据权利要求1所述的一种基于大数据的网上商品在网页上的排序方法,其特征在于:在步骤S1中,通过这些数据库来进行查询和处理工作,其中数据库指Redis、MongoDB以及NoSQL数据库,通过Redis、MongoDB以及NoSQL数据库用于数据的采集;或利用传统的关系型数据库MySQL和Oracle来进行查询和处理工作。
3.根据权利要求1所述的一种基于大数据的网上商品在网页上的排序方法,其特征在于:在步骤S2中,通过利用大数据的数据库,将用户的操作记录以及用户的历史数据记录对应的进行分析,判断用户浏览商品时的一般排序方法,排序方法包括人气从高到底排序、人气从低到高排序、销量从高到底排序、销量从低到高排序、信用从高到底排序、信用从低到高排序、价格从高到底排序以及价格从低到高排序。
4.根据权利要求1所述的一种基于大数据的网上商品在网页上的排序方法,其特征在于:在步骤S4中,用户希望购买商品的分类以及用户希望购买商品的特征指商品的属性特征,这个商品的属性特征包括商品的品牌、商品的成分、商品的产地、商品的用途以及商品的分类。
5.根据权利要求1所述的一种基于大数据的网上商品在网页上的排序方法,其特征在于:在步骤S5中,通过用户希望购买商品的分类以及用户希望购买商品的特征在网上购物***中建立商品排序模型,通过商品排序模型对用户进行商品浏览时的排序。
CN201610583106.8A 2016-07-24 2016-07-24 一种基于大数据的网上商品在网页上的排序方法 Pending CN106202517A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610583106.8A CN106202517A (zh) 2016-07-24 2016-07-24 一种基于大数据的网上商品在网页上的排序方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610583106.8A CN106202517A (zh) 2016-07-24 2016-07-24 一种基于大数据的网上商品在网页上的排序方法

Publications (1)

Publication Number Publication Date
CN106202517A true CN106202517A (zh) 2016-12-07

Family

ID=57492422

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610583106.8A Pending CN106202517A (zh) 2016-07-24 2016-07-24 一种基于大数据的网上商品在网页上的排序方法

Country Status (1)

Country Link
CN (1) CN106202517A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107230136A (zh) * 2017-05-31 2017-10-03 合肥亿迈杰软件有限公司 一种基于大数据的购物排序推送方法
CN110490707A (zh) * 2019-08-13 2019-11-22 蚌埠聚本电子商务产业园有限公司 一种用于电子商务的猎奇搜索购物方法
WO2020078084A1 (zh) * 2018-10-19 2020-04-23 深圳点猫科技有限公司 一种基于教育资源平台的消费数据统计方法及装置
CN111080406A (zh) * 2019-12-04 2020-04-28 重庆锐云科技有限公司 一种基于拍照的商品价格智能查询***及方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102411754A (zh) * 2011-11-29 2012-04-11 南京大学 一种基于商品属性熵值的个性化推荐方法
CN102419779A (zh) * 2012-01-13 2012-04-18 青岛理工大学 一种基于属性排序的商品个性化搜索方法及装置
CN102446180A (zh) * 2010-10-09 2012-05-09 腾讯科技(深圳)有限公司 一种商品搜索方法及其装置
CN105528374A (zh) * 2014-10-21 2016-04-27 苏宁云商集团股份有限公司 一种电子商务中的商品推荐方法及其***

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102446180A (zh) * 2010-10-09 2012-05-09 腾讯科技(深圳)有限公司 一种商品搜索方法及其装置
CN102411754A (zh) * 2011-11-29 2012-04-11 南京大学 一种基于商品属性熵值的个性化推荐方法
CN102419779A (zh) * 2012-01-13 2012-04-18 青岛理工大学 一种基于属性排序的商品个性化搜索方法及装置
CN105528374A (zh) * 2014-10-21 2016-04-27 苏宁云商集团股份有限公司 一种电子商务中的商品推荐方法及其***

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
胡中飞: "基于数据挖掘的网上商城个性化推荐模型研究", 《中国优秀硕士学位论文全文数据库 经济与管理科学辑》 *
阎毅编著: "《信息科学技术导论》", 31 August 2014, 西安:西安电子科技大学出版社 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107230136A (zh) * 2017-05-31 2017-10-03 合肥亿迈杰软件有限公司 一种基于大数据的购物排序推送方法
WO2020078084A1 (zh) * 2018-10-19 2020-04-23 深圳点猫科技有限公司 一种基于教育资源平台的消费数据统计方法及装置
CN110490707A (zh) * 2019-08-13 2019-11-22 蚌埠聚本电子商务产业园有限公司 一种用于电子商务的猎奇搜索购物方法
CN111080406A (zh) * 2019-12-04 2020-04-28 重庆锐云科技有限公司 一种基于拍照的商品价格智能查询***及方法

Similar Documents

Publication Publication Date Title
CN104866474B (zh) 个性化数据搜索方法及装置
CN104679771B (zh) 一种个性化数据搜索方法和装置
WO2020215751A1 (zh) 一种推荐方法、电子设备及可读存储介质
CN103793388B (zh) 搜索结果的排序方法和装置
Sivapalan et al. Recommender systems in e-commerce
Raorane et al. Association rule–extracting knowledge using market basket analysis
CN102419779B (zh) 一种基于属性排序的商品个性化搜索方法及装置
CN107590675B (zh) 一种基于大数据的用户购物行为识别方法、储存设备及移动终端
CN106530058A (zh) 一种基于历史搜索浏览记录推荐商品的方法
TWI512653B (zh) Information providing method and apparatus, method and apparatus for determining the degree of comprehensive relevance
CN106202516A (zh) 一种根据时间节点的电子商务平台商品展示方法
CN103970850B (zh) 网站信息推荐方法和***
CN107633430A (zh) 一种基于群体社区的商品推荐方法
CN108537596B (zh) 搜索框内车型推荐的方法、装置、***及存储器
CN104252456B (zh) 一种权重估计方法、装置及***
CN102411754A (zh) 一种基于商品属性熵值的个性化推荐方法
Hasan et al. Query suggestion for e-commerce sites
CN105138690B (zh) 确定关键词的方法和装置
CN102446180A (zh) 一种商品搜索方法及其装置
CN106157099A (zh) 一种基于大数据的用户点击信息奖励方法
CN106202517A (zh) 一种基于大数据的网上商品在网页上的排序方法
CN104077286A (zh) 商品信息的搜索方法及***
US10409877B2 (en) Search engine results declumping method
CN107194758A (zh) 基于可信朋友的评价记录方法
Monteserin et al. Influence-based approach to market basket analysis

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20161207