CN114493760A - 电商云数据分析方法及*** - Google Patents
电商云数据分析方法及*** Download PDFInfo
- Publication number
- CN114493760A CN114493760A CN202111655687.9A CN202111655687A CN114493760A CN 114493760 A CN114493760 A CN 114493760A CN 202111655687 A CN202111655687 A CN 202111655687A CN 114493760 A CN114493760 A CN 114493760A
- Authority
- CN
- China
- Prior art keywords
- data
- product
- emotion
- analysis
- original
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0207—Discounts or incentives, e.g. coupons or rebates
- G06Q30/0224—Discounts or incentives, e.g. coupons or rebates based on user history
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Mathematical Physics (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Data Mining & Analysis (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Economics (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Mathematical Optimization (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Pure & Applied Mathematics (AREA)
- Biomedical Technology (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开了一种电商云数据分析方法及***,其中,方法包括:获取一个分析对象的历史购物数据中的原始购物数据和原始评价数据;根据分析对象的历史购物数据中的原始购物数据和原始评价数据生成一个情感量化矩阵,情感量化矩阵反映分析对象的原始评价数据所体现出针对产品的量化的情感程度;将情感量化矩阵输入至一个数据分析模型以使数据分析模型输出一个针对分析对象的倾向购买产品。本申请的有益之处在于:提供了一种根据分析对象的购物和评价数据生成情感量化矩阵以准确为分析对象推荐倾向购买产品的电商云数据分析方法及***。
Description
技术领域
本申请涉及计算机技术领域,具体而言,涉及一种电商云数据分析方法及***。
背景技术
随着电子商务的不断发展,网络购物用户规模会一直呈增长态势,致使购物网站中的推荐技术得到应用,带来的效果越来越明显。对于个性化推荐方法的探索,各电商平台都在不断增大投入并进行深入探索,为用户推荐感兴趣的电商来促进成单。
在相关商品推荐方案中,大多基于用户的浏览、购买及收藏行为来为用户进行推荐,此推荐方案并不能准确的反映用户对某一产品或某一类产品的情感程度,从而商品推荐往往达不到预期的效果。
发明内容
本申请的内容部分用于以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。本申请的内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
本申请的一些实施例提出了电商云数据分析方法、***、装置、电子设备和计算机存储介质,来解决以上背景技术部分提到的技术问题。
作为本申请的第一方面,本申请的一些实施例提供了一种电商云数据分析方法,包括:获取一个分析对象的历史购物数据中的原始购物数据和原始评价数据;根据分析对象的历史购物数据中的原始购物数据和原始评价数据生成一个情感量化矩阵,情感量化矩阵反映分析对象的原始评价数据所体现出针对产品的量化的情感程度;将情感量化矩阵输入至一个数据分析模型以使数据分析模型输出一个针对分析对象的倾向购买产品。
进一步的,其中,根据分析对象的历史购物数据中的原始购物数据和原始评价数据生成一个情感量化矩阵,包括:根据分析对象的历史购物数据中的原始购物数据和原始评价数据获得处于一个产品小类中的产品对应的情感分值vij;将m个分析对象的处于一个产品小类中的产品对应的情感分值生成一个情感量化矩阵Vmn=(vij)mxn;其中i表示分析对象编号,j表示一个产品类目下的产品编号
进一步的,其中,将m个分析对象的处于一个产品小类中的产品对应的情感分值生成一个情感量化矩阵Vmn=(vij)mxn,包括:根据分析对象的历史购物数据中的原始购物数据获取备选产品并按照排序值Y的大小排列以构成备选产品列表;从备选产品列表中选择预设数量的备选产品。
进一步的,其中,根据分析对象的历史购物数据中的原始购物数据获取备选产品并按照排序值Y的大小排列以构成备选产品列表,包括:根据分析对象的历史购物数据中的原始购物数据分别获取备选产品的初始浏览时间与当前时间的时间差Ta、备选产品的购买时间与当前时间的时间差Tb,并获得两者的比值Tb/Ta;根据分析对象的历史购物数据中的原始购物数据获取备选产品的浏览次数Na;根据分析对象的历史购物数据中的原始购物数据获取备选产品的添加购物车时间与当前时间的时间差Tc、备选产品的购买时间与当前时间的时间差Tb,并获得两者的比值Tb/Tc;结合备选产品的Tb/Ta、浏览次数Na及Tb/Tc获得排序值;其中排序值的计算方法为Y=α*Na+β*(Tb/Ta)+γ*(Tb/Tc);其中α、β及γ均为常数。
进一步的,其中,根据分析对象的历史购物数据中的原始购物数据和原始评价数据生成一个情感量化矩阵,包括:根据分析对象的历史购物数据中的原始购物数据和原始评价数据获得处于一个产品小类中的产品对应的情感分值vk ij,并将它们构成一个产品小类对应的情感分矩阵Vk=(vk ij)1xn;根据处于一个产品大类中的产品小类对应的情感分矩阵Vk构成一个产品大类的情感子矩阵W,其中情感子矩阵W=(V1V2…Vk…);将m个分析对象的情感子矩阵W构成情感量化矩阵其中k表示处于一个产品大类下的产品小类编号,i表示分析对象编号,j表示一个产品类目下的产品编号,h表示产品大类的数量。
进一步的,其中,根据处于一个产品大类中的产品小类对应的情感分矩阵Vk构成一个产品大类的情感子矩阵W,包括:根据分析对象的历史购物数据中的原始购物数据获取包含有备选产品的备选小类并按照筛选值Y的大小排列以构成备选小类列表;从备选小类列表中选择预设数量的备选小类。
进一步的,其中,根据分析对象的分析对象的历史购物数据中的原始购物数据获取备选产品的并按照筛选值Z的大小排列以构成备选小类列表,包括:根据分析对象的历史购物数据中的原始购物数据获取备选产品的价格P;根据分析对象的历史购物数据中的原始购物数据获取备选产品所属备选小类的最近购买行为与当前时间的时间差Td;结合备选产品的价格P和备选产品所属备选小类的最近购买行为与当前时间的时间差Td获得筛选值。
进一步的,其中,筛选值的计算方法为Z=θ*(Td/60min)+ω*P;其中θ为常数,ω为常数。
进一步的,其中,数据分析模型采用LTR神经网络模型。
作为本申请的第二方面,本申请的一些实施例提供了一种电商云数据分析***,该电商云数据分析***执行前述的电商云数据分析方法,该***包括:获取模块,用于获取一个分析对象的历史购物数据中的原始购物数据和原始评价数据;生成模块,用于根据分析对象的历史购物数据中的原始购物数据和原始评价数据生成一个情感量化矩阵,情感量化矩阵反映分析对象的原始评价数据所体现出针对产品的量化的情感程度;分析模块,用于将情感量化矩阵输入至一个数据分析模型以使数据分析模型输出一个针对分析对象的倾向购买产品。
本申请的有益效果在于:提供了一种根据分析对象的购物和评价数据生成情感量化矩阵以准确为分析对象推荐倾向购买产品的电商云数据分析方法及***。
附图说明
构成本申请的一部分的附图用来提供对本申请的进一步理解,使得本申请的其它特征、目的和优点变得更明显。本申请的示意性实施例附图及其说明用于解释本申请,并不构成对本申请的不当限定。
另外,贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,元件和元素不一定按照比例绘制。
在附图中:
图1是根据本申请一种实施例的电商云数据分析方法的应用场景的示意图;
图2是根据本申请一种实施例的电商云数据分析方法的另一应用场景的示意图;
图3是根据本申请一种实施例的电商云数据分析方法的主要步骤示意图;
图4是根据本申请一种实施例的电商云数据分析方法中步骤S2的一部分具体步骤的示意图。
图5是根据本申请一种实施例的电商云数据分析方法中步骤S22a的一部分具体步骤的示意图。
图6是根据本申请一种实施例的电商云数据分析方法中步骤S221a的一部分具体步骤的示意图。
图7是根据本申请一种实施例的电商云数据分析方法中步骤S2的另一实施方式的一部分具体步骤的示意图。
图8是根据本申请一种实施例的电商云数据分析方法中步骤S22b的一部分具体步骤的示意图。
图9是根据本申请一种实施例的电商云数据分析方法中步骤S221b的一部分具体步骤的示意图。
图10是根据本申请一种实施例的电商云数据分析方法中另一部分具体步骤的示意图;
图11是根据本申请一种实施例的电商云数据分析***的模块示意框图;
图12是根据本申请一种实施例的电商云数据分析方法中操作行为矩阵的示意图;
图13是根据本申请一种实施例的电商云数据分析方法中用户终端的历史购物界面示意图;
图14是根据本申请一种实施例的电商云数据分析方法中商品推荐界面示意图;
图15是根据本申请一种实施例的电商云数据分析方法中另一商品推荐界面示意图。
图中附图标记的含义:
101a、前端服务器;102、用户终端(第一用户);103、用户终端(第二用户);104、分析服务器;101b、前端服务器.
具体实施方式
下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例。相反,提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。
需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
下面将参考附图并结合实施例来详细说明本公开。
参考图1所示,在本申请一个应用场景中,包括分析服务器104、前端服务器101a及用户终端102、103,其中前端服务器104获取用户终端的购物数据,并发送至分析服务器104;分析服务器104对购物数据进行分析得到商品推荐结果,此时前端服务器101a接收分析服务器104商品推荐结果并推送至用户终端。用户终端可以被构造为一个智能手机、平板计算或者笔记本计算机。
当然,分析服务器的分析功能可合并入前端服务器,参考图2所示,图2示出了本申请另一实施方式的一个具体应用场景,在该应用场景中,包括前端服务器101b及用户终端102、103;前端服务器101b获取用户终端的购物数据,并对购物数据进行分析得到商品推荐结果,然后前端服务器101b将商品推荐结果发送至用户终端。
如图3所示,本申请的电商云数据分析方法主要包括如下步骤:
S1:获取一个分析对象的历史购物数据中的原始购物数据和原始评价数据。
当检测到分析对象使用关联的用户终端产生商品浏览行为时,如图13所示,前端服务器获取分析对象的历史购物数据,并对历史购物数据进行初步处理获得原始购物数据和原始评价数据。
S2:根据分析对象的历史购物数据中的原始购物数据和原始评价数据生成一个情感量化矩阵,情感量化矩阵反映分析对象的原始评价数据所体现出针对产品的量化的情感程度。
采用以上方式,将分析对象针对产品的情感程度进行量化,并转化为标准的矩阵,从而真实反映分析对象的情感变化。
S3:将情感量化矩阵输入至一个数据分析模型以使数据分析模型输出一个针对分析对象的倾向购买产品。
采用这样的方案,通过数据分析模型对输入的情感量化矩阵进行分析,这样可以更加柔性进行分析判断,并且将分析对象的情感作为商品推荐的重要参考因素,从而准确为分析对象推荐倾向购买产品。
作为具体方案,参照图4所示,上述步骤S2具体包括如下步骤:
S21a:根据分析对象的历史购物数据中的原始购物数据和原始评价数据获得处于一个产品小类中的产品对应的情感分值vij。
S22a:将m个分析对象的处于一个产品小类中的产品对应的情感分值生成一个情感量化矩阵Vmn=(vij)mxn。
上述(vij)mxn中的i表示分析对象编号,j表示一个产品类目下的产品编号,如图12所示,本申请的情感量化矩阵的每列对应不同的产品,情感量化矩阵的每行对应不同的分析对象。
采用这样的方式,将多个分析对象在一个产品小类中的产品对应的情感分值进行相互参照分析,不仅可以弥补某一分析对象在其中一件产品中的情感评分空白,同时提高推荐的准确率。
在实际应用中发现,一个产品小类下包含的产品种类众多,若将每个产品均列入情感化矩阵中,会使得上述情感量化矩阵的维数太大而造成庞大的运算量。
作为具体方案,参照图5所示,上述步骤S22a具体包括如下步骤:
S221a:根据分析对象的历史购物数据中的原始购物数据获取备选产品并按照排序值Y的大小排列以构成备选产品列表。
S222a:从备选产品列表中选择预设数量的备选产品。
采用这样的方案,根据排序值对历史购物数据中的多个产品进行排序以预筛选,并从备选产品列表中选取出分析对象可能购买的若干产品,比如:一个产品小类下的产品数量可能有数十个甚至更多,若全部置入情感量化矩阵中,则矩阵维数过多,因而可从备选产品列表选取其中可能性最高的5个产品作为备选产品,大幅度降低情感量化矩阵的维数,减少不必要的计算量。
作为具体方案,参照图6所示,上述步骤S221a具体包括如下步骤:
S2211a:根据分析对象的历史购物数据中的原始购物数据分别获取备选产品的初始浏览时间与当前时间的时间差Ta、备选产品的购买时间与当前时间的时间差Tb,并获得两者的比值Tb/Ta.
S2212a:根据分析对象的历史购物数据中的原始购物数据获取备选产品的浏览次数Na。
S2213a:根据分析对象的历史购物数据中的原始购物数据获取备选产品的添加购物车时间与当前时间的时间差Tc、备选产品的购买时间与当前时间的时间差Tb,并获得两者的比值Tb/Tc。
S2214a:结合备选产品的Tb/Ta、浏览次数Na及Tb/Tc获得排序值。
步骤S2214a中的排序值的计算方法为Y=α*Na+β*(Tb/Ta)+γ*(Tb/Tc) (公式1)其中α、β及γ均为常数。
根据实际测试的数据和模拟实验结果,排序值的影响因素中,浏览次数Na作为分析对象对一件产品的关注程度,对排序值的影响较大;公式1中Tb/Ta反映了分析对象对于一件产品的购买权衡时间,如对生活必需品的选择往往考虑时间较短,其在某一些特征时间或时间段与排序值的关联性较强,因此其对排序值的影响相对浏览次数次之;公式1中的Tb/Tc作为对Tb/Ta的补充,其具体表现为分析对象倾向于某一件产品,然而该产品并不是分析对象必需的而导致存在于购物车的时间过长,使得Ta和Tb之间的差值较大,对Tb/Ta造成较大影响,因此,设置Tb/Tc对排序值进行修正,γ对排序值的影响小于α和β。作为优选方案,公式1中的α的取值范围为0.55至0.7;β的值范围为0.1至0.45;γ的取值范围为0.05至0.25。
作为更进一步的方案,公式1中α+β+γ=1,因此α、β及γ可直观的反映Na、Tb/Ta及Tb/Tc对排序值的影响比重,并使得三者的大小处于可对比的范围之内。
作为优选方案,数据分析模型采用LTR神经网络模型,该LTR神经网络模型的输入数据为情感量化矩阵,输出数据为针对分析对象的倾向购买产品。
数据分析模型的构建方法为:采集电商平台上用户的历史购物数据并生成情感量化矩阵Vmn=(vij)mxn以构成数据分析模型的训练集的输入数据,输出倾向购买产品构成推荐模型的训练集的输出数据,采用训练集中对应的输入数据和输出数据训练数据分析模型,数据分析模型的推荐准确率可以根据用户最终选择的产品作比对,根据比对结果对数据分析模型进行修正。
上述方案获得的情感量化矩阵是基于一个产品小类中的购物数据获得,其数据分析模型最终的产品也只能是该产品小类下的产品,若要对所有产品大类中的产品进行分析推荐,则要分别对每个产品小类建立情感量化矩阵,局限性太大且运算量大。
作为本申请的另外一种实施方式,参照图7所示,上述步骤S2具体包括如下步骤:
S21b:根据分析对象的历史购物数据中的原始购物数据和原始评价数据获得处于一个产品小类中的产品对应的情感分值vk ij,并将它们构成一个产品小类对应的情感分矩阵Vk=(vk ij)1xn。
S22b:根据处于一个产品大类中的产品小类对应的情感分矩阵Vk构成一个产品大类的情感子矩阵W,其中情感子矩阵W=(V1V2…Vk…)。
采用这样的方案,获得基于所有产品大类并精确到产品的情感分值的情感量化矩阵,其囊括分析对象在所有的产品大类下的购物数据,从多个产品大类中筛选出最优的推荐方案。
在实际应用中发现,一个产品大类下包含的产品小类数量众多,若将每个产品小类均列入情感化矩阵中,会使得上述情感量化矩阵的维数太大而造成庞大的运算量。
作为具体方案,参照图8所示,上述步骤S22b具体包括如下步骤:
S221b:根据分析对象的历史购物数据中的原始购物数据获取包含有备选产品的备选小类并按照筛选值Y的大小排列以构成备选小类列表。
S222b:从备选小类列表中选择预设数量的备选小类。
采用这样的方案,根据筛选值Y对历史购物数据中的多个产品小类进行排列以便于预筛选,选取出其中分析对象可能购买的产品小类,比如:一个产品大类下的产品小类数量可能有十数种甚至更多,若全部置入情感量化矩阵中,考虑到产品小类下的产品数,矩阵维数过多,因而可从备选小类列表选取其中可能性最高的5个作为备选小类,从而大幅度降低情感量化矩阵的维数,减少不必要的计算量。当然,每个产品小类中可列入情感量化矩阵的产品可通过上述排序值的方法进行筛选。
作为具体方案,参照图9所示,上述步骤S221b具体包括如下步骤:
S2211b:根据分析对象的历史购物数据中的原始购物数据获取备选产品的价格P。
S2212b:根据分析对象的历史购物数据中的原始购物数据获取备选产品所属备选小类的最近购买行为与当前时间的时间差Td。
S2213b:结合备选产品的价格P和备选产品所属备选小类的最近购买行为与当前时间的时间差Td获得筛选值。
其中,步骤S2213b中的筛选值的计算方法为Z=θ*(Td/60min)+ω*P (公式2);其中θ及ω均为常数。
根据模拟实验结果,筛选值的影响因素中,备选产品所属备选小类的最近购买行为与当前时间的时间差Td直接反映了分析对象的购买行为特征,备选产品的价格间接反映了分析对象的消费特征,作为对Td的补充,因此θ对筛选值的影响较大。
作为优选的方案,公式2中θ的取值范围为0.6至0.8;ω的取值范围为0.2至0.5。
作为更进一步的方案,公式1中θ+ω=1,直观地反映可直观的反映价格P及Td/60min对筛选值的影响比重,并使得二者的大小处于可对比的范围之内。
作为优选方案,数据分析模型采用LTR神经网络模型,该LTR神经网络模型的输入数据为情感量化矩阵,输出数据为针对分析对象的倾向购买产品。
数据分析模型的构建方法为:采集电商平台上用户的历史购物数据并生成情感量化矩阵以构成数据分析模型的训练集的输入数据,输出倾向购买产品构成推荐模型的训练集的输出数据,采用训练集中对应的输入数据和输出数据训练数据分析模型,数据分析模型的推荐准确率可以根据用户最终选择的产品作比对,根据比对结果对数据分析模型进行修正。
如图14所示,可以在商品推荐界面中,直接显示分析对象的对象编号、推荐的产品名称、产品名称所处的产品小类及产品大类;若点击“推送”按钮则向分析对象推送分析结果,若点击“放弃”则放弃本次分析结果。
如图14所示,在商品推荐界面中,设置有“分析”按钮,点击即重新进行一次分析;当然,也可采用定时分析的方式更新分析结果或由用户终端浏览信号触发以更新。
如图15所示,可以在商品推荐界面点击“历史分析”按钮,即可查看历史命中次数的趋势图及推荐命中率图,从而可根据对数据分析模型进行修正。
具体而言,参照图10所示,其中情感分值vij获取步骤为:
St01:根据行业和\或产品属性构建用于产品问题分析的特征维度;
St02:通过爬虫获取足够数量的同一行业或同一类型产品的用户评论数据作为样本,根据中英文断句的标点符号对样本进行分句处理;根据St01中构建的特征维度进行标注,得到带有维度标签和各维度情感标签的训练样本;
St03:搭建包括至少一个Embedding层和两个Dense层的神经网络模型,使用St02中标注后的训练样本按照7比3或8比2的比例拆分为训练样本和测试样本,对训练样本进行分词处理得到分词模型,并构建索引词表,然后将分词后的文本训练向量化模型,向量化后的样本训练得到多维度分类模型和各维度情感分析模型;
St04:循环筛选包括各个维度分类下的各情感分的训练样本,利用词频统计提取出排在前N位的分词结果,纳入候选关键词库;
St05:对候选关键词库中涉及相同问题的关键词进行分类合并,设置可统领涉及同类问题的小词的大词,得到大小词映射表;
St06:根据中英文断句的标点符号对评价数据进行分句处理获得评论分句;对评论分句使用中分词模型、索引词表和向量化模型进行向量化处理转为向量矩阵。
St07:将向量矩阵输入至多特征维度分类模型以使多特征维度分类模型输出维度分类结果。
St08:将维度分类结果输入至情感分析模型以使情感分析模型输出所有评论分句的评分值。
St09:通过得到的维度分类结果和评分值,根据大小词映射表,通过匹配小词来得到对应的关键评价词类。
St10:根据得到的关键评价词类的及关键评价词类对应的评分值获得情感分值。
其中,预设的关键评价词类包括舒适、价格、美观、气味、尺寸、耐用及物流,然而并不是每个关键评价词类对应的评分值都对情感分值有相同作用,因此可以为每个关键评价词类配置相应的权重,对情感分值进行修正,从而情感分值更能体现分析对象的情感程度。
如图11所示,本申请的电商云数据分析***执行前述的电商云数据分析方法,该***包括:获取模块,用于获取一个分析对象的历史购物数据中的原始购物数据和原始评价数据;生成模块,用于根据分析对象的历史购物数据中的原始购物数据和原始评价数据生成一个情感量化矩阵,情感量化矩阵反映分析对象的原始评价数据所体现出针对产品的量化的情感程度;分析模块,用于将情感量化矩阵输入至一个数据分析模型以使数据分析模型输出一个针对分析对象的倾向购买产品。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的一些实施例的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言―诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言:诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)——连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。
也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。
例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上***(SOC)、复杂可编程逻辑设备(CPLD)等等。
以上描述仅为本公开的一些较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开的实施例中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开的实施例中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
Claims (10)
1.一种电商云数据分析方法,包括:
获取一个分析对象的历史购物数据中的原始购物数据和原始评价数据;
根据所述分析对象的历史购物数据中的原始购物数据和原始评价数据生成一个情感量化矩阵,所述情感量化矩阵反映所述分析对象的原始评价数据所体现出针对产品的量化的情感程度;
将所述情感量化矩阵输入至一个数据分析模型以使所述数据分析模型输出一个针对所述分析对象的倾向购买产品。
2.根据权利要求1所述的电商云数据分析方法,其中,所述根据所述分析对象的历史购物数据中的原始购物数据和原始评价数据生成一个情感量化矩阵,包括:
根据所述分析对象的历史购物数据中的原始购物数据和原始评价数据获得处于一个产品小类中的产品对应的情感分值vij;
将m个分析对象的所述处于一个产品小类中的产品对应的情感分值生成一个情感量化矩阵Vmn=(vij)mxn;
其中i表示分析对象编号,j表示一个产品类目下的产品编号。
3.根据权利要求2所述的电商云数据分析方法,其中,所述将m个分析对象的所述处于一个产品小类中的产品对应的情感分值生成一个情感量化矩阵Vmn=(vij)mxn,包括:
根据分析对象的历史购物数据中的原始购物数据获取备选产品并按照排序值Y的大小排列以构成备选产品列表;
从所述备选产品列表中选择预设数量的所述备选产品。
4.根据权利要求3所述的电商云数据分析方法,其中,所述根据分析对象的历史购物数据中的原始购物数据获取备选产品并按照排序值Y的大小排列以构成备选产品列表,包括:
根据所述分析对象的历史购物数据中的原始购物数据分别获取备选产品的初始浏览时间与当前时间的时间差Ta、备选产品的购买时间与当前时间的时间差Tb,并获得两者的比值Tb/Ta;
根据所述分析对象的历史购物数据中的原始购物数据获取备选产品的浏览次数Na;
根据所述分析对象的历史购物数据中的原始购物数据获取备选产品的添加购物车时间与当前时间的时间差Tc、备选产品的购买时间与当前时间的时间差Tb,并获得两者的比值Tb/Tc;
结合备选产品的Tb/Ta、浏览次数Na及Tb/Tc获得排序值;
其中所述排序值的计算方法为Y=α*Na+β*(Tb/Ta)+γ*(Tb/Tc);其中α、β及γ均为常数。
5.根据权利要求1所述的电商云数据分析方法,其中,所述根据所述分析对象的历史购物数据中的原始购物数据和原始评价数据生成一个情感量化矩阵,包括:
根据所述分析对象的历史购物数据中的原始购物数据和原始评价数据获得处于一个产品小类中的产品对应的情感分值vk ij,并将它们构成一个产品小类对应的情感分矩阵Vk=(vk ij)1xn;
根据处于一个产品大类中的产品小类对应的情感分矩阵Vk构成一个产品大类的情感子矩阵W,其中所述情感子矩阵W=(V1 V2 … Vk …);
其中k表示处于一个产品大类下的产品小类编号,i表示分析对象编号,j表示一个产品类目下的产品编号,h表示产品大类的数量。
6.根据权利要求5所述的电商云数据分析方法,其中,所述根据处于一个产品大类中的产品小类对应的情感分矩阵Vk构成一个产品大类的情感子矩阵W,包括:
根据分析对象的历史购物数据中的原始购物数据获取包含有备选产品的备选小类并按照筛选值Y的大小排列以构成备选小类列表;
从所述备选小类列表中选择预设数量的所述备选小类。
7.根据权利要求6所述的电商云数据分析方法,其中,所述根据分析对象的分析对象的历史购物数据中的原始购物数据获取备选产品的并按照筛选值Z的大小排列以构成备选小类列表,包括:
根据所述分析对象的历史购物数据中的原始购物数据获取备选产品的价格P;
根据所述分析对象的历史购物数据中的原始购物数据获取备选产品所属备选小类的最近购买行为与当前时间的时间差Td;
结合备选产品的价格P和备选产品所属备选小类的最近购买行为与当前时间的时间差Td获得筛选值。
8.根据权利要求7所述的电商云数据分析方法,其中,所述筛选值的计算方法为Z=θ*(Td/60min)+ω*P;其中θ为常数,ω为常数。
9.根据权利要求1所述的电商云数据分析方法,其中,所述数据分析模型采用LTR神经网络模型。
10.一种电商云数据分析***,所述电商云数据分析***执行如权利要求1至9任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111655687.9A CN114493760A (zh) | 2021-12-30 | 2021-12-30 | 电商云数据分析方法及*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111655687.9A CN114493760A (zh) | 2021-12-30 | 2021-12-30 | 电商云数据分析方法及*** |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114493760A true CN114493760A (zh) | 2022-05-13 |
Family
ID=81497257
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111655687.9A Pending CN114493760A (zh) | 2021-12-30 | 2021-12-30 | 电商云数据分析方法及*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114493760A (zh) |
-
2021
- 2021-12-30 CN CN202111655687.9A patent/CN114493760A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109740148B (zh) | 一种BiLSTM结合Attention机制的文本情感分析方法 | |
Wang et al. | Mapping customer needs to design parameters in the front end of product design by applying deep learning | |
CN107491531A (zh) | 基于集成学习框架的中文网络评论情感分类方法 | |
US11263714B1 (en) | Automated document analysis for varying natural languages | |
CN110929034A (zh) | 一种基于改进lstm的商品评论细粒度情感分类方法 | |
US11393237B1 (en) | Automatic human-emulative document analysis | |
CN113627969A (zh) | 一种基于电商平台用户评论的产品问题分析方法和*** | |
CN111966888B (zh) | 融合外部数据的基于方面类别的可解释性推荐方法及*** | |
Samah et al. | The best malaysian airline companies visualization through bilingual twitter sentiment analysis: a machine learning classification | |
Mishra et al. | Twitter sentiment analysis using naive bayes algorithm | |
Purbaya et al. | Implementation of n-gram Methodology to Analyze Sentiment Reviews for Indonesian Chips Purchases in Shopee E-Marketplace | |
Hossain et al. | Rating prediction of product reviews of bangla language using machine learning algorithms | |
CN112862569A (zh) | 基于图像和文本多模态数据的产品外观风格评价方法和*** | |
CN111723302A (zh) | 一种基于协同双模型深度表示学习的推荐方法 | |
CN114429384B (zh) | 基于电商平台的产品智能推荐方法及*** | |
CN114493760A (zh) | 电商云数据分析方法及*** | |
Ardiyanto et al. | Application Of Artificial Intelligence (AI) For Hijab Business In Mojokerto Using Sentiment Analysis Method Natural Language Processing (NLP) | |
Bayu et al. | Classification of Indonesian Population’s Level Happiness on Twitter Data Using N-Gram, Naïve Bayes, and Big Data Technology | |
Ali et al. | Online reviews & ratings inter-contradiction based product’s quality-prediction through hybrid neural network | |
Maharani et al. | Classification of Public Sentiment on Fuel Price Increases Using CNN | |
Ikhsanti et al. | Implementation of the c4. 5 decision tree learning algorithm for sentiment analysis in e-commerce application reviews on *** play store | |
AU2021106572A4 (en) | A recommendation system and method for e-commerce using machine learning | |
Erfina et al. | Indonesian Analysis Sentiment on Non Fungible Token (NFT) | |
CN115880034B (zh) | 一种数据的采集分析*** | |
CN116911280B (zh) | 一种基于自然语言处理的评论分析报告生成方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |