CN116629977A - 基于大数据的电子商务决策方法及其*** - Google Patents
基于大数据的电子商务决策方法及其*** Download PDFInfo
- Publication number
- CN116629977A CN116629977A CN202310668132.0A CN202310668132A CN116629977A CN 116629977 A CN116629977 A CN 116629977A CN 202310668132 A CN202310668132 A CN 202310668132A CN 116629977 A CN116629977 A CN 116629977A
- Authority
- CN
- China
- Prior art keywords
- feature vector
- recommended
- product
- consumption data
- commerce
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims abstract description 65
- 239000013598 vector Substances 0.000 claims description 264
- 239000011159 matrix material Substances 0.000 claims description 54
- 238000012545 processing Methods 0.000 claims description 52
- 238000005457 optimization Methods 0.000 claims description 20
- 230000002457 bidirectional effect Effects 0.000 claims description 19
- 230000011218 segmentation Effects 0.000 claims description 16
- 238000007781 pre-processing Methods 0.000 claims description 13
- 238000012935 Averaging Methods 0.000 claims description 8
- 238000011176 pooling Methods 0.000 claims description 8
- 238000012546 transfer Methods 0.000 claims description 8
- 230000003213 activating effect Effects 0.000 claims description 4
- 230000004913 activation Effects 0.000 claims description 4
- 238000009826 distribution Methods 0.000 abstract description 28
- 238000013135 deep learning Methods 0.000 abstract description 8
- 238000013473 artificial intelligence Methods 0.000 abstract description 4
- 238000005516 engineering process Methods 0.000 abstract description 4
- 230000008569 process Effects 0.000 description 14
- 238000010586 diagram Methods 0.000 description 13
- 238000004590 computer program Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 10
- 238000013528 artificial neural network Methods 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 6
- 230000008901 benefit Effects 0.000 description 4
- 238000013507 mapping Methods 0.000 description 4
- 238000005065 mining Methods 0.000 description 4
- 238000003062 neural network model Methods 0.000 description 4
- 238000012805 post-processing Methods 0.000 description 4
- 238000003860 storage Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000006399 behavior Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000004140 cleaning Methods 0.000 description 2
- 238000005094 computer simulation Methods 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000001739 density measurement Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 230000008034 disappearance Effects 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 238000007792 addition Methods 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/254—Fusion techniques of classification results, e.g. of results related to same input data
- G06F18/256—Fusion techniques of classification results, e.g. of results related to same input data of results relating to different input data, e.g. multimodal recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Strategic Management (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Development Economics (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- Marketing (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Game Theory and Decision Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
一种基于大数据的电子商务决策方法及其***,其获取待推荐用户的历史消费数据,以及,获取待推荐电商产品的描述文本和产品图像;采用基于深度学习的人工智能技术,挖掘所述用户的历史消费数据的语义理解特征与所述电商产品的描述文本语义特征和产品图像特征的关联特征之间的关联性特征分布信息,以此对于消费数据与电商产品在高维空间中的特征对比,从而精准地为用户推荐适宜的电商产品,提高电商产品推荐的效率和准确性,进而提升用户的体验和满意度,扩展营销的可能性。
Description
技术领域
本申请涉及智能化决策技术领域,并且更具体地,涉及一种基于大数据的电子商务决策方法及其***。
背景技术
电子商务相对于传统零售业来说,最大的特点就是都可以通过数据化来监控和改进。通过对于电子商务网站的数据分析,可以看到用户的客源、如何组织产品可以实现很好的转化率、投放广告的效率等。因此,对于电子商务网站的数据分析显得尤为重要。
当用户在电子商务网站上有了购买行为之后,就从潜在客户变成了网站的价值客户。电子商务网站一般都会将用户的交易信息,包括购买时间、购买商品、购买数量、支付金额等信息保存在自己的数据库里面,所以对于这些客户,可以基于网站的运营数据对他们的交易行为进行分析,以估计每位客户的价值,及针对每位客户的扩展营销的可能性。但往往针对性低,导致交易成功率不高。
因此,期待一种优化的电子商务决策方案。
发明内容
为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种基于大数据的电子商务决策方法及其***,其获取待推荐用户的历史消费数据,以及,获取待推荐电商产品的描述文本和产品图像;采用基于深度学习的人工智能技术,挖掘所述用户的历史消费数据的语义理解特征与所述电商产品的描述文本语义特征和产品图像特征的关联特征之间的关联性特征分布信息,以此对于消费数据与电商产品在高维空间中的特征对比,从而精准地为用户推荐适宜的电商产品,提高电商产品推荐的效率和准确性,进而提升用户的体验和满意度,扩展营销的可能性。
第一方面,提供了一种基于大数据的电子商务决策方法,其包括:获取待推荐用户的历史消费数据,以及,获取待推荐电商产品的描述文本和产品图像;对所述待推荐用户的历史消费数据进行预处理以得到预处理后历史消费数据;将所述预处理后历史消费数据经分词处理后通过词嵌入层以得到多个消费词嵌入向量;将所述多个消费词嵌入向量通过包含双向LSTM模型和RNN模型的双管线语义理解器以得到多尺度消费数据语义理解特征向量;将所述待推荐电商产品的描述文本和产品图像通过包含序列编码器和图像编码器的CLIP模型以得到待推荐产品特征矩阵;对所述待推荐产品特征矩阵和所述多尺度消费数据语义理解特征向量进行关联编码以得到分类特征向量;对所述分类特征向量进行高斯概率密度的流形曲面的基准线网化以得到优化分类特征向量;以及
将所述优化分类特征向量通过分类器以得到分类结果,所述分类结果用于表示是否推荐所述待推荐电商产品给所述待推荐用户。
在上述基于大数据的电子商务决策方法中,将所述多个消费词嵌入向量通过包含双向LSTM模型和RNN模型的双管线语义理解器以得到多尺度消费数据语义理解特征向量,包括:将所述多个消费词嵌入向量输入所述双管线语义理解器的双向LSTM模型以得到第一尺度消费数据语义理解特征向量;将所述多个消费词嵌入向量输入所述双管线语义理解器的RNN模型以得到第二尺度消费数据语义理解特征向量;以及,将所述第一尺度消费数据语义理解特征向量和所述第二尺度消费数据语义理解特征向量进行级联以得到所述多尺度消费数据语义理解特征向量。
在上述基于大数据的电子商务决策方法中,将所述待推荐电商产品的描述文本和产品图像通过包含序列编码器和图像编码器的CLIP模型以得到待推荐产品特征矩阵,包括:使用所述CLIP模型的图像编码器对所述产品图像进行处理以得到图像特征向量;使用所述CLIP模型的序列编码器对所述待推荐电商产品的描述文本进行处理以得到文本特征向量;以及,使用所述CLIP模型的联合编码器来基于所述文本特征向量,对所述图像特征向量进行图像属性编码优化以得到所述待推荐产品特征矩阵。
在上述基于大数据的电子商务决策方法中,使用所述CLIP模型的序列编码器对所述待推荐电商产品的描述文本进行处理以得到文本特征向量,包括:使用所述CLIP模型的序列编码器的各层在层的正向传递中分别对输入数据进行卷积处理、基于特征矩阵的均值池化处理和激活处理以由所述CLIP模型的序列编码器的最后一层的输出为所述文本特征向量,其中,所述CLIP模型的序列编码器的第一层的输入为所述待推荐电商产品的描述文本。
在上述基于大数据的电子商务决策方法中,使用所述CLIP模型的图像编码器对所述产品图像进行处理以得到图像特征向量,包括:使用所述CLIP模型的图像编码器的各层在层的正向传递中对输入数据分别进行卷积处理、基于特征矩阵的均值池化处理和非线性激活处理以由所述CLIP模型的图像编码器的最后一层输出所述图像特征向量,其中,所述CLIP模型的图像编码器的第一层的输入为所述产品图像。
在上述基于大数据的电子商务决策方法中,对所述待推荐产品特征矩阵和所述多尺度消费数据语义理解特征向量进行关联编码以得到分类特征向量,包括:以如下关联公式对所述待推荐产品特征矩阵和所述多尺度消费数据语义理解特征向量进行关联编码以得到分类特征向量;其中,所述关联公式为:其中,/>表示所述待推荐产品特征矩阵,/>表示所述多尺度消费数据语义理解特征向量,/>表示所述分类特征向量,/>表示向量相乘。
在上述基于大数据的电子商务决策方法中,对所述分类特征向量进行高斯概率密度的流形曲面的基准线网化以得到优化分类特征向量,包括:以如下优化公式对所述分类特征向量进行高斯概率密度的流形曲面的基准线网化以得到所述优化分类特征向量;其中,所述优化公式为:其中,/>是所述分类特征向量的第/>个位置的特征值,/>和/>是所述分类特征向量的各个位置特征值集合的均值和标准差,且/>是所述优化分类特征向量的第/>个位置的特征值。
在上述基于大数据的电子商务决策方法中,将所述优化分类特征向量通过分类器以得到分类结果,所述分类结果用于表示是否推荐所述待推荐电商产品给所述待推荐用户,包括:使用所述分类器的多个全连接层对所述优化分类特征向量进行全连接编码以得到编码分类特征向量;以及,将所述编码分类特征向量通过所述分类器的Softmax分类函数以得到所述分类结果。
第二方面,提供了一种基于大数据的电子商务决策***,其包括:数据获取模块,用于获取待推荐用户的历史消费数据,以及,获取待推荐电商产品的描述文本和产品图像;预处理模块,用于对所述待推荐用户的历史消费数据进行预处理以得到预处理后历史消费数据;分词模块,用于将所述预处理后历史消费数据经分词处理后通过词嵌入层以得到多个消费词嵌入向量;双管线语义理解模块,用于将所述多个消费词嵌入向量通过包含双向LSTM模型和RNN模型的双管线语义理解器以得到多尺度消费数据语义理解特征向量;CLIP模型编码模块,用于将所述待推荐电商产品的描述文本和产品图像通过包含序列编码器和图像编码器的CLIP模型以得到待推荐产品特征矩阵;关联编码模块,用于对所述待推荐产品特征矩阵和所述多尺度消费数据语义理解特征向量进行关联编码以得到分类特征向量;优化模块,用于对所述分类特征向量进行高斯概率密度的流形曲面的基准线网化以得到优化分类特征向量;以及
推荐结果生成模块,用于将所述优化分类特征向量通过分类器以得到分类结果,所述分类结果用于表示是否推荐所述待推荐电商产品给所述待推荐用户。
在上述基于大数据的电子商务决策***中,所述双管线语义理解模块,包括:第一尺度单元,用于将所述多个消费词嵌入向量输入所述双管线语义理解器的双向LSTM模型以得到第一尺度消费数据语义理解特征向量;第二尺度单元,用于将所述多个消费词嵌入向量输入所述双管线语义理解器的RNN模型以得到第二尺度消费数据语义理解特征向量;以及,级联单元,用于将所述第一尺度消费数据语义理解特征向量和所述第二尺度消费数据语义理解特征向量进行级联以得到所述多尺度消费数据语义理解特征向量。
与现有技术相比,本申请提供的基于大数据的电子商务决策方法及其***,其获取待推荐用户的历史消费数据,以及,获取待推荐电商产品的描述文本和产品图像;采用基于深度学习的人工智能技术,挖掘所述用户的历史消费数据的语义理解特征与所述电商产品的描述文本语义特征和产品图像特征的关联特征之间的关联性特征分布信息,以此对于消费数据与电商产品在高维空间中的特征对比,从而精准地为用户推荐适宜的电商产品,提高电商产品推荐的效率和准确性,进而提升用户的体验和满意度,扩展营销的可能性。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为根据本申请实施例的基于大数据的电子商务决策方法的场景示意图。
图2为根据本申请实施例的基于大数据的电子商务决策方法的流程图。
图3为根据本申请实施例的基于大数据的电子商务决策方法的架构示意图。
图4为根据本申请实施例的基于大数据的电子商务决策方法中步骤140的子步骤的流程图。
图5为根据本申请实施例的基于大数据的电子商务决策方法中步骤150的子步骤的流程图。
图6为根据本申请实施例的基于大数据的电子商务决策方法中步骤180的子步骤的流程图。
图7为根据本申请实施例的基于大数据的电子商务决策***的框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
除非另有说明,本申请实施例所使用的所有技术和科学术语与本申请的技术领域的技术人员通常理解的含义相同。本申请中所使用的术语只是为了描述具体的实施例的目的,不是旨在限制本申请的范围。
在本申请实施例记载中,需要说明的是,除非另有说明和限定,术语“连接”应做广义理解,例如,可以是电连接,也可以是两个元件内部的连通,可以是直接相连,也可以通过中间媒介间接相连,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语的具体含义。
需要说明的是,本申请实施例所涉及的术语“第一\第二\第三”仅仅是是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序。应该理解“第一\第二\第三”区分的对象在适当情况下可以互换,以使这里描述的本申请的实施例可以除了在这里图示或描述的那些以外的顺序实施。
如上所述,电子商务网站一般都会将用户的交易信息,包括购买时间、购买商品、购买数量、支付金额等信息保存在自己的数据库里面,所以对于这些客户,可以基于网站的运营数据对他们的交易行为进行分析,以估计每位客户的价值,及针对每位客户的扩展营销的可能性。但往往针对性低,导致交易成功率不高。因此,期待一种优化的电子商务决策方案。
相应地,考虑到在实际进行电子商务营销决策的过程中,为了提高交易成功率,需要基于用户的历史消费数据语义特征和电商产品的隐含特征进行特征对比分析,从而进行电商产品的推送,以此来扩展营销的可能性。但是,由于所述用户的历史消费数据中存在有较多的无效、重复、错误、缺失数据,难以精准地进行所述用户的历史消费数据的语义理解,并且所述电商产品具有描述文本的语义特征信息和产品图像特征信息,也使得对于电商产品的隐含特征分析的精确度较低,从而影响了推荐的精准度。因此,在此过程中,难点在于如何挖掘所述用户的历史消费数据的语义理解特征与所述电商产品的描述文本语义特征和产品图像特征的关联特征之间的关联性特征分布信息,以此来对于消费数据与电商产品在高维空间中的特征对比,从而精准地为用户推荐适宜的电商产品,提高电商产品推荐的效率和准确性,进而提升用户的体验和满意度,扩展营销的可能性。
近年来,深度学习以及神经网络已经广泛应用于计算机视觉、自然语言处理、文本信号处理等领域。深度学习以及神经网络的发展为挖掘所述用户的历史消费数据的语义理解特征与所述电商产品的描述文本语义特征和产品图像特征的关联特征之间的关联性特征分布信息提供了新的解决思路和方案。
具体地,在本申请的技术方案中,首先,获取待推荐用户的历史消费数据,以及,获取待推荐电商产品的描述文本和产品图像。应可以理解,所述待推荐用户的历史消费数据中可能存在有无效、重复、错误、缺失的数据,导致后续在进行语义理解时出现误差,从而影响后续进行电子商务的产品推荐。因此,为了提高数据质量并使其更有利于后续算法的运用,需要对所述待推荐用户的历史消费数据进行一系列的预处理操作,如数据清洗、去重、归一化、编码等处理,以得到符合需求的预处理后历史消费数据。也就是说,采用预处理后的所述历史消费数据可以有效避免原始数据带来的干扰,减少噪声对后续分析的影响,提高算法的精度和稳定性。
然后,考虑到由于所述预处理后历史消费数据是由多个词组成的,并且各个词之间具有着上下文的语义关联关系。因此,为了能够对于所述预处理后历史消费数据进行语义理解,需要将所述预处理后历史消费数据经分词处理以避免词序混乱后,将其再通过词嵌入层以得到多个消费词嵌入向量。应可以理解,使用嵌入层将分词处理后的所述预处理后历史消费数据映射到嵌入向量以得到多个消费词嵌入向量,能够利用消费交易数据的专业术语语义特征的知识图谱来进行构建以使得在将分词处理后的所述预处理后历史消费数据映射到嵌入向量的过程中引入消费交易数据的专业术语语义特征的先验信息。
进一步地,为了能够进行所述待推荐用户的历史消费数据的语义特征的充分表达,在本申请的技术方案中,进一步再将所述多个消费词嵌入向量通过包含双向LSTM模型和RNN模型的双管线语义理解器以得到多尺度消费数据语义理解特征向量。
更具体地,首先,将所述多个消费词嵌入向量通过所述双向LSTM模型以得到第一尺度消费数据语义理解特征向量。应可以理解,所述双向LSTM模型通过增加输入门、输出门和遗忘门,使得神经网络的权重能够自我更新,在网络模型参数固定的情况下,不同通道的权重尺度可以动态改变,从而能够避免梯度消失或者梯度膨胀的问题。特别地,所述双向长短期记忆神经网络模型是由前向LSTM与后向LSTM组合而成,前向LSTM可以学习到前面局部区域的历史消费数据的语义关联特征信息而后向LSTM可以学习到后续局部区域的历史消费数据的语义关联特征信息,因此,通过所述双向长短期记忆神经网络模型获得的所述第一尺度消费数据语义理解特征向量学习到了各个局部区域的检测图像的中等距离依赖的隐含关联特征信息。
接着,将所述多个消费词嵌入向量通过所述RNN模型以得到第二尺度消费数据语义理解特征向量。应可以理解,通过使用RNN神经网络能够在进行所述待推荐用户的历史消费数据的语义理解时对于所述各个词之间的基于短距离依赖的关联性语义特征进行有效地提取,以此来充分对于所述待推荐用户的历史消费数据进行语义理解。继而,再融合所述第一尺度消费数据语义理解特征向量和第二尺度消费数据语义理解特征向量,以融合所述待推荐用户的历史消费数据的中短距离依赖关联特征的上下文语义理解特征信息,从而得到多尺度消费数据语义理解特征向量。
对于所述待推荐电商产品来说,其包括有所述待推荐电商产品的描述文本和产品图像,因此,为了能够进行所述待推荐电商产品的隐含特征提取,不仅需要对于所述电商产品的描述文本进行语义理解,还需要对其产品图像进行隐含特征挖掘。因此,在本申请的技术方案中,将所述待推荐电商产品的描述文本和产品图像通过包含序列编码器和图像编码器的CLIP模型以得到待推荐产品特征矩阵。特别地,这里,所述序列编码器能够提出所述待推荐电商产品的描述文本的语义理解特征信息,所述图像编码器能够提取出所述产品图像的隐含特征分布信息。再通过所述CLIP模型的联合编码器来进行两者的特征融合,就能够利用所述待推荐电商产品的描述文本的语义理解特征信息来对所述产品图像的隐含特征分布信息进行图像属性编码优化,从而得到所述待推荐产品特征矩阵。
进一步地,对所述待推荐产品特征矩阵和所述多尺度消费数据语义理解特征向量进行关联编码,以此来融合所述用户的历史消费数据的语义理解特征信息与所述电商产品的描述文本语义特征和产品图像特征的关联特征信息,从而得到具有两者关联性特征分布信息的分类特征向量。接着,再将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示是否推荐所述待推荐电商产品给所述待推荐用户。
也就是,在本申请的技术方案中,所述分类器的标签包括推荐所述待推荐电商产品给所述待推荐用户(第一标签),以及,不推荐所述待推荐电商产品给所述待推荐用户(第二标签),其中,所述分类器通过软最大值函数来确定所述分类特征向量属于哪个分类标签。值得注意的是,这里的所述第一标签p1和所述第二标签p2并不包含人为设定的概念,实际上在训练过程当中,计算机模型并没有“是否推荐所述待推荐电商产品给所述待推荐用户”这种概念,其只是有两种分类标签且输出特征在这两个分类标签下的概率,即p1和p2之和为一。因此,是否推荐所述待推荐电商产品给所述待推荐用户的分类结果实际上是通过分类标签转化为符合自然规律的二分类的类概率分布,实质上用到的是标签的自然概率分布的物理意义,而不是“是否推荐所述待推荐电商产品给所述待推荐用户”的语言文本意义。应可以理解,在本申请的技术方案中,所述分类器的分类标签为是否推荐所述待推荐电商产品给所述待推荐用户的控制策略标签,因此,在得到所述分类结果后,可基于所述分类结果来为用户推荐适宜的电商产品,以提高电商产品推荐的效率和准确性。
特别地,在本申请的技术方案中,在对所述待推荐产品特征矩阵和所述多尺度消费数据语义理解特征向量进行关联编码得到所述分类特征向量时,是将所述待推荐产品特征矩阵表达的所述待推荐电商产品的文本序列特征图像语义特征的关联特征分布与所述多尺度消费数据语义理解特征向量表达的历史消费数据的多尺度语义关联特征分布相关联。但是,考虑到所述待推荐产品特征矩阵和所述多尺度消费数据语义理解特征向量的源数据的异质性所带来的特征表示间的区别,其在分类器的类概率表达上也存在概率密度差异,因此关联得到的所述分类特征向量在分类器的类概率密度空间内的收敛性也会较差,影响其通过分类器得到的分类结果的准确性。
因此,本申请的申请人对所述分类特征向量进行高斯概率密度的流形曲面的基准线网化,具体表示为:/>其中/>和/>是特征值集合/>的均值和标准差,且/>是优化后的所述分类特征向量的第/>个位置的特征值。
这里,所述高斯概率密度的流形曲面的基准线网化以所述分类特征向量的高维特征集合的统计特性,即均值和标准差作为概率密度度量的基准锚点,通过沿着流形曲面的局部线性嵌入方向进行线网化,以获得局部概率密度极值的邻域网络的低维约束表达,从而通过重构流形曲面的概率密度表达来基于邻域分布地约束高维特征的局部分布的基于基准的相对空间位置关系,这样,就提升了所述分类特征向量的高维特征的类概率密度的空间收敛性,也就是,提升了所述分类特征向量在概率密度空间内的概率密度表达的一致性,改进了所述分类特征向量通过分类器得到的分类结果的准确性。这样,能够精准地为用户推荐适宜的电商产品,提高电商产品推荐的效率和准确性,进而提升用户的体验和满意度,扩展营销的可能性。
图1为根据本申请实施例的基于大数据的电子商务决策方法的场景示意图。如图1所示,在该应用场景中,首先,获取待推荐用户的历史消费数据(例如,如图1中所示意的C1),以及,获取待推荐电商产品的描述文本和产品图像(例如,如图1中所示意的C2);然后,将获取的历史消费数、描述文本和产品图像输入至部署有基于大数据的电子商务决策算法的服务器(例如,如图1中所示意的S)中,其中所述服务器能够基于大数据的电子商务决策算法对所述历史消费数、所述描述文本和产品图像进行处理,以生成用于表示是否推荐所述待推荐电商产品给所述待推荐用户的分类结果。
在介绍了本申请的基本原理之后,下面将参考附图来具体介绍本申请的各种非限制性实施例。
在本申请的一个实施例中,图2为根据本申请实施例的基于大数据的电子商务决策方法的流程图。如图2所示,根据本申请实施例的基于大数据的电子商务决策方法100,包括:110,获取待推荐用户的历史消费数据,以及,获取待推荐电商产品的描述文本和产品图像;120,对所述待推荐用户的历史消费数据进行预处理以得到预处理后历史消费数据;130,将所述预处理后历史消费数据经分词处理后通过词嵌入层以得到多个消费词嵌入向量;140,将所述多个消费词嵌入向量通过包含双向LSTM模型和RNN模型的双管线语义理解器以得到多尺度消费数据语义理解特征向量;150,将所述待推荐电商产品的描述文本和产品图像通过包含序列编码器和图像编码器的CLIP模型以得到待推荐产品特征矩阵;160,对所述待推荐产品特征矩阵和所述多尺度消费数据语义理解特征向量进行关联编码以得到分类特征向量;170,对所述分类特征向量进行高斯概率密度的流形曲面的基准线网化以得到优化分类特征向量;以及,180,将所述优化分类特征向量通过分类器以得到分类结果,所述分类结果用于表示是否推荐所述待推荐电商产品给所述待推荐用户。
图3为根据本申请实施例的基于大数据的电子商务决策方法的架构示意图。如图3所示,在该网络架构中,首先,获取待推荐用户的历史消费数据,以及,获取待推荐电商产品的描述文本和产品图像;然后,对所述待推荐用户的历史消费数据进行预处理以得到预处理后历史消费数据;接着,将所述预处理后历史消费数据经分词处理后通过词嵌入层以得到多个消费词嵌入向量;然后,将所述多个消费词嵌入向量通过包含双向LSTM模型和RNN模型的双管线语义理解器以得到多尺度消费数据语义理解特征向量;接着,将所述待推荐电商产品的描述文本和产品图像通过包含序列编码器和图像编码器的CLIP模型以得到待推荐产品特征矩阵;然后,对所述待推荐产品特征矩阵和所述多尺度消费数据语义理解特征向量进行关联编码以得到分类特征向量;接着,对所述分类特征向量进行高斯概率密度的流形曲面的基准线网化以得到优化分类特征向量;以及,最后,将所述优化分类特征向量通过分类器以得到分类结果,所述分类结果用于表示是否推荐所述待推荐电商产品给所述待推荐用户。
具体地,在步骤110中,获取待推荐用户的历史消费数据,以及,获取待推荐电商产品的描述文本和产品图像。如上所述,电子商务网站一般都会将用户的交易信息,包括购买时间、购买商品、购买数量、支付金额等信息保存在自己的数据库里面,所以对于这些客户,可以基于网站的运营数据对他们的交易行为进行分析,以估计每位客户的价值,及针对每位客户的扩展营销的可能性。但往往针对性低,导致交易成功率不高。因此,期待一种优化的电子商务决策方案。
相应地,考虑到在实际进行电子商务营销决策的过程中,为了提高交易成功率,需要基于用户的历史消费数据语义特征和电商产品的隐含特征进行特征对比分析,从而进行电商产品的推送,以此来扩展营销的可能性。但是,由于所述用户的历史消费数据中存在有较多的无效、重复、错误、缺失数据,难以精准地进行所述用户的历史消费数据的语义理解,并且所述电商产品具有描述文本的语义特征信息和产品图像特征信息,也使得对于电商产品的隐含特征分析的精确度较低,从而影响了推荐的精准度。因此,在此过程中,难点在于如何挖掘所述用户的历史消费数据的语义理解特征与所述电商产品的描述文本语义特征和产品图像特征的关联特征之间的关联性特征分布信息,以此来对于消费数据与电商产品在高维空间中的特征对比,从而精准地为用户推荐适宜的电商产品,提高电商产品推荐的效率和准确性,进而提升用户的体验和满意度,扩展营销的可能性。
近年来,深度学习以及神经网络已经广泛应用于计算机视觉、自然语言处理、文本信号处理等领域。深度学习以及神经网络的发展为挖掘所述用户的历史消费数据的语义理解特征与所述电商产品的描述文本语义特征和产品图像特征的关联特征之间的关联性特征分布信息提供了新的解决思路和方案。
具体地,在本申请的技术方案中,首先,获取待推荐用户的历史消费数据,以及,获取待推荐电商产品的描述文本和产品图像。
具体地,在步骤120中,对所述待推荐用户的历史消费数据进行预处理以得到预处理后历史消费数据。应可以理解,所述待推荐用户的历史消费数据中可能存在有无效、重复、错误、缺失的数据,导致后续在进行语义理解时出现误差,从而影响后续进行电子商务的产品推荐。因此,为了提高数据质量并使其更有利于后续算法的运用,需要对所述待推荐用户的历史消费数据进行一系列的预处理操作,如数据清洗、去重、归一化、编码等处理,以得到符合需求的预处理后历史消费数据。也就是说,采用预处理后的所述历史消费数据可以有效避免原始数据带来的干扰,减少噪声对后续分析的影响,提高算法的精度和稳定性。
具体地,在步骤130中,将所述预处理后历史消费数据经分词处理后通过词嵌入层以得到多个消费词嵌入向量。然后,考虑到由于所述预处理后历史消费数据是由多个词组成的,并且各个词之间具有着上下文的语义关联关系。因此,为了能够对于所述预处理后历史消费数据进行语义理解,需要将所述预处理后历史消费数据经分词处理以避免词序混乱后,将其再通过词嵌入层以得到多个消费词嵌入向量。应可以理解,使用嵌入层将分词处理后的所述预处理后历史消费数据映射到嵌入向量以得到多个消费词嵌入向量,能够利用消费交易数据的专业术语语义特征的知识图谱来进行构建以使得在将分词处理后的所述预处理后历史消费数据映射到嵌入向量的过程中引入消费交易数据的专业术语语义特征的先验信息。
具体地,在步骤140中,将所述多个消费词嵌入向量通过包含双向LSTM模型和RNN模型的双管线语义理解器以得到多尺度消费数据语义理解特征向量。进一步地,为了能够进行所述待推荐用户的历史消费数据的语义特征的充分表达,在本申请的技术方案中,进一步再将所述多个消费词嵌入向量通过包含双向LSTM模型和RNN模型的双管线语义理解器以得到多尺度消费数据语义理解特征向量。
更具体地,首先,将所述多个消费词嵌入向量通过所述双向LSTM模型以得到第一尺度消费数据语义理解特征向量。应可以理解,所述双向LSTM模型通过增加输入门、输出门和遗忘门,使得神经网络的权重能够自我更新,在网络模型参数固定的情况下,不同通道的权重尺度可以动态改变,从而能够避免梯度消失或者梯度膨胀的问题。特别地,所述双向长短期记忆神经网络模型是由前向LSTM与后向LSTM组合而成,前向LSTM可以学习到前面局部区域的历史消费数据的语义关联特征信息而后向LSTM可以学习到后续局部区域的历史消费数据的语义关联特征信息,因此,通过所述双向长短期记忆神经网络模型获得的所述第一尺度消费数据语义理解特征向量学习到了各个局部区域的检测图像的中等距离依赖的隐含关联特征信息。
接着,将所述多个消费词嵌入向量通过所述RNN模型以得到第二尺度消费数据语义理解特征向量。应可以理解,通过使用RNN神经网络能够在进行所述待推荐用户的历史消费数据的语义理解时对于所述各个词之间的基于短距离依赖的关联性语义特征进行有效地提取,以此来充分对于所述待推荐用户的历史消费数据进行语义理解。继而,再融合所述第一尺度消费数据语义理解特征向量和第二尺度消费数据语义理解特征向量,以融合所述待推荐用户的历史消费数据的中短距离依赖关联特征的上下文语义理解特征信息,从而得到多尺度消费数据语义理解特征向量。
图4为根据本申请实施例的基于大数据的电子商务决策方法中步骤140的子步骤的流程图,如图4所示,将所述多个消费词嵌入向量通过包含双向LSTM模型和RNN模型的双管线语义理解器以得到多尺度消费数据语义理解特征向量,包括:141,将所述多个消费词嵌入向量输入所述双管线语义理解器的双向LSTM模型以得到第一尺度消费数据语义理解特征向量;142,将所述多个消费词嵌入向量输入所述双管线语义理解器的RNN模型以得到第二尺度消费数据语义理解特征向量;以及,143,将所述第一尺度消费数据语义理解特征向量和所述第二尺度消费数据语义理解特征向量进行级联以得到所述多尺度消费数据语义理解特征向量。
具体地,在步骤150中,将所述待推荐电商产品的描述文本和产品图像通过包含序列编码器和图像编码器的CLIP模型以得到待推荐产品特征矩阵。对于所述待推荐电商产品来说,其包括有所述待推荐电商产品的描述文本和产品图像,因此,为了能够进行所述待推荐电商产品的隐含特征提取,不仅需要对于所述电商产品的描述文本进行语义理解,还需要对其产品图像进行隐含特征挖掘。
因此,在本申请的技术方案中,将所述待推荐电商产品的描述文本和产品图像通过包含序列编码器和图像编码器的CLIP模型以得到待推荐产品特征矩阵。特别地,这里,所述序列编码器能够提出所述待推荐电商产品的描述文本的语义理解特征信息,所述图像编码器能够提取出所述产品图像的隐含特征分布信息。再通过所述CLIP模型的联合编码器来进行两者的特征融合,就能够利用所述待推荐电商产品的描述文本的语义理解特征信息来对所述产品图像的隐含特征分布信息进行图像属性编码优化,从而得到所述待推荐产品特征矩阵。
图5为根据本申请实施例的基于大数据的电子商务决策方法中步骤150的子步骤的流程图,如图5所示,将所述待推荐电商产品的描述文本和产品图像通过包含序列编码器和图像编码器的CLIP模型以得到待推荐产品特征矩阵,包括:151,使用所述CLIP模型的图像编码器对所述产品图像进行处理以得到图像特征向量;152,使用所述CLIP模型的序列编码器对所述待推荐电商产品的描述文本进行处理以得到文本特征向量;以及,153,使用所述CLIP模型的联合编码器来基于所述文本特征向量,对所述图像特征向量进行图像属性编码优化以得到所述待推荐产品特征矩阵。
其中,使用所述CLIP模型的序列编码器对所述待推荐电商产品的描述文本进行处理以得到文本特征向量,包括:使用所述CLIP模型的序列编码器的各层在层的正向传递中分别对输入数据进行卷积处理、基于特征矩阵的均值池化处理和激活处理以由所述CLIP模型的序列编码器的最后一层的输出为所述文本特征向量,其中,所述CLIP模型的序列编码器的第一层的输入为所述待推荐电商产品的描述文本。
进一步地,使用所述CLIP模型的图像编码器对所述产品图像进行处理以得到图像特征向量,包括:使用所述CLIP模型的图像编码器的各层在层的正向传递中对输入数据分别进行卷积处理、基于特征矩阵的均值池化处理和非线性激活处理以由所述CLIP模型的图像编码器的最后一层输出所述图像特征向量,其中,所述CLIP模型的图像编码器的第一层的输入为所述产品图像。
具体地,在步骤160中,对所述待推荐产品特征矩阵和所述多尺度消费数据语义理解特征向量进行关联编码以得到分类特征向量。进一步地,对所述待推荐产品特征矩阵和所述多尺度消费数据语义理解特征向量进行关联编码,以此来融合所述用户的历史消费数据的语义理解特征信息与所述电商产品的描述文本语义特征和产品图像特征的关联特征信息,从而得到具有两者关联性特征分布信息的分类特征向量。接着,再将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示是否推荐所述待推荐电商产品给所述待推荐用户。
其中,对所述待推荐产品特征矩阵和所述多尺度消费数据语义理解特征向量进行关联编码以得到分类特征向量,包括:以如下关联公式对所述待推荐产品特征矩阵和所述多尺度消费数据语义理解特征向量进行关联编码以得到分类特征向量;其中,所述关联公式为:其中,/>表示所述待推荐产品特征矩阵,/>表示所述多尺度消费数据语义理解特征向量,/>表示所述分类特征向量,/>表示向量相乘。
具体地,在步骤170中,对所述分类特征向量进行高斯概率密度的流形曲面的基准线网化以得到优化分类特征向量。特别地,在本申请的技术方案中,在对所述待推荐产品特征矩阵和所述多尺度消费数据语义理解特征向量进行关联编码得到所述分类特征向量时,是将所述待推荐产品特征矩阵表达的所述待推荐电商产品的文本序列特征图像语义特征的关联特征分布与所述多尺度消费数据语义理解特征向量表达的历史消费数据的多尺度语义关联特征分布相关联。但是,考虑到所述待推荐产品特征矩阵和所述多尺度消费数据语义理解特征向量的源数据的异质性所带来的特征表示间的区别,其在分类器的类概率表达上也存在概率密度差异,因此关联得到的所述分类特征向量在分类器的类概率密度空间内的收敛性也会较差,影响其通过分类器得到的分类结果的准确性。
因此,本申请的申请人对所述分类特征向量进行高斯概率密度的流形曲面的基准线网化,具体表示为:以如下优化公式对所述分类特征向量进行高斯概率密度的流形曲面的基准线网化以得到所述优化分类特征向量;其中,所述优化公式为:/>其中,/>是所述分类特征向量的第/>个位置的特征值,/>和/>是所述分类特征向量的各个位置特征值集合的均值和标准差,且/>是所述优化分类特征向量的第/>个位置的特征值。
这里,所述高斯概率密度的流形曲面的基准线网化以所述分类特征向量的高维特征集合的统计特性,即均值和标准差作为概率密度度量的基准锚点,通过沿着流形曲面的局部线性嵌入方向进行线网化,以获得局部概率密度极值的邻域网络的低维约束表达,从而通过重构流形曲面的概率密度表达来基于邻域分布地约束高维特征的局部分布的基于基准的相对空间位置关系,这样,就提升了所述分类特征向量的高维特征的类概率密度的空间收敛性,也就是,提升了所述分类特征向量在概率密度空间内的概率密度表达的一致性,改进了所述分类特征向量通过分类器得到的分类结果的准确性。这样,能够精准地为用户推荐适宜的电商产品,提高电商产品推荐的效率和准确性,进而提升用户的体验和满意度,扩展营销的可能性。
具体地,在步骤180中,将所述优化分类特征向量通过分类器以得到分类结果,所述分类结果用于表示是否推荐所述待推荐电商产品给所述待推荐用户。也就是,在本申请的技术方案中,所述分类器的标签包括推荐所述待推荐电商产品给所述待推荐用户(第一标签),以及,不推荐所述待推荐电商产品给所述待推荐用户(第二标签),其中,所述分类器通过软最大值函数来确定所述分类特征向量属于哪个分类标签。
值得注意的是,这里的所述第一标签p1和所述第二标签p2并不包含人为设定的概念,实际上在训练过程当中,计算机模型并没有“是否推荐所述待推荐电商产品给所述待推荐用户”这种概念,其只是有两种分类标签且输出特征在这两个分类标签下的概率,即p1和p2 之和为一。因此,是否推荐所述待推荐电商产品给所述待推荐用户的分类结果实际上是通过分类标签转化为符合自然规律的二分类的类概率分布,实质上用到的是标签的自然概率分布的物理意义,而不是“是否推荐所述待推荐电商产品给所述待推荐用户”的语言文本意义。
应可以理解,在本申请的技术方案中,所述分类器的分类标签为是否推荐所述待推荐电商产品给所述待推荐用户的控制策略标签,因此,在得到所述分类结果后,可基于所述分类结果来为用户推荐适宜的电商产品,以提高电商产品推荐的效率和准确性。
图6为根据本申请实施例的基于大数据的电子商务决策方法中步骤180的子步骤的流程图,如图6所示,将所述优化分类特征向量通过分类器以得到分类结果,所述分类结果用于表示是否推荐所述待推荐电商产品给所述待推荐用户,包括:181,使用所述分类器的多个全连接层对所述优化分类特征向量进行全连接编码以得到编码分类特征向量;以及,182,将所述编码分类特征向量通过所述分类器的Softmax分类函数以得到所述分类结果。
综上,基于本申请实施例的基于大数据的电子商务决策方法100被阐明,其获取待推荐用户的历史消费数据,以及,获取待推荐电商产品的描述文本和产品图像;采用基于深度学习的人工智能技术,挖掘所述用户的历史消费数据的语义理解特征与所述电商产品的描述文本语义特征和产品图像特征的关联特征之间的关联性特征分布信息,以此对于消费数据与电商产品在高维空间中的特征对比,从而精准地为用户推荐适宜的电商产品,提高电商产品推荐的效率和准确性,进而提升用户的体验和满意度,扩展营销的可能性。
在本申请的一个实施例中,图7为根据本申请实施例的基于大数据的电子商务决策***的框图。如图7所示,根据本申请实施例的基于大数据的电子商务决策***200,包括:数据获取模块210,用于获取待推荐用户的历史消费数据,以及,获取待推荐电商产品的描述文本和产品图像;预处理模块220,用于对所述待推荐用户的历史消费数据进行预处理以得到预处理后历史消费数据;分词模块230,用于将所述预处理后历史消费数据经分词处理后通过词嵌入层以得到多个消费词嵌入向量;双管线语义理解模块240,用于将所述多个消费词嵌入向量通过包含双向LSTM模型和RNN模型的双管线语义理解器以得到多尺度消费数据语义理解特征向量;CLIP模型编码模块250,用于将所述待推荐电商产品的描述文本和产品图像通过包含序列编码器和图像编码器的CLIP模型以得到待推荐产品特征矩阵;关联编码模块260,用于对所述待推荐产品特征矩阵和所述多尺度消费数据语义理解特征向量进行关联编码以得到分类特征向量;优化模块270,用于对所述分类特征向量进行高斯概率密度的流形曲面的基准线网化以得到优化分类特征向量;以及,推荐结果生成模块280,用于将所述优化分类特征向量通过分类器以得到分类结果,所述分类结果用于表示是否推荐所述待推荐电商产品给所述待推荐用户。
在一个具体示例中,在上述基于大数据的电子商务决策***中,所述双管线语义理解模块,包括:第一尺度单元,用于将所述多个消费词嵌入向量输入所述双管线语义理解器的双向LSTM模型以得到第一尺度消费数据语义理解特征向量;第二尺度单元,用于将所述多个消费词嵌入向量输入所述双管线语义理解器的RNN模型以得到第二尺度消费数据语义理解特征向量;以及,级联单元,用于将所述第一尺度消费数据语义理解特征向量和所述第二尺度消费数据语义理解特征向量进行级联以得到所述多尺度消费数据语义理解特征向量。
在一个具体示例中,在上述基于大数据的电子商务决策***中,所述CLIP模型编码模块,包括:图像编码单元,用于使用所述CLIP模型的图像编码器对所述产品图像进行处理以得到图像特征向量;序列编码单元,用于使用所述CLIP模型的序列编码器对所述待推荐电商产品的描述文本进行处理以得到文本特征向量;以及,优化单元,用于使用所述CLIP模型的联合编码器来基于所述文本特征向量,对所述图像特征向量进行图像属性编码优化以得到所述待推荐产品特征矩阵。
在一个具体示例中,在上述基于大数据的电子商务决策***中,所述序列编码单元,用于:使用所述CLIP模型的序列编码器的各层在层的正向传递中分别对输入数据进行卷积处理、基于特征矩阵的均值池化处理和激活处理以由所述CLIP模型的序列编码器的最后一层的输出为所述文本特征向量,其中,所述CLIP模型的序列编码器的第一层的输入为所述待推荐电商产品的描述文本。
在一个具体示例中,在上述基于大数据的电子商务决策***中,所述图像编码单元,用于:使用所述CLIP模型的图像编码器的各层在层的正向传递中对输入数据分别进行卷积处理、基于特征矩阵的均值池化处理和非线性激活处理以由所述CLIP模型的图像编码器的最后一层输出所述图像特征向量,其中,所述CLIP模型的图像编码器的第一层的输入为所述产品图像。
在一个具体示例中,在上述基于大数据的电子商务决策***中,所述关联编码模块,用于:以如下关联公式对所述待推荐产品特征矩阵和所述多尺度消费数据语义理解特征向量进行关联编码以得到分类特征向量;其中,所述关联公式为:其中,表示所述待推荐产品特征矩阵,/>表示所述多尺度消费数据语义理解特征向量,/>表示所述分类特征向量,/>表示向量相乘。
在一个具体示例中,在上述基于大数据的电子商务决策***中,所述优化模块,用于 :以如下优化公式对所述分类特征向量进行高斯概率密度的流形曲面的基准线网化以得到所述优化分类特征向量;其中,所述优化公式为:其中,/>是所述分类特征向量的第/>个位置的特征值,/>和/>是所述分类特征向量的各个位置特征值集合的均值和标准差,且/>是所述优化分类特征向量的第/>个位置的特征值。
在一个具体示例中,在上述基于大数据的电子商务决策***中,所述推荐结果生成模块,包括:编码单元,用于使用所述分类器的多个全连接层对所述优化分类特征向量进行全连接编码以得到编码分类特征向量;以及,分类单元,用于将所述编码分类特征向量通过所述分类器的Softmax分类函数以得到所述分类结果。
这里,本领域技术人员可以理解,上述基于大数据的电子商务决策***中的各个单元和模块的具体功能和操作已经在上面参考图1到图6的基于大数据的电子商务决策方法的描述中得到了详细介绍,并因此,将省略其重复描述。
如上所述,根据本申请实施例的基于大数据的电子商务决策***200可以实现在各种终端设备中,例如用于基于大数据的电子商务决策的服务器等。在一个示例中,根据本申请实施例的基于大数据的电子商务决策***200可以作为一个软件模块和/或硬件模块而集成到终端设备中。例如,该基于大数据的电子商务决策***200可以是该终端设备的操作***中的一个软件模块,或者可以是针对于该终端设备所开发的一个应用程序;当然,该基于大数据的电子商务决策***200同样可以是该终端设备的众多硬件模块之一。
替换地,在另一示例中,该基于大数据的电子商务决策***200与该终端设备也可以是分立的设备,并且基于大数据的电子商务决策***200可以通过有线和/或无线网络连接到该终端设备,并且按照约定的数据格式来传输交互信息。
本申请还提供了一种计算机程序产品,所述计算机程序产品包括指令,当所述指令被执行时,以使得装置执行对应于上述方法中的操作。
在本申请的一个实施例中,还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述所述方法的计算机程序。
应可以理解,本申请的实施例可提供为方法、***、或计算机程序产品。因此,可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等) 上实施的计算机程序产品的形式。
本申请实施例的方法、***、和计算机程序产品的流程图和/或框图来描述的。应理解可由计算机程序指令实现流程图和/或框图中的每一流程和/或方框、以及流程图和/或框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或框图一个方框或多个方框中指定的功能的步骤。
以上结合具体实施例描述了本申请的基本原理,但是,需要指出的是,在本申请中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本申请的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本申请为必须采用上述具体的细节来实现。
本申请中涉及的器件、装置、设备、***的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、***。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
还需要指出的是,在本申请的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。
提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本申请的范围。因此,本申请不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本申请的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。
Claims (10)
1.一种基于大数据的电子商务决策方法,其特征在于,包括:获取待推荐用户的历史消费数据,以及,获取待推荐电商产品的描述文本和产品图像;对所述待推荐用户的历史消费数据进行预处理以得到预处理后历史消费数据;将所述预处理后历史消费数据经分词处理后通过词嵌入层以得到多个消费词嵌入向量;将所述多个消费词嵌入向量通过包含双向LSTM模型和RNN模型的双管线语义理解器以得到多尺度消费数据语义理解特征向量;将所述待推荐电商产品的描述文本和产品图像通过包含序列编码器和图像编码器的CLIP模型以得到待推荐产品特征矩阵;对所述待推荐产品特征矩阵和所述多尺度消费数据语义理解特征向量进行关联编码以得到分类特征向量;对所述分类特征向量进行高斯概率密度的流形曲面的基准线网化以得到优化分类特征向量;以及将所述优化分类特征向量通过分类器以得到分类结果,所述分类结果用于表示是否推荐所述待推荐电商产品给所述待推荐用户。
2.根据权利要求1所述的基于大数据的电子商务决策方法,其特征在于,将所述多个消费词嵌入向量通过包含双向LSTM模型和RNN模型的双管线语义理解器以得到多尺度消费数据语义理解特征向量,包括:将所述多个消费词嵌入向量输入所述双管线语义理解器的双向LSTM模型以得到第一尺度消费数据语义理解特征向量;将所述多个消费词嵌入向量输入所述双管线语义理解器的RNN模型以得到第二尺度消费数据语义理解特征向量;以及将所述第一尺度消费数据语义理解特征向量和所述第二尺度消费数据语义理解特征向量进行级联以得到所述多尺度消费数据语义理解特征向量。
3.根据权利要求2所述的基于大数据的电子商务决策方法,其特征在于,将所述待推荐电商产品的描述文本和产品图像通过包含序列编码器和图像编码器的CLIP模型以得到待推荐产品特征矩阵,包括:使用所述CLIP模型的图像编码器对所述产品图像进行处理以得到图像特征向量;使用所述CLIP模型的序列编码器对所述待推荐电商产品的描述文本进行处理以得到文本特征向量;以及使用所述CLIP模型的联合编码器来基于所述文本特征向量,对所述图像特征向量进行图像属性编码优化以得到所述待推荐产品特征矩阵。
4.根据权利要求3所述的基于大数据的电子商务决策方法,其特征在于,使用所述CLIP模型的序列编码器对所述待推荐电商产品的描述文本进行处理以得到文本特征向量,包括:使用所述CLIP模型的序列编码器的各层在层的正向传递中分别对输入数据进行卷积处理、基于特征矩阵的均值池化处理和激活处理以由所述CLIP模型的序列编码器的最后一层的输出为所述文本特征向量,其中,所述CLIP模型的序列编码器的第一层的输入为所述待推荐电商产品的描述文本。
5.根据权利要求4所述的基于大数据的电子商务决策方法,其特征在于,使用所述CLIP模型的图像编码器对所述产品图像进行处理以得到图像特征向量,包括:使用所述CLIP模型的图像编码器的各层在层的正向传递中对输入数据分别进行卷积处理、基于特征矩阵的均值池化处理和非线性激活处理以由所述CLIP模型的图像编码器的最后一层输出所述图像特征向量,其中,所述CLIP模型的图像编码器的第一层的输入为所述产品图像。
6.根据权利要求5所述的基于大数据的电子商务决策方法,其特征在于,对所述待推荐产品特征矩阵和所述多尺度消费数据语义理解特征向量进行关联编码以得到分类特征向量,包括:以如下关联公式对所述待推荐产品特征矩阵和所述多尺度消费数据语义理解特征向量进行关联编码以得到分类特征向量;其中,所述关联公式为: 其中,表示所述待推荐产品特征矩阵,/>表示所述多尺度消费数据语义理解特征向量,/>表示所述分类特征向量,/>表示向量相乘。
7.根据权利要求6所述的基于大数据的电子商务决策方法,其特征在于,对所述分类特征向量进行高斯概率密度的流形曲面的基准线网化以得到优化分类特征向量,包括:以如下优化公式对所述分类特征向量进行高斯概率密度的流形曲面的基准线网化以得到所述优化分类特征向量;其中,所述优化公式为:其中,/>是所述分类特征向量的第/>个位置的特征值,/>和/>是所述分类特征向量的各个位置特征值集合的均值和标准差,且/>是所述优化分类特征向量的第/>个位置的特征值。
8.根据权利要求7所述的基于大数据的电子商务决策方法,其特征在于,将所述优化分类特征向量通过分类器以得到分类结果,所述分类结果用于表示是否推荐所述待推荐电商产品给所述待推荐用户,包括:使用所述分类器的多个全连接层对所述优化分类特征向量进行全连接编码以得到编码分类特征向量;以及将所述编码分类特征向量通过所述分类器的Softmax分类函数以得到所述分类结果。
9.一种基于大数据的电子商务决策***,其特征在于,包括:数据获取模块,用于获取待推荐用户的历史消费数据,以及,获取待推荐电商产品的描述文本和产品图像;预处理模块,用于对所述待推荐用户的历史消费数据进行预处理以得到预处理后历史消费数据;分词模块,用于将所述预处理后历史消费数据经分词处理后通过词嵌入层以得到多个消费词嵌入向量;双管线语义理解模块,用于将所述多个消费词嵌入向量通过包含双向LSTM模型和RNN模型的双管线语义理解器以得到多尺度消费数据语义理解特征向量;CLIP模型编码模块,用于将所述待推荐电商产品的描述文本和产品图像通过包含序列编码器和图像编码器的CLIP模型以得到待推荐产品特征矩阵;关联编码模块,用于对所述待推荐产品特征矩阵和所述多尺度消费数据语义理解特征向量进行关联编码以得到分类特征向量;优化模块,用于对所述分类特征向量进行高斯概率密度的流形曲面的基准线网化以得到优化分类特征向量;以及推荐结果生成模块,用于将所述优化分类特征向量通过分类器以得到分类结果,所述分类结果用于表示是否推荐所述待推荐电商产品给所述待推荐用户。
10.根据权利要求9所述的基于大数据的电子商务决策***,其特征在于,所述双管线语义理解模块,包括:第一尺度单元,用于将所述多个消费词嵌入向量输入所述双管线语义理解器的双向LSTM模型以得到第一尺度消费数据语义理解特征向量;第二尺度单元,用于将所述多个消费词嵌入向量输入所述双管线语义理解器的RNN模型以得到第二尺度消费数据语义理解特征向量;以及级联单元,用于将所述第一尺度消费数据语义理解特征向量和所述第二尺度消费数据语义理解特征向量进行级联以得到所述多尺度消费数据语义理解特征向量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310668132.0A CN116629977A (zh) | 2023-06-07 | 2023-06-07 | 基于大数据的电子商务决策方法及其*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310668132.0A CN116629977A (zh) | 2023-06-07 | 2023-06-07 | 基于大数据的电子商务决策方法及其*** |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116629977A true CN116629977A (zh) | 2023-08-22 |
Family
ID=87616963
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310668132.0A Withdrawn CN116629977A (zh) | 2023-06-07 | 2023-06-07 | 基于大数据的电子商务决策方法及其*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116629977A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116777572A (zh) * | 2023-08-25 | 2023-09-19 | 乐麦信息技术(杭州)有限公司 | 基于大数据的电子商务交易管理***及其方法 |
CN117611245A (zh) * | 2023-12-14 | 2024-02-27 | 浙江博观瑞思科技有限公司 | 用于电商运营活动策划的数据分析管理***及方法 |
CN117710006A (zh) * | 2024-01-30 | 2024-03-15 | 深圳市承和润文化传播股份有限公司 | 基于大数据技术的电子商务营销分析***及方法 |
-
2023
- 2023-06-07 CN CN202310668132.0A patent/CN116629977A/zh not_active Withdrawn
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116777572A (zh) * | 2023-08-25 | 2023-09-19 | 乐麦信息技术(杭州)有限公司 | 基于大数据的电子商务交易管理***及其方法 |
CN117611245A (zh) * | 2023-12-14 | 2024-02-27 | 浙江博观瑞思科技有限公司 | 用于电商运营活动策划的数据分析管理***及方法 |
CN117611245B (zh) * | 2023-12-14 | 2024-05-31 | 浙江博观瑞思科技有限公司 | 用于电商运营活动策划的数据分析管理***及方法 |
CN117710006A (zh) * | 2024-01-30 | 2024-03-15 | 深圳市承和润文化传播股份有限公司 | 基于大数据技术的电子商务营销分析***及方法 |
CN117710006B (zh) * | 2024-01-30 | 2024-04-30 | 深圳市承和润文化传播股份有限公司 | 基于大数据技术的电子商务营销分析***及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109903117B (zh) | 一种用于商品推荐的知识图谱处理方法及装置 | |
CN110728541B (zh) | 信息流媒体广告创意推荐方法及装置 | |
CN116629977A (zh) | 基于大数据的电子商务决策方法及其*** | |
CN111444334B (zh) | 数据处理方法、文本识别方法、装置及计算机设备 | |
US20210182680A1 (en) | Processing sequential interaction data | |
Li et al. | Deep heterogeneous autoencoders for collaborative filtering | |
CN114372573B (zh) | 用户画像信息识别方法、装置、计算机设备和存储介质 | |
CN111881671B (zh) | 一种属性词提取方法 | |
CN107169061B (zh) | 一种融合双信息源的文本多标签分类方法 | |
CN112288554B (zh) | 商品推荐方法和装置、存储介质及电子装置 | |
Abinaya et al. | Enhancing top-N recommendation using stacked autoencoder in context-aware recommender system | |
CN114648031A (zh) | 基于双向lstm和多头注意力机制的文本方面级情感识别方法 | |
CN116703506A (zh) | 一种基于多特征融合的电商商品推荐方法及*** | |
Liu | Deep learning in marketing: a review and research agenda | |
CN116757773A (zh) | 服装电子商务销售管理***及其方法 | |
CN112905793A (zh) | 一种基于Bilstm+Attention文本分类的案例推荐方法及*** | |
CN116703523A (zh) | 基于大数据的电子商务***及其方法 | |
CN116910294A (zh) | 一种基于情感分析的图像滤镜生成方法 | |
CN116910621A (zh) | 纺织化纤供应链管理决策支持***及其方法 | |
CN113868542B (zh) | 基于注意力模型的推送数据获取方法、装置、设备及介质 | |
Daradkeh et al. | Lifelong machine learning for topic modeling based on hellinger distance | |
Wu et al. | Mining trajectory patterns with point-of-interest and behavior-of-interest | |
Kim | Time-varying Item Feature Conditional Variational Autoencoder for Collaborative Filtering | |
CN116562760B (zh) | 纺织化纤供应链监管方法及其*** | |
Prasad | Pattern recognition: possible research areas and issues |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20230822 |
|
WW01 | Invention patent application withdrawn after publication |