CN116541607B - 基于商品检索数据分析的智能推荐方法 - Google Patents
基于商品检索数据分析的智能推荐方法 Download PDFInfo
- Publication number
- CN116541607B CN116541607B CN202310806870.7A CN202310806870A CN116541607B CN 116541607 B CN116541607 B CN 116541607B CN 202310806870 A CN202310806870 A CN 202310806870A CN 116541607 B CN116541607 B CN 116541607B
- Authority
- CN
- China
- Prior art keywords
- commodity
- user
- data sequence
- data
- newly added
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 62
- 238000007405 data analysis Methods 0.000 title claims abstract description 14
- 239000011159 matrix material Substances 0.000 claims abstract description 69
- 238000001914 filtration Methods 0.000 claims abstract description 12
- 239000013598 vector Substances 0.000 claims description 48
- 238000004364 calculation method Methods 0.000 claims description 22
- 238000006243 chemical reaction Methods 0.000 claims description 6
- 238000011156 evaluation Methods 0.000 claims description 4
- 238000003064 k means clustering Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 abstract description 4
- 230000006399 behavior Effects 0.000 description 37
- 230000003993 interaction Effects 0.000 description 7
- 238000010606 normalization Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000001502 supplementing effect Effects 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0623—Item investigation
- G06Q30/0625—Directed, with specific intent or strategy
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- General Engineering & Computer Science (AREA)
- Marketing (AREA)
- Economics (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及数据处理技术领域,提出了一种基于商品检索数据分析的智能推荐方法,包括:采集用户多个维度的商品检索数据,得到每个用户的若干商品数据序列;根据每个用户的商品数据序列的聚类结果,获取每个商品数据序列的参考权重,得到每个用户每个维度的购物行为特征,结合商品数据序列得到用户‑商品矩阵中的初始元素值;获取用户的新增数据序列,根据新增数据序列的商品类型与所有商品数据序列,得到新增数据序列的突出程度,结合新增数据序列与商品数据序列之间的相关性,得到更新元素值;根据更新后的用户‑商品矩阵,通过协同滤波算法完成商品智能推荐。本发明旨在解决用户购买商品受多种因素影响而导致推荐结果不准确的问题。
Description
技术领域
本发明涉及数据处理技术领域,具体涉及基于商品检索数据分析的智能推荐方法。
背景技术
随着互联网和电子商务的飞速发展,海量商品信息涌现在用户面前,用户可以从海量商品中选择、购买并进行相关操作,这些过程中产生的数据被称为商品检索数据;商品检索数据通常包括用户查询关键词、浏览记录、购买行为、评价信息等,这些数据反映了用户对商品的需求和兴趣;在如此庞大的信息量面前,如何帮助用户精确地找到他们感兴趣的商品并生成相关推荐列表成为亟待解决的问题。
协同滤波作为一种经典的推荐算法,在实践中取得了良好的应用效果;该方法源于观察到用户在选择商品或服务时,往往会受到与他们相似性兴趣的其他用户的影响,通过分析分析用户之间的相似性以及物品之间的相似性,为目标用户推荐具有相似喜好用户感兴趣的物品或与他们已经喜欢的物品相似的物品;但是在协同滤波算法中需要来构建用户-商品矩阵来表征用户和商品之间的交互信息,该矩阵是协同过滤推荐的基础数据结构,但是该矩阵的初始构建不合理以及更新过程不合理,会使得矩阵出现稀疏问题,进而会得到错误的推荐结果;因此需要获取得到一个准确的初始用户-商品矩阵,同时在不断的加入数据更新过程中,得到准确的用户-商品矩阵,进而保证推荐结果的准确性。
发明内容
本发明提供基于商品检索数据分析的智能推荐方法,以解决现有的用户购买商品受多种因素影响而导致推荐结果不准确的问题,所采用的技术方案具体如下:
本发明一个实施例提供了基于商品检索数据分析的智能推荐方法,该方法包括以下步骤:
采集用户多个维度的商品检索数据,得到每个用户的若干商品数据序列;
根据商品数据序列及每个用户每个维度的购物行为特征,获取用户-商品矩阵中每个元素的初始元素值;
根据新增数据序列的突出程度、商品类型以及商品数据序列,得到加入新的商品检索数据后更新后的用户-商品矩阵;
根据更新后的用户-商品矩阵,通过协同滤波算法生成每个用户的推荐列表,完成商品智能推荐。
进一步的,所述得到每个用户的若干商品数据序列,包括的具体方法为:
多个维度包括关键词、浏览记录、购买行为、评价信息以及购买时间,对除关键词维度之外其他数据进行编码,对关键词进行词向量转换,一组商品检索数据中编码后的数据及转换后的词向量,组成一个商品数据序列,对每个商品检索数据得到商品数据序列。
进一步的,所述用户-商品矩阵中每个元素的初始元素值,具体的获取方法为:
构建用户-商品矩阵,矩阵中不同行表示不同的商品,不同列表示不同的用户,得到用户-商品矩阵的模型;
根据每个用户的商品数据序列的聚类结果,得到每个用户除关键词维度外每个维度的购物行为特征;将第个用户的第/>个商品数据序列对应的元素记为用户-商品矩阵中第/>行第/>列的元素,其初始元素值/>的计算方法为:
其中,表示用户-商品矩阵中第/>行第/>列的元素对应的第/>个用户的第/>个商品数据序列中关键词的词向量与第/>个用户所有商品数据序列中若干相同商品类型的商品数据序列中关键词的词向量之间的余弦相似度均值,/>表示商品数据序列中除关键词维度之外其他维度的数量,/>表示用户-商品矩阵中第/>行第/>列的元素对应的第/>个用户第/>个维度的购物行为特征,/>表示用户-商品矩阵中第/>行第/>列的元素对应的第/>个用户的第/>个商品数据序列中第/>个维度的数据值,/>表示求绝对值,/>表示以自然常数为底数的指数函数;获取每个用户的每个商品数据序列对应元素的初始元素值;
以任意一个没有对应商品数据序列的元素为目标元素,获取目标元素对应的商品及商品类型,并对目标元素对应的商品提取关键词;获取目标元素所在列中对应商品类型与该商品类型之间差异最小的具有初始元素值的元素,记为目标元素的参考元素;得到参考元素对应的商品数据序列,获取该商品数据序列中关键词的词向量,并与目标元素提取到的关键词的词向量进行余弦相似度的计算,将得到的余弦相似度与参考元素的初始元素值相乘,得到的结果作为目标的初始元素值;获取每个没有对应商品数据序列的元素的初始元素值。
进一步的,所述得到每个用户除关键词维度外每个维度的购物行为特征,包括的具体方法为:
根据每个用户的商品数据序列的聚类结果,获取每个用户每个商品数据序列的参考权重,根据参考权重对第个用户除关键词维度外每个维度的数据进行加权求和,得到的加权和值记为第/>个用户除关键词维度外每个维度的购物行为特征;
获取每个用户除关键词维度外每个维度的购物行为特征。
进一步的,所述每个用户每个商品数据序列的参考权重,具体的获取方法为:
对每个用户的若干商品数据序列通过聚类划分到若干聚簇中,第个用户的第/>个商品数据序列的参考权重的计算方法为:
其中,表示第/>个用户的第/>个商品数据序列的参考系数,/>表示第/>个用户的第/>个商品数据序列所在聚簇中商品数据序列的数量占第/>个用户的商品数据序列数量的比例,/>表示第/>个用户的第/>个商品数据序列所在聚簇中任意两个商品数据序列之间的距离均值,/>表示第/>个用户的任意两个商品数据序列之间的距离均值,/>表示第/>个用户的第/>个商品数据序列与所在聚簇的聚类中心之间的距离,/>表示第/>个用户的第/>个商品数据序列所在聚簇中商品数据序列与聚类中心之间的距离最大值,/>表示以自然常数为底数的指数函数;
获取第个用户所有商品数据序列的参考系数,对所有参考系数进行归一化,得到的结果记为第/>个用户每个商品数据序列的参考权重;获取每个用户每个商品数据序列的参考权重。
进一步的,所述对每个用户的若干商品数据序列通过聚类划分到若干聚簇中,包括的具体方法为:
对第个用户的每个商品数据序列获取对应的商品及商品类型,以商品类型为横坐标,购买时间为纵坐标构建坐标系,将第/>个用户的若干商品数据序列转换为坐标系中的坐标点,对坐标点进行K-means聚类,聚类距离采用坐标点之间的欧式距离,K值采用5,其中坐标点之间的欧式距离由时间差异与商品类型差异得到,商品类型之间的差异通过将商品类型进行词向量转换,以词向量之间的DTW距离来表示商品类型之间的差异;将坐标点聚类到若干聚簇中,根据坐标点与商品数据序列的对应关系,将第/>个用户的若干商品数据序列划分到多个聚簇中;对每个用户的若干商品数据序列通过聚类划分到若干聚簇中。
进一步的,所述得到加入新的商品检索数据后更新后的用户-商品矩阵,包括的具体方法为:
对新加入的商品检索数据获取序列,记为新增数据序列,获取新增数据序列对应的商品类型;
对新增数据序列对应的用户-商品矩阵中的元素所在列的元素重新进行初始元素值的计算,将新增数据序列加入到所在列的初始元素值计算过程中,完成对于新增数据序列对应元素所在列的元素值的更新;
将新增数据序列记为,新增数据序列对应用户记为用户/>,获取存在商品数据序列对应商品类型与新增数据序列对应商品类型相同的每个用户与用户/>的关联性;
将存在商品数据序列对应商品类型与新增数据序列对应商品类型相同的第个用户的任意一个与新增数据序列对应商品类型相同的商品数据序列对应的元素记为用户-商品矩阵中第/>行第/>列的元素,更新元素值/>的计算方法为:
其中,表示用户-商品矩阵中第/>行第/>列的元素的初始元素值,表示用户/>与第/>个用户的关联性;
对每个与新增数据序列对应商品类型相同的商品数据序列对应的元素获取更新元素值;完成在新加入商品检索数据后对用户-商品矩阵的更新,得到更新后的用户-商品矩阵。
进一步的,所述存在商品数据序列对应商品类型与新增数据序列对应商品类型相同的每个用户与用户的关联性,具体的获取方法为:
根据商品类型得到新增数据序列的突出程度,存在商品数据序列对应商品类型与新增数据序列对应商品类型相同的第/>个用户与用户/>的关联性/>的计算方法为:
其中,表示新增数据序列的突出程度,/>表示新增数据序列中关键词的词向量中元素数量,/>表示所有商品数据序列中关键词的词向量中元素数量最大值,/>表示存在商品数据序列对应商品类型与新增数据序列/>对应商品类型相同的第/>个用户的商品数据序列的数量,/>表示第/>个用户的第/>个商品数据序列的参考权重,/>表示新增数据序列/>中关键词的词向量与第/>个用户的第/>个商品数据序列中关键词的词向量之间的余弦相似度;
获取存在商品数据序列对应商品类型与新增数据序列对应商品类型相同的每个用户与用户的关联性。
进一步的,所述根据商品类型得到新增数据序列的突出程度,包括的具体方法为:
新增数据序列的突出程度/>的计算方法为:
其中,表示已有的商品数据序列数量,/>表示新增数据序列对应商品类型中已有的商品数据序列数量。
本发明的有益效果是:本发明通过协同滤波算法进行推荐,其中根据每个用户本身的购物行为特征来确定,并结合用户购物行为特征以及商品的相似性获取用户-商品矩阵的初始元素值,在获取购物行为特征过程中获取商品数据序列的参考权重值,采用加权平均的方式获取每个维度的购物行为特征,避免短时效性的购物行为对购物行为特征造成过多影响;通过计算新增数据序列对于初始的用户-商品矩阵的元素值的影响,进行数据更新,进而得到准确的用户-商品矩阵;避免了传统的协同滤波推荐算法过程中,由于初始构建不合理以及更新过程不合理,导致矩阵出现稀疏问题,进而得到错误的推荐结果的缺点;使得得到的用户-商品矩阵更加准确,进而得到准确的推荐结果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一个实施例所提供的基于商品检索数据分析的智能推荐方法流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,其示出了本发明一个实施例所提供的基于商品检索数据分析的智能推荐方法流程图,该方法包括以下步骤:
步骤S001、采集用户多个维度的商品检索数据,得到每个用户的若干商品数据序列。
本实施例的目的是根据不同用户的商品检索数据,对用户生成相应的推荐列表,因此首先需要采集用户的商品检索数据;用户存在多种与商品相关的检索数据,即有多个维度的数据,本实施例中商品检索数据包括用户查询的关键词、浏览记录即浏览次数、购买行为即购买数量(没有购买则购买数量为0)、评价信息(本实施例采用1-5分的评分作为评价信息)以及购买时间共5个维度的数据,对每个用户这些维度的数据进行采集,则可以得到若干组用户与商品之间的多维商品检索数据,对所有数据进行编码处理,本实施例采用UTF-8编码方法,UTF-8编码为公知技术,本实施例不再赘述;而对于关键词,本实施例采用词向量转换方法,将每组商品检索数据中关键词转换为词向量形式,词向量转换为公知技术,本实施例不再赘述;对编码及转换后的数据,将同一组中多个维度数据作为一个序列,记为用户与商品之间的商品数据序列,则每个用户可以得到若干商品数据序列。
至此,通过采集商品检索数据,获取到了每个用户的若干商品数据序列。
需要说明的是,在根据商品检索数据进行用户-商品矩阵的元素值计算过程中,矩阵的元素表征的为用户和商品之间的交互强度,元素值的计算往往根据对应的商品数据序列获取,但是由于采集的用户数据中,可能会存在用户的短时效性的购物行为,其中短时效性的购物行为例如短期内需要购买手机,则对应的短时间内用户都在对手机商品信息进行浏览,但是该用户对于该手机商品并不感兴趣,因此对应的该条数据所计算得到的元素值并不准确;并且在加入新的商品检索数据进行元素值更新的过程中,需要考虑新加的商品检索数据对现有元素结果的影响,即对应新用户对原有用户的影响,进而得到准确的用户-商品矩阵。
步骤S002、根据每个用户的商品数据序列的聚类结果,获取每个商品数据序列的参考权重,得到每个用户每个维度的购物行为特征,结合商品数据序列得到用户-商品矩阵中的初始元素值。
需要说明的是,在获取用户-商品矩阵的每个元素的过程中,对应的即为获取每个用户对商品的交互强度,其中交互强度表征的是用户对该商品的评分大小,因此根据每个商品数据序列中用户对该商品的购买情况来获取交互强度,即初始元素值;在判断购买情况时,需要根据每个用户本身的购物行为特性来确定,并结合用户的购物行为特征以及商品的相似性获取用户-商品矩阵的初始元素值;然而在获取购物行为特征时,需要参考每个用户所有的商品数据序列进行统一分析,但是每个数据序列中(即对应的用户每次的购物行为),由于购物行为会存在短时效性的购物行为,因此需要对每个用户的若干商品数据序列分配合适的参考权重,进而得到购物行为特征。
具体的,首先构建用户-商品矩阵,矩阵中不同行表示不同的商品,不同列表示不同的用户,则得到了用户-商品矩阵的模型;以第个用户的若干商品数据序列为例,首先对每个商品数据序列获取商品类型,商品类型的划分采用CNN神经网络进行,训练数据集为所有用户的所有商品数据序列,输入数据为商品数据序列对应的商品,输出数据为商品类型,采用人工标注的方式将商品进行商品类型的划分,损失函数采用交叉熵损失函数,则通过训练CNN神经网络,输出得到每个商品数据序列对应的商品类型;以商品类型为横坐标,购买时间为纵坐标构建坐标系,其中商品类型之间的差异通过将商品类型进行词向量转换,以词向量之间的DTW距离来反映商品类型之间的差异,将第/>个用户的若干商品数据序列转换为坐标系中的坐标点,对坐标点进行K-means聚类,聚类距离采用坐标点之间的欧式距离(时间差异及商品类型差异),本实施例采用K=5进行叙述,则将坐标点聚类到了若干聚簇中,根据坐标点与商品数据序列的对应关系,则将第/>个用户的若干商品数据序列划分到多个聚簇中。
进一步的,第个用户的第/>个商品数据序列的参考权重的计算方法为:
其中,表示第/>个用户的第/>个商品数据序列的参考系数,/>表示第/>个用户的第/>个商品数据序列所在聚簇中商品数据序列的数量占第/>个用户的商品数据序列数量的比例,/>表示第/>个用户的第/>个商品数据序列所在聚簇中任意两个商品数据序列之间的距离均值,即对应坐标点之间的欧式距离均值,/>表示第/>个用户的任意两个商品数据序列之间的距离均值,/>表示第/>个用户的第/>个商品数据序列与所在聚簇的聚类中心之间的距离,/>表示第/>个用户的第/>个商品数据序列所在聚簇中商品数据序列与聚类中心之间的距离最大值,/>表示以自然常数为底数的指数函数,本实施例采用/>来呈现反比例关系及归一化处理,实施者可根据实际情况设置反比例函数及归一化函数;商品数据序列所在聚簇中序列之间的距离与所有序列之间的距离的差异特征越大,该聚簇与其他聚簇差异越大,计算参考系数时该聚簇中的商品数据序列的参考系数应越小,同时通过聚簇中序列数量占比进行限制,占比越大同时差异特征越大,则参考系数应更小;而在聚簇内部,商品数据序列与聚类中心的距离越大,聚簇内的参考权重分配就会更小,则参考系数更小;按照上述方法获取第/>个用户所有商品数据序列的参考系数,对所有参考系数进行softmax归一化,得到的结果记为第/>个用户每个商品数据序列的参考权重;按照上述方法获取每个用户每个商品数据序列的参考权重。
进一步的,以第个用户的若干商品数据序列为例,每个商品数据序列对应一个参考权重,根据参考权重对第/>个用户除关键词维度外每个维度的数据进行加权求和,得到的加权和值记为第/>个用户除关键词维度外每个维度的购物行为特征;按照上述方法获取每个用户除关键词维度外每个维度的购物行为特征,此时通过参考权重的计算,对短时效性的商品数据序列进行了限制,使得得到的购物行为特征更加准确,需要说明的是,此处计算每个维度的购物行为特征时,关键词对应维度不参与计算,即由于关键词对应数据为向量形式,不通过加权求和来获取购物行为特征。
进一步的,每个商品数据序列与用户及商品均为一对一的对应关系,则每个商品数据序列与用户-商品矩阵中的元素对应,将第个用户的第/>个商品数据序列对应的元素记为用户-商品矩阵中第/>行第/>列的元素,该元素的初始元素值通过对应商品数据序列中的数据与该用户各维度的购物行为特征之间的相似性来表示,初始元素值/>的计算方法为:
其中,表示用户-商品矩阵中第/>行第/>列的元素对应的第/>个用户的第/>个商品数据序列中关键词的词向量与第/>个用户所有商品数据序列中若干相同商品类型的商品数据序列中关键词的词向量之间的余弦相似度均值,即获取第/>个用户若干与第/>个商品数据序列对应商品类型相同的商品数据序列,并分别计算这些序列中关键词的词向量与第/>个用户的第/>个商品数据序列中关键词的词向量之间的余弦相似度,再求均值,需要说明的是,关键词的词向量中元素数量存在差异,通过补0使得元素数量相同;/>表示商品数据序列中除关键词维度之外其他维度的数量,本实施例中/>,/>表示用户-商品矩阵中第/>行第/>列的元素对应的第/>个用户第/>个维度的购物行为特征,/>表示用户-商品矩阵中第/>行第/>列的元素对应的第/>个用户的第/>个商品数据序列中第/>个维度的数据值,/>表示求绝对值,/>表示以自然常数为底数的指数函数,本实施例采用/>来呈现反比例关系及归一化处理,实施者可根据实际情况设置反比例函数及归一化函数;对于其他维度的数据,通过相同维度下的购物行为特征与元素对应商品数据序列中的数据之间的差异来反映相似性,差异越大,相似性越小,初始元素值越小;而对于关键词维度,通过词向量之间的相似性来量化,获取相同商品类型下的商品数据序列中关键词的词向量之间的余弦相似度,进而得到均值,均值越大相似度越大,初始元素值越大;按照上述方法获取每个用户的每个商品数据序列对应元素的初始元素值。
进一步的,对于没有对应商品数据序列的元素,即不存在对应用户购买该商品的购物行为,对于这类情况,以任意一个没有对应商品数据序列的元素为例,首先该元素对应一个商品,对该商品提取关键词,本实施例采用NLP关键词提取算法进行提取,公知技术本实施例不再赘述;同时该商品对应的商品类型已知,获取该元素所在列中对应商品类型与该商品类型之间差异最小的具有初始元素值的元素,记为该没有初始元素值的元素的参考元素,即同列为同一用户的商品数据序列对应的元素,商品类型差异最小则参考程度最大;得到参考元素后即得到了对应的商品数据序列,获取该商品数据序列中关键词的词向量,并与该没有初始元素值的元素提取到的关键词的词向量进行余弦相似度的计算,若向量元素数量存在差异则补0填充,将得到的余弦相似度与参考元素的初始元素值相乘,得到的结果作为该没有初始元素值的元素的初始元素值;按照上述方法获取每个没有对应商品数据序列的元素的初始元素值,则得到了用户-商品矩阵中每个元素的初始元素值。
至此,获取到了用户-商品矩阵中每个元素的初始元素值,完成了用户-商品矩阵的构建。
步骤S003、获取用户的新增数据序列,根据新增数据序列的商品类型与所有商品数据序列,得到新增数据序列的突出程度,结合新增数据序列与商品数据序列之间的相关性,得到更新元素值。
需要说明的是,新加入的商品检索数据会对原有的结果造成影响,会使得整体数据的交互强度发生变化;而某些用户的商品的购买行为与其他用户有关,例如一个用户在购买东西的时候,其购买的东西的商品类型越集中,但当前新加入的数据中的商品类型极为不同,其购买的数据关键词与另外一个用户的关键词基本相同的同时,关键词也较为的详细的描述商品类型,则对应的该用户新增的商品检索数据在进行元素值的更新过程中,需要计算关联性影响,即在通过相似性计算初始元素值的过程中,需要考虑关联性的影响,关联性影响越大,则对应的该用户对于此商品的交互强度较低,需要调整矩阵元素值。
具体的,任意一个用户新加入一组商品检索数据后,对商品检索数据同样进行编码以及词向量转换,并得到一个序列,记为新增数据序列,并通过已经训练好的神经网络获取新增数据序列对应的商品类型,则首先获取新增数据序列的突出程度,新增数据序列用表示,对应用户记为用户/>,突出程度/>,其中/>表示已有的商品数据序列数量,表示新增数据序列对应商品类型中已有的商品数据序列数量,存在新增数据序列对应商品类型不存在于已有商品类型中的情况,则此时/>;突出程度表征了该用户的该购物行为受影响的情况,突出程度越大,该购物行为受其他用户影响的可能性越大。
进一步的,对于新增数据序列对应的用户-商品矩阵中的元素,按照上述方法对该元素所在列中的初始元素值重新进行计算,即对应用户的购物行为特征计算过程中需要考虑新增数据序列,则对该元素所在列的初始元素值更新完成;而对于其他列即其他用户对应元素的初始元素值,由于新增数据序列存在关联性影响,则需要对其他列中元素也进行更新,以存在商品数据序列对应商品类型与新增数据序列对应商品类型相同的第/>个用户为例,新增数据序列对应用户/>与第/>个用户的关联性/>的计算方法为:
其中,表示新增数据序列的突出程度,/>表示新增数据序列中关键词的词向量中元素数量,/>表示所有商品数据序列中关键词的词向量中元素数量最大值,/>表示存在商品数据序列对应商品类型与新增数据序列/>对应商品类型相同的第/>个用户的商品数据序列的数量,/>表示第/>个用户的第/>个商品数据序列的参考权重,/>表示新增数据序列/>中关键词的词向量与第/>个用户的第/>个商品数据序列中关键词的词向量之间的余弦相似度,若词向量之间元素数量存在差异通过补0进行填充;突出程度越大,相同商品类型的商品数据序列越多,受关联影响越大,关联性越大;词向量中元素数量的比值越大,表明新增数据序列中关键词描述越相近,受关联影响越大,关联性越大;通过参考权重对第/>个用户各商品数据序列的关键词的词向量的余弦相似度进行加权,相似度越大则关联性越大;按照上述方法获取存在商品数据序列对应商品类型与新增数据序列对应商品类型相同的每个用户与用户/>的关联性。
进一步的,以存在商品数据序列对应商品类型与新增数据序列对应商品类型相同的第/>个用户为例,获取该用户的若干商品数据序列中对应商品类型与新增数据序列对应商品类型相同的任意一个商品数据序列,根据已经得到的关联性对初始元素值进行调整,该商品数据序列对应的元素为用户-商品矩阵中第/>行第/>列的元素,则更新元素值的计算方法为:
其中,表示用户-商品矩阵中第/>行第/>列的元素的初始元素值,表示用户/>与第/>个用户的关联性;按照上述方法对每个与新增数据序列对应商品类型相同的商品数据序列对应的元素获取更新元素值,同时已经对新增数据序列对应元素所在列的元素值完成更新,则完成了在新加入商品检索数据后对用户-商品矩阵的更新。
至此,获取到了新加入商品检索数据后用户-商品矩阵中的更新元素值,每次新加入商品检索数据后都按照上述方法进行更新元素值获取。
步骤S004、根据更新后的用户-商品矩阵,通过协同滤波算法生成每个用户的推荐列表,完成商品智能推荐。
在加入新的商品检索数据,即获取到不同用户的新增数据序列时,通过对初始元素值进行更新,得到更新元素值,则对用户-商品矩阵也完成了更新,更新后的用户-商品矩阵中每个元素值的代表评分大小,根据协同滤波算法过程计算键入关键词的评分大小,采用Top-N推荐标准,对关键词从大到小进行排序,本实施例选取每个用户的前10个值进行推荐,则生成了每个用户的推荐列表,完成商品的智能推荐;其中协同滤波算法及Top-N推荐标准均为公知技术,本实施例不再赘述。
至此,通过构建更加准确的用户-商品矩阵,利用协同滤波算法,完成对用户的商品智能推荐。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (8)
1.基于商品检索数据分析的智能推荐方法,其特征在于,该方法包括以下步骤:
采集用户多个维度的商品检索数据,得到每个用户的若干商品数据序列;
根据商品数据序列及每个用户每个维度的购物行为特征,获取用户-商品矩阵中每个元素的初始元素值;
根据新增数据序列的突出程度、商品类型以及商品数据序列,得到加入新的商品检索数据后更新后的用户-商品矩阵;
根据更新后的用户-商品矩阵,通过协同滤波算法生成每个用户的推荐列表,完成商品智能推荐;
所述用户-商品矩阵中每个元素的初始元素值,具体的获取方法为:
构建用户-商品矩阵,矩阵中不同行表示不同的商品,不同列表示不同的用户,得到用户-商品矩阵的模型;
根据每个用户的商品数据序列的聚类结果,得到每个用户除关键词维度外每个维度的购物行为特征;将第个用户的第/>个商品数据序列对应的元素记为用户-商品矩阵中第/>行第/>列的元素,其初始元素值/>的计算方法为:
其中,表示用户-商品矩阵中第/>行第/>列的元素对应的第/>个用户的第/>个商品数据序列中关键词的词向量与第/>个用户所有商品数据序列中若干相同商品类型的商品数据序列中关键词的词向量之间的余弦相似度均值,/>表示商品数据序列中除关键词维度之外其他维度的数量,/>表示用户-商品矩阵中第/>行第/>列的元素对应的第/>个用户第/>个维度的购物行为特征,/>表示用户-商品矩阵中第/>行第/>列的元素对应的第个用户的第/>个商品数据序列中第/>个维度的数据值,/>表示求绝对值,/>表示以自然常数为底数的指数函数;获取每个用户的每个商品数据序列对应元素的初始元素值;
以任意一个没有对应商品数据序列的元素为目标元素,获取目标元素对应的商品及商品类型,并对目标元素对应的商品提取关键词;获取目标元素所在列中对应商品类型与该商品类型之间差异最小的具有初始元素值的元素,记为目标元素的参考元素;得到参考元素对应的商品数据序列,获取该商品数据序列中关键词的词向量,并与目标元素提取到的关键词的词向量进行余弦相似度的计算,将得到的余弦相似度与参考元素的初始元素值相乘,得到的结果作为目标的初始元素值;获取每个没有对应商品数据序列的元素的初始元素值。
2.根据权利要求1所述的基于商品检索数据分析的智能推荐方法,其特征在于,所述得到每个用户的若干商品数据序列,包括的具体方法为:
多个维度包括关键词、浏览记录、购买行为、评价信息以及购买时间,对除关键词维度之外其他数据进行编码,对关键词进行词向量转换,一组商品检索数据中编码后的数据及转换后的词向量,组成一个商品数据序列,对每个商品检索数据得到商品数据序列。
3.根据权利要求1所述的基于商品检索数据分析的智能推荐方法,其特征在于,所述得到每个用户除关键词维度外每个维度的购物行为特征,包括的具体方法为:
根据每个用户的商品数据序列的聚类结果,获取每个用户每个商品数据序列的参考权重,根据参考权重对第个用户除关键词维度外每个维度的数据进行加权求和,得到的加权和值记为第/>个用户除关键词维度外每个维度的购物行为特征;
获取每个用户除关键词维度外每个维度的购物行为特征。
4.根据权利要求3所述的基于商品检索数据分析的智能推荐方法,其特征在于,所述每个用户每个商品数据序列的参考权重,具体的获取方法为:
对每个用户的若干商品数据序列通过聚类划分到若干聚簇中,第个用户的第/>个商品数据序列的参考权重的计算方法为:
其中,表示第/>个用户的第/>个商品数据序列的参考系数,/>表示第/>个用户的第/>个商品数据序列所在聚簇中商品数据序列的数量占第/>个用户的商品数据序列数量的比例,/>表示第/>个用户的第/>个商品数据序列所在聚簇中任意两个商品数据序列之间的距离均值,/>表示第/>个用户的任意两个商品数据序列之间的距离均值,/>表示第/>个用户的第/>个商品数据序列与所在聚簇的聚类中心之间的距离,/>表示第/>个用户的第/>个商品数据序列所在聚簇中商品数据序列与聚类中心之间的距离最大值,/>表示以自然常数为底数的指数函数;
获取第个用户所有商品数据序列的参考系数,对所有参考系数进行归一化,得到的结果记为第/>个用户每个商品数据序列的参考权重;获取每个用户每个商品数据序列的参考权重。
5.根据权利要求4所述的基于商品检索数据分析的智能推荐方法,其特征在于,所述对每个用户的若干商品数据序列通过聚类划分到若干聚簇中,包括的具体方法为:
对第个用户的每个商品数据序列获取对应的商品及商品类型,以商品类型为横坐标,购买时间为纵坐标构建坐标系,将第/>个用户的若干商品数据序列转换为坐标系中的坐标点,对坐标点进行K-means聚类,聚类距离采用坐标点之间的欧式距离,K值采用5,其中坐标点之间的欧式距离由时间差异与商品类型差异得到,商品类型之间的差异通过将商品类型进行词向量转换,以词向量之间的DTW距离来表示商品类型之间的差异;将坐标点聚类到若干聚簇中,根据坐标点与商品数据序列的对应关系,将第/>个用户的若干商品数据序列划分到多个聚簇中;对每个用户的若干商品数据序列通过聚类划分到若干聚簇中。
6.根据权利要求1所述的基于商品检索数据分析的智能推荐方法,其特征在于,所述得到加入新的商品检索数据后更新后的用户-商品矩阵,包括的具体方法为:
对新加入的商品检索数据获取序列,记为新增数据序列,获取新增数据序列对应的商品类型;
对新增数据序列对应的用户-商品矩阵中的元素所在列的元素重新进行初始元素值的计算,将新增数据序列加入到所在列的初始元素值计算过程中,完成对于新增数据序列对应元素所在列的元素值的更新;
将新增数据序列记为,新增数据序列对应用户记为用户/>,获取存在商品数据序列对应商品类型与新增数据序列对应商品类型相同的每个用户与用户/>的关联性;
将存在商品数据序列对应商品类型与新增数据序列对应商品类型相同的第个用户的任意一个与新增数据序列对应商品类型相同的商品数据序列对应的元素记为用户-商品矩阵中第/>行第/>列的元素,更新元素值/>的计算方法为:
其中,表示用户-商品矩阵中第/>行第/>列的元素的初始元素值,/>表示用户/>与第/>个用户的关联性;
对每个与新增数据序列对应商品类型相同的商品数据序列对应的元素获取更新元素值;完成在新加入商品检索数据后对用户-商品矩阵的更新,得到更新后的用户-商品矩阵。
7.根据权利要求6所述的基于商品检索数据分析的智能推荐方法,其特征在于,所述存在商品数据序列对应商品类型与新增数据序列对应商品类型相同的每个用户与用户的关联性,具体的获取方法为:
根据商品类型得到新增数据序列的突出程度,存在商品数据序列对应商品类型与新增数据序列对应商品类型相同的第/>个用户与用户/>的关联性/>的计算方法为:
其中,表示新增数据序列的突出程度,/>表示新增数据序列中关键词的词向量中元素数量,/>表示所有商品数据序列中关键词的词向量中元素数量最大值,/>表示存在商品数据序列对应商品类型与新增数据序列/>对应商品类型相同的第/>个用户的商品数据序列的数量,/>表示第/>个用户的第/>个商品数据序列的参考权重,/>表示新增数据序列/>中关键词的词向量与第/>个用户的第/>个商品数据序列中关键词的词向量之间的余弦相似度;
获取存在商品数据序列对应商品类型与新增数据序列对应商品类型相同的每个用户与用户的关联性。
8.根据权利要求7所述的基于商品检索数据分析的智能推荐方法,其特征在于,所述根据商品类型得到新增数据序列的突出程度,包括的具体方法为:
新增数据序列的突出程度/>的计算方法为:
其中,表示已有的商品数据序列数量,/>表示新增数据序列对应商品类型中已有的商品数据序列数量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310806870.7A CN116541607B (zh) | 2023-07-04 | 2023-07-04 | 基于商品检索数据分析的智能推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310806870.7A CN116541607B (zh) | 2023-07-04 | 2023-07-04 | 基于商品检索数据分析的智能推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116541607A CN116541607A (zh) | 2023-08-04 |
CN116541607B true CN116541607B (zh) | 2023-09-15 |
Family
ID=87454463
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310806870.7A Active CN116541607B (zh) | 2023-07-04 | 2023-07-04 | 基于商品检索数据分析的智能推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116541607B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116826977B (zh) * | 2023-08-28 | 2023-11-21 | 青岛恒源高新电气有限公司 | 一种光储直柔微电网智能管理*** |
CN117710054A (zh) * | 2023-12-20 | 2024-03-15 | 塞奥斯(北京)网络科技有限公司 | 线上商城商品智能化展示*** |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105095477A (zh) * | 2015-08-12 | 2015-11-25 | 华南理工大学 | 一种基于多指标评分的推荐算法 |
CN107292648A (zh) * | 2016-04-01 | 2017-10-24 | 株式会社理光 | 一种用户行为分析方法及装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100997541B1 (ko) * | 2008-10-08 | 2010-11-30 | 인하대학교 산학협력단 | 신상품 추천문제 해결을 위한 내용기반 필터링과 협업 필터링을 혼합한 사용자 프로파일 기반 이미지 추천 방법 및 장치 |
-
2023
- 2023-07-04 CN CN202310806870.7A patent/CN116541607B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105095477A (zh) * | 2015-08-12 | 2015-11-25 | 华南理工大学 | 一种基于多指标评分的推荐算法 |
CN107292648A (zh) * | 2016-04-01 | 2017-10-24 | 株式会社理光 | 一种用户行为分析方法及装置 |
Non-Patent Citations (1)
Title |
---|
基于多特征融合的混合协同过滤算法研究;邹腾飞;中国优秀硕士学位论文全文数据库 信息科技辑(第2015 年 第12期期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN116541607A (zh) | 2023-08-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116541607B (zh) | 基于商品检索数据分析的智能推荐方法 | |
CN111797321B (zh) | 一种面向不同场景的个性化知识推荐方法及*** | |
CN106021364B (zh) | 图片搜索相关性预测模型的建立、图片搜索方法和装置 | |
CN109741112B (zh) | 一种基于移动大数据的用户购买意向预测方法 | |
CN112417306B (zh) | 基于知识图谱的推荐算法性能优化的方法 | |
CN107944035B (zh) | 一种融合视觉特征和用户评分的图像推荐方法 | |
CN108563690B (zh) | 一种基于面向对象聚类的协同过滤推荐方法 | |
CN112214685A (zh) | 一种基于知识图谱的个性化推荐方法 | |
CN112487199B (zh) | 一种基于用户购买行为的用户特征预测方法 | |
CN109460519B (zh) | 浏览对象推荐方法及装置、存储介质、服务器 | |
CN113807422B (zh) | 融合多特征信息的加权图卷积神经网络评分预测模型 | |
CN112395487B (zh) | 信息推荐方法、装置、计算机可读存储介质及电子设备 | |
CN113407729B (zh) | 一种面向司法的个性化案例推荐方法及*** | |
CN111753209A (zh) | 一种基于改进时序卷积网络的序列推荐列表生成方法 | |
CN113065062A (zh) | 一种基于用户阅读时间行为的新闻推荐方法及*** | |
CN112100512A (zh) | 一种基于用户聚类和项目关联分析的协同过滤推荐方法 | |
CN113239159B (zh) | 基于关系推理网络的视频和文本的跨模态检索方法 | |
CN112288471A (zh) | 一种基于用户历史行为序列的广告点击率预测方法 | |
CN112612951B (zh) | 一种面向收益提升的无偏学习排序方法 | |
CN114741603A (zh) | 基于用户聚类和商品聚类的混合协同过滤推荐算法 | |
CN115712780A (zh) | 一种基于云计算和大数据的信息推送方法及装置 | |
CN116680363A (zh) | 一种基于多模态评论数据的情感分析方法 | |
CN114781503A (zh) | 一种基于深度特征融合的点击率预估方法 | |
CN111506813A (zh) | 一种基于用户画像的遥感信息精准推荐方法 | |
CN110555719B (zh) | 一种基于深度学习的商品点击率预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |