WO2020073534A1 - 基于重聚类的推送方法、装置、计算机设备及存储介质 - Google Patents

基于重聚类的推送方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
WO2020073534A1
WO2020073534A1 PCT/CN2018/125334 CN2018125334W WO2020073534A1 WO 2020073534 A1 WO2020073534 A1 WO 2020073534A1 CN 2018125334 W CN2018125334 W CN 2018125334W WO 2020073534 A1 WO2020073534 A1 WO 2020073534A1
Authority
WO
WIPO (PCT)
Prior art keywords
vector
product
user
row vector
commodity
Prior art date
Application number
PCT/CN2018/125334
Other languages
English (en)
French (fr)
Inventor
吴壮伟
Original Assignee
平安科技(深圳)有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 平安科技(深圳)有限公司 filed Critical 平安科技(深圳)有限公司
Publication of WO2020073534A1 publication Critical patent/WO2020073534A1/zh

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques

Definitions

  • the present application relates to the field of information push technology, and in particular, to a push method, device, computer equipment, and storage medium based on re-clustering.
  • the recommendation algorithm based on collaborative filtering is commonly used in the user-rating matrix.
  • the user-rating matrix represents the user's rating of the item (the item can be understood as a specific product).
  • the horizontal axis of the user-rating matrix is the item, and the vertical axis is the user.
  • the value is user i's rating of item j. As the amount of product data becomes larger, the cost of maintaining a full user-scoring matrix scoring system will become higher and higher.
  • the embodiments of the present application provide a push method, device, computer equipment and storage medium based on re-clustering, aiming to solve the scoring system corresponding to the full user-scoring matrix of online malls in the prior art as the number of commodities increases, More and more bloated, leading to the difficulty of maintaining a full user-scoring matrix.
  • an embodiment of the present application provides a push method based on re-clustering, which includes:
  • a commodity recommendation list is obtained from the commodity corresponding to the comprehensive score value in the commodity recommendation row vector before the preset second ranking threshold, and the commodity recommendation list is pushed to the receiving end corresponding to the target user.
  • an embodiment of the present application provides a re-clustering-based pushing device, which includes:
  • the user clustering unit is used for clustering the obtained user-scoring matrix through DBSCAN clustering to obtain at least one cluster group and a sub-user-scoring matrix corresponding to each cluster group in one-to-one correspondence;
  • the cluster judgment unit is used to obtain the cluster group corresponding to the target user's row vector according to the target user corresponding to the selected row vector in the sub-user-score matrix;
  • the similar user rating matrix acquisition unit is used to calculate and obtain the Euclidean distance between each rating row vector and the target user's row vector in the cluster group corresponding to the target user, and obtain the preset first rank in each Euclidean distance
  • the scoring row vector corresponding to the Euclidean distance before the threshold to form a scoring matrix for similar user groups;
  • the product recommendation row vector acquisition unit is used to obtain the comprehensive rating value of each product by the similar user group based on each rating row vector in the similar user group rating matrix to form a product recommendation row vector;
  • the information pushing unit is used to obtain the product recommendation list from the products corresponding to the comprehensive rating value whose rating rank is before the preset second ranking threshold in the product recommendation row vector, and push the product recommendation list to the receiving end corresponding to the target user .
  • an embodiment of the present application further provides a computer device, including a memory, a processor, and a computer program stored on the memory and executable on the processor, the processor executing the computer
  • the program implements the push method based on the re-clustering described in the first aspect.
  • an embodiment of the present application further provides a computer-readable storage medium, wherein the computer-readable storage medium stores a computer program, and when the computer program is executed by a processor, the processor causes the processor to execute the first On the one hand, the push method based on re-clustering.
  • FIG. 1 is a schematic flowchart of a push method based on re-clustering provided by an embodiment of the present application
  • FIG. 2 is a schematic diagram of a sub-process of a push method based on re-clustering provided by an embodiment of the present application
  • FIG. 3 is a schematic diagram of another sub-process of a push method based on re-clustering provided by an embodiment of the present application;
  • FIG. 4 is a schematic block diagram of a re-clustering-based pushing device provided by an embodiment of the present application.
  • FIG. 5 is a schematic block diagram of a subunit of a re-clustering-based push device provided by an embodiment of the present application
  • FIG. 6 is a schematic block diagram of another subunit of a re-clustering-based push device provided by an embodiment of the present application.
  • FIG. 7 is a schematic block diagram of a computer device provided by an embodiment of the present application.
  • FIG. 1 is a schematic flowchart of a re-clustering-based push method provided by an embodiment of the present application.
  • the re-clustering-based push method is applied to a management server.
  • the method is implemented by application software installed in the management server.
  • the management server is the enterprise terminal for pushing based on re-clustering.
  • the method includes steps S110-S150.
  • the user-score matrix represents the user's rating of the product (items can be understood as specific products), the horizontal axis of the user-score matrix is the item, and the vertical axis is the user, and the value in it is user i to item j 'S rating.
  • the user-score matrix S is a 4 ⁇ 5 matrix, such as:
  • the row vector in the first row of the user-scoring matrix S represents user 1 ’s ratings for products 1-commodity 5
  • the row vector in the second row represents user 2 ’s ratings for products 1-commodity 5
  • the third row ’s The row vectors represent user 3's ratings for products 1-5 respectively
  • the fourth row row vectors represent user 4 ratings for products 1-5 respectively.
  • the DBSCAN clustering model is used to cluster the row vectors in the user-scoring matrix, so that similar users are divided into the same cluster group according to the user's score for each product, and each user groups each product in the same cluster group
  • the ratings are approximate (that is, the difference between the ratings of the products is small).
  • step S110 includes:
  • minPts which represents the minimum number of included points
  • ⁇ neighborhood which means the area within the scan radius of the given object, centered on the given object
  • Core object means that if the number of objects included in the ⁇ neighborhood of a given object is greater than or equal to the minimum number of inclusion points, the given object is called a core object;
  • the direct density is reachable, which means that for the sample set D, if the sample point q is in the ⁇ neighborhood of p, and p is the core object, then the object q is directly reachable from the object p;
  • the density is reachable, then the object q is reachable from the object p density;
  • the density is connected, which means that there is a point o in the sample set D. If the objects o to p and q are all reachable in density, then p and q are connected in density.
  • DBSCAN Density-Based Spatial Clustering of Applications with Noise
  • DBSCAN requires two parameters: scanning radius (eps) and minimum included points (minPts). Pick an unvisited point to start, and find all nearby points that are within the distance of eps (including eps).
  • the current point forms a cluster with its nearby points, and the departure point is marked as visited. Then recursively, process all points in the cluster that are not marked as visited in the same way, so as to expand the cluster. If the number of nearby points ⁇ minPts, the point is temporarily marked as a noise point. If the cluster is fully expanded, that is, all points in the cluster are marked as visited, then use the same algorithm to deal with the points that have not been visited.
  • the cluster group to which the row vector belongs is obtained at the same time. You can quickly determine the similar users of the target user.
  • the Euclidean distance between each rating row vector in the cluster group and the target user's row vector can be obtained, and each Euclidean distance can be After sorting in descending order, the score row vector corresponding to the Euclidean distance ranked before the preset first ranking threshold in each Euclidean distance is acquired to form a similar user group scoring matrix. If the first ranking threshold is set to 11, then the scoring row vector corresponding to the Euclidean distance ranked 1-10 in each Euclidean distance is obtained, and these 10 row vectors form a similar user group scoring matrix. After acquiring similar users of the target user, calculation can be performed with a small number of selected row vectors, without calling the full user-scoring matrix, which reduces the amount of calculation in the running process.
  • step S130 includes:
  • the rating row vectors of the similar users are sequentially obtained.
  • the above method can accurately obtain the rating rows corresponding to the similar users
  • a similar user group scoring matrix composed of vectors is convenient for subsequent calculation of the user's comprehensive scoring value for each product.
  • the comprehensive user's comprehensive score value can be calculated for each product.
  • the product recommendation row vector can be calculated, and the product recommendation row vector is used as the basis for product recommendation.
  • step S140 includes:
  • a first cluster group and a second cluster group are obtained, where the first cluster group includes the rating row vectors of user 1 and user 2,
  • the two-cluster cluster includes user 3 and user 4's rating row vectors.
  • the sub-user-score matrix corresponding to the first cluster group is composed of user 1 and user 2 score row vectors
  • the sub-user-score matrix corresponding to the second cluster group is composed of user 3 and user 4 score row vectors.
  • the cluster group corresponding to the rating row vector of user 1 is the first cluster group.
  • the first cluster group also includes the rating of user 2 Line vector.
  • the similar user group rating matrix is [0 4 1 3 2]
  • the Euclidean distance between the similar user group rating matrix [0 4 1 3 2] and the target user ’s rating row vector [1 3 1 5 2] is Euclidean distance vector of similar user groups Multiplied by the target user's line vector [1 3 1 5 2] That is, a product recommendation row vector composed of a comprehensive score value of each product by a similar user group is obtained.
  • the product recommendation row vector is calculated according to the rating row vector corresponding to each user in the cluster group to which the target user belongs and the target user's rating row vector, the ranking of each product in the product recommendation row vector
  • the top products can be used as one of the components of the product recommendation list. In this way, the recommended products obtained through the product recommendation row vector fully consider the preferences of the approximate users, so they can accurately reflect the preferences of the target users.
  • a product recommendation list is obtained from the product corresponding to the comprehensive rating value whose rating rank is before the preset second ranking threshold in the product recommendation row vector, and the product recommendation list is pushed to the receiving end corresponding to the target user.
  • the comprehensive score of each product in the cluster group to which the target user belongs can be known, and the ranking of the comprehensive score is before the second ranking threshold (For example, if the second ranking threshold is set to 4) the product corresponding to the score can be used as a recommended item in the product recommendation list.
  • the top three products in the product recommendation row vector corresponding to the similar user (user 2) of the target user (user 1) are product 2, product 4, and product 5, respectively.
  • the above three products are used as the product list Push to the target user.
  • the product preferences of similar users can be used as the main factors considered when recommending products to target users, and product recommendations can be made more reasonably.
  • the method before step S110, the method further includes:
  • the DBSCAN clustering model is used to cluster the statistical vectors corresponding to the commodity keyword set to obtain at least one commodity clustering cluster;
  • a weighted average is obtained according to the score corresponding to each product name in the similar product result to obtain a product weighted score corresponding to the blank value, so as to update the blank value to the corresponding product weighted score.
  • the user can select one or more of a variety of commodities and make a purchase.
  • a set of historical commodity information is stored.
  • Each historical commodity information in the historical commodity information set includes a commodity name and a commodity attribute, where the attribute of the commodity includes the price, label, brand, and function of the commodity.
  • each historical commodity can be The information is simply expressed as a corresponding set of product keywords.
  • the word frequency-inverse text frequency index model is a commonly used weighting technique for information retrieval and data mining.
  • TF means term frequency (Term Frequency)
  • IDF means inverse text frequency index (Inverse Document Frequency).
  • TF-IDF is a statistical method used to evaluate the importance of a word to one of the documents in a document set or a corpus. The importance of a word increases proportionally with the number of times it appears in the document, but at the same time it decreases inversely with the frequency of its appearance in the corpus.
  • the key of the commodity can be learned through the Word2Vec model (Word2Vec is a model for learning semantic knowledge in an unsupervised manner from a large number of text corpora)
  • the word set is converted into a word vector corresponding to each historical commodity information.
  • the basketball, Spalding, and XX models each correspond to a vector. Only one value in the vector is 1, and the rest are all 0. Enter the vector corresponding to the above information into the Word2Vec model to convert it into low-dimensional continuous values. This is a dense vector, and words with similar meanings will be mapped to similar positions in the vector space.
  • the average of the word vectors of each product keyword may be taken as the statistical vector of the product.
  • each historical commodity information in the historical commodity information set is converted into a corresponding statistical vector, and then the statistical vector corresponding to the commodity keyword set is clustered by the DBSCAN clustering model to obtain at least one commodity cluster cluster.
  • the row vector to which the blank value belongs in the initial user-score matrix it can be known which user ’s product score for which product is a blank value, and at this time, the product corresponding to the blank value is first obtained You can know the statistical vector corresponding to the product name by name. Then, judging the product cluster to which the statistical vector belongs, the similar product names of other products in the product cluster can be obtained as the similar product results of the product names corresponding to the blank values. Since the blank value is in the row vector to which the initial user-score matrix belongs, the user's score for each similar product name in the similar product result can be obtained. Finally, the weighted average of the user's ratings for each similar product name is obtained to obtain the product weighted score corresponding to the blank value.
  • the weighted average is obtained according to the score corresponding to each product name in the similar product result, and the product weighted score corresponding to the blank value is obtained, including:
  • Score k represents the product weighted score of the blank corresponding to the product k
  • m is the total number of similar products c in the similar product results.
  • the score of user 1 for product 2 is a blank value
  • the results of similar products corresponding to product 2 are product 4 and product 5
  • the scores of user 1 for product 4 and product 5 are 3 and 4, respectively
  • product 4 corresponds to
  • the distance between the statistical vector and the statistical vector corresponding to commodity 2 is 0.5
  • the distance between the statistical vector corresponding to commodity 5 and the statistical vector corresponding to commodity 2 is 1, then:
  • the Score2 calculated above is used as the product weighted score corresponding to the blank value.
  • the user-scoring matrix can be effectively completed, avoiding the problem of cold start during the recommendation process.
  • the method realizes that the user-scoring matrix is divided into multiple sub-matrices for maintenance, which reduces maintenance costs, and can accurately push the target user's commodity information according to the sub-matrix.
  • An embodiment of the present application further provides a re-clustering-based push device, and the re-clustering-based push device is used to perform any embodiment of the foregoing re-clustering-based push method.
  • FIG. 4 is a schematic block diagram of a re-clustering-based push device provided by an embodiment of the present application.
  • the push device 100 based on re-clustering may be configured in the management server.
  • the re-clustering-based pushing device 100 includes a user clustering unit 110, a clustering judgment unit 120, a similar user rating matrix obtaining unit 130, a product recommendation row vector obtaining unit 140, and an information pushing unit 150.
  • the user clustering unit 110 is configured to cluster the obtained user-scoring matrix by DBSCAN clustering to obtain at least one cluster group and a sub-user-scoring matrix corresponding to each cluster group in one-to-one relationship.
  • the user clustering unit 110 includes:
  • the initial center obtaining unit 111 is configured to use any row vector in the user-scoring matrix as an initial clustering center;
  • the initial cluster group obtaining unit 112 is configured to obtain a line vector with a distance from the center of the initial cluster within a preset scan radius according to a preset minimum number of included points, as an initial cluster group;
  • the cluster group adjustment unit 113 is used to take each row vector in the initial cluster group as a cluster center, and obtain a row vector in the user-scoring matrix directly attainable in density, reachable in density, or connected to the cluster center, as The adjusted cluster group.
  • the cluster judgment unit 120 is configured to obtain the cluster group corresponding to the row vector of the target user according to the target user corresponding to the row vector selected in the sub-user-score matrix.
  • the similar user rating matrix obtaining unit 130 is used to calculate and obtain the Euclidean distance between each rating row vector and the target user's row vector in the cluster group corresponding to the target user, and obtain the ranking first in each Euclidean distance
  • the scoring row vector corresponding to the Euclidean distance before the ranking threshold constitutes a scoring matrix for similar user groups.
  • the product recommendation row vector acquisition unit 140 is configured to acquire a comprehensive rating value of each product of the similar user group according to each rating row vector in the similar user group rating matrix to form a product recommendation row vector.
  • the commodity recommendation row vector acquisition unit 140 includes:
  • the Euclidean distance row vector acquisition unit 141 is used to form the Euclidean distance row vector of the similar user group according to the Euclidean distance between each rating row vector in the similar user group rating matrix and the target user's row vector;
  • the comprehensive score calculation unit 142 is used to multiply the similar user group Euclidean distance row vector and the similar user group score matrix to obtain the comprehensive score value of the similar user group for each product to form a product recommendation row vector.
  • the information pushing unit 150 is used to obtain a product recommendation list from the products corresponding to the comprehensive rating value in the product recommendation row vector whose rating rank is before the preset second ranking threshold, and push the product recommendation list to the corresponding reception of the target user end.
  • the re-clustering-based pushing device 100 further includes:
  • the historical keyword set acquisition unit is used to acquire a historical commodity information set, and extract keyword information from each historical commodity information in the historical commodity information set through the word frequency-inverse text frequency index model to obtain information related to each historical commodity Corresponding product keyword set;
  • the word vector conversion unit is used to obtain the word vector corresponding to each commodity keyword in each commodity keyword set through the Word2Vec model;
  • the statistical vector acquisition unit is used to acquire the average value of the word vector corresponding to each commodity keyword in each commodity keyword set to obtain the statistical vector corresponding to each commodity keyword set;
  • the commodity clustering unit is used to cluster the statistical vectors corresponding to the commodity keyword set by the DBSCAN clustering model to obtain at least one commodity clustering cluster;
  • a vector-to-be-predicted unit for obtaining a statistical vector corresponding to the product name according to the product name corresponding to the blank value if the user-scoring matrix includes a blank value
  • Commodity cluster attribution judgment unit used to obtain the commodity cluster to which the statistical vector corresponding to the commodity name belongs
  • a similar product result obtaining unit configured to obtain a similar product name corresponding to the product name corresponding to the blank value based on the product cluster to which the statistical vector corresponding to the product name belongs, as a similar product result;
  • a similar commodity score obtaining unit configured to obtain a score corresponding to each commodity name in the similar commodity result according to the row vector corresponding to the blank value;
  • the product weighted score acquisition unit is configured to perform weighted averaging based on the score corresponding to each product name in the similar product result to obtain the product weighted score corresponding to the blank value to update the blank value to the corresponding product weighted score.
  • the product weighted score acquisition unit includes:
  • the vector distance set acquisition unit is configured to use the statistical vector corresponding to each product name in the similar product result as a statistical vector group, and use the statistical vector corresponding to the product name corresponding to the blank value as the product score vector to be predicted to obtain the The distance between each statistical vector in the statistical vector group and the score vector of the product to be predicted to obtain a vector distance set;
  • a product weighted total score acquisition unit configured to multiply the corresponding score of each product name in the similar product result by the corresponding vector distance in the vector distance set and sum to obtain a product weighted total score
  • the average score obtaining unit is used to divide the weighted total score of the product by the sum of the vector distances in the vector distance set to obtain the product weighted score corresponding to the blank value.
  • FIG. 7 is a schematic block diagram of a computer device provided by an embodiment of the present application.
  • the computer device 500 includes a processor 502, a memory, and a network interface 505 connected through a system bus 501, where the memory may include a non-volatile storage medium 503 and an internal memory 504.
  • the non-volatile storage medium 503 can store an operating system 5031 and a computer program 5032.
  • the computer program 5032 When executed, it may cause the processor 502 to execute a push method based on re-clustering.
  • the processor 502 is used to provide computing and control capabilities to support the operation of the entire computer device 500.
  • the memory 504 provides an environment for running the computer program 5032 in the non-volatile storage medium 503.
  • the processor 502 can cause the processor 502 to execute a push method based on re-clustering.
  • the network interface 505 is used for network communication, such as the transmission of data information.
  • the processor 502 is used to run the computer program 5032 stored in the memory, so as to implement the re-clustering-based push method of the embodiment of the present application.
  • the embodiment of the computer device shown in FIG. 7 does not constitute a limitation on the specific configuration of the computer device.
  • the computer device may include more or less components than shown in the figure. Or combine certain components, or arrange different components.
  • the computer device may only include a memory and a processor. In such an embodiment, the structures and functions of the memory and the processor are consistent with the embodiment shown in FIG. 7 and will not be repeated here.
  • the processor 502 may be a central processing unit (Central Processing Unit, CPU), and the processor 502 may also be other general-purpose processors, digital signal processors (Digital Signal Processor, DSP), Application specific integrated circuit (Application Specific Integrated Circuit, ASIC), ready-made programmable gate array (Field-Programmable Gate Array, FPGA) or other programmable logic devices, discrete gate or transistor logic devices, discrete hardware components, etc.
  • the general-purpose processor may be a microprocessor or the processor may be any conventional processor.
  • a computer-readable storage medium may be a non-volatile computer-readable storage medium.
  • the computer-readable storage medium stores a computer program, where when the computer program is executed by a processor, the push method based on re-clustering of the embodiment of the present application is implemented.
  • the storage medium may be an internal storage unit of the aforementioned device, such as a hard disk or a memory of the device.
  • the storage medium may also be an external storage device of the device, such as a plug-in hard disk equipped on the device, a smart memory card (Smart) Card (SMC), a secure digital (SD) card, or a flash memory card (Flash Card) etc.
  • the storage medium may also include both an internal storage unit of the device and an external storage device.

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Physics & Mathematics (AREA)
  • Marketing (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Business, Economics & Management (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种基于重聚类的推送方法、装置、计算机设备(500)及存储介质。该方法通过对用户-评分矩阵中各行向量进行DBSCAN聚类,得到按用户分类的聚类群,及与每一聚类群一一对应的子用户-评分矩阵,获取了在子用户-评分矩阵中选定的行向量作为目标用户,根据目标用户所在的子用户-评分矩阵中获取目标用户的相似用户群评分矩阵,及与相似用户群评分矩阵对应的商品推荐行向量,根据商品推荐行向量得到商品推荐列表,将所述商品推荐列表推送至目标用户对应的接收端。

Description

基于重聚类的推送方法、装置、计算机设备及存储介质
本申请要求于2018年10月12日提交中国专利局、申请号为201811191703.1、申请名称为“基于重聚类的推送方法、装置、计算机设备及存储介质”的中国专利申请的优先权,其全部内容通过引用结合在本申请中。
技术领域
本申请涉及信息推送技术领域,尤其涉及一种基于重聚类的推送方法、装置、计算机设备及存储介质。
背景技术
目前,在基于互联网的在线商城上进行网络购物已越来越频繁,这些在线商城对用户进行商品推荐时,通常使用的是基于协同过滤的推荐算法(协同过滤算法,原理是用户喜欢那些具有相似兴趣的用户喜欢过的商品,比如你的朋友喜欢电影哈利波特I,那么就会推荐给你,这是最简单的基于用户的协同过滤算法)。
基于协同过滤的推荐算法常用到用户-评分矩阵,用户-评分矩阵表示用户对项目(项目可以理解为具体的商品)的评分,用户-评分矩阵的横轴为项目,纵轴为用户,当中的值是用户i对项目j的评分。随着商品的数据量越来越大,维护全量的用户-评分矩阵的评分***的成本会越来越高。
发明内容
本申请实施例提供了一种基于重聚类的推送方法、装置、计算机设备及存储介质,旨在解决现有技术中在线商城的全量用户-评分矩阵对应的评分***随着商品数量的增多,越来越臃肿,导致对全量用户-评分矩阵维护困难的问题。
第一方面,本申请实施例提供了一种基于重聚类的推送方法,其包括:
通过DBSCAN聚类对所获取的用户-评分矩阵进行聚类,得到至少一个聚类群,及与每一聚类群一一对应的子用户-评分矩阵;
根据在子用户-评分矩阵中所选中的行向量对应的目标用户,获取目标用户的行向量对应的聚类群;
在目标用户对应的聚类群中,计算获取各评分行向量与目标用户的行向量之间的欧式距离,获取各欧式距离中排名位于预设的第一排名阈值之前的欧式距离对应的评分行向量,以组成相似用户群评分矩阵;
根据相似用户群评分矩阵中各评分行向量,获取相似用户群对各商品的综合评分值,以组成商品推荐行向量;以及
由商品推荐行向量中评分排名位于预设的第二排名阈值之前的综合评分值所对应商品以得到商品推荐列表,将所述商品推荐列表推送至目标用户对应的接收端。
第二方面,本申请实施例提供了一种基于重聚类的推送装置,其包括:
用户聚类单元,用于通过DBSCAN聚类对所获取的用户-评分矩阵进行聚类,得到至少一个聚类群,及与每一聚类群一一对应的子用户-评分矩阵;
聚类判断单元,用于根据在子用户-评分矩阵中所选中的行向量对应的目标用户,获取目标用户的行向量对应的聚类群;
相似用户评分矩阵获取单元,用于在目标用户对应的聚类群中,计算获取各评分行向量与目标用户的行向量之间的欧式距离,获取各欧式距离中排名位于预设的第一排名阈值之前的欧式距离对应的评分行向量,以组成相似用户群评分矩阵;
商品推荐行向量获取单元,用于根据相似用户群评分矩阵中各评分行向量,获取相似用户群对各商品的综合评分值,以组成商品推荐行向量;
信息推送单元,用于由商品推荐行向量中评分排名位于预设的第二排名阈值之前的综合评分值所对应商品以得到商品推荐列表,将所述商品推荐列表推送至目标用户对应的接收端。
第三方面,本申请实施例又提供了一种计算机设备,其包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面所述的基于重聚类的推送方法。
第四方面,本申请实施例还提供了一种计算机可读存储介质,其中所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行上述第一方面所述的基于重聚类的推送方法。
附图说明
为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的基于重聚类的推送方法的流程示意图;
图2为本申请实施例提供的基于重聚类的推送方法的子流程示意图;
图3为本申请实施例提供的基于重聚类的推送方法的另一子流程示意图;
图4为本申请实施例提供的基于重聚类的推送装置的示意性框图;
图5为本申请实施例提供的基于重聚类的推送装置的子单元示意性框图;
图6为本申请实施例提供的基于重聚类的推送装置的另一子单元示意性框图;
图7为本申请实施例提供的计算机设备的示意性框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
请参阅图1,图1是本申请实施例提供的基于重聚类的推送方法的流程示意图,该基于重聚类的推送方法应用于管理服务器中,该方法通过安装于管理服 务器中的应用软件进行执行,管理服务器即是用于进行基于重聚类的推送的企业终端。
如图1所示,该方法包括步骤S110~S150。
S110、通过DBSCAN聚类对所获取的用户-评分矩阵进行聚类,得到至少一个聚类群,及与每一聚类群一一对应的子用户-评分矩阵。
在本实施例中,用户-评分矩阵表示用户对商品(项目可以理解为具体的商品)的评分,用户-评分矩阵的横轴为项目,纵轴为用户,当中的值是用户i对项目j的评分。例如用户-评分矩阵S为4×5的矩阵,如:
Figure PCTCN2018125334-appb-000001
其中,用户-评分矩阵S中第一行的行向量表示用户1分别针对商品1-商品5的评分,第二行的行向量表示用户2分别针对商品1-商品5的评分,第三行的行向量表示用户3分别针对商品1-商品5的评分,第四行的行向量表示用户4分别针对商品1-商品5的评分。
通过DBSCAN聚类模型对用户-评分矩阵中各行向量进行聚类,实现了根据用户对各商品的评分,将相似的用户划分为同一聚类群中,在同一聚类群中各用户对各商品的评分是近似的(也就是对各商品的评分的分差较小)。通过将全量的用户-评分矩阵进行DBSCAN聚类划分为多个子用户-评分矩阵后,只需分别对各子用户-评分矩阵进行维护即可,提高了维护的效率。
在一实施例中,如图2所示,步骤S110包括:
S111、将用户-评分矩阵中任意一个行向量作为初始聚类中心;
S112、根据预设的最小包含点数,获取与初始聚类中心之间的间距在预设的扫描半径之内的行向量,以作为初始聚类群;
S113、将初始聚类群中每一行向量作为聚类中心,获取用户-评分矩阵中与聚类中心直接密度可达、密度可达或密度相连的行向量,以作为调整后的聚类群。
在本实施例中,为了更清楚的理解DBSCAN聚类的详细过程,下面对DBSCAN聚类中所涉及的特征词进行介绍。
eps,表示扫描半径;
minPts,表示最小包含点数;
ξ邻域,表示以给定对象为中心,在给定对象的扫描半径范围内的区域;
核心对象,表示若在给定对象的ξ邻域中所包括的对象个数大于或等于最小包含点数,则称该给定对象为核心对象;
直接密度可达,表示对于样本集合D,如果样本点q在p的ξ邻域内,且p为核心对象,那么对象q从对象p直接密度可达;
密度可达,表示对于样本集合D,给定一串样本点p 1、p 2、……、p n,若p 1=q、且p n=p,假如对象p i从p i-1直接密度可达,那么对象q从对象p密度可达;
密度相连,表示存在样本集合D中的一点o,如果对象o到对象p和对象q都是密度可达的,那么p和q密度相连。
DBSCAN(Density-Based Spatial Clustering of Applications with Noise)是一个比较有代表性的基于密度的聚类算法。
DBSCAN需要二个参数:扫描半径(eps)和最小包含点数(minPts)。任选一个未被访问(unvisited)的点开始,找出与其距离在eps之内(包括eps)的所有附近点。
如果附近点的数量≥minPts,则当前点与其附近点形成一个簇,并且出发点被标记为已访问(visited)。然后递归,以相同的方法处理该簇内所有未被标记为已访问(visited)的点,从而对簇进行扩展。如果附近点的数量<minPts,则该点暂时被标记作为噪声点。如果簇充分地被扩展,即簇内的所有点被标记为已访问,然后用同样的算法去处理未被访问的点。
S120、根据在子用户-评分矩阵中所选中的行向量对应的目标用户,获取目标用户的行向量对应的聚类群。
在本实施例中,在多个聚类群中的其中一个聚类群对应的子用户-评分矩阵中,选中一个行向量作为目标向量后,同时会获取该行向量所属的聚类群,这样即可快速判断目标用户的相似用户。
S130、在目标用户对应的聚类群中,计算获取各评分行向量与目标用户的行向量之间的欧式距离,获取各欧式距离中排名位于预设的第一排名阈值之前的欧式距离对应的评分行向量,以组成相似用户群评分矩阵。
在本实施例中,为了判断目标用户所属的聚类群中与目标用户相似的用户,可以获取聚类群中各评分行向量与目标用户的行向量之间的欧式距离,将各欧 式距离按降序排序后,获取获取各欧式距离中排名位于预设的第一排名阈值之前的欧式距离对应的评分行向量,以组成相似用户群评分矩阵。如将第一排名阈值设置为11,则获取各欧式距离中排名1-10名的欧式距离对应的评分行向量,以这10个行向量组成相似用户群评分矩阵。获取了目标用户的相似用户之后,即可通过少量被选中的行向量进行计算,无需调用全量的用户-评分矩阵,降低了运行过程中的计算量。
在一实施例中,步骤S130中包括:
获取各欧式距离中排名位于预设的第一排名阈值之前的欧式距离对应的评分行向量,按照评分行向量在对应的子用户-评分矩阵中行序号的先后顺序进行排列,得到相似用户群评分矩阵。
在本实施例中,按照各评分行向量在对应的子用户-评分矩阵中各行出现的先后顺序,来依序获取各相似用户的评分行向量,上述方式能精确获取各相似用户对应的评分行向量组成的相似用户群评分矩阵,便于后续计算用户对各商品的综合评分值。
S140、根据相似用户群评分矩阵中各评分行向量,获取相似用户群对各商品的综合评分值,以组成商品推荐行向量。
在本实施例中,获取了目标用户的相似用户对各商品的评分后,即可针对每一商品计算相似用户对其综合评分值。在综合考虑目标用户与相似用户中各用户之间的欧氏距离,以及相似用户对各商品的评分值,即可运算得到商品推荐行向量,以商品推荐行向量作为商品推荐的依据。
在一实施例中,如图3所示,步骤S140包括:
S141、根据相似用户群评分矩阵中各评分行向量分别与目标用户的行向量之间的欧式距离,以组成相似用户群欧式距离行向量;
S142、根据相似用户群欧式距离行向量与相似用户群评分矩阵相乘得到相似用户群对各商品的综合评分值,以组成商品推荐行向量。
在本实施例中,例如由用户-评分矩阵S进行DBSCAN聚类后,得到第一聚类群和第二聚类群,其中第一聚类群包括用户1和用户2的评分行向量,第二聚类群包括用户3和用户4的评分行向量。此时第一聚类群对应的子用户-评分矩阵由用户1和用户2的评分行向量组成,第二聚类群对应的子用户-评分矩阵由用户3和用户4的评分行向量组成。
若选定了用户1作为目标用户,则用户1的评分行向量对应的聚类群为第一聚类群,在第一聚类群中除了包括用户1的评分向量,还包括用户2的评分行向量。此时,相似用户群评分矩阵为[0 4 1 3 2],相似用户群评分矩阵[0 4 1 3 2]与目标用户的评分行向量[1 3 1 5 2]之间的欧式距离为
Figure PCTCN2018125334-appb-000002
将相似用户群欧式距离行向量
Figure PCTCN2018125334-appb-000003
与标用户的行向量[1 3 1 5 2]相乘得到
Figure PCTCN2018125334-appb-000004
即得到了相似用户群对各商品的综合评分值组成的商品推荐行向量。
当根据与目标用户所属的聚类群中各用户对应的评分行向量和与目标用户的评分行向量的欧氏距离,计算得到商品推荐行向量,在商品推荐行向量中对各商品的评分排位靠前的商品即可作为商品推荐列表的组成元素之一,这样通过商品推荐行向量得到的推荐商品由于充分考虑了近似用户的喜好,故能准确的反映目标用户的喜好。
S150、由商品推荐行向量中评分排名位于预设的第二排名阈值之前的综合评分值所对应商品以得到商品推荐列表,将所述商品推荐列表推送至目标用户对应的接收端。
在本实施例中,在计算所得到的商品推荐行向量中,即可获知目标用户所属的聚类群中各用户对各商品的综合评分,以该综合评分中评分排名位于第二排名阈值之前(如设置第二排名阈值为4)的评分所对应商品即可作为商品推荐列表的推荐项。
例如,目标用户(用户1)的相似用户(用户2)对应的商品推荐行向量中评分位于前3名的商品分别是商品2、商品4和商品5,此时将上述3件商品作为商品列表推送至目标用户。
通过上述基于欧氏距离的计算,能将相似用户的商品喜好作为对目标用户推荐商品时所考虑的主要因素,能更合理的进行商品推荐。
在一实施例中,步骤S110之前还包括:
获取历史商品信息集合,通过词频-逆文本频率指数模型对所述历史商品信息集合中每一历史商品信息均进行关键词信息抽取,得到与每一历史商品信息对应的商品关键词集合;
通过Word2Vec模型获取每一商品关键词集合中各商品关键词对应的词向量;
获取每一商品关键词集合中各商品关键词所对应词向量的平均值,以得到 与每一商品关键词集合对应的统计向量;
通过DBSCAN聚类模型对商品关键词集合对应的统计向量进行聚类,得到至少一个商品聚类簇;
若用户-评分矩阵中包括空白值,根据所述空白值对应的商品名称,以获取与商品名称相应的统计向量;
获取与商品名称相应的统计向量所归属的商品聚类簇;
根据与商品名称相应的统计向量所归属的商品聚类簇,获取与所述空白值对应的商品名称相应的相似商品名称,以作为相似商品结果;
根据所述空白值对应的行向量,获取与所述相似商品结果中每一商品名称对应的评分;
根据与所述相似商品结果中每一商品名称对应的评分进行加权平均,得到所述空白值对应的商品加权评分,以将空白值更新为对应的商品加权评分。
在本实施例中,管理服务器中所提供的面向用户的UI界面中,用户可以选择多种商品中的一种或多种并进行购买。在管理服务器中是存储有历史商品信息集合,历史商品信息集合中每一历史商品信息包括由商品名称和商品属性,其中商品的属性包括商品的价格、标签、品牌和功能等。
当通过TF-IDF模型(即term frequency-inverse document frequency,表示词频-逆文本频率指数模型)对所述历史商品信息集合中每一历史商品信息均进行关键词信息抽取,可以将每一历史商品信息简化表述为对应的商品关键词集合。
词频-逆文本频率指数模型是一种用于信息检索与数据挖掘的常用加权技术。TF意思是词频(Term Frequency),IDF意思是逆文本频率指数(Inverse Document Frequency)。TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。
例如,有一斯伯丁品牌XX型号YY元的篮球,其还有产地、尺寸等丰富的商品信息,但是经过TF-IDF模型进行关键词抽取后,最后得到的商品关键词集合为“篮球+斯伯丁+XX型号”。这样,将每一历史商品信息均简化为对应的商品关键词集合,能便于转化为词向量。
再将历史商品信息集合转化为与每一历史商品信息对应的商品关键词集合后,可通过Word2Vec模型(Word2Vec是从大量文本语料中以无监督的方式学 习语义知识的一种模型)将商品关键词集合转化为与每一历史商品信息一一对应的词向量。
例如在语料库中,篮球、斯伯丁、XX型号各对应一个向量,向量中只有一个值为1,其余都为0,将上述信息对应的向量输入Word2Vec模型即可转化为低维度的连续值,也就是稠密向量,并且其中意思相近的词将被映射到向量空间中相近的位置。
在获取了商品关键词集合中各各商品关键词的词向量,再取各商品关键词的词向量平均值作为该商品的统计向量即可。此时即将历史商品信息集合中每一历史商品信息均转化为对应的统计向量,之后将通过DBSCAN聚类模型对商品关键词集合对应的统计向量进行聚类,可得到至少一个商品聚类簇。
由于确定了所述空白值在初始用户-评分矩阵中所归属的行向量后,即可知道是哪一用户针对哪一商品的商品评分是空白值,此时先获取所述空白值对应的商品名称即可知道该商品名称所对应的统计向量。然后判断该统计向量所归属的商品聚类簇,即可获取该商品聚类簇中其他商品的相似商品名称,以作为所述空白值对应的商品名称的相似商品结果。由于所述空白值在初始用户-评分矩阵中所归属的行向量中,可获知该用户针对相似商品结果中各相似商品名称的评分。最后根据该用户针对各相似商品名称的评分进行加权平均,得到所述空白值对应的商品加权评分。
在一实施例中,所述根据与所述相似商品结果中每一商品名称对应的评分进行加权平均,得到所述空白值对应的商品加权评分,包括:
将所述相似商品结果中每一商品名称对应的统计向量作为统计向量组,将所述空白值对应商品名称相应的统计向量作为待预测商品评分向量,获取所述统计向量组中每一统计向量与待预测商品评分向量之间的距离,以得到向量距离集合;
将所述相似商品结果中每一商品名称对应评分乘以向量距离集合中对应的向量距离并求和,得到商品加权总评分;
将商品加权总评分除以向量距离集合中各向量距离之和,得到所述空白值对应的商品加权评分。
在本实施例中,若将所述统计向量组中每一统计向量与待预测商品评分向量之间的距离记为d ck,将所述空白值所在行向量对应的用户对所述相似商品结 果中每一商品名称对应评分记为S ic,通过如下公式计算得到所述空白值对应的商品加权评分:
Figure PCTCN2018125334-appb-000005
其中,Score k表示所述空白值对应商品k的商品加权评分,m为所述相似商品结果中相似商品c的总个数。
例如,用户1针对商品2的评分为空白值,而得到商品2对应的相似商品结果为商品4和商品5,且用户1针对商品4和商品5的评分分别为3和4,商品4对应的统计向量与商品2对应的统计向量之间的距离为0.5,商品5对应的统计向量与商品2对应的统计向量之间的距离为1,则:
Score 2=(0.5*3+1*4)/(0.5+1)=11/3;
此时,将上述计算得到的Score2作为所述空白值对应的商品加权评分。
通过对新用户所缺少的商品评分,通过基于内容的预测方法,能有效的补全用户-评分矩阵,避免了推荐过程中冷启动的问题。
该方法实现了将用户-评分矩阵划分为多个子矩阵分别进行维护,降低维护成本,而且能根据子矩阵横精准对目标用户进行商品信息推送。
本申请实施例还提供一种基于重聚类的推送装置,该基于重聚类的推送装置用于执行前述基于重聚类的推送方法的任一实施例。具体地,请参阅图4,图4是本申请实施例提供的基于重聚类的推送装置的示意性框图。该基于重聚类的推送装置100可以配置于管理服务器中。
如图4所示,基于重聚类的推送装置100包括用户聚类单元110、聚类判断单元120、相似用户评分矩阵获取单元130、商品推荐行向量获取单元140、和信息推送单元150。
用户聚类单元110,用于通过DBSCAN聚类对所获取的用户-评分矩阵进行聚类,得到至少一个聚类群,及与每一聚类群一一对应的子用户-评分矩阵。
在一实施例中,如图5所示,用户聚类单元110包括:
初始中心获取单元111,用于将用户-评分矩阵中任意一个行向量作为初始聚类中心;
初始聚类群获取单元112,用于根据预设的最小包含点数,获取与初始聚类中心之间的间距在预设的扫描半径之内的行向量,以作为初始聚类群;
聚类群调整单元113,用于将初始聚类群中每一行向量作为聚类中心,获取用户-评分矩阵中与聚类中心直接密度可达、密度可达或密度相连的行向量,以作为调整后的聚类群。
聚类判断单元120,用于根据在子用户-评分矩阵中所选中的行向量对应的目标用户,获取目标用户的行向量对应的聚类群。
相似用户评分矩阵获取单元130,用于在目标用户对应的聚类群中,计算获取各评分行向量与目标用户的行向量之间的欧式距离,获取各欧式距离中排名位于预设的第一排名阈值之前的欧式距离对应的评分行向量,以组成相似用户群评分矩阵。
商品推荐行向量获取单元140,用于根据相似用户群评分矩阵中各评分行向量,获取相似用户群对各商品的综合评分值,以组成商品推荐行向量。
在一实施例中,如图6所示,商品推荐行向量获取单元140包括:
欧式距离行向量获取单元141,用于根据相似用户群评分矩阵中各评分行向量分别与目标用户的行向量之间的欧式距离,以组成相似用户群欧式距离行向量;
综合评分值计算单元142,用于根据相似用户群欧式距离行向量与相似用户群评分矩阵相乘得到相似用户群对各商品的综合评分值,以组成商品推荐行向量。
信息推送单元150,用于由商品推荐行向量中评分排名位于预设的第二排名阈值之前的综合评分值所对应商品以得到商品推荐列表,将所述商品推荐列表推送至目标用户对应的接收端。
在一实施例中,基于重聚类的推送装置100,还包括:
历史关键词集合获取单元,用于获取历史商品信息集合,通过词频-逆文本频率指数模型对所述历史商品信息集合中每一历史商品信息均进行关键词信息抽取,得到与每一历史商品信息对应的商品关键词集合;
词向量转化单元,用于通过Word2Vec模型获取每一商品关键词集合中各商品关键词对应的词向量;
统计向量获取单元,用于获取每一商品关键词集合中各商品关键词所对应词向量的平均值,以得到与每一商品关键词集合对应的统计向量;
商品聚类单元,用于通过DBSCAN聚类模型对商品关键词集合对应的统计 向量进行聚类,得到至少一个商品聚类簇;
待预测向量获取单元,用于若用户-评分矩阵中包括空白值,根据所述空白值对应的商品名称,以获取与商品名称相应的统计向量;
商品聚类簇归属判断单元,用于获取与商品名称相应的统计向量所归属的商品聚类簇;
相似商品结果获取单元,用于根据与商品名称相应的统计向量所归属的商品聚类簇,获取与所述空白值对应的商品名称相应的相似商品名称,以作为相似商品结果;
相似商品评分获取单元,用于根据所述空白值对应的行向量,获取与所述相似商品结果中每一商品名称对应的评分;
商品加权评分获取单元,用于根据与所述相似商品结果中每一商品名称对应的评分进行加权平均,得到所述空白值对应的商品加权评分,以将空白值更新为对应的商品加权评分。
在一实施例中,商品加权评分获取单元,包括:
向量距离集合获取单元,用于将所述相似商品结果中每一商品名称对应的统计向量作为统计向量组,将所述空白值对应商品名称相应的统计向量作为待预测商品评分向量,获取所述统计向量组中每一统计向量与待预测商品评分向量之间的距离,以得到向量距离集合;
商品加权总评分获取单元,用于将所述相似商品结果中每一商品名称对应评分乘以向量距离集合中对应的向量距离并求和,得到商品加权总评分;
平均分获取单元,用于将商品加权总评分除以向量距离集合中各向量距离之和,得到所述空白值对应的商品加权评分。
上述基于重聚类的推送装置可以实现为计算机程序的形式,该计算机程序可以在如图7所示的计算机设备上运行。请参阅图7,图7是本申请实施例提供的计算机设备的示意性框图。
参阅图7,该计算机设备500包括通过***总线501连接的处理器502、存储器和网络接口505,其中,存储器可以包括非易失性存储介质503和内存储器504。该非易失性存储介质503可存储操作***5031和计算机程序5032。该计算机程序5032被执行时,可使得处理器502执行基于重聚类的推送方法。该处理器502用于提供计算和控制能力,支撑整个计算机设备500的运行。该内存 储器504为非易失性存储介质503中的计算机程序5032的运行提供环境,该计算机程序5032被处理器502执行时,可使得处理器502执行基于重聚类的推送方法。该网络接口505用于进行网络通信,如提供数据信息的传输等。本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备500的限定,具体的计算机设备500可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
其中,所述处理器502用于运行存储在存储器中的计算机程序5032,以实现本申请实施例的基于重聚类的推送方法。
本领域技术人员可以理解,图7中示出的计算机设备的实施例并不构成对计算机设备具体构成的限定,在其他实施例中,计算机设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。例如,在一些实施例中,计算机设备可以仅包括存储器及处理器,在这样的实施例中,存储器及处理器的结构及功能与图7所示实施例一致,在此不再赘述。
应当理解,在本申请实施例中,处理器502可以是中央处理单元(Central Processing Unit,CPU),该处理器502还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
在本申请的另一实施例中提供计算机可读存储介质。该计算机可读存储介质可以为非易失性的计算机可读存储介质。该计算机可读存储介质存储有计算机程序,其中计算机程序被处理器执行时实现本申请实施例的基于重聚类的推送方法。
所述存储介质可以是前述设备的内部存储单元,例如设备的硬盘或内存。所述存储介质也可以是所述设备的外部存储设备,例如所述设备上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储介质还可以既包括所述设备的内部存储单元也包括外部存储设备。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描 述的设备、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (20)

  1. 一种基于重聚类的推送方法,包括:
    通过DBSCAN聚类对所获取的用户-评分矩阵进行聚类,得到至少一个聚类群,及与每一聚类群一一对应的子用户-评分矩阵;
    根据在子用户-评分矩阵中所选中的行向量对应的目标用户,获取目标用户的行向量对应的聚类群;
    在目标用户对应的聚类群中,计算获取各评分行向量与目标用户的行向量之间的欧式距离,获取各欧式距离中排名位于预设的第一排名阈值之前的欧式距离对应的评分行向量,以组成相似用户群评分矩阵;
    根据相似用户群评分矩阵中各评分行向量,获取相似用户群对各商品的综合评分值,以组成商品推荐行向量;以及
    由商品推荐行向量中评分排名位于预设的第二排名阈值之前的综合评分值所对应商品以得到商品推荐列表,将所述商品推荐列表推送至目标用户对应的接收端。
  2. 根据权利要求1所述的基于重聚类的推送方法,其中,所述通过DBSCAN聚类对用户-评分矩阵进行聚类,得到至少一个聚类群,包括:
    将用户-评分矩阵中任意一个行向量作为初始聚类中心;
    根据预设的最小包含点数,获取与初始聚类中心之间的间距在预设的扫描半径之内的行向量,以作为初始聚类群;
    将初始聚类群中每一行向量作为聚类中心,获取用户-评分矩阵中与聚类中心直接密度可达、密度可达或密度相连的行向量,以作为调整后的聚类群。
  3. 根据权利要求1所述的基于重聚类的推送方法,其中,所述根据相似用户群评分矩阵中各评分行向量,获取相似用户群对各商品的综合评分值,以组成商品推荐行向量,包括:
    根据相似用户群评分矩阵中各评分行向量分别与目标用户的行向量之间的欧式距离,以组成相似用户群欧式距离行向量;
    根据相似用户群欧式距离行向量与相似用户群评分矩阵相乘得到相似用户群对各商品的综合评分值,以组成商品推荐行向量。
  4. 根据权利要求1所述的基于重聚类的推送方法,其中,所述获取各欧式 距离中排名位于预设的第一排名阈值之前的欧式距离对应的评分行向量,以组成相似用户群评分矩阵,包括:
    获取各欧式距离中排名位于预设的第一排名阈值之前的欧式距离对应的评分行向量,按照评分行向量在对应的子用户-评分矩阵中行序号的先后顺序进行排列,得到相似用户群评分矩阵。
  5. 根据权利要求1所述的基于重聚类的推送方法,其中,所述通过DBSCAN聚类对所获取的用户-评分矩阵进行聚类,得到至少一个聚类群,及与每一聚类群一一对应的子用户-评分矩阵之前,还包括:
    获取历史商品信息集合,通过词频-逆文本频率指数模型对所述历史商品信息集合中每一历史商品信息均进行关键词信息抽取,得到与每一历史商品信息对应的商品关键词集合;
    通过Word2Vec模型获取每一商品关键词集合中各商品关键词对应的词向量;
    获取每一商品关键词集合中各商品关键词所对应词向量的平均值,以得到与每一商品关键词集合对应的统计向量;
    通过DBSCAN聚类模型对商品关键词集合对应的统计向量进行聚类,得到至少一个商品聚类簇;
    若用户-评分矩阵中包括空白值,根据所述空白值对应的商品名称,以获取与商品名称相应的统计向量;
    获取与商品名称相应的统计向量所归属的商品聚类簇;
    根据与商品名称相应的统计向量所归属的商品聚类簇,获取与所述空白值对应的商品名称相应的相似商品名称,以作为相似商品结果;
    根据所述空白值对应的行向量,获取与所述相似商品结果中每一商品名称对应的评分;
    根据与所述相似商品结果中每一商品名称对应的评分进行加权平均,得到所述空白值对应的商品加权评分,以将空白值更新为对应的商品加权评分。
  6. 根据权利要求5所述的基于重聚类的推送方法,其中,所述根据与所述相似商品结果中每一商品名称对应的评分进行加权平均,得到所述空白值对应的商品加权评分,包括:
    将所述相似商品结果中每一商品名称对应的统计向量作为统计向量组,将 所述空白值对应商品名称相应的统计向量作为待预测商品评分向量,获取所述统计向量组中每一统计向量与待预测商品评分向量之间的距离,以得到向量距离集合;
    将所述相似商品结果中每一商品名称对应评分乘以向量距离集合中对应的向量距离并求和,得到商品加权总评分;
    将商品加权总评分除以向量距离集合中各向量距离之和,得到所述空白值对应的商品加权评分。
  7. 一种基于重聚类的推送装置,包括:
    用户聚类单元,用于通过DBSCAN聚类对所获取的用户-评分矩阵进行聚类,得到至少一个聚类群,及与每一聚类群一一对应的子用户-评分矩阵;
    聚类判断单元,用于根据在子用户-评分矩阵中所选中的行向量对应的目标用户,获取目标用户的行向量对应的聚类群;
    相似用户评分矩阵获取单元,用于在目标用户对应的聚类群中,计算获取各评分行向量与目标用户的行向量之间的欧式距离,获取各欧式距离中排名位于预设的第一排名阈值之前的欧式距离对应的评分行向量,以组成相似用户群评分矩阵;
    商品推荐行向量获取单元,用于根据相似用户群评分矩阵中各评分行向量,获取相似用户群对各商品的综合评分值,以组成商品推荐行向量;
    信息推送单元,用于由商品推荐行向量中评分排名位于预设的第二排名阈值之前的综合评分值所对应商品以得到商品推荐列表,将所述商品推荐列表推送至目标用户对应的接收端。
  8. 根据权利要求7所述的基于重聚类的推送装置,其中,所述用户聚类单元,包括:
    初始中心获取单元,用于将用户-评分矩阵中任意一个行向量作为初始聚类中心;
    初始聚类群获取单元,用于根据预设的最小包含点数,获取与初始聚类中心之间的间距在预设的扫描半径之内的行向量,以作为初始聚类群;
    聚类群调整单元,用于将初始聚类群中每一行向量作为聚类中心,获取用户-评分矩阵中与聚类中心直接密度可达、密度可达或密度相连的行向量,以作为调整后的聚类群。
  9. 根据权利要求7所述的基于重聚类的推送装置,其中,所述商品推荐行向量获取单元,包括:
    欧式距离行向量获取单元,用于根据相似用户群评分矩阵中各评分行向量分别与目标用户的行向量之间的欧式距离,以组成相似用户群欧式距离行向量;
    综合评分值计算单元,用于根据相似用户群欧式距离行向量与相似用户群评分矩阵相乘得到相似用户群对各商品的综合评分值,以组成商品推荐行向量。
  10. 根据权利要求7所述的基于重聚类的推送装置,还包括:
    历史关键词集合获取单元,用于获取历史商品信息集合,通过词频-逆文本频率指数模型对所述历史商品信息集合中每一历史商品信息均进行关键词信息抽取,得到与每一历史商品信息对应的商品关键词集合;
    词向量转化单元,用于通过Word2Vec模型获取每一商品关键词集合中各商品关键词对应的词向量;
    统计向量获取单元,用于获取每一商品关键词集合中各商品关键词所对应词向量的平均值,以得到与每一商品关键词集合对应的统计向量;
    商品聚类单元,用于通过DBSCAN聚类模型对商品关键词集合对应的统计向量进行聚类,得到至少一个商品聚类簇;
    待预测向量获取单元,用于若用户-评分矩阵中包括空白值,根据所述空白值对应的商品名称,以获取与商品名称相应的统计向量;
    商品聚类簇归属判断单元,用于获取与商品名称相应的统计向量所归属的商品聚类簇;
    相似商品结果获取单元,用于根据与商品名称相应的统计向量所归属的商品聚类簇,获取与所述空白值对应的商品名称相应的相似商品名称,以作为相似商品结果;
    相似商品评分获取单元,用于根据所述空白值对应的行向量,获取与所述相似商品结果中每一商品名称对应的评分;
    商品加权评分获取单元,用于根据与所述相似商品结果中每一商品名称对应的评分进行加权平均,得到所述空白值对应的商品加权评分,以将空白值更新为对应的商品加权评分。
  11. 一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其中,所述处理器执行所述计算机程序时实现 以下步骤:
    通过DBSCAN聚类对所获取的用户-评分矩阵进行聚类,得到至少一个聚类群,及与每一聚类群一一对应的子用户-评分矩阵;
    根据在子用户-评分矩阵中所选中的行向量对应的目标用户,获取目标用户的行向量对应的聚类群;
    在目标用户对应的聚类群中,计算获取各评分行向量与目标用户的行向量之间的欧式距离,获取各欧式距离中排名位于预设的第一排名阈值之前的欧式距离对应的评分行向量,以组成相似用户群评分矩阵;
    根据相似用户群评分矩阵中各评分行向量,获取相似用户群对各商品的综合评分值,以组成商品推荐行向量;以及
    由商品推荐行向量中评分排名位于预设的第二排名阈值之前的综合评分值所对应商品以得到商品推荐列表,将所述商品推荐列表推送至目标用户对应的接收端。
  12. 根据权利要求11所述的计算机设备,其中,所述通过DBSCAN聚类对用户-评分矩阵进行聚类,得到至少一个聚类群,包括:
    将用户-评分矩阵中任意一个行向量作为初始聚类中心;
    根据预设的最小包含点数,获取与初始聚类中心之间的间距在预设的扫描半径之内的行向量,以作为初始聚类群;
    将初始聚类群中每一行向量作为聚类中心,获取用户-评分矩阵中与聚类中心直接密度可达、密度可达或密度相连的行向量,以作为调整后的聚类群。
  13. 根据权利要求11所述的计算机设备,其中,所述根据相似用户群评分矩阵中各评分行向量,获取相似用户群对各商品的综合评分值,以组成商品推荐行向量,包括:
    根据相似用户群评分矩阵中各评分行向量分别与目标用户的行向量之间的欧式距离,以组成相似用户群欧式距离行向量;
    根据相似用户群欧式距离行向量与相似用户群评分矩阵相乘得到相似用户群对各商品的综合评分值,以组成商品推荐行向量。
  14. 根据权利要求11所述的计算机设备,其中,所述获取各欧式距离中排名位于预设的第一排名阈值之前的欧式距离对应的评分行向量,以组成相似用户群评分矩阵,包括:
    获取各欧式距离中排名位于预设的第一排名阈值之前的欧式距离对应的评分行向量,按照评分行向量在对应的子用户-评分矩阵中行序号的先后顺序进行排列,得到相似用户群评分矩阵。
  15. 根据权利要求11所述的计算机设备,其中,所述通过DBSCAN聚类对所获取的用户-评分矩阵进行聚类,得到至少一个聚类群,及与每一聚类群一一对应的子用户-评分矩阵之前,还包括:
    获取历史商品信息集合,通过词频-逆文本频率指数模型对所述历史商品信息集合中每一历史商品信息均进行关键词信息抽取,得到与每一历史商品信息对应的商品关键词集合;
    通过Word2Vec模型获取每一商品关键词集合中各商品关键词对应的词向量;
    获取每一商品关键词集合中各商品关键词所对应词向量的平均值,以得到与每一商品关键词集合对应的统计向量;
    通过DBSCAN聚类模型对商品关键词集合对应的统计向量进行聚类,得到至少一个商品聚类簇;
    若用户-评分矩阵中包括空白值,根据所述空白值对应的商品名称,以获取与商品名称相应的统计向量;
    获取与商品名称相应的统计向量所归属的商品聚类簇;
    根据与商品名称相应的统计向量所归属的商品聚类簇,获取与所述空白值对应的商品名称相应的相似商品名称,以作为相似商品结果;
    根据所述空白值对应的行向量,获取与所述相似商品结果中每一商品名称对应的评分;
    根据与所述相似商品结果中每一商品名称对应的评分进行加权平均,得到所述空白值对应的商品加权评分,以将空白值更新为对应的商品加权评分。
  16. 根据权利要求15所述的计算机设备,其中,所述根据与所述相似商品结果中每一商品名称对应的评分进行加权平均,得到所述空白值对应的商品加权评分,包括:
    将所述相似商品结果中每一商品名称对应的统计向量作为统计向量组,将所述空白值对应商品名称相应的统计向量作为待预测商品评分向量,获取所述统计向量组中每一统计向量与待预测商品评分向量之间的距离,以得到向量距 离集合;
    将所述相似商品结果中每一商品名称对应评分乘以向量距离集合中对应的向量距离并求和,得到商品加权总评分;
    将商品加权总评分除以向量距离集合中各向量距离之和,得到所述空白值对应的商品加权评分。
  17. 一种计算机可读存储介质,其中,所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行以下操作:
    通过DBSCAN聚类对所获取的用户-评分矩阵进行聚类,得到至少一个聚类群,及与每一聚类群一一对应的子用户-评分矩阵;
    根据在子用户-评分矩阵中所选中的行向量对应的目标用户,获取目标用户的行向量对应的聚类群;
    在目标用户对应的聚类群中,计算获取各评分行向量与目标用户的行向量之间的欧式距离,获取各欧式距离中排名位于预设的第一排名阈值之前的欧式距离对应的评分行向量,以组成相似用户群评分矩阵;
    根据相似用户群评分矩阵中各评分行向量,获取相似用户群对各商品的综合评分值,以组成商品推荐行向量;以及
    由商品推荐行向量中评分排名位于预设的第二排名阈值之前的综合评分值所对应商品以得到商品推荐列表,将所述商品推荐列表推送至目标用户对应的接收端。
  18. 根据权利要求17所述的存储介质,其中,所述通过DBSCAN聚类对用户-评分矩阵进行聚类,得到至少一个聚类群,包括:
    将用户-评分矩阵中任意一个行向量作为初始聚类中心;
    根据预设的最小包含点数,获取与初始聚类中心之间的间距在预设的扫描半径之内的行向量,以作为初始聚类群;
    将初始聚类群中每一行向量作为聚类中心,获取用户-评分矩阵中与聚类中心直接密度可达、密度可达或密度相连的行向量,以作为调整后的聚类群。
  19. 根据权利要求17所述的存储介质,其中,所述根据相似用户群评分矩阵中各评分行向量,获取相似用户群对各商品的综合评分值,以组成商品推荐行向量,包括:
    根据相似用户群评分矩阵中各评分行向量分别与目标用户的行向量之间的 欧式距离,以组成相似用户群欧式距离行向量;
    根据相似用户群欧式距离行向量与相似用户群评分矩阵相乘得到相似用户群对各商品的综合评分值,以组成商品推荐行向量。
  20. 根据权利要求17所述的存储介质,其中,所述获取各欧式距离中排名位于预设的第一排名阈值之前的欧式距离对应的评分行向量,以组成相似用户群评分矩阵,包括:
    获取各欧式距离中排名位于预设的第一排名阈值之前的欧式距离对应的评分行向量,按照评分行向量在对应的子用户-评分矩阵中行序号的先后顺序进行排列,得到相似用户群评分矩阵。
PCT/CN2018/125334 2018-10-12 2018-12-29 基于重聚类的推送方法、装置、计算机设备及存储介质 WO2020073534A1 (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201811191703.1 2018-10-12
CN201811191703.1A CN109166017B (zh) 2018-10-12 2018-10-12 基于重聚类的推送方法、装置、计算机设备及存储介质

Publications (1)

Publication Number Publication Date
WO2020073534A1 true WO2020073534A1 (zh) 2020-04-16

Family

ID=64878156

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2018/125334 WO2020073534A1 (zh) 2018-10-12 2018-12-29 基于重聚类的推送方法、装置、计算机设备及存储介质

Country Status (2)

Country Link
CN (1) CN109166017B (zh)
WO (1) WO2020073534A1 (zh)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111612583A (zh) * 2020-05-19 2020-09-01 江苏大学 一种基于聚类的个性化导购***
CN111813905A (zh) * 2020-06-17 2020-10-23 平安科技(深圳)有限公司 语料生成方法、装置、计算机设备及存储介质
CN111859281A (zh) * 2020-05-29 2020-10-30 石化盈科信息技术有限责任公司 物品补给时间预测方法、装置、存储介质及电子设备
CN111950632A (zh) * 2020-08-12 2020-11-17 贝壳技术有限公司 用于实现聚类的方法、装置、介质以及电子设备
CN112036987A (zh) * 2020-09-11 2020-12-04 杭州海康威视数字技术股份有限公司 确定推荐商品的方法和装置
CN112381598A (zh) * 2020-10-26 2021-02-19 泰康保险集团股份有限公司 产品服务信息推送方法及装置
CN112633978A (zh) * 2020-12-22 2021-04-09 重庆大学 图神经网络模型构建方法、用于商品推荐的方法、装置及设备
CN113822734A (zh) * 2021-01-18 2021-12-21 北京沃东天骏信息技术有限公司 用于生成信息的方法和装置
CN115018584A (zh) * 2022-06-13 2022-09-06 浙江理工大学 融合评论文本主题词情感倾向和用户信任关系的推荐方法
CN116402399A (zh) * 2023-04-14 2023-07-07 北京智慧大王科技有限公司 基于人工智能与电子商城的业务数据处理方法及***
CN116702304A (zh) * 2023-08-08 2023-09-05 中建五局第三建设有限公司 一种基于无监督学习的基坑设计方案分组方法和装置
CN117350823A (zh) * 2023-12-04 2024-01-05 北京国双科技有限公司 一种电子商城用商品信息推荐方法、***、设备及介质
CN117493913A (zh) * 2023-11-24 2024-02-02 济南高更食品科技有限公司 一种基于用户反馈的复合调味料控制方法及***
CN117633165A (zh) * 2023-10-20 2024-03-01 广州天晟网络信息有限公司 一种智能ai客服对话引导方法
CN117851464A (zh) * 2024-03-07 2024-04-09 济南道图信息科技有限公司 一种用于心理评估的用户行为模式辅助分析方法
CN117952726A (zh) * 2024-03-27 2024-04-30 摘星社信息科技(浙江)股份有限公司 一种基于运营商数据分析的个性化权益包推荐***

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109949070B (zh) * 2019-01-28 2024-03-26 平安科技(深圳)有限公司 用户黏度评估方法、装置、计算机设备及存储介质
CN109829761A (zh) * 2019-01-31 2019-05-31 广州视源电子科技股份有限公司 一种商品选择方法、装置、设备和存储介质
CN109977299B (zh) * 2019-02-21 2022-12-27 西北大学 一种融合项目热度和专家系数的推荐算法
CN109903138B (zh) * 2019-02-28 2021-05-18 华中科技大学 一种个性化商品推荐方法
CN111984837B (zh) * 2019-05-23 2021-04-23 浙江口碑网络技术有限公司 商品数据的处理方法、装置及设备
CN110503506B (zh) * 2019-07-05 2022-07-08 平安科技(深圳)有限公司 基于评分数据的物品推荐方法、装置及介质
CN112307309B (zh) * 2019-07-26 2022-12-06 中移(苏州)软件技术有限公司 一种信息推荐方法及装置、存储介质
CN110717097A (zh) * 2019-09-06 2020-01-21 中国平安财产保险股份有限公司 业务推荐方法、装置、计算机设备和存储介质
CN112307324A (zh) * 2020-03-04 2021-02-02 北京字节跳动网络技术有限公司 信息处理方法、装置、设备和介质
CN111639263B (zh) * 2020-06-03 2023-11-24 小红书科技有限公司 笔记推荐方法、装置及***
CN111881191B (zh) * 2020-08-05 2021-06-11 留洋汇(厦门)金融技术服务有限公司 移动互联网下的客户画像关键特征挖掘***与方法
CN111986005A (zh) * 2020-08-31 2020-11-24 上海博泰悦臻电子设备制造有限公司 活动推荐方法及相关设备
CN113836310B (zh) * 2021-08-04 2022-11-29 欧冶工业品股份有限公司 知识图谱驱动的工业品供应链管理方法和***
CN113763134A (zh) * 2021-09-22 2021-12-07 携程旅游信息技术(上海)有限公司 信息推荐方法、***、设备及存储介质
CN117851650B (zh) * 2024-03-05 2024-05-10 烟台大学 一种基于用户群和强化学习的项目推荐方法、***和设备
CN118096324A (zh) * 2024-04-23 2024-05-28 成都帆点创想科技有限公司 推荐模型训练方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170031919A1 (en) * 2015-07-31 2017-02-02 RCRDCLUB Corporation Systems and methods of providing recommendations of content items
CN106919699A (zh) * 2017-03-09 2017-07-04 华北电力大学 一种面向大规模用户的个性化信息推荐方法
CN107577786A (zh) * 2017-09-15 2018-01-12 合肥工业大学 一种基于联合聚类的矩阵分解推荐方法
CN107944485A (zh) * 2017-11-17 2018-04-20 西安电子科技大学 基于聚类群组发现的推荐***及方法、个性化推荐***
CN108197285A (zh) * 2018-01-15 2018-06-22 腾讯科技(深圳)有限公司 一种数据推荐方法以及装置
CN108205682A (zh) * 2016-12-19 2018-06-26 同济大学 一种用于个性化推荐的融合内容和行为的协同过滤方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7512524B2 (en) * 2005-03-18 2009-03-31 International Business Machines Corporation Preparing peptide spectra for identification
CN103412948B (zh) * 2013-08-27 2017-10-24 北京交通大学 基于聚类的协同过滤的商品推荐方法及***
CN106651546B (zh) * 2017-01-03 2021-12-07 重庆邮电大学 一种面向智慧社区的电子商务信息推荐方法
CN107861945A (zh) * 2017-11-01 2018-03-30 平安科技(深圳)有限公司 金融数据分析方法、应用服务器及计算机可读存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170031919A1 (en) * 2015-07-31 2017-02-02 RCRDCLUB Corporation Systems and methods of providing recommendations of content items
CN108205682A (zh) * 2016-12-19 2018-06-26 同济大学 一种用于个性化推荐的融合内容和行为的协同过滤方法
CN106919699A (zh) * 2017-03-09 2017-07-04 华北电力大学 一种面向大规模用户的个性化信息推荐方法
CN107577786A (zh) * 2017-09-15 2018-01-12 合肥工业大学 一种基于联合聚类的矩阵分解推荐方法
CN107944485A (zh) * 2017-11-17 2018-04-20 西安电子科技大学 基于聚类群组发现的推荐***及方法、个性化推荐***
CN108197285A (zh) * 2018-01-15 2018-06-22 腾讯科技(深圳)有限公司 一种数据推荐方法以及装置

Cited By (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111612583A (zh) * 2020-05-19 2020-09-01 江苏大学 一种基于聚类的个性化导购***
CN111612583B (zh) * 2020-05-19 2024-03-19 江苏大学 一种基于聚类的个性化导购***
CN111859281B (zh) * 2020-05-29 2023-09-08 石化盈科信息技术有限责任公司 物品补给时间预测方法、装置、存储介质及电子设备
CN111859281A (zh) * 2020-05-29 2020-10-30 石化盈科信息技术有限责任公司 物品补给时间预测方法、装置、存储介质及电子设备
CN111813905A (zh) * 2020-06-17 2020-10-23 平安科技(深圳)有限公司 语料生成方法、装置、计算机设备及存储介质
CN111813905B (zh) * 2020-06-17 2024-05-10 平安科技(深圳)有限公司 语料生成方法、装置、计算机设备及存储介质
CN111950632A (zh) * 2020-08-12 2020-11-17 贝壳技术有限公司 用于实现聚类的方法、装置、介质以及电子设备
CN111950632B (zh) * 2020-08-12 2021-11-09 贝壳找房(北京)科技有限公司 用于实现小区信息聚类的方法、装置、介质以及电子设备
CN112036987A (zh) * 2020-09-11 2020-12-04 杭州海康威视数字技术股份有限公司 确定推荐商品的方法和装置
CN112381598A (zh) * 2020-10-26 2021-02-19 泰康保险集团股份有限公司 产品服务信息推送方法及装置
CN112381598B (zh) * 2020-10-26 2023-12-05 泰康保险集团股份有限公司 产品服务信息推送方法及装置
CN112633978A (zh) * 2020-12-22 2021-04-09 重庆大学 图神经网络模型构建方法、用于商品推荐的方法、装置及设备
CN112633978B (zh) * 2020-12-22 2024-03-08 重庆大学 图神经网络模型构建方法、用于商品推荐的方法、装置及设备
CN113822734A (zh) * 2021-01-18 2021-12-21 北京沃东天骏信息技术有限公司 用于生成信息的方法和装置
CN115018584A (zh) * 2022-06-13 2022-09-06 浙江理工大学 融合评论文本主题词情感倾向和用户信任关系的推荐方法
CN116402399A (zh) * 2023-04-14 2023-07-07 北京智慧大王科技有限公司 基于人工智能与电子商城的业务数据处理方法及***
CN116402399B (zh) * 2023-04-14 2023-12-29 上海锦咏数据科技有限公司 基于人工智能与电子商城的业务数据处理方法及***
CN116702304B (zh) * 2023-08-08 2023-10-20 中建五局第三建设有限公司 一种基于无监督学习的基坑设计方案分组方法和装置
CN116702304A (zh) * 2023-08-08 2023-09-05 中建五局第三建设有限公司 一种基于无监督学习的基坑设计方案分组方法和装置
CN117633165A (zh) * 2023-10-20 2024-03-01 广州天晟网络信息有限公司 一种智能ai客服对话引导方法
CN117633165B (zh) * 2023-10-20 2024-05-31 广州天晟网络信息有限公司 一种智能ai客服对话引导方法
CN117493913A (zh) * 2023-11-24 2024-02-02 济南高更食品科技有限公司 一种基于用户反馈的复合调味料控制方法及***
CN117493913B (zh) * 2023-11-24 2024-05-14 济南高更食品科技有限公司 一种基于用户反馈的复合调味料控制方法及***
CN117350823A (zh) * 2023-12-04 2024-01-05 北京国双科技有限公司 一种电子商城用商品信息推荐方法、***、设备及介质
CN117851464A (zh) * 2024-03-07 2024-04-09 济南道图信息科技有限公司 一种用于心理评估的用户行为模式辅助分析方法
CN117851464B (zh) * 2024-03-07 2024-05-14 济南道图信息科技有限公司 一种用于心理评估的用户行为模式辅助分析方法
CN117952726A (zh) * 2024-03-27 2024-04-30 摘星社信息科技(浙江)股份有限公司 一种基于运营商数据分析的个性化权益包推荐***

Also Published As

Publication number Publication date
CN109166017A (zh) 2019-01-08
CN109166017B (zh) 2024-06-04

Similar Documents

Publication Publication Date Title
WO2020073534A1 (zh) 基于重聚类的推送方法、装置、计算机设备及存储介质
CN109360057B (zh) 信息推送方法、装置、计算机设备及存储介质
US20240037096A1 (en) Searchable index
WO2020119063A1 (zh) 专家知识推荐方法、装置、计算机设备及存储介质
CN109086439B (zh) 信息推荐方法及装置
WO2020048084A1 (zh) 资源推荐方法、装置、计算机设备及计算机可读存储介质
WO2018041168A1 (zh) 信息推送方法、存储介质和服务器
CN109033101B (zh) 标签推荐方法及装置
CN110717099B (zh) 一种推荐影片的方法及终端
CN110019794B (zh) 文本资源的分类方法、装置、存储介质及电子装置
TW201911080A (zh) 搜索方法、搜索伺服器和搜索系統
US20190294259A1 (en) Sticker recommendation method and apparatus
WO2020073528A1 (zh) 基于会话的信息推送方法、装置、计算机设备及存储介质
CN110909182A (zh) 多媒体资源搜索方法、装置、计算机设备及存储介质
WO2017143930A1 (zh) 一种搜索结果排序方法及其设备
CN111010592B (zh) 一种视频推荐方法、装置、电子设备及存储介质
CN112100396B (zh) 一种数据处理方法和装置
WO2020073526A1 (zh) 基于信任网络的推送方法、装置、计算机设备及存储介质
CN110472016B (zh) 文章推荐方法、装置、电子设备及存储介质
US20130212105A1 (en) Information processing apparatus, information processing method, and program
CN109885651B (zh) 一种问题推送方法和装置
CN110909222A (zh) 基于聚类的用户画像建立方法、装置、介质及电子设备
JPWO2017046845A1 (ja) 情報処理装置、情報処理方法、プログラム、記憶媒体
CN106095941B (zh) 基于大数据知识库的解决方案推荐方法和***
CN117495485A (zh) 产品推荐方法、设备及可读存储介质

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 18936345

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 18936345

Country of ref document: EP

Kind code of ref document: A1