CN106021379B - 一种基于用户偏好的个性化推荐方法及其*** - Google Patents

一种基于用户偏好的个性化推荐方法及其*** Download PDF

Info

Publication number
CN106021379B
CN106021379B CN201610311472.8A CN201610311472A CN106021379B CN 106021379 B CN106021379 B CN 106021379B CN 201610311472 A CN201610311472 A CN 201610311472A CN 106021379 B CN106021379 B CN 106021379B
Authority
CN
China
Prior art keywords
user
training
data
behavior data
user behavior
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610311472.8A
Other languages
English (en)
Other versions
CN106021379A (zh
Inventor
廖好
沈婧
吴巧云
毛睿
陆敏华
刘刚
王毅
李荣华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qishuo Tianjin Intelligent Technology Co ltd
Original Assignee
Shenzhen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen University filed Critical Shenzhen University
Priority to CN201610311472.8A priority Critical patent/CN106021379B/zh
Publication of CN106021379A publication Critical patent/CN106021379A/zh
Application granted granted Critical
Publication of CN106021379B publication Critical patent/CN106021379B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种基于用户偏好的个性化推荐方法,包括:根据用户的行为获取用户行为数据;将得到的所述用户行为数据进行过滤;将过滤后的用户行为数据划分为训练集和测试集,进行模型训练;在训练中获取每个用户的个性化参数;利用所得到的用户的个性化参数预测用户对未选择产品的偏好值;根据偏好值的大小对用户未选择产品进行递减排序,选择位于前列的多个产品推荐给用户。本发明还提供一种基于用户偏好的个性化推荐***。本发明提供的技术方案能精确的分析出用户的潜在消费趋势,从而最终为用户提供一个有效且精确的个性化推荐服务。

Description

一种基于用户偏好的个性化推荐方法及其***
技术领域
本发明涉及计算机网络领域,尤其涉及一种基于用户偏好的个性化推荐方法及其***。
背景技术
随着Internet的快速发展,接入Internet的服务器数量和万维网上的网页的数目都呈现出指数增长的态势。互联网技术的迅速发展使得大量的信息同时呈现在我们面前,例如,Netflix上有数万部电影,Amazon上有数百万本书,Del.icio.us上面有超过10亿的网页收藏。数字革命带给我们全球信息总量疯狂增长,个体有太多需要处理的信息,信息***使得信息的利用率反而降低,从而有我们所谓的“信息过载”问题。这个问题导致现今几乎没有一个电子商务的网站没有一些信息过滤的形式和推荐服务。
因此,如何从海量信息中为用户提供精确的推荐服务一直是业界亟待实现的目标。
发明内容
有鉴于此,本发明的目的在于提供一种基于用户偏好的个性化推荐方法及其***,旨在解决现有技术中在面对海量信息时如何为用户提供精确的个性化推荐服务的技术问题。
本发明提出一种基于用户偏好的个性化推荐方法,所述方法包括:
根据用户的行为获取用户行为数据;
将得到的所述用户行为数据进行过滤;
将过滤后的用户行为数据划分为训练集和测试集,进行模型训练;
在训练中获取每个用户的个性化参数;
利用所得到的用户的个性化参数预测用户对未选择产品的偏好值;
根据偏好值的大小对用户未选择产品进行递减排序,选择位于前列的多个产品推荐给用户。
优选的,所述用户的行为记录在预设评分***中,所述用户行为数据包括用户对产品的评分数据,其中,所述将得到的所述用户行为数据进行过滤的步骤具体包括:
过滤掉评分数据低于预设值的用户行为数据,保留评分数据大于或者等于所述预设值的用户行为数据。
优选的,所述将过滤后的用户行为数据划分为训练集和测试集,进行模型训练的步骤具体包括:
将保留的用户行为数据进行划分,其中,90%的用户行为数据作为训练集,10%的用户行为数据作为测试集;
将得到的所述训练集进行划分,其中,所述训练集的90%的用户行为数据保留,将所述训练集的10%的用户行为数据划分到所述测试集中;
利用机器学习方法训练经过上述两次划分之后得到的训练集。
优选的,所述用户的个性化参数包括初始化资源参数和混合参数,其中,所述在训练中获取每个用户的个性化参数的步骤具体包括:
在训练中通过个性化初始资源分配算法获取每个用户的初始化资源参数;
在训练中通过混合算法获取每个用户的混合参数。
另一方面,本发明还提供一种基于用户偏好的个性化推荐***,所述个性化推荐***包括:
行为获取模块,用于根据用户的行为获取用户行为数据;
数据过滤模块,用于将得到的所述用户行为数据进行过滤;
数据划分模块,用于将过滤后的用户行为数据划分为训练集和测试集,进行模型训练;
数据训练模块,用于在训练中获取每个用户的个性化参数;
偏好预测模块,用于利用所得到的用户的个性化参数预测用户对未选择产品的偏好值;
产品推荐模块,用于根据偏好值的大小对用户未选择产品进行递减排序,选择位于前列的多个产品推荐给用户。
优选的,所述用户的行为记录在预设评分***中,所述用户行为数据包括用户对产品的评分数据,其中,所述数据过滤模块具体用于:
过滤掉评分数据低于预设值的用户行为数据,保留评分数据大于或者等于所述预设值的用户行为数据。
优选的,所述数据划分模块具体包括:
第一划分子模块,用于将保留的用户行为数据进行划分,其中,90%的用户行为数据作为训练集,10%的用户行为数据作为测试集;
第二划分子模块,用于将得到的所述训练集进行划分,其中,所述训练集的90%的用户行为数据保留,将所述训练集的10%的用户行为数据划分到所述测试集中;
学习子模块,用于利用机器学习方法训练经过上述两次划分之后得到的训练集。
优选的,所述用户的个性化参数包括初始化资源参数和混合参数,其中,所述数据训练模块具体包括:
第一训练子模块,用于在训练中通过个性化初始资源分配算法获取每个用户的初始化资源参数;
第二训练子模块,用于在训练中通过混合算法获取每个用户的混合参数。
本发明提供的技术方案能精确的分析出用户的潜在消费趋势,从而最终为用户提供一个有效且精确的个性化推荐服务。
附图说明
图1为本发明一实施方式中基于用户偏好的个性化推荐方法流程图;
图2为本发明一实施方式中基于用户偏好的个性化推荐***10的内部结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明具体实施方式提供了一种基于用户偏好的个性化推荐方法,所述方法主要包括如下步骤:
S11、根据用户的行为获取用户行为数据;
S12、将得到的所述用户行为数据进行过滤;
S13、将过滤后的用户行为数据划分为训练集和测试集,进行模型训练;
S14、在训练中获取每个用户的个性化参数;
S15、利用所得到的用户的个性化参数预测用户对未选择产品的偏好值;
S16、根据偏好值的大小对用户未选择产品进行递减排序,选择位于前列的多个产品推荐给用户。
本发明提出了一种基于用户偏好的个性化推荐方法,能精确的分析出用户的潜在消费趋势,从而最终为用户提供一个有效且精确的个性化推荐服务。
以下将对本发明所提供的一种基于用户偏好的个性化推荐方法进行详细说明。
请参阅图1,为本发明一实施方式中基于用户偏好的个性化推荐方法流程图。
在步骤S11中,根据用户的行为获取用户行为数据。
在本实施方式中,所述用户的行为记录在预设评分***中,所述用户行为数据包括用户对产品的评分数据,其中,预设评分***包括Netflix评分***和MovieLens评分***,这些评分***真实的记录了不同用户对其所选择的产品和服务的各种评分,这些评分通过评分等级来表示,从1到5依次分别表示最差到最好,即评分等级为1表示最差,评分等级为2表示较差,评分等级为3表示中等,评分等级为4表示较好,评分等级为5表示最好。
在步骤S12中,将得到的所述用户行为数据进行过滤。
在本实施方式中,所述将得到的所述用户行为数据进行过滤的步骤S12具体包括:
过滤掉评分数据低于预设值的用户行为数据,保留评分数据大于或者等于所述预设值的用户行为数据。
在本实施方式中,以上述评分等级从1到5依次分别表示最差到最好为例,所述预设值为评分等级是3的值,具体的,过滤掉评分数据低于评分等级3的用户行为数据,保留评分数据大于或者等于评分等级3的用户行为数据。
在步骤S13中,将过滤后的用户行为数据划分为训练集和测试集,进行模型训练。
在本实施方式中,所述将过滤后的用户行为数据划分为训练集和测试集,进行模型训练的步骤S13具体包括:
将保留的用户行为数据进行划分,其中,90%的用户行为数据作为训练集,10%的用户行为数据作为测试集;
将得到的所述训练集进行划分,其中,所述训练集的90%的用户行为数据保留,将所述训练集的10%的用户行为数据划分到所述测试集中;
利用机器学习方法训练经过上述两次划分之后得到的训练集。
在本实施方式中,由于每个用户的个性化参数是不同的,但用户的品味或多或少都持续一个较长的时期,本发明可以预测用户的最优个性化参数,将数据集分为两个部分:训练集和测试集。因为测试集对于测试算法性能包含了未知的连边,训练集可以被用来确定个性化参数,此时将训练集分为两部分,分别对应T-training(训练集)集合和T-probe(测试集)集合,这两个部分的比例为9:1,通过调节这些T-training集合和T-Probe集合,可以发现,这种划分数据集(指的是原始训练集)的最优个性化参数。为了预测用户的个性化参数,通过分离多次,获得归一化的接近最优的个性化参数,这对于除去噪音是很有效的,例如,我们可以选择划分训练集100次来获得100次对于每个用户的个性化参数。
在步骤S14中,在训练中获取每个用户的个性化参数。
在本实施方式中,所述用户的个性化参数包括初始化资源参数和混合参数,其中,所述在训练中获取每个用户的个性化参数的步骤S14具体包括:
在训练中通过个性化初始资源分配算法获取每个用户的初始化资源参数;
在训练中通过混合算法获取每个用户的混合参数。
在本实施方式中,首先将混合算法及异构的初始资源分配算法置于个体层次。例如,每个用户对Wαβ可以调整他/她的个性化混合参数λα和个性化初始资源参数θb,从而获得最佳的推荐。当排序分(RS)最低时,用户i被分配最佳的λα和θ。本发明为每个用户设置个性化参数,并与其它的推荐算法做性能比较,并发现带有个性化参数的算法性能普遍有所提升。
其中,用Wαβ表示产品α愿意分配给产品β的资源配额,可以得到Wαβ的一般表达式:
其中,表示产品β的度,表示用户j的度,a表示用户l是否选择过产品β,若选择过,a=1,反之,a=0。a表示用户j是否选择过产品γ,若选择过,a=1,反之,a=0。
在本实施方式中,通过加入参数λ将物质扩散和热传导结合的混合算法,可以表示为:
其中,当参数λ=0时就是完全的热传导算法,当λ=1时即为物质扩散算法。当λ从0增加到1时,混过算法从热传导变成物质扩散。这种混合算法被证明是解决精确性和多样性的有效途径。在这个混合算法中,根据这个参数可以选择热门的产品或者是冷门的产品。对于给定的一个目标用户,将他选择过的产品上的初始资源设为1,未选择的设为0,这样得到一个n维的0/1矢量,代表针对该个体的初始资源分配构型,显然,这个初始构型表达了个性化信息,对于不同用户是不一样的。记这个n维的0/1矢量为f,通过上述过程得到的最终的资源分配矢量可以表示为其中,f为上述提到的n维的0/1矢量,W为n*n阶的资源分配矩阵。
在本实施方式中,同样考虑到每个用户有一些相似的排序分数,所以归一化个性化的参数是很必要的。在本实施方式中,获得的个性化参数λi和θi类似于最优个性化参数,本发明基于训练集提出一个策略来为每个用户分配一个合适的个性化混合参数λi和个性化初始资源参数θi,提出了一个基于个性化初始资源与混合算法(PIHP),定义为:
其中,λi是通过最小的排序分数(RS)收集的用户的个性化混合参数。为了提升方法的可行性,PIHP仅通过训练集获得的λi,并将原始训练集划分为新的训练集和测试集100次,且这两个集合比例为9:1。
在步骤S15中,利用所得到的用户的个性化参数预测用户对未选择产品的偏好值。
在本实施方式中,通过如下方式来进行预测,即通过将数据集多次分离为训练集和测试集,最终获得归一化的接近最优的偏好值。
在步骤S16中,根据偏好值的大小对用户未选择产品进行递减排序,选择位于前列的多个产品推荐给用户。
在本实施方式中,选择两个真实评分***:Netflix和MovieLens。为了测试本发明算法的性能,使用2个基准数据集:Netflix和MovieLens。从MovieLens(http://www.grouplens.org/)中选取了943个用户对1682部电影的100000条评分数据。评分等级从1到5分别表示从最差到最好。出于推荐的目的,在滤掉过程中考虑评分超过3的数据。在粗获取过程后,获得的数据包含了943个用户和1682个产品在内的82520个用户-产品对。Netflix数据(http://www.netflixprize.com)是随机抽样了用户在Netflix网站的整个交互记录。最终获得了包含10000个用户,6000部电影的824802个用户-电影对。和MovieLens做同样的数据过滤,最后剩下了701947个用户-电影对。为了测试推荐的性能,本发明把真实数据被分成了两部分,一部分是占数据的90%训练集ET,被认为是已知的信息,另一部分是隐藏起来用于检测算法准确程度的测试集EP,占数据的10%。
本发明利用排序分数(Rank Score,RS)来度量推荐算法的排序准确度,以建立一个较优的推荐产品排序,从而匹配用户的偏好设置。对于一个特定的用户,推荐***可以产生用户未选择产品的排行榜。本发明测量了在测试集中的每个用户-产品链接对下的排行榜,例如,有一个有1000个未选择商品的活跃用户ua,其中用户喜欢的产品ib出现在用户ua推荐列表的第10位,那么,对于用户ua而言,产品ib的排序分数为RSab=10/1000=0.01。将所有用户的排序分数求平均即得到用来度量推荐算法准确性的***排序分RS,排序分值越小,说明***越趋向于把用户喜欢的商品排在前面,表明这样的算法更好。其中,***排序分RS可表示为:
由于真实用户通常只考虑推荐列表的前几个,本发明也设置两个实际的准确度指标来考虑用户选择的产品在推荐列表里的数量,称为查准率(Precision)和查全率(Recall)。
对于用户ua而言,推荐的查准率被定义为:
其中,da(N)表示在推荐列表前N位的位置,相关产品的数量(即为测试集中已经被用户ua选择过的产品),将所有用户的查准率求平均即得整个推荐***的平均查准率。除了查准率,查全率也有类似的函数定义从另一个角度来评估推荐算法的准确度。
对于用户ua而言,推荐的查全率被定义为:
da(N)表示在推荐列表前N位的位置,相关产品的数量(即为测试集中已经被用户ua选择过的产品),并且Na是测试集中用户a选择的产品数。平均所有用户的查全率就可以得到整个***的平均查全率。
本发明首先在MovieLens和Netflix数据下,比较多种算法对应于L=50的RS、查准率和查全率。其中,HMass算法指的是物质扩散算法和异构的初始资源分配算法的结合。OMass算法物质扩散算法和带有个性化初始资源参数θi算法的结合。混合(Hybrids)算法是物质扩散和热传导算法的结合。OHybrid指的是混合算法并且为每个用户提供个性化参数λi。CoHybrid算法指的是混合算法加入了整体最优的初始资源参数θ和整体最优混合参数λ。OCoHybrid算法指的是CoHybrid算法的提升版,为每个用户结合了最优个性化初始资源参数θi和最优个性化混合和参数λi。参数λ在[0,1]之间,设置步长为0.05,初始资源参数θ在[-5,5]之间,且步长为0.1。
对于MovieLens数据,HMass,CoHybrids方法中最优θ=0.8。Hybrids和CoHybrids中最优λ=0.45。每个数字都是通过平均超过10个采用独立随机划分训练集和测试集运行获得的。得到的测试结果如下表一所示:
表一
该结果表明,每个用户使用自己的个性化参数的算法性能普遍更好。以MovieLens为例,对OCoHybrids算法在排序分RS、查准率P(50)和查全率R(50)这三个指标上进行性能对比,分别可以提升9.01%,4.09%和7.9%的增强。而Netflix数据集,OCoHybrids算法在排序分RS上有较明显提升,以及P(50)和R(50)较之前的CoHybrids算法,分别提升了10.8%,0.9%和2.8%。
同时,基于本发明提出的PIHP算法,将这些推荐算法做出性能比较。结果如下表二所示:
表二
结果显示,PCoHybrids算法性能表现比所有提到过的指标更好。以MovieLens为例,在RS、查准率P(50)和查全率R(50)的指标下,PCoHybrids方法中分别有2.07%,3.3%,和4.5%的提高。而Netflix数据集,PCoHybrids方法也就RS而言取得了较大的性能提升,以及P(20)和R(20)较之前的CO-Hybrids方法分别有2.01%,1.6%和1.1%的提高。
本发明提供的一种基于用户偏好的个性化推荐方法,能精确的分析出用户的潜在消费趋势,从而最终为用户提供一个有效且精确的个性化推荐服务。
本发明具体实施方式还提供一种基于用户偏好的个性化推荐***10,主要包括:
行为获取模块11,用于根据用户的行为获取用户行为数据;
数据过滤模块12,用于将得到的所述用户行为数据进行过滤;
数据划分模块13,用于将过滤后的用户行为数据划分为训练集和测试集,进行模型训练;
数据训练模块14,用于在训练中获取每个用户的个性化参数;
偏好预测模块15,用于利用所得到的用户的个性化参数预测用户对未选择产品的偏好值;
产品推荐模块16,用于根据偏好值的大小对用户未选择产品进行递减排序,选择位于前列的多个产品推荐给用户。
本发明提供的一种基于用户偏好的个性化推荐***10,能精确的分析出用户的潜在消费趋势,从而最终为用户提供一个有效且精确的个性化推荐服务。
请参阅图2,所示为本发明一实施方式中基于用户偏好的个性化推荐***10的结构示意图。在本实施方式中,基于用户偏好的个性化推荐***10主要包括行为获取模块11、数据过滤模块12、数据划分模块13、数据训练模块14、偏好预测模块15以及产品推荐模块16。
行为获取模块11,用于根据用户的行为获取用户行为数据。
在本实施方式中,所述用户的行为记录在预设评分***中,所述用户行为数据包括用户对产品的评分数据,其中,预设评分***包括Netflix评分***和MovieLens评分***,这些评分***真实的记录了不同用户对其所选择的产品和服务的各种评分,这些评分通过评分等级来表示,从1到5依次分别表示最差到最好,即评分等级为1表示最差,评分等级为2表示较差,评分等级为3表示中等,评分等级为4表示较好,评分等级为5表示最好。
数据过滤模块12,用于将得到的所述用户行为数据进行过滤。
在本实施方式中,数据过滤模块12具体用于:
过滤掉评分数据低于预设值的用户行为数据,保留评分数据大于或者等于所述预设值的用户行为数据。
在本实施方式中,以上述评分等级从1到5依次分别表示最差到最好为例,所述预设值为评分等级是3的值,具体的,过滤掉评分数据低于评分等级3的用户行为数据,保留评分数据大于或者等于评分等级3的用户行为数据。
数据划分模块13,用于将过滤后的用户行为数据划分为训练集和测试集,进行模型训练。
在本实施方式中,数据划分模块13具体包括:第一划分子模块、第二划分子模块以及学习子模块。
第一划分子模块,用于将保留的用户行为数据进行划分,其中,90%的用户行为数据作为训练集,10%的用户行为数据作为测试集;
第二划分子模块,用于将得到的所述训练集进行划分,其中,所述训练集的90%的用户行为数据保留,将所述训练集的10%的用户行为数据划分到所述测试集中;
学习子模块,用于利用机器学习方法训练经过上述两次划分之后得到的训练集。
在本实施方式中,由于每个用户的个性化参数是不同的,但用户的品味或多或少都持续一个较长的时期,本发明可以预测用户的最优个性化参数,将数据集分为两个部分:训练集和测试集。因为测试集对于测试算法性能包含了未知的连边,训练集可以被用来确定个性化参数,此时将训练集分为两部分,分别对应T-training(训练集)集合和T-probe(测试集)集合,这两个部分的比例为9:1,通过调节这些T-training集合和T-Probe集合,可以发现,这种划分数据集(指的是原始训练集)的最优个性化参数。为了预测用户的个性化参数,通过分离多次,获得归一化的接近最优的个性化参数,这对于除去噪音是很有效的,例如,我们可以选择划分训练集100次来获得100次对于每个用户的个性化参数。
数据训练模块14,用于在训练中获取每个用户的个性化参数。
在本实施方式中,所述用户的个性化参数包括初始化资源参数和混合参数,其中,数据训练模块14具体包括:第一训练子模块以及第二训练子模块。
第一训练子模块,用于在训练中通过个性化初始资源分配算法获取每个用户的初始化资源参数;
第二训练子模块,用于在训练中通过混合算法获取每个用户的混合参数。
在本实施方式中,首先将混合算法及异构的初始资源分配算法置于个体层次。例如,每个用户对Wαβ可以调整他/她的个性化混合参数λα和个性化初始资源参数θb,从而获得最佳的推荐。当排序分(RS)最低时,用户i被分配最佳的λα和θ。本发明为每个用户设置个性化参数,并与其它的推荐算法做性能比较,并发现带有个性化参数的算法性能普遍有所提升。
在本实施方式中,数据训练模块14具体的训练方法详见前述步骤S14中的相关记载,在此不做重复描述。
偏好预测模块15,用于利用所得到的用户的个性化参数预测用户对未选择产品的偏好值。
产品推荐模块16,用于根据偏好值的大小对用户未选择产品进行递减排序,选择位
本发明提供的一种基于用户偏好的个性化推荐***10,能精确的分析出用户的潜在消费趋势,从而最终为用户提供一个有效且精确的个性化推荐服务。
值得注意的是,上述实施例中,所包括的各个单元只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
另外,本领域普通技术人员可以理解实现上述各实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,相应的程序可以存储于一计算机可读取存储介质中,所述的存储介质,如ROM/RAM、磁盘或光盘等。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (4)

1.一种基于用户偏好的个性化推荐方法,其特征在于,所述方法包括:
根据用户的行为获取用户行为数据,所述用户行为数据包括用户对产品的评分数据;
将得到的所述用户行为数据进行过滤;
将过滤后的用户行为数据划分为训练集和测试集,进行模型训练;
在训练中获取每个用户的个性化参数;
利用所得到的用户的个性化参数预测用户对未选择产品的偏好值;
根据偏好值的大小对用户未选择产品进行递减排序,选择位于前列的多个产品推荐给用户;
其中,所述用户的个性化参数包括初始化资源参数和混合参数,其中,所述在训练中获取每个用户的个性化参数的步骤具体包括:
在训练中通过个性化初始资源分配算法获取每个用户的初始化资源参数;
在训练中通过混合算法获取每个用户的混合参数;
所述将过滤后的用户行为数据划分为训练集和测试集,进行模型训练的步骤具体包括:
步骤A、将保留的用户行为数据进行划分,其中,90%的用户行为数据作为训练集,10%的用户行为数据作为测试集;
步骤B、将得到的所述训练集进行划分,其中,所述训练集的90%的用户行为数据保留,将所述训练集的10%的用户行为数据划分到所述测试集中;
步骤C、利用机器学习方法训练经过上述两次划分之后得到的训练集;
其中,多次重复上述步骤B、C,以得到归一化的接近最优的个性化参数。
2.如权利要求1所述的基于用户偏好的个性化推荐方法,其特征在于,所述用户的行为记录在预设评分***中,所述用户行为数据包括用户对产品的评分数据,其中,所述将得到的所述用户行为数据进行过滤的步骤具体包括:
过滤掉评分数据低于预设值的用户行为数据,保留评分数据大于或者等于所述预设值的用户行为数据。
3.一种基于用户偏好的个性化推荐***,其特征在于,所述个性化推荐***包括:
行为获取模块,用于根据用户的行为获取用户行为数据,所述用户行为数据包括用户对产品的评分数据;
数据过滤模块,用于将得到的所述用户行为数据进行过滤;
数据划分模块,用于将过滤后的用户行为数据划分为训练集和测试集,进行模型训练;
数据训练模块,用于在训练中获取每个用户的个性化参数;
偏好预测模块,用于利用所得到的用户的个性化参数预测用户对未选择产品的偏好值;
产品推荐模块,用于根据偏好值的大小对用户未选择产品进行递减排序,选择位于前列的多个产品推荐给用户;
其中,所述用户的个性化参数包括初始化资源参数和混合参数,其中,所述数据训练模块具体包括:
第一训练子模块,用于在训练中通过个性化初始资源分配算法获取每个用户的初始化资源参数;
第二训练子模块,用于在训练中通过混合算法获取每个用户的混合参数;
所述数据划分模块具体包括:
第一划分子模块,用于将保留的用户行为数据进行划分,其中,90%的用户行为数据作为训练集,10%的用户行为数据作为测试集;
第二划分子模块,用于将得到的所述训练集进行划分,其中,所述训练集的90%的用户行为数据保留,将所述训练集的10%的用户行为数据划分到所述测试集中;
学习子模块,用于利用机器学习方法训练经过上述两次划分之后得到的训练集,
其中,多次重复所述第二划分子模块及学习子模块,以得到归一化的接近最优的个性化参数。
4.如权利要求3所述的基于用户偏好的个性化推荐***,其特征在于,所述用户的行为记录在预设评分***中,所述用户行为数据包括用户对产品的评分数据,其中,所述数据过滤模块具体用于:
过滤掉评分数据低于预设值的用户行为数据,保留评分数据大于或者等于所述预设值的用户行为数据。
CN201610311472.8A 2016-05-12 2016-05-12 一种基于用户偏好的个性化推荐方法及其*** Active CN106021379B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610311472.8A CN106021379B (zh) 2016-05-12 2016-05-12 一种基于用户偏好的个性化推荐方法及其***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610311472.8A CN106021379B (zh) 2016-05-12 2016-05-12 一种基于用户偏好的个性化推荐方法及其***

Publications (2)

Publication Number Publication Date
CN106021379A CN106021379A (zh) 2016-10-12
CN106021379B true CN106021379B (zh) 2017-08-25

Family

ID=57099160

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610311472.8A Active CN106021379B (zh) 2016-05-12 2016-05-12 一种基于用户偏好的个性化推荐方法及其***

Country Status (1)

Country Link
CN (1) CN106021379B (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017193323A1 (zh) * 2016-05-12 2017-11-16 深圳大学 一种基于用户偏好的个性化推荐方法及其***
CN106779204B (zh) * 2016-12-08 2021-02-09 电子科技大学 一种个性化路径推荐的方法及装置
CN106600369A (zh) * 2016-12-09 2017-04-26 广东奡风科技股份有限公司 基于朴素贝叶斯分类的银行金融产品实时推荐***和方法
CN106934696A (zh) * 2017-03-15 2017-07-07 深圳大学 一种基于用户地理位置信息的产品推荐方法及***
CN107330744A (zh) * 2017-07-21 2017-11-07 携程旅游网络技术(上海)有限公司 机票衍生产品的推荐方法及***
CN108287902B (zh) * 2018-01-24 2020-11-20 厦门大学 一种基于数据非随机缺失机制的推荐***方法
CN108805614A (zh) * 2018-05-28 2018-11-13 苏州若依玫信息技术有限公司 一种基于消费预算分析的电子商务***
CN110555743A (zh) * 2018-05-31 2019-12-10 阿里巴巴集团控股有限公司 商品对象推荐方法、装置及电子设备
CN109800347A (zh) * 2018-12-10 2019-05-24 淮阴工学院 一种基于个性化时间窗口提取信息主干的方法
CN109636473A (zh) * 2018-12-14 2019-04-16 深圳大学 一种基于在线用户观影行为的兴趣偏好挖掘方法
US11068772B2 (en) * 2019-02-14 2021-07-20 Caastle, Inc. Systems and methods for automatic apparel wearability model training and prediction
CN111310039B (zh) * 2020-02-10 2022-10-04 江苏满运软件科技有限公司 推荐信息穿插位置确定方法、***、设备及存储介质
CN113591986B (zh) * 2021-07-30 2024-06-04 阿里巴巴创新公司 用于生成推荐模型的对象权值的方法和个性化推荐方法
CN115293291B (zh) * 2022-08-31 2023-09-12 北京百度网讯科技有限公司 排序模型的训练方法、排序方法、装置、电子设备及介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103440242A (zh) * 2013-06-26 2013-12-11 北京亿赞普网络技术有限公司 一种基于用户搜索行为的个性化推荐方法和***
CN104346476A (zh) * 2014-11-20 2015-02-11 西安电子科技大学 基于物品相似度和网络结构的个性化物品推荐方法
CN104899763A (zh) * 2015-05-07 2015-09-09 西安电子科技大学 基于二分网络双向扩散的个性化推荐方法
CN105404678A (zh) * 2015-11-24 2016-03-16 中国科学院重庆绿色智能技术研究院 一种在线***中用户定制推荐***的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103440242A (zh) * 2013-06-26 2013-12-11 北京亿赞普网络技术有限公司 一种基于用户搜索行为的个性化推荐方法和***
CN104346476A (zh) * 2014-11-20 2015-02-11 西安电子科技大学 基于物品相似度和网络结构的个性化物品推荐方法
CN104899763A (zh) * 2015-05-07 2015-09-09 西安电子科技大学 基于二分网络双向扩散的个性化推荐方法
CN105404678A (zh) * 2015-11-24 2016-03-16 中国科学院重庆绿色智能技术研究院 一种在线***中用户定制推荐***的方法

Also Published As

Publication number Publication date
CN106021379A (zh) 2016-10-12

Similar Documents

Publication Publication Date Title
CN106021379B (zh) 一种基于用户偏好的个性化推荐方法及其***
Kowald et al. The unfairness of popularity bias in music recommendation: A reproducibility study
WO2017193323A1 (zh) 一种基于用户偏好的个性化推荐方法及其***
Zappia et al. Splatter: simulation of single-cell RNA sequencing data
CN106844637B (zh) 基于正交与聚类修剪改进多目标遗传算法的电影推荐方法
US20050210025A1 (en) System and method for predicting the ranking of items
CN106503022A (zh) 推送推荐信息的方法和装置
CN110377521B (zh) 一种目标对象验证方法及装置
Havemann et al. Bibliometric indicators of young authors in astrophysics: Can later stars be predicted?
Carrignon et al. Modelling rapid online cultural transmission: evaluating neutral models on Twitter data with approximate Bayesian computation
Carraro et al. Is the Galactic disc older than the halo?
CN103700007B (zh) 基于物品的推荐方法及***
KR20150113644A (ko) 협업필터링 기반의 상품 추천 시스템에서 추천 기법을 선택하는 방법
Zeng et al. Information filtering in sparse online systems: Recommendation via semi-local diffusion
McNamara et al. Predicting high impact academic papers using citation network features
Su et al. Link prediction in recommender systems with confidence measures
Perera et al. Relationship between journal-ranking metrics for a multidisciplinary set of journals
CN110689410B (zh) 数据处理方法、装置、设备及存储介质
Sánchez et al. Attribute-based evaluation for recommender systems: incorporating user and item attributes in evaluation metrics
CN106055665B (zh) 基于异常值剔除的情境感知Web服务推荐方法和***
Shi et al. Long-term effects of user preference-oriented recommendation method on the evolution of online system
Dorta-González et al. An approach to the author citation potential: Measures of scientific performance which are invariant across scientific fields
CN111177564A (zh) 一种产品推荐方法及装置
CN104750752B (zh) 一种上网偏好用户群体的确定方法和设备
Xue et al. Enhancing the long-term performance of recommender system

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20230816

Address after: Room 101-117, Zone C1, Animation Building, No. 126 Animation Middle Road, Zhongxin Ecological City, Binhai New Area, Tianjin, 300450

Patentee after: Qishuo (Tianjin) Intelligent Technology Co.,Ltd.

Address before: 518000 No. 3688 Nanhai Road, Shenzhen, Guangdong, Nanshan District

Patentee before: SHENZHEN University