CN110825967A - 一种提高推荐***多样性的推荐列表重排名方法 - Google Patents
一种提高推荐***多样性的推荐列表重排名方法 Download PDFInfo
- Publication number
- CN110825967A CN110825967A CN201911056270.3A CN201911056270A CN110825967A CN 110825967 A CN110825967 A CN 110825967A CN 201911056270 A CN201911056270 A CN 201911056270A CN 110825967 A CN110825967 A CN 110825967A
- Authority
- CN
- China
- Prior art keywords
- ranking
- user
- entropy
- item
- recommendation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 52
- 239000011159 matrix material Substances 0.000 claims description 7
- 238000010606 normalization Methods 0.000 claims description 6
- BUAJNGPDPGKBGV-UHFFFAOYSA-N 1-(1-phenylcyclohexyl)piperidin-1-ium;chloride Chemical compound [Cl-].C1CCCC[NH+]1C1(C=2C=CC=CC=2)CCCCC1 BUAJNGPDPGKBGV-UHFFFAOYSA-N 0.000 claims description 3
- 101000802640 Homo sapiens Lactosylceramide 4-alpha-galactosyltransferase Proteins 0.000 claims description 3
- 102100035838 Lactosylceramide 4-alpha-galactosyltransferase Human genes 0.000 claims description 3
- 230000001174 ascending effect Effects 0.000 claims description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 235000019640 taste Nutrition 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种提高推荐***多样性的推荐列表重排名方法,首先采用原有的推荐方法获得推荐列表,然后计算用户的熵值,利用该熵值获得推荐列表的排名阀值,排名阀值结合本方法的重排名核心公式,获得新的推荐列表。本发明与现有的参数化排名方法相比,能够考虑到用户对于推荐列表多样性的不同需求,因此其推荐的物品更加贴合人们的真实感受,也考虑了不同用户对于同一物品的评分偏差。并且在准确性与多样性的平衡上,适当地提高多样性,但对于准确性的影响很小。
Description
技术领域
本发明涉及推荐***领域,更具体地,涉及一种提高推荐***多样性的推荐列表重排名方法。
背景技术
在信息过剩的互联网时代,信息推荐技术对于互联网公司运营的重要性是不言而喻的,目前各种各样的网站都会在后台使用推荐***。推荐根据用户的访问特点,计算出最适合推荐给该用户的候选产品,然后把这些产品展现给用户,供其选择。由于产品数量和用户数量非常庞大,推荐***大量使用到基于云计算的数据挖掘,通过挖掘用户行为和商品信息,使用各种推荐算法来计算推荐列表,实现向不同用户展示不同内容的效果,提高页面的转化率。
现有的推荐***集中在提高推荐的准确率上,而忽视了推荐列表多样性的重要性。而随着用户对个性化要求的不断提高,如今也出现了同时追求推荐多样性与准确性的方法。如对推荐列表进行重排序的方法,使用评分阈值对准确性和多样性进行平衡,以提高总体多样性,称为参数化排名方法;但参数化排名方法所使用的评分阈值对于所有的用户而言都是相同的,但却没有考虑到用户对于各自推荐列表的多样性的不同需求。比如,有的用户偏爱自己喜欢的东西,而不愿意去尝试新事物,如果我们贸然推荐新的物品给他,反而会引起用户的反感;相反,有些用户兴趣爱好广泛,喜欢尝试新事物,那么推荐新物品给这些用户则是再合适不过了。
发明内容
本发明为克服上述现有技术中参数化排名方法没有考虑到用户对于推荐列表多样性的不同需求这一缺陷,提供一种提高推荐***多样性的推荐列表重排名方法,通过评分阀值来进行推荐列表排序,能够针对不同用户的不同需求。
为解决上述技术问题,本发明采用的技术方案是:提供一种提高推荐***多样性的推荐列表重排名方法,包括以下步骤:
步骤一:输入用户-物品评分矩阵R,物品类型矩阵T,推荐列表长度N,通过推荐;采用推荐***获得推荐列表,可以选用某一种现有的推荐方法获得推荐列表,并预测未知评分R*,未知评分指的就是矩阵R中的空白评分,需要用推荐***使用算法进行预测;
步骤二:利用标准排名方法获得每个用户的推荐列表的标准排名,该方法对应排序公式为:
rankstandard(i)=R*(u,i)-1
其中,R*(u,i)指根据预测评分由低到高的排名,那么添加上-1的幂则表示按照预测评分由高到低进行排名;
步骤三:计算用户的熵值λ(u),包括物品流行度的熵值和物品类型的熵值,并通过将物品流行度的熵值和物品类型的熵值相加获得用户的熵值;
步骤四:根据用户的熵值计算用户的推荐列表的排名阀值Trank,使用该排名阀值对推荐列表进行重新排序,具体的核心公式如下:
Trank=M*N*λ(u)
其中,rankx(i)是非标准排名方法,rating则指某一个具体评分,TH是指加入推荐列表物品对应的最低评分或是该用户所有已评分物品的平均评分,N是指top-N推荐列表的长度,M是本方法中需要进行调节的超参数(超参数的选取需要进行搜索最优结果对应的值。
优选的,在所述步骤三中,物品流行度的熵值的计算公式为:
其中,k表示用户的度数,H(k)表示度数为k的用户对应的物品流行度的熵值,而pi表示特定度数的物品对应的概率;度数指在同一数据集中该物品被购买的总次数,n(k)则指不同的用户度数总的数量。
优选的,在所述步骤三中,物品类型的熵值的计算公式为:
其中,H2(u)指用户物品类型的熵值,u指单个的用户,n(type)指物品的类型总数,而pi指用户u已评分的物品中该物品属于类型i的概率。
优选的,物品流行度的熵值和物品类型的熵值的结果再相加前需要进行标准化,其标准化公式和用户的熵值的公式分别为:
λ1(k)=H1(k)/log2(n(k))
λ2(k)=H2(u)/log2(n(type))
λ(u)=λ1(u∈P(k))+λ2(u)
其中,λ1(k)为标准化后的物品流行度的熵值,λ2(k)为标准化后的物品类型的熵值,P(k)指度数为k(单个用户购买商品总数)的用户人群。
优选的,所述非标准排名方法包括逆序评分排名、流行度逆向排名、随机排名、平均评分升序排名和比例排名。
与现有技术相比,有益效果是:
本发明与现有的参数化排名方法相比,能够考虑到用户对于推荐列表多样性的不同需求,因此其推荐的物品更加贴合人们的真实感受,也考虑了不同用户对于同一物品的评分偏差。并且在准确性与多样性的平衡上,适当地提高多样性,但对于准确性的影响很小。
附图说明
图1是本发明的一种提高推荐***多样性的推荐列表重排名方法的流程图;
图2为本发明的种提高推荐***多样性的推荐列表重排名方法一个应用例。
具体实施方式
附图仅用于示例性说明,不能理解为对本专利的限制;为了更好说明本实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。附图中描述位置关系仅用于示例性说明,不能理解为对本专利的限制。
本发明实施例的附图中相同或相似的标号对应相同或相似的部件;在本发明的描述中,需要理解的是,若有术语“上”、“下”、“左”、“右”“长”“短”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此附图中描述位置关系的用语仅用于示例性说明,不能理解为对本专利的限制,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语的具体含义。
下面通过具体实施例,并结合附图,对本发明的技术方案作进一步的具体描述:
实施例
如图1所示为一种提高推荐***多样性的推荐列表重排名方法的是实施例,包括以下步骤:
步骤一:输入用户-物品评分矩阵R,物品类型矩阵T,推荐列表长度N,通过推荐;采用推荐***获得推荐列表,可以选用某一种现有的推荐方法获得推荐列表,并预测未知评分R*;
步骤二:利用标准排名方法获得每个用户的推荐列表的标准排名,该方法对应排序公式为:
rankstandard(i)=R*(u,i)-1
其中,R*(u,i)指根据预测评分由低到高的排名,那么添加上-1的幂则表示按照预测评分由高到低进行排名;
步骤三:计算用户的熵值λ(u),包括物品流行度的熵值和物品类型的熵值,并通过将物品流行度的熵值和物品类型的熵值相加获得用户的熵值;
具体的,物品流行度的熵值的计算公式为:
其中,k表示用户的度数,H(k)表示度数为k的用户对应的物品流行度的熵值,而pi表示特定度数的物品对应的概率;度数指在同一数据集中该物品被购买的总次数,n(k)则指不同的用户度数总的数量。
具体的,物品类型的熵值的计算公式为:
其中,H2(u)指用户物品类型的熵值,u指单个的用户,n(type)指物品的类型总数,而pi指用户u已评分的物品中该物品属于类型i的概率。
具体的,物品流行度的熵值和物品类型的熵值的结果再相加前需要进行标准化,其标准化公式和用户的熵值的公式分别为:
λ1(k)=H1(k)/log2(n(k))
λ2(k)=H2(u)/log2(n(type))
λ(u)=λ1(u∈P(k))+λ2(u)
其中,λ1(k)为标准化后的物品流行度的熵值,λ2(k)为标准化后的物品类型的熵值,P(k)指度数为k(单个用户购买商品总数)的用户人群。
步骤四:根据用户的熵值计算用户的推荐列表的排名阀值Trank,使用该排名阀值对推荐列表进行重新排序,具体的核心公式如下:
Trank=M*N*λ(u)
其中,rankx(i)是非标准排名方法,rating则指某一个具体评分,TH是指加入推荐列表物品对应的最低评分或是该用户所有已评分物品的平均评分,N是指top-N推荐列表的长度,M是本方法中需要进行调节的超参数,M=2。
另外的,所述非标准排名方法包括逆序评分排名、流行度逆向排名、随机排名、平均评分升序排名和比例排名。
本发明的工作原理:如图2所示的应用例子,首先使用某一个推荐算法,如协同过滤方法中的一种来进行评分预测,从而得子图(a)的标准排名推荐列表;接下来,需要计算出该用户的用户信息熵,从而计算得到排名阈值Trank,确定推荐列表可重排名范围,如子图(b);最后,选定某种合适的非标准排名方法,如物品流行度逆向排名方法,重新确定Top-5推荐列表,如子图(c)。
本实施例的有益效果:本发明与现有的参数化排名方法相比,能够考虑到用户对于推荐列表多样性的不同需求,因此其推荐的物品更加贴合人们的真实感受,也考虑了不同用户对于同一物品的评分偏差。并且在准确性与多样性的平衡上,适当地提高多样性,但对于准确性的影响很小。
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。
Claims (6)
1.一种提高推荐***多样性的推荐列表重排名方法,其特征在于,包括如下步骤:
步骤一:输入用户-物品评分矩阵R,物品类型矩阵T,推荐列表长度N,通过推荐;采用推荐***获得推荐列表,并预测未知评分R*;
步骤二:利用标准排名方法以及预测得到的评分来获得每个用户的推荐列表的标准排名,该方法对应排序公式为:
rankstandard(i)=R*(u,i)-1
其中,R*(u,i)指根据预测评分由低到高的排名,那么添加上-1的幂则表示按照预测评分由高到低进行排名;
步骤三:计算用户的熵值λ(u),包括物品流行度的熵值和物品类型的熵值,并通过将物品流行度的熵值和物品类型的熵值相加获得用户的熵值;
步骤四:根据用户的熵值计算用户的推荐列表的排名阀值Trank,使用该排名阀值对推荐列表进行重新排序,具体公式如下:
Trank=M*N*λ(u)
其中,rankx(i)是非标准排名方法,rating则指某一个具体评分,TH是指加入推荐列表物品对应的最低评分或是该用户所有已评分物品的平均评分,N是指top-N推荐列表的长度,M是本方法中需要进行调节的超参数。
3.根据权利要求2所述的一种提高推荐***多样性的推荐列表重排名方法,其特征在于,在所述步骤三中,物品类型的熵值的计算公式为:
其中,H2(u)指用户物品类型的熵值,u指单个的用户,n(type)指物品的类型总数,而pi指用户u已评分的物品中该物品属于类型i的概率。
4.根据权利要求3所述的一种提高推荐***多样性的推荐列表重排名方法,其特征在于,物品流行度的熵值和物品类型的熵值的结果再相加前需要进行标准化,其标准化公式和用户的熵值的公式分别为:
λ1(k)=H1(k)/log2(n(k))
λ2(k)=H2(u)/log2(n(type))
λ(u)=λ1(u∈P(k))+λ2(u)
其中,λ1(k)为标准化后的物品流行度的熵值,λ2(k)为标准化后的物品类型的熵值,P(k)指度数为k的用户人群。
5.根据权利要求1所述的一种提高推荐***多样性的推荐列表重排名方法,其特征在于,所述非标准排名方法包括逆序评分排名和流行度逆向排名。
6.根据权利要求5所述的一种提高推荐***多样性的推荐列表重排名方法,其特征在于,随机排名、平均评分升序排名和比例排名。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911056270.3A CN110825967B (zh) | 2019-10-31 | 2019-10-31 | 一种提高推荐***多样性的推荐列表重排名方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911056270.3A CN110825967B (zh) | 2019-10-31 | 2019-10-31 | 一种提高推荐***多样性的推荐列表重排名方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110825967A true CN110825967A (zh) | 2020-02-21 |
CN110825967B CN110825967B (zh) | 2023-04-07 |
Family
ID=69552065
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911056270.3A Active CN110825967B (zh) | 2019-10-31 | 2019-10-31 | 一种提高推荐***多样性的推荐列表重排名方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110825967B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113497831A (zh) * | 2021-06-30 | 2021-10-12 | 西安交通大学 | 一种移动边缘网络下基于反馈流行度的内容放置方法及*** |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106202151A (zh) * | 2016-06-23 | 2016-12-07 | 长沙学院 | 一种用于提高个性化推荐***多样性的方法 |
CN106951459A (zh) * | 2017-02-24 | 2017-07-14 | 西北大学 | 基于熵值法的改进协同过滤推荐算法 |
CN106980646A (zh) * | 2017-02-27 | 2017-07-25 | 上海大学 | 基于流行度对用户兴趣的影响机制分析及其在推荐算法中应用的方法 |
CN109919723A (zh) * | 2019-03-01 | 2019-06-21 | 西安电子科技大学 | 一种基于用户和物品的个性化推荐方法 |
-
2019
- 2019-10-31 CN CN201911056270.3A patent/CN110825967B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106202151A (zh) * | 2016-06-23 | 2016-12-07 | 长沙学院 | 一种用于提高个性化推荐***多样性的方法 |
CN106951459A (zh) * | 2017-02-24 | 2017-07-14 | 西北大学 | 基于熵值法的改进协同过滤推荐算法 |
CN106980646A (zh) * | 2017-02-27 | 2017-07-25 | 上海大学 | 基于流行度对用户兴趣的影响机制分析及其在推荐算法中应用的方法 |
CN109919723A (zh) * | 2019-03-01 | 2019-06-21 | 西安电子科技大学 | 一种基于用户和物品的个性化推荐方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113497831A (zh) * | 2021-06-30 | 2021-10-12 | 西安交通大学 | 一种移动边缘网络下基于反馈流行度的内容放置方法及*** |
Also Published As
Publication number | Publication date |
---|---|
CN110825967B (zh) | 2023-04-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103870973B (zh) | 基于电子信息的关键词提取的信息推送、搜索方法及装置 | |
Ganesan et al. | Opinion-based entity ranking | |
CN102982042B (zh) | 一种个性化内容推荐方法、平台以及*** | |
CN104252456B (zh) | 一种权重估计方法、装置及*** | |
Guo et al. | Personalized ranking with pairwise factorization machines | |
Gao et al. | Personalized service system based on hybrid filtering for digital library | |
CN112991017A (zh) | 基于用户评论解析的标签体系精准推荐方法 | |
CN111639258B (zh) | 一种基于神经网络的新闻推荐方法 | |
CN107330727A (zh) | 一种基于隐语义模型的个性化推荐方法 | |
US20120117043A1 (en) | Measuring Duplication in Search Results | |
O'Banion et al. | Social media-driven news personalization | |
CN108984551A (zh) | 一种基于多类别联合软聚类的推荐方法及*** | |
US20130332440A1 (en) | Refinements in Document Analysis | |
CN110825967B (zh) | 一种提高推荐***多样性的推荐列表重排名方法 | |
CN108182264A (zh) | 一种基于跨领域排名推荐模型的排名推荐方法 | |
CN114756758B (zh) | 一种混合推荐方法和*** | |
Sang et al. | Design and implementation of collaborative filtering approach for movie recommendation system | |
CN110795640A (zh) | 一种弥补群组成员差异的自适应组推荐方法 | |
Peng et al. | Improved collaborative filtering algorithm in the research and application of personalized movie recommendations | |
CN114756743A (zh) | 一种基于用户行为的推荐方法及***、设备及介质 | |
Zhang et al. | Estimating online review helpfulness with probabilistic distribution and confidence | |
Liu et al. | Multi-domain collaborative recommendation with feature selection | |
CN114912031A (zh) | 基于聚类和协同过滤的混合推荐方法和*** | |
Jiang et al. | Research of improved recommendation algorithm based on collaborative filtering and content prediction | |
Ye et al. | A collaborative neural model for rating prediction by leveraging user reviews and product images |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |