CN111259232A - 一种基于个性化召回的推荐***优化方法 - Google Patents
一种基于个性化召回的推荐***优化方法 Download PDFInfo
- Publication number
- CN111259232A CN111259232A CN201911220707.2A CN201911220707A CN111259232A CN 111259232 A CN111259232 A CN 111259232A CN 201911220707 A CN201911220707 A CN 201911220707A CN 111259232 A CN111259232 A CN 111259232A
- Authority
- CN
- China
- Prior art keywords
- recall
- user
- strategy
- stage
- similarity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02W—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO WASTEWATER TREATMENT OR WASTE MANAGEMENT
- Y02W90/00—Enabling technologies or technologies with a potential or indirect contribution to greenhouse gas [GHG] emissions mitigation
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于个性化召回的推荐***优化方法,涉及推荐***技术领域。采用的是针对推荐***两阶段模式过程中召回阶段进行优化和改进,结合一种优化迭代的思想获取到不同用户在召回阶段多路召回策略下拥有不同的召回数量,以致于更加体现出不同用户的不同兴趣点。其中,为了更好的获取到用户在多路召回策略下拥有不同的召回数量以及用户感兴趣召回物品,通过对召回策略召回的物品与用户感兴趣的物品进行不断迭代计算用户偏好的召回策略权重,获取到针对不同用户的兴趣点分配不同的召回策略权重,从而达到不同用户在召回阶段多路召回策略下拥有不同的召回数量,实现召回阶段个性化。
Description
技术领域
本发明涉及推荐***技术领域,具体涉及一种基于个性化召回的推荐***优化方法。
背景技术
随着互联网技术的不断发展,数据时代的到来,数据信息越积越累,“信息过载”的现象就会导致人们在大量的信息中寻找自己可能感兴趣的信息变得非常艰难。然而,推荐***的出现就是为了解决这种“信息过载”的问题,它会主动帮助用户在大量的信息中发现他们感兴趣的信息,也会主动的将信息推送给对它们感兴趣的用户。
不论是在工业界还是在科研界,推荐***的发展已越来越成熟。目前,工业界中绝大多数的推荐***都是分为两阶段模式:召回阶段和排序阶段。在召回阶段,大多数都是采用多路召回策略,每一路召回topK的数量对每个用户都是相同的。一般来说,不同的用户对每一路召回策略感兴趣程度是不一样的,因此这会导致每个用户召回得到的物品完全相同,不能突出其个性化,尤其是在时效性特别强的新闻推荐领域更突显。
如图1所示,以往两阶段推荐***召回阶段中每个用户在每一路召回都是召回固定数量的物品,导致每个用户在召回阶段召回的物品完全相同,从而很难体现出不同用户的兴趣偏好,影响推荐***的准确性及用户感知。
本发明提出了一种基于个性化召回的推荐***优化方法,能够更加精确的获取用户兴趣偏好,从而提高整个推荐***的个性化以及准确性。
发明内容
本发明所要解决的技术问题就是提供一种基于不断迭代的方式对推荐***多路召回策略实现个性化的处理方法,通过一种优化迭代的思想,获取每个用户对不同召回策略的权重占比,然后按照每个用户的权重占比获取不同召回策略召回数,计算每个用户召回阶段的召回物品,接着进入排序阶段进行重排序预测。
本发明为解决上述技术问题采用以下技术方案
一种基于个性化召回的推荐***优化方法,具体包括如下步骤:
步骤A:设定召回阶段召回物品的数量N,其中N>0,即推荐***召回阶段候选集数量;
步骤B:设定召回阶段召回策略的数量n,其中n>0,即推荐***召回阶段有多少路召回策略;
步骤C:设定相似度阈值δ,即物品与物品之间的相似度超过此阈值,表示物品较相似;
步骤D:设定召回阶段每个用户对每路召回的数量为K1,K2,...,Kn,初始化值为Ki=N/n,i=1,2...n;
步骤E:根据用户特征信息以及物品特征信息,通过词向量模型计算出每个物品的embedding向量,然后根据余弦相似度计算出所有物品与物品之间的相似度,形成物品相似度矩阵,其中,余弦相似度公式如下:
步骤F:根据召回阶段召回策略以及其召回数量Ki,i=1,2,...,n,计算召回阶段每路召回策略召回的topKi,i=1,2,...,n物品;
步骤G:根据用户行为数据、物品与物品相似度数据以及召回阶段每路策略召回的物品数据,计算出每个用户每路召回策略的权重占比β1,β2,...,βn,然后计算出每个用户对每路召回的数量K'i=N*βi,i=1,2,...,n;
作为本发明一种基于个性化召回的推荐***优化方法的进一步优选方案,所述步骤G,具体包含如下:
步骤G1:通过用户近一个月的行为数据获取每个用户点击的物品;
步骤G2:根据步骤G1获取的用户近一个月点击的物品,通过物品与物品相似度数据,匹配出用户近一个月点击的物品以及其相似度超过δ的相似物品,作为用户偏好的物品集;
步骤G3:根据步骤G2获取到的用户偏好物品与召回阶段每路召回策略召回的物品进行匹配,计算出每路召回策略中能够匹配到的物品数量为k1,k2,...,kn,占比情况然后通过softmax函数进行归一化得到每个用户每路召回策略权重占比β1,β2,...,βn。
作为本发明一种基于个性化召回的推荐***优化方法的进一步优选方案,在步骤C中,相似度阈值δ的取值范围为[0,1],参考经验值为0.8。
作为本发明一种基于个性化召回的推荐***优化方法的进一步优选方案,在步骤E中,利用物品的词向量以及余弦相似度,计算物品与物品之间相似度。
作为本发明一种基于个性化召回的推荐***优化方法的进一步优选方案,在步骤F中,通过不同召回策略以及召回数量获取每个用户每个召回策略的召回物品。
作为本发明一种基于个性化召回的推荐***优化方法的进一步优选方案,在步骤H中,通过不断的重复迭代步骤E至步骤F,直到每个用户的每路召回策略召回数量不发生变化即止,得到每个用户每路召回策略最终召回数量i=1,2,...,n。
有益效果
本发明采用以上技术方案与现有技术相比,具有以下技术效果:
1、本发明所涉及一种基于个性化召回的推荐***优化方法,采用的是针对推荐***两阶段模式过程中召回阶段进行优化和改进,结合一种优化迭代的思想获取到不同用户在召回阶段多路召回策略下拥有不同的召回数量,以致于更加体现出不同用户的不同兴趣点。
2、为了更好的获取到用户在多路召回策略下拥有不同的召回数量以及用户感兴趣召回物品,通过对召回策略召回的物品与用户感兴趣的物品进行不断迭代计算用户偏好的召回策略权重,获取到针对不同用户的兴趣点分配不同的召回策略权重,从而达到不同用户在召回阶段多路召回策略下拥有不同的召回数量,实现召回阶段个性化。
附图说明
图1是传统的推荐***多路召回策略示意图;
图2是本发明改进后的推荐***多路召回策略示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提出了一种基于个性化召回的推荐***优化方法。主要是针对传统的推荐***两阶段模式中召回阶段进行优化和改进,从而实现召回阶段的个性化以及提高推荐***的准确性。
如图2所示,具体步骤如下:
步骤A:设定召回阶段召回物品的数量N(N>0),即推荐***召回阶段候选集数量;
步骤B:设定召回阶段召回策略的数量n(n>0),即推荐***召回阶段有多少路召回策略;
步骤C:设定相似度阈值δ,即物品与物品之间的相似度超过此阈值,表示物品较相似;
步骤D:设定召回阶段每个用户对每路召回的数量为K1,K2,...,Kn,初始化值为Ki=N/n,i=1,2...n;
步骤E:根据用户特征信息以及物品特征信息,通过词向量模型计算出每个物品的embedding向量,然后根据余弦相似度计算出所有物品与物品之间的相似度,形成物品相似度矩阵,其中,余弦相似度公式如下:
步骤F:根据召回阶段召回策略以及其召回数量Ki,i=1,2,...,n,计算召回阶段每路召回策略召回的topKi,i=1,2,...,n物品;
步骤G:根据用户近一个月行为数据、物品与物品相似度数据以及召回阶段每路策略召回的物品数据,计算出每个用户每路召回策略的权重占比β1,β2,...,βn,然后计算出每个用户对每路召回的数量K'i=N*βi,i=1,2,...,n;
上述步骤G包括如下步骤G1至G3:
步骤G1:通过用户近一个月的行为数据(选取“近一个月”是为了获取用户最近的偏好作为指标)获取每个用户点击的物品;
步骤G2:根据步骤G1获取的用户近一个月点击的物品,通过物品与物品相似度数据,匹配出用户近一个月点击的物品以及其相似度超过δ的相似物品,作为用户偏好的物品集;
步骤G3:根据步骤G2获取到的用户偏好物品与召回阶段每路召回策略召回的物品进行匹配,计算出每路召回策略中能够匹配到的物品数量为k1,k2,...,kn,占比情况然后通过softmax函数进行归一化得到每个用户每路召回策略权重占比β1,β2,...,βn。
上述技术方案所涉及的一种基于个性化召回的推荐***及实现方法,采用的是针对推荐***两阶段模式过程中召回阶段进行优化和改进,结合一种优化迭代的思想获取到不同用户在召回阶段多路召回策略下拥有不同的召回数量,以致于更加体现出不同用户的不同兴趣点。其中,为了更好的获取到用户在多路召回策略下拥有不同的召回数量以及用户感兴趣召回物品,通过对召回策略召回的物品与用户感兴趣的物品进行不断迭代计算用户偏好的召回策略权重,获取到针对不同用户的兴趣点分配不同的召回策略权重,从而达到不同用户在召回阶段多路召回策略下拥有不同的召回数量,实现召回阶段个性化。
本发明并不限于上述实施方式,在本发明领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下做出各种变化。
本技术领域技术人员可以理解的是,除非另外定义,这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样定义,不会用理想化或过于正式的含义来解释。
以上实施例仅为说明本发明的技术思想,不能以此限定本发明的保护范围,凡是按照本发明提出的技术思想,在技术方案基础上所做的任何改动,均落入本发明保护范围之内。上面对本发明的实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下做出各种变化。
Claims (6)
1.一种基于个性化召回的推荐***优化方法,其特征在于,具体包括如下步骤:
步骤A:设定召回阶段召回物品的数量N,其中N>0,即推荐***召回阶段候选集数量;
步骤B:设定召回阶段召回策略的数量n,其中n>0,即推荐***召回阶段有多少路召回策略;
步骤C:设定相似度阈值δ,即物品与物品之间的相似度超过此阈值,表示物品较相似;
步骤D:设定召回阶段每个用户对每路召回的数量为K1,K2,...,Kn,初始化值为 Ki=N/n,i=1,2...n;
步骤E:根据用户特征信息以及物品特征信息,通过词向量模型计算出每个物品的embedding向量,然后根据余弦相似度计算出所有物品与物品之间的相似度,形成物品相似度矩阵,其中,余弦相似度公式如下:
步骤F:根据召回阶段召回策略以及其召回数量Ki,i=1,2,...,n,计算召回阶段每路召回策略召回的topKi,i=1,2,...,n物品;
步骤G:根据用户行为数据、物品与物品相似度数据以及召回阶段每路策略召回的物品数据,计算出每个用户每路召回策略的权重占比β1,β2,...,βn,然后计算出每个用户对每路召回的数量K'i=N*βi,i=1,2,...,n;
3.根据权利要求1所述一种基于个性化召回的推荐***优化方法,其特征在于,在一个实施方式中,在步骤C中,相似度阈值δ的取值范围为[0,1],参考经验值为0.8。
4.根据权利要求1所述一种基于个性化召回的推荐***优化方法,其特征在于,在一个实施方式中,在步骤E中,利用物品的词向量以及余弦相似度,计算物品与物品之间相似度。
5.根据权利要求1所述一种基于个性化召回的推荐***优化方法,其特征在于,在一个实施方式中,在步骤F中,通过不同召回策略以及召回数量获取每个用户每个召回策略的召回物品。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911220707.2A CN111259232B (zh) | 2019-12-03 | 2019-12-03 | 一种基于个性化召回的推荐***优化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911220707.2A CN111259232B (zh) | 2019-12-03 | 2019-12-03 | 一种基于个性化召回的推荐***优化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111259232A true CN111259232A (zh) | 2020-06-09 |
CN111259232B CN111259232B (zh) | 2022-08-12 |
Family
ID=70954166
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911220707.2A Active CN111259232B (zh) | 2019-12-03 | 2019-12-03 | 一种基于个性化召回的推荐***优化方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111259232B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113360632A (zh) * | 2021-06-09 | 2021-09-07 | 南京大学 | 一种用于众包软件测试的多路召回推荐方法 |
WO2022110789A1 (zh) * | 2020-11-27 | 2022-06-02 | 北京搜狗科技发展有限公司 | 词条推荐方法、装置和用于推荐词条的装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108829822A (zh) * | 2018-06-12 | 2018-11-16 | 腾讯科技(深圳)有限公司 | 媒体内容的推荐方法和装置、存储介质、电子装置 |
CN109190043A (zh) * | 2018-09-07 | 2019-01-11 | 北京三快在线科技有限公司 | 推荐方法及装置,存储介质,电子设备及推荐*** |
-
2019
- 2019-12-03 CN CN201911220707.2A patent/CN111259232B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108829822A (zh) * | 2018-06-12 | 2018-11-16 | 腾讯科技(深圳)有限公司 | 媒体内容的推荐方法和装置、存储介质、电子装置 |
CN109190043A (zh) * | 2018-09-07 | 2019-01-11 | 北京三快在线科技有限公司 | 推荐方法及装置,存储介质,电子设备及推荐*** |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022110789A1 (zh) * | 2020-11-27 | 2022-06-02 | 北京搜狗科技发展有限公司 | 词条推荐方法、装置和用于推荐词条的装置 |
CN113360632A (zh) * | 2021-06-09 | 2021-09-07 | 南京大学 | 一种用于众包软件测试的多路召回推荐方法 |
CN113360632B (zh) * | 2021-06-09 | 2023-08-25 | 南京大学 | 一种用于众包软件测试的多路召回推荐方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111259232B (zh) | 2022-08-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103678518B (zh) | 一种推荐列表调整方法和装置 | |
CN111259232B (zh) | 一种基于个性化召回的推荐***优化方法 | |
CN110879864A (zh) | 一种基于图神经网络和注意力机制的上下文推荐方法 | |
CN103886001A (zh) | 一种个性化商品推荐*** | |
CN109902235A (zh) | 基于蝙蝠优化的用户偏好聚类协同过滤推荐算法 | |
CN106980648A (zh) | 一种基于概率矩阵分解结合相似度的个性化推荐方法 | |
CN103559622A (zh) | 基于特征的协同过滤推荐方法 | |
CN106791964B (zh) | 广播电视节目推荐***及方法 | |
WO2007140084A1 (en) | Aggregation of affinity lists | |
CN110598061A (zh) | 一种多元图融合的异构信息网嵌入方法 | |
CN105740480B (zh) | 机票推荐方法及*** | |
CN109101563A (zh) | 一种对象推荐方法、装置、介质以及设备 | |
CN110059257B (zh) | 基于评分修正的项目推荐方法 | |
CN109508407A (zh) | 融合时间与兴趣相似度的电视产品推荐方法 | |
CN108694234A (zh) | 一种基于改进协同过滤算法的服务推荐模型 | |
CN112085158A (zh) | 一种基于堆栈降噪自编码器的图书推荐方法 | |
CN116805023B (zh) | 一种基于大语言模型的外卖推荐方法 | |
CN112115359B (zh) | 一种基于多阶近邻预测的推荐***及方法 | |
CN106919647B (zh) | 一种基于聚类的网络结构相似性推荐方法 | |
CN111209489B (zh) | 一种基于差异化资源分配的二部图推荐方法 | |
CN105677850B (zh) | 一种基于神经网络模型的上下文感知音乐推荐方法 | |
CN107516113A (zh) | 一种基于图像生成模型的视觉搜索目标解码方法 | |
CN110968793A (zh) | 基于协同过滤混合填充的用户冷启动推荐算法 | |
CN108984582B (zh) | 一种查询请求处理方法 | |
CN113449200A (zh) | 物品推荐方法、装置及计算机存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: 211100 floor 5, block a, China Merchants high speed rail Plaza project, No. 9, Jiangnan Road, Jiangning District, Nanjing, Jiangsu (South Station area) Applicant after: JIANGSU AIJIA HOUSEHOLD PRODUCTS Co.,Ltd. Address before: 211100 No. 18 Zhilan Road, Science Park, Jiangning District, Nanjing City, Jiangsu Province Applicant before: JIANGSU AIJIA HOUSEHOLD PRODUCTS Co.,Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |