CN108763314B - 一种兴趣推荐方法、装置、服务器及存储介质 - Google Patents
一种兴趣推荐方法、装置、服务器及存储介质 Download PDFInfo
- Publication number
- CN108763314B CN108763314B CN201810387692.8A CN201810387692A CN108763314B CN 108763314 B CN108763314 B CN 108763314B CN 201810387692 A CN201810387692 A CN 201810387692A CN 108763314 B CN108763314 B CN 108763314B
- Authority
- CN
- China
- Prior art keywords
- interest
- user
- similarity
- list
- sample set
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 47
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 77
- 238000012549 training Methods 0.000 claims description 25
- 230000006399 behavior Effects 0.000 claims description 19
- 238000010276 construction Methods 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000004590 computer program Methods 0.000 claims description 2
- 238000012163 sequencing technique Methods 0.000 claims 3
- 238000001914 filtration Methods 0.000 abstract description 17
- 230000006872 improvement Effects 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 13
- 238000010801 machine learning Methods 0.000 description 13
- 238000003066 decision tree Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 230000008901 benefit Effects 0.000 description 5
- 238000012417 linear regression Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 230000003993 interaction Effects 0.000 description 4
- 230000007774 longterm Effects 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000011478 gradient descent method Methods 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 238000003672 processing method Methods 0.000 description 3
- 238000007637 random forest analysis Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000013475 authorization Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000004931 aggregating effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000013106 supervised machine learning method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2323—Non-hierarchical techniques based on graph theory, e.g. minimum spanning trees [MST] or graph cuts
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/761—Proximity, similarity or dissimilarity measures
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Business, Economics & Management (AREA)
- General Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Computational Linguistics (AREA)
- Medical Informatics (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Multimedia (AREA)
- Databases & Information Systems (AREA)
- Discrete Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种兴趣推荐方法、装置、服务器及存储介质,所述方法包括:获取目标用户的特征信息;根据所述特征信息,采用兴趣相似度预测模型预测所述目标用户与用户群体之间的兴趣相似度;其中,所述兴趣相似度预测模型基于树模型编码混合线性算法实现;根据所述兴趣相似度,确定所述用户群体中与所述目标用户兴趣相似的推荐用户;获取所述推荐用户的兴趣列表,并为所述目标用户创建推荐列表。本发明解决了传统协同过滤算法的冷启动问题,即当用户没有足够的观看历史时的推荐问题,提高了推荐结果的准确性,带来点击率上的明显提升,实现了个性化推荐的“千人千面”。
Description
技术领域
本发明涉及互联网技术领域,尤其涉及一种兴趣推荐方法、装置、服务器及存储介质。
背景技术
视频推荐已经成为在线视频服务中不可或缺的一部分。现有的视频推荐算法主要分为非个性化推荐算法和个性化推荐算法,请参见图1,这些算法用到的数据主要有用户画像,用户观影记录,以及视频属性等信息。其中,非个性化推荐算法包括基于流行度(Popularity)视频推荐算法和基于人工统计学信息的用户分群配合基于流行度的视频推荐。个性化推荐主要包括基于用户当前观看视频的相关推荐以及基于用户历史偏好(即历史观看记录)的个性化推荐。对于个性化推荐来说,其中相关推荐是基于关联规则(Association Rule,AR)的方式;而基于历史偏好的个性化推荐包括协同过滤推荐(Collaborative Filtering,CF)和基于内容的推荐(Content-Based,CB)。
目前比较流行的视频推荐算法包括基于内容的推荐、协同过滤推荐和社交化推荐(social recommendation)。这些算法共同的不足之处是面对冷启动(cold start)和数据稀疏(data sparsity)的难题,即当用户没有足够的观看历史时,传统的视频推荐算法往往不能够满足用户的需求。
对于协同过滤和基于内容的推荐,需要用到用户的历史观影行为数据,这些方法对于新用户或者行为较少用户无法使用或者效果差,这些问题都会影响到用户的体验从而影响用户粘性和视频服务的长远发展。
传统的解决冷启动的方法是对用户进行聚类,比如寻找相似年龄、相同性别、相近地域或者同一社群的用户。
发明内容
本发明所要解决的技术问题在于,提供了一种兴趣推荐方法、装置、服务器及存储介质,本发明通过有监督机器算法进行学习和预测用户的兴趣相似度,从而可以准确地寻找到兴趣相似的用户来做推荐。
为了解决上述技术问题,第一方面,本发明提供了一种兴趣推荐方法,包括:
获取目标用户的特征信息;
根据所述特征信息,采用兴趣相似度预测模型预测所述目标用户与用户群体之间的兴趣相似度;其中,所述兴趣相似度预测模型基于树模型编码混合线性算法实现;
根据所述兴趣相似度,确定所述用户群体中与所述目标用户兴趣相似的推荐用户;
获取所述推荐用户的兴趣列表,并根据所述兴趣列表为所述目标用户创建推荐列表。
第二方面,本发明提供了一种兴趣推荐装置,包括:
特征信息获取模块,用于获取目标用户的特征信息;
兴趣相似度预测模块,用于根据所述特征信息,采用兴趣相似度预测模型预测所述目标用户与用户群体之间的兴趣相似度;其中,所述兴趣相似度预测模型基于树模型编码混合线性算法实现;
推荐用户确定模块,用于根据所述兴趣相似度,确定所述用户群体中与所述目标用户兴趣相似的推荐用户;
推荐列表创建模块,用于获取所述推荐用户的兴趣列表,并根据所述兴趣列表为所述目标用户创建推荐列表。
第三方面,本发明提供了一种服务器,包括处理器和存储器,其中,所述存储器存储有计算机程序,所述计算机程序适于由所述处理器加载并执行以下步骤:
获取目标用户的特征信息;
根据所述特征信息,采用兴趣相似度预测模型预测所述目标用户与用户群体之间的兴趣相似度;其中,所述兴趣相似度预测模型基于树模型编码混合线性算法实现;
根据所述兴趣相似度,确定所述用户群体中与所述目标用户兴趣相似的推荐用户;
获取所述推荐用户的兴趣列表,并根据所述兴趣列表为所述目标用户创建推荐列表。
第四方面,本发明提供了一种计算机存储介质,所述计算机存储介质存储有多条指令,所述指令适用于由处理器加载并执行以下步骤:
获取目标用户的特征信息;
根据所述特征信息,采用兴趣相似度预测模型预测所述目标用户与用户群体之间的兴趣相似度;其中,所述兴趣相似度预测模型基于树模型编码混合线性算法实现;
根据所述兴趣相似度,确定所述用户群体中与所述目标用户兴趣相似的推荐用户;
获取所述推荐用户的兴趣列表,并根据所述兴趣列表为所述目标用户创建推荐列表。
实施本发明实施例,具有如下有益效果:
本发明通过获取目标用户的特征信息,并根据所述特征信息,采用有监督机器学习算法来预测所述目标用户与其他用户群体之间的兴趣相似度,并根据预测的所述兴趣相似度确定推荐用户,再根据所述推荐用户的兴趣列表为所述目标用户创建推荐列表。本发明解决了传统协同过滤算法的冷启动问题,即当用户没有足够的观看历史时的推荐问题,提高了推荐结果的准确性,带来点击率上的明显提升,实现了个性化推荐的“千人千面”。
附图说明
图1是现有技术中视频推荐算法的分类结构图;
图2是本发明实施例提供的实施环境的示意图;
图3是本发明实施例提供的一种树模型编码混合线性模型的模型示意图;
图4是本发明实施例提供的一种树模型编码混合线性模型算法的流程图;
图5是本发明实施例提供的一种兴趣相似度预测模型生成方法流程图;
图6是本发明实施例提供的一种兴趣相似度的预测方法流程图;
图7是本发明实施例提供的一种基于用户的协同过滤算法的框架图;
图8是本发明实施例提供的一种兴趣推荐方法的算法框架图;
图9是本发明实施例提供的一种兴趣推荐方法流程图;
图10是本发明实施例提供的一种视频推荐列表生成方法流程图;
图11是本发明实施例提供的一种用户界面示意图;
图12是本发明实施例提供的一种兴趣推荐装置结构示意图;
图13是本发明实施例提供的一种预测模型生成模块结构示意图;
图14是本发明实施例提供的一种树模型混合线性模型模块的结构示意图;
图15是本发明实施例提供的一种基于社交软件的好友关系链视频推荐方法流程图;
图16是本发明实施例提供的一种服务器构架示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述。显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
冷启动在推荐***中表示该***积累数据量过少,无法给新用户做个性化推荐的问题,这是产品推荐的一大难题。基本上,冷启动问题可以分为以下三类:
用户冷启动:用户冷启动主要解决如何给新用户做个性化推荐的问题。当新用户到来时,我们没有他的行为数据,所以也无法根据他的历史行为预测其兴趣,从而无法借此给他做个性化推荐。
物品冷启动:物品冷启动主要解决如何将新的物品推荐给可能对它感兴趣的用户这一问题。
***冷启动:***冷启动主要解决如何在一个新开发的网站上(还没有用户,也没有用户行为,只有一些物品的信息)设计个性化推荐***,从而在网站刚发布时就让用户体验到个性化推荐服务这一问题。
本发明实施例主要提供的是针对推荐***中用户冷启动的处理方法。
请参见图2,其示出了本发明实施例提供的实施环境的示意图,该实施环境包括:若干终端设备210和服务器220,其中,所述终端设备210可以但不限于为手机、平板电脑、台式计算机等终端设备。所述服务器220可以是一台服务器,也可以是由若干服务器组成的服务器集群,或者是一个云计算服务中心。
所述终端设备210可以与各种网络如互联网、企业内部网、无线网络等进行通讯,上述的无线网络可包括蜂窝式电话网、无线局域网或者城域网。上述的无线网络可以使用各种通信标准、协议及技术。所述终端设备210通过网络向所述服务器220发送请求,所述服务器220接收所述请求并进行处理。
在实际应用场景中,服务器220可获取若干终端设备210的用户信息,根据获取的用户信息进行用户兴趣相似度的计算,并根据所述兴趣相似度为用户提供相关的推荐,最终实现用户的个性化推荐。
最常用的有监督机器学习算法有线性模型和树模型,其中线性模型,如线性回归(Linear Regression)的优点是简单,易用于大规模数据集,缺点是无法拟合非线性关联;而树模型,如决策树(Decision Tree)的优点是可以拟合非线性关系,而且可以应用于离散特征和连续特征上,缺点是不善于捕捉线性或者近似线性关系,且较为复杂。
为了同时利用两类模型的优点,本发明实施例提出了一种树模型编码混合线性模型(Hybrid Tree-encoded Linear Model),图3示出了其模型,该算法主要分为两个步骤,具体来说,为了增强模型的最终非线性表达能力,先使用梯度提升决策树(GBDT)对特征进行非线性变换,即将原始特征变换成一系列二进制特征,类似于编码。
再将所有编码后的特征,即二值特征和所有的原始特征一起作为输入特征,放入线性回归模型中训练(使用梯度下降法进行训练),得到最终的混合模型结果,将训练好的模型在测试集上进行预测,即可判断该模型的效果。
请参见图4,其示出了一种树模型混合线性模型算法的方法流程图,包括:
S401.采用树模型对所述样本集合的特征进行编码,得到编码后的二值特征。
例如,使用有2棵子树的GBDT来拟合训练数据,拟合的结果是第一颗子树有3个叶子节点,第二颗子树有2个叶子节点。如果一个样本经过该GBDT后在第一颗子树中落在了第二个叶子节点(即编码为010,每一位对应一个叶子节点),在第二颗子树中落在了第一个叶子节点(即编码为10),这样最终该样本的编码结果为01010,对应了5个二值特征。
S402.将所述样本集合的特征和所述二值特征作为输入特征,通过线性模型进行训练。
再将所有编码后的特征,即5个二值特征和所有的原始特征一起作为输入特征,放入线性回归模型中训练(使用梯度下降法进行训练),得到最终的混合模型结果,将训练好的模型在测试集上进行预测,即可判断该模型的效果。
请参见图5,其示出了一种兴趣相似度预测模型生成方法,具体包括:
S501.获取用户历史观影记录的样本集合。
因为是有监督机器学习,需要构造有标签的样本来进行学习:从过去一个月历史观影记录表中随机抽取一百万对用户,其中每一对用户均为活跃用户(如观影数量>=30)。
S502.构造所述样本集合的特征。
为了构建有效的有监督机器学习算法,分别需要进行数据准备(特征构造和选择)。
作为机器学习算法的输入,我们需要去构造这些样本的特征:
对这一百万对用户,可以设计以下特征:
比如,人口统计学特征、社交软件使用特征、网络行为特征、社会文化背景特征以及历史兴趣相似度特征等。
其中,人口统计学特征包括以下信息中的至少一种:年龄、年龄差、所在的地区、性别等;
社交软件使用特征包括以下信息中的至少一种:是否是社交软件好友(比如QQ、微信、旺旺、钉钉、支付宝、MSN、微博、易信等),历史交互记录(比如发消息频率,发消息的数量,共同好友数,共同群组数,互发邮件数等),在线时长,使用频率等;
网络行为特征包括以下信息中的至少一种:浏览频率较高的网站、页面浏览量、访问时长、关注的话题或者公众号等;
社会文化背景特征包括以下信息中的至少一种:学历、毕业学校、职业、工作单位、兴趣爱好等;
历史兴趣相似度特征包括以下信息中的至少一种:过去三个月兴趣相似度、过去半年兴趣相似度、过去一年兴趣相似度等。
S503.计算所述样本集合中每对用户的兴趣相似度。
对于用户u和用户v,他们的兴趣相似度定义为:
其中,Iu和Iv分别是用户u和用户v历史(过去一个月)观看过的视频列表集合,这里是计算了两个用户历史观影集合之间的余弦相似度作为他们的兴趣相似度的。
S504.使用树模型混合线性模型算法对所述特征进行训练和预测。
将所述样本集合的特征作为所述树模型混合线性模型算法的输入,将所述每对用户的兴趣相似度作为预测目标值,采用树模型混合线性模型算法对所述样本集合的特征进行训练。
所述树模型混合线性模型算法具体包括:
S401.采用树模型对所述样本集合的特征进行编码,得到编码后的二值特征。
例如,使用有2棵子树的GBDT来拟合训练数据,拟合的结果是第一颗子树有3个叶子节点,第二颗子树有2个叶子节点。如果一个样本经过该GBDT后在第一颗子树中落在了第二个叶子节点(即编码为010,每一位对应一个叶子节点),在第二颗子树中落在了第一个叶子节点(即编码为10),这样最终该样本的编码结果为01010,对应了5个二值特征。
S402.将所述样本集合的特征和所述二值特征作为输入特征,通过线性模型进行训练。
再将所有编码后的特征,即5个二值特征和所有的原始特征一起作为输入特征,放入线性回归模型中训练(使用梯度下降法进行训练),得到最终的混合模型结果,将训练好的模型在测试集上进行预测,即可判断该模型的效果。
为了将该预测问题简单化,本实施例中将预测目标值(即真实兴趣相似度)进行二值化,即相似度大于某一个门限值的作为正样本,其他的作为负样本,这样就是一个二分类(binary classification)的问题。
将有标签的样本数据集(按本实施例中构造有标签的样本的方法得到)分为训练集(占70%)和测试集(占30%)。采用的预测效果评价指标是AUC值(area under the ROCcurve)。将本实施例提出的树模型编码混合线性模型的算法和其他几个常用机器学习算法(逻辑斯特回归算法,决策树算法和随机森林算法)进行了比较,其预测效果的比较结果如下表所示:
算法 | AUC值 |
逻辑斯特回归 | 0.783 |
决策树 | 0.810 |
随机森林 | 0.818 |
树模型编码混合线性模型 | 0.834 |
从表中可以看出,相对于逻辑斯特回归算法,决策树算法和随机森林算法,本发明实施例提出的树模型混合线性模型在相似度预测的准确性上有明显提升。
对于推荐***冷启动而导致的无法计算目标用户与用户群体之间的相似度,本发明实施例提供了一种兴趣相似度的预测方法,请参见图6,具体包括:
S601.获取目标用户的特征信息。
其中,所述目标用户即为冷启动的用户,可以是新注册的用户或者是历史记录较少的用户。
所述特征信息包括:人口统计学特征、社交软件使用特征、网络行为特征、社会文化背景特征以及历史兴趣相似度特征等。
其中,人口统计学特征包括以下信息中的至少一种:年龄、年龄差、所在的地区、性别等;
社交软件使用特征包括以下信息中的至少一种:是否是社交软件好友(比如QQ、微信、旺旺、钉钉、支付宝、MSN、微博、易信等),历史交互记录(比如发消息频率,发消息的数量,共同好友数,共同群组数,互发邮件数等),在线时长,使用频率等;
网络行为特征包括以下信息中的至少一种:浏览频率较高的网站、页面浏览量、访问时长、关注的话题或者公众号等;
社会文化背景特征包括以下信息中的至少一种:学历、毕业学校、职业、工作单位、兴趣爱好等;
历史兴趣相似度特征包括以下信息中的至少一种:过去三个月兴趣相似度、过去半年兴趣相似度、过去一年兴趣相似度等。
所述特征信息还可以是用户的兴趣描述,比如对用户信息进行预采集,具体地,当新用户进入***时除了填写一些个人基本信息之外,还可以为用户设置一些类别或者标签供用户选择。还可以是从其他网站导入的用户站外行为,比如用户利用社交网站账号登录,就可以在获得用户授权的情况下导入用户在该社交网站的部分行为数据和社交网络数据。
S602.根据所述特征信息,采用兴趣相似度预测模型预测所述目标用户与用户群体之间的兴趣相似度;其中,所述兴趣相似度预测模型基于树模型编码混合线性算法实现。
当获取到所述目标用户的特征信息时,采用兴趣相似度预测模型,预测所述目标用户与所述用户群体中的每个用户之间的兴趣相似度。
其中,所述兴趣相似度预测模型的生成方法具体包括:
S6021.获取用户历史观影记录的样本集合。
因为是有监督机器学习,需要构造有标签的样本来进行学习:从过去一个月历史观影记录表中随机抽取一百万对用户,其中每一对用户均为活跃用户(如观影数量>=30)。
S6022.构造所述样本集合的特征。
为了构建有效的有监督机器学习算法,分别需要进行数据准备(特征构造和选择)。
作为机器学习算法的输入,我们需要去构造这些样本的特征:
对这一百万对用户,可以设计如下技术特征,包括人口统计学特征、社交软件使用特征、网络行为特征、社会文化背景特征以及历史兴趣相似度特征等。
S6023.计算所述样本集合中每对用户的兴趣相似度。
对于用户u和用户v,他们的兴趣相似度定义为:
其中,Iu和Iv分别是用户u和用户v历史(过去一个月)观看过的视频列表集合,这里是计算了两个用户历史观影集合之间的余弦相似度作为他们的兴趣相似度的。
S6024.使用树模型混合线性模型算法对所述特征进行训练和预测。
将所述样本集合的特征作为所述树模型混合线性模型算法的输入,将所述每对用户的兴趣相似度作为预测目标值,采用树模型混合线性模型算法对所述样本集合的特征进行训练。
请参见图7,其示出了一种基于用户的协同过滤算法的框架图,基于用户的协同过滤算法可拆分为两个步骤:
找到与目标用户兴趣相似的用户集合;
找到这个集合中用户喜欢的,并且目标用户没有看过的物品推荐给目标用户。
具体来说,当需要给一个目标用户推荐视频时,通过比较该目标用户和其他用户的历史观影记录,来寻找兴趣相似的一群用户,然后将这群用户所偏好的其他视频(即目标用户没有看过的)推荐给目标用户。这个算法在数据充足的情况下简单有效,但是对于新用户或者观影行为较少目标用户,因为不知道他们的观影喜好,从而无法找到与目标用户相似的用户群体,这样就没法给目标用户准确的推荐视频了。
为了解决因为冷启动的原因导致无法计算用户兴趣相似度,而使得协同过滤算法失效的问题,本发明实施例提供了一种兴趣推荐方法,是一种增强型的基于用户的协同过滤算法,其算法框架图请参见图8,通过有监督机器学习方法预测用户之间的兴趣相似度,从而增强了基于用户的协同过滤算法。
请参见图9,一种兴趣推荐方法具体包括:
S901.获取目标用户的特征信息。
其中,所述目标用户即为冷启动的用户,可以是新注册的用户或者是历史记录较少的用户。
所述特征信息包括:
比如,人口统计学特征、社交软件使用特征、网络行为特征、社会文化背景特征以及历史兴趣相似度特征等。
其中,人口统计学特征包括以下信息中的至少一种:年龄、年龄差、所在的地区、性别等;
社交软件使用特征包括以下信息中的至少一种:是否是社交软件好友(比如QQ、微信、旺旺、钉钉、支付宝、MSN、微博、易信等),历史交互记录(比如发消息频率,发消息的数量,共同好友数,共同群组数,互发邮件数等),在线时长,使用频率等;
网络行为特征包括以下信息中的至少一种:浏览频率较高的网站、页面浏览量、访问时长、关注的话题或者公众号等;
社会文化背景特征包括以下信息中的至少一种:学历、毕业学校、职业、工作单位、兴趣爱好等;
历史兴趣相似度特征包括以下信息中的至少一种:过去三个月兴趣相似度、过去半年兴趣相似度、过去一年兴趣相似度等。
所述特征信息还可以是用户的兴趣描述,比如对用户信息进行预采集,具体地,当新用户进入***时除了填写一些个人基本信息之外,还可以为用户设置一些类别或者标签供用户选择。还可以是从其他网站导入的用户站外行为,比如用户利用社交网站账号登录,就可以在获得用户授权的情况下导入用户在该社交网站的部分行为数据和社交网络数据。
S902.根据所述特征信息,采用兴趣相似度预测模型预测所述目标用户与用户群体之间的兴趣相似度;其中,所述兴趣相似度预测模型基于树模型编码混合线性算法实现。
当获取到所述目标用户的特征信息时,采用兴趣相似度预测模型,预测所述目标用户与所述用户群体中的每个用户之间的兴趣相似度。
其中,所述兴趣相似度预测模型的生成方法具体包括:
S9021.获取用户历史观影记录的样本集合。
因为是有监督机器学习,需要构造有标签的样本来进行学习:从过去一个月历史观影记录表中随机抽取一百万对用户,其中每一对用户均为活跃用户(如观影数量>=30)。
S9022.构造所述样本集合的特征。
为了构建有效的有监督机器学习算法,分别需要进行数据准备(特征构造和选择)。
作为机器学习算法的输入,我们需要去构造这些样本的特征:
对这一百万对用户,设计三类特征:人口统计学特征、社交特征和历史兴趣特征。
S9023.计算所述样本集合中每对用户的兴趣相似度。
对于用户u和用户v,他们的兴趣相似度定义为:
其中,Iu和Iv分别是用户u和用户v历史(过去一个月)观看过的视频列表集合,这里是计算了两个用户历史观影集合之间的余弦相似度作为他们的兴趣相似度的。
S9024.将所述样本集合的特征作为所述树模型混合线性模型算法的输入,将所述每对用户的兴趣相似度作为预测目标值,采用树模型混合线性模型算法对所述样本集合的特征进行训练。
上述步骤S9024还包括如下子步骤:
采用树模型对所述样本集合的特征进行编码,得到编码后的二值特征;
将所述样本集合的特征和所述二值特征作为输入特征,通过线性模型进行训练。
S903.根据所述兴趣相似度,确定所述用户群体中与所述目标用户兴趣相似的推荐用户。
当得到所述目标用户与所述用户群体中的每个用户两两之间的兴趣预测相似度之后,将所述相似度按从高到低的顺序进行排序,并选择相似度排名靠前的K个用户作为推荐用户,这里的K是整数,具体值可根据具体要求进行设置。
S904.获取所述推荐用户的兴趣列表,并根据所述兴趣列表为所述目标用户创建推荐列表。
具体可通过获取所述推荐用户的兴趣列表,对所述兴趣列表中的项目进行评分与相似度加权,并对所述评分与相似度加权的结果进行排序得到排序结果,根据所述排序结果为所述目标用户创建推荐列表。
所述推荐列表包括所述推荐用户感兴趣的而所述目标用户没有观看过的视频列表。
基于上述基于用户的协同过滤算法,确定了与所述目标用户兴趣相似的推荐用户之后,以视频推荐为例,具体包括:
S9041.针对目标用户u,以及选出的兴趣相似度最高的K位推荐用户,用集合S(u,K)表示。
S9042.将集合S中所有用户喜欢的视频列表取出来并去除目标用户u已经观看过或者感兴趣的视频,获得第一列表。
S9043.对所述第一列表中的视频进行评分与相似度加权,并对结果进行排序得到排序结果。
S9044.根据所述排序结果生成推荐列表,对目标用户u进行推荐。
其中,每个可能推荐的视频i,用户u对其感兴趣的程度可以用如下公式计算:
rvi表示用户v对视频i的喜欢程度,即对i的评分,wuv表示用户u和v之间的相似度。
协同过滤推荐***常需要处理上百万乃至上亿级的数据记录,如何存取这些海量数据以及快速计算出推荐结果,成为协同过滤面临的巨大挑战。云计算采用分布式技术,云端***构建在大量廉价的服务器集群之上,通过大规模集群获得与高性能计算机相当的计算能力和存储能力,集群的管理提高***的可扩展性。将协同过滤与云计算技术相结合,使协同过滤推荐***具有更强的并行计算能力、容错能力和更高的推荐实时性。
本发明提供的一种兴趣推荐方法可以应用于视频网站或视频APP的个性化推荐模块,请参见图11,即为用户提供符合其观影兴趣的视频列表,实现这一模块的“千人千面”。提升了用户体验,增强了用户粘度。
相应地,本发明实施例还提供了一种兴趣推荐装置,请参见图12,具体包括:
特征信息获取模块1210,用于获取目标用户的特征信息。
兴趣相似度预测模块1220,用于根据所述特征信息,采用兴趣相似度预测模型预测所述目标用户与用户群体之间的兴趣相似度;其中,所述兴趣相似度预测模型基于树模型编码混合线性算法实现。
推荐用户确定模块1230,用于根据所述兴趣相似度,确定所述用户群体中与所述目标用户兴趣相似的推荐用户。所述推荐用户确定模块1230还包括排序模块1231,用于将所述目标用户与所述用户群体中的每个用户之间的兴趣相似度按从高到低进行排序,并选择排名靠前的若干位用户作为推荐用户。
推荐列表创建模块1240,用于获取所述推荐用户的兴趣列表,并根据所述兴趣列表为所述目标用户创建推荐列表。所述推荐列表创建模块1240包括评分加权模块1241和列表生成模块1242,所述评分加权模块1241用于获取所述推荐用户的兴趣列表,对所述兴趣列表中的项目进行评分与相似度加权;所述列表生成模块1242用于对所述评分与相似度加权的结果进行排序得到排序结果,根据所述排序结果生成推荐列表。
进一步地,所述兴趣相似度预测模块1220包括预测模型生成模块1221,用于生成基于所述特征信息的兴趣相似度的预测模型。
请参见图13,所述预测模型生成模块1221还包括:
样本集合获取模块1310,用于获取用户历史观影记录的样本集合;
特征构造模块1320,用于构造所述样本集合的特征;
目标相似度计算模块1330,用于根据余弦相似度公式
计算所述样本集合中每对用户的兴趣相似度,其中u表示第一用户,v表示第二用户,Iu和Iv分别是所述第一用户和所述第二用户的历史视频观看列表集合;
训练模块1340,用于将所述样本集合的特征作为所述树模型混合线性模型算法的输入,将所述每对用户的兴趣相似度作为预测目标值,采用树模型混合线性模型算法对所述样本集合的特征进行训练。
请参见图14,所述树模型混合线性模型包括:
编码模块1410,用于采用树模型对所述样本集合的特征进行编码,得到编码后的二值特征;
拟合模块1420,用于将所述样本集合的特征和所述二值特征作为输入特征,通过线性模型进行训练。
本发明实施例还提供了一种基于社交软件的好友关系链的视频推荐方法,请参见图15,包括:
S1510.对社交软件的好友关系链进行过滤,保留关系链中至少有一方是X视频用户的好友关系链。
为了降低社交软件的好友关系链计算的巨大困难,先过滤掉一部分用户,仅留下关系链中至少有一方是X视频用户的好友关系链。
S1520.计算所述用户与好友中为X视频用户的好友之间的关系强度。
所述关系强度及亲密度,所述亲密度的计算方法有两种:
(1)长期的:基于长期社交网络交互计算的亲密度;
(2)短期的:基于近期社交软件的通信频度计算的亲密度;采用短期亲密度的缺点在与可能会包含一些如商业等方面的通信好友,且稀疏度较大(短期内,如30天通信好友数一般较少),因此最终需要综合权衡长期和短期的亲密度选出最终的好友视频推荐候选人。
S1530.根据所述关系强度来加权聚合好友近期观影行为,产生基于好友关系链的视频推荐列表,并推荐给所述用户。
本发明实施例还提供了一种服务器,请参见图16,其示出服务器的结构示意图,该服务器用于实施上述实施例中提供的推荐***冷启动处理方法,具体来讲,所述服务器结构可以包括上述推荐***冷启动处理装置。
该服务器1600可因配置或性能不同而产生比较大的差异,可以包括一个或一个以***处理器(Central Processing Units,CPU)1610(例如,一个或一个以上处理器)和存储器1630,一个或一个以上存储应用程序1623或数据1622的存储介质1620(例如一个或一个以上海量存储设备)。其中,存储器1630和存储介质1620可以是短暂存储或持久存储。存储在存储介质1620的程序可以包括一个或一个以上模块,每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器1610可以设置为与存储介质1620通信,在服务器1600上执行存储介质1620中的一系列指令操作。服务器1600还可以包括一个或一个以上电源1660,一个或一个以上有线或无线网络接口1650,一个或一个以上输入输出接口1640,和/或,一个或一个以上操作***1621,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
本发明实施例还提供了一种计算机存储介质,所述存储介质可用于保存用于实现上述方法实施例中推荐***冷启动处理方法的程序代码。所述程序代码可用于实现:
获取目标用户的特征信息;
根据所述特征信息,采用兴趣相似度预测模型预测所述目标用户与用户群体之间的兴趣相似度;其中,所述兴趣相似度预测模型基于树模型编码混合线性算法实现;
根据所述兴趣相似度,确定所述用户群体中与所述目标用户兴趣相似的推荐用户;
获取所述推荐用户的兴趣列表,并根据所述兴趣列表为所述目标用户创建推荐列表。
可选地,在本实施例,上述存储介质可以位于计算机网络的多个网络设备中的至少一个网络设备。可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
本发明通过获取目标用户的特征信息,并根据所述特征信息,采用有监督机器学习算法来预测所述目标用户与其他用户群体之间的兴趣相似度,并根据预测的所述兴趣相似度确定推荐用户,再根据所述推荐用户的兴趣列表为所述目标用户创建推荐列表。本发明解决了传统协同过滤算法的冷启动问题,即当用户没有足够的观看历史时的推荐问题,提高了推荐结果的准确性,带来点击率上的明显提升,实现了个性化推荐的“千人千面”。
本实施例中所示出的结构,仅仅是与本申请方案相关的部分结构,并不构成对本申请方案所应用于其上的设备的限定,具体的设备可以包括比示出的更多或更少的部件,或者组合某些部件,或者具有不同的部件的布置。
本领域技术人员还可以进一步意识到,结合本说明书所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合实现,为了清除地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但这种实现不应认为超出本发明的范围。
通过以上的实施例的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实时方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质,如ROM/RAM、磁碟、光盘中,包括若干指令用以使得一台终端设备,可以是手机、计算机、服务器、空调器、或者网络设备等,执行本发明各个实施例所述的方法。
以上所揭露的仅为本发明的较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。
Claims (12)
1.一种兴趣推荐方法,其特征在于,包括:
获取目标用户的特征信息;
根据所述特征信息,采用兴趣相似度预测模型预测所述目标用户与用户群体之间的兴趣相似度;其中,所述兴趣相似度预测模型基于树模型混合线性模型算法实现;所述树模型混合线性模型算法包括:采用树模型对样本集合的特征进行编码,得到编码后的二值特征;将所述样本集合的特征和所述二值特征作为输入特征,通过线性模型进行训练;所述样本集合的特征为在所述兴趣相似度预测模型的生成过程中,对获取的用户历史观影记录的样本集合进行特征构造得到的;
根据所述兴趣相似度,确定所述用户群体中与所述目标用户兴趣相似的推荐用户;
获取所述推荐用户的兴趣列表,并根据所述兴趣列表为所述目标用户创建推荐列表。
2.根据权利要求1所述的一种兴趣推荐方法,其特征在于,所述特征信息包括人口统计学特征、社交软件使用特征、网络行为特征、社会文化背景特征和历史兴趣相似度特征中的至少一种特征信息。
4.根据权利要求1所述的一种兴趣推荐方法,其特征在于,根据所述兴趣相似度,确定所述用户群体中与所述目标用户兴趣相似的推荐用户包括:
将所述目标用户与所述用户群体中的每个用户之间的兴趣相似度按从高到低进行排序,并选择排名靠前的若干位用户作为推荐用户。
5.根据权利要求1所述的一种兴趣推荐方法,其特征在于,所述获取所述推荐用户的兴趣列表,并根据所述兴趣列表为所述目标用户创建推荐列表包括:
获取所述推荐用户的兴趣列表,对所述兴趣列表中的项目进行评分与相似度加权,并对所述评分与相似度加权的结果进行排序得到排序结果,根据所述排序结果为所述目标用户创建推荐列表;
所述推荐列表包括所述推荐用户感兴趣的而所述目标用户没有观看过的视频列表。
6.一种兴趣推荐装置,其特征在于,包括:
特征信息获取模块,用于获取目标用户的特征信息;
兴趣相似度预测模块,用于根据所述特征信息,采用兴趣相似度预测模型预测所述目标用户与用户群体之间的兴趣相似度;其中,所述兴趣相似度预测模型基于树模型混合线性模型算法实现;所述树模型混合线性模型算法包括:采用树模型对样本集合的特征进行编码,得到编码后的二值特征;将所述样本集合的特征和所述二值特征作为输入特征,通过线性模型进行训练;所述样本集合的特征为在所述兴趣相似度预测模型的生成过程中,对获取的用户历史观影记录的样本集合进行特征构造得到的;
推荐用户确定模块,用于根据所述兴趣相似度,确定所述用户群体中与所述目标用户兴趣相似的推荐用户;
推荐列表创建模块,用于获取所述推荐用户的兴趣列表,并根据所述兴趣列表为所述目标用户创建推荐列表。
7.根据权利要求6所述的一种兴趣推荐装置,其特征在于,所述兴趣相似度预测模块包括预测模型生成模块,所述预测模型生成模块用于生成基于所述特征信息的兴趣相似度预测模型。
9.根据权利要求6所述的一种兴趣推荐装置,其特征在于,所述推荐用户确定模块还包括排序模块,用于将所述目标用户与所述用户群体中的每个用户之间的兴趣相似度按从高到低进行排序,并选择排名靠前的若干位用户作为推荐用户。
10.根据权利要求6所述一种兴趣推荐装置,其特征在于,所述推荐列表创建模块包括:
评分加权模块,用于获取所述推荐用户的兴趣列表,对所述兴趣列表中的项目进行评分与相似度加权;
列表生成模块,用于对所述评分与相似度加权的结果进行排序得到排序结果,根据所述排序结果生成推荐列表。
11.一种服务器,其特征在于,包括处理器和存储器,其中,所述存储器存储有计算机程序,所述计算机程序适于由所述处理器加载并执行以下步骤:
获取目标用户的特征信息;
根据所述特征信息,采用兴趣相似度预测模型预测所述目标用户与用户群体之间的兴趣相似度;其中,所述兴趣相似度预测模型基于树模型混合线性模型算法实现;所述树模型混合线性模型算法包括:采用树模型对样本集合的特征进行编码,得到编码后的二值特征;将所述样本集合的特征和所述二值特征作为输入特征,通过线性模型进行训练;所述样本集合的特征为在所述兴趣相似度预测模型的生成过程中,对获取的用户历史观影记录的样本集合进行特征构造得到的;
根据所述兴趣相似度,确定所述用户群体中与所述目标用户兴趣相似的推荐用户;
获取所述推荐用户的兴趣列表,并根据所述兴趣列表为所述目标用户创建推荐列表。
12.一种计算机存储介质,其特征在于,所述计算机存储介质存储有多条指令,所述指令适用于由处理器加载并执行以下步骤:
获取目标用户的特征信息;
根据所述特征信息,采用兴趣相似度预测模型预测所述目标用户与用户群体之间的兴趣相似度;其中,所述兴趣相似度预测模型基于树模型混合线性模型算法实现;所述树模型混合线性模型算法包括:采用树模型对样本集合的特征进行编码,得到编码后的二值特征;将所述样本集合的特征和所述二值特征作为输入特征,通过线性模型进行训练;所述样本集合的特征为在所述兴趣相似度预测模型的生成过程中,对获取的用户历史观影记录的样本集合进行特征构造得到的;
根据所述兴趣相似度,确定所述用户群体中与所述目标用户兴趣相似的推荐用户;
获取所述推荐用户的兴趣列表,并根据所述兴趣列表为所述目标用户创建推荐列表。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810387692.8A CN108763314B (zh) | 2018-04-26 | 2018-04-26 | 一种兴趣推荐方法、装置、服务器及存储介质 |
PCT/CN2019/076164 WO2019205795A1 (zh) | 2018-04-26 | 2019-02-26 | 兴趣推荐方法、计算机设备及存储介质 |
US16/909,682 US11593894B2 (en) | 2018-04-26 | 2020-06-23 | Interest recommendation method, computer device, and storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810387692.8A CN108763314B (zh) | 2018-04-26 | 2018-04-26 | 一种兴趣推荐方法、装置、服务器及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108763314A CN108763314A (zh) | 2018-11-06 |
CN108763314B true CN108763314B (zh) | 2021-01-19 |
Family
ID=64011944
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810387692.8A Active CN108763314B (zh) | 2018-04-26 | 2018-04-26 | 一种兴趣推荐方法、装置、服务器及存储介质 |
Country Status (3)
Country | Link |
---|---|
US (1) | US11593894B2 (zh) |
CN (1) | CN108763314B (zh) |
WO (1) | WO2019205795A1 (zh) |
Families Citing this family (70)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108763314B (zh) | 2018-04-26 | 2021-01-19 | 深圳市腾讯计算机***有限公司 | 一种兴趣推荐方法、装置、服务器及存储介质 |
CN110245301A (zh) * | 2018-11-29 | 2019-09-17 | 腾讯科技(深圳)有限公司 | 一种推荐方法、装置及存储介质 |
CN109597940A (zh) * | 2018-12-06 | 2019-04-09 | 上海哔哩哔哩科技有限公司 | 基于商业兴趣的目标人群确定及信息推送方法和*** |
CN111353015B (zh) * | 2018-12-24 | 2024-03-15 | 阿里巴巴集团控股有限公司 | 众包题目推荐方法、装置、设备及存储介质 |
CN109829105A (zh) * | 2019-01-18 | 2019-05-31 | 王惟惟 | 一种可应用区块链技术的人工智能创作辅助*** |
CN109829110A (zh) * | 2019-01-29 | 2019-05-31 | 四川长虹电器股份有限公司 | 一种学习资料的个性化推荐方法 |
CN109885770B (zh) * | 2019-02-20 | 2022-01-07 | 杭州威佩网络科技有限公司 | 一种信息推荐方法、装置、电子设备及存储介质 |
CN110134390B (zh) * | 2019-03-30 | 2022-11-25 | 杭州电子科技大学 | 一种基于用户相似度的可编程控制器图编程控件的智能推送功能的实现方法 |
CN110059249B (zh) * | 2019-04-03 | 2022-11-25 | 华为技术有限公司 | 个性化推荐的方法、终端设备和*** |
CN110046303B (zh) * | 2019-04-09 | 2022-05-17 | 有光创新(北京)信息技术有限公司 | 一种基于需求匹配平台实现的信息推荐方法及装置 |
CN110008408B (zh) * | 2019-04-12 | 2021-04-06 | 山东大学 | 一种会话推荐方法、***、设备及介质 |
CN110222254A (zh) * | 2019-04-26 | 2019-09-10 | 平安科技(深圳)有限公司 | 课程推荐方法、装置、设备及计算机可读存储介质 |
CN110209946B (zh) * | 2019-06-10 | 2021-03-09 | 合肥工业大学 | 基于社交和社群的产品推荐方法、***和存储介质 |
CN110443717A (zh) * | 2019-07-16 | 2019-11-12 | 阿里巴巴集团控股有限公司 | 一种基于信用评估的保险理赔方法和*** |
CN112395487B (zh) * | 2019-08-14 | 2024-04-26 | 腾讯科技(深圳)有限公司 | 信息推荐方法、装置、计算机可读存储介质及电子设备 |
US11727312B2 (en) | 2019-09-03 | 2023-08-15 | International Business Machines Corporation | Generating personalized recommendations to address a target problem |
CN110874437B (zh) * | 2019-11-14 | 2023-06-16 | 重庆邮电大学 | 一种基于多重兴趣点对排序的个性化兴趣点推荐方法 |
CN110677701A (zh) * | 2019-11-20 | 2020-01-10 | 咪咕文化科技有限公司 | 视频流推荐方法、电子设备和存储介质 |
CN111026977B (zh) * | 2019-12-17 | 2022-04-08 | 腾讯科技(深圳)有限公司 | 信息推荐方法、装置及存储介质 |
CN111291264B (zh) * | 2020-01-23 | 2023-06-23 | 腾讯科技(深圳)有限公司 | 基于机器学习的访问对象预测方法、装置和计算机设备 |
CN113286199A (zh) * | 2020-02-20 | 2021-08-20 | 佛山市云米电器科技有限公司 | 节目推荐方法、电视机和存储介质 |
CN111310056B (zh) * | 2020-03-11 | 2023-04-14 | 深圳市雅阅科技有限公司 | 基于人工智能的信息推荐方法、装置、设备及存储介质 |
CN113407772B (zh) * | 2020-03-16 | 2023-12-26 | 北京达佳互联信息技术有限公司 | 视频推荐模型的生成方法、视频推荐方法、装置 |
CN111460130B (zh) * | 2020-03-27 | 2023-07-25 | 咪咕数字传媒有限公司 | 信息推荐方法、装置、设备和可读存储介质 |
CN113495989B (zh) * | 2020-04-01 | 2024-07-12 | 北京达佳互联信息技术有限公司 | 一种对象推荐方法、装置、计算设备及存储介质 |
CN111581506B (zh) * | 2020-04-28 | 2023-04-25 | 海南太美航空股份有限公司 | 基于协同过滤的航班推荐方法及*** |
CN113596528B (zh) * | 2020-04-30 | 2022-10-04 | 北京达佳互联信息技术有限公司 | 视频推送模型的训练方法、装置、服务器及存储介质 |
CN111552883B (zh) * | 2020-05-13 | 2023-12-12 | 咪咕文化科技有限公司 | 内容推荐方法及计算机可读存储介质 |
CN111708952B (zh) * | 2020-06-18 | 2023-10-20 | 小红书科技有限公司 | 一种标签推荐方法及*** |
CN112765449B (zh) * | 2020-06-19 | 2023-09-12 | 腾讯科技(深圳)有限公司 | 一种应用程序展示方法、装置及存储介质 |
CN111914177B (zh) * | 2020-08-18 | 2023-11-14 | 深圳市雅阅科技有限公司 | 媒体信息兴趣度的匹配方法、装置、设备及存储介质 |
CN112131485A (zh) * | 2020-08-19 | 2020-12-25 | 贝壳技术有限公司 | 房源推荐方法及装置 |
CN112395499B (zh) * | 2020-11-03 | 2022-08-12 | 腾讯科技(深圳)有限公司 | 信息推荐方法及装置、电子设备、存储介质 |
CN112464087B (zh) * | 2020-11-23 | 2024-03-01 | 北京明略软件***有限公司 | 推荐概率的输出方法及装置、存储介质、电子设备 |
CN112507163B (zh) * | 2020-12-02 | 2023-07-21 | 北京奇艺世纪科技有限公司 | 时长预测模型训练方法、推荐方法、装置、设备及介质 |
CN112434391B (zh) * | 2020-12-10 | 2022-03-01 | 四川长虹电器股份有限公司 | 一种基于注塑件相似度比较推荐工艺参数的方法 |
CN112487300B (zh) * | 2020-12-18 | 2024-06-07 | 上海众源网络有限公司 | 一种视频推荐方法、装置、电子设备及存储介质 |
CN114765624B (zh) * | 2020-12-31 | 2024-04-30 | 北京达佳互联信息技术有限公司 | 信息推荐方法、装置、服务器及存储介质 |
CN112785372B (zh) * | 2021-01-11 | 2023-09-12 | 北京欧拉认知智能科技有限公司 | 一种基于语义关系的智能推荐方法 |
CN112989146B (zh) * | 2021-02-18 | 2024-04-23 | 百度在线网络技术(北京)有限公司 | 向目标用户推荐资源的方法、装置、设备、介质和程序产品 |
CN112991009A (zh) * | 2021-03-08 | 2021-06-18 | 北京嘀嘀无限科技发展有限公司 | 对象推荐方法、装置、电子设备和存储介质 |
CN112950325B (zh) * | 2021-03-16 | 2023-10-03 | 山西大学 | 一种社交行为融合的自注意力序列推荐方法 |
CN113010788B (zh) * | 2021-03-19 | 2023-05-23 | 成都欧珀通信科技有限公司 | 信息推送方法及装置、电子设备、计算机可读存储介质 |
CN112862007B (zh) * | 2021-03-29 | 2022-12-13 | 山东大学 | 基于用户兴趣编辑的商品序列推荐方法及*** |
CN112948701B (zh) * | 2021-04-16 | 2023-10-20 | 泰康保险集团股份有限公司 | 信息推荐装置、方法、设备及存储介质 |
CN113139834A (zh) * | 2021-04-29 | 2021-07-20 | 北京沃东天骏信息技术有限公司 | 信息处理方法、装置、电子设备和存储介质 |
CN113329344B (zh) * | 2021-05-19 | 2022-08-30 | 中国科学院计算技术研究所 | 一种用于通讯网络的文件推荐的方法 |
CN113127750B (zh) * | 2021-05-19 | 2024-04-02 | 同盾科技有限公司 | 信息列表生成方法及装置、存储介质、电子设备 |
CN113269262B (zh) * | 2021-06-02 | 2024-06-14 | 腾讯音乐娱乐科技(深圳)有限公司 | 训练匹配度检测模型的方法、设备和存储介质 |
CN113469786A (zh) * | 2021-06-29 | 2021-10-01 | 深圳市点购电子商务控股股份有限公司 | 物品推荐的方法、装置、计算机设备和存储介质 |
CN113626686A (zh) * | 2021-07-19 | 2021-11-09 | 上海泛宥信息科技有限公司 | 基于用户数据分析的自动推送方法、装置和计算机设备 |
CN113609388B (zh) * | 2021-07-27 | 2024-02-06 | 浙江大学 | 基于反事实用户行为序列生成的序列推荐方法 |
CN113836310B (zh) * | 2021-08-04 | 2022-11-29 | 欧冶工业品股份有限公司 | 知识图谱驱动的工业品供应链管理方法和*** |
CN113609394B (zh) * | 2021-08-09 | 2023-09-05 | 上海交通大学 | 面向信息流的安全推荐*** |
CN113378071A (zh) * | 2021-08-16 | 2021-09-10 | 武汉卓尔数字传媒科技有限公司 | 广告推荐方法及装置、电子设备、存储介质 |
CN113630631A (zh) * | 2021-08-23 | 2021-11-09 | 南京金智视讯技术有限公司 | 一种基于协同过滤推荐算法的hls缓存方法及*** |
CN113656698B (zh) * | 2021-08-24 | 2024-04-09 | 北京百度网讯科技有限公司 | 兴趣特征提取模型的训练方法、装置和电子设备 |
CN113674065B (zh) * | 2021-08-30 | 2023-09-22 | 中国平安人寿保险股份有限公司 | 基于服务触点的业务推荐方法、装置、电子设备及介质 |
CN113836444B (zh) * | 2021-09-30 | 2024-04-19 | 中国科学院深圳先进技术研究院 | 一种线性时间好友推荐方法、***、终端以及存储介质 |
CN114168465B (zh) * | 2021-12-02 | 2024-05-17 | 天津大学 | 一种基于计算实验的推荐***验证方法 |
CN114282106B (zh) * | 2021-12-22 | 2023-07-25 | 北京网聘咨询有限公司 | 一种职位信息快速投递方法 |
CN114595345A (zh) * | 2022-03-04 | 2022-06-07 | 江苏锐天智能科技股份有限公司 | 一种基于兴趣点的机载娱乐信息推荐***及方法 |
CN114817724B (zh) * | 2022-04-27 | 2024-06-25 | 湖南大学 | 针对推荐算法的评估方法、装置及存储介质 |
CN115065845A (zh) * | 2022-06-17 | 2022-09-16 | 联通沃音乐文化有限公司 | 一种社群融合推荐的影音视频播放管理方法及*** |
CN116579820A (zh) * | 2023-04-11 | 2023-08-11 | 广州携旅信息科技有限公司 | 一种商城商品推荐算法方法、***、电子设备和存储介质 |
CN116610864A (zh) * | 2023-06-06 | 2023-08-18 | 北京科码先锋互联网技术股份有限公司 | 一种基于pgc、ugc内容版块千人千面的内容呈现算法及*** |
CN116596576B (zh) * | 2023-07-17 | 2024-04-16 | 深圳须弥云图空间科技有限公司 | 目标推荐方法及装置 |
CN117132356B (zh) * | 2023-08-29 | 2024-02-13 | 重庆大学 | 基于自适应用户兴趣变化周期的推荐方法、装置及*** |
CN116887001B (zh) * | 2023-09-06 | 2023-12-15 | 四川中电启明星信息技术有限公司 | 融合社会属性信息的短视频推送方法、装置及电子设备 |
CN117874349B (zh) * | 2024-01-18 | 2024-07-09 | 谷麦香(宁夏)餐饮管理有限公司 | 基于大数据分析的菜包肉养生配方推荐方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103116614A (zh) * | 2013-01-25 | 2013-05-22 | 北京奇艺世纪科技有限公司 | 一种基于用户轨迹的协同过滤推荐方法、装置及*** |
CN106709076A (zh) * | 2017-02-27 | 2017-05-24 | 华南理工大学 | 基于协同过滤的社交网络推荐装置及方法 |
CN107169574A (zh) * | 2017-05-05 | 2017-09-15 | 第四范式(北京)技术有限公司 | 利用嵌套机器学习模型来执行预测的方法及*** |
CN107273438A (zh) * | 2017-05-24 | 2017-10-20 | 深圳大学 | 一种推荐方法、装置、设备及存储介质 |
CN107563542A (zh) * | 2017-08-02 | 2018-01-09 | 阿里巴巴集团控股有限公司 | 数据预测方法及装置和电子设备 |
Family Cites Families (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7734680B1 (en) * | 1999-09-30 | 2010-06-08 | Koninklijke Philips Electronics N.V. | Method and apparatus for realizing personalized information from multiple information sources |
US7613664B2 (en) * | 2005-03-31 | 2009-11-03 | Palo Alto Research Center Incorporated | Systems and methods for determining user interests |
US9654721B2 (en) * | 2007-07-10 | 2017-05-16 | Verizon Patent And Licensing Inc. | System and method for providing personal content recommendations |
US8696470B2 (en) * | 2010-04-09 | 2014-04-15 | Nguyen Gaming Llc | Spontaneous player preferences |
KR20120003362A (ko) * | 2010-07-02 | 2012-01-10 | 아코지토(주) | 협력적 필터링 알고리즘 기반의 iptv 개인별 선호프로그램 추천시스템 |
US20130031216A1 (en) * | 2011-07-29 | 2013-01-31 | Myxer, Inc. | Systems and methods for generation of customized media playlists |
US8831902B2 (en) * | 2011-09-22 | 2014-09-09 | Tcl Lab (Us) Inc. | Least click TV |
US9473730B1 (en) * | 2012-02-13 | 2016-10-18 | Nbcuniversal Media, Llc | Method and system for personalized recommendation modeling |
US10521473B2 (en) * | 2012-05-21 | 2019-12-31 | Kent State University | Shortest path computation in large networks |
CN103345503B (zh) * | 2013-07-01 | 2016-04-13 | 杭州万事利丝绸科技有限公司 | 一种基于小波网络的丝绸产品个性化推荐方法 |
WO2015123751A1 (en) * | 2014-02-21 | 2015-08-27 | Rna Labs Inc. | Systems and methods for automatically collecting user data and making a real-world action for a user |
US20150248651A1 (en) * | 2014-02-28 | 2015-09-03 | Christine E. Akutagawa | Social networking event planning |
CN105022754B (zh) * | 2014-04-29 | 2020-05-12 | 腾讯科技(深圳)有限公司 | 基于社交网络的对象分类方法及装置 |
US10083494B2 (en) * | 2015-01-30 | 2018-09-25 | Huawei Technologies Co., Ltd. | Systems, devices and methods for distributed content pre-fetching to a user device |
CN104915861A (zh) * | 2015-06-15 | 2015-09-16 | 浙江经贸职业技术学院 | 基于评分和标签构建用户群体模型的电子商务推荐方法 |
CN106557513B (zh) * | 2015-09-29 | 2022-05-10 | 腾讯科技(深圳)有限公司 | 事件信息推送方法及事件信息推送装置 |
CN106933821A (zh) * | 2015-12-29 | 2017-07-07 | 中国电信股份有限公司 | 一种基于相似度计算的个性化职位推荐方法和*** |
US10341728B2 (en) * | 2015-12-30 | 2019-07-02 | Sling Media L.L.C. | Media systems for temporally and contextually relevant recommendations |
CN105809479A (zh) * | 2016-03-07 | 2016-07-27 | 海信集团有限公司 | 物品推荐方法及装置 |
US10832031B2 (en) * | 2016-08-15 | 2020-11-10 | Apple Inc. | Command processing using multimodal signal analysis |
US10657574B2 (en) * | 2016-09-13 | 2020-05-19 | Adobe Inc. | Item recommendation techniques |
US10846052B2 (en) * | 2016-10-27 | 2020-11-24 | Tencent Technology (Shenzhen) Company Limited | Community discovery method, device, server and computer storage medium |
CN106708953A (zh) * | 2016-11-28 | 2017-05-24 | 西安电子科技大学 | 基于离散粒子群优化的局部社区检测协同过滤推荐方法 |
CN113570064A (zh) * | 2017-05-05 | 2021-10-29 | 第四范式(北京)技术有限公司 | 利用复合机器学习模型来执行预测的方法及*** |
CN108763314B (zh) * | 2018-04-26 | 2021-01-19 | 深圳市腾讯计算机***有限公司 | 一种兴趣推荐方法、装置、服务器及存储介质 |
-
2018
- 2018-04-26 CN CN201810387692.8A patent/CN108763314B/zh active Active
-
2019
- 2019-02-26 WO PCT/CN2019/076164 patent/WO2019205795A1/zh active Application Filing
-
2020
- 2020-06-23 US US16/909,682 patent/US11593894B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103116614A (zh) * | 2013-01-25 | 2013-05-22 | 北京奇艺世纪科技有限公司 | 一种基于用户轨迹的协同过滤推荐方法、装置及*** |
CN106709076A (zh) * | 2017-02-27 | 2017-05-24 | 华南理工大学 | 基于协同过滤的社交网络推荐装置及方法 |
CN107169574A (zh) * | 2017-05-05 | 2017-09-15 | 第四范式(北京)技术有限公司 | 利用嵌套机器学习模型来执行预测的方法及*** |
CN107273438A (zh) * | 2017-05-24 | 2017-10-20 | 深圳大学 | 一种推荐方法、装置、设备及存储介质 |
CN107563542A (zh) * | 2017-08-02 | 2018-01-09 | 阿里巴巴集团控股有限公司 | 数据预测方法及装置和电子设备 |
Non-Patent Citations (2)
Title |
---|
Efficient hybrid tree/linear array architectures for block-matching motion estimation algorithms;M.J.Chen 等;《IEEE Proceedings Vision, Image and Signal Processing》;19960831;217-222 * |
在线广告中高层特征表示及点击率预测方法研究;邵迪;《中国优秀硕士学位论文全文数据库 信息科技辑》;20150215;I138-1540 * |
Also Published As
Publication number | Publication date |
---|---|
CN108763314A (zh) | 2018-11-06 |
WO2019205795A1 (zh) | 2019-10-31 |
US11593894B2 (en) | 2023-02-28 |
US20200320646A1 (en) | 2020-10-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108763314B (zh) | 一种兴趣推荐方法、装置、服务器及存储介质 | |
US11100466B2 (en) | Social media profiling for one or more authors using one or more social media platforms | |
Bagrow et al. | Information flow reveals prediction limits in online social activity | |
Yin et al. | Joint event-partner recommendation in event-based social networks | |
US10546006B2 (en) | Method and system for hybrid information query | |
CN110162693B (zh) | 一种信息推荐的方法以及服务器 | |
US10515424B2 (en) | Machine learned query generation on inverted indices | |
US20150242497A1 (en) | User interest recommending method and apparatus | |
CN110462604A (zh) | 基于设备使用关联互联网设备的数据处理***和方法 | |
WO2009023070A1 (en) | Systems and methods for keyword selection in a web-based social network | |
Yazdanfar et al. | Link recommender: Collaborative-filtering for recommending urls to twitter users | |
CN107896153B (zh) | 一种基于移动用户上网行为的流量套餐推荐方法及装置 | |
CN107918618B (zh) | 数据处理方法及装置 | |
CN108932646B (zh) | 基于运营商的用户标签验证方法、装置和电子设备 | |
CN114371946B (zh) | 基于云计算和大数据的信息推送方法及信息推送服务器 | |
CN113656699B (zh) | 用户特征向量确定方法、相关设备及介质 | |
US20190370297A1 (en) | Method and apparatus for enriching metadata via a network | |
Liu et al. | A hybrid book recommendation algorithm based on context awareness and social network | |
Wang et al. | Accurate and early prediction of user lifespan in an online video-on-demand system | |
Cui et al. | Personalized microblog recommendation using sentimental features | |
US10853429B2 (en) | Identifying domain-specific accounts | |
US20140244741A1 (en) | Computer-Implemented System And Method For Context-Based APP Searching And APP Use Insights | |
WO2023087933A1 (zh) | 内容推荐方法、装置、设备、存储介质及程序产品 | |
CN115795156A (zh) | 物料召回和神经网络训练方法、装置、设备及存储介质 | |
Li et al. | A combined collaborative filtering model for social influence prediction in event-based social networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |