CN109977315A - 一种文章推荐方法、装置、设备及存储介质 - Google Patents

一种文章推荐方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN109977315A
CN109977315A CN201910251329.8A CN201910251329A CN109977315A CN 109977315 A CN109977315 A CN 109977315A CN 201910251329 A CN201910251329 A CN 201910251329A CN 109977315 A CN109977315 A CN 109977315A
Authority
CN
China
Prior art keywords
article
user
recommendation
list
recommended
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910251329.8A
Other languages
English (en)
Inventor
陈滨
梁晓斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiamen Armored Network Co Ltd
Original Assignee
Xiamen Armored Network Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiamen Armored Network Co Ltd filed Critical Xiamen Armored Network Co Ltd
Priority to CN201910251329.8A priority Critical patent/CN109977315A/zh
Publication of CN109977315A publication Critical patent/CN109977315A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种文章推荐方法、装置、设备及存储介质,涉及信息技术领域。根据用户的历史浏览文章,构建用户结构化模型;根据用户结构化模型以及预设的至少两种推荐算法,获得对应于所述用户的至少两种文章推荐算法;依次将待推荐的文章通过至少两种文章推荐算法,获得相应于用户的最终推荐文章列表;其中,每种文章推荐算法输出的推荐文章列表作为下一个文章推荐算法的输入,最后一个文章推荐算法输出的文章推荐列表即为最终推荐文章列表。本发明采用流水线式混合文章推荐方法,保证了推荐出的文章数据集合了所有文章推荐算法的推荐的优点,弥补了单项推荐的不足,使得推荐文章数据更加的准确有效。

Description

一种文章推荐方法、装置、设备及存储介质
技术领域
本发明涉及信息技术领域,具体而言,涉及一种文章推荐方法、装置、设备及存储介质。
背景技术
随着互联网的快速发展,人们每天需要面对大量的信息,为了让用户能够准确阅读到用户感兴趣的文章,从而提高用户粘性,推荐***服务也逐渐地被运用到资讯类网站/移动应用中。文章推荐***可以根据资讯类网站/移动应用的用户数据与文章内容,为网站/移动应用的用户计算出文章资讯,使得用户可以不受其他多余信息的干扰,直接查看到自身感兴趣的文章资讯。目前的文章推荐***主要采用的是基于内容的推荐算法或者协同过滤算法。
基于内容的推荐算法主要根据用户的当前及历史的行为内容通过机器学习的方法计算得出当前用户的相关内容标签,然后再根据用户的内容标签进行内容的推荐。但是基于内容的推荐只是单一的用户数据样本,尤其是针对用户行为稀少的情况下,得出的用户内容标签不够准确,精度较低。
而协同过滤算法是在基于内容算法的基础上利用其他用户的历史行为内容,即在得出当前用户的内容标签后,在数据库中进行对比,找到用户相似内容标签的其他用户,然后将其他用户感兴趣的内容推荐给当前用户。虽然协同过滤算法在一定程度上提高了推荐精度,但当用户及文章数据的增多,而且部分没有访问行为的文章就很难出现在推荐的列表中,造成文章资源分配不均,不利于文章的相应阅读推广。
因此,需研发一种推荐精度高、覆盖的文章数广的混合推荐算法用于减少单项文章推荐算法的不足,使得文章推荐更加准确且更符合相应的推荐要求。
发明内容
有鉴于此,本发明实施例的目的在于提供一种文章推荐方法、装置、设备及存储介质,以改善现有技术中单项文章推荐算法的不足的问题。
本发明提供了一种文章推荐方法,包括:
根据用户的历史浏览文章,构建用户结构化模型;
根据所述用户结构化模型以及预设的至少两种推荐算法,获得对应于所述用户的至少两种文章推荐算法;
依次将待推荐的文章通过所述至少两种文章推荐算法,获得相应于所述用户的最终推荐文章列表;其中,每种文章推荐算法输出的推荐文章列表作为下一个文章推荐算法的输入,最后一个文章推荐算法输出的文章推荐列表即为所述最终推荐文章列表。
优选地,根据用户的历史浏览文章,构建用户结构化模型的步骤包括:
获取用户的历史浏览文章的特征数据;
基于所述特征数据,采用机器学习的分类算法构建用户结构化模型;
储存为用户构建的所述用户结构化模型。
优选地,所述文章推荐算法包括如下中的两个:热点新闻推荐算法、基于内容的推荐算法或协同过滤算法。
优选地,所述协同过滤算法包括基于用户的协同过滤算法和基于文章的协同过滤算法。
优选地,还包括:
获取用户对生成的最终推荐文章列表中的文章的点击阅读顺序;
获取点击阅读顺序排列在前N次的文章在各个文章推荐算法中的排列位置;
根据排列位置更新所述至少两种文章推荐算法的排列顺序。
本发明实施例还提供一种文章推荐装置,包括:
建模单元,用于根据用户的历史浏览文章,构建用户结构化模型;
算法单元,用于根据所述用户结构化模型以及预设的至少两种推荐算法,获得对应于所述用户的至少两种文章推荐算法;
推荐单元,用于依次将待推荐的文章通过所述至少两种文章推荐算法,获得相应于所述用户的最终推荐文章列表;其中,每种文章推荐算法输出的推荐文章列表作为下一个文章推荐算法的输入,最后一个文章推荐算法输出的文章推荐列表即为所述最终推荐文章列表。
优选地,所述建模单元包括:
获取模块,用于获取用户的历史浏览文章的特征数据;
构建模块,用于基于所述特征数据,采用机器学习的分类算法构建用户结构化模型;
储存模块,用于储存为用户构建的所述用户结构化模型。
优选地,所述文章推荐算法包括如下中的两个:热点新闻推荐算法、基于内容的推荐算法或协同过滤算法。
本发明还提供一种文章推荐设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述计算机程序时实现如上述的文章推荐方法。
本发明还提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现上述文章推荐方法的步骤。
本发明提供了一种文章推荐方法、装置、设备及存储介质,通过流水线式混合文章推荐方法,即本发明将文章数据经过至少两次不同的文章推荐算法的计算得出推荐文章列表。这种流水线式混合文章推荐算法保证了推荐出的文章数据集合了所用的所有文章推荐算法的推荐的优点,弥补了单项推荐的不足,使得推荐文章数据更加的准确有效。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明第一实施例提供的一种文章推荐方法的流程图。
图2为本发明第一实施例提供的文章推荐方法的原理图。
图3是本发明第二实施例提供的文章推荐装置的结构示意图。
图标:201-建模单元;202-算法单元;203-推荐单元。
具体实施方式
下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本发明的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
请参考图1及图2,本发明的第一实施例提供了一种文章推荐方法,其可由文章推荐设备来执行,并至少包括如下步骤:
S101,根据用户的历史浏览文章,构建用户结构化模型。
其中,在本实施例中,所述文章推荐设备例如可为一个服务器或者具有数据处理和收发能力的终端,其安装有相应的计算机程序(例如一个中间件),并通过执行所述计算机程序来实现本实施例的文章推荐方法。
其中,在本发明的一较佳实施例中,根据用户的历史浏览文章,构建用户结构化模型的具体步骤包括:
获取用户的历史浏览文章的特征数据;
基于所述特征数据,采用机器学习的分类算法构建用户结构化模型;
储存为用户构建的所述用户结构化模型。
其中,在本实施例中,所述文章推荐设备的文章库当中的每篇文章均具备至少一个特征属性标签。具体地,在文章库中的所有文章通过预设的文章信息标签库的标签,每篇文章至少提取一个所对应的文章标签词,而后通过数值型数据归一化、非数值型数据词袋法将文章标签词转换为词特征向量,载通过TF-IDF(Term frequency-inverse documentfrequency,词频-逆文件频率指数)进行内容分析,获得每篇文章的特征属性标签,而这些特征属性标签就形成每篇文章的特征数据。且随着文章信息标签库当中标签词数量和文章库文章数量的不断增加,每篇文章的特征属性标签描述也进行持续的更新。其中,TF-IDF算法是一种统计方法,一种用于信息检索与数据挖掘的常用加权技术,通过对文本数据进行数据挖掘,得到可以作为特征数据的词语,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,因此,通过TF-IDF算法对文章内容分析后获得文章的特征数据与文章内容具有更强的关联性,提高文章的特征数据的价值。
机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。在本实施例中,所述文章推荐设备获取每个用户的历史浏览文章的特征数据,使用机器学习的分类算法构建每个用户以文章的特征属性标签为内容的用户结构化模型,即以文章的特征数据为内容的用户结构化模型,并储存于用户结构化模型库中。而且,随着用户浏览文章数据的不断增多,机器学习还会对用户结构化模型进行持续的修正调整。其中,所述机器学习可通过分类算法如KNN(K-NearestNeighbor,邻近算法)、决策树算法等为每个用户构建用户结构化模型,但不限于此,并且这些分类算法均为现有技术,这里就不在赘述。
S102,根据所述用户结构化模型以及预设的至少两种推荐算法,获得对应于所述用户的至少两种文章推荐算法。
S103,依次将待推荐的文章通过所述至少两种文章推荐算法,获得相应于所述用户的最终推荐文章列表;其中,每种文章推荐算法输出的推荐文章列表作为下一个文章推荐算法的输入,最后一个文章推荐算法输出的文章推荐列表即为所述最终推荐文章列表。
本实施例提供的流水线式混合文章推荐方法,将文章库中的文章数据经过至少两次不同的文章推荐算法的计算得出推荐文章列表。这种流水线式混合文章推荐算法保证了推荐出的文章集合了所用的所有文章推荐算法的推荐的优点,弥补了单项推荐的不足,使得推荐文章数据更加的准确有效。
优选地,在第一实施例的基础上,在一个优选实施例中,所述文章推荐算法包括如下中的两个:热点新闻推荐算法、基于内容的推荐算法或协同过滤算法。
其中,所述热点新闻推荐算法是根据文章发表的时间及当前的热点词、文章标签来进行文章列表的选择推荐的一种算法,在本实施例中,通过热点新闻推荐算法生成推荐列表的步骤包括:
设置热点关键词与热点时间;
匹配所述热点关键词与文章的特征数据,生成文章样品数据;
根据文章发布时间和所述热点时间对所述文章样品数据进行排序,生成推荐列表。
具体地,首先运营人员对最新出现的热点进行热点关键词以及热点时间进行设置。而后,文章推荐设备通过对每篇文章的特征数据与热点关键词进行匹配,获得具有热点关键词特征属性标签的文章样品数据,最后根据每篇文章的发布时间以及热点关键词出现的热点时间进行排序,从而获得推荐列表,该推荐列表内的文章数据均具有较强的实时性与热点性。
基于内容的推荐算法是根据用户的当前及历史浏览文章内容通过机器学习的方法计算得出用户的相关内容标签,然后再根据用户的内容标签进行内容的推荐,在本实施例中,基于内容的推荐算法的步骤包括:
匹配文章的特征数据与所述用户结构化模型,生成文章样品数据;其中,采用余弦相识度的公式计算所述用户结构化模型与文章的特征数据的匹配距离;
基于所述匹配距离,将文章样品数据排序、去重后生成推荐列表。
具体地,在本实施例中,文章库中的每篇文章的特征数据都与该用户的用户结构化模型进行匹配操作,为用户推荐一组相关性最大的文章样品数据,并生成相应的推荐列表。
其中所述的匹配操作主要为计算用户结构化模型与每篇文章的特征数据的匹配距离,而后根据所述匹配距离排序、去重后获得推荐列表。具体操作如下:将文章的特征数据(标签)用矩阵来表示,如文章Ia[1,1,0,....0,0,0],其中标签有效的为1,无效为0。而用户结构化模型也用矩阵表示,如用户Ua[0.5,x,y,......z],其中,对于标签的感兴趣度用数值表示。本实施例通过利用余弦相识度的公式来计算用户Ua与文章Ia的匹配距离,其具体公式如下所示:
Ua表示用户Ua矩阵中对应的值,例如举例的0.5;Ia表示文章Ia矩阵中对应的值,如举例中的1;余弦相识度越大说明用户越可能喜欢。通过计算出文章库中文章Ia与用户Ua的余弦相似度,从而进行降序排序,去掉用户Ua已经阅读过的文章,生成一组与用户Ua相关性最大的文章样品数据,根据预设的推荐条数生成推荐列表。
在本发明一较佳实施例中,将待推荐的文章先通过热点新闻推荐算法生成推荐文章列表后,将该推荐文章列表的文章样品数据通过基于内容的推荐算法生成最终文章推荐列表,这种推荐方法一般用于需要同时满足多种推荐条件的情况,如热门新闻推荐(用户感兴趣且热门的文章)、文章下方相关推荐(既与文章相关又是用户可能感兴趣的文章)等。这种文章推荐方法保证了推荐文章数据具有一定的时效性与热度,也使得文章资源得到较好的分配,弥补了单项推荐的不足,并能根据版块的不同需求进行更准确的推荐。
在上述实施例的基础上,在一个优选实施例中,所述协同过滤算法包括基于用户的协同过滤算法和基于文章的协同过滤算法。
具体地,通过所述协同过滤算法获得推荐文章列表或最终推荐文章列表的步骤包括:
依次将待推荐的文章或上一个文章算法输出的文章通过两个所述协同过滤算法,获得相应于所述用户的第一列表和第二列表;其中,第一个协同过滤算法输出的第一列表作为第二个协同过滤算法的输入,第二个协同过滤算法输出的第二列表即为推荐文章列表或最终推荐文章列表。
其中,基于用户的协同过滤算法是利用其他用户的历史浏览文章的特征数据,获得其他用户的结构化模型,并在用户结构化模型库中进行其他用户结构模型与当前用户结构模型之间的对比,找到与当前用户具有相似的用户结构化模型的其他用户,然后将其他用户当前及历史浏览文章推荐给当前用户。而基于文章的协同过滤算法是根据用户的历史浏览文章的特征数据,将该特征数据与文章库中所有文章的特征数据进行对比,找到与当前用户历史浏览文章相似的文章样品数据,然后推荐给当前用户。基于用户的协同过滤算法推荐的文章偏向有用户行为的文章上,而基于文章的协同过滤算法则可推荐无用户行为的文章,弥补基于用户的协同过滤算法的不足,将二者获得的推荐列表流水线式混合后进行推荐,有利于增加推荐的精确度。需要说明的是,将待推荐的文章或上一个文章算法输出的文章可先通过基于用户的协同过滤算法,获得第一列表;也可先通过基于文章的协同过滤算法获得第一列表,这里不做限定。
优选地,在本发明的一较佳实施例中,通过基于用户的协同过滤算法获得相应于所述用户的第一列表或第二列表的步骤包括:
基于所述用户结构化模型,获得各个用户之间的用户相关度系数;
根据所述用户相关度系数,生成第一文章样品数据;
过滤所述第一文章样品数据中已阅读文章数据后,加权、排序生成第一列表或第二列表。
其中,在本实施例中,文章推荐设备将各个用户结构化模型通过皮尔逊相关度评价计算得出各个用户之间的用户相关度系数,皮尔逊相关系数计算公式如下所示,计算用户U和其他用户V之间的用户相关度系数:
根据上述公式计算结果得出的各个用户之间的用户相关度系数,通过比较用户相关度系数的数值,获得与用户U相近的其他用户列表,而后从待推荐的文章或上一个文章算法输出的文章或基于文章的协同过滤算法输出的文章中得到其他用户列表的历史浏览文章,去除用户U已浏览的文章,剩余的文章进行加权排序,获得最适合推荐给用户U的第一列表或第二列表。其中,剩余的文章通过文章系数乘以用户相关度系数的数值进行加权排序。所述文章系数为用户U相近的其他用户V对该文章的感兴趣程度,可根据其他用户V对文章的浏览、评论、点赞等行为获得文章系数,两个系数相乘获得推荐给用户U的权重,按照权重从高到低排序,得出最适合推荐给用户U的第一列表或第二列表。
除此之外,在本发明的另一较佳实施例中,从待推荐的文章得到所述用户列表的历史浏览文章可先以文章发布时间、热点、标签为标准,选出具有热点效应的相关的文章样品数据;在文章样品数据去除用户已浏览的文章,剩余的文章样品数据进行加权排序,获得最适合推荐给用户的第一列表,使推荐给用户的文章具有时效性和热点性。
优选地,在本发明的另一较佳实施例中,通过基于文章的协同过滤算法获得相应于所述用户的第一列表或第二列表的步骤包括:
基于用户的历史浏览文章的特征数据,获取各个文章之间的文章相关度系数;
根据所述文章相关度系数,生成第二文章样品数据;
过滤所述第二文章样品数据中已阅读文章数据后,加权、排序生成第一列表或第二列表。
其中,在本实施例中,基于文章的协同过滤算法与基于用户的协同过滤算法相似,用户的历史浏览文章的特征数据和文章库中文章的特征数据通过皮尔逊相关度评价计算得出各个文章之间的文章相关度系数,而后从待推荐的文章或上一个文章算法输出的文章或基于用户的协同过滤算法输出的文章中得到与所述用户历史浏览文章相近的文章,去除用户U已浏览的文章,剩余的文章进行加权排序,获得最适合推荐给用户U的第一列表或第二列表。其中,剩余的文章通过文章特征数据乘以文章相关度系数加权排序,两个系数相乘获得推荐给用户的权重,按照权重从高到低排序,得出最适合推荐给用户的第一列表或第二列表。
除此之外,在本发明的另一较佳实施例中,从待推荐的文章得到与所述用户历史浏览文章相近的文章可先以文章发布时间、热点、标签为标准,选出具有热点效应的相关的文章样品数据;在文章样品数据去除用户已浏览的文章,剩余的文章样品数据进行加权排序,获得最适合推荐给用户的第一列表,使推荐给用户的文章具有时效性和热点性。
在上述实施例的基础上,在一个优选实施例中,还包括:
获取用户对生成的最终推荐文章列表中的文章的点击阅读顺序;
获取点击阅读顺序排列在前N次的文章在各个文章推荐算法中的排列位置;
根据排列位置更新所述至少两种文章推荐算法的排列顺序。
具体地,例如文章库的所有文章先通过第一个文章推荐算法获得了100篇推荐文章列表,将这100篇推荐文章列表在通过第二个文章推荐算法获得50篇推荐文章,而后这50篇推荐再经过第三文章推荐算法或第四推荐算法得到15篇最终推荐文章列表,但该形式的文章推荐方法是按照已设定顺序的文章推荐算法顺序进行文章筛选和排序的,而文章推荐算法的顺序不同会影响到最终推荐文章列表内的文章的内容以及其排列顺序,但不同用户对文章推荐算法的适配度可能是不同的,因此固定顺序的文章推荐算法难以满足不同用户的需求。
为此,在本实施例中,考虑最终推荐文章列表中的所有文章在每个推荐列表当中的顺序不一样的信息,使文章推荐设备先获取用户对生成的最终推荐文章列表中的文章的点击阅读顺序,进而获取点击阅读顺序排列在前N次的文章(通常是用户比较感兴趣的文章)在各个文章推荐算法中的排列位置,根据各个文章推荐列表当中阅读顺序排列在前N次的文章排列位置,按照文章排列位置从低到高排序进行文章推荐算法排序,文章排列位置最低的文章推荐算法为第一文章推荐算法,文章排列位置最高的文章推荐算法为最终文章推荐算法,确保生成的最终推荐列表符合用户的阅读顺序,并把用户喜爱的文章列在最终推荐文章列表靠前顺序,更符合用户的阅读需求。且文章推荐设备可根据每个用户自己的阅读需求调整文章推荐算法的顺序,灵活性更好,推荐精度更高。
请参考图3,本发明的第二实施例还提供一种文章推荐装置,包括:
建模单元201,用于根据用户的历史浏览文章,构建用户结构化模型;
算法单元202,用于根据所述用户结构化模型以及预设的至少两种推荐算法,获得对应于所述用户的至少两种文章推荐算法;
推荐单元203,用于依次将待推荐的文章通过所述至少两种文章推荐算法,获得相应于所述用户的最终推荐文章列表;其中,每种文章推荐算法输出的推荐文章列表作为下一个文章推荐算法的输入,最后一个文章推荐算法输出的文章推荐列表即为所述最终推荐文章列表。
优选地,所述文章推荐装置还包括:
阅读顺序获取单元,用于获取用户对生成的最终推荐文章列表中的文章的点击阅读顺序;
位置获取单元,用于获取点击阅读顺序排列在前N次的文章在各个文章推荐算法中的排列位置;
算法顺序更新单元,用于根据排列位置更新所述至少两种文章推荐算法的排列顺序。
优选地,所述建模单元201的步骤包括:
获取模块,用于获取用户的历史浏览文章的特征数据;
构建模块,用于基于所述特征数据,采用机器学习的分类算法构建用户结构化模型;
储存模块,用于储存为用户构建的所述用户结构化模型。
优选地,所述算法单元202包括如下中的两个算法模块:热点新闻推荐算法模块、基于内容的推荐算法模块或协同过滤算法模块。
其中,所述热点新闻推荐算法模块用于:
设置热点关键词与热点时间;
匹配所述热点关键词与文章的特征数据,生成文章样品数据;
根据文章发布时间和所述热点时间对所述文章样品数据进行排序,生成推荐列表。
其中,所述基于内容的推荐算法模块用于:
匹配文章的特征数据与所述用户结构化模型,生成文章样品数据;其中,采用余弦相识度的公式计算所述用户结构化模型与文章的特征数据的匹配距离;
基于所述匹配距离,将文章样品数据排序、去重后生成推荐列表。
优选地,所述协同过滤算法模块包括基于用户的协同过滤算法模块和基于文章的协同过滤算法模块。
优选地,所述协同过滤算法模块用于:
依次将待推荐的文章或上一个文章算法输出的文章通过两个所述协同过滤算法,获得相应于所述用户的第一列表和第二列表;其中,第一个协同过滤算法输出的第一列表作为第二个协同过滤算法的输入,第二个协同过滤算法输出的第二列表即为推荐文章列表或最终推荐文章列表。
其中,所述基于用户的协同过滤算法模块用于:
基于所述用户结构化模型,获得各个用户之间的用户相关度系数;
根据所述用户相关度系数,生成第一文章样品数据;
过滤所述第一文章样品数据中已阅读文章数据后,加权、排序生成第一列表或第二列表。
其中,所述基于文章的协同过滤算法模块用于:
基于用户的历史浏览文章的特征数据,获取各个文章之间的文章相关度系数;
根据所述文章相关度系数,生成第二文章样品数据;
过滤所述第二文章样品数据中已阅读文章数据后,加权、排序生成第一列表或第二列表。
本发明第三实施例还提供一种文章推荐设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述计算机程序时实现如上述实施例的文章推荐方法。
本发明第四实施例还提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现上述实施例的文章推荐方法的步骤。
示例性地,本发明实施例所述的计算机程序可以被分割成一个或多个模块,所述一个或者多个模块被存储在所述存储器中,并由所述处理器执行,以完成本发明。所述一个或多个模块可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在所述实现服务器设备中的执行过程。例如,本发明第二实施例中所述的装置。
所称处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(APPlication Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述文章推荐方法的控制中心,利用各种接口和线路连接整个所述实现文章推荐方法的各个部分。
所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现文章推荐方法的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需的应用程序(比如声音播放功能、文字转换功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、文字消息数据等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘、智能存储卡(Smart Media Card,SMC)、安全数字(Secure Digital,SD)卡、闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
其中,所述实现服务设备的模块如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一个计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
需说明的是,以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外,本发明提供的装置实施例附图中,模块之间的连接关系表示它们之间具有通信连接,具体可以实现为一条或多条通信总线或信号线。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种文章推荐方法,其特征在于,包括:
根据用户的历史浏览文章,构建用户结构化模型;
根据所述用户结构化模型以及预设的至少两种推荐算法,获得对应于所述用户的至少两种文章推荐算法;
依次将待推荐的文章通过所述至少两种文章推荐算法,获得相应于所述用户的最终推荐文章列表;其中,每种文章推荐算法输出的推荐文章列表作为下一个文章推荐算法的输入,最后一个文章推荐算法输出的文章推荐列表即为所述最终推荐文章列表。
2.根据权利要求1所述的文章推荐方法,其特征在于,根据用户的历史浏览文章,构建用户结构化模型的步骤包括:
获取用户的历史浏览文章的特征数据;
基于所述特征数据,采用机器学习的分类算法构建用户结构化模型;
储存为用户构建的所述用户结构化模型。
3.根据权利要求1所述的文章推荐方法,其特征在于,所述文章推荐算法包括如下中的两个:热点新闻推荐算法、基于内容的推荐算法或协同过滤算法。
4.根据权利要求3所述的文章推荐方法,其特征在于,所述协同过滤算法包括基于用户的协同过滤算法和基于文章的协同过滤算法。
5.根据权利要求1所述的文章推荐方法,其特征在于,还包括:
获取用户对生成的最终推荐文章列表中的文章的点击阅读顺序;
获取点击阅读顺序排列在前N次的文章在各个文章推荐算法中的排列位置;
根据排列位置更新所述至少两种文章推荐算法的排列顺序。
6.一种文章推荐装置,其特征在于,包括:
建模单元,用于根据用户的历史浏览文章,构建用户结构化模型;
算法单元,用于根据所述用户结构化模型以及预设的至少两种推荐算法,获得对应于所述用户的至少两种文章推荐算法;
推荐单元,用于依次将待推荐的文章通过所述至少两种文章推荐算法,获得相应于所述用户的最终推荐文章列表;其中,每种文章推荐算法输出的推荐文章列表作为下一个文章推荐算法的输入,最后一个文章推荐算法输出的文章推荐列表即为所述最终推荐文章列表。
7.根据权利要求6所述的文章推荐装置,其特征在于,所述建模单元包括:
获取模块,用于获取用户的历史浏览文章的特征数据;
构建模块,用于基于所述特征数据,采用机器学习的分类算法构建用户结构化模型;
储存模块,用于储存为用户构建的所述用户结构化模型。
8.根据权利要求6所述的文章推荐装置,其特征在于,所述文章推荐算法包括如下中的两个:热点新闻推荐算法、基于内容的推荐算法或协同过滤算法。
9.一种文章推荐设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述计算机程序时实现如权利要求1-5任意一项所述的文章推荐方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1~5任一项所述文章推荐方法的步骤。
CN201910251329.8A 2019-03-29 2019-03-29 一种文章推荐方法、装置、设备及存储介质 Pending CN109977315A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910251329.8A CN109977315A (zh) 2019-03-29 2019-03-29 一种文章推荐方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910251329.8A CN109977315A (zh) 2019-03-29 2019-03-29 一种文章推荐方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN109977315A true CN109977315A (zh) 2019-07-05

Family

ID=67081706

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910251329.8A Pending CN109977315A (zh) 2019-03-29 2019-03-29 一种文章推荐方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN109977315A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110795657A (zh) * 2019-09-25 2020-02-14 腾讯科技(深圳)有限公司 文章推送及模型训练方法、装置、存储介质和计算机设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104424278A (zh) * 2013-08-29 2015-03-18 腾讯科技(深圳)有限公司 一种获取热点资讯的方法及装置
US20160253325A1 (en) * 2014-12-30 2016-09-01 Socialtopias, Llc Method and apparatus for programmatically adjusting the relative importance of content data as behavioral data changes
CN108228745A (zh) * 2017-12-19 2018-06-29 北京荣之联科技股份有限公司 一种基于协同过滤优化的推荐算法和装置
CN108304556A (zh) * 2018-02-06 2018-07-20 中国传媒大学 基于内容与协同过滤相结合的个性化推荐方法
CN108665323A (zh) * 2018-05-20 2018-10-16 北京工业大学 一种用于理财产品推荐***的集成方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104424278A (zh) * 2013-08-29 2015-03-18 腾讯科技(深圳)有限公司 一种获取热点资讯的方法及装置
US20160253325A1 (en) * 2014-12-30 2016-09-01 Socialtopias, Llc Method and apparatus for programmatically adjusting the relative importance of content data as behavioral data changes
CN108228745A (zh) * 2017-12-19 2018-06-29 北京荣之联科技股份有限公司 一种基于协同过滤优化的推荐算法和装置
CN108304556A (zh) * 2018-02-06 2018-07-20 中国传媒大学 基于内容与协同过滤相结合的个性化推荐方法
CN108665323A (zh) * 2018-05-20 2018-10-16 北京工业大学 一种用于理财产品推荐***的集成方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
刘皓熙: "基于多维标签与分类排序的推荐算法研究及实现", 《中国优秀硕士学位论文全文数据库信息科技辑》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110795657A (zh) * 2019-09-25 2020-02-14 腾讯科技(深圳)有限公司 文章推送及模型训练方法、装置、存储介质和计算机设备
CN110795657B (zh) * 2019-09-25 2023-10-27 腾讯科技(深圳)有限公司 文章推送及模型训练方法、装置、存储介质和计算机设备

Similar Documents

Publication Publication Date Title
CN103729359B (zh) 一种推荐搜索词的方法及***
CN109977316A (zh) 一种并行式文章推荐方法、装置、设备及存储介质
CN105224699B (zh) 一种新闻推荐方法及装置
US8781813B2 (en) Intent management tool for identifying concepts associated with a plurality of users' queries
Ben-Yitzhak et al. Beyond basic faceted search
US9934293B2 (en) Generating search results
CN103400286B (zh) 一种基于用户行为进行物品特征标注的推荐***及方法
US20090077047A1 (en) Method and apparatus for identifying and classifying query intent
CN103136683A (zh) 计算产品参考价格的方法、装置及产品搜索方法、***
CN110111167A (zh) 一种确定推荐对象的方法和装置
CN104933100A (zh) 关键词推荐方法和装置
CN102236663A (zh) 一种基于垂直搜索的查询方法、***和装置
CN102999586A (zh) 一种网站推荐的方法和装置
US20110218852A1 (en) Matching of advertising sources and keyword sets in online commerce platforms
CN107193883B (zh) 一种数据处理方法和***
Ortega et al. Artificial intelligence scientific documentation dataset for recommender systems
CN112818230B (zh) 内容推荐方法、装置、电子设备和存储介质
CN113836131A (zh) 一种大数据清洗方法、装置、计算机设备及存储介质
CN109840788A (zh) 用于分析用户行为数据的方法及装置
CN111767459A (zh) 物品推荐的方法和装置
Zhang et al. Term frequency–function of document frequency: a new term weighting scheme for enterprise information retrieval
CN109450963A (zh) 消息推送方法及终端设备
Rao et al. Product recommendation system from users reviews using sentiment analysis
CN113077321A (zh) 物品推荐方法、装置、电子设备和存储介质
Zhang et al. The approaches to contextual transaction trust computation in e‐Commerce environments

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190705