CN110598086A

CN110598086A - 文章推荐方法、装置、计算机设备及存储介质

Info

Publication number: CN110598086A
Application number: CN201810515869.8A
Authority: CN
Inventors: 刘毅; 胡澜涛; 张博; 夏锋; 林乐宇; 冯喆; 陈磊; 饶君; 刘书凯; 丘志杰; 孙振龙; 王良栋
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2018-05-25
Filing date: 2018-05-25
Publication date: 2019-12-20
Anticipated expiration: 2038-05-25
Also published as: US11763145B2; US20200364506A1; WO2019223552A1; CN110598086B

Abstract

本申请提供了一种文章推荐方法、装置、计算机设备及存储介质，该方法包括：获取历史阅读集合，历史阅读集合包括：目标用户阅读过的多篇历史文章；对每篇历史文章，依据该历史文章的内容特征及历史阅读集合中阅读时刻在该历史文章的阅读时刻之前的至少一篇待定历史文章的内容特征，分别确定每篇待定历史文章与该历史文章的注意力程度；依据多篇待定历史文章分别与至少一篇历史文章的注意力程度，从该多篇待定历史文章中，选取出触发向该目标用户推荐文章的可能性相对较低的至少一篇推荐参考文章；分别根据每篇推荐参考文章的内容特征，从可推荐文章集合中，确定待推荐的至少一篇候选推荐文章。本申请的方案可以提高向用户推荐文章的多样性。

Description

文章推荐方法、装置、计算机设备及存储介质

技术领域

本申请涉及数据处理技术领域，尤其涉及一种文章推荐方法、装置、计算机设备及存储介质。

背景技术

随着网络的不断发展，用户通过互联网中各种文章发布平台(如，即时通讯平台中的各种公众号等)所能阅读到的文章数量也日益增多。

为了吸引用户阅读文章发布平台的文章，文章发布平台会根据用户阅读过的历史文章，向用户推荐文章。但是目前为用户推荐文章时，都是根据用户阅读历史，向用户推荐内容上相似的文章。如，基于内容的推荐技术是根据用户历史阅读文章，确定与用户阅读过的文章的内容相似的文章，并将这些相似文章推荐给用户。

然而，由于为用户推荐的文章与用户历史阅读过的文章的内容大多相似，会导致文章推荐的多样性较差。

发明内容

有鉴于此，本申请提供了一种文章推荐方法、装置、计算机设备及存储介质，以提高文章推荐的多样性。

为实现上述目的，一方面，本申请提供了一种文章推荐方法，包括：

获取待分析的目标用户的历史阅读集合，所述历史阅读集合包括：所述目标用户在不同阅读时刻阅读过的多篇历史文章；

针对每篇所述历史文章，依据所述历史文章的内容特征以及所述历史阅读集合中阅读时刻在所述历史文章的阅读时刻之前的至少一篇待定历史文章的内容特征，分别确定每篇所述待定历史文章与所述历史文章的第一注意力程度，所述第一注意力程度反映在用户阅读所述待定历史文章的情况下，推荐用户阅读所述历史文章的可能性；

依据得到的多篇所述待定历史文章分别与至少一篇所述历史文章的第一注意力程度，从所述多篇待定历史文章中，选取出触发向所述目标用户推荐文章的可能性相对较低的至少一篇待定历史文章作为推荐参考文章；

分别根据每篇所述推荐参考文章的内容特征，从可推荐文章集合中，确定待推荐给所述目标用户的至少一篇候选推荐文章。

又一方面，本申请还提供了一种文章推荐装置，包括：

历史获取单元，用于获取待分析的目标用户的历史阅读集合，所述历史阅读集合包括：所述目标用户在不同阅读时刻阅读过的多篇历史文章；

第一注意分析单元，用于针对每篇所述历史文章，依据所述历史文章的内容特征以及所述历史阅读集合中阅读时刻在所述历史文章的阅读时刻之前的至少一篇待定历史文章的内容特征，分别确定每篇所述待定历史文章与所述历史文章的第一注意力程度，所述第一注意力程度反映在用户阅读所述待定历史文章的情况下，推荐用户阅读所述历史文章的可能性；

推荐参考确定单元，用于依据得到的多篇所述待定历史文章分别与至少一篇所述历史文章的第一注意力程度，从所述多篇待定历史文章中，选取出触发向所述目标用户推荐文章的可能性相对较低的至少一篇待定历史文章作为推荐参考文章；

候选推荐确定单元，用于分别根据每篇所述推荐参考文章的内容特征，从可推荐文章集合中，确定待推荐给所述目标用户的至少一篇候选推荐文章。

又一方面，本申请还提供了一种计算机设备，包括：

处理器和存储器；

其中，所述处理器用于执行所述存储器中存储的程序；

所述存储器用于存储程序，所述程序至少用于：

又一方面，本申请还提供了一种存储介质，所述存储介质中存储有计算机可执行指令，所述计算机可执行指令被处理器加载并执行时，实现如上所述的文章推荐方法。

经以上可知，在本申请实施例中，对于用户阅读过的历史文章，会分析用户在阅读该历史文章之前阅读的其他历史文章与该历史文章的注意力程度，由于两篇文章之间的注意力程度可以反映出用户阅读一篇文章的情况下，推荐用户阅读另一篇文章的可能性，因此，依据确定出的各篇文章与其他文章之间的注意力程度，可以从阅读历史集合中确定出表征向目标用户推荐文章的可能性较低的历史文章，而该历史文章的类型及内容便不属于用户经常阅读到的文章类型及文章内容，因此，以该历史文章作为推荐参考文章，向用户推荐候选推荐文章，有利于提高确定出的候选推荐文章的多样性，进而有利于提高向用户推荐文章的多样性。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1示出了本申请实施例的文章推荐方法所适用的一种***组成架构示意图；

图2示出了本申请实施例的文章推荐方法所适用的一种计算机设备的组成架构示意图；

图3示出了本申请实施例的文章推荐方法的一种流程示意图；

图4示出了本申请实施例的文章推荐方法中训练注意力模型的一种流程示意图；

图5示出了本申请实施例中基于LSTM输出文章的文章向量的示意图；

图6示出了本申请实施例中确定推荐参考文章的一种实现原理示意图；

图7示出了本申请实施例的文章推荐方法又一个实施例的流程示意图；

图8示出了本申请实施例的文章推荐方法的一种实现原理示意图；

图9示出了本申请实施例的文章推荐装置的一种组成架构示意图；

图10示出了本申请实施例的文章推荐装置的又一种组成架构示意图。

具体实施方式

本申请实施例的文章推荐方法适用于各种文章发布平台，以确定向文章发布平台中不同用户所需要推荐的文章，提高向用户推荐文章的多样性。如，新闻媒体平台针对不同用户推荐新闻文章；社交平台或者社交平台接入的公众号向用户推荐文章等。

为了便于理解，参见图1，其示出了本申请的一种文章推荐***的组成架构示意图。

由图1可知，该文章推荐***可以包括：计算机设备101以及至少一台文章发布服务器102。

其中，文章发布服务器102，用于发布可供用户阅读的多篇文章，并记录不同用户在不同时刻阅读过的文章。为了便于区分，将用户阅读过的文章称为历史文章。

该计算机设备101，用于分别基于每个用户阅读过的多篇历史文章，确定需要向该用户推荐的推荐文章。

进一步的，该计算机设备还可以将确定出的待推荐给用户的推荐文章的信息发送给文章发布服务器。

可选的，该文章推荐***还可以包括数据存储服务器103，该数据存储服务器可以存储至少一台文章发布服务器所产生的用户数据，如用户画像，以及用户的阅读历史记录等等。其中，用户画像可以包括用户的性别、年龄、学历以及所处地区等用户属性信息。阅读历史记录可以包括：用户阅读过的文章以及文章相关的来源等等信息。

相应的，计算机设备可以从数据存储服务器103获取用户的阅读历史记录，以根据用户阅读历史记录，确定需要向该用户推荐的推荐文章。

需要说明的是，计算机设备所依据的用户阅读过的历史文章可以是来源于某一个文章发布平台中的一台或多台文章发布服务器，也可以是来源于多个文章发布平台的文章发布服务器。

其中，对于某个文章发布平台而言，计算机设备可以是独立于文章发布服务器单独设置的服务器或者终端；也可以是与文章发布服务器为同一台服务器，也就是说，该计算机设备具备文章发布以及确定向用户推荐文章的功能。

为了便于理解该计算机设备，如，参见图2，其示出了本申请的计算机设备的一种组成示意图。

在图2中，该计算机设备200可以包括：处理器201、存储器202、通信接口203、输入单元204和显示器205和通信总线206。

处理器201、存储器202、通信接口203、输入单元204、显示器205、均通过通信总线206完成相互间的通信。

在本申请实施例中，该处理器201，可以为中央处理器(Central ProcessingUnit，CPU)，特定应用集成电路(application-specific integrated circuit，ASIC)，数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件等。

该处理器可以调用存储器202中存储的程序，具体的，可以处理器可以执行以下图3至图9中服务器侧所执行的操作。

存储器202中用于存放一个或者一个以上程序，程序可以包括程序代码，所述程序代码包括计算机操作指令，在本申请实施例中，该存储器中至少存储有用于实现以下功能的程序：

其中，存储器202可包括存储程序区和存储数据区，其中，存储程序区可存储操作***、以上所提到的程序，以及至少一个功能(比如声音播放功能、图像播放功能等)所需的应用程序等；存储数据区可存储根据计算机设备的使用过程中所创建的数据以及接收到的待处理数据，比如，用户阅读记录等。

此外，存储器202可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

该通信接口203可以为通信模块的接口。

本申请中该服务器还可以包括输入单元205，如，键盘等等。

该显示器204包括显示面板。在一种可能的情况中，可以采用液晶显示器(LiquidCrystal Display，LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板。

当然，图2所示的计算机设备结构并不构成对本申请实施例中计算机设备的限定，在实际应用中计算机设备可以包括比图2所示的更多或更少的部件，或者组合某些部件。

结合以上共性，对本申请实施例的一种文章推荐方法进行介绍。如，参见图3，其示出了本申请实施例一种文章推荐方法的一种流程示意图，本实施例从计算机设备侧进行介绍。该过程包括：

S301，获取待分析的目标用户的历史阅读集合。

其中，历史阅读集合包括：该目标用户在不同阅读时刻阅读过的多篇历史文章。

如，历史阅读集合包括按照阅读先后顺序排序的多篇历史文章，这样，根据该多篇历史文章的先后顺序，便可以确定该多篇历史文章对应的阅读时刻的先后顺序。

又如，该历史阅读集合可以包括多篇目标用户阅读过的多篇历史文章以及每篇历史文章对应的阅读时刻。

可以理解的是，针对不同的用户，需要结合不同用户的历史阅读集合，来确定适合推荐给该用户的文章，在本申请实施例中，为了便于描述，将当前需要确定待推荐文章的用户称为待分析的目标用户。同时，为了与推荐给用户的文章进行区分，将用户阅读过的文章称为历史文章。

S302，针对每篇历史文章，依据该历史文章的内容特征，从历史阅读集合中阅读时刻在该历史文章的阅读时刻之前的至少一篇待定历史文章。

可以理解的是，对于历史阅读集合中的任意一篇历史文章，可以认为是在该目标用户通过阅读该历史文章之前，由于阅读其他历史文章而阅读到该历史文章。而此处的其他历史文章与该历史文章之间的关系可以表征出其他历史文章与该历史文章之间的聚焦程度，即，以其他历史文章为基准，推荐用户阅读该历史文章的可能性，因此，本申请需要确定用户在阅读历史文章之前阅读的其他历史文章，并分析相应的历史文章之间的关系。

如，历史文章集合中包括文章A、文章B和文章C，且这三篇文章的顺序表征了这三篇文章被用户阅读的阅读先后顺序，由此可知，文章A和文章B是在阅读文章C之前阅读的，那么文章C有可能是由于用户阅读了文章A和文章B中的一篇或者两篇文章后，选择阅读的该文章C，因此，需要确定文章C之前阅读的文章A与文章B，并分析文章A、文章B分别与文章C的关系，以得到由文章A触发用户阅读文章C的可能性，以及由文章B触发用户阅读文章C的可能性。

其中，为了便于区分，将该历史文章之前阅读过的，用于分析与该历史文章之间关系的其他历史文章均称为待定历史文章。

在本申请实施例中，可以将该历史文章之前阅读过的每篇待定历史文章均作为待定历史文章，并执行后续分析待定历史文章与该历史文章之间关系的操作。可选的，考虑到与在该历史文章之前阅读过的文章数量较大，为了降低数据处理量，又不影响后续分析结果，可以将该历史文章之前阅读到的设定数量篇历史文章作为待定历史文章。例如，从该历史文章之前阅读的其他历史文章中，随机选取设定数量篇历史文章，以将选取出的设定篇历史文章作为待定历史文章，并执行后续操作。

进一步的，考虑到与该历史文章的阅读时刻较为接近的其他历史文章，对于用户能否阅读到该历史文章的影响性较大，因此，可以从阅读时刻处于该历史文章的阅读时刻之前，且阅读时刻与该历史文章的阅读时刻之间的时长不超过预设时长的多篇历史文章中，随机选取预设数量篇历史文章作为待定历史文章或者选取与该历史文章的阅读时刻最近的多篇历史文章作为待定历史文章。

需要说明的是，考虑到历史阅读集合中，会存在某些历史文章之前阅读的文章的数量不足预设数量，例如，历史阅读集合中阅读时刻处于第二位的历史文章之前仅仅有一篇文章，因此，在该种情况中，历史文章对应的待定历史文章的数量可以少于该预设数量。

S303，针对每篇历史文章，依据该历史文章的内容特征以及该历史文章对应的至少一篇待定历史文章的内容特征，分别确定每篇待定历史文章与该历史文章的第一注意力程度。

其中，该注意力程度也可以称为聚焦程度，反映的是阅读一篇文章的情况下，推荐用户阅读另一篇文章的可能性。同时，注意力程度也可以反映出在用户一篇文章的情况下，通过点击等方式选择阅读另一篇文章的可能性。正是由于注意力程度的以上含义，其也被称为从一篇文章到另一篇文章的注意力程度或者聚焦程度。

在本申请实施例中，注意力程度可以是一个分值、概率、等级等等，在此不加以限制。

其中，为了便于与后续其他文章之间的注意力程度进行区分，将待定历史文章与历史文章之间的注意力程度称为第一注意力程度。相应的，该第一注意力程度用于反映在用户阅读该待定历史文章的情况下，推荐用户阅读该历史文章的可能性。在该步骤S303中，需要分别确定每篇待定历史文章各自与该历史文章的第一注意力程度。

可以理解的是，对于任意文章，文章的内容特征由该文章的标题及文章的正文中的字词决定，文章的内容特征可以反映出文章类型、文章的主题思想及文章所涉及到的具体内容等等。因此，对于任意两篇文章，可以依据这两篇文章各自的内容特征，来分析从其中一篇文章到另一篇文章的注意力程度。

在一种可能的实现方式中，对于任意两篇文章，基于这两篇文章各自的内容特征，可以分析这两篇文章的内容特征的相似性，并依据内容特征的相似性，确定这两篇文章之间的注意力程度。如，将这两篇文章的内容特征的相似性，作为这两篇文章之间的注意力程度。

相应的，依据待定历史文章与历史文章的内容特征，确定待定历史文章与历史文章的相似性，确定待定历史文章与历史文章之间的注意力程度。

特别的，大部分情况需要确定一个文章集合中各篇文章M与某一篇文章N的注意力程度的情况，而且可能需要比较不同文章集合中的文章M与该篇文章M的注意力程度之间的大小关系。在该种情况下，为了便于比较各篇文章M与该篇文章N之间的注意力程度，对于每个文章集合，可以在分别确定出该文章集合中每篇文章M与该篇文章N的内容特征的相似性之后，根据该文章集合中各篇文章M各自对应的相似性，分别对该文章集合中每篇文章M与文章N的相似性进行归一化，并将每篇文章M与该文章N之间的相似性对应的归一化结果作为反映注意力程度的评价指标。

其中，按照上面的方式，对一篇文章M与文章N的内容特征的相似性进行归一化之后，归一化结果都是一个大于等于零小于1的数值，通过该数值可以反映从该文章M触发点击文章N的可能性。

在又一种可能的实现方式中，可以预先训练得到用于确定注意力程度的注意力模型。该注意力模型为利用多个用户的历史文章样本集合以及每个历史文章样本集合中每篇历史文章样本各自对应的已标注的注意力分数序列训练得到的。其中，为了便于区分，将训练注意力模型的历史文章称为历史文章样本。

其中，对于一个用户而言，该用户的历史文章样本对应的注意力分数序列包括：用户阅读该历史文章样本之前阅读的多篇历史文章样本分别与该历史文章样本的注意力分数。如，通过从文章发布平台的服务器中获取用户的历史阅读日志，得到用户阅读不同文章时，通过点击等方式选择阅读的其他文章，从而统计出从各篇文章触发阅读其他文章的概率，并将相应的概率作为注意力分数。

相应的，在该步骤S303中，可以依据历史文章的内容特征以及该历史阅读集合中阅读时刻在该历史文章的阅读时刻之前的至少一篇待定历史文章的内容特征，并利用预先训练得到的注意力模型，分别确定每篇该待定历史文章与该历史文章的注意力分数。

可选的，文章的内容特征可以通过文章的文章向量表示。相应的，为了确定某一篇或者多篇文章M到另一篇文章N的注意力分数，可以先分别确定每篇文章(如，文章M及文章N)的内容特征，确定出该文章的文章向量。然后，将各篇文章M以及文章N的文章向量输入到该注意力模型中，以分别输出每篇文章M到文章N的注意力分数。

可以理解的是，为了便于后续比较不同待定历史文章推荐出其他历史文章的可能性的大小，该注意力模型输出的各个待定历史文章与历史文章之间的注意力程度(如注意力分数)同样可以为归一化后的结果。

其中，依据历史样本集合训练注意力模型的过程可以有多种，本申请对此不加以限制。为了便于理解，以注意力模型为通过对深度神经网络进行训练得到的为例进行说明。如，参见图4，其示出了训练注意力模型的一种流程示意图。

在S401部分中，获取多个用户的历史文章样本集合以及每个历史文章样本集合中各篇历史文章样本各自对应的已标注的注意力分数序列。

如，对于某个用户的历史文章样本集合中包括用户先后阅读的文章S1，文章S2、文章S3和文章S4，其中，对于文章S4对应的已标注的注意力分数序列可以包括：该文章S4与文章S3的注意力分数，文章S4与文章S2的注意力分数、该文章S4与文章S1的注意力分数。而对于文章S3而言，其对应的已标注的注意力分数序列可以包括：文章S3与文章S2的注意力分数，文章S3与文章S1的注意力分数。对于文章S2和S1这种阅读时刻处于其阅读时刻之前的文章仅有一篇或者没有文章的情况，可以不设置注意力分数序列。

可以理解的是，历史文章样本对应的已标注的注意力分数序列中每个注意力分数为依据该注意力分数序列中各个注意力分数归一化之后的结果。

在步骤S402部分中，分别将各篇历史文章样本输入到深度神经网络中进行循环训练，并依据各篇历史文章样本各自的注意力分数序列对深度神经网络模型进行循环训练，直至深度神经网络输出的各篇历史文章对应的实际注意力分数序列分别与相应的已标注的注意力分数序列之间的准确度满足预设要求。

如，以历史样本集合G中，用户在N时刻阅读的历史文章样本S_m对应的已标注的注意力分数序列为例进行说明，历史文章样本S_m对应的已标注的注意力分数序列为该历史文章样本S_m分别与历史文章样本序列S中多篇历史文章样本之间的注意力分数，其中，历史文章样本序列S为该历史样本集合G中在N时刻之前被阅读的多篇历史文章样本所组成的序列。

相应的，历史文章样本S_m对应的已标注的注意力分数序列可以表示为：A_m ^*＝{a₁ ^*，a₂ ^*，……，a_m-1 ^*}，其中，a_j ^*表示历史文章样本S_m与历史文章样本序列S中历史文章样本S_j之间的注意力分数，j表示从1到m-1的自然数，m-1表示历史文章样本序列S中历史样本的总个数。

将该历史文章样本S_N及其对应的已标注的注意力分数序列A_m ^*输入到该深度神经网络模型中，可以该深度神经网络模型可以输出该历史文章样本S_m对应的实际注意力分数序列A_m，该实际注意力分数序列A_m包括该深度神经网络模型输出的该历史文章样本S_m分别与历史文章样本序列S中各篇历史文章样本的注意力分数。

这样，通过比较已标注的注意力分数序列A_m ^*与实际注意力分数序列A_m的差距，可以分析该深度神经网络模型的准确度是否符合要求。具体的，可以依据预设的损失函数，以及多个历史文章样本分别对应的已标注的注意力分数序列和实际注意力分数序列，并采用梯度下降法来进行优化，直至迭代收敛。如，可以定义如下的损失函数(即公式一)：

其中，m取值不同的是，A_m ^*，A_m分别表示不同历史文章样本对应的已标注的注意力分数，与实际注意力分数，n为训练用的历史文章样本的总个数。

相应的，假设优化目标为minL(A，A^*)，则可以使用梯度下降的方法对该优化目标进行优化，直至最终迭代收敛，则训练结束。训练出的深度神经网络模型可以作为注意力模型。

其中，训练得到的注意力模型同样是根据不同文章的内容特征，来计算文章之间的相似度，并基于相似度，确定文章的注意力程度。

举例说明，以需要确定一个文章序列(集合)D＝{d₁，d₂，……d_i……d_t-2，d_t-1}中任一篇文章d_i分别与文章d_t的注意力程度为例进行说明。其中，d_i表示文章序列D中任意一篇文章，i为从1到t-1的自然数，t-1为文章序列D中文章的总数量。为了确定文章序列D中任意一篇文章d_i与文章d_t之间的注意力程度，注意力模型中该文章序列D中文章d_i与文章d_t的注意力分数的函数关系可以表示为如下公式二：

其中，

其中，为文章d_i的文章向量，为文章d_t的文章向量。W，U，b均为注意力模型中设定的参数，这些参数的参数值在训练过程中确定。F表示一种设定的函数关系，该函数关系同样可以在训练过程中确定。

如，

其中，e_i求取的是文章d_i与文章d_t之间文章向量的相似性，而通过公式二进行归一化之后，可以得到文章d_i与文章d_t的注意力分数。

其中，对于任意一篇文章，基于文章的内容特征确定该文章的文章向量的方式也可以有多种。可选的，可以是将该文章中的内容进行分词，并将该文章分词出的多个词语输入到预先训练得到的文章向量模型中，以通过文章向量模型输出该文章的文章向量。

如，以文章向量模型为长短期记忆网络(Long Short-Term Memory，LSTM)为例进行说明。为了确定文章d的文章向量，首先，将文章的内容进行分词，假设文章d分词出N个词，则文章可以表示为d＝{w₁,w₂……w_N}，其中，w_i表示文章d中分词出的第i个分词，i为从1到N的自然数。然后，将这N个分词依次输入到该LSTM网络模型中，从而可以通过该LSTM网络模型最终输出该文章d的文章向量。

为了便于理解，可以参见图5，其示出了LSTM网络模型将文章的LSTM将文章的多个分词转换为文章的文章向量的一种示意图。

由该图5可以看出，LSTM网络模型中的输入为文章分词出的各个分词，最终输出为文章的文章向量为h_t。

S304，依据得到的多篇该待定历史文章分别与至少一篇历史文章的注意力程度，从该多篇待定历史文章中，选取出触发向该目标用户推荐文章的可能性相对较低的至少一篇待定历史文章作为推荐参考文章。

可以理解的是，在目标用户的历史阅读集合中，如果目标用户阅读某篇历史文章的情况下，触发向目标用户推荐其他文章或者说触发目标用户点击阅读其他文章的可能性较低，则说明在当前时刻之前，基于该篇历史文章向目标用户推荐文章的概率较低。而由于该篇历史文章存在于历史阅读集合中，所以该篇历史文章的内容或者其他相关信息是用户感兴趣的，但是却很少获取到相关信息的文章。在该种情况下，如果后续基于该篇历史文章向该目标用户推荐文章，必然有利于扩展用户所阅读到的文章，增加文章推荐的多样性。

举例说明，假设目标用户的历史阅读集合中，存在属于时尚类、文艺类、新闻资讯类、科学类等类型的文章，而对于属于同一类型或者内容相似的两篇或者多篇文章而言，通过前面步骤，确定出属于同一类型的两篇或多篇文章之间的注意力程度会相对较高。因此，如果确定某篇待定历史文章与多个历史文章之间的注意力程度相对较高，则说明该篇待定历史文章触发推荐文章的可能性高，而且历史阅读集合中与该待定历史文章的类型或者内容相似的文章也相对较多；反之，如果某篇待定历史文章与其他文章之间的注意力程度较低，则说明目标用户阅读过该篇待定历史文章相关类型或者内容的文章较少，因此，可以以该篇待定历史文章为推荐参考文章，以便增加向该目标用户推荐文章的多样性。

可以理解的是，由于每篇历史文章均对应的一个或者多个待定历史文章，因此，在该步骤S303中可以得到多篇待定历史文章。同时，一篇历史文章可能会作为一篇或者多篇其他历史文章的待定历史文章，相应的，一篇待定历史文章可能会分别确定出与多篇历史文章的注意力程度，这样，针对每篇待定历史文章，可以得到该待定历史文章与至少一篇历史文章的注意力程度。因此，针对每篇待定历史文章，综合该待定历史文章与对应的各篇历史文章之间的注意力程度，可以得到基于待定历史文章向目标用户推荐文章的可能性。

如，对于文章4，可能会分别将文章3、文章2和文章1作为待定历史文章，并分别确定文章3、文章2以及文章1与文章4之间的注意力程度，同时，对于文章3也可能会将文章2和文章1作为待定历史文章，并分别确定出文章2和文章1与文章3的注意力程度。相应的。对于文章3，仅仅确定出文章3与文章4之间的注意力程度，而该注意力程度可以用于反映基于文章3触发向用户推荐文章的可能性。而对于文章2，则依据文章2与文章4之间的注意力程度，以及文章2与文章3的注意力程度，来综合确定基于该文章2，触发向用户推荐文章的可能性。

其中，对于任意一篇待定历史文章，确定基于该待定历史文章向用户推荐文章的可能性的方式可以有多种。

如，在一种实现方式中，针对每篇所述待定历史文章，根据该待定历史文章分别与至少一篇历史文章(该待定历史文章对应的至少一篇历史文章)的注意力程度，确定该待定历史文章与该至少一篇历史文章的平均注意力程度。相应的，该平均注意力程度可以反映基于该待定历史文章，向用户推荐文章的可能性，其中，该平均注意力程度越低，则触发向用户推荐文章的可能性也越低。

进一步的，可以从多篇该历史文章对应的多篇待定历史文章中，选取出平均注意力程度较低的至少一篇待定历史文章作为推荐参考文章，以便后续基于该推荐参考文章，确定需要向该目标用户推荐的文章。如，选取平均注意力程度最低的待定历史文章作为推荐参考文章。

为了便于理解，以基于待定历史文章的平均注意力程度，从多篇待定历史文章中选取推荐参考文章为例，对本申请从历史文章集合中确定出推荐参考文章的过程进行举例说明。如，参见图6，其示出了确定推荐参考文章的一种实现原理示意图。

在图6中以目标用户的历史阅读集合中包括文章d1、文章d2、文章d3、文章d4、文章d5和文章d6为例。在图6中以每篇文章选取在该历史文章之前阅读的三篇文章作为待定历史文章为例，同时，为了便于描述，选取与文章的阅读时刻相对较近的三篇文章作为待定历史文章。

如，图6中“待定历史文章选取”部分中，文章d6对应的待定历史文章包括：文章d5、文章d4和文章d3。文章d5对应的待定历史文章包括：文章d4、文章d3和文章d2。文章d4对应的待定历史文章包括：文章d3、文章d2和文章d1。由于在文章d3和文章d2之前被阅读的文章都不足三篇，因此，文章d3对应的待定历史文章只有文章d2和文章d2；相应的，文章d2对应的待定历史文章为文章d1，而文章d1之前不存在其他被阅读的文章，所以针对文章d1不需要分析其对应的待定历史文章。

相应的，针对每篇历史文章，需要分别计算该历史文章与该历史文章对应的至少一篇待定历史文章之间的注意力分数，从而该历史文章对应的注意力序列。参见图6中从上到下第一个箭头指向的部分图像，在图6中该部分，通过连线“-”连接两篇文章的标识来表示出两篇文章之间的注意力分数。如图6中所示，对于文章d6，需要计算文章d6与文章d5之间的注意力分数，在图6中其表示为d6-d5，注意力分数为0.6；相应的，文章d6与文章d4之间的注意力分数d6-d4为0.1；文章d6与文章d3之间的注意力分数为d6-d3为0.3。对于其他文章d5、d4、d3、d2也类似，具体可以参见图6中“注意力分数序列”部分。

结合图6中从上到下的第二个箭头指向的部分图像中示出的了待定历史文章与历史文章之间的对应关系，由此可以看出，每篇文章可能会作为多篇其他文章的待定历史文章。在该部分中示出了作为待定历史文章的每篇文章所对应的多篇历史文章，及该待定历史文章与各篇历史文章之间的注意力分数。如，文章d5仅仅是文章d6对应的待定历史文章，而该文章d5与文章d6的注意力分数d6-d5可以从文章d6对应的注意力分数序列中查出，即文章d5与文章d6的注意力分数d6-d5为0.6。相应的，文章d5对应的平均注意力分数为0.6。

又如，文章d4作为文章d6以及文章d5的待定历史文章，其中，文章d4与文章d6的注意力分数d6-d4为0.1；而文章d4与文章d5的注意力分数d5-d4为0.4，由此可知，该待定历史文章d4对应的平均注意力分数为0.25。

与此类似，由图6可以看出，得到作为待定历史文章的文章d3对应的平均注意力分数为0.4；作为待定历史文章的文章d2对应的平均注意力0.33；作为待定历史文章的文章d1对应的平均注意力分数为0.56。

可见，对于所有的待定历史文章，文章d4对应的平均注意力分数最低，则将文章d4确定为推荐参考文章，以便后续以文章d4为依据，确定需要推荐给目标用户的候选推荐文章。

在另一种实现方式，可以默认每篇待定历史文章对应着预设数量篇历史文章，如果某篇待定历史文章对应的历史文章的数量不足该预设数量，而预设数量与根据待定历史文章对应的历史文章的数量之间的差值，补充该差值个默认注意力程度(如，注意力分数)。然后，分别计算待定历史文章与预设数量篇历史文章之间的注意力程度的加和，并将加和后的注意力程度作为反映该待定历史文章具备触发推荐文章的可能性的依据。

举例说明，仍以图6为例，假设需要确定出每篇待定历史文章与3篇历史文章之间的注意力分数，并假设默认注意力分数为0.5。在该图6中文章d5仅仅是文章d6对应的待定历史文章，因此，文章d5对应的历史文章的数量不足预设数量，即3篇。在该种情况下，文章d5对应的注意力程度的加和可以为文章d5与文章d6的注意力分数与两个默认注意力分数加和，具体为：0.6+0.5+0.5等于1.6。而文章b3对应的历史文章有三篇，即为文章b6、文章b5和文章b4，在该种情况下，可以直接将文章b3分别与这两篇历史文章的注意力分数加和即可，即文章b3对应的加和后的注意力分数为：0.3+0.5+0.4＝1.2。由此可以看出，由文章b3触发推荐文章的可能性，小于由文章b5触发推荐文章的可能性。

S305，分别根据每篇该推荐参考文章的内容特征，从可推荐文章集合中，确定待推荐给该目标用户的至少一篇候选推荐文章。

其中，可推荐文章集合中包括能够推荐给该目标用户的多篇文章，如针对一个文章发布平台，该可推荐文章集合可以为文章发布平台所能发布的所有文章的集合；又如，该可推荐文章集合也可以是文章发布平台中所有用户阅读过的文章所构成的集合，当然，还可能有其他可能情况，在此不加以限制。

其中，针对每篇推荐参考文章，基于该推荐参考文章，确定待推荐给该目标用户的候选推荐文章的具体方式可以有多种。如，在一种可能的实现方式中，可以依据推荐参考文章的内容特征，并结合文章协同推荐算法、基于内容的推荐算法或者基于序列的推荐算法等，从该可推荐文章集合中，确定出至少一篇候选推荐文章。

可选的，为了使得确定出的候选推荐文章能够与该待推荐参考文章的类型或者内容的相关程度更高，还可以基于注意力的推荐策略，确定候选推荐文章。其中，基于注意力的推荐策略为：针对每篇推荐参考文章，可以依据该推荐参考文章的内容特征以及可推荐文章集合中每篇文章的内容特征，分别确定该推荐参考文章与该可推荐文章集合中每篇文章的注意力程度。相应的，可以从该可推荐文章集合中，选取出与该推荐参考文章的注意力程度较高的至少一篇候选推荐文章。

其中，确定推荐参考文章与可推荐文章集合中各篇文章的注意力程度的方式可以参考前面确定注意力程度的相关介绍，如，可以将可推荐文章集合的各篇文章的文章向量，以及该推荐参考文章的文章向量输入到预先训练出的注意力模型中，以输出该推荐参考文章与该可推荐文章集合中各篇文章之间的注意力程度(如，注意力分数)所构成的注意力分数序列。当然，前面描述的通过其他方式确定注意力程度的方式也同样适用于此处，在此不再赘述。

可见，在本申请实施例中，对于用户阅读过的历史文章，会分析用户在阅读该历史文章之前阅读的其他历史文章与该历史文章的注意力程度，由于两篇文章之间的注意力程度可以反映出用户阅读一篇文章的情况下，推荐用户阅读另一篇文章的可能性，因此，依据确定出的各篇文章与其他文章之间的注意力程度，可以从阅读历史集合中确定出表征向目标用户推荐文章的可能性较低的历史文章，而该历史文章的类型及内容便不属于用户经常阅读到的文章类型及文章内容，因此，以该历史文章作为推荐参考文章，向用户推荐候选推荐文章，有利于提高确定出的候选推荐文章的多样性，进而有利于提高向用户推荐文章的多样性。

可以理解的是，基于推荐参考文章，确定出候选推荐文章之后，可以直接将候选推荐文章作为需要推荐给该目标用户的文章。然而，确定出的考虑到候选推荐文章的数量有可能会相对较大；而且，在实际应用中，可能会配置多种推荐策略，并分别依据不同的推荐策略，确定与该推荐参考文章匹配的多篇候选推荐文章，也会使得确定出的候选推荐文章的数量较大，如果将这些大量的候选推荐文章都推荐给用户，很难实现精准向用户推荐用户感兴趣的文章，从而影响到推荐效果。

可选的，在依据可推荐文章集合中各文章与推荐参考文章之间的注意力程度，基于内容推荐算法，协同推荐算法等方式中的一种或者多种，确定出至少一个候选推荐文章之后，还可以针对每篇候选推荐文章，分别计算历史阅读集合中每篇历史文章与该候选推荐文章的注意力程度，得到所述候选推荐文章与该历史阅读集合中多篇历史文章之间的注意力程度序列。然后，分别计算每篇候选推荐文章对应的注意力程度序列的信息熵，得到每篇候选推荐文章各自对应的信息熵。相应的，可以从该至少一篇候选推荐文章中，选取出信息熵较小的至少一篇候选推荐文章作为待推荐给该目标用户的至少一篇目标推荐文章。

可以理解的是，历史阅读集合中每篇历史文章与该候选推荐文章的注意力程度可以反映出，由各篇历史文章触发阅读该候选推荐文章的可能性；而，该候选推荐文章与该历史阅读集合中各篇历史文章之间的注意力程度序列对应的信息熵可以衡量该历史阅读集合中各篇历史文章触发阅读到该候选推荐文章的稳定性或者说可靠性。可见，通过选取对应的信息熵较小的候选推荐文章作为待推荐的目标推荐文章，有利于在增加向用户推荐文章多样性的前提下，最大程度的保证向用户推荐用户感兴趣的文章，以实现基于用户进行个性化推荐。

进一步的，确定出至少一篇目标推荐文章之后，还可以确定这至少一篇目标推荐文章的排序，以便后续文章发布平台按照该排序输出该至少一篇目标推荐文章。

如，参见图7，其示出了本申请实施例一种文章推荐方法的又一种流程示意图，本实施例的方法从计算机设备侧描述，该方法可以包括：

S701，获取待分析的目标用户的历史阅读集合。

其中，该历史阅读集合包括：目标用户在不同阅读时刻阅读过的多篇历史文章。

S702，针对每篇历史文章，依据该历史文章的内容特征，确定该历史文章的文章向量，并依据该历史阅读集合中阅读时刻在该历史文章的阅读时刻之前的至少一篇待定历史文章各自的内容特征，分别确定每篇待定历史文章的文章向量。

S703，针对每篇历史文章，将该历史文章对应的至少一篇待定历史文章的文章向量以及该历史文章的内容向量输入到预先训练出的注意力模型中，以通过该注意力模型输出注意力分数序列。

其中，该注意力分数序列包括该至少一篇待定历史文章分别与该历史文章之间的注意力分数。待定历史文章与该历史文章的注意力分数可以反映在用户阅读所述待定历史文章的情况下，推荐用户阅读该历史文章的可能性。

S704，针对每篇该待定历史文章，根据该待定历史文章分别到至少一篇历史文章的注意力分数，确定该待定历史文章到至少一篇历史文章的平均注意力分数。

S705，从多篇该历史文章对应的多篇待定历史文章中，选取出平均注意力分数较低的至少一篇待定历史文章作为推荐参考文章。

以上步骤S701到S705可以参见前面的相关介绍，在此不再赘述。其中，步骤S704和S705仅仅是基于待定历史文章与相应的历史文章之间的注意力分数，确定推荐参考文章的一种实现方式，对于前面实施例提到的其他方式，也同样适用于本实施例，在此不再赘述。

可以理解的是，以上步骤S701到S705实际上是基于注意力模型的选取策略，即，基于注意力模型，从目标用户的阅读历史集合中选取推荐参考文章。但是可以理解的是，在实际应用中，基于注意力模型，来选取推荐参考文章可以仅仅是选取待推荐文章的一种选取策略，因此，在计算机设备中除了配置基于注意力模型的选取策略之后，还可以同时配置其他一种或多种选取策略，如基于用户画像的选取策略，即，基于目标用户的用户画像，从该阅读历史集合中选取出一篇或多篇历史文章作为推荐参考文章。相应的，计算机设备可以分别通过配置的多种选取策略，分别选取出的推荐参考文章，并执行后续的操作。

如，参见图8，本申请中文章推荐方法的一种实现原理示意图。由图8可以看出，用于选取推荐参考文章的推荐策略可以有多种。相应的，依据目标用户阅读的阅读历史集合以及用户的目标用户的用户画像，并分别采用多种不同的推荐策略，从阅读历史集合中确定推荐参考文章，这样，基于每种推荐策略可以均可以选取出一篇推荐参考文章。

S706，针对每篇推荐参考文章，依据该推荐参考文章的内容特征以及可推荐文章集合中每篇文章的内容特征，分别确定可推荐文章集合中每篇文章与推荐参考文章的第二注意力程度。

其中，可推荐文章集合中任意一篇文章与推荐参考文章之间第二注意力程度表征用户在阅读推荐参考文章的情况下，推荐用户阅读该可推荐文章集合中该文章的可能性。

S707，从该推荐文章集合中，选取出与该荐参考文章的第二注意力程度较高的至少一篇候选推荐文章。

可以理解的是，文章与推荐参考文章的注意力程度越高，则说明文章与该推荐参考文章的类型及内容的关联性越高，则该文章属于用户阅读过的但是又不经常阅读过的文章类型，将该文章选取为候选推荐文章，则既能贴合用户的阅读需求，又有可能增加用户阅读的文章的多样性。

在以上步骤S706至S707中实际上是基于注意力的推荐策略，来确定候选推荐文章为例进行说明，但是可以理解的通过其他的推荐策略，来确定候选推荐文章的方式也同样适用于本实施例。

可以理解的是，在实际应用中，基于推荐参考文章，确定候选推荐文章时，可以仅仅设置一种推荐策略，如上面提到的基于注意力的推荐策略。在实际应用中，可能会设置多种推荐策略，如，设置基于注意力的推荐策略的同时，还会设置基于内容的推荐策略，以及基于协同的推荐策略等等。如图8，推荐策略也可以配置有多种。相应的，计算机设备可以分别以各篇推荐参考文章为基准，并分别多种推荐策略，从可推荐文章集合中确定出相应的至少一篇候选推荐文章；或者是，综合多种推荐策略，来确定出至少一篇候选推荐文章。如图8所示，依据多种推荐策略以及确定出的推荐参考文章，可以从推荐文章集合中选取候选推荐文章，以便执行后续的初选操作。

S708，针对每篇候选推荐文章，分别计算该历史阅读集合中每篇历史文章与该候选推荐文章的第三注意力程度，得到候选推荐文章与该历史阅读集合中多篇历史文章之间的注意力程度序列。

其中，该注意力程度序列中包括候选推荐文章分别与该历史阅读集合中多篇历史文章的第三注意力程度。

S709，分别计算每篇候选推荐文章对应的注意力程度序列的信息熵，得到每篇候选推荐文章各自对应的信息熵。

其中，该注意力程度序列对应的信息熵可以反映出该候选推荐文章与历史阅读集合中各篇历史文章之间注意力程度的分布情况。候选推荐文章对应的注意力程度序列的信息熵越小，则说明根据用户阅读的历史阅读集合，确定出用户对该候选推荐文章的感兴趣程度越高。

其中，计算注意力程度序列的信息熵的方式可以有多种，本申请对此不加以限制。

为了便于理解，以一种计算信息熵的方式进行介绍。如，假设候选推荐文章与历史文章集合的注意力程度序列为一个注意力分数序列，其表示为A_t＝{a₁,a₂……a_t}，则该注意力分数序列对应的信息熵H(A)可以通过如下公式计算得到：

其中，公式四中的a_i为注意力分数序列A_t中的注意力分数。

S710，从该至少一篇候选推荐文章中，选取出信息熵较小的至少一篇候选推荐文章作为待推荐给该目标用户的至少一篇目标推荐文章。

通过选取对应的信息熵较小的候选推荐文章作为目标推荐文章，可以使得筛选出的目标推荐文章在满足多样性的前提下，更符合用户的兴趣。

可以理解的是，以上步骤S708到S710是基于注意力模型，从候选推荐文章中，确定最终筛选推荐的目标推荐文章的方式，即，基于注意力模型的初选策略。但是可以理解的是，通过其他初选策略，从多篇候选推荐文章中最终筛选出至少一篇目标推荐文章也同样适用于本实施例。如，初选策略可以为基于用户画像，来从多篇候选推荐文章中选取与用户画像最为匹配的至少一篇目标推荐文章。

在实际应用中，还可以在基于注意力模型的初选策略的基础上，综合其他初选策略，以最终从候选推荐文章中筛选出至少一篇目标推荐文章。如图8所示，计算机设备中可以配置多种初选策略。相应的，计算机设备可以分别基于该多种初选策略，从候选推荐文章中确定出至少一篇目标推荐文章；或者是，结合多种初选策略，来综合确定出至少一篇候选推荐文章。

S711，针对任意一篇参考推荐文章，确定该至少一篇目标推荐文章分别与参考推荐文章的第四注意力程度。

其中，第四注意力程度反映用户在阅读该参考推荐文章的情况下，推荐用户阅读该目标推荐文章的可能性。

S712，依据该至少一篇目标推荐文章分别与参考推荐文章之间的第四注意力程度，确定该至少一篇目标推荐文章的推荐顺序。

如，目标推荐文章对应的第四注意力程度越高，该目标推荐文章的排序越靠前。特别的，当存在多篇参考推荐文章的情况下，可以依据目标推荐文章分别与各篇参考推荐文章的第四注意力程度，来确定该目标推荐文章的第四注意力程度的综合值，并根据各个目标推荐文章的该综合值，来确定推荐顺序。

其中，目标推荐文章对应的第四注意力程度越高，则在用户阅读该参考推荐文章的情况下，选择阅读该目标推荐文章的可能性越大，因此，对应的第四注意力程度较高的目标推荐文章的排在较为靠前的顺序上，越有利于用户点击该目标推荐文章。

可以理解的是，计算机设备确定出该至少一篇目标推荐文章的推荐顺序之后，可以将该至少一篇目标推荐文章的标识以及推荐顺序发送给文章发布服务器。相应的，在目标用户访问文章发布服务器，如，登录文章发布服务器阅读文章等，则该文章发布服务器可以依据该推荐顺序，向该目标用户展现该至少一篇目标推荐文章，以使得目标用户可以看到更为广泛类型且较为符合自身兴趣的文章。

可以理解的是，第二注意力程度，第三注意力程度、第四注意力程度仅仅是为了便于区分不同文章之间的注意力程度，但是其求取过程都可以参见前面介绍的用于确定文章之间的注意力程度的方式，如，利用预先训练得到的注意力模型来确定以上的第二注意力程度、第三注意力程度及第四注意力程度，具体可以参见前面实施例的相关介绍，在此不再赘述。

另一方面，本申请还提供了一种文章推荐装置。如，参见图10，其示出了本申请一种文章推荐装置一个实施例的组成结构示意图，本实施例的装置可以应用于前面所述的计算机设备，该装置可以包括：

历史获取单元901，用于获取待分析的目标用户的历史阅读集合，所述历史阅读集合包括：所述目标用户在不同阅读时刻阅读过的多篇历史文章；

第一注意分析单元902，用于针对每篇所述历史文章，依据所述历史文章的内容特征以及所述历史阅读集合中阅读时刻在所述历史文章的阅读时刻之前的至少一篇待定历史文章的内容特征，分别确定每篇所述待定历史文章与所述历史文章的第一注意力程度，所述第一注意力程度反映在用户阅读所述待定历史文章的情况下，推荐用户阅读所述历史文章的可能性；

推荐参考确定单元903，用于依据得到的多篇所述待定历史文章分别与至少一篇所述历史文章的第一注意力程度，从所述多篇待定历史文章中，选取出触发向所述目标用户推荐文章的可能性相对较低的至少一篇待定历史文章作为推荐参考文章；

候选推荐确定单元904，用于分别根据每篇所述推荐参考文章的内容特征，从可推荐文章集合中，确定待推荐给所述目标用户的至少一篇候选推荐文章。

可选的，所述第一注意分析单元可以包括：

第一注意分析子单元，用于依据所述历史文章的内容特征以及所述历史阅读集合中阅读时刻在所述历史文章的阅读时刻之前的至少一篇待定历史文章的内容特征，并利用预先训练得到的注意力模型，分别确定每篇所述待定历史文章与所述历史文章的注意力分数；

其中，所述注意力模型为利用多个用户的历史文章样本集合以及每个所述历史文章样本集合中每篇历史文章样本各自对应的已标注的注意力分数序列训练的到的，其中，历史文章样本的注意力分数序列包括：用户阅读该历史文章样本之前阅读的多篇历史文章样本分别与该历史文章样本的注意力分数。

可选的，所述第一注意力分析子单元可以包括：

第一向量确定子单元，用于依据所述历史文章的内容特征，确定所述历史文章的文章向量；

第二向量确定子单元，用于依据所述历史阅读集合中阅读时刻在所述历史文章的阅读时刻之前的至少一篇待定历史文章各自的内容特征，分别确定每篇待定历史文章的文章向量；

注意分数分析子单元，用于根据所述历史文章的文章向量以及所述至少一篇待定历史文章各自的文章向量，并利用所述注意力模型，分别确定每篇待定历史文章与所述历史文章的注意力分数。

在一种可能的实现方式中，所述推荐参考确定单元，包括：

平均注意分析子单元，用于针对每篇所述待定历史文章，根据所述待定历史文章分别与至少一篇历史文章的第一注意力程度，确定所述待定历史文章到所述至少一篇历史文章的平均注意力程度；

参考筛选子单元，用于从多篇所述历史文章对应的多篇待定历史文章中，选取出平均注意力程度较低的至少一篇待定历史文章作为推荐参考文章。

在一种可能的实现方式中，所述候选推荐确定单元，包括：

第二注意分析单元，用于针对每篇推荐参考文章，依据所述推荐参考文章的内容特征以及可推荐文章集合中每篇文章的内容特征，分别确定所述可推荐文章集合中每篇文章与所述推荐参考文章的第二注意力程度，所述第二注意力程度反映用户在阅读所述推荐参考文章的情况下，推荐用户阅读所述可推荐文章集合中文章的可能性；

候选推荐选取单元，用于从所述可推荐文章集合中，选取出与所述推荐参考文章的第二注意力程度较高的至少一篇候选推荐文章。

如，参见图10，其示出了本申请的文章推荐装置的又一种组成结构示意图，本实施例的文章推荐装置与前面图9所示装置的不同之处在于：

该装置除了包括，历史获取单元901，第一注意分析单元902，推荐参考确定单元903和候选推荐确定单元904之外，还包括：

第三注意分析单元905，用于在所述候选推荐确定单元确定出至少一篇候选推荐文章之后，针对每篇候选推荐文章，分别计算所述历史阅读集合中每篇历史文章与所述候选推荐文章的第三注意力程度，得到所述候选推荐文章与所述历史阅读集合中多篇历史文章之间的注意力程度序列，所述第三注意力程度反映用户在阅读所述历史阅读集合中的历史文章的情况下，推荐用户阅读所述候选推荐文章的可能性；

信息熵计算单元906，用于分别计算每篇候选推荐文章对应的注意力程度序列的信息熵，得到每篇候选推荐文章各自对应的信息熵；

目标推荐确定单元907，用于从所述至少一篇候选推荐文章中，选取出信息熵较小的至少一篇候选推荐文章作为待推荐给所述目标用户的至少一篇目标推荐文章。

可选的，该装置还可以包括：

第四注意分析单元908，用于分别确定所述参考推荐文章与至少一篇目标推荐文章的第四注意力程度，所述第四注意力程度反映用户在阅读所述参考推荐文章的情况下，推荐用户阅读所述目标推荐文章的可能性；

排序确定单元909，用于依据所述参考推荐文章分别与所述至少一篇目标推荐文章的第四注意力程度，确定所述至少一篇目标推荐文章的推荐顺序。

其中，历史获取单元901，第一注意分析单元902，推荐参考确定单元903和候选推荐确定单元904具体可以参见前面实施例的相关介绍，在此不在赘述。

另一方面，本申请还提供了一种存储介质，所述存储介质中存储有计算机可执行指令，所述计算机可执行指令被处理器加载并执行时，实现如上任一项所述的文章推荐方法。

需要说明的是，本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。

对所公开的实施例的上述说明，使本领域技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其它实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

以上仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种文章推荐方法，其特征在于，包括：

2.根据权利要求1所述的文章推荐方法，其特征在于，所述分别确定每篇所述待定历史文章与所述历史文章的第一注意力程度，包括：

依据所述历史文章的内容特征以及所述历史阅读集合中阅读时刻在所述历史文章的阅读时刻之前的至少一篇待定历史文章的内容特征，并利用预先训练得到的注意力模型，分别确定每篇所述待定历史文章与所述历史文章的注意力分数；

其中，所述注意力模型为利用多个用户的历史文章样本集合以及每个所述历史文章样本集合中每篇历史文章样本各自对应的已标注的注意力分数序列训练得到的，其中，历史文章样本的注意力分数序列包括：用户阅读该历史文章样本之前阅读的多篇历史文章样本分别与该历史文章样本的注意力分数。

3.根据权利要求2所述的文章推荐方法，其特征在于，所述利用预先训练得到的注意力模型，分别确定每篇所述待定历史文章与所述历史文章的注意力分数，包括：

依据所述历史文章的内容特征，确定所述历史文章的文章向量；

依据所述历史阅读集合中阅读时刻在所述历史文章的阅读时刻之前的至少一篇待定历史文章各自的内容特征，分别确定每篇待定历史文章的文章向量；

根据所述历史文章的文章向量以及所述至少一篇待定历史文章各自的文章向量，并利用所述注意力模型，分别确定每篇待定历史文章与所述历史文章的注意力分数。

4.根据权利要求1至3任一项所述的文章推荐方法，其特征在于，所述依据得到的多篇所述待定历史文章分别与至少一篇所述历史文章的第一注意力程度，从所述多篇待定历史文章中，选取出触发向所述目标用户推荐文章的可能性相对较低的至少一篇待定历史文章作为推荐参考文章，包括：

针对每篇所述待定历史文章，根据所述待定历史文章分别与至少一篇历史文章的第一注意力程度，确定所述待定历史文章到所述至少一篇历史文章的平均注意力程度；

从多篇所述历史文章对应的多篇待定历史文章中，选取出平均注意力程度较低的至少一篇待定历史文章作为推荐参考文章。

5.根据权利要求1所述的文章推荐方法，其特征在于，所述分别根据每篇所述推荐参考文章的内容特征，从可推荐文章集合中，确定待推荐给所述目标用户的至少一篇候选推荐文章，包括：

针对每篇推荐参考文章，依据所述推荐参考文章的内容特征以及可推荐文章集合中每篇文章的内容特征，分别确定所述可推荐文章集合中每篇文章与所述推荐参考文章的第二注意力程度，所述第二注意力程度反映用户在阅读所述推荐参考文章的情况下，推荐用户阅读所述可推荐文章集合中文章的可能性；

从所述可推荐文章集合中，选取出与所述推荐参考文章的第二注意力程度较高的至少一篇候选推荐文章。

6.根据权利要求1或5所述的文章推荐方法，其特征在于，确定出至少一篇候选推荐文章之后，还包括：

针对每篇候选推荐文章，分别计算所述历史阅读集合中每篇历史文章与所述候选推荐文章的第三注意力程度，得到所述候选推荐文章与所述历史阅读集合中多篇历史文章之间的注意力程度序列，所述第三注意力程度反映用户在阅读所述历史阅读集合中的历史文章的情况下，推荐用户阅读所述候选推荐文章的可能性；

分别计算每篇候选推荐文章对应的注意力程度序列的信息熵，得到每篇候选推荐文章各自对应的信息熵；

从所述至少一篇候选推荐文章中，选取出信息熵较小的至少一篇候选推荐文章作为待推荐给所述目标用户的至少一篇目标推荐文章。

7.根据权利要求6所述的文章推荐方法，其特征在于，还包括：

分别确定所述参考推荐文章与至少一篇目标推荐文章的第四注意力程度，所述第四注意力程度反映用户在阅读所述参考推荐文章的情况下，推荐用户阅读所述目标推荐文章的可能性；

依据所述参考推荐文章分别与所述至少一篇目标推荐文章的第四注意力程度，确定所述至少一篇目标推荐文章的推荐顺序。

8.一种文章推荐装置，其特征在于，包括：

9.根据权利要求8所述的文章推荐装置，其特征在于，所述第一注意分析单元，包括：

10.根据权利要求8或9所述的文章推荐装置，其特征在于，所述推荐参考确定单元，包括：

11.根据权利要求8所述的文章推荐装置，其特征在于，所述候选推荐确定单元，包括：

12.根据权利要求8或11所述的文章推荐装置，其特征在于，还包括：

第三注意分析单元，用于在所述候选推荐确定单元确定出至少一篇候选推荐文章之后，针对每篇候选推荐文章，分别计算所述历史阅读集合中每篇历史文章与所述候选推荐文章的第三注意力程度，得到所述候选推荐文章与所述历史阅读集合中多篇历史文章之间的注意力程度序列，所述第三注意力程度反映用户在阅读所述历史阅读集合中的历史文章的情况下，推荐用户阅读所述候选推荐文章的可能性；

信息熵计算单元，用于分别计算每篇候选推荐文章对应的注意力程度序列的信息熵，得到每篇候选推荐文章各自对应的信息熵；

目标推荐确定单元，用于从所述至少一篇候选推荐文章中，选取出信息熵较小的至少一篇候选推荐文章作为待推荐给所述目标用户的至少一篇目标推荐文章。

13.根据权利要求12所述的文章推荐装置，其特征在于，还包括：

第四注意分析单元，用于分别确定所述参考推荐文章与至少一篇目标推荐文章的第四注意力程度，所述第四注意力程度反映用户在阅读所述参考推荐文章的情况下，推荐用户阅读所述目标推荐文章的可能性；

排序确定单元，用于依据所述参考推荐文章分别与所述至少一篇目标推荐文章的第四注意力程度，确定所述至少一篇目标推荐文章的推荐顺序。

14.一种计算机设备，其特征在于，包括：

处理器和存储器；

其中，所述处理器用于执行所述存储器中存储的程序；

所述存储器用于存储程序，所述程序至少用于：

15.一种存储介质，其特征在于，所述存储介质中存储有计算机可执行指令，所述计算机可执行指令被处理器加载并执行时，实现如上权利要求1至8任一项所述的文章推荐方法。