CN111914159B

CN111914159B - 一种信息推荐方法及终端

Info

Publication number: CN111914159B
Application number: CN201910389789.7A
Authority: CN
Inventors: 李建新; 上官晨寰; 石国忠; 吴信红; 林童; 吴宏; 刘宇戈
Original assignee: China Merchants Securities Co ltd
Current assignee: China Merchants Securities Co ltd
Priority date: 2019-05-10
Filing date: 2019-05-10
Publication date: 2024-03-12
Anticipated expiration: 2039-05-10
Also published as: CN111914159A

Abstract

本发明适用于计算机技术领域，提供了一种信息推荐方法及终端，该方法包括：当获取到用户浏览的资讯信息时，对所述资讯信息进行打标签处理，得到目标资讯信息；通过预设的卷积神经网络模型提取所述标签类型的文本特征；通过预设的协同过滤模型对所述文本特征以及目标历史行为数据进行评分，得到评分结果；根据所述评分结果确定待推荐的目标资讯信息，并将所述目标资讯信息推荐给所述用户。本发明实施例，通过预设的卷积神经网络模型和预设的协同过滤模型对文本特征以及用户历史行为数据进行处理，根据处理结果向用户推荐资讯信息，使得用户能够快速获取到感兴趣、有价值且有针对性的资讯信息。

Description

一种信息推荐方法及终端

技术领域

本发明属于计算机技术领域，尤其涉及一种信息推荐方法及终端。

背景技术

随着互联网的快速发展，在这个大数据时代，用户每天都会接触到海量的资讯信息，与此同时，提供高精确度与个性化的信息推荐越来越重要。资讯信息是指用户因为及时地获得它并利用它，而能够在相对短的时间内给自己带来价值的信息。

然而传统的资讯信息推荐***基于时间线向所有用户推荐并展示同类资讯信息(即传统的资讯推荐***根据时间周期更新资讯信息)。由于资讯信息更新周期长，且推荐的信息对于所有用户都是相同的，导致用户无法快速获取到感兴趣、有价值且有针对性的资讯信息。

发明内容

有鉴于此，本发明实施例提供了一种信息推荐方法及终端，以解决现有技术中，传统的资讯信息推荐***基于时间线向所有用户推荐并展示同类资讯信息，由于资讯信息更新周期长，且推荐的信息对于所有用户都是相同的，导致用户无法快速获取到感兴趣、有价值且有针对性的资讯信息的问题。

本发明实施例的第一方面提供了一种信息推荐方法，包括：

当获取到用户浏览的资讯信息时，对所述资讯信息进行打标签处理，得到目标资讯信息；所述目标资讯信息包括用于标识所述资讯信息所属类别的标签类型；

通过预设的卷积神经网络模型提取所述标签类型的文本特征；

通过预设的协同过滤模型对所述文本特征以及目标历史行为数据进行评分，得到评分结果；所述目标历史行为数据为所述用户的历史行为数据中与所述文本特征关联的历史行为数据；所述评分结果用于表示所述用户对与所述标签类型对应的资讯信息的兴趣度；

根据所述评分结果确定待推荐的目标资讯信息，并将所述目标资讯信息推荐给所述用户。

本发明实施例的第二方面提供了一种终端，该终端包括：

处理单元，用于当获取到用户浏览的资讯信息时，对所述资讯信息进行打标签处理，得到目标资讯信息；所述目标资讯信息包括用于标识所述资讯信息所属类别的标签类型；

提取单元，用于通过预设的卷积神经网络模型提取所述标签类型的文本特征；

评分单元，用于通过预设的协同过滤模型对所述文本特征以及目标历史行为数据进行评分，得到评分结果；所述目标历史行为数据为所述用户的历史行为数据中与所述文本特征关联的历史行为数据；所述评分结果用于表示所述用户对与所述标签类型对应的资讯信息的兴趣度；

推荐单元，用于根据所述评分结果确定待推荐的目标资讯信息，并将所述目标资讯信息推荐给所述用户。

本发明实施例的第三方面提供了另一种终端，包括处理器、输入设备、输出设备和存储器，所述处理器、输入设备、输出设备和存储器相互连接，其中，所述存储器用于存储支持终端执行上述方法的计算机程序，所述计算机程序包括程序指令，所述处理器被配置用于调用所述程序指令，执行以下步骤：

本发明实施例的第四方面提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现以下步骤：

本发明实施例，当获取到用户浏览的资讯信息时，对所述资讯信息进行打标签处理，得到目标资讯信息；所述目标资讯信息包括用于标识所述资讯信息所属类别的标签类型；通过预设的卷积神经网络模型提取所述标签类型的文本特征；通过预设的协同过滤模型对所述文本特征以及目标历史行为数据进行评分，得到评分结果；所述目标历史行为数据为所述用户的历史行为数据中与所述文本特征关联的历史行为数据；所述评分结果用于表示所述用户对与所述标签类型对应的资讯信息的兴趣度；根据所述评分结果确定待推荐的目标资讯信息，并将所述目标资讯信息推荐给所述用户。本发明实施例，通过预设的卷积神经网络模型提取标签类型的文本特征，通过预设的协同过滤模型对文本特征以及用户历史行为数据进行处理，根据处理得到的评分结果确定目标推荐信息并推荐给用户。由于通过预设的神经网络模型以及预设的协同过滤模型处理文本特征以及用户历史行为数据，提高了处理数据的速度，进一步提升了信息推荐的速率；且针对每个用户推荐不同的资讯信息，使得用户能够快速获取到感兴趣、有价值、有针对性的资讯信息。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本发明一实施例提供的一种信息推荐方法的实现流程图；

图2是本发明另一实施例提供的一种信息推荐方法的实现流程图；

图3是本发明一实施例提供的一种终端的示意图；

图4是本发明另一实施例提供的一种终端的示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

请参见图1，图1是本发明实施例提供的一种信息推荐方法的示意流程图。本实施例中信息推荐方法的执行主体为终端，终端包括但不限于智能手机、平板电脑、个人数字助理(Personal Digital Assistant，PDA)等移动终端，还可以包括台式电脑等终端。如图1所示的信息推荐方法可包括：

S101：当获取到用户浏览的资讯信息时，对所述资讯信息进行打标签处理，得到目标资讯信息；所述目标资讯信息包括用于标识所述资讯信息所属类别的标签类型。

资讯信息是指用户因为及时地获得它并利用它，而能够在相对短的时间内给自己带来价值的信息。资讯信息可以是一段文字、一篇文章、一句话等，对资讯信息的内容、形式、数据量、格式等不做限定。打标签处理指为资讯信息进行标签标注；标签用于标识所述资讯信息所属的类别。

终端在获取到用户浏览的资讯信息时，对所述资讯信息进行打标签处理，得到目标资讯信息。具体地，用户浏览的资讯信息可以是用户上传至终端的资讯信息，也可以是终端在检测到用户浏览资讯信息时，自动获取得到的资讯信息。对所述资讯信息进行打标签处理的方式可以是，通过预设的标签标注模型对所述资讯信息进行打标签处理；其中，所述标签标注模型是通过使用机器学习算法对资讯信息样本集进行训练得到；对所述资讯信息进行打标签处理的方式也可以是，通过文本分类器对所述资讯信息进行标签标注；还可以通过人工标记的方式为所述资讯信息进行打标签处理。

对所述资讯信息进行打标签处理之后，得到的资讯信息为目标资讯信息；所述目标资讯信息包括标签类型，所述标签类型用于标识所述资讯信息所属的类别。在一个目标资讯信息中，标签类型的数量可以是一个或者多个，对此不做限定。

进一步地，S101具体可以包括：通过预设的标签标注模型对所述资讯信息进行打标签处理，得到目标资讯信息；其中，所述标签标注模型是通过使用机器学习算法对资讯信息样本集进行训练得到。

预设的标签标注模型是通过使用机器学习算法对资讯信息样本集进行训练得到。资讯信息样本集可以为多个已经打上标签的资讯信息，标签的数量可以为一个或者多个，对此不做限定。可知，资讯信息样本集中的资讯信息越多时，训练得到的模型准确度越高。具体地，使用文本分类器对所述资讯信息样本集进行自动标签标注训练，生成标签标注模型。

将获取到的用户浏览的资讯信息输入至训练好的标签标注模型中，标签标注模型对所述资讯信息进行打标签处理，得到标注好的目标资讯信息。输出的目标资讯信息可以为：

资讯1，标签1，标签2，标签3……

资讯2，标签4，标签5，标签6……

资讯3，标签7，标签8，标签9……

上述目标资讯信息仅为示例性说明，不同目标资讯信息中标签内容可以相同也可以不同，目标资讯信息中标签的数量可以为一个或者多个，此处不做限定。

S102：通过预设的卷积神经网络模型提取所述标签类型的文本特征。

预设的卷积神经网络模型是通过使用机器学习算法对标签类型样本集进行训练得到，在训练过程中，所述卷积神经网络模型的输入为包含标签类型的资讯信息，所述卷积神经网络模型的输出为提取的所述标签类型的文本特征。其中，标签类型样本集可以由包含标签类型的资讯信息组成，也可以直接由标签类型组成。

通过预设的卷积神经网络模型提取所述标签类型的文本特征。具体地，所述卷积神经网络模型将所述标签类型转换为与所述标签类型对应的向量矩阵；通过卷积神经网络模型提取所述向量矩阵的特征向量；进一步地，通过卷积神经网络模型在所述特征向量中提取具有代表性的特征，即文本特征。

进一步地，为了使提取的文本特征更准确，具有更多的上下文特征，加快提取文本特征的处理速度，S102可以包括：S1021-S1023，具体如下：

S1021：将所述标签类型输入所述卷积神经网络模型进行处理，得到所述标签类型对应的向量矩阵。

卷积神经网络模型可以包括输入层(嵌入层)、卷积层、池化层以及输出层。输入层包括一个输入层节点，用于接收输入的标签类型，将所述标签类型转换成与所述标签类型对应的向量矩阵。经过转换后每个标签类型都有一个与之对应的向量矩阵；当标签类型为多个时，就转换得到多个向量矩阵；卷积神经网络模型通过输入层将转换得到的向量矩阵传递至卷积层。

S1022：提取所述向量矩阵的特征向量。

卷积神经网络模型中的卷积层对向量矩阵进行处理，提取向量矩阵的局部特征，即特征向量。当向量矩阵为一个时，卷积层对所述向量矩阵整个区域进行卷积得到特征向量；当向量矩阵为多个时，按照向量矩阵输入卷积层的顺序，先对输入的第一个向量矩阵进行卷积得倒一个特征向量，然后在这个特征向量上生成候选区域，在所述候选区域的基础上与下一个向量矩阵进行卷积，得到新的特征向量。继续以该方式对向量矩阵进行卷积，直至对所有的向量矩阵卷积完成，将最终输出的特征向量传递至池化层。

S1023：提取所述特征向量的所述文本特征。

卷积神经网络模型中的池化层对所述特征向量进行处理，在所述特征向量中进一步提取更具有代表性的特征，得到文本特征。池化层包括一个最大值池化层节点，用于提取特征向量中的最大值。具体地，池化层对所述特征向量进行归一化处理，筛选出特征向量的最大值，得到文本特征。

进一步地，为了使提取的文本特征更准确，加快提取文本特征的处理速度，池化层可通过池化操作构建固定长度的特征向量，即将卷积层得到的特征向量处理为固定长度的特征向量。具体地，可以利用降采样(采样点数减少)的方式从每个特征向量中提取最大特征值，将特征向量处理为固定长度的特征向量，提取所述特征向量中的文本特征。

S103：通过预设的协同过滤模型对所述文本特征以及目标历史行为数据进行评分，得到评分结果；所述目标历史行为数据为所述用户的历史行为数据中与所述文本特征关联的历史行为数据；所述评分结果用于表示所述用户对与所述标签类型对应的资讯信息的兴趣度。

预设的协同过滤模型是通过使用机器学习算法对训练样本集进行训练得到。其中，训练样本集包括多组文本特征以及与每组文本特征关联的历史行为数据。在训练过程中，协同过滤模型的输入为文本特征以及与文本特征关联的历史行为数据，协同过滤模型的输出为对文本特征以及历史行为数据进行评分得到的评分结果。

历史行为数据是指用户在预设时间内对所述资讯信息进行操作产生的数据；预设时间由用户根据实际情况进行设置，如预设时间可以为48小时、24小时、12小时、1小时、30分钟等，对此不做限定。所述历史行为数据为离线数据，当用户对资讯信息进行操作时，产生的数据会生成日志文件，获取并存储的预设时间内的日志文件(即离线数据)。

用户对资讯信息具体的操作行为可以是，浏览、收藏、点赞、标记不喜欢、不再出现、分享、评论、下载、转发、搜索、浏览次数、浏览时长、加入喜欢列表、移除喜欢列表、切换资讯信息等。进一步地，为了方便后续通过协同过滤模型计算评分，可以为用户历史行为数据中的各个行为设置相应的权重，方便后续协同过滤模型对所述权重以及文本特征进行评分。

目标历史行为数据是指用户的历史行为数据中与文本特征关联的历史行为数据。具体地，每个用户都有一个用户标识信息，如用户ID，为每个资讯信息设置资讯信息标识，所述资讯信息标识用于标识具体是哪一个资讯信息，且所述资讯信息标识与用户ID相关联。所述日志文件可以包括用户ID以及与所述用户ID关联的资讯信息标识、资讯信息具体内容、用户历史行为数据等。

对用户浏览的资讯信息进行处理得到的文本特征中可以包括资讯信息标识，根据所述资讯信息标识在日志文件中查找与所述资讯信息标识关联的用户ID，根据所述用户ID查找所述用户对资讯信息进行的操作产生的历史行为数据。例如，当某个资讯信息标识为A，处理该资讯信息得到文本特征，在日志中查找目标历史行为数据，就是查找用户对资讯信息标识为A的资讯信息进行操作产生的数据。

进一步地，为了提高推荐资讯信息的准确度，加快处理速度，可以筛选用户的历史行为数据，将筛选后的历史行为数据与文本特征关联。例如用户对资讯信息进行的行为相似的操作，可以只保留其中一个。

通过预设的协同过滤模型对所述文本特征以及目标历史行为数据进行评分，得到评分结果。具体地，将获取到的目标历史行为数据转换为与所述目标历史行为数据对应的向量；通过协同过滤模型为文本特征以及所述向量构建评分矩阵；根据评分矩阵确定评分结果。其中，评分结果用于表示所述用户对与所述标签类型对应的资讯信息的兴趣度，评分结果可以包括评分数值及其关联的标签类型，还可以包括用户ID等。

进一步地，为了准确的分析用户的历史行为数据，提高信息推荐的准确性，S103可以包括：S1031-S1033，具体如下：

S1031：获取所述目标历史行为数据，将所述目标历史行为数据转换为与所述目标历史行为数据对应的向量。

终端获取目标历史行为数据，具体地，文本特征中可以包括资讯信息标识，终端根据所述资讯信息标识在日志文件中查找与所述资讯信息标识关联的用户ID，根据所述用户ID查找所述用户对资讯信息进行的操作产生的历史行为数据；也可以是用户将与文本特征关联的目标历史行为数据上传至终端，终端根据所述文本特征查找与所述文本特征关联的目标历史行为数据。

协同过滤模型可以包括输入层、处理层以及输出层。输入层包括一个输入层节点，用于接收输入的文本特征以及目标历史行为数据。将目标历史行为数据输入协同过滤模型之后，协同过滤模型将所述目标历史行为数据转换为与所述目标历史行为数据对应的向量，并将所述向量以及所述文本特征传递至处理层。

S1032：基于所述文本特征以及所述向量构建评分矩阵。

随机梯度下降算法是一种无模型优化算法，适用于控制变量较多，受控***比较复杂，无法建立准确数学模型的训练；隐向量是指不可观测的随机变量构成的向量。

基于所述文本特征以及所述向量构建评分矩阵，是指通过协同过滤模型构建隐向量矩阵。具体地，通过随机梯度下降算法训练隐向量矩阵，隐向量矩阵可以包括用户隐向量矩阵以及资讯隐向量矩阵，用户隐向量矩阵基于随机梯度下降算法以及文本特征计算得到，资讯隐向量矩阵基于随机梯度下降算法以及目标历史行为数据对应的向量计算得到。

S1033：基于所述评分矩阵确定评分结果。

协同过滤模型中的处理层层将用户隐向量矩阵以及资讯隐向量矩阵中的数据进行点乘，得到预测的评分结果。评分结果用于表示用户对与评分结果中的标签类型对应的资讯信息的兴趣度，评分结果可以包括评分数值及其关联的标签类型，还可以包括用户ID等。评分结果可以包括一个或多个评分数值以及每个评分数值关联的标签类型。

例如，评分结果为用户1--股票证券--90；用户1--娱乐新闻--60；用户1--基金--80等；其中数值90、60、80为评分数值，反应了用户对这个标签类型对应的资讯信息感兴趣的程度。用户可根据实际情况调整、设置分值规则，如总分值为100、总分值为10、总分值为1000等；分值越大表示用户兴趣度越高、分值越小表示用户兴趣度越低，或者分值越大表示用户兴趣度越低、分值越小表示用户兴趣度越高；当分值相同时选择顺序靠前的标签类型对应的资讯信息，或者对于分值相同的标签类型对应的资讯信息都进行推荐等，对此不做限定。

S104：根据所述评分结果确定待推荐的目标资讯信息，并将所述目标资讯信息推荐给所述用户。

目标资讯信息是指需要推荐给用户的资讯信息，根据评分结果确定。具体地，可将评分结果根据评分数值的高低，从低到高或者从高到低进行排序，获取评分数值最高的评分结果，并获取该评分结果中的标签类型以及用户ID，根据该评分结果中的标签类型确定待推荐的目标资讯信息，根据用户ID将目标资讯信息推荐给用户。

进一步地，评分结果中还可包括与评分结果中的标签类型对应的资讯信息。当获取到评分数值最大的评分结果时，提取该评分结果中的资讯信息作为目标资讯信息，并根据评分结果中的用户ID将所述目标资讯信息推荐给用户。

进一步地，当评分结果包括评分数值及其关联的标签类型时，S104可以包括：S1041-S1042，具体如下：

S1041：基于所述评分结果中的所述评分数值及其关联的标签类型，将与最高的评分数值关联的标签类型识别为目标标签类型。

根据用户预设的排序方法基于评分结果中的评分数值对评分结果进行排序。排序方法由用户预先设置，可以设置为评分数值从低到高排列，也可设置为评分数值从高到低排列等，对此不做限定。

当用户预设的排序方法为评分数值从高到低排列时，获取第一个评分数值(即最高的评分数值)关联的标签类型，将这个标签类型识别标记为目标标签类型。

S1042：查找与所述目标标签类型对应的目标资讯信息，并将所述目标资讯信息推荐给所述用户。

根据目标标签类型在本地数据库或者服务器中查找与所述目标标签类型对应的目标资讯信息。具体的，本地数据库中以及服务器中存储了多个标签类型以及与每个标签类型对应的资讯信息，终端可以根据目标标签类型在本地数据中以及服务器中查找与所述目标便签类型对应的目标资讯信息；也可以根据所述目标标签类型在网络中搜索与所述目标标签类型对应的目标资讯信息，当搜索到目标资讯信息时，获取所述目标资讯信息的具体内容并将其推荐给用户。

进一步地，当搜索到目标资讯信息时，也可以获取所述目标资讯信息的标识、链接或者地址等，并将所述标识、链接或者地址等信息推荐给用户。用户可根据资讯信息标识查看资讯信息，或者通过点击链接查看资讯信息，也可以根据目标资讯信息的地址查找目标资讯信息。

请参见图2，图2是本发明另一实施例提供的一种信息推荐方法的示意流程图。本实施例中信息推荐方法的执行主体为终端，终端包括但不限于智能手机、平板电脑、个人数字助理等移动终端，还可以包括台式电脑等终端。

本实施例与图1对应的实施例的区别为在S204之后还可包括S205-S206，本实施例中S201-S204与上一实施例中的S101-S104完全相同，具体请参阅上一实施例中S101-S104的相关描述，此处不赘述。

进一步地，为了向用户实时推荐更准确的资讯信息，在S204之后还可包括S205-S206，具体如下：

S205：获取与所述文本特征关联的所述用户的实时行为数据。

实时行为数据与历史行为数据不同，历史行为数据为离线数据，而实时行为数据为用户实时反馈的行为数据，可以理解为当用户对资讯信息进行任何行为操作时，便将产生的数据反馈至终端，此时终端接收到的数据为实时行为数据。其中，文本特征中可以包括资讯信息标识，用户进行操作的资讯信息也包括资讯信息标识，根据资讯信息标识将文本特征以及资讯信息关联，当用户对所述资讯信息进行操作时，将用户操作产生的实时行为数据与文本特征关联。

终端可以在预设时间内获取与所述文本特征关联的用户的实时行为数据。对于实时行为数据一般预设时间设置比较短，如2分钟、3分钟、5分钟等，用户可根据实际情况进行调整，对此不做限定。

S206：将所述评分结果以及所述实时行为数据输入所述卷积神经网络模型进行数据迭代处理，并根据数据迭代处理结果更新所述评分结果。

卷积神经网络模型中可以包括实时流推荐模块，实时流推荐模块用于处理上述协同过滤模型输出的评分结果以及实时行为数据，并根据处理结果更新评分结果，基于更新后的评分结果推荐目标资讯信息。

具体地，将协同过滤模型输出的评分结果以及获取到的实时行为数据输入至卷积神经网络模型中的实时流推荐模块中，实时流推荐模块对评分结果以及实时行为数据进行数据迭代处理，得到数据迭代处理结果。迭代是指重复反馈过程的活动，每一次对过程的重复成为一次迭代，每一次迭代的结果作为下一次迭代的初始值。通过数据迭代处理实时更新评分结果，由于不用每次都对用户的所有行为数据进行计算分析，可以大大的减少工作量，提升信息推荐的效率以及准确度。

当通过实时流推荐模块对评分结果以及实时行为数据进行数据迭代处理，得到数据迭代处理结果后，根据该处理结果更新评分结果。根据更新后的评分结果查找对应的目标资讯信息，并向用户推荐目标资讯信息。

进一步地，为了保证数据的实时性，提升信息推荐的准确性与效率，在通过协同过滤模型处理历史行为数据以及实时流推荐模块处理实时行为数据时，可以利用滑动窗口丢弃一部分历史数据，如丢弃时间过于久远的用户行为数据，保留最新的实时数据信息用于计算。其中，滑动窗口是一种流量控制技术，用于控制数据流量。

进一步地，为了提高信息推荐的速率和准确性，还可以利用分群算法对用户、资讯信息、历史行为数据等进行分类，例如，根据用户的年龄、性别、职业、活跃度、学历、爱好、收入等对用户浏览的资讯信息进行分类，终端每次处理同一种类型的数据。由于每次处理的都是同一类型的数据，会使卷积神经网络模型以及协通过滤模型处理数据的准确率越来越高，从而使得信息推荐越来越准确。其中，分群算法是一种分割式分群方法，用于在大量数据中查找出具有代表性的数据。

通常我们会认为用户在某一段时间内对资讯信息进行的行为操作，产生的行为数据与该资讯信息有关，这个时间段可以由用户自行设定，一般时间比较短。用户对资讯信息进行的任一行为操作产生的数据，都需要卷积神经网络模型和协同过滤模型进行处理，如果数据是比较久远的，对于推荐资讯信息的意义不大，却需要终端耗费大量时间去处理。这时在通过卷积神经网络模型和协同过滤模型，处理历史行为数据以及实时行为数据时，可以利用剪枝算法丢弃一部分历史行为数据，提高信息推荐的速率和准确性。其中，剪枝算法是通过自定义的判断规则，避免一些不必要的遍历过程。

请参见图3，图3是本发明一实施例提供的一种终端的示意图。终端包括的各单元用于执行图1、图2对应的实施例中的各步骤。具体请参阅图1、图2各自对应的实施例中的相关描述。为了便于说明，仅示出了与本实施例相关的部分。参见图3，终端3包括：

处理单元310，用于当获取到用户浏览的资讯信息时，对所述资讯信息进行打标签处理，得到目标资讯信息；所述目标资讯信息包括用于标识所述资讯信息所属类别的标签类型；

提取单元320，用于通过预设的卷积神经网络模型提取所述标签类型的文本特征；

评分单元330，用于通过预设的协同过滤模型对所述文本特征以及目标历史行为数据进行评分，得到评分结果；所述目标历史行为数据为所述用户的历史行为数据中与所述文本特征关联的历史行为数据；所述评分结果用于表示所述用户对与所述标签类型对应的资讯信息的兴趣度；

推荐单元340，用于根据所述评分结果确定待推荐的目标资讯信息，并将所述目标资讯信息推荐给所述用户。

进一步地，提取单元320具体用于：

将所述标签类型输入所述卷积神经网络模型进行处理，得到所述标签类型对应的向量矩阵；

提取所述向量矩阵的特征向量；

提取所述特征向量的所述文本特征。

进一步地，评分单元330具体用于：

获取所述目标历史行为数据，将所述目标历史行为数据转换为与所述目标历史行为数据对应的向量；

基于所述文本特征以及所述向量构建评分矩阵；

基于所述评分矩阵确定评分结果。

进一步地，所述评分结果包括评分数值及其关联的标签类型，推荐单元340具体用于：

基于所述评分结果中的所述评分数值及其关联的标签类型，将与最高的评分数值关联的标签类型识别为目标标签类型；

查找与所述目标标签类型对应的目标资讯信息，并将所述目标资讯信息推荐给所述用户。

进一步地，终端还包括：

获取单元，用于获取与所述文本特征关联的所述用户的实时行为数据；

更新单元，用于将所述评分结果以及所述实时行为数据输入所述卷积神经网络模型进行数据迭代处理，并根据数据迭代处理结果更新所述评分结果。

进一步地，处理单元310具体用于：

通过预设的标签标注模型对所述资讯信息进行打标签处理，得到目标资讯信息；其中，所述标签标注模型是通过使用机器学习算法对资讯信息样本集进行训练得到。

请参见图4，图4是本发明另一实施例提供的一种终端的示意图。如图4所示，该实施例的终端4包括：处理器40、存储器41以及存储在所述存储器41中并可在所述处理器40上运行的计算机程序42。所述处理器40执行所述计算机程序42时实现上述各个终端的信息推荐方法实施例中的步骤，例如图1所示的S101至S104。或者，所述处理器40执行所述计算机程序42时实现上述各装置实施例中各单元的功能，例如图4所示单元310至340功能。

示例性的，所述计算机程序42可以被分割成一个或多个单元，所述一个或者多个单元被存储在所述存储器41中，并由所述处理器40执行，以完成本发明。所述一个或多个单元可以是能够完成特定功能的一系列计算机程序指令段，该指令段用于描述所述计算机程序42在所述终端4中的执行过程。例如，所述计算机程序42可以被分割成处理单元、提取单元、评分单元以及推荐单元，各单元具体功能如上所述。

所述终端可包括，但不仅限于，处理器40、存储器41。本领域技术人员可以理解，图4仅仅是终端4的示例，并不构成对终端4的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件，例如所述终端还可以包括输入输出终端、网络接入终端、总线等。

所称处理器40可以是中央处理单元(Central Processing Unit，CPU)，还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

所述存储器41可以是所述终端4的内部存储单元，例如终端4的硬盘或内存。所述存储器41也可以是所述终端4的外部存储终端，例如所述终端4上配备的插接式硬盘，智能存储卡(Smart Media Card，SMC)，安全数字(Secure Digital，SD)卡，闪存卡(Flash Card)等。进一步地，所述存储器41还可以既包括所述终端4的内部存储单元也包括外部存储终端。所述存储器41用于存储所述计算机程序以及所述终端所需的其他程序和数据。所述存储器41还可以用于暂时地存储已经输出或者将要输出的数据。

以上所述实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围，均应包含在本发明的保护范围之内。

Claims

1.一种信息推荐方法，其特征在于，包括：

通过预设的协同过滤模型对所述文本特征以及目标历史行为数据进行评分，得到评分结果；所述目标历史行为数据为所述用户的历史行为数据中与所述文本特征关联的历史行为数据；所述评分结果用于表示所述用户对与所述标签类型对应的资讯信息的兴趣度；所述历史行为数据是指所述用户在预设时间内对所述资讯信息进行操作产生的数据；所述用户在预设时间内对所述资讯信息进行操作至少包括浏览次数和/或浏览时长；

所述评分结果包括评分数值及其关联的标签类型、用户ID；所述用户ID为用户标识信息，每个所述用户都有一个所述用户标识信息；

根据所述评分结果确定待推荐的目标资讯信息，并将所述目标资讯信息推荐给所述用户；所述目标资讯信息是指需要推荐给所述用户的资讯信息，所述目标资讯信息是根据所述评分结果确定的；

所述根据所述评分结果确定待推荐的目标资讯信息，并将所述目标资讯信息推荐给所述用户包括：

将所述评分结果根据评分数值的高低，从低到高或者从高到低进行排序，获取所述评分数值最高的评分结果，并获取所述评分数值最高的评分结果中的标签类型以及所述用户ID，根据所述评分数值最高的评分结果中的标签类型确定待推荐的所述目标资讯信息，根据所述用户ID将所述目标资讯信息推荐给所述用户。

2.如权利要求1所述的信息推荐方法，其特征在于，所述通过预设的卷积神经网络模型提取所述标签类型的文本特征，包括：

提取所述向量矩阵的特征向量；

提取所述特征向量的所述文本特征。

3.如权利要求1所述的信息推荐方法，其特征在于，所述通过预设的协同过滤模型对所述文本特征以及目标历史行为数据进行评分，得到评分结果，包括：

基于所述文本特征以及所述向量构建评分矩阵；

基于所述评分矩阵确定评分结果。

4.如权利要求1所述的信息推荐方法，其特征在于，所述评分结果包括评分数值及其关联的标签类型，所述根据所述评分结果确定待推荐的目标资讯信息，并将所述目标资讯信息推荐给所述用户，包括：

5.如权利要求1至4任一项所述的信息推荐方法，其特征在于，所述通过预设的协同过滤模型对所述文本特征以及目标历史行为数据进行评分，得到评分结果之后，还包括：

获取与所述文本特征关联的所述用户的实时行为数据；

将所述评分结果以及所述实时行为数据输入所述卷积神经网络模型进行数据迭代处理，并根据数据迭代处理结果更新所述评分结果。

6.如权利要求1所述的信息推荐方法，其特征在于，所述当获取到用户浏览的资讯信息时，对所述资讯信息进行打标签处理，得到目标资讯信息，包括：

7.一种终端，其特征在于，包括：

评分单元，用于通过预设的协同过滤模型对所述文本特征以及目标历史行为数据进行评分，得到评分结果；所述目标历史行为数据为所述用户的历史行为数据中与所述文本特征关联的历史行为数据；所述评分结果用于表示所述用户对与所述标签类型对应的资讯信息的兴趣度；所述历史行为数据是指所述用户在预设时间内对所述资讯信息进行操作产生的数据；所述用户在预设时间内对所述资讯信息进行操作至少包括浏览次数和/或浏览时长；

推荐单元，用于根据所述评分结果确定待推荐的目标资讯信息，并将所述目标资讯信息推荐给所述用户；

所述目标资讯信息是指需要推荐给所述用户的资讯信息，所述目标资讯信息是根据所述评分结果确定的；

8.如权利要求7所述的终端，其特征在于，所述提取单元具体用于：

提取所述向量矩阵的特征向量；

提取所述特征向量的所述文本特征。

9.一种终端，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述方法的步骤。

10.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至6任一项所述方法的步骤。