WO2019105432A1

WO2019105432A1 - 文本推荐方法、装置及电子设备

Info

Publication number: WO2019105432A1
Application number: PCT/CN2018/118274
Authority: WO
Inventors: 李冰锋; 范欣; 冯晓强; 李彪
Original assignee: 腾讯科技（深圳）有限公司
Priority date: 2017-11-29
Filing date: 2018-11-29
Publication date: 2019-06-06
Also published as: US20200242304A1; CN109840321A; CN109840321B; US11182564B2

Abstract

一种文本推荐方法、装置和电子设备。方法包括：对目标文本进行预处理，得到目标文本的特征内容（201）；采用至少两种文本分析模型对特征内容进行处理，得到至少两种语义向量（202）；对目标文本的至少两种语义向量进行整合，生成目标文本的整合语义向量（203）；根据目标文本的整合语义向量和至少一个待推荐文本的整合语义向量，从至少一个待推荐文本中选取目标文本对应的推荐文本（204）。由于目标文本的整合语义向量是基于至少两种文本分析模型得到，该整合语义向量融合了各个语义向量的优势，因此该整合语义向量的表征能力更强，后续进行文本推荐时，推荐文本与目标文本之间的关联程度能得到提高，进而提高推荐的准确性。

Description

文本推荐方法、装置及电子设备

本申请要求于2017年11月29日提交的申请号为201711225593.1、发明名称为“文本推荐方法、装置及电子设备”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请实施例涉及文本分析技术领域，特别涉及一种文本推荐方法、装置及电子设备。

背景技术

文本分析技术是指将从文本中提取的特征词进行量化以表示文本信息的技术。目前，文本分析技术主要应用于文本推荐领域，也即基于用户所浏览的文本内容向用户推荐用户可能感兴趣的其它内容。

相关技术提供的文本推荐方法通常基于协同过滤算法。协同过滤算法可以是基于用户和/或内容的协同过滤算法。以基于用户的协同过滤算法为例，首先基于各个用户的行为数据确定相似用户集合，相似用户集合中包括至少两个用户，后续进行文本推荐时，将相似用户集合中的其中一个用户所浏览的文本推荐给上述相似用户集合中的其他用户。例如，相似用户集合包括用户A与用户B，则将用户A所浏览的文本推荐给用户B。

相关技术中，向用户推荐的文本与用户想浏览或者浏览过的文本之间的关联程度较小，推荐的准确性较低。

发明内容

本申请实施例提供了一种文本推荐方法、装置及电子设备，用以解决相关技术中向用户推荐的文本与用户想浏览或者浏览过的文本之间的关联程度较小，推荐的准确性较低的问题。所述技术方案如下：

一方面，提供了一种文本推荐方法，所述方法包括：

对目标文本进行预处理，得到所述目标文本的特征内容；

基于至少两种文本分析模型对所述特征内容进行处理，得到所述目标文本的至少两种语义向量；对所述目标文本的至少两种语义向量进行整合，生成所述目标文本的整合语义向量；

根据所述目标文本的整合语义向量和至少一个待推荐文本的整合语义向量，从所述至少一个待推荐文本中选取所述目标文本对应的推荐文本。

一方面，提供了一种文本推荐装置，其特征在于，所述装置包括：

预处理模块，用于对目标文本进行预处理，得到所述目标文本的特征内容；

文本分析模块，用于基于至少两种文本分析模型对所述特征内容进行处理，得到所述目标文本的至少两种语义向量；

向量获取模块，用于根据所述至少两种语义向量获取所述目标文本的整合语义向量；

文本推荐模块，用于根据所述目标文本的整合语义向量和至少一个待推荐文本的整合语义向量，从所述至少一个待推荐文本中选取所述目标文本对应的推荐文本。

一方面，提供了一种电子设备，所述电子设备包括处理器和存储器，所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如第一方面所述的文本推荐方法。

一方面，提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如第一方面所述的文本推荐方法。

一方面，提供了一种计算机程序产品，当该计算机程序产品被执行时，其用于执行上述第一方面所述的文本推荐方法。

本申请实施例提供的技术方案可以带来如下有益效果：

通过基于至少两个文本分析模型获取至少两种语义向量，并对上述至少两种语义向量进行整合处理，得到目标文本的整合语义向量，由于通过不同分析模型获取的语义向量各有优势，将其进行整合后得到的整合语义向量融合了各个语义向量的优势，因此该整合语义向量的表征能力更强，能更好地表示目标文本的文本信息，后续基于整合语义向量进行文本推荐时，推荐文本与目标文本之间的关联程度能得到提高，进而提高推荐的准确性。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请一个示例性实施例提供的实施环境的示意图；

图2是本申请一个示例性实施例提供的文本推荐方法的流程图；

图3A是本申请一个示例性实施例提供的文本推荐方法的流程图；

图3B是本申请一个示例性实施例提供的文本推荐的界面示意图；

图4A是本申请另一个示例性实施例示出的文本推荐方法的流程图；

图4B是本申请一个示例性实施例示出通过DNN模型获取第二语义向量的示意图；

图4C是图4A所示实施例应用于新闻推荐领域的示意图；

图5是本申请一个示例性实施例示出的训练第一分析模型的流程图；

图6A是本申请一个示例性实施例示出的训练第二分析模型的流程图；

图6B是本申请一个示例性实施例示出的训练第二分析模型的示意图；

图7是本申请一个示例性实施例示出的文本推荐装置的方框图；

图8是本申请另一个示例性实施例示出的文本推荐装置的方框图；

图9是本申请另一个示例性实施例示出的文本推荐装置的方框图；

图10是本申请一个示例性实施例示出的电子设备的方框图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请实施方式作进一步地详细描述。

请参考图1，其示出了本申请一个实施例示出的实施环境的示意图。该实施环境包括第一设备11与第二设备12。

第一设备11可以是具有文本分析功能的电子设备。可选地，第一设备11能够通过该文本分析功能来执行本申请例提供的文本推荐方法的各个步骤。该第一设备11可以是PC(Personal Computer，个人计算机)、智能手机、平板电脑之类的终端设备，也可以是服务器。服务器可以是一台服务器，也可以是由多台服务器组成的服务器集群，或者是一个云计算服务中心。

第二设备12可以是具有文本展示功能的电子设备。可选地，第二设备12安装有指定类型的客户端，该指定类型的客户端用于实现上述文本展示功能。也即，该指定类型的客户端能够接收第一设备11发送的推荐文本，并展示上述推荐文本。上述指定类型的客户端可以是阅读类客户端、资讯类客户端等等。该第二设备12可以是PC(Personal Computer，个人计算机)、智能手机、平板电脑之类的终端设备。

第一设备11与第二设备12之间通过有线网络或无线网络建立通信连接。在本申请实施例中，仅以第二设备12为终端设备，第一设备11为第二设备12中的指定类型的客户端对应的服务器为例进行说明。

在本申请实施例中，通过至少两个文本分析模型获取目标文本的至少两种语义向量，并对上述至少两种语义向量进行整合处理，得到目标文本的整合语义向量，由于通过不同分析模型获取的语义向量各有优势，将其进行整合后得到的整合语义向量融合了各个语义向量的优势，因此该整合语义向量的表征能力更强，能更好地表示目标文本的文本信息，后续基于语义向量进行文本推荐时，推荐文本与目标文本之间的关联程度能得到提高，进而提高推荐的准确性。

请参考图2，其示出了本申请一个实施例示出的文本推荐方法的流程图。该文本推荐方法可以应用于图1所示实施环境中的第一设备11。该方法包括：

步骤201，对目标文本进行预处理，得到目标文本的特征内容。

服务器中设置有数据库，数据库中包括多个文本。目标文本可以是上述多个文本中的任意一个。可选地，服务器直接从数据库中读取目标文本。

目标文本的特征内容是对目标文本的高度提炼，通常可用于概括性地表示目标文本所包括的文本信息。可选地，目标文本的特征内容包括目标文本的标题和正文特征词。

目标文本的标题通常由服务器直接获取。服务器获取目标文本的标题之后，通常需要对上述标题进行分词处理。分词处理是指将目标文本的标题划分为一个一个单独的词语。示例性地，对于句子“分词是文本挖掘的基础”，对该句子进行分词处理，得到“分词”、“是”、“文本挖掘”、“的”以及“基础”等五个词语。对目标文本的标题进行分词处理所采取的算法可以是基于字符串匹配的分词算法、基于理解的分词算法、基于统计的分词算法等等，本申请实施例对此不作限定。目标文本的正文特征词是指目标文本的正文中所包括的关键词，其通常能用于概括性地表示目标文本的正文。

步骤202，基于至少两种文本分析模型对特征内容进行处理，得到目标文本的至少两种语义向量。

上述语义向量是文本分析模型对特征内容进行处理的结果。文本分析模型与语义向量之间存在一一对应的关系，采用不同的语义分析模型时，所得到的语义向量的大小、方向、维度均有可能不同。对于获取至少两种语义向量的具体实现过程，将在下文实施例进行讲解。

文本分析模型可以是word2vec模型，深层神经网络(Dynamic Neural Network，DNN)模型、文档主题生成(Latent Dirichlet Allocation，LDA)模型等等，本申请实施例对此不作限定。

步骤203，对目标文本的至少两种语义向量进行整合，生成目标文本的整合语义向量。

在本发明实施例中，基于至少两种文本分析模型对特征内容进行处理，并对上述至少两种语义向量进行整合处理，得到目标文本的整合语义向量，由于通过不同分析模型获取的语义向量各有优势，将其进行整合后得到的整合语义向量融合了各个语义向量的优势，因此该整合语义向量的表征能力更强，能更好地即表示目标文本的文本信息，后续基于整合语义向量进行文本推荐时，推荐文本与目标文本之间的关联程度较好，进而提高推荐的准确性。

可选地，将上述至少两种语义向量进行拼接得到目标文本对应的语义向量。向量拼接是指将至少两个向量拼接成一个向量，拼接后的向量的维度应该大于拼接前的任意一个向量的维度。向量的维度用于指示该向量的表征能力，向量的维度越多时，向量的表征能力就越强。

步骤204，根据目标文本的整合语义向量和至少一个待推荐文本的整合语义向量，从至少一个待推荐文本中选取目标文本对应的推荐文本。

待推荐文本可以是数据库中除目标文本之外的文本。可选地，待推荐文本的整合语义向量的获取方式与目标文本的整合语义向量的获取方式相同，也即，服务器先对待推荐文本进行预处理，得到待推荐文本的特征内容，之后服务器采用至少两个文本分析模型对待推荐文本的特征内容进行处理，得到待推荐文本的至少两种语义向量，并对上述至少两种语义向量进行整合处理，得到待推荐文本的整合语义向量。

综上所述，本申请实施例提供的技术方案，通过至少两个文本分析模型获取目标文本的至少两种语义向量，并对上述至少两种语义向量进行整合处理，得到目标文本的整合语义向量，由于通过不同分析模型获取的语义向量各有优势，将其进行整合后得到的整合语义向量融合了各个语义向量的优势，因此该整合语义向量的表征能力更强，能更好地表示目标文本的文本信息，后续基于语义向量进行文本推荐时，推荐文本与目标文本之间的关联程度能得到提高，进而提高推荐的准确性。

请参考图3A，其示出了本申请一个实施例示出的文本推荐方法的流程图。该方法可以包括如下步骤：

步骤301，对目标文本进行预处理，得到目标文本的特征内容。

目标文本的正文特征词的获取过程如下：

步骤301a，对目标文本的正文进行分词处理，得到多个词语。

该步骤是将目标文本的正文划分为一个一个单独的词语。对目标文本的正文进行分词处理所采取的算法也可以是基于字符串匹配的分词算法、基于理解的分词算法、基于统计的分词算法等等，本申请实施例对此不作限定。

步骤301b，获取各个词语对应的词频和逆向文件频率(term frequency–inverse document frequency，TF-IDF)指标。

词语的TF-IDF指标可通过词语在目标文本中的出现次数，以及词语在待推荐文本中的出现次数来衡量。若某个词语在目标文本中的出现次数越多，并且该词语在待推荐文本中的出现次数越少，则该词语的TF-IDF指标越高；若某个词语在目标文本中的出现次数越少，并且该词语在待推荐文本中的出现次数越多，则该词语的TF-IDF指标越低。

TF-IDF指标可用于评估该词语在目标文本中的重要程度。TF-IDF指标与词语在目标文本中的重要程度呈正相关关系，也即，词语的TF-IDF指标越高，该词语在目标文本的重要程度越高；词语的TF-IDF指标越低，该词语在目标文本的重要程度越低。

步骤303c，将TF-IDF指标符合预设大小，且词性为预设词性的词语确定为目标文本的正文特征词。

预设大小可以根据实际经验设定，本申请实施例对此不作限定。词语的词性可以是名词、动词、形容词、副词中的任意一种。由于形容词以及副词通常起修饰作用，而并没有实质含义，例如形容词通常用于修饰名词，副词通常用于修饰动词，因此在本申请实施例中，预设词性可以是名词和/或动词。在其它可能的示例中，将各个词性为名词或动词的词语按照TF-IDF指标的大小进行排列，将TF-IDF指标排名在前n位的词语确定为目标文本的正文特征词。n的数值可以预先设定，示例性地，n为5。

步骤302，基于至少两种文本分析模型对特征内容进行处理，得到至少两种语义向量。

步骤303，根据至少两种语义向量获取目标文本对应的语义向量。

步骤304，获取目标文本对应的语义向量与待推荐文本对应的语义向量之间的关联程度。

关联程度用于表征目标文本与待推荐文本之间的相似度。关联程度与相似度之间呈正相关关系，也即，目标文本与待推荐文本之间的相似度越大，则目标文本对应的语义向量与待推荐文本对应的语义向量之间的关联程度越大；目标文本与待推荐文本之间的相似度越小，则目标文本对应的语义向量与待推荐文本对应的语义向量之间的关联程度越小。

可选地，服务器通过计算目标文本的语义向量与待推荐文本的语义向量之间的余弦距离，以获取目标文本对应的语义向量与待推荐文本对应的语义向量之间的关联程度。其中，余弦距离与关联程度之间呈正相关关系，也即，目标文本的语义向量与待推荐文本的语义向量之间的余弦距离越大，目标文本对应的语义向量与待推荐文本对应的语义向量之间的关联程度越大；目标文本的语义向量与待推荐文本的语义向量之间的余弦距离越小，目标文本对应的语义向量与待推荐文本对应的语义向量之间的关联程度越小。

两个语义向量之间的余弦距离cosθ可以通过如下公式计算得到：

其中，n是两个语义向量的维度，A _i是第一个语义向量，B _i是第二个语义向量，

是第一个语义向量的大小，

是第二个语义向量的大小。

步骤305，将关联程度符合第一预设条件的语义向量对应的文本确定为目标文本对应的推荐文本，并进行推荐。

将目标文本对应的语义向量与待推荐文本对应的语义向量之间的关联程度按照由高到低的顺序进行排列，第一预设条件是目标文本对应的语义向量与待推荐文本对应的语义向量之间的关联程度排在前m位。m的数值可以预先设定，本发明实施例对此不作限定。另外，第一预设条件也可以是目标文本对应的语义向量与待推荐文本对应的语义向量之间的关联程度大于预设程度。预设程度可以根据实际经验设定，本发明实施例对此不作限定。

当通过余弦距离来获取关联程度时，将目标文本对应的语义向量与待推荐文本对应的语义向量之间的余弦距离按照由高到低的顺序进行排列，第一预设条件是目标文本对应的语义向量与待推荐文本对应的语义向量之间的余弦距离排在前m位。另外，第一预设条件也可以是目标文本对应的语义向量与待推荐文本对应的语义向量之间的余弦距离大于预设距离。预设距离可以根据实际经验设定，本发明实施例对此不作限定。

本实施例的部分步骤与图2所示的实施例相同，详细论述可以参见图2的相关描述。另外，后续用户通过终端向服务器请求目标文本时，服务器将目标文本发送至终端的同时，也将推荐文本发送至终端，从而实现向用户推荐文本。通过上述方式可以使用户在浏览完目标文本之后，可以继续浏览与目标文本的关联程度较大的其它文本，从而增大用户在相关应用程序的用户界面的停留时间，增加用户粘性。

具体地，提供阅读功能的应用程序的用户界面中显示有各个目标文本的标识(例如，目标文本的标题)，用户触发任一目标文本的标识之后，上述应用程序的客户端向服务器发送文本获取请求，文本获取请求携带有用户选择的目标文本的标识，服务器根据文本获取请求携带的目标文本的标识获取目标文本，并采取图3A所示实施例提供的方法获取目标文本对应的推荐文本，之后将目标文本与推荐文本发送至上述应用程序的客户端，由客户端在该应用程序的用户界面上同时显示目标文本和推荐文本。

结合参考图3B，其示出了本申请一个示例性实施例示出的文本推荐的界面示意图。其中，提供阅读功能的应用程序的用户界面30上显示有目标文本31和推荐文本32。

综上所述，本申请实施例提供的方法，通过基于至少两个文本分析模型获取至少两种语义向量，并对上述至少两种语义向量进行整合处理，得到目标文本的整合语义向量，由于通过不同分析模型获取的语义向量各有优势，将其进行整合后得到的整合语义向量融合了各个语义向量的优势，因此该整合语义向量的表征能力更强，能更好地表示目标文本的文本信息，后续基于整合语义向量进行文本推荐时，推荐文本与目标文本之间的关联程度能得到提高，进而提高推荐的准确性。

请参考图4A，其示出了本申请另一个实施例示出的文本推荐方法的流程图。在本申请实施例中，至少两个文本分析模型包括第一分析模型和第二分析模型。该方法可以包括如下步骤：

步骤401，对目标文本进行预处理，得到目标文本的特征内容。

步骤401与步骤101相同，此处不作赘述。

步骤402，采用第一分析模型对特征内容进行处理，得到目标文本的第一语义向量。

在本申请实施例中，第一分析模型是word4vec模型。Word4vec模型可以解决汉语中存在的“一词多义”、“多词一义”等问题。需要说明的是，通过word2vec模型对目标文本的特征内容进行处理时，通常只会对目标文本的正文特征词进行处理。

可选地，目标文本的特征内容包括目标文本的正文特征词，第一分析模型包括词语与语义向量之间的对应关系，步骤402可以包括如下子步骤：

步骤402a，查找对应关系，得到每个正文特征词对应的语义向量；

上述对应关系也即是训练word4vec模型得到的训练结果。另外，word4vec 模型的训练过程，将在下文实施例进行解释说明。

步骤402b，基于每个正文特征词对应的语义向量获取第一语义向量。

可选地，将每个正文特征词对应的语义向量相加后计算平均值，得到第一语义向量。示例性地，正文特征词A、B和C对应的语义向量分别为w _A、w _B和w _C，则第一语义向量w _a可以通过如下公式计算得到：

步骤403，采用第二分析模型对特征内容进行处理，得到目标文本的第二语义向量。

在本申请实施例中，第二分析模型是DNN模型。通过DNN模型得到的语义向量的表征性较强，后续再进行文本推荐时，目标文本与推荐文本之间的关联程度计算得较为准确。另外，由于对正文特征词进行处理时，无需考虑正文特征词之间的顺序，而在对标题进行处理时，需要考虑对标题进行分词得到的词语之间的顺序，因此需要对正文特征词和标题分开进行处理。

可选地，目标文本的特征内容包括目标文本的正文特征词和标题，步骤403可以包括如下子步骤：

步骤403a，采用第二分析模型对正文特征词进行处理，得到正文特征词的语义向量；

可选地，第二分析模型包括BOW层，BOW层用于对正文特征词进行处理，得到正文特征词的语义向量。此时，步骤403a具体实现为：采用BOW层对正文特征词进行处理，得到正文特征词的语义向量。

正文特征词的数量通常有多个，并且正文特征词是从目标文本的正文中的不同句子提取得到的，因此正文特征词之间并不存在特定的顺序，因此采用第二分析模型的BOW层对各个正文特征词进行处理，得到各个正文特征词的语义向量。可选地，将各个正文特征词的语义向量相加后求平均值，得到正文特征词的语义向量。

步骤403b，采用第二分析模型对标题进行处理，得到标题对应的语义向量；

可选地，第二分析模型包括CNN层，CNN层用于对标题进行处理，得到标题的语义向量。此时，步骤403b具体实现为：采用CNN层对标题进行处理，得到标题的语义向量。

在对标题进行处理之前，需要对标题进行分词处理，分词处理后得到的各个词语在标题中的顺序固定，因此，采用CNN层对标题进行处理，得到标题对应的语义向量。

步骤403c，基于正文特征词对应的语义向量和标题对应的语义向量获取第二语义向量。

可选地，将正文特征词对应的语义向量和标题对应的语义向量相加，得到第二语义向量。

可选地，第二分析模型还包括输入层、嵌入层、全联通层。输入层用于输入目标文本的正文特征词以及标题，其中，标题与正文特征词是在输入层的不同位置进行输入的，另外，将目标特征词与标题输入输入层之前，通常采用不同的id来表示正文特征词以及对标题进行分词得到的词语。嵌入层用于采用随机的初始化向量表示正文特征词以及标题。全联通层用于对CNN层输出的标题对应的语义向量以及BOW层输出的正文特征词对应的语义向量之和进行进一步处理，全联通层输出的目标文本对应的语义向量的表征能力更强。

结合参考图4B，其示出了本申请一个示例性实施例示出的采用DNN模型获取第二语义向量的示意图。DNN模型包括输入层、嵌入层、CNN层、BOW层以及两个全联通层。将目标文本的标题以及正文特征词分别输入输入层，再输入至嵌入层，得到标题对应的初始化向量以及正文特征词对应的初始化向量，标题对应的初始化向量被输入至CNN层，并由CNN层输出标题对应的语义向量，正文特征词对应的初始化向量被输入至BOW层，并由BOW层输出正文特征词对应的语义向量，之后将标题对应的语义向量与正文特征词对应的语义向量相加后输入至全联通层，得到目标文本对应的第二语义向量。

在本申请实施例中，基于标题所存在的顺序，将正文特征词与标题分开进行处理，从而使通过DNN模型得到的第二语义向量能更加准确地表示目标文本的文本信息，后续进行文本推荐时，推荐文本与目标文本之间的关联程度能得到进一步提高。

步骤404，基于第一语义向量和第二语义向量获取目标文本对应的语义向量。

可选地，将第一语义向量与第二语义向量进行向量拼接，得到目标文本对应的语义向量。示例性地，第一语义向量为128维，第二语义向量为200维，则向量拼接后得到的目标文本对应的语义向量为328维。

可选地，步骤404可以包括如下两个子步骤：

步骤404a，获取第一语义向量对应的第一系数和第二语义向量对应的第二系数。

第一系数与第二系数根据经验设定。另外，后续得到目标文本对应的推荐文本时，还可以依据目标文本与推荐文本之间的关联程度对第一系数、第二系数进行调整。

步骤404b，对第一语义向量与第一系数之间的乘积和第二语义向量和第二系数之间的乘积进行拼接处理，得到目标文本对应的语义向量。

示例性地，第一系数为k1，第二系数为k2，第一语义向量为w _a，第二语义向量为w _b，则拼接得到的目标文本对应的语义向量w _s可以表示为(k1w _a，k4w _b)。

步骤405，获取目标文本对应的语义向量与待推荐文本对应的语义向量之间的关联程度。

步骤406，将关联程度符合第一预设条件的语义向量对应的文本确定为目标文本对应的推荐文本，并进行推荐。

步骤405至步骤406与步骤104至105相同，此处不再赘述。

下面对图4A所示实施例应用于新闻推荐领域进行讲解，结合参考图4C，其示出了图4A所示实施例应用于新闻推荐领域的示意图。

新闻候选池中包括多个新闻(待推荐文本)，对新闻候选池中的各个新闻进行预处理，得到各个新闻的特征内容，后续通过word4vec模型和DNN模型对各个新闻的特征内容进行处理，得到各个新闻对应的语义向量，上述各个新闻对应的语义向量组成了新闻向量集合，后续每生成一个新闻，对新生成的新闻进行预处理，得到新生成的新闻的特征内容，后续通过word4vec模型和DNN模型对新生成的新闻的特征内容进行处理，得到上述新闻对应的语义向量，计算上述新闻对应的语义向量与新闻向量集合中的各个向量之间的余弦距离，将上述各个余弦距离按从大到小的顺序排列，将排在前m位的余弦距离对应的新闻作为上述新生成的新闻对应的推荐新闻。

综上所述，本申请实施例提供的方法，通过基于至少两个文本分析模型获取至少两种语义向量，并对上述至少两种语义向量进行整合处理，得到目标文本的整合语义向量，由于通过不同分析模型获取的语义向量各有优势，将其进行整合后得到的整合语义向量融合了各个语义向量的优势，因此该整合语义向量的表征能力更强，能更好地表示目标文本的文本信息，后续基于语义向量进行文本推荐时，推荐文本与目标文本之间的关联程度能得到提高，进而提高推荐的准确性。

还通过将正文特征词与标题分开进行处理，从而使通过DNN模型得到的第二语义向量能更加准确地表示目标文本的文本信息，后续进行文本推荐时，推荐文本与目标文本之间的关联程度能得到进一步提高。

下面将对第一分析模型的训练过程进行讲解。

结合参考图5，其示出了本申请实施例示出的训练第一分析模型的流程图。训练第一分析模型可以包括如下步骤501至504。

步骤501，获取第一训练样本集。

第一训练样本集包括多个第一训练样本。第一训练样本可以是一个文本。服务器可以从数据库中直接读取第一训练样本，也可以从与服务器建立有通信连接的其它电子设备处获取第一训练样本。以上述推荐文本应用于新闻推荐领域为例，上述第一训练样本可以是预设时间内的新闻，预设时间可以根据对第一训练样本的数量要求实际确定。比如，第一训练样本是最近一年的新闻。

每个第一训练样本包括至少一个词语和每个词语的上下文。词语的上下文是指在一个完整的句子中在该词语之前和之后出现的词语。例如，在句子“今天没有下雨”中，“没有”的上下文是“今天”和“下雨”。词语以及词语的上下文是由服务器对第一训练样本所包括的句子进行分词处理得到的。

词语对应有语义向量，词语的上下文也对应有语义向量。词语对应的语义向量，以及词语的上下文对应的语义向量均是通过随机化的方式获取到的。

步骤502，对于每一个词语，将词语的上下文对应的语义向量输入第一原始模型，得到训练结果。

第一原始模型可以是CBOW(Continuous Bag Of Words Model)模型，也可以是Skip-gram模型，本申请实施例对此不作限定。在本申请实施例中，仅以第一原始模型为CBOW模型为例进行解释说明。

训练结果包括每个词语的出现概率。每个词语的出现概率是指该词语出现在输入第一原始模型的语义向量对应的上下文之间的概率。

步骤503，根据训练结果调整词语的上下文的语义向量，并将调整后的语义向量再次输入第一原始模型，直至训练结果符合期望结果。

期望结果是指上下文对应的词语的出现概率符合第二预设条件。第二预设条件是指上下文对应的词语的出现概率最大。示例性地，“没有”在“今天”和“下雨”之间的出现概率应当最大。

服务器可以检测训练结果是否符合期望结果，若训练结果不符合期望结果时，则相应地对输入第一原始模型的上下文对应的语义向量进行调整，之后重复将调整后的语义向量输入第一原始模型，得到训练结果，并在训练结果不符合期望结果的情况下调整输入的语义向量的步骤，直到训练结果符合期望结果。

步骤504，当训练结果符合期望结果时，根据各个词语对应的语义向量生成第一分析模型。

当训练结果符合期望结果时，此时输入第一原始模型的语义向量可以视为上下文对应的语义向量，当第一训练样本足够时，对于每个词语，均可以得到该词语对应的语义向量，其中，词语与词语对应的语义向量之间的预设对应关系可以称之为第一分析模型。

下面将对第二分析模型的训练过程进行讲解。

结合参考图6A，其示出了本申请实施例示出的训练第二分析模型的流程图。训练第二分析模型可以包括如下步骤601至604。

步骤601，获取第二训练样本集。

第二训练样本集包括多个第二训练样本。服务器可以从数据库中直接读取第二训练样本，也可以从与服务器建立有通信连接的其它电子设备处获取第二训练样本。以上述推荐文本应用于新闻推荐领域为例，上述第二训练样本可以是预设时间内的新闻，预设时间可以根据对第二训练样本的数量要求实际确定。

每个第二训练样本包括训练文本、训练文本的正例和训练文本的反例。上述训练文本、训练文本的正例和训练文本的反例可以采用三元数组{news，pos，neg}表示。News为训练文本，其可以是任何一个文本。Pos是训练文本的正例，其通常是与训练文本较为相关的文本，pos可以通过协同过滤的方法得到；neg为训练文本的反例，其可以是与上述训练文本完全无关的文本，其可以随机选取。通常，pos与neg的比例为1:1。

每个第二训练文本对应有第一相似度和第二相似度，第一相似度是训练文本与训练文本的正例之间的相似度，第二相似度是训练文本与训练文本的反例之间的相似度。需要说明的是，news，pos，neg均是采用文本的特征内容来表示的，得到文本的特征内容的过程可以参考步骤102，此处不再赘述。

步骤602，对于每一个第二训练样本，将第二训练样本输入第二原始模型，得到训练结果。

第二原始模型是待训练的深层神经网络模型。可选地，第二原始模型包括输入层、嵌入层、CNN层、BOW层、全联通层。每一层的初始参数可以是随机设置的。

将第二训练样本所包括的news、pos和neg的特征内容输入输入层，需要说明的是，在输入之前，通常会将news、pos和neg的特征内容表示为one-hot向量，也即，对于特征内容所包括的每一个词语，均采用唯一的id进行表示。

嵌入层用于得到news、pos和neg的特征内容对应的初始化语义向量。CNN层用于对news、pos和neg的标题进行处理，得到news、pos和neg的标题对应的语义向量。BOW层用于对news、pos和neg的正文特征词进行处理，得到news、pos和neg的正文特征词对应的语义向量。

第二原始模型将标题对应的语义向量和正文特征词对应的语义向量分别相加，得到news、pos和neg分别对应的语义向量，后续全联通层对news、pos和neg分别对应的语义向量进行进一步处理，得到news、pos和neg分别对应的语义向量。

第二原始模型分别计算news对应的语义向量与pos对应的语义向量之间的相似度，以及和neg对应的最终语义向量之间的相似度，上述两个相似度也即是将第二训练样本输入第二原始模型所得到的训练结果。

步骤603，对于每一个第二训练样本，将训练结果分别与第一相似度和第二相似度进行比较，得到计算损失。

计算损失用于表征训练结果与第一相似度之间的误差以及与第二相似度之间的误差。计算损失包括第一计算损失和第二计算损失，第一计算损失是训练结果中news对应的语义向量与pos对应的语义向量之间的相似度与第一相似度之间的误差，第二计算损失是训练结果中news对应的语义向量与neg对应的最终语义向量之间的相似度与第二相似度之间的误差。可选地，第二原始模型还包括损耗层，损耗层用于根据训练结果、第一相似度以及第二相似度计算得到计算损失。具体地，损耗层计算训练结果中news对应的语义向量与pos对应的语义向量之间的相似度与第一相似度的差值得到第一计算损失，并计算训练结果中news对应的语义向量与neg对应的最终语义向量之间的相似度与第二相似度之间的差值得到第二计算损失。

步骤604，根据训练样本集中的各个第二训练样本分别对应的计算损失，采用误差反向传播算法训练得到第二分析模型。

当计算损失不符合第三预设条件时，调整第二原始模型中的输入层、嵌入层、CNN层以及BOW层之间的参数，并基于调整后的第二原始模型继续进行训练，直至计算损失符合第三预设条件。其中，第三预设条件是指计算损失小于预设数值，预设数值可以根据DNN模型的精度要求实际设定，本申请实施例对此不作限定。

结合参考图6B，其示出了本申请一个示例性实施例示出的训练第二分析模型的示意图。待训练的第二原始模型包括输入层、嵌入层、CNN层、BOW层、两个全联通层以及损耗层，将训练文本、训练文本的正例、训练文本的反例输入第二原始模型，经过第二原始模型的输入层、嵌入层、CNN层、BOW层以及两个全联通层逐层进行处理后，得到训练文本对应的语义向量，训练文本的正例对应的语义向量以及训练文本的反例对应的语义向量，分别计算训练文本对应的语义向量与训练文本的正例对应的语义向量之间的相似度，以及训练文本对应的语义向量与训练文本的反例对应的语义向量之间的相似度，将上述两个相似度分别输入至损耗层，由损耗层计算计算损失，之后可根据计算损失对第二原始模型所包括的各个层的参数进行调整，并基于调整后的第二原始模型继续进行训练，直至计算损失符合第三预设条件。

下述为本申请装置实施例，可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节，请参照本申请方法实施例。

请参考图7，其示出了本申请一个实施例示出的文本推荐装置的框图。。该装置具有实现上述方法示例中的功能，所述功能可以由硬件实现，也可以由硬件执行相应的软件实现。该装置可以包括：

预处理模块701、文本分析模块702、向量获取模块703和文本推荐模块704。

预处理模块701，用于对目标文本进行预处理，得到所述目标文本的特征内容。

文本分析模块702，用于通过至少两种文本分析模型对所述特征内容进行处理，得到所述目标文本的至少两种语义向量。

向量获取模块703，用于对所述目标文本的至少两种语义向量进行整合，生成所述目标文本的整合语义向量。

文本推荐模块704，用于根据所述目标文本的整合语义向量和至少一个待推荐文本的整合语义向量，从所述至少一个待推荐文本中选取所述目标文本对应的推荐文本。

请参考图8，其示出了本发明一个实施例提供的文本推荐装置的框图。该装置具有实现上述方法示例中的功能，所述功能可以由硬件实现，也可以由硬件执行相应的软件实现。该装置可以包括：预处理模块801、文本分析模块802、向量获取模块803、程度获取模块804和文本推荐模块805。

预处理模块801，用于对目标文本进行预处理，得到所述目标文本的特征内容。

文本分析模块802，用于基于至少两种文本分析模型对所述特征内容进行处理，得到至少两种语义向量。

向量获取模块803，用于根据所述至少两种语义向量获取所述目标文本对应的语义向量。

程度获取模块804，用于获取所述目标文本对应的语义向量与待推荐文本对应的语义向量之间的关联程度，所述关联程度用于表征所述目标文本与所述待推荐文本之间的相似度。

文本推荐模块805，用于将关联程度符合第一预设条件的语义向量对应的待推荐文本确定为所述目标文本对应的推荐文本，并进行推荐。

在基于图8所示实施例提供的可选实施例中，所述至少两种文本分析模型包括第一分析模型和第二分析模型，所述文本分析模块802，包括：第一处理单元、第二处理单元(图中未示出)。

第一处理单元，用于采用所述第一分析模型对所述特征内容进行处理，得到所述目标文本对应的第一语义向量。

第二处理单元，用于采用所述第二分析模型对所述特征内容进行处理，得到所述目标文本对应的第二语义向量。

所述向量获取模块803，用于基于所述第一语义向量和所述第二语义向量获取所述目标文本对应的语义向量。

可选地，所述目标文本的特征内容包括所述目标文本的正文特征词，所述第一分析模型包括词语与语义向量之间的对应关系，所述第一处理单元，用于：

查找所述对应关系，得到每个正文特征词对应的语义向量；

基于所述每个正文特征词对应的语义向量获取所述第一语义向量。

可选地，所述目标文本的特征内容包括所述目标文本的正文特征词和标题；所述第二处理单元，用于：

采用所述第二分析模型对所述正文特征词进行处理，得到所述正文特征词对应的语义向量；

采用所述第二分析模型对所述标题进行处理，得到所述标题对应的语义向量；

基于所述正文特征词对应的语义向量和所述标题对应的语义向量获取所述第二语义向量。

可选地，所述第二分析模型包括BOW层和CNN层；所述第二处理单元，具体用于采用所述BOW层对所述正文特征词进行处理，得到所述正文特征词对应的语义向量；采用所述CNN层对所述标题进行处理，得到所述标题对应的语义向量。

可选地，所述向量获取模块803，具体用于：

获取所述第一语义向量对应的第一系数和所述第二语义向量对应的第二系数；

对所述第一语义向量与所述第一系数之间的乘积和所述第二语义向量和所述第二系数之间的乘积进行拼接处理，得到所述目标文本对应的语义向量。

在基于图8所示实施例提供的另一个可选实施例中，请参考图9，所述装置还包括：第一获取模块806、第二获取模块807、向量调整模块808和第一生成模块809。

第一获取模块806，用于获取第一训练样本集，所述第一训练样本集包括多个第一训练样本，每个第一训练样本包括至少一个词语和每个词语的上下文，所述词语对应有语义向量，所述词语的上下文也对应有语义向量。

第二获取模块807，用于对于每一个词语，将所述词语的上下文对应的语义向量输入第一原始模型，得到训练结果，所述训练结果包括每个词语的出现概率。

向量调整模块808，用于根据所述训练结果调整所述词语的上下文的语义向量，并将调整后的语义向量再次输入所述第一原始模型，直至所述训练结果符合期望结果，所述期望结果是指所述上下文对应的词语的出现概率符合第二预设条件。

第一生成模块809，用于当所述训练结果符合所述期望结果时，根据各个词语对应的语义向量生成所述第一分析模型。

在基于图8所示实施例提供的另一个可选实施例中，请参考图9，请所述装置还包括：第三获取模块810、第四获取模块811、损失计算模块812和第二生成模块813。

第三获取模块810，用于获取第二训练样本集，所述第二训练样本集包括多个第二训练样本，每个第二训练样本包括训练文本、所述训练文本的正例和所述训练文本的反例，每个第二训练文本对应有第一相似度和第二相似度，所述第一相似度是所述训练文本与所述训练文本的正例之间的相似度，所述第二相似度是所述训练文本与所述训练文本的反例之间的相似度。

第四获取模块811，用于对于每一个第二训练样本，将所述第二训练样本输入第二原始模型，得到训练结果。

损失计算模块812，用于对于每一个第二训练样本，将所述训练结果分别与所述第一相似度、所述第二相似度进行比较，得到计算损失，所述计算损失用于表征所述训练结果与所述第一相似度之间的误差以及与所述第二相似度之间的误差。

第二生成模块813，用于根据所述训练样本集中的各个第二训练样本分别对应的计算损失，采用误差反向传播算法训练得到所述第二分析模型。

综上所述，本申请实施例提供的装置，通过基于至少两个文本分析模型获取至少两种语义向量，并基于上述至少两种语义向量获取目标文本对应的语义向量，采用上述方式得到的语义向量的表征能力更强，能更好地表示目标文本的文本信息，后续基于语义向量进行文本推荐时，推荐文本与目标文本之间的关联程度能得到提高，进而提高推荐的准确性。

请参考图10，其示出了本申请一个实施例提供的电子设备的结构示意图。该电子设备可以是服务器。该电子设备用于实施上述实施例中提供的文本推荐方法。具体来讲：

所述电子设备1000包括中央处理单元(CPU)1001、包括随机存取存储器(RAM)1002和只读存储器(ROM)1003的***存储器1004，以及连接***存储器1004和中央处理单元1001的***总线1005。所述电子设备1000还包括帮助计算机内的各个器件之间传输信息的基本输入/输出***(I/O***)1006，和用于存储操作***1013、应用程序1014和其他程序模块1015的大容量存储设备1007。

所述基本输入/输出***1006包括有用于显示信息的显示器1008和用于用户输入信息的诸如鼠标、键盘之类的输入设备1009。其中所述显示器1008和输入设备1009都通过连接到***总线1005的输入输出控制器1010连接到中央处理单元1001。所述基本输入/输出***1006还可以包括输入输出控制器1010以用于接收和处理来自键盘、鼠标、或电子触控笔等多个其他设备的输入。类似地，输入输出控制器1010还提供输出到显示屏、打印机或其他类型的输出设备。

所述大容量存储设备1007通过连接到***总线1005的大容量存储控制器(未示出)连接到中央处理单元1001。所述大容量存储设备1007及其相关联的计算机可读介质为电子设备1000提供非易失性存储。也就是说，所述大容量存储设备1007可以包括诸如硬盘或者CD-ROM驱动器之类的计算机可读介质(未示出)。

不失一般性，所述计算机可读介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括RAM、ROM、EPROM、EEPROM、闪存或其他固态存储其技术，CD-ROM、DVD或其他光学存储、磁带盒、磁带、磁盘存储或其他磁性存储设备。当然，本领域技术人员可知所述计算机存储介质不局限于上述几种。上述的***存储器1004和大容量存储设备1007可以统称为存储器。

根据本申请的各种实施例，所述电子设备1000还可以通过诸如因特网等网络连接到网络上的远程计算机运行。也即电子设备1000可以通过连接在所述***总线1005上的网络接口单元1011连接到网络1012，或者说，也可以使用网络接口单元1011来连接到其他类型的网络或远程计算机***(未示出)。

所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现上述方法实施例中的文本推荐方法。

在示例性实施例中，还提供了一种计算机可读存储介质，所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由电子设备的处理器加载并执行以实现上述方法实施例中的文本推荐方法。

可选地，上述计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

应当理解的是，在本文中提及的“多个”是指两个或两个以上。“和/或”，描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。本文中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性，而只是用来区分不同的组成部分。

上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。

以上仅为本申请的示例性实施例，并不用以限制本申请，凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

一种文本推荐方法，应用于电子设备中，所述方法包括：

对目标文本进行预处理，得到所述目标文本的特征内容；

基于至少两种文本分析模型对所述特征内容进行处理，得到所述目标文本的至少两种语义向量；

对所述目标文本的至少两种语义向量进行整合，生成所述目标文本的整合语义向量；

根据所述目标文本的整合语义向量和至少一个待推荐文本的整合语义向量，从所述至少一个待推荐文本中选取所述目标文本对应的推荐文本。
根据权利要求1所述的方法，其中，所述至少两种文本分析模型包括第一分析模型和第二分析模型，所述采用至少两种文本分析模型对所述特征内容进行处理，得到所述目标文本的至少两种语义向量，包括：

采用所述第一分析模型对所述特征内容进行处理，得到所述目标文本的第一语义向量；

采用所述第二分析模型对所述特征内容进行处理，得到所述目标文本的第二语义向量；

其中，所述整合语义向量是对所述第一语义向量和所述第二语义向量进行整合生成的。
根据权利要求2所述的方法，其中，所述特征内容包括所述目标文本的正文特征词；

所述采用所述第一分析模型对所述特征内容进行处理，得到所述目标文本的第一语义向量，包括：

通过所述第一分析模型获取所述目标文本的正文特征词的语义向量；

基于所述正文特征词的语义向量获取所述第一语义向量。
根据权利要求2所述的方法，其中，所述特征内容包括所述目标文本的正文特征词与标题，所述采用所述第二分析模型对所述特征内容进行处理，得到所述目标文本的第二语义向量，包括：

采用所述第二分析模型对所述正文特征词进行处理，得到所述正文特征词的语义向量；

采用所述第二分析模型对所述标题进行处理，得到所述标题的语义向量；

基于所述正文特征词的语义向量和所述标题的语义向量获取所述第二语义向量。
根据权利要求4所述的方法，其中，所述第二分析模型包括词袋BOW层和卷积神经网络CNN层；所述BOW层用于对所述正文特征词进行处理，得到所述正文特征词的语义向量；所述CNN层用于对所述标题进行处理，得到所述标题的语义向量。
根据权利要求2所述的方法，其中，所述对所述目标文本的至少两种语义向量进行整合，生成所述目标文本的整合语义向量，包括：

获取所述第一语义向量对应的第一系数和所述第二语义向量对应的第二系数；

对所述第一语义向量与所述第一系数之间的乘积和所述第二语义向量与所述第二系数之间的乘积进行拼接处理，得到所述目标文本的整合语义向量。
根据权利要求1至6任一项所述的方法，其中，所述根据所述目标文本的整合语义向量和至少一个待推荐文本的整合语义向量，从所述至少一个待推荐文本中选取所述目标文本对应的推荐文本，包括：

获取所述目标文本的整合语义向量与各个所述待推荐文本的整合语义向量之间的关联程度，所述关联程度用于表征所述目标文本与所述待推荐文本之间的相似度；

将所述关联程度符合第一预设条件的待推荐文本确定为所述目标文本对应的推荐文本。
根据权利要求1至6任一项所述的方法，其中，所述采用至少两种文本分析模型对所述特征内容进行处理，得到所述目标文本的至少两种语义向量之前，还包括：

获取第一训练样本集，所述第一训练样本集包括多个第一训练样本，每个第一训练样本包括至少一个词语和每个词语的上下文，所述词语对应有语义向量，所述词语的上下文也对应有语义向量；

对于每一个词语，将所述词语的上下文对应的语义向量输入第一原始模型，得到训练结果，所述训练结果包括每个词语的出现概率；

根据所述训练结果调整所述词语的上下文的语义向量，并将调整后的语义向量再次输入所述第一原始模型，直至所述训练结果符合期望结果，所述期望结果是指所述上下文对应的词语的出现概率符合第二预设条件；

当所述训练结果符合所述期望结果时，根据各个词语对应的语义向量生成第一分析模型。
根据权利要求1至6任一项所述的方法，其中，所述采用至少两种文本分析模型对所述特征内容进行处理，得到所述目标文本的至少两种语义向量之前，还包括：

获取第二训练样本集，所述第二训练样本集包括多个第二训练样本，每个第二训练样本包括训练文本、所述训练文本的正例和所述训练文本的反例，每个第二训练文本对应有第一相似度和第二相似度，所述第一相似度是所述训练文本与所述训练文本的正例之间的相似度，所述第二相似度是所述训练文本与所述训练文本的反例之间的相似度；

对于每一个第二训练样本，将所述第二训练样本输入第二原始模型，得到训练结果；

对于每一个第二训练样本，将所述训练结果分别与所述第一相似度、所述第二相似度进行比较，得到计算损失，所述计算损失用于表征所述训练结果与所述第一相似度之间的误差以及与所述第二相似度之间的误差；

根据所述训练样本集中的各个第二训练样本分别对应的计算损失，采用误差反向传播算法训练得到第二分析模型。
一种文本推荐装置，应用于电子设备中，所述装置包括：

预处理模块，用于对目标文本进行预处理，得到所述目标文本的特征内容；

文本分析模块，用于基于少两种文本分析模型对所述特征内容进行处理，得到所述目标文本的至少两种语义向量；

向量获取模块，用于对所述目标文本的至少两种语义向量进行整合，生成所述目标文本的整合语义向量；

文本推荐模块，用于根据所述目标文本的整合语义向量和至少一个待推荐文本的整合语义向量，从所述至少一个待推荐文本中选取所述目标文本对应的推荐文本。
根据权利要求10所述的装置，其中，所述至少两种文本分析模型包括第一分析模型和第二分析模型，所述向量获取模块，用于：

采用所述第一分析模型对所述特征内容进行处理，得到所述目标文本的第一语义向量；

采用所述第二分析模型对所述特征内容进行处理，得到所述目标文本的第二语义向量；

其中，所述整合语义向量是对所述第一语义向量和所述第二语义向量进行整合生成的。
根据权利要求10所述的装置，其中，所述特征内容包括所述目标文本的正文特征词，所述向量获取模块，用于：

通过所述第一分析模型获取每个所述正文特征词的语义向量；

基于所述每个正文特征词对应的语义向量获取所述第一语义向量。
根据权利要求10所述的装置，其中，所述特征内容包括正文特征词与标题，所述向量获取模块，用于：

采用所述第二分析模型对所述正文特征词进行处理，得到所述正文特征词的语义向量；

采用所述第二分析模型对所述标题进行处理，得到所述标题的语义向量；

基于所述正文特征词的语义向量和所述标题的语义向量获取所述第二语义向量。
根据权利要求13所述的装置，其中，所述第二分析模型包括词袋BOW 层和卷积神经网络CNN层；所述BOW层用于对所述正文特征词进行处理，得到所述正文特征词的语义向量；所述CNN层用于对所述标题进行处理，得到所述标题的语义向量。
根据权利要求10至14任一项所述的装置，其特征在于，所述文本推荐模块，用于：获取所述目标文本的整合语义向量与所述至少一个待推荐文本的整合语义向量之间的关联程度，所述关联程度用于表征所述目标文本与所述待推荐文本之间的相似度；

将所述关联程度符合第一预设条件的待推荐文本确定为所述目标文本对应的推荐文本。
一种电子设备，所述电子设备包括处理器和存储器，所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如权利要求1至9任一项所述的文本推荐方法。
一种计算机可读存储介质，所述计算机可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如权利要求1至9任一项所述的文本推荐方法。