WO2020155877A1

WO2020155877A1 - 信息推荐

Info

Publication number: WO2020155877A1
Application number: PCT/CN2019/125054
Authority: WO
Inventors: 陈文石; 王强; 卢文羊; 李春阳
Original assignee: 北京三快在线科技有限公司
Priority date: 2019-01-28
Filing date: 2019-12-13
Publication date: 2020-08-06
Also published as: CN109829108B; CN109829108A

Abstract

一种信息推荐方法、装置、电子设备及可读存储介质。所述方法，包括：基于目标用户的第一用户数据确定所述目标用户与各个情景主题的关联程度值（110）；根据各待推荐信息对应的第二用户数据，确定所述待推荐信息与所述情景主题的匹配程度值（120）；基于所述关联程度值以及所述匹配程度值，确定与所述目标用户匹配的待推荐信息，并将所述待推荐信息发送至所述目标用户（130）。由此解决了现有的信息推荐方法精准性和多样性存在不足，且对用户的吸引力较低的技术问题。取得了提高推荐信息的精准性、多样性以及用户吸引力的有益效果。

Description

信息推荐

本申请要求在2019年1月28日提交中国专利局、申请号为201910081528.9、发明名称为“信息推荐方法、装置、电子设备及可读存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本发明涉及互联网技术领域，具体涉及一种信息推荐方法、装置、电子设备及可读存储介质。

背景技术

随着移动互联网业务的兴起，人们可以方便的通过移动终端访问网络，进而获取或定制所需的服务，因此O2O(Online To Offline，/线上到线下)模式应运而生。这种模式的本质是使得用户和服务彼此之间更为便捷的发现，用户随时可以在线上选择自己需要的线下服务；而通过对用户画像及商户信息的挖掘，又可以向用户进行信息推荐，进而提升用户体验，并帮商户进行发现客户。

但现有的信息推荐方案的核心思想是挖掘相似的用户或者相似待推荐信息，通过相似用户进行推荐或者给用户推荐相似待推荐信息。由此可见，现有的信息推荐方法多在于优化推荐算法，即如何更精准的匹配用户和商户，而并未关注用户实际所处的情境，因此基于现有信息推荐方法确定的推荐结果精准性和多样性存在不足，且对用户的吸引力较低。

发明内容

本发明提供一种信息推荐方法、装置、电子设备及可读存储介质，以部分或全部解决现有技术中信息推荐过程相关的上述问题。

依据本发明第一方面，提供了一种信息推荐方法，包括：

基于目标用户的第一用户数据确定所述目标用户与各个情景主题的关联程度值；

根据各待推荐信息对应的第二用户数据，确定所述待推荐信息与所述情景主题的匹配程度值；

基于所述关联程度值以及所述匹配程度值，确定与所述目标用户匹配的待推荐信息，并将所述待推荐信息发送至所述目标用户。

根据本发明的第二方面，提供了一种信息推荐装置，包括：

关联程度确定模块，用于基于目标用户的第一用户数据确定所述目标用户与各个情景主题的关联程度值；

匹配程度确定模块，用于根据各待推荐信息对应的第二用户数据，确定所述待推荐信息与所述情景主题的匹配程度值；

推荐信息匹配模块，用于基于所述关联程度值以及所述匹配程度值，确定与所述目标用户匹配的待推荐信息，并将所述待推荐信息发送至所述目标用户。

根据本发明的第三方面，提供了一种电子设备，包括：

处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现前述的信息推荐方法。

根据本发明的第四方面，提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现本申请实施例公开的前述的信息推荐方法的步骤。

根据本发明的信息推荐方法，可以基于目标用户的第一用户数据确定所述目标用户与各个情景主题的关联程度值；根据各待推荐信息对应的第二用户数据，确定所述待推荐信息与所述情景主题的匹配程度值；基于所述关联程度值以及所述匹配程度值，确定与所述目标用户匹配的待推荐信息，并将所述待推荐信息发送至所述目标用户。由此解决了现有的信息推荐方法精准性和多样性存在不足，且对用户的吸引力较低的技术问题。取得了提高推荐信息的精准性、多样性以及用户吸引力的有益效果。

上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂，以下特举本发明的具体实施方式。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1示出了根据本发明一个实施例的一种信息推荐方法的步骤流程图；

图2示出了根据本发明一个实施例的一种信息推荐方法的步骤流程图；

图3示出了根据本发明一个实施例的一种信息推荐装置的结构示意图；以及

图4示出了根据本发明一个实施例的一种信息推荐装置的结构示意图。

图5示意性地示出了用于执行根据本申请的方法的计算处理设备的框图。

图6示意性地示出了用于保持或者携带实现根据本申请的方法的程序代码的存储单元。

具体实施例

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

实施例一

详细介绍本发明实施例提供的一种信息推荐方法。

参照图1，示出了本发明实施例中一种信息推荐方法的步骤流程图。

步骤110，基于目标用户的第一用户数据确定所述目标用户与各个情景主题的关联程度值。

在本发明实施例中，在向用户推荐信息时，为了提高推荐信息与相应用户所处情景的匹配程度，从而进一步提高推荐信息与相应用户之间的匹配精准性。针对需要进行信息推荐的目标用户，可以获取目标用户的第一用户数据，并且基于第一用户数据确定相应的目标用户针对各个情景主题的关联程度值。

其中的第一用户数据可以包括任何可以获取得到的与目标用户相关的数据。例如，用户画像数据、UGC(User Generated Content，用户原创内容)数据、PGC(Professionally-generated Content，专业生产内容)数据、OGC(Occupationally-generated Content，职业生产内容)数据，用户定位数据、当前的POI(Point of Interest，兴趣点)数据，等等。其中的POI数据又可以包括但不限于POI标签、POI的UGC内容、POI关联的文章，等等。在本发明实施例中，可以根据需求预先设置第一用户数据所包含的具体内容，而且在本发明实施例中，可以通过任何可用方法获取得到第一用户数据，对此本发明实施例均不加以限定。

其中的情景主题也可以根据需求通过任何可用方法进行预先定义，例如可以通过专家定义的方式设定情景主题，也可以通过大量的参考数据进行数据挖掘，从而挖掘出情景主题，等等。而且情景主题的表示方式可以包括一个情景主题由至少一个词进行表示，等等。

例如，可以设置某一情景主题为浪漫约会的情景主题，或者某一情景主题为聚餐的情景主题，等等。

而且，在本发明实施例中可以采用任何可用方法基于第一用户数据确定相应的目标用户对各个情景主题的关联程度，对此本发明实施例不加以限定。例如，可以基于第一用户数据与各个情景主题的匹配程度作为相应的目标用户与相应情景主题的关联程度值，等等。

步骤120，根据各待推荐信息对应的第二用户数据，确定所述待推荐信息与所述情景主题的匹配程度值。

在实际应用中，不同用户针对某一待推荐信息的第二用户数据可以在一定程度上表征相应的待推荐信息。例如，如果某一待推荐信息对应的第二用户数据中包含了多个用户选择该待推荐信息对应的地点作为约会地，那么则可以推知相应的待推荐信息与约会的情景主题的匹配程度较高。

因此在本发明实施例中，为了给目标用户推荐与其所处情景匹配度较高的待推荐信息，同样地可以根据各待推荐信息对应的第二用户数据，确定相应的待推荐信息与每个情景主题的匹配程度值。具体的可以通过任何可用方式基于待推荐信息对应的第二用户数据，确定所述待推荐信息与所述情景主题的匹配程度值，对此本发明实施例不加以限定。

而且，在本发明实施例中，待推荐信息可以为任何一种可以推荐给用户的信息，例如可以包括但不限于针对至少一个物品的推荐信息、针对至少一个场所的推荐信息、针对至少一个网页的推荐信息，等等。具体的待推荐信息可以根据需求进行设定，对此本发明实施例不加以限定。

另外，各推荐信息对应的第二用户数据可以包括针对相应的推荐信息进行购买、浏览、分享等操作的相关用户的第二用户数据。而且第二用户数据也可以包括但不限于前述的用户画像数据、UGC数据、PGC数据、OGC数据，用户定位数据、POI数据，等等。具体的第二用户数据所包含的数据类型可以根据需求进行预先设置，对此本发明实施例不加以限定。

步骤130，基于所述关联程度值以及所述匹配程度值，确定与所述目标用户匹配的待推荐信息，并将所述待推荐信息发送至所述目标用户。

如前述，上述的关联程度值可以表征目标用户与各个情景主题的相关程度，而匹配程度则可以表征各个待推荐信息与各情景主题的相关程度。在本方案的目的在于基于目标用户所处情景向目标用户推荐相应的信息。因此，则可以基于关联程度值以及匹配程度值，确定与目标用户匹配的待推荐信息，进而可以将相应的待推荐信息发送至相应的目标用户。

其中，基于关联程度值可以确定与目标用户对应的情景主题，而基于匹配程度值则可以确定与相应的情景主题匹配的待推荐信息，进而得到目标用户匹配的待推荐信息；或者在本发明实施例中，还可以直接基于关联程度值和匹配程度值，获取相应待推荐信息与目标用户的关联程度，进而基于关联程度从待推荐信息中选出与目标用户匹配的待推荐信息，等等。

而且，在本发明实施例中，可以通过任何可用方法将确定的待推荐信息发送至目标用户，对此本发明实施例不加以限定。

实施例二

详细介绍本发明实施例提供的一种信息推荐方法。

参照图2，示出了本发明实施例中一种信息推荐方法的步骤流程图。

步骤210，基于可参考用户的第三用户数据进行数据挖掘，提取出特定的情景主题。

在实际应用中，如果由用户自定义情景主题类型，那么由于不同用户的需求不同所定义的情景主题也会各不相同，而且对于同样的情景不同用户可能设定不同的情景主题，从而容易导致情景主题混乱，容易影响推荐信息的准确性。因此，在本发明实施例中，为了避免上述情况，可以预先统一定义不同的情景主题。具体的可以基于可参考用户的第三用户数据进行数据挖掘，提取出特定的情景主题。其中可参考用户的第三用户数据具体可以包括任何可以获取得到以进行情景主题挖掘的用户数据。例如，团购、外卖等平台上用户的用户数据，等等。

而且第三用户数据也可以包括但不限于前述的用户画像数据、UGC数据、PGC数据、OGC数据，用户定位数据、POI数据，等等。具体的第三用户数据所包含的数据类型可以根据需求进行预先设置，对此本发明实施例不加以限定。

而且，在本发明实施例中，基于可参考用户的第三用户数据，可以采用任何可用方法进行数据挖掘，从而提取出特定的情景主题，对此本发明实施例不加以限定。

可选地，在本发明实施例中，所述步骤210进一步可以包括：

子步骤211，对所述可参考用户的第三用户数据进行向量化处理，得到所述第三用户数据对应的多维词向量。

在本发明实施例中，为了方便从可参考用户的第三用户数据中挖掘出情景主题，可以对可参考用户的第三用户数据进行向量化处理，从而得到第三用户数据对应的多维词向量。具体的可以通过任何可用的向量处理方法对可参考用户的第三用户数据进行向量化处理，对此本发明实施例不加以限定。

例如，可以通过doc2vec模型对可参考用户的第三用户数据进行向量化处理，或者可以通过word2vec模型对可参考用户的第三用户数据进行向量化处理，等等。而且，word2vec模型又可以包括skip-gram模型、连续词袋(continuous bag-of-word，CBOW)模型，等等。

可选地，在本发明实施例中，所述子步骤211，进一步可以包括：

子步骤2111，对所述可参考用户的第三用户数据进行分词处理；

在实际应用中，为了将第三用户数据进行向量化处理，则可以对可参考用户的第三用户数据进行分词处理，具体的可以采用任何可用的分词处理方法对可参考用户的第三用户数据进行分词处理，对此本发明实施例不加以限定。

子步骤2112，去除分词处理后的第三用户数据中的无效词，并提取所述第三用户数据中的特征词，所述无效词包括停用词、高频词中的至少一种；

在实际应用中，用户数据中的部分词语对情景主题的确定并没有任何作用，可以定义此类词为无效词，因此在生成多维向量时也可以不用考虑无效词，那么对于经分词处理后的第三用户数据，则可以进一步去除其中的无效词，进而提取出特征词。其中的无效词可以包括但不限于停用词(Stop Words)、高频词，等等。

其中停用词的具体内容可以根据需求进行预设设置，对此本发明实施例不加以限定。例如可以参照现有的如哈工大停用词表、百度停用词表等停用词表设置停用词，等等。而且，在本发明实施例中，针对具体业务，可以按业务需要，专门整理对业务无帮助或无意义的词。甚至停用词中可以包括停用“句”，如针对电商的“此用户没有发表评论。”也可以设置为停用词。

对于经分词处理后得到的各个分词，在去除其中的无效词之后，则可以将剩下的分词直接作为特征词；或者，也可以进一步对去除无效词后的得到的各个分词进行进一步过滤，进而得到特征词，具体的过滤策略可以根据需求进行预先设置，对此本发明实施例不加以限定。

而且，高频词所对应的词频范围也可以根据需求进行预先设置，对此本发明实施例也不加以限定。

子步骤2113，基于所述特征词构建所述第三用户数据的多维词向量。

在提取出特征词之后，则可以基于特征词构建得到可参考用户的第三用户数据的多维词向量。

其中采用不同的向量化模型，得到的多维词向量的形式可以有所不同。例如，多维词向量可以为one-hot编码形式，或者是TF-IDF(term frequency-inverse document frequency，词频-逆文档频率)形式，等等。具体的可以根据需求进行预先设置，对此本发明实施例不加以限定。

子步骤212，基于所述多维词向量，通过主题模型得到所述情景主题。

在得到多维词向量之后，则可以基于多维词向量，通过主题模型挖掘得到情景主题。其中的主题模型具体的可以为任意一种可用的主题模型，例如LDA(Latent Dirichlet Allocation，文档主题生成模型)主题模型、Sentence LDA主题模型、Copula LDA主题模型，等等。

步骤220，根据预设的情景判断条件，定义特定的情境主题。

另外，在本发明实施例中，为了避免数据挖掘得到的情景主题类型不够全面，或者是不够准确，还可以根据预设的情景判断条件，定义特定的情景主题。其中的情景判断条件则可以根据需求进行预先设置，对此本发明实施例不加以限定。例如，可以考虑用户的实际意图及场景，设置不同的情景判断条件，并且定义浪漫约会的情境，定义聚餐情境，等等。

需要说明的是，在本发明实施例中，可以基于步骤210和/或步骤220获取得到情景主题，对此本发明实施例不加以限定。

可选地，在本发明实施例中，所述情景主题由情景主题词，和/或在所述情景主题词类别下的主题相关词所表征。

在本发明实施例中，为了准确表征各个情景主题，可以设置每个情景主题由至少一个情景主题词，和/或在相应的情景主题词类别下的至少一个主题相关词所表征。

例如，对于某一情景主题，其情景主题词可以为“约会”，而在该情景主题词类别下类包含“浪漫”、“烛光晚餐”、“鲜花”，等等主题相关词。

步骤230，根据所述目标用户的每条第一用户数据中包含的情景相关词在各个情景主题词下的概率，获取所述第一用户数据针对每个情景主题词的特征值。

在本发明实施例中，以LDA模型为例，将上述的多维词向量输入LDA模型，进而可以得到word-topic矩阵，其中的word则可以理解为本发明实施例中的主题相关词，而topic则可以理解为本发明中的情景主题词。另外，基于上述的主题模型还可以得到各个情景相关词在相应的情景主题词下的概率。

那么在本发明实施例中，为了得到目标用户对某一情景主题的关联程度值，而且由于目标用户可能对应至少一条第一用户数据，而且同一用户对应的不同第一用户数据具体所包含的内容也可以有所不同，因此在本发明实施例中，可以目标用户的每条第一用户数据为单位，分别根据每条第一用户数据中包含的情景相关词在各个情景主题词下的概率，从而获取相应每条第一用户数据针对各个情景主题词的特征值。

其中，某一第一用户数据针对某一情景主题词的特征值，与相应的第一用户数据所包含的情景相关词在相应的情景主题词下的概率之间的对应关系可以根据需求进行预设设置，对此本发明实施例不加以限定。

可选地，在本发明实施例中，所述步骤230进一步可以包括：

子步骤231，针对每条第一用户数据，提取所述第一用户数据中的主题相关词；

同样地，由于第一用户数据中包含的内容比较多，而且其中可能存在至少一个主题相关词，另外还可以包括其他无关词，那么在本发明实施例中，为了确定每条第一用户数据对应的情景主题词的特征值，可以先针对每条第一用户数据，提取其中的主题相关词。

而且，在本发明实施例中，为了提高提取主题相关词的效率以及准确性，也可以对每条第一用户数据进行预处理。其中的预处理可以包括分词处理、去除无效词处理，等等。其中的无效词也可以包括上述的高频词和停用词，等等。

子步骤232，针对每个情景主题词，对所述主题相关词在所述情景主题词下的概率进行求和，得到所述第一用户数据针对所述情景主题词的特征值。

在获取得到第一用户数据中包含的情景相关词之后，为了确定第一用户数据对应在每个情景主题下的特征值，则可以针对每个情景主题词，对从相应的第一用户数据中提取出的主题相关词在相应的情景主题词下的概率进行求和，得到相应的第一用户数据针对相应情景主题词的特征值。

而且，在本发明实施例中，在从第一用户数据中提取出情景相关词之后，则可以得知提取出的各个情景相关词对应的情景主题词，进而可以得到相应的第一用户数据对应的情景主题词。而如果某一第一用户数据中不包含某一情景主题词下的全部情景相关词，那么则说明该第一用户数据针对该情景主题词的特征值为零。因此，在本发明实施例中，可以只针对相应的第一用户数据对应的每个情景主题词，对提取出的对应相应情景主题词的主题相关词在相应情景主题词下的概率进行求和，得到相应第一用户数据针对相应情景主题词的特征值。

假设，F _uik表示目标用户u对信息i的第一用户数据a的针对情景主题词k的特征值，那么特征值可以按照下面的方式进行计算：

其中，n是从第一用户数据a中提取出的属于情景主题词k分类下的情境相关词的个数；f _uikt表示的是情境相关词t在情景主题词k下的概率，而如果情景主题词k下不包含情境相关词t，那么f _uikt可以为0。

步骤240，基于所述第一用户数据在各个情景主题词下的特征值，获取所述目标用户对所述情景主题词所表征的情景主题的关联程度值。

在本发明实施例中，在确定目标用户的每条第一用户数据在各个情景主题词下的特征值之后，则可以进一步基于目标用户全部的第一用户数据在各个情景主题词下的特征值，获取相应的目标用户对各个情景主题的关联程度值。

其中，特征值与关联程度值之间的对应关系可以根据需求进行预先设置，对此本发明实施例不加以限定。

例如，可以设置目标用户针对某一情景主题的关联程度值，为该目标用户的每条第一用户数据针对相应情景主题的情景主题词的特征值平均值；或者可以设置目标用户针对某一情景主题的关联程度值，为该目标用户的每条第一用户数据针对相应情景主题的情景主题词的特征值的加权平均值，其中的权重则可以根据需求进行预先设置，等等。

可选地，在本发明实施例中，所述步骤240进一步可以包括:

子步骤241，针对每个情景主题词，获取所述目标用户的全部第一用户数据针对所述情景主题词的特征值和值；

如前述，而且目标用户的每条第一用户数据都可以在一定程度上表征其当前所处环境，因此在本发明实施例中，为了确定目标用户当前对每个情景主题的关联程度，可以针对每个情景主题词，分别获取目标用户的全部第一用户数据针对所述情景主题词的特征值和值。

例如，对于情景主题词k，假设第一用户数据1对该情景主题词k的特征值为n1，第一用户数据2对情景主题词k的特征值为n2，第一用户数据3对情景主题词k的特征值为n3。此时，可以得到目标用户的全部第一用户数据针对情景主题词k的特征值和值为n1+n2+n3。

需要说明的是，其中的全部第一用户数据可以是可以获取得到的目标用户的全部第一用户数据，也可以是根据预设的第一用户数据获取条件获取得到的全部第一用户数据，等等。其中的第一用户数据获取条件则可以根据需求进行预先设置，对此本发明实施例不加以限定。例如，可以设置第一用户数据获取条件为获取发布时间到当前时间时间的时间差在预设时间差范围内的第一用户数据，或者获取针对预设信息类型的第一用户数据，等等。

子步骤242，获取所述特征值和值与所述全部第一用户数据的数量的比值，得到所述目标用户针对所述情景主题词所表征的情景主题的关联程度值。

为了综合考虑各个第一用户数据对目标用户所处情景的表征作用，在本发明实施例中，可以每个第一用户数据针对同一情景主题词的特征值平均值作为其对相应情景主题的关联程度值，那么此时则可以获取针对某一情景主题词的特征值和值与所述全部第一用户数据的数量的比值，得到所述目标用户针对所述情景主题词所表征的情景主题的关联程度值。

例如，对于上述的情景主题词k，目标用户的全部第一用户数据针对情景主题词k的特征值和值为n1+n2+n3，而且此时的全部第一用户数据具体包括三条第一用户数据，那么可以得到目标用户针对情景主题词k所表征的情景主题的关联程度为(n1+n2+n3)/3。

可选地，在本发明实施例中，所述关联程度值包括短期关联程度值和/或长期关联程度值的加权求和；其中，所述短期关联程度值的权值大于长期关联程度值的权值。

另外在实际应用中，用户可能只在一段时间内对某一情景比较感兴趣，也可能长期对某些情景感兴趣，因此按照时效性用户的兴趣可以分为短期性趣和长期关联程度值，那么相应的目标用户对各个情景主题的关联程度值也可以包含了短期关联程度值和/或长期关联程度值的加权求和，其中短期关联程度值和长期关联程度值的权值都可以根据需求进行预先设置，对此本发明实施例不加以限定。但是在实际应用中一般短期兴趣更能表征目标用户当前的兴趣所在，因此可以设置所述短期关联程度值的权值大于长期关联程度值的权值，而且还可以设置短期关联程度值的权值与长期关联程度值的权值之和为1。

那么此时目标用户u针对某一情景主题的关联程度值可以表示为：

式中的

表示目标用户针对相应情景主题的短期关联程度值，

目标用户针对相应情景主题的长期关联程度值。其中α与β分别为短期关联程度值和长期关联程度值的权值。

其中，短期关联程度值可以为考虑预设的一段短期时间内目标用户的第一用户数据所对应的关联程度值，通常为较为短时间的动态兴趣，而长期兴趣则可以为至少一个预设较长的历史时间段内兴趣，主要根据用户属性及长期的偏好确定的值，例如用户是新生儿母亲，长期会对亲子类目有潜在兴趣。具体的长期兴趣对应的用户属性的类型，以及每个预设较短历史时间段的短期关联程度值都可以根据需求进行预先设置，对此本发明实施例不加以限定。

例如，可以设置短期关联程度值为当前时间之前的预设时间段内目标用户的第一用户数据所对应的关联程度值，可以根据用户当前小时、当天或者其他较短时间内的兴趣程度，而长期兴趣则可以为用户的基础属性设置的兴趣，例如年轻女性对于美妆的偏好，或者年轻男性对于运动健身的偏好等等，或者可以当前用户在重复的点击浏览火锅商户，我们也可以判断用户潜在对火锅品类感兴趣。或者也可以直接设置所述长期关联程度值是至少一个预设历史时间段内的短期关联程度值的和值。

步骤250，针对每个待推荐信息，获取每个可参考用户针对所述待推荐信息的每条第二用户数据。

在本发明实施例中，在确定目标用户对各个情景主题的关联程度值之后，为了向目标用户推荐适用的待推荐信息，还需要确定各个待推荐信息与每个情景主题的匹配程度值。具体的则可以参考某一待推荐信息所对应的第二用户数据从而确定该待推荐信息与各个情景主题的匹配程度，因此首先，针对每个待推荐信息，可以获取每个可参考用户针对该待推荐信息的每条第二用户数据。其中的可参考用户也即上述的全部第二用户数据所对应的可参考用户。

例如，对于待推荐信息i，假设可参考用户u1针对待推荐信息i的第二用户数据是s1，可参考用户u2针对待推荐信息i的第二用户数据是s2，那么针对待推荐信息i，则可以获取上述的第二用户数据s1和s2。

步骤260，针对每个情景主题词，根据所述第二用户数据针对所述情景主题词的特征值，以及所述待推荐信息对应的第二用户数据的数量，获取所述待推荐信息对所述情景主题词所表征的情景主题的匹配程度值。

其中，匹配程度值与特征值和用户数据数量之前的对应关系可以根据需求进行预先设置，对此本发明实施例不加以限定。例如，可以设置某一待推荐信息对某一情景主题词所表征的情景主题的匹配程度值为相应待推荐信息所对应的全部第二用户数据针对相应情景主题词的特征值和值，与相应待推荐信息对应的全部第二用户数据的数量的比值。

例如，假设针对情景主题词k，针对待推荐信息i的第二用户数据s1对该情景主题词的特征值为f _uik，那么此时待推荐信息i对情景主题词k所表征的情景主题的匹配程度值为：

T _ik＝∑ _uf _uik/|C _i|

其中，∑ _uf _uik示待推荐信息i所对应的全部第二用户数据针对相应情景主题词k的特征值和值，|C _i|表示待推荐信息i对应的全部第二用户数据的数量。

另外，需要说明的是，在本发明实施例中，也可以预先确定各个待推荐信息与各个情景主题的匹配程度，而且由于第二用户数据会不断更新，那么也可以预设时间段为时间间隔，周期性地获取以当前可参考用户的第二用户数据重新确定各个待推荐信息与各个情景主题的匹配程度。

而且，如果当前已经确定目标用户对各个情景主题的关联程度值，那么此时还可以选取关联程度值最高的M个情景主题，进而可以只获取各待推荐信息与该M个情景主题的匹配程度即可，而无需获取各待推荐信息与每个情景主题的匹配程度。

步骤270，对所述关联程度值和所述匹配程度值进行归一化处理。

另外，在本发明实施例中，为了统一对物品情境相关信息的关联程度，可以将关联程度值和所述匹配程度值进行归一化处理。具体的归一化处理方法可以根据需求进行预先设置，对此本发明实施例不加以限定。

步骤280，基于所述关联程度值以及所述匹配程度值，获取所述目标用户与所述待推荐信息之间的相似度。

在得到目标用户对各个情景主题的关联程度值，以及各个待推荐信息与各个情景主题的匹配程度值之后，则可以进一步从待推荐信息中筛选出目标用户感兴趣的待推荐信息。此时，可以进一步基于关联程度值以及所述匹配程度值，获取所述目标用户与每个待推荐信息之间的相似度。具体的可以通过任何可用的相似度确定方法获取目标用户与各个待推荐信息之间的相似度，对此本发明实施例不加以限定。例如，欧几里得距离(Eucledian Distance)相似度、曼哈顿距离(Manhattan Distance)相似度、明可夫斯基距离(Minkowski distance)相似度、余弦相似度(Cosine Similarity)，等等。

可选地，在本发明实施例中，所述相似度包括余弦相似度。

如果相似度为余弦相似度，那么目标用户u与待推荐信息i之前的相似度为：

Cos(I _u,T _i)＝|I _u·T _i|/||I _u||||T _i||

式中I _u目标用户的兴趣程度向量，I _u＝[I _u1,I _u2,I _u3,...,I _uk]，T _i表示物品i的匹配程度向量，T _i＝[T _i1,T _i2,T _i3,...,T _ik]，k∈[1，K]，其中I _uk表示目标用户u对第k个情景主题的关联程度值，T _ik表示待推荐信息对第k个情景主题的匹配程度值，K表示情景主题的总数量。

步骤290，选择与所述目标用户相似度最高的预设数量的待推荐信息作为所述目标用户的推荐信息，并将所述推荐信息发送至所述目标用户。

在确定目标用户与各个待推荐信息之间的相似度之后，则可以选择与所述目标用户相似度最高的预设数量的待推荐信息作为所述目标用户的推荐信息，并将所述推荐信息发送至所述目标用户。其中的预设数量也可以根据需求进行预先设置，对此本发明实施例不加以限定。

可选地，在本发明实施例中，所述用户数据包括用户原创内容数据、用户画像数据中的至少一种。

步骤2110，根据所述关联程度值确定与所述目标用户匹配的目标情景主题。

步骤2120，根据所述目标情景主题，展示所述待推荐信息。

可选地，在本发明实施例中，所述步骤2120进一步可以包括：根据所述目标情景主题，展示所述待推荐信息中与所述目标情景主题相关的推荐信息，所述推荐信息包括推荐理由、图片信息、视频信息、文字信息中的至少一种。

另外，在本发明实施例中，还可以根据目标用户所处的情景，个性化展示相应的待推荐信息，具体的可以根据前述确定的关联程度值确定与目标用户匹配的目标情景主题，进而可以根据目标情景主题展示选择得到的待推荐信息。具体的可以优先展示待推荐信息与目标情景主题相关的部分，或者如果目标用户当前所处情景为无线网络环境，那么此时则可以通过动画或者高清图片等方式展示选定的待推荐信息，而如果目标用户当前所处情景为户外环境，那么此时则可以通过语音方式展示选定的推荐信息，等等。

优选地，可以展示选定的待推荐信息中与所述目标情景主题相关的推荐信息，所述推荐信息可以包括但不限于与所述目标情景主题匹配的推荐理由、图片信息、视频信息、文字信息中的至少一种。

而且，在本发明实施例中，还可以基于可参考用户的第三用户数据进行数据挖掘，提取出特定的情景主题；和/或，根据预设的情景判断条件，定义特定的情境主题。并且，对所述可参考用户的第三用户数据进行向量化处理，得到所述第三用户数据对应的多维词向量；基于所述多维词向量，通过主题模型得到所述情景主题。从而可以提高情景主题的全面性和准确性，进而提高推荐信息的精确性和用户吸引力。

另外，在本发明实施例中，所述情景主题由情景主题词，和/或在所述情景主题词类别下的主题相关词所表征。而且还可以根据所述目标用户的每条第一用户数据中包含的情景相关词在各个情景主题词下的概率，获取所述第一用户数据针对每个情景主题词的特征值；基于所述第一用户数据在各个情景主题词下的特征值，获取所述目标用户对所述情景主题词所表征的情景主题的关联程度值。进而，针对每条第一用户数据，提取所述第一用户数据中的主题相关词；针对每个情景主题词，对所述主题相关词在所述情景主题词下的概率进行求和，得到所述第一用户数据针对所述情景主题词的特征值。针对每个情景主题词，获取所述目标用户的全部第一用户数据针对所述情景主题词的特征值和值；获取所述特征值和值与所述全部第一用户数据的数量的比值，得到所述目标用户针对所述情景主题词所表征的情景主题的关联程度值。并且，针对每个待推荐信息，获取每个可参考用户针对所述待推荐信息的每条第二用户数据；针对每个情景主题词，根据所述第二用户数据针对所述情景主题词的特征值，以及所述待推荐信息对应的第二用户数据的数量，获取所述待推荐信息对所述情景主题词所表征的情景主题的匹配程度值。基于所述关联程度值以及所述匹配程度值，获取所述目标用户与所述待推荐信息之间的相似度；选择与所述目标用户相似度最高的预设数量的待推荐信息作为所述目标用户的推荐信息，并将所述推荐信息发送至所述目标用户。从而可以进一步提高得到推荐信息的效率以及精确性。

进一步地，在本发明实施例中，还可以根据所述关联程度值确定与所述目标用户匹配的目标情景主题；根据所述目标情景主题，展示所述待推荐信息。根据所述目标情景主题，展示所述待推荐信息中与所述目标情景主题相关的推荐信息；所述推荐信息包括推荐理由、图片信息、视频信息、文字信息中的至少一种。从而实现对待推荐信息的个性化展示，进一步提高推荐信息的用户吸引力。

对于方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本发明实施例并不受所描述的动作顺序的限制，因为依据本发明实施例，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作并不一定是本发明实施例所必须的。

实施例三

详细介绍本发明实施例提供的一种信息推荐装置。

参照图3，示出了本发明实施例中一种信息推荐装置的结构示意图。

关联程度确定模块310，用于基于目标用户的第一用户数据确定所述目标用户与各个情景主题的关联程度值。

匹配程度确定模块320，用于根据各待推荐信息对应的第二用户数据，确定所述待推荐信息与所述情景主题的匹配程度值。

推荐信息匹配模块330，用于基于所述关联程度值以及所述匹配程度值，确定与所述目标用户匹配的待推荐信息，并将所述待推荐信息发送至所述目标用户。

实施例四

详细介绍本发明实施例提供的一种信息推荐装置。

参照图4，示出了本发明实施例中一种信息推荐装置的结构示意图。

情景主题挖掘模块410，用于基于可参考用户的第三用户数据进行数据挖掘，提取出特定的情景主题。

可选地，在本发明实施例中，所述情景主题挖掘模块410，进一步可以包括：

向量化处理子模块，用于对所述可参考用户的第三用户数据进行向量化处理，得到所述第三用户数据对应的多维词向量；

情景主题挖掘子模块，用于基于所述多维词向量，通过主题模型得到所述情景主题。

可选地，在本发明实施例中，所述向量化处理子模块，包括：

分词处理单元，用于对所述可参考用户的第三用户数据进行分词处理；

特征词提取单元，用于去除分词处理后的第三用户数据中的无效词，并提取所述第三用户数据中的特征词，所述无效词包括停用词、高频词中的至少一种；

多维词向量构建单元，用于基于所述特征词构建所述第三用户数据的多维词向量。

情景主题定义模块420，用于根据预设的情景判断条件，定义特定的情境主题。

可选地，在本发明实施例中，所述所述情景主题由情景主题词，和/或在所述情景主题词类别下的主题相关词所表征。

关联程度确定模块430，用于基于目标用户的第一用户数据确定所述目标用户与各个情景主题的关联程度值。

其中，所述关联程度确定模块430，进一步可以包括：

特征值获取子模块431，用于根据所述目标用户的每条第一用户数据中包含的情景相关词在各个情景主题词下的概率，获取所述第一用户数据针对每个情景主题词的特征值；

关联程度确定子模块432，用于基于所述第一用户数据在各个情景主题词下的特征值，获取所述目标用户对所述情景主题词所表征的情景主题的关联程度值。

可选地，在本发明实施例中，所述特征值获取子模块431，进一步可以包括：

主题相关词提取单元，用于针对每条第一用户数据，提取所述第一用户数据中的主题相关词；

特征值获取单元，用于针对每个情景主题词，对所述主题相关词在所述情景主题词下的概率进行求和，得到所述第一用户数据针对所述情景主题词的特征值。

可选地，在本发明实施例中，所述关联程度确定子模块432，进一步可以包括：

特征值求和单元，用于针对每个情景主题词，获取所述目标用户的全部第一用户数据针对所述情景主题词的特征值和值；

关联程度确定单元，用于获取所述特征值和值与所述全部第一用户数据的数量的比值，得到所述目标用户针对所述情景主题词所表征的情景主题的关联程度值。

匹配程度确定模块440，用于根据各待推荐信息对应的第二用户数据，确定所述待推荐信息与所述情景主题的匹配程度值。

其中，在本发明实施例中，所述匹配程度确定模块440，进一步可以包括：

用户数据获取子模块441，用于针对每个待推荐信息，获取每个可参考用户针对所述待推荐信息的每条第二用户数据；

匹配程度确定子模块442，用于针对每个情景主题词，根据所述第二用户数据针对所述情景主题词的特征值，以及所述待推荐信息对应的第二用户数据的数量，获取所述待推荐信息对所述情景主题词所表征的情景主题的匹配程度值。

推荐信息匹配模块450，用于基于所述关联程度值以及所述匹配程度值，确定与所述目标用户匹配的待推荐信息，并将所述待推荐信息发送至所述目标用户。

其中，在本发明实施例中，所述推荐信息匹配模块450，进一步可以包括：

归一化处理子模块451，用于对所述关联程度值和所述匹配程度值进行归一化处理；

相似度确定子模块452，用于基于所述关联程度值以及所述匹配程度值，获取所述目标用户与所述待推荐信息之间的相似度；

推荐信息匹配子模块453，用于选择与所述目标用户相似度最高的预设数量的待推荐信息作为所述目标用户的推荐信息，并将所述推荐信息发送至所述目标用户。

可选地，在本发明实施例中，所述相似度包括余弦相似度。

目标情景主题确定模块460，用于根据所述关联程度值确定与所述目标用户匹配的目标情景主题。

推荐信息展示模块470，用于根据所述目标情景主题，展示所述待推荐信息。

可选地，在本发明实施例中，所述推荐信息展示模块，进一步可以包括：

推荐信息展示子模块，用于根据所述目标情景主题，展示所述待推荐信息中与所述目标情景主题相关的推荐信息；所述推荐信息包括推荐理由、图片信息、视频信息、文字信息中的至少一种。

本发明实施例中还公开了一种电子设备，包括：

本发明实施例中还公开了一种可读存储介质，当所述存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行前述的信息推荐方法。

对于装置实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

在此提供的算法和显示不与任何特定计算机、虚拟***或者其它设备固有相关。各种通用***也可以与基于在此的示教一起使用。根据上面的描述，构造这类***所要求的结构是显而易见的。此外，本发明也不针对任何特定编程语言。应当明白，可以利用各种编程语言实现在此描述的本发明的内容，并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。

在此处所提供的说明书中，说明了大量具体细节。然而，能够理解，本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中，并未详细示出公知的方法、结构和技术，以便不模糊对本说明书的理解。

类似地，应当理解，为了精简本公开并帮助理解各个发明方面中的一个或多个，在上面对本发明的示例性实施例的描述中，本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而，并不应将该公开的方法解释成反映如下意图：即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说，如下面的权利要求书所反映的那样，发明方面在于少于前面公开的单个实施例的所有特征。因此，遵循具体实施方式的权利要求书由此明确地并入该具体实施方式，其中每个权利要求本身都作为本发明的单独实施例。

本领域那些技术人员可以理解，可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件，以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外，可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述，本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外，本领域的技术人员能够理解，尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征，但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如，在下面的权利要求书中，所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

本发明的各个部件实施例可以以硬件实现，或者以在一个或者多个处理器上运行的软件模块实现，或者以它们的组合实现。本领域的技术人员应当理解，可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的信息推荐设备中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如，计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上，或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到，或者在载体信号上提供，或者以任何其他形式提供。

例如，图5出了可以实现根据本申请的方法的计算处理设备。该计算处理设备传统上包括处理器1010和以存储器1020形式的计算机程序产品或者计算机可读介质。存储器1020可以是诸如闪存、EEPROM(电可擦除可编程只读存储器)、EPROM、硬盘或者ROM之类的电子存储器。存储器1020具有用于执行上述方法中的任何方法步骤的程序代码1031的存储空间1030。例如，用于程序代码的存储空间1030可以包括分别用于实现上面的方法中的各种步骤的各个程序代码1031。这些程序代码可以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。这些计算机程序产品包括诸如硬盘，紧致盘(CD)、存储卡或者软盘之类的程序代码载体。这样的计算机程序产品通常为如参考图6述的便携式或者固定存储单元。该存储单元可以具有与图5计算处理设备中的存储器1020类似布置的存储段、存储空间等。程序代码可以例如以适当形式进行压缩。通常，存储单元包括计算机可读代码1031’，即可以由例如诸如1010之类的处理器读取的代码，这些代码当由计算处理设备运行时，导致该计算处理设备执行上面所描述的方法中的各个步骤。

应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制，并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中，不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中，这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

Claims

一种信息推荐方法，其特征在于，包括：

基于目标用户的第一用户数据确定所述目标用户与各个情景主题的关联程度值；

根据各待推荐信息对应的第二用户数据，确定所述待推荐信息与所述情景主题的匹配程度值；

基于所述关联程度值以及所述匹配程度值，确定与所述目标用户匹配的待推荐信息。
根据权利要求1所述的方法，其特征在于，在所述基于目标用户的第一用户数据确定所述目标用户与各个情景主题的关联程度值的步骤之前，还包括：

基于可参考用户的第三用户数据进行数据挖掘，提取出特定的情景主题；

和/或，根据预设的情景判断条件，定义特定的情境主题。
根据权利要求2所述的方法，其特征在于，所述基于可参考用户的第三用户数据进行数据挖掘，提取出特定的情景主题的步骤，包括：

对所述可参考用户的第三用户数据进行向量化处理，得到所述第三用户数据对应的多维词向量；

基于所述多维词向量，通过主题模型得到所述情景主题。
根据权利要求3所述的方法，其特征在于，所述对所述可参考用户的第三用户数据进行向量化处理，得到所述第三用户数据对应的多维词向量的步骤，包括：

对所述可参考用户的第三用户数据进行分词处理；

去除分词处理后的第三用户数据中的无效词，并提取所述第三用户数据中的特征词，所述无效词包括停用词、高频词中的至少一种；

基于所述特征词构建所述第三用户数据的多维词向量。
根据权利要求1-3任一项所述的方法，其特征在于，所述情景主题由情景主题词，和/或在所述情景主题词类别下的主题相关词所表征。
根据权利要求5所述的方法，其特征在于，所述基于目标用户的第一用户数据确定所述目标用户与各个情景主题的关联程度值的步骤，包括：

根据所述目标用户的每条第一用户数据中包含的情景相关词在各个情景主题词下的概率，获取所述第一用户数据针对每个情景主题词的特征值；

基于所述第一用户数据在各个情景主题词下的特征值，获取所述目标用户对所述情景主题词所表征的情景主题的关联程度值。
根据权利要求6所述的方法，其特征在于，所述根据所述目标用户的每条第一用户数据中包含的情景相关词在各个情景主题词下的概率，获取所述第一用户数据针对每个情景主题词的特征值的步骤，包括：

针对每条第一用户数据，提取所述第一用户数据中的主题相关词；

针对每个情景主题词，对所述主题相关词在所述情景主题词下的概率进行求和，得到所述第一用户数据针对所述情景主题词的特征值。
根据权利要求6所述的方法，其特征在于，所述基于所述第一用户数据在各个情景主题词下的特征值，获取所述目标用户对所述情景主题词所表征的情景主题的关联程度值的步骤，包括：

针对每个情景主题词，获取所述目标用户的全部第一用户数据针对所述情景主题词的特征值和值；

获取所述特征值和值与所述全部第一用户数据的数量的比值，得到所述目标用户针对所述情景主题词所表征的情景主题的关联程度值。
根据权利要求6或8所述的方法，其特征在于，所述关联程度值包括短期关联程度值和/或长期关联程度值的加权求和；其中，所述短期关联程度值的权值大于长期关联程度值的权值。
根据权利要求5所述的方法，其特征在于，所述根据各待推荐信息对应的第二用户数据，确定所述待推荐信息与所述情景主题的匹配程度值的步骤，包括：

针对每个待推荐信息，获取每个可参考用户针对所述待推荐信息的每条第二用户数据；

针对每个情景主题词，根据所述第二用户数据针对所述情景主题词的特征值，以及所述待推荐信息对应的第二用户数据的数量，获取所述待推荐信息对所述情景主题词所表征的情景主题的匹配程度值。
根据权利要求1所述的方法，其特征在于，所述基于所述关联程度值以及所述匹配程度值，确定与所述目标用户匹配的待推荐信息，并将所述待推荐信息发送至所述目标用户的步骤，包括：

基于所述关联程度值以及所述匹配程度值，获取所述目标用户与所述待推荐信息之间的相似度；

选择与所述目标用户相似度最高的预设数量的待推荐信息作为所述目标用户的推荐信息，并将所述推荐信息发送至所述目标用户。
根据权利要求11所述的方法，在所述基于所述关联程度值以及所述匹配程度值，获取所述目标用户与所述待推荐信息之间的相似度的步骤之前，还包括：

对所述关联程度值和所述匹配程度值进行归一化处理。
根据权利要求1所述的方法，其特征在于，在所述基于所述关联程度值以及所述匹配程度值，确定与所述目标用户匹配的待推荐信息，并将所述待推荐信息发送至所述目标用户的步骤之后，还包括：

根据所述关联程度值确定与所述目标用户匹配的目标情景主题；

根据所述目标情景主题，展示所述待推荐信息。
根据权利要求13所述的方法，其特征在于，所述根据所述目标情景主题，展示所述待推荐信息的步骤，包括：

根据所述目标情景主题，展示所述待推荐信息中与所述目标情景主题相关的推荐信息，所述推荐信息包括推荐理由、图片信息、视频信息、文字信息中的至少一种。
一种信息推荐装置，其特征在于，包括：

关联程度确定模块，用于基于目标用户的第一用户数据确定所述目标用户与各个情景主题的关联程度值；

匹配程度确定模块，用于根据各待推荐信息对应的第二用户数据，确定所述待推荐信息与所述情景主题的匹配程度值；

推荐信息匹配模块，用于基于所述关联程度值以及所述匹配程度值，确定与所述目标用户匹配的待推荐信息，并将所述待推荐信息发送至所述目标用户。
一种电子设备，其特征在于，包括：

处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1-14中的任一项所述的信息推荐方法。
一种计算机可读存储介质，其特征在于，其上存储有计算机程序，该程序被处理器执行时实现如权利要求1-14中的任一项所述的信息推荐方法的步骤。