CN113988060A

CN113988060A - 数据信息推荐方法、装置、终端设备和存储介质

Info

Publication number: CN113988060A
Application number: CN202111012365.2A
Authority: CN
Inventors: 余亚玲; 任祥辉; 刘彬彬
Original assignee: CETC 15 Research Institute
Current assignee: CETC 15 Research Institute
Priority date: 2021-08-31
Filing date: 2021-08-31
Publication date: 2022-01-28

Abstract

本发明涉及一种数据信息推荐方法、装置、终端设备和存储介质，通过响应于用户输入的目标需求信息，获取目标需求信息中包括的不同类型的数据内容；根据不同类型对应的目标数据内容，确定初始特征模型；获取用户的隐式行为信息，并根据用户的隐式行为信息，确定用户行为模型；根据初始特征模型和用户行为模型，确定用户兴趣模型；根据目标数据内容和用户兴趣模型，确定推荐数据信息集合；根据D‑S证据理论和推荐数据信息集合，确定目标数据信息，并将目标数据信息推荐给用户，结合目标数据内容的特征向量，采用初始特征模型挖掘用户显性需求，解决冷启动问题；同时利用用户行为特征挖掘用户隐性需求，解决概念漂移问题。

Description

数据信息推荐方法、装置、终端设备和存储介质

技术领域

本发明涉及计算机技术领域，尤其涉及一种数据信息推荐方法、装置、终端设备和存储介质。

背景技术

在合适的条件下，将合适的消息推荐给合适的用户，则需要用到推荐技术，而推荐技术的核心是推荐算法，现有技术中通常采用的推荐算法中只能从单一方向进行推荐，但是随着用户数量的不断增加和项目规模的不断扩大，采用单一方向的推荐算法已经无法解决面临的问题，会出现冷启动和概念漂移问题。

发明内容

本发明意在提供一种数据信息推荐方法、装置、终端设备和存储介质，以解决现有技术中存在的不足，本发明要解决的技术问题通过以下技术方案来实现。

第一个方面，本发明实施例提供一种数据信息推荐方法，所述方法包括：

响应于用户输入的目标需求信息，获取所述目标需求信息中包括的不同类型的数据内容，所述不同类型至少包括方向维度、目标维度和区域维度；

根据所述不同类型对应的目标数据内容，确定初始特征模型；其中，所述初始特征模型是根据是不同类型的目标数据内容和不同类型对应的权重值确定的；

获取用户的隐式行为信息，并根据所述用户的隐式行为信息，确定用户行为模型；

根据所述初始特征模型和所述用户行为模型，确定用户兴趣模型；

根据所述目标数据内容和所述用户兴趣模型，确定推荐数据信息集合；

根据D-S证据理论和所述推荐数据信息集合，确定目标数据信息，并将所述目标数据信息推荐给用户。

可选地，响应于用户输入的目标需求信息，获取所述目标需求信息中包括的不同类型的数据内容，包括：

响应于用户输入的目标需求信息，从预先建立的数据内容数据库中获取与所述不同类型对应的目标数据内容，所述目标数据内容为富文本性质的数据内容；

根据TF-IDF算法确定所述目标数据内容中的关键词和所述关键词的维度；

根据Python Gensim主题模型和所述关键词，确定与所述关键词对应的关键词特征向量；

将所述目标数据内容中的关键词特征向量确定为资料数据向量模型。

可选地，所述根据所述不同类型对应的目标数据内容，确定初始特征模型，包括：

根据所述方向维度的目标数据内容对应的特征向量和方向兴趣度权重，确定方向维度上的初始特征模型；

根据所述目标维度的目标数据内容对应的特征向量和目标兴趣度权重，确定目标维度上的初始特征模型；

根据所述区域维度的目标数据内容对应的特征向量和区域兴趣度权重，确定区域维度上的初始特征模型。

可选地，所述隐式行为信息至少包括浏览、评论、收藏、分享、下载中的一种或多种；

所述根据所述初始特征模型和所述用户行为模型，确定用户兴趣模型，包括：

根据所述用户行为模型对所述初始特征模型进行修正，得到所述用户兴趣模型。

可选地，所述用户兴趣模型包括方向维度的用户兴趣模型、目标维度的用户兴趣模型和区域维度的用户兴趣模型，所述根据所述目标数据内容和所述用户兴趣模型，确定推荐数据信息集合，包括：

计算所述方向维度的用户兴趣模型与资料数据向量模型的第一余弦相似度；

若所述第一余弦相似度满足第一预设条件，则将资料数据向量模型中的方向维度的特征向量，确定为方向维度的推荐数据信息集合；

计算所述目标维度的用户兴趣模型与资料数据向量模型的第二余弦相似度；

若所述第二余弦相似度满足第二预设条件，则将资料数据向量模型中的目标维度的特征向量，确定为目标维度的推荐数据信息集合；

计算所述区域维度的用户兴趣模型与资料数据向量模型的第三余弦相似度；

若所述第三余弦相似度满足第三预设条件，则将资料数据向量模型中的区域维度的特征向量，确定为区域维度的推荐数据信息集合。

可选地，所述根据D-S证据理论和所述推荐数据信息集合，确定目标数据信息，并将所述目标数据信息推荐给用户，包括：

基于D-S证据理论对不同类型对应的推荐数据进行排序，将满足第四预设条件的目标数据信息推荐给用户。

可选地，所述基于D-S证据理论对不同类型对应的推荐数据进行排序，将满足第四预设条件的目标数据信息推荐给用户，包括：

在不同类型对应的推荐数据信息集合中，分别确定每一个目标数据内容对应的推荐度；

分别确定每个类型对应的权重值；

根据所述每一个目标数据内容对应的推荐度和所述权重值，按照信度分配函数，计算第一信度值，并根据平均信度分配函数，计算第一均值；

根据所述目标数据内容，计算正交化系数；

根据第一信度值和对应的正交化系数，按照D-S证据理论的合成公式进行合成，得到第一合成值；

根据所述第一合成值和所述第一均值，计算得到第二合成值，其中，所述第二合成值为任意两个不同类型的目标数据内容进行合成的结果；

根据所述第二合成值与第三个类型的目标数据内容进行合成，得到第三合成值；

将第四合成值按照从大到小的顺序进行排序；

将所述第四合成值大于第四值，则将与所述第四合成值对应的目标数据信息推荐给用户。

第二个方面，本发明实施例提供一种数据信息推荐装置，所述装置包括：

获取模块，用于响应于用户输入的目标需求信息，获取所述目标需求信息中包括的不同类型的数据内容，用于响应于用户输入的目标需求信息，获取所述目标需求信息中包括的不同类型的数据内容，，所述不同类型至少包括方向维度、目标维度和区域维度；

初始特征模型确定模块，用于根据所述不同类型对应的目标数据内容，确定初始特征模型；其中，所述初始特征模型是根据是不同类型的目标数据内容和不同类型对应的权重值确定的；

用户行为模型确定模块，用于获取用户的隐式行为信息，并根据所述用户的隐式行为信息，确定用户行为模型；

用户兴趣模型确定模块，用于根据所述初始特征模型和所述用户行为模型，确定用户兴趣模型；

确定模块，用于根据所述目标数据内容和所述用户兴趣模型，确定推荐数据信息集合；

推荐模块，用于根据D-S证据理论和所述推荐数据信息集合，确定目标数据信息，并将所述目标数据信息推荐给用户。

可选地，所述获取模块用于：

可选地，所述初始特征模型确定模块用于：

所述根据所述不同类型对应的目标数据内容，确定初始特征模型，包括：

所述用户兴趣模型确定模块用于：

可选地，所述用户兴趣模型包括方向维度的用户兴趣模型、目标维度的用户兴趣模型和区域维度的用户兴趣模型，所述确定模块用于：

可选地，所述推荐模块用于：

可选地，所述推荐模块具体用于：

分别确定每个类型对应的权重值；

根据所述目标数据内容，计算正交化系数；

将第四合成值按照从大到小的顺序进行排序；

第三个方面，本发明实施例提供一种终端设备，包括：至少一个处理器和存储器；

所述存储器存储计算机程序；所述至少一个处理器执行所述存储器存储的计算机程序，以实现第一个方面提供的数据信息推荐方法。

第四个方面，本发明实施例提供一种计算机可读存储介质，该计算机可读存储介质中存储有计算机程序，所述计算机程序被执行时实现第一个方面提供的数据信息推荐方法。

本发明实施例包括以下优点：

本发明实施例提供的数据信息推荐方法、装置、终端设备和存储介质，通过响应于用户输入的目标需求信息，获取目标需求信息中包括的不同类型的数据内容，不同类型至少包括方向维度、目标维度和区域维度；根据不同类型对应的目标数据内容，确定初始特征模型；其中，初始特征模型是根据是不同类型的目标数据内容和不同类型对应的权重值确定的；获取用户的隐式行为信息，并根据用户的隐式行为信息，确定用户行为模型；根据初始特征模型和用户行为模型，确定用户兴趣模型；根据目标数据内容和用户兴趣模型，确定推荐数据信息集合；根据D-S证据理论和推荐数据信息集合，确定目标数据信息，并将目标数据信息推荐给用户，本发明实施例结合目标数据内容的特征根，采用初始特征模型挖掘用户显性需求，解决冷启动问题；同时利用用户行为特征挖掘用户隐性需求，解决概念漂移问题。

附图说明

图1是本发明的一种数据信息推荐方法实施例的流程示意图；

图2是本发明的再一种数据信息推荐方法实施例的流程示意图；

图3是本发明的用户关注模型的示意图；

图4是本发明的一种数据信息推荐装置实施例的结构框图；

图5是本发明的一种终端设备的结构示意图。

具体实施方式

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。

本发明一实施例提供一种数据信息推荐方法，用于获取到合适的数据内容推荐给合适的用户。本实施例的执行主体为数据信息推荐装置，设置在终端设备上，例如，终端设备至少包括手机终端、平板终端和计算机终端等。

参照图1，示出了本发明的一种数据信息推荐方法实施例的步骤流程图，该方法具体可以包括如下步骤：

S101、响应于用户输入的目标需求信息，获取所述目标需求信息中包括的不同类型的数据内容，所述不同类型至少包括方向维度、目标维度和区域维度；

具体地，预先将数据内容保存在数据库中，数据内容是富文本性质,虽然可能包含图片等多媒体数据,但是文本内容仍然是主体信息,所包含的内容属于文本类型，该数据内容可以是大量文本情报数据，其中蕴含着大量的目标活动、动向、意图、趋势等揭示战场内涵、内幕的重要信息。本发明实施例可以在大量的文本情报数据中快速识别出合适的文本数据推荐给合适和用户，该终端设备上安装有推荐***，用户在终端设备上输入目标需求信息，也就是用户所关注的内容，终端设备获取到用户的目标需求信息，该目标需求信息包括不同类型的数据内容，不同类型至少包括方向维度、目标维度和区域维度，也就是说终端设备在预先建立的情报数据库中查找到与目标需求信息对应的不同类型的数据内容。

S102、根据所述不同类型对应的目标数据内容，确定初始特征模型；其中，所述初始特征模型是根据是不同类型的目标数据内容和不同类型对应的权重值确定的；

具体地，终端设备上的推荐***中用户与项目的互动行为有两种表现形式：显式的行为数据与隐式的行为数据。显式数据是用户对项目的直接评分,隐式数据包括用户对项目的行为动作，隐式数据间接的表明了用户对于项目的兴趣特征。推荐***获取的不同类型的数据内容建立初始特征模型，也就是用户关注模型。关注模型使用了层次订阅方式，方便用户灵活配置自己想要的情报内容，配置与扩展提供了多样的订阅推荐方式。***从方向、区域、目标三个维度进行用户关注模型设计，如图3所示。

S103、获取用户的隐式行为信息，并根据所述用户的隐式行为信息，确定用户行为模型；

具体地，基于用户隐式行为信息，如浏览、评论、收藏、分享、下载等，根据该用户的隐式行为信息确定用户行为模型。用户的行为全集中包含了情报内容相关的信息和用户的所有行为特征。***记录的用户行为特征有浏览、评论、收藏、分享和下载，不同的行为动作体现了用户不同的情感倾向。

S104、根据所述初始特征模型和所述用户行为模型，确定用户兴趣模型；

具体地，在初始特征模型长时间未更新的情况下，初始特征模型不能完全表达用户兴趣，抽取用户动作中所包含的情感，需要对初始特征模型进行修正，也即是根据用户行为模型对初始特征模型进行修正，建立用户兴趣模型。

S105、根据所述目标数据内容和所述用户兴趣模型，确定推荐数据信息集合；

具体地，在预先建立的情报数据库即目标数据内容的数据库中，需要确定每个目标数据内容对应的向量模型，也就是情报数据的情报向量模型，然后计算用户兴趣模型与情报向量模型的余弦相似度，分别选出不同维度(方向、目标和区域)的候选推荐情报集合，将得到的三个集合的目标数据内容确定为推荐数据信息集合。

S106、根据D-S证据理论和所述推荐数据信息集合，确定目标数据信息，并将所述目标数据信息推荐给用户。

具体地，基于D-S证据理论对不同维度的候选情报进行综合排序，将排序在前的预设数值的目标数据信息推荐给用户，其中，目标数据信息是符合条件的目标数据内容。

本发明实施例提供的数据信息推荐方法，通过响应于用户输入的目标需求信息，获取目标需求信息中包括的不同类型的数据内容，不同类型至少包括方向维度、目标维度和区域维度；根据不同类型对应的目标数据内容，确定初始特征模型；其中，初始特征模型是根据是不同类型的目标数据内容和不同类型对应的权重值确定的；获取用户的隐式行为信息，并根据用户的隐式行为信息，确定用户行为模型；根据初始特征模型和用户行为模型，确定用户兴趣模型；根据目标数据内容和用户兴趣模型，确定推荐数据信息集合；根据D-S证据理论和推荐数据信息集合，确定目标数据信息，并将目标数据信息推荐给用户，本发明实施例结合目标数据内容的特征根，采用初始特征模型挖掘用户显性需求，解决冷启动问题；同时利用用户行为特征挖掘用户隐性需求，解决概念漂移问题。

本发明又一实施例对上述实施例提供的数据信息推荐方法做进一步补充说明。

步骤A1、响应于用户输入的目标需求信息，从预先建立的数据内容数据库中获取与所述不同类型对应的目标数据内容，所述目标数据内容为富文本性质的数据内容；

步骤A2、根据TF-IDF算法确定所述目标数据内容中的关键词和所述关键词的维度；

步骤A3、根据Python Gensim主题模型和所述关键词，确定与所述关键词对应的关键词特征向量；

步骤A4、将所述目标数据内容中的关键词特征向量确定为资料数据向量模型。

步骤B1、根据所述方向维度的目标数据内容对应的特征向量和方向兴趣度权重，确定方向维度上的初始特征模型；

步骤B2、根据所述目标维度的目标数据内容对应的特征向量和目标兴趣度权重，确定目标维度上的初始特征模型；

步骤B3、根据所述区域维度的目标数据内容对应的特征向量和区域兴趣度权重，确定区域维度上的初始特征模型。

步骤C1、计算所述方向维度的用户兴趣模型与资料数据向量模型的第一余弦相似度；

步骤C2、若所述第一余弦相似度满足第一预设条件，则将资料数据向量模型中的方向维度的特征向量，确定为方向维度的推荐数据信息集合；

步骤C3、计算所述目标维度的用户兴趣模型与资料数据向量模型的第二余弦相似度；

步骤C4、若所述第二余弦相似度满足第二预设条件，则将资料数据向量模型中的目标维度的特征向量，确定为目标维度的推荐数据信息集合；

步骤C5、计算所述区域维度的用户兴趣模型与资料数据向量模型的第三余弦相似度；

步骤C6、若所述第三余弦相似度满足第三预设条件，则将资料数据向量模型中的区域维度的特征向量，确定为区域维度的推荐数据信息集合。

该步骤具体包括：

步骤D1、在不同类型对应的推荐数据信息集合中，分别确定每一个目标数据内容对应的推荐度；

步骤D2、分别确定每个类型对应的权重值；

步骤D3、根据所述每一个目标数据内容对应的推荐度和所述权重值，按照信度分配函数，计算第一信度值，并根据平均信度分配函数，计算第一均值；

步骤D4、根据所述目标数据内容，计算正交化系数；

步骤D5、根据第一信度值和对应的正交化系数，按照D-S证据理论的合成公式进行合成，得到第一合成值；

步骤D6、根据所述第一合成值和所述第一均值，计算得到第二合成值，其中，所述第二合成值为任意两个不同类型的目标数据内容进行合成的结果；

步骤D7、根据所述第二合成值与第三个类型的目标数据内容进行合成，得到第三合成值；

具体地，可以将方向维度和区域维度先进行合成，然后再和目标维度进行合成，也可以先将方向维度和目标维度进行合成，再和区域维度进行合成，或者，先将区域维度和目标维度进行合成，然后再与方向维度进行合成。

步骤D8、将第四合成值按照从大到小的顺序进行排序；

步骤D9、将所述第四合成值大于第四值，则将与所述第四合成值对应的目标数据信息推荐给用户。

第四值可以根据需要进行设定，在本发明实施例中不做具体限定。

如图2所示，本发明的再一种数据信息推荐方法实施例的流程示意图，该数据信息推荐方法包括：

S1、对入库情报建立向量空间模型，实现情报文本向量化；

情报信息的一大特点是富文本性质，虽然可能包含图片等多媒体数据,但是文本内容仍然是主体信息，所包含的内容属于文本类型，要构建情报信息的推荐***，首先应将情报文本向量化。基于情报的高维性以及用户模型的构建， ***采用向量空间模型来表示情报特征向量。

给定情报集合DS＝{d1,d2,…,dn}，其向量空间模型表示为：

表示情报d_i的特征向量，其中w_ij表示为关键词k_j在情报d_i中的权重。***构建向量空间模型的步骤如下：

步骤1：关键词维度确定。关键词用于表征情报特性，经过实验，***关键词个数在(5,8)之间时效果最好；同时考虑关键词数量增加会导致M的维度m增大，以及情报维度分析，***提取每篇文档中的前5个关键词来表征该情报特性，接着采用TF-IDF算法(termfrequency–inverse document frequency，词频-逆向文件频率))得出新闻集中关键词集的维度m＝600； TF-IDF算法是一种用于信息检索(information retrieval)与文本挖掘(text mining)的常用加权技术。

步骤2：关键词向量化；推荐***使用Python Gensim主题模型中的 word2vec工具，将情报d_i中的关键词k_j转化为向量vk_j，维度为m。

步骤3：根据公式计算出情报d_i的特征向量v(d_i)。

步骤4：权重w_ij的计算。推荐***采用信息检索领域的成熟技术TF-IDF 进行权重计算。

Count(i,j)表示关键词j在新闻i中的频数，size(i)表示新闻i的总词数，n 表示情报集总数，count(i)表示关键词j出现过的新闻数量。

S2、对入库的情报根据方向、区域、目标进行多维度分类标注；

具体的，管理员负责将情报加入***情报资料库即预先建立的情报数据库，管理员可以手工设置情报的分类，对于未分类的情报，推荐***自动进行分类并给情报即数据内容打上类别标签。

分类方法为：文本即数据内容向量化后，利用深度模型得到文本即数据内容的语义表示，并在此之上进行文本分类，形成各个文本类型概率，并选取最大值作为该文本类型。

S3、通过用户填报，获取用户对不同维度(方向、目标和区域)的关注内容，各维度的初始特征模型根据该类别所有文本情报即数据内容加权平均求出，其中，权值根据该类别情报数量占总情报数量比例计算得到，例如方向维度的情报数量占总情报数据的比例；

推荐***中用户与项目的互动行为有两种表现形式：显式的行为数据与隐式的行为数据。显式数据是用户对项目的直接评分,隐式数据包括用户对项目的行为动作，隐式数据间接的表明了用户对于项目的兴趣特征。***通过建立关注模型，获取用户显示行为特征，建立用户初始模型；并基于用户隐式行为，如浏览、评论、收藏、分享、下载等，对初始模型进行修正，最终建立用户兴趣模型。

关注模型使用了层次订阅方式，方便用户灵活配置自己想要的情报内容，配置与扩展提供了多样的订阅推荐方式。推荐***从方向、区域、目标三个维度进行用户关注模型设计，如图2所示。

用户初始模型是根据该维度关注对象所包含的所有情报特征向量根据兴趣度加权平均求出。以方向维度为例，所有方向维度情报资料可以表示为 {(L₁,w₁,N₁),…,(L_m,w_m,N_m)}，其中L_i表示方向i的特征向量，w_i表示方向 i的权重(即该类别情报兴趣度)，N_i表示方向i包含的所有情报数量。用户方向维度上的初始模型表示如下：

其中L_i表示方向i的特征向量，根据该方向所包含的所有情报特征向量计算平均值；W_i表示方向i的值根据方向i包含的情报数量占所有方向中情报数量总和的权重来计算。

Dj表示方向i中的用户浏览过的情报资料集合，V_dj表示情报特征向量。

S4、根据用户隐式行为如浏览、评论、收藏、分享、下载等，建立用户行为模型；

具体的，在关注模型长时间未更新的情况下，用户初始模型不能完全表达用户兴趣，抽取用户动作中所包含的情感，修正用户初始模型十分有必要。

假如用户u_i近期(例如设置一个月内)己访问情报集合为DS(u_i)＝{(id₁,A_α),(id₂,A_β),…，(id_n,A_γ)}，(id_n,A_γ)表示用户u_i近期对情报id_n产生了行为A_γ。

从上式可以看出,用户的行为全集中包含了情报内容相关的信息和用户的所有行为特征。***记录的用户行为特征有浏览、评论、收藏、分享和下载，不同的行为动作体现了用户不同的情感倾向，***根据经验值赋予不同的行为特征权重。

表1行为权重值表

行为	浏览	评论	收藏	分享	下载
						权重值	0.7	0.1	0.9	0.7	1.0

同时含有情感倾向的行为特征虽然对兴趣影响大，但是多个动作的影响不会是线性叠加的，因此计算采用指数函数形式，计算方法如下：

w_i,j表示对于情报i的第j个行为动作的权重，w_i′表示情报i综合后行为权重。如果只有一种动作(如浏览)，w_i′＝0.504，可以反映用户对该情报存在一定兴趣，如果出现多个动作(如所有动作)，w_i′＝0.967，反应出用户对该情报兴趣是极大的，但是兴趣权重不会超过上限。

在行为数据符合正态分布的情况下,用户的内容兴趣度模型可以认为是在特征集合的时间段内,有互动行为的情报的文本向量的加权平均值。

方向、区域、目标三个维度的用户饮食模型分别用u_action-d、u_action-f、 u_action-o表示。

S5、根据用户行为模型对初始特征模型进行修正，建立用户兴趣模型；

具体的，基于用户隐式行为特征模型对基于关注的用户初始模型进行修正，公式如下：

u＝α×u_init+(1-α)×u_action

其中参数α可以控制初始模型和行为修正模型对用户模型的影响程度。由于用户的兴趣偏好会受到外界各种情况的影响，用户岗位、参与任务、承担项目的变化都会使得兴趣模型发生改变，从而造成用户兴趣的概念漂移。因此，***考虑初始模型定义时间越久远，发生概念漂移的可能性越大，则动作修正对用户模型的影响越大。参数α定义如下：

当初始模型定义在一个月以内，则α＝1,表示初始模型不需要修正；当初始模型定义距离当前时间为六个月，α＝0.55，表示初始模型和行为修正模型的影响比例相当；当模型定义距离当前时间为一年，α＝0.3，表示以行为修正模型为主。

S6、计算用户兴趣模型与情报向量模型的余弦相似度，分别选出不同维度(方向、目标和区域)的候选推荐情报集合；

具体的，***使用余弦相似度计算出候选情报di与(Vdi为di的特征向量)用户之间的相似性，分别选出不同维度(方向、目标和区域)的候选推荐情报集合。

S7、最后基于改进的D-S证据理论对不同维度的候选情报进行综合排序，将前n个情报推荐给用户，n为大于0的自然数，在本发明实施例中可以根据需要自行设定。

得到候选结果集合R_L、R_F、R_O之后,常规做法是对各个集合进行去重处理, 然后将各个集合的并集作为结果集合推荐给用户。该方法忽略了不同情况下推荐效果的差异问题。本发明实施例提供一种基于改进的D-S证据理论对不同维度的候选情报进行综合排序的方法，将前n个情报推荐给用户。

首先，D-S证据理论为将不同的信息源采集的信息进行融合提供了行之有效的合并规则，这样在推荐结果综合排序中，就可以综合各方的数据源，从而消除由于单方面的信息源造成的不确定性，增强最终推荐结果的准确性与合理性；其次，不同维度的情报存在相互关联性，D-S证据合成方法即是将这些相互关联的多源信息进行融合从而获取更加准确的信息。

以上就是D-S证据合成理论的突出优点，但是，D-S证据理论也存在本身的不足之处：在数据高度冲突的情况下会导致与实际结果相悖的结果。因此，为了克服D-S证据合成理论的不足，***对理论中的基本可信度分配模型进行修改，以使D-S证据合成方法在各种实际情况中，能够对数据进行正常的融合并给出较为正确的结果。两个证据融合的计算方法如下：

(1)计算经过权重分配后的信度分配函数；

(2)第二步计算平均信度分配函数；

(3)求正交化系数(正交化系数根据原始值计算)；

(4)将新的信都值按D-S证据理论的合成公式进行合成；

(5)将步骤2和步骤4的结果相加，得到最终的合成结果；

(6)归一化后得到最终结果。

下面通过举例说明。首先针对每个维度的候选情报集合，通过将近似度归一化，得到各个维度的推荐度。如下表2，在方向维度，候选集的推荐度分别为{0.56，0.36，0，0.10，0},0表示该情报未出现在方向维度候选集中。各维度的权重由用户通过关注模型设置，假设分别为0.3、0.2、0.5。

表2候选集推荐度列表

(1)首先通过上述方法计算方向、区域2个证据融合结果；

A.计算经过权重分配后的信度分配函数(第一行、第二行)，以及平均信度分配函数(第三行)；其中根据方向加权0.3和区域加权0.2的比值，二者的权重系数为0.6和0.4；

表3方向、区域融合过程

B.正交化系数1-K＝1-0.54*0.55-0.36*0.85-0.1*1＝0.297；

C.将新的信都值按D-S证据理论的合成公式进行合成，如 M(1)’＝0.324*0.18/0.297＝0.196364；

D.将均值和D-S合成值相加，得到第5行数值；规一化后得到最终结果 (第六行)。

(2)将上述2个维度(方向、区域)融合结果与第三个维度(目标)进行融合，其中融合结果与方向的权重系数为0.5和0.5,最终的结果见表2；

(3)最后，根据融合后的推荐度进行候选集排序，分别为{情报4，情报 2，情报3，情报1，情报5}。将最后得到的排序发送给用户。

本发明实施例采用面向项目的协同过滤方法，结合情报特征，采用用户关注模型挖掘用户显性需求，解决冷启动问题；同时利用用户行为特征挖掘用户隐性需求，解决概念漂移问题；同时，利用改进的D-S证据理论方法，对多维度的候选集进行融合排序，实现情报综合推荐。也可以对三个维度的用户兴趣模型进行融合后，进行相似度计算，从而对用户进行合适的数据内容推荐。

需要说明的是，对于方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本发明实施例并不受所描述的动作顺序的限制，因为依据本发明实施例，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作并不一定是本发明实施例所必须的。

本发明另一实施例提供一种数据信息推荐装置，用于执行上述实施例提供的数据信息推荐方法。

参照图4，示出了本发明的一种数据信息推荐装置实施例的结构框图，该装置具体可以包括如下模块：获取模块301、初始特征模型确定模块302、用户行为模型确定模块303、用户兴趣模型确定模块304、确定模块305和推荐模块306，其中：

获取模块301用于响应于用户输入的目标需求信息，获取目标需求信息中包括的不同类型的数据内容，不同类型至少包括方向维度、目标维度和区域维度；

初始特征模型确定模块302用于根据不同类型对应的目标数据内容，确定初始特征模型；其中，初始特征模型是根据是不同类型的目标数据内容和不同类型对应的权重值确定的；

用户行为模型确定模块303用于获取用户的隐式行为信息，并根据用户的隐式行为信息，确定用户行为模型；

用户兴趣模型确定模块304用于根据初始特征模型和用户行为模型，确定用户兴趣模型；

确定模块305用于根据目标数据内容和用户兴趣模型，确定推荐数据信息集合；

推荐模块306用于根据D-S证据理论和推荐数据信息集合，确定目标数据信息，并将目标数据信息推荐给用户。

本发明实施例提供的数据信息推荐装置，通过响应于用户输入的目标需求信息，获取目标需求信息中包括的不同类型的数据内容，不同类型至少包括方向维度、目标维度和区域维度；根据不同类型对应的目标数据内容，确定初始特征模型；其中，初始特征模型是根据是不同类型的目标数据内容和不同类型对应的权重值确定的；获取用户的隐式行为信息，并根据用户的隐式行为信息，确定用户行为模型；根据初始特征模型和用户行为模型，确定用户兴趣模型；根据目标数据内容和用户兴趣模型，确定推荐数据信息集合；根据D-S证据理论和推荐数据信息集合，确定目标数据信息，并将目标数据信息推荐给用户，本发明实施例结合目标数据内容的特征根，采用初始特征模型挖掘用户显性需求，解决冷启动问题；同时利用用户行为特征挖掘用户隐性需求，解决概念漂移问题。

本发明又一实施例对上述实施例提供的数据信息推荐装置做进一步补充说明。

可选地，所述获取模块用于：

可选地，所述初始特征模型确定模块用于：

所述用户兴趣模型确定模块用于：

可选地，所述推荐模块用于：

可选地，所述推荐模块具体用于：

分别确定每个类型对应的权重值；

根据所述目标数据内容，计算正交化系数；

将第四合成值按照从大到小的顺序进行排序；

对于装置实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

本发明再一实施例提供一种终端设备，用于执行上述实施例提供的数据信息推荐方法。

图5是本发明的一种终端设备的结构示意图，如图5所示，该终端设备包括：至少一个处理器801和存储器802；

存储器存储计算机程序；至少一个处理器执行存储器存储的计算机程序，以实现上述实施例提供的数据信息推荐方法。

本实施例提供的终端设备，通过响应于用户输入的目标需求信息，获取目标需求信息中包括的不同类型的数据内容，不同类型至少包括方向维度、目标维度和区域维度；根据不同类型对应的目标数据内容，确定初始特征模型；其中，初始特征模型是根据是不同类型的目标数据内容和不同类型对应的权重值确定的；获取用户的隐式行为信息，并根据用户的隐式行为信息，确定用户行为模型；根据初始特征模型和用户行为模型，确定用户兴趣模型；根据目标数据内容和用户兴趣模型，确定推荐数据信息集合；根据D-S证据理论和推荐数据信息集合，确定目标数据信息，并将目标数据信息推荐给用户，本发明实施例结合目标数据内容的特征根，采用初始特征模型挖掘用户显性需求，解决冷启动问题；同时利用用户行为特征挖掘用户隐性需求，解决概念漂移问题。

本申请又一实施例提供一种计算机可读存储介质，该计算机可读存储介质中存储有计算机程序，计算机程序被执行时实现上述任一实施例提供的数据信息推荐方法。

根据本实施例的计算机可读存储介质，通过响应于用户输入的目标需求信息，获取目标需求信息中包括的不同类型的数据内容，不同类型至少包括方向维度、目标维度和区域维度；根据不同类型对应的目标数据内容，确定初始特征模型；其中，初始特征模型是根据是不同类型的目标数据内容和不同类型对应的权重值确定的；获取用户的隐式行为信息，并根据用户的隐式行为信息，确定用户行为模型；根据初始特征模型和用户行为模型，确定用户兴趣模型；根据目标数据内容和用户兴趣模型，确定推荐数据信息集合；根据D-S证据理论和推荐数据信息集合，确定目标数据信息，并将目标数据信息推荐给用户，本发明实施例结合目标数据内容的特征根，采用初始特征模型挖掘用户显性需求，解决冷启动问题；同时利用用户行为特征挖掘用户隐性需求，解决概念漂移问题。

应该指出，上述详细说明都是示例性的，旨在对本申请提供进一步的说明。除非另有指明，本文使用的所有技术和科学术语均具有与本申请所属技术领域的普通技术人员的通常理解所相同的含义。

需要注意的是，这里所使用的术语仅是为了描述具体实施方式，而非意图限制根据本申请所述的示例性实施方式。如在这里所使用的，除非上下文另外明确指出，否则单数形式也意图包括复数形式。此外，还应当理解的是，当在本说明书中使用术语“包含”和/或“包括”时，其指明存在特征、步骤、操作、器件、组件和/或它们的组合。

需要说明的是，本申请的说明书和权利要求书及上述附图中的术语“第一”、 “第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的术语在适当情况下可以互换，以便这里描述的本申请的实施方式能够以除了在这里图示或描述的那些以外的顺序实施。

此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含。例如，包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

为了便于描述，在这里可以使用空间相对术语，如“在……之上”、“在…… 上方”、“在……上表面”、“上面的”等，用来描述如在图中所示的一个器件或特征与其他器件或特征的空间位置关系。应当理解的是，空间相对术语旨在包含除了器件在图中所描述的方位之外的在使用或操作中的不同方位。例如，如果附图中的器件被倒置，则描述为“在其他器件或构造上方”或“在其他器件或构造之上”的器件之后将被定位为“在其他器件或构造下方”或“在其他器件或构造之下”。因而，示例性术语“在……上方”可以包括“在……上方”和“在…… 下方”两种方位。该器件也可以其他不同方式定位，如旋转90度或处于其他方位，并且对这里所使用的空间相对描述作出相应解释。

在上面详细的说明中，参考了附图，附图形成本文的一部分。在附图中，类似的符号典型地确定类似的部件，除非上下文以其他方式指明。在详细的说明书、附图及权利要求书中所描述的图示说明的实施方案不意味是限制性的。在不脱离本文所呈现的主题的精神或范围下，其他实施方案可以被使用，并且可以作其他改变。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种数据信息推荐方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，响应于用户输入的目标需求信息，获取所述目标需求信息中包括的不同类型的数据内容，包括：

根据TF-IDF算法确定所述目标数据内容中的关键词和关键词的维度；

3.根据权利要求2所述的方法，其特征在于，所述根据所述不同类型对应的目标数据内容，确定初始特征模型，包括：

4.根据权利要求1所述的方法，其特征在于，所述隐式行为信息至少包括浏览、评论、收藏、分享、下载中的一种或多种；

5.根据权利要求4所述的方法，其特征在于，所述用户兴趣模型包括方向维度的用户兴趣模型、目标维度的用户兴趣模型和区域维度的用户兴趣模型，所述根据所述目标数据内容和所述用户兴趣模型，确定推荐数据信息集合，包括：

6.根据权利要求2所述的方法，其特征在于，所述根据D-S证据理论和所述推荐数据信息集合，确定目标数据信息，并将所述目标数据信息推荐给用户，包括：

7.根据权利要求6所述的方法，其特征在于，所述基于D-S证据理论对不同类型对应的推荐数据进行排序，将满足第四预设条件的目标数据信息推荐给用户，包括：

分别确定每个类型对应的权重值；

根据所述目标数据内容，计算正交化系数；

将第四合成值按照从大到小的顺序进行排序；

8.一种数据信息推荐装置，其特征在于，所述装置包括：

获取模块，用于响应于用户输入的目标需求信息，获取所述目标需求信息中包括的不同类型的数据内容，用于响应于用户输入的目标需求信息，获取所述目标需求信息中包括的不同类型的数据内容，所述不同类型至少包括方向维度、目标维度和区域维度；

9.一种终端设备，其特征在于，包括：至少一个处理器和存储器；

所述存储器存储计算机程序；所述至少一个处理器执行所述存储器存储的计算机程序，以实现权利要求1-7中任一项所述的数据信息推荐方法。

10.一种计算机可读存储介质，其特征在于，该计算机可读存储介质中存储有计算机程序，所述计算机程序被执行时实现权利要求1-7中任一项所述的数据信息推荐方法。