CN109801146B

CN109801146B - 一种基于需求偏好的资源服务推荐方法及***

Info

Publication number: CN109801146B
Application number: CN201910108265.6A
Authority: CN
Inventors: 李建强; 张丝雨
Original assignee: Beijing University of Technology
Current assignee: DIGITAL CHINA ADVANCED SYSTEMS SERVICES Co.,Ltd.
Priority date: 2019-01-18
Filing date: 2019-01-18
Publication date: 2020-12-29
Anticipated expiration: 2039-01-18
Also published as: CN109801146A

Abstract

本发明公开了一种基于需求偏好的资源服务推荐方法及***，包括：从资源服务属性组合中采样正样本和负样本；采用随机森林模型对正样本和负样本进行训练，得到训练模型；对训练模型中正样本分支的所有属性进行投票，得到同属性间偏好排序；对训练模型中正、负样本分支上出现的、未出现的属性打分，得到不同属性间偏好排序；基于同属性间偏好排序和不同属性间偏好排序，进行资源服务推荐。本发明的资源服务推荐方法考虑到组合因素、负面因素，使用信息熵作为评价标准，实现更准确的资源服务需求偏好分析与推荐效果。

Description

一种基于需求偏好的资源服务推荐方法及***

技术领域

本发明涉及资源服务推荐技术领域，具体涉及一种基于需求偏好的资源服务推荐方法及***。

背景技术

基于需求偏好的资源服务分析是用来分析用户群对某类型资源服务中属性的偏好程度的一种手段，它一方面可以帮助生产商了解用户需求，制定更准确的工艺研究方向和生产方案；另一方面也可以帮助营销商制定更准确的营销卖点，达到提高销量的目的。

基于需求偏好的资源服务分析是针对某资源服务下的分析，通过分析某用户群产生行为下的资源服务及其属性的分布规律，结合平台展示的资源服务相关属性的分布规律，得到该用户群对该类型资源服务中需求偏好描述。

现有基于需求偏好的资源服务分析的方式主要为：

针对用户的购买，关注，加购等相关正向操作的数据，计算某属性具体值的占比情况，并除以该资源服务中该值占比，得到修正后该属性中用户偏好情况；并通过计算各属性占比的方差，得到修正后各属性中用户需求偏好分析结果。

现有基于需求偏好的资源服务分析的缺点为：

1、计算基础是数量的占比，忽略了单纯在数量占比取胜但在组合占比较少的属性A，很可能是该属性A与其他属性B具有很强的关联性，而用户比较偏好属性B导致的情况而产生的错误，所以应该考虑到组合因素；

2、不同属性间的在意程度只靠正面因素(购买,关注，加购)来反映，其不够全面，因为某属性比较重要的表现是用户群对该属性某些值的正面因素和负面因素的偏好具有良好的区分性，所以应该综合负面因素；

3、不同属性间在意度的描述根据方差描述，当数据的分布有“多峰”(也可以理解为非凸)时方差描述信息不确定度的能力降低，所以应该用熵来描述不确定度，这种时候可能熵增大时方差减小。

发明内容

针对上述问题中存在的不足之处，本发明提供一种基于需求偏好的资源服务推荐方法及***。

本发明公开了一种基于需求偏好的资源服务推荐方法，包括：

从资源服务属性组合中采样正样本和负样本；

采用随机森林模型对所述正样本和负样本进行训练，得到训练模型；

对所述训练模型中正样本分支的所有属性进行投票，得到同属性间偏好排序；

对所述训练模型中正、负样本分支上出现的、未出现的属性打分，得到不同属性间偏好排序；

基于所述同属性间偏好排序和不同属性间偏好排序，进行资源服务推荐。

作为本发明的进一步改进，所述从资源服务属性组合中采样正样本和负样本，包括：

将资源服务中的连续属性值离散为离散属性值，得到所述资源服务属性组合；

将所述资源服务属性组合中用户正向操作的资源服务属性设为正样本；

将所述资源服务属性组合中用户未正向操作的资源服务属性设为负样本。

作为本发明的进一步改进，所述对所述训练模型中正样本分支的所有属性进行投票，得到同属性间偏好排序；包括：

从所述训练模型中找出正样本分支，对所述正样本分支上的所有属性进行投票；

将投票结果除以展示产品的属性组合中该属性占比，得到修正的投票结果；

决策树投票结果汇总，得到同属性间偏好排序。

将所述正、负样本分支的顶端属性得分设为随机森林的最大深度；随后每加一层，该层上的属性得分为上层属性得分减1；

对所述正、负样本分支上未出现的属性，该属性得分为该分支上得分最低的属性得分；

决策树结果汇总，得到不同属性间偏好排序。

作为本发明的进一步改进，所述基于所述同属性间偏好排序和不同属性间偏好排序，进行资源服务推荐；包括：

基于所述同属性间偏好排序，所述资源服务推荐包括：

按照排序结果进行资源服务推荐；

基于所述不同属性间偏好排序，所述资源服务推荐包括：

计算不同属性在意度权重列表；

对用户在权重列表上进行投票打分，得到用户的资源服务属性偏好；

与现有产品进行匹配，进行资源服务推荐。

本发明还公开了一种基于需求偏好的资源服务推荐***，包括：

样本生成模块，用于从资源服务属性组合中采样正样本和负样本；

模型训练模块，用于采用随机森林模型对所述正样本和负样本进行训练，得到训练模型；

需求偏好分析模块，用于对所述训练模型中正样本分支的所有属性进行投票，得到同属性间偏好排序；对所述训练模型中正、负样本分支上出现的、未出现的属性打分，得到不同属性间偏好排序；

资源服务推荐模块，用于基于所述同属性间偏好排序和不同属性间偏好排序，进行资源服务推荐。

作为本发明的进一步改进，所述样本生成模块，用于：

作为本发明的进一步改进，所述模型训练模块，用于：

决策树投票结果汇总，得到同属性间偏好排序。

作为本发明的进一步改进，所述模型训练模块，还用于：

决策树结果汇总，得到不同属性间偏好排序。

作为本发明的进一步改进，所述资源服务推荐模块，用于：

基于所述同属性间偏好排序，所述资源服务推荐包括：

按照排序结果进行资源服务推荐；

基于所述不同属性间偏好排序，所述资源服务推荐包括：

计算不同属性在意度权重列表；

与现有产品进行匹配，进行资源服务推荐。

与现有技术相比，本发明的有益效果为：

本发明的资源服务推荐方法考虑到组合因素、负面因素，使用信息熵作为评价标准，实现更准确的资源服务需求偏好分析与推荐效果。

附图说明

图1为本发明一种实施例公开的基于需求偏好的资源服务推荐方法的流程图；

图2为本发明一种实施例公开的基于需求偏好的资源服务推荐***的框架图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明的一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本发明保护的范围。

下面结合附图对本发明做进一步的详细描述：

如图1所示，本发明提供一种基于需求偏好的资源服务推荐方法，包括：

S1、从资源服务属性组合中采样正样本和负样本；其中：

S11、将资源服务中的连续属性值离散为离散属性值，得到资源服务属性组合；

S12、将资源服务属性组合中每个用户购买、关注、加购等正向操作的资源服务属性设为正样本，label＝1；

S13、将资源服务属性组合中每个用户未购买、关注、加购、浏览等正向操作的资源服务属性设为负样本，label＝0。

S2、采用随机森林模型对正样本和负样本进行训练，得到训练模型；其中：

模型采用随机森林模型，其中每个基决策树的构建，从顶至底通过计算每个节点上基决策树所选属性的信息增益，找到使得当前节点信息增益最大的属性作为划分属性，得到基决策树，若干基决策树组成最终的随机森林模型。

S3、对训练模型中正样本分支的所有属性进行投票，得到同属性间偏好排序；其中：

在用户喜欢的(label＝1)组合中，某属性以更多频率出现在各个组合，代表用户更偏好它，而单纯数量取胜但组合较少的属性A，很可能是该属性A与其他属性B具有很强的关联性，而用户比较偏好属性B导致的问题。故：

S31、从训练模型中找出正样本分支，即叶子节点为1的分支；对正样本分支上的所有属性进行投票；

S32、将投票结果除以平台中服务资源属性组合中该属性占比，得到修正的投票结果；

S33、决策树投票结果汇总，得到同属性间偏好排序。

S4、对训练模型中正、负样本分支上出现的、未出现的属性打分，得到不同属性间偏好排序；其中：

用户更在意的属性的各项值分布在label＝1和label＝0中的信息熵比，次在意的属性分布的信息熵值更小(混乱程度更小)。故：

S41、设属性所在层数为x，故将训练得到的模型中每颗决策树顶端(x＝1)属性得分score(x＝1)设为＝max_depth(随机森林的最大深度)，随后每加一层，该层上的属性得分score(x+1)＝score(x)-1；

S42、对于每条分支上没出现的属性，该属性得分为该分支上得分最低的属性得分-1；

S43、决策树结果汇总，至此得到基于用户的资源服务属性偏好。

S5、基于同属性间偏好排序和不同属性间偏好排序，进行资源服务推荐；其中：

同一类资源服务中，不同群体对资源服务的不同属性偏好程度顺序是固定的，但对同一属性的偏好程度顺序则具有个性化。

当描述用户U的资源服务属性偏好时，包括：

S51、找到用户U所在群体偏好排名在前1/2的属性列表A；

S52、对用户U曾经浏览/关注过的产品在属性列表A上进行投票打分，得到用户U的资源服务属性偏好列表；

S53、与现有产品进行匹配，进行产品推荐。

如图2所示，本发明提供一种基于需求偏好的资源服务推荐***，包括：样本生成模块、模型训练模块、需求偏好分析模块和资源服务推荐模块；

样本生成模块，用于从资源服务属性组合中采样正样本和负样本；其中：

将资源服务中的连续属性值离散为离散属性值，得到资源服务属性组合；将资源服务属性组合中每个用户购买、关注、加购等正向操作的资源服务属性设为正样本，label＝1；将资源服务属性组合中每个用户未购买、关注、加购、浏览等正向操作的资源服务属性设为负样本，label＝0。

模型训练模块，用于采用随机森林模型对正样本和负样本进行训练，得到训练模型；其中：

需求偏好分析模块，用于对训练模型中正样本分支的所有属性进行投票，得到同属性间偏好排序；其中：

在用户喜欢的(label＝1)组合中，某属性以更多频率出现在各个组合，代表用户更偏好它，而单纯数量取胜但组合较少的属性A，很可能是该属性A与其他属性B具有很强的关联性，而用户比较偏好属性B导致的问题。故：从训练模型中找出正样本分支，即叶子节点为1的分支；对正样本分支上的所有属性进行投票；将投票结果除以平台中服务资源属性组合中该属性占比，得到修正的投票结果；决策树投票结果汇总，得到同属性间偏好排序。

需求偏好分析模块，还用于对训练模型中正、负样本分支上出现的、未出现的属性打分，得到不同属性间偏好排序；其中：

用户更在意的属性的各项值分布在label＝1和label＝0中的信息熵比，次在意的属性分布的信息熵值更小(混乱程度更小)。设属性所在层数为x，故将训练得到的模型中每颗决策树顶端(x＝1)属性得分score(x＝1)设为＝max_depth(随机森林的最大深度)，随后每加一层，该层上的属性得分score(x+1)＝score(x)-1；对于每条分支上没出现的属性，该属性得分为该分支上得分最低的属性得分-1；决策树结果汇总，至此得到基于用户的资源服务属性偏好。

资源服务推荐模块，用于基于同属性间偏好排序和不同属性间偏好排序，进行资源服务推荐；其中：

资源服务推荐模块是基于整个用户群的资源服务属性分析结果的扩展模块，旨在生成每个用户的资源服务属性偏好画像。画像计算的假设来自前三个模块针对不同用户群进行实验的结论：同一类资源服务中，不同群体对资源服务的不同属性偏好程度顺序是固定的，但对同一属性的偏好程度顺序则具有个性化，当我们描述用户U的资源服务属性偏好时，找到用户U所在群体偏好排名在前1/2的属性列表A；对用户U曾经浏览/关注过的产品在属性列表A上进行投票打分，得到用户U的资源服务属性偏好列表；与现有产品进行匹配，进行产品推荐。

本发明的优点为：

本发明的资源服务推荐方法利用随机森林原理来考虑到组合因素、负面因素，使用信息熵作为评价标准，解决了传统需求偏好分析中没考虑到的组合因素而带来的与热门属性具有强关联性的属性在数量占比占优的问题、没考虑到的负面因素而带来的结果不够全面准确的问题、方差描述信息不确定度的能力在数据非凸时的性能较差的问题，实现更准确的资源服务需求偏好分析与推荐效果。

以上仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于需求偏好的资源服务推荐方法，其特征在于，包括：

从资源服务属性组合中采样正样本和负样本；

对所述训练模型中正样本分支的所有属性进行投票，得到同属性间偏好排序；其中，具体包括：从所述训练模型中找出正样本分支，对所述正样本分支上的所有属性进行投票；将投票结果除以展示产品的属性组合中该属性占比，得到修正的投票结果；决策树投票结果汇总，得到同属性间偏好排序；

对所述训练模型中正、负样本分支上出现的、未出现的属性打分，得到不同属性间偏好排序；其中，具体包括：将所述正、负样本分支的顶端属性得分设为随机森林的最大深度；随后每加一层，该层上的属性得分为上层属性得分减1；对所述正、负样本分支上未出现的属性，该属性得分为该分支上得分最低的属性得分；决策树结果汇总，得到不同属性间偏好排序；

基于所述同属性间偏好排序和不同属性间偏好排序，进行资源服务推荐；其中，基于所述同属性间偏好排序，所述资源服务推荐包括：按照排序结果进行资源服务推荐；基于所述不同属性间偏好排序，所述资源服务推荐包括：计算不同属性在意度权重列表；对用户在权重列表上进行投票打分，得到用户的资源服务属性偏好；与现有产品进行匹配，进行资源服务推荐；

所述从资源服务属性组合中采样正样本和负样本，包括：

2.一种基于需求偏好的资源服务推荐***，其特征在于，包括：

模型训练模块，用于采用随机森林模型对所述正样本和负样本进行训练，得到训练模型；其中，具体用于：从所述训练模型中找出正样本分支，对所述正样本分支上的所有属性进行投票；将投票结果除以展示产品的属性组合中该属性占比，得到修正的投票结果；决策树投票结果汇总，得到同属性间偏好排序；

需求偏好分析模块，用于对所述训练模型中正样本分支的所有属性进行投票，得到同属性间偏好排序；对所述训练模型中正、负样本分支上出现的、未出现的属性打分，得到不同属性间偏好排序；其中，具体用于：将所述正、负样本分支的顶端属性得分设为随机森林的最大深度；随后每加一层，该层上的属性得分为上层属性得分减1；对所述正、负样本分支上未出现的属性，该属性得分为该分支上得分最低的属性得分；决策树结果汇总，得到不同属性间偏好排序；

资源服务推荐模块，用于基于所述同属性间偏好排序和不同属性间偏好排序，进行资源服务推荐；其中，基于所述同属性间偏好排序，所述资源服务推荐包括：按照排序结果进行资源服务推荐；基于所述不同属性间偏好排序，所述资源服务推荐包括：计算不同属性在意度权重列表；对用户在权重列表上进行投票打分，得到用户的资源服务属性偏好；与现有产品进行匹配，进行资源服务推荐；

所述样本生成模块，用于：