CN109801146B - 一种基于需求偏好的资源服务推荐方法及*** - Google Patents
一种基于需求偏好的资源服务推荐方法及*** Download PDFInfo
- Publication number
- CN109801146B CN109801146B CN201910108265.6A CN201910108265A CN109801146B CN 109801146 B CN109801146 B CN 109801146B CN 201910108265 A CN201910108265 A CN 201910108265A CN 109801146 B CN109801146 B CN 109801146B
- Authority
- CN
- China
- Prior art keywords
- attribute
- resource service
- preference
- attributes
- positive
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于需求偏好的资源服务推荐方法及***,包括:从资源服务属性组合中采样正样本和负样本;采用随机森林模型对正样本和负样本进行训练,得到训练模型;对训练模型中正样本分支的所有属性进行投票,得到同属性间偏好排序;对训练模型中正、负样本分支上出现的、未出现的属性打分,得到不同属性间偏好排序;基于同属性间偏好排序和不同属性间偏好排序,进行资源服务推荐。本发明的资源服务推荐方法考虑到组合因素、负面因素,使用信息熵作为评价标准,实现更准确的资源服务需求偏好分析与推荐效果。
Description
技术领域
本发明涉及资源服务推荐技术领域,具体涉及一种基于需求偏好的资源服务推荐方法及***。
背景技术
基于需求偏好的资源服务分析是用来分析用户群对某类型资源服务中属性的偏好程度的一种手段,它一方面可以帮助生产商了解用户需求,制定更准确的工艺研究方向和生产方案;另一方面也可以帮助营销商制定更准确的营销卖点,达到提高销量的目的。
基于需求偏好的资源服务分析是针对某资源服务下的分析,通过分析某用户群产生行为下的资源服务及其属性的分布规律,结合平台展示的资源服务相关属性的分布规律,得到该用户群对该类型资源服务中需求偏好描述。
现有基于需求偏好的资源服务分析的方式主要为:
针对用户的购买,关注,加购等相关正向操作的数据,计算某属性具体值的占比情况,并除以该资源服务中该值占比,得到修正后该属性中用户偏好情况;并通过计算各属性占比的方差,得到修正后各属性中用户需求偏好分析结果。
现有基于需求偏好的资源服务分析的缺点为:
1、计算基础是数量的占比,忽略了单纯在数量占比取胜但在组合占比较少的属性A,很可能是该属性A与其他属性B具有很强的关联性,而用户比较偏好属性B导致的情况而产生的错误,所以应该考虑到组合因素;
2、不同属性间的在意程度只靠正面因素(购买,关注,加购)来反映,其不够全面,因为某属性比较重要的表现是用户群对该属性某些值的正面因素和负面因素的偏好具有良好的区分性,所以应该综合负面因素;
3、不同属性间在意度的描述根据方差描述,当数据的分布有“多峰”(也可以理解为非凸)时方差描述信息不确定度的能力降低,所以应该用熵来描述不确定度,这种时候可能熵增大时方差减小。
发明内容
针对上述问题中存在的不足之处,本发明提供一种基于需求偏好的资源服务推荐方法及***。
本发明公开了一种基于需求偏好的资源服务推荐方法,包括:
从资源服务属性组合中采样正样本和负样本;
采用随机森林模型对所述正样本和负样本进行训练,得到训练模型;
对所述训练模型中正样本分支的所有属性进行投票,得到同属性间偏好排序;
对所述训练模型中正、负样本分支上出现的、未出现的属性打分,得到不同属性间偏好排序;
基于所述同属性间偏好排序和不同属性间偏好排序,进行资源服务推荐。
作为本发明的进一步改进,所述从资源服务属性组合中采样正样本和负样本,包括:
将资源服务中的连续属性值离散为离散属性值,得到所述资源服务属性组合;
将所述资源服务属性组合中用户正向操作的资源服务属性设为正样本;
将所述资源服务属性组合中用户未正向操作的资源服务属性设为负样本。
作为本发明的进一步改进,所述对所述训练模型中正样本分支的所有属性进行投票,得到同属性间偏好排序;包括:
从所述训练模型中找出正样本分支,对所述正样本分支上的所有属性进行投票;
将投票结果除以展示产品的属性组合中该属性占比,得到修正的投票结果;
决策树投票结果汇总,得到同属性间偏好排序。
作为本发明的进一步改进,所述对所述训练模型中正样本分支的所有属性进行投票,得到同属性间偏好排序;包括:
将所述正、负样本分支的顶端属性得分设为随机森林的最大深度;随后每加一层,该层上的属性得分为上层属性得分减1;
对所述正、负样本分支上未出现的属性,该属性得分为该分支上得分最低的属性得分;
决策树结果汇总,得到不同属性间偏好排序。
作为本发明的进一步改进,所述基于所述同属性间偏好排序和不同属性间偏好排序,进行资源服务推荐;包括:
基于所述同属性间偏好排序,所述资源服务推荐包括:
按照排序结果进行资源服务推荐;
基于所述不同属性间偏好排序,所述资源服务推荐包括:
计算不同属性在意度权重列表;
对用户在权重列表上进行投票打分,得到用户的资源服务属性偏好;
与现有产品进行匹配,进行资源服务推荐。
本发明还公开了一种基于需求偏好的资源服务推荐***,包括:
样本生成模块,用于从资源服务属性组合中采样正样本和负样本;
模型训练模块,用于采用随机森林模型对所述正样本和负样本进行训练,得到训练模型;
需求偏好分析模块,用于对所述训练模型中正样本分支的所有属性进行投票,得到同属性间偏好排序;对所述训练模型中正、负样本分支上出现的、未出现的属性打分,得到不同属性间偏好排序;
资源服务推荐模块,用于基于所述同属性间偏好排序和不同属性间偏好排序,进行资源服务推荐。
作为本发明的进一步改进,所述样本生成模块,用于:
将资源服务中的连续属性值离散为离散属性值,得到所述资源服务属性组合;
将所述资源服务属性组合中用户正向操作的资源服务属性设为正样本;
将所述资源服务属性组合中用户未正向操作的资源服务属性设为负样本。
作为本发明的进一步改进,所述模型训练模块,用于:
从所述训练模型中找出正样本分支,对所述正样本分支上的所有属性进行投票;
将投票结果除以展示产品的属性组合中该属性占比,得到修正的投票结果;
决策树投票结果汇总,得到同属性间偏好排序。
作为本发明的进一步改进,所述模型训练模块,还用于:
将所述正、负样本分支的顶端属性得分设为随机森林的最大深度;随后每加一层,该层上的属性得分为上层属性得分减1;
对所述正、负样本分支上未出现的属性,该属性得分为该分支上得分最低的属性得分;
决策树结果汇总,得到不同属性间偏好排序。
作为本发明的进一步改进,所述资源服务推荐模块,用于:
基于所述同属性间偏好排序,所述资源服务推荐包括:
按照排序结果进行资源服务推荐;
基于所述不同属性间偏好排序,所述资源服务推荐包括:
计算不同属性在意度权重列表;
对用户在权重列表上进行投票打分,得到用户的资源服务属性偏好;
与现有产品进行匹配,进行资源服务推荐。
与现有技术相比,本发明的有益效果为:
本发明的资源服务推荐方法考虑到组合因素、负面因素,使用信息熵作为评价标准,实现更准确的资源服务需求偏好分析与推荐效果。
附图说明
图1为本发明一种实施例公开的基于需求偏好的资源服务推荐方法的流程图;
图2为本发明一种实施例公开的基于需求偏好的资源服务推荐***的框架图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面结合附图对本发明做进一步的详细描述:
如图1所示,本发明提供一种基于需求偏好的资源服务推荐方法,包括:
S1、从资源服务属性组合中采样正样本和负样本;其中:
S11、将资源服务中的连续属性值离散为离散属性值,得到资源服务属性组合;
S12、将资源服务属性组合中每个用户购买、关注、加购等正向操作的资源服务属性设为正样本,label=1;
S13、将资源服务属性组合中每个用户未购买、关注、加购、浏览等正向操作的资源服务属性设为负样本,label=0。
S2、采用随机森林模型对正样本和负样本进行训练,得到训练模型;其中:
模型采用随机森林模型,其中每个基决策树的构建,从顶至底通过计算每个节点上基决策树所选属性的信息增益,找到使得当前节点信息增益最大的属性作为划分属性,得到基决策树,若干基决策树组成最终的随机森林模型。
S3、对训练模型中正样本分支的所有属性进行投票,得到同属性间偏好排序;其中:
在用户喜欢的(label=1)组合中,某属性以更多频率出现在各个组合,代表用户更偏好它,而单纯数量取胜但组合较少的属性A,很可能是该属性A与其他属性B具有很强的关联性,而用户比较偏好属性B导致的问题。故:
S31、从训练模型中找出正样本分支,即叶子节点为1的分支;对正样本分支上的所有属性进行投票;
S32、将投票结果除以平台中服务资源属性组合中该属性占比,得到修正的投票结果;
S33、决策树投票结果汇总,得到同属性间偏好排序。
S4、对训练模型中正、负样本分支上出现的、未出现的属性打分,得到不同属性间偏好排序;其中:
用户更在意的属性的各项值分布在label=1和label=0中的信息熵比,次在意的属性分布的信息熵值更小(混乱程度更小)。故:
S41、设属性所在层数为x,故将训练得到的模型中每颗决策树顶端(x=1)属性得分score(x=1)设为=max_depth(随机森林的最大深度),随后每加一层,该层上的属性得分score(x+1)=score(x)-1;
S42、对于每条分支上没出现的属性,该属性得分为该分支上得分最低的属性得分-1;
S43、决策树结果汇总,至此得到基于用户的资源服务属性偏好。
S5、基于同属性间偏好排序和不同属性间偏好排序,进行资源服务推荐;其中:
同一类资源服务中,不同群体对资源服务的不同属性偏好程度顺序是固定的,但对同一属性的偏好程度顺序则具有个性化。
当描述用户U的资源服务属性偏好时,包括:
S51、找到用户U所在群体偏好排名在前1/2的属性列表A;
S52、对用户U曾经浏览/关注过的产品在属性列表A上进行投票打分,得到用户U的资源服务属性偏好列表;
S53、与现有产品进行匹配,进行产品推荐。
如图2所示,本发明提供一种基于需求偏好的资源服务推荐***,包括:样本生成模块、模型训练模块、需求偏好分析模块和资源服务推荐模块;
样本生成模块,用于从资源服务属性组合中采样正样本和负样本;其中:
将资源服务中的连续属性值离散为离散属性值,得到资源服务属性组合;将资源服务属性组合中每个用户购买、关注、加购等正向操作的资源服务属性设为正样本,label=1;将资源服务属性组合中每个用户未购买、关注、加购、浏览等正向操作的资源服务属性设为负样本,label=0。
模型训练模块,用于采用随机森林模型对正样本和负样本进行训练,得到训练模型;其中:
模型采用随机森林模型,其中每个基决策树的构建,从顶至底通过计算每个节点上基决策树所选属性的信息增益,找到使得当前节点信息增益最大的属性作为划分属性,得到基决策树,若干基决策树组成最终的随机森林模型。
需求偏好分析模块,用于对训练模型中正样本分支的所有属性进行投票,得到同属性间偏好排序;其中:
在用户喜欢的(label=1)组合中,某属性以更多频率出现在各个组合,代表用户更偏好它,而单纯数量取胜但组合较少的属性A,很可能是该属性A与其他属性B具有很强的关联性,而用户比较偏好属性B导致的问题。故:从训练模型中找出正样本分支,即叶子节点为1的分支;对正样本分支上的所有属性进行投票;将投票结果除以平台中服务资源属性组合中该属性占比,得到修正的投票结果;决策树投票结果汇总,得到同属性间偏好排序。
需求偏好分析模块,还用于对训练模型中正、负样本分支上出现的、未出现的属性打分,得到不同属性间偏好排序;其中:
用户更在意的属性的各项值分布在label=1和label=0中的信息熵比,次在意的属性分布的信息熵值更小(混乱程度更小)。设属性所在层数为x,故将训练得到的模型中每颗决策树顶端(x=1)属性得分score(x=1)设为=max_depth(随机森林的最大深度),随后每加一层,该层上的属性得分score(x+1)=score(x)-1;对于每条分支上没出现的属性,该属性得分为该分支上得分最低的属性得分-1;决策树结果汇总,至此得到基于用户的资源服务属性偏好。
资源服务推荐模块,用于基于同属性间偏好排序和不同属性间偏好排序,进行资源服务推荐;其中:
资源服务推荐模块是基于整个用户群的资源服务属性分析结果的扩展模块,旨在生成每个用户的资源服务属性偏好画像。画像计算的假设来自前三个模块针对不同用户群进行实验的结论:同一类资源服务中,不同群体对资源服务的不同属性偏好程度顺序是固定的,但对同一属性的偏好程度顺序则具有个性化,当我们描述用户U的资源服务属性偏好时,找到用户U所在群体偏好排名在前1/2的属性列表A;对用户U曾经浏览/关注过的产品在属性列表A上进行投票打分,得到用户U的资源服务属性偏好列表;与现有产品进行匹配,进行产品推荐。
本发明的优点为:
本发明的资源服务推荐方法利用随机森林原理来考虑到组合因素、负面因素,使用信息熵作为评价标准,解决了传统需求偏好分析中没考虑到的组合因素而带来的与热门属性具有强关联性的属性在数量占比占优的问题、没考虑到的负面因素而带来的结果不够全面准确的问题、方差描述信息不确定度的能力在数据非凸时的性能较差的问题,实现更准确的资源服务需求偏好分析与推荐效果。
以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (2)
1.一种基于需求偏好的资源服务推荐方法,其特征在于,包括:
从资源服务属性组合中采样正样本和负样本;
采用随机森林模型对所述正样本和负样本进行训练,得到训练模型;
对所述训练模型中正样本分支的所有属性进行投票,得到同属性间偏好排序;其中,具体包括:从所述训练模型中找出正样本分支,对所述正样本分支上的所有属性进行投票;将投票结果除以展示产品的属性组合中该属性占比,得到修正的投票结果;决策树投票结果汇总,得到同属性间偏好排序;
对所述训练模型中正、负样本分支上出现的、未出现的属性打分,得到不同属性间偏好排序;其中,具体包括:将所述正、负样本分支的顶端属性得分设为随机森林的最大深度;随后每加一层,该层上的属性得分为上层属性得分减1;对所述正、负样本分支上未出现的属性,该属性得分为该分支上得分最低的属性得分;决策树结果汇总,得到不同属性间偏好排序;
基于所述同属性间偏好排序和不同属性间偏好排序,进行资源服务推荐;其中,基于所述同属性间偏好排序,所述资源服务推荐包括:按照排序结果进行资源服务推荐;基于所述不同属性间偏好排序,所述资源服务推荐包括:计算不同属性在意度权重列表;对用户在权重列表上进行投票打分,得到用户的资源服务属性偏好;与现有产品进行匹配,进行资源服务推荐;
所述从资源服务属性组合中采样正样本和负样本,包括:
将资源服务中的连续属性值离散为离散属性值,得到所述资源服务属性组合;
将所述资源服务属性组合中用户正向操作的资源服务属性设为正样本;
将所述资源服务属性组合中用户未正向操作的资源服务属性设为负样本。
2.一种基于需求偏好的资源服务推荐***,其特征在于,包括:
样本生成模块,用于从资源服务属性组合中采样正样本和负样本;
模型训练模块,用于采用随机森林模型对所述正样本和负样本进行训练,得到训练模型;其中,具体用于:从所述训练模型中找出正样本分支,对所述正样本分支上的所有属性进行投票;将投票结果除以展示产品的属性组合中该属性占比,得到修正的投票结果;决策树投票结果汇总,得到同属性间偏好排序;
需求偏好分析模块,用于对所述训练模型中正样本分支的所有属性进行投票,得到同属性间偏好排序;对所述训练模型中正、负样本分支上出现的、未出现的属性打分,得到不同属性间偏好排序;其中,具体用于:将所述正、负样本分支的顶端属性得分设为随机森林的最大深度;随后每加一层,该层上的属性得分为上层属性得分减1;对所述正、负样本分支上未出现的属性,该属性得分为该分支上得分最低的属性得分;决策树结果汇总,得到不同属性间偏好排序;
资源服务推荐模块,用于基于所述同属性间偏好排序和不同属性间偏好排序,进行资源服务推荐;其中,基于所述同属性间偏好排序,所述资源服务推荐包括:按照排序结果进行资源服务推荐;基于所述不同属性间偏好排序,所述资源服务推荐包括:计算不同属性在意度权重列表;对用户在权重列表上进行投票打分,得到用户的资源服务属性偏好;与现有产品进行匹配,进行资源服务推荐;
所述样本生成模块,用于:
将资源服务中的连续属性值离散为离散属性值,得到所述资源服务属性组合;
将所述资源服务属性组合中用户正向操作的资源服务属性设为正样本;
将所述资源服务属性组合中用户未正向操作的资源服务属性设为负样本。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910108265.6A CN109801146B (zh) | 2019-01-18 | 2019-01-18 | 一种基于需求偏好的资源服务推荐方法及*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910108265.6A CN109801146B (zh) | 2019-01-18 | 2019-01-18 | 一种基于需求偏好的资源服务推荐方法及*** |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109801146A CN109801146A (zh) | 2019-05-24 |
CN109801146B true CN109801146B (zh) | 2020-12-29 |
Family
ID=66561906
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910108265.6A Active CN109801146B (zh) | 2019-01-18 | 2019-01-18 | 一种基于需求偏好的资源服务推荐方法及*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109801146B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110275779B (zh) * | 2019-06-20 | 2022-07-08 | 北京百度网讯科技有限公司 | 一种资源获取方法、装置、设备和存储介质 |
CN110377805B (zh) * | 2019-07-16 | 2022-02-11 | 浙江大学城市学院 | 一种基于快速分支配排序算法的传感器资源推荐方法 |
CN110647715B (zh) * | 2019-11-01 | 2023-04-21 | 数字钱包(北京)科技有限公司 | 排行榜投票处理方法和装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106056427A (zh) * | 2016-05-25 | 2016-10-26 | 中南大学 | 一种基于Spark的大数据混合模型的移动推荐方法 |
CN106815297A (zh) * | 2016-12-09 | 2017-06-09 | 宁波大学 | 一种学术资源推荐服务***与方法 |
CN107273909A (zh) * | 2016-04-08 | 2017-10-20 | 上海市玻森数据科技有限公司 | 高维数据的分类算法 |
CN107967627A (zh) * | 2017-12-05 | 2018-04-27 | 北京工业大学 | 一种基于内容的线性回归理财产品推荐方法 |
-
2019
- 2019-01-18 CN CN201910108265.6A patent/CN109801146B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107273909A (zh) * | 2016-04-08 | 2017-10-20 | 上海市玻森数据科技有限公司 | 高维数据的分类算法 |
CN106056427A (zh) * | 2016-05-25 | 2016-10-26 | 中南大学 | 一种基于Spark的大数据混合模型的移动推荐方法 |
CN106815297A (zh) * | 2016-12-09 | 2017-06-09 | 宁波大学 | 一种学术资源推荐服务***与方法 |
CN107967627A (zh) * | 2017-12-05 | 2018-04-27 | 北京工业大学 | 一种基于内容的线性回归理财产品推荐方法 |
Non-Patent Citations (1)
Title |
---|
基于改进随机森林的推荐算法研究;吴迪;《中国优秀硕士学位论文全文数据库 信息科技辑》;20180215;论文第31–47页 * |
Also Published As
Publication number | Publication date |
---|---|
CN109801146A (zh) | 2019-05-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9754306B2 (en) | Recommendation engine with profile analysis | |
US20230043174A1 (en) | Method for pushing anchor information, computer device, and storage medium | |
CN109801146B (zh) | 一种基于需求偏好的资源服务推荐方法及*** | |
KR101579376B1 (ko) | 주관성 분석을 이용한 사용자 분류와 그에 따른 개인화된 장소 추천 시스템 및 방법 | |
CN110532351B (zh) | 推荐词展示方法、装置、设备及计算机可读存储介质 | |
CN106779814B (zh) | 一种广告投放方法、业务平台及媒体平台 | |
WO2009126815A2 (en) | Diversified, self-organizing map system and method | |
CN106776701B (zh) | 用于物品推荐的问题确定方法和装置 | |
CN106447419B (zh) | 基于特征选择的拜访者标识 | |
CN107180093A (zh) | 信息搜索方法及装置和时效性查询词识别方法及装置 | |
US20110238491A1 (en) | Suggesting keyword expansions for advertisement selection | |
CN110378770A (zh) | 一种电商运营选款推荐的方法及装置 | |
US20190228451A1 (en) | Method, system, and computer-readable medium for product and vendor selection | |
CN107122390A (zh) | 基于用户群组的推荐***构建方法 | |
CN108133058A (zh) | 一种视频检索方法 | |
CN110727859A (zh) | 一种推荐信息推送方法及其装置 | |
CN106445965B (zh) | 信息推广处理方法及装置 | |
US20140344293A1 (en) | Information providing device, information providing method, program, information storage medium, and information providing system | |
CN112783468A (zh) | 目标对象的排序方法和排序装置 | |
CN111460301B (zh) | 对象推送方法、装置、电子设备及存储介质 | |
CN103886869B (zh) | 一种基于语音情感识别的信息反馈方法和*** | |
CN108932262B (zh) | 一种歌曲推荐方法及装置 | |
CN110874432B (zh) | 排序方法、信息推荐方法、***及装置 | |
CN106446213B (zh) | 基于人工智能的服务排序方法和装置 | |
JP6065061B2 (ja) | 情報処理装置、端末装置、情報処理方法、表示方法、情報処理プログラム、及び表示プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20210714 Address after: 100193 room 101-501, 5 / F, building 18, east yard, No. 10, northwest Wangdong Road, Haidian District, Beijing Patentee after: DIGITAL CHINA ADVANCED SYSTEMS SERVICES Co.,Ltd. Address before: 100124 No. 100 Chaoyang District Ping Tian Park, Beijing Patentee before: Beijing University of Technology |