CN108665148B

CN108665148B - 一种电子资源质量评价方法、装置和存储介质

Info

Publication number: CN108665148B
Application number: CN201810350650.7A
Authority: CN
Inventors: 刘冲; 明细龙; 蒋健; 张宏业
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2018-04-18
Filing date: 2018-04-18
Publication date: 2022-02-22
Anticipated expiration: 2038-04-18
Also published as: CN108665148A

Abstract

本发明公开了一种电子资源质量评价方法、装置和存储介质，用以准确客观地评价电子资源质量，提高电子资源评价结果的准确性。所述电子资源质量评价方法，包括：获取针对待评价电子资源设定的每一评价指标的指标值；根据各评价指标的指标值，利用聚类算法分别确定每一评价指标所属的类别；根据每一评价指标对应的加权参数及其所属类别对应的评分，确定所述待评价电子资源的加权评分。

Description

一种电子资源质量评价方法、装置和存储介质

技术领域

本发明涉及数据处理技术领域，尤其涉及一种电子资源质量评价方法、装置和存储介质。

背景技术

本部分旨在为权利要求书中陈述的本发明的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。

传统的基于C/S(Client/Server，客户端/服务器)架构的应用中，一般由客户端应用程序及服务器端应用程序相互配合为用户提供服务。客户端应用程序是指安装在终端上，且能够与网络侧的服务器进行信息交互，通过与服务器端应用程序的相互配合运行，为用户提供服务的客户端应用程序。比如，在手机上安装的电子书客户端、图片浏览客户端、游戏客户端以及即时通信客户端等，均属于客户端应用程序。

不同的应用程序客户端可以为用户提供不同的电子资源。例如，电子书客户端可以为用户提供数字化的书籍资源，而视频播放类的客户端可以为用户提供视频资源。为了向用户推荐优质的电子资源，现有技术中，可以根据电子资源的人气、用户评分或者点击量等单一维度的指标来对电子资源进行评价。但是，单一指标评价存在严重的马太效应，导致强者更强，弱者更弱，无法准确客观地反映电子资源的质量，降低了电子资源评价结果的准确性。

发明内容

本发明实施例提供一种电子资源质量评价、装置和存储介质，用以准确客观地评价电子资源质量，提高电子资源评价结果的准确性。

第一方面，提供一种电子资源质量评价方法，包括：

获取针对待评价电子资源设定的每一评价指标的指标值；

根据各评价指标的指标值，利用聚类算法分别确定每一评价指标所属的类别；

根据每一评价指标对应的加权参数及其所属类别对应的评分，确定所述待评价电子资源的加权评分。

可选地，如果所述评价指标包含至少两个维度的向量，则在利用聚类算法分别确定每一评价指标所属的类别之前，还包括：

将包含至少两个维度向量的评价指标降维为一维向量。

可选地，将包含至少两个维度向量的评价指标降维为一维向量，具体包括：

针对包含至少两个维度向量的评价指标，根据每一维度向量对应的指标值和设定的理想指标每一维度向量对应的理想值，确定该评价指标与期望指标之间的欧式距离作为降维后的一维向量。

可选地，按照以下方法确定每一评价指标对应的加权参数：

根据预设的约束条件，确定每一评价指标对应的候选加权参数组成候选加权参数集合，其中所述约束条件至少包括各评价指标对应的加权参数之和为1；

针对每一候选加权参数集合，利用该候选加权参数集合中包含的各评价指标对应的候选加权参数以及各评价指标所属类别对应的评分，确定所述待评价电子资源的候选加权评分；

根据所述候选加权评分对所述待评价电子资源进行排序；

确定得到的排序结果与设定的排序结果之间误差最小的一组候选加权参数集合；

将确定出的一组候选加权参数集合中所包含的评价指标对应的候选加权参数为每一评价指标对应的加权参数。

可选地，所述约束条件还包括其中至少一个评价指标对应的加权参数不小于第一设定值和/或其中至少一个评价指标对应的加权参数不大于第二设定值。

可选地，所述评价指标包括以下至少一项：待评价电子资源获得的月票数量、待评价电子资源获得的单位点击量、在一个评价周期内待评价电子资源获得的点击量增量、待评价电子资源最近一次更新与上一次更新的间隔时长、用户针对待评价电子资源的评分和待评价电子资源对应的收藏数量，其中，用户针对待评价电子资源的评分包括评分用户数量和总评分两个维度的向量。

可选地，本发明实施例提供的电子资源质量评价方法，还包括：

根据每一电子资源的加权评分对所述电子资源进行排序。

第二方面，提供一种电子资源质量评价装置，包括：

获取单元，用于获取针对待评价电子资源设定的每一评价指标的指标值；

第一确定单元，用于根据各评价指标的指标值，利用聚类算法分别确定每一评价指标所属的类别；

第二确定单元，用于根据每一评价指标对应的加权参数及其所属类别对应的评分，确定所述待评价电子资源的加权评分。

可选地，本发明实施例提供的电子资源质量评价装置，还包括：

降维单元，用于如果所述评价指标包含至少两个维度的向量，则在所述第一确定单元利用聚类算法分别确定每一评价指标所属的类别之前，将包含至少两个维度向量的评价指标降维为一维向量。

可选地，所述降维单元，具体用于针对包含至少两个维度向量的评价指标，根据每一维度向量对应的指标值和设定的理想指标每一维度向量对应的理想值，确定该评价指标与期望指标之间的欧式距离作为降维后的一维向量。

第三确定单元，用于根据预设的约束条件，确定每一评价指标对应的候选加权参数组成候选加权参数集合，其中所述约束条件至少包括各评价指标对应的加权参数之和为1；

第四确定单元，用于针对每一候选加权参数集合，利用该候选加权参数集合中包含的各评价指标对应的候选加权参数以及各评价指标所属类别对应的评分，确定所述待评价电子资源的候选加权评分；

第一排序单元，用于根据所述候选加权评分对所述待评价电子资源进行排序；

第五确定单元，用于确定得到的排序结果与设定的排序结果之间误差最小的一组候选加权参数集合；将确定出的一组候选加权参数集合中所包含的评价指标对应的候选加权参数为每一评价指标对应的加权参数。

第二排序单元，用于根据每一电子资源的加权评分对所述电子资源进行排序。

第三方面，提供一种计算装置，包括至少一个处理器、以及至少一个存储器，其中，所述存储器存储有计算机程序，当所述程序被所述处理器执行时，使得所述处理器执行上述任一电子资源评价方法所述的步骤。

第四方面，提供一种计算机可读介质，其存储有可由终端设备执行的计算机程序，当所述程序在终端设备上运行时，使得所述终端设备执行上述任一电子资源评价方法所述的步骤。

本发明实施例提供的电子资源评价方法、装置和存储介质中，针对电子资源设定多个维度的评价指标，根据各评价指标对应的指标值利用聚类算法进行聚类，不同类别对应的评分不同，最后，根据各评价指标对应的评分以及权重参数进行加权得到电子资源的加权评分，上述过程中，由于根据指标值对评价指标进行聚类，并根据聚类结果确定相应的评分，再结合每一评价指标对应的加权参数确定加权评分，使得对每一指标的评分更加客观合理，从而提高了电子资源评价结果的准确性。

本发明的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本发明的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1为根据本发明实施方式的应用场景示意图；

图2为根据本发明实施方式的电子资源质量评价方法的实施流程示意图；

图3为根据本发明实施方式的评价数字漫画资源质量的两个主要因素各自可能涉及的评价指标示意图；

图4为根据本发明实施方式的针对数字漫画资源设计的评价指标示意图；

图5为根据本发明实施方式的聚类流程示意图；

图6a为根据本发明实施方式的第一种聚类结果示意图；

图6b为根据本发明实施方式的第二种聚类结果示意图；

图6c为根据本发明实施方式的第三种聚类结果示意图；

图6d为根据本发明实施方式的第四种聚类结果示意图；

图7a为根据本发明实施方式的确定各个评价指标对应的加权参数的实施流程示意图；

图7b为根据本发明实施方式的确定待评价数字漫画资源的实施流程示意图；

图8为根据本发明实施方式的电子资源质量评价装置的结构示意图；

图9为根据本发明实施方式的计算装置结构示意图。

具体实施方式

为了减少电子资源评价过程中的马太效应的影响，以更加准确客观地评价电子资源，提高电子资源评价结果的准确性，本发明实施例提供了一种电子资源评价方法、装置和存储介质。

首先，对本发明实施例中涉及的部分用语进行说明，以便于本领域技术人员理解。

1、加权，“权”即“权重”，亦称为“系数”，“加权”就是“乘以权重”，即“乘以系数”。

2、线性拟合，已知某函数的若干离散函数值{f1,f2,…,fn}，通过调整该函数中若干待定系数f(λ1,λ2,…,λm),使得该函数与已知点集的差别最小，如果待定函数是线性，就叫线性拟合或者线性回归。

3、马太效应，指强者愈强、弱者愈弱的现象。

4、百分制，满分为100分的评价机制。

5、聚类分析，聚类分析又称群分析，它是研究(样品或指标)分类问题的一种统计分析方法，同时也是数据挖掘的一个重要算法。

6、K-means，K-means算法是最为经典的基于划分的聚类方法，K-means算法的基本思想是：以空间中k个点为中心进行聚类，将最靠近这k个点的对象分别归类，通过迭代的方法，逐次更新各聚类中心的值，直至得到最好的聚类结果。

7、欧氏距离，欧氏距离是指在m维空间中两个点之间的真实距离，或者向量的自然长度(即该点到原点的距离)，在二维和三维空间中的欧氏距离就是两点之间的实际距离。

另外，需要说明的是，本发明中的终端设备可以是个人电脑(英文全称：PersonalComputer，PC)、平板电脑、个人数字助理(Personal Digita l Assistant，PDA)、个人通信业务(英文全称：Personal Communication Service，PCS)电话、笔记本和手机等终端设备，也可以是具有移动终端的计算机，例如，可以是便携式、袖珍式、手持式、计算机内置的或者车载的移动装置，它们能够向用户提供语音和/或数据连通性的设备，以及与无线接入网交换语言和/或数据。

另外，本发明实施例中的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。

以下结合说明书附图对本发明的优选实施例进行说明，应当理解，此处所描述的优选实施例仅用于说明和解释本发明，并不用于限定本发明，并且在不冲突的情况下，本发明中的实施例及实施例中的特征可以相互组合。

如图1所示，其为本发明实施例提供的电子资源评价方法的应用场景示意图。用户10通过终端设备11中安装的应用客户端登录应用服务器12，其中，应用客户端可以为网页的浏览器，也可以为安装于终端设备，如手机，平板电脑等中的应用程序客户端。

终端设备11与应用服务器12之间通过网络进行通信连接，该网络可以为局域网、蜂窝网和广域网等。终端设备11可以为便携设备(例如：手机、平板、笔记本电脑等)，也可以为个人电脑(PC，Personal Computer)，应用服务器12可以为任何能够提供互联网服务的设备。

其中，用户10利用终端设备11通过向应用服务器12注册获得用户名，应用服务器12在用户进行注册成功后存储用户名以及与用户10设置的用户密码作为认证信息，后续用户10利用终端设备11再次登录应用服务器12时，应用服务器12向应用客户端返回登录页面，用户在应用客户端显示的登录页面输入认证信息(即用户名和用户密码)并提交给应用服务器12，应用服务器12比较用户提交认证信息与自身在用户注册时存储的认证信息是否一致以确定是否允许用户登录。

应用服务器12可以为用户提供不同的互联网业务，例如，应用服务器12可以为用户提供云阅读业务，这种情况下，本发明实施例中涉及的电子资源可以为电子书资源，例如，数字漫画资源、数字小说资源、数字散文资源等等，应用服务器12还可以为用户提供视频播放业务，这种情况下，本发明实施例中涉及的电子资源可以为数字视频资源等等，应用服务器还可以为用户提供多媒体播放业务，这种情况下，本发明实施例中涉及的电子资源可以为数字音乐资源等等，应用服务器12还可以为用户提供应用程序下载业务，这种情况下，本发明实施例涉及的电子资源可以为应用程序等，具体实施时，根据应用服务器提供的业务不同，本发明实施例中涉及的电子资源也不同，这里不再一一列举。

本发明施例提供的电子资源评价方法可以应用于应用服务器中。在一个评价周期内，由应用服务器针对不同的评价指标收集统计相应的指标值，并根据各评价指标的指标值确定每一电子资源的加权评分。其中，评价周期可以根据实际需要进行设置，例如，可以设置一天作为一个评价周期，即每天更新各电子资源的加权评分，也可以设置一周作为一个评价周期，还可以设置一个月作为一个评价周期，本发明实施例对此不进行限定，根据各电子资源的加权评分，应用服务器可以根据电子资源的加权评分向用户推荐电子资源，例如，应用服务器可以根据加权评分对电子资源进行排序显示等等。

如图2所示，其为本发明实施例提供的电子资源质量评价方法的实施流程示意图，可以包括以下步骤：

S21、获取针对待评价电子资源设定的每一评价指标的指标值。

本步骤中，对于待评价电子资源，针对每一评价指标，可以获取该评价指标对应的指标值。

在评价指标的选取上，具体实施时，可以从用户和电子资源自身两个维度进行考虑，因为判断电子资源优劣的实质是用户对电子资源的认同程度，所以，本发明实施例中，选取的评价指标中也侧重于考虑用于的主观反馈。

以电子资源为数字漫画资源为例，如图3所示，其为评价数字漫画资源质量的两个主要因素各自可能涉及的评价指标。其中，读者(即用户)的主观反馈相关的评价指标可以包括：读者的主观反馈，包括：月票数量、红票、黑票、评分、评论、吐槽、点击量、阅读时长、收藏数量、下载数量、购买数量等。

其中，点击量是指某一段时间内数字漫画资源被点击的次数，是数字漫画资源被点击浏览的一种量词。评分是用户根据自身的阅读感受为某部数字漫画资源的评分分数，分数范围一般是0～10分，月票数量是业务平台提供的虚拟道具，用户可以购买月票投给自己喜欢的数字漫画资源作品；收藏是数字漫画资源平台提供的一种功能，是指用户将自己喜欢的数字漫画资源添加至收藏夹，收藏数量是指数字漫画资源被用户添加至收藏夹的次数。

在实际选取评价指标时，由于红票黑票形式比较旧，反映出的数据量小，阅读时长收集成本较大，下载平台覆盖不够，购买局限于收费数字漫画资源，所以本发明实施例中选择月票数量，点击量，评分，收藏数量作为读者主观反馈方面的评价指标。其中，对点击量而言，由于总点击量是历史值具备很强的马太效应，有鉴于此，本发明实施例中选择在当前评价周期被的点击量增量，比如，今天的总点击量减去昨天的总点击量即为今天的点击量增量，该评价指标可以让优质的数字漫画资源更快地提升加权评分，从而快速进入排行榜单中被推荐给用户。

另外，对于电子书资源来说，书籍的正文通常由若干章节组成，一本电子书的点击量为电子书每一章节的点击量的累加值，这种统计方式对于章节较多的电子书来说，其累积的点击量可能要远远大于章节较少的电子书，这就使得一些低质量且章节较多的电子书获得的加权评分反而高于一些优质但章节较少的电子书，对于电视剧等包含若干剧集的视频资源存在同样的问题，为了解决这一问题，本发明实施例中引入了单位点击量这一评价指标。单位点击量是指用户单位时间，例如一个评价周期内对数字漫画资源单位章节的平均点击量，这样，可以消除累计点击量对评价结果的噪声影响。

数字漫画资源自身涉及的评价指标如下：数字漫画资源客观方面的评价指标，包括：数字漫画资源的更新速度、数字漫画资源作者是否名家或者签约作者、数字漫画资源封面是否精美和数字漫画资源名字、介绍是否吸引用户等等。因为数字漫画资源封面和名字优劣难以量化，数字漫画资源作者是否名家或者签约对于评价结果相对不重要，所以本发明实施例中选择数字漫画资源更新速度作为评价指标之一。

综上，本发明实施例中涉及的电子资源评价指标可以包括以下至少一项：待评价电子资源获得的月票数量、待评价电子资源获得的单位点击量、在一个评价周期内待评价电子资源获得的点击量增量、待评价电子资源最近一次更新与上一次更新的间隔时长、用户针对待评价电子资源的评分和待评价电子资源对应的收藏数量，其中，用户针对待评价电子资源的评分包括评分用户数量和总评分两个维度的向量。仍然以数字漫画资源为例，针对数字漫画资源作品设计的评价指标如图4所示。

基于此，步骤S21中，获取各个评价指标的指标值，其中，月票数量、用户评分和收藏数量均可以为历史统计累加值，对于单位点击量可以计算每一章节或者每一剧集的平均点击量，而点击量增量可以统计当前评价周期较上一评价周期增加的点击量，更新时长可以计算电子资源最近一次更新与上一次更新的间隔时长，具体实施时，间隔时长可以以秒为单位进行统计。

S22、根据各评价指标的指标值，利用聚类算法分别确定每一评价指标所属的类别。

S23、根据每一评价指标对应的加权参数及其所属类别对应的评分，确定所述待评价电子资源的加权评分。

本发明实施例中，为了更加准确客观地对每一电子资源进行评价，具体实施时，针对不同的电子资源，可以根据同一评价指标的指标值对评价指标进行聚类，根据聚类结果，为属于同一类别的评价指标赋予相同的评分。例如，根据指标值可以将评价指标聚为5类，根据每一类中包含的指标值由高至低的顺序分别对应相应的评分：100,80,60,40,20。这样，对于每一电子资源的每一评价指标来说，均可以获得相应的评分。

以下以月票数量为例，对评价指标的聚类过程进行说明。具体实施时，可以采用K-means算法对评价指标进行聚类，包括以下步骤：

(1)初始时，可以随机选择c个类的初始中心，其中，c为大于等于2的自然数，其具体值可以根据实际需要归类的数量进行设定，例如，可以设定c＝5，即将所有待评价电子资源对应的月票数量划分为5类。

(2)在第k次迭代过程中，对于任意一个电子资源对应的月票数量，分别计算其到c个中心的距离，将该月票数量归到距离最短的中心所在的类.

(3)针对得到的每一类，更新该类的中心值，例如，可以通过计算该类的均值，以均值作为该类的中心值。

(4)对于所有的c个聚类中心，如果利用(2)(3)的迭代法更新后，中心值趋于稳定，则迭代结束，否则继续迭代，直至中心值趋于稳定。其中，中心值趋于稳定，可以定义为上一次迭代得到的中心值与本次迭代得到的中心值之间的差值在预设范围之内。

以下以c＝5，评价指标为评分值为例对具体的聚类过程进行描述，如图5所示，可以包括以下步骤：

S51、获取每一待评价电子资源的评分值Vi。

其中，i＝1,2,3……,n，n为待评价电子资源的数量。如图6a所示，这些评分值根据数值大小分布在数轴之上。

S52、选取5个初始中心点。

本例中，初始中心点可以选择为5分点，即这5个点将整个Vi平均分为距离相等的5份，每份间隔(Vimax-Vimin)/5，如图6b所示。

S53、计算每一评分值与各中心点之间的距离。

本步骤中，针对每一评分值，分别计算其与每一中心点之间的距离。

S54、针对每一评分值，确定该评分值与距离最近的中心点属于一类。

如图6c所示，节点A就属于聚类1，节点B属于聚类4，其中，每一节点对应一个评分值。

S55、针对每一类，调整该类的中心点。

本步骤中，针对每一类，可以按照以下方法调整该类的中心点：确定该类中所有评分值的均值，确定该均值为调整后的中心点。例如，可以调整聚类1的类中心为(ViA+Vi1+ViC)/3，针对每一类，按照该方法确定出每一类的新中心点，如图6d所示。

S56、判断新的中心点与旧的中心点之间的差值是否不大于预设阈值，如果是，则流程结束，如果否，则执行步骤S53。

在聚类结束后，可以将所有的评分值划分为5类，针对得到的聚类，按照聚类结果中包含的评分值由高至低的顺序分别分配对应的评分，依次为：100,80,60,40和20。

采用相同的方法，根据每一评价指标对应的指标值可以得到每一评价指标对应的评分。

具体实施时，如果评价指标包含至少两个维度的向量，这种情况下可以首先对其进行降维处理得到一维向量，然后根据得到的一维向量进行聚类。本发明实施例中，针对包含至少两个维度向量的评价指标，根据每一维度向量对应的指标值和设定的理想指标每一维度向量对应的理想值，确定该评价指标与期望指标之间的欧式距离作为降维后的一维向量。即针对多维指标设定一个理想指标，理想指标的各个维度对应的指标值均为该指标的理想值，例如，对于评分的理想指标是所有用户均打满分100分。

以评价指标评分为例，用户评分中可以包含如下两个维度：用户数量和用户评分。假设电子资源A的评分人数为3000人，总评分为24000，电子资源B的评分人数为4000人，总评分为28000分。而且，通过数据统计可知，单个电子资源最多的评分人数为20000人，则可以假定存在电子资源C的理想指标为评分人数为50000人，每人评分10分，即总评分对应的理想值为500000分，如表1所示。

表1

电子资源	评分人数	总评分
			A	3000	24000
B	4000	28000
			C	50000	500000

根据表1中的数据，可以按照以下公式计算两点(x₁,y₁)和(x₂,y₂)之间的距离disc：

可以得到电子资源A的评分指标与电子资源C的理想指标之间的欧式距离disc _A：

电子资源B的评分指标与电子资源C的理想指标之间的欧式距离disc_B：

同样地，对于其他电子资源，利用上述公式可以获得该电子资源的评分指标与理想指标之间的欧式距离，由此可以将两维的向量降维为一维向量。再利用K-means算法对评分指标进行聚类得到不同的类别，根据不同类别对应的评分可以确定各电子资源在评分指标上对应的评分。

在得到所有评价指标对应的评分之后，结合每一评价指标对应的加权参数可以获得各个电子资源对应的加权评分。

需要说明的是，具体实施时，对于包含一维向量的评价指标，也可以采用上述方法，即确定该评价指标与其对应的理想指标之间的欧式距离，然后根据确定出的欧式距离进行聚类的方法。例如，对于更新时间间隔这一评价指标，可以设定理想指标为1秒，分别确定更新时间间隔指标与理想指标之间的距离，并根据确定结果对更新时间间隔进行聚类，最终，根据聚类结果确定各电子资源的更新时间间隔这一指标对应的评分。

具体实施时，对多维指标进行降维可以采用其它方法，例如，对于评分指标来说可以根据评分人数和总评分来计算平均分，这样，也可以将评分指标降维为一维的向量。

具体实施时，可以按照图7a所示的流程确定各个评价指标对应的加权参数，包括以下步骤：

S71、根据预设的约束条件，确定每一评价指标对应的候选加权参数组成候选加权参数集合。

其中，确定各个评价指标对应的加权参数的约束条件至少包括各评价指标对应的加权参数之和为1。以评价指标包含6个为例，各个评价指标对应的加权参数分别为λ₁,λ₂,…,λ₆，则约束条件可以表示为λ₁+λ₂+λ₃+λ₄+λ₅+λ₆＝1。具体实施时，根据该约束条件，可以采用线性拟合的方式获得满足该约束条件的若干组解，每一组解便组成一个候选加权参数集合。

S72、针对每一候选加权参数集合，利用该候选加权参数集合中包含的各评价指标对应的候选加权参数以及各评价指标所属类别对应的评分，确定待评价电子资源的候选加权评分。

具体实施时，为了减少候选加权参数集合的数量，降低算法复杂度，本发明实施例中，可以增加约束条件，以快速从若干组候选加权参数集合中排除不满足约束条件的候选加权参数集合。其中，增加的约束条件可以包括以下至少一项：至少一个评价指标对应的加权参数不小于第一设定值和其中至少一个评价指标对应的加权参数不大于第二设定值。例如，可以增加约束条件如下：评价指标余票数量对应的加权参数不小于0.3，其他评价指标对应的加权参数不大于0.2等等。

假设用户评分对应的加权参数为λ₁，月票数量对应的加权参数为λ₂，单位点击量对应的加权参数为λ₃，更新时间间隔对应的加权参数为λ₄，点击量增量对应的加权参数为λ₅，收藏数量对应的加权参数为λ₆，以候选加权参数集合为λ₁＝0.1,λ₂＝0.4,λ₃＝0.2,λ₄＝0.15,λ₅＝0.1,λ₆＝0.05为例，则可以按照以下公式确定待评价电子资源i对应的评分：λ₁F_1i+λ₂F_2i+λ₃F_3i+λ₄F_4i+λ₅F_5i+λ₆F_i。

S73、根据候选加权评分对待评价电子资源进行排序。

S74、确定得到的排序结果与设定的排序结果之间误差最小的一组候选加权参数集合。

其中，设定的排序结果可以由专家给出，例如对于数字漫画资源，专家可以为数字漫画资源的专业编辑给出。以待评价电子资源分别为A，B，C，D为例，专家给定的排序结果分别为A-1，B-2，C-3，D-4，如表2所示：

表2

数字漫画资源	排名
		A	1
B	2
		C	3
D	4

根据步骤S71和步骤S72得到的其中一组候选加权参数集合确定待评价电子资源的排序结果为：A-1，B-3，C-2，D-4，如表3所示：

表3

数字漫画资源	排名
		A	1
B	3
		C	2
D	4

则具体实施时，可以按照以下公式计算两者之间的误差：将同一电子资源排名误差的绝对值之和作为两者之间的误差。本例中，专家给定的排序结果与该组候选加权参数集合确定出的排序结果之间的误差为：|1-1|+|2-3|+|3-2|+|4-4|＝2，以此类推，可以确定出每一候选加权参数集合对应的排序结果与设定的排序结果之间的误差。

S75、将确定出的一组候选加权参数集合中所包含的评价指标对应的候选加权参数为每一评价指标对应的加权参数。

最终，选择误差最小的一组候选加权参数集合中所包含的评价指标对应的候选加权参数为每一评价指标对应的加权参数。根据确定出的每一评价指标对应的加权参数，可以利用以下公式计算待评价电子资源对应的评分：

其中，λ_i为评价指标i对应的加权参数，F_ij为电子资源j的评价指标i对应的评分。

本发明实施例提供的电子资源评价方法还可以应用于需要为用户推荐电子资源的应用场景中，例如，电子书排行榜，热门视频资源排行榜等等，根据利用本发明实施例提供的电子资源评价方法得到的每一电子资源的加权评分结果，可以对各个榜单中包含的电子资源进行排序显示。具体实施时，可以根据电子资源推荐指令或者电子资源排序指令对各个榜单的电子资源进行排序，也可以根据设定的周期在每一周期开始时，利用本发明实施例提供的电子资源评价方法确定各电子资源的加权评分，并根据加权评分结果对电子资源进行排序。

为了更好地理解本发明实施例，以下结合评价数字漫画资源质量的实施流程对本发明实施例进行详细说明。假设有100个待评价数字漫画资源，针对待评价数字资源设定的评价指标包括以下6项：月票数量、单位点击量、点击量增量、更新时间间隔时长、用户评分和收藏数量，其中用户评分包含两个维度的向量，分别为评分用户数量和用户总评分。

如图7b所示，本发明实施例中，可以按照图7b所示的流程确定每一待评价电子资源的加权评分：

S701、针对每一待评价的数字漫画资源，根据设定的评价指标，分别获取该数字漫画资源的每一评价指标对应的指标值。

本步骤中，针对任一待评价数字漫画资源，分别获取该待评价数字漫画资源的月票数量，总点击量，在当前评价周期内的点击量增量，最近一次更新时间和上一次更新时间，评分用户数量和每一用户的评分以及收藏数量。

进一步地，根据总点击量和该待评价数字漫画资源包含的章节数量，确定该待评价数字漫画资源的单位点击量，并根据最近一次更新时间和上一次更新时间确定更新间隔时长，以及根据每一评分用户的评分统计用户对该待评价数字漫画资源的总评分。

S702、针对评价指标用户评分，分别确定每一数字漫画资源的用户评分与设定的理想用户评分之间的欧式距离。

在获取了各个待评价数字漫画资源的各个评价指标的指标值之后，对包含至少两个维度向量的评价指标进行降维处理。

本实施例中，包含至少两个维度的评价指标为用户评分，其包含评分用户数量和总评分两个维度的向量。以理想用户评分包含的两个维度的向量分别为：用户数量50000，每一用户评分10，则可以得到用户总评分的理想值为500000。据此，针对每一待评价数字漫画资源，根据该数字漫画资源的用户评分所包含的两个维度的指标值和理想用户评分包含的两个维度的理想指标值，确定各待评价数字漫画资源的用户评分与理想用户评分之间的理想值，其具体实施过程在上述已经说明，这里不再赘述。

在确定出各数字漫画资源的用户评分与理想用户评分之间的欧式距离之后，可以采用确定出的欧式距离来表征用户评分这一评价指标。

需要说明的是，具体实施时，理想指标可以设定为一个在实际应用中不可能实现的理想值。

S703、对于所有待评价数字漫画资源的各评价指标，根据相应的指标值进行聚类。

本步骤中，根据预先设定的聚类数量对各个评价指标进行聚类，其中，聚类数量可以根据实际需要进行设定，本实施例中，可以设定聚类数量为5，具体的聚类过程可以参照图5所示的流程，这里不再赘述。

S704、针对任一待评价数字漫画资源的任一评价指标，根据聚类结果确定该评价指标对应的评分。

具体实施时，对于每一评价指标，针对不同的类别可以预先设定不同的评分。以聚类数量为5为例，对于月票数量，可以按照每一类别中包含的月票数量由高到低的顺序分别确定每一类对应的评分分别为100,80,60,40,20；对于用户评分，可以按照每一类别中的欧式距离由近至远的顺序分别确定每一类对应的评分分别为100,80,60,40,20；对于更新时间间隔，可以按照每一类别中的更新时间间隔时长由短到长的顺序分别确定每一类对应的评分分别为100,80,60,40,20；对于单位点击量和点击量增量以及收藏数量，可以按照每一类别中的单位点击量和点击量增量以及收藏数量由多到少的顺序分别确定每一类对应的评分分别为100,80,60,40,20。

这样，可以得到每一待评价数字漫画资源的每一评价指标对应的评分。

进一步地，需要确定出各个评价指标对应的加权参数。

S705、根据设定的约束条件，确定满足约束条件的候选加权参数集合。

具体实施时，首先需要根据设定的约束条件，利用线性拟合方法拟合得到各评价指标对应的加权参数。假设各评价指标对应的加权参数分别为λ₁,λ₂,…,λ₆。其中，设定的约束条件如下：

约束条件1、各评价指标对应的加权参数之和为1，即λ₁+λ₂+λ₃+λ₄+λ₅+λ₆＝1。

约束条件2：λ₁不小于0.3。

约束条件3：λ_i不大于0.2，其中i＝2,3,4,5,6

根据上述约束条件，利用线性拟合方法可以获得若干满足上述约束条件的加权参数集合。本发明实施例中，将其作为候选加权参数集合，从中选择出使得评价结果最优的一组候选加权参数集合，将其包含的各个加权参数作为各个评价指标对应的加权参数。

S706、针对每一候选加权参数集合，利用该候选加权参数集合中包含的各评价指标对应的候选加权参数以及各评价指标所属类别对应的评分，分别确定每一待评价数字漫画资源的候选加权评分。

本步骤中，可以根据如下公式确定待评价数字漫画资源对应的评分：

其中，λ_i为评价指标i对应的加权参数，F_ij为数字漫画资源j的评价指标i对应的评分。

针对每一待评价数字漫画资源，根据候选加权参数集合中包含的每一评价指标对应的加权参数和步骤S704中确定出的每一评价指标对应的评分，利用公式

确定每一待评价数字漫画资源对应的加权评分。

S707、根据候选加权评分对各待评价数字漫画资源进行排序。

本步骤中，可以根据加权评分由高至低的顺序对各待评价数字漫画资源进行排序。

S708、确定得到的排序结果与设定的排序结果之间误差。

本步骤中，可以确定同一电子资源排名误差的绝对值之和为两个排序结果之间的误差。

为了便于描述，以待评价数字漫画资源有6个为例，分别为A，B，C，D，E，F，设定的排序结果如表4所示：

表4

数字漫画资源	排名
		A	2
B	3
		C	1
D	5
		E	4
F	6

具体实施时，根据步骤S707得到的各待评价数字漫画资源的排序结果如表5所示：

表5

数字漫画资源	排名	误差绝对值
			A	3	1
B	1	2
			C	2	1
D	6	1
			E	5	1
F	4	2

这样，可以确定根据该组候选加权参数集合得到的排序结果与给定的排序结果之间的误差为：8。

S709、选择对应的误差最小的一组候选加权参数集合。

S710、将选择出的一组候选加权参数集合中所包含的候选加权参数作为每一评价指标对应的加权参数。

具体实施时，假设根据步骤S705～710选择出的每一评价指标对应的加权参数如表6所示：

表6

评价指标	加权参数
		月票数量	0.4
单位点击量	0.2
		点击量增量	0.1
更新时间间隔	0.15
		用户评分	0.1
收藏数量	0.05

S711、根据每一评价指标对应的加权参数及其所属类别对应的评分，确定所述待评价数字漫画资源的加权评分。

至此，可以获得每一待评价数字漫画资源的加权评分，应用服务器根据各待评价数字漫画资源的加权评分可以对各待评价数字漫画资源进行排序并提供给用户，由此实现了向用户推荐优质数字漫画资源的目的。

本发明实施例提供的电子资源评价方法中，针对电子资源多个维度的评价指标，首先根据各个指标的指标值进行聚类，根据聚类结果确定相应类别的评分，最后根据各评价指标的加权参数和评分确定电子资源的加权评分，其中，对于加权参数可以根据设定的约束条件确定出若干组加权参数集合，针对每一组加权参数集合，根据其中的加权参数确定每一电子资源的加权评分并据此对电子资源进行排序，确定与设定的电子资源排序误差最小的一组加权参数集合为确定出的加权参数，上述过程中，不仅考虑了多个维度的评价指标，而且针对每一评价指标将其转换为统一的衡量***中进行评分，使得据此得到的电子资源评价结果更加客观准确，进而使得据此向用户推荐的电子资源排序结果也更加准确。

基于同一发明构思，本发明实施例中还提供了一种电子资源质量评价装置，由于上述装置解决问题的原理与电子资源质量评价方法相似，因此上述装置的实施可以参见方法的实施，重复之处不再赘述。

如图8所示，其为本发明实施例提供的电子资源质量评价装置的结构示意图，包括：

获取单元81，用于获取针对待评价电子资源设定的每一评价指标的指标值；

第一确定单元82，用于根据各评价指标的指标值，利用聚类算法分别确定每一评价指标所属的类别；

第二确定单元83，用于根据每一评价指标对应的加权参数及其所属类别对应的评分，确定所述待评价电子资源的加权评分。

为了描述的方便，以上各部分按照功能划分为各模块(或单元)分别描述。当然，在实施本发明时可以把各模块(或单元)的功能在同一个或多个软件或硬件中实现。

在介绍了本发明示例性实施方式的电子资源质量评价方法和装置之后，接下来，介绍根据本发明的另一示例性实施方式的计算装置。

所属技术领域的技术人员能够理解，本发明的各个方面可以实现为***、方法或程序产品。因此，本发明的各个方面可以具体实现为以下形式，即：完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等)，或硬件和软件方面结合的实施方式，这里可以统称为“电路”、“模块”或“***”。

在一些可能的实施方式中，根据本发明的计算装置可以至少包括至少一个处理器、以及至少一个存储器。其中，所述存储器存储有程序代码，当所述程序代码被所述处理器执行时，使得所述处理器执行本说明书上述描述的根据本发明各种示例性实施方式的电子资源质量评价方法中的步骤。例如，所述处理器可以执行如图2中所示的步骤S21、获取针对待评价电子资源设定的每一评价指标的指标值，和步骤S22、根据各评价指标的指标值，利用聚类算法分别确定每一评价指标所属的类别；以及步骤S23、根据每一评价指标对应的加权参数及其所属类别对应的评分，确定所述待评价电子资源的加权评分。

下面参照图9来描述根据本发明的这种实施方式的计算装置90。图9显示的计算装置90仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。

如图9所示，计算装置90以通用计算设备的形式表现。计算装置90的组件可以包括但不限于：上述至少一个处理器91、上述至少一个存储器92、连接不同***组件(包括存储器92和处理器91)的总线93。

总线93表示几类总线结构中的一种或多种，包括存储器总线或者存储器控制器、***总线、处理器或者使用多种总线结构中的任意总线结构的局域总线。

存储器92可以包括易失性存储器形式的可读介质，例如随机存取存储器(RAM)921和/或高速缓存存储器922，还可以进一步包括只读存储器(ROM)923。

存储器92还可以包括具有一组(至少一个)程序模块924的程序/实用工具925，这样的程序模块924包括但不限于：操作***、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。

计算装置90也可以与一个或多个外部设备94(例如键盘、指向设备等)通信，还可与一个或者多个使得用户能与计算装置90交互的设备通信，和/或与使得该计算装置90能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口95进行。并且，计算装置90还可以通过网络适配器96与一个或者多个网络(例如局域网(LAN)，广域网(WAN)和/或公共网络，例如因特网)通信。如图所示，网络适配器96通过总线93与用于计算装置90的其它模块通信。应当理解，尽管图中未示出，可以结合计算装置90使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID***、磁带驱动器以及数据备份存储***等。

在一些可能的实施方式中，本发明提供的电子资源质量评价方法的各个方面还可以实现为一种程序产品的形式，其包括程序代码，当所述程序产品在计算机设备上运行时，所述程序代码用于使所述计算机设备执行本说明书上述描述的根据本发明各种示例性实施方式的电子资源质量评价方法中的步骤，例如，所述计算机设备可以执行如图2中所示的步骤S21、获取针对待评价电子资源设定的每一评价指标的指标值，和步骤S22、根据各评价指标的指标值，利用聚类算法分别确定每一评价指标所属的类别；以及步骤S23、根据每一评价指标对应的加权参数及其所属类别对应的评分，确定所述待评价电子资源的加权评分。

所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

本发明的实施方式的用于电子资源质量评价的程序产品可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码，并可以在计算设备上运行。然而，本发明的程序产品不限于此，在本文件中，可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行***、装置或者器件使用或者与其结合使用。

可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了可读程序代码。这种传播的数据信号可以采用多种形式，包括——但不限于——电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质，该可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。

可读介质上包含的程序代码可以用任何适当的介质传输，包括——但不限于——无线、有线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中，远程计算设备可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算设备，或者，可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。

应当注意，尽管在上文详细描述中提及了装置的若干单元或子单元，但是这种划分仅仅是示例性的并非强制性的。实际上，根据本发明的实施方式，上文描述的两个或更多单元的特征和功能可以在一个单元中具体化。反之，上文描述的一个单元的特征和功能可以进一步划分为由多个单元来具体化。

此外，尽管在附图中以特定顺序描述了本发明方法的操作，但是，这并非要求或者暗示必须按照该特定顺序来执行这些操作，或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地，可以省略某些步骤，将多个步骤合并为一个步骤执行，和/或将一个步骤分解为多个步骤执行。

本领域内的技术人员应明白，本发明的实施例可提供为方法、***、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本发明的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例做出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种电子资源质量评价方法，其特征在于，包括：

获取针对待评价电子资源设定的每一评价指标的指标值；

根据每一评价指标对应的加权参数及其所属类别对应的评分，确定所述待评价电子资源的加权评分；

其中，按照以下方法确定每一评价指标对应的加权参数：

根据所述候选加权评分对所述待评价电子资源进行排序；

2.如权利要求1所述的方法，其特征在于，如果所述评价指标包含至少两个维度的向量，则在利用聚类算法分别确定每一评价指标所属的类别之前，还包括：

将包含至少两个维度向量的评价指标降维为一维向量。

3.如权利要求2所述的方法，其特征在于，将包含至少两个维度向量的评价指标降维为一维向量，具体包括：

4.如权利要求1所述的方法，其特征在于，所述约束条件还包括其中至少一个评价指标对应的加权参数不小于第一设定值和/或其中至少一个评价指标对应的加权参数不大于第二设定值。

5.如权利要求1～4任一权利要求所述的方法，其特征在于，所述评价指标包括以下至少一项：待评价电子资源获得的月票数量、待评价电子资源获得的单位点击量、在一个评价周期内待评价电子资源获得的点击量增量、待评价电子资源最近一次更新与上一次更新的间隔时长、用户针对待评价电子资源的评分和待评价电子资源对应的收藏数量，其中，用户针对待评价电子资源的评分包括评分用户数量和总评分两个维度的向量。

6.如权利要求5所述的方法，其特征在于，还包括：

根据每一电子资源的加权评分对所述电子资源进行排序。

7.一种电子资源质量评价装置，其特征在于，包括：

第五确定单元，用于确定得到的排序结果与设定的排序结果之间误差最小的一组候选加权参数集合；将确定出的一组候选加权参数集合中所包含的评价指标对应的候选加权参数为每一评价指标对应的加权参数；

8.如权利要求7所述的装置，其特征在于，还包括：

9.如权利要求8所述的装置，其特征在于，

所述降维单元，具体用于针对包含至少两个维度向量的评价指标，根据每一维度向量对应的指标值和设定的理想指标每一维度向量对应的理想值，确定该评价指标与期望指标之间的欧式距离作为降维后的一维向量。

10.如权利要求7所述的装置，其特征在于，所述约束条件还包括其中至少一个评价指标对应的加权参数不小于第一设定值和/或其中至少一个评价指标对应的加权参数不大于第二设定值。

11.如权利要求10所述的装置，其特征在于，还包括：

12.一种计算装置，其特征在于，包括至少一个处理器、以及至少一个存储器，其中，所述存储器存储有计算机程序，当所述程序被所述处理器执行时，使得所述处理器执行权利要求1～6任一权利要求所述方法的步骤。

13.一种计算机可读介质，其特征在于，其存储有可由终端设备执行的计算机程序，当所述程序在终端设备上运行时，使得所述终端设备执行权利要求1～6任一所述方法的步骤。