CN110795658A - 用户评分方法、装置、电子设备及计算机存储介质 - Google Patents
用户评分方法、装置、电子设备及计算机存储介质 Download PDFInfo
- Publication number
- CN110795658A CN110795658A CN201910913446.6A CN201910913446A CN110795658A CN 110795658 A CN110795658 A CN 110795658A CN 201910913446 A CN201910913446 A CN 201910913446A CN 110795658 A CN110795658 A CN 110795658A
- Authority
- CN
- China
- Prior art keywords
- user
- dimension
- content
- score
- dimensions
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Transfer Between Computers (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本公开实施例提供了一种用户评分方法、装置、电子设备及计算机可读存储介质。所述方法包括:获取用户在指定业务平台上的多个维度的数据信息;基于所述多个维度的数据信息,确定所述用户在各个维度下的评分值;基于所述用户在各个维度下的评分值和各个维度对应的维度权重,确定所述用户的目标评分值。本公开实施例可以动态反映出用户的等级变化,无需频繁更改用户等级,并且,结合每个维度对应的维度权重确定用户的最终评分,能够有效防止单一数据带来的评分变化。
Description
技术领域
本公开的实施例涉及计算机技术领域,尤其涉及一种用户评分方法、装置、电子设备及计算机存储介质。
背景技术
随着互联网技术和计算机技术的发展,能够向用户提供服务的网站和应用程序(Application,APP)越来越多。这些网站或APP的运营者为了吸引新用户和维护老用户,会将用户划分至不同的用户等级,并针对不同用户等级的用户采用不同的运营策略,以在提升用户体验的同时提高用户黏性。
目前,这些网站或APP,主要基于用户在网站或APP中的使用行为数据,进行用户等级的划分。例如,根据用户行为的累计值对用户的等级进行划分,而一些论坛会基于用户发表的文章或帖子数量等产出内容,进行用户等级的划分。
上述用户等级的划分方式,是用户行为的累计分值,要经常变动分数规则:两者分数都是累计值,随着整体数据的提升要不断修改分值,无法动态反映出用户等级的变化,并且,上述等级划分方式单一,某一指标的突出可能使得分数无限增长,无法设定统一的等级标准,容易出现刷分的现象。
发明内容
本公开实施例提供了一种用户评分方法、装置、电子设备及计算机存储介质,用以动态反映出用户的等级变化,无需频繁更改用户等级,且能够有效防止单一数据带来的评分变化。
根据本公开实施例的第一方面,提供了一种用户评分方法,包括:
获取用户在指定业务平台上的多个维度的数据信息;
基于所述多个维度的数据信息,确定所述用户在各个维度下的评分值;
基于所述用户在各个维度下的评分值和各个维度对应的维度权重,确定所述用户的目标评分值。
可选地,还包括:
确定用于评价的多个维度及各个维度的维度权重。
可选地,所述多个维度是从账号影响维度、创作频率维度、内容效果维度、内容专业维度、内容健康维度、以及原创维度中选取的。
可选地,所述多个维度包括账号影响维度,所述获取用户在指定业务平台上的多个维度的数据信息的步骤,包括:
获取用户在指定业务平台上的账号影响维度的数据信息;
所述获取用户在指定业务平台上的账号影响维度的数据信息的步骤,包括:
获取所述用户在所述指定业务平台上的平台等级、用户等级和粉丝量;
所述基于所述多个维度的数据信息,确定所述用户在各个维度下的评分值的步骤,包括:
获取所述平台等级对应的平台分值、所述用户等级对应的用户分值及所述粉丝量对应的粉丝分值;
基于所述平台分值、所述用户分值和所述粉丝分值,计算得到所述用户在所述账号影响维度下的账号影响分值。
可选地,所述多个维度包括创作频率维度,所述获取用户在指定业务平台上的多个维度的数据信息的步骤,包括:
获取用户在指定业务平台上的创作频率维度的数据信息;
所述获取用户在指定业务平台上的创作频率维度的数据信息的步骤,包括:
在从第一统计起始时间至当前时间之内,获取所述用户在所述指定业务平台上的每天的发文内容数量;
所述基于所述多个维度的数据信息,确定所述用户在各个维度下的评分值的步骤,包括:
基于每天的所述发文内容数量,确定每天的发文分值;
基于第一时间衰减因子,对每天的所述发文分值进行调整,得到每天的调整发文分值;
基于各所述调整发文分值,计算得到所述用户在所述创作频率维度下的创作频率分值。
可选地,所述多个维度包括内容效果维度,所述获取用户在指定业务平台上的多个维度的数据信息的步骤,包括:
获取用户在指定业务平台上的内容效果维度的数据信息;
所述获取用户在指定业务平台上的内容效果维度的数据信息的步骤,包括:
在从第二统计起始时间至当前时间内,获取所述用户在所述指定业务平台上的每天内发布的至少一个发文内容;
所述基于所述多个维度的数据信息,确定所述用户在各个维度下的评分值的步骤,包括:
获取每个所述发文内容对应的喜爱度和分享收藏度;所述喜爱度与浏览数目、点赞数目和评论数目有关,所述分享收藏度与收藏数目、分享数目和点击数目有关;
基于各所述喜爱度和各所述分享收藏度,计算得到每天的内容分值;
基于第二时间衰减因子,对每天的所述内容分值进行调整,得到每天的调整内容分值;
基于各所述调整内容分值,计算得到所述用户在所述内容效果维度下的内容效果分值。
可选地,所述多个维度包括内容专业维度,所述获取用户在指定业务平台上的多个维度的数据信息的步骤,包括:
获取用户在指定业务平台上的内容专业维度的数据信息;
所述获取用户在指定业务平台上的内容专业维度的数据信息的步骤,包括:
获取所述用户在所述指定业务平台上的所有发文内容;
所述基于所述多个维度的数据信息,确定所述用户在各个维度下的评分值的步骤,包括:
获取所述所有发文内容的总内容数,及所述所有发文内容中的精品内容数、热点内容数和推进内容数;
基于所述精品内容数和所述总内容数,计算得到精品内容率;
基于所述精品内容数、所述精品内容率、所述热点内容数和所述推进内容数,计算得到所述用户在所述内容专业维度下的内容专业分值。
可选地,所述多个维度包括内容健康维度,所述基于所述多个维度的数据信息,确定所述用户在各个维度下的评分值的步骤,包括:
获取所述所有发文内容中的不分发内容数和违规内容数;
基于所述不分发内容数和所述违规内容数,确定所述用户在所述内容健康维度下的内容健康分值。
可选地,所述多个维度包括原创维度,所述基于所述多个维度的数据信息,确定所述用户在各个维度下的评分值的步骤,包括:
获取所述所有发文内容中的原创内容数和非原创内容数;
基于所述原创内容数和所述非原创内容数,计算得到所述用户在所述原创维度下的内容原创分值。
可选地,所述基于所述用户在各个维度下的评分值和各个维度对应的维度权重,确定所述用户的目标评分值的步骤,包括:
计算各个维度的评分值与各个维度对应的维度权重的乘积值;
将各所述乘积值相加求和,得到所述目标评分值。
根据本公开实施例的第二方面,提供了一种用户评分装置,包括:
数据信息获取模块,用于获取用户在指定业务平台上的多个维度的数据信息;
评分值确定模块,用于基于所述多个维度的数据信息,确定所述用户在各个维度下的评分值;
目标评分确定模块,用于基于所述用户在各个维度下的评分值和各个维度对应的维度权重,确定所述用户的目标评分值。
可选地,还包括:
维度权重确定模块,用于确定用于评价的多个维度及各个维度的维度权重。
可选地,所述多个维度是从账号影响维度、创作频率维度、内容效果维度、内容专业维度、内容健康维度、原创维度中选取的。
可选地,所述多个维度包括账号影响维度,所述数据信息获取模块包括:
第一数据信息获取子模块,用于获取用户在指定业务平台上的账号影响维度的数据信息;
所述第一数据信息获取子模块包括:
等级粉丝量获取子模块,用于获取所述用户在所述指定业务平台上的平台等级、用户等级和粉丝量;
所述评分值确定模块包括:
等级粉丝分值获取子模块,用于获取所述平台等级对应的平台分值、所述用户等级对应的用户分值及所述粉丝量对应的粉丝分值;
账号影响分值计算子模块,用于基于所述平台分值、所述用户分值和所述粉丝分值,计算得到所述用户在所述账号影响维度下的账号影响分值。
可选地,所述多个维度包括创作频率维度,所述数据信息获取模块包括:
第二数据信息获取子模块,用于获取用户在指定业务平台上的创作频率维度的数据信息;
所述第二数据信息获取子模块包括:
发文内容数获取子模块,用于在从第一统计起始时间至当前时间之内,获取所述用户在所述指定业务平台上的每天的发文内容数量;
所述评分值确定模块包括:
发文分值确定子模块,用于基于每天的所述发文内容数量,确定每天的发文分值;
调整发文分值获取子模块,用于基于第一时间衰减因子,对每天的所述发文分值进行调整,得到每天的调整发文分值;
创作频率分值计算子模块,用于基于各所述调整发文分值,计算得到所述用户在所述创作频率维度下的创作频率分值。
可选地,所述多个维度包括内容效果维度,所述数据信息获取模块包括:
第三数据信息获取子模块,用于获取用户在指定业务平台上的内容效果维度的数据信息;
所述第三数据信息获取子模块包括:
发文内容获取子模块,用于在从第二统计起始时间至当前时间内,获取所述用户在所述指定业务平台上的每天内发布的至少一个发文内容;
所述评分值确定模块包括:
喜爱度获取子模块,用于获取每个所述发文内容对应的喜爱度和分享收藏度;所述喜爱度与浏览数目、点赞数目和评论数目有关,所述分享收藏度与收藏数目、分享数目和点击数目有关;
内容分值计算子模块,用于基于各所述喜爱度和各所述分享收藏度,计算得到每天的内容分值;
调整内容分值获取子模块,用于基于第二时间衰减因子,对每天的所述内容分值进行调整,得到每天的调整内容分值;
内容效果分值计算子模块,用于基于各所述调整内容分值,计算得到所述用户在所述内容效果维度下的内容效果分值。
可选地,所述多个维度包括内容专业维度,所述数据信息获取模块包括:
第四数据信息获取子模块,用于获取用户在指定业务平台上的内容专业维度的数据信息;
所述第四数据信息获取子模块包括:
所有发文内容获取子模块,用于获取所述用户在所述指定业务平台上的所有发文内容;
所述评分值确定模块包括:
内容数获取子模块,用于获取所述所有发文内容的总内容数,及所述所有发文内容中的精品内容数、热点内容数和推进内容数;
内容率计算子模块,用于基于所述精品内容数和所述总内容数,计算得到精品内容率;
内容专业分值计算子模块,用于基于所述精品内容数、所述精品内容率、所述热点内容数和所述推进内容数,计算得到所述用户在所述内容专业维度下的内容专业分值。
可选地,所述多个维度包括内容健康维度,所述评分值确定模块包括:
所有内容数获取子模块,用于获取所述所有发文内容中的不分发内容数和违规内容数;
内容健康分确定子模块,用于基于所述不分发内容数和所述违规内容数,确定所述用户在所述内容健康维度下的内容健康分值。
可选地,所述多个维度包括原创维度,所述评分值确定模块包括:
原创内容数获取子模块,用于获取所述所有发文内容中的原创内容数和非原创内容数;
内容原创分计算子模块,用于基于所述原创内容数和所述非原创内容数,计算得到所述用户在所述原创维度下的内容原创分值。
可选地,所述目标评分确定模块包括:
乘积值计算子模块,用于计算各个维度的评分值与各个维度对应的维度权重的乘积值;
目标评分获取子模块,用于将各所述乘积值相加求和,得到所述目标评分值。
根据本公开实施例的第三方面,提供了一种电子设备,包括:
处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现上述任一项所述的用户评分方法。
根据本公开实施例的第四方面,提供了一种计算机可读存储介质,存储有计算机指令,当所述计算机指令由电子设备的处理器执行时,使得电子设备能够执行上述任一项所述的用户评分方法。
本公开实施例提供的用户评分方案,通过获取用户在指定业务平台上的多个维度的数据信息,基于多个维度的数据信息,确定用户在各个维度下的评分值,并基于用户在各个维度下的评分值和各个维度对应的维度权重,确定用户的目标评分值。本公开实施例结合与用户关联的多个维度的数据信息对用户进行评分,根据用户评分可以动态反映出用户的等级变化,无需频繁更改用户等级,并且,结合每个维度对应的维度权重确定用户的最终评分(即目标评分值),能够有效防止单一数据带来的评分变化。
附图说明
为了更清楚地说明本公开的实施例的技术方案,下面将对本公开的实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的实施例的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1示出了本公开实施例一提供的用户评分方法的步骤流程图;
图2示出了本公开实施例二提供的用户评分方法的步骤流程图;
图3示出了本公开实施例三提供的用户评分装置的结构示意图;
图4示出了本公开实施例四提供的用户评分装置的结构示意图;
图5示出了图4中的用户评分装置提供的目标评分确定模块的结构示意图。
具体实施方式
下面将结合本公开的实施例中的附图,对本公开的实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本公开的实施例一部分实施例,而不是全部的实施例。基于本公开的实施例中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开的实施例保护的范围。
参照图1,示出了本公开实施例一提供的用户评分方法的步骤流程图。如图1所示,该用户评分方法可以包括如下步骤:
步骤101:获取用户在指定业务平台上的多个维度的数据信息。
在本公开实施例中,指定业务平台可以是能够向用户提供服务的网站或APP(如美团APP),用户可以在指定业务平台上发布图片、写点评、发布视频等。
多个维度是指结合用户在指定业务平台上的产生的行为生成的维度。
在本公开中,多个维度可以是从账号影响维度、创作频率维度、内容效果维度、内容专业维度、内容健康维度、以及原创维度等维度中选取的两个或两个以上的维度。
账号影响维度是指结合用户的账号在指定平台上的影响力。
创作频率维度是指用户在指定业务平台上发布文章的频率。
内容效果维度是指用户发布的文章的数据表现,如发布文章的浏览次数、点赞次数、评论次数等。
内容专业维度是指用户发布的文章在专业领域的权威性。
内容健康维度是指用户发布的文章是否符合规范,如是否存在不健康词汇,或是否会造成舆论的不良影响等。
原创维度是指用户的原创能力,可以是结合用户在指定业务平台上发布文章的数量确定的。
在确定多个维度之后,可以根据用户在指定业务平台上产生的用户行为,获取用户在指定业务平台上的多个维度的数据信息。
在某些示例中,可以预先设置每天获取数据信息的固定时间,如每天10:00、20:00等。如此,在每天达到设置的固定时间时,即获取用户在指定业务平台上的多个维度的数据信息。
在某些示例中,可以每隔预置时间间隔执行一次获取数据信息的操作,如每隔两个小时或三个小时等。如此,每隔预置时间间隔,即执行一次获取用户在指定业务平台上的多个维度的数据信息。
在某些示例中,可以采用网络爬虫技术,从指定业务平台上获取多个维度的数据信息。
在某些示例中,可以采用多线程爬取数据的方式,即针对每个维度分别创建一个线程,通过调用多个维度分别对应的线程从指定业务平台上爬取相应维度的数据信息。
可以理解地,上述示例仅是为了更好地理解本公开实施例的技术方案而列举的示例,不作为对本公开实施例的唯一限制。
在获取用户在指定业务平台上的多个维度的数据信息之后,执行步骤102。
步骤102:基于多个维度的数据信息,确定所述用户在各个维度下的评分值。
在得到用户在指定业务平台上的多个维度的数据信息之后,可以结合每个维度的数据信息,计算得到用户在每个维度下的评分值。
而获取的数据信息中有些数据信息距离当前时间较近(如近几天的数据信息等),而有些数据信息距离当前时间较远(如距离当前时间已经一个月的数据信息等),进而,在计算每个维度下的评分值时,可以结合时间衰减因子,即一条数据信息,距离当前时间越近,则评分时所占的比重越大,分值越高,而距离当前越远,则评分时所占的比重越小,分值越低。
可以理解地,上述示例仅是为了更好地理解本公开实施例的技术方案而列举的示例,不作为对本公开实施例的唯一限制。
对于计算用户在每个维度下的评分值的详细过程,将在下述方法实施例中进行详细描述,本公开实施例在此不再加以赘述。
在根据各个维度的数据信息,确定出用户在多个维度下的评分值之后,执行步骤103。
步骤103:基于所述用户在各个维度下的评分值和各个维度对应的维度权重,确定所述用户的目标评分值。
维度权重是指预先设置的与每个维度对应的权重值,如账号影响维度对应的维度权重为0.6,创作频率维度对应的维度权重为0.8,内容效果维度对应的维度权重为0.7等。
目标评分值是指结合各维度的评分值和维度权重,计算得到的用户的最终评分值,目标评分值可以反映出用户在指定业务平台的等级,目标评分值越高表示用户在指定业务平台上的等级越高,而目标评分值越低表示用户在指定业务平台上的等级越低。
在某些示例中,可以设置固定的维度权重,即对于同一个维度,每个用户在该维度下的维度权重是相同的。例如,在维度权重为账号影响维度时,账号影响维度对应的维度权重为0.8,则所有用户在账号影响维度下的维度权重均为0.8。
在某些示例中,可以针对不同的用户设置不同的维度权重,即对于同一个维度,每个用户在该维度下的维度权重是不相同的。例如,在维度权重为账号影响维度时,用户a在账号影响维度下的维度权重为0.8,用户b在账号影响维度下的维度权重为0.6。
可以理解地,上述示例仅是为了更好地理解本公开实施例的技术方案而列举的示例,不作为对本公开实施例的唯一限制。
在获取用户在各个维度下的评分值和各个维度对应的维度权重之后,可以根据评分值和维度权重计算用户的目标评分值,具体地,首先,可以计算每个维度下的评分值与该维度对应的维度权重的乘积值,然后将所有的乘积值相加,得到最终的和值,并将最终的和值作为用户的目标评分值。
本公开实施例通过结合用户在指定业务平台上的多个维度的数据信息对用户进行评分,可以动态反映出用户等级变化,无需频繁更改用户等级,并且,结合每个维度对应的维度权重确定用户的最终评分(即目标评分值),能够有效防止单一数据带来的评分变化。
本公开实施例提供的用户评分方法,通过获取用户在指定业务平台上的多个维度的数据信息,基于多个维度的数据信息,确定用户在各个维度下的评分值,并基于用户在各个维度下的评分值和各个维度对应的维度权重,确定用户的目标评分值。本公开实施例结合与用户关联的多个维度的数据信息对用户进行评分,根据用户评分可以动态反映出用户的等级变化,无需频繁更改用户等级,并且,结合每个维度对应的维度权重确定用户的最终评分(即目标评分值),能够有效防止单一数据带来的评分变化。
参照图2,示出了本公开实施例二提供的用户评分方法的步骤流程图。如图2所示,该用户评分方法可以包括如下步骤:
步骤201:获取用户在指定业务平台上的多个维度的数据信息。
在本公开实施例中,指定业务平台可以是能够向用户提供服务的网站或APP(如美团APP),用户可以在指定业务平台上发布图片、写点评、发布视频等。
多个维度是指结合用户在指定业务平台上的产生的行为生成的维度。
在本公开中,多个维度可以是从账号影响维度、创作频率维度、内容效果维度、内容专业维度、内容健康维度、原创维度等维度中选取的两个或两个以上的维度。
在确定多个维度之后,可以根据用户在指定业务平台上产生的用户行为,获取用户在指定业务平台上的多个维度的数据信息。
在某些示例中,可以预先设置每天获取数据信息的固定时间,如每天10:00、20:00等,在每天达到设置的固定时间时,即获取用户在指定业务平台上的多个维度的数据信息。
在某些示例中,可以每隔预置时间间隔执行一次获取数据信息的操作,如每隔两个小时或三个小时等,即每隔预置时间间隔,即执行一次获取用户在指定业务平台上的多个维度的数据信息。
在某些示例中,可以采用网络爬虫技术,从指定业务平台上获取多个维度的数据信息。
在某些示例中,可以采用多线程爬取数据的方式,即针对每个维度分别创建一个线程,通过调用多个维度分别对应的线程从指定业务平台上爬取相应维度的数据信息。
可以理解地,上述示例仅是为了更好地理解本公开实施例的技术方案而列举的示例,不作为对本公开实施例的唯一限制。
接下来,结合上述提及的多个维度针对获取数据信息的过程进行如下详细描述。
在本公开的一种具体实现中,在多个维度包括账号影响维度时,上述步骤201可以包括:
子步骤A1:获取用户在指定业务平台上的账号影响维度的数据信息。
在本公开实施例中,账号影响维度是指结合用户的账号在指定平台上的影响力。
可以采用上述提及的网络爬虫或多线程爬取等方式,从指定业务平台上爬取用户在账号影响维度下的数据信息,具体地,上述子步骤A1可以包括:
子步骤A1-1:获取所述用户在所述指定业务平台上的平台等级、用户等级和粉丝量。
账号影响维度可以是结合用户在指定业务平台上的平台等级、用户等级和粉丝量生成的维度。
平台等级是指用户使用的账号在指定业务平台上的等级。在某些示例中,所述平台等级可分为如0级、1级、2级、3级等,平台等级高低的排序为:0级<1级<2级<3级等。其中,平台等级可以与用户使用账号的登录时长相关。例如,用户使用账号登录10天以内时,平台等级为0级。账号登录10天至30天之间时,平台等级为1级。账号登录30天至60天之间时,平台等级为2级。账号登录60天及以上,平台等级为3级等。
用户等级是指用户使用的账号在指定业务平台上开通的VIP的等级。在某些示例中,所述用户等级可分为如VIP1、VIP2、VIP3等,用户等级高低的排序为:VIP1<VIP2<VIP3等。其中,用户等级可以与用户开通VIP的时长相关。例如,用户开通VIP的时长为10天以内时,用户等级为VIP1。用户开通VIP的时长为10至30天之间时,用户等级为VIP2。用户开通VIP的时长为30天及以上时,用户等级为VIP3。当然,在某些示例中,在某些业务平台上,可以设置用户等级的高低为:初级VIP、中级VIP、高级VIP等。
粉丝量是指用户使用的账号在指定业务平台上所拥有的粉丝数量。
在多个账号包括账号影响维度时,可以从指定业务平台上获取用户的平台等级、用户等级和粉丝量,将用户的平台等级、用户等级和粉丝量作为用户在账号影响维度下的数据信息。
在本公开的另一种具体实现中,在多个维度包括创作频率维度时,上述步骤201可以包括:
子步骤B1:获取用户在指定业务平台上的创作频率维度的数据信息。
在本公开实施例中,创作频率维度是指用户在指定业务平台上发布文章的频率。
可以采用上述提及的网络爬虫或多线程爬取等方式,从指定业务平台上爬取用户在创作频率维度下的数据信息,具体地,上述子步骤B1可以包括:
子步骤B1-1:在从第一统计起始时间至当前时间之内,获取所述用户在所述指定业务平台上的每天的发文内容数量。
创作频率维度可以是结合用户在指定业务平台上的发文数量生成的维度。即用户在指定业务平台上发布的文章的数量。
第一统计起始时间是指预先设置的开始对用户在指定业务平台上的发文数量开始统计的时间,例如,需要从2019-09-01开始统计时,则将2019-09-01作为第一统计起始时间。
在多个账号包括创作频率维度时,可以在从第一统计时间起始时间至当前时间之内,从指定业务平台上获取用户在每一天的发文内容数量,并将用户在指定业务平台上每天的发文内容数量,作为用户在指定业务平台上的创作频率维度的数据信息。
在本公开的另一种具体实现中,在多个维度包括内容效果维度时,上述步骤201可以包括:
子步骤C1:获取用户在指定业务平台上的内容效果维度的数据信息。
在本公开实施例中,内容效果维度是指用户发布的文章的数据表现,如发布文章的浏览次数、点赞次数、评论次数等。
可以采用上述提及的网络爬虫或多线程爬取等方式,从指定业务平台上爬取用户在内容效果维度下的数据信息,具体地,上述子步骤C1可以包括:
子步骤C1-1:在从第二统计起始时间至当前时间内,获取所述用户在所述指定业务平台上的每天内发布的至少一个发文内容。
内容效果维度可以是结合用户在指定业务平台上的发文的内容形成的维度。
第二统计起始时间是指预先设置的开始对用户在指定业务平台上发布的文章内容开始统计的时间,例如,需要从2019-09-10开始统计时,则将2019-09-10作为第二统计起始时间。
在多个账号包括内容效果维度时,可以在从第二统计时间起始时间至当前时间之内,从指定业务平台上获取用户在每一天的发文内容,并将用户在指定业务平台上每天的发布的至少一个发文的内容,作为用户在指定业务平台上的内容效果维度的数据信息。
在本公开的另一种具体实现中,在多个维度包括内容专业维度时,上述步骤201可以包括:
子步骤D1:获取用户在指定业务平台上的内容专业维度的数据信息。
在本公开实施例中,内容专业维度是指用户发布的文章在专业领域的权威性。
可以采用上述提及的网络爬虫或多线程爬取等方式,从指定业务平台上爬取用户在内容专业维度下的数据信息,具体地,上述子步骤D1可以包括:
子步骤D1-1:获取所述用户在所述指定业务平台上的所有发文内容。
所有发文内容是指用户在指定业务平台上发布的所有文章的内容。
在多个维度包括内容专业维度时,可以获取用户在指定业务平台发布的所有文章,并提取出所有文章的内容,即所有发文内容,并将所有发文内容作为用户在内容专业维度下的数据信息。
在本公开的另一种具体实现中,在多个维度包括内容健康维度时,内容健康维度是指用户发布的文章是否符合规范,如是否存在不健康词汇,或是否会造成舆论的不良影响等,可以采用上述提及的网络爬虫或多线程爬取等方式,从指定业务平台上爬取用户在内容健康维度下的数据信息,如,结合上述子步骤D1-1中获取的所有发文内容,获取所有发文内容中的不分发内容数(即用户在指定业务平台上上传的,但未经过验证的文章的数目)和违规内容数(即在指定业务平台上已发布,但出现违规内容后被下线的文章的数目),并将不分发内容数和违规内容数作为用户在指定业务平台上的内容健康维度下的数据信息。
在本公开的另一种具体实现中,在多个维度包括原创维度时,原创维度是指用户的原创能力,可以是结合用户在指定业务平台上发布文章的数量确定的,可以采用上述提及的网络爬虫或多线程爬取等方式,从指定业务平台上爬取用户在原创维度下的数据信息,如结合上述子步骤D1-1中获取的所有发文内容,获取所有发文内容中的原创内容数和非原创内容数,并将原创内容数和非原创内容数作为用户在指定业务平台上的原创维度下的数据信息。
当然,在多个维度还包括其它维度时,可以采用特定方式获取用户在指定业务平台上的其它维度下的数据信息,具体地,可以根据实际情况而定,本公开实施例在此不再加以赘述。
在获取用户在指定业务平台上的多个维度的数据信息之后,执行步骤202。
步骤202:基于多个维度的数据信息,确定所述用户在各个维度下的评分值。
在得到用户在指定业务平台上的多个维度的数据信息之后,可以结合每个维度的数据信息,计算得到用户在每个维度下的评分值。
而获取的数据信息中有些数据信息距离当前时间较近(如近几天的数据信息等),而有些数据信息距离当前时间较远(如距离当前时间已经一个月的数据信息等),进而,在计算每个维度下的评分值时,可以结合时间衰减因子,即一条数据信息,距离当前时间越近,则评分时所占的比重越大,分值越高,而距离当前越远,则评分时所占的比重越小,分值越低。
接下来结合上述提及的多个维度,对于确定用户在各个维度的评分值的具体方式进行详细描述。
在本公开的一种具体实现中,在多个维度包括账号影响维度时,上述步骤202可以包括:
子步骤F1:获取所述平台等级对应的平台分值、所述用户等级对应的用户分值及所述粉丝量对应的粉丝分值。
在本公开实施例中,在多个维度包括账号影响维度时,可以获取用户在指定业务平台上的账号影响维度下的数据信息,即平台等级、用户等级和粉丝量。
平台分值是指平台等级所对应的分值。
用户分值是指用户等级所对应的分值。
粉丝分值是指粉丝量所对应的分值。
在***中可以预先设置不同的平台等级、用户等级和粉丝量所对应的分值,如下述表1所示:
表1:
如上述表1所示,预先设置有不同平台等级对应的分值,不同用户等级对应的分值,及不同的粉丝量按照上述公式计算得到分值。
在获取用户在指定业务平台上的平台等级、用户等级和粉丝量之后,可以计算得到对应的平台分值、用户分值和粉丝分值,进而,执行子步骤F2。
子步骤F2:基于所述平台分值、所述用户分值和所述粉丝分值,计算得到所述用户在所述账号影响维度下的账号影响分值。
账号影响分值是指用户在账号影响维度下的评分分值。
在得到平台分值、用户分值和粉丝分值之后,可以计算三个分值的和值,并将该和值作为用户在账号影响维度下的账号影响分值。
在本公开的一种具体实现中,在多个维度包括创作频率维度时,上述步骤202可以包括:
子步骤G1:基于每天的所述发文内容数量,确定每天的发文分值。
在本公开实施例中,可以根据不同的发文内容数量设置相应的发文分值,例如,用户在第1天的发文内容数量为2时,可以设置相应的发文分值为20;而用户在第3天的发文内容数量为4时,可以设置相应的发文分值为40。
在多个维度包括创作频率维度时,可以在从第一统计起始时间至当前时间之内,获取用户在指定业务平台上的每天的发文内容数量之后,可以根据用户在每天内的发文内容数量,确定每天的发文分值。
在基于每天的发文内容数量确定每天的发文分值之后,执行子步骤G2。
子步骤G2:基于第一时间衰减因子,对每天的所述发文分值进行调整,得到每天的调整发文分值。
第一时间衰减因子是指与创作频率维度对应的衰减因子,在具体实现中,为避免距今时间较长的内容影响较大,可以设置第一时间衰减因子。
在某些示例中,可以为每天设置相应的第一时间衰减因子,即每天的第一时间衰减因子是不相同的。
在某些示例中,可以为每个时间段设置相应的第一时间衰减因子,如距离当前时间5天以内,可以设置一个相同的时间衰减因子;而距离当前时间大于5天,小于10天的时间段,可以设置一个相同的时间衰减因子。
在得到发文分值之后,基于每天所对应的第一时间衰减因子对每天的发文分值进行调整,以得到每天的调整发文分值。
子步骤G3:基于各所述调整发文分值,计算得到所述用户在所述创作频率维度下的创作频率分值。
在得到每天的调整发文分值之后,可以基于每天的调整发文分值,计算得到用户在创作频率维度下的创作频率分值,具体地,可以参照下述公式(1)和(2)计算得到创作频率分值。
上述公式(1)和(2),f(t)为创作频率分值,t0为第一统计起始时间,α为第一时间衰减因子,f0(t)为按照时间衰减因子得到的每天的调整发文分值。
在上述过程中,获取到调整发文分值、第一统计起始时间和第一时间衰减因子之后,可以再代入上述公式(1)和(2)即可得到创作频率分值。
在本公开的一种具体实现中,在多个维度包括内容效果维度时,上述步骤202可以包括:
子步骤H1:获取每个所述发文内容对应的喜爱度和分享收藏度;所述喜爱度与浏览数目、点赞数目和评论数目有关,所述分享收藏度与收藏数目、分享数目和点击数目有关。
在本公开实施例中,喜爱度是指用户在指定业务平台上发布的文章的受欢迎程度,喜爱度是与发布文章的浏览数目、点赞数目和评论数目相关的。
分享收藏度是指用户在指定业务平台上发布的文章被分享、收藏和点击的数目,分享收藏度是与收藏数目、分享数目和点击数目相关的。
在获取用户在指定业务平台上的内容效果维度下的发文内容之后,可以统计发文内容对应的喜爱度和分享收藏度,即统计发文内容对应的浏览数目、点赞数目和评论数目,结合浏览数目、点赞数目和评论数目得到喜爱度;并统计发文内容的收藏数目、分享数目、商户模块点击数目(即点击文章内容里包含的商户图像的次数)和商户模块收藏数目(即点击文章内容里包含的商户图像对应的藏按钮,对商户图像进行收藏的次数),结合收藏数目、分享数目、商户模块点击数目和商户模块收藏数目得到分享收藏度。
在获取每个发文内容对应的喜爱度和分享收藏度之后,执行子步骤H2。
子步骤H2:基于各所述喜爱度和各所述分享收藏度,计算得到每天的内容分值。
内容分值是指用户在一天内所有发文内容对应的分值的总和。
在得到每天的所有发文内容的喜爱度和分享收藏度之后,可以计算得到当天的内容分值。
在本公开中,可以设置喜爱度和分享收藏度对应的计算规则,如下述表2所示:
表2:
如上述表2所示,可以分别在不同指标下的分值,从而将喜爱度和种草度(即分享收藏度)在不同指标下的分值,从而以计算和值的方式,计算在喜爱度和分享收藏度下的分值,如下述公式(3)和(4)所示:
favor(t)=view(t)+ctr(t)+like(t)+comment(t) (3)
seed(t)=con.collect(t)+shop.collect(t)+shop.click(t)+share(t) (4)
上述公式(3)和(4)中,favor(t)为用户每天的发文内容在喜爱度下的分值,seed(t)为用户每天的发文内容在分享收藏度下的分值。
在得到用户每天的发文内容在喜爱度下的分值和在分享收藏度下的分值之后,可以计算两个分值的和值,将该和值作为用户每天的发文内容对应的内容分值,如下述公式(5)所示:
e0(t)=favor(t)+seed(t) (5)
上述公式(5)中,e0(t)为内容分值。
本公开为了达到增加内容效果分准确度的目的,可以统计内容效果流水和、平均值、最大值的方法分别代表整体效果、篇均效果、峰值效果,避免了单一方式带来的分数不全面的影响。
在计算得到每天的内容分值之后,执行子步骤H3。
子步骤H3:基于第二时间衰减因子,对每天的所述内容分值进行调整,得到每天的调整内容分值。
第二时间衰减因子是指与内容效果维度对应的时间衰减因子,在具体实现中,为避免距今时间较长的内容影响较大,可以设置第二时间衰减因子。
在某些示例中,可以为每天设置相应的第二时间衰减因子,即每天的第二时间衰减因子是不相同的。
在某些示例中,可以为每个时间段设置相应的第二时间衰减因子,如距离当前时间5天以内,可以设置一个相同的时间衰减因子;而距离当前时间大于5天,小于10天的时间段,可以设置一个相同的时间衰减因子。
在得到发文分值之后,基于每天所对应的第二时间衰减因子对每天的内容分值进行调整,以得到每天的调整内容分值。
子步骤H4:基于各所述调整内容分值,计算得到所述用户在所述内容效果维度下的内容效果分值。
在得到每天的调整内容分值之后,可以将所有统计的内容分值相加,得到一个最终和值,并将该最终和值作为用户在内容效果维度下的内容效果分值。
在本公开的另一种具体实现中,在多个维度包括内容专业维度时,上述步骤202可以包括:
子步骤I1:获取所述所有发文内容的总内容数,及所述所有发文内容中的精品内容数、热点内容数和推进内容数。
在本公开实施例中,精品内容数是指所有发文内容中被编辑评选为高质量内容的数目。
热点内容数是指所有发文内容中被***判定为符合时事热点的内容数量。
推进内容数是指所有发文内容中被***选中并发送给全部用户浏览的内容数量。
在获取用户在指定业务平台上的所有发文内容之后,可以获取所有发文内容的总内容数(即发布的文章的总数),以及所有发文内容中的精品内容数、热点内容数和推进内容数。
在获取所有发文内容的总内容数,及所有发文内容中的精品内容数、热点内容数和推进内容数之后,执行子步骤I2。
子步骤I2:基于所述精品内容数和所述总内容数,计算得到精品内容率。
在得到精品内容数和总内容数之后,可以计算得到精品内容率,即100*精品内容数/总内容数。
子步骤I3:基于所述精品内容数、所述精品内容率、所述热点内容数和所述推进内容数,计算得到所述用户在所述内容专业维度下的内容专业分值。
在得到精品内容数、精品内容率、热点内容数和推进内容数之后,结合这些指标数据计算在相应指标下的分值,如下述表3所示:
表3:
如上述表3所示,结合在不同指标下的数目,可以计算得到在不同指标下的分值,并将所有分值相加求和,即可得到内容专业分值,如下述公式(6)所示:
p(t)=hq(t)+hqp(t)+hot(t)+push(t) (6)
上述公式(6)中,p(t)为内容专业分值,hq(t)为精品内容数对应的分值,hqp(t)为精品内容率对应的分值,hot(t)为热点内容数对应的分值,push(t)为推进内容数对应的分值。
在本公开的另一种具体实现中,在多个维度包括内容健康维度时,上述步骤202可以包括:
子步骤J1:获取所述所有发文内容中的不分发内容数和违规内容数;
子步骤J2:基于所述不分发内容数和所述违规内容数,确定所述用户在所述内容健康维度下的内容健康分值。
在本公开实施例中,在获取到用户在指定业务平台上发布的所有发文内容之后,可以统计得到其中的不分发内容数和违规内容数,进而,可以结合不分发内容数和违规内容数,计算得到用户在内容健康维度下的内容健康分值。
可以理解地,内容健康分值代表了用户内容的规范程度,它是一个负向分值,可以设置扣分上限,如下述表4所示:
表4:
如上述表4所示,在用户的所有发文内容中存在一篇不分发内容时,则扣20分,扣分上限为100;而在所有发文内容中存在一篇违规内容时,则扣20分,扣分上限为100。
可以理解地,上述示例仅是为了更好地理解本公开实施例的技术方案而列举的示例,不作为对本公开实施例的唯一限制。
在获取不分发内容数和违规内容数之后,结合不分发内容数和违规内容数,即可获取到用户在内容健康维度下的内容健康分值。
在本公开的另一种具体实现中,在多个维度包括原创维度时,上述步骤202可以包括:
子步骤K1:获取所述所有发文内容中的原创内容数和非原创内容数;
子步骤K2:基于所述原创内容数和所述非原创内容数,计算得到所述用户在所述原创维度下的内容原创分值。
在本公开实施例中,原创内容数是指用户在指定业务平台上发布的所有发文内容中,属于原创内容的数量。
非原创内容数是指用户在指定业务平台上发布的所有发文内容中,属于非原创内容(如引用文章、抄袭内容等)的数量。
可以理解,原创内容和非原创内容是相对的,而原创内容数和非原创内容数的和值即为所有发文内容的总数。
在得到所有发文内容中的原创内容数和非原创内容数之后,可以结合下述公式计算得到用户在原创维度下的内容原创分值。
内容原创分值=100*(所有发文内容的总数-非原创内容数)/发文总数=原创内容数/发文总数。
可以理解地,上述是针对本公开实施例提及的多个维度进行的各维度下的评分值计算过程,在存在其它维度时,可以设置其它方式的在其它维度下的评分值计算方式,具体地,可以根据实际情况而定,本公开实施例对此不加以限制。
在基于各个维度的数据信息,确定出用户在各个维度下的评分值之后,执行步骤203。
步骤203:确定用于评价的多个维度及各个维度的维度权重。
维度权重是指预先设置的与每个维度对应的权重值,如账号影响维度对应的维度权重为0.6,创作频率维度对应的维度权重为0.8,内容效果维度对应的维度权重为0.7等。
在某些示例中,可以设置固定的维度权重,即对于同一个维度,每个用户在该维度下的维度权重是相同的,例如,在维度权重为账号影响维度时,账号影响维度对应的维度权重为0.8,则所有用户在账号影响维度下的维度权重均为0.8。
在某些示例中,可以针对不同的用户设置不同的维度权重,即对于同一个维度,每个用户在该维度下的维度权重是不相同的,例如,在维度权重为账号影响维度时,用户a在账号影响维度下的维度权重为0.8;用户b在账号影响维度下的维度权重为0.6。
可以理解地,上述示例仅是为了更好地理解本公开实施例的技术方案而列举的示例,不作为对本公开实施例的唯一限制。
在获取用户在各个维度下的评分值和各个维度对应的维度权重之后,执行步骤204。
步骤204:计算各个维度的评分值与各个维度对应的维度权重的乘积值。
在得到用户在各个维度下的评分值,以及各个维度所对应的维度权重之后,可以计算各个维度的评分值与对应维度的维度权重的乘积值,例如,在维度权重为账号影响维度时,账号影响维度对应的维度权重为0.8,用户在账号影响维度下的评分值为50,则二者的乘积值即为:50*0.8=40。
可以理解地,上述示例仅是为了更好地理解本公开实施例的技术方案而列举的示例,不作为对本公开实施例的唯一限制。
在计算得到各个维度的评分值与各个维度对应的维度权重的乘积值之后,执行步骤205。
步骤205:将各所述乘积值相加求和,得到所述目标评分值。
目标评分值是指结合各维度的评分值和维度权重,计算得到的用户的最终评分值,目标评分值可以反映出用户在指定业务平台的等级,目标评分值越高表示用户在指定业务平台上的等级越高,而目标评分值越低表示用户在指定业务平台上的等级越低。
在计算各个维度的评分值与各个维度对应的维度权重的乘积值之后,可以将这些乘积值相加求和,得到的和值即为用户在指定业务平台上的目标评分值。
本公开实施例通过结合用户在指定业务平台上的多个维度的数据信息对用户进行评分,可以动态反映出用户等级变化,无需频繁更改用户等级,并且,结合每个维度对应的维度权重确定用户的最终评分(即目标评分值),能够有效防止单一数据带来的评分变化。
本公开实施例提供的用户评分方法,通过获取用户在指定业务平台上的多个维度的数据信息,基于多个维度的数据信息,确定用户在各个维度下的评分值,并基于用户在各个维度下的评分值和各个维度对应的维度权重,确定用户的目标评分值。本公开实施例结合与用户关联的多个维度的数据信息对用户进行评分,根据用户评分可以动态反映出用户的等级变化,无需频繁更改用户等级,并且,结合每个维度对应的维度权重确定用户的最终评分(即目标评分值),能够有效防止单一数据带来的评分变化。
参照图3,示出了本公开实施例三提供的用户评分装置的结构示意图。如图3所示,该用户评分装置300可以包括:数据信息获取模块310、评分值确定模块320和目标评分确定模块330,其中,
数据信息获取模块310可以用于获取用户在指定业务平台上的多个维度的数据信息。
在本公开实施例中,指定业务平台可以是能够向用户提供服务的网站或APP(如美团APP),用户可以在指定业务平台上发布图片、写点评、发布视频等。
多个维度是指结合用户在指定业务平台上的产生的行为生成的维度。
在本公开中,多个维度可以是从账号影响维度、创作频率维度、内容效果维度、内容专业维度、内容健康维度、原创维度等维度中选取的两个或两个以上的维度。
账号影响维度是指结合用户的账号在指定平台上的影响力。
创作频率维度是指用户在指定业务平台上发布文章的频率。
内容效果维度是指用户发布的文章的数据表现,如发布文章的浏览次数、点赞次数、评论次数等。
内容专业维度是指用户发布的文章在专业领域的权威性。
内容健康维度是指用户发布的文章是否符合规范,如是否存在不健康词汇,或是否会造成舆论的不良影响等。
原创维度是指用户的原创能力,可以是结合用户在指定业务平台上发布文章的数量确定的。
在确定多个维度之后,可以由数据信息获取模块310根据用户在指定业务平台上产生的用户行为,获取用户在指定业务平台上的多个维度的数据信息。
在某些示例中,可以预先设置每天获取数据信息的固定时间,如每天10:00、20:00等,在每天达到设置的固定时间时,即获取用户在指定业务平台上的多个维度的数据信息。
在某些示例中,可以每隔预置时间间隔执行一次获取数据信息的操作,如每隔两个小时或三个小时等,即每隔预置时间间隔,即执行一次获取用户在指定业务平台上的多个维度的数据信息。
在某些示例中,可以采用网络爬虫技术,从指定业务平台上获取多个维度的数据信息。
在某些示例中,可以采用多线程爬取数据的方式,即针对每个维度分别创建一个线程,通过调用多个维度分别对应的线程从指定业务平台上爬取相应维度的数据信息。
可以理解地,上述示例仅是为了更好地理解本公开实施例的技术方案而列举的示例,不作为对本公开实施例的唯一限制。
在数据信息获取模块310获取用户在指定业务平台上的多个维度的数据信息之后,执行评分值确定模块320。
评分值确定模块320可以用于基于多个维度的数据信息,确定所述用户在各个维度下的评分值。
在数据信息获取模块310得到用户在指定业务平台上的多个维度的数据信息之后,可以,可以由评分值确定模块320结合多个维度的数据信息,计算得到用户在每个维度下的评分值。
而评分值确定模块320获取的数据信息中有些数据信息距离当前时间较近(如近几天的数据信息等),而有些数据信息距离当前时间较远(如距离当前时间已经一个月的数据信息等),进而,在计算每个维度下的评分值时,可以结合时间衰减因子,即一条数据信息,距离当前时间越近,则评分时所占的比重越大,分值越高,而距离当前越远,则评分时所占的比重越小,分值越低。
可以理解地,上述示例仅是为了更好地理解本公开实施例的技术方案而列举的示例,不作为对本公开实施例的唯一限制。
对于评分值确定模块320计算用户在每个维度下的评分值的详细过程,将在下述实施例中进行详细描述,本公开实施例在此不再加以赘述。
在评分值确定模块320根据多个维度的数据信息,确定出用户在各个维度下的评分值之后,执行目标评分确定模块330。
目标评分确定模块330可以用于基于所述用户在各个维度下的评分值和各个维度对应的维度权重,确定所述用户的目标评分值。
维度权重是指预先设置的与每个维度对应的权重值,如账号影响维度对应的维度权重为0.6,创作频率维度对应的维度权重为0.8,内容效果维度对应的维度权重为0.7等。
目标评分值是指结合各维度的评分值和维度权重,计算得到的用户的最终评分值,目标评分值可以反映出用户在指定业务平台的等级,目标评分值越高表示用户在指定业务平台上的等级越高,而目标评分值越低表示用户在指定业务平台上的等级越低。
在某些示例中,可以设置固定的维度权重,即对于同一个维度,每个用户在该维度下的维度权重是相同的,例如,在维度权重为账号影响维度时,账号影响维度对应的维度权重为0.8,则所有用户在账号影响维度下的维度权重均为0.8。
在某些示例中,可以针对不同的用户设置不同的维度权重,即对于同一个维度,每个用户在该维度下的维度权重是不相同的,例如,在维度权重为账号影响维度时,用户a在账号影响维度下的维度权重为0.8;用户b在账号影响维度下的维度权重为0.6。
可以理解地,上述示例仅是为了更好地理解本公开实施例的技术方案而列举的示例,不作为对本公开实施例的唯一限制。
在由评分值确定模块320获取用户在各个维度下的评分值之后,可以由目标评分确定模块330结合各个维度的评分值和各个维度对应的维度权重,计算得到用户的目标评分值,具体地,首先,可以计算每个维度下的评分值与该维度对应的维度权重的乘积值,然后将所有的乘积值相加,得到最终的和值,并将最终的和值作为用户的目标评分值。
本公开实施例通过结合用户在指定业务平台上的多个维度的数据信息对用户进行评分,可以动态反映出用户等级变化,无需频繁更改用户等级,并且,结合每个维度对应的维度权重确定用户的最终评分(即目标评分值),能够有效防止单一数据带来的评分变化。
本公开实施例提供的用户评分装置,通过获取用户在指定业务平台上的多个维度的数据信息,基于多个维度的数据信息,确定用户在各个维度下的评分值,并基于用户在各个维度下的评分值和各个维度对应的维度权重,确定用户的目标评分值。本公开实施例结合与用户关联的多个维度的数据信息对用户进行评分,根据用户评分可以动态反映出用户的等级变化,无需频繁更改用户等级,并且,结合每个维度对应的维度权重确定用户的最终评分(即目标评分值),能够有效防止单一数据带来的评分变化。
参照图4,示出了本公开实施例四提供的用户评分装置的结构示意图。如图4所示,该用户评分装置400可以包括:数据信息获取模块410、评分值确定模块420、维度权重确定模块430和目标评分确定模块440。
数据信息获取模块410可以用于获取用户在指定业务平台上的多个维度的数据信息。
在本公开实施例中,指定业务平台可以是能够向用户提供服务的网站或APP(如美团APP),用户可以在指定业务平台上发布图片、写点评、发布视频等。
多个维度是指结合用户在指定业务平台上的产生的行为生成的维度。
在本公开中,多个维度可以是从账号影响维度、创作频率维度、内容效果维度、内容专业维度、内容健康维度、原创维度等维度中选取的两个或两个以上的维度。
在确定多个维度之后,可以由数据信息获取模块410根据用户在指定业务平台上产生的用户行为,获取用户在指定业务平台上的多个维度的数据信息。
在某些示例中,可以预先设置每天获取数据信息的固定时间,如每天10:00、20:00等,在每天达到设置的固定时间时,即获取用户在指定业务平台上的多个维度的数据信息。
在某些示例中,可以每隔预置时间间隔执行一次获取数据信息的操作,如每隔两个小时或三个小时等,即每隔预置时间间隔,即执行一次获取用户在指定业务平台上的多个维度的数据信息。
在某些示例中,可以采用网络爬虫技术,从指定业务平台上获取多个维度的数据信息。
在某些示例中,可以采用多线程爬取数据的方式,即针对每个维度分别创建一个线程,通过调用多个维度分别对应的线程从指定业务平台上爬取相应维度的数据信息。
可以理解地,上述示例仅是为了更好地理解本公开实施例的技术方案而列举的示例,不作为对本公开实施例的唯一限制。
接下来,结合上述提及的多个维度针对获取数据信息的过程进行如下详细描述。
在本公开的一种具体实现中,在多个维度包括账号影响维度时,数据信息获取模块410可以包括:第一数据信息获取子模块,其中,
第一数据信息获取子模块可以用于获取用户在指定业务平台上的账号影响维度的数据信息。
在本公开实施例中,账号影响维度是指结合用户的账号在指定平台上的影响力。
可以采用上述提及的网络爬虫或多线程爬取等方式,由第一数据信息获取子模块从指定业务平台上爬取用户在账号影响维度下的数据信息,具体地,第一数据信息获取子模块可以包括:等级粉丝量获取子模块,其中,
等级粉丝量获取子模块可以用于获取所述用户在所述指定业务平台上的平台等级、用户等级和粉丝量。
账号影响维度可以是结合用户在指定业务平台上的平台等级、用户等级和粉丝量生成的维度。
平台等级是指用户使用的账号在指定业务平台上的等级。在某些示例中,所述平台等级可分为如0级、1级、2级、3级等,平台等级高低的排序为:0级<1级<2级<3级等。其中,平台等级可以与用户使用账号的登录时长相关。例如,用户使用账号登录10天以内时,平台等级为0级。账号登录10天至30天之间时,平台等级为1级。账号登录30天至60天之间时,平台等级为2级。账号登录60天及以上,平台等级为3级等。
用户等级是指用户使用的账号在指定业务平台上开通的VIP的等级。在某些示例中,所述用户等级可分为如VIP1、VIP2、VIP3等,用户等级高低的排序为:VIP1<VIP2<VIP3等。其中,用户等级可以与用户开通VIP的时长相关。例如,用户开通VIP的时长为10天以内时,用户等级为VIP1。用户开通VIP的时长为10至30天之间时,用户等级为VIP2。用户开通VIP的时长为30天及以上时,用户等级为VIP3。当然,在某些示例中,在某些业务平台上,可以设置用户等级的高低为:初级VIP、中级VIP、高级VIP等。
粉丝量是指用户使用的账号在指定业务平台上所拥有的粉丝数量。
在多个账号包括账号影响维度时,可以由等级粉丝量获取子模块从指定业务平台上获取用户的平台等级、用户等级和粉丝量,将用户的平台等级、用户等级和粉丝量作为用户在账号影响维度下的数据信息。
在本公开的另一种具体实现中,在多个维度包括创作频率维度时,数据信息获取模块410可以包括:第二数据信息获取子模块,其中,
第二数据信息获取子模块可以用于获取用户在指定业务平台上的创作频率维度的数据信息。
在本公开实施例中,创作频率维度是指用户在指定业务平台上发布文章的频率。
可以采用上述提及的网络爬虫或多线程爬取等方式,从由第二数据信息获取子模块指定业务平台上爬取用户在创作频率维度下的数据信息,具体地,上述第二数据信息获取子模块可以包括:发文内容数获取子模块,其中,
发文内容数获取子模块可以用于在从第一统计起始时间至当前时间之内,获取所述用户在所述指定业务平台上的每天的发文内容数量。
创作频率维度可以是结合用户在指定业务平台上的发文数量生成的维度。即用户在指定业务平台上发布的文章的数量。
第一统计起始时间是指预先设置的开始对用户在指定业务平台上的发文数量开始统计的时间,例如,需要从2019-09-01开始统计时,则将2019-09-01作为第一统计起始时间。
在多个账号包括创作频率维度时,可以在从第一统计时间起始时间至当前时间之内,由发文内容数获取子模块从指定业务平台上获取用户在每一天的发文内容数量,并将用户在指定业务平台上每天的发文内容数量,作为用户在指定业务平台上的创作频率维度的数据信息。
在本公开的另一种具体实现中,在多个维度包括内容效果维度时,上述数据信息获取模块410可以包括:第三数据信息获取子模块,其中,
第三数据信息获取子模块可以用于获取用户在指定业务平台上的内容效果维度的数据信息。
在本公开实施例中,内容效果维度是指用户发布的文章的数据表现,如发布文章的浏览次数、点赞次数、评论次数等。
可以采用上述提及的网络爬虫或多线程爬取等方式,由第三数据信息获取子模块从指定业务平台上爬取用户在内容效果维度下的数据信息,具体地,上述第三数据信息获取子模块可以包括:发文内容获取子模块,其中,
发文内容获取子模块可以用于在从第二统计起始时间至当前时间内,获取所述用户在所述指定业务平台上的每天内发布的至少一个发文内容。
内容效果维度可以是结合用户在指定业务平台上的发文的内容形成的维度。
第二统计起始时间是指预先设置的开始对用户在指定业务平台上发布的文章内容开始统计的时间,例如,需要从2019-09-10开始统计时,则将2019-09-10作为第二统计起始时间。
在多个账号包括内容效果维度时,可以在从第二统计时间起始时间至当前时间之内,由发文内容获取子模块从指定业务平台上获取用户在每一天的发文内容,并将用户在指定业务平台上每天的发布的至少一个发文的内容,作为用户在指定业务平台上的内容效果维度的数据信息。
在本公开的另一种具体实现中,在多个维度包括内容专业维度时,数据信息获取模块410可以包括:第四数据信息获取子模块,其中,
第四数据信息获取子模块可以用于获取用户在指定业务平台上的内容专业维度的数据信息。
在本公开实施例中,内容专业维度是指用户发布的文章在专业领域的权威性。
可以采用上述提及的网络爬虫或多线程爬取等方式,由第四数据信息获取子模块从指定业务平台上爬取用户在内容专业维度下的数据信息,具体地,上述第四数据信息获取子模块可以包括:所有发文内容获取子模块,其中,
所有发文内容获取子模块可以用于获取所述用户在所述指定业务平台上的所有发文内容。
所有发文内容是指用户在指定业务平台上发布的所有文章的内容。
在多个维度包括内容专业维度时,可以由所有发文内容获取子模块获取用户在指定业务平台发布的所有文章,并提取出所有文章的内容,即所有发文内容,并将所有发文内容作为用户在内容专业维度下的数据信息。
在本公开的另一种具体实现中,在多个维度包括内容健康维度时,内容健康维度是指用户发布的文章是否符合规范,如是否存在不健康词汇,或是否会造成舆论的不良影响等,可以采用上述提及的网络爬虫或多线程爬取等方式,从指定业务平台上爬取用户在内容健康维度下的数据信息,如,结合上述获取的所有发文内容,获取所有发文内容中的不分发内容数(即用户在指定业务平台上上传的,但未经过验证的文章的数目)和违规内容数(即在指定业务平台上已发布,但出现违规内容后被下线的文章的数目),并将不分发内容数和违规内容数作为用户在指定业务平台上的内容健康维度下的数据信息。
在本公开的另一种具体实现中,在多个维度包括原创维度时,原创维度是指用户的原创能力,可以是结合用户在指定业务平台上发布文章的数量确定的,可以采用上述提及的网络爬虫或多线程爬取等方式,从指定业务平台上爬取用户在原创维度下的数据信息,如结合上述获取的所有发文内容,获取所有发文内容中的原创内容数和非原创内容数,并将原创内容数和非原创内容数作为用户在指定业务平台上的原创维度下的数据信息。
当然,在多个维度还包括其它维度时,可以采用特定方式获取用户在指定业务平台上的其它维度下的数据信息,具体地,可以根据实际情况而定,本公开实施例在此不再加以赘述。
在由数据信息获取模块410获取用户在指定业务平台上的多个维度的数据信息之后,执行评分值确定模块420。
评分值确定模块420可以用于基于多个维度的数据信息,确定所述用户在各个维度下的评分值。
在由数据信息获取模块410获取到用户在指定业务平台上的多个维度的数据信息之后,可以由评分值确定模块420结合多个维度的数据信息,计算得到用户在每个维度下的评分值。
而在数据信息获取模块410获取的数据信息中有些数据信息距离当前时间较近(如近几天的数据信息等),而有些数据信息距离当前时间较远(如距离当前时间已经一个月的数据信息等),进而,在计算每个维度下的评分值时,可以结合时间衰减因子,即一条数据信息,距离当前时间越近,则评分时所占的比重越大,分值越高,而距离当前越远,则评分时所占的比重越小,分值越低。
接下来结合上述提及的多个维度,对于评分值确定模块420确定用户在各个维度的评分值的具体方式进行详细描述。
在本公开的一种具体实现中,在多个维度包括账号影响维度时,评分值确定模块420可以包括:等级粉丝分值获取子模块和账号影响分值计算子模块,其中,
等级粉丝分值获取子模块可以用于获取所述平台等级对应的平台分值、所述用户等级对应的用户分值及所述粉丝量对应的粉丝分值。
在本公开实施例中,在多个维度包括账号影响维度时,可以获取用户在指定业务平台上的账号影响维度下的数据信息,即平台等级、用户等级和粉丝量。
平台分值是指平台等级所对应的分值。
用户分值是指用户等级所对应的分值。
粉丝分值是指粉丝量所对应的分值。
在***中可以预先设置不同的平台等级、用户等级和粉丝量所对应的分值,例如,参照上述表1,及其相应的描述可知,预先设置有不同平台等级对应的分值,不同用户等级对应的分值,及不同的粉丝量按照上述公式计算得到分值。
在获取用户在指定业务平台上的平台等级、用户等级和粉丝量之后,可以由等级粉丝分值获取子模块计算得到对应的平台分值、用户分值和粉丝分值,进而,执行账号影响分值计算子模块。
账号影响分值计算子模块可以用于基于所述平台分值、所述用户分值和所述粉丝分值,计算得到所述用户在所述账号影响维度下的账号影响分值。
账号影响分值是指用户在账号影响维度下的评分分值。
在得到平台分值、用户分值和粉丝分值之后,可以由账号影响分值计算子模块计算三个分值的和值,并将该和值作为用户在账号影响维度下的账号影响分值。
在本公开的一种具体实现中,在多个维度包括创作频率维度时,评分值确定模块420可以包括:发文分值确定子模块、调整发文分值获取子模块和创作频率分值计算子模块,其中,
发文分值确定子模块可以用于基于每天的所述发文内容数量,确定每天的发文分值。
在本公开实施例中,可以由发文分值确定子模块根据不同的发文内容数量设置相应的发文分值,例如,用户在第1天的发文内容数量为2时,可以设置相应的发文分值为20;而用户在第3天的发文内容数量为4时,可以设置相应的发文分值为40。
在多个维度包括创作频率维度时,可以在从第一统计起始时间至当前时间之内,获取用户在指定业务平台上的每天的发文内容数量之后,可以由发文分值确定子模块根据用户在每天内的发文内容数量,确定每天的发文分值。
在发文分值确定子模块基于每天的发文内容数量确定每天的发文分值之后,执行调整发文分值获取子模块。
调整发文分值获取子模块可以用于基于第一时间衰减因子,对每天的所述发文分值进行调整,得到每天的调整发文分值。
第一时间衰减因子是指与创作频率维度对应的衰减因子,在具体实现中,为避免距今时间较长的内容影响较大,可以设置第一时间衰减因子。
在某些示例中,可以为每天设置相应的第一时间衰减因子,即每天的第一时间衰减因子是不相同的。
在某些示例中,可以为每个时间段设置相应的第一时间衰减因子,如距离当前时间5天以内,可以设置一个相同的时间衰减因子;而距离当前时间大于5天,小于10天的时间段,可以设置一个相同的时间衰减因子。
在得到发文分值之后,可以由调整发文分值获取子模块基于每天所对应的第一时间衰减因子对每天的发文分值进行调整,以得到每天的调整发文分值。
创作频率分值计算子模块可以用于基于各所述调整发文分值,计算得到所述用户在所述创作频率维度下的创作频率分值。
在得到每天的调整发文分值之后,可以由创作频率分值计算子模块基于每天的调整发文分值,计算得到用户在创作频率维度下的创作频率分值,具体地,可以参照下述公式(1)和(2)计算得到创作频率分值。
上述公式(1)和(2),f(t)为创作频率分值,t0为第一统计起始时间,α为第一时间衰减因子,f0(t)为按照时间衰减因子得到的每天的调整发文分值。
在上述过程中,获取到调整发文分值、第一统计起始时间和第一时间衰减因子之后,可以由创作频率分值计算子模块再将调整发文分值、第一统计起始时间和第一时间衰减因子代入上述公式(1)和(2)即可得到创作频率分值。
在本公开的一种具体实现中,在多个维度包括内容效果维度时,评分值确定模块420可以包括:喜爱度获取子模块、内容分值计算子模块、调整内容分值获取子模块和内容效果分值计算子模块,其中,
喜爱度获取子模块可以用于获取每个所述发文内容对应的喜爱度和分享收藏度;所述喜爱度与浏览数目、点赞数目和评论数目有关,所述分享收藏度与收藏数目、分享数目和点击数目有关。
在本公开实施例中,喜爱度是指用户在指定业务平台上发布的文章的受欢迎程度,喜爱度是与发布文章的浏览数目、点赞数目和评论数目相关的。
分享收藏度是指用户在指定业务平台上发布的文章被分享、收藏和点击的数目,分享收藏度是与收藏数目、分享数目和点击数目相关的。
在获取用户在指定业务平台上的内容效果维度下的发文内容之后,可以由喜爱度获取子模块统计发文内容对应的喜爱度和分享收藏度,即统计发文内容对应的浏览数目、点赞数目和评论数目,结合浏览数目、点赞数目和评论数目得到喜爱度;并统计发文内容的收藏数目、分享数目、商户模块点击数目(即点击文章内容里包含的商户图像的次数)和商户模块收藏数目(即点击文章内容里包含的商户图像对应的藏按钮,对商户图像进行收藏的次数),结合收藏数目、分享数目、商户模块点击数目和商户模块收藏数目得到分享收藏度。
在由喜爱度获取子模块获取每个发文内容对应的喜爱度和分享收藏度之后,执行内容分值计算子模块。
内容分值计算子模块可以用于基于各所述喜爱度和各所述分享收藏度,计算得到每天的内容分值。
内容分值是指用户在一天内所有发文内容对应的分值的总和。
在得到每天的所有发文内容的喜爱度和分享收藏度之后,可以由内容分值计算子模块计算得到当天的内容分值。
在本公开中,可以设置喜爱度和分享收藏度对应的计算规则,例如,参照上述表2及其相应的描述可知,可以根据在不同指标下的分值,从而将喜爱度和种草度(即分享收藏度)在不同指标下的分值,从而以计算和值的方式,计算在喜爱度和分享收藏度下的分值,如下述公式(3)和(4)所示:
favor(t)=view(t)+ctr(t)+like(t)+comment(t) (3)
seed(t)=con.collect(t)+shop.collect(t)+shop.click(t)+share(t) (4)
上述公式(3)和(4)中,favor(t)为用户每天的发文内容在喜爱度下的分值,seed(t)为用户每天的发文内容在分享收藏度下的分值。
在得到用户每天的发文内容在喜爱度下的分值和在分享收藏度下的分值之后,可以由内容分值计算子模块计算两个分值的和值,将该和值作为用户每天的发文内容对应的内容分值,如下述公式(5)所示:
e0(t)=favor(t)+seed(t) (5)
上述公式(5)中,e0(t)为内容分值。
本公开为了达到增加内容效果分准确度的目的,可以统计内容效果流水和、平均值、最大值的方法分别代表整体效果、篇均效果、峰值效果,避免了单一方式带来的分数不全面的影响。
在由内容分值计算子模块计算得到每天的内容分值之后,执行调整内容分值获取子模块。
调整内容分值获取子模块可以用于基于第二时间衰减因子,对每天的所述内容分值进行调整,得到每天的调整内容分值。
第二时间衰减因子是指与内容效果维度对应的时间衰减因子,在具体实现中,为避免距今时间较长的内容影响较大,可以设置第二时间衰减因子。
在某些示例中,可以为每天设置相应的第二时间衰减因子,即每天的第二时间衰减因子是不相同的。
在某些示例中,可以为每个时间段设置相应的第二时间衰减因子,如距离当前时间5天以内,可以设置一个相同的时间衰减因子;而距离当前时间大于5天,小于10天的时间段,可以设置一个相同的时间衰减因子。
在得到发文分值之后,可以由调整内容分值获取子模块基于每天所对应的第二时间衰减因子对每天的内容分值进行调整,以得到每天的调整内容分值。
内容效果分值计算子模块可以用于基于各所述调整内容分值,计算得到所述用户在所述内容效果维度下的内容效果分值。
在得到每天的调整内容分值之后,可以由内容效果分值计算子模块将所有统计的内容分值相加,得到一个最终和值,并将该最终和值作为用户在内容效果维度下的内容效果分值。
在本公开的另一种具体实现中,在多个维度包括内容专业维度时,评分值确定模块420可以包括:内容数获取子模块、内容率计算子模块和内容专业分值计算子模块,其中,
内容数获取子模块可以用于获取所述所有发文内容的总内容数,及所述所有发文内容中的精品内容数、热点内容数和推进内容数。
在本公开实施例中,精品内容数是指所有发文内容中被编辑评选为高质量内容的数目。
热点内容数是指所有发文内容中被***判定为符合时事热点的内容数量。
推进内容数是指所有发文内容中被***选中并发送给全部用户浏览的内容数量。
在获取用户在指定业务平台上的所有发文内容之后,可以由内容数获取子模块获取所有发文内容的总内容数(即发布的文章的总数),以及所有发文内容中的精品内容数、热点内容数和推进内容数。
在由内容数获取子模块获取所有发文内容的总内容数,及所有发文内容中的精品内容数、热点内容数和推进内容数之后,执行内容率计算子模块。
内容率计算子模块可以用于基于所述精品内容数和所述总内容数,计算得到精品内容率。
在得到精品内容数和总内容数之后,可以由内容率计算子模块计算得到精品内容率,即100*精品内容数/总内容数。
内容专业分值计算子模块可以用于基于所述精品内容数、所述精品内容率、所述热点内容数和所述推进内容数,计算得到所述用户在所述内容专业维度下的内容专业分值。
在得到精品内容数、精品内容率、热点内容数和推进内容数之后,可以由内容专业分值计算子模块结合这些指标数据计算在相应指标下的分值,例如,参照上述表3及其相应的描述可知,由内容专业分值计算子模块结合在不同指标下的数目,可以计算得到在不同指标下的分值,并将所有分值相加求和,即可得到内容专业分值,如下述公式(6)所示:
p(t)=hq(t)+hqp(t)+hot(t)+push(t) (6)
上述公式(6)中,p(t)为内容专业分值,hq(t)为精品内容数对应的分值,hqp(t)为精品内容率对应的分值,hot(t)为热点内容数对应的分值,push(t)为推进内容数对应的分值。
在本公开的另一种具体实现中,在多个维度包括内容健康维度时,评分值确定模块420可以包括:所有内容数获取子模块和内容健康分确定子模块,其中,
所有内容数获取子模块可以用于获取所述所有发文内容中的不分发内容数和违规内容数。
内容健康分确定子模块可以用于基于所述不分发内容数和所述违规内容数,确定所述用户在所述内容健康维度下的内容健康分值。
在本公开实施例中,在获取到用户在指定业务平台上发布的所有发文内容之后,可以由所有内容数获取子模块统计得到其中的不分发内容数和违规内容数,进而,可以由内容健康分确定子模块结合不分发内容数和违规内容数,计算得到用户在内容健康维度下的内容健康分值。
可以理解地,内容健康分值代表了用户内容的规范程度,它是一个负向分值,可以设置扣分上限,例如,参照上述表4及其相应的描述可知,在用户的所有发文内容中存在一篇不分发内容时,则扣20分,扣分上限为100;而在所有发文内容中存在一篇违规内容时,则扣20分,扣分上限为100。
在所有内容数获取子模块获取不分发内容数和违规内容数之后,可以由内容健康分确定子模块结合不分发内容数和违规内容数,即可获取到用户在内容健康维度下的内容健康分值。
在本公开的另一种具体实现中,在多个维度包括原创维度时,评分值确定模块420可以包括:原创内容数获取子模块和内容原创分计算子模块,其中,
原创内容数获取子模块可以用于获取所述所有发文内容中的原创内容数和非原创内容数。
内容原创分计算子模块可以用于基于所述原创内容数和所述非原创内容数,计算得到所述用户在所述原创维度下的内容原创分值。
在本公开实施例中,原创内容数是指用户在指定业务平台上发布的所有发文内容中,属于原创内容的数量。
非原创内容数是指用户在指定业务平台上发布的所有发文内容中,属于非原创内容(如引用文章、抄袭内容等)的数量。
可以理解,原创内容和非原创内容是相对的,而原创内容数和非原创内容数的和值即为所有发文内容的总数。
在原创内容数获取子模块得到所有发文内容中的原创内容数和非原创内容数之后,可以由内容原创分计算子模块结合下述公式计算得到用户在原创维度下的内容原创分值。
内容原创分值=100*(所有发文内容的总数-非原创内容数)/发文总数=原创内容数/发文总数。
可以理解地,上述是针对本公开实施例提及的多个维度进行的各维度下的评分值计算过程,在存在其它维度时,可以设置其它方式的在其它维度下的评分值计算方式,具体地,可以根据实际情况而定,本公开实施例对此不加以限制。
在评分值确定模块420基于各个维度的数据信息,确定出用户在各个维度下的评分值之后,执行维度权重确定模块430。
维度权重确定模块430可以用于确定用于评价的多个维度及各个维度的维度权重。
维度权重是指预先设置的与每个维度对应的权重值,如账号影响维度对应的维度权重为0.6,创作频率维度对应的维度权重为0.8,内容效果维度对应的维度权重为0.7等。
在某些示例中,可以设置固定的维度权重,即对于同一个维度,每个用户在该维度下的维度权重是相同的,例如,在维度权重为账号影响维度时,账号影响维度对应的维度权重为0.8,则所有用户在账号影响维度下的维度权重均为0.8。
在某些示例中,可以针对不同的用户设置不同的维度权重,即对于同一个维度,每个用户在该维度下的维度权重是不相同的,例如,在维度权重为账号影响维度时,用户a在账号影响维度下的维度权重为0.8;用户b在账号影响维度下的维度权重为0.6。
可以理解地,上述示例仅是为了更好地理解本公开实施例的技术方案而列举的示例,不作为对本公开实施例的唯一限制。
在维度权重确定模块430获取用户在各个维度下的评分值和各个维度对应的维度权重之后,执行目标评分确定模块440。
目标评分确定模块440可以用于基于所述用户在各个维度下的评分值和各个维度对应的维度权重,确定所述用户的目标评分值。
目标评分值是指结合各维度的评分值和维度权重,计算得到的用户的最终评分值,目标评分值可以反映出用户在指定业务平台的等级,目标评分值越高表示用户在指定业务平台上的等级越高,而目标评分值越低表示用户在指定业务平台上的等级越低。
在评分值确定模块420获取用户在各个维度下的评分值,及维度权重确定模块430获取各个维度对应的维度权重之后,可以由目标评分确定模块440根据评分值和维度权重计算用户的目标评分值,具体地,首先,可以计算每个维度下的评分值与该维度对应的维度权重的乘积值,然后将所有的乘积值相加,得到最终的和值,并将最终的和值作为用户的目标评分值。具体地,结合下述具体实现方式进行详细描述。
在本公开的一种具体实现中,如图5所示,目标评分确定模块440可以包括:乘积值计算子模块441和目标评分获取子模块442,其中,
乘积值计算子模块441可以用于计算各个维度的评分值与各个维度对应的维度权重的乘积值。
在得到用户在各个维度下的评分值,以及各个维度所对应的维度权重之后,可以由乘积值计算子模块441计算各个维度的评分值与对应维度的维度权重的乘积值,例如,在维度权重为账号影响维度时,账号影响维度对应的维度权重为0.8,用户在账号影响维度下的评分值为50,则二者的乘积值即为:50*0.8=40。
可以理解地,上述示例仅是为了更好地理解本公开实施例的技术方案而列举的示例,不作为对本公开实施例的唯一限制。
在乘积值计算子模块441计算得到各个维度的评分值与各个维度对应的维度权重的乘积值之后,执行目标评分获取子模块442。
目标评分获取子模块442可以用于将各所述乘积值相加求和,得到所述目标评分值。
目标评分值是指结合各维度的评分值和维度权重,计算得到的用户的最终评分值,目标评分值可以反映出用户在指定业务平台的等级,目标评分值越高表示用户在指定业务平台上的等级越高,而目标评分值越低表示用户在指定业务平台上的等级越低。
在乘积值计算子模块441计算各个维度的评分值与各个维度对应的维度权重的乘积值之后,可以由目标评分获取子模块442将这些乘积值相加求和,得到的和值即为用户在指定业务平台上的目标评分值。
本公开实施例通过结合用户在指定业务平台上的多个维度的数据信息对用户进行评分,可以动态反映出用户等级变化,无需频繁更改用户等级,并且,结合每个维度对应的维度权重确定用户的最终评分(即目标评分值),能够有效防止单一数据带来的评分变化。
本公开实施例提供的用户评分装置,通过获取用户在指定业务平台上的多个维度的数据信息,基于多个维度的数据信息,确定用户在各个维度下的评分值,并基于用户在各个维度下的评分值和各个维度对应的维度权重,确定用户的目标评分值。本公开实施例结合与用户关联的多个维度的数据信息对用户进行评分,根据用户评分可以动态反映出用户的等级变化,无需频繁更改用户等级,并且,结合每个维度对应的维度权重确定用户的最终评分(即目标评分值),能够有效防止单一数据带来的评分变化。
本公开的实施例还提供了一种电子设备,包括:处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现前述实施例的用户评分方法。
本公开的实施例还提供了一种计算机可读存储介质,存储有计算机指令,当所述计算机指令由电子设备的处理器执行时,使得电子设备能够执行前述实施例的用户评分方法。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
在此提供的算法和显示不与任何特定计算机、虚拟***或者其它设备固有相关。各种通用***也可以与基于在此的示教一起使用。根据上面的描述,构造这类***所要求的结构是显而易见的。此外,本公开的实施例也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本公开的实施例的内容,并且上面对特定语言所做的描述是为了披露本公开的实施例的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本公开的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本公开的示例性实施例的描述中,本公开的实施例的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本公开的实施例要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本公开的实施例的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的替代特征来代替。
本公开的实施例的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本公开的实施例的动态图片的生成设备中的一些或者全部部件的一些或者全部功能。本公开的实施例还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序。这样的实现本公开的实施例的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本公开的实施例进行说明而不是对本公开的实施例进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本公开的实施例可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的***、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
以上所述仅为本公开的实施例的较佳实施例而已,并不用以限制本公开的实施例,凡在本公开的实施例的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本公开的实施例的保护范围之内。
以上所述,仅为本公开的实施例的具体实施方式,但本公开的实施例的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本公开的实施例揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本公开的实施例的保护范围之内。因此,本公开的实施例的保护范围应以权利要求的保护范围为准。
Claims (13)
1.一种用户评分方法,其特征在于,包括:
获取用户在指定业务平台上的多个维度的数据信息;
基于所述多个维度的数据信息,确定所述用户在各个维度下的评分值;
基于所述用户在各个维度下的评分值和各个维度对应的维度权重,确定所述用户的目标评分值。
2.根据权利要求1所述的方法,其特征在于,还包括:
确定用于评价的多个维度及各个维度的维度权重。
3.根据权利要求2所述的方法,其特征在于,所述多个维度是从账号影响维度、创作频率维度、内容效果维度、内容专业维度、内容健康维度、以及原创维度中选取的。
4.根据权利要求3所述的方法,其特征在于,所述多个维度包括账号影响维度,所述获取用户在指定业务平台上的多个维度的数据信息的步骤,包括:
获取用户在指定业务平台上的账号影响维度的数据信息;
所述获取用户在指定业务平台上的账号影响维度的数据信息的步骤,包括:
获取所述用户在所述指定业务平台上的平台等级、用户等级和粉丝量;
所述基于所述多个维度的数据信息,确定所述用户在各个维度下的评分值的步骤,包括:
获取所述平台等级对应的平台分值、所述用户等级对应的用户分值及所述粉丝量对应的粉丝分值;
基于所述平台分值、所述用户分值和所述粉丝分值,计算得到所述用户在所述账号影响维度下的账号影响分值。
5.根据权利要求3所述的方法,其特征在于,所述多个维度包括创作频率维度,所述获取用户在指定业务平台上的多个维度的数据信息的步骤,包括:
获取用户在指定业务平台上的创作频率维度的数据信息;
所述获取用户在指定业务平台上的创作频率维度的数据信息的步骤,包括:
在从第一统计起始时间至当前时间之内,获取所述用户在所述指定业务平台上的每天的发文内容数量;
所述基于所述多个维度的数据信息,确定所述用户在各个维度下的评分值的步骤,包括:
基于每天的所述发文内容数量,确定每天的发文分值;
基于第一时间衰减因子,对每天的所述发文分值进行调整,得到每天的调整发文分值;
基于各所述调整发文分值,计算得到所述用户在所述创作频率维度下的创作频率分值。
6.根据权利要求3所述的方法,其特征在于,所述多个维度包括内容效果维度,所述获取用户在指定业务平台上的多个维度的数据信息的步骤,包括:
获取用户在指定业务平台上的内容效果维度的数据信息;
所述获取用户在指定业务平台上的内容效果维度的数据信息的步骤,包括:
在从第二统计起始时间至当前时间内,获取所述用户在所述指定业务平台上的每天内发布的至少一个发文内容;
所述基于所述多个维度的数据信息,确定所述用户在各个维度下的评分值的步骤,包括:
获取每个所述发文内容对应的喜爱度和分享收藏度;所述喜爱度与浏览数目、点赞数目和评论数目有关,所述分享收藏度与收藏数目、分享数目和点击数目有关;
基于各所述喜爱度和各所述分享收藏度,计算得到每天的内容分值;
基于第二时间衰减因子,对每天的所述内容分值进行调整,得到每天的调整内容分值;
基于各所述调整内容分值,计算得到所述用户在所述内容效果维度下的内容效果分值。
7.根据权利要求3所述的方法,其特征在于,所述多个维度包括内容专业维度,所述获取用户在指定业务平台上的多个维度的数据信息的步骤,包括:
获取用户在指定业务平台上的内容专业维度的数据信息;
所述获取用户在指定业务平台上的内容专业维度的数据信息的步骤,包括:
获取所述用户在所述指定业务平台上的所有发文内容;
所述基于所述多个维度的数据信息,确定所述用户在各个维度下的评分值的步骤,包括:
获取所述所有发文内容的总内容数,及所述所有发文内容中的精品内容数、热点内容数和推进内容数;
基于所述精品内容数和所述总内容数,计算得到精品内容率;
基于所述精品内容数、所述精品内容率、所述热点内容数和所述推进内容数,计算得到所述用户在所述内容专业维度下的内容专业分值。
8.根据权利要求7所述的方法,其特征在于,所述多个维度包括内容健康维度;
所述基于所述多个维度的数据信息,确定所述用户在各个维度下的评分值的步骤,包括:
获取所述所有发文内容中的不分发内容数和违规内容数;
基于所述不分发内容数和所述违规内容数,确定所述用户在所述内容健康维度下的内容健康分值。
9.根据权利要求7所述的方法,其特征在于,所述多个维度包括原创维度;
所述基于所述多个维度的数据信息,确定所述用户在各个维度下的评分值的步骤,包括:
获取所述所有发文内容中的原创内容数和非原创内容数;
基于所述原创内容数和所述非原创内容数,计算得到所述用户在所述原创维度下的内容原创分值。
10.根据权利要求1所述的方法,其特征在于,所述基于所述用户在各个维度下的评分值和各个维度对应的维度权重,确定所述用户的目标评分值的步骤,包括:
计算各个维度的评分值与各个维度对应的维度权重的乘积值;
将各所述乘积值相加求和,得到所述目标评分值。
11.一种用户评分装置,其特征在于,包括:
数据信息获取模块,用于获取用户在指定业务平台上的多个维度的数据信息;
评分值确定模块,用于基于所述多个维度的数据信息,确定所述用户在各个维度下的评分值;
目标评分确定模块,用于基于所述用户在各个维度下的评分值和各个维度对应的维度权重,确定所述用户的目标评分值。
12.一种电子设备,其特征在于,包括:
处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现权利要求1至10中任一项所述的用户评分方法。
13.一种计算机可读存储介质,其特征在于,存储有计算机指令,当所述计算机指令由电子设备的处理器执行时,使得电子设备能够执行权利要求1至10中任一项所述的用户评分方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910913446.6A CN110795658A (zh) | 2019-09-25 | 2019-09-25 | 用户评分方法、装置、电子设备及计算机存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910913446.6A CN110795658A (zh) | 2019-09-25 | 2019-09-25 | 用户评分方法、装置、电子设备及计算机存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110795658A true CN110795658A (zh) | 2020-02-14 |
Family
ID=69439725
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910913446.6A Withdrawn CN110795658A (zh) | 2019-09-25 | 2019-09-25 | 用户评分方法、装置、电子设备及计算机存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110795658A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111429294A (zh) * | 2020-03-23 | 2020-07-17 | 北京奇艺世纪科技有限公司 | 账户识别方法及装置、电子设备和可存储介质 |
CN112200600A (zh) * | 2020-09-10 | 2021-01-08 | 广州半城云信息科技有限公司 | 电商及私域流量的顾客价值的评估方法 |
CN112966203A (zh) * | 2021-03-12 | 2021-06-15 | 杨虡 | 一种等级确定方法、装置、电子设备及存储介质 |
CN113065899A (zh) * | 2021-04-12 | 2021-07-02 | 上海明略人工智能(集团)有限公司 | 用户生命周期价值计算方法、***、设备及存储介质 |
CN113220997A (zh) * | 2021-05-13 | 2021-08-06 | 北京百度网讯科技有限公司 | 数据处理方法、装置、电子设备及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103198161A (zh) * | 2013-04-28 | 2013-07-10 | 中国科学院计算技术研究所 | 微博水军识别方法与设备 |
CN107403336A (zh) * | 2017-06-26 | 2017-11-28 | 阿里巴巴集团控股有限公司 | 基于流数据的评分方法和装置 |
CN109086289A (zh) * | 2018-06-07 | 2018-12-25 | 杜泽壮 | 一种媒体数据处理方法、客户端、介质和设备 |
CN109670855A (zh) * | 2018-11-02 | 2019-04-23 | 北京奇虎科技有限公司 | 信息流平台作者的评分方法和装置 |
CN109919442A (zh) * | 2019-01-31 | 2019-06-21 | 德联易控科技(北京)有限公司 | 基于评价数据的汽修厂分类方法、装置及电子设备 |
CN109934461A (zh) * | 2019-02-15 | 2019-06-25 | 北京创鑫旅程网络技术有限公司 | 知识社区用户贡献能力计算方法及装置 |
-
2019
- 2019-09-25 CN CN201910913446.6A patent/CN110795658A/zh not_active Withdrawn
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103198161A (zh) * | 2013-04-28 | 2013-07-10 | 中国科学院计算技术研究所 | 微博水军识别方法与设备 |
CN107403336A (zh) * | 2017-06-26 | 2017-11-28 | 阿里巴巴集团控股有限公司 | 基于流数据的评分方法和装置 |
CN109086289A (zh) * | 2018-06-07 | 2018-12-25 | 杜泽壮 | 一种媒体数据处理方法、客户端、介质和设备 |
CN109670855A (zh) * | 2018-11-02 | 2019-04-23 | 北京奇虎科技有限公司 | 信息流平台作者的评分方法和装置 |
CN109919442A (zh) * | 2019-01-31 | 2019-06-21 | 德联易控科技(北京)有限公司 | 基于评价数据的汽修厂分类方法、装置及电子设备 |
CN109934461A (zh) * | 2019-02-15 | 2019-06-25 | 北京创鑫旅程网络技术有限公司 | 知识社区用户贡献能力计算方法及装置 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111429294A (zh) * | 2020-03-23 | 2020-07-17 | 北京奇艺世纪科技有限公司 | 账户识别方法及装置、电子设备和可存储介质 |
CN111429294B (zh) * | 2020-03-23 | 2024-03-05 | 北京奇艺世纪科技有限公司 | 账户识别方法及装置、电子设备和可存储介质 |
CN112200600A (zh) * | 2020-09-10 | 2021-01-08 | 广州半城云信息科技有限公司 | 电商及私域流量的顾客价值的评估方法 |
CN112966203A (zh) * | 2021-03-12 | 2021-06-15 | 杨虡 | 一种等级确定方法、装置、电子设备及存储介质 |
CN113065899A (zh) * | 2021-04-12 | 2021-07-02 | 上海明略人工智能(集团)有限公司 | 用户生命周期价值计算方法、***、设备及存储介质 |
CN113220997A (zh) * | 2021-05-13 | 2021-08-06 | 北京百度网讯科技有限公司 | 数据处理方法、装置、电子设备及存储介质 |
CN113220997B (zh) * | 2021-05-13 | 2023-07-25 | 北京百度网讯科技有限公司 | 数据处理方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110795658A (zh) | 用户评分方法、装置、电子设备及计算机存储介质 | |
US8849822B2 (en) | Method for generating search result and system for information search | |
US11461803B2 (en) | Content item slot location suggestions | |
Lao | Search, Essential Facilities, and the Antitrust Duty to Deal | |
CN106372249B (zh) | 一种点击率预估方法、装置及电子设备 | |
US8095419B1 (en) | Search score for the determination of search quality | |
US20150066590A1 (en) | Optimization of social media engagement | |
DE202013005811U1 (de) | System zum Zustellen elektronischer Inhalte | |
CN104090908B (zh) | 统计页面组的平均停留时间、网站内容推广的方法和装置 | |
Clarke | SEO 2016 Learn Search Engine Optimization With Smart Internet Marketing Strategies | |
EP2509007A1 (en) | Evaluating supply of electronic content relating to keywords | |
WO2014123617A1 (en) | Bid adjustment suggestions based on device type | |
CN106897398B (zh) | 一种视频展示方法及装置 | |
US20160342692A1 (en) | Ranking content items based on preference scores | |
CN109558884A (zh) | 一种直播房间分类的方法、装置、服务器及介质 | |
Netanel | Mandating digital platform support for quality journalism | |
CN102880643B (zh) | 一种动态信息的筛选显示方法和装置 | |
US9514194B1 (en) | Website duration performance based on category durations | |
CN104991935B (zh) | 一种网站关注度的处理方法和装置 | |
WO2016148842A1 (en) | System and method for providing context-based third-party content | |
US9053129B1 (en) | Content item relevance based on presentation data | |
US9558233B1 (en) | Determining a quality measure for a resource | |
CN102508883B (zh) | 一种确定与多媒体相关联的展现信息的方法、装置及设备 | |
CN108881968A (zh) | 一种网络视频广告投放方法和*** | |
CN112000865B (zh) | 热词生成方法、装置、服务器及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20200214 |