CN103455938A - 一种数据处理方法、装置及服务器设备 - Google Patents
一种数据处理方法、装置及服务器设备 Download PDFInfo
- Publication number
- CN103455938A CN103455938A CN2013103957138A CN201310395713A CN103455938A CN 103455938 A CN103455938 A CN 103455938A CN 2013103957138 A CN2013103957138 A CN 2013103957138A CN 201310395713 A CN201310395713 A CN 201310395713A CN 103455938 A CN103455938 A CN 103455938A
- Authority
- CN
- China
- Prior art keywords
- version
- feedback data
- product
- user
- weighted value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种数据处理方法、装置及服务器设备。所述方法包括:记录对产品每个版本的反馈数据对应的数值及反馈数据的反馈次数;获取产品每个版本对应的权重值;根据所述反馈数据对应的数值、反馈数据的反馈次数及每个版本的权重值计算产品的最终反馈数据。
Description
技术领域
本发明涉及计算机科学技术领域,尤其涉及一种数据处理方法、装置及服务器设备。
背景技术
随着信息技术和互联网的快速发展,衍生出各种各样的用户生成内容(UGC)的网站、论坛和贴吧等,而在这些UGC中,用户参与度最高、门槛最低的就是评论评分***。几乎每一个论坛、贴吧、门户网站、视频网站都存在用户参与的评论评分***。对于用户而言,评论评分几乎没有任何难点,一般只要注册网站,提供一些个人真实或者不真实的基本信息就可以进行评分。而且正是因为评论评分简单、没有门槛,但是用户关注度、参与度高的原因,也让一些广告、色情等信息很容易的充斥在其中,影响用户体验。
另外,用户还通过其评论评分***中他人的评论评分,来决定是否购买或者使用某一种商品,而在这些决定用户是否下载、购买、浏览某一个商品的因素中,该商品的评分是一个重要的因素。评分有可能直接影响着该商品在整个市场上的排名和销售量。
目前的评分计算方法仅仅是最原始的加权计算方法。基于加权的评分计算采用的是不同比重数据的平均数,即将原始数据按照合理的比例来计算,若n个数中,x1出现f1次,x2出现f2次,...,xk出现fk次,那么(x1f1+x2f2+...xkfk)/(f1+f2+...+fk)叫做x1,x2,...,xk的加权平均数,其中f1,f2,...,fk可以看做是x1,x2,...,xk对应的权重。原始数据所占的比例是固定的。
但是由于加权只是简单的考虑同一种商品用户评分数量这一种因素,完全没有参考商品的更新迭代对其的影响,用户很难从中得到更真实的评分信息。
发明内容
本发明实施例提供一种数据处理方法、装置及服务器设备,用于实现对用户反馈信息更加精确地分析。
一种数据处理方法,该方法包括:
记录对产品每个版本的反馈数据对应的数值及反馈数据的反馈次数;
获取产品每个版本对应的权重值;
根据所述反馈数据对应的数值、反馈数据的反馈次数及每个版本的权重值计算产品的最终反馈数据。
本方案中,考虑到一些产品的迭代性,通过对产品的不同版面分配不同的权重值,这样,在计算该产品的最终反馈数据时,能够体现不同版本产品的反馈数据对于最终反馈数据的影响,使得对用户反馈数据的分析更加精确。
优选地,根据所述反馈数据对应的数值、反馈数据的反馈次数及每个版本的权重值计算产品的最终反馈数据包括:根据以下公式计算产品的最终反馈数据,
其中,S为该产品的最终反馈数据;Cij为对所述产品第j个版本的第i个反馈数据对应的数值;Nij为对所述产品第j个版本的第i个反馈数据的反馈次数;Wj为所述产品第j个版本的权重值;i=1,2,3......n,j=1,2,3......m,n为反馈数据的个数,m为版本的个数。
本实施例中,通过按照产品版本的新旧顺序,为每个版本分配权重值,这样,在计算所述产品的最终反馈数据时,能够体现不同版本产品的反馈数据对于最终反馈数据的影响,使得对用户反馈数据的分析更加精确。
优选地,获取产品每个版本对应的权重值包括:通过以下公式计算每个版本对应的权重值:
其中,Wj为所述产品第j个版本的权重值,j=1,2,3...m;m为所述产品版本个数;tj为第j个版本与第j+1个版本之间的版本差异值,其中t0=0。
优选地,所述版本差异值是通过以下公式计算而得的:
当zj<yj时,所述版本差异值
所述zj为根据所述产品第j个版本与第j+1个版本之间的差异获得的代码更新增量;yj为所述产品第j个版本的代码量。
本方案中,通过根据产品每个版本的代码量及相邻版本之间的代码更新增量计算每个版本对应的权重值,使得每个版本的权重值体现了相邻版本之间的差异,能够更加准确地体现不同版本产品的反馈数据对于最终反馈数据的影响,使得对用户反馈数据的分析更加精确。
优选地,所述产品每个版本对应的权重值呈等差数列或等比数列,或所述产品每个版本对应的权重值根据预先设置的表格查询获得。
本方案中,通过按照产品版本的新旧顺序,为每个版本分配递减的权重值,这样,在计算所述产品的最终反馈数据时,能够体现新旧版本产品的反馈数据对于最终反馈数据的影响,即最新版本产品的反馈数据对最终反馈数据影响最大,而越旧版本产品的反馈数据对最终反馈数据影响越小,使得对用户反馈数据的分析更加精确。
优选地,获取产品每个版本对应的权重值包括:
检测所述反馈数据对应的产品版本是否已记录;
当所述反馈数据对应的产品版本已记录时,获取已记录的所述产品版本对应的权重值;
当所述反馈数据对应的产品版本未记录时,重新计算已记录的产品版本和未记录的产品版本对应的权重值。
本实施例中,通过判断反馈数据是否针对新版本产品,当反馈数据是针对新版本产品,即产品已更新,需要调整产品各个的权重值,使得最新版本对应的权重值最大,越旧版本对应的权重值越小,使得对用户反馈数据的分析更加精确。当产品未更新时,则获取已有版本对应的权重值,对用户反馈数据进行分析计算。
优选地,所述方法还包括:
记录提交所述反馈数据的用户ID;
根据所述用户ID检测所述用户是否对同一产品的同一版本已提交过反馈数据;
当已提交过的反馈数据,将所述用户对同一产品的同一版本的在先提交的反馈数据删除,保留在后提交的反馈数据。
本方案中,可以避免同一用户反复对所述产品进行恶意反馈,也可以及时更新用户对所述产品的最新反馈数据,使得对用户反馈数据的分析更加精确。
优选地,所述方法还包括:
记录提交所述反馈数据的用户ID;
检测所述用户ID对所述产品提交的反馈数据的次数或对所述产品的其中一个版本提交的反馈数据的次数;
当对所述产品提交的反馈数据的次数或对所述产品的其中一个版本提交的反馈数据的次数超过预设的第一阈值时,不记录所述用户ID提交的反馈数据。
本方案中,可以避免同一用户反复对所述产品进行恶意反馈,也可以及时更新用户对所述产品的最新反馈数据,使得对用户反馈数据的分析更加精确。
优选地,所述方法还包括:
记录提交所述反馈数据的用户ID;
检测所述用户ID在预设时间段内提交反馈数据的次数;
当所述用户ID在预设时间段内提交反馈数据的次数超过预设的第二阈值时,不记录所述用户ID提交的反馈数据。
本方案中,可以避免同一用户频繁地对所述产品进行恶意反馈,也可以及时更新用户对所述产品的最新反馈数据,使得对用户反馈数据的分析更加精确。
优选地,所述方法还包括:
对所述反馈数据进行审核,判断所述反馈数据中是否包含不合法信息;
当所述反馈数据中包含不合法信息时,删除所述反馈数据。
本方案中,可以对含有垃圾信息或不良内容的反馈数据进行过滤,避免用户的恶意反馈后续分析的影响,提高对用户反馈数据的分析的精确度。
一种数据处理装置,所述装置包括:
记录模块,用于记录对产品每个版本的反馈数据对应的数值及反馈数据的反馈次数;
获取模块,用于获取产品每个版本对应的权重值;
最终反馈数据计算模块,用于根据所述反馈数据对应的数值、反馈数据的反馈次数及每个版本的权重值计算产品的最终反馈数据。
优选地,所述最终反馈数据计算模块,用于根据以下公式计算计算产品的最终反馈数据,
其中,S为所述产品的最终反馈数据;Cij为对所述产品第j个版本的第i个反馈数据对应的数值;Nij为对所述产品第j个版本的第i个反馈数据的反馈次数;Wj为所述产品第j个版本的权重值;i=1,2,3......n,j=1,2,3......m,n为反馈数据的个数,m为版本的个数。
优选地,所述获取模块包括:权重计算子模块,用于通过以下公式计算每个版本对应的权重值:
其中,Wj为所述产品第j个版本的权重值,j=1,2,3...m;m为所述产品版本个数;tj为第j个版本与第j+1个版本之间的版本差异值,其中t0=0。
优选地,所述权重计算子模块,用于通过以下公式计算所述版本差异值:
所述zj为根据所述产品第j个版本与第j+1个版本之间的差异获得的代码更新增量;yj为所述产品第j个版本的代码量。
优选地,所述获取模块还包括:
检测子模块,用于检测所述反馈数据对应的产品版本是否已记录;
权重获取子模块,用于当所述反馈数据对应的产品版本已记录时,获取已记录的所述产品版本对应的权重值;
所述权重计算子模块,当所述反馈数据对应的产品版本未记录时,重新计算已记录的产品版本和未记录的产品版本对应的权重值。
优选地,所述产品每个版本对应的权重值呈等差数列或等比数列,或所述产品每个版本对应的权重值根据预先设置的表格查询获得。
优选地,所述装置还包括:第一检测模块,
所述记录模块,用于记录提交所述反馈数据的用户ID;
所述第一检测模块,用于根据所述用户ID检测所述用户是否对同一产品的同一版本已提交过反馈数据;
所述记录模块,用于当已提交过的反馈数据,将所述用户对同一产品的同一版本的在先提交的反馈数据删除,保留在后提交的反馈数据。
优选地,所述装置还包括:第二检测模块,
所述记录模块,用于记录提交所述反馈数据的用户ID;
所述第二检测模块,用于检测所述用户ID对所述产品提交的反馈数据的次数或对所述产品的其中一个版本提交的反馈数据的次数;
所述记录模块,用于当对所述产品提交的反馈数据的次数或对所述产品的其中一个版本提交的反馈数据的次数超过预设的第一阈值时,不记录所述用户ID提交的反馈数据。
优选地,所述装置还包括:第三检测模块,
所述记录模块,用于记录提交所述反馈数据的用户ID;
所述第三检测模块,用于检测所述用户ID在预设时间段内提交反馈数据的次数;
所述记录模块,用于当所述用户ID在预设时间段内提交反馈数据的次数超过预设的第二阈值时,不记录所述用户ID提交的反馈数据。
优选地,所述装置还包括:
审核模块,用于对所述反馈数据进行审核,判断所述反馈数据中是否包含不合法信息;
所述记录模块,用于当所述反馈数据中包含不合法信息时,删除所述反馈数据。
一种服务器设备,所述服务器设备包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
记录对产品每个版本的反馈数据对应的数值及反馈数据的反馈次数;
获取产品每个版本对应的权重值;
根据所述反馈数据对应的数值、反馈数据的反馈次数及每个版本的权重值计算产品的最终反馈数据。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明实施例中数据处理方法的流程示意图;
图2为本发明实施例中数据处理方法的另一流程示意图;
图3为本发明实施例中数据处理方法的再一流程示意图;
图4为本发明实施例中数据处理装置的结构示意图;
图5为本发明实施例中获取模块的结构示意图;
图6为本发明实施例中服务器设备的结构示意图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
如图1所述,本发明实施例提供了一种数据处理方法,包括以下步骤:
步骤102,记录产品每个版本的反馈数据对应的数值及反馈数据的反馈次数;
步骤104,获取产品每个版本对应的权重值;
步骤106,根据反馈数据对应的数值、反馈数据的反馈次数及每个版本的权重值计算产品的最终反馈数据。
本实施例中,考虑到一些产品的迭代性,通过对产品的不同版面分配不同的权重值,这样,在计算产品的最终反馈数据时,能够体现不同版本产品的反馈数据对于最终反馈数据的影响,使得对用户反馈数据的分析更加精确。
优选地,步骤106中,根据反馈数据对应的数值、反馈数据的反馈次数及每个版本的权重值计算产品的最终反馈数据包括:
其中,S为产品的最终反馈数据;Cij为对产品第j个版本的第i个反馈数据对应的数值;Nij为对产品第j个版本的第i个反馈数据的反馈次数;Wj为产品第j个版本的权重值;i=1,2,3......n,j=1,2,3......m,n为反馈数据的个数,m为版本的个数。
优选地,产品每个版本对应的权重值呈等差数列或等比数列,或产品每个版本对应的权重值根据预先设置的表格查询获得。
例如:版本之间的权重值呈等差数列,如1,0.8,0.6,0.4。版本之间的权重值呈等比数列,如1,0.8,0.64,0.512。或者,版本之间的权重值依据预先设置好的表格查表获得。还可以根据某个重点版本的更新给出特别权重,如该版本与相邻版本之间差两级。例如,某产品刚做了一次重大更新,最新版本与其之前版本的权重值依次为:1,0.6,0.4。
本实施例中,通过按照产品版本的新旧顺序,为每个版本分配递减的权重值,这样,在计算产品的最终反馈数据时,能够体现新旧版本产品的反馈数据对于最终反馈数据的影响,即最新版本产品的反馈数据对最终反馈数据影响最大,而越旧版本产品的反馈数据对最终反馈数据影响越小,使得对用户反馈数据的分析更加精确。
优选地,为了更加合理的表现出版本升级对于每个版本权重的影响,步骤104中,根据产品每个版本的代码量及相邻版本之间的代码更新增量计算每个版本对应的权重值:
其中,Wj为产品第j个版本的权重值,j=1,2,3...m;m为产品版本个数;tj为第j个版本与第j+1个版本之间的版本差异值,其中t0=0。所述公式中,根据产品版本由新到旧对应的权重值分别为W1、W2、W3...Wm。应当指出,权重值的编号顺序与产品版本的新旧之间的对应关系,仅是一种人为的设定,并不影响本发明的保护范围限定。
版本差异值是通过以下公式计算而得的:
当zj<yj时,版本差异值
当zj≥yj时,版本差异值
zj为根据产品第j个版本与第j+1个版本之间的差异获得的代码更新增量;yj为产品第j个版本的代码量。
实际中,可以采用二进制差异(binary diff,bsdiff)程序针对产品新旧两个版本之间的差异生成的差异(diff)文件,根据diff文件的代码量和每个版本Android安装包(AndroidPackage,apk)文件的代码量计算每个版本对应的权重值。例如:某个产品一共有5个版本,产品由新到旧版本号依次为1、2、3、4、5。根据上述公式(2),计算得到每个版本的权重值依次为:
W1=1;
例如"搜狗输入法"从版本2.0升级到1.0,版本2.0的apk文件10M,版本1.0的apk文件12M,这2个版本之间的根据算法生成的diff文件5M,则版本升级后,版本1.0对应的权重值为1,版本2.0对应的权重值为1-5/12=0.58。
本实施例中,通过根据产品每个版本的代码量及相邻版本之间的代码更新增量计算每个版本对应的权重值,使得每个版本的权重值体现了相邻版本之间的差异,能够更加准确地体现不同版本产品的反馈数据对于最终反馈数据的影响,使得对用户反馈数据的分析更加精确。
优选地,本实施例中,步骤104包括:
检测反馈数据对应的产品版本是否已记录;
当反馈数据对应的产品版本已记录时,获取已记录的产品版本对应的权重值;
当反馈数据对应的产品版本未记录时,重新计算已记录的产品版本和未记录的产品版本对应的权重值。
本实施例中,通过判断反馈数据是否针对新版本产品,当反馈数据是针对新版本产品,即产品已更新,需要调整产品各个的权重值,使得最新版本对应的权重值最大,越旧版本对应的权重值越小,使得对用户反馈数据的分析更加精确。当产品未更新时,则获取已有版本对应的权重值,对用户反馈数据进行分析计算。
优选地,该方法还包括:在步骤102中还记录提交反馈数据的用户ID;步骤104之前,根据用户ID检测用户是否对同一产品的同一版本已提交过反馈数据;当已提交过的反馈数据,将用户对同一产品的同一版本的在先提交的反馈数据删除,保留在后提交的反馈数据。这样,可以避免同一用户反复对产品进行恶意反馈,也可以及时更新用户对产品的最新反馈数据,使得对用户反馈数据的分析更加精确。
优选地,该方法还包括:在步骤102中还记录提交反馈数据的用户ID;步骤104之前,检测用户ID对产品提交的反馈数据的次数或对产品的其中一个版本提交的反馈数据的次数;当对产品提交的反馈数据的次数或对产品的其中一个版本提交的反馈数据的次数超过预设的第一阈值时,不记录用户ID提交的反馈数据。这样,可以避免同一用户反复对产品进行恶意反馈,也可以及时更新用户对产品的最新反馈数据,使得对用户反馈数据的分析更加精确。
优选地,该方法还包括:在步骤102中还记录提交反馈数据的用户ID;在步骤104之前,检测用户ID在预设时间段内提交反馈数据的次数;当用户ID在预设时间段内提交反馈数据的次数超过预设的第二阈值时,不记录用户ID提交的反馈数据。这样,可以避免同一用户频繁地对产品进行恶意反馈,也可以及时更新用户对产品的最新反馈数据,使得对用户反馈数据的分析更加精确。
优选地,该方法还包括:在步骤104之前,对反馈数据进行审核,判断反馈数据中是否包含不合法信息;当反馈数据中包含不合法信息时,删除反馈数据。这样,可以对含有垃圾信息或不良内容的反馈数据进行过滤,避免用户的恶意反馈后续分析的影响,提高对用户反馈数据的分析的精确度。
下面以用户对不同版本软件进行评分为例对本发明实施例提供的方法进行详细说明。
如图2所示,当有用户提交新的评分时,本发明实施例提供的该方法包括以下步骤:
步骤202,将该用户提交的评分信息记录在数据库中;其中评分信息中至少包括:分数值和针对的软件版本信息;
步骤204,在数据库中记录评分信息时对该分数值的评分次数进行更新;
步骤206,检测该新提交评分所针对的版本信息是否为对数据库中已有软件版本的评分,如果是,执行步骤208,如果否,执行步骤210;
步骤208,直接利用数据库中记录的数据计算软件的最终评分;
步骤210,获取软件版本的权重值后,计算软件的最终评分。
本实施例中,对软件评分的计算更加的合理。软件的开发者可以更快的看到用户对于新上线或者提交的软件的喜好。当用户对软件差评较多时,可以及时的从评分的迅速变化反应出来,便于开发者及时提交新版本。对软件评分的计算更加精确,对于软件评分影响的排行、精品等信息的推荐更加的合理,在排行,精品等一系列个性化推荐中评分较差的软件不予以推荐。可以对比同一开发者的软件,推荐给用户该开发者评分较高的软件给用户。
如图3所示,本发明实施例提供的该方法包括以下步骤:
步骤302,将该用户提交的评分信息记录在数据库中,其中评分信息中至少包括:分数值、针对的软件版本信息和用户ID;
步骤304,在数据库记录评分信息时对该分数值的评分次数进行更新;
步骤306,根据用户ID检测该用户是否对该软件的同一版本已提交过反馈数据,如果否,执行步骤308,如果是,执行步骤310;
步骤308,直接利用数据库中记录的数据计算软件的最终评分;
步骤310,在数据库中删除该用户原先的评分记录,添加新的评分记录;
步骤312,根据更新后的数据库计算软件的最终评分。
这样,可以避免同一用户反复对该软件进行恶意评分,也可以及时更新用户对该软件的最新评价。
为了体现用户对软件的喜好程度,采用目前流行的评星方式,1-5星分别代表了用户对软件的喜好程度,1星最不喜欢,5星最喜欢。
对同一个软件的同一个版本评分,采用加权方式计算软件的最终评分。用户第一次评分的时候,相应的星值加1,评分总数加1。用户第二次以及以后的评分,相应的星值评分次数加1,原来的星值评分次数减1。
例如,appId为10的软件版本1目前评分1,2,3,4,5星的人数分别为1,2,3,2,1,则评星的总数为1*1+2*2+3*3+2*4+1*5=27,评分总人数为1+2+3+2+1=9人,软件评分为27/9=3。当某一个用户第一次评3星时,评3星的人数加1,评星的总数加3,软件评分为30/10=3星。这个用户第二次评分为5分,则原来的3星个数减1,5星的个数加1。此时,评1,2,3,4,5星的人数分别是1,2,3,2,2,评星总数30-3+5=32,软件评分为32/10=3.2。
但软件版本升级后,相应的评星人数也随之改变,appId为10的软件为例(评分1,2,3,4,5星的人数分别为1,2,3,2,1),当应用升级到版本2时,相应的评星人数均乘以一个系数0.8(或者其他0-1之间的值),评1,2,3,4,5星的人数变为0.8,1.6,2.4,1.6,0.8,评分的总人数变为0.8+1.6+2.4+1.6+0.8=7.2,评星总数是27*0.8=21.6,软件评分为21.6/7.2=3。可见,在版本升级后,如果还没有人评分时,软件评分是保持不变的。
当有一个用户(不管是之前从没有评分过的用户还是评分过的用户)对软件的评分为1分时,这是评1,2,3,4,5星的人数为1.8,1.6,2.4,1.6,0.8,评分总人数变为8.2,评分总数变为22.6,则软件评分为22.6/8.2=2.756。可见一个用户对于新版本的差评(1星)直接导致了软件评分从3降到了2.75,而同时也保留了老版本的评分对于软件评分的影响。
当一些恶意的用户为了提高好评数,通过程序或者人工的方式发布一些广告,黄色信息时,软件评分的计算也会受到很大的影响,可以有以下2种方式解决:
1)先通过审核,后删除评论评分。
以前面的appId为10(评分1,2,3,4,5星的人数分别为1,2,3,2,1)的软件为例,某一个用户发表了一条黄色广告评论,评分是5分,这时评星人数变为1,2,3,2,2,软件评分为3.2。但是这个评分不应该累计到软件评分计算中,删除的时候,先检测这条评论评分记录对应的版本是否是app的最新版本,如果是,表明版本还没有进行升级,这时可以简单的将对于的星数减1,总评分减1,则软件评分为(1*1+2*2+3*3+4*2+5*(2-1))/(1+2+3+2+2-1)=3。如果不是app的最新版,则需要检测出app已经升级了多少次,假设升级了1次,软件评分就应该是(1*1+2*2+3*3+4*2+5*(2-1*0.8))/(1+2+3+2+2-1*0.8)=3.04。
2)直接通过程序判断为垃圾评论,其评分对平均分的计算没有影响
通过一些机器学习和基于正则规则的垃圾评论检测方式,可以及时的发现垃圾广告,将其状态设置为仅自己可见,这样他发过来的评论评分在他的手机端可以看到。
例如,垃圾评论的识别方式如下:A)可以限制同一个用户推荐的次数;B)对于查找出来的app,在评论***中查找它的评分,评分小于2,认为它是一个垃圾的应用,在各种列表上展示;C)每一个账号在一段时间内(比如一天)不能超过10条重复的评论,每一个ime号在一段时间内(比如一天)不能超过20条相同的评论。
基于同一发明构思,本发明实施例还提供一种数据处理装置,如图4所示,该装置包括:
记录模块41,用于记录对产品每个版本的反馈数据对应的数值及反馈数据的反馈次数;
获取模块42,用于获取产品每个版本对应的权重值;
最终反馈数据计算模块43,用于根据反馈数据对应的数值、反馈数据的反馈次数及每个版本的权重值计算产品的最终反馈数据。
优选地,最终反馈数据计算模块43根据以下公式计算计算产品的最终反馈数据,
其中,S为该产品的最终反馈数据;Cij为对该产品第j个版本的第i个反馈数据对应的数值;Nij为对该产品第j个版本的第i个反馈数据的反馈次数;Wj为该产品第j个版本的权重值;i=1,2,3......n,j=1,2,3......m,n为反馈数据的个数,m为版本的个数。
优选地,如图5所示,获取模块42包括:权重计算子模块421,用于通过以下公式计算每个版本对应的权重值:
其中,Wj为产品第j个版本的权重值,j=1,2,3...m;m为产品版本个数;tj为第j个版本与第j+1个版本之间的版本差异值,其中t0=0。
优选地,权重计算子模块,用于通过以下公式计算版本差异值:
当zj<yj时,版本差异值
当zj≥yj时,版本差异值
zj为根据产品第j个版本与第j+1个版本之间的差异获得的代码更新增量;yj为产品第j个版本的代码量。
优选地,如图5所示,获取模块42还包括:
检测子模块422,用于检测反馈数据对应的产品版本是否已记录;
权重获取子模块423,用于当反馈数据对应的产品版本已记录时,获取已记录的产品版本对应的权重值;
权重计算子模块421,当反馈数据对应的产品版本未记录时,重新计算已记录的产品版本和未记录的产品版本对应的权重值。
如图4所示,优选地,该装置还包括:第一检测模块44,
记录模块41,用于记录提交反馈数据的用户ID;
第一检测模块44,用于根据用户ID检测该用户是否对同一产品的同一版本已提交过反馈数据;
记录模块41,用于当已提交过的反馈数据,将该用户对同一产品的同一版本的在先提交的反馈数据删除,保留在后提交的反馈数据。
优选地,该装置还包括:第二检测模块45,
记录模块41,用于记录提交反馈数据的用户ID;
第二检测模块45,用于检测用户ID对产品提交的反馈数据的次数或对产品的其中一个版本提交的反馈数据的次数;
记录模块41,用于当对产品提交的反馈数据的次数或对产品的其中一个版本提交的反馈数据的次数超过预设的第一阈值时,不记录用户ID提交的反馈数据。。
优选地,该装置还包括:第三检测模块46,
记录模块41,用于记录提交反馈数据的用户ID;
第三检测模块46,用于检测用户ID在预设时间段内提交反馈数据的次数;
记录模块41,用于当用户ID在预设时间段内提交反馈数据的次数超过预设的第二阈值时,不记录用户ID提交的反馈数据。
优选地,该装置还包括:
审核模块47,用于对反馈数据进行审核,判断反馈数据中是否包含不合法信息;
记录模块41,用于当反馈数据中包含不合法信息时,删除反馈数据。
图6是本发明实施例提供的一种服务器设备结构示意图。如图6所示,该服务器设备可以用于实施上述实施例中提供的数据处理方法。其中,该服务器设备可以为网络环境中的高性能计算机或计算机***等,侦听网络上的其他计算机(客户机)提交的服务请求,并提供相应的服务。优先的:
该服务器设备600包括但不限于如下结构或动能。优先地,该服务器设备600至少包括一个或多个中央处理器(CPU)610、一个或多个内存630、用于存储操作***621、应用程序622或数据的一个或多个媒体620(例如一个或多个大容量存储器)。
该一个或多个内存630和媒体620可以设置为临时的或非临时的。存储在一个或多个媒体620中的程序可以包括一个或多个模块。每个模块可以包括该服务器设备600的操作指令集。更近一步地,CPU610可以被配置为与媒体620进行通信、执行指令集及执行在服务器设备600上的操作。
该服务器设备还可以包括一个或多个电源660、一个或多个有线或无线网络接口640、一个或多个键盘一个或多个输入输出(I/O)接口650、和/或一个或多个操作***621,如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等操作***。
具体在本实施例中,服务器设备包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行一个或者一个以上程序包含用于进行以下操作的指令:
记录产品每个版本的反馈数据对应的数值及反馈数据的反馈次数;
获取产品每个版本对应的权重值;
根据反馈数据对应的数值、反馈数据的反馈次数及每个版本的权重值计算产品的最终反馈数据。
优选地,还包含用于进行以下操作的指令:根据反馈数据对应的数值、反馈数据的反馈次数及每个版本的权重值计算产品的最终反馈数据包括:
其中,S为该产品的最终反馈数据;Cij为对该产品第j个版本的第i个反馈数据对应的数值;Nij为对该产品第j个版本的第i个反馈数据的反馈次数;Wj为该产品第j个版本的权重值;i=1,2,3......n,j=1,2,3......m,n为反馈数据的个数,m为版本的个数。
优选地,还包含用于进行以下操作的指令:通过以下公式计算每个版本对应的权重值:
其中,Wj为产品第j个版本的权重值,j=1,2,3…m;m为产品版本个数;tj为第j个版本与第j+1个版本之间的版本差异值,其中t0=0。
优选地,还包含用于进行以下操作的指令:版本差异值是通过以下公式计算而得的:
当zj<yj时,版本差异值
当zj≥yj时,版本差异值
zj为根据产品第j个版本与第j+1个版本之间的差异获得的代码更新增量;yj为产品第j个版本的代码量。
优选地,还包含用于进行以下操作的指令:检测反馈数据对应的产品版本是否已记录;当反馈数据对应的产品版本已记录时,获取已记录的产品版本对应的权重值;当反馈数据对应的产品版本未记录时,重新计算已记录的产品版本和未记录的产品版本对应的权重值。
优选地,还包含用于进行以下操作的指令:记录提交反馈数据的用户ID;根据用户ID检测该用户是否对同一产品的同一版本已提交过反馈数据;当已提交过的反馈数据,将该用户对同一产品的同一版本的在先提交的反馈数据删除,保留在后提交的反馈数据。
优选地,还包含用于进行以下操作的指令:记录提交反馈数据的用户ID;检测用户ID对产品提交的反馈数据的次数或对产品的其中一个版本提交的反馈数据的次数;当对产品提交的反馈数据的次数或对产品的其中一个版本提交的反馈数据的次数超过预设的第一阈值时,不记录用户ID提交的反馈数据。
优选地,还包含用于进行以下操作的指令:记录提交反馈数据的用户ID;检测用户ID在预设时间段内提交反馈数据的次数;当用户ID在预设时间段内提交反馈数据的次数超过预设的第二阈值时,不记录用户ID提交的反馈数据。
优选地,还包含用于进行以下操作的指令:对反馈数据进行审核,判断反馈数据中是否包含不合法信息;当反馈数据中包含不合法信息时,删除反馈数据。
本发明设备实施例的数据处理方法、装置及服务器设备,考虑到一些产品的迭代性,通过对产品的不同版面分配不同的权重值,这样,在计算该产品的最终反馈数据时,能够体现不同版本产品的反馈数据对于最终反馈数据的影响,使得对用户反馈数据的分析更加精确。
本领域内的技术人员应明白,本发明的实施例可提供为方法、***、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (21)
1.一种数据处理方法,其特征在于,所述方法包括:
记录对产品每个版本的反馈数据对应的数值及反馈数据的反馈次数;
获取产品每个版本对应的权重值;
根据所述反馈数据对应的数值、反馈数据的反馈次数及每个版本的权重值计算产品的最终反馈数据。
2.如权利要求1所述的方法,其特征在于,根据所述反馈数据对应的数值、反馈数据的反馈次数及每个版本的权重值计算产品的最终反馈数据,包括:根据以下公式计算产品的最终反馈数据,
其中,S为该产品的最终反馈数据;Cij为对所述产品第j个版本的第i个反馈数据对应的数值;Nij为对所述产品第j个版本的第i个反馈数据的反馈次数;Wj为所述产品第j个版本的权重值;i=1,2,3......n,j=1,2,3......m,n为反馈数据对应的数值的个数,m为所述产品的版本个数。
3.如权利要求1或2所述的方法,其特征在于,获取产品每个版本对应的权重值包括:通过以下公式计算每个版本对应的权重值:
其中,Wj为所述产品第j个版本的权重值,j=1,2,3...m;m为所述产品版本个数;tj为第j个版本与第j+1个版本之间的版本差异值,其中t0=0。
5.如权利要求1所述的方法,其特征在于,所述产品每个版本对应的权重值呈等差数列或等比数列,或所述产品每个版本对应的权重值根据预先设置的表格查询获得。
6.如权利要求1所述的方法,其特征在于,获取产品每个版本对应的权重值包括:
检测所述反馈数据对应的产品版本是否已记录;
当所述反馈数据对应的产品版本已记录时,获取已记录的所述产品版本对应的权重值;
当所述反馈数据对应的产品版本未记录时,重新计算已记录的产品版本和未记录的产品版本对应的权重值。
7.如权利要求1所述的方法,其特征在于,所述方法还包括:
记录提交所述反馈数据的用户ID;
根据所述用户ID检测所述用户是否对同一产品的同一版本已提交过反馈数据;
当已提交过的反馈数据,将所述用户对同一产品的同一版本的在先提交的反馈数据删除,保留在后提交的反馈数据。
8.如权利要求1所述的方法,其特征在于,所述方法还包括:
记录提交所述反馈数据的用户ID;
检测所述用户ID对所述产品提交的反馈数据的次数或对所述产品的其中一个版本提交的反馈数据的次数;
当对所述产品提交的反馈数据的次数或对所述产品的其中一个版本提交的反馈数据的次数超过预设的第一阈值时,不记录所述用户ID提交的反馈数据。
9.如权利要求1所述的方法,其特征在于,所述方法还包括:
记录提交所述反馈数据的用户ID;
检测所述用户ID在预设时间段内提交反馈数据的次数;
当所述用户ID在预设时间段内提交反馈数据的次数超过预设的第二阈值时,不记录所述用户ID提交的反馈数据。
10.如权利要求1所述的方法,其特征在于,所述方法还包括:
对所述反馈数据进行审核,判断所述反馈数据中是否包含不合法信息;
当所述反馈数据中包含不合法信息时,删除所述反馈数据。
11.一种数据处理装置,其特征在于,所述装置包括:
记录模块,用于记录对产品每个版本的反馈数据对应的数值及反馈数据的反馈次数;
获取模块,用于获取产品每个版本对应的权重值;
最终反馈数据计算模块,用于根据所述反馈数据对应的数值、反馈数据的反馈次数及每个版本的权重值计算产品的最终反馈数据。
12.如权利要求11所述的装置,其特征在于,所述最终反馈数据计算模块,用于根据以下公式计算计算产品的最终反馈数据,
其中,S为所述产品的最终反馈数据;Cij为对所述产品第j个版本的第i个反馈数据对应的数值;Nij为对所述产品第j个版本的第i个反馈数据的反馈次数;Wj为所述产品第j个版本的权重值;i=1,2,3......n,j=1,2,3......m,n为反馈数据的个数,m为版本的个数。
13.如权利要求11或12所述的装置,其特征在于,所述获取模块包括:权重计算子模块,用于通过以下公式计算每个版本对应的权重值:
其中,Wj为所述产品第j个版本的权重值,j=1,2,3...m;m为所述产品版本个数;tj为第j个版本与第j+1个版本之间的版本差异值,其中t0=0。
15.如权利要求11所述的装置,其特征在于,所述产品每个版本对应的权重值呈等差数列或等比数列,或所述产品每个版本对应的权重值根据预先设置的表格查询获得。
16.如权利要求11所述的装置,其特征在于,所述获取模块还包括:
检测子模块,用于检测所述反馈数据对应的产品版本是否已记录;
权重获取子模块,用于当所述反馈数据对应的产品版本已记录时,获取已记录的所述产品版本对应的权重值;
所述权重计算子模块,当所述反馈数据对应的产品版本未记录时,重新计算已记录的产品版本和未记录的产品版本对应的权重值。
17.如权利要求11所述的装置,其特征在于,所述装置还包括:第一检测模块,
所述记录模块,用于记录提交所述反馈数据的用户ID;
所述第一检测模块,用于根据所述用户ID检测所述用户是否对同一产品的同一版本已提交过反馈数据;
所述记录模块,用于当已提交过的反馈数据,将所述用户对同一产品的同一版本的在先提交的反馈数据删除,保留在后提交的反馈数据。
18.如权利要求11所述的装置,其特征在于,所述装置还包括:第二检测模块,
所述记录模块,用于记录提交所述反馈数据的用户ID;
所述第二检测模块,用于检测所述用户ID对所述产品提交的反馈数据的次数或对所述产品的其中一个版本提交的反馈数据的次数;所述记录模块,用于当对所述产品提交的反馈数据的次数或对所述产品的其中一个版本提交的反馈数据的次数超过预设的第一阈值时,不记录所述用户ID提交的反馈数据。
19.如权利要求11所述的装置,其特征在于,所述装置还包括:第三检测模块,
所述记录模块,用于记录提交所述反馈数据的用户ID;
所述第三检测模块,用于检测所述用户ID在预设时间段内提交反馈数据的次数;
所述记录模块,用于当所述用户ID在预设时间段内提交反馈数据的次数超过预设的第二阈值时,不记录所述用户ID提交的反馈数据。
20.如权利要求11所述的装置,其特征在于,所述装置还包括:
审核模块,用于对所述反馈数据进行审核,判断所述反馈数据中是否包含不合法信息;
所述记录模块,用于当所述反馈数据中包含不合法信息时,删除所述反馈数据。
21.一种服务器设备,其特征在于,所述服务器设备包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
记录对产品每个版本的反馈数据对应的数值及反馈数据的反馈次数;
获取产品每个版本对应的权重值;
根据所述反馈数据对应的数值、反馈数据的反馈次数及每个版本的权重值计算产品的最终反馈数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310395713.8A CN103455938B (zh) | 2013-09-03 | 2013-09-03 | 一种数据处理方法、装置及服务器设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310395713.8A CN103455938B (zh) | 2013-09-03 | 2013-09-03 | 一种数据处理方法、装置及服务器设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103455938A true CN103455938A (zh) | 2013-12-18 |
CN103455938B CN103455938B (zh) | 2016-07-20 |
Family
ID=49738272
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310395713.8A Active CN103455938B (zh) | 2013-09-03 | 2013-09-03 | 一种数据处理方法、装置及服务器设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103455938B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104993946A (zh) * | 2015-06-01 | 2015-10-21 | 华为技术有限公司 | 灰度发布的评估方法、装置和*** |
CN107391151A (zh) * | 2017-07-28 | 2017-11-24 | 努比亚技术有限公司 | 应用评价方法、设备及计算机可读存储介质 |
CN107766550A (zh) * | 2017-10-31 | 2018-03-06 | 广东欧珀移动通信有限公司 | 评论信息处理方法、装置、终端设备及存储介质 |
CN109101563A (zh) * | 2018-07-13 | 2018-12-28 | 东软集团股份有限公司 | 一种对象推荐方法、装置、介质以及设备 |
CN111857807A (zh) * | 2020-07-29 | 2020-10-30 | 海尔优家智能科技(北京)有限公司 | 版本适配结果的确定方法及装置、存储介质、电子装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101251850A (zh) * | 2008-01-04 | 2008-08-27 | 杨虡 | 基于用户威望的互联网主题排名***和方法 |
CN103020846A (zh) * | 2012-12-14 | 2013-04-03 | 百度在线网络技术(北京)有限公司 | 一种移动应用的推送方法及*** |
CN103119583A (zh) * | 2010-09-28 | 2013-05-22 | 高通股份有限公司 | 用于表示对可用项目的感兴趣程度的装置和方法 |
CN103177109A (zh) * | 2013-03-27 | 2013-06-26 | 四川长虹电器股份有限公司 | 应用排名优化方法 |
-
2013
- 2013-09-03 CN CN201310395713.8A patent/CN103455938B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101251850A (zh) * | 2008-01-04 | 2008-08-27 | 杨虡 | 基于用户威望的互联网主题排名***和方法 |
CN103119583A (zh) * | 2010-09-28 | 2013-05-22 | 高通股份有限公司 | 用于表示对可用项目的感兴趣程度的装置和方法 |
CN103020846A (zh) * | 2012-12-14 | 2013-04-03 | 百度在线网络技术(北京)有限公司 | 一种移动应用的推送方法及*** |
CN103177109A (zh) * | 2013-03-27 | 2013-06-26 | 四川长虹电器股份有限公司 | 应用排名优化方法 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104993946A (zh) * | 2015-06-01 | 2015-10-21 | 华为技术有限公司 | 灰度发布的评估方法、装置和*** |
WO2016192488A1 (zh) * | 2015-06-01 | 2016-12-08 | 华为技术有限公司 | 灰度发布的评估方法、装置和*** |
CN104993946B (zh) * | 2015-06-01 | 2019-04-05 | 华为技术有限公司 | 灰度发布的评估方法、装置和*** |
CN107391151A (zh) * | 2017-07-28 | 2017-11-24 | 努比亚技术有限公司 | 应用评价方法、设备及计算机可读存储介质 |
CN107766550A (zh) * | 2017-10-31 | 2018-03-06 | 广东欧珀移动通信有限公司 | 评论信息处理方法、装置、终端设备及存储介质 |
CN109101563A (zh) * | 2018-07-13 | 2018-12-28 | 东软集团股份有限公司 | 一种对象推荐方法、装置、介质以及设备 |
CN111857807A (zh) * | 2020-07-29 | 2020-10-30 | 海尔优家智能科技(北京)有限公司 | 版本适配结果的确定方法及装置、存储介质、电子装置 |
Also Published As
Publication number | Publication date |
---|---|
CN103455938B (zh) | 2016-07-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6211605B2 (ja) | クリックスルー率に基づく検索結果の順位付け | |
US20170083965A1 (en) | Item Recommendation Method and Apparatus | |
US11238233B2 (en) | Artificial intelligence engine for generating semantic directions for websites for automated entity targeting to mapped identities | |
CN107704503A (zh) | 用户关键词提取装置、方法及计算机可读存储介质 | |
CN106251174A (zh) | 信息推荐方法及装置 | |
CN105556512A (zh) | 用于分析关注实体特性的设备、***以及方法 | |
CN105893406A (zh) | 群体用户画像方法及*** | |
CN103838756A (zh) | 一种确定推送信息的方法及装置 | |
CN103455938A (zh) | 一种数据处理方法、装置及服务器设备 | |
CN105786838A (zh) | 一种信息匹配处理方法和装置 | |
CN110880136A (zh) | 配套产品的推荐方法、***、设备和存储介质 | |
CN105589917A (zh) | 浏览器日志信息的分析方法和装置 | |
CN114398560B (zh) | 基于web平台的营销界面设置方法、装置、设备及介质 | |
CN112507230A (zh) | 基于浏览器的网页推荐方法、装置、电子设备及存储介质 | |
CN115204971B (zh) | 产品推荐方法、装置、电子设备及计算机可读存储介质 | |
CN114612194A (zh) | 产品推荐方法、装置、电子设备及存储介质 | |
CN102999576A (zh) | 用于确定目标页面所对应的页面描述信息的方法和设备 | |
JP5982968B2 (ja) | 電子書籍表示装置、蔵書情報表示プログラム及び蔵書情報表示方法 | |
CN110083809A (zh) | 合同条款相似度计算方法、装置、设备及可读存储介质 | |
CN103530392B (zh) | 确定抓取流量的方法及设备 | |
CN114625973B (zh) | 一种匿名信息跨域推荐方法、装置、电子设备及存储介质 | |
CN103218726A (zh) | 一种信息项推荐方法及*** | |
CN115238179A (zh) | 项目推送方法、装置、电子设备及计算机可读存储介质 | |
CN102214173A (zh) | 用于选择用于网络发布的关键词的方法和设备 | |
CN113344674A (zh) | 基于用户购买力的产品推荐方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |