CN108694212B - 一种样本对象的处理方法及装置 - Google Patents

一种样本对象的处理方法及装置 Download PDF

Info

Publication number
CN108694212B
CN108694212B CN201710234565.XA CN201710234565A CN108694212B CN 108694212 B CN108694212 B CN 108694212B CN 201710234565 A CN201710234565 A CN 201710234565A CN 108694212 B CN108694212 B CN 108694212B
Authority
CN
China
Prior art keywords
sample
target
sample object
objects
index data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710234565.XA
Other languages
English (en)
Other versions
CN108694212A (zh
Inventor
隋馨缘
王冬冬
黄利贤
张望
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201710234565.XA priority Critical patent/CN108694212B/zh
Publication of CN108694212A publication Critical patent/CN108694212A/zh
Application granted granted Critical
Publication of CN108694212B publication Critical patent/CN108694212B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例公开了一种样本对象的处理方法及装置。本发明实施例方法包括:获取样本对象集合中每个样本对象的指标数据;根据指标数据删除样本对象集合中的无效样本对象,得到第一样本对象集合,无效样本对象为指标数据超过预设范围的样本对象;从第一样本对象集合中选择目标数量的目标样本对象集合,目标数量大于第一阈值,目标样本对象集合中的各目标样本对象所对应的指标数据达到预设标准;按照预设标准对目标样本对象集合中的样本对象进行周期性的行为数据分析。本发明实施例还提供了一种样本对象的处理装置,不同周期的样本对象的代表性一致,降低由于样本对象的代表性差异而导致对行为分析产生偏差,利于提高对对象行为分析的准确性。

Description

一种样本对象的处理方法及装置
技术领域
本发明涉及计算机领域,尤其涉及样本对象的处理方法及装置。
背景技术
数据分析是指用适当的统计方法对收集来的大量数据进行分析,以求最大化地开发数据的功能,发挥数据的作用。提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。进而通过对对象数据的分析来反映对象的行为也成为当前各企业营销策略制定的关键。
当前,可以通过获取一定数量的样本对象的对象数据,对整体移动互联网和各类手机应用的发展变化趋势的分析。通常可以以统计学的抽样方式选取特定数量的样本对象,用以反映整体互联网网民的状况。
采用抽样的方式选取特定数量的网民作为样本对象的过程中,会针对样本对象的人口属性做配比,从而使样本对象的人口属性的配比符合对象总体(如网民总体)的情况,例如样本对象集合中的男性样本数量与女性样本数量的比例为1:1,最后确定将人口属性的配比符合对象总体情况的样本对象集合作为最后分析对象行为的样本对象。
传统方式中,并没有结合数据分析具体需要达到的目的而筛选样本对象。例如,在反映某类用户的态度类数据(用户对某类事物的看法、观点)时传统方法可能还可以符合预期,但在需要反映对象的行为数据时(如网页的回访次数,跳出率等),则会在样本对象行为层面代表性不足,进而导致在通过观测样本对象来分析整体对象的行为时,不同周期间样本对象自身的代表性不一致,样本对象行为数据分析产生偏差。例如,在2015年01月和2015年02月这两个观测周期内,02月的样本对象相比01月可能整体更少使用手机,则通过样本对象对对象行为(回访次数,跳出率等)进行分析时与全体网民的实际情况产生偏差。
发明内容
本发明实施例提供了一种样本对象的处理方法及装置,用于使得不同周期的样本对象的代表性一致,降低由于样本对象的代表性差异而导致对行为分析产生偏差,利于提高对对象行为分析的准确性。
第一方面,本发明实施例中提供了一种样本对象的处理方法,包括:
获取样本对象集合中每个样本对象的指标数据;
根据所述指标数据删除所述样本对象集合中的无效样本对象,得到第一样本对象集合,所述无效样本对象为指标数据超过预设范围的样本对象;
从所述第一样本对象集合中选择目标数量的目标样本对象集合,所述目标数量大于第一阈值,所述目标样本对象集合中的各目标样本对象所对应的指标数据达到预设标准;
按照所述预设标准对所述目标样本对象集合中的样本对象进行周期性的行为数据分析。
第二方面,本发明实施例中提供了一种样本对象的处理装置,包括:
获取模块,获取样本对象集合中每个样本对象的指标数据;
删除模块,用于根据所述获取模块获取的所述指标数据删除所述样本对象集合中的无效样本对象,得到第一样本对象集合,所述无效样本对象为指标数据超过预设范围的样本对象;
选择模块,用于从所述删除模块删除无效样本对象后得到的所述第一样本对象集合中选择目标数量的目标样本对象集合,所述目标数量大于第一阈值,所述目标样本对象集合中的各目标样本对象所对应的指标数据达到预设标准;
数据分析模块,用于按照所述选择模块确定的所述预设标准对所述目标样本对象集合中的样本对象进行周期性的行为数据分析。
从以上技术方案可以看出,本发明实施例具有以下优点:
在抽样的过程中,抽取样本对象集合,然后进一步获取样本对象集合的指标数据,该指标数据可以用于衡量样本对象的代表性,然后,根据指标数据删除样本对象集合中的无效样本对象,得到第一样本对象集合,无效样本对象为指标数据超过预设范围的样本对象,最后,从第一样本对象集合中选择出一定数量的目标样本对象集合,目标样本对象集合中的各目标样本对象所对应的指标数据需要达到预设标准。本实施例中,使目标样本对象集合中的各目标对象样本对应的指标数据达到一个预设标准,然后按照所述预设标准对所述目标样本对象集合中的样本对象进行周期性的行为数据分析,这样在后续的对样本对象的行为数据进行分析时,不同周期的样本对象的代表性一致,不会由于样本对象的代表性差异而导致对对象数据分析产生偏差,利于提高后续对对象行为分析的准确性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,还可以根据这些附图获得其他的附图。
图1为本发明实施例中一种样本对象的处理方法的一个实施例的场景示意图;
图2为本发明实施例中的一种样本对象的处理方法的一个实施例的步骤示意图;
图3为本发明实施例中的样本对象投射放大示意图;
图4为本发明实施例中一种样本对象的处理方法的另一个实施例的场景示意图;
图5为本发明实施例中一种样本对象的处理方法的另一个实施例的步骤流程图;
图6为本发明实施例中的目标样本对象集合中子集合的示意图;
图7为本发明实施例中的一种样本对象的处理方法的试验数据趋势折线图;
图8为本发明实施例中的一种样本对象的处理装置的一个实施例的结构示意图;
图9为本发明实施例中的一种样本对象的处理装置的另一个实施例的结构示意图;
图10为本发明实施例中的一种样本对象的处理装置的另一个实施例的结构示意图;
图11为本发明实施例中的一种样本对象的处理装置的另一个实施例的结构示意图;
图12为本发明实施例中的一种样本对象的处理装置的另一个实施例的结构示意图;
图13为本发明实施例中的一种样本对象的处理装置的另一个实施例的结构示意。
具体实施方式
本发明实施例提供了一种样本对象的处理方法及装置,用于降低由于样本对象的代表性差异而导致对行为分析产生偏差,利于提高对对象行为分析的准确性。
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员所获得的所有其他实施例,都应当属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
在对对象总体进行对象行为分析之前,需要对对象总体进行抽样,得到样本对象集合,通过研究样本对象集合中的样本对象来对对象总体进行分析,当前对整体移动互联网和手机各类应用的发展变化趋势的分析过程中通过周期性的对样本对象进行分析。
本发明实施例中提供的一种样本对象的处理方法,请结合图1所示的处理方法的场景示意图进行理解,采用抽样的方式选取特定数量的网民作为样本对象的过程中,会针对样本对象的人口属性做配比,从而使样本对象的人口属性的配比符合对象总体(如网民总体)的情况的基础上,获取样本对象集合110中每个样本对象1101的指标数据,指标数据与样本对象的行为数据具有关联性,可以理解的是,本实施例中依据需要行为数据确定指标数据,以分析目的为导向,在本实施例中,以分析各类应用的发展变化趋势为目的,则该指标数据可以为活跃性指标,然后,根据指标数据删除样本对象集合中的无效样本对象1102,得到第一样本对象集合120,该无效样本对象为指标数据超过预设范围的样本对象;然后,从第一样本对象集合中选择目标数量的目标样本对象集合130,目标数量大于第一阈值,目标样本对象集合130中的各目标样本对象1103所对应的指标数据达到预设标准;最后,按照预设标准对目标样本对象集合中的样本对象进行周期性的行为数据分析。本实施例中,每个行为分析的周期通过将该指标数据达到预设标准作为筛选目标对象的标准,这样在后续的对样本对象的行为数据进行分析时,不同周期的样本对象的代表性一致,不会由于样本对象的代表性差异而导致对对象数据分析产生偏差,利于提高后续对对象行为分析的准确性。
为了方便理解,首先对本发明实施例中涉及的词语进行解释说明。
样本对象集合:可以理解为样本库,再进行行为数据分析之前,需要选取或者招募用户,这些被选取的或者通过一些渠道招募的用户为样本对象,一定数量的样本对象组成了样本对象集合,然后可以进一步的获取样本对象集合中样本对象的行为数据,对该行为数据进行分析,得到需要的分析结果。
行为数据:通过样本对象某些行为得到的数据,例如,该行为数据可以包括样本对象的来源地区、来路域名和页面;在网站的停留时间、跳出率、回访者、新访问者、回访次数、回访相隔天数;注册用户和非注册用户;所使用的搜索引擎、关键词、关联关键词和站内关键字;入口形式(广告或者网站入口链接);访问网站流程;点击页面上的网页热点图分布的次数和网页覆盖图的次数;在不同时段的访问量等。
行为数据分析:通过获取样本对象的行为数据,周期性的观测样本对象行为,例如,这里的周期可以为一个月或一个星期等,对样本对象的行为数据进行统计、分析,从中发现用户访问网站的规律。例如,通过对样本对象选择什么样的入口形式(广告或者网站入口链接),分析哪种入口形式更有效;通过样本对象访问网站的流程,分析页面结构设计是否合理等等。在实际的应用中对于周期的具体时长并不限定。
抽样:在统计学中,从目标总体中抽取一部分作为样本对象,后续对样本对象进行行为分析时,可以通过分析样本对象的某一或某些属性,依据对样本对象的行为数据,得到对对象总体(如全体网民)的行为进行一定可靠性的评估判断,从而达到对总体的认识。一般在数据分析的过程中,因无法覆盖中国网民全体,因此均需要通过一些渠道来触达部分网民,也即使用了抽样的方式。具体的,抽样可以按照地域进行抽样,在不同的城市抽取一定数量的样本对象,如,在城市A选择100个网民作为样本对象,在城市B选择100个网民作为样本对象;或者,抽样也可以按照年龄进行抽样,在不同的年龄段一定数量的样本对象,例如,在10至15岁的这个年龄段选择100位网民作为100个样本对象,在16至20岁的这个年龄段选择100位网民作为100个样本对象等等。
失效样本对象:一些不合格、信息不真实的样本对象,以保证删除失效样本对象后剩余的样本对象集合在构成上更具有代表性。例如,如果样本对象C主动上报的信息为“男性,14岁,已婚”,则根据相关法律法规可判断出样本对象给出的信息作假,因此,将该样本对象C为失效样本对象,需要说明的是,本实施例中的样本对象集合可以为已经删除失效样本对象之后的样本对象集合。
指标数据:用于对获取样本对象进行细分数据,以使得样本对象对于后续行为分析更具有代表性;指标数据包括指标及该指标对应的指标值,该指标可以包括活跃指标和属性指标等。
活跃指标:用于指示样本的活跃水平,可以用于表示在某一个周期(如一个月内)内使用终端(如手机)上网的总时长和/或频率。本发明实施例中该活跃指标可以通过样本对象使用各应用(app)的行为数据做衡量。该活跃指标可以包括所有应用被使用的总时长、总次数、总天数(去除重复天数)、使用应用的总个数、日均使用时长、日均使用次数、日均使用应用个数中的至少一个。使用“应用”的行为作为活跃指标,用于表示在该周期内样本对象使用互联网的活跃情况。
例如,样本对象E的终端中装载了4个应用(app),若该四个应用分别为微信,淘宝、浏览器和QQ,则所有应用在一个周期之内的活跃指标及对应的参数值如下表1所示,本实施例中的一个周期可以以一个月为例进行说明,该周期的具体数值在实际应用中可以根据实际情况进行设定,本发明实施例中对于周期的举例并不造成对本发明的限定性说明:
表1
应用 使用时长 使用次数
微信 60 280
淘宝 28 30
QQ 25 60
浏览器 30 120
总计 143 490
从上表1中可以看出,表1中以一个周期内使用应用的总时长,总次数举例说明,总时长为将每个应用的使用时长进行加总,得到总时长;总次数为对每个应用的使用次数进行加总,得到总次数。
在另一种方式中,该总时长也可以为记录每个应用使用的起始时刻和终止时刻,将每个应用的使用时长进行加总,得到总时长之后,去掉重复的时长,如果按照集合的概念进行理解,总时长是各应用使用的时长的并集。
使用应用的总天数为将每个应用使用的天数进行加总,然后去除重复的天数,得到总天数,如果按照集合的概念进行理解,总天数是确定各应用使用的日期的并集。请结合下表2进行理解。
表2
日期 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
微信
淘宝
QQ
浏览器  
需要说明的是,上表2中,以15天作为一个周期进行示例性说明,表2中的一个周期是以天为最小单位进行的示例性说明,确定该四个应用使用日期的并集:在1日至15日中这15天中使用这四个应用的总天数为13天。需要说明的是,上表2只是为了方便说明而举的例子,在实际应用中,某一个应用可能不会一整天都在被使用,在这种情况下,可以记录每个应用使用的起始时刻和终止时刻,然后根据各应用使用的起始时刻和终止时刻来确定各应用使用时长的并集,从而确定出这四个应用使用的总天数,原理与上表2中所示例的以天作为单位的原理相同,本发明实施例中,该起始时刻和终止时刻的最小单位可以根据实际情况中需要确定的精确度而确定,此处并不限定,例如,起始时刻和终止时刻可以以小时为单位(如2日10点),也可以以分为单位(如2日10点20分)。
以上述表1和表2为例进行说明,使用应用的总个数为4个。
日均使用时长为一个周期的总时长与一个周期的总天数的商,以表1中的“微信”为例,总时长为60小时,一个周期的总天数为30天,则日均使用时长为2小时。
日均使用次数为一个周期的总时长与一个周期的总天数的商,以表1中的“微信”为例,总次数为490次,一个周期的总天数为30天,则日均使用次数为16次。
需要说明的是,该活跃指标也可以为该应用被使用的总时长、总次数、总天数(去除重复天数)、使用应用的总个数、日均使用时长、日均使用次数、日均使用应用个数中的至少两个,按照权重计算之后的活跃指标,例如,取两个个参数分别为总时长和总次数,总时长的权重系数为a,总次数的权重系数为b,则活跃指数=a*总时长+b*总次数。
属性指标:包括样本对象的所属地域、收益等。若每个周期选择的样本对象的收益差距很大,则可以选择的样本对象的收益指标作为数据指标,例如,若需要通过对样本对象的行为数据分析某一个付费应用的使用情况,则在选择对象样本的时候可以将收益这个属性指标作为辅助的指标,从而使每个周期内的对象样本代表性一致。
无效样本对象:指标数据超过预设范围的样本对象。例如,该指标数据以终端被使用的总时长,该预设范围为大于10秒钟。举一个例子,若获取到的样本对象D的指标数据为在1个月内仅使用手机9秒,则这样的样本对象可能无法代表真实的网民情况,则该样本对象D为无效样本对象,则在样本对象的处理过程中,将该样本对象D从样本对象集合中删除。
分位数:常见有四分位数、百分位数、中位数等,即将所有数值从小到大排列并分成若干等分,处于分割点位置的数值就是分位数。例如四分位数即把所有数值从小到大排列后分为四等分,处于三个分割点位置的数值即分别为1/4分位数,中位数(2/4位数),3/4分位数。分位数可以用来分析数据变量的变化趋势。
上面对本发明实施例中所涉及的词语进行了解释说明,下面对本发明实施例中提供的一种样本对象的处理方法的一个实施例进行说明,该一种样本对象的处理方法可以应用于一种样本对象的处理装置,该处理装置可以以服务器的形态存在。请结合图1和图2进行理解,图2为本发明实施例中提供的一种样本对象的处理方法的步骤示意图。
步骤201、获取样本对象集合中每个样本对象的指标数据。
获取每个样本对象的指标数据的途径可以为:终端记录该指数数据,终端主动向服务器上报样本对象的指数数据;或者也可以服务器向终端发送请求,终端接收到请求后向该服务器反馈该样本对象的指数数据。
该样本对象集合可以为已经删除失效样本对象的集合,该指标数据可以为活跃指数数据和属性指数数据的经过权重计算之后的指标数据,本实施例中行为数据可以为某网站的页面浏览量为例进行说明,该指标数据可以以活跃指标数据为例进行说明。
步骤202、根据指标数据删除样本对象集合中的无效样本对象,得到第一样本对象集合,无效样本对象为指标数据超过预设范围的样本对象。
本实施例中,为了方便说明,该活跃指数以终端被使用的总时长为例进行说明。
在一种实现方式中,该预设范围可以为大于第一预置值,且小于第二预置值,可以理解的是,在实际应用中,可能会出现有的样本对象在一个月之内都很少使用手机,而有的样本对象在一个月之内所有应用被使用的总时长(以下简称总时长)又非常长,这样的样本对象都不具备代表性,代表性是指选择的样本对象的活跃指数数据可以代表大多数对象的活跃水平。
例如,该第一预置值可以为0.1小时,第二预置值为500小时,那就是说无效样本对象,总时长小于0.1小时,或者总时长大于500小时的样本对象。
在另一种实现方式中,该预设范围可以为大于第一预置值,则无效样本对象就为总时长小于或者等于第一预置值的样本。例如,总时长小于0.1小时的样本对象。或者,该预置范围也可以为小于第二预置值,则无效样本对象为活跃指数对应的指数值大于500小时的样本对象。
在另一种可能的实现方式中,该指标数据可以包括活跃指标及指标值的标准差,该预设范围小于预置数量的标准差。可以理解的是,标准差的值大说明该组数据较分散,若标准差小,则说明该组数据较集中。若在第一样本对象集合中有样本对象F对应的指标值落在平均值加减三个标准差之外,则表明对象F在一个月之内使用手机的总时长非常短或者总时长非常长,样本对象F并不具备代表性,样本对象F为无效样本对象。
需要说明的是,在实际应用中,可以根据需要分析的行为数据的历史数据来具体设定该预设范围,本实施例中只是对该预设范围进行举例说明,并不造成对本发明的限定性说明。
步骤203、从第一样本对象集合中选择目标数量的目标样本对象集合,目标数量大于第一阈值,目标样本对象集合中的各目标样本对象所对应的指标数据达到预设标准。
该第一阈值为样本集合中需要包括的样本对象数量的下限值,可以理解的是,可以根据需要分析的对象总体的数量而进行设置。例如,需要分析的对象总体的数量为100万,该第一阈值可以为1万,若需要分析的对象总体的数量为10万,该第一阈值可以为0.1万。需要说明的是,上述对于第一阈值为举例说明,并不造成对本发明的限定性说明。
需要说明的是,当第一样本对象集合中的样本对象所对应的指标数据已经达到预设标准,则第一样本对象集合与目标样本对象集合相同。
该预设标准可以为:该目标样本对象集合中的各目标样本对象所对应的指标数据平均值为第二阈值。
该预设标准可以根据历史指标数据平均值和/或第三方数据(如中国互联网络信息中心(China Internet Network Information Center,缩写:CNNIC)对中国网民的普查报告等)中对网民行为活跃水平的评估等确定。
例如,该第二阈值可以为100小时,可以理解的是,该目标样本集合中的每个样本对象的活跃指数对应一个指标值,该目标样本集合中的所有样本对象对应的指标值的平均值为100小时。
步骤204、将目标样本集合中的每个样本对象所代表的对象数量从1放大至目标数量。
将目标样本集合中的每个样本对象代表的对象数量投射放大,每个样本对象所代表的对象数量从1放大至目标数量,从而使得该目标样本集合中的样本数量可以代表对象总体。请结合图3进行理解,图3为样本对象投射放大示意图。
例如,当前需要对100万的网民的行为数据进行分析,那么也就是说对象总体的数量为100万,而目标样本集合中的样本数量为1万,可以理解的是,每一个样本对象需要代表100个对象,才能使得该1万的样本对象代表100万的对象总体,那么,该目标数量为100。
需要说明的是,步骤204为可选步骤,可以不执行,而直接执行步骤205。步骤204中对于对象总体和目标对象集合中的样本对象的数量均为举例说明,并不造成对本发明的限定性说明。
步骤205、按照预设标准对目标样本对象集合中的样本对象进行周期性的行为数据分析。
获取每个样本对象的行为数据,然后对每个样本对象的行为数据进行分析,对样本对象的行为数据分析是周期性进行的。每一个周期的活跃性指数都达到预设标准,以使得每一个周期中所选的样本对象的代表性具有一致性,从而使对样本对象的行为数据分析准确。
本发明实施例中提供的一种样本对象的处理方法的另一个实施例。请结合图4和图5进行理解,图4为一种样本对象的处理方法的场景示意图,图5为一种样本对象的处理方法的另一个实施例的步骤流程图。
步骤501、获取样本对象集合中每个样本对象的指标数据;
获取每个样本对象的指标数据的途径可以为:终端记录该指数数据,终端主动向服务器上报样本对象的指数数据;或者也可以服务器向终端发送请求,终端接收到请求后向该服务器反馈该样本对象的指数数据。
该样本对象集合可以为已经删除失效样本对象的集合,该指标数据可以为活跃指数数据和属性指数数据的经过权重计算之后的指标数据,本实施例中行为数据可以为某网站的页面浏览量为例进行说明,该指标数据可以以活跃指标数据为例进行说明。
步骤502、根据指标数据删除样本对象集合中的无效样本对象,得到第一样本对象集合,无效样本对象为指标数据超过预设范围的样本对象。
本实施例中,为了方便说明,该活跃指数以终端被使用的总时长为例进行说明。
在一种实现方式中,该预设范围可以为大于第一预置值,且小于第二预置值,可以理解的是,在实际应用中,可能会出现有的样本对象在一个月之内都很少使用手机,而有的样本对象在一个月之内所有应用被使用的总时长(以下简称总时长)又非常长,这样的样本对象都不具备代表性,代表性是指选择的样本对象的活跃指数数据可以代表大多数对象的活跃水平。
例如,该第一预置值可以为0.1小时,第二预置值为500小时,那就是说无效样本对象,总时长小于0.1小时,或者总时长大于500小时的样本对象。
在另一种实现方式中,该预设范围可以为大于第一预置值,则无效样本对象就为总时长小于或者等于第一预置值的样本。例如,总时长小于0.1小时的样本对象。或者,该预置范围也可以为小于第二预置值,则无效样本对象为活跃指数对应的指数值大于500小时的样本对象。
在另一种可能的实现方式中,该指标数据可以包括活跃指标及指标值的标准差,该预设范围小于预置数量的标准差。可以理解的是,标准差的值大说明该组数据较分散,若标准差小,则说明该组数据较集中。若在第一样本对象集合中有样本对象F对应的指标值落在平均值加减三个标准差之外,则表明对象F在一个月之内使用手机的总时长非常短或者总时长非常长,样本对象F并不具备代表性,样本对象F为无效样本对象。
需要说明的是,在实际应用中,可以根据需要分析的行为数据的实际情况来具体设定该预设范围,本实施例中只是对该预设范围进行举例说明,并不造成对本发明的限定性说明。
步骤503、从第一样本对象集合中选择目标数量的目标样本对象集合,目标数量大于第一阈值,目标样本对象集合中的各目标样本对象所对应的指标数据达到预设标准。
该第一阈值为样本集合中需要包括的样本对象数量的下限值,可以理解的是,可以根据需要分析的对象总体的数量而进行设置。例如,需要分析的对象总体的数量为100万,该第一阈值可以为1万,若需要分析的对象总体的数量为10万,该第一阈值可以为0.1万。需要说明的是,上述对于第一阈值为举例说明,并不造成对本发明的限定性说明。
该预设标准可以为:该目标样本对象集合中的各目标样本对象所对应的指标数据平均值为第二阈值。
例如,该第二阈值可以为100小时,可以理解的是,该目标样本集合中的每个样本对象的活跃指数对应一个指标值,该目标样本集合中的所有样本对象对应的指标值的平均值为100小时。
步骤504、确定目标样本对象集合中的多个子集合,每个子集合中的样本对象的指标数据对应一个范围值。
进一步的,为了使得目标样本对象更具有代表性,也就是样本对象和实际对象总体的情况更近似,则对目标样本对象集合内部的各部分组成的比例与对象总体的情况一致。
确定该目标样本对象集合中的多个子集合的方式可以为:
请结合图6进行理解,图6为目标样本对象集合中子集合的示意图。确定目标样本对象集合中多个样本对象的活跃指标数据的分位数,本实施例中以三分位数为例进行说明,按照分位数将目标样本对象集合分为多个子集合。当分位数包括第一分位数和第二分位数时,确定三个子集合,该三个子集合分别为第一子集合、确定第二子集合和确定第三子集合,该第一子集合包括指标数据小于第一分位数的样本对象;该第二子集合包括指标数据大于或者等于第一分位数,且指标数据小于第二分位数的样本对象;该第三子集合包括指标数据大于或者等于第二分位数的样本对象。
可以理解的是,一个子集合可以代表一个活跃水平,例如第一子集合可以代表活跃水平A的样本对象的集合,第二子集合可以代表活跃水平B的样本对象的集合,第三子集合可以代表活跃水平C的样本对象的集合。
再如,第一分位数为10小时,第二分位数为20小时。则该第一子集合包括总时长小于10小时所对应的样本对象;该第二子集合包括总时长大于或者等于10小时,且小于20小时所对应的样本对象;该第三子集合包括总时长大于或者等于20小时所对应的样本对象。
步骤505、确定每个子集合之间的样本对象数量的差异参数。
在一种实现方式中,该差异参数可以用比例来表示,确定每个子集合中样本对象数量,然后根据样本对象数量确定子集合之间的样本对象数量的目标比例。
例如目标样本集合中样本对象的数量为10万,第一子集合中样本对象的数量为4万,第二子集合中样本对象的数量为3万,第三子集合中样本对象的数量为3万,则可以确定第一子集合中样本对象的数量,第二子集合中样本对象的数量与第三子集合中样本对象的数量为4:3:3。也可以理解为活跃水平为A的样本对象的数量,活跃水平为B的样本对象的数量与活跃水平为B的样本对象的数量的比例为4:3:3。
在另一种实现方式中,可以根据每个子集合中样本对象的数量与目标对象集合中样本对象的总量确定每个子集合占目标样本集合中样本对象总量的第二比例,然后,再根据目标比例确定子集合之间的样本对象数量的目标比例。
例如,第一子集合中样本对象的数量占目标样本集合中样本对象总量的40%,第二子集合中样本对象的数量占目标样本集合中样本对象总量的30%,第三子集合中样本对象的数量占目标样本集合中样本对象总量的30%。可以理解的是,第一子集合中样本对象的数量、第二子集合中样本对象的数量与第三子集合中样本对象的数量之间的比例为4:3:3。
步骤506、调整差异参数,以使差异参数满足预设目标值。
预设目标值可以根据历史数据和/或第三方数据(如中国互联网络信息中心(China Internet Network Information Center,缩写:CNNIC)确定,例如,在第三方数据中,活跃水平为A的对象的数量占对象总体数量的30%,活跃水平为B的对象的数量占对象总体数量的40%,活跃水平为B的对象的数量占对象总体数量的30%,也就是说,预设目标值为3:4:3。而实际目标样本集合中的活跃水平为A的对象的数量,活跃水平为B的对象的数量与活跃水平为C的对象的数量的比例为4:3:3,为了使样本对象能够更符合实际对象的情况,将目标样本集合中各子集合中的样本对象数量之间的比例进行调整。
将目标样本集合中各子集合中的样本对象数量之间的比例可以通过权重系数进行调整的方式:
假设分位数为P1,P2,与该分位数对应的预设目标值为:p1:p2:p3,而与该分位数对象的目标对象集合中各子集合的样本对象数量之间的目标比例为:q1:q2:q3;为了使得不同活跃水平的用户占比预设目标值,则将第一子集合(活跃水平A)的对象数量乘以权重p1/q1,将第二子集合(活跃水平B)的对象数量乘以权重p2/q2,将第三子集合(活跃水平C)的对象数量乘以权重p3/q3,从而使得目标对象集合中的三个子集合之间的比例为预设目标值p1:p2:p3。
为了方便理解,举一个例子,预设目标值为3:4:3,预期的比例关系是,活跃水平为A的对象占比30%,活跃水平B的独享占比40%,活跃水平C的对象占比30%;则把活跃水平为A的样本对象数量在乘以权重系数(3/4),而把活跃水平B的样本对象数量乘以权重系数(4/3),进而使得三个活跃水平的样本对象数量之间的比例满足3:4:3的占比,而非4:3:3。
本实施例中进一步的按照指数数据的分位数将目标对象集合中多个样本对象分成多个子集合,其中,每一子集合可以代表一个活跃水平,按照预设目标值对子集合中样本对象数量之间的目标比例进行调整,可以对样本对象进行更加精细化控制,目标样本对象集合中的样本对象的情况更能反映真实情况。
步骤507、将目标样本集合中的每个样本对象所代表的对象数量从1放大至目标数量。将目标样本集合中的每个样本对象代表的对象数量投射放大,每个样本对象所代表的对象数量从1放大至目标数量,从而使得该目标样本集合中的样本数量可以代表对象总体。请结合图3进行理解,图3为样本对象投射放大示意图。
例如,当前需要对100万的网民的行为数据进行分析,那么也就是说对象总体的数量为100万,而目标样本集合中的样本数量为1万,可以理解的是,每一个样本对象需要代表100个对象,才能使得该1万的样本对象代表100万的对象总体,那么,该目标数量为100。
需要说明的是,步骤507为可选步骤,可以不执行,而直接执行步骤508。步骤507中对于对象总体和目标对象集合中的样本对象的数量均为举例说明,并不造成对本发明的限定性说明。
步骤508、按照预设标准对目标样本对象集合中的样本对象进行周期性的行为数据分析。
获取每个样本对象的行为数据,然后对每个样本对象的行为数据进行分析,对样本对象的行为数据分析是周期性进行的。每一个周期的活跃性指数都达到预设标准,以使得每一个周期中所选的样本对象的代表性具有一致性,从而使对样本对象的行为数据分析准确。
可选的,在本发明实施例中,在每一个数据分析周期都可以按照步骤501至步骤508的方法来确定样本对象,在后续的周期,可以将步骤203和步骤503中预设标准可以根据网民的实际情况进行设定。例如,该预设标准可以与周期成正相关,第一个周期的预设标准为总时长的平均值为100小时,则在第二个周期,该预设标准可设置为100.1小时,在第三个周期,该预设标准可以设置为100.2小时,若第三方数据报告中体现的网民的实际情况是网民使用手机的总时长逐渐增加,则此种设置会更契合所观测网民总体的真实情况。
请参阅图7所示,按照本发明实施例中的方法,本发明实施例中可以以模拟数据分析平台的数据效果来展示本发明实施例中提供的方法的有益效果。以目标样本对象集合中的样本对象去推测中国网民总体情况时,在传统的方法中,因样本的代表性发生了变化而使得淘宝的每月用户量趋势和基准数据(通过其他渠道获取的真实数据)的趋势相背离(一个上涨一个下跌),而使用本发明实施例中提供样本对象的处理方法中确定样本对象,对样本对象的行为数据进行分析后,推测出的中国网民总体中淘宝的每月用户量趋势(模拟结果)和基准数据之间的趋势更为接近。本发明实施例中提供的一种样本对象的处理方法通过将每一个行为数据分析周期中的指标数据都满足预设标准,从而使得每一个周期的样本对象的代表性具有一致性,样本对象所反映的对象总体的行为情况更加准确,真实,对样本对象的行为数据的分析结果与实际情况更加相符。
上面对一种样本对象的处理方法进行了描述,下面对一种样本对象的处理方法所应用的处理装置进行描述,该处理装置可以以服务器的形态存在。
请参阅图8所示,本发明实施例中提供了一种样本对象的处理装置800的一个实施例包括:
获取模块801,获取样本对象集合中每个样本对象的指标数据;
删除模块802,用于根据所述获取模块801获取的所述指标数据删除所述样本对象集合中的无效样本对象,得到第一样本对象集合,所述无效样本对象为指标数据超过预设范围的样本对象;
选择模块803,用于从所述删除模块802删除无效样本对象后得到的所述第一样本对象集合中选择目标数量的目标样本对象集合,所述目标数量大于第一阈值,所述目标样本对象集合中的各目标样本对象所对应的指标数据达到预设标准;
数据分析模块804,用于按照所述选择模块803确定的所述预设标准对所述目标样本对象集合中的样本对象进行周期性的行为数据分析。
请参阅图9所示,在图8对应的实施例的基础上,本发明实施例中提供了一种样本对象的处理装置900的另一个实施例包括:
第一确定模块805,用于确定所述目标样本对象集合中的多个子集合,每个子集合中的样本对象的指标数据对应一个范围值;
第二确定模块806,用于确定所述第一确定模块805确定的每个子集合之间的样本对象数量的差异参数;
调整模块807,用于调整所述第二确定模块806确定的差异参数,以使所述差异参数满足预设目标值。
请参阅图10所示,在图9对应的实施例的基础上,本发明实施例中提供了一种样本对象的处理装置1000的另一个实施例包括:
所述第一确定模块805还包括第一确定单元8051和第二确定单元8052;
所述第一确定单元8051,用于确定所述目标样本对象集合中的样本对象所对应的指标数据的分位数;
所述第二确定单元8052,用于按照所述第一确定单元8051确定的所述分位数将所述目标样本对象集合分为多个子集合。
可选的,当所述分位数包括第一分位数和第二分位数时,所述第二确定单元8052还用于:
确定第一子集合,所述第一子集合包括指标数据小于所述第一分位数的样本对象;
确定第二子集合,所述第二子集合包括指标数据大于或者等于所述第一分位数,且指标数据小于所述第二分位数的样本对象;
确定第三子集合,所述第三子集合包括指标数据大于或者等于所述第三分位数的样本对象。
请参阅图11所示,在图9对应的实施例的基础上,本发明实施例中提供了一种样本对象的处理装置1100的另一个实施例包括:
所述第二确定模块806还包括第三确定单元8061和第四确定单元8062;
所述第三确定单元8061,用于确定每个子集合中样本对象数量;
所述第四确定单元8062,用于根据所述第三确定单元8061确定的所述样本对象数量确定所述子集合之间的样本对象数量的目标比例;
所述调整模块807,还用于通过权重系数调整所述第四确定单元8062确定的所述子集合之间的目标比例,以使所述目标比例满足预设目标值。
请参阅图12所示,在图8对应的实施例的基础上,本发明实施例中提供了一种样本对象的处理装置1200的另一个实施例包括:
所述数量放大模块808,还用于将所述目标样本集合中的每个样本对象所代表的对象数量从1放大至目标数量。
可选的,所述预设标准为所述目标样本对象集合中的各目标样本对象所对应的指标数据平均值为第二阈值。
进一步的,图8至图12中的处理装置是以功能模块的形式来呈现。这里的“模块”可以指特定应用集成电路(application-specific integrated circuit,ASIC),电路,执行一个或多个软件或固件程序的处理器和存储器,集成逻辑电路,和/或其他可以提供上述功能的器件。在一个简单的实施例中,图8至图12中的处理装置可以采用图13所示的形式。
图13是本发明实施例提供的一种服务器结构示意图,该服务器1300可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器1322和存储器1332,一个或一个以上存储应用程序1342或数据1344的存储介质1330(例如一个或一个以上海量存储设备)。其中,存储器1332和存储介质1330可以是短暂存储或持久存储。存储在存储介质1330的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,处理器1322可以设置为与存储介质1330通信,在服务器1300上执行存储介质1330中的一系列指令操作。
服务器1300还可以包括一个或一个以上电源1326,一个或一个以上有线或无线网络接口1350,一个或一个以上输入输出接口1358,和/或,一个或一个以上操作***1341,例如Windows Server,Mac OS XTM,Unix,Linux,FreeBSD等等。
网络接口1350,用于获取样本对象集合中每个样本对象的指标数据;
处理器1322,用于根据所述指标数据删除所述样本对象集合中的无效样本对象,得到第一样本对象集合,所述无效样本对象为指标数据超过预设范围的样本对象;从所述第一样本对象集合中选择目标数量的目标样本对象集合,所述目标数量大于第一阈值,所述目标样本对象集合中的各目标样本对象所对应的指标数据达到预设标准;按照所述预设标准对所述目标样本对象集合中的样本对象进行周期性的行为数据分析。
可选的,处理器1322,还用于确定所述目标样本对象集合中的多个子集合,每个子集合中的样本对象的指标数据对应一个范围值;确定每个子集合之间的样本对象数量的差异参数;调整所述差异参数,以使所述差异参数满足预设目标值。
可选的,处理器1322,还用于确定所述目标样本对象集合中的样本对象所对应的指标数据的分位数;按照所述分位数将所述目标样本对象集合分为多个子集合。
可选的,当所述分位数包括第一分位数和第二分位数时,处理器1322,还用于确定第一子集合,所述第一子集合包括指标数据小于所述第一分位数的样本对象;确定第二子集合,所述第二子集合包括指标数据大于或者等于所述第一分位数,且指标数据小于所述第二分位数的样本对象;确定第三子集合,所述第三子集合包括指标数据大于或者等于所述第三分位数的样本对象。
可选的,处理器1322,还用于确定每个子集合中样本对象数量;根据所述样本对象数量确定所述子集合之间的样本对象数量的目标比例;通过权重系数调整所述子集合之间的目标比例,以使所述目标比例满足预设目标值。
可选的,处理器1322,还用于将所述目标样本集合中的每个样本对象所代表的对象数量从1放大至目标数量。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的***,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的***,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (12)

1.一种样本对象的处理方法,其特征在于,所述样本对象为网民,所述方法包括:
获取样本对象集合中每个样本对象的指标数据,所述指标数据包括活跃指标数据;
根据所述活跃指标数据删除所述样本对象集合中的无效样本对象,得到第一样本对象集合,所述无效样本对象为活跃指标数据超过预设范围的样本对象;
从所述第一样本对象集合中选择目标数量的目标样本对象集合,所述目标数量大于第一阈值,所述目标样本对象集合中的各目标样本对象所对应的活跃指标数据达到预设标准;所述预设标准为所述目标样本对象集合中的各目标样本对象所对应的活跃指标数据平均值为第二阈值;
确定所述目标样本对象集合中的多个子集合,每个子集合中的样本对象的活跃指标数据对应一个范围值;
确定每个子集合之间的样本对象数量的目标比例;
通过权重系数调整所述目标比例,以使所述目标比例满足预设目标值,所述预设目标值是指不同活跃水平的真实网民的数量比例;
按照所述预设标准对所述目标样本对象集合中的样本对象进行周期性的行为数据分析。
2.根据权利要求1所述的样本对象的处理方法,其特征在于,所述确定所述目标样本对象集合中的多个子集合,包括:
确定所述目标样本对象集合中的样本对象所对应的活跃指标数据的分位数;
按照所述分位数将所述目标样本对象集合分为多个子集合。
3.根据权利要求2所述的样本对象的处理方法,其特征在于,当所述分位数包括第一分位数和第二分位数时,所述按照所述分位数将所述目标样本对象集合分为多个子集合,包括:
确定第一子集合,所述第一子集合包括活跃指标数据小于所述第一分位数的样本对象;
确定第二子集合,所述第二子集合包括活跃指标数据大于或者等于所述第一分位数,且所述活跃指标数据小于所述第二分位数的样本对象;
确定第三子集合,所述第三子集合包括活跃指标数据大于或者等于所述第二分位数的样本对象。
4.根据权利要求1至3中任一项所述的样本对象的处理方法,其特征在于,所述确定每个子集合之间的样本对象数量的目标比例,包括:
确定每个子集合中样本对象数量;
根据所述样本对象数量确定所述子集合之间的样本对象数量的目标比例。
5.根据权利要求1至3中任一项所述的样本对象的处理方法,其特征在于,所述从所述第一样本对象集合中选择目标数量的目标样本对象集合之后,所述方法还包括:
将所述目标样本对象集合中的每个样本对象所代表的对象数量从1放大至目标数量。
6.一种样本对象的处理装置,其特征在于,所述样本对象为网民,所述装置包括:
获取模块,获取样本对象集合中每个样本对象的指标数据,所述指标数据包括活跃指标数据;
删除模块,用于根据所述获取模块获取的所述活跃指标数据删除所述样本对象集合中的无效样本对象,得到第一样本对象集合,所述无效样本对象为活跃指标数据超过预设范围的样本对象;
选择模块,用于从所述删除模块删除无效样本对象后得到的所述第一样本对象集合中选择目标数量的目标样本对象集合,所述目标数量大于第一阈值,所述目标样本对象集合中的各目标样本对象所对应的活跃指标数据达到预设标准;所述预设标准为所述目标样本对象集合中的各目标样本对象所对应的活跃指标数据平均值为第二阈值;
第一确定模块,用于确定所述目标样本对象集合中的多个子集合,每个子集合中的样本对象的活跃指标数据对应一个范围值;
第二确定模块,用于确定所述第一确定模块确定的每个子集合之间的样本对象数量的目标比例;
调整模块,用于通过权重系数调整所述第二确定模块确定的目标比例,以使所述目标比例满足预设目标值;所述预设目标值是指不同活跃水平的真实网民的数量比例;
数据分析模块,用于按照所述选择模块确定的所述预设标准对所述目标样本对象集合中的样本对象进行周期性的行为数据分析。
7.根据权利要求6所述的样本对象的处理装置,其特征在于,
所述第一确定模块还包括第一确定单元和第二确定单元;
所述第一确定单元,用于确定所述目标样本对象集合中的样本对象所对应的活跃指标数据的分位数;
所述第二确定单元,用于按照所述第一确定单元确定的所述分位数将所述目标样本对象集合分为多个子集合。
8.根据权利要求7所述的样本对象的处理装置,其特征在于,当所述分位数包括第一分位数和第二分位数时,所述第二确定单元还用于:
确定第一子集合,所述第一子集合包括活跃指标数据小于所述第一分位数的样本对象;
确定第二子集合,所述第二子集合包括活跃指标数据大于或者等于所述第一分位数,且活跃指标数据小于所述第二分位数的样本对象;
确定第三子集合,所述第三子集合包括活跃指标数据大于或者等于所述第二分位数的样本对象。
9.根据权利要求6至8中任一项所述的样本对象的处理装置,其特征在于,所述第二确定模块还包括第三确定单元和第四确定单元;
所述第三确定单元,用于确定每个子集合中样本对象数量;
所述第四确定单元,用于根据所述第三确定单元确定的所述样本对象数量确定所述子集合之间的样本对象数量的目标比例。
10.根据权利要求6至8中任一项所述的样本对象的处理装置,其特征在于,还包括:
数量放大模块,还用于将所述目标样本对象集合中的每个样本对象所代表的对象数量从1放大至目标数量。
11.一种服务器,其特征在于,所述服务器包括处理器和存储器;
所述存储器用于存储程序;
所述处理器用于执行所述程序,以实现如权利要求1~5中任一项所述的样本对象的处理方法。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有程序,所述程序用于使计算机设备执行如权利要求1~5中任一项所述的样本对象的处理方法。
CN201710234565.XA 2017-04-11 2017-04-11 一种样本对象的处理方法及装置 Active CN108694212B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710234565.XA CN108694212B (zh) 2017-04-11 2017-04-11 一种样本对象的处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710234565.XA CN108694212B (zh) 2017-04-11 2017-04-11 一种样本对象的处理方法及装置

Publications (2)

Publication Number Publication Date
CN108694212A CN108694212A (zh) 2018-10-23
CN108694212B true CN108694212B (zh) 2023-04-14

Family

ID=63843499

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710234565.XA Active CN108694212B (zh) 2017-04-11 2017-04-11 一种样本对象的处理方法及装置

Country Status (1)

Country Link
CN (1) CN108694212B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113487225B (zh) * 2021-07-23 2024-05-24 北京云从科技有限公司 一种风险控制方法、***、设备及介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11127354A (ja) * 1997-10-20 1999-05-11 Casio Comput Co Ltd 画像符号化方法及び記憶媒体
JP2004334326A (ja) * 2003-04-30 2004-11-25 Nri & Ncc Co Ltd 商品需要予測システム、商品の売上数調整システム
CN104408143A (zh) * 2014-12-01 2015-03-11 北京国双科技有限公司 网页数据的监测方法和装置
CN104778481A (zh) * 2014-12-19 2015-07-15 五邑大学 一种大规模人脸模式分析样本库的构建方法和装置
CN106203298A (zh) * 2016-06-30 2016-12-07 北京集创北方科技股份有限公司 生物特征识别方法及装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102262678A (zh) * 2011-08-16 2011-11-30 郑毅 一个对海量数据进行抽样以及抽样数据管理***
CN103426121B (zh) * 2013-04-28 2016-06-22 中国南方电网有限责任公司 一种电网运行评估指标无量纲化的计算方法
CN104951962A (zh) * 2015-06-05 2015-09-30 百度在线网络技术(北京)有限公司 一种用于确定与多个指标相对应的趋势信息的方法和装置
CN105139282B (zh) * 2015-08-20 2018-09-14 国家电网公司 一种电网指标数据处理方法、装置以及计算设备
CN105868275A (zh) * 2016-03-22 2016-08-17 深圳市艾酷通信软件有限公司 一种数据统计方法及电子设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11127354A (ja) * 1997-10-20 1999-05-11 Casio Comput Co Ltd 画像符号化方法及び記憶媒体
JP2004334326A (ja) * 2003-04-30 2004-11-25 Nri & Ncc Co Ltd 商品需要予測システム、商品の売上数調整システム
CN104408143A (zh) * 2014-12-01 2015-03-11 北京国双科技有限公司 网页数据的监测方法和装置
CN104778481A (zh) * 2014-12-19 2015-07-15 五邑大学 一种大规模人脸模式分析样本库的构建方法和装置
CN106203298A (zh) * 2016-06-30 2016-12-07 北京集创北方科技股份有限公司 生物特征识别方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张悦玫.基于价值增长的企业绩效评价体系研究.《中国博士学位论文全文数据库 社会科学Ⅰ辑(经济政治与法律)》.2005,J152-13. *

Also Published As

Publication number Publication date
CN108694212A (zh) 2018-10-23

Similar Documents

Publication Publication Date Title
Di Marco et al. Wilderness areas halve the extinction risk of terrestrial biodiversity
CN108289121B (zh) 营销信息的推送方法及装置
Noss et al. Comparison of density estimation methods for mammal populations with camera traps in the K aa‐I ya del G ran C haco landscape
Cain et al. Bias due to left truncation and left censoring in longitudinal studies of developmental and disease processes
Pineda-Munoz et al. Mammal species occupy different climates following the expansion of human impacts
CN110674144A (zh) 用户画像生成方法、装置、计算机设备和存储介质
CN111737646B (zh) 广告推广的效果评估数据处理方法、***和存储介质
CN111148018B (zh) 基于通信数据识别定位区域价值的方法和装置
Finley et al. Does network quality matter? A field study of mobile user satisfaction
CN108345662B (zh) 一种考虑用户分布区域差异的签到微博数据加权统计方法
Smolak et al. The impact of human mobility data scales and processing on movement predictability
CN111340540B (zh) 广告推荐模型的监控方法、推荐方法及装置
CN110012436B (zh) 用户位置确定方法、装置、设备及计算机可读存储介质
Woods et al. Exploring methods for mapping seasonal population changes using mobile phone data
CN114662772A (zh) 交通噪音预警方法、模型训练方法、装置、设备及介质
CN108694212B (zh) 一种样本对象的处理方法及装置
CN113850416A (zh) 广告推广合作对象确定方法和装置
US10171602B2 (en) Determining device counts
JP6221453B2 (ja) 位置推定方法、位置推定プログラム、及び、位置推定装置
CN110148011B (zh) 基于大数据的活跃量下降分析方法、装置、设备及介质
CN113287107B (zh) 数据处理装置、数据处理方法、数据处理程序、终端装置和数据处理***
JP7024663B2 (ja) 評価更新装置、方法、及びプログラム
WO2014207912A1 (ja) 情報提供装置、情報提供方法、および情報提供プログラム
CN111078816B (zh) 基于位置的分析方法、装置、终端及存储介质
KR102343815B1 (ko) 네트워크 데이터를 이용한 광고 효과 측정 방법, 광고 효과 측정 장치, 광고 효과 측정 시스템

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant