CN104408143A - 网页数据的监测方法和装置 - Google Patents

网页数据的监测方法和装置 Download PDF

Info

Publication number
CN104408143A
CN104408143A CN201410720534.1A CN201410720534A CN104408143A CN 104408143 A CN104408143 A CN 104408143A CN 201410720534 A CN201410720534 A CN 201410720534A CN 104408143 A CN104408143 A CN 104408143A
Authority
CN
China
Prior art keywords
sample data
value
significance
data
level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410720534.1A
Other languages
English (en)
Inventor
钦滨杰
李梦溪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Gridsum Technology Co Ltd
Original Assignee
Beijing Gridsum Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Gridsum Technology Co Ltd filed Critical Beijing Gridsum Technology Co Ltd
Priority to CN201410720534.1A priority Critical patent/CN104408143A/zh
Publication of CN104408143A publication Critical patent/CN104408143A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • Finance (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Engineering & Computer Science (AREA)
  • Game Theory and Decision Science (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了网页数据的监测方法和装置。其中,网页数据的监测方法包括:按照预设周期获取历史时间段内的网页数据,得到多个第一样本数据;根据多个第一样本数据确定指标值;接收预设的显著性水平;获取待监测时间段的网页数据,得到第二样本数据,其中,待监测时间段的时长等于预设周期;根据显著性水平和指标值确定第二样本数据的目标状态,其中,目标状态表示第二样本数据的异常情况。通过本发明,解决了现有技术中网页数据监测不够精确的问题,达到了提高网页数据监测精确度的效果。

Description

网页数据的监测方法和装置
技术领域
本发明涉及数据处理领域,具体而言,涉及一种网页数据的监测方法和装置。 
背景技术
随着互联网的普及和发展,通过互联网了解信息和进行交易的用户越来越多,进而得到的互联网的用户访问数据也随之日渐庞大。更多的产品提供方开始利用互联网这个平台进行宣传、交易和维护产品,这就导致对互联网数据处理和呈现的需求一路飙升。数据提供方可以通过各种图、表的方式展示用户访问数据的变化情况。 
如上所述,现阶段数据提供方的侧重点在于更快、更好得整合和展现数据,以协助产品提供方掌握和了解产品的历史表现,具体用到的方法仅限于描述性的统计方法,如:多维数据表、折线图、柱形图、饼形图、气泡图、面积图等,上述统计方法只能进行数据展示,所以只能让需求方(即,产品提供方)看到静态的数据表现,缺乏对数据的动态评判。因为缺乏对用户访问数据动态评判的监测,在某种程度上会造成产品提供方错失的最佳决策机会。 
针对现有技术中网页数据监测不够精确的问题,目前尚未提出有效的解决方案。 
发明内容
本发明的主要目的在于提供一种网页数据的监测方法和装置,以解决现有技术中网页数据监测不够精确。 
为了实现上述目的,根据本发明实施例的一个方面,提供了一种网页数据的监测方法。 
根据本发明的网页数据的监测方法包括:按照预设周期获取历史时间段内的所述网页数据,得到多个第一样本数据;根据多个所述第一样本数据确定指标值;接收预设的显著性水平;获取待监测时间段的所述网页数据,得到第二样本数据,其中,所述待监测时间段的时长等于所述预设周期;以及根据所述显著性水平和所述指标值确定所述第二样本数据的目标状态,其中,所述目标状态表示所述第二样本数据的异常情况。 
进一步地,根据所述显著性水平和所述指标值确定所述第二样本数据的目标状态包括:根据标准正态分布表和所述显著性水平确定第一临界值;根据所述第一临界值 和所述指标值计算待监测时间段内的所述网页数据的区间范围;判断所述第二样本数据是否在所述区间范围内;在判断出所述第二样本数据在所述区间范围内的情况下,确定所述目标状态为第一状态;以及在判断出所述第二样本数据不在所述区间范围内的情况下,确定所述目标状态为第二状态。 
进一步地,所述指标值包括均值和标准差,根据所述第一临界值和所述指标值计算待监测时间段内的所述网页数据的区间范围包括:按照公式计算所述区间范围的下界值;以及按照公式计算所述区间范围的上界值,其中,A为所述下界值,B为所述上界值,为所述均值,Zα/2为所述第一临界值,σ为所述标准差,α为所述显著性水平。 
进一步地,根据所述显著性水平和所述指标值确定所述第二样本数据的目标状态包括:根据所述第二样本数据和所述指标值计算标准值;根据标准正态分布表和所述标准值计算第二临界值;比较所述第二临界值和所述显著性水平;在比较出所述第二临界值大于等于所述显著性水平的情况下,确定所述第二样本数据的目标状态为第一状态;以及在比较出所述第二临界值小于所述显著性水平的情况下,确定所述第二样本数据的目标状态为第二状态。 
进一步地,所述指标值包括均值和标准差,根据所述第二样本数据和所述指标值计算标准值包括:按照公式计算所述标准值,其中,S为所述标准值,x为所述第二样本数据,为所述均值,σ为所述标准差。 
为了实现上述目的,根据本发明实施例的另一方面,提供了一种网页数据的监测装置。 
根据本发明的网页数据的监测装置包括:第一获取单元,用于按照预设周期获取历史时间段内的所述网页数据,得到多个第一样本数据;第一确定单元,用于根据多个所述第一样本数据确定指标值;第一接收单元,用于接收预设的显著性水平;第二获取单元,用于获取待监测时间段的所述网页数据,得到第二样本数据,其中,所述待监测时间段的时长等于所述预设周期;以及第二确定单元,用于根据所述显著性水平和所述指标值确定所述第二样本数据的目标状态,其中,所述目标状态表示所述第二样本数据的异常情况。 
进一步地,所述第二确定单元包括:第一确定模块,用于根据标准正态分布表和所述显著性水平确定第一临界值;第一计算模块,用于根据所述第一临界值和所述指标值计算待监测时间段内的所述网页数据的区间范围;判断模块,用于判断所述第二 样本数据是否在所述区间范围内;第二确定模块,用于在判断出所述第二样本数据在所述区间范围内的情况下,确定所述目标状态为第一状态;以及第三确定模块,用于在判断出所述第二样本数据不在所述区间范围内的情况下,确定所述目标状态为第二状态。 
进一步地,所述指标值包括均值和标准差,所述第一计算模块包括:第一计算子模块,用于按照公式计算所述区间范围的下界值;以及第二计算子模块,用于按照公式计算所述区间范围的上界值,其中,A为所述下界值,B为所述上界值,为所述均值,Zα/2为所述第一临界值,σ为所述标准差,α为所述显著性水平。 
进一步地,所述第二确定单元包括:第二计算模块,用于根据所述第二样本数据和所述指标值计算标准值;第三计算模块,用于根据标准正态分布表和所述标准值计算第二临界值;比较模块,用于比较所述第二临界值和所述显著性水平;第四确定模块,用于在比较出所述第二临界值大于等于所述显著性水平的情况下,确定所述第二样本数据的目标状态为第一状态;以及第五确定模块,用于在比较出所述第二临界值小于所述显著性水平的情况下,确定所述第二样本数据的目标状态为第二状态。 
进一步地,所述指标值包括均值和标准差,所述第二计算模块包括:第三计算子模块,用于按照公式计算所述标准值,其中,S为所述标准值,x为所述第二样本数据,为所述均值,σ为所述标准差。 
进一步地,所述指标值包括均值,所述监测装置还包括:计算单元,用于在确定目标状态为第二状态之后,根据所述均值和所述第二样本数据计算所述第二样本数据的异常程度。 
根据发明实施例,采用按照预设周期获取历史时间段内的网页数据,得到多个第一样本数据;根据多个第一样本数据确定指标值;接收预设的显著性水平;获取待监测时间段内的网页数据,得到第二样本数据,其中,待监测时间段的时长等于预设周期;以及根据显著性水平和指标值确定第二样本数据的目标状态,其中,目标状态表示第二样本数据的异常情况。通过按照预设周期对历史时间段内的网页数据进行获取得到多个第一样本数据,进而根据多个第一样本数据确定指标值,实现了以历史时间段内的数据为基础来确定网页数据的相关指标,然后获取待监测时间段的网页数据,最后根据显著性水平和指标值计算出网页数据的参考范围,比较网页数据与参考范围之间的关系确定网页数据的异常情况,此种监测方式,相比较于现有技术中无法对网页数据进行异常情况监测,本发明解决了现有技术中网页数据监测不够精确的问题, 达到了提高网页数据监测精确度的效果。 
附图说明
构成本申请的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中: 
图1是根据本发明实施例的网页数据的监测方法的流程图; 
图2是根据本发明优选实施例的网页数据的监测方法的流程图; 
图3是根据本发明优选实施例的网页数据的监测方法的流程图; 
图4是根据本发明实施例的网页数据的监测装置的示意图。 
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。 
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。 
在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。 
对本发明实施例中所涉及的技术术语做如下解释: 
显著性水平:是估计总体参数落在某一区间内,可能犯错误的概率为显著性水平。 
置信区间:是指由样本统计量所构造的总体参数的估计区间。 
实施例1 
根据本发明实施例,提供了一种可以用于实施本申请装置实施例的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机***中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。 
根据本发明实施例,提供了一种网页数据的监测方法,图1是根据本发明实施例的网页数据的监测方法的流程图。如图1所示,该方法包括如下的步骤S102至步骤S110: 
S102:按照预设周期获取历史时间段内的网页数据,得到多个第一样本数据,具体地,预设周期、历史时间段和网页数据可以根据需求选择;预设周期可以为日、周或者月中任一种;网页数据可以是访问次数、访问者、浏览量、收入、平均访问持续时间、跳出率、新访问次数百分比、订单转化率或者目标转化率等。第一样本数据可以用Xi表示,i依次取1至n,n为多个第一样本数据的个数,则多个第一样本数据可以具体表示为{X1,X2,X3,....Xn}。 
例如:选择的历史时间段为2014.3.1-2014.8.31,预设周期为月,网页数据为推广信息A的访问量,其中,2014年3月份(即,2014.3.1-2014.3.31)的访问量为5000,2014年4月份(即,2014.4.1-2014.4.30)的访问量为6000,2014年5月份(即,2014.5.1-2014.5.31)的访问量为5000,2014年6月份(即,2014.6.1-2014.6.30)的访问量为7000,2014年7月份(即,2014.7.1-2014.7.31)的访问量为5000,2014年8月份(即,2014.8.1-2014.8.31)的访问量为5500,此时就会得到6个第一样本数据,分别是X1至X6,X1=5000,X2=6000,X3=5000,X4=7000,X5=5000,X6=5500。 
S104:根据多个第一样本数据确定指标值。 
S106:接收预设的显著性水平。在本发明实施例中,显著性水平用α表示,取值范围是0-1,具体取值可以根据需求设置。 
S108:获取待监测时间段的网页数据,得到第二样本数据,其中,待监测时间段的时长等于预设周期,即,也就是按照预设周期获取时长为一个预设周期的网页数据,待监测时间段为历史时间段之后的时间段,并且可以根据需求选择。继续采用S102中的举例进行说明,预设周期为月,历史时间段为2014.3.1-2014.8.31,网页数据为推广产品A的访问量,可以选择待监测时间段为2014.10.1-2014.10.31的访问量作为第二样本数据。 
S110:根据显著性水平和指标值确定第二样本数据的目标状态,其中,目标状态表示第二样本数据的异常情况,具体地,目标状态可以为异常,也可以为正常。 
在本发明实施例中,通过按照预设周期对历史时间段内的网页数据进行获取得到多个第一样本数据,进而根据多个第一样本数据确定由多个第一样本数据得到的指标值,实现了以历史时间段内的数据为基础来确定网页数据的相关指标,然后获取待监测时间段的网页数据,最后根据显著性水平和指标值计算出网页数据的参考范围,比较网页数据与参考范围之间的关系确定网页数据的异常情况,此种监测方式,相比较于现有技术中无法对网页数据进行异常情况监测,本发明解决了现有技术中网页数据监测不够精确的问题,达到了提高网页数据监测精确度的效果。 
具体地,根据显著性水平和指标值确定第二样本数据的目标状态有两种方式,以下分别说明: 
方式一:可以通过步骤1-1至步骤1-5确定第二样本数据的目标状态,步骤1-1至步骤1-5具体如下: 
步骤1-1:根据标准正态分布表和显著性水平确定第一临界值,具体地,根据标准正态分布表(即,表1)和显著性水平确定第一临界值的过程如下: 
该步骤中的显著性水平为步骤S106中接收到的α,首先计算出α/2的值,其次用1-α/2计算出一个数值A1,然后在标准正态分布临界值表中查询与上述数值A1最接近的数值B1,以及数值B1所对应的两个数值,两个数值分别是数值C1和数值D1,最后将数值C1和数值D1求和得到第一临界值Zα/2。举例说明:假设在步骤S106中接收到的显著性水平α=0.05,首先计算出α/2=0.025,其次计算出A1=1-α/2=1-0.025=0.975,然后在表1中查到与0.975最接近的数值为0.9750,即,B1=0.9750,并且数值B1对应的两个数值分别是1.9和0.06,此时确定第一临界值Zα/2为1.96。 
表1 
可选地,在知道显著性水平α后,也可以根据公式计算第一临界值,其中,P1=α/2,在P1为已知值的情况下,可以根据上述公式逆推出第一临界值Zα/2。不论是通过显著性水平α与上述公式确定的第一临界值Zα/2,还是通过显著性水平α与标准正态分布临界值表(即,表1)确定的第一临界值Zα/2,两种方式确定的第一临界值Zα/2都是相等的。 
步骤1-2:根据第一临界值和指标值计算待监测时间段的网页数据的区间范围,该区间范围是待监测时间段的网页数据应该符合的区间范围,该区间范围也可称作置信区间。 
具体地,指标值包括均值和标准差,根据公式计算均值,根据公式 σ = Σ i = 1 n ( x i - x ‾ ) 2 n = ( x 1 - x ‾ ) 2 + ( x 2 - x ‾ ) 2 + . . . + ( x n - x ‾ ) 2 n 计算标准差,其中,为均值,σ为标准差。为了保证根据多个第一样本数据确定的均值和标准差 是收敛的,在步骤S102中得到的第一样本数据的个数应该是足够多的。 
需要说明的是,若选择访问次数、访问者、浏览量、收入等任一绝对量作为网页数据的话,那么可以直接按每个预设周期将得到的多个第一样本数据进行相加汇总,将汇总后的结果除以第一样本的个数就可以计算出均值;若选择平均访问持续时间、跳出率、新访问次数百分比、订单转化率、目标转化率等任一非绝对量作为网页数据的话,指标在计算均值时,要将所选的网页数据的所有数据看成一个整体进行计算,而不能按每个预设周期将得到的多个第一样本数据进行相加汇总,将汇总结果除以第一样本的个数计算均值。 
按照公式计算区间范围的下界值;按照公式计算区间范围的上界值,其中,A为下界值,B为上界值,为均值,Zα/2为第一临界值,σ为标准差,α为显著性水平,根据计算出的上界值和下界值可以确定区间范围。 
步骤1-3:判断第二样本数据是否在区间范围内。 
步骤1-4:在判断出第二样本数据在区间范围内的情况下,确定目标状态为第一状态,即,判断出第二样本数据在区间范围时,确定第二样本数据正常。 
步骤1-5:在判断出第二样本数据不在区间范围内的情况下,确定目标状态为第二状态,即,判断出第二样本数据不在区间范围时,确定第二样本数据异常。 
方式二:可以通过步骤2-1至步骤2-5确定第二样本数据的目标状态,步骤2-1至步骤2-5具体如下: 
步骤2-1:根据第二样本数据和指标值计算标准值。 
具体地,指标值包括均值和标准差,均值和标准差的计算方式在上述方式一中具体说明过,同样的,在此不再重复说明。按照公式计算标准值,其中,S为标准值,x为第二样本数据,为均值,σ为标准差。 
步骤2-2:根据标准正态分布表和标准值计算第二临界值,具体地,根据标准正态分布表和标准值确定第二临界值的过程如下: 
首先将步骤2-1中确定的标准值S分为两部分,一部分是整数加上小数点后一位的值E1,另一部分是小数点后两位的值F1,并且S=E1+F1;其次在标准正态分布表(即,表1)中查到E1和F1对应的值G1,第二临界值P2=1-G1。举例说明:假设步 骤2-1中确定的标准值S=1.35,此时E1=1.3,F1=0.05,在表1中查询即可得知1.3与0.05对应的值应该是0.9115,即G1=0.9115,第二临界值P2=1-G1=1-0.9115=0.0885。 
可选地,在确定标准值S后,也可以根据公式计算出第二临界值P2。不论是通过标准值S与上述公式确定的第二临界值P2,还是通过标准值S与标准正态分布临界值表(即,表1)确定的第二临界值P2,两种方式确定的第二临界值P2都是相等的。 
步骤2-3:比较第二临界值和显著性水平。 
步骤2-4:在比较出第二临界值大于等于显著性水平的情况下,确定第二样本数据的目标状态为第一状态,即,在比较出第二临界值大于等于显著性水平的情况下,第二样本数据正常。 
步骤2-5:在比较出第二临界值小于显著性水平的情况下,确定第二样本数据的目标状态为第二状态,即,在比较出第二临界值小于显著性水平的情况下,第二样本数据异常。 
优选地,指标值包括均值,在确定目标状态为第二状态之后,即,在确定第二样本数据异常后,本发明实施例所提供的网页数据的监测方法还包括:根据均值和第二样本数据计算第二样本数据的异常程度。具体地,可以根据公式:异常百分率=|实际值-均值|/实际值×100%计算第二样本数据的异常程度,其中,实际值为第二样本数据。 
在本发明实施例中,在确定待监测的网页数据异常后,还可以计算该网页数据的异常程度,为用户了解该网页数据的具体异常情况提供了便利,提高了用户满意度。 
优选地,在确定目标状态为第二状态之后,即,在确定第二样本数据异常后,本发明实施例所提供的网页数据的监测方法还包括:向预先设定的用户通过以下至少之一发送报警指令:短消息、电子邮件,即,在确定第二样本数据异常后,可以通过短消息或者电子邮件向预先设定的用户发送报警指令,该报警指令用于提醒该预设用户网页数据异常。 
在本发明实施例中,在确定待监测的网页数据异常后,向预设用户发送报警指令,提醒该预设用户网页数据异常,使得该预设用户收到报警指令后,可以尽快采取相应措施,避免后续网页数据继续异常。 
优选地,在按照预设周期获取历史时间段内的多个历史样本数据的历史实际值Xn 之前,本发明实施例所提供的网页数据的监测方法还包括:接收选择指令,选择指令用于确定预设周期、历史时间段和网页数据,即,可以根据需求选择预设周期为日、周或月之一、历史时间段和网页数据。 
图2是根据本发明优选实施例的网页数据的监测方法的流程图。如图2所示,该方法包括如下的步骤S202至步骤S212: 
S202:选定样本数据,该样本数据相当于步骤S102中得到的多个第一样本数据。 
S204:考察样本数据的基本特征,即,计算该样本数据的基本特征,基本特征包括标准差、均值。 
S206:利用正态分布原理,对某时期的数据正常变化区间范围进行判断,该步骤中的数据正常变化区间范围相当于步骤1-2中的区间范围,区间范围的具体确定过程,在之前已经详细说明,此处不再重复说明。 
S208:判断是否在正常区间范围内,相当于步骤1-3,此处不在赘述。在判断出在正常区间范围内的情况下,执行步骤S210,在判断出不在正常区间范围内的情况下,执行步骤S212。 
S210:正常,相当于步骤1-4,此处不在赘述。 
S212:异常,计算异常程度,也就是“在确定目标状态为第二状态之后,即,在确定第二样本数据异常后,根据均值和第二样本数据计算第二样本数据的异常程度”,此处不在重复。 
图3是根据本发明优选实施例的网页数据的监测方法的流程图。如图3所示,该方法包括如下的步骤S302至步骤S308: 
S302:用户选择时间周期、历史时间段和指标,指标为网页数据。 
S304:利用正态分布原理,计算时间周期内指标正常的波动区间,即,利用正态分布原理,计算网页数据的区间范围。 
S306:判断选定期间的指标是否在正常的波动区间内,相当于步骤1-3,此处不再重复说明。 
S308:结果展现,不论选定期间的指标是否在正常的波动区间内,都将指标正常的波动区间和选定期间的指标之间的关系以图表的形式展现。 
在本发明实施例中,将网页数据和其的区间范围直接的关系以图表的形式进行展现,可以使用户直观的了解到进行监测的网页数据是否异常。 
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。 
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。 
实施例2 
根据本发明实施例,还提供了一种用于实施上述网页数据的监测方法的网页数据的监测装置,该监测装置主要用于执行本发明实施例上述内容所提供的监测方法,以下对本发明实施例所提供的网页数据的监测装置做具体介绍: 
图4是根据本发明实施例的网页数据的监测装置的示意图。如图4所示,该装置主要包括第一获取单元10、第一确定单元20、第一接收单元30、第二获取单元40、第二确定单元50,其中: 
第一获取单元10用于按照预设周期获取历史时间段内的网页数据,得到多个第一样本数据,具体地,预设周期、历史时间段和网页数据可以根据需求选择;预设周期可以为日、周或者月中任一种;网页数据可以是访问次数、访问者、浏览量、收入、平均访问持续时间、跳出率、新访问次数百分比、订单转化率或者目标转化率等。第一样本数据可以用Xi表示,i依次取1至n,n为多个第一样本数据的个数,则多个第一样本数据可以具体表示为{X1,X2,X3,....Xn}。 
例如:选择的历史时间段为2014.3.1-2014.8.31,预设周期为月,网页数据为推广信息A的访问量,其中,2014年3月份(即,2014.3.1-2014.3.31)的访问量为5000,2014年4月份(即,2014.4.1-2014.4.30)的访问量为6000,2014年5月份(即, 2014.5.1-2014.5.31)的访问量为5000,2014年6月份(即,2014.6.1-2014.6.30)的访问量为7000,2014年7月份(即,2014.7.1-2014.7.31)的访问量为5000,2014年8月份(即,2014.8.1-2014.8.31)的访问量为5500,此时就会得到6个第一样本数据,分别是X1至X6,X1=5000,X2=6000,X3=5000,X4=7000,X5=5000,X6=5500。 
第一确定单元20用于根据多个第一样本数据确定指标值。 
第一接收单元30用于接收预设的显著性水平,在本发明实施例中,显著性水平用α表示,取值范围是0-1,具体取值可以根据需求设置。 
第二获取单元40用于获取待监测时间段的网页数据,得到第二样本数据,其中,待监测时间段的时长等于预设周期,即,也就是按照预设周期获取时长为一个预设周期的网页数据,待监测时间段为历史时间段之后的时间段,并且可以根据需求选择。继续采用第一获取单元10中的举例进行说明,预设周期为月,历史时间段为2014.3.1-2014.8.31,网页数据为推广产品A的访问量,可以选择待监测时间段为2014.10.1-2014.10.31的访问量作为第二样本数据。 
第二确定单元50用于根据显著性水平和指标值确定第二样本数据的目标状态,其中,目标状态表示第二样本数据的异常情况,具体地,目标状态可以为异常,也可以为正常。 
在本发明实施例中,通过按照预设周期对历史时间段内的网页数据进行获取得到多个第一样本数据,进而根据多个第一样本数据确定由多个第一样本数据得到的指标值,实现了以历史时间段内的数据为基础来确定网页数据的相关指标,然后获取待监测时间段的网页数据,最后根据显著性水平和指标值计算出网页数据的参考范围,比较网页数据与参考范围之间的关系确定网页数据的异常情况,此种监测方式,相比较于现有技术中无法对网页数据进行异常情况监测,本发明解决了现有技术中网页数据监测不够精确的问题,达到了提高网页数据监测精确度的效果。 
具体地,根据显著性水平和指标值确定第二样本数据的目标状态有两种方式,以下分别说明: 
方式一:第二确定单元50包括第一确定模块、第一计算模块、判断模块、第二确定模块和第三确定模块,其中: 
第一确定模块用于根据标准正态分布表和显著性水平确定第一临界值,具体地,根据标准正态分布表(即,表1)和显著性水平确定第一临界值的过程如下: 
显著性水平为第一接收单元30接收到的显著性水平α,首先计算出α/2的值,其次用1-α/2计算出一个数值A1,然后在标准正态分布临界值表中查询与上述数值A1最接近的数值B1,以及数值B1所对应的两个数值,两个数值分别是数值C1和数值D1,最后将数值C1和数值D1求和得到第一临界值Zα/2。举例说明:假设第一接收单元30接收到的显著性水平α=0.05,首先计算出α/2=0.025,其次计算出A1=1-α/2=1-0.025=0.975,然后在表1中查到与0.975最接近的数值为0.9750,即,B1=0.9750,并且数值B1对应的两个数值分别是1.9和0.06,此时确定第一临界值Zα/2为1.96。 
可选地,在知道显著性水平α后,也可以根据公式计算第一临界值,其中,P1=α/2,在P1为已知值的情况下,可以根据上述公式逆推出第一临界值Zα/2。不论是通过显著性水平α与上述公式确定的第一临界值Zα/2,还是通过显著性水平α与标准正态分布临界值表(即,表1)确定的第一临界值Zα/2,两种方式确定的第一临界值Zα/2都是相等的。 
第一计算模块用于根据第一临界值和指标值计算待监测时间段内的网页数据的区间范围,该区间范围是待监测时间段的网页数据应该符合的区间范围,该区间范围也可称作置信区间。 
具体地,指标值包括均值和标准差,根据公式计算均值,根据公式 σ = Σ i = 1 n ( x i - x ‾ ) 2 n = ( x 1 - x ‾ ) 2 + ( x 2 - x ‾ ) 2 + . . . + ( x n - x ‾ ) 2 n 计算标准差,其中,为均值,σ为标准差。为了保证根据多个第一样本数据确定的均值和标准差是收敛的,在第一获取单元10中得到的第一样本数据的个数应该是足够多的。 
需要说明的是,若选择访问次数、访问者、浏览量、收入等任一绝对量作为网页数据的话,那么可以直接按每个预设周期将得到的多个第一样本数据进行相加汇总,将汇总后的结果除以第一样本的个数就可以计算出均值;若选择平均访问持续时间、跳出率、新访问次数百分比、订单转化率、目标转化率等任一非绝对量作为网页数据 的话,指标在计算均值时,要将所选的网页数据的所有数据看成一个整体进行计算,而不能按每个预设周期将得到的多个第一样本数据进行相加汇总,将汇总结果除以第一样本的个数计算均值。 
第一计算模块包括第一计算子模块和第二计算子模块,其中,第一计算子模块用于按照公式计算区间范围的下界值;第二计算子模块用于按照公式 计算区间范围的上界值,其中,A为下界值,B为上界值,为均值,Zα/2为第一临界值,σ为标准差,α为显著性水平,根据计算出的上界值和下界值可以确定区间范围。 
判断模块用于判断第二样本数据是否在区间范围内; 
第二确定模块用于在判断出第二样本数据在区间范围内的情况下,确定目标状态为第一状态,即,判断出第二样本数据在区间范围时,确定第二样本数据正常。 
第三确定模块用于在判断出第二样本数据不在区间范围内的情况下,确定目标状态为第二状态,即,判断出第二样本数据不在区间范围时,确定第二样本数据异常。 
方式二:第二确定单元50包括第二计算模块、第三计算模块、比较模块、第四确定模块和第五确定模块,其中: 
第二计算模块用于根据第二样本数据和指标值计算标准值。 
具体地,指标值包括均值和标准差,均值和标准差的计算方式在上述方式一中具体说明过,在此不再重复说明。第二计算模块包括第三计算子模块,用于按照公式 计算标准值,其中,S为标准值,x为第二样本数据,为均值,σ为标准差。 
第三计算模块用于根据标准正态分布表和标准值计算第二临界值,具体地,根据标准正态分布表和标准值确定第二临界值的过程如下: 
首先将第二计算模块确定的标准值S分为两部分,一部分是整数加上小数点后一位的值E1,另一部分是小数点后两位的值F1,并且S=E1+F1;其次在标准正态分布表(即,表1)中查到E1和F1对应的值G1,第二临界值P2=1-G1。举例说明:假设第二计算模块确定的标准值S=1.35,此时E1=1.3,F1=0.05,在表1中查询即可得知1.3与0.05对应的值应该是0.9115,即G1=0.9115,第二临界值 P2=1-G1=1-0.9115=0.0885。 
可选地,在确定标准值S后,也可以根据公式计算出第二临界值P2。不论是通过标准值S与上述公式确定的第二临界值P2,还是通过标准值S与标准正态分布临界值表(即,表1)确定的第二临界值P2,两种方式确定的第二临界值P2都是相等的。 
比较模块用于比较第二临界值和显著性水平。 
第四确定模块用于在比较出第二临界值大于等于显著性水平的情况下,确定第二样本数据的目标状态为第一状态,即,在比较出第二临界值大于等于显著性水平的情况下,第二样本数据正常。 
第五确定模块用于在比较出第二临界值小于显著性水平的情况下,确定第二样本数据的目标状态为第二状态,即,在比较出第二临界值小于显著性水平的情况下,第二样本数据异常。 
优选地,指标值包括均值,本发明实施例所提供的网页数据的监测装置还包括计算单元,用于在确定目标状态为第二状态之后,根据均值和第二样本数据计算第二样本数据的异常程度。具体地,可以根据公式:异常百分率=|实际值-均值|/实际值×100%计算第二样本数据的异常程度,其中,实际值为第二样本数据。 
在本发明实施例中,在确定待监测的网页数据异常后,还可以计算该网页数据的异常程度,为用户了解该网页数据的具体异常情况提供了便利,提高了用户满意度。 
优选地,本发明实施例所提供的网页数据的监测方法还包括发送单元,用于在确定目标状态为第二状态之后,向预先设定的用户通过以下至少之一发送报警指令:短消息、电子邮件,即,在确定第二样本数据异常后,可以通过短消息或者电子邮件向预先设定的用户发送报警指令,该报警指令用于提醒该预设用户网页数据异常。 
在本发明实施例中,在确定待监测的网页数据异常后,向预设用户发送报警指令,提醒该预设用户网页数据异常,使得该预设用户收到报警指令后,可以尽快采取相应措施,避免后续网页数据继续异常。 
优选地,本发明实施例所提供的网页数据的监测装置还包括第二接收单元,用于在按照预设周期获取历史时间段内的多个历史样本数据的历史实际值Xn之前,接收选择指令,其中,选择指令用于确定预设周期、历史时间段和网页数据,即,可以根 据需求选择预设周期为日、周或月之一、历史时间段和网页数据。 
从以上的描述中,可以看出,本发明解决了现有技术中网页数据监测不够精确的问题,达到了提高网页数据监测精确度的效果。 
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。 
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。 
在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。 
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。 
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。 
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。 
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润 饰也应视为本发明的保护范围。 

Claims (12)

1.一种网页数据的监测方法,其特征在于,包括:
按照预设周期获取历史时间段内的所述网页数据,得到多个第一样本数据;
根据多个所述第一样本数据确定指标值;
接收预设的显著性水平;
获取待监测时间段的所述网页数据,得到第二样本数据,其中,所述待监测时间段的时长等于所述预设周期;以及
根据所述显著性水平和所述指标值确定所述第二样本数据的目标状态,其中,所述目标状态表示所述第二样本数据的异常情况。
2.根据权利要求1所述的监测方法,其特征在于,根据所述显著性水平和所述指标值确定所述第二样本数据的目标状态包括:
根据标准正态分布表和所述显著性水平确定第一临界值;
根据所述第一临界值和所述指标值计算待监测时间段内的所述网页数据的区间范围;
判断所述第二样本数据是否在所述区间范围内;
在判断出所述第二样本数据在所述区间范围内的情况下,确定所述目标状态为第一状态;以及
在判断出所述第二样本数据不在所述区间范围内的情况下,确定所述目标状态为第二状态。
3.根据权利要求2所述的监测方法,其特征在于,所述指标值包括均值和标准差,根据所述第一临界值和所述指标值计算待监测时间段内的所述网页数据的区间范围包括:
按照公式计算所述区间范围的下界值;以及
按照公式计算所述区间范围的上界值,其中,A为所述下界值,B为所述上界值,为所述均值,Zα/2为所述第一临界值,σ为所述标准差,α为所述显著性水平。
4.根据权利要求1所述的监测方法,其特征在于,根据所述显著性水平和所述指标值确定所述第二样本数据的目标状态包括:
根据所述第二样本数据和所述指标值计算标准值;
根据标准正态分布表和所述标准值计算第二临界值;
比较所述第二临界值和所述显著性水平;
在比较出所述第二临界值大于等于所述显著性水平的情况下,确定所述第二样本数据的目标状态为第一状态;以及
在比较出所述第二临界值小于所述显著性水平的情况下,确定所述第二样本数据的目标状态为第二状态。
5.根据权利要求4所述的监测方法,其特征在于,所述指标值包括均值和标准差,根据所述第二样本数据和所述指标值计算标准值包括:
按照公式计算所述标准值,其中,S为所述标准值,x为所述第二样本数据,为所述均值,σ为所述标准差。
6.根据权利要求2或4所述的监测方法,其特征在于,所述指标值包括均值,在确定目标状态为第二状态之后,所述监测方法还包括:
根据所述均值和所述第二样本数据计算所述第二样本数据的异常程度。
7.一种网页数据的监测装置,其特征在于,包括:
第一获取单元,用于按照预设周期获取历史时间段内的所述网页数据,得到多个第一样本数据;
第一确定单元,用于根据多个所述第一样本数据确定指标值;
第一接收单元,用于接收预设的显著性水平;
第二获取单元,用于获取待监测时间段的所述网页数据,得到第二样本数据,其中,所述待监测时间段的时长等于所述预设周期;以及
第二确定单元,用于根据所述显著性水平和所述指标值确定所述第二样本数据的目标状态,其中,所述目标状态表示所述第二样本数据的异常情况。
8.根据权利要求7所述的监测装置,其特征在于,所述第二确定单元包括:
第一确定模块,用于根据标准正态分布表和所述显著性水平确定第一临界值;
第一计算模块,用于根据所述第一临界值和所述指标值计算待监测时间段内的所述网页数据的区间范围;
判断模块,用于判断所述第二样本数据是否在所述区间范围内;
第二确定模块,用于在判断出所述第二样本数据在所述区间范围内的情况下,确定所述目标状态为第一状态;以及
第三确定模块,用于在判断出所述第二样本数据不在所述区间范围内的情况下,确定所述目标状态为第二状态。
9.根据权利要求8所述的监测装置,其特征在于,所述指标值包括均值和标准差,所述第一计算模块包括:
第一计算子模块,用于按照公式计算所述区间范围的下界值;以及
第二计算子模块,用于按照公式计算所述区间范围的上界值,其中,A为所述下界值,B为所述上界值,为所述均值,Zα/2为所述第一临界值,σ为所述标准差,α为所述显著性水平。
10.根据权利要求7所述的监测装置,其特征在于,所述第二确定单元包括:
第二计算模块,用于根据所述第二样本数据和所述指标值计算标准值;
第三计算模块,用于根据标准正态分布表和所述标准值计算第二临界值;
比较模块,用于比较所述第二临界值和所述显著性水平;
第四确定模块,用于在比较出所述第二临界值大于等于所述显著性水平的情况下,确定所述第二样本数据的目标状态为第一状态;以及
第五确定模块,用于在比较出所述第二临界值小于所述显著性水平的情况下,确定所述第二样本数据的目标状态为第二状态。
11.根据权利要求10所述的监测装置,其特征在于,所述指标值包括均值和标准差,所述第二计算模块包括:
第三计算子模块,用于按照公式计算所述标准值,其中,S为所述标准值,x为所述第二样本数据,为所述均值,σ为所述标准差。
12.根据权利要求8或10所述的监测装置,其特征在于,所述指标值包括均值,所述监测装置还包括:
计算单元,用于在确定目标状态为第二状态之后,根据所述均值和所述第二样本数据计算所述第二样本数据的异常程度。
CN201410720534.1A 2014-12-01 2014-12-01 网页数据的监测方法和装置 Pending CN104408143A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410720534.1A CN104408143A (zh) 2014-12-01 2014-12-01 网页数据的监测方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410720534.1A CN104408143A (zh) 2014-12-01 2014-12-01 网页数据的监测方法和装置

Publications (1)

Publication Number Publication Date
CN104408143A true CN104408143A (zh) 2015-03-11

Family

ID=52645774

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410720534.1A Pending CN104408143A (zh) 2014-12-01 2014-12-01 网页数据的监测方法和装置

Country Status (1)

Country Link
CN (1) CN104408143A (zh)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104767640A (zh) * 2015-03-25 2015-07-08 亚信科技(南京)有限公司 预警方法及预警***
CN105512094A (zh) * 2015-12-04 2016-04-20 小米科技有限责任公司 异常短信模板确定方法及装置
CN106407657A (zh) * 2016-08-31 2017-02-15 无锡雅座在线科技发展有限公司 事件捕获方法和装置
CN106570073A (zh) * 2016-10-14 2017-04-19 周磊 地表水水质数据粗误差筛查方法及装置
CN106611023A (zh) * 2015-10-27 2017-05-03 北京国双科技有限公司 网站访问异常的检测方法及装置
CN107194486A (zh) * 2017-06-16 2017-09-22 北京微影时代科技有限公司 一种异常座位数据处理的方法及装置
WO2017167063A1 (zh) * 2016-03-30 2017-10-05 阿里巴巴集团控股有限公司 一种数据检索方法和装置、一种数据存储方法和装置
CN108093013A (zh) * 2016-11-23 2018-05-29 北京国双科技有限公司 一种网页数据计算方法及服务器
CN108121753A (zh) * 2016-11-30 2018-06-05 北京国双科技有限公司 数据监测方法及装置
CN108694212A (zh) * 2017-04-11 2018-10-23 腾讯科技(深圳)有限公司 一种样本对象的处理方法及装置
CN109242528A (zh) * 2018-07-26 2019-01-18 焦点科技股份有限公司 一种电商平台自定义路径的漏斗分析方法及装置
CN109885564A (zh) * 2019-02-12 2019-06-14 北京字节跳动网络技术有限公司 用于发送信息的方法和装置
CN110399903A (zh) * 2019-06-28 2019-11-01 上海上湖信息技术有限公司 异常数据的检测方法及装置、计算机可读存储介质
CN111833135A (zh) * 2019-08-01 2020-10-27 北京嘀嘀无限科技发展有限公司 订单数据的分析方法、装置及电子设备
CN113556240A (zh) * 2020-04-24 2021-10-26 北京淇瑀信息科技有限公司 一种上游流量的监测方法、装置和电子设备
CN113590962A (zh) * 2021-08-03 2021-11-02 合肥泰瑞数创科技有限公司 一种流量数据预测***、方法、计算机设备及介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100153344A1 (en) * 2008-12-15 2010-06-17 Industrial Technology Research Institute Information extraction method, extractor rebuilding method, and system and computer program product thereof
CN103605714A (zh) * 2013-11-14 2014-02-26 北京国双科技有限公司 网站异常数据的识别方法及装置
CN103714057A (zh) * 2012-09-28 2014-04-09 北京亿赞普网络技术有限公司 一种在线网页信息的实时监测方法和装置
CN103856366A (zh) * 2012-12-06 2014-06-11 腾讯科技(深圳)有限公司 一种平台数据监控方法及***

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100153344A1 (en) * 2008-12-15 2010-06-17 Industrial Technology Research Institute Information extraction method, extractor rebuilding method, and system and computer program product thereof
CN103714057A (zh) * 2012-09-28 2014-04-09 北京亿赞普网络技术有限公司 一种在线网页信息的实时监测方法和装置
CN103856366A (zh) * 2012-12-06 2014-06-11 腾讯科技(深圳)有限公司 一种平台数据监控方法及***
CN103605714A (zh) * 2013-11-14 2014-02-26 北京国双科技有限公司 网站异常数据的识别方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
盛骤 等: "参数估计和假设检验", 《概率论与数理统计(第四版)》 *

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104767640B (zh) * 2015-03-25 2019-03-12 亚信科技(南京)有限公司 预警方法及预警***
CN104767640A (zh) * 2015-03-25 2015-07-08 亚信科技(南京)有限公司 预警方法及预警***
CN106611023A (zh) * 2015-10-27 2017-05-03 北京国双科技有限公司 网站访问异常的检测方法及装置
CN106611023B (zh) * 2015-10-27 2020-11-24 北京国双科技有限公司 网站访问异常的检测方法及装置
CN105512094A (zh) * 2015-12-04 2016-04-20 小米科技有限责任公司 异常短信模板确定方法及装置
CN105512094B (zh) * 2015-12-04 2019-07-02 小米科技有限责任公司 异常短信模板确定方法及装置
WO2017167063A1 (zh) * 2016-03-30 2017-10-05 阿里巴巴集团控股有限公司 一种数据检索方法和装置、一种数据存储方法和装置
CN106407657A (zh) * 2016-08-31 2017-02-15 无锡雅座在线科技发展有限公司 事件捕获方法和装置
CN106570073A (zh) * 2016-10-14 2017-04-19 周磊 地表水水质数据粗误差筛查方法及装置
CN106570073B (zh) * 2016-10-14 2019-11-15 北京建筑大学 地表水水质数据粗误差筛查方法及装置
CN108093013A (zh) * 2016-11-23 2018-05-29 北京国双科技有限公司 一种网页数据计算方法及服务器
CN108121753A (zh) * 2016-11-30 2018-06-05 北京国双科技有限公司 数据监测方法及装置
CN108121753B (zh) * 2016-11-30 2021-09-17 北京国双科技有限公司 数据监测方法及装置
CN108694212A (zh) * 2017-04-11 2018-10-23 腾讯科技(深圳)有限公司 一种样本对象的处理方法及装置
CN108694212B (zh) * 2017-04-11 2023-04-14 腾讯科技(深圳)有限公司 一种样本对象的处理方法及装置
CN107194486A (zh) * 2017-06-16 2017-09-22 北京微影时代科技有限公司 一种异常座位数据处理的方法及装置
CN109242528A (zh) * 2018-07-26 2019-01-18 焦点科技股份有限公司 一种电商平台自定义路径的漏斗分析方法及装置
CN109885564A (zh) * 2019-02-12 2019-06-14 北京字节跳动网络技术有限公司 用于发送信息的方法和装置
CN110399903B (zh) * 2019-06-28 2021-07-13 上海上湖信息技术有限公司 异常数据的检测方法及装置、计算机可读存储介质
CN110399903A (zh) * 2019-06-28 2019-11-01 上海上湖信息技术有限公司 异常数据的检测方法及装置、计算机可读存储介质
CN111833135A (zh) * 2019-08-01 2020-10-27 北京嘀嘀无限科技发展有限公司 订单数据的分析方法、装置及电子设备
CN113556240A (zh) * 2020-04-24 2021-10-26 北京淇瑀信息科技有限公司 一种上游流量的监测方法、装置和电子设备
CN113590962A (zh) * 2021-08-03 2021-11-02 合肥泰瑞数创科技有限公司 一种流量数据预测***、方法、计算机设备及介质
CN113590962B (zh) * 2021-08-03 2023-07-25 合肥泰瑞数创科技有限公司 一种流量数据预测***、方法、计算机设备及介质

Similar Documents

Publication Publication Date Title
CN104408143A (zh) 网页数据的监测方法和装置
CN106997549A (zh) 一种广告信息的推送方法及***
Alexopoulos et al. DESYMA: assessing flexibility for the lifecycle of manufacturing systems
CN104090912A (zh) 信息推送方法及装置
Kannan et al. Modelling and analysis of selective assembly using Taguchi's loss function
CN110019622A (zh) 一种实时海量地图点位聚合方法及装置
Shu An adaptive exponentially weighted moving average control chart for monitoring process variances
CN103425664A (zh) 一种对实体数据单元进行搜索、显示的方法和设备
CN103258248A (zh) 一种微博流行趋势预测方法、装置及***
CN108133390A (zh) 用于预测用户行为的方法和装置以及计算设备
Nair et al. The Govindarajulu distribution: Some properties and applications
CN104408640A (zh) 应用软件推荐方法及装置
Taconeli et al. New two-stage sampling designs based on neoteric ranked set sampling
CN115809569A (zh) 基于耦合竞争失效模型的可靠性评价方法和装置
CN106156123B (zh) 活跃值计算方法及装置
Reyes et al. Nonparametric kernel density estimation for general grouped data
Lee et al. A process monitoring scheme controlling false discovery rate
CN104484357B (zh) 数据处理方法及装置和访问频次信息处理方法及装置
Ahmadi Yazdi et al. Addressing the effect of parameter estimation on phase II monitoring of multivariate multiple linear profiles via a new cluster-based approach
CN110796520A (zh) 商品推荐的方法、装置、计算设备以及介质
CN103778329B (zh) 一种构造数据补足值的方法
KR101462858B1 (ko) 기업의 해외 진출 역량 평가 방법
Koutrouvelis et al. Cumulant plots and goodness-of-fit tests for the inverse Gaussian distribution
CN114090407A (zh) 基于线性回归模型的接口性能预警方法及其相关设备
CN115271866A (zh) 一种产品推荐方法、装置、电子设备及可读存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20150311