CN108427687A - 一种用户数处理方法及装置 - Google Patents

一种用户数处理方法及装置 Download PDF

Info

Publication number
CN108427687A
CN108427687A CN201710081406.0A CN201710081406A CN108427687A CN 108427687 A CN108427687 A CN 108427687A CN 201710081406 A CN201710081406 A CN 201710081406A CN 108427687 A CN108427687 A CN 108427687A
Authority
CN
China
Prior art keywords
users
period
generation
accumulative
active
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710081406.0A
Other languages
English (en)
Inventor
郭涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Gridsum Technology Co Ltd
Original Assignee
Beijing Gridsum Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Gridsum Technology Co Ltd filed Critical Beijing Gridsum Technology Co Ltd
Priority to CN201710081406.0A priority Critical patent/CN108427687A/zh
Publication of CN108427687A publication Critical patent/CN108427687A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Fuzzy Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种用户数处理方法及装置,分别获取活跃用户数的生成周期和累计用户数的生成周期,根据活跃用户数的生成周期和累计用户数的生成周期,确定统计周期,统计周期同时为活跃用户数的生成周期和累计用户数的生成周期的正整数倍,每当时间到达统计周期时,分别对活跃用户数和累计用户数进行数量统计,将活跃用户数和累计用户数的数量统计结果在同一图表中进行展示,以便对活跃用户数和累计用户数进行对比分析。本发明公开的用户数处理方法及装置使得活跃用户数和累计用户数数量统计结果可在同一图表中进行展示,有助于后续更好地实现对数据的分析和处理。

Description

一种用户数处理方法及装置
技术领域
本发明涉及数据分析技术领域,尤其设计一种用户数处理方法及装置。
背景技术
在采用实时***分析实时数据时,累计用户数和活跃用户数通常是分开计算并展示的。然而,在某些时候,为了能更好的对数据进行分析,希望能够将累计用户数和活跃用户数一起分析并展示,为了满足数据分析的需求,亟需一种能够将累计用户数和活跃用户数关联到一起同时分析的解决方案。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的技术方案:
一种用户数处理方法,包括:
分别获取活跃用户数的生成周期和累计用户数的生成周期;
根据所述活跃用户数的生成周期和所述累计用户数的生成周期,确定统计周期,所述统计周期同时为所述活跃用户数的生成周期和所述累计用户数的生成周期的正整数倍;
每当时间到达所述统计周期时,分别对所述活跃用户数和所述累计用户数进行数量统计;
将所述活跃用户数和所述累计用户数的数量统计结果在同一图表中进行展示,以便对所述活跃用户数和所述累计用户数进行对比分析。
其中,根据所述活跃用户数的生成周期和所述累计用户数的生成周期,确定统计周期,包括:
如果所述活跃用户数的生成周期和所述累计用户数的生成周期中,数值较大的生成周期为数值较小的生成周期的正整数倍,则将所述数值较大的生成周期确定为所述统计周期;
如果所述活跃用户数的生成周期和所述累计用户数的生成周期中,数值较大的生成周期不是数值较小的生成周期的正整数倍,则计算所述活跃户数的生成周期和所述累计用户数的生成周期的最小公倍数,将所述最小公倍数所对应的数值,确定为所述统计周期。
在分别对所述活跃用户数和所述累计用户数进行数量统计之前,所述方法还包括:
分别获取所述活跃用户数和所述累计用户数所对应的用户的用户标识信息;
获取布隆过滤器,所述布隆过滤器中存储有用户标识信息;
判断所述用户标识信息是否存在于所述布隆过滤器中;
如果判断所述用户标识信息不存在于所述布隆过滤器中,则将所述用户对应的用户标识信息添加进所述布隆过滤器中,以便对所述活跃用户数和所述累计用户数进行统计。
在分别对所述活跃用户数和所述累计用户数进行数量统计之前,所述方法还包括:
分别获取所述活跃用户数和所述累计用户数所对应的用户的用户标识信息;
获取布隆过滤器,所述布隆过滤器中存储有用户标识信息;
判断所述用户标识信息是否存在于所述布隆过滤器中;
如果判断所述用户标识信息不存在于所述布隆过滤器中,则获取数据分析维度,所述数据分析维度包括所述用户对应的地域信息和/或频道信息;
将所述数据分析维度和所述用户标识信息都添加进所述布隆过滤器中,以便根据所述数据分析维度对所述活跃用户数和所述累计用户数进行统计。
在将所述活跃用户数和所述累计用户数的数量统计结果在同一图表中进行展示之前,所述方法还包括:
获取按照所述活跃用户数的生成周期生成的活跃用户数日志;
获取按照所述累计用户数的生成周期生成的累计用户数日志;
按照所述数据分析维度分别对所述活跃用户数日志和所述累计用户数日志进行聚合;
按照所述统计周期对聚合后的活跃用户数和聚合后的累计用户数进行关联,并将关联结果进行存储。
一种用户数处理装置,包括:第一获取单元、确定单元、统计单元和展示单元;
所述第一获取单元,用于分别获取活跃用户数的生成周期和累计用户数的生成周期;
所述确定单元,用于根据获取的所述活跃用户数的生成周期和所述累计用户数的生成周期,确定统计周期,所述统计周期同时为所述活跃用户数的生成周期和所述累计用户数的生成周期的正整数倍;
所述统计单元,用于每当时间到达所述统计周期时,分别对所述活跃用户数和所述累计用户数进行数量统计;
所述展示单元,用于将所述活跃用户数和所述累计用户数的数量统计结果在同一图表中进行展示,以便对所述活跃用户数和所述累计用户数进行对比分析。
其中,所述确定单元包括:第一确定子模块、计算子模块和第二确定子模块;
所述第一确定子模块,用于当所述活跃用户数的生成周期和所述累计用户数的生成周期中,数值较大的生成周期为数值较小的生成周期的正整数倍时,将所述数值较大的生成周期确定为所述统计周期;
所述计算子模块,用于当所述活跃用户数的生成周期和所述累计用户数的生成周期中,数值较大的生成周期不是数值较小的生成周期的正整数倍时,计算所述活跃户数的生成周期和所述累计用户数的生成周期的最小公倍数;
所述第二确定子模块,用于将所述最小公倍数所对应的数值,确定为所述统计周期。
所述用户数处理装置还包括:第二获取单元、第三获取单元、第一判断单元和第一信息添加单元;
所述第二获取单元,用于分别获取所述活跃用户数和所述累计用户数所对应的用户的用户标识信息;
所述第三获取单元,用于获取布隆过滤器,所述布隆过滤器中存储有用户标识信息;
所述第一判断单元,用于判断所述用户标识信息是否存在于所述布隆过滤器中;
所述第一信息添加单元,用于当所述判断单元判断出所述用户标识信息不存在于所述布隆过滤器中时,将所述用户对应的用户标识信息添加进所述布隆过滤器中,以便对所述活跃用户数和所述累计用户数进行统计。
所述用户数处理装置还包括:第四获取单元、第五获取单元、第二判断单元、第六获取单元和第二信息添加单元;
所述第四获取单元,用于分别获取所述活跃用户数和所述累计用户数所对应的用户的用户标识信息;
所述第五获取单元,用于获取布隆过滤器,所述布隆过滤器中存储有用户标识信息;
所述第二判断单元,用于判断所述用户标识信息是否存在于所述布隆过滤器中;
所述第六获取单元,用于当所述用户标识信息不存在于所述布隆过滤器中时,获取数据分析维度,所述数据分析维度包括所述用户对应的地域信息和/或频道信息;
所述第二信息添加单元,用于将所述数据分析维度和所述用户标识信息都添加进所述布隆过滤器中,以便根据所述数据分析维度对所述活跃用户数和所述累计用户数进行统计。
所述用户数处理装置还包括:第七获取单元、第八获取单元、聚合单元、关联单元和存储单元;
所述第七获取单元,用于获取按照所述活跃用户数的生成周期生成的活跃用户数日志;
所述第八获取单元,用于获取按照所述累计用户数的生成周期生成的累计用户数日志;
所述聚合单元,用于按照所述数据分析维度分别对所述活跃用户数日志和所述累计用户数日志进行聚合;
所述关联单元,用于按照所述统计周期对聚合后的活跃用户数和聚合后的累计用户数进行关联;
所述存储单元,用于将所述关联单元的关联结果进行存储。
借由上述技术方案,本发明提供的用户数处理方法及装置,能够分别获取活跃用户数的生成周期和累计用户数的生成周期,并根据活跃用户数的生成周期和累计用户数的生成周期确定统计周期,从而使得,每当时间到达统计周期时,能够分别对活跃用户数和累计用户数进行数量统计,进而将活跃用户数和累计用户数的数量统计结果在同一图表中进行展示。由此可见,本发明提供的用户数处理方法及装置能够实现将活跃用户数和累计用户数的数量统计结果在同一图表中进行展示,这有助于对活跃用户数和累计用户数进行对比分析,即,能更好地实现对数据的分析和处理。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本发明实施例提供的用户数处理方法的流程示意图;
图2示出了本发明实施例提供将活跃用户数和累计用户数以折线图的方式在同一图标中进行展示的示意图;
图3示出了本发明实施例提供的用户数处理装置的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
本发明实施例提供了一种用户数处理方法,请参阅图1,示出了该用户数处理方法的流程示意图,可以包括:
步骤S101:分别获取活跃用户数的生成周期和累计用户数的生成周期。
步骤S102:根据活跃用户数的生成周期和累计用户数的生成周期,确定统计周期。
其中,统计周期同时为活跃用户数的生成周期和累计用户数的生成周期的正整数倍。
示例性的,活跃用户数的生成周期为10秒,累计用户数的生成周期为20秒,则统计周期同时为10秒和20秒的正整数倍,如20秒、40秒等。
步骤S103:每当时间到达统计周期时,分别对活跃用户数和累计用户数进行数量统计。
示例性的,活跃用户数的生成周期为10秒,累计用户数的生成周期为20秒,统计周期为30秒:
假设从2016/9/27 0:00:00开始,当到达2016/9/27 0:00:10时,生成活跃用户数,假设生成的活跃用户数为10,当到达2016/9/27 0:00:20时,生成活跃用户数,假设生成的活跃用户数为18,同时生成累计用户数,假设累计用户为15,当到达2016/9/27 0:00:30时,生成活跃用户数,假设生成的活跃用户数为20,以此类推。由于统计周期为20秒,因此,在2016/9/27 0:00:20时,对累计用户数和活跃用户数进行统计,得到活跃用户数为18,累计用户数为15。
步骤S104:将活跃用户数和累计用户数的数量统计结果在同一图表中进行展示,以便对活跃用户数和累计用户数进行对比分析。
从上述示例可知,在2016/9/27 0:00:20,可获得活跃用户数和累计用户数,如此便可将活跃用户数和累计用户数基于时间维度在同一图表中进行展示,以对同一时刻的活跃用户数和累计用户数进行对比分析。请参阅图2,示出了将活跃用户数与累计用户数的数量统计结果基于时间维度在同一图表中展示的一示意图。
本发明实施例提供的用户数处理方法,能够分别获取活跃用户数的生成周期和累计用户数的生成周期,并根据活跃用户数的生成周期和累计用户数的生成周期确定统计周期,从而使得,每当时间到达统计周期时,能够分别对活跃用户数和累计用户数进行数量统计,进而将活跃用户数和累计用户数的数量统计结果在同一图表中进行展示。由此可见,本发明实施例提供的用户数处理方法能够实现将活跃用户数和累计用户数的数量统计结果在同一图表中进行展示,这有助于对活跃用户数和累计用户数进行对比分析,即,能更好地实现对数据的分析和处理。
在上述实施例提供的用户数处理方法中,根据活跃用户数的生成周期和累计用户数的生成周期,确定统计周期的一种可能的实现过程可以包括:如果活跃用户数的生成周期和累计用户数的生成周期中,数值较大的生成周期为数值较小的生成周期的正整数倍,则将数值较大的生成周期确定为统计周期;如果活跃用户数的生成周期和累计用户数的生成周期中,数值较大的生成周期不是数值较小的生成周期的正整数倍,则计算活跃户数的生成周期和累计用户数的生成周期的最小公倍数,将最小公倍数所对应的数值,确定为统计周期。
示例性的,活跃用户数的生成周期为5秒,即每隔5秒生成一次活跃用户数,累计用户数的生成周期为10秒,即每隔10秒生成一次累计用户数,而累计用户数的生成周期10秒为活跃用户数的生成周期5秒的2倍,此时,将较大的生成周期10秒确定为统计周期,即,每隔10秒统计一次活跃用户数和累计用户数。
示例性的,活跃用户数的生成周期为5秒,即每隔5秒生成一次活跃用户数,累计用户数的生成周期为9秒,即每隔9秒生成一次累计用户数,而累计用户数的生成周期9秒不为活跃用户数的生成周期5秒的正整数倍,活跃用户数的生成周期5秒也不为累计用户数的生成周期9秒的整数倍,此时,计算累计用户数的生成周期9秒与活跃用户数的生成周期5秒的最小公倍数,由于9与5的最小公倍数为45,因此,将45秒确定为统计周期,即每隔45秒统计一次活跃用户数和累计用户数。
在一种可能的实现方式中,对于上述实施例提供的用户数处理方法,在分别对活跃用户数和累计用户数进行数量统计之前,还可以包括:
分别获取活跃用户数和累计用户数所对应的用户的用户标识信息;获取布隆过滤器,其中,布隆过滤器中存储有用户标识信息;判断用户标识信息是否存在于布隆过滤器中;如果判断用户标识信息不存在于布隆过滤器中,则将用户对应的用户标识信息添加进布隆过滤器中,以便对活跃用户数和累计用户数进行统计。
布隆过滤器(Bloom Filter)是1970年由布隆提出的,它是一个很长的二进制向量和一系列随机映射函数,布隆过滤器可以用于检索一个元素是否在一个集合中,它的优点是空间效率和查询时间都远远超过一般的算法。
需要说明的是,由于活跃用户数和累计用户数基于布隆过滤器中存储的用户标识信息统计,因此,为了避免重复统计,在每次获取到用户标识信息时,需要判断该获取的用户标识信息是否存在与布隆过滤器中,如果获取的用户标识信息存在于布隆过滤器中,则表明在此之前获取过该用户标识信息,为了避免后续出现数据重复统计的情况,则不再存储该用户标识信息,反之,如果获取的用户标识不存在于布隆过滤器中,则表明该用户标识信息为新的用户标识信息,在此之前未获取过该用户标识信息,此时,需要将该用户标识信息添加进布隆过滤器中,以便进行后续的数据统计。
在另一种可能的实现方式中,对于上述实施例提供的用户数处理方法,在分别对活跃用户数和累计用户数进行数量统计之前,还可以包括:
分别获取活跃用户数和累计用户数所对应的用户的用户标识信息;获取布隆过滤器,布隆过滤器中存储有用户标识信息;判断用户标识信息是否存在于布隆过滤器中;如果判断用户标识信息不存在于布隆过滤器中,则获取数据分析维度,其中,数据分析维度可以包括用户对应的地域信息和频道信息中的至少一个;将数据分析维度和用户标识信息都添加进布隆过滤器中,以便根据数据分析维度对活跃用户数和累计用户数进行统计。
对于上述实施例提供的用户数处理方法,在将活跃用户数和累计用户数的数量统计结果在同一图表中进行展示之前,方法还包括:
获取按照活跃用户数的生成周期生成的活跃用户数日志;获取按照累计用户数的生成周期生成的累计用户数日志;按照数据分析维度分别对活跃用户数日志和累计用户数日志进行聚合;按照统计周期对聚合后的活跃用户数和聚合后的累计用户数进行关联,并将关联结果进行存储。
在一种可能的实现方式中,活跃用户数日志中可以包括在活跃用户数的生成周期内记录的一个数据分析维度或多个数据分析维度的用户信息,同样的,累计用户数日志可以包括在累计用户数的生成周期内记录的一个数据分析维度或多个数据分析维度的用户信息,在获得活跃用户数日志和累计用户数日志之后,可基于某一个数据分析维度或综合某几个数据分析维度对活跃用户数日志和累计用户数日志进行聚合,从而得到基于某一个维度或综合某几个维度聚合后的活跃用户数和累计用户数,进而按统计周期对聚合后的活跃用户数和累计用户数进行关联,例如,基于统计周期将活跃用户数和累计用户数记录至一关联日志中并存储,具体的,关联日志的内容可如下表1所示:
表1
在上述本发明实施例的基础上,现列举一具体实例进行说明:
假设活跃用户数的生成周期为10秒,则每隔10秒生成一次活跃用户数如,生成的活跃用户数如表2所示:
表2
假设累计用户数的生成周期为60秒,即每隔60秒生成一次累计用户数,生成的累计用户数如表3所示:
表3
假设统计周期为60秒,即每隔60秒统计一个活跃用户数和累计用户数,从上表2和3可以得出,在第一个统计周期即2016/9/27 0:01:00,活跃用户数为26,累计用户数为10,在第二个统计周期即2016/9/27 0:02:00,活跃用户数为26,活跃用户数为30,累计用户数为15,在第三个统计周期即2016/9/27 0:03:00,活跃用户数为35,累计用户数为18,在第四个统计周期即2016/9/27 0:04:00,活跃用户数为32,累计用户数为25,在第五个统计周期即2016/9/27 0:05:00,活跃用户数为50,累计用户数为26,即,如表4所示,由此可得到在相同时间统计的活跃用户数和累计用户数。通过在相同时间统计的活跃用户数和累计用户数可实现将活跃用户数和累计用户数的数量统计结果在同一图表中进行展示。
表4
与上述方法相对应,本发明实施例还提供了一种用户数处理装置,请参阅图3,示出了该用户数出来装置的结构示意图,可以包括:第一获取单元301、确定单元302、统计单元303和展示单元304。其中:
第一获取单元301,用于分别获取活跃用户数的生成周期和累计用户数的生成周期。
确定单元302,用于根据获取的所述活跃用户数的生成周期和所述累计用户数的生成周期,确定统计周期,所述统计周期同时为所述活跃用户数的生成周期和所述累计用户数的生成周期的正整数倍。
统计单元303,用于每当时间到达所述统计周期时,分别对所述活跃用户数和所述累计用户数进行数量统计。
展示单元304,用于将所述活跃用户数和所述累计用户数的数量统计结果在同一图表中进行展示,以便对所述活跃用户数和所述累计用户数进行对比分析。
本发明实施例提供的用户数处理装置,能够分别获取活跃用户数的生成周期和累计用户数的生成周期,并根据活跃用户数的生成周期和累计用户数的生成周期确定统计周期,从而使得,每当时间到达统计周期时,能够分别对活跃用户数和累计用户数进行数量统计,进而将活跃用户数和累计用户数的数量统计结果在同一图表中进行展示。由此可见,本发明实施例提供的用户数处理装置能够实现将活跃用户数和累计用户数的数量统计结果在同一图表中进行展示,这有助于对活跃用户数和累计用户数进行对比分析,即,能更好地实现对数据的分析和处理。
上述实施例提供的用户数处理装置中,确定单元包括:第一确定子模块、计算子模块和第二确定子模块。其中:
第一确定子模块,用于当所述活跃用户数的生成周期和所述累计用户数的生成周期中,数值较大的生成周期为数值较小的生成周期的正整数倍时,将所述数值较大的生成周期确定为所述统计周期。
计算子模块,用于当所述活跃用户数的生成周期和所述累计用户数的生成周期中,数值较大的生成周期不是数值较小的生成周期的正整数倍时,计算所述活跃户数的生成周期和所述累计用户数的生成周期的最小公倍数。
第二确定子模块,用于将所述最小公倍数所对应的数值,确定为所述统计周期。
上述实施例提供的用户数处理装置还可以包括:第二获取单元、第三获取单元、第一判断单元和第一信息添加单元。其中:
第二获取单元,用于分别获取所述活跃用户数和所述累计用户数所对应的用户的用户标识信息。
第三获取单元,用于获取布隆过滤器,所述布隆过滤器中存储有用户标识信息。
第一判断单元,用于判断所述用户标识信息是否存在于所述布隆过滤器中。
第一信息添加单元,用于当所述判断单元判断出所述用户标识信息不存在于所述布隆过滤器中时,将所述用户对应的用户标识信息添加进所述布隆过滤器中,以便对所述活跃用户数和所述累计用户数进行统计。
上述实施例提供的用户数处理装置还可以包括:第四获取单元、第五获取单元、第二判断单元、第六获取单元和第二信息添加单元。其中:
第四获取单元,用于分别获取所述活跃用户数和所述累计用户数所对应的用户的用户标识信息。
第五获取单元,用于获取布隆过滤器,所述布隆过滤器中存储有用户标识信息。
第二判断单元,用于判断所述用户标识信息是否存在于所述布隆过滤器中。
第六获取单元,用于当所述用户标识信息不存在于所述布隆过滤器中时,获取数据分析维度,所述数据分析维度包括所述用户对应的地域信息和频道信息中的至少一个。
第二信息添加单元,用于将所述数据分析维度和所述用户标识信息都添加进所述布隆过滤器中,以便根据所述数据分析维度对所述活跃用户数和所述累计用户数进行统计。
上述实施例提供的用户数处理装置还可以包括:第七获取单元、第八获取单元、聚合单元、关联单元和存储单元。其中:
第七获取单元,用于获取按照所述活跃用户数的生成周期生成的活跃用户数日志;
第八获取单元,用于获取按照所述累计用户数的生成周期生成的累计用户数日志;
聚合单元,用于按照所述数据分析维度分别对所述活跃用户数日志和所述累计用户数日志进行聚合;
关联单元,用于按照所述统计周期对聚合后的活跃用户数和聚合后的累计用户数进行关联;
存储单元,用于将所述关联单元的关联结果进行存储。
所述用户数处理装置包括处理器和存储器,上述第一获取单元、确定单元、统计单元和展示单元等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来将活跃用户数与累计用户数基于相同的时间进行关联。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flashRAM),存储器包括至少一个存储芯片。
本发明实施例提供的用户数处理装置,能够分别获取活跃用户数的生成周期和累计用户数的生成周期,并根据活跃用户数的生成周期和累计用户数的生成周期确定统计周期,从而使得,每当时间到达统计周期时,能够分别对活跃用户数和累计用户数进行数量统计,进而将活跃用户数和累计用户数的数量统计结果在同一图表中进行展示。由此可见,本发明实施例提供的用户数处理装置能够实现将活跃用户数和累计用户数的数量统计结果在同一图表中进行展示,这有助于对活跃用户数和累计用户数进行对比分析,即,能更好地实现对数据的分析和处理。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序代码:分别获取活跃用户数的生成周期和累计用户数的生成周期;根据所述活跃用户数的生成周期和所述累计用户数的生成周期,确定统计周期,所述统计周期同时为所述活跃用户数的生成周期和所述累计用户数的生成周期的正整数倍;每当时间到达所述统计周期时,分别对所述活跃用户数和所述累计用户数进行数量统计;将所述活跃用户数和所述累计用户数的数量统计结果在同一图表中进行展示,以便对所述活跃用户数和所述累计用户数进行对比分析。
本领域内的技术人员应明白,本申请的实施例可提供为方法、***、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flashRAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的单元或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (10)

1.一种用户数处理方法,其特征在于,包括:
分别获取活跃用户数的生成周期和累计用户数的生成周期;
根据所述活跃用户数的生成周期和所述累计用户数的生成周期,确定统计周期,所述统计周期同时为所述活跃用户数的生成周期和所述累计用户数的生成周期的正整数倍;
每当时间到达所述统计周期时,分别对所述活跃用户数和所述累计用户数进行数量统计;
将所述活跃用户数和所述累计用户数的数量统计结果在同一图表中进行展示,以便对所述活跃用户数和所述累计用户数进行对比分析。
2.根据权利要求1所述的方法,其特征在于,根据所述活跃用户数的生成周期和所述累计用户数的生成周期,确定统计周期,包括:
如果所述活跃用户数的生成周期和所述累计用户数的生成周期中,数值较大的生成周期为数值较小的生成周期的正整数倍,则将所述数值较大的生成周期确定为所述统计周期;
如果所述活跃用户数的生成周期和所述累计用户数的生成周期中,数值较大的生成周期不是数值较小的生成周期的正整数倍,则计算所述活跃户数的生成周期和所述累计用户数的生成周期的最小公倍数,将所述最小公倍数所对应的数值,确定为所述统计周期。
3.根据权利要求1所述的方法,其特征在于,在分别对所述活跃用户数和所述累计用户数进行数量统计之前,所述方法还包括:
分别获取所述活跃用户数和所述累计用户数所对应的用户的用户标识信息;
获取布隆过滤器,所述布隆过滤器中存储有用户标识信息;
判断所述用户标识信息是否存在于所述布隆过滤器中;
如果判断所述用户标识信息不存在于所述布隆过滤器中,则将所述用户对应的用户标识信息添加进所述布隆过滤器中,以便对所述活跃用户数和所述累计用户数进行统计。
4.根据权利要求1所述的方法,其特征在于,在分别对所述活跃用户数和所述累计用户数进行数量统计之前,所述方法还包括:
分别获取所述活跃用户数和所述累计用户数所对应的用户的用户标识信息;
获取布隆过滤器,所述布隆过滤器中存储有用户标识信息;
判断所述用户标识信息是否存在于所述布隆过滤器中;
如果判断所述用户标识信息不存在于所述布隆过滤器中,则获取数据分析维度,所述数据分析维度包括所述用户对应的地域信息和/或频道信息;
将所述数据分析维度和所述用户标识信息都添加进所述布隆过滤器中,以便根据所述数据分析维度对所述活跃用户数和所述累计用户数进行统计。
5.根据权利要求4所述的方法,其特征在于,在将所述活跃用户数和所述累计用户数的数量统计结果在同一图表中进行展示之前,所述方法还包括:
获取按照所述活跃用户数的生成周期生成的活跃用户数日志;
获取按照所述累计用户数的生成周期生成的累计用户数日志;
按照所述数据分析维度分别对所述活跃用户数日志和所述累计用户数日志进行聚合;
按照所述统计周期对聚合后的活跃用户数和聚合后的累计用户数进行关联,并将关联结果进行存储。
6.一种用户数处理装置,其特征在于,包括:第一获取单元、确定单元、统计单元和展示单元;
所述第一获取单元,用于分别获取活跃用户数的生成周期和累计用户数的生成周期;
所述确定单元,用于根据获取的所述活跃用户数的生成周期和所述累计用户数的生成周期,确定统计周期,所述统计周期同时为所述活跃用户数的生成周期和所述累计用户数的生成周期的正整数倍;
所述统计单元,用于每当时间到达所述统计周期时,分别对所述活跃用户数和所述累计用户数进行数量统计;
所述展示单元,用于将所述活跃用户数和所述累计用户数的数量统计结果在同一图表中进行展示,以便对所述活跃用户数和所述累计用户数进行对比分析。
7.根据权利要求6所述的用户数处理装置,其特征在于,所述确定单元包括:第一确定子模块、计算子模块和第二确定子模块;
所述第一确定子模块,用于当所述活跃用户数的生成周期和所述累计用户数的生成周期中,数值较大的生成周期为数值较小的生成周期的正整数倍时,将所述数值较大的生成周期确定为所述统计周期;
所述计算子模块,用于当所述活跃用户数的生成周期和所述累计用户数的生成周期中,数值较大的生成周期不是数值较小的生成周期的正整数倍时,计算所述活跃户数的生成周期和所述累计用户数的生成周期的最小公倍数;
所述第二确定子模块,用于将所述最小公倍数所对应的数值,确定为所述统计周期。
8.根据权利要求6所述的用户数处理装置,其特征在于,所述用户数处理装置还包括:第二获取单元、第三获取单元、第一判断单元和第一信息添加单元;
所述第二获取单元,用于分别获取所述活跃用户数和所述累计用户数所对应的用户的用户标识信息;
所述第三获取单元,用于获取布隆过滤器,所述布隆过滤器中存储有用户标识信息;
所述第一判断单元,用于判断所述用户标识信息是否存在于所述布隆过滤器中;
所述第一信息添加单元,用于当所述判断单元判断出所述用户标识信息不存在于所述布隆过滤器中时,将所述用户对应的用户标识信息添加进所述布隆过滤器中,以便对所述活跃用户数和所述累计用户数进行统计。
9.根据权利要求6所述的用户数处理装置,其特征在于,所述用户数处理装置还包括:第四获取单元、第五获取单元、第二判断单元、第六获取单元和第二信息添加单元;
所述第四获取单元,用于分别获取所述活跃用户数和所述累计用户数所对应的用户的用户标识信息;
所述第五获取单元,用于获取布隆过滤器,所述布隆过滤器中存储有用户标识信息;
所述第二判断单元,用于判断所述用户标识信息是否存在于所述布隆过滤器中;
所述第六获取单元,用于当所述用户标识信息不存在于所述布隆过滤器中时,获取数据分析维度,所述数据分析维度包括所述用户对应的地域信息和/或频道信息;
所述第二信息添加单元,用于将所述数据分析维度和所述用户标识信息都添加进所述布隆过滤器中,以便根据所述数据分析维度对所述活跃用户数和所述累计用户数进行统计。
10.根据权利要求9所述的用户数处理装置,其特征在于,所述用户数处理装置还包括:第七获取单元、第八获取单元、聚合单元、关联单元和存储单元;
所述第七获取单元,用于获取按照所述活跃用户数的生成周期生成的活跃用户数日志;
所述第八获取单元,用于获取按照所述累计用户数的生成周期生成的累计用户数日志;
所述聚合单元,用于按照所述数据分析维度分别对所述活跃用户数日志和所述累计用户数日志进行聚合;
所述关联单元,用于按照所述统计周期对聚合后的活跃用户数和聚合后的累计用户数进行关联;
所述存储单元,用于将所述关联单元的关联结果进行存储。
CN201710081406.0A 2017-02-15 2017-02-15 一种用户数处理方法及装置 Pending CN108427687A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710081406.0A CN108427687A (zh) 2017-02-15 2017-02-15 一种用户数处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710081406.0A CN108427687A (zh) 2017-02-15 2017-02-15 一种用户数处理方法及装置

Publications (1)

Publication Number Publication Date
CN108427687A true CN108427687A (zh) 2018-08-21

Family

ID=63155420

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710081406.0A Pending CN108427687A (zh) 2017-02-15 2017-02-15 一种用户数处理方法及装置

Country Status (1)

Country Link
CN (1) CN108427687A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130185429A1 (en) * 2012-01-13 2013-07-18 Alibaba Group Holding Limited Processing Store Visiting Data
CN103500177A (zh) * 2013-09-06 2014-01-08 乐视致新电子科技(天津)有限公司 一种用户激活数的统计方法及装置
CN105279143A (zh) * 2015-10-17 2016-01-27 浙江宇视科技有限公司 一种周期性报表***
CN105718455A (zh) * 2014-12-01 2016-06-29 阿里巴巴集团控股有限公司 一种数据查询方法及装置
CN105824952A (zh) * 2016-03-28 2016-08-03 努比亚技术有限公司 一种处理数据的装置和方法
US20160267501A1 (en) * 2013-11-20 2016-09-15 Beijing Gridsum Technology Co., Ltd. Calculation method and apparatus for user retention ratio

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130185429A1 (en) * 2012-01-13 2013-07-18 Alibaba Group Holding Limited Processing Store Visiting Data
CN103500177A (zh) * 2013-09-06 2014-01-08 乐视致新电子科技(天津)有限公司 一种用户激活数的统计方法及装置
US20160267501A1 (en) * 2013-11-20 2016-09-15 Beijing Gridsum Technology Co., Ltd. Calculation method and apparatus for user retention ratio
CN105718455A (zh) * 2014-12-01 2016-06-29 阿里巴巴集团控股有限公司 一种数据查询方法及装置
CN105279143A (zh) * 2015-10-17 2016-01-27 浙江宇视科技有限公司 一种周期性报表***
CN105824952A (zh) * 2016-03-28 2016-08-03 努比亚技术有限公司 一种处理数据的装置和方法

Similar Documents

Publication Publication Date Title
CN107391526A (zh) 一种基于区块链的数据处理方法及设备
CN109542789B (zh) 一种代码覆盖率统计方法及装置
CN106557486A (zh) 一种数据的存储方法和装置
CN105718565A (zh) 数据仓库模型的构建方法和构建装置
CN108255886B (zh) 推荐***的评估方法及装置
CN105824855B (zh) 一种对数据对象筛选分类的方法、装置以及电子设备
CN106919370A (zh) 一种对象属性值的获取方法及装置
CN107705199A (zh) 特征计算代码的生成方法和装置
CN109561052A (zh) 网站异常流量的检测方法及装置
CN109657427A (zh) 权限控制的方法及装置
CN109948680A (zh) 病历数据的分类方法及***
CN110175184A (zh) 一种数据维度的下钻方法、***及电子设备
CN110457182A (zh) 一种负载均衡集群实例运行指标监控***
CN110348578A (zh) 一种安全事件情景推演构建方法、***、设备及介质
CN106815100A (zh) 接口测试方法及装置
CN110222936A (zh) 一种业务场景的根因定位方法、***及电子设备
CN109558543A (zh) 一种样本采样方法、样本采样装置、服务器和存储介质
CN109726068A (zh) 一种数据检测方法及装置
CN109947853A (zh) 一种业务活动变更感知方法、***及服务器
CN109033995A (zh) 识别用户行为的方法、装置及智能可穿戴设备
CN110032750A (zh) 一种模型构建、数据生命周期预测方法、装置及设备
CN104090932B (zh) 一种内容推荐方法及装置
CN108932525A (zh) 一种行为预测方法及装置
CN107391533A (zh) 生成图形数据库查询结果的方法及装置
CN116628600A (zh) 基于随机森林的不平衡数据采样方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 100080 No. 401, 4th Floor, Haitai Building, 229 North Fourth Ring Road, Haidian District, Beijing

Applicant after: BEIJING GRIDSUM TECHNOLOGY Co.,Ltd.

Address before: 100086 Cuigong Hotel, 76 Zhichun Road, Shuangyushu District, Haidian District, Beijing

Applicant before: BEIJING GRIDSUM TECHNOLOGY Co.,Ltd.

RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180821