CN110134721B - 基于位图的数据统计方法、装置及电子设备 - Google Patents

基于位图的数据统计方法、装置及电子设备 Download PDF

Info

Publication number
CN110134721B
CN110134721B CN201910416920.4A CN201910416920A CN110134721B CN 110134721 B CN110134721 B CN 110134721B CN 201910416920 A CN201910416920 A CN 201910416920A CN 110134721 B CN110134721 B CN 110134721B
Authority
CN
China
Prior art keywords
bitmap
user terminal
attribute
attributes
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910416920.4A
Other languages
English (en)
Other versions
CN110134721A (zh
Inventor
王广裕
张岩
方政委
袁洪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Smartsteps Data Technology Co ltd
Original Assignee
Smartsteps Data Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Smartsteps Data Technology Co ltd filed Critical Smartsteps Data Technology Co ltd
Priority to CN201910416920.4A priority Critical patent/CN110134721B/zh
Publication of CN110134721A publication Critical patent/CN110134721A/zh
Application granted granted Critical
Publication of CN110134721B publication Critical patent/CN110134721B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/51Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/587Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Library & Information Science (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Remote Sensing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本申请实施例提供一种基于位图的数据统计方法、装置及电子设备,该方法包括:获取n个属性中至少一个目标属性对应的位图,根据所述至少一个目标属性对应的位图对满足所述至少一个目标属性的用户终端进行统计。由于一个用户终端仅对应一个位图中的一个比特位,所以统计过程中仅需要少量的数据计算即可实现对用户终端的统计,进而提高了统计效率。

Description

基于位图的数据统计方法、装置及电子设备
技术领域
本申请涉及基于位图的数据统计领域,具体而言,涉及一种基于位图的数据统计方法、装置及电子设备。
背景技术
现有技术中,在对用户终端的相关情况进行统计的过程中,如需统计用户终端在某个区域内的数量,一般采用的统计方法是在数据库中记录该区域内用户终端的相关信息。在需要统计的时候就使用结构化查询语言(SQL,StructuredQueryLanguage)对用户终端的数量进行统计,而由于数据库需要针对每个用户终端均存储一条信息记录,所以在统计涉及到的数据量较大时,若使用结构化查询语言时,需要进行大量的数据计算,导致统计效率较低。
发明内容
有鉴于此,本申请实施例的目的在于提供一种基于位图的数据统计方法、装置及电子设备,以改善现有技术中统计效率较低的问题。
第一方面,本申请实施例提供了一种基于位图的数据统计方法,所述方法包括:获取n个属性中至少一个目标属性对应的位图,其中,所述位图中每一个比特位对应一个用户终端,不同的属性对应的位图中相同比特位对应的用户终端相同,所述位图中的所述每一个比特位的取值用于表示与所述每一个比特位对应的一个用户终端是否具有对应的属性,n为大于或等于1的整数;根据所述至少一个目标属性对应的位图对满足所述至少一个目标属性的用户终端进行统计。
在上述实现过程中,由于一个用户终端仅对应一个位图中的一个比特位,所以,一个位图可表征多个用户终端的属性对应的相关信息,由此,在进行统计时,可以直接基于位图获得多个用户终端的相关情况,统计过程中仅需要少量的数据计算即可实现对用户终端的统计,进而提高了统计效率。
可选地,所述获取n个属性中至少一个目标属性对应的位图之前,所述方法还包括:获取多个用户终端中每个用户终端的属性以及所述每个用户终端对应的用户的属性,共获得n个属性;为n个属性中每个属性生成对应的位图并存储。
在上述实现过程中,预先生成n个属性中每个属性对应的位图并进行存储,从而在进行统计时,可直接获取到所需统计的属性对应的位图,然后基于该获取的位图对用户终端进行统计,进而可提高统计效率;并且,由于一个位图可表征多个用户终端的属性对应的相关信息,相比于现有技术中针对每个用户终端需存储一条对应的信息记录,本方案采用位图的形式进行数据的存储可有效地节省存储空间。
可选地,所述为n个属性中每个属性生成对应的位图并存储之后,所述方法还包括:确定所述n个属性中发生变化的指定属性;对所述发生变化的指定属性对应的位图进行更新。
在上述实现过程中,若n个属性中的指定属性发生了变化,则需对相应的位图进行更新,以便在进行统计时可基于更新后的位图进行统计,以此提高了统计结果的准确性。
可选地,所述用户终端的属性包括时间以及在对应时间时所述用户终端所在的位置,所述用户的属性包括用户的标识、年龄段和性别。
可选地,所述确定所述n个属性中发生变化的指定属性,包括:判断所述用户终端所在的位置对应的位置是否发生变化;若发生变化,则确定所述用户终端的位置为发生变化的指定属性。
在上述实现过程中,由于用户终端自身的属性可能不会发生变化,而随着用户终端的移动,其位置可能会发生变化,若用户终端的位置发生了变化,则其位置属性对应的位图也应该进行更新,从而若基于位置属性对应的位图对用户终端进行统计时可以获得较为准确的统计结果。
可选地,所述判断所述用户终端所在的位置否发生变化,包括:判断在预设时间段内是否能获取到所述用户终端新的位置,若否,则表示所述用户终端的位置发生变化。
在上述实现过程中,若用户终端可能由于关机或者处于无法获知其状态的模式下时,无法获得用户终端新的位置,则表明该用户终端可能已经离开原来所处的位置了,所以,很大可能用户终端的位置已经发生了变化,进而为了后续统计的准确性,还需对位置属性对应的位图进行更新。
可选地,当所述至少一个目标属性为至少两个目标属性时,所述根据所述至少一个目标属性对应的位图对满足所述至少一个目标属性的用户终端进行统计,包括:将所述至少两个目标属性对应的位图中的相同比特位进行逻辑运算,获得运算后的最终位图;根据所述最终位图对满足所述至少两个目标属性的用户终端进行统计。
在上述实现过程中,通过对位图中的相同比特位进行逻辑运算,则可获得最终位图,再根据最终位图对用户终端进行统计,从而可以减少统计过程中的计算过程,提高了统计效率。
第二方面,本申请实施例提供了一种基于位图的数据统计装置,所述装置包括:
位图获取模块,用于获取n个属性中至少一个目标属性对应的位图,其中,所述位图中每一个比特位对应一个用户终端,不同的属性对应的位图中相同比特位对应的用户终端相同,所述位图中的所述每一个比特位的取值用于表示与所述每一个比特位对应的一个用户终端是否具有对应的属性,n为大于或等于1的整数;
统计模块,用于根据所述至少一个目标属性对应的位图对满足所述至少一个目标属性的用户终端进行统计。
第三方面,本申请实施例提供一种电子设备,包括处理器以及存储器,所述存储器存储有计算机可读取指令,当所述计算机可读取指令由所述处理器执行时,运行如上述第一方面提供的所述方法中的步骤。
第四方面,本申请实施例提供一种可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时运行如上述第一方面提供的所述方法中的步骤。
本申请的其他特征和优点将在随后的说明书阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请实施例了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的一种基于位图的数据统计方法的流程图;
图2为本申请实施例提供的一种基于位图的数据统计方法中步骤S120的流程图;
图3为本申请实施例提供的一种基于位图的数据统计装置的结构框图;
图4为本申请一实施例提供的电子设备的示意图。
具体实施方式
下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
下述实施例所描述的用户终端可以是个人电脑(personal computer,PC)、平板电脑、智能手机、个人数字助理(personal digital assistant,PDA)、可穿戴设备等终端。
请参照图1,图1为本申请实施例提供的一种基于位图的数据统计方法的流程图,该方法应用于下述的电子设备,该方法包括如下步骤:
步骤S110:获取n个属性中至少一个目标属性对应的位图。
其中,位图就是指bitmap,其是用一个bit位来标记某个元素对应的value,而key即是这个元素,由于采用bit为单位来存储数据,因此可以达到节省存储空间的目的。
位图的实现原理为:假设要对0-7内的五个元素(5,7,4,3,2)进行排序,则可以利用位图达到该目的,要标识8个数,需要8bit,每个bit相当于一个标志位,可以通过标志位(0,1)去标识这个元素是否存在,例如,5为第一个元素,则在5对应的bit变为1,如下所示:
0 0 0 1 0 0 0 0
接着遍历其他的元素,按照上述方式进行标记,获得如下的位图:
0 1 0 1 1 1 1 0
按照位图的思想,在本实施例中,为了统计用户终端的一些情况,如统计在某个区域的某个时间的用户终端的数量,所以,为了方便统计,减少内存的占用,位图中的每一个比特位对应一个用户终端。
其中,上述的属性是指用户终端相关的属性,其可以包括用户终端的属性以及该用户终端对应的用户的属性,用户终端的属性可以包括时间以及在对应时间时该用户终端所在的位置,用户终端的属性还可以包括用户终端的型号等自身属性,用户的属性可以包括用户的标识(如唯一编号)、年龄段和性别等其他个人属性,如该用户的居住地等,在此不一一列举。
每个属性均对应有一个位图,当然,每个属性可单独对于一个位图,也可以是多个属性组合获得的属性对应一个位图,其中,位图中每一个比特位对应一个用户终端。在获得每个属性对应的位图之前,可以先建立用户终端与位图中比特位的位置的对应关系,如下表1所示:
表1
位图中比特位的位置索引 用户终端的标识
1 A1
2 A2
3 A4
... ...
如表1中,位图中的第一个比特位表示用户终端A1对应的位置,第二个比特位表示用户终端A2对应的位置,第三个比特位表示用户终端A3对应的位置,依此方式,可以将多个用户终端均对应到位图中的相应比特位。
由于每个属性均对应有各自的位图,所以,不同的属性对应的位图中相同比特位对应的用户终端相同,位图中的每一个比特位的取值用于表示与每一个比特位对应的一个用户终端是否具有对应的属性。为了区别各个用户终端,每个用户中的属性均不同,如下述的性别男、时间12:00、位置A等这些数据可以称为用户终端的属性。
例如,用户的属性如下表2所示:
表2
用户终端的标识 年龄段 性别
A1 20-25
A2 20-25
A3 30-35
... ... ...
用户终端的属性可以如表3所示:
表3
用户终端的标识 时间 位置
A1 12:00 A
A2 12:00 B
A3 13:00 C
... ... ...
若以用户的属性为性别为例:统计对应的用户终端,其性别为男性时对应的位图如下:
1 0 1
其性别为女性时对应的位图如下:
0 1 0
若以用户终端的属性为例,如位置A对应的位图如下:
0 0 1
或者,属性为时间+位置,如12:00在A位置对应的位图如下:
0 0 1
可以理解的,上述位图中比特位为1表示用户终端具有该位图所对应的属性,如在属性为男性对应的位图中,第一比特位和第三比特位的位置均为1,即表示用户终端A1和A3对应的用户为男性。并且,在属性为男性对应的位图与在属性为位置A对应的位图中的第一比特位均对应用户终端A1,第二比特位均对应用户终端A2,第三比特位均对应用户终端A3,如此方式,可以更加直观和便捷地统计出各个属性下的用户终端的相关情况。
按照上述方式,每个属性均有对应的位图,而为了对用户终端的相关情况进行统计,可获取n个属性中至少一个目标属性对应的位图,n为大于或等于1的整数。
需要说明的是,至少一个目标属性可以是n个属性中的一个属性或多个属性,比如,获取n个属性中的m个目标属性对应的位图,m为小于等于n的整数。作为一种示例,若用户想统计属性为男性时的用户终端的情况,此时,m为1,即从n个属性中获取一个目标属性对应的位图,若用户想统计属性为12:00在A位置时的用户终端的情况,此时m为2,即从n个属性中获取两个目标属性对应的位图。
步骤S120:根据所述至少一个目标属性对应的位图对满足所述至少一个目标属性的用户终端进行统计。
若用户想要对用户终端的相关情况进行统计时,用户可通过电子设备中的显示单元的相关显示界面输入相应的统计请求,该统计请求包括查询语句,该查询语句如“统计为男性的用户数量”,则电子设备可接收到该统计请求后,对查询语句进行语义理解,其具体的语义理解方法可采用现有技术中的方法,在此不做详细阐述。在对查询语句进行语义理解后,电子设备即知晓用户需要查询的是男性的用户的数量,则电子设备可直接获取属性为男性对应的位图,如上所示,则可统计其中比特位为1的数量,上述示例中比特位为1的数量为2,然后可将该统计结果(即男性的用户的数量为2)输出给用户,由此用户可获得对应的统计结果。
在上述实现过程中,由于位图中一个比特位对应一个用户终端,所以,一个位图可表征多个用户终端的属性对应的相关信息,由此,在进行统计时,可以直接基于位图获得多个用户终端的相关情况,进而提高了统计效率。
作为一种示例,若用户输入的查询语句中包括至少两个属性,即目标属性为至少两个,则在进行统计时,还需将至少两个目标属性对应的位图进行相关运算后,再对用户终端进行统计。所以,根据至少一个目标属性对应的位图对满足至少一个目标属性的用户终端进行统计,如图2所示,可以包括如下步骤:
步骤S121:将所述至少两个目标属性对应的位图中的相同比特位进行逻辑运算,获得运算后的最终位图。
步骤S122:根据所述最终位图对满足所述至少两个目标属性的用户终端进行统计。
其中,相同比特位是指至少两个位图中处于同一个位置处的比特位,例如,上述的性别为男性对应的位图中的第一个比特位与性别为女性对应的位图的第一个比特位为相同比特位。
逻辑运算包括有或运算、与运算。
若只获得一个目标属性对应的位图,则无需对这一个位图再进行上述的逻辑运算即可获得对应的统计结果,例如,若需统计男性的用户数量,则可获取属性为男性对应的位图,然后统计该位图中数值为1的数量,该数量即为对应的统计结果。
若用户输入的查询语句中包含有需要统计至少有两个目标属性的用户终端的相关情况,如查询语句为“统计12:00在A位置处的用户的数量”,则对其进行语义理解后,知晓其目标属性包括两个,一个目标属性为时间在12:00,另一个目标属性为位置在A位置,然后分别获取这两个目标属性对应的位图,如上述的时间为12:00对应的位图如下:
0 1 1
位置在A位置对应的位图如下:
0 0 1
然后在进行统计时,可以将这两个位图对应的相同比特位进行与运算,即获得运算后的最终位图,如下所示:
0 0 1
由此,根据该最终位图可对具有上述两个目标属性的用户终端进行统计,即最终位图表示12:00在A位置处的用户终端的情况,根据最终位图可知,12:00在A位置处的只有用户终端A1,则最终获得的统计结果即为12:00在A位置处的用户终端的数量为1。
当然,若用户输入的查询语句为“统计12:00的用户情况或在A位置处的用户情况”,此时,则需将上述两个位图中对应的相同比特位进行或运算,获得的最终位图如下:
0 1 1
由此,可根据最终位图看出,在12:00或在A位置处的用户终端有用户终端A1和用户终端A2,从而可获得对应的统计结果。
需要说明的是,上述是以两个目标属性为例进行说明的,实际应用中,可以根据用户的统计需要,获得对应个数的目标属性对应的位图,再将这些位图对应相同比特位进行逻辑运算,获得最终位图,然后根据最终位图获得对用户终端的统计结果。当然,其中的逻辑运算也不仅仅是包括上述举例说明的与运算和或运算,其也可以根据用户的统计需求进行相应的其他逻辑运算,然后获得对应的最终位图。
应理解,虽然上文仅给出了逻辑与运算以及或运算的例子,但本申请实施例并不限于此,本领域技术人员根据本文的描述,可以进行各种变形,本申请实施例并不限于此。应理解,本领域技术人员在进行其他逻辑运算时,相应地位图结构也可以进行相应调整,本文不再赘述。
在上述实现过程中,通过对位图中的相同比特位进行逻辑运算,则可获得最终位图,再根据最终位图对用户终端进行统计,从而可以减少统计过程中的计算过程,提高了统计效率。
作为一种示例,为了便于用户的查询,电子设备中还可以预先存储有上述各个属性对应的位图,即在获取n个属性中至少一个目标属性对应的位图之前,上述方法还包括:获取多个用户终端中每个用户终端的属性以及每个用户终端对应的用户的属性,共获得n个属性,为这n个属性中每个属性生成对应的位图并存储。
如上面的实施例所描述的,可以获得用户终端的多个属性以及用户终端对应的用户的属性,然后建立用户终端与位图中的比特位之间的位置索引关系,再根据各个属性生成相应的位图,这些属性可以是单一的属性对应的位图,也可以是多个属性对应的位图,如上述的属性为12:00在位置A对应的位图,该位图为两个单一属性综合后获得的属性对应的位图,即这两个属性也可称为n个属性中的其中一个目标属性,所以,根据实际应用需要,在电子设备中可以存储很多个这样的属性对应的位图,从而可以根据用户的统计需求更加快速的获取统计结果。
可以理解地,上述的n个属性均来自于用户终端对应的属性以及用户对应的属性,而用户终端的属性包括时间以及在对应时间时用户终端所在的位置等,用户的属性包括用户的标识(如唯一编号或用户终端标识)、年龄段和性别等用户个人属性。其中,用户终端所在的位置可以通过用户终端产生的信令数据获取,信令数据中包括用户某个时间点所在的基站位置,如用户终端A1在12:00所在的基站位置为基站1,当然用户终端所在的位置也可以通过对用户终端进行定位获取的,其采用的定位技术可以基于全球定位***(GlobalPositioning System,GPS)、全球导航卫星***(Global Navigation Satellite System,GLONASS),罗盘导航***(COMPASS)、伽利略定位***、准天顶卫星***(Quasi-ZenithSatellite System,QZSS)、无线保真(Wireless Fidelity,WiFi)定位技术等,或其任意组合。一个或多个上述定位***可以在本申请中互换使用。
在上述实现过程中,预先生成n个属性中每个属性对应的位图并进行存储,从而在进行统计时,可直接获取到所需统计的属性对应的位图,然后基于该获取的位图对用户终端进行统计,进而可提高统计效率;并且,由于一个位图可表征多个用户终端的属性对应的相关信息,相比于现有技术中针对每个用户终端需存储一条对应的信息记录,本方案采用位图的形式进行数据的存储可有效地节省存储空间。
作为一种示例,由于用户终端的属性可能会发生变化,例如,用户终端A1在12:00时的位置在A,但是在经过一段时间后,用户终端A1在13:00时的位置在B,则此时属性为位置A对应的位图发生了变化,所以在为n个属性中每个属性生成对应的位图并存储后,还需检测用户终端的指定属性是否发生变化,若发生变化,则需将对应的位图进行更新,以便提高后续统计结果的准确性。也就是说,在生成n个属性对应的位图并存储之后,还可以包括:确定用户终端的属性中发生变化的指定属性,然后对所述发生变化的指定属性对应的位图进行更新。
作为一种示例,可以实时检测n个属性中的指定属性是否发生改变,若发生改变,则更新对应的属性对应的位图,其中,指定属性可以包括位置、用户终端对应的用户标识、用户终端对应的用户的性别等属性,如上所述,若用户终端A1在12:00时的位置在A,此时属性为位置A对应的位图为001,但是在经过一段时间后,用户终端A1在13:00时的位置在B,此时,属性为位置A对应的位图即变为000,也就是说此时A位置处的用户终端的数量为0,该情况下是用户终端的位置发生了变化,所以,用户终端的属性为位置对应的位图也均发生了变化,而由位置和其他指定属性的组合获得的属性对应的位图也应相应进行更新。例如,属性为在位置A的男性对应的位图为001,则该属性更新后的位图应为000,也就是说,若任一指定属性发生了变化,则需对该指定属性对应的位图进行更新,其与该指定属性与其他指定属性组合生成的属性对应的位图也需进行更新。
需要说明的是,上述的指定属性中不包括时间属性,因为时间会时刻发生变化,所以,历史时间对应的位图可以保存,不用进行更新,以及历史时间与其他属性组合生成的属性对应的位图要无需进行更新,只需获取新的时刻的属性,然后生成该新的时刻对应的位图即可。
同理,若用户的指定属性也发生了变化,则发生变化的指定属性对应的位图需进行更新,用户的指定属性可以指用户的年龄段、用户对应的用户终端标识等,且与该指定属性关联的其他指定属性对应的位图也需进行更新,与该指定属性关联的其他指定属性可以理解为是与该指定属性与其他指定属性组合生成的属性,如上述的性别与位置组成生成的属性,如位置A处的男性。
在上述实现过程中,若指定属性发生了变化,则需对相应的位图进行更新,以便在进行统计时可基于更新后的位图进行统计,以此提高了统计结果的准确性。
作为一种示例,为了确定所述n个属性中发生变化的指定属性,可以判断用户终端所在的位置是否发生变化,若发生变化,则确定用户终端的位置为发生变化的指定属性。
以用户终端的信令数据为例,若检测到用户终端的信令数据发生了变化,则获取该用户终端新的信令数据,然后将该新的信令数据与历史存储的该用户终端的信令数据进行比较,若发现其位置未发生变化,则更新对应的时间即可,如历史存储的用户终端A1的信令数据如下:
用户终端 时间 基站
A1 12:00 基站1
若接收到用户终端A1的新的信令数据如下:
用户终端 时间 基站
A1 13:00 基站1
此时,用户终端A1的位置未发生变化,其是时间发生了变化,则在内存中更新对应的时间数据,然后生成新的时刻对应的位图。需要说明的是,上述的历史存储的信令数据与新的信令数据均可以存储在电子设备的存储器中,若为了减少存储器的内存的占用,也可以在获得新的信令数据后,将原始的历史信令数据进行删除。
另外,为了统计基站的用户流量情况,在用户终端的信令数据发生变化时,还可以生成对应的基站流量,如若用户终端的位置发生了变化,则生成两条基站流量:
1.新基站标识,用户终端标识,流入标识,发生信令时间;
2.原基站标识,用户终端标识,流出标识,发生信令时间。
在上述实现过程中,由于用户终端自身的属性可能不会发生变化,而随着用户终端的移动,其位置可能会发生变化,若用户终端的位置发生了变化,则其位置属性对应的位图也应该进行更新,从而若基于位置属性对应的位图对用户终端进行统计时可以获得较为准确的统计结果。
若用户终端可能由于关机或者处于无法获知其状态的模式下时,无法获得用户终端的位置或者用户终端的位置一直未改变,此时该用户终端可能已经离开原来所处的位置了,所以,还可以判断在预设时间段内是否能获取到所述用户终端新的位置,若否,则表示该用户终端的位置发生变化,即若在预设时间段内用户终端未产生新的信令数据,表示该用户终端可能已处于关机状态或者处于飞行模式下,则此时,此时自动生成1条基站流量如下:
原基站标识,用户终端标识,流出标识,发生信令时间。
这些基站流量可以用作为更新用户终端的属性对应的位图的参考数据,然后基于这些位图可以统计某个基站的用户流量情况,然后在特定的时间点将更新后获得的位图进行复制后存储在特定的存储空间,以便于后续可以基于历史时间进行相关数据的统计。
其中,用户终端新的位置是指与用户终端在预设时间段之前所在的位置不一致的位置,预设时间段可以根据实际需求进行设置,如一个小时或两个小时等,在实际应用中,可以将预设时间段设置得更长一些,此处以预设时间段为一个小时为例进行说明。例如,若在一个小时内若未获得用户终端新的位置,可以理解为在一个小时内可以获取到用户终端的位置,但是其位置未发生变化,即无法获得用户终端新的位置,或者在这一个小时内根本无法获得用户的位置,进而也就无法获得该用户终端新的位置,则表明此时用户终端的位置可能有误或者可能用户终端已经离开原始位置了,所以可以对该属性为位置对应的位图进行更新。例如,上述的位置A对应的位图为001,若此时无法接收到用户终端A1的新的位置了,则将位置A对应的位图更新为000,表示用户终端A1已经不在位置A处了,由此可及时对相应的位图进行更新,提高了后续统计的准确性。
在上述实现过程中,若用户终端可能由于关机或者处于无法获知其状态的模式下时,无法获得用户终端新的位置,则表明该用户终端可能已经离开原来所处的位置了,所以,很大可能用户终端的位置已经发生了变化,进而为了后续统计的准确性,还需对位置属性对应的位图进行更新。
应理解,前文结合图1至图2描述了本申请实施例的基于位图的数据统计方法,上述基于位图的数据统计方法仅是示例性的,本领域技术人员根据上文的描述,可以进行各种变形,这样的修改也在本申请的保护范围内。
请参照图3,图3为本申请实施例提供的一种基于位图的数据统计装置200的结构框图,该装置可以运行于下述电子设备上的模块、程序段或代码。应理解,该基于位图的数据统计装置200与上述图1方法实施例对应,能够执行图1方法实施例涉及的各个步骤,该基于位图的数据统计装置200具体的功能可以参见上文中的描述,为避免重复,此处适当省略详细描述。可选地,所述装置包括:
位图获取模块210,用于获取n个属性中至少一个目标属性对应的位图,其中,所述位图中每一个比特位对应一个用户终端,不同的属性对应的位图中相同比特位对应的用户终端相同,所述位图中的所述每一个比特位的取值用于表示与所述每一个比特位对应的一个用户终端是否具有对应的属性,n为大于或等于1的整数;
统计模块220,用于根据所述至少一个目标属性对应的位图对满足所述至少一个目标属性的用户终端进行统计。
可选地,所述装置还包括:
位图生成模块,用于获取多个用户终端中每个用户终端的属性以及所述每个用户终端对应的用户的属性,共获得n个属性;为n个属性中每个属性生成对应的位图并存储。
可选地,所述装置还包括:
位图更新模块,用于确定所述n个属性中发生变化的指定属性;对所述发生变化的指定属性对应的位图进行更新。
可选地,所述用户终端的属性包括时间以及在对应时间时所述用户终端所在的位置,所述用户的属性包括所述用户的标识、年龄段和性别。
可选地,所述位图更新模块,还用于判断所述用户终端所在的位置是否发生变化;若发生变化,则确定所述用户终端的位置为发生变化的指定属性。
可选地,所述位图更新模块,还用于判断在预设时间段内是否能获取到所述用户终端新的位置,若否,则表示所述用户终端的位置发生变化。
可选地,当所述至少一个目标属性为至少两个目标属性时,所述统计模块220,具体用于将所述至少两个目标属性对应的位图中的相同比特位进行逻辑运算,获得运算后的最终位图;根据所述最终位图对满足所述至少两个目标属性的用户终端进行统计。
请参照图4,图4为本申请一实施例提供的电子设备100的示意图。如图4所示,该实施例的电子设备100包括:处理器110、存储器120以及存储在所述存储器120中并可在所述处理器110上运行的计算机程序130。所述处理器110执行所述计算机程序130时实现上述各个基于位图的数据统计方法实施例中的步骤,例如图1所示的步骤110至120。或者,所述处理器110执行所述计算机程序130时实现上述各装置实施例中各模块/单元的功能,例如图3所示模块210至220的功能。
示例性的,所述计算机程序130可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器120中,并由所述处理器110执行,以完成本申请。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序130在所述电子设备100中的执行过程。例如,所述计算机程序130可以被分割成位图获取模块210和统计模块220,各模块具体功能如下:
位图获取模块210,用于获取n个属性中至少一个目标属性对应的位图,其中,所述位图中每一个比特位对应一个用户终端,不同的属性对应的位图中相同比特位对应的用户终端相同,所述位图中的所述每一个比特位的取值用于表示与所述每一个比特位对应的一个用户终端是否具有对应的属性,n为大于或等于1的整数;
统计模块220,用于根据所述至少一个目标属性对应的位图对满足所述至少一个目标属性的用户终端进行统计。
所述电子设备100可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述电子设备100可包括,但不仅限于,处理器110、存储器120。本领域技术人员可以理解,图4仅仅是电子设备100的示例,并不构成对电子设备100的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述电子设备还可以包括输入输出设备、网络接入设备、总线、显示单元等。
所称处理器110可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器120可以是所述电子设备100的内部存储单元,例如电子设备100的硬盘或内存。所述存储器120也可以是所述电子设备100的外部存储设备,例如所述电子设备100上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(SecureDigital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器120还可以既包括所述电子设备100的内部存储单元也包括外部存储设备。所述存储器120用于存储所述计算机程序以及所述电子设备所需的其他程序和数据。所述存储器120还可以用于暂时地存储已经输出或者将要输出的数据。
本申请实施例提供一种可读存储介质,所述计算机程序被处理器执行时,执行如图1所示方法实施例中电子设备所执行的方法过程。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置的具体工作过程,可以参考前述方法中的对应过程,在此不再过多赘述。
综上所述,本申请实施例提供一种基于位图的数据统计方法、装置及电子设备,该方法中通过从n个属性中获取至少一个属性对应的位图,然后基于该位图对满足该至少一个属性的用户终端进行统计,由于一个用户终端仅对应一个位图中的一个比特位,所以,一个位图可表征多个用户终端的属性对应的相关信息,由此,在进行统计时,可以直接基于位图获得多个用户终端的相关情况,统计过程中仅需要少量的数据计算即可实现对用户终端的统计,进而提高了统计效率。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

Claims (10)

1.一种基于位图的数据统计方法,其特征在于,所述方法包括:
获取n个属性中至少一个目标属性对应的位图,其中,所述位图中每一个比特位对应一个用户终端,不同的属性对应的位图中相同比特位对应的用户终端相同,所述位图中的所述每一个比特位的取值用于表示与所述每一个比特位对应的一个用户终端是否具有对应的属性,n为大于或等于1的整数;
根据所述至少一个目标属性对应的位图对满足所述至少一个目标属性的用户终端进行统计;
所述方法还包括:
若用户终端产生的信令数据发生变化时,生成对应的基站流量;
根据所述基站流量更新用户终端的属性对应的位图。
2.根据权利要求1所述的方法,其特征在于,所述获取n个属性中至少一个目标属性对应的位图之前,所述方法还包括:
获取多个用户终端中每个用户终端的属性以及所述每个用户终端对应的用户的属性,共获得n个属性;
为n个属性中每个属性生成对应的位图并存储。
3.根据权利要求2所述的方法,其特征在于,所述为n个属性中每个属性生成对应的位图并存储之后,所述方法还包括:
确定所述n个属性中发生变化的指定属性;
对所述发生变化的指定属性对应的位图进行更新。
4.根据权利要求3所述的方法,其特征在于,所述用户终端的属性包括时间以及在对应时间时所述用户终端所在的位置,所述用户的属性包括所述用户的标识、年龄段和性别。
5.根据权利要求4所述的方法,其特征在于,所述确定所述n个属性中发生变化的指定属性,包括:
判断所述用户终端所在的位置是否发生变化;
若发生变化,则确定所述用户终端的位置为发生变化的指定属性。
6.根据权利要求5所述的方法,其特征在于,所述判断所述用户终端所在的位置是否发生变化,包括:
判断在预设时间段内是否能获取到所述用户终端新的位置,若否,则表示所述用户终端的位置发生变化。
7.根据权利要求1所述的方法,其特征在于,当所述至少一个目标属性为至少两个目标属性时,所述根据所述至少一个目标属性对应的位图对满足所述至少一个目标属性的用户终端进行统计,包括:
将所述至少两个目标属性对应的位图中的相同比特位进行逻辑运算,获得运算后的最终位图;
根据所述最终位图对满足所述至少两个目标属性的用户终端进行统计。
8.一种基于位图的数据统计装置,其特征在于,所述装置包括:
位图获取模块,用于获取n个属性中至少一个目标属性对应的位图,其中,所述位图中每一个比特位对应一个用户终端,不同的属性对应的位图中相同比特位对应的用户终端相同,所述位图中的所述每一个比特位的取值用于表示与所述每一个比特位对应的一个用户终端是否具有对应的属性,n为大于或等于1的整数;
统计模块,用于根据所述至少一个目标属性对应的位图对满足所述至少一个目标属性的用户终端进行统计;
所述装置还包括:
位图更新模块,用于若用户终端产生的信令数据发生变化时,生成对应的基站流量;根据所述基站流量更新用户终端的属性对应的位图。
9.一种电子设备,其特征在于,包括处理器以及存储器,所述存储器存储有计算机可读取指令,当所述计算机可读取指令由所述处理器执行时,运行如权利要求1-7任一所述方法中的步骤。
10.一种可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时运行如权利要求1-7任一所述方法中的步骤。
CN201910416920.4A 2019-05-17 2019-05-17 基于位图的数据统计方法、装置及电子设备 Active CN110134721B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910416920.4A CN110134721B (zh) 2019-05-17 2019-05-17 基于位图的数据统计方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910416920.4A CN110134721B (zh) 2019-05-17 2019-05-17 基于位图的数据统计方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN110134721A CN110134721A (zh) 2019-08-16
CN110134721B true CN110134721B (zh) 2021-05-28

Family

ID=67571329

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910416920.4A Active CN110134721B (zh) 2019-05-17 2019-05-17 基于位图的数据统计方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN110134721B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111489167A (zh) * 2020-04-17 2020-08-04 支付宝(杭州)信息技术有限公司 业务请求的风险识别方法、装置及处理设备
CN112650887B (zh) * 2020-12-22 2022-02-18 广州锦行网络科技有限公司 一种图数据库时间属性的快速查询方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1502073A (zh) * 2000-12-18 2004-06-02 ���˹���Ѷ��� 用文本和图形区分位置和对测量的解释
CN101330451A (zh) * 2007-06-20 2008-12-24 华为技术有限公司 数据包的转发处理方法、节点与分组核心装置
CN103188296A (zh) * 2011-12-29 2013-07-03 北京网康科技有限公司 一种网络字节缓存的实现方法及其设备
CN105991272A (zh) * 2015-02-13 2016-10-05 中兴通讯股份有限公司 数据传输方法及装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9471631B2 (en) * 2012-09-28 2016-10-18 Oracle International Corporation Creating and using data that indicates misestimates of actual costs
US10122380B2 (en) * 2015-11-16 2018-11-06 International Business Machines Corporation Compression of javascript object notation data using structure information
CN105930366A (zh) * 2016-04-13 2016-09-07 郑州悉知信息科技股份有限公司 一种统计方法及装置
CN106535129B (zh) * 2016-11-22 2019-10-18 腾云天宇科技(北京)有限公司 一种统计移动设备数量的方法、装置和计算设备
CN107622121B (zh) * 2017-09-25 2020-06-23 北京邮电大学 一种基于位图数据结构的数据分析方法及装置
CN108415952B (zh) * 2018-02-02 2020-10-16 北京腾云天下科技有限公司 用户数据存储方法、标签计算方法及计算设备
CN108509592B (zh) * 2018-03-30 2022-11-29 贵阳朗玛信息技术股份有限公司 基于Redis的数据存储方法、读取方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1502073A (zh) * 2000-12-18 2004-06-02 ���˹���Ѷ��� 用文本和图形区分位置和对测量的解释
CN101330451A (zh) * 2007-06-20 2008-12-24 华为技术有限公司 数据包的转发处理方法、节点与分组核心装置
CN103188296A (zh) * 2011-12-29 2013-07-03 北京网康科技有限公司 一种网络字节缓存的实现方法及其设备
CN105991272A (zh) * 2015-02-13 2016-10-05 中兴通讯股份有限公司 数据传输方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"Secure Multiparty Computation of Chi-Square Test Statistics and Contingency Coefficients";S. Hong 等;《2017 ieee 3rd international conference on big data security on cloud (bigdatasecurity)》;20170528;53-56 *
基于灰度直方图窗口扫描分类的FGS图像编码;李勇 等;《吉林大学学报(信息科学版)》;20090331;117-122 *

Also Published As

Publication number Publication date
CN110134721A (zh) 2019-08-16

Similar Documents

Publication Publication Date Title
CN108733681B (zh) 信息处理方法及装置
WO2020147488A1 (zh) 异常群体识别方法及装置
CN107690637B (zh) 使用大表语料库连接语义相关的数据
CN108491388B (zh) 数据集获取方法、分类方法、装置、设备及存储介质
CN110705214A (zh) 一种自动编码方法及装置
WO2019024496A1 (zh) 企业推荐方法及应用服务器
CN108090086B (zh) 分页查询方法及装置
CN112148843B (zh) 文本处理方法、装置、终端设备和存储介质
CN110134721B (zh) 基于位图的数据统计方法、装置及电子设备
US20230205755A1 (en) Methods and systems for improved search for data loss prevention
CN110888866A (zh) 数据扩充方法、装置、数据处理设备及存储介质
WO2019119635A1 (zh) 种子用户拓展方法、电子设备及计算机可读存储介质
US20220215054A1 (en) Merging Point-of-Interest Datasets for Mapping Systems
EP3332334B1 (en) Efficient location-based entity record conflation
CN111367956A (zh) 数据统计方法及装置
CN110674383B (zh) 舆情查询方法、装置及设备
CN106651408B (zh) 一种数据分析方法及装置
CN107038051B (zh) 一种bios配置项推荐方法及装置
CN111241103B (zh) 数据存储方法、数据查询方法及相关装置
CN114579580A (zh) 存储数据的方法、查询数据的方法和装置
CN112907257A (zh) 风险阈值确定方法、异常检测方法、装置和电子设备
CN112836472A (zh) 一种地址批注方法、装置、设备及存储介质
CN117114142B (zh) 基于ai的数据规则表达式生成方法、装置、设备及介质
CN112733939A (zh) 相似度特征向量的构建方法、装置、电子设备及存储介质
CN109241208B (zh) 地址定位、地址监测、信息处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant