CN103902636A - 基于过滤聚类法推送信息的方法和服务器 - Google Patents

基于过滤聚类法推送信息的方法和服务器 Download PDF

Info

Publication number
CN103902636A
CN103902636A CN201210590440.8A CN201210590440A CN103902636A CN 103902636 A CN103902636 A CN 103902636A CN 201210590440 A CN201210590440 A CN 201210590440A CN 103902636 A CN103902636 A CN 103902636A
Authority
CN
China
Prior art keywords
user
grid
unit
block
hot
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201210590440.8A
Other languages
English (en)
Other versions
CN103902636B (zh
Inventor
史晓峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201210590440.8A priority Critical patent/CN103902636B/zh
Publication of CN103902636A publication Critical patent/CN103902636A/zh
Application granted granted Critical
Publication of CN103902636B publication Critical patent/CN103902636B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明实施例公开了一种基于过滤聚类法推送信息的方法和服务器,所述方法包括:将地理范围划分为多于一个区块;获取每个区块中用户的数量;根据所述获取的用户的数量,过滤用户数量小于预置数值的区块;根据过滤后保留的区块,将彼此相邻的区块形成的一个连续的区域作为热区存储,所述存储的热区的数量至少多于一个;为所述热区内的用户提供服务。本发明实施例提供的技术方案,将地理区域划分为区块,根据区块中的用户数量对区块进行过滤和聚合,形成热区,为热区中当前的用户提供更丰富的服务,本方案过滤聚合操作计算简单,处理时间短,过滤用户数量少的区块,聚合用户数量大的区块,形成热区,减少运算的开销,大大降低了维护成本。

Description

基于过滤聚类法推送信息的方法和服务器
技术领域
本发明涉及通信技术领域,具体涉及以一种基于过滤聚类法推送信息的方法和服务器。
背景技术
基于密度的空间成群应用以噪声(DBSCAN,Density-Based SpatialClustering of Applications with Noise)是一个有代表性的基于密度的聚类算法。与划分和层次聚类方法不同,它将簇定义为密度相连的点的最大集合,能够把具有足够高密度的区域划分为簇,并可在噪声的空间数据库中发现任意形状的聚类。它采用迭代查找的方法,通过迭代地查找所有直接密度可达的对象,找到各个所有密度可达的对象,具体算法简单描述如下:
(1)检测数据库中尚未检查过的对象p,如果p为被处理(归为某个簇或者标记为噪声),则检查其邻域,若包含的对象数不小于,建立新簇C,将中所有点加入C;
(2)对C中所有尚未被处理的对象q,检查其邻域,若中至少包含个对象,则将中未归入任何一个簇的对象加入C;
(3)重复步骤(2),继续检查C中未处理的对象,知道没有新的对象加入当前簇C;
(4)重复步骤(1)~(3),直到所有对象都归入了某个簇或标记为噪声。
但是,目前的DBSCAN聚类算法,面对海量数据处理,例如8亿的QQ用户群,计算的时间长,无法满足业务需求,计算过程复杂度大,维护成本巨大。
发明内容
本发明实施例提供了一种基于过滤聚类法推送信息的方法和服务器,可以减少服务器运算的开销,大大降低了维护成本。
本发明实施例提供了一种基于过滤聚类法推送信息的方法,所述方法包括:
将地理范围划分为多于一个区块;
获取每个区块中用户的数量;
根据所述获取的用户的数量,过滤用户数量小于预置数值的区块;
根据过滤后保留的区块,将彼此相邻的区块形成的一个连续的区域作为热区存储,所述存储的热区的数量至少多于一个;
向所述热区内的用户进行信息推送。
本发明实施例还提供了一种服务器,所述服务器包括:
切分单元,获取数量单元,过滤单元,聚合单元,和服务单元;
所述切分单元,用于将地理范围划分为多于一个区块;
所述获取数量单元,用于获取每个区块中用户的数量;
所述过滤单元,用于根据所述获取的用户的数量,过滤用户数量小于预置数值的区块;
所述聚合单元,用于根据过滤后保留的区块,将彼此相邻的区块形成的一个连续的区域作为热区存储,所述存储的热区的数量至少多于一个;
所述服务单元,用于向所述热区内的用户进行信息推送。
从以上技术方案可以看出,本发明实施例具有以下优点:将地理区域划分为区块,根据区块中的用户数量对区块进行过滤和聚合,形成热区,为热区中当前的用户提供更丰富的服务,与现有技术采用DBSCAN聚类算法相比,本方案过滤聚合操作计算简单,处理时间短,过滤用户数量少的区块,聚合用户数量大的区块,形成热区,减少运算的开销,大大降低了维护成本。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例一提供的一种基于过滤聚类法推送信息的方法流程示意简图;
图2a是本发明实施例二提供的一种基于过滤聚类法推送信息的方法流程示意简图一部分;
图2b是本发明实施例二提供的一种基于过滤聚类法推送信息的方法流程示意简图另一部分;
图3是本发明实施例三提供的一种服务器示意简图;
图4是所述服务器中服务单元的一种具体示意简图;
图5是所述服务器中获取数量单元的一种具体示意简图;
图6是所述服务器中第三获取单元的一种具体示意简图;
图7是所述服务器中获取数量单元的另一种具体示意简图。
具体实施方式
本发明实施例提供的技术方案的目的是发现用户聚集密度大的地区(简称“热区”),当用户出现在该热区后,推送服务器可以为热区中的用户推送信息。便于用户能够及时快速的获取到该热区中的信息。
本发明实施例提供的一种基于过滤聚类法推送信息的方法和服务器,通过将地理范围划分为多个区块,获取每个区块中用户的数量,根据区块中用户的数量,对区块进行过滤,即将区块中用户数量少于预置数值的区块过滤,在服务器中仅存储用户数量单元预置数值的区块的信息,服务器可以进一步对该类存储的区块进行聚合,即将彼此相邻的区块形成的一个连续的区域作为热区存储,存储的热区的数量至少多于一个。有相邻关系的热区之间形成的一个连续的区域中用户数量是非常惊人的,可以为该热区内的用户集中提供更多更丰富的服务,使得服务器的服务效率最大化。当服务器判断出用户在该热区内,就可以通过用户的账号为用户提供服务器。使得用户及时了解该热区中的咨询。
下面结合实施例对本发明实施例提供的技术方案做具体说明。
实施例一
本发明实施例提供一种基于过滤聚类法推送信息的方法。如图1所示,该方法包括:
步骤S100,将地理范围划分为多于一个区块。地理范围可以指具有一定面积的区域,例如可以将深圳的总面积作为一个地理范围,也可以将中国的总面积作为一个地理范围;地理范围作为一个平面可以划分为面积更小的区块,这里所说的区块,可以是规则紧密排列的图形,例如:大小相同的圆形,正方形,长方形,六边形,五边形等等;或者区块也可以是大小不同的、不规则的图形拼接无缝的形成的地理范围。为了便于机器实现,本发明是实施例中可以以正方形的栅格作为所说的“区块”来实现。每一区块也代表一定面积的地理范围。
服务器根据定位操作获取到用户的位置,用户的具***置落入具体的栅格内,便于服务器根据用户历史位置信息统计出相关数据,作为后续判断为热区的参考信息。
步骤S102,获取每个区块中用户的数量。其中,服务器获取每个区块中用户的数量的方法,可以是根据用户历史定位信息,判断在该区块中的用户的总的数量。具体可以是统计在每个区块内有多少个用户历史定位点,作为每个区块中的用户数量。用户历史定位信息具体可以是指用户在某一时间段去过的地方,具体可以是在该时间段内用户留下了3个定位信息,这三个定位信息可以分别位于不同的栅格内,如栅格1,栅格3,和栅格4。
步骤S104,根据获取的用户数量,过滤用户数量小于预置数值的区块。假设预置数值具体可以是1000,服务器统计出在每个区块内,用户历史定位的点的数量。每个区块内的点的数量越多,表示该区块覆盖的区域内用户的数量越多,更方便为数量巨大的用户进行服务。相反,区块内的点的数量越少,表示该区块覆盖的区域内用户的数量越少,不便于为用户提供更丰富的服务,即服务成本太高。
步骤S106,根据过滤后保留的区块,将彼此相邻的区块形成的一个连续的区域作为热区存储,所述存储的热区的数量至少多于一个。例如,保留的栅格为栅格1至栅格8,其中,栅格1是独立的,不与其他栅格相邻,则栅格1可以单独作为一个热区,栅格2与栅格3相邻,栅格3与栅格4相邻,栅格4与栅格5相邻,则栅格2、3、4、5形成一个连续的区域,则这个连续的区域可以称为一个热区;假设栅格6、7、8也是彼此相邻形成一个联系的区域,即热区。热区的范围越大,包含的区块的数量越多,则该热区中用户的数量就越大。例如:深圳地区的华强北地区,或者东门等,都是包含有多个区块形成的连续的区域,即热区。当热区越大,则服务器在适当的范围内效率可以实现最大化。
可选的,服务器也可以将单个的区块作为热区,即获取的点的数量大于预置的数值的区块都可以单独作为热区。
步骤S108,向所述热区内的用户进行信息推送。
其中,步骤S108为热区内的用户提供服务,具体可以包括如下:步骤S108a~S108c。
步骤S108a,获取到用户当前位置和用户的账号。当某个用户进入到一个热区中后,服务器获取到用户的当前位置以及用户账号后,可以为该用户提供相应的信息服务,例如用户使用QQ定位服务,服务器可以获取到该QQ用户的账号和当前位置。服务器会进行后续为该热区中的用户提供信息服务。
步骤S108b,判断用户当前位置是否在热区中,如果是,执行步骤S108c,通知推送服务器根据用户的账号为用户提供服务。例如:为用户提供当前该热区内发生的重点事件的消息,以及为用户提供便利的其它信息服务。如果不在热区中,则结束流程。
本发明实施例提供的一种基于过滤聚类法推送信息的方法,通过将地理范围划分为多个区块,获取每个区块中用户的数量,根据区块中用户的数量,对区块进行过滤,即将区块中用户数量少于预置数值的区块过滤,在服务器中仅存储用户数量单元预置数值的区块的信息,服务器可以进一步对该类存储的区块进行聚合,即将彼此相邻的区块形成的一个连续的区域作为热区存储,存储的热区的数量至少多于一个。有相邻关系的热区之间形成的一个连续的区域中用户数量是非常惊人的,可以为该热区内的用户集中提供更多更丰富的服务,使得服务器的服务效率最大化。当服务器判断出用户在该热区内,就可以通过用户的账号为用户提供服务器。使得用户及时了解该热区中的咨询。
本发明实施例提供的技术方案,将地理区域划分为区块,根据区块中的用户数量对区块进行过滤和聚合,形成热区,为热区中当前的用户提供更丰富的服务,与现有技术采用DBSCAN聚类算法相比,本方案过滤聚合操作计算简单,处理时间短,过滤用户数量少的区块,聚合用户数量大的区块,形成热区,减少运算的开销,大大降低了维护成本。
实施例二
本发明实施例提供一种基于过滤聚类法推送信息的方法。如图2a和图2b所示,该方法包括:
步骤S200,服务器将地理范围划分为栅格。其中,具体可以是将一定地理区域表面(例如:深圳市的二维平面)划分为大小均匀紧密相邻的网格阵列,栅格的最小单位可以正方形也可以是长方形,可以根据具体的设计要求而确定,在本发明实施例重点以栅格最小单位是正方形的情况进行说明。
服务器根据定位操作获取到用户的位置,用户的具***置落入具体的栅格内,便于服务器根据用户历史位置信息统计出相关数据,作为后续判断为热区的参考信息。
步骤S201,服务器获取用户历史定位信息。其中,用户历史定位信息具体可以是指用户在某一时间段去过的地方,具体可以是在该时间段内用户留下了3个定位信息,这三个定位信息可以分别位于不同的栅格内,如栅格1,栅格3,和栅格4。
步骤S202,服务器获取各栅格的中心点位置。其中,栅格的中心点位置是指正方形内切圆的圆心,该圆心到该圆心所在的栅格边的距离是已知的,即内切圆的半径是已知的。获取各栅格中心点位置的用途是为了计算用户历史定位信息与当前中心点位置之间的距离,当用户历史定位信息与当前中心点位置之间的距离,小于已知的内切圆的半径,则表示该用户定位信息在该栅格内,可以理解为栅格内的一个点。
步骤S203,服务器计算栅格中心点位置与用户历史定位之间的距离。
步骤S204,服务器根据计算出的距离,获取到该用户历史定位所归属的栅格,将用户历史定位作为一个栅格内的点。如果计算出用户历史定位A点与栅格1中心距离小于栅格1内切圆半径,则可以判断A点在栅格1内,同理,用户历史定位点B点,C点可以用相同的方法判断出位于栅格3,栅格4内。
步骤S205,服务器对每个栅格内点进行统计,从而获取每个区块中用户的数量。
需要说明的是,上述步骤S201至S205是实现服务器获取每个区块中用户的数量的一种优选的方法,本发明实施例还提供另外一种优选的获取每个区块中用户的数量,具体包括:获取用户历史定位信息;获取所述用户历史定位信息所归属的栅格;统计每个栅格中用户的数量。通过操作也可以获取到每个栅格中用户的数量,设计人员可以根据具体的情况,选择其中一种。
步骤S206,服务器判断每个栅格中统计的点的数量是否大于预置的数值。
步骤S207,服务器存储点的数量大于预置的数值的栅格信息,将此类栅格定义为热格子。对于点的数量低于预置的数值的栅格,服务可以不做处理。
例如,假设预置的数值具体可以是1000,服务器统计出在每个栅格内,用户历史定位的点的数量。每个栅格内的点的数量越多,表示该栅格覆盖的区域内用户的数量越多,更方便为数量巨大的用户进行服务。相反,栅格内的点的数量越少,表示该栅格覆盖的区域内用户的数量越少,不便于为用户提供更丰富的服务,即服务成本太高。
步骤S208,服务器将存储的栅格中,彼此相邻的栅格形成的一个连续的区域作为热区存储。热区的范围越大,包含的栅格的数量越多,则该热区中用户的数量就越大。例如:深圳地区的华强北地区,或者东门等,都是包含有多个栅格形成的连续的区域,即热区。当热区越大,则服务器在适当的范围内效率可以实现最大化。
可选的,服务器也可以将记录的栅格作为热区,即获取的点的数量大于预置的数值的栅格作为热区。
如下步骤可以同时参考图2b,包括:
步骤S209,服务器根据存储的热区,获取用户的账号。用户的账号可以但不限于QQ号码。服务器具体可以是根据用户在该热区中的历史信息,获取到用户的账号,如用户历史定位信息,或者在该热区中有使用账号的历史。
步骤S210,定位服务器获取到用户的当前位置和用户账号。其中,步骤S210一种具体的实现方式可以是,接收定位服务器发送的用户当前位置和用户账号。但本发明实施例不限制于当前的举例。
可选的,步骤S210中获取用户当前位置和用户账号,具体也可以包括:通过用户使用的通过即时通讯工具,获取用户当前位置和即时通讯工具的账号。
步骤S211,定位服务器将获取的当前位置和用户账号发送给推送服务器。通过用户使用的通过即时通讯工具,获取用户当前位置和即时通讯工具的账号。该即时通讯工具可以是QQ等,用户使用手机QQ定位服务,服务器获取到用户通过QQ定位服务器的当前位置,将用户的QQ账号作为用户身份特征,便于后续通过该QQ账号为用户推送信息。
步骤S212,推送服务器接收到用户当前位置和用户账号后,根据服务器中存储的热区和用户的账号,判断该当前位置是否在热区,判断该用户账号是否是热区中出现的账号。
步骤S213,当判断出用户当前位置在热区后,向所述热区内的用户进行信息推送。例如:为用户提供当前该区域内发生的重点事件的消息,以及为用户提供便利的其它服务。
本发明实施例提供的一种基于过滤聚类法推送信息的方法,通过将地理范围划分为多个区块,获取每个区块中用户的数量,根据区块中用户的数量,对区块进行过滤,即将区块中用户数量少于预置数值的区块过滤,在服务器中仅存储用户数量单元预置数值的区块的信息,服务器可以进一步对该类存储的区块进行聚合,即将彼此相邻的区块形成的一个连续的区域作为热区存储,存储的热区的数量至少多于一个。有相邻关系的热区之间形成的一个连续的区域中用户数量是非常惊人的,可以为该热区内的用户集中提供更多更丰富的服务,使得服务器的服务效率最大化。当服务器判断出用户在该热区内,就可以通过用户的账号为用户提供服务器。使得用户及时了解该热区中的咨询。
本发明实施例提供的技术方案,将地理区域划分为区块,根据区块中的用户数量对区块进行过滤和聚合,形成热区,为热区中当前的用户提供更丰富的服务,与现有技术采用DBSCAN聚类算法相比,本方案过滤聚合操作计算简单,处理时间短,过滤用户数量少的区块,聚合用户数量大的区块,形成热区,减少运算的开销,大大降低了维护成本。
实施例三
本发明实施例提供一种服务器,如图3所示,该服务器包括:切分单元300,获取数量单元302,过滤单元304,聚合单元306,和服务单元308;
切分单元300,用于将地理范围划分为多于一个区块。地理范围作为一个平面可以划分为面积更小的区块,这里所说的区块,可以是规则紧密排列的图形,例如:大小相同的圆形,正方形,长方形,六边形,五边形等等;或者区块也可以是大小不同的、不规则的图形拼接无缝的形成的地理范围。为了便于机器实现,本发明是实施例中可以以正方形的栅格作为所说的“区块”来实现。每一区块也代表一定面积的地理范围。
服务器根据定位操作获取到用户的位置,用户的具***置落入具体的栅格内,便于服务器根据用户历史位置信息统计出相关数据,作为后续判断为热区的参考信息。
所述获取数量单元302,用于获取每个区块中用户的数量。其中,服务器获取每个区块中用户的数量的方法,可以是根据用户历史定位信息,判断在该区块中的用户的总的数量。具体可以是统计在每个区块内有多少个用户历史定位点,作为每个区块中的用户数量。用户历史定位信息具体可以是指用户在某一时间段去过的地方,具体可以是在该时间段内用户留下了3个定位信息,这三个定位信息可以分别位于不同的栅格内,如栅格1,栅格3,和栅格4。
所述过滤单元304,用于根据所述获取的用户的数量,过滤用户数量小于预置数值的区块。假设预置数值具体可以是1000,服务器统计出在每个区块内,用户历史定位的点的数量。每个区块内的点的数量越多,表示该区块覆盖的区域内用户的数量越多,更方便为数量巨大的用户进行服务。相反,区块内的点的数量越少,表示该区块覆盖的区域内用户的数量越少,不便于为用户提供更丰富的服务,即服务成本太高。
所述聚合单元306,用于根据过滤后保留的区块,将彼此相邻的区块形成的一个连续的区域作为热区存储,所述存储的热区的数量至少多于一个。热区的范围越大,包含的区块的数量越多,则该热区中用户的数量就越大。例如:深圳地区的华强北地区,或者东门等,都是包含有多个区块形成的连续的区域,即热区。当热区越大,则服务器在适当的范围内效率可以实现最大化。
可选的,服务器也可以将单个的区块作为热区,即获取的点的数量大于预置的数值的区块都可以单独作为热区。
所述服务单元308,用于向所述热区内的用户进行信息推送。
优选的,所述服务单元308,如图4,包括:获取用户信息单元401,判断单元402,和通知单元403;
所述获取用户信息单元401,用于获取用户当前位置和用户账号.当某个用户进入到一个热区中后,服务器获取到用户的当前位置以及用户账号后,可以为该用户提供相应的信息服务,例如用户使用QQ定位服务,服务器可以获取到该QQ用户的账号和当前位置。服务器会进行后续为该热区中的用户提供信息服务。
所述判断单元402,用于判断用户当前位置是否在热区中;
所述通知单元403,用于若所述用户当前位置是在热区中,通知推送服务器根据用户的账号为用户提供服务。例如:为用户提供当前该热区内发生的重点事件的消息,以及为用户提供便利的其它信息服务。如果不在热区中,则结束流程。
优选的,所述获取用户信息单元401,具体用于通过用户使用的通过即时通讯工具,获取用户当前位置和即时通讯工具的账号。
优选的,所述获取用户信息单元401,具体包括接收单元,
所述接收单元,用于接收定位服务器发送的用户当前位置和用户账号。
优选的,所述切分单元300,具体用于将地理范围划分为多于一个的栅格,所述栅格为正方形。
优选的,所述获取数量单元302,如图5所示,具体包括:第一获取单元501,第二获取单元502,计算单元503,第三获取单元504,和第一统计单元505;
所述第一获取单元501,用于获取用户历史定位信息;
所述第二获取单元502,用于获取各栅格的中心点位置;
所述计算单元503,用于计算栅格中心点位置与用户历史定位之间的距离;
所述第三获取单元504,用于根据计算出的距离,获取所述用户历史定位所归属的栅格,将用户历史定位作为一个栅格内的点;
所述统计单元505,用于对每个栅格内点进行统计,从而获取每个区块中用户的数量。
优选的,所述第三获取单元504,如图6所示,具体包括:第一判断单元601,和获知单元602;
所述第一判断单元601,用于判断所述计算出的距离是否小于所述栅格内切圆的半径;
所述获知单元602,用于若计算出的距离小于所述栅格内切圆的半径,获知该用户历史定位归属所述栅格,将所示用户历史定位作为一个栅格内的点。
优选的,所述获取数量单元302,如图7所示,具体包括:第四获取单元701,第五获取单元702,和第二统计单元703;
所述第四获取单元601,用于获取用户历史定位信息;
所述第五获取单元602,用于获取所述用户历史定位信息所归属的栅格;
所述第二统计单元603,用于统计每个栅格中用户的数量。
本发明实施例提供的一种服务器,服务器通过将地理范围划分为多个区块,获取每个区块中用户的数量,根据区块中用户的数量,对区块进行过滤,即将区块中用户数量少于预置数值的区块过滤,在服务器中仅存储用户数量单元预置数值的区块的信息,服务器可以进一步对该类存储的区块进行聚合,即将彼此相邻的区块形成的一个连续的区域作为热区存储,存储的热区的数量至少多于一个。有相邻关系的热区之间形成的一个连续的区域中用户数量是非常惊人的,可以为该热区内的用户集中提供更多更丰富的服务,使得服务器的服务效率最大化。当服务器判断出用户在该热区内,就可以通过用户的账号为用户提供服务器。使得用户及时了解该热区中的咨询。
本发明实施例提供的技术方案,将地理区域划分为区块,根据区块中的用户数量对区块进行过滤和聚合,形成热区,为热区中当前的用户提供更丰富的服务,与现有技术采用DBSCAN聚类算法相比,本方案过滤聚合操作计算简单,处理时间短,过滤用户数量少的区块,聚合用户数量大的区块,形成热区,减少运算的开销,大大降低了维护成本。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上对本发明所提供的一种基于过滤聚类法推送信息的方法和服务器进行了详细介绍,对于本领域的一般技术人员,依据本发明实施例的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (16)

1.一种基于过滤聚类法推送信息的方法,其特征在于,所述方法包括:
将地理范围划分为多于一个区块;
获取每个区块中用户的数量;
根据所述获取的用户的数量,过滤用户数量小于预置数值的区块;
根据过滤后保留的区块,将彼此相邻的区块形成的一个连续的区域作为热区存储,所述存储的热区的数量至少多于一个;
向所述热区内的用户进行信息推送。
2.根据权利要求1所述的方法,其特征在于,所述为所述热区内的用户提供服务,包括:
获取用户当前位置和用户账号;
判断用户当前位置是否在热区中,如果是,通知推送服务器根据用户的账号为用户提供服务。
3.根据权利要求2所述的方法,其特征在于,所述获取用户当前位置和用户账号,包括:
通过用户使用的通过即时通讯工具,获取用户当前位置和即时通讯工具的账号。
4.根据权利要求2所述的方法,其特征在于,所述获取用户当前位置和用户账号,包括:
接收定位服务器发送的用户当前位置和用户账号。
5.根据权利要求1所述的方法,其特征在于,所述将地理范围划分为多于一个区块,包括:
将地理范围划分为多于一个的栅格,所述栅格为正方形。
6.根据权利要求5所述的方法,其特征在于,所述获取每个区块中用户的数量,具体包括:
获取用户历史定位信息;
获取各栅格的中心点位置;
计算栅格中心点位置与用户历史定位之间的距离;
根据计算出的距离,获取所述用户历史定位所归属的栅格,将用户历史定位作为一个栅格内的点;
对每个栅格内点进行统计,从而获取每个区块中用户的数量。
7.根据权利要求6所述的方法,其特征在于,所述根据计算出的距离,获取所述用户历史定位所归属的栅格,将用户历史定位作为一个栅格内的点,包括:
判断所述计算出的距离是否小于所述栅格内切圆的半径,如果是,则获知该用户历史定位归属所述栅格,将所示用户历史定位作为一个栅格内的点。
8.根据权利要求5所述的方法,其特征在于,所述获取每个区块中用户的数量,包括:
获取用户历史定位信息;
获取所述用户历史定位信息所归属的栅格;
统计每个栅格中用户的数量。
9.一种服务器,其特征在于,所述服务器包括:
切分单元,获取数量单元,过滤单元,聚合单元,和服务单元;
所述切分单元,用于将地理范围划分为多于一个区块;
所述获取数量单元,用于获取每个区块中用户的数量;
所述过滤单元,用于根据所述获取的用户的数量,过滤用户数量小于预置数值的区块;
所述聚合单元,用于根据过滤后保留的区块,将彼此相邻的区块形成的一个连续的区域作为热区存储,所述存储的热区的数量至少多于一个;
所述服务单元,用于向所述热区内的用户进行信息推送。
10.根据权利要求9所述服务器,其特征在于,所述服务单元包括:获取用户信息单元,判断单元,和通知单元;
所述获取用户信息单元,用于获取用户当前位置和用户账号;
所述判断单元,用于判断用户当前位置是否在热区中;
所述通知单元,用于若所述用户当前位置是在热区中,通知推送服务器根据用户的账号为用户提供服务。
11.根据权利要求10所述服务器,其特征在于,所述获取用户信息单元,具体用于通过用户使用的通过即时通讯工具,获取用户当前位置和即时通讯工具的账号。
12.根据权利要求10所述服务器,其特征在于,所述获取用户信息单元,具体包括接收单元,
所述接收单元,用于接收定位服务器发送的用户当前位置和用户账号。
13.根据权利要求9所述服务器,其特征在于,所述切分单元,具体用于将地理范围划分为多于一个的栅格,所述栅格为正方形。
14.根据权利要求13所述服务器,其特征在于,所述获取数量单元,具体包括:第一获取单元,第二获取单元,计算单元,第三获取单元,和第一统计单元;
所述第一获取单元,用于获取用户历史定位信息;
所述第二获取单元,用于获取各栅格的中心点位置;
所述计算单元,用于计算栅格中心点位置与用户历史定位之间的距离;
所述第三获取单元,用于根据计算出的距离,获取所述用户历史定位所归属的栅格,将用户历史定位作为一个栅格内的点;
所述统计单元,用于对每个栅格内点进行统计,从而获取每个区块中用户的数量。
15.根据权利要求14所述服务器,其特征在于,所述第三获取单元具体包括:第一判断单元,和获知单元;
所述第一判断单元,用于判断所述计算出的距离是否小于所述栅格内切圆的半径;
所述获知单元,用于若计算出的距离小于所述栅格内切圆的半径,获知该用户历史定位归属所述栅格,将所示用户历史定位作为一个栅格内的点。
16.根据权利要求13所述服务器,其特征在于,所述获取数量单元,具体包括:第四获取单元,第五获取单元,和第二统计单元;
所述第四获取单元,用于获取用户历史定位信息;
所述第五获取单元,用于获取所述用户历史定位信息所归属的栅格;
所述第二统计单元,用于统计每个栅格中用户的数量。
CN201210590440.8A 2012-12-30 2012-12-30 基于过滤聚类法推送信息的方法和服务器 Active CN103902636B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210590440.8A CN103902636B (zh) 2012-12-30 2012-12-30 基于过滤聚类法推送信息的方法和服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210590440.8A CN103902636B (zh) 2012-12-30 2012-12-30 基于过滤聚类法推送信息的方法和服务器

Publications (2)

Publication Number Publication Date
CN103902636A true CN103902636A (zh) 2014-07-02
CN103902636B CN103902636B (zh) 2018-04-27

Family

ID=50993963

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210590440.8A Active CN103902636B (zh) 2012-12-30 2012-12-30 基于过滤聚类法推送信息的方法和服务器

Country Status (1)

Country Link
CN (1) CN103902636B (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106161553A (zh) * 2015-04-16 2016-11-23 腾讯科技(深圳)有限公司 社区应用信息推送方法和***
CN106204118A (zh) * 2016-06-30 2016-12-07 百度在线网络技术(北京)有限公司 一种用于商圈发现的方法与装置
CN107548027A (zh) * 2017-07-28 2018-01-05 ***通信集团江苏有限公司 数据推送方法、装置、设备及计算机存储介质
CN107679992A (zh) * 2017-06-12 2018-02-09 平安科技(深圳)有限公司 基于保单服务的区域划分方法、***、服务器和存储介质
WO2018059315A1 (zh) * 2016-09-30 2018-04-05 阿里巴巴集团控股有限公司 基于地理位置数据的热点区域确定方法及装置
CN108241990A (zh) * 2016-12-26 2018-07-03 北京奇虎科技有限公司 移动广告投放配置、控制方法及其相应的装置
CN108269087A (zh) * 2018-01-12 2018-07-10 阿里巴巴集团控股有限公司 位置信息的处理方法及装置
CN108304592A (zh) * 2018-03-16 2018-07-20 江西财经大学 一种基于移动用户位置的网络服务推荐方法
WO2020043070A1 (zh) * 2018-08-31 2020-03-05 京东方科技集团股份有限公司 客流动线以及客流热区确定方法及装置
RU2745776C1 (ru) * 2018-02-07 2021-03-31 Телефонактиеболагет Лм Эрикссон (Пабл) Способы и устройства для экспонирования функциональной возможности зоны представления отчета о присутствии
CN114331548A (zh) * 2021-12-30 2022-04-12 深圳市晨北科技有限公司 消息推送方法、装置以及服务器、计算机存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004086791A1 (en) * 2003-03-24 2004-10-07 Nokia Corporation Group communication in a communication network
CN101076156A (zh) * 2007-06-22 2007-11-21 中兴通讯股份有限公司 个人手持电话***中基于位置触发广播消息的方法及***
CN101887440A (zh) * 2009-05-13 2010-11-17 财团法人资讯工业策进会 热点分析***及方法
CN102215452A (zh) * 2011-05-30 2011-10-12 宇龙计算机通信科技(深圳)有限公司 基于地理位置的信息推送方法、服务器和终端

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004086791A1 (en) * 2003-03-24 2004-10-07 Nokia Corporation Group communication in a communication network
CN101076156A (zh) * 2007-06-22 2007-11-21 中兴通讯股份有限公司 个人手持电话***中基于位置触发广播消息的方法及***
CN101887440A (zh) * 2009-05-13 2010-11-17 财团法人资讯工业策进会 热点分析***及方法
CN102215452A (zh) * 2011-05-30 2011-10-12 宇龙计算机通信科技(深圳)有限公司 基于地理位置的信息推送方法、服务器和终端

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
刘颖等: "基于停留点聚类的多粒度热点区域分析方法", 《微计算机信息》 *
苏孝强等: "基于地理位置的移动用户群组划分方法", 《计算机工程》 *

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106161553A (zh) * 2015-04-16 2016-11-23 腾讯科技(深圳)有限公司 社区应用信息推送方法和***
CN106204118A (zh) * 2016-06-30 2016-12-07 百度在线网络技术(北京)有限公司 一种用于商圈发现的方法与装置
KR20190053923A (ko) * 2016-09-30 2019-05-20 알리바바 그룹 홀딩 리미티드 지오로케이션 데이터에 기초하여 관심 지역을 결정하기 위한 방법 및 디바이스
WO2018059315A1 (zh) * 2016-09-30 2018-04-05 阿里巴巴集团控股有限公司 基于地理位置数据的热点区域确定方法及装置
US11087490B2 (en) 2016-09-30 2021-08-10 Advanced New Technologies Co., Ltd. Method and device for determining areas of interest based on geolocation data
RU2728290C1 (ru) * 2016-09-30 2020-07-29 Алибаба Груп Холдинг Лимитед Способ и устройство для определения областей интереса на основе данных геопозиционирования
US10943364B2 (en) 2016-09-30 2021-03-09 Advanced New Technologies Co., Ltd. Method and device for determining areas of interest based on geolocation data
TWI666951B (zh) * 2016-09-30 2019-07-21 香港商阿里巴巴集團服務有限公司 基於地理位置資料的熱點區域確定方法及裝置
JP2019537048A (ja) * 2016-09-30 2019-12-19 アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited 地理位置情報データに基づいて関心領域を決定する方法及び装置
AU2017335101B2 (en) * 2016-09-30 2020-01-30 Advanced New Technologies Co., Ltd. Method and device for determining areas of interest based on geolocation data
KR102220963B1 (ko) 2016-09-30 2021-03-02 어드밴스드 뉴 테크놀로지스 씨오., 엘티디. 지오로케이션 데이터에 기초하여 관심 지역을 결정하기 위한 방법 및 디바이스
CN108241990A (zh) * 2016-12-26 2018-07-03 北京奇虎科技有限公司 移动广告投放配置、控制方法及其相应的装置
CN107679992A (zh) * 2017-06-12 2018-02-09 平安科技(深圳)有限公司 基于保单服务的区域划分方法、***、服务器和存储介质
WO2018227771A1 (zh) * 2017-06-12 2018-12-20 平安科技(深圳)有限公司 基于保单服务的区域划分方法、***、服务器和存储介质
CN107548027A (zh) * 2017-07-28 2018-01-05 ***通信集团江苏有限公司 数据推送方法、装置、设备及计算机存储介质
CN108269087A (zh) * 2018-01-12 2018-07-10 阿里巴巴集团控股有限公司 位置信息的处理方法及装置
WO2019137230A1 (zh) * 2018-01-12 2019-07-18 阿里巴巴集团控股有限公司 位置信息的处理方法及装置
US11176564B2 (en) 2018-01-12 2021-11-16 Advanced New Technologies Co., Ltd. Location information processing method and apparatus
RU2745776C1 (ru) * 2018-02-07 2021-03-31 Телефонактиеболагет Лм Эрикссон (Пабл) Способы и устройства для экспонирования функциональной возможности зоны представления отчета о присутствии
US11323841B2 (en) 2018-02-07 2022-05-03 Telefonaktiebolaget Lm Ericsson (Publ) Methods and apparatuses for exposure of presence reporting area functionality
CN108304592A (zh) * 2018-03-16 2018-07-20 江西财经大学 一种基于移动用户位置的网络服务推荐方法
WO2020043070A1 (zh) * 2018-08-31 2020-03-05 京东方科技集团股份有限公司 客流动线以及客流热区确定方法及装置
US11232470B2 (en) 2018-08-31 2022-01-25 Boe Technology Group Co., Ltd. Customer flow line and customer flow hot zone determining method and apparatus
CN114331548A (zh) * 2021-12-30 2022-04-12 深圳市晨北科技有限公司 消息推送方法、装置以及服务器、计算机存储介质

Also Published As

Publication number Publication date
CN103902636B (zh) 2018-04-27

Similar Documents

Publication Publication Date Title
CN103902636A (zh) 基于过滤聚类法推送信息的方法和服务器
CN107547633B (zh) 一种用户常驻点的处理方法、装置和存储介质
Parwez et al. Big data analytics for user-activity analysis and user-anomaly detection in mobile wireless network
Cici et al. On the decomposition of cell phone activity patterns and their connection with urban ecology
EP3627884A1 (en) Method and arrangement for supporting analysis of social networks in a communication network
CN103605791A (zh) 信息推送***和信息推送方法
CN108243435B (zh) 一种lte小区场景划分中的参数优化方法及装置
EP3278580A1 (en) Method and system for a real-time counting of a number of persons in a crowd by means of aggregated data of a telecommunication network
US10397737B2 (en) Method and system for estimating a posteriori a number of persons in one or more crowds by means of aggregated data of a telecommunication network
CN109547872B (zh) 一种网络规划方法及装置
CN102890860A (zh) 一种交通小区划分方法及装置
CN103235793A (zh) 联机处理数据的方法、设备及***
CN103945238A (zh) 一种基于用户行为的社区探测方法
CN104486769A (zh) 一种价值小区的选取方法及装置
Okic et al. Analyzing different mobile applications in time and space: A city-wide scenario
CN112887910B (zh) 异常覆盖区域的确定方法、装置和计算机可读存储介质
CN117042026A (zh) 业务可视化模型构建方法、装置、设备、介质和程序产品
CN114911849A (zh) 基于复杂网络理论的移动网络流量模式挖掘方法
Zaidi et al. Differentially private occupancy monitoring from wifi access points
CN113747441A (zh) 一种基于特征降维的移动网络流量异常检测方法及***
JP2022087086A5 (zh)
Jiang et al. Characterizing on-bus WiFi passenger behaviors by approximate search and cluster analysis
CN112867110B (zh) 通信小区的效能识别方法、装置及电子设备
CN102652425B (zh) 一种大规模网络的数据采集方法和网络节点
CN102752776B (zh) 无线网络利用率的获取方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant