CN108460102A - 社交网络数据查询方法、装置、计算机设备和存储介质 - Google Patents

社交网络数据查询方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN108460102A
CN108460102A CN201810111975.XA CN201810111975A CN108460102A CN 108460102 A CN108460102 A CN 108460102A CN 201810111975 A CN201810111975 A CN 201810111975A CN 108460102 A CN108460102 A CN 108460102A
Authority
CN
China
Prior art keywords
node
subtree
leaf
target
period
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810111975.XA
Other languages
English (en)
Inventor
张翀
夏东
郭澄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan Visual Great Intelligent Technology Co Ltd
Original Assignee
Hunan Visual Great Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan Visual Great Intelligent Technology Co Ltd filed Critical Hunan Visual Great Intelligent Technology Co Ltd
Priority to CN201810111975.XA priority Critical patent/CN108460102A/zh
Publication of CN108460102A publication Critical patent/CN108460102A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2246Trees, e.g. B+trees

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及一种社交网络数据查询方法、装置、计算机设备和存储介质。所述方法包括:接收查询指令,并解析查询指令,得到待查询的时间段;然后根据待查询的时间段,从树状图中查找目标子树,树状图存储有用户历史信息数据,树状图包括根节点和子树集合,根节点用于索引不同时间点,各时间点分别指向对应时间段的子树,子树集合包括各时间段的子树;遍历目标子树中的节点,当目标子树中的节点为叶子节点时,获取目标子树中叶子节点存储的用户历史信息数据,这样可以有效提高查询速度。

Description

社交网络数据查询方法、装置、计算机设备和存储介质
技术领域
本申请涉及计算机技术领域,特别是涉及一种社交网络数据查询方法、装置、计算机设备和存储介质。
背景技术
随着互联网技术的发展,社交网络也不断发展和普及,用户除了通过社交网络进行社交活动外,借助定位功能,还可以留下位置信息以及光顾商家的信息等信息。
随着社交网络应用的不断推广,大量的社交数据得以积累,可以从中分析挖掘出用户的行为规律,对于更精准有效地对目标用户进行宣传,根据用户的喜好和行为规律为其提供更好的推荐和服务等具有重要的价值。而传统的对海量的社交数据进行查询的方法,需要遍历社交网络数据库中的所有记录,查询速度慢。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高查询速度的社交网络数据查询方法、装置、计算机设备和存储介质。
一种社交网络数据查询方法,所述方法包括:
接收查询指令,并解析所述查询指令,得到待查询的时间段;
从存储有用户历史信息数据的树状图中,根据待查询的时间段,查找目标子树,所述树状图包括根节点和子树集合,所述根节点用于索引不同时间点,各时间点分别指向对应时间段的子树,所述子树集合包括各时间段的子树;
遍历目标子树中的节点,当所述目标子树中的节点为叶子节点时,获取所述目标子树中叶子节点存储的用户历史信息数据。
在一个实施例中,所述用户历史信息数据包括空间位置信息、时间段信息以及处于预设空间位置的频率,所述根据待查询的时间段,查找得到目标子树之后,包括:
当所述目标子树中的节点为非叶子节点时,获取所述目标子树中非叶子节点对应的最小外接矩形、时间段信息以及处于预设空间位置的频率;
当所述最小外接矩形对应的空间位置与预设空间位置重叠、所述非叶子节点对应的时间段信息与预设时间段重叠、且所述非叶子节点对应的处于所述预设空间位置的频率大于或等于预设频率时,获取所述非叶子节点的子节点;
当所述非叶子节点的子节点为叶子节点时,获取所述叶子节点存储的用户历史信息数据。
在一个实施例中,所述当所述目标子树中的节点为非叶子节点时,获取所述目标子树中非叶子节点对应的最小外接矩形、时间段信息以及处于预设空间位置的频率之后,包括:
当所述最小外接矩形对应的空间位置与预设空间位置重叠、所述非叶子节点对应的时间段信息与预设时间段重叠、且所述非叶子节点对应的处于所述预设空间位置的频率小于预设频率时,滤除所述非叶子节点的子节点。
在一个实施例中,所述用户历史信息数据包括空间位置信息、时间信息以及处于预设空间位置的频率,所述当所述目标子树中的节点为叶子节点时,获取所述目标子树中叶子节点存储的用户历史信息数据,包括:
获取所述目标子树中叶子节点对应的空间位置信息、时间信息以及处于预设空间位置的频率;
当所述目标子树中的节点为叶子节点、所述叶子节点对应的空间位置信息属于预设空间位置、所述叶子节点对应的时间信息属于预设时间段内的时间、且所述叶子节点对应的处于所述预设空间位置的频率大于或等于预设频率时,获取所述目标子树中叶子节点存储的用户历史信息数据。
在一个实施例中,所述用户历史信息数据包括空间位置信息、时间信息以及关键词信息,所述当所述目标子树中的节点为叶子节点时,获取所述目标子树中叶子节点存储的用户历史信息数据,包括:
获取所述目标子树中叶子节点对应的空间位置信息、时间信息以及关键词信息;
当所述目标子树中的节点为叶子节点、所述叶子节点对应的空间位置信息属于预设空间位置、所述叶子节点对应的时间信息属于预设时间段内的时间、且所述叶子节点对应的关键词信息属于预设关键词时,获取所述目标子树中叶子节点存储的用户历史信息数据。
在一个实施例中,所述用户历史信息数据包括空间位置信息、时间段信息以及关键词信息,所述根据待查询的时间段,查找得到目标子树之后,包括:
当所述目标子树中的节点为非叶子节点时,获取所述目标子树中非叶子节点对应的最小外接矩形、时间段信息以及关键词信息;
当所述最小外接矩形对应的空间位置与预设空间位置重叠、所述非叶子节点对应的时间段信息与预设时间段重叠、且所述非叶子节点对应的关键词信息与预设关键词重叠时,获取所述非叶子节点的子节点;
当所述非叶子节点的子节点为叶子节点时,获取所述叶子节点存储的用户历史信息数据。
在一个实施例中,所述用户历史信息数据包括空间位置信息以及时间段信息,所述根据待查询的时间段,查找得到目标子树之后,包括:
当所述目标子树中的节点为非叶子节点时,获取所述目标子树中非叶子节点对应的最小外接矩形以及时间段信息;
当所述最小外接矩形对应的空间位置与预设空间位置不重叠、且所述非叶子节点对应的时间段信息与预设时间段不重叠时,滤除所述非叶子节点的子节点。
一种社交网络数据查询装置,所述装置包括:
指令解析模块,用于接收查询指令,并解析所述查询指令,得到待查询的时间段;
目标子树查找模块,用于从存储有用户历史信息数据的树状图中,根据待查询的时间段,查找目标子树,所述树状图包括根节点和子树集合,所述根节点用于索引不同时间点,各时间点分别指向对应时间段的子树,所述子树集合包括各时间段的子树;
目标用户获取模块,用于遍历目标子树中的节点,当所述目标子树中的节点为叶子节点时,获取所述目标子树中叶子节点存储的用户历史信息数据。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
接收查询指令,并解析所述查询指令,得到待查询的时间段;
从存储有用户历史信息数据的树状图中,根据待查询的时间段,查找目标子树,所述树状图包括根节点和子树集合,所述根节点用于索引不同时间点,各时间点分别指向对应时间段的子树,所述子树集合包括各时间段的子树;
遍历目标子树中的节点,当所述目标子树中的节点为叶子节点时,获取所述目标子树中叶子节点存储的用户历史信息数据。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
接收查询指令,并解析所述查询指令,得到待查询的时间段;
从存储有用户历史信息数据的树状图中,根据待查询的时间段,查找目标子树,所述树状图包括根节点和子树集合,所述根节点用于索引不同时间点,各时间点分别指向对应时间段的子树,所述子树集合包括各时间段的子树;
遍历目标子树中的节点,当所述目标子树中的节点为叶子节点时,获取所述目标子树中叶子节点存储的用户历史信息数据。
上述社交网络数据查询方法、装置、计算机设备和存储介质,首先接收查询指令,并解析查询指令,得到待查询的时间段;树状图存储有用户历史信息数据,树状图包括根节点和子树集合,根节点用于索引不同时间点,各时间点分别指向对应时间段的子树,子树集合包括各时间段的子树,然后根据待查询的时间段,从树状图中查找目标子树;遍历目标子树中的节点,当目标子树中的节点为叶子节点时,获取目标子树中叶子节点存储的用户历史信息数据,这样可以有效提高查询速度。
附图说明
图1为一个实施例中社交网络数据查询方法的应用环境图;
图2为一个实施例中社交网络数据查询方法的流程示意图;
图3为一个实施例中树的节点示意图;
图4为一个实施例中目标用户获取步骤的流程示意图;
图5为另一个实施例中目标用户获取步骤的流程示意图;
图6为一个实施例中痕迹索引结构的示意图;
图7为一个实施例中定位索引结构的示意图;
图8为一个实施例中用户组时空查询方法的流程示意图;
图9为一个实施例中用户组时空行为方式查询方法的流程示意图;
图10为一个实施例中查找方法的流程示意图;
图11为一个实施例中社交网络数据查询装置的结构示意图;
图12为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的社交网络数据查询方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104通过网络进行通信。终端接收查询指令,并解析查询指令,得到待查询的时间段。然后终端然后根据待查询的时间段,从树状图中查找目标子树,树状图存储有用户历史信息数据,树状图包括根节点和子树集合,根节点用于索引不同时间点,各时间点分别指向对应时间段的子树,子树集合包括各时间段的子树。当目标子树中的节点为叶子节点时,获取目标子树中叶子节点存储的用户历史信息数据。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种社交网络数据查询方法,以该方法应用于图1中的终端为例进行说明,包括以下步骤:
步骤202,接收查询指令,并解析查询指令,得到待查询的时间段。
查询指令是指外部设备需要查询相关信息时输入的指令,查询指令可以是时空及关键词信息,具体可以表示为(C,[ts,te],Wq),其中,C为输入的空间范围,[ts,te]为输入的时间范围,Wq为输入的关键词集合。查询指令也可以是时空、关键词及行为用户行为方式信息,具体可以表示为(C,[ts,te],tg,k,Wq],其中,C为输入的空间范围,[ts,te]为输入的时间范围,tg为自定义的时间长度,整数k为tg时间长度内用户出现的次数,Wq为输入的关键词集合。
步骤204,从存储有用户历史信息数据的树状图中,根据待查询的时间段,查找目标子树,树状图包括根节点和子树集合,根节点用于索引不同时间点,各时间点分别指向对应时间段的子树,子树集合包括各时间段的子树。
树状图是一种数据结构,它是由n(n>=1)个有限节点组成一个具有层次关系的集合。树状图也可称为树,因为它看起来像一棵倒挂的树,也就是说它是根朝上,而叶朝下的。树状图具有以下特点:每个节点有零个或多个子节点;没有父节点的节点称为根节点;每一个非根节点有且只有一个父节点;除了根节点外,每个子节点可以分为多个不相交的子树。
根节点用于索引不同时间点,每个根节点对应一个时间点的索引项,各根节点按照时间顺序延伸。具体地,根节点可以包括t1、t2、t3…等连续时间点的索引项。索引项是指被索引对象的类称,每个索引节点保存了文件***中的一个文件***对象的元数据,但不包括数据内容或者文件名。元数据是指描述数据的数据,主要是描述数据的属性信息,用来支持如指示存储位置、历史数据、资源查找、文件记录等功能。元数据是一种电子式目录,可以达到编制目录的目的,进而达成协助数据检索的目的。子树是树的其中一个节点以及其下面的所有的节点所构成的树。假设T是有根树,a是T中的一个顶点,由a以及a的所有后裔(后代)导出的子图称为有向树T的子树。比如,如图3所示,该树T有16个节点,其中,A是根节点,其余节点分成6个互不相交的子集,分别用T1、T2、T3、T4、T5和T6表示。T1={B},T2={C},T3={D,H},T4={E,I,J,P,Q},T5={F,K,L,M},T6={G,N},T1、T2、T3、T4、T5和T6都是T的子树,其本身也是一棵树,树T1、T2、T3、T4、T5和T6的根节点分别为B、C、D、E、F和G。各时间点的索引项指向对应时间段的子树,比如时间点ti,其指向[ti,ti+1)时间区间的子树。
在子树集合中根据待查询的时间段进行查找,得到目标子树。比如,根节点包括t1、t2、t3…等连续时间点的索引项,获取到的子树集合包括[t1,t2)、[t2,t3)、[t3,t4)…等时间区间的子树,当待查询的时间段为[t1,t3),根据该待查询时间段,查找得到的目标子树为[t1,t2)和[t2,t3)时间区间的子树。
步骤206,遍历目标子树中的节点,当目标子树中的节点为叶子节点时,获取目标子树中叶子节点存储的用户历史信息数据。
叶子节点是树中最底端的节点,叶子节点没有子节点。比如,图3中的节点B、C、H、I、P、Q、K、L、M、N均为叶子节点。
在一个实施例中,如图4所示,用户历史信息数据包括空间位置信息、时间信息以及处于预设空间位置的频率,当目标子树中的节点为叶子节点时,获取目标子树中叶子节点存储的用户历史信息数据,包括:
步骤402,获取目标子树中叶子节点对应的空间位置信息、时间信息以及处于预设空间位置的频率;
步骤404,当目标子树中的节点为叶子节点、叶子节点对应的空间位置信息属于预设空间位置、叶子节点对应的时间信息属于预设时间段内的时间、且叶子节点对应的处于预设空间位置的频率大于或等于预设频率时,获取目标子树中叶子节点存储的用户历史信息数据。
具体地,叶子节点可以表示为<uid,x,y,Wp>的数据项形式,其中,uid是用户标识,(x,y)是用户uid在时刻t的坐标,而Wp有两种可能性:若存在,则(x,y)是定位点的坐标,其覆盖的关键词为Wp;若Wp为null(空),则(x,y)不对应相关的定位点,仅表示用户位置的坐标。检验目标子树中每个叶子节点的数据项是否满足下述条件:(1)时刻t在预设时间段[ts,te]中,(2)坐标(x,y)在预设空间范围C内;(3)用户进入此时空范围的频率大于或等于预设频率k/tg,其中,tg为自定义的时间长度,整数k为tg时间长度内该用户出现的次数。若叶子节点的数据项满足上述条件,则返回该叶子节点中存储的用户历史信息数据。
在一个实施例中,如图5所示,用户历史信息数据包括空间位置信息、时间信息以及关键词信息,当目标子树中的节点为叶子节点时,获取目标子树中叶子节点存储的用户历史信息数据,包括:
步骤502,获取目标子树中叶子节点对应的空间位置信息、时间信息以及关键词信息;
步骤504,当目标子树中的节点为叶子节点、叶子节点对应的空间位置信息属于预设空间位置、叶子节点对应的时间信息属于预设时间段内的时间、且叶子节点对应的关键词信息属于预设关键词时,获取目标子树中叶子节点存储的用户历史信息数据。
具体地,叶子节点可以表示为(x,y,t,w)的形式,其中,(x,y)为空间对象的坐标,t为定位的时间,w为空间对象的关键词。检验目标子树中每个叶子节点是否满足下述条件:(1)坐标(x,y)位于预设空间范围C;(2)该叶子节点对应的数据记录中的时间位于预设时间区间[ts,te]中;(3)包含预设关键词Wq。若叶子节点的数据项满足上述条件,则返回该叶子节点中存储的用户历史信息数据。
上述社交网络数据查询方法中,首先接收查询指令,并解析查询指令,得到待查询的时间段;树状图存储有用户历史信息数据,包括用于索引不同时间点的根节点和各时间点指向的子树集合,然后根据待查询的时间段,从树状图中查找目标子树;遍历目标子树中的节点,当目标子树中的节点为叶子节点时,获取目标子树中叶子节点存储的用户历史信息数据,这样可以有效提高查询速度。
在一个实施例中,用户历史信息数据包括空间位置信息、时间段信息以及处于预设空间位置的频率,根据待查询的时间段,查找得到目标子树之后,包括:当目标子树中的节点为非叶子节点时,获取目标子树中非叶子节点对应的最小外接矩形、时间段信息以及处于预设空间位置的频率;当最小外接矩形对应的空间位置与预设空间位置重叠、非叶子节点对应的时间段信息与预设时间段重叠、且叶子节点对应的处于预设空间位置的频率大于或等于预设频率时,获取非叶子节点的子节点;当非叶子节点的子节点为叶子节点时,获取该叶子节点存储的用户历史信息数据。具体地,非叶子结点可以表示为<MBR,tns,tne,KW,U>的数据项形式,其中,MBR表示子树的最小外接矩阵,[tns,tne]表示此MBR存在的时间段,KW表示子树包含的关键词,U是子树中用户的统计信息的集合,U中元素的形式具体可以表示为<uid,MBRu,tus,tue,num>,其中,uid是用户的标识,MBRu是在时间段[tus,tue]内用户uid对应的MBR,num是用户uid在此节点对应记录的数目。如图6所示,图中表示了一个叶子节点和非叶子节点的具体信息。叶子节点中有用户u1和u2的历史痕迹信息,在叶子节点中的信息显示为:u1在时间段[t1,t3]的MBR为MBRu1,且痕迹记录个数为2;u2在时间段[t2,t2]的MBR为MBRu2,痕迹记录个数为1。
在一个实施例中,当目标子树中的节点为非叶子节点时,获取目标子树中非叶子节点对应的最小外接矩形、时间段信息以及处于预设空间位置的频率之后,包括:当最小外接矩形对应的空间位置与预设空间位置重叠、非叶子节点对应的时间段信息与预设时间段重叠、且非叶子节点对应的处于预设空间位置的频率小于预设频率时,滤除非叶子节点的子节点。具体地,可以初始化一个哈希表,用于存储用户的检验信息。当目标子树中的非叶子节点的最小外接矩形对应的空间位置与预设空间位置重叠、非叶子节点对应的时间段信息与预设时间段重叠、且非叶子节点对应的处于预设空间位置的频率小于预设频率时,将其对应的哈希表中的哈希值赋值为false,对应的子树不需要被检验,即滤除该子树中非叶子节点的子节点,这样可以进一度加快查询速度。
在一个实施例中,用户历史信息数据包括空间位置信息、时间段信息以及关键词信息,根据待查询的时间段,查找得到目标子树之后,包括:当目标子树中的节点为非叶子节点时,获取目标子树中非叶子节点对应的最小外接矩形、时间段信息以及关键词信息;当最小外接矩形对应的空间位置与预设空间位置重叠、非叶子节点对应的时间段信息与预设时间段重叠、且非叶子节点对应的关键词信息与预设关键词重叠时,获取非叶子节点的子节点;当非叶子节点的子节点为叶子节点时,获取叶子节点存储的用户历史信息数据。具体地,非叶子节点可表示为<MBR,KW>的形式,其中,MBR为子节点的最小外接矩形,KW为子节点包含的关键词。图7为基于历史记录信息对用户定位进行索引的示意图。
在一个实施例中,用户历史信息数据包括空间位置信息以及时间段信息,根据待查询的时间段,查找得到目标子树之后,包括:当目标子树中的节点为非叶子节点时,获取目标子树中非叶子节点对应的最小外接矩形以及时间段信息;当最小外接矩形对应的空间位置与预设空间位置不重叠、且非叶子节点对应的时间段信息与预设时间段不重叠时,滤除非叶子节点的子节点。滤除该非叶子节点的子节点,该非叶子节点的子节点对应的子树不需要被检验,这样可以进一度加快查询速度。
在一个实施例中,随着社交网络在移动互联网技术推动下的不断发展和普及,用户除了传统的网络社交活动外,借助定位功能,还可以留下位置信息以及光顾商家的信息。随着社交应用的不断推广,大量的具有时空属性的社交数据得以积累,从中分析挖掘出用户群组的时空行为规律具有重要的价值。很多用户会在自己喜欢的景点、商家等地方定位签到并发送社交信息,分享给社交网络中其他用户,利用这些数据,就可以通过高效的索引,针对给定时间、空间、关键字和签到频率进行检索,获取目标用户群组,并进一步分析,总结出目标用户群组的时空行为规律。这对商家来说,可以利用挖掘出的行为规律更精准有效地对目标用户进行宣传;对客户端的社交应用来说,也可以根据用户的喜好和行为规律,为其提供更好的推荐和服务。
具体地,可以按以下两种方式进行查询,(1)用户组时空定位查询:在一个固定的空间范围C=(o,r)内(其中o为圆心,r为半径),一个时间区间[ts,te],一个关键词集合Wq中,查询出对应的用户组集合,每个用户组中需符合以下条件:在时间区间[ts,te]内,每个用户都定位在C范围中的地点,并且定位的地点覆盖关键词集合Wq。(2)用户组时空行为方式查询:给定一个空间范围C=(o,r)内(其中o为圆心,r为半径),一个时间区间[ts,te],一个时间长度(或时间粒度)tg,一个整数k以及一个关键词集合Wq,寻找用户组集合,每个用户组中需符合以下条件:在时间区间[ts,te]内,每个时间长度tg用户进入空间范围C中至少k次,并且该用户组定位的地点覆盖关键词集合Wq
定位索引用于对用户定位的历史记录信息进行索引。该索引类对时间进行了单独处理,每一时刻下的空间信息被储存在R树中,即保存了不同时间点空间对象的分布情况。定位索引结构的示意图如图7所示,根结点为包含不同时间点的索引项,按照时间顺序延伸,其中的每一个索引项,例如ti,其指向[ti,ti+1)时间区间的子树,并且其指向的子树为R树,即此R树存储了[ti,ti+1)时间段内发生定位的数据。和HR树不同的是,R树的非叶子节点都结合了布隆过滤器,用于过滤关键词。定位索引的叶子节点形式为(x,y,t,w),其中,(x,y)为定位的空间对象的坐标,t为定位的时间,w为空间对象的关键词。对于非叶子节点,可表示为<MBR,KW>,其中,MBR为子节点的最小外接矩形,KW包含子节点的关键词。
对于用户组时空定位查询,查询条件为(C,[ts,te],Wq),其中,C=(o,r),旨在找到在指定时空范围内与关键词相关的用户组集合。用户组时空定位查询方法如图8所示,具体包括:
第一步:用getRoot()函数将定位索引的根节点导入内存中;
第二步:找到符合[ts,te]时间区间条件的R树子树,记为SN;
第三步:对于每个SN中的节点,使用函数search()获得在时间段[ts,te]内定位了关键词Wq的叶子节点用户集合,记为Uset:
对于每个SN中的节点,若为非叶子节点,对节点中的数据项检验是否符合以下条件:(1)MBR范围与给定空间范围C有重叠;(2)所在的时间范围与给定时间范围有重叠;(3)布隆过滤器检验的结果包含给定关键词集合Wq。若这三个条件都符合,则再次使用search()函数,对其对应的子节点进行迭代查找。
对于每个SN中的节点,若为叶子节点,对节点中的数据项检验是否符合以下条件:(1)坐标(x,y)落在给定空间范围C中;(2)该数据记录中的时间戳在给定时间区间[ts,te]中;(3)关键词包括给定关键词Wq。若符合以上三个条件,则返回符合条件的叶子节点信息。
第四步:对于Uset,将集合中的用户构建连接图,获得最终的用户组集合Ulist。
痕迹索引用于索引用户组的痕迹信息。其叶子结点的形式为<uid,x,y,Wp>,其中uid是用户的标识,(x,y)是用户uid在时刻t的坐标,而Wp有两种可能性:若存在,则(x,y)是定位点的坐标,包括的关键词为Wp;若Wp为null,则(x,y)不对应相关的定位点,仅表示用户位置的坐标。非叶子结点的形式为<MBR,tns,tne,KW,U>,其中,MBR表示子树的最小外接矩形,[tns,tne]表示此MBR存在的时间段,KW表示子树包含的关键词,U是子树中用户的统计信息的集合,U中元素的形式为<uid,MBRu,tus,tue,num>,其中,uid是用户标识,MBRu是在时间段[tus,tue]内用户uid对应的MBR,num是用户uid在此节点对应记录的数目。图6为痕迹索引结构的示意图,图中只表示了一个叶子节点和非叶子节点的具体信息,叶子节点中有用户u1和u2的历史痕迹信息。在叶子节点中的信息显示为:用户u1在时间段[t1,t3]的MBR为MBRu1,且痕迹记录个数为2;用户u2在时间段[t2,t2]的MBR为MBRu2,痕迹记录个数为1。
对于用户组时空行为方式查询,其查询条件为(C,[ts,te],tg,k,Wq),目标是返回在某一段时空范围中,出现频率高于k/tg(每tg时间段k次)的用户(行为方式限制),并且关键词组Wq被覆盖在这些用户形成的组中。用户组时空行为方式查询方法如图9所示,具体包括:
第一步:用getRoot()函数将定位索引的根节点导入内存中;
第二步:找到符合时间段[ts,te]条件的R树子树,记为SN;
第三步:对于每个SN中的节点,使用函数search()获得在时间段[ts,te]内定位了给定关键词的叶子节点用户集合,称为Uset:
第四步:对Uset集合中的用户构建连接图;
第五步:找到包括给定关键词Wq的连接图,并从中获得最终的用户组集合Ulist。
其中,用户组时空行为方式查询方法中第三步中search()函数的过程如图10所示,包括:
第一步:初始化一个哈希表,用于存储用户的检验信息;
第二步:对于非叶子节点中的索引项,判断是否符合以下两个条件:索引项的MBR与给定空间范围C有重叠,索引项的时间区间与给定时间范围[ts,te]有重叠:
若满足上述两个条件,则进行进一步检验,若avgc<k,将对应的哈希值赋值为false,对应的子树不需要再被检索,avgc每个时间段tg中用户ui出现的平均次数,即将时间区间[tus,tue]按时间长度tg进行分段,分段计算平均的记录数目avgc=u.num/((u.tue-tus)/tg);若avgc≥k,继续用search()函数检索其子树。若不满足上述两个条件,则对应的子树不需要再被检索。
第三步:一直遍历到叶子节点,检验每个叶子节点中的数据项是否符合下述条件:(1)在给定时间段[ts,te]中,(2)在给定空间范围C内;(3)用户进入此时空范围的频率高于k/tg。若数据项满足上述条件,则返回该用户;若数据项不满足上述条件,则排除该用户。
第四步:得到叶子节点用户集合Uset。
应该理解的是,虽然图2、4-5、8-10的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2、4-5、8-10中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图11所示,提供了一种社交网络数据查询装置,包括:指令解析模块1102、目标子树查找模块1104和目标用户获取模块1106,其中:
指令解析模块1102,用于接收查询指令,并解析查询指令,得到待查询的时间段;
目标子树查找模块1104,用于从存储有用户历史信息数据的树状图中,根据待查询的时间段,查找目标子树,树状图包括根节点和子树集合,根节点用于索引不同时间点,各时间点分别指向对应时间段的子树,子树集合包括各时间段的子树;
目标用户获取模块1106,用于遍历目标子树中的节点,当目标子树中的节点为叶子节点时,获取目标子树中叶子节点存储的用户历史信息数据。
在一个实施例中,目标子树查找模块之后,包括:目标子树信息获取模块,用于当目标子树中的节点为非叶子节点时,获取目标子树中非叶子节点对应的最小外接矩形、时间段信息以及处于预设空间位置的频率;目标子树信息判断模块,用于当最小外接矩形对应的空间位置与预设空间位置重叠、非叶子节点对应的时间段信息与预设时间段重叠、且非叶子节点对应的处于预设空间位置的频率大于或等于预设频率时,获取非叶子节点的子节点;目标子树用户返回模块,用于当所述非叶子节点的子节点为叶子节点时,获取该叶子节点存储的用户历史信息数据。
在一个实施例中,目标子树信息获取模块之后,包括:目标子树信息滤除模块,用于当最小外接矩形对应的空间位置与预设空间位置重叠、非叶子节点对应的时间段信息与预设时间段重叠、且非叶子节点对应的处于所述预设空间位置的频率小于预设频率时,滤除非叶子节点的子节点。
在一个实施例中,目标用户获取模块包括:叶子节点信息获取单元,用于获取目标子树中叶子节点对应的空间位置信息、时间信息以及处于预设空间位置的频率;叶子节点信息判断单元,用于当目标子树中的节点为叶子节点、叶子节点对应的空间位置信息属于预设空间位置、叶子节点对应的时间信息属于预设时间段内的时间、且叶子节点对应的处于预设空间位置的频率大于或等于预设频率时,获取目标子树中叶子节点存储的用户历史信息数据。
在一个实施例中,目标用户获取模块包括:目标子树信息获取单元,用于获取目标子树中叶子节点对应的空间位置信息、时间信息以及关键词信息;目标子树信息判断单元,当目标子树中的节点为叶子节点、叶子节点对应的空间位置信息属于预设空间位置、叶子节点对应的时间信息属于预设时间段内的时间、且叶子节点对应的关键词信息属于预设关键词时,获取目标子树中叶子节点存储的用户历史信息数据。
在一个实施例中,目标子树查找模块之后,包括:非叶子节点信息获取模块,用于当目标子树中的节点为非叶子节点时,获取目标子树中非叶子节点对应的最小外接矩形、时间段信息以及关键词信息;非叶子节点信息判断模块,用于当最小外接矩形对应的空间位置与预设空间位置重叠、非叶子节点对应的时间段信息与预设时间段重叠、且非叶子节点对应的关键词信息与预设关键词重叠时,获取非叶子节点的子节点;非叶子节点用户筛选模块,用于当非叶子节点的子节点为叶子节点时,获取叶子节点存储的用户历史信息数据。
在一个实施例中,目标子树查找模块之后,包括:子树信息获取模块,用于当目标子树中的节点为非叶子节点时,获取目标子树中非叶子节点对应的最小外接矩形以及时间段信息;子树信息判断模块,用于当最小外接矩形对应的空间位置与预设空间位置不重叠、且非叶子节点对应的时间段信息与预设时间段不重叠时,滤除非叶子节点的子节点。
关于社交网络数据查询装置的具体限定可以参见上文中对于社交网络数据查询方法的限定,在此不再赘述。上述社交网络数据查询装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图12所示。该计算机设备包括通过***总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***、计算机程序和数据库。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的数据库用于存储社交网络中的用户时空历史信息数据、用户定位的历史记录信息以及用户的痕迹信息数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种社交网络数据查询方法。
本领域技术人员可以理解,图12中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:接收查询指令,并解析所述查询指令,得到待查询的时间段;从存储有用户历史信息数据的树状图中,根据待查询的时间段,查找目标子树,树状图包括根节点和子树集合,根节点用于索引不同时间点,各时间点分别指向对应时间段的子树,子树集合包括各时间段的子树;遍历目标子树中的节点,当目标子树中的节点为叶子节点时,获取目标子树中叶子节点存储的用户历史信息数据。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:接收查询指令,并解析所述查询指令,得到待查询的时间段;从存储有用户历史信息数据的树状图中,根据待查询的时间段,查找目标子树,树状图包括根节点和子树集合,根节点用于索引不同时间点,各时间点分别指向对应时间段的子树,子树集合包括各时间段的子树;当目标子树中的节点为非叶子节点时,获取目标子树中非叶子节点对应的最小外接矩形、时间段信息以及处于预设空间位置的频率;当最小外接矩形对应的空间位置与预设空间位置重叠、非叶子节点对应的时间段信息与预设时间段重叠、且非叶子节点对应的处于预设空间位置的频率大于或等于预设频率时,获取非叶子节点的子节点;当非叶子节点的子节点为叶子节点时,获取该叶子节点存储的用户历史信息数据;当目标子树中的节点为叶子节点时,获取目标子树中叶子节点存储的用户历史信息数据。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:接收查询指令,并解析所述查询指令,得到待查询的时间段;从存储有用户历史信息数据的树状图中,根据待查询的时间段,查找目标子树,树状图包括根节点和子树集合,根节点用于索引不同时间点,各时间点分别指向对应时间段的子树,子树集合包括各时间段的子树;当目标子树中的节点为非叶子节点时,获取目标子树中非叶子节点对应的最小外接矩形、时间段信息以及处于预设空间位置的频率;当最小外接矩形对应的空间位置与预设空间位置重叠、非叶子节点对应的时间段信息与预设时间段重叠、且非叶子节点对应的处于所述预设空间位置的频率小于预设频率时,滤除非叶子节点的子节点;当最小外接矩形对应的空间位置与预设空间位置重叠、非叶子节点对应的时间段信息与预设时间段重叠、且非叶子节点对应的处于预设空间位置的频率大于或等于预设频率时,获取非叶子节点的子节点;当非叶子节点的子节点为叶子节点时,获取该叶子节点存储的用户历史信息数据;当目标子树中的节点为叶子节点时,获取目标子树中叶子节点存储的用户历史信息数据。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:接收查询指令,并解析所述查询指令,得到待查询的时间段;从存储有用户历史信息数据的树状图中,根据待查询的时间段,查找目标子树,树状图包括根节点和子树集合,根节点用于索引不同时间点,各时间点分别指向对应时间段的子树,子树集合包括各时间段的子树;获取目标子树中叶子节点对应的空间位置信息、时间信息以及处于预设空间位置的频率;当目标子树中的节点为叶子节点、叶子节点对应的空间位置信息属于预设空间位置、叶子节点对应的时间信息属于预设时间段内的时间、且叶子节点对应的处于所述预设空间位置的频率大于或等于预设频率时,获取该叶子节点存储的用户历史信息数据。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:接收查询指令,并解析所述查询指令,得到待查询的时间段;从存储有用户历史信息数据的树状图中,根据待查询的时间段,查找目标子树,树状图包括根节点和子树集合,根节点用于索引不同时间点,各时间点分别指向对应时间段的子树,子树集合包括各时间段的子树;获取目标子树中叶子节点对应的空间位置信息、时间信息以及关键词信息;当目标子树中的节点为叶子节点、叶子节点对应的空间位置信息属于预设空间位置、叶子节点对应的时间信息属于预设时间段内的时间、且叶子节点对应的关键词信息属于预设关键词时,获取该叶子节点存储的用户历史信息数据。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:接收查询指令,并解析所述查询指令,得到待查询的时间段;从存储有用户历史信息数据的树状图中,根据待查询的时间段,查找目标子树,树状图包括根节点和子树集合,根节点用于索引不同时间点,各时间点分别指向对应时间段的子树,子树集合包括各时间段的子树;当目标子树中的节点为非叶子节点时,获取目标子树中非叶子节点对应的最小外接矩形、时间段信息以及关键词信息;当最小外接矩形对应的空间位置与预设空间位置重叠、非叶子节点对应的时间段信息与预设时间段重叠、且非叶子节点对应的关键词信息与预设关键词重叠时,获取非叶子节点的子节点;当非叶子节点的子节点为叶子节点时,获取该叶子节点存储的用户历史信息数据;当目标子树中的节点为叶子节点时,获取该叶子节点存储的用户历史信息数据。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:接收查询指令,并解析所述查询指令,得到待查询的时间段;从存储有用户历史信息数据的树状图中,根据待查询的时间段,查找目标子树,树状图包括根节点和子树集合,根节点用于索引不同时间点,各时间点分别指向对应时间段的子树,子树集合包括各时间段的子树;当目标子树中的节点为非叶子节点时,获取目标子树中非叶子节点对应的最小外接矩形以及时间段信息;当最小外接矩形对应的空间位置与预设空间位置不重叠、且非叶子节点对应的时间段信息与预设时间段不重叠时,滤除非叶子节点的子节点;当目标子树中的节点为叶子节点时,获取该叶子节点存储的用户历史信息数据。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:接收查询指令,并解析所述查询指令,得到待查询的时间段;从存储有用户历史信息数据的树状图中,根据待查询的时间段,查找目标子树,树状图包括根节点和子树集合,根节点用于索引不同时间点,各时间点分别指向对应时间段的子树,子树集合包括各时间段的子树;遍历目标子树中的节点,当目标子树中的节点为叶子节点时,获取目标子树中叶子节点存储的用户历史信息数据。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:接收查询指令,并解析所述查询指令,得到待查询的时间段;从存储有用户历史信息数据的树状图中,根据待查询的时间段,查找目标子树,树状图包括根节点和子树集合,根节点用于索引不同时间点,各时间点分别指向对应时间段的子树,子树集合包括各时间段的子树;当目标子树中的节点为非叶子节点时,获取目标子树中非叶子节点对应的最小外接矩形、时间段信息以及处于预设空间位置的频率;当最小外接矩形对应的空间位置与预设空间位置重叠、非叶子节点对应的时间段信息与预设时间段重叠、且非叶子节点对应的处于预设空间位置的频率大于或等于预设频率时,获取非叶子节点的子节点;当非叶子节点的子节点为叶子节点时,获取该叶子节点存储的用户历史信息数据;当目标子树中的节点为叶子节点时,获取目标子树中叶子节点存储的用户历史信息数据。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:接收查询指令,并解析所述查询指令,得到待查询的时间段;从存储有用户历史信息数据的树状图中,根据待查询的时间段,查找目标子树,树状图包括根节点和子树集合,根节点用于索引不同时间点,各时间点分别指向对应时间段的子树,子树集合包括各时间段的子树;当目标子树中的节点为非叶子节点时,获取目标子树中非叶子节点对应的最小外接矩形、时间段信息以及处于预设空间位置的频率;当最小外接矩形对应的空间位置与预设空间位置重叠、非叶子节点对应的时间段信息与预设时间段重叠、且非叶子节点对应的处于所述预设空间位置的频率小于预设频率时,滤除非叶子节点的子节点;当最小外接矩形对应的空间位置与预设空间位置重叠、非叶子节点对应的时间段信息与预设时间段重叠、且非叶子节点对应的处于预设空间位置的频率大于或等于预设频率时,获取非叶子节点的子节点;当非叶子节点的子节点为叶子节点时,获取该叶子节点存储的用户历史信息数据;当目标子树中的节点为叶子节点时,获取目标子树中叶子节点存储的用户历史信息数据。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:接收查询指令,并解析所述查询指令,得到待查询的时间段;从存储有用户历史信息数据的树状图中,根据待查询的时间段,查找目标子树,树状图包括根节点和子树集合,根节点用于索引不同时间点,各时间点分别指向对应时间段的子树,子树集合包括各时间段的子树;获取目标子树中叶子节点对应的空间位置信息、时间信息以及处于预设空间位置的频率;当目标子树中的节点为叶子节点、叶子节点对应的空间位置信息属于预设空间位置、叶子节点对应的时间信息属于预设时间段内的时间、且叶子节点对应的处于所述预设空间位置的频率大于或等于预设频率时,获取该叶子节点存储的用户历史信息数据。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:接收查询指令,并解析所述查询指令,得到待查询的时间段;从存储有用户历史信息数据的树状图中,根据待查询的时间段,查找目标子树,树状图包括根节点和子树集合,根节点用于索引不同时间点,各时间点分别指向对应时间段的子树,子树集合包括各时间段的子树;获取目标子树中叶子节点对应的空间位置信息、时间信息以及关键词信息;当目标子树中的节点为叶子节点、叶子节点对应的空间位置信息属于预设空间位置、叶子节点对应的时间信息属于预设时间段内的时间、且叶子节点对应的关键词信息属于预设关键词时,获取该叶子节点存储的用户历史信息数据。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:接收查询指令,并解析所述查询指令,得到待查询的时间段;从存储有用户历史信息数据的树状图中,根据待查询的时间段,查找目标子树,树状图包括根节点和子树集合,根节点用于索引不同时间点,各时间点分别指向对应时间段的子树,子树集合包括各时间段的子树;当目标子树中的节点为非叶子节点时,获取目标子树中非叶子节点对应的最小外接矩形、时间段信息以及关键词信息;当最小外接矩形对应的空间位置与预设空间位置重叠、非叶子节点对应的时间段信息与预设时间段重叠、且非叶子节点对应的关键词信息与预设关键词重叠时,获取非叶子节点的子节点;当非叶子节点的子节点为叶子节点时,获取该叶子节点存储的用户历史信息数据;当目标子树中的节点为叶子节点时,获取该叶子节点存储的用户历史信息数据。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:接收查询指令,并解析所述查询指令,得到待查询的时间段;从存储有用户历史信息数据的树状图中,根据待查询的时间段,查找目标子树,树状图包括根节点和子树集合,根节点用于索引不同时间点,各时间点分别指向对应时间段的子树,子树集合包括各时间段的子树;当目标子树中的节点为非叶子节点时,获取目标子树中非叶子节点对应的最小外接矩形以及时间段信息;当最小外接矩形对应的空间位置与预设空间位置不重叠、且非叶子节点对应的时间段信息与预设时间段不重叠时,滤除非叶子节点的子节点;当目标子树中的节点为叶子节点时,获取该叶子节点存储的用户历史信息数据。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种社交网络数据查询方法,所述方法包括:
接收查询指令,并解析所述查询指令,得到待查询的时间段;
从存储有用户历史信息数据的树状图中,根据所述待查询的时间段,查找目标子树,所述树状图包括根节点和子树集合,所述根节点用于索引不同时间点,各时间点分别指向对应时间段的子树,所述子树集合包括各时间段的子树;
遍历目标子树中的节点,当所述目标子树中的节点为叶子节点时,获取所述目标子树中叶子节点存储的用户历史信息数据。
2.根据权利要求1所述的方法,其特征在于,所述用户历史信息数据包括空间位置信息、时间段信息以及处于预设空间位置的频率,所述根据待查询的时间段,查找得到目标子树之后,包括:
当所述目标子树中的节点为非叶子节点时,获取所述目标子树中非叶子节点对应的最小外接矩形、时间段信息以及处于预设空间位置的频率;
当所述最小外接矩形对应的空间位置与预设空间位置重叠、所述非叶子节点对应的时间段信息与预设时间段重叠、且所述非叶子节点对应的处于所述预设空间位置的频率大于或等于预设频率时,获取所述非叶子节点的子节点;
当所述非叶子节点的子节点为叶子节点时,获取所述叶子节点存储的用户历史信息数据。
3.根据权利要求2所述的方法,其特征在于,所述当所述目标子树中的节点为非叶子节点时,获取所述目标子树中非叶子节点对应的最小外接矩形、时间段信息以及处于预设空间位置的频率之后,包括:
当所述最小外接矩形对应的空间位置与预设空间位置重叠、所述非叶子节点对应的时间段信息与预设时间段重叠、且所述非叶子节点对应的处于所述预设空间位置的频率小于预设频率时,滤除所述非叶子节点的子节点。
4.根据权利要求1所述的方法,其特征在于,所述用户历史信息数据包括空间位置信息、时间信息以及处于预设空间位置的频率,所述当所述目标子树中的节点为叶子节点时,获取所述目标子树中叶子节点存储的用户历史信息数据,包括:
获取所述目标子树中叶子节点对应的空间位置信息、时间信息以及处于预设空间位置的频率;
当所述目标子树中的节点为叶子节点、所述叶子节点对应的空间位置信息属于预设空间位置、所述叶子节点对应的时间信息属于预设时间段内的时间、且所述叶子节点对应的处于所述预设空间位置的频率大于或等于预设频率时,获取所述目标子树中叶子节点存储的用户历史信息数据。
5.根据权利要求1所述的方法,其特征在于,所述用户历史信息数据包括空间位置信息、时间信息以及关键词信息,所述当所述目标子树中的节点为叶子节点时,获取所述目标子树中叶子节点存储的用户历史信息数据,包括:
获取所述目标子树中叶子节点对应的空间位置信息、时间信息以及关键词信息;
当所述目标子树中的节点为叶子节点、所述叶子节点对应的空间位置信息属于预设空间位置、所述叶子节点对应的时间信息属于预设时间段内的时间、且所述叶子节点对应的关键词信息属于预设关键词时,获取所述目标子树中叶子节点存储的用户历史信息数据。
6.根据权利要求1所述的方法,其特征在于,所述用户历史信息数据包括空间位置信息、时间段信息以及关键词信息,所述根据待查询的时间段,查找得到目标子树之后,包括:
当所述目标子树中的节点为非叶子节点时,获取所述目标子树中非叶子节点对应的最小外接矩形、时间段信息以及关键词信息;
当所述最小外接矩形对应的空间位置与预设空间位置重叠、所述非叶子节点对应的时间段信息与预设时间段重叠、且所述非叶子节点对应的关键词信息与预设关键词重叠时,获取所述非叶子节点的子节点;
当所述非叶子节点的子节点为叶子节点时,获取所述叶子节点存储的用户历史信息数据。
7.根据权利要求1-6任意一项所述的方法,其特征在于,所述用户历史信息数据包括空间位置信息以及时间段信息,所述根据待查询的时间段,查找得到目标子树之后,包括:
当所述目标子树中的节点为非叶子节点时,获取所述目标子树中非叶子节点对应的最小外接矩形以及时间段信息;
当所述最小外接矩形对应的空间位置与预设空间位置不重叠、且所述非叶子节点对应的时间段信息与预设时间段不重叠时,滤除所述非叶子节点的子节点。
8.一种社交网络数据查询装置,其特征在于,所述装置包括:
指令解析模块,用于接收查询指令,并解析所述查询指令,得到待查询的时间段;
目标子树查找模块,用于从存储有用户历史信息数据的树状图中,根据待查询的时间段,查找目标子树,所述树状图包括根节点和子树集合,所述根节点用于索引不同时间点,各时间点分别指向对应时间段的子树,所述子树集合包括各时间段的子树;
目标用户获取模块,用于遍历目标子树中的节点,当所述目标子树中的节点为叶子节点时,获取所述目标子树中叶子节点存储的用户历史信息数据。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
CN201810111975.XA 2018-02-05 2018-02-05 社交网络数据查询方法、装置、计算机设备和存储介质 Pending CN108460102A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810111975.XA CN108460102A (zh) 2018-02-05 2018-02-05 社交网络数据查询方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810111975.XA CN108460102A (zh) 2018-02-05 2018-02-05 社交网络数据查询方法、装置、计算机设备和存储介质

Publications (1)

Publication Number Publication Date
CN108460102A true CN108460102A (zh) 2018-08-28

Family

ID=63239575

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810111975.XA Pending CN108460102A (zh) 2018-02-05 2018-02-05 社交网络数据查询方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN108460102A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110084714A (zh) * 2019-04-25 2019-08-02 太原理工大学 基于有向树的社交网络影响力最大化方法、装置及设备
CN110347925A (zh) * 2019-07-12 2019-10-18 腾讯科技(深圳)有限公司 信息处理方法及计算机可读存储介质
CN110532437A (zh) * 2019-07-18 2019-12-03 平安科技(深圳)有限公司 电子凭证提示方法、装置、计算机设备及存储介质
CN111858613A (zh) * 2020-07-31 2020-10-30 湖北亿咖通科技有限公司 一种业务数据的检索方法
CN112989228A (zh) * 2021-04-25 2021-06-18 湖南视觉伟业智能科技有限公司 分布式时空查询方法及***
CN113254451A (zh) * 2021-06-01 2021-08-13 北京城市网邻信息技术有限公司 一种数据索引构建方法、装置、电子设备及存储介质
CN113961573A (zh) * 2021-12-23 2022-01-21 北京力控元通科技有限公司 一种时序数据库查询方法和查询***

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105389370A (zh) * 2015-11-13 2016-03-09 浙江工业大学 一种面向社交活动组织的时间聚合查询方法
CN106844790A (zh) * 2017-03-22 2017-06-13 中国人民解放军国防科学技术大学 一种用于社交网络中用户组分析的快速时态查询方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105389370A (zh) * 2015-11-13 2016-03-09 浙江工业大学 一种面向社交活动组织的时间聚合查询方法
CN106844790A (zh) * 2017-03-22 2017-06-13 中国人民解放军国防科学技术大学 一种用于社交网络中用户组分析的快速时态查询方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
XIAOYING CHEN等: "Historical Geo-Social Query Processing", 《ASIA-PACIFIC WEB CONFERENCE 2016: WEB TECHNOLOGIES AND APPLICATIONS》 *
XIAOYING CHEN等: "Spatio-temporal Queries in HBase", 《2015 IEEE INTERNATIONAL CONFERENCE ON BIG DATA》 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110084714A (zh) * 2019-04-25 2019-08-02 太原理工大学 基于有向树的社交网络影响力最大化方法、装置及设备
CN110084714B (zh) * 2019-04-25 2021-05-07 太原理工大学 基于有向树的社交网络影响力最大化方法、装置及设备
CN110347925A (zh) * 2019-07-12 2019-10-18 腾讯科技(深圳)有限公司 信息处理方法及计算机可读存储介质
CN110347925B (zh) * 2019-07-12 2023-11-14 腾讯科技(深圳)有限公司 信息处理方法及计算机可读存储介质
CN110532437A (zh) * 2019-07-18 2019-12-03 平安科技(深圳)有限公司 电子凭证提示方法、装置、计算机设备及存储介质
CN110532437B (zh) * 2019-07-18 2023-08-01 平安科技(深圳)有限公司 电子凭证提示方法、装置、计算机设备及存储介质
CN111858613A (zh) * 2020-07-31 2020-10-30 湖北亿咖通科技有限公司 一种业务数据的检索方法
CN112989228A (zh) * 2021-04-25 2021-06-18 湖南视觉伟业智能科技有限公司 分布式时空查询方法及***
CN112989228B (zh) * 2021-04-25 2021-08-27 湖南视觉伟业智能科技有限公司 分布式时空查询方法及***
CN113254451A (zh) * 2021-06-01 2021-08-13 北京城市网邻信息技术有限公司 一种数据索引构建方法、装置、电子设备及存储介质
CN113961573A (zh) * 2021-12-23 2022-01-21 北京力控元通科技有限公司 一种时序数据库查询方法和查询***

Similar Documents

Publication Publication Date Title
CN108460102A (zh) 社交网络数据查询方法、装置、计算机设备和存储介质
Yuan et al. Index-based densest clique percolation community search in networks
US8700605B1 (en) Estimating rows returned by recursive queries using fanout
Baralis et al. Generalized association rule mining with constraints
CN103714134B (zh) 一种网络流量数据索引方法及***
EP2746970B1 (en) Timeline index for managing temporal data
US8108399B2 (en) Filtering of multi attribute data via on-demand indexing
Liu et al. U-skyline: A new skyline query for uncertain databases
CN105912666B (zh) 一种面向云平台的混合结构数据高性能存储、查询方法
US20140317117A1 (en) Method, device and computer storage media for user preferences information collection
JP2017512344A (ja) 迅速なデータ解析のためのシステム及び方法
CN107145526B (zh) 一种路网下地理社交关键字反最近邻查询处理方法
CN101901242A (zh) 联合的配置数据管理
US9135630B2 (en) Systems and methods for large-scale link analysis
Mahmood et al. FAST: frequency-aware indexing for spatio-textual data streams
CN110928882B (zh) 一种基于改进红黑树的内存数据库索引方法及***
CN107832333B (zh) 基于分布式处理和dpi数据构建用户网络数据指纹的方法和***
US8150790B2 (en) Lightweight physical design alerter
US20110179013A1 (en) Search Log Online Analytic Processing
CN101256579A (zh) 一种数据库范围查询数据组织的方法
CN112434027A (zh) 多维度数据的索引方法、装置、计算机设备和存储介质
CN104750860B (zh) 一种不确定数据的数据存储方法
US20060143206A1 (en) Interval tree for identifying intervals that intersect with a query interval
US20160078071A1 (en) Large scale offline retrieval of machine operational information
CN111782663A (zh) 一种提升聚合查询效率的聚合索引结构及聚合索引方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180828