CN114970621A - 异常聚集事件的检测方法、装置、电子设备和存储介质 - Google Patents

异常聚集事件的检测方法、装置、电子设备和存储介质 Download PDF

Info

Publication number
CN114970621A
CN114970621A CN202210550795.8A CN202210550795A CN114970621A CN 114970621 A CN114970621 A CN 114970621A CN 202210550795 A CN202210550795 A CN 202210550795A CN 114970621 A CN114970621 A CN 114970621A
Authority
CN
China
Prior art keywords
sub
region
abnormal
event
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210550795.8A
Other languages
English (en)
Inventor
肖艳清
张钧波
郑宇�
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jingdong City Beijing Digital Technology Co Ltd
Original Assignee
Jingdong City Beijing Digital Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jingdong City Beijing Digital Technology Co Ltd filed Critical Jingdong City Beijing Digital Technology Co Ltd
Priority to CN202210550795.8A priority Critical patent/CN114970621A/zh
Publication of CN114970621A publication Critical patent/CN114970621A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/02Preprocessing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • Tourism & Hospitality (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Educational Administration (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Signal Processing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

本公开提出一种异常聚集事件的检测方法、装置、电子设备和存储介质,其中,方法包括:根据设定网格间距,对设定区域进行网格划分,以得到设定区域的多个子区域;针对每个子区域,获取在多个时刻对子区域中的对象进行监测得到的监测数据,以得到各子区域的监测数据序列;对各子区域的监测数据序列中的监测数据进行特征提取,以得到对应子区域的目标特征;根据各子区域的目标特征,对各子区域进行聚集事件检测,以得到各子区域的异常聚集检测结果。由此,通过各个子区域的监测数据序列中的监测数据进行特征提取,得到对应子区域的目标特征,并根据各个子区域的目标特征,可准确地确定各子区域是否发生异常聚集以及发生异常聚集的子区域发生异常聚集的时刻。

Description

异常聚集事件的检测方法、装置、电子设备和存储介质
技术领域
本公开涉及数据处理技术领域,尤其涉及一种异常聚集事件的检测方法、装置、电子设备和存储介质。
背景技术
随着现代化和城市化进程的不断推进,使得城镇人口不断增加,城镇的商业中心、公共交通、娱乐场所、体育场所、政府门口、企业门口等经常出现大量的人群,为了更好地进行市域治理,如何及时发现人群是否异常聚集,是智能城市建设过程中关注的技术问题。
目前,通过运营商信令数据实现的人群监控,多为对信令数据实时统计分析,统计结果只能说明当前人数是否增加,无法准确地确定是否发生异常聚集。
发明内容
本公开第一方面实施例提出一种异常聚集事件的检测方法。
本公开第二方面实施例提出一种异常聚集事件的检测装置。
本公开第三方面实施例提出一种电子设备。
本公开第四方面实施例提出一种计算机可读存储介质。
本公开第一方面实施例提出了一种异常聚集事件的检测方法,包括:根据设定网格间距,对设定区域进行网格划分,以得到所述设定区域的多个子区域;针对每个所述子区域,获取在多个时刻对所述子区域中的对象进行监测得到的监测数据,以得到各所述子区域的监测数据序列;对各所述子区域的监测数据序列中的监测数据进行特征提取,以得到对应子区域的目标特征;根据各所述子区域的目标特征,对各所述子区域进行聚集事件检测,以得到各所述子区域的异常聚集检测结果。
本公开实施例的异常聚集事件的检测方法,通过各个子区域的监测数据序列中的监测数据进行特征提取,得到对应子区域的目标特征,并根据各个子区域的目标特征,可准确地确定各子区域是否发生异常聚集以及发生异常聚集的子区域发生异常聚集的时刻。
另外,根据本公开上述实施例的异常聚集事件的检测方法还可以具有如下附加的技术特征:
在本公开的一个实施例中,所述目标特征包括:统计特征;对各所述子区域的监测数据序列中的监测数据进行特征提取,以得到对应子区域的目标特征,包括:从各所述子区域的监测数据序列中,获取目标时刻之前的设定时间段内的第一子监测数据序列;对各所述子区域的第一子监测数据序列中至少一个历史监测数据进行特征提取,以得到对应子区域在所述目标时刻的统计特征。
在本公开的一个实施例中,所述目标特征包括:时间特征,对各所述子区域的监测数据序列中的监测数据进行特征提取,以得到对应子区域的目标特征,包括:对各所述子区域所采集的第一目标数据对应的所述目标时刻进行特征提取,以得到对应子区域在所述目标时刻的时间特征。
在本公开的一个实施例中,所述目标特征包括:时空依赖特征,所述对各所述子区域的监测数据序列中的监测数据进行特征提取,以得到对应子区域的目标特征,包括:从各所述子区域的监测数据序列中,获取所述目标时刻的上一时刻所采集的第二目标数据,以及从对应子区域的邻接区域的监测数据序列中,获取所述目标时刻采集的第三目标数据;根据各所述子区域对应的所述第二目标数据以及所述第三目标数据,确定对应子区域的时空依赖特征。
在本公开的一个实施例中,所述根据各所述子区域的目标特征,对各所述子区域进行聚集事件检测,以得到各所述子区域的异常聚集检测结果,包括:根据各所述子区域所在的地理位置信息,确定各所述子区域的兴趣点POI类别;根据各所述子区域的POI类别,确定对应所述子区域的异常聚集模型;将各所述子区域的所述目标特征,输入至对应的异常聚集模型中进行聚集事件检测,以得到各所述子区域的异常聚集检测结果。
在本公开的一个实施例中,所述异常聚集模型通过以下步骤训练得到:获取样本数据序列集;其中,所述样本数据序列集中的各样本数据序列标注有发生异常聚集的标注子区域以及各所述标注子区域发生异常聚集的标注时刻;提取各所述样本数据序列的特征,以得到各所述标注子区域的样本特征;将各所述标注子区域的样本特征输入至所述异常聚集模型中,得到发生异常聚集的预测子区域以及各所述预测子区域发生异常聚集的预测时刻;根据所述标注子区域与所述预测子区域的第一差异,以及所述标注时刻与所述预测时刻的第二差异,对所述异常聚集模型进行训练。
在本公开的一个实施例中,所述方法还包括:在设定时空坐标系中,根据各所述子区域的地理位置信息和各所述子区域对应的所述目标时刻,确定各子区域的坐标位置;针对所述异常聚集检测结果中任意两个发生异常聚集的子区域,根据所述任意两个发生异常聚集的子区域在所述时空坐标系中的坐标位置,确定所述两个发生异常聚集的子区域之间的距离;在所述距离小于所述距离阈值或者所述距离处于设定距离范围内时,将所述任意两个发生异常聚集的子区域发生的异常聚集事件确定为同一异常聚集事件;根据所述异常聚集事件的异常聚集类型,进行异常聚集事件处置方法推荐。
在本公开的一个实施例中,所述方法还包括:获取包含热点事件的候选文档;根据所述异常聚集事件,从所述候选文档中确定目标文档;其中,所述目标文档中热点事件的发生时间与所述异常聚集事件的发生的时间区间匹配,所述目标文档中热点事件的发生地点与发生所述异常聚集事件的子区域的经纬度范围匹配;根据所述目标文档中的热点事件的发生时间、发生地点,确定所述异常聚集事件的类型。
在本公开的一个实施例中,所述根据所述目标文档中的热点事件的发生时间、发生地点以及所述异常聚集事件的特征,确定所述同一异常聚集事件的类型,包括:将所述目标文档中的热点事件的发生时间、发生地点以及所述异常聚集事件的特征,输入异常事件分类模型中,以得到所述同一异常聚集事件的类型。
在本公开的一个实施例中,所述异常事件分类模型通过以下步骤训练得到:获取样本训练数据;其中,所述样本训练数据标注有异常聚集事件的标注类别;将所述样本训练数据中的热点事件的发生时间、发生地点以及历史异常聚集事件的特征输入至所述异常事件分类模型中,以得到异常聚集事件的预测类别;根据所述预测类别与所述标注类别的差异,对所述异常事件分类模型进行训练。
本公开第二方面实施例提出了一种异常聚集事件的检测装置,包括:划分模块,用于根据设定网格间距,对设定区域进行网格划分,以得到所述设定区域的多个子区域;采集模块,用于针对每个所述子区域,获取在多个时刻对所述子区域中的对象进行监测得到的监测数据,以得到各所述子区域的监测数据序列;第一提取模块,用于对各所述子区域的监测数据序列中的监测数据进行特征提取,以得到对应子区域的目标特征;检测模块,用于根据各所述子区域的目标特征,对各所述子区域进行聚集事件检测,以得到各所述子区域的异常聚集检测结果。
本公开第三方面实施例提出了一种电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如前述第一方面实施例所述的异常聚集事件的检测方法。
本公开第四方面实施例提出了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时,实现如本公开第一方面实施例所述的异常聚集事件的检测方法。
本公开第五方面实施例提出了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现如本公开第一方面实施例所述的异常聚集事件的检测方法。
本公开附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本公开的实践了解到。
附图说明
本公开上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为根据本公开一个实施例的异常聚集事件的检测方法的流程示意图;
图2为根据本公开另一个实施例的异常聚集事件的检测方法的流程示意图;
图3为根据本公开另一个实施例的异常聚集事件的检测方法的流程示意图;
图4为根据本公开另一个实施例的异常聚集事件的检测方法的流程示意图;
图5为根据本公开一个实施例的设定区域的网格划分示意图;
图6为根据本公开另一个实施例的异常聚集事件的检测方法的流程示意图;
图7为根据本公开另一个实施例的异常聚集事件的检测方法的流程示意图;
图8为根据本公开另一个实施例的异常聚集事件的检测方法的流程示意图;
图9为根据本公开一个实施例的时空坐标系示意图;
图10为根据本公开另一个实施例的异常聚集事件的检测方法的流程示意图;
图11为根据本公开的一个实施例的异常聚集事件的检测方法的流程示意图;
图12为根据本公开实施例的一种异常聚集事件的检测装置的结构示意图;
图13是根据一示例性实施例示出的一种用于异常聚集事件的检测的电子设备的框图。
具体实施方式
下面详细描述本公开的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本公开,而不能理解为对本公开的限制。
下面参照附图描述本公开实施例的异常聚集事件的检测方法、装置、电子设备和存储介质。需要说明的是,本公开实施例的异常聚集事件的检测方法可应用于本公开实施例的异常聚集事件的检测装置,该装置可被配置于电子设备中。其中,该电子设备可以是移动终端,例如,手机、平板电脑、个人数字助理等具有各种操作***的硬件设备。
图1为根据本公开一个实施例的异常聚集事件的检测方法的流程示意图。
如图1所示,该异常聚集事件的检测方法,可包括如下步骤:
步骤101,根据设定网格间距,对设定区域进行网格划分,以得到设定区域的多个子区域。
在本公开实施例中,对于运营商提供的信令数据中对应的设定区域,可根据设定网格间距进行网格划分,得到该设定区域对应的多个子区域,比如,设定网格为150*150,根据该网格对设定区域进行网格划分,该设定区域中的每个网格可为一个子区域。
步骤102,针对每个子区域,获取在多个时刻对子区域中的对象进行监测得到的监测数据,以得到各子区域的监测数据序列。
作为一种示例,以设定周期,采集每个子区域中对对象进行监测得到的监测数据,从而可以获取各子区域的多个时刻对对象进行监测得到的监测数据,并根据各个子区域的多个时刻的监测数据,生成各个子区域的监测数据序列,比如,以设定周期为5分钟为例,异常聚集事件的检测装置每5分钟对运营商提供的信令数据进行统计,获取子区域内的实时监测数据,从而,可获取该子区域多个时刻的监测数据,将该子区域多个时刻的监测数据按照监测时刻进行排列,可生成该子区域的多个时刻的监测数据序列。其中,需要说明的是,各子区域的对应的监测数据可包括:监测的对象数量、监测的对象所处的地理位置以及各对象在对应子区域的时刻等。
步骤103,对各子区域的监测数据序列中的监测数据进行特征提取,以得到对应子区域的目标特征。
进一步地,可采用相关特征提取算法对子区域的监测数据序列中的监测数据进行特征提取,以获取对应子区域的目标特征,其中,需要说明的是,目标特征可包括:统计特征、时间特征和时空依赖特征中的至少一个。
步骤104,根据各子区域的目标特征,对各子区域进行聚集事件检测,以得到各子区域的异常聚集检测结果。
在本公开实施例中,可根据目标特征中的一个或多个特征,对各子区域进行聚集事件检测,以得到各子区域的异常聚集检测结果。其中,异常聚集检测结果可包括各子区域是否发生异常聚集以及发生异常聚集的子区域的对应的发生异常聚集的时刻。
综上,通过各个子区域的监测数据序列中的监测数据进行特征提取,得到对应子区域的目标特征,并根据各个子区域的目标特征,可准确地确定各子区域是否发生异常聚集以及发生异常聚集的子区域的发生异常聚集的时刻。
在本公开实施例中,目标特征可包括:统计特征、时间特征和时空依赖特征中的至少一个,为了准确地获取目标特征中的统计特征,进而,根据该统计特征准确地对各子区域进行聚集事件检测,如图2所示,图2为根据本公开另一个实施例的异常聚集事件的检测方法的流程示意图,可根据各子区域中的目标时刻之前的设定时间段内的历史监测数据,得到对应子区域在目标时刻的统计特征,图2所示实施例可包括如下步骤:
步骤201,根据设定网格间距,对设定区域进行网格划分,以得到设定区域的多个子区域。
步骤202,针对每个子区域,获取在多个时刻对所述子区域中的对象进行监测得到的监测数据,以得到各子区域的监测数据序列。
步骤203,从各子区域的监测数据序列中,获取目标时刻之前的设定时间段内的第一子监测数据序列。
比如,目标时刻为9月1日14:00,子区域的数量为16个,分别为(w1,w2...w16),设定时间段为8月1日至8月31日,从各区域的监测数据序列中,获取8月1日至8月31日的子监测数据序列,作为第一子监测数据序列。
需要说明的是,目标时刻的个数可为一个或多个,目标时刻可为当前时刻,或者当前时刻之前的任一时刻。
步骤204,对各子区域的第一子监测数据序列中至少一个历史监测数据进行特征提取,以得到对应子区域在目标时刻的统计特征。
进一步地,对各子区域的第一子监测数据序列中的至少一个历史监测数据进行特征提取,以得到对应子区域在目标时刻的统计特征。比如,根据至少一个历史监测数据,进行数据统计,以确定各对应子区域在目标时刻的统计特征,如,设定时间段为8月1日至8月31日,从各区域的监测数据序列中,获取8月1日至8月31日的子监测数据序列,并计算各子监测数据序列对应的方差、最大值、中位数、对象数量均值等;又比如,设定时间段为目标时刻的上一个工作日(如,8月31日),从各区域的监测数据序列中,获取8月31日的子监测数据序列,并计算8月31日的各子监测数据序列对应的方差、最大值、中位数、对象数量均值等。
步骤205,根据各子区域的在目标时刻的统计特征,对各子区域进行聚集事件检测,以得到各子区域的异常聚集检测结果。
作为本公开实施例的一种可能实现方式,可根据各子区域在多个目标时刻的统计特征,确定各子区域在不同目标时刻的统计特征的变化趋势,根据各子区域在不同时刻的统计的变化趋势,确定各子区域的异常聚集检测结果。比如,可根据各子区域在目标时刻的统计特征中的对象数量的最大值,确定各子区域在不同时刻的对象数量最大值的变化趋势,在变化趋势呈上升趋势,且对象数量的变化值大于设定变化阈值时,可确定对应子区域发生异常聚集,并将对象数量的变化值大于设定变化阈值的时刻作为该子区域发生异常聚集的时刻。
需要说明的是,步骤201-202的执行过程可以分别采用本公开的各实施例中的任一种方式实现,本公开实施例并不对此作出限定,也不再赘述。
综上,通过从各子区域的监测数据序列中,获取目标时刻之前的设定时间段内的第一子监测数据序列;对各子区域的第一子监测数据序列中至少一个历史监测数据进行特征提取,以得到对应子区域在目标时刻的统计特征,由此,根据各子区域中的目标时刻之前的设定时间段内的子监测数据序列中的历史监测数据,可准确地确定目标特征中的统计特征,进而,根据该统计特征,可确定各子区域是否发生异常聚集以及发生异常聚集的子区域的对应的发生异常聚集的时刻。
为了准确地获取目标特征中的时间特征,如图3所示,图3为根据本公开另一个实施例的异常聚集事件的检测方法的流程示意图,在本公开实施例中,可对各子区域对应的目标时刻所采集的第一目标数据进行特征提取,得到对应子区域在目标时刻的时间特征,图3所示实施例可包括如下步骤:
步骤301,根据设定网格间距,对设定区域进行网格划分,以得到设定区域的多个子区域。
步骤302,针对每个子区域,获取在多个时刻对子区域中的对象进行监测得到的监测数据,以得到各子区域的监测数据序列。
步骤303,对各子区域对应的目标时刻所采集的第一目标数据进行特征提取,以得到对应子区域在目标时刻的时间特征。
在本公开实施例中,时间特征可包括但不限于所属月份、是否节假日以及一周第几天等,为了准确地确定各子区域在目标时刻的时间特征,可对各子区域所采集的第一目标数据对应的目标时刻进行特征提取,以得到对应子区域在目标时刻的时间特征。其中,第一目标数据可为目标时刻对应的监测数据序列中的监测数据。
比如,各子区域所采集的第一目标数据对应的目标时刻为2021年9月1日14:00,可对目标时刻2021年9月1日14:00进行特征提取,可得到各子区域在2021年9月1日对应的时间特征为月份为9月份,一周的第3天,节假日是0(0代表非节假日,1代表节假日)。
步骤304,根据各子区域在目标时刻的时间特征,对各子区域进行聚集事件检测,以得到各子区域的异常聚集检测结果。
进一步地,根据对各子区域在目标时刻的时间特征进行分析,可确定各子区域的异常聚集检测结果。比如,目标时刻2021年9月1日14:00,对应的时间特征为9月份,一周的第三天,且为非节假日,若各子区域的第一目标数据对应的对象数量值较大,可确定对应子区域可能发生异常聚集以及该子区域的对应的发生异常聚集的时刻为该目标时刻。
需要说明的是,步骤301-302的执行过程可以分别采用本公开的各实施例中的任一种方式实现,本公开实施例并不对此作出限定,也不再赘述。
综上,通过对各子区域对应的目标时刻所采集的第一目标数据进行特征提取,以得到对应子区域在目标时刻的时间特征;根据各子区域在目标时刻的时间特征,对各子区域进行聚集事件检测,以得到各子区域的异常聚集检测结果,由此,根据各子区域中的所采集的第一目标数据对应的目标时刻,可准确地确定目标特征中的时间特征,进而,根据该时间特征,可确定各子区域是否发生异常聚集以及发生异常聚集的子区域发生异常聚集的时刻。
为了准确地获取目标特征中的时空依赖特征,如图4所示,图4为根据本公开另一个实施例的异常聚集事件的检测方法的流程示意图,在本公开实施例中,可根据各子区域的监测数据序列中的目标时刻的上一时刻所采集的第二目标数据,以及对应子区域的邻接区域的监测数据序列中的目标时刻所采集的第三目标数据,确定对应子区域的时空依赖特征,图4实施例可包括如下步骤:
步骤401,根据设定网格间距,对设定区域进行网格划分,以得到设定区域的多个子区域。
步骤402,针对每个子区域,获取在多个时刻对子区域中的对象进行监测得到的监测数据,以得到各子区域的监测数据序列。
步骤403,从各子区域的监测数据序列中,获取目标时刻的上一时刻所采集的第二目标数据,以及从对应子区域的邻接区域的监测数据序列中,获取目标时刻采集的第三目标数据。
举例而言,如图5所示,以目标时刻为2021年9月1日14:00为例,目标时刻的上一时刻为2021年9月1日13:55,针对图5中的网格w6对应的子区域,可获取网格w6在2021年9月1日13:55对应的监测数据,作为第二目标数据,网格w6对应的子区域的邻接区域为网格w1、w2、w3、w5、w7、w9、w10、w11对应的子区域,可获取网格w1、w2、w3、w5、w7、w9、w10、w11在2021年9月1日14:00对应的监测数据,作为第三目标数据。
步骤404,根据各子区域对应的第二目标数据以及第三目标数据,确定对应子区域的时空依赖特征。
进一步地,可将各子区域对应的第二目标数据以及第三目标数据,作为对应子区域的时空依赖特征。
步骤405,根据各子区域的时空依赖特征,对各子区域进行聚集事件检测,以得到各子区域的异常聚集检测结果。
作为本公开实施例的一种可能实现方式,针对各子区域中的任一子区域,可根据该子区域在目标时刻的上一时刻所采集的第二目标数据,以及该子区域的邻接区域的在目标时刻采集的第三目标数据,可预测该子区域在目标时刻的是否发生异常聚集以及该子区域的邻接区域是否也发生异常聚集。
作为一种示例,对各子区域中的任一子区域,可根据该子区域在目标时刻的上一时刻对应的监测数据,结合该子区域在目标时刻的监测数据,预测该子区域在目标时刻是否发生异常聚集,以及该子区域的邻接区域在目标时刻是否也发生异常聚集,比如,以子区域为图5中的网格w6,目标时刻为2021年9月1日14:00为例,可根据网格w6在2021年9月1日13:55(上一时刻)的监测数据(人群数量),结合该子区域在2021年9月1日14:00的监测数据,如,网格w6在2021年9月1日13:55(上一时刻)的监测数据值较低,子区域在2021年9月1日14:00的监测数据较大,该子区域的邻接区域在目标时刻的监测数据较低,可表示该子区域可能发生异常聚集以及该子区域发生异常聚集的时刻为2021年9月1日14:00,该子区域的邻接区域没有发生异常聚集。
需要说明的是,步骤401-402的执行过程可以分别采用本公开的各实施例中的任一种方式实现,本公开实施例并不对此作出限定,也不再赘述。
综上,通过从各子区域的监测数据序列中,获取目标时刻的上一时刻所采集的第二目标数据,以及从对应子区域的邻接区域的监测数据序列中,获取目标时刻采集的第三目标数据;根据各子区域对应的第二目标数据以及第三目标数据,确定对应子区域的时空依赖特征;根据各子区域的时空依赖特征,对各子区域进行聚集事件检测,以得到各子区域的异常聚集检测结果,由此,可根据各子区域的监测数据序列中的目标时刻的上一时刻所采集的第二目标数据,以及对应子区域的邻接区域的监测数据序列中的目标时刻所采集的第三目标数据,可准确地确定对应子区域的时空依赖特征,进而,根据该时空依赖特征,可确定各子区域是否发生异常聚集以及发生异常聚集的子区域发生异常聚集的时刻。
为了根据目标特征更加准确地确定各子区域的异常聚集检测结果,如图6所示,图6为根据本公开另一个实施例的异常聚集事件的检测方法的流程示意图,在本公开实施例中,目标特征可包括统计特征、时间特征和时空依赖特征,可将目标特征输入至对应的异常聚集检测模型中,以得到各子区域的异常聚集检测结果,图6所示实施例可包括如下步骤:
步骤601,根据设定网格间距,对设定区域进行网格划分,以得到设定区域的多个子区域。
步骤602,针对每个子区域,获取在多个时刻对子区域中的对象进行监测得到的监测数据,以得到各子区域的监测数据序列。
步骤603,从各子区域的监测数据序列中,获取目标时刻之前的设定时间段内的第一子监测数据序列。
步骤604,对各子区域的第一子监测数据序列中至少一个历史监测数据进行特征提取,以得到对应子区域在目标时刻的统计特征。
步骤605,对各子区域所采集的第一目标数据对应的目标时刻进行特征提取,以得到对应子区域在目标时刻的时间特征。
步骤606,从各子区域的监测数据序列中,获取目标时刻的上一时刻所采集的第二目标数据,以及从对应子区域的邻接区域的监测数据序列中,获取目标时刻采集的第三目标数据。
步骤607,根据各子区域对应的第二目标数据以及第三目标数据,确定对应子区域的时空依赖特征。
步骤608,根据各子区域所在的地理位置信息,确定各所述子区域的兴趣点POI类别。
在本公开实施例中,兴趣点(Point of Interest,简称POI)类别可为各子区域所在的地理位置对应的类型,比如,兴趣点可包括商业街、路网、学校、医院、政府建筑、公园和写字楼等。
作为本公开实施例的一种可能实现方式,可根据各子区域的经纬度信息确定各子区域的POI,根据各子区域的POI信息可确定各子区域的POI类别,例如,子区域为图5中的网格w6,根据网格w6经纬度匹配可确定网格w6所在的POI信息,根据POI信息可提取出POI类别,如,网格w6的POI类别为道路。
步骤609,根据各子区域的POI类别,确定对应子区域的异常聚集模型。
在本公开实施例中,POI类别不同,对应子区域的异常聚集模型也不同。为了准确地确定对应子区域的异常聚集模型,可根据各子区域的POI类别,对各子区域的POI类别进行分类,其中,需要说明的是,可根据各子区域的POI类别,确定具有相同POI类别的子区域,将具有相同POI类别的子区域划分为同一类,且具有相同的异常聚集模型。比如,假设16个子区域的POI类别均为公园,则16个子区域对应的异常聚集模型为公园类别的异常聚集模型。
步骤610,将各子区域的统计特征、时间特征和时空依赖特征,输入至对应的异常聚集模型中进行聚集事件检测,以得到各子区域的异常聚集检测结果。
进一步地,可将各子区域的统计特征、时间特征和时空依赖特征,输入至对应的异常聚集模型中进行聚集事件检测,各子区域对应的异常聚集模型可输出各子区域是否发生异常聚集以及发生异常聚集的子区域发生异常聚集的时刻,同时,还会输出各子区域的异常聚集的置信度,该置信度可表征各子区域发生异常聚集的概率。
需要说明的是,步骤601-607的执行过程可以分别采用本公开的各实施例中的任一种方式实现,本公开实施例并不对此作出限定,也不再赘述。
综上,通过根据各子区域所在的地理位置信息,确定各所述子区域的兴趣点POI类别;根据各子区域的POI类别,确定对应子区域的异常聚集模型;将各子区域的统计特征、时间特征和时空依赖特征,输入至对应的异常聚集模型中进行聚集事件检测,以得到各子区域的异常聚集检测结果,由此,根据目标特征中的统计特征、时间特征和时空依赖特征,可更加准确地确定各子区域的异常聚集检测结果。
为了自动对目标特征进行判定,以确定各子区域是否发生异常聚集以及发生异常聚集的子区域发生异常聚集的时刻,如图7所示,图7为根据本公开一个实施例的异常聚集事件的检测方法的流程示意图,在本公开实施例中,可对异常聚集模型进行训练,以使异常聚集模型学习到目标特征与各子区域是否发生异常聚集以及发生异常聚集的子区域发生异常聚集的时刻的对应关系,图7所示实施例可包括如下步骤:
步骤701,根据设定网格间距,对设定区域进行网格划分,以得到设定区域的多个子区域。
步骤702,针对每个子区域,获取在多个时刻对子区域中的对象进行监测得到的监测数据,以得到各子区域的监测数据序列。
步骤703,对各子区域的监测数据序列中的监测数据进行特征提取,以得到对应子区域的目标特征。
步骤704,根据各子区域所在的地理位置信息,确定各子区域的兴趣点POI类别。
步骤705,获取样本数据序列集;其中,样本数据序列集中的各样本数据序列标注有发生异常聚集的标注子区域以及各标注子区域发生异常聚集的标注时刻。
在本公开实施例中,可通过各子区域的对象历史监测数据确定样本数据序列集,其中,样本数据序列集中的各样本数据序列标注有发生异常聚集的标注子区域以及各标注子区域发生异常聚集的标注时刻。其中,需要说明的是,样本数据序列集中可包含正样本数据序列集和负样本数据序列集,其中,正样本数据序列集为发生异常聚集的标注子区域以及对应子区域发生异常聚集的标注时刻,对应的标签为true;负样本数据序列集为发生异常聚集的子区域对应的未发生异常聚集的标注时刻,对应的标签为false。
步骤706,提取各样本数据序列的特征,以得到各标注子区域的样本特征。
进一步地,可对各样本数据序列进行特征提取,以得到各标注子区域的样本特征,其中,样本特征可包括但不限于样本统计特征、样本时间特征和样本时空依赖特征。比如,可对正样本数据序列集中的发生异常聚集的子区域的发生异常聚集时刻的数据进行特征提取,以确定发生异常聚集时刻的所有样本特征,对负样本数据序列集中发生异常聚集的子区域的未发生异常聚集时刻的数据进行特征提取,以确定未发生异常聚集时刻的所有样本特征。
步骤707,将各标注子区域的样本特征输入至异常聚集模型中,得到发生异常聚集的预测子区域以及各预测子区域发生异常聚集的预测时刻。
在本公开实施例中,可将各标注子区域的样本特征输入至异常聚集模型中,异常聚集模型可输出发生异常聚集的预测子区域以及各预测子区域发生异常聚集的预测时刻。
步骤708,根据标注子区域与预测子区域的第一差异,以及标注时刻与预测时刻的第二差异,对异常聚集模型进行训练。
进而,将标注子区域与预测子区域进行比对,以确定标注子区域与预测子区域的第一差异,并根据第一差异确定第一子损失函数,将标注时刻与预测时刻进行比对,以确定标注时刻与预测时刻的第二差异,并根据第二差异确定第二子损失函数,接着,根据第一子损失函数和第二子损失函数对异常聚集模型进行训练,以使第一子损失函数和/或第二子损失函数最小化。
需要说明的是,本公开实施例对异常聚集模型的训练时机不做具体限定,仅需在步骤709之前训练得到即可。需要说明的是,为了是异常聚集模型更加准确,可选地,获取测试数据集,采用测试数据集对已训练的异常聚集模型进行测试,作为一种示例,可采用测试数据集中的正样本测试数据集和负样本测试数据集对已训练的异常聚集模型分别进行测试,进而,根据异常聚集模型的输出结果,可验证该异常聚集模型的预测结果是否准确,在异常聚集模型的预测结果不准确时,可继续对该异常聚集模型进行参数调整,直至异常聚集模型的预测结果准确,进而,可将通过测试的且预测结果准确的异常聚集模型进行各子区域的聚集事件检测。
步骤709,将各子区域的目标特征,输入至对应的异常聚集模型中进行聚集事件检测,以得到各子区域的异常聚集检测结果。
需要说明的是,步骤701-704、步骤709的执行过程可以分别采用本公开的各实施例中的任一种方式实现,本公开实施例并不对此作出限定,也不再赘述。
综上,通过获取样本数据序列集;其中,样本数据序列集中的各样本数据序列标注有发生异常聚集的标注子区域以及各标注子区域发生异常聚集的标注时刻;提取各样本数据序列的特征,以得到各标注子区域的样本特征;将各标注子区域的样本特征输入至异常聚集模型中,得到发生异常聚集的预测子区域以及各预测子区域发生异常聚集的预测时刻;根据标注子区域与预测子区域的第一差异,以及标注时刻与预测时刻的第二差异,对异常聚集模型进行训练。由此,可对异常聚集模型进行训练,以使异常聚集模型学习得到目标特征与各子区域是否发生异常聚集以及发生异常聚集的子区域发生异常聚集的时刻的对应关系。
为了便于区域管理人员对发生异常聚集的子区域进行管理,如图8所示,图8为根据本公开另一个实施例的异常聚集事件的检测方法的流程示意图,可在时空坐标系中,确定发生异常聚集的两个子区域之间的距离,进而确定两个子区域发生的异常聚集事件是否为同一异常聚集事件,在该异常聚集事件为同一异常聚集事件时,可根据该异常聚集事件的类型,对异常聚集事件的处置方式进行推荐,图8所示实施例可包括如下步骤:
步骤801,根据设定网格间距,对设定区域进行网格划分,以得到设定区域的多个子区域。
步骤802,针对每个子区域,获取在多个时刻对子区域中的对象进行监测得到的监测数据,以得到各子区域的监测数据序列。
步骤803,对各子区域的监测数据序列中的监测数据进行特征提取,以得到对应子区域的目标特征。
步骤804,根据各子区域的目标特征,对各子区域进行聚集事件检测,以得到各子区域的异常聚集检测结果。
步骤805,在设定时空坐标系中,根据各子区域的地理位置信息和各子区域对应的目标时刻,确定各子区域的坐标位置。
在本公开实施例中,如图9所示,可绘制三维图,将该三维图作为时空坐标系,并在该时空坐标系中,将各子区域(网格w1至网格w16)按照地理位置信息和时间先后排序,确定各子区域在时空坐标系中的坐标位置。
步骤806,针对异常聚集检测结果中任意两个发生异常聚集的子区域,根据任意两个发生异常聚集的子区域在时空坐标系中的坐标位置,确定所述两个发生异常聚集的子区域之间的距离。
进一步地,针对异常聚集检测结果中任意两个发生异常聚集的子区域,可获取该任意两个发生异常聚集的子区域在时空坐标系中的坐标位置,或者,获取该任意两个发生异常聚集的子区域的中心点在时空坐标系中的坐标位置,根据该任意两个发生异常聚集的子区域在时空坐标系中的坐标位置,或者该任意两个发生异常聚集的子区域的中心点在时空坐标系中的坐标位置,可确定该两个发生异常聚集的子区域之间的距离。比如,图9中的网格w6在(t-3)时刻与网格w1在(t-2)时刻发生异常聚集,w6在(t-3)时刻的坐标为(2,2,1),w1在(t-2)时刻的坐标为(1,1,2),坐标(2,2,1)与坐标(1,1,2)之间的距离为1.73;又比如,图9中的网格w6在(t-3)时刻与网格w12在(t-3)时刻发生异常聚集,w6在(t-3)时刻的坐标为(2,2,1),w12在(t-3)时刻的坐标为(4,3,1),坐标(2,2,1)与坐标(4,3,1)之间的距离为2.23。
步骤807,在距离小于距离阈值或者距离处于设定距离范围内时,将任意两个发生异常聚集的子区域发生的异常聚集事件确定为同一异常聚集事件。
进一步地,将距离与距离阈值进行比对,若距离小于距离阈值,且距离处于设定距离范围内时,可确定该任意两个发生异常聚集的子区域发生的异常聚集事件为同一异常聚集事件。比如,w6在(t-3)时刻的坐标位置与网格w1在(t-2)时刻坐标位置之间的距离为1.73,距离阈值为2,w6在(t-3)时刻的坐标位置与网格w1在(t-2)时刻坐标位置之间的距离小于距离阈值,w6在(t-3)时刻与网格w1在(t-2)时刻发生异常聚集为同一异常聚集事件;又比如,网格w6在(t-3)时刻的坐标位置与网格w12在(t-3)时刻的坐标位置之间的距离为2.23,w6在(t-3)时刻的坐标位置与网格w12在(t-3)时刻的坐标位置之间的距离大于距离阈值,且w6在(t-3)时刻的坐标位置与网格w12在(t-3)时刻的坐标位置之间的距离处于设定范围(2,3)之间,另外,w6在(t-3)时刻的坐标位置与网格w12在(t-3)时刻的坐标位置之间经过的网格为w7,t-3((t-3)时刻的网格为w7),w11,t-3((t-3)时刻的网格w11),w7,t-3和w11,t-3发生异常聚集的概率大于设定概率阈值(如,0.6),则w7在(t-3)时刻与网格w11在(t-3)时刻的坐标、w6在(t-3)时刻以及w12在(t-3)时刻发生的异常聚集事件可确定为同一异常聚集事件。
另外,在距离大于或等于距离阈值或者距离不处于设定距离范围内时,将任意两个发生异常聚集的子区域发生的异常聚集事件确定为非同一异常聚集事件。
步骤808,根据异常聚集事件的异常聚集类型,进行异常聚集事件处置方法推荐。
在本公开实施例中,可先确定异常聚集事件的异常聚集类型,根据异常聚集类型确定对应的异常聚集事件处置方法并进行推荐。比如,异常聚集类型为:商业活动的预案,对应的聚集事件处置方法为:安排城管人员进行秩序维护。
作为一种示例,由于发生同一异常聚集事件在每个时刻对应的子区域不同,也就是说,发生该异常聚集事件会出现空间转移,作为一种示例,可通过计算发生异常聚集事件的目标时刻的相邻上一时刻对应的子区域的中间点,以及发生异常聚集事件的目标时刻的对应的子区域的中间点,将上述两个中间点进行连接,可确定发生该异常聚集事件的空间转移方向,(比如,东、南、西、北、东南、西北、西南以及东北等方向),并根据异常聚集事件对应的子区域的监测数据序列,确定异常聚集事件的监测数据的变化趋势,进而,根据该变化趋势和异常聚集事件类别,确定对应的异常聚集事件处置方法并进行推荐。
作为另一种示例,在任意两个发生异常聚集的子区域发生的异常聚集事件确定为非同一异常聚集事件,可统计该任意两个子区域的每个时刻的对象数量,得到对应的时序序列,将该时间序列输入至时间序列模型(如,Prophet)中,以预测对应子区域在设定时间内(比如,未来半小时)的对象数量,根据该任意两个子区域的时序序列以及设定时间内的对象数量,预测设定时间内对应子区域是否仍然异常,若预测设定时间内对应子区域仍然异常,可根据两个子区域的时序序列以及设定时间内的对象数量,确定异常聚集事件的监测数据的变化趋势,进而,根据该变化趋势,确定对应的异常聚集事件处置方法并进行推荐。
需要说明的是,步骤801-804的执行过程可以分别采用本公开的各实施例中的任一种方式实现,本公开实施例并不对此作出限定,也不再赘述。
综上,根据各子区域在时空坐标系中的坐标位置确定发生异常聚集的子区域之间的距离,进而,根据该距离确定对应的子区域发生的异常聚集事件是否为同一异常聚集事件,在确定对应的子区域发生的异常聚集事件为同一异常聚集事件时,根据异常聚集事件的异常聚集类型,可准确地进行异常聚集事件的处置方法的推荐,为区域管理人员对发生异常聚集的子区域进行管理提供了便利。
为了根据异常聚集事件的异常聚集类型,准确地进行异常聚集事件处置方法推荐,如图10所示,图10为根据本公开另一个实施例的异常聚集事件的检测方法的流程示意图,在本公开实施例中,在根据异常聚集事件的异常聚集类型,进行异常聚集事件处置方法推荐之前,可先确定异常聚集事件类型,图10所示实施例可包括如下步骤:
步骤1001,根据设定网格间距,对设定区域进行网格划分,以得到设定区域的多个子区域。
步骤1002,针对每个子区域,获取在多个时刻对子区域中的对象进行监测得到的监测数据,以得到各所述子区域的监测数据序列。
步骤1003,对各子区域的监测数据序列中的监测数据进行特征提取,以得到对应子区域的目标特征。
步骤1004,根据各子区域的目标特征,对各子区域进行聚集事件检测,以得到各子区域的异常聚集检测结果。
步骤1005,在设定时空坐标系中,根据各子区域的地理位置信息和各子区域对应的目标时刻,确定各子区域的坐标位置。
步骤1006,针对异常聚集检测结果中任意两个发生异常聚集的子区域,根据任意两个发生异常聚集的子区域在时空坐标系中的坐标位置,确定两个发生异常聚集的子区域之间的距离。
步骤1007,在距离小于距离阈值或者距离处于设定距离范围内时,将任意两个发生异常聚集的子区域发生的异常聚集事件确定为同一异常聚集事件。
步骤1008,获取包含热点事件的候选文档。
在本公开实施例中,为了更加准确地确定异常聚集事件的类型,可根据异常聚集事件的关键词进行搜索,可根据搜索结果获取包含热点事件的候选文档。比如,可异常聚集事件对应的子区域的经纬度范围和发生异常聚集事件的时间范围确定对应的关键词,并根据该关键词进行搜索,以获取包含热点事件的候选文档。
步骤1009,根据异常聚集事件,从候选文档中确定目标文档;其中,目标文档中热点事件的发生时间与异常聚集事件的发生的时间区间匹配,目标文档中热点事件的发生地点与发生异常聚集事件的子区域的经纬度范围匹配。
进而,在候选文档中筛选出目标文档,其中,目标文档中的热点事件的发生时间与异常聚集事件的发生时间区间匹配,以及发生地点与发生异常聚集事件的子区域的经纬度范围匹配。
步骤1010,根据目标文档中的热点事件的发生时间、发生地点,确定异常聚集事件的类型。
可选地,将所述目标文档中的热点事件的发生时间、发生地点以及异常聚集事件的特征,输入异常事件分类模型中,以得到异常聚集事件的类型。
作为一种示例,可异常聚集事件对应的子区域的经纬度范围和发生异常聚集事件的时间范围确定对应的关键词,并将关键词通过用来产生词向量的相关模型(如,word2vec)转化为数字向量特征,将该数字向量特征作为异常聚集事件的特征,进而,将目标文档中的热点事件的发生时间、发生地点以及异常聚集事件的特征,输入异常事件分类模型中,异常聚集事件分类模型可输出该异常聚集事件的类型。
为了准确地得到异常聚集事件的类型,在本公开实施例中,在将目标文档中的热点事件的发生时间、发生地点以及异常聚集事件的特征,输入异常事件分类模型之前,可先训练异常事件分类模型,可选地,获取样本训练数据;其中,样本训练数据标注有异常聚集事件的标注类别;将样本训练数据中的热点事件的发生时间、发生地点以及历史异常聚集事件的特征输入至异常事件分类模型中,以得到异常聚集事件的预测类别;根据预测类别与标注类别的差异,对异常事件分类模型进行训练。
也就是说,样本训练数据中包含热点事件的发生时间、发生地点以及历史聚集事件的特征,并且样本训练数据标注有异常聚集事件的标注类别,进而,将样本训练数据中的热点事件的发生时间、发生地点以及历史异常聚集事件的特征输入至异常事件分类模型中,以得到异常聚集事件的预测类别,根据预测类别与标注类别的差异,构建对应的损失函数,根据该损失函数进行异常事件分类模型的训练,以使预测类别与标注类别的差异最小化。
需要说明的是,步骤1001-1007的执行过程可以分别采用本公开的各实施例中的任一种方式实现,本公开实施例并不对此作出限定,也不再赘述。
综上,通过获取包含热点事件的候选文档;根据异常聚集事件,从候选文档中确定目标文档;其中,目标文档中热点事件的发生时间与异常聚集事件的发生的时间区间匹配,目标文档中热点事件的发生地点与发生异常聚集事件的子区域的经纬度范围匹配;根据目标文档中的热点事件的发生时间、发生地点,确定异常聚集事件的类型,由此,通过融合信令数据、POI类别和热点事件数据,可准确地确定异常聚集事件的类型。
为了准确地说明上述实施例,现举例进行说明。
举例而言,如图11所示,首先,根据运营商提供的信令数据中对应的设定区域,可得到设定区域的多个子区域,针对每个子区域,获取在多个时刻对子区域中的对象进行监测得到的监测数据,以得到各子区域的监测数据序列,对各子区域的监测数据序列中的监测数据进行特征提取,以得到对应子区域的统计特征、时间特征和时空依赖特征。
进一步地,根据各子区域所在的地理位置信息,确定各子区域的兴趣点POI类别,根据各子区域的POI类别,对各子区域的POI类别进行分类,分类结果如图11中的地理位置类别1网格至地理位置类别n网格,每个POI类别,对应不同的异常聚集模型,若异常聚集模型经过训练,则将对应子区域的统计特征、时间特征和时空依赖特征输入至异常聚集模型中,以得到存在异常聚集的网格和异常聚集时刻的集合;若异常聚集模型未经过训练,可根据历史异常聚集事件构建训练数据,对异常聚集模型进行训练。
接着,在得到存在异常聚集的子区域和异常聚集时刻的集合之后,根据各子区域的地理位置信息和各子区域对应的目标时刻,确定各子区域在时空坐标系中的坐标位置;并根据各子区域在时空坐标系中的坐标位置,确定任意两个发生异常聚集的子区域之间的距离,进而根据该距离确定该任意两个发生异常聚集的子区域发生的异常聚集事件是否为同一异常聚集事件。
在任意两个发生异常聚集的子区域发生的异常聚集事件为同一异常聚集事件时,根据目标文档中的热点事件的发生时间、发生地点以及异常聚集事件的特征,输入经过训练的异常事件分类模型中,该异常事件分类模型可输出异常聚集事件的类型,其中,若异常事件分类模型未经过训练,可采用历史异常聚集事件的数据集对异常事件分类模型进行训练。在确定任意两个子区域发生的异常聚集事件的类型为同一异常聚集事件类型时,异常聚集事件在每个时刻的子区域发生变化,出现了空间转移,比如,t-1时刻的异常区域中间点,和t时刻的异常区域中间点,连接后判断转移方向(比如,东、南、西、北、东南、西北、西南以及东北等方向),并根据异常聚集事件对应的子区域的监测数据序列,确定异常聚集事件的监测数据的变化趋势,进而,根据该变化趋势和异常聚集事件的类型,确定对应的异常聚集事件处置方法并进行推荐,异常聚集事件的类型比如为:商业活动的预案,对应的推荐处置方法可为:安排城管人员进行秩序维护。
在任意两个发生异常聚集的子区域发生的异常聚集事件确定为非同一异常聚集事件,异常聚集事件对应的空间未发生转移,可统计该任意两个子区域的每个时刻的对象数量,得到对应的时序序列,将该时序序列输入至时间序列模型(如,Prophet)中,以预测对应子区域的未来半小时的对象数量,根据该任意两个子区域的时序序列以及未来半小时的对象数量,预测半小时内对应子区域是否仍然异常,以及异常结束时间,若预测半小时内对应子区域仍然异常,可根据两个子区域的时序序列以及未来半小时的对象数量,确定异常聚集事件的监测数据的变化趋势,进而,根据该变化趋势和对应子区域的异常聚集事件类型,确定对应的异常聚集事件处置方法并进行推荐。比如,根据异常事件的类型关联事件处置预案,输出异常聚集事件处置建议和异常相关信息。
本公开实施例的异常聚集事件的检测方法,通过根据设定网格间距,对设定区域进行网格划分,以得到设定区域的多个子区域;针对每个子区域,获取在多个时刻对子区域中的对象进行监测得到的监测数据,以得到各子区域的监测数据序列;对各子区域的监测数据序列中的监测数据进行特征提取,以得到对应子区域的目标特征;根据各子区域的目标特征,对各子区域进行聚集事件检测,以得到各子区域的异常聚集检测结果,由此,通过各个子区域的监测数据序列中的监测数据进行特征提取,得到对应子区域的目标特征,并根据各个子区域的目标特征,该目标特征融合了信令数据、POI类别,统计特征、时空特征以及时空依赖特征,进而根据该目标特征,可准确地确定各子区域是否发生异常聚集以及发生异常聚集的子区域的对应的发生异常聚集的时刻。
为了实现上述实施例,本公开还提出一种异常聚集事件的检测装置。
图12为根据本公开实施例的一种异常聚集事件的检测装置的结构示意图,如图12所示,异常聚集事件的检测装置1200包括:划分模块1210、采集模块1220、第一提取模块1230和检测模块1240。
其中,划分模块1210,用于根据设定网格间距,对设定区域进行网格划分,以得到设定区域的多个子区域;采集模块1220,用于针对每个子区域,获取在多个时刻对子区域中的对象进行监测得到的监测数据,以得到各子区域的监测数据序列;第一提取模块1230,用于对各子区域的监测数据序列中的监测数据进行特征提取,以得到对应子区域的目标特征;检测模块1240,用于根据各子区域的目标特征,对各子区域进行聚集事件检测,以得到各子区域的异常聚集检测结果。
作为本公开实施例的一种可能实现方式,目标特征包括:统计特征;第一提取模块1230,具体用于:从各子区域的监测数据序列中,获取目标时刻之前的设定时间段内的第一子监测数据序列;对各子区域的第一子监测数据序列中至少一个历史监测数据进行特征提取,以得到对应子区域在目标时刻的统计特征。
作为本公开实施例的一种可能实现方式,目标特征包括:时间特征,第一提取模块1230,还用于:对各子区域采集的第一目标数据对应的目标时刻进行特征提取,以得到对应子区域在目标时刻的时间特征。
作为本公开实施例的一种可能实现方式,目标特征包括:时空依赖特征,第一提取模块1230,还用于:从各所述子区域的监测数据序列中,获取目标时刻的上一时刻所采集的第二目标数据,以及从对应子区域的邻接区域的监测数据序列中,获取目标时刻采集的第三目标数据;根据各子区域对应的第二目标数据以及第三目标数据,确定对应子区域的时空依赖特征。
作为本公开实施例的一种可能实现方式,检测模块1240,具体用于:根据各子区域所在的地理位置信息,确定各子区域的兴趣点POI类别;根据各子区域的POI类别,确定对应子区域的异常聚集模型;将各子区域的目标特征,输入至对应的异常聚集模型中进行聚集事件检测,以得到各子区域的异常聚集检测结果。
作为本公开实施例的一种可能实现方式,异常聚集模型通过以下模块训练得到:第一获取模块、第二提取模块、第一输入模块和第一训练模块。
其中,第一获取模块,用于获取样本数据序列集;其中,样本数据序列集中的各样本数据序列标注有发生异常聚集的标注子区域以及各标注子区域发生异常聚集的标注时刻;第二提取模块,用于提取各样本数据序列的特征,以得到各标注子区域的样本特征;第一输入模块,用于将各标注子区域的样本特征输入至异常聚集模型中,得到发生异常聚集的预测子区域以及各预测子区域发生异常聚集的预测时刻;第一训练模块,用于根据标注子区域与预测子区域的第一差异,以及标注时刻与预测时刻的第二差异,对异常聚集模型进行训练。
作为本公开实施例的一种可能实现方式,异常聚集事件的检测装置1200还包括:空间聚合模块、计算模块、确定模块和推荐模块。
其中,空间聚合模块,用于在设定时空坐标系中,根据各子区域的地理位置信息和各子区域对应的目标时刻,确定各子区域的坐标位置;计算模块,用于针对所述异常聚集检测结果中任意两个发生异常聚集的子区域,根据所述任意两个发生异常聚集的子区域在所述时空坐标系中的坐标位置,确定所述两个发生异常聚集的子区域之间的距离;确定模块,用于在距离小于距离阈值或者距离处于设定距离范围内时,将任意两个发生异常聚集的子区域发生的异常聚集事件确定为同一异常聚集事件;推荐模块,用于根据异常聚集事件的异常聚集类型,进行异常聚集事件处置方法推荐。
作为本公开实施例的一种可能实现方式,异常聚集事件的检测装置1200还包括:第三获取模块。
其中,第三获取模块,用于获取包含热点事件的候选文档;确定模块,还用于根据异常聚集事件,从候选文档中确定目标文档;其中,目标文档中热点事件的发生时间与异常聚集事件的发生的时间区间匹配,目标文档中热点事件的发生地点与发生异常聚集事件的子区域的经纬度范围匹配;确定模块,还用于根据目标文档中的热点事件的发生时间、发生地点,确定异常聚集事件的类型。
作为本公开实施例的一种可能实现方式,确定模块还用于:将所述目标文档中的热点事件的发生时间、发生地点以及异常聚集事件的特征,输入异常事件分类模型中,以得到所述异常聚集事件的类型。
作为本公开实施例的一种可能实现方式,异常事件分类模型通过以下模块训练得到:第四获取模块、第二输入模块和第二训练模块。
其中,第四获取模块,用于获取样本训练数据;其中,样本训练数据标注有异常聚集事件的标注类别;第二输入模块,用于将样本训练数据中的热点事件的发生时间、发生地点以及历史异常聚集事件的特征输入至异常事件分类模型中,以得到异常聚集事件的预测类别;第二训练模块,用于根据预测类别与标注类别的差异,对异常事件分类模型进行训练。
本公开实施例的异常聚集事件的检测装置,通过根据设定网格间距,对设定区域进行网格划分,以得到设定区域的多个子区域;针对每个子区域,获取在多个时刻对子区域中的对象进行监测得到的监测数据,以得到各子区域的监测数据序列;对各子区域的监测数据序列中的监测数据进行特征提取,以得到对应子区域的目标特征;根据各子区域的目标特征,对各子区域进行聚集事件检测,以得到各子区域的异常聚集检测结果,由此,通过各个子区域的监测数据序列中的监测数据进行特征提取,得到对应子区域的目标特征,并根据各个子区域的目标特征,可准确地确定各子区域是否发生异常聚集以及发生异常聚集的子区域的对应的发生异常聚集的时刻。
为了实现上述实施例,本公开还提出一种电子设备,如图13所示,图13是根据一示例性实施例示出的一种用于异常聚集事件的检测的电子设备的框图。
如图13所示,上述电子设备1300包括:
存储器1310及处理器1320,连接不同组件(包括存储器1310和处理器1320)的总线1330,存储器1310存储有计算机程序,当处理器1320执行所述程序时实现本公开实施例所述的异常聚集事件的检测方法。
总线1330表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,***总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及***组件互连(PCI)总线。
电子设备1300典型地包括多种电子设备可读介质。这些介质可以是任何能够被电子设备1300访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储器1310还可以包括易失性存储器形式的计算机***可读介质,例如随机存取存储器(RAM)1340和/或高速缓存存储器1350。电子设备1300可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机***存储介质。仅作为举例,存储***1360可以用于读写不可移动的、非易失性磁介质(图13未显示,通常称为“硬盘驱动器”)。尽管图13中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线1330相连。存储器1310可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本公开各实施例的功能。
具有一组(至少一个)程序模块1370的程序/实用工具1380,可以存储在例如存储器1310中,这样的程序模块1370包括但不限于操作***、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块1370通常执行本公开所描述的实施例中的功能和/或方法。
电子设备1300也可以与一个或多个外部设备1390(例如键盘、指向设备、显示器等)通信,还可与一个或者多个使得用户能与该电子设备1300交互的设备通信,和/或与使得该电子设备1300能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口1392进行。并且,电子设备1300还可以通过网络适配器1393与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图13所示,网络适配器1393通过总线1330与电子设备1300的其它模块通信。应当明白,尽管图13中未示出,可以结合电子设备1300使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID***、磁带驱动器以及数据备份存储***等。
处理器1320通过运行存储在存储器1310中的程序,从而执行各种功能应用以及数据处理。
需要说明的是,本实施例的电子设备的实施过程和技术原理参见前述对本公开实施例的异常聚集事件的检测方法的解释说明,此处不再赘述。
为了实现上述实施例,本公开还提出一种存储有计算机指令的非瞬时计算机可读存储介质,计算机指令用于使计算机执行上述实施例所述的异常聚集事件的检测方法。
为了实现上述实施例,本公开还提供一种计算机程序产品,当所述计算机程序产品中的指令处理器执行时,执行上述实施例所述的异常聚集事件的检测方法。
在本说明书的描述中,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本公开的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本公开的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
尽管上面已经示出和描述了本公开的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本公开的限制,本领域的普通技术人员在本公开的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (13)

1.一种异常聚集事件的检测方法,其特征在于,包括:
根据设定网格间距,对设定区域进行网格划分,以得到所述设定区域的多个子区域;
针对每个所述子区域,获取在多个时刻对所述子区域中的对象进行监测得到的监测数据,以得到各所述子区域的监测数据序列;对各所述子区域的监测数据序列中的监测数据进行特征提取,以得到对应子区域的目标特征;
根据各所述子区域的目标特征,对各所述子区域进行聚集事件检测,以得到各所述子区域的异常聚集检测结果。
2.根据权利要求1所述的方法,其特征在于,所述目标特征包括:统计特征;对各所述子区域的监测数据序列中的监测数据进行特征提取,以得到对应子区域的目标特征,包括:
从各所述子区域的监测数据序列中,获取目标时刻之前的设定时间段内的第一子监测数据序列;
对各所述子区域的第一子监测数据序列中至少一个历史监测数据进行特征提取,以得到对应子区域在所述目标时刻的统计特征。
3.根据权利要求2所述的方法,其特征在于,所述目标特征包括:时间特征,对各所述子区域的监测数据序列中的监测数据进行特征提取,以得到对应子区域的目标特征,包括:
对各所述子区域所采集的第一目标数据对应的所述目标时刻进行特征提取,以得到对应子区域在所述目标时刻的时间特征。
4.根据权利要求2所述的方法,其特征在于,所述目标特征包括:时空依赖特征,所述对各所述子区域的监测数据序列中的监测数据进行特征提取,以得到对应子区域的目标特征,包括:
从各所述子区域的监测数据序列中,获取所述目标时刻的上一时刻所采集的第二目标数据,以及从对应子区域的邻接区域的监测数据序列中,获取所述目标时刻采集的第三目标数据;
根据各所述子区域对应的所述第二目标数据以及所述第三目标数据,确定对应子区域的时空依赖特征。
5.根据权利要求1所述的方法,其特征在于,所述根据各所述子区域的目标特征,对各所述子区域进行聚集事件检测,以得到各所述子区域的异常聚集检测结果,包括:
根据各所述子区域所在的地理位置信息,确定各所述子区域的兴趣点POI类别;
根据各所述子区域的POI类别,确定对应所述子区域的异常聚集模型;
将各所述子区域的所述目标特征,输入至对应的异常聚集模型中进行聚集事件检测,以得到各所述子区域的异常聚集检测结果。
6.根据权利要求5所述的方法,其特征在于,所述异常聚集模型通过以下步骤训练得到:
获取样本数据序列集;其中,所述样本数据序列集中的各样本数据序列标注有发生异常聚集的标注子区域以及各所述标注子区域发生异常聚集的标注时刻;
提取各所述样本数据序列的特征,以得到各所述标注子区域的样本特征;
将各所述标注子区域的样本特征输入至所述异常聚集模型中,得到发生异常聚集的预测子区域以及各所述预测子区域发生异常聚集的预测时刻;
根据所述标注子区域与所述预测子区域的第一差异,以及所述标注时刻与所述预测时刻的第二差异,对所述异常聚集模型进行训练。
7.根据权利要求2所述的方法,其特征在于,所述方法还包括:
在设定时空坐标系中,根据各所述子区域的地理位置信息和各所述子区域对应的所述目标时刻,确定各子区域的坐标位置;
针对所述异常聚集检测结果中任意两个发生异常聚集的子区域,根据所述任意两个发生异常聚集的子区域在所述时空坐标系中的坐标位置,确定所述两个发生异常聚集的子区域之间的距离;
在所述距离小于所述距离阈值或者所述距离处于设定距离范围内时,将所述任意两个发生异常聚集的子区域发生的异常聚集事件确定为同一异常聚集事件;
根据所述异常聚集事件的异常聚集类型,进行异常聚集事件处置方法推荐。
8.根据权利要求7所述的方法,其特征在于,所述方法,还包括:
获取包含热点事件的候选文档;
根据所述异常聚集事件,从所述候选文档中确定目标文档;其中,所述目标文档中热点事件的发生时间与所述异常聚集事件的发生的时间区间匹配,所述目标文档中热点事件的发生地点与发生所述异常聚集事件的子区域的经纬度范围匹配;
根据所述目标文档中的热点事件的发生时间、发生地点,确定所述异常聚集事件的类型。
9.根据权利要求8所述的方法,其特征在于,所述根据所述目标文档中的热点事件的发生时间、发生地点以及所述异常聚集事件的特征,确定所述同一异常聚集事件的类型,包括:
将所述目标文档中的热点事件的发生时间、发生地点以及所述异常聚集事件的特征,输入异常事件分类模型中,以得到所述异常聚集事件的类型。
10.根据权利要求9所述的方法,其特征在于,所述异常事件分类模型通过以下步骤训练得到:
获取样本训练数据;其中,所述样本训练数据标注有异常聚集事件的标注类别;
将所述样本训练数据中的热点事件的发生时间、发生地点以及历史异常聚集事件的特征输入至所述异常事件分类模型中,以得到异常聚集事件的预测类别;
根据所述预测类别与所述标注类别的差异,对所述异常事件分类模型进行训练。
11.一种异常聚集事件的检测装置,其特征在于,包括:
划分模块,用于根据设定网格间距,对设定区域进行网格划分,以得到所述设定区域的多个子区域;
采集模块,用于针对每个所述子区域,获取在多个时刻对所述子区域中的对象进行监测得到的监测数据,以得到各所述子区域的监测数据序列;
第一提取模块,用于对各所述子区域的监测数据序列中的监测数据进行特征提取,以得到对应子区域的目标特征;
检测模块,用于根据各所述子区域的目标特征,对各所述子区域进行聚集事件检测,以得到各所述子区域的异常聚集检测结果。
12.一种电子设备,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如权利要求1-10中任一项所述的异常聚集事件的检测方法。
13.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-10中任一项所述的异常聚集事件的检测方法。
CN202210550795.8A 2022-05-20 2022-05-20 异常聚集事件的检测方法、装置、电子设备和存储介质 Pending CN114970621A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210550795.8A CN114970621A (zh) 2022-05-20 2022-05-20 异常聚集事件的检测方法、装置、电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210550795.8A CN114970621A (zh) 2022-05-20 2022-05-20 异常聚集事件的检测方法、装置、电子设备和存储介质

Publications (1)

Publication Number Publication Date
CN114970621A true CN114970621A (zh) 2022-08-30

Family

ID=82984778

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210550795.8A Pending CN114970621A (zh) 2022-05-20 2022-05-20 异常聚集事件的检测方法、装置、电子设备和存储介质

Country Status (1)

Country Link
CN (1) CN114970621A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115941807A (zh) * 2022-12-22 2023-04-07 陕西通信规划设计研究院有限公司 一种园区安防***数据高效压缩方法
CN116662638A (zh) * 2022-09-06 2023-08-29 荣耀终端有限公司 数据采集方法及相关装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116662638A (zh) * 2022-09-06 2023-08-29 荣耀终端有限公司 数据采集方法及相关装置
CN116662638B (zh) * 2022-09-06 2024-04-12 荣耀终端有限公司 数据采集方法及相关装置
CN115941807A (zh) * 2022-12-22 2023-04-07 陕西通信规划设计研究院有限公司 一种园区安防***数据高效压缩方法
CN115941807B (zh) * 2022-12-22 2024-02-23 陕西通信规划设计研究院有限公司 一种园区安防***数据高效压缩方法

Similar Documents

Publication Publication Date Title
Zheng et al. Detecting collective anomalies from multiple spatio-temporal datasets across different domains
US20210216928A1 (en) Systems and methods for dynamic risk analysis
Rao et al. Origin-destination pattern estimation based on trajectory reconstruction using automatic license plate recognition data
US20180053110A1 (en) Method of predicting crime occurrence in prediction target region using big data
Chen et al. iBOAT: Isolation-based online anomalous trajectory detection
Wang et al. The spatio-temporal modeling for criminal incidents
WO2017202226A1 (zh) 人群流量的确定方法及装置
CN114970621A (zh) 异常聚集事件的检测方法、装置、电子设备和存储介质
CN110909102B (zh) 室内热力图展示方法、装置和计算机可读存储介质
US20130057551A1 (en) Visual Analytics Law Enforcement Tools
Zhu et al. An anticrime information support system design: Application of K-means-VMD-BiGRU in the city of Chicago
CN111950470A (zh) 一种智能监控方法、装置、计算机设备及存储介质
Chohlas-Wood et al. Mining 911 calls in New York City: Temporal patterns, detection, and forecasting
Johansson et al. Crime hotspots: An evaluation of the KDE spatial mapping technique
CN111639092A (zh) 一种人员流动分析方法、装置、电子设备及存储介质
CN116680658A (zh) 一种基于风险评价的热浪监测站选址方法及***
Grinberger et al. Dynamic agent based simulation of an urban disaster using synthetic big data
Nicoletta et al. Bayesian spatio-temporal modelling and prediction of areal demands for ambulance services
CN110895543A (zh) 人口迁徙跟踪展示方法、装置及存储介质
CN110399537B (zh) 一种基于人工智能技术的警情时空预测方法
Aydın Classification of the fire station requirement with using machine learning algorithms
CN106844948B (zh) 滑坡预测方法和装置
KR101744776B1 (ko) 지도 검색 기록을 이용한 유동인구 추정 장치 및 방법
Prestemon et al. Exploiting autoregressive properties to develop prospective urban arson forecasts by target
KR20190138350A (ko) 웨어러블 기기에서 수집한 생체 정보 및 행동 패턴을 활용한 개인별 범죄 피해 확률 예측 시스템

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination