CN114511816A - 数据处理方法、装置、电子设备及机器可读存储介质 - Google Patents
数据处理方法、装置、电子设备及机器可读存储介质 Download PDFInfo
- Publication number
- CN114511816A CN114511816A CN202011281663.7A CN202011281663A CN114511816A CN 114511816 A CN114511816 A CN 114511816A CN 202011281663 A CN202011281663 A CN 202011281663A CN 114511816 A CN114511816 A CN 114511816A
- Authority
- CN
- China
- Prior art keywords
- track
- image acquisition
- sequence
- common
- points
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title abstract description 16
- 238000000034 method Methods 0.000 claims abstract description 27
- 238000012545 processing Methods 0.000 claims abstract description 7
- 238000012806 monitoring device Methods 0.000 claims description 36
- 238000012544 monitoring process Methods 0.000 claims description 24
- 238000004891 communication Methods 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 9
- 230000002596 correlated effect Effects 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 9
- 238000004422 calculation algorithm Methods 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 5
- 230000000875 corresponding effect Effects 0.000 description 5
- 230000002159 abnormal effect Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 4
- 238000001914 filtration Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000006872 improvement Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000004454 trace mineral analysis Methods 0.000 description 2
- 230000001174 ascending effect Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Landscapes
- Image Analysis (AREA)
Abstract
本申请提供一种数据处理方法、装置、电子设备及机器可读存储介质,该方法包括:确定各对象的轨迹序列;基于指定对象的轨迹序列,以及其他对象的轨迹序列,分别确定所述指定对象的轨迹序列与各其他对象的轨迹序列的公共子序列;基于所述指定对象的轨迹序列与各其他对象的轨迹序列之间的公共子序列,确定与所述指定对象存在同行关系的其他对象。该方法可以提高同行关系判定的效率和准确率。
Description
技术领域
本申请涉及大数据技术领域,尤其涉及一种数据处理方法、装置、电子设备及机器可读存储介质。
背景技术
基于指定人员的图像采集数据,以及其他人员的图像采集数据,确定与该指定人员存在同行关系的人员,能够从大数据的角度出发协助对与指定人员存在一定关系的其他人员、指定人员的行动轨迹进行有效的分析。
如何确定与指定对象存在同行关系的其他对象成为亟待解决的技术问题。
发明内容
有鉴于此,本申请提供一种数据处理方法、装置、电子设备及机器可读存储介质。
根据本申请实施例的第一方面,提供一种数据处理方法,包括:
确定各对象的轨迹序列;其中,该轨迹序列包括多个轨迹点,轨迹点包括监控设备标识与图像采集时间,任一轨迹序列中各轨迹点按照图像采集时间顺序排列;
基于指定对象的轨迹序列,以及其他对象的轨迹序列,分别确定指定对象的轨迹序列与各其他对象的轨迹序列的公共子序列;
基于指定对象的轨迹序列与各其他对象的轨迹序列之间的公共子序列,确定与指定对象存在同行关系的其他对象。
根据本申请实施例的第二方面,提供一种数据处理装置,包括:
第一确定单元,被配置为确定各对象的轨迹序列;其中,该轨迹序列包括多个轨迹点,轨迹点包括监控设备标识与图像采集时间,任一轨迹序列中各轨迹点按照图像采集时间顺序排列;
第二确定单元,被配置为基于指定对象的轨迹序列,以及其他对象的轨迹序列,分别确定指定对象的轨迹序列与各其他对象的轨迹序列的公共子序列;
第三确定单元,被配置为基于指定对象的轨迹序列与各其他对象的轨迹序列之间的公共子序列,确定与指定对象存在同行关系的其他对象。
根据本申请实施例的第三方面,提供一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现第一方面的数据处理方法。
根据本申请实施例的第四方面,提供一种计算机可读存储介质,计算机可读存储介质内存储有计算机程序,计算机程序被处理器执行时实现第一方面的数据处理方法。
根据本申请实施例的第五方面,提供一种计算机程序,该计算机程序存储于机器可读存储介质,并且当处理器执行该计算机程序时,促使处理器执行第一方面的数据处理方法。
本申请实施例的数据处理方法,确定各对象的轨迹序列,并基于指定对象的轨迹序列,以及其他对象的轨迹序列,分别确定指定对象的轨迹序列与各其他对象的轨迹序列的公共子序列,进而,基于指定对象的轨迹序列与各其他对象的轨迹序列之间的公共子序列,确定与指定对象存在同行关系的其他对象,通过确定不同对象的轨迹序列之间的公共子序列,并基于不同对象的轨迹序列之间的公共子序列进行同行关系判定,将轨迹序列之间不存在公共子序列的对象在进行同行关系判定时剔除,提高了同行关系判定的效率和准确率。
附图说明
图1是本申请一示例性实施例提供的一种数据处理方法的流程示意图;
图2是本申请一示例性实施例提供的一种应用场景的示意图;
图3是本申请一示例性实施例提供的一种确定指定对象的轨迹序列与他对象的轨迹序列的公共子序列的流程示意图;
图4A是本申请一示例性实施例提供的一种重复采集的场景的示意图;
图4B是本申请一示例性实施例提供的一种重叠采集的场景的示意图;
图5是本申请一示例性实施例提供的一种确定各对象的轨迹序列的流程示意图;
图6是本申请一示例性实施例提供的一种数据处理装置的结构示意图;
图7是本申请一示例性实施例示出的一种电子设备的硬件结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
为了使本领域技术人员更好地理解本申请实施例提供的技术方案,并使本申请实施例的上述目的、特征和优点能够更加明显易懂,下面结合附图对本申请实施例中技术方案作进一步详细的说明。
请参见图1,为本申请实施例提供的一种数据处理方法的流程示意图,如图1所示,该数据处理方法可以包括以下步骤:
需要说明的是,本申请实施例中各步骤的序号大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
步骤S100、确定各对象的轨迹序列;其中,轨迹序列包括多个轨迹点,轨迹点包括监控设备标识与图像采集时间,任一轨迹序列中各轨迹点按照图像采集时间顺序排列。
本申请实施例中,对象可以包括但不限于人或车辆等。
本申请实施例中,若未特殊说明,所提及的图像采集数据是指可以对被采集的对象进行身份信息识别的图片,例如,对于车辆,身份信息可以为车牌号;对于人员,身份信息可以为通过人脸分析等得到的人员信息。
本申请实施例中,考虑到存在同行关系的两个对象通常会在相同或相近时刻被相同监控设备采集到图像,因此,为了提高同行关系判定的效率和准确率,可以基于两个对象在相同或相近时刻被相同监控设备采集到图像的情况,对该两个对象进行同行关系判定。
为了确定是否存在两个对象在相同或相近时刻被相同监控设备采集到的图像的情况,可以先确定各对象的轨迹序列。
示例性的,可以分别基于各对象的图像采集数据,确定各对象的轨迹序列。
示例性的,轨迹序列可以表征特定对象在特定时间被特定监控设备采集到图像。
示例性的,一个轨迹序列可以包括一个或多个轨迹点,任一轨迹点包括监控设备标识(采集到相应对象的图像的监控设备的标识)与图像采集时间(该监控设备采集到该对象的图像的时间),任一轨迹序列中各轨迹点按照图像采集时间顺序排列,例如,按照图像采集时间升序或降序排列。
需要说明的是,在本申请实施例中,当基于某对象的图像采集数据确定的该对象的轨迹点的数量为一个时,可以不进行轨迹序列的确定,且在进行同行关系判定时,可以将该对象的图像采集数据滤除。
步骤S110、基于指定对象的轨迹序列,以及其他对象的轨迹序列,分别确定指定对象的轨迹序列与各其他对象的轨迹序列的公共子序列。
本申请实施例中,指定对象并不特指某一固定的对象,而是可以指代任一存在轨迹序列,且需要进行同行关系分析的对象,本申请实施例后续不再复述。
本申请实施例中,当需要针对指定对象进行同行关系判定时,可以基于指定对象的轨迹序列,以及其他对象(除指定对象之外的存在轨迹序列的对象)的轨迹序列,分别确定指定对象的轨迹序列与各其他对象的轨迹序列的公共子序列。
在一个示例中,对于任一其他对象的轨迹序列,可以基于LCS(Longest CommonSubsequence,最长公共子序列)算法,确定该其他对象的轨迹序列与指定对象的轨迹序列的公共子序列。
步骤S120、基于指定对象的轨迹序列与各其他对象的轨迹序列之间的公共子序列,确定与指定对象存在同行关系的其他对象。
本申请实施例中,在按照上述方式确定了指定对象的轨迹序列与各其他对象的轨迹序列之间的公共子序列时,可以基于所确定的指定对象的轨迹序列与各其他对象的轨迹序列之间的公共子序列,确定与指定对象存在同行关系的其他对象。
例如,可以将与指定对象的轨迹序列之间的公共子序列的长度超过预设长度阈值的其他对象的轨迹序列,确定为与指定对象存在同行关系的其他对象的轨迹序列,该其他对象为该指定对象的同行对象。
可见,在图1所示方法实施例中,通过确定各对象的轨迹序列,并基于指定对象的轨迹序列,以及其他对象的轨迹序列,分别确定指定对象的轨迹序列与各其他对象的轨迹序列的公共子序列,进而,基于指定对象的轨迹序列与各其他对象的轨迹序列之间的公共子序列,通过确定不同对象的轨迹序列之间的公共子序列,并基于不同对象的轨迹序列之间的公共子序列进行同行关系判定,将轨迹序列之间不存在公共子序列的对象在进行同行关系判定时剔除,提高了同行关系判定的效率和准确率。
在一个实施例中,对于任一其他对象的轨迹序列,该其他对象与指定对象的公共子序列中包含的公共轨迹点为该其他对象的轨迹序列与指定对象的轨迹序列共同拥有的轨迹点、且各公共轨迹点在公共子序列中的顺序,与各公共轨迹点在任一原轨迹序列中的顺序相同。
示例性的,对于任一其他对象,该其他对象的轨迹序列与指定对象的轨迹序列的公共子序列中的轨迹点,应该为该其他对象和指定对象均经过(即均被该轨迹点所包含的监控设备采集到图像),且经过的顺序(时间顺序)相同的轨迹点,因此,任一其他对象的轨迹序列与指定对象的轨迹序列之间的公共子序列中包含的公共轨迹点为该其他对象的轨迹序列与指定对象的轨迹序列共同拥有的轨迹点,且各公共轨迹点在公共子序列中的顺序,与各公共轨迹点在任一原轨迹序列中的顺序相同。
其中,公共轨迹点可以包括监控设备标识相同,且图像采集时间一致(包括相同,或差值不超过预设时间间隔)的两个轨迹点,该两个轨迹点在指定对象的轨迹序列和该其他对象的轨迹序列中均存在。此外,考虑到实际场景中可能会存在两个轨迹序列存在公共序列,但是公共序列中图像采集时间相邻的两个公共轨迹点在某一原轨迹序列中间隔过多的其他轨迹点的情况,原轨迹序列为该其他对象的轨迹序列或指定对象的轨迹序列;该情况意味着该其他对象和指定对象中,一个对象在两个公共轨迹点之间的轨迹距离比较大,而另一个对象在两个公共轨迹点之间的轨迹距离比较小,但这两个公共轨迹点对该其他对象和指定对象的图像采集时间相近或相同,这种情况不属于同行,可能会导致同行状态的误判。
举例来说,如图2所示,P1沿着直线行走,分别经过设备D1、D3;P2骑自行车按照曲线路线行走分别经过D1、D2、D3、D4;但是P1和P2经过D1和D3设备时,图像采集时间相近,虽然存在公共子序列D1、D3,但是并非同行。
相应地,为了提高同行状态判定的准确性,对于任一其他对象的轨迹序列与指定对象的轨迹序列的公共子序列,可以基于图像采集时间相邻的两个公共轨迹点之间的距离,确定该图像采集时间相邻的两个公共轨迹点是否属于同一公共子序列。
示例性的,公共子序列中包含的图像采集时间相邻的两个公共轨迹点之间的距离需要小于预设距离阈值(可以根据实际场景设定)。
在一个示例中,两个公共轨迹点之间的距离可以基于原轨迹序列中该两个公共轨迹点之间的轨迹点的数量确定,且两个公共轨迹点之间的距离与任一原轨迹序列中该两个公共轨迹点之间的轨迹点的数量正相关。
示例性的,两个公共轨迹点之间的距离可以基于原轨迹序列中该两个公共轨迹点之间的轨迹点的数量确定;所述原轨迹序列为该其他对象的轨迹序列或所述指定对象的轨迹序列。
例如,假设轨迹序列A和轨迹序列B中包括相邻公共轨迹点1和公共轨迹点2,在轨迹序列A中,公共轨迹点1和公共轨迹点2之间存在3个轨迹点,在轨迹序列B中,公共轨迹点1和公共轨迹点2之间存在4个轨迹点,则可以基于轨迹序列A中公共轨迹点1和公共轨迹点2之间的轨迹点的数量(3个),以及轨迹序列B中公共轨迹点1和公共轨迹点2之间的轨迹点的数量(4个),确定公共轨迹点1和公共轨迹点2之间的距离。
示例性的,原轨迹序列中两个公共轨迹点之间的轨迹点的数量,可以基于该两个公共轨迹点在原轨迹序列中的位置确定。
其中,轨迹点在轨迹序列中的位置可以基于轨迹点在轨迹序列中的顺序确定。
例如,轨迹序列中的第1个轨迹点在该轨迹序列中的位置为0,轨迹序列中的第2个轨迹点在该轨迹序列中的位置为1…。
举例来说,假设轨迹序列A和轨迹序列B中包括相邻公共轨迹点1和公共轨迹点2,公共轨迹点1在轨迹序列A和轨迹序列B中的位置为均0,公共轨迹点2在轨迹序列A中的位置为3,公共轨迹点2在轨迹序列B中的位置为4,则公共轨迹点1和公共轨迹点2之间的距离可以为(0,0)到(3,4)之间的距离。
在一个示例中,对于任一其他对象,当该其他对象的轨迹序列与指定对象的轨迹序列的最长公共子序列中轨迹点的数量超过预设数量阈值时,确定该其他对象与指定对象存在同行关系。
需要说明的是,在本申请实施例中,两个对象的轨迹序列的公共轨迹点也可以均加入同一公共子序列,并基于图像采集时间相邻的两个公共轨迹点之间的距离,对公共子序列中的各公共轨迹点进行子集划分。
在一个示例中,如图3所示,步骤S110中,基于指定对象的轨迹序列,以及其他对象的轨迹序列,分别确定指定对象的轨迹序列与各其他对象的轨迹序列的公共子序列,可以通过以下步骤实现:
步骤S111、对于任一其他对象的轨迹序列,确定该其他对象的轨迹序列与指定对象的轨迹序列中的公共轨迹点,并按照公共轨迹点在原轨迹序列中的顺序对公共轨迹点进行排序。
步骤S112、当图像采集时间相邻的两个公共轨迹点之间的距离大于预设距离阈值时,将该两个公共轨迹点加入指定对象与该其他对象的公共子序列的不同子集。
步骤S113、当图像采集时间相邻的两个公共轨迹点之间的距离小于或等于预设距离阈值时,将该两个公共轨迹点加入指定对象与该其他对象的公共子序列的同一子集。
示例性的,对于任一其他对象,该其他对象的轨迹序列与指定对象的轨迹序列的公共子序列为一个集合,该集合中包括该其他对象的轨迹序列与指定对象的轨迹序列之间的公共轨迹点,且各公共轨迹点在该集合中的顺序与各公共轨迹点在任一原轨迹序列中的顺序相同。
因此,对于任一其他对象的轨迹序列,可以确定该其他对象的轨迹序列与指定对象的轨迹序列中的公共轨迹点,并按照公共轨迹点在原轨迹序列中的顺序对公共轨迹点进行排序。
对于所确定的公共轨迹点中图像采集时间相邻的任意两个公共轨迹点,可以确定该两个公共轨迹点之间的距离。
在确定了图像采集时间相邻的两个公共轨迹点之间的距离时,可以比较该距离与预设距离阈值。
当图像采集时间相邻的两个公共轨迹点之间的距离大于预设距离阈值时,将该两个公共轨迹点加入指定对象与该其他对象的公共子序列的不同子集。
当图像采集时间相邻的两个公共轨迹点之间的距离小于或等于预设距离阈值时,将该两个公共轨迹点加入该指定对象与该对象的公共子序列的同一子集。
在一个示例中,步骤S120中,基于指定对象的轨迹序列与各其他对象的轨迹序列之间的公共子序列,确定与指定对象存在同行关系的其他对象,可以包括:
对于任一其他对象,当该其他对象的轨迹序列与指定对象的轨迹序列之间的公共子序列的最大子集中轨迹点的数量超过预设数量阈值时,确定该其他对象与指定对象存在同行关系。
示例性的,在确定了指定对象的轨迹序列与任一其他对象的轨迹序列之间的公共子序列时,可以比较该其他对象的轨迹序列与指定对象的轨迹序列之间的公共子序列的最大子集中轨迹点的数量和预设数量阈值(可以根据实际场景设定,如3个),并当最大子集中轨迹点的数量超过预设数量阈值时,确定该其他对象与指定对象存在同行关系。
需要说明的是,在本申请实施例中,对于判定为与指定对象存在同行关系的其他对象,还可以基于按照上述方式确定的公共子序列进行排序。
示例性的,可以基于公共子序列中包括的子集的数量对公共子序列进行排序。例如,公共子序列中子集的数量越多(子集的数量可以用于表征两个对象同行的次数,子集数量越多,表明两个对象同行的次数越多),排序越靠前。
此外,还可以基于公共子序列中包括的子集的数量,以及各子集中包括的公共轨迹点的数量,确定一个用于评分的评分值,并基于该评分值对公共子序列进行排序,公共子序列的评分值越高,排序越靠前,其具体实现在此不做赘述。
在一个实施例中,任一轨迹序列中图像采集时间相邻的两个轨迹点包括的监控设备标识不同,且图像采集时间相邻的两个轨迹点包括的图像采集时间的差值大于预设时间阈值。
考虑到图像采集数据的重复采集(参见图4A)和/或重叠采集(参见图4B)会导致同行关系判定效率和准确率差,因此,为了提高同行关系判定的效率和准确性,可以对监控设备获取到的图像采集数据中存在的重复采集数据和/或重叠采集数据进行过滤,并基于过滤后的图像采集数据进行同行关系判定。
如图4A所示,为本申请实施例提供的一种重复采集的场景的示意图,同一个对象(图中以对象为人为例),连续多次被同一个监控设备采集到,产生多个监控设备相同,图像采集时间连续的图像采集数据。
如图4B所示,为本申请实施例提供的一种重叠采集的场景的示意图,两个不同的监控设备的监控区域存在重叠,同一个对象(图中以对象为人为例)在相近时间或者相同时间内被不同的监控设备采集到图像。
相应地,在本申请实施例中,可以基于监控设备针对不同对象的图像采集数据,分别确定各对象的轨迹序列,在轨迹序列的确定过程中实现重复采集数据或/和重叠采集数据的过滤。
由于重复采集数据为同一监控设备在连续时间内对同一对象的多次进行图像采集产生的图像采集数据,重叠采集数据为不同监控设备对同一对象在相近或相同时间进行图像采集产生的图像采集数据,因此,为了实现对图像采集数据中的重复采集数据或/和重叠采集数据的过滤,在进行数据过滤时,需保证过滤后的数据中,在一个独立的时间段内,不会保存多个监控设备对同一对象的图像采集数据,且同一监控设备对同一对象的图像采集数据的数量为一条。
即对于重复采集数据,可以通过在某对象的图像采集数据按照图像采集时间顺序排列之后,当图像采集时间相邻的两条图像采集数据的监控设备相同时
存在连续多条图像采集数据的监控设备相同的情况下,将该多条图像采集数据过滤至一条(即该多条图像采集数据中保留一条,其余删除)的方式,来保证图像采集时间相邻的两条图像采集数据对应的监控设备不同,实现重复采集数据的过滤。
对于重叠采集数据,可以通过在某对象的图像采集数据按照图像采集时间顺序排列之后,若存在图像采集时间相邻的两条图像采集数据的监控设备不同,且图像采集时间的差值小于或等于预设时间阈值,则将该两条图像采集数据中的其中一条删除的方式,来保证图像采集时间相邻的两条不同监控设备的图像采集数据,图像采集时间的差值大于预设时间阈值,实现重叠采集数据的过滤。
进而,任一对象的轨迹序列中,图像采集时间相邻的两个轨迹点中包括的监控设备标识不同,且包括的图像采集时间的差值大于预设时间阈值(可以根据实际场景确定,如2分钟)。
在一个示例中,上述预设时间阈值可以根据实际场景中监控设备之间的平均距离,以及对象移动速率(可以为经验值)确定。
在一个实施例中,如图5所示,步骤S100中,确定各对象的轨迹序列,可以通过以下步骤实现:
步骤S101、对于任一对象,基于该对象在预设统计周期内的图像采集数据,确定图像采集时间最小的第一图像采集数据。
步骤S102、从该对象在预设统计周期内的图像采集数据中,确定所属监控设备与第一图像采集数据所属监控设备不同,且图像采集时间与第一图像采集数据的图像采集时间最接近的第二图像采集数据。
步骤S103、当第二图像采集数据的图像采集时间与第一图像采集数据的图像采集时间之间的差值大于预设时间阈值时,基于第一图像采集数据生成轨迹点,从该对象在预设统计周期内的图像采集数据中,剔除所属监控设备与第一图像采集数据所属监控设备相同,且图像采集时间小于第二图像采集数据的图像采集时间的图像采集数据,并将第二图像采集数据确定为新的第一图像采集数据。
步骤S104、当第二图像采集数据的图像采集时间与第一图像采集数据的图像采集时间之间的差值小于或等于预设时间阈值时,剔除该第二图像采集数据,并重新从该对象在预设统计周期内的图像采集数据中确定新的第二图像采集数据。
示例性的,为了实现对图像采集数据中的重复采集数据或/和重叠采集数据进行过滤,对于任一对象,在确定该对象的轨迹序列时,可以基于该对象在预设统计周期内的图像采集数据,确定图像采集时间最小(图像采集越早,图像采集时间越小)的图像采集数据(本文中称为第一图像采集数据)。
在一个示例中,该预设统计周期可以为自然日或其他时间段(如某一自然日的上午8点到12点)。
在确定了第一图像采集数据之后,可以从该对象在预设统计周期内的图像采集数据中,确定所属监控设备与第一图像采集数据所属监控设备不同,且图像采集时间与第一图像采集数据的图像采集时间最接近的图像采集数据(本文中称为第二图像采集数据)。
在确定了第一图像采集数据和第二图像采集数据时,可以计算第二图像采集数据的图像采集时间和第一图像采集数据的图像采集时间之间的差值(较大者减去较小值得到的差值),并比较该差值与预设时间阈值。
当该差值大于预设时间阈值时,可以基于第一图像采集数据生成一个轨迹点(该轨迹点包括第一图像采集数据所属监控设备的监控设备标识以及第一图像采集数据的图像采集时间),剔除所属监控设备与第一图像采集数据所属监控设备相同,且图像采集时间小于第二图像采集数据的图像采集时间的图像采集数据(这些数据属于重复采集数据),并将第二图像采集数据确定为新的第一图像采集数据。
需要说明的是,为了减小计算内存,可以为监控设备标识配置唯一性的编号,对于图像采集时间,以自然日为统计周期进行轨迹序列统计时,可以将图像采集时间减去当前时间原点(例如:2019-09-29 00:00:00),并将得到的结果以分钟为单位存储作为图像采集时间。
示例性的,当该差值小于或等于预设时间阈值时,可以剔除该第二图像采集数据(这些数据属于重叠采集数据),并重新从该对象在预设统计周期内的图像采集数据中确定新的第二图像采集数据。
需要说明的是,在该实施例中,在确定了新的第一图像采集数据或第二图像采集数据时,可以继续按照上述策略进行轨迹点生成,直至不再存在新的第二图像采集数据时,基于所确定的轨迹点生成轨迹序列。
在一个示例中,当按照上述方式确定了新的第一图像采集数据时,若不存在图像采集时间与该第一图像采集数据的图像采集时间之间的差值大于预设时间阈值的第二图像采集数据时,可以基于该第一图像采集数据生成一个轨迹点,并结束该对象的轨迹序列确定流程。
为了使本领域技术人员更好地理解本申请实施例提供的技术方案,下面结合具体实例对本申请实施例提供的技术方案进行说明。
在该实施例中,以图像采集的对象为人为例。
在该实施例中,为了提高数据读取效率和计算速度,可以按照以下数据结构记录监控设备的图像采集数据:
1、以空间点,即监控设备作为key。
2、以该human_id(人员的唯一标识)被监控设备(key)采集到图像的图像采集时间序列作为value。
一天内采集到某一个human_id的图像的监控设备数量是有限的,并且组成的空间序列长度远远小于以图像采集时间组成的时间序列长度。
某一个human_id被一个监控设备重复、不间断的进行图像采集,造成单个监控设备下图像采集时间序列过长。采用当前的数据结构在进行轨迹序列计算时能够避免该问题,以减少计算量。
数据结构:
[d1,<t11,t12,t13……t1n>]
[d2,<t21,t22,t23……t2n>]
……
[dm,<tm1,tm2,tm3……tmn>]
其中,di为监控设备i的设备标识,tij为监控设备i第j次采集到该human的图像的图像采集时间。
一、人员轨迹序列计算
基于异常数据来源(参见图4A和图4B),可以根据异常数据产生的特点,制定针对性的数据清洗算法,将尽可能多的异常数据清洗掉,并且保证正确数据没有被清洗掉的风险。
在该实施例中,为了实现异常数据过滤,需要保证在独立的一段时间内(直到被其他的监控设备采集到图像),一个人只能被一个监控设备采集到图像,且只采集到一次图像。
基于上述的数据结构,人员轨迹序列计算算法如下:
1)、从所有的图像采集时间序列中找最小时间(tmin),并且记录tmin所属的设备(devicekey);
2)、从非devicekey的其他设备序列中,找最小时间(ttemp),并记录所属设备(devicetemp);
3)、判断ttemp-tmin>阈值(threshold,默认2分钟)是否成立;
示例性的,阈值过大则可能会丢失轨迹点,阈值过小会增加脏数据量,根据实际情况(监控设备的最小距离间隔)设置。
4)、若上述表达式成立,则将<devicekey,tmin>作为一个轨迹点,并且剔除devicekey时间序列中所有小于ttemp的时间点,将ttemp赋值给tmin,devicetemp赋值给devicekey进行下一轮循环。
5)、若上述表达式不成立,则剔除devicetemp时间序列中的ttemp进入下一轮循环。
6)、直到ttemp找不到时,结束循环。
经过上述人员轨迹序列计算算法计算后的数据,会形成一条清晰的轨迹,由监控设备的设备标识和图像采集时间组成,且是按照图像采集时间排序过的轨迹序列。
形式:
[<device1,time1>,<device2,time2>……<devicex,timex>……<deivcen,timen>]
为了进一步的减少计算内存,可以将监控设备存入缓存并且赋予唯一的编号,按照天为单位记录轨迹序列,时间可以由图像采集时间减去当天时间原点(例如:2019-09-2900:00:00)以分钟为单位进行储存。
则轨迹序列形式为:
[<1,23>,<3,45>……<x,tx>……<n,tn>]
上面的轨迹序列表示:当天的第23分钟,被监控设备1采集到;当前的第45分钟,被监控设备3采集到……
至此,完成human_id的轨迹分析功能。
将human_id对应的轨迹以时间(精确到天)、human_id组成的rowKey存储到HBase中,进行存储,以方便后续基于轨迹序列的其他研判功能分析。
二、基于LCS改进型算法的人脸同行人分析
在完成human_id的轨迹分析之后,可以基于轨迹序列进一步的分析同行人。同行人是指在一段时间内和待分析人员一起运动的人员,则同行人必定和待分析人员具有相同的运动轨迹,表现在轨迹序列中,则是具有公共子序列。因此,可以基于轨迹序列采用LCS算法计算待分析人员的同行人。
但是,需要剔除两个轨迹序列存在公共子序列,但是相同轨迹点之间间隔过多的其他轨迹点的情况。
在该实施例中,对于待分析人员的轨迹序列以及任一待比对人员的轨迹序列,可以基于LCS改进算法确定公共子序列,并保证同一公共子序列的同一子集中各轨迹点之间的距离不大于预设距离阈值,以消除振荡的脏数据对轨迹结果的影响,并且保证轨迹的相似性(即允许同行人之间拥有不同设监控备的图像采集记录,但是记录的量小于阈值,从而剔除上述交叉同行的情况)。
基于动态规划最优子问题解过程:
令X=<x1,x2,...,xm>和Y=<y1,y2,...,yn>为两个序列,Z=<z1,z2,z3,...,zk>为X和Y的任意公共子序列。
1)若Xm=Yn,则Zk=Xm=Yn,且Zk-1为Xm-1和Yn-1的公共子序列;
2)若Xm≠Yn且Zk≠Xm,则Z为Xm-1和Yn的公共子序列;
3)若Xm≠Yn且Zk≠Yn,则Z为Xm和Yn-1的公共子序列;
则公共子序列长度计算公式为:
设C[i][j]表示序列Xm和Yn的最长公共子序列的长度,则计算公式:
其中,i=m+1,j=n+1;
计算过程:
需要说明的是:X、Y表示序列,下标表示长度;x、y表示元素,下标表示位置。
1、输入轨迹序列X(长度m)和轨迹序列Y(长度n),并且初始化栈Stack(用于存放公共轨迹点)与标记字符flag;
2、根据轨迹序列X和Y的长度生成二维Integer(整数)型数组(C[i][j]),长宽分别为X,Y的长度加1,即i=m+1,j=n+1;
3、将C[i][j]的第一行和第一列都初始化为0元素;
4、根据C[i][j]公式计算C[i][j]中其他的元素的值;
5、对C[i][j]元素进行回溯,当C[i][j]=C[i-1][j-1]+1,并且C[i][j]>Max(C[i][j-1],C[i-1][j])时,判断C[i][j]对应的元素(即公共轨迹点)与上一次入栈元素之间的距离(通过下标计算)是否超过阈值,如果超过,则flag入栈,即将flag之前和之后的元素划分至不同的子集;
6.C[i][j]对应元素(即xi-1或yj-1,其中,xi-1=yj-1)入栈;
7.更新当前横向索引i,纵向索引j;
8.回溯结束。根据标记字符flag对栈中元素进行切分,最长的子段即为改进型公共子序列中的最大子集。
基于上述策略,不仅能够发现两条轨迹序列是否存在同行关系。如果两条轨迹序列中存在同行关系,还能将同行的点位和时间进行返回。
以上对本申请提供的方法进行了描述。下面对本申请提供的装置进行描述:
请参见图6,为本申请实施例提供的一种数据处理装置的结构示意图,如图6所示,该数据处理装置可以包括:
第一确定单元610,被配置为确定各对象的轨迹序列;其中,该轨迹序列包括多个轨迹点,轨迹点包括监控设备标识与图像采集时间,任一轨迹序列中各轨迹点按照图像采集时间顺序排列;
第二确定单元620,被配置为基于指定对象的轨迹序列,以及其他对象的轨迹序列,分别确定指定对象的轨迹序列与各其他对象的轨迹序列的公共子序列;
第三确定单元630,被配置为基于指定对象的轨迹序列与各其他对象的轨迹序列之间的公共子序列,确定与指定对象存在同行关系的其他对象。
在一种可能的实施例中,对于任一其他对象的轨迹序列,该其他对象的轨迹序列与指定对象的轨迹序列的公共子序列中包含的公共轨迹点为该其他对象的轨迹序列与指定对象的轨迹序列共同拥有、各公共轨迹点在该公共子序列中的顺序,与各公共轨迹点在任一原轨迹序列中的顺序相同、且图像采集时间相邻的两个公共轨迹点之间的距离小于预设距离阈值。
在一种可能的实施例中,两个公共轨迹点之间的距离基于原轨迹序列中该两个公共轨迹点之间的轨迹点的数量确定,且两个公共轨迹点之间的距离与任一原轨迹序列中该两个公共轨迹点之间的轨迹点的数量正相关。
在一种可能的实施例中,任一轨迹序列中图像采集时间相邻的两个轨迹点包括的监控设备标识不同,且图像采集时间相邻的两个轨迹点包括的图像采集时间的差值大于预设时间阈值。
在一种可能的实施例中,第一确定单元610,具体被配置为对于任一对象,基于该对象在预设统计周期内的图像采集数据,确定图像采集时间最小的第一图像采集数据;
从该对象在预设统计周期内的图像采集数据中,确定所属监控设备与第一图像采集数据所属监控设备不同,且图像采集时间与第一图像采集数据的图像采集时间最接近的第二图像采集数据;
当第二图像采集数据的图像采集时间与第一图像采集数据的图像采集时间之间的差值大于预设时间阈值时,基于第一图像采集数据生成轨迹点,剔除所属监控设备与第一图像采集数据所属监控设备相同,且图像采集时间小于第二图像采集数据的图像采集时间的图像采集数据,并将第二图像采集数据确定为新的第一图像采集数据;
当第二图像采集数据的图像采集时间与第一图像采集数据的图像采集时间之间的差值小于或等于预设时间阈值时,剔除该第二图像采集数据,并重新从该对象在预设统计周期内的图像采集数据中确定新的第二图像采集数据。
请参见图7,为本申请实施例提供的一种电子设备的硬件结构示意图。该电子设备可以包括处理器701、通信接口702、存储器703和通信总线704。处理器701、通信接口702以及存储器703通过通信总线704完成相互间的通信。其中,存储器703上存放有计算机程序;处理器701可以通过执行存储器703上所存放的程序,执行上文描述的数据处理方法。
本文中提到的存储器703可以是任何电子、磁性、光学或其它物理存储装置,可以包含或存储信息,如可执行指令、数据,等等。例如,存储器702可以是:RAM(Radom AccessMemory,随机存取存储器)、易失存储器、非易失性存储器、闪存、存储驱动器(如硬盘驱动器)、固态硬盘、任何类型的存储盘(如光盘、dvd等),或者类似的存储介质,或者它们的组合。
本申请实施例还提供了一种存储有计算机程序的机器可读存储介质,例如图7中的存储器703,该计算机程序可由图7所示电子设备中的处理器701执行以实现上文中描述的数据处理方法。
本申请实施例还提供了一种计算机程序,存储于机器可读存储介质,例如图7中的存储器703,并且当处理器执行该计算机程序时,促使处理器701执行上文中描述的数据处理方法。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅为本申请的较佳实施例而已,并不用以限制本申请,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请保护的范围之内。
Claims (10)
1.一种数据处理方法,其特征在于,包括:
确定各对象的轨迹序列;其中,所述轨迹序列包括多个轨迹点,所述轨迹点包括监控设备标识与图像采集时间,任一轨迹序列中各轨迹点按照图像采集时间顺序排列;
基于指定对象的轨迹序列,以及其他对象的轨迹序列,分别确定所述指定对象的轨迹序列与各其他对象的轨迹序列的公共子序列;
基于所述指定对象的轨迹序列与各其他对象的轨迹序列之间的公共子序列,确定与所述指定对象存在同行关系的其他对象。
2.根据权利要求1所述的方法,其特征在于,对于任一其他对象的轨迹序列,所述公共子序列中包含的公共轨迹点为该其他对象的轨迹序列与所述指定对象的轨迹序列共同拥有的轨迹点、且各所述公共轨迹点在所述公共子序列中的顺序,与各所述公共轨迹点在任一原轨迹序列中的顺序相同。
3.根据权利要求2所述的方法,其特征在于,在所述公共子序列中图像采集时间相邻的两个所述公共轨迹点之间的距离小于预设距离阈值。
4.根据权利要求3所述的方法,其特征在于,两个公共轨迹点之间的距离基于原轨迹序列中该两个公共轨迹点之间的轨迹点的数量确定,且两个公共轨迹点之间的距离与任一原轨迹序列中该两个公共轨迹点之间的轨迹点的数量正相关;所述原轨迹序列为该其他对象的轨迹序列或所述指定对象的轨迹序列。
5.根据权利要求1至4任一项所述的方法,其特征在于,任一轨迹序列中图像采集时间相邻的两个轨迹点包括的监控设备标识不同,且图像采集时间相邻的两个轨迹点包括的图像采集时间的差值大于预设时间阈值。
6.根据权利要求5所述的方法,其特征在于,所述确定各对象的轨迹序列,包括:
对于任一对象,基于该对象在预设统计周期内的图像采集数据,确定图像采集时间最小的第一图像采集数据;
从该对象在预设统计周期内的图像采集数据中,确定所属监控设备与第一图像采集数据所属监控设备不同,且图像采集时间与第一图像采集数据的图像采集时间最接近的第二图像采集数据;
当第二图像采集数据的图像采集时间与第一图像采集数据的图像采集时间之间的差值大于所述预设时间阈值时,基于第一图像采集数据生成轨迹点,剔除所属监控设备与第一图像采集数据所属监控设备相同,且图像采集时间小于第二图像采集数据的图像采集时间的图像采集数据,并将第二图像采集数据确定为新的第一图像采集数据;
当第二图像采集数据的图像采集时间与第一图像采集数据的图像采集时间之间的差值小于或等于所述预设时间阈值时,剔除该第二图像采集数据,并重新从该对象在预设统计周期内的图像采集数据中确定新的第二图像采集数据。
7.一种数据处理装置,其特征在于,包括:
第一确定单元,被配置为确定各对象的轨迹序列;其中,所述轨迹序列包括多个轨迹点,所述轨迹点包括监控设备标识与图像采集时间,任一轨迹序列中各轨迹点按照图像采集时间顺序排列;
第二确定单元,被配置为基于指定对象的轨迹序列,以及其他对象的轨迹序列,分别确定所述指定对象的轨迹序列与各其他对象的轨迹序列的公共子序列;
第三确定单元,被配置为基于所述指定对象的轨迹序列与各其他对象的轨迹序列之间的公共子序列,确定与所述指定对象存在同行关系的其他对象。
8.根据权利要求7所述的装置,其特征在于,对于任一其他对象的轨迹序列,所述公共子序列中包含的公共轨迹点为该其他对象的轨迹序列与所述指定对象的轨迹序列共同拥有的轨迹点、且各所述公共轨迹点在所述公共子序列中的顺序,与各所述公共轨迹点在任一原轨迹序列中的顺序相同。
9.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-6任一项所述的方法。
10.一种机器可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-6任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011281663.7A CN114511816A (zh) | 2020-11-16 | 2020-11-16 | 数据处理方法、装置、电子设备及机器可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011281663.7A CN114511816A (zh) | 2020-11-16 | 2020-11-16 | 数据处理方法、装置、电子设备及机器可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114511816A true CN114511816A (zh) | 2022-05-17 |
Family
ID=81547181
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011281663.7A Pending CN114511816A (zh) | 2020-11-16 | 2020-11-16 | 数据处理方法、装置、电子设备及机器可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114511816A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115994147A (zh) * | 2023-03-23 | 2023-04-21 | 浙江宇视科技有限公司 | 一种轨迹库构建方法、装置、电子设备及介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111090681A (zh) * | 2019-11-12 | 2020-05-01 | 高新兴科技集团股份有限公司 | 一种团伙挖掘方法、装置、设备及存储介质 |
CN111372188A (zh) * | 2020-05-27 | 2020-07-03 | 腾讯科技(深圳)有限公司 | 区域内热点轨迹确定方法和装置、存储介质及电子装置 |
CN111382627A (zh) * | 2018-12-28 | 2020-07-07 | 成都云天励飞技术有限公司 | 同行判定方法及相关产品 |
CN111563479A (zh) * | 2020-05-26 | 2020-08-21 | 深圳市商汤科技有限公司 | 同行人去重方法、团伙分析方法、装置及电子设备 |
CN111651484A (zh) * | 2020-05-22 | 2020-09-11 | 华中科技大学 | 基于语义轨迹相似度移动对象伴随关系的分析方法和装置 |
-
2020
- 2020-11-16 CN CN202011281663.7A patent/CN114511816A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111382627A (zh) * | 2018-12-28 | 2020-07-07 | 成都云天励飞技术有限公司 | 同行判定方法及相关产品 |
CN111090681A (zh) * | 2019-11-12 | 2020-05-01 | 高新兴科技集团股份有限公司 | 一种团伙挖掘方法、装置、设备及存储介质 |
CN111651484A (zh) * | 2020-05-22 | 2020-09-11 | 华中科技大学 | 基于语义轨迹相似度移动对象伴随关系的分析方法和装置 |
CN111563479A (zh) * | 2020-05-26 | 2020-08-21 | 深圳市商汤科技有限公司 | 同行人去重方法、团伙分析方法、装置及电子设备 |
CN111372188A (zh) * | 2020-05-27 | 2020-07-03 | 腾讯科技(深圳)有限公司 | 区域内热点轨迹确定方法和装置、存储介质及电子装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115994147A (zh) * | 2023-03-23 | 2023-04-21 | 浙江宇视科技有限公司 | 一种轨迹库构建方法、装置、电子设备及介质 |
CN115994147B (zh) * | 2023-03-23 | 2023-05-30 | 浙江宇视科技有限公司 | 一种轨迹库构建方法、装置、电子设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6832504B2 (ja) | 物体追跡方法、物体追跡装置およびプログラム | |
CN108921008B (zh) | 人像识别方法、装置及电子设备 | |
CN107506684B (zh) | 步态识别方法及装置 | |
JP4753193B2 (ja) | 動線管理システムおよびプログラム | |
CN108257386B (zh) | 行驶轨迹获取方法和装置 | |
CN109165237A (zh) | 伴随对象确定方法、装置以及电子设备 | |
CN113065474B (zh) | 行为识别方法、装置及计算机设备 | |
CN111597970B (zh) | 异常行为的识别方法及装置 | |
CN107945522A (zh) | 基于大数据查找嫌疑车辆的方法和*** | |
CN114283370A (zh) | 车辆未清洗识别方法、装置及应用 | |
US20070104373A1 (en) | Method for automatic key posture information abstraction | |
JP2007310480A (ja) | 認識装置および認識方法 | |
CN114511816A (zh) | 数据处理方法、装置、电子设备及机器可读存储介质 | |
CN111090777A (zh) | 一种视频数据的管理方法、管理设备及计算机存储介质 | |
CN112668438A (zh) | 红外视频时序行为定位方法、装置、设备及存储介质 | |
CN110164137B (zh) | 基于卡口对行车时间的***辆的识别方法及***、介质 | |
WO2018030048A1 (ja) | 物体追跡方法、物体追跡装置およびプログラム | |
CN115880894A (zh) | 一种交通状态确定方法、装置及设备 | |
CN111784742B (zh) | 一种行人跨镜头追踪方法及装置 | |
CN105930430B (zh) | 一种基于非累积属性的实时欺诈检测方法及装置 | |
CN112559583B (zh) | 一种同行人识别方法及装置 | |
CN111222370A (zh) | 一种案件研判方法、***及装置 | |
CN114049608A (zh) | 轨迹监测方法、装置、计算机设备、存储介质 | |
CN113628248A (zh) | 行人驻留时长确定方法、装置以及计算机可读存储介质 | |
CN112364072A (zh) | 一种涉车非营运车营运发现方法、装置、设备和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |