WO2022135511A1

WO2022135511A1 - 运动物体的定位方法、装置、电子设备及存储介质

Info

Publication number: WO2022135511A1
Application number: PCT/CN2021/140765
Authority: WO
Inventors: 马欣; 吴臻志; 祝夭龙
Original assignee: 北京灵汐科技有限公司
Priority date: 2020-12-24
Filing date: 2021-12-23
Publication date: 2022-06-30
Also published as: CN112669344B; CN112669344A

Abstract

一种运动物体的定位方法、装置、电子设备及存储介质，该方法包括：通过动态视觉传感器获取事件流信息，以及通过目标摄像组件获取图像信息（S110）；根据预设采样周期对事件流信息进行采样，以获取采样事件帧（S120）；根据采样事件帧对应的事件流信息，确定采样事件帧中运动物体的预测位置区域（S130）；根据预测位置区域，确定图像信息中与预测位置区域匹配的定位区域（S140）。该方法提高了运动物体的定位效率，尤其是提高了针对高速运动物体的检测实时性。

Description

运动物体的定位方法、装置、电子设备及存储介质

技术领域

本公开实施例涉及图像识别技术领域，尤其涉及一种运动物体的定位方法、装置、电子设备及存储介质。

背景技术

随着科技的不断进步，图像识别技术得到了迅速发展，被广泛应用于各个领域，其中对于图像中高速运动物体的定位，成为了图像识别技术的重要分支。

在相关技术中，通常是针对摄像组件获取的视频图像，直接在全局图像中进行特征提取，并根据提取到的图像特征在图像中对运动物体进行定位。

但是这样的图像识别方式，图像特征的提取计算量极大，且由于摄像组件的拍摄画面中，大多数情况下保持静止状态，常常造成计算资源浪费，同时，通过图像特征，比较物体在不同图像帧之间的位置来判断是否存在运动物体，难以保证图像识别的实时性，尤其对于高速运动的物体，定位效果较差。

发明内容

本公开实施例提供了一种运动物体的定位方法、装置、电子设备及存储介质。

第一方面，本公开实施例提供了一种运动物体的定位方法，该定位方法包括：通过动态视觉传感器获取事件流信息，以及通过目标摄像组件获取图像信息；根据预设采样周期对事件流信息进行采样，以获取采样事件帧；根据所述采样事件帧对应的事件流信息，确定所述采样事件帧中运动物体的预测位置区域；根据所述预测位置区域，确定所述图像信息中与所述预测位置区域匹配的定位区域。

第二方面，本公开实施例提供了一种运动物体的定位装置，该定位装置包括：信息获取模块，用于通过动态视觉传感器获取事件流信息，以及通过目标摄像组件获取图像信息；采样执行模块，用于根据预设采样周期，对所述事件流信息进行采样，以获取采样事件帧，并根据所述采样事件帧对应的事件流信息，确定所述采样事件帧中运动物体的预测位置区域；分类执行模块，用于根据所述预测位置区域，确定所述图像信息中与所述预测位置区域匹配的定位区域。

第三方面，本公开实施例提供了一种电子设备，该电子设备包括：一个或多个处理器；存储器，用于存储一个或多个程序；当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现本公开任意实施例所述的运动物体的定位方法。

第四方面，本公开实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现本公开任意实施例所述的运动物体的定位方法。

根据本公开实施例提供的运动物体的定位方法及装置、电子设备、计算机可读存储介质的技术方案，通过动态视觉传感器获取到事件流信息后，确定采样事件帧中运动物体的预测位置区域，并在目标摄像组件的图像信息中确定匹配的定位区域，提高了运动物体的定位效率，尤其是提高了针对高速运动物体的检测实时性。

附图说明

图1A是本公开实施例提供的一种运动物体的定位方法的流程示意图；

图1B是本公开实施例中一种确定采样事件帧中运动物体的轮廓区域的方法的流程示意图；

图1C是本公开实施例提供的运动物体的预测位置区域的示意图；

图1D是本公开实施例中一种确定图像信息中与预测位置区域匹配的定位区域的方法的流程示意图；

图2是本公开实施例提供的另一种运动物体的定位方法的流程示意图；

图3是本公开实施例提供的一种运动物体的定位装置的结构框图；

图4是本公开实施例提供的一种电子设备的结构框图。

具体实施方式

下面结合附图和实施例对本公开作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释本公开，而非对本公开的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与本公开相关的部分而非全部结构。

图1A为本公开实施例提供的一种运动物体的定位方法的流程示意图，本公开实施例可用于检测目标摄像组件拍摄的图像信息中是否存在运动物体，对目标摄像组件拍摄的图像信息中的运动物体进行定位、识别和分类，该方法可以由本公开实施例中的运动物体的定位装置来执行，该装置可以通过软件和/或硬件实现，并集成在电子设备中，该方法具体包括如下步骤：步骤S110～步骤S140。

步骤S110、通过动态视觉传感器获取事件流信息，以及通过目标摄像组件获取图像信息。

动态视觉传感器(Dynamic Vision Sensor，DVS)，是一种采用像素异步机制，并基于地址和事件表达(AER)的图像采集装置；相较于相关技术中以固定频率采集的“帧”为基础，并依次读取各“帧”中所有的像素信息的方案，DVS不需要对画面中的所有像素点进行读取，仅需要获取光强度变化的像素点的地址和信息；具体的，当动态视觉传感器检测到某个像素点的光强度变化大于等于预设门限数值时，则发出该像素点的事件信号；其中，如果该光强度变化为正向变化，即该像素点由低亮度跳变至高亮度，则发出用“+1”表示的事件信号，并标注为正事件；如果该光强度变化为负向变化，即该像素点由高亮度跳变至低亮度，则发出用“-1”表示的事件信号，并标注为负事件；如果光强度变化小于预设门限数值，则不发出事件信号，标注为无事件；动态视觉传感器通过对各像素点进行的事件标注，以构成事件流信息。

目标摄像组件是将光学图像信号转变为电信号，进而进行电信号存储或传输的拍摄装置，可以包括多种类型拍摄装置，例如，高速图像采集(High-speed Image Acquisition)设备和监控摄像头；其中，高速图像采集设备是一种用于高速采集并获取数字化视频图像信息的图像采集设备，可以将获取到的图像数据流，按照预先安排好的路径传输、显示和存储；在本公开实施例中，高速图像采集设备，对可见光范围内的RGB(红、绿、蓝三通道)图像进行快速捕获，生成高速的画面帧，以确保对高速运动物体轨迹的获取，其生成画面帧的帧率可以达到每秒一千帧至十万帧的量级。

在本公开实施例中，在步骤S110中，通过动态视觉传感器获取目标场景的事件流信息，以及通过目标摄像组件获取该目标场景的图像信息。换言之，事件流信息和图像信息是针对相同场景的拍摄画面，且拍摄画面的内容相同；事件流信息和图像信息可以是在同一时刻下获取的，也可以先通过动态视觉传感器获取事件流信息，并在采样事件帧中进行定位后，再通过目标摄像组件获取图像信息。

为了确保动态视觉传感器和目标摄像组件拍摄的画面内容相同，动态视觉传感器和目标摄像组件可以设置在邻近的拍摄位置(例如，可将动态视觉传感器和目标摄像组件集成在同一台电子设备中)，以使动态视觉传感器和目标摄像组件两种设备的摄像头足够接近，以改善拍摄角度视差，且可以通过调节该两种设备的摄像头的拍摄角度，以确保能够获取到相同场景的拍摄画面。

步骤S120、根据预设采样周期对事件流信息进行采样，以获取采样事件帧。

步骤S130、根据采样事件帧对应的事件流信息，确定采样事件帧中运动物体的预测位置区域。

相比于光亮强度变化较小的背景图像，画面中运动物体经过的区域，其对应的像素点的光亮强度会存在不同程度的变化，例如，运动物体出现时，运动物体出现区域的像素点的光亮强度会显著增加，运动物体消失时，运动物体消失区域的像素点的光亮强度会显著降低，因此，根据事件流信息，可以确定画面中哪些像素点可能存在运动物体。具体的，在预设采样周期内，如果某个像素点的事件流信息中包括正事件或负事件，则该像素点可能是与运动物体相关的像素点；采样事件帧是在预设采样周期内，对每个像素点的所有标注事件进行汇总后显示的图像帧，采样事件帧的事件流信息包括多个像素点对应的事件信息，每个像素点对应的事件信息包括至少一个标注事件，根据采样事件帧中多个像素点的标注事件(如正事件、负事件)，可以预测得到运动物体的位置区域。

其中，预设采样周期可以根据实际需要设定，例如，为了提高事件流信息中运动物体的检测效率，可以将预设采样周期设定为较低数值；为了降低图像处理压力，则可以将预设采样周期设定为较高数值；特别的，由于DVS的检测精度较高，对于像素点的事件信号的检测可以达到纳秒级(例如，1000纳秒，即每间隔1000纳秒获取一次像素点的事件信号)，而预设采样周期通常设定为毫秒级(例如，10毫秒)，因此，在一个采样周期内，一个像素点的光强度可能经历了多次变化，即DVS针对一个像素点发出了多个事件信号，那么只要在预设采样周期内，该像素点的事件信息包括至少一个正事件和/或负事件，那么该像素点即包含在运动物体的预测位置区域中。

在本公开的一些实施例中，在步骤S130中，根据采样事件帧对应的事件流信息，确定采样事件帧中运动物体的预测位置区域，可以进一步包括：根据采样事件帧对应的事件流信息，确定采样事件帧中运动物体的轮廓区域，并通过感兴趣区域框标注轮廓区域，以获取运动物体的预测位置区域。

其中，感兴趣区域(Region Of Interest，ROI)是以方框、圆、椭圆和多边形等方式勾勒出来需要处理的区域，由于运动物体的轮廓信息通常为不规则图形，在图像中不便于定位，在本公开的一些实施例中，感兴趣区域框可以通过矩形标注框的方式，在图像中标注出同时包含运动物体出现轮廓和运动物体消失轮廓的最小矩形，而矩形标注框及矩形标注框内的区域，即为运动物体的预测位置区域。其中，对于运动物体的轮廓区域，可以在采样事件帧中，通过目标检测算法获取，例如，通过滑动窗口检测器或R-CNN(Regions with CNN features，基于卷积神经网络的区域特征)获取。

图1B是本公开实施例中一种确定采样事件帧中运动物体的轮廓区域的方法的流程示意图，在本公开的一些实施例中，如图1B所示，在步骤S130中，根据采样事件帧对应的事件流信息，确定采样事件帧中运动物体的轮廓区域，可以进一步包括：步骤S131～步骤S133。

步骤S131、根据采样事件帧对应的事件流信息，获取事件出现帧和事件消失帧。

如前所述，采样事件帧的事件流信息包括采样事件帧中多个像素点对应的事件信息，每个像素点对应的事件信息包括至少一个标注事件，标注事件包括标注为正事件或者负事件的事件。

作为一种可选的实施方式，在步骤S131中，根据采样事件帧对应的事件流信息，获取事件出现帧和事件消失帧，可以进一步包括：将多个像素点对应的事件信息中，被标注为正事件的标注事件所对应的像素点确定为事件出现像素点；并且将多个像素点对应的事件信息中，被标注为负事件的标注事件所对应的像素点确定为事件消失像素点；根据所有事件出现像素点生成事件出现帧，并根据所有事件消失像素点生成事件消失帧。

可以理解的是，采样事件帧描述所有像素点的事件信息，事件出现帧描述所有正事件对应的像素点的信息，而事件消失帧描述所有负事件对应的像素点的信息。

其中，事件出现帧、事件消失帧与采样事件帧的像素分辨率相同，而采样事件帧的像素分辨率与动态视觉传感器DVS的分辨率相同。

在事件出现帧中，所有事件出现像素点对应的像素值设置为第一像素值，所有非事件出现像素点对应的像素值设置为第二像素值。在事件消失帧中，所有事件消失像素点对应的像素值设置为第一像素值，所有非事件消失像素点对应的像素值设置为第二像素值。示例性的，第一像素值可以设置为最大像素值，即255，而第二像素值可以设置为最小像素值，即0。

在本公开的一些实施例中，可以通过事件出现矩阵表示事件出现帧，通过事件消失矩阵表示事件消失帧。其中，事件出现矩阵中每个元素对应事件出现帧的每个像素点，且位置对应设置，事件出现矩阵中每个元素的值为对应的像素点的像素值；同理，事件消失矩阵中每个元素对应事件消失帧的每个像素点，且位置对应设置，事件消失矩阵中每个元素的值为对应的像素点的像素值。

初始时，可以预置一个事件出现空矩阵和一个事件消失空矩阵。其中，事件出现空矩阵中的每个元素的值初始化为第二像素值(如0)，事件出现空矩阵中的元素行数与采样事件帧的像素分辨率中像素行数对应一致，事件出现空矩阵中的元素列数与采样事件帧的像素分辨率中像素列数对应一致，事件出现空矩阵中每个元素对应一个像素点；事件消失空矩阵中的每个元素的值初始化为第二像素值(如0)，事件消失空矩阵中的元素行数与采样事件帧的像素分辨率中像素行数对应一致，事件消失空矩阵中的元素列数与采样事件帧的像素分辨率中像素列数对应一致，事件消失空矩阵中每个元素对应一个像素点。示例性的，动态视觉传感器的分辨率为1024(水平像素)×648(垂直像素)，则相应的，事件出现空矩阵和事件消失空矩阵均为1024(行)×648(列)矩阵。

根据预设采样周期内采样事件帧中每个像素点的标注事件，对事件出现空矩阵和事件消失空矩阵中的各元素进行赋值，以获取事件出现矩阵和事件消失矩阵。

示例性的，事件出现空矩阵和事件消失空矩阵中各元素的值均初始化为第二像素值，例如0。若在预设采样周期内，获取到一个像素点的标注事件为正事件时，则在事件出现空矩阵中，将与该像素点对应的元素赋值为第一像素值(即赋值为255)；通过将预设采样周期内所有包含正事件的像素点所对应的事件出现空矩阵中的元素均赋值为第一像素值(即255)，而所有包含负事件或无事件的像素点所对应的元素的值则保持为第二像素值(即0)，从而得到事件出现矩阵；在获取的事件出现矩阵中，值为255的元素在画面中的位置表示在预设采样周期出现运动物体时运动物体的边缘的出现轨迹，因此，根据事件出现矩阵可以在图像中获取高亮的运动物体的出现轮廓。

同理，若在预设采样周期内，获取到一个像素点的标注事件为负事件时，则在事件消失空矩阵中，将与该像素点对应的元素赋值为第一像素数值(即赋值为255)；通过将预设采样周期内所有包含负事件的像素点所对应的事件消失空矩阵中的元素均赋值为第一像素值(即255)，而所有包含正事件或无事件的像素点所对应的元素的值则保持为第二像素值(即0)，从而得到事件消失矩阵；在获取的事件消失矩阵中，值为255的元素在画面中的位置表示在预设采样周期出现运动物体时运动物体的边缘的消失轨迹，因此，根据事件消失矩阵可以在图像中获取高亮的运动物体消失轮廓。最终将运动物体的出现轮廓和运动物体的消失轮廓的并集共同作为运动物体的轮廓信息。

步骤S132、根据事件出现帧确定运动物体的预测出现区域，根据事件消失帧确定运动物体的预测消失区域。

在步骤S132中，根据事件出现帧中像素值为第一像素值的所有像素点的位置确定运动物体的预测出现区域，该运动物体的预测出现区域即为前述运动物体的出现轮廓所在的区域；根据事件消失帧中像素值为第一像素值的所有像素点的位置确定运动物体的预测消失区域，该运动物体的预测消失区域即为前述运动物体的消失轮廓所在的区域。其中，像素点的位置可以采用二维位置坐标进行表示。

步骤S133、根据预测出现区域和预测消失区域，确定运动物体的轮廓区域。

其中，该运动物体的预测出现区域即为前述运动物体的出现轮廓所在的区域，可称为运动物体的出现轮廓区域；运动物体的预测消失区域即为前述运动物体的消失轮廓所在的区域，可称为运动物体的消失轮廓区域。通过将运动物体的出现轮廓区域和运动物体的消失轮廓区域进行组合，以作为运动物体的轮廓区域。

如前所述，在确定运动物体的轮廓区域后，通过感兴趣区域框标注轮廓区域，以获取运动物体的预测位置区域。图1C是本公开实施例提供的运动物体的预测位置区域的示意图，如图1C所示，以采样事件帧的左上角像素点为原点建立坐标系，运动物体的出现轮廓区域对应的感兴趣区域ROI ₁可表示为ROI ₁＝[x ₁₁,y ₁₁,x ₁₂,y ₁₂]，(x ₁₁,y ₁₁)和(x ₁₂,y ₁₂)分别为该运动物体的出现轮廓区域的左上角顶点A1(对应区域中左上角的像素点)的二维位置坐标和右下角顶点B1(对应区域中右下角的像素点)的二维位置坐标。

运动物体的消失轮廓区域对应的感兴趣区域ROI ₂可表示为ROI ₂＝[x ₂₁,y ₂₁,x ₂₂,y ₂₂]，(x ₂₁,y ₂₁)和(x ₂₂,y ₂₂)分别为该运动物体的消失轮廓区域的左上角顶点A2(对应区域中左上角的像素点)的二维位置坐标和右下角顶点B2(对应区域中右下角的像素点)的二维位置坐标；采样事件帧中运动物体的预测位置区域ROI _DVS可由如下公式表示：

ROI _DVS＝[min(x ₁₁，x ₂₁),min(y ₁₁，y ₂₁)，max(x ₁₂，x ₂₂)，max(y ₁₂，y ₂₂)]。

示例性的，当x ₁₁小于x ₂₁，y ₁₁小于y ₂₁，x ₁₂小于x ₂₂，y ₂₁小于y ₂₂时，此时ROI _DVS＝[x ₁₁,y ₁₁,x ₂₂,y ₂₂]，即以(x ₁₁，y ₁₁)作为预测位置区域ROI _DVS的左上角顶点的位置坐标，以(x ₂₂，y ₂₂)作为预测位置区域ROI _DVS的右下角顶点的位置坐标，从而确定出预测位置区域ROI _DVS。

在本公开的一些实施例中，在上述步骤S131中获取事件出现帧(事件出现矩阵)和事件消失帧(事件消失矩阵)之后，在步骤S132之前，确定轮廓区域的方法还可以进一步包括：对事件出现帧和/或事件消失帧，进行噪声点去除处理。

通常情况下，事件出现帧所对应的事件出现矩阵和事件消失帧所对应的事件消失矩阵均为稀疏矩阵，由于动态视觉传感器的敏感性，画面中除了运动物体外的背景区域也会出现稀疏噪声点，因此需要进行稀疏噪声点的去除处理。具体的，对事件出现帧和/或事件消失帧中的非零像素值的像素点进行腐蚀操作和膨胀操作，从而实现噪声点的去除，以便在二值化的事件出现帧和/或事件消失帧上检测运动物体的轮廓区域时，有效改善噪声点造成的影响，提高检测轮廓区域的精确性。

S140、根据预测位置区域，确定图像信息中与预测位置区域匹配的定位区域。

在确定了动态视觉传感器的采样事件帧中运动物体的预测位置区域后，如果动态视觉传感器和目标摄像组件的分辨率相同，表示动态视觉传感器采样的采样事件帧和目标摄像组件获取的图像信息的分辨率相同，那么采样事件帧中的预测位置区域与图像信息中的定位区域即为相同区域，在图像信息中获取与采样事件帧具有相同拍摄时刻、相同拍摄位置和拍摄角度的待检测图像，并根据预测位置区域，将待检测图像中的与预测位置区域相同的区域直接作为定位区域；

如果动态视觉传感器和目标摄像组件的分辨率不同，需要先确定动态视觉传感器和目标摄像组件的分辨率之间的比例关系，根据比例关系和采样事件帧中的预测位置区域，确定运动物体在图像信息的待检测图像中的定位区域。

图1D是本公开实施例中一种确定图像信息中与预测位置区域匹配的定位区域的方法的流程示意图，在本公开的一些实施例中，如图1D所示，在步骤S140中，根据预测位置区域，确定图像信息中与预测位置区域匹配的定位区域，可以进一步包括：步骤S141～步骤S143。

步骤S141、获取动态视觉传感器和目标摄像组件的分辨率之间的比例关系。

步骤S142、根据比例关系对预测位置区域进行缩放处理。

步骤S143、将经缩放处理后的预测位置区域映射到图像信息中，以确定出与预设位置区域匹配的定位区域。

在步骤S141中，动态视觉传感器和目标摄像组件的分辨率之间的比例关系包括动态视觉传感器的水平方向分辨率(水平像素)与和目标摄像组件的水平方向分辨率(水平像素)的比值，以及动态视觉传感器的垂直方向分辨率(垂直像素)与和目标摄像组件的垂直方向分辨率(垂直像素)的比值。示例性的，假设动态视觉传感器的分辨率为1024(水平像素)×648(垂直像素)，目标摄像组件的分辨率为1280(水平像素)×960(垂直像素)，则动态视觉传感器的水平方向分辨率(水平像素)与和目标摄像组件的水平方向分辨率(水平像素)的比值为1024/1280，动态视觉传感器的垂直方向分辨率(垂直像素)与和目标摄像组件的垂直方向分辨率(垂直像素)的比值为648/960。

在步骤S142中，将动态视觉传感器的水平方向分辨率与和目标摄像组件的水平方向分辨率的比值，作为水平方向调节因子

将动态视觉传感器的垂直方向分辨率与和目标摄像组件的垂直方向分辨率的比值，作为垂直方向调节因子

根据水平方向调节因子

和垂直方向调节因子

对预测位置区域ROI _DVS进行水平方向和垂直方向上的缩放处理，得到经缩放处理后的预测位置区域ROI。经缩放处理后的预测位置区域可由如下公式表示：

在步骤S143中，将经缩放处理后的预测位置区域映射到图像信息中，图像信息中与经缩放处理后的预测位置区域相同的区域即为匹配的定位区域，从而确定出与预设位置区域匹配的定位区域，其中，图像信息中运动物体的定位区域同样可由如下公式表示：

根据本公开实施例提供的运动物体的定位方法的技术方案，通过动态视觉传感器获取到事件流信息后，确定采样事件帧中运动物体的预测位置区域，并在目标摄像组件的图像信息中确定匹配的定位区域，提高了运动物体的定位效率，尤其是提高了针对高速运动物体的检测实时性。

图2是本公开实施例所提供的另一种运动物体的定位方法的流程示意图，在本公开的一些实施例中，在确定图像信息中的定位区域之后，即在上述步骤S140之后，根据预训练完成的图像分类模型，对定位区域进行识别及分类处理，以确定图像信息中是否存在运动物体，从而实现对图像信息中的运动物体的识别、分类和跟踪。如图2所示，该定位方法可以包括以下步骤：步骤S210～步骤S250。

S210、通过动态视觉传感器获取事件流信息，以及通过目标摄像组件获取图像信息。

关于步骤S210的具体描述可参见上述对步骤S110的描述，此处不再赘述。

S220、根据预设采样周期对事件流信息进行采样，以获取采样事件帧。

关于步骤S220的具体描述可参见上述对步骤S120的描述，此处不再赘述。

步骤S230、根据采样事件帧对应的事件流信息，确定采样事件帧中运动物体的预测位置区域。

关于步骤S230的具体描述可参见上述对步骤S130的描述，此处不再赘述。

S240、根据预测位置区域，确定图像信息中与预测位置区域匹配的定位区域。

关于步骤S240的具体描述可参见上述对步骤S140的描述，此处不再赘述。

S250、根据预训练完成的图像分类模型，对图像信息中的定位区域进行识别及分类处理，以确定图像信息中是否存在运动物体。

其中，图像分类模型是基于样本图像预先训练完成的分类模型，其作用在于针对输入的定位区域的图像数据，进行图像特征的提取并获取特征向量，然后根据获取到的特征向量输出对应的图像分类概率，其中图像分类概率表示了输入的定位区域的图像数据为正样本或负样本的概率，进而根据该图像分类概率进行分类(即二值分类)，确定输入的定位区域的图像数据是否存在运动物体，实现对图像信息的定位区域中运动物体的识别和分类。其中，图像特征可以包括图像的颜色特征、纹理特征、形状特征和空间关系特征；颜色特征描述了图像或图像区域所对应的景物的表面性质，是基于像素点的特征；纹理特征描述了图像或图像区域所对应景物的表面性质，其需要在包含多个像素点的区域中进行统计计算；形状特征则描述物体外边界的轮廓特征，以及整体上的区域特征；空间关系特征是视频图像中分割出来的多个目标之间的相互的空间位置或相对方向关系，例如，连接关系、重叠关系以及包含关系等。在本公开实施例中，对提取的图像特征的类型不作具体限定。

在本公开的一些实施例中，在根据预训练完成的图像分类模型，对图像信息中的定位区域进行识别及分类处理之前，还包括：判断定位区域中像素点的数量是否大于预设检测阈值。根据预训练完成的图像分类模型，对图像信息中的定位区域进行识别及分类处理，包括：若定位区域中像素点的数量大于预设检测阈值，则根据预训练完成的图像分类模型，对定位区域进行识别及分类处理。

在本公开的一些实施例中，若定位区域中像素点的数量小于或等于预设检测阈值，则不对该定位区域作进一步处理。

在本公开的一些实施例中，为了避免将体积较小的干扰物体(例如，飞虫)误检测为待监测的目标运动物体(例如，对于高空抛物的监测，高空抛物为待监测的目标运动物体)，可以将预设检测阈值设定为较大数值，以有效防止对干扰物体的误检测。在本公开的一些实施例中，为了提高对图像信息中运动物体的检测精度，也可以将预设检测阈值设定为较小数值，例如，设定为0，即定位区域中存在变化的像素点时，即将对应的定位区域通过图像分类模型进行识别和分类处理。

由于目标摄像组件的拍摄画面中，大多数情况下保持静止状态，因此预设检测阈值的设定，使得只有在检测到屏幕中，存在光强度发生变化的像素点的数量超过预设门限数值的定位区域时，才会通过图像分类模型进行图像特征提取计算，且仅需处理图像信息中的定位区域，从而有效提高了对运动物体进行识别、分析的效率，有效节约了计算资源，减轻了计算压力，提高了计算效率。

在本公开的一些实施例中，在根据预训练完成的图像分类模型，对图像信息中的定位区域进行识别及分类处理之前，还包括：获取样本图像集合，并通过样本图像集合对图像分类模型进行图像分类训练，以获取预训练完成的图像分类模型；

其中，图像分类模型基于神经网络构建，图像识别模型是基于神经网络(Neural Networks，NNS)构建的数学模型，在预先建立的网络结构基础上，通过调整内部大量节点的连接关系，实现对信息的有效处理；样本图像集合中，正样本图像为包含运动物体的图像信息，正样本图像的输出值为1；负样本图像为不包含运动物体的图像信息，负样本图像的输出值为0。通过正样本图像和负样本图像组成的样本图像集合对图像分类模型进行模型训练，使得训练完成的图像分类模型具备了根据输入的定位区域的图像数据，输出对应的图像分类概率的能力，进而输出对输入的定位区域的图像数据的类别判断结果。

根据本公开实施例提供的运动物体的定位方法的技术方案，通过动态视觉传感器获取到事件流信息后，确定采样事件帧中运动物体的预测位置区域，并在目标摄像组件的图像信息中确定匹配的定位区域，进而根据图像分类模型对定位区域图像进行图像识别及分类处理，以确定图像中是否存在运动物体，在实现运动物体定位的同时，提高了图像信息中运动物体的检测精度，有利于减少对运动物体的误检测现象的发生。

图3是本公开实施例提供的一种运动物体的定位装置的结构框图，该装置具体包括：信息获取模块310、采样执行模块320和分类执行模块330。

其中，信息获取模块310，用于通过动态视觉传感器获取事件流信息，以及通过目标摄像组件获取图像信息。采样执行模块320，用于根据预设采样周期对事件流信息进行采样，以获取采样事件帧；根据采样事件帧对应的事件流信息，确定采样事件帧中运动物体的预测位置区域。分类执行模块330，用于根据预测位置区域，确定图像信息中与预测位置区域匹配的定位区域。

根据本公开实施例提供的运动物体的定位装置的技术方案，通过动态视觉传感器获取到事件流信息后，确定采样事件帧中运动物体的预测位置区域，并在目标摄像组件的图像信息中确定匹配的定位区域，提高了运动物体的定位效率，尤其是提高了针对高速运动物体的检测实时性。

在本公开的一些实施例中，采样执行模块320，用于根据采样事件帧对应的事件流信息，确定采样事件帧中运动物体的轮廓区域，并通过感兴趣区域框标注轮廓区域，以获取运动物体的预测位置区域。

在本公开的一些实施例中，采样执行模块320，可以进一步包括：帧处理单元、预测区域获取单元和轮廓区域获取单元。

帧处理单元，用于根据采样事件帧对应的事件流信息，获取事件出现帧和事件消失帧。

预测区域获取单元，用于根据事件出现帧确定运动物体的预测出现区域，根据事件消失帧确定运动物体的预测消失区域。

轮廓区域获取单元，用于根据预测出现区域和预测消失区域，确定运动物体的轮廓区域。

在本公开的一些实施例中，采样事件帧对应的事件流信息包括多个像素点的事件信息，像素点的事件信息包括至少一个标注事件；帧获取单元用于：将多个像素点对应的事件信息中，被标注为正事件的标注事件所对应的像素点确定为事件出现像素点；并且将多个像素点对应的事件信息中，被标注为负事件的标注事件所对应的像素点确定为事件消失像素点；根据所有事件出现像素点生成事件出现帧，并根据所有事件消失像素点生成事件消失帧。

在本公开的一些实施例中，事件出现帧、事件消失帧与采样事件帧的像素分辨率相同；在事件出现帧中，所有事件出现像素点对应的像素值设置为第一像素值，所有非事件出现像素点对应的像素值设置为第二像素值；在事件消失帧中，所有事件消失像素点对应的像素值设置为第一像素值，所有非事件消失像素点对应的像素值设置为第二像素值。

在本公开的一些实施例中，预测区域获取单元用于：根据事件出现帧中像素值为第一像素值的所有像素点的位置，确定运动物体的预测出现区域，根据所述事件消失帧中像素值为第一像素值的所有像素点的位置，确定运动物体的预测消失区域。

在本公开的一些实施例中，分类执行模块330用于：获取动态视觉传感器和目标摄像组件的分辨率之间的比例关系；根据比例关系对预测位置区域进行缩放处理；将经缩放处理后的预测位置区域映射到图像信息中，以确定出匹配的定位区域。

在本公开的一些实施例中，运动物体的定位装置还包括：分类处理执行模块，分类处理执行模块用于根据预训练完成的图像分类模型，对图像信息中的定位区域进行识别及分类处理，以确定图像信息中是否存在运动物体。

在本公开的一些实施例中，运动物体的定位装置还包括：判断执行模块，判断执行模块用于判断定位区域中像素点的数量是否大于预设检测阈值。

在本公开的一些实施例中，分类执行模块330用于若所述定位区域中像素点的数量大于预设检测阈值，则根据预训练完成的图像分类模型，对图像信息中的定位区域进行识别及分类处理。

在本公开的一些实施例中，运动物体的定位装置还包括：预训练执行模块，预训练执行模块用于获取样本图像集合，并通过样本图像集合对图像分类模型进行图像分类训练，以获取预训练完成的图像分类模型；其中，图像分类模型基于神经网络构建。

上述定位装置可执行本公开任意实施例所提供的运动物体的定位方法，具备执行方法相应的功能模块和有益效果，未在本公开实施例中详尽描述的定位装置的技术细节，可参见上述本公开任意实施例提供的定位方法中相关的描述吗，此处不再赘述。

图4是本公开实施例提供的一种电子设备的结构框图。图4示出了适于用来实现本公开实施例所述的定位方法的示例性电子设备12的结构框图。图4所示的电子设备12仅仅是一个示例，不应对本公开实施例的功能和使用范围带来任何限制。

如图4所示，电子设备12以通用计算设备的形式表现。电子设备12的组件可以包括但不限于：一个或者多个处理器或者处理单元16，存储器28，连接不同***组件(包括存储器28和处理单元16)的总线18。

总线18表示几类总线结构中的一种或多种，包括存储器总线或者存储器控制器，***总线，图形加速端口，处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说，这些体系结构包括但不限于工业标准体系结构(ISA)总线，微通道体系结构(MAC)总线，增强型ISA总线、视频电子标准协会(VESA)局域总线以及***组件互连(PCI)总线。

电子设备12典型地包括多种计算机***可读介质。这些介质可以是任何能够被电子设备12访问的可用介质，包括易失性和非易失性介质，可移动的和不可移动的介质。

存储器28可以包括易失性存储器形式的计算机***可读介质，例如随机存取存储器(RAM)30和/或高速缓存存储器32。电子设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机***存储介质。仅作为举例，存储***34可以用于读写不可移动的、非易失性磁介质(图4未显示，通常称为“硬盘驱动器”)。尽管图4中未示出，可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器，以及对可移动非易失性光盘(例如CD-ROM，DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下，每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品，该程序产品具有一组(例如至少一个)程序模块，这些程序模块被配置以执行本公开各实施例的功能。

具有一组(至少一个)程序模块42的程序/实用工具40，可以存储在例如存储器28中，这样的程序模块42包括但不限于操作***、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本公开所描述的实施例中的功能和/或方法。

电子设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信，还可与一个或者多个使得用户能与该电子设备12交互的设备通信，和/或与使得该电子设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡，调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且，电子设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN)，广域网(WAN)和/或公共网络，例如因特网)通信。如图所示，网络适配器20通过总线18与电子设备12的其它模块通信。应当明白，尽管图中未示出，可以结合电子设备12使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID***、磁带驱动器以及数据备份存储***等。

处理单元16通过运行存储在存储器28中的程序，从而执行各种功能应用以及数据处理，例如实现本公开任意实施例提供的运动物体的定位方法。也即：通过动态视觉传感器获取事件流信息，以及通过目标摄像组件获取图像信息；根据预设采样周期对事件流信息进行采样，以获取采样事件帧，并根据采样事件帧对应的事件流信息，确定采样事件帧中运动物体的预测位置区域；根据预测位置区域，确定图像信息中与预测位置区域匹配的定位区域。

本公开实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本公开任意实施例所述的运动物体的定位方法；该方法包括：通过动态视觉传感器获取事件流信息，以及通过目标摄像组件获取图像信息；根据预设采样周期对事件流信息进行采样，以获取采样事件帧；根据采样事件帧对应的事件流信息，确定采样事件帧中运动物体的预测位置区域；根据预测位置区域，确定图像信息中与预测位置区域匹配的定位区域。

本公开实施例的计算机存储介质，可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于：电、磁、光、电磁、红外线、或半导体的***、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行***、装置或者器件使用或者与其结合使用。

计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。

计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：无线、电线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言或其组合来编写用于执行本公开操作的计算机程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

注意，上述仅为本公开的较佳实施例及所运用技术原理。本领域技术人员会理解，本公开不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本公开的保护范围。因此，虽然通过以上实施例对本公开进行了较为详细的说明，但是本公开不仅仅限于以上实施例，在不脱离本公开构思的情况下，还可以包括更多其他等效实施例，而本公开的范围由所附的权利要求范围决定。

Claims

一种运动物体的定位方法，其特征在于，所述定位方法包括：

通过动态视觉传感器获取事件流信息，以及通过目标摄像组件获取图像信息；

根据预设采样周期对所述事件流信息进行采样，以获取采样事件帧；

根据所述采样事件帧对应的事件流信息，确定所述采样事件帧中运动物体的预测位置区域；

根据所述预测位置区域，确定所述图像信息中与所述预测位置区域匹配的定位区域。
根据权利要求1所述的方法，其特征在于，所述根据所述采样事件帧对应的事件流信息，确定所述采样事件帧中运动物体的预测位置区域，包括：

根据所述采样事件帧对应的事件流信息，确定所述采样事件帧中运动物体的轮廓区域，并通过感兴趣区域框标注所述轮廓区域，以获取运动物体的预测位置区域。
根据权利要求2所述的方法，其特征在于，所述根据所述采样事件帧对应的事件流信息，确定所述采样事件帧中运动物体的轮廓区域，包括：

根据所述采样事件帧对应的事件流信息，获取事件出现帧和事件消失帧；

根据所述事件出现帧确定运动物体的预测出现区域，根据所述事件消失帧确定运动物体的预测消失区域；

根据所述预测出现区域和所述预测消失区域，确定运动物体的轮廓区域。
根据权利要求3所述的方法，其特征在于，所述采样事件帧对应的事件流信息包括多个像素点的事件信息，所述像素点的事件信息包括至少一个标注事件；

所述根据所述采样事件帧对应的事件流信息，获取事件出现帧和事件消失帧，包括：

将多个像素点对应的事件信息中，被标注为正事件的标注事件所对应的像素点确定为事件出现像素点；并且

将多个像素点对应的事件信息中，被标注为负事件的标注事件所对应的像素点确定为事件消失像素点；

根据所有事件出现像素点生成所述事件出现帧，并根据所有事件消失像素点生成所述事件消失帧。
根据权利要求4所述的方法，其特征在于，所述事件出现帧、所述事件消失帧与所述采样事件帧的像素分辨率相同；

在所述事件出现帧中，所有事件出现像素点对应的像素值设置为第一像素值，所有非事件出现像素点对应的像素值设置为第二像素值；

在所述事件消失帧中，所有事件消失像素点对应的像素值设置为第一像素值，所有非事件消失像素点对应的像素值设置为第二像素值。
根据权利要求5所述的方法，其特征在于，所述根据所述事件出现帧确定运动物体的预测出现区域，包括：根据所述事件出现帧中像素值为第一像素值的所有像素点的位置，确定运动物体的预测出现区域；

所述根据所述事件消失帧确定运动物体的预测消失区域，包括：根据所述事件消失帧中像素值为第一像素值的所有像素点的位置，确定运动物体的预测消失区域。
根据权利要求1所述的方法，其特征在于，所述根据所述预测位置区域，确定所述图像信息中与所述预测位置区域匹配的定位区域，包括：

获取所述动态视觉传感器和所述目标摄像组件的分辨率之间的比例关系；

根据所述比例关系对所述预测位置区域进行缩放处理；

将经缩放处理后的所述预测位置区域映射到所述图像信息中，以确定出匹配的所述定位区域。
根据权利要求1所述的方法，其特征在于，在所述根据所述预测位置区域，确定所述图像信息中与所述预测位置区域匹配的定位区域之后，所述方法还包括：

根据预训练完成的图像分类模型，对所述定位区域进行识别及分类处理，以确定所述图像信息中是否存在运动物体。
根据权利要求8所述的方法，其特征在于，在所述根据预训练完成的图像分类模型，对所述定位区域进行识别及分类处理之前，所述方法还包括：

判断所述定位区域中像素点的数量是否大于预设检测阈值；

所述根据预训练完成的图像分类模型，对所述定位区域进行识别及分类处理，包括：

若所述定位区域中像素点的数量大于预设检测阈值，则根据预训练完成的图像分类模型，对所述定位区域进行识别及分类处理。
根据权利要求9所述的方法，其特征在于，在所述根据预训练完成的图像分类模型，对所述定位区域进行识别及分类处理之前，所述方法还包括：

获取样本图像集合，并通过所述样本图像集合对所述图像分类模型进行图像分类训练，以获取预训练完成的所述图像分类模型；其中，所述图像分类模型基于神经网络构建。
一种运动物体的定位装置，其特征在于，包括：

信息获取模块，用于通过动态视觉传感器获取事件流信息，以及通过目标摄像组件获取图像信息；

采样执行模块，用于根据预设采样周期对所述事件流信息进行采样，以获取采样事件帧，并根据所述采样事件帧对应的事件流信息，确定所述采样事件帧中运动物体的预测位置区域；

分类执行模块，用于根据所述预测位置区域，确定所述图像信息中与所述预测位置区域匹配的定位区域。
一种电子设备，其特征在于，所述电子设备包括：

一个或多个处理器；

存储器，用于存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1-10中任一项所述的运动物体的定位方法。
一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1-10中任一项所述的运动物体的定位方法。