WO2019001505A1

WO2019001505A1 - 一种目标特征提取方法、装置及应用***

Info

Publication number: WO2019001505A1
Application number: PCT/CN2018/093291
Authority: WO
Inventors: 车军
Original assignee: 杭州海康威视数字技术股份有限公司
Priority date: 2017-06-30
Filing date: 2018-06-28
Publication date: 2019-01-03
Also published as: US20200117946A1; EP3648448B1; CN109215055A; US11398084B2; EP3648448A1; EP3648448A4

Abstract

本申请实施例提供了一种目标特征提取方法、装置及应用***，所述方法包括：获取全景相机拍摄的目标区域视频数据；通过目标检测算法，确定所述目标区域视频数据中具有预设特征的跟踪目标；将所述跟踪目标分配给细节相机，以使所述细节相机跟踪所述跟踪目标并获取所述跟踪目标的特写视频数据；提取所述特写视频数据中所述跟踪目标的属性信息。应用本申请实施例，可以准确的提取各目标属性信息，提高了提取目标属性信息的准确性。

Description

一种目标特征提取方法、装置及应用***

本申请要求于2017年6月30日提交中国专利局、申请号为201710527437.4发明名称为“一种目标特征提取方法、装置及应用***”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及计算机视觉技术领域，特别是涉及一种目标特征提取方法、装置及应用***。

背景技术

目前，广角相机和长焦相机均可以用于拍摄一定区域的视频，其中，广角相机主要用于拍摄大范围、远距离目标的视频，长焦相机用于以一定的视场角拍摄近距离目标的视频。实际应用中，可以将广角相机和长焦相机相结合来拍摄目标区域内的视频，进而，通过视频结构化技术提取视频中的目标信息。

相关技术中，视频机构化过程中提取目标的方法，主要包括：采用广角相机拍摄监控区域内的视频数据，并利用背景建模来提取该视频数据中的目标及每个目标的时空位置。同时，控制长焦相机对每个目标进行跟踪拍摄，获得每个目标的视频数据，提取每个目标的视频数据中的特征图像。

但是，上述方法中，利用背景建模来提取广角相机的视频数据中的目标时，当出现突发情况，例如，相机发生抖动、光照发生变化、拍摄场景突变(如，地面出现抛洒物)等时，可能导致相机抓拍虚假目标，进而，影响提取目标的准确性，鲁棒性不强。另外，在提取视频数据中的目标时，需要将视频数据中的全部移动目标都进行提取，当视频数据中存在多个目标黏连时，长焦相机可能会将黏连一起的目标作为一个整体目标跟踪拍摄，这样，导致从长焦相机获取的视频数据中无法准确提取各目标特征及属性，从而影响提取的准确性。

发明内容

本申请实施例的目的在于提供一种目标特征提取方法、装置及应用***，以提高提取目标的属性信息的准确性。具体技术方案如下：

第一方面，本申请实施例提供了一种目标特征提取方法，包括：

获取全景相机拍摄的目标区域视频数据；

通过目标检测算法，确定所述目标区域视频数据中具有预设特征的跟踪目标；

将所述跟踪目标分配给细节相机，以使所述细节相机跟踪所述跟踪目标并获取所述跟踪目标的特写视频数据；

提取所述特写视频数据中所述跟踪目标的属性信息。

可选的，所述通过目标检测算法，确定所述目标区域视频数据中具有预设特征的跟踪目标的步骤包括：

获取所述目标区域视频数据的视频帧；通过预设目标检测模型提取所述视频帧的图像特征；所述预设目标检测模型为基于具有预设特征的多个目标训练得到的；

将所述图像特征与预设目标检测特征进行匹配，并将与所述预设目标检测特征匹配的图像特征确定为跟踪目标；所述预设目标检测特征为具有预设特征的目标的集合。

可选的，所述将所述跟踪目标分配给细节相机，以使所述细节相机跟踪所述跟踪目标并获取所述跟踪目标的特写视频数据的步骤包括：

在所述获取所述目标区域视频数据的视频帧之后，获取每个跟踪目标在所述目标区域视频的视频帧中的第一坐标；

根据所述第一坐标，为每个跟踪目标分配一个细节相机；

将所述每个跟踪目标的第一坐标转换为每个跟踪目标在所分配的细节相机中的第二坐标，并将所述第二坐标及所述跟踪目标发送给分配后的细节相机，以使所述细节相机跟踪拍摄分配的跟踪目标并获取所述跟踪目标的特写视频数据。

可选的，所述提取所述特写视频数据中所述跟踪目标的属性信息的步骤包括：

获取所述特写视频数据中的特写视频帧；

根据目标评价模型，获得所述特写视频帧的评分结果，并选取评分结果最高的特写视频帧；

提取所述评分结果最高的特写视频帧中所述跟踪目标的至少一个属性信息。

可选的，所述方法还包括：

根据所述跟踪目标的标识信息及所述至少一个属性信息，对所述跟踪目标建立目标索引；所述标识信息为：在确定所述目标区域视频数据中具有预设特征的跟踪目标之后，分别对每个跟踪目标进行标识得到的；

判断所述目标索引是否与已存储的索引匹配；

若否，存储所述目标索引，若是，丢弃所述目标索引。

第二方面，本申请实施例提供了一种目标特征提取装置，包括：

获取单元，用于获取全景相机拍摄的目标区域视频数据；

确定单元，用于通过目标检测算法，确定所述目标区域视频数据中具有预设特征的跟踪目标；

分配单元，用于将所述跟踪目标分配给细节相机，以使所述细节相机跟踪所述跟踪目标并获取所述跟踪目标的特写视频数据；

提取单元，用于提取所述特写视频数据中所述跟踪目标的属性信息。

可选的，所述确定单元具体用于：

获取所述目标区域视频数据的视频帧；通过预设目标检测模型提取所述视频帧的图像特征；所述预设目标检测模型为基于具有预设特征的多个目标训练得到的；将所述图像特征与预设目标检测特征进行匹配，并将与所述预设目标检测特征匹配的图像特征确定为跟踪目标；所述预设目标检测特征为具有预设特征的目标的集合。

可选的，所述分配单元具体用于：

在所述获取所述目标区域视频数据的视频帧之后，获取每个跟踪目标在所述目标区域视频的视频帧中的第一坐标；根据所述第一坐标，为每个跟踪目标分配一个细节相机；将所述每个跟踪目标的第一坐标转换为每个跟踪目标在所分配的细节相机中的第二坐标，并将所述第二坐标及所述跟踪目标发送给分配后的细节相机，以使所述细节相机跟踪拍摄分配的跟踪目标并获取所述跟踪目标的特写视频数据。

可选的，所述提取单元具体用于：

获取所述特写视频数据中的特写视频帧；根据目标评价模型，获得所述特写视频帧的评分结果，并选取评分结果最高的特写视频帧；提取所述评分结果最高的特写视频帧中所述跟踪目标的至少一个属性信息。

可选的，所述装置还包括：

索引单元，用于根据所述跟踪目标的标识信息及所述至少一个属性信息，对所述跟踪目标建立目标索引；所述标识信息为：在确定所述目标区域视频数据中具有预设特征的跟踪目标之后，分别对每个跟踪目标进行标识得到的；

判断单元，用于判断所述目标索引是否与已存储的索引匹配；

处理单元，用于若所述目标索引与已存储的索引不匹配，存储所述目标索引，若所述目标索引与已存储的索引匹配，丢弃所述目标索引。

第三方面，本申请实施例提供了一种目标特征提取应用***，包括：全景相机、视频处理器、细节相机；

其中，所述全景相机，用于拍摄目标区域视频数据；

所述视频处理器，用于获取全景相机拍摄的目标区域视频数据；通过目标检测算法，确定所述目标区域视频数据中具有预设特征的跟踪目标；将所述跟踪目标分配给细节相机，以使所述细节相机跟踪所述跟踪目标并获取所述跟踪目标的特写视频数据；提取所述特写视频数据中所述跟踪目标的属性信息；

所述细节相机，用于跟踪所述跟踪目标并获取所述跟踪目标的特写视频数据。

可选的，所述视频处理器具体用于：

可选的，所述视频处理器具体还用于：

根据所述跟踪目标的标识信息及所述至少一个属性信息，对所述跟踪目标建立目标索引；所述标识信息为：在确定所述目标区域视频数据中具有预设特征的跟踪目标之后，分别对每个跟踪目标进行标识得到的；判断所述目标索引是否与已存储的索引匹配；若否，存储所述目标索引，若是，丢弃所述目标索引。

第四方面，本申请实施例又提供了一种计算机设备，包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；

存储器，用于存放计算机程序；

处理器，用于执行存储器上所存放的程序时，实现本申请所述的目标特征提取方法步骤。

第五方面，本申请实施例又提供了一种计算机可读存储介质，所述计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现本申请所述的目标特征提取方法步骤。

本申请实施例提供的一种目标特征提取方法、装置及应用***，其中，目标特征提取方法应用于目标特征提取应用***中的视频处理器，该视频处理器可以获取全景相机拍摄的目标区域视频数据，并且，该视频处理器可以通过目标检测算法，确定目标区域视频数据中具有预设特征的跟踪目标，同时，视频处理器可以将跟踪目标分配给细节相机，以使细节相机跟踪跟踪目标并获取跟踪目标的特写视频数据，进而，视频处理器可以提取特写视频数据中跟踪目标的属性信息。

本方案中，视频处理器可以通过目标检测算法，确定目标区域视频数据中具有预设特征的跟踪目标，这样，视频处理器可以将目标区域视频中的符合用户要求的目标选择出来，进而，视频处理器可以根据所选择的目标，提取各目标的属性信息，提高了提取目标的属性信息的准确性。当然，实施本申请的任一产品或方法必不一定需要同时达到以上所述的所有优点。

附图说明

为了更清楚地说明本申请实施例或相关技术中的技术方案，下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的目标特征提取方法的一种流程图；

图2为本申请实施例提供的目标特征提取方法的另一种流程图；

图3为本申请实施例提供的目标特征提取装置的一种结构示意图；

图4为本申请实施例提供的目标特征提取装置的另一种结构示意图；

图5为本申请实施例提供的目标特征提取应用***的一种结构示意图；

图6为本申请实施例提供的一种计算机设备的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

相关的视频结构化提取目标的方法中，主要是通过广角相机拍摄监控区域的视频数据，进而，获取视频数据中的目标及时空位置，针对每个目标，采用长焦相机进行跟踪拍摄，获得每个目标的特征图像。但是，当出现突发情况，例如，相机发生抖动、光照发生变化、拍摄场景突变(如，地面出现抛洒物)等时，可能导致相机抓拍虚假目标，进而，影响提取目标的准确性，鲁棒性不高。另外，在提取视频数据中的目标时，当视频数据中存在多个目标黏连时，提取获取视频数据中的目标时，可能会将黏连一起的目标作为一个整体目标跟踪拍摄，这样，可能无法准确的提取到各目标特征及属性。

为了提高提取目标属性信息的准确性，本申请实施例提供了一种目标特征提取方法的过程，如图1所示，该过程可以包括以下步骤：

S101，获取全景相机拍摄的目标区域视频数据。

本申请实施例提供的方法可以应用于一种视频处理器，该视频处理器可以集成于全景相机中，也可以集成于终端设备(例如，计算机)，或者该视频处理器可以为一种电子设备。

其中，全景相机可以为一个或者多个广角相机，根据目标区域的大小，可以确定广角相机的数量。例如，如果一个广角相机足以监控目标区域，则在目标区域安装一个广角相机，如果一个广角相机的监控范围不能完全监控到目标区域，则可以安装至少两个广角相机。全景相机也可以为由多个镜头进行拼接组成的相机，本申请在此不做限定。

本申请实施例中，全景相机可以对目标区域进行拍摄，进而，视频处理器可以获取全景相机所拍摄的目标区域视频数据。

S102，通过目标检测算法，确定所述目标区域视频数据中具有预设特征的跟踪目标。

其中，目标检测算法可以包括：Boosting(通过构造一个预测函数系列，以一定的方式将预测函数系列组合成一个预测函数)、RCNN(区域卷积神经网络目标检测算法，Region with CNN)、FRCNN(快速区域卷积神经网络目标检测算法)、Faster RCNN(更快速区域卷积神经网络目标检测算法)等，但不限于此。

本申请实施例中，为了将目标区域视频数据中用户所需要的目标提取出来，可以采用上述目标检测算法中的任一种算法，对目标区域视频数据进行处理，以获得跟踪目标，其中，每个跟踪目标具有预设特征。例如，车的预设特征可以包括：车牌信息、车灯、车辆类型(卡车、轿车、越野车等)、车身颜色等，但不限于此。

本申请实施例中，视频处理器可以获取目标区域视频数据中在时间上具有连续性的至少一个视频帧，采用上述的目标检测算法对所获取的视频帧进行处理，即视频处理器可以通过预设目标检测模型提取至少一个视频帧中的图像特征，具体的，预设目标检测模型可以为基于具有预设特征的多个目标训练得到的，本申请实施例中，预设目标检测模型具体为：将大量的目标样本通过卷积神经网络的训练得到的模型。并且视频处理器可以将所获取的图像特征与预设目标检测特征进行匹配，将与预设目标检测特征相匹配的图像特征确定为跟踪目标。其中，预设目标检测特征为具有预设特征的目标的集合，例如，预设目标检测特征可以包括：人的特征和/或车辆的特征，但不限于此。例如，人的特征可以包括：头发、胳膊、手、性别、衣着款式、是否戴眼镜等，但不限于此，车辆的特征可以包括但不限于，车辆的尺寸、车辆型号、车辆颜色等。

例如，可以通过对大量样本数据(例如，对100个人的样本数据)输入至卷积神经网络，经过训练得到预设目标检测模型。本申请实施例可以针对人、机动车、非机动车等不同的目标采用相关技术，得到不同样本数据对应的预设目标检测模型。

S103，将所述跟踪目标分配给细节相机，以使所述细节相机跟踪所述跟踪目标并获取所述跟踪目标的特写视频数据。

本申请实施例中，视频处理器确定跟踪目标后，可以根据跟踪目标的数量，将跟踪目标分配给细节相机。例如，当跟踪目标的数量只有一个时，可以将跟踪目标分配给任一个细节相机，也可以将跟踪目标分配给距离跟踪目标最近的细节相机。当跟踪目标的数量较多时，可以将多个跟踪目标分配给一个或多个细节相机。这样，细节相机可以根据所分配的跟踪目标进行跟踪拍摄，获取跟踪目标的特写视频数据。

其中，细节相机可以包括一个或者多个可变焦的相机，每个细节相机可以携带一个云台，云台是可转动的，且云台的俯仰角可变的，视频处理器可以通过控制云台来控制各细节相机的拍摄角度、方向，但不限于此。

本申请实施例中，在获取目标区域视频数据的视频帧之后，视频处理器可以获取每个跟踪目标在目标区域视频的视频帧中的第一坐标，其中，第一坐标为跟踪目标在目标区域内的坐标位置。目标区域内的每个位置对应一个坐标，视频处理器可以根据跟踪目标在视频帧中的位置对应得到跟踪目标在目标区域内的坐标位置。

可选的，视频处理器可以根据第一坐标，为每个跟踪目标分配一个细节相机。在实际应用中，可以预先将各细节相机均匀的设置于目标区域，如果跟踪目标A的第一坐标(x ₁、y ₂、z ₃)在目标区域中对应的位置距离细节相机a最近，可以将细节相机a分配给跟踪目标A。

另外，视频处理器可以将每个跟踪目标的第一坐标转换为每个跟踪目标在所分配的细节相机中的第二坐标，并将第二坐标及跟踪目标发送给分配后的细节相机，这样，细节相机可以对所分配的跟踪目标进行跟踪拍摄，进而，细节相机可以拍摄到跟踪目标的特写视频数据。每个跟踪目标的第一坐标在不同的细节相机对应不同的第二坐标。

在一种情况中，本申请实施例中上述的特写视频数据可以为所包含跟踪目标的尺寸占视频帧的尺寸的比例超过预设比例的视频数据；也可以为仅包含跟踪目标的视频数据；也可以为所包含跟踪目标在指定位置处的视频数据，例如：所包含跟踪目标在视频帧的正中间区域位置。

例如，跟踪目标包括：跟踪目标A(第一坐标：x ₁₁、y ₁₂、z ₁₃)、跟踪目标B(第一坐标：x ₂₁、y ₂₂、z ₂₃)、跟踪目标C(第一坐标：x ₃₁、y ₃₂、z ₃₃)，细节相机包括：细节相机a、细节相机b、细节相机c及细节相机d，由于各细节相机的位置不同，所以跟踪目标在细节相机的第二坐标不相同，视频处理器可以将跟踪目标A分配给细节相机b，则视频处理器可以将跟踪目标A的第一坐标：(x ₁₁、y ₁₂、z ₁₃)转换为跟踪目标A在细节相机b的第二坐标(P _b1、T _b2、Z _b3)，从而，细节相机b以第二坐标(P _b1、T _b2、Z _b3)跟踪目标区域内的跟踪目标A，并且获取跟踪目标A的特写视频数据。又例如，视频处理器可以将跟踪目标A分配给细节相机c，则视频处理器可以将跟踪目标A的第一坐标：(x ₁₁、y ₁₂、z ₁₃)转换为跟踪目标A在细节相机c的第二坐标(P _c1、T _c2、Z _c3)，从而，细节相机c以第二坐标(P _c1、T _c2、Z _c3)跟踪目标区域内的跟踪目标A，并且获取跟踪目标A的特写视频数据。

本申请实施例中，全景相机和细节相机的位置是预先设置好的，跟踪目标在目标区域的位置对应于其在全景相机中唯一第一坐标，由于细节相机的位置预先设置好了，所以，跟踪目标的第一坐标与跟踪目标在细节相机中的第二坐标的对应关系是确定好的。

S104，提取所述特写视频数据中所述跟踪目标的属性信息。

在本申请实施例的一种实现方式中，视频处理器可以集成于细节相机中，也可以集成在全景相机中，或者集成在其他电子设备中。视频处理器可以从各个细节相机获取特写视频数据中，并且从特写视频数据中提取跟踪目标的属性信息，具体的，跟踪目标的属性信息可以包括但不限于：人脸特征、人体特征、车辆特征等。

具体的，视频处理器可以获取特写视频数据中的一个跟踪目标在时间序列上的连续的特写视频帧，并且根据目标评价模型，获得各特写视频帧的评分结果，进而，视频处理器可以选取评分结果最高的特写视频帧，并且提取评分结果最高的特写视频帧中跟踪目标的至少一个属性信息。

其中，目标评分模型可以为：预先针对各类目标样本数据进行训练所获得的模型，样本数据包括：图像质量、清晰度、目标姿势等，但不限于此。例如，预先获取1000个视频帧的样本数据，对每个视频帧的样本数据进行分级，根据分级结果设置分数，等级越高，分数越高。例如，图像质量可以包括：优、良、中、差，根据视频帧的图像质量给视频帧的图像质量赋分值，同理，对视频帧的清晰度、目标姿势等进行赋分值。获取每个视频帧的图像质量、清晰度、目标姿势等信息，然后根据目标评价模型，对每个视频帧的图像质量、清晰度、目标姿势等信息评分，得到评分结果最高的视频帧，提取评分结果最高的视频帧中的跟踪目标的至少一个属性信息。

其中，当跟踪目标为人时，至少一个属性信息可以包括：性别、年龄、上装颜色、下装颜色、衣着类型、衣着款式、是否背包、是否拎包、是否戴眼镜、是否戴帽子、是否骑车等，不限于此。

当跟踪目标为车辆时，至少一个属性信息可以包括：车牌信息、车牌颜色、车辆类型、车身颜色、车辆品牌、主副驾是否系安全带、是否有挂件、是否有摆件、是否有年检标志及标志个数等，但不限于此。

本申请实施例中，视频处理器可以获取目标区域视频数据中的至少一个视频帧，通过目标检测算法，确定出至少一个视频帧中具有预设特征的跟踪目标，进而，视频处理器可以将各跟踪目标分配给不同的细节相机，这样，细节相机可以针对所分配的跟踪目标进行跟踪拍摄，并将拍摄到的跟踪目标的特写视频数据发送给视频处理器，视频处理器可以获取跟踪目标的特写视频数据中连续的视频帧，根据目标评分模型，选择评分结果最高的视频帧，进而，提取评分结果最高的视频帧中跟踪目标的属性信息，可以，本方案提高了提取目标属性信息的准确性。

如图2所示，本申请实施例提供的目标特征提取方法可以包括以下步骤：

S201，获取全景相机拍摄的目标区域视频数据。

S202，通过目标检测算法，确定所述目标区域视频数据中具有预设特征的跟踪目标。

S203，将所述跟踪目标分配给细节相机，以使所述细节相机跟踪所述跟踪目标并获取所述跟踪目标的特写视频数据。

S204，提取所述特写视频数据中所述跟踪目标的属性信息。

其中，S201～S204与上述实施例中的S101～S104相同，在此不再赘述。

S205，根据所述跟踪目标的标识信息及所述至少一个属性信息，对所述跟踪目标建立目标索引。

本申请实施例中，在确定目标区域视频数据中具有预设特征的跟踪目标之后，视频处理器可以分别为每个跟踪目标进行标识，每个跟踪目标具有其标识信息。例如，当存在4个跟踪目标时，可以采用不同的标识信息代表每个跟踪目标，其中，标识信息可以定义为任意符号，例如，标识信息可以包括1、2、3、4……等，标识信息也可以包括a、b、c、d……等。

视频处理器可以根据各跟踪目标的标识信息及属性信息，分别为各跟踪目标建立目标索引，如表1所示，为3个跟踪目标的目标索引。

跟踪目标	车辆颜色	车辆类型	有无年检标识
1	红色	跑车	有
2	黄色	面包车	有
3	黑色	轿车	无

S206，判断所述目标索引是否与已存储的索引匹配。

当视频处理器对跟踪目标建立了目标索引后，可以将该目标索引与已经存储的所有的目标索引进行比对，或者将目标索引与预设时间段内的存储的目标索引进行比对，进而判断跟踪目标的目标索引与已存储的任一索引是否相同。

若否，执行步骤S207，存储所述目标索引；若是，执行步骤S208：丢弃所述目标索引。

本申请实施例中，当已存储的索引中不存在任一索引与跟踪目标的目标索引相同时，视频处理器可以将该跟踪目标的目标索引存储，这样，便于有关人员查看，当已存储的索引中存在任一索引与跟踪目标的目标索引相同时，视频处理器可以丢弃该跟踪目标的目标索引对应的数据，避免对同一跟踪目标的属性信息进行重复存储。

本申请实施例中，视频处理器可以通过目标检测算法，确定目标区域视频数据中具有预设特征的跟踪目标，将目标区域视频中的符合用户要求的目标选择出来，进而，视频处理器可以根据所选择的目标，提取各目标的属性信息，提高了提取目标属性信息的准确性。另外，视频处理器可以针对已建立索引的目标，丢弃重复索引数据，降低了存储压力。

其中，本发明实施例中，通过不同类型的目标的样本数据，可以训练得到不同类型的目标对应的预设目标检测模型，以利用预设目标检测模型提取所对应类型的目标的特征，例如，通过人的样本数据，可以训练得到人对应的预设目标检测模型，即该人对应的预设目标检测模型可以从视频数据的视频帧中检测得到人；基于机动车的样本数据，可以训练得到机动车对应的预设目标检测模型，即该机动车对应的预设目标检测模型可以从视频数据的视频帧中检测得到机动车，等等。

其中，本发明实施例中，上述目标评分模型可以为：预先基于对应不同预设属性的视频帧进行训练所获得的模型。在一种情况中，称对应不同预设属性的视频帧为样本视频帧，预设属性可以包括：样本视频帧的图像质量、清晰度以及样本视频帧中所包含目标的目标姿势等，但不限于此。例如，预先获取1000个样本视频帧，对每个样本视频帧对应的不同预设属性进行分级，根据分级结果设置分数，等级越高，分数越高。例如，图像质量可以包括：优、良、中、差，根据样本视频帧的图像质量给样本视频帧的图像质量赋分值，同理，对样本视频帧的清晰度、所包含目标的目标姿势等赋分值，称上述所赋分值为预期分值。

后续的，将上述每一样本视频帧以及每一样本视频帧对应的各预设属性的预期分值，训练初始的评分模型，直到上述初始的评分模型收敛后，得到上述目标评分模型。其中，上述上述初始的评分模型收敛可以为：初始的评分模型对应的预设损失函数的差值小于预设阈值。其中，上述差值为上述每一样本视频帧对应的各预设属性的预期分值与上述初始的评分模型所得到的每一样本视频帧对应的各预设属性的预测分值之间的差值。其中，上述目标评价模型可以为预设的卷积神经网络模型。

进而，获取特写视频数据中的特写视频帧，将上述所获取的特写视频帧输入目标评价模型，目标评价模型基于每个特写视频帧的图像质量、清晰度、目标姿势等信息进行评分，进而基于上述每个特写视频帧的图像质量、清晰度、目标姿势等信息对应的评分，得到每个特写视频帧的得分，进而基于每个特写视频帧的得分，确定得到评分结果最高的特写视频帧，提取评分结果最高的特写视频帧中的跟踪目标的至少一个属性信息。

相应于上面的方法实施例，本申请实施例还提供了相应的装置实施例。图3为本申请实施例提供了一种目标特征提取装置300，该装置300包括：

获取单元310，用于获取全景相机拍摄的目标区域视频数据。

确定单元320，用于通过目标检测算法，确定所述目标区域视频数据中具有预设特征的跟踪目标。

分配单元330，用于将所述跟踪目标分配给细节相机，以使所述细节相机跟踪所述跟踪目标并获取所述跟踪目标的特写视频数据。

提取单元340，用于提取所述特写视频数据中所述跟踪目标的属性信息。

本申请实施例中，视频处理器可以通过目标检测算法，确定目标区域视频数据中具有预设特征的跟踪目标，这样，视频处理器可以将目标区域视频中的符合用户要求的目标选择出来，进而，视频处理器可以根据所选择的目标，提取各目标的属性信息，提高了提取目标属性信息的准确性。

作为本申请实施例中一种实施方式，所述确定单元320具体用于：

作为本申请实施例中一种实施方式，所述分配单元330具体用于：在所述获取所述目标区域视频数据的视频帧之后，获取每个跟踪目标在所述目标区域视频的视频帧中的第一坐标；

根据所述第一坐标，为每个跟踪目标分配一个细节相机；将所述每个跟踪目标的第一坐标转换为每个跟踪目标在所分配的细节相机中的第二坐标，并将所述第二坐标及所述跟踪目标发送给分配后的细节相机，以使所述细节相机跟踪拍摄分配的跟踪目标并获取所述跟踪目标的特写视频数据。

作为本申请实施例中一种实施方式，所述提取单元340具体用于：

获取所述特写视频数据中的特写视频帧；根据目标评价模型，获得所述特写视频帧的评分结果，并选取评分结果最高的特写视频帧；

作为本申请实施例中一种实施方式，如图4所示，在包括获取单元310、确定单元320、分配单元330及提取单元340的基础上，所述装置300还包括：

索引单元350，用于根据所述跟踪目标的标识信息及所述至少一个属性信息，对所述跟踪目标建立目标索引；所述标识信息为：在确定所述目标区域视频数据中具有预设特征的跟踪目标之后，分别对每个跟踪目标进行标识得到的。

判断单元360，用于判断所述目标索引是否与已存储的索引匹配。

处理单元370，用于若所述目标索引与已存储的索引不匹配，存储所述目标索引，若所述目标索引与已存储的索引匹配，丢弃所述目标索引。

另外，如图5所示，本申请实施例提供了一种目标特征提取应用***，该应用***包括：全景相机510、视频处理器520、细节相机530。

其中，所述全景相机510，用于拍摄目标区域视频数据。

所述视频处理器520，用于获取全景相机拍摄的目标区域视频数据；通过目标检测算法，确定所述目标区域视频数据中具有预设特征的跟踪目标；将所述跟踪目标分配给细节相机，以使所述细节相机跟踪所述跟踪目标并获取所述跟踪目标的特写视频数据；提取所述特写视频数据中所述跟踪目标的属性信息。

所述细节相机530，用于跟踪所述跟踪目标并获取所述跟踪目标的特写视频数据。

具体的，视频处理器可以采用图3或者图4所示的装置实施例完成目标特征提取的过程。

本申请实施例中，视频处理器可以通过目标检测算法，确定目标区域视频数据中具有预设特征的跟踪目标，视频处理器可以将目标区域视频中的符合用户要求的目标选择出来，进而，视频处理器可以根据所选择的目标，提取各目标的属性信息，提高了提取目标属性信息的准确性。

作为本申请实施例中一种实施方式，所述视频处理器520，具体用于获取所述目标区域视频数据的视频帧；通过预设目标检测模型提取所述视频帧的图像特征；所述预设目标检测模型为基于具有预设特征的多个目标训练得到的；将所述图像特征与预设目标检测特征进行匹配，并将与所述预设目标检测特征匹配的图像特征确定为跟踪目标；所述预设目标检测特征为具有预设特征的目标的集合。

作为本申请实施例中一种实施方式，所述视频处理器520，具体用于在所述获取所述目标区域视频数据的视频帧之后，获取每个跟踪目标在所述目标区域视频的视频帧中的第一坐标；根据所述第一坐标，为每个跟踪目标分配一个细节相机；将所述每个跟踪目标的第一坐标转换为每个跟踪目标在所分配的细节相机中的第二坐标，并将所述第二坐标及所述跟踪目标发送给分配后的细节相机，以使所述细节相机跟踪拍摄分配的跟踪目标并获取所述跟踪目标的特写视频数据。

作为本申请实施例中一种实施方式，所述视频处理器520，具体用于获取所述特写视频数据中的特写视频帧；根据目标评价模型，获得所述特写视频帧的评分结果，并选取评分结果最高的特写视频帧；提取所述评分结果最高的特写视频帧中所述跟踪目标的至少一个属性信息。

作为本申请实施例中一种实施方式，所述视频处理器520，具体还用于根据所述跟踪目标的标识信息及所述至少一个属性信息，对所述跟踪目标建立目标索引；所述标识信息为：在确定所述目标区域视频数据中具有预设特征的跟踪目标之后，分别对每个跟踪目标进行标识得到的；判断所述目标索引是否与已存储的索引匹配；若所述目标索引与已存储的索引不匹配，存储所述目标索引，若所述目标索引与已存储的索引匹配，丢弃所述目标索引。

本申请实施例中，视频处理器可以集成在全景相机中，或者视频处理器可以集成在细节相机中，当视频处理器集成在全景相机中时，目标索引可以存储于全景相机中具有存储功能的介质中，当视频处理器集成在细节相机中时，目标索引可以存储于细节相机中具有存储功能的介质中。需要注意的是，视频处理器可以作为一个独立的处理器存在，或者视频处理器可以集成于除全景相机和细节相机之外的其他电子设备上，例如，该设备可以为具有处理视频数据，并提取视频数据中目标特征功能的计算机设备，则可以将上述目标索引存储于该计算机设备中，对于视频处理器所在的电子设备，在此不做限定。

本申请实施例又提供了一种计算机设备，如图6所示，所述计算机设备可以包括处理器610、通信接口620、存储器630和通信总线640，其中，处理器610，通信接口620，存储器630通过通信总线640完成相互间的通信；

存储器630，用于存放计算机程序；

处理器610，用于执行存储器630上所存放的程序时，实现如下步骤：

获取全景相机拍摄的目标区域视频数据；

提取所述特写视频数据中所述跟踪目标的属性信息。

上述计算机设备提到的通信总线可以是外设部件互连标准(Peripheral Pomponent Interconnect，简称PCI)总线或扩展工业标准结构(Extended Industry Standard Architecture，简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示，图中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

通信接口用于上述计算机设备与其他设备之间的通信。

存储器可以包括随机存取存储器(Random Access Memory，简称RAM)，也可以包括非易失性存储器(non-volatile memory)，例如至少一个磁盘存储器。可选的，存储器还可以是至少一个位于远离前述处理器的存储装置。

上述的处理器可以是通用处理器，包括中央处理器(Central Processing Unit，简称CPU)、网络处理器(Network Processor，简称NP)等；还可以是数字信号处理器(Digital Signal Processing，简称DSP)、专用集成电路(Application Specific Integrated Circuit，简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array，简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

本申请实施例又提供了一种计算机可读存储介质，该计算机可读存储介质内存储有计算机程序，该计算机程序被处理器执行时实现本申请所述的目标特征提取方法步骤。

对于装置/***/电子设备/存储介质实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于***实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本申请的较佳实施例而已，并非用于限定本申请的保护范围。凡在本申请的精神和原则之内所作的任何修改、等同替换、改进等，均包含在本申请的保护范围内。

Claims

一种目标特征提取方法，其特征在于，包括：

获取全景相机拍摄的目标区域视频数据；

通过目标检测算法，确定所述目标区域视频数据中具有预设特征的跟踪目标；

将所述跟踪目标分配给细节相机，以使所述细节相机跟踪所述跟踪目标并获取所述跟踪目标的特写视频数据；

提取所述特写视频数据中所述跟踪目标的属性信息。
根据权利要求1所述的方法，其特征在于，所述通过目标检测算法，确定所述目标区域视频数据中具有预设特征的跟踪目标的步骤包括：

获取所述目标区域视频数据的视频帧；

通过预设目标检测模型提取所述视频帧的图像特征；所述预设目标检测模型为基于具有预设特征的多个目标训练得到的；

将所述图像特征与预设目标检测特征进行匹配，并将与所述预设目标检测特征匹配的图像特征确定为跟踪目标；所述预设目标检测特征为具有预设特征的目标的集合。
根据权利要求2所述的方法，其特征在于，所述将所述跟踪目标分配给细节相机，以使所述细节相机跟踪所述跟踪目标并获取所述跟踪目标的特写视频数据的步骤包括：

在所述获取所述目标区域视频数据的视频帧之后，获取每个跟踪目标在所述目标区域视频的视频帧中的第一坐标；

根据所述第一坐标，为每个跟踪目标分配一个细节相机；

将所述每个跟踪目标的第一坐标转换为每个跟踪目标在所分配的细节相机中的第二坐标，并将所述第二坐标及所述跟踪目标发送给分配后的细节相机，以使所述细节相机跟踪拍摄分配的跟踪目标并获取所述跟踪目标的特写视频数据。
根据权利要求1所述的方法，其特征在于，所述提取所述特写视频数据中所述跟踪目标的属性信息的步骤包括：

获取所述特写视频数据中的特写视频帧；

根据目标评价模型，获得所述特写视频帧的评分结果，并选取评分结果最高的特写视频帧；

提取所述评分结果最高的特写视频帧中所述跟踪目标的至少一个属性信息。
根据权利要求4所述的方法，其特征在于，所述方法还包括：

根据所述跟踪目标的标识信息及所述至少一个属性信息，对所述跟踪目标建立目标索引；所述标识信息为：在确定所述目标区域视频数据中具有预设特征的跟踪目标之后，分别对每个跟踪目标进行标识得到的；

判断所述目标索引是否与已存储的索引匹配；

若否，存储所述目标索引，若是，丢弃所述目标索引。
一种目标特征提取装置，其特征在于，包括：

获取单元，用于获取全景相机拍摄的目标区域视频数据；

确定单元，用于通过目标检测算法，确定所述目标区域视频数据中具有预设特征的跟踪目标；

分配单元，用于将所述跟踪目标分配给细节相机，以使所述细节相机跟踪所述跟踪目标并获取所述跟踪目标的特写视频数据；

提取单元，用于提取所述特写视频数据中所述跟踪目标的属性信息。
根据权利要求6所述的装置，其特征在于，所述确定单元具体用于：

获取所述目标区域视频数据的视频帧；通过预设目标检测模型提取所述视频帧的图像特征；所述预设目标检测模型为基于具有预设特征的多个目标训练得到的；将所述图像特征与预设目标检测特征进行匹配，并将与所述预设目标检测特征匹配的图像特征确定为跟踪目标；所述预设目标检测特征为具有预设特征的目标的集合。
根据权利要求7所述的装置，其特征在于，所述分配单元具体用于：

在所述获取所述目标区域视频数据的视频帧之后，获取每个跟踪目标在所述目标区域视频的视频帧中的第一坐标；根据所述第一坐标，为每个跟踪目标分配一个细节相机；将所述每个跟踪目标的第一坐标转换为每个跟踪目标在所分配的细节相机中的第二坐标，并将所述第二坐标及所述跟踪目标发送给分配后的细节相机，以使所述细节相机跟踪拍摄分配的跟踪目标并获取所述跟踪目标的特写视频数据。
根据权利要求6所述的装置，其特征在于，所述提取单元具体用于：

获取所述特写视频数据中的特写视频帧；根据目标评价模型，获得所述特写视频帧的评分结果，并选取评分结果最高的特写视频帧；提取所述评分结果最高的特写视频帧中所述跟踪目标的至少一个属性信息。
根据权利要求9所述的装置，其特征在于，所述装置还包括：

索引单元，用于根据所述跟踪目标的标识信息及所述至少一个属性信息，对所述跟踪目标建立目标索引；所述标识信息为：在确定所述目标区域视频数据中具有预设特征的跟踪目标之后，分别对每个跟踪目标进行标识得到的；

判断单元，用于判断所述目标索引是否与已存储的索引匹配；

处理单元，用于若所述目标索引与已存储的索引不匹配，存储所述目标索引，若所述目标索引与已存储的索引匹配，丢弃所述目标索引。
一种目标特征提取应用***，其特征在于，包括：全景相机、视频处理器、细节相机；

其中，所述全景相机，用于拍摄目标区域视频数据；

所述视频处理器，用于获取全景相机拍摄的目标区域视频数据；通过目标检测算法，确定所述目标区域视频数据中具有预设特征的跟踪目标；将所述跟踪目标分配给细节相机，以使所述细节相机跟踪所述跟踪目标并获取所述跟踪目标的特写视频数据；提取所述特写视频数据中所述跟踪目标的属性信息；

所述细节相机，用于跟踪所述跟踪目标并获取所述跟踪目标的特写视频数据。
根据权利要求11所述的应用***，其特征在于，所述视频处理器具体用于：

获取所述目标区域视频数据的视频帧；通过预设目标检测模型提取所述视频帧的图像特征；所述预设目标检测模型为基于具有预设特征的多个目标训练得到的；将所述图像特征与预设目标检测特征进行匹配，并将与所述预设目标检测特征匹配的图像特征确定为跟踪目标；所述预设目标检测特征为具有预设特征的目标的集合。
根据权利要求12所述的应用***，其特征在于，所述视频处理器具体用于：

在所述获取所述目标区域视频数据的视频帧之后，获取每个跟踪目标在所述目标区域视频的视频帧中的第一坐标；根据所述第一坐标，为每个跟踪目标分配一个细节相机；将所述每个跟踪目标的第一坐标转换为每个跟踪目标在所分配的细节相机中的第二坐标，并将所述第二坐标及所述跟踪目标发送给分配后的细节相机，以使所述细节相机跟踪拍摄分配的跟踪目标并获取所述跟踪目标的特写视频数据。
根据权利要求11所述的应用***，其特征在于，所述视频处理器具体用于：

获取所述特写视频数据中的特写视频帧；根据目标评价模型，获得所述特写视频帧的评分结果，并选取评分结果最高的特写视频帧；提取所述评分结果最高的特写视频帧中所述跟踪目标的至少一个属性信息。
根据权利要求14所述的应用***，其特征在于，所述视频处理器具体还用于：

根据所述跟踪目标的标识信息及所述至少一个属性信息，对所述跟踪目标建立目标索引；所述标识信息为：在确定所述目标区域视频数据中具有预设特征的跟踪目标之后，分别对每个跟踪目标进行标识得到的；判断所述目标索引是否与已存储的索引匹配；若否，存储所述目标索引，若是，丢弃所述目标索引。
一种计算机设备，其特征在于，所述计算机设备可以包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；

存储器，用于存放计算机程序；

处理器，用于执行存储器上所存放的程序时，实现权利要求1-5任一所述的目标特征提取方法步骤。
一种机器可读存储介质，其特征在于，存储有机器可执行指令，在被图像处理器调用和执行时，所述机器可执行指令促使所述图像处理器：实现权利要求1-5任一所述的目标特征提取方法步骤。