CN113467740A

CN113467740A - 一种基于联合编码的视频监控阵列显示优化方法和装置

Info

Publication number: CN113467740A
Application number: CN202110802969.0A
Authority: CN
Inventors: 孙国强; 刘保臣; 杨志刚
Original assignee: Qingdao Bo Tian Tian Tong Information Technology Co Ltd
Current assignee: Qingdao Bo Tian Tian Tong Information Technology Co Ltd
Priority date: 2021-07-15
Filing date: 2021-07-15
Publication date: 2021-10-01
Anticipated expiration: 2041-07-15
Also published as: CN113467740B

Abstract

本发明公开一种基于联合编码的视频监控阵列显示优化方法和装置，属于人工智能技术领域，通过构建全局编码器和局部编码器；利用深度学习的循环神经网络结构，构建含有全局编码器与局部编码器的联合编码监控策略推荐模型；使用当前监控序列的表示形式和每个候选项之间的双线性相似函数来计算相似度评分，根据每个项目的相似度评分获得对应监控画面接下来出现的概率值；基于每一个监控画面接下来出现的概率值优化视频监控阵列显示排序；通过构建含有全局编码器与局部编码器的联合编码监控策略推荐模型，对监控人员的行为进行可视化分析后利用循环神经网络结构，自动捕捉和总结优化后的监控人员行为。

Description

一种基于联合编码的视频监控阵列显示优化方法和装置

技术领域

本发明涉及人工智能技术领域，尤其涉及一种基于联合编码的视频监控阵列显示优化方法和装置。

背景技术

近年来，随着科技的发展和社会的进步，视频监控得到了迅速的发展，且越来越多的应用于传统和非传统的安保领域。视频监控***是当前安防最重要的安全防范技术手段之一。随着视频监控点位的增多，所需监看视频个数远大于指挥中心监控屏幕可显示数量。监管人员通过人工模式进行视频轮巡查看，工作强度大、效率低，难以实现有效管控。随着计算机视觉和人工智能技术的发展，智能监控***的轮巡机制在一定程度上减轻了监管人员的工作强度，提高了安防管理的工作效率，但是现在的轮巡机制会导致严重的信息丢失问题。

现有监控摄像机阵列排序显示技术对监控视频的显示主要有固定规则排序显示与异常画面排序显示两种思路方向，异常画面排序显示方法可以使用基于图像对比计算视频权重的方法，首先基于单一视频采集终端视频前后之间的差异，计算出各终端的权重值，再以各终端的权重值作为依据，筛选、确定多个视频流在监视器屏幕播放的次序。该方法对于处于长期“动态静止”状态的监控画面轮巡具有较好的效果，但是对持续动态变化的监控画面效果甚微。其次异常画面排序显示方法可以通过背景提取技术，判断是否有人员及异常设备等的入侵，并进行重点监控摄像机轮巡，这对运动物体检测技术有较高要求，并且由于监控摄像机工作环境及运动物体检测技术的原因，误报率较高。固定规则排序显示方法根据监控人员现有经验，设置间隔固定时间进行固定画面轮巡，这要求监控人员熟悉风险易发区域及时间，并且由于轮巡次序固定，无法针对不同时间段的高风险区域进行定时定点的轮巡监控。

这两种视频监控阵列排序显示方法均存在很大的弊端：基于固定规则的轮巡排序技术对监控人员经验要求较高，且无法在不同时间对不同风险区域进行精确轮巡；基于异常画面轮巡技术受图像智能分析技术准确性影响，误报率高，影响监控人员对风险的判断。

视频监控阵列排序显示方法从理论上可归集为一种推荐算法，利用推荐算法可以有效解决上述问题。在监控***日志中不会关注监控操作人员信息，因为对于监控***来说，监控摄像机排序显示次序比监控操作人员信息更为重要。因此可以有效利用的信息仅有操作人员的查看序列与对应的查看时间，在这种情况下使用传统推荐方法来推荐下一次排序显示的推荐结果往往是不够准确的，且推荐的结果存在滞后性和重复性的问题，然而基于会话的推荐***可以有效解决这类问题。

发明内容

本发明提供一种基于联合编码的视频监控阵列显示优化方法和装置，通过构建含有全局编码器与局部编码器的联合编码监控策略推荐模型，对监控人员的行为进行可视化分析后利用循环神经网络结构，自动捕捉和总结优化后的监控人员行为。

本发明提供的具体技术方案如下：

一方面，本发明提供一种基于联合编码的视频监控阵列显示优化方法包括：

通过将整个监控序列作为全局编码器的输入，监控人员在所述监控序列中的行为特征作为全局编码器的输出，构建全局编码器；

采用物品级的注意力机制，动态选择和线性组合输入序列的不同部分，进行构建局部编码器；

利用深度学习的循环神经网络结构，构建含有全局编码器与局部编码器的联合编码监控策略推荐模型；

使用当前监控序列的表示形式和每个候选项之间的双线性相似函数来计算相似度评分，根据每个项目的相似度评分获得对应监控画面接下来出现的概率值；

基于每一个监控画面接下来出现的概率值优化视频监控阵列显示排序。

可选的，所述构建全局编码器具体包括：

将数据集按照操作对象组织进行分组，并且将分组后的数据集按照操作时间进行排序，按照时间顺序排列的一个对象组织相当于一个序列，其中，所述数据集包括用户名、操作对象、操作对象组织、操作时间；

采用排序之后的数据集，根据公式

计算重置门r_t，其中，σ为Sigmoid激活函数，x_t为全局编码器第t次的输入数据，

为全局编码器第t-1次的输出数据，W_r和U_r为权重向量；

根据公式

计算候选行为

其中，r_t为重置门，

为全局编码器第t-1次的输出数据，x_t为全局编码器第t次的输入数据，W和U分别为权重向量，⊙为哈达玛乘积；

根据公式

计算更新门，其中，σ为Sigmoid激活函数，x_t为全局编码器第t次的输入数据，

为全局编码器第t-1次的输出数据，W_z和U_z为权重向量；

根据公式

计算候选行为

与其之前的行为h_t-1的关系，其中，z_t为更新门，

为候选行为，

为全局编码器第t-1次的输出数据，候选行为

与其之前的行为h_t-1的关系

为全局编码器的输出操作序列特征。

可选的，所述构建局部编码器具体包括：

根据公式

计算全局编码器隐层输出

和局部编码器隐层向量表示

的相似度函数q，其中，矩阵A₁用来将

转化到一个潜在空间，矩阵A₂用来将

转化到一个潜在空间，σ为Sigmoid激活函数，v^T是维度转换矩阵；

根据公式

计算加权因子α，其中，

是全局编码器隐层输出；

是局部编码器隐层向量表示；

根据公式

计算监控序列中监控人员的意图系数，其中，a_tj是加权因子；

是局部编码器隐层向量表示。

可选的，所述构建含有全局编码器与局部编码器的联合编码监控策略推荐模型具体包括：

利用深度学习的循环神经网络结构，构建含有全局编码器与局部编码器的联合编码监控策略推荐模型，其中，全局编码器用于对整个监控序列进行总结，局部编码器用于自适应地选择当前会话中的重要项。

可选的，联合编码监控策略推荐模型构建过程中，全局编码器

被整合到c_t中用来提供联合编码监控策略推荐模型的顺序行为表示，全局编码器

一个隐藏状态与局部编码器的作用不同，局部编码器

用于计算前一个隐状态下的注意力权值，而全局编码器

的最后一个隐藏状态用来编码整个序列行为。

另一方面，本发明还提供一种基于联合编码的视频监控阵列显示优化装置包括：

全局构建模块，用于通过将整个监控序列作为全局编码器的输入，监控人员在所述监控序列中的行为特征作为全局编码器的输出，构建全局编码器；

局部构建模块，用于采用物品级的注意力机制，动态选择和线性组合输入序列的不同部分，进行构建局部编码器；

模型构建模块，用于利用深度学习的循环神经网络结构，构建含有全局编码器与局部编码器的联合编码监控策略推荐模型；

相似度计算模块，用于使用当前监控序列的表示形式和每个候选项之间的双线性相似函数来计算相似度评分，根据每个项目的相似度评分获得对应监控画面接下来出现的概率值；

显示排序模块，用于基于每一个监控画面接下来出现的概率值优化视频监控阵列显示排序。

可选的，所述全局构建模块具体用于：

采用排序之后的数据集，根据公式

为全局编码器第t-1次的输出数据，W_r和U_r为权重向量；

根据公式

计算候选行为

其中，r_t为重置门，

根据公式

为全局编码器第t-1次的输出数据，W_z和U_z为权重向量；

根据公式

计算候选行为

与其之前的行为h_t-1的关系，其中，z_t为更新门，

为候选行为，

为全局编码器第t-1次的输出数据，候选行为

与其之前的行为h_t-1的关系

为全局编码器的输出操作序列特征。

可选的，所述局部构建模块具体用于：

根据公式

计算全局编码器隐层输出

和局部编码器隐层向量表示

的相似度函数q，其中，矩阵A₁用来将

转化到一个潜在空间，矩阵A₂用来将

根据公式

计算加权因子α，其中，

是全局编码器隐层输出；

是局部编码器隐层向量表示；

根据公式

是局部编码器隐层向量表示。

可选的，所述模型构建模块具体用于：

一个隐藏状态与局部编码器的作用不同，局部编码器

用于计算前一个隐状态下的注意力权值，而全局编码器

的最后一个隐藏状态用来编码整个序列行为。

本发明的有益效果如下：

本发明实施例提供的一种基于联合编码的视频监控阵列显示优化方法包括通过将整个监控序列作为全局编码器的输入，监控人员在所述监控序列中的行为特征作为全局编码器的输出，构建全局编码器；采用物品级的注意力机制，动态选择和线性组合输入序列的不同部分，进行构建局部编码器；利用深度学习的循环神经网络结构，构建含有全局编码器与局部编码器的联合编码监控策略推荐模型；使用当前监控序列的表示形式和每个候选项之间的双线性相似函数来计算相似度评分，根据每个项目的相似度评分获得对应监控画面接下来出现的概率值；基于每一个监控画面接下来出现的概率值优化视频监控阵列显示排序；通过构建含有全局编码器与局部编码器的联合编码监控策略推荐模型，对监控人员的行为进行可视化分析后利用循环神经网络结构，自动捕捉和总结优化后的监控人员行为。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的一种基于联合编码的视频监控阵列显示优化方法的流程示意图；

图2是本发明实施例提供的一种基于联合编码的视频监控阵列显示优化方法装置的结构框图；

图3是本发明实施例提供的一种全局编码器的示意图；

图4为本发明实施例提供的一种局部编码器的示意图；

图5为本发明实施例提供的一种联合编码监控策略推荐模型的示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明实施方式作进一步地详细描述。

下面将结合附图1～附图5，对本发明实施例的一种基于联合编码的视频监控阵列显示优化方法和装置进行详细说明。

参考图1、图3、图4和图5所示，本发明实施例提供的一种基于联合编码的视频监控阵列显示优化方法包括：

步骤100：通过将整个监控序列作为全局编码器的输入，监控人员在所述监控序列中的行为特征作为全局编码器的输出，构建全局编码器；

具体的，参考图3所示，将数据集按照操作对象组织进行分组，并且将分组后的数据集按照操作时间进行排序，按照时间顺序排列的一个对象组织相当于一个序列，其中，所述数据集包括用户名、操作对象、操作对象组织、操作时间；

采用排序之后的数据集，根据公式

为全局编码器第t-1次的输出数据，W_r和U_r为权重向量；

根据公式

计算候选行为

其中，r_t为重置门，

根据公式

为全局编码器第t-1次的输出数据，W_z和U_z为权重向量；

根据公式

计算候选行为

与其之前的行为h_t-1的关系，其中，z_t为更新门，

为候选行为，

为全局编码器第t-1次的输出数据，候选行为

与其之前的行为h_t-1的关系

为全局编码器的输出操作序列特征。

其中，将整个监控序列作为全局编码器的输入，监控人员在该序列的行为特征作为全局编码器的输出。数据集中含有操作用户、操作用户IP、操作用户MAC、操作用户组织、操作业务、操作动作、操作对象、操作对象类型、操作对象组织、描述、操作时间、操作结果、新值、原值这14个数据项，本发明实施例剔除与实验无关的数据项，仅保留用户名、操作对象、操作对象组织、操作时间这4个数据项，进一步降低数据集大小以提高模型运行速度。

将数据集按照操作对象组织进行分组，并且将分组后的数据集按照操作时间进行排序，按照时间顺序排列的一个对象组织相当于一个序列。在全局编码器中，输入数据被分成一个个固定大小的批次来进行训练，批次的大小决定一次训练的样本数目和，影响模型的优化程度、模型输入层的参数设置和速度。选择正确的批次是为了在内存效率和内存容量之间寻找最佳平衡。

本发明实施例根据用户点击序列的特点，全局编码器将用户的序列数据集进行拆分，将上一次的点击作为输入，下一次的点击作为输出，通过输入和输出的对应关系来保留数据之间的关联性，从而解决因序列长度差异大而难以建模的问题。

步骤200：采用物品级的注意力机制，动态选择和线性组合输入序列的不同部分，进行构建局部编码器；

由于全局编码器对整个监控序列的矢量化概括难以精确获得监控人员的意图，也正是基于此，本发明实施例设计了面向视频监控的局部编码器，局部编码器的优点是自适应的捕获监控人员意图。

参考图4所示，局部编码器的构建过程中，将数据集按照操作对象组织进行分组，并且将分组后的数据集按照操作时间进行排序，按照时间顺序排列的一个对象组织相当于一个序列，其中，所述数据集包括用户名、操作对象、操作对象组织、操作时间。局部编码器的构建过程中，采用的数据集与全局编码器构建过程中采用的数据集相同，且数据预处理方式也与全局编码器相同。

参考图4所示，根据公式

计算全局编码器隐层输出

和局部编码器隐层向量表示

的相似度函数q，其中，矩阵A₁用来将

转化到一个潜在空间，矩阵A₂用来将

根据公式

计算加权因子α，其中，

是全局编码器隐层输出；

是局部编码器隐层向量表示；

根据公式

是局部编码器隐层向量表示。

步骤300：利用深度学习的循环神经网络结构，构建含有全局编码器与局部编码器的联合编码监控策略推荐模型；

参考图5所示，利用深度学习的循环神经网络结构，构建含有全局编码器与局部编码器的联合编码监控策略推荐模型，其中，全局编码器用于对整个监控序列进行总结，局部编码器用于自适应地选择当前会话中的重要项。

并且，在联合编码监控策略推荐模型构建过程中，全局编码器

一个隐藏状态与局部编码器的作用不同，局部编码器

用于计算前一个隐状态下的注意力权值，而全局编码器

的最后一个隐藏状态用来编码整个序列行为。

本发明实施例利用深度学习的循环神经网络结构，构建含有全局编码器与局部编码器的联合编码监控策略推荐模型。对于基于会话的摄像机监控任务，全局编码器用于对整个监控序列进行总结，而局部编码器可以自适应地选择当前会话中的重要项。序列行为利于提取当前会话中用户的主要目的。因此，本发明实施例使用序列行为的表示与之前的隐藏状态来计算每次用户点击的注意力权重。

步骤400：使用当前监控序列的表示形式和每个候选项之间的双线性相似函数来计算相似度评分，根据每个项目的相似度评分获得对应监控画面接下来出现的概率值；

步骤500：基于每一个监控画面接下来出现的概率值优化视频监控阵列显示排序。

需要说明的是，轮巡是指所安装的所有摄像头每个画面，按摄像头顺序在屏幕上显示，每隔几秒或者几分钟切换到下一个摄像头拍摄的画面。轮询的过程中省去了手动人工点击切换画面，一般适合小区保安室夜间守护，商场保安室电子巡逻用。轮巡策略是指轮巡摄像头的显示顺序，及切换间隔。循环神经网络(Recurrent Neural Network,RNN)是一类以序列数据为输入，在序列的演进方向进行递归且所有节点按链式连接的递归神经网络；循环神经网络具有记忆性、参数共享并且图灵完备，因此在对序列的非线性特征进行学习时具有一定优势。

本发明实施例使用双线性解码方案(bi-linear decoding scheme)，既减少了参数的数目，又提高了模型的性能。其中，根据公式

使用当前监控序列的表示形式和每个候选项之间的双线性相似函数来计算相似度评分S_i，其中，B是一个维度转换矩阵，用于将c_t的嵌入表示转化成和嵌入层

相同的维度。最后，将每个项目的相似度评分输入到softmax层，以获得该摄像头画面接下来出现的概率。

本发明实施例利用监控***的操作日志，自动学习操作人员行为，提出一种基于全局-局部联合编码模型的视频监控阵列显示优化方法，解决了现有轮巡机制对监控人员经验要求较高及无法对监控区域精确轮巡的弊端。其中，利用全局编码器对整个操作序列进行总结，利用GRU作为全局编码器的主要单元使其具有较低的计算复杂度及较高的可扩展性，从而有利于对较长的操作序列进行总结。利用局部编码器自适应地选择操作序列中的重要项，实现捕捉操作人员的主要目的。

本发明实施例提供的一种基于联合编码的视频监控阵列显示优化方法可以采用Recall@20和MMR@20两个指标来进行评测，

其中TP表示将正类预测为正类的数目，FN表示将正类预测为负类的数目，Recall@20表示：模型对所有预测物品评分的排序中，被正确预测的物品在前20项里所占的比例。

MRR是用来衡量搜索算法效果的指标，目前被广泛用在允许返回多个结果的问题，模型会对每一个返回的结果给一个置信度(打分)，然后根据置信度排序，将得分高的结果排在前面返回。具体来说：对于一个查询，第一个正确答案排名倒数的平均数(如果返回的正确物品在前20名之外，则这项物品的排名倒数分数就是0)。

MRR可以采用如下公式计算：

其中，Q为样本查询集合；|Q|为Q中的查询个数；rank_i表示在第i个查询中，第一个正确答案的排名。

本发明实施例提供的一种基于联合编码的视频监控阵列显示优化方法的Recall@20为48％，MRR@20为22％，明显优于相同场景下的传统方法。

基于相同的发明构思，参考图2所示，本发明实施例还提供一种基于联合编码的视频监控阵列显示优化装置包括：

全局构建模块110，用于通过将整个监控序列作为全局编码器的输入，监控人员在所述监控序列中的行为特征作为全局编码器的输出，构建全局编码器；

局部构建模块120，用于采用物品级的注意力机制，动态选择和线性组合输入序列的不同部分，进行构建局部编码器；

模型构建模块130，用于利用深度学习的循环神经网络结构，构建含有全局编码器与局部编码器的联合编码监控策略推荐模型；

相似度计算模块140，用于使用当前监控序列的表示形式和每个候选项之间的双线性相似函数来计算相似度评分，根据每个项目的相似度评分获得对应监控画面接下来出现的概率值；

显示排序模块150，用于基于每一个监控画面接下来出现的概率值优化视频监控阵列显示排序。

可选的，全局构建模块110具体用于：

采用排序之后的数据集，根据公式

为全局编码器第t-1次的输出数据，W_r和U_r为权重向量；

根据公式

计算候选行为

其中，r_t为重置门，

根据公式

为全局编码器第t-1次的输出数据，W_z和U_z为权重向量；

根据公式

计算候选行为

与其之前的行为h_t-1的关系，其中，z_t为更新门，

为候选行为，

为全局编码器第t-1次的输出数据，候选行为

与其之前的行为h_t-1的关系

为全局编码器的输出操作序列特征。

可选的，局部构建模块120具体用于：

根据公式

计算全局编码器隐层输出

和局部编码器隐层向量表示

的相似度函数q，其中，矩阵A₁用来将

转化到一个潜在空间，矩阵A₂用来将

根据公式

计算加权因子α，其中，

是全局编码器隐层输出；

是局部编码器隐层向量表示；

根据公式

是局部编码器隐层向量表示。

可选的，模型构建模块130具体用于：

利用深度学习的循环神经网络结构，构建含有全局编码器与局部编码器的联合编码监控策略推荐模型，其中，全局编码器用于对整个监控序列进行总结，局部编码器用于自适应地选择当前会话中的重要项。联合编码监控策略推荐模型构建过程中，全局编码器

一个隐藏状态与局部编码器的作用不同，局部编码器

用于计算前一个隐状态下的注意力权值，而全局编码器

的最后一个隐藏状态用来编码整个序列行为。

本发明实施例还提供一种基于联合编码的视频监控阵列显示优化装置，利用监控***的操作日志，构建联合编码模型，利用全局编码器对操作序列进行总结，利用局部编码器自适应地选择操作序列中的重要项，捕捉操作人员的主要目的，可以有效解决现有轮巡机制对监控人员经验要求高及无法对监控区域精确轮巡的弊端。

显然，本领域的技术人员可以对本发明实施例进行各种改动和变型而不脱离本发明实施例的精神和范围。这样，倘若本发明实施例的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种基于联合编码的视频监控阵列显示优化方法，其特征在于，所述视频监控阵列显示优化方法包括：

2.根据权利要求1所述的视频监控阵列显示优化方法，其特征在于，所述构建全局编码器具体包括：

采用排序之后的数据集，根据公式

为全局编码器第t-1次的输出数据，W_r和U_r为权重向量；

根据公式

计算候选行为

其中，r_t为重置门，

根据公式

为全局编码器第t-1次的输出数据，W_z和U_z为权重向量；

根据公式

计算候选行为

与其之前的行为h_t-1的关系，其中，z_t为更新门，

为候选行为，

为全局编码器第t-1次的输出数据，候选行为

与其之前的行为h_t-1的关系

为全局编码器的输出操作序列特征。

3.根据权利要求1所述的视频监控阵列显示优化方法，其特征在于，所述构建局部编码器具体包括：

根据公式

计算全局编码器隐层输出

和局部编码器隐层向量表示

的相似度函数q，其中，矩阵A₁用来将

转化到一个潜在空间，矩阵A₂用来将

根据公式

计算加权因子α，其中，

是全局编码器隐层输出；

是局部编码器隐层向量表示；

根据公式

是局部编码器隐层向量表示。

4.根据权利要求1所述的视频监控阵列显示优化方法，其特征在于，所述构建含有全局编码器与局部编码器的联合编码监控策略推荐模型具体包括：

5.根据权利要求4所述的视频监控阵列显示优化方法，其特征在于，联合编码监控策略推荐模型构建过程中，全局编码器

一个隐藏状态与局部编码器的作用不同，局部编码器

用于计算前一个隐状态下的注意力权值，而全局编码器

的最后一个隐藏状态用来编码整个序列行为。

6.一种基于联合编码的视频监控阵列显示优化装置，其特征在于，所述视频监控阵列显示优化装置包括：

7.根据权利要求6所述的视频监控阵列显示优化装置，其特征在于，所述全局构建模块具体用于：

采用排序之后的数据集，根据公式

为全局编码器第t-1次的输出数据，W_r和U_r为权重向量；

根据公式

计算候选行为

其中，r_t为重置门，

根据公式

为全局编码器第t-1次的输出数据，W_z和U_z为权重向量；

根据公式

计算候选行为

与其之前的行为h_t-1的关系，其中，z_t为更新门，

为候选行为，

为全局编码器第t-1次的输出数据，候选行为

与其之前的行为h_t-1的关系

为全局编码器的输出操作序列特征。

8.根据权利要求6所述的视频监控阵列显示优化装置，其特征在于，所述局部构建模块具体用于：

根据公式

计算全局编码器隐层输出

和局部编码器隐层向量表示

的相似度函数q，其中，矩阵A₁用来将

转化到一个潜在空间，矩阵A₂用来将

根据公式

计算加权因子α，其中，

是全局编码器隐层输出；

是局部编码器隐层向量表示；

根据公式

是局部编码器隐层向量表示。

9.根据权利要求6所述的视频监控阵列显示优化装置，其特征在于，所述模型构建模块具体用于：

10.根据权利要求9所述的视频监控阵列显示优化装置，其特征在于，联合编码监控策略推荐模型构建过程中，全局编码器

一个隐藏状态与局部编码器的作用不同，局部编码器

用于计算前一个隐状态下的注意力权值，而全局编码器

的最后一个隐藏状态用来编码整个序列行为。