WO2018028102A1

WO2018028102A1 - 一种仿记忆引导的模式识别方法

Info

Publication number: WO2018028102A1
Application number: PCT/CN2016/109001
Authority: WO
Inventors: 陈哲; 王志坚; 胡文才; 王鑫
Original assignee: 河海大学
Priority date: 2016-08-08
Filing date: 2016-12-08
Publication date: 2018-02-15
Also published as: US10860891B2; GB201902335D0; CN106296736B; AU2016418565A1; GB2567595A; GB2567595B; US20190164013A1; CN106296736A; NZ750970A; AU2016418565B2

Abstract

一种仿记忆引导的模式识别方法，通过引入当前时刻之前记忆中的时间序列信息，以序列中的样本为参考进行模式识别，检测运动信息。模拟人脑中的记忆调用机制，以不同的记忆片段为基元，检测出多个记忆片段中的运动变化及与之相对应的运动状态；模拟记忆的衰减机制，组合多个片段中的运动检测结果，增强当前时刻中的运动变化信息并构成连续时间序列中的运动状态，形成当前时刻的运动检测结果，作为模式识别结果。本方法能够稳定、可靠地用于复杂条件下的模式识别及运动检测，具有较好的噪声抑制效果且运算效率较高。

Description

一种仿记忆引导的模式识别方法

技术领域

本发明涉及一种模式识别方法，具体的是指一种仿记忆引导的视频序列中模式识别及运动检测方法。

背景技术

人类的视觉感知***在模式识别上具有较为突出的优势。较为高级的记忆和选择***能够使人类的视觉快速的集中于运动和连续的运动变化上。这种机制是通过短时记忆和长时记忆中的全局时序特征引导而实现的，称之为记忆引导。基于该种机制，对于连续运动状态的模式识别是通过融合不同时刻目标的空间位置及运动轨迹而实现的。例如在图1中，人类感知***对场景的描述为：“一个女孩从左边向右边跑”，“许多车辆相向行驶”，以及“两个人走到了一起”。可以发现，除了“跑步的女孩”，“行驶的汽车”和“行人”之外每种描述都强调了在连续的时间序列中至当前时刻为止的运动轨迹等模式信息。然而，目前的机器视觉、图像处理及模式识别方法多是针对当前时刻目标静态的空间位置进行预测和检测、或是仅针对目标的运动轨迹进行拟合，尚无方法能够模拟人类记忆机制以片段序列为基元同时检测出当前目标的空间位置并能够回溯其运动轨迹等模式，如图1所示。

此外，对于真实、复杂场景中的模式识别还存在噪声难以抑制的问题。目前的机器视觉方法多是采用对序列中所有数据一次建模的方法以识别当前帧中运动模式的变化。在这一过程中，真实场景中大量的运动噪声被引入到结果中，并且这种运动噪声不仅数量大且难以抑制，严重影响到模式识别及运动检测结果的准确性。对于这一问题的解决，很多工作给我们有益的启发。例如，模拟视觉中央.周边差的时间滤波器、基于频谱差分的运动显著性模型等，但是这些模型均无法实现对整个时间序列中运动轨迹的描述，且对运动噪声的抑制能力较弱，结果中存在较多的噪声干扰。

受益于最新生物学研究的发展，发现人类视觉的模式识别在很大程度上要依赖于记忆中的历史经验，短时或长时记忆中的全局上下文信息使得模式识别更加便捷、高效。这一发现强调了全局长下文信息对模式识别的重要作用。这种重要作用主要体现在它不仅能够准确的检测运动变化模式并得到运动轨迹，还能够抑制由于相机抖动等所导致的运动噪声。因此，需要对这种机制进行建模，发明一种全新的模式识别模型以准确的检测当前时刻的运动并标定运动轨迹，在最终的模式识别结果中，同时准确检测出当前时刻和记忆中历史时刻的运动变化、运动轨迹。该发明的基本依据在于运动所产生的变化不仅同时域邻接的样本有关还同全局的上下文有关。因而，除了短时记忆片段，长时记忆片段也需要引入到模式识别过程中，能够在一次检测过程中得到运动在整个时间序列中的变化状态。

发明内容

发明目的：针对现有技术中存在的问题，本发明提供一种仿记忆引导的时间序列中模式识别方法，该模式识别方法能够在一次识别过程中得到在整个时间序列中的目标运动状态，并能够解决复杂自然场景运动检测中噪声难以抑制的问题。

技术方案：一种仿记忆引导的模式识别方法，包括如下步骤：

步骤一：仿记忆调用机制及其过程，分割历史时间序列并同当前时刻帧组合成为片段序列作为模式识别的基元。对于一个视频序列我们可以获得多个片段序列，彼此间相互独立，无重叠，且并行处理。

步骤二：仿视觉运动显著性机制及其过程，提取每个片段序列中的运动显著性，检测得到该短时序列中的运动信息。对于每一个记忆片段中的时间序列，采用视觉运动显著性模型检测该片段序列中所出现的运动变化。

步骤三：仿记忆衰退机制及其过程，对运动信息进行加权，并加权融合所有片段序列中的运动信息，输出当前时刻运动信息及整个时间序列中的运动轨迹，综合作为模式识别结果。

对于每个片段中的运动检测结果，考虑到记忆片段其同当前时刻的时延，认为时延越大的片段序列中运动检测结果同当前时刻的时间相关性越弱，所赋相应权重值越小；反之，认为时延越小的片段序列中运动检测结果同当前时刻的时间相关性越强，所赋相应权重值越大。通过加权累积的融合的方式能够提高对当前时刻运动检测的准确性，并能够得到整个记忆时序列区间中的运动轨迹，综合得到整体的模式识别结果。

相比较一般模式识别方法对时间序列的整体建模，本发明以片段序列为基元进行运动检测并融合的处理方式进行模式识别。这种策略能够准确检测出当前时刻的运动信息并生成整个时间序列中运动状态变化的轨迹信息，且能够标定轨迹、运动的时间信息，并兼有对运动噪声的抑制能力。

附图说明

图1是记忆引导的模式识别示意图；

图2是本发明实施例的模式识别的流程图，(a)输入视频序列中当前时刻的帧图像，(b)短时记忆中的运动检测，(c)长时记忆中的运动检测，(d)当前时刻中帧图像中的运动检测，(e)整个时间序列中的运动状态；

图3是本发明实施例中时间序列分割的示意图；

图4是本发明实施例中积累的运动检测及模式识别结果。

具体实施方式

下面结合具体实施例，进一步阐明本发明，应理解这些实施例仅用于说明本发明而不用于限制本发明的范围，在阅读了本发明之后，本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。

实施例如图2所示，一种仿记忆引导的模式识别方法。本发明的提出主要依赖于四个生物学发现：①短时记忆能够引导识别近期所出现的运动突变；②长时记忆能够引导识别稳定出现的运动变化；③基于记忆的运动显著性机制多集中于短时记忆、长时记忆中均发生运动变化的部分，忽视无关的背景及零星的噪声信息；④通过记忆和运动显著性机制的交互能够描述当前时刻中的运动信息及记忆中整个时间序列中的运动状态及状态变化(运动轨迹)。根据发现①，在短时记忆中的模式识别应能够标定出那些近期所出现突变的运动信息，并抑制静态的背景信息(如图2(b))。根据发现②，在长时记忆中的模式识别应能够标定出较长时间范围内所稳定出现的运动信息(如图2(c))并抑制零星的运动噪声。根据发现③，所得到的强度最高的模式识别结果集中于那些短时\长时记忆中均发生运动变化的部分(如图2(d))。根据发现④，模式识别方法应能够检测到在记忆中整个时间序列中运动变化的轨迹，以准确的描述运动状态及状态变化(如图2(e))。

首先，根据发现①、②若一个点被识别为发生了运动模式的变化，那么该点应该在短时记忆和长时记忆片段中均检测到了稳定的运动变化。为了模拟这种机制首先对记忆中的时间序列进行分割，并将同一空间位置、时间上连续的样本排列组成片段序列。对于当前时刻的点，仅在它同所有记忆中的样本存在差异时才认为其位置处发生了运动。分割过程如图3所示。对于当前时刻中的点x_n，若该点的信息同记忆中存储的样本信息存在差异那么认为该点位置处发生运动变化。具体而言，若x_t为t时刻所考察的点，当前时刻t＝n，l个记忆片段(记忆的存储量为l)中的时间序列可通过组合x_n及记忆中的样本

而得到。因此，对于当前时刻中的点x_n，相应的序列片段可以构造为：

其中，

为片段序列，x_n为当前时刻所考察的点，x_n-1，x_n-2，…，x_n-l×k为记忆中的样本，k为时间序列的长度(最小值设置为16)，l为记忆的存储量(最小值设置为10)。

至此，完成了对记忆中所有时间序列的分割。

在每个序列片段中，采用基于时间傅里叶变换的视觉运动显著性模型检测每个片段序列中的运动信息。基于时间傅里叶变换的视觉运动显著性模型认为时间序列频谱中相位谱的波动对应于时域中序列信息的变化。因而可以通过对相位谱的计算检测运动信息。主要包括以下步骤：

步骤一，构造当前时刻点和历史时刻样本所组成的片段序列：

步骤二，对于该片段序列计算其傅里叶变换及相应的相位谱：

步骤三，对所得的相位谱计算其反傅里叶变换：

其中，F和F^-1分别表示傅里叶变换及反傅里叶变换，

代表序列片段

的相位谱，

为相位谱的反傅里叶变换结果，g(t)为一维高斯滤波器(典型值方差σ＝5)。为了准确地检测运动信息的同时抑制背景中的运动噪声，需要进一步对

进行阈值滤波。

步骤四，对相位谱的反变换结果进行阈值滤波，如果

的值大于阈值则相应位置处出现运动信息，否则认为无运动变化：

其中，T为阈值，典型值设置为：

其中，

和

分别为

的均值和方差。

随后，根据发现③，将多个序列片段中的运动检测结果融合，形成记忆引导的运动检测结果，不仅考虑到了短时间内的运动突变还考虑了长时间内稳定的运动变化。这种机制可以形式化建模为所有l个序列片段中的运动检测结果的累积：

其中，E_n为运动检测结果的累积。所得到的结果如图4所示：在所得到的运动检测结果图中(图4)强度最大的点对应于当前时刻的运动信息，强度随着时间的延续而减弱。因此，可以通过基于灰度直方图的方法对运动检测结果图E_n进行分割。通过这种计算，可以得到仅针对当前时刻的运动信息S_n，作为当前时刻的模式识别结果。

至此，完成了对当前时刻运动信息的检测，能够识别得到当前时刻的模式。

根据发现④，运动信息在人脑中的强度应随着时间的推移而减弱，称之为记忆衰减。本发明采用加权的方法来模拟这种衰减机制。对于任意片段序列，所检测到运动信息对应的强度反比于该片段距离当前时刻的时延。这种权重及衰减可以计算为：

其中，

为第i个片段中运动检测结果所对应的权重，α为调制参数，取值范围为0＜α＜1。由于

的强度随着时延的增大而降低，使其能够标定运动发生的时间。

此外，根据发现④，当前时刻中的运动信息可以同历史时刻的运动信息组合形成运动轨迹，本发明形式化模拟这种机制为衰减后运动信息的累积：

其中，

为运动轨迹图。为了抑制轨迹生成过程及运动信息衰减过程中所引入的噪声。将原始运动检测累积结果同衰减后的运动检测累积结果相乘：

其中，

为噪声抑制后的轨迹，所得到的结果如图2(e)所示。

至此，完成了记忆中所有时刻运动轨迹的拟合和表征，完成了对历史时刻运动轨迹及运动状态等模式的识别。

Claims

一种仿记忆引导的模式识别方法，其特征在于，包括如下步骤：

步骤一：仿记忆调用机制及其过程，分割历史时间序列并同当前时刻帧组合成为片段序列作为模式识别的基元；

步骤二：仿视觉运动显著性机制及其过程，提取每个片段序列中的运动显著性，检测得到该短时序列中的运动信息；

步骤三：仿记忆衰退机制及其过程，对运动信息进行加权，并加权融合所有片段序列中的运动信息，输出当前时刻运动信息及整个时间序列中的运动轨迹，综合作为模式识别结果。
如权利要求1所述的仿记忆引导的模式识别方法，其特征在于，仿记忆调用机制中基于片段序列的运动检测策略，既对于所存储的历史记忆进行分段，以记忆片段作为运动检测的基元；具体，对于视频序列中当前时刻t的图像帧，将1，2，…，t时刻的帧按照长度k进行分割，分别对分割出每个片段序列模拟视觉运行显著性机制检测片段序列中所出现的运动变换，作为该片段中的模式识别结果。
如权利要求1所述的仿记忆引导的模式识别方法，其特征在于，仿记忆衰退机制中，对于每个片段中的运动检测结果，考虑到记忆片段同当前时刻的时延，认为时延越大的片段序列中运动检测结果同当前时刻的时间相关性越弱，所赋相应权重值越小；反之，认为时延越小的片段序列中运动检测结果同当前时刻的时间相关性越强，所赋相应权重值越大；通过加权累积融合的方式能够提高对当前时刻运动检测的准确性，并能够得到整个记忆时序列区间中的运动轨迹，综合得到整体的模式识别结果。