CN112613516A - 用于航拍视频数据的语义分割方法 - Google Patents

用于航拍视频数据的语义分割方法 Download PDF

Info

Publication number
CN112613516A
CN112613516A CN202011459565.8A CN202011459565A CN112613516A CN 112613516 A CN112613516 A CN 112613516A CN 202011459565 A CN202011459565 A CN 202011459565A CN 112613516 A CN112613516 A CN 112613516A
Authority
CN
China
Prior art keywords
semantic segmentation
histogram
video data
aerial video
data set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011459565.8A
Other languages
English (en)
Inventor
郑若冰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Moviebook Technology Corp ltd
Original Assignee
Beijing Moviebook Technology Corp ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Moviebook Technology Corp ltd filed Critical Beijing Moviebook Technology Corp ltd
Priority to CN202011459565.8A priority Critical patent/CN112613516A/zh
Publication of CN112613516A publication Critical patent/CN112613516A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/56Extraction of image or video features relating to colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • G06V20/13Satellite images

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Astronomy & Astrophysics (AREA)
  • Remote Sensing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)

Abstract

本申请公开了一种用于航拍视频数据的语义分割方法,通过镜头边界检测算法对航拍视频数据集进行训练识别,得到所述航拍视频数据集中的关键帧并构成关键帧数据集,再通过基于全卷积网络的语义分割算法对所述关键帧数据集进行语义分割。本申请的的语义分割方法,是经过数据预处理、提取关键帧,从而减小数据的计算量,不用大型的数据集驱动模型来进行学习,通过结合颜色和纹理特征来解决模型对由阴影产生光流变化的敏感性,使用卷积神经网络以端到端的的方式学习局部特征和全局特征来优化语义分割的结果,提高后期拓展性詹策的准确性和可靠性。

Description

用于航拍视频数据的语义分割方法
技术领域
本申请涉及一种用于航拍视频数据的语义分割方法。
背景技术
通过分析无人机捕获的视频具有广泛的应用,例如跟踪车辆,物体检测,异常检测等。对于大多数应用,需要从视频的图像帧中推断空间和上下文信息。例如,在了解有关道路知识的情况下,对车辆的跟踪将更容易,语义分割是用于将图像划分成不同语义区域并将这些区域分类为预定义类的工具之一。语义分割有助于理解场景的布局,因此它越来越成为异常检测、自动驾驶车辆、物体检测等的重要因素。但是由于类中对象的变化、视角的丢失、场景的上下文、噪声的存在以及光照变化等,语义分割仍然具有挑战性。目前的语义分割可以通过使用传统的机器学习方法如条件随机场(CRF)和深度卷积神经网络(CNN)的学习方法。
基于CRF的算法因其捕获上下文信息的能力而被广泛使用,该框架通常由一元势能和成对势能组成。一元势能捕获局部特征,这些特征依赖于像素本身,而成对势能捕获空间信息。捕获各种特征(如纹理,颜色位置等)的不同势能需要手动编码到模型中。但是,这些手动操作的功能可能无法捕获数据中的所有变体。
而对于航拍视频中的异常检测、事件检测等自动化***的成功在很大程度上依赖于场景理解以获得更高的准确性。另外,由于缺乏可用的数据集,对无人机视频的语义分割的研究很有限。
因此,如何更有效地实现对于无人机航拍视频进行语义分割进而利用于分析,是目前急需解决的技术问题。
发明内容
本申请的目的在于克服上述问题或者至少部分地解决或缓减解决上述问题。
根据本申请的一个方面,提供了一种用于航拍视频数据的语义分割方法,通过镜头边界检测算法对航拍视频数据集进行训练识别,得到所述航拍视频数据集中的关键帧并构成关键帧数据集,再通过基于全卷积网络的语义分割算法对所述关键帧数据集进行语义分割。
可选地,镜头边界检测算法对航拍视频数据集中的连续帧进行镜头边界的识别,是通过计算连续帧的直方图差异并与设定阈值相比较从而完成镜头边界的识别。
可选地,镜头边界检测算法对航拍视频数据集中的连续帧进行镜头边界的识别的过程,是通过非重叠网格的划分并结合直方图差异计算来识别每一帧的镜头边界。
可选地,镜头边界检测算法通过非重叠网格并结合直方图差异计算来识别每一帧的镜头边界时,先将每一帧划分为16×16大小的非重叠网格,然后采用卡方距离计算相邻两帧之间相应的网格直方图差,再计算连续两帧之间的直方图平均差,最后将直方图平均差与设定的阈值Tshot进行比较从而识别镜头边界。
可选地,采用卡方距离计算相邻两帧之间相应的网格直方图差的公式为:
Figure BDA0002830944630000021
其中,Hi表示第i帧直方图,Hi+1表示第(i+1)帧直方图,I表示两帧中同一位置的图像块。
可选地,连续两帧之间的直方图平均差的计算公式为:
Figure BDA0002830944630000022
其中,D为连续两帧的直方图平均差,dk为第k个图像块之间的卡方差,N表示图像中图像块的总数。
可选地,将直方图平均差与设定的阈值Tshot进行比较的计算公式为:
Figure BDA0002830944630000023
其中,i和i+1表示两个连续的帧.
可选地,通过基于全卷积网络的语义分割算法对所述关键帧数据集进行语义分割中采用的是U-Net模型,所述U-Net模型包括收缩路径和对称的扩张路径,通过收缩路径对关键帧中的特征进行卷积运算,再通过Relu激活函数来提取特征,在提取的特征中应用maxpool函数识别出相关特征,在所述U-Net模型的最后一层实用Softmax激活,得到每个类的像素概率。
可选地,所述U-Net模型所处理的关键帧所针对的是256*256的彩色图像,并在所述U-Net模型的每层同时予以填充、保留针对关键帧特征最相关的特性。
特别地,本发明还提供了一种计算设备,包括存储器、处理器和存储在所述存储器内并能由所述处理器运行的计算机程序,其中,所述处理器执行所述计算机程序时实现如上所述的方法。
本发明还提供了一种计算机可读存储介质,优选为非易失性可读存储介质,其内存储有计算机程序,所述计算机程序在由处理器执行时实现如上所述的方法。
本发明还提供了一种计算机程序产品,包括计算机可读代码,当所述计算机可读代码由计算机设备执行时,导致所述计算机设备执行如上所述的方法。
本申请的用于航拍视频数据的语义分割方法,是经过数据预处理、提取关键帧,从而减小数据的计算量,不用大型的数据集驱动模型来进行学习,通过结合颜色和纹理特征来解决模型对由阴影产生光流变化的敏感性,使用卷积神经网络以端到端的的方式学习局部特征和全局特征来优化语义分割的结果,提高后期拓展性詹策的准确性和可靠性。
根据下文结合附图对本申请的具体实施例的详细描述,本领域技术人员将会更加明了本申请的上述以及其他目的、优点和特征。
附图说明
后文将参照附图以示例性而非限制性的方式详细描述本申请的一些具体实施例。附图中相同的附图标记标示了相同或类似的部件或部分。本领域技术人员应该理解,这些附图未必是按比例绘制的。附图中:
图1是根据本申请一个实施例的用于航拍视频数据的语义分割方法的方法流程图;
图2是根据本申请另一个实施例的计算设备结构图;
图3是根据本申请另一个实施例的计算机可读存储介质结构图。
具体实施方式
本方案提出了一种用于航拍视频数据的语义分割方法,如图1所示,其通过镜头边界检测算法对航拍视频数据集进行训练识别,得到所述航拍视频数据集中的关键帧并构成关键帧数据集,再通过基于全卷积网络的语义分割算法对所述关键帧数据集进行语义分割。
镜头边界检测算法对航拍视频数据集中的连续帧进行镜头边界的识别,是通过计算连续帧的直方图差异并与设定阈值相比较从而完成镜头边界的识别。进一步说来,是通过非重叠网格的划分并结合直方图差异计算来识别每一帧的镜头边界。
具体说来,镜头边界检测算法通过非重叠网格并结合直方图差异计算来识别每一帧的镜头边界时,先将每一帧划分为16×16大小的非重叠网格,然后采用卡方距离计算相邻两帧之间相应的网格直方图差,
Figure BDA0002830944630000041
其中,Hi表示第i帧直方图,Hi+1表示第(i+1)帧直方图,I表示两帧中同一位置的图像块。
然后,计算连续两帧之间的直方图平均差,
Figure BDA0002830944630000042
其中,D为连续两帧的直方图平均差,dk为第k个图像块之间的卡方差,N表示图像中图像块的总数。
最后,将直方图平均差与设定的阈值Tshot进行比较从而识别镜头边界,将直方图平均差与设定的阈值Tshot进行比较的计算公式为:
Figure BDA0002830944630000043
其中,i和i+1表示两个连续的帧。阈值Tshot的确定可根据的具体工况需求来确定,本实施例中的阈值Tshot是根据直方图曲线的峰和谷,优选地,所述阈值Tshot对应选定直方图中两个峰之间的最小值,可根据实验表现来确定。在确定镜头边界时,如Di+1-Di>Tshot则判定为1即判定为镜头边界,否则则为非镜头边界。
可选地,通过基于全卷积网络的语义分割算法对所述关键帧数据集进行语义分割中采用的是U-Net模型,所述U-Net模型包括收缩路径和对称的扩张路径,通过收缩路径对关键帧中的特征进行卷积运算,再通过Relu激活函数来提取特征,在提取的特征中应用maxpool函数识别出相关特征,在所述U-Net模型的最后一层实用Softmax激活,得到每个类的像素概率。通常而言一张图片里会包含多个语义类,比如“道路”、“草地”、“房屋”等,在本实施例中得到每个类的像素概率后既可以得到该像素点所对应的语义类,也就是能够分析出图片中的语义。
本实施例对U-Net模型进行了相应的修改,以处理航空影像。所述U-Net模型所处理的关键帧所针对的是256*256的彩色图像,并在所述U-Net模型的每层同时予以填充,每层的输入由上层做卷积从而丰富,保留针对关键帧特征最相关的特性。
根据下文结合附图对本申请的具体实施例的详细描述,本领域技术人员将会更加明了本申请的上述以及其他目的、优点和特征。
本申请实施例还提供了一种计算设备,参照图2,该计算设备包括存储器1120、处理器1110和存储在所述存储器1120内并能由所述处理器1110运行的计算机程序,该计算机程序存储于存储器1120中的用于程序代码的空间1130,该计算机程序在由处理器1110执行时实现用于执行任一项根据本发明的方法步骤1131。
本申请实施例还提供了一种计算机可读存储介质。参照图3,该计算机可读存储介质包括用于程序代码的存储单元,该存储单元设置有用于执行根据本发明的方法步骤的程序1131′,该程序被处理器执行。
本申请实施例还提供了一种包含指令的计算机程序产品。当该计算机程序产品在计算机上运行时,使得计算机执行根据本发明的方法步骤。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、获取其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
专业人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令处理器完成,所述的程序可以存储于计算机可读存储介质中,所述存储介质是非短暂性(英文:non-transitory)介质,例如随机存取存储器,只读存储器,快闪存储器,硬盘,固态硬盘,磁带(英文:magnetic tape),软盘(英文:floppy disk),光盘(英文:optical disc)及其任意组合。
以上所述,仅为本申请较佳的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应该以权利要求的保护范围为准。

Claims (10)

1.一种用于航拍视频数据的语义分割方法,其特征在于,通过镜头边界检测算法对航拍视频数据集进行训练识别,得到所述航拍视频数据集中的关键帧并构成关键帧数据集,再通过基于全卷积网络的语义分割算法对所述关键帧数据集进行语义分割。
2.根据权利要求1所述的用于航拍视频数据的语义分割方法,其特征在于,镜头边界检测算法对航拍视频数据集中的连续帧进行镜头边界的识别,是通过计算连续帧的直方图差异并与设定阈值相比较从而完成镜头边界的识别。
3.根据权利要求2所述的用于航拍视频数据的语义分割方法,其特征在于,镜头边界检测算法对航拍视频数据集中的连续帧进行镜头边界的识别的过程,是通过非重叠网格的划分并结合直方图差异计算来识别每一帧的镜头边界。
4.根据权利要求3所述的用于航拍视频数据的语义分割方法,其特征在于,镜头边界检测算法通过非重叠网格并结合直方图差异计算来识别每一帧的镜头边界时,先将每一帧划分为16×16大小的非重叠网格,然后采用卡方距离计算相邻两帧之间相应的网格直方图差,再计算连续两帧之间的直方图平均差,最后将直方图平均差与设定的阈值Tshot进行比较从而识别镜头边界。
5.根据权利要求4所述的用于航拍视频数据的语义分割方法,其特征在于,采用卡方距离计算相邻两帧之间相应的网格直方图差的公式为:
Figure FDA0002830944620000011
其中,Hi表示第i帧直方图,Hi+1表示第(i+1)帧直方图,I表示两帧中同一位置的图像块。
6.根据权利要求5所述的用于航拍视频数据的语义分割方法,其特征在于,连续两帧之间的直方图平均差的计算公式为:
Figure FDA0002830944620000012
其中,D为连续两帧的直方图平均差,dk为第k个图像块之间的卡方差,N表示图像中图像块的总数。
7.根据权利要求6所述的用于航拍视频数据的语义分割方法,其特征在于,将直方图平均差与设定的阈值Tshot进行比较的计算公式为:
Figure FDA0002830944620000021
其中,i和i+1表示两个连续的帧。
8.根据权利要求2所述的用于航拍视频数据的语义分割方法,其特征在于,通过基于全卷积网络的语义分割算法对所述关键帧数据集进行语义分割中采用的是U-Net模型,所述U-Net模型包括收缩路径和对称的扩张路径,通过收缩路径对关键帧中的特征进行卷积运算,再通过Relu激活函数来提取特征,在提取的特征中应用maxpool函数识别出相关特征,在所述U-Net模型的最后一层实用Softmax激活,得到每个类的像素概率。
9.根据权利要求8所述的用于航拍视频数据的语义分割方法,其特征在于,所述U-Net模型所处理的关键帧所针对的是256*256的彩色图像,并在所述U-Net模型的每层同时予以填充、保留针对关键帧特征最相关的特性。
10.一种计算机程序产品,包括计算机可读代码,当所述计算机可读代码由计算机设备执行时,导致所述计算机设备执行如权利要求1-9中任一项所述的方法。
CN202011459565.8A 2020-12-11 2020-12-11 用于航拍视频数据的语义分割方法 Pending CN112613516A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011459565.8A CN112613516A (zh) 2020-12-11 2020-12-11 用于航拍视频数据的语义分割方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011459565.8A CN112613516A (zh) 2020-12-11 2020-12-11 用于航拍视频数据的语义分割方法

Publications (1)

Publication Number Publication Date
CN112613516A true CN112613516A (zh) 2021-04-06

Family

ID=75233598

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011459565.8A Pending CN112613516A (zh) 2020-12-11 2020-12-11 用于航拍视频数据的语义分割方法

Country Status (1)

Country Link
CN (1) CN112613516A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023000159A1 (zh) * 2021-07-20 2023-01-26 海南长光卫星信息技术有限公司 高分辨率遥感影像半监督分类方法、装置、设备及介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107590442A (zh) * 2017-08-22 2018-01-16 华中科技大学 一种基于卷积神经网络的视频语义场景分割方法
CN108182421A (zh) * 2018-01-24 2018-06-19 北京影谱科技股份有限公司 视频分割方法和装置
CN109753913A (zh) * 2018-12-28 2019-05-14 东南大学 计算高效的多模式视频语义分割方法
CN109919044A (zh) * 2019-02-18 2019-06-21 清华大学 基于预测进行特征传播的视频语义分割方法及装置
CN110782469A (zh) * 2019-10-25 2020-02-11 北京达佳互联信息技术有限公司 一种视频帧图像分割方法、装置、电子设备及存储介质
CN110852961A (zh) * 2019-10-28 2020-02-28 北京影谱科技股份有限公司 一种基于卷积神经网络的实时视频去噪方法及***

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107590442A (zh) * 2017-08-22 2018-01-16 华中科技大学 一种基于卷积神经网络的视频语义场景分割方法
CN108182421A (zh) * 2018-01-24 2018-06-19 北京影谱科技股份有限公司 视频分割方法和装置
CN109753913A (zh) * 2018-12-28 2019-05-14 东南大学 计算高效的多模式视频语义分割方法
CN109919044A (zh) * 2019-02-18 2019-06-21 清华大学 基于预测进行特征传播的视频语义分割方法及装置
CN110782469A (zh) * 2019-10-25 2020-02-11 北京达佳互联信息技术有限公司 一种视频帧图像分割方法、装置、电子设备及存储介质
CN110852961A (zh) * 2019-10-28 2020-02-28 北京影谱科技股份有限公司 一种基于卷积神经网络的实时视频去噪方法及***

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
GIRISHA, S.,等: ""Semantic segmentation of UAV aerial videos using convolutional neural networks"", 《IEEE SECOND INTERNATIONAL CONFERENCE ON ARTIFICIAL INTELLIGENCE AND KNOWLEDGE ENGINEERING》, pages 21 - 27 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023000159A1 (zh) * 2021-07-20 2023-01-26 海南长光卫星信息技术有限公司 高分辨率遥感影像半监督分类方法、装置、设备及介质

Similar Documents

Publication Publication Date Title
CN111010590B (zh) 一种视频裁剪方法及装置
CN107274433B (zh) 基于深度学习的目标跟踪方法、装置及存储介质
JP6474854B2 (ja) 背景モデルを更新するための方法及び装置
AU2009243442B2 (en) Detection of abnormal behaviour in video objects
US10068137B2 (en) Method and device for automatic detection and tracking of one or multiple objects of interest in a video
CN110751674A (zh) 多目标跟踪方法及相应视频分析***
CN111311475A (zh) 检测模型训练方法、装置、存储介质和计算机设备
Girisha et al. Semantic segmentation of UAV aerial videos using convolutional neural networks
CN110287877B (zh) 视频目标的处理方法及装置
CN113191180B (zh) 目标跟踪方法、装置、电子设备及存储介质
CN109859250B (zh) 一种航空红外视频多目标检测与跟踪方法及装置
CN113205138B (zh) 人脸人体匹配方法、设备和存储介质
CN111753590A (zh) 一种行为识别方法、装置及电子设备
CN115511920A (zh) 一种基于DeepSort和DeepEMD的检测跟踪方法和***
CN115761655A (zh) 一种目标跟踪方法及装置
Mishra Video shot boundary detection using hybrid dual tree complex wavelet transform with Walsh Hadamard transform
CN110969645A (zh) 面向拥挤场景的无监督异常轨迹检测方法和装置
CN112613516A (zh) 用于航拍视频数据的语义分割方法
JP2014110020A (ja) 画像処理装置、画像処理方法および画像処理プログラム
CN115187884A (zh) 一种高空抛物识别方法、装置、电子设备及存储介质
KR20170095599A (ko) 동영상 검색 시스템 및 그 방법
CN110956649A (zh) 多目标三维物体跟踪的方法和装置
CN113762027B (zh) 一种异常行为的识别方法、装置、设备及存储介质
CN112686828B (zh) 视频去噪方法、装置、设备及存储介质
CN115393755A (zh) 视觉目标跟踪方法、装置、设备以及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination