CN110942002B - 一种基于旋转不变感知哈希的无人机航拍视频帧定位方法 - Google Patents

一种基于旋转不变感知哈希的无人机航拍视频帧定位方法 Download PDF

Info

Publication number
CN110942002B
CN110942002B CN201911129923.6A CN201911129923A CN110942002B CN 110942002 B CN110942002 B CN 110942002B CN 201911129923 A CN201911129923 A CN 201911129923A CN 110942002 B CN110942002 B CN 110942002B
Authority
CN
China
Prior art keywords
sequence
rotation
hash
unmanned aerial
aerial vehicle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911129923.6A
Other languages
English (en)
Other versions
CN110942002A (zh
Inventor
印鉴
陈智聪
陈殷齐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sun Yat Sen University
Original Assignee
Sun Yat Sen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sun Yat Sen University filed Critical Sun Yat Sen University
Priority to CN201911129923.6A priority Critical patent/CN110942002B/zh
Publication of CN110942002A publication Critical patent/CN110942002A/zh
Application granted granted Critical
Publication of CN110942002B publication Critical patent/CN110942002B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • G06V20/13Satellite images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/80Analysis of captured images to determine intrinsic or extrinsic camera parameters, i.e. camera calibration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Astronomy & Astrophysics (AREA)
  • Remote Sensing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明提供一种基于旋转不变感知哈希的无人机航拍视频帧定位方法,该方法有一定的平移不变形(pooling原理);编码时使用差分编码,使得光照天气条件无关;再加上起点无关的圆周编码顺序使具有旋转不变性;圆周编码顺序时不编码边角部分,因为边角部分会因为视角不同差异大,从而排除了旋转时边角的其他景物不同影响。通过在真实无人机视频上的实验表明,本发明对比之前的感知哈希方法,成功解决了传统感知哈希不具有旋转不变的特性。

Description

一种基于旋转不变感知哈希的无人机航拍视频帧定位方法
技术领域
本发明涉及视频图像处理算法领域,更具体地,涉及一种基于旋转不变感知哈希的无人机航拍视频帧定位方法。
背景技术
近年来,随着无人机的普及,利用无人机航拍视频来完成一些任务已经越来越受到工业界的关注。但在无人机河道异常巡航的任务中,需要对同一条河道的不同时间段无人机视频进行逐帧的定位,即找到一个视频上的一帧在另一个视频上同一个位置的一帧。这样的任务仍未有相关的研究。
比较相关的技术有基于深度学习的图片检索,但是不符合无人机视频帧定位的应用,因为深度学习的图片检索旨在找到图片之间的语义匹配,而我们一整段视频的语义信息基本相同并且深度学习耗时过大,而一个短视频具有的帧数巨大。所以我们采用感知哈希(Perceptual Hashing)这样一种简单又快速的相似图片搜索技术。感知哈希是多媒体数据集到感知摘要集的一类单向映射,即将具有相同感知内容的多媒体数字表示唯一地映射为一段数字摘要,并满足感知鲁棒性和安全性。感知哈希为多媒体内容识别、检索、认证等信息服务方式提供安全可靠的技术支撑。
哈希函数(Hash Functions)是不可逆的提取原始数据的数字摘要(Digest),具有单向性、脆弱性等特点,可保证原始数据的唯一性与不可篡改性。各种哈希函数已在信息检索与管理、数据认证等领域中得到了成功的应用。但是,传统哈希函数已无法满足不同时间的俩段无人机航拍视频的帧定位功能,因为即使在同一个地方不同时间拍摄出来的视频他们之间存在一些镜头旋转的差异,而这样的细微差异使得哈希映射不正确(同一张图片旋转哈希值完全不相同)。
发明内容
本发明提供一种基于旋转不变感知哈希的无人机航拍视频帧定位方法,该方法实现了排除了旋转时边角的其他景物不同影响。
为了达到上述技术效果,本发明的技术方案如下:
一种基于旋转不变感知哈希的无人机航拍视频帧定位方法,包括以下步骤:
S1:对需要定位的视频帧-参考帧和需要检索的视频帧-目标帧进行旋转不变的哈希值计算;
S2:将参考帧和目标帧与另一个时间的无人机视频所有帧对比哈希值差异找到差异最小的一帧。
进一步地,所述步骤S1的具体过程是:
S11:将参考帧和目标帧进行图片缩放;
S12:将缩放后的图片进行灰度图转换;
S13:将灰度图进行获取哈希值的圆周编码顺序;
S14:对S13处理后的图片进行获取哈希值的二进制形式进而获取旋转不变的哈希值;
S15:根据S14的结果得出信息指纹。
进一步地,所述步骤S11的过程是:
把图片统一缩放到8*8,共64个像素的图片,这样操作具有一定的平移不变性,当平移量在缩放范围时,缩略图基本会一致。
进一步地,所述步骤S12的过程是:把缩放后的图片转化为256阶的灰度图。
进一步地,所述步骤S13的过程是:
根据圆周的方式编码哈希使其有旋转不变性,根据图片的长H,取长度为r(1~H/2)作为圆周的半径,每一个半径长度用极坐标的方式x=rcosθ+x0,y=rsinθ+y0,计算每一个圆周的坐标序列,其中θ为按0~360°的各个取值,(x0,y0)为缩放图片的中心,这样就可以得到r=1时的一个圆周序列(x1 1,y1 1)(x1 2,y1 2)(x1 3,y1 3).....其中,xr i表示半径为r的圆周下按照0°,1°,2°...~360°的度数计算出来的第i个不重复的坐标索引,那么就可以得到S1=I(x1 1,y1 1),I(x1 2,y1 2),I(x1 3,y1 3).....一个圆周坐标索引得到的像素值序列,可以得到r个这样的序列记为S(第r个序列为Sr),这样的编码顺序还会自动把边角影响去除,因为实际的拍摄视频中带有旋转差异的俩帧他们在边角部分会完全不一样。
进一步地,所述步骤S14中获取哈希值的二进制形式的过程是:
采用差分的方式对每一个Sr序列进行编码,遍历灰度图片每一个像素,前一个值大于当前值记录为1,否则为0,最后一个像素值和投一个像素比较,使得它首尾相连,构成圆周,最终获得r个这样的二进制序列记为B,其中第r个序列为Br
进一步地,所述步骤S14中获取获取旋转不变的哈希值的过程是:
把Br做循环移位,把循环移位之后二进制序列值最小的那一个序列作为该圆周的最终序列,最终获得r个这样的与起点无关二进制序列记为Z,其中第r个序列为Zr
进一步地,所述步骤S15的过程是:
按照r从1到H/2的顺序,将Zr组合起来,构成最终的信息指纹X=Z1Z2Z3...ZH/2
进一步地,所述步骤S2的过程是:
对需要对比的参考帧和目标帧的指纹,计算汉明距离,汉明距离越大则说明图片越不一致,反之,汉明距离越小则说明图片越相似,当距离为0时,说明完全相同,在目标帧上所有视频帧都做一次比较,找到汉明距离最小的前20帧,在做进一步的SSIM对比,相似度最高的为所需要的帧。
与现有技术相比,本发明技术方案的有益效果是:
本发明的旋转不变感知哈希通过将图像变换成缩略图,有一定的平移不变形(pooling原理);编码时使用差分编码,使得光照天气条件无关;再加上起点无关的圆周编码顺序使具有旋转不变性;圆周编码顺序时不编码边角部分,因为边角部分会因为视角不同差异大,从而排除了旋转时边角的其他景物不同影响。通过在真实无人机视频上的实验表明,本发明对比之前的感知哈希方法,成功解决了传统感知哈希不具有旋转不变的特性。
附图说明
图1为本发明算法旋转不变编码方式示意图;
图2为本发明的旋转不变感知哈希的计算示意图;
图3为本发明的视频帧定位应用流程示意图;
图4为经典的Lena图;
图5为实拍视频的帧定位应用结果对比图。
具体实施方式
附图仅用于示例性说明,不能理解为对本专利的限制;
为了更好说明本实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;
对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
下面结合附图和实施例对本发明的技术方案做进一步的说明。
如图1-2所示,一种基于旋转不变感知哈希的无人机航拍视频帧定位方法,包括以下步骤:
S1:对需要定位的视频帧-参考帧和需要检索的视频帧-目标帧进行旋转不变的哈希值计算;
S2:将参考帧和目标帧与另一个时间的无人机视频所有帧对比哈希值差异找到差异最小的一帧。
步骤S1的具体过程是:
S11:将参考帧和目标帧进行图片缩放;
S12:将缩放后的图片进行灰度图转换;
S13:将灰度图进行获取哈希值的圆周编码顺序;
S14:对S13处理后的图片进行获取哈希值的二进制形式进而获取旋转不变的哈希值;
S15:根据S14的结果得出信息指纹。
步骤S11的过程是:
把图片统一缩放到8*8,共64个像素的图片,这样操作具有一定的平移不变性,当平移量在缩放范围时,缩略图基本会一致。
步骤S12的过程是:把缩放后的图片转化为256阶的灰度图。
如图3所示,步骤S13的过程是:
根据圆周的方式编码哈希使其有旋转不变性,根据图片的长H,取长度为r(1~H/2)作为圆周的半径,每一个半径长度用极坐标的方式x=rcosθ+x0,y=rsinθ+y0,计算每一个圆周的坐标序列,其中θ为按0~360°的各个取值,(x0,y0)为缩放图片的中心,这样就可以得到r=1时的一个圆周序列(x1 1,y1 1)(x1 2,y1 2)(x1 3,y1 3).....其中,xr i表示半径为r的圆周下按照0°,1°,2°...~360°的度数计算出来的第i个不重复的坐标索引,那么就可以得到S1=I(x1 1,y1 1),I(x1 2,y1 2),I(x1 3,y1 3).....一个圆周坐标索引得到的像素值序列,可以得到r个这样的序列记为S(第r个序列为Sr),这样的编码顺序还会自动把边角影响去除,因为实际的拍摄视频中带有旋转差异的俩帧他们在边角部分会完全不一样。
步骤S14中获取哈希值的二进制形式的过程是:
采用差分的方式对每一个Sr序列进行编码,遍历灰度图片每一个像素,前一个值大于当前值记录为1,否则为0,最后一个像素值和投一个像素比较,使得它首尾相连,构成圆周,最终获得r个这样的二进制序列记为B,其中第r个序列为Br
步骤S14中获取获取旋转不变的哈希值的过程是:
把Br做循环移位,把循环移位之后二进制序列值最小的那一个序列作为该圆周的最终序列,最终获得r个这样的与起点无关二进制序列记为Z,其中第r个序列为Zr
步骤S15的过程是:
按照r从1到H/2的顺序,将Zr组合起来,构成最终的信息指纹X=Z1Z2Z3...ZH/2
步骤S2的过程是:
对需要对比的参考帧和目标帧的指纹,计算汉明距离,汉明距离越大则说明图片越不一致,反之,汉明距离越小则说明图片越相似,当距离为0时,说明完全相同,在目标帧上所有视频帧都做一次比较,找到汉明距离最小的前20帧,在做进一步的SSIM对比,相似度最高的为所需要的帧。
实验选定了经典的Lena图和对Lena图做旋转之后的图像(如图4),与传统的哈希phash方法作比较。对比结果如表1。
表1Lena图做旋转之后的图像,与传统的哈希phash方法作比较结果
实验表明我们的旋转不变哈希在Lena图中不论旋转不旋转,他的哈希值都比传统的方法中哈希值更鲁棒。
采用实际的无人机航拍视频。随机选定一个视频帧,在另一个时间段的视频中使用传统的感知哈希phash等方法。全部过程和图3一样。因为没有ground true,我们对最终搜索出来的帧做主观对比。图5为实拍视频的帧定位应用结果对比。
从结果可以看出我们的发明相较于以前的哈希方法有较大的提升,使得带有旋转的帧也能被准确定位。图5中由于整个视频不存在相同的视角帧,所以phash搜索出来的结果十分差。但在本申请方法中准确找到了。
相同或相似的标号对应相同或相似的部件;
附图中描述位置关系的用于仅用于示例性说明,不能理解为对本专利的限制;
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。

Claims (4)

1.一种基于旋转不变感知哈希的无人机航拍视频帧定位方法,其特征在于,包括以下步骤:
S1:对需要定位的视频帧-参考帧和需要检索的视频帧-目标帧进行旋转不变的哈希值计算;
所述步骤S1的具体过程是:
S11:将参考帧和目标帧进行图片缩放;
S12:将缩放后的图片进行灰度图转换;
S13:将灰度图进行获取哈希值的圆周编码顺序;所述步骤S13的过程是:
根据圆周的方式编码哈希使其有旋转不变性,根据图片的长H,取长度为r(1~H/2)作为圆周的半径,每一个半径长度用极坐标的方式,/>,计算每一个圆周的坐标序列,其中/>为按/>的各个取值,/>为缩放图片的中心,这样就得到r = 1时的一个圆周序列/>其中,/>表示半径为r的圆周下按照/>的度数计算出来的第i个不重复的坐标索引,那么就得到/>一个圆周坐标索引得到的像素值序列,得到r个这样的序列记为/>,第r个序列为/>,这样的编码顺序还会自动把边角影响去除,因为实际的拍摄视频中带有旋转差异的俩帧他们在边角部分会完全不一样;
S14:对S13处理后的图片进行获取哈希值的二进制形式进而获取旋转不变的哈希值;
所述步骤S14中获取哈希值的二进制形式的过程是:
采用差分的方式对每一个序列进行编码,遍历灰度图片每一个像素,前一个值大于当前值记录为1,否则为0,最后一个像素值和投一个像素比较,使得它首尾相连,构成圆周,最终获得r个这样的二进制序列记为/>,其中第r个序列为/>
所述步骤S14中获取旋转不变的哈希值的过程是:
做循环移位,把循环移位之后二进制序列值最小的那一个序列作为该圆周的最终序列,最终获得r个这样的与起点无关二进制序列记为/>,其中第r个序列为/>
S15:根据S14的结果得出信息指纹;
所述步骤S15的过程是:
按照r从1到H/2的顺序,将组合起来,构成最终的信息指纹/>
S2:将参考帧和目标帧与另一个时间的无人机视频所有帧对比哈希值差异找到差异最小的一帧。
2.根据权利要求1所述的基于旋转不变感知哈希的无人机航拍视频帧定位方法,其特征在于,所述步骤S11的过程是:
把图片统一缩放到8*8,共64个像素的图片,这样操作具有一定的平移不变性,当平移量在缩放范围时,缩略图基本会一致。
3.根据权利要求2所述的基于旋转不变感知哈希的无人机航拍视频帧定位方法,其特征在于,所述步骤S12的过程是:把缩放后的图片转化为256阶的灰度图。
4.根据权利要求3所述的基于旋转不变感知哈希的无人机航拍视频帧定位方法,其特征在于,所述步骤S2的过程是:
对需要对比的参考帧和目标帧的指纹,计算汉明距离,汉明距离越大则说明图片越不一致,反之,汉明距离越小则说明图片越相似,当距离为0时,说明完全相同,在目标帧上所有视频帧都做一次比较,找到汉明距离最小的前20帧,在做进一步的SSIM对比,相似度最高的为所需要的帧。
CN201911129923.6A 2019-11-18 2019-11-18 一种基于旋转不变感知哈希的无人机航拍视频帧定位方法 Active CN110942002B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911129923.6A CN110942002B (zh) 2019-11-18 2019-11-18 一种基于旋转不变感知哈希的无人机航拍视频帧定位方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911129923.6A CN110942002B (zh) 2019-11-18 2019-11-18 一种基于旋转不变感知哈希的无人机航拍视频帧定位方法

Publications (2)

Publication Number Publication Date
CN110942002A CN110942002A (zh) 2020-03-31
CN110942002B true CN110942002B (zh) 2023-11-07

Family

ID=69907730

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911129923.6A Active CN110942002B (zh) 2019-11-18 2019-11-18 一种基于旋转不变感知哈希的无人机航拍视频帧定位方法

Country Status (1)

Country Link
CN (1) CN110942002B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112434185B (zh) * 2020-10-26 2023-07-14 国家广播电视总局广播电视规划院 一种查找相似视频片段的方法、***、服务器及存储介质
CN113704532B (zh) * 2020-11-25 2024-04-26 天翼数字生活科技有限公司 一种提升图片检索召回率的方法和***
CN112698661B (zh) * 2021-03-22 2021-08-24 成都睿铂科技有限责任公司 一种飞行器的航测数据采集方法、装置、***及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105069042A (zh) * 2015-07-23 2015-11-18 北京航空航天大学 基于内容的无人机侦察图像数据检索方法
CN106126585A (zh) * 2016-06-20 2016-11-16 北京航空航天大学 基于质量分级与感知哈希特征组合的无人机图像检索方法
CN107040790A (zh) * 2017-04-01 2017-08-11 华南理工大学 一种基于多粒度哈希的视频内容认证和篡改定位方法
CN109918537A (zh) * 2019-01-18 2019-06-21 杭州电子科技大学 一种基于HBase的船舶监控视频内容的快速检索方法
CN110427895A (zh) * 2019-08-06 2019-11-08 李震 一种基于计算机视觉的视频内容相似度判别方法及***

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105069042A (zh) * 2015-07-23 2015-11-18 北京航空航天大学 基于内容的无人机侦察图像数据检索方法
CN106126585A (zh) * 2016-06-20 2016-11-16 北京航空航天大学 基于质量分级与感知哈希特征组合的无人机图像检索方法
CN107040790A (zh) * 2017-04-01 2017-08-11 华南理工大学 一种基于多粒度哈希的视频内容认证和篡改定位方法
CN109918537A (zh) * 2019-01-18 2019-06-21 杭州电子科技大学 一种基于HBase的船舶监控视频内容的快速检索方法
CN110427895A (zh) * 2019-08-06 2019-11-08 李震 一种基于计算机视觉的视频内容相似度判别方法及***

Also Published As

Publication number Publication date
CN110942002A (zh) 2020-03-31

Similar Documents

Publication Publication Date Title
Cao et al. Coverless information hiding based on the molecular structure images of material.
CN110942002B (zh) 一种基于旋转不变感知哈希的无人机航拍视频帧定位方法
Lee et al. Robust video fingerprinting for content-based video identification
JP5175854B2 (ja) 画像認識のための画像記述子
Ardizzone et al. Detecting multiple copies in tampered images
Lei et al. Video sequence matching based on the invariance of color correlation
Qu et al. A convolutive mixing model for shifted double JPEG compression with application to passive image authentication
CN103945228B (zh) 基于时空关联性的视频帧内copy‑move篡改检测方法
WO2013068638A2 (en) Methods and apparatuses for mobile visual search
Kim et al. Adaptive weighted fusion with new spatial and temporal fingerprints for improved video copy detection
Sarkar et al. Video fingerprinting: features for duplicate and similar video detection and query-based video retrieval
CN114640881A (zh) 视频帧对齐方法、装置、终端设备及计算机可读存储介质
CN108038488B (zh) 基于sift和lbp混合的鲁棒性图像哈希方法
CN117251598A (zh) 视频检索方法
Brasnett et al. Recent developments on standardisation of MPEG-7 Visual Signature Tools
Himeur et al. Joint color and texture descriptor using ring decomposition for robust video copy detection in large databases
Bhatnagar et al. Reversible Data Hiding scheme for color images based on skewed histograms and cross-channel correlation
Wang et al. Spatial descriptor embedding for near-duplicate image retrieval
CN106952211B (zh) 基于特征点投影的紧凑型图像哈希方法
Nie et al. Key-frame based robust video hashing using isometric feature mapping
KR101367821B1 (ko) 계층적 영상블록의 대칭정보를 이용한 비디오 식별 방법 및 장치
Hebbar et al. A deep learning framework with transfer learning approach for image forgery localization
JP2018194956A (ja) 画像認識装置、方法、及びプログラム
Mengyang et al. Content-based video copy detection using binary object fingerprints
Iida et al. Robust image identification for double-compressed and resized JPEG images

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant