CN102693299B - 一种并行视频拷贝检测***和方法 - Google Patents
一种并行视频拷贝检测***和方法 Download PDFInfo
- Publication number
- CN102693299B CN102693299B CN201210153893.4A CN201210153893A CN102693299B CN 102693299 B CN102693299 B CN 102693299B CN 201210153893 A CN201210153893 A CN 201210153893A CN 102693299 B CN102693299 B CN 102693299B
- Authority
- CN
- China
- Prior art keywords
- video
- frame
- parallel
- feature
- inquiry
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种并行视频拷贝检测方法和***,包括如下步骤:1.采用并行的方法对查询视频和参考视频选取关键帧,并对这些关键帧提取MIFT特征;2.采用并行的分级聚类方法对所提取的参考视频的特征数据进行聚类;3.根据聚类的结果采用并行量化方法对查询视频和参考视频的特征进行量化;4.对参考视频的量化数据建立索引;5.采用并行的方法检索,利用查询视频的量化数据在索引中初步查找得到备选视频,然后计算空间一致性和时间一致性最终确定拷贝的视频。本发明的***在基于视觉词汇包模型(BOF)的快速检索基础上采用了并行机制,大大地提高了***的检测效率。
Description
技术领域
本发明属于视频拷贝检测技术领域,涉及一种并行视频拷贝检测***和方法。
背景技术
近年来,计算机技术和通信技术的快速发展极大地方便了数字视频信息的传输、存储和复制,使得视频信息的数量飞速增长。这对视频内容的管理和检索的方案是一个很大的挑战。此外,一个复制的视频可能不是对原始视频的精确拷贝而是一个对原始视频经过改造了的版本。视频拷贝检测的任务是在一个参考视频库中查找并确定查询视频被复制或修改的内容片段。视频拷贝检测技术在视觉信息处理中有着重要的用途,如发现多媒体内容的拷贝片段、通过样本视频检索相关的视频、商业电影或电视节目的监测等。
视频搜索特别是视频拷贝检测是一个非常活跃的研究领域。现有的文献中Josef Sivic and Andrew Zisserman,”Efficient Visual Search of Videos Cast asText Retrieval”,IEEE Trans.Pattern Analysis and Machine Intelligence,vol.31,no.4,pp.591-606,April 2009.、HervéJégou,Matthijs Douze,CordeliaSchmid,”Improving Bag-of-Features for Large Scale Image Search”,Int JComput Vis vol.87,pp.316-336,2010,对视频拷贝检测技术的研究做出了很大的贡献。但是这些方法在大型数据库上检索结果不够精确、运行效率不高,因此这些视频检索和视频拷贝检测技术没有得到广泛应用。尽管研究人员提出了多种视频拷贝检测方法,但由于视频格式和内容的多样性,如何快速有效地检测视频拷贝依然是一个未解决的问题。并行计算机提供了良好的运行环境,可以在大型数据库上高效地执行检索算法。最近,人们越来越关注并行检索算法。
发明内容
本发明解决的问题在于提供一种并行视频拷贝检测***和方法,能够在海量的视频数据库中快速、精确的确定用户所关心视频是否是数据库中视频的拷贝的检索方法和***。
本发明是通过以下技术方案来实现:
一种并行视频拷贝检测***,包括离线子***和在线子***:
离线子***的处理对象是参考视频库,对参考视频库中的视频进行关键帧提取、图像特征提取、特征矢量的聚类分析、特征矢量到视觉词汇的量化并生成视觉词汇表和关于特征的倒排索引表以供在线子***的查询;
在线子***完成对查询视频在参考视频库中的查询;在线子***对查询视频进行关键帧提取、图像特征提取、根据参考视频库生成的视觉词汇表对在线***当前视频的所有关键帧中的特征量化成视觉词汇,然后结合参考视频库的倒排索引表以及当前视频所有关键帧中的视觉词汇进行候选视频的查找和搜索,接下来检查几何一致性和时间一致性,对检索得出的匹配分数进行融合、规一化处理并得出最终检索结果。
所述的离线子***包括特征提取模块和索引建立模块,征提取模块对参考视频库中的视频进行关键帧提取,并对关键帧进行图像特征提取,提取得到特征矢量;
索引建立模块对特征矢量进行特征矢量的聚类分析,并根据聚类结果对特征矢量到视觉词汇的量化,生成视觉词汇表和关于特征的倒排索引表。
所述的在线子***包括特征提取模块、索引建立模块和检索模块;
征提取模块对查询视频进行关键帧提取,并对关键帧进行图像特征提取,提取得到特征矢量;
索引建立模块根据参考视频库生成的视觉词汇表对在线***当前视频的所有关键帧中的特征量化成视觉词汇;
检索模块在将索引建立模块建立的基础上,结合参考视频库的倒排索引表以及当前视频所有关键帧中的视觉词汇进行候选视频的查找和搜索,接下来检查几何一致性和时间一致性,对检索得出的匹配分数进行融合、规一化处理并得出最终检索结果。
一种并行视频拷贝检测方法,包括以下步骤:
1)采用并行的方法,在线子***和离线子***分别对查询视频和参考视频选取关键帧,并对关键帧提取图像特征;
2)采用并行的分级聚类方法,离线子***对所提取的参考视频的特征数据进行聚类;
3)离线子***根据聚类的结果采用并行量化方法,对特征矢量到视觉词汇的量化,生成视觉词汇表和关于特征的倒排索引表;
在线子***根据参考视频库生成的视觉词汇表采用并行量化方法,对在线***当前视频的所有关键帧中的特征量化成视觉词汇;
4)在线子***采用并行的方法检索,利用参考视频库的倒排索引表以及当前视频所有关键帧中的视觉词汇进行候选视频的查找和搜索,得到备选视频,然后计算空间一致性和时间一致性,对检索得出的匹配分数进行融合、规一化处理并得出最终检索结果。
所述对关键帧提取图形特征为:采用单程序多数据流的方法,把视频数据n分成p等份数据块,每个CPU在一个数据块上运行一个独立的程序进行关键帧选取、MIFT特征提取及MIFT特征描述,所生成的MIFT特征存放到指定的共享文件夹中。
所述聚类包括下列步骤:
在并行框架下对特征数据进行分级采样,并应用分级量化方法把下级采样数据量化到当前级的所有中心上:在分级比较的量化过程中根据SPMD并行原理,把需要量化的数据和计算机任务进行划分,使多个CPU并行执行量化程序,并且每一个CPU都在不同的数据上运行相同的分级比较量化代码;
在并行框架下应用K-均值聚类算法对当前级量化后的分组数据分别进行并行聚类:应用多线程并行对下级分组采用K-均值聚类,把需要聚类的分组数据和计算机任务进行划分,使多个CPU并行执行聚类程序,并且每一个CPU都在不同的分组数据上运行相同的聚类代码,所生成的类中心按顺序保存到共享内存中。
所述的步骤3)的并行量化方法是应用多线程并行的方法在多个CPU上同时运行相同的分级量化代码;
所述倒排索引表的生成为:
根据视觉词汇的量化的结果,对于量化结果中的的n个视觉词汇中的一个视觉词汇wk,在m个视频帧d1…dm中的倒排索引表表示为:
wk d1[f1]…dm[fm] (1)
其中fm表示视觉词汇信息。
所述备选视频的检索是,利用查询视频的量化数据在索引中初步查找得到备选视频,把需要检索的数据和计算机任务进行划分,使多个CPU并行执行检索程序,并且每一个CPU都在不同的数据上运行相同的检索代码,然后计算空间一致性和时间一致性最终确定拷贝的视频,每个进程包括下列步骤:
基于词频/反词频加权的BOF投票检索:在计算查询帧图像与参考帧图像之间的相似性时应用BOF投票方法,并应用TF-IDF对所计算出的分值进行加权处理;
几何一致性检查:查询帧图像与参考帧图像在局部具有空间几何一致性的属性,应用这一属性对查询的帧图像结果进行筛选;
空间一致性检查:查询视频与参考视频在时间上具有一致性的属性,应用这一属性对查询的视频结果进行筛选。
所述的基于词频/反词频加权的BOF投票检索为:
首先对查询视频的特征进行量化,并计算每帧的TIF-IDF权值:
q:Rd→[1,k]
(2)
wi=tfi·idfi (5)
其中,yl,l=1,...,m1为给定的查询视频帧的第l个特征,xi,j,i=1,...,m2为参考视频库中第j帧中第i个特征,fij是第i个视觉词汇在第j个视频帧上出现的频率,ni是包含第i个视觉词汇的参考视频帧的总数,N是总的参考视频数。q:表示量化,Rd表示实数空间中的d维数据,tfi表示词频率因子、idfi表示逆词频率因子。
然后计算相似性:
所述的几何一致性的计算为:
g=(β1gx+β2gy+β3ga+β4gs)
(8)
β1+β2+β3+β4=1
其中,h为帧图像的高,w为帧图像的宽,(x1,y1)、(x2,y2)分别是参考视频帧和查询视频帧中特征的坐标,s1、s2分别是参考视频帧和查询视频帧中特征的尺度,a1、a2分别是参考视频帧和查询视频帧中特征的方向;β1-β4是0至1之间的一个实数,并且β1+β2+β3+β4=1,gx为x轴上的偏移影响因子,gy为y轴上的偏移影响因子,gs为尺度偏移影响因子,gs为方向偏移影响因子,fg表示用式(8)加权后的相似性。
规一化的计算为:
其中,sj为匹配分数,sj *为规一化后的匹配分数。
空间一致性:对每个候选匹配视频都计算匹配帧的时间差的统计直方图,选择直方图最大的视频作为最佳视频。
与现有技术相比,本发明具有以下有益的技术效果:
对视频特征提取、索引建立及视频检索三大模块实行并行计算,极大地提高了***的运行效率;
采用并行聚类方法使本发明的***能够有效地对大型数据集进行快速聚类,可使本***能够用在更大的视频数据库中;
采用基于TF-IDF加权的BOF投票检索方法、几何一致性检查和空间一致性检查这三项技术很好地提高了拷贝检测的精确度。
本发明的视频拷贝检测***检索结果精确、运行速度快,可以在大型视频数据库中快速、精确地确定用户所关心视频是否是数据库中视频的拷贝。
附图说明
图1为本发明的***框架图;
图2为本发明的并行特征提取模块示例图;
图3为本发明的并行量化流程示例图;
图4为本发明的并行聚类流程示例图;
图5为本发明的时间一致性检查示例图;
图6为本发明的并行检索模块示例图;
图7为本发明的实验结果。
具体实施方式
下面结合具体的实施例对本发明做进一步的详细说明,所述是对本发明的解释而不是限定。
如图1所示的并行视频拷贝检测的***框架图,并行视频拷贝检测***分为两个子***:离线子***及在线子***。离线子***的处理对象是目标视频库,产生在线子***查询时所需要的倒排索引表,在线子***主要是完成对查询视频在目标视频库中的查询过程。
离线子***的处理对象是参考视频库,对参考视频库中的视频进行关键帧提取、图像特征提取、特征矢量的聚类分析、特征矢量到视觉词汇的量化并生成视觉词汇表和关于特征的倒排索引表以供在线子***的查询。
在线子***完成对查询视频在参考视频库中的查询;在线子***对查询视频进行关键帧提取、图像特征提取、根据参考视频库生成的视觉词汇表对在线***当前视频的所有关键帧中的特征量化成视觉词汇,然后结合参考视频库的倒排索引表以及当前视频所有关键帧中的视觉词汇进行候选视频的查找和搜索,接下来检查几何一致性和时间一致性,对检索得出的匹配分数进行融合、规一化处理并得出最终检索结果。
在图1所示的***框架图中,下侧虚线框中的模块为离线子***的各部分模块,上侧虚线框中的模块为在线子***各部分模块。
按照功能划分,***可以划分为三个功能模块,即特征提取模块、索引建立模块和检索模块。
离线子***包括特征提取模块和索引建立模块,征提取模块对参考视频库中的视频进行关键帧提取,并对关键帧进行图像特征提取,提取得到特征矢量;
索引建立模块对特征矢量进行特征矢量的聚类分析,并根据聚类结果对特征矢量到视觉词汇的量化,生成视觉词汇表和关于特征的倒排索引表。
在线子***包括特征提取模块、索引建立模块和检索模块;
征提取模块对查询视频进行关键帧提取,并对关键帧进行图像特征提取,提取得到特征矢量;
索引建立模块根据参考视频库生成的视觉词汇表对在线***当前视频的所有关键帧中的特征量化成视觉词汇;
检索模块在将索引建立模块建立的基础上,结合参考视频库的倒排索引表以及当前视频所有关键帧中的视觉词汇进行候选视频的查找和搜索,接下来检查几何一致性和时间一致性,对检索得出的匹配分数进行融合、规一化处理并得出最终检索结果。
基于上述***的并行视频拷贝检测方法,包括以下步骤:
1)采用并行的方法,在线子***和离线子***分别对查询视频和参考视频选取关键帧,并对关键帧提取图像特征;
2)采用并行的分级聚类方法,离线子***对所提取的参考视频的特征数据进行聚类;
3)离线子***根据聚类的结果采用并行量化方法,对特征矢量到视觉词汇的量化,生成视觉词汇表和关于特征的倒排索引表;
在线子***根据参考视频库生成的视觉词汇表采用并行量化方法,对在线***当前视频的所有关键帧中的特征量化成视觉词汇;
4)在线子***采用并行的方法检索,利用参考视频库的倒排索引表以及当前视频所有关键帧中的视觉词汇进行候选视频的查找和搜索,得到备选视频,然后计算空间一致性和时间一致性,对检索得出的匹配分数进行融合、规一化处理并得出最终检索结果。
从功能执行上讲,首先执行特征提取模块,包括关键帧提取、图像特征提取模块。采用并行的方法对查询视频和参考视频选取关键帧,并对这些关键帧提取图形特征,具体是提取关键帧的MIFT特征(该特征是一种图形特征的提取方法)。
具体的MIFT特征的提取采用单程序多数据流(SPMD)的方法,把视频数据n分成p等份数据块,每个CPU在一个数据块上运行一个独立的程序进行关键帧选取、MIFT特征提取及MIFT特征描述,其方法如图2所示。
接下来执行索引建立模块,包括特征矢量的聚类分析、特征矢量到视觉词汇的量化以及生成倒排索引表。
采用并行的分级聚类方法对所提取的参考视频的特征数据进行聚类,包括下列三个步骤:
1)在SPMD并行框架下对原始特征数据进行分级采样,采样级数由用户的需求决定,采样数据的数据量逐级增加,最后一级数据大小要满足两个条件:一是要大于原始数据的5%,二是要大于总聚类中心数的30倍;
2)在并行框架下应用分级量化方法把下级采样数据量化到当前级的所有中心上。在分级比较的量化过程中根据SPMD并行原理,把需要量化的数据和计算机任务进行划分,使多个CPU并行执行量化程序,并且每一个CPU都在不同的数据上运行相同的分级比较量化代码,其运行如图3所示。
3)在并行框架下应用K-均值聚类算法对当前级量化后的分组数据分别进行并行聚类。应用多线程并行对下级分组采用K-均值聚类。根据SPMD并行原理,把需要聚类的分组数据和计算机任务进行划分,使多个CPU并行执行聚类程序,所生成的类中心按顺序保存到共享内存中,并且每一个CPU都在不同的分组数据上运行相同的聚类代码,其运行如图4所示。
根据聚类的结果采用并行量化方法对所有查询视频和参考视频的特征进行量化,应用多线程并行的方法在多个CPU上同时运行相同的分级量化代码,生成量化表文件。
根据前一步骤的量化结果(词汇表),对于量化表文件中的n个视觉词汇(特征)w1…wn中的一个wk,在m个视频帧d1…dm中的倒排表可以表示为:
wk d1[f1]…dm[fm] (1)
这样n条记录就构成一个完整的倒排表,其中fm表示视觉词汇信息,比如频率、方向、尺度等。一个倒排表实际上就是一个词汇到出现过该词汇的所有视频帧位置的映射。
最后执行检索模块,采用并行的方法检索。在计算查询帧图像与参考帧图像之间的相似性时应用BOF投票方法(Josef Sivic and Andrew Zisserman,”Efficient Visual Search of Videos Cast as Text Retrieval”,IEEE Trans.PatternAnalysis and Machine Intelligence,vol.31,no.4,pp.591-606,April 2009),并采用TF-IDF(R.Baeza-Yates and B.Ribeiro-Neto.“Modern Information Retrieval”.ACM Press,ISBN:020139829,1999)对所计算出的分值进行加权处理。利用查询视频的量化数据在索引中初步查找得到备选视频,然后计算空间一致性和时间一致性最终确定拷贝的视频。
具体包括下列步骤:
首先对查询视频的特征进行量化,并计算每帧的TIF-IDF权值:
q:Rd→[1,k]
(2)
wi=tfi·idfi (5)
其中,yl,l=1,...,m1为给定的查询视频帧的第l个特征,xi,j,i=1,...,m2为参考视频库中第j帧中第i个特征,fij是第i个视觉词汇在第j个视频帧上出现的频率,ni是包含第i个视觉词汇的参考视频帧的总数,N是总的参考视频数。q:表示量化,Rd表示实数空间中的d维数据,tfi表示词频率因子、idfi表示逆词频率因子。
然后计算相似性:
其中q:表示量化,δ表示如果q(xi,j),q(yl)相等则为1,否则为0。
接下来计算几何一致性,几何一致性检查是指查询帧图像与参考帧图像在局部具有空间几何一致性的属性,应用这一属性可以对查询的帧图像结果进行筛选。计算方法如下:
g=(β1gx+β2gy+β3ga+β4gs)
(8)
β1+β2+β3+β4=1
其中,h为帧图像的高,w为帧图像的宽,(x1,y1)、(x2,y2)分别是参考视频帧和查询视频帧中特征的坐标,s1、s2分别是参考视频帧和查询视频帧中特征的尺度,a1、a2分别是参考视频帧和查询视频帧中特征的方向,β1-β4是0至1之间的一个实数,并且β1+β2+β3+β4=1,gx为x轴上的偏移影响因子,gy为y轴上的偏移影响因子,gs为尺度偏移影响因子,gs为方向偏移影响因子,fg表示用式(8)加权后的相似性。
接下来计算匹配分值,并对其规一化:
其中,sj为匹配分数,sj *为规一化后的匹配分数。
然后执行空间一致性检查。空间一致性检查是指,查询视频与参考视频如果有拷贝关系,则对应的帧在时间上应该具有一致性,应用这一属性可以对查询的视频结果进行筛选。
其方法如图5所示,对每个候选匹配视频计算匹配帧之间的时间差,也就是用参考视频帧的帧号减去查询帧帧号。其基本原理是真正匹配上的两个视频之间的时间差是变化不大的。
对每个候选匹配视频都计算匹配帧的时间差的统计直方图,一般选择直方图最大的视频作为最佳视频。
最后对检索得出的匹配分数进行融合、规一化处理并得出最终检索结果。如果检索到,这个查询视频就是一个被拷贝过的视频,则返回发生拷贝帧的起始和结束时间。如果没有检索到则这个查询视频是一个原版的视频。
以上检索步骤可以并行执行,根据SPMD并行原理,把须要检索的数据和计算机任务进行划分,使多个CPU并行执行检索程序,并且每一个CPU都在不同的数据上运行相同的检索代码,其方法如图6所示。
具体的在曙光天阔服务器上对TRECVID的视频拷贝检测数据库进行了测试。实验中在TRECVID数据库中选取H个小时的视频组成实验数据库SH,总共建成S50、S100、S200和S400四个实验数据库。每个实验数据库的具体配置的情况如表1所示。
表1.四个实验库的具体情况。
数据库 | 关键帧数 | 特征数 | 特征大小 |
S50 | 42 118 | 16 847 500 | 5.6G |
S100 | 105 530 | 38 212 342 | 11.8G |
S200 | 341 762 | 116 251 837 | 36.8G |
S400 | 672 114 | 268 845 792 | 89.4G |
检测的性能指标如下:
在以上四个数据库中对并行拷贝检测***进行了实验,在同样参数配置的情况下所得出的性能对比如图7所示。在S50、S100、S200和S400四个数据库中,虽然它们的特征大小变化很大,从5.6G到89.4G,但它们的PR曲线图变化并不大,相差不到0.1,这显示出本***具有良好的可扩展性,能够在很大的数据库中检索。本发明拷贝检测***在1.2万个目标视频中检测8千个查询视频,平均一个查询视频的检测时间为6秒。
Claims (7)
1.一种并行视频拷贝检测***,其特征在于,包括离线子***和在线子***:
离线子***的处理对象是参考视频库,对参考视频库中的视频进行关键帧提取、图像特征提取、特征矢量的聚类分析、特征矢量到视觉词汇的量化并生成视觉词汇表和关于特征的倒排索引表以供在线子***的查询;
在线子***完成对查询视频在参考视频库中的查询;在线子***对查询视频进行关键帧提取、图像特征提取、根据参考视频库生成的视觉词汇表对在线***当前视频的所有关键帧中的特征量化成视觉词汇,然后结合参考视频库的倒排索引表以及当前视频所有关键帧中的视觉词汇进行候选视频的查找和搜索,接下来检查几何一致性和时间一致性,对检索得出的匹配分数进行融合、规一化处理并得出最终检索结果;
候选视频的检索是,利用查询视频的量化数据在索引中初步查找得到候选视频,把需要检索的数据和计算机任务进行划分,使多个CPU并行执行检索程序,并且每一个CPU都在不同的数据上运行相同的检索代码,然后计算空间一致性和时间一致性最终确定拷贝的视频,每个进程包括下列步骤:
基于词频/反词频加权的BOF投票检索:在计算查询帧图像与参考帧图像之间的相似性时应用BOF投票方法,并应用TF-IDF对所计算出的分值进行加权处理;
几何一致性检查:查询帧图像与参考帧图像在局部具有空间几何一致性的属性,应用这一属性对查询的帧图像结果进行筛选;
空间一致性检查:查询视频与参考视频在时间上具有一致性的属性,应用这一属性对查询的视频结果进行筛选;
所述的几何一致性的计算为:
g=(β1gx+β2gy+β3ga+β4gs)
(8)
β1+β2+β3+β4=1
其中,h为帧图像的高,w为帧图像的宽,(x1,y1)、(x2,y2)分别是参考视频帧和查询视频帧中特征的坐标,s1、s2分别是参考视频帧和查询视频帧中特征的尺度,a1、a2分别是参考视频帧和查询视频帧中特征的方向;β1-β4是0至1之间的一个实数,并且β1+β2+β3+β4=1,gx为x轴上的偏移影响因子,gy为y轴上的偏移影响因子,gs为尺度偏移影响因子,ga为方向偏移影响因子,fg表示用式(8)加权后的相似性;ftf-idf(xi,j,yl)表示相似性,q:表示量化;δ表示如果q(xi,j),q(yl)相等则为1,否则为0,和是用公式(5)求出的权值;
Wi=tfi·idfi (5)
其中,yl,l=1,...,m1为给定的查询视频帧的第l个特征,xi,j,i=1,...,m2为参考视频库中第j帧中第i个特征,fij是第i个特征所属的视觉词汇在第j个视频帧上出现的频率,ni是包含第i个特征所属的视觉词汇的参考视频帧的总数,N是总的参考视频数;q:表示量化,Rd表示实数空间中的d维数据,tfi表示词频率因子、idfi表示逆词频率因子;
规一化的计算为:
其中,sj为匹配分数,sj*为规一化后的匹配分数;yl,l=1,...,m1为给定的查询视频帧的第l个特征,xi,j,i=1,...,m2为参考视频库中第j帧中第i个特征;
空间一致性:对每个候选匹配视频都计算匹配帧的时间差的统计直方图,选择直方图最大的视频作为最佳视频。
2.如权利要求1所述的并行视频拷贝检测***,其特征在于,所述的离线子***包括特征提取模块和索引建立模块,特征提取模块对参考视频库中的视频进行关键帧提取,并对关键帧进行图像特征提取,提取得到特征矢量;
索引建立模块对特征矢量进行特征矢量的聚类分析,并根据聚类结果对特征矢量到视觉词汇的量化,生成视觉词汇表和关于特征的倒排索引表。
3.如权利要求1所述的并行视频拷贝检测***,其特征在于,所述的在线子***包括特征提取模块、索引建立模块和检索模块;
特征提取模块对查询视频进行关键帧提取,并对关键帧进行图像特征提取,提取得到特征矢量;
索引建立模块根据参考视频库生成的视觉词汇表对在线***当前视频的所有关键帧中的特征量化成视觉词汇;
检索模块在将索引建立模块建立的基础上,结合参考视频库的倒排索引表以及当前视频所有关键帧中的视觉词汇进行候选视频的查找和搜索,接下来检查几何一致性和时间一致性,对检索得出的匹配分数进行融合、规一化处理并得出最终检索结果。
4.一种并行视频拷贝检测方法,其特征在于,包括以下步骤:
1)采用并行的方法,在线子***和离线子***分别对查询视频和参考视频选取关键帧,并对关键帧提取图像特征;
2)采用并行的分级聚类方法,离线子***对所提取的参考视频的特征数据进行聚类;
3)离线子***根据聚类的结果采用并行量化方法,对特征矢量到视觉词汇的量化,生成视觉词汇表和关于特征的倒排索引表;
在线子***根据参考视频库生成的视觉词汇表采用并行量化方法,对在线***当前视频的所有关键帧中的特征量化成视觉词汇;
4)在线子***采用并行的方法检索,利用参考视频库的倒排索引表以及当前视频所有关键帧中的视觉词汇进行候选视频的查找和搜索,得到备选视频,然后计算空间一致性和时间一致性,对检索得出的匹配分数进行融合、规一化处理并得出最终检索结果;
所述备选视频的检索是,利用查询视频的量化数据在索引中初步查找得到备选视频,把需要检索的数据和计算机任务进行划分,使多个CPU并行执行检索程序,并且每一个CPU都在不同的数据上运行相同的检索代码,然后计算空间一致性和时间一致性最终确定拷贝的视频,每个进程包括下列步骤:
基于词频/反词频加权的BOF投票检索:在计算查询帧图像与参考帧图像之间的相似性时应用BOF投票方法,并应用TF-IDF对所计算出的分值进行加权处理;
几何一致性检查:查询帧图像与参考帧图像在局部具有空间几何一致性的属性,应用这一属性对查询的帧图像结果进行筛选;
空间一致性检查:查询视频与参考视频在时间上具有一致性的属性,应用这一属性对查询的视频结果进行筛选;
所述的几何一致性的计算为:
g=(β1gx+β2gy+β3ga+β4gs)
(8)
β1+β2+β3+β4=1
其中,h为帧图像的高,w为帧图像的宽,(x1,y1)、(x2,y2)分别是参考视频帧和查询视频帧中特征的坐标,s1、s2分别是参考视频帧和查询视频帧中特征的尺度,a1、a2分别是参考视频帧和查询视频帧中特征的方向;β1-β4是0至1之间的一个实数,并且β1+β2+β3+β4=1,gx为x轴上的偏移影响因子,gy为y轴上的偏移影响因子,gs为尺度偏移影响因子,ga为方向偏移影响因子,fg表示用式(8)加权后的相似性;
规一化的计算为:
其中,sj为匹配分数,sj*为规一化后的匹配分数;yl,l=1,...,m1为给定的查询视频帧的第l个特征,xi,j,i=1,...,m2为参考视频库中第j帧中第i个特征;
空间一致性:对每个候选匹配视频都计算匹配帧的时间差的统计直方图,选择直方图最大的视频作为最佳视频;
所述的基于词频/反词频加权的BOF投票检索为:
首先对查询视频的特征进行量化,并计算每帧的TIF-IDF权值:
Wi=tfi·idfi (5)
其中,yl,l=1,...,m1为给定的查询视频帧的第l个特征,xi,j,i=1,...,m2为参考视频库中第j帧中第i个特征,fij是第i个特征所属的视觉词汇在第j个视频帧上出现的频率,ni是包含第i特征所属的个视觉词汇的参考视频帧的总数,N是总的参考视频数,q:表示量化,Rd表示实数空间中的d维数据,tfi表示词频率因子、idfi表示逆词频率因子;
然后计算相似性:
其中q:表示量化,量化后q(xi,j),q(yl)∈[1,k],δ表示如果q(xi,j),q(yl)相等则为1,否则为0,和是用公式(5)求出的权值。
5.如权利要求4所述的并行视频拷贝检测方法,其特征在于,所述对关键帧提取图形特征为:采用单程序多数据流的方法,把视频数据n分成p等份数据块,每个CPU在一个数据块上运行一个独立的程序进行关键帧选取、MIFT特征提取及MIFT特征描述,所生成的MIFT特征存放到指定的共享文件夹中。
6.如权利要求4所述的并行视频拷贝检测方法,其特征在于,所述聚类包括下列步骤:
在并行框架下对特征数据进行分级采样,并应用分级量化方法把下级采样数据量化到当前级的所有中心上:在分级比较的量化过程中根据SPMD并行原理,把需要量化的数据和计算机任务进行划分,使多个CPU并行执行量化程序,并且每一个CPU都在不同的数据上运行相同的分级比较量化代码;
在并行框架下应用K-均值聚类算法对当前级量化后的分组数据分别进行并行聚类:应用多线程并行对下级分组采用K-均值聚类,把需要聚类的分组数据和计算机任务进行划分,使多个CPU并行执行聚类程序,并且每一个CPU都在不同的分组数据上运行相同的聚类代码,所生成的类中心按顺序保存到共享内存中。
7.如权利要求4所述的并行视频拷贝检测方法,其特征在于,所述的步骤3)的并行量化方法是应用多线程并行的方法在多个CPU上同时运行相同的分级量化代码;
所述倒排索引表的生成为:
根据视觉词汇的量化的结果,对于量化结果中的n个视觉词汇中的一个视觉词汇Wk,在m个视频帧d1L dm中的倒排索引表表示为:
Wk d1[f1] L dm[fm] (1)
其中fm表示视觉词汇信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210153893.4A CN102693299B (zh) | 2012-05-17 | 2012-05-17 | 一种并行视频拷贝检测***和方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210153893.4A CN102693299B (zh) | 2012-05-17 | 2012-05-17 | 一种并行视频拷贝检测***和方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102693299A CN102693299A (zh) | 2012-09-26 |
CN102693299B true CN102693299B (zh) | 2015-01-07 |
Family
ID=46858733
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210153893.4A Expired - Fee Related CN102693299B (zh) | 2012-05-17 | 2012-05-17 | 一种并行视频拷贝检测***和方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102693299B (zh) |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102547268B (zh) * | 2010-12-30 | 2014-12-10 | 深圳华强数码电影有限公司 | 一种流媒体播放方法及播放设备 |
CN103336795B (zh) * | 2013-06-09 | 2017-03-08 | 华中科技大学 | 基于多特征的视频索引方法 |
CN104376003B (zh) * | 2013-08-13 | 2019-07-05 | 深圳市腾讯计算机***有限公司 | 一种视频检索方法及装置 |
CN104463864B (zh) * | 2014-12-05 | 2018-08-14 | 华南师范大学 | 多级并行关键帧云提取方法及*** |
CN104715057A (zh) * | 2015-03-30 | 2015-06-17 | 江南大学 | 一种基于可变步长关键帧提取的网络视频拷贝检索方法 |
CN106375781B (zh) * | 2015-07-23 | 2019-09-13 | 无锡天脉聚源传媒科技有限公司 | 一种重复视频的判断方法及装置 |
CN106375850B (zh) * | 2015-07-23 | 2019-09-13 | 无锡天脉聚源传媒科技有限公司 | 一种匹配视频的判断方法及装置 |
CN105468781A (zh) * | 2015-12-21 | 2016-04-06 | 小米科技有限责任公司 | 视频查询方法和装置 |
CN106649440B (zh) * | 2016-09-13 | 2019-10-25 | 西安理工大学 | 融合全局r特征的近似重复视频检索方法 |
CN106503112B (zh) * | 2016-10-18 | 2020-01-21 | 大唐软件技术股份有限公司 | 视频检索方法和装置 |
CN107153670B (zh) * | 2017-01-23 | 2020-08-14 | 合肥麟图信息科技有限公司 | 基于多幅图像融合的视频检索方法及*** |
CN108881947B (zh) * | 2017-05-15 | 2021-08-17 | 阿里巴巴集团控股有限公司 | 一种直播流的侵权检测方法及装置 |
CN110020252B (zh) * | 2017-12-30 | 2022-04-22 | 惠州学院 | 基于片尾内容的识别有害视频的方法及其*** |
CN109543641B (zh) * | 2018-11-30 | 2021-01-26 | 厦门市美亚柏科信息股份有限公司 | 一种实时视频的多目标去重方法、终端设备及存储介质 |
CN110175267B (zh) * | 2019-06-04 | 2020-07-07 | 黑龙江省七星农场 | 一种基于无人机遥感技术的农业物联网控制处理方法 |
CN110598042A (zh) * | 2019-08-29 | 2019-12-20 | 北京睿企信息科技有限公司 | 一种基于增量更新的视频结构化实时更新方法及*** |
CN112182287B (zh) * | 2020-09-10 | 2021-06-08 | 南京信息工程大学 | 一种基于时空视觉词组和分层匹配的视频拷贝检测方法 |
CN113286174B (zh) * | 2021-05-21 | 2022-11-08 | 浙江商汤科技开发有限公司 | 视频抽帧方法、装置、电子设备、计算机可读存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101394522B (zh) * | 2007-09-19 | 2010-07-21 | 中国科学院计算技术研究所 | 一种视频拷贝的检测方法和*** |
-
2012
- 2012-05-17 CN CN201210153893.4A patent/CN102693299B/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN102693299A (zh) | 2012-09-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102693299B (zh) | 一种并行视频拷贝检测***和方法 | |
CN107515895B (zh) | 一种基于目标检测的视觉目标检索方法与*** | |
CN104899253B (zh) | 面向社会图像的跨模态图像-标签相关度学习方法 | |
CN106649490B (zh) | 一种基于深度特征的图像检索方法及装置 | |
CN112417381B (zh) | 应用于图像版权保护的快速定位侵权图像的方法及装置 | |
CN102663447B (zh) | 基于判别相关分析的跨媒体检索方法 | |
CN104462199A (zh) | 一种网络环境下的近似重复图像搜索方法 | |
CN104216949A (zh) | 一种融合空间信息的图像特征聚合表示方法及*** | |
CN104199842A (zh) | 一种基于局部特征邻域信息的相似图片检索方法 | |
CN105930873A (zh) | 一种基于子空间的自步跨模态匹配方法 | |
CN112163114B (zh) | 一种基于特征融合的图像检索方法 | |
CN111326236A (zh) | 一种医疗图像自动处理*** | |
CN106649440A (zh) | 融合全局r特征的近似重复视频检索方法 | |
CN114706559A (zh) | 一种基于需求识别的软件规模度量方法 | |
CN114443855A (zh) | 一种基于图表示学习的知识图谱跨语言对齐方法 | |
Wang et al. | Beauty product image retrieval based on multi-feature fusion and feature aggregation | |
Han et al. | Bin similarity‐based domain adaptation for fine‐grained image classification | |
Jin et al. | Content-based image retrieval based on shape similarity calculation | |
CN110442736B (zh) | 一种基于二次判别分析的语义增强子空间跨媒体检索方法 | |
CN105760875A (zh) | 基于随机森林算法的判别二进制图像特征相似实现方法 | |
Yin et al. | Sentence-bert and k-means based clustering technology for scientific and technical literature | |
Pengcheng et al. | Fast Chinese calligraphic character recognition with large-scale data | |
CN116721713B (zh) | 一种面向化学结构式识别的数据集构建方法和装置 | |
JP2017162009A (ja) | 特徴量生成装置、方法、及びプログラム | |
CN112084353A (zh) | 一种快速陆标-卷积特征匹配的词袋模型方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20150107 Termination date: 20170517 |
|
CF01 | Termination of patent right due to non-payment of annual fee |