CN103970885B - 基于视频内容分析的3d视频搜索引擎的实现方法 - Google Patents
基于视频内容分析的3d视频搜索引擎的实现方法 Download PDFInfo
- Publication number
- CN103970885B CN103970885B CN201410213424.6A CN201410213424A CN103970885B CN 103970885 B CN103970885 B CN 103970885B CN 201410213424 A CN201410213424 A CN 201410213424A CN 103970885 B CN103970885 B CN 103970885B
- Authority
- CN
- China
- Prior art keywords
- image
- video
- search engine
- color
- judge
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/783—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Library & Information Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Processing Or Creating Images (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于视频内容分析的3D视频搜索引擎的实现方法,该方法主要包括:通过网络爬虫视频网页,解析视频网页获取视频地址,下载视频样本;对所述步骤1下载的视频样本进行3D识别,若该视频样本为MVC编码格式,则保存该视频网页地址,进入步骤3;否则提取该视频的关键帧,分析该帧画面是否为3D格式,若为3D格式则进入步骤3,否则取出下一个视频样本再从头执行步骤2;将所述步骤2中被识别为3D视频的网页保存,并将视频按照相似度进行聚类,建立搜索引擎的索引。采用本发明所述方法能够有效判断出真正的3D视频,提高3D视频搜索引擎的精度。
Description
技术领域
本发明属于视频检索技术领域,具体涉及一种基于视频内容分析的3D视频搜索引擎实现方法的设计。
背景技术
3D电影《阿凡达》的巨大成功,给3D视频领域带来了巨大的发展。3D显示技术日渐成熟,观影效果越来越好,3D视频得到了消费者广泛的认可。3D视频利用双眼视差原理,让观众的左眼和右眼获得独立的影像,从而获得三维的空间感。为了形成视差,3D视频至少包含两路影像。多视点编码(Multiview Video Coding,MVC)技术是3D视频编码的标准技术,2009年3月作为H.264标准扩展编码的附件H由联合视频编码组(JVT)正式提出。视频技术的推广是一个非常漫长的过程,需要考虑如何利用现有硬软件设备,再平滑过渡到新的技术实施标准。MVC技术的普及还需要一个漫长的过长,为了兼容现有软件***采,目前3D视频大都采用的普通视频的编码,通过将视频帧经过时间复用或空间复用的技术的处理来保存两路影像。
目前的视频搜索引擎是利用使用视频元数据(包括视频标题、标签和描述等结构化的文本信息)来检索视频,实质上使用的是文本检索技术,所以并不能识别出3D视觉特征。对于MVC编码的3D视频,可以通过编码分析很容易地识别出3D信息。但是对于普通编码的3D视频,目前还没有从视频内容上准确识别的方法。用普通视频搜索引擎或者全文搜索引擎来搜索3D视频,存在着两个缺陷。一是准确率低,对于视频搜索引擎来说,视频元数据包含“3D”或“立体”关键词的视频不一定是3D视频,对于全文搜索引擎来说,搜索结果中存在着大量非视频结果。二是召回率低,因为有的3D视频没有被人工添加“3D”相关的文本描述,则无法基于文本检索的搜索引擎检索。
发明内容
本发明所要解决的技术问题是提出一种基于视频内容分析的3D视频搜索引擎的实现方法,克服传统搜索引擎在3D视频搜索上的不足。
本发明解决其技术问题采用的技术方案是:基于视频内容分析的3D视频搜索引擎的实现方法,具体包括:
步骤1:通过网络爬虫获取视频网页,解析视频网页获取视频地址,下载视频样本;
步骤2:对所述步骤1下载的视频样本进行3D识别,若该视频样本为MVC编码格式,则保存该视频网页地址,进入步骤3;否则提取该视频的关键帧,分析该帧画面是否为3D格式,若为3D格式则进入步骤3,否则取出下一个视频样本再从头执行步骤2;
步骤3:将所述步骤2中被识别为3D视频的网页保存,并将视频按照相似度进行聚类,建立搜索引擎的索引。
进一步的,所述通过网络爬虫获取视频网页的具体过程为:利用HtmlUnit浏览器程序,模拟图形浏览器访问网页,运行网页的脚本代码,获取网页的动态数据,分析数据获取结果列表,模拟点击“下一页”获取搜索页面的下一页,如果页面不再包含“下一页”按钮,则认为本次搜索的结果已被找完。
进一步的,所述步骤2中分析关键帧画面是否为3D格式的具体过程中,该3D格式包括拼接格式和色差格式,所述拼接格式指将左右两路影像直接左右拼接或者上下拼接形成的3D视频格式,所述色差格式是指将左右两路影像分别存储于不同的RGB颜色通道形成的3D视频格式。
更进一步的,所述拼接格式的识别过程为:
步骤21:将帧图像分割为左右两部分,计算左右两部分的距离Dist 1,如果距离Dist 1小于阀值TH1,则判断该图像为左右拼接格式的图像,结束流程,否则进入步骤22;
其中,所述H表示一维直方图数组,L表示该数组的长度,k的取值范围为1~L,表示将整个图像明度划分为L阶后的第k阶明度,H1(k)表示左半部分图像对应的直方图数组,H2(k)表示表示右半部分图像对应的直方图数组;
步骤22:将帧图像分割为上下两部分,计算上下两部分的距离Dist 2,如果距离Dist 2小于阀值TH2,则判断该图像为上下拼接格式的图像,结束流程,否则进入步骤23;
其中,所述H3(k)表示上半部分图像对应的直方图数组,H4(k)表示下半部分图像对应的直方图数组;
步骤23:计算帧图像的边缘图像,在宽度为W的中央部分取出连续的W列像素,其中一列的黑色像素数目占该列像素总数的百分比δ以上,则认为存在垂直的拼缝,则判断该图像左右拼接格式的图像,结束流程,否则进入步骤24;
步骤24:计算帧图像的边缘图像,在宽度为W的中央部分取出连续的W行像素,其中一行的黑色像素数目占该列像素总数的百分比δ以上,则认为存在水平的拼缝,则判断该图像上下拼接格式的图像,否则认为是普通图像或其他3D格式的图像,结束流程。
更进一步的,所述色差格式的识别过程为:
将帧图像的红绿蓝三色通道分离出来形成三个通道图像,应用边缘提取或者二值化预处理三个通道图像,设其中两个图像I1和I2的宽为w,长为h,它们的边缘图像或者二值化图像为I1’和I2’,则I1和I2之间的距离Dist(I1,I2)定义为:
其中,I'1(x,y)表示在图像I1’中第y行第x列像素的明度值,I'2(x,y)表示在图像I2’
中第y行第x列像素的明度值;
对红青色差格式的评价值KR定义为:
KR=1 if Dist(G,B)=0
其中,R表示红色通道图像,G表示绿色通道图像,B蓝色通道图像;如果KR大于1,则判断该图像为红青3D图像,否则进行绿靛色差格式的判断;
对绿靛色差格式的评价值KG定义为:
KG=1 if Dist(B,R)=0
如果KG大于1,则判断该图像为绿靛3D图像,否则进行蓝黄色差格式的判断;
对蓝黄色差格式的评价值KB定义为:
KB=1 if Dist(R,G)=0
如果KB大于1,则判断该图像为蓝黄3D图像,否则为普通格式图像。
本发明的有益效果是:本发明基于视频内容分析的3D视频搜索引擎实现方法通过利用3D视频分析方法,能够有效判断出真正的3D视频,提高3D视频搜索引擎的精度,利用分布式计算模式,能够快速分析3D视频样本,太高搜索引擎的及时性,准确及时的3D视频搜索引擎大大提升了3D视频搜索用户的体验,各种3D视频终端可以接入该搜索引擎使用3D视频搜索功能,高效准确地获取3D内容。
附图说明
图1所示为本发明具体实施方式的基于视频内容分析的3D视频搜索引擎实现方法的流程框图;
具体实施方式
下面结合附图和具体的实施例对本发明作进一步的阐述。
如图1所示为本发明实施方式的基于视频内容分析的3D视频搜索引擎实现方法的流程框图,其具体包括:
步骤1:通过网络爬虫获取视频网页,解析视频网页获取视频地址,下载视频样本;
步骤2:对所述步骤1下载的视频样本进行3D识别,若该视频样本为MVC编码格式,则保存该视频网页地址,进入步骤3;否则提取该视频的关键帧,分析该帧画面是否为3D格式,若为3D格式则进入步骤3,否则取出下一个视频样本再从头执行步骤2;
步骤3:将所述步骤2中被识别为3D视频的网页保存,并将视频按照相似度进行聚类,建立搜索引擎的索引。
本发明通过对视频内容的分析,建立3D视频数据库,克服了现有技术由关键字进行3D视频检索造成的准确率低的问题,并且实现的过程较为简单,检索正确率较高,为了本领域技术人员能够理解并且实施本发明技术方案,下面将对每个步骤进行详细说明:
所述步骤1中利用网络爬虫视频网页,解析视频网页获取视频地址的过程在现有技术中是较为成熟的网页获取技术,在本申请方案中不再做详细阐述。
本发明的关键技术在于对于普通编码的3D视频,通过分析视频内容来识别出3D格式,本发明将针对最为常见的拼接格式和色差格式做出详细的识别方案,其中所述拼接格式是指将左右两路影像直接左右拼接或者上下拼接形成的3D视频格式,色差格式是指将左右两路影像分别存储于不同的RGB颜色通道形成的3D视频格式。
为了本领域技术人员能够理解并且实施本发明技术方案,下面通过具体实施方式对拼接格式和色差格式的识别作进一步介绍。
所述拼接格式的识别过程为:
步骤21:将帧图像分割为左右两部分,计算左右两部分的距离Dist 1,如果距离Dist 1小于阀值TH1,则判断该图像为左右拼接格式的图像,结束流程,否则进入步骤22;
其中,所述H表示一维直方图数组,L表示该数组的长度,k的取值范围为1~L,表示将整个图像明度划分为L阶后的第k阶明度,比如把图像的明度划分为256阶,就可以对图像得到一个长度为256的直方图数组,H(k)就表示明度在k-1到k的像素的个数或者比例;H1(k)表示左半部分图像对应的直方图数组,H2(k)表示表示右半部分图像对应的直方图数组;所述阀值TH1的值可以根据具体情况进行设定;比如把明度划分为256阶,就可以对图像得到一个长度为256的直方图数组,H(k)就表示明度在k-1到k的像素的个数或者比例。
步骤22:将帧图像分割为上下两部分,计算上下两部分的距离Dist 2,如果距离Dist 2小于阀值TH2,则判断该图像为上下拼接格式的图像,结束流程,否则进入步骤23;
其中,所述H3(k)表示上半部分图像对应的直方图数组,H4(k)表示下半部分图像对应的直方图数组,所述阀值TH2的值可以根据具体情况进行设定;
步骤23:计算帧图像的边缘图像,在宽度为W的中央部分取出连续的W列像素,其中一列的黑色像素数目占该列像素总数的百分比δ1以上,则认为存在垂直的拼缝,则判断该图像左右拼接格式的图像,结束流程,否则进入步骤24;其中δ1的值可以根据具体的需求进行设定;
步骤24:计算帧图像的边缘图像,在宽度为W的中央部分取出连续的W行像素,其中一行的黑色像素数目占该列像素总数的百分比δ2以上,则认为存在水平的拼缝,则判断该图像上下拼接格式的图像,否则认为是普通图像或其他3D格式的图像,结束流程;其中δ2的值可以根据具体的需求进行设定。
下面以左右拼接为例,画面的左半部分存储左路影像,右半部分存储右路影像,左右两部分之间的关系是视频场景的左右眼视角的关系,有两种方法可以检测左右拼接格式,一是利用左右部分相似的特征,采用计算左右画面之间的距离来表征相似度的方法,即上述步骤S21的内容;二是利用拼接存在的明显拼缝的特征,采用图像边缘查找方法找出拼缝,即上述步骤S23的内容。
在介绍色差格式的识别的过程中,首先对色差格式进行说明:非色差格式图像的三个通道图像是完全重叠的图像,除了有明度差异以外,没有视角的差异,而色差格式图像的三个通道图像之中,有两个可以完成重叠,与另外一个有视角差异。利用这个原理,将帧图像的红绿蓝三色通道分离出来,形成三个通道图像,通过比较三个通道图像之间的距离,可以判断该图像是否为色差格式或是何种色差格式。
其具体过程为:将帧图像的红绿蓝三色通道分离出来形成三个通道图像,应用边缘提取或者二值化预处理三个通道图像,设其中两个图像I1和I2的宽为w,长为h,它们的边缘图像或者二值化图像为I1’和I2’,则I1和I2之间的距离Dist(I1,I2)定义为:
其中,I'1(x,y)表示在图像I1’中第y行第x列像素的明度值,I'2(x,y)表示在图像I2’
中第y行第x列像素的明度值;I(x,y)的含义,在这里将图像视为矩阵,也就是一个二维数组,比如一个宽320高240的图像可以视为一个240行320列的矩阵,元素的值就是明度值,I(x,y)就表示y行x列像素的明度值,RGB三色通道图像之间距离的计算公式和上面提到的直方图的计算公式是相似的,也是求差求绝对值再求和的步骤。
对红青色差格式的评价值KR定义为:
KR=1 if Dist(G,B)=0
其中,R表示红色通道图像,G表示绿色通道图像,B蓝色通道图像;如果KR大于1,则判断该图像为红青3D图像,否则进行绿靛色差格式的判断;
对绿靛色差格式的评价值KG定义为:
KG=1 if Dist(B,R)=0
如果KG大于1,则判断该图像为绿靛3D图像,否则进行蓝黄色差格式的判断;
对蓝黄色差格式的评价值KB定义为:
KB=1 if Dist(R,G)=0
如果KB大于1,则判断该图像为蓝黄3D图像,否则为普通格式图像。由于色差格式中,红青格式最多,应当首先判断是否为红青格式,其次再判断是否为绿靛格式和蓝黄格式。
所述步骤S3具体为:利用成熟的文本索引技术,对视频结构化的描述文本建立查询索引;利用现有的视频聚类算法,对视频进行聚类分析,并建立聚类索引以供聚类查询。本发明不涉及到视频聚类相关的内容,但是视频聚类需要在识别3D视频格式的基础上进行,针对不同格式取出3D视频的一路影像来进行聚类分析。
本领域的普通技术人员将会意识到,这里所述的实施例是为了帮助读者理解本发明的原理,应被理解为发明的保护范围并不局限于这样的特别陈述和实施例。凡是根据上述描述做出各种可能的等同替换或改变,均被认为属于本发明的权利要求的保护范围。
Claims (5)
1.基于视频内容分析的3D视频搜索引擎的实现方法,其特征在于,具体包括:
步骤1:通过网络爬虫获取视频网页,解析视频网页获取视频地址,下载视频样本;
步骤2:对所述步骤1下载的视频样本进行3D识别,若该视频样本为MVC编码格式,则保存该视频网页地址,进入步骤3;否则提取该视频的关键帧,分析该帧画面是否为3D格式,若为3D格式则进入步骤3,否则取出下一个视频样本再从头执行步骤2;
步骤3:将所述步骤2中被识别为3D视频的网页保存,并将视频按照相似度进行聚类,建立搜索引擎的索引。
2.如权利要求1所述的基于视频内容分析的3D视频搜索引擎的实现方法,其特征在于,所述通过网络爬虫获取视频网页的具体过程为:利用HtmlUnit浏览器程序,模拟图形浏览器访问网页,运行网页的脚本代码,获取网页的动态数据,分析数据获取结果列表,模拟点击“下一页”获取搜索页面的下一页,如果页面不再包含“下一页”按钮,则认为本次搜索的结果已被找完。
3.如权利要求1所述的基于视频内容分析的3D视频搜索引擎的实现方法,其特征在于,所述步骤2中分析关键帧画面是否为3D格式的具体过程中,该3D格式包括拼接格式和色差格式,所述拼接格式指将左右两路影像直接左右拼接或者上下拼接形成的3D视频格式,所述色差格式是指将左右两路影像分别存储于不同的RGB颜色通道形成的3D视频格式。
4.如权利要求3所述的基于视频内容分析的3D视频搜索引擎的实现方法,其特征在于,所述拼接格式的识别过程为:
步骤21:将帧图像分割为左右两部分,计算左右两部分的距离Dist 1,如果距离Dist 1小于阀值TH1,则判断该图像为左右拼接格式的图像,结束流程,否则进入步骤22;
其中,所述H表示一维直方图数组,L表示该数组的长度,k的取值范围为1~L,表示将整个图像明度划分为L阶后的第k阶明度,H1(k)表示左半部分图像对应的直方图数组,H2(k)表示表示右半部分图像对应的直方图数组;
步骤22:将帧图像分割为上下两部分,计算上下两部分的距离Dist2,如果距离Dist2小于阀值TH2,则判断该图像为上下拼接格式的图像,结束流程,否则进入步骤23;
其中,所述H3(k)表示上半部分图像对应的直方图数组,H4(k)表示下半部分图像对应的直方图数组;
步骤23:计算帧图像的边缘图像,在宽度为W的中央部分取出连续的W列像素,其中一列的黑色像素数目占该列像素总数的百分比δ以上,则认为存在垂直的拼缝,则判断该图像左右拼接格式的图像,结束流程,否则进入步骤24;
步骤24:计算帧图像的边缘图像,在宽度为W的中央部分取出连续的W行像素,其中一行的黑色像素数目占该列像素总数的百分比δ以上,则认为存在水平的拼缝,则判断该图像上下拼接格式的图像,否则认为是普通图像或其他3D格式的图像,结束流程。
5.如权利要求4所述的基于视频内容分析的3D视频搜索引擎的实现方法,其特征在于,所述色差格式的识别过程为:
将帧图像的红绿蓝三色通道分离出来形成三个通道图像,应用边缘提取或者二值化预处理三个通道图像,设其中两个图像I1和I2的宽为w,长为h,它们的边缘图像或者二值化图像为I1’和I2’,则I1和I2之间的距离Dist(I1,I2)定义为:
其中,I'1(x,y)表示在图像I1’中第y行第x列像素的明度值,I'2(x,y)表示在图像I2’中第y行第x列像素的明度值;
对红青色差格式的评价值KR定义为:
KR=1if Dist(G,B)=0
其中,R表示红色通道图像,G表示绿色通道图像,B蓝色通道图像;如果KR大于1,则判断该图像为红青3D图像,否则进行绿靛色差格式的判断;
对绿靛色差格式的评价值KG定义为:
KG=1if Dist(B,R)=0
如果KG大于1,则判断该图像为绿靛3D图像,否则进行蓝黄色差格式的判断;
对蓝黄色差格式的评价值KB定义为:
KB=1if Dist(R,G)=0
如果KB大于1,则判断该图像为蓝黄3D图像,否则为普通格式图像。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410213424.6A CN103970885B (zh) | 2014-05-20 | 2014-05-20 | 基于视频内容分析的3d视频搜索引擎的实现方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410213424.6A CN103970885B (zh) | 2014-05-20 | 2014-05-20 | 基于视频内容分析的3d视频搜索引擎的实现方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103970885A CN103970885A (zh) | 2014-08-06 |
CN103970885B true CN103970885B (zh) | 2017-01-25 |
Family
ID=51240383
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410213424.6A Expired - Fee Related CN103970885B (zh) | 2014-05-20 | 2014-05-20 | 基于视频内容分析的3d视频搜索引擎的实现方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103970885B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104994374B (zh) * | 2015-07-03 | 2017-01-18 | 宁波易维视显示技术有限公司 | 一种自动检测视频三维格式的方法 |
CN107315799A (zh) * | 2017-06-19 | 2017-11-03 | 重庆誉存大数据科技有限公司 | 一种互联网重复信息筛选方法及*** |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6711587B1 (en) * | 2000-09-05 | 2004-03-23 | Hewlett-Packard Development Company, L.P. | Keyframe selection to represent a video |
CN102378020A (zh) * | 2010-08-06 | 2012-03-14 | 日立民用电子株式会社 | 接收装置和接收方法 |
CN102857779A (zh) * | 2012-09-12 | 2013-01-02 | 康佳集团股份有限公司 | 利用云端服务器实现3d视频信号自动识别的方法及*** |
CN103081482A (zh) * | 2010-09-03 | 2013-05-01 | 索尼公司 | 图像处理装置和图像处理方法 |
CN103210653A (zh) * | 2010-11-15 | 2013-07-17 | Lg电子株式会社 | 用于转换帧格式的方法及使用该方法的装置 |
CN103636222A (zh) * | 2011-04-19 | 2014-03-12 | 三星电子株式会社 | 用于对多视点视频进行统一可分级视频编码的方法和设备以及对多视点视频进行统一可分级视频解码的方法和设备 |
-
2014
- 2014-05-20 CN CN201410213424.6A patent/CN103970885B/zh not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6711587B1 (en) * | 2000-09-05 | 2004-03-23 | Hewlett-Packard Development Company, L.P. | Keyframe selection to represent a video |
CN102378020A (zh) * | 2010-08-06 | 2012-03-14 | 日立民用电子株式会社 | 接收装置和接收方法 |
CN103081482A (zh) * | 2010-09-03 | 2013-05-01 | 索尼公司 | 图像处理装置和图像处理方法 |
CN103210653A (zh) * | 2010-11-15 | 2013-07-17 | Lg电子株式会社 | 用于转换帧格式的方法及使用该方法的装置 |
CN103636222A (zh) * | 2011-04-19 | 2014-03-12 | 三星电子株式会社 | 用于对多视点视频进行统一可分级视频编码的方法和设备以及对多视点视频进行统一可分级视频解码的方法和设备 |
CN102857779A (zh) * | 2012-09-12 | 2013-01-02 | 康佳集团股份有限公司 | 利用云端服务器实现3d视频信号自动识别的方法及*** |
Non-Patent Citations (1)
Title |
---|
Automatic 3D Video Format Detection;Tao Zhang 等;《Stereoscopic Displays and Applications XXII》;20110215;1-10 * |
Also Published As
Publication number | Publication date |
---|---|
CN103970885A (zh) | 2014-08-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109829443A (zh) | 基于图像增强与3d卷积神经网络的视频行为识别方法 | |
CN111858954A (zh) | 面向任务的文本生成图像网络模型 | |
CN103714181B (zh) | 一种层级化的特定人物检索方法 | |
CN106446015A (zh) | 一种基于用户行为偏好的视频内容访问预测与推荐方法 | |
CN110827312B (zh) | 一种基于协同视觉注意力神经网络的学习方法 | |
CN106649663B (zh) | 一种基于紧凑视频表征的视频拷贝检测方法 | |
CN113449727A (zh) | 一种基于深度神经网络的伪装目标检测识别方法 | |
CN101369281A (zh) | 基于视频摘要元数据的检索方法 | |
CN104331450B (zh) | 基于多模式特征和张量分解的视频拷贝检测方法 | |
CN104850850A (zh) | 一种结合形状和颜色的双目立体视觉图像特征提取方法 | |
CN111783712A (zh) | 一种视频处理方法、装置、设备及介质 | |
CN113592018B (zh) | 基于残差密集网络和梯度损失的红外光与可见光图像融合方法 | |
CN113411550B (zh) | 视频上色方法、装置、设备及存储介质 | |
CN112668638A (zh) | 一种图像美学质量评估和语义识别联合分类方法及*** | |
CN116863319B (zh) | 基于跨尺度建模和交替细化的复制移动篡改检测方法 | |
CN110458115A (zh) | 一种基于时序的多帧集成目标检测算法 | |
CN111046213B (zh) | 一种基于图像识别的知识库构建方法 | |
CN104143077A (zh) | 基于图像的行人目标检索方法和*** | |
CN103970885B (zh) | 基于视频内容分析的3d视频搜索引擎的实现方法 | |
CN113920171A (zh) | 基于特征级和决策级融合的双模态目标跟踪算法 | |
CN113066074A (zh) | 一种基于双目视差偏移融合的视觉显著性预测方法 | |
CN114663802B (zh) | 基于特征时空约束的监控视频跨模态视频迁移方法 | |
CN111738039A (zh) | 一种行人重识别方法、终端及存储介质 | |
Ghodhbani et al. | Depth-based color stereo images retrieval using joint multivariate statistical models | |
CN115019139A (zh) | 一种基于双流网络的光场显著目标检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20170125 Termination date: 20180520 |