CN106708876B - 一种基于Lucene的相似视频检索方法及*** - Google Patents

一种基于Lucene的相似视频检索方法及*** Download PDF

Info

Publication number
CN106708876B
CN106708876B CN201510785287.8A CN201510785287A CN106708876B CN 106708876 B CN106708876 B CN 106708876B CN 201510785287 A CN201510785287 A CN 201510785287A CN 106708876 B CN106708876 B CN 106708876B
Authority
CN
China
Prior art keywords
video
frame
similar
lucene
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510785287.8A
Other languages
English (en)
Other versions
CN106708876A (zh
Inventor
杨长龙
王艳玲
景晓军
沈智杰
唐新民
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Surfilter Network Technology Co ltd
Original Assignee
Surfilter Network Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Surfilter Network Technology Co ltd filed Critical Surfilter Network Technology Co ltd
Priority to CN201510785287.8A priority Critical patent/CN106708876B/zh
Publication of CN106708876A publication Critical patent/CN106708876A/zh
Application granted granted Critical
Publication of CN106708876B publication Critical patent/CN106708876B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/735Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/732Query formulation
    • G06F16/7328Query by example, e.g. a complete video frame or video sequence

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种基于Lucene的相似视频检索方法,包括:S1、在一集群的不同的节点分别建立一Lucene视频索引库;S2、获取用于检索相似视频的样本视频,并同时在每一所述Lucene视频索引库中进行检索,分别得到与所述样本视频相似的结果视频;S3、收集各个节点的结果视频,按照相似系数进行排列形成一结果视频集合,并输出该结果视频集合。本发明还提供了对应的***。实施本发明,在检索时,每一节点同时进行检索,提高检索速度,保证了检索质量。同时,通过Lucene作为检索引擎,使用余弦相似算法计算视频相似度,加快比对速度,同时通过预先建立Lucene视频索引库,减少视频检索过程中的预处理时间,并对提取的视频帧进行压缩,减少帧比对的计算量,进一步加快比对速度。

Description

一种基于Lucene的相似视频检索方法及***
技术领域
本发明涉及计算机互联网技术领域,更具体地说,涉及一种基于Lucene的相似视频检索方法及***。
背景技术
视频内容不同于文本内容,不能像文本检索一样对视频进行检索,而现实生活中,尤其是互联网上对视频内容检索的需求是很强烈的。
现有技术中,已经出现了一些对视频内容进行检索的方法和装置,但是,对视频检索所做的工作,基本都是专注于如何对视频中的帧特征进行分析,而检索速度并没有达到理想的效果,速度慢,检索过程较为耗时。
发明内容
本发明要解决的技术问题在于,针对现有技术中的视频检索的检索速度慢而检索过程较为耗时的问题,提供一种基于Lucene的相似视频检索方法及***。
本发明解决上述问题的技术方案是提供了一种基于Lucene的相似视频检索方法,该方法包括以下步骤:
S1、在一集群的不同的节点分别建立一Lucene视频索引库;
S2、获取用于检索相似视频的样本视频,并同时在每一所述Lucene视频索引库中进行检索,分别得到与所述样本视频相似的结果视频;
S3、收集各个节点的结果视频,按照相似系数进行排列形成一结果视频集合,并输出该结果视频集合。
在上述基于Lucene的相似视频检索方法中,在上述步骤S1中,在一个节点建立一所述Lucene视频索引库的步骤包括:
S11、采集该节点的源视频;
S12、使用视频处理工具对所述源视频进行预处理;
S13、使用视频提取工具对预处理后的源视频按照第一时间间隔进行采样得到源视频帧,并对所述源视频的帧图片进行分辨率压缩;
S14、采用图片特征提取算法提取所述源视频帧的帧特征;
S15、建立Lucene索引,给每一所述帧特征分配编号,并将具有编号的帧特征、该帧特征所属的源视频的信息以及该帧特征的来源帧的信息构成Lucene的一条记录,其中,编号为源视频的MD5值和帧图片的顺序序号的组合。
在上述基于Lucene的相似视频检索方法中,在上述步骤S2中,在每一所述Lucene视频索引库中进行检索,得到与所述样本视频相似的结果视频的步骤包括:
S21、随机获取用于检索相似视频的所述样本视频的一样本视频帧及与所述样本视频帧相邻的样本视频左帧和样本视频右帧,并分别将所述样本视频及样本视频左帧和样本视频右帧进行压缩提取特征数据;
S22、在所述Lucene视频索引库中进行检索,将所述样本视频帧与所述Lucene视频索引库中的各个帧特征进行匹配,获得与所述样本视频帧相似的多个相似帧;
S23、根据与所述样本视频帧相邻的所述样本视频左帧和所述样本视频右帧对所述多个相似帧进行过滤,获得与所述样本视频帧相似的多个有效相似帧,并将所述多个有效相似帧构成一视频集合;
S24、重复所述步骤S21至所述步骤S23,获得多个视频集合,根据所述有效相似帧的数目占所述样本视频帧的数目的比值超过一预定值,汇总统计得到与所述样本视频相似的结果视频,并输出所述结果视频。
在上述基于Lucene的相似视频检索方法中,所述步骤S23包括:
S231、根据所述Lucene视频索引库的帧特征的编号获取每一所述相似帧及与所述相似帧相邻的左相似帧和右相似帧;
S232、分别将与所述相似帧相邻的所述左相似帧和所述右相似帧与与所述样本视频帧相邻的所述样本视频左帧和样本视频右帧进行相似比对,获得多个有效相似帧;
S233、将所述多个有效相似帧构成一所述视频集合。
在上述基于Lucene的相似视频检索方法中,在所述步骤S21之前包括:
使用视频处理工具对所述样本视频进行预处理;
使用视频提取工具对预处理后的样本视频按照第二时间间隔进行采样得到所述样本视频帧,并对所述样本视频帧的帧图片进行分辨率压缩。
本发明还提供了一种基于Lucene的相似视频检索***,该***包括:
建立模块,用于在一集群的不同的节点分别建立一Lucene视频索引库;
检索模块,用于获取用于检索相似视频的样本视频,并同时在每一所述Lucene视频索引库中进行检索,分别得到与所述样本视频相似的结果视频;
输出模块,用于收集各个节点的结果视频,按照相似系数进行排列形成一结果视频集合,并输出该结果视频集合。
在上述基于Lucene的相似视频检索***中,在一个节点建立一所述Lucene视频索引库,所述建立模块包括:
采集单元,用于采集该节点的源视频;
第一预处理单元,用于使用视频处理工具对所述源视频进行预处理;
第一采样单元,用于使用视频提取工具对预处理后的源视频按照第一时间间隔进行采样得到源视频帧,并对所述源视频的帧图片进行分辨率压缩;
提取单元,用于采用图片特征提取算法提取所述源视频帧的帧特征;
建立子单元,用于建立Lucene索引,给每一所述帧特征分配编号,并将具有编号的帧特征、该帧特征所属的源视频的信息以及该帧特征的来源帧的信息构成Lucene的一条记录,其中,编号为源视频的MD5值和帧图片的顺序序号的组合。
在上述基于Lucene的相似视频检索***中,所述检索模块包括:
获取单元,用于随机获取用于检索相似视频的所述样本视频的一样本视频帧及与所述样本视频帧相邻的样本视频左帧和样本视频右帧,并分别将所述样本视频及样本视频左帧和样本视频右帧进行压缩提取特征数据;
匹配单元,用于在所述Lucene视频索引库中进行检索,将所述样本视频帧与所述Lucene视频索引库中的各个帧特征进行匹配,获得与所述样本视频帧相似的多个相似帧;
过滤单元,用于根据与所述样本视频帧相邻的所述样本视频左帧和所述样本视频右帧对所述多个相似帧进行过滤,获得与所述样本视频帧相似的多个有效相似帧,并将所述多个有效相似帧构成一视频集合;
统计单元,用于根据所述有效相似帧的数目占所述样本视频帧的数目的比值超过一预定值,将多个视频集合汇总统计得到与所述样本视频相似的结果视频,并输出所述结果视频。
在上述基于Lucene的相似视频检索***中,所述过滤单元包括:
获取子单元,用于根据所述Lucene视频索引库的帧特征的编号获取每一所述相似帧及与所述相似帧相邻的左相似帧和右相似帧;
比对子单元,用于分别将与所述相似帧相邻的所述左相似帧和所述右相似帧与与所述样本视频帧相邻的所述样本视频左帧和样本视频右帧进行相似比对,获得多个有效相似帧;
构造子单元,将所述多个有效相似帧构成一所述视频集合。
在上述基于Lucene的相似视频检索***中,,所述检索模块还包括:
第二预处理单元,用于使用视频处理工具对所述样本视频进行预处理;
第二采样单元,用于使用视频提取工具对预处理后的样本视频按照第二时间间隔进行采样得到所述样本视频帧,并对所述样本视频帧的帧图片进行分辨率压缩。
本发明的基于Lucene的相似视频检索方法及***,有益效果有:
首先,通过在一集群的不同节点分别建立一Lucene视频索引库,在检索时,每一节点同时进行检索,提高检索速度,保证了检索质量。
其次,通过Lucene作为检索引擎,使用余弦相似算法计算视频相似度,加快比对速度,同时,通过预先建立Lucene视频索引库,减少视频检索过程中的预处理时间,并对图片特征提取算法提取的视频帧进行压缩,减少帧比对的计算量,进一步加快比对速度。
附图说明
图1是本发明的基于Lucene的相似视频检索方法实施例的流程图。
图2是图1中的在一个节点建立一Lucene视频索引库实施例的流程图。
图3是图1中的在每一Lucene视频索引库中进行检索的具体流程图。
图4是本发明的基于Lucene的相似视频检索***实施例的流程图。
图5是图4中的建立模块的结构示意图。
图6是图4中的检索模块的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
本发明的基于Lucene的相似视频检索方法及***,通过在一集群的不同节点分别建立一Lucene视频索引库,在检索时,每一节点同时进行检索,提高检索速度,保证了检索质量。同时,通过Lucene作为检索引擎,使用余弦相似算法计算视频相似度,加快比对速度,同时通过预先建立Lucene视频索引库,减少视频检索过程中的预处理时间,并对图片特征提取算法提取的视频帧进行压缩,减少帧比对的计算量,进一步加快比对速度。
如图1所示,是本发明的基于Lucene的相似视频检索方法实施例的流程图。该方法包括:
首先,在步骤S1中,在一集群的不同的节点分别建立一Lucene视频索引库,不同的节点建立的Lucene视频索引库结合了节点本身的情况,具体地,在一个节点建立一Lucene视频索引库,如图2所示,包括:在步骤S11中,采集该节点的源视频,在步骤S12中,使用视频处理工具对源视频进行预处理,将该样本视频处理成统一的属性,该属性包括格式、帧率、图像大小等。在步骤S13中,使用视频提取工具对预处理后的源视频按照第一时间间隔进行采样得到源视频帧,并对该源视频的帧图片进行分辨率压缩,在此步骤中,第一时间间隔为一固定值,即定时采样,对帧图片进行压缩之后,减少了源视频帧的帧特征大小,有利于提高与样本视频帧进行比对的速度。在步骤S14中,采用图片特征提取算法提取源视频帧的帧特征,其中图片特征提取算法包括CEDD(Color and Edge Directivity Descriptor,颜色和边缘的方向性描述符)、JCD(Joint Composite Descriptor,联合综合描述符)、FCTH(Fuzzy Color and Texture Histogram,模糊的颜色和纹理直方图)等。在步骤S15中,建立Lucene索引,给每一帧特征分配编号,并将具有编号的帧特征、该帧特征所属的源视频的信息以及该帧特征的来源帧的信息构成Lucene的一条记录,其中,编号为源视频的MD5值和帧图片的顺序序号的组合。
随后,在步骤S2中,获取用于检索相似视频的样本视频,并同时在每一视Lucene频索引库中进行检索,分别得到与该样本视频相似的结果视频。在本实施例中,如图3所示,在每一Lucene视频索引库中进行检索,分别得到与该样本视频相似的结果视频的步骤包括:
在步骤S21中,随机获取用于检索相似视频的样本视频的一样本视频帧及与该样本视频帧相邻的样本视频左帧和样本视频右帧,并分别将该样本视频及样本视频左帧和样本视频右帧进行压缩提取特征数据。
在步骤S22中,在Lucene视频索引库中进行检索,将该样本视频帧与Lucene视频索引库中的各个帧特征进行匹配,获得与该样本视频帧相似的多个相似帧,在此步骤中,采用余弦相似度计算该样本视频帧与Lucene视频索引库中的各个帧特征的相似度。
在步骤S23中,根据与该样本视频帧相邻的样本视频左帧和样本视频右帧对多个相似帧进行过滤,获得与该样本视频帧相似的多个有效相似帧,并将该多个有效相似帧构成一视频集合。具体地,步骤S23包括:在步骤S231中,根据Lucene视频索引库的帧特征的编号获取每一相似帧m及与该相似帧m相邻的左相似帧ml和右相似帧mr。在步骤S232中,分别将与该相似帧m相邻的左相似帧ml和右相似帧mr与与该样本视频帧s相邻的样本视频左帧l和样本视频右帧r进行相似比对,获得多个有效相似帧,其中,在左相似帧ml及右相似帧mr分别与左样本视频帧l及右样本视频帧r对应相似时,则该相似帧m为有效相似帧,在左相似帧ml与左样本视频帧l不相似或者右相似帧mr与右样本视频帧r不相似时,则该相似帧m为非有效相似帧。在步骤S233中,将该多个有效相似帧构成一视频集合。
在步骤S24中,重复上述步骤S21至步骤S23,获得多个视频集合,汇总统计得到与该样本视频相似的结果视频,并输出该结果视频,其中,该结果视频的有效相似帧的数目占样本视频帧的数目的比值超过一预定值。
在上述步骤S21之前包括:在步骤S201中,使用视频处理工具对样本视频进行预处理,将该样本视频处理成统一的属性,该属性包括格式、帧率、图像大小等。在步骤S202中,使用视频提取工具对预处理后的样本视频按照第二时间间隔进行采样得到样本视频帧,并对该样本视频帧的帧图片进行分辨率压缩,在此步骤中,第二时间间隔为一固定值,即定时采样,对帧图片进行压缩之后,该样减少了样本视频帧的帧特征大小,有利于样本视频帧与预先建立的Lucene视频索引库中的各个帧特征进行比对的速度。
随后,在步骤S3中,收集各个节点的结果视频,按照相似系数的大小进行排列形成一结果视频集合,并输出该结果视频集合。在本实施例中,该相似系数为该结果视频的有效相似帧的数目占样本视频帧的数目的比值。
在本发明的实施例中,通过在不同的节点分别建立一Lucene视频索引库,Lucene视频索引库处于分布式,在需要检索时,每一节点同时进行检索得到结果视频,分布式进行检索,提高检索速度,保证了检索质量。
如图4所示,是本发明的基于Lucene的相似视频检索***实施例的结构示意图。该***100包括建立模块10、检索模块20以及输出模块30,其中,建立模块10用于在一集群的不同的节点分别建立一Lucene视频索引库,不同的节点建立的Lucene视频索引库结合了节点本身的情况。检索模块20用于获取用于检索相似视频的样本视频,并同时在每一Lucene视频索引库中进行检索,分别得到与该样本视频相似的结果视频.输出模块30用于收集各个节点的结果视频,按照相似系数的大小进行排列形成一结果视频集合,并输出该结果视频集合。在本实施例中,该相似系数为该结果视频的有效相似帧的数目占样本视频帧的数目的比值。
在本发明的实施例中,具体地,在一个节点建立一Lucene视频索引库,如图5所示,建立模块10包括采集单元11、第一预处理单元12、第一采样单元13、提取单元14以及建立子单元15,其中,采集单元11用于采集该节点的源视频。第一预处理单元12用于使用视频处理工具对源视频进行预处理,将该样本视频处理成统一的属性,该属性包括格式、帧率、图像大小等。第一采样单元13用于使用视频提取工具对预处理后的源视频按照第一时间间隔进行采样得到源视频帧,并对该源视频的帧图片进行分辨率压缩,其中,第一时间间隔为一固定值,即定时采样,对帧图片进行压缩之后,减少了源视频帧的帧特征大小,有利于提高与样本视频帧进行比对的速度。提取单元14用于采用图片特征提取算法提取源视频帧的帧特征,其中图片特征提取算法包括CEDD(Color and Edge Directivity Descriptor,颜色和边缘的方向性描述符)、JCD(Joint Composite Descriptor,联合综合描述符)、FCTH(FuzzyColor and Texture Histogram,模糊的颜色和纹理直方图)等。建立子单元15用于建立Lucene索引,给每一帧特征分配编号,并将具有编号的帧特征、该帧特征所属的源视频的信息以及该帧特征的来源帧的信息构成Lucene的一条记录,其中,编号为源视频的MD5值和帧图片的顺序序号的组合。
在本发明的实施例中,如图6所示,在每一Lucene视频索引库中进行检索,分别得到与该样本视频相似的结果视频,检索模块20包括获取单元21、匹配单元22、过滤单元23以及统计单元24,其中,获取单元21用于随机获取用于检索相似视频的样本视频的一样本视频帧及与该样本视频帧相邻的样本视频左帧和样本视频右帧,并分别将该样本视频及样本视频左帧和样本视频右帧进行压缩提取特征数据。匹配单元22用于在Lucene视频索引库中进行检索,将该样本视频帧与Lucene视频索引库中的各个帧特征进行匹配,获得与该样本视频帧相似的多个相似帧,其中,采用余弦相似度计算该样本视频帧与Lucene视频索引库中的各个帧特征的相似度。过滤单元23用于根据与该样本视频帧相邻的样本视频左帧和样本视频右帧对多个相似帧进行过滤,获得与该样本视频帧相似的多个有效相似帧,并将该多个有效相似帧构成一视频集合。统计单元24用于汇总统计得到与该样本视频相似的结果视频,并输出该结果视频,其中,该结果视频的有效相似帧的数目占样本视频帧的数目的比值超过一预定值。
进一步地,在本实施例中,过滤单元23包括获取子单元231、比对子单元232以及构造子单元233,其中:获取子单元231用于根据Lucene视频索引库的帧特征的编号获取每一相似帧m及与该相似帧m相邻的左相似帧ml和右相似帧mr。比对子单元232用于分别将与该相似帧m相邻的左相似帧ml和右相似帧mr与与该样本视频帧s相邻的样本视频左帧l和样本视频右帧r进行相似比对,获得多个有效相似帧,其中,在左相似帧ml及右相似帧mr分别与左样本视频帧l及右样本视频帧r对应相似时,则该相似帧m为有效相似帧,在左相似帧ml与左样本视频帧l不相似或者右相似帧mr与右样本视频帧r不相似时,则该相似帧m为非有效相似帧。构造子单元233用于将该多个有效相似帧构成一视频集合。
在本发明的实施例,该***还包括第二预处理单元以及第二采样单元,其中,第二预处理单元用于使用视频处理工具对样本视频进行预处理,将该样本视频处理成统一的属性,该属性包括格式、帧率、图像大小等。第二采样单元使用视频提取工具对预处理后的样本视频按照第二时间间隔进行采样得到样本视频帧,并对该样本视频帧的帧图片进行分辨率压缩,其中,第二时间间隔为一固定值,即定时采样,对帧图片进行压缩之后,该样减少了样本视频帧的帧特征大小,有利于样本视频帧与预先建立的Lucene视频索引库中的各个帧特征进行比对的速度。
在本发明的实施例中,通过在不同的节点分别建立一Lucene视频索引库,在需要检索时,每一节点同时进行检索得到结果视频,提高检索速度,保证了检索质量。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (8)

1.一种基于Lucene的相似视频检索方法,其特征在于,该方法包括以下步骤:
S1、在一集群的不同的节点分别建立一Lucene视频索引库;
S2、随机获取用于检索相似视频的样本视频的一样本视频帧及与所述样本视频帧相邻的样本视频左帧和样本视频右帧,并分别将所述样本视频帧及样本视频左帧和样本视频右帧进行压缩提取特征数据;
S3、在所述Lucene视频索引库中进行检索,将所述样本视频帧与所述Lucene视频索引库中的各个帧特征进行匹配,获得与所述样本视频帧相似的多个相似帧;
S4、根据与所述样本视频帧相邻的所述样本视频左帧和所述样本视频右帧对所述多个相似帧进行过滤,获得与所述样本视频帧相似的多个有效相似帧,并将所述多个有效相似帧构成一帧集合;
S5、重复所述步骤S2至所述步骤S4,获得多个帧集合,根据所述有效相似帧的数目占所述样本视频帧的数目的比值超过一预定值,汇总统计得到与所述样本视频相似的结果视频,并输出所述结果视频;
S6、收集各个节点的结果视频,按照相似系数进行排列形成一结果视频集合,并输出该结果视频集合。
2.根据权利要求1中所述的基于Lucene的相似视频检索方法,其特征在于,在上述步骤S1中,在一个节点建立一所述Lucene视频索引库的步骤包括;
S11、采集该节点的源视频;
S12、使用视频处理工具对所述源视频进行预处理;
S13、使用视频提取工具对预处理后的源视频按照第二时间间隔进行采样得到源视频帧,并对所述源视频的帧图片进行分辨率压缩;
S14、采用图片特征提取算法提取所述源视频帧的帧特征;
S15、建立Lucene索引,给每一所述帧特征分配编号,并将具有编号的帧特征、该帧特征所属的源视频的信息以及该帧特征的来源帧的信息构成Lucene的一条记录,其中,编号为源视频的MD5值和帧图片的顺序序号的组合。
3.根据权利要求1中所述的基于Lucene的相似视频检索方法,其特征在于,所述步骤S4包括:
S41、根据所述Lucene视频索引库的帧特征的编号获取每一所述相似帧及与所述相似帧相邻的左相似帧和右相似帧;
S42、分别将与所述相似帧相邻的所述左相似帧和所述右相似帧与与所述样本视频帧相邻的所述样本视频左帧和样本视频右帧进行相似比对,获得多个有效相似帧;
S43、将所述多个有效相似帧构成一所述帧集合。
4.根据权利要求3中所述的基于Lucene的相似视频检索方法,其特征在于,在所述步骤S2之前包括:
使用视频处理工具对所述样本视频进行预处理;
使用视频提取工具对预处理后的样本视频按照第二时间间隔进行采样得到所述样本视频帧,并对所述样本视频帧的帧图片进行分辨率压缩。
5.一种基于Lucene的相似视频检索***,其特征在于,该***包括:
建立模块,用于在一集群的不同的节点分别建立一Lucene视频索引库;
获取模块,用于随机获取用于检索相似视频的样本视频的一样本视频帧及与所述样本视频帧相邻的样本视频左帧和样本视频右帧,并分别将所述样本视频帧及样本视频左帧和样本视频右帧进行压缩提取特征数据;
检索匹配模块,用于在所述Lucene视频索引库中进行检索,将所述样本视频帧与所述Lucene视频索引库中的各个帧特征进行匹配,获得与所述样本视频帧相似的多个相似帧;
过滤模块,用于根据与所述样本视频帧相邻的所述样本视频左帧和所述样本视频右帧对所述多个相似帧进行过滤,获得与所述样本视频帧相似的多个有效相似帧,并将所述多个有效相似帧构成一帧集合
统计模块,用于根据帧集合中所述有效相似帧的数目占所述样本视频帧的数目的比值超过一预定值,汇总统计得到与所述样本视频相似的结果视频,并输出所述结果视频;
输出模块,用于收集各个节点的结果视频,按照相似系数进行排列形成一结果视频集合,并输出该结果视频集合。
6.根据权利要求5中所述的基于Lucene的相似视频检索***,其特征在于,在一个节点建立一所述Lucene视频索引库,所述建立模块包括:
采集单元,用于采集该节点的源视频;
第一预处理单元,用于使用视频处理工具对所述源视频进行预处理;
第一采样单元,用于使用视频提取工具对预处理后的源视频按照第一时间间隔进行采样得到源视频帧,并对所述源视频的帧图片进行分辨率压缩;
提取单元,用于采用图片特征提取算法提取所述源视频帧的帧特征;
建立子单元,用于建立Lucene索引,给每一所述帧特征分配编号,并将具有编号的帧特征、该帧特征所属的源视频的信息以及该帧特征的来源帧的信息构成Lucene的一条记录,其中,编号为源视频的MD5值和帧图片的顺序序号的组合。
7.根据权利要求6中所述的基于Lucene的相似视频检索***,其特征在于,所述过滤模块包括:
获取单元,用于根据所述Lucene视频索引库的帧特征的编号获取每一所述相似帧及与所述相似帧相邻的左相似帧和右相似帧;
比对单元,用于分别将与所述相似帧相邻的所述左相似帧和所述右相似帧与与所述样本视频帧相邻的所述样本视频左帧和样本视频右帧进行相似比对,获得多个有效相似帧;
构造单元,将所述多个有效相似帧构成一所述帧集合。
8.根据权利要求7中所述的基于Lucene的相似视频检索***,其特征在于,所述获取模块还包括:
第二预处理单元,用于使用视频处理工具对所述样本视频进行预处理;
第二采样单元,用于使用视频提取工具对预处理后的样本视频按照第二时间间隔进行采样得到所述样本视频帧,并对所述样本视频帧的帧图片进行分辨率压缩。
CN201510785287.8A 2015-11-16 2015-11-16 一种基于Lucene的相似视频检索方法及*** Active CN106708876B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510785287.8A CN106708876B (zh) 2015-11-16 2015-11-16 一种基于Lucene的相似视频检索方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510785287.8A CN106708876B (zh) 2015-11-16 2015-11-16 一种基于Lucene的相似视频检索方法及***

Publications (2)

Publication Number Publication Date
CN106708876A CN106708876A (zh) 2017-05-24
CN106708876B true CN106708876B (zh) 2020-04-21

Family

ID=58932001

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510785287.8A Active CN106708876B (zh) 2015-11-16 2015-11-16 一种基于Lucene的相似视频检索方法及***

Country Status (1)

Country Link
CN (1) CN106708876B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108304506B (zh) * 2018-01-18 2022-08-26 腾讯科技(深圳)有限公司 检索方法、装置及设备
CN110474937A (zh) * 2018-05-09 2019-11-19 深圳企业云科技股份有限公司 超大文件分段续传方法及其***
CN109189969A (zh) * 2018-10-22 2019-01-11 镇江悦乐网络科技有限公司 一种基于图像序列的三维cg动画检索方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102549603A (zh) * 2009-08-24 2012-07-04 谷歌公司 基于相关性的图像选择
CN102799684A (zh) * 2012-07-27 2012-11-28 成都索贝数码科技股份有限公司 一种视音频文件编目标引、元数据存储索引与搜索方法
CN103593464A (zh) * 2013-11-25 2014-02-19 华中科技大学 基于视觉特征的视频指纹检测及视频序列匹配方法及***
CN103761252A (zh) * 2013-12-25 2014-04-30 北京航天测控技术有限公司 一种视频检索方法
CN104166685A (zh) * 2014-07-24 2014-11-26 北京捷成世纪科技股份有限公司 一种检测视频片段的方法和装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102436513B (zh) * 2012-01-18 2014-11-05 中国电子科技集团公司第十五研究所 分布式检索方法和***

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102549603A (zh) * 2009-08-24 2012-07-04 谷歌公司 基于相关性的图像选择
CN102799684A (zh) * 2012-07-27 2012-11-28 成都索贝数码科技股份有限公司 一种视音频文件编目标引、元数据存储索引与搜索方法
CN103593464A (zh) * 2013-11-25 2014-02-19 华中科技大学 基于视觉特征的视频指纹检测及视频序列匹配方法及***
CN103761252A (zh) * 2013-12-25 2014-04-30 北京航天测控技术有限公司 一种视频检索方法
CN104166685A (zh) * 2014-07-24 2014-11-26 北京捷成世纪科技股份有限公司 一种检测视频片段的方法和装置

Also Published As

Publication number Publication date
CN106708876A (zh) 2017-05-24

Similar Documents

Publication Publication Date Title
EP3477506B1 (en) Video detection method, server and storage medium
KR102082816B1 (ko) 스트리밍 파일의 해상도 개선 방법
CN108228696B (zh) 人脸图像检索方法和***、拍摄装置、计算机存储介质
JP5390506B2 (ja) ビデオ検出システムおよびビデオ検出方法
CN110008797B (zh) 一种多摄像机多人脸视频接续采集方法
CN108197265A (zh) 一种基于短视频搜索完整视频的方法及***
DE112016002175T5 (de) Entitätsbasierte temporale Segmentierung von Videostreams
CN105335387A (zh) 一种视频云存储***的检索方法
JP2005032246A (ja) 画像グループの表現方法および表現方法によって導出される記述子、探索方法、装置、コンピュータプログラム、ならびに記憶媒体
CN109195011B (zh) 一种视频处理方法、装置、设备及存储介质
JP2022518459A (ja) 情報処理方法および装置、記憶媒体
WO2017032245A1 (zh) 一种视频文件索引信息的生成方法和设备
WO2017000880A1 (zh) 信息处理方法、信息处理装置和视频监控***
CN106708876B (zh) 一种基于Lucene的相似视频检索方法及***
CN104298748A (zh) 一种用于视频中人脸检索的装置及方法
CN111368867B (zh) 档案归类方法及***、计算机可读存储介质
CN102682024A (zh) 未残缺jpeg文件碎片重组的方法
CN109660762A (zh) 智能抓拍装置中大小图关联方法及装置
KR20120090101A (ko) 디지털 비디오 고속 정합 시스템
CN110543584A (zh) 一种建立人脸索引的方法、装置、处理服务器及存储介质
KR20220032627A (ko) 프레임 처리방법 및 장치
CN110769259A (zh) 一种视频目标跟踪轨迹内容的图像数据压缩方法
CN112434049A (zh) 表格数据存储方法、装置、存储介质及电子装置
CN110460840B (zh) 基于三维密集网络的镜头边界检测方法
CN109241342B (zh) 基于深度线索的视频场景检索方法和***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant