CN101650740B - 一种电视广告检测方法及装置 - Google Patents

一种电视广告检测方法及装置 Download PDF

Info

Publication number
CN101650740B
CN101650740B CN2009101672490A CN200910167249A CN101650740B CN 101650740 B CN101650740 B CN 101650740B CN 2009101672490 A CN2009101672490 A CN 2009101672490A CN 200910167249 A CN200910167249 A CN 200910167249A CN 101650740 B CN101650740 B CN 101650740B
Authority
CN
China
Prior art keywords
camera lens
video
detected
database
advertisement
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2009101672490A
Other languages
English (en)
Other versions
CN101650740A (zh
Inventor
陈向文
朱明�
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Science and Technology of China USTC
Original Assignee
University of Science and Technology of China USTC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Science and Technology of China USTC filed Critical University of Science and Technology of China USTC
Priority to CN2009101672490A priority Critical patent/CN101650740B/zh
Publication of CN101650740A publication Critical patent/CN101650740A/zh
Application granted granted Critical
Publication of CN101650740B publication Critical patent/CN101650740B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Studio Devices (AREA)

Abstract

本发明公开了一种电视广告检测方法及装置,技术方案包括:根据待检测视频生成至少一个镜头;对所述镜头的图像特征进行提取,并用所述图像特征构建数据库,所述数据库存储有广告镜头以及对应的相关信息;对所述数据库中存储的所述相关信息进行检索,以便检测出重复出现的电视广告。本发明一种电视广告检测装置包括:镜头生成模块,数据控制模块以及广告检索模块。采用本发明的技术方案能够对视频中重复性的广告节目进行检测,提高了用户体验。

Description

一种电视广告检测方法及装置
技术领域
本发明涉及视频识别技术领域,具体的说,涉及一种电视广告检测方法及装置。
背景技术
目前,随着多媒体技术的迅速发展,电视广告在日常生活中占居的地位日益重要。由于电视广告重复的出现在电视节目中,不仅影响了观众收看电视节目的用户体验,还占用了大量的视频空间。
针对目前电视广告的特点,早期广告检测策略提出的基于台标和black/silent帧(黑色/无声帧)的检测方式已不再适用。一方面是因为现在电视台在播放广告的时候通常不会隐去台标,并且台标的形式也逐渐趋于复杂化,所以给基于台标的检测方式带来难题。另一方面,在普通节目和广告片段转换时并不总是存在black/silent帧,black/silent帧可以根据某种剪辑需要随机的***,这就直接导致基于black/silent帧检测方法的失败。
基于镜头的广告检测方法是通过从镜头中提取一些能够表示广告片段的特征,并利用这些特征将电视镜头分成普通节目镜头和广告镜头。由于这种方法通常只对镜头进行简单分类,不仅没有考虑如何消除错分广告镜头的影响,也没有考虑如何合并广告镜头得到广告片段的问题,并且现在很多技术都没有考虑广告内容的一致性,从而很难改善检测的效果。所以,这种方法即使在检测切变镜头方面取得很好的效果,但当检测消隐或者淡入淡出镜头时就会遇到问题。
基于数据库的广告检测方法是通过在数据库中预先存储定义的广告视频段的特征,利用此数据库识别嵌入在电视节目里面的广告段。这种方法必需配置一个足够大的数据库来存储已知的广告特征,维护工作量巨大,对于预先未存储在数据库中的广告视频段特征的内容就检测不出来。
在实现本发明的过程中,发明人发现如何能够快速的在大量视频中检测出电视广告是目前要解决的技术难题。
发明内容
本发明要解决的技术问题是,提供一种电视广告检测方法及装置,能够对视频流中重复出现的广告进行检测,提高用户的体验。
本发明的技术方案如下所述:
本发明提供了一种电视广告检测方法,技术方案包括:
根据待检测视频生成至少一个镜头;
对所述镜头的图像特征进行提取,并用所述图像特征构建数据库,所述数据库存储有广告镜头以及对应的相关信息;所述构建数据库具体包括:
提取至少一个镜头中所有图片的特征矩阵,将每个镜头的关键帧特征矩阵作为该镜头的图像特征;
根据所述图像特征,分别计算待检测视频中镜头与数据库中存储镜头之间的距离;
当待检测视频中镜头与数据库中存储镜头之间距离大于预定阈值时,确定数据库中存在与待检测视频镜头匹配的镜头,并更新所述数据库中保存的与该镜头对应的相关信息,否则,确定数据库中不存在与待检测视频镜头匹配的镜头,在所述数据库中添加该镜头对应的相关信息,所述相关信息包括待检测视频的文件名、每个镜头的特征矩阵、该镜头在待检测视频中的位置以及重复次数中的一种或多种;
对所述数据库中存储的所述相关信息进行检索,以便检测出重复出现的电视广告;对所述数据库中存储的所述相关信息进行检索,具体包括:
将所述数据库中重复次数相等且大于一的一组连续镜头以及对应的相关信息进行抽取;
通过预定条件对所述相关信息进行判断,当提取出的所述连续镜头均满足预定条件时,确定所述连续镜头为同一段广告,并根据所述连续镜头的位置信息确定该广告的位置;当所述连续镜头中包含不满足预定条件的镜头时,则确定从该镜头起始的下一镜头为另一段广告的起始镜头,根据该镜头的位置信息区分不同的广告,并确定每段广告的的位置;所述预定条件包括容器中的每个镜头的filename数组的相应位置上的数完全相同,以及后一个镜头的pos数组中的每一个结束帧与前一个镜头的pos数组中的相应的起始帧数值相差不超过500。
进一步,根据待检测视频生成至少一个镜头,具体包括:
将待检测的视频切分成至少一个图片;
根据镜头分割算法将所述至少一个图片生成至少一个镜头。
进一步,所述方法还包括:
预先设定镜头密度阈值,当根据待检测视频生成至少一个镜头后,当所述镜头密度大于所述镜头密度阈值时,确定该镜头为电视节目,并将电视节目从待检测视频中删除,否则,确定该镜头为广告节目保留。
本发明提供一种电视广告检测装置,技术方案包括:
镜头生成模块,用于根据待检测视频生成至少一个镜头;
数据控制模块,用于对所述镜头生成模块生成的所述镜头的图像特征进行提取,并用所述图像特征构建数据库,所述数据库存储有广告镜头以及对应的相关信息;所述数据控制模块具体包括:
特征提取单元,用于提取至少一个镜头中所有图片的特征矩阵,将每个镜头的关键帧特征矩阵作为该镜头的图像特征;
相似度计算单元,用于根据所述图像特征,分别计算待检测视频中镜头与数据库中存储镜头之间的距离;
判断处理单元,用于当待检测视频中镜头与数据库中存储镜头之间距离大于预定阈值时,确定数据库中存在与待检测视频镜头匹配的镜头,更新所述数据库中保存的与该镜头对应的相关信息,否则,确定数据库中不存在与待检测视频镜头匹配的镜头,在所述数据库中添加该镜头对应的相关信息,所述相关信息包括待检测视频的文件名、每个镜头的特征矩阵、该镜头在待检测视频中的位置以及重复次数中的一种或多种;
广告检索模块,用于对所述数据库中存储的所述相关信息进行检索,以便检测出重复性出现的电视广告;所述广告检索模块具体包括:
数据抽取单元,用于将所述数据库中重复次数相等且大于一的一组连续镜头以及对应的相关信息进行抽取;
数据检测单元,用于通过预定条件对所述相关信息进行判断,当提取出的所述连续镜头均满足预定条件时,确定所述连续镜头为同一段广告,并根据所述连续镜头的位置信息确定该广告的位置;当所述连续镜头中包含不满足预定条件的镜头时,则确定从该镜头起始的下一镜头为另一段广告的起始镜头,根据该镜头的位置信息区分不同的广告,并确定每段广告的的位置,所述预定条件包括容器中的每个镜头的filename数组的相应位置上的数完全相同,以及后一个镜头的pos数组中的每一个结束帧与前一个镜头的pos 数组中的相应的起始帧数值相差不超过500。
优选的,所述镜头生成模块具体包括:
视频处理单元,用于将待检测的视频切分成至少一个图片;
镜头切割单元,用于根据镜头分割算法将所述视频处理单元切分的至少一个图片生成至少一个镜头。
优选的,所述装置还包括:
镜头过滤模块,用于预先设定镜头密度阈值,当根据待检测视频生成至少一个镜头后,当所述镜头密度大于所述镜头密度阈值时,确定该镜头为电视节目,并将电视节目从待检测视频中删除,否则,确定该镜头为广告节目保留。
有益效果:
本发明采用基于广告重复性的检测方法,通过在构建数据库时保存的每个广告镜头的相关信息,只要是重复出现的广告镜头都可以检测出来,解决了应用现有数据库检测方法检测不到没有预先存储在数据库中的广告镜头样本的缺点。
附图说明
图1为本发明实施例一种电视广告检测方法流程图;
图2为本发明实施例一种电视广告检测装置结构示意图;
图3为本发明实施例一中视频检测流程图;
图4为本发明实施例一中图像特征提取时图像区域分割示意图。
具体实施方式
下面将结合具体实施例对本发明的技术方案做进一步说明。
本发明实施例一种电视广告检测方法及装置是根据视频图像特征,针对视频流中重复出现的广告节目进行检测,能够减少相同内容广告在同一视频中重复出现的次数,提高用户的体验。
由于本发明实施例的技术方案是基于提取图像特征的基础上的,不需要像基于镜头的广告检测方法那样,提取大量的广告特征来将视频中的镜头分类。由于现有的基于数据库的广告检测方法,需要预先在数据库中存储大量的广告镜头,对于数据库中没有预先储存的广告镜头无法检测的问题。本发明实施例数据库的建立和广告检测过程几乎是同时进行的,所以在更新了数据库之后,对数据库中的内容进行检索,可以获得重复出现的广告镜头以及对应的位置信息,便于对该镜头进行删除或屏蔽。
如图1所示,本发明实施例一种电视广告检测方法,可以通过如下技术方案实现:
步骤100:根据待检测视频生成至少一个镜头;
步骤200:对所述镜头的图像特征进行提取,并用所述图像特征构建数据库,所述数据库存储有广告镜头以及对应的相关信息;
步骤300:对所述数据库中存储的所述相关信息进行检索,以便检测出重复出现的电视广告。
在一个具体实施例中,步骤100具体可以通过如下技术方案实现:
(1)将待检测的视频切分成至少一个图片;
(2)根据镜头分割算法将所述至少一个图片生成至少一个镜头。
具体的,需要对视频流进行检测时,将视频流截取成若干图片,得到离散化的视频数据,这样可便于对该视频中内容进行检测。
本发明实施例中通过镜头分割法将截取获得的若干图片切割成镜头,每个镜头中包含若干个图片,通过镜头分割法能够获得每个镜头最后一帧的切点文件,以便获得每个镜头在该视频中的位置信息。其中,镜头分割法具体可以通过如下所述的技术方案实现:
本发明实施例中所采用的镜头分割算法是基于颜色直方图的镜头分割。分别统计图像的R,G,B三个分量的直方图,将256的区间等分成64段来统计,即有64bins,所以三个分量一共有192bins,可用向量表示为:B=(b1,b2,...,b192)。两幅图像的颜色直方图的差异程度可以由以下公式计算获得:
d A , B = Σ i = 1 192 ( a i - b i ) 2
在本发明实施例中将差异阈值取5×108,当d大于该阈值时,说明这两幅图像是镜头的切点,通过该切点即可获得该镜头在待检测视频中的位置。
在一个具体实施例中,一种电视广告检测方法还包括:
预先设定镜头密度阈值,当根据待检测视频生成至少一个镜头后,当所述镜头密度大于所述镜头密度阈值时,确定该镜头为电视节目,并将电视节目从待检测视频中删除,否则,确定该镜头为广告节目保留。
具体的,通常大于镜头密度阈值的镜头一定是电视节目,但是有的电视节目的镜头密度也会小于这个阈值;而广告的镜头密度肯定是小于该阈值,所以通过镜头密度阈值对生成的镜头进行初级过滤,可以大大减少了检测过程中的工作量,但很有可能在在留下的视频中还包含一部分电视节目和全部的广告。
在一个具体实施例中,步骤200具体可以通过如下技术方案实现:
(1)提取至少一个镜头中所有图片的特征矩阵,将每个镜头的关键帧特征矩阵作为该镜头的图像特征;
(2)根据所述图像特征,分别计算待检测视频中镜头与数据库中存储镜头之间的距离;
(3)当待检测视频中镜头与数据库中存储镜头之间距离大于预定阈值时,确定数据库中存在与待检测视频镜头匹配的镜头,并更新所述数据库中保存的与该镜头对应的相关信息,否则,确定数据库中不存在与待检测视频镜头匹配的镜头,在所述数据库中添加该镜头对应的相关信息,所述相关信息包括待检测视频的文件名、每个镜头的特征矩阵、该镜头在待检测视频中的位置以及重复次数中的一种或多种。
具体的,针对上述步骤(1)和(2)来说,本发明实施例中选择基于RGB颜色空间的图像特征作为每个镜头的图像特征。将R、G、B三个颜色分量的取值空间(0,255)分别等分成16个区间。形成一个16×16×16的颜色区间,分别统计每个颜色区间的像素占整幅图像的比例形成一个16×16×16的特征矩阵(double类型)。为了提高该特征的灵敏度,减小量化所带来的误差,本发明实施例不采用量化或归一化方法,而是直接将该double类型的特征矩阵作为图像特征。为了提高特征的灵敏度,本发明实施例将每一幅图像分割成5个区域,对每个区域分别计算16×16×16的特征矩阵。
由于本发明实施例对视频流的处理是基于镜头的,因此广告相识度计算归根究底是镜头相似度的计算,即镜头的距离。在确定了图像特征之后,为了将镜头的距离转化为图像的距离,根据在一个镜头内的各个图像帧的各种属性变化不大的理由,本发明实施例将关键帧定义为一个镜头内所有帧的对应属性的平均。因此本发明实施例中将每个镜头中所有图像帧的特征矩阵的平均值作为该镜头的关键帧特征矩阵。
在提取一个镜头的关键帧特征矩阵时,先提取镜头内所有图像帧的特征矩阵,然后求平均值,假设关键帧的特征矩阵为A,镜头内有n帧,第i帧的特征矩阵为Ai
A = A 1 + A 2 + . . . + A n n
在计算两个镜头间的距离时,引入向量距离的概念,向量L1和L2的距离为:
d = L 1 · L 2 | L 1 | | L 2 |
将关键帧的特征矩阵作为是一个16×16×16维的向量。则镜头A和B的距离为:
d AB = A · B | A | | B |
其中, A · B = Σ i = 0 15 Σ j = 0 15 Σ k = 0 15 a [ i ] [ j ] [ k ] * b [ i ] [ j ] [ k ] , | A | = Σ i = 0 15 Σ j = 0 15 Σ k = 0 15 ( a [ i ] [ j ] [ k ] ) 2
| B | = Σ i = 0 15 Σ j = 0 15 Σ k = 0 15 ( b [ i ] [ j ] [ k ] ) 2
由于本发明实施例将图像分割成5部分,所以计算两个镜头的距离时,5个部分的距离分别计算得到5个距离d1、d2、d3、d4、d5,到此判断两个镜头相似的条件有两种:
第一种:取 d = d 1 + d 2 + d 3 + d 4 + d 5 5 , 然后判断d是否大于某一阈值L;
第二种:判断d1、d2、d3、d4、d5是否都大于某一个阈值L;
本发明实施例为了提高准确度和灵敏度,优选第二种方法,取阈值L=0.95。
具体的,本发明实施例通过上述相似度计算方法,分别计算待检测视频中每个镜头与数据库中存储的镜头之间的距离,来确定数据库中是否包含有与待检测视频中匹配的镜头,以对数据库进行更新原有镜头数据或者添加新镜头数据的处理。
具体的,针对步骤200来说,本发明实施例中数据库的建立过程可以通过如下所述的数据库建立算法来实现:
步骤101:输入当前待检测视频的文件名;
步骤102:对该视频的每个镜头提取关键帧特征矩阵;
步骤103:通过计算待检测视频中每个镜头与数据库中存储的镜头之间的距离,来确定在数据库中是否包含与待检测视频镜头相匹配的镜头,若存在,用待检测视频中相匹 配的镜头以及相关信息,更新数据库中对应的镜头的相关信息,具体为:将匹配镜头对应的数据单元count(重复次数)值加1,并且在filename(文件名)数组里加上该视频的文件名,其中,文件名规定为int类型,同时在pos(位置)数组里加上该镜头在待检测视频中的位置;
若不存在,则在数据库中加上与该匹配镜头对应的数据单元,其中,将count值设置为1,在filename中加上当前视频的文件名,在pos数组中加上该镜头在视频中的位置。
在视频流结束之前,均需要通过步骤103对待检测视频镜头进行搜索,直到视频流结束。
关于数据单元的结构,可以通过如下方式定义:
typedef struct{
keyframe shot;          //关键帧特征矩阵
int count;              //镜头出现的次数统计
int filename[50];       //用存储出现该镜头的文件名
matchpair pos[50];      //用于存储镜头在视频中的位置
int shotbegin;          //当前处理镜头在当前视频中的起始帧
int shotend;            //当前处理镜头在当前视频中的结束帧
}shotcharacter;
在一个具体实施例中,步骤300具体可以通过如下所述的技术方案实现:
(1)将所述数据库中重复次数相等且大于一的一组连续镜头以及对应的相关信息进行抽取;
(2)通过预定条件对所述相关信息进行判断,当提取出的所述连续镜头均满足预定条件时,确定所述连续镜头为同一段广告,并根据所述连续镜头的位置信息确定该广告的位置;当所述连续镜头中包含不满足预定条件的镜头时,则确定从该镜头起始的下一镜头为另一段广告的起始镜头,根据该镜头的位置信息区分不同的广告,并确定每段广告的的位置。
具体的说,步骤300是在更新后的数据库中检索重复出现广告的过程。通常由于数据库中存储的最小数据单元是镜头,所以要将这些镜头合并生成广告片段。在完成这些后,可利用数据库中保存的镜头的相关信息(数据单元中的count属性、相似镜头的连续性以及filename的视频文件名)来确定所检测视频中是否包含重复出现的广告。在数据库中找出count值相同的一片连续的镜头,然后根据filename中的文件名和pos中的镜头位 置,确定每个视频文件中重复出现的广告的位置。步骤300的具体过程可以通过如下所述的广告检测算法来实现:
步骤201:搜索数据库,找出count值相等且count>1的连续(本发明实施例中连续是指中间断掉的镜头不能超过2个)的一组镜头,压入一个临时的容器中;本发明实施例中当count>1时,就可以判定出那些镜头是重复出现的广告的镜头;
步骤202:对临时容器中的数据进行判断,判断条件如下:
a.容器中的每个镜头的filename数组的相应位置上的数完全相同;
b.后一个镜头的pos数组中的每一个结束帧与前一个镜头的pos数组中的相应的起始帧数值相差不超过500;
若镜头均满足上述条件a和b,则说明容器中的这一组连续的镜头都是同一段广告的,由于数据库中存储的镜头都是独立的,所以根据预定条件将这一组连续的独立的镜头连接起来,组合成一段广告,并根据每个镜头的相关信息中pos数组的位置信息确定该广告段的位置,并输出该广告的位置;
若有镜头不满足其中任何一个条件,则说明该以镜头开始的下一镜头是另外一个广告的,而两端广告之间的分界处就是那个不能同时满足这两个条件的那个镜头,由此可以将两个不同广告分割出来,并根据不满足预定条件的镜头的相关信息中的pos数组的位置信息,确定每段广告的位置,并输出;
步骤203:清空临时容器,回到步骤201停下来的地方继续执行,直到数据检测完毕。
通过上述本发明一种广告检测方法,通过实现证明广告图像的召回率可达94.572%,准确率达93.472%,能够实现对视频流中出现两次或两次以上的广告片段进行检测。
如图2所示,基于上述图1的方法实施例,本发明实施例提出一种电视广告检测装置,可以通过如下技术方案实现:
镜头生成模块11,用于根据待检测视频生成至少一个镜头;
数据控制模块22,用于对所述镜头生成模块11生成的所述镜头的图像特征进行提取,并用所述图像特征构建数据库,所述数据库存储有广告镜头以及对应的相关信息;
广告检索模块33,用于对所述数据库中存储的所述相关信息进行检索,以便检测出重复性出现的电视广告。
在一个具体实施例中,所述镜头生成模块11具体包括:
视频处理单元111,用于将待检测的视频切分成至少一个图片;
镜头切割单元112,用于根据镜头分割算法将所述视频处理单元切分的至少一个图片生成至少一个镜头。
在一个具体实施例中,,所述数据控制模块22具体包括:
特征提取单元221,用于提取至少一个镜头中所有图片的特征矩阵,将每个镜头的关键帧特征矩阵作为该镜头的图像特征;
相似度计算单元222,用于根据所述图像特征,分别计算待检测视频中镜头与数据库中存储镜头之间的距离;
判断处理单元223,用于当待检测视频中镜头与数据库中存储镜头之间距离大于预定阈值时,确定数据库中存在与待检测视频镜头匹配的镜头,更新所述数据库中保存的与该镜头对应的相关信息,否则,确定数据库中不存在与待检测视频镜头匹配的镜头,在所述数据库中添加该镜头对应的相关信息,所述相关信息包括待检测视频的文件名、每个镜头的特征矩阵、该镜头在待检测视频中的位置以及重复次数中的一种或多种。
在一个具体实施例中,,所述广告检索模块33具体包括:
数据抽取单元331,用于将所述数据库中重复次数相等且大于一的一组连续镜头以及对应的相关信息进行抽取;
数据检测单元332,用于通过预定条件对所述相关信息进行判断,当提取出的所述连续镜头均满足预定条件时,确定所述连续镜头为同一段广告,并根据所述连续镜头的位置信息确定该广告的位置;当所述连续镜头中包含不满足预定条件的镜头时,则确定从该镜头起始的下一镜头为另一段广告的起始镜头,根据该镜头的位置信息区分不同的广告,并确定每段广告的的位置。
在一个具体实施例中,,所述装置还包括:
镜头过滤模块44,用于预先设定镜头密度阈值,当根据待检测视频生成至少一个镜头后,当所述镜头密度大于所述镜头密度阈值时,确定该镜头为电视节目,并将电视节目从待检测视频中删除,否则,确定该镜头为广告节目保留。
鉴于本发明实施例是鉴于上述图1所述的方法实施例获得的,具体涉及的技术方案可以参见上述图1实施例,不再一一赘述。
实施例一:
下面结合实施例一对本发明的技术方案进行说明。
结合图1和图2所示的方法和装置,例如要检测3段长度为30分钟到40分钟的视频,这3段视频的文件名是filel,file2和file3,输出的广告位置的格式为filename[a,b],其中filename是文件名,a是广告片段的起始帧,b是广告片段的结束帧。
如图3所示为本发明实施例一中的视频检测流程图,具体如下:
步骤501:对第一段待检测视频通过ffmpeg软件,按照25帧/s的速度截取图片,得到离散化的视频,每个图像的大小是448×336,格式是jpg;
步骤502:利用镜头分割算法,对这些图片进行镜头切割,得到每个镜头的最后一帧的切点文件,其中,切点文件是.txt格式,其中记录了每个镜头的最后一帧;镜头分割法的具体过程请参见上述方法实施例中的步骤100:
步骤503:利用广告的镜头切换速度远大于常规电视节目的特性,通过预先设定镜头密度的阈值,扫描得到的切点文件,当镜头密度(单位时间内的镜头切换个数)大于阈值,则确定这些镜头是电视节目,可以剔除;如此扫描直至扫描完整个切点文件,得到一个记录了除了被剔除镜头外的所有镜头的起始帧和结束帧新的镜头文件;
步骤504:对新镜头文件里的镜头提取图像特征(关键帧特征矩阵),图4示出在进行图像特征提取时将图像区域分割为5个部分。镜头的特征大小为5×16×16×16×32=640kb,根据计算待检测视频中每个镜头与数据库中存储镜头之间的距离,确定数据库中是否存在与待检测视频中匹配的镜头,具体可以根据数据库建立算法来处理(具体过程请参见上述方法实施例步骤200),当新镜头的图像特征在数据库中存在时,用所述图像特征更新所述数据库中该镜头对应的相关信息,当不存在时,确定该视频镜头为新的镜头,通过数据库建立算法将新的镜头的相关信息保存在数据库中;在这个步骤中将分别对待检测的3段视频执行数据库建立算法的处理;
步骤505:通过上述广告检索算法(具体过程请参见上述方法实施例中步骤300),对数据库中保存的与待检测镜头对应的相关信息进行处理,最终将会获得重复出现的广告视频在待检测视频中重复出现的广告位置。
基于上述实施例一中所述的步骤,当检测出重复出现的广告视频时,可以针对这些重复的内容屏蔽或者删除,来保证用户的体验,准确率较高。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求书的保护范围为准。

Claims (6)

1.一种电视广告检测方法,其特征在于,包括:
根据待检测视频生成至少一个镜头;
对所述镜头的图像特征进行提取,并用所述图像特征构建数据库,所述数据库存储有广告镜头以及对应的相关信息;所述构建数据库具体包括:
提取至少一个镜头中所有图片的特征矩阵,将每个镜头的关键帧特征矩阵作为该镜头的图像特征;
根据所述图像特征,分别计算待检测视频中镜头与数据库中存储镜头之间的距离;
当待检测视频中镜头与数据库中存储镜头之间距离大于预定阈值时,确定数据库中存在与待检测视频镜头匹配的镜头,并更新所述数据库中保存的与该镜头对应的相关信息,否则,确定数据库中不存在与待检测视频镜头匹配的镜头,在所述数据库中添加该镜头对应的相关信息,所述相关信息包括待检测视频的文件名、每个镜头的特征矩阵、该镜头在待检测视频中的位置以及重复次数中的一种或多种;
对所述数据库中存储的所述相关信息进行检索,以便检测出重复出现的电视广告;对所述数据库中存储的所述相关信息进行检索,具体包括:
将所述数据库中重复次数相等且大于一的一组连续镜头以及对应的相关信息进行抽取;
通过预定条件对所述相关信息进行判断,当提取出的所述连续镜头均满足预定条件时,确定所述连续镜头为同一段广告,并根据所述连续镜头的位置信息确定该广告的位置;当所述连续镜头中包含不满足预定条件的镜头时,则确定从该镜头起始的下一镜头为另一段广告的起始镜头,根据该镜头的位置信息区分不同的广告,并确定每段广告的的位置;所述预定条件包括容器中的每个镜头的filename数组的相应位置上的数完全相同,以及后一个镜头的pos数组中的每一个结束帧与前一个镜头的pos数组中的相应的起始帧数值相差不超过500;所述filename数组用于存储出现所述镜头的视频文件名;所述pos数组用于存储所述镜头在所述视频中的位置。
2.根据权利要求1所述检测方法,其特征在于,根据待检测视频生成至少一个镜头,具体包括:
将待检测的视频切分成至少一个图片;
根据镜头分割算法将所述至少一个图片生成至少一个镜头。
3.根据权利要求1所述的检测方法,其特征在于,所述方法还包括:
预先设定镜头密度阈值,当根据待检测视频生成至少一个镜头后,当镜头密度大于所述镜头密度阈值时,确定该镜头为电视节目,并将电视节目从待检测视频中删除,否则,确定该镜头为广告节目保留。
4.一种电视广告检测装置,其特征在于,包括:
镜头生成模块,用于根据待检测视频生成至少一个镜头;
数据控制模块,用于对所述镜头生成模块生成的所述镜头的图像特征进行提取,并用所述图像特征构建数据库,所述数据库存储有广告镜头以及对应的相关信息;所述数据控制模块具体包括:
特征提取单元,用于提取至少一个镜头中所有图片的特征矩阵,将每个镜头的关键帧特征矩阵作为该镜头的图像特征;
相似度计算单元,用于根据所述图像特征,分别计算待检测视频中镜头与数据库中存储镜头之间的距离;
判断处理单元,用于当待检测视频中镜头与数据库中存储镜头之间距离大于预定阈值时,确定数据库中存在与待检测视频镜头匹配的镜头,更新所述数据库中保存的与该镜头对应的相关信息,否则,确定数据库中不存在与待检测视频镜头匹配的镜头,在所述数据库中添加该镜头对应的相关信息,所述相关信息包括待检测视频的文件名、每个镜头的特征矩阵、该镜头在待检测视频中的位置以及重复次数中的一种或多种;
广告检索模块,用于对所述数据库中存储的所述相关信息进行检索,以便检测出重复性出现的电视广告;所述广告检索模块具体包括:
数据抽取单元,用于将所述数据库中重复次数相等且大于一的一组连续镜头以及对应的相关信息进行抽取;
数据检测单元,用于通过预定条件对所述相关信息进行判断,当提取出的所述连续镜头均满足预定条件时,确定所述连续镜头为同一段广告,并根据所述连续镜头的位置信息确定该广告的位置;当所述连续镜头中包含不满足预定条件的镜头时,则确定从该镜头起始的下一镜头为另一段广告的起始镜头,根据该镜头的位置信息区分不同的广告,并确定每段广告的的位置,所述预定条件包括容器中的每个镜头的filename数组的相应位置上的数完全相同,以及后一个镜头的pos数组中的每一个结束帧与前一个镜头的pos数组中的相应的起始帧数值相差不超过500;所述filename数组用于存储出现所述镜头的视频文件名;所述pos数组用于存储所述镜头在所述视频中的位置。
5.根据权利要求4所述检测装置,其特征在于,所述镜头生成模块具体包括:
视频处理单元,用于将待检测的视频切分成至少一个图片;
镜头切割单元,用于根据镜头分割算法将所述视频处理单元切分的至少一个图片生成至少一个镜头。
6.根据权利要求4所述检测装置,其特征在于,所述装置还包括:
镜头过滤模块,用于预先设定镜头密度阈值,当根据待检测视频生成至少一个镜头后,当镜头密度大于所述镜头密度阈值时,确定该镜头为电视节目,并将电视节目从待检测视频中删除,否则,确定该镜头为广告节目保留。
CN2009101672490A 2009-08-27 2009-08-27 一种电视广告检测方法及装置 Expired - Fee Related CN101650740B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2009101672490A CN101650740B (zh) 2009-08-27 2009-08-27 一种电视广告检测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2009101672490A CN101650740B (zh) 2009-08-27 2009-08-27 一种电视广告检测方法及装置

Publications (2)

Publication Number Publication Date
CN101650740A CN101650740A (zh) 2010-02-17
CN101650740B true CN101650740B (zh) 2011-09-21

Family

ID=41672978

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009101672490A Expired - Fee Related CN101650740B (zh) 2009-08-27 2009-08-27 一种电视广告检测方法及装置

Country Status (1)

Country Link
CN (1) CN101650740B (zh)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2579258A1 (en) * 2011-10-04 2013-04-10 Thomson Licensing Method of automatic management of a collection of images and corresponding device
CN102404064B (zh) * 2011-11-30 2018-03-23 上海博泰悦臻电子设备制造有限公司 电台广告屏蔽方法和***
CN103425474B (zh) 2012-05-24 2016-08-17 国际商业机器公司 用于获取屏幕快照中的内容的方法和设备
CN103237233B (zh) * 2013-03-28 2017-01-25 深圳Tcl新技术有限公司 一种电视广告的快速检测方法及***
CN103248953B (zh) * 2013-04-24 2017-04-19 Tcl集团股份有限公司 一种电视广告时间的处理方法、***及电视节目播放终端
CN104185017B (zh) * 2013-05-23 2017-02-08 中国科学院深圳先进技术研究院 视频匹配方法和***
CN104424436B (zh) * 2013-08-28 2019-02-15 腾讯科技(深圳)有限公司 一种恶意广告识别方法及装置
CN104636940A (zh) * 2013-11-07 2015-05-20 深圳市腾讯计算机***有限公司 广告投放方法及***、广告筛选方法及装置、服务器
CN103596016B (zh) * 2013-11-20 2018-04-13 韩巍 一种多媒体视频数据处理方法和装置
CN106375847A (zh) * 2015-07-23 2017-02-01 无锡天脉聚源传媒科技有限公司 一种生成模板的方法、装置、视频的更新方法及装置
CN106372092A (zh) * 2015-07-23 2017-02-01 无锡天脉聚源传媒科技有限公司 一种生成模板的方法、装置、视频的更新方法及装置
JP6524899B2 (ja) * 2015-12-02 2019-06-05 富士通株式会社 秘匿データ照合装置、秘匿データ照合プログラムおよび秘匿データ照合方法
CN105760472A (zh) * 2016-02-06 2016-07-13 中国农业大学 视频检索方法及***
CN107169004B (zh) * 2017-03-31 2021-07-30 北京奇艺世纪科技有限公司 一种特征数据库更新方法及装置
CN107133266B (zh) * 2017-03-31 2020-02-18 北京奇艺世纪科技有限公司 视频镜头类别的检测方法及装置和数据库更新方法及装置
CN107135401B (zh) * 2017-03-31 2020-03-27 北京奇艺世纪科技有限公司 关键帧选取方法及***
CN107133264A (zh) * 2017-03-31 2017-09-05 北京奇艺世纪科技有限公司 镜头的检测方法及装置和广告数据库的更新方法及装置
CN107729489A (zh) * 2017-10-17 2018-02-23 北京京东尚科信息技术有限公司 广告文本识别方法和装置
CN108153882A (zh) * 2017-12-26 2018-06-12 中兴通讯股份有限公司 一种数据处理方法及装置
CN108470290A (zh) * 2018-03-28 2018-08-31 百度在线网络技术(北京)有限公司 广告检测方法、装置及服务器
CN108540833A (zh) * 2018-04-16 2018-09-14 北京交通大学 一种基于镜头的电视广告识别方法
CN109189991B (zh) * 2018-08-17 2021-06-08 百度在线网络技术(北京)有限公司 重复视频识别方法、装置、终端及计算机可读存储介质
CN111008868A (zh) * 2019-12-05 2020-04-14 秒针信息技术有限公司 一种广告监测方法、***和计算机可读存储介质

Also Published As

Publication number Publication date
CN101650740A (zh) 2010-02-17

Similar Documents

Publication Publication Date Title
CN101650740B (zh) 一种电视广告检测方法及装置
US8295611B2 (en) Robust video retrieval utilizing audio and video data
US6501856B2 (en) Scheme for extraction and recognition of telop characters from video data
CN100499751C (zh) 运动图像分割设备、字幕提取设备和方法
US8316301B2 (en) Apparatus, medium, and method segmenting video sequences based on topic
US9087125B2 (en) Robust video retrieval utilizing video data
US7983340B2 (en) Extracting key frames from video using a triangle model of motion based on perceived motion energy
CN101427250B (zh) 对数据流创建摘要的数据摘要***和方法
US20130163864A1 (en) Video detection system and methods
JP2004357302A (ja) コンテンツベースのビデオタイムラインを使用してビデオ内の位置を識別する方法およびシステム
EP1459518A1 (en) Family histogram based techniques for detection of commercials and other video content
Oh et al. Content-based scene change detection and classification technique using background tracking
EP2104937B1 (fr) Procede de creation d'un nouveau sommaire d'un document audiovisuel comportant deja un sommaire et des reportages et recepteur mettant en oeuvre le procede
CN103514248A (zh) 视频记录设备、信息处理***、信息处理方法和记录介质
KR100612842B1 (ko) 앵커 샷 결정방법 및 결정장치
WO2010078629A1 (en) A system for real time near-duplicate video detection
KR101536930B1 (ko) 동영상을 요약하는 방법 및 동영상 요약기, 그리고 이를 이용한 동영상 만화 정보 서비스 방법
WO2000067204A2 (en) Image analysis process
Yu et al. A multi-resolution video segmentation scheme for wipe transition identification
KR20050033075A (ko) 비디오 이미지들의 시퀀스에서 콘텐트 속성을 검출하는 유닛 및 방법
KR20100109345A (ko) 방송통신시스템에서 시공간적 특징정보 추출 및 비교판별 장치 및 방법
Quénot TREC-10 Shot Boundary Detection Task: CLIPS System Description and Evaluation.
Kim et al. An efficient graphical shot verifier incorporating visual rhythm
Detyniecki et al. Video rushes summarization by adaptive acceleration and stacking of shots
Chen et al. Using content-based search to download digital video into a client station

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110921

Termination date: 20150827

EXPY Termination of patent right or utility model