CN106845483A - 一种视频高清字样检测方法 - Google Patents

一种视频高清字样检测方法 Download PDF

Info

Publication number
CN106845483A
CN106845483A CN201710075217.2A CN201710075217A CN106845483A CN 106845483 A CN106845483 A CN 106845483A CN 201710075217 A CN201710075217 A CN 201710075217A CN 106845483 A CN106845483 A CN 106845483A
Authority
CN
China
Prior art keywords
high definition
printed words
video
image
detection method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710075217.2A
Other languages
English (en)
Inventor
郑茂宗
杭欣
郭伟伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Arcvideo Technology Co ltd
Original Assignee
Hangzhou Arcvideo Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Arcvideo Technology Co ltd filed Critical Hangzhou Arcvideo Technology Co ltd
Priority to CN201710075217.2A priority Critical patent/CN106845483A/zh
Publication of CN106845483A publication Critical patent/CN106845483A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/635Overlay text, e.g. embedded captions in a TV program
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/42Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation
    • G06V10/431Frequency domain transformation; Autocorrelation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • G06V10/507Summing image-intensity values; Histogram projection analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种视频高清字样检测方法,包括:从每帧图像中获取“高清”字样的候选位置;提取“高清”字样候选位置的图像特征;按照设定比例输入正负样本进行“难例挖掘”得出判定器最优参数;对所提取的图像特征进行SVM判别,确定图片是否含有“高清”字样。本发明通过预先计算“高清”字样的候选位置的方式确定待提取图像特征的区间,对该区间采用交叉验证和“难例挖掘”的方法计算出使得SVM判定结果的正确率收敛的判定器最优参数,进而通过所述参数集对视频中所有图片进行SVM判定,有效提高“高清”字样判断的正确性的同时,提高了对不同电台产生的“高清”字样的模糊兼容能力,大大提高了高清视频检测的速度和效率。

Description

一种视频高清字样检测方法
技术领域
本发明涉及一种视频高清字样检测方法,尤其涉及一种模式识别技术领域的高清字样检测方法。
背景技术
相比标准清晰度电视,高清电视的图像分辨率成倍提高,很好地满足了观众对音画节目的欣赏需求。因此广电总局相继出台一系列促进高清电视发展政策。然而在高清电视的发展之初,仍存在高清节目源缺乏;频道高、标清节目变换和标识不规范等问题。因此,加强对高清节目和相关技术指标的监测,有利于促进高清电视发展,维护广大电视用户的权益。其中“高清”字样的检测是非常重要的监测目标之一。
已有的“高清”字样检测方法主要是通过模板匹配的方法进行检测。该方法易受背景信息的干扰。此外由于不同电视台的“高清”字样存在差异,这造成基于模板匹配的方法需要存储每个电视台的“高清”字样,并逐一匹配模板,导致检测速度慢。
发明内容
针对“高清”字样检测技术中存在的不足,本发明一种视频高清字样检测方法,通过预先计算“高清”字样的候选位置的方式确定待提取图像特征的区间,对该区间采用交叉验证和“难例挖掘”的方法计算出使得SVM判定结果的正确率收敛的判定器最优参数,进而通过该参数集对视频中所有图片进行SVM判定,有效提高“高清”字样判断正确性的同时,提高了对不同电台产生的“高清”字样的模糊兼容能力,大大提高了高清视频检测的速度和效率。
本发明解决其技术问题所采用的技术方案包括以下步骤:
计算候选位置步骤,采用特定方法确定输入视频图像中“高清”字样的候选位置。
优选的,所述特定方法包括:滑动窗口法和记忆上一图片候选位置法。
优选的,若为第一帧图像或者上一帧图像未检测到“高清”字样,则使用滑动窗口法确定候选位置;否则,使用两种方法共同确定候选位置。
提取图像特征步骤,对“高清”字样候选位置的图片区域提取图像特征。
优选的,所述图像特征包括空间域特征和频域特征。
优选的,所述空间域特征使用方向梯度直方图(Histogram of OrientedGradient , HOG)特征;所述频域特征通过离散傅立叶变换(Discrete CosineTransformation , DCT)提取。
计算判定器最优参数步骤,离线模式下输入已知判定结果的图片给SVM进行“难例挖掘”训练学习,得出判定器最优参数。
优选的,输入为已知判定结果的正负数据样本,输出为高斯核-SVM向量参数集,执行方式为交叉验证。
优选的,所述正负样本分别为含有“高清”字样的图片特征和不含“高清”字样的图片特征,且按1:1比例投放。
优选的,在每次所述“难例挖掘”训练学习结束后,将被误判为正样本的负样本加入下一次“难例挖掘”的负样本池,以提高判定正确率。
优选的,所述“难例挖掘”学习结束的条件为,应用上一次计算得到的参数集进行SVM判定,得到的判定结果正确率收敛。
在线判定步骤,采用指定的SVM判定器最优参数对视频中的所有图像进行“高清”字样检测判定。
优选的,根据所述计算判定器最优参数步骤计算得出的最优判定参数,对视频中所有图像经所述提取图像特征步骤提取的图像特征进行判定操作,若存在一个候选位置包含“高清”字样,则认为该图像存在“高清”字样。
采用上述技术方案,本发明具有以下优点:
本发明涉及一种视频高清字样检测方法,通过预先计算“高清”字样的候选位置的方式确定待提取图像特征的区间,对该区间采用交叉验证和“难例挖掘”的方法计算出使得SVM判定结果的正确率收敛的判定器最优参数,进而通过该参数集对视频中所有图片进行SVM判定,有效提高了“高清”判断的正确性的同时,提高了对不同电台产生的“高清”字样的模糊兼容能力,大大提高了高清视频检测的速度和效率。
附图说明
图1为本发明较佳实施方式的一种视频高清字样检测方法的步骤示意图。
图2为本发明较佳实施方式的一种视频高清字样检测方法的详细流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例仅仅是本发明的一个实施例,而不是全部实施例。基于本发明中的实施例,本领域的一般技术人员在没有做出创造性劳动的前提下所获得的其他实施例,都属于本发明保护的范围。
本发明实施例公开了一种视频高清字样检测方法,参见图1所示,该方法包括:
步骤S1:从每帧图像中获取“高清”字样的候选位置;
步骤S2:提取“高清”字样候选位置的图像特征;
步骤S3:按照设定比例输入正负样本进行“难例挖掘”得出判定器最优参数;
步骤S4:对所提取的图像特征进行SVM判别,确定图片是否含有“高清”字样。
本发明实施例中,通过对滑动窗口和记忆上一帧图像候选位置的方法计算视频图像中“高清”字样出现的候选位置,进而提取该区域图像的区域特征和频域特征作为“高清”字样判定的输入,通过“难例挖掘”交叉验证的方法获得判定器最优参数,最后通过所述参数集采用高斯核-SVM对视频中的每帧图像进行“高清”字样判定。
可见,本发明实施例中,通过交叉验证和“难例挖掘”的方法计算出使得SVM判定结果的正确率收敛的判定器最优参数,进而通过该参数集对视频中所有图片进行SVM判定,有效提高了“高清”判断的正确性的同时,提高了对不同电台产生的“高清”字样的模糊兼容能力,大大提高了高清视频检测的速度和效率。
本发明实施例公开了一种视频高清字样检测方法,参见图2,相对上一实施例,本实施例对技术方案作了进一步的说明和优化。具体的,本实施例中一种视频高清字样检测方法包含以下步骤:
S1:计算候选位置。
优选的,所述步骤中,采用特定方法确定输入视频图像中“高清”字样的候选位置。
优选的,当输入第一张视频图像或者上一帧图像未检测到“高清”字样时,执行步骤S11采用活动窗口法计算“高清”字样的候选位置。
优选的,当检测到上一张图像存在“高清”字样候选位置时,执行步骤S12通过记忆上一帧图像的“高清”字样候选位置法并结合S11共同确定本次图片的“高清”字样候选位置。
S2:提取图像特征。
优选的,所述步骤中,对“高清”字样候选位置的图片区域提取图像特征。
优选的,通过执行步骤S21方向梯度直方图提取空间域特征。
优选的,通过执行步骤S22将步骤S1中获得的候选位置图像缩小成32*32大小,进而执行步骤S23对所得图像进行二维DCT变换,最后执行步骤S24对变换所得结果进行提取8*8频域特征。
S3:计算判定器最优参数。
优选的,所述步骤中,离线模式下输入已知判定结果的图片给SVM,通过交叉验证的方式进行“难例挖掘”训练学习,得出判定器最优参数。
优选的,通过执行步骤S31将包含“高清”字样的区域图像和不含“高清”字样的区域图像按照1:1比例输入SVM进行“难例挖掘”判定训练。
优选的,针对步骤S31执行得到的结果,执行步骤S32提取结果中被误判为正样本的负样本然后执行步骤S33。
优选的,通过执行步骤S33来收集步骤S31产生的高斯核-SVM向量机参数,进而执行步骤S34。
优选的,通过步骤S34判断步骤S31执行后得到的SVM判定结果,若所述结果不收敛,则将步骤S32中提取的负样本加入新的负样本池后重复步骤S31到步骤S34的执行过程持续修正步骤S31执行得到的高斯核-SVM向量机参数集,直至步骤S34得到的判定结果收敛。
S4:在线判定。
优选的,所述步骤中,采用指定的SVM判定器最优参数对视频中的所有图像进行“高清”字样检测判定。
优选的,当步骤S34得到的判定结果收敛,则执行步骤S4,应用S34收集到的高斯核-SVM向量机参数集,对目标视频的所有图像经过步骤S1和S2后的到的图像特征进行在线SVM“高清”字样检测,对于每一帧图像,若存在一个候选位置包含“高清”字样,则认为该帧图像包含“高清”字样。
综上所述,通过执行步骤S1来确定“高清”字样候选位置,具体地首先对于视频图像的第一帧或者前一帧为检测到“高清”字样的情况执行步骤S11采用滑动窗口法计算图像“高清”字样的候选位置,否则执行步骤S12记忆上一帧图像“高清”字样候选位置法初步确定候选位置后,进一步执行步骤S11来共同确定“高清”字样的候选位置,针对所述“高清”字样候选位置图像区域执行步骤S2,提取候选区域图像特征,具体的首选执行步骤S21采用方向梯度直方图提取空间域特征,然后执行步骤S22将图像区域压缩为32*32大小格式后执行步骤S23对所述压缩后图像进行二维DCT变换,最后对变换结果执行步骤S24提取图像的低频8*8系数,对步骤S2执行得到的结果执行步骤S3,选择已知判定结果的图像进行“难例挖掘”得出判定参数,具体的先执行步骤S31,将含有“高清”字样的图像特征和不含“高清”字样的图像特征分别作为正负样本集按照1:1比例输入高斯核-SVM进行“难例挖掘”训练,然后执行步骤S32提取步骤S31判定结果中被误判为正样本的负样本,并将所述负样本注入新的负样本池,进而执行步骤S33收集步骤S31产生的高斯核-SVM向量机参数,最后执行步骤S34,判断S31执行结果的正确率是否收敛,若未收敛,则将步骤S32产生的新的负样本池作为新的负样本输入重复执行步骤S31至S34直至S31的执行结果正确率收敛为止,执行完S3最后执行S4,应用S3产生的高斯核-SVM向量机参数,对目标视频的所有图像经过步骤S1和S2后的到的图像特征进行在线SVM“高清”字样检测,对于每一帧图像,若存在一个候选位置包含“高清”字样,则认为该帧图像包含“高清”字样。通过预先计算“高清”字样的候选位置的方式确定待提取图像特征的区间,对该区间采用交叉验证和“难例挖掘”的方法计算出使得SVM判定结果的正确率收敛的判定器最优参数,进而通过该参数集对视频中所有图片进行SVM判定,有效提高了“高清”判断的正确性的同时,提高了对不同电台产生的“高清”字样的模糊兼容能力,大大提高了高清视频检测的速度和效率。
以上所述仅为举例性,而非为限制性。本领域的技术人员可以对发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包括这些改动和变型在内。

Claims (10)

1.一种视频高清字样检测方法,其特征在于,该方法包含以下步骤:
计算候选位置步骤,采用特定方法确定输入视频图像中“高清”字样的候选位置;
提取图像特征步骤,对“高清”字样候选位置的图片区域提取图像特征;
计算判定器最优参数步骤,离线模式下输入已知判定结果的图片给SVM进行“难例挖掘”训练学习,得出判定器最优参数;
在线判定步骤,采用指定的SVM判定器最优参数对视频中的所有图像进行“高清”字样检测判定。
2.如权利要求1所述的一种视频高清字样检测方法,其特征在于,
所述计算候选位置步骤中,所述特定方法包括:滑动窗口法和记忆上一图片候选位置法。
3.如权利要求2所述的一种视频高清字样检测方法,其特征在于,
若为第一帧图像或者上一帧图像未检测到“高清”字样,则使用滑动窗口法确定候选位置;否则,使用两种方法共同确定候选位置。
4.如权利要求1所述的一种视频高清字样检测方法,其特征在于,
所述提取图像特征步骤中,所述图像特征包括空间域特征和频域特征。
5.如权利要求4所述的一种视频高清字样检测方法,其特征在于,
所述空间域特征使用方向梯度直方图(Histogram of Oriented Gradient , HOG)特征;所述频域特征通过离散傅立叶变换(Discrete Cosine Transformation , DCT)提取。
6.如权利要求1所述的一种视频高清字样检测方法,其特征在于,
所述计算判定器最优参数步骤中,输入为已知判定结果的正负数据样本,输出为高斯核-SVM向量参数集,执行方式为交叉验证。
7.如权利要求6所述的一种视频高清字样检测方法,其特征在于,
所述正负样本分别为含有“高清”字样的图片特征和不含“高清”字样的图片特征,且按1:1比例投放。
8.如权利要求6所述的一种视频高清字样检测方法,其特征在于,
在每次所述“难例挖掘”训练学习结束后,将被误判为正样本的负样本加入下一次“难例挖掘”的负样本池,以提高判定正确率。
9.如权利要求1所述的一种视频高清字样检测方法,其特征在于,
所述计算判定器最优参数步骤中,所述“难例挖掘”学习结束的条件为,应用上一次计算得到的参数集进行SVM判定,得到的判定结果正确率收敛。
10.如权利要求1所述的一种视频高清字样检测方法,其特征在于,
所述在线判定步骤中,根据所述计算判定器最优参数步骤计算得出的最优判定参数,对视频中所有图像经所述提取图像特征步骤提取的图像特征进行判定操作,若存在一个候选位置包含“高清”字样,则认为该图像存在“高清”字样。
CN201710075217.2A 2017-02-10 2017-02-10 一种视频高清字样检测方法 Pending CN106845483A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710075217.2A CN106845483A (zh) 2017-02-10 2017-02-10 一种视频高清字样检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710075217.2A CN106845483A (zh) 2017-02-10 2017-02-10 一种视频高清字样检测方法

Publications (1)

Publication Number Publication Date
CN106845483A true CN106845483A (zh) 2017-06-13

Family

ID=59127993

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710075217.2A Pending CN106845483A (zh) 2017-02-10 2017-02-10 一种视频高清字样检测方法

Country Status (1)

Country Link
CN (1) CN106845483A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107463954A (zh) * 2017-07-21 2017-12-12 华中科技大学 一种模糊异谱图像的模板匹配识别方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102663357A (zh) * 2012-03-28 2012-09-12 北京工业大学 基于颜色特征的停车场车位检测算法
CN105139004A (zh) * 2015-09-23 2015-12-09 河北工业大学 基于视频序列的人脸表情识别方法
CN106157308A (zh) * 2016-06-30 2016-11-23 北京大学 矩形目标物检测方法
CN106331752A (zh) * 2016-08-31 2017-01-11 杭州当虹科技有限公司 一种流媒体视频文件的保护方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102663357A (zh) * 2012-03-28 2012-09-12 北京工业大学 基于颜色特征的停车场车位检测算法
CN105139004A (zh) * 2015-09-23 2015-12-09 河北工业大学 基于视频序列的人脸表情识别方法
CN106157308A (zh) * 2016-06-30 2016-11-23 北京大学 矩形目标物检测方法
CN106331752A (zh) * 2016-08-31 2017-01-11 杭州当虹科技有限公司 一种流媒体视频文件的保护方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107463954A (zh) * 2017-07-21 2017-12-12 华中科技大学 一种模糊异谱图像的模板匹配识别方法
CN107463954B (zh) * 2017-07-21 2019-10-25 华中科技大学 一种模糊异谱图像的模板匹配识别方法

Similar Documents

Publication Publication Date Title
Zhao et al. EGNet: Edge guidance network for salient object detection
Li et al. Contour knowledge transfer for salient object detection
US11100370B2 (en) Method of using deep discriminate network model for person re-identification in image or video
CN103208123B (zh) 图像分割方法与***
CN110827312B (zh) 一种基于协同视觉注意力神经网络的学习方法
CN103035003B (zh) 一种实现增强现实的方法及装置
CN102542282B (zh) 一种无源图像马赛克检测方法及装置
CN106504255A (zh) 一种基于多标签多示例学习的多目标图像联合分割方法
CN105205488A (zh) 基于Harris角点和笔画宽度的文字区域检测方法
CN110807402B (zh) 一种基于肤色检测的五官定位方法、***和终端设备
CN112528845B (zh) 一种基于深度学习的物理电路图识别方法及其应用
CN108876810A (zh) 视频摘要中利用图割算法进行运动目标检测的方法
CN103226824B (zh) 维持视觉显著性的视频重定向***
CN113643365B (zh) 一种相机位姿估计方法、装置、设备以及可读存储介质
CN104966285A (zh) 一种显著性区域的检测方法
CN109978907A (zh) 一种面向家居场景的学生坐姿检测方法
CN110267101A (zh) 一种基于快速三维拼图的无人机航拍视频自动抽帧方法
CN114170570A (zh) 一种适用于拥挤场景下的行人检测方法及***
CN109859222A (zh) 基于级联神经网络的边缘提取方法及***
CN106447662A (zh) 一种基于组合距离的fcm图像分割算法
CN115861738A (zh) 一种类别语义信息引导的遥感目标检测主动采样方法
CN115482523A (zh) 轻量级多尺度注意力机制的小物体目标检测方法及***
CN106845483A (zh) 一种视频高清字样检测方法
CN102625028B (zh) 对视频中存在的静态徽标进行检测的方法和设备
CN105184809A (zh) 运动对象检测方法和运动对象检测装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 310000 B2010 two north two building, six and 368 Road, Binjiang District, Hangzhou, Zhejiang.

Applicant after: Hangzhou Dang Hong Polytron Technologies Inc

Address before: 310000 B2010 two north two building, six and 368 Road, Binjiang District, Hangzhou, Zhejiang.

Applicant before: HANGZHOU DANGHONG TECHNOLOGY CO., LTD.

CB02 Change of applicant information
CB02 Change of applicant information

Address after: 310000 E, 16 floor, A block, Paradise software garden, 3 West Gate Road, Xihu District, Hangzhou, Zhejiang.

Applicant after: Hangzhou Dang Hong Polytron Technologies Inc

Address before: 310000 B2010 two north two building, six and 368 Road, Binjiang District, Hangzhou, Zhejiang.

Applicant before: Hangzhou Dang Hong Polytron Technologies Inc

RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170613