CN107133631A - 一种识别电视台图标的方法及装置 - Google Patents

一种识别电视台图标的方法及装置 Download PDF

Info

Publication number
CN107133631A
CN107133631A CN201610113656.3A CN201610113656A CN107133631A CN 107133631 A CN107133631 A CN 107133631A CN 201610113656 A CN201610113656 A CN 201610113656A CN 107133631 A CN107133631 A CN 107133631A
Authority
CN
China
Prior art keywords
station
picture
convolutional neural
neural networks
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610113656.3A
Other languages
English (en)
Inventor
胡东方
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuxi Tvmining Juyuan Media Technology Co Ltd
Original Assignee
Wuxi Tvmining Juyuan Media Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuxi Tvmining Juyuan Media Technology Co Ltd filed Critical Wuxi Tvmining Juyuan Media Technology Co Ltd
Priority to CN201610113656.3A priority Critical patent/CN107133631A/zh
Publication of CN107133631A publication Critical patent/CN107133631A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种识别电视台图标的方法及装置。所述识别电视台图标的方法,包括:根据预设的电视台图标训练样本库,训练基于深度学习的卷积神经网络;测试训练后的所述基于深度学习的卷积神经网络;获取待检测的电视台的画面图像;通过所述合格的基于深度学习的卷积神经网络来分析所述待检测的电视台的画面图像;输出所述待检测的电视台的画面图像所对应的电视台图标。本发明可通过训练卷积神经网络,使得卷积神经网络具有高度识别电视台图标的能力,当用户提交待识别的电视台的画面到该训练后卷积神经网络后,可以准确的识别出待识别的电视台的画面中的电视台图标。

Description

一种识别电视台图标的方法及装置
技术领域
本发明涉及图像智能分析领域,特别涉及一种识别电视台图标的方法及装置。
背景技术
电视台图标是广播视频中所特有的视觉内容之一,包含了该电视台的台名、类型、版权等重要的语义信息,是区分广播电视频道的重要标识,而且台标的识别对于广播电视的节目导向、内容分析和检索等都具有重要的意义。目前,在识别电视台图标的方面,经常会遇到电视台图标出现在复杂的背景图像中,而且背景图像在很多情况下会持续变化,复杂又持续变化的背景图像会影响到识别电视台图标的准确度。特别是目前电视台的数量非常多,据统计不少于三百个频道,其中有些电视台图标的类似度较高,增加了准确识别电视台图标的难度。因此如何解决上述问题,就成为了业界亟待解决的课题。
发明内容
本发明提供一种识别电视台图标的方法及装置,通过训练卷积神经网络来模拟人类识别图像的思维模式,以达到在精确的识别电视台图标的目的。
根据本发明实施例的第一方面,提供一种识别电视台图标的方法,包括:
根据预设的电视台图标训练样本库,训练卷积神经网络;
测试训练后的所述卷积神经网络,将测试结果达到预设合格阈值的卷积神经网络称之为合格的卷积神经网络;
获取待检测的电视台的画面图像;
通过所述合格的卷积神经网络来分析所述待检测的电视台的画面图像;
输出所述待检测的电视台的画面图像所对应的电视台图标。
在一个实施例中所述根据预设的电视台图标训练样本库,训练卷积神经网络,包括:
在预设的电视台图标训练样本库中,获取两个及两个以上的电视台中的各个电视台的n幅图像画面;
根据预设的截取区域,截取所述各个电视台的n幅图像画面对应的所述截取区域内的图像画面,所述图像画面称之为截取图像画面;
将所述截取图像画面的尺寸转换为预设的标准尺寸,将转换后的所述截取图像画面称之为第一图像画面;
将所述第一图像画面进行灰度化处理,将灰度化处理后的所述第一图像画面称之为标准图像画面;
使用所述标准图像画面,训练所述卷积神经网络。
在一个实施例中,所述测试训练后的所述卷积神经网络,将测试结果达到预设合格阈值的卷积神经网络称之为合格的卷积神经网络,包括:
选择所述各个电视台的m幅图像画面,所述各个电视台的m幅图像画面与所述各个电视台的n幅图像画面没有交集;
将所述各个电视台的m幅图像画面生成对应的标准图像画面;
通过所述训练后的所述卷积神经网络来分析所述各个电视台的m幅图像画面;
输出所述各个电视台的m幅图像画面所对应的电视台图标,将所述对应的电视台图标称之为测试电视台图标;
计算所述测试电视台图标的准确率;
当所述测试电视台图标的准确率高于所述预设合格阈值时,确定所述训练后的所述卷积神经网络为合格的卷积神经网络;
当所述准确率低于等于所述预设合格阈值时,重新开始训练所述卷积神经网络。
在一个实施例中,所述根据预设的电视台图标训练样本库,训练卷积神经网络,还包括:
实时检测所述训练卷积神经网络的过程中的拟合精度;
实时判断所述拟合精度的增长幅度是否大于预设的过拟合增长阈值;
当所述拟合精度的增长幅度高于预设的过拟合增长阈值时,重新开始训练所述卷积神经网络。
在一个实施例中,所述重新开始训练所述卷积神经网络,包括:
重新获取所述各个电视台的n幅图像画面;
根据所述重新选择所述各个电视台的n幅图像画面,重新生成所述各个电视台的n幅图像画面对应的标准图像画面;
使用所述标准图像画面,重新训练所述卷积神经网络。
根据本发明实施例的第二方面,提供一种识别电视台图标的装置,包括:
训练模块,用于根据预设的电视台图标训练样本库,训练卷积神经网络;
测试模块,用于测试训练后的所述卷积神经网络,将测试结果达到预设合格阈值的卷积神经网络称之为合格的卷积神经网络;
获取模块,用于获取待检测的电视台的画面图像;
分析模块,用于通过所述合格的卷积神经网络来分析所述待检测的电视台的画面图像;
输出模块,用于输出所述待检测的电视台的画面图像所对应的电视台图标。
在一个实施例中,所述训练模块,包括:
获取子模块,用于在预设的电视台图标训练样本库中,获取两个及两个以上的电视台中的各个电视台的n幅图像画面;
截取子模块,用于根据预设的截取区域,截取所述各个电视台的n幅图像画面对应的所述截取区域内的图像画面,所述图像画面称之为截取图像画面;
转换子模块,用于将所述截取图像画面的尺寸转换为预设的标准尺寸,将转换后的所述截取图像画面称之为第一图像画面;
灰度化子模块,用于将所述第一图像画面进行灰度化处理,将灰度化处理后的所述第一图像画面称之为标准图像画面;
训练子模块,用于使用所述标准图像画面,训练所述卷积神经网络。
在一个实施例中,所述测试模块,包括:
选择子模块,用于选择所述各个电视台的m幅图像画面,所述各个电视台的m幅图像画面与所述各个电视台的n幅图像画面没有交集;
生成子模块,用于将所述各个电视台的m幅图像画面生成对应的标准图像画面;
分析子模块,用于通过所述训练后的所述卷积神经网络来分析所述各个电视台的m幅图像画面;
输出子模块,用于输出所述各个电视台的m幅图像画面所对应的电视台图标,将所述对应的电视台图标称之为测试电视台图标;
计算子模块,用于计算所述测试电视台图标的准确率;
确定子模块,用于当所述测试电视台图标的准确率高于所述预设合格阈值时,确定所述训练后的所述卷积神经网络为合格的卷积神经网络;
第一重训子模块,用于当所述准确率低于等于所述预设合格阈值时,重新开始训练所述卷积神经网络。
在一个实施例中,所述训练模块,还包括:
监测子模块,实时监测所述训练卷积神经网络的过程中的拟合精度;
判断子模块,用于实时判断所述拟合精度的增长幅度是否大于预设的过拟合增长阈值;
第二重训子模块,用于当所述拟合精度的增长幅度高于预设的过拟合增长阈值时,重新开始训练所述卷积神经网络。
在一个实施例中,所述第一重训子模块和第二重训子模块,还用于重新获取所述各个电视台的n幅图像画面;根据所述重新选择所述各个电视台的n幅图像画面,重新生成所述各个电视台的n幅图像画面对应的标准图像画面;使用所述标准图像画面,重新训练所述卷积神经网络。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明一示例性实施例示出的一种识别电视台图标的方法的流程图;
图2为本发明一示例性实施例示出的一种识别电视台图标的方法的步骤S11的流程图;
图3为本发明一示例性实施例示出的一种识别电视台图标的方法的步骤S12的流程图;
图4为本发明又一示例性实施例示出的一种识别电视台图标的方法的步骤S11的流程图;
图5为本发明一示例性实施例示出的一种识别电视台图标的方法的步骤S37和步骤S43流程图;
图6为本发明一示例性实施例示出的一种识别电视台图标的装置的框图;
图7为本发明一示例性实施例示出的一种识别电视台图标的装置的训练模块61的框图;
图8为本发明一示例性实施例示出的一种识别电视台图标的装置的测试模块62的框图;
图9为本发明又一示例性实施例示出的一种识别电视台图标的装置的训练模块61框图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
电视台图标是广播视频中所特有的视觉内容之一,包含了该电视台的台名、类型、版权等重要的语义信息,是区分广播电视频道的重要标识,而且台标的识别对于广播电视的节目导向、内容分析和检索等都具有重要的意义。目前,在识别电视台图标的方面,经常会遇到电视台图标出现在复杂的背景图像中,而且背景图像在很多情况下会持续变化,复杂又持续变化的背景图像会影响到识别电视台图标的精度。特别是目前电视台的数量非常多,据统计不少于三百个频道,有些电视台图标的类似度较高,更加降低了识别电视台图标的精度。因此如何解决上述问题,就成为了业界亟待解决的课题。
图1是根据一示例性实施例示出的一种识别电视台图标的方法流程图,如图1所示,该识别电视台图标的方法,包括以下步骤S11-S15:
在步骤S11中,根据预设的电视台图标训练样本库,训练卷积神经网络;
深度学习(Deep Learning,简称DL)的概念源于人工神经网络的研究,含多隐层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。深度学习是机器学习研究中的一个领域,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本。
卷积神经网络(Convolutional neural networks,简称CNN)是一种深度的监督学习下的机器学习模型,是深度神经网络中的一种。卷积神经网络,在多层神经网络的基础上,加入特征学习的内容,用来模仿人脑对信号的分级处理的处理方式。
根据预设的电视台图标训练样本库,卷积神经网络会在训练的过程中自动学习并不断完善自身的识别能力。训练的样本数量越多,该卷积神经网络可能具备的分析能力就越强大。
在步骤S12中,测试训练后的所述卷积神经网络,将测试结果达到预设合格阈值的卷积神经网络称之为合格的卷积神经网络;
经过测试训练后的卷积神经网络已经具备了一定的对电视台图标的识别能力,此时,需要使用不同于训练时使用的样本库中的样本,进行检验该训练后的卷积神经网络的识别能力。
在步骤S13中,获取待检测的电视台的画面图像;
在步骤S14中,通过所述合格的卷积神经网络来分析所述待检测的电视台的画面图像;
通过获取待检测的电视台的画面图像的低层图像特征,根据该低层图像特征来判断其所对应的高层图像特征,进而得出通过该高层图像特征得出相应的电视台图标。该低层图像特征和该高层图形之间的层数大于三层。
在步骤S15中,输出所述待检测的电视台的画面图像所对应的电视台图标。
输出该待检测的电视台的画面图像所对应的电视台图标,同时,还可以提供相似度较高的几个相似电视台图标,以供用户参考。
本实施例中所使用的卷积神经网络具有类似于人脑思考方式的多层次结构,通过识别图像中的低层图像特征,比如像素。然后逐渐升级到较高层次图像特征,比如轮廓、纹理。再逐渐升级高更高层次的图像特征。相邻的上层层次能够学习到下层的数据本身的结构。在学习到第n-1层后,将n-1层的输出作为第n层的输入,训练第n层,该n的数值大于4。
随着训练完成的样本数据量的增加,卷积神经网络的识别能力也随之增强。在卷积神经网络训练的过程中,是无需人工参与调节的。低层的图像特征也是无需人工指定,可以通过卷积神经网络自身解决。
在一个实施例中,如图2所示,步骤S11包括如下步骤S21-S25:
在步骤S21中,在预设的电视台图标训练样本库中,获取两个及两个以上的电视台中的各个电视台的n幅图像画面;
获取电视台的图像画面,电视台的数量可以是大于2的任意正整数。由于卷积神经网络的特性,故对于每个电视台而言,提供越多的电视台的图像画面,越可以提高卷积神经网络在训练后的识别能力。
在步骤S22中,根据预设的截取区域,截取所述各个电视台的n幅图像画面对应的所述截取区域内的图像画面,所述图像画面称之为截取图像画面;
该预设的截取区域是根据先验知识,电视台图标总是出现在屏幕的左上角或者是右上角。故,判断出某个电视台图标出现在左上角或者右上角,不妨假设该电视台图标出现在左上角,那么对于该电视台只截取该电视台的图像画面的左上角即可。而且电视台图标的本身的尺寸大小也是有限制的,所以需要的截取区域是的大小也可以是固定的,这样可以方便对众多电视台做出统一处理。将截取出来的截取区域内的图像画面称之为截取图像画面。
在步骤S23中,将所述截取图像画面的尺寸转换为预设的标准尺寸,将转换后的所述截取图像画面称之为第一图像画面;
对截取画面的尺寸转换为统一的尺寸,该尺寸是预设的标准尺寸。可以方便后续的环节的处理。
在步骤S24中,将所述第一图像画面进行灰度化处理,将灰度化处理后的所述第一图像画面称之为标准图像画面;
在步骤S25中,使用所述标准图像画面,训练所述卷积神经网络。
本实施例中的卷积神经网络是在神经网络的基础上,模仿了人脑对信号的分级处理,加入特征学习的功能,该卷积神经网络可以自发的学习特征,通过多层的训练,实现对图像的低层图像特征的识别上升到图像的高层图像特征的识别。其中相邻的两层之间,下层的神经网络为上层的神经网络提供输入,上层的神经网络只接收下层的神经网络的图像特征。
通过训练大量的样本,来达到增强卷积神经网络的分析能力。在选择样本方面,为了提高卷积神经网络的分析能力,需要选择具有电视台的视频画面中关键帧的图像。所谓关键帧的图像是指为某个电视台准备的样本数据中,其中每个样本数据之间的差异度要大于预设的差异度阈值。
在一个实施例中,如图3所示,步骤S12包括如下步骤S31-S37:
在步骤S31中,选择所述各个电视台的m幅图像画面,所述各个电视台的m幅图像画面与所述各个电视台的n幅图像画面没有交集;
测试训练后的卷积神经网络所选取的测试样本库,对于选择测试样本库是有要求的。首先,测试样本库中样本数量不能过少,一般来说不少于一半的训练样本库的样本数量;其次,测试样本库与训练样本库的交集为空集。
在步骤S32中,将所述各个电视台的m幅图像画面生成对应的标准图像画面;
对测试样本库中所有的图像画面截取图像画面,该图像画面是预设的截取区域内的图像画面;再将该图像画面转换为标准尺寸;接着再进行灰度化处理,即可完成测试样本库中的所有图像画面转换为标准图像画面。
在步骤S33中,通过所述训练后的所述卷积神经网络来分析所述各个电视台的m幅图像画面;
在步骤S34中,输出所述各个电视台的m幅图像画面所对应的电视台图标,将所述对应的电视台图标称之为测试电视台图标;
在步骤S35中,计算所述测试电视台图标的准确率;
测试样本库中每个图像画面都预先记录了该图像画面来自于那个电视台,即对于测试样本数据库中的每个图像画面对应的真实电视台图标都是已知的。通过本实施例中的测试方法,可得到每个图像画面的测试电视台图标。比较每个图像画面的真实电视台图标和测试电视台图标是否是相符的。通过统计,可以得出通过本实施例的方法预测电视台图标的准确率。
在步骤S36中,当所述测试电视台图标的准确率高于所述预设合格阈值时,确定所述训练后的所述卷积神经网络为合格的卷积神经网络;
在步骤S37中,当所述准确率低于等于所述预设合格阈值时,重新开始训练所述卷积神经网络。
重新开始训练该卷积神经网络,需要选取新的电视台图标训练样本库。可以在上次训练的基础上,继续通过新的电视台图标训练样本库来训练该卷积神经网络;还可以清除上次训练所产生的所有数据,使得该卷积神经网络没有任何在上次训练所带来的影响,再通过新的电视台图标训练样本库来训练该卷积神经网络。
在一个实施例中,如图4所示,步骤S11还包括如下步骤S41-S43:
在步骤S41中,实时检测所述训练卷积神经网络的过程中的拟合精度;
在步骤S42中,实时判断所述拟合精度的增长幅度是否大于预设的过拟合增长阈值;
在步骤S43中,当所述拟合精度的增长幅度高于预设的过拟合增长阈值时,重新开始训练所述卷积神经网络。
在一个实施例中,在使用本实施例中的方法训练卷积神经网络的过程中,实时监测该卷积神经网络的拟合精度的变化情况。在对大数据的训练过程中,拟合精度通常是逐渐缓慢提升的。如果出现拟合精度的增长幅度是否大于预设的过拟合增长阈值的情况,那么通常是出现了过拟合的情况。对于出现了过拟合的情况,一般而言是需要重新开始训练该卷积神经网络的。也可以继续训练该卷积神经网络,通过测试该卷积神经网络的性能,即测试电视台图标的准确度,再决定是否重新开始训练该卷积神经网络。
在一个实施例中,如图5所示,步骤S37和步骤43包括如下步骤S51-S53:
在步骤S51中,重新获取所述各个电视台的n幅图像画面;
在步骤S52中,根据所述重新选择所述各个电视台的n幅图像画面,重新生成所述各个电视台的n幅图像画面对应的标准图像画面;
在步骤S53中,使用所述标准图像画面,重新训练所述卷积神经网络。
在一个实施例中,重新组建新的电视台图标训练样本库,即重新获取各个电视台的n幅图像画面。对重新获取各个电视台的n幅图像画面截取预设的截取区域内的图像画面,再将该些图像画面转换为标准尺寸,接着再进行灰度化处理,即可完成重新组建新的电视台图标训练样本库。其中,重新组建新的电视台图标训练样本库和之前的电视台图标训练样本库之间必须存在不同的样本数据,而且该不同的样本数据越多越佳。
在一个实施例中,图6是根据一示例性实施例示出的一种识别电视台图标的装置框图。如图6示,该装置包括训练模块61、测试模块62、获取模块63、分析模块64和输出模块65。
该训练模块61,用于根据预设的电视台图标训练样本库,训练卷积神经网络;
测试模块62,用于测试训练后的所述卷积神经网络,将测试结果达到预设合格阈值的卷积神经网络称之为合格的卷积神经网络;
获取模块63,用于获取待检测的电视台的画面图像;
分析模块64,用于通过所述合格的卷积神经网络来分析所述待检测的电视台的画面图像;
输出模块65,用于输出所述待检测的电视台的画面图像所对应的电视台图标。
如图7所示,该训练模块61包括获取子模块71、截取子模块72、转换子模块73、灰度化子模块74和训练子模块75。
获取子模块71,用于在预设的电视台图标训练样本库中,获取两个及两个以上的电视台中的各个电视台的n幅图像画面;
截取子模块72,用于根据预设的截取区域,截取所述各个电视台的n幅图像画面对应的所述截取区域内的图像画面,所述图像画面称之为截取图像画面;
转换子模块73,用于将所述截取图像画面的尺寸转换为预设的标准尺寸,将转换后的所述截取图像画面称之为第一图像画面;
灰度化子模块74,用于将所述第一图像画面进行灰度化处理,将灰度化处理后的所述第一图像画面称之为标准图像画面;
训练子模块75,用于使用所述标准图像画面,训练所述卷积神经网络。
如图8所示,该测试模块62包括选择子模块81、生成子模块82、分析子模块83、输出子模块84、计算子模块85、确定子模块86和第一重训子模块87。
该选择子模块81,用于选择所述各个电视台的m幅图像画面,所述各个电视台的m幅图像画面与所述各个电视台的n幅图像画面没有交集;
生成子模块82,用于将所述各个电视台的m幅图像画面生成对应的标准图像画面;
分析子模块83,用于通过所述训练后的所述卷积神经网络来分析所述各个电视台的m幅图像画面;
输出子模块84,用于输出所述各个电视台的m幅图像画面所对应的电视台图标,将所述对应的电视台图标称之为测试电视台图标;
计算子模块85,用于计算所述测试电视台图标的准确率;
确定子模块86,用于当所述测试电视台图标的准确率高于所述预设合格阈值时,确定所述训练后的所述卷积神经网络为合格的卷积神经网络;
第一重训子模块87,用于当所述准确率低于等于所述预设合格阈值时,重新开始训练所述卷积神经网络;
第一重训子模块87,还用于重新获取所述各个电视台的n幅图像画面;根据所述重新选择所述各个电视台的n幅图像画面,重新生成所述各个电视台的n幅图像画面对应的标准图像画面;使用所述标准图像画面,重新训练所述卷积神经网络。
如图9所示,该训练模块61还包括监测子模块91、判断子模块92和第二重训子模块93。
监测子模块91,实时监测所述训练卷积神经网络的过程中的拟合精度;
判断子模块92,用于实时判断所述拟合精度的增长幅度是否大于预设的过拟合增长阈值;
第二重训子模块93,用于当所述拟合精度的增长幅度高于预设的过拟合增长阈值时,重新开始训练所述卷积神经网络。
第二重训子模块93,还用于重新获取所述各个电视台的n幅图像画面;根据所述重新选择所述各个电视台的n幅图像画面,重新生成所述各个电视台的n幅图像画面对应的标准图像画面;使用所述标准图像画面,重新训练所述卷积神经网络。
本领域内的技术人员应明白,本发明的实施例可提供为方法、***、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种识别电视台图标的方法,其特征在于,包括:
根据预设的电视台图标训练样本库,训练卷积神经网络;
测试训练后的所述卷积神经网络,将测试结果达到预设合格阈值的卷积神经网络称之为合格的卷积神经网络;
获取待检测的电视台的画面图像;
通过所述合格的卷积神经网络来分析所述待检测的电视台的画面图像;
输出所述待检测的电视台的画面图像所对应的电视台图标。
2.如权利要求1所述的方法,其特征在于,所述根据预设的电视台图标训练样本库,训练卷积神经网络,包括:
在预设的电视台图标训练样本库中,获取两个及两个以上的电视台中的各个电视台的n幅图像画面;
根据预设的截取区域,截取所述各个电视台的n幅图像画面对应的所述截取区域内的图像画面,所述图像画面称之为截取图像画面;
将所述截取图像画面的尺寸转换为预设的标准尺寸,将转换后的所述截取图像画面称之为第一图像画面;
将所述第一图像画面进行灰度化处理,将灰度化处理后的所述第一图像画面称之为标准图像画面;
使用所述标准图像画面,训练所述卷积神经网络。
3.如权利要求2所述的方法,其特征在于,所述测试训练后的所述卷积神经网络,将测试结果达到预设合格阈值的卷积神经网络称之为合格的卷积神经网络,包括:
选择所述各个电视台的m幅图像画面,所述各个电视台的m幅图像画面与所述各个电视台的n幅图像画面没有交集;
将所述各个电视台的m幅图像画面生成对应的标准图像画面;
通过所述训练后的所述卷积神经网络来分析所述各个电视台的m幅图像画面;
输出所述各个电视台的m幅图像画面所对应的电视台图标,将所述对应的电视台图标称之为测试电视台图标;
计算所述测试电视台图标的准确率;
当所述测试电视台图标的准确率高于所述预设合格阈值时,确定所述训练后的所述卷积神经网络为合格的卷积神经网络;
当所述准确率低于等于所述预设合格阈值时,重新开始训练所述卷积神经网络。
4.如权利要求2所述的方法,其特征在于,所述根据预设的电视台图标训练样本库,训练卷积神经网络,还包括:
实时监测所述训练卷积神经网络的过程中的拟合精度;
实时判断所述拟合精度的增长幅度是否大于预设的过拟合增长阈值;
当所述拟合精度的增长幅度高于预设的过拟合增长阈值时,重新开始训练所述卷积神经网络。
5.如权利要求3、4所述的方法,其特征在于,所述重新开始训练所述卷积神经网络,包括:
重新获取所述各个电视台的n幅图像画面;
根据所述重新选择所述各个电视台的n幅图像画面,重新生成所述各个电视台的n幅图像画面对应的标准图像画面;
使用所述标准图像画面,重新训练所述卷积神经网络。
6.一种识别电视台图标的装置,其特征在于,包括:
训练模块,用于根据预设的电视台图标训练样本库,训练卷积神经网络;
测试模块,用于测试训练后的所述卷积神经网络,将测试结果达到预设合格阈值的卷积神经网络称之为合格的卷积神经网络;
获取模块,用于获取待检测的电视台的画面图像;
分析模块,用于通过所述合格的卷积神经网络来分析所述待检测的电视台的画面图像;
输出模块,用于输出所述待检测的电视台的画面图像所对应的电视台图标。
7.根据权利要求6的装置,其特征在于,所述训练模块,包括:
获取子模块,用于在预设的电视台图标训练样本库中,获取两个及两个以上的电视台中的各个电视台的n幅图像画面;
截取子模块,用于根据预设的截取区域,截取所述各个电视台的n幅图像画面对应的所述截取区域内的图像画面,所述图像画面称之为截取图像画面;
转换子模块,用于将所述截取图像画面的尺寸转换为预设的标准尺寸,将转换后的所述截取图像画面称之为第一图像画面;
灰度化子模块,用于将所述第一图像画面进行灰度化处理,将灰度化处理后的所述第一图像画面称之为标准图像画面;
训练子模块,用于使用所述标准图像画面,训练所述卷积神经网络。
8.根据权利要求7的装置,其特征在于,所述测试模块,包括:
选择子模块,用于选择所述各个电视台的m幅图像画面,所述各个电视台的m幅图像画面与所述各个电视台的n幅图像画面没有交集;
生成子模块,用于将所述各个电视台的m幅图像画面生成对应的标准图像画面;
分析子模块,用于通过所述训练后的所述卷积神经网络来分析所述各个电视台的m幅图像画面;
输出子模块,用于输出所述各个电视台的m幅图像画面所对应的电视台图标,将所述对应的电视台图标称之为测试电视台图标;
计算子模块,用于计算所述测试电视台图标的准确率;
确定子模块,用于当所述测试电视台图标的准确率高于所述预设合格阈值时,确定所述训练后的所述卷积神经网络为合格的卷积神经网络;
第一重训子模块,用于当所述准确率低于等于所述预设合格阈值时,重新开始训练所述卷积神经网络。
9.根据权利要求7的装置,其特征在于,所述训练模块,还包括:
监测子模块,实时监测所述训练卷积神经网络的过程中的拟合精度;
判断子模块,用于实时判断所述拟合精度的增长幅度是否大于预设的过拟合增长阈值;
第二重训子模块,用于当所述拟合精度的增长幅度高于预设的过拟合增长阈值时,重新开始训练所述卷积神经网络。
10.根据权利要求8、9的装置,其特征在于,
所述第一重训子模块和第二重训子模块,还用于重新获取所述各个电视台的n幅图像画面;根据所述重新选择所述各个电视台的n幅图像画面,重新生成所述各个电视台的n幅图像画面对应的标准图像画面;使用所述标准图像画面,重新训练所述卷积神经网络。
CN201610113656.3A 2016-02-29 2016-02-29 一种识别电视台图标的方法及装置 Pending CN107133631A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610113656.3A CN107133631A (zh) 2016-02-29 2016-02-29 一种识别电视台图标的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610113656.3A CN107133631A (zh) 2016-02-29 2016-02-29 一种识别电视台图标的方法及装置

Publications (1)

Publication Number Publication Date
CN107133631A true CN107133631A (zh) 2017-09-05

Family

ID=59720811

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610113656.3A Pending CN107133631A (zh) 2016-02-29 2016-02-29 一种识别电视台图标的方法及装置

Country Status (1)

Country Link
CN (1) CN107133631A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108009637A (zh) * 2017-11-20 2018-05-08 天津大学 基于跨层特征提取的像素级台标识别网络的台标分割方法
CN108304104A (zh) * 2017-10-24 2018-07-20 腾讯科技(深圳)有限公司 一种数据获取方法及其设备、存储介质、终端
CN108960412A (zh) * 2018-06-29 2018-12-07 北京京东尚科信息技术有限公司 图像识别方法、装置及计算机可读存储介质
CN109168062A (zh) * 2018-08-28 2019-01-08 北京达佳互联信息技术有限公司 视频播放的展示方法、装置、终端设备及存储介质
CN109726709A (zh) * 2017-10-31 2019-05-07 优酷网络技术(北京)有限公司 基于卷积神经网络的图标识别方法和装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007102264A (ja) * 2005-09-30 2007-04-19 Toshiba Corp 文字認識装置および文字認識方法
CN103607603A (zh) * 2013-11-28 2014-02-26 Tcl集团股份有限公司 一种识别台标的方法及装置
CN103729678A (zh) * 2013-12-12 2014-04-16 中国科学院信息工程研究所 一种基于改进dbn模型的水军检测方法及***
CN103902987A (zh) * 2014-04-17 2014-07-02 福州大学 一种基于卷积网络的台标识别方法
CN105095837A (zh) * 2014-05-15 2015-11-25 Tcl集团股份有限公司 一种台标识别方法和***

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007102264A (ja) * 2005-09-30 2007-04-19 Toshiba Corp 文字認識装置および文字認識方法
CN103607603A (zh) * 2013-11-28 2014-02-26 Tcl集团股份有限公司 一种识别台标的方法及装置
CN103729678A (zh) * 2013-12-12 2014-04-16 中国科学院信息工程研究所 一种基于改进dbn模型的水军检测方法及***
CN103902987A (zh) * 2014-04-17 2014-07-02 福州大学 一种基于卷积网络的台标识别方法
CN105095837A (zh) * 2014-05-15 2015-11-25 Tcl集团股份有限公司 一种台标识别方法和***

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张博洋等: "基于神经网络的静态台标识别***设计与实现", 《计算机仿真》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108304104A (zh) * 2017-10-24 2018-07-20 腾讯科技(深圳)有限公司 一种数据获取方法及其设备、存储介质、终端
CN108304104B (zh) * 2017-10-24 2022-01-28 腾讯科技(深圳)有限公司 一种数据获取方法及其设备、存储介质、终端
CN109726709A (zh) * 2017-10-31 2019-05-07 优酷网络技术(北京)有限公司 基于卷积神经网络的图标识别方法和装置
CN108009637A (zh) * 2017-11-20 2018-05-08 天津大学 基于跨层特征提取的像素级台标识别网络的台标分割方法
CN108009637B (zh) * 2017-11-20 2021-06-25 天津大学 基于跨层特征提取的像素级台标识别网络的台标分割方法
CN108960412A (zh) * 2018-06-29 2018-12-07 北京京东尚科信息技术有限公司 图像识别方法、装置及计算机可读存储介质
CN109168062A (zh) * 2018-08-28 2019-01-08 北京达佳互联信息技术有限公司 视频播放的展示方法、装置、终端设备及存储介质
CN109168062B (zh) * 2018-08-28 2020-11-24 北京达佳互联信息技术有限公司 视频播放的展示方法、装置、终端设备及存储介质

Similar Documents

Publication Publication Date Title
US11605226B2 (en) Video data processing method and apparatus, and readable storage medium
JP6980958B1 (ja) 深層学習に基づく農村地域分けゴミ識別方法
US11967151B2 (en) Video classification method and apparatus, model training method and apparatus, device, and storage medium
CN107133631A (zh) 一种识别电视台图标的方法及装置
CN106156781A (zh) 排序卷积神经网络构建方法及其图像处理方法与装置
CN109784153A (zh) 情绪识别方法、装置、计算机设备及存储介质
CN104517122A (zh) 一种基于优化卷积架构的图像目标识别方法
CN110148400A (zh) 发音类型的识别方法、模型的训练方法、装置及设备
CN110647875A (zh) 一种血细胞分割、识别模型构造的方法及血细胞识别方法
CN109409533A (zh) 一种机器学习模型的生成方法、装置、设备及存储介质
CN113435269A (zh) 一种基于YOLOv3改进的水面漂浮物检测与识别方法及***
CN109753884A (zh) 一种基于关键帧提取的视频行为识别方法
CN111080746B (zh) 图像处理方法、装置、电子设备和存储介质
US20200372255A1 (en) Video format classification and metadata injection using machine learning
CN115131698B (zh) 视频属性确定方法、装置、设备及存储介质
CN112231516B (zh) 视频摘要生成模型的训练方法、视频摘要生成方法及装置
CN109978074A (zh) 基于深度多任务学习的图像美感和情感联合分类方法及***
CN114556413A (zh) 用于组织分割的机器学习模型的交互式训练
CN107135402A (zh) 一种识别电视台图标的方法及装置
CN110263835A (zh) 基于深度学习和贝叶斯网络的岩石类别自动识别方法
CN111325212A (zh) 模型训练方法、装置、电子设备和计算机可读存储介质
CN113282840B (zh) 一种训练采集综合管理平台
CN110427998A (zh) 模型训练、目标检测方法及装置、电子设备、存储介质
CN110275820B (zh) 页面兼容性测试方法、***及设备
CN111539390A (zh) 一种基于Yolov3的小目标图像识别方法、设备和***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170905