CN105868683A

CN105868683A - 台标识别方法及装置

Info

Publication number: CN105868683A
Application number: CN201510824167.4A
Authority: CN
Inventors: 何小坤
Original assignee: Leshi Zhixin Electronic Technology Tianjin Co Ltd
Current assignee: Leshi Zhixin Electronic Technology Tianjin Co Ltd
Priority date: 2015-11-24
Filing date: 2015-11-24
Publication date: 2016-08-17
Also published as: WO2017088479A1

Abstract

本发明公开了一种台标识别方法及装置，涉及信息识别技术领域，所述方法包括：判断台标区域中的待识别台标是否为央视台标；在所述待识别台标为央视台标时，按照第一预设策略对所述待识别台标进行识别；在所述待识别台标为非央视台标时，按照第二预设策略对所述待识别台标进行识别。本发明提供的台标识别方法及装置，不再对各台标均采用相同方式进行识别，而是先判断台标区域中的待识别台标是否为央视台标，再对央视台标和非央视台标采用不同策略进行识别，能够有效地针对央视台标和非央视台标的特征对待识别台标进行识别，提高了识别效率和识别准确率。

Description

台标识别方法及装置

技术领域

本发明涉及信息识别技术领域，特别涉及一种台标识别方法及装置。

背景技术

智能电视正顺应“高清化”、“网络化”、“智能化”的趋势迅速发展，具备从因特网、视频设备、计算机等多种渠道获得节目内容、通过信息融合的方式将消费者最需要的内容在大屏幕上清晰展现的功能。与传统电视相比，智能电视为用户提供了更加快捷、智能、人性化的应用服务。

智能电视包含大量点播视频、直播节目，绝大多数的电视节目保留了节目出品方的台标。台标是区分电视台的重要标志，包含了电视台台名、节目来源、节目取向等重要的语义信息，是实现视频分析、理解和检索的重要语义源。台标识别技术的实现，将有效实现节目单功能，并对理解用户喜好、投放增值服务具有十分重要的意义。

现有技术中在对台标进行识别时，通常采用以下两种方案：

第一种方案：基于单帧图像的台标识别方案。该种方法以边缘距离变换矩阵作为特征，均采用模板匹配的方式，包括全局边缘匹配(滑动窗口遍历整个台标区域)、分块匹配(采用人工方式过滤非边缘)、颜色形状匹配(颜色和形状特征同时匹配，为节目搜索进行分类排序)等。

第二种方案：基于多帧图像的台标识别方法。该种方案通常可采用以下三种方法：一、利用连续多帧视频帧序列的敏感区域(即台标区域)像素点的特征值变化来分割图像，并进行边缘检测，采用滑动窗口和分块方法进行匹配识别。二、综合利用颜色和形状特征，根据时空不变性在帧序列中分割台标，利用空间分布直方图结合HSV彩色直方图对特征进行有效描述，最后利用SUV完成台标识别。方法三：计算相邻帧图像的变化，提取台标及其Hu不变矩，并根据候选集合和预设准则得到识别结果等。

但现有技术中，对央视台标、卫视台标和地方台标等采用相同方式进行识别，导致识别效率和识别准确率过低。

发明内容

本发明实施例提供一种台标识别方法及装置，用以解决现有技术中识别效率和识别准确率过低的缺陷。

本发明实施例提供一种台标识别方法，所述方法包括：

判断台标区域中的待识别台标是否为央视台标；

在所述待识别台标为央视台标时，按照第一预设策略对所述待识别台标进行识别；

在所述待识别台标为非央视台标时，按照第二预设策略对所述待识别台标进行识别。

本发明实施例提供一种台标识别装置，所述装置包括：

台标判断单元，用于判断台标区域中的待识别台标是否为央视台标；

第一识别单元，用于在所述待识别台标为央视台标时，按照第一预设策略对所述待识别台标进行识别；

第二识别单元，用于在所述待识别台标为非央视台标时，按照第二预设策略对所述待识别台标进行识别。

本发明实施例提供的台标识别方法及装置，不再对各台标均采用相同方式进行识别，而是先判断台标区域中的待识别台标是否为央视台标，再对央视台标和非央视台标采用不同策略进行识别，能够有效地针对央视台标和非央视台标的特征对待识别台标进行识别，提高了识别效率和识别准确率。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明一种实施方式的台标识别方法的流程图；

图2是本发明一种实施方式中区域分割前的视频帧图像的示意图；

图3是本发明一种实施方式中区域分割后的视频帧图像的示意图；

图4是以CCTV5为例，将各视频帧图像的边缘进行合成的整体效果图；

图5是本发明一种实施方式的台标识别方法的流程图；

图6是本发明一种实施方式的台标识别装置的结构框图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

应理解的是，虽然背景技术中主要针对智能电视中电视节目的台标识别，但本公开的实施方式并不限于此，其还可适用于其他对象(诸如，平板电脑、手机、PC机等设备)中电视节目的台标识别，也就是说，凡是涉及到电视节目的台标识别的场景均包括在本实施方式的应用范围内。

图1是本发明一种实施方式的台标识别方法的流程图；参照图1，所述方法包括：

S101：判断台标区域中的待识别台标是否为央视台标；

需要说明的是，所述台标区域即为仅包括待识别台标的区域。

可理解的是，所述台标区域可通过多种方式进行提取，为了防止随机噪声、画面噪声等噪声对台标识别的影响，本实施方式中，通过以下步骤获取包括待识别台标的台标区域：

(1)从包括待识别台标的视频的预设区域内获取视频帧图像序列；

根据先验知识，电视台台标基本全部位于视频帧图像的左上角(当然，若处于其他位置，也可根据需要进行适应性调整即可)，因此台标检测时，只需提取固定的左上角区域(即预设区域)作为台标检测区域即可。现有的台标识别方法一般按照最优区域规则(GSR)获取台标区域，本实施方式与现有的台标识别方法不同之处在于：(1)计算所有台标在各视频帧图像中有效识别的比例位置；(2)计算所有比例位置的最大范围作为台标区域分割的区域。以1920*1080的视频为例，台标分割区域为——行开始位置80(1/24)，列开始位置40(1/27)，行宽450(15/64)，列宽180(1/6)，区域分割效果如图2和图3所示，当然，所述比例位置可根据需要进行适当调整，本实施方式对此不加以限制。

为消除图像中无关的信息、恢复或增强有用的相关信息，提高特征的可检测性，最大限度地简化数据，以确保识别的可靠性，本实施方式中，可对各视频帧图像进行预处理，所述预处理包括：区域分割、灰度化和图像增强中的至少一种，当然，还可包括其他处理过程，本实施方式对此不加以限制。

所述预处理可采用公式Gray＝0.33R+0.59G+0.11B进行灰度化，当然，也可通过三通道平均值法或三通道最大值法等方式替代，其中，Gray为像素的灰度值，R为像素的红色分量，G为像素的绿色分量，B为像素的蓝色分量。

所述图像增强的目的是突出台标区域有效信息，如图标、文字、数字等，图像增强采用0～255灰度级的灰度拉伸，也可用直方图变换法替代。

(2)对各视频帧图像进行边缘提取；

可理解的是，边缘是图像灰度变化剧烈之处，边缘提取是台标识别的关键，边缘的完整程度直接影响台标识别结果，当然，边缘提取的方法有很多，如Canny、LOG、Sobel、拉普拉斯算子法等。综合考虑去噪、边缘完整性、边缘定位精度等要求，本实施方式中采用Canny边缘检测方法。

在具体实现中，Canny边缘检测方法的参数设置为：弱边缘阈值50，强边缘阈值200，当然，也可根据需要进行适当浮动，例如，阈值在±10的范围内进行浮动。

(3)将各视频帧图像的边缘进行合成；

在具体实现中，可根据所述视频帧图像的数量来确定对应的预设图像阈值，再根据所述各边缘点在视频帧图像的数量是否低于所述预设图像阈值来判断是否保留该边缘点。

也就是说，预先建立视频帧图像的数量与预设图像阈值之间的对应关系，根据所述视频帧图像的数量查找对应关系，以确定对应的预设图像阈值，在具有各边缘点在视频帧图像的数量低于所述预设图像阈值时，不保留该边缘点，在各边缘点在视频帧图像的数量高于等于所述预设图像阈值时，保留该边缘点。

下面以一个具体的实施例来说明将各视频帧图像的边缘进行合成，但不限定本发明的保护范围：设N为视频帧图像的数量，X为预设图像阈值。

当N＝6时，相应地，X＝4，也就是说，只有边缘点在4个以上(包括4)的视频帧图像中存在时才保留，若边缘点在3个以下(包括3)的视频帧图像中存在时则舍弃；

当6>N>3时，相应地，X＝3，也就是说，只有边缘点在3个以上(包括3)的视频帧图像中存在时才保留，若边缘点在2个以下(包括2)的视频帧图像中存在时则舍弃；

当N≤3时，相应地，X＝N，也就是说，只有边缘点在所有视频帧图像中存在时才保留，其他情况均舍弃。

当然，所述对应关系中的参数可根据图像的分辨率进行调整，本实施方式对此不加以限制。

以CCTV5为例，图4展示了合成的整体效果。

由于边缘噪声、黑边和非必要文字等均会对识别准确率造成影响，为进一步提高识别准确率，可合成的边缘进行优化处理，本实施方式中，所述优化处理包括：边缘噪声删除、黑边去除和非必要文字删除中的至少一种。

(4)获取合成的边缘的最小外接矩阵；

(5)按照所述最小外接矩阵分别对各视频帧图像进行分割，并将分割出的图像通过加权平均的方式进行合成，以获得包括待识别台标的台标区域。

S102：在所述待识别台标为央视台标时，按照第一预设策略对所述待识别台标进行识别；

在具体实现中，由于央视台标的差别仅在于数字和文字不同，故而，可针对央视台标的特征，按照第一预设策略对所述待识别台标进行识别。

S103：在所述待识别台标为非央视台标时，按照第二预设策略对所述待识别台标进行识别。

可理解的是，可针对非央视台标的特征，按照第二预设策略对所述待识别台标进行识别。

本实施方式不再对各台标均采用相同方式进行识别，而是先判断台标区域中的待识别台标是否为央视台标，再对央视台标和非央视台标采用不同策略进行识别，能够有效地针对央视台标和非央视台标的特征对待识别台标进行识别，提高了识别效率和识别准确率。

图5是本发明一种实施方式的台标识别方法的流程图；参照图2，所述方法包括：

S501：判断台标区域中的待识别台标是否为央视台标；

可理解的是，判断台标区域中的待识别台标是否为央视台标时，可采用多种方式，为保证判断的准确率，本实施方式中，根据台标区域的长宽比、灰度和颜色判断台标区域中的待识别台标是否为央视台标。

研究发现，央视台标相对卫视台标、地方台标的特点和差异发现：(1)长宽比差异，央视台标的长宽比(长：竖直方向长度；宽：水平方向宽度)普遍明显小于其他台标；(2)央视台标的彩色图有广泛的白色像素特征，尤其表现在左侧2/3处；(3)央视台标的灰度图分块后，子块之间满足灰度接近的相关约束，如均值、方差等。

故而，可通过所述台标区域的长宽比、灰度和颜色的不同来对所述台标区域进行分类。

由于长宽比是台标最直接的特征之一。故而，可先对所述台标区域通过长宽比进行初步判断，也就是说，先计算各台标区域的长宽比，计算长宽比的方法为：计算台标区域的长度H和宽度W，长宽比ratio＝W/H。

央视台标的ratio通常在0.3以下，故而，可构建的初步判断条件为：ratio<0.3。但是，内蒙古卫视、重庆卫视、北京卫视等卫视台(包括这些卫视的地方台)台标的ratio均在0.3以下，故而，可通过长宽比筛选后，再通过灰度和颜色进行再次筛选。

通过灰度和颜色进行再次筛选时，可根据以下判断条件进行分类，也就是说，设置以下用于进一步判断的条件：

(1)所述台标区域左上角的第一预设范围内的红色分量和所述台标区域右下角的第二预设范围内的红色分量的均值小于预设红色分量。

也就是说，可将台标区域按行*列分为5*3子块(当然，也可通过6*3或4*3等方式进行分块)，提取左上角的第一个子块area1(即第一预设范围)和右下角的第一个子块area2(即第二预设范围)。央视台标和重庆卫视台标、北京卫视台标等在这两个区域的红色分布截然不同。

综合干扰台标和央视台标的颜色特征，可构建条件1(即Condition1)——area1和area2的红色均值小于150。

(2)所述台标区域左侧第三预设范围内的灰度均值小于预设灰度值。

考虑Condition1的容错性和央视台标半透明的特点，取子块area3。可以台标区域的宽度方向50个像素为标准，取台标区域最左8列像素(即宽的4/25)构成area3(即第三预设范围)。

分析干扰台标和CCTV台标在area3的灰度差异，构建条件2(Condition2)——area3的灰度均值小于100。

可理解的是，可通过三通道经典合成法Gray＝0.33R+0.59G+0.11B来获得灰度图像，也可通过三通道最大值法、三通道平均值法等，本实施方式对此不加以限制。

(3)将所述台标区域分割为至少4个部分，分割后的预设部分之间的像素均值的绝对差不超过预设绝对差；

由于Condition1和Condition2只包含了各子块的自身信息，需将约束扩展至子块间的关系。分析发现，台标区域中的文字、数字像素主要位于台标区域的后1/3列。为此，将台标区域按照行*列分为2*3子块(当然，也可通过3*3等方式进行分块)，取前2*2子块(即分割后的预设部分)分别表示为area4、area5、area6和area7。

多样本严格计算发现，CCTV台标在这4个子块处基本如下条件：

条件3(Condition3)——area4、area5、area6和area7的均值之绝对差不超过100。

(4)分割后的预设部分之间的像素均值的方差不超过预设方差。

也就是说，以上4个子块的像素均值的方差均有不同，故而，CCTV台标在这4个子块处满足如下条件：

条件4(Condition4)——area4、area5、area6和area7的均值序列之方差不超过1600。

某台标样本同时满足以上Condition1～Condition4时，可将其判断为央视台标，否则判断为非央视台标。上述条件同时判断时，准确率最高，实验证明，缺少任意一项条件均会提高多样本分类的错误率。

S502：在所述待识别台标为央视台标时，提取所述台标区域中的数字区域，对提取的数字区域进行位数判别，根据位数判别结果识别所述数字区域中的数字，将央视台标的标志和识别的数字之间的组合作为所述待识别台标的识别结果；

需要说明的是，所述央视台标包含标志(即CCTV)、文字和数字，常见央视台标的差异在于文字和数字。模式识别领域中，数字识别比文字识别容易、稳定、快速。同时，央视台标的数字可单独描述具体频道，从而本实施方式将去除台标区域中的文字(如“综合”、“财经”等)，提取台标区域中的数字(即1、2等)。其中，文字处于台标下方并与标志有明显的像素间隔，可设置预设像素间隔，通过所述提取的边缘中与标志之间的像素间隔是否超过预设像素间隔，在超过预设像素间隔时，则确认为文字，对其进行删除，故而，下述台标区域即为仅包括数字和标志的区域。

可理解的是，所述数字区域位于所述台标区域内，并且存在一定的位置关系，因此，可预先建立所述台标区域和数字区域之间的位置关系，再根据所述数字区域的位置信息对所述图像进行分割处理，以获得所述数字区域。

对于台标区域而言，数字区域和标志区域(即CCTV所在区域)之间存在如下对应关系：

(1)数字区域位于标志区域右侧，所占宽度大约等于标志区域的1/4；

(2)数字区域和标志区域中的字母等高，约占央视台标整体高度的0.8。

故而，可根据所述台标区域和数字区域之间的位置关系提取所述台标区域中的数字区域。

另外，为了便于对数字区域中的数字进行识别，可对所述数字区域中的数字部分和背景部分进行二值化处理，设数字部分设为白色，背景部分设为黑色。

由于所述数字区域四个角的位置容易产生白色像素块/点，并且所述数字区域中还存在噪声点，这些干扰信息会对数字识别造成影响，本实施方式中，可对二值化后的数字区域进行干扰信息删除。

在具体实现中，可根据以下方式删除所述数字区域四个角的白色像素块/点：设所述数字区域的水平宽度为W(等于0.25W_A，W_A为所述台标区域的宽度)、竖直长度为H(等于H_A，H_A为所述台标区域的高度)，各像素点灰度值为gray(i,j)，i为像素点竖直行坐标，j为像素点水平列坐标，变换后的灰度值为Gray(i,j)，

G r a y (i, j) = \{\begin{matrix} \begin{matrix} 0, & i f & (0.2 H &GreaterEqual; i, 0.1 W &GreaterEqual; j o r j &GreaterEqual; 0.9 W) \end{matrix} \\ \begin{matrix} 0, & i f & (0.8 H \leq i, 0.1 W &GreaterEqual; j o r j &GreaterEqual; 0.9 W) \end{matrix} \\ \begin{matrix} g r a y (i, j), & e l s e \end{matrix} \end{matrix}

对于所述数字区域中的噪声点，则可进行噪声滤波，进一步削弱和减少噪声点影响。

为进一步提高数字识别的准确率，本实施方式中，先对提取的数字区域进行位数判别，再根据位数判别结果识别所述数字区域中的数字。

可理解的是，对提取的数字区域进行判别可通过多种方式，本实施方式中，按列对所述数字区域中各像素的灰度值进行投影，以构成长度为所述数字区域水平宽度的投影向量，在一列投影向量中具有超过预设数量的属于数字部分的像素时，将该列投影向量进行标识，若存在相邻两个被标识的投影向量之间的最小距离大于预设距离，则将所述数字判别结果设为两位，否则将所述数字判别结果设为一位。

为进一步提高数字识别的效率，本实施方式中，可通过以下3个步骤根据位数判别结果识别所述数字区域中的数字：

(1)获取数字区域中的白色像素区域A，并计算A的水平宽度w和竖直行宽h。如果h/w>2，则该台标为CCTV-1的台标。否则进入(2)。

(2)对所述数字区域进行边缘提取，如果按行*列分块为m*n个子块，具体如表1所示。构建边缘点概率空间分布直方图，与标准0、2～9的数字图像边缘点概率空间分布直方图计算匹配概率。

表1分块参数

参数	0.8<h/w<1.25	其他
			m	4	6
n	4	3

(3)根据数字判别结果识别所述数字区域中的数字。如果数字判别结果为一位，则台标为CCTV-1、CCTV-10～CCTV15的概率为0，如果数字判别结果为两位，则台标为CCTV1～CCTV9的概率均为0，从而完成所述数字区域中的数字识别。

考虑识别是否准确的问题，本实施方式中，根据所述位数判别结果将所述数字区域与标准数字进行匹配，在最高匹配率和次高匹配率不相等时，按照所述最高匹配率对应的标准数字作为所述数字区域中的数字。

当然，在最高匹配率和次高匹配率相等时，不予唯一识别。

S503：在所述待识别台标为非央视台标时，计算所述台标区域的边缘与各标准台标的匹配率；

可理解的是，由于非央视台标通常包括：卫视台标和地方台标，本实施方式中，考虑到卫视台标的特征和差异，可分为无文字台标(如东方卫视)、有可分离文字台标(如东南卫视，也就是上述的“非必要文字”)和有不可完全分离文字台标(如河北卫视，也就是上述的“必要文字”)，故而，在标准库中将依据三种不同卫视台台标类型进行相应类型标准台标的构建。

为便于计算所述台标区域的边缘与各标准台标的匹配率，本实施方式中，对所述台标区域中的边缘通过空间分布直方图与标准台标进行匹配，以计算所述台标区域的边缘与各标准台标的匹配率。

由于江苏卫视、东方卫视等台标只剩下圆形、椭圆形台标(该类台标定义为短台标)，长宽比较小，内蒙古卫视、新疆卫视等电视台台标(这类台标定义为长台标)的长宽比明显大于这些卫视台标的长宽比。所以，可将长宽比作为分类条件。长台标的ratio在1.5以上，识别层次之长宽比比较条件即为：ratio≥1.5，在分类后，进行匹配时，则可直接按照相同长宽比类型的标准台标进行匹配，而无需和所有标准台标均进行匹配，进一步缩短了匹配时长。

本实施方式中，将台标区域的边缘Edge划分为数量相同的子块A1、A2、A3…Am，其中m为子块的个数。对每个子块，统计其中的边缘点概率，即得到空间分布直方图。例如：短台标的Edge分为5*5个子块，即25个子块；长台标的Edge分为5*10(行*列)个子块，即50个子块。标准图库中的各标准台标也按照短、长进行空间分布直方图计算，所述台标区域的空间分布直方图与标准台标逐子块进行匹配。计匹配的子块数为n(初值为0)，总子块数为N，如果某子块的概率十分接近(例如：概率差<0.05)，则n＝n+1；匹配结束，计算匹配率为p＝n/N。由此得到遍历所有标准台标的匹配率数组P。

也就是说，参数Δp用于判断是否需要进行像素信息匹配。Δp定义为：Δp＝p_max-p_second，其中，p_max为匹配率数组P的最大值(即最高匹配率)，p_second为匹配率数组P中除最大值之外的次大值(即次高匹配率)。

S504：在最高匹配率与次高匹配率之差大于第一预设差值时，将最高匹配率对应的标准台标作为所述待识别台标的识别结果；

考虑到匹配识别有一定的容错性，设定判断条件Δp≥0.25(即第一预设差值，当然，还可为其他值)，如果判断条件Δp≥0.25成立，则将p_max对应的标准台标为作为所述待识别台标的识别结果。

S505：在最高匹配率与次高匹配率之差小于等于第一预设差值时，判断所述最高匹配率或次高匹配率对应的标准台标是否属于地方台标；

在判断条件Δp≥0.25不成立时，则需要确定所述待识别台标是否为地方台标，本实施方式中，需要判断所述最高匹配率或次高匹配率对应的标准台标是否属于地方台标。

S506：若所述最高匹配率或次高匹配率对应的标准台标均不属于地方台标，则将所述最高匹配率和次高匹配率对应的标准台标作为待匹配标准台标，将所述台标区域的彩色信息与所述待匹配标准台标进行匹配，以更新所述待匹配标准台标的匹配率，将匹配率较高的待匹配标准作为所述待识别台标的识别结果。

由于所述最高匹配率或次高匹配率对应的标准台标均不属于地方台标，故而，所述待识别台标也不会属于地方台标，属于卫视台标的可能性非常高。

本实施方式中，通过台标区域的彩色信息与所述待匹配标准台标进行匹配，以更新所述待匹配标准台标的匹配率，可通过以下步骤：

(1)提取台标区域RGB彩色三通道灰度矩阵M_R、M_G、M_B。

(2)提取所述台标区域中三通道灰度区域矩阵M_0.5R、M_0.5G、M_0.5B，三者的宽、高分别为M_R、M_G、M_B的一半，三者的像素原点坐标如式(1)所示。其中，gray分别代表R、G、B，x为行坐标，y为列坐标，H为矩阵行数(即高度)，W为矩阵列数(即宽度)。

\{\begin{matrix} x_{0, M_{0.5 g r a y}} = \frac{H_{M_{g r a y}}}{4} \\ y_{0, M_{0.5 g r a y}} = \frac{W_{M_{g r a y}}}{4} \end{matrix}

式(1)

提取半宽半高区域的目的是，消除台标区域四角处的背景颜色干扰，以便于后续匹配。

(3)矩阵分块。将M_0.5R、M_0.5G、M_0.5B分别进行分块。由于区域尺寸缩小，从而分块方案修正为：短台标的Edge分为3*3个子块，即9个区域；长台标的Edge分为3*6(行*列)个子块，即18个区域。

(4)RGB三通道空间分布直方图构建。按步骤(3)的分块方案，计算各子块区域的平均红色灰度值m_Ri、平均绿色灰度值m_Gi、平均蓝色灰度值m_Bi，标准库中的标准台标进行同理的分块均值计算，并进行三通道均值匹配。计匹配的区域数为n_rgb，总区域数位N_rgb，如果三个通道的匹配差(同一子块区域中样本灰度均值和标准灰度均值的差值)都小于50，则n_rgb＝n_rgb+1。匹配结束，计算匹配率为p_rgb＝n_rgb/N_rgb。由此得到遍历所有标准台标的RGB匹配率数组P_rgb，其中相近台标的匹配率为p_rgb，非相近台标的匹配率为0。

(5)匹配率更新。综合匹配率数组P和P_rgb的结果，更新匹配率数组P_new＝P+P_rgb。

S507：若所述最高匹配率或次高匹配率对应的标准台标属于地方台标，则根据所述台标区域的边缘与各标准台标的匹配率来确定所述待识别台标所属的地区，分割出所述台标区域中的文字区域，分离所述文字区域中的单字部分，对分离出的单字部分进行识别，将单字部分识别结果与所述地区对应的标准台标进行文字匹配，将匹配的标准台标作为所述待识别台标的识别结果。

可理解的是，所述地区对应的标准台标可理解为所述地区的所有标准台标。

由于所述最高匹配率或次高匹配率对应的标准台标属于地方台标，此时，所述待识别台标属于地方台标的可能性非常高，通常会与多个相同地区的标准台标均具有较高的匹配率，在此情况下，可根据这些匹配率来确定所述待识别台标所属的地区。

本实施方式中，在根据获取的标准台标中各地区的标准台标数量和各地区的标准台标总数确定所述待识别台标所属的地区，可通过以下标准：

获取匹配率与最高匹配率之差小于第一预设差值的标准台标(包括最高匹配率对应的标准台标)，根据获取的各标准台标所属的地区确定最多标准台标所属的目标地区，判断获取的各标准台标中目标区域的标准台标数量和所述目标区域对应的标准台标的总数之间的比例是否超过预设比例，若是，则将所述目标区域作为所述待识别台标所属的地区。

例如：匹配率与最高匹配率之差小于第一预设差值的标准台标为10个，并且10个标准台标中8个属于北京电视台，1个属于四川电视台，1个属于新疆电视台，设北京电视台一共有12个，四川电视台一共有6个，新疆电视台一共有5个，预设比例为50％，可确定目标区域为北京，获取的各标准台标中北京的标准台标数量(即8个)和北京对应的标准台标的总数(即12个)之间的比例为72.7％，超过了预设比例(50％)，此时，将北京作为所述待识别台标所属的地区。

需要说明的是，提取所述台标区域中的文字区域具有多种方式，为提高文字区域的提取效率和准确率，本实施方式，根据台标区域和文字区域之间的位置关系以及所述台标区域的位置信息确定所述文字区域的位置信息，并根据所述文字区域的位置信息从所述台标区域中提取文字区域，当然，还可通过其他方式，本实施方式对此不加以限制。

以所述待识别台标为北京电视台台标为例，文字区域与北京电视台中的标志“BTV”等高，故而，可切割标志“BTV”右侧两倍于所述台标区域高度的区域作为文字区域，也就是说，文字区域的高度与标志“BTV”的高度相同，文字区域的长度为所述台标区域高度的两倍；

为进一步提高识别准确率，本实施方式中，对所述文字区域进行Ostu二值化处理，并采用连通域方式去除噪声干扰。

可理解的是，对于有些地方台标，例如北京电视台台标，其差异在于文字，如“北京卫视”、“体育”、“生活”等。该差异可由文字区域中第一个文字唯一描述，为了提高识别效率，本实施方式中，分离出的单字部分为所述文字区域中的第一个文字所在的单字部分，可通过以下流程实现分离：

(1)去除文字区域中横向、纵向的干扰直线(段)；

(2)获取所述文字区域中单字部分之间的像素间隔；

(3)根据所述像素间隔提取出完整的单字部分，如：文(文艺)、影(影视)；

(4)对单字部分进行阈值分割，分割过程中取左上角5*5子域，计算黑色比例r，如果r小于0.5，交换单字部分的黑白像素。

当然，还可将全部单字部分均分离出来，再分别进行识别，本实施方式对此不加以限制。

在现有技术中存在多种对分离出的单字部分进行识别的方法，但为了提高识别准确率和稳定性，参照图2，所述对分离出的单字部分进行识别包括：

A1：对所述单字部分进行细化处理；

本实施方式中，对所述单字部分进行细化处理，以获得所述单字部分的细化边缘图，细化处理的过程可参照由吕岳和施鹏飞编写的《一种实用并行细化算法及其实现》，本实施方式在此不再赘述。

为了便于后续处理，还可对单字集中的标准单字也进行细化处理，以获得各标准单字的细化边缘图；

为使所述单字部分的细化边缘图及各标准单字的细化边缘图的大小保持一致，例如：可将所述单字部分的细化边缘图及各标准单字的细化边缘图变换为50*50像素大小。

A2：根据细化处理后的单字部分的细化边缘计算所述单字部分和标准单字之间的边缘匹配率；

细化文字的边缘特征包含了刻画了文字的笔画，可缩小匹配标准数据的范围，而区域特征是细化文字的内容，丰富了区域描述，可修正确定匹配文字，由于细化的数据量小于区域特征，本实施方式中，先通过边缘特征匹配，再通过区域特征修正，从而减少运算量。

本实施方式中，根据细化处理后的单字部分的细化边缘计算所述单字部分和标准单字之间的边缘匹配率时，可通过以下流程：

(1)遍历标准单字的细化边缘图si，将si分成10*10的100个子图；

(2)计算各子图细化边缘比例pi_j，组成细化边缘比例矩阵Mi，同理计算得到单字部分的细化边缘比例矩阵M；

(3)比较M和Mi中相同位置元素的近似度，进而计算边缘矩阵匹配度Pe_i；

(4)根据Ps_i+＝Pe_i(Ps_i为Ps的第i个元素)，组成新的概率数组Ps；

A3：判断最高边缘匹配率和次高边缘匹配率的匹配率差值是否高于第二预设差值；

也就是说，判断Ps的最高值Ps_m1与次高值Ps_m2满足条件：

Ps_m1-Ps_m2≧0.25(0.25可设为其它值)，

A4：在所述匹配率差值高于第二预设差值时，将所述最高边缘匹配率对应的标准单字作为所述单字区域的单字识别结果；

也就是说，在满足Ps_m1-Ps_m2≧0.25时，识别为Ps_m1对应的文字并更新匹配率。

A5：在所述匹配率差值不高于第二预设差值时，根据细化处理后的单字部分的区域特征和标准单字进行匹配，对所述边缘匹配率进行更新；

也就是说，在不满足Ps_m1-Ps_m2≧0.25时，可根据区域特征通过以下流程进行修正：

将细化处理后的单字部分逐区域像素确定细化处理后的标准单字相同位置的像素是否为区域像素，计算整图匹配率pi_ds；

将细化处理后的标准单字逐区域像素确定细化处理后的单字部分相同位置的像素是否为区域像素，计算整图匹配率pi_sd；

根据Ps_i+＝(pi_ds+2*pi_sd)/3(Ps_i为Ps的第i个元素)，组成新的概率数组Ps；

A6：将最高边缘匹配率对应的标准单字作为所述单字区域的单字识别结果。

也就是说，将Ps的最大值Ps_m对应的文字作为识别文字，并修正匹配率。

表1给出了采用本实施方式的方法对几个典型台标的平均识别时间。遍历识别时间较短且差异不大，均在2s左右。

表1典型电视台台标的平均识别时间

电视台	台标识别时间(s)
		CCTV1	1.44
CCTV5	1.29
		凤凰卫视	1.76
东南卫视	1.93
		北京生活	2.17
北京体育	2.25

表2给出了采用本实施方式的方法对几个典型台标的平均匹配率及识别率。表2证明了本实施方式的方法的有效性、稳定性和可靠性。

表2典型电视台的平均匹配率及识别率

电视台	平均匹配率	识别率
			CCTV1	100％	100％
CCTV5	92.4％	95.1％
			凤凰卫视	95.2％	97.8％
东南卫视	84.0％	96.6％
			北京生活	76.3％	95.4％
北京体育	82.6％	96.3％

本实施方式的方法适合央视台、卫视台及地方台的匹配识别，实现95％以上的高识别率正确识别，并将遍历识别时间控制在3s以内。

对于方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本发明实施例并不受所描述的动作顺序的限制，因为依据本发明实施例，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作并不一定是本发明实施例所必须的。

图6是本发明一种实施方式的台标识别装置的结构框图；参照图6，所述装置包括：

台标判断单元601，用于判断台标区域中的待识别台标是否为央视台标；

第一识别单元602，用于在所述待识别台标为央视台标时，按照第一预设策略对所述待识别台标进行识别；

第二识别单元603，用于在所述待识别台标为非央视台标时，按照第二预设策略对所述待识别台标进行识别。

在本发明的一种可选实施例中，所述台标判断单元，进一步用于根据台标区域的长宽比、灰度和颜色判断台标区域中的待识别台标是否为央视台标。

在本发明的一种可选实施例中，所述第一识别单元，进一步用于提取所述台标区域中的数字区域，对提取的数字区域进行位数判别，根据位数判别结果识别所述数字区域中的数字，将央视台标的标志和识别的数字之间的组合作为所述待识别台标的识别结果。

在本发明的一种可选实施例中，所述第一识别单元，进一步用于根据所述台标区域和数字区域之间的位置关系提取所述台标区域中的数字区域，并对所述数字区域中的数字部分和背景部分进行二值化处理。

在本发明的一种可选实施例中，所述第一识别单元，进一步用于按列对所述数字区域中各像素的灰度值进行投影，以构成长度为所述数字区域水平宽度的投影向量，在一列投影向量中具有超过预设数量的属于数字部分的像素时，将该列投影向量进行标识，若存在相邻两个被标识的投影向量之间的最小距离大于预设距离，则将所述数字判别结果设为两位，否则将所述数字判别结果设为一位。

在本发明的一种可选实施例中，所述第二识别单元，进一步用于计算所述台标区域的边缘与各标准台标的匹配率；在最高匹配率与次高匹配率之差大于第一预设差值时，将最高匹配率对应的标准台标作为所述待识别台标的识别结果；在最高匹配率与次高匹配率之差小于等于第一预设差值时，判断所述最高匹配率或次高匹配率对应的标准台标是否属于地方台标；在所述最高匹配率或次高匹配率对应的标准台标均不属于地方台标时，将所述最高匹配率和次高匹配率对应的标准台标作为待匹配标准台标，将所述台标区域的彩色信息与所述待匹配标准台标进行匹配，以更新所述待匹配标准台标的匹配率，将匹配率较高的待匹配标准作为所述待识别台标的识别结果。

在本发明的一种可选实施例中，所述第二识别单元，进一步用于对所述台标区域中的边缘通过空间分布直方图与标准台标进行匹配，以计算所述台标区域的边缘与各标准台标的匹配率。

在本发明的一种可选实施例中，所述第二识别单元，进一步用于在所述最高匹配率或次高匹配率对应的标准台标属于地方台标时，根据所述台标区域的边缘与各标准台标的匹配率来确定所述待识别台标所属的地区，分割出所述台标区域中的文字区域，分离所述文字区域中的单字部分，对分离出的单字部分进行识别，将单字部分识别结果与所述地区对应的标准台标进行文字匹配，将匹配的标准台标作为所述待识别台标的识别结果。

在本发明的一种可选实施例中，所述第二识别单元，进一步用于对所述单字部分进行细化处理；根据细化处理后的单字部分的细化边缘计算所述单字部分和标准单字之间的边缘匹配率；判断最高边缘匹配率和次高边缘匹配率的匹配率差值是否高于第二预设差值；在所述匹配率差值高于第二预设差值时，将所述最高边缘匹配率对应的标准单字作为所述单字区域的单字识别结果；在所述匹配率差值不高于第二预设差值时，根据细化处理后的单字部分的区域特征和标准单字进行匹配，对所述边缘匹配率进行更新；将最高边缘匹配率对应的标准单字作为所述单字区域的单字识别结果。

在本发明的一种可选实施例中，所述装置还包括：

区域获取单元，用于从包括待识别台标的视频的预设区域内获取视频帧图像序列，对各视频帧图像进行边缘提取，将各视频帧图像的边缘进行合成，获取合成的边缘的最小外接矩阵，按照所述最小外接矩阵分别对各视频帧图像进行分割，并将分割出的图像通过加权平均的方式进行合成，以获得包括待识别台标的台标区域。

对于装置实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种台标识别方法，其特征在于，所述方法包括：

判断台标区域中的待识别台标是否为央视台标；

2.根据权利要求1所述的方法，其特征在于，所述判断台标区域中的待识别台标是否为央视台标，进一步包括：

根据台标区域的长宽比、灰度和颜色判断台标区域中的待识别台标是否为央视台标。

3.根据权利要求1所述的方法，其特征在于，所述按照第一预设策略对所述待识别台标进行识别，进一步包括：

提取所述台标区域中的数字区域，对提取的数字区域进行位数判别，根据位数判别结果识别所述数字区域中的数字，将央视台标的标志和识别的数字之间的组合作为所述待识别台标的识别结果。

4.根据权利要求3所述的方法，其特征在于，所述提取所述台标区域中的数字区域，进一步包括：

根据所述台标区域和数字区域之间的位置关系提取所述台标区域中的数字区域，并对所述数字区域中的数字部分和背景部分进行二值化处理。

5.根据权利要求4所述的方法，其特征在于，所述对提取的数字区域进行位数判别，进一步包括：

按列对所述数字区域中各像素的灰度值进行投影，以构成长度为所述数字区域水平宽度的投影向量，在一列投影向量中具有超过预设数量的属于数字部分的像素时，将该列投影向量进行标识，若存在相邻两个被标识的投影向量之间的最小距离大于预设距离，则将所述数字判别结果设为两位，否则将所述数字判别结果设为一位。

6.根据权利要求1所述的方法，其特征在于，所述按照第二预设策略对所述待识别台标进行识别，进一步包括：

计算所述台标区域的边缘与各标准台标的匹配率；

在最高匹配率与次高匹配率之差大于第一预设差值时，将最高匹配率对应的标准台标作为所述待识别台标的识别结果；

在最高匹配率与次高匹配率之差小于等于第一预设差值时，判断所述最高匹配率或次高匹配率对应的标准台标是否属于地方台标；

若所述最高匹配率或次高匹配率对应的标准台标均不属于地方台标，则将所述最高匹配率和次高匹配率对应的标准台标作为待匹配标准台标，将所述台标区域的彩色信息与所述待匹配标准台标进行匹配，以更新所述待匹配标准台标的匹配率，将匹配率较高的待匹配标准作为所述待识别台标的识别结果。

7.根据权利要求6所述的方法，其特征在于，所述计算所述台标区域的边缘与各标准台标的匹配率，进一步包括：

对所述台标区域中的边缘通过空间分布直方图与标准台标进行匹配，以计算所述台标区域的边缘与各标准台标的匹配率。

8.根据权利要求6所述的方法，其特征在于，所述判断所述最高匹配率或次高匹配率对应的标准台标是否属于地方台标之后，所述方法还包括：

若所述最高匹配率或次高匹配率对应的标准台标属于地方台标，则根据所述台标区域的边缘与各标准台标的匹配率来确定所述待识别台标所属的地区，分割出所述台标区域中的文字区域，分离所述文字区域中的单字部分，对分离出的单字部分进行识别，将单字部分识别结果与所述地区对应的标准台标进行文字匹配，将匹配的标准台标作为所述待识别台标的识别结果。

9.根据权利要求8所述的方法，其特征在于，所述对分离出的单字部分进行识别，进一步包括：

对所述单字部分进行细化处理；

根据细化处理后的单字部分的细化边缘计算所述单字部分和标准单字之间的边缘匹配率；

判断最高边缘匹配率和次高边缘匹配率的边缘匹配率差值是否高于第二预设差值；

在所述边缘匹配率差值高于第二预设差值时，将所述最高边缘匹配率对应的标准单字作为所述单字区域的单字识别结果；

在所述边缘匹配率差值不高于第二预设差值时，根据细化处理后的单字部分的区域特征和标准单字进行匹配，对所述边缘匹配率进行更新；

将最高边缘匹配率对应的标准单字作为所述单字区域的单字识别结果。

10.根据权利要求1～9中任一项所述的方法，其特征在于，所述判断台标区域中的待识别台标是否为央视台标之前，所述方法还包括：

从包括待识别台标的视频的预设区域内获取视频帧图像序列，对各视频帧图像进行边缘提取，将各视频帧图像的边缘进行合成，获取合成的边缘的最小外接矩阵，按照所述最小外接矩阵分别对各视频帧图像进行分割，并将分割出的图像通过加权平均的方式进行合成，以获得包括待识别台标的台标区域。

11.一种台标识别装置，其特征在于，所述装置包括：

12.根据权利要求11所述的装置，其特征在于，所述台标判断单元，进一步用于根据台标区域的长宽比、灰度和颜色判断台标区域中的待识别台标是否为央视台标。

13.根据权利要求11所述的装置，其特征在于，所述第一识别单元，进一步用于提取所述台标区域中的数字区域，对提取的数字区域进行位数判别，根据位数判别结果识别所述数字区域中的数字，将央视台标的标志和识别的数字之间的组合作为所述待识别台标的识别结果。

14.根据权利要求13所述的装置，其特征在于，所述第一识别单元，进一步用于根据所述台标区域和数字区域之间的位置关系提取所述台标区域中的数字区域，并对所述数字区域中的数字部分和背景部分进行二值化处理。

15.根据权利要求14所述的装置，其特征在于，所述第一识别单元，进一步用于按列对所述数字区域中各像素的灰度值进行投影，以构成长度为所述数字区域水平宽度的投影向量，在一列投影向量中具有超过预设数量的属于数字部分的像素时，将该列投影向量进行标识，若存在相邻两个被标识的投影向量之间的最小距离大于预设距离，则将所述数字判别结果设为两位，否则将所述数字判别结果设为一位。

16.根据权利要求11所述的装置，其特征在于，所述第二识别单元，进一步用于计算所述台标区域的边缘与各标准台标的匹配率；在最高匹配率与次高匹配率之差大于第一预设差值时，将最高匹配率对应的标准台标作为所述待识别台标的识别结果；在最高匹配率与次高匹配率之差小于等于第一预设差值时，判断所述最高匹配率或次高匹配率对应的标准台标是否属于地方台标；在所述最高匹配率或次高匹配率对应的标准台标均不属于地方台标时，将所述最高匹配率和次高匹配率对应的标准台标作为待匹配标准台标，将所述台标区域的彩色信息与所述待匹配标准台标进行匹配，以更新所述待匹配标准台标的匹配率，将匹配率较高的待匹配标准作为所述待识别台标的识别结果。

17.根据权利要求16所述的装置，其特征在于，所述第二识别单元，进一步用于对所述台标区域中的边缘通过空间分布直方图与标准台标进行匹配，以计算所述台标区域的边缘与各标准台标的匹配率。

18.根据权利要求16所述的装置，其特征在于，所述第二识别单元，进一步用于在所述最高匹配率或次高匹配率对应的标准台标属于地方台标时，根据所述台标区域的边缘与各标准台标的匹配率来确定所述待识别台标所属的地区，分割出所述台标区域中的文字区域，分离所述文字区域中的单字部分，对分离出的单字部分进行识别，将单字部分识别结果与所述地区对应的标准台标进行文字匹配，将匹配的标准台标作为所述待识别台标的识别结果。

19.根据权利要求18所述的装置，其特征在于，所述第二识别单元，进一步用于对所述单字部分进行细化处理；根据细化处理后的单字部分的细化边缘计算所述单字部分和标准单字之间的边缘匹配率；判断最高边缘匹配率和次高边缘匹配率的匹配率差值是否高于第二预设差值；在所述匹配率差值高于第二预设差值时，将所述最高边缘匹配率对应的标准单字作为所述单字区域的单字识别结果；在所述匹配率差值不高于第二预设差值时，根据细化处理后的单字部分的区域特征和标准单字进行匹配，对所述边缘匹配率进行更新；将最高边缘匹配率对应的标准单字作为所述单字区域的单字识别结果。

20.根据权利要求11～19中任一项所述的装置，其特征在于，所述装置还包括：