CN108133210A - 一种图像格式识别方法及装置 - Google Patents

一种图像格式识别方法及装置 Download PDF

Info

Publication number
CN108133210A
CN108133210A CN201711318144.1A CN201711318144A CN108133210A CN 108133210 A CN108133210 A CN 108133210A CN 201711318144 A CN201711318144 A CN 201711318144A CN 108133210 A CN108133210 A CN 108133210A
Authority
CN
China
Prior art keywords
images
recognized
region
machine learning
format
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201711318144.1A
Other languages
English (en)
Other versions
CN108133210B (zh
Inventor
于炀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhangjiagang Kangdexin Optronics Material Co Ltd
Original Assignee
SHANGHAI WEI ZHOU MICROELECTRONICS TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHANGHAI WEI ZHOU MICROELECTRONICS TECHNOLOGY Co Ltd filed Critical SHANGHAI WEI ZHOU MICROELECTRONICS TECHNOLOGY Co Ltd
Priority to CN201711318144.1A priority Critical patent/CN108133210B/zh
Publication of CN108133210A publication Critical patent/CN108133210A/zh
Application granted granted Critical
Publication of CN108133210B publication Critical patent/CN108133210B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • G06V10/245Aligning, centring, orientation detection or correction of the image by locating a pattern; Special marks for positioning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明实施例公开了一种图像格式识别方法及装置。其中方法包括:获取待识别图像,并获取所述待识别图像的至少三个预设兴趣区域,其中所述预设兴趣区域包括图像中心区域和至少两个对应区域,所述至少两个对应区域的位置信息基于所述图像中心区域相匹配;提取所述预设兴趣区域的特征参数;将所述特征参数输入至少一个具有图像识别功能的机器学习模型,根据所述机器学习模型的输出结果确定所述待识别图像的格式类型。本发明实施例解决了手动输入格式类型耗费人力与时间的问题,实现了根据图像参数自动识别图像格式类型,提高了图像格式类型的识别效率和准确度。

Description

一种图像格式识别方法及装置
技术领域
本发明实施例涉及图像技术,尤其涉及一种图像格式识别方法及装置。
背景技术
随着3D设备的不断发展,越来越多的3D设备进而同时实现显示2D图像和3D图像。其中,3D图像的显示是通过将左右格式的图像进行图像交织实现,其中,左右格式的图像包括左右格式(LR格式)图像以及左2D图右深度图格式(2D+Z格式)图像。
目前,上述三种格式的一般是通过如下方式识别:一、通过人工识别图像格式后,手动输入图像格式,识别速度慢,误差大,且耗费大量的人力资源;二、通过识别文件头的方式确定图像格式,但是,目前市场上没有对2D/3D图像或者视频的统一规范,无法对不同的文件头标识进行统一地识别,导致图像格式识别率差。
发明内容
本发明实施例提供一种图像格式识别方法及装置,以实现自动识别的图像格式。
第一方面,本发明实施例提供了一种图像格式识别方法,其中方法包括:
获取待识别图像的至少三个预设兴趣区域,其中所述预设兴趣区域包括图像中心区域和至少两个对应区域,所述至少两个对应区域的位置信息基于所述图像中心区域相匹配;
提取所述预设兴趣区域的特征参数;
将所述特征参数输入至少一个具有图像识别功能的机器学习模型,根据所述机器学习模型的输出结果确定所述待识别图像的格式类型。
进一步的,所述特征参数包括如下至少一项:区域基调特征、区域色彩差异特征、区域基调差异特征和区域一致性特征。
进一步的,所述机器学习模型为两个,其中将所述特征参数输入至少一个机器学习模型,根据所述机器学习模型的输出结果确定所述待识别图像的格式类型,包括:
根据所述特征参数确定所述待识别图像是否包括深度图;
根据所述特征参数确定所述待识别图像是否是独立的二维图像;
根据深度图识别结果和/或二维图像的识别结果确定所述待识别图像的格式类型。
进一步的,根据深度图识别结果和/或二维图像的识别结果确定所述待识别图像的格式类型,包括:
若所述待识别图像包括深度图,则确定所述待识别图像的格式类型为二维图与深度图组合格式;
若所述待识别图像是独立的二维图像,则确定所述待识别图像的格式类型为二维图像格式;
若所述待识别图像不包括深度图,且所述待识别图像不是独立的二维图像,则确定所述待识别图像的格式类型为左右图像格式。
进一步的,在获取待识别图像之前,还包括:
建立至少一个待训练的机器学习模型;
根据预设训练样本集对所述待训练的机器学习模型进行训练,并根据训练结果对所述待训练的机器学习模型进行优化,生成所述机器学习模型。
第二方面,本发明实施例还提供了一种图像格式识别装置,该装置包括:
兴趣区域获取模块,用于获取待识别图像的至少三个预设兴趣区域,其中所述预设兴趣区域包括图像中心区域和至少两个对应区域,所述至少两个对应区域的位置信息基于所述图像中心区域相匹配;
特征参数提取模块,用于提取所述预设兴趣区域的特征参数;
图像格式识别模块,用于将所述特征参数输入至少一个具有图像识别功能的机器学习模型,根据所述机器学习模型的输出结果确定所述待识别图像的格式类型。
进一步的,所述特征参数包括如下至少一项:区域基调特征、区域色彩差异特征、区域基调差异特征和和区域一致性特征。
进一步的,所述机器学习模型为两个,所述图像格式识别模块包括:
第一识别模型,用于根据所述特征参数确定所述待识别图像是否包括深度图;
第二识别模型,用于根据所述特征参数确定所述待识别图像是否是独立的二维图像;
识别结果确定单元,用于根据所述第一识别模型和/或所述第二识别模型的识别结果确定所述待识别图像的格式类型。
进一步的,所述识别结果确定单元具体用于:
若所述待识别图像包括深度图,则确定所述待识别图像的格式类型为二维图与深度图组合格式;
若所述待识别图像是独立的二维图像,则确定所述待识别图像的格式类型为二维图像格式;
若所述待识别图像不包括深度图,且所述待识别图像不是独立的二维图像,则确定所述待识别图像的格式类型为左右图像格式。
进一步的,所述装置还包括:
模型建立模块,用于在获取待识别图像之前,建立至少一个待训练的机器学习模型;
模型训练模块,用于根据预设训练样本集对所述待训练的机器学习模型进行训练,并根据训练结果对所述待训练的机器学习模型进行优化,生成所述机器学习模型。
本发明实施例通过获取待识别图像的多个预设兴趣区域,提取了图像中心区域和至少两个对应区域的特征参数,将该特征参数输入至少一个机器学习模型,并根据机器学习模型的输出结果确定待识别图像的格式类型,解决了手动输入格式类型耗费人力与时间,或者文件头标识不统一无法准确识别图像格式的问题,实现了根据图像参数自动识别图像格式类型,提高了图像格式类型的识别效率和准确度。
附图说明
图1是本发明实施例一提供的一种图像格式识别方法的流程图;
图2是本发明实施例一提供的预设兴趣区域的示意图;
图3A是本发明实施例二提供的一种图像格式识别方法的流程图;
图3B是本发明实施例二提供的一种图像格式识别方法的流程图;
图4是本发明实施例三提供的一种图像格式识别方法的流程图;
图5是本发明实施例三提供的Adaboost训练识别误差逐级降低示意图;
图6是本发明实施例三提供的Adaboost验证识别误差逐级降低示意图;
图7是本发明实施例四提供的一种图像格式识别装置的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1是本发明实施例一提供的一种图像格式识别方法的流程图,本实施例可适用于自动识别图像格式的情况,该方法可以由本发明实施例提供的图像格式识别装置来执行,该装置可采用软件和/或硬件的方式实现。参见图1,该方法具体包括:
S110、获取待识别图像的至少三个预设兴趣区域,其中,预设兴趣区域包括图像中心区域和至少两个对应区域,至少两个对应区域的位置信息基于图像中心区域相匹配。
本实施例中,待识别图像可以是任意格式图像,示例性的,待识别图像可以是独立的二维图像,或者是能够进行图像交织的SBS(Side-By-Side)格式图像,其中SBS格式图像可以包括左右格式(LR格式)图像以及左2D图右深度图格式(2D+Z格式)图像,且不同格式的图像的显示策略不同。
本实施例中,在待识别图像中选择至少三个预设兴趣区域,其中,预设兴趣区域包括图像中心区域和至少两个对应区域,至少两个对应区域的位置信息基于图像中心区域相匹配。其中,图像中心区域为以待识别图像的中心线为轴线的规则区域,示例性的,图像中心区域为矩形区域。中心线将待识别区域划分为两部分图像,至少两个对应区域分别位于两部分图像的对应位置。位于相匹配位置的两个对应区域的图形一致,大小相同,有利于提高待识别图像的格式类型的准确度。其中,对应区域可以是规则区域,也可以不规则区域。
示例性的,参见图2,图2是本发明实施例一提供的预设兴趣区域的示意图。图2中图像中心区域C位置以待检测图像的中心线为轴线设置,中心线将待检测图像划分为左侧图像和右侧图像,在上述两部分图像中包含位置匹配的三组对应区域,且对应区域形状、大小相同,且相对于各部分图像的位置相同。需要说明的是,图2仅是一个预设兴趣区域的一种选择实例,本实施例中,预设兴趣区域的数量和位置可随机选择,或者根据待识别图像尺寸等设置。
本实施例中,预设兴趣区域包括多组对应区域,避免了单一对应区域检测图像时导致的数据单一,识别误差大的问题。预设兴趣区域包括图像中心区域,不同格式类型的图像中心区域存在明显差异,是识别图像类型的一个重要因素。其中,2D图像的图像中心区域为连续图像,图像中心区域的像素值变化差异较小;SBS格式图像中心区域为两个图像边缘的组合,图像中心区域的像素值变化差异较大。本实施例中,将图像中心区域确定为一个预设兴趣区域,增加了只图像格式识别的依据,提高了图像格式识别的准确度和可靠性。
S120、提取预设兴趣区域的特征参数。
其中,特征参数用于表征预设兴趣区域的图像特征。可选的,特征参数包括如下至少一项:区域基调特征、区域色彩差异特征、区域基调差异特征和区域一致性特征。
可选的,上述各特征参数基于YUV通道计算。
区域基调特征由各预设兴趣区域的像素平均值表示,示例性的,参见图2,各预设兴趣区域的区域基调特征可根据如下公式(1)实现:
其中,Il、Ir和Ic分别为图2中对应预设兴趣区域的各像素点的像素值,l表示左侧区域,r表示右侧区域,c表示图像中心区域,#用于表示各对应预设兴趣区域的各像素点数量。
区域基调差异特征可根据位置匹配的对应区域的像素平均值之差的绝对值确定,其中,对应区域可以是左右对应区域,还可以是上下对应区域。在一个实施例中,区域基调差异特征可以是左右区域基调差异特征,示例性的,参见图2,对应区域的基调差异特征可根据如下公式(2)实现:
|mean(Il)-mean(Ir)| (2)
区域色彩差异特征由任意两个预设兴趣区域的直方图之差的绝对值表示。示例性的,参见图2,各预设兴趣区域的色彩差异特征可根据如下公式(3)实现:
∑|hist(Il)-hist(Ir)|,∑|hist(Il)-hist(Ic)|,∑|hist(Ir)-hist(Ic)| (3)
其中,hist()是图像直方图计算函数。
区域一致性特征可由各预设兴趣区域的梯度绝对值的平均值表示。示例性的,参见图2,各预设兴趣区域的一致性特征可根据如下公式(4)实现:
mean(|grad(Il)|),mean(|grad(Ir)|),mean(|grad(Ic)|) (4)
本实施例中,提取预设兴趣区域的多种特征参数,避免了根据单一特征识别图像导致识别误差大的问题。
S130、将特征参数输入至少一个具有图像识别功能的机器学习模型,根据机器学习模型的输出结果确定待识别图像的格式类型。
其中,机器学习模型可根据图像特征参数识别图像的格式类型,机器学习模型可以是一个或多个。示例性的,机器学习模型可以是经过训练的分类器或者神经网络,可选的,机器学习模型为级联机器学习模型。示例性的,机器学习模型包括但不限于Adaboost和Random Forest。本实施例中,实现了根据图像参数自动识别图像格式类型,提高了图像格式类型的识别效率和准确度。
需要说明的是,SBS格式图像还可以包括上下格式图像或者上2D图下深度图格式图像,可根据本发明实施例提供的图像格式识别方法识别。
可选的,在步骤S130之后,可根据格式类型,将待识别图像以对应的显示策略进行图像显示。
本实施例的技术方案,通过获取待识别图像的多个预设兴趣区域,提取了图像中心区域和至少两个对应区域的特征参数,将该特征参数输入至少一个机器学习模型,并根据机器学习模型的输出结果确定待识别图像的格式类型,解决了手动输入格式类型耗费人力与时间,或者文件头标识不统一无法准确识别图像格式的问题,实现了根据图像参数自动识别图像格式类型,提高了图像格式类型的识别效率和准确度。
实施例二
图3A是本发明实施例二提供的一种图像格式识别方法的流程图,在上述实施例一的基础上,进一步的提供了将特征参数输入至少一个机器学习模型,根据机器学习模型的输出结果确定待识别图像的格式类型的方法。相应的,该方法具体包括:
S210、获取待识别图像的至少三个预设兴趣区域。
其中,所述预设兴趣区域包括图像中心区域和至少两个对应区域,所述至少两个对应区域的位置信息基于所述图像中心区域相匹配。
S220、提取预设兴趣区域的特征参数。
S230、根据特征参数确定待识别图像是否包括深度图。
本实施例中,机器学习模型包括第一识别模型和第二识别模型。其中,第一识别模型基于深度图的像素灰度值特征识别图像中是否包括深度图。深度图为灰度图像,U通道与V通道的输出值均接近128。可选的,通过检测待识别图像右侧区域U通道和V通道的最大值和最小值的差值是否小于第一预设值,若是,则确定待识别图像包含深度图。可选的,通过检测待识别图像右侧区域U通道和V通道的区域一致性特征是否小于第二预设参数,若是,则确定待识别图像包含深度图。可选的,通过检测待识别图像右侧区域U通道和V通道的最大值和最小值分别与数值128的差值的绝对值是否小于第三预设值,若是,则确定待识别图像包含深度图,避免了待识别图像中包含大量纯色的非灰度图像,导致识别错误的情况。其中,第一预设值、第二预设值和第三预设值可根据图像识别精度需求或者历史识别结果确定。
本实施例中,第一识别模型可以是决策树,也可以是Adaboost分类器,其中,Adaboost分类器的级数可根据第一识别模型的识别精度和计算速度确定。
S240、根据特征参数确定待识别图像是否是独立的二维图像。
本实施例中,第二识别模型例如可以是Adaboost分类器,可选的,采用单层决策树作为弱分类器。其中,Adaboost分类器的级数可根据第二识别模型的识别精度和计算速度确定。
单独的二维图像指的是待识别图像为一个完整的2D图像,而不是由两个图像组合而成。
S250、根据深度图识别结果和/或二维图像的识别结果确定待识别图像的格式类型。
本实施例中,根据两个机器学习模型的分类结果确定待识别图像的格式类型。本实施例中,将特征参数输入两个机器学习模型,并根据两个机器学习模型的输出结果综合确定待识别图像的格式类型。可选的,根据两个机器学习模型的输出结果综合确定待识别图像的格式类型包括:待识别图像包括深度图,则确定待识别图像的格式类型为二维图与深度图组合格式;若待识别图像是独立的二维图像,则确定待识别图像的格式类型为二维图像格式;若待识别图像不包括深度图,且待识别图像不是独立的二维图像,则确定待识别图像的格式类型为左右图像格式。
本实施例中,通过两个机器学习模型确定待识别图像的格式类型,相对于一个机器学习模型,简化了机器学习模型的复杂度,降低了机器学习模型的成本,提高了图像格式识别速度。
本实施例的技术方案,通过第一识别模型根据特征参数确定待识别图像是否包括深度图,第二识别模型根据特征参数确定待识别图像是否是独立的二维图像,并根据两个机器学习模型的输出结果确定待识别图像的格式类型,简化了机器学习模型的复杂度,实现了快速自动识别图像格式。
在上述实施例的基础上,需要说明的是,不限定步骤S240和步骤S230的执行顺序,可以是同步执行,还可以是先执行步骤S240和步骤S230中的任意一个。示例性的,先判断所述待识别图像是否包括深度图,再根据深度图的识别结果,进一步确定所述待识别图像是否是独立的二维图像。参见图3B,图3B是本发明实施例二提供的一种图像格式识别方法的流程图。
S310、获取待识别图像的至少三个预设兴趣区域。
S320、提取预设兴趣区域的特征参数。
S330、根据特征参数确定待识别图像是否包括深度图,若是,则执行步骤S340,若否,则执行步骤S350。
S340、确定待识别图像的格式为二维图与深度图的组合格式,并停止对该待识别图像的识别。
S350、根据特征参数确定待识别图像是否是独立的二维图像,若是,则执行步骤S360,若否,则执行步骤S370。
S360、确定待识别图像的格式为二维图像格式。
S370、确定待识别图像为左右图像格式。
实施例三
图4是本发明实施例三提供的一种图像格式识别方法的流程图,在上述实施例的基础上,进一步的增加了机器学习模型的训练方法。相应的,该方法具体包括:
S410、建立至少一个待训练的机器学习模型。
S420、根据预设训练样本集对待训练的机器学习模型进行训练,并根据训练结果对待训练的机器学习模型进行优化,生成机器学习模型。
示例性的,若机器学习模型为一个,则预设训练样本集包括:二维图与深度图组合格式图像、二维图像格式图像和左右图像格式图像;若机器学习模型为两个,则第一识别模型的预设训练样本集包括二维图与深度图组合格式图像,第二识别模型的预设训练样本集包括二维图像格式图像和左右图像格式图像。
本实施例中,机器学习模型可以是分类器,示例性的,以Adaboost分类器为例介绍机器学习模型的训练过程。需要说明的是,Adaboost分类器仅是一个可选择实例,可根据不同的用户需求选择不同的分类器。
机器学习模型为M级Adaboost分类器,设置样本数量为N的样本空间S={(x1,y1),...,(xn,yn)},其中,xi为第i各样本的特征值向量,yi为第i个样本的分类结果,本实施例中,yi可以是+1和-1,wi为第i个样本的权重。
设置第K(K≤M)阶弱分类器为hk(X),并设置K阶弱分类器合并所得强分类器为样本初始权重为wi=1/N,i=1...N。
对于Adaboost分类器各若分类器的误差为:
或者
其中,ε为一个较小值。
根据上述误差更新Adaboost分类器中各样本权重:
并对上述样本权重进行归一化处理,使得∑wi (K+1)=1。本实施例中,可选的,将单层决策树或者决策树作为Adaboost分类器的若分类器。
可选的,机器学习模型为级联机器学习模型。示例性的,机器学习模型可以是30级,其中,机器学习模型中级数越高,其输出结果的精度越高,30级仅是一个实施例中的机器学习模型的示例,对此不做限定。示例性的,参见图5和图6,图5是本发明实施例三提供的Adaboost训练识别误差逐级降低示意图,图6是本发明实施例三提供的Adaboost验证识别误差逐级降低示意图。
S430、获取待识别图像的至少三个预设兴趣区域。
其中,所述预设兴趣区域包括图像中心区域和至少两个对应区域,所述至少两个对应区域的位置信息基于所述图像中心区域相匹配。
S440、提取预设兴趣区域的特征参数。
S450、将特征参数输入至少一个具有图像识别功能的机器学习模型,根据机器学习模型的输出结果确定待识别图像的格式类型。
本实施例的技术方案,通过建立练至少一个机器学习模型,通过学习训练使得该机器学习模型具有识别图像格式的能力,能够自动识别输入的待识别图像的格式类型,解决了人为干预图像格式识别的问题,实现了图像格式识别的自动化与智能化,提高了识别准确率和效率。
实施例四
图7是本发明实施例四提供的一种图像格式识别装置的结构示意图,该装置具体包括:
兴趣区域获取模块510,用于获取待识别图像的至少三个预设兴趣区域,其中,所述预设兴趣区域包括图像中心区域和至少两个对应区域,所述至少两个对应区域的位置信息基于所述图像中心区域相匹配。
特征参数提取模块520,用于提取预设兴趣区域的特征参数。
图像格式识别模块530,用于将特征参数输入至少一个具有图像识别功能的机器学习模型,根据机器学习模型的输出结果确定待识别图像的格式类型。
可选的,预设兴趣区域包括图像中心区域和至少两个对应区域,至少两个对应区域的位置信息基于图像中心区域相匹配。
可选的,特征参数包括如下至少一项:区域基调特征、区域色彩差异特征、区域基调差异特征和区域一致性特征。
可选的,机器学习模型为两个,图像格式识别模块530包括:
第一识别模型,用于根据特征参数确定待识别图像是否包括深度图;
第二识别模型,用于根据特征参数确定待识别图像是否是独立的二维图像;
识别结果确定单元,用于根据第一识别模型和/或第二识别模型的识别结果确定待识别图像的格式类型。
可选的,识别结果确定单元具体用于:
待识别图像包括深度图,则确定待识别图像的格式类型为二维图与深度图组合格式;
若待识别图像是独立的二维图像,则确定待识别图像的格式类型为二维图像格式;
若待识别图像不包括深度图,且待识别图像不是独立的二维图像,则确定待识别图像的格式类型为左右图像格式。
可选的,装置还包括:
模型建立模块,用于在获取待识别图像之前,建立至少一个待训练的机器学习模型;
模型训练模块,用于根据预设训练样本集对待训练的机器学习模型进行训练,并根据训练结果对待训练的机器学习模型进行优化,生成机器学习模型。
本发明实施例提供的图像格式识别装置可执行本发明任意实施例所提供的图像格式识别方法,具备执行图像格式识别方法相应的功能模块和有益效果。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (10)

1.一种图像格式识别方法,其特征在于,包括:
获取待识别图像的至少三个预设兴趣区域,其中所述预设兴趣区域包括图像中心区域和至少两个对应区域,所述至少两个对应区域的位置信息基于所述图像中心区域相匹配;
提取所述预设兴趣区域的特征参数;
将所述特征参数输入至少一个具有图像识别功能的机器学习模型,根据所述机器学习模型的输出结果确定所述待识别图像的格式类型。
2.根据权利要求1所述的方法,其特征在于,所述特征参数包括如下至少一项:区域基调特征、区域色彩差异特征、区域基调差异特征和区域一致性特征。
3.根据权利要求1所述的方法,其特征在于,根据所述机器学习模型的输出结果确定所述待识别图像的格式类型,包括:
根据所述特征参数确定所述待识别图像是否包括深度图;
根据所述特征参数确定所述待识别图像是否是独立的二维图像;
根据深度图识别结果和/或二维图像的识别结果确定所述待识别图像的格式类型。
4.根据权利要求3所述的方法,其特征在于,根据深度图识别结果和/或二维图像的识别结果确定所述待识别图像的格式类型,包括:
若所述待识别图像包括深度图,则确定所述待识别图像的格式类型为二维图与深度图组合格式;
若所述待识别图像是独立的二维图像,则确定所述待识别图像的格式类型为二维图像格式;
若所述待识别图像不包括深度图,且所述待识别图像不是独立的二维图像,则确定所述待识别图像的格式类型为左右图像格式。
5.根据权利要求1所述的方法,其特征在于,在获取待识别图像之前,还包括:
建立至少一个待训练的机器学习模型;
根据预设训练样本集对所述待训练的机器学习模型进行训练,并根据训练结果对所述待训练的机器学习模型进行优化,生成所述机器学习模型。
6.一种图像格式识别装置,其特征在于,包括:
兴趣区域获取模块,用于获取待识别图像的至少三个预设兴趣区域,其中所述预设兴趣区域包括图像中心区域和至少两个对应区域,所述至少两个对应区域的位置信息基于所述图像中心区域相匹配;
特征参数提取模块,用于提取所述预设兴趣区域的特征参数;
图像格式识别模块,用于将所述特征参数输入至少一个具有图像识别功能的机器学习模型,根据所述机器学习模型的输出结果确定所述待识别图像的格式类型。
7.根据权利要求6所述的装置,其特征在于,所述特征参数包括如下至少一项:区域基调特征、区域色彩差异特征、区域基调差异特征和区域一致性特征。
8.根据权利要求6所述的装置,其特征在于,所述机器学习模型为两个,所述图像格式识别模块包括:
第一识别模型,用于根据所述特征参数确定所述待识别图像是否包括深度图;
第二识别模型,用于根据所述特征参数确定所述待识别图像是否是独立的二维图像;
识别结果确定单元,用于根据所述第一识别模型和/或所述第二识别模型的识别结果确定所述待识别图像的格式类型。
9.根据权利要求6所述的装置,其特征在于,所述识别结果确定单元具体用于:
若所述待识别图像包括深度图,则确定所述待识别图像的格式类型为二维图与深度图组合格式;
若所述待识别图像是独立的二维图像,则确定所述待识别图像的格式类型为二维图像格式;
若所述待识别图像不包括深度图,且所述待识别图像不是独立的二维图像,则确定所述待识别图像的格式类型为左右图像格式。
10.根据权利要求6所述的装置,其特征在于,所述装置还包括:
模型建立模块,用于在获取待识别图像之前,建立至少一个待训练的机器学习模型;
模型训练模块,用于根据预设训练样本集对所述待训练的机器学习模型进行训练,并根据训练结果对所述待训练的机器学习模型进行优化,生成所述机器学习模型。
CN201711318144.1A 2017-12-12 2017-12-12 一种图像格式识别方法及装置 Active CN108133210B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711318144.1A CN108133210B (zh) 2017-12-12 2017-12-12 一种图像格式识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711318144.1A CN108133210B (zh) 2017-12-12 2017-12-12 一种图像格式识别方法及装置

Publications (2)

Publication Number Publication Date
CN108133210A true CN108133210A (zh) 2018-06-08
CN108133210B CN108133210B (zh) 2022-04-01

Family

ID=62389325

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711318144.1A Active CN108133210B (zh) 2017-12-12 2017-12-12 一种图像格式识别方法及装置

Country Status (1)

Country Link
CN (1) CN108133210B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110674831A (zh) * 2018-06-14 2020-01-10 佛山市顺德区美的电热电器制造有限公司 一种数据处理方法、装置及计算机可读存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102710953A (zh) * 2012-05-08 2012-10-03 深圳Tcl新技术有限公司 自动识别3d视频播放模式的方法和装置
CN102742283A (zh) * 2010-02-09 2012-10-17 皇家飞利浦电子股份有限公司 三维视频格式检测
CN102970555A (zh) * 2012-11-30 2013-03-13 深圳Tcl新技术有限公司 调整3d视频播放模式的方法和装置
CN104185023A (zh) * 2014-09-16 2014-12-03 上海通途半导体科技有限公司 三维视频格式自动检测方法及装置
CN104994374A (zh) * 2015-07-03 2015-10-21 宁波易维视显示技术有限公司 一种自动检测视频三维格式的方法
CN105550706A (zh) * 2015-12-13 2016-05-04 大巨龙立体科技有限公司 一种2d图像与3d图像的识别方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102742283A (zh) * 2010-02-09 2012-10-17 皇家飞利浦电子股份有限公司 三维视频格式检测
CN102710953A (zh) * 2012-05-08 2012-10-03 深圳Tcl新技术有限公司 自动识别3d视频播放模式的方法和装置
CN102970555A (zh) * 2012-11-30 2013-03-13 深圳Tcl新技术有限公司 调整3d视频播放模式的方法和装置
CN104185023A (zh) * 2014-09-16 2014-12-03 上海通途半导体科技有限公司 三维视频格式自动检测方法及装置
CN104994374A (zh) * 2015-07-03 2015-10-21 宁波易维视显示技术有限公司 一种自动检测视频三维格式的方法
CN105550706A (zh) * 2015-12-13 2016-05-04 大巨龙立体科技有限公司 一种2d图像与3d图像的识别方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110674831A (zh) * 2018-06-14 2020-01-10 佛山市顺德区美的电热电器制造有限公司 一种数据处理方法、装置及计算机可读存储介质

Also Published As

Publication number Publication date
CN108133210B (zh) 2022-04-01

Similar Documents

Publication Publication Date Title
CN107451607B (zh) 一种基于深度学习的典型人物的身份识别方法
CN109543606B (zh) 一种加入注意力机制的人脸识别方法
CN105574550B (zh) 一种车辆识别方法及装置
Machado et al. Experiments in computational aesthetics: An iterative approach to stylistic change in evolutionary art
CN107609493A (zh) 优化人脸图片质量评价模型的方法及装置
CN107423700A (zh) 人证核实的方法及装置
CN103208123B (zh) 图像分割方法与***
CN109034159A (zh) 图像信息提取方法和装置
CN106529448A (zh) 利用聚合通道特征进行多视角人脸检测的方法
CN106845357A (zh) 一种基于多通道网络的视频人脸检测和识别方法
CN106778506A (zh) 一种融合深度图像和多通道特征的表情识别方法
CN107341463A (zh) 一种结合图像质量分析与度量学习的人脸特征识别方法
CN108614994A (zh) 一种基于深度学习的人头部图像提取方法和装置
CN110188708A (zh) 一种基于卷积神经网络的人脸表情识别方法
CN106934455B (zh) 基于cnn的遥感影像光学适配结构选取方法及***
CN109117863A (zh) 基于深度卷积生成对抗网络的绝缘子样本扩充方法及装置
CN104200238B (zh) 台标识别方法和台标识别装置
CN110827312A (zh) 一种基于协同视觉注意力神经网络的学习方法
CN111062331B (zh) 图像的马赛克检测方法、装置、电子设备及存储介质
CN106327537A (zh) 一种图像预处理方法及装置
CN106529432A (zh) 一种深度融合显著性检测与先验知识的手部区域分割方法
CN108256454A (zh) 一种基于cnn模型的训练方法、人脸姿态估测方法及装置
CN109086772A (zh) 一种扭曲粘连字符图片验证码的识别方法及***
CN111881716A (zh) 一种基于多视角生成对抗网络的行人重识别方法
CN107993228A (zh) 一种基于心血管oct影像的易损斑块自动检测方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20200408

Address after: 215634 north side of Chengang road and west side of Ganghua Road, Jiangsu environmental protection new material industrial park, Zhangjiagang City, Suzhou City, Jiangsu Province

Applicant after: ZHANGJIAGANG KANGDE XIN OPTRONICS MATERIAL Co.,Ltd.

Address before: 201203, room 5, building 690, No. 202 blue wave road, Zhangjiang hi tech park, Shanghai, Pudong New Area

Applicant before: WZ TECHNOLOGY Inc.

GR01 Patent grant
GR01 Patent grant