CN108875451B

CN108875451B - 一种定位图像的方法、装置、存储介质和程序产品

Info

Publication number: CN108875451B
Application number: CN201710325609.XA
Authority: CN
Inventors: 晏栋; 赵伟; 邓亮专
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2017-05-10
Filing date: 2017-05-10
Publication date: 2023-04-07
Anticipated expiration: 2037-05-10
Also published as: CN108875451A

Abstract

一种定位图像的方法、装置、存储介质和程序产品，所述方法包括：从获取的图片中确定与图像模版匹配的至少一个匹配区域；根据所述至少一个匹配区域确定目标区域；根据特征匹配算法在所述目标区域中提取第一特征信息；根据预设的识别条件和所述第一特征信息在所述目标区域内的分布特征，确定所述目标区域中的至少一个有效区域；根据所述至少一个有效区域内的特征信息的分布特征确定出结果图像。通过采用本方案，能够有效的提高识别特定类型的图片的效率，也能提高识别出的特定类型的图片的准确性。

Description

一种定位图像的方法、装置、存储介质和程序产品

技术领域

本申请涉及图像处理技术领域，尤其涉及一种定位图像的方法、装置、存储介质和程序产品。

背景技术

目前交通或者停车场一般会对车辆的车牌进行定位和识别，以便于交通管理或者缴费管理。车牌定位主要基于颜色分量来识别车牌：将拍摄的图片的颜色空间由RGB色彩模型转为HSV色彩模型，提取图片的蓝色分量，将有蓝色分量并超过阈值的区域设置为前景区域，将图片中的其他部分作为背景区域，然后在前景区域中利用车牌的先验知识去识别出前景区域中的车牌。若采用给予颜色分量的方式识别身份证，由于身份证的特性，会导致拍摄的身份证图片中的白色和黑色在背景中出现的概率很高，这样就无法准确的识别出身份证图片。

目前主要采用基于边缘信息方法，具体如下：将彩色图片转换为灰度图片，利用各种卜算子对该灰度图片进行边缘检测，然后在边缘图像中寻找符合身份证形状的边缘，将符合身份证特性的边缘线段所包围的区域作为身份证区域。但是在复杂背景中检测身份证图像时，采用上述基于边缘信息方法识别出身份证图像的效率较低，其次，在复杂背景中检测的身份证图像的准确度较低。

发明内容

本申请提供了一种定位图像的方法、装置、存储介质和程序产品，能够解决现有技术中准确度较低的问题。

本申请第一方面提供一种定位图像的方法，所述方法包括：

从获取的图片中确定与图像模版匹配的至少一个匹配区域；

根据所述至少一个匹配区域确定目标区域；

根据特征匹配算法在所述目标区域中提取第一特征信息；

根据预设的识别条件和所述第一特征信息在所述目标区域内的分布特征，确定所述目标区域中的至少一个有效区域；

根据所述至少一个有效区域内的特征信息的分布特征确定出结果图像。

本申请第二方面提供一种用于识别图像的装置，具有实现对应于上述第一方面提供的识别图像的方法的功能。所述功能可以通过硬件实现，也可以通过硬件执行相应的软件实现。硬件或软件包括一个或多个与上述功能相对应的模块，所述模块可以是软件和/或硬件。一种可能的设计中，本申请中的用于识别图像的装置可包括：

获取模块，用于获取图片；

处理模块，用于从所述获取模块获取的图片中确定与图像模版匹配的至少一个匹配区域；

根据特征匹配算法在所述目标区域中提取第一特征信息；

本申请又一方面提供了一种计算机存储介质，其包括指令，当其在计算机上运行时，使得计算机执行上述各方面所述的方法。

本申请又一方面提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述各方面所述的方法。

相较于现有技术，本申请提供的方案中，首先根据特征模版从图片中确定与特征模版匹配的至少一个匹配区域，能够缩小识别的范围，然后根据这些匹配区域确定出目标区域，再根据特征匹配算法在目标区域中提取第一特征信息，根据预设的识别条件和第一特征信息在所述目标区域的分布特征，确定所述目标区域中的至少一个有效区域，这样就可以根据至少一个有效区域确定出结果图像。采用本方案，能够有效的提高识别特定类型的图像的效率，也能提高识别出的特定类型的图像的准确性。

附图说明

图1为本发明实施例中征信***的一种网络拓扑结构示意图；

图2为本发明实施例中定位图像的方法的一种流程示意图；

图3-1为本发明实施例中图像模版与特征模版之间的一种关系示意图；

图3-2为本发明实施例中用匹配区域确定目标区域的一种示意图；

图3-3为本发明实施例中用匹配区域确定目标区域的另一种示意图；

图4为本发明实施例中采用身份证正面特征模版匹配出3个匹配区域的一种示意图；

图5为本发明实施例中过滤3个匹配区域中的无效匹配区域的一种示意图；

图6为本发明实施例中采用身份证正面特征模版匹配出1个匹配区域的一种示意图；

图7为本发明实施例中过滤3个匹配区域中的无效匹配区域的另一种示意图；

图8为本发明实施例中确定身份证背面区域中SIFT特征点的一种示意图；

图9为本发明实施例中确定身份证正面区域中SIFT有效行的一种示意图；

图10为本发明实施例中根据确定的SIFT有效行确定身份证区域的一种示意图；

图11为本发明实施例中用于定位图像的装置的一种结构示意图；

图12为本发明实施例中用于定位图像的手机的一种结构示意图；

图13为本发明实施例中用于定位图像的服务器的一种结构示意图。

具体实施方式

本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或模块的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或模块，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或模块，本申请中所出现的模块的划分，仅仅是一种逻辑上的划分，实际应用中实现时可以有另外的划分方式，例如多个模块可以结合成或集成在另一个***中，或一些特征可以忽略，或不执行，另外，所显示的或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，模块之间的间接耦合或通信连接可以是电性或其他类似的形式，本申请中均不作限定。并且，作为分离部件说明的模块或子模块可以是也可以不是物理上的分离，可以是也可以不是物理模块，或者可以分布到多个电路模块中，可以根据实际的需要选择其中的部分或全部模块来实现本申请方案的目的。

本申请实施例供了一种定位图像的方法、装置、存储介质和程序产品，本申请可用于征信***和图像识别***等领域。例如电商平台的征信***、人脸识别***、图1为征信***的一种网络拓扑结构，用户可通过手机将拍摄的身份证图片上传给服务器，然后由服务器对用户上传的身份证图片进行身份证的识别，再对识别出的身份证进行征信验证。

为解决上述技术问题，本申请实施例主要提供以下技术方案：

基于Haar特征的检测技术定位到照片中身份证正面的人脸或者身份证背面的国徽从而确定身份证的大致区域，在大致区域中提取sift特征，通过sift特征点的统计分布从而确定身份证的准确位置。其中，Haar特征主要分为三类：边缘特征、线性特征、中心特征和对角线特征，组合成特征模板。特征模板内有白色和黑色两种矩形，并定义该模板的特征值为白色矩形像素之和减去黑色矩形像素之和。Haar特征值可反映图像的灰度变化情况。本申请可基于Haar特征预先训练出多个Haar特征模版，对身份证正/反面使用的Haar特征模版不同。

需要说明的是，本申请中的用于定位图像的装置可以是作为服务端的服务器，也可以是作为服务端的终端设备，还可以理解为安装在终端设备上的客户端(或者称之为交互式应用)。

参照图2，以下对本申请实施例提供的一种定位图像的方法进行举例说明，所述方法可包括：

201、从获取的图片中确定与图像模版匹配的至少一个匹配区域。

其中，图像模版是指根据各种类型的图片预先训练得到的模版，其可从全局来识别出特定类型的图片，特定类型的图片可例如身份证、银行卡、驾驶证、车牌或人脸等，具体本申请不作限定。考虑到图像模版的复用以及上述图片的不确定性，本申请实施例中，还可以分别从局部识别出局部的特征，然后综合得到上述至少一个匹配区域。具体来说，上述图像模版可包括至少两个特征模版，每个特征模版对应一个类型的特定特征，这样在识别图片中的匹配区域时，就可以分别根据特征模版去匹配出相同或相似的特征。

一方面中，这样既可以在图片中匹配出更多满足该特征模版中特征的匹配区域，匹配出更多的匹配区域能够减少漏网之鱼；另一方面中，用局部的特征模版去匹配时，能够提高匹配的准确度和精确度，也能够过滤掉上述图像模版匹配时匹配出的无用的匹配区域，由此可见，采用几个特征模版结合去匹配图片，还能缩小定位特征的搜寻范围。例如，当仅仅采用上述图像模版来匹配图片中的特征时，若图片中存在特征与特征之间相互重叠的现象，那么，可能将这些互相重叠的特征所在的特定类型的图片直接过滤掉，最终可能出现即使上述图片中存在某个待识别的特定类型的图片，也无法将其识别出来的现象。所以，可以结合使用多个特征模版来分别匹配局部特征，这样是可以减少此类现象的。

可选的，在另一种实施方式中，如果要识别的特定类型的图片很多，而有些特定类型的图片之间存在局部相同或相似的部分，例如身份证和居住证等身份证明文件，各种毕业证书之间、各种职业证书之间等，甚至某些法律格式化或规格文件之间等，诸如此类，都有可能会有相同或相似的特征。可能在这些特定类型的图片中都会划分一个住址信息、用户信息和用户头像等，鉴于要识别的图片的类型较多，那么会相应增加数据库的负荷。为降低数据库的负荷，以及便于数据库管理，可通过对特征模版的复用来实现，这样也能提高某些特征模版的复用率，那么可以将这些被复用的特征模版称之为公用特征模版，可将其他只能用于某个特定类型的图片的特征模版称之为专用特征模版。

举例来说，在识别特定类型的图片时，可以根据当前图片的特征信息来大致确定其中所包含的图片的类型，然后可直接调用上述图像模版，也可调用至少两个特征模版，在这些被调用的至少两个特征模版中，可以仅包括专用特征模版，也可仅包括公用特征模版，还可既包括专用特征模版又包括公用特征模版，具体如何选用特征模版，本申请不作限定。举例来说，所述至少两个特征模版中还可包括至少一个类型的专用特征模版和至少一个类型的公用特征模版，图3-1为图像模版与特征模版(包括专用特征模版和共用特征模版)的一种关系示意图。

匹配区域是指将调用的特征模版与图片中的特征进行比对检测，最后匹配出与特征模版对应的特征所在的区域，该匹配区域可以由一个全局的特征模版来匹配出，也可以由一个单独的特征模版匹配出。

如图4所示，使用图像模版得到了三个匹配区域(匹配区域1-3)，这三个匹配区域为候选的匹配区域，其中有一个匹配区域3虽然能够被该图像模版匹配到，但匹配区域3中的特征并非想要识别出的特征，因此，需要将匹配区域3过滤掉。

若被调用的至少两个特征模版仅包括专用特征模版时，服务器或者终端设备可根据这些专用特征模版从图片中确定出上述至少一个匹配区域。若被调用的至少两个特征模版包括专用特征模版和公用特征模版时，服务器或者终端设备可所述从获取的图片中确定与所述至少一个类型的专用特征模版匹配的匹配区域，以及从所述图片中确定与所述至少一个公用特征模版匹配的匹配区域。

202、根据所述至少一个匹配区域确定目标区域。

可选的，在一些实施方式中，由步骤201中的描述可知，所述至少一个匹配区域包括第一匹配区域，所述第一匹配区域与第一特征模版匹配。相应的，根据所述至少一个匹配区域确定目标区域的过程具体如下：

根据所述第一特征模版中的第一特征，判断所述第一匹配区域内的第一特征是否与所述第一特征模版中的第二特征对应，若是，则将所述第一匹配区域作为一个候选区域，若否，则忽略所述第一匹配区域。需要说明的是，本申请中的第一匹配区域是指步骤201中所得到的至少一个匹配区域中的任意匹配区域，其他匹配区域的判断过程可参考对第一匹配区域的说明，不作赘述。这样可分别对步骤201中的每个匹配区域或者多个匹配区域进行判断，最终可得到至少一个候选区域。

然后，再将得到的至少一个候选区域作为所述目标区域，所述目标区域则是指符合识别条件的图片中的特征所在的区域。

其中，所述第一特征在所述结果图像中的位置与所述第二特征在所述图像模版中的位置对应，所述第一候选区域在所述结果图像中的位置与所述第一特征模版在所述图像模版中的位置对应。举例来说，如图4所示，在识别身份证图片的场景中，使用人脸特征模版和文字特征模版确定出三个匹配区域(匹配区域1-匹配区域3)，这三个匹配区域为候选的匹配区域，其中有一个匹配区域3虽然能够被该图像模版匹配到，但匹配区域3中的特征并非想要识别出的特征，因此，需要将匹配区域3过滤掉，最后得到的身份证区域的示意图可参考图5。通过特征比对，能够过滤掉不合格的匹配区域，从而提高图像识别的准确率，一定程度上也能降低运算复杂度。

可选的，在一些实施方式中，根据至少一个匹配区域确定上述目标区域的手段主要包括下述几种：

(1)、根据各个匹配区域在所述图片中的位置，以及采用先验知识来判断其中是否存在能够符合某些特定类型的图像的特征的区域，然后将这些符合条件的匹配区域作为一个目标区域。例如，上述至少一个匹配区域可包括人脸匹配区域、用户信息匹配区域、国徽匹配区域及身份证号匹配区域，很显然，根据先验知识可得出其中的国徽匹配区域与其它三个匹配区域是不可能组成一种特定类型的图片的，而人脸匹配区域、用户信息匹配区域和身份证号匹配区域却可以组成具备身份证明信息的图片，例如身份证图片或者居住证图片，至于是身份证图片还是居住证图片，可以进一步对各个匹配区域内的特征点进行分析，例如可以根据身份证格式或者居住证格式来判断，具体本申请不作赘述。

(2)、根据一个匹配区域在其周围划定一个包含该匹配区域的特定类型的区域(如图3-2所示)，然后通过先验知识去检测所划定的区域是否包含特定类型的图片的全部或部分特征、以及判断所划定的区域是否满足某种特定类型的图片的判断条件，若满足则可将其作为一个目标区域。依此类推，可对每个匹配区域都按照需求划定一个特定类型的区域，然后检测、判断即可。当然，也可以同时以两个以上的匹配区域去划定一个特定类型的区域(如图3-3所示)，具体实现手段本申请不作限定。

203、根据特征匹配算法在所述目标区域中提取第一特征信息。

可选的，在一些实施方式中，所述第一特征信息包括多个特征点，每个有效区域为两个特征行之间所包括的区域，所述两个特征行的间距小于预设阈值。

其中，特征匹配算法可采用尺度不变特征转换(英文全称：Scale-invariantfeature transform，英文简称：SIFT)算法、高鲁棒性的局部感兴趣点检测(英文全称：Speeded Up Robust Feature，英文简称：SURF)或ORB算法等，具体本申请不作限定。SIFT算法可用来侦测与描述影像中的局部性特征，它在空间尺度中寻找极值点，并提取出其位置、尺度、旋转不变量。SIFT算法主要包括SIFT特征向量的生成，以及第二阶段是SIFT特征向量的匹配两个阶段。

204、根据预设的识别条件和所述第一特征信息在所述目标区域内的分布特征，确定所述目标区域中的至少一个有效区域。

205、根据所述至少一个有效区域内的特征信息的分布特征确定出结果图像。

相较于现有机制，本申请提供的方案中，根据特征模版从图片中确定与特征模版匹配的至少一个匹配区域，能够缩小识别的范围，然后根据这些匹配区域确定出目标区域，再根据特征匹配算法在目标区域中提取第一特征信息，根据预设的识别条件和第一特征信息在所述目标区域的分布特征，确定所述目标区域中的至少一个有效区域，这样就可以根据至少一个有效区域确定出特定图像。由此可见，采用本方案，能够有效的提高识别特定图像的效率，也能提高识别出的特定图像的准确性。

可选的，在一些发明实施例中，例如，在采用SIFT算法时，根据SIFT特征匹配算法在目标区域中提取SIFT特征信息，根据预设的识别条件和SIFT特征信息在所述目标区域的分布特征，确定所述目标区域中的至少一个SIFT有效区域，这样就可以根据至少一个SIFT有效区域确定出特定类型的图像。

相应的，上述第一特征信息可包括多个SIFT特征点，每个SIFT有效区域为两个SIFT特征行之间所包括的区域，所述两个SIFT特征行的间距小于预设阈值。由于SIFT算法的独特性好，信息量丰富，所以可以在海量特征数据库中进行快速、准确的匹配到SIFT特征点，并且SIFT算法具备多量性，即使少数的几个物体也可以产生大量SIFT特征向量，SIFT算法还具备较快的运算速度，所以可以达到实时的要求，尤其适用于在服务器同时处理多个终端设备上传的图片的场景。此外，由于SIFT特征点是图片的局部特征，所以在对图片进行仿真变换时的稳定性较强。可见，采用SIFT算法来识别特定类型的图片时，可提高识别特定类型的图片的效率以及提高识别出的特定类型的图片的准确性。

可选的，在一些发明实施例中，考虑到可能服务器或者终端设备并不知道该图片中包含的特定类型的图片是什么类型的，或者上述图片中所包括的特征较多，又或者有污染源，再或者相似的特定类型的图片较多，即使各特征不相互重叠，也会对想要识别的特定类型的图片产生干扰。那么，这样，会增加用不同的特征模版去匹配的次数，并且，其中有一部分的匹配操作肯定是无用功。那么，为减少操作负荷，以及提高对特定类型的图片的准确度，在所述从获取的图片中确定与所述图像模版匹配的至少一个匹配区域之前，还可从所述图片中提取图片的第二特征信息，然后查询与所述第二特征信息匹配的所述图像模版。

例如，若拍摄的图片中有身份证图片，终端设备并不知道其中含有身份证图片，终端设备可以调用本地存储的各种类型的特征模版去匹配，最终可以匹配出该图片中的身份证图片，但可能几次就匹配出，可能需要遍历较多特征模版才能匹配出。采用本方案后，终端设备可先从该图片中提取特征信息，然后调用各种证件特征模版(例如依次调用社保卡特征模版、居住证特征模版和身份证特征模版来匹配，最终可通过身份证特征模版匹配出该身份证图片。通过采用该方式，可以减少匹配多次才能找到真正合适的图像模版，能够提高运算效率。

可选的，在一些发明实施例中，上述第二特征信息包括图形、文字、标识、图标、点、线、像素点之间的梯度或者像素点之间的位置关系中的至少一种信息元素，在所述从所述图片中提取图片的第二特征信息之后，在所述查询与所述第二特征信息匹配的所述图像模版之前，还可从所述第二特征信息中提取至少一个特征，提取的至少一个特征可以是特定类型的特征，例如人脸、住址信息、姓名或标志等。

所述查询与所述第二特征信息匹配的所述图像模版，包括：

查询与所述至少一个特征匹配的所述图像模版，这样在查询合适的图像模版时，可以进一步缩小候选的范围，从而减少遍历次数。

可选的，在一些发明实施例中，考虑到获取的图片质量可能较低，为提高识别特定类型的图片的效率，在所述从所述图片中提取图片的第二特征信息之前，还可对所述图片进行预处理，所述预处理的方式包括图像平滑处理、图像变换域、图像增强、图像复原中的至少一种处理方式。

其中，图像增强是指将原来不清晰的图像变得清晰或强调某些感兴趣的特征，抑制不感兴趣的特征，使之改善图像质量、丰富信息量，加强图像判读和识别效果的图像处理方式，主要包括频率域法和空间域法。

图像复原是指利用退化过程的先验知识，去恢复已被退化图像的本来面目，可对遥感图像资料进行大气影响的校正、几何校正以及对由于设备原因造成的扫描线漏失、错位等的改正，将降质图像重建成接近于或完全无退化的原始理想图像。

为便于理解，下面以服务器识别用户上传的照片中的身份证图片为例。

首先，可通过先验知识，例如前述实施例中提取的第二特征信息来确定照片中是否包含有身份证的正/反面图片信息，确定用户上传的照片中包含身份证正/反面图片后，即可进行以下的身份证图片的识别操作：

可基于Haar特征的检测技术定位到照片中身份证正面的人脸或者身份证背面的国徽从而确定身份证的大致区域，在大致区域中提取SIFT特征通过SIFT特征点的统计分布从而确定身份证的准确位置。其中，Haar特征主要分为三类：边缘特征、线性特征、中心特征和对角线特征，组合成特征模板。特征模板内有白色和黑色两种矩形，并定义该模板的特征值为白色矩形像素和减去黑色矩形像素和。Haar特征值可反映图像的灰度变化情况。本身请可基于Haar特征预先训练出多个Haar特征模版，对身份证正/反面使用的Haar特征模版不同。

下面对从照片中准确的识别出身份证图片的步骤(1)-步骤(7)进行说明：

(1)、利用已经训练好的haar特征模版在照片中检测与特征模版匹配的区域。

具体来说，可采用人脸特征模板在照片中检测与该人脸特征模板匹配的匹配区域，很可能会得到两个以上的关于人脸的匹配区域。同理，采用国徽特征模板在照片中检测与该国徽特征模板匹配的匹配区域，很可能会得到两个以上的关于国徽的匹配区域。最终，可检测出多个匹配区域，检测出多个匹配区域的示意图可参考图6所示的身份证正面检测示意图，图6中，每个虚线框均可代表一个匹配区域，通过先验知识可判断出图6中的匹配区域3不是真实身份证正面上的人脸，所以可忽略该匹配区域3，最终得到图7所示的区域示意图。

(2)、如果照片中包含身份证正面图片，则排除左上角小于图片宽度1/2的人脸匹配区域，如果照片中包含身份证背面图片，则忽略左上角超过照片宽度1/3处的国徽匹配区域4，效果见图7。

(3)、根据得到的多个匹配区域确定目标区域。

设定长度H是指匹配区域的垂直距离，宽度W是指匹配区域的水平距离.，根据匹配区域的长宽设定目标区域的大小，匹配区域与目标区域都为长方形。如果照片中包含的是身份证正面则目标区域的左上角的坐标计算方法如式(1),右下角的坐标计算方法如式(2)：

(max(0,int(X–3.58*W),max(0,int(Y-0.48*H))) (1)

(min(WW,int(X+1.9*W))，min(HH,int(Y+2.5*H))) (2)

如果照片中包含的是身份证背面，则目标区域的左上角的坐标计算方法如式(3),右下角的坐标计算方法如式(4)：

(max(0,int(X–0.8*W),max(0,int(Y-0.4*H))) (3)

(min(WW,int(X+6*W))，min(HH,int(Y+3.6*H))) (4)

其中，图片的坐标系定义为：以图片左上角为原点，向右方向为水平轴正方向，向下方向为纵轴正方向X,Y分别表示匹配区域左上角的横坐标与纵坐标WW为图片最大宽度，HH为图片最大长度，max()函数为求取参数之中最大数，min()函数为求取参数中最小数，int()函数为求与参数最相近的整数。

(4)、目标区域中提取SIFT特征。

SIFT特征点往往出现在边缘变化剧烈且不受尺度变化影响的地方，所以身份证区域上的SIFT特征点一般出现在文字区域，边缘及图片区域的SIFT特征点不多。本步骤效果可参考图8中对身份证背面区域的SIFT特征点检测，图8中的虚线框标识目标区域在上述照片中的位置，其中，虚线框内的空心点为目标区域上的SIFT特征点。对身份证正面区域的SIFT特征点的检测同理，可参考图8的检测，不作赘述。

(5)、根据身份证格式和SIFT特征点在该照片中的分布特征确定SIFT有效区域。

在步骤(2)中，本方案已经确定目标区域，本申请中可将SIFT有效区域定义为：

照片某SIFT行上包含有两个以上的SIFT特征点，则该行为SIFT有效行，如果两个SIFT有效行之间的垂直距离不超过两行，则可将每两个SIFT有效行之间的区域称为SIFT有效区域；如果两个SIFT有效行之间的垂直距离超过两行，则可认为这两个SIFT有效行的特征不明显,可忽略这两个SIFT有效行。由于身份证格式固定，所以可采用身份证边缘格式、身份证中的文字排版和图形排版来作为过滤不合适的目标区域，最终将合格的目标区域所组成的区域作为身份证区域，检测出身份证区域的一种效果示意图可参考图9，图9中的每条实线代表一条SIFT有效行。身份证区域判断规则如下：

如果照片中包含的是身份证正面图片，则在距人脸匹配区域左上角下方0.7H—1.6H处会有长度为0.2—0.6H的SIFT有效区域(即对应住址区域)，在距人脸匹配区域左下角下方1.7—2.3W处会有长度为0.2—0.6H的SIFT有效区域，其中，SIFT区域是指由多个SIFT有效行及他们之间的区域所组成的区域。

如果照片中包含的是身份证反面图片，则在距国徽匹配区域的的右侧0.2—0.5W处会有0.3—0.5H SIFT有效区域(即对应中华人民共和国的文字段)和0.4--0.6H SIFT有效区域(即对应居民身份证的文字段)。在距国徽匹配区域的右下角下方1.0—1.3H处有0.1—0.2H SIFT有效区域。

(6)、根据先验知识和步骤5中的判断规则可确定出符合身份证格式的多个SIFT有效区域为身份证区域，如果有多个SIFT有效区域满足身份证格式，则选取区域最大的目标区域作为身份证区域。图10为最终确定的身份证正面区域的一种示意图，确定身份证背面区域的方式与身份证正面区域类似。

(7)、如果没有满足条件的SIFT有效区域，则返回提示照片无效的信息。

由此可见，本申请能够准确的、快速的定位出照片中的将身份证区域(包括身份证正面区域和身份证背面区域)，为下一步身份证矫正以及身份证OCR提供干净的输入，并结合用身份证边缘和文字排版等先验知识来选取SIFT有效区域，所以，采用本申请所提供的方案，能够提高身份证图片的识别速度及准确度。

需要说明的是，本申请中，可以对同时存在身份证正面和身份证背面的图片进行识别处理，也可以对仅存在身份证正面的图片进行身份证正面识别处理，以及对仅存在身份证背面的额图片进行身份证背面进行识别处理，具体待识别身份证的图片上是否同时包括身份证正面和身份证背面本申请不作限定。并且，针对仅存在身份证正面的图片进行身份证正面的识别处理的方式，与针对仅存在身份证背面的图片进行身份证背面的识别处理的方式相同或相似，只是各自使用的图像模版的类型不同。

上述图1-图11任意所述的匹配区域、图像模版、特征模版等特征均可适用于下述图12-图13，后续可参考图1-图11中的说明，不作赘述。

以上对本申请实施例中一种用于定位图像的方法进行说明，以下对执行上述定位图像的方法的装置进行描述。

一、参照图11，对本申请实施例中的用于定位图像的装置110进行说明，该装置110包括：

获取模块1101，用于获取图片。

处理模块1102，用于从所述获取模块1101获取的图片中确定与图像模版匹配的至少一个匹配区域；

根据所述至少一个匹配区域确定目标区域；

根据特征匹配算法在所述目标区域中提取第一特征信息；

相较于现有机制，本申请提供的方案中，处理模块1102根据特征模版从图片中确定与特征模版匹配的至少一个匹配区域，能够缩小识别的范围，然后根据这些匹配区域确定出目标区域，再根据特征匹配算法在目标区域中提取第一特征信息，根据预设的识别条件和第一特征信息在所述目标区域的分布特征，确定所述目标区域中的至少一个有效区域，这样就可以根据至少一个有效区域确定出特定类型的图像。由此可见，采用本方案，能够有效的提高识别特定图像的效率，也能提高识别出的特定图像的准确性。

可选的，在一些发明实施例中，所述处理模块1102在从获取的图片中确定与所述图像模版匹配的至少一个匹配区域之前，还用于：

从所述图片中提取图片的第二特征信息；

查询与所述第二特征信息匹配的所述图像模版。

可选的，在一些发明实施例中，所述处理模块1102在从所述图片中提取图片的第二特征信息之前，还用于：

对所述图片进行预处理，所述预处理的方式包括图像平滑处理、图像变换域、图像增强、图像复原中的至少一种处理方式。

可选的，在一些发明实施例中，所述第二特征信息包括图形、文字、标识、图标、点、线、像素点之间的梯度或者像素点之间的位置关系中的至少一种信息元素，所述处理模块1102在从所述图片中提取图片的第二特征信息之后，在查询与所述第二特征信息匹配的所述图像模版之前，还用于：

从所述第二特征信息中提取至少一个特征；

所述处理模块具体用于：

查询与所述至少一个特征匹配的所述图像模版。

可选的，在一些发明实施例中，所述图像模版包括至少两个特征模版，每个特征模版对应一个类型的特定特征，所述至少两个特征模版中包括至少一个类型的专用特征模版和至少一个类型的公用特征模版，所述处理模块具体用于：

从所述图片中确定与所述至少一个类型的专用特征模版匹配的匹配区域，以及从所述图片中确定与所述至少一个公用特征模版匹配的匹配区域。

可选的，在一些发明实施例中，所述至少一个匹配区域包括第一匹配区域，所述处理模块1102具体用于：

根据所述第一特征模版中的第一特征，判断所述第一匹配区域内的第一特征是否与所述第一特征模版中的第二特征对应，若是，则将所述第一匹配区域作为一个候选区域，若否，则忽略所述第一匹配区域；

将得到的至少一个候选区域作为所述目标区域；

所述第一特征在所述结果图像中的位置与所述第二特征在所述图像模版中的位置对应，所述第一候选区域在所述结果图像中的位置与所述第一特征模版在所述图像模版中的位置对应。

可选的，在一些发明实施例中，所述第一特征信息包括多个特征点，每个有效区域为两个特征行之间所包括的区域，所述两个特征行的间距小于预设阈值

上面从单元化功能实体的角度对本发明实施例中的装置进行了描述，下面从硬件处理的角度对本发明实施例中的装置进行描述。

本发明实施例还提供了一种终端设备，该终端设备具体为一种识别图像的方法中描述的终端设备，如图12所示，为了便于说明，仅示出了与本发明实施例相关的部分，具体技术细节未揭示的，请参照本发明实施例方法部分。本申请涉及的终端设备，可以是指向用户提供语音和/或数据连通性的设备，具有无线连接功能的手持式设备、或连接到无线调制解调器的其他处理设备。无线终端可以经无线接入网(英文全称：Radio Access Network，英文简称：RAN)与一个或多个核心网进行通信，无线终端可以是移动终端，如移动电话(或称为“蜂窝”电话)和具有移动终端的计算机，例如，可以是便携式、袖珍式、手持式、计算机内置的或者车载的移动装置，它们与无线接入网交换语音和/或数据。例如，个人通信业务(英文全称：Personal Communication Service，英文简称：PCS)电话、无绳电话、会话发起协议(SIP)话机、无线本地环路(Wireless Local Loop，英文简称：WLL)站、个人数字助理(英文全称：Personal Digital Assistant，英文简称：PDA)等设备。无线终端也可以称为***、订户单元(Subscriber Unit)、订户站(Subscriber Station)，移动站(MobileStation)、移动台(Mobile)、远程站(Remote Station)、接入点(Access Point)、远程终端(Remote Terminal)、接入终端(Access Terminal)、用户终端(User Terminal)、终端设备、用户代理(User Agent)、用户设备(User Device)、、用户装备(User Equipment)、手机、销售终端(英文全称：Point of Sales，英文简称：POS)、车载电脑等任意终端设备，以终端设备为手机为例：

图12示出的是与本发明实施例提供的终端相关的手机的部分结构的框图。参考图12，手机包括：射频(英文全称：Radio Frequency，英文简称：RF)电路1212、存储器1220、输入单元1230、显示单元1240、传感器1250、音频电路1260、无线保真(英文全称：wirelessfidelity，英文简称：WiFi)模块1270、处理器1280、以及电源1290等部件。本领域技术人员可以理解，图12中示出的手机结构并不构成对手机的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

下面结合图12对手机的各个构成部件进行具体的介绍：

RF电路1212可用于收发信息或通话过程中，信号的接收和发送，特别地，将基站的下行信息接收后，给处理器1280处理；另外，将设计上行的数据发送给基站。通常，RF电路1212包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(Low NoiseAmplifier，LNA)、双工器等。此外，RF电路1212还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信标准或协议，包括但不限于全球移动通讯***(英文全称：Global System of Mobile communication，英文简称：GSM)、通用分组无线服务(英文全称：General Packet Radio Service，英文简称：GPRS)、码分多址(英文全称：CodeDivision Multiple Access，英文简称：CDMA)、宽带码分多址(英文全称：Wideband CodeDivision Multiple Access,英文简称：WCDMA)、长期演进(Long Term Evolution，LTE)、电子邮件、短消息服务(英文全称：Short Messaging Service，英文简称：SMS)等。

存储器1220可用于存储软件程序以及模块，处理器1280通过运行存储在存储器1220的软件程序以及模块，从而执行手机的各种功能应用以及数据处理。存储器1220可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作***、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外，存储器1220可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

输入单元1230可用于接收输入的数字或字符信息，以及产生与手机的用户设置以及功能控制有关的键信号输入。具体地，输入单元1230可包括触控面板1231以及其他输入设备1232。触控面板1231，也称为触摸屏，可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板1231上或在触控面板1231附近的操作)，并根据预先设定的程式驱动相应的连接装置。可选的，触控面板1231可包括触摸检测装置和触摸控制器两个部分。其中，触摸检测装置检测用户的触摸方位，并检测触摸操作带来的信号，将信号传送给触摸控制器；触摸控制器从触摸检测装置上接收触摸信息，并将它转换成触点坐标，再送给处理器1280，并能接收处理器1280发来的命令并加以执行。此外，可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板1231。除了触控面板1231，输入单元1230还可以包括其他输入设备1232。具体地，其他输入设备1232可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。

显示单元1240可用于显示由用户输入的信息或提供给用户的信息以及手机的各种菜单。显示单元1240可包括显示面板1241，可选的，可以采用液晶显示器(LiquidCrystal Display，LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板1241。进一步的，触控面板1231可覆盖显示面板1241，当触控面板1231检测到在其上或附近的触摸操作后，传送给处理器1280以确定触摸事件的类型，随后处理器1280根据触摸事件的类型在显示面板1241上提供相应的视觉输出。虽然在图12中，触控面板1231与显示面板1241是作为两个独立的部件来实现手机的输入和输入功能，但是在某些实施例中，可以将触控面板1231与显示面板1241集成而实现手机的输入和输出功能。

手机还可包括至少一种传感器1250，比如光传感器、运动传感器以及其他传感器。具体地，光传感器可包括环境光传感器及接近传感器，其中，环境光传感器可根据环境光线的明暗来调节显示面板1241的亮度，接近传感器可在手机移动到耳边时，关闭显示面板1241和/或背光。作为运动传感器的一种，加速计传感器可检测各个方向上(一般为三轴)加速度的大小，静止时可检测出重力的大小及方向，可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等；至于手机还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器，在此不再赘述。

音频电路1260、扬声器1261，传声器1262可提供用户与手机之间的音频接口。音频电路1260可将接收到的音频数据转换后的电信号，传输到扬声器1261，由扬声器1261转换为声音信号输出；另一方面，传声器1262将收集的声音信号转换为电信号，由音频电路1260接收后转换为音频数据，再将音频数据输出处理器1280处理后，经RF电路1212以发送给比如另一手机，或者将音频数据输出至存储器1220以便进一步处理。

WiFi属于短距离无线传输技术，手机通过WiFi模块1270可以帮助用户收发电子邮件、浏览网页和访问流式媒体等，它为用户提供了无线的宽带互联网访问。虽然图12示出了WiFi模块1270，但是可以理解的是，其并不属于手机的必须构成，完全可以根据需要在不改变发明的本质的范围内而省略。

处理器1280是手机的控制中心，利用各种接口和线路连接整个手机的各个部分，通过运行或执行存储在存储器1220内的软件程序和/或模块，以及调用存储在存储器1220内的数据，执行手机的各种功能和处理数据，从而对手机进行整体监控。可选的，处理器1280可包括一个或多个处理单元；优选的，处理器1280可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作***、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器1280中。

手机还包括给各个部件供电的电源1290(比如电池)，优选的，电源可以通过电源管理***与处理器1280逻辑相连，从而通过电源管理***实现管理充电、放电、以及功耗管理等功能。

尽管未示出，手机还可以包括摄像头、蓝牙模块等，在此不再赘述。

在本发明实施例中，该终端设备所包括的处理器1280还具有控制执行以上由用于识别图像的装置所执行的方法流程。

本发明实施例还提供一种服务器结构示意图，如图13所示，该服务器1300可因配置或性能不同而产生比较大的差异，可以包括一个或一个以***处理器(英文全称：central processing units，英文简称：CPU)1322(例如，一个或一个以上处理器)和存储器1332，一个或一个以上存储应用程序1342或数据1344的存储介质1330(例如一个或一个以上海量存储设备)。其中，存储器1332和存储介质1330可以是短暂存储或持久存储。存储在存储介质1330的程序可以包括一个或一个以上模块(图示没标出)，每个模块可以包括对服务器中的一系列指令操作。更进一步地，中央处理器1322可以设置为与存储介质1330通信，在服务器1300上执行存储介质1330中的一系列指令操作。

服务器1300还可以包括一个或一个以上电源1326，一个或一个以上有线或无线网络接口1350，一个或一个以上输入输出接口1358，和/或，一个或一个以上操作***1341，例如Windows ServerTM，Mac OS XTM，UnixTM,LinuxTM，FreeBSDTM等等。

上述发明实施例中由用于识别图像的装置所执行的步骤可以基于该图13所示的服务器结构。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的***，装置和模块的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的***，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个模块或组件可以结合或者可以集成到另一个***，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或模块的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为模块显示的部件可以是或者也可以不是物理模块，即可以位于一个地方，或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能模块可以集成在一个处理模块中，也可以是各个模块单独物理存在，也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。

所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存储的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。

以上对本申请所提供的技术方案进行了详细介绍，本申请中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的一般技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

Claims

1.一种定位图像的方法，其特征在于，所述方法包括：

从获取的图片中确定与图像模版匹配的至少一个匹配区域；

根据所述至少一个匹配区域确定目标区域；

根据尺度不变特征转换SIFT算法在所述目标区域中提取第一特征信息；所述第一特征信息包括多个SIFT特征点；

根据预设的识别条件和所述第一特征信息在所述目标区域内的分布特征，确定所述目标区域中的至少一个SIFI有效区域；其中，每个SIFT有效区域为两个SIFT有效行之间所包括的区域，所述两个SIFT有效行的间距小于预设阈值；所述SIFT有效行为包括有两个以上的SIFT特征点；

根据所述至少一个SIFI有效区域内的特征信息的分布特征确定出结果图像。

2.根据权利要求1所述的方法，其特征在于，在所述从获取的图片中确定与所述图像模版匹配的至少一个匹配区域之前，所述方法还包括：

从所述图片中提取图片的第二特征信息；

查询与所述第二特征信息匹配的所述图像模版。

3.根据权利要求2所述的方法，其特征在于，在所述从所述图片中提取图片的第二特征信息之前，所述方法还包括：

4.根据权利要求2所述的方法，其特征在于，所述第二特征信息包括图形、文字、标识、图标、点、线、像素点之间的梯度或者像素点之间的位置关系中的至少一种信息元素，在所述从所述图片中提取图片的第二特征信息之后，在所述查询与所述第二特征信息匹配的所述图像模版之前，所述方法还包括：

从所述第二特征信息中提取至少一个特征；

所述查询与所述第二特征信息匹配的所述图像模版，包括：

查询与所述至少一个特征匹配的所述图像模版。

5.根据权利要求1-4任一所述的方法，其特征在于，所述图像模版包括至少两个特征模版，每个特征模版对应一个类型的特定特征，所述至少两个特征模版中包括至少一个类型的专用特征模版和至少一个类型的公用特征模版，所述从获取的图片中确定与所述图像模版匹配的至少一个匹配区域，包括：

6.根据权利要求5所述的方法，其特征在于，所述至少一个匹配区域包括第一匹配区域，所述第一匹配区域与第一特征模版匹配，所述根据所述至少一个匹配区域确定目标区域，包括：

将得到的至少一个候选区域作为所述目标区域；

7.一种用于定位图像的装置，其特征在于，所述装置包括：

获取模块，用于获取图片；

8.根据权利要求7所述的装置，其特征在于，所述处理模块在从获取的图片中确定与所述图像模版匹配的至少一个匹配区域之前，还用于：

从所述图片中提取图片的第二特征信息；

查询与所述第二特征信息匹配的所述图像模版。

9.根据权利要求8所述的装置，其特征在于，所述处理模块在从所述图片中提取图片的第二特征信息之前，还用于：

10.根据权利要求8所述的装置，其特征在于，所述第二特征信息包括图形、文字、标识、图标、点、线、像素点之间的梯度或者像素点之间的位置关系中的至少一种信息元素，所述处理模块在从所述图片中提取图片的第二特征信息之后，在查询与所述第二特征信息匹配的所述图像模版之前，还用于：

从所述第二特征信息中提取至少一个特征；

所述处理模块具体用于：

查询与所述至少一个特征匹配的所述图像模版。

11.根据权利要求7-10任一所述的装置，其特征在于，所述图像模版包括至少两个特征模版，每个特征模版对应一个类型的特定特征，所述至少两个特征模版中包括至少一个类型的专用特征模版和至少一个类型的公用特征模版，所述处理模块具体用于：

12.根据权利要求11所述的装置，其特征在于，所述至少一个匹配区域包括第一匹配区域，所述处理模块具体用于：

将得到的至少一个候选区域作为所述目标区域；

13.一种计算机存储介质，其特征在于，其包括指令，当其在计算机上运行时，使得计算机执行如权利要求1-6任一所述的方法。

14.一种终端设备，其特征在于，包括存储器、处理器；

其中，所述存储器用于存储程序；

所述处理器用于执行所述存储器中的程序时实现如权利要求1-6任一所述的方法。