WO2017128977A1

WO2017128977A1 - 图片处理方法和装置

Info

Publication number: WO2017128977A1
Application number: PCT/CN2017/071256
Authority: WO
Inventors: 林桐
Original assignee: 阿里巴巴集团控股有限公司; 林桐
Priority date: 2016-01-25
Filing date: 2017-01-16
Publication date: 2017-08-03
Also published as: US10706555B2; KR20180105210A; CN106997580A; TWI711004B; JP2019504430A; US20200126238A1; PH12018501579A1; TW201732733A; US10769795B2; CN106997580B; EP3410389A4; EP3410389A1; US20190005651A1; JP6937782B2; MY192394A; SG11201806345QA; KR102239588B1

Abstract

本申请提供一种图片处理方法和装置。所述方法包括：采用多种不同的方式去除原始图片中的干扰因子，得到多张样本图片；根据预设的分割规则，分别将每张样本图片分割为多张样本子图片；在相同属性的样本子图片中确定目标子图片；将不同属性的多张目标子图片合并为目标图片。本申请能够在相同属性的多张样本子图片中确定最接近真实图像的目标子图片，并将不同属性的多张目标子图片合并为目标图片，得到的目标图片能够高度还原真实图像，从而可以提高后续图像识别的准确度。

Description

图片处理方法和装置

技术领域

本申请涉及图片处理技术领域，尤其涉及一种图片处理方法和装置。

背景技术

随着互联网技术的快速发展，越来越多的网络业务涉及到图片的识别，比如：对人脸图片的识别、对证件图片的识别等。然而，目前很多图片会被添加网纹、水印等干扰因子，导致图片识别的效率下降，并增加了图片识别的难度。

发明内容

有鉴于此，本申请提供一种图片处理方法和装置。

具体地，本申请是通过如下技术方案实现的：

一种图片处理方法，所述方法包括：

采用多种不同的方式去除原始图片中的干扰因子，得到多张样本图片；

根据预设的分割规则，分别将每张样本图片分割为多张样本子图片；

在相同属性的样本子图片中确定目标子图片；

将不同属性的多张目标子图片合并为目标图片。

可选的，所述在相同属性的样本子图片中确定目标子图片，包括：

确定每个样本子图片的数学参数；

根据所述数学参数，采用聚类算法将所述相同属性的样本子图片划分为多个图片集合，其中，每个图片集合中包括有一张或者多张样本子图片；

在包括样本子图片最多的图片集合中，确定目标子图片。

可选的，所述确定每个样本子图片的数学参数，包括：

根据所述样本子图片中各像素点的RGB信息，为所述样本子图片生成RGB向量，作为所述样本子图片的数学参数。

可选的，所述在包括样本子图片最多的图片集合中，确定目标子图片，包括：

在包括样本子图片最多的图片集合中，将聚类后所述图片集合中的中心点对应的样本子图片确定为所述目标子图片。

可选的，所述将不同属性的多张目标子图片合并为目标图片，包括：

根据所述目标子图片中各像素点的位置坐标，将不同属性的多张目标子图片合并为目标图片。

一种图片处理装置，所述装置包括：

干扰去除单元，采用多种不同的方式去除原始图片中的干扰因子，得到多张样本图片；

图片分割单元，根据预设的分割规则，分别将每张样本图片分割为多张样本子图片；

目标确定单元，在相同属性的样本子图片中确定目标子图片；

目标合成单元，将不同属性的多张目标子图片合并为目标图片。

可选的，所述目标确定单元，包括：

参数确定子单元，确定每个样本子图片的数学参数；

集合划分子单元，根据所述数学参数，采用聚类算法将所述相同属性的样本子图片划分为多个图片集合，其中，每个图片集合中包括有一张或者多张样本子图片；

目标确定子单元，在包括样本子图片最多的图片集合中，确定目标子图片。

可选的，所述参数确定子单元，根据所述样本子图片中各像素点的RGB信息，为所述样本子图片生成RGB向量，作为所述样本子图片的数学参数。

可选的，所述目标确定子单元，在包括样本子图片最多的图片集合中，将聚类后所述图片集合中的中心点对应的样本子图片确定为所述目标子图片。

可选的，所述目标合成单元，根据所述目标子图片中各像素点的位置坐标，将不同属性的多张目标子图片合并为目标图片。

由此可以看出，本申请可以先采用多种不同的方式去除原始图片中的干扰因子，以得到多张样本图片，然后根据预设的分割规则，将多张样本图片分别分割为多张样本子图片，并在相同属性的样本子图片中确定目标子图片，从而能够在相同属性的多张样本子图片中确定最接近真实图像的目标子图片，并将不同属性的多张目标子图片合并为目标图片，得到的目标图片能够高度还原真实图像，从而可以提高后续图像识别的准确度。

附图说明

图1是本申请一示例性实施例示出的一种图片处理方法的流程示意图。

图2是本申请一示例性实施例示出的一种样本图片的分割示意图。

图3是本申请一示例性实施例示出的一种在相同属性的样本子图片中确定目标子图片的流程示意图。

图4是本申请一示例性实施例示出的一种用于图片处理装置的一结构示意图。

图5是本申请一示例性实施例示出的一种图片处理装置的结构示意图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。

在本申请使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。还应当理解，本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

应当理解，尽管在本申请可能采用术语第一、第二、第三等来描述各种信息，但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如，在不脱离本申请范围的情况下，第一信息也可以被称为第二信息，类似地，第二信息也可以被称为第一信息。取决于语境，如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。

相关技术中，可以采用一些图片处理算法或者图片处理工具，比如：Photoshop等，去除原始图片中的网纹或水印。然而，在这样的实现方式中，去网纹或水印后得到的图片往往无法真实还原原始图片中的图像，进而影响后续图片识别的准确度。

请参考图1，所述图片处理方法可以应用在终端中，所述终端可以包括智能手机、平板电脑、PDA(Personal Digital Assistant，掌上电脑)PC机等智能设备。所述图片处理方法也可以应用在服务端中，本申请对此不作特殊限制。所述图片处理方法可以包括以下步骤：

步骤101，采用多种不同的方式去除原始图片中的干扰因子，得到多张样本图片。

在本实施例中，所述原始图片通常为待识别的图片，所述原始图片中包括有干扰因子，所述干扰因子通常为在真实图像的基础上后续添加的网纹、水印等干扰图案。

在本实施例中，可以采用相关技术中提供的多种不同的去干扰因子的方法去除所述原始图片中的干扰因子，以得到去干扰因子后的多张样本图片，比如：可以通过photoshop等图像处理软件去除所述原始图片中的干扰因子等。

步骤102，根据预设的分割规则，分别将每张样本图片分割为多张样本子图片。

基于前述步骤101，在得到多张去干扰的样本图片后，可以根据预设的分割规则，分别将每张样本图片分割为多张子图片，为便于描述，在本申请中，可以将分割后得到的所述子图片称为样本子图片。

在本实施例中，所述预设的分割规则可以由开发人员进行设置，所述预设的分割规则可以以样本子图片的尺寸为单位，也可以以样本子图片的数量为单位，本申请对此不作特殊限制。举例来说，所述预设的分割规则可以为将样本图片分割为25张样本子图片，比如：按照5乘5的规则，将所述样本图片分割为25张样本子图片。

在本实施例中，假设在前述步骤101中，采用N种不同的方式去除原始图片中的干扰因子，可以得到N张样本图片。又假设，在本步骤中，将每张样本图片分割为M张样本子图片，则一共可以得到N×M张样本子图片。其中，M和N均为大于1的自然数。

步骤103，在相同属性的样本子图片中确定目标子图片。

在本实施例中，每张样本子图片均包括有对应的属性，所述属性用来表示所述样本子图片在所属样本图片中的位置信息。请参考图2，假设图片A为原始图片去干扰后得到的一张样本图片，根据预设的分割规则，可以将所述样本图片分割为3乘3的9张样本子图片，这9张样本子图片的属性分别为：A11、A12、A13、A21、…、A33。

在本实施例中，仍然以图2所示的分割规则为例，假设采用N种不同的方式去除原始图片中的干扰因子，得到N张样本图片，则一共可以得到N×9张样本子图片，其中，属性为A11至A33的样本子图片各有N张。在本步骤中，可以在N张属性为A11的样本子图片中确定属性为A11的目标子图片，在N张属性为A12的样本子图片中确定属性为A12的目标子图片，以此类推，可以确定属性为A11至A33的9张目标子图片。

步骤104，将不同属性的多张目标子图片合并为目标图片。

基于前述步骤103，在相同属性的样本子图片中确定目标子图片后，可以将不同属性的多张目标子图片合并为目标图片，比如：可以根据每张目标子图片的属性将所述多张目标子图片合并为目标图片，也可以根据每张目标子图片中各像素点的位置坐标将所述多张目标子图片合并为目标图片，本申请对此不作特殊限制。

举例来说，仍以图2所示的分割规则为例，在本步骤中，可以将属性为A11至A33的9张目标子图片合并为一张目标图片。

由以上描述可以看出，本申请可以先采用多种不同的方式去除原始图片中的干扰因子，以得到多张样本图片，然后根据预设的分割规则，将多张样本图片分别分割为多张样本子图片，并在相同属性的样本子图片中确定目标子图片，从而能够在相同属性的多张样本子图片中确定最接近真实图像的目标子图片，并将不同属性的多张目标子图片合并为目标图片，得到的目标图片能够高度还原真实图像，从而可以提高后续图像识别的准确度。

可选的，在本申请一个例子中，请参考图3，在相同属性的样本子图片中确定目标子图片的过程可以包括以下步骤：

步骤301，确定每个样本子图片的数学参数。

在本实施例中，在将样本图片分割为多张样本子图片后，可以确定每张样本子图片的数学参数，以便后续计算。

可选的，在本申请一个例子中，可以根据所述样本子图片中各像素点的RGB信息，为所述样本子图片生成RGB向量，作为所述样本子图片的数学参数。比如：可以先获取所述样本子图片中各像素点的RGB信息，诸如：RGB值，然后根据各像素点RGB信息生成RGB向量。假设，所述样本子图片中包括有K个像素点，其中，第i个像素点的RGB值为R_i，i的取值为1至K，则所述样本子图片的RGB向量为 {R₁，R₂，…,R_K}。

步骤302，根据所述数学参数，采用聚类算法将所述相同属性的样本子图片划分为多个图片集合，其中，每个图片集合中包括有一张或者多张样本子图片。

在本实施例中，针对相同属性的多个样本子图片，基于所述样本子图片的数学参数，可以采用聚类算法将所述多个样本子图片划分到多个图片集合中。所述聚类算法可以包括：DBSCAN聚类算法(Density-Based Spatial Clustering of Applications with Noise)、K-means聚类算法等，本申请对此不作特殊限制。

举例来说，当采用DBSCAN聚类算法时，可以预先设置扫描半径(eps)和最小包含点数(minPts)，每个样本子图片都对应聚类过程中的一个点，所述最小包含点数为划分后的图片集合中所能包含的最少样本子图片数量。在聚类的过程中，可以基于所述样本子图片的数学参数进行相关的计算，比如：可以将两个样本子图片的RGB向量之间的距离作为两个样本子图片之间的距离等。

步骤303，在包括样本子图片最多的图片集合中，确定目标子图片。

基于前述步骤302，在将相同属性的样本子图片划分为多个图片集合之后，确定每个图片集合包括的样本子图片的数量，然后可以在包括样本子图片最多的图片集合中，确定目标子图片。

可选的，在本申请一个例子中，在包括样本子图片最多的图片集合中，可以将聚类后所述图片集合中的中心点对应的样本子图片确定为所述目标子图片。

在本实施例中，可以采用聚类算法在相同属性的样本子图片中确定目标子图片，从而确保确定的目标子图片更加接近真实图像。

与前述图片处理方法的实施例相对应，本申请还提供了图片处理装置的实施例。

本申请图片处理装置的实施例可以应用在终端或者服务端上。装置实施例可以通过软件实现，也可以通过硬件或者软硬件结合的方式实现。以软件实现为例，作为一个逻辑意义上的装置，是通过其所在终端或服务端的处理器将非易失性存储器中对应的计算机程序指令读取到内存中运行形成的。从硬件层面而言，如图4所示，为本申请图片处理装置所在终端或服务端的一种硬件结构图，除了图4所示的处理器、内存、网络接口、以及非易失性存储器之外，实施例中装置所在的终端或服务端通常根据该终端或服务端的实际功能，还可以包括其他硬件，对此不再赘述。

请参考图5，所述图片处理装置400可以应用在图4所示的终端或服务端中，包括有：干扰去除单元401、图片分割单元402、目标确定单元403以及目标合并单元404。其中，所述目标确定单元403还可以包括：参数确定子单元4031、集合划分子单元4032以及目标确定子单元4033。

其中，所述干扰去除单元401，采用多种不同的方式去除原始图片中的干扰因子，得到多张样本图片。

所述图片分割单元402，根据预设的分割规则，分别将每张样本图片分割为多张样本子图片。

所述目标确定单元403，在相同属性的样本子图片中确定目标子图片。

所述目标合成单元404，将不同属性的多张目标子图片合并为目标图片。

所述参数确定子单元4031，确定每个样本子图片的数学参数。

所述集合划分子单元4032，根据所述数学参数，采用聚类算法将所述相同属性的样本子图片划分为多个图片集合，其中，每个图片集合中包括有一张或者多张样本子图片。

所述目标确定子单元4033，在包括样本子图片最多的图片集合中，确定目标子图片。

可选的，所述参数确定子单元4031，根据所述样本子图片中各像素点的RGB信息，为所述样本子图片生成RGB向量，作为所述样本子图片的数学参数。

可选的，所述目标确定子单元4033，在包括样本子图片最多的图片集合中，将聚类后所述图片集合中的中心点对应的样本子图片确定为所述目标子图片。

可选的，所述目标合成单元404，根据所述目标子图片中各像素点的位置坐标，将不同属性的多张目标子图片合并为目标图片。

上述装置中各个单元的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程，在此不再赘述。

对于装置实施例而言，由于其基本对应于方法实施例，所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本申请方案的目的。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

以上所述仅为本申请的较佳实施例而已，并不用以限制本申请，凡在本申请的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本申请保护的范围之内。

Claims

一种图片处理方法，其特征在于，所述方法包括：

采用多种不同的方式去除原始图片中的干扰因子，得到多张样本图片；

根据预设的分割规则，分别将每张样本图片分割为多张样本子图片；

在相同属性的样本子图片中确定目标子图片；

将不同属性的多张目标子图片合并为目标图片。
根据权利要求1所述的方法，其特征在于，所述在相同属性的样本子图片中确定目标子图片，包括：

确定每个样本子图片的数学参数；

根据所述数学参数，采用聚类算法将所述相同属性的样本子图片划分为多个图片集合，其中，每个图片集合中包括有一张或者多张样本子图片；

在包括样本子图片最多的图片集合中，确定目标子图片。
根据权利要求2所述的方法，其特征在于，所述确定每个样本子图片的数学参数，包括：

根据所述样本子图片中各像素点的RGB信息，为所述样本子图片生成RGB向量，作为所述样本子图片的数学参数。
根据权利要求2所述的方法，其特征在于，所述在包括样本子图片最多的图片集合中，确定目标子图片，包括：

在包括样本子图片最多的图片集合中，将聚类后所述图片集合中的中心点对应的样本子图片确定为所述目标子图片。
根据权利要求1所述的方法，其特征在于，所述将不同属性的多张目标子图片合并为目标图片，包括：

根据所述目标子图片中各像素点的位置坐标，将不同属性的多张目标子图片合并为目标图片。
一种图片处理装置，其特征在于，所述装置包括：

干扰去除单元，采用多种不同的方式去除原始图片中的干扰因子，得到多张样本图片；

图片分割单元，根据预设的分割规则，分别将每张样本图片分割为多张样本子图片；

目标确定单元，在相同属性的样本子图片中确定目标子图片；

目标合成单元，将不同属性的多张目标子图片合并为目标图片。
根据权利要求1所述的装置，其特征在于，所述目标确定单元，包括：

参数确定子单元，确定每个样本子图片的数学参数；

集合划分子单元，根据所述数学参数，采用聚类算法将所述相同属性的样本子图片划分为多个图片集合，其中，每个图片集合中包括有一张或者多张样本子图片；

目标确定子单元，在包括样本子图片最多的图片集合中，确定目标子图片。
根据权利要求7所述的装置，其特征在于，

所述参数确定子单元，根据所述样本子图片中各像素点的RGB信息，为所述样本子图片生成RGB向量，作为所述样本子图片的数学参数。
根据权利要求7所述的装置，其特征在于，

所述目标确定子单元，在包括样本子图片最多的图片集合中，将聚类后所述图片集合中的中心点对应的样本子图片确定为所述目标子图片。
根据权利要求6所述的装置，其特征在于，

所述目标合成单元，根据所述目标子图片中各像素点的位置坐标，将不同属性的多张目标子图片合并为目标图片。