CN104834941A

CN104834941A - 基于计算机输入下的稀疏自编码的脱机手写体识别方法

Info

Publication number: CN104834941A
Application number: CN201510255508.0A
Authority: CN
Inventors: 张可; 柴毅; 袁媛; 邱焕敏; 王一鸣
Original assignee: Chongqing University
Current assignee: Chongqing University
Priority date: 2015-05-19
Filing date: 2015-05-19
Publication date: 2015-08-12

Abstract

本发明属于模式识别领域，公开了一种基于计算机输入下的稀疏自编码的手写体识别方法，该方法包括：选取手写体图像库，并分为训练集和测试集两个子数据集；采用稀疏自编码来构建深度神经网络，并获得特征；使用ZCA白化数据进行预处理和可视化得到更好的特征，到此训练好稀疏自编码深度神经网络；将每张图像分成小块，取其中一个小块学习到特征，依次与剩下的小块进行卷积运算并提取训练集图像的各个特征；采用PSO算法快速得到多分类支持向量机参数；将测试集数据输入到多分类支持向量机中，得到分类结果，并得到该测试集识别的正确率。本发明的手写体识别方法，对数据的泛化能力比较好，并且手写体识别率较高。

Description

基于计算机输入下的稀疏自编码的脱机手写体识别方法

本发明涉及模式识别、光学字符识别技术、深度学习领域，特别是涉及一种计算机输入下的稀疏自编码的脱机手写体识别方法。

背景技术

手写体字符识别是光学字符识别技术(OpticalCharacterRecognition，简称OCR)的一个分支，它研究的对象是：如何使计算机自动辨认人手写在纸张上的字符。在整个OCR领域中，最为困难的就是脱机手写字符的识别。

数字识别就是通过计算机用数学技术方法来研究模式的自动处理和识别。随着计算机技术的发展，人类对模式识别技术提出了更高的要求。特别是对于大量己有的印刷资料和手稿，计算机自动识别输入己成为必须研究的课题，字符识别是智能计算机接口的一个重要组成部分，所以在文献检索、办公自动化、邮政***、银行票据处理等方面有着广阔的应用前景。

本申请提出一种基于计算机输入下的稀疏自编码的脱机手写体识别方法，能够提高数据集的泛化能力以及手写体识别率。

发明内容

有鉴于此，本申请提供一种基于计算机输入下的稀疏自编码的脱机手写体识别方法，识别算法一方面训练过程均是采用无监督的特征学习，对数据集的泛化能力较好；另一方面，没采用传统视觉特征，对图像识别的干扰小，识别率较高。

为达到上述目的，本发明提供如下技术方案：

一种基于计算机输入下的稀疏自编码的脱机手写体识别方法，其特征在于包括以下步骤：步骤一：选取手写体库，并将图像训练集和测试集两个子数据集；步骤二：采用稀疏自编码来构建深度神经网络，并获得学习到的特征；步骤三：使用ZCA白化对训练集样本数据进行预处理和可视化，得到含有丰富边缘的特征，到此得到训练好的深度神经网络；步骤四，将每张图像分成小块，取其中一个小块学习到特征，依次与剩下的小块进行卷积运算并提取训练集图像的各个特征；步骤五，采用PSO算法快速得到多分类支持向量机参数；步骤六，将测试集数据输入到多分类支持向量机中，得到分类结果，即得到该测试集手写体的识别率。

进一步，在步骤二中具体包括以下步骤：21：假设神经元激活函数为f(z)，用表示神经网络中第l层中第i个神经元的输出值激活函数一般采用sigmoid函数；22：在自编码神经网络中，仍然采用BP算法并让训练集输入样本与输出结果目标相等，即yⁱ＝xi^，则训练集样本集表示为{x¹，x²，...，xⁱ，...，x^m}，1≤i≤m(m为训练集样本数量)；23：用表示第i组样本输入xⁱ情况下隐藏层第j个神经元的输出值，则隐藏层(l＝2)中第j个神经元的平均激活值为：然后为该神经网络加入上述的稀疏性限制，也即让p′_j＝p，p为稀疏性参数，通常是一个很小的真分数，也就是说要使第j个隐藏神经元的平均激活值接近于p；24：为了实现稀疏性限制，特定义代价目标函数为：最后一部分是惩罚项，该项是惩罚那些p′_j和p显著不同的情况以实现对该神经网络的稀疏性限制，KL(p′_j||p)是p′_j与p间的相对熵，相对熵是一种常用的测量两个分布间差异的方法；25：确定w和b的迭代规则，待迭代算法收敛或达到最大迭代次数，隐藏单元就获得学习好的特征，即训练好了稀疏自编码深度神经网络的权值向量w和偏置向量b。

进一步，在步骤三中具体包括以下步骤：31：ZCA白化在本文中主要是两个应用：对训练集样本数据进行预处理和可视化学习到的特征。通过调节ZCA白化数学公式中白化参数ζ，从而改变数据的预处理，直到得到较好的特征为止，较好的特征图像中含有丰富的边缘信息等。

进一步，在步骤四中具体包括以下步骤：41：先从大图像(D_image*D_image)中用一个大小为D_patch*D_patch的小块学习特征，这可以用稀疏自编码神经网络训练完成；42：然后对训练图像用前面学习到的特征参数依次进行卷积运算提取训练图像的各个特征，卷积运算步长为1。

进一步，在步骤五中具体包括以下步骤：51：采用PSO算法可以精确并快速的得出多分类SVM参数c和γ的最优解。

进一步，在步骤六中具体包括以下步骤：61：将步骤S1中的测试集，输入训练好的多分类SVM中得到分类标签；62：若多分类SVM输出标签与测试样本一致，表明识别结果正确，反之，则识别结果错误；63：统计整个测试集中识别正确样本数量除以样本总数，得到针对该测试集手写体识别的正确率。

附图说明

图1是本发明一种基于计算机输入下的稀疏自编码的脱机手写体识别方法在银行票据签名识别中应用的流程图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白，以下结合具体实施例，并参照附图，对本发明进一步详细说明。

S1：选取银行票据的手写签名图像库，并将图像库分为训练集和测试集两个子数据集；

S2：采用稀疏自编码构建深度神经网络，训练网络的权值向量和偏置向量，即获得隐藏单元的学习特征；

S21：在本发明一实施例中，稀疏自编码深度神经网络输入层和输出层神经元数量为InputSize192，隐藏层神经元数量为HiddenSize400；

S3：使用ZCA白化对无标记样本数据进行预处理和可视化学习较好的特征；

S31:在本发明一实施例中，对数据的预处理中，首先，对样本数据的特征维(实施例中指输入层神经元个数)进行零均值化，用样本数据每一维减去该维平均值得到x^j，并归一化样本数据到[0,1]范围内，得到ZCA白化数学公式。最后可视化学习到的特征，看是否学习到好的特征，若不是则需调节ζ，从而改变数据的预处理，直到得到含有丰富的边缘信息的较好特征

S4:用稀疏自编码神经网络训练从大图像(D_image*D_image)中取一个大小为D_patch*D_patch的小块学习特征，然后对训练图像用前面学习到的特征参数依次对剩下的小块进行卷积运算提取训练图像的各个特征，卷积运算步长为1；

S41:本发明一实施例中，用于提取特征的图像小块的大小D_patch＝8，从训练集样本每张图片中随机提取1000个小块，100张图片共提取10万个小块；

S42:测试集图片均统一图片大小到D_image＝64；

S5:采用PSO算法精确并快速的得出多分类SVM参数c和γ的最优解，完成多分类SVM的训练；

S6:将步骤S1中的测试集，输入训练好的多分类SVM中得到分类标签，若多分类SVM输出标签与测试样本一致，表明识别结果正确，统计整个测试集中识别正确样本数量除以样本总数，得到针对该测试集手写体识别的正确率。

上述详细地描述了本发明提供的基于计算机输入下的稀疏自编码的脱机手写识别体的应用，本发明采用无监督学习方法，对数据泛化能力较好，同时也证明了该方法准确率高的优越性。

以上实施例仅用以说明本发明,而并非限制本发明所描述的技术方案。因此,一切不脱离本发明的精神和范围的技术方案及其改进,均应涵盖在本发明的权利要求范围内。

Claims

1.基于计算机输入下的稀疏自编码的脱机手写体识别方法，其特征在于，该方法包括以下步骤：

步骤一：选取手写体图像库，并将图像训练集和测试集两个子数据集；

步骤二：采用稀疏自编码来构建深度神经网络，并获得学习到的特征；

步骤三：使用ZCA白化对训练集样本数据进行预处理和可视化，得到含有丰富边缘的特征，得到训练好的深度神经网络；

步骤四，将每张大图像分割成小块学习特征，并用前面学习到的特征参数对剩下的小块依次进行卷积运算并提取训练集图像的各个特征；

步骤五，采用PSO算法快速得到多分类支持向量机参数；

步骤六，将测试集数据输入到多分类支持向量机中，得到识别结果，并得到该测试集手写体识别的正确率。

2.如权利要求书1所述的手写体识别方法，其特征在于：在步骤二中具体包括：21：假设神经元激活函数为f(z)，用表示神经网络中第l层中第i个神经元的输出值激活函数一般采用sigmoid函数；22：在自编码神经网络中，仍然采用BP算法并让训练集输入样本与输出结果目标相等，即yⁱ＝xⁱ，则训练集样本集表示为{x¹，x²，...，xⁱ，...，x^m}，1≤i≤m(m为训练集样本数量)；23：用表示第i组样本输入xⁱ情况下隐藏层第j个神经元的输出值，则隐藏层(l＝2)中第j个神经元的平均激活值为：然后为该神经网络加入上述的稀疏性限制，也即让p′_j＝p，p为稀疏性参数，通常是一个很小的真分数，也就是说要使第j个隐藏神经元的平均激活值接近于p；24：为了实现稀疏性限制，特定义代价目标函数为：最后一部分是惩罚项，该项是惩罚那些p′_j和p显著不同的情况以实现对该神经网络的稀疏性限制，KL(p′_j||p)是p′_j与p间的相对熵，相对熵是一种常用的测量两个分布间差异的方法；25：确定w和b的迭代规则，待迭代算法收敛或达到最大迭代次数，隐藏单元就获得学习好的特征，即训练好了稀疏自编码深度神经网络的权值向量w和偏置向量b。

3.如权利要求书1所述的手写体识别方法，其特征在于，在步骤三中具体包括：31：ZCA白化在本文中主要是两个应用：对训练集样本数据进行预处理和可视化学习到的特征。通过调节ZCA白化数学公式中白化参数ζ，从而改变数据的预处理，直到得到较好的特征为止，较好的特征图像中含有丰富的边缘信息等。

4.如权利要求书1所述的手写体识别方法，其特征在于，在步骤四中具体包括：41：先从大图像(D_image*D_image)中取一个大小为D_patch*D_patch的小块学习特征，这可以用稀疏自编码神经网络训练完成；42：然后用前面学习到的特征参数依次对剩下的小块训练图像进行卷积运算提取训练图像的各个特征，卷积运算步长为1。

5.如权利要求书1所述的手写体识别方法，其特征在于，在述步骤五中包括：51：采用PSO算法可以精确并快速的得出多分类SVM参数c和γ的最优解。

6.如权利要求书1所述的手写体识别方法，其特征在于，在步骤六中包括：61：将步骤S1中的测试集，输入训练好的多分类SVM中得到分类标签；62：若多分类SVM输出标签与测试样本一致，表明识别结果正确，反之，则识别结果错误；63：统计整个测试集中识别正确样本数量除以样本总数，得到针对该测试集手写体识别的正确率。