CN110135512A - 图片的识别方法、设备、存储介质及装置 - Google Patents
图片的识别方法、设备、存储介质及装置 Download PDFInfo
- Publication number
- CN110135512A CN110135512A CN201910428452.2A CN201910428452A CN110135512A CN 110135512 A CN110135512 A CN 110135512A CN 201910428452 A CN201910428452 A CN 201910428452A CN 110135512 A CN110135512 A CN 110135512A
- Authority
- CN
- China
- Prior art keywords
- picture
- dimensional matrix
- identified
- samples pictures
- pixel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/211—Selection of the most significant subset of features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
- Character Discrimination (AREA)
Abstract
本发明公开了一种图片的识别方法、设备、存储介质及装置,所述方法包括:对待识别图片进行特征提取,获得所述待识别图片中各像素点的特征值,通过第一二维矩阵对所述待识别图片中各像素点的特征值进行表征,所述第一二维矩阵是基于笛卡尔坐标建立的,通过所述待识别图片中各像素点的笛卡尔坐标确定相应的极坐标,基于所述待识别图片中各像素点的极坐标建立第二二维矩阵,通过预设图卷积神经网络模型对所述第二二维矩阵进行分析,以实现对所述待识别图片的识别。在本发明中,利用极坐标的特性,将图片的旋转的变化转变为平移的变化,以此来提高图卷积神经网络提取图片旋转不变的特征的能力。
Description
技术领域
本发明涉及图片识别分类技术领域,尤其涉及一种图片的识别方法、设备、存储介质及装置。
背景技术
卷积网络(CNN)是一类尤其适合计算机视觉应用的神经网络,因为它们能使用局部操作对表征进行分层抽象。有两大关键的设计思想推动了卷积架构在计算机视觉领域的成功。第一,CNN利用了图像的2D结构,并且相邻区域内的像素通常是高度相关的。因此,CNN就无需使用所有像素单元之间的一对一连接(大多数神经网络都会这么做),而可以使用分组的局部连接。第二,CNN架构依赖于特征共享,因此,每个通道(即输出特征图)是在所有位置使用同一个过滤器进行卷积而生成的。
传统的CNN具有一定平移不变性,这是卷积和最大池化共同导致的。卷积操作可以理解为:在神经网络中,卷积被定义为不同位置的特征检测器,也就意味着,无论目标出现在图像中的哪个位置,它都会检测到同样的这些特征,输出同样的响应。最大池化可以理解为:最大池化返回的是感受野中的最大值,如果最大值被移动了,但是仍然在这个感受野中,那么池化层也仍然会输出相同的最大值。所以这两种操作共同提供了一些平移不变性,即使图像被平移,卷积保证仍然能检测到它的特征,池化则尽可能地保持一致的表达。
而传统的卷积神经网络(CNN)本身的设计对旋转不变性没有进行专门的考虑,只不过还是最大池化可以稍微补偿一下这个功能,只是角度变化太大,可能会作用不大,但因为最大池化并不是为此而设计的,所以总体上说CNN提取旋转不变的特征能力是比较弱的。
发明内容
本发明的主要目的在于提供一种图片的识别方法、设备、存储介质及装置,旨在解决现有技术中图卷积神经网络提取旋转不变的特征能力弱的技术问题。
为实现上述目的,本发明提供一种图片的识别方法,所述方法包括以下步骤:
对待识别图片进行特征提取,获得所述待识别图片中各像素点的特征值;
通过第一二维矩阵对所述待识别图片中各像素点的特征值进行表征,所述第一二维矩阵是基于笛卡尔坐标建立的;
通过所述待识别图片中各像素点在所述第一二维矩阵中的笛卡尔坐标,确定所述待识别图片中各像素点的极坐标;
基于所述待识别图片中各像素点的极坐标建立第二二维矩阵,并将所述第一二维矩阵中各像素点的特征值赋予到所述第二二维矩阵中相应的点上;
通过预设图卷积神经网络模型对所述第二二维矩阵进行分析,以实现对所述待识别图片的识别。
优选地,所述通过预设图卷积神经网络模型对所述第二二维矩阵进行分析,以实现对所述待识别图片的识别之前,所述方法还包括:
获得若干样本图片,对各样本图片进行处理,获得各样本图片的极坐标二维矩阵特征图;
获得各样本图片的识别结果,基于所述样本图片的极坐标二维矩阵特征图和所述识别结果建立所述预设图卷积神经网络模型。
优选地,所述获得各样本图片的识别结果,基于所述样本图片的极坐标二维矩阵特征图和所述识别结果建立所述预设图卷积神经网络模型,具体包括:
获得各样本图片的识别结果,并获得初始图卷积神经网络模型;
通过所述样本图片的极坐标二维矩阵特征图和所述识别结果对所述初始图卷积神经网络模型进行训练;
将训练后的初始图卷积神经网络模型作为所述预设图卷积神经网络模型。
优选地,所述通过所述样本图片的极坐标二维矩阵特征图和所述识别结果对所述初始图卷积神经网络模型进行训练,具体包括:
对所述初始图卷积神经网络模型进行改进,以确定所述样本图片的极坐标二维矩阵特征图的第一区域,并将所述第一区域平移至预设位置,获得所述样本图片的当前极坐标二维矩阵特征图;
通过所述样本图片的当前极坐标二维矩阵特征图和所述识别结果对所述改进后的初始图卷积神经网络模型进行训练。
优选地,所述对所述初始图卷积神经网络模型进行改进,以确定所述样本图片的极坐标二维矩阵特征图的第一区域,并将所述第一区域平移至预设位置,获得所述样本图片的当前极坐标二维矩阵特征图,具体包括:
对所述初始图卷积神经网络模型进行改进,以确定所述样本图片的极坐标二维矩阵特征图的第一区域和第二区域,并将所述第一区域和第二区域平移至预设位置,获得所述样本图片的当前极坐标二维矩阵特征图;
通过所述样本图片的当前极坐标二维矩阵特征图和所述识别结果对所述改进后的初始图卷积神经网络模型进行训练。
优选地,所述对所述初始图卷积神经网络模型进行改进,以确定所述样本图片的极坐标二维矩阵特征图的第一区域和第二区域,并将所述第一区域和第二区域平移至预设位置,获得所述样本图片的当前极坐标二维矩阵,具体包括:
对所述初始图卷积神经网络模型进行改进,基于所述初始图卷积神经网络模型的卷积核确定所述样本图片的极坐标二维矩阵特征图的第一区域和第二区域,并将所述第一区域和第二区域平移至预设位置,获得所述样本图片的当前极坐标二维矩阵特征图。
优选地,所述将训练后的初始图卷积神经网络模型作为预设图卷积神经网络模型,具体包括:
获取若干原始图片;
随机生成旋转角度,并基于所述旋转角度和预设原点对所述原始图片进行旋转,生成若干测试图片;
通过所述测试图片对所述训练后的图卷积神经网络模型进行测试,获得测试结果;
在所述测试结果满足预设要求时,将训练后的初始图卷积神经网络模型作为预设图卷积神经网络模型。
此外,为实现上述目的,本发明还提供一种图片的识别设备,所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的图片的识别程序,所述图片的识别程序被所述处理器执行时实现如上文所述的图片的识别方法的步骤。
此外,为实现上述目的,本发明还提供一种存储介质,所述存储介质上存储有图片的识别程序,所述图片的识别程序被处理器执行时实现如上文所述图片的识别方法的步骤。
此外,为实现上述目的,本发明还提供一种图片的识别装置,所述图片的识别装置包括:
提取模块,用于对待识别图片进行特征提取,获得所述待识别图片中各像素点的特征值;
建立模块,用于通过第一二维矩阵对所述待识别图片中各像素点的特征值进行表征,所述第一二维矩阵是基于笛卡尔集坐标建立的;
确定模块,用于通过所述待识别图片中各像素点在所述第一二维矩阵中的笛卡尔坐标,确定所述待识别图片中各像素点的极坐标;
赋值模块,用于基于所述待识别图片中各像素点的极坐标建立第二二维矩阵,并将所述第一二维矩阵中各像素点的特征值赋予到所述第二二维矩阵中相应的点上;
分析模块,用于通过预设图卷积神经网络模型对所述第二二维矩阵进行分析,以实现对所述待识别图片的识别。
在本发明中,对待识别图片进行特征提取,获得所述待识别图片中各像素点的特征值,通过第一二维矩阵对所述待识别图片中各像素点的特征值进行表征,所述第一二维矩阵是基于笛卡尔坐标建立的,通过所述待识别图片中各像素点的笛卡尔坐标确定相应的极坐标,基于所述待识别图片中各像素点的极坐标建立第二二维矩阵,通过预设图卷积神经网络模型对所述第二二维矩阵进行分析,以实现对所述待识别图片的识别。在本发明中,利用极坐标的特性,将图片的旋转的变化转变为平移的变化,以此来提高图卷积神经网络提取图片旋转不变的特征的能力。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的设备结构示意图;
图2为本发明图片的识别方法第一实施例的流程示意图;
图3为本发明图片的识别方法第二实施例的流程示意图;
图4为本发明图片的识别方法第三实施例的流程示意图;
图5为本发明图片的识别方法第四实施例的流程示意图;
图6为本发明图片的识别方法一实施例的样本图片的极坐标二维矩阵特征图;
图7为本发明图片的识别方法一实施例的样本图片的当前极坐标二维矩阵特征图;
图8为本发明图片的识别装置第一实施例的功能模块图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
参照图1,图1为本发明实施例方案涉及的硬件运行环境的图片的识别设备的结构示意图。
如图1所示,所述图片的识别设备可以包括:处理器1001,例如CPU,通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储服务器。
本领域技术人员可以理解,图1中示出的结构并不构成对所述图片的识别设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种存储介质的存储器1005中可以包括操作装置、网络通信模块、用户接口模块以及图片的识别程序。
在图1所示的图片的识别设备中,网络接口1004主要用于连接后台服务器,与所述后台服务器进行数据通信;用户接口1003主要用于连接用户设备;所述图片的识别设备通过处理器1001调用存储器1005中存储的图片的识别程序,并执行本发明实施例提供的图片的识别方法。
所述图片的识别设备通过处理器1001调用存储器1005中存储的图片的识别程序,并执行以下操作:
对待识别图片进行特征提取,获得所述待识别图片中各像素点的特征值;
通过第一二维矩阵对所述待识别图片中各像素点的特征值进行表征,所述第一二维矩阵是基于笛卡尔坐标建立的;
通过所述待识别图片中各像素点在所述第一二维矩阵中的笛卡尔坐标,确定所述待识别图片中各像素点的极坐标;
基于所述待识别图片中各像素点的极坐标建立第二二维矩阵,并将所述第一二维矩阵中各像素点的特征值赋予到所述第二二维矩阵中相应的点上;
通过预设图卷积神经网络模型对所述第二二维矩阵进行分析,以实现对所述待识别图片的识别。
进一步地,处理器1001可以调用存储器1005中存储的图片的识别程序,还执行以下操作:
获得若干样本图片,对各样本图片进行处理,获得各样本图片的极坐标二维矩阵特征图;
获得各样本图片的识别结果,基于所述样本图片的极坐标二维矩阵特征图和所述识别结果建立所述预设图卷积神经网络模型。
进一步地,处理器1001可以调用存储器1005中存储的图片的识别程序,还执行以下操作:
获得各样本图片的识别结果,并获得初始图卷积神经网络模型;
通过所述样本图片的极坐标二维矩阵特征图和所述识别结果对所述初始图卷积神经网络模型进行训练;
将训练后的初始图卷积神经网络模型作为所述预设图卷积神经网络模型。
进一步地,处理器1001可以调用存储器1005中存储的图片的识别程序,还执行以下操作:
对所述初始图卷积神经网络模型进行改进,以确定所述样本图片的极坐标二维矩阵特征图的第一区域,并将所述第一区域平移至预设位置,获得所述样本图片的当前极坐标二维矩阵特征图;
通过所述样本图片的当前极坐标二维矩阵特征图和所述识别结果对所述改进后的初始图卷积神经网络模型进行训练。
进一步地,处理器1001可以调用存储器1005中存储的图片的识别程序,还执行以下操作:
对所述初始图卷积神经网络模型进行改进,以确定所述样本图片的极坐标二维矩阵特征图的第一区域和第二区域,并将所述第一区域和第二区域平移至预设位置,获得所述样本图片的当前极坐标二维矩阵特征图。
进一步地,处理器1001可以调用存储器1005中存储的图片的识别程序,还执行以下操作:
对所述初始图卷积神经网络模型进行改进,基于所述初始图卷积神经网络模型的卷积核确定所述样本图片的极坐标二维矩阵特征图的第一区域和第二区域,并将所述第一区域和第二区域平移至预设位置,获得所述样本图片的当前极坐标二维矩阵特征图。
进一步地,处理器1001可以调用存储器1005中存储的图片的识别程序,还执行以下操作:
获取若干原始图片;
随机生成旋转角度,并基于所述旋转角度和预设原点对所述原始图片进行旋转,生成若干测试图片;
通过所述测试图片对所述训练后的图卷积神经网络模型进行测试,获得测试结果;
在所述测试结果满足预设要求时,将训练后的初始图卷积神经网络模型作为预设图卷积神经网络模型。
在本实施例中,对待识别图片进行特征提取,获得所述待识别图片中各像素点的特征值,通过第一二维矩阵对所述待识别图片中各像素点的特征值进行表征,所述第一二维矩阵是基于笛卡尔坐标建立的,通过所述待识别图片中各像素点的笛卡尔坐标确定相应的极坐标,基于所述待识别图片中各像素点的极坐标建立第二二维矩阵,通过预设图卷积神经网络模型对所述第二二维矩阵进行分析,以实现对所述待识别图片的识别。在本发明中,利用极坐标的特性,将图片的旋转的变化转变为平移的变化,以此来提高图卷积神经网络提取图片旋转不变的特征的能力。
基于上述硬件结构,提出本发明图片的识别方法的实施例。
参照图2,图2为本发明图片的识别方法第一实施例的流程示意图。
在第一实施例中,所述图片的识别方法包括以下步骤:
步骤S10:对待识别图片进行特征提取,获得所述待识别图片中各像素点的特征值。
在获得待识别图片时,首先对待识别图片进行数据化处理,即对待识别图片进行特征提取,获得组成所述待识别图片的各像素点的特征值,这里其实是通过特征值来对图片的特征进行表征。
步骤S20:通过第一二维矩阵对所述待识别图片中各像素点的特征值进行表征,所述第一二维矩阵是基于笛卡尔坐标建立的。
在具体实现时,是基于自定义的原点,获得所述待识别图片中各像素点的笛卡尔坐标,基于各像素点的笛卡尔坐标建立由所述待识别图片中像素点组成的二维矩阵,通过建立的二维矩阵对待识别图片中各像素点的特征值进行表征。
需要说明的是,本方案中的第一和第二并不具有限定性的作用,只是为了为了对各二维矩阵进行区分。
步骤S30:通过所述待识别图片中各像素点在所述第一二维矩阵中的笛卡尔坐标,确定所述待识别图片中各像素点的极坐标。
在具体实现中,基于自定义的原点及所述待识别图片中各像素点的笛卡尔坐标,计算得到所述待识别图片中各像素点的极坐标。
步骤S40:基于所述待识别图片中各像素点的极坐标建立第二二维矩阵,并将所述第一二维矩阵中各像素点的特征值赋予到所述第二二维矩阵中相应的点上。
基于所述待识别图片中各像素点的极坐标建立第二二维矩阵,并将所述第一二维矩阵中各像素点的特征值赋予到所述第二二维矩阵中相应的点上。
可以理解的是,所述第一二维矩阵是以基于所述待识别图片的横纵坐标建立的,所述第二二维矩阵是基于半径及角度建立的,在对图片进行旋转的情况下,在所述第二二维矩阵中也可以理解为对图片进行的平移操作。
步骤S50:通过预设图卷积神经网络模型对所述第二二维矩阵进行分析,以实现对所述待识别图片的识别。
在本实施例中,对待识别图片进行特征提取,获得所述待识别图片中各像素点的特征值,通过第一二维矩阵对所述待识别图片中各像素点的特征值进行表征,所述第一二维矩阵是基于笛卡尔坐标建立的,通过所述待识别图片中各像素点的笛卡尔坐标确定相应的极坐标,基于所述待识别图片中各像素点的极坐标建立第二二维矩阵,通过预设图卷积神经网络模型对所述第二二维矩阵进行分析,以实现对所述待识别图片的识别。在本发明中,利用极坐标的特性,将图片的旋转的变化转变为平移的变化,以此来提高图卷积神经网络提取图片旋转不变的特征的能力。
参照图3,图3为本发明图片的识别方法第二实施例的流程示意图,基于上述图2所示的实施例,提出本发明图片的识别方法的第二实施例。
在第二实施例中,所述步骤S50之前,所述方法还包括:
步骤S01:获得若干样本图片,对各样本图片进行处理,获得各样本图片的极坐标二维矩阵特征图。
可以理解的是,可以根据待识别图片的类型来进行样本图片的选取,比如待识别图片为数字类,可以选取大量的各种类型的数字样本图片,待识别图片为动物类,可以选取大量的动物样本图片,图片的具体来源可以为各种数据集,本实施例中,所述样本图片来自mnist数据集。
步骤S02:获得各样本图片的识别结果,基于所述样本图片的极坐标二维矩阵特征图和所述识别结果建立所述预设图卷积神经网络模型。
本实施例中,将基于样本图片的极坐标二维矩阵和所述样本图片的识别结果建立的图卷积神经网络模型作为预设图卷积神经网络模型,通过所述图卷积神经网络模型对待识别图片进行识别,提高对待识别图片提取旋转不变的特征的能力。
参照图4,图4为本发明图片的识别方法第三实施例的流程示意图,基于上述图3所示的实施例,提出本发明图片的识别方法的第三实施例。
在第二实施例中,所述步骤S02,具体包括:
步骤S021:获得各样本图片的识别结果,并获得初始图卷积神经网络模型。
可以理解的是,获得初始图卷积神经网络模型实际上为获得初始图卷积神经网络模型的初始参数。
步骤S022:通过所述样本图片的极坐标二维矩阵特征图和所述识别结果对所述初始图卷积神经网络模型进行训练。
具体实现时,可以获取若干样本图片,对各样本图片进行处理,获得各样本图片的极坐标二维矩阵特征图,将各样本图片的极坐标二维矩阵特征图作为所述初始神经网络模型的输入,将各样本图片的识别结果作为所述初始神经网络模型的目标输出,对所述初始图卷积神经网络模型进行训练,获得所述图卷积神经网络的当前输出,基于所述当前输出与目标输出的差值对所述初始图卷积神经网络的初始参数进行更新。
步骤S023:将训练后的初始图卷积神经网络模型作为所述预设图卷积神经网络模型。
直到所述当前输出与目标输出的差值满足预设要求时,获得相应的初始图卷积神经网络模型的模型参数,并将训练后的初始图卷积神经网络模型作为所述预设图卷积神经网络模型。
在建立所述预设图卷积神经网络模型之后,可以进一步地对所述预设图卷积神经网络模型对图片的识别效果进行考察,具体可以通过以下操作进行:
首先,获取若干原始图片,基于随机造成的旋转角度和预设原点对所述原始图片进行旋转,生成若干测试图片,通过所述测试图片对所述训练后的图卷积神经网络模型进行测试,获得测试结果,在所述测试结果满足预设要求时,将训练后的初始图卷积神经网络模型作为预设图卷积神经网络模型。
可以理解的是,本实施例中的原始图片和样本图片可以来自同一个数据集,通过对原始图片进行旋转,生成若干测试图片,可以通过对所述测试图片的识别效果来对所述训练后的初始图卷积神经网络模型提取图片旋转不变的特征的能力进行考察。
其中分别编写了两个方法来实现这两个操作:expand_data方法,用于将数据集进行旋转,其核心代码就是运用ndimage包中的ndimage.rotate方法,其参数为原始图片数据和旋转的角度,循环遍历每一张原始图片,每一张原始图片进行旋转操作;其中用numpy包中的np.random.randint方法生成-180到180之间的随机数作为图片旋转的角度,每次循环需要调用该方法生成不同随机数作为每张图片旋转的角度,这样就构建了新的旋转过后的数据集。
本实施例中,将基于样本图片的极坐标二维矩阵和所述样本图片的识别结果对初始神经网络进行训练,并对图片进行旋转,基于旋转后的图片对所述训练后的初始神经网络提取图片旋转不变的特征的能力进行考察,提高对旋转后图片的识别效果。
参照图5,图5为本发明图片的识别方法第四实施例的流程示意图,基于上述图4所示的实施例,提出本发明图片的识别方法的第四实施例。
在第二实施例中,所述步骤S022,具体包括:
步骤S024:对所述初始图卷积神经网络模型进行改进,以确定所述样本图片的极坐标二维矩阵特征图的第一区域,并将所述第一区域平移至预设位置,获得所述样本图片的当前极坐标二维矩阵特征图。
可以理解的是,通过对所述待识别图片进行处理,可以获得所述将所述待识别图片的极坐标二维矩阵作为所述图卷积神经网络模型的输入,在通过图卷积神经网络模型对所述待识别图片的极坐标二维矩阵进行处理时,相应的卷积核以及所提取的特征映射也是以角度和弧度为横纵坐标的,但在传统的卷积层中会将极坐标中表示的圆展开成一个以角度和弧度为横纵坐标的矩形,这样展开的特征映射就丢失了弧度为0和弧度为2π之间的数据关系,所以我们进行“首尾相接”的工作,对传统的图卷积神经网络进行改进,将弧度0和2π之间的数据联系起来。
在具体实现中,需要在传统的图卷积神经网络模型的基础上重新设计卷积层,重新设计的卷积层需要继承卷积方法都需要继承的_Conv类,并重写相应的方法,这样既保留原卷积层卷积功能,又使重新设计的卷积层能有效利用极坐标系的特性。
可以理解的是,需要重新写入call()方法,其参数是导入的图片数据,根据重写的call()方法,可以对导入的图片进行数据拓展,具体为确定所述样本图片的极坐标二维矩阵特图的第一区域,并将所述第一区域平移至预设位置,获得所述样本图片的当前极坐标二维矩阵特征图。
为了方便理解,结合图6和图7对本方案的具体实施方法进行详细解释。
如图6所示,区域11表示对样本图片进行处理之后得到的极坐标二维矩阵特征图,需要说明的是,这里并没有将所述极坐标二维矩阵特征图中的具体内容展示出来,只是通过区域11来对所述极坐标二维矩阵所在的区域进行简单展示,所述第一区域为所述样本图片的极坐标二维矩阵特征图的左侧部分,对所述第一区域进行平移,以使所述第一区域与所述样本图片的极坐标二维矩阵特征图的右侧相邻,从而达到“首尾相接”的效果,平移后的结果可参照图7,区域22表示样本图片的当前极坐标二维矩阵特征图。
需要说明的是,本方案中的“第一”及“第二”并不构成对所述区域的任何限制,只是为了对各区域进行区分,方便对本方案的理解。
当然,也可以对所述初始图卷积神经网络模型进行改进,以确定所述样本图片的极坐标二维矩阵特征图的第一区域和第二区域,并将所述第一区域和第二区域平移至预设位置,获得所述样本图片的当前极坐标二维矩阵特征图。
可以理解的是,本方案中并没有对所述第一区域和第二区域的大小进行限制,只要达到“首尾相接”的效果即可。
进一步地,可以基于所述初始图卷积神经网络模型的卷积核确定所述样本图片的极坐标二维矩阵特征图的第一区域和第二区域,并将所述第一区域和第二区域平移至预设位置,获得所述样本图片的当前极坐标二维矩阵特征图。
在具体实现时,基于所述初始图卷积神经网络模型的卷积核确定所述样本图片的极坐标二维矩阵特征图上的第一区域和第二区域,使得所述第一区域与第二区域的总区域与所述卷积核的区域面积相等,利用卷积核来确定所述第一区域及第二区域,可以在一定程度上避免数据的流失,保证数据的完整性,同时又不会造成出现过多重复的数据。
步骤S025:通过所述样本图片的当前极坐标二维矩阵特征图和所述识别结果对所述改进后的初始图卷积神经网络模型进行训练。
本实施例中,通过对传统的图卷积神经网络的改进,既保留了原卷积层的卷积功能,又能够有效利用极坐标系的特性,提高了本方案中的预设神经网络对图片的识别效果。
此外,本发明实施例还提出一种存储介质,所述存储介质上存储有图片的识别程序,所述图片的识别程序被处理器执行时实现如下操作:
对待识别图片进行特征提取,获得所述待识别图片中各像素点的特征值;
通过第一二维矩阵对所述待识别图片中各像素点的特征值进行表征,所述第一二维矩阵是基于笛卡尔坐标建立的;
通过所述待识别图片中各像素点在所述第一二维矩阵中的笛卡尔坐标,确定所述待识别图片中各像素点的极坐标;
基于所述待识别图片中各像素点的极坐标建立第二二维矩阵,并将所述第一二维矩阵中各像素点的特征值赋予到所述第二二维矩阵中相应的点上;
通过预设图卷积神经网络模型对所述第二二维矩阵进行分析,以实现对所述待识别图片的识别。
进一步地,所述图片的识别程序被处理器执行时还实现如下操作:
获得若干样本图片,对各样本图片进行处理,获得各样本图片的极坐标二维矩阵特征图;
获得各样本图片的识别结果,基于所述样本图片的极坐标二维矩阵特征图和所述识别结果建立所述预设图卷积神经网络模型。
进一步地,所述图片的识别程序被处理器执行时还实现如下操作:
获得各样本图片的识别结果,并获得初始图卷积神经网络模型;
通过所述样本图片的极坐标二维矩阵特征图和所述识别结果对所述初始图卷积神经网络模型进行训练;
将训练后的初始图卷积神经网络模型作为所述预设图卷积神经网络模型。
进一步地,所述图片的识别程序被处理器执行时还实现如下操作:
对所述初始图卷积神经网络模型进行改进,以确定所述样本图片的极坐标二维矩阵特征图的第一区域,并将所述第一区域平移至预设位置,获得所述样本图片的当前极坐标二维矩阵特征图;
通过所述样本图片的当前极坐标二维矩阵特征图和所述识别结果对所述改进后的初始图卷积神经网络模型进行训练。
进一步地,所述图片的识别程序被处理器执行时还实现如下操作:
对所述初始图卷积神经网络模型进行改进,以确定所述样本图片的极坐标二维矩阵特征图的第一区域和第二区域,并将所述第一区域和第二区域平移至预设位置,获得所述样本图片的当前极坐标二维矩阵特征图。
进一步地,所述图片的识别程序被处理器执行时还实现如下操作:
对所述初始图卷积神经网络模型进行改进,基于所述图卷积神经网络模型的卷积核确定所述样本图片的极坐标二维矩阵特征图的第一区域和第二区域,并将所述第一区域和第二区域平移至预设位置,获得所述样本图片的当前极坐标二维矩阵特征图。
进一步地,所述图片的识别程序被处理器执行时还实现如下操作:
获取若干原始图片;
随机生成旋转角度,并基于所述旋转角度和预设原点对所述原始图片进行旋转,生成若干测试图片;
通过所述测试图片对所述训练后的图卷积神经网络模型进行测试,获得测试结果;
在所述测试结果满足预设要求时,将训练后的初始图卷积神经网络模型作为预设图卷积神经网络模型。
在本实施例中,对待识别图片进行特征提取,获得所述待识别图片中各像素点的特征值,通过第一二维矩阵对所述待识别图片中各像素点的特征值进行表征,所述第一二维矩阵是基于笛卡尔坐标建立的,通过所述待识别图片中各像素点的笛卡尔坐标确定相应的极坐标,基于所述待识别图片中各像素点的极坐标建立第二二维矩阵,通过预设图卷积神经网络模型对所述第二二维矩阵进行分析,以实现对所述待识别图片的识别。在本发明中,利用极坐标的特性,将图片的旋转的变化转变为平移的变化,以此来提高图卷积神经网络提取图片旋转不变的特征的能力。
参照图8,图8为本发明图片的识别装置第一实施例的功能模块图,基于所述图片的识别方法,提出本发明图片的识别装置的第一实施例。
在本实施例中,所述图片的识别装置包括:
提取模块10,用于对待识别图片进行特征提取,获得所述待识别图片中各像素点的特征值。
在获得待识别图片时,首先对待识别图片进行数据化处理,即对待识别图片进行特征提取,获得组成所述待识别图片的各像素点的特征值,这里其实是通过特征值来对图片的特征进行表征。
建立模块20,用于通过第一二维矩阵对所述待识别图片中各像素点的特征值进行表征,所述第一二维矩阵是基于笛卡尔集坐标建立的。
在具体实现时,是基于自定义的原点,获得所述待识别图片中各像素点的笛卡尔坐标,基于各像素点的笛卡尔坐标建立由所述待识别图片中像素点组成的二维矩阵,通过建立的二维矩阵对待识别图片中各像素点的特征值进行表征。
需要说明的是,本方案中的第一和第二并不具有限定性的作用,只是为了为了对各二维矩阵进行区分。
确定模块30,用于通过所述待识别图片中各像素点在所述第一二维矩阵中的笛卡尔坐标,确定所述待识别图片中各像素点的极坐标。
在具体实现中,基于自定义的原点及所述待识别图片中各像素点的笛卡尔坐标,计算得到所述待识别图片中各像素点的极坐标。
赋值模块40,用于基于所述待识别图片中各像素点的极坐标建立第二二维矩阵,并将所述第一二维矩阵中各像素点的特征值赋予到所述第二二维矩阵中相应的点上。
基于所述待识别图片中各像素点的极坐标建立第二二维矩阵,并将所述第一二维矩阵中各像素点的特征值赋予到所述第二二维矩阵中相应的点上。
可以理解的是,所述第一二维矩阵是以基于所述待识别图片的横纵坐标建立的,所述第二二维矩阵是基于半径及角度建立的,在对图片进行旋转的情况下,在所述第二二维矩阵中也可以理解为对图片进行的平移操作。
分析模块50,用于通过预设图卷积神经网络模型对所述第二二维矩阵进行分析,以实现对所述待识别图片的识别。
在本实施例中,对待识别图片进行特征提取,获得所述待识别图片中各像素点的特征值,通过第一二维矩阵对所述待识别图片中各像素点的特征值进行表征,所述第一二维矩阵是基于笛卡尔坐标建立的,通过所述待识别图片中各像素点的笛卡尔坐标确定相应的极坐标,基于所述待识别图片中各像素点的极坐标建立第二二维矩阵,通过预设图卷积神经网络模型对所述第二二维矩阵进行分析,以实现对所述待识别图片的识别。在本发明中,利用极坐标的特性,将图片的旋转的变化转变为平移的变化,以此来提高图卷积神经网络提取图片旋转不变的特征的能力。
可理解的是,所述图片的识别装置中的各模块还用于实现上述方法中的各步骤,在此不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
单词第一、第二、以及第三等的使用不表示任何顺序,可将这些单词解释为名称。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端智能电视(可以是手机,计算机,服务器,空调器,或者网络智能电视等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种图片的识别方法,其特征在于,所述方法包括以下步骤:
对待识别图片进行特征提取,获得所述待识别图片中各像素点的特征值;
通过第一二维矩阵对所述待识别图片中各像素点的特征值进行表征,所述第一二维矩阵是基于笛卡尔坐标建立的;
通过所述待识别图片中各像素点在所述第一二维矩阵中的笛卡尔坐标,确定所述待识别图片中各像素点的极坐标;
基于所述待识别图片中各像素点的极坐标建立第二二维矩阵,并将所述第一二维矩阵中各像素点的特征值赋予到所述第二二维矩阵中相应的点上;
通过预设图卷积神经网络模型对所述第二二维矩阵进行分析,以实现对所述待识别图片的识别。
2.如权利要求1所述的方法,其特征在于,所述通过预设图卷积神经网络模型对所述第二二维矩阵进行分析,以实现对所述待识别图片的识别之前,所述方法还包括:
获得若干样本图片,对各样本图片进行处理,获得各样本图片的极坐标二维矩阵特征图;
获得各样本图片的识别结果,基于所述样本图片的极坐标二维矩阵特征图和所述识别结果建立所述预设图卷积神经网络模型。
3.如权利要求2所述的方法,其特征在于,所述获得各样本图片的识别结果,基于所述样本图片的极坐标二维矩阵特征图和所述识别结果建立所述预设图卷积神经网络模型,具体包括:
获得各样本图片的识别结果,并获得初始图卷积神经网络模型;
通过所述样本图片的极坐标二维矩阵特征图和所述识别结果对所述初始图卷积神经网络模型进行训练;
将训练后的初始图卷积神经网络模型作为所述预设图卷积神经网络模型。
4.如权利要求3所述的方法,其特征在于,所述通过所述样本图片的极坐标二维矩阵特征图和所述识别结果对所述初始图卷积神经网络模型进行训练,具体包括:
对所述初始图卷积神经网络模型进行改进,以确定所述样本图片的极坐标二维矩阵特征图的第一区域,并将所述第一区域平移至预设位置,获得所述样本图片的当前极坐标二维矩阵特征图;
通过所述样本图片的当前极坐标二维矩阵特征图和所述识别结果对所述改进后的初始图卷积神经网络模型进行训练。
5.如权利要求4所述的方法,其特征在于,所述对所述初始图卷积神经网络模型进行改进,以确定所述样本图片的极坐标二维矩阵特征图的第一区域,并将所述第一区域平移至预设位置,获得所述样本图片的当前极坐标二维矩阵特征图,具体包括:
对所述初始图卷积神经网络模型进行改进,以确定所述样本图片的极坐标二维矩阵特征图的第一区域和第二区域,并将所述第一区域和第二区域平移至预设位置,获得所述样本图片的当前极坐标二维矩阵特征图。
6.如权利要求5所述的方法,其特征在于,所述对所述初始图卷积神经网络模型进行改进,以确定所述样本图片的极坐标二维矩阵特征图的第一区域和第二区域,并将所述第一区域和第二区域平移至预设位置,获得所述样本图片的当前极坐标二维矩阵,具体包括:
对所述初始图卷积神经网络模型进行改进,基于所述初始图卷积神经网络模型的卷积核确定所述样本图片的极坐标二维矩阵特征图的第一区域和第二区域,并将所述第一区域和第二区域平移至预设位置,获得所述样本图片的当前极坐标二维矩阵特征图。
7.如权利要求2-6中任一项所述的方法,其特征在于,所述将训练后的初始图卷积神经网络模型作为预设图卷积神经网络模型,具体包括:
获取若干原始图片;
随机生成旋转角度,并基于所述旋转角度和预设原点对所述原始图片进行旋转,生成若干测试图片;
通过所述测试图片对所述训练后的图卷积神经网络模型进行测试,获得测试结果;
在所述测试结果满足预设要求时,将训练后的初始图卷积神经网络模型作为预设图卷积神经网络模型。
8.一种图片的识别设备,其特征在于,所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的图片的识别程序,所述图片的识别程序被所述处理器执行时实现如权利要求1至7中任一项所述的图片的识别方法的步骤。
9.一种存储介质,其特征在于,所述存储介质上存储有图片的识别程序,所述图片的识别程序被处理器执行时实现如权利要求1至7中任一项所述的图片的识别方法的步骤。
10.一种图片的识别装置,其特征在于,所述图片的识别装置包括:
提取模块,用于对待识别图片进行特征提取,获得所述待识别图片中各像素点的特征值;
建立模块,用于通过第一二维矩阵对所述待识别图片中各像素点的特征值进行表征,所述第一二维矩阵是基于笛卡尔集坐标建立的;
确定模块,用于通过所述待识别图片中各像素点在所述第一二维矩阵中的笛卡尔坐标,确定所述待识别图片中各像素点的极坐标;
赋值模块,用于基于所述待识别图片中各像素点的极坐标建立第二二维矩阵,并将所述第一二维矩阵中各像素点的特征值赋予到所述第二二维矩阵中相应的点上;
分析模块,用于通过预设图卷积神经网络模型对所述第二二维矩阵进行分析,以实现对所述待识别图片的识别。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910428452.2A CN110135512B (zh) | 2019-05-21 | 2019-05-21 | 图片的识别方法、设备、存储介质及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910428452.2A CN110135512B (zh) | 2019-05-21 | 2019-05-21 | 图片的识别方法、设备、存储介质及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110135512A true CN110135512A (zh) | 2019-08-16 |
CN110135512B CN110135512B (zh) | 2021-07-27 |
Family
ID=67572316
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910428452.2A Expired - Fee Related CN110135512B (zh) | 2019-05-21 | 2019-05-21 | 图片的识别方法、设备、存储介质及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110135512B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111343848A (zh) * | 2019-12-01 | 2020-06-26 | 深圳市智微智能软件开发有限公司 | Smt位置检测方法及*** |
CN112434708A (zh) * | 2020-11-18 | 2021-03-02 | 西安理工大学 | 一种极坐标二维s变换图像局部谱识别方法 |
US20210190941A1 (en) * | 2019-12-18 | 2021-06-24 | Robert Bosch Gmbh | More reliable classification of radar data from dynamic settings |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101520848A (zh) * | 2008-02-27 | 2009-09-02 | 中国科学院自动化研究所 | 一种图像型垃圾邮件的过滤方法 |
CN107909585A (zh) * | 2017-11-14 | 2018-04-13 | 华南理工大学 | 一种血管内超声影像的血管中内膜分割方法 |
CN108319924A (zh) * | 2018-02-07 | 2018-07-24 | 武汉理工大学 | 一种基于融合特征和elm算法的交通标志识别方法 |
CN109472786A (zh) * | 2018-11-05 | 2019-03-15 | 平安科技(深圳)有限公司 | 脑出血图像处理方法、装置、计算机设备及存储介质 |
US10248664B1 (en) * | 2018-07-02 | 2019-04-02 | Inception Institute Of Artificial Intelligence | Zero-shot sketch-based image retrieval techniques using neural networks for sketch-image recognition and retrieval |
-
2019
- 2019-05-21 CN CN201910428452.2A patent/CN110135512B/zh not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101520848A (zh) * | 2008-02-27 | 2009-09-02 | 中国科学院自动化研究所 | 一种图像型垃圾邮件的过滤方法 |
CN107909585A (zh) * | 2017-11-14 | 2018-04-13 | 华南理工大学 | 一种血管内超声影像的血管中内膜分割方法 |
CN108319924A (zh) * | 2018-02-07 | 2018-07-24 | 武汉理工大学 | 一种基于融合特征和elm算法的交通标志识别方法 |
US10248664B1 (en) * | 2018-07-02 | 2019-04-02 | Inception Institute Of Artificial Intelligence | Zero-shot sketch-based image retrieval techniques using neural networks for sketch-image recognition and retrieval |
CN109472786A (zh) * | 2018-11-05 | 2019-03-15 | 平安科技(深圳)有限公司 | 脑出血图像处理方法、装置、计算机设备及存储介质 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111343848A (zh) * | 2019-12-01 | 2020-06-26 | 深圳市智微智能软件开发有限公司 | Smt位置检测方法及*** |
CN111343848B (zh) * | 2019-12-01 | 2022-02-01 | 深圳市智微智能软件开发有限公司 | Smt位置检测方法及*** |
US20210190941A1 (en) * | 2019-12-18 | 2021-06-24 | Robert Bosch Gmbh | More reliable classification of radar data from dynamic settings |
CN112434708A (zh) * | 2020-11-18 | 2021-03-02 | 西安理工大学 | 一种极坐标二维s变换图像局部谱识别方法 |
CN112434708B (zh) * | 2020-11-18 | 2024-07-09 | 南京中科软创科技有限公司 | 一种极坐标二维s变换图像局部谱识别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110135512B (zh) | 2021-07-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110135512A (zh) | 图片的识别方法、设备、存储介质及装置 | |
CN110390269A (zh) | Pdf文档表格提取方法、装置、设备及计算机可读存储介质 | |
CN107742107A (zh) | 人脸图像分类方法、装置及服务器 | |
CN111275784B (zh) | 生成图像的方法和装置 | |
CN110490232B (zh) | 训练文字行方向预测模型的方法、装置、设备、介质 | |
CN110025956A (zh) | 一种电竞数据推送方法、装置及服务器 | |
CN103577322B (zh) | 一种点击测试方法和装置 | |
CN110910343A (zh) | 路面裂缝检测的方法、装置及计算机设备 | |
CN112215171B (zh) | 目标检测方法、装置、设备及计算机可读存储介质 | |
CN107563181A (zh) | 一种点选图形验证码的验证方法及*** | |
US20210012201A1 (en) | Center-biased machine learning techniques to determine saliency in digital images | |
CN110020653A (zh) | 图像语义分割方法、装置及计算机可读存储介质 | |
CN109977762A (zh) | 一种文本定位方法及装置、文本识别方法及装置 | |
CN109964204A (zh) | 用于处理图形的方法和*** | |
CN109977832A (zh) | 一种图像处理方法、装置及存储介质 | |
CN107944478A (zh) | 图像识别方法、***以及电子设备 | |
CN113160231A (zh) | 一种样本生成方法、样本生成装置及电子设备 | |
CN110348109A (zh) | 三维仿真培训数据处理的方法及终端设备 | |
CN110163201B (zh) | 图像测试方法和装置、存储介质及电子装置 | |
CN108364022A (zh) | 基于机器学习分析指纹相似度的跨浏览器设备识别方法 | |
CN111160501A (zh) | 一种二维码训练数据集的构建方法及装置 | |
CN105404672B (zh) | 网页数据存储和操作的***及方法 | |
CN106682014A (zh) | 游戏展示数据的生成方法和装置 | |
CN112347976B (zh) | 遥感卫星影像的区域提取方法、装置、电子设备和介质 | |
CN110427998A (zh) | 模型训练、目标检测方法及装置、电子设备、存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20210727 |