CN107563376A - 一种获取平面图像旋转角度的方法及装置 - Google Patents

一种获取平面图像旋转角度的方法及装置 Download PDF

Info

Publication number
CN107563376A
CN107563376A CN201710756022.4A CN201710756022A CN107563376A CN 107563376 A CN107563376 A CN 107563376A CN 201710756022 A CN201710756022 A CN 201710756022A CN 107563376 A CN107563376 A CN 107563376A
Authority
CN
China
Prior art keywords
image
rotation
anglec
training
network model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710756022.4A
Other languages
English (en)
Inventor
高岩
段成德
于治楼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jinan Inspur Hi Tech Investment and Development Co Ltd
Original Assignee
Jinan Inspur Hi Tech Investment and Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jinan Inspur Hi Tech Investment and Development Co Ltd filed Critical Jinan Inspur Hi Tech Investment and Development Co Ltd
Priority to CN201710756022.4A priority Critical patent/CN107563376A/zh
Publication of CN107563376A publication Critical patent/CN107563376A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明提供了一种获取平面图像旋转角度的方法及装置,所述方法包括:采集至少一张对应旋转角度不大于设定角度的样本平面图像,并根据获取的所述至少一张样本平面图像确定神经网络模型;将被识别平面图像输入所述神经网络模型,并获取所述神经网络模型根据所述被识别平面图像输出的旋转角度。通过本发明的技术方案,可提高用户体验。

Description

一种获取平面图像旋转角度的方法及装置
技术领域
本发明涉及计算机技术领域,特别涉及一种获取平面图像旋转角度的方法及装置。
背景技术
在针对平面图像进行识别以提取被识别平面图像中的特征之前,比如提取被识别平面图像中的文字之前,通常需要获取被识别平面图像的旋转角度,进而根据获取的旋转角度控制被识别平面图像旋转,以使被识别图像中文字的倾斜角度不大于设定的数值。
目前,获取被识别图像的旋转角度时,通常需要人工标记出被识别平面图像中的一个或多个特征点,然后根据标记的各个特征点计算被识别平面图像的旋转角度。
可见,上述技术方案中,每一张被识别图像均需要人工标记特征点,人工介入程度较高,用户体验较差。
发明内容
本发明实施例提供了一种获取平面图像旋转角度的方法及装置,可提高用户体验。
第一方面,本发明提供了一种获取平面图像旋转角度的方法,包括:
采集至少一张对应旋转角度不大于设定角度的样本平面图像,并根据获取的所述至少一张样本平面图像确定神经网络模型;
将被识别平面图像输入所述神经网络模型,并获取所述神经网络模型根据所述被识别平面图像输出的旋转角度。
优选地,
所述根据获取的所述至少一张样本平面图像确定神经网络模型,包括:
针对于每一张所述样本平面图像,均执行:确定所述样本平面图像对应的至少一个目标旋转角度;根据所述至少一个目标旋转角度对所述样本平面图像进行旋转处理以生成每一个所述目标旋转角度所分别对应的训练图像;
根据各个所述训练图像及各个所述训练图像所分别对应的目标旋转训练初始神经网络模型以形成所述神经网络模型。
优选地,
所述确定所述样本平面图像对应的至少一个目标旋转角度,包括:
生成至少一组随机数向量;
确定每一组所述随机数向量所分别对应的旋转系数;
针对于每一组所述随机数向量,计算所述随机数向量中的各个元素分别与对应的所述旋转系数之间的乘积;
将各个所述乘积均确定为所述样本平面图像所对应的目标旋转角度。
优选地,
在所述根据所述至少一个目标旋转角度对所述样本平面图像进行旋转处理以生成每一个所述目标旋转角度所分别对应的训练图像之前,进一步包括:
对所述样本平面图像进行灰度处理以得到灰度图像;
对所述灰度图像进行二值化处理以得到二值化图像;
根据所述二值化图像的边长,生成背景图像;
将所述二值化图像置于所述背景图像上,且所述二值化图像的中心与所述背景图像的中心相重合以形成与所述样本平面图像相对应的标准二值化图像;
则,
所述根据所述至少一个目标旋转角度对所述样本平面图像进行旋转处理以生成每一个所述目标旋转角度所分别对应的训练图像,包括:根据所述至少一个目标旋转角度,控制所述标准二值化图像以所述标准二值化图像的中心为旋转中心进行旋转以形成各个所述目标旋转角度所分别对应的训练图像。
优选地,
所述根据各个所述训练图像及各个所述训练图像所分别对应的目标旋转训练初始神经网络模型以形成所述神经网络模型,包括:
根据各个所述训练图像所分别对应的目标旋转角度,确定各个所述训练图像所分别对应的损失函数;
根据各个所述训练图像及各个所述训练图像所分别对应的目标旋转角度、损失函数训练初始神经网络模型以形成所述神经网络模型。
优选地,
各个所述训练图像所分别对应的损失函数具体为:
其中,loss(mk)表征第k个训练图像所对应的损失函数的函数值,θk表征第k个训练图像所对应的目标旋转角度,表征向所述神经网络模型输入所述第k个训练图像时所述神经网络模型所输出的输出角度。
和/或,
所述设定角度的绝对值不大于5度。
第二方面,本发明实施例提供了一种获取平面图像旋转角度的装置,包括:
样本采集模块,用于采集至少一张对应旋转角度不大于设定角度的样本平面图像;
训练模块,用于根据获取的所述至少一张样本平面图像确定神经网络模型;
角度获取模块,用于将被识别平面图像输入所述神经网络模型,并获取所述神经网络模型根据所述被识别平面图像输出的旋转角度。
优选地,
所述训练模块,包括:角度确定单元、变换处理单元和训练单元;其中,
所述角度确定单元,用于针对于每一张所述样本平面图像,确定所述样本平面图像对应的至少一个目标旋转角度;
所述变换处理单元,用于根据所述至少一个目标旋转角度对所述样本平面图像进行旋转处理以生成每一个所述目标旋转角度所分别对应的训练图像;
所述训练单元,用于根据各个所述训练图像及各个所述训练图像所分别对应的目标旋转训练初始神经网络模型以形成所述神经网络模型。
优选地,
所述角度确定单元,用于执行如下各个步骤:
生成至少一组随机数向量;
确定每一组所述随机数向量所分别对应的旋转系数;
针对于每一组所述随机数向量,计算所述随机数向量中的各个元素分别与对应的所述旋转系数之间的乘积;
将各个所述乘积均确定为所述样本平面图像所对应的目标旋转角度。
优选地,
还包括:样本图像处理模块;其中,
所述样本图像处理模块,用于对所述样本平面图像进行灰度处理以得到灰度图像;
对所述灰度图像进行二值化处理以得到二值化图像;
根据所述二值化图像的边长,生成背景图像;
将所述二值化图像置于所述背景图像上,且所述二值化图像的中心与所述背景图像的中心相重合以形成与所述样本平面图像相对应的标准二值化图像;
则,
所述变换处理单元,用于根据所述至少一个目标旋转角度,控制所述标准二值化图像以所述标准二值化图像的中心为旋转中心进行旋转以形成各个所述目标旋转角度所分别对应的训练图像。
本发明实施例提供了一种获取平面图像旋转角度的方法及装置,该方法中,通过采集至少一张对应旋转角度不大于设定角度的样本平面图像,则可根据获取的至少一张样本平面图像确定出神经网络模型,后续则可将被识别平面图像输入确定的神经网络模型,由确定的神经网络模型对输入的被识别图像进行识别处理以确定出被识别图像的旋转角度并输出,从而获取到被识别图像的旋转角度。综上可见,通过本发明实施例提供的技术方案获取被识别图像的旋转角度时,无需人工标记被识别图像上的特征点,人工干预程度较低,用户体验较好。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例提供的一种获取平面图像旋转角度的方法的流程图;
图2是本发明一实施例提供的另一种获取平面图像旋转角度的方法的流程图;
图3是本发明一实施例提供的一种获取平面图像旋转角度的装置的结构示意图;
图4是本发明一实施例提供的另一种获取平面图像旋转角度的装置的结构示意图;
图5是本发明一实施例提供的又一种获取平面图像旋转角度的装置的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明实施例提供了一种获取平面图像旋转角度的方法,包括:
步骤101,采集至少一张对应旋转角度不大于设定角度的样本平面图像,并根据获取的所述至少一张样本平面图像确定神经网络模型;
步骤102,将被识别平面图像输入所述神经网络模型,并获取所述神经网络模型根据所述被识别平面图像输出的旋转角度。
本发明上述实施例中,通过采集至少一张对应旋转角度不大于设定角度的样本平面图像,则可根据获取的至少一张样本平面图像确定出神经网络模型,后续则可将被识别平面图像输入确定的神经网络模型,由确定的神经网络模型对输入的被识别图像进行识别处理以确定出被识别图像的旋转角度并输出,从而获取到被识别图像的旋转角度。综上可见,通过本发明实施例提供的技术方案获取被识别图像的旋转角度时,无需人工标记被识别图像上的特征点,人工干预程度较低,用户体验较好。
本发明一个实施例中,所述设定角度的绝对值应当不大于5度。设定角度的绝对值不大于5度,即样本平面图像本身的旋转角度相对较小,可确保确定的神经网络模型能够较为准确的识别出被识别图像的旋转角度。
具体地的,基于如图1所示的实施例,步骤101中,所述根据获取的所述至少一张样本平面图像确定神经网络模型,包括:针对于每一张所述样本平面图像,均执行:确定所述样本平面图像对应的至少一个目标旋转角度;根据所述至少一个目标旋转角度对所述样本平面图像进行旋转处理以生成每一个所述目标旋转角度所分别对应的训练图像;
根据各个所述训练图像及各个所述训练图像所分别对应的目标旋转训练初始神经网络模型以形成所述神经网络模型。
具体地,所述确定所述样本平面图像对应的至少一个目标旋转角度,包括:生成至少一组随机数向量;确定每一组所述随机数向量所分别对应的旋转系数;针对于每一组所述随机数向量,计算所述随机数向量中的各个元素分别与对应的所述旋转系数之间的乘积;将各个所述乘积均确定为所述样本平面图像所对应的目标旋转角度。
本发明上述实施例中,可使用标准正态分布生成至少一组随机数向量,每一组随机数向量中元素的取值范围可以是0至1,每一组随机数向量所分别对应的旋转系数可结合实际业务需求及相应数量的样本分析以得到的,通常来讲,随机数向量的组数应当尽可能取偶数,每两组随机数向量所分别对应的旋转系数可以是相反数,在根据生成的至少一组随机数向量及各组随机数向量所分别对应的旋转系数确定出至少一个目标旋转角度之后,则可根据至少一个目标旋转角度对样本平面图像进行旋转处理以生成每一个目标旋转角度所分别对应的训练图像,如此,生成的各个训练图像所分别对应的目标旋转角度随机性极高,根据各个训练图像及各个训练图像所分别对应的目标旋转训练初始神经网络模型以形成神经网络模型时,形成的神经网络模型能够对大量对应不同旋转角度的被识别图像进行识别并输出其旋转角度。
本发明一个实施例中,在所述根据所述至少一个目标旋转角度对所述样本平面图像进行旋转处理以生成每一个所述目标旋转角度所分别对应的训练图像之前,进一步包括:
对所述样本平面图像进行灰度处理以得到灰度图像;
对所述灰度图像进行二值化处理以得到二值化图像;
根据所述二值化图像的边长,生成背景图像;
将所述二值化图像置于所述背景图像上,且所述二值化图像的中心与所述背景图像的中心相重合以形成与所述样本平面图像相对应的标准二值化图像;
则,
所述根据所述至少一个目标旋转角度对所述样本平面图像进行旋转处理以生成每一个所述目标旋转角度所分别对应的训练图像,包括:根据所述至少一个目标旋转角度,控制所述标准二值化图像以所述标准二值化图像的中心为旋转中心进行旋转以形成各个所述目标旋转角度所分别对应的训练图像。
本发明上述实施例中,可对采集的样本平面图像进行灰度处理以得到灰度图像,并针对灰度图像进行二值化处理以得到二值化图像,然后根据二值化图像的边长,生成背景图像,最后再将二值化图像置于生成的背景图像上,且二值化图像的中心与背景图像的中心相重合以形成与样本平面图像相对应的标准二值化图像;然后则可根据确定的至少一个目标旋转角度,控制标准二值化图像以标准二值化图像的中心为旋转中心进行旋转以形成各个目标旋转角度所分别对应的训练图像。相应的,后续过程中将被识别平面图像输入神经网络模型时,也应当通过与本发明上述实施例的各个步骤相似的方法将被识别平面图像转换成大小与背景图像相同的二值化被识别图像,并将转换形成的二值化被识别图像输入确定的神经网络模型,由确定的神经网络模型对输入的二值化被识别平面图像进行识别以输出被识别图像的旋转角度。
本发明一个实施例中,所述根据各个所述训练图像及各个所述训练图像所分别对应的目标旋转训练初始神经网络模型以形成所述神经网络模型,包括:根据各个所述训练图像所分别对应的目标旋转角度,确定各个所述训练图像所分别对应的损失函数;根据各个所述训练图像及各个所述训练图像所分别对应的目标旋转角度、损失函数训练初始神经网络模型以形成所述神经网络模型。
本发明上述实施例中,根据各个训练图像所分别对应的目标旋转角度,确定各个训练图像所分别对应的损失函数,后续则可根据各个训练图像及各个训练图像所分别对应的目标旋转角度、损失函数训练初始神经网络模型以形成神经网络模型;如此,使得神经网络模型对被识别图像进行识别以确定并输出被识别图像的旋转角度时,误差范围更小。
具体地,本发明一个实施例中,各个所述训练图像所分别对应的损失函数具体为:
其中,loss(mk)表征第k个训练图像所对应的损失函数的函数值,θk表征第k个训练图像所对应的目标旋转角度,表征向所述神经网络模型输入所述第k个训练图像时所述神经网络模型所输出的输出角度。
为了更加清楚的说明本发明的技术方案及优点,下面以根据一张样本平面图像确定神经网络模型,并根据确定的神经网络模型获取被识别图像的旋转角度为例,如图2所示,具体可以包括如下各个步骤:
步骤201,采集一张对应旋转角度为0的样本平面图像。
本发明实施例中,样本平面图像的类型包括但不限于出版物、海报、手写便签,样本平面图像上可以包括呈现行列分布的字符或标识等能够用于衡量图像旋转角度的特征信息。
应当理解的是,在实际应用场景中,为了更为准确的获取被识别图像的旋转角度,样本平面图像的数量、类型以及样本平面图像上特征信息的数量应当相对加到,比如,样本平面图像的数量应当不小于1000张。
步骤202,对采集的样本平面图像进行灰度处理以得到灰度图像,对灰度图像进行二值化处理以得到二值化图像,并根据二值化图像的边长,生成背景图像。
步骤203,将二值化图像置于背景图像上,且二值化图像的中心与背景图像的中心相重合以形成与样本平面图像相对应的标准二值化图像。
步骤202至步骤203中,当样本图像图像的长边和宽边不相等时,即样本图像不是方形图像时,可通过步骤202和步骤203生成与样本平面图像相对应的标准二值化图像,以便初始神经网络模型对标准二值化图像进行识别,标准二值化图像的边长与样本平面图像的长边长度相等。
本发明上述实施例中,对灰度图像进行二值化处理时,灰度值255为背景值,灰度值0为前景值。
步骤204,根据标准正态分布生成两组[0,1]之间的随机数向量A和B。
在实际应用场景中,为了减小神经网络模型对被识别图像进行识别以确定并输出被识别图像的旋转角度时,可具有更小的误差范围,随机数向量的个数可以相对较大,比如不小于100组;一般来说,为了减小计算量,每一组随机数向量中元素的个数可以是10个,当然,在可能实现的情况下,每一组随机数向量中元素的个数也可以相对较大,比如大于或等于100个。
步骤205,确定每一组随机数向量所分别对应的旋转系数。
本发明实施例中,各组随机数向量所分别对应的旋转系数可以结合具体的应用场景及相应数量的样本分析以确定,通常来讲,随机数向量组数可以去2,2组随机数向量所分别对应的选住啊系数可以是45和-45.
本发明实施例中的下述各个步骤以随机数向量A对应的旋转系数是45,随机数向量B对应的旋转系数是-45为例。
步骤206,计算各组随机数向量中的各个元素分别与对应的旋转系数之间的乘积,将各个乘积均确定为样本平面图像所对应的目标旋转角度。
具体地,随机数向量A中的各个元素分别与对应的旋转系数45相乘以得到10个目标旋转角度,随机数向量B中的各个元素分别与对应的旋转系数-45相乘以得到10个目标旋转角度,共得到20个目标旋转角度。
步骤207,根据各个目标旋转角度,控制标准二值化图像以标准二值化图像的中心为旋转中心进行旋转以形成各个目标旋转角度所分别对应的训练图像。
具体地,这里以目标旋转角度大于0时,控制标准二值化图像以标准二值化图像的中心为旋转中心沿顺时针方向旋转,目标旋转角度小于0时,控制标准二值化图像以标准二值化图像的中心为旋转中心沿逆时针方向旋转为例,当随机数向量A中的一个元素是0.2时,与对应的旋转系数45的乘积为9,即得到的一个目标旋转角度为9度,针对于该目标旋转角度9度,可控制标准二值化图像以标准二值化图像的中心为旋转中心沿顺时针方向旋转9度以形成目标旋转角度9度所对应的训练图像。
步骤208,确定各个训练图像所分别对应的损失函数。
这里,损失函数具体可以为:
其中,loss(mk)表征第k个训练图像所对应的损失函数的函数值,θk表征第k个训练图像所对应的目标旋转角度,表征向最终确定的神经网络模型输入第k个训练图像时神经网络模型所输出的输出角度。
步骤209,根据各个训练图像以及各个训练图像所分别对应的目标旋转角度、损失函数训练初始神经网络模型以形成神经网络模型。
这里,形成的神经网络模型应当满足的条件是:向形成的神经网络模型输入第k个训练图像时,若第k个训练图像所对应的目标旋转角度为θk,神经网络模型输出的输出角度为θk之间的差值的绝对值应当小于其对应的损失函数的函数值loss(mk)。
步骤210,获取被识别平面图像。
步骤211,对被识别平面图像依次进行灰度处理、二值化处理以得到二值化被识别图像,并针对二值化被识别图像进行缩放处理。
这里,可以对二值化被识别图像进行缩放处理以使二值化被识别图像的尺寸为480dpi*480dpi。
步骤212,将缩放处理后的二值化被识别图像输入形成的神经网络模型,并获取神经网络模型输出的旋转角度。
这里,训练得到的神经网络模型可自动标记并识别二值化被识别图像中能够用于衡量图像旋转角度的特征信息,并根据识别的特征信息确定出该二值化被识别图像所对应的被识别图像的旋转角度,并输出。
如图3所示,本发明实施例提供了一种获取平面图像旋转角度的装置,包括:
样本采集模块301,用于采集至少一张对应旋转角度不大于设定角度的样本平面图像;
训练模块302,用于根据获取的所述至少一张样本平面图像确定神经网络模型;
角度获取模块303,用于将被识别平面图像输入所述神经网络模型,并获取所述神经网络模型根据所述被识别平面图像输出的旋转角度。
如图4所示,本发明一个实施例中,所述训练模块302,包括:角度确定单元3021、变换处理单元3022和训练单元3023;其中,
所述角度确定单元3021,用于针对于每一张所述样本平面图像,确定所述样本平面图像对应的至少一个目标旋转角度;
所述变换处理单元3022,用于根据所述至少一个目标旋转角度对所述样本平面图像进行旋转处理以生成每一个所述目标旋转角度所分别对应的训练图像;
所述训练单元3023,用于根据各个所述训练图像及各个所述训练图像所分别对应的目标旋转训练初始神经网络模型以形成所述神经网络模型。
本发明一个实施例中,所述角度确定单元3021,用于执行如下各个步骤:
生成至少一组随机数向量;
确定每一组所述随机数向量所分别对应的旋转系数;
针对于每一组所述随机数向量,计算所述随机数向量中的各个元素分别与对应的所述旋转系数之间的乘积;
将各个所述乘积均确定为所述样本平面图像所对应的目标旋转角度。
如图5所示,本发明一个实施例中,还包括:样本图像处理模块501;其中,
所述样本图像处理模块501,用于对所述样本平面图像进行灰度处理以得到灰度图像;对所述灰度图像进行二值化处理以得到二值化图像;根据所述二值化图像的边长,生成背景图像;将所述二值化图像置于所述背景图像上,且所述二值化图像的中心与所述背景图像的中心相重合以形成与所述样本平面图像相对应的标准二值化图像;
则,
所述变换处理单元3022,用于根据所述至少一个目标旋转角度,控制所述标准二值化图像以所述标准二值化图像的中心为旋转中心进行旋转以形成各个所述目标旋转角度所分别对应的训练图像。
上述装置内的各单元之间的信息交互、执行过程等内容,由于与本发明方法实施例基于同一构思,具体内容可参见本发明方法实施例中的叙述,此处不再赘述。
本发明实施例提供了一种可读介质,包括执行指令,当存储控制器的处理器执行所述执行指令时,所述存储控制器执行本发明任意一个实施例中提供的方法。
本发明实施例提供了一种存储控制器,包括:处理器、存储器和总线;
所述处理器和所述存储器通过所述总线连接;
所述存储器,当所述存储控制器运行时,所述处理器执行所述存储器存储的所述执行指令,以使所述存储控制器执行本发明任意一个实施例中提供的方法。
综上所述,本发明各个实施例至少具有如下有益效果:
1、本发明一实施例中,通过采集至少一张对应旋转角度不大于设定角度的样本平面图像,则可根据获取的至少一张样本平面图像确定出神经网络模型,后续则可将被识别平面图像输入确定的神经网络模型,由确定的神经网络模型对输入的被识别图像进行识别处理以确定出被识别图像的旋转角度并输出,从而获取到被识别图像的旋转角度。综上可见,通过本发明实施例提供的技术方案获取被识别图像的旋转角度时,无需人工标记被识别图像上的特征点,人工干预程度较低,用户体验较好。
2、本发明一实施例中,设定角度的绝对值不大于5度,即样本平面图像本身的旋转角度相对较小,可确保确定的神经网络模型能够较为准确的识别出被识别图像的旋转角度。
3、本发明一实施例中,可使用标准正态分布生成至少一组随机数向量,每一组随机数向量中元素的取值范围可以是0至1,每一组随机数向量所分别对应的旋转系数可结合实际业务需求及相应数量的样本分析以得到的,通常来讲,随机数向量的组数应当尽可能取偶数,每两组随机数向量所分别对应的旋转系数可以是相反数,在根据生成的至少一组随机数向量及各组随机数向量所分别对应的旋转系数确定出至少一个目标旋转角度之后,则可根据至少一个目标旋转角度对样本平面图像进行旋转处理以生成每一个目标旋转角度所分别对应的训练图像,如此,生成的各个训练图像所分别对应的目标旋转角度随机性极高,根据各个训练图像及各个训练图像所分别对应的目标旋转训练初始神经网络模型以形成神经网络模型时,形成的神经网络模型能够对大量对应不同旋转角度的被识别图像进行识别并输出其旋转角度。
4、本发明一实施例中,根据各个训练图像所分别对应的目标旋转角度,确定各个训练图像所分别对应的损失函数,后续则可根据各个训练图像及各个训练图像所分别对应的目标旋转角度、损失函数训练初始神经网络模型以形成神经网络模型;如此,使得神经网络模型对被识别图像进行识别以确定并输出被识别图像的旋转角度时,误差范围更小。
需要说明的是,在本文中,诸如第一和第二之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个〃····〃”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同因素。
最后需要说明的是:以上所述仅为本发明的较佳实施例,仅用于说明本发明的技术方案,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所做的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (10)

1.一种获取平面图像旋转角度的方法,其特征在于,包括:采集至少一张对应旋转角度不大于设定角度的样本平面图像,并根据获取的所述至少一张样本平面图像确定神经网络模型,还包括:
将被识别平面图像输入所述神经网络模型,并获取所述神经网络模型根据所述被识别平面图像输出的旋转角度。
2.根据权利要求1所述的方法,其特征在于,
所述根据获取的所述至少一张样本平面图像确定神经网络模型,包括:
针对于每一张所述样本平面图像,均执行:确定所述样本平面图像对应的至少一个目标旋转角度;根据所述至少一个目标旋转角度对所述样本平面图像进行旋转处理以生成每一个所述目标旋转角度所分别对应的训练图像;
根据各个所述训练图像及各个所述训练图像所分别对应的目标旋转训练初始神经网络模型以形成所述神经网络模型。
3.根据权利要求2所述的方法,其特征在于,
所述确定所述样本平面图像对应的至少一个目标旋转角度,包括:
生成至少一组随机数向量;
确定每一组所述随机数向量所分别对应的旋转系数;
针对于每一组所述随机数向量,计算所述随机数向量中的各个元素分别与对应的所述旋转系数之间的乘积;
将各个所述乘积均确定为所述样本平面图像所对应的目标旋转角度。
4.根据权利要求2所述的方法,其特征在于,
在所述根据所述至少一个目标旋转角度对所述样本平面图像进行旋转处理以生成每一个所述目标旋转角度所分别对应的训练图像之前,进一步包括:
对所述样本平面图像进行灰度处理以得到灰度图像;
对所述灰度图像进行二值化处理以得到二值化图像;
根据所述二值化图像的边长,生成背景图像;
将所述二值化图像置于所述背景图像上,且所述二值化图像的中心与所述背景图像的中心相重合以形成与所述样本平面图像相对应的标准二值化图像;
则,
所述根据所述至少一个目标旋转角度对所述样本平面图像进行旋转处理以生成每一个所述目标旋转角度所分别对应的训练图像,包括:根据所述至少一个目标旋转角度,控制所述标准二值化图像以所述标准二值化图像的中心为旋转中心进行旋转以形成各个所述目标旋转角度所分别对应的训练图像。
5.根据权利要求2所述的方法,其特征在于,
所述根据各个所述训练图像及各个所述训练图像所分别对应的目标旋转训练初始神经网络模型以形成所述神经网络模型,包括:
根据各个所述训练图像所分别对应的目标旋转角度,确定各个所述训练图像所分别对应的损失函数;
根据各个所述训练图像及各个所述训练图像所分别对应的目标旋转角度、损失函数训练初始神经网络模型以形成所述神经网络模型。
6.根据权利要求5所述的方法,其特征在于,
各个所述训练图像所分别对应的损失函数具体为:
<mrow> <mi>l</mi> <mi>o</mi> <mi>s</mi> <mi>s</mi> <mrow> <mo>(</mo> <msub> <mi>m</mi> <mi>k</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <msup> <mrow> <mo>(</mo> <msub> <mi>cos&amp;theta;</mi> <mi>k</mi> </msub> <mo>-</mo> <mi>c</mi> <mi>o</mi> <mi>s</mi> <msub> <mover> <mi>&amp;theta;</mi> <mo>&amp;OverBar;</mo> </mover> <mi>k</mi> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>+</mo> <msup> <mrow> <mo>(</mo> <msub> <mi>sin&amp;theta;</mi> <mi>k</mi> </msub> <mo>-</mo> <mi>sin</mi> <msub> <mover> <mi>&amp;theta;</mi> <mo>&amp;OverBar;</mo> </mover> <mi>k</mi> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> </mrow>
其中,loss(mk)表征第k个训练图像所对应的损失函数的函数值,θk表征第k个训练图像所对应的目标旋转角度,表征向所述神经网络模型输入所述第k个训练图像时所述神经网络模型所输出的输出角度。
和/或,
所述设定角度的绝对值不大于5度。
7.一种获取平面图像旋转角度的装置,其特征在于,包括:
样本采集模块,用于采集至少一张对应旋转角度不大于设定角度的样本平面图像;
训练模块,用于根据获取的所述至少一张样本平面图像确定神经网络模型;
角度获取模块,用于将被识别平面图像输入所述神经网络模型,并获取所述神经网络模型根据所述被识别平面图像输出的旋转角度。
8.根据权利要求7所述的装置,其特征在于,
所述训练模块,包括:角度确定单元、变换处理单元和训练单元;其中,
所述角度确定单元,用于针对于每一张所述样本平面图像,确定所述样本平面图像对应的至少一个目标旋转角度;
所述变换处理单元,用于根据所述至少一个目标旋转角度对所述样本平面图像进行旋转处理以生成每一个所述目标旋转角度所分别对应的训练图像;
所述训练单元,用于根据各个所述训练图像及各个所述训练图像所分别对应的目标旋转训练初始神经网络模型以形成所述神经网络模型。
9.根据权利要求8所述的装置,其特征在于,
所述角度确定单元,用于执行如下各个步骤:
生成至少一组随机数向量;
确定每一组所述随机数向量所分别对应的旋转系数;
针对于每一组所述随机数向量,计算所述随机数向量中的各个元素分别与对应的所述旋转系数之间的乘积;
将各个所述乘积均确定为所述样本平面图像所对应的目标旋转角度。
10.根据权利要求8所述的装置,其特征在于,
还包括:样本图像处理模块;其中,
所述样本图像处理模块,用于对所述样本平面图像进行灰度处理以得到灰度图像;
对所述灰度图像进行二值化处理以得到二值化图像;
根据所述二值化图像的边长,生成背景图像;
将所述二值化图像置于所述背景图像上,且所述二值化图像的中心与所述背景图像的中心相重合以形成与所述样本平面图像相对应的标准二值化图像;
则,
所述变换处理单元,用于根据所述至少一个目标旋转角度,控制所述标准二值化图像以所述标准二值化图像的中心为旋转中心进行旋转以形成各个所述目标旋转角度所分别对应的训练图像。
CN201710756022.4A 2017-08-29 2017-08-29 一种获取平面图像旋转角度的方法及装置 Pending CN107563376A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710756022.4A CN107563376A (zh) 2017-08-29 2017-08-29 一种获取平面图像旋转角度的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710756022.4A CN107563376A (zh) 2017-08-29 2017-08-29 一种获取平面图像旋转角度的方法及装置

Publications (1)

Publication Number Publication Date
CN107563376A true CN107563376A (zh) 2018-01-09

Family

ID=60976111

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710756022.4A Pending CN107563376A (zh) 2017-08-29 2017-08-29 一种获取平面图像旋转角度的方法及装置

Country Status (1)

Country Link
CN (1) CN107563376A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109241968A (zh) * 2018-09-25 2019-01-18 广东工业大学 图像内容倾斜角度预测网络训练方法及修正方法、***
CN112115943A (zh) * 2020-09-16 2020-12-22 四川长虹电器股份有限公司 一种基于深度学习的票据旋转角度检测方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8687880B2 (en) * 2012-03-20 2014-04-01 Microsoft Corporation Real time head pose estimation
CN103870811A (zh) * 2014-03-06 2014-06-18 中国人民解放军国防科学技术大学 一种用于视频监控的正面人脸快速判别方法
CN105760836A (zh) * 2016-02-17 2016-07-13 厦门美图之家科技有限公司 基于深度学习的多角度人脸对齐方法、***及拍摄终端
CN106056161A (zh) * 2016-06-02 2016-10-26 中国人民解放军军事医学科学院卫生装备研究所 一种针对平面旋转目标的视觉检测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8687880B2 (en) * 2012-03-20 2014-04-01 Microsoft Corporation Real time head pose estimation
CN103870811A (zh) * 2014-03-06 2014-06-18 中国人民解放军国防科学技术大学 一种用于视频监控的正面人脸快速判别方法
CN105760836A (zh) * 2016-02-17 2016-07-13 厦门美图之家科技有限公司 基于深度学习的多角度人脸对齐方法、***及拍摄终端
CN106056161A (zh) * 2016-06-02 2016-10-26 中国人民解放军军事医学科学院卫生装备研究所 一种针对平面旋转目标的视觉检测方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109241968A (zh) * 2018-09-25 2019-01-18 广东工业大学 图像内容倾斜角度预测网络训练方法及修正方法、***
CN109241968B (zh) * 2018-09-25 2022-04-19 广东工业大学 图像内容倾斜角度预测网络训练方法及修正方法、***
CN112115943A (zh) * 2020-09-16 2020-12-22 四川长虹电器股份有限公司 一种基于深度学习的票据旋转角度检测方法

Similar Documents

Publication Publication Date Title
CN108229647A (zh) 神经网络结构的生成方法和装置、电子设备、存储介质
CN105069746A (zh) 基于局部仿射和颜色迁移技术的视频实时人脸替换方法及其***
CN105069774B (zh) 基于多示例学习与图割优化的目标分割方法
CN109086722A (zh) 混合车牌识别方法、装置、电子设备
CN107506828A (zh) 计算装置和方法
CN110070101A (zh) 植物种类的识别方法及装置、存储介质、计算机设备
CN103559476B (zh) 一种指纹匹配方法和装置
CN107832684A (zh) 一种具有自主学习能力的智能静脉认证方法和***
CN106067161A (zh) 一种对图像进行超分辨的方法
CN106033621A (zh) 一种三维建模的方法及装置
CN110245711A (zh) 基于角度旋转生成网络的sar目标识别方法
CN107784321A (zh) 数字绘本快速识别方法、***及计算机可读存储介质
CN107516103A (zh) 一种影像分类方法和***
CN106600537A (zh) 一种反距离权重的异向性三维空间插值方法
CN107729901A (zh) 图像处理模型的建立方法、装置及图像处理方法及***
CN106778791A (zh) 一种基于多重感知器的木材视觉识别方法
CN103839066A (zh) 一种源于生物视觉的特征提取方法
CN106373112A (zh) 图像处理方法、装置和电子设备
CN108564569B (zh) 一种基于多核分类学习的混凝土裂缝检测方法及装置
CN107563376A (zh) 一种获取平面图像旋转角度的方法及装置
CN112132812A (zh) 证件校验方法、装置、电子设备及介质
CN103927530A (zh) 一种最终分类器的获得方法及应用方法、***
CN115204292A (zh) 一种基于psfen的跨设备振动故障迁移诊断方法
CN106650573B (zh) 一种跨年龄的人脸验证方法及***
CN110401488A (zh) 一种解调方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180109