CN111340123A - 一种基于深度卷积神经网络的图像分数标签预测方法 - Google Patents

一种基于深度卷积神经网络的图像分数标签预测方法 Download PDF

Info

Publication number
CN111340123A
CN111340123A CN202010132930.8A CN202010132930A CN111340123A CN 111340123 A CN111340123 A CN 111340123A CN 202010132930 A CN202010132930 A CN 202010132930A CN 111340123 A CN111340123 A CN 111340123A
Authority
CN
China
Prior art keywords
image
neural network
training
convolutional neural
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010132930.8A
Other languages
English (en)
Inventor
金鑫
李熹桥
肖超恩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shaoding Artificial Intelligence Technology Co ltd
Original Assignee
Shaoding Artificial Intelligence Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shaoding Artificial Intelligence Technology Co ltd filed Critical Shaoding Artificial Intelligence Technology Co ltd
Priority to CN202010132930.8A priority Critical patent/CN111340123A/zh
Publication of CN111340123A publication Critical patent/CN111340123A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明提出了一种基于深度卷积神经网络的图像分数标签预测方法,包括:步骤(1),随机将数据集中80%数量的图片作为训练集,剩余的20%作为测试集;进行数据集预处理,到图像像素大小一致,包括图像分数标签的训练集和测试集;步骤(2),进行深度卷积神经网络模型训练,首先根据图像的特征和图像分数标签预测的标准,设计一个深度卷积神经网络模型,然后利用训练集中的样本图像进行学习训练,通过深度学习方法训练深度卷积神经网络模型,作为图像标签预测模型;步骤(3)进行深度卷积神经网络模型评估与测试。该方法很容易通过软件实现,本发明可广泛应用推广到计算机视觉、图像质量预测等中。

Description

一种基于深度卷积神经网络的图像分数标签预测方法
技术领域
本发明属于图像分析、计算机视觉领域,特别是图像分数标签预测,具体地说是基于深度卷积神经网络的图像分数标签预测方法。
背景技术
计算机视觉与人工智能的飞速发展、数字设备的大量衍生、人民生活水平的逐步提高,催生出大量的数字图像,可视内容感知理解已经成为可视计算、计算机视觉、计算摄像学等科学研究领域及其交叉方向国际前沿的研究方向。其中图像分数标签回归是近期可视内容感知理解方向中的研究热点。图像分数标签可以为图像的任意数据,比如图像的画面质量。
传统的图像分数标签预测都是基于原始的图像数据来设计特征,并将提取的特征输入分类器训练模型。现如今随着各个大型数据集的公开,深度学习在图像分数标签预测方向的优势也越来越凸显,且深度学习的方法也在各项任务中取得了不错的效果。但是各个大型数据集都具有自身数据分布的问题,比如数据类别之间不均衡,数据标签质量不一致等问题,这些问题也是当前图像分数标签预测面临的主要困难之一。
发明内容
本发明的技术解决问题:如今的图像分数标签预测受限于数据集标签的分布情况,图像数据集的分数标签大多数是不均衡的数据集,导致深度神经网络在拟合的时候分数预测会集中在数据集标签的最多的区段。
本发明采用的技术方案为:一种基于深度卷积神经网络的图像分数标签预测方法,包括如下步骤:
步骤(1),随机将数据集中80%数量的图片作为训练集,剩余的20%作为测试集;进行数据集预处理,首先将具有图像分数标签的数据集中的图像进行预处理,预处理包括图像大小变换、图像随机旋转和图像归一化;由此得到图像像素大小一致,包括图像分数标签的训练集和测试集;
步骤(2),进行深度卷积神经网络模型训练,首先根据图像的特征和图像分数标签预测的标准,设计一个深度卷积神经网络模型,然后利用训练集中的样本图像进行学习训练,通过深度学习方法训练深度卷积神经网络模型,作为图像标签预测模型;
步骤(3)进行深度卷积神经网络模型评估与测试,首先对测试集中的样本图像调用步骤(1)预处理后的图像,然后调用步骤(2)中得到的图像分数标签预测模型,从而预测出图像的质量分数。
进一步的,步骤(1)所述图像预处理方法采取以下步骤:
步骤(11)将训练集中原图像进行图像裁剪、图像缩放,将原始图像的像素大小变换到一个固定尺寸,这个尺寸和步骤(2)所设计的深度卷积神经网络所要求的输入尺寸保持一致;
步骤(12)将训练集中原始图像根据通道归一化,首先统计出训练集中的样本图像的不同通道的均值,然后对每一个样本图像对应通道做去均值操作。
进一步的,步骤(2)所述深度卷积神经网络模型训练过程如下:
步骤(21)使用Resnet网络作为基础网络,由残差块堆叠50层而得到Resnet50网络,网络的残差块是通过在两个卷积层之间增加短连接来拟合残差;
步骤(22)模型在Resent50网络的特征提取部分后面增加了注意力机制部分;注意力机制包括两个部分,位置注意力和通道注意力;位置注意力是在最后一层特征图上进行1*1的卷积操作,经过训练即可得到特征图上每一个位置的权重,通道注意力是对特征提取最后一层的每个通道上计算权重,得到对最终结果影响最大的几个通道;
步骤(23)将上过程依次完成,在步骤(22)注意力机制后面增加两组全连接层,其中一组全连接层的最后输出为图像分数分类数目,另一组全连接B层的最后输出为图像分数回归标签;
步骤(24)整个模型训练过程包括:首先训练步骤(21)、(22)中的特征提取部分和步骤(23)图像分数分类部分全连接层,分类误差采用Softmax误差公式进行计算,梯度回传只考虑分类的结果;然后固定神经网络模型参数,只训练步骤(23)图像分数回归部分全连接层,回归误差采用欧式误差公式进行计算,在梯度回传的时候损失函数需要将图像分数分类的结果与图像分数回归的结果结合,公式如下:
LOSS=loss1+λloss2
其中,loss1为图像分数回归损失,公式如下:
Figure BDA0002396286100000021
其中,ej为神经网络模型最后一个神经元的输出;ei为第i个神经元的输出,n为神经元个数;
loss2为图像分数分类损失,其公式如下:
Figure BDA0002396286100000031
其中,
Figure BDA0002396286100000032
为模型预测值,yi为真实值,λ为权重系数;
步骤(25)整个训练过程采用随机梯度下降法(SGD)寻找最优参数,训练神经网络模型,随机梯度下降法中的学习率变化是采用正弦函数的规律来设置,最终得到神经网络模型。
进一步的,步骤(3)所述模型的测试和预测采取以下步骤:
步骤(31)将测试集中的样本图像经过预处理得到一个新的图像A;
步骤(32)将新的图像A经过训练好的神经网络模型,模型通过正向计算得到图像分数预测结果;用模型输出测试集的结果和测试集的真实分数作对比,从而测试模型的欧式距离和相关性系数。
使用者提供目标图像,***自动的调用图像分数标签预测神经网络模型,给出预测值。
本发明与现有的技术相比,其优势在于:
(1)本发明的方法提出了一种图像标签预测的具体可行的方法;
(2)本发明的方法首次提出用标签类别信息来指导标签回归预测任务;
(3)本发明的方法提出的注意力卷积网络模型,利用卷积特性和注意力机制,此模型使图像的特征提取不需要人工干预,网络可以自动学习出图像的特征,避免了特征提取和回归过程中数据重建的复杂度。
附图说明
图1是本发明的方法流程图;
图2是本发明网络模型详细结构图;
图3是本发明注意力机制结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例仅为本发明的一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域的普通技术人员在不付出创造性劳动的前提下所获得的所有其他实施例,都属于本发明的保护范围。
如图1所示,本发明具体实现包括如下步骤:
步骤(1),随机将数据集中80%数量的图片作为训练集,剩余的20%作为测试集;进行数据集预处理,首先将具有图像分数标签的数据集中的图像进行预处理,预处理包括图像大小变换、图像随机旋转和图像归一化;由此得到图像像素大小一致,包括图像分数标签的训练集和测试集;
图1为本发明方法的流程图。首先将数据集按照80%、20%的比重分割原始数据集形成训练集和测试集;接着将训练集中图片进行预处理操作,其中包括图像缩放、图像裁剪、图像旋转等,而测试集中的图片预处理操作只进行图像缩放。卷积神经网络能够很好的提取出图像的特征,但直接堆积卷积层会导致梯度消失的情况。
图像预处理过程主要包括图像的大小归一化和图像通道去均值。
由于深度卷积神经网络对输入图像的大小有一定的限制,因此根据设计的卷积神经网络对输入的大小要求,对初始图像做大小归一化处理。大小归一化可以直接通过图像缩放操作或者通过随机裁剪然后通过图像缩放操作。
利用机器学习的方法训练模型,需要对图像通道做去均值操作,这样可以保证训练集中的图像数据都分布在均值附近。
步骤(2),进行深度卷积神经网络模型训练,首先根据图像的特征和图像分数标签预测的标准,设计一个深度卷积神经网络模型,然后利用训练集中的样本图像进行学习训练,通过深度学习方法训练深度卷积神经网络模型,作为图像标签预测模型;
步骤(3)进行深度卷积神经网络模型评估与测试,首先对测试集中的样本图像调用步骤(1)预处理后的图像,然后调用步骤(2)中得到的图像分数标签预测模型,从而预测出图像的质量分数。
进一步的,步骤(1)所述图像预处理方法采取以下步骤:
步骤(11)将训练集中原图像进行图像裁剪、图像缩放,将原始图像的像素大小变换到一个固定尺寸,这个尺寸和步骤(2)所设计的深度卷积神经网络所要求的输入尺寸保持一致;
步骤(12)将训练集中原始图像根据通道归一化,首先统计出训练集中的样本图像的不同通道的均值,然后对每一个样本图像对应通道做去均值操作。
进一步的,步骤(2)所述深度卷积神经网络模型训练过程如下:
如图2将Resnet50作为基础模型,在神经网络模型学习中,一般而言模型的参数越多则模型的表达能力越强,模型所存储的信息量也越大,但这会带来信息过载的问题。因此在基础模型特征提取后面增加注意力模块,那么通过引入注意力机制,在众多的输入信息中聚焦于对当前任务更为关键的信息,降低对其他信息的关注度,甚至过滤掉无关信息,就可以解决信息过载问题,并提高任务处理的效率和准确性。
步骤(21)使用Resnet网络作为基础网络,由残差块堆叠50层而得到Resnet50网络,网络的残差块是通过在两个卷积层之间增加短连接来拟合残差;
步骤(22)模型在Resent50网络的特征提取部分后面增加了注意力机制部分;注意力机制包括两个部分,位置注意力和通道注意力;位置注意力是在最后一层特征图上进行1*1的卷积操作,经过训练即可得到特征图上每一个位置的权重,通道注意力是对特征提取最后一层的每个通道上计算权重,得到对最终结果影响最大的几个通道;
图3为注意力机制的结构图,位置注意力是通过训练特征图每个位置的权重,得到位置关系矩阵X,使得模型对特征中重要区域的感知更集中,然后通过将位置关系矩阵X与初始特征A进行矩阵乘法得到最终特征图E1。通道注意力是同理是训练特征图每个维度的权重,得到通道关系矩阵Y,使得模型可以集中感知重要通道,然后通过将通道关系矩阵Y与初始特征A进行矩阵乘法得到最终特征图E2。在注意力机制后面接入两组全连接层,一组全连接层最后的输出是图像分数标签类别数,一组全连接层最后的输出是图像分数标签。类别数目由数据集标签分布来确定,尽可能使得各个类别的数目相同。整个训练包括两个部分,首先训练图像特征提取部分、自注意力部分和图像分类部分,然后固定当前模型参数,只训练图像分数标签回归部分。整个训练采用SGD随机梯度下降法寻找最优参数,SGD的学习率设置是通过正弦函数的规律设置。由此设置来训练模型。
步骤(23)将上过程依次完成,在步骤(22)注意力机制后面增加两组全连接层,其中一组全连接层的最后输出为图像分数分类数目,另一组全连接B层的最后输出为图像分数回归标签;
步骤(24)整个模型训练过程包括:首先训练步骤(21)、(22)中的特征提取部分和步骤(23)图像分数分类部分全连接层,分类误差采用Softmax误差公式进行计算,梯度回传只考虑分类的结果;然后固定神经网络模型参数,只训练步骤(23)图像分数回归部分全连接层,回归误差采用欧式误差公式进行计算,在梯度回传的时候损失函数需要将图像分数分类的结果与图像分数回归的结果结合,公式如下:
LOSS=loss1+λloss2
其中,loss1为图像分数回归损失,公式如下:
Figure BDA0002396286100000061
其中,ej为神经网络模型最后一个神经元的输出;ei为第i个神经元的输出,n为神经元个数;
loss2为图像分数分类损失,其公式如下:
Figure BDA0002396286100000062
其中,
Figure BDA0002396286100000063
为模型预测值,yi为真实值,λ为权重系数;
步骤(25)整个训练过程采用随机梯度下降法(SGD)寻找最优参数,训练神经网络模型,随机梯度下降法中的学习率变化是采用正弦函数的规律来设置,最终得到神经网络模型。
进一步的,步骤(3)所述模型的测试和预测采取以下步骤:
步骤(31)将测试集中的样本图像经过预处理得到一个新的图像A;
步骤(32)将新的图像A经过训练好的神经网络模型,模型通过正向计算得到图像分数预测结果;用模型输出测试集的结果和测试集的真实分数作对比,从而测试模型的欧式距离和相关性系数。
本发明通过增加注意力机制,模型对特征图的感知更加集中,过滤掉贡献小的特征,再通过图像分数标签分类指导粒度更加细致的分数标签回归,图像分数标签回归任务的好坏是通过计算相关系数和均分误差的大小来评估,通过真实实验测试都可以取得更好的结果。。
总之,本发明中提出的基于深度卷积神经网络的图像分数标签预测方法能够自动对图像分数标签做出预测。通过实验显示出本发明提出的方法能优于一般的图像分数标签预测方法。
应用举例:本发明的***及方法已经成功应用于图像质量评价的应用之中,其在工业设计、服装设计、产品设计、影像视觉、城市规划、环境保护等多个方面有重要的应用前景。比如自动识别拍摄,把摄像机再搭配上模型,就可以捕捉出非常好的照片,不用摄影师一直等待时机去捕捉场景,而可以自动采集高质量的照片;比如在产品设计,城市规划中可以对海选作品进行辅助判断。

Claims (4)

1.一种基于深度卷积神经网络的图像分数标签预测方法,其特征在于,包括如下步骤:
步骤(1),随机将数据集中80%数量的图片作为训练集,剩余的20%作为测试集;进行数据集预处理,首先将具有图像分数标签的数据集中的图像进行预处理,预处理包括图像大小变换、图像随机旋转和图像归一化;由此得到图像像素大小一致,包括图像分数标签的训练集和测试集;
步骤(2),进行深度卷积神经网络模型训练,首先根据图像的特征和图像分数标签预测的标准,设计一个深度卷积神经网络模型,然后利用训练集中的样本图像进行学习训练,通过深度学习方法训练深度卷积神经网络模型,作为图像标签预测模型;
步骤(3)进行深度卷积神经网络模型评估与测试,首先对测试集中的样本图像调用步骤(1)预处理后的图像,然后调用步骤(2)中得到的图像分数标签预测模型,从而预测出图像的质量分数。
2.根据权利要求1所述的一种基于深度卷积神经网络的图像分数标签预测方法,其特征在于:步骤(1)所述图像预处理方法采取以下步骤:
步骤(11)将训练集中原图像进行图像裁剪、图像缩放,将原始图像的像素大小变换到一个固定尺寸,这个尺寸和步骤(2)所设计的深度卷积神经网络所要求的输入尺寸保持一致;
步骤(12)将训练集中原始图像根据通道归一化,首先统计出训练集中的样本图像的不同通道的均值,然后对每一个样本图像对应通道做去均值操作。
3.根据权利要求1所述的一种基于深度卷积神经网络的图像分数标签预测方法,其特征在于:步骤(2)所述深度卷积神经网络模型训练过程如下:
步骤(21)使用Resnet网络作为基础网络,由残差块堆叠50层而得到Resnet50网络,网络的残差块是通过在两个卷积层之间增加短连接来拟合残差;
步骤(22)模型在Resent50网络的特征提取部分后面增加了注意力机制部分;注意力机制包括两个部分,位置注意力和通道注意力;位置注意力是在最后一层特征图上进行1*1的卷积操作,经过训练即可得到特征图上每一个位置的权重,通道注意力是对特征提取最后一层的每个通道上计算权重,得到对最终结果影响最大的几个通道;
步骤(23)将上过程依次完成,在步骤(22)注意力机制后面增加两组全连接层,其中一组全连接层的最后输出为图像分数分类数目,另一组全连接B层的最后输出为图像分数回归标签;
步骤(24)整个模型训练过程包括:首先训练步骤(21)、(22)中的特征提取部分和步骤(23)图像分数分类部分全连接层,分类误差采用Softmax误差公式进行计算,梯度回传只考虑分类的结果;然后固定神经网络模型参数,只训练步骤(23)图像分数回归部分全连接层,回归误差采用欧式误差公式进行计算,在梯度回传的时候损失函数需要将图像分数分类的结果与图像分数回归的结果结合,公式如下:
LOSS=loss1+λloss2
其中,loss1为图像分数回归损失,公式如下:
Figure FDA0002396286090000021
其中,ej为神经网络模型最后一个神经元的输出;ei为第i个神经元的输出,n为神经元个数;
loss2为图像分数分类损失,其公式如下:
Figure FDA0002396286090000022
其中,
Figure FDA0002396286090000023
为模型预测值,yi为真实值,λ为权重系数;
步骤(25)整个训练过程采用随机梯度下降法(SGD)寻找最优参数,训练神经网络模型,随机梯度下降法中的学习率变化是采用正弦函数的规律来设置,最终得到神经网络模型。
4.根据权利要求1所述的一种基于深度卷积神经网络的图像分数标签预测方法,其特征在于:步骤(3)所述模型的测试和预测采取以下步骤:
步骤(31)将测试集中的样本图像经过预处理得到一个新的图像A;
步骤(32)将新的图像A经过训练好的神经网络模型,模型通过正向计算得到图像分数预测结果;用模型输出测试集的结果和测试集的真实分数作对比,从而测试模型的欧式距离和相关性系数。
CN202010132930.8A 2020-02-29 2020-02-29 一种基于深度卷积神经网络的图像分数标签预测方法 Pending CN111340123A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010132930.8A CN111340123A (zh) 2020-02-29 2020-02-29 一种基于深度卷积神经网络的图像分数标签预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010132930.8A CN111340123A (zh) 2020-02-29 2020-02-29 一种基于深度卷积神经网络的图像分数标签预测方法

Publications (1)

Publication Number Publication Date
CN111340123A true CN111340123A (zh) 2020-06-26

Family

ID=71183971

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010132930.8A Pending CN111340123A (zh) 2020-02-29 2020-02-29 一种基于深度卷积神经网络的图像分数标签预测方法

Country Status (1)

Country Link
CN (1) CN111340123A (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111858340A (zh) * 2020-07-23 2020-10-30 深圳慕智科技有限公司 一种基于稳定性变换的深度神经网络测试数据生成方法
CN111914938A (zh) * 2020-08-06 2020-11-10 上海金桥信息股份有限公司 一种基于全卷积二分支网络的图像属性分类识别方法
CN112287965A (zh) * 2020-09-21 2021-01-29 卓尔智联(武汉)研究院有限公司 图像质量检测模型训练方法、装置和计算机设备
CN112488234A (zh) * 2020-12-10 2021-03-12 武汉大学 一种基于注意力池化的端到端组织病理图像分类方法
CN112801940A (zh) * 2020-12-31 2021-05-14 深圳市联影高端医疗装备创新研究院 模型评测方法、装置、设备及介质
CN113139464A (zh) * 2021-04-23 2021-07-20 国网山东省电力公司青岛市即墨区供电公司 一种电网故障检测方法
CN113191452A (zh) * 2021-05-21 2021-07-30 中国矿业大学(北京) 一种基于深度学习的煤灰分在线检测***及其检测方法
CN113222032A (zh) * 2021-05-19 2021-08-06 西安电子科技大学 基于自注意图像编码的无参考图像质量评价方法
CN113361636A (zh) * 2021-06-30 2021-09-07 山东建筑大学 一种图像分类方法、***、介质及电子设备
CN113469233A (zh) * 2021-06-23 2021-10-01 临沂大学 基于深度学习的烟叶自动定级方法及***
CN113554327A (zh) * 2021-07-29 2021-10-26 上海千内云教育软件科技有限公司 一种基于深度学习的素描作品智能分档以及量化评分方法
CN113592812A (zh) * 2021-07-29 2021-11-02 华南师范大学 一种素描图片评价方法及装置
CN116777892A (zh) * 2023-07-03 2023-09-19 东莞市震坤行胶粘剂有限公司 基于视觉检测的点胶质量检测方法及其***
WO2023201509A1 (en) * 2022-04-19 2023-10-26 Paypal, Inc. Document image quality detection

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107610123A (zh) * 2017-10-11 2018-01-19 中共中央办公厅电子科技学院 一种基于深度卷积神经网络的图像美学质量评价方法
CN108564097A (zh) * 2017-12-05 2018-09-21 华南理工大学 一种基于深度卷积神经网络的多尺度目标检测方法
CN110245665A (zh) * 2019-05-13 2019-09-17 天津大学 基于注意力机制的图像语义分割方法
CN110473164A (zh) * 2019-05-31 2019-11-19 北京理工大学 一种基于注意力机制的图像美学质量评价方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107610123A (zh) * 2017-10-11 2018-01-19 中共中央办公厅电子科技学院 一种基于深度卷积神经网络的图像美学质量评价方法
CN108564097A (zh) * 2017-12-05 2018-09-21 华南理工大学 一种基于深度卷积神经网络的多尺度目标检测方法
CN110245665A (zh) * 2019-05-13 2019-09-17 天津大学 基于注意力机制的图像语义分割方法
CN110473164A (zh) * 2019-05-31 2019-11-19 北京理工大学 一种基于注意力机制的图像美学质量评价方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JUN FU 等: "Dual Attention Network for Scene Segmentation" *

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111858340A (zh) * 2020-07-23 2020-10-30 深圳慕智科技有限公司 一种基于稳定性变换的深度神经网络测试数据生成方法
CN111914938A (zh) * 2020-08-06 2020-11-10 上海金桥信息股份有限公司 一种基于全卷积二分支网络的图像属性分类识别方法
CN111914938B (zh) * 2020-08-06 2024-01-30 上海金桥信息股份有限公司 一种基于全卷积二分支网络的图像属性分类识别方法
CN112287965A (zh) * 2020-09-21 2021-01-29 卓尔智联(武汉)研究院有限公司 图像质量检测模型训练方法、装置和计算机设备
CN112488234A (zh) * 2020-12-10 2021-03-12 武汉大学 一种基于注意力池化的端到端组织病理图像分类方法
CN112488234B (zh) * 2020-12-10 2022-04-29 武汉大学 一种基于注意力池化的端到端组织病理图像分类方法
CN112801940A (zh) * 2020-12-31 2021-05-14 深圳市联影高端医疗装备创新研究院 模型评测方法、装置、设备及介质
CN112801940B (zh) * 2020-12-31 2024-07-02 深圳市联影高端医疗装备创新研究院 模型评测方法、装置、设备及介质
CN113139464A (zh) * 2021-04-23 2021-07-20 国网山东省电力公司青岛市即墨区供电公司 一种电网故障检测方法
CN113222032A (zh) * 2021-05-19 2021-08-06 西安电子科技大学 基于自注意图像编码的无参考图像质量评价方法
CN113222032B (zh) * 2021-05-19 2023-03-10 西安电子科技大学 基于自注意图像编码的无参考图像质量评价方法
CN113191452A (zh) * 2021-05-21 2021-07-30 中国矿业大学(北京) 一种基于深度学习的煤灰分在线检测***及其检测方法
CN113469233A (zh) * 2021-06-23 2021-10-01 临沂大学 基于深度学习的烟叶自动定级方法及***
CN113469233B (zh) * 2021-06-23 2024-05-07 临沂大学 基于深度学习的烟叶自动定级方法及***
CN113361636A (zh) * 2021-06-30 2021-09-07 山东建筑大学 一种图像分类方法、***、介质及电子设备
CN113361636B (zh) * 2021-06-30 2022-09-20 山东建筑大学 一种图像分类方法、***、介质及电子设备
CN113554327A (zh) * 2021-07-29 2021-10-26 上海千内云教育软件科技有限公司 一种基于深度学习的素描作品智能分档以及量化评分方法
CN113592812A (zh) * 2021-07-29 2021-11-02 华南师范大学 一种素描图片评价方法及装置
WO2023201509A1 (en) * 2022-04-19 2023-10-26 Paypal, Inc. Document image quality detection
CN116777892B (zh) * 2023-07-03 2024-01-26 东莞市震坤行胶粘剂有限公司 基于视觉检测的点胶质量检测方法及其***
CN116777892A (zh) * 2023-07-03 2023-09-19 东莞市震坤行胶粘剂有限公司 基于视觉检测的点胶质量检测方法及其***

Similar Documents

Publication Publication Date Title
CN111340123A (zh) 一种基于深度卷积神经网络的图像分数标签预测方法
CN111639692B (zh) 一种基于注意力机制的阴影检测方法
Deng et al. Image aesthetic assessment: An experimental survey
CN106126585B (zh) 基于质量分级与感知哈希特征组合的无人机图像检索方法
CN110569814B (zh) 视频类别识别方法、装置、计算机设备及计算机存储介质
CN111639564B (zh) 一种基于多注意力异构网络的视频行人重识别方法
CN109657715B (zh) 一种语义分割方法、装置、设备及介质
CN111612024B (zh) 特征提取方法、装置、电子设备及计算机可读存储介质
CN108491856B (zh) 一种基于多尺度特征卷积神经网络的图像场景分类方法
CN111680705B (zh) 适于目标检测的mb-ssd方法和mb-ssd特征提取网络
CN111401374A (zh) 基于多任务的模型训练方法、字符识别方法及装置
CN111652273B (zh) 一种基于深度学习的rgb-d图像分类方法
CN112507853B (zh) 一种基于互注意力机制的跨模态行人重识别方法
CN110827312A (zh) 一种基于协同视觉注意力神经网络的学习方法
CN114360067A (zh) 一种基于深度学习的动态手势识别方法
CN110852199A (zh) 一种基于双帧编码解码模型的前景提取方法
CN111368637B (zh) 一种基于多掩模卷积神经网络的搬运机器人识别目标方法
CN111126155B (zh) 一种基于语义约束生成对抗网络的行人再识别方法
CN115063832A (zh) 一种基于全局与局部特征的对抗学习跨模态行人重识别方法
Zhou et al. Attention transfer network for nature image matting
CN114627424A (zh) 一种基于视角转化的步态识别方法和***
CN112132839B (zh) 一种基于深度卷积级联网络的多尺度快速人脸分割方法
CN116977859A (zh) 基于多尺度图像切割和实例困难度的弱监督目标检测方法
CN112528077A (zh) 基于视频嵌入的视频人脸检索方法及***
CN109583584B (zh) 可使具有全连接层的cnn接受不定形状输入的方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20200626

WD01 Invention patent application deemed withdrawn after publication