CN113139577B - 一种基于可变形卷积网络的深度学习图像分类方法及*** - Google Patents

一种基于可变形卷积网络的深度学习图像分类方法及*** Download PDF

Info

Publication number
CN113139577B
CN113139577B CN202110303551.5A CN202110303551A CN113139577B CN 113139577 B CN113139577 B CN 113139577B CN 202110303551 A CN202110303551 A CN 202110303551A CN 113139577 B CN113139577 B CN 113139577B
Authority
CN
China
Prior art keywords
layer
image
convolution
gray
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110303551.5A
Other languages
English (en)
Other versions
CN113139577A (zh
Inventor
刘伟鑫
徐晨
周松斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Intelligent Manufacturing of Guangdong Academy of Sciences
Original Assignee
Institute of Intelligent Manufacturing of Guangdong Academy of Sciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Intelligent Manufacturing of Guangdong Academy of Sciences filed Critical Institute of Intelligent Manufacturing of Guangdong Academy of Sciences
Priority to CN202110303551.5A priority Critical patent/CN113139577B/zh
Publication of CN113139577A publication Critical patent/CN113139577A/zh
Application granted granted Critical
Publication of CN113139577B publication Critical patent/CN113139577B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于可变形卷积网络的深度学习图像分类方法及***,涉及计算机视觉图像识别领域,该方法包括以下步骤:步骤S1:将所有图像缩放至90*90大小,并分为训练集和测试集;步骤S2:设定可变形卷积网络结构;步骤S3:将可变形卷积网络结构第二层和第四层的卷积核按照一定规则丢弃部分卷积核参数;步骤S4:根据网络模型对训练集数据进行训练;步骤S5:将训练好的模型对测试集数据进行分类识别(假设要分N类图像)。本发明方法通过一定规则的处理,丢弃网络中部分卷积核参数,提高网络的关键信息提取能力,减少网络参数、运算量,提高网络分类准确率的同时,提高网络运行效率。

Description

一种基于可变形卷积网络的深度学习图像分类方法及***
技术领域
本发明涉及计算机视觉图像识别领域,尤其是涉及一种基于可变形卷积网络的深度学习图像分类方法及***。
背景技术
近年来深度学习在学术界、科技界应用广泛,尤其在图像领域,目前已经在图像分类领域取得较大进展,取得不错成效。人类在观察环境时,大脑往往只关注某几个特别重要的局部,获取关键信息,去除无关紧要的信息,但目前的主流的深度学习网络如VGG16、ALexNet、GoogleNet等对图像关键信息提取能力都较弱,在提取图像有用特征信息的同时包含了部分的无关信息,影响了网络模型的性能。
发明内容
有鉴于此,有必要针对上述问题,提供一种基于可变形卷积网络的深度学习图像分类方法及***,其根据分类图像的特征信息自动设计卷积核,丢弃部分参数,实现提高网络关键特征信息提取能力的同时,减少网络运行算,提高网络运行效率。
为实现上述目的,本发明提供以下技术方案:
一方面,本发明提供一种基于可变形卷积网络的深度学习图像分类方法,包括以下步骤:
步骤S1:将所有图像缩放至90*90大小,并分为训练集和测试集;
步骤S2:设定可变形卷积网络结构;
步骤S3:将可变形卷积网络结构的第二层和第四层的卷积核按照一定规则丢弃部分卷积核参数:
步骤S4:根据网络模型对训练集数据进行训练;
步骤S5:将训练好的模型对测试集数据进行分类识别。
进一步地,步骤S2中,可变形卷积网络结构具体为:第1层为输入层,输入90*90的图片;第2层为卷积层,卷积核个数为16,卷积核大小为9*9;第3层为最大值池化层,核大小为2*2;第4层为卷积层,卷积核个数为16,卷积核大小为9*9;第5层为最大值池化层,核大小为2*2;第6、7层为全连接层,分别为120个和84个神经节点;第8层为输出层,输出节点为N。
进一步地,步骤S3中,可变形卷积网络结构的第二层和第四层的卷积核按照如下规则丢弃部分卷积核参数:
①将训练集每张图片转换为灰度图,再转换为二值图片,然后将90*90的二值图片压缩至9*9灰度图,再求二值图;
②然后将①中所有9*9的二值图片相加,二值图片的白色点值为1,黑色点值为0;具体为图片每个像素点对应位置像素值相加,再除以训练集图片数量,然后每个像素点乘以255,得到9*9的平均灰度图Gray;
③求平均灰度图Gray的图像灰度均值Mean,然后以Mean为阈值对平均灰度图Gray进行二值化操作,得到9*9的二值图C;
④第二层、第四层的9*9卷积核参数丢弃部分对应9*9二值图C中像素值为0的像素位置。
进一步地,所述二值化操作采用大津法二值化方法。
进一步地,所述图像缩放采用opencv的resize()函数,选择最近邻插值方式。
另一方面,本发明还提供一种基于可变形卷积网络的深度学习图像分类***,包括:
图像缩放模块,用于将所有图像缩放至90*90大小,并分为训练集和测试集;
网络结构设定模块,用于设定可变形卷积网络结构;
参数丢弃模块,用于将可变形卷积网络结构的第二层和第四层的卷积核按照一定规则丢弃部分卷积核参数:
模型训练模块,用于根据网络模型对训练集数据进行训练;
分类识别模块,用于将训练好的模型对测试集数据进行分类识别。
进一步地,可变形卷积网络结构具体为:第1层为输入层,输入90*90的图片;第2层为卷积层,卷积核个数为16,卷积核大小为9*9;第3层为最大值池化层,核大小为2*2;第4层为卷积层,卷积核个数为16,卷积核大小为9*9;第5层为最大值池化层,核大小为2*2;第6、7层为全连接层,分别为120个和84个神经节点;第8层为输出层,输出节点为N。
进一步地,可变形卷积网络结构的第二层和第四层的卷积核按照如下规则丢弃部分卷积核参数:
①将训练集每张图片转换为灰度图,再转换为二值图片,然后将90*90的二值图片压缩至9*9灰度图,再求二值图;
②然后将①中所有9*9的二值图片相加,二值图片的白色点值为1,黑色点值为0;具体为图片每个像素点对应位置像素值相加,再除以训练集图片数量,然后每个像素点乘以255,得到9*9的平均灰度图Gray;
③求平均灰度图Gray的图像灰度均值Mean,然后以Mean为阈值对平均灰度图Gray进行二值化操作,得到9*9的二值图C;
④第二层、第四层的9*9卷积核参数丢弃部分对应9*9二值图C中像素值为0的像素位置。
进一步地,所述二值化操作采用大津法二值化方法。
进一步地,所述图像缩放采用opencv的resize()函数,选择最近邻插值方式。
与现有技术相比,本发明的优点和积极效果至少包括:
(1)本发明根据分类图像的特征信息自动设计卷积核,丢弃部分参数,实现提高网络关键特征信息提取能力的同时,减少网络运行算,提高网络运行效率;
(2)本发明适用于其他图像分类任务,具有一定的通用性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明基于可变形卷积网络的深度学习图像分类方法的流程示意图;
图2是本发明基于可变形卷积网络的深度学习图像分类方法采用的网络结构示意图;
图3是本发明基于可变形卷积网络的深度学习图像分类***的结构示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面将结合附图和具体的实施例对本发明的技术方案进行详细说明。需要指出的是,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
为对本发明内容进行具体说明,本实施例以CIFAR-10数据集作一个10分类的问题作实例。
需要说明的是,本实施例中所使用的具体数字,仅仅是本实施例中所使用的一组可能的或较优的搭配,但并不能因此而理解为对本发明专利范围的限制;应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明的保护范围应以所附权利要求为准。
如图1所示,本实施例提供一种基于可变形卷积网络的深度学习图像分类方法,包括以下步骤:
步骤S1:CIFAR-10数据集一共有10种图片,包括(飞机、汽车、鸟类、猫、鹿、狗、蛙类、马、船和卡车),将所有图像缩放至90*90大小,并分为训练集和测试集;
步骤S2:设定网络结构:第1层为输入层,输入90*90的图片;第2层为卷积层,卷积核个数为16,卷积核大小为9*9;第3层为最大值池化层,核大小为2*2;第4层为卷积层,卷积核个数为16,卷积核大小为9*9;第5层为最大值池化层,核大小为2*2;第6、7层为全连接层,分别为120个和84个神经节点;第8层为输出层,输出节点为N,如图2所示。
步骤S3:步骤S2中第二层和第四层的卷积核按照如下规则丢弃部分卷积核参数:
①将训练集每张图片转换为灰度图,再转换为二值图片,然后将90*90的二值图片压缩至9*9灰度图,再求二值图;
②然后将①中所有9*9的二值图片(白色点值为1,黑色点值为0)相加,具体为图片每个像素点对应位置像素值相加,再除以训练集图片数量,然后每个像素点乘以255,得到9*9的平均灰度图Gray;
③求平均灰度图Gray的图像灰度均值Mean,然后以Mean为阈值对平均灰度图Gray进行二值化操作,得到9*9的二值图C;
④第二层、第四层的9*9卷积核参数丢弃部分对应9*9二值图C中像素值为0的像素位置。
步骤S4:根据网络模型对训练集数据进行训练;
步骤S5:将训练好的模型对测试集数据进行分类识别,得到分类识别结果。
本发明方法基于CIFAR-10数据集与AlexNet、VGG16、GoogleNet三种主流的深度学习算法进行对比测试。
表1四种方法测试结果对比
方法 准确率
本发明方法 98.83%
AlexNet 92.34%
VGG16 96.71%
GoogleNet 97.45%
由上表1可以看出,本发明方法准确率高于目前主流深度学习网络AlexNet、VGG16、GoogleNet。
实施例2
为对本发明内容进行具体说明,本实施例以CIFAR-10数据集作一个10分类的问题作实例。
如图3所示,本实施例提供一种基于可变形卷积网络的深度学习图像分类***,包括图像缩放模块、网络结构设定模块、参数丢弃模块、模型训练模块和分类识别模块;
图像缩放模块:CIFAR-10数据集一共有10种图片,包括(飞机、汽车、鸟类、猫、鹿、狗、蛙类、马、船和卡车),将所有图像缩放至90*90大小,并分为训练集和测试集;
网络结构设定模块:设定网络结构,第1层为输入层,输入90*90的图片;第2层为卷积层,卷积核个数为16,卷积核大小为9*9;第3层为最大值池化层,核大小为2*2;第4层为卷积层,卷积核个数为16,卷积核大小为9*9;第5层为最大值池化层,核大小为2*2;第6、7层为全连接层,分别为120个和84个神经节点;第8层为输出层,输出节点为N,如图2所示。
参数丢弃模块:将网络结构的第二层和第四层的卷积核按照如下规则丢弃部分卷积核参数:
①将训练集每张图片转换为灰度图,再转换为二值图片,然后将90*90的二值图片压缩至9*9灰度图,再求二值图;
②然后将①中所有9*9的二值图片(白色点值为1,黑色点值为0)相加,具体为图片每个像素点对应位置像素值相加,再除以训练集图片数量,然后每个像素点乘以255,得到9*9的平均灰度图Gray;
③求平均灰度图Gray的图像灰度均值Mean,然后以Mean为阈值对平均灰度图Gray进行二值化操作,得到9*9的二值图C;
④第二层、第四层的9*9卷积核参数丢弃部分对应9*9二值图C中像素值为0的像素位置。
模型训练模块:根据网络模型对训练集数据进行训练;
分类识别模块:将训练好的模型对测试集数据进行分类识别,得到分类识别结果。
本发明的优点和积极效果至少包括:
(1)本发明根据分类图像的特征信息自动设计卷积核,丢弃部分参数,实现提高网络关键特征信息提取能力的同时,减少网络运行算,提高网络运行效率;
(2)本发明适用于其他图像分类任务,具有一定的通用性。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明的保护范围应以所附权利要求为准。

Claims (8)

1.一种基于可变形卷积网络的深度学习图像分类方法,其特征在于,包括以下步骤:
步骤S1:将所有图像缩放至90*90大小,并分为训练集和测试集;
步骤S2:设定可变形卷积网络结构;
步骤S3:将可变形卷积网络结构的第二层和第四层的卷积核按照一定规则丢弃部分卷积核参数,具体包括:
①将训练集每张图片转换为灰度图,再转换为二值图片,然后将90*90的二值图片压缩至9*9灰度图,再求二值图;
②然后将①中所有9*9的二值图片相加,二值图片的白色点值为1,黑色点值为0;具体为图片每个像素点对应位置像素值相加,再除以训练集图片数量,然后每个像素点乘以255,得到9*9的平均灰度图Gray;
③求平均灰度图Gray的图像灰度均值Mean,然后以Mean为阈值对平均灰度图Gray进行二值化操作,得到9*9的二值图C;
④第二层、第四层的9*9卷积核参数丢弃部分对应9*9二值图C中像素值为0的像素位置;
步骤S4:根据网络模型对训练集数据进行训练;
步骤S5:将训练好的模型对测试集数据进行分类识别。
2.根据权利要求1所述的基于可变形卷积网络的深度学习图像分类方法,其特征在于,步骤S2中,可变形卷积网络结构具体为:第1层为输入层,输入90*90的图片;第2层为卷积层,卷积核个数为16,卷积核大小为9*9;第3层为最大值池化层,核大小为2*2;第4层为卷积层,卷积核个数为16,卷积核大小为9*9;第5层为最大值池化层,核大小为2*2;第6、7层为全连接层,分别为120个和84个神经节点;第8层为输出层,输出节点为N。
3.根据权利要求1所述的基于可变形卷积网络的深度学习图像分类方法,其特征在于,所述二值化操作采用大津法二值化方法。
4.根据权利要求1所述的基于可变形卷积网络的深度学习图像分类方法,其特征在于,所述图像缩放采用opencv的resize()函数,选择最近邻插值方式。
5.一种基于可变形卷积网络的深度学习图像分类***,其特征在于,包括:
图像缩放模块,用于将所有图像缩放至90*90大小,并分为训练集和测试集;
网络结构设定模块,用于设定可变形卷积网络结构;
参数丢弃模块,用于将可变形卷积网络结构的第二层和第四层的卷积核按照一定规则丢弃部分卷积核参数,具体包括:
①将训练集每张图片转换为灰度图,再转换为二值图片,然后将90*90的二值图片压缩至9*9灰度图,再求二值图;
②然后将①中所有9*9的二值图片相加,二值图片的白色点值为1,黑色点值为0;具体为图片每个像素点对应位置像素值相加,再除以训练集图片数量,然后每个像素点乘以255,得到9*9的平均灰度图Gray;
③求平均灰度图Gray的图像灰度均值Mean,然后以Mean为阈值对平均灰度图Gray进行二值化操作,得到9*9的二值图C;
④第二层、第四层的9*9卷积核参数丢弃部分对应9*9二值图C中像素值为0的像素位置;
模型训练模块,用于根据网络模型对训练集数据进行训练;
分类识别模块,用于将训练好的模型对测试集数据进行分类识别。
6.根据权利要求5所述的基于可变形卷积网络的深度学习图像分类***,其特征在于,可变形卷积网络结构具体为:第1层为输入层,输入90*90的图片;第2层为卷积层,卷积核个数为16,卷积核大小为9*9;第3层为最大值池化层,核大小为2*2;第4层为卷积层,卷积核个数为16,卷积核大小为9*9;第5层为最大值池化层,核大小为2*2;第6、7层为全连接层,分别为120个和84个神经节点;第8层为输出层,输出节点为N。
7.根据权利要求6所述的基于可变形卷积网络的深度学习图像分类***,其特征在于,所述二值化操作采用大津法二值化方法。
8.根据权利要求7所述的基于可变形卷积网络的深度学习图像分类***,其特征在于,所述图像缩放采用opencv的resize()函数,选择最近邻插值方式。
CN202110303551.5A 2021-03-22 2021-03-22 一种基于可变形卷积网络的深度学习图像分类方法及*** Active CN113139577B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110303551.5A CN113139577B (zh) 2021-03-22 2021-03-22 一种基于可变形卷积网络的深度学习图像分类方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110303551.5A CN113139577B (zh) 2021-03-22 2021-03-22 一种基于可变形卷积网络的深度学习图像分类方法及***

Publications (2)

Publication Number Publication Date
CN113139577A CN113139577A (zh) 2021-07-20
CN113139577B true CN113139577B (zh) 2024-02-23

Family

ID=76810271

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110303551.5A Active CN113139577B (zh) 2021-03-22 2021-03-22 一种基于可变形卷积网络的深度学习图像分类方法及***

Country Status (1)

Country Link
CN (1) CN113139577B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114022714B (zh) * 2021-11-11 2024-04-16 哈尔滨工程大学 一种基于Harris的数据增强图像分类方法及***

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108510467A (zh) * 2018-03-28 2018-09-07 西安电子科技大学 基于深度可变形卷积神经网络的sar图像目标识别方法
CN109086799A (zh) * 2018-07-04 2018-12-25 江苏大学 一种基于改进卷积神经网络模型AlexNet的作物叶片病害识别方法
CN109522949A (zh) * 2018-11-07 2019-03-26 北京交通大学 目标识别模型建立方法及装置
CN109871799A (zh) * 2019-02-02 2019-06-11 浙江万里学院 一种基于深度学习的驾驶员玩手机行为的检测方法
CN110222817A (zh) * 2019-05-10 2019-09-10 上海交通大学 基于学习自动机的卷积神经网络压缩方法、***及介质
CN110427922A (zh) * 2019-09-03 2019-11-08 陈�峰 一种基于机器视觉和卷积神经网络病虫害识别***和方法
CN110598731A (zh) * 2019-07-31 2019-12-20 浙江大学 一种基于结构化剪枝的高效图像分类方法
CN111027626A (zh) * 2019-12-11 2020-04-17 西安电子科技大学 基于可变形卷积网络的流场识别方法
CN111368684A (zh) * 2020-02-27 2020-07-03 北华航天工业学院 一种基于可变形全卷积神经网络的冬小麦自动解译方法
CN112465810A (zh) * 2020-12-15 2021-03-09 华南农业大学 一种纺织品疵点的检测分类方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108510467A (zh) * 2018-03-28 2018-09-07 西安电子科技大学 基于深度可变形卷积神经网络的sar图像目标识别方法
CN109086799A (zh) * 2018-07-04 2018-12-25 江苏大学 一种基于改进卷积神经网络模型AlexNet的作物叶片病害识别方法
CN109522949A (zh) * 2018-11-07 2019-03-26 北京交通大学 目标识别模型建立方法及装置
CN109871799A (zh) * 2019-02-02 2019-06-11 浙江万里学院 一种基于深度学习的驾驶员玩手机行为的检测方法
CN110222817A (zh) * 2019-05-10 2019-09-10 上海交通大学 基于学习自动机的卷积神经网络压缩方法、***及介质
CN110598731A (zh) * 2019-07-31 2019-12-20 浙江大学 一种基于结构化剪枝的高效图像分类方法
CN110427922A (zh) * 2019-09-03 2019-11-08 陈�峰 一种基于机器视觉和卷积神经网络病虫害识别***和方法
CN111027626A (zh) * 2019-12-11 2020-04-17 西安电子科技大学 基于可变形卷积网络的流场识别方法
CN111368684A (zh) * 2020-02-27 2020-07-03 北华航天工业学院 一种基于可变形全卷积神经网络的冬小麦自动解译方法
CN112465810A (zh) * 2020-12-15 2021-03-09 华南农业大学 一种纺织品疵点的检测分类方法

Also Published As

Publication number Publication date
CN113139577A (zh) 2021-07-20

Similar Documents

Publication Publication Date Title
CN110992275B (zh) 一种基于生成对抗网络的细化单幅图像去雨方法
CN110555372A (zh) 数据录入方法、装置、设备及存储介质
CN107292458B (zh) 一种应用于神经网络芯片的预测方法和预测装置
JP6341650B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP2008542911A (ja) メトリック埋め込みによる画像比較
JP2014041476A (ja) 画像処理装置、画像処理方法及びプログラム
CN113781510B (zh) 边缘检测方法、装置及电子设备
JP6107531B2 (ja) 特徴抽出プログラム及び情報処理装置
US11605210B2 (en) Method for optical character recognition in document subject to shadows, and device employing method
CN109740553B (zh) 一种基于识别的图像语义分割数据筛选方法及***
CN112560901A (zh) 一种基于图像预处理与对抗训练结合的防御对抗样本的方法
CN113139577B (zh) 一种基于可变形卷积网络的深度学习图像分类方法及***
CN105354228B (zh) 相似图搜索方法及装置
CN110751191A (zh) 一种图像的分类方法及***
CN113971644A (zh) 基于数据增强策略选择的图像识别方法及装置
CN116363535A (zh) 基于卷积神经网络的无人机航拍影像中的船舶检测方法
CN109003247B (zh) 彩色图像混合噪声的去除方法
CN110728352A (zh) 一种基于深度卷积神经网络的大规模图像分类方法
CN112434731B (zh) 图像识别方法、装置及可读存储介质
CN110349119B (zh) 基于边缘检测神经网络的路面病害检测方法和装置
CN113988148A (zh) 一种数据聚类的方法、***、计算机设备和存储介质
CN115358952B (zh) 一种基于元学习的图像增强方法、***、设备和存储介质
CN116091844A (zh) 一种基于边缘计算的图像数据处理方法及***
CN116245765A (zh) 基于增强型深度扩张卷积神经网络的图像去噪方法及***
CN110288604B (zh) 基于K-means的图像分割方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant