CN112396613A - 图像分割方法、装置、计算机设备及存储介质 - Google Patents
图像分割方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN112396613A CN112396613A CN202011288874.3A CN202011288874A CN112396613A CN 112396613 A CN112396613 A CN 112396613A CN 202011288874 A CN202011288874 A CN 202011288874A CN 112396613 A CN112396613 A CN 112396613A
- Authority
- CN
- China
- Prior art keywords
- image
- layer
- network
- result
- segmentation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003709 image segmentation Methods 0.000 title claims abstract description 51
- 238000000034 method Methods 0.000 title claims abstract description 51
- 230000011218 segmentation Effects 0.000 claims abstract description 128
- 238000004364 calculation method Methods 0.000 claims abstract description 39
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 30
- 238000000354 decomposition reaction Methods 0.000 claims abstract description 27
- 238000012549 training Methods 0.000 claims description 175
- 238000012360 testing method Methods 0.000 claims description 31
- 230000006870 function Effects 0.000 claims description 26
- 238000011176 pooling Methods 0.000 claims description 26
- 238000012545 processing Methods 0.000 claims description 20
- 239000011800 void material Substances 0.000 claims description 17
- 230000004913 activation Effects 0.000 claims description 12
- 238000005070 sampling Methods 0.000 claims description 12
- 238000013528 artificial neural network Methods 0.000 claims description 8
- 238000005516 engineering process Methods 0.000 abstract description 4
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 238000000605 extraction Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000004891 communication Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000003708 edge detection Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/136—Segmentation; Edge detection involving thresholding
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
本申请实施例属于人工智能领域,涉及一种图像分割方法,包括获取目标图像,并对所述目标图像进行二层小波分解,得到多维图像块;获取预设的空洞卷积神经网络,其中,所述空洞卷积神经网络包括第一层网络和第二层网络,基于所述第一层网络中的编码器对所述多维图像块进行编码处理得到编码结果,基于所述第一层网络的解码器对所述编码结果进行解码处理得到所述目标图像的二值分割结果图;基于所述第二层网络对所述二值分割结果图进行多层卷积计算,得到所述目标图像的语义分割结果图。本申请还提供一种图像分割装置、计算机设备及存储介质。此外,本申请还涉及区块链技术,所述语义分割结果图可存储于区块链中。本申请实现了对图像的精确分割。
Description
技术领域
本申请涉及人工智能技术领域,尤其涉及一种图像分割方法、装置、计算机设备及存储介质。
背景技术
合成孔径雷达(synthetic aperture radar,SAR)作为一种具有距离高分辨率和方位高分辨率能力的成像雷达,在军事领域和民用领域具有广泛的应用。将SAR图像中的感兴趣目标检测出来并且根据目标的轮廓将它与背景分割开来,能够为后续理解分析,制定计划奠定基础。
目前常见的分割方法有最大类间方差法、基于局部混合滤波的边缘检测算法、偏差修正模糊c均值算法等。近年来比较热的一个研究领域是基于深度学习的分割方法,该算法通过深度神经网络来学习图像特征,这种高度抽象的特征更有利于图像分割。该方法通过端到端的深度神经网络,实现了对像素点的分类,然而该方法的缺点是使用线性差值,使得分割时细节结构信息丢失,造成边界模糊。其中,池化层虽然有扩大感受野的作用,但是却造成位置信息的丢失,而在语义分割处理的过程中往往需要保留位置信息。由此,最终导致图像分割时信息提取不够准确的问题。
发明内容
本申请实施例的目的在于提出一种图像分割方法、装置、计算机设备及存储介质,以解决图像分割时信息提取不够准确的技术问题。
为了解决上述技术问题,本申请实施例提供一种图像分割方法,采用了如下所述的技术方案:
获取目标图像,并对所述目标图像进行二层小波分解,得到多维图像块;
获取预设的空洞卷积神经网络,其中,所述空洞卷积神经网络包括第一层网络和第二层网络,基于所述第一层网络中的编码器对所述多维图像块进行编码处理得到编码结果,基于所述第一层网络的解码器对所述编码结果进行解码处理得到所述目标图像的二值分割结果图;
基于所述第二层网络对所述二值分割结果图进行多层卷积计算,得到所述目标图像的语义分割结果图。
进一步的,所述编码器包括第一卷积层、第一空洞卷积层和池化层,所述基于所述第一层网络中的编码器对所述多维图像块进行编码处理得到编码结果的步骤具体包括:
将所述多维图像块依次经过所述第一卷积层、所述第一空洞卷积层和所述池化层,得到池化结果;
通过预设降拟合层对所述池化结果进行降拟合得到所述多维图像块对应的编码结果。
进一步的,所述解码器包括上采样层、第二卷积层和第二空洞卷积成层,所述基于所述第一层网络的解码器对所述编码结果进行解码处理得到所述目标图像的二值分割结果图的步骤具体包括:
在得到所述编码结果时,根据所述上采样层、所述第二卷积层和所述第二空洞卷积成层对所述编码结果进行计算,得到空洞卷积结果;
通过预设激活函数对所述空洞卷积结果进行计算,得到所述目标图像的二值分割结果图。
进一步的,所述基于所述第二层网络对所述二值分割结果图进行多层卷积计算,得到所述目标图像的语义分割结果图的步骤具体包括:
获取所述第一层网络的第一卷积结果,根据所述第一卷积结果对所述二值分割结果图进行掩膜约束,得到掩膜结果;
基于所述第二层网络对所述掩膜结果进行多层卷积计算,得到所述目标图像的语义分割结果图。
进一步的,在所述获取预设的空洞卷积神经网络的步骤之前还包括:
选取预设图像库中预设个数的图像为训练图像,将所述预设图像库中剩余的图像作为测试图像;
获取基础训练网络,根据所述训练图像对所述基础训练网络进行训练,得到训练后的基础训练网络;
根据所述测试图像对所述训练后的基础训练网络进行测试,在所述训练后的基础训练网络对所述测试图像的识别成功率大于等于预设成功率时,确定所述训练后的基础训练网络为所述空洞卷积神经网络。
进一步的,所述根据所述训练图像对所述基础训练网络进行训练,得到训练后的基础训练网络的步骤具体包括:
分解所述训练图像为训练图像块,输入所述训练图像块至所述基础训练网络中得到训练分割图像;
获取所述训练图像的标准分割图像,根据所述训练分割图像和所述标准分割图像对所述基础训练网络进行训练,得到训练后的基础训练网络。
进一步的,所述根据所述训练分割图像和所述标准分割图像对所述基础训练网络进行训练,得到训练后的基础训练网络的步骤具体包括:
获取所述训练分割图像的第一像素个数,以及所述标准分割图像的第二像素个数;
根据所述第一像素个数和所述第二像素个数计算所述基础训练网络的损失函数,在所述损失函数收敛时,确定所述基础训练网络为训练后的基础训练网络。
为了解决上述技术问题,本申请实施例还提供一种图像分割装置,采用了如下所述的技术方案:
分解模块,用于获取目标图像,并对所述目标图像进行二层小波分解,得到多维图像块;
处理模块,用于获取预设的空洞卷积神经网络,其中,所述空洞卷积神经网络包括第一层网络和第二层网络,基于所述第一层网络中的编码器对所述多维图像块进行编码处理得到编码结果,基于所述第一层网络的解码器对所述编码结果进行解码处理得到所述目标图像的二值分割结果图;
计算模块,用于基于所述第二层网络对所述二值分割结果图进行多层卷积计算,得到所述目标图像的语义分割结果图。
为了解决上述技术问题,本申请实施例还提供一种计算机设备,包括存储器和处理器,以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令,所述处理器执行所述计算机可读指令时实现上述图像分割方法的步骤。
为了解决上述技术问题,本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可读指令,所述计算机可读指令被处理器执行时实现上述图像分割方法的步骤。
上述图像分割方法,通过获取目标图像,并对目标图像进行二层小波分解,得到多维图像块,通过分解的多维图像块可以提高图像处理的精度;而后,获取预设的空洞卷积神经网络,其中,空洞卷积神经网络包括第一层网络和第二层网络,基于第一层网络中的编码器对多维图像块进行编码处理得到编码结果,基于第一层网络的解码器对编码结果进行解码处理得到目标图像的二值分割结果图,通过预设的空洞卷积神经网络对多维图像块进行处理,可以在网络参数可控的范围内,增加感受野,使得每个特征图像所包含的信息量越来越大,有助于图像全局信息的提取,避免图像信息的丢失;最后,基于第二层网络对二值分割结果图进行多层卷积计算,得到所述目标图像的语义分割结果图,由此,实现了在图像分割时能够获取到更多的图像信息,提高了局部特征信息提取时图像信号描述的准确度,并且在网络参数可控的范围内,极大地增加了感受野,提高了每个特征所包含的信息量,进一步使得图像信息分割更加精确,获取得到的图像信息更加完整。
附图说明
为了更清楚地说明本申请中的方案,下面将对本申请实施例描述中所需要使用的附图作一个简单介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请可以应用于其中的示例性***架构图;
图2根据本申请的图像分割方法的一个实施例的流程图;
图3是根据本申请的图像分割装置的一个实施例的结构示意图;
图4是根据本申请的计算机设备的一个实施例的结构示意图。
附图标记:图像分割装置300、分解模块301、处理模块302、以及计算模块303。
具体实施方式
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同;本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请;本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
为了使本技术领域的人员更好地理解本申请方案,下面将结合附图,对本申请实施例中的技术方案进行清楚、完整地描述。
如图1所示,***架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving PictureExpertsGroup Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(MovingPictureExperts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上显示的页面提供支持的后台服务器。
需要说明的是,本申请实施例所提供的图像分割方法一般由服务器/终端设备执行,相应地,图像分割装置一般设置于服务器/终端设备中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
继续参考图2,示出了根据本申请的图像分割的方法的一个实施例的流程图。所述的图像分割方法,包括以下步骤:
步骤S201,获取目标图像,并对所述目标图像进行二层小波分解,得到多维图像块;
在本实施例中,获取目标图像,目标图像为包括目标分割信息的图像。在得到目标图像时,对该图像进行二层小波分解。具体地,小波通常为局部特征在有限的区间内取值不为0的信号,小波分解的第一层分解为将图像分为低频信息和高频信息,高频信息为图像强度变化强烈的部分,如图像轮廓;低频信息为图像强度变化平缓的部分,如图像中大色块的地方。在第一层分解的基础上,将低频信息再分解为低频信息和高频信息,即为小波的第二层分解。通过MATLAB可以对目标图像进行二层小波分解,从而得到多维图像块。
步骤S202,获取预设的空洞卷积神经网络,其中,所述空洞卷积神经网络包括第一层网络和第二层网络,基于所述第一层网络中的编码器对所述多维图像块进行编码处理得到编码结果,基于所述第一层网络的解码器对所述编码结果进行解码处理得到所述目标图像的二值分割结果图;
在本实施例中,在得到多维图像块时,获取预设的空洞卷积神经网络,其中,该空洞卷积神经网络包括第一层网络和第二层网络,第一层网络包括编码器和解码器,编码器包括三个第一卷积层、三个第一空洞卷积层和两个池化层,根据编码器对多维图像块进行编码;解码器包括两个上采样层、两个第二卷积层和两个第二空洞卷积成层,基于解码器对编码器输出的编码结果进行解码,最终得到二值分割结果图;第二层网络则包括多个卷积层。根据第一层网络可以得到目标图像对应的二值分割结果图,根据第二层网络则可以对得到二值分割结果图进行多层卷积计算,得到目标图像对应的语义分割图。
步骤S203,基于所述第二层网络对所述二值分割结果图进行多层卷积计算,得到所述目标图像的语义分割结果图。
在本实施例中,在得到二值分割结果图时,根据第二层网络对该二值分割图进行多层卷积计算,得到目标图像的语义分割图。具体地,第二层网络包括第三卷积层、第三空洞卷积层和第四卷积层,在得到二值分割结果图时,获取第一层网络的第一卷积结果,其中,第一卷积结果由第一层网络的编码器中第一次的第一空洞卷积计算得到的第一子空洞卷积结果,经过再次卷积计算得到。将该第一卷积结果和该二值分割结果图进行相乘,得到相乘结果。输入该相乘结果至第三卷积层,按照第三卷积层、第三空洞卷积层和第四卷积层的顺序,将前一层的输出结果作为后一层的输入计算,由此得到最终的语义分割结果图,该语义分割结果图即为目标图像最终分割的结果图。
需要强调的是,为进一步保证上述语义分割结果图信息的私密和安全性,上述语义分割结果图信息还可以存储于一区块链的节点中。
本申请所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
本实施例实现了在图像分割时能够获取到更多的图像信息,提高了局部特征信息提取时图像信号描述的准确度,并且在网络参数可控的范围内,极大地增加了感受野,提高了每个特征所包含的信息量,进一步使得图像信息分割更加精确,获取得到的图像信息更加完整。
在本申请的一些实施例中,上述编码器包括第一卷积层、第一空洞卷积层和池化层,上述基于所述第一层网络中的编码器对所述多维图像块进行编码处理得到编码结果包括:
将所述多维图像块依次经过所述第一卷积层、所述第一空洞卷积层和所述池化层,得到池化结果;
通过预设降拟合层对所述池化结果进行降拟合得到所述多维图像块对应的编码结果。
在本实施例中,第一层网络中的编码器包括第一卷积层、第一空洞卷积层和池化层。在得到多维图像块时,基于第一卷积层对多维图像块进行卷积及激活,得到第一子卷积结果;而后通过第一空洞卷积层对该第一子卷积结果进行空洞卷积及激活,得到第一子空洞卷积结果,最后通过池化层对该第一子空洞卷积结果进行处理,得到子池化结果。其中,第一卷积层、第一空洞卷积层和池化层均为多维处理器,如三维卷积(conv 3*3*3)、三维空洞卷积(3-dilated conv 3*3*3)和三维池化(max pool 2*2*1)。在第一卷积层和第一空洞卷积层计算得到第一子卷积结果和第一子空洞卷积结果前,都会分别对根据第一卷积层和第一空洞卷积层直接计算得到的卷积结果,进行一个relu的激活函数处理,最终分别得到第一子卷积结果和第一子空洞卷积结果。在得到子池化结果时,将该子池化结果作为编码其中第二个第一卷积层的输入,按照第一卷积层、第一空洞卷积层和池化层的顺序,同样将前一层的输出结果作为后一层的输入,计算得到最终的池化结果。在得到该池化结果时,通过预设的降拟合层对该池化结果进行降拟合,得到多维图像块对应的编码结果。其中,降拟合层中包括第一卷积层、第一空洞卷积层和子降拟合层(dropout 0.5),在得到池化结果时,将该池化结果作为该降拟合层中第一卷积层的输入,按照第一卷积层、第一空洞卷积层和子降拟合层的顺序,将前一层的输出结果作为后一层的输入,计算得到多维图像块对应的编码结果。
本实施例通过编码器对多维图像块进行编码处理,进一步提高了图片处理的精度,并且通过空洞卷积增加了感受野,提高了输出图像包括的信息量。
在本申请的一些实施例中,上述解码器包括上采样层、第二卷积层和第二空洞卷积成层,上述基于所述第一层网络的解码器对所述编码结果进行解码处理得到所述目标图像的二值分割结果图包括:
在得到所述编码结果时,根据所述上采样层、所述第二卷积层和所述第二空洞卷积成层对所述编码结果进行计算,得到空洞卷积结果;
通过预设激活函数对所述空洞卷积结果进行计算,得到所述目标图像的二值分割结果图。
在本实施例中,解码器包括上采样层、第二卷积层和第二空洞卷积层。在得到编码结果时,通过解码器中的上采样层进行计算,得到第一上采样结果;将该第一上采样结果与编码器中第二次的第一空洞卷积计算后得到的结果进行拼接,得到第一拼接结果;将该第一拼接结果作为第二卷积层的输入,按照第二卷积层和第二空洞卷积层的顺序,将前一层的输出结果作为后一层的输入,计算得到第二子空洞卷积结果。
之后,通过第二个上采样层对该第二子空洞卷积结果进行处理,得到第二上采样结果,将该第二上采样结果与编码器中第一次的第一空洞卷积计算后得到的结果进行拼接,得到第二拼接结果;将该第二拼接结果通过解码器中的第二个第二卷积层,再次按照第二卷积层和第二空洞卷积层的顺序,将前一层的输出结果作为后一层的输入计算得到最终的空洞卷积结果。最后,在得到该空洞卷积结果时,在对该空洞卷积结果通过预设激活函数计算之前,还需对该空洞卷积结果再进行一次卷积运算(如conv 1*1*9),之后通过预设激活函数(如sigmoid函数)对该空洞卷积结果的卷积计算结果进行计算,即得到目标函数的二值分割结果图。
特别地,本实施例中上采样层、第二卷积层和第二空洞卷积层亦均为多维处理器,上采样层可用up-conv 2*2*1计算,第二卷积层和第二空洞卷积层与第一卷积层、第一空洞卷积层所采用的卷积相同。在第二卷积层和第二空洞卷积层计算得到第二子卷积结果和第二子空洞卷积结果前,亦会分别对根据第二卷积层和第二空洞卷积层直接得到的卷积结果进行一个relu的激活函数的处理,从而分别得到最终的第二子卷积结果和第二子空洞卷积结果。
本实施例通过解码器对编码结果进行处理得到二值分割结果图,实现了对图片的高效分割,并且提高了二值分割结果图所包括的信息量,以及图片分割的精确度。
在本申请的一些实施例中,上述基于所述第二层网络对所述二值分割结果图进行多层卷积计算,得到所述目标图像的语义分割结果图包括:
获取所述第一层网络的第一卷积结果,根据所述第一卷积结果对所述二值分割结果图进行掩膜约束,得到掩膜结果;
基于所述第二层网络对所述掩膜结果进行多层卷积计算,得到所述目标图像的语义分割结果图。
在本实施例中,第一卷积结果为在通过第一层网络的编码器第一次的第一空洞卷积计算得到第一空洞卷积结果时,将该第一空洞卷积结果通过一次卷积conv 1*1*9以及relu的激活函数计算得到的结果。根据该第一卷积结果对该二值分割图进行掩膜约束。具体地,掩膜约束为将第一卷积结果与得到的二值分割结果图进行相乘,得到感兴趣区图像,该感兴趣图像即为掩膜结果。在得到该掩膜结果时,将该掩膜结果按照第三卷积层、第三空洞卷积层和第四卷积层的输出顺序,计算得到目标图像的语义分割结果图。其中,第三卷积层和第三空洞卷积层与第一卷积层、第一空洞卷积层所采用的卷积和激活计算方式相同,第四卷积层则采用conv 1*1*1以及relu的激活函数计算方式。
本实施例通过掩膜约束,使得得到的语义分割结果图的信息更完全,进一步提高了图片分割的精确度。
在本申请的一些实施例中,在上述获取预设的空洞卷积神经网络之前还包括:
选取预设图像库中预设个数的图像为训练图像,将所述预设图像库中剩余的图像作为测试图像;
获取基础训练网络,根据所述训练图像对所述基础训练网络进行训练,得到训练后的基础训练网络;
根据所述测试图像对所述训练后的基础训练网络进行测试,在所述训练后的基础训练网络对所述测试图像的识别成功率大于等于预设成功率时,确定所述训练后的基础训练网络为所述空洞卷积神经网络。
在本实施例中,在通过预设的空洞卷积神经网络对多维图像块进行处理之前,需要对基础训练网络进行训练,得到该空洞卷积神经网络。具体地,该基础训练网络为与空洞卷积神经网络结构相同,参数不同的模型。预先选取预设图像库中预设个数的图像为训练图像,将所述预设图像库中剩余的图像作为测试图像;获取基础训练网络,将该训练图像输入至该基础训练网络中,根据训练图像和该训练图像对应的标准分割图,对该基础训练网络的参数进行调整,得到训练后的基础训练网络。之后,根据测试图像对训练后的基础训练网络进行测试,在该训练后的基础训练网络对该测试图像的识别结果与该测试图像对应的标准分割图的相似度大于等于预设阈值时,确定该训练后的基础训练网络对该测试图像识别成功;在训练后的基础训练网络对测试图像的识别成功率大于等于预设成功率时,则确定该训练后的基础训练网络为预设的空洞卷积神经网络。
本实施例通过预先对基础训练网络进行训练,使得在得到目标图像时,能够快速根据训练后的网络进行图像分割,提高了图像分割的效率及准确率。
在本申请的一些实施例中,上述根据所述训练图像对所述基础训练网络进行训练,得到训练后的基础训练网络包括:
分解所述训练图像为训练图像块,输入所述训练图像块至所述基础训练网络中得到训练分割图像;
获取所述训练图像的标准分割图像,根据所述训练分割图像和所述标准分割图像对所述基础训练网络进行训练,得到训练后的基础训练网络。
在本实施例中,在得到训练图像时,对每一张训练图像均进行二层小波分解,得到对应的训练图像块,将该训练图像块输入至基础训练网络中,输出得到训练图像对应的训练分割图像。获取该训练图像的标准分割图像,该标准分割图像为预设的与训练图像关联的分割图像。根据该标准分割图像和训练分割图像可以对基础训练网络的损失函数进行计算,在损失函数收敛时,则该基础训练网络为训练后的基础训练网络。
本实施例通过训练图像块对基础训练网络进行训练,使得训练后的网络能够准确地对图像进行分割,避免了图像分割的误差,进一步提高了图像分割的精确度。
在本申请的一些实施例中,上述根据所述训练分割图像和所述标准分割图像对所述基础训练网络进行训练,得到训练后的基础训练网络包括:
获取所述训练分割图像的第一像素个数,以及所述标准分割图像的第二像素个数;
根据所述第一像素个数和所述第二像素个数计算所述基础训练网络的损失函数,在所述损失函数收敛时,确定所述基础训练网络为训练后的基础训练网络。
在本实施例中,根据训练分割图像的第一像素个数和标准分割图像的第二像素个数,可以计算得到基础训练网络的损失函数。该损失函数的具体计算公式如下所示:
loss=1-2|L1∩L2|/(|L1|+|L2|)
其中,L1表示标准分割图像的第二像素个数,L2表示训练分割图像的第一像素个数。在该损失函数收敛时,所得到的基础训练网络即为训练后的基础训练网络。
本实施例通过损失函数对训练后的基础训练网络进行约束,减少了训练时长,提高了模型训练的效率。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机可读指令来指令相关的硬件来完成,该计算机可读指令可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)等非易失性存储介质,或随机存储记忆体(Random Access Memory,RAM)等。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
进一步参考图3,作为对上述图2所示方法的实现,本申请提供了一种图像分割装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图3所示,本实施例所述的图像分割装置300包括:分解模块301、处理模块302、以及计算模块303。其中:
分解模块301,用于获取目标图像,并对所述目标图像进行二层小波分解,得到多维图像块;
在本实施例中,获取目标图像,目标图像为包括目标分割信息的图像。在得到目标图像时,对该图像进行二层小波分解。具体地,小波通常为局部特征在有限的区间内取值不为0的信号,小波分解的第一层分解为将图像分为低频信息和高频信息,高频信息为图像强度变化强烈的部分,如图像轮廓;低频信息为图像强度变化平缓的部分,如图像中大色块的地方。在第一层分解的基础上,将低频信息再分解为低频信息和高频信息,即为小波的第二层分解。通过MATLAB可以对目标图像进行二层小波分解,从而得到多维图像块。
处理模块302,用于获取预设的空洞卷积神经网络,其中,所述空洞卷积神经网络包括第一层网络和第二层网络,基于所述第一层网络中的编码器对所述多维图像块进行编码处理得到编码结果,基于所述第一层网络的解码器对所述编码结果进行解码处理得到所述目标图像的二值分割结果图;
其中,所述处理模块302包括:
第一处理单元,用于将所述多维图像块依次经过所述第一卷积层、所述第一空洞卷积层和所述池化层,得到池化结果;
降拟合单元,用于通过预设降拟合层对所述池化结果进行降拟合得到所述多维图像块对应的编码结果。
第二处理单元,用于在得到所述编码结果时,根据所述上采样层、所述第二卷积层和所述第二空洞卷积成层对所述编码结果进行计算,得到空洞卷积结果;
第三处理单元,用于通过预设激活函数对所述空洞卷积结果进行计算,得到所述目标图像的二值分割结果图。
在本实施例中,在得到多维图像块时,获取预设的空洞卷积神经网络,其中,该空洞卷积神经网络包括第一层网络和第二层网络,第一层网络包括编码器和解码器,编码器包括三个第一卷积层、三个第一空洞卷积层和两个池化层,根据编码器对多维图像块进行编码;解码器包括两个上采样层、两个第二卷积层和两个第二空洞卷积成层,基于解码器对编码器输出的编码结果进行解码,最终得到二值分割结果图;第二层网络则包括多个卷积层。根据第一层网络可以得到目标图像对应的二值分割结果图,根据第二层网络则可以对得到二值分割结果图进行多层卷积计算,得到目标图像对应的语义分割图。
计算模块303,用于基于所述第二层网络对所述二值分割结果图进行多层卷积计算,得到所述目标图像的语义分割结果图。
其中,所述计算模块303包括:
第一约束单元,用于获取所述第一层网络的第一卷积结果,根据所述第一卷积结果对所述二值分割结果图进行掩膜约束,得到掩膜结果;
第二约束单元,用于基于所述第二层网络对所述掩膜结果进行多层卷积计算,得到所述目标图像的语义分割结果图。
在本实施例中,在得到二值分割结果图时,根据第二层网络对该二值分割图进行多层卷积计算,得到目标图像的语义分割图。具体地,第二层网络包括第三卷积层、第三空洞卷积层和第四卷积层,在得到二值分割结果图时,获取第一层网络的第一卷积结果,其中,第一卷积结果由第一层网络的编码器中第一次的第一空洞卷积计算得到的第一子空洞卷积结果,经过再次卷积计算得到。将该第一卷积结果和该二值分割结果图进行相乘,得到相乘结果。输入该相乘结果至第三卷积层,按照第三卷积层、第三空洞卷积层和第四卷积层的顺序,将前一层的输出结果作为后一层的输入计算,由此得到最终的语义分割结果图,该语义分割结果图即为目标图像最终分割的结果图。
需要强调的是,为进一步保证上述语义分割结果图信息的私密和安全性,上述语义分割结果图信息还可以存储于一区块链的节点中。
本申请所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
本实施例中提出的图像分割装置还包括:
获取模块,用于选取预设图像库中预设个数的图像为训练图像,将所述预设图像库中剩余的图像作为测试图像;
训练模块,用于获取基础训练网络,根据所述训练图像对所述基础训练网络进行训练,得到训练后的基础训练网络;
测试模块,用于根据所述测试图像对所述训练后的基础训练网络进行测试,在所述训练后的基础训练网络对所述测试图像的识别成功率大于等于预设成功率时,确定所述训练后的基础训练网络为所述空洞卷积神经网络。
其中,所述训练模块包括:
分解单元,用于分解所述训练图像为训练图像块,输入所述训练图像块至所述基础训练网络中得到训练分割图像;
训练单元,用于获取所述训练图像的标准分割图像,根据所述训练分割图像和所述标准分割图像对所述基础训练网络进行训练,得到训练后的基础训练网络。
其中,所述训练单元还包括:
获取子单元,用于获取所述训练分割图像的第一像素个数,以及所述标准分割图像的第二像素个数;
确认子单元,用于根据所述第一像素个数和所述第二像素个数计算所述基础训练网络的损失函数,在所述损失函数收敛时,确定所述基础训练网络为训练后的基础训练网络。
在本实施例中,在通过预设的空洞卷积神经网络对多维图像块进行处理之前,需要对基础训练网络进行训练,得到该空洞卷积神经网络。具体地,该基础训练网络为与空洞卷积神经网络结构相同,参数不同的模型。预先选取预设图像库中预设个数的图像为训练图像,将所述预设图像库中剩余的图像作为测试图像;获取基础训练网络,将该训练图像输入至该基础训练网络中,根据训练图像和该训练图像对应的标准分割图,对该基础训练网络的参数进行调整,得到训练后的基础训练网络。之后,根据测试图像对训练后的基础训练网络进行测试,在该训练后的基础训练网络对该测试图像的识别结果与该测试图像对应的标准分割图的相似度大于等于预设阈值时,确定该训练后的基础训练网络对该测试图像识别成功;在训练后的基础训练网络对测试图像的识别成功率大于等于预设成功率时,则确定该训练后的基础训练网络为预设的空洞卷积神经网络。
本实施例提出的图像分割装置,实现了在图像分割时能够获取到更多的图像信息,提高了局部特征信息提取时图像信号描述的准确度,并且在网络参数可控的范围内,极大地增加了感受野,提高了每个特征所包含的信息量,进一步使得图像信息分割更加精确,获取得到的图像信息更加完整。
为解决上述技术问题,本申请实施例还提供计算机设备。具体请参阅图4,图4为本实施例计算机设备基本结构框图。
所述计算机设备6包括通过***总线相互通信连接存储器61、处理器62、网络接口63。需要指出的是,图中仅示出了具有组件61-63的计算机设备6,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。其中,本技术领域技术人员可以理解,这里的计算机设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(ApplicationSpecific Integrated Circuit,ASIC)、可编程门阵列(Field-Programmable GateArray,FPGA)、数字处理器(Digital Signal Processor,DSP)、嵌入式设备等。
所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。
所述存储器61至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器61可以是所述计算机设备6的内部存储单元,例如该计算机设备6的硬盘或内存。在另一些实施例中,所述存储器61也可以是所述计算机设备6的外部存储设备,例如该计算机设备6上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(FlashCard)等。当然,所述存储器61还可以既包括所述计算机设备6的内部存储单元也包括其外部存储设备。本实施例中,所述存储器61通常用于存储安装于所述计算机设备6的操作***和各类应用软件,例如图像分割方法的计算机可读指令等。此外,所述存储器61还可以用于暂时地存储已经输出或者将要输出的各类数据。
所述处理器62在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器62通常用于控制所述计算机设备6的总体操作。本实施例中,所述处理器62用于运行所述存储器61中存储的计算机可读指令或者处理数据,例如运行所述图像分割方法的计算机可读指令。
所述网络接口63可包括无线网络接口或有线网络接口,该网络接口63通常用于在所述计算机设备6与其他电子设备之间建立通信连接。
本实施例提出的计算机设备,实现了在图像分割时能够获取到更多的图像信息,提高了局部特征信息提取时图像信号描述的准确度,并且在网络参数可控的范围内,极大地增加了感受野,提高了每个特征所包含的信息量,进一步使得图像信息分割更加精确,获取得到的图像信息更加完整。
本申请还提供了另一种实施方式,即提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可读指令,所述计算机可读指令可被至少一个处理器执行,以使所述至少一个处理器执行如上述的图像分割方法的步骤。
本实施例提出的计算机可读存储介质,实现了在图像分割时能够获取到更多的图像信息,提高了局部特征信息提取时图像信号描述的准确度,并且在网络参数可控的范围内,极大地增加了感受野,提高了每个特征所包含的信息量,进一步使得图像信息分割更加精确,获取得到的图像信息更加完整。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例所述的方法。
显然,以上所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例,附图中给出了本申请的较佳实施例,但并不限制本申请的专利范围。本申请可以以许多不同的形式来实现,相反地,提供这些实施例的目的是使对本申请的公开内容的理解更加透彻全面。尽管参照前述实施例对本申请进行了详细的说明,对于本领域的技术人员来而言,其依然可以对前述各具体实施方式所记载的技术方案进行修改,或者对其中部分技术特征进行等效替换。凡是利用本申请说明书及附图内容所做的等效结构,直接或间接运用在其他相关的技术领域,均同理在本申请专利保护范围之内。
Claims (10)
1.一种图像分割方法,其特征在于,包括下述步骤:
获取目标图像,并对所述目标图像进行二层小波分解,得到多维图像块;
获取预设的空洞卷积神经网络,其中,所述空洞卷积神经网络包括第一层网络和第二层网络,基于所述第一层网络中的编码器对所述多维图像块进行编码处理得到编码结果,基于所述第一层网络的解码器对所述编码结果进行解码处理得到所述目标图像的二值分割结果图;
基于所述第二层网络对所述二值分割结果图进行多层卷积计算,得到所述目标图像的语义分割结果图。
2.根据权利要求1所述的图像分割方法,其特征在于,所述编码器包括第一卷积层、第一空洞卷积层和池化层,所述基于所述第一层网络中的编码器对所述多维图像块进行编码处理得到编码结果的步骤具体包括:
将所述多维图像块依次经过所述第一卷积层、所述第一空洞卷积层和所述池化层,得到池化结果;
通过预设降拟合层对所述池化结果进行降拟合得到所述多维图像块对应的编码结果。
3.根据权利要求1所述的图像分割方法,其特征在于,所述解码器包括上采样层、第二卷积层和第二空洞卷积成层,所述基于所述第一层网络的解码器对所述编码结果进行解码处理得到所述目标图像的二值分割结果图的步骤具体包括:
在得到所述编码结果时,根据所述上采样层、所述第二卷积层和所述第二空洞卷积成层对所述编码结果进行计算,得到空洞卷积结果;
通过预设激活函数对所述空洞卷积结果进行计算,得到所述目标图像的二值分割结果图。
4.根据权利要求1所述的图像分割方法,其特征在于,所述基于所述第二层网络对所述二值分割结果图进行多层卷积计算,得到所述目标图像的语义分割结果图的步骤具体包括:
获取所述第一层网络的第一卷积结果,根据所述第一卷积结果对所述二值分割结果图进行掩膜约束,得到掩膜结果;
基于所述第二层网络对所述掩膜结果进行多层卷积计算,得到所述目标图像的语义分割结果图。
5.根据权利要求1所述的图像分割方法,其特征在于,在所述获取预设的空洞卷积神经网络的步骤之前还包括:
选取预设图像库中预设个数的图像为训练图像,将所述预设图像库中剩余的图像作为测试图像;
获取基础训练网络,根据所述训练图像对所述基础训练网络进行训练,得到训练后的基础训练网络;
根据所述测试图像对所述训练后的基础训练网络进行测试,在所述训练后的基础训练网络对所述测试图像的识别成功率大于等于预设成功率时,确定所述训练后的基础训练网络为所述空洞卷积神经网络。
6.根据权利要求5所述的图像分割方法,其特征在于,所述根据所述训练图像对所述基础训练网络进行训练,得到训练后的基础训练网络的步骤具体包括:
分解所述训练图像为训练图像块,输入所述训练图像块至所述基础训练网络中得到训练分割图像;
获取所述训练图像的标准分割图像,根据所述训练分割图像和所述标准分割图像对所述基础训练网络进行训练,得到训练后的基础训练网络。
7.根据权利要求6所述的图像分割方法,其特征在于,所述根据所述训练分割图像和所述标准分割图像对所述基础训练网络进行训练,得到训练后的基础训练网络的步骤具体包括:
获取所述训练分割图像的第一像素个数,以及所述标准分割图像的第二像素个数;
根据所述第一像素个数和所述第二像素个数计算所述基础训练网络的损失函数,在所述损失函数收敛时,确定所述基础训练网络为训练后的基础训练网络。
8.一种图像分割装置,其特征在于,包括:
分解模块,用于获取目标图像,并对所述目标图像进行二层小波分解,得到多维图像块;
处理模块,用于获取预设的空洞卷积神经网络,其中,所述空洞卷积神经网络包括第一层网络和第二层网络,基于所述第一层网络中的编码器对所述多维图像块进行编码处理得到编码结果,基于所述第一层网络的解码器对所述编码结果进行解码处理得到所述目标图像的二值分割结果图;
计算模块,用于基于所述第二层网络对所述二值分割结果图进行多层卷积计算,得到所述目标图像的语义分割结果图。
9.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述处理器执行所述计算机可读指令时实现如权利要求1至7中任一项所述的图像分割方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机可读指令,所述计算机可读指令被处理器执行时实现如权利要求1至7中任一项所述的图像分割方法的步骤。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011288874.3A CN112396613B (zh) | 2020-11-17 | 2020-11-17 | 图像分割方法、装置、计算机设备及存储介质 |
PCT/CN2021/090817 WO2022105125A1 (zh) | 2020-11-17 | 2021-04-29 | 图像分割方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011288874.3A CN112396613B (zh) | 2020-11-17 | 2020-11-17 | 图像分割方法、装置、计算机设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112396613A true CN112396613A (zh) | 2021-02-23 |
CN112396613B CN112396613B (zh) | 2024-05-10 |
Family
ID=74606047
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011288874.3A Active CN112396613B (zh) | 2020-11-17 | 2020-11-17 | 图像分割方法、装置、计算机设备及存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN112396613B (zh) |
WO (1) | WO2022105125A1 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113112518A (zh) * | 2021-04-19 | 2021-07-13 | 深圳思谋信息科技有限公司 | 基于拼接图像的特征提取器生成方法、装置和计算机设备 |
CN113191367A (zh) * | 2021-05-25 | 2021-07-30 | 华东师范大学 | 基于密集尺度动态网络的语义分割方法 |
WO2022105125A1 (zh) * | 2020-11-17 | 2022-05-27 | 平安科技(深圳)有限公司 | 图像分割方法、装置、计算机设备及存储介质 |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115082502B (zh) * | 2022-06-30 | 2024-05-10 | 温州医科大学 | 一种基于距离引导的深度学习策略的图像分割方法 |
CN115205300B (zh) * | 2022-09-19 | 2022-12-09 | 华东交通大学 | 基于空洞卷积和语义融合的眼底血管图像分割方法与*** |
CN115471765B (zh) * | 2022-11-02 | 2023-04-07 | 广东工业大学 | 一种航拍图像的语义分割方法、装置、设备及存储介质 |
CN115546236B (zh) * | 2022-11-24 | 2023-04-07 | 阿里巴巴(中国)有限公司 | 基于小波变换的图像分割方法及装置 |
CN115641434B (zh) * | 2022-12-26 | 2023-04-14 | 浙江天铂云科光电股份有限公司 | 电力设备定位方法、***、终端及存储介质 |
CN117007606B (zh) * | 2023-08-17 | 2024-03-08 | 泓浒(苏州)半导体科技有限公司 | 一种基于晶粒分割网络的晶圆晶粒缺陷检测方法及*** |
CN116824308B (zh) * | 2023-08-30 | 2024-03-22 | 腾讯科技(深圳)有限公司 | 图像分割模型训练方法与相关方法、装置、介质及设备 |
CN117474925B (zh) * | 2023-12-28 | 2024-03-15 | 山东润通齿轮集团有限公司 | 一种基于机器视觉的齿轮点蚀检测方法及*** |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108537292A (zh) * | 2018-04-10 | 2018-09-14 | 上海白泽网络科技有限公司 | 语义分割网络训练方法、图像语义分割方法及装置 |
CN108986124A (zh) * | 2018-06-20 | 2018-12-11 | 天津大学 | 结合多尺度特征卷积神经网络视网膜血管图像分割方法 |
CN109859158A (zh) * | 2018-11-27 | 2019-06-07 | 邦鼓思电子科技(上海)有限公司 | 一种基于视觉的工作区域边界的检测***、方法及机器设备 |
CN110363210A (zh) * | 2018-04-10 | 2019-10-22 | 腾讯科技(深圳)有限公司 | 一种图像语义分割模型的训练方法和服务器 |
CN111091576A (zh) * | 2020-03-19 | 2020-05-01 | 腾讯科技(深圳)有限公司 | 图像分割方法、装置、设备及存储介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110197709B (zh) * | 2019-05-29 | 2023-06-20 | 广州瑞多思医疗科技有限公司 | 一种基于深度学习与先验计划的三维剂量预测方法 |
CN110415260B (zh) * | 2019-08-01 | 2022-02-15 | 西安科技大学 | 基于字典与bp神经网络的烟雾图像分割与识别方法 |
CN112396613B (zh) * | 2020-11-17 | 2024-05-10 | 平安科技(深圳)有限公司 | 图像分割方法、装置、计算机设备及存储介质 |
-
2020
- 2020-11-17 CN CN202011288874.3A patent/CN112396613B/zh active Active
-
2021
- 2021-04-29 WO PCT/CN2021/090817 patent/WO2022105125A1/zh active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108537292A (zh) * | 2018-04-10 | 2018-09-14 | 上海白泽网络科技有限公司 | 语义分割网络训练方法、图像语义分割方法及装置 |
CN110363210A (zh) * | 2018-04-10 | 2019-10-22 | 腾讯科技(深圳)有限公司 | 一种图像语义分割模型的训练方法和服务器 |
CN108986124A (zh) * | 2018-06-20 | 2018-12-11 | 天津大学 | 结合多尺度特征卷积神经网络视网膜血管图像分割方法 |
CN109859158A (zh) * | 2018-11-27 | 2019-06-07 | 邦鼓思电子科技(上海)有限公司 | 一种基于视觉的工作区域边界的检测***、方法及机器设备 |
CN111091576A (zh) * | 2020-03-19 | 2020-05-01 | 腾讯科技(深圳)有限公司 | 图像分割方法、装置、设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
张蓉: "基于卷积神经网络的图像语义分割研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》, no. 3, pages 9 - 51 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022105125A1 (zh) * | 2020-11-17 | 2022-05-27 | 平安科技(深圳)有限公司 | 图像分割方法、装置、计算机设备及存储介质 |
CN113112518A (zh) * | 2021-04-19 | 2021-07-13 | 深圳思谋信息科技有限公司 | 基于拼接图像的特征提取器生成方法、装置和计算机设备 |
CN113112518B (zh) * | 2021-04-19 | 2024-03-26 | 深圳思谋信息科技有限公司 | 基于拼接图像的特征提取器生成方法、装置和计算机设备 |
CN113191367A (zh) * | 2021-05-25 | 2021-07-30 | 华东师范大学 | 基于密集尺度动态网络的语义分割方法 |
Also Published As
Publication number | Publication date |
---|---|
WO2022105125A1 (zh) | 2022-05-27 |
CN112396613B (zh) | 2024-05-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112396613B (zh) | 图像分割方法、装置、计算机设备及存储介质 | |
US11640528B2 (en) | Method, electronic device and computer readable medium for information processing for accelerating neural network training | |
CN108509915B (zh) | 人脸识别模型的生成方法和装置 | |
US11625433B2 (en) | Method and apparatus for searching video segment, device, and medium | |
CN112668588B (zh) | 车位信息生成方法、装置、设备和计算机可读介质 | |
WO2023273628A1 (zh) | 一种视频循环识别方法、装置、计算机设备及存储介质 | |
CN112418292A (zh) | 一种图像质量评价的方法、装置、计算机设备及存储介质 | |
CN112466314A (zh) | 情感语音数据转换方法、装置、计算机设备及存储介质 | |
CN111914654B (zh) | 一种文本版面分析方法、装置、设备和介质 | |
CN114529574B (zh) | 基于图像分割的图像抠图方法、装置、计算机设备及介质 | |
CN115147598A (zh) | 目标检测分割方法、装置、智能终端及存储介质 | |
CN114612902A (zh) | 图像语义分割方法、装置、设备、存储介质及程序产品 | |
CN114780701A (zh) | 自动问答匹配方法、装置、计算机设备及存储介质 | |
CN113240071A (zh) | 图神经网络处理方法、装置、计算机设备及存储介质 | |
CN116796287A (zh) | 图文理解模型的预训练方法、装置、设备及存储介质 | |
CN116416645A (zh) | 基于双分支Transformer网络的属性与图像跨模态行人再辨识方法及装置 | |
CN114724579A (zh) | 语音分离方法、装置、计算机设备及存储介质 | |
CN113361519B (zh) | 目标处理方法、目标处理模型的训练方法及其装置 | |
CN115601235A (zh) | 一种图像超分辨率网络训练方法、装置、设备及存储介质 | |
CN114627462A (zh) | 化学式识别方法、装置、计算机设备及存储介质 | |
CN113610856A (zh) | 训练图像分割模型和图像分割的方法和装置 | |
CN114241411A (zh) | 基于目标检测的计数模型处理方法、装置及计算机设备 | |
CN113780239A (zh) | 虹膜识别方法、装置、电子设备和计算机可读介质 | |
CN112966150A (zh) | 一种视频内容抽取的方法、装置、计算机设备及存储介质 | |
CN112071331A (zh) | 语音文件修复方法、装置、计算机设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |