CN108491889A - 图像语义分割方法、装置及计算机可读存储介质 - Google Patents

图像语义分割方法、装置及计算机可读存储介质 Download PDF

Info

Publication number
CN108491889A
CN108491889A CN201810281858.8A CN201810281858A CN108491889A CN 108491889 A CN108491889 A CN 108491889A CN 201810281858 A CN201810281858 A CN 201810281858A CN 108491889 A CN108491889 A CN 108491889A
Authority
CN
China
Prior art keywords
pictures
image
semantic segmentation
semantic
existing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810281858.8A
Other languages
English (en)
Inventor
刘新
宋朝忠
郭烽
张新
陈安东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Yicheng Automatic Driving Technology Co Ltd
Original Assignee
Shenzhen Yicheng Automatic Driving Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Yicheng Automatic Driving Technology Co Ltd filed Critical Shenzhen Yicheng Automatic Driving Technology Co Ltd
Priority to CN201810281858.8A priority Critical patent/CN108491889A/zh
Publication of CN108491889A publication Critical patent/CN108491889A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种图像语义分割方法、装置及计算机可读存储介质,所述图像语义分割方法包括:对现有图片集进行扩增,得到新图片集;通过所述新图片集对初始语义分割算法进行数据训练,得到目标语义分割模型;获取测试图片,对所述测试图片进行预处理;将经过预处理的测试图片输入所述目标语义分割模型,得到语义分割结果。本发明中,增加图片集覆盖场景范围,对测试图片进行预处理,一方面提高了语义分割算法的适用范围,另一方面提高了语义分割算法的预测准确率。

Description

图像语义分割方法、装置及计算机可读存储介质
技术领域
本发明涉及机器视觉技术领域,尤其涉及图像语义分割方法、装置及计算机可读存储介质。
背景技术
随着自动驾驶的飞速发展,与自动驾驶相关的技术也得到了飞速发展,其中,基于深度学习的语义分割技术在自动驾驶中得到广泛应用。语义分割技术能够对目标进行像素级的分类,此种像素级分类对自动驾驶场景中的环境感知具有重大意义。由于语义分割算法相关数据集大多是在路面宽阔,天气良好的情况采集的,因此语义分割算法适用场景也是天气良好的情况。然而随着自动驾驶技术的发展,自动驾驶汽车需要适应的场景也越来越多,目前语义分割算法在识别带有光斑的路面图片时会失效,容易将路面上的光斑识别成路面标线。
发明内容
本发明的主要目的在于提供一种图像语义分割方法、装置及计算机可读存储介质,旨在解决现有技术中语义分割算法应用在光照不均匀场景下,预测准确率较低的技术问题。
为实现上述目的,本发明提供一种图像语义分割方法,所述图像语义分割方法包括:
对现有图片集进行扩增,得到新图片集;
通过所述新图片集对初始语义分割算法进行数据训练,得到目标语义分割模型;
获取测试图片,对所述测试图片进行预处理;
将经过预处理的测试图片输入所述目标语义分割模型,得到语义分割结果。
可选的,所述对现有图片集进行扩增,得到新图片集包括:
对现有图片集中的现有图片进行对比度增强处理以及将目标场景图片加入所述现有图片集,得到新图片集。
可选的,所述通过所述新图片集对初始语义分割算法进行数据训练,得到目标语义分割模型包括:
将所述新图片集输入初始语义分割算法,得到训练结果;
通过所述训练结果,对所述初始语义分割算法进行参数优化,得到目标语义分割模型。
可选的,所述获取测试图片,对所述测试图片进行预处理包括:
获取测试图片,对所述测试图片进行对比度增强处理以及白平衡处理。
可选的,所述将经过预处理的测试图片输入所述目标语义分割模型,得到语义分割结果之后包括:
获取所述测试图片的标注信息;
将所述语义分割结果与所述标注信息进行对比,得到对比结果,并输出所述对比结果。
此外,为实现上述目的,本发明还提供一种图像语义分割装置,所述图像语义分割装置包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的图像语义分割程序,所述图像语义分割程序被所述处理器执行时实现如上所述的图像语义分割方法的步骤。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有图像语义分割程序,所述图像语义分割程序被处理器执行时实现如上所述的图像语义分割方法的步骤。
本发明中,对现有图片集进行扩增,得到新图片集,通过新图片集对初始语义分割算法进行数据训练,得到目标语义分割模型,获取测试图片,对测试图片进行预处理,将经过预处理的测试图片输入目标语义分割模型,得到语义分割结果。本发明中,增加图片集覆盖场景范围,对测试图片进行预处理,一方面提高了语义分割算法的适用范围,另一方面提高了语义分割算法的预测准确率。
附图说明
图1为本发明实施例方案涉及的硬件运行环境的图像语义分割装置结构示意图;
图2为本发明图像语义分割方法第一实施例的流程示意图;
图3为本发明图像语义分割方法一实施例的操作流程示意图;
图4为本发明图像语义分割方法一实施例中语义分割结果示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,图1是本发明实施例方案涉及的硬件运行环境的图像语义分割装置结构示意图。
本发明实施例图像语义分割装置可以是PC,也可以是智能手机、平板电脑、便携计算机等具备一定数据处理能力的终端设备。
如图1所示,该图像语义分割装置可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的图像语义分割装置结构并不构成对图像语义分割装置的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作***、网络通信模块、用户接口模块以及图像语义分割程序。
在图1所示的图像语义分割装置中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端(用户端),与客户端进行数据通信;而处理器1001可以用于调用存储器1005中存储的图像语义分割程序,并执行以下操作:
对现有图片集进行扩增,得到新图片集;
通过所述新图片集对初始语义分割算法进行数据训练,得到目标语义分割模型;
获取测试图片,对所述测试图片进行预处理;
将经过预处理的测试图片输入所述目标语义分割模型,得到语义分割结果。
进一步地,所述对现有图片集进行扩增,得到新图片集包括:
对现有图片集中的现有图片进行对比度增强处理以及将目标场景图片加入所述现有图片集,得到新图片集。
进一步地,所述通过所述新图片集对初始语义分割算法进行数据训练,得到目标语义分割模型包括:
将所述新图片集输入初始语义分割算法,得到训练结果;
通过所述训练结果,对所述初始语义分割算法进行参数优化,得到目标语义分割模型。
进一步地,所述获取测试图片,对所述测试图片进行预处理包括:
获取测试图片,对所述测试图片进行对比度增强处理以及白平衡处理。
进一步地,所述将经过预处理的测试图片输入所述目标语义分割模型,得到语义分割结果之后包括:
获取所述测试图片的标注信息;
将所述语义分割结果与所述标注信息进行对比,得到对比结果,并输出所述对比结果。
参照图2,图2为本发明图像语义分割方法第一实施例的流程示意图。
在一实施例中,图像语义分割方法包括:
步骤S10,对现有图片集进行扩增,得到新图片集;
本实施例中,对现有图片集进行扩增得到新图片集包括:对现有图片集中的现有图片进行对比度增强处理,以及在现有图片集中加入光照不均匀场景图片(例如在树荫底下带有光斑的路面图片)。
本实施例中,现有图片集中的现有图片是指在路面宽阔以及天气良好的情况下采集的图片,现有图片中不存在光照不均匀的情况。例如,现有图片集中有若干张路面图片,这些图片均不带有光斑。对这些图片进行对比度增强处理(对比度增强是将图像中的亮度值范围拉伸或压缩成显示***指定的亮度显示范围,从而提高图像全部或局部的对比度)。相当于在图片中加入了光斑的显示效果,即相当于将这些不带光斑的路面图片模拟成带光斑的路面图片。以及在现有图片集中加入带有光斑的路面图片,本实施例中,带有光斑的路面图片可以是拍摄树荫底下带有光斑的路面图片或是其他障碍物下带有光斑的路面图片。即本实施例中,新图片集包括真实采集的光照不均匀场景图片,例如树荫底下带有光斑的路面图片,以及模拟得到的带有光斑的路面图片。
步骤S20,通过所述新图片集对初始语义分割算法进行数据训练,得到目标语义分割模型;
本实施例中,语义分割是指像素级的图像理解,即对图像中的每个像素标注所属的类别。在深度学习广泛应用于计算机视觉领域之前,人们一般使用TextonForest和Random Forest based classifiers的方法进行语义分割。CNN(Convolutional NeuralNetwork,卷积神经网络)不仅有助于图像识别,在图像的语义分割问题中同样取得了成功。深度学习方法中常见的一种语义分割方法是图像块分类(patch classification),即利用像素周围的图像块对每一个像素进行分类。的原因是网络模型通常包含全连接层(fullyconnect layer),而且要求固定大小的图像输入。2014年,加州大学伯克利分校的Long等人提出全卷积网络(Fully Convolutional Networks,FCN),使得卷积神经网络不需要全连接层就可以实现密集的像素级分类,从而成为当前非常流行的像素级分类CNN架构。由于不需要全连接层,所以可以对任意大小的图像进行语义分割,而且比传统方法要快上很多。之后,语义分割领域几乎所有的先进方法都是基于该模型进行扩展的。本实施例中,对于语义分割算法的选择根据实际情况进行选择,在此不作限制。
本实施例中,将新图片集(包括如上所述的真实采集的光照不均匀场景图片,以及模拟得到的带有光斑的路面图片)作为数据输入至初始语义分割算法,得到训练结果。通过该训练结果,利用梯度下降算法(梯度下降是迭代法的一种,可以用于求解最小二乘问题(线性和非线性都可以)。在求解机器学习算法的模型参数,即无约束优化问题时,梯度下降(Gradient Descent)是最常采用的方法之一,另一种常用的方法是最小二乘法。在求解损失函数的最小值时,可以通过梯度下降法来一步步的迭代求解,得到最小化的损失函数和模型参数值。反过来,如果我们需要求解损失函数的最大值,这时就需要用梯度上升法来迭代了。在机器学习中,基于基本的梯度下降法发展了两种梯度下降方法,分别为随机梯度下降法和批量梯度下降法)对初始语义分割算法进行参数优化,直至得到目标语义分割模型。本实施例中,通过新图片集对初始语义分割算法进行数据训练,得到目标语义分割模型的具体实施例,可参见现有技术机器学习中模型训练方法,在此不做赘述。
步骤S30,获取测试图片,对所述测试图片进行预处理;
本实施例中,测试图片指光照不均与场景下的图片,例如带有光斑的路面图片。测试图片与步骤S10中真实采集的光照不均匀场景图片不能相同。
本实施例中,对测试图片进行预处理包括对比度压缩处理以及白平衡处理。降低了测试图片的对比度差异,从而降低了目标语义分割模型将测试图片中的光斑识别为路面标线的概率。
步骤S40,将经过预处理的测试图片输入所述目标语义分割模型,得到语义分割结果。
本实施例中,通过目标语义分割模型对经过预处理的测试图片进行图像语义分割,即对测试图片中的内容进行像素级分类,从像素的角度分割出测试图片中的不同对象,对测试图片中的每个像素都进行标注,即得到语义分割结果。
参照图3,图3为本发明图像语义分割方法一实施例的操作流程示意图。本实施例中,对现有图片进行对比度增强处理,采集光照不均匀场景图片,将经过对比度增强处理的后的图片以及光照不均匀场景图片输入初始语义分割算法,对初始语义分割算法进行参数优化,得到目标语义分割模型。对测试图片进行预处理,预处理包括对比度压缩处理以及白平衡处理,将经过预处理后的图片输入目标语义分割模型,通过目标语义分割模型对经过预处理的测试图片进行图像语义分割,得到语义分割结果。
本实施例中,对现有图片集进行扩增,得到新图片集,通过新图片集对初始语义分割算法进行数据训练,得到目标语义分割模型,获取测试图片,对测试图片进行预处理,将经过预处理的测试图片输入目标语义分割模型,得到语义分割结果。通过本实施例,增加图片集覆盖场景范围,对测试图片进行预处理,一方面提高了语义分割算法的适用范围,另一方面提高了语义分割算法的预测准确率。
进一步的,本发明图像语义分割方法一实施例中,步骤S10包括:
对现有图片集中的现有图片进行对比度增强处理以及将目标场景图片加入所述现有图片集,得到新图片集。
本实施例中,对现有图片集进行扩增得到新图片集包括:对现有图片集中的现有图片进行对比度增强处理,以及在现有图片集中加入光照不均匀场景图片(即目标场景图片,例如在树荫底下带有光斑的路面图片)。
本实施例中,现有图片集中的现有图片是指在路面宽阔以及天气良好的情况下采集的图片,现有图片中不存在光照不均匀的情况。例如,现有图片集中有若干张路面图片,这些图片均不带有光斑。对这些图片进行对比度增强处理(对比度增强是将图像中的亮度值范围拉伸或压缩成显示***指定的亮度显示范围,从而提高图像全部或局部的对比度)。相当于在图片中加入了光斑的显示效果,即相当于将这些不带光斑的路面图片模拟成带光斑的路面图片。以及在现有图片集中加入带有光斑的路面图片,本实施例中,带有光斑的路面图片可以是拍摄树荫底下带有光斑的路面图片或是其他障碍物下带有光斑的路面图片。即本实施例中,新图片集包括真实采集的光照不均匀场景图片,例如树荫底下带有光斑的路面图片,以及模拟得到的带有光斑的路面图片。
本实施例通过对原有图片集进行数据扩增,增加了图片集覆盖场景范围,提高了语义分割算法的适用范围。
进一步的,本发明图像语义分割方法一实施例中,步骤S20包括:
将所述新图片集输入初始语义分割算法,得到训练结果;
通过所述训练结果,对所述初始语义分割算法进行参数优化,得到目标语义分割模型。
本实施例中,语义分割是指像素级的图像理解,即对图像中的每个像素标注所属的类别。在深度学习广泛应用于计算机视觉领域之前,人们一般使用TextonForest和Random Forest based classifiers的方法进行语义分割。CNN(Convolutional NeuralNetwork,卷积神经网络)不仅有助于图像识别,在图像的语义分割问题中同样取得了成功。深度学习方法中常见的一种语义分割方法是图像块分类(patch classification),即利用像素周围的图像块对每一个像素进行分类。的原因是网络模型通常包含全连接层(fullyconnect layer),而且要求固定大小的图像输入。2014年,加州大学伯克利分校的Long等人提出全卷积网络(Fully Convolutional Networks,FCN),使得卷积神经网络不需要全连接层就可以实现密集的像素级分类,从而成为当前非常流行的像素级分类CNN架构。由于不需要全连接层,所以可以对任意大小的图像进行语义分割,而且比传统方法要快上很多。之后,语义分割领域几乎所有的先进方法都是基于该模型进行扩展的。本实施例中,对于语义分割算法的选择根据实际情况进行选择,在此不作限制。
本实施例中,将新图片集(包括如上所述的真实采集的光照不均匀场景图片,以及模拟得到的带有光斑的路面图片)作为数据输入至初始语义分割算法,得到训练结果。通过该训练结果,利用梯度下降算法(梯度下降是迭代法的一种,可以用于求解最小二乘问题(线性和非线性都可以)。在求解机器学习算法的模型参数,即无约束优化问题时,梯度下降(Gradient Descent)是最常采用的方法之一,另一种常用的方法是最小二乘法。在求解损失函数的最小值时,可以通过梯度下降法来一步步的迭代求解,得到最小化的损失函数和模型参数值。反过来,如果我们需要求解损失函数的最大值,这时就需要用梯度上升法来迭代了。在机器学习中,基于基本的梯度下降法发展了两种梯度下降方法,分别为随机梯度下降法和批量梯度下降法)对初始语义分割算法进行参数优化,直至得到目标语义分割模型。本实施例中,通过新图片集对初始语义分割算法进行数据训练,得到目标语义分割模型的具体实施例,可参见现有技术机器学习中模型训练方法,在此不做赘述。
本实施例中,通过新图片集对初始语义分割算法进行训练,得到目标语义分割模型,降低了目标语义分割模型将光斑识别为路面标线的概率。
进一步的,本发明图像语义分割方法一实施例中,步骤S30包括:
获取测试图片,对所述测试图片进行对比度增强处理以及白平衡处理。
本实施例中,测试图片指光照不均与场景下的图片,例如带有光斑的路面图片。测试图片与步骤S10中真实采集的光照不均匀场景图片不能相同。
本实施例中,对测试图片进行预处理包括对比度压缩处理以及白平衡处理。降低了测试图片的对比度差异,提高了语义分割准确率,降低了目标语义分割模型将测试图片中的光斑识别为路面标线的概率。
进一步的,本发明图像语义分割方法一实施例中,步骤S40之后包括:
获取所述测试图片的标注信息;
将所述语义分割结果与所述标注信息进行对比,得到对比结果,并输出所述对比结果。
本实施例中,通过目标语义分割模型对经过预处理的测试图片进行图像语义分割,即对测试图片中的内容进行像素级分类,从像素的角度分割出测试图片中的不同对象,对测试图片中的每个像素都进行标注,即得到语义分割结果。参照图4,图4为本发明图像语义分割方法一实施例中语义分割结果示意图。如图4所示,若语义分割结果将图4中对象1、对象2、对象3标注为路面标线,将对象4、对象5标注为光斑。若该测试图片的标注信息为:对象1、对象2、对象3为路面标线,对象4、对象5为光斑,则对比结果为:语义分割结果正确率100%。若语义分割结果将图4中对象1、对象2、对象3、对象4标注为路面标线,将对象5标注为光斑。若该测试图片的标注信息为:对象1、对象2、对象3为路面标线,对象4、对象5为光斑,则对比结果为:语义分割结果正确率80%。
本实施例中,将语义分割结果与标注信息进行对比,得到对比结果,并输出对比结果,使得相关人员可以通过对比结果获知目标语义分割模型对测试图片进行语义分割的准确性,可将对比结果作为目标语义分割模型能否实际应用的评判标准。
此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有图像语义分割程序,所述图像语义分割程序被处理器执行时实现如上所述的图像语义分割方法的步骤。
本发明计算机可读存储介质的具体实施例与上述图像语义分割方法的各个实施例基本相同,在此不做赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者***不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者***所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者***中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种图像语义分割方法,其特征在于,所述图像语义分割方法包括:
对现有图片集进行扩增,得到新图片集;
通过所述新图片集对初始语义分割算法进行数据训练,得到目标语义分割模型;
获取测试图片,对所述测试图片进行预处理;
将经过预处理的测试图片输入所述目标语义分割模型,得到语义分割结果。
2.如权利要求1所述的图像语义分割方法,其特征在于,所述对现有图片集进行扩增,得到新图片集包括:
对现有图片集中的现有图片进行对比度增强处理以及将目标场景图片加入所述现有图片集,得到新图片集。
3.如权利要求1所述的图像语义分割方法,其特征在于,所述通过所述新图片集对初始语义分割算法进行数据训练,得到目标语义分割模型包括:
将所述新图片集输入初始语义分割算法,得到训练结果;
通过所述训练结果,对所述初始语义分割算法进行参数优化,得到目标语义分割模型。
4.如权利要求1所述的图像语义分割方法,其特征在于,所述获取测试图片,对所述测试图片进行预处理包括:
获取测试图片,对所述测试图片进行对比度增强处理以及白平衡处理。
5.如权利要求1所述的图像语义分割方法,其特征在于,所述将经过预处理的测试图片输入所述目标语义分割模型,得到语义分割结果之后包括:
获取所述测试图片的标注信息;
将所述语义分割结果与所述标注信息进行对比,得到对比结果,并输出所述对比结果。
6.一种图像语义分割装置,其特征在于,所述图像语义分割装置包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的图像语义分割程序,所述图像语义分割程序被所述处理器执行时实现如下步骤:
对现有图片集进行扩增,得到新图片集;
通过所述新图片集对初始语义分割算法进行数据训练,得到目标语义分割模型;
获取测试图片,对所述测试图片进行预处理;
将经过预处理的测试图片输入所述目标语义分割模型,得到语义分割结果。
7.如权利要求6所述的图像语义分割装置,其特征在于,所述图像语义分割程序被所述处理器执行时还实现如下步骤:
对现有图片集中的现有图片进行对比度增强处理以及将目标场景图片加入所述现有图片集,得到新图片集。
8.如权利要求6所述的图像语义分割装置,其特征在于,所述图像语义分割程序被所述处理器执行时还实现如下步骤:
将所述新图片集输入初始语义分割算法,得到训练结果;
通过所述训练结果,对所述初始语义分割算法进行参数优化,得到目标语义分割模型。
9.如权利要求6所述的图像语义分割装置,其特征在于,所述图像语义分割程序被所述处理器执行时还实现如权利要求4或5所述的图像语义分割方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有图像语义分割程序,所述图像语义分割程序被处理器执行时实现如权利要求1至5中任一项所述的图像语义分割方法的步骤。
CN201810281858.8A 2018-04-02 2018-04-02 图像语义分割方法、装置及计算机可读存储介质 Pending CN108491889A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810281858.8A CN108491889A (zh) 2018-04-02 2018-04-02 图像语义分割方法、装置及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810281858.8A CN108491889A (zh) 2018-04-02 2018-04-02 图像语义分割方法、装置及计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN108491889A true CN108491889A (zh) 2018-09-04

Family

ID=63317978

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810281858.8A Pending CN108491889A (zh) 2018-04-02 2018-04-02 图像语义分割方法、装置及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN108491889A (zh)

Cited By (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109299716A (zh) * 2018-08-07 2019-02-01 北京市商汤科技开发有限公司 神经网络的训练方法、图像分割方法、装置、设备及介质
CN109377509A (zh) * 2018-09-26 2019-02-22 深圳前海达闼云端智能科技有限公司 图像语义分割标注的方法、装置、存储介质和设备
CN109492396A (zh) * 2018-11-12 2019-03-19 杭州安恒信息技术股份有限公司 基于语义分割的恶意软件基因快速检测方法和装置
CN110769258A (zh) * 2019-11-05 2020-02-07 山东浪潮人工智能研究院有限公司 一种用于特定场景多语义区域的图像压缩方法及***
CN110874598A (zh) * 2019-11-05 2020-03-10 西南交通大学 一种基于深度学习的高速公路水痕检测方法
CN112840376A (zh) * 2018-10-15 2021-05-25 华为技术有限公司 一种图像处理方法、装置与设备
CN112949516A (zh) * 2021-03-09 2021-06-11 深圳海翼智新科技有限公司 踢被子行为的识别方法和装置
US11403069B2 (en) 2017-07-24 2022-08-02 Tesla, Inc. Accelerated mathematical engine
US11409692B2 (en) 2017-07-24 2022-08-09 Tesla, Inc. Vector computational unit
US11487288B2 (en) 2017-03-23 2022-11-01 Tesla, Inc. Data synthesis for autonomous control systems
US11537811B2 (en) 2018-12-04 2022-12-27 Tesla, Inc. Enhanced object detection for autonomous vehicles based on field view
US11561791B2 (en) 2018-02-01 2023-01-24 Tesla, Inc. Vector computational unit receiving data elements in parallel from a last row of a computational array
US11562231B2 (en) 2018-09-03 2023-01-24 Tesla, Inc. Neural networks for embedded devices
US11567514B2 (en) 2019-02-11 2023-01-31 Tesla, Inc. Autonomous and user controlled vehicle summon to a target
US11610117B2 (en) 2018-12-27 2023-03-21 Tesla, Inc. System and method for adapting a neural network model on a hardware platform
WO2023050651A1 (zh) * 2021-09-29 2023-04-06 平安科技(深圳)有限公司 图像语义分割方法、装置、设备及存储介质
US11636333B2 (en) 2018-07-26 2023-04-25 Tesla, Inc. Optimizing neural network structures for embedded systems
US11665108B2 (en) 2018-10-25 2023-05-30 Tesla, Inc. QoS manager for system on a chip communications
US11681649B2 (en) 2017-07-24 2023-06-20 Tesla, Inc. Computational array microprocessor system using non-consecutive data formatting
US11734562B2 (en) 2018-06-20 2023-08-22 Tesla, Inc. Data pipeline and deep learning system for autonomous driving
US11748620B2 (en) 2019-02-01 2023-09-05 Tesla, Inc. Generating ground truth for machine learning from time series elements
US11790664B2 (en) 2019-02-19 2023-10-17 Tesla, Inc. Estimating object properties using visual image data
US11816585B2 (en) 2018-12-03 2023-11-14 Tesla, Inc. Machine learning models operating at different frequencies for autonomous vehicles
US11841434B2 (en) 2018-07-20 2023-12-12 Tesla, Inc. Annotation cross-labeling for autonomous control systems
US11893393B2 (en) 2017-07-24 2024-02-06 Tesla, Inc. Computational array microprocessor system with hardware arbiter managing memory requests
US11893774B2 (en) 2018-10-11 2024-02-06 Tesla, Inc. Systems and methods for training machine models with augmented data
US12014553B2 (en) 2019-02-01 2024-06-18 Tesla, Inc. Predicting three-dimensional features for autonomous driving
US12026863B2 (en) 2018-10-15 2024-07-02 Huawei Technologies Co., Ltd. Image processing method and apparatus, and device

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104850845A (zh) * 2015-05-30 2015-08-19 大连理工大学 一种基于非对称卷积神经网络的交通标志识别方法
CN105631440A (zh) * 2016-02-22 2016-06-01 清华大学 一种易受伤害道路使用者的联合检测方法
CN106530305A (zh) * 2016-09-23 2017-03-22 北京市商汤科技开发有限公司 语义分割模型训练和图像分割方法及装置、计算设备
CN106886801A (zh) * 2017-04-14 2017-06-23 北京图森未来科技有限公司 一种图像语义分割方法及装置
CN107301383A (zh) * 2017-06-07 2017-10-27 华南理工大学 一种基于Fast R‑CNN的路面交通标志识别方法
CN107403183A (zh) * 2017-07-21 2017-11-28 桂林电子科技大学 整合目标检测和图像分割为一体的智能分割方法
CN107424159A (zh) * 2017-07-28 2017-12-01 西安电子科技大学 基于超像素边缘和全卷积网络的图像语义分割方法
CN107610141A (zh) * 2017-09-05 2018-01-19 华南理工大学 一种基于深度学习的遥感图像语义分割方法
CN107862293A (zh) * 2017-09-14 2018-03-30 北京航空航天大学 基于对抗生成网络的雷达生成彩色语义图像***及方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104850845A (zh) * 2015-05-30 2015-08-19 大连理工大学 一种基于非对称卷积神经网络的交通标志识别方法
CN105631440A (zh) * 2016-02-22 2016-06-01 清华大学 一种易受伤害道路使用者的联合检测方法
CN106530305A (zh) * 2016-09-23 2017-03-22 北京市商汤科技开发有限公司 语义分割模型训练和图像分割方法及装置、计算设备
CN106886801A (zh) * 2017-04-14 2017-06-23 北京图森未来科技有限公司 一种图像语义分割方法及装置
CN107301383A (zh) * 2017-06-07 2017-10-27 华南理工大学 一种基于Fast R‑CNN的路面交通标志识别方法
CN107403183A (zh) * 2017-07-21 2017-11-28 桂林电子科技大学 整合目标检测和图像分割为一体的智能分割方法
CN107424159A (zh) * 2017-07-28 2017-12-01 西安电子科技大学 基于超像素边缘和全卷积网络的图像语义分割方法
CN107610141A (zh) * 2017-09-05 2018-01-19 华南理工大学 一种基于深度学习的遥感图像语义分割方法
CN107862293A (zh) * 2017-09-14 2018-03-30 北京航空航天大学 基于对抗生成网络的雷达生成彩色语义图像***及方法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
ADAM PASZKE等: "ENet: A Deep Neural Network Architecture for Real-Time Semantic Segmentation", 《ARXIV:1606.02147V1 [CS.CV]》 *
EDUARDO ROMERA等: "Efficient ConvNet for Real-time Semantic Segmentation", 《RESEARCHGATE》 *
EDUARDO ROMERA等: "ERFNet: Efficient Residualfor Real-Time Semantic Segmentation Factorized ConvNet", 《IEEE TRANSACTIONS ON INTELLIGENT TRANSPORTATION SYSTEMS》 *
EVAN SHELHAMER等: "Fully Convolutional Networks for Semantic Segmentation", 《IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MICHINE INTELLIGENCE》 *
TOBIAS POHLEN等: "Full-Resolution Residual Networks for Semantic Segmentation in Street Scenes", 《ARXIV:1611.08323V2 [CS.CV]》 *
VIJAY BADRINARAYANAN等: "SegNet: A Deep ConvolutionArchitecture for Image Segmentational Encoder-Decoder", 《IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE》 *

Cited By (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US12020476B2 (en) 2017-03-23 2024-06-25 Tesla, Inc. Data synthesis for autonomous control systems
US11487288B2 (en) 2017-03-23 2022-11-01 Tesla, Inc. Data synthesis for autonomous control systems
US11403069B2 (en) 2017-07-24 2022-08-02 Tesla, Inc. Accelerated mathematical engine
US11893393B2 (en) 2017-07-24 2024-02-06 Tesla, Inc. Computational array microprocessor system with hardware arbiter managing memory requests
US11681649B2 (en) 2017-07-24 2023-06-20 Tesla, Inc. Computational array microprocessor system using non-consecutive data formatting
US11409692B2 (en) 2017-07-24 2022-08-09 Tesla, Inc. Vector computational unit
US11797304B2 (en) 2018-02-01 2023-10-24 Tesla, Inc. Instruction set architecture for a vector computational unit
US11561791B2 (en) 2018-02-01 2023-01-24 Tesla, Inc. Vector computational unit receiving data elements in parallel from a last row of a computational array
US11734562B2 (en) 2018-06-20 2023-08-22 Tesla, Inc. Data pipeline and deep learning system for autonomous driving
US11841434B2 (en) 2018-07-20 2023-12-12 Tesla, Inc. Annotation cross-labeling for autonomous control systems
US11636333B2 (en) 2018-07-26 2023-04-25 Tesla, Inc. Optimizing neural network structures for embedded systems
CN109299716B (zh) * 2018-08-07 2021-07-06 北京市商汤科技开发有限公司 神经网络的训练方法、图像分割方法、装置、设备及介质
CN109299716A (zh) * 2018-08-07 2019-02-01 北京市商汤科技开发有限公司 神经网络的训练方法、图像分割方法、装置、设备及介质
US11983630B2 (en) 2018-09-03 2024-05-14 Tesla, Inc. Neural networks for embedded devices
US11562231B2 (en) 2018-09-03 2023-01-24 Tesla, Inc. Neural networks for embedded devices
CN109377509A (zh) * 2018-09-26 2019-02-22 深圳前海达闼云端智能科技有限公司 图像语义分割标注的方法、装置、存储介质和设备
US11893774B2 (en) 2018-10-11 2024-02-06 Tesla, Inc. Systems and methods for training machine models with augmented data
US12026863B2 (en) 2018-10-15 2024-07-02 Huawei Technologies Co., Ltd. Image processing method and apparatus, and device
CN112840376A (zh) * 2018-10-15 2021-05-25 华为技术有限公司 一种图像处理方法、装置与设备
US11665108B2 (en) 2018-10-25 2023-05-30 Tesla, Inc. QoS manager for system on a chip communications
CN109492396A (zh) * 2018-11-12 2019-03-19 杭州安恒信息技术股份有限公司 基于语义分割的恶意软件基因快速检测方法和装置
US11816585B2 (en) 2018-12-03 2023-11-14 Tesla, Inc. Machine learning models operating at different frequencies for autonomous vehicles
US11908171B2 (en) 2018-12-04 2024-02-20 Tesla, Inc. Enhanced object detection for autonomous vehicles based on field view
US11537811B2 (en) 2018-12-04 2022-12-27 Tesla, Inc. Enhanced object detection for autonomous vehicles based on field view
US11610117B2 (en) 2018-12-27 2023-03-21 Tesla, Inc. System and method for adapting a neural network model on a hardware platform
US12014553B2 (en) 2019-02-01 2024-06-18 Tesla, Inc. Predicting three-dimensional features for autonomous driving
US11748620B2 (en) 2019-02-01 2023-09-05 Tesla, Inc. Generating ground truth for machine learning from time series elements
US11567514B2 (en) 2019-02-11 2023-01-31 Tesla, Inc. Autonomous and user controlled vehicle summon to a target
US11790664B2 (en) 2019-02-19 2023-10-17 Tesla, Inc. Estimating object properties using visual image data
CN110769258A (zh) * 2019-11-05 2020-02-07 山东浪潮人工智能研究院有限公司 一种用于特定场景多语义区域的图像压缩方法及***
CN110874598A (zh) * 2019-11-05 2020-03-10 西南交通大学 一种基于深度学习的高速公路水痕检测方法
CN110874598B (zh) * 2019-11-05 2022-09-27 西南交通大学 一种基于深度学习的高速公路水痕检测方法
CN112949516A (zh) * 2021-03-09 2021-06-11 深圳海翼智新科技有限公司 踢被子行为的识别方法和装置
WO2023050651A1 (zh) * 2021-09-29 2023-04-06 平安科技(深圳)有限公司 图像语义分割方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN108491889A (zh) 图像语义分割方法、装置及计算机可读存储介质
Nogueira et al. Dynamic multicontext segmentation of remote sensing images based on convolutional networks
CN103578119B (zh) 基于超像素的Codebook动态场景中目标检测方法
US20200034648A1 (en) Method and apparatus for segmenting sky area, and convolutional neural network
CN104216976B (zh) 一种移动终端图片分组查看方法及***
CN108229575A (zh) 用于检测目标的方法和装置
CN109472193A (zh) 人脸检测方法及装置
CN112508094B (zh) 垃圾图片的识别方法、装置及设备
US11301711B2 (en) Systems and methods for enhancing real-time image recognition
US20160275343A1 (en) System and method for recognizing offensive images
CN113627402B (zh) 一种图像识别方法及相关装置
CN110033018A (zh) 图形相似度判断方法、装置及计算机可读存储介质
CN110717420A (zh) 一种基于遥感图像的耕地提取方法、***及电子设备
CN106339719A (zh) 一种图像识别方法及装置
CN113841161A (zh) 用于自动生成内容分发图像的可扩展体系架构
CN109670517A (zh) 目标检测方法、装置、电子设备和目标检测模型
CN108446688B (zh) 人脸图像性别判断方法、装置、计算机设备及存储介质
CN108664906B (zh) 一种基于卷积网络的火灾场景中内容的检测方法
US11495020B2 (en) Systems and methods for stream recognition
CN113221991A (zh) 一种利用深度学习重新标注数据集的方法
CN111178181B (zh) 交通场景分割方法及相关装置
CN107622278A (zh) 一种基于Android手机平台的专利图像识别方法
CN108229271A (zh) 解译遥感图像的方法、装置和电子设备
CN116958729A (zh) 对象分类模型的训练、对象分类方法、装置及存储介质
CN102129575A (zh) 一种基于颜色空间肤色模型的色情图像分析***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180904