CN108985250A - 一种基于多任务网络的交通场景解析方法 - Google Patents
一种基于多任务网络的交通场景解析方法 Download PDFInfo
- Publication number
- CN108985250A CN108985250A CN201810842269.2A CN201810842269A CN108985250A CN 108985250 A CN108985250 A CN 108985250A CN 201810842269 A CN201810842269 A CN 201810842269A CN 108985250 A CN108985250 A CN 108985250A
- Authority
- CN
- China
- Prior art keywords
- decoder
- characteristic pattern
- multitask network
- segmentation
- encoder
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/52—Surveillance or monitoring of activities, e.g. for recognising suspicious objects
- G06V20/54—Surveillance or monitoring of activities, e.g. for recognising suspicious objects of traffic, e.g. cars on the road, trains or boats
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于多任务网络的交通场景解析方法,包括以下步骤:将多任务网络划分为编码器、分割解码器和检测解码器。编码器提取图像的特征并提取特征图中的多尺度信息;分割解码器扩大特征图的尺寸,并与特征图进行融合;检测解码器对输入特征图进行处理,输出对应的目标检测结果。使用深度学习框架Tensorflow对上述多任务网络进行配置、训练和测试。本发明的多任务网络可以提取丰富的图像特征,弥补了编码器中下采样带来的图像细节信息的丢失,有助于提高分割和检测效果。本发明设计了一种多任务网络结构,能够通过一次反向传播实现交通场景图像的语义分割和目标检测,具有较好的实时性和较高的精确率。
Description
技术领域
本发明属于安全辅助驾驶领域,特别是一种用于实时交通场景解析的多任务网络设计方法。
背景技术
基于视觉的交通场景解析在智能交通***中具有重要的应用。语义分割和目标检测是交通场景解析中的两个主要任务。解决这些任务的传统方法如支持向量机(SVM)、自适应增强算法(AdaBoost)、随机森林迭代法(random forest)等具有较差的泛化性和鲁棒性。近年来,深度学习取得了突破性进展,并在图像处理领域广泛应用。深度学习方法从复杂数据中自动提取丰富的特征,使得模型具有更好的泛化能力,而且提取的特征可以用于语义分割和目标检测等不同的任务。
语义分割将像素分为不同的类,本质上是一个分类任务。许多基于深度学习的方法在语义分割任务中取得了较好的效果,但这些语义分割方法主要关注精度,实时性较差。目前,基于多尺度的网络被证明在保证精确率的前提下,能够获得较好的实时性。在目标检测方面,一些能够端到端训练的目标检测网络被提出,在检测精度和实时性上都获得了较好的效果,并且随着深度学习的发展,这些网络的性能在不断得到改善。
在实际的交通场景应用中,如果进行交通场景解析,同时实现语义分割和目标检测,则必须同时运行两个网络,这需要强大的计算性能且实时性差。
发明内容
为解决现有技术存在的上述问题,本发明要提出一种能同时实现语义分割和目标检测任务,从而减少计算量和计算时间的基于多任务网络的交通场景解析方法。
为实现上述目的,本发明的技术方案如下:一种基于多任务网络的交通场景解析方法,包括以下步骤:
A、多任务网络结构设计
多任务网络包括编码器、分割解码器和检测解码器。所述的编码器包含卷积层和下采样层,所述的卷积层采用深度残差网络中的三层残差学习单元,用来从原始图像提取特征信息,得到特征图;所述的下采样层的卷积核大小为3×3、步长为2,用来缩小特征图的尺寸;在编码器的最后,包含一个空间金字塔池化层,用来提取特征图中不同尺度的信息。编码器输出的特征图作为分割解码器和检测解码器的输入。所述的分割解码器为多尺度结构,首先通过多级的双线性差值方法对输入特征图进行上采样,扩大特征图的尺寸,然后采用1×1卷积核对编码器中不同尺寸的特征图执行卷积操作,并将输出特征图与分割解码器中上采样后的对应大小的特征图进行相加,以此来弥补编码器中下采样层带来的图像细节丢失的问题。所述的检测解码器基于回归的方法,对输入特征图进行处理,输出对应的目标检测结果。
B、多任务网络的训练
使用深度学习框架Tensorflow对上述多任务网络进行配置、训练和测试。网络训练的目标函数定义为分割解码器和检测解码器的损失函数之和,采用交叉熵损失函数作为分割解码器的损失函数,且仅利用分割解码器最后一层输出的特征图来计算损失值,公式如下:
式中,LS是损失值,q是标签,p是预测值,C是类别数量,N是训练批次中的样本数量,i表示第i个类别。检测解码器的损失函数定义为置信度的交叉熵损失函数和边界框坐标的L1损失函数的总和,公式如下:
式中(x,y)是边界框的中心点坐标,Lb是损失值,q是标签,p是预测值,N是一个训练批次中的样本数量,w和h分别是边界框的高和宽,i表示第i个类别。
在反向传播阶段,利用适应性阶梯算法即Adam优化器对多任务网络权重进行优化。Adam优化器是一种基于梯度下降的方法,使用梯度一阶矩估计和二阶矩估计来动态调整每个参数的学习速率。训练时,采用小批量梯度下降的方法,小批量值设置为3-5,学习率设置为0.00005-0.00015。采用L2正则化方法,正则化系数设置为0.0003-0.0007。
采用KITTI道路基准数据集和KITTI目标基准数据集对多任务网络进行训练和测试。
与现有技术相比,本发明具有以下有益效果:
1、本发明构建了具有多尺度结构的多任务网络,包括编码器、分割解码器、检测解码器。所设计的多任务网络可以提取丰富的图像特征,弥补了编码器中下采样带来的图像细节信息的丢失,有助于提高分割和检测效果。
2、本发明设计了一种多任务网络结构,能够通过一次反向传播实现交通场景图像的语义分割和目标检测,具有较好的实时性和较高的精确率。
附图说明
本发明共有附图2张,其中:
图1是本发明的多任务网络结构示意图;
图2是本发明的流程图。
具体实施方式
以下结合技术方案和附图详细叙述本发明的具体实施方式,一种用于实时交通场景分析的多任务网络设计方法,包括以下步骤:
A、多任务网络结构设计
多任务网络包括编码器、分割解码器和检测解码器。所述的编码器包含卷积层和下采样层,所述的卷积层采用深度残差网络中的三层残差学习单元,用来从原始图像提取特征信息,得到特征图;所述的下采样层的卷积核大小为3×3、步长为2,用来缩小特征图的尺寸;在编码器的最后,包含一个空间金字塔池化层,用来提取特征图中不同尺度的信息。通过卷积和下采样的层级组合,编码器输出特征图尺寸为输入图像尺寸的1/32,这些特征图作为分割解码器和检测解码器的输入。所述的分割解码器为多尺度结构,首先通过多级的双线性差值方法对输入特征图进行上采样,扩大特征图的尺寸,然后在编码器的1/8尺寸特征图和1/16尺寸特征图处,分别使用1×1卷积核对编码器中特征图执行卷积操作,并将输出特征图与分割解码器中上采样后的对应大小的特征图进行相加,以此来弥补编码器中下采样层带来的图像细节丢失的问题。所述的检测解码器基于回归的方法,对输入特征图进行处理,输出对应的目标检测结果。
B、多任务网络的训练方法
使用深度学习框架Tensorflow对上述多任务网络进行配置、训练和测试。网络训练的目标函数定义为分割解码器和检测解码器的损失函数之和,采用交叉熵损失函数作为分割解码器的损失函数,且仅利用分割解码器最后一层输出的特征图来计算损失值,公式如下:
式中,LS是损失值,q是标签,p是预测值,C是类别数量,N是训练批次中的样本数量,i表示第i个类别。检测解码器的损失函数定义为置信度的交叉熵损失函数和边界框坐标的L1损失函数的总和,公式如下:
式中(x,y)是边界框的中心点坐标,Lb是损失值,q是标签,p是预测值,N是一个训练批次中的样本数量,w和h分别是边界框的高和宽,i表示第i个类别。
在反向传播阶段,利用适应性阶梯算法即Adam优化器对多任务网络权重进行优化。Adam优化器是一种基于梯度下降的方法,使用梯度一阶矩估计和二阶矩估计来动态调整每个参数的学习速率。训练时,采用小批量梯度下降的方法,小批量值设置为3-5,学习率设置为0.00005-0.00015。采用L2正则化方法,正则化系数设置为0.0003-0.0007。
采用KITTI道路基准数据集和KITTI目标基准数据集对多任务网络进行训练和测试。采用MaxF1来评估网络的语义分割性能,采用平均精度得分来评估网络的目标检测性能。训练时的最大迭代次数设置为200000,每隔2000次迭代在验证集上测试网络的性能,在大约170000次迭代以后,网络开始收敛。训练结束后,采用数据集中的图片对网络进行测试,
本发明不局限于本实施例,任何在本发明披露的技术范围内的等同构思或者改变,均列为本发明的保护范围。
Claims (1)
1.一种基于多任务网络的交通场景解析方法,其特征在于:包括以下步骤:
A、多任务网络结构设计
多任务网络包括编码器、分割解码器和检测解码器;所述的编码器包含卷积层和下采样层,所述的卷积层采用深度残差网络中的三层残差学习单元,用来从原始图像提取特征信息,得到特征图;所述的下采样层的卷积核大小为3×3、步长为2,用来缩小特征图的尺寸;在编码器的最后,包含一个空间金字塔池化层,用来提取特征图中不同尺度的信息;编码器输出的特征图作为分割解码器和检测解码器的输入;所述的分割解码器为多尺度结构,首先通过多级的双线性差值方法对输入特征图进行上采样,扩大特征图的尺寸,然后采用1×1卷积核对编码器中不同尺寸的特征图执行卷积操作,并将输出特征图与分割解码器中上采样后的对应大小的特征图进行相加,以此来弥补编码器中下采样层带来的图像细节丢失的问题;所述的检测解码器基于回归的方法,对输入特征图进行处理,输出对应的目标检测结果;
B、多任务网络的训练
使用深度学习框架Tensorflow对上述多任务网络进行配置、训练和测试;网络训练的目标函数定义为分割解码器和检测解码器的损失函数之和,采用交叉熵损失函数作为分割解码器的损失函数,且仅利用分割解码器最后一层输出的特征图来计算损失值,公式如下:
式中,LS是损失值,q是标签,p是预测值,C是类别数量,N是训练批次中的样本数量,i表示第i个类别;检测解码器的损失函数定义为置信度的交叉熵损失函数和边界框坐标的L1损失函数的总和,公式如下:
式中(x,y)是边界框的中心点坐标,Lb是损失值,q是标签,p是预测值,N是一个训练批次中的样本数量,w和h分别是边界框的高和宽,i表示第i个类别;
在反向传播阶段,利用适应性阶梯算法即Adam优化器对多任务网络权重进行优化;Adam优化器是一种基于梯度下降的方法,使用梯度一阶矩估计和二阶矩估计来动态调整每个参数的学习速率;训练时,采用小批量梯度下降的方法,小批量值设置为3-5,学习率设置为0.00005-0.00015;采用L2正则化方法,正则化系数设置为0.0003-0.0007;
采用KITTI道路基准数据集和KITTI目标基准数据集对多任务网络进行训练和测试。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810842269.2A CN108985250A (zh) | 2018-07-27 | 2018-07-27 | 一种基于多任务网络的交通场景解析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810842269.2A CN108985250A (zh) | 2018-07-27 | 2018-07-27 | 一种基于多任务网络的交通场景解析方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108985250A true CN108985250A (zh) | 2018-12-11 |
Family
ID=64551963
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810842269.2A Pending CN108985250A (zh) | 2018-07-27 | 2018-07-27 | 一种基于多任务网络的交通场景解析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108985250A (zh) |
Cited By (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109829926A (zh) * | 2019-01-30 | 2019-05-31 | 杭州鸿泉物联网技术股份有限公司 | 道路场景语义分割方法及装置 |
CN110097084A (zh) * | 2019-04-03 | 2019-08-06 | 浙江大学 | 通过投射特征训练多任务学生网络的知识融合方法 |
CN110110719A (zh) * | 2019-03-27 | 2019-08-09 | 浙江工业大学 | 一种基于注意层区域卷积神经网络的目标检测方法 |
CN110458203A (zh) * | 2019-07-19 | 2019-11-15 | 北京科技大学 | 一种广告图像素材检测方法 |
CN111178181A (zh) * | 2019-12-16 | 2020-05-19 | 深圳市华尊科技股份有限公司 | 交通场景分割方法及相关装置 |
CN111222512A (zh) * | 2019-12-30 | 2020-06-02 | 河北工业大学 | 适用于储罐金属立面表面场景的深度学习语义分割方法 |
CN111310574A (zh) * | 2020-01-17 | 2020-06-19 | 清华大学 | 一种车载视觉实时多目标多任务联合感知方法和装置 |
CN111339919A (zh) * | 2020-02-24 | 2020-06-26 | 大连理工大学 | 一种基于多任务协作的镜子检测方法 |
CN111898439A (zh) * | 2020-06-29 | 2020-11-06 | 西安交通大学 | 基于深度学习的交通场景联合目标检测和语义分割方法 |
CN112070772A (zh) * | 2020-08-27 | 2020-12-11 | 闽江学院 | 基于UNet++和ResNet的血液白细胞图像分割方法 |
CN112101205A (zh) * | 2020-09-15 | 2020-12-18 | 东软睿驰汽车技术(沈阳)有限公司 | 基于多任务网络的训练方法和装置 |
CN112183395A (zh) * | 2020-09-30 | 2021-01-05 | 深兰人工智能(深圳)有限公司 | 基于多任务学习神经网络的道路场景识别方法和*** |
CN112232445A (zh) * | 2020-12-11 | 2021-01-15 | 北京世纪好未来教育科技有限公司 | 多标签分类任务网络的训练方法和装置 |
CN112347933A (zh) * | 2020-11-06 | 2021-02-09 | 浙江大华技术股份有限公司 | 一种基于视频流的交通场景理解方法及装置 |
CN112989867A (zh) * | 2019-12-02 | 2021-06-18 | 北京华航无线电测量研究所 | 目标检测与场景分割一体化网络设计方法 |
CN113011202A (zh) * | 2021-03-23 | 2021-06-22 | 中国科学院自动化研究所 | 基于多任务训练的端到端图像文本翻译方法、***、装置 |
CN113079391A (zh) * | 2020-12-31 | 2021-07-06 | 无锡乐骐科技有限公司 | 一种人像图像混合处理方法、设备及计算机可读存储介质 |
CN113076902A (zh) * | 2021-04-12 | 2021-07-06 | 华南理工大学 | 一种多任务融合的人物细粒度分割***和方法 |
CN113569853A (zh) * | 2021-06-25 | 2021-10-29 | 北京机械设备研究所 | 一种基于多任务学习的特征点提取与语义分割方法 |
CN113762476A (zh) * | 2021-09-08 | 2021-12-07 | 中科院成都信息技术股份有限公司 | 一种用于文字检测的神经网络模型及其文字检测方法 |
CN115953394A (zh) * | 2023-03-10 | 2023-04-11 | 中国石油大学(华东) | 基于目标分割的海洋中尺度涡检测方法及*** |
CN116895023A (zh) * | 2023-09-11 | 2023-10-17 | 中国石油大学(华东) | 一种基于多任务学习的中尺度涡识别方法及*** |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107316307A (zh) * | 2017-06-27 | 2017-11-03 | 北京工业大学 | 一种基于深度卷积神经网络的中医舌图像自动分割方法 |
CN107451620A (zh) * | 2017-08-11 | 2017-12-08 | 深圳市唯特视科技有限公司 | 一种基于多任务学习的场景理解方法 |
US20170372199A1 (en) * | 2016-06-23 | 2017-12-28 | Microsoft Technology Licensing, Llc | Multi-domain joint semantic frame parsing |
CN108304765A (zh) * | 2017-12-11 | 2018-07-20 | 中国科学院自动化研究所 | 用于人脸关键点定位与语义分割的多任务检测装置 |
-
2018
- 2018-07-27 CN CN201810842269.2A patent/CN108985250A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170372199A1 (en) * | 2016-06-23 | 2017-12-28 | Microsoft Technology Licensing, Llc | Multi-domain joint semantic frame parsing |
CN107316307A (zh) * | 2017-06-27 | 2017-11-03 | 北京工业大学 | 一种基于深度卷积神经网络的中医舌图像自动分割方法 |
CN107451620A (zh) * | 2017-08-11 | 2017-12-08 | 深圳市唯特视科技有限公司 | 一种基于多任务学习的场景理解方法 |
CN108304765A (zh) * | 2017-12-11 | 2018-07-20 | 中国科学院自动化研究所 | 用于人脸关键点定位与语义分割的多任务检测装置 |
Non-Patent Citations (4)
Title |
---|
HENGSHUANG ZHAO ET AL: "ICNet for Real-Time Semantic Segmentation on High-Resolution Images", 《ARXIV》 * |
MARVIN TEICHMANN ET AL: "MultiNet: Real-time Joint Semantic Reasoning for Autonomous Driving", 《ARXIV》 * |
李琳辉: "基于卷积神经网络的交通场景语义分割方法研究", 《通信学报》 * |
李琳辉等: "基于卷积神经网络的道路车辆检测方法", 《吉林大学学报(工学版)》 * |
Cited By (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109829926A (zh) * | 2019-01-30 | 2019-05-31 | 杭州鸿泉物联网技术股份有限公司 | 道路场景语义分割方法及装置 |
CN110110719A (zh) * | 2019-03-27 | 2019-08-09 | 浙江工业大学 | 一种基于注意层区域卷积神经网络的目标检测方法 |
CN110097084A (zh) * | 2019-04-03 | 2019-08-06 | 浙江大学 | 通过投射特征训练多任务学生网络的知识融合方法 |
CN110097084B (zh) * | 2019-04-03 | 2021-08-31 | 浙江大学 | 通过投射特征训练多任务学生网络的知识融合方法 |
CN110458203A (zh) * | 2019-07-19 | 2019-11-15 | 北京科技大学 | 一种广告图像素材检测方法 |
CN110458203B (zh) * | 2019-07-19 | 2021-11-30 | 北京科技大学 | 一种广告图像素材检测方法 |
CN112989867A (zh) * | 2019-12-02 | 2021-06-18 | 北京华航无线电测量研究所 | 目标检测与场景分割一体化网络设计方法 |
CN111178181B (zh) * | 2019-12-16 | 2023-06-09 | 深圳市华尊科技股份有限公司 | 交通场景分割方法及相关装置 |
CN111178181A (zh) * | 2019-12-16 | 2020-05-19 | 深圳市华尊科技股份有限公司 | 交通场景分割方法及相关装置 |
CN111222512B (zh) * | 2019-12-30 | 2023-04-21 | 河北工业大学 | 适用于储罐金属立面表面场景的深度学习语义分割方法 |
CN111222512A (zh) * | 2019-12-30 | 2020-06-02 | 河北工业大学 | 适用于储罐金属立面表面场景的深度学习语义分割方法 |
CN111310574A (zh) * | 2020-01-17 | 2020-06-19 | 清华大学 | 一种车载视觉实时多目标多任务联合感知方法和装置 |
CN111339919A (zh) * | 2020-02-24 | 2020-06-26 | 大连理工大学 | 一种基于多任务协作的镜子检测方法 |
CN111339919B (zh) * | 2020-02-24 | 2022-10-14 | 大连理工大学 | 一种基于多任务协作的镜子检测方法 |
CN111898439A (zh) * | 2020-06-29 | 2020-11-06 | 西安交通大学 | 基于深度学习的交通场景联合目标检测和语义分割方法 |
CN112070772B (zh) * | 2020-08-27 | 2024-01-12 | 闽江学院 | 基于UNet++和ResNet的血液白细胞图像分割方法 |
CN112070772A (zh) * | 2020-08-27 | 2020-12-11 | 闽江学院 | 基于UNet++和ResNet的血液白细胞图像分割方法 |
CN112101205A (zh) * | 2020-09-15 | 2020-12-18 | 东软睿驰汽车技术(沈阳)有限公司 | 基于多任务网络的训练方法和装置 |
CN112183395A (zh) * | 2020-09-30 | 2021-01-05 | 深兰人工智能(深圳)有限公司 | 基于多任务学习神经网络的道路场景识别方法和*** |
CN112347933A (zh) * | 2020-11-06 | 2021-02-09 | 浙江大华技术股份有限公司 | 一种基于视频流的交通场景理解方法及装置 |
CN112232445A (zh) * | 2020-12-11 | 2021-01-15 | 北京世纪好未来教育科技有限公司 | 多标签分类任务网络的训练方法和装置 |
CN113079391A (zh) * | 2020-12-31 | 2021-07-06 | 无锡乐骐科技有限公司 | 一种人像图像混合处理方法、设备及计算机可读存储介质 |
CN113011202A (zh) * | 2021-03-23 | 2021-06-22 | 中国科学院自动化研究所 | 基于多任务训练的端到端图像文本翻译方法、***、装置 |
CN113011202B (zh) * | 2021-03-23 | 2023-07-25 | 中国科学院自动化研究所 | 基于多任务训练的端到端图像文本翻译方法、***、装置 |
CN113076902B (zh) * | 2021-04-12 | 2023-07-18 | 华南理工大学 | 一种多任务融合的人物细粒度分割***和方法 |
CN113076902A (zh) * | 2021-04-12 | 2021-07-06 | 华南理工大学 | 一种多任务融合的人物细粒度分割***和方法 |
CN113569853A (zh) * | 2021-06-25 | 2021-10-29 | 北京机械设备研究所 | 一种基于多任务学习的特征点提取与语义分割方法 |
CN113569853B (zh) * | 2021-06-25 | 2024-04-09 | 北京机械设备研究所 | 一种基于多任务学习的特征点提取与语义分割方法 |
CN113762476B (zh) * | 2021-09-08 | 2023-12-19 | 中科院成都信息技术股份有限公司 | 一种用于文字检测的神经网络模型及其文字检测方法 |
CN113762476A (zh) * | 2021-09-08 | 2021-12-07 | 中科院成都信息技术股份有限公司 | 一种用于文字检测的神经网络模型及其文字检测方法 |
CN115953394A (zh) * | 2023-03-10 | 2023-04-11 | 中国石油大学(华东) | 基于目标分割的海洋中尺度涡检测方法及*** |
CN116895023A (zh) * | 2023-09-11 | 2023-10-17 | 中国石油大学(华东) | 一种基于多任务学习的中尺度涡识别方法及*** |
CN116895023B (zh) * | 2023-09-11 | 2024-02-09 | 中国石油大学(华东) | 一种基于多任务学习的中尺度涡识别方法及*** |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108985250A (zh) | 一种基于多任务网络的交通场景解析方法 | |
CN110135267B (zh) | 一种大场景sar图像细微目标检测方法 | |
CN110287960A (zh) | 自然场景图像中曲线文字的检测识别方法 | |
CN111126472A (zh) | 一种基于ssd改进的目标检测方法 | |
CN108549893A (zh) | 一种任意形状的场景文本端到端识别方法 | |
CN110532859A (zh) | 基于深度进化剪枝卷积网的遥感图像目标检测方法 | |
CN110163187A (zh) | 基于f-rcnn的远距离交通标志检测识别方法 | |
CN111079739B (zh) | 一种多尺度注意力特征检测方法 | |
CN110782420A (zh) | 一种基于深度学习的小目标特征表示增强方法 | |
CN113807464B (zh) | 基于改进yolo v5的无人机航拍图像目标检测方法 | |
CN109583483A (zh) | 一种基于卷积神经网络的目标检测方法和*** | |
CN110443258B (zh) | 文字检测方法、装置、电子设备及存储介质 | |
CN111753828A (zh) | 一种基于深度卷积神经网络的自然场景水平文字检测方法 | |
CN106600595A (zh) | 一种基于人工智能算法的人体特征尺寸自动测量方法 | |
CN109711401A (zh) | 一种基于Faster Rcnn的自然场景图像中的文本检测方法 | |
CN110263731B (zh) | 一种单步人脸检测*** | |
CN114092487A (zh) | 目标果实实例分割方法及*** | |
CN106874879A (zh) | 基于多特征融合和深度学习网络提取的手写数字识别方法 | |
CN116645592B (zh) | 一种基于图像处理的裂缝检测方法和存储介质 | |
CN114842208A (zh) | 一种基于深度学习的电网危害鸟种目标检测方法 | |
CN111695463A (zh) | 人脸面部杂质检测模型的训练方法、人脸面部杂质检测方法 | |
CN116994140A (zh) | 基于遥感影像的耕地提取方法、装置、设备和介质 | |
CN117079098A (zh) | 一种基于位置编码的空间小目标检测方法 | |
CN115527098A (zh) | 基于全局均值对比度空间注意力的红外小目标检测方法 | |
CN116229226A (zh) | 一种适用于光电吊舱的双通道图像融合目标检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20181211 |