CN110321969B - 一种基于mtcnn的车脸对齐方法 - Google Patents

一种基于mtcnn的车脸对齐方法 Download PDF

Info

Publication number
CN110321969B
CN110321969B CN201910625985.XA CN201910625985A CN110321969B CN 110321969 B CN110321969 B CN 110321969B CN 201910625985 A CN201910625985 A CN 201910625985A CN 110321969 B CN110321969 B CN 110321969B
Authority
CN
China
Prior art keywords
net
vehicle
mtcnn
algorithm model
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910625985.XA
Other languages
English (en)
Other versions
CN110321969A (zh
Inventor
朱顺意
范继辉
李广立
瞿明军
刘雪健
周莉
巩志远
陈建学
杜来民
邓国超
白玥寅
张松
周雨晨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Lingneng Electronic Technology Co ltd
Taiyuan University of Technology
Shandong University
Original Assignee
Shandong Lingneng Electronic Technology Co ltd
Taiyuan University of Technology
Shandong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Lingneng Electronic Technology Co ltd, Taiyuan University of Technology, Shandong University filed Critical Shandong Lingneng Electronic Technology Co ltd
Priority to CN201910625985.XA priority Critical patent/CN110321969B/zh
Publication of CN110321969A publication Critical patent/CN110321969A/zh
Application granted granted Critical
Publication of CN110321969B publication Critical patent/CN110321969B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/08Detecting or categorising vehicles
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种基于MTCNN的车脸对齐方法,属于车辆识别领域,包括:将车辆数据集划分为训练集和测试集,使用LabelImg工具标注训练数据集;修改MTCNN算法模型中的图像读取文件,更改特征点数量;训练MTCNN算法模型;指定目标图片并构建图像金字塔;将图像金字塔导入MTCNN算法模型,经过P‑Net进行第一级处理;P‑Net的输出结果进入R‑Net进行第二级处理;R‑Net的输出结果进入O‑Net进行第三级处理,识别出车脸边框及特征点;对MTCNN算法模型的输出结果进行仿射变换。本发明解决了车辆识别中车脸对齐这个关键问题,有效提升了车辆识别的泛化能力和准确率。

Description

一种基于MTCNN的车脸对齐方法
技术领域
本发明涉及一种基于MTCNN的车脸对齐方法,属于车辆识别技术领域。
背景技术
车辆识别一直以车牌识别技术为主,当出现恶意污损、遮挡车牌,套牌以及恶劣天气时,车牌识别技术难以达到有效的车辆识别。这时需要一种更加智能的基于车牌以外的其他车辆特征进行车辆识别的技术,而车脸能够有效的表达车辆的外观属性,如品牌、车系、车型、款式、颜色及独特性标志等差异性元素,因此可以使用车脸图像来对车辆进行识别。基于车脸识别的车辆识别技术,可以应用于公安机关快速检索和布控,以及恶劣天气多发区,有效提高车辆识别率。
车脸的识别分为两大步骤:车脸对齐与车脸检测。在车脸图像中,车脸的距离、方向、大小等各种条件各不一样,因此提取车脸特征之前,首先需要车脸对齐,车脸对齐指的是在车脸图像提取特征之前,将不同的车脸图像调整到一致(距离、方向、大小等)。
MTCNN算法一直以来应用于人脸识别领域中的人脸对齐环节,具有速度快、误检率低、泛化能力强的优点,但目前并没有将MTCNN算法移植到车脸对齐上的案例。车脸对齐与人脸对齐具有一定的相似度,但也存在不同,其难点在于特征点的选取。
发明内容
针对现有技术的不足,本发明提供一种基于MTCNN的车脸对齐方法,解决了车脸识别中车脸对齐的问题,有效提升了车辆识别的泛化能力和准确率。
本发明采用以下技术方案:
一种基于MTCNN的车脸对齐方法,包括以下步骤:
(1)将车辆数据集划分为训练集和测试集,使用LabelImg工具标注训练数据集;
(2)MTCNN算法模型是现有的用于处理人脸对齐的模型,本发明修改MTCNN算法中的图像读取文件,更改特征点数量,将原本读取5个特征点更改为读取4个特征点;
(3)训练MTCNN算法模型;
(4)指定目标图片并使用resize()构建图像金字塔;
(5)将图像金字塔导入MTCNN算法模型,经过P-Net进行第一级处理;
(6)P-Net的输出结果进入R-Net进行第二级处理;
(7)R-Net的输出结果进入O-Net进行第三级处理,识别出车脸边框及特征点;
(8)对MTCNN算法模型的输出结果进行仿射变换。
优选的,所述步骤(1)前还包括准备车辆数据集,此处的车辆数据集为多张车脸图像,需要保证采集的车辆图像包含车脸且具有尺度、场景的变化,即各张车脸所对应的尺度、场景应该有所不同,不能全部一样。
优选的,所述步骤(1)进一步为:
将车辆数据集划分为训练集和测试集,可随机划分,划分比例优选为:训练集占90%,测试集占10%,下载并安装LabelImg工具,将类别文件中的值改为car,考虑到车脸的对称性,选取车前窗左下角、右下角,车头左下角、右下角四个细节丰富、特征明显的特征点,对训练集中的车辆图像标注(可采用LabelImg工具手动标注)车前窗左下角、右下角,车头左下角、右下角,共四个特征点,即收集车脸四角在图像中的位置信息。
优选的,所述步骤(2)进一步为:
修改MTCNN算法模型中的图像读取label.xml标签文件的函数,通过函数读取特征点向量列表,即lable.xml,将读取到的的特征点向量列表的第7、8位删除(读取函数在修改后会自动在读取后将第7、8位删除),即删除第五个点的坐标数据,更改特征点个数为4。
优选的,所述步骤(3)进一步为:
使用标注后的训练集中的图像进行算法模型的训练,得到训练后的MTCNN算法模型,训练过程可参考现有技术进行。
优选的,所述步骤(4)进一步为:
指定目标图像,即指定测试集中的一张图像(或其他来源的包含车脸的图片)进行算法模型的应用验证;
对给定的车辆图像,使用resize()函数将其缩放到不同尺度形成图像金字塔,以适应不同大小的车脸。本发明的图像金字塔中,可以在代码中人为指定最大和最小尺寸,最小为20×20,最大为100×100,单位为像素,分辨率无要求。
优选的,所述步骤(5)进一步为:
将图像金字塔导入MTCNN算法模型,首先经过P-Net,通过一个全卷积神经网络(FCN)进行初步特征提取,生成预测窗和边框回归向量(bounding box regressionvectors),使用边框回归(Bounding-box regression)的方法来校正预测窗,并使用非极大值抑制(NMS)的方法来校正这些预测窗,合并重叠的预测窗。
优选的,所述步骤(6)进一步为:
P-Net的输出结果经过resize()函数修改大小(即缩放,可修改为24×24×3,单位为像素)后输入R-Net,R-Net的基本构造比P-Net增加了一个全连接层,用以滤除大量效果较差的预测窗,最后对选定的预测窗进行边框回归(Bounding-box regression)和非极大值抑制(NMS)进一步优化预测结果。
优选的,所述步骤(7)进一步为:
R-Net的输出结果经过resize()函数修改大小(即缩放,可修改为48×48×3,单位为像素)后输入O-Net,O-Net的基本构造比R-Net增加了一个卷积层,通过更多的监督学习来识别车脸区域,并对四个特征点进行回归,输出四个特征点,同时对选定的预测窗进行边框回归(Bounding-box regression)和非极大值抑制进一步优化预测结果,输出最终预测窗和4个特征点。
优选的,所述步骤(8)进一步为:
通过仿射变换算法,对MTCNN算法模型输出结果进行仿射变换,实现车脸图像的角度矫正和数据集增广。
本发明中,步骤(5)~步骤(8)中,将图像金字塔导入MTCNN,依次经过P-Net、R-Net、O-Net的过程及仿射变换过程,未详尽之处,均可采用现有技术进行。
本发明的有益效果为:
车脸对齐则是车脸识别技术的关键部分,本发明修改了输入,并将MTCNN算法应用在新的场景(车脸识别),可以作为车牌识别技术的有效补充。本发明将MTCNN算法移植到车脸对齐上,其难点在于特征点的选取,本发明根据车脸在对称性上的特点,改为选取车前窗左下角、右下角,车头左下角、右下角,总共四个特征点,可以有效实现算法的移植。
本发明在MTCNN人脸对齐的基础上进行解析,选取车前窗左下角、右下角,车头左下角、右下角四个细节丰富、特征明显的特征点,对标注后的训练集数据进行训练产出模型,并对输出结果进行仿射变换,实现了车脸对齐这一关键技术,本发明解决了车脸识别中车脸对齐的关键问题,提高了车脸检测的精度,进而提升了车辆识别的泛化能力和鲁棒性。
附图说明
图1为本发明的基于MTCNN的车脸对齐方法的流程图;
图2为以某一车脸图像为例,采用LabelImg工具标注车前窗左下角、右下角,车头左下角、右下角,共四个特征点位置示意图一;
图3为以某一车脸图像为例,采用LabelImg工具标注车前窗左下角、右下角,车头左下角、右下角,共四个特征点位置示意图一;
图4为MTCNN工作原理示意图。
具体实施方式:
为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述,但不仅限于此,本发明未详尽说明的,均按本领域常规技术。
实施例:
一种基于MTCNN的车脸对齐方法,如图1所示,包括以下步骤:
(1)将车辆数据集划分为训练集和测试集,使用LabelImg工具标注训练数据集;
步骤(1)前还包括准备车辆数据集,此处的车辆数据集为多张车脸图像,需要保证采集的车辆图像包含车脸且具有尺度、场景的变化,即各张车脸所对应的尺度、场景应该有所不同,不能全部一样;
步骤(1)进一步为:
将车辆数据集划分为训练集和测试集,可随机划分,划分比例优选为:训练集占90%,测试集占10%,下载并安装LabelImg工具,将类别文件中的值改为car,考虑到车脸的对称性,选取车前窗左下角、右下角,车头左下角、右下角四个细节丰富、特征明显的特征点,对训练集中的车辆图像标注(可采用LabelImg工具手动标注)车前窗左下角、右下角,车头左下角、右下角,共四个特征点,即收集车脸四角在图像中的位置信息,如图2、图3所示。
(2)MTCNN算法模型是现有的用于处理人脸对齐的模型,其工作原理如图4所示,本发明修改MTCNN算法中的图像读取文件,更改特征点数量,将原本读取5个特征点更改为读取4个特征点;
步骤(2)进一步为:
修改MTCNN算法模型中的图像读取label.xml标签文件的函数,通过函数读取特征点向量列表,即lable.xml,将读取到的的特征点向量列表的第7、8位删除(读取函数在修改后会自动在读取后将第7、8位删除),即删除第五个点的坐标数据,更改特征点个数为4。
(3)训练MTCNN算法模型;
步骤(3)进一步为:
使用标注后的训练集中的图像进行算法模型的训练,得到训练后的MTCNN算法模型,训练过程可参考现有技术进行。
(4)指定目标图片并使用resize()构建图像金字塔;
步骤(4)进一步为:
指定目标图像,即指定测试集中的一张图像(或其他来源的包含车脸的图片)进行算法模型的应用验证;
对给定的车辆图像,使用resize()函数将其缩放到不同尺度形成图像金字塔,以适应不同大小的车脸。本发明的图像金字塔中,可以在代码中人为指定最大和最小尺寸,最小为20×20,最大为100×100,单位为像素,分辨率无要求。
(5)将图像金字塔导入MTCNN算法模型,经过P-Net进行第一级处理;
步骤(5)进一步为:
将图像金字塔导入MTCNN算法模型,首先经过P-Net,通过一个全卷积神经网络(FCN)进行初步特征提取,生成预测窗和边框回归向量(bounding box regressionvectors),使用边框回归(Bounding-box regression)的方法来校正预测窗,并使用非极大值抑制(NMS)的方法来校正这些预测窗,合并重叠的预测窗。
(6)P-Net的输出结果进入R-Net进行第二级处理;
步骤(6)进一步为:
P-Net的输出结果经过resize()函数修改大小(即缩放,可修改为24×24×3,单位为像素)后输入R-Net,R-Net的基本构造比P-Net增加了一个全连接层,用以滤除大量效果较差的预测窗,最后对选定的预测窗进行边框回归(Bounding-box regression)和非极大值抑制(NMS)进一步优化预测结果。
(7)R-Net的输出结果进入O-Net进行第三级处理,识别出车脸边框及特征点;
步骤(7)进一步为:
R-Net的输出结果经过resize()函数修改大小(即缩放,可修改为48×48×3,单位为像素)后输入O-Net,O-Net的基本构造比R-Net增加了一个卷积层,通过更多的监督学习来识别车脸区域,并对四个特征点进行回归,输出四个特征点,同时对选定的预测窗进行边框回归(Bounding-box regression)和非极大值抑制进一步优化预测结果,输出最终预测窗和4个特征点。
(8)通过仿射变换算法,对MTCNN算法模型输出结果进行仿射变换,实现车脸图像的角度矫正和数据集增广。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (4)

1.一种基于MTCNN的车脸对齐方法,其特征在于,包括以下步骤:
(1)将车辆数据集划分为训练集和测试集,使用LabelImg工具标注训练数据集;
(2)修改MTCNN算法模型中的图像读取文件,更改特征点数量;
(3)训练MTCNN算法模型;
(4)指定目标图片并构建图像金字塔;
(5)将图像金字塔导入MTCNN算法模型,经过P-Net进行第一级处理;
(6)P-Net的输出结果进入R-Net进行第二级处理;
(7)R-Net的输出结果进入O-Net进行第三级处理,识别出车脸边框及特征点;
(8)对MTCNN算法模型的输出结果进行仿射变换;
所述步骤(1)进一步为:
将车辆数据集划分为训练集和测试集,下载并安装LabelImg工具,选取车前窗左下角、右下角,车头左下角、右下角四个特征点,对训练集中的车辆图像标注车前窗左下角、右下角,车头左下角、右下角,共四个特征点,即收集车脸四角在图像中的位置信息;
所述步骤(2)进一步为:
修改MTCNN算法模型中的图像读取文件,将读取到的的特征点向量列表的第7、8位删除,即删除第五个点的坐标数据,更改特征点个数为4;
所述步骤(5)进一步为:
将图像金字塔导入MTCNN算法模型,首先经过P-Net,通过一个全卷积神经网络生成预测窗和边框回归向量,使用Bounding box regression的方法来校正预测窗,并使用非极大值抑制合并重叠的预测窗;
所述步骤(6)进一步为:
P-Net的输出结果经过resize()函数修改大小后输入R-Net,R-Net的基本构造比P-Net增加了一个全连接层,对选定的预测窗进行Bounding-Box Regression和非极大值抑制进一步优化预测结果;
所述步骤(7)进一步为:
R-Net的输出结果经过resize()函数修改大小后输入O-Net,O-Net的基本构造比R-Net增加了一个卷积层,通过,监督学习来识别车脸区域,并对四个特征点进行回归,同时对选定的预测窗进行边框回归和非极大值抑制进一步优化预测结果,输出最终预测窗和4个特征点;
所述步骤(8)进一步为:
通过仿射变换算法,对MTCNN算法模型输出结果进行仿射变换,实现车脸图像的角度矫正和数据集增广。
2.根据权利要求1所述的基于MTCNN的车脸对齐方法,其特征在于,所述步骤(1)前还包括准备车辆数据集,保证采集的车辆图像包含车脸且具有尺度、场景的变化。
3.根据权利要求1所述的基于MTCNN的车脸对齐方法,其特征在于,所述步骤(3)进一步为:
使用标注后的训练集中的图片进行算法模型的训练,得到训练后的MTCNN算法模型。
4.根据权利要求1所述的基于MTCNN的车脸对齐方法,其特征在于,所述步骤(4)进一步为:
指定目标图像,并对指定的车辆照片,使用resize()函数将其缩放到不同尺度形成图像金字塔。
CN201910625985.XA 2019-07-11 2019-07-11 一种基于mtcnn的车脸对齐方法 Active CN110321969B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910625985.XA CN110321969B (zh) 2019-07-11 2019-07-11 一种基于mtcnn的车脸对齐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910625985.XA CN110321969B (zh) 2019-07-11 2019-07-11 一种基于mtcnn的车脸对齐方法

Publications (2)

Publication Number Publication Date
CN110321969A CN110321969A (zh) 2019-10-11
CN110321969B true CN110321969B (zh) 2023-06-30

Family

ID=68121988

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910625985.XA Active CN110321969B (zh) 2019-07-11 2019-07-11 一种基于mtcnn的车脸对齐方法

Country Status (1)

Country Link
CN (1) CN110321969B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110781888B (zh) * 2019-10-25 2022-07-12 北京字节跳动网络技术有限公司 回归视频画面中屏幕的方法、装置、可读介质及电子设备
CN111429727B (zh) * 2020-04-23 2021-04-02 深圳智优停科技有限公司 一种开放式停车位中车牌识别方法及***
CN112215245A (zh) * 2020-11-05 2021-01-12 中国联合网络通信集团有限公司 一种图像识别方法及装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105335702A (zh) * 2015-10-15 2016-02-17 浙江捷尚视觉科技股份有限公司 一种基于统计学习的卡口车型识别方法
CN109359651A (zh) * 2018-11-08 2019-02-19 东风商用车有限公司 一种车牌定位处理器及其定位处理方法
CN109407080A (zh) * 2018-11-27 2019-03-01 东风商用车有限公司 一种基于双目摄像头的车辆测距***及其测距方法
CN109472193A (zh) * 2018-09-21 2019-03-15 北京飞搜科技有限公司 人脸检测方法及装置
CN109635768A (zh) * 2018-12-20 2019-04-16 深圳市捷顺科技实业股份有限公司 一种图像帧中停车位状态检测方法、***及相关设备
CN109657609A (zh) * 2018-12-19 2019-04-19 新大陆数字技术股份有限公司 人脸识别方法及***
CN109711407A (zh) * 2018-12-28 2019-05-03 深圳市捷顺科技实业股份有限公司 一种车牌识别的方法及相关装置
CN109874054A (zh) * 2019-02-14 2019-06-11 深兰科技(上海)有限公司 一种广告推荐方法及装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105335702A (zh) * 2015-10-15 2016-02-17 浙江捷尚视觉科技股份有限公司 一种基于统计学习的卡口车型识别方法
CN109472193A (zh) * 2018-09-21 2019-03-15 北京飞搜科技有限公司 人脸检测方法及装置
CN109359651A (zh) * 2018-11-08 2019-02-19 东风商用车有限公司 一种车牌定位处理器及其定位处理方法
CN109407080A (zh) * 2018-11-27 2019-03-01 东风商用车有限公司 一种基于双目摄像头的车辆测距***及其测距方法
CN109657609A (zh) * 2018-12-19 2019-04-19 新大陆数字技术股份有限公司 人脸识别方法及***
CN109635768A (zh) * 2018-12-20 2019-04-16 深圳市捷顺科技实业股份有限公司 一种图像帧中停车位状态检测方法、***及相关设备
CN109711407A (zh) * 2018-12-28 2019-05-03 深圳市捷顺科技实业股份有限公司 一种车牌识别的方法及相关装置
CN109874054A (zh) * 2019-02-14 2019-06-11 深兰科技(上海)有限公司 一种广告推荐方法及装置

Also Published As

Publication number Publication date
CN110321969A (zh) 2019-10-11

Similar Documents

Publication Publication Date Title
Uittenbogaard et al. Privacy protection in street-view panoramas using depth and multi-view imagery
CN105046196B (zh) 基于级联卷积神经网络的前车车辆信息结构化输出方法
CN110321969B (zh) 一种基于mtcnn的车脸对齐方法
US10198657B2 (en) All-weather thermal-image pedestrian detection method
CN113255659B (zh) 一种基于MSAFF-Yolov3的车牌校正检测识别方法
CN111967313B (zh) 一种深度学习目标检测算法辅助的无人机图像标注方法
CN110008909B (zh) 一种基于ai的实名制业务实时稽核***
CN110163188B (zh) 视频处理以及在视频中嵌入目标对象的方法、装置和设备
CN108154149B (zh) 基于深度学习网络共享的车牌识别方法
US20220198721A1 (en) Method, apparatus, and computer program product for training a signature encoding module and a query processing module using augmented data
CN112580657B (zh) 一种自学习字符识别方法
CN112052855A (zh) 一种基于深度学习的车牌识别方法及装置
CN113989794B (zh) 一种车牌检测和识别方法
CN116597270A (zh) 基于注意力机制集成学习网络的道路损毁目标检测方法
CN112001873B (zh) 一种基于集装箱x射线图像的数据生成方法
CN112990237A (zh) 基于深度学习的地铁隧道图像渗漏检测的方法
Shit et al. An encoder‐decoder based CNN architecture using end to end dehaze and detection network for proper image visualization and detection
CN108053409B (zh) 一种遥感影像分割基准库自动构建方法及其***
WO2024067732A1 (zh) 神经网络模型的训练方法、车辆视图的生成方法和车辆
CN106339684A (zh) 一种行人检测的方法、装置及车辆
CN112053407B (zh) 一种交通执法影像中基于ai技术的车道线自动检测方法
CN112686247A (zh) 一种身份证号码检测方法、装置、可读存储介质和终端
Bala et al. Image simulation for automatic license plate recognition
CN113743434A (zh) 一种目标检测网络的训练方法、图像增广方法及装置
CN116524725A (zh) 一种智能驾驶的交通标志图像数据识别***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant