CN111860499B - 一种基于特征分组的双线性卷积神经网络的汽车品牌识别方法 - Google Patents
一种基于特征分组的双线性卷积神经网络的汽车品牌识别方法 Download PDFInfo
- Publication number
- CN111860499B CN111860499B CN202010623874.8A CN202010623874A CN111860499B CN 111860499 B CN111860499 B CN 111860499B CN 202010623874 A CN202010623874 A CN 202010623874A CN 111860499 B CN111860499 B CN 111860499B
- Authority
- CN
- China
- Prior art keywords
- model
- bilinear
- image
- convolution
- neural network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/08—Detecting or categorising vehicles
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及图像细粒度分类技术领域,具体涉及一种基于特征分组的双线性卷积神经网络的汽车品牌识别方法,具体包括以下步骤:步骤1:利用目标检测模型SSD对原始数据集进行目标识别,裁剪出原始图像中包含车辆的区域;步骤2:对步骤1得到的裁剪图像进行数据扩充,让数据集达到特征分组的双线性卷积模型训练的要求;步骤3:利用扩充后的数据集对基于特征分组的双线性卷积模型进行训练;步骤4:基于特征分组的双线性卷积网络对输入图像进行汽车品牌识别;解决了传统车辆识别方法容易被复杂背景干扰以及识别模型参数量过多不易部署的问题;结合使用了目标检测模型来对目标区域进行提取,剔除了大部分的背景信息,减少了模型的识别难度。
Description
技术领域
本发明涉及图像细粒度分类技术领域,用于解决传统车辆识别方法容易被复杂背景干扰以及识别模型参数量过多不易部署的问题,具体涉及一种基于特征分组的双线性卷积神经网络的汽车品牌识别方法。
背景技术
汽车品牌识别技术主要是通过对输入图像的一系列处理工作,然后在图像中找出汽车所在的具体区域,然后对汽车进行品牌识别,在当今的日常生产生活中,汽车品牌识别技术在城市智能交通、互联网图像检索领域都有着巨大的应用前景。
原始的双线性卷积神经网络采用双线性的机制,使用两路卷积网络分别去提取图像中物体的特征,其大体思想是两路卷积分别取提取不同的特征,利用外积操作来获得高维度的细粒度特征,最后利用Sonmax或者SVM(Support Vector Machine)等分类器对提取特征进行分类。
目前细粒度分类技术相比于普通图像分类任务还存在很多难点,尤其是在复杂背景的应用场景下,待识别目标很容易被背景信息所干扰,会导致模型识别难度的提升;其次,目前的细粒度分类模型通常参数量比较多,需要设备具有大的显存或内存,不利于在应用场景中进行高效部署。
发明内容
本发明的目的在于:解决传统车辆识别方法容易被复杂背景干扰以及识别模型参数量过多不易部署的问题,提供一种基于特征分组的双线性卷积神经网络的汽车品牌识别方法,结合使用了目标检测模型来对目标区域进行提取,剔除了大部分的背景信息,减少了模型的识别难度;对原始双线性卷积神经网络进行了改进,首先使用了目标检测模型SSD对图像先进行目标提取;其次对双线性模型结构也进行了改进,利用特征分组模块大幅地降低了模型整体的参数量,让模型在实际场景下部署更容易;实现复杂背景下对车辆的识别。
本发明采用的技术方案如下:
一种基于特征分组的双线性卷积神经网络的汽车品牌识别方法,具体包括以下步骤:
步骤1:利用目标检测模型SSD对原始数据集进行目标识别,裁剪出原始图像中包含车辆的区域;
步骤2:对步骤1得到的裁剪图像进行数据扩充,让数据集达到特征分组的双线性卷积模型训练的要求;
步骤3:利用扩充后的数据集对基于特征分组的双线性卷积模型进行训练;
步骤4:基于特征分组的双线性卷积网络对输入图像进行汽车品牌识别。
进一步的,步骤1的具体方法如下:
步骤1-1:对收集的数据进行手工标注,构建汽车品牌原始数据集;
步骤1-2:利用目标检测模型SSD对原始图像进行目标检测,提取出图像中包含汽车的区域作为新的图像数据。
进一步的,步骤2的具体方法如下:
步骤2-1:将步骤1-2中获得的每张裁剪后的图片进行旋转、随机裁剪、翻转、仿射变换操作,将得到的图像并入步骤1-2的原始数据集中,得到最终扩充的数据集;
步骤2-2:将步骤2-1中得到的图像进行尺寸缩放,把全部图像的尺寸都固定为448*448。
进一步的,步骤3的具体方法如下:
步骤3-1:构建双线性卷积神经模型,获取到两路卷积特征图;
步骤3-2:加入特征分组模块,将步骤3-1得到的每一路特征图都分为类别数组,两路特征图进行组内外积操作,让双线性卷积模型的参数量大大降低;
步骤3-3:使用全局最大池化层去替换全连接层,有效地减少双线性卷积模型的参数量;
步骤3-4:将步骤2-2得到的训练数据集输入到步骤3-2得到的模型中进行训练;
步骤3-5:模型充分训练后得到基于特征分组的双线性模型的权值文件。
进一步的,所述步骤3-1中双线性卷积神经网络模型中两路卷积模型都选取Resnct-34网络模型。
进一步的,步骤4的具体方法如下:
步骤4-1:利用训练好的目标检测模型SSD对输入图像进行车辆检测,得到包含汽车的图像区域;
步骤4-2:将得到的裁剪图像缩放到448*448的尺寸;
步骤4-3:将步骤3-5训练好的权值文件载入到基于特征分组的双线性卷积神经网络中;
步骤4-4:将步骤4-2得到的图像输入到步骤4-3的模型中进行识别,最后通过Softmax分类器对图像进行分类;
步骤4-5:模型输出图像所对应的品牌分类。
综上所述,本发明相较于现有技术的有益效果是:
(1)本发明中,利用了目标检测模型对图像进行了目标定位,减少了复杂背景的干扰,很大程度上提高了车辆品牌识别的精度;
(2)本发明中,利用随机裁剪、水平翻转、旋转、仿射变换对图像进行数据扩充,一定程度上缓解了模型过拟合的问题,提高了模型预测精度;
(3)本发明中,采用的基于特征分组的双线性卷积神经网络的车型识别方法,与传统的双线性卷积网络方法相比,提出的基于特征分组改进方案能够有效地减少原始双线性卷积神经网络的参数量,提高模型的运行效率;
(4)本发明中,双线性卷积神经网络模型Resnet-34作为特征提取器,替换原始的Vgg-16模型。将识别精确度提高了1%;
(5)本发明中,使用全局最大池化层去替换原始模型中的全连接层,将模型的参数量进一步的减少。
附图说明
图1为本发明方法流程图;
图2为本发明步骤1方法效果图;
图3为本发明步骤2方法效果图;
图4为本发明步骤3方法结果图;
图5为本发明实施例识别与检测效果图;
图6为本发明步骤4方法结果图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明,即所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面结合附图1-6及实施例1对本发明作进一步说明。
实施例1:
一种基于特征分组的双线性卷积神经网络模型的汽车品牌识别方法,对图片中的汽车进行检测与品牌识别,参照图1,步骤如下:
步骤1:进行原始数据集扩充,得到规模达到进行区域卷积神经网络模型训练要求的扩充的数据集,具体为:
步骤1-1:对收集的数据进行手工标注,构建汽车品牌原始数据集,构建的数据集包括奥迪、奔驰、大众等110个不同品牌的汽车图像,取名为CarBrand-110;
步骤1-2:利用目标检测模型SSD对原始图像进行目标检测,提取出图像中包含汽车的区域作为新的图像数据;为了让基于特征分组的双线性卷积神经网络能够学习到一些背景信息,对目标检测区域进行图像裁剪时,会将目标检测模型得到的目标框向外扩展30个像素点的距离,裁剪后的效果图如附图2所示。
步骤2:对步骤1得到的裁剪图像进行数据扩充,让数据集达到特征分组的双线性卷积模型训练的要求,具体为:
步骤2-1:将步骤1-2中获得的每张裁剪后的图片进行旋转、随机裁剪、翻转、仿射变换操作,每个操作都对图像进行2次变换,最终可以得到8倍于原始数据集的扩充数据集。将得到的图像并入步骤12的原始数据集中,得到最终扩充的数据集;
步骤2-2:将步骤2-1中得到的图像进行尺寸缩放,把全部图像的尺寸都固定为448*448,且对图像像素值进行归一化处理,方便后续把图像输入到基于特征分组的双线性卷积神经网络中,数据扩充效果如图3所示;
步骤3:利用扩充后的数据集对基于特征分组的双线性卷积模型进行训练,流程图如图4所示,具体为:
步骤3-1:构建双线性卷积神经模型,特征提取器使用Resnet-34,能够分别获取到两路卷积特征图;
步骤3-2:加入特征分组模块,将步骤3-1得到的每一路特征图都分为类别数组,两路特征图进行组内外积操作,让双线性卷积模型的参数量大大降低;
步骤3-3:使用全局最大池化层去替换全连接层,有效地减少双线性卷积模型的参数量,结构如图5所示;
步骤3-4:将步骤2-2得到的训练数据集输入到步骤3-2得到的模型中进行训练;
步骤35:模型充分训练后得到基于特征分组的双线性模型的权值文件;
步骤4:利用扩充后的数据集对基于特征分组的双线性卷积模型进行训练,流程图如图6所示,具体为:
步骤4-1:利用训练好的目标检测模型SSD对输入图像进行车辆检测,得到包含汽车的图像区域;为了让基于特征分组的双线性卷积神经网络能够学习到一些有用的背景信息,对目标检测区域进行图像裁剪时,会将目标检测模型得到的目标框向外扩展30个像素点的距离;
步骤4-2:将得到的裁剪图像缩放到448*448的尺寸,且对图像像素值进行归一化处理,方便后续把图像输入到基于特征分组的双线性卷积神经网络中;
步骤4-3:将步骤3-4训练好的权值文件载入到基于特征分组的双线性卷积神经网络中;
步骤4-4:将步骤4-2得到的图像输入到步骤4-3的模型中进行识别,最后通过Softmax分类器对图像进行分类;
步骤4-5:模型输出图像所对应的品牌分类。
实施例1的识别与检测效果如图5所示。
以上所述实施例仅表达了本申请的具体实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请保护范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请技术方案构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。
Claims (6)
1.一种基于特征分组的双线性卷积神经网络的汽车品牌识别方法,其特征在于,具体包括以下步骤:
步骤1:利用目标检测模型SSD对原始数据集进行目标识别,裁剪出原始图像中包含车辆的区域;
步骤2:对步骤1得到的裁剪图像进行数据扩充,让数据集达到特征分组的双线性卷积模型训练的要求;
步骤3:利用扩充后的数据集对基于特征分组的双线性卷积模型进行训练;具体为:构建双线性卷积神经模型,特征提取器使用Resnet-34,能够分别获取到两路卷积特征图;加入特征分组模块,将每一路特征图都分为类别数组,两路特征图进行组内外积操作,让双线性卷积模型的参数量大大降低;
步骤4:基于特征分组的双线性卷积网络对输入图像进行汽车品牌识别。
2.根据权利要求1所述的一种基于特征分组的双线性卷积神经网络的汽车品牌识别方法,其特征在于,步骤1的具体方法如下:
步骤1-1:对收集的数据进行手工标注,构建汽车品牌原始数据集;
步骤1-2:利用目标检测模型SSD对原始图像进行目标检测,提取出图像中包含汽车的区域作为新的图像数据。
3.根据权利要求2所述的一种基于特征分组的双线性卷积神经网络的汽车品牌识别方法,其特征在于,步骤2的具体方法如下:
步骤2-1:将步骤1-2中获得的每张裁剪后的图片进行旋转、随机裁剪、翻转、仿射变换操作,将得到的图像并入步骤1-2的原始数据集中,得到最终扩充的数据集;
步骤2-2:将步骤2-1中得到的图像进行尺寸缩放,把全部图像的尺寸都固定为448*448。
4.根据权利要求3所述的一种基于特征分组的双线性卷积神经网络的汽车品牌识别方法,其特征在于,步骤3的具体方法如下:
步骤3-1:构建双线性卷积神经模型,获取到两路卷积特征图;
步骤3-2:加入特征分组模块,将步骤3-1得到的每一路特征图都分为类别数组,两路特征图进行组内外积操作,让双线性卷积模型的参数量大大降低;
步骤3-3:使用全局最大池化层去替换全连接层,有效地减少双线性卷积模型的参数量;
步骤3-4:将步骤2-2得到的训练数据集输入到步骤3-2得到的模型中进行训练;
步骤3-5:模型充分训练后得到基于特征分组的双线性模型的权值文件。
5.根据权利要求4所述的一种基于特征分组的双线性卷积神经网络的汽车品牌识别方法,其特征在于:所述步骤3-1中双线性卷积神经网络模型中两路卷积模型都选取Resnet-34网络模型。
6.根据权利要求4所述的一种基于特征分组的双线性卷积神经网络的汽车品牌识别方法,其特征在于,步骤4的具体方法如下:
步骤4-1:利用训练好的目标检测模型SSD对输入图像进行车辆检测,得到包含汽车的图像区域;
步骤4-2:将得到的裁剪图像缩放到448*448的尺寸;
步骤4-3:将步骤3-5训练好的权值文件载入到基于特征分组的双线性卷积神经网络中;
步骤4-4:将步骤4-2得到的图像输入到步骤4-3的模型中进行识别,最后通过Softmax分类器对图像进行分类;
步骤4-5:模型输出图像所对应的品牌分类。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010623874.8A CN111860499B (zh) | 2020-07-01 | 2020-07-01 | 一种基于特征分组的双线性卷积神经网络的汽车品牌识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010623874.8A CN111860499B (zh) | 2020-07-01 | 2020-07-01 | 一种基于特征分组的双线性卷积神经网络的汽车品牌识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111860499A CN111860499A (zh) | 2020-10-30 |
CN111860499B true CN111860499B (zh) | 2022-07-12 |
Family
ID=72988960
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010623874.8A Active CN111860499B (zh) | 2020-07-01 | 2020-07-01 | 一种基于特征分组的双线性卷积神经网络的汽车品牌识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111860499B (zh) |
Families Citing this family (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10678244B2 (en) | 2017-03-23 | 2020-06-09 | Tesla, Inc. | Data synthesis for autonomous control systems |
US11893393B2 (en) | 2017-07-24 | 2024-02-06 | Tesla, Inc. | Computational array microprocessor system with hardware arbiter managing memory requests |
US10671349B2 (en) | 2017-07-24 | 2020-06-02 | Tesla, Inc. | Accelerated mathematical engine |
US11157441B2 (en) | 2017-07-24 | 2021-10-26 | Tesla, Inc. | Computational array microprocessor system using non-consecutive data formatting |
US11409692B2 (en) | 2017-07-24 | 2022-08-09 | Tesla, Inc. | Vector computational unit |
US11561791B2 (en) | 2018-02-01 | 2023-01-24 | Tesla, Inc. | Vector computational unit receiving data elements in parallel from a last row of a computational array |
US11215999B2 (en) | 2018-06-20 | 2022-01-04 | Tesla, Inc. | Data pipeline and deep learning system for autonomous driving |
US11361457B2 (en) | 2018-07-20 | 2022-06-14 | Tesla, Inc. | Annotation cross-labeling for autonomous control systems |
US11636333B2 (en) | 2018-07-26 | 2023-04-25 | Tesla, Inc. | Optimizing neural network structures for embedded systems |
US11562231B2 (en) | 2018-09-03 | 2023-01-24 | Tesla, Inc. | Neural networks for embedded devices |
SG11202103493QA (en) | 2018-10-11 | 2021-05-28 | Tesla Inc | Systems and methods for training machine models with augmented data |
US11196678B2 (en) | 2018-10-25 | 2021-12-07 | Tesla, Inc. | QOS manager for system on a chip communications |
US11816585B2 (en) | 2018-12-03 | 2023-11-14 | Tesla, Inc. | Machine learning models operating at different frequencies for autonomous vehicles |
US11537811B2 (en) | 2018-12-04 | 2022-12-27 | Tesla, Inc. | Enhanced object detection for autonomous vehicles based on field view |
US11610117B2 (en) | 2018-12-27 | 2023-03-21 | Tesla, Inc. | System and method for adapting a neural network model on a hardware platform |
US10997461B2 (en) | 2019-02-01 | 2021-05-04 | Tesla, Inc. | Generating ground truth for machine learning from time series elements |
US11150664B2 (en) | 2019-02-01 | 2021-10-19 | Tesla, Inc. | Predicting three-dimensional features for autonomous driving |
US11567514B2 (en) | 2019-02-11 | 2023-01-31 | Tesla, Inc. | Autonomous and user controlled vehicle summon to a target |
US10956755B2 (en) | 2019-02-19 | 2021-03-23 | Tesla, Inc. | Estimating object properties using visual image data |
CN112837541B (zh) * | 2020-12-31 | 2022-04-29 | 遵义师范学院 | 基于改进ssd的智能交通车流量管理方法 |
CN113343881A (zh) * | 2021-06-21 | 2021-09-03 | 浪潮云信息技术股份公司 | 基于深度学习的车辆品牌型号细粒度分类***及方法 |
CN113837269A (zh) * | 2021-09-23 | 2021-12-24 | 中国特种设备检测研究院 | 基于双线性卷积神经网络的金相组织识别方法 |
CN116671919B (zh) * | 2023-08-02 | 2023-10-20 | 电子科技大学 | 一种基于可穿戴设备的情绪检测提醒方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106529578A (zh) * | 2016-10-20 | 2017-03-22 | 中山大学 | 一种基于深度学习的车辆品牌型号精细识别方法与*** |
CN108647682A (zh) * | 2018-05-17 | 2018-10-12 | 电子科技大学 | 一种基于区域卷积神经网络模型的品牌Logo检测与识别方法 |
CN109086792A (zh) * | 2018-06-26 | 2018-12-25 | 上海理工大学 | 基于检测和识别网络架构的细粒度图像分类方法 |
CN110097090A (zh) * | 2019-04-10 | 2019-08-06 | 东南大学 | 一种基于多尺度特征融合的图像细粒度识别方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200012884A1 (en) * | 2018-07-03 | 2020-01-09 | General Electric Company | Classification based on annotation information |
CN109684911B (zh) * | 2018-10-30 | 2021-05-11 | 百度在线网络技术(北京)有限公司 | 表情识别方法、装置、电子设备及存储介质 |
-
2020
- 2020-07-01 CN CN202010623874.8A patent/CN111860499B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106529578A (zh) * | 2016-10-20 | 2017-03-22 | 中山大学 | 一种基于深度学习的车辆品牌型号精细识别方法与*** |
CN108647682A (zh) * | 2018-05-17 | 2018-10-12 | 电子科技大学 | 一种基于区域卷积神经网络模型的品牌Logo检测与识别方法 |
CN109086792A (zh) * | 2018-06-26 | 2018-12-25 | 上海理工大学 | 基于检测和识别网络架构的细粒度图像分类方法 |
CN110097090A (zh) * | 2019-04-10 | 2019-08-06 | 东南大学 | 一种基于多尺度特征融合的图像细粒度识别方法 |
Non-Patent Citations (4)
Title |
---|
Non-Local Neural Networks with Grouped Bilinear Attentional Transforms;Lu Chi 等;《2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR)》;20200619;11804-11813 * |
基于双线性卷积神经网络的图像分类方法研究;金科;《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》;20200215(第02期);I138-1959 * |
基于双线性卷积神经网络的猪脸识别算法;秦兴 等;《杭州电子科技大学学报(自然科学版)》;20190331;第39卷(第2期);12-17 * |
基于深度神经网络的细粒度图像分类方法研究;郝雪洁;《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》;20200715(第07期);I138-1262 * |
Also Published As
Publication number | Publication date |
---|---|
CN111860499A (zh) | 2020-10-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111860499B (zh) | 一种基于特征分组的双线性卷积神经网络的汽车品牌识别方法 | |
CN111027493B (zh) | 一种基于深度学习多网络软融合的行人检测方法 | |
CN111753828B (zh) | 一种基于深度卷积神经网络的自然场景水平文字检测方法 | |
CN107358258B (zh) | 基于nsct双cnn通道和选择性注意机制的sar图像目标分类 | |
CN111179217A (zh) | 一种基于注意力机制的遥感图像多尺度目标检测方法 | |
CN111695514B (zh) | 一种基于深度学习的雾天下车辆检测方法 | |
CN109919145B (zh) | 一种基于3d点云深度学习的矿卡检测方法及*** | |
CN111461039B (zh) | 基于多尺度特征融合的地标识别方法 | |
CN111738344A (zh) | 一种基于多尺度融合的快速目标检测方法 | |
CN105069447A (zh) | 一种人脸表情的识别方法 | |
Cai et al. | Traffic sign recognition algorithm based on shape signature and dual-tree complex wavelet transform | |
CN104951793A (zh) | 一种基于stdf特征的人体行为识别算法 | |
CN112200186A (zh) | 基于改进yolo_v3模型的车标识别方法 | |
CN111104924B (zh) | 一种识别低分辨率商品图像的处理算法 | |
CN111709291B (zh) | 一种基于融合信息的外卖人员身份识别方法 | |
Thubsaeng et al. | Vehicle logo detection using convolutional neural network and pyramid of histogram of oriented gradients | |
CN114782417A (zh) | 基于边缘强化图像分割的风机数字孪生特征实时检测方法 | |
CN111639697A (zh) | 基于非重复采样与原型网络的高光谱图像分类方法 | |
CN114998756A (zh) | 一种基于yolov5的遥感图像检测方法、装置及存储介质 | |
CN114612820A (zh) | 一种基于类别感知特征聚合的视频目标检测方法 | |
CN112241736A (zh) | 一种文本检测的方法及装置 | |
CN107170004B (zh) | 一种无人车单目视觉定位中对匹配矩阵的图像匹配方法 | |
CN110580462B (zh) | 一种基于非局部网络的自然场景文本检测方法和*** | |
CN112418358A (zh) | 一种强化深度融合网络的车辆多属性分类方法 | |
CN112329647A (zh) | 基于U-Net神经网络的土地利用类型识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |