CN109409197A - 一种基于神经网络的碗碟检测方法 - Google Patents

一种基于神经网络的碗碟检测方法 Download PDF

Info

Publication number
CN109409197A
CN109409197A CN201811007923.4A CN201811007923A CN109409197A CN 109409197 A CN109409197 A CN 109409197A CN 201811007923 A CN201811007923 A CN 201811007923A CN 109409197 A CN109409197 A CN 109409197A
Authority
CN
China
Prior art keywords
neural network
dishes
detection method
image
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811007923.4A
Other languages
English (en)
Inventor
陈晓鹏
杨德顺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Send Cheng Ke Food Information Technology Co Ltd
Original Assignee
Guangzhou Send Cheng Ke Food Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Send Cheng Ke Food Information Technology Co Ltd filed Critical Guangzhou Send Cheng Ke Food Information Technology Co Ltd
Priority to CN201811007923.4A priority Critical patent/CN109409197A/zh
Publication of CN109409197A publication Critical patent/CN109409197A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开一种基于神经网络的碗碟检测方法,包括以下步骤:S1,获取图像并输入YOLO神经网络;S2,训练YOLO神经网络;S3,获取训练好的神经网络模型的置信度参数,得到关键特征;S4,设置置信度阈值,选择并匹配边界框的目标;S5,使用神经网络最终抽取的特征进行碗碟图像分类;S6,根据模型参数输出参数并框出目标。本发明基于对图像进行全局信息预测,减少网络中的卷积层,简化了检测步骤,提升了检测的准确率和速度。

Description

一种基于神经网络的碗碟检测方法
技术领域
本发明涉及一种碗碟检测方法,尤其涉及一种基于神经网络的碗碟检测方法。
背景技术
随着智能化技术的发展,基于深度学习的神经网络技术已经可以应用在目标检测中。在碗碟检测方面,目前的检测方法大部分是基于轮廓检测,或者是根据相对规则的外观采取人为设置目标形状特征进行检测,并不是基于全局信息进行预测。这种方式只能针对特定目标,对环境要求也较为苛刻,碗碟的摆放,菜品的干扰等会导致在使用过程中出现无法检测等异常情况,造成检测准确率低。并且这种网络模型检测时会消耗较高的运算资源,导致检测速度下降而不能达到视频流的状态。
发明内容
本发明提供一种基于神经网络的碗碟检测方法,旨在解决目前碗碟检测准确率低,速度慢的问题。
本发明所述的一种基于神经网络的碗碟检测方法,包括以下步骤:
S1,获取图像并输入YOLO神经网络;
S2,训练YOLO神经网络;
S3,获取训练好的神经网络模型的置信度参数,得到关键特征;
S4,设置置信度阈值,选择并匹配边界框的目标;
S5,使用神经网络最终抽取的特征进行碗碟图像分类;
S6,根据模型参数输出参数并框出目标。
本发明是基于图像的全局信息进行预测,通过YOLO神经网络提取特征训练,对获取的碗碟图像目标进行边界框的置信度计算,通过将置信度信息与特征类别进行比较,得出检测目标。本发明采用YOLO神经网络,相比其他神经网络,YOLO的卷积层减少,结构简单,维度计算较低,提升了算法的速度。除此之外,使用经过训练的YOLO神经网络,计算更多边界框的置信度并排除干扰,使检测准确率提高。
附图说明
图1是一种基于神经网络的碗碟检测方法流程图1;
图2是一种基于神经网络的碗碟检测方法流程图2;
图3是一种基于神经网络的碗碟检测方法流程图3;
图4是一种基于神经网络的碗碟检测方法流程图4。
具体实施方式
下面结合附图和实施例对本发明作进一步说明。
如图1所示,一种基于神经网络的碗碟检测方法,包括以下步骤:S1,获取图像并输入YOLO神经网络;S2,训练YOLO神经网络;S3,获取训练好的神经网络模型的置信度参数,得到关键特征;S4,设置置信度阈值,选择并匹配边界框的目标;S5,使用神经网络最终抽取的特征进行碗碟图像分类;S6,根据模型参数输出参数并框出目标。本发明采用YOLO神经网络对图像进行全局信息预测,并且可以减少卷积层,提升了检测的准确率和速度。
如图2所示,YOLO神经网络的训练步骤包括:S21,收集碗碟的各种样本,并制作可用的数据集;S22,设置神经网络结构,填写层参数;S23,配置GPU环境,采用双GPU模式;S24,使用测试集的图像测试,若测试置信度达到设定值则进入步骤S3,否则返回步骤S23。神经网络具有学习功能,在对神经网络进行大量的训练学习后,可以更加快速准确地检测目标。
其中,所述YOLO神经网络训练步骤S21包括以下步骤:S211,收集空碗碟和有菜式碗碟图像,调整为固定大小的图像;S212,为每个菜式图像分配对应的菜式名标签;S213,将图像和对应的标签分为训练集合测试集。本发明所使用的神经网络对碗碟进行检测,需要收集图像样本对神经网络进行训及测试,以便后续使用。
所述步骤S22包括以下步骤:S221,选取训练样本输入网络,设置神经网络结构;S222,根据神经网络结构设置网络层,根据目标感受野的设置,计算卷积核和池化层参数;S223,根据样本特征设置权值初始化类型和池化类型。其中目标感受野的范围是0.06-0.16,使用距离桌面110厘米的摄像头采集大小为1080*800的图像。本发明根据训练样本来设置神经网络,使其能够准确检测出
目标。
所述步骤S23包括以下步骤:S231,配置计算机资源配置GPU矩阵运算的加速环境;S232,根据网络模型训练结果的参数绘制变化曲线图;S233,根据S232得到的结果,对神经网络的结构进行调整。本发明通过配置GPU环境,采用双GPU模式,加速神经网络的迭代训练,进一步提升神经网络的学习速度。
如图3所示,所述步骤S3包括以下步骤:S31,使用神经网络模型,获取其中的置信度;S32,对置信度采取一定比例的抽取和删选;S33,对有效目标重新赋值和分类,计算图像目标物的边界框置信度。通过对置信度的抽取和删选,将不需要的目标过滤。
如图4所示,所述步骤S4包括以下步骤:S S41,设置置信度阈值范围;S42,确定置信度是否包含目标物;S43,排除同一目标多个置信度;S44,重复步骤S43,得到整幅图像的匹配类别。其中,置信度阈值范围设置为0.6-0.8。经过排除同一目标的多个置信度,可以排除同一个目标的多个干扰参数,提高了检测的准确率。
所述步骤S5包括以下步骤:S51,排除多个目标中的置信度较小目标;S52,获取每个目标的坐标和宽高数值;S53,根据获取目标的中心坐标,进行局部缩放使用。通过非极大值抑制,排除置信度较小的目标,提高检测的准确率。
对于本领域的技术人员来说,可根据以上描述的技术方案以及构思,做出其它各种相应的改变以及变形,而所有的这些改变以及变形都应该属于本发明权利要求的保护范围之内。

Claims (10)

1.一种基于神经网络的碗碟检测方法,其特征在于,包括以下步骤:
S1,获取图像并输入YOLO神经网络;
S2,设置网络结构并训练YOLO神经网络;
S3,获取训练好的神经网络模型的置信度参数,得到关键特征;
S4,设置置信度阈值,选择并匹配边界框的目标;
S5,使用神经网络最终抽取的特征进行碗碟图像分类;
S6,根据模型参数输出参数并框出目标。
2.根据权利要求1所述的一种基于神经网络的碗碟检测方法,其特征在于,步骤2包括以下步骤:
S21,收集碗碟的各种样本,并制作可用的数据集;
S22,设置神经网络结构,填写层参数设置;
S23,配置GPU环境,采用双GPU模式;
S24,使用测试集的图像测试,若测试置信度达到设定值则进入步骤S3,否则返回步骤S23。
3.根据权利要求2所述的一种基于神经网络的碗碟检测方法,其特征在于,步骤S21包括以下步骤:
S211,收集空碗碟和有菜式碗碟图像,调整为固定大小的图像;
S212,为每个菜式图像分配对应的菜式名标签;
S213,将图像和对应的标签分为训练集合测试集。
4.根据权利要求2所述的一种基于神经网络的碗碟检测方法,其特征在于,步骤S22包括以下步骤:
S221,选取训练样本输入网络,设置神经网络结构;
S222,根据神经网络结构设置网络层,根据目标感受野的设置,计算卷积核和池化层参数;
S223,根据样本特征设置权值初始化类型和池化类型。
5.根据权利要求4所述的一种基于神经网络的碗碟检测方法,其特征在于,步骤S222所述目标感受野的范围是0.06-0.16。
6.根据权利要求2所述的一种基于神经网络的碗碟检测方法,其特征在于,步骤S23包括以下步骤:
S231,配置计算机资源配置GPU矩阵运算的加速环境;
S232,根据网络模型训练结果的参数绘制变化曲线图;
S233,根据S232得到的结果,对神经网络的结构进行调整。
7.根据权利要求1所述的一种基于神经网络的碗碟检测方法,其特征在于,步骤S3包括以下步骤:
S31,使用神经网络模型,获取其中的置信度;
S32,对置信度采取一定比例的抽取和删选;
S33,对有效目标重新赋值和分类,计算图像目标物的边界框置信度。
8.根据权利要求1所述的一种基于神经网络的碗碟检测方法,其特征在于,步骤S4包括以下步骤:
S41,设置置信度阈值范围;
S42,确定置信度是否包含目标物;
S43,排除同一目标多个置信度;
S44,重复步骤S43,得到整幅图像的匹配类别。
9.根据权利要求8所述的一种基于神经网络的碗碟检测方法,其特征在于,步骤S41的置信度范围是0.6-0.8。
10.根据权利要求1所述的一种基于神经网络的碗碟检测方法,其特征在于,步骤S5包括以下步骤:
S51,排除多个目标中的置信度较小目标;
S52,获取每个目标的坐标和宽高数值;
S53,根据获取目标的中心坐标,进行局部缩放使用。
CN201811007923.4A 2018-08-31 2018-08-31 一种基于神经网络的碗碟检测方法 Pending CN109409197A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811007923.4A CN109409197A (zh) 2018-08-31 2018-08-31 一种基于神经网络的碗碟检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811007923.4A CN109409197A (zh) 2018-08-31 2018-08-31 一种基于神经网络的碗碟检测方法

Publications (1)

Publication Number Publication Date
CN109409197A true CN109409197A (zh) 2019-03-01

Family

ID=65463763

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811007923.4A Pending CN109409197A (zh) 2018-08-31 2018-08-31 一种基于神经网络的碗碟检测方法

Country Status (1)

Country Link
CN (1) CN109409197A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110955257A (zh) * 2019-12-17 2020-04-03 深圳市道通智能航空技术有限公司 一种多目标传输方法、***及遥控设备、无人机

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107134144A (zh) * 2017-04-27 2017-09-05 武汉理工大学 一种用于交通监控的车辆检测方法
CN107527009A (zh) * 2017-07-11 2017-12-29 浙江汉凡软件科技有限公司 一种基于yolo目标检测的遗留物检测方法
CN107742093A (zh) * 2017-09-01 2018-02-27 国网山东省电力公司电力科学研究院 一种红外图像电力设备部件实时检测方法、服务器及***

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107134144A (zh) * 2017-04-27 2017-09-05 武汉理工大学 一种用于交通监控的车辆检测方法
CN107527009A (zh) * 2017-07-11 2017-12-29 浙江汉凡软件科技有限公司 一种基于yolo目标检测的遗留物检测方法
CN107742093A (zh) * 2017-09-01 2018-02-27 国网山东省电力公司电力科学研究院 一种红外图像电力设备部件实时检测方法、服务器及***

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
赵俊: "基于深度神经网络的智能监控***的研究与实现", 《中国优秀硕士学位论文全文数据库信息科技辑(月刊)》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110955257A (zh) * 2019-12-17 2020-04-03 深圳市道通智能航空技术有限公司 一种多目标传输方法、***及遥控设备、无人机
CN110955257B (zh) * 2019-12-17 2024-02-09 深圳市道通智能航空技术股份有限公司 一种多目标传输方法、***及遥控设备、无人机

Similar Documents

Publication Publication Date Title
KR102236046B1 (ko) 얼굴 검출 훈련 방법, 장치 및 전자 장치
CN107657279B (zh) 一种基于少量样本的遥感目标检测方法
CN107316294B (zh) 一种基于改进的深度玻尔兹曼机肺结节特征提取方法
CN107633522B (zh) 基于局部相似性活动轮廓模型的脑部图像分割方法和***
CN110020592A (zh) 物体检测模型训练方法、装置、计算机设备及存储介质
CN106408030B (zh) 基于中层语义属性和卷积神经网络的sar图像分类方法
CN108932479A (zh) 一种人体异常行为检测方法
CN105512676A (zh) 一种智能终端上的食物识别方法
CN105160400A (zh) 基于l21范数的提升卷积神经网络泛化能力的方法
CN104049639B (zh) 一种基于支持向量回归机的无人艇抗浪涌控制装置和方法
CN109272016A (zh) 目标检测方法、装置、终端设备和计算机可读存储介质
CN110378297A (zh) 一种基于深度学习的遥感图像目标检测方法
CN104077609A (zh) 一种基于条件随机场的显著性检测方法
CN108447057A (zh) 基于显著性和深度卷积网络的sar图像变化检测方法
CN106815323A (zh) 一种基于显著性检测的跨域视觉检索方法
CN105426895A (zh) 基于马尔科夫模型的显著性检测方法
US20030169919A1 (en) Data classifier for classifying pattern data into clusters
CN104182621A (zh) 基于深度信念网络的adhd判别分析方法
CN108960430A (zh) 为人体运动活动生成个性化分类器的方法和设备
CN104318271B (zh) 一种基于适应性编码和几何平滑汇合的图像分类方法
CN110458022A (zh) 一种基于域适应的可自主学习目标检测方法
CN108230313B (zh) 基于部件自适应选择与判别模型的sar图像目标检测方法
CN108805907B (zh) 一种行人姿势多特征智能辨识方法
Li et al. Artificial Intelligence and Neural Network‐Based Shooting Accuracy Prediction Analysis in Basketball
CN115346272A (zh) 基于深度图像序列的实时摔倒检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190301