CN109978029B - 一种基于卷积神经网络的无效图像样本筛选方法 - Google Patents

一种基于卷积神经网络的无效图像样本筛选方法 Download PDF

Info

Publication number
CN109978029B
CN109978029B CN201910188287.8A CN201910188287A CN109978029B CN 109978029 B CN109978029 B CN 109978029B CN 201910188287 A CN201910188287 A CN 201910188287A CN 109978029 B CN109978029 B CN 109978029B
Authority
CN
China
Prior art keywords
sample
invalid
model
samples
images
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910188287.8A
Other languages
English (en)
Other versions
CN109978029A (zh
Inventor
张永军
闫思宇
沈涛
文韩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiamen Xinhang Century Information Technology Co ltd
Original Assignee
Beijing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Posts and Telecommunications filed Critical Beijing University of Posts and Telecommunications
Priority to CN201910188287.8A priority Critical patent/CN109978029B/zh
Publication of CN109978029A publication Critical patent/CN109978029A/zh
Application granted granted Critical
Publication of CN109978029B publication Critical patent/CN109978029B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/10Pre-processing; Data cleansing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于建立卷积神经网络过滤样本模型进行无效图像样本筛选的方法,原始样本通过经由卷积神经网络构建的过滤样本模型,将大量模糊、空拍及残损等无效样本(冗余样本)图像筛选出,其余样本即为质量更好、具有更多代表性的图像样本,可作为图像分类的有效样本集。该方法最终可以实现:将无效样本通过算法筛选出,减少将大量无效样本筛选出所耗费的工时,降低人工成本。

Description

一种基于卷积神经网络的无效图像样本筛选方法
技术领域
本发明涉及机器学习领域,特别是涉及一种基于建立卷积神经网络过滤样本模型进行无效图像样本筛选的方法。
背景技术
在在卷积神经网络进行图像分类时,需要大量图像样本进行分类作为样本库,用于构建模型。在实际的工业过程中,相对于正常工业过程而言,采集到的产品图像数据中往往存在一些无效的图像数据,例如流水线生产时会采集到的模糊图像、空拍图像以及残损图像等,这类图像对于模型的构建属于无效数据,所以该方法用于将模糊图像、空拍图像等从采集到的样本中筛选出,实现原始样本的清洗,减少筛选图像所耗费的工时,降低人工成本。
发明内容
本发明主要解决的技术问题是提供一种基于建立卷积神经网络过滤样本模型进行无效图像样本筛选的方法,能够花费更少的工时和人工成本将模糊图像、空拍图像等从采集到的样本中筛选出,实现原始样本的清洗。
为解决上述技术问题,本发明采用的一个技术方案是:将未标注的部分样本图像进行模糊处理,筛选出该部分样本极度模糊的图像,进行一次模糊清理。
处理过后的样本经过人工分类,分为无效图像即模糊图像、空拍图像等和有效样本图像。
经过过滤器处理的极度模糊图像也划分到无效图像一类,形成两种类型的图像划分,形成一个样本库。
CNN算法采用该样本库构建一个包含两种分类情况的分类器模型,之后用该模型进行样本清洗,实现筛选出大量样本中的无效样本,对样本进行清理。
本发明的有益效果是:本发明采用卷积神经网络进行样本清洗,实现筛选出大量样本中的无效样本,减少筛选图像所耗费的工时,降低人工成本。
附图说明
图1是基于建立卷积神经网络过滤样本模型进行无效图像样本筛选的方法的流程示意图;
图2是一种构建过滤样本模型的流程示意图;
具体实施方式
下面结合附图对本发明的较佳实施例进行详细阐述,以使本发明的优点和特征能更易于被本领域技术人员理解,从而对本发明的保护范围做出更为清楚明确的界定。
请参阅图1和图2,本发明实施例包括:
一种基于建立卷积神经网络过滤样本模型进行无效图像样本筛选的方法,运用卷积神经网络构建模型,将模型运用到采集样本中,花费更少的工时和人工成本将模糊图像、空拍图像等无效数据从采集到的样本中筛选出,实现原始样本的清洗。
实施例一:模糊、精化样本
(1)原始样本准备:在工业生产中采集生产产品的图像数据,以1000张作为基础数量。
(2)模糊过滤器:可以用opencv的cv2.Laplacian()方法,实现过滤模糊程度很高的图片,对样本实现一次清洗工作。
模糊、精化样本得到方式:将已准备的基础样本经过模糊过滤器,过滤出模糊程度较高的图片作为模糊样本、其余剩余样本则作为精化样本。
实施例二:样本集合
(1)人工过滤:在没有过滤样本模型时,需要采取人工过滤的方式,将精化样本分类成无效样本类型和有效样本类型。
(2)无效样本类型:将模糊图像、空拍图像以及残损等样本图像作为无效样本类型。
(3)有效样本类型:其他图片清晰、特征明显的图像作为有效样本类型。
(4)样本集合:无效样本和有效样本两个类型组成一个样本集合。
实施例三:构建过滤样本模型
(1)算法:基于深度卷积神经元网络算法实现样本清洗。
(2)判断样本数量以及比例:若正负样本不均衡可以采用以下方法:
过采样:增加样本中少数类样本的数量。复制少数样本或者在少数样本中加入随机噪声,干扰数据通过一定的规则生成一定的样本。
下采样:减少多数样本的数量。随机的去掉多数类样本,直到多数样本和少数样本相同。
(3)构建模型,当样本集合中正负样本数量合适且比例均衡时,开始计算模型,如图2的流程。
准确率(accuracy):
Figure BDA0001993552620000021
召回率(recall)是覆盖面的度量,度量有多个正例被分为正例:
Figure BDA0001993552620000022
当模型准确率ACC较低或者召回率recall较小时,计算的模型不符合要求。
(4)将计算好的新模型放入图1流程中,进行处理。
实施例四:满足需求的样本库
(1)判断样本库是否满足需求:样本库的数量等是否满足需求。
(2)循环处理:一般一次是无法得到一个数量充足的样本库,所以当样本库未达到需求时,开启循环,原始样本经过模糊过滤器过滤模糊图像,经过滤样本模型对样本图像进行分类,判断出新图像所属分类,实现样本清洗。

Claims (5)

1.一种基于建立卷积神经网络过滤样本模型进行无效图像样本筛选的方法,该方法包括以下步骤:
S1:收集工业生产中产品的图像数据,作为基础,形成原始样本集;
S2:构建模糊过滤器,实现过滤模糊程度高的图片;
S3:将经过模糊过滤器过滤后的剩余图像即精化样本经过人工分类形成无效样本类型和有效样本类型,经过模糊过滤器处理的极度模糊图像也划分到无效样本一类,无效样本类型包括:模糊图像、空拍图像以及残损图像;
S4:无效样本和有效样本两个类型组成一个样本集合;
S5:构建一个卷积神经网络过滤样本模型;
S6:利用S2的模糊过滤器和S5的模型循环将大量原始样本图像进行分类,实现样本清洗,直至建好一个满足需求的样本库。
2.根据权利要求1所述的方法,其特征在于:在S3步骤之前,先在S2步骤中加入模糊过滤器,提前过滤掉模糊程度高的样本图像。
3.根据权利要求1所述的方法,其特征在于:S3步骤中精化样本经过人工处理。
4.根据权利要求1所述的方法,其特征在于:S5步骤中当样本集合中正负样本数量合适且比例均衡时计算模型,当模型召回率和准确率不符合要求,则放弃该模型。
5.根据权利要求1所述的方法,其特征在于:当样本库未达到需求时,在S6步骤开启循环,对大量原始样本图像进行分类,实现样本清洗。
CN201910188287.8A 2019-03-13 2019-03-13 一种基于卷积神经网络的无效图像样本筛选方法 Active CN109978029B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910188287.8A CN109978029B (zh) 2019-03-13 2019-03-13 一种基于卷积神经网络的无效图像样本筛选方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910188287.8A CN109978029B (zh) 2019-03-13 2019-03-13 一种基于卷积神经网络的无效图像样本筛选方法

Publications (2)

Publication Number Publication Date
CN109978029A CN109978029A (zh) 2019-07-05
CN109978029B true CN109978029B (zh) 2021-02-09

Family

ID=67078702

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910188287.8A Active CN109978029B (zh) 2019-03-13 2019-03-13 一种基于卷积神经网络的无效图像样本筛选方法

Country Status (1)

Country Link
CN (1) CN109978029B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110990917A (zh) * 2019-11-19 2020-04-10 北京长空云海科技有限公司 Bim模型展示的方法、装置及***

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5590218A (en) * 1993-10-18 1996-12-31 Bayer Corporation Unsupervised neural network classification with back propagation
CN106067020A (zh) * 2016-06-02 2016-11-02 广东工业大学 实时场景下快速获取有效图像的***和方法
CN108960409A (zh) * 2018-06-13 2018-12-07 南昌黑鲨科技有限公司 标注数据生成方法、设备及计算机可读存储介质
CN109379557A (zh) * 2018-09-30 2019-02-22 田东县文设芒果专业合作社 基于图像识别的芒果虫害智能监控***

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7991223B2 (en) * 2006-09-05 2011-08-02 Bruker Daltonik Gmbh Method for training of supervised prototype neural gas networks and their use in mass spectrometry
KR102592076B1 (ko) * 2015-12-14 2023-10-19 삼성전자주식회사 딥러닝 기반 영상 처리 장치 및 방법, 학습 장치
CN107909566A (zh) * 2017-10-28 2018-04-13 杭州电子科技大学 一种基于深度学习的皮肤癌黑色素瘤的图像识别方法
CN108171175B (zh) * 2017-12-29 2020-06-23 苏州科达科技股份有限公司 一种深度学习样本增强***及其运行方法
CN108154134B (zh) * 2018-01-11 2019-07-23 天格科技(杭州)有限公司 基于深度卷积神经网络的互联网直播色情图像检测方法
CN108764372B (zh) * 2018-06-08 2019-07-16 Oppo广东移动通信有限公司 数据集的构建方法和装置、移动终端、可读存储介质
CN108986075A (zh) * 2018-06-13 2018-12-11 浙江大华技术股份有限公司 一种优选图像的判断方法及装置
CN109165671A (zh) * 2018-07-13 2019-01-08 上海交通大学 基于样本到决策边界距离的对抗样本检测方法
CN109117887A (zh) * 2018-08-17 2019-01-01 哈尔滨工业大学 一种针对低维数据样本筛选的支持向量机加速方法及装置
CN109241903B (zh) * 2018-08-30 2023-08-29 平安科技(深圳)有限公司 样本数据清洗方法、装置、计算机设备及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5590218A (en) * 1993-10-18 1996-12-31 Bayer Corporation Unsupervised neural network classification with back propagation
CN106067020A (zh) * 2016-06-02 2016-11-02 广东工业大学 实时场景下快速获取有效图像的***和方法
CN108960409A (zh) * 2018-06-13 2018-12-07 南昌黑鲨科技有限公司 标注数据生成方法、设备及计算机可读存储介质
CN109379557A (zh) * 2018-09-30 2019-02-22 田东县文设芒果专业合作社 基于图像识别的芒果虫害智能监控***

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Consensus of Ambiguity: Theory and Application of Active Learning for Biomedical Image Analysis;Scott Doyle 等;《pattern recognition in bioinformatics-5th IAPR international conference》;20100930;314-324 *
Efficient Multiple Instance Convolutional Neural Networks for Gigapixel Resolution Image Classification;Le Hou 等;《arXiv:1504.07947v3》;20150519;1-9 *
基于卷积神经网络的小样本图像识别方法;段萌 等;《计算机工程与设计》;20180131;第39卷(第1期);224-229 *

Also Published As

Publication number Publication date
CN109978029A (zh) 2019-07-05

Similar Documents

Publication Publication Date Title
CN110782399B (zh) 一种基于多任务cnn的图像去模糊方法
CN109064418B (zh) 一种基于非局部均值的非均匀噪声图像去噪方法
CN107248148B (zh) 图像降噪方法及***
CN105894460A (zh) 图像滤波方法及装置
CN106910169A (zh) 一种防止边缘模糊的图像椒盐噪声去除方法
CN111598918B (zh) 一种基于参考帧优选和前后景分离的视频稳像运动估计方法
CN110458789B (zh) 一种图像清晰度评测方法、装置及电子设备
CN106709879A (zh) 一种基于简单透镜计算成像的空间变化点扩散函数平滑方法
CN106910170B (zh) 一种图像椒盐噪声的去除方法
CN113554649B (zh) 一种缺陷检测方法、装置、计算机设备及存储介质
CN109118434A (zh) 一种图像预处理方法
CN108107611A (zh) 一种自适应缺陷检测方法、装置及电子设备
CN109978029B (zh) 一种基于卷积神经网络的无效图像样本筛选方法
CN110942436A (zh) 一种基于图像质量评价的图像去模糊方法
CN113537182A (zh) 染色体中期***相显微图像的自动识别方法与***
CN113034404A (zh) 一种基于多尺度对抗学习的交通图像去模糊方法及装置
CN108288274A (zh) 模具检测方法、装置以及电子设备
CN114663427A (zh) 基于图像处理的锅炉零件尺寸检测方法
CN111104976B (zh) 一种基于时间序列图像的蓝藻覆盖率计算方法
CN115761259B (zh) 基于类别平衡损失函数的厨余垃圾目标检测方法和***
CN114913092B (zh) 一种在线铁谱反射光图像增强方法及***
CN114486916A (zh) 基于机器视觉的手机玻璃盖板缺陷检测方法
CN114120192A (zh) 基于视频信号的多工况模型自动选择方法及装置
CN103886551A (zh) 一种图像滤波处理器
CN114897214A (zh) 一种基于图形化处理的金属增材制造时间预测***和方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20240129

Address after: Room 401-55, No. 821 Lianting Road, Min'an Street, Xiang'an District, Xiamen City, Fujian Province, 361101

Patentee after: Xiamen Xinhang Century Information Technology Co.,Ltd.

Country or region after: China

Address before: 100876 Beijing city Haidian District Xitucheng Road No. 10

Patentee before: Beijing University of Posts and Telecommunications

Country or region before: China

TR01 Transfer of patent right