CN113806613B - 训练图像集生成方法、装置、计算机设备及存储介质 - Google Patents

训练图像集生成方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN113806613B
CN113806613B CN202111153778.2A CN202111153778A CN113806613B CN 113806613 B CN113806613 B CN 113806613B CN 202111153778 A CN202111153778 A CN 202111153778A CN 113806613 B CN113806613 B CN 113806613B
Authority
CN
China
Prior art keywords
image
generated
images
training
image set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111153778.2A
Other languages
English (en)
Other versions
CN113806613A (zh
Inventor
高预皓
彭晶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Life Insurance Company of China Ltd
Original Assignee
Ping An Life Insurance Company of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Life Insurance Company of China Ltd filed Critical Ping An Life Insurance Company of China Ltd
Priority to CN202111153778.2A priority Critical patent/CN113806613B/zh
Publication of CN113806613A publication Critical patent/CN113806613A/zh
Application granted granted Critical
Publication of CN113806613B publication Critical patent/CN113806613B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/194Calculation of difference between files
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/60Rotation of whole images or parts thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/90Dynamic range modification of images or parts thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/12Edge-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/13Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30176Document
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Databases & Information Systems (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及人工智能技术领域,本发明公开了一种训练图像集生成方法、装置、设备及介质,所述方法包括:通过获取待生成图像集和生成数量;运用文本相似度技术,爬取与目标标签和目标描述均相似的历史标签,并确定出待迁移类别;获取相应的待迁移模型,以及对各待生成图像进行识别,得到与各待生成图像对应的目标区域,并记录为待处理图像;对各待处理图像进行基于因素增强比例的图像增强处理,生成训练图像;并关联各训练图像;将所有待处理图像和训练图像确定为训练图像集。因此,本发明实现了基于零标注的少量待生成图像集自动生成训练图像集,提高了训练图像集生成的准确性和效率。本发明适用于人工智能领域,可进一步推动智慧城市的建设。

Description

训练图像集生成方法、装置、计算机设备及存储介质
技术领域
本发明涉及数据处理的数据采集技术领域,尤其涉及一种训练图像集生成方法、装置、计算机设备及存储介质。
背景技术
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。其中,计算机视觉技术(CV,Computer Vision)是一门研究如何使机器“看”的科学,通常包括图像处理、图像识别、图像语义理解、图像检索、光学字符识别文字识别(OCR,Optical Character Recognition)等技术。
而随着人工智能技术逐渐成熟,图像识别技术越来越广泛地应用到日常生活中。为了得到识别精确更高的图像识别模型,需要通过大量的已标注样本对图像识别模型进行训练,而在现有技术中在构建训练样本时,通常采用手动输入等人工标注的方式实现,不仅耗费人力成本,还大大降低了样本的标注效率,给模型训练上带来了极大的困难。
发明内容
本发明提供一种训练图像集生成方法、装置、计算机设备及存储介质,实现了能够基于零标注的少量待生成图像集自动生成训练图像集,减少了人工标注时间和收集训练图像的工作量,提高了标注效率,节省了投入成本,提高了生成训练图像集的准确性和效率。
一种训练图像集生成方法,包括:
获取待生成图像集和生成数量;其中,所述待生成图像集包括多个待生成图像;一个所述待生成图像关联一个目标标签;一个所述目标标签对应一个目标描述;所述生成数量为通过待生成图像集生成用于训练的训练图像的数量;
运用文本相似度技术,在历史标签库中爬取与所述目标标签和所述目标描述均相似的历史标签,并根据爬取的所有所述历史标签,确定出待迁移类别;
从识别模型库中获取与所述待迁移类别对应的待迁移模型,以及通过所述待迁移模型对各所述待生成图像进行识别,得到与各所述待生成图像对应的目标区域,并将标记有目标区域的所述待生成图像记录为待处理图像;
对各所述待处理图像进行基于因素增强比例的图像增强处理,生成所述生成数量个数的训练图像;
将各所述训练图像和与各所述训练图像对应的所述待生成图像关联的所述目标标签进行关联;
将所有所述待处理图像和所有关联后的所述训练图像确定为训练图像集。
一种训练图像集生成装置,包括:
获取模块,用于获取待生成图像集和生成数量;其中,所述待生成图像集包括多个待生成图像;一个所述待生成图像关联一个目标标签;一个所述目标标签对应一个目标描述;所述生成数量为通过待生成图像集生成用于训练的训练图像的数量;
爬取模块,用于运用文本相似度技术,在历史标签库中爬取与所述目标标签和所述目标描述均相似的历史标签,并根据爬取的所有所述历史标签,确定出待迁移类别;
迁移模块,用于从识别模型库中获取与所述待迁移类别对应的待迁移模型,以及通过所述待迁移模型对各所述待生成图像进行识别,得到与各所述待生成图像对应的目标区域,并将标记有目标区域的所述待生成图像记录为待处理图像;
生成模块,用于对各所述待处理图像进行基于因素增强比例的图像增强处理,生成所述生成数量个数的训练图像;
关联模块,用于将各所述训练图像和与各所述训练图像对应的所述待生成图像关联的所述目标标签进行关联;
确定模块,用于将所有所述待处理图像和所有关联后的所述训练图像确定为训练图像集。
一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述训练图像集生成方法的步骤。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述训练图像集生成方法的步骤。
本发明提供的训练图像集生成方法、装置、计算机设备及存储介质,该方法通过获取待生成图像集和生成数量;运用文本相似度技术,在历史标签库中爬取与所述目标标签和所述目标描述均相似的历史标签,并根据爬取的所有所述历史标签,确定出待迁移类别;从识别模型库中获取与所述待迁移类别对应的待迁移模型,以及通过所述待迁移模型对各所述待生成图像进行识别,得到与各所述待生成图像对应的目标区域,并将标记有目标区域的所述待生成图像记录为待处理图像;对各所述待处理图像进行基于因素增强比例的图像增强处理,生成所述生成数量个数的训练图像;将各所述训练图像和与各所述训练图像对应的所述待生成图像关联的所述目标标签进行关联;将所有所述待处理图像和所有关联后的所述训练图像确定为训练图像集,如此,实现了通过文本相似度技术、爬取技术和迁移学习技术,以及运用图像增强处理,能够基于零标注的少量待生成图像集自动生成训练图像集,减少了人工标注时间和收集训练图像的工作量,提高了标注效率,节省了投入成本,提高了生成训练图像集的准确性和效率,为后续的训练提供高质量的训练图像。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例中训练图像集生成方法的应用环境示意图;
图2是本发明一实施例中训练图像集生成方法的流程图;
图3是本发明一实施例中训练图像集生成方法的步骤S20的流程图;
图4是本发明一实施例中训练图像集生成方法的步骤S30的流程图;
图5是本发明一实施例中训练图像集生成方法的步骤S40的流程图;
图6是本发明一实施例中训练图像集生成方法的步骤S404的流程图;
图7是本发明一实施例中训练图像集生成装置的原理框图;
图8是本发明一实施例中计算机设备的示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供的训练图像集生成方法,可应用在如图1的应用环境中,其中,客户端(计算机设备或终端)通过网络与服务器进行通信。其中,客户端(计算机设备或终端)包括但不限于为各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(ContentDelivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
在一实施例中,如图2所示,提供一种训练图像集生成方法,其技术方案主要包括以下步骤S10-S60:
S10,获取待生成图像集和生成数量;其中,所述待生成图像集包括多个待生成图像;一个所述待生成图像关联一个目标标签;一个所述目标标签对应一个目标描述;所述生成数量为通过待生成图像集生成用于训练的训练图像的数量。
可理解地,所述待生成图像集为所有所述待生成图像的集合,所述待生成图像为历史收集的与所述目标标签相关的图像,所述目标标签为对所述待生成图像的内容进行分类赋予的标签,比如目标标签为翻拍或非翻拍、人脸或非人脸、证件或非证件等等标签,所述目标描述为对所述目标标签的类别的相关关键特征进行描述的文本内容,例如:针对目标标签为身份证件,目标描述为含有人脸头像、18位字符的矩形证件,所述生成数量为通过待生成图像集生成用于训练的训练图像的数量。
S20,运用文本相似度技术,在历史标签库中爬取与所述目标标签和所述目标描述均相似的历史标签,并根据爬取的所有所述历史标签,确定出待迁移类别。
可理解地,所述爬取过程为:首先,运用网络爬虫技术爬取出与所述目标标签的相关描述,并将爬取出的相关描述进行汇总提取出关键词及各个关键词的出现次数,将其作为网络描述,其次,将所述网络描述和所述目标描述进行关键词聚合,即将所述目标描述中赋予与所述网络描述一致的关键词进行加权,通过加权可以将所述目标描述中的重要的词语进行重点比较的对象,最后,运用所述文本相似度技术,在所述历史标签库中,将各所述历史标签下的历史描述与加权后的所述目标描述进行比较,将比较后的相似度值最高的历史标签确定为与所述目标标签和所述目标描述均相似的所述历史标签,例如:目标标签为身份证,目标描述为含有人脸头像、18位字符的矩形证件,其中对人脸头像、18位字符和矩形进行了加权,通过运用文本相似度技术,在所述历史标签库中爬取到历史标签为相框的历史描述为含有人物的风景的矩形相框的图像,其与加权后的所述目标描述的相似度值最高,则确定出相框为与身份证相似的历史标签。
其中,所述历史标签库中存储了所有可识别的历史标签,所述历史标签为可通过与其相应的训练完成的模型进行识别的类别,一个所述历史标签对应一个历史描述,所述历史描述为对所述历史标签的相关特征的描述,所述文本相似度技术为运用文本相似度算法,比较出两个文本之间的相似程度的技术,所述文本相似度算法为将两个文本进行词嵌入(word embeddings)转换处理,在词嵌入转换处理过程中根据具有权重的关键词进行同等权重的转换,将处理后的两个文本进行相似度计算,得到两文本之间的相似度值的算法,所述网络爬虫技术是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本从而获取所需的信息的技术。
在一实施例中,如图3所示,所述步骤S20中,即所述运用文本相似度技术,在历史标签库中爬取与所述目标标签和所述目标描述均相似的历史标签,并根据爬取的所有所述历史标签,确定出待迁移类别,包括:
S201,运用网络爬虫技术,爬取与所述目标标签匹配的网络描述。
可理解地,所述网络爬虫技术是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本从而获取所需的信息的技术,从互联网中爬取到与所述目标标注类别相关的描述,对爬取到的所有相关的描述进行汇总提炼,运用TF-IDF算法,提取出关键词,将提取出的关键词各个关键词的出现次数确定为网络描述。
其中,所述TF-IDF算法为一种用于信息检索(information retrieval)与文本挖掘(text mining)的加权技术,所述TF-IDF算法是一种统计方法,用于评估一字词对于一个文本中的重要程度,字或词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降的算法。
S202,根据所述网络描述,对所述目标描述进行关键词加权,得到聚焦描述。
可理解地,在所述目标描述中查找到与所述网络描述中的关键词相符的词语,并根据各关键词的出现次数对查找到的词语进行加权,得到所述聚焦描述。
S203,运用文本相似度技术,在所述历史标签库中比对各所述历史标签下的历史描述和所述聚焦描述,得到与各所述历史描述对应的相似度值。
可理解地,所述文本相似度技术为运用文本相似度算法,比较出两个文本之间的相似程度的技术,所述文本相似度算法为将两个文本进行词嵌入(word embeddings)转换处理,在词嵌入转换处理过程中根据具有权重的关键词进行同等权重的转换,将处理后的两个文本进行相似度计算,得到两文本之间的相似度值的算法,所述词嵌入(wordembeddings)转换处理也称为word2vec,即指将一个词语(word)转换为一个向量(vector)表示,在转换过程中对具有权重的关键词进行转换后的向量赋予等同权重,则在所述历史标签库中运用文本相似度算法比较各所述历史标签下的历史描述和所述聚焦描述,输出的相似度值中将与赋予权重的关键词对应的向量增加等同的权重,即对与赋予权重的关键词对应的向量对相似度值的影响占整体有较与其他有更高的权重比。
S204,将与最大的相似度值对应的所述历史描述对应的所述历史标签确定为所述待迁移类别。
可理解地,将最大的所述相似度值所对应的所述历史标签记录为所述待迁移类别,所述待迁移类别表明了需要被迁移的类别。
本发明实现了通过运用网络爬虫技术,爬取与所述目标标签匹配的网络描述;根据所述网络描述,对所述目标描述进行关键词加权,得到聚焦描述;运用文本相似度技术,在所述历史标签库中比对各所述历史标签下的历史描述和所述聚焦描述,得到与各所述历史描述对应的相似度值;将与最大的相似度值对应的所述历史描述对应的所述历史标签确定为所述待迁移类别,如此,实现了通过运用网络爬虫技术、关键词加权和文本相似度技术,自动从目标分类识别库中识别出待迁移类别,减少了人工识别的成本,能够快速地、准确地找到待迁移类别,提高了识别准确率和可靠性。
S30,从识别模型库中获取与所述待迁移类别对应的待迁移模型,以及通过所述待迁移模型对各所述待生成图像进行识别,得到与各所述待生成图像对应的目标区域,并将标记有目标区域的所述待生成图像记录为待处理图像。
可理解地,所述识别模型库中存储了所有各种与历史标签相对应的所述待迁移模型,所述待迁移模型为训练完成的用于识别与其对应的历史标签的图像识别模型,比如所述待迁移模型可以为深度学***移不变性的特点,通过所述待迁移模型对各所述待生成图像进行目标识别,所述目标识别的过程为在所述待生成图像中提取与所述历史标签对应的迁移特征,通过提取的迁移特征能够定位出与迁移特征相符的区域,即通过相似的历史标签的特征识别出与所述目标标签对应的区域,将相符的区域确定为与所述待生成图像对应的所述目标区域,在此过程中可以对识别出的相符的区域进行微调,从而精准确定出目标区域,并将标记有目标区域的所述待生成图像记录为待处理图像。
在一实施例中,如图4所示,所述步骤S30中,即所述通过所述待迁移模型对各所述待生成图像进行识别,得到与各所述待生成图像对应的目标区域,包括:
S301,通过所述待迁移模型对各所述待生成图像进行迁移特征提取,根据提取的迁移特征进行区域识别,得到各所述待生成图像的识别区域。
可理解地,在所述待生成图像中提取与所述历史标签对应的迁移特征,通过提取的迁移特征能够定位出与迁移特征相符的区域,即通过相似的历史标签的特征识别出与所述目标标签对应的区域,将相符的区域确定为与所述待生成图像对应的所述识别区域。
S302,对各所述待生成图像的识别区域进行目标微调,得到与各所述待生成图像对应的目标区域。
可理解地,所述目标微调的过程为对与所述待生成图像对应的所述待迁移模型输出的所述识别区域的边缘相邻的预设范围内的图像进行边缘分割,识别出边缘线,对所述识别区域沿着所述边缘线进行边缘缩小的调节过程,从而得到与其对应的所述目标区域。
本发明实现了通过所述待迁移模型对各所述待生成图像进行迁移特征提取,根据提取的迁移特征进行区域识别,得到各所述待生成图像的识别区域;对各所述待生成图像的识别区域进行目标微调,得到与各所述待生成图像对应的目标区域,如此,能够自动通过待迁移模型中大致识别出待生成图像中需要识别的区域,再通过目标微调能够精准地框定出所需识别的最终的目标区域,提高目标区域定位的精准性和可靠性。
在一实施例中,所述步骤S302中,即所述对各所述待生成图像的识别区域进行目标微调,得到与各所述待生成图像对应的目标区域,包括:
对所述待生成图像的识别区域邻近的预设范围内进行边缘分割,识别出边缘线。
可理解地,所述边缘分割为对所述识别区域中的边缘进行识别,识别出相邻像素点之间的像素点的色差值大于预设色差值的像素点,将这些识别出的像素点进行封闭线分割,即将能围成封闭区域的线条进行分割,分割出边缘线的过程,所述边缘线为大于预设色差值的像素点能够围成一个封闭区域的线条。
根据所述边缘线,对所述识别区域进行边缘缩小,得到与所述待生成图像对应的所述目标区域。
可理解地,根据所述边缘线围成的区域对所述识别区域进行边缘缩小,所述边缘缩小为所述识别区域缩小至与所述边缘线存在重合,并能够覆盖所述边缘线围成的区域的过程,最后将缩小后的区域确定为所述目标区域,一个所述待生成图像对应一个所述目标区域。
本发明实现了通过对所述待生成图像的识别区域邻近的预设范围内进行边缘分割,识别出边缘线;根据所述边缘线,对所述识别区域进行边缘缩小,得到与所述待生成图像对应的所述目标区域,如此,实现了对识别区域的自动微调,更加想准确的真实区域进行靠拢,提高了目标区域识别的准确性。
S40,对各所述待处理图像进行基于因素增强比例的图像增强处理,生成所述生成数量个数的训练图像。
可理解地,所述因素增强比例为预设的与各个图像增强的因素所占的占比,所述因素增强比例为基于所述生成图像集的总数基础上设定的,各因素的占比为扩大的比例,即按照所述生成图像集的总数扩大的数量的比例,所述图像增强的因素包括旋转因素、模糊因素、对比因素、亮度因素和平衡因素;所述旋转因素与旋转角度图像增强算法对应;所述模糊因素与模糊图像增强算法对应;所述对比因素与对比度图像增强算法对应;所述亮度因素与亮度图像增强算法对应;所述平衡因素与色彩平衡图像增强算法对应;所述基于因素增强比例的图像增强处理为按照不同的图像增强的因素所对应的图像增强算法对每个所述待处理图像进行处理的方法,而且在处理过程中不断根据生成的测试图像的性能指标值调整因素增强比例,不断向高的性能指标值靠拢,从而生成训练图像的过程。
其中,首先,对按照调整后的所述因素增强比例,设置旋转角度参数,并根据所述旋转角度图像增强算法和设置后的所述旋转角度参数,对各所述待处理图像进行图像旋转处理,生成与各所述待处理图像对应的多个旋转测试图像;设置模糊度参数,并根据模糊图像增强算法和设置后的所述模糊度参数,对各所述待处理图像进行图像模糊处理,生成与各所述待处理图像对应的多个模糊测试图像;设置对比度参数,并根据对比度图像增强算法和设置后的所述对比度参数,对各所述待处理图像进行色彩对比化处理,生成与各所述待处理图像对应的多个对比测试图像;设置模糊度参数,并根据亮度图像增强算法和设置后的所述亮度参数,对各所述待处理图像进行亮度增强处理,生成与各所述待处理图像对应的多个亮度测试图像;设置色彩平衡参数,并根据亮度色彩平衡图像增强算法和设置后的所述色彩平衡参数,对各所述待处理图像进行色彩平衡处理,生成与各所述待处理图像对应的多个平衡测试图像;最后,将所有所述旋转测试图像、所述模糊测试图像、所述对比测试图像、所述亮度测试图像和所述平衡测试图像记录为所述测试图像。
其中,将各所述测试图像输入所述待迁移模型中,通过所述待迁移模型对所述测试图像进行识别,可以确定出性能指标值,例如:性能指标值为准确率,并根据各测试图像的准确率,调整与其所对应的图像增强的因素所占的占比,即调整因素增强比例,从而能够优化输出高性能指标值的测试图像,所述训练图像为后续进行训练所需的图像。
在一实施例中,如图5所示,所述步骤S40中,即所述对各所述待处理图像进行基于因素增强比例的图像增强处理,生成所述生成数量个数的训练图像,包括:
S401,将所述生成数量和所述待生成图像集中的待生成图像的个数的比值确定为目标占比;其中,所述生成数量大于所述待生成图像集中的待生成图像的个数。
可理解地,将所述生成数量除以所有所述待生成图像的个数,并进行取整,得到所述目标占比,其中,所述取整可以为向上取整,也可以为向下取整,所述生成数量大于所述待生成图像集中的待生成图像的个数。
S402,对所有所述待处理图像进行基于所述目标占比的多等分处理,得到包含顺次排序的多个单元图像集的图像序列组。
可理解地,对所述待生成图像集中的所有所述待生成图像所对应的所述待处理图像进行排序,并按照所述目标占比的个数对排序后的所有所述待处理图像进行多等分处理,划分出多个所述单元图像集,一等分对应一个所述单元图像集,划分后剩余不足一等分的所述待处理图像确定为一个所述单元图像集,在多等分处理过程中,将所述单元图像集中排序第一的所述待处理图像的序号作为该单元图像集的序号,并对所有所述单元图像集按照各自的序号顺次进行排序,从而将顺次排序后的所有所述单元图像集确定为所述图像序列组。
S403,选取所述图像序列组中排序第一的所述单元图像集。
S404,根据所述目标占比和预设因素增强比例,对选取的所述单元图像集进行图像增强处理,生成与该单元图像集对应的多个测试图像,并确定出与该单元图像集对应的性能指标值。
可理解地,所述因素增强比例初始为预设的旋转因素维度、模糊因素维度、对比因素维度、亮度因素维度和平衡因素维度之间的比例值,所述因素增强比例会根据逐个所述单元图像集进行图像增强处理后输出的测试图像的效果进行调整,直至所有所述单元图像集均被图像增强处理后,停止调整所述因素增强比例,所述图像增强处理包括各个因素所对应的图像增强算法进行处理的过程,例如:因素包括旋转因素、模糊因素、对比因素、亮度因素和平衡因素,所述旋转因素与旋转角度图像增强算法对应,所述模糊因素与图像模糊算法对应,所述对比因素与对比度图像增强算法对应,所述亮度因素与亮度图像增强算法对应,所述平衡因素与色彩平衡图像增强算法对应,运用所述旋转角度图像增强算法,对所述单元图像集中的所述待生成图像进行图像旋转处理;运用图像模糊算法,对所述单元图像集中的所述待生成图像进行图像模糊处理;运用对比度图像增强算法,对所述单元图像集中的所述待生成图像进行色彩对比处理;运用亮度图像增强算法,对所述单元图像集中的所述待生成图像进行亮度增强处理;并且运用色彩平衡图像增强算法,对所述单元图像集中的所述待生成图像进行色彩平衡处理,从而得到与所述待处理图像对应的多个所述测试图像,以及与其对应的增强区域,所述增强区域为根据各个所述待生成图像的目标区域随着图像增强处理中的算法同步移动或者不变获得的区域,并将得到的所述测试图像输入所述待迁移模型中,通过所述待迁移模型对所述测试图像进行识别,得到识别结果,根据各所述测试图像所对应的所述识别结果和所述增强区域之间的重合率,确定出与所述单元图像集对应的性能指标值,所述性能指标值体现了生成的所述测试图像的效果。
在一实施例中,如图6所示,所述步骤S404中,即所述根据所述目标占比和预设因素增强比例,对选取的所述单元图像集进行图像增强处理,生成与该单元图像集对应的多个测试图像,并确定出与该单元图像集对应的性能指标值,包括:
S4041,根据所述目标占比和预设因素增强比例,确定出一个所述待处理图像所对应的各因素生成数量。
可理解地,以所述目标占比的个数作为总数,按照所述因素增强比例划分总数,得到一个所述待生成图像需生成的各因素生成数量,即针对旋转因素维度、模糊因素维度、对比因素维度、亮度因素维度和平衡因素维度所生成的数量,所述因素生成数量包括旋转因素生成数量、模糊因素生成数量、对比因素生成数量、亮度因素生成数量和平衡因素生成数量,所述旋转因素维度对应所述旋转因素生成数量、所述模糊因素维度对应所述模糊因素生成数量、所述对比因素维度对应所述对比因素生成数量、所述亮度因素维度对应所述亮度因素生成数量,以及所述平衡因素维度对应所述平衡因素生成数量。
S4042,按照各因素生成数量,对所述单元图像集中的各所述待处理图像进行图像增强处理,获得所述单元图像集中的各所述待处理图像所对应的测试图像及与其对应的增强区域。
可理解地,按照各因素生成数量,相应地对所述单元图像集中的各个所述待处理图像进行图像旋转处理、图像模糊处理、色彩对比化处理、亮度增强处理和色彩平衡处理,从而生成该单元图像集中的与各个所述待处理图像所对应的测试图像及与其对应的增强区域。
其中,所述旋转因素生成数量与旋转角度图像增强算法对应;所述模糊因素生成数量与模糊图像增强算法对应;所述对比因素生成数量与对比度图像增强算法对应;所述亮度因素生成数量与亮度图像增强算法对应;所述平衡因素生成数量与色彩平衡图像增强算法对应。
在一实施例中,所述步骤S4042中,所述按照各因素生成数量,对所述单元图像集中的各所述待处理图像进行图像增强处理,获得所述单元图像集中的各所述待处理图像所对应的测试图像及与其对应的增强区域,包括:
根据各因素生成数量,分别设置旋转角度参数、模糊度参数、对比度参数、亮度参数和色彩平衡参数。
可理解地,按照所述因素生成数量中的旋转因素生成数量,设置所述旋转角度参数,所述旋转角度参数为对所述待处理图像旋转角度的步长或者角度值,可以以360度为总量程,根据所述旋转因素生成数量对量程进行等分,得到每次旋转角度,从而确定每次旋转的旋转角度参数,按照所述因素生成数量中的所述模糊因素生成数量,设置所述模糊度参数,所述模糊度参数为对所述待处理图像中的各像素点进行步长内邻近的像素点径向模糊的参数,其中,步长可以根据需求设定,比如以2为增长的增量,按照所述模糊因素生成数量,设置每一次模糊的步长的模糊度参数,按照所述因素生成数量中的所述对比因素生成数量,设置所述对比度参数,所述对比度参数为对所述待处理图像中的各像素点进行去雾及锐化处理的步长涉及的参数,其中,步长可以根据需求设定,比如以0.2为增长的增量,按照所述对比度因素生成数量,设置每一次对比度处理的步长的对比度参数,按照所述因素生成数量中的所述亮度因素生成数量,设置所述亮度参数,所述亮度参数为对所述待处理图像中的各像素点进行像素值按照预设步长增长的参数,其中,步长可以根据需求设定,比如以2为增长的增量,按照所述亮度因素生成数量,设置每一次亮度增强处理的步长的参数,按照所述因素生成数量中的平衡因素生成数量,设置所述色彩平衡参数,所述色彩平衡参数为对所述待处理图像进行校正图像色偏的步长的参数。
根据所述旋转角度参数、所述模糊度参数、所述对比度参数、所述亮度参数和所述色彩平衡参数,对各所述待处理图像分别进行图像旋转处理、图像模糊处理、色彩对比化处理、亮度增强处理和色彩平衡处理,生成与各所述待处理图像对应的多个所述测试图像及与其对应的增强区域。
可理解地,按照所述旋转因素生成数量,设置旋转角度参数,并根据所述旋转角度图像增强算法和设置后的所述旋转角度参数,对各所述待处理图像进行图像旋转处理,生成与各所述待处理图像对应的多个旋转测试图像与其对应的增强区域;一个所述待处理图像对应与所述旋转因素生成数量相同的所述旋转测试图像;按照所述模糊因素生成数量,设置模糊度参数,并根据模糊图像增强算法和设置后的所述模糊度参数,对各所述待处理图像进行图像模糊处理,生成与各所述待处理图像对应的多个模糊测试图像与其对应的增强区域;一个所述待处理图像对应与所述模糊因素生成数量相同的所述模糊测试图像;按照所述对比因素生成数量,设置对比度参数,并根据对比度图像增强算法和设置后的所述对比度参数,对各所述待处理图像进行色彩对比化处理,生成与各所述待处理图像对应的多个对比测试图像与其对应的增强区域;一个所述待处理图像对应与所述对比因素生成数量相同的所述对比测试图像;按照所述亮度因素生成数量,设置亮度参数,并根据亮度图像增强算法和设置后的所述亮度参数,对各所述待处理图像进行亮度增强处理,生成与各所述待处理图像对应的多个亮度测试图像与其对应的增强区域;一个所述待处理图像对应与所述亮度因素生成数量相同的所述亮度测试图像;按照所述平衡因素生成数量,设置色彩平衡参数,并根据亮度色彩平衡图像增强算法和设置后的所述色彩平衡参数,对各所述待处理图像进行色彩平衡处理,生成与各所述待处理图像对应的多个平衡测试图像与其对应的增强区域;一个所述待处理图像对应与所述平衡因素生成数量相同的所述平衡测试图像;将所有所述旋转测试图像、所述模糊测试图像、所述对比测试图像、所述亮度测试图像和所述平衡测试图像记录为所述测试图像。
其中,所述图像旋转处理为以图像中心点为中心,旋转所述旋转角度参数的处理过程,所述图像模糊处理为按照所述模糊度参数使图像模糊化的处理过程,所述色彩对比化处理的过程为按照所述对比度参数将所述待处理图像中的像素点之间的差值更加明显的处理过程,所述亮度增强处理的过程为按照所述亮度参数对所述待处理图像中的像素点进行亮度值增长的处理过程,所述色彩平衡处理的过程为按照所述色彩平衡参数对所述待处理图像中的像素点之间的均衡化处理的过程。
本发明实现了通过根据各因素生成数量,分别设置旋转角度参数、模糊度参数、对比度参数、亮度参数和色彩平衡参数;根据所述旋转角度参数、所述模糊度参数、所述对比度参数、所述亮度参数和所述色彩平衡参数,对各所述待处理图像分别进行图像旋转处理、图像模糊处理、色彩对比化处理、亮度增强处理和色彩平衡处理,生成与各所述待处理图像对应的多个所述测试图像及与其对应的增强区域,如此,能够运用图像旋转处理、图像模糊处理、色彩对比化处理、亮度增强处理和色彩平衡处理,多维度地生成不同的测试图像并自动标识出增强区域,提高了后续训练图像生成的多样性。
S4043,将图像增强处理获得的各所述测试图像输入所述待迁移模型中,通过所述待迁移模型对所述测试图像进行识别,得到识别结果。
可理解地,将所述测试图像输入所述待迁移模型中,通过所述待迁移模型对所述测试图像进行隐式特征的提取,根据提取的隐式特征进行区域的识别,从而识别出具有隐式特征的区域,将其作为所述识别结果,其中,所述隐式特征为与迁移的所述待迁移模型相应的迁移特征。
S4044,根据各所述测试图像所对应的所述识别结果和所述增强区域,确定出与所述单元图像集对应的性能指标值。
可理解地,将一个所述测试图像所对应的所述识别结果中的区域部分和所述增强区域的区域部分进行重合度计算,从而判断出准确率,最终确定出与该单元图像集对应的与各因素相关的所述性能指标值。
本发明实现了通过根据所述目标占比和预设因素增强比例,确定出一个所述待处理图像所对应的各因素生成数量;按照各因素生成数量,对所述单元图像集中的各所述待处理图像进行图像增强处理,获得所述单元图像集中的各所述待处理图像所对应的测试图像及与其对应的增强区域;将图像增强处理获得的各所述测试图像输入所述待迁移模型中,通过所述待迁移模型对所述测试图像进行识别,得到识别结果;根据各所述测试图像所对应的所述识别结果和所述增强区域,确定出与所述单元图像集对应的性能指标值,如此,实现了自动识别出测试图像的识别结果,并自动判断出性能指标值,为后续的因素增强比例提供调整基础,无需人工识别及调整,节省了成本,并提高了后续的训练图像集生成的质量,能够向高质量的图像靠拢。
S405,检测所述图像序列组中是否存在除排序第一的所述单元图像集之外的单元图像集。
S406,若检测到存在除排序第一的所述单元图像集之外的单元图像集,将排序第一的所述单元图像集从图像序列组中删除,并基于所述性能指标值,调整所述因素增强比例,以及返回选取所述图像序列组中排序第一的所述单元图像集的步骤,直至图像序列组为空,将所有所述测试图像记录为所述训练图像。
可理解地,如果检测到所述图像序列组中存在除排序第一的所述单元图像集之外的单元图像集,将排序第一的该单元图像集从所述图像序列组中移除,并根据所述性能指标,调整所述因素增强比例中各个因素所对应的值,即调整各个因素之间的比例值,将高于准确率均值的准确率所对应的因素进行相应的比例值的增加,将低于准确率均值的准确率所对应的因素进行相应的比例值的减少,并在调整完因素增强比例之后,返回选取所述图像序列组中排序第一的所述单元图像集的步骤进行执行,不断地调整因素增强比例,直至检测到所述图像序列组中不存在单元图像集,即所述图像序列组为空,从而将所有所述测试图像记录为所述训练图像。
如此,本发明实现了通过基于因素增强比例的图像增强处理,能够不断调整因素增强比例,从而生成高质量的训练图像。
在一实施例中,所述步骤S405之后,即所述检测所述图像序列组中是否存在除排序第一的所述单元图像集之外的单元图像集之后,还包括:
若检测到不存在除排序第一的所述单元图像集之外的单元图像集,就说明所有所述单元图像集已经被图像增强处理,无需再调整所述因素增强比例。
S50,将各所述训练图像和与各所述训练图像对应的所述待生成图像关联的所述目标标签进行关联。
可理解地,建立一个所述训练图像和与该训练图像对应的所述待处理图像对应的所述待生成图像关联的所述目标标签之间的关联关系。
S60,将所有所述待处理图像和所有关联后的所述训练图像确定为训练图像集。
可理解地,将所有所述待处理图像和所有关联后的所述训练图像记录为训练图像集,再将该训练图像集作为后续训练神经网络的样本,节省了收集样本的时间及成本,并提高了神经网络学习的准确性。
本发明实现了通过获取待生成图像集和生成数量;运用文本相似度技术,在历史标签库中爬取与所述目标标签和所述目标描述均相似的历史标签,并根据爬取的所有所述历史标签,确定出待迁移类别;从识别模型库中获取与所述待迁移类别对应的待迁移模型,以及通过所述待迁移模型对各所述待生成图像进行识别,得到与各所述待生成图像对应的目标区域,并将标记有目标区域的所述待生成图像记录为待处理图像;对各所述待处理图像进行基于因素增强比例的图像增强处理,生成所述生成数量个数的训练图像;将各所述训练图像和与各所述训练图像对应的所述待生成图像关联的所述目标标签进行关联;将所有所述待处理图像和所有关联后的所述训练图像确定为训练图像集,如此,实现了通过文本相似度技术、爬取技术和迁移学习技术,以及运用图像增强处理,能够基于零标注的少量待生成图像集自动生成训练图像集,减少了人工标注时间和收集训练图像的工作量,提高了标注效率,节省了投入成本,提高了生成训练图像集的准确性和效率,为后续的训练提供高质量的训练图像。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
在一实施例中,提供一种训练图像集生成装置,该训练图像集生成装置与上述实施例中训练图像集生成方法一一对应。如图7所示,该训练图像集生成装置包括获取模块11、爬取模块12、迁移模块13、生成模块14、关联模块15和确定模块16。各功能模块详细说明如下:
获取模块11,用于获取待生成图像集和生成数量;其中,所述待生成图像集包括多个待生成图像;一个所述待生成图像关联一个目标标签;一个所述目标标签对应一个目标描述;所述生成数量为通过待生成图像集生成用于训练的训练图像的数量;
爬取模块12,用于运用文本相似度技术,在历史标签库中爬取与所述目标标签和所述目标描述均相似的历史标签,并根据爬取的所有所述历史标签,确定出待迁移类别;
迁移模块13,用于从识别模型库中获取与所述待迁移类别对应的待迁移模型,以及通过所述待迁移模型对各所述待生成图像进行识别,得到与各所述待生成图像对应的目标区域,并将标记有目标区域的所述待生成图像记录为待处理图像;
生成模块14,用于对各所述待处理图像进行基于因素增强比例的图像增强处理,生成所述生成数量个数的训练图像;
关联模块15,用于将各所述训练图像和与各所述训练图像对应的所述待生成图像关联的所述目标标签进行关联;
确定模块16,用于将所有所述待处理图像和所有关联后的所述训练图像确定为训练图像集。
关于训练图像集生成装置的具体限定可以参见上文中对于训练图像集生成方法的限定,在此不再赘述。上述训练图像集生成装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是客户端或者服务端,其内部结构图可以如图8所示。该计算机设备包括通过***总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括可读存储介质、内存储器。该可读存储介质存储有操作***、计算机程序和数据库。该内存储器为可读存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种训练图像集生成方法。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述实施例中训练图像集生成方法。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述实施例中训练图像集生成方法。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本发明所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (8)

1.一种训练图像集生成方法,其特征在于,包括:
获取待生成图像集和生成数量;其中,所述待生成图像集包括多个待生成图像;一个所述待生成图像关联一个目标标签;一个所述目标标签对应一个目标描述;所述生成数量为通过待生成图像集生成用于训练的训练图像的数量;
运用文本相似度技术,在历史标签库中爬取与所述目标标签和所述目标描述均相似的历史标签,并根据爬取的所有所述历史标签,确定出待迁移类别;
从识别模型库中获取与所述待迁移类别对应的待迁移模型,以及通过所述待迁移模型对各所述待生成图像进行识别,得到与各所述待生成图像对应的目标区域,并将标记有目标区域的所述待生成图像记录为待处理图像;
对各所述待处理图像进行基于因素增强比例的图像增强处理,生成所述生成数量个数的训练图像;
将各所述训练图像和与各所述训练图像对应的所述待生成图像关联的所述目标标签进行关联;
将所有所述待处理图像和所有关联后的所述训练图像确定为训练图像集;
所述运用文本相似度技术,在历史标签库中爬取与所述目标标签和所述目标描述均相似的历史标签,并根据爬取的所有所述历史标签,确定出待迁移类别,包括:
运用网络爬虫技术,爬取与所述目标标签匹配的网络描述;
根据所述网络描述,对所述目标描述进行关键词加权,得到聚焦描述;
运用文本相似度技术,在所述历史标签库中比对各所述历史标签下的历史描述和所述聚焦描述,得到与各所述历史描述对应的相似度值;
将与最大的相似度值对应的所述历史描述对应的所述历史标签确定为所述待迁移类别;
所述对各所述待处理图像进行基于因素增强比例的图像增强处理,生成所述生成数量个数的训练图像,包括:
将所述生成数量和所述待生成图像集中的待生成图像的个数的比值确定为目标占比;其中,所述生成数量大于所述待生成图像集中的待生成图像的个数;
对所有所述待处理图像进行基于所述目标占比的多等分处理,得到包含顺次排序的多个单元图像集的图像序列组;
选取所述图像序列组中排序第一的所述单元图像集;
根据所述目标占比和预设因素增强比例,对选取的所述单元图像集进行图像增强处理,生成与该单元图像集对应的多个测试图像,并确定出与该单元图像集对应的性能指标值;
检测所述图像序列组中是否存在除排序第一的所述单元图像集之外的单元图像集;
若检测到存在除排序第一的所述单元图像集之外的单元图像集,将排序第一的所述单元图像集从图像序列组中删除,并基于所述性能指标值,调整所述因素增强比例,以及返回选取所述图像序列组中排序第一的所述单元图像集的步骤,直至图像序列组为空,将所有所述测试图像记录为所述训练图像。
2.如权利要求1所述的训练图像集生成方法,其特征在于,所述通过所述待迁移模型对各所述待生成图像进行识别,得到与各所述待生成图像对应的目标区域,包括:
通过所述待迁移模型对各所述待生成图像进行迁移特征提取,根据提取的迁移特征进行区域识别,得到各所述待生成图像的识别区域;
对各所述待生成图像的识别区域进行目标微调,得到与各所述待生成图像对应的目标区域。
3.如权利要求2所述的训练图像集生成方法,其特征在于,所述对各所述待生成图像的识别区域进行目标微调,得到与各所述待生成图像对应的目标区域,包括:
对所述待生成图像的识别区域邻近的预设范围内进行边缘分割,识别出边缘线;
根据所述边缘线,对所述识别区域进行边缘缩小,得到与所述待生成图像对应的所述目标区域。
4.如权利要求1所述的训练图像集生成方法,其特征在于,所述根据所述目标占比和预设因素增强比例,对选取的所述单元图像集进行图像增强处理,生成与该单元图像集对应的多个测试图像,并确定出与该单元图像集对应的性能指标值,包括:
根据所述目标占比和预设因素增强比例,确定出一个所述待处理图像所对应的各因素生成数量;
按照各因素生成数量,对所述单元图像集中的各所述待处理图像进行图像增强处理,获得所述单元图像集中的各所述待处理图像所对应的测试图像及与其对应的增强区域;
将图像增强处理获得的各所述测试图像输入所述待迁移模型中,通过所述待迁移模型对所述测试图像进行识别,得到识别结果;
根据各所述测试图像所对应的所述识别结果和所述增强区域,确定出与所述单元图像集对应的性能指标值。
5.如权利要求4所述的训练图像集生成方法,其特征在于,所述按照各因素生成数量,对所述单元图像集中的各所述待处理图像进行图像增强处理,获得所述单元图像集中的各所述待处理图像所对应的测试图像及与其对应的增强区域,包括:
根据各因素生成数量,分别设置旋转角度参数、模糊度参数、对比度参数、亮度参数和色彩平衡参数;
根据所述旋转角度参数、所述模糊度参数、所述对比度参数、所述亮度参数和所述色彩平衡参数,对各所述待处理图像分别进行图像旋转处理、图像模糊处理、色彩对比化处理、亮度增强处理和色彩平衡处理,生成与各所述待处理图像对应的多个所述测试图像及与其对应的增强区域。
6.一种训练图像集生成装置,所述训练图像集生成装置实现如权利要求1至5任一项所述训练图像集生成方法,其特征在于,所述训练图像集生成装置包括:
获取模块,用于获取待生成图像集和生成数量;其中,所述待生成图像集包括多个待生成图像;一个所述待生成图像关联一个目标标签;一个所述目标标签对应一个目标描述;所述生成数量为通过待生成图像集生成用于训练的训练图像的数量;
爬取模块,用于运用文本相似度技术,在历史标签库中爬取与所述目标标签和所述目标描述均相似的历史标签,并根据爬取的所有所述历史标签,确定出待迁移类别;
迁移模块,用于从识别模型库中获取与所述待迁移类别对应的待迁移模型,以及通过所述待迁移模型对各所述待生成图像进行识别,得到与各所述待生成图像对应的目标区域,并将标记有目标区域的所述待生成图像记录为待处理图像;
生成模块,用于对各所述待处理图像进行基于因素增强比例的图像增强处理,生成所述生成数量个数的训练图像;
关联模块,用于将各所述训练图像和与各所述训练图像对应的所述待生成图像关联的所述目标标签进行关联;
确定模块,用于将所有所述待处理图像和所有关联后的所述训练图像确定为训练图像集。
7.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5任一项所述训练图像集生成方法。
8.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述训练图像集生成方法。
CN202111153778.2A 2021-09-29 2021-09-29 训练图像集生成方法、装置、计算机设备及存储介质 Active CN113806613B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111153778.2A CN113806613B (zh) 2021-09-29 2021-09-29 训练图像集生成方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111153778.2A CN113806613B (zh) 2021-09-29 2021-09-29 训练图像集生成方法、装置、计算机设备及存储介质

Publications (2)

Publication Number Publication Date
CN113806613A CN113806613A (zh) 2021-12-17
CN113806613B true CN113806613B (zh) 2023-07-25

Family

ID=78938938

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111153778.2A Active CN113806613B (zh) 2021-09-29 2021-09-29 训练图像集生成方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN113806613B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114463821A (zh) * 2022-02-15 2022-05-10 平安科技(深圳)有限公司 证件数据生成方法、装置、计算机设备及存储介质
CN114972883B (zh) * 2022-06-17 2024-05-10 平安科技(深圳)有限公司 基于人工智能的目标检测样本生成方法及相关设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10013436B1 (en) * 2014-06-17 2018-07-03 Google Llc Image annotation based on label consensus
CN111582410A (zh) * 2020-07-16 2020-08-25 平安国际智慧城市科技股份有限公司 图像识别模型训练方法、装置、计算机设备及存储介质
CN111881900A (zh) * 2020-07-01 2020-11-03 腾讯科技(深圳)有限公司 语料生成、翻译模型训练、翻译方法、装置、设备及介质
WO2021017261A1 (zh) * 2019-08-01 2021-02-04 平安科技(深圳)有限公司 识别模型训练方法、图像识别方法、装置、设备及介质
CN112765387A (zh) * 2020-12-31 2021-05-07 中国工商银行股份有限公司 图像检索方法、图像检索装置和电子设备
CN112926654A (zh) * 2021-02-25 2021-06-08 平安银行股份有限公司 预标注模型训练、证件预标注方法、装置、设备及介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10013436B1 (en) * 2014-06-17 2018-07-03 Google Llc Image annotation based on label consensus
WO2021017261A1 (zh) * 2019-08-01 2021-02-04 平安科技(深圳)有限公司 识别模型训练方法、图像识别方法、装置、设备及介质
CN111881900A (zh) * 2020-07-01 2020-11-03 腾讯科技(深圳)有限公司 语料生成、翻译模型训练、翻译方法、装置、设备及介质
CN111582410A (zh) * 2020-07-16 2020-08-25 平安国际智慧城市科技股份有限公司 图像识别模型训练方法、装置、计算机设备及存储介质
CN112765387A (zh) * 2020-12-31 2021-05-07 中国工商银行股份有限公司 图像检索方法、图像检索装置和电子设备
CN112926654A (zh) * 2021-02-25 2021-06-08 平安银行股份有限公司 预标注模型训练、证件预标注方法、装置、设备及介质

Also Published As

Publication number Publication date
CN113806613A (zh) 2021-12-17

Similar Documents

Publication Publication Date Title
CN112926654B (zh) 预标注模型训练、证件预标注方法、装置、设备及介质
WO2021169111A1 (zh) 简历筛选方法、装置、计算机设备和存储介质
WO2020000688A1 (zh) 财务风险验证处理方法、装置、计算机设备及存储介质
CN111191568B (zh) 翻拍图像识别方法、装置、设备及介质
CN113806613B (zh) 训练图像集生成方法、装置、计算机设备及存储介质
US20220198182A1 (en) Methods and systems of field detection in a document
CN110751533B (zh) 产品画像生成方法、装置、计算机设备和存储介质
CN111666932B (zh) 单据审核方法、装置、计算机设备及存储介质
WO2022134805A1 (zh) 文档分类预测方法、装置、计算机设备及存储介质
CN110705233A (zh) 基于文字识别技术的笔记生成方法、装置和计算机设备
CN111859093A (zh) 敏感词处理方法、装置及可读存储介质
CN114357174B (zh) 基于ocr和机器学习的代码分类***及方法
CN112232336A (zh) 一种证件识别方法、装置、设备及存储介质
CN113707296B (zh) 医疗方案数据处理方法、装置、设备及存储介质
CN113673528B (zh) 文本处理方法、装置、电子设备和可读存储介质
CN110889341A (zh) 基于ai的表单图像识别方法、装置、计算机设备和存储介质
CN113780116A (zh) ***分类方法、装置、计算机设备和存储介质
CN116304184A (zh) 视频分类模型、训练方法、分类方法、设备及存储介质
US20230134218A1 (en) Continuous learning for document processing and analysis
CN115984588A (zh) 图像背景相似度分析方法、装置、电子设备及存储介质
CN115880702A (zh) 数据处理方法、装置、设备、程序产品及存储介质
CN114818627A (zh) 一种表格信息抽取方法、装置、设备及介质
CN114492584A (zh) 一种针对安卓中文应用市场的自动内容分级方法
CN114283429A (zh) 素材工单数据处理方法、装置、设备及存储介质
CN117058432B (zh) 图像查重方法、装置、电子设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant