CN108921161A - 模型训练方法、装置、电子设备和计算机可读存储介质 - Google Patents
模型训练方法、装置、电子设备和计算机可读存储介质 Download PDFInfo
- Publication number
- CN108921161A CN108921161A CN201810586082.0A CN201810586082A CN108921161A CN 108921161 A CN108921161 A CN 108921161A CN 201810586082 A CN201810586082 A CN 201810586082A CN 108921161 A CN108921161 A CN 108921161A
- Authority
- CN
- China
- Prior art keywords
- image
- semantic segmentation
- segmentation model
- convergence
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本申请涉及一种模型训练方法、装置、电子设备和计算机可读存储介质。上述方法包括:A:将图像输入预设的语义分割模型,获取所述语义分割模型识别出的所述图像中目标主体的边缘信息;B:根据所述边缘信息分割所述图像中目标主体;C:若分割出的所述目标主体不正确,获取对所述边缘信息进行校正后的图像;D:根据校正后的图像对所述语义分割模型进行训练;E:获取训练后语义分割模型的收敛结果;F:在所述收敛结果不满足预设收敛条件时,迭代执行步骤A至步骤E直到所述收敛结果满足预设收敛条件。上述方法,对语义分割模型进行训练的训练数据集无需人工标注,大大降低了人工标注样本图像的工作量,节省了对语义分割模型进行训练的成本。
Description
技术领域
本申请涉及到计算机技术领域,特别是涉及到一种模型训练方法、装置、电子设备和计算机可读存储介质。
背景技术
随着大数据以及机器学习技术的发展,采用机器学习技术处理大数据越来越常见。通常情况下,可采用机器学习技术构建的机器学习模型对大数据进行处理,在采用机器学习模型对大数据进行处理之前,通常需要对机器学习模型进行训练、检测和验证,在机器学习模型验证通过后再用机器学习模型对大数据进行处理。
发明内容
本申请实施例提供一种模型训练方法、装置、电子设备和计算机可读存储介质,可以节省对模型进行训练的成本,提高对模型进行训练的效率。
一种模型训练方法,包括:
A:将图像输入预设的语义分割模型,获取所述语义分割模型识别出的所述图像中目标主体的边缘信息;
B:根据所述边缘信息分割所述图像中目标主体;
C:若分割出的所述目标主体不正确,获取对所述边缘信息进行校正后的图像;
D:根据校正后的图像对所述语义分割模型进行训练;
E:获取训练后语义分割模型的收敛结果;
F:在所述收敛结果不满足预设收敛条件时,迭代执行步骤A至步骤E直到所述收敛结果满足预设收敛条件。
一种模型训练装置,包括:
第一获取模块,用于将图像输入预设的语义分割模型,获取所述语义分割模型识别出的所述图像中目标主体的边缘信息;
分割模块,用于根据所述边缘信息分割所述图像中目标主体;
第二获取模块,用于若分割出的所述目标主体不正确,获取对所述边缘信息进行校正后的图像;
训练模块,用于根据校正后的图像对所述语义分割模型进行训练;
第三获取模块,用于获取训练后语义分割模型的收敛结果;
处理模块,用于在所述收敛结果不满足预设收敛条件时,由所述第一获取模块、分割模型、第二获取模块和所述训练模块迭代执行各自的功能直到所述收敛结果满足预设收敛条件。
一种电子设备,包括存储器及处理器,所述存储器中储存有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如上所述的方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如上所述的方法的步骤。
本申请实施例中方法、装置、电子设备和计算机可读存储介质,采用语义分割模型对图像进行自动检测获取图像中目标主体的边缘信息,在根据上述边缘信息检测获取的目标主体不正确时,再获取对边缘信息进行校正后的图像,再根据上述校正后的图像对语义分割模型进行训练,即对语义分割模型进行训练的训练数据集无需人工标注,大大降低了人工标注样本图像的工作量,节省了对语义分割模型进行训练的成本。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为一个实施例中图像处理方法的流程图;
图2为另一个实施例中图像处理方法的流程图;
图3为另一个实施例中图像处理方法的流程图;
图4为另一个实施例中图像处理方法的流程图;
图5为一个实施例中图像处理装置的结构框图;
图6为另一个实施例中图像处理装置的结构框图;
图7为一个实施例中电子设备的内部结构示意图;
图8为一个实施例中图像处理电路的示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
电子设备在获取到图像后,可对图像进行图像处理。例如,对图像进行饱和度处理、图像亮度处理、图像对比度处理以及图像色彩处理等。电子设备还可根据图像拍摄的时刻、图像拍摄的地点、图像中人脸等对图像进行分组处理。上述电子设备对图像的图像处理是基于图像的色彩空间和电子设备的相机参数对图像进行参数调整。进一步的,电子设备还可对图像进行场景识别,识别上述图像对应的场景类别,进而根据图像对应的场景类别对图像进行全局处理或局部处理。其中,电子设备可根据语义分割模型对图像进行场景识别。上述语义分割模型是指根据深度学习算法构建的模型,上述语义分割模型可模拟人脑中用于分析学习的神经网络,再根据模拟的人脑机制对输入的数据进行分析。在使用语义分割模型对输入的数据进行分析之前,通常需要对语义分割模型进行训练,使语义分割模型的收敛结果达到预设收敛条件。
通常情况下,在对上述语义分割模型进行训练时,可将人工处理后的数据输入上述语义分割模型,使上述语义分割模型根据上述人工处理后的数据进行学习和分析,使得上述语义分割模型的收敛结果达到预设收敛条件。例如,当上述语义分割模型是用于图像场景识别的语义分割模型时,电子设备可将人工标注图像输入上述语义分割模型,上述人工标注图像是指对图像中目标主体的边缘已标注出的图像,上述语义分割模型则可根据输入的人工标注图像进行学习和分析。当上述语义分割模型学习的样本足够多时,上述语义分割模型即可对图像中目标主体的边缘进行识别。通常情况下,在对语义分割模型进行训练时需要海量的人工处理数据作为样本,从而导致对语义分割模型训练的成本较高。
图1为一个实施例中一种模型训练方法,其特征在于,包括:
步骤102,将图像输入预设的语义分割模型,获取语义分割模型识别出的图像中目标主体的边缘信息。
语义分割模型是指根据图像分割算法识别图像中目标主体的边缘信息的模型,电子设备将图像输入上述语义分割模型后,语义分割模型可根据图像分割算法对上述图像进行检测并识别图像中目标主体的边缘信息。上述目标主体的边缘信息即一个目标主体与另一个目标主体或背景的分界线。在将图像输入到语义分割模型后,语义分割模型可对图像中的各个像素进行识别,识别上述图像中各个像素对应的目标主体,再划分各个目标主体的边缘信息。其中,上述目标主体可为预设类型的目标主体,可包括:人像、婴儿、猫、狗、美食、蓝天、绿草、沙滩等。电子设备在将图像输入语义分割模型后,可识别上述图像中是否包括人像、婴儿、猫、狗、美食、蓝天、绿草、沙滩等,在识别到上述图像中目标主体后,例如识别到人像后,语义分割模型可获取上述人像的边缘信息,根据上述人像的边缘信息即可将图像中人像与背景区域分隔开。
语义分割模型在识别上述图像中目标主体的边缘信息时,也可识别上述目标主体的类别。上述目标主体的类别包括:人像、婴儿、猫、狗、美食、蓝天、绿草、沙滩等,即语义分割模型可识别出上述图像中目标主体的类别以及各个目标主体的边界。例如,语义分割模型可识别出图像中包含目标主体“猫”,并标识出目标主体“猫”的边界线。
步骤104,根据边缘信息分割图像中目标主体。
在获取到图像中目标主体的边缘信息后,电子设备可根据边缘检测算法将目标主体从图像中分割出来。其中,电子设备可在电子设备中根据边缘检测算法将图像中目标主体分割出来;电子设备也可将上述图像及图像带有的边缘信息上传到服务器,由服务器对上述图像中目标主体进行分割,电子设备在接收服务器返回上述图像中分割出来的目标主体信息。
步骤106,若分割出的目标主体不正确,获取对边缘信息进行校正后的图像。
在将图像中目标主体分割出来后,可检测上述图像中分割的目标主体是否正确。若上述图像中分割的目标主体不正确,则获取对上述图像中边缘信息进行校正后的图像。即当图像中分割的目标主体不正确时,可获取对边缘信息进行校正后图像,上述校正后图像中带有目标主体正确的边缘信息。其中,可由电子设备对上述图像中目标主体的边缘信息进行校正,也可由人工对上述图像中目标主体的边缘信息进行校正。
步骤108,根据校正后的图像对语义分割模型进行训练。
在得到对目标主体的边缘信息进行校正后的校正后图像后,可根据校正后的图像对上述语义分割模型进行训练。即当检测到语义分割模型对图像中目标主体的边缘信息识别错误后,对上述识别错误的图像中目标主体的边缘信息进行校正,获取校正后的图像,再将上述带有校正后边缘信息的图像重新输入语义分割模型,使得语义分割模型可根据上述图像中目标主体的校正后边缘信息进行学习和训练,提高上述语义分割模型对图像中目标主体的边缘信息检测的正确率。
步骤110,获取训练后语义分割模型的收敛结果。
在对上述语义分割模型进行训练后,可获取训练后的语义分割模型的收敛结果,检测上述训练后语义分割模型的收敛结果是否达到预设收敛条件。其中,对语义分割模型进行训练后,语义分割模型会越来越收敛,上述收敛结果可表示上述语义分割模型的精度。当上述收敛结果满足预设收敛条件时,即上述训练后学习模型的精度达到预设精度时,可使用上述训练后的语义分割模型进行图像数据的图像分割。例如,预设精度为语义分割模型对图像中目标主体的边缘信息识别正确率为95%,当训练后语义分割模型的精度不低于上述95%时,则训练后语义分割模型的收敛结果满足预设收敛条件,可根据上述训练后语义分割模型识别图像中目标主体的边缘信息。
步骤112,在收敛结果不满足预设收敛条件时,迭代执行步骤102至步骤110直到收敛结果满足预设收敛条件。
当上述收敛结果未达到预设收敛条件时,可迭代执行上述步骤102至上述步骤110:将图像输入预设的语义分割模型,获取语义分割模型对图像中目标主体进行识别得到的目标主体的边缘信息;根据上述边缘信息分割图像中目标主体,在分割出的目标主体不正确时,获取对上述边缘信息进行校正后的图像,在根据上述校正后的图像对语义分割模型进行训练,得到训练后的语义分割模型的收敛结果。即重复执行步骤
以语义分割模型为语义分割模型为例,将图像输入上述语义分割模型,则上述语义分割模型可自动识别上述图像中目标主体并标注出图像中目标主体的边缘信息,根据上述目标主体的边缘信息可对图像中目标主体进行分割,当根据上述边缘信息分割出的目标主体不正确时,可获取对上述图像中目标主体的边缘信息进行校正后的图像,在将上述校正后的图像数据语义分割模型,根据上述校正后的图像的边缘信息对语义分割模型进行训练,提升上述语义分割模型的精度。获取训练后语义分割模型的精度,在语义分割模型的精度达到预设精度时,可使用上述语义分割模型处理图像;当上述语义分割模型的精度未达到预设精度时,可重复上述步骤对语义分割模型进行训练直到上述语义分割模型的精度达到预设精度。
通常情况下,在对语义分割模型进行训练时,需要人工标注样本图像,再根据人工标注的样本图像对语义分割模型进行训练,使得语义分割模型的收敛结果满足上述收敛条件,而对语义分割模型进行训练通常需要海量数据,因此采用人工标注样本图像的方法来训练语义分割模型的成本较高。
本申请实施例中方法,采用语义分割模型对图像进行自动检测获取图像中目标主体的边缘信息,在根据上述边缘信息检测获取的目标主体不正确时,再获取对边缘信息进行校正后的图像,在根据上述校正后的图像对语义分割模型进行训练,即对语义分割模型进行训练的训练数据集无需人工标注,大大降低了人工标注样本图像的工作量,节省了对语义分割模型进行训练的成本;且通过对语义分割模型进行迭代训练,可提高语义分割模型的收敛结果,也提高了对语义分割模型进行训练的效率。
在一个实施例中,一种模型训练方法包括:
步骤202,将图像输入预设的语义分割模型,获取所述语义分割模型识别出的所述图像中目标主体的边缘信息。
步骤204,根据所述边缘信息分割所述图像中目标主体。
步骤206,若分割出的所述目标主体不正确,获取对所述边缘信息进行校正后的图像。
步骤208,根据校正后的图像对所述语义分割模型进行训练。
步骤210,获取训练后语义分割模型的收敛结果。
步骤212,若检测到所述训练后语义分割模型未收敛,调整所述语义分割模型识别图像中目标主体的边缘信息的精度。
步骤214,在所述收敛结果不满足预设收敛条件时,迭代执行步骤202至步骤210直到所述收敛结果满足预设收敛条件。
在对语义分割模型进行训练后,可获取上述训练后的语义分割模型的收敛结果,若上述语义分割模型未收敛,即上述语义分割模型在训练后没有比训练前更收敛时,则可调整语义分割模型识别图像中目标主体的边缘信息的精度。可选地,可将上述语义分割模型识别图像中目标主体的边缘信息的精度调高,即上述语义分割模型识别图像中目标主体的边缘信息更准确。在调整上述语义分割模型的精度后,在迭代执行步骤202至步骤210,提高上述语义分割模型的收敛结果。
在一个实施例中,一种模型训练方法包括:
步骤302,将图像输入预设的语义分割模型,获取所述语义分割模型识别出的所述图像中目标主体的边缘信息。
步骤304,根据所述边缘信息分割所述图像中目标主体。
步骤306,若分割出的所述目标主体不正确,获取对所述边缘信息进行校正后的图像。
步骤308,根据校正后的图像对所述语义分割模型进行训练。
步骤310,获取训练后语义分割模型的收敛结果。
步骤312,在收敛结果满足预设收敛条件时,采用训练后语义分割模型对待检测图像进行检测,识别待检测图像中目标主体的边缘信息。
在对上述语义分割模型进行训练后,若检测到训练后语义分割模型的收敛结果满足预设收敛条件,则上述训练后语义分割模型可对待检测图像进行图像分割。即对上述语义分割模型进行训练后,若检测到训练后语义分割模型的精度达到预设精度,可根据上述训练后的语义分割模型对待检测图像进行图像分割。上述待检测图像是指需要进行图像分割的图像,语义分割模型对待检测图像进行图像分割包括:识别上述待检测图像中目标主体以及目标主体的边缘信息。
本申请实施例中方法,在语义分割模型的收敛结果满足预设收敛条件时,可采用训练后的语义分割模型对待检测图像进行图像分割,可提高对图像进行图像分割的速度。
在一个实施例中,一种模型训练方法,包括:
步骤402,获取样本图像。
步骤404,根据样本图像集合对语义分割模型进行训练,使得语义分割模型的精度达到第一阈值。
步骤406,将图像输入预设的语义分割模型,获取所述语义分割模型识别出的所述图像中目标主体的边缘信息。
步骤408,根据所述边缘信息分割所述图像中目标主体。
步骤410,若分割出的所述目标主体不正确,获取对所述边缘信息进行校正后的图像。
步骤412,根据校正后的图像对所述语义分割模型进行训练。
在采用语义分割模型对图像数据进行检测时,若语义分割模型的精度太低,则语义分割模型对图像数据进行图像分割得到的目标主体的边缘信息错误率较高,因此,在采用语义分割模型对图像数据进行检测之前,需要对语义分割模型进行训练,使语义分割模型精度达到第一阈值。上述语义分割模型的精度是指语义分割模型对图像数据进行图像分割得到的目标主体的边缘信息的正确率,即语义分割模型的收敛结果。语义分割模型的精度越高时,即语义分割模型对图像数据进行目标检测得到的信息的正确率越高。
对上述语义分割模型进行训练的方法包括:获取样本图像,根据上述样本图像对语义分割模型进行训练。上述样本图像是已标识图像中目标主体和目标主体边缘信息的图像。根据上述样本图像对语义分割模型进行训练包括:将上述样本图像输入语义分割模型,使语义分割模型根据上述图像数据信息进行学习,提高语义分割模型识别图像中目标主体以及目标主体的边缘信息的精度。在对上述语义分割模型进行训练后,可获取训练后语义分割模型的精度,检测上述训练后语义分割模型的精度是否达到第一阈值,在训练后语义分割模型的精度达到第一阈值时,将图像数据输入上述预设的语义分割模型;在训练后语义分割模型的精度未达到第一阈值时,更换样本图像,根据样本图像对上述语义分割模型重新进行训练,直到上述语义分割模型的精度达到第一阈值。当上述预设收敛条件表示为精度时,上述第一阈值第一上述预设收敛条件;例如,当上述预设收敛条件为语义分割模型识别正确率为95%,则上述第一阈值可为语义分割模型识别正确率为80%。即先采用样本图像中图像样本对语义分割模型进行训练,使得语义分割模型对图像数据的识别正确率达到80%,再根据训练后语义分割模型对图像进行图像分割,获取图像中目标主体的边缘信息,提高语义分割模型的收敛结果。
本申请实施例中方法,在采用语义分割模型对图像数据进行检测之前,先对语义分割模型进行训练,提升语义分割模型的精度,即减少了对语义分割模型进行训练的样本数量,又使得语义分割模型对图像进行目标检测时精度不会太低,降低了对语义分割模型进行训练的成本。
在一个实施例中,获取样本图像包括:根据预设的图像分割标准对样本图像进行图像分割,得到样本图像中目标主体的边缘信息。
在获取样本图像之前,需要获取图像分割标准,根据上述图像分割标准对图像进行图像分割,识别图像中目标主体及目标主体的边缘信息。在获取到上述图像分割标准后,可根据上述图像分割标准对样本图像进行图像分割,获取样本图像中目标主体的边缘信息。在获取到上述样本图像以及样本图像的边缘信息后,可根据上述样本图像以及样本图像的边缘信息对语义分割模型进行训练。
在一个实施例中,根据校正后的图像对语义分割模型进行训练包括:将校正后的图像与样本图像组成训练图像集;根据训练图像集对语义分割模型进行训练。
电子设备可将上述校正后的图像与样本图像组成训练图像集,上述训练图像集是指用于训练语义分割模型的图像集合,包括样本图像和校正后图像。上述训练图像集中图像中带有目标主体的边缘信息,电子设备可将上述训练图像集中图像分别输入语义分割模型,使得语义分割模型可根据上述训练图像集中图像进行学习和训练,提高语义分割模型的收敛结果。
在一个实施例中,一种模型训练方法,包括:
A:将图像输入预设的语义分割模型,获取语义分割模型识别出的图像中目标主体的边缘信息。
B:根据边缘信息分割图像中目标主体。
C:若分割出的目标主体不正确,获取对边缘信息进行校正后的图像。
D:根据校正后的图像对语义分割模型进行训练。
E:获取训练后语义分割模型的收敛结果;
F:在收敛结果不满足预设收敛条件时,迭代执行步骤A至步骤E直到收敛结果满足预设收敛条件。
在一个实施例中,还包括:在收敛结果满足预设收敛条件时,采用训练后语义分割模型对待检测图像进行检测,识别待检测图像中目标主体的边缘信息。
在一个实施例中,在将图像输入预设的语义分割模型之前,方法还包括:获取样本图像;根据样本图像集合对语义分割模型进行训练,使得语义分割模型的精度达到第一阈值。
在一个实施例中,获取样本图像包括:根据预设的图像分割标准对样本图像进行图像分割,得到样本图像中目标主体的边缘信息。
在一个实施例中,根据校正后的图像对语义分割模型进行训练包括:将校正后的图像与样本图像组成训练图像集;根据训练图像集对语义分割模型进行训练。
在一个实施例中,在所述收敛结果不满足预设收敛条件时之前,还包括:
若检测到所述训练后语义分割模型未收敛,调整所述语义分割模型识别图像中目标主体的边缘信息的精度。
应该理解的是,虽然上述流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,上述流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
图5为一个实施例中模型训练装置,包括:
第一获取模块502,用于将图像输入预设的语义分割模型,获取语义分割模型识别出的图像中目标主体的边缘信息。
分割模块504,用于根据边缘信息分割图像中目标主体。
第二获取模块506,用于若分割出的目标主体不正确,获取对边缘信息进行校正后的图像。
训练模块508,用于根据校正后的图像对语义分割模型进行训练。
第三获取模块510,用于获取训练后语义分割模型的收敛结果。
处理模块512,用于在收敛结果不满足预设收敛条件时,由所述第一获取模块、分割模型、第二获取模块和所述训练模块迭代执行各自的功能直到所述收敛结果满足预设收敛条件。
在一个实施例中,处理模块512还用于在收敛结果满足预设收敛条件时,采用训练后语义分割模型对待检测图像进行检测,识别待检测图像中目标主体的边缘信息。
在一个实施例中,第一获取模块502还用于在将图像输入预设的语义分割模型之前,获取样本图像;根据样本图像集合对语义分割模型进行训练,使得语义分割模型的精度达到第一阈值。
在一个实施例中,第一获取模块502获取样本图像包括:根据预设的图像分割标准对样本图像进行图像分割,得到样本图像中目标主体的边缘信息。
在一个实施例中,训练模块508根据校正后的图像对语义分割模型进行训练包括:将校正后的图像与样本图像组成训练图像集;根据训练图像集对语义分割模型进行训练。
图6为另一个实施例中模型训练装置,包括:
第一获取模块602,用于将图像输入预设的语义分割模型,获取语义分割模型识别出的图像中目标主体的边缘信息。
分割模块604,用于根据边缘信息分割图像中目标主体。
第二获取模块606,用于若分割出的目标主体不正确,获取对边缘信息进行校正后的图像。
训练模块608,用于根据校正后的图像对语义分割模型进行训练。
第三获取模块610,用于获取训练后语义分割模型的收敛结果。
调整模块612,若检测到所述训练后语义分割模型未收敛,调整所述语义分割模型识别图像中目标主体的边缘信息的精度。
处理模块614,用于在收敛结果不满足预设收敛条件时,由所述第一获取模块、分割模型、第二获取模块和所述训练模块迭代执行各自的功能直到所述收敛结果满足预设收敛条件。
上述第一获取模块602、分割模块604、第二获取模块606、训练模块608、第三获取模块610以及处理模块614与图5中对应的模块功能相同。
本申请实施例中提供的模型训练装置中的各个模块的实现可为计算机程序的形式。该计算机程序可在终端或服务器上运行。该计算机程序构成的程序模块可存储在终端或服务器的存储器上。该计算机程序被处理器执行时,实现本申请实施例中所描述模型训练方法的步骤。
本申请实施例还提供了一种计算机可读存储介质。一个或多个包含计算机可执行指令的非易失性计算机可读存储介质,当计算机可执行指令被一个或多个处理器执行时,使得处理器执行本申请实施例中所描述模型训练方法的步骤。
本申请实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行本申请实施例中所描述模型训练方法的步骤。
图7为一个实施例中电子设备的内部结构示意图。如图7所示,该电子设备包括通过***总线连接的处理器、存储器和网络接口。其中,该处理器用于提供计算和控制能力,支撑整个电子设备的运行。存储器用于存储数据、程序等,存储器上存储至少一个计算机程序,该计算机程序可被处理器执行,以实现本申请实施例中提供的适用于电子设备的模型训练方法。存储器可包括非易失性存储介质及内存储器。非易失性存储介质存储有操作***和计算机程序。该计算机程序可被处理器所执行,以用于实现以下各个实施例所提供的一种模型训练方法。内存储器为非易失性存储介质中的操作***计算机程序提供高速缓存的运行环境。网络接口可以是以太网卡或无线网卡等,用于与外部的电子设备进行通信。该电子设备可以是手机、平板电脑或者个人数字助理或穿戴式设备等。
本申请实施例还提供一种电子设备。上述电子设备中包括图像处理电路,图像处理电路可以利用硬件和/或软件组件实现,可包括定义ISP(Image SignalProcessing,图像信号处理)管线的各种处理单元。图8为一个实施例中图像处理电路的示意图。如图8所示,为便于说明,仅示出与本申请实施例相关的图像处理技术的各个方面。
如图8所示,图像处理电路包括第一ISP处理器830、第二ISP处理器840和控制逻辑器850。第一摄像头810包括一个或多个第一透镜812和第一图像传感器814。第一图像传感器814可包括色彩滤镜阵列(如Bayer滤镜),第一图像传感器814可获取用第一图像传感器814的每个成像像素捕捉的光强度和波长信息,并提供可由第一ISP处理器830处理的一组图像数据。第二摄像头820包括一个或多个第二透镜822和第二图像传感器824。第二图像传感器824可包括色彩滤镜阵列(如Bayer滤镜),第二图像传感器824可获取用第二图像传感器824的每个成像像素捕捉的光强度和波长信息,并提供可由第二ISP处理器840处理的一组图像数据。
第一摄像头810采集的第一图像传输给第一ISP处理器830进行处理,第一ISP处理器830处理第一图像后,可将第一图像的统计数据(如图像的亮度、图像的反差值、图像的颜色等)发送给控制逻辑器850,控制逻辑器850可根据统计数据确定第一摄像头810的控制参数,从而第一摄像头810可根据控制参数进行自动对焦、自动曝光等操作。第一图像经过第一ISP处理器830进行处理后可存储至图像存储器860中,第一ISP处理器830也可以读取图像存储器860中存储的图像以对进行处理。另外,第一图像经过ISP处理器830进行处理后可直接发送至显示器870进行显示,显示器870也可以读取图像存储器860中的图像以进行显示。
其中,第一ISP处理器830按多种格式逐个像素地处理图像数据。例如,每个图像像素可具有8、10、12或14比特的位深度,第一ISP处理器830可对图像数据进行一个或多个图像处理操作、收集关于图像数据的统计信息。其中,图像处理操作可按相同或不同的位深度精度进行。
图像存储器860可为存储器装置的一部分、存储设备、或电子设备内的独立的专用存储器,并可包括DMA(Direct Memory Access,直接直接存储器存取)特征。
当接收到来自第一图像传感器814接口时,第一ISP处理器830可进行一个或多个图像处理操作,如时域滤波。处理后的图像数据可发送给图像存储器860,以便在被显示之前进行另外的处理。第一ISP处理器830从图像存储器860接收处理数据,并对处理数据进行RGB和YCbCr颜色空间中的图像数据处理。第一ISP处理器830处理后的图像数据可输出给显示器870,以供用户观看和/或由图形引擎或GPU(Graphics Processing Unit,图形处理器)进一步处理。此外,第一ISP处理器830的输出还可发送给图像存储器860,且显示器870可从图像存储器860读取图像数据。在一个实施例中,图像存储器860可被配置为实现一个或多个帧缓冲器。
第一ISP处理器830确定的统计数据可发送给控制逻辑器850。例如,统计数据可包括自动曝光、自动白平衡、自动聚焦、闪烁检测、黑电平补偿、第一透镜812阴影校正等第一图像传感器814统计信息。控制逻辑器850可包括执行一个或多个例程(如固件)的处理器和/或微控制器,一个或多个例程可根据接收的统计数据,确定第一摄像头810的控制参数及第一ISP处理器830的控制参数。例如,第一摄像头810的控制参数可包括增益、曝光控制的积分时间、防抖参数、闪光控制参数、第一透镜812控制参数(例如聚焦或变焦用焦距)、或这些参数的组合等。ISP控制参数可包括用于自动白平衡和颜色调整(例如,在RGB处理期间)的增益水平和色彩校正矩阵,以及第一透镜812阴影校正参数。
同样地,第二摄像头820采集的第二图像传输给第二ISP处理器840进行处理,第二ISP处理器840处理第一图像后,可将第二图像的统计数据(如图像的亮度、图像的反差值、图像的颜色等)发送给控制逻辑器850,控制逻辑器850可根据统计数据确定第二摄像头820的控制参数,从而第二摄像头820可根据控制参数进行自动对焦、自动曝光等操作。第二图像经过第二ISP处理器840进行处理后可存储至图像存储器860中,第二ISP处理器840也可以读取图像存储器860中存储的图像以对进行处理。另外,第二图像经过ISP处理器840进行处理后可直接发送至显示器870进行显示,显示器870也可以读取图像存储器860中的图像以进行显示。第二摄像头820和第二ISP处理器840也可以实现如第一摄像头810和第一ISP处理器830所描述的处理过程。运用图8中图像处理技术可实现本申请实施例中模型训练方法。
本申请所使用的对存储器、存储、数据库或其它介质的任何引用可包括非易失性和/或易失性存储器。合适的非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM),它用作外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDR SDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)。
以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种模型训练方法,其特征在于,包括:
A:将图像输入预设的语义分割模型,获取所述语义分割模型识别出的所述图像中目标主体的边缘信息;
B:根据所述边缘信息分割所述图像中目标主体;
C:若分割出的所述目标主体不正确,获取对所述边缘信息进行校正后的图像;
D:根据校正后的图像对所述语义分割模型进行训练;
E:获取训练后语义分割模型的收敛结果;
F:在所述收敛结果不满足预设收敛条件时,迭代执行步骤A至步骤E直到所述收敛结果满足预设收敛条件。
2.根据权利要求1所述的方法,其特征在于,还包括:
在所述收敛结果满足预设收敛条件时,采用训练后语义分割模型对待检测图像进行检测,识别所述待检测图像中目标主体的边缘信息。
3.根据权利要求1所述的方法,其特征在于,在所述将图像输入预设的语义分割模型之前,还包括:
获取样本图像;
根据所述样本图像集合对所述语义分割模型进行训练,使得所述语义分割模型的精度达到第一阈值。
4.根据权利要求1所述的方法,其特征在于,所述获取样本图像包括:
根据预设的图像分割标准对所述样本图像进行图像分割,得到所述样本图像中目标主体的边缘信息。
5.根据权利要求1所述的方法,其特征在于,所述根据校正后的图像对所述语义分割模型进行训练包括:
将所述校正后的图像与样本图像组成训练图像集;
根据所述训练图像集对所述语义分割模型进行训练。
6.根据权利要求1所述的方法,其特征在于,在所述收敛结果不满足预设收敛条件时之前,还包括:
若检测到所述训练后语义分割模型未收敛,调整所述语义分割模型识别图像中目标主体的边缘信息的精度。
7.一种模型训练装置,其特征在于,包括:
第一获取模块,用于将图像输入预设的语义分割模型,获取所述语义分割模型识别出的所述图像中目标主体的边缘信息;
分割模块,用于根据所述边缘信息分割所述图像中目标主体;
第二获取模块,用于若分割出的所述目标主体不正确,获取对所述边缘信息进行校正后的图像;
训练模块,用于根据校正后的图像对所述语义分割模型进行训练;
第三获取模块,用于获取训练后语义分割模型的收敛结果;
处理模块,用于在所述收敛结果不满足预设收敛条件时,由所述第一获取模块、分割模型、第二获取模块和所述训练模块迭代执行各自的功能直到所述收敛结果满足预设收敛条件。
8.根据权利要求7所述的装置,其特征在于:
所述处理模块还用于在所述收敛结果满足预设收敛条件时,采用训练后语义分割模型对待检测图像进行检测,识别所述待检测图像中目标主体的边缘信息。
9.一种电子设备,包括存储器及处理器,所述存储器中储存有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1至7中任一项所述的方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810586082.0A CN108921161B (zh) | 2018-06-08 | 2018-06-08 | 模型训练方法、装置、电子设备和计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810586082.0A CN108921161B (zh) | 2018-06-08 | 2018-06-08 | 模型训练方法、装置、电子设备和计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108921161A true CN108921161A (zh) | 2018-11-30 |
CN108921161B CN108921161B (zh) | 2021-03-23 |
Family
ID=64418558
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810586082.0A Active CN108921161B (zh) | 2018-06-08 | 2018-06-08 | 模型训练方法、装置、电子设备和计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108921161B (zh) |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109613524A (zh) * | 2018-12-11 | 2019-04-12 | 银河水滴科技(北京)有限公司 | 一种基于相机拍摄的轨距检测方法及装置 |
CN109800805A (zh) * | 2019-01-14 | 2019-05-24 | 上海联影智能医疗科技有限公司 | 基于人工智能的图像处理***以及计算机设备 |
CN109947651A (zh) * | 2019-03-21 | 2019-06-28 | 上海智臻智能网络科技股份有限公司 | 人工智能引擎优化方法和装置 |
CN110009573A (zh) * | 2019-01-29 | 2019-07-12 | 北京奇艺世纪科技有限公司 | 模型训练、图像处理方法、装置、电子设备及计算机可读存储介质 |
CN110110811A (zh) * | 2019-05-17 | 2019-08-09 | 北京字节跳动网络技术有限公司 | 用于训练模型的方法和装置、用于预测信息的方法和装置 |
CN110610483A (zh) * | 2019-08-12 | 2019-12-24 | 全球能源互联网研究院有限公司 | 裂纹图像获取、检测方法、计算机设备及可读存储介质 |
CN111191724A (zh) * | 2019-12-31 | 2020-05-22 | 深圳市优必选科技股份有限公司 | 一种电梯图像标注方法、装置、计算机设备及存储介质 |
CN111833291A (zh) * | 2019-04-22 | 2020-10-27 | 上海汽车集团股份有限公司 | 一种语义分割训练集人工标注评价方法及装置 |
CN111983794A (zh) * | 2019-05-21 | 2020-11-24 | 卡尔蔡司显微镜有限责任公司 | 自动聚焦光学显微镜 |
CN112132845A (zh) * | 2020-08-13 | 2020-12-25 | 当家移动绿色互联网技术集团有限公司 | 三维模型的单体化方法、装置、电子设备和可读介质 |
CN112199539A (zh) * | 2020-09-10 | 2021-01-08 | 佛山聚卓科技有限公司 | 无人机三维地图摄影图像内容自动标注方法、***及设备 |
CN112560853A (zh) * | 2020-12-14 | 2021-03-26 | 中科云谷科技有限公司 | 图像处理的方法、装置及存储介质 |
CN113128486A (zh) * | 2021-03-31 | 2021-07-16 | 河北师范大学 | 手写数学公式样本库的构建方法、装置及终端设备 |
CN113673529A (zh) * | 2021-08-16 | 2021-11-19 | 连城凯克斯科技有限公司 | 语义分割模型训练方法、硅熔融状态检测方法及电子设备 |
CN113706561A (zh) * | 2021-10-29 | 2021-11-26 | 华南理工大学 | 一种基于区域分离的图像语义分割方法 |
CN113762049A (zh) * | 2021-05-11 | 2021-12-07 | 腾讯科技(深圳)有限公司 | 内容识别方法、装置、存储介质和终端设备 |
CN114677567A (zh) * | 2022-05-27 | 2022-06-28 | 成都数联云算科技有限公司 | 模型训练方法、装置、存储介质及电子设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140050391A1 (en) * | 2012-08-17 | 2014-02-20 | Nec Laboratories America, Inc. | Image segmentation for large-scale fine-grained recognition |
CN106530305A (zh) * | 2016-09-23 | 2017-03-22 | 北京市商汤科技开发有限公司 | 语义分割模型训练和图像分割方法及装置、计算设备 |
CN107341805A (zh) * | 2016-08-19 | 2017-11-10 | 北京市商汤科技开发有限公司 | 图像前背景分割及网络模型训练、图像处理方法和装置 |
US20180107901A1 (en) * | 2015-04-02 | 2018-04-19 | Hitachi, Ltd. | Image processing device, object detection device, image processing method |
CN107944457A (zh) * | 2017-11-23 | 2018-04-20 | 浙江清华长三角研究院 | 一种复杂场景下的绘画物体识别与提取方法 |
-
2018
- 2018-06-08 CN CN201810586082.0A patent/CN108921161B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140050391A1 (en) * | 2012-08-17 | 2014-02-20 | Nec Laboratories America, Inc. | Image segmentation for large-scale fine-grained recognition |
US20180107901A1 (en) * | 2015-04-02 | 2018-04-19 | Hitachi, Ltd. | Image processing device, object detection device, image processing method |
CN107341805A (zh) * | 2016-08-19 | 2017-11-10 | 北京市商汤科技开发有限公司 | 图像前背景分割及网络模型训练、图像处理方法和装置 |
CN106530305A (zh) * | 2016-09-23 | 2017-03-22 | 北京市商汤科技开发有限公司 | 语义分割模型训练和图像分割方法及装置、计算设备 |
CN107944457A (zh) * | 2017-11-23 | 2018-04-20 | 浙江清华长三角研究院 | 一种复杂场景下的绘画物体识别与提取方法 |
Cited By (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109613524A (zh) * | 2018-12-11 | 2019-04-12 | 银河水滴科技(北京)有限公司 | 一种基于相机拍摄的轨距检测方法及装置 |
CN109800805A (zh) * | 2019-01-14 | 2019-05-24 | 上海联影智能医疗科技有限公司 | 基于人工智能的图像处理***以及计算机设备 |
CN110009573A (zh) * | 2019-01-29 | 2019-07-12 | 北京奇艺世纪科技有限公司 | 模型训练、图像处理方法、装置、电子设备及计算机可读存储介质 |
CN110009573B (zh) * | 2019-01-29 | 2022-02-01 | 北京奇艺世纪科技有限公司 | 模型训练、图像处理方法、装置、电子设备及存储介质 |
CN109947651A (zh) * | 2019-03-21 | 2019-06-28 | 上海智臻智能网络科技股份有限公司 | 人工智能引擎优化方法和装置 |
CN111833291A (zh) * | 2019-04-22 | 2020-10-27 | 上海汽车集团股份有限公司 | 一种语义分割训练集人工标注评价方法及装置 |
CN111833291B (zh) * | 2019-04-22 | 2023-11-03 | 上海汽车集团股份有限公司 | 一种语义分割训练集人工标注评价方法及装置 |
CN110110811A (zh) * | 2019-05-17 | 2019-08-09 | 北京字节跳动网络技术有限公司 | 用于训练模型的方法和装置、用于预测信息的方法和装置 |
WO2020233200A1 (zh) * | 2019-05-17 | 2020-11-26 | 北京字节跳动网络技术有限公司 | 用于训练模型的方法和装置、用于预测信息的方法和装置 |
CN111983794A (zh) * | 2019-05-21 | 2020-11-24 | 卡尔蔡司显微镜有限责任公司 | 自动聚焦光学显微镜 |
CN111983794B (zh) * | 2019-05-21 | 2022-07-26 | 卡尔蔡司显微镜有限责任公司 | 自动聚焦光学显微镜 |
CN110610483A (zh) * | 2019-08-12 | 2019-12-24 | 全球能源互联网研究院有限公司 | 裂纹图像获取、检测方法、计算机设备及可读存储介质 |
CN110610483B (zh) * | 2019-08-12 | 2022-02-22 | 全球能源互联网研究院有限公司 | 裂纹图像获取、检测方法、计算机设备及可读存储介质 |
CN111191724A (zh) * | 2019-12-31 | 2020-05-22 | 深圳市优必选科技股份有限公司 | 一种电梯图像标注方法、装置、计算机设备及存储介质 |
CN111191724B (zh) * | 2019-12-31 | 2024-04-23 | 深圳市优必选科技股份有限公司 | 一种电梯图像标注方法、装置、计算机设备及存储介质 |
CN112132845A (zh) * | 2020-08-13 | 2020-12-25 | 当家移动绿色互联网技术集团有限公司 | 三维模型的单体化方法、装置、电子设备和可读介质 |
CN112199539A (zh) * | 2020-09-10 | 2021-01-08 | 佛山聚卓科技有限公司 | 无人机三维地图摄影图像内容自动标注方法、***及设备 |
CN112560853A (zh) * | 2020-12-14 | 2021-03-26 | 中科云谷科技有限公司 | 图像处理的方法、装置及存储介质 |
CN113128486A (zh) * | 2021-03-31 | 2021-07-16 | 河北师范大学 | 手写数学公式样本库的构建方法、装置及终端设备 |
CN113128486B (zh) * | 2021-03-31 | 2022-12-27 | 河北师范大学 | 手写数学公式样本库的构建方法、装置及终端设备 |
CN113762049A (zh) * | 2021-05-11 | 2021-12-07 | 腾讯科技(深圳)有限公司 | 内容识别方法、装置、存储介质和终端设备 |
CN113762049B (zh) * | 2021-05-11 | 2024-03-29 | 腾讯科技(深圳)有限公司 | 内容识别方法、装置、存储介质和终端设备 |
CN113673529A (zh) * | 2021-08-16 | 2021-11-19 | 连城凯克斯科技有限公司 | 语义分割模型训练方法、硅熔融状态检测方法及电子设备 |
CN113706561A (zh) * | 2021-10-29 | 2021-11-26 | 华南理工大学 | 一种基于区域分离的图像语义分割方法 |
CN114677567A (zh) * | 2022-05-27 | 2022-06-28 | 成都数联云算科技有限公司 | 模型训练方法、装置、存储介质及电子设备 |
CN114677567B (zh) * | 2022-05-27 | 2022-10-14 | 成都数联云算科技有限公司 | 模型训练方法、装置、存储介质及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN108921161B (zh) | 2021-03-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108921161A (zh) | 模型训练方法、装置、电子设备和计算机可读存储介质 | |
CN108960232A (zh) | 模型训练方法、装置、电子设备和计算机可读存储介质 | |
CN108764208B (zh) | 图像处理方法和装置、存储介质、电子设备 | |
US11138478B2 (en) | Method and apparatus for training, classification model, mobile terminal, and readable storage medium | |
CN108764370B (zh) | 图像处理方法、装置、计算机可读存储介质和计算机设备 | |
CN108805103B (zh) | 图像处理方法和装置、电子设备、计算机可读存储介质 | |
CN108764372B (zh) | 数据集的构建方法和装置、移动终端、可读存储介质 | |
CN108777815B (zh) | 视频处理方法和装置、电子设备、计算机可读存储介质 | |
CN110276767A (zh) | 图像处理方法和装置、电子设备、计算机可读存储介质 | |
CN107833197B (zh) | 图像处理的方法、装置、计算机可读存储介质和电子设备 | |
WO2019233392A1 (zh) | 图像处理方法、装置、电子设备和计算机可读存储介质 | |
CN108921040A (zh) | 图像处理方法和装置、存储介质、电子设备 | |
CN108875619B (zh) | 视频处理方法和装置、电子设备、计算机可读存储介质 | |
CN108009999A (zh) | 图像处理方法、装置、计算机可读存储介质和电子设备 | |
CN107886484A (zh) | 美颜方法、装置、计算机可读存储介质和电子设备 | |
CN108810418A (zh) | 图像处理方法、装置、移动终端及计算机可读存储介质 | |
CN110473185A (zh) | 图像处理方法和装置、电子设备、计算机可读存储介质 | |
CN108804658B (zh) | 图像处理方法和装置、存储介质、电子设备 | |
CN108897786A (zh) | 应用程序的推荐方法、装置、存储介质及移动终端 | |
CN110956679B (zh) | 图像处理方法和装置、电子设备、计算机可读存储介质 | |
CN109002843A (zh) | 图像处理方法和装置、电子设备、计算机可读存储介质 | |
CN108764321B (zh) | 图像识别方法和装置、电子设备、存储介质 | |
CN107743200A (zh) | 拍照的方法、装置、计算机可读存储介质和电子设备 | |
CN109712177A (zh) | 图像处理方法、装置、电子设备和计算机可读存储介质 | |
CN108063891A (zh) | 图像处理方法、装置、计算机可读存储介质和计算机设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |