CN113793325B - 一种检测方法、装置、计算机设备和存储介质 - Google Patents
一种检测方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN113793325B CN113793325B CN202111107793.3A CN202111107793A CN113793325B CN 113793325 B CN113793325 B CN 113793325B CN 202111107793 A CN202111107793 A CN 202111107793A CN 113793325 B CN113793325 B CN 113793325B
- Authority
- CN
- China
- Prior art keywords
- target
- image
- determining
- detected
- target image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 68
- 238000003860 storage Methods 0.000 title claims abstract description 17
- 238000009826 distribution Methods 0.000 claims abstract description 193
- 238000013528 artificial neural network Methods 0.000 claims abstract description 80
- 238000000034 method Methods 0.000 claims abstract description 41
- 239000003245 coal Substances 0.000 claims description 40
- 238000005457 optimization Methods 0.000 claims description 23
- 238000012549 training Methods 0.000 claims description 21
- 238000000605 extraction Methods 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 6
- 238000004891 communication Methods 0.000 claims description 4
- 238000012360 testing method Methods 0.000 claims description 3
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 22
- 230000008569 process Effects 0.000 description 15
- 230000006870 function Effects 0.000 description 11
- 229910052742 iron Inorganic materials 0.000 description 11
- 238000010586 diagram Methods 0.000 description 8
- 238000012545 processing Methods 0.000 description 8
- 239000006185 dispersion Substances 0.000 description 7
- 230000002159 abnormal effect Effects 0.000 description 6
- 239000011521 glass Substances 0.000 description 4
- 239000004033 plastic Substances 0.000 description 4
- 229920003023 plastic Polymers 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 238000005286 illumination Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 229910052500 inorganic mineral Inorganic materials 0.000 description 2
- 239000011707 mineral Substances 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000013450 outlier detection Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0004—Industrial image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20076—Probabilistic image processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30108—Industrial image inspection
- G06T2207/30164—Workpiece; Machine component
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Software Systems (AREA)
- Quality & Reliability (AREA)
- Image Analysis (AREA)
Abstract
本公开提供了一种检测方法、装置、计算机设备和存储介质,其中,该方法包括:获取第一目标图像;第一目标图像包括待测对象;利用训练好的目标神经网络,提取第一目标图像的目标图像特征;基于目标图像特征和目标类别对应的特征分布信息,确定待测对象与目标类别之间的匹配程度;基于匹配程度,确定待测对象是否为目标类别的对象。本公开实施例将利用训练好的目标神经网络提取的目标图像特征,与特征分布信息进行比对,能够准确地计算出目标图像特征服从目标类别的对象对应的特征分布的概率,基于此概率,能够较为准确地确定待测对象与目标类别之间的匹配程度,进而能够较为准确地确定出待测对象是否为目标类别的对象,有效提高了检测精度。
Description
技术领域
本公开涉及神经网络技术领域,具体而言,涉及一种检测方法、装置、计算机设备和存储介质。
背景技术
矿井中用于传输煤矿的方式一般为皮带传输,由于自然因素或者人为因素的影响,会导致传送带上偶尔存在非煤矿的异物,比如铁杆和矿泉水瓶等,这些传送带上的异物会降低煤矿传输的效率,损害加工仪器,甚至会导致皮带被撕裂,威胁到矿井人员安全等,因此,如何准确的检测出皮带上的非煤矿的异物,是本领域技术人员亟待解决的问题。
发明内容
本公开实施例至少提供一种检测方法、装置、计算机设备和存储介质。
第一方面,本公开实施例提供了一种检测方法,包括:
获取第一目标图像;所述第一目标图像包括待测对象;
利用训练好的目标神经网络,提取所述第一目标图像的目标图像特征;
基于所述目标图像特征和目标类别对应的特征分布信息,确定所述待测对象与所述目标类别之间的匹配程度;
基于所述匹配程度,确定所述待测对象是否为所述目标类别的对象。
这里,目标类别对应的特征分布信息可以是经过训练好的神经网络对包括目标类别的对象的图像提取得到的,例如,可以是上述训练好的目标神经网络提取得到的,其能够准确地反映目标类别的对象对应的图像特征的分布状况。将利用训练好的目标神经网络提取第一目标图像的目标图像特征,与上述特征分布信息进行比对,能够准确地计算出目标图像特征服从目标类别的对象对应的特征分布的概率,基于此概率,能够较为准确地确定待测对象与目标类别之间的匹配程度,进而能够较为准确地确定出待测对象是否为目标类别的对象,有效提高了检测精度。
一种可选的实施方式中,所述特征分布信息包括预设概率分布;
所述基于所述目标图像特征和目标类别对应的特征分布信息,确定所述待测对象与所述目标类别之间的匹配程度,包括:
确定所述目标图像特征与所述预设概率分布的匹配程度,并将确定的匹配程度作为所述待测对象与所述目标类别之间的匹配程度。
该实施方式中,由于预设概率分布能够准确地反映目标类别的对象的图像特征的分布,因此,通过计算目标图像特征服从预设概率分布的分布概率,能够较为准确地确定目标图像特征与预设概率分布的匹配程度,进而能够较为准确地确定该目标图像特征对应的待测对象与目标类别之间的匹配程度。
一种可选的实施方式中,所述基于所述目标图像特征和目标类别对应的特征分布信息,确定所述待测对象与所述目标类别之间的匹配程度,包括:
基于所述目标图像特征,生成第二目标图像;所述第二目标图像与所述第一目标图像的规格相同;
确定所述第一目标图像与所述第二目标图像之间的图像相似度;
基于所述目标图像特征、所述目标类别对应的特征分布信息和所述图像相似度,确定所述待测对象与所述目标类别之间的匹配程度。
该实施方式中,第二目标图像是在第一目标图像中提取的目标图像特征基础上生成的,可以认为是第一目标图像对应的还原图像,进行图像还原所用的神经网络可以是利用包括目标类别的对象的样本图像训练得到的,该神经网络对目标类别的对象所对应的图像的还原精度较高,其他类别的对象所对应的图像的还原精度较低,因此,上述还原图像与第一目标图像之间的图像相似度能够表征提取的目标图像特征与目标类别对应的特征分布信息的匹配程度,在此基础之上,再结合目标图像特征、目标类别对应的特征分布信息,能够有效提高确定的上述匹配程度的准确性。
一种可选的实施方式中,所述基于所述目标图像特征、所述目标类别对应的特征分布信息和所述图像相似度,确定所述待测对象与所述目标类别之间的匹配程度,包括:
基于所述目标图像特征与预设概率分布的匹配程度,确定第一匹配子程度;
基于所述图像相似度,确定第二匹配子程度;
基于所述第一匹配子程度和所述第二匹配子程度,确定所述待测对象与所述目标类别之间的匹配程度。
该实施方式,由于图像相似度能够表征提取的目标图像特征与目标类别对应的特征分布信息的匹配程度,在此基础之上,再结合目标图像特征、目标类别对应的特征分布信息,能够有效提高确定的上述匹配程度的准确性。
一种可选的实施方式中,其特征在于,所述基于所述匹配程度,确定所述待测对象是否为所述目标类别的对象,包括:
在所述匹配程度大于或等于预设阈值的情况下,确定所述待测对象为所述目标类别的对象。
该实施方式中,匹配程度能够表征待测对象为目标类别的对象的概率,预设阈值为基于经验值确定的最优阈值,因此,利用预设阈值与匹配程度之间的大小关系,能够准确的判断出待测对象是否为目标类别的对象,即,如果匹配程度大于或等于预设阈值,则可以认为待测对象为目标类别的对象;否则,可以认为待测对象不为目标类别的对象。
一种可选的实施方式中,在所述确定所述待测对象与所述目标类别之间的匹配程度之前,还包括:
获取多张第一样本图像;所述第一样本图像包括所述目标类别的对象;
针对所述多张第一样本图像中的每张,利用训练好的目标神经网络提取所述第一样本图像的样本图像特征,并基于所述样本图像特征,确定所述第一样本图像对应的预设分布参数;
基于得到的所述多张第一样本图像中每张第一样本图像对应的预设分布参数,确定所述特征分布信息。
该实施方式,由于提取样本图像特征和目标图像特征的神经网络为同一神经网络,即目标神经网络,因此,目标图像特征和样本图像特征不会由于特征提取网络的不同造成匹配误差,进而影响后续确定的匹配程度的准确性,即利用同一个目标神经网络来确定上述特征分布信息和与特征分布信息进行匹配的目标图像特征,有利于提高确定上述匹配程度的准确性。
一种可选的实施方式中,所述预设分布参数包括多个分布子参数;
所述基于得到的所述多张第一样本图像中每张第一样本图像对应的预设分布参数,确定所述特征分布信息,包括:
基于得到的所述多张第一样本图像中每张第一样本图像对应的多个分布子参数,确定所述目标类别的目标优化值;
基于所述目标优化值,确定所述特征分布信息。
该实施方式,由于目标优化值是能够反映出多张第一样本图像对应的分布子参数的分布特征,因此,通过目标优化值能够较为准确地确定上述特征分布信息。
一种可选的实施方式中,在所述利用训练好的目标神经网络,提取所述第一目标图像的目标图像特征之前,还包括:
基于当前次迭代对应的多张第二样本图像,确定当前次迭代对应的特征分布信息;
基于当前次迭代对应的特征分布信息,确定采样图像特征;
基于所述采样图像特征,生成多张第三样本图像,以在下一次迭代中对所述目标神经网络进行训练。
该实施方式,利用多张第二样本图像生成用于下一次迭代所用的第三样本图像的方式能够减少需要获取的训练样本的数量,有利于提高训练效率和训练精度,另外,由于目标神经网络对于采样自同一分布的特征有更好的重建能力,因此,利用采样来自同一分布的特征重建的第三样本图像,来训练目标神经网络,能够得到拥有较强鲁棒性的目标神经网络。
一种可选的实施方式中,所述获取第一目标图像,包括:
获取对煤矿传送带上传送的所述待测对象进行拍摄得到的原始图像;
识别所述原始图像中的所述待测对象,并确定每个所述待测对象的目标检测框;
基于所述目标检测框,从所述原始图像中提取包括所述待测对象的所述第一目标图像。
该实施方式,应用于煤矿传送场景,具体在煤矿传送环境下拍摄煤矿传送带上的对象,即待测对象。利用目标检测框,从原始图像中提取出包括待测对象的子图像,能够降低后续针对图像进行处理的计算量,即只需要处理子图像(第一目标图像)即可,进而提高检测效率。
一种可选的实施方式中,所述识别所述原始图像中的所述待测对象,包括:
对所述原始图像进行特征点提取,得到所述原始图像包含的多个特征点;
将所述多个特征点与预先存储的所述待测对象包含的多个特征点分别进行比对,确定所述原始图像中包含的所述待测对象。
该实施方式中,通过对比特征点的方式,能够从原始图像中找到较为准确的待测对象。
一种可选的实施方式中,所述待测对象包含的多个特征点包括所述待测对象的至少一个预设部位的特征点。
该实施方式中,通过预设部位的特征点识别待检测对象,不仅能够保证识别精度,还能够减少需要处理的特征点的数量,提高识别效率。
第二方面,本公开实施例还提供一种检测装置,包括:
图像获取模块,用于获取第一目标图像;所述第一目标图像包括待测对象;
特征提取模块,用于利用训练好的目标神经网络,提取所述第一目标图像的目标图像特征;
特征匹配模块,用于基于所述目标图像特征和目标类别对应的特征分布信息,确定所述待测对象与所述目标类别之间的匹配程度;
对象检测模块,用于基于所述匹配程度,确定所述待测对象是否为所述目标类别的对象。
一种可选的实施方式中,所述特征分布信息包括预设概率分布;
所述特征匹配模块,用于确定所述目标图像特征与所述预设概率分布的匹配程度,并将确定的匹配程度作为所述待测对象与所述目标类别之间的匹配程度。
一种可选的实施方式中,所述特征匹配模块,用于基于所述目标图像特征,生成第二目标图像;所述第二目标图像与所述第一目标图像的规格相同;确定所述第一目标图像与所述第二目标图像之间的图像相似度;基于所述目标图像特征、所述目标类别对应的特征分布信息和所述图像相似度,确定所述待测对象与所述目标类别之间的匹配程度。
一种可选的实施方式中,所述特征匹配模块,用于基于所述目标图像特征与预设概率分布的匹配程度,确定第一匹配子程度;基于所述图像相似度,确定第二匹配子程度;基于所述第一匹配子程度和所述第二匹配子程度,确定所述待测对象与所述目标类别之间的匹配程度。
一种可选的实施方式中,所述对象检测模块,用于在所述匹配程度大于或等于预设阈值的情况下,确定所述待测对象为所述目标类别的对象。
一种可选的实施方式中,所述装置还包括信息确定模块,用于在所述确定所述待测对象与所述目标类别之间的匹配程度之前,获取多张第一样本图像;所述第一样本图像包括所述目标类别的对象;针对所述多张第一样本图像中的每张,利用训练好的目标神经网络提取所述第一样本图像的样本图像特征,并基于所述样本图像特征,确定所述第一样本图像对应的预设分布参数;基于得到的所述多张第一样本图像中每张第一样本图像对应的预设分布参数,确定所述特征分布信息。
一种可选的实施方式中,所述预设分布参数包括多个分布子参数;
所述信息确定模块,用于基于得到的所述多张第一样本图像中每张第一样本图像对应的多个分布子参数,确定所述目标类别的目标优化值;基于所述目标优化值,确定所述特征分布信息。
一种可选的实施方式中,所述装置还包括模型训练模块,用于在所述利用训练好的目标神经网络,提取所述第一目标图像的目标图像特征之前,基于当前次迭代对应的多张第二样本图像,确定当前次迭代对应的特征分布信息;基于当前次迭代对应的特征分布信息,确定采样图像特征;基于所述采样图像特征,生成多张第三样本图像,以在下一次迭代中对所述目标神经网络进行训练。
一种可选的实施方式中,所述图像获取模块,用于获取对煤矿传送带上传送的所述待测对象进行拍摄得到的原始图像;识别所述原始图像中的所述待测对象,并确定每个所述待测对象的目标检测框;基于所述目标检测框,从所述原始图像中提取包括所述待测对象的所述第一目标图像。
一种可选的实施方式中,所述图像获取模块,用于对所述原始图像进行特征点提取,得到所述原始图像包含的多个特征点;将所述多个特征点与预先存储的所述待测对象包含的多个特征点分别进行比对,确定所述原始图像中包含的所述待测对象。
一种可选的实施方式中,所述待测对象包含的多个特征点包括所述待测对象的至少一个预设部位的特征点。
第三方面,本公开实施例还提供一种计算机设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当计算机设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行上述第一方面,或第一方面中任一种可能的检测方法的步骤。
第四方面,本公开实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述第一方面,或第一方面中任一种可能的检测方法的步骤。
关于上述检测装置、计算机设备和存储介质的效果描述参见上述检测方法的说明,这里不再赘述。
为使本公开的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本公开实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,此处的附图被并入说明书中并构成本说明书中的一部分,这些附图示出了符合本公开的实施例,并与说明书一起用于说明本公开的技术方案。应当理解,以下附图仅示出了本公开的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本公开实施例所提供的一种检测方法的流程图;
图2示出了本公开实施例所提供的结合目标图像特征、特征分布信息以及图像相似度,确定待测对象与目标类别之间的匹配程度的流程图;
图3示出了本公开实施例所提供的自编码器对特征进行编码并解码的结构示意图;
图4示出了本公开实施例所提供的原始图像中待测对象的目标检测框的展示示意图;
图5示出了本公开实施例所提供的训练深度神经网络之前的ROC曲线的评测结果示意图;
图6示出了本公开实施例所提供的一种检测装置的示意图;
图7示出了本公开实施例所提供的一种计算机设备的结构示意图。
具体实施方式
为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本公开实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本公开的实施例的详细描述并非旨在限制要求保护的本公开的范围,而是仅仅表示本公开的选定实施例。基于本公开的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本公开保护的范围。
另外,本公开实施例中的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。
在本文中提及的“多个或者若干个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
经研究发现,矿井中用于传输煤矿的方式一般为皮带传输,由于自然因素或者人为因素的影响,会导致传送带上偶尔存在非煤矿的异物,比如铁杆和矿泉水瓶等,这些传送带上的异物会降低煤矿传输的效率,损害加工仪器,甚至会导致皮带被撕裂,威胁到矿井人员安全等。因此,如何快速、准确、低成本地检测出传送带上的异物是非常困难的。比如,1、在不依赖于计算机视觉的解决方案下,通长需要额外配置昂贵的传感器,增加了部署成本;另外,在传送带上的配置过程也较为复杂。2、在利用计算机视觉的解决方案中,尽管部署成本有所降低,但是基于计算机视觉中的规则算法往往无法分辨与矿石相似的物体,导致误报率和漏报率增加。
基于上述研究,本公开提供了一种检测方法、装置、计算机设备和存储介质,通过获取第一目标图像;第一目标图像包括待测对象;利用训练好的目标神经网络,提取第一目标图像的目标图像特征;基于目标图像特征和目标类别对应的特征分布信息,确定待测对象与目标类别之间的匹配程度;基于匹配程度,确定待测对象是否为目标类别的对象。这里,目标类别对应的特征分布信息可以是经过训练好的神经网络对包括目标类别的对象的图像提取得到的,例如,可以是上述训练好的目标神经网络提取得到的,其能够准确地反映目标类别的对象对应的图像特征的分布状况。将利用训练好的目标神经网络提取第一目标图像的目标图像特征,与上述特征分布信息进行比对,能够准确地计算出目标图像特征服从目标类别的对象对应的特征分布的概率,基于此概率,能够较为准确地确定待测对象与目标类别之间的匹配程度,进而能够较为准确地确定出待测对象是否为目标类别的对象,有效提高了检测精度。
针对以上方案所存在的缺陷,均是发明人在经过实践并仔细研究后得出的结果,因此,上述问题的发现过程以及下文中本公开针对上述问题所提出的解决方案,都应该是发明人在本公开过程中对本公开做出的贡献。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
下面对本公开实施例中涉及的名词做进一步的解释:
1、YOLO(You Only Look Once),是一个用于目标检测的网络。目标检测任务包括确定图像中存在某些对象的位置,以及对这些对象进行分类。
2、自编码器(autoencoder,AE)是一类在半监督学习和非监督学习中使用的人工神经网络(Artificial Neural Networks,ANNs),其功能是通过将输入信息作为学习目标,对输入信息进行表征学习。自编码器包含编码器(encoder)和解码器(decoder)两部分。自编码器具有一般意义上的表征学习算法的功能,被应用于降维和异常值检测。包含卷积层构筑的自编码器可被用于计算机视觉问题。
3、vMF分布:von Mises–Fisher分布,弗-密斯尔-费舍分布,是定义单位球面上的特征向量的概率密度分布。
4、ROC曲线:receiver operating characteristic curve,接收者操作特征曲线。是指在特定刺激条件下,以被试在不同判断标准下所得的虚报概率为横坐标,以击中概率为纵坐标,画得的各点的连线。
为便于对本实施例进行理解,首先对本公开实施例所公开的一种检测方法进行详细介绍,本公开实施例所提供的检测方法的执行主体一般为具有一定计算能力的计算机设备。在一些可能的实现方式中,该检测方法可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。
下面以执行主体为计算机设备为例对本公开实施例提供的检测方法加以说明。
为便于对本实施例进行理解,下面对本公开实施例所公开的一种检测方法的应用场景进行介绍。本公开实施例可以应用于矿井中煤矿运输的场景,比如,应用于皮带运输煤矿,检测皮带上非煤矿异物的检测方法,首先,可以利用深度神经网络,比如YOLOv5,对皮带上的物体进行检测,并将检测到的物体图像从原始图像中截取出来;之后,还可以利用自编码器对检测出的物体进行进一步筛查。一种可能的实施方式,如果需要工作人员直观判断物体情况,则可以将从原始图像中截取出来的物体图像输入到自编码器中,自编码器将输入的物体图像进行编码,将图像特征映射到隐层空间,然后利用解码器对隐层空间的图像特征进行解码(重建过程),获得输入的重建图像,之后,对比重建图像与输入图像,确定两者之间的相似度,进而判断当前物体是否为异常物体。即,相似度越高,当前物体为煤矿的概率越大;相似度越低,当前物体为异常物体的概率越大。这里,异常物体为非煤矿物体。
参见图1所示,为本公开实施例提供的一种检测方法的流程图,所述方法包括步骤S101~S104,其中:
S101:获取第一目标图像;第一目标图像包括待测对象。
本步骤中,第一目标图像可以为从原始图像中截取的,包含待测对象的图像;或者,可以为通过拍摄设备直接拍摄到的仅包含待测对象的图像。这里,原始图像可以为通过拍摄设备拍摄到的包含待测对象和待测对象所处环境的图像。
这里,待测对象包括目标类别的对象。示例性的,目标类别可以为矿石类,具体包括非金属矿石(比如,煤矿等)和金属矿石(比如,铁矿等)。
示例性的,原始图像包括摄像头拍摄到的场景图像,其中,场景图像中不仅限于目标类别的对象,还包括背景图像或其他类别的对象,比如,针对检测煤矿的场景,背景图像可以包括皮带、工业设备等,其他类别的对象可以为皮带上的铁杆、铁块、塑料、玻璃等。另外,待测对象可以包括煤矿、铁杆、铁块、塑料、玻璃等中的一项或多项。
延续上例,第一目标图像可以包括从场景图像中截取到的,矿石图像、铁杆图像、铁块图像、塑料图像、玻璃图像等包括相应对象的图像。
S102:利用训练好的目标神经网络,提取第一目标图像的目标图像特征。
本步骤中,提取到的第一目标图像的目标图像特征包括待测对象的对象特征。
在一些实施例中,训练目标神经网络可以包括,获取待训练图像,以该待训练图像作为标签来监督该目标神经网络,该待训练图像包括目标类别的对象;将该待训练图像输入到目标神经网络中,训练该目标神经网络,使目标神经网络输出图像,实现重建待训练图像的功能。其输出图像与待训练图像相似度越高,其目标神经网络重建能力越好,在输出图像与待训练图像相似度超过或等于预设相似度后,确定目标神经网络训练完成。这里,预设相似度可以根据经验值获取,本公开实施例不进行限定。
示例性的,以目标神经网络为自编码器为例,提取第一目标图像的目标图像特征,其中,自编码器分为两部分,编码器和解码器,其中编码器部分使用3×3的卷积核对第一目标图像的特征进行卷积,设置有三个卷积层,各卷积层的卷积核个数分别为64、128、256,其中,第一层卷积层对第一目标图像的特征进行卷积,比如,针对256×256×3的第一目标图像,64个卷积核中的每一个卷积核不同,卷积过程中的滑动步长相同,在滑动步长为1的情况下,能够得到256×256×64的图像,确定该图像的第一特征,同理,针对第二层卷积层对256×256×64的图像的第一特征进行卷积,128个卷积核中的每一个卷积核不同,卷积过程中的滑动步长相同,比如,在滑动步长为4的情况下,能够得到64×64×128的图像,确定该图像的第二特征,同理,针对第三层卷积层对64×64×128的图像的第二特征进行卷积,256个卷积核中的每一个卷积核不同,卷积过程中的滑动步长相同,比如,在滑动步长为16的情况下,能够得到4×4×256的图像,确定该图像的第三特征,即目标图像特征。这里,之所以在卷积过程中不断加大滑动步长,是为了能够得到较小尺寸的图像,即4×4×256,利用较小尺寸的图像和大量通道值(4×4×256中的256)能够表示较为准确的第一目标图像的特征图,进而确定较为准确的目标图像特征。
S103:基于目标图像特征和目标类别对应的特征分布信息,确定待测对象与目标类别之间的匹配程度。
本步骤中,目标类别对应的特征分布信息包括目标类别的对象对应的特征分布,即下述的预设概率分布。示例性的,以检测煤矿为例,煤矿对应的特征服从vMF分布,因此,目标类别对应的特征分布信息包括基于大量的煤矿图像特征拟合得到的一个目标vMF分布,即预设概率分布。
在一些实施例中,可以确定目标图像特征与预设概率分布的匹配程度,进而将确定好的匹配程度作为待测对象与目标类别之间的匹配程度。
这里,目标图像特征与预设概率分布的匹配程度可以用于指示目标图像特征服从预设概率分布的一个分布概率。其中,分布概率越高,匹配程度越高。待测对象与目标类别之间的匹配程度可以用于指示待测对象是否属于目标类别的对象,其中,匹配程度越高,证明待测对象属于目标类别的对象的概率越大。
延续上例,可以计算出目标图像特征服从预设概率分布的一个分布概率,如果分布概率低于预设概率的情况下,则确定目标图像特征对应的第一目标图像中的待测对象非煤矿,属于异常物体,进而确定待测对象与目标类别之间的匹配程度为0。如果分布概率高于或等于预设概率的情况下,则确定目标图像特征对应的第一目标图像中的待测对象为煤矿,进而确定待测对象与目标类别之间的匹配程度为1。这里,预设概率可以基于经验值获取,本公开实施例不进行限定。
S104:基于匹配程度,确定待测对象是否为目标类别的对象。
具体实施时,在匹配程度大于或等于预设阈值的情况下,确定待测对象为目标类别的对象。延续上例,以预设阈值为0.7为例,在确定待测对象与目标类别之间的匹配程度为1的情况下,确定该匹配程度大于预设阈值,则确定待测对象为目标类别的对象。
这里,匹配程度,即待测对象与目标类别之间的匹配程度,能够表征待测对象为目标类别的对象的概率,预设阈值为基于经验值确定的最优阈值,因此,利用预设阈值与匹配程度之间的大小关系,能够准确的判断出待测对象是否为目标类别的对象,即,如果匹配程度大于或等于预设阈值,则可以认为待测对象为目标类别的对象;否则,可以认为待测对象不为目标类别的对象。需要说明的是,预设阈值可以通过经验值获取,本公开实施例不进行具体限定。
延续步骤S103,在基于目标图像特征和目标类别对应的特征分布信息的基础上,还可以结合第一目标图像与第二目标图像之间的图像相似度,进一步判断待测对象与目标类别之间的匹配程度。参见图2所示,其为结合目标图像特征、特征分布信息以及图像相似度,确定待测对象与目标类别之间的匹配程度的流程图,包括步骤S201~S203:
S201:基于目标图像特征,生成第二目标图像。
其中,第二目标图像与第一目标图像的规格相同。示例性的,规格可以包括尺寸和分辨率,即第二目标图像与第一目标图像的尺寸相同,分辨率相同;在确定尺寸和分辨率相同的情况下,可以确定第二目标图像与第一目标图像的像素点数量相同。
示例性的,可以利用自编码器中的解码器对目标图像特征进行解码(即重建图像),输出针对第一目标图像的目标图像特征重建后的重建图像,即第二目标图像。
延续上述步骤S102,可以参见图3所示,其为自编码器对特征进行编码并解码的结构示意图。其中,31表示自编码器的输入,即输入第一目标图像,32表示编码器,用于对第一目标图像的进行编码,33表示解码器,用于对目标图像特征进行解码,34表示自编码器的输出,即输出第二目标图像。
示例性的,在解码器部分,使用相同大小以及个数的逆卷积核,对目标图像特征进行解码(重建过程),最终重建出与第一目标图像尺寸和分辨率相同的第二目标图像。
示例性的,由于自编码器是利用煤矿图像进行训练的,因此,对属于煤矿的目标图像特征拥有很好的重建功能,即能够重建得到与第一目标图像相似的第二目标图像。反之,针对非煤矿的异常物体,该自编码器不具有良好的重建功能,即能够重建得到与第一目标图像不相似的第二目标图像。
S202:确定第一目标图像与第二目标图像之间的图像相似度。
示例性的,利用深度学习的方式计算图像相似度,具体实施时,可以利用一神经网络确定图像相似度,将第一目标图像与第二目标图像作为一图像对,以该图像对为单位,标签为相似度,将图像对输入神经网络模型中,最终,神经网络模型能够回归出输入图像对的相似度,即图像相似度。
基于上述S201,由于自编码器针对目标类别的对象具有很好的重建功能,因此,还可以利用图像相似度来进一步判断待测对象与目标类别之间的匹配程度。
S203:基于目标图像特征、目标类别对应的特征分布信息和图像相似度,确定待测对象与目标类别之间的匹配程度。
上述步骤S201~203中,第二目标图像是在第一目标图像中提取的目标图像特征基础上生成的,可以认为是第一目标图像对应的还原图像,进行图像还原所用的神经网络可以是利用包括目标类别的对象的样本图像训练得到的,该神经网络对目标类别的对象所对应的图像的还原精度较高,其他类别的对象所对应的图像的还原精度较低,因此,上述还原图像与第一目标图像之间的图像相似度能够表征提取的目标图像特征与目标类别对应的特征分布信息的匹配程度,在此基础之上,再结合目标图像特征、目标类别对应的特征分布信息,能够有效提高确定的上述匹配程度的准确性。
这里,每一条件因素,即目标图像特征与预设概率分布的匹配程度和图像相似度,对待测对象与目标类别之间的匹配程度的影响力不同,因此,还需要预先设置每一条件的权重值,该权重值可以根据开发人员的经验值确定,本公开实施例不进行具体限定。
示例性的,预先设置目标图像特征与预设概率分布的匹配程度的第一权重为P1,预先设置图像相似度的第二权重为即P2,在已知目标图像特征与预设概率分布的匹配程度为X和图像相似度为Y的情况下,可以按照以下步骤确定待测对象与目标类别之间的匹配程度:
S2031:基于目标图像特征与预设概率分布的匹配程度,确定第一匹配子程度。
延续上例,第一匹配程度可以为P1X。
S2032:基于图像相似度,确定第二匹配子程度。
延续上例,第二匹配程度可以为P2Y。
S2033:基于第一匹配子程度和第二匹配子程度,确定待测对象与目标类别之间的匹配程度。
延续上例,待测对象与目标类别之间的匹配程度可以为P1X+P2Y。之后,确定计算出的P1X+P2Y是否大于或等于预设阈值,如果大于或等于,则确定待测对象为目标类别的对象。
另外,还可以在确定匹配程度的运算过程中,进行归一化处理,则将图像相似度Y的第二权重设置为1,第一权重设置为P1/P2。
这里,由于图像相似度能够表征提取的目标图像特征与目标类别对应的特征分布信息的匹配程度,在此基础之上,再结合目标图像特征、目标类别对应的特征分布信息,能够有效提高确定的上述匹配程度的准确性。
或者,还可以利用图像相似度,进一步校验基于目标图像特征和目标类别对应的特征分布信息所确定的待测对象与目标类别之间的匹配程度。具体实施时,在第一匹配子程度大于或等于预设阈值的情况下,可以初步确定待测对象为目标类别的对象。之后,可以利用图像相似度进行校验处理,在图像相似度大于或等于预设阈值的情况下,可以最终确定待测对象为目标类别的对象;否则,如果在图像相似度小于预设阈值的情况下,可以基于上述S2031~S2033,确定最终的待测对象与目标类别之间的匹配程度,再进一步判断该匹配程度与预设阈值的大小关系,如果该匹配程度大于或等于预设阈值,则确定待测对象为目标类别的对象;否则,确定待测对象不为目标类别的对象。这里,利用图像相似度进一步校验基于目标图像特征和目标类别对应的特征分布信息,确定出的待测对象与目标类别之间的匹配程度,能够降低误报率。
针对步骤S103,其中,确定特征分布信息的步骤包括:
S1031:获取多张第一样本图像;第一样本图像包括目标类别的对象。
本步骤中,第一样本图像可以为从带有目标类别的对象的原始样本图像中截取的、只包含目标类别的对象的图像。或者,可以为通过拍摄设备直接拍摄到的仅包含目标类别的对象的图像。
由于第一样本图像中仅有目标类别的对象,因此,可以利用多张第一样本图像中的样本图像特征,拟合出样本图像特征服从的一个预设概率分布,即目标类别的对象的特征所服从的预设概率分布,进而得到特征分布信息。
S1032:针对多种第一样本图像中的每张,利用训练好的目标神经网络提取第一样本图像的样本图像特征,并基于样本图像特征,确定第一样本图像对应的预设分布参数。
本步骤中,提取样本图像特征的过程可以参照上述步骤S102中提取目标图像特征的过程,由于两种提取特征的方式相同,因此重复之处在此不再赘述。
这里,预设分布参数包括多个分布子参数。示例性的,煤矿的图像特征服从vMF分布。预设分布参数中的多个分布子参数分别包括平均方向和离散程度。确定预设分布参数的过程包括:将提取到的样本图像特征,经过目标神经网络的全连接层,能够得到该第一样本图像对应的预设分布参数,即vMF分布中的平均方向和离散程度。需要知道的是,一组平均方向和离散程度,就能够确定一个vMF分布。之后,基于多张第一样本图像,能够得到多组平均方向和离散程度,能够确定多个vMF分布。
S1033:基于每张第一样本图像对应的预设分布参数,确定特征分布信息。
具体实施时,基于得到的多张第一样本图像中每张第一样本图像对应的多个分布子参数,确定目标类别的目标优化值;基于目标优化值,确定特征分布信息。
这里,一张第一样本图像对应的预设分布参数能够确定一组分布子参数(包括多个分布子参数),因此,利用多张第一样本图像中每张第一样本图像对应的预设分布参数,能够确定每张第一样本图像对应的每组分布子参数,即确定多组分布子参数。利用多组分布子参数,能够确定目标类别的目标优化值。示例性的,一组分布子参数包括平均方向和离散程度,多组分布子参数包括多个平均方向和多个离散程度。目标优化值包括平均方向的优化值和离散程度的优化值;具体的,可以利用多个平均方向,确定平均方向的优化值,即为平均方向的目标优化值;利用多个离散程度,确定离散程度的优化值,即为离散程度的目标优化值。
这里,由于目标优化值是能够反映出多张第一样本图像对应的分布子参数的分布特征,因此,通过目标优化值能够较为准确地确定上述特征分布信息。
对多组分布子参数进行优化处理,确定优化后的目标优化值,在一些实施例中,可以基于确定出的多组分布子参数中的多个平均方向,确定平均方向均值,即平均方向的目标优化值;基于确定出的多组分布子参数中的多个离散程度,确定离散程度均值,即离散程度的目标优化值。之后,可以利用平均方向的目标优化值和离散程度的目标优化值,确定一个预设概率分布,进而确定特征分布信息。
在另一些实施例中,在不断确定vMF分布的过程中,可以利用前一个平均方向和离散程度,优化后一个平均方向和离散程度,进而达到不断优化vMF分布的效果。比如,针对第一样本图像A,确定平均方向A1和离散程度A2;之后,针对第一样本图像B,确定平均方向B1和离散程度B2,优化处理,得到平均方向均值和离散程度均值/>之后,针对第一样本图像C,确定平均方向C1和离散程度C2,优化处理,得到平均方向均值/>和离散程度均值/>以此类推,在遍历完多张第一样本图像后,能够得到最终的平均方向均值(平均方向的目标优化值)和离散程度均值(离散程度的目标优化值)。之后,可以利用该平均方向的目标优化值和该离散程度的目标优化值,确定一个预设概率分布,进而确定特征分布信息。
上述步骤S1031~S1033,由于提取样本图像特征和目标图像特征的神经网络为同一神经网络,即目标神经网络,因此,目标图像特征和样本图像特征不会由于特征提取网络的不同造成匹配误差,进而影响后续确定的匹配程度的准确性,即利用同一个目标神经网络来确定上述特征分布信息和与特征分布信息进行匹配的目标图像特征,有利于提高确定上述匹配程度的准确性。
在一个可能的实施方式中,由于目标神经网络对于采样自同一分布的特征有更好的重建能力,因此,利用采样来自同一分布的特征重建的样本图像,来训练目标神经网络,能够得到拥有较强鲁棒性的目标神经网络。
训练目标神经网络的步骤,具体的,可以基于当前次迭代对应的多张第二样本图像,确定当前次迭代对应的特征分布信息。之后,基于当前次迭代对应的特征分布信息,确定采样图像特征。基于采样图像特征,生成多张第三样本图像,以在下一次迭代中对目标神经网络进行训练,在达到训练截止条件的情况下,得到训练完成的目标神经网络。
这里,第二样本图像中包括目标类别的对象,第二样本图像可以为从上一次迭代后得到的特征分布信息中随机采取的图像特征重建后的样本图像。或者,还可以为从拍摄设备拍摄到的原始图像中截取的、包含目标类别的对象的图像。
这里,训练目标神经网络的第三样本图像,可以通过重建采样图像特征得到,这里的采样图像特征可以为从特征分布信息中的预设概率分布内随机采取的特征。
需要说明的是,由于预设概率分布是通过目标类别的对象的特征拟合得到的分布,因此,利用从预设概率分布中采样得到的采样图像特征所重建得到的图像为目标类别的对象的图像,即第三样本图像。
针对S101,得到第一目标图像的具体实施方式为,首先,可以获取对煤矿传送带上传送的待测对象进行拍摄得到的原始图像;该原始图像可以为包含待测对象和待测对象所处环境的图像。之后,通过识别原始图像中的待测对象,确定出每个待测对象的目标检测框。之后,可以基于目标检测框,从原始图像中提取包括待测对象的第一目标图像。示例性的,可以参见图4所示,其为原始图像中待测对象的目标检测框的展示示意图。其中,41表示目标检测框,该目标检测框能够将待测对象框起来,在原始图像中所框出的部分图像即为第一目标图像。
上述,识别待测对象的过程,具体的,首先,可以对原始图像进行特征点提取,得到原始图像包含的多个特征点;之后,将多个特征点与预先存储的待测对象包含的多个特征点分别进行比对,确定原始图像中包含的待测对象。
示例性的,针对从原始图像中提取到的多个特征点中的每个特征点,可以逐个特征点与预先存储的待测对象包含的多个特征点进行比对,将比对结果满足预设条件的特征点作为待测对象的特征点,将在预设范围内满足预设数量个比对成功的特征点所组成的对象作为待测对象。
示例性的,针对从原始图像中提取到的多个特征点中的部分特征点,可以以部分特征点融合得到的特征与待测对象包含的多个特征点融合得到的特征进行比对,比对成功,则可以确定该部分特征点对应的对象为待测对象。
这里,预设范围和预设数量可以根据传送带上能够传送的待测对象的体积,以及经验值进行设定,本公开实施例不进行具体限定。
这里,预先存储的待测对象包含的多个特征点可以包括目标神经网络检测仅包含待测对象的图像,得到的图像特征点。或者,还可以包括待测对象的至少一个预设部位的特征点。其中,预设部位可以包括检测到的第一目标图像中待测对象曲率大于预设曲率的部位,或者,图像清晰度大于预设清晰度的部位;或者,图像光照强度大于预设光照强度的部位等。需要说明的是,预设曲率、预设清晰度、以及预设光照强度可以根据经验值设定,本公开实施例不进行具体限定。
在一些实施例中,可以利用预先训练完成的深度神经网络识别待测对象,可以利用深度神经网络检测待测对象的性能来判断深度神经网络是否训练完成,具体的,针对包括待测对象的原始图像,确定在不同对象识别概率下的待测对象的识别结果;基于在不同对象识别概率下的待测对象的识别结果,确定深度神经网络检测待测对象的性能。性能越好,表征深度神经网络训练的越好。
这里,对象识别概率为预先设置的用于指示在原始图像中识别到目标类别的对象的概率。识别结果包括原始图像中目标类别的对象的数量和识别出的目标类别的对象的准确率。在识别结果中,目标类别的对象的数量与识别出的目标类别的对象的准确率成反比,具体的,对象识别概率越大,目标类别的对象的数量越少,识别出的目标类别的对象的准确率越高;反之,对象识别概率越小,目标类别的对象的数量越多,识别出的目标类别的对象的准确率越低。
示例性的,可以基于ROC曲线的评测结果,确定满足预设条件的目标对象识别概率。其中,可以参见图5所示,其为训练深度神经网络之前的ROC曲线的评测结果示意图。其中,横坐标51表示归一化后的目标类别的对象的数量,纵坐标52表示归一化后的识别出的目标类别的对象的准确率,如图所示,预设条件可以为随机选取横坐标和纵坐标分别达到0.8以上的坐标点,进而确定该坐标点所对应的目标对象识别概率。53表示横坐标和纵坐标分别达到0.8以上的坐标点的集合。
需要知道的是,每一对象识别概率对应一组目标类别的对象的数量和识别出的目标类别的对象的准确率。这里,利用不同对象识别概率下的待测对象的识别结果能够表征完整的深度神经网络检测待测对象的性能,具体的,可以利用曲线积分得到的面积来确定深度神经网络检测待测对象的性能,面积越大,性能越好。
示例性的,在深度神经网络识别待测对象的过程中,如果深度神经网络识别原始图像中某一待测对象的对象识别概率大于或等于目标对象识别概率,则确定识别到待测对象,进而确定目标检测框。其中,目标对象识别概率可以取53内的某一坐标点对应的对象识别概率。
通过上述步骤S101~S104,目标类别对应的特征分布信息可以是经过训练好的神经网络对包括目标类别的对象的图像提取得到的,例如,可以是上述训练好的目标神经网络提取得到的,其能够准确地反映目标类别的对象对应的图像特征的分布状况。将利用训练好的目标神经网络提取第一目标图像的目标图像特征,与上述特征分布信息进行比对,能够准确地计算出目标图像特征服从目标类别的对象对应的特征分布的概率,基于此概率,能够较为准确地确定待测对象与目标类别之间的匹配程度,进而能够较为准确地确定出待测对象是否为目标类别的对象,有效提高了检测精度。
示例性的,针对煤矿传送场景,通过YOLOv5检测传送带上的煤矿和/或异物(比如铁杆、铁块、塑料、玻璃等),确定第一目标图像;利用自编码器对第一目标图像进行编码,将图像特征映射到隐层空间,确定目标图像特征,即煤矿或异物的图像特征。已知煤矿特征服从vMF分布,因此,可以判断当前确定的目标图像特征是否服从vMF分布,如果服从,则可以确定该目标图像特征对应的对象为煤矿,否则,确定该目标图像特征对应的对象为异物。
延续上例,在确定了目标图像特征的情况下,还可以利用解码器重建图像,由于自编码器是利用煤矿图像进行训练的,因此,对属于煤矿的目标图像特征拥有很好的重建功能。反之,针对非煤矿的异常物体,该自编码器不具有良好的重建功能。因此,可以利用重建图像与自编码器的输入图像进行对比,比如,利用损失函数计算二者误差,若确定误差值大于预估误差的情况下,确定重建失败,即第一目标图像中的待测对象为异物。若确定误差值小于或等于预估误差的情况下,确定重建成功,即第一目标图像中的待测对象为煤矿。预估误差可以根据经验值设定,本公开实施例不进行具体限定。
本领域技术人员可以理解,在具体实施方式的上述方法中,各步骤的撰写顺序并不意味着严格的执行顺序而对实施过程构成任何限定,各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。
基于同一发明构思,本公开实施例中还提供了与检测方法对应的检测装置,由于本公开实施例中的装置解决问题的原理与本公开实施例上述检测方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。
参照图6所示,为本公开实施例提供的一种检测装置的示意图,所述装置包括:图像获取模块601、特征提取模块602、特征匹配模块603和对象检测模块604;其中,
图像获取模块601,用于获取第一目标图像;所述第一目标图像包括待测对象;
特征提取模块602,用于利用训练好的目标神经网络,提取所述第一目标图像的目标图像特征;
特征匹配模块603,用于基于所述目标图像特征和目标类别对应的特征分布信息,确定所述待测对象与所述目标类别之间的匹配程度;
对象检测模块604,用于基于所述匹配程度,确定所述待测对象是否为所述目标类别的对象。
一种可选的实施方式中,所述特征分布信息包括预设概率分布;
所述特征匹配模块603,用于确定所述目标图像特征与所述预设概率分布的匹配程度,并将确定的匹配程度作为所述待测对象与所述目标类别之间的匹配程度。
一种可选的实施方式中,所述特征匹配模块603,用于基于所述目标图像特征,生成第二目标图像;所述第二目标图像与所述第一目标图像的规格相同;确定所述第一目标图像与所述第二目标图像之间的图像相似度;基于所述目标图像特征、所述目标类别对应的特征分布信息和所述图像相似度,确定所述待测对象与所述目标类别之间的匹配程度。
一种可选的实施方式中,所述特征匹配模块603,用于基于所述目标图像特征与预设概率分布的匹配程度,确定第一匹配子程度;基于所述图像相似度,确定第二匹配子程度;基于所述第一匹配子程度和所述第二匹配子程度,确定所述待测对象与所述目标类别之间的匹配程度。
一种可选的实施方式中,所述对象检测模块604,用于在所述匹配程度大于或等于预设阈值的情况下,确定所述待测对象为所述目标类别的对象。
一种可选的实施方式中,所述装置还包括信息确定模块605,用于在所述确定所述待测对象与所述目标类别之间的匹配程度之前,获取多张第一样本图像;所述第一样本图像包括所述目标类别的对象;针对所述多张第一样本图像中的每张,利用训练好的目标神经网络提取所述第一样本图像的样本图像特征,并基于所述样本图像特征,确定所述第一样本图像对应的预设分布参数;基于得到的所述多张第一样本图像中每张第一样本图像对应的预设分布参数,确定所述特征分布信息。
一种可选的实施方式中,所述预设分布参数包括多个分布子参数;
所述信息确定模块605,用于基于得到的所述多张第一样本图像中每张第一样本图像对应的多个分布子参数,确定所述目标类别的目标优化值;基于所述目标优化值,确定所述特征分布信息。
一种可选的实施方式中,所述装置还包括模型训练模块606,用于在所述利用训练好的目标神经网络,提取所述第一目标图像的目标图像特征之前,基于当前次迭代对应的多张第二样本图像,确定当前次迭代对应的特征分布信息;基于当前次迭代对应的特征分布信息,确定采样图像特征;基于所述采样图像特征,生成多张第三样本图像,以在下一次迭代中对所述目标神经网络进行训练。
一种可选的实施方式中,所述图像获取模块601,用于获取对煤矿传送带上传送的所述待测对象进行拍摄得到的原始图像;识别所述原始图像中的所述待测对象,并确定每个所述待测对象的目标检测框;基于所述目标检测框,从所述原始图像中提取包括所述待测对象的所述第一目标图像。
一种可选的实施方式中,所述图像获取模块601,用于对所述原始图像进行特征点提取,得到所述原始图像包含的多个特征点;将所述多个特征点与预先存储的所述待测对象包含的多个特征点分别进行比对,确定所述原始图像中包含的所述待测对象。
一种可选的实施方式中,所述待测对象包含的多个特征点包括所述待测对象的至少一个预设部位的特征点。
关于检测装置中的各模块的处理流程、以及各模块之间的交互流程的描述可以参照上述检测方法实施例中的相关说明,这里不再详述。
基于同一技术构思,本申请实施例还提供了一种计算机设备。参照图7所示,为本申请实施例提供的计算机设备的结构示意图,包括:
处理器71、存储器72和总线73。其中,存储器72存储有处理器71可执行的机器可读指令,处理器71用于执行存储器72中存储的机器可读指令,所述机器可读指令被处理器71执行时,处理器71执行下述步骤:S101:获取第一目标图像;第一目标图像包括待测对象;S102:利用训练好的目标神经网络,提取第一目标图像的目标图像特征;S103:基于目标图像特征和目标类别对应的特征分布信息,确定待测对象与目标类别之间的匹配程度;S104:基于匹配程度,确定待测对象是否为目标类别的对象。
上述存储器72包括内存721和外部存储器722;这里的内存721也称内存储器,用于暂时存放处理器71中的运算数据,以及与硬盘等外部存储器722交换的数据,处理器71通过内存721与外部存储器722进行数据交换,当计算机设备运行时,处理器71与存储器72之间通过总线73通信,使得处理器71在执行上述方法实施例中所提及的执行指令。
本公开实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述方法实施例中所述的检测方法的步骤。其中,该存储介质可以是易失性或非易失的计算机可读取存储介质。
本公开实施例还提供一种计算机程序产品,包括计算机指令,所述计算机指令被处理器执行时实现上述的检测方法的步骤。其中,计算机程序产品可以是任何能实现上述检测方法的产品,该计算机程序产品中对现有技术做出贡献的部分或全部方案可以以软件产品(例如软件开发包(Software Development Kit,SDK))的形式体现,该软件产品可以被存储在一个存储介质中,通过包含的计算机指令使得相关设备或处理器执行上述检测方法的部分或全部步骤。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。在本公开所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个模块或组件可以结合,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本公开各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本公开的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本公开各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本公开的具体实施方式,用以说明本公开的技术方案,而非对其限制,本公开的保护范围并不局限于此,尽管参照前述实施例对本公开进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本公开揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本公开实施例技术方案的精神和范围,都应涵盖在本公开的保护范围之内。因此,本公开的保护范围应所述以权利要求的保护范围为准。
Claims (13)
1.一种检测方法,其特征在于,包括:
获取第一目标图像;所述第一目标图像包括待测对象;
利用训练好的目标神经网络,提取所述第一目标图像的目标图像特征;其中,目标神经网络是通过如下步骤训练得到的:基于当前次迭代对应的多张第二样本图像,确定当前次迭代对应的特征分布信息;基于所述当前次迭代对应的特征分布信息,确定采样图像特征;基于所述采样图像特征,生成多张第三样本图像,以在下一次迭代中对目标神经网络进行训练,现在达到训练截止条件的情况下,得到训练完成的目标神经网络;其中,所述第二样本图像是从上一次迭代后得到的所述特征分布信息中随机采取的图像特征重建后的样本图像;所述第三样本图像为通过重建所述采样图像信息得到的;
基于所述目标图像特征和目标类别对应的特征分布信息,确定所述待测对象与所述目标类别之间的匹配程度;
基于所述匹配程度,确定所述待测对象是否为所述目标类别的对象。
2.根据权利要求1所述的方法,其特征在于,所述特征分布信息包括预设概率分布;
所述基于所述目标图像特征和目标类别对应的特征分布信息,确定所述待测对象与所述目标类别之间的匹配程度,包括:
确定所述目标图像特征与所述预设概率分布的匹配程度,并将确定的匹配程度作为所述待测对象与所述目标类别之间的匹配程度。
3.根据权利要求1或2所述的方法,其特征在于,所述基于所述目标图像特征和目标类别对应的特征分布信息,确定所述待测对象与所述目标类别之间的匹配程度,包括:
基于所述目标图像特征,生成第二目标图像;所述第二目标图像与所述第一目标图像的规格相同;
确定所述第一目标图像与所述第二目标图像之间的图像相似度;
基于所述目标图像特征、所述目标类别对应的特征分布信息和所述图像相似度,确定所述待测对象与所述目标类别之间的匹配程度。
4.根据权利要求3所述的方法,其特征在于,所述基于所述目标图像特征、所述目标类别对应的特征分布信息和所述图像相似度,确定所述待测对象与所述目标类别之间的匹配程度,包括:
基于所述目标图像特征与预设概率分布的匹配程度,确定第一匹配子程度;
基于所述图像相似度,确定第二匹配子程度;
基于所述第一匹配子程度和所述第二匹配子程度,确定所述待测对象与所述目标类别之间的匹配程度。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述基于所述匹配程度,确定所述待测对象是否为所述目标类别的对象,包括:
在所述匹配程度大于或等于预设阈值的情况下,确定所述待测对象为所述目标类别的对象。
6.根据权利要求1至5任一项所述的方法,其特征在于,在所述确定所述待测对象与所述目标类别之间的匹配程度之前,还包括:
获取多张第一样本图像;所述第一样本图像包括所述目标类别的对象;
针对所述多张第一样本图像中的每张,利用训练好的目标神经网络提取所述第一样本图像的样本图像特征,并基于所述样本图像特征,确定所述第一样本图像对应的预设分布参数;
基于得到的所述多张第一样本图像中每张第一样本图像对应的预设分布参数,确定所述特征分布信息。
7.根据权利要求6所述的方法,其特征在于,所述预设分布参数包括多个分布子参数;
所述基于得到的所述多张第一样本图像中每张第一样本图像对应的预设分布参数,确定所述特征分布信息,包括:
基于得到的所述多张第一样本图像中每张第一样本图像对应的多个分布子参数,确定所述目标类别的目标优化值;
基于所述目标优化值,确定所述特征分布信息。
8.根据权利要求1至7任一所述的方法,其特征在于,所述获取第一目标图像,包括:
获取对煤矿传送带上传送的所述待测对象进行拍摄得到的原始图像;
识别所述原始图像中的所述待测对象,并确定每个所述待测对象的目标检测框;
基于所述目标检测框,从所述原始图像中提取包括所述待测对象的所述第一目标图像。
9.根据权利要求8所述的方法,其特征在于,所述识别所述原始图像中的所述待测对象,包括:
对所述原始图像进行特征点提取,得到所述原始图像包含的多个特征点;
将所述多个特征点与预先存储的所述待测对象包含的多个特征点分别进行比对,确定所述原始图像中包含的所述待测对象。
10.根据权利要求9所述的方法,其特征在于,所述待测对象包含的多个特征点包括所述待测对象的至少一个预设部位的特征点。
11.一种检测装置,其特征在于,包括:
图像获取模块,用于获取第一目标图像;所述第一目标图像包括待测对象;
特征提取模块,用于利用训练好的目标神经网络,提取所述第一目标图像的目标图像特征;其中,目标神经网络是通过如下步骤训练得到的:基于当前次迭代对应的多张第二样本图像,确定当前次迭代对应的特征分布信息;基于所述当前次迭代对应的特征分布信息,确定采样图像特征;基于所述采样图像特征,生成多张第三样本图像,以在下一次迭代中对目标神经网络进行训练,现在达到训练截止条件的情况下,得到训练完成的目标神经网络;其中,所述第二样本图像是从上一次迭代后得到的所述特征分布信息中随机采取的图像特征重建后的样本图像;所述第三样本图像为通过重建所述采样图像信息得到的;特征匹配模块,用于基于所述目标图像特征和目标类别对应的特征分布信息,确定所述待测对象与所述目标类别之间的匹配程度;
对象检测模块,用于基于所述匹配程度,确定所述待测对象是否为所述目标类别的对象。
12.一种计算机设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当计算机设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如权利要求1至10任一项所述的检测方法的步骤。
13.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1至10任一项所述的检测方法的步骤。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111107793.3A CN113793325B (zh) | 2021-09-22 | 2021-09-22 | 一种检测方法、装置、计算机设备和存储介质 |
PCT/CN2022/092413 WO2023045350A1 (zh) | 2021-09-22 | 2022-05-12 | 检测方法、装置、计算机设备、存储介质和程序产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111107793.3A CN113793325B (zh) | 2021-09-22 | 2021-09-22 | 一种检测方法、装置、计算机设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113793325A CN113793325A (zh) | 2021-12-14 |
CN113793325B true CN113793325B (zh) | 2024-05-24 |
Family
ID=78879059
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111107793.3A Active CN113793325B (zh) | 2021-09-22 | 2021-09-22 | 一种检测方法、装置、计算机设备和存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN113793325B (zh) |
WO (1) | WO2023045350A1 (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113793325B (zh) * | 2021-09-22 | 2024-05-24 | 北京市商汤科技开发有限公司 | 一种检测方法、装置、计算机设备和存储介质 |
CN116991258B (zh) * | 2023-09-26 | 2024-02-09 | 北京杰创永恒科技有限公司 | 一种物品指示方法、***、计算机设备及可读存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109977943A (zh) * | 2019-02-14 | 2019-07-05 | 平安科技(深圳)有限公司 | 一种基于yolo的图像目标识别方法、***和存储介质 |
CN110147699A (zh) * | 2018-04-12 | 2019-08-20 | 北京大学 | 一种图像识别方法、装置以及相关设备 |
CN111259967A (zh) * | 2020-01-17 | 2020-06-09 | 北京市商汤科技开发有限公司 | 图像分类及神经网络训练方法、装置、设备及存储介质 |
CN111291817A (zh) * | 2020-02-17 | 2020-06-16 | 北京迈格威科技有限公司 | 图像识别方法、装置、电子设备和计算机可读介质 |
CN111881855A (zh) * | 2020-07-31 | 2020-11-03 | 上海商汤临港智能科技有限公司 | 图像处理方法、装置、计算机设备及存储介质 |
CN112766162A (zh) * | 2021-01-20 | 2021-05-07 | 北京市商汤科技开发有限公司 | 活体检测方法、装置、电子设备及计算机可读存储介质 |
CN112906685A (zh) * | 2021-03-04 | 2021-06-04 | 重庆赛迪奇智人工智能科技有限公司 | 一种目标检测方法、装置、电子设备及存储介质 |
CN113361550A (zh) * | 2020-03-04 | 2021-09-07 | 阿里巴巴集团控股有限公司 | 目标检测方法、模型训练方法、装置及设备 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102174777B1 (ko) * | 2018-01-23 | 2020-11-06 | 주식회사 날비컴퍼니 | 이미지의 품질 향상을 위하여 이미지를 처리하는 방법 및 장치 |
CN109919251A (zh) * | 2019-03-21 | 2019-06-21 | 腾讯科技(深圳)有限公司 | 一种基于图像的目标检测方法、模型训练的方法及装置 |
CN113793325B (zh) * | 2021-09-22 | 2024-05-24 | 北京市商汤科技开发有限公司 | 一种检测方法、装置、计算机设备和存储介质 |
-
2021
- 2021-09-22 CN CN202111107793.3A patent/CN113793325B/zh active Active
-
2022
- 2022-05-12 WO PCT/CN2022/092413 patent/WO2023045350A1/zh unknown
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110147699A (zh) * | 2018-04-12 | 2019-08-20 | 北京大学 | 一种图像识别方法、装置以及相关设备 |
CN109977943A (zh) * | 2019-02-14 | 2019-07-05 | 平安科技(深圳)有限公司 | 一种基于yolo的图像目标识别方法、***和存储介质 |
CN111259967A (zh) * | 2020-01-17 | 2020-06-09 | 北京市商汤科技开发有限公司 | 图像分类及神经网络训练方法、装置、设备及存储介质 |
CN111291817A (zh) * | 2020-02-17 | 2020-06-16 | 北京迈格威科技有限公司 | 图像识别方法、装置、电子设备和计算机可读介质 |
CN113361550A (zh) * | 2020-03-04 | 2021-09-07 | 阿里巴巴集团控股有限公司 | 目标检测方法、模型训练方法、装置及设备 |
CN111881855A (zh) * | 2020-07-31 | 2020-11-03 | 上海商汤临港智能科技有限公司 | 图像处理方法、装置、计算机设备及存储介质 |
CN112766162A (zh) * | 2021-01-20 | 2021-05-07 | 北京市商汤科技开发有限公司 | 活体检测方法、装置、电子设备及计算机可读存储介质 |
CN112906685A (zh) * | 2021-03-04 | 2021-06-04 | 重庆赛迪奇智人工智能科技有限公司 | 一种目标检测方法、装置、电子设备及存储介质 |
Non-Patent Citations (2)
Title |
---|
A robust space target detection algorithm based on target characteristics;Bin Lin et al;《IA robust space target detection algorithm based on target characteristics》;20210618;第19卷;1-5 * |
多视图视觉检测关键技术及其应用研究;周彬;《中国优秀硕士学位论文全文数据库(电子期刊)》;20191115;第2019卷(第11期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
WO2023045350A1 (zh) | 2023-03-30 |
CN113793325A (zh) | 2021-12-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11087180B2 (en) | Risky transaction identification method and apparatus | |
CN113793325B (zh) | 一种检测方法、装置、计算机设备和存储介质 | |
US10410292B2 (en) | Method, system, apparatus, and storage medium for realizing antifraud in insurance claim based on consistency of multiple images | |
CN109902018B (zh) | 一种智能驾驶***测试案例的获取方法 | |
WO2020100136A1 (en) | Method of anomaly detection and system thereof | |
CN110807491A (zh) | 车牌图像清晰度模型训练方法、清晰度检测方法及装置 | |
CN111738351A (zh) | 模型训练方法、装置、存储介质及电子设备 | |
CN110276252B (zh) | 一种基于生成式对抗网络的抗表情干扰的人脸识别方法 | |
CN109815884A (zh) | 基于深度学习的不安全驾驶行为检测方法及装置 | |
CN110263680B (zh) | 图像处理方法、装置和***及存储介质 | |
CN109815797A (zh) | 活体检测方法和装置 | |
CN112070506A (zh) | 风险用户识别方法、装置、服务器及存储介质 | |
CN112232971A (zh) | 反欺诈检测方法、装置、计算机设备和存储介质 | |
CN112115921A (zh) | 一种真伪鉴别方法、装置以及电子设备 | |
CN117011274A (zh) | 自动化玻璃瓶检测***及其方法 | |
CN115239672A (zh) | 缺陷检测方法及装置、设备、存储介质 | |
CN111259838A (zh) | 服务机器人服务环境下深度理解人体行为的方法及*** | |
Arafah et al. | Face recognition system using Viola Jones, histograms of oriented gradients and multi-class support vector machine | |
Cho et al. | Vision-based parking occupation detecting with embedded AI processor | |
CN112949785A (zh) | 对象检测方法、装置、设备及计算机存储介质 | |
CN113837390A (zh) | 一种模态信息补全方法、装置及设备 | |
CN111507420A (zh) | 轮胎信息获取方法、装置、计算机设备和存储介质 | |
CN111093140A (zh) | 检测麦克和听筒防尘网缺陷的方法、装置、设备及存储介质 | |
CN115937991A (zh) | 人体摔倒识别方法、装置、计算机设备及存储介质 | |
CN114898350A (zh) | 一种银行卡识别方法、识别***、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40058665 Country of ref document: HK |
|
GR01 | Patent grant | ||
GR01 | Patent grant |