CN110705613A

CN110705613A - 物体分类方法

Info

Publication number: CN110705613A
Application number: CN201910885199.3A
Authority: CN
Inventors: 张发恩; 宋亮; 秦永强
Original assignee: Innovation Qizhi (qingdao) Technology Co Ltd
Current assignee: Innovation Qizhi (qingdao) Technology Co Ltd
Priority date: 2019-09-19
Filing date: 2019-09-19
Publication date: 2020-01-17
Anticipated expiration: 2039-09-19
Also published as: CN110705613B

Abstract

本发明公开了物体分类方法，包括下列步骤：首先使用检测模型检测出场景中所有目标，并进行一次粗分类；第二步将粗分类的各目标根据相互位置关系构造位置关系图，根据相对距离计算出关系影响权重；第三步使用第二步计算出的所述关系影响权重对所述位置关系图进行图卷积，得到平滑后的结果；重复上述步骤直到变化值停止不变。本发明通过构造不同物体的位置关系图，使得最终结果不只是针对单个物体的分类结果，而是考虑到周围物体的分类结果，这样对于存在遮挡模糊等原因而导致机器学习模型难以分辨的物体就可以进行重新分类，从而可以进行简单的推断，即通过周围物体的分类结果来推理出这些难以分辨物体的分类结果。

Description

物体分类方法

技术领域

本发明涉及产品分类的技术领域，具体涉及到一种物体分类方法的技术。

背景技术

随着人工智能的发展，检测分类技术在日常生活中发挥着越来越重要的作用，但是目前主流的检测分类技术实质是对每一个对立的物体进行分类，并没有考虑到物体之间的相互关系。对于一些需要考虑相互关系的场景表现较差，难以达到人类的准确率。

发明内容

为了克服现有技术的不足，本发明的目的在于提供一种物体分类方法，对于难以分辨物体的分类进行简单的推断，得到所述物体的类别。

为达上述目的，本发明采用以下技术方案：

一种物体分类方法，其特征在于：所述物体分类方法包括下列步骤

首先使用检测模型检测出场景中所有目标，并进行一次粗分类；

第二步将粗分类的各目标根据相互位置关系构造位置关系图，根据相对距离计算出关系影响权重；

第三步使用第二步计算出的所述关系影响权重对所述位置关系图进行图卷积，得到平滑后的结果；

重复上述步骤直到变化值停止不变。

所述粗分类是卷积神经网络如ResNet，结果为属于每一类的概率。

所述相互位置关系是使用欧式像素距离作为距离，权重为e^-(distance/k)，其中k为可以根据实际效果更改的参数。

所述第三步中卷积就是加权，按照第二步中计算出的权重进行加权，所述平滑后的结果为x1＝sum(wi*x0i)；所述变化值为x1-x0。

本发明具有以下有益效果：

本发明通过构造不同物体的位置关系图，使得最终结果不只是针对单个物体的分类结果，而是考虑到周围物体的分类结果，即将目标物体与其周围物体结合进行一个分类结果的推断，这样对于存在遮挡模糊等原因而导致机器学习模型难以分辨的物体就可以进行重新分类，从而可以进行简单的推断，即通过周围物体的分类结果来推理出这些难以分辨物体的分类结果。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例中所需要使用的附图作简单地介绍。显而易见地，下面所描述的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。

图1是本发明物体分类方法的原理图；

图2是本发明物体分类方法的分类模块示意图。

具体实施方式

下面结合附图并通过具体实施方式来进一步说明本发明的技术方案。

其中，附图仅用于示例性说明，表示的仅是示意图，而非实物图，不能理解为对本专利的限制；为了更好地说明本发明的实施例，附图某些部件会有省略、放大或缩小，并不代表实际产品的尺寸；对本领域技术人员来说，附图中某些公知结构及其说明可能省略是可以理解的。

本发明实施例的附图中相同或相似的标号对应相同或相似的部件；在本发明的描述中，需要理解的是，若出现术语“上”、“下”、“左”、“右”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此附图中描述位置关系的用语仅用于示例性说明，不能理解为对本专利的限制，对于本领域的普通技术人员而言，可以根据具体情况理解上述术语的具体含义。

本发明物体分类方法包括下列步骤：

首先使用检测模型如Mask-RCNN检测出场景中所有目标，并进行一次粗分类，即卷积神经网络结果属于每一类的概率，如将物体分为三类，则对每一个物体粗分类结果为[0.1 0.10.8]分别代表第一类概率为0.1第二类概率为0.1第三类概率为0.8，即应当被分为第三类。所述卷积神经网络结果如ResNet结果；ResNet(Residual Neural Network)由微软研究院的Kaiming He等四名华人提出，通过使用ResNet Unit成功训练出了152层的神经网络。ResNet的结构可以极快的加速神经网络的训练，模型的准确率也有比较大的提升。同时ResNet的推广性非常好，甚至可以直接用到InceptionNet网络中。Mask R-CNN是一个两阶段的框架，第一个阶段扫描图像并生成提议(proposals，即有可能包含一个目标的区域)，第二阶段分类提议并生成边界框和掩码。Mask R-CNN扩展自Faster R-CNN，由同一作者在去年提出。Faster R-CNN是一个流行的目标检测框架，Mask R-CNN将其扩展为实例分割框架。

第二步将粗分类的各目标根据相互位置关系构造位置关系图，根据相对距离计算出关系影响权重，使用欧式像素距离作为距离，所述关系影响权重为e^-(distance/k)，其中k为根据实际效果更改的参数；

第三步使用第二步计算出的所述权重对所述位置关系图进行图卷积，所述卷积就是加权，得到平滑后的结果为x1＝sum(wi*x0i)；

重复上述步骤直到变化值停止不变，即所述变化值x1-x0停止不变，该变化值x1-x0尽量较小。前述e^-(distance/k)、x1＝sum(wi*x0i)给出个参数e^、distance、k、(distance/k)、sum、wi、x0i、x0、x1的技术含义如下：e^指数；distance为两个物体的像素距离(像素距离即为在图片上的距离)；sum求和；wi是所计算的权重；x是所计算的概率。x1＝sum(wi*x0i)依赖于e^-(distance/k)的计算结果；x1-x0是指对概率的修正。

例如：使用检测模型如Mask-RCNN检测出场景中所有目标，包括目标物体A与周围物体B，目标物体A存在遮挡模糊，因此导致机器学习模型难以分辨，周围物体B易于机器学习模型难以分辨其类别。对目标物体A与周围物体B进行一次粗分类，其分类原理是利用卷积神经网络结果，得到一个属于每一类的概率数值。其中周围物体B是足够临近目标物体A的相邻物体。

将目标物体A与周围物体B根据它们的相互位置关系，构造位置关系图，根据相对距离计算出关系影响权重，使用欧式像素距离作为距离，所述关系影响权重为e^-(distance/k)，其中k为根据实际效果更改的参数；

使用所算出的权重对所述位置关系图进行图卷积，即进行加权，得到平滑后的结果x1＝sum(wi*x0i)。

重复上述步骤直到变化值停止不变，即变化值x1-x0停止不变，则认为目标物体与周围物体B为同一类概率较大。由此推断周围物体B的类别就是目标物体A的类别。

本发明所述物体分类方法，通过考虑物体相互位置关系，因此可以使物体检测分类结果考虑到不同物体的相互关系，使分类结果更加稳定并且接近人类所达到结果。在本发明中，技术核心是通过构造不同物体的位置关系图，使得的最终结果不只是对单个目标物体的分类结果，而是考虑到周围物体的分类结果，进行一个推断。上述过程其实是通过物体周边分类进行加权，认为目标物体与相近物体为同一类概率较大，以此进行推断。这样对于存在遮挡模糊等原因而导致机器学***滑后的结果即x1＝sum(wi*x0i)；重复上述步骤，变化值x1-x0停止不变，则认为目标物体与周围物体为同一类概率较大，由此推断周围物体即相近物体的类别就是目标物体即机器学习模型难以分辨的物体的类别。可见，本发明通过周围物体推理出这些难以分辨的目标物体的类别。

综上所述，本发明所述物体分类方法，是将足够近的相邻物体使用一条边连起来，使得最终结果不只是对单个物体的分类结果，而是考虑到周围物体的分类结果进行一个推断，因此，对于存在遮挡模糊等原因而导致机器学习模型难以分辨的物体进行重新分类，使得模型可以进行简单的推断，通过周围物体推理出这些难以分辨物体的类别。

如图1，给出了本发明所述物体分类方法的原理：使用检测模型进行检测以及粗分类；构造图片中物体关系图并计算权重；根据计算得到的权重和图，进行卷积，得到平滑后的结果x1＝sum(wi*x0i)；重复上述过程直到变化值x1-x0停止不变。图2为分类模块图，即检测分类模型、物体关系图、图卷积。

需要声明的是，上述具体实施方式仅为本发明的较佳实施例及所运用技术原理，在本发明所公开的技术范围内，任何熟悉本技术领域的技术人员所容易想到的变化或替换，都应涵盖在本发明的保护范围内。

Claims

1.一种物体分类方法，其特征在于：所述物体分类方法包括下列步骤

重复上述步骤直到变化值停止不变。

2.根据权利要求1所述的物体分类方法，其特征在于：所述粗分类是卷积神经网络结果，所述卷积神经网络结果是属于每一类的概率。

3.根据权利要求1所述的物体分类方法，其特征在于：所述相互位置关系是使用欧式像素距离作为距离，权重为e^-(distance/k)，其中k为可以根据实际效果更改的参数。

4.根据权利要求3所述的物体分类方法，其特征在于：所述第三步中卷积就是加权，按照第二步中计算出的权重进行加权，所述平滑后的结果为x1＝sum(wi*x0i)；所述变化值为x1-x0。