CN111223143A - 关键点检测方法、装置及计算机可读存储介质 - Google Patents
关键点检测方法、装置及计算机可读存储介质 Download PDFInfo
- Publication number
- CN111223143A CN111223143A CN201911424797.7A CN201911424797A CN111223143A CN 111223143 A CN111223143 A CN 111223143A CN 201911424797 A CN201911424797 A CN 201911424797A CN 111223143 A CN111223143 A CN 111223143A
- Authority
- CN
- China
- Prior art keywords
- point
- points
- image
- thermodynamic diagram
- detected
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 title claims description 21
- 238000010586 diagram Methods 0.000 claims abstract description 180
- 238000000034 method Methods 0.000 claims abstract description 48
- 239000000203 mixture Substances 0.000 claims description 79
- 238000009826 distribution Methods 0.000 claims description 36
- 238000012549 training Methods 0.000 claims description 24
- 238000004590 computer program Methods 0.000 claims description 8
- 238000013507 mapping Methods 0.000 claims description 7
- 238000005516 engineering process Methods 0.000 abstract description 2
- 230000006870 function Effects 0.000 description 18
- 230000008569 process Effects 0.000 description 13
- 238000013528 artificial neural network Methods 0.000 description 10
- 238000004364 calculation method Methods 0.000 description 8
- 230000008859 change Effects 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 210000001747 pupil Anatomy 0.000 description 6
- 210000003423 ankle Anatomy 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000000877 morphologic effect Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000010079 rubber tapping Methods 0.000 description 1
- 210000000697 sensory organ Anatomy 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000010897 surface acoustic wave method Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 210000000707 wrist Anatomy 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20076—Probabilistic image processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Image Analysis (AREA)
Abstract
本发明提供了一种关键点检测方法、装置及计算机可读存储介质,属于计算机技术视觉领域。该方法中,对于待检测图像对应的每张热力图,会确定该热力图中极值点及极值点的至少一个相邻点在待检测图像中对应的原始区域,每张热力图分别用于确定该热力图的对应位置的关键点,该热力图小于该待检测图像,接着,会基于该原始区域确定该原始区域中每个像素点的概率值,该概率值表示像素点为关键点的概率,基于所有像素点的概率值,确定对应位置的关键点。这样,通过结合热力图中极值点及相邻点,由于相邻点能够额外提供更加丰富可靠的信息,像素点的概率值能够更加明确的表示该像素点是关键点的概率,因此一定程度上可以提高关键点确定的准确率。
Description
技术领域
本发明属于计算机视觉技术领域,特别是涉及一种关键点检测方法、装置及计算机可读存储介质。
背景技术
随着计算机视觉领域的不断发展,对图像中动态对象的姿态估计技术得到了广泛的应用。为了实现姿态估计,往往需要对人体中不同位置的关键点进行检测。其中,该关键点所在的位置可以是人体关节或者五官所在的位置。进行关键点检测时,往往是先对待检测图像进行缩小,然后将缩小后的图像输入预设的神经网络中,利用该神经网络生成与不同位置的关键点对应的热力图,最后,基于每个位置的关键点对应的热力图中的极值点,确定该位置的关键点在待检测图像中对应的像素点,进而实现关键点检测。其中,热力图中每个点的数值表示该点所在的位置是关键点的概率,极值点表示所在位置是关键点的概率最大的点。
现有技术中,在基于热力图中的极值点,确定该热力图对应位置的关键点时,往往是按照固定选择规则,将该极值点在原图中对应的区域中,指定的位置的像素点确定为关键点,例如,将该区域的中心位置的像素点作为关键点。这样,按照固定方式进行选取的方式准确率较低。
发明内容
有鉴于此,本发明提供一种关键点检测方法、装置及计算机可读存储介质,在一定程度上解决了关键点检测的准确率较低的问题。
依据本发明的第一方面,提供了一种关键点检测方法,该方法可以包括:
对于待检测图像对应的每张热力图,确定所述热力图中极值点及所述极值点的至少一个相邻点在所述待检测图像中对应的原始区域;每张所述热力图分别用于确定所述热力图的对应位置的关键点,所述热力图小于所述待检测图像;
基于所述原始区域,生成所述原始区域中每个像素点的概率值;所述概率值表示所述像素点为关键点的概率;
基于所有所述像素点的概率值,确定所述对应位置的关键点。
依据本发明的第二方面,提供了一种关键点检测装置,该装置可以包括:
第一确定模块,用于对于待检测图像对应的每张热力图,确定所述热力图中极值点及所述极值点的至少一个相邻点在所述待检测图像中对应的原始区域;每张所述热力图分别用于确定所述热力图的对应位置的关键点,所述热力图小于所述待检测图像;
生成模块,用于基于所述原始区域,生成所述原始区域中每个像素点的概率值;所述概率值表示所述像素点为关键点的概率;
第二确定模块,用于基于所有所述像素点的概率值,确定所述对应位置的关键点。
第三方面,本发明实施例提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的关键点检测方法的步骤。
针对在先技术,本发明具备如下优点:
对于待检测图像对应的每张热力图,会确定该热力图中极值点及极值点的至少一个相邻点在待检测图像中对应的原始区域,其中,每张热力图分别用于确定该热力图的对应位置的关键点,该热力图小于该待检测图像,接着,会基于该原始区域确定该原始区域中每个像素点的概率值,该概率值表示像素点为关键点的概率,最后,会基于所有像素点的概率值,确定对应位置的关键点。相较于直接选择热力图中极值点对应区域中固定位置的像素点的方式,本发明实施例中,通过结合热力图中极值点及相邻点,基于两者对应的原始区域中各个像素点的概率值来选择关键点时,由于相邻点能够额外提供更加丰富可靠的信息,像素点的概率值能够更加明确的表示该像素点是关键点的概率,因此,基于该原始区域中的各个像素点的概率值选择准确率的方式,一定程度上可以提高关键点确定的准确率。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1是本发明实施例提供的一种关键点检测方法的步骤流程图;
图2-1是本发明实施例提供的一种关键点检测方法的步骤流程图;
图2-2是本发明实施例提供的一种相邻点示意图;
图2-3是本发明实施例提供的另一种相邻点示意图;
图2-4是本发明实施例提供的又一种相邻点示意图;
图2-5是本发明实施例提供的一种原始区域示意图;
图2-6是本发明实施例提供的一种真实关键点点云生成示意图;
图2-7是本发明实施例提供的一种模型示意图;
图2-8是本发明实施例提供的一种关键点示意图;
图3是本发明实施例提供的一种关键点检测装置的框图;
图4是本发明实施例提供的另一种关键点检测装置的框图;
图5为实现本发明各个实施例的一种终端的硬件结构示意图。
具体实施方式
下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
图1是本发明实施例提供的一种关键点检测方法的步骤流程图,如图1所示,该方法可以包括:
步骤101、对于待检测图像对应的每张热力图,确定所述热力图中极值点及所述极值点的至少一个相邻点在所述待检测图像中对应的原始区域;每张所述热力图分别用于确定所述热力图的对应位置的关键点,所述热力图小于所述待检测图像。
本发明实施例中,该待检测图像可以是需要检测关键点的图像,该待检测图像中包括至少一个人像,该待检测图像对应的热力图可以是预先利用神经网络生成的,该极值点的相邻点指的是该热力图中与该极值点的距离在预设阈值内的点,其中,该预设阈值可以是根据实际情况预先设定。
进一步地,该待检测图像对应的热力图的数量可以与需要检测的关键点的数量相等,其中,需要检测的关键点的数量可以是根据实际需求预先设定的,示例的,检测的关键点的数量可以为14个,也可以为18个,本发明实施例对此不作限定。其中,热力图的对应位置可以是该热力图中的极值点所指示的关键点在人体中的位置,该位置可以为手肘、手腕、脚踝,等等。
进一步地,热力图的尺寸可以小于该待检测图像的尺寸,即就是在利用神经网络生成该热力图时,是通过神经网络对缩小之后的待检测图像进行处理,进而生成该热力图,其中,在通过神经网络对缩小之后的待检测图像进行处理,还可以对缩小后的待检测图像进行张量坐标变化,例如,将缩小之后的待检测图像由256*128*3的输入转换为3*256*128的输入,其中,3表示颜色通道数,256表示图像宽度,128表示图像高度。
这样,通过对待检测图像进行缩小,利用神经网络对该缩小后的待检测图像进行处理,进而生成该热力图的方式,可以减少神经网络的计算量,进而提高关键点检测的效率,以及使本发明实施例中的方法也能应用与计算能力较弱的设备,进而提高应用范围。
相应地,由于热力图的尺寸小于待检测图像的尺寸,因此,热力图中的一个像素点,会对应该待检测图像中由多个像素点组成的一个区域,进而可以根据极值点及相邻点从待检测图像中确定出一个对应的区域。具体的,在确定时,可以确定极值点在待检测图像中对应的区域,确定相邻点在待检测图像中对应的区域,这些区域组成的区域即为该原始区域。实际应用场景中,人体的姿势发生,会使得不同位置的关键点在人体中的相对位置与自然状态下该位置的关键点在人体中的相对位置变化,但是,随着人体姿势的变化,关键点周围的相邻点与该关键点的相对位置往往不会发生变化,因此,极值点的相邻点往往能额外提供更加丰富可靠的信息,这样,本步骤中,通过结合热力图中极值点及相邻点确定原始区域,可以使得原始区域中能够包含更多丰富可靠的信息,进而提高后续步骤中,基于该原始区域确定的关键点的准确率。
步骤102、基于所述原始区域,生成所述原始区域中每个像素点的概率值;所述概率值表示所述像素点为关键点的概率。
本发明实施例中,可以对原始区域中每个像素点进行概率预估,以确定每个像素点是关键点的概率,进而得到每个像素点的概率值。示例的,可以将原始区域作为输入,利用预训练的预估模型并根据原始区域的图像特征,来确定原始区域中每个像素点的概率值,也可以是根据原始区域中的各个像素点的位置信息,确定每个像素点的概率值,本发明实施例对此不作限定。
步骤103、基于所有所述像素点的概率值,确定所述对应位置的关键点。
由于像素点的概率值表示的是该像素点为关键点的概率,也就是,如果像素点的概率值越大,那么该像素点是关键点的概率更大,因此,本步骤中,基于所有像素点的概率值,确定该对应位置的关键点时,可以将概率值最大的像素点作为该对应位置的关键点。示例的,假设该热力图的对应为脚踝处,那么可以将该原始区域中概率值最大的像素点确定为脚踝处的关键点。
当然,每个像素点的概率值的精度可能会存在一定的误差,即,概率值与最大概率值相差较小的像素点是关键点可能性与概率值最大的像素点的可能性相同,因此,本步骤中,也可以是从概率值大于预设概率阈值的像素点中,选择一个像素点作为该对应位置的像素点。由于概率值能够更加明确的表示该像素点是关键点的概率,因此,相较于选择极值点对应区域中固定位置的像素点作为关键点的方式,基于概率值选择关键点的方式,一定程度上可以使确定的关键点更加准确。
综上所述,本发明实施例提供的关键点检测方法,对于待检测图像对应的每张热力图,会确定该热力图中极值点及极值点的至少一个相邻点在待检测图像中对应的原始区域,其中,每张热力图分别用于确定该热力图的对应位置的关键点,该热力图小于该待检测图像,接着,会基于该原始区域确定该原始区域中每个像素点的概率值,该概率值表示像素点为关键点的概率,最后,会基于所有像素点的概率值,确定对应位置的关键点。相较于直接选择热力图中极值点对应区域中固定位置的像素点的方式,本发明实施例中,通过结合热力图中极值点及相邻点,基于两者对应的原始区域中各个像素点的概率值来选择关键点时,由于相邻点能够额外提供更加丰富可靠的信息,像素点的概率值能够更加明确的表示该像素点是关键点的概率,因此,基于该原始区域中的各个像素点的概率值选择准确率的方式,一定程度上可以提高关键点确定的准确率。
图2-1是本发明实施例提供的一种关键点检测方法的步骤流程图,如图2-1所示,该方法可以包括:
步骤201、对于待检测图像对应的每张热力图,确定所述热力图中极值点及所述极值点的至少一个相邻点在所述待检测图像中对应的原始区域;每张所述热力图分别用于确定所述热力图的对应位置的关键点,所述热力图小于所述待检测图像。
具体的,在确定原始区域之前,可以先确定该极值点的相邻点,然后基于极值点及相邻点确定原始区域。
进一步地,确定该极值点的相邻点的操作可以通过下述子步骤(1)~子步骤(2)实现:
子步骤(1):基于预设的位置与相邻点数量及相对位置对应关系以及所述极值点的对应位置,确定所述极值点的相邻点的数量及所述相邻点与所述极值点的相对位置。
本步骤中,该相邻点可以是与极值点直接相邻的点,可以是与极值点间接相邻的点,示例的,图2-2是本发明实施例提供的一种相邻点示意图,如图2-2所示,存在两个相邻点与极值点直接相邻,进一步地,图2-3是本发明实施例提供的另一种相邻点示意图,如图2-3所示,存在两个相邻点与极值点直接相邻,存在两个相邻点与极值点间接相邻。其中,极值点以斜线覆盖的正方形框示出,相邻点以圆点覆盖的正方形框示出。
进一步地,该对应关系可以是基于与各个位置中关键点的相对位置固定的点预先生成的,该对应关系中可以包括多个不同位置以及该位置的极值点的相邻点的数量及相对位置建立的。对于每个位置而言,与该位置中关键点的相对位置固定的点可以是开发人员预先根据该位置的形态特点设置的,该相对位置固定的点即为该位置对应的相邻点。示例的,假设该位置为鼻尖,而鼻子往往是沿着竖直方向呈现出细长形,靠近鼻尖的上方位置的点与鼻尖的相对位置,不会因为人体的姿态变化而变化,因此,可以设置该位置对应的相邻点的数量为2,相邻点的相对位置为位于极值点的正上方。假设该位置为瞳孔,而眼睛往往是沿着水平方向呈现出宽短形,靠近瞳孔的左右两边的位置的点与瞳孔的相对位置,不会因为人体的姿态变化而变化,因此,可以设置该位置对应的相邻点的数量为2,相邻点的相对位置可以为沿着水平方向分别位于极值点的两侧。
相应地,可以将该极值点的对应位置与该对应关系中的位置一一对比,进而查找出相匹配的位置,接着,可以将该相匹配的位置对应的数量及相对位置,作为该极值点的相邻点的数量及与该极值点的相对位置。示例的,假设该极值点的对应位置是瞳孔,那么可以确定极值点的相邻点的数量为2,相邻点与该极值点的相对位置是:沿着水平方向分别位于极值点的两侧。
本发明实施例中,由于对应关系中相邻点个数及相对位置是基于位置的形态特点来设定的,因此,基于该对应关系确定的相邻点,能够与极值点更加适配,进而一定程度上可以提高后续步骤中基于极值点及相邻点选择的关键点的准确率。
子步骤(2):基于所述相邻点的数量及所述相邻点与所述极值点的相对位置在所述热力图中进行选择,得到至少一个所述相邻点。
本步骤中,可以按照相对位置选择X个相邻点,其中,X为相邻点的数量。示例的,假设极值点的相邻点的数量为2,相邻点与该极值点的相对位置是:沿着水平方向分别位于极值点的左右两侧,那么可以将沿着水平方向分别位于该极值点的两侧两个点,确定为该极值点的相邻点。
当然,也可以直接以极值点为中心,选择框选一个矩形,将该矩形内除该极值点之外的点作为相邻点。这样,无需基于对应关系进行查找,即可实现确定相邻点,进而可以提高确定效率。具体的,矩形越大,相邻点的数量就会越大,相应地,结合该相邻点进行确定的精度就会越高,但是,相应地,计算量也会越多,而矩形越小,相邻点的数量就会越小,相应地,结合该相邻点进行确定的精度就会越低,但是,相应地,计算量也会越少,因此,矩形的具体大小可以根据实际需求来设置,本发明实施例对此不作限定。
示例的,该矩形的大小可以为3*3,相应地,相邻点为与该极值点直接相邻,围绕该极值点一圈的8个点。图2-4是本发明实施例提供的又一种相邻点示意图,可以看出,绕着极值点一圈分布着8个相邻点。
该矩形的大小也可以为4*4,相应地,相邻点可以为除该极值点之外的15个点,该矩形的大小还可以为5*5,相应地,相邻点可以为除该极值点之外的24个点。本发明的另一可选实施例中,可以按照3*3的大小进行选取,这样,可以在使相邻点更加全面的同时,尽可能避免带来更多的计算量,进而节省设备的处理资源。
进一步地,在确定相邻点之后,可以确定极值点及该相邻点在待检测图像中对应的原始区域,具体的,确定原始区域的操作可以通过下述子步骤(3)~子步骤(5)实现:
子步骤(3):获取所述待检测图像与所述热力图的宽高比例。
本步骤中,该宽高比例可以包括宽度比例以及高度比例,其中,宽度比例指的是待检测图像的宽度与热力图的宽度的比值,高度比例指的是待检测图像的高度与热力图的高度的比值。在获取时,可以是先获取待检测图像的宽度值及高度值,以及获取热力图的宽度值及高度值,接着,基于待检测图像的宽度值及高度值以及热力图的宽度值及高度值,计算该宽高比例。这样,通过实时计算,可以确保数据的准确性。示例的,假设待检测图像的宽度为W,热力图的宽度为w,待检测图像的高度为H,热力图的宽度为h,那么可以得到宽度比例:W/w,高度比例:H/h。
进一步地,在生成该热力图时,会按照预设比例对待检测图像进行缩小,以获取缩小后的图像,用于生成该热力图,而生成的热力图的尺寸往往与缩小后的图像尺寸一致,因此,本步骤中,也可以直接读取生成该热力图时,所使用的预设比例,这样,无需计算即可获得宽高比例,进而可以提高确定效率。
子步骤(4):基于所述宽高比例,分别将所述极值点及每个所述相邻点映射至所述待检测图像中,得到所述极值点在所述待检测图像中对应的子区域及每个所述相邻点在所述待检测图像中对应的子区域。
本步骤中,基于宽高比例进行映射时,可以是按照该宽高比例,对热力图进行线性插值,对该热力图进行扩充,得到一个与待检测图像大小一致的图像,然后基于该图像中极值点及其周围扩充的点所组成的区域在该图像中的相对位置,确定待检测图像中对应的区域,进而得到该极值点在该待检测图像中对应的子区域,类似的,可以基于相同的实现方式确定相邻点在该待检测图像中对应的子区域。
子步骤(5):将所有所述子区域组成的区域,确定为所述原始区域。
示例的,假设有8个相邻点,那么可以将由该8个相邻点对应的子区域以及该极值点对应的子区域所组成的区域,确定为原始区域。示例的,图2-5是本发明实施例提供的一种原始区域示意图,如图2-5所示,该原始区域由9个子区域组成。
步骤202、将所述原始区域作为预训练的目标高斯混合模型的输入,并基于所述目标高斯混合模型,生成所述原始区域中每个像素点的概率值。
本步骤中,该目标高斯混合模型可以是以样本图像及样本图像中预设位置的关键点作为训练数据训练得到的,该预设位置可以与热力图的对应位置相匹配。示例的,假设该热力图的对应位置是脚踝,那么本步骤中使用的目标高斯混合模型可以是基于样本图像及样本图像中脚踝处的关键点训练得到的,假设该热力图的对应位置是瞳孔,那么本步骤中使用的目标高斯混合模型可以是基于样本图像及样本图像中瞳孔处的关键点训练得到的。这样,由于该目标高斯混合模型是基于样本图像中与该对应位置匹配的预设位置的关键点训练得到的。这样,可以使得训练场景与使用场景更加贴近,即,都是确定出同一位置的关键点,进而使训练得到的该目标高斯混合模型能够最大程度学习到预测该对应位置的关键点的概率分布能力,使得基于该目标高斯混合模型,生成的概率值更加准确。当然,也可以不区分样本图像中关键点的位置,直接为所有位置的关键点生成一个高斯混合模型,并基于该高斯混合模型生成原始区域中每个像素点的概率值,本发明实施例对此不作限定。
进一步地,本发明实施例中,可以针对不同的位置,预先训练相对应的高斯混合模型,在基于生成原始区域中每个像素点的概率值时,可以基于热力图的对应位置,选择训练时,是基于样本图像中该对应位置的关键点训练得到的高斯混合模型,作为目标高斯混合模型,并基于该目标高斯混合模型对基于该热力图确定的原始区域进行处理,进而得到原始区域中每个像素点的概率值。
相应地,本发明实施例中,可以在本步骤之前,基于样本图像及样本图像中预设位置的关键点进行训练,以获取该目标高斯混合模型。具体的,可以通过下述子步骤(6)~子步骤(9)实现训练目标高斯混合模型:
子步骤(6):对于每帧所述样本图像,确定所述样本图像的热力图中极值点及所述极值点的至少一个相邻点在所述样本图像中对应的样本区域;所述样本图像的热力图的对应位置为所述预设位置。
本步骤中,由于要训练的目标高斯混合模型是用于预测该预设位置的关键点的概率分布,因此,基于样本图像进行训练时,可以采用对应位置为该预设位置的热力图进行训练,以确保训练数据的适配性。其中,该样本图像的热力图可以是训练神经网络的过程中生成的,也可以是利用训练好的神经网络生成的,本发明实施例对此不作限定。
进一步地,确定样本区域时,可以先获取样本图像与该热力图的宽高比例,然后基于该宽高比例,分别将极值点及每个相邻点映射至样本图像中,得到极值点在样本图像中对应的子区域及每个相邻点在样本图像中对应的子区域,最后,可以将所有子区域组成的区域,确定为样本区域。具体的,获取宽高比例,基于宽高比例进行映射的具体实现方式,可以参照前述步骤中的描述,本发明实施例对此不作限定。其中,该样本区域包括的子区域数可以与原始区域包括的子区域数相同,即,训练过程中选取的相邻点的个数与进行关键点检测时选取的相邻的个数相同,进一步地,两者选取相邻点的相对位置也可以相同。通过保持相邻点的一致性,一定程度上可以提高训练出的目标高斯混合模型的处理效果。
子步骤(7):基于初始高斯混合模型,确定每帧所述样本图像的所述样本区域中的关键点,得到预测关键点点云。
本步骤中,该初始高斯混合模型可以是基于实际需求预先搭建的,该初始高斯混合模型中可以包括K个子高斯分布,具体的K的具体数值可以与样本区域中包含的子区域的个数相同。K个子高斯分布叠加在一起就组成该初始高斯混合模型。
示例的,该初始高斯混合模型可以定义为:
其中,πk表示第k个子高斯分布的权重,p(xk)表示第k个子高斯分布的高斯概率密度函数,该高斯概率密度函数中的参数可以包括期望值μ,标准差σ,其中,期望值可以决定概率分布的位置,标准差可以决定概率分布的幅度。
进一步地,在使用初始高斯混合模型确定预测关键点点云的之前,可以先对初始高斯混合模型中的各个预设参数进行初始化,即,为每个预设参数随机赋值。其中,该预设参数即为各个子高斯分布的权重、期望值及标准差。
接着,对于每个样本区域而言,可以先从该样本区域包括的每个子区域中,选取每个子区域对应的坐标值,接着,将该每个子区域对应的坐标值,确定为初始高斯混合模型中对应的子高斯分布的中心值,接着,可以将每个子区域中每个像素点的坐标值输入该初始高斯混合模型中,相应地,该初始高斯混合模型可以生成该样本区域中每个像素点的预测概率值,最后,可以将最大预测概率值对应的像素点作为该样本图像的预测关键点。以此类推,可以得到多个样本图像的预测关键点,这些样本图像的预测关键点可以组成预测关键点点云。
子步骤(8):基于所述样本图像对应真实关键点点云及所述预测关键点点云,确定所述初始高斯混合模型的误差值。
本步骤中,该真实关键点点云可以是由这多个样本图像的真实关键点组成。示例的,图2-6是本发明实施例提供的一种真实关键点点云生成示意图,如图2-6所示,a中示出了一个样本图像的热力图中的极值点及相邻点,b中示出了该热力图中的极值点及相邻点对应的样本区域及该样本区域中的真实关键点,该样本区域由9个子区域组成,每个子区域中示出了像素点的概率分布,图中以封闭圆环示意概率分布,以实心圆点示意真实关键点。进一步地,c中示出了由多个样本图像的真实关键点组成的真实关键点点云。
进一步地,在确定误差值时,可以基于预设的误差函数计算预测关键点点云与真实关键点点云之间的误差值。其中,该预设的误差函数可以是基于实际需求设定的,示例的,该误差函数可以是交叉熵函数,也可以是均方误差函数,本发明实施例对此不作限定。该误差值可以体现测关键点点云与真实关键点点云之间的偏差程度,该误差值越大,则说明两者之间的偏差程度越大,相应地,该初始高斯混合模型的预测能力越弱。该误差值越小,则说明两者之间的偏差程度越小,相应地,该初始高斯混合模型的预测能力越强。
相较于基于单个真实关键点及预测关键点确定误差值,本步骤中,通过真实关键点点云及预测关键点点云确定误差值的方式,由于关键点更多,通过一次计算就能综合多个对真实关键点及预测关键点的信息,进而效率更高,计算出的误差值的代表性也更强。
子步骤(9):基于所述误差值对所述初始高斯混合模型中的参数进行调整,直至所述误差值小于预设阈值,得到所述目标高斯混合模型。
本步骤中,该预设阈值可以基于实际情况预先设定的,如果误差值小于该预设阈值,则可以认为初始高斯混合模型能够正确的预测出关键点,相应地,可以将该初始高斯混合模型作为目标高斯混合模型。反之,如果误差值不小于该预设阈值,则可以认为初始高斯混合模型还不能正确的预测出关键点,相应地,可以对初始高斯混合模型中的参数进行调整,然后基于上述步骤对该调整后的初始高斯混合模型继续进行训练,直至误差值小于预设阈值。其中,调整参数时,可以按照预设步长随机对参数进行调整,也可以基于随机梯度下降法进行调整,也可以是利用最大似然估计法对参数进行估计,本发明实施例对此不作限定。随着参数的不断调整,初始高斯混合模型会不断收敛,在误差值小于预设阈值时,则可以认为该初始高斯混合模型完全收敛。示例的,图2-7是本发明实施例提供的一种模型示意图,如图2-7所示,图2-7中包括两个子高斯分布的高斯混合模型中每个位置的概率密度是平滑的,该高斯混合模收敛。
进一步地,可以利用得到的目标高斯混合模型,生成原始区域中每个像素点的概率值。该生成原始区域中每个像素点的概率值的具体过程可以是:对于每个原始区域中的子区域,从该子区域中选取一个像素点的坐标值作为该子区域对应的坐标值。接着,将每个述子区域对应的坐标值,确定为子区域在所述目标高斯混合模型中对应的子高斯分布的中心值,最后,基于每个子高斯分布的中心值、期望值、标准差及权重,生成每个子区域中每个像素点的概率值。由于目标高斯混合模型在预测概率分布时的计算量较小,同时通过目标高斯混合模型来确定概率值时,引入了多个子高斯分布来对整体分布进行估计,进而可以使得估计的概率分布平滑且保持一定的精度,因此,本步骤中,通过采用目标高斯混合模型确定每个像素点的概率值,可以在尽可能减小计算的同时,确保精度。
具体的,在子区域对应的坐标值时,可以按照指定的坐标建立方式,在该待检测图像中建立参考坐标系,然后,确定该子区域的中心位置的像素点在该参考坐标系中的坐标值,得到该子区域对应的坐标值。其中,该指定的坐标建立方式可以是预先设定的,示例的,该指定的坐标建立方式可以是以左上角为原点,以水平方向为x轴,以竖直方向为y轴建立。这样,通过选择中心位置像素点的坐标值作为子高斯分布的中心值,可以使得目标高斯混合模型基于该中心值生成的概率分布更加均匀,进而可以提高生成的概率值的准确度。进一步地,生成每个子区域中每个像素点的概率值时,可以是将每个子区域中像素点的坐标值作为输入,相应地,该子区域对应的子高斯分布可以以中心值为中心,基于期望值、标准差及权重,生成每个像素点的概率值。
步骤203、基于所有所述像素点的概率值,确定所述对应位置的关键点。
具体的,本步骤的实现方式参照前述步骤,本发明实施例对此不作限定。
需要说明的是,在确定出关键点之后,可以将对待检测图像中的该关键点进行标记。示例的,假设待检测图像对应有14张热力图,即,要检测14个位置的关键点,图2-8是本发明实施例提供的一种关键点示意图,可以看出图2-8中的待检测图像中包括14个位于不同位置的关键点。
进一步地,本发明实施例中的待检测图像可以为待检测视频中包含的N帧连续视频图像,其中,N为大于2的整数。由于同一视频中有些连续的视频图像之间的内容变化程度往往较小,这样,多帧视频图像的热力图中极值点往往靠的比较近,且由于热力图的分辨率较低,相邻的点的值往往比较接近,例如,连续两帧视频图像的热力图中的极值点所处的位置可能相邻且值很接近,但是,由于极值点在视频图像中对应的往往是一整块区域,这样,位置相邻的两个极值点,其各自对应的区域虽然也是相邻的,但由于区域本身会占据一定的面积,这样,如果按照固定位置选择关键点,可能会导致这帧视频图像中的关键点相距较远。示例的,假设极值点对应的区域为7*7的像素区域,该固定位置为区域中心,那么这两帧视频图像中的关键点之间会相隔7个像素点。这样,由于连续视频图像中的关键点相距较远,进而会导致播放该待检测视频时,连续视频图像中的关键点出现“抖动”的问题。
而本发明实施例中,通过结合极值点及相邻点确定原始区域,并基于概率分布在该原始区域中确定关键值,这样,在连续视频图像的热力图中的极值点相邻的情况下,通过结合两者各自在视频图像中对应的区域,可以更加灵活合理的在原始区域中确定出关键点,进而一定程度上可以避免抖动问题,提高关键点平滑性,进而提高检测后视频图像中关键点的稳定性。
同时,相较于直接结合热力图中极值点和相邻点,预测偏移量,然后基于该偏移量,从该极值点对应的区域中选取关键点的方式,由于热力图中每个点的粒度较大,因此,结合之后预测得到的偏移量,也会存在较大的误差,进而会使得确定的关键点不准确。而本发明实施例中通过结合极值点和相邻点对应的区域,可以避免粒度带来的误差,进而一定程度上可以提高确定关键点的准确性。
综上所述,本发明实施例提供的关键点检测方法,对于待检测图像对应的每张热力图,会确定该热力图中极值点及极值点的至少一个相邻点在待检测图像中对应的原始区域,其中,每张热力图分别用于确定该热力图的对应位置的关键点,该热力图小于该待检测图像,接着,会基于预训练的目标高斯混合模型,生成原始区域中每个像素点的概率值,最后,会基于所有像素点的概率值,确定对应位置的关键点。相较于直接选择热力图中极值点对应区域中固定位置的像素点的方式,本发明实施例中,通过结合热力图中极值点及相邻点,基于两者对应的原始区域中各个像素点的概率值来选择关键点时,由于相邻点能够额外提供更加丰富可靠的信息,像素点的概率值能够更加明确的表示该像素点是关键点的概率,因此,基于该原始区域中的各个像素点的概率值选择准确率的方式,一定程度上可以提高关键点确定的准确率。同时,由于目标高斯混合模型在预测概率分布时的计算量较小,通过目标高斯混合模型来确定概率值时,引入了多个子高斯分布来对整体分布进行估计,进而可以使得估计的概率分布平滑且保持一定的精度,因此,通过采用目标高斯混合模型确定每个像素点的概率值,还可以在尽可能减小计算的同时,确保精度,进而进一步提高基于概率值确定的关键点的准确性。
图3是本发明实施例提供的一种关键点检测装置的框图,如图3所示,该装置30可以包括:
第一确定模块301,用于对于待检测图像对应的每张热力图,确定所述热力图中极值点及所述极值点的至少一个相邻点在所述待检测图像中对应的原始区域;每张所述热力图分别用于确定所述热力图的对应位置的关键点,所述热力图小于所述待检测图像。
生成模块302,用于基于所述原始区域,生成所述原始区域中每个像素点的概率值;所述概率值表示所述像素点为关键点的概率。
第二确定模块303,用于基于所有所述像素点的概率值,确定所述对应位置的关键点。
综上所述,本发明实施例提供的关键点检测装置,对于待检测图像对应的每张热力图,会确定该热力图中极值点及极值点的至少一个相邻点在待检测图像中对应的原始区域,其中,每张热力图分别用于确定该热力图的对应位置的关键点,该热力图小于该待检测图像,接着,会基于该原始区域确定该原始区域中每个像素点的概率值,该概率值表示像素点为关键点的概率,最后,会基于所有像素点的概率值,确定对应位置的关键点。相较于直接选择热力图中极值点对应区域中固定位置的像素点的方式,本发明实施例中,通过结合热力图中极值点及相邻点,基于两者对应的原始区域中各个像素点的概率值来选择关键点时,由于相邻点能够额外提供更加丰富可靠的信息,像素点的概率值能够更加明确的表示该像素点是关键点的概率,因此,基于该原始区域中的各个像素点的概率值选择准确率的方式,一定程度上可以提高关键点确定的准确率。
图4是本发明实施例提供的另一种关键点检测装置的框图,如图4所示,该装置40可以包括:
第一确定模块401,用于对于待检测图像对应的每张热力图,确定所述热力图中极值点及所述极值点的至少一个相邻点在所述待检测图像中对应的原始区域;每张所述热力图分别用于确定所述热力图的对应位置的关键点,所述热力图小于所述待检测图像。
生成模块402,用于基于所述原始区域,生成所述原始区域中每个像素点的概率值;所述概率值表示所述像素点为关键点的概率。
第二确定模块403,用于基于所有所述像素点的概率值,确定所述对应位置的关键点。
可选的,所述装置40还包括:
第三确定模块404,用于基于预设的位置与相邻点数量及相对位置对应关系和所述极值点的对应位置,确定所述极值点的相邻点的数量及所述相邻点与所述极值点的相对位置。
选取模块405,用于基于所述相邻点的数量及所述相邻点与所述极值点的相对位置在所述热力图中进行选择,得到至少一个所述相邻点。
其中,所述对应关系是基于与各个位置中关键点的相对位置固定的点预先生成的。
可选的,所述第一确定模块401,具体用于:
获取所述待检测图像与所述热力图的宽高比例。
基于所述宽高比例,分别将所述极值点及每个所述相邻点映射至所述待检测图像中,得到所述极值点在所述待检测图像中对应的子区域及每个所述相邻点在所述待检测图像中对应的子区域。
将所有所述子区域组成的区域,确定为所述原始区域。
可选的,所述生成模块402,具体用于:
将所述原始区域作为预训练的目标高斯混合模型的输入,并基于所述目标高斯混合模型,生成所述原始区域中每个像素点的概率值。
其中,所述目标高斯混合模型是以样本图像及所述样本图像中预设位置的关键点作为训练数据训练得到的,所述预设位置与所述热力图的对应位置相匹配。
可选的,所述原始区域由所述极值点在所述待检测图像中对应的子区域及所述相邻点在所述待检测图像中对应子区域组成。
所述生成模块402,还具体用于:
对于每个所述子区域,从所述子区域中选取一个像素点的坐标值作为所述子区域对应的坐标值。
将每个所述子区域对应的坐标值,确定为所述子区域在所述目标高斯混合模型中对应的子高斯分布的中心值。
基于每个子高斯分布的中心值、期望值、标准差及权重,生成每个子区域中每个像素点的概率值。
其中,所述目标高斯混合模型中包含的子高斯分布的个数与所述原始区域包含的子区域的个数相同。
可选的,所述生成模块402,还具体用于:
按照指定的坐标建立方式,在所述待检测图像中建立参考坐标系。
确定所述子区域的中心位置的像素点在所述参考坐标系中的坐标值,得到所述子区域对应的坐标值。
可选的,所述装置40还包括:
训练模块,用于基于所述样本图像及所述样本图像中预设位置的关键点进行训练,以获取所述目标高斯混合模型。
可选的,所述训练模块,具体用于:
对于每帧所述样本图像,确定所述样本图像的热力图中极值点及所述极值点的至少一个相邻点在所述样本图像中对应的样本区域;所述样本图像的热力图的对应位置为所述预设位置。
基于初始高斯混合模型,确定每帧所述样本图像的所述样本区域中的关键点,得到预测关键点点云。
基于所述样本图像对应真实关键点点云及所述预测关键点点云,确定所述初始高斯混合模型的误差值。
基于所述误差值对所述初始高斯混合模型中的参数进行调整,直至所述误差值小于预设阈值,得到所述目标高斯混合模型。
可选的,所述训练模块,还具体用于:
获取所述样本图像与所述热力图的宽高比例;
基于所述宽高比例,分别将所述极值点及每个所述相邻点映射至所述样本图像中,得到所述极值点在所述样本图像中对应的子区域及每个所述相邻点在所述样本图像中对应的子区域;
将所有样本图像中对应的子区域所组成的区域,确定为所述样本区域。
可选的,所述待检测图像为待检测视频中包含的N帧连续视频图像;
所述N为大于2的整数。
综上所述,本发明实施例提供的关键点检测装置,对于待检测图像对应的每张热力图,会确定该热力图中极值点及极值点的至少一个相邻点在待检测图像中对应的原始区域,其中,每张热力图分别用于确定该热力图的对应位置的关键点,该热力图小于该待检测图像,接着,会基于预训练的目标高斯混合模型,生成原始区域中每个像素点的概率值,最后,会基于所有像素点的概率值,确定对应位置的关键点。相较于直接选择热力图中极值点对应区域中固定位置的像素点的方式,本发明实施例中,通过结合热力图中极值点及相邻点,基于两者对应的原始区域中各个像素点的概率值来选择关键点时,由于相邻点能够额外提供更加丰富可靠的信息,像素点的概率值能够更加明确的表示该像素点是关键点的概率,因此,基于该原始区域中的各个像素点的概率值选择准确率的方式,一定程度上可以提高关键点确定的准确率。同时,由于目标高斯混合模型在预测概率分布时的计算量较小,通过目标高斯混合模型来确定概率值时,引入了多个子高斯分布来对整体分布进行估计,进而可以使得估计的概率分布平滑且保持一定的精度,因此,通过采用目标高斯混合模型确定每个像素点的概率值,还可以在尽可能减小计算的同时,确保精度,进而进一步提高基于概率值确定的关键点的准确性。
对于上述装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
图5为实现本发明各个实施例的一种终端的硬件结构示意图,如图5所示,该终端500包括但不限于:射频单元501、网络模块502、音频输出单元503、输入单元504、传感器505、显示单元506、用户输入单元507、接口单元508、存储器509、处理器510、以及电源511等部件。本领域技术人员可以理解,图5中示出的终端结构并不构成对终端的限定,终端可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。在本发明实施例中,终端包括但不限于手机、平板电脑、笔记本电脑、掌上电脑、车载终端、可穿戴设备、以及计步器等。
其中,处理器510,用于对于待检测图像对应的每张热力图,确定所述热力图中极值点及所述极值点的至少一个相邻点在所述待检测图像中对应的原始区域;每张所述热力图分别用于确定所述热力图的对应位置的关键点,所述热力图小于所述待检测图像。
处理器510,用于基于所述原始区域,生成所述原始区域中每个像素点的概率值;所述概率值表示所述像素点为关键点的概率。
处理器510,用于基于所有所述像素点的概率值,确定所述对应位置的关键点。
本发明实施例中,终端对于待检测图像对应的每张热力图,会确定该热力图中极值点及极值点的至少一个相邻点在待检测图像中对应的原始区域,其中,每张热力图分别用于确定该热力图的对应位置的关键点,该热力图小于该待检测图像,接着,会基于该原始区域确定该原始区域中每个像素点的概率值,该概率值表示像素点为关键点的概率,最后,会基于所有像素点的概率值,确定对应位置的关键点。相较于直接选择热力图中极值点对应区域中固定位置的像素点的方式,本发明实施例中,通过结合热力图中极值点及相邻点,基于两者对应的原始区域中各个像素点的概率值来选择关键点时,由于相邻点能够额外提供更加丰富可靠的信息,像素点的概率值能够更加明确的表示该像素点是关键点的概率,因此,基于该原始区域中的各个像素点的概率值选择准确率的方式,一定程度上可以提高关键点确定的准确率。
应理解的是,本发明实施例中,射频单元501可用于收发信息或通话过程中,信号的接收和发送,具体的,将来自基站的下行数据接收后,给处理器510处理;另外,将上行的数据发送给基站。通常,射频单元501包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器、双工器等。此外,射频单元501还可以通过无线通信***与网络和其他设备通信。
终端通过网络模块502为用户提供了无线的宽带互联网访问,如帮助用户收发电子邮件、浏览网页和访问流式媒体等。
音频输出单元503可以将射频单元501或网络模块502接收的或者在存储器509中存储的音频数据转换成音频信号并且输出为声音。而且,音频输出单元503还可以提供与终端500执行的特定功能相关的音频输出(例如,呼叫信号接收声音、消息接收声音等等)。音频输出单元503包括扬声器、蜂鸣器以及受话器等。
输入单元504用于接收音频或视频信号。输入单元504可以包括图形处理器(Graphics Processing Unit,GPU)5041和麦克风5042,图形处理器5041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示单元105上。经图形处理器5041处理后的图像帧可以存储在存储器509(或其它存储介质)中或者经由射频单元501或网络模块502进行发送。麦克风5042可以接收声音,并且能够将这样的声音处理为音频数据。处理后的音频数据可以在电话通话模式的情况下转换为可经由射频单元501发送到移动通信基站的格式输出。
终端500还包括至少一种传感器505,比如光传感器、运动传感器以及其他传感器。具体地,光传感器包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板5061的亮度,接近传感器可在终端500移动到耳边时,关闭显示面板5061和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别终端姿态(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;传感器505还可以包括指纹传感器、压力传感器、虹膜传感器、分子传感器、陀螺仪、气压计、湿度计、温度计、红外线传感器等,在此不再赘述。
显示单元506用于显示由用户输入的信息或提供给用户的信息。显示单元506可包括显示面板5061,可以采用液晶显示器(Liquid Crystal Display,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板5061。
用户输入单元507可用于接收输入的数字或字符信息,以及产生与终端的用户设置以及功能控制有关的键信号输入。具体地,用户输入单元507包括触控面板5071以及其他输入设备5072。触控面板5071,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板5071上或在触控面板5071附近的操作)。触控面板5071可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器510,接收处理器510发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板5071。除了触控面板5071,用户输入单元507还可以包括其他输入设备5072。具体地,其他输入设备5072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。
进一步的,触控面板5071可覆盖在显示面板5061上,当触控面板5071检测到在其上或附近的触摸操作后,传送给处理器510以确定触摸事件的类型,随后处理器510根据触摸事件的类型在显示面板5061上提供相应的视觉输出。虽然在图5中,触控面板5071与显示面板5061是作为两个独立的部件来实现终端的输入和输出功能,但是在某些实施例中,可以将触控面板5071与显示面板5061集成而实现终端的输入和输出功能,具体此处不做限定。
接口单元508为外部装置与终端500连接的接口。例如,外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(I/O)端口、视频I/O端口、耳机端口等等。接口单元508可以用于接收来自外部装置的输入(例如,数据信息、电力等等)并且将接收到的输入传输到终端500内的一个或多个元件或者可以用于在终端500和外部装置之间传输数据。
存储器509可用于存储软件程序以及各种数据。存储器509可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器509可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
处理器510是终端的控制中心,利用各种接口和线路连接整个终端的各个部分,通过运行或执行存储在存储器509内的软件程序和/或模块,以及调用存储在存储器509内的数据,执行终端的各种功能和处理数据,从而对终端进行整体监控。处理器510可包括一个或多个处理单元;优选的,处理器510可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作***、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器510中。
终端500还可以包括给各个部件供电的电源511(比如电池),优选的,电源511可以通过电源管理***与处理器510逻辑相连,从而通过电源管理***实现管理充电、放电、以及功耗管理等功能。
另外,终端500包括一些未示出的功能模块,在此不再赘述。
可选的,本发明实施例还提供一种终端,包括处理器510,存储器509,存储在存储器509上并可在所述处理器510上运行的计算机程序,该计算机程序被处理器510执行时实现上述关键点检测方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
可选的,本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述关键点检测方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random AccessMemory,简称RAM)、磁碟或者光盘等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本发明的保护之内。
Claims (12)
1.一种关键点检测方法,其特征在于,所述方法包括:
对于待检测图像对应的每张热力图,确定所述热力图中极值点及所述极值点的至少一个相邻点在所述待检测图像中对应的原始区域;每张所述热力图分别用于确定所述热力图的对应位置的关键点,所述热力图小于所述待检测图像;
基于所述原始区域,生成所述原始区域中每个像素点的概率值;所述概率值表示所述像素点为关键点的概率;
基于所有所述像素点的概率值,确定所述对应位置的关键点。
2.根据权利要求1所述的方法,其特征在于,所述确定所述热力图中极值点及所述极值点的至少一个相邻点在所述待检测图像中对应的原始区域之前,所述方法还包括:
基于预设的位置与相邻点数量及相对位置对应关系和所述极值点的对应位置,确定所述极值点的相邻点的数量及所述相邻点与所述极值点的相对位置;
基于所述相邻点的数量及所述相邻点与所述极值点的相对位置在所述热力图中进行选择,得到至少一个所述相邻点;
其中,所述对应关系是基于与各个位置中关键点的相对位置固定的点预先生成的。
3.根据权利要求1所述的方法,其特征在于,所述确定所述热力图中极值点及所述极值点的至少一个相邻点在所述待检测图像中对应的原始区域,包括:
获取所述待检测图像与所述热力图的宽高比例;
基于所述宽高比例,分别将所述极值点及每个所述相邻点映射至所述待检测图像中,得到所述极值点在所述待检测图像中对应的子区域及每个所述相邻点在所述待检测图像中对应的子区域;
将所有所述子区域组成的区域,确定为所述原始区域。
4.根据权利要求1至3中任一所述的方法,其特征在于,所述基于所述原始区域,生成所述原始区域中每个像素点的概率值,包括:
将所述原始区域作为预训练的目标高斯混合模型的输入,并基于所述目标高斯混合模型,生成所述原始区域中每个像素点的概率值;
其中,所述目标高斯混合模型是以样本图像及所述样本图像中预设位置的关键点作为训练数据训练得到的,所述预设位置与所述热力图的对应位置相匹配。
5.根据权利要求4所述的方法,其特征在于,所述原始区域由所述极值点在所述待检测图像中对应的子区域及所述相邻点在所述待检测图像中对应子区域组成;
所述基于所述目标高斯混合模型,生成所述原始区域中每个像素点的概率值,包括:
对于每个所述子区域,从所述子区域中选取一个像素点的坐标值作为所述子区域对应的坐标值;
将每个所述子区域对应的坐标值,确定为所述子区域在所述目标高斯混合模型中对应的子高斯分布的中心值;
基于每个子高斯分布的中心值、期望值、标准差及权重,生成每个子区域中每个像素点的概率值;
其中,所述目标高斯混合模型中包含的子高斯分布的个数与所述原始区域包含的子区域的个数相同。
6.根据权利要求5所述的方法,其特征在于,所述从所述子区域中选取一个像素点的坐标值作为所述子区域对应的坐标值,包括:
按照指定的坐标建立方式,在所述待检测图像中建立参考坐标系;
确定所述子区域的中心位置的像素点在所述参考坐标系中的坐标值,得到所述子区域对应的坐标值。
7.根据权利要求4所述的方法,其特征在于,所述将所述原始区域作为预训练的目标高斯混合模型的输入,并基于所述目标高斯混合模型,生成所述原始区域中每个像素点的概率值之前,所述方法还包括:
基于所述样本图像及所述样本图像中预设位置的关键点进行训练,以获取所述目标高斯混合模型。
8.根据权利要求7所述的方法,其特征在于,所述基于所述样本图像及所述样本图像中预设位置的关键点进行训练,以获取所述目标高斯混合模型,包括:
对于每帧所述样本图像,确定所述样本图像的热力图中极值点及所述极值点的至少一个相邻点在所述样本图像中对应的样本区域;所述样本图像的热力图的对应位置为所述预设位置;
基于初始高斯混合模型,确定每帧所述样本图像的所述样本区域中的关键点,得到预测关键点点云;
基于所述样本图像对应真实关键点点云及所述预测关键点点云,确定所述初始高斯混合模型的误差值;
基于所述误差值对所述初始高斯混合模型中的参数进行调整,直至所述误差值小于预设阈值,得到所述目标高斯混合模型。
9.根据权利要求8所述的方法,其特征在于,所述确定所述样本图像的热力图中极值点及所述极值点的至少一个相邻点在所述样本图像中对应的样本区域,包括:
获取所述样本图像与所述热力图的宽高比例;
基于所述宽高比例,分别将所述极值点及每个所述相邻点映射至所述样本图像中,得到所述极值点在所述样本图像中对应的子区域及每个所述相邻点在所述样本图像中对应的子区域;
将所有样本图像中对应的子区域所组成的区域,确定为所述样本区域。
10.根据权利要求1所述的方法,其特征在于,所述待检测图像为待检测视频中包含的N帧连续视频图像;
所述N为大于2的整数。
11.一种关键点检测装置,其特征在于,所述装置包括:
第一确定模块,用于对于待检测图像对应的每张热力图,确定所述热力图中极值点及所述极值点的至少一个相邻点在所述待检测图像中对应的原始区域;每张所述热力图分别用于确定所述热力图的对应位置的关键点,所述热力图小于所述待检测图像;
生成模块,用于基于所述原始区域,生成所述原始区域中每个像素点的概率值;所述概率值表示所述像素点为关键点的概率;
第二确定模块,用于基于所有所述像素点的概率值,确定所述对应位置的关键点。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如权利要求1至10任一所述的关键点检测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911424797.7A CN111223143B (zh) | 2019-12-31 | 2019-12-31 | 关键点检测方法、装置及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911424797.7A CN111223143B (zh) | 2019-12-31 | 2019-12-31 | 关键点检测方法、装置及计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111223143A true CN111223143A (zh) | 2020-06-02 |
CN111223143B CN111223143B (zh) | 2023-04-11 |
Family
ID=70825964
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911424797.7A Active CN111223143B (zh) | 2019-12-31 | 2019-12-31 | 关键点检测方法、装置及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111223143B (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111860300A (zh) * | 2020-07-17 | 2020-10-30 | 广州视源电子科技股份有限公司 | 一种关键点检测方法、装置、终端设备及存储介质 |
CN111950419A (zh) * | 2020-08-03 | 2020-11-17 | 中国民用航空华东地区空中交通管理局 | 图像信息预测方法、装置、计算机设备和存储介质 |
CN111985556A (zh) * | 2020-08-19 | 2020-11-24 | 南京地平线机器人技术有限公司 | 关键点识别模型的生成方法和关键点识别方法 |
CN112200862A (zh) * | 2020-12-01 | 2021-01-08 | 北京达佳互联信息技术有限公司 | 目标检测模型的训练方法、目标检测方法及装置 |
CN113128436A (zh) * | 2021-04-27 | 2021-07-16 | 北京百度网讯科技有限公司 | 关键点的检测方法和装置 |
CN113220748A (zh) * | 2021-05-21 | 2021-08-06 | 国网江苏省电力有限公司镇江供电分公司 | 一种构建配电网设备负荷热力图及数据分析的方法和*** |
CN113947635A (zh) * | 2021-10-15 | 2022-01-18 | 北京百度网讯科技有限公司 | 图像定位方法、装置、电子设备以及存储介质 |
CN114299037A (zh) * | 2021-12-30 | 2022-04-08 | 广州极飞科技股份有限公司 | 一种对象检测结果的质量评估方法、装置、电子设备及计算机可读存储介质 |
CN114463534A (zh) * | 2021-12-28 | 2022-05-10 | 佳都科技集团股份有限公司 | 一种目标关键点检测方法、装置、设备及存储介质 |
WO2022257120A1 (zh) * | 2021-06-11 | 2022-12-15 | 华为技术有限公司 | 瞳孔位置的确定方法、装置及*** |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105701832A (zh) * | 2016-01-19 | 2016-06-22 | 苏州大学 | 三维图割算法结合随机游走算法的pet‐ct肺肿瘤分割方法 |
CN109101919A (zh) * | 2018-08-03 | 2018-12-28 | 北京字节跳动网络技术有限公司 | 用于生成信息的方法和装置 |
CN109522910A (zh) * | 2018-12-25 | 2019-03-26 | 浙江商汤科技开发有限公司 | 关键点检测方法及装置、电子设备和存储介质 |
CN109858333A (zh) * | 2018-12-20 | 2019-06-07 | 腾讯科技(深圳)有限公司 | 图像处理方法、装置、电子设备及计算机可读介质 |
-
2019
- 2019-12-31 CN CN201911424797.7A patent/CN111223143B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105701832A (zh) * | 2016-01-19 | 2016-06-22 | 苏州大学 | 三维图割算法结合随机游走算法的pet‐ct肺肿瘤分割方法 |
CN109101919A (zh) * | 2018-08-03 | 2018-12-28 | 北京字节跳动网络技术有限公司 | 用于生成信息的方法和装置 |
CN109858333A (zh) * | 2018-12-20 | 2019-06-07 | 腾讯科技(深圳)有限公司 | 图像处理方法、装置、电子设备及计算机可读介质 |
CN109522910A (zh) * | 2018-12-25 | 2019-03-26 | 浙江商汤科技开发有限公司 | 关键点检测方法及装置、电子设备和存储介质 |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111860300A (zh) * | 2020-07-17 | 2020-10-30 | 广州视源电子科技股份有限公司 | 一种关键点检测方法、装置、终端设备及存储介质 |
CN111950419A (zh) * | 2020-08-03 | 2020-11-17 | 中国民用航空华东地区空中交通管理局 | 图像信息预测方法、装置、计算机设备和存储介质 |
CN111985556A (zh) * | 2020-08-19 | 2020-11-24 | 南京地平线机器人技术有限公司 | 关键点识别模型的生成方法和关键点识别方法 |
CN112200862A (zh) * | 2020-12-01 | 2021-01-08 | 北京达佳互联信息技术有限公司 | 目标检测模型的训练方法、目标检测方法及装置 |
CN112200862B (zh) * | 2020-12-01 | 2021-04-13 | 北京达佳互联信息技术有限公司 | 目标检测模型的训练方法、目标检测方法及装置 |
CN113128436B (zh) * | 2021-04-27 | 2022-04-01 | 北京百度网讯科技有限公司 | 关键点的检测方法和装置 |
CN113128436A (zh) * | 2021-04-27 | 2021-07-16 | 北京百度网讯科技有限公司 | 关键点的检测方法和装置 |
CN113220748A (zh) * | 2021-05-21 | 2021-08-06 | 国网江苏省电力有限公司镇江供电分公司 | 一种构建配电网设备负荷热力图及数据分析的方法和*** |
CN113220748B (zh) * | 2021-05-21 | 2023-10-27 | 国网江苏省电力有限公司镇江供电分公司 | 一种构建配电网设备负荷热力图及数据分析的方法和*** |
WO2022257120A1 (zh) * | 2021-06-11 | 2022-12-15 | 华为技术有限公司 | 瞳孔位置的确定方法、装置及*** |
CN113947635A (zh) * | 2021-10-15 | 2022-01-18 | 北京百度网讯科技有限公司 | 图像定位方法、装置、电子设备以及存储介质 |
CN114463534A (zh) * | 2021-12-28 | 2022-05-10 | 佳都科技集团股份有限公司 | 一种目标关键点检测方法、装置、设备及存储介质 |
CN114299037A (zh) * | 2021-12-30 | 2022-04-08 | 广州极飞科技股份有限公司 | 一种对象检测结果的质量评估方法、装置、电子设备及计算机可读存储介质 |
CN114299037B (zh) * | 2021-12-30 | 2023-09-01 | 广州极飞科技股份有限公司 | 一种对象检测结果的质量评估方法、装置、电子设备及计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111223143B (zh) | 2023-04-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111223143B (zh) | 关键点检测方法、装置及计算机可读存储介质 | |
CN111260665B (zh) | 图像分割模型训练方法和装置 | |
CN111602139A (zh) | 图像处理方法、装置、控制终端及可移动设备 | |
CN108683850B (zh) | 一种拍摄提示方法及移动终端 | |
CN107730460B (zh) | 一种图像处理方法及移动终端 | |
CN111031234B (zh) | 一种图像处理方法及电子设备 | |
US20230014409A1 (en) | Detection result output method, electronic device and medium | |
CN109727212B (zh) | 一种图像处理方法及移动终端 | |
CN111031178A (zh) | 一种视频流裁剪方法及电子设备 | |
CN110908517B (zh) | 图像编辑方法、装置、电子设备及介质 | |
CN109639981B (zh) | 一种图像拍摄方法及移动终端 | |
CN109104573B (zh) | 一种确定对焦点的方法及终端设备 | |
CN111091519A (zh) | 一种图像处理方法及装置 | |
CN111405361B (zh) | 一种视频获取方法、电子设备及计算机可读存储介质 | |
CN111061407B (zh) | 视频程序的操作控制方法、电子设备及存储介质 | |
CN110602384B (zh) | 曝光控制方法及电子设备 | |
CN111402271A (zh) | 一种图像处理方法及电子设备 | |
CN111314639A (zh) | 一种视频录制方法及电子设备 | |
CN115240250A (zh) | 模型训练方法、装置、计算机设备及可读存储介质 | |
CN111276142B (zh) | 一种语音唤醒方法及电子设备 | |
CN109257543B (zh) | 拍摄模式控制方法及移动终端 | |
CN109389561B (zh) | 一种成像方法及装置 | |
CN109194943B (zh) | 一种图像处理方法及终端设备 | |
CN111563838A (zh) | 图像处理方法及电子设备 | |
CN112308771A (zh) | 一种图像处理方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20231007 Address after: 31a, 15th floor, building 30, maple commercial city, bangrang Road, Brazil Patentee after: Baiguoyuan Technology (Singapore) Co.,Ltd. Address before: 511400 floor 5-13, West Tower, building C, 274 Xingtai Road, Shiqiao street, Panyu District, Guangzhou City, Guangdong Province Patentee before: GUANGZHOU BAIGUOYUAN INFORMATION TECHNOLOGY Co.,Ltd. |