CN118172750A - 人物识别方法及相关设备 - Google Patents
人物识别方法及相关设备 Download PDFInfo
- Publication number
- CN118172750A CN118172750A CN202211585080.2A CN202211585080A CN118172750A CN 118172750 A CN118172750 A CN 118172750A CN 202211585080 A CN202211585080 A CN 202211585080A CN 118172750 A CN118172750 A CN 118172750A
- Authority
- CN
- China
- Prior art keywords
- area
- target
- region
- width
- expected
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 230000008859 change Effects 0.000 claims abstract description 80
- 230000015654 memory Effects 0.000 claims description 17
- 238000004590 computer program Methods 0.000 claims description 9
- 238000012360 testing method Methods 0.000 claims description 9
- 238000004422 calculation algorithm Methods 0.000 claims description 7
- 238000013135 deep learning Methods 0.000 claims description 4
- 210000000746 body region Anatomy 0.000 abstract description 36
- 238000003062 neural network model Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 9
- 238000001514 detection method Methods 0.000 description 6
- 230000008439 repair process Effects 0.000 description 5
- 238000012549 training Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 4
- 230000011218 segmentation Effects 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000000737 periodic effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 235000019800 disodium phosphate Nutrition 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/60—Analysis of geometric attributes
- G06T7/62—Analysis of geometric attributes of area, perimeter, diameter or volume
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/7715—Feature extraction, e.g. by transforming the feature space, e.g. multi-dimensional scaling [MDS]; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/776—Validation; Performance evaluation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/103—Static body considered as a whole, e.g. static pedestrian or occupant recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Computing Systems (AREA)
- Human Computer Interaction (AREA)
- Geometry (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Biology (AREA)
- Data Mining & Analysis (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
本申请提供一种人物识别方法及相关设备,所述方法包括:从获取的图像中识别每个人物对应的人物区域;根据人物区域的长度与预设的长度占比,将人物区域划分为多个目标区域;识别多个目标区域对应的多个宽度,确定第一目标宽度变化关系;在第一目标宽度变化关系与预设的标准宽度变化关系不匹配时,确定对人物的识别不完整。本申请能够提高图像识别中对于人体区域识别的精确度。
Description
技术领域
本申请涉及图像识别技术领域,尤其涉及一种人物识别方法及相关设备。
背景技术
在车辆行驶的过程中,行人作为车辆障碍物之一,需要准确的识别以及避让,才能避免对行人造成危险。目前,通常采用目标检测技术,即,通过建立神经网络模型进行检测,但这类方法需要消耗大量的算力和时间成本对神经网络模型进行训练,并且,由于神经网络模型的训练是周期性地,因此,如果神经网络模型的训练与更新不足,会导致无法准确识别道路中的行人,必然会产生危险。
发明内容
本申请实施例公开了一种人物识别方法及相关设备,能够解决基于图像进行人物识别时存在对人体区域识别不精确的技术问题。
本申请提供一种人物识别方法,所述方法包括:从获取的图像中识别每个人物对应的人物区域;根据所述人物区域的长度与预设的长度占比,将所述人物区域划分为多个目标区域;识别所述多个目标区域对应的多个宽度,确定第一目标宽度变化关系;在所述第一目标宽度变化关系与预设的标准宽度变化关系不匹配时,确定对所述人物的识别不完整。
在一些可选的实施例中,在所述确定所述人物区域不完整以后,所述方法还包括:利用预设的深度学习算法对所述人物区域进行修复,得到修复后的人物区域;根据所述修复后的人物区域的长度以及所述长度占比,将所述修复后的人物区域划分为多个预期区域;识别所述多个预期区域对应的多个宽度,确定第二目标宽度变化关系;若所述第二目标宽度变化关系与所述标准宽度变化关系匹配,确定所述修复后的人物区域为所述人物的识别结果;若所述第二目标宽度变化关系与所述标准宽度变化关系不匹配,确定所述人物区域为所述人物的识别结果。
在一些可选的实施例中,所述标准变化关系,包括:获取多个测试人员对应的多个测试图像;将所述多个测试图像输入预设的识别模型,得到所述多个测试图像中所述测试人员的人体区域;对所述人体区域进行划分,将包含所述测试人员头部的区域作为第一人体区域,将不包含所述测试人员头部的上半身区域作为第二人体区域、将所述测试人员的下半身区域作为第三人体区域;获取所述第一人体区域对应的宽度、所述第二人体区域对应的宽度以及所述第三人体区域对应的宽度;基于所述第一人体区域对应的宽度、所述第二人体区域对应的宽度以及所述第三人体区域对应的宽度,确定所述标准宽度变化关系。
在一些可选的实施例中,所述第一人体区域对应的宽度小于所述第二人体区域对应的宽度和所述第三人体区域对应的宽度;所述第二人体区域对应的宽度大于所述第三人体区域对应的宽度。
在一些可选的实施例中,所述多个目标区域包括第一目标区域、第二目标区域以及第三目标区域,所述根据所述人物区域的长度与预设的长度占比,将所述人物区域划分为多个目标区域,包括:识别所述人物区域的长度;基于所述人物区域的长度与预设的长度占比,将所述人物区域划分为所述第一目标区域、所述第二目标区域以及所述第三目标区域,其中,所述第一目标区域的长度占比小于所述第二目标区域以及所述第三目标区域,所述第二目标区域的长度占比大于所述第三目标区域。
在一些可选的实施例中,所述确定所述人物区域不完整,包括:识别所述第一目标区域对应的宽度、所述第二目标区域对应的宽度以及所述第三目标区域对应的宽度;若所述第一目标区域对应的宽度大于或等于所述第二目标区域对应的宽度,且所述第一目标区域对应的宽度大于所述第三目标区域对应的宽度,确定所述第一目标宽度变化关系与所述标准宽度变化关系不匹配。
在一些可选的实施例中,所述多个预期区域包括第一预期区域、第二预期区域以及第三预期区域,所述根据所述修复后的人物区域的长度以及所述长度占比,将所述修复后的人物区域划分为多个预期区域,包括:识别所述修复后的人物区域的长度;基于所述修复后的人物区域的长度以及所述预设的长度占比,将所述修复后的人物区域划分为所述第一预期区域、所述第二预期区域以及所述第三预期区域,其中,所述第一预期区域的长度占比小于所述第二预期区域以及所述第三预期区域,所述第二预期区域的长度占比大于所述第三预期区域。
在一些可选的实施例中,所述确定所述修复后的人物区域为所述人物的识别结果,包括:识别所述第一预期区域对应的宽度、所述第二预期区域对应的宽度以及所述第三预期区域对应的宽度;若所述第一预期区域对应的宽度小于所述第二预期区域对应的宽度,且所述第二预期区域的宽度大于所述第三预期区域的宽度,确定所述第二目标宽度变化关系与所述标准宽度变化关系匹配。
本申请还提供一种电子设备,所述电子设备包括处理器和存储器,所述处理器用于执行所述存储器中存储的计算机程序时实现所述的人物识别方法。
本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现所述的人物识别方法。
在本申请提供的人物识别方法中,将识别出来的人物区域划分为多个目标区域,为精准地识别人物区域提供了基础,进一步地,通过识别多个目标区域对应的多个宽度,确定第一目标宽度变化关系,并将第一目标宽度变化关系与标准宽度变化关系进行匹配,能够提高识别人体区域的精确度。
附图说明
图1是本申请一实施例提供的电子设备的示意图。
图2是本申请一实施例提供的人物识别方法的流程图。
图3是本申请一实施例提供的划分人物区域的示意图。
图4是本申请一实施例提供的划分人物区域的示意图。
图5是本申请一实施例提供的多个目标区域对应的多个宽度的示意图。
图6是本申请一实施例提供的对不完整的人物区域进行修改的流程图。
图7是本申请一实施例提供的修复后的人物区域的示意图。
具体实施方式
为了便于理解,示例性的给出了部分与本申请实施例相关概念的说明以供参考。
需要说明的是,本申请中“至少一个”是指一个或者多个,“多个”是指两个或多于两个。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B可以表示:单独存在A,同时存在A和B,单独存在B的情况,其中A,B可以是单数或者复数。本申请的说明书和权利要求书及附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不是用于描述特定的顺序或先后次序。
在车辆行驶的过程中,行人作为车辆障碍物之一,需要准确的识别以及避让,才能避免对行人造成危险。目前,通常采用目标检测技术,即,通过建立神经网络模型进行检测,但这类方法需要消耗大量的算力和时间成本对神经网络模型进行训练,并且,由于神经网络模型的训练是周期性地,因此,如果神经网络模型的训练与更新不足,会导致无法准确识别道路中的行人,必然会产生危险。
为了解决基于图像进行人物识别时存在对人体区域识别不精确的技术问题,以及能更好地理解本申请实施例提供的人物识别方法及相关设备,下面首先对本申请人物识别方法的应用场景进行描述。
图1是本申请实施例提供的电子设备的示意图。本申请实施例提供的人物识别方法应用于电子设备1中,所述电子设备1包括,但不限于,互相之间通过通信总线10连接的存储器11、至少一个处理器12以及拍摄装置13,所述拍摄装置13可以是车辆的车载拍摄设备、外接车辆的摄像设备,例如,摄像头或行车记录仪,以拍摄车辆前方的多个图像或视频。
在本申请实施例中,所述电子设备1可以应用于交通工具中,例如,可以是车辆中的车载装置(例如,车机),也可以是独立的车载装置(例如,计算机、笔记本电脑、手机等)并且能够与车载设备进行通信与数据交互,从而实现对车辆的控制。
图1仅仅是电子设备1的示例,并不构成对电子设备1的限定,实际应用中的电子设备1可以包括比图示更多或更少的部件,或者组合某些部件,或者替换不同的部件,例如所述电子设备1还可以包括输入输出设备、网络接入设备等。
如图2所示,是本申请实施例提供的人物识别方法的流程图。本申请所述的人物识别方法应用在电子设备(例如图1的电子设备1)中。根据不同的需求,该流程图中步骤的顺序可以改变,某些步骤可以省略。
S21,从获取的图像中识别每个人物对应的人物区域。
在本申请的实施例中,利用车辆的拍摄装置(例如,单目相机)可以拍摄车辆周围不同时刻的多个图像,在通过拍摄装置拍摄到车辆外场景的图像中,将拍摄到的RGB图像作为单幅图像。
将拍摄得到的图像输入预设的神经网络模型,比如,利用长短期记忆网络(LongShort-Term Memory,LSTM)、循环神经网络(Recurrent Neural Network,RNN)、卷积神经网络(Convolutional Neural Networks,CNN)中任意一种或两种训练得到的神经网络模型,在一些示例中,该神经网络模型可以是实例分割模型(Instance Segmentation),能够分割出不同对象的实例,其中,不同对象可以是不同的人物。
利用实例分割模型对拍摄到的图像进行处理,对图像中的人物进行识别,并且将识别出的人物用掩膜进行覆盖,其中,掩膜(Mask)也称为掩蔽,表示用选定的图像、图形或物体对待处理的图像(全部或局部)进行遮挡。
将利用掩膜覆盖的图像中人物的区域作为人物区域,每个人物对应一个人物区域,可以同时获取多个人物区域,并且利用不同的掩膜对人物区域进行覆盖。
S22,根据人物区域的长度与预设的长度占比,将人物区域划分为多个目标区域。
在本申请的实施例中,在获取到图像中的人物区域以后,可以测量或计算每个人物区域对应的长度,根据测量或计算得到的长度分别对每个人物区域进行划分,可以根据预设的长度占比将人物区域划分为多个目标区域。
图3是本申请一实施例提供的划分人物区域的示意图,如图3所示,对图像中的任意一个掩膜区域(即人物区域)进行划分,假设将人物区域划分为多个目标区域,例如,三个目标区域,包括第一目标区域、第二目标区域以及第三目标区域,可以预先设置长度占比为2:5:3,基于人物区域的长度D以及长度占比2:5:3,得到第一目标区域A1、第二目标区域A2以及第三目标区域A3,其中,第一目标区域A1的长度占比小于第二目标区域A2以及第三目标区域A3的长度占比,第二目标区域A2的长度占比大于第三目标区域A3的长度占比。
在另一些实施例中,预先设置的长度占比还可以设置为2:6:2,即,第一目标区域A1与第三目标区域A3对应的长度占比可以相等,第一目标区域A1和第三目标区域A3的长度占比小于第二目标区域A2的长度占比。
图4是本申请另一实施例提供的划分人物区域的示意图,如图4所示,假设将人物区域划分为两个目标区域,包括第一目标区域、第二目标区域,可以预先设置长度占比为2:8,基于人物区域的长度D以及长度占比2:8,得第一目标区域A4以及第二目标区域A5。
以上只是示例性地举例说明,实际应用中也可以将人物区域划分为四部分或更多的部分,长度占比也可以根据实际需要进行调整,本申请实施例对此不作限定。
S23,识别多个目标区域对应的多个宽度,确定第一目标宽度变化关系。
在本申请实施例中,将人物区域划分为多个目标区域以后,测量或计算每个目标区域对应的宽度,在测量每个目标区域对应的宽度的过程中,可以沿着同一方向测量每个目标区域对应的宽度,获取每个目标区域在该方向下对应的最宽的距离作为每个目标区域对应的宽度。
在一些示例中,可以将人物区域划分为第一目标区域、第二目标区域以及第三目标区域,可以计算第一目标区域对应的宽度、第二目标区域对应的宽度以及第三目标区域对应的宽度,还可以利用图像目标检测算法识别第一目标区域对应的宽度、第二目标区域对应的宽度以及第三目标区域对应的宽度,具体为:采用图像目标检测算法获取边缘图中相对应的轮廓线,该轮廓线对应多个轮廓值,利用欧几里距离计算图像左侧轮廓值与图像右侧轮廓值之间的距离。
图5是本申请实施例提供的多个目标区域对应的多个宽度的示意图。
如图5所示,根据预设的长度占比,例如2:5:3,将人物区域长度D划分为第一目标区域A1、第二目标区域A2、以及第三目标区域A3以后,可以在同一方向下测量第一目标区域A1对应的宽度、第二目标区域A2对应的宽度以及第三目标区域A3对应的宽度,得到宽度B1、B2以及B3。
根据得到的第一目标区域对应的宽度、第二目标区域对应的宽度以及第三目标区域对应的宽度,确定第一目标宽度变化关系。
具体地,在得到第一目标区域对应的宽度、第二目标区域对应的宽度以及第三目标区域对应的宽度以后,比较第一目标区域对应的宽度、第二目标区域对应的宽度以及第三目标区域对应的宽度的大小,将从第一目标区域对应的宽度至第三目标区域对应的宽度的大小变化关系作为第一目标宽度变化关系。
例如,在一些示例中,第一目标区域A1对应的宽度B1为2mm,第二目标区域A2对应的宽度B2为15mm,第三目标区域A3对应的宽度B3为7mm,即宽度的变化关系为2mm→15mm→7mm,即从第一小宽度变化至大宽度,再从大宽度变化至第二小宽度,其中,第一小宽度小于第二小宽度。
在另一些示例中,目标区域包括第一目标区域和第二目标区域,则第一目标宽度变化关系为从小宽度变化至大宽度。
以上只是示例性地,根据多个目标区域对应的宽度,可以得到多个目标区域对应的第一目标宽度变化关系。
S24,在第一目标宽度变化关系与预设的标准宽度变化关系不匹配时,确定对人物的识别不完整。
在本申请实施例中,在将第一目标宽度变化关系与预设的标准变化关系进行比对之前,通过对测试人员对应的测试图片进行分析,建立标准变化关系。
具体地,可以获取多个测试人员对应的多个测试图像,每个测试人员的人体比例可以不同,利用实例分割模型,采用掩膜的方式确定测试图像中的感兴趣区域,即人体区域。对获取到的人体区域进行划分,基于人体比例,将包含测试人员头部的区域作为第一人体区域,将不包含测试人员头部的上半身区域作为第二人体区域,将测试人员的下半身区域作为第三人体区域。
分别测量第一人体区域对应的宽度、第二人体区域对应的宽度以及第三人体区域对应的宽度,其中,测量每个区域的测量方向一致,并且选取每个测量区域最宽的距离作为相应的宽度。根据测量得到的第一人体区域对应的宽度、第二人体区域对应的宽度以及第三人体区域对应的宽度,确定标准宽度变化关系。
例如,在一些示例中,第一人体区域对应的宽度为2mm、第二人体区域对应的宽度为15mm、第三人体区域对应的宽度为7mm,则标准宽度变化关系为从第一人体区域对应的宽度变化至第二人体区域对应的宽度,再从第二人体区域对应的宽度变化至第三人体区域对应的宽度,其中,第一人体区域对应的宽度小于第二人体区域对应的宽度以及第三人体区域对应的宽度,第二人体区域对应的宽度大于第三人体区域对应的宽度,即,标准宽度变化关系为小大小的关系。
在另一些实施例中,可以将人体区域划分为包含头部的第一人体区域以及不包含头部的第二人体区域,分别测量第一人体区域的宽度以及第二人体区域的宽度,根据测量得到的宽度,确定标准宽度变化关系。例如,第一人体区域对应的宽度2mm,第二人体区域对应的宽度为15mm,则标准宽度变化关系为从小宽度变化至大宽度的关系。
以上只是示例性地,可以根据实际的需要,将人体区域划分为多个区域,根据多个区域的宽度,确定相应的标准宽度变化关系。
在确定标准变化关系以后,将第一目标宽度变化关系与标准变化关系进行比对。例如,人物区域对应的多个目标区域包括第一目标区域、第二目标区域以及第三目标区域,其中,第一目标区域对应的宽度大于或等于第二目标区域的对应的宽度,且第一目标区域对应的宽度大于第三目标区域对应的宽度,即第一目标宽度变化关系为从大宽度变化至小宽度,标准宽度变化关系为从小大小的关系,因此,第一目标宽度变化关系与标准变化关系不匹配,表明人物区域不存在包含头部对应的区域,确定对人物的识别不完整。如果第一目标区域对应的宽度小于第二目标区域对应的宽度,且第二目标区域对应的宽度大于第三目标区域的宽度,第一目标区域的宽度小于第三目标区域的宽度,第一目标宽度变化关系与标准变化关系匹配,表明人物区域存在包含头部对应的区域,确定能完整的识别人物。
在一些具体的示例中,为了判断识别到的人物区域的头部区域是否完整,可以针对第一目标区域和第二目标区域进行分析,具体为:在判断的过程中,第一目标区域小于第二目标区域,第一目标区域可以等于或小于第三目标区域,可以表明第一目标宽度变化关系与标准变化关系匹配。
在确定对人物区域识别不完整以后,可以对不完整的人物区域进行修复。
图6是本申请实施例提供的对不完整的人物区域进行修改的流程图,如图6所示,包括以下步骤:
S61,利用预设的深度学习算法对人物区域进行修复,得到修复后的人物区域。
在本申请的实施例中,由于人物的像素与周围环境的像素不一致,即人物的亮度信息与周围环境的亮度信息不一致,可以利用预设的深度学习算法对人物区域进行修复,具体地:通过结合编码-解码(Encoder-Decoder)网络结构和生成对抗网络(GenerativeAdversarialNetworks,GAN),利用L2损失函数(Reconstruction Loss)和对抗损失函数(Adversarial Loss)来修复图像,Encoder-Decoder结构用来学习全局图像特征,全局图像特征包括颜色特征、纹理特征和形状特征,基于全局图像特征修复图像的损失部分,GAN部分用来判断推断出的图片和预先设置的标准图片是否一致。
图7是本申请实施例提供的修复后的人物区域的示意图,如图7所示,修复后的区域如图7中的C部分。
S62,根据修复后的人物区域的长度以及长度占比,将修复后的人物区域划分为多个预期区域。
在本申请的实施例中,识别修复后的人物区域的长度,预先对修复后的人物区域的长度设置长度占比,根据修复后的人物区域的长度以及长度占比,可以将修复后的人物区域划分为多个预期区域,例如,三个目标区域,则对应的长度占比可以是2:5:3。
在一些示例中,多个预期区域包括第一预期区域、第二预期区域以及第三预期区域,根据预设的长度占比对修复后的人物区域进行划分,例如,长度占比为2:5:3,即,第一预期区域的长度占比小于第二预期区域的长度占比以及第三预期区域的长度占比,第二预期区域的长度占比大于第三预期区域的长度占比。
S63,识别多个预期区域对应的多个宽度,确定第二目标宽度变化关系。
在本申请的实施例中,在将修复后的人物区域划分为第一预期区域、第二预期区域以及第三预期区域以后,通过测量或利用识别算法,确定第一预期区域对应的宽度、第二预期区域对应的宽度以及第三预期区域对应的宽度。
比对第一预期区域的宽度、第二预期区域的宽度以及第三预期区域的宽度,确定第二目标宽度变化关系。
例如,在一些示例中,第一预期区域的宽度为2mm、第二预期区域的宽度为15mm、第三预期区域的宽度为7mm,则第二目标宽度变化关系为从小宽度变化至大宽度,再从大宽度变化至小宽度的关系。
S64,比对第二目标宽度变化关系与标准宽度变化关系是否匹配。
为了判断修复后的人物区域是否符合预期,将第二目标宽度变化关系与标准宽度变化关系进行比对,其中,标准宽度变化关系可以参照上述步骤S24,在此不再重复描述。
S65,若第二目标宽度变化关系与标准宽度变化关系匹配,确定修复后的人物区域为人物的识别结果。
在本申请的实施例中,假设第一预期区域的宽度为2mm、第二预期区域的宽度为15mm、第三预期区域的宽度为7mm,即,第一预期区域的宽度小于第二预期区域的宽度,且第二预期区域的宽度大于第三预期区域的宽度,表明第二目标宽度变化关系与标准宽度变化关系匹配,保留对人物区域的修复,将修复后的人物区域作为对人物的识别结果。
S66,若第二目标宽度变化关系与标准宽度变化关系不匹配,确定人物区域为人物的识别结果。
在本申请的实施例中,假设第一预期区域的宽度为15mm、第二预期区域的宽度为12mm、第三预期区域的宽度为7mm,即,第一预期区域的宽度大于第二预期区域的宽度,且第二预期区域的宽度大于第三预期区域的宽度,表明第二目标宽度变化关系与标准宽度变化关系不匹配,即对人物区域的修复不符合预期,不保留对人物区域的修复,将修复前的人物区域作为对人物的识别结果。其中,第一预期区域的宽度大于第二预期区域的宽度,假设第一预期区域是对人物头部的修复,根据标准宽度关系,第一预期区域的宽度应小于第二预期区域的宽度,如果第一预期区域的宽度大于第二预期区域的宽度,表明修复后的人物区域不符合人体比例。
本申请能够预先设置一个标准宽度变化关系,并对识别到的人物区域进行划分以及获取每个划分区域的宽度变化,通过与标准宽度变化关系进行比对,确定识别到的人物区域是否完整,提高了识别人物的精准度,避免出现人物区域抓取不完整的情况,当应用在车辆驾驶领域中时,可以提高识别行人的准确度,提高车辆行驶的安全性。
请继续参阅图1,本实施例中,所述存储器11可以是电子设备1的内部存储器,即内置于所述电子设备1的存储器。在其他实施例中,所述存储器11也可以是电子设备1的外部存储器,即外接于所述电子设备1的存储器。
在一些实施例中,所述存储器11用于存储程序代码和各种数据,并在电子设备1的运行过程中实现高速、自动地完成程序或数据的存取。
所述存储器11可以包括随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘、智能存储卡(Smart Media Card,SMC)、安全数字(Secure Digital,SD)卡、闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
在一实施例中,所述处理器12可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件物料等。通用处理器可以是微处理器或者所述处理器也可以是其它任何常规的处理器等。
所述存储器11中的程序代码和各种数据如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,例如人物识别方法,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于计算机可读存储介质中,所述计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)等。
可以理解的是,以上所描述的模块划分,为一种逻辑功能划分,实际实现时可以有另外的划分方式。另外,在本申请各个实施例中的各功能模块可以集成在相同处理单元中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在相同单元中。上述集成的模块既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
最后应说明的是,以上实施例仅用以说明本申请的技术方案而非限制,尽管参照较佳实施例对本申请进行了详细说明,本领域的普通技术人员应当理解,可以对本申请的技术方案进行修改或等同替换,而不脱离本申请技术方案的精神和范围。
Claims (10)
1.一种人物识别方法,其特征在于,所述方法包括:
从获取的图像中识别每个人物对应的人物区域;
根据所述人物区域的长度与预设的长度占比,将所述人物区域划分为多个目标区域;
识别所述多个目标区域对应的多个宽度,确定第一目标宽度变化关系;
在所述第一目标宽度变化关系与预设的标准宽度变化关系不匹配时,确定对所述人物的识别不完整。
2.根据权利要求1所述的人物识别方法,其特征在于,在所述确定所述人物区域不完整以后,所述方法还包括:
利用预设的深度学习算法对所述人物区域进行修复,得到修复后的人物区域;
根据所述修复后的人物区域的长度以及所述长度占比,将所述修复后的人物区域划分为多个预期区域;
识别所述多个预期区域对应的多个宽度,确定第二目标宽度变化关系;
若所述第二目标宽度变化关系与所述标准宽度变化关系匹配,确定所述修复后的人物区域为所述人物的识别结果;
若所述第二目标宽度变化关系与所述标准宽度变化关系不匹配,确定所述人物区域为所述人物的识别结果。
3.根据权利要求1所述的人物识别方法,其特征在于,所述标准变化关系,包括:
获取多个测试人员对应的多个测试图像;
将所述多个测试图像输入预设的识别模型,得到所述多个测试图像中所述测试人员的人体区域;
对所述人体区域进行划分,将包含所述测试人员头部的区域作为第一人体区域,将不包含所述测试人员头部的上半身区域作为第二人体区域、将所述测试人员的下半身区域作为第三人体区域;
获取所述第一人体区域对应的宽度、所述第二人体区域对应的宽度以及所述第三人体区域对应的宽度;
基于所述第一人体区域对应的宽度、所述第二人体区域对应的宽度以及所述第三人体区域对应的宽度,确定所述标准宽度变化关系。
4.根据权利要求3所述的人物识别方法,其特征在于,
所述第一人体区域对应的宽度小于所述第二人体区域对应的宽度和所述第三人体区域对应的宽度;
所述第二人体区域对应的宽度大于所述第三人体区域对应的宽度。
5.根据权利要求1所述的人物识别方法,其特征在于,所述多个目标区域包括第一目标区域、第二目标区域以及第三目标区域,所述根据所述人物区域的长度与预设的长度占比,将所述人物区域划分为多个目标区域,包括:
识别所述人物区域的长度;
基于所述人物区域的长度与预设的长度占比,将所述人物区域划分为所述第一目标区域、所述第二目标区域以及所述第三目标区域,其中,所述第一目标区域的长度占比小于所述第二目标区域以及所述第三目标区域,所述第二目标区域的长度占比大于所述第三目标区域。
6.根据权利要求5所述的人物识别方法,其特征在于,所述确定所述人物区域不完整,包括:
识别所述第一目标区域对应的宽度、所述第二目标区域对应的宽度以及所述第三目标区域对应的宽度;
若所述第一目标区域对应的宽度大于或等于所述第二目标区域对应的宽度,且所述第一目标区域对应的宽度大于所述第三目标区域对应的宽度,确定所述第一目标宽度变化关系与所述标准宽度变化关系不匹配。
7.根据权利要求2所述的人物识别方法,其特征在于,所述多个预期区域包括第一预期区域、第二预期区域以及第三预期区域,所述根据所述修复后的人物区域的长度以及所述长度占比,将所述修复后的人物区域划分为多个预期区域,包括:
识别所述修复后的人物区域的长度;
基于所述修复后的人物区域的长度以及所述预设的长度占比,将所述修复后的人物区域划分为所述第一预期区域、所述第二预期区域以及所述第三预期区域,其中,所述第一预期区域的长度占比小于所述第二预期区域以及所述第三预期区域,所述第二预期区域的长度占比大于所述第三预期区域。
8.根据权利要求7所述的人物识别方法,其特征在于,所述确定所述修复后的人物区域为所述人物的识别结果,包括:
识别所述第一预期区域对应的宽度、所述第二预期区域对应的宽度以及所述第三预期区域对应的宽度;
若所述第一预期区域对应的宽度小于所述第二预期区域对应的宽度,且所述第二预期区域的宽度大于所述第三预期区域的宽度,确定所述第二目标宽度变化关系与所述标准宽度变化关系匹配。
9.一种电子设备,其特征在于,所述电子设备包括处理器和存储器,所述处理器用于执行存储器中存储的计算机程序以实现如权利要求1至8中任意一项所述的人物识别方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有至少一个指令,所述至少一个指令被处理器执行时实现如权利要求1至8中任意一项所述的人物识别方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211585080.2A CN118172750A (zh) | 2022-12-10 | 2022-12-10 | 人物识别方法及相关设备 |
US18/109,541 US20240193980A1 (en) | 2022-12-10 | 2023-02-14 | Method for recognizing human body area in image, electronic device, and storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211585080.2A CN118172750A (zh) | 2022-12-10 | 2022-12-10 | 人物识别方法及相关设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN118172750A true CN118172750A (zh) | 2024-06-11 |
Family
ID=91349397
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211585080.2A Pending CN118172750A (zh) | 2022-12-10 | 2022-12-10 | 人物识别方法及相关设备 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20240193980A1 (zh) |
CN (1) | CN118172750A (zh) |
-
2022
- 2022-12-10 CN CN202211585080.2A patent/CN118172750A/zh active Pending
-
2023
- 2023-02-14 US US18/109,541 patent/US20240193980A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
US20240193980A1 (en) | 2024-06-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109960742B (zh) | 局部信息的搜索方法及装置 | |
CN112528878A (zh) | 检测车道线的方法、装置、终端设备及可读存储介质 | |
CN110135318B (zh) | 过车记录的确定方法、装置、设备及存储介质 | |
CN110443148B (zh) | 一种动作识别方法、***和存储介质 | |
CN108805016B (zh) | 一种头肩区域检测方法及装置 | |
US20160092726A1 (en) | Using gestures to train hand detection in ego-centric video | |
WO2021017283A1 (zh) | 基于离线型的在线跟踪方法、装置、计算机设备及存储介质 | |
CN109241890B (zh) | 面部图像校正方法、装置及存储介质 | |
US20230334893A1 (en) | Method for optimizing human body posture recognition model, device and computer-readable storage medium | |
US20230078721A1 (en) | Vehicle localization method and device, electronic device and storage medium | |
CN109977941A (zh) | 车牌识别方法及装置 | |
CN112836653A (zh) | 人脸隐私化方法、设备、装置及计算机存储介质 | |
CN112541394A (zh) | 黑眼圈及鼻炎识别方法、***及计算机介质 | |
CN115100469A (zh) | 一种基于分割算法的目标属性识别方法、训练方法和装置 | |
WO2021258955A1 (zh) | 目标图像中的对象轮廓的标注方法及装置、存储介质和电子装置 | |
US20160140395A1 (en) | Adaptive sampling for efficient analysis of ego-centric videos | |
CN113191189A (zh) | 人脸活体检测方法、终端设备及计算机可读存储介质 | |
CN113012030A (zh) | 图像拼接方法、装置及设备 | |
CN110751163B (zh) | 目标定位方法及其装置、计算机可读存储介质和电子设备 | |
CN118172750A (zh) | 人物识别方法及相关设备 | |
CN116452802A (zh) | 车损检测方法、装置、设备及存储介质 | |
TWI845060B (zh) | 人物識別方法及相關設備 | |
WO2020192262A1 (zh) | 一种实物图像生成方法及装置、设备 | |
TW202424784A (zh) | 人物識別方法及相關設備 | |
CN113989925B (zh) | 刷脸互动方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |