CN110942056A - 服饰关键点定位方法、装置、电子设备及介质 - Google Patents
服饰关键点定位方法、装置、电子设备及介质 Download PDFInfo
- Publication number
- CN110942056A CN110942056A CN201811110017.7A CN201811110017A CN110942056A CN 110942056 A CN110942056 A CN 110942056A CN 201811110017 A CN201811110017 A CN 201811110017A CN 110942056 A CN110942056 A CN 110942056A
- Authority
- CN
- China
- Prior art keywords
- key point
- image
- heat maps
- keypoint
- clothing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 52
- 238000001914 filtration Methods 0.000 claims abstract description 56
- 238000012549 training Methods 0.000 claims description 44
- 238000004422 calculation algorithm Methods 0.000 claims description 26
- 230000004807 localization Effects 0.000 claims description 26
- 238000013528 artificial neural network Methods 0.000 claims description 14
- 238000012545 processing Methods 0.000 claims description 9
- 239000003550 marker Substances 0.000 claims description 3
- 238000004590 computer program Methods 0.000 description 14
- 230000006870 function Effects 0.000 description 12
- 230000008569 process Effects 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 4
- 230000004927 fusion Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 238000009795 derivation Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 239000002699 waste material Substances 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000006386 memory function Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000005507 spraying Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0623—Item investigation
- G06Q30/0625—Directed, with specific intent or strategy
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Image Analysis (AREA)
Abstract
本发明提供一种服饰关键点定位方法、装置、电子设备及介质。所述服饰关键点定位方法包括:接收目标图像;利用训练好的关键点定位模型,得到所述目标图像的多个预测关键点热图;对所述多个预测关键点热图进行滤波,得到多个过滤热图;获取所述多个过滤热图中每个过滤热图的最大值对应的点;根据每个过滤热图的最大值对应的点,确定所述目标图像的目标关键点。因此,利用本发明能对服饰关键点进行自动定位,人为操作的步骤较少,用户体验更佳。
Description
技术领域
本发明涉及智能搜索技术领域,尤其涉及一种服饰关键点定位方法、装置、电子设备及介质。
背景技术
随着经济发展与消费观念的改变,时尚(如服饰)消费品市场正表现出井喷式的发展,与此同时,消费者也对个性化消费与方便的电商购物提出了更高的要求。有鉴于此,服饰关键点定位技术能显著的提高电商搜索***对用户所提供的服饰图像的识别率,保证为用户提供更加稳定的时尚需求的推荐。
然而,现有的服饰关键点定位技术不仅容易受到服饰本身尺度多变、形状多变、身着服饰的模特体态及环境多变等因素的影响,同时还需要用户进行配合(例如:人为框定服饰区域等),影响用户购物体验。
发明内容
鉴于以上内容,有必要提供一种服饰关键点定位方法、装置、电子设备及介质,能对服饰关键点进行自动定位。
一种服饰关键点定位方法,所述方法包括:
接收目标图像;
利用训练好的关键点定位模型,得到所述目标图像的多个预测关键点热图;
对所述多个预测关键点热图进行滤波,得到多个过滤热图;
获取所述多个过滤热图中每个过滤热图的最大值对应的点;
根据每个过滤热图的最大值对应的点,确定所述目标图像的目标关键点。
根据本发明优选实施例,所述方法还包括:训练所述关键点定位模型,所述训练所述关键点定位模型包括:
获取至少一张带有指定标记的初始图像;
生成每张初始图像的热图;
将每张初始图像及每张初始图像的热图确定为样本图像;
采用神经网络算法,对所述样本图像进行训练,得到训练好的关键点定位模型。
根据本发明优选实施例,所述样本图像还包括背景热图,所述背景热图中不包括所述指定标记。
根据本发明优选实施例,所述获取至少一张带有指定标记的初始图像包括:
获取至少一张图像;
确定所述至少一张图像中每张图像的关键点坐标;
对所述关键点坐标进行标记,得到所述至少一张带有指定标记的初始图像。
根据本发明优选实施例,所述采用神经网络算法,对所述样本图像进行训练,得到训练好的关键点定位模型包括:
结合特征金字塔网络算法,得到所述样本图像的多尺度特征信息;
利用所述多尺度特征信息进行训练,得到训练好的关键点定位模型。
根据本发明优选实施例,在利用训练好的关键点定位模型,得到所述目标图像的多个预测关键点热图后,所述方法还包括:
确定所述目标图像的尺寸信息;
根据所述尺寸信息,对所述多个预测关键点热图进行上采样处理。
根据本发明优选实施例,在确定所述目标图像的目标关键点后,所述方法还包括:
确定所述目标关键点的服饰元素;
根据所述服饰元素进行搜索,得到搜索结果;
计算所述搜索结果与所述服饰元素的相似度;
按照相似度由高到低的顺序展示所述搜索结果。
一种服饰关键点定位装置,所述装置包括:
接收单元,用于接收目标图像;
预测单元,用于利用训练好的关键点定位模型,得到所述目标图像的多个预测关键点热图;
滤波单元,用于对所述多个预测关键点热图进行滤波,得到多个过滤热图;
获取单元,用于获取所述多个过滤热图中每个过滤热图的最大值对应的点;
确定单元,用于根据每个过滤热图的最大值对应的点,确定所述目标图像的目标关键点。
根据本发明优选实施例,所述装置还包括:
训练单元,与训练所述关键点定位模型包括:
所述训练所述关键点定位模型包括:
所述获取单元,还用于获取至少一张带有指定标记的初始图像;
生成单元,用于生成每张初始图像的热图;
所述确定单元,还用于将每张初始图像及每张初始图像的热图确定为样本图像;
所述训练单元,还用于采用神经网络算法,对所述样本图像进行训练,得到训练好的关键点定位模型。
根据本发明优选实施例,所述样本图像还包括背景热图,所述背景热图中不包括所述指定标记。
根据本发明优选实施例,所述获取单元获取至少一张带有指定标记的初始图像包括:
获取至少一张图像;
确定所述至少一张图像中每张图像的关键点坐标;
对所述关键点坐标进行标记,得到所述至少一张带有指定标记的初始图像。
根据本发明优选实施例,所述训练单元具体用于:
结合特征金字塔网络算法,得到所述样本图像的多尺度特征信息;
利用所述多尺度特征信息进行训练,得到训练好的关键点定位模型。
根据本发明优选实施例,所述确定单元,还用于在利用训练好的关键点定位模型,得到所述目标图像的多个预测关键点热图后,确定所述目标图像的尺寸信息;
所述装置还包括:
上采样单元,用于根据所述尺寸信息,对所述多个预测关键点热图进行上采样处理。
根据本发明优选实施例,所述确定单元,还用于在确定所述目标图像的目标关键点后,确定所述目标关键点的服饰元素;
所述装置还包括:
搜索单元,用于根据所述服饰元素进行搜索,得到搜索结果;
计算单元,用于计算所述搜索结果与所述服饰元素的相似度;
展示单元,用于按照相似度由高到低的顺序展示所述搜索结果。
一种电子设备,所述电子设备包括:
存储器,存储至少一个指令;及
处理器,执行所述存储器中存储的指令以实现所述服饰关键点定位方法。
一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个指令,所述至少一个指令被电子设备中的处理器执行以实现所述的服饰关键点定位方法。
由以上技术方案可以看出,本发明接收目标图像;利用训练好的关键点定位模型,得到所述目标图像的多个预测关键点热图;对所述多个预测关键点热图进行滤波,得到多个过滤热图;获取所述多个过滤热图中每个过滤热图的最大值对应的点;根据每个过滤热图的最大值对应的点,确定所述目标图像的目标关键点,从而实现了对服饰关键点进行自动定位。
附图说明
图1是本发明服饰关键点定位方法的较佳实施例的流程图。
图2是本发明服饰关键点定位装置的较佳实施例的功能模块图。
图3是本发明实现服饰关键点定位方法的较佳实施例的电子设备的结构示意图。
主要元件符号说明
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。
如图1所示,是本发明服饰关键点定位方法的较佳实施例的流程图。根据不同的需求,该流程图中步骤的顺序可以改变,某些步骤可以省略。
所述服饰关键点定位方法应用于一个或者多个电子设备中,所述电子设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程门阵列(Field-Programmable Gate Array,FPGA)、数字处理器(Digital SignalProcessor,DSP)、嵌入式设备等。
所述电子设备可以是任何一种可与用户进行人机交互的电子产品,例如,个人计算机、平板电脑、智能手机、个人数字助理(Personal Digital Assistant,PDA)、游戏机、交互式网络电视(Internet Protocol Television,IPTV)、智能式穿戴式设备等。
所述电子设备还可以包括网络设备和/或用户设备(如:手机、智能终端、多媒体设备、流媒体设备等)。其中,所述网络设备包括,但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(Cloud Computing)的由大量主机或网络服务器构成的云。所述电子设备所处的网络包括但不限于互联网、广域网、城域网、局域网、虚拟专用网络(Virtual Private Network,VPN)等。
S10,所述电子设备接收目标图像。
在本发明的至少一个实施例中,所述目标图像可以由用户根据实际搜索需求输入到所述电子设备中,本发明不限制。
例如:当所述用户看到一张明星照后,想要在指定店铺(如:电商平台A)找到明星服饰的同款,则所述电子设备可以将所述明星照作为所述目标图像。
S11,所述电子设备训练所述关键点定位模型。
具体地,所述电子设备训练所述关键点定位模型包括:
所述电子设备获取至少一张带有指定标记的初始图像,并生成每张初始图像的热图,所述电子设备将每张初始图像及每张初始图像的热图确定为样本图像,采用神经网络算法,对所述样本图像进行训练,得到训练好的关键点定位模型。
进一步地,所述样本图像还包括背景热图,所述背景热图中不包括所述指定标记。
也就是说,由于所述关键点定位模型可以实现至少一种服饰类型关键点的预测,因此,需要输入多种服饰类型的初始图像,同时,为了实现对所述关键点定位模型的训练,还需要输入不包含相关关键点的图片作为负样本数据。
例如:在训练所述关键点定位模型中预测半袖的部分时,输入裙子类别的图像作为所述背景热图。
通过上述实施方式,所述电子设备能够以每张初始图像的热图作为正样本数据,以所述背景热图作为负样本数据,采用神经网络算法训练所述关键点定位模型,由于热图反映的是点的概率,在不确定性推理上具有很大的优势,因此也使所述关键点定位模型更加准确。
具体地,所述电子设备获取至少一张带有指定标记的初始图像包括:
所述电子设备获取至少一张图像,确定所述至少一张图像中每张图像的关键点坐标,所述电子设备对所述关键点坐标进行标记,得到所述至少一张带有指定标记的初始图像。
具体地,所述电子设备可以采取网络爬虫技术获取所述至少一张图像,以保证获取到大量的数据作为训练样本,使训练的所述关键点定位模型更加准确。
当然,在其他实施例中,所述电子设备也可以接收用户上传的所述至少一张图像,以根据所述用户的实际需求训练所述关键点定位模型,避免多余的训练工作耗费时间,不仅提高了训练效率,也间接提高了所述电子设备的运行速度。
例如:当所述用户是经营旗袍的商家时,则无需训练其他类型的服饰,避免浪费时间。
进一步地,对应于所述至少一张图像的不同获取方式,确定所述至少一张图像中每张图像的关键点坐标的方式也有所不同。
当所述至少一张图像为通过网络爬虫技术获取时,所述电子设备可以直接爬出带有所述关键点坐标的图像,避免人为标记关键点带来的不便,减少人为工作量。
而当所述至少一张图像是用户上传时,则所述用户需要根据个人需求确定所述关键点坐标,虽然工作量相对提高,但是也更加有针对性。
在确定所述至少一张图像中每张图像的关键点坐标后,所述电子设备对所述关键点坐标进行标记,标记的方式不限制。
在本发明的至少一个实施例中,所述电子设备生成每张初始图像的热图可以采用如下公式:
其中,0<x≤h,0<y≤w,h,w表示生成热图的像素值,e表示自然对数底数,值约为2.7182818;σ表示热图中各个点概率分布的集中程度;(kptx,kpty)表示服饰中关键点的空间位置坐标。
在一个实施例中,根据大量实验以及积累的经验得出,h,w可以取值为48,σ可以设置为15。在其它实施方式中,h,w以及σg的值都可以根据实际情况进行相应的调整。
在本发明的至少一个实施例中,所述电子设备采用神经网络算法,对所述样本图像进行训练,得到训练好的关键点定位模型包括:
所述电子设备结合FPN(Feature Pyramid Networks for Object Detection,特征金字塔网络的对象检测)算法,得到所述样本图像的多尺度特征信息,并利用所述多尺度特征信息进行训练,得到训练好的关键点定位模型。
具体地,所述电子设备首先将所述样本图像输入到深度残差网络中,并输出5个不同尺度的特征C1、C2、C3、C4、C5,所述C1、C2、C3、C4、C5具有不同的像素值,是尺寸一致的二维特征图,例如:当所述样本图像的像素值384*384时,C1、C2、C3、C4、C5的像素值分别为192*192、96*92、48*48、24*24、12*12。所述电子设备利用所述FPN算法,对C1、C2、C3、C4、C5进行处理,得到3个不同的尺度特征P3、P4、P5,其中,P3的大小是48*48,P4的大小是24*24,P5的大小是12*12。
通过上述实施方式,无需人工输入或者是爬虫获得多个尺度的图像作为样本,所述电子设备即可通过FPN算法得到所述样本图像的多尺度特征信息,使样本的获取更加简单,从而降低对样本的要求。
S12,所述电子设备利用训练好的关键点定位模型,得到所述目标图像的多个预测关键点热图。
在本发明的至少一个实施例中,在利用训练好的关键点定位模型,得到所述目标图像的多个预测关键点热图后,所述方法还包括:
所述电子设备确定所述目标图像的尺寸信息,并根据所述尺寸信息,对所述多个预测关键点热图进行上采样处理。
具体地,所述电子设备可以采用内插值方法,对所述多个预测关键点热图进行上采样处理。
进一步地,在对所述多个预测关键点热图进行上采样处理后,所述电子设备即可将通过FPN算法得到的3个不同的尺度特征P3、P4、P5进行融合,融合方式就是做像素间的加法,以得到与输入的样本图像像素一致的特征图像。
通过上述实施方式,能够使输出的多个预测关键点热图的清晰度与输入的所述目标图像一致,视觉效果不变,不会降低图片的质量,从而提升用户体验。
更进一步地,所述电子设备对输出的特征图像进行卷积运算,并结合神经网络算法中欧式距离损失函数的求导反向传播,不断更新整个网络的各个神经元的权重。欧式距离损失函数的具体公式如下:
其中,N是所述关键点个数;Wx,Hy是所述热图的长和宽(例如:Wx=Hy=48);gn表示所述样本图像的集合,同理,tn表示经过融合后得到特征图像的集合。
S13,所述电子设备对所述多个预测关键点热图进行滤波,得到多个过滤热图。
在本发明的至少一个实施例中,所述电子设备可以采用低通滤波器对所述多个预测关键点热图进行滤波,从而滤除所述多个预测关键点热图的干扰噪声。
例如:所述电子设备可以采用高斯低通滤波器对所述多个预测关键点热图进行滤波。
具体地,计算过程如下:
其中,π≈3.14,σg是正态分布的标准偏差,x、y分别代表点的横纵坐标。
在一个实施例中,根据大量实验以及积累的经验得出,σg可以设置为3。在其它实施方式中,σg的值可以根据实际情况进行相应的调整。
S14,所述电子设备获取所述多个过滤热图中每个过滤热图的最大值对应的点。
在本发明的至少一个实施例中,所述电子设备获取所述多个过滤热图中每个过滤热图的最大值对应的点包括:
所述电子设备在每个过滤热图的水平和垂直方向上,分别取最大值,得到每个过滤热图的最大值对应的点。
具体地,所述电子设备对公式(2)中的predict_out分别在水平和垂直方向上取最大值,取得最大值的方式不限制。
S15,所述电子设备根据每个过滤热图的最大值对应的点,确定所述目标图像的目标关键点。
在本发明的至少一个实施例中,所述电子设备根据每个过滤热图的最大值对应的点,确定所述目标图像的目标关键点包括:
所述电子设备建立每个过滤热图的最大值对应的点的集合,以作为所述目标图像的目标关键点的集合。
通过上述实施方式,由于选取的是每个过滤热图的最大值对应的点,因此可以确保得到更加清晰的效果图,用户体验更佳。
在本发明的至少一个实施例中,在确定所述目标图像的目标关键点后,所述方法还包括:
所述电子设备确定所述目标关键点的服饰元素,并根据所述服饰元素进行搜索,得到搜索结果,所述电子设备计算所述搜索结果与所述服饰元素的相似度,并按照相似度由高到低的顺序展示所述搜索结果。
具体地,所述电子设备可以对所述目标关键点处的服饰元素进行识别,得到识别结果,并将识别结果与存储的服饰元素特征进行匹配,并将匹配的服饰元素特征对应的服饰元素确定为所述目标关键点处的服饰元素。
具体地,所述服饰元素可以包括,但不限于以下一种或者多种的组合:铆钉元素、蝴蝶结元素、蕾丝元素等。
进一步地,所述电子设备可以根据所述服饰元素在网络上进行搜索,或者是在指定平台(如:指定电商平台等)上进行搜索。
更进一步地,所述电子设备可以在所述用户的显示设备上展示所述搜索结果,便于用户进行查看。
通过上述实施方式,所述电子设备即可在利用所述关键点定位模型进行关键点定位后,进一步根据确定的目标关键点进行搜索,并优先展示相似度较高的搜索结果供用户查看,给用户的搜索带来便利,也更加贴近用户的搜索需求。
综上所述,本发明能接收目标图像;利用训练好的关键点定位模型,得到所述目标图像的多个预测关键点热图;对所述多个预测关键点热图进行滤波,得到多个过滤热图;获取所述多个过滤热图中每个过滤热图的最大值对应的点;根据每个过滤热图的最大值对应的点,确定所述目标图像的目标关键点。因此,利用本发明能对服饰关键点进行自动定位,较少人为操作的步骤,用户体验更佳。
如图2所示,是本发明服饰关键点定位装置的较佳实施例的功能模块图。所述服饰关键点定位装置11包括接收单元110、预测单元111、滤波单元112、获取单元113、确定单元114、生成单元115、训练单元116、上采样单元117、搜索单元118、计算单元119及展示单元120。本发明所称的模块/单元是指一种能够被处理器13(如图3所示)所执行,并且能够完成固定功能的一系列计算机程序段,其存储在存储器12中。在本实施例中,关于各模块/单元的功能将在后续的实施例中详述。
接收单元110接收目标图像。
在本发明的至少一个实施例中,所述目标图像可以由用户根据实际搜索需求输入到所述电子设备中,本发明不限制。
例如:当所述用户看到一张明星照后,想要在指定店铺(如:电商平台A)找到明星服饰的同款,则所述接收单元110可以将所述明星照作为所述目标图像。
预测单元111利用训练好的关键点定位模型,得到所述目标图像的多个预测关键点热图。
在本发明的至少一个实施例中,所述预测单元111在利用训练好的关键点定位模型,得到所述目标图像的多个预测关键点热图前,所述方法还包括:
训练单元116训练所述关键点定位模型。
具体地,所述训练单元116训练所述关键点定位模型包括:
获取单元113获取至少一张带有指定标记的初始图像,生成单元115生成每张初始图像的热图,确定单元114将每张初始图像及每张初始图像的热图确定为样本图像,所述训练单元116采用神经网络算法,对所述样本图像进行训练,得到训练好的关键点定位模型。
进一步地,所述样本图像还包括背景热图,所述背景热图中不包括所述指定标记。
也就是说,由于所述关键点定位模型可以实现至少一种服饰类型关键点的预测,因此,需要输入多种服饰类型的初始图像,同时,为了实现对所述关键点定位模型的训练,还需要输入不包含相关关键点的图片作为负样本数据。
例如:在训练所述关键点定位模型中预测半袖的部分时,输入裙子类别的图像作为所述背景热图。
通过上述实施方式,所述训练单元116能够以每张初始图像的热图作为正样本数据,以所述背景热图作为负样本数据,采用神经网络算法训练所述关键点定位模型,由于热图反映的是点的概率,在不确定性推理上具有很大的优势,因此也使所述关键点定位模型更加准确。
具体地,所述获取单元113获取至少一张带有指定标记的初始图像包括:
所述获取单元113获取至少一张图像,确定所述至少一张图像中每张图像的关键点坐标,所述获取单元113对所述关键点坐标进行标记,得到所述至少一张带有指定标记的初始图像。
具体地,所述获取单元113可以采取网络爬虫技术获取所述至少一张图像,以保证获取到大量的数据作为训练样本,使训练的所述关键点定位模型更加准确。
当然,在其他实施例中,所述获取单元113也可以接收用户上传的所述至少一张图像,以根据所述用户的实际需求训练所述关键点定位模型,避免多余的训练工作耗费时间,不仅提高了训练效率,也间接提高了所述电子设备的运行速度。
例如:当所述用户是经营旗袍的商家时,则无需训练其他类型的服饰,避免浪费时间。
进一步地,对应于所述至少一张图像的不同获取方式,确定所述至少一张图像中每张图像的关键点坐标的方式也有所不同。
当所述至少一张图像为通过网络爬虫技术获取时,所述确定单元114可以直接爬出带有所述关键点坐标的图像,避免人为标记关键点带来的不便,减少人为工作量。
而当所述至少一张图像是用户上传时,则所述用户需要根据个人需求确定所述关键点坐标,虽然工作量相对提高,但是也更加有针对性。
在确定所述至少一张图像中每张图像的关键点坐标后,所述获取单元113对所述关键点坐标进行标记,标记的方式不限制。
在本发明的至少一个实施例中,所述生成单元115生成每张初始图像的热图可以采用如下公式:
其中,0<x≤h,0<y≤w,h,w表示生成热图的像素值,e表示自然对数底数,值约为2.7182818;σ表示热图中各个点概率分布的集中程度;(kptx,kpty)表示服饰中关键点的空间位置坐标。
在一个实施例中,根据大量实验以及积累的经验得出,h,w可以取值为48,σ可以设置为15。在其它实施方式中,h,w以及σg的值都可以根据实际情况进行相应的调整。
在本发明的至少一个实施例中,所述训练单元116采用神经网络算法,对所述样本图像进行训练,得到训练好的关键点定位模型包括:
所述训练单元116结合FPN(Feature Pyramid Networks for Object Detection,特征金字塔网络的对象检测)算法,得到所述样本图像的多尺度特征信息,并利用所述多尺度特征信息进行训练,得到训练好的关键点定位模型。
具体地,所述电子设备首先将所述样本图像输入到深度残差网络中,并输出5个不同尺度的特征C1、C2、C3、C4、C5,所述C1、C2、C3、C4、C5具有不同的像素值,是尺寸一致的二维特征图,例如:当所述样本图像的像素值384*384时,C1、C2、C3、C4、C5的像素值分别为192*192、96*92、48*48、24*24、12*12。所述电子设备利用所述FPN算法,对C1、C2、C3、C4、C5进行处理,得到3个不同的尺度特征P3、P4、P5,其中,P3的大小是48*48,P4的大小是24*24,P5的大小是12*12。
通过上述实施方式,无需人工输入或者是爬虫获得多个尺度的图像作为样本,所述训练单元116即可通过FPN算法得到所述样本图像的多尺度特征信息,使样本的获取更加简单,从而降低对样本的要求。
在本发明的至少一个实施例中,在利用训练好的关键点定位模型,得到所述目标图像的多个预测关键点热图后,所述方法还包括:
所述确定单元114确定所述目标图像的尺寸信息,上采样单元117并根据所述尺寸信息,对所述多个预测关键点热图进行上采样处理。
具体地,所述上采样单元117可以采用内插值方法,对所述多个预测关键点热图进行上采样处理。
进一步地,在对所述多个预测关键点热图进行上采样处理后,所述训练单元116即可将通过FPN算法得到的3个不同的尺度特征P3、P4、P5进行融合,融合方式就是做像素间的加法,以得到与输入的样本图像像素一致的特征图像。
通过上述实施方式,能够使输出的多个预测关键点热图的清晰度与输入的所述目标图像一致,视觉效果不变,不会降低图片的质量,从而提升用户体验。
更进一步地,所述训练单元116对输出的特征图像进行卷积运算,并结合神经网络算法中欧式距离损失函数的求导反向传播,不断更新整个网络的各个神经元的权重。欧式距离损失函数的具体公式如下:
其中,N是所述关键点个数;Wx,Hy是所述热图的长和宽(例如:Wx=Hy=48);gn表示所述样本图像的集合,同理,tn表示经过融合后得到特征图像的集合。
滤波单元112对所述多个预测关键点热图进行滤波,得到多个过滤热图。
在本发明的至少一个实施例中,所述滤波单元112可以采用低通滤波器对所述多个预测关键点热图进行滤波,从而滤除所述多个预测关键点热图的干扰噪声。
例如:所述滤波单元112可以采用高斯低通滤波器对所述多个预测关键点热图进行滤波。
具体地,计算过程如下:
其中,π≈3.14,σg是正态分布的标准偏差,x、y分别代表点的横纵坐标。
在一个实施例中,根据大量实验以及积累的经验得出,σg可以设置为3。在其它实施方式中,σg的值可以根据实际情况进行相应的调整。
所述获取单元113获取所述多个过滤热图中每个过滤热图的最大值对应的点。
在本发明的至少一个实施例中,所述获取单元113获取所述多个过滤热图中每个过滤热图的最大值对应的点包括:
所述获取单元113在每个过滤热图的水平和垂直方向上,分别取最大值,得到每个过滤热图的最大值对应的点。
具体地,所述获取单元113对公式(2)中的predict_out分别在水平和垂直方向上取最大值,取得最大值的方式不限制。
所述确定单元114根据每个过滤热图的最大值对应的点,确定所述目标图像的目标关键点。
在本发明的至少一个实施例中,所述确定单元114根据每个过滤热图的最大值对应的点,确定所述目标图像的目标关键点包括:
所述确定单元114建立每个过滤热图的最大值对应的点的集合,以作为所述目标图像的目标关键点的集合。
通过上述实施方式,由于选取的是每个过滤热图的最大值对应的点,因此可以确保得到更加清晰的效果图,用户体验更佳。
在本发明的至少一个实施例中,在确定所述目标图像的目标关键点后,所述方法还包括:
所述确定单元114确定所述目标关键点的服饰元素,搜索单元118根据所述服饰元素进行搜索,得到搜索结果,计算单元119计算所述搜索结果与所述服饰元素的相似度,并按照相似度由高到低的顺序展示所述搜索结果。
具体地,所述搜索单元118可以对所述目标关键点处的服饰元素进行识别,得到识别结果,并将识别结果与存储的服饰元素特征进行匹配,并将匹配的服饰元素特征对应的服饰元素确定为所述目标关键点处的服饰元素。
具体地,所述服饰元素可以包括,但不限于以下一种或者多种的组合:铆钉元素、蝴蝶结元素、蕾丝元素等。
进一步地,所述搜索单元118可以根据所述服饰元素在网络上进行搜索,或者是在指定平台(如:指定电商平台等)上进行搜索。
更进一步地,展示单元120可以在所述用户的显示设备上展示所述搜索结果,便于用户进行查看。
通过上述实施方式,所述电子设备即可在利用所述关键点定位模型进行关键点定位后,进一步根据确定的目标关键点进行搜索,并优先展示相似度较高的搜索结果供用户查看,给用户的搜索带来便利,也更加贴近用户的搜索需求。
综上所述,本发明能接收目标图像;利用训练好的关键点定位模型,得到所述目标图像的多个预测关键点热图;对所述多个预测关键点热图进行滤波,得到多个过滤热图;获取所述多个过滤热图中每个过滤热图的最大值对应的点;根据每个过滤热图的最大值对应的点,确定所述目标图像的目标关键点。因此,利用本发明能对服饰关键点进行自动定位,较少人为操作的步骤,用户体验更佳。
如图3所示,是本发明实现服饰关键点定位方法的较佳实施例的电子设备的结构示意图。
所述电子设备1是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、可编程门阵列(Field-Programmable Gate Array,FPGA)、数字处理器(Digital Signal Processor,DSP)、嵌入式设备等。
所述电子设备1还可以是但不限于任何一种可与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互的电子产品,例如,个人计算机、平板电脑、智能手机、个人数字助理(Personal Digital Assistant,PDA)、游戏机、交互式网络电视(InternetProtocol Television,IPTV)、智能式穿戴式设备等。
所述电子设备1还可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。
所述电子设备1所处的网络包括但不限于互联网、广域网、城域网、局域网、虚拟专用网络(Virtual Private Network,VPN)等。
在本发明的一个实施例中,所述电子设备1包括,但不限于,存储器12、处理器13,以及存储在所述存储器12中并可在所述处理器13上运行的计算机程序,例如服饰关键点定位程序。
本领域技术人员可以理解,所述示意图仅仅是电子设备1的示例,并不构成对电子设备1的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述电子设备1还可以包括输入输出设备、网络接入设备、总线等。
所称处理器13可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器13是所述电子设备1的运算核心和控制中心,利用各种接口和线路连接整个电子设备1的各个部分,及执行所述电子设备1的操作***以及安装的各类应用程序、程序代码等。
所述处理器13执行所述电子设备1的操作***以及安装的各类应用程序。所述处理器13执行所述应用程序以实现上述各个服饰关键点定位方法实施例中的步骤,例如图1所示的步骤S10、S11、S12、S13、S14。
或者,所述处理器13执行所述计算机程序时实现上述各装置实施例中各模块/单元的功能,例如:接收目标图像;利用训练好的关键点定位模型,得到所述目标图像的多个预测关键点热图;对所述多个预测关键点热图进行滤波,得到多个过滤热图;获取所述多个过滤热图中每个过滤热图的最大值对应的点;根据每个过滤热图的最大值对应的点,确定所述目标图像的目标关键点。
示例性的,所述计算机程序可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器12中,并由所述处理器13执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在所述电子设备1中的执行过程。例如,所述计算机程序可以被分割成接收单元110、预测单元111、滤波单元112、获取单元113、确定单元114、生成单元115、训练单元116、上采样单元117、搜索单元118、计算单元119及展示单元120。
所述存储器12可用于存储所述计算机程序和/或模块,所述处理器13通过运行或执行存储在所述存储器12内的计算机程序和/或模块,以及调用存储在存储器12内的数据,实现所述电子设备1的各种功能。所述存储器12可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器12可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
所述存储器12可以是电子设备1的外部存储器和/或内部存储器。进一步地,所述存储器12可以是集成电路中没有实物形式的具有存储功能的电路,如RAM(Random-AccessMemory,随机存取存储器)、FIFO(First In First Out,)等。或者,所述存储器12也可以是具有实物形式的存储器,如内存条、TF卡(Trans-flash Card)等等。
所述电子设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。
其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random AccessMemory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
结合图1,所述电子设备1中的所述存储器12存储多个指令以实现一种服饰关键点定位方法,所述处理器13可执行所述多个指令从而实现:接收目标图像;利用训练好的关键点定位模型,得到所述目标图像的多个预测关键点热图;对所述多个预测关键点热图进行滤波,得到多个过滤热图;获取所述多个过滤热图中每个过滤热图的最大值对应的点;根据每个过滤热图的最大值对应的点,确定所述目标图像的目标关键点。
根据本发明优选实施例,所述处理器13还执行多个指令包括:
训练所述关键点定位模型,所述训练所述关键点定位模型包括:
获取至少一张带有指定标记的初始图像;
生成每张初始图像的热图;
将每张初始图像及每张初始图像的热图确定为样本图像;
采用神经网络算法,对所述样本图像进行训练,得到训练好的关键点定位模型。
根据本发明优选实施例,所述样本图像还包括背景热图,所述背景热图中不包括所述指定标记。
根据本发明优选实施例,所述处理器13还执行多个指令包括:
获取至少一张图像;
确定所述至少一张图像中每张图像的关键点坐标;
对所述关键点坐标进行标记,得到所述至少一张带有指定标记的初始图像。
根据本发明优选实施例,所述处理器13还执行多个指令包括:
结合特征金字塔网络算法,得到所述样本图像的多尺度特征信息;
利用所述多尺度特征信息进行训练,得到训练好的关键点定位模型。
根据本发明优选实施例,所述处理器13还执行多个指令包括:
确定所述目标图像的尺寸信息;
根据所述尺寸信息,对所述多个预测关键点热图进行上采样处理。
根据本发明优选实施例,所述处理器13还执行多个指令包括:
确定所述目标关键点的服饰元素;
根据所述服饰元素进行搜索,得到搜索结果;
计算所述搜索结果与所述服饰元素的相似度;
按照相似度由高到低的顺序展示所述搜索结果。
具体地,所述处理器13对上述指令的具体实现方法可参考图1对应实施例中相关步骤的描述,在此不赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的***,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。***权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。
Claims (10)
1.一种服饰关键点定位方法,其特征在于,所述方法包括:
接收目标图像;
利用训练好的关键点定位模型,得到所述目标图像的多个预测关键点热图;
对所述多个预测关键点热图进行滤波,得到多个过滤热图;
获取所述多个过滤热图中每个过滤热图的最大值对应的点;
根据每个过滤热图的最大值对应的点,确定所述目标图像的目标关键点。
2.如权利要求1所述的服饰关键点定位方法,其特征在于,所述还方法包括:训练所述关键点定位模型,所述训练所述关键点定位模型包括:
获取至少一张带有指定标记的初始图像;
生成每张初始图像的热图;
将每张初始图像及每张初始图像的热图确定为样本图像;
采用神经网络算法,对所述样本图像进行训练,得到训练好的关键点定位模型。
3.如权利要求2所述的服饰关键点定位方法,其特征在于,所述样本图像还包括背景热图,所述背景热图中不包括所述指定标记。
4.如权利要求2所述的服饰关键点定位方法,其特征在于,所述获取至少一张带有指定标记的初始图像包括:
获取至少一张图像;
确定所述至少一张图像中每张图像的关键点坐标;
对所述关键点坐标进行标记,得到所述至少一张带有指定标记的初始图像。
5.如权利要求2所述的服饰关键点定位方法,其特征在于,所述采用神经网络算法,对所述样本图像进行训练,得到训练好关键点定位模型包括:
结合特征金字塔网络算法,得到所述样本图像的多尺度特征信息;
利用所述多尺度特征信息进行训练,得到训练好关键点定位模型。
6.如权利要求1所述的服饰关键点定位方法,其特征在于,在利用训练好的关键点定位模型,得到所述目标图像的多个预测关键点热图后,所述方法还包括:
确定所述目标图像的尺寸信息;
根据所述尺寸信息,对所述多个预测关键点热图进行上采样处理。
7.如权利要求1所述的服饰关键点定位方法,其特征在于,在确定所述目标图像的目标关键点后,所述方法还包括:
确定所述目标关键点的服饰元素;
根据所述服饰元素进行搜索,得到搜索结果;
计算所述搜索结果与所述服饰元素的相似度;
按照相似度由高到低的顺序展示所述搜索结果。
8.一种服饰关键点定位装置,其特征在于,所述装置包括:
接收单元,用于接收目标图像;
预测单元,用于利用训练好的关键点定位模型,得到所述目标图像的多个预测关键点热图;
滤波单元,用于对所述多个预测关键点热图进行滤波,得到多个过滤热图;
获取单元,用于获取所述多个过滤热图中每个过滤热图的最大值对应的点;
确定单元,用于根据每个过滤热图的最大值对应的点,确定所述目标图像的目标关键点。
9.一种电子设备,其特征在于,所述电子设备包括:
存储器,存储至少一个指令;及
处理器,执行所述存储器中存储的指令以实现如权利要求1至7中任意一项所述的服饰关键点定位方法。
10.一种计算机可读存储介质,其特征在于:所述计算机可读存储介质中存储有至少一个指令,所述至少一个指令被电子设备中的处理器执行以实现如权利要求1至7中任意一项所述的服饰关键点定位方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811110017.7A CN110942056A (zh) | 2018-09-21 | 2018-09-21 | 服饰关键点定位方法、装置、电子设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811110017.7A CN110942056A (zh) | 2018-09-21 | 2018-09-21 | 服饰关键点定位方法、装置、电子设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110942056A true CN110942056A (zh) | 2020-03-31 |
Family
ID=69904837
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811110017.7A Pending CN110942056A (zh) | 2018-09-21 | 2018-09-21 | 服饰关键点定位方法、装置、电子设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110942056A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111709874A (zh) * | 2020-06-16 | 2020-09-25 | 北京百度网讯科技有限公司 | 图像调整的方法、装置、电子设备及存储介质 |
CN112507954A (zh) * | 2020-12-21 | 2021-03-16 | 深圳市优必选科技股份有限公司 | 一种人体关键点识别方法、装置、终端设备及存储介质 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150269143A1 (en) * | 2014-03-21 | 2015-09-24 | Samsung Techwin Co., Ltd. | Image processing system and method |
CN105469087A (zh) * | 2015-07-13 | 2016-04-06 | 百度在线网络技术(北京)有限公司 | 识别服饰图片的方法、服饰图片的标注方法及装置 |
CN106548179A (zh) * | 2016-09-29 | 2017-03-29 | 北京市商汤科技开发有限公司 | 物体和服饰关键点的检测方法、装置和电子设备 |
US9798949B1 (en) * | 2015-03-19 | 2017-10-24 | A9.Com, Inc. | Region selection for image match |
US20180060701A1 (en) * | 2016-08-31 | 2018-03-01 | Adobe Systems Incorporated | Deep-learning network architecture for object detection |
CN108205655A (zh) * | 2017-11-07 | 2018-06-26 | 北京市商汤科技开发有限公司 | 一种关键点预测方法、装置、电子设备及存储介质 |
CN108229496A (zh) * | 2017-07-11 | 2018-06-29 | 北京市商汤科技开发有限公司 | 服饰关键点的检测方法和装置、电子设备、存储介质和程序 |
CN108229488A (zh) * | 2016-12-27 | 2018-06-29 | 北京市商汤科技开发有限公司 | 用于检测物体关键点的方法、装置及电子设备 |
CN108229445A (zh) * | 2018-02-09 | 2018-06-29 | 深圳市唯特视科技有限公司 | 一种基于级联金字塔网络的多人姿态估计方法 |
CN108227912A (zh) * | 2017-11-30 | 2018-06-29 | 北京市商汤科技开发有限公司 | 设备控制方法和装置、电子设备、计算机存储介质 |
US20180250826A1 (en) * | 2017-03-03 | 2018-09-06 | Futurewei Technologies, Inc. | Fine-grained object recognition in robotic systems |
CN108520251A (zh) * | 2018-04-20 | 2018-09-11 | 北京市商汤科技开发有限公司 | 关键点检测方法及装置、电子设备和存储介质 |
-
2018
- 2018-09-21 CN CN201811110017.7A patent/CN110942056A/zh active Pending
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150269143A1 (en) * | 2014-03-21 | 2015-09-24 | Samsung Techwin Co., Ltd. | Image processing system and method |
US9798949B1 (en) * | 2015-03-19 | 2017-10-24 | A9.Com, Inc. | Region selection for image match |
CN105469087A (zh) * | 2015-07-13 | 2016-04-06 | 百度在线网络技术(北京)有限公司 | 识别服饰图片的方法、服饰图片的标注方法及装置 |
US20180060701A1 (en) * | 2016-08-31 | 2018-03-01 | Adobe Systems Incorporated | Deep-learning network architecture for object detection |
CN106548179A (zh) * | 2016-09-29 | 2017-03-29 | 北京市商汤科技开发有限公司 | 物体和服饰关键点的检测方法、装置和电子设备 |
CN108229488A (zh) * | 2016-12-27 | 2018-06-29 | 北京市商汤科技开发有限公司 | 用于检测物体关键点的方法、装置及电子设备 |
US20180250826A1 (en) * | 2017-03-03 | 2018-09-06 | Futurewei Technologies, Inc. | Fine-grained object recognition in robotic systems |
CN108229496A (zh) * | 2017-07-11 | 2018-06-29 | 北京市商汤科技开发有限公司 | 服饰关键点的检测方法和装置、电子设备、存储介质和程序 |
CN108205655A (zh) * | 2017-11-07 | 2018-06-26 | 北京市商汤科技开发有限公司 | 一种关键点预测方法、装置、电子设备及存储介质 |
CN108227912A (zh) * | 2017-11-30 | 2018-06-29 | 北京市商汤科技开发有限公司 | 设备控制方法和装置、电子设备、计算机存储介质 |
CN108229445A (zh) * | 2018-02-09 | 2018-06-29 | 深圳市唯特视科技有限公司 | 一种基于级联金字塔网络的多人姿态估计方法 |
CN108520251A (zh) * | 2018-04-20 | 2018-09-11 | 北京市商汤科技开发有限公司 | 关键点检测方法及装置、电子设备和存储介质 |
Non-Patent Citations (7)
Title |
---|
LINGFEI ZHU 等: "Human Pose Estimation Based on Deep Neural Network", 《2018 INTERNATIONAL CONFERENCE ON AUDIO, LANGUAGE AND IMAGE PROCESSING (ICALIP)》 * |
OUYANG YI: "Clothes Image Searching System Based on SIFT Features", 《2009 INTERNATIONAL CONFERENCE ON E-BUSINESS AND INFORMATION SYSTEM SECURITY》 * |
XIAO CHEN 等: "Multi-Person Pose Estimation with LIMB Detection Heatmaps", 《2018 25TH IEEE INTERNATIONAL CONFERENCE ON IMAGE PROCESSING (ICIP)》 * |
向新 主编, 西安电子科技大学出版社 * |
夏一民等: "基于多尺度下特征点的检测", 《计算机工程与设计》 * |
陈嫒嫒等: "基于关键点的服装检索", 《计算机应用》 * |
陈康: "基于深度卷积神经网络的汽车驾驶场景目标检测算法研究", 《中国优秀硕士学位论文全文数据库信息科技辑》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111709874A (zh) * | 2020-06-16 | 2020-09-25 | 北京百度网讯科技有限公司 | 图像调整的方法、装置、电子设备及存储介质 |
CN111709874B (zh) * | 2020-06-16 | 2023-09-08 | 北京百度网讯科技有限公司 | 图像调整的方法、装置、电子设备及存储介质 |
CN112507954A (zh) * | 2020-12-21 | 2021-03-16 | 深圳市优必选科技股份有限公司 | 一种人体关键点识别方法、装置、终端设备及存储介质 |
CN112507954B (zh) * | 2020-12-21 | 2024-01-19 | 深圳市优必选科技股份有限公司 | 一种人体关键点识别方法、装置、终端设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109508681B (zh) | 生成人体关键点检测模型的方法和装置 | |
US10032072B1 (en) | Text recognition and localization with deep learning | |
CN107690657B (zh) | 根据影像发现商户 | |
KR102081842B1 (ko) | 자동 가이드식 이미지 캡쳐 및 프레젠테이션 | |
US9922461B2 (en) | Reality augmenting method, client device and server | |
US8718369B1 (en) | Techniques for shape-based search of content | |
CN109688463A (zh) | 一种剪辑视频生成方法、装置、终端设备及存储介质 | |
CN108876804B (zh) | 抠像模型训练和图像抠像方法、装置和***及存储介质 | |
CN112101305B (zh) | 多路图像处理方法、装置及电子设备 | |
EP2972950B1 (en) | Segmentation of content delivery | |
CN111078940B (zh) | 图像处理方法、装置、计算机存储介质及电子设备 | |
US9058660B2 (en) | Feature searching based on feature quality information | |
US20210166058A1 (en) | Image generation method and computing device | |
CN112163577A (zh) | 游戏画面中的文字识别方法、装置、电子设备和存储介质 | |
CN110427915A (zh) | 用于输出信息的方法和装置 | |
CN113688839B (zh) | 视频处理方法及装置、电子设备、计算机可读存储介质 | |
CN111429512A (zh) | 图像处理方法和装置、存储介质及处理器 | |
CN110942056A (zh) | 服饰关键点定位方法、装置、电子设备及介质 | |
CN110197459B (zh) | 图像风格化生成方法、装置及电子设备 | |
CN109299378B (zh) | 搜索结果的展示方法、装置、终端及存储介质 | |
CN109799905B (zh) | 一种手部跟踪方法和广告机 | |
CN108875501B (zh) | 人体属性识别方法、装置、***及存储介质 | |
US20200082625A1 (en) | Augmented reality layers enhancement | |
CN111507139A (zh) | 图像效果生成方法、装置和电子设备 | |
CN115661444A (zh) | 图像处理方法、装置、设备、存储介质及产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200331 |
|
RJ01 | Rejection of invention patent application after publication |