CN110349082A - 图像区域的裁剪方法和装置、存储介质及电子装置 - Google Patents
图像区域的裁剪方法和装置、存储介质及电子装置 Download PDFInfo
- Publication number
- CN110349082A CN110349082A CN201910584273.8A CN201910584273A CN110349082A CN 110349082 A CN110349082 A CN 110349082A CN 201910584273 A CN201910584273 A CN 201910584273A CN 110349082 A CN110349082 A CN 110349082A
- Authority
- CN
- China
- Prior art keywords
- image
- cut
- area
- target
- region
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000005520 cutting process Methods 0.000 title claims abstract description 175
- 238000000034 method Methods 0.000 title claims abstract description 98
- 238000003860 storage Methods 0.000 title claims abstract description 17
- 238000001514 detection method Methods 0.000 claims description 105
- 230000008569 process Effects 0.000 claims description 34
- 230000015654 memory Effects 0.000 claims description 17
- 238000004590 computer program Methods 0.000 claims description 11
- 238000007689 inspection Methods 0.000 claims description 4
- 238000004422 calculation algorithm Methods 0.000 description 20
- 230000000694 effects Effects 0.000 description 17
- 238000012545 processing Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 11
- 238000005516 engineering process Methods 0.000 description 10
- 238000004458 analytical method Methods 0.000 description 4
- 210000000746 body region Anatomy 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 241001465754 Metazoa Species 0.000 description 3
- 230000009471 action Effects 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000005484 gravity Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 210000005036 nerve Anatomy 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 230000005389 magnetism Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000011897 real-time detection Methods 0.000 description 1
- 238000013515 script Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000009966 trimming Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/04—Context-preserving transformations, e.g. by using an importance map
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/462—Salient features, e.g. scale invariant feature transforms [SIFT]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种图像区域的裁剪方法和装置、存储介质及电子装置。其中,该方法包括:获取与待裁剪图像对应的第一区域集合中的第一目标区域的第一中心点,每个第一区域包含属于目标类型的对象,第一目标区域为第一区域集合中的最大区域;获取与待裁剪图像对应的第二区域集合中的第二目标区域的第二中心点,每个第二区域包含对待裁剪图像进行显著性检测得到的显著性区域,第二目标区域为第二区域集合中第一中心点所在的第二区域,或者,为第二区域集合中的最大区域;在第一中心点无效时,基于第二中心点从待裁剪图像中裁剪出目标尺寸的裁剪图像;在第一中心点有效时,基于第一中心点和第二中心点从待裁剪图像中裁剪出目标尺寸的裁剪图像。
Description
技术领域
本发明涉及计算机领域,具体而言,涉及一种图像区域的裁剪方法和装置、存储介质及电子装置。
背景技术
目前,在一些场景中,需要对图片(图像)进行图片裁剪,得到图片主体。对于针对目标类型对象的图片,在进行图片裁剪时,需要裁剪后的图片尽可能的包含该目标类型对象。
例如,对于包含特定人员的图像,可以利用人脸检测进行图片主体裁剪。通过人脸检测技术,例如,MTCNN(Multitask Cascaded Convolutional Networks,多任务级联卷积神经网络)、faceboxes等,可以检测到图像中包含的人脸,并基于检测到的人脸定位出图片主***置。
然而,对于不包含人脸的图片或者人脸检测失败的图片,则无法进一步分析图片主体。并且,只分析人脸区域,会忽略人体区域对图片主体中心的偏移影响,裁剪出来的图片与图片主体存在较大偏差。
可见,相关技术中的图像裁剪的方式,存在适用性差,裁剪图片与图片主体容易产生偏差的问题。
发明内容
本发明实施例提供一种图像区域的裁剪方法和装置、存储介质及电子装置,以至少解决相关技术中的图像裁剪的方式,存在适用性差,裁剪图片与图片主体容易产生偏差的技术问题。
根据本发明实施例的一个方面,提供了一种图像区域的裁剪方法,包括:获取与待裁剪图像对应的第一区域集合中的第一目标区域的第一中心点,其中,每个第一区域包含属于目标类型的对象,第一目标区域为第一区域集合中的最大区域;获取与待裁剪图像对应的第二区域集合中的第二目标区域的第二中心点,其中,每个第二区域包含对待裁剪图像进行显著性检测得到的显著性区域,第二目标区域为第二区域集合中第一中心点所在的第二区域,或者,为第二区域集合中的最大区域;在第一中心点为无效点的情况下,基于第二中心点从待裁剪图像中裁剪出目标尺寸的裁剪图像;在第一中心点为有效点的情况下,基于第一中心点和第二中心点从待裁剪图像中裁剪出目标尺寸的裁剪图像。
根据本发明实施例的另一方面,还提供了一种图像区域的裁剪装置,包括:第一获取单元,用于获取与待裁剪图像对应的第一区域集合中的第一目标区域的第一中心点,其中,每个第一区域包含属于目标类型的对象,第一目标区域为第一区域集合中的最大区域;第二获取单元,用于获取与待裁剪图像对应的第二区域集合中的第二目标区域的第二中心点,其中,每个第二区域包含对待裁剪图像进行显著性检测得到的显著性区域,第二目标区域为第二区域集合中第一中心点所在的第二区域,或者,为第二区域集合中的最大区域;第一裁剪单元,用于在第一中心点为无效点的情况下,基于第二中心点从待裁剪图像中裁剪出目标尺寸的裁剪图像;第二裁剪单元,用于在第一中心点为有效点的情况下,基于第一中心点和第二中心点从待裁剪图像中裁剪出目标尺寸的裁剪图像。
根据本发明实施例的又一方面,还提供了一种存储介质,该存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述方法。
根据本发明实施例的又一方面,还提供了一种电子装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,上述处理器通过计算机程序执行上述的方法。
在本发明实施例中,综合利用对象检测和图片显著性主体检测技术对输入图片进行主体裁剪,分别确定待裁剪图像中与对象检测对应的第一中心点和与显著性检测对应的第二中心点,在第一中心点无效时,基于该第二中心点进行图像裁剪,在第一中心点有效时,基于该第一中心点和该第二中心点进行图像裁剪,可以适用于不同的场景,且同时考虑对象与其他物体之间的关系,利用精细化策略得到最合理的裁剪图像,保证了图像裁剪方式的适用性,提高了图像裁剪的合理性,进而解决了相关技术中的图像裁剪的方式,存在适用性差,裁剪图片与图片主体容易产生偏差的问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种图像区域的裁剪方法的应用环境的示意图;
图2是根据本发明实施例的一种可选的图像区域的裁剪方法的流程示意图;
图3是根据本发明实施例的一种可选的客户端显示界面的示意图;
图4是根据本发明实施例的一种可选的图像区域的裁剪方法的示意图;
图5是根据本发明实施例的另一种可选的图像区域的裁剪方法的示意图;
图6是根据本发明实施例的一种可选的训练目标检测模型的示意图;
图7是根据本发明实施例的一种可选的目标检测模型预测的示意图;
图8是根据本发明实施例的又一种可选的图像区域的裁剪方法的示意图;
图9是根据本发明实施例的另一种可选的图像区域的裁剪方法的流程示意图;
图10是根据本发明实施例的一种可选的图像区域的裁剪装置的结构示意图;
图11是根据本发明实施例的一种可选的电子装置的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本发明实施例中所使用的部分术语的解释如下:
(1)显著性检测,指通过智能算法提取图像中的显著区域(即人类感兴趣的区域);
(2)RAS:Reverse Attention for Salient Object Detection,引入注意力机制的显著性检测模型;
显著性特征图:标记图片显著性区域和不显著区域的二值图;
Faceboxes:一种CPU(Central Processing Unit,中央处理器)上实时的人脸检测模型;
人脸特征图:标记图片人脸区域和非人脸区域的二值图。
根据本发明实施例的一个方面,提供了一种图像区域的裁剪方法。可选地,上述图像区域的裁剪方法可以但不限于应用于如图1所示的应用环境中。如图1所示,终端设备102通过目标应用的客户端将初始图像通过网络104发送给服务器106,上述目标应用可以包括但不限于:即时通讯应用、图片处理应用等。由服务器106对初始图像预处理,得到待裁剪图像。
对于待裁剪图像,服务器106可以执行以下步骤:获取与待裁剪图像对应的第一区域集合中的第一目标区域的第一中心点,其中,每个第一区域包含属于目标类型的对象,第一目标区域为第一区域集合中的最大区域;获取与待裁剪图像对应的第二区域集合中的第二目标区域的第二中心点,其中,每个第二区域包含对待裁剪图像进行显著性检测得到的显著性区域,第二目标区域为第二区域集合中第一中心点所在的第二区域,或者,为第二区域集合中的最大区域;在第一中心点为无效点的情况下,基于第二中心点从待裁剪图像中裁剪出目标尺寸的裁剪图像;在第一中心点为有效点的情况下,基于第一中心点和第二中心点从待裁剪图像中裁剪出目标尺寸的裁剪图像。
在得到裁剪图像之后,服务器106可以通过网络104将裁剪图像发送给终端设备102,由终端设备102将裁剪图像进行显示和/或保存。
可选地,在本实施例中,上述终端设备102可以是配置有上述客户端的终端设备,可以包括但不限于以下至少之一:手机(如Android手机、iOS手机等)、笔记本电脑、平板电脑、掌上电脑、移动互联网设备(Mobile Internet Devices,MID)、PAD、台式电脑等。上述网络可以包括但不限于:有线网络,无线网络,其中,该有线网络包括:局域网、城域网和广域网,该无线网络包括:蓝牙、WIFI及其他实现无线通信的网络。上述服务器可以是单一服务器,也可以是由多个服务器组成的服务器集群。上述只是一种示例,本实施例对此不做任何限定。
可选地,在本实施例中,作为一种可选的实施方式,该方法可以由服务器执行,也可以由终端设备执行,或者由服务器和终端设备共同执行,本实施例中,以由服务器执行为例进行说明。如图2所示,上述图像区域的裁剪方法可以包括:
步骤S202,获取与待裁剪图像对应的第一区域集合中的第一目标区域的第一中心点,其中,每个第一区域包含属于目标类型的对象,第一目标区域为第一区域集合中的最大区域;
步骤S204,获取与待裁剪图像对应的第二区域集合中的第二目标区域的第二中心点,其中,每个第二区域包含对待裁剪图像进行显著性检测得到的显著性区域,第二目标区域为第二区域集合中第一中心点所在的第二区域,或者,为第二区域集合中的最大区域;
步骤S206,在第一中心点为无效点的情况下,基于第二中心点从待裁剪图像中裁剪出目标尺寸的裁剪图像;
步骤S208,在第一中心点为有效点的情况下,基于第一中心点和第二中心点从待裁剪图像中裁剪出目标尺寸的裁剪图像。
可选地,上述图像区域的裁剪方法可以但不限于应用图像的横屏转为竖屏的过程中、图片尺寸变换的过程中,对于其他需要进行图像裁剪的场景,均可应用上述图像区域的裁剪方法。
例如,上述图像区域的裁剪方法可以应用于视频封面图横屏转竖屏。目前大部分视频封面,专辑封面图仍然是横屏样式,而随着竖版视频的兴起,封面图也需要适应竖屏风格,此时,一张图同时适应横屏和竖屏要求,需要对图片内容进行主体裁剪。又例如,在社交产品中,对于图文缩略图一般有固定尺寸,而用户上传的图片通常跟这个固定的尺寸比例不同,此时,缩略图只能显示图片的一部分。通过图片主体的选择,图文信息可以更有效地在缩略图中展示图片主要内容。
通过本实施例,综合利用对象检测和图片显著性主体检测技术对输入图片进行主体裁剪,分别确定待裁剪图像中与对象检测对应的第一中心点和与显著性检测对应的第二中心点,在第一中心点无效时,基于该第二中心点进行图像裁剪,在第一中心点有效时,基于该第一中心点和该第二中心点进行图像裁剪,解决了相关技术中的图像裁剪的方式,存在适用性差,裁剪图片与图片主体容易产生偏差的问题,保证了图像裁剪方式的适用性,提高了图像裁剪的合理性。
下面结合图2对上述图像区域的裁剪方法进行说明。
在步骤S202之前,可以获取待裁剪图像。上述待裁剪图像可以是初始图像;可以将初始图像作为待裁剪图像进行处理。上述待裁剪图像也可以是对初始图像进行预处理之后得到的图像,上述预处理可以包括但不限于:比例缩放。
可选地,在本实施例中,在获取与待裁剪图像对应的第一区域集合中的第一目标区域的第一中心点之前,可以获取与初始图像对应的规格参数,其中,规格参数用于表示从初始图像中裁剪出裁剪图像所需的参数信息;在规格参数包括缩放比例的情况下,按照缩放比例对初始图像进行缩放,得到待裁剪图像。
初始图像可以是用户通过客户端上传的图像。在上传初始图像的同时,可以设置裁图(裁剪图像)的尺寸规格(规格参数),如,裁图所指定的长宽是对图片进行固定比例缩放再裁得长宽还是严格根据输入尺寸固定长宽进行裁图。服务器可以对输入规格进行条件判断,判断其是否是有效输入。无效输入包括以下至少之一:输入尺寸不为正数,设定固定长宽裁图而输入尺寸大于图片本身长宽。
例如,在图3所示的客户端界面上,用户可以选择初始图像,并输入在裁图时的缩放比例以及尺寸大小,由服务器基于缩放比例首先确定待裁剪图像。
通过本实施例,通过对初始图像进行比例缩放进而可以满足不同的裁剪需求,提高图像裁剪方式的适用性。
在步骤S202中,获取与待裁剪图像对应的第一区域集合中的第一目标区域的第一中心点,其中,每个第一区域包含属于目标类型的对象,第一目标区域为第一区域集合中的最大区域。
对于待裁剪图像,可以获取与其对应的包含属于目标类型的对象的第一区域集合中的最大区域(第一目标区域)的中心点(第一中心点)。对于不同的图像,其图像主体不同,目标类型的对象也可以不同。例如,对于包含人物的图像,目标类型的对象可以是人脸、或人体的其他部位。对于包含动物的图像,目标类型的对象可以是动物脸、或动物的其他部位。
在获取第一中心点之前,可以确定出第一区域集合。可以对待裁剪图片执行目标类型的对象检测(例如,人脸检测),得到目标对象特征图(例如,人脸特征图),上述目标对象特征图可以用于标记待裁剪图像上的包含目标类型对象的第一区域和非第一区域,目标对象特征图可以是二值图。根据目标对象特征图,可以确定出一个或多个目标对象区域。
例如,目标类型的对象可以是人脸,对待裁剪图像进行人脸检测,得到与待裁剪图像对应的人脸特征二值图。基于人脸特征二值图,可以将面积大于预定面积值的有值区域(该区域内的像素点值均为1,表示有人脸)的边界区域,作为一个人脸区域。
需要说明的是,对于包含多个目标类型的对象的图像(多张人脸),第一区域可以有多个;目标类型的对象可以有重叠,重叠的多个目标类型的对象在一个目标对象区域内。
在得到一个或多个目标对象区域之后,可以根据一个或多个目标对象区域,确定出第一区域集合,进而确定出第一目标区域。
作为一种可选的实施方式,可以将每个目标对象区域作为一个第一区域,得到第一区域集合,并将第一区域集合中面积最大的区域,作为第一目标区域。
作为另一种可选的实施方式,在目标对象区域有多个的情况下,可以连通距离相近的目标对象区域,得到一个或多个第一连通区域,每个第一连通区域可以作为一个第一区域,得到第一区域集合。
连通距离相近的目标对象区域的方式可以有多种。例如,可以采用对目标对象特征图进行膨胀处理,将膨胀处理后具有交集的目标对象区域进行连通,得到一个或多个第一连通区域。
可选地,在本实施例中,在获取与待裁剪图像对应的第一区域集合中的第一目标区域的第一中心点之前,对待裁剪图像进行目标对象检测,获取目标对象区域,其中,目标对象检测用于检测待裁剪图像所包含的目标类型的对象;在目标对象区域为多个的情况下,使用第一膨胀系数分别对多个目标对象区域进行膨胀处理,得到多个第一膨胀区域;将多个第一膨胀区域中具有交集的第一膨胀区域进行合并,得到第一区域集合;从第一区域集合中确定出第一目标区域。
可以使用第一膨胀系数分别对每个目标对象区域进行膨胀处理。膨胀处理可以是:将目标对象区域向外扩展与第一膨胀系数对应的长、宽膨胀值。第一膨胀系数可以是一个固定值,也可以是一个相对值。与第一膨胀系数对应的长度膨胀值和宽度膨胀值可以是相同的,也可以是不同的。第一膨胀系数可以是:裁剪图像的尺寸与目标对象区域的尺寸的比值(面积比值、长度比值、宽度比值等),可以是与目标对象区域的尺寸正相关的预定值(不同的面积区域对应于不同的预定值),还可以是预先设定的固定值。
例如,裁剪图像的尺寸为:60*80,目标对象区域的尺寸为:20*20,第一膨胀系数为:裁剪图像的面积与目标对象区域的面积的比值,则目标对象区域的各个边的膨胀值为:(60*80)/(20*20)=12,目标对象区域的边分别向外扩展12个像素值(也可以是各个边分别向外扩展6个像素值)。第一膨胀系数为:裁剪图像的边与目标对象区域的对应边的比值,则,目标对象区域的长的膨胀值为:60/20=3,目标对象区域的长向外扩展3个像素值,目标对象区域的宽的膨胀值为:80/20=4,宽向外扩展4个像素值。
又例如,目标对象区域的尺寸为:20*20,第一膨胀系数为(第一个参数为目标对象的尺寸范围,第二个参数为对应的膨胀值):(0,100],5;(100,400],10;(400,800],15,(800,裁剪图像尺寸],20。目标对象区域的尺寸为400,对应的膨胀系数为10,目标对象区域的边分别向外扩展10个像素值。
又例如,目标对象区域的尺寸为:20*40,第一膨胀系数为固定值:10,目标对象区域的边分别向外扩展10个像素值。第一膨胀系数为固定值:5,10,目标对象区域的长向外扩展5个像素值,宽向外扩展10个像素值。第一膨胀系数为固定值:5,5*(宽度/长度),目标对象区域的长向外扩展5个像素值,宽向外扩展10个像素值。
在对多个目标对象区域分别进行膨胀处理之后,可以得到多个第一膨胀区域。将多个第一膨胀区域中具有交集的第一膨胀区域(第一膨胀区域连通)进行合并,得到第一区域集合,并将第一区域集合中面积最大的区域,确定为第一目标区域。
例如,如图4和图5所示,对于确定出的8个人脸区域,分别对各目标对象区域进行膨胀处理(如图4左半部分所示),得到8个第一膨胀区域(如如图4右半部分所示),将8个第一膨胀区域中具有交集的第一膨胀区域进行合并,得到如图5所示的4个第一区域,并将最大的第一区域确定为第一目标区域。
通过本实施例,通过对待裁剪图像进行目标对象检测得到的多个目标对象区域进行膨胀处理,并选取最大连通区域作为第一目标区域,可以将不重叠而距离又较近的目标对象区域连通,使得裁剪图像包含尽可能多的目标类型的对象,提高图像裁剪的准确性。
在确定出第一目标区域之后,可以从第一目标区域中,确定出第一目标区域的中心点(第一中心点)。
下面结合可选示例对第一中心点的确定方式进行说明。在本示例中,目标类型的对象为人脸。
对待裁剪图像进行人脸检测。人脸检测可以使用FaceBoxes算法,保证算法在CPU上满足效果的同时实现实时人脸检测。FaceBoxes算法由快速消化的卷积层和多尺度卷积层构成。前者注重效能,保证FaceBoxes可以在CPU上实现实时检测;后者注重效果,它的目的是利用不同层输出丰富感受野,处理不同大小尺度的人脸。使用这一算法,平均每张图可以在单核CPU上在150ms内检测人脸。
如果检测到人脸(人脸特征二值图有效),则对特征图进行膨胀处理,然后求最大连通区域的中心点。做膨胀处理是希望将相靠近的几张人脸经过处理后连成一个整体连通区域,处理后求得的中心点就是考虑了几张人脸求得的中心点。基于此中心点确定裁图区域的中心,可以尽可能显示所有人脸。
在步骤S204中,获取与待裁剪图像对应的第二区域集合中的第二目标区域的第二中心点,其中,每个第二区域包含对待裁剪图像进行显著性检测得到的显著性区域,第二目标区域为第二区域集合中第一中心点所在的第二区域,或者,为第二区域集合中的最大区域。
对于待裁剪图像,可以获取与其对应的第二区域集合中的第二目标区域的第二中心点。
在获取第二目标区域的第二中心点之前,可以首先确定出第二区域集合。可以对待裁剪图片执行显著性检测,得到显著性特征图,上述显著性特征图可以用于标记待裁剪图像上的显著性区域(显著区域)的非显著性区域(不显著区域),显著性特征图可以是二值图。根据显著性特征图,可以确定出一个或多个显著区域。
例如,对待裁剪图像进行显著性检测,得到与待裁剪图像对应的显著性特征二值图。基于显著性特征二值图,可以将面积大于预定面积值的有值区域(该区域内的像素点值均为1,表示有人脸)的边界区域,作为一个显著性区域。
在进行显著性检测时,可以使用显著性检测模型或者显著性检测模型的子模型对待裁剪图像进行显著性检测。
可选地,在本实施例中,在获取与待裁剪图像对应的第二区域集合中的第二目标区域的第二中心点之前,可以将待裁剪图像输入到目标检测模型中,获取目标检测模型的目标侧输出层输出的侧输出显著性图,其中,目标检测模型用于对待裁剪图像进行显著性检测,目标检测模型包括第二数量的侧输出层,目标侧输出层为目标检测模型的前第一数量的侧输出层,第一数量小于第二数量;根据侧输出显著性图,获取与待裁剪图像对应的显著性特征图;从显著性特征图中确定出显著性区域。
为了保证显著性检测的准确性和及时性,可以在模型训练时,使用目标检测模型(用于对待裁剪图像进行显著性检测的显著性检测模型)进行模型训练,确定出模型参数,以保证显著性检测的准确性;在模型使用时,使用目标检测模型的子模型进行待裁剪图像的显著性检测,以保证显著性检测的及时性。
目标检测模型可以是一种卷积神经网络(目标神经网络),包含多个卷积层,多个卷积层可以划分为多个阶段,每个阶段的最后一个卷积层可以具有一个侧输出层(sideoutput layer)。经过卷积神经网络以及各级side output layer后输出一个结果称之为global saliency map(全局显著性图)。由于global saliency map只有输入图片(待裁剪图像)的1/N(N可以大于或者等于2的正整数,例如,32),可以在每一个side output(侧输出)学习残差特征来逐步提高分辨率。残差学习通过从侧输出特征中擦除当前预测的显著区域,将关注点放在未被确定显著区域的部分细节,以便使用这个网络可以得到准确性高、分辨率高的显著性特征图。
在使用目标检测模型进行预测时,如果继续使用原有网络,可以得到细节丰富的显著性特征图,但是检测耗时会很大。为了均衡效能,可以简化原有目标神经网络作为检测网络,只使用前第一数量的侧输出层的侧输出显著性图,牺牲一部分显著性特征边缘细节的准确度,平衡效果与效能,缩减检测时间,保证显著性检测能在CPU上进行检测。
根据前第一数量的侧输出层的侧输出显著性图,获取与待裁剪图像对应的显著性特征图,并从显著性特征图中确定出显著性区域。
通过本实施例,在进行显著性检测时使用目标检测模型的前第一数量的侧输出层的侧输出显著性图,根据侧输出显著性图,获取显著性特征图,可以兼顾显著性检测的准确性和及时性。
下面结合可选示例对显著性检测的方式进行说明。在本示例中,显著性检测使用的目标检测模型可以是:RAS模型。
如图6所示,在进行模型训练时,使用的是原RAS模型。原RAS结构是基于VGG16,网络模型先是为VGG16的每个阶段的最后一个卷积层(conv1_2,conv2_2,conv3_3,conv4_3,conv5_3)增加一个side output layer(如图6所示,第一列只显示出每个阶段的输出s-out,步长分别为1,2,4,8,16)。
经过VGG网络及各级side output layer后输出一个结果,称之为globalsaliency map。由于global saliency map只有输入图片的1/32,可以在每一个sideoutput学习残差特征来逐步提高分辨率。残差学习通过从侧输出特征中擦除当前预测的显著区域,将关注点放在未被确定显著区域的部分细节。使用这个网络可以得到准确性高分辨率高的显著性特征图。
如图7所示,在进行预测时,使用的是简化的RAS模型,只使用前三个side output,牺牲一部分显著性特征边缘细节的准确度,平衡效果与效能,保证显著性检测能在CPU上进行检测。
在得到一个或多个显著性区域之后,可以根据一个或多个显著性区域,确定出第二区域集合,进而确定出第二目标区域。
作为一种可选的实施方式,可以将每个显著性区域作为一个第二区域,得到第二区域集合。
作为另一种可选的实施方式,在显著性区域有多个的情况下,可以连通距离相近的显著性区域,得到一个或多个第二连通区域,每个第二连通区域可以作为一个第二区域,得到第二区域集合。
连通距离相近的目标对象区域的方式可以有多种。例如,可以采用对显著性特征图进行膨胀处理,将膨胀处理后具有交集的显著性区域进行连通,得到一个或多个第二连通区域。
可选地,在本实施例中,在获取与待裁剪图像对应的第二区域集合中的第二目标区域的第二中心点之前,可以对待裁剪图像进行显著性检测,获取显著性区域;在显著性区域为多个的情况下,使用第二膨胀系数分别对多个显著性区域进行膨胀处理,得到多个第二膨胀区域;将多个第二膨胀区域中具有交集的第二膨胀区域进行合并,得到第二区域集合;在第一中心点位于第二区域集合内的情况下,将第二区域集合中第一中心点所在的第二区域确定为第二目标区域;在第一中心点位于第二区域集合外的情况下,将第二区域集合中的最大区域确定为第二目标区域。
可以使用第二膨胀系数分别对每个显著性区域进行膨胀处理。膨胀处理可以是:将显著性区域向外扩展与第二膨胀系数对应的长、宽膨胀值。第二膨胀系数可以是一个固定值,也可以是一个相对值。与第二膨胀系数对应的长度膨胀值和宽度膨胀值可以是相同的,也可以是不同的。第二膨胀系数可以是:裁剪图像的尺寸与显著性区域的尺寸的比值(面积比值、长度比值、宽度比值等),可以是与显著性区域的尺寸正相关的预定值(不同的面积区域对应于不同的预定值),还可以是预先设定的固定值。
第二膨胀系数的限定方式以及对应膨胀值的确定方式与第一膨胀系数类似,在此不作赘述。
在对多个显著性区域分别进行膨胀处理之后,可以得到多个第二膨胀区域。将多个第二膨胀区域中具有交集的第二膨胀区域(第二膨胀区域连通)进行合并,得到第二区域集合。
在得到第二区域集合之后,可以从第二区域集合中确定出第二目标区域。在第一中心点位于第二区域集合内的情况下,将第二区域集合中第一中心点所在的第二区域确定为第二目标区域;在第一中心点位于第二区域集合外的情况下,将第二区域集合中的最大区域确定为第二目标区域,并将第二目标区域的中心点作为第二中心点。
例如,如图5所示,图5中示出的各个区域为第二连通区域。如果第一中心点的位置为位置A,则将区域3确定为第二目标区域。如果第一中心点的位置为位置B,则将区域2确定为第二目标区域。
在确定出第二目标区域之后,可以将第二目标区域的中心点确定为第二中心点。
通过本实施例,通过对待裁剪图像进行显著性检测得到的多个显著性区域进行膨胀处理,并选取最大连通区域作为第二目标区域,可以将不重叠而距离又较近的显著性区域连通,使得裁剪图像包含尽可能多的显著性对象,提高图像裁剪的准确性。
在获取到第一中心点和第二中心点之后,可以确定裁剪图像的中心点,从而可以根据裁剪图像的中心点以及目标尺寸对待裁剪图像进行裁剪,得到裁剪图像。
对于不同的图像,第一中心点和第二中心点的有效情况可以是不同的,可以包括:第一中心点为有效点,第二中心点为有效点;第二中心点为有效点,第二中心点为无效点;第一中心点为无效点,第二中心点为有效点;第一中心点为无效点,第二中心点为无效点。对于不同的情况,可以采用不同的方式确定裁剪图像的中心点,进而裁剪出裁剪图像。
在步骤S206中,在第一中心点为无效点的情况下,基于该第二中心点从待裁剪图像中裁剪出目标尺寸的裁剪图像。
在第一中心点为无效点时,可以确定出待裁剪图像不包含目标类型的对象,可以基于该第二中心点从待裁剪图像中裁剪出目标尺寸的裁剪图像。
可选地,在本实施例中,基于第二中心点从待裁剪图像中裁剪出目标尺寸的裁剪图像可以包括:在第二中心点为无效点的情况下,以待裁剪图像的第三中心点为中心,从待裁剪图像中裁剪出目标尺寸的裁剪图像;在第二中心点为有效点的情况下,以第二中心点为中心,从待裁剪图像中裁剪出目标尺寸的裁剪图像。
如果第一中心点和第二中心点均为无效点,可以以待裁剪图像的中心点为中心,从待裁剪图像中裁剪出目标尺寸的裁剪图像。
如果第一中心点为无效点,第二中心点为有效点,可以以第二中心点为中心,从待裁剪图像中裁剪出目标尺寸的裁剪图像,保证图像裁剪的效果至少与利用显著性检测进行图片主体裁剪的效果相同。
通过本实施例,在第一中心点为无效点时,根据第二中心点是否有效采用不同的方式进行图像裁剪,可以保证图像裁剪的准确性。
在步骤S208中,在第一中心点为有效点的情况下,基于第一中心点和第二中心点从待裁剪图像中裁剪出目标尺寸的裁剪图像。
在第一中心点为有效点时,可以确定出待裁剪图像包含目标类型的对象,可以基于该第一中心点和第二中心点从待裁剪图像中裁剪出目标尺寸的裁剪图像。
可选地,在本实施例中,基于第一中心点和第二中心点从待裁剪图像中裁剪出目标尺寸的裁剪图像可以包括:在第二中心点为无效点的情况下,以第一中心点为中心,从待裁剪图像中裁剪出目标尺寸的裁剪图像;在第二中心点为有效点,且第一中心点位于第二目标区域内的情况下,对第一中心点和第二中心点进行加权求和,获取到目标点;以目标点为中心,从待裁剪图像中裁剪出目标尺寸的裁剪图像;在第二中心点为有效点,且第一中心点位于第二目标区域外的情况下,以第二中心点为中心,从待裁剪图像中裁剪出目标尺寸的裁剪图像。
如果第一中心点为有效点,第二中心点为无效点,可以第一中心点为中心,从待裁剪图像中裁剪出目标尺寸的裁剪图像。
如果第一中心点和第二中心点为有效点,可以对第一中心点和第二中心点进行加权求和,得到目标点,以目标点为中心,从待裁剪图像中裁剪出目标尺寸的裁剪图像,或者,以第一中心点为中心,从待裁剪图像中裁剪出目标尺寸的裁剪图像,或者,以第二中心点为中心,从待裁剪图像中裁剪出目标尺寸的裁剪图像。
可选地,如果第一中心点和第二中心点为有效点,还可以进一步确定第一中心点是否位于第二目标区域内,并根据第一中心点与第二目标区域的位置关系,确定裁剪图像的中心点。
如果第一中心点位于第二目标区域内,可以确定显著性区域和目标对象区域重叠较多(目标类型的对象属于显著性对象),可以对第一中心点和第二中心点进行加权求和,得到目标点,以目标点为中心,从待裁剪图像中裁剪出目标尺寸的裁剪图像。加权的权值可以根据需要进行设定,如果希望裁剪图像包含更多的目标类型的对象,可以增加第一中心点的权重,如果希望裁剪图像包含更多的显著性区域,可以增加第二中心点的权重。
如果第一中心点位于第二目标区域外,可以确定显著性区域和目标对象区域重叠较少(目标类型的对象不是显著性对象),目标类型的对象不是待裁剪图像的主体部分,可以以第二中心点为中心,从待裁剪图像中裁剪出目标尺寸的裁剪图像。
通过本实施例,在第一中心点为有效点时,根据第二中心点是否有效、以及第一中心点与第二目标区域的位置采用不同的方式进行图像裁剪,可以保证图像裁剪的准确性。
下面结合可选示例对图像裁剪的方式进行说明。在本示例中,结合人脸检测和显著性检测,使用一套自适应裁图策略。待裁剪图像可以分为以下类别:
类别1:包含人脸图片并且图片显著部位与人脸主体(或人脸集中区域)重合;
类别2:包含人脸图片但图片显著部位与人脸主体(或人脸集中区域)不重合;
类别3:包含人脸图片但图片整体色调光线不明显导致无显著区域;
类别4:不包含人脸图片但包含其他物体;
类别5:整体无显著区域的图片。
以上类别中,人脸检测算法能起作用的类别包括类别1、2、3,显著性检测算法能起作用的类别包括1、2、4。因此,综合使用人脸检测算法和显著性检测算法对图片进行裁图,可以覆盖几乎所有类型的图片。另外,本示例中的图像裁剪方法可以做到使人脸检测算法和显著性检测算法互补的效果,当其中一个算法出现漏检或误检时,另一个算法可以做到一定纠正的作用。如:人脸检测漏检,裁图策略仍然可以根据显著人体区域裁出主体区域。
在实现时,人脸检测算法对应得到人脸特征图,抽象计算出特征图最大区域质心f_center(第一中心点),显著性检测算法对应得到显著性特征图,并根据人脸检测结果抽象计算出显著性特征图包含人脸的最大区域质心(如果无,则只计算最大区域重心)s_center。对于f_center,其点坐标为(f_centerx,f_centery);对于s_center,其点坐标为(s_centerx,s_centery)。
我们设置一个统一的权重ω权衡f_center和s_center对最终裁图中心点center坐标(centerx,centery)的影响,公式如公式(1)所示:
其中,权重参数ω正比于f_center所在的人脸区域面积f_area(第一目标区域的面积)除以s_center所在的显著性区域面积s_area(第er目标区域的面积),如公式(2)所示:
考虑所有情况,ω的取值如公式(3)所示:
其中,fs_area是人脸区域与显著性区域重合面积。达到的效果是人脸比重越大,全图中心越往人脸方向偏。我们设置s_center的初始值为全图正中心,上式1对应处理图片类别3,上式2对应处理图片类别1,上式3对应处理图片类别2、4、5。
在裁剪出裁剪图像之后,服务器可以将裁剪图像发送给上传初始图像的客户端,并在运行该客户端的终端设备上显示。
下面结合可选示例对上述图像区域的裁剪方法进行说明。在本示例中,目标类型的对象为人脸,目标对象区域为人脸区域。
相关技术中,可以利用人脸检测进行图片主体裁剪(方式一)。对不包含人脸的图片或者人脸检测失败的图片,无法进一步分析图片主体。另外,只分析人脸区域,会忽略人体区域对图片主体中心的偏移影响,裁剪出来的主体区域无法尽可能包含更多人体内容。并且,当人脸区域不重叠而距离又较近时,容易错误地把其中一张脸作为图片主体中心,将其他人脸裁得不完整。
除了利用人脸检测进行图片主体裁剪以外,还可以采用以下方式进行图片主体裁剪:
方式二:利用人脸检测加背景识别进行图片主体裁剪
可以先对图片进行人脸检测,方法与方式一类似。当图片检测人脸失败时,采用图片分块算法,计算出左右上下的背景部分,对图片标定背景。随后将除去背景部分的框标定为图片的主体部分。
图片分块算法用了合并的思想,就是从图像的像素开始,不停地合并相似度大的相邻像素,是一种基于图的图像分割算法。当画面非常复杂的时候,这样的背景识别效果不明显,图片主体仍然无法确定。对于图片中物体复杂的情况也难以辨别。另外,该方式旨在尽量包含主体区域,当背景部分过度删除或规格不合适时,只能通过填充空位来合成规格样式。
方式三:利用显著性检测进行图片主体裁剪
利用基于深度学习显著性检测对图片进行检测的手法也可以对图片主体进行有效地裁剪。
上述方式一方面是忽略了人物信息,比如一个平躺着的人,会截到人体的中间部分。另一方面现阶段显著性检测使用的算法只能做到GPU下的实时运行,在只有CPU的环境下效能较低。
本示例中的图像区域的裁剪方法不需要人工干预,适用于对同一张图片进行自适应性裁剪以满足不同尺寸规格要求的场景,也可以用作素材提取作为海报制图的基础。本示例中的图像区域的裁剪方法可以对图片进行人脸检测和显著性检测之后,分别得到人脸特征图和显著性特征图。根据不同图片不同的检测情况,可以通过以下方式定位图片主体区域:对人脸特征图分析可找到最主要人脸区域的几何中心;对显著性特征图进行膨胀处理后可选取最大连通区域的几何中心;综合两个特征图可找到最主要人脸区域所在的显著性区域,综合分析出最优几何中心。
与前述方式一~方式三相比,本示例中的图像区域的裁剪方法具有以下优点:
与方式一相比,本示例中的图像区域的裁剪方法对于不包含人脸的图片,使用显著性特征图进行图片裁剪;针对对于包含人脸的图片本发明综合人脸检测和显著性特征图对中心进行调整;针对多人脸问题,对人脸区域先进行膨胀,让相邻的人脸连成一个人脸区域。
与方式二相比,本示例中的图像区域的裁剪方法不使用背景识别,直接采用基于深度学习的显著性检测,对目前已有的深度学习网络进行简化得到效能较高并且只关注突出区域的算法;且直接提供规格样式自由选择。
与方式三相比,示例中的图像区域的裁剪方法同时考虑人脸与人体和其他物体之间的关系,利用精细化策略得到最合理的裁图区域;在保证效果的前提下做到CPU环境下运行效能的提高。
各图像区域的裁剪方式的比较结果可以如表1所示,方式一、方式三和方式四的识别结果可以如图8所示,其中,方式四为本示例中的图像区域的裁剪方法。
表1
如图9所示,本示例中的图像区域的裁剪方法可以包括以下步骤:
步骤1,输入图片。
对于输入的图片,可以设置裁图的尺寸规格,如裁图指定的长宽是对图片进行固定比例缩放再裁得长宽还是严格根据输入尺寸固定长宽进行裁图。对输入规格进行条件判断,判断其是否是有效输入。这里无效输入包括,输入尺寸不为正数,设定固定长宽裁图而输入尺寸大于图片本身长宽。
步骤2,进行人脸检测,输出一张人脸区域特征二值图。
可以使用faceboxes模型对输入的图片进行人脸检测。人脸检测完成后输出一张人脸区域特征二值图。
步骤3,连通相近人脸区域,确定最大连通区域的中心点。
如果检测到人脸(即二值图有效),则对特征图进行膨胀处理,然后求最大连通区域的中心点f_center。做膨胀处理是希望将相靠近的几张人脸经过处理后连成一个整体连通区域,处理后求得的中心点就是考虑了几张人脸求得的中心点。
步骤4,进行显著性检测,输出一张显著性特征二值图。
可以使用基于Reverse Attention的显著性检测方法(RAS)对对输入的图片进行显著性检测,输出一张显著性特征二值图。
步骤5,连通相近区域,确定特定连通区域的中心点。
可以对显著性特征图进行膨胀处理,原理和步骤3类似,希望将相邻的几个原本不相连的显著性区域连成一个整体。与步骤3不同的是,当人脸检测检测到人脸时,显著性特征图不求最大连通区域中心点,而是求f_center所处的连通区域的中心点s_center。当人脸检测没检测到人脸时,求最大连通区域中心点s_center,或者,与f_center最近的连通区域的中心点s_center。
步骤6,根据求得的f_center和s_center,确定裁图中心。
可以分以下几种情况处理:
情况1:f_center和s_center均无有效图,最终裁图中心center取全图中心点;
情况2:f_center无有效值,s_center有值,最终裁图中心center=s_center;
情况3:f_center和s_center均有值但f_center不在s_center所在的显著性区域内,最终裁图中心center=s_center;
情况4:f_center和s_center均有值且f_center在s_center所在的显著性区域内,最终裁图中心center=w*f_center+(1-w)*s_center,其中,w为加权系数。
情况5:f_center有值,s_center无有效值,最终裁图中心center=f_center。
步骤7,对图片执行裁剪操作,得到裁剪后的图片。
可以以确定的裁图中心为中心点,从输入的图片(或者,比例缩放后的图片)中裁剪出与用户输入的尺寸规格对应的图片。
通过本示例中的图像区域的裁剪方法,图片自适应裁剪对于网页多样式图片处理,视频封面图处理以及人工智能设计海报能够提供很大的便利,图片运营人员和设计人员可以更加方便地处理大批图片。同时在图片展示效果上,将裁剪合适的图片展示给用户,也能很好地提高用户使用相关产品的体验。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
根据本发明实施例的另一个方面,还提供了一种用于实施上述图像区域的裁剪方法的图像区域的裁剪装置,如图10所示,该装置包括:
(1)第一获取单元1002,用于获取与待裁剪图像对应的第一区域集合中的第一目标区域的第一中心点,其中,每个所述第一区域包含属于目标类型的对象,所述第一目标区域为所述第一区域集合中的最大区域;
(2)第二获取单元1004,用于获取与所述待裁剪图像对应的第二区域集合中的第二目标区域的第二中心点,其中,每个所述第二区域包含对所述待裁剪图像进行显著性检测得到的显著性区域,所述第二目标区域为所述第二区域集合中所述第一中心点所在的第二区域,或者,为所述第二区域集合中的最大区域;
(3)第一裁剪单元1006,用于在所述第一中心点为无效点的情况下,基于所述第二中心点从所述待裁剪图像中裁剪出目标尺寸的裁剪图像;
(4)第二裁剪单元1008,用于在所述第一中心点为有效点的情况下,基于所述第一中心点和所述第二中心点从所述待裁剪图像中裁剪出目标尺寸的裁剪图像。
可选地,上述图像区域的裁剪装置可以但不限于应用图像的横屏转为竖屏的过程中、图片尺寸变换的过程中,对于其他需要进行图像裁剪的场景,均可应用上述图像区域的裁剪装置。
可选地,第一获取单元1002可以用于执行上述步骤S202,第二获取单元1004可以用于执行上述步骤S204,第一裁剪单元1006可以用于执行上述步骤S206,第二裁剪单元1008可以用于执行上述步骤S208。
通过本实施例,综合利用对象检测和图片显著性主体检测技术对输入图片进行主体裁剪,分别确定待裁剪图像中与对象检测对应的第一中心点和与显著性检测对应的第二中心点,在第一中心点无效时,基于该第二中心点进行图像裁剪,在第一中心点有效时,基于该第一中心点和该第二中心点进行图像裁剪,解决了相关技术中的图像裁剪的方式,存在适用性差,裁剪图片与图片主体容易产生偏差的问题,保证了图像裁剪方式的适用性,提高了图像裁剪的合理性。
作为一种可选的实施方案,第一裁剪单元1006包括:
(1)第一裁剪模块,用于在所述第二中心点为无效点的情况下,以所述待裁剪图像的第三中心点为中心,从所述待裁剪图像中裁剪出所述目标尺寸的所述裁剪图像;
(2)第二裁剪模块,用于在所述第二中心点为有效点的情况下,以所述第二中心点为中心,从所述待裁剪图像中裁剪出所述目标尺寸的所述裁剪图像。
通过本实施例,在第一中心点为无效点时,根据第二中心点是否有效采用不同的方式进行图像裁剪,可以保证图像裁剪的准确性。
作为一种可选的实施方案,所述第二裁剪单元1008包括:
(1)第三裁剪模块,用于在所述第二中心点为无效点的情况下,以所述第一中心点为中心,从所述待裁剪图像中裁剪出所述目标尺寸的所述裁剪图像;
(2)第四裁剪模块,用于在所述第二中心点为有效点,且所述第一中心点位于所述第二目标区域内的情况下,对所述第一中心点和所述第二中心点进行加权求和,获取到目标点;以所述目标点为中心,从所述待裁剪图像中裁剪出所述目标尺寸的所述裁剪图像;
(3)第五裁剪模块,用于在所述第二中心点为有效点,且所述第一中心点位于所述第二目标区域外的情况下,以所述第二中心点为中心,从所述待裁剪图像中裁剪出所述目标尺寸的所述裁剪图像。
通过本实施例,在第一中心点为有效点时,根据第二中心点是否有效、以及第一中心点与第二目标区域的位置采用不同的方式进行图像裁剪,可以保证图像裁剪的准确性。
作为一种可选的实施方案,上述装置还包括:
(1)第一检测单元,用于在获取与待裁剪图像对应的第一区域集合中的第一目标区域的第一中心点之前,对待裁剪图像进行目标对象检测,获取目标对象区域,其中,目标对象检测用于检测待裁剪图像所包含的目标类型的对象;
(2)第一膨胀处理单元,用于在目标对象区域为多个的情况下,使用第一膨胀系数分别对多个目标对象区域进行膨胀处理,得到多个第一膨胀区域;
(3)第一合并单元,用于将多个第一膨胀区域中具有交集的第一膨胀区域进行合并,得到第一区域集合;
(4)第一确定单元,用于从第一区域集合中确定出第一目标区域。
通过本实施例,通过对待裁剪图像进行目标对象检测得到的多个目标对象区域进行膨胀处理,并选取最大连通区域作为第一目标区域,可以将不重叠而距离又较近的目标对象区域连通,使得裁剪图像包含尽可能多的目标类型的对象,提高图像裁剪的准确性。
作为一种可选的实施方案,上述装置还包括:
(1)第二检测单元,用于在获取与待裁剪图像对应的第二区域集合中的第二目标区域的第二中心点之前,对待裁剪图像进行显著性检测,获取显著性区域;
(2)第二膨胀处理单元,用于在显著性区域为多个的情况下,使用第二膨胀系数分别对多个显著性区域进行膨胀处理,得到多个第二膨胀区域;
(3)第二合并单元,用于将多个第二膨胀区域中具有交集的第二膨胀区域进行合并,得到第二区域集合;
(4)第二确定单元,用于在第一中心点位于第二区域集合内的情况下,将第二区域集合中第一中心点所在的第二区域确定为第二目标区域;
(5)第三确定单元,用于在第一中心点位于第二区域集合外的情况下,将第二区域集合中的最大区域确定为第二目标区域。
通过本实施例,通过对待裁剪图像进行显著性检测得到的多个显著性区域进行膨胀处理,并选取最大连通区域作为第二目标区域,可以将不重叠而距离又较近的显著性区域连通,使得裁剪图像包含尽可能多的显著性对象,提高图像裁剪的准确性。
作为一种可选的实施方案,上述装置还包括:
(1)输入单元,用于在获取与待裁剪图像对应的第二区域集合中的第二目标区域的第二中心点之前,将待裁剪图像输入到目标检测模型中,获取目标检测模型的目标侧输出层输出的侧输出显著性图,其中,目标检测模型用于对待裁剪图像进行显著性检测,目标检测模型包括第二数量的侧输出层,目标侧输出层为目标检测模型的前第一数量的侧输出层,第一数量小于第二数量;
(2)第三获取单元,用于根据侧输出显著性图,获取与待裁剪图像对应的显著性特征图;
(3)第四确定单元,用于从显著性特征图中确定出显著性区域。
通过本实施例,在进行显著性检测时使用目标检测模型的前第一数量的侧输出层的侧输出显著性图,根据侧输出显著性图,获取显著性特征图,可以兼顾显著性检测的准确性和及时性。
作为一种可选的实施方案,上述装置还包括:
(1)第四获取单元,用于在获取与待裁剪图像对应的第一区域集合中的第一目标区域的第一中心点之前,获取与初始图像对应的规格参数,其中,规格参数用于表示从初始图像中裁剪出裁剪图像所需的参数信息;
(2)缩放单元,用于在规格参数包括缩放比例的情况下,按照缩放比例对初始图像进行缩放,得到待裁剪图像。
通过本实施例,通过对初始图像进行比例缩放进而可以满足不同的裁剪需求,提高图像裁剪方式的适用性。
根据本发明的实施例的又一方面,还提供了一种存储介质,该存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的计算机程序:
S1,获取与待裁剪图像对应的第一区域集合中的第一目标区域的第一中心点,其中,每个第一区域包含属于目标类型的对象,第一目标区域为第一区域集合中的最大区域;
S2,获取与待裁剪图像对应的第二区域集合中的第二目标区域的第二中心点,其中,每个第二区域包含对待裁剪图像进行显著性检测得到的显著性区域,第二目标区域为第二区域集合中第一中心点所在的第二区域,或者,为第二区域集合中的最大区域;
S3,在第一中心点为无效点的情况下,基于第二中心点从待裁剪图像中裁剪出目标尺寸的裁剪图像;
S4,在第一中心点为有效点的情况下,基于第一中心点和第二中心点从待裁剪图像中裁剪出目标尺寸的裁剪图像。
可选地,在本实施例中,本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(Random Access Memory,RAM)、磁盘或光盘等。
根据本发明实施例的又一个方面,还提供了一种用于实施上述图像区域的裁剪方法的电子装置,如图11所示,该电子装置包括:处理器1102、存储器1104、传输装置1106等。该存储器中存储有计算机程序,该处理器被设置为通过计算机程序执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
S1,获取与待裁剪图像对应的第一区域集合中的第一目标区域的第一中心点,其中,每个第一区域包含属于目标类型的对象,第一目标区域为第一区域集合中的最大区域;
S2,获取与待裁剪图像对应的第二区域集合中的第二目标区域的第二中心点,其中,每个第二区域包含对待裁剪图像进行显著性检测得到的显著性区域,第二目标区域为第二区域集合中第一中心点所在的第二区域,或者,为第二区域集合中的最大区域;
S3,在第一中心点为无效点的情况下,基于第二中心点从待裁剪图像中裁剪出目标尺寸的裁剪图像;
S4,在第一中心点为有效点的情况下,基于第一中心点和第二中心点从待裁剪图像中裁剪出目标尺寸的裁剪图像。
可选地,本领域普通技术人员可以理解,图11所示的结构仅为示意,电子装置也可以是如图1所示的终端设备102或者服务器106。图11其并不对上述电子装置的结构造成限定。例如,电子装置还可包括比图11中所示更多或者更少的组件(如网络接口等),或者具有与图11所示不同的配置。
其中,存储器1104可用于存储软件程序以及模块,如本发明实施例中的图像区域的裁剪方法和装置对应的程序指令/模块,处理器1102通过运行存储在存储器1104内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述图像区域的裁剪方法。存储器1104可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器1104可进一步包括相对于处理器1102远程设置的存储器,这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
上述的传输装置1106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括有线网络及无线网络。在一个实例中,传输装置1106包括一个网络适配器(NetworkInterface Controller,NIC),其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中,传输装置1106为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (15)
1.一种图像区域的裁剪方法,其特征在于,包括:
获取与待裁剪图像对应的第一区域集合中的第一目标区域的第一中心点,其中,每个所述第一区域包含属于目标类型的对象,所述第一目标区域为所述第一区域集合中的最大区域;
获取与所述待裁剪图像对应的第二区域集合中的第二目标区域的第二中心点,其中,每个所述第二区域包含对所述待裁剪图像进行显著性检测得到的显著性区域,所述第二目标区域为所述第二区域集合中所述第一中心点所在的第二区域,或者,为所述第二区域集合中的最大区域;
在所述第一中心点为无效点的情况下,基于所述第二中心点从所述待裁剪图像中裁剪出目标尺寸的裁剪图像;
在所述第一中心点为有效点的情况下,基于所述第一中心点和所述第二中心点从所述待裁剪图像中裁剪出目标尺寸的裁剪图像。
2.根据权利要求1所述的方法,其特征在于,基于所述第二中心点从所述待裁剪图像中裁剪出所述目标尺寸的所述裁剪图像包括:
在所述第二中心点为无效点的情况下,以所述待裁剪图像的第三中心点为中心,从所述待裁剪图像中裁剪出所述目标尺寸的所述裁剪图像;
在所述第二中心点为有效点的情况下,以所述第二中心点为中心,从所述待裁剪图像中裁剪出所述目标尺寸的所述裁剪图像。
3.根据权利要求1所述的方法,其特征在于,基于所述第一中心点和所述第二中心点从所述待裁剪图像中裁剪出所述目标尺寸的所述裁剪图像包括:
在所述第二中心点为无效点的情况下,以所述第一中心点为中心,从所述待裁剪图像中裁剪出所述目标尺寸的所述裁剪图像;
在所述第二中心点为有效点,且所述第一中心点位于所述第二目标区域内的情况下,对所述第一中心点和所述第二中心点进行加权求和,获取到目标点;以所述目标点为中心,从所述待裁剪图像中裁剪出所述目标尺寸的所述裁剪图像;
在所述第二中心点为有效点,且所述第一中心点位于所述第二目标区域外的情况下,以所述第二中心点为中心,从所述待裁剪图像中裁剪出所述目标尺寸的所述裁剪图像。
4.根据权利要求1所述的方法,其特征在于,在获取与所述待裁剪图像对应的所述第一区域集合中的所述第一目标区域的所述第一中心点之前,所述方法还包括:
对所述待裁剪图像进行目标对象检测,获取目标对象区域,其中,所述目标对象检测用于检测所述待裁剪图像所包含的所述目标类型的对象;
在所述目标对象区域为多个的情况下,使用第一膨胀系数分别对多个所述目标对象区域进行膨胀处理,得到多个第一膨胀区域;
将所述多个第一膨胀区域中具有交集的第一膨胀区域进行合并,得到所述第一区域集合;
从所述第一区域集合中确定出所述第一目标区域。
5.根据权利要求1所述的方法,其特征在于,在获取与所述待裁剪图像对应的所述第二区域集合中的所述第二目标区域的所述第二中心点之前,所述方法还包括:
对所述待裁剪图像进行显著性检测,获取所述显著性区域;
在所述显著性区域为多个的情况下,使用第二膨胀系数分别对多个所述显著性区域进行膨胀处理,得到多个第二膨胀区域;
将所述多个第二膨胀区域中具有交集的第二膨胀区域进行合并,得到所述第二区域集合;
在所述第一中心点位于所述第二区域集合内的情况下,将所述第二区域集合中所述第一中心点所在的第二区域确定为所述第二目标区域;
在所述第一中心点位于所述第二区域集合外的情况下,将所述第二区域集合中的最大区域确定为所述第二目标区域。
6.根据权利要求1所述的方法,其特征在于,在获取与所述待裁剪图像对应的所述第二区域集合中的所述第二目标区域的所述第二中心点之前,所述方法还包括:
将所述待裁剪图像输入到目标检测模型中,获取所述目标检测模型的目标侧输出层输出的侧输出显著性图,其中,所述目标检测模型用于对所述待裁剪图像进行显著性检测,所述目标检测模型包括第二数量的侧输出层,所述目标侧输出层为所述目标检测模型的前第一数量的侧输出层,所述第一数量小于所述第二数量;
根据所述侧输出显著性图,获取与所述待裁剪图像对应的显著性特征图;
从所述显著性特征图中确定出所述显著性区域。
7.根据权利要求1至6中任一项所述的方法,其特征在于,在获取与所述待裁剪图像对应的所述第一区域集合中的所述第一目标区域的所述第一中心点之前,所述方法还包括:
获取与初始图像对应的规格参数,其中,所述规格参数用于表示从所述初始图像中裁剪出所述裁剪图像所需的参数信息;
在所述规格参数包括缩放比例的情况下,按照所述缩放比例对所述初始图像进行缩放,得到所述待裁剪图像。
8.一种图像区域的裁剪装置,其特征在于,包括:
第一获取单元,用于获取与待裁剪图像对应的第一区域集合中的第一目标区域的第一中心点,其中,每个所述第一区域包含属于目标类型的对象,所述第一目标区域为所述第一区域集合中的最大区域;
第二获取单元,用于获取与所述待裁剪图像对应的第二区域集合中的第二目标区域的第二中心点,其中,每个所述第二区域包含对所述待裁剪图像进行显著性检测得到的显著性区域,所述第二目标区域为所述第二区域集合中所述第一中心点所在的第二区域,或者,为所述第二区域集合中的最大区域;
第一裁剪单元,用于在所述第一中心点为无效点的情况下,基于所述第二中心点从所述待裁剪图像中裁剪出目标尺寸的裁剪图像;
第二裁剪单元,用于在所述第一中心点为有效点的情况下,基于所述第一中心点和所述第二中心点从所述待裁剪图像中裁剪出目标尺寸的裁剪图像。
9.根据权利要求8所述的装置,其特征在于,所述第一裁剪单元包括:
第一裁剪模块,用于在所述第二中心点为无效点的情况下,以所述待裁剪图像的第三中心点为中心,从所述待裁剪图像中裁剪出所述目标尺寸的所述裁剪图像;
第二裁剪模块,用于在所述第二中心点为有效点的情况下,以所述第二中心点为中心,从所述待裁剪图像中裁剪出所述目标尺寸的所述裁剪图像。
10.根据权利要求8所述的装置,其特征在于,所述第二裁剪单元包括:
第三裁剪模块,用于在所述第二中心点为无效点的情况下,以所述第一中心点为中心,从所述待裁剪图像中裁剪出所述目标尺寸的所述裁剪图像;
第四裁剪模块,用于在所述第二中心点为有效点,且所述第一中心点位于所述第二目标区域内的情况下,对所述第一中心点和所述第二中心点进行加权求和,获取到目标点;以所述目标点为中心,从所述待裁剪图像中裁剪出所述目标尺寸的所述裁剪图像;
第五裁剪模块,用于在所述第二中心点为有效点,且所述第一中心点位于所述第二目标区域外的情况下,以所述第二中心点为中心,从所述待裁剪图像中裁剪出所述目标尺寸的所述裁剪图像。
11.根据权利要求8所述的装置,其特征在于,所述装置还包括:
第一检测单元,用于在获取与所述待裁剪图像对应的所述第一区域集合中的所述第一目标区域的所述第一中心点之前,对所述待裁剪图像进行目标对象检测,获取目标对象区域,其中,所述目标对象检测用于检测所述待裁剪图像所包含的所述目标类型的对象;
第一膨胀处理单元,用于在所述目标对象区域为多个的情况下,使用第一膨胀系数分别对多个所述目标对象区域进行膨胀处理,得到多个第一膨胀区域;
第一合并单元,用于将所述多个第一膨胀区域中具有交集的第一膨胀区域进行合并,得到所述第一区域集合;
第一确定单元,用于从所述第一区域集合中确定出所述第一目标区域。
12.根据权利要求8所述的装置,其特征在于,所述装置还包括:
第二检测单元,用于在获取与所述待裁剪图像对应的所述第二区域集合中的所述第二目标区域的所述第二中心点之前,对所述待裁剪图像进行显著性检测,获取所述显著性区域;
第二膨胀处理单元,用于在所述显著性区域为多个的情况下,使用第二膨胀系数分别对多个所述显著性区域进行膨胀处理,得到多个第二膨胀区域;
第二合并单元,用于将所述多个第二膨胀区域中具有交集的第二膨胀区域进行合并,得到所述第二区域集合;
第二确定单元,用于在所述第一中心点位于所述第二区域集合内的情况下,将所述第二区域集合中所述第一中心点所在的第二区域确定为所述第二目标区域;
第三确定单元,用于在所述第一中心点位于所述第二区域集合外的情况下,将所述第二区域集合中的最大区域确定为所述第二目标区域。
13.根据权利要求8至12中任一项所述的装置,其特征在于,所述装置还包括:
输入单元,用于在获取与所述待裁剪图像对应的所述第二区域集合中的所述第二目标区域的所述第二中心点之前,将所述待裁剪图像输入到目标检测模型中,获取所述目标检测模型的目标侧输出层输出的侧输出显著性图,其中,所述目标检测模型用于对所述待裁剪图像进行显著性检测,所述目标检测模型包括第二数量的侧输出层,所述目标侧输出层为所述目标检测模型的前第一数量的侧输出层,所述第一数量小于所述第二数量;
第三获取单元,用于根据所述侧输出显著性图,获取与所述待裁剪图像对应的显著性特征图;
第四确定单元,用于从所述显著性特征图中确定出所述显著性区域。
14.一种存储介质,其特征在于,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行所述权利要求1至7任一项中所述的方法。
15.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行所述权利要求1至7任一项中所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910584273.8A CN110349082B (zh) | 2019-06-28 | 2019-06-28 | 图像区域的裁剪方法和装置、存储介质及电子装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910584273.8A CN110349082B (zh) | 2019-06-28 | 2019-06-28 | 图像区域的裁剪方法和装置、存储介质及电子装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110349082A true CN110349082A (zh) | 2019-10-18 |
CN110349082B CN110349082B (zh) | 2023-08-29 |
Family
ID=68177641
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910584273.8A Active CN110349082B (zh) | 2019-06-28 | 2019-06-28 | 图像区域的裁剪方法和装置、存储介质及电子装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110349082B (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111638929A (zh) * | 2020-05-26 | 2020-09-08 | 广州视源电子科技股份有限公司 | 开机图像处理方法、装置、设备及存储介质 |
CN111784773A (zh) * | 2020-07-02 | 2020-10-16 | 清华大学 | 图像处理方法及装置、神经网络训练方法及装置 |
CN111914698A (zh) * | 2020-07-16 | 2020-11-10 | 北京紫光展锐通信技术有限公司 | 图像中人体的分割方法、分割***、电子设备及存储介质 |
CN112017193A (zh) * | 2020-08-24 | 2020-12-01 | 杭州趣维科技有限公司 | 一种基于视觉显著性和美学分数的图像裁切装置及方法 |
CN112329511A (zh) * | 2020-08-06 | 2021-02-05 | 扬州大学 | 基于残差特征金字塔的人像分割方法 |
CN112528827A (zh) * | 2020-12-03 | 2021-03-19 | 和远智能科技股份有限公司 | 一种高铁接触网供电设备裂损自动检测方法 |
CN113570626A (zh) * | 2021-09-27 | 2021-10-29 | 腾讯科技(深圳)有限公司 | 图像裁剪方法、装置、计算机设备及存储介质 |
WO2022194102A1 (zh) * | 2021-03-19 | 2022-09-22 | 腾讯科技(深圳)有限公司 | 图像处理方法、装置、计算机设备、存储介质及程序产品 |
CN117213717A (zh) * | 2023-11-09 | 2023-12-12 | 江苏省计量科学研究院(江苏省能源计量数据中心) | 一种压力表在线计量***及方法 |
Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8363984B1 (en) * | 2010-07-13 | 2013-01-29 | Google Inc. | Method and system for automatically cropping images |
US20130148854A1 (en) * | 2011-12-12 | 2013-06-13 | Canon Kabushiki Kaisha | Method, system and apparatus for determining a subject and a distractor in an image |
CN103914689A (zh) * | 2014-04-09 | 2014-07-09 | 百度在线网络技术(北京)有限公司 | 基于人脸识别的图片裁剪方法及装置 |
US20150161466A1 (en) * | 2013-12-10 | 2015-06-11 | Dropbox, Inc. | Systems and methods for automated image cropping |
US20160104055A1 (en) * | 2014-10-09 | 2016-04-14 | Adobe Systems Incorporated | Image Cropping Suggestion Using Multiple Saliency Maps |
CN106778757A (zh) * | 2016-12-12 | 2017-05-31 | 哈尔滨工业大学 | 基于文本显著性的场景文本检测方法 |
CN107146197A (zh) * | 2017-03-31 | 2017-09-08 | 北京奇艺世纪科技有限公司 | 一种缩略图生成方法及装置 |
CN107369131A (zh) * | 2017-07-04 | 2017-11-21 | 华中科技大学 | 图像的显著性检测方法、装置、存储介质和处理器 |
US20180130203A1 (en) * | 2016-11-06 | 2018-05-10 | International Business Machines Corporation | Automated skin lesion segmentation using deep side layers |
US20180181593A1 (en) * | 2016-12-28 | 2018-06-28 | Shutterstock, Inc. | Identification of a salient portion of an image |
US20180276492A1 (en) * | 2017-03-27 | 2018-09-27 | Samsung Electronics Co., Ltd | Image processing method and apparatus for object detection |
CN108597003A (zh) * | 2018-04-20 | 2018-09-28 | 腾讯科技(深圳)有限公司 | 一种文章封面生成方法、装置、处理服务器及存储介质 |
CN108776970A (zh) * | 2018-06-12 | 2018-11-09 | 北京字节跳动网络技术有限公司 | 图像处理方法和装置 |
CN109165660A (zh) * | 2018-06-20 | 2019-01-08 | 扬州大学 | 一种基于卷积神经网络的显著物体检测方法 |
CN109712164A (zh) * | 2019-01-17 | 2019-05-03 | 上海携程国际旅行社有限公司 | 图像智能剪裁方法、***、设备及存储介质 |
-
2019
- 2019-06-28 CN CN201910584273.8A patent/CN110349082B/zh active Active
Patent Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8363984B1 (en) * | 2010-07-13 | 2013-01-29 | Google Inc. | Method and system for automatically cropping images |
US20130148854A1 (en) * | 2011-12-12 | 2013-06-13 | Canon Kabushiki Kaisha | Method, system and apparatus for determining a subject and a distractor in an image |
US20150161466A1 (en) * | 2013-12-10 | 2015-06-11 | Dropbox, Inc. | Systems and methods for automated image cropping |
CN103914689A (zh) * | 2014-04-09 | 2014-07-09 | 百度在线网络技术(北京)有限公司 | 基于人脸识别的图片裁剪方法及装置 |
US20160104055A1 (en) * | 2014-10-09 | 2016-04-14 | Adobe Systems Incorporated | Image Cropping Suggestion Using Multiple Saliency Maps |
US20180130203A1 (en) * | 2016-11-06 | 2018-05-10 | International Business Machines Corporation | Automated skin lesion segmentation using deep side layers |
CN106778757A (zh) * | 2016-12-12 | 2017-05-31 | 哈尔滨工业大学 | 基于文本显著性的场景文本检测方法 |
US20180181593A1 (en) * | 2016-12-28 | 2018-06-28 | Shutterstock, Inc. | Identification of a salient portion of an image |
US20180276492A1 (en) * | 2017-03-27 | 2018-09-27 | Samsung Electronics Co., Ltd | Image processing method and apparatus for object detection |
CN107146197A (zh) * | 2017-03-31 | 2017-09-08 | 北京奇艺世纪科技有限公司 | 一种缩略图生成方法及装置 |
CN107369131A (zh) * | 2017-07-04 | 2017-11-21 | 华中科技大学 | 图像的显著性检测方法、装置、存储介质和处理器 |
CN108597003A (zh) * | 2018-04-20 | 2018-09-28 | 腾讯科技(深圳)有限公司 | 一种文章封面生成方法、装置、处理服务器及存储介质 |
CN108776970A (zh) * | 2018-06-12 | 2018-11-09 | 北京字节跳动网络技术有限公司 | 图像处理方法和装置 |
CN109165660A (zh) * | 2018-06-20 | 2019-01-08 | 扬州大学 | 一种基于卷积神经网络的显著物体检测方法 |
CN109712164A (zh) * | 2019-01-17 | 2019-05-03 | 上海携程国际旅行社有限公司 | 图像智能剪裁方法、***、设备及存储介质 |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111638929A (zh) * | 2020-05-26 | 2020-09-08 | 广州视源电子科技股份有限公司 | 开机图像处理方法、装置、设备及存储介质 |
CN111784773A (zh) * | 2020-07-02 | 2020-10-16 | 清华大学 | 图像处理方法及装置、神经网络训练方法及装置 |
CN111914698A (zh) * | 2020-07-16 | 2020-11-10 | 北京紫光展锐通信技术有限公司 | 图像中人体的分割方法、分割***、电子设备及存储介质 |
CN112329511A (zh) * | 2020-08-06 | 2021-02-05 | 扬州大学 | 基于残差特征金字塔的人像分割方法 |
CN112017193A (zh) * | 2020-08-24 | 2020-12-01 | 杭州趣维科技有限公司 | 一种基于视觉显著性和美学分数的图像裁切装置及方法 |
CN112528827A (zh) * | 2020-12-03 | 2021-03-19 | 和远智能科技股份有限公司 | 一种高铁接触网供电设备裂损自动检测方法 |
CN112528827B (zh) * | 2020-12-03 | 2023-04-07 | 和远智能科技股份有限公司 | 一种高铁接触网供电设备裂损自动检测方法 |
WO2022194102A1 (zh) * | 2021-03-19 | 2022-09-22 | 腾讯科技(深圳)有限公司 | 图像处理方法、装置、计算机设备、存储介质及程序产品 |
CN113570626A (zh) * | 2021-09-27 | 2021-10-29 | 腾讯科技(深圳)有限公司 | 图像裁剪方法、装置、计算机设备及存储介质 |
CN117213717A (zh) * | 2023-11-09 | 2023-12-12 | 江苏省计量科学研究院(江苏省能源计量数据中心) | 一种压力表在线计量***及方法 |
CN117213717B (zh) * | 2023-11-09 | 2024-01-30 | 江苏省计量科学研究院(江苏省能源计量数据中心) | 一种压力表在线计量***及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110349082B (zh) | 2023-08-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110349082A (zh) | 图像区域的裁剪方法和装置、存储介质及电子装置 | |
EP3779774B1 (en) | Training method for image semantic segmentation model and server | |
WO2021227726A1 (zh) | 面部检测、图像检测神经网络训练方法、装置和设备 | |
CN111696112B (zh) | 图像自动裁剪方法、***、电子设备及存储介质 | |
CN109146892A (zh) | 一种基于美学的图像裁剪方法及装置 | |
WO2020107847A1 (zh) | 基于骨骼点的跌倒检测方法及其跌倒检测装置 | |
CN108520229A (zh) | 图像检测方法、装置、电子设备和计算机可读介质 | |
CN113822314B (zh) | 图像数据处理方法、装置、设备以及介质 | |
CN109902798A (zh) | 深度神经网络的训练方法和装置 | |
CN110414499A (zh) | 文本位置定位方法和***以及模型训练方法和*** | |
CN106529565A (zh) | 目标识别模型训练和目标识别方法及装置、计算设备 | |
CN108304765A (zh) | 用于人脸关键点定位与语义分割的多任务检测装置 | |
JP7376720B2 (ja) | 画像データ検出方法及び装置並びにコンピュータ装置及びプログラム | |
CN110059728B (zh) | 基于注意力模型的rgb-d图像视觉显著性检测方法 | |
CN111046855A (zh) | 图片识别方法、识别模型训练方法、装置及电子装置 | |
CN109034206A (zh) | 图像分类识别方法、装置、电子设备及计算机可读介质 | |
CN106326857A (zh) | 基于人脸图像的性别识别方法及装置 | |
WO2021238548A1 (zh) | 区域识别方法、装置、设备及可读存储介质 | |
CN110765882B (zh) | 一种视频标签确定方法、装置、服务器及存储介质 | |
CN109740585A (zh) | 一种文本定位方法及装置 | |
CN109685037A (zh) | 一种实时动作识别方法、装置及电子设备 | |
CN109583367A (zh) | 图像文本行检测方法及装置、存储介质和电子设备 | |
CN106778910A (zh) | 基于本地训练的深度学习***和方法 | |
CN116452810A (zh) | 一种多层次语义分割方法、装置、电子设备及存储介质 | |
CN114445684A (zh) | 车道线分割模型的训练方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |