CN114332118A - 图像处理方法、装置、设备及存储介质 - Google Patents

图像处理方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN114332118A
CN114332118A CN202111592671.8A CN202111592671A CN114332118A CN 114332118 A CN114332118 A CN 114332118A CN 202111592671 A CN202111592671 A CN 202111592671A CN 114332118 A CN114332118 A CN 114332118A
Authority
CN
China
Prior art keywords
image
key area
area image
processing
segmentation algorithm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111592671.8A
Other languages
English (en)
Inventor
张亚杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Dajia Internet Information Technology Co Ltd
Original Assignee
Beijing Dajia Internet Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Dajia Internet Information Technology Co Ltd filed Critical Beijing Dajia Internet Information Technology Co Ltd
Priority to CN202111592671.8A priority Critical patent/CN114332118A/zh
Publication of CN114332118A publication Critical patent/CN114332118A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • User Interface Of Digital Computer (AREA)

Abstract

本公开关于一种图像处理方法、装置、设备及存储介质,能够降低语义分割算法处理图像的计算量,以应用到终端等轻量化设备。具体方案包括:获取第一图像。若检测到第一图像中存在关键区域图像,对第一图像进行分割处理,得到第二图像,第二图像包括关键区域图像,第二图像的尺寸小于第一图像的尺寸。根据第二图像和预设分割算法,得到关键区域图像。

Description

图像处理方法、装置、设备及存储介质
技术领域
本公开涉及网络技术领域,尤其涉及一种图像处理方法、装置、设备及存储介质。
背景技术
随着网络技术的发展,对图像或者视频等资源进行处理的方式变得多种多样。例如,可以对图像进行分割,得到图像中的关键区域图像(例如图像中的人脸区域图像、手部区域图像等)。
目前,可以通过图像分割算法(例如语义分割算法)对图像进行处理得到图像中的关键区域图像。但是,语义分割算法是基于深度学***板电脑和笔记本电脑)等轻量化设备上。
发明内容
本公开提供一种图像处理方法、装置、设备及存储介质,能够降低语义分割算法处理图像的计算量,以应用到终端等轻量化设备。本公开的技术方案如下:
根据本公开的第一方面,提供一种图像处理方法,该方法包括:
获取第一图像。若检测到第一图像中存在关键区域图像,对第一图像进行分割处理,得到第二图像,第二图像包括关键区域图像,第二图像的尺寸小于第一图像的尺寸。根据第二图像和预设分割算法,得到关键区域图像。
可选的,上述“若检测到第一图像中存在关键区域图像,对第一图像进行分割处理,得到第二图像”的方法,包括:根据关键区域图像的尺寸和关键区域图像在第一图像中的位置,对第一图像进行分割处理,得到第二图像。
可选的,该图像处理方法还包括:若未检测到第一图像中存在关键区域图像,则根据第一图像和预设分割算法,得到第三图像,其中,第三图像为包括关键区域图像的掩码图,或者,第三图像为不包括关键区域图像的掩码图。
可选的,确定目标位置,目标位置为关键区域图像在第一图像中的位置。对关键区域图像进行渲染处理,得到渲染后的关键区域图像。将渲染后的关键区域图像按照目标位置,拼接至第一图像,得到第四图像,第四图像包括渲染后的关键区域图像。
可选的,上述获取第一图像的方法,包括:获取目标视频,从目标视频中获取每一帧图像作为第一图像。
根据本公开的第二方面,提供一种图像处理装置,该图像处理装置包括:获取单元和处理单元。
获取单元,被配置为执行获取第一图像。处理单元,被配置为执行若检测到第一图像中存在关键区域图像,对第一图像进行分割处理,得到第二图像,第二图像包括关键区域图像,第二图像的尺寸小于第一图像的尺寸。处理单元,还被配置为执行根据第二图像和预设分割算法,得到关键区域图像。
可选的,处理单元,具体被配置为执行根据关键区域图像的尺寸和关键区域图像在第一图像中的位置,对第一图像进行分割处理,得到第二图像。
可选的,处理单元,还被配置为执行若未检测到第一图像中存在关键区域图像,则根据第一图像和预设分割算法,得到第三图像,其中,第三图像为包括关键区域图像的掩码图,或者,第三图像为不包括关键区域图像的掩码图。
可选的,处理单元,还被配置为执行确定目标位置,目标位置为关键区域图像在第一图像中的位置。处理单元,还被配置为执行对关键区域图像进行渲染处理,得到渲染后的关键区域图像。处理单元,还被配置为执行将渲染后的关键区域图像按照目标位置,拼接至第一图像,得到第四图像,第四图像包括渲染后的关键区域图像。
可选的,获取单元,具体被配置为执行获取目标视频,从目标视频中获取每一帧图像作为第一图像。
根据本公开的第三方面,提供一种终端,终端包括:
处理器。用于存储处理器可执行指令的存储器。其中,处理器被配置为执行指令,以实现上述第一方面中任一种可选地图像处理方法。
根据本公开的第四方面,提供一种计算机可读存储介质,计算机可读存储介质上存储有指令,当计算机可读存储介质中的指令由终端的处理器执行时,使得终端能够执行上述第一方面中任一种可选地图像处理方法。
根据本公开的第五方面,提供一种计算机程序产品,包含指令,当其在计算机上运行时,使得计算机执行如第一方面中任一种可选地图像处理方法。
根据本公开的第六方面,本公开提供一种芯片,芯片包括处理器和通信接口,通信接口和处理器耦合,处理器用于运行计算机程序或指令,以实现如第一方面和第一方面的任一种可能的实现方式中所描述的图像处理方法。
本公开提供的技术方案至少带来以下有益效果:获取第一图像,第一图像包括关键区域图像。之后,对第一图像进行分割处理,得到第二图像,第二图像包括关键区域图像,第二图像的显示区域小于第一图像的显示区域。由于第二图像的显示区域小于第一图像。因此,可以减小通过预设分割算法对图像进行处理的计算量。然后,根据第二图像和预设分割算法,得到关键区域图像。由于减小预设分割算法对图像进行处理的计算量,因此可以降低预设分割算法对于硬件设备的要求,将预设分割算法应用到终端等轻量化设备上。并且,通过减小预设分割算法对图像进行处理的计算量,可以提高对图像进行处理的效率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
图1是根据一示例性实施例示出的一种终端的结构示意图;
图2是根据一示例性实施例示出的一种图像处理方法的流程图;
图3是根据一示例性实施例示出的一种图像实例图;
图4是根据一示例性实施例示出的一种图像位置关系的示意图;
图5是根据一示例性实施例示出的一种掩码图的实例图;
图6是根据一示例性实施例示出的另一种图像处理方法的流程图;
图7是根据一示例性实施例示出的另一种图像处理方法的流程图;
图8是根据一示例性实施例示出的一种图像处理装置的结构示意图;
图9是根据一示例性实施例示出的另一种图像处理装置的结构示意图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
需要说明的是,本公开所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等),均为经用户授权或者经过各方充分授权的信息。
首先,对本公开实施例的应用场景进行介绍。
本公开实施例的图像处理方法应用于处理图像的场景中。在相关技术中,为了降低使用图像分割算法(如语义分割算法)的条件,使语义分割算法可以应用到轻量化设备中,可以在终端通过语义分割算法对图像进行分割时,将图像的尺寸(即分辨率)进行缩小处理。之后,通过图像分割算法对缩小后的图像进行分割。这样一来,可以减少语义分割算法对图像进行分割的计算量。但是,关键区域图像在整个图像中的占比通常较低,即关键区域图像本身尺寸已经较小,因此,缩小图像后的关键区域图像的尺寸会变得更小,进而影响通过图像分割算法提取关键区域图像的效果。
为了解决上述问题,本公开实施例提供一种图像处理方法,获取待处理图像(也可以称为第一图像),该第一图像中包括关键区域图像。之后,从第一图像中切割出显示区域小于第一图像、且存在关键区域的图像(称为第二图像)。然后,通过预设分割算法对第二图像进行处理,得到关键区域图像。这样一来,由于第二图像的显示区域小于第一图像。因此,可以减小通过预设分割算法对图像进行处理的计算量,进而降低语义分割算法对于硬件设备的要求,将语义分割算法应用到终端(例如手机、平板电脑和笔记本电脑)等轻量化设备上。并且,减小通过预设分割算法对图像进行处理的计算量,可以提高对图像进行处理的效率。
图1为本公开实施例提供的一种应用本公开所提供方法的终端的结构示意图。其中,该终端10包括有处理器101和存储器102。
其中,处理器101可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器101可以包括应用处理器(application processor,AP),调制解调处理器,图形处理器(graphics processing unit,GPU),图像信号处理器(image signal processor,ISP),控制器,存储器,视频编解码器,数字信号处理器(digital signal processor,DSP),基带处理器,和/或神经网络处理器(neural-network processing unit,NPU)等。其中,不同的处理单元可以是独立的器件,也可以集成在一个或多个处理器中。
存储器102可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器102还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器102中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器101所执行以实现本公开方法实施例提供的群组通信方法。
在一些实施例中,终端10还可选包括有:***设备接口103和至少一个***设备。处理器101、存储器102和***设备接口103之间可以通过总线或信号线相连。各个***设备可以通过总线、信号线或电路板与***设备接口103相连。具体地,***设备包括:射频电路104、显示屏105、摄像头组件106、音频电路107、定位组件108和电源109 中的至少一种。
***设备接口103可被用于将I/O(Input/Output,输入/输出)相关的至少一个***设备连接到处理器101和存储器102。在一些实施例中,处理器101、存储器102和***设备接口103被集成在同一芯片或电路板上;在一些其他实施例中,处理器101、存储器 102和***设备接口103中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不予限定。
射频电路104用于接收和发射RF(Radio Frequency,射频)信号,也称电磁信号。射频电路104通过电磁信号与通信网络以及其他通信设备进行通信。射频电路104将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路104包括:天线***、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路104可以通过至少一种无线通信协议来与其它服务器进行通信。该无线通信协议包括但不限于:城域网、各代移动通信网络 (2G、3G、4G及5G)、无线局域网和/或Wi-Fi(Wireless Fidelity,无线保真)网络。在一些实施例中,射频电路104还可以包括NFC(Near Field Communication,近距离无线通信)有关的电路,本公开对此不加以限定。
显示屏105用于显示UI(User Interface,用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏105是触摸显示屏时,显示屏105还具有采集在显示屏105的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器101进行处理。此时,显示屏105还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏105可以为一个,设置终端10的前面板;显示屏105可以采用LCD(Liquid Crystal Display,液晶显示屏)、OLED(Organic Light-Emitting Diode,有机发光二极管)等材质制备。
摄像头组件106用于采集图像或视频。可选地,摄像头组件106包括前置摄像头和后置摄像头。通常,前置摄像头设置在服务器的前面板,后置摄像头设置在服务器的背面。音频电路107可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器101进行处理,或者输入至射频电路104以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在终端10的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器101或射频电路 104的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路107还可以包括耳机插孔。
定位组件108用于定位终端10的当前地理位置,以实现导航或LBS(LocationBased Service,基于位置的服务)。定位组件108可以是基于美国的GPS(GlobalPositioning System,全球定位***)、中国的北斗***、俄罗斯的格雷纳斯***或欧盟的伽利略***的定位组件。
电源109用于为终端10中的各个组件进行供电。电源109可以是交流电、直流电、一次性电池或可充电电池。当电源109包括可充电电池时,该可充电电池可以支持有线充电或无线充电。该可充电电池还可以用于支持快充技术。
在一些实施例中,终端10还包括有一个或多个传感器1010。该一个或多个传感器1010 包括但不限于:加速度传感器、陀螺仪传感器、压力传感器、指纹传感器、光学传感器以及接近传感器。
加速度传感器可以检测以终端10建立的坐标系的三个坐标轴上的加速度大小。陀螺仪传感器可以检测终端10的机体方向及转动角度,陀螺仪传感器可以与加速度传感器协同采集用户对终端10的3D动作。压力传感器可以设置在终端10的侧边框和/或显示屏 105的下层。当压力传感器设置在终端10的侧边框时,可以检测用户对终端10的握持信号。指纹传感器用于采集用户的指纹。光学传感器用于采集环境光强度。接近传感器,也称距离传感器,通常设置在终端10的前面板。接近传感器用于采集用户与终端10的正面之间的距离。
本公开提供的一种图像处理方法的执行主体可以为图像处理装置,该执行装置可以为图1所示的终端。同时,该执行装置还可以为该终端的中央处理器(CentralProcessing Unit, CPU),或者该终端中的用于处理图像的控制模块。本申请实施例中以终端执行图像处理方法为例,说明本申请实施例提供的图像处理方法。
可选的,该终端还可以为服务器。也就是说,服务器也可以作为本公开实施例的执行主体。
在一种可实施的方式中,终端用于向用户提供语音和/或数据连通***。终端可以有不同的名称,例如UE端、终端单元、终端站、移动站、移动台、远方站、远程终端、移动设备、无线通信设备、车辆用户设备、终端代理或终端装置等。
可选的,终端可以为各种具有通信功能的手持设备、车载设备、可穿戴设备、计算机,本公开实施例对此不作任何限定。例如,手持设备可以是智能手机。车载设备可以是车载导航***。可穿戴设备可以是智能手环。计算机可以是个人数字助理(personal digitalassistant,PDA)电脑、平板型电脑以及膝上型电脑(laptop computer)。
在介绍了本公开实施例的应用场景和实施环境之后,下面结合图1所示的实施环境,对本公开实施例提供的图像处理方法进行详细介绍。
图2是根据一示例性实施例示出的一种图像处理方法的流程图。如图2所示,该方法可以包括步骤201-步骤203。
201、获取第一图像。
作为一种可能的实现方式,获取终端中存储的第一图像。
示例性的,终端中存储有多张图像。响应于对多张图像的选择操作,获取第一图像,第一图像为终端中存储的多张图像中的任一图像。
202、对第一图像进行分割处理,得到第二图像。
其中,第二图像包括关键区域图像。
需要说明的是,本公开实施例对关键区域图像不作限定。例如,关键区域图像为手部区域图像。又例如,关键区域图像为脸部区域图像。又例如,关键区域图像为天空区域图像。
在本公开实施例中,第二图像的尺寸小于第一图像的尺寸。
需要说明的是,第二图像的尺寸小于第一图像的尺寸,也可以称为第二图像的显示区域小于第一图像的显示区域。第二图像的显示区域小于第一图像的显示区域是指,第二图像的显示分辨率小于第一图像的显示分辨率。示例性的,假如第一图像的分辨率为6000*3000,则第二图像的分辨率可以为2000*1000,或者第二图像的分辨率可以为 2000*500,或者第二图像的分辨率可以为300*500,本公开实施例对此不作限定。
在本公开实施例中,第二图像为第一图像的部分区域图像。
示例性的,如图3所示,第一图像301包括关键区域图像302和第一区域图像303,第一图像的分辨率为6000*2500。第二图像304为第一图像301中的部分区域图像,第二图像304包括关键区域图像302,第二图像的分辨率为1000*300。
作为一种可能的实现方式,根据关键区域图像的尺寸和关键区域图像在第一图像中的位置,对第一图像进行分割处理,得到第二图像。具体的,通过关键区域检测算法,确定关键区域图像位于第一图像的位置。之后,根据关键区域图像位于第一图像的位置和关键区域图像的尺寸,对第一图像进行分割处理,得到矩阵形状的第二图像。
示例性的,获取关键区域图像中每个像素点位于第一图像的坐标位置。之后,根据关键区域图像中的边缘像素点的坐标,确定第一图像。例如,第一图像的坐标系的坐标原点可以是第一图像中任意一个角(如左上角或左下角),x轴和y轴为相邻的两条边。如图 4所示,点o为坐标原点,x轴为第一图像401的下侧边,y轴为第一图像401的左侧边。关键区域图像402中最左侧的像素点A1的二维坐标为A1(x1,y1),关键区域图像402 中最上侧的像素点A2的二维坐标为A2(x2,y2),关键区域图像402中最右侧的像素点A3的二维坐标为A3(x3,y3),关键区域图像402中最下侧的像素点A4的二维坐标为A4(x4,y4)。之后,根据像素点A1、像素点A2、像素点A3和像素点A4的二维坐标,确定第二图像的任意两个对角(如左上角A5和右下角A6)。其中A5二维坐标为 A5(x5,y5),A6二维坐标为A6(x6,y6)。其中,x5小于或者等于x1,y5大于或者等于y2,x6大于或者等于x3,y6小于或者等于y4。关键区域图像的尺寸即为关键区域图像中像素点的数量。
上述实施例提供的技术方案至少带来以下有益效果:根据关键区域图像的尺寸和关键区域图像在第一图像中的位置,对第一图像进行分割处理,得到第二图像。如此,可以更加精准地对第一图像进行分割处理,以得到尺寸较小的第二图像,进而减少对图像处理计算量。
203、根据第二图像和预设分割算法,得到关键区域图像。
可选的,预设分割算法是基于深度学习神经网络得到的。
需要说明的是,本公开实施例对预设分割算法不作限定。例如,预设分割算法可以为语义分割算法(unet网络)。又例如,预设分割算法可以为deeplabv3。又例如,预设分割算法可以为hrnet。
作为一种可能的实现方式,通过预设分割算法对第二图像进行处理,从第二图像中分割出关键区域图像。具体的,可以通过预设分割算法提取第二图像中的每个像素点,识别每个像素点是否为关键区域图像中的像素点。之后,确定关键区域图像中的全部像素点,得到关键区域图像。
可选的,根据第二图像和预设分割算法,得到包括关键区域图像的掩码图。示例性的,如图5所示,掩码图501包括关键区域图像502,其中掩码图501中除关键区域图像502 以外区域的图像均为黑色。
需要说明的是,具体对于通过预设分割算法对第二图像进行处理的方式,可以参考常规技术中通过语义分割算法对图像进行处理的方法,本公开实施例对此不予赘述。
作为另一种可能的实现方式,将第二图像输入基于预设分割算法构建的分割模型,得到关键区域图像。
上述实施例提供的技术方案至少带来以下有益效果:获取第一图像。之后,对第一图像进行分割处理,得到第二图像,第二图像包括关键区域图像,第二图像的尺寸小于第一图像的尺寸。由于第二图像的尺寸小于第一图像。因此,可以减小通过预设分割算法对图像进行处理的计算量。然后,根据第二图像和预设分割算法,得到关键区域图像。由于减小预设分割算法对图像进行处理的计算量,因此可以降低预设分割算法对于硬件设备的要求,将预设分割算法应用到终端等轻量化设备上。并且,通过减小预设分割算法对图像进行处理的计算量,可以提高对图像进行处理的效率。
在一种可实施的方式中,如图6所示,在步骤201之后,该图像处理方法还包括步骤601-步骤602。
601、检测第一图像中是否存在关键区域图像。
作为一种可能的实现方式,根据预设检测算法检测第一图像中是否存在关键区域图像。
需要说明的是,本公开实施例对预设检测算法不作限定。例如,预设检测算法为yolov5 算法。又例如,预设检测算法为fasterrcnn算法。
示例性的,检测第一图像中是否存在手部区域的图像。
在一种可实施的方式中,若检测到第一图像中存在关键区域图像,则执行步骤202。
可以理解的是,通过检测第一图像中是否存在关键区域图像,可以确定第一图像中是否存在关键区域图像。之后,在检测到第一图像中存在关键区域图像的情况下,对第一图像进行分割处理,得到第二图像。如此,可以减小预设分割算法对图像进行处理的计算量。
在一种可实施的方式中,若检测到第一图像中存在关键区域图像,则执行步骤202。若未检测到第一图像中存在关键区域图像,则执行步骤602。
602、根据第一图像和预设分割算法,得到第三图像。
需要说明的是,通过预设检测算法检测第一图像中是否存在关键区域图像时,可能存在第一图像中存在关键区域图像,但是未检测到第一图像中存在关键区域图像。
在一种可能的设计中,第三图像为包括关键区域图像的掩码图。在未检测到第一图像中存在关键区域图像,但是第一图像包括关键区域图像的情况下,通过预设分割算法对第一图像进行处理,得到包括关键区域图像的掩码图。
需要说明的是,通过预设分割算法对第一图像进行处理,得到的掩码图的分辨率(即显示区域)大于通过预设分割算法对第二图像进行处理,得到的掩码图的分辨率。也就是说,结合图5,通过预设分割算法对第一图像进行处理,得到的掩码图的分辨率,大于掩码图501的分辨率。
在另一种可能的设计中,第三图像为不包括关键区域图像的掩码图。在未检测到第一图像中存在关键区域图像,且第一图像中实际不存在关键区域图像的情况下,通过预设分割算法对第一图像进行处理,得到不包括关键区域图像的掩码图。
示例性的,在未检测到第一图像中存在关键区域图像,且第一图像中实际不存在关键区域图像的情况下,通过预设分割算法对第一图像进行处理,得到不包括关键区域图像的掩码图。
上述实施例提供的技术方案至少带来以下有益效果:若未检测到第一图像中存在关键区域图像,则根据第一图像和预设分割算法,得到第三图像。可以理解的是,为了避免第一图像中存在关键区域图像但未检测到的情况,在未检测到第一图像中存在关键区域图像的情况下,根据第一图像和预设分割算法,得到第三图像。如此,可以再次对关键区域图像进行提取。若第一图像中存在关键区域图像,则得到包括关键区域图像的掩码图。若第一图像中不存在关键区域图像,则得到不包括关键区域图像的掩码图。
在本公开实施例中,第一计算量小于第二计算量,第一计算量为:对第一图像进行分割处理所需的计算量与,通过预设分割算法对第二图像进行处理所需的计算量之和;第二计算量为:通过预设分割算法对第一图像进行处理所需的计算量。
示例性的,对第一图像进行分割处理所需的计算量为100,通过预设分割算法对第二图像进行处理所需的计算量为50,则第一计算量为150。通过预设分割算法对第一图像进行处理所需的计算量为300。
可以理解的是,由于减小预设分割算法对图像进行处理的计算量,因此可以降低预设分割算法对于硬件设备的要求,将预设分割算法应用到终端等轻量化设备上。并且,通过减小预设分割算法对图像进行处理的计算量,可以提高对图像进行处理的效率。
在一种可实施的方式中,如图7所示,该图像处理方法还包括步骤701-步骤703。
701、确定目标位置。
其中,目标位置为关键区域图像在第一图像中的位置。
作为一种可能的实现方式,根据关键区域图像的像素点位于第一图像的位置,确定目标位置。示例性的,目标位置可以通过关键区域图像在基于第一图像中的二维坐标表示(如图4)。
702、对关键区域图像进行渲染处理,得到渲染后的关键区域图像。
需要说明的是,本公开实施例对渲染处理不作限定。例如,假如关键区域图像为手部区域图像,渲染处理可以为在手部区域图像增加手套图像。又例如,假如关键区域图为天空区域图像,渲染处理可以为在天空区域图像增加特效(如将蓝天改为夕阳天)。又例如,假如关键区域图像为脸部区域图像,渲染处理可以为在脸部区域图像增加面具图像。
703、将渲染后的关键区域图像按照目标位置,拼接至第一图像,得到第四图像。
其中,第四图像包括渲染后的关键区域图像。
在本公开实施例中,第四图像的显示区域与第一图像的显示区域相同。
上述实施例提供的技术方案至少带来以下有益效果:确定目标位置之后,对关键区域图像进行渲染处理,得到渲染后的关键区域图像。将渲染后的关键区域图像按照目标位置,拼接至第一图像,得到第四图像,第四图像包括渲染后的关键区域图像。由于减小预设分割算法对图像进行处理的计算量,能够减少得到关键区域图像的时间。因此,可以进一步提高得到包括渲染后的关键区域图像的第四图像的速度,提高了图像渲染的效率。
在一种可实施的方式中,获取第一图像,即步骤201可以包括:获取目标视频,从目标视频中获取每一帧图像作为第一图像。
也就是说,获取目标视频之后,可以对目标视频中的每帧图像执行本公开实施例(如步骤201-步骤203)的方法。
可选的,得到目标视频中每帧图像的关键区域图像之后,可以对每帧图像中的关键区域图像进行渲染处理,得到每帧图像对应的渲染后的关键区域图像。之后,将每帧图像对应的渲染后的关键区域图像拼接至对应的图像。
示例性的,假如目标视频包括:图像帧A、图像帧B和图像帧C。可以分别对图像帧A、图像帧B和图像帧C执行步骤201-步骤203,得到图像帧A的关键区域图像A、图像帧B的关键区域图像B和图像帧C的关键区域图像C。之后,可以分别对关键区域图像A、关键区域图像B和关键区域图像C进行渲染处理,得到渲染后的关键区域图像 A、渲染后的关键区域图像B和渲染后的关键区域图像C。然后,将渲染后的关键区域图像A拼接至图像帧A,将渲染后的关键区域图像B拼接至图像帧B,将渲染后的关键区域图像C拼接至图像帧C。
上述实施例提供的技术方案至少带来以下有益效果:获取目标视频,第一图像为目标视频中的每帧图像。也就是说,在通过预设分割算法对目标视频进行处理的过程中,可以将目标视频中的每帧图像的显示区域进行缩小,之后由预设分割算法对图像进行处理。如此,可以减小预设分割算法对视频进行处理的计算量,降低预设分割算法对于硬件设备的要求,将预设分割算法应用到终端等轻量化设备上。
可以理解的是,上述方法可以由图像处理装置实现。图像处理装置为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所公开的实施例描述的各示例的模块及算法步骤,本公开实施例能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本公开实施例的范围。
本公开实施例可以根据上述方法示例对上述图像处理装置等进行功能模块的划分,例如,可以对应各个功能划分各个功能模块,也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。需要说明的是,本公开实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
图8是根据一示例性实施例示出的一种图像处理装置的结构框图。参照图8,该图像处理装置80包括获取单元81和处理单元82。
获取单元81,被配置为执行获取第一图像。处理单元82,被配置为执行若检测到第一图像中存在关键区域图像,对第一图像进行分割处理,得到第二图像,第二图像包括关键区域图像,第二图像的尺寸小于第一图像的尺寸。处理单元82,还被配置为执行根据第二图像和预设分割算法,得到关键区域图像。
可选的,处理单元82,具体被配置为执行根据关键区域图像的尺寸和关键区域图像在第一图像中的位置,对第一图像进行分割处理,得到第二图像。
可选的,处理单元82,还被配置为执行若未检测到第一图像中存在关键区域图像,则根据第一图像和预设分割算法,得到第三图像,其中,第三图像为包括关键区域图像的掩码图,或者,第三图像为不包括关键区域图像的掩码图。
可选的,处理单元82,还被配置为执行确定目标位置,目标位置为关键区域图像在第一图像中的位置。处理单元82,还被配置为执行对关键区域图像进行渲染处理,得到渲染后的关键区域图像。处理单元82,还被配置为执行将渲染后的关键区域图像按照目标位置,拼接至第一图像,得到第四图像,第四图像包括渲染后的关键区域图像。
可选的,获取单元81,具体被配置为执行获取目标视频,从目标视频中获取每一帧图像作为第一图像。
关于上述实施例中的图像处理装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图9是本公开提供的一种图像处理装置90的结构示意图。如图9,该图像处理装置90 可以包括至少一个处理器901以及用于存储处理器901可执行指令的存储器903。其中,处理器901被配置为执行存储器903中的指令,以实现上述实施例中的图像处理方法。
另外,图像处理装置90还可以包括通信总线902以及至少一个通信接口904。
处理器901可以是一个GPU,微处理单元,ASIC,或一个或多个用于控制本公开方案程序执行的集成电路。
通信总线902可包括一通路,在上述组件之间传送信息。
通信接口904,使用任何收发器一类的装置,用于与其他设备或通信网络通信,如以太网,无线接入网(radio access network,RAN),无线局域网(wireless local areanetworks, WLAN)等。
存储器903可以是只读存储器(read-only memory,ROM)或可存储静态信息和指令的其他类型的静态存储设备,随机存取存储器(random access memory,RAM)或者可存储信息和指令的其他类型的动态存储设备,也可以是电可擦可编程只读存储器(electricallyerasable programmable read-only memory,EEPROM)、只读光盘(compact disc read-only memory,CD-ROM)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。存储器可以是独立存在,通过总线与处理单元相连接。存储器也可以和处理单元集成在一起,为GPU中的易失性存储介质。
其中,存储器903用于存储执行本公开方案的指令,并由处理器901来控制执行。处理器901用于执行存储器903中存储的指令,从而实现本公开方法中的功能。
在具体实现中,作为一种实施例,处理器901可以包括一个或多个GPU,例如图9中的GPU0和GPU1。
在具体实现中,作为一种实施例,图像处理装置90可以包括多个处理器,例如图9中的处理器901和处理器907。这些处理器中的每一个可以是一个单核(single-CPU)处理器,也可以是一个多核(multi-GPU)处理器。这里的处理器可以指一个或多个设备、电路、和/或用于处理数据(例如计算机程序指令)的处理核。
在具体实现中,作为一种实施例,图像处理装置90还可以包括输出设备905和输入设备906。输出设备905和处理器901通信,可以以多种方式来显示信息。例如,输出设备905可以是液晶显示器(liquid crystal display,LCD),发光二极管(light emitting diode,LED) 显示设备,阴极射线管(cathode ray tube,CRT)显示设备,或投影仪(projector)等。输入设备906和处理器901通信,可以以多种方式接受用户的输入。例如,输入设备906可以是鼠标、键盘、触摸屏设备或传感设备等。
本领域技术人员可以理解,图9中示出的结构并不构成对图像处理装置90的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
本公开还提供了一种计算机可读存储介质,计算机可读存储介质上存储有指令,当存储介质中的指令由服务器的处理器执行时,使得服务器能够执行上述本公开实施例提供的群组通信方法。
本公开实施例还提供了一种包含指令的计算机程序产品,当其在服务器上运行时,使得服务器执行上述本公开实施例提供的图像处理方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (10)

1.一种图像处理方法,其特征在于,所述方法包括:
获取第一图像;
若检测到所述第一图像中存在关键区域图像,对所述第一图像进行分割处理,得到第二图像,所述第二图像包括所述关键区域图像,所述第二图像的尺寸小于所述第一图像的尺寸;
根据所述第二图像和预设分割算法,得到所述关键区域图像。
2.根据权利要求1所述的方法,其特征在于,所述若检测到所述第一图像中存在关键区域图像,对所述第一图像进行分割处理,得到第二图像,包括:
根据所述关键区域图像的尺寸和所述关键区域图像在所述第一图像中的位置,对所述第一图像进行分割处理,得到所述第二图像。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
若未检测到所述第一图像中存在所述关键区域图像,则根据所述第一图像和所述预设分割算法,得到第三图像,其中,所述第三图像为包括所述关键区域图像的掩码图,或者,所述第三图像为不包括所述关键区域图像的掩码图。
4.根据权利要求1-3中任一项所述的方法,其特征在于,所述方法还包括:
确定目标位置,所述目标位置为所述关键区域图像在所述第一图像中的位置;
对所述关键区域图像进行渲染处理,得到渲染后的所述关键区域图像;
将所述渲染后的关键区域图像按照所述目标位置,拼接至所述第一图像,得到第四图像,所述第四图像包括所述渲染后的关键区域图像。
5.根据权利要求4所述的方法,其特征在于,所述获取第一图像,包括:
获取目标视频,从所述目标视频中获取每一帧图像作为所述第一图像。
6.一种图像处理装置,其特征在于,包括:
获取单元,被配置为执行获取第一图像;
处理单元,被配置为执行若检测到所述第一图像中存在关键区域图像,对所述第一图像进行分割处理,得到第二图像,所述第二图像包括所述关键区域图像,所述第二图像的尺寸小于所述第一图像的尺寸;
处理单元,还被配置为执行根据所述第二图像和预设分割算法,得到所述关键区域图像。
7.根据权利要求6所述的图像处理装置,其特征在于,
所述处理单元,具体被配置为执行根据所述关键区域图像的尺寸和所述关键区域图像在所述第一图像中的位置,对所述第一图像进行分割处理,得到所述第二图像。
8.一种终端,其特征在于,所述终端包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1-5任一项所述的图像处理方法。
9.一种计算机可读存储介质,所述计算机可读存储介质上存储有指令,其特征在于,当所述计算机可读存储介质中的指令由终端的处理器执行时,使得所述终端能够执行如权利要求1-5中任一项所述的图像处理方法。
10.一种计算机程序产品,包括计算机程序/指令,其特征在于,所述计算机程序/指令被处理器执行时实现权利要求1-5中任一项所述的图像处理方法。
CN202111592671.8A 2021-12-23 2021-12-23 图像处理方法、装置、设备及存储介质 Pending CN114332118A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111592671.8A CN114332118A (zh) 2021-12-23 2021-12-23 图像处理方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111592671.8A CN114332118A (zh) 2021-12-23 2021-12-23 图像处理方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN114332118A true CN114332118A (zh) 2022-04-12

Family

ID=81055215

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111592671.8A Pending CN114332118A (zh) 2021-12-23 2021-12-23 图像处理方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN114332118A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114926830A (zh) * 2022-05-30 2022-08-19 南京数睿数据科技有限公司 屏幕图像识别方法、装置、设备和计算机可读介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114926830A (zh) * 2022-05-30 2022-08-19 南京数睿数据科技有限公司 屏幕图像识别方法、装置、设备和计算机可读介质
CN114926830B (zh) * 2022-05-30 2023-09-12 南京数睿数据科技有限公司 屏幕图像识别方法、装置、设备和计算机可读介质

Similar Documents

Publication Publication Date Title
CN110502954B (zh) 视频分析的方法和装置
US20220004794A1 (en) Character recognition method and apparatus, computer device, and storage medium
CN108594997B (zh) 手势骨架构建方法、装置、设备及存储介质
CN110059685B (zh) 文字区域检测方法、装置及存储介质
CN110097576B (zh) 图像特征点的运动信息确定方法、任务执行方法和设备
CN110490179B (zh) 车牌识别方法、装置及存储介质
CN112581358B (zh) 图像处理模型的训练方法、图像处理方法及装置
WO2022042425A1 (zh) 视频数据处理方法、装置、计算机设备及存储介质
CN110321126B (zh) 生成页面代码的方法和装置
CN110647881A (zh) 确定图像对应的卡片类型的方法、装置、设备及存储介质
CN110991457A (zh) 二维码处理方法、装置、电子设备及存储介质
CN110677713B (zh) 视频图像处理方法及装置、存储介质
CN110503159B (zh) 文字识别方法、装置、设备及介质
CN110288689B (zh) 对电子地图进行渲染的方法和装置
CN115454642A (zh) 线程的内存池管理方法、装置、设备及存储介质
CN111325220A (zh) 图像生成方法、装置、设备及存储介质
CN110377914B (zh) 字符识别方法、装置及存储介质
CN114332118A (zh) 图像处理方法、装置、设备及存储介质
CN110232417B (zh) 图像识别方法、装置、计算机设备及计算机可读存储介质
CN112053360A (zh) 图像分割方法、装置、计算机设备及存储介质
CN111722903A (zh) 一种数据处理方法、装置、电子设备及存储介质
CN114390195B (zh) 一种自动对焦的方法、装置、设备及存储介质
CN114168873B (zh) 一种页面弹框的处理方法、装置、终端设备及存储介质
CN115205364A (zh) 对象高度的确定方法、装置及存储介质
CN114283395A (zh) 车道线检测的方法、装置、设备及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination