CN109034136A - 图像处理方法、装置、摄像设备及存储介质 - Google Patents
图像处理方法、装置、摄像设备及存储介质 Download PDFInfo
- Publication number
- CN109034136A CN109034136A CN201811039245.XA CN201811039245A CN109034136A CN 109034136 A CN109034136 A CN 109034136A CN 201811039245 A CN201811039245 A CN 201811039245A CN 109034136 A CN109034136 A CN 109034136A
- Authority
- CN
- China
- Prior art keywords
- interest
- area
- frame picture
- present frame
- region
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 22
- 238000000034 method Methods 0.000 claims abstract description 29
- 238000013136 deep learning model Methods 0.000 claims abstract description 22
- 239000000284 extract Substances 0.000 claims abstract description 6
- 230000011218 segmentation Effects 0.000 claims description 27
- 238000001514 detection method Methods 0.000 claims description 25
- 238000000605 extraction Methods 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 4
- 238000011084 recovery Methods 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 abstract description 7
- 238000010586 diagram Methods 0.000 description 22
- 230000006870 function Effects 0.000 description 8
- 230000008569 process Effects 0.000 description 6
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000002093 peripheral effect Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 230000004888 barrier function Effects 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 241000208340 Araliaceae Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000000151 deposition Methods 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/56—Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
- G06V20/588—Recognition of the road, e.g. of lane markings; Recognition of the vehicle driving pattern in relation to the road
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
Abstract
本发明实施例提出了一种图像处理方法、装置、摄像设备及存储介质,涉及图像处理领域,该方法包括:确定出当前帧图片中的路面区域;提取当前帧图片中的感兴趣区域,其中,感兴趣区域中包含有路面区域;判断感兴趣区域的范围占当前帧图片的比例是否大于第一预设值;当感兴趣区域的范围占当前帧图片的比例大于第一预设值时,调整感兴趣区域的分辨率,其中,调整后的分辨率小于调整前的分辨率;依据预设的深度学习模型对调整分辨率后的感兴趣区域进行处理。本发明实施例所提供的一种图像处理方法、装置、摄像设备及存储介质,能够减小在处理高分辨率图片时的计算量,提升计算速度,节约计算资源。
Description
技术领域
本发明涉及图像处理领域,具体而言,涉及一种图像处理方法、装置、摄像设备及存储介质。
背景技术
在辅助驾驶及自动驾驶等领域,需要进行物体检测、交通红绿灯识别、可行驶区域检测等视觉检测任务,但是受制于处理器计算量及功耗的限制,无法将图像原图直接送到模型中去处理,一般都需要降低图片的分辨率后(比如一般1080P的图片都要缩小到416x416大小的图片,才能够实时处理)再对图片进行处理。
并且,随着摄像头分辨率的增减增大,目前大于等于800万像素的摄像头慢慢开始流行,可以极大的拓宽视觉算法可以检测的距离和精度,但是这会给处理器的处理性能带来更大的压力。
发明内容
本发明的目的在于提供一种图像处理方法、装置、摄像设备及存储介质,能够减小在处理高分辨率图片时的计算量,提升计算速度,节约计算资源。
为了实现上述目的,本发明实施例采用的技术方案如下:
第一方面,本发明实施例提供了一种图像处理方法,所述方法包括:确定出当前帧图片中的路面区域;提取所述当前帧图片中的感兴趣区域,其中,所述感兴趣区域中包含有所述路面区域;判断所述感兴趣区域的范围占所述当前帧图片的比例是否大于第一预设值;当所述感兴趣区域的范围占所述当前帧图片的比例大于所述第一预设值时,调整所述感兴趣区域的分辨率,其中,所述调整后的分辨率小于所述调整前的分辨率;依据预设的深度学习模型对所述调整分辨率后的感兴趣区域进行处理。
第二方面,本发明实施例提供了一种图像处理装置,所述装置包括:路面区域识别模块,用于确定出当前帧图片中的路面区域;感兴趣区域提取模块,用于提取所述当前帧图片中的感兴趣区域,其中,所述感兴趣区域中包含有所述路面区域;判断模块,用于判断所述感兴趣区域的范围占所述当前帧图片的比例是否大于第一预设值;分辨率调整模块,用于当所述感兴趣区域的范围占所述当前帧图片的比例大于所述第一预设值时,调整所述感兴趣区域的分辨率,其中,所述调整后的分辨率小于所述调整前的分辨率;图像处理模块,用于依据预设的深度学习模型对所述调整分辨率后的感兴趣区域进行处理。
第三方面,本发明实施例提供了一种摄像设备,所述摄像设备包括存储器,用于存储一个或多个程序;处理器。当所述一个或多个程序被所述处理器执行时,实现上述的图像处理方法。
第四方面,本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述的图像处理方法。
相对于现有技术,本发明实施例所提供的一种图像处理方法、装置、摄像设备及存储介质,通过提取获得当前帧图片中的感兴趣区域,并在判定感兴趣区域的范围占当前帧图片的比例大于第一预设值时,调整感兴趣区域的分辨率后送入到预设的深度学习模型中进行处理,相比于现有技术,能够减小在处理高分辨率图片时的计算量,提升计算速度,节约计算资源。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它相关的附图。
图1示出了本发明实施例所提供的一种摄像设备的一种示意性结构图;
图2示出了本发明实施例所提供的一种图像处理方法的一种示意性流程图;
图3为辅助驾驶时摄像设备拍摄的图片示意图;
图4为图2中步骤S100的子步骤的一种示意性流程图;
图5为语义分割示意图;
图6为图2中步骤S200的子步骤的一种示意性流程图;
图7为感兴趣区域的提取步骤示意图;
图8为多个子兴趣区域的生成示意图;
图9示出了本发明实施例所提供的一种图像处理装置的一种示意性结构图;
图10示出了本发明实施例所提供的一种图像处理装置的路面区域识别模块的一种示意性结构图;
图11示出了本发明实施例所提供的一种图像处理装置的感兴趣区域提取模块的一种示意性结构图。
图中:10-摄像设备;110-存储器;120-处理器;130-存储控制器;140-外设接口;150-射频单元;160-通讯总线/信号线;170-摄像单元;200-图像处理装置;210-路面区域识别模块;211-语义分割处理单元;212-路面区域确定单元;220-感兴趣区域提取模块;221-感兴趣区域选定单元;222-感兴趣区域更新单元;230-判断模块;240-分辨率调整模块;250-图像处理模块;260-子兴趣区域生成模块;270-目标兴趣区域确定模块;280-图像融合模块。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本发明的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
下面结合附图,对本发明的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
基于上述现有技术的缺陷,本发明实施例所提供的一种改进方式为:提取获得当前帧图片中的感兴趣区域,并在判定感兴趣区域的范围占当前帧图片的比例大于第一预设值时,调整感兴趣区域的分辨率后送入到预设的深度学习模型中进行处理。
请参阅图1,图1示出了本发明实施例所提供的一种摄像设备10的一种示意性结构图,在本发明实施例中,所述摄像设备10包括存储器110、存储控制器130,一个或多个(图中仅示出一个)处理器120、外设接口140、射频单元150、摄像单元170等。这些组件通过一条或多条通讯总线/信号线160相互通讯。
存储器110可用于存储软件程序以及模组,如本发明实施例所提供的图像处理装置200对应的程序指令/模组,处理器120通过运行存储在存储器110内的软件程序以及模组,从而执行各种功能应用以及图像处理,如本发明实施例所提供的图像处理方法。
其中,所述存储器110可以是,但不限于,随机存取存储器(Random AccessMemory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(ProgrammableRead-Only Memory,PROM),可擦除只读存储器(Erasable Programmable Read-OnlyMemory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-OnlyMemory,EEPROM)等。
处理器120可以是一种集成电路芯片,具有信号处理能力。上述的处理器120可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(NetworkProcessor,NP)、语音处理器以及视频处理器等;还可以是数字信号处理器、专用集成电路、现场可编程门阵列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器120也可以是任何常规的处理器等。
外设接口140将各种输入/输入装置耦合至处理器120以及存储器110。在一些实施例中,外设接口140,处理器120以及存储控制器130可以在单个芯片中实现。在本发明其他的一些实施例中,他们还可以分别由独立的芯片实现。
射频单元150用于接收以及发送电磁波,实现电磁波与电信号的相互转换,从而与通讯网络或者其他设备进行通讯。
摄像单元170用于拍摄照片,以使处理器120对拍摄的照片进行处理。
可以理解,图1所示的结构仅为示意,摄像设备10可以包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。图1中所示的各组件可以采用硬件、软件或其组合实现。
请参阅图2,图2示出了本发明实施例所提供的一种图像处理方法的一种示意性流程图,在本发明实施例中,该图像处理方法包括以下步骤:
步骤S100,确定出当前帧图片中的路面区域。
目前在视频检测领域,高像素图片都是经过调整降低图片的分辨率后,整图送到预设的深度学习模型中进行图像处理,但实际上针对辅助驾驶的情况,深度学习模型处理的图片中,包含有大片区域的无用信息。
比如,请参阅图3,图3为辅助驾驶时摄像设备10拍摄的图片示意图,在辅助驾驶过程中,实际上只有图3下半部分中路面区域包含的信息对汽车的辅助驾驶是有用的,上半部分中天空区域包含的信息对汽车的辅助驾驶是无用的,因此,在辅助驾驶过程中,实际上如图3中上半部分的天空是不需要进行处理的。
因此,在本发明实施例中,首先确定出当前帧图片中的路面区域,进而确定出当前帧图片中包含有对辅助驾驶有用信息的区域。
可选地,作为一种实施方式,确定出当前帧图片中的路面区域的方式可以为:根据当前帧图片中每个像素点各自的坐标以及每个像素点各自的像素值大小,来区别出当前帧图片中的天空区域及路面区域;或者是,还可以采用kmeans等聚类分析算法进行路面区域的识别。
可选地,作为另一种实施方式,确定出当前帧图片中的路面区域还可以采用语义分割的技术实现。请参阅图4,图4为图2中步骤S100的子步骤的一种示意性流程图,在本发明实施例中,步骤S100包括以下子步骤:
子步骤S110,得到当前帧图片的语义分割结果。
目前,语义分割(Full-Resolution Residual Networks,FRRN)技术广泛应用于自动驾驶及辅助驾驶领域。图像语义分割的目的是为了处理设备能够自动分割并识别图像中的内容,比如,请参阅图5,图5为语义分割示意图,图5(1)为原图,图5(2)为语义分割得到的结果示意图,将原图5(1)中的天空、路面、车辆以及建设等采用不同的色彩来表示,进而得到图5(2)的语义分割结果示意图。
同理,在确定出当前帧图片的路面区域时,首先依据摄像设备10中预设的语义分割算法,得到当前帧图片的语义分割结果。
子步骤S120,依据上一帧图片中的语义分割结果,确定出当前帧图片的语义分割结果中的路面区域。
可以理解,在摄像设备10中,还存储有上一帧图片的语义分割结果,上一帧图片的语义分割结果为摄像设备10按照预设的语义分割算法对上一帧图片进行处理时所得到的结果。
摄像设备10依据上一帧图片的语义分割结果,能够获悉语义分割结果中各自用于表示天空、路面、车辆以及建设等的色彩。相应地,依据上一帧图片的语义分割结果,即表示天空、路面、车辆以及建设等各自的色彩,即可在当前帧图片的语义分割结果中,确定出当前帧图片中的路面区域。
步骤S200,提取当前帧图片中的感兴趣区域。
如上所述,在辅助驾驶时,摄像设备10拍摄的当前帧图片中,路面区域为包含的有对辅助驾驶有用信息的区域,因此,摄像设备10依据路面区域,提取当前帧图片中的感兴趣区域(region of interest,ROI)。
可选地,作为一种实施方式,请参阅图6,图6为图2中步骤S200的子步骤的一种示意性流程图,在本发明实施例中,步骤S200包括以下子步骤:
子步骤S210,依据预设的生成方式,选定路面区域占当前帧图片中的所有区域作为感兴趣区域。
在提取当前帧图片中的感兴趣区域时,在当前帧图片中,按照预设的生成方式,选定路面区域占当前帧图片中的所有区域作为感兴趣区域。
例如,请参阅图7,图7为感兴趣区域的提取步骤示意图,在图7(1)所示的示意图中,利用矩形框,在当前帧图片中选定所有的路面区域,即矩形框的范围内必须包含有所有的路面区域,进而将矩形框所包含的所有区域作为感兴趣区域。
可选地,作为一种实施方式,步骤S200还包括以下子步骤:
子步骤S220,依据预设的缩放比例调整感兴趣区域的范围,以更新感兴趣区域。
为了排除车辆或者是建筑等障碍物遮挡造成路面区域被缩小的情况,对获取到的感兴趣区域,采用预设的缩放比例来调整感兴趣区域的范围,以对感兴趣区域做冗余处理,进而更新感兴趣区域,确保路面区域完全被感兴趣区域所包围,进而确保能够覆盖住路面区域上出现的车辆高度。
比如,图7(2)即为在图7(1)的基础上,将选取感兴趣区域的矩形框按照预设的缩放比例扩大(比如说扩大10%)后的结果,图7(2)所示的感兴趣区域为在图7(1)所示的感兴趣区域的基础上进行冗余处理的结果,再将图7(2)的感兴趣区域进行剪切处理,即得到如图7(3)所示的用于深度学习模型进行处理的图像数据。
基于上述设计,本发明实施例所提供的一种图像处理方法,通过将感兴趣区域按照预设的缩放比例进行调整更新的方式进行冗余处理,确保路面区域完全被感兴趣区域所包围。
步骤S300,判断感兴趣区域的范围占当前帧图片的比例是否大于第一预设值?当为是时,执行步骤S413;当为否时,执行步骤S421。
在当前帧图片中存在有大面积的遮挡时,比如摄像设备10前方有一辆大卡车或者是其他的障碍物时,可能会导致摄像设备10所拍摄到的路面区域很小,比如路面区域完全被遮挡等,进而导致所得到的感兴趣区域较小,影响深度学习模型对感兴趣区域的检测精度。
因此,在得到当前帧图片中的感兴趣区域后,依据感兴趣区域和当前帧图片各自的范围大小,判断感兴趣区域的范围占当前帧图片的比例是否大于第一预设值。当感兴趣区域的范围占当前帧图片的比例大于第一预设值时,表征感兴趣区域在当前帧图片上所占的区域足够大,能够满足深度学习模型对感兴趣区域的检测精度要求,此时执行步骤S413;反之,当感兴趣区域的范围占当前帧图片的比例小于或等于第一预设值时,表征感兴趣区域在当前帧图片上所占的区域比较小,不能够满足深度学习模型对感兴趣区域的检测精度要求,此时即执行步骤S421。
步骤S413,调整感兴趣区域的分辨率。
在判定感兴趣区域的范围占当前帧图片的比例大于第一预设值时,摄像设备10即判定感兴趣区域在当前帧图片上所占的区域足够大,此时,即调整感兴趣区域的分辨率,以将调整分辨率后的感兴趣区域输入到预设的深度学习模型中进行检测处理,其中,感兴趣区域调整后的分辨率小于调整前的分辨率。
步骤S414,依据预设的深度学习模型对调整分辨率后的感兴趣区域进行处理。
基于上述设计,本发明实施例所提供的一种图像处理方法,通过提取获得当前帧图片中的感兴趣区域,并在判定感兴趣区域的范围占当前帧图片的比例大于第一预设值时,调整感兴趣区域的分辨率后送入到预设的深度学习模型中进行处理,相比于现有技术,能够减小在处理高分辨率图片时的计算量,提升计算速度,节约计算资源。
作为一种实施方式,请继续参阅图2,在本发明实施例中,在执行步骤S413之前,该图像处理方法还包括以下步骤:
步骤S411,依据感兴趣区域,按照预设的缩放方式生成多个子兴趣区域。
由于在选取感兴趣区域时,是直接按照路面区域的范围进行选取得到的,但路面区域上存在的目标检测物体(比如说其他的汽车等)距离辅助驾驶汽车较远,这就导致目标检测物体在感兴趣区域上所占范围较小,成为“小物体”,导致目标检测物体的识别精度下降,从而使摄像设备10可能识别不出来“小物体”。
因此,对于提取到的感兴趣区域,按照预设的缩放方式,先生成多个子兴趣区域,其中,该多个子兴趣区域具有相同的缩放点。
比如,请参阅图8,图8为多个子兴趣区域的生成示意图,最外层的矩形框所包围的区域为选取的感兴趣区域,将路面两边的边线进行延伸后得到的交点作为缩放点,再按照预设的缩放方式,比如按照不同的缩放比例连续缩放最外层的矩形框,得到多个矩形框,每个矩形框各自所包围的区域均为一个子兴趣区域。
当然,可以理解,在本发明实施例其他的一些实施方式中,还可以采用其他的方式选定缩放点,比如现在感兴趣区域一条边线的中点或者是端点等,只要能够确定出缩放点即可,比如,缩放点还可以为预设的固定点或者是中点再往上调整一定的距离得到。
步骤S412,确定出多个子兴趣区域中的目标子兴趣区域。
在依据感兴趣区域得到多个子兴趣区域后,再根据摄像设备10所需要检测的目标检测物体,在多个子兴趣区域中确定出目标子兴趣区域,进而以该目标子兴趣区域作为步骤S413中用于调整分辨率的感兴趣区域,其中,目标子兴趣区域为多个子兴趣区域中包含有目标检测物体的最小区域。
可选地,作为一种实施方式,确定多个子兴趣区域中的目标子兴趣区域的方式可以为:遍历所有的子兴趣区域,找到所有识别出目标检测物体的子兴趣区域作为备选子兴趣区域,然后在所有备选子兴趣区域中,根据识别目标检测物体的目标识别框与每个子兴趣区域的交叠区域占目标识别框的比例大小,选定目标子兴趣区域。比如说,在备选子兴趣区域中相邻的两个子兴趣区域中,当目标识别框被较小的子兴趣区域完全包围时,则以较小的子兴趣区域作为目标子兴趣区域;当目标识别框没有被较小的子兴趣区域完全包围,且目标识别框与较小的子兴趣区域存在交叠区域,并且交叠区域占目标识别框的比例大于第二预设值,则此时选择相邻的两者中较小的子兴趣区域作为目标子兴趣区域;而当标识别框没有被较小的子兴趣区域完全包围,且目标识别框与较小的子兴趣区域存在交叠区域,并且交叠区域占目标识别框的比例小于或等于第二预设值时,则选择相邻的两者中较大的子兴趣区域作为目标子兴趣区域。
基于上述设计,本发明实施例所提供的一种图像处理方法,通过在以预设的缩放方式将感兴趣区域缩放后得到的多个子兴趣区域中确定出的目标子兴趣区域作为图像处理的感兴趣区域,使得目标检测物体在感兴趣区域中的像素比例得到放大,提高了目标检测物体的检测识别率。
请继续参阅图2,在本发明实施例中,当依据步骤S300判定感兴趣区域的范围占当前帧图片的比例小于或等于第一预设值时,该图像处理方法还包括以下步骤:
步骤S421,调整当前帧图片的分辨率。
也就是说,当依据步骤S300判定感兴趣区域的范围占当前帧图片的比例小于或等于第一预设值时,则摄像设备10判定感兴趣区域在当前帧图片上所占的区域范围比较小,此时即以当前帧图片整体作为感兴趣区域,调整当前帧图片的分辨率,以将调整分辨率后的当前帧图片输入到预设的深度学习模型中进行检测处理,其中,调整后的分辨率小于调整前的分辨率。
步骤S422,依据预设的深度学习模型对调整分辨率后的当前帧图片进行处理。
上述步骤S414中依据预设的深度学习模型进行处理的感兴趣区域仅为当前帧图片的一部分,但由于摄像设备10展示给用户的图片一般为完整的当前帧图片,并且在目标物体连续追踪时,也需要连续的完整图片来进行追踪,因此,作为一种实施方式,请继续参阅图2,在本发明实施例中,该图像处理方法还包括以下步骤:
步骤S500,恢复处理后的感兴趣区域的分辨率至调整前的分辨率。
步骤S600,将恢复分辨率后的感兴趣区域与当前帧图片融合。
恢复分辨率后的感兴趣区域与当前帧图片的分辨率相同,此时,将恢复分辨率后的感兴趣区域与当前帧图片进行融合后,即可实现连续的多帧图像中对目标检测物体的连续识别。也就是说,摄像设备10在对图像进行处理的过程中,从第一帧图片到第N帧图片的处理过程中,在处理第一帧图片时,即将由第一帧图片中提取出来的感兴趣区域融合回第一帧图片中;从第N帧图片中提取出来的感兴趣区域则融合回第N帧图片中。即:由那一帧图片提取出的感兴趣区域,则将提取出的感兴趣区域融合回相应的那一帧图片中。
请参阅图9,图9示出了本发明实施例所提供的一种图像处理装置200的一种示意性结构图,在本发明实施例中,该图像处理装置200包括路面区域识别模块210、感兴趣区域提取模块220、判断模块230、分辨率调整模块240及图像处理模块250。
路面区域识别模块210用于确定出当前帧图片中的路面区域。
可选地,作为一种实施方式,请参阅图10,图10示出了本发明实施例所提供的一种图像处理装置200的路面区域识别模块210的一种示意性结构图,在本发明实施例中,该路面区域识别模块210包括语义分割处理单元211及路面区域确定单元212。
语义分割处理单元211用于得到所述当前帧图片的语义分割结果。
路面区域确定单元212用于依据上一帧图片中的语义分割结果,确定出所述当前帧图片的语义分割结果中的路面区域。
请继续参阅图9,感兴趣区域提取模块220用于提取所述当前帧图片中的感兴趣区域,其中,所述感兴趣区域中包含有所述路面区域。
可选地,作为一种实施方式,请参阅图11,图11示出了本发明实施例所提供的一种图像处理装置200的感兴趣区域提取模块220的一种示意性结构图,在本发明实施例中,该感兴趣区域提取模块220包括感兴趣区域选定单元221及感兴趣区域更新单元222。
感兴趣区域选定单元221用于依据预设的生成方式,选定所述路面区域占所述当前帧图片中的所有区域作为感兴趣区域。
感兴趣区域更新单元222用于依据预设的缩放比例调整所述感兴趣区域的范围,以更新所述感兴趣区域。
请继续参阅图9,判断模块230用于判断所述感兴趣区域的范围占所述当前帧图片的比例是否大于第一预设值。
分辨率调整模块240用于当所述感兴趣区域的范围占所述当前帧图片的比例大于所述第一预设值时,调整所述感兴趣区域的分辨率,其中,所述调整后的分辨率小于所述调整前的分辨率。
图像处理模块250用于依据预设的深度学习模型对所述调整分辨率后的感兴趣区域进行处理。
作为一种实施方式,请继续参阅图9,所述分辨率调整模块240还用于,当所述感兴趣区域的范围占所述当前帧图片的比例小于或等于所述第一预设值时,调整所述当前帧图片的分辨率。
所述图像处理模块250还用于依据预设的深度学习模型对所述调整分辨率后的当前帧图片进行处理。
作为一种实施方式,请继续参阅图9,该图像处理装置200还包括子兴趣区域生成模块260及目标兴趣区域确定模块270。
子兴趣区域生成模块260用于依据所述感兴趣区域,按照预设的缩放方式生成多个子兴趣区域,其中,所述多个子兴趣区域具有相同的缩放点。
目标兴趣区域确定模块270用于确定出所述多个子兴趣区域中的目标子兴趣区域,其中,所述目标子兴趣区域为所述多个子兴趣区域中包含有目标检测物体的最小区域,且所述目标子兴趣区域为所述调整所述感兴趣区域的分辨率的步骤中的子兴趣区域。
作为一种实施方式,请继续参阅图9,在本发明实施例中,该图像处理装置200还包括图像融合模块280。
所述分辨率调整模块240还用于恢复所述处理后的感兴趣区域的分辨率至所述调整前的分辨率。
所述图像融合模块280用于将所述恢复分辨率后的感兴趣区域与所述当前帧图片融合。
在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本发明实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
综上所述,本发明实施例所提供的一种图像处理方法、装置、摄像设备及存储介质,通过提取获得当前帧图片中的感兴趣区域,并在判定感兴趣区域的范围占当前帧图片的比例大于第一预设值时,调整感兴趣区域的分辨率后送入到预设的深度学习模型中进行处理,相比于现有技术,能够减小在处理高分辨率图片时的计算量,提升计算速度,节约计算资源;还通过在以预设的缩放方式将感兴趣区域缩放后得到的多个子兴趣区域中确定出的目标子兴趣区域作为图像处理的感兴趣区域,使得目标检测物体在感兴趣区域中的像素比例得到放大,提高了目标检测物体的检测识别率;还通过将感兴趣区域按照预设的缩放比例进行调整更新的方式进行冗余处理,确保路面区域完全被感兴趣区域所包围。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其它的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
Claims (10)
1.一种图像处理方法,其特征在于,所述方法包括:
确定出当前帧图片中的路面区域;
提取所述当前帧图片中的感兴趣区域,其中,所述感兴趣区域中包含有所述路面区域;
判断所述感兴趣区域的范围占所述当前帧图片的比例是否大于第一预设值;
当所述感兴趣区域的范围占所述当前帧图片的比例大于所述第一预设值时,调整所述感兴趣区域的分辨率,其中,所述调整后的分辨率小于所述调整前的分辨率;
依据预设的深度学习模型对所述调整分辨率后的感兴趣区域进行处理。
2.如权利要求1所述的方法,其特征在于,所述确定出当前帧图片中的路面区域的步骤,包括:
得到所述当前帧图片的语义分割结果;
依据上一帧图片中的语义分割结果,确定出所述当前帧图片的语义分割结果中的路面区域。
3.如权利要求1所述的方法,其特征在于,所述提取所述当前帧图片中的感兴趣区域的步骤,包括:
依据预设的生成方式,选定所述路面区域占所述当前帧图片中的所有区域作为感兴趣区域。
4.如权利要求3所述的方法,其特征在于,所述提取所述当前帧图片中的感兴趣区域的步骤,还包括:
依据预设的缩放比例调整所述感兴趣区域的范围,以更新所述感兴趣区域。
5.如权利要求1所述的方法,其特征在于,所述方法还包括:
当所述感兴趣区域的范围占所述当前帧图片的比例小于或等于所述第一预设值时,调整所述当前帧图片的分辨率;
依据预设的深度学习模型对所述调整分辨率后的当前帧图片进行处理。
6.如权利要求1所述的方法,其特征在于,在所述调整所述感兴趣区域的分辨率的步骤之前,所述方法还包括:
依据所述感兴趣区域,按照预设的缩放方式生成多个子兴趣区域,其中,所述多个子兴趣区域具有相同的缩放点;
确定出所述多个子兴趣区域中的目标子兴趣区域,其中,所述目标子兴趣区域为所述多个子兴趣区域中包含有目标检测物体的最小区域,且所述目标子兴趣区域为所述调整所述感兴趣区域的分辨率的步骤中的子兴趣区域。
7.如权利要求1所述的方法,其特征在于,所述方法还包括:
恢复所述处理后的感兴趣区域的分辨率至所述调整前的分辨率;
将所述恢复分辨率后的感兴趣区域与所述当前帧图片融合。
8.一种图像处理装置,其特征在于,所述装置包括:
路面区域识别模块,用于确定出当前帧图片中的路面区域;
感兴趣区域提取模块,用于提取所述当前帧图片中的感兴趣区域,其中,所述感兴趣区域中包含有所述路面区域;
判断模块,用于判断所述感兴趣区域的范围占所述当前帧图片的比例是否大于第一预设值;
分辨率调整模块,用于当所述感兴趣区域的范围占所述当前帧图片的比例大于所述第一预设值时,调整所述感兴趣区域的分辨率,其中,所述调整后的分辨率小于所述调整前的分辨率;
图像处理模块,用于依据预设的深度学习模型对所述调整分辨率后的感兴趣区域进行处理。
9.一种摄像设备,其特征在于,包括:
存储器,用于存储一个或多个程序;
处理器;
当所述一个或多个程序被所述处理器执行时,实现如权利要求1-7中任一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1-7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811039245.XA CN109034136B (zh) | 2018-09-06 | 2018-09-06 | 图像处理方法、装置、摄像设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811039245.XA CN109034136B (zh) | 2018-09-06 | 2018-09-06 | 图像处理方法、装置、摄像设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109034136A true CN109034136A (zh) | 2018-12-18 |
CN109034136B CN109034136B (zh) | 2021-07-20 |
Family
ID=64623889
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811039245.XA Active CN109034136B (zh) | 2018-09-06 | 2018-09-06 | 图像处理方法、装置、摄像设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109034136B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109871814A (zh) * | 2019-02-22 | 2019-06-11 | 成都旷视金智科技有限公司 | 年龄的估计方法、装置、电子设备和计算机存储介质 |
CN110490910A (zh) * | 2019-08-13 | 2019-11-22 | 顺丰科技有限公司 | 目标检测方法、装置、电子设备及存储介质 |
CN110572579A (zh) * | 2019-09-30 | 2019-12-13 | 联想(北京)有限公司 | 图像处理方法、装置及电子设备 |
CN111311547A (zh) * | 2020-01-20 | 2020-06-19 | 北京航空航天大学 | 一种超声图像分割装置及超声图像分割方法 |
CN111461104A (zh) * | 2019-01-22 | 2020-07-28 | 北京京东尚科信息技术有限公司 | 视觉识别方法、装置、设备及存储介质 |
CN111612726A (zh) * | 2019-02-26 | 2020-09-01 | 广州慧睿思通信息科技有限公司 | 图像数据筛选方法、装置、计算机设备和存储介质 |
CN112702568A (zh) * | 2020-12-14 | 2021-04-23 | 广东荣文科技集团有限公司 | 异常检测方法及相关装置 |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120062769A1 (en) * | 2010-03-30 | 2012-03-15 | Sony Corporation | Image processing device and method, and program |
CN102831617A (zh) * | 2012-07-17 | 2012-12-19 | 聊城大学 | 一种运动目标检测与跟踪的方法和*** |
US20150065850A1 (en) * | 2013-09-04 | 2015-03-05 | Siemens Corporation | Accurate and efficient polyp detection in wireless capsule endoscopy images |
CN105512649A (zh) * | 2016-01-22 | 2016-04-20 | 大连楼兰科技股份有限公司 | 一种基于颜色空间的高清视频实时车牌定位方法 |
CN106682409A (zh) * | 2016-12-20 | 2017-05-17 | 上海联影医疗科技有限公司 | 采样方法及放射治疗计划优化方法、剂量计算方法 |
CN106897993A (zh) * | 2017-01-12 | 2017-06-27 | 华东师范大学 | 基于定量磁化率成像人脑灰质核团概率图谱的构建方法 |
CN107066990A (zh) * | 2017-05-04 | 2017-08-18 | 厦门美图之家科技有限公司 | 一种目标跟踪方法及移动设备 |
CN107292304A (zh) * | 2017-06-02 | 2017-10-24 | 国芯科技(北京)有限公司 | 一种感兴趣区域确定的方法及装置 |
CN107944351A (zh) * | 2017-11-07 | 2018-04-20 | 深圳市易成自动驾驶技术有限公司 | 图像识别方法、装置及计算机可读存储介质 |
CN108230355A (zh) * | 2017-06-14 | 2018-06-29 | 北京市商汤科技开发有限公司 | 目标跟踪及神经网络训练方法、装置、存储介质和电子设备 |
CN108307113A (zh) * | 2018-01-26 | 2018-07-20 | 北京图森未来科技有限公司 | 图像采集方法、图像采集控制方法及相关装置 |
CN108427951A (zh) * | 2018-02-08 | 2018-08-21 | 腾讯科技(深圳)有限公司 | 图像处理方法、装置、存储介质和计算机设备 |
CN108460787A (zh) * | 2018-03-06 | 2018-08-28 | 北京市商汤科技开发有限公司 | 目标跟踪方法和装置、电子设备、程序、存储介质 |
-
2018
- 2018-09-06 CN CN201811039245.XA patent/CN109034136B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120062769A1 (en) * | 2010-03-30 | 2012-03-15 | Sony Corporation | Image processing device and method, and program |
CN102831617A (zh) * | 2012-07-17 | 2012-12-19 | 聊城大学 | 一种运动目标检测与跟踪的方法和*** |
US20150065850A1 (en) * | 2013-09-04 | 2015-03-05 | Siemens Corporation | Accurate and efficient polyp detection in wireless capsule endoscopy images |
CN105512649A (zh) * | 2016-01-22 | 2016-04-20 | 大连楼兰科技股份有限公司 | 一种基于颜色空间的高清视频实时车牌定位方法 |
CN106682409A (zh) * | 2016-12-20 | 2017-05-17 | 上海联影医疗科技有限公司 | 采样方法及放射治疗计划优化方法、剂量计算方法 |
CN106897993A (zh) * | 2017-01-12 | 2017-06-27 | 华东师范大学 | 基于定量磁化率成像人脑灰质核团概率图谱的构建方法 |
CN107066990A (zh) * | 2017-05-04 | 2017-08-18 | 厦门美图之家科技有限公司 | 一种目标跟踪方法及移动设备 |
CN107292304A (zh) * | 2017-06-02 | 2017-10-24 | 国芯科技(北京)有限公司 | 一种感兴趣区域确定的方法及装置 |
CN108230355A (zh) * | 2017-06-14 | 2018-06-29 | 北京市商汤科技开发有限公司 | 目标跟踪及神经网络训练方法、装置、存储介质和电子设备 |
CN107944351A (zh) * | 2017-11-07 | 2018-04-20 | 深圳市易成自动驾驶技术有限公司 | 图像识别方法、装置及计算机可读存储介质 |
CN108307113A (zh) * | 2018-01-26 | 2018-07-20 | 北京图森未来科技有限公司 | 图像采集方法、图像采集控制方法及相关装置 |
CN108427951A (zh) * | 2018-02-08 | 2018-08-21 | 腾讯科技(深圳)有限公司 | 图像处理方法、装置、存储介质和计算机设备 |
CN108460787A (zh) * | 2018-03-06 | 2018-08-28 | 北京市商汤科技开发有限公司 | 目标跟踪方法和装置、电子设备、程序、存储介质 |
Non-Patent Citations (5)
Title |
---|
NISHANT SHRIVASTAVA ET AL: "Content based image retrieval based on relative locations of multiple regions of interest using selective regions matching", 《INFORMATION SCIENCES》 * |
卢胜男: "复杂交通视频场景中的车辆轨迹提取及行为分析", 《中国博士学位论文全文数据库 信息科技辑》 * |
李松泽: "《基于深度学习的车道线检测***的设计与实现》", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
陈秀梅等: "基于Curvelet变换和SPIHT算法的医学图像感兴趣区压缩", 《中国医学影像学杂志》 * |
鲁书喜等: "《基于感兴趣区域的空域分辨率可调整方法》", 《平顶山学院学报》 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111461104A (zh) * | 2019-01-22 | 2020-07-28 | 北京京东尚科信息技术有限公司 | 视觉识别方法、装置、设备及存储介质 |
CN111461104B (zh) * | 2019-01-22 | 2024-04-09 | 北京京东乾石科技有限公司 | 视觉识别方法、装置、设备及存储介质 |
CN109871814A (zh) * | 2019-02-22 | 2019-06-11 | 成都旷视金智科技有限公司 | 年龄的估计方法、装置、电子设备和计算机存储介质 |
CN111612726A (zh) * | 2019-02-26 | 2020-09-01 | 广州慧睿思通信息科技有限公司 | 图像数据筛选方法、装置、计算机设备和存储介质 |
CN110490910A (zh) * | 2019-08-13 | 2019-11-22 | 顺丰科技有限公司 | 目标检测方法、装置、电子设备及存储介质 |
CN110572579A (zh) * | 2019-09-30 | 2019-12-13 | 联想(北京)有限公司 | 图像处理方法、装置及电子设备 |
CN111311547A (zh) * | 2020-01-20 | 2020-06-19 | 北京航空航天大学 | 一种超声图像分割装置及超声图像分割方法 |
CN112702568A (zh) * | 2020-12-14 | 2021-04-23 | 广东荣文科技集团有限公司 | 异常检测方法及相关装置 |
CN112702568B (zh) * | 2020-12-14 | 2023-11-24 | 广东荣文科技集团有限公司 | 异常检测方法及相关装置 |
Also Published As
Publication number | Publication date |
---|---|
CN109034136B (zh) | 2021-07-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109034136A (zh) | 图像处理方法、装置、摄像设备及存储介质 | |
Wei et al. | Multi-vehicle detection algorithm through combining Harr and HOG features | |
CN112132156B (zh) | 多深度特征融合的图像显著性目标检测方法及*** | |
CN110163188B (zh) | 视频处理以及在视频中嵌入目标对象的方法、装置和设备 | |
CN110555433A (zh) | 图像处理方法、装置、电子设备及计算机可读存储介质 | |
CN101406390A (zh) | 检测人体部位和人的方法和设备以及对象检测方法和设备 | |
CN111696080B (zh) | 一种基于静态纹理的人脸欺诈检测方法、***及存储介质 | |
CN113657409A (zh) | 车辆损失检测方法、装置、电子设备及存储介质 | |
Xing et al. | Traffic sign recognition using guided image filtering | |
CN110706235A (zh) | 一种基于双级级联分割的远红外行人检测方法 | |
CN110956081A (zh) | 车辆与交通标线位置关系的识别方法、装置及存储介质 | |
Kim et al. | Robust facial landmark extraction scheme using multiple convolutional neural networks | |
Gu et al. | Embedded and real-time vehicle detection system for challenging on-road scenes | |
CN112016519A (zh) | 一种基于Hard Triple的车辆重识别方法及*** | |
US20120189161A1 (en) | Visual attention apparatus and control method based on mind awareness and display apparatus using the visual attention apparatus | |
CN108647605B (zh) | 一种结合全局颜色与局部结构特征的人眼凝视点提取方法 | |
Jain et al. | A hybrid approach for detection and recognition of traffic text sign using MSER and OCR | |
JP5201184B2 (ja) | 画像処理装置及びプログラム | |
CN111199199B (zh) | 一种基于自适应上下文区域选取的动作识别方法 | |
Gornale et al. | Detection and classification of signage’s from random mobile videos using local binary patterns | |
CN115115947A (zh) | 遥感图像检测方法、装置、电子设备以及存储介质 | |
JP6467817B2 (ja) | 画像処理装置、画像処理方法、およびプログラム | |
Chandra et al. | A review of various techniques used in the implementation of lane departure and road detection | |
Das et al. | Bag of feature approach for vehicle classification in heterogeneous traffic | |
JP2017228297A (ja) | テキスト検出方法および装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20220323 Address after: 430090 No. b1336, chuanggu startup area, taizihu cultural Digital Creative Industry Park, No. 18, Shenlong Avenue, Wuhan Economic and Technological Development Zone, Hubei Province Patentee after: Yikatong (Hubei) Technology Co.,Ltd. Address before: 430000 no.c101, chuanggu start up area, taizihu cultural Digital Industrial Park, No.18 Shenlong Avenue, Wuhan Economic and Technological Development Zone, Hubei Province Patentee before: HUBEI ECARX TECHNOLOGY Co.,Ltd. |