CN114004840A

CN114004840A - 图像处理方法、训练方法、检测方法、装置、设备及介质

Info

Publication number: CN114004840A
Application number: CN202111279533.4A
Authority: CN
Inventors: 康帅
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2021-10-29
Filing date: 2021-10-29
Publication date: 2022-02-01

Abstract

本公开提供了图像处理方法、目标检测模型的训练方法、目标检测方法、装置、电子设备、存储介质以及程序产品，涉及人工智能技术领域，尤其涉及计算机视觉和深度学习技术领域。具体实现方案为：对多个待处理图像进行裁剪处理，得到与所述多个待处理图像一一对应的多个裁剪后图像；将所述多个裁剪后图像进行边缘重叠拼接，得到拼接后图像；以及对所述拼接后图像中的重叠区域进行图像融合处理，得到目标图像。

Description

图像处理方法、训练方法、检测方法、装置、设备及介质

技术领域

本公开涉及人工智能技术领域，尤其涉及计算机视觉和深度学习技术领域。具体涉及图像处理方法、目标检测模型的训练方法、目标检测方法、装置、电子设备、存储介质以及程序产品。

背景技术

图像处理技术是用计算机对图像信息进行处理的技术。图像处理技术主要包括图像数字化、图像增强和复原、图像数据编码、图像分割以及图像识别等。图像处理技术可以应用于科学研究、工农业生产、生物医学工程、航空航天、军事、机器人制造等领域。因此，图像处理技术的不断发展，例如识别能力、特征提取能力或者处理速度等方面的提升，均能够促进图像处理技术发挥更大的作用。

发明内容

本公开提供了一种图像处理方法、目标检测模型的训练方法、目标检测方法、装置、电子设备、存储介质以及程序产品。

根据本公开的一方面，提供了一种图像处理方法，包括：对多个待处理图像进行裁剪处理，得到与所述多个待处理图像一一对应的多个裁剪后图像；将所述多个裁剪后图像进行边缘重叠拼接，得到拼接后图像；以及对所述拼接后图像中的重叠区域进行图像融合处理，得到目标图像。

根据本公开的另一方面，提供了一种目标检测模型的训练方法，包括：利用训练样本训练目标检测模型，得到训练后的目标检测模型，其中，所述训练样本包括利用图像处理方法得到的样本图像。

根据本公开的另一方面，提供了一种目标检测方法，包括：利用目标检测模型处理待检测图像，得到目标检测结果；其中，所述目标检测模型是目标检测模型的训练方法训练的。

根据本公开的另一方面，提供了一种图像处理装置，包括：裁剪模块，用于对多个待处理图像进行裁剪处理，得到与所述多个待处理图像一一对应的多个裁剪后图像；拼接模块，用于将所述多个裁剪后图像进行边缘重叠拼接，得到拼接后图像；以及融合模块，用于对所述拼接后图像中的重叠区域进行图像融合处理，得到目标图像。

根据本公开的另一方面，提供了一种目标检测模型的训练装置，包括：训练模块，用于利用训练样本训练目标检测模型，得到训练后的目标检测模型，其中，所述训练样本包括利用上述所述的图像处理方法得到的样本图像。

根据本公开的另一方面，提供了一种目标检测装置，包括：检测模块，用于利用目标检测模型处理待检测图像，得到目标检测结果；其中，所述目标检测模型是根据上述所述的目标检测模型的训练方法训练的。

根据本公开的另一方面，提供了一种电子设备，包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行如上所述的方法。

根据本公开的另一方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行如上所述的方法。

根据本公开的另一方面，提供了一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现如上所述的方法。

应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案，不构成对本公开的限定。其中：

图1示意性示出了根据本公开实施例的可以应用目标检测方法及装置的示例性***架构；

图2示意性示出了根据本公开实施例的图像处理方法的流程图；

图3示意性示出了根据本公开实施例的裁剪处理的示意图；

图4示意性示出了根据本公开实施例的拼接后图像的示意图；

图5示意性示出了根据本公开另一实施例的拼接后图像的示意图；

图6示意性示出了根据本公开另一实施例的待融合图像的示意图；

图7示意性示出了根据本公开实施例的目标检测模型的训练方法的流程图；

图8示意性示出了根据本公开实施例的目标检测方法的流程图；

图9示意性示出了根据本公开实施例的图像处理装置的框图；

图10示意性示出了根据本公开实施例的目标检测模型的训练装置的框图；

图11示意性示出了根据本公开实施例的目标检测装置的框图；以及

图12示意性示出了根据本公开实施例的适于实现图像处理方法、目标检测方法或者目标检测模型的训练方法的电子设备的框图。

具体实施方式

以下结合附图对本公开的示范性实施例做出说明，其中包括本公开实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本公开的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

本公开提供了图像处理方法、目标检测模型的训练方法、目标检测方法、装置、电子设备、存储介质以及程序产品。

根据本公开的实施例，图像处理方法可以包括：对多个待处理图像进行裁剪处理，得到与多个待处理图像一一对应的多个裁剪后图像；将多个裁剪后图像进行边缘重叠拼接，得到拼接后图像；以及对拼接后图像中的重叠区域进行图像融合处理，得到目标图像。

根据本公开的另一实施例，目标检测模型的训练方法可以包括：利用训练样本训练目标检测模型，得到训练后的目标检测模型，其中，训练样本包括利用图像处理方法得到的样本图像。

根据本公开的另一实施例，目标检测方法可以包括：利用目标检测模型处理待检测图像，得到目标检测结果；其中，目标检测模型是目标检测模型的训练方法训练的。

本公开的技术方案中，所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理，均符合相关法律法规的规定，且不违背公序良俗。

图1示意性示出了根据本公开实施例的可以应用目标检测方法及装置的示例性***架构。

需要注意的是，图1所示仅为可以应用本公开实施例的***架构的示例，以帮助本领域技术人员理解本公开的技术内容，但并不意味着本公开实施例不可以用于其他设备、***、环境或场景。例如，在另一实施例中，可以应用目标检测方法及装置的示例性***架构可以包括终端设备，但终端设备可以无需与服务器进行交互，即可实现本公开实施例提供的目标检测方法及装置。

需要注意的是，图1所示仅为可以应用目标检测方法及装置的示例性***架构的示例，以帮助本领域技术人员理解本公开的技术内容，但并不意味着本公开实施例不可以用于其他设备、***、环境或场景。

如图1所示，待检测图像可以是通过视频采集设备101例如数码相机、摄像头等采集得到的。待检测图像可以通过视频采集设备101传输给终端设备102。

可以利用本公开实施例提供的目标检测方法，对待检测图像进行处理，得到关于目标对象的目标检测结果。

根据本公开的实施例，本公开实施例提供的目标检测方法一般可以由终端设备102执行。终端设备102可以配置有用于处理待检测图像的目标检测模型104，终端设备102可以和视频采集设备101通信连接，可以经由视频采集设备101将待检测图像传输至终端设备102。

根据本公开的实施例，终端设备102可以是具有显示屏并且支持图像处理的各种电子设备，包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。

根据本公开的实施例，本公开实施例所提供的目标检测方法一般也可以由服务器103执行。相应地，本公开实施例所提供的目标检测装置一般也可以设置于服务器103中。本公开实施例所提供的目标检测方法也可以由不同于服务器103且能够与终端设备102和/或服务器103通信的服务器或服务器集群执行。相应地，本公开实施例所提供的目标检测装置也可以设置于不同于服务器103且能够与终端设备102和/或服务器103通信的服务器或服务器集群中。

根据本公开的实施例，服务器103可以是提供各种服务的服务器，例如，服务器103可以配置有用于处理待检测图像的目标检测模型104，对用户利用终端设备102所传输的待检测图像进行目标检测处理的后台管理服务器(仅为示例)。但是并不局限于此，服务器还可以是提供对目标检测模型进行训练服务的服务器。

应该理解，图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器。

图2示意性示出了根据本公开实施例的图像处理方法的流程图。

如图2所示，该方法包括操作S210～S230。

操作S210，对多个待处理图像进行裁剪处理，得到与多个待处理图像一一对应的多个裁剪后图像。

操作S220，将多个裁剪后图像进行边缘重叠拼接，得到拼接后图像。

操作S230，对拼接后图像中的重叠区域进行图像融合处理，得到目标图像。

根据本公开的实施例，针对多个待处理图像中的每个待处理图像，进行裁剪处理，可以是指从待处理图像中裁剪得到待处理图像中的一部分作为裁剪后图像。可以按照预定的裁剪比例、预定的裁剪形状进行裁剪，但是并不局限于此，还可以随机裁剪或者不裁剪。

根据本公开的实施例，对多个待处理图像进行裁剪处理，有利于后续多个裁剪后图像进行边缘重叠拼接，防止拼接后图像过大或者目标对象过多而导致后续处理困难的问题。

根据本公开的实施例，将多个裁剪后图像进行边缘重叠拼接，可以是指裁剪后图像的边缘与相邻的裁剪后图像的边缘重叠，即相邻的两个裁剪后图像的边缘上下叠置，而非边缘接触或者边缘靠近。

根据本公开的实施例，对裁剪后图像的数量不做限定，例如可以是2个，也可以是3个、4个或者更多个。对裁剪后图像的重叠拼接方式不做限定，例如，通过边缘重叠拼接后得到的拼接后图像可以是呈圆环型，还可以是呈线性，也可以是呈矩形。

根据本公开的实施例，图像融合处理可以是指多个图像综合成一幅新的图像。例如，采用Mixup(融合)方法将重叠区域进行图像融合处理。但是并不局限于此。还可以是采用其他已知图像融合方法来对拼接后图像的重叠区域进行图像融合处理。

利用本公开实施例提供的图像处理方法，可以结合多个待处理图像中的目标对象，将其进行组合得到目标图像，由此丰富目标图像中的目标对象的多样性。将本公开实施例提供的目标图像作为训练样本训练模型，将有助于提高训练速度。此外，在对多个裁剪后图像进行边缘重叠拼接，并对重叠区域进行图像融合处理，可以降低拼接边缘的域分化的问题，避免由边缘特征而导致的目标对象在检测过程中产生目标歧义的问题，进而使得边缘特征更平滑，将本公开实施例提供的目标图像作为训练样本训练模型，有助于提高模型精度。

下面参考图3～图6，结合具体实施例对如图2所示的图像处理方法做进一步说明。

图3示意性示出了根据本公开实施例的裁剪处理的示意图。

如图3所示，针对待处理图像310，可以按照预定裁剪图形例如矩形、预定裁剪比例设置裁剪框320，可以将待处理图像的中心位置作为基准位置，从待处理图像的基准位置向任一方向进行滑动、定位，然后以裁剪框320的大小、形状对待处理图像310进行裁剪，得到裁剪后图像330。

根据本公开的实施例，裁剪图形可以是矩形，矩形可以包括长方形或者正方形，但是并不局限于此，还可以是菱形、三角形或者圆形等形状。只要是能够裁剪的形状即可。

根据本公开的示例性实施例，裁剪框的图形可以采用矩形，进而裁剪后图像为矩形。裁剪后图像为矩形将更有利于后续拼接形成利于应用的目标图像。

根据本公开的实施例，预定裁剪比例不做限定，例如，裁剪后图像的面积可以是待处理图像的面积的1/4，但是并不局限于此，裁剪后图像的面积还可以是待处理图像的面积的1/3或者1/5。

根据本公开的示例性实施例，预定裁剪比例可以为：裁剪后图像的面积为待处理图像的面积的1/4。例如，可以以待处理图像的中心点、以及任一一个顶角为裁切后图像的两个相对的顶角，进行裁切，得到裁切后图像。利用该预定裁剪比例可以很好的保留待处理图像中的目标对象的信息，而且有利于提高裁剪后图像中的目标对象的数量，进而提高目标图像中的目标对象的数量，丰富目标图像中目标对象的多样性。

根据本公开的实施例，在执行操作S220将多个裁剪后图像进行边缘重叠拼接，得到拼接后图像之前，还可以对裁剪后图像进行翻转、缩放、色域变化中的一项或多项预处理操作。

根据本公开的实施例，通过对裁剪后图像进行预处理操作，可以提高裁剪后图像的多样性。

根据本公开的示例性实施例，对多个裁剪后图像中的一个或多个裁剪后图像进行缩放预处理，例如，对裁剪后图像进行等比例缩小。由此来调整用于后续拼接的裁剪后图像中目标对象的尺度，即大小。使得拼接后图像中目标对象的尺度不同，提高小尺度的目标对象的占比，丰富目标对象的尺度的多样性。

图4示意性示出了根据本公开实施例的拼接后图像的示意图。

如图4所示，从多个裁剪后图像中确定面积最大的裁剪后图像作为基准裁剪后图像410；以及以基准裁剪后图像410的一个顶点作为拼接中心点420，对多个裁剪后图像中的除基准裁剪后图像410外的其他裁剪后图像，以拼接中心点420为中心进行至少两个边缘的边缘重叠拼接，得到拼接后图像。

根据本公开的实施例，以面积最大的裁剪后图像作为基准裁剪后图像。可以基于基准裁剪后图像确定待填充的填充框，使得多个裁剪后图像完整且填充框的面积最小。

根据本公开的实施例，对多个裁剪后图像中的除基准裁剪后图像外的其他裁剪后图像，以拼接中心点为中心进行至少两个边缘的边缘重叠拼接，能够保证拼接后图像中的多个裁剪后图像之间无拼接缝隙或者空白区域，保证图像之间的完整性，避免由边缘特征突出而导致的目标对象在检测过程中产生目标歧义的问题。

根据本公开的实施例，可以不限定于以拼接中心点为中心进行边缘重叠拼接，还可以按照其他的边缘重叠拼接的方式，只要是保证拼接后图像的图像区域无空隙即可。

图5示意性示出了根据本公开另一实施例的拼接后图像的示意图。

如图5所示，可以从四个裁剪后图像中确定面积最大的裁剪后图像作为基准裁剪后图像510；以基准裁剪后图像510的一个顶点作为拼接中心点520，对其他三个非基准裁剪后图像的裁剪后图像530、540、550，按照平行的方式、以拼接中心点为中心进行至少两个边缘的边缘重叠拼接，得到拼接后图像。

例如，基准裁剪后图像的一个顶点标记为(base_W，base_H)，可以以该点作为拼接中心点，其他三个裁剪后图像中的每个裁剪后图像，以拼接中心点为中心，按照平行的方式(例如，保持裁剪后图像的边缘与基准裁剪后图像中的相邻边缘平行的方式)进行边缘重叠拼接，得到拼接后图像。

根据本公开的实施例，不仅限定于4个裁剪后图像，还可以采用大于4或者小于4的数量的裁剪后图像进行拼接。根据本公开的实施例，进行拼接的裁剪后图像的数量太多，目标对象多，导致像素点多，进而造成因特征提取量大而不利于后续处理的问题；进行拼接的裁剪后图像的数量太少，达不到丰富目标对象的信息的效果。综合考虑，可以采用4个裁剪后图像进行拼接。

需要说明的是，这只是一种裁切方式，还可以将4个待处理图像(未进行裁切)进行组合，或者三个待处理图像进行裁切，另外一个待处理图像不进行裁切进行组合。

根据本公开的实施例，可以按照固定不变的预定边缘重叠宽度进行边缘重叠拼接，但是并不局限于此，还可以将边缘重叠宽度设置为可调节的。例如，边缘重叠宽度可以根据裁剪后图像的大小自动调整。

根据本公开的实施例，针对操作S220，将多个裁剪后图像进行边缘重叠拼接，得到拼接后图像还可以包括如下操作。

例如，针对多个裁剪后图像中进行边缘重叠拼接的相邻至少两个裁剪后图像，计算至少两个裁剪后图像各自的边缘重叠宽度；从至少两个裁剪后图像各自的边缘重叠宽度中，确定最小边缘重叠宽度作为目标重叠宽度；以及按照目标重叠宽度对至少两个裁剪后图像进行边缘重叠拼接。

根据本公开的实施例，可以预定边缘重叠宽度相对于裁剪后图像的总宽度的比例，例如，预定比例为base_cnt，则针对裁剪后图像A1和与其相邻的裁剪后图像A2，可以预先按照预定比例计算各自的边缘重叠宽度，选取最小边缘重叠宽度作为目标重叠宽度。例如，裁剪后图像A1的宽度为w1，裁剪后图像A2的宽度为w2，各自的边缘重叠宽度分别为w1/base_cnt和w2/base_cnt，目标重叠宽度w可以为min(w1/base_cnt，w2/base_cnt)。则两个裁剪后图像之间的边缘重叠宽度按照目标重叠宽度进行边缘重叠拼接。以同样的目标重叠宽度的确定方式，对裁剪后图像A3和裁剪后图像A4、裁剪后图像A2和裁剪后图像A3、裁剪后图像A1和裁剪后图像A4等各自之间的目标重叠宽度进行确定。

根据本公开的示例性实施例，base_cnt可以为[5～8]之间的任一整数。根据本公开的实施例，目标重叠宽度设置太大，则影响拼接后图像中的目标对象的特征的提取。目标重叠宽度设置太小，则实现重叠拼接融合的效果较弱。综合考虑，base_cnt可以为[5～8]之间的任一整数，可以满足上述双重效果。

根据本公开的示例性实施例，还可以从待拼接的多个裁剪后图像中确定一个目标重叠宽度，然后将多个裁剪后图像中每相邻两个裁剪后图像之间的边缘重叠宽度均设置为相同的目标重叠宽度。例如，目标重叠宽度可以为min(w1/base_cnt，w2/base_cnt，w3/base_cnt，······wn/base_cnt)。

根据本公开的实施例，采用相同目标重叠宽度，计算方便，处理效率高。

根据本公开的实施例，在执行操作S230，对拼接后图像中的重叠区域进行图像融合处理，得到目标图像之前，还可以计算确定拼接后图像的面积，判断拼接后图像的面积与预定面积的大小，在确定拼接后图像的面积等于预定面积的情况下，意即，拼接后图像满足预定图形，在此情况下，可以直接对拼接后图像中的重叠区域进行图像融合处理，得到目标图像。

根据本公开的其他实施例，也可以将拼接后图像与预定的填充框进行对比，在确定拼接后图像与填充框匹配的情况下，意即，拼接后图像满足预定图形，在此情况下，也可以直接对拼接后图像中的重叠区域进行图像融合处理，得到目标图像。

根据本公开的示例性实施例，在确定拼接后图像的面积小于预定面积的情况下，按照预定填充规则对拼接后图像进行图像重叠填充，直至拼接后图像的面积等于预定面积，得到待融合图像；以及对待融合图像中的重叠区域进行图像融合处理，得到目标图像。

根据本公开的实施例，预定填充规则可以是指设定填充的图像或者像素值的规则。例如，可以是按照拼接后图像的平均像素值进行填充，也可以是利用0-255中的任一像素值来进行填充。只要是能够实现对空白区域进行填充即可。但是并不局限于此。预定填充规则还可以是指设定填充的图像或者像素值的规则以及填充方式的规则。填充方式的规则可以是例如，将大于空白区域的填充图像与拼接后图像进行边缘重叠拼接，即进行图像重叠填充。

根据本公开的实施例，按照预定填充规则对拼接后图像进行图像重叠填充，直至拼接后图像的面积等于预定面积，并对重叠区域进行图像融合处理，得到的目标图像，既满足图像的完整性要求，而且在进行图像重叠填充的过程中，也避免了边缘的域分化的问题，降低了由边缘特征而导致的目标歧义问题。

图6示意性示出了根据本公开另一实施例的待融合图像的示意图。

如图6所示，在得到拼接后图像的情况下，可以通过计算确定拼接后图像的面积。确定填充框610，填充框610可以以基准裁剪后图像620为基准来确定，例如，将基准裁剪后图像620的拼接中心点630作为填充框的中心点，长度设计为基准裁剪后图像620的长度的2倍，宽度设计为基准裁剪后图像620的宽度的2倍。在确定拼接后图像的面积小于填充框610的预定面积的情况下，可以将拼接后图像与填充框610进行比对，确定填充区域640(即空白区域)。按照预定填充规则对拼接后图像进行图像重叠填充，直至拼接后图像的面积等于预定面积，得到待融合图像；以及对待融合图像中的重叠区域进行图像融合处理，得到目标图像。

图7示意性示出了根据本公开实施例的目标检测模型的训练方法的流程图。

如图7所示，该方法包括操作S710。

操作S710，利用训练样本训练目标检测模型，得到训练后的目标检测模型，其中，训练样本包括图像处理方法得到的样本图像。

根据本公开的实施例，目标检测模型的网络架构不做限定，例如，可以是基于多头注意力网络的DETR(DEtection TRansformer)、基于元学习注意力的Faster R-CNN(FasterRegion-Convolutional Neural Network)等。只要是基于深度学习构建的目标检测模型即可。

利用本公开实施例提供的图像处理方法得到的样本图像，目标对象数量多，利用该样本图像来训练目标检测模型，可以提高训练速度和模型精度，提高训练效率。此外，利用本公开实施例提供的图像处理方法得到的样本图像，在提高目标对象的丰富度的基础上，降低了由于拼接而产生的边缘突出的现象，避免了由边缘特征而导致的目标对象在检测过程中产生目标歧义的问题，进而利用本公开实施例提供的样本图像来训练目标检测模型，可以提高目标检测模型的检测精度。

图8示意性示出了根据本公开实施例的目标检测方法的流程图。

如图8所示，该方法包括操作S810。

操作S810，利用目标检测模型处理待检测图像，得到目标检测结果；其中，目标检测模型是目标检测模型的训练方法训练的。

根据本公开的实施例，利用目标检测模型来处理待检测图像，不仅可以检测得到待检测图像中的大尺度的目标对象，而且可以准确检测得到待检测图像中的小尺度的目标对象。可以将该目标检测方法以及该目标检测模型应用于航拍等领域。利用航拍例如无人机拍摄得到的图像作为待检测图像，小尺度的目标对象多，利用本公开实施例提供的目标检测模型来进行目标检测，精度高。

图9示意性示出了根据本公开实施例的图像处理装置的框图。

如图9所示，图像处理装置900可以包括裁剪模块910、拼接模块920、融合模块930。

裁剪模块910，用于对多个待处理图像进行裁剪处理，得到与多个待处理图像一一对应的多个裁剪后图像。

拼接模块920，用于将多个裁剪后图像进行边缘重叠拼接，得到拼接后图像。

融合模块930，用于对拼接后图像中的重叠区域进行图像融合处理，得到目标图像。

根据本公开的实施例，裁剪模块可以包括裁剪单元。

裁剪单元，用于针对多个待处理图像中的每个待处理图像，以矩形作为裁剪图形，按照预定裁剪比例，对待处理图像进行裁剪处理，得到裁剪后图像。

根据本公开的实施例，拼接模块可以包括基准确定单元、第一拼接单元。

基准确定单元，用于从多个裁剪后图像中确定面积最大的裁剪后图像作为基准裁剪后图像。

第一拼接单元，用于以基准裁剪后图像的一个顶点作为拼接中心点，对多个裁剪后图像中的除基准裁剪后图像外的其他裁剪后图像，以拼接中心点为中心进行至少两个边缘的边缘重叠拼接，得到拼接后图像。

根据本公开的实施例，拼接模块还可以包括宽度计算单元、宽度确定单元、第二拼接单元。

宽度计算单元，用于针对多个裁剪后图像中进行边缘重叠拼接的相邻至少两个裁剪后图像，计算至少两个裁剪后图像各自的边缘重叠宽度。

宽度确定单元，用于从至少两个裁剪后图像各自的边缘重叠宽度中，确定最小边缘重叠宽度作为目标重叠宽度。

第二拼接单元，用于按照目标重叠宽度对至少两个裁剪后图像进行边缘重叠拼接。

根据本公开的实施例，图像处理装置，还可以包括预处理模块，在拼接模块之前：

预处理模块，用于对裁剪后图像执行以下至少一项预处理：缩放、翻转、色域变化。

根据本公开的实施例，融合模块可以包括面积确定单元、填充单元、融合单元。

面积确定单元，用于确定拼接后图像的面积。

填充单元，用于在确定拼接后图像的面积小于预定面积的情况下，按照预定填充规则对拼接后图像进行图像重叠填充，直至拼接后图像的面积等于预定面积，得到待融合图像。

融合单元，用于对待融合图像中的重叠区域进行图像融合处理，得到目标图像。

图10示意性示出了根据本公开实施例的目标检测模型的训练装置的框图。

如图10所示，目标检测模型的训练装置1000可以包括训练模块1010。

训练模块1010，用于利用训练样本训练目标检测模型，得到训练后的目标检测模型，其中，训练样本包括利用图像处理方法得到的样本图像。

图11示意性示出了根据本公开实施例的目标检测装置的框图。

如图11所示，目标检测装置1100可以包括检测模块1110。

检测模块1110，用于利用目标检测模型处理待检测图像，得到目标检测结果；其中，目标检测模型是根据目标检测模型的训练方法训练的。

根据本公开的实施例，本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。

根据本公开的实施例，一种电子设备，包括：至少一个处理器；以及与至少一个处理器通信连接的存储器；其中，存储器存储有可被至少一个处理器执行的指令，指令被至少一个处理器执行，以使至少一个处理器能够执行如上所述的方法。

根据本公开的实施例，一种存储有计算机指令的非瞬时计算机可读存储介质，其中，计算机指令用于使计算机执行如上所述的方法。

根据本公开的实施例，一种计算机程序产品，包括计算机程序，计算机程序在被处理器执行时实现如上所述的方法。

图12示出了可以用来实施本公开的实施例的示例电子设备1200的示意性框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本公开的实现。

如图12所示，设备1200包括计算单元1201，其可以根据存储在只读存储器(ROM)1202中的计算机程序或者从存储单元1208加载到随机访问存储器(RAM)1203中的计算机程序，来执行各种适当的动作和处理。在RAM 1203中，还可存储设备1200操作所需的各种程序和数据。计算单元1201、ROM 1202以及RAM 1203通过总线1204彼此相连。输入/输出(I/O)接口1205也连接至总线1204。

设备1200中的多个部件连接至I/O接口1205，包括：输入单元1206，例如键盘、鼠标等；输出单元1207，例如各种类型的显示器、扬声器等；存储单元1208，例如磁盘、光盘等；以及通信单元1209，例如网卡、调制解调器、无线通信收发机等。通信单元1209允许设备1200通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元1201可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元1201的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元1201执行上文所描述的各个方法和处理，例如图像处理方法、目标检测模型的训练方法、或者目标检测方法。例如，在一些实施例中，图像处理方法、目标检测模型的训练方法、或者目标检测方法可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元1208。在一些实施例中，计算机程序的部分或者全部可以经由ROM 1202和/或通信单元1209而被载入和/或安装到设备1200上。当计算机程序加载到RAM 1203并由计算单元1201执行时，可以执行上文描述的图像处理方法、目标检测模型的训练方法、或者目标检测方法的一个或多个步骤。备选地，在其他实施例中，计算单元1201可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行图像处理方法、目标检测模型的训练方法、或者目标检测方法。

本文中以上描述的***和技术的各种实施方式可以在数字电子电路***、集成电路***、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上***的***(SOC)、复杂可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程***上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储***、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储***、该至少一个输入装置、和该至少一个输出装置。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行***、装置或设备使用或与指令执行***、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体***、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互，可以在计算机上实施此处描述的***和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的***和技术实施在包括后台部件的计算***(例如，作为数据服务器)、或者包括中间件部件的计算***(例如，应用服务器)、或者包括前端部件的计算***(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的***和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算***中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将***的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)和互联网。

计算机***可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，也可以是分布式***的服务器，或者是结合了区块链的服务器。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本公开公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本公开保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等，均应包含在本公开保护范围之内。

Claims

1.一种图像处理方法，包括：

对多个待处理图像进行裁剪处理，得到与所述多个待处理图像一一对应的多个裁剪后图像；

将所述多个裁剪后图像进行边缘重叠拼接，得到拼接后图像；以及

对所述拼接后图像中的重叠区域进行图像融合处理，得到目标图像。

2.根据权利要求1所述的方法，其中，所述对多个待处理图像进行裁剪处理，得到与所述多个待处理图像一一对应的多个裁剪后图像包括：

针对所述多个待处理图像中的每个待处理图像，以矩形作为裁剪图形，按照预定裁剪比例，对所述待处理图像进行裁剪处理，得到裁剪后图像。

3.根据权利要求2所述的方法，其中，所述将所述多个裁剪后图像进行边缘重叠拼接，得到拼接后图像包括：

从所述多个裁剪后图像中确定面积最大的裁剪后图像作为基准裁剪后图像；以及

以所述基准裁剪后图像的一个顶点作为拼接中心点，对所述多个裁剪后图像中的除所述基准裁剪后图像外的其他裁剪后图像，以所述拼接中心点为中心进行至少两个边缘的边缘重叠拼接，得到拼接后图像。

4.根据权利要求3所述的方法，其中，所述将所述多个裁剪后图像进行边缘重叠拼接，得到拼接后图像还包括：

针对所述多个裁剪后图像中进行边缘重叠拼接的相邻至少两个裁剪后图像，计算所述至少两个裁剪后图像各自的边缘重叠宽度；

从所述至少两个裁剪后图像各自的边缘重叠宽度中，确定最小边缘重叠宽度作为目标重叠宽度；以及

按照目标重叠宽度对所述至少两个裁剪后图像进行边缘重叠拼接。

5.根据权利要求2所述的方法，还包括，在将所述多个裁剪后图像进行边缘重叠拼接，得到拼接后图像之前：

对所述裁剪后图像执行以下至少一项预处理：

缩放、翻转、色域变化。

6.根据权利要求1所述的方法，其中，所述对所述拼接后图像中的重叠区域进行图像融合处理，得到目标图像包括：

确定所述拼接后图像的面积；

在确定所述拼接后图像的面积小于预定面积的情况下，按照预定填充规则对所述拼接后图像进行图像重叠填充，直至所述拼接后图像的面积等于所述预定面积，得到待融合图像；以及

对所述待融合图像中的重叠区域进行图像融合处理，得到所述目标图像。

7.一种目标检测模型的训练方法，包括：

利用训练样本训练目标检测模型，得到训练后的目标检测模型，

其中，所述训练样本包括利用根据权利要求1至6任一项所述的图像处理方法得到的样本图像。

8.一种目标检测方法，包括：

利用目标检测模型处理待检测图像，得到目标检测结果；

其中，所述目标检测模型是根据权利要求7所述的目标检测模型的训练方法训练的。

9.一种图像处理装置，包括：

裁剪模块，用于对多个待处理图像进行裁剪处理，得到与所述多个待处理图像一一对应的多个裁剪后图像；

拼接模块，用于将所述多个裁剪后图像进行边缘重叠拼接，得到拼接后图像；以及

融合模块，用于对所述拼接后图像中的重叠区域进行图像融合处理，得到目标图像。

10.根据权利要求9所述的装置，其中，所述裁剪模块包括：

裁剪单元，用于针对所述多个待处理图像中的每个待处理图像，以矩形作为裁剪图形，按照预定裁剪比例，对所述待处理图像进行裁剪处理，得到裁剪后图像。

11.根据权利要求10所述的装置，其中，所述拼接模块包括：

基准确定单元，用于从所述多个裁剪后图像中确定面积最大的裁剪后图像作为基准裁剪后图像；以及

第一拼接单元，用于以所述基准裁剪后图像的一个顶点作为拼接中心点，对所述多个裁剪后图像中的除所述基准裁剪后图像外的其他裁剪后图像，以所述拼接中心点为中心进行至少两个边缘的边缘重叠拼接，得到拼接后图像。

12.根据权利要求11所述的装置，其中，所述拼接模块还包括：

宽度计算单元，用于针对所述多个裁剪后图像中进行边缘重叠拼接的相邻至少两个裁剪后图像，计算所述至少两个裁剪后图像各自的边缘重叠宽度；

宽度确定单元，用于从所述至少两个裁剪后图像各自的边缘重叠宽度中，确定最小边缘重叠宽度作为目标重叠宽度；以及

第二拼接单元，用于按照目标重叠宽度对所述至少两个裁剪后图像进行边缘重叠拼接。

13.根据权利要求10所述的装置，还包括，在所述拼接模块之前：

预处理模块，用于对所述裁剪后图像执行以下至少一项预处理：缩放、翻转、色域变化。

14.根据权利要求9所述的装置，其中，所述融合模块包括：

面积确定单元，用于确定所述拼接后图像的面积；

填充单元，用于在确定所述拼接后图像的面积小于预定面积的情况下，按照预定填充规则对所述拼接后图像进行图像重叠填充，直至所述拼接后图像的面积等于所述预定面积，得到待融合图像；以及

融合单元，用于对所述待融合图像中的重叠区域进行图像融合处理，得到所述目标图像。

15.一种目标检测模型的训练装置，包括：

训练模块，用于利用训练样本训练目标检测模型，得到训练后的目标检测模型，

16.一种目标检测装置，包括：

检测模块，用于利用目标检测模型处理待检测图像，得到目标检测结果；

17.一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-6中任一项所述的图像处理方法、权利要求7所述的目标检测模型的训练方法、或者权利要求8所述的目标检测方法。

18.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行根据权利要求1-6中任一项所述的图像处理方法、权利要求7所述的目标检测模型的训练方法、或者权利要求8所述的目标检测方法。

19.一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现根据权利要求1-6中任一项所述的图像处理方法、权利要求7所述的目标检测模型的训练方法、或者权利要求8所述的目标检测方法。