CN113642612B - 样本图像生成方法、装置、电子设备及存储介质 - Google Patents

样本图像生成方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN113642612B
CN113642612B CN202110815305.8A CN202110815305A CN113642612B CN 113642612 B CN113642612 B CN 113642612B CN 202110815305 A CN202110815305 A CN 202110815305A CN 113642612 B CN113642612 B CN 113642612B
Authority
CN
China
Prior art keywords
image
images
target
segmentation
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110815305.8A
Other languages
English (en)
Other versions
CN113642612A (zh
Inventor
刘静伟
谷祎
刘旭辉
王晓迪
韩树民
冯原
辛颖
李超
张滨
郑弘晖
龙翔
彭岩
丁二锐
王云浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202110815305.8A priority Critical patent/CN113642612B/zh
Publication of CN113642612A publication Critical patent/CN113642612A/zh
Priority to US17/743,057 priority patent/US20220301131A1/en
Application granted granted Critical
Publication of CN113642612B publication Critical patent/CN113642612B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/60Editing figures and text; Combining figures or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/50Image enhancement or restoration using two or more images, e.g. averaging or subtraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/13Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/772Determining representative reference patterns, e.g. averaging or distorting patterns; Generating dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20112Image segmentation details
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20212Image combination
    • G06T2207/20221Image fusion; Image merging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • G06V10/443Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
    • G06V10/449Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
    • G06V10/451Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
    • G06V10/454Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本公开提供了一种样本图像生成方法、装置、电子设备及存储介质,涉及人工智能技术领域,具体涉及计算机视觉和深度学习技术领域。具体实现方案为:获取初始图像,初始图像对应初始图像尺寸;采用多种参考处理方式分别处理初始图像,以得到对应的多个参考图像;融合多个参考图像,以得到待处理图像;以及根据初始图像尺寸,从待处理图像之中确定出目标样本图像。由此,能够有效地提升样本图像生成效果,使得生成的目标样本图像能够充分地表征出初始图像包含的语义信息,从而使目标样本图像能够有效地满足实际图像处理场景中的个性化处理需求。

Description

样本图像生成方法、装置、电子设备及存储介质
技术领域
本公开涉及人工智能技术领域,尤其涉及计算机视觉和深度学习技术领域,具体涉及一种样本图像生成方法、装置、电子设备及存储介质。
背景技术
人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术;人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术以及机器学习/深度学习、大数据处理技术、知识图谱技术等几大方向。
相关技术中,通常是基于旋转变换方式,或者基于颜色变换方式处理初始图像以生成多样化的样本图像。
发明内容
本公开提供了一种样本图像生成方法、装置、电子设备、存储介质以及计算机程序产品。
根据本公开的第一方面,提供了一种样本图像生成方法,包括:获取初始图像,所述初始图像对应初始图像尺寸;采用多种参考处理方式分别处理所述初始图像,以得到对应的多个参考图像;融合所述多个参考图像,以得到待处理图像;以及根据所述初始图像尺寸,从所述待处理图像之中确定出目标样本图像。
根据本公开的第二方面,提供了一种样本图像生成装置,包括:获取模块,用于获取初始图像,所述初始图像对应初始图像尺寸;处理模块,用于采用多种参考处理方式分别处理所述初始图像,以得到对应的多个参考图像;融合模块,用于融合所述多个参考图像,以得到待处理图像;以及确定模块,用于根据所述初始图像尺寸,从所述待处理图像之中确定出目标样本图像。
根据本公开的第三方面,提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行本公开实施例的样本图像生成方法。
根据本公开的第四方面,提出了一种存储有计算机指令的非瞬时计算机可读存储介质,计算机指令用于使计算机执行本公开实施例公开的样本图像生成方法。
根据本公开的第五方面,提出了一种计算机程序产品,包括计算机程序,当计算机程序由处理器执行时实现本公开实施例公开的样本图像生成方法。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1是根据本公开第一实施例的示意图;
图2a是本实施例中Tida模型和其它自监督模型的结果对比示意图;
图2b是本实施例中基于不同样本图像进行模型预测结果对比示意图;
图3是根据本公开第二实施例的示意图;
图4是根据本公开第三实施例的示意图;
图5是根据本公开实施例中样本图像生成方法的流程示意图;
图6是根据本公开第四实施例的示意图;
图7是根据本公开第五实施例的示意图;
图8示出了可以用来实施本公开的实施例的样本图像生成方法的示例电子设备的示意性框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
图1是根据本公开第一实施例的示意图。
其中,需要说明的是,本实施例的样本图像生成方法的执行主体为样本图像生成装置,该装置可以由软件和/或硬件的方式实现,该装置可以配置在电子设备中,电子设备可以包括但不限于终端、服务器端等。
本公开实施例涉及人工智能技术领域,尤其涉及计算机视觉和深度学习技术领域。
其中,人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用***的一门新的技术科学。
深度学习是学习样本数据的内在规律和表示层次,这些学习过程中获得的信息对诸如文字,图像和声音等数据的解释有很大的帮助。深度学习的最终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。
计算机视觉,指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。
如图1所示,该样本图像生成方法,包括:
S101:获取初始图像,初始图像对应初始图像尺寸。
其中,在执行样本图像生成方法时,在初始阶段获取的图像,可以被称为初始图像,该初始图像的数量可以是一张或者多张,该初始图像可以是通过手机、相机等具有拍摄功能的装置拍摄得到的,或者,该初始图像也可以是从视频中解析得到的,例如,该初始图像,可以是从视频包含的多个视频帧之中提取出的部分视频帧图像,对此不做限制。
其中,用于描述初始图像大小的参数可以被称为初始图像尺寸,而初始图像尺寸可以例如初始图像的宽度和高度,或者也可以是初始图像的半径等,对此不做限制。
其中,需要说明的是,为了实现本实施例中描述的样本图像生成方法,当获取得到的多张初始图像时,不同的初始图像可以对应相同或者不相同的初始图像尺寸。
S102:采用多种参考处理方式分别处理初始图像,以得到对应的多个参考图像。
其中,用于对对初始图像进行处理的方式,可以被称为参考处理方式,而参考处理方式可以例如随机翻转(random clip)、色调调整(color jitter)、随机擦除(randomerasing)、高斯模糊(Gaussian blur)等、对此不做限制。
本公开实施例中,多种参考处理方式可以是上述示例处理方式中至少两种的组合,而组合的方式可以根据实际图像处理场景的需求自适应配置,对此不做限制。
上述在获取初始图像后,可以采用多种参考处理方式分别处理初始图像,以得到多个处理后的图像,该处理后的图像可以被称为参考图像。
也即是说,上述在获取初始图像后,可以采用多种参考处理方式,分别对一张初始图像进行处理,以得到与多种参考处理方式分别对应的多个参考图像,或者也可以采用某一种或者几种参考处理方式,对多张初始图像进行处理,以得到多个参考图像,对此不做限制。
举例而言,如果获取的初始图像为初始图像a,则可以采用随机翻转、色调调整、随机擦除、高斯模糊等参考处理方式分别对初始图像进行处理,以得到色调调整处理方式对应的图像a1、随机翻转处理方式对应的图像a2、随机擦除处理方式对应的图像a3、高斯模糊处理方式对应的图像a4等,可以把处理得到的图像a1、图像a2、图像a3、图像a4作为参考图像。
举例而言,如果获取的初始图像为初始图像a、初始图像b、初始图像c、初始图像d,则可以采用随机翻转的参考处理方式依次对初始图像a、初始图像b、初始图像c、初始图像d进行处理,以得到随机翻转处理方式对应的图像a1、随机翻转处理方式对应的图像b1、随机翻转处理方式对应的图像c1、随机翻转处理方式对应的图像d1,可以把图像a1、图像b1、图像c1、图像d1作为参考图像。
S103:融合多个参考图像,以得到待处理图像。
上述在采用多种参考处理方式分别处理初始图像,以得到对应的多个参考图像后,可以融合多个参考图像,以得到融合后的图像,该融合后的图像可以被称为待处理图像。
可选地,一些实施例中,融合多个参考图像,以得到待处理图像,可以是对多个参考图像进行边拼接处理,并将拼接处理得到的图像作为待处理图像,由此,可以有效的减少图像融合过程中出现的拼缝和模糊问题,以实现图像的无缝拼接,并且,能够有效地保障针对初始图像的语义信息表达的完整性,有效地避免损失初始图像边缘的语义信息,保障整体的语义信息的表达效果。
其中,边拼接处理,是指采用边对齐的方式将多个参考图像无缝地拼接称为一张完整图像的图像处理方式,对此不做限制。
举例而言,如果参考图像包括:参考图像a,参考图像b、参考图像c、参考图像d,4个参考图像对应的图像尺寸均为224*224,则可以将参考图像a,参考图像b、参考图像c、参考图像d的边缘依次对齐,即将多个参考图像基于长边和宽边进行无缝拼接,以形成完整的图像e,图像e即可以被称为待处理图像,图像e对应的图像尺寸可以是448*448。
S104:根据初始图像尺寸,从待处理图像之中确定出目标样本图像。
上述在融合多个参考图像,以得到待处理图像后,可以根据初始图像尺寸,从待处理图像之中确定出尺寸与初始图像尺寸相同或者不相同的图像,该图像可以被称为目标样本图像。
一些实施例中,可以将初始图像对应的初始图像尺寸和与待处理图像对应的待处理图像尺寸相比对,如果待处理图像尺寸和初始图像尺寸相一致,则可以确定该待处理图像为目标样本图像,或者,也可以采用其它任意可能的方式从待处理图像之中确定出目标样本图像,比如随机采样的方式、局部抽取的方式、模型识别的方式等等,对此不做限制。
本实施例中,通过获取初始图像,初始图像对应初始图像尺寸,采用多种参考处理方式分别处理初始图像,以得到对应的多个参考图像,融合多个参考图像,以得到待处理图像,以及根据初始图像尺寸,从待处理图像之中确定出目标样本图像,由此,能够有效地提升样本图像生成效果,使得生成的目标样本图像能够充分地表征出初始图像包含的语义信息,从而使目标样本图像能够有效地满足实际图像处理场景中的个性化处理需求。
下面将以三元实例判别结构(Triplet Instance DiscriminationArchitecture,Tida)模型为例,描述本实施例描述的样本图像生成方法,在模型预测方面的效果。如图2a、图2b所示,图2a是本实施例中Tida模型和其它自监督模型的结果对比示意图,模型预测的骨架结构可以以卷积神经网络(Residual Network-50,ResNet-50)结构进行示例说明,其中,准确率1是指当模型预测某一图像的类别时,模型输出的唯一预测类别结果的准确率,准确率5是指当模型预测某一图像的类别时,模型输出的5个预测类别结果的准确率。
在上述图2a中,模型1-模型14可以是相关技术中的自回归模型、自编码模型、流模型、混合生成模型等等,对此不做限制。
图2b是本实施例中基于不同样本图像进行模型预测结果对比示意图,图2b对比展示了本实施例描述的样本图像生成方法(方法1),负样本采样机制(方法2)及三元判别损失(方法3)在同样条件下的模型预测结果对比情况,为了更为客观的对模型预测效果进行展示说明,本实施例将分别展示Tida模型,在以大数据集(ImageNet 1k,IN-1K)和小数据集(Small imagenet1k,SIN-1K)为基础时的模型预测结果,其中小数据集的数据量是大数据集的1/10。
由上述图2a和图2b可知,本公开实施例的样本图像生成方法,在以大数据集和小数据为基础的模型预测方面,均具有较好的模型预测效果。
图3是根据本公开第二实施例的示意图。
如图3所示,该样本图像生成方法包括:
S301:获取初始图像,初始图像对应初始图像尺寸。
S302:采用多种参考处理方式分别处理初始图像,以得到对应的多个参考图像。
S303:融合多个参考图像,以得到待处理图像。
S301-S303的举例说明可以具体参见上述实施例,在此不再赘述。
S304:根据初始图像尺寸确定目标分割点。
其中,用于对初始图像进行分割处理的分割点,可以被称为目标分割点。
可选地,一些实施例中,根据初始图像尺寸确定目标分割点,可以是根据初始图像尺寸确定目标图像区域,在目标图像区域之中随机选取目标像素点,并将目标像素点作为目标分割点,由于是根据初始图像尺寸确定目标图像区域,并在目标图像区域中随机选定目标像素点作为目标分割点,能够灵活地、便捷地确定出目标分割点,并且有效地避免引入主观选取的干扰因素,保障目标分割点的随机性,使得后续基于目标分割点所确定出的目标样本图像具有更客观的语义信息分布,保障整体的样本图像的生成效果。
其中,用于确定目标分割点的图像区域,可以被称作目标图像区域。
一些实施例中,根据初始图像尺寸确定目标图像区域,可以是在待处理图像中,随机选择与初始图像尺寸相同的局部图像区域,并作为目标图像区域。
举例而言,如果初始图像尺寸为224*224,融合得到的待处理图像对应的图像尺寸为448*448,则可以根据初始图像尺寸,在待处理图像中随机选择尺寸为224*224的区域,并作为目标图像区域。
其中,像素点是构成图像的基本单元,即可以把一个图像看成是由数个像素点组成的像素点集合,相应地,像素点集合中用于对目标图像进行分割的像素点,可以被称为目标像素点。
上述在从待处理图像中确定目标图像区域后,可以在目标图像区域之中随机选取目标像素点,并将目标像素点作为目标分割点。
也即是说,在从待处理图像中确定目标图像区域后,可以从目标图像区域(构成目标图像区域的像素点集合)中,随机选择一个像素点,并将其作为目标像素点,从而可以基于目标像素点,执行后续对待处理图像进行分割处理的步骤。
S305:根据目标分割点对待处理图像进行分割处理,以得到多个分割图像并作为多个目标样本图像。
上述在根据初始图像尺寸确定目标分割点后,可以根据目标分割点对待处理图像进行分割处理,以得到多个分割图像并作为多个目标样本图像。
一些实施例中,根据目标分割点对待处理图像进行分割处理,可以是以目标分割点为中心,在水平方向和垂直方向上对待处理图像进行分割,以得到4个分割图像并将其作为目标样本图像,或者也可以采用其它任意可能的方式来实现根据目标分割点对待处理图像进行分割处理的步骤,对此不做限制。
本实施例中,通过获取初始图像,初始图像对应初始图像尺寸,采用多种参考处理方式分别处理初始图像,以得到对应的多个参考图像,融合多个参考图像,以得到待处理图像,以及根据初始图像尺寸,从待处理图像之中确定出目标样本图像,由此,能够有效地提升样本图像生成效果,使得生成的目标样本图像能够充分地表征出初始图像包含的语义信息,从而使目标样本图像能够有效地满足实际图像处理场景中的个性化处理需求。根据初始图像尺寸确定目标分割点,可以是根据初始图像尺寸确定目标图像区域,在目标图像区域之中随机选取目标像素点,并将目标像素点作为目标分割点,由于是根据初始图像尺寸确定目标图像区域,并在目标图像区域中随机选定目标像素点作为目标分割点,能够灵活地、便捷地确定出目标分割点,并且有效地避免引入主观选取的干扰因素,保障目标分割点的随机性,使得后续基于目标分割点所确定出的目标样本图像具有更客观的语义信息分布,保障整体的样本图像的生成效果。通过根据所述初始图像尺寸确定目标分割点,再根据所述目标分割点对所述待处理图像进行分割处理,以得到多个分割图像并作为多个所述目标样本图像,由此,能够基于目标分割点对待处理图像进行更为准确的分割处理,从而可以有效地提升图像分割的效果,提升图像分割的效率。
图4是根据本公开第三实施例的示意图。
如图4所示,该样本图像生成方法包括:
S401:获取初始图像,初始图像对应初始图像尺寸。
S402:采用多种参考处理方式分别处理初始图像,以得到对应的多个参考图像。
S403:融合多个参考图像,以得到待处理图像。
S404:根据初始图像尺寸确定目标分割点。
S401-S404的举例说明可以具体参见上述实施例,在此不再赘述。
S405:根据目标分割点生成至少一条分割线。
上述在根据初始图像尺寸确定目标分割点后,可以根据目标分割点生成至少一条分割线,其中,分割线可以用于对待处理图像进行分割处理。
一些实施例中,根据目标分割点生成分割线,可以是以目标分割点为原点,在水平方向和垂直方向上建立直角坐标系,后可以把直角坐标系的x轴和y轴作为分割线,从而可以基于该分割线,对待处理图像进行分割处理。
或者,也可以采用其它任意可能的方式,执行根据目标分割点生成至少一条分割线的步骤,例如,该分割线还可以是弧形或者其它任意可能的形状,对此不做限制。
S406:以至少一条分割线为基准,对待处理图像进行分割处理,以得到多个分割图像,多个分割图像分别对应的多个分割图像尺寸相同或者不相同。
上述在根据目标分割点生成至少一条分割线后,可以至少一条分割线为基准,对待处理图像进行分割处理,由此能够有效地避免图像分割处理逻辑损坏初始图像的语义信息,保障语义信息的完整性,还能够有效地简化图像分割处理逻辑,有效地提升图像分割处理的效率及分割处理效果。
也即是说,在根据目标分割点生成至少一条分割线后,可以沿分割线对待处理图像进行分割处理。
举例而言,上述以目标分割点为原点,在水平方向和垂直方向上建立直角坐标系,并将x坐标轴和y坐标轴确定为分割线后,可以沿x坐标轴和y坐标轴,依次对待处理图像进行分割处理,以得到由x坐标轴和y坐标分割得到的多个分割图像。
其中,用于描述分割图像大小的参数可以被称为分割图像尺寸,多个分割图像分别对应的多个分割图像尺寸可以相同或者不相同。
S407:将多个分割图像分别调整为目标图像尺寸的多个图像,并将多个图像作为多个目标样本图像,目标图像尺寸和初始图像尺寸相同。
其中,用于描述目标样本图像大小的参数可以被称为目标图像尺寸,目标图像尺寸和初始图像尺寸可以配置为相同。
上述在对待处理图像进行分割处理,以得到多个分割图像后,可以对多个分割图像的尺寸进行调整,以使得调整得到的多个图像尺寸和初始图像尺寸可以配置为相同,上述调整得到的多个图像即为目标样本图像。
一些实施例中,可以初始图像尺寸为基准,使用具有图片编辑功能的软件,对分割图像的图像尺寸进行调整,即将分割图像的尺寸调整为初始图像的尺寸,或者,也可以采用其它任意可能的方法对分割图像的尺寸进行调整,对此不做限制。
本实施例中,通过获取初始图像,初始图像对应初始图像尺寸,采用多种参考处理方式分别处理初始图像,以得到对应的多个参考图像,融合多个参考图像,以得到待处理图像,以及根据初始图像尺寸,从待处理图像之中确定出目标样本图像,由此,能够有效地提升样本图像生成效果,使得生成的目标样本图像能够充分地表征出初始图像包含的语义信息,从而使目标样本图像能够有效地满足实际图像处理场景中的个性化处理需求。通过根据所述目标分割点对所述待处理图像进行分割处理,以得到多个分割图像,所述多个分割图像分别对应的多个分割图像尺寸相同或者不相同,并将所述多个分割图像分别调整为目标图像尺寸的多个图像,并将所述多个图像作为多个所述目标样本图像,所述目标图像尺寸和所述初始图像尺寸相同,由于是将多个分割图像对应的图像尺寸调整为初始图像尺寸,从而能够使得生成的多个目标样本图像,能够有效地适配于模型训练针对图像尺度的个性化需求,并且,还可以支持基于调整得到的多个分割图像,再次执行本实施例中描述的样本图像生成方法,能够有效地辅助对样本图像进行扩充,从而可以解决图像语义信息利用不充分的技术问题。
如图5所示,图5是根据本公开实施例中样本图像生成方法的流程示意图,首先可以采用多种参考处理方式对初始图像进行处理,以得到4个参考图像(可以取其它数字),可以对多个4个参考图像进行融合处理,以得到待处理图像,再根据初始图像尺寸从待处理图像中确定目标图像区域(如图虚线框所示),并在目标图像区域中选取目标分割点,根据目标分割点生成两条分割线,再以两条分割线为基准,将待处理图像分割为4个分割图像,后以初始图像尺寸为基准,将4个分割图像的尺寸调整为初始图像尺寸,以得到目标样本图像。
图6是根据本公开第四实施例的示意图。
如图6所示,该样本图像生成装置60,包括:
获取模块601,用于获取初始图像,所述初始图像对应初始图像尺寸;
处理模块602,用于采用多种参考处理方式分别处理所述初始图像,以得到对应的多个参考图像;
融合模块603,用于融合所述多个参考图像,以得到待处理图像;以及
确定模块604,用于根据所述初始图像尺寸,从所述待处理图像之中确定出目标样本图像。
在本公开的一些实施例中,如图7所示,图7是根据本公开第五实施例的示意图,该样本图像生成装置70,包括:获取模块701、处理模块702、融合模块703、确定模块704,其中,融合模块703,具体用于:
对所述多个参考图像进行边拼接处理,并将拼接处理得到的图像作为所述待处理图像。
在本公开的一些实施例中,其中,确定模块704,包括:
确定子模块7041,用于根据所述初始图像尺寸确定目标分割点;
处理子模块7042,用于根据所述目标分割点对所述待处理图像进行分割处理,以得到多个分割图像并作为多个所述目标样本图像。
在本公开的一些实施例中,其中,处理子模块7042,具体用于:
根据所述目标分割点对所述待处理图像进行分割处理,以得到多个分割图像,所述多个分割图像分别对应的多个分割图像尺寸相同或者不相同;
将所述多个分割图像分别调整为目标图像尺寸的多个图像,并将所述多个图像作为多个所述目标样本图像,所述目标图像尺寸和所述初始图像尺寸相同。
在本公开的一些实施例中,其中,确定模块704,还包括:
生成子模块7043,用于在所述根据所述初始图像尺寸确定目标分割点之后,根据所述目标分割点生成至少一条分割线;
其中,处理子模块7042,具体用于:
以所述至少一条分割线为基准,对所述待处理图像进行分割处理。
在本公开的一些实施例中,其中,确定子模块7041,具体用于:
根据所述初始图像尺寸确定目标图像区域;
在所述目标图像区域之中随机选取目标像素点,并将所述目标像素点作为所述目标分割点。
可以理解的是,本实施例附图7中的样本图像生成装置70与上述实施例中的样本图像生成装置60,获取模块701与上述实施例中的获取模块601,处理模块702与上述实施例中的处理模块602,融合模块703与上述实施例中的融合模块603,确定模块704与上述实施例中的确定模块604,可以具有相同的功能和结构。
需要说明的是,前述对样本图像生成方法的解释说明也适用于本实施例的样本图像生成装置,此处不再赘述。
本实施例中,通过获取初始图像,初始图像对应初始图像尺寸,采用多种参考处理方式分别处理初始图像,以得到对应的多个参考图像,融合多个参考图像,以得到待处理图像,以及根据初始图像尺寸,从待处理图像之中确定出目标样本图像,由此,能够有效地提升样本图像生成效果,使得生成的目标样本图像能够充分地表征出初始图像包含的语义信息,从而使目标样本图像能够有效地满足实际图像处理场景中的个性化处理需求。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
图8示出了可以用来实施本公开的实施例的样本图像生成方法的示例电子设备的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图8所示,设备800包括计算单元801,其可以根据存储在只读存储器(ROM)802中的计算机程序或者从存储单元808加载到随机访问存储器(RAM)803中的计算机程序,来执行各种适当的动作和处理。在RAM 803中,还可存储设备800操作所需的各种程序和数据。计算单元801、ROM 802以及RAM 803通过总线804彼此相连。输入/输出(I/O)接口805也连接至总线804。
设备800中的多个部件连接至I/O接口805,包括:输入单元806,例如键盘、鼠标等;输出单元807,例如各种类型的显示器、扬声器等;存储单元808,例如磁盘、光盘等;以及通信单元809,例如网卡、调制解调器、无线通信收发机等。通信单元809允许设备800通过诸如因特网的计算机网络和/或各种电信网络与其它设备交换信息/数据。
计算单元801可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元801的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元801执行上文所描述的各个方法和处理,例如样本图像生成方法。
例如,在一些实施例中,样本图像生成方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元808。在一些实施例中,计算机程序的部分或者全部可以经由ROM 802和/或通信单元809而被载入和/或安装到设备800上。当计算机程序加载到RAM 803并由计算单元801执行时,可以执行上文描述的样本图像生成方法的一个或多个步骤。备选地,在其它实施例中,计算单元801可以通过其它任何适当的方式(例如,借助于固件)而被配置为执行样本图像生成方法。
本文中以上描述的***和技术的各种实施方式可以在数字电子电路***、集成电路***、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上***的***(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程***上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储***、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储***、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其它可编程样本图像生成装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行***、装置或设备使用或与指令执行***、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体***、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的***和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的***和技术实施在包括后台部件的计算***(例如,作为数据服务器)、或者包括中间件部件的计算***(例如,应用服务器)、或者包括前端部件的计算***(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的***和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算***中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将***的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、互联网及区块链网络。
计算机***可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务("Virtual Private Server",或简称"VPS")中,存在的管理难度大,业务扩展性弱的缺陷。服务器也可以为分布式***的服务器,或者是结合了区块链的服务器。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其它因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

Claims (10)

1.一种样本图像生成方法,包括:
获取初始图像,所述初始图像对应初始图像尺寸;
采用多种参考处理方式分别处理一张所述初始图像,以得到对应的多个参考图像;
融合所述多个参考图像,以得到待处理图像;以及
根据所述初始图像尺寸,从所述待处理图像之中确定出目标样本图像;述据所述初始图像尺寸,从所述待处理图像之中确定出目标样本图像,包括:
根据所述初始图像尺寸随机选择与初始图像尺寸相同的局部图像区域作为目标图像区域;
在所述目标图像区域之中随机选取目标像素点,并将所述目标像素点作为目标分割点;
根据所述目标分割点对所述待处理图像进行分割处理,以得到多个分割图像并作为多个所述目标样本图像;
将所述多个分割图像分别调整为目标图像尺寸的多个图像,并将所述多个图像作为多个所述目标样本图像,所述目标图像尺寸和所述初始图像尺寸相同。
2.根据权利要求1所述的方法,其中,所述融合所述多个参考图像,以得到待处理图像,包括:
对所述多个参考图像进行边拼接处理,并将拼接处理得到的图像作为所述待处理图像。
3.根据权利要求1所述的方法,其中,所述根据所述目标分割点对所述待处理图像进行分割处理,以得到多个分割图像并作为多个所述目标样本图像,包括:
根据所述目标分割点对所述待处理图像进行分割处理,以得到多个分割图像,所述多个分割图像分别对应的多个分割图像尺寸相同或者不相同。
4.根据权利要求1所述的方法,在所述根据所述初始图像尺寸确定目标分割点之后,还包括:
根据所述目标分割点生成至少一条分割线;
其中,所述根据所述目标分割点对所述待处理图像进行分割处理,包括:
以所述至少一条分割线为基准,对所述待处理图像进行分割处理。
5.一种样本图像生成装置,包括:
获取模块,用于获取初始图像,所述初始图像对应初始图像尺寸;
处理模块,用于采用多种参考处理方式分别处理一张所述初始图像,以得到对应的多个参考图像;
融合模块,用于融合所述多个参考图像,以得到待处理图像;以及
确定模块,用于根据所述初始图像尺寸,从所述待处理图像之中确定出目标样本图像;
所述确定模块,包括:
确定子模块,具体用于:
根据所述初始图像尺寸随机选择与初始图像尺寸相同的局部图像区域作为目标图像区域;
在所述目标图像区域之中随机选取目标像素点,并将所述目标像素点作为目标分割点;
处理子模块,用于根据所述目标分割点对所述待处理图像进行分割处理,以得到多个分割图像并作为多个所述目标样本图像;将所述多个分割图像分别调整为目标图像尺寸的多个图像,并将所述多个图像作为多个所述目标样本图像,所述目标图像尺寸和所述初始图像尺寸相同。
6.根据权利要求5所述的装置,其中,所述融合模块,具体用于:
对所述多个参考图像进行边拼接处理,并将拼接处理得到的图像作为所述待处理图像。
7.根据权利要求5所述的装置,其中,所述处理子模块,具体用于:
根据所述目标分割点对所述待处理图像进行分割处理,以得到多个分割图像,所述多个分割图像分别对应的多个分割图像尺寸相同或者不相同。
8.根据权利要求5所述的装置,其中,所述确定模块,还包括:
生成子模块,用于在所述根据所述初始图像尺寸确定目标分割点之后,根据所述目标分割点生成至少一条分割线;
其中,所述处理子模块,具体用于:
以所述至少一条分割线为基准,对所述待处理图像进行分割处理。
9.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-4中任一项所述的方法。
10.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-4中任一项所述的方法。
CN202110815305.8A 2021-07-19 2021-07-19 样本图像生成方法、装置、电子设备及存储介质 Active CN113642612B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202110815305.8A CN113642612B (zh) 2021-07-19 2021-07-19 样本图像生成方法、装置、电子设备及存储介质
US17/743,057 US20220301131A1 (en) 2021-07-19 2022-05-12 Method and apparatus for generating sample image

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110815305.8A CN113642612B (zh) 2021-07-19 2021-07-19 样本图像生成方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN113642612A CN113642612A (zh) 2021-11-12
CN113642612B true CN113642612B (zh) 2022-11-18

Family

ID=78417711

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110815305.8A Active CN113642612B (zh) 2021-07-19 2021-07-19 样本图像生成方法、装置、电子设备及存储介质

Country Status (2)

Country Link
US (1) US20220301131A1 (zh)
CN (1) CN113642612B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112580558A (zh) * 2020-12-25 2021-03-30 烟台艾睿光电科技有限公司 红外图像目标检测模型构建方法、检测方法、装置及***
CN113012176A (zh) * 2021-03-17 2021-06-22 北京百度网讯科技有限公司 样本图像的处理方法、装置、电子设备及存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109255814A (zh) * 2018-09-20 2019-01-22 北京字节跳动网络技术有限公司 用于处理图像的方法和装置
US10915992B1 (en) * 2019-08-07 2021-02-09 Nanotronics Imaging, Inc. System, method and apparatus for macroscopic inspection of reflective specimens
CN112419328B (zh) * 2019-08-22 2023-08-04 北京市商汤科技开发有限公司 图像处理方法及装置、电子设备和存储介质
CN112085056B (zh) * 2020-08-05 2023-12-29 深圳市优必选科技股份有限公司 目标检测模型生成方法、装置、设备及存储介质
CN112270653A (zh) * 2020-10-27 2021-01-26 中国计量大学 一种针对图像样本不平衡的数据增强方法
CN112330685B (zh) * 2020-12-28 2021-04-06 北京达佳互联信息技术有限公司 图像分割模型训练、图像分割方法、装置及电子设备

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112580558A (zh) * 2020-12-25 2021-03-30 烟台艾睿光电科技有限公司 红外图像目标检测模型构建方法、检测方法、装置及***
CN113012176A (zh) * 2021-03-17 2021-06-22 北京百度网讯科技有限公司 样本图像的处理方法、装置、电子设备及存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Improved U-net fundus image segmentation method;WANG Yijie et al;《2019 International Conference on Intelligent Informatics and Biomedical Sciences (ICIIBMS)》;20200213;110-113页 *
基于低空无人机影像和YOLOv3实现棉田杂草检测;薛金利等;《石河子大学学报》;20190228;第37卷(第1期);21-27页 *
基于序列图像的全景图像拼接;胡社教等;《合肥工业大学学报(自然科学版)》;20030831(第04期);525-528页 *

Also Published As

Publication number Publication date
US20220301131A1 (en) 2022-09-22
CN113642612A (zh) 2021-11-12

Similar Documents

Publication Publication Date Title
CN114550177B (zh) 图像处理的方法、文本识别方法及装置
CN113033537A (zh) 用于训练模型的方法、装置、设备、介质和程序产品
CN113177472B (zh) 动态手势识别方法、装置、设备以及存储介质
CN113361572B (zh) 图像处理模型的训练方法、装置、电子设备以及存储介质
CN113538235B (zh) 图像处理模型的训练方法、装置、电子设备及存储介质
CN114092759A (zh) 图像识别模型的训练方法、装置、电子设备及存储介质
CN114120253A (zh) 图像处理方法、装置、电子设备和存储介质
CN113379877B (zh) 人脸视频生成方法、装置、电子设备及存储介质
CN113177451A (zh) 图像处理模型的训练方法、装置、电子设备及存储介质
CN113378855A (zh) 用于处理多任务的方法、相关装置及计算机程序产品
US20220319141A1 (en) Method for processing image, device and storage medium
CN113033346A (zh) 文本检测方法、装置和电子设备
CN113344214B (zh) 数据处理模型的训练方法、装置、电子设备及存储介质
CN113657466A (zh) 预训练模型的生成方法、装置、电子设备和存储介质
CN113657396A (zh) 训练方法、译文展示方法、装置、电子设备以及存储介质
CN112580666A (zh) 图像特征的提取方法、训练方法、装置、电子设备及介质
CN113642612B (zh) 样本图像生成方法、装置、电子设备及存储介质
CN114882313B (zh) 生成图像标注信息的方法、装置、电子设备及存储介质
EP4156124A1 (en) Dynamic gesture recognition method and apparatus, and device and storage medium
CN113781653B (zh) 对象模型生成方法、装置、电子设备及存储介质
CN114445682A (zh) 训练模型的方法、装置、电子设备、存储介质及产品
CN112632309B (zh) 图像展示方法、装置、电子设备和存储介质
CN114445668A (zh) 图像识别方法、装置、电子设备及存储介质
CN114972910A (zh) 图文识别模型的训练方法、装置、电子设备及存储介质
CN113361575A (zh) 模型训练方法、装置和电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant