CN111382796A - 图像特征的提取方法、装置、设备及存储介质 - Google Patents

图像特征的提取方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN111382796A
CN111382796A CN202010158252.2A CN202010158252A CN111382796A CN 111382796 A CN111382796 A CN 111382796A CN 202010158252 A CN202010158252 A CN 202010158252A CN 111382796 A CN111382796 A CN 111382796A
Authority
CN
China
Prior art keywords
image
feature extraction
extraction model
original
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010158252.2A
Other languages
English (en)
Inventor
高玮
张超
胡浩
杨超龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Bozhilin Robot Co Ltd
Original Assignee
Guangdong Bozhilin Robot Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Bozhilin Robot Co Ltd filed Critical Guangdong Bozhilin Robot Co Ltd
Priority to CN202010158252.2A priority Critical patent/CN111382796A/zh
Publication of CN111382796A publication Critical patent/CN111382796A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)

Abstract

本发明实施例公开了一种图像特征的提取方法、装置、设备及存储介质。该方法包括:获取待提取图像;将所述待提取图像输入到预先训练完成的目标特征提取模型中,得到输出的目标特征图像;其中,所述目标特征提取模型包括第一特征提取模型和第二特征提取模型,所述第一特征提取模型是基于原始建筑图像和与所述原始建筑图像对应的原始特征图像融合后得到的第一融合图像训练得到的,所述第二特征提取模型是基于所述原始训练图像和所述第一特征提取模型的输出图像融合后得到的第二融合图像训练得到的。本发明实施例通过将图像融合后的图像作为训练图像,对目标特征提取模型进行训练,解决了图像特征提取中人工成本的问题,提高了图像特征提取的精度。

Description

图像特征的提取方法、装置、设备及存储介质
技术领域
本发明实施例涉及图像处理技术领域,尤其涉及一种图像特征的提取方法、装置、设备及存储介质。
背景技术
抠图是图像处理中经常使用的功能,即将图像中的目标图像分离出来成为单独的图像,该图像处理操作对目标图像的定位和识别要求都很高。现阶段,建筑图纸中的图像数据庞大,对人工校验图纸带来很大的负担,且工作效率低下,因此实现图纸自动化校验变得十分重要。
在图纸校验过程中,需要对建筑图纸进行有效信息提取,由于数据过于庞大,人工筛选难以完成,需要借助图像处理批量生成已经去除无用信息的图纸。现有技术的核心思想基本上都是基于人机相结合的方法,这种识别方案在一定程度上能实现智能识别的目的,但存在一定缺陷,如识别精度和识别效率都较低,需要人机重复性操作,人员负担较重。
发明内容
本发明实施例提供了一种图像特征的提取方法、装置、设备及存储介质,以提高图像特征提取的精度和工作效率。
第一方面,本发明实施例提供了一种图像特征的提取方法,该方法包括:
获取待提取图像;
将所述待提取图像输入到预先训练完成的目标特征提取模型中,得到输出的目标特征图像;
其中,所述目标特征提取模型包括第一特征提取模型和第二特征提取模型,所述第一特征提取模型是基于原始建筑图像和与所述原始建筑图像对应的原始特征图像融合后得到的第一融合图像训练得到的,所述第二特征提取模型是基于所述原始训练图像和所述第一特征提取模型的输出图像融合后得到的第二融合图像训练得到的。
第二方面,本发明实施例还提供了一种图像特征的提取装置,该装置包括:
待提取图像获取模块,用于获取待提取图像;
目标特征图像输出模块,用于将所述待提取图像输入到预先训练完成的目标特征提取模型中,得到输出的目标特征图像;
其中,所述目标特征提取模型包括第一特征提取模型和第二特征提取模型,所述第一特征提取模型是基于原始建筑图像和与所述原始建筑图像对应的原始特征图像融合后得到的第一融合图像训练得到的,所述第二特征提取模型是基于所述原始训练图像和所述第一特征提取模型的输出图像融合后得到的第二融合图像训练得到的。
第三方面,本发明实施例还提供了一种设备,该设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现上述所涉及的任一所述的图像特征的提取方法。
第四方面,本发明实施例还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行上述所涉及的任一所述的图像特征的提取方法。
本发明实施例通过将图像融合后的图像作为训练图像,对第一特征提取模型和第二特征提取模型进行训练,解决了图像特征提取中人工成本的问题,提高了图像特征提取的精度和工作效率。
附图说明
图1是本发明实施例一提供的一种图像特征的提取方法的流程图。
图2是本发明实施例一提供的一种原始建筑图像的示意图。
图3是本发明实施例一提供的一种原始特征图像的示意图。
图4是本发明实施例一提供的一种第一特征提取模型的输出图像的示意图。
图5是本发明实施例二提供的一种图像特征的提取方法的流程图。
图6是本发明实施例二提供的一种目标特征提取模型的构建方法的示意图。
图7是本发明实施例三提供的一种图像特征的提取装置的示意图。
图8是本发明实施例四提供的一种设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1是本发明实施例一提供的一种图像特征的提取方法的流程图,本实施例可适用于提取输入图像中的原始特征图像的情况,该方法可以由图像特征的提取装置来执行,该装置可采用软件和/或硬件的方式实现,该装置可以配置于终端设备中。具体包括如下步骤:
S110、获取待提取图像。
其中,待提取图像为待输入到预先训练完成的目标特征提取模型中的图像。示例性的,待提取图像的类型可以是建筑图像。其中,示例性的,获取待提取图像,包括:接收用户输入的待提取图像,和/或,读取设备中已存储的待提取图像。此处对获取待提取图像的方式不作限定。示例性的,待提取图像的文件格式可以是jpg、png或pdf格式,此处对待提取图像的文件格式不作限定。
在一个实施例中,可选的,将待提取图像转换为二值图像,根据转换后的待提取图像,执行后续步骤。其中,二值图像是指图像中像素点的灰度等级只有两种,也就是说,二值图像中的任意像素点的灰度值为0或255。这样设置的好处在于,可以突出待提取图像中的图像特征信息,进而提高目标特征提取模型对待提取图像的特征提取效果。
S120、将待提取图像输入到预先训练完成的目标特征提取模型中,得到输出的目标特征图像。
其中,目标特征提取模型包括第一特征提取模型和第二特征提取模型,第一特征提取模型是基于原始建筑图像和与原始建筑图像对应的原始特征图像融合后得到的第一融合图像训练得到的,第二特征提取模型是基于原始建筑图像和第一特征提取模型的输出图像融合后得到的第二融合图像训练得到的。
其中,原始建筑图像可以是用于表征建筑物的内部布置的技术图像。示例性的,建筑图像可包括建筑物的外部形状、装修设备、结构构造、文字说明和标尺等中的至少一项建筑信息。图2是本发明实施例一提供的一种原始建筑图像的示意图,在图2示出了建筑物的平面布置信息,示例性的,图2示出了建筑物的承重墙、空调位置、门开向和窗户等建筑信息。图2中的横、竖虚线可以用于对建筑物中内部装修的安装位置进行坐标参考说明。需要说明的是,图2示出的原始建筑图像的示意图只是用于对原始建筑图像进行举例解释说明,并不是对原始建筑图像进行限定。本实施例对原始建筑图像中的建筑信息和建筑图示不进行限定。
在一个实施例中,可选的,将原始建筑图像转换为二值图像。这样设置的好处在于,可以突出原始建筑图像中的图像特征信息,进而提高目标特征提取模型的特征提取效果。
其中,与原始建筑图像对应的原始特征图像是在原始建筑图像的基础上对特征对象进行提取得到的原始特征图像。示例性的,原始特征图像的类型也可以为二值图像。在一个实施例中,原始特征图像包括特征对象。在此基础上,原始特征图像还可以包括背景线条等连接线信息。图3是本发明实施例一提供的一种原始特征图像的示意图,如图3所示,原始特征图像包含了原始建筑图像中需要进行特征提取的特征对象,示例性的,图3标注了原始特征图像包含的特征对象,如砖墙体、电梯、消防栓、承重墙、飘窗、卧室平开门、卫生间平开门、窗户、阳台推拉门、空调、爬梯和电、水井门等。在一个实施例中,可选的,采用图像分割方法对原始建筑图像进行分割,得到原始特征图像。示例性的,图像分割方法包括灰度阈值分割方法、基于聚类的分割方法和Mask R-CNN图像实例分割方法中至少一种。在另一个实施例中,可通过人工方式对原始建筑图像进行标注,得到原始特征图像。需要说明的是,图3示出的原始特征图像的示意图只是用于对原始特征图像进行举例解释说明,并不是对原始特征图像进行限定。本实施例对原始特征图像包含的特征对象和特征对象的图示不进行限定。
在一个实施例中,可选的,第一特征提取模型包括编码-解码器网络模型,第二特征提取模型包括全卷积网络模型。在一个实施例中,可选的,基于第一损失函数对编码-解码器网络模型的模型参数进行调整,以得到训练完成的第一特征提取模型;基于第二损失函数对全卷积网络模型的模型参数进行调整,以得到训练完成的第二特征提取模型。
其中,将原始建筑图像和与原始建筑图像对应的原始特征图像进行图像融合后得到的第一融合图像作为第一特征提取模型的输入图像,也就是说,将第一融合图像作为第一特征提取模型的训练图像。这样设置的好处在于,突出原始建筑图像的特征信息以及特征信息在原始建筑图像中的位置信息,从而提高第一特征提取模型对原始建筑图像的特征提取的效率和精度。
在一个实施例中,可选的,将第一融合图像输入到编码-解码器网络模型,编码器网络采用卷积层和池化层向下采样对第一融合图像进行特征提取,得到编码图像;解码器网络采用卷积层和转置卷积向上采样对编码器网络输出的编码图像进行特征重构,得到第一特征提取模型的输出图像。其中,池化层是一种对输入图像进行分区采样得到特征图像的方法,示例性的,池化层可以是最大池化层,最大池化层是将每个区域内的最大值作为池化结果,从而实现对图像的特征提取。在一个实施例中,可选的,解码器网络结构少于编码器网络结构。示例性的,解码器网络结构的节点数量少于编码器网络结构的节点数量,或解码器网络结构的层数少于编码器网络结构的层数。这样设置的好处在于,由于编码器网络的输出图像的图像数据少于第一融合图像的图像数据,因此减少解码器网络结构在保证特征重构质量的同时,可以加快第一特征提取模型的训练过程。
图4是本发明实施例一提供的一种第一特征提取模型的输出图像的示意图。与图2相比,图4所示的第一特征提取模型输出的预测图像去除了图2中的干扰信息得到的第一目标特征图像。其中,示例性的,干扰信息包括但不限于背景线条、文字说明和干扰对象,其中,干扰对象包括非特征对象。第一目标特征图像包含更多的全局信息,包含有效信息元素等。其中,有效信息元素包括特征对象。需要说明的是,图4示出的第一特征提取模型的输出图像的示意图,只是对第一特征提取模型的输出图像进行举例解释说明,并不对第一特征提取模型的输出图像进行限定。其中,示例性的,第一特征提取模型的输出图像的线条清晰度可以与原始建筑图像的线条清晰度相同,也可以与原始建筑图像的线条清晰度不同。第一特征提取模型的输出图像的呈现效果需要根据实际操作过程中的训练结果确定,此处对其不进行限定。
在一个实施例中,可选的,在解码器网络中,采用最近邻插值算法对编码器的输出图像进行特征重构,得到第一特征提取模型的输出图像。在另一个实施例中,可选的,在解码器网络中,采用双线性插值算法或双三次插值算法对编码器的输出图像进行特征重构,得到第一特征提取模型的输出图像。此处对采用的插值算法不作具体的限定。
其中,损失函数可以用于评价特征提取模型输出的预测图像与标准图像之间的差异程度的函数。在一个实施例中,损失函数越小,表示特征提取模型的鲁棒性越好。其中,标准图像是指符合要求的目标特征图像,也就是说,标准图像是去除了所有干扰信息的图像。其中,示例性的,干扰信息包括但不限于文字说明和非特征对象。此处对干扰信息不进行限定,干扰信息可以根据实际操作要求进行具体限定。在一个实施例中,可选的,损失函数包括但不限于平方损失函数、指数损失函数、绝对值损失函数、对数损失函数和组合损失函数。其中,组合损失函数是至少两种损失函数组合构成的损失函数。其中,第一损失函数和第二损失函数可以相同,当然也可以不同,此处对第一损失函数和第二损失函数不作限定。
将原始建筑图像和第一特征提取模型的输出图像进行图像融合后得到的第二融合图像作为第二特征提取模型的输入图像,也就是说,将第二融合图像作为第二特征提取模型的训练图像。第二特征提取模型采用的全卷积网络模型是一种优化器网络模型。这样设置的好处在于,第一特征提取模型的输出图像输入到第二特征提取模型后,第二特征提取模型的输出图像相较于第一特征提取模型的输出图像,细节特征增加明显,突出第一特征提取模型的输出图像中的细节信息,如线条,从而使得第二特征提取模型的输出图像具有更锐利的边缘,提高经过目标特征提取模型的输出图像的精度和质量。
本实施例的技术方案,通过将图像融合后的图像作为训练图像,对第一特征提取模型和第二特征提取模型进行训练,解决了图像特征提取中人工成本的问题,提高了图像特征提取的精度和工作效率。
实施例二
图5是本发明实施例二提供的一种图像特征的提取方法的流程图,本实施例的技术方案是上述实施例的基础上的进一步细化。可选的,所述方法还包括:基于预测损失函数、部分损失函数和损失权重,构建第一损失函数。
本实施例的具体实施步骤包括:
S210、基于预测损失函数、部分损失函数和损失权重,构建第一损失函数。
在一个实施例中,可选的,第一损失函数满足如下公式:
Loverall=w1Lα+(1-w1)Lc
其中,Loverall表示第一损失值,w1表示预测损失函数的权重,Lα表示预测损失值,Lc表示部分损失值。其中,预设损失值和部分损失值分别根据预测损失函数和部分损失函数计算得到。
在一个实施例中,可选的,基于第一特征提取模型的输出图像和标准图像的alpha通道值,构建预测损失函数。在一个实施例中,预测损失函数满足如下公式:
Figure BDA0002404855100000091
其中,
Figure BDA0002404855100000092
表示像素点i处的预测损失值,
Figure BDA0002404855100000093
表示第一特征提取模型的输出图像在像素点i处alpha通道值,
Figure BDA0002404855100000094
表示原始建筑图像在像素点i处alpha通道值,其中,
Figure BDA0002404855100000095
其中,第一损失函数中的预测损失值包括图像中各像素点处的预测损失值进行相加得到的损失值。其中,图像包括R、G、B和A四个通道,其中,R通道表示红色,G通道表示绿色,B通道表示蓝色,A通道表示alpha通道,描述一个颜色空间。
在一个实施例中,可选的,基于第一特征提取模型的输出图像和与原始建筑图像对应的原始背景图像的融合图像的RGB值,以及原始建筑图像的RGB值,构建部分损失函数。在一个实施例中,部分损失函数满足如下公式:
Figure BDA0002404855100000101
其中,
Figure BDA0002404855100000102
表示像素点i处的部分损失值,
Figure BDA0002404855100000103
表示第一初始特征提取模型的输出图像和与原始建筑图像对应的原始背景图像的融合图像在像素点i处RGB值,
Figure BDA0002404855100000104
表示原始建筑图像在像素点i处RGB值,其中,
Figure BDA0002404855100000105
其中,原始背景图像包括在原始建筑图像的基础上,去除了原始建筑图像中特征对象得到的图像。在一个实施例中,将原始背景图像与原始特征图像叠加融合后可得到原始建筑图像。其中,第一损失函数中的部分损失值包括图像中各像素点处的部分损失值进行相加得到的损失值。部分损失函数的好处在于,可以防止神经网络进行复合运算,加速训练过程,使第一特征提取模型输出更精确的预测图像。
S220、基于第一损失函数对编码-解码器网络模型的模型参数进行调整,以得到训练完成的第一特征提取模型。
其中,根据计算得到的预测损失值和部分损失值,分别对编码-解码器网络模型的模型参数进行调整,当根据预测损失值和部分损失值计算得到的第一损失值收敛时,得到训练完成的第一特征提取模型。
S230、基于第二损失函数对全卷积网络模型的模型参数进行调整,以得到训练完成的第二特征提取模型。
在一个实施例中,可选的,基于第二特征提取模型的输出图像和第一特征提取模型的输出图像的融合图像的alpha通道值,以及标准图像的alpha通道值,构建第二损失函数。在一个实施例中,第二损失函数满足如下公式:
Figure BDA0002404855100000106
其中,
Figure BDA0002404855100000107
表示像素点i处的第二损失值,
Figure BDA0002404855100000108
表示第二特征提取模型的输出图像和第一特征提取模型的输出图像的融合图像在像素点i处alpha通道值,
Figure BDA0002404855100000111
表示标准图像在像素点i处alpha通道值,其中,
Figure BDA0002404855100000112
其中,根据计算得到的第二损失值,全卷积网络模型的模型参数进行调整,第二损失值收敛时,得到训练完成的第二特征提取模型。
图6是本发明实施例二提供的一种目标特征提取模型的构建方法的示意图。将原始建筑图像和与原始建筑图像对应的原始特征图像进行融合后输入到编码-解码器网络模型中,其中,编码器网络和解码器网络可通过跳变链接方式进行连接。根据编码-解码器网络模型的输出图像与标准图像计算得到的预测损失值,对编码-解码器网络模型的模型参数进行调整,根据编码-解码器网络模型的输出图像和与原始建筑图像对应的原始背景图像进行融合后得到的图像,以及原始建筑图像计算得到的部分损失值,对编码-解码器网络模型的模型参数进行调整。当编码-解码器网络模型收敛后,得到第一特征提取模型。将第一特征提取模型的输出图像与原始建筑图像进行融合后输入到全卷积网络模型中,并根据全卷积网络模型的输出图像和第一特征提取模型的输出图像的融合图像,以及标准图像计算得到的预测损失值,对全卷积网络模型的模型参数进行调整,当全卷积网络模型收敛后,得到第二特征提取模型。
需要说明的是,图6示出的示意图中包括图2示出的原始建筑图像、图3示出的原始特征图像。有效元素图是指本实施例中记载的原始特征图像,真实的背景图片是指本实施例中记载的原始背景图像,真实图片是指本实施例中记载的原始建筑图像。图6中包含的各图像只是用于对目标特征提取模型的构建过程进行举例解释说明,以便更加直观的对目标特征提取模型的构建过程进行理解,并不对目标特征提取模型的构建过程中使用的图像进行限定。
S240、获取待提取图像。
S250、将待提取图像输入到预先训练完成的目标特征提取模型中,得到输出的目标特征图像,其中,目标特征提取模型包括第一特征提取模型和第二特征提取模型。
本实施例的技术方案,通过采用预测损失函数和部分损失函数对目标特征提取模型进行训练,解决了图像特征提取精度不高的问题,提高了图像特征提取的精度和质量。
实施例三
图7是本发明实施例三提供的一种图像特征的提取装置的示意图。本实施例可适用于提取输入图像中的原始特征图像的情况,该装置可采用软件和/或硬件的方式实现,该装置可以配置于终端设备中。该图像特征的提取装置包括:待提取图像获取模块310和目标特征图像输出模块320。
其中,待提取图像获取模块310,用于获取待提取图像;
目标特征图像输出模块320,用于将待提取图像输入到预先训练完成的目标特征提取模型中,得到输出的目标特征图像;
其中,目标特征提取模型包括第一特征提取模型和第二特征提取模型,第一特征提取模型是基于原始建筑图像和与原始建筑图像对应的原始特征图像融合后得到的第一融合图像训练得到的,第二特征提取模型是基于原始训练图像和第一特征提取模型的输出图像融合后得到的第二融合图像训练得到的。
本实施例的技术方案,通过将图像融合后的图像作为训练图像,对第一特征提取模型和第二特征提取模型进行训练,解决了图像特征提取中人工成本的问题,提高了图像特征提取的精度和工作效率。
在上述技术方案的基础上,可选的,该装置还包括目标特征提取模型构建模块,具体用于:
基于第一损失函数对编码-解码器网络模型的模型参数进行调整,以得到训练完成的第一特征提取模型;
基于第二损失函数对全卷积网络模型的模型参数进行调整,以得到训练完成的第二特征提取模型。
可选的,该装置还包括:
特征重构模块,用于在解码器网络中,采用最近邻插值算法对编码器的输出图像进行特征重构,得到第一特征提取模型的输出图像。
可选的,该装置还包括:
第一损失函数构建模块,用于基于预测损失函数、部分损失函数和损失权重,构建第一损失函数。
可选的,第一损失函数构建模块包括:
预测损失函数构建单元,用于基于第一特征提取模型的输出图像和标准图像的alpha通道值,构建预测损失函数。
可选的,第一损失函数构建模块包括:
部分损失函数构建单元,用于基于第一特征提取模型的输出图像和与原始建筑图像对应的原始背景图像的融合图像的RGB值,以及原始建筑图像的RGB值,构建部分损失函数。
可选的,该装置还包括:
第二损失函数构建模块,用于基于第二特征提取模型的输出图像和第一特征提取模型的输出图像的融合图像的alpha通道值,以及标准图像的alpha通道值,构建第二损失函数。
本发明实施例所提供的图像特征的提取装置可以用于执行本发明实施例所提供的图像特征的提取方法,具备执行方法相应的功能和有益效果。
值得注意的是,上述图像特征的提取装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
实施例四
图8是本发明实施例四提供的一种设备的结构示意图,本发明实施例为本发明上述实施例的图像特征的提取方法的实现提供服务,可配置上述实施例中的图像特征的提取装置。图8示出了适于用来实现本发明实施方式的示例性设备12的框图。图8显示的设备12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图8所示,设备12以通用计算设备的形式表现。设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,***存储器28,连接不同***组件(包括***存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,***总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及***组件互连(PCI)总线。
设备12典型地包括多种计算机***可读介质。这些介质可以是任何能够被设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
***存储器28可以包括易失性存储器形式的计算机***可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机***存储介质。仅作为举例,存储***34可以用于读写不可移动的、非易失性磁介质(图8未显示,通常称为“硬盘驱动器”)。尽管图8中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括但不限于操作***、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该设备12交互的设备通信,和/或与使得该设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图8所示,网络适配器20通过总线18与设备12的其它模块通信。应当明白,尽管图中未示出,可以结合设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID***、磁带驱动器以及数据备份存储***等。
处理单元16通过运行存储在***存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的图像特征的提取方法。
通过上述设备,解决了图像特征提取中人工成本的问题,提高了图像特征提取的精度和工作效率。
实施例五
本发明实施例五还提供了一种包含计算机可执行指令的存储介质,计算机可执行指令在由计算机处理器执行时用于执行一种图像特征的提取方法,该方法包括:
获取待提取图像;
将待提取图像输入到预先训练完成的目标特征提取模型中,得到输出的目标特征图像;
其中,目标特征提取模型包括第一特征提取模型和第二特征提取模型,第一特征提取模型是基于原始建筑图像和与原始建筑图像对应的原始特征图像融合后得到的第一融合图像训练得到的,第二特征提取模型是基于原始训练图像和第一特征提取模型的输出图像融合后得到的第二融合图像训练得到的。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,程序设计语言包括面向对象的程序设计语言,诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络包括局域网(LAN)或广域网(WAN),连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上的方法操作,还可以执行本发明任意实施例所提供的图像特征的提取方法中的相关操作。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (10)

1.一种图像特征的提取方法,其特征在于,包括:
获取待提取图像;
将所述待提取图像输入到预先训练完成的目标特征提取模型中,得到输出的目标特征图像;
其中,所述目标特征提取模型包括第一特征提取模型和第二特征提取模型,所述第一特征提取模型是基于原始建筑图像和与所述原始建筑图像对应的原始特征图像融合后得到的第一融合图像训练得到的,所述第二特征提取模型是基于所述原始建筑图像和所述第一特征提取模型的输出图像融合后得到的第二融合图像训练得到的。
2.根据权利要求1所述的方法,其特征在于,还包括:
基于第一损失函数对编码-解码器网络模型的模型参数进行调整,以得到训练完成的第一特征提取模型;
基于第二损失函数对全卷积网络模型的模型参数进行调整,以得到训练完成的第二特征提取模型。
3.根据权利要求2所述的方法,其特征在于,还包括:
在解码器网络中,采用最近邻插值算法对编码器的输出图像进行特征重构,得到第一特征提取模型的输出图像。
4.根据权利要求2所述的方法,其特征在于,还包括:
基于预测损失函数、部分损失函数和损失权重,构建第一损失函数。
5.根据权利要求4所述的方法,其特征在于,还包括:
基于所述第一特征提取模型的输出图像和标准图像的alpha通道值,构建预测损失函数。
6.根据权利要求4所述的方法,其特征在于,还包括:
基于所述第一特征提取模型的输出图像和与所述原始建筑图像对应的原始背景图像的融合图像的RGB值,以及所述原始建筑图像的RGB值,构建部分损失函数。
7.根据权利要求2所述的方法,其特征在于,还包括:
基于所述第二特征提取模型的输出图像和所述第一特征提取模型的输出图像的融合图像的alpha通道值,以及标准图像的alpha通道值,构建第二损失函数。
8.一种图像特征的提取装置,其特征在于,包括:
待提取图像获取模块,用于获取待提取图像;
目标特征图像输出模块,用于将所述待提取图像输入到预先训练完成的目标特征提取模型中,得到输出的目标特征图像;
其中,所述目标特征提取模型包括第一特征提取模型和第二特征提取模型,所述第一特征提取模型是基于原始建筑图像和与所述原始建筑图像对应的原始特征图像融合后得到的第一融合图像训练得到的,所述第二特征提取模型是基于所述原始训练图像和所述第一特征提取模型的输出图像融合后得到的第二融合图像训练得到的。
9.一种设备,其特征在于,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的图像特征的提取方法。
10.一种包含计算机可执行指令的存储介质,其特征在于,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-7中任一所述的图像特征的提取方法。
CN202010158252.2A 2020-03-09 2020-03-09 图像特征的提取方法、装置、设备及存储介质 Pending CN111382796A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010158252.2A CN111382796A (zh) 2020-03-09 2020-03-09 图像特征的提取方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010158252.2A CN111382796A (zh) 2020-03-09 2020-03-09 图像特征的提取方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN111382796A true CN111382796A (zh) 2020-07-07

Family

ID=71218731

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010158252.2A Pending CN111382796A (zh) 2020-03-09 2020-03-09 图像特征的提取方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN111382796A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113255756A (zh) * 2021-05-20 2021-08-13 联仁健康医疗大数据科技股份有限公司 图像融合方法、装置、电子设备及存储介质
CN114743062A (zh) * 2020-12-24 2022-07-12 广东博智林机器人有限公司 一种建筑特征的识别方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108154196A (zh) * 2018-01-19 2018-06-12 百度在线网络技术(北京)有限公司 用于输出图像的方法和装置
CN108681743A (zh) * 2018-04-16 2018-10-19 腾讯科技(深圳)有限公司 图像对象识别方法和装置、存储介质
WO2019233421A1 (zh) * 2018-06-04 2019-12-12 京东数字科技控股有限公司 图像处理方法及装置、电子设备、存储介质
CN110751286A (zh) * 2018-07-23 2020-02-04 第四范式(北京)技术有限公司 神经网络模型的训练方法和训练***

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108154196A (zh) * 2018-01-19 2018-06-12 百度在线网络技术(北京)有限公司 用于输出图像的方法和装置
CN108681743A (zh) * 2018-04-16 2018-10-19 腾讯科技(深圳)有限公司 图像对象识别方法和装置、存储介质
WO2019233421A1 (zh) * 2018-06-04 2019-12-12 京东数字科技控股有限公司 图像处理方法及装置、电子设备、存储介质
CN110751286A (zh) * 2018-07-23 2020-02-04 第四范式(北京)技术有限公司 神经网络模型的训练方法和训练***

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
卢良锋等: "基于RGB特征与深度特征融合的物体识别算法", 《计算机工程》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114743062A (zh) * 2020-12-24 2022-07-12 广东博智林机器人有限公司 一种建筑特征的识别方法及装置
CN113255756A (zh) * 2021-05-20 2021-08-13 联仁健康医疗大数据科技股份有限公司 图像融合方法、装置、电子设备及存储介质
CN113255756B (zh) * 2021-05-20 2024-05-24 联仁健康医疗大数据科技股份有限公司 图像融合方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN110363252B (zh) 趋向于端到端的场景文字检测与识别方法以及***
EP3786835A1 (en) Traffic image recognition method and apparatus, and computer device and medium
CN110348368B (zh) 一种户型图的人工智能解析方法、计算机可读介质及***
CN112906823B (zh) 目标对象识别模型训练方法、识别方法及识别装置
CN111382796A (zh) 图像特征的提取方法、装置、设备及存储介质
CN111382647B (zh) 一种图片处理方法、装置、设备及存储介质
CN117392615B (zh) 一种基于监控视频的异常识别方法及***
CN112270246B (zh) 视频行为识别方法及装置、存储介质、电子设备
CN116091719B (zh) 一种基于物联网的河道数据管理方法及***
CN110689518A (zh) 宫颈细胞图像筛查方法、装置、计算机设备及存储介质
CN115546485A (zh) 一种分层自注意力场景语义分割模型的构建方法
CN114266860A (zh) 三维人脸模型建立方法、装置、电子设备及存储介质
CN113780326A (zh) 一种图像处理方法、装置、存储介质及电子设备
CN111523169A (zh) 一种装修方案生成方法、装置、电子设备及存储介质
CN111368593B (zh) 一种马赛克处理方法、装置、电子设备及存储介质
CN114170575A (zh) 一种火焰识别方法、装置、电子设备及存储介质
CN114022865A (zh) 基于车道线识别模型的图像处理方法、装置、设备和介质
CN109934185B (zh) 数据处理方法及装置、介质和计算设备
CN111583417A (zh) 一种图像语义和场景几何联合约束的室内vr场景构建的方法、装置、电子设备和介质
CN113762017B (zh) 一种动作识别方法、装置、设备及存储介质
CN114627296B (zh) 图像分割模型的训练方法、装置、电子设备及存储介质
CN115493596A (zh) 一种移动机器人语义地图构建与导航方法
CN115861962A (zh) 点云过滤方法、装置、电子设备、存储介质
CN113762027B (zh) 一种异常行为的识别方法、装置、设备及存储介质
CN113901868A (zh) 一种变电现场安全监控方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
AD01 Patent right deemed abandoned
AD01 Patent right deemed abandoned

Effective date of abandoning: 20231229