CN103839063A - 一种基于加权金字塔结构的图像特征提取方法 - Google Patents

一种基于加权金字塔结构的图像特征提取方法 Download PDF

Info

Publication number
CN103839063A
CN103839063A CN201210475799.0A CN201210475799A CN103839063A CN 103839063 A CN103839063 A CN 103839063A CN 201210475799 A CN201210475799 A CN 201210475799A CN 103839063 A CN103839063 A CN 103839063A
Authority
CN
China
Prior art keywords
image
layer
pyramid structure
feature extraction
level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201210475799.0A
Other languages
English (en)
Inventor
李圣
�田宏
黄曙光
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
DALIAN LINGDONG TECHNOLOGY DEVELOPMENT Co Ltd
Original Assignee
DALIAN LINGDONG TECHNOLOGY DEVELOPMENT Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by DALIAN LINGDONG TECHNOLOGY DEVELOPMENT Co Ltd filed Critical DALIAN LINGDONG TECHNOLOGY DEVELOPMENT Co Ltd
Priority to CN201210475799.0A priority Critical patent/CN103839063A/zh
Publication of CN103839063A publication Critical patent/CN103839063A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)
  • Processing Or Creating Images (AREA)

Abstract

一种基于加权金字塔结构的图像特征提取方法,图像内容一般是由颜色、纹理、形状、空间布局等特征表示的,图像可视内容的提取和表示是基于内容图像检索的基础。然而,现有的图像内容描述子还不能完美地表达图像内容。本发明提出一种基于加权金字塔结构的图像特征提取方法。基于加权金字塔结构的图像特征提取方法是借鉴人类基于图元的图像内容理解思想、从人类对图像整体和局部的认知顺序和认知程度出发的一种简化的多层次图像特征提取手段。本发明改善了图像的特征提取方法,参照人类理解图像的过程,将图像按图元进行分割,同时考虑到整体与局部对图像内容理解的不同贡献,采用相应的加权策略,有效地改善了图像描述的性能。

Description

一种基于加权金字塔结构的图像特征提取方法
技术领域
本发明涉及图像特征方法,特别是一种基于加权金字塔结构的方法。
背景技术
无论是孩童学看画,还是成人对图像的理解首先是对图像中感兴趣的、典型的、有意义图像块的认识,然后再通过对整幅图像中这些图像块之间的空间结构关系、布局以及更高层的语义理解,最后综合成对整幅图像的理解。把那些具有典型意义的图像块称为图元,具有典型意义图元的提取和语义分析是整幅图像语义分析的基础。图像典型意义图元提取的问题本质上是图像分割问题。图像分割是图像分析和理解中的一项基本内容,成为图像内容检索***中一个基础而又非常关键的部分。现有的很多***仅仅根据整幅图像的低层特征进行检索,图像中可能包含了大量不相关的信息。这些不相关的信息在提取出的特征中占了很大的比例的话,提出的特征就不能够准确地反映检索的要求,检索的结果中就可能出现大量不相关的结果,即使采用相关反馈等技术手段也难以取得比较令人满意的检索结果。事实上,人们判断图像的相似性并非仅仅建立在整幅图像底层特征的相似性上,基于内容检索的初衷是想根据人对图像的理解和认识来衡量图像间的相似性进行检索的,这种人对图像的理解可表示成图像的高层语义。
为了实现更为贴近用户的自然而简洁的查询方式,并提高图像检索的精度,必须实现由图像底层次特征推知高层次语义,从而使用高层语义进行图像检索。为此需要解决两方面的基本问题:一是提供高层语义的描述方式;二是应有将低层图像视觉特征映射到高层语义的方法。从目前现状来看,并没有从本质上解决视觉特征和语义之间的关联问题,“语义鸿沟”依然存在,如何提取图像语义成为基于内容的图像检索领域最具挑战性的难题。
发明内容
基于加权金字塔结构的图像特征提取方法是借鉴人类基于图元的图像内容理解思想、从人类对图像整体和局部的认知顺序和认知程度出发的一种简化的多层次图像特征提取手段。
为了实现上述目的,本发明的技术方案如下:一种基于加权金字塔结构的图像特征提取方法,包括以下步骤:
A、图像分层
将图像按照金字塔结构分为三层。金字塔中的每一层来都代表着整幅图像,在图像理解过程中都发挥着相同的作用。
A1、第一层
每一幅图像都会表达一个完整的高层语义,即一幅图像是一个整体,它蕴涵着图像中各个图元之间的空间、时间和语义关系,而且它在人类对图像的理解过程中起着至关重要的作用,因此,把整个图像当成金字塔第一层;
A2、第二层
兼顾到人类摄影的习惯及尽量保持图像中每个图元的完整性,提高图像中主要图元在整幅图像理解过程中的作用,我们采用如图1所示的方式对图像进行切分,作为金字塔结构的第二层;
A3、第三层
作为对第一层和第二层切分方式的补充和完善,将图像切割成4*4个小块,作为金字塔结构的第三层。
B、分层加权
上述的多层次的图像分割手段,可以将图像分成22个子图像块,但每个子图像存在尺寸大小上的差异,在图像内容理解过程中所起的作用也不一样。因此,为了衡量各个子图像块在理解过程中所发挥的作用,需要对每个图像块进行加权处理。对于金字塔中的每一层来说,其都代表着一幅整体的图像,因此我们设每层结构的整体权重,显然Wg=1:
Σ i = 1 3 W g = 3 ( i = 1,2,3 )
同时,对于每层中的子图像块,设其权重为:
W i = 1 N i ( i = 1,2,3 )
其中Ni为第i层上子图像块的数目N={1,5,16}。
C、图像特征提取
提取每一幅子图像颜色、纹理、边缘方向等低层特征,子图像之间的特征提取及不同底层特征提取都是彼此独立的;成功将低层特征提出后,即将每一个样本图像的内容转化成为22组数值向量,作为该样本图像的特征向量组。
与现有技术相比,本发明具有以下有益效果:
1、本发明改善了图像的特征提取方法,参照人类理解图像的过程,将图像按图元进行分割,同时考虑到整体与局部对图像内容理解的不同贡献,采用相应的加权策略,有效地改善了图像描述的性能。
附图说明
本发明共有附图1张,其中:
图1是图像加权金字塔;
具体实施方式
A、图像分层
将图像按照金字塔结构分为三层。金字塔中的每一层来都代表着整幅图像,在图像理解过程中都发挥着相同的作用。
A1、第一层
每一幅图像都会表达一个完整的高层语义,即一幅图像是一个整体,它蕴涵着图像中各个图元之间的空间、时间和语义关系,而且它在人类对图像的理解过程中起着至关重要的作用,因此,把整个图像当成金字塔第一层;
A2、第二层
兼顾到人类摄影的习惯及尽量保持图像中每个图元的完整性,提高图像中主要图元在整幅图像理解过程中的作用,我们采用如图1所示的方式对图像进行切分,作为金字塔结构的第二层;
A3、第三层
作为对第一层和第二层切分方式的补充和完善,将图像切割成4*4个小块,作为金字塔结构的第三层。
B、分层加权
上述的多层次的图像分割手段,可以将图像分成22个子图像块,但每个子图像存在尺寸大小上的差异,在图像内容理解过程中所起的作用也不一样。因此,为了衡量各个子图像块在理解过程中所发挥的作用,需要对每个图像块进行加权处理。对于金字塔中的每一层来说,其都代表着一幅整体的图像,因此我们设每层结构的整体权重,显然Wg=1:
Σ i = 1 3 W g = 3 ( i = 1,2,3 )
同时,对于每层中的子图像块,设其权重为:
W i = 1 N i ( i = 1,2,3 )
其中Ni为第i层上子图像块的数目N={1,5,16}。
C、图像特征提取
提取每一幅子图像颜色、纹理、边缘方向等低层特征,子图像之间的特征提取及不同底层特征提取都是彼此独立的;成功将低层特征提出后,即将每一个样本图像的内容转化成为22组数值向量,作为该样本图像的特征向量组。

Claims (1)

1.一种基于加权金字塔结构的图像特征提取方法,其特征在于:包括以下步骤:
A、图像分层
将图像按照金字塔结构分为三层;金字塔中的每一层来都代表着整幅图像,在图像理解过程中都发挥着相同的作用;
A1、第一层
每一幅图像都会表达一个完整的高层语义,即一幅图像是一个整体,它蕴涵着图像中各个图元之间的空间、时间和语义关系,而且它在人类对图像的理解过程中起着至关重要的作用,因此,把整个图像当成金字塔第一层;
A2、第二层
兼顾到人类摄影的习惯及尽量保持图像中每个图元的完整性,提高图像中主要图元在整幅图像理解过程中的作用,我们采用如图1所示的方式对图像进行切分,作为金字塔结构的第二层;
A3、第三层
作为对第一层和第二层切分方式的补充和完善,将图像切割成4*4个小块,作为金字塔结构的第三层;
B、分层加权
上述的多层次的图像分割手段,可以将图像分成22个子图像块,但每个子图像存在尺寸大小上的差异,在图像内容理解过程中所起的作用也不一样;因此,为了衡量各个子图像块在理解过程中所发挥的作用,需要对每个图像块进行加权处理;对于金字塔中的每一层来说,其都代表着一幅整体的图像,因此我们设每层结构的整体权重,显然Wg=1:
Σ i = 1 3 W g = 3 ( i = 1,2,3 )
同时,对于每层中的子图像块,设其权重为:
W i = 1 N i ( i = 1,2,3 )
其中Ni为第i层上子图像块的数目N={1,5,16};
C、图像特征提取
提取每一幅子图像颜色、纹理、边缘方向等低层特征,子图像之间的特征提取及不同底层特征提取都是彼此独立的;成功将低层特征提出后,即将每一个样本图像的内容转化成为22组数值向量,作为该样本图像的特征向量组。
CN201210475799.0A 2012-11-21 2012-11-21 一种基于加权金字塔结构的图像特征提取方法 Pending CN103839063A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210475799.0A CN103839063A (zh) 2012-11-21 2012-11-21 一种基于加权金字塔结构的图像特征提取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210475799.0A CN103839063A (zh) 2012-11-21 2012-11-21 一种基于加权金字塔结构的图像特征提取方法

Publications (1)

Publication Number Publication Date
CN103839063A true CN103839063A (zh) 2014-06-04

Family

ID=50802541

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210475799.0A Pending CN103839063A (zh) 2012-11-21 2012-11-21 一种基于加权金字塔结构的图像特征提取方法

Country Status (1)

Country Link
CN (1) CN103839063A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105760488A (zh) * 2016-02-17 2016-07-13 北京大学 基于多层次特征融合的图像表达方法和装置
CN110853120A (zh) * 2019-10-09 2020-02-28 上海交通大学 基于分割绘图法的网络布局方法、***及介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104318252A (zh) * 2014-11-02 2015-01-28 西安电子科技大学 基于分层概率模型的高光谱图像分类方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104318252A (zh) * 2014-11-02 2015-01-28 西安电子科技大学 基于分层概率模型的高光谱图像分类方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JIANMING LI .ETC: "Content-based Semantic Indexing of Image Using Fuzzy Support Vector", 《THE 2TH CHINESE CONFERENCE ON PATTERN RECOGNITION,CCPR 2008》 *
JIANMING LI .ETC: "Image Classification Based on Fuzzy Support Vector Machine", 《2008 INTERNATIONAL SYMPOSIUM ON COMPUTATIONAL INTELLIGENCE AND DESIGN》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105760488A (zh) * 2016-02-17 2016-07-13 北京大学 基于多层次特征融合的图像表达方法和装置
CN110853120A (zh) * 2019-10-09 2020-02-28 上海交通大学 基于分割绘图法的网络布局方法、***及介质
CN110853120B (zh) * 2019-10-09 2023-05-19 上海交通大学 基于分割绘图法的网络布局方法、***及介质

Similar Documents

Publication Publication Date Title
CN107704877A (zh) 一种基于深度学习的图像隐私感知方法
CN107944442A (zh) 基于改进卷积神经网络的对象检测装置及方法
De et al. Impact of colour on robustness of deep neural networks
CN110060236B (zh) 基于深度卷积神经网络的立体图像质量评价方法
Weng et al. CT 2: Colorization transformer via color tokens
CN102567731A (zh) 一种感兴趣区域提取方法
EP3282367A1 (en) Method for controlling identification and identification control apparatus
Fialon et al. Legitimacy of front-of-pack nutrition labels: controversy over the deployment of the nutri-score in Italy
CN112668638A (zh) 一种图像美学质量评估和语义识别联合分类方法及***
Zhuo et al. Fake colorized image detection with channel-wise convolution based deep-learning framework
CN103839063A (zh) 一种基于加权金字塔结构的图像特征提取方法
CN113642466A (zh) 活体检测和模型训练方法、设备及介质
CN117437528A (zh) 一种基于klt理论和视差补偿的sr图像质量评价方法及***
Cui et al. WetlandNet: Semantic segmentation for remote sensing images of coastal wetlands via improved UNet with deconvolution
CN112733777A (zh) 一种遥感图像的道路提取方法、装置、设备和存储介质
Minh et al. A novel light-weight DCNN model for classifying plant diseases on internet of things edge devices
CN113837212A (zh) 一种基于多模态双向导向注意力的视觉问答方法
CN110009657A (zh) 一种基于金字塔网络调制的视频目标分割方法
CN105338335A (zh) 一种立体图像显著图提取方法
CN114896384A (zh) 一种面向问答社区的问题回答专家跨域推荐方法及***
Cui Research on garden landscape reconstruction based on geographic information system under the background of deep learning
Khimani et al. Generative Adversarial Network for Colorization of Mammograms
Dancette et al. Dynamic Query Selection for Fast Visual Perceiver
Tranquille et al. Evaluating the effects of size in linesets
CN111461150B (zh) 一种无监督学习物体外观的算法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20140604