CN111414510A - 一种快速图像检索方法 - Google Patents

一种快速图像检索方法 Download PDF

Info

Publication number
CN111414510A
CN111414510A CN202010213972.4A CN202010213972A CN111414510A CN 111414510 A CN111414510 A CN 111414510A CN 202010213972 A CN202010213972 A CN 202010213972A CN 111414510 A CN111414510 A CN 111414510A
Authority
CN
China
Prior art keywords
image
feature modeling
vector
retrieval method
expression vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010213972.4A
Other languages
English (en)
Inventor
钱鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Curve Intelligent Equipment Co ltd
Original Assignee
Beijing Curve Intelligent Equipment Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Curve Intelligent Equipment Co ltd filed Critical Beijing Curve Intelligent Equipment Co ltd
Priority to CN202010213972.4A priority Critical patent/CN111414510A/zh
Publication of CN111414510A publication Critical patent/CN111414510A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/55Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Library & Information Science (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明属于图像识别技术领域,公开了一种快速图像检索方法,包括如下步骤:S1.获取图像,进行预处理,得到图像局部特征;S2:进行图像局部特征的特征抽取和选择,得到特征建模向量;S3:进行特征建模向量的判别学习,得到降维后的特征建模向量;S4:融合降维后的特征建模向量,得到最终图像表达向量;S5:根据最终图像表达向量,得到检索结果。本发明解决了现有技术存在的图像识别准确性低、效率低以及无法适应大规模数据情况的问题。

Description

一种快速图像检索方法
技术领域
本发明属于图像识别技术领域,具体涉及一种快速图像检索方法。
背景技术
图像识别是人工智能的一个重要领域。图像识别的发展经历了三个阶段:文字识别、数字图像处理与识别、物体识别。图像识别,顾名思义,就是对图像做出各种处理、分析,最终识别我们所要研究的目标。今天所指的图像识别并不仅仅是用人类的肉眼,而是借助计算机技术进行识别。虽然人类的识别能力很强大,但是对于高速发展的社会,人类自身识别能力已经满足不了我们的需求,于是就产生了基于计算机的图像识别技术。通常一个领域有固有技术无法解决的需求时,就会产生相应的新技术。图像识别技术也是如此,此技术的产生就是为了让计算机代替人类去处理大量的物理信息,解决人类无法识别或者识别率特别低的信息。
模式识别是人工智能和信息科学的重要组成部分。模式识别是指对表示事物或现象的不同形式的信息做分析和处理从而得到一个对事物或现象做出描述、辨认和分类等的过程。简单地说,模式识别就是对数据进行分类,它是一门与数学紧密结合的科学,其中所用的思想大部分是概率与统计。模式识别主要分为三种:统计模式识别、句法模式识别、模糊模式识别。
在实现本发明的过程中,发明人发现现有技术中至少存在如下问题:
识别方法中基本的也是常用的方法有统计法(或决策理论法)、句法(或结构)方法、神经网络法、模板匹配法和霍夫变换法。
统计法:该方法是对研究的图像进行大量的统计分析,找出其中的规律并提取反映图像本质特点的特征来进行图像识别的。它以数学上的决策理论为基础,建立统计学识别模型,因而是一种分类误差最小的方法。常用的图像统计模型有贝叶斯(Bayes)模型和马尔柯夫(Markow)随机场(MRF)模型。但是,较为常用的贝叶斯决策规则虽然从理论上解决了最优分类器的设计问题,其应用却在很大程度受到了更为困难的概率密度估计问题的限制。同时,正是因为统计方法基于严格的数学基础,而忽略了被识别图像的空间结构关系,当图像非常复杂、类别数很多时,将导致特征数量的激增,给特征提取造成困难,也使分类难以实现。尤其是当被识别图像(如指纹、染色体等)的主要特征是结构特征时,用统计法就很难进行识别。
句法识别法:该方法是对统计识别方法的补充,在用统计法对图像进行识别时,图像的特征是用数值特征描述的,而句法方法则是用符号来描述图像特征的。它模仿了语言学中句法的层次结构,采用分层描述的方法,把复杂图像分解为单层或多层的相对简单的子图像,主要突出被识别对象的空间结构关系信息。模式识别源于统计方法,而句法方法则扩大了模式识别的能力,使其不仅能用于对图像的分类,而且可以用于对景物的分析与物体结构的识别。但是,当存在较大的干扰和噪声时,句法识别方法抽取子图像(基元)困难,容易产生误判率,难以满足分类识别精度和可靠度的要求。
神经网络方法:该方法是指用神经网络算法对图像进行识别的方法。神经网络***是由大量的,同时也是很简单的处理单元(称为神经元),通过广泛地按照某种方式相互连接而形成的复杂网络***,虽然每个神经元的结构和功能十分简单,但由大量的神经元构成的网络***的行为却是丰富多彩和十分复杂的。它反映了人脑功能的许多基本特征,是人脑神经网络***的简化、抽象和模拟。句法方法侧重于模拟人的逻辑思维,而神经网络侧重于模拟和实现人的认知过程中的感知觉过程、形象思维、分布式记忆和自学习自组织过程,与符号处理是一种互补的关系。由于神经网络具有非线性映射逼近、大规模并行分布式存储和综合优化处理、容错性强、独特的联想记忆及自组织、自适应和自学习能力,因而特别适合处理需要同时考虑许多因素和条件的问题以及信息不确定性(模糊或不精确)问题。在实际应用中,由于神经网络法存在收敛速度慢、训练量大、训练时间长,且存在局部最小,识别分类精度不够,难以适用于经常出现新模式的场合,因而其实用性有待进一步提高。
模板匹配法:它是一种最基本的图像识别方法。所谓模板是为了检测待识别图像的某些区域特征而设计的阵列,它既可以是数字量,也可以是符号串等,因此可以把它看为统计法或句法的一种特例。所谓模板匹配法就是把已知物体的模板与图像中所有未知物体进行比较,如果某一未知物体与该模板匹配,则该物体被检测出来,并被认为是与模板相同的物体。模板匹配法虽然简单方便,但其应用有一定的限制。因为要表明所有物体的各种方向及尺寸,就需要较大数量的模板,且其匹配过程由于需要的存储量和计算量过大而不经济。同时,该方法的识别率过多地依赖于已知物体的模板,如果已知物体的模板产生变形,会导致错误的识别。此外,由于图像存在噪声以及被检测物体形状和结构方面的不确定性,模板匹配法在较复杂的情况下往往得不到理想的效果,难以绝对精确,一般都要在图像的每一点上求模板与图像之间的匹配量度,凡是匹配量度达到某一阈值的地方,表示该图像中存在所要检测的物体。经典的图像匹配方法利用互相关计算匹配量度,或用绝对差的平方和作为不匹配量度,但是这两种方法经常发生不匹配的情况,因此,利用几何变换的匹配方法有助于提高稳健性。
霍夫变换:霍夫变换是一种快速形状匹配技术,它对图像进行某种形式的变换,把图像中给定形状曲线上的所有点变换到霍夫空间,形成峰点,这样,给定形状的曲线检测问题就变换为霍夫空间中峰点的检测问题,可以用于有缺损形状的检测,是一种鲁棒性(Robust)很强的方法。为了减少计算量和和内存空间以提高计算效率,又提出了改进的霍夫算法,如快速霍夫变换(FHT)、自适应霍夫变换(AHT)及随机霍夫变换(RHT)。其中随机霍夫变换RHT(RandomizedHough Transform)是20世纪90年代提出的一种精巧的变换算法,其突出特点不仅能有效地减少计算量和内存容量,提高计算效率,而且能在有限的变换空间获得任意高的分辨率。
发明内容
本发明旨在于至少在一定程度上解决上述技术问题之一。
为此,本发明目的在于提供一种快速图像检索方法,解决了现有技术存在的图像识别准确性低、效率低以及无法适应大规模数据情况的问题。
本发明所采用的技术方案为:
一种快速图像检索方法,包括如下步骤:
S1.获取图像,进行预处理,得到图像局部特征;
S2.进行图像局部特征的特征抽取和选择,得到特征建模向量;
S3.进行特征建模向量的判别学习,得到降维后的特征建模向量;
S4.融合降维后的特征建模向量,得到最终图像表达向量;
S5.根据最终图像表达向量,得到检索结果。
进一步地,步骤S1中,使用基于迁移学习的深层卷积神经网络,对获取的图像进行预处理。
进一步地,预处理包括依次进行的去噪处理、平滑处理以及变换处理。
进一步地,步骤S2中,进行图像局部特征的特征抽取和选择时,分别使用空间均值池化和鲁棒协方差对图像局部特征进行建模,得到对应的两种特征建模向量。
进一步地,步骤S3中,得到降维后的特征建模向量的具体步骤如下:
S3-1.获取图像数据库中的训练数据,根据预设训练数据中已知的标签信息,使用大间隔最近子空间学习算法对两种初始特征建模向量进行判别学习,得到对应的两种低秩线性映射矩阵;;
S3-2.根据得到的低秩线性映射矩阵,对对应的特征建模向量进行降维,得到两种降维后的特征建模向量。
进一步地,步骤S4中,融合降维后的特征建模向量时,使用加权系数对两种降维后的特征建模向量进行加权级联,得到最终图像表达向量。
进一步地,步骤S5中,得到检索结果的具体步骤如下:
S5-1.根据最终图像表达向量,得到与图像数据库中的所有待检索图像的表达向量的欧氏距离;
S5-2.对所有的欧氏距离进行排序,将最小的欧氏距离对应的若干个图像作为检索结果。
本发明的有益效果为:
1)本发明使用经过迁移学习的深层卷积神经网络提取图像局部特征,提升了检索结果的准确性;
2)本发明提出的空间均值池化方法充分利用了图像的局部空间信息;提出的鲁棒协方差进一步丰富了图像信息的表达,提升了检索的准确率;
3)本发明提出了基于最大间隔子空间的低秩测度学习方法,适应大规模数据情况,提高图像匹配的效率;
4)本发明提出的准确、快速的图像检索方法,在网络多媒体等诸多领域具有广泛的应用前景。
本发明的其他有益效果将在具体实施方式中进行详细说明。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是快速图像检索方法流程图。
具体实施方式
下面结合附图及具体实施例来对本发明作进一步阐述。在此需要说明的是,对于这些实施例方式的说明虽然是用于帮助理解本发明,但并不构成对本发明的限定。本发明公开的功能细节仅用于描述本发明的示例实施例。然而,可用很多备选的形式来体现本发明,并且不应当理解为本发明限制在本发明阐述的实施例中。
应当理解,本发明使用的术语仅用于描述特定实施例,并不意在限制本发明的示例实施例。若术语“包括”、“包括了”、“包含”和/或“包含了”在本发明中被使用时,指定所声明的特征、整数、步骤、操作、单元和/或组件的存在性,并且不排除一个或多个其他特征、数量、步骤、操作、单元、组件和/或他们的组合存在性或增加。
应当理解,还应当注意到在一些备选实施例中,所出现的功能/动作可能与附图出现的顺序不同。例如,取决于所涉及的功能/动作,实际上可以实质上并发地执行,或者有时可以以相反的顺序来执行连续示出的两个图。
应当理解,在下面的描述中提供了特定的细节,以便于对示例实施例的完全理解。然而,本领域普通技术人员应当理解可以在没有这些特定细节的情况下实现示例实施例。例如可以在框图中示出***,以避免用不必要的细节来使得示例不清楚。在其他实例中,可以不以不必要的细节来示出众所周知的过程、结构和技术,以避免使得示例实施例不清楚。
实施例1
如图1所示,本实施例提供一种快速图像检索方法,包括如下步骤:
S1.获取图像,进行预处理,具体的,使用基于迁移学***滑处理以及变换处理,得到图像局部特征;
深层卷积神经网络中的BP分为三部分,即全连接层、卷积核的反向传播和池化层的反向通路;全连接层的BP计算与传统的前馈神经网络相同,卷积层的反向传播是一个与前向传播类似的交叉相关计算;提取首先使用检索数据库的训练集图像对经过预训练的深层卷积神经网络进行迁移学习,即微调卷积神经网络各层参数;然后将待处理的图像作为迁移学习得到的深层卷积神经网络的输入,提取最后一层卷积层的输出作为图像局部特征;
S2.进行图像局部特征的特征抽取和选择,图像是各式各样的,通过这些图像所具有的本身特征来识别并将其区分开,而获取这些特征的过程就是特征抽取,提取有用的特征,这就是特征的选择,即分别使用一阶的空间均值池化和二阶的鲁棒协方差对图像局部特征进行建模,得到用于表示图像局部特征信息的对应的两种特征建模向量;
S3.进行特征建模向量的判别学习,得到降维后的特征建模向量,具体步骤如下:
S3-1.获取图像数据库中的训练数据,根据预设训练数据中已知的标签信息,使用大间隔最近子空间学习算法对两种初始特征建模向量进行判别学习,得到对应的两种低秩线性映射矩阵;
S3-2.根据得到的低秩线性映射矩阵,对对应的特征建模向量进行降维,得到两种降维后的特征建模向量;
S4.融合降维后的特征建模向量时,使用加权系数对两种降维后的特征建模向量进行加权级联,得到最终图像表达向量;
S5.根据最终图像表达向量,得到检索结果;具体步骤如下:
S5-1.根据最终图像表达向量,得到与图像数据库中的所有待检索图像的表达向量的欧氏距离;
S5-2.对所有的欧氏距离进行排序,将最小的欧氏距离对应的若干个图像作为检索结果。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
本发明不局限于上述可选的实施方式,任何人在本发明的启示下都可得出其他各种形式的产品。上述具体实施方式不应理解成对本发明的保护范围的限制,本发明的保护范围应当以权利要求书中界定的为准,并且说明书可以用于解释权利要求书。

Claims (7)

1.一种快速图像检索方法,其特征在于:包括如下步骤:
S1.获取图像,进行预处理,得到图像局部特征;
S2.进行图像局部特征的特征抽取和选择,得到特征建模向量;
S3.进行特征建模向量的判别学习,得到降维后的特征建模向量;
S4.融合降维后的特征建模向量,得到最终图像表达向量;
S5.根据最终图像表达向量,得到检索结果。
2.根据权利要求1所述的一种快速图像检索方法,其特征在于:所述的步骤S1中,使用基于迁移学习的深层卷积神经网络,对获取的图像进行预处理。
3.根据权利要求2所述的一种快速图像检索方法,其特征在于:所述的预处理包括依次进行的去噪处理、平滑处理以及变换处理。
4.根据权利要求1所述的一种快速图像检索方法,其特征在于:所述的步骤S2中,进行图像局部特征的特征抽取和选择时,分别使用空间均值池化和鲁棒协方差对图像局部特征进行建模,得到对应的两种特征建模向量。
5.根据权利要求4所述的一种快速图像检索方法,其特征在于:所述的步骤S3中,得到降维后的特征建模向量的具体步骤如下:
S3-1.获取图像数据库中的训练数据,根据预设训练数据中已知的标签信息,使用大间隔最近子空间学习算法对两种初始特征建模向量进行判别学习,得到对应的两种低秩线性映射矩阵;
S3-2.根据得到的低秩线性映射矩阵,对对应的特征建模向量进行降维,得到两种降维后的特征建模向量。
6.根据权利要求5所述的一种快速图像检索方法,其特征在于:所述的步骤S4中,融合降维后的特征建模向量时,使用加权系数对两种降维后的特征建模向量进行加权级联,得到最终图像表达向量。
7.根据权利要求6所述的一种快速图像检索方法,其特征在于:所述的步骤S5中,得到检索结果的具体步骤如下:
S5-1.根据最终图像表达向量,得到与图像数据库中的所有待检索图像的表达向量的欧氏距离;
S5-2.对所有的欧氏距离进行排序,将最小的欧氏距离对应的若干个图像作为检索结果。
CN202010213972.4A 2020-03-24 2020-03-24 一种快速图像检索方法 Pending CN111414510A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010213972.4A CN111414510A (zh) 2020-03-24 2020-03-24 一种快速图像检索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010213972.4A CN111414510A (zh) 2020-03-24 2020-03-24 一种快速图像检索方法

Publications (1)

Publication Number Publication Date
CN111414510A true CN111414510A (zh) 2020-07-14

Family

ID=71493171

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010213972.4A Pending CN111414510A (zh) 2020-03-24 2020-03-24 一种快速图像检索方法

Country Status (1)

Country Link
CN (1) CN111414510A (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106055576A (zh) * 2016-05-20 2016-10-26 大连理工大学 一种大规模数据背景下的快速有效的图像检索方法
CN107122809A (zh) * 2017-04-24 2017-09-01 北京工业大学 基于图像自编码的神经网络特征学习方法
CN110084794A (zh) * 2019-04-22 2019-08-02 华南理工大学 一种基于注意力卷积神经网络的皮肤癌图片识别方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106055576A (zh) * 2016-05-20 2016-10-26 大连理工大学 一种大规模数据背景下的快速有效的图像检索方法
CN107122809A (zh) * 2017-04-24 2017-09-01 北京工业大学 基于图像自编码的神经网络特征学习方法
CN110084794A (zh) * 2019-04-22 2019-08-02 华南理工大学 一种基于注意力卷积神经网络的皮肤癌图片识别方法

Similar Documents

Publication Publication Date Title
CN110163258B (zh) 一种基于语义属性注意力重分配机制的零样本学习方法及***
CN110532920B (zh) 基于FaceNet方法的小数量数据集人脸识别方法
Adithya et al. Artificial neural network based method for Indian sign language recognition
Singh et al. Svm-bdt pnn and fourier moment technique for classification of leaf shape
Sharma et al. Classification in pattern recognition: A review
CN112766378B (zh) 一种专注细粒度识别的跨域小样本图像分类模型方法
CN109840518B (zh) 一种结合分类与域适应的视觉追踪方法
CN110598022B (zh) 一种基于鲁棒深度哈希网络的图像检索***与方法
CN112183659A (zh) 一种基于卷积神经网络的未知信号辐射源识别方法
CN113255366A (zh) 一种基于异构图神经网络的方面级文本情感分析方法
Sen et al. Face recognition using deep convolutional network and one-shot learning
Yan et al. An incremental intelligent object recognition system based on deep learning
Mawaddah et al. Handwriting recognition of hiragana characters using convolutional neural network
Ma et al. An improved deep learning network structure for multitask text implication translation character recognition
Abd El-Khalek et al. A Robust Machine Learning Algorithm for Cosmic Galaxy Images Classification Using Neutrosophic Score Features.
CN108898157B (zh) 基于卷积神经网络的数值型数据的雷达图表示的分类方法
Ye et al. TS2V: A transformer-based Siamese network for representation learning of univariate time-series data
Kumar et al. Convolutional neural network based face recognition approach
CN111414510A (zh) 一种快速图像检索方法
CN113032612B (zh) 一种多目标图像检索模型的构建方法及检索方法和装置
CN115100694A (zh) 一种基于自监督神经网络的指纹快速检索方法
Qi et al. Multigranularity semantic labeling of point clouds for the measurement of the rail tanker component with structure modeling
Pal et al. Sign Language to Text Classification using One-Shot Learning
Kong et al. A one-shot learning approach for similarity retrieval of wafer bin maps with unknown failure pattern
CN113887509A (zh) 一种基于图像集合的快速多模态视频人脸识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination