CN109117773B - 一种图像特征点检测方法、终端设备及存储介质 - Google Patents

一种图像特征点检测方法、终端设备及存储介质 Download PDF

Info

Publication number
CN109117773B
CN109117773B CN201810865350.2A CN201810865350A CN109117773B CN 109117773 B CN109117773 B CN 109117773B CN 201810865350 A CN201810865350 A CN 201810865350A CN 109117773 B CN109117773 B CN 109117773B
Authority
CN
China
Prior art keywords
initial
image
current category
feature point
category
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810865350.2A
Other languages
English (en)
Other versions
CN109117773A (zh
Inventor
张弓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Oppo Mobile Telecommunications Corp Ltd
Original Assignee
Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Oppo Mobile Telecommunications Corp Ltd filed Critical Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority to CN201810865350.2A priority Critical patent/CN109117773B/zh
Publication of CN109117773A publication Critical patent/CN109117773A/zh
Priority to PCT/CN2019/093685 priority patent/WO2020024744A1/zh
Application granted granted Critical
Publication of CN109117773B publication Critical patent/CN109117773B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/52Surveillance or monitoring of activities, e.g. for recognising suspicious objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本申请适用于图像识别技术领域,提供了一种图像特征点检测方法终端设备及计算机可读存储介质,所述方法包括:获取多个类别的自然场景的初始图像,针对每个类别的自然场景,从初始图像中提起初始特征点,根据初始特征点在当前自然场景的初始图像中的对应关系,将符合预设条件的初始特征点作为当前类别的目标特征点,将包含目标特征点的初始图像作为当前类别的训练图像,通过所述训练样本集中的训练图像,训练构建的深度神经网络,获得训练后的深度神经网络,基于所述训练后的深度神经网络,对待检测图像进行检测,获得所述待检测图像中的特征点,通过本申请可以提高场景检测中的检测精度。

Description

一种图像特征点检测方法、终端设备及存储介质
技术领域
本申请属于图像识别技术领域,尤其涉及一种图像特征点检测方法、终端设备及计算机可读存储介质。
背景技术
随着计算机视觉的不断发展,以及用户需求的不断提高,出现了很多图像处理技术。在对图像进行各种处理时,为了获得较好的处理效果,有时需要识别图像的场景,
目前,对图像场景的检测识别大多是在图像尺度空间逐个计算图像像素的某种响应值,并基于像素位置和尺度获得局部极值以得到特征点检测结果。然而,这种图像特征点检测的方式检测精度较低。
发明内容
有鉴于此,本申请实施例提供了一种图像特征点检测方法、终端设备及计算机可读存储介质,以解决目前场景的特征点检测方式检测精度较低的问题。
本申请实施例的第一方面提供了一种图像特征点检测方法,包括:
获取多个类别的自然场景的初始图像,其中,每个类别的自然场景包括多个初始图像;
对于每个类别自然场景,从当前类别的初始图像中分别提取初始特征点;
获取所述初始特征点在当前类别的每个初始图像中的对应关系;
基于所述对应关系,从当前类别的初始图像的初始特征点中获取符合预设条件的初始特征点作为当前类别的目标特征点;
将每个类别的初始图像中包含当前类别的目标特征点的初始图像作为训练图像,获得多个类别的自然场景的训练样本集;
通过所述训练样本集中的训练图像,训练构建的深度神经网络,获得训练后的深度神经网络;
基于所述训练后的深度神经网络,对待检测图像进行检测,获得所述待检测图像中的特征点。
本申请实施例的第二方面提供了一种终端设备,包括:
初始图像获取模块,用于获取多个类别的自然场景的初始图像,其中,每个类别的自然场景包括多个初始图像;
初始特征点获取模块,用于对于每个类别自然场景,从当前类别的初始图像中分别提取初始特征点;
对应关系获取模块,用于获取所述初始特征点在当前类别的每个初始图像中的对应关系;
目标特征点获取模块,用于基于所述对应关系,从当前类别的初始图像的初始特征点中获取符合预设条件的初始特征点作为当前类别的目标特征点;
训练图像获取模块,用于将每个类别的初始图像中包含当前类别的目标特征点的初始图像作为训练图像,获得多个类别的自然场景的训练样本集;
训练模块,用于通过所述训练样本集中的训练图像,训练构建的深度神经网络,获得训练后的深度神经网络;
检测模块,用于基于所述训练后的深度神经网络,对待检测图像进行检测,获得所述待检测图像中的特征点。
本申请实施例的第三方面提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现本申请实施例第一方面提供的所述方法的步骤。
本申请实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被一个或多个处理器执行时实现本申请实施例第一方面提供的所述方法的步骤。
本申请实施例的第五方面提供了一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被一个或多个处理器执行时实现本申请实施例第一方面提供的所述方法的步骤。
本申请实施例提供了一种检测图像的场景时如何检测特征点的方法,首先获取多个类别的自然场景的初始图像,对于每个类别的自然场景,提取初始特征点,然后将获取初始特征点在不同初始图像中的对应关系,根据所述对应关系,从初始图像中筛选出能够表征当前自然场景的目标特征点,将包括目标特征点的初始图像作为训练图像,训练构建的深度神经网络模型,训练后的深度神经网络模型就具有了检测图像场景特征点的能力,由于本申请实施例中训练深度神经网络模型的训练图像是通过从初始特征点中筛选出的能够表征每个类别的自然场景的目标特征点所在的图像,因此,能够提高场景检测中特征点的检测精度。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种图像特征点检测方法的实现流程示意图;
图2是本申请实施例提供的另一种图像特征点检测方法的实现流程示意图;
图3是本申请实施例提供的一种终端设备的示意框图;
图4是本申请实施例提供的另一种终端设备的示意框图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定***结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的***、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
为了说明本申请所述的技术方案,首先介绍本申请实施例的应用场景,本申请可应用于对图像的场景检测,例如,可以预设设定场景的类别为大地、溪水、云朵、雨后、雪山等,当然,在实际应用中,也可以是其它对自然场景的分类方式,在此不做限制,检测图像的场景就是检测出图像中给的自然场景的类别。对场景类别的检测需要基于特征点的检测,然而,场景检测中不像人脸检测可以将具有明显特征的五官作为特征点,人脸检测中基于特定的五官获取特征点可以实现人脸检测,场景检测中对于训练图像很难手动标定出具有明显特殊特征的特征点。所以,通常是在图像尺度空间逐个计算图像像素的某种响应值,并在像素位置与尺度联合组成的三维空间求取局部极值以得到特征点检测结果。这种特征点的检测不够精确,并且有可能并不能代表场景的特征。本申请实施例是先获取到能够代表场景的特征的目标特征点,然后对图像中的目标特征点进行标定,通过标定了目标特征点的图像训练深度神经网络,通过训练后的深度神经网络检测图像的场景特征点,从而获得图像的场景。下面通过具体实施例来进行说明。
图1是本申请实施例提供的一种图像特征点检测方法的实现流程示意图,如图所示该方法可以包括以下步骤:
步骤S101,获取多个类别的自然场景的初始图像,其中,每个类别的自然场景包括多个初始图像。
在本申请实施例中,为了使得训练的深度神经网络能够识别多种类别的自然场景,所以,获取的训练图像需要包含多个类别的自然场景对应的图像。实际应用中,也可以通过单一类别的自然场景的图像训练深度神经网络,这样,训练获得的深度神经网络在进行场景检测时就只能够检测出单一类别的自然场景的图像的特征点。
若需要训练后的深度神经网络能够对多个类别的场景进行特征点检测,可以获取多个类别的自然场景的初始图像,例如,设置了5个自然场景,需要收集每个自然场景对应的大量的初始图像。
步骤S102,对于每个类别自然场景,从当前类别的初始图像中分别提取初始特征点。
在本申请实施例中,从初始图像中提取初始特征点的方法包括但不限于Harris、SUSAN、SIFT、SURF、FAST、MSER等。以Harris角点为例,先将图像分成M×M个小块,对每个小块进行Harris角点响应计算,提取每个小块内角点响应值最大的N个点作为特征点,一张图最多提取M×M×N个特征点。可以理解,实际应用中,还可以是其它提取图像特征点的方法。
步骤S103,获取所述初始特征点在当前类别的每个初始图像中的对应关系。
在本申请实施例中,对于某个类别的自然场景,可能该场景中初始图像的初始特征点之间存在相同,也存在不同。例如,初始图像A中提取了初始特征点a1、初始特征点a2、初始特征点a3、初始特征点a4,初始图像B中提取了初始特征点b1、初始特征点b2、初始特征点b3。由于是从不同的初始图像中提取的特征点,可能初始特征点a1和初始特征点b2是同一类型的特征点。即初始图像A中的初始特征点a1与初始图像B中的初始特征点b2是对应关系。这样就可以将初始特征点a1和初始特征点b2标记为同一类型的初始特征点。在判断初始特征点在不同初始图像中的对应关系的时候,可以根据初始特征点的特征信息进行判断。
步骤S104,基于所述对应关系,从当前类别的初始图像的初始特征点中获取符合预设条件的初始特征点作为当前类别的目标特征点。
在本申请实施例中,在确定了初始特征点的对应关系之后,就可以获得从当前自然场景的初始图像中总共获得了多少种类型的初始特征点。
为了更通俗的理解,我们以人脸检测为例,假设从当前自然场景的初始图像A中提取了初始特征点a1(左眼)、初始特征点a2(右眼)、初始特征点a3(鼻尖)、初始特征点a4(脸部的点),初始图像B中提取了初始特征点b1(鼻尖)、初始特征点b2(左眼)、初始特征点b3(右眼),那么,当前自然场景的初始特征点的种类并不是:初始特征点a1、初始特征点a2、初始特征点a3、初始特征点a4、初始特征点b1、初始特征点b2、初始特征点b3;当前自然场景的初始特征点的种类应该是:左眼、右眼、鼻尖、脸部的点。这是因为,初始特征点a1与初始特征点b2为对应的关系,均表示左眼,初始特征点a2和初始特征点b3为对应关系,均表示右眼,初始特征点a3和初始特征点b1为对应关系,均表示鼻尖,初始特征点a4表示脸部的点。自然场景图像中的特征点不像人脸图像具有明显的特征,所以如果不确定对应关系,就会出现用不同的初始特征点表示同一场景特征点的问题。
在确定了当前自然场景的初始图像中总共获得了多少种类型的初始特征点之后,可以从当前初始特征点中选取符合预设条件的作为目标特征点。例如,选取在不同初始图像中出现的频次较高的作为目标特征点,还可以将初始特征点中符合预设特征的作为目标特征点。从初始特征点中获取目标特征点的过程实际上是获取能够代表当前自然场景的特征的初始特征点作为目标特征点。例如,还可以是从当前场景的初始特征点中选取与其它自然场景中的初始特征点的差异大于阈值的初始特征点作为当前场景的目标特征点。当然,实际应用中还可以设置其它的预设条件以获得目标特征点。
步骤S105,将每个类别的初始图像中包含当前类别的目标特征点的初始图像作为训练图像,获得多个类别的自然场景的训练样本集。
在本申请实施例中,获得的目标特征点为能够代表当前自然场景的特征点,所以可以在包含了目标特征点的初始图像中将目标特征点标记出来,并将标记了目标特征点的初始图像作为训练图像。每个类别的自然场景均需要经过从初始特征点中选取目标特征点的过程,那么就可以获得每个自然场景对应的训练图像,这样就可以获得多个类别的自然场景的训练样本集。
步骤S106,通过所述训练样本集中的训练图像,训练构建的深度神经网络,获得训练后的深度神经网络。
在本申请实施例中,所述深度神经网络可以是VGG神经网络模型。通过标定了目标特征点训练图像训练深度神经网络的过程可以是:将训练图像输入深度神经网络获得输出图像,根据输出图像中检测到的特征点与目标特征点的差异构建损失函数,基于所述损失函数,反向更新深度神经网络中各层的参数,直到通过深度神经网络检测到特征点趋向于标定的目标特征点,即深度神经网络收敛,就可以获得训练后的深度神经网络。当然,实际应用中,还可以是其它训练方式。
作为本申请又一实施例,,在通过所述训练样本集中的训练图像,训练构建的深度神经网络,获得训练后的深度神经网络之前,还包括:
为每个训练图像标定所述训练图像的自然场景和目标特征点。
在本申请实施例中,不仅可以为训练图像标定目标特征点,还可以标定出训练图像对应的自然场景,这样在设置深度神经网络的时候可以在最后增加一个分类器,用于根据检测到的特征点对图像的自然场景进行分类,这样,通过增加了分类器的深度神经网络检测图像特征点的时候就可以相应的获得待检测图像的自然场景。
步骤S107,基于所述训练后的深度神经网络,对待检测图像进行检测,获得所述待检测图像中的特征点。
在本申请实施例中,训练后的深度神经网络,具有了检测获得特征点无限逼近目标特征点的能力,因此,在将待检测图像输入训练后的深度神经网络之后,就可以获得待检测图像中能够表征待检测图像的场景的特征点。
由于本申请实施例中训练深度神经网络模型的训练图像是通过从初始特征点中筛选出的能够表征每个类别的自然场景的目标特征点所在的图像,因此,能够提高场景检测中特征点的检测精度。
图2是本申请实施例提供的另一种图像特征点检测方法的流程示意图,本申请实施例是在图1所示实施例的基础上描述如何获取目标特征点的过程,可以包括以下步骤:
步骤S201,获取多个类别的自然场景的初始图像,其中,每个类别的自然场景包括多个初始图像。
步骤S202,对于每个类别自然场景,从当前类别的初始图像中分别提取初始特征点。
步骤S201至步骤S202的内容和步骤S101至步骤S102的内容一致,具体可参照步骤S101至步骤S102的描述,在此不再赘述。
步骤S203,获取当前类别的自然场景的三维模型。
在本申请实施例中,所述自然场景的三维模型可以是预先建立的,也可以是根据当前自然场景的初始图像建立的。
作为本申请又一实施例,所述获取当前类别的自然场景的三维模型包括:
基于图像重建算法,根据当前类别的初始图像建立当前类别的自然场景的三维模型。
在本申请实施例中,基于所述初始图像建立当前类别的自然场景的三维模型,可以是根据多个初始图像组成的图像序列建立当前类别的自然场景的三维模型。首先根据任意两个初始图像之间的相似度,对所述初始图像进行排序,使得初始图像与前后相邻的两个图像的相似度最高。然后,从图像序列的头部开始,对于相邻的第一个和第二个初始图像,可以获取每个初始图像的SIFT特征,对每个初始图像的SIFT特征进行匹配,从而得到第一个和第二个初始图像的三维重建,然后根据第二个初始图像和第三个初始图像之间的SIFT特征匹配,对第一个和第二个初始图像的三维重建进行修正和扩充,得到第一个初始图像、第二个初始图像和第三个初始图像之间的三维重建,根据第三个初始图像和第四个初始图像之间的SIFT特征匹配,对第一个初始图像、第二个初始图像和第三个初始图像之间的三维重建进行修正和扩充,得到第一个至第四个初始图形之间的三维重建,……,依次类推,获得当前自然场景下的所有初始图像的三维重建结果。
需要说明的是,上述对多个初始图像进行三维重建获得三维模型的过程仅用于举例,实际应用中,还可以是其它三维重建方法。
步骤S204,基于当前类别的初始图像在所述三维模型中的投影矩阵,获得所述初始特征点在当前类别的每个初始图像中的对应关系。
在本申请实施例中,以一个自然场景为例,当前自然场景的初始图像可以映射到三维模型中,获得每个初始图像的投影矩阵,也可以理解为以一个视角对所述三维模型进行成像可以获得一个初始图像。在获得了每个初始图像在所述三维模型中的投影矩阵之后,由于所述初始特征点位于所述初始图像中,所以,根据初始图像在所述三维模型中的投影矩阵,就可以获得所述初始特征点在当前类别的每个初始图像中的对应关系,如图1所示实施例中的描述,获得所述初始特征点在当前类别的每个初始图像中的对应关系的过程也可以是对所述初始特征点进行匹配的过程,可以根据初始特征点的特征、位置等信息进行匹配。
作为本申请又一实施例,所述基于当前类别的初始图像在所述三维模型中的投影矩阵,获得所述初始特征点在当前类别的每个初始图像中的对应关系包括:
基于当前类别的初始图像在所述三维模型中的投影矩阵,获得每个初始特征点在所述三维模型中的位置;
基于每个初始特征点在所述三维模型中的位置,获得所述初始特征点在当前类别的每个初始图像中的对应关系。
在本申请实施例中,可以基于初始特征点的位置进行匹配,例如,根据初四特征点在初始图像中的位置,以及初始图像在三维模型中的投影矩阵,可获得初始特征点在所述三维模型中的位置,基于每个初始特征点在所述三维模型中的位置,获得所述初始特征点在当前类别的每个初始图像中的对应关系。
步骤S205,基于所述对应关系,获取每个初始特征点在当前类别的初始图像中出现的频次。
步骤S206,将所述频次符合预设条件的初始特征点作为当前类别的目标特征点。
在本申请实施例中,可以根据初始特征点在当前类别的初始图像中出现的频次作为筛选目标特征点的条件,也可以理解为,有N个初始图像中出现了初始特征点a1,则初始特征点a1的频次就记录为出现初始特征点a1的初始图像的个数N。
作为本申请又一实施例,所述将所述频次符合预设条件的初始特征点作为当前类别的目标特征点包括:
将当前类别的初始特征点中,所述频次大于预设频次的初始特征点作为当前类别的目标特征点;
或,按照所述频次将当前类别的初始特征点进行排序,从高频次到低频次依次选取预设数量的初始特征点作为当前类别的目标特征点。
在本申请实施例中,可以将同一初始特征点在不同初始图像中出现的次数大于预设次数的初始特征点作为目标特征点,也可以预先设置数量,从高频次到低频次依次选取预设数量的初始特征点作为当前类别的目标特征点。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
图3是本申请一实施例提供的终端设备的示意框图,为了便于说明,仅示出与本申请实施例相关的部分。
该终端设备3可以是内置于手机、平板电脑、笔记本等终端设备内的软件单元、硬件单元或者软硬结合的单元,也可以作为独立的挂件集成到所述手机、平板电脑、笔记本等终端设备中。
所述终端设备3包括:
初始图像获取模块31,用于获取多个类别的自然场景的初始图像,其中,每个类别的自然场景包括多个初始图像;
初始特征点获取模块32,用于对于每个类别自然场景,从当前类别的初始图像中分别提取初始特征点;
对应关系获取模块33,用于获取所述初始特征点在当前类别的每个初始图像中的对应关系;
目标特征点获取模块34,用于基于所述对应关系,从当前类别的初始图像的初始特征点中获取符合预设条件的初始特征点作为当前类别的目标特征点;
训练图像获取模块35,用于将每个类别的初始图像中包含当前类别的目标特征点的初始图像作为训练图像,获得多个类别的自然场景的训练样本集;
训练模块36,用于通过所述训练样本集中的训练图像,训练构建的深度神经网络,获得训练后的深度神经网络;
检测模块37,用于基于所述训练后的深度神经网络,对待检测图像进行检测,获得所述待检测图像中的特征点。
可选的,所述对应关系获取模块33包括:
三维模型获取单元331,用于获取当前类别的自然场景的三维模型;
对应关系获取单元332,用于基于当前类别的初始图像在所述三维模型中的投影矩阵,获得所述初始特征点在当前类别的每个初始图像中的对应关系。
可选的,所述三维模型获取单元331还用于:
基于图像重建算法,根据当前类别的初始图像建立当前类别的自然场景的三维模型。
可选的,所述对应关系获取单元332包括:
初始特征点位置获取子单元,用于基于当前类别的初始图像在所述三维模型中的投影矩阵,获得每个初始特征点在所述三维模型中的位置;
对应关系获取子单元,用于基于每个初始特征点在所述三维模型中的位置,获得所述初始特征点在当前类别的每个初始图像中的对应关系。
可选的,所述目标特征点获取模块34包括:
初始特征点频次获取单元341,用于基于所述对应关系,获取每个初始特征点在当前类别的初始图像中出现的频次;
目标特征点获取单元342,用于将所述频次符合预设条件的初始特征点作为当前类别的目标特征点。
可选的,所述目标特征点获取单元342还用于:
将当前类别的初始特征点中,所述频次大于预设频次的初始特征点作为当前类别的目标特征点;
或,按照所述频次将当前类别的初始特征点进行排序,从高频次到低频次依次选取预设数量的初始特征点作为当前类别的目标特征点。
可选的,所述终端设备3还包括:
标定模块,用于在通过所述训练样本集中的训练图像,训练构建的深度神经网络,获得训练后的深度神经网络之前,为每个训练图像标定所述训练图像的自然场景和目标特征点。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述终端设备的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述终端设备中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
图4是本申请又一实施例提供的终端设备的示意框图。如图4所示,该实施例的终端设备4包括:一个或多个处理器40、存储器41以及存储在所述存储器41中并可在所述处理器40上运行的计算机程序42。所述处理器40执行所述计算机程序42时实现上述各个图像特征点检测方法实施例中的步骤,例如图1所示的步骤S101至S107。或者,所述处理器40执行所述计算机程序42时实现上述终端设备实施例中各模块/单元的功能,例如图3所示模块31至37的功能。
示例性的,所述计算机程序42可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器41中,并由所述处理器40执行,以完成本申请。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序42在所述终端设备4中的执行过程。例如,所述计算机程序42可以被分割成初始图像获取模块、初始特征点获取模块、对应关系获取模块、目标特征点获取模块、训练图像获取模块、训练模块、检测模块。
初始图像获取模块,用于获取多个类别的自然场景的初始图像,其中,每个类别的自然场景包括多个初始图像;
初始特征点获取模块,用于对于每个类别自然场景,从当前类别的初始图像中分别提取初始特征点;
对应关系获取模块,用于获取所述初始特征点在当前类别的每个初始图像中的对应关系;
目标特征点获取模块,用于基于所述对应关系,从当前类别的初始图像的初始特征点中获取符合预设条件的初始特征点作为当前类别的目标特征点;
训练图像获取模块,用于将每个类别的初始图像中包含当前类别的目标特征点的初始图像作为训练图像,获得多个类别的自然场景的训练样本集;
训练模块,用于通过所述训练样本集中的训练图像,训练构建的深度神经网络,获得训练后的深度神经网络;
检测模块,用于基于所述训练后的深度神经网络,对待检测图像进行检测,获得所述待检测图像中的特征点。
其它模块或者单元可参照图3所示的实施例中的描述,在此不再赘述。
所述终端设备包括但不仅限于处理器40、存储器41。本领域技术人员可以理解,图4仅仅是终端设备4的一个示例,并不构成对终端设备4的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述终端设备还可以包括输入设备、输出设备、网络接入设备、总线等。
所述处理器40可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器41可以是所述终端设备4的内部存储单元,例如终端设备4的硬盘或内存。所述存储器41也可以是所述终端设备4的外部存储设备,例如所述终端设备4上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器41还可以既包括所述终端设备4的内部存储单元也包括外部存储设备。所述存储器41用于存储所述计算机程序以及所述终端设备所需的其他程序和数据。所述存储器41还可以用于暂时地存储已经输出或者将要输出的数据。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的实施例中,应该理解到,所揭露的终端设备和方法,可以通过其它的方式实现。例如,以上所描述的终端设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括是电载波信号和电信信号。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。

Claims (7)

1.一种图像特征点检测方法,其特征在于,包括:
获取多个类别的自然场景的初始图像,其中,每个类别的自然场景包括多个初始图像;
对于每个类别自然场景,基于预设的初始特征点提取方法从当前类别的初始图像中分别提取初始特征点;
获取所述初始特征点在当前类别的每个初始图像中的对应关系,包括:基于图像重建算法,根据当前类别的初始图像建立当前类别的自然场景的三维模型;基于当前类别的初始图像在所述三维模型中的投影矩阵,获得每个初始特征点在所述三维模型中的位置;基于每个初始特征点在所述三维模型中的位置,获得所述初始特征点在当前类别的每个初始图像中的对应关系;其中,所述对应关系为所述初始特征点与在当前类别的每个初始图像中具有同一类型关系的初始特征点的对应关系;
基于所述对应关系,从当前类别的初始图像的初始特征点中获取符合预设条件的初始特征点作为当前类别的目标特征点;
将每个类别的初始图像中包含当前类别的目标特征点的初始图像作为训练图像,获得多个类别的自然场景的训练样本集;
通过所述训练样本集中的训练图像,训练构建的深度神经网络,获得训练后的深度神经网络;
基于所述训练后的深度神经网络,对待检测图像进行检测,获得所述待检测图像中的特征点。
2.如权利要求1所述的图像特征点检测方法,其特征在于,所述基于所述对应关系,从当前类别的初始图像的初始特征点中获取符合预设条件的初始特征点作为当前类别的目标特征点包括:
基于所述对应关系,获取每个初始特征点在当前类别的初始图像中出现的频次;
将所述频次符合预设条件的初始特征点作为当前类别的目标特征点。
3.如权利要求2所述的图像特征点检测方法,其特征在于,所述将所述频次符合预设条件的初始特征点作为当前类别的目标特征点包括:
将当前类别的初始特征点中,所述频次大于预设频次的初始特征点作为当前类别的目标特征点;
或,按照所述频次将当前类别的初始特征点进行排序,从高频次到低频次依次选取预设数量的初始特征点作为当前类别的目标特征点。
4.如权利要求1所述的图像特征点检测方法,其特征在于,在通过所述训练样本集中的训练图像,训练构建的深度神经网络,获得训练后的深度神经网络之前,还包括:
为每个训练图像标定所述训练图像的自然场景和目标特征点。
5.一种终端设备,其特征在于,包括:
初始图像获取模块,用于获取多个类别的自然场景的初始图像,其中,每个类别的自然场景包括多个初始图像;
初始特征点获取模块,用于对于每个类别自然场景,基于预设的初始特征点提取方法从当前类别的初始图像中分别提取初始特征点;
对应关系获取模块,用于获取所述初始特征点在当前类别的每个初始图像中的对应关系,具体包括:基于图像重建算法,根据当前类别的初始图像建立当前类别的自然场景的三维模型;基于当前类别的初始图像在所述三维模型中的投影矩阵,获得每个初始特征点在所述三维模型中的位置;基于每个初始特征点在所述三维模型中的位置,获得所述初始特征点在当前类别的每个初始图像中的对应关系;其中,所述对应关系为所述初始特征点与在当前类别的每个初始图像中具有同一类型关系的初始特征点的对应关系;
目标特征点获取模块,用于基于所述对应关系,从当前类别的初始图像的初始特征点中获取符合预设条件的初始特征点作为当前类别的目标特征点;
训练图像获取模块,用于将每个类别的初始图像中包含当前类别的目标特征点的初始图像作为训练图像,获得多个类别的自然场景的训练样本集;
训练模块,用于通过所述训练样本集中的训练图像,训练构建的深度神经网络,获得训练后的深度神经网络;
检测模块,用于基于所述训练后的深度神经网络,对待检测图像进行检测,获得所述待检测图像中的特征点。
6.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至4任一项所述方法的步骤。
7.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被一个或多个处理器执行时实现如权利要求1至4任一项所述方法的步骤。
CN201810865350.2A 2018-08-01 2018-08-01 一种图像特征点检测方法、终端设备及存储介质 Active CN109117773B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201810865350.2A CN109117773B (zh) 2018-08-01 2018-08-01 一种图像特征点检测方法、终端设备及存储介质
PCT/CN2019/093685 WO2020024744A1 (zh) 2018-08-01 2019-06-28 一种图像特征点检测方法、终端设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810865350.2A CN109117773B (zh) 2018-08-01 2018-08-01 一种图像特征点检测方法、终端设备及存储介质

Publications (2)

Publication Number Publication Date
CN109117773A CN109117773A (zh) 2019-01-01
CN109117773B true CN109117773B (zh) 2021-11-02

Family

ID=64863925

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810865350.2A Active CN109117773B (zh) 2018-08-01 2018-08-01 一种图像特征点检测方法、终端设备及存储介质

Country Status (2)

Country Link
CN (1) CN109117773B (zh)
WO (1) WO2020024744A1 (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109117773B (zh) * 2018-08-01 2021-11-02 Oppo广东移动通信有限公司 一种图像特征点检测方法、终端设备及存储介质
CN110322399B (zh) * 2019-07-05 2023-05-05 深圳开立生物医疗科技股份有限公司 一种超声图像调整方法、***、设备及计算机存储介质
CN110942063B (zh) * 2019-11-21 2023-04-07 望海康信(北京)科技股份公司 证件文字信息获取方法、装置以及电子设备
CN113470110A (zh) * 2020-03-30 2021-10-01 北京四维图新科技股份有限公司 测距方法和装置
CN112907726B (zh) * 2021-01-25 2022-09-20 重庆金山医疗技术研究院有限公司 一种图像处理方法、装置、设备及计算机可读存储介质
CN113240031B (zh) * 2021-05-25 2021-11-19 中德(珠海)人工智能研究院有限公司 全景图像特征点匹配模型的训练方法、装置以及服务器
CN113361363B (zh) * 2021-05-31 2024-02-06 北京百度网讯科技有限公司 人脸图像识别模型的训练方法、装置、设备及存储介质
CN114898354A (zh) * 2022-03-24 2022-08-12 中德(珠海)人工智能研究院有限公司 基于三维模型的测量方法、装置、服务器及可读存储介质
CN115953567B (zh) * 2023-03-14 2023-06-30 广州市玄武无线科技股份有限公司 一种堆箱数量的检测方法、装置、终端设备及存储介质

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010170184A (ja) * 2009-01-20 2010-08-05 Seiko Epson Corp 顔画像における特徴部位の位置の特定
CN101859326B (zh) * 2010-06-09 2012-04-18 南京大学 一种图像检索方法
CN103578093B (zh) * 2012-07-18 2016-08-17 成都理想境界科技有限公司 图像配准方法、装置及增强现实***
CN103310445A (zh) * 2013-06-01 2013-09-18 吉林大学 用于虚拟视点绘制的虚拟视点摄像机参数估计方法
CN103617432B (zh) * 2013-11-12 2017-10-03 华为技术有限公司 一种场景识别方法及装置
CN104008400A (zh) * 2014-06-16 2014-08-27 河南科技大学 结合sift和bp网络进行物体识别的方法
KR20170024303A (ko) * 2015-08-25 2017-03-07 영남대학교 산학협력단 얼굴의 특징점 검출 시스템 및 방법
CN105184271A (zh) * 2015-09-18 2015-12-23 苏州派瑞雷尔智能科技有限公司 一种基于深度学习的车辆自动检测方法
CN105488541A (zh) * 2015-12-17 2016-04-13 上海电机学院 增强现实***中基于机器学习的自然特征点识别方法
CN106446930B (zh) * 2016-06-28 2019-11-22 沈阳工业大学 基于深层卷积神经网络的机器人工作场景识别方法
CN109117773B (zh) * 2018-08-01 2021-11-02 Oppo广东移动通信有限公司 一种图像特征点检测方法、终端设备及存储介质

Also Published As

Publication number Publication date
WO2020024744A1 (zh) 2020-02-06
CN109117773A (zh) 2019-01-01

Similar Documents

Publication Publication Date Title
CN109117773B (zh) 一种图像特征点检测方法、终端设备及存储介质
CN109784186B (zh) 一种行人重识别方法、装置、电子设备及计算机可读存储介质
CN110660066B (zh) 网络的训练方法、图像处理方法、网络、终端设备及介质
US8582836B2 (en) Face recognition in digital images by applying a selected set of coefficients from a decorrelated local binary pattern matrix
CN110991533B (zh) 图像识别方法、识别装置、终端设备及可读存储介质
CN111079785A (zh) 一种图像识别方法、装置及终端设备
CN110689043A (zh) 一种基于多重注意力机制的车辆细粒度识别方法及装置
CN112348778B (zh) 一种物体识别方法、装置、终端设备及存储介质
CN110738204B (zh) 一种证件区域定位的方法及装置
CN110781770B (zh) 基于人脸识别的活体检测方法、装置及设备
CN111191582B (zh) 三维目标检测方法、检测装置、终端设备及计算机可读存储介质
CN110570442A (zh) 一种复杂背景下轮廓检测方法、终端设备及存储介质
CN112633084A (zh) 人脸框确定方法、装置、终端设备及存储介质
CN108805838B (zh) 一种图像处理方法、移动终端及计算机可读存储介质
CN109389628B (zh) 图像配准方法、设备和存储介质
CN111145196A (zh) 图像分割方法、装置及服务器
CN111062927A (zh) 一种无人机图像质量检测的方法、***及设备
CN112200004B (zh) 图像检测模型的训练方法、装置及终端设备
CN111161348A (zh) 一种基于单目相机的物***姿估计方法、装置及设备
CN111199228B (zh) 一种车牌定位的方法及装置
CN108776959B (zh) 图像处理方法、装置及终端设备
CN110610178A (zh) 图像识别方法、装置、终端及计算机可读存储介质
CN115439733A (zh) 图像处理方法、装置、终端设备及计算机可读存储介质
CN112069885A (zh) 人脸属性识别方法、装置及移动终端
CN110674817A (zh) 一种基于双目摄像头的车牌防伪的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant