CN115437601A - 图像排序方法、电子设备、程序产品及介质 - Google Patents

图像排序方法、电子设备、程序产品及介质 Download PDF

Info

Publication number
CN115437601A
CN115437601A CN202211364538.1A CN202211364538A CN115437601A CN 115437601 A CN115437601 A CN 115437601A CN 202211364538 A CN202211364538 A CN 202211364538A CN 115437601 A CN115437601 A CN 115437601A
Authority
CN
China
Prior art keywords
image
images
matching
area
electronic device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211364538.1A
Other languages
English (en)
Other versions
CN115437601B (zh
Inventor
陈敬濠
曹鹏蕊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Honor Device Co Ltd
Original Assignee
Honor Device Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Honor Device Co Ltd filed Critical Honor Device Co Ltd
Priority to CN202211364538.1A priority Critical patent/CN115437601B/zh
Publication of CN115437601A publication Critical patent/CN115437601A/zh
Application granted granted Critical
Publication of CN115437601B publication Critical patent/CN115437601B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F7/06Arrangements for sorting, selecting, merging, or comparing data on individual record carriers
    • G06F7/08Sorting, i.e. grouping record carriers in numerical or other ordered sequence according to the classification of at least some of the information they carry
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Library & Information Science (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本申请提供一种图像排序方法、电子设备、程序产品及介质,该方法包括:获取第一图像集合,该第一图像集合包括多个待排序图像,该待排序图像为根据查询图像检索得到的图像;根据每个待排序图像和该查询图像之间匹配的第一特征点,计算对应待排序图像和查询图像的共视比例;根据该共视比例对所述多个待排序图像进行排序。本申请可以通过反映特征点分布的共视比例对检索结果中的相似图像按照相似度进一步排序,得到更准确的排序结果,解决图像检索结果中相似图像排序混乱的问题。

Description

图像排序方法、电子设备、程序产品及介质
技术领域
本申请涉及检索技术领域,尤其涉及一种图像排序方法、电子设备、计算机程序产品及计算机可读存储介质。
背景技术
图像检索不断发展,从开始的根据文本描述的方式描述图像的特征以进行检索,已经发展到可以根据图像的颜色、纹理、布局等进行分析和检索,即基于内容的图像检索技术。 图像检索广泛应用于视觉定位、商品推荐和相似物搜索等场景。
图像检索一般是基于图像特征进行相似度匹配,按照相似度从大到小的顺序,将图像检索的相似图像返回。对于不同距离或不同视角下同一拍摄目标的图像,由于图像特征高度相似,检索结果中这些图像的排序混乱。
发明内容
本申请提供了一种图像排序方法、电子设备、计算机程序产品及计算机可读存储介质,目的在于解决图像检索结果中相似图像排序混乱的问题。
第一方面,本申请提供了一种图像排序方法,包括:获取第一图像集合,该第一图像集合包括多个待排序图像,该待排序图像为根据查询图像检索得到的图像;根据该每个待排序图像和该查询图像之间匹配的第一特征点,计算对应该待排序图像和该查询图像的共视比例,该第一特征点包括目标图像中与该查询图像匹配的特征点,以及该查询图像中与该目标图像匹配的特征点,该目标图像为当前一次计算该共视比例的该待排序图像,该共视比例是指两张图像之间匹配的特征点分布在该两张图像中的匹配区域与该匹配区域所属图像的预设区域的面积比例;根据该共视比例对该多个待排序图像进行排序。
本申请中,通过在检索得到与查询图像的图像特征相似的待排序图像后,根据待排序图像和查询图像之间匹配的第一特征点,计算得到反映特征点分布的共视比例;最后根据该共视比例对该待排序图像进行排序,达到根据图像的特征点分布对检索结果进行进一步排序的效果,排序精度更高。
在一种可能的实现中,该根据该每个待排序图像和该查询图像之间匹配的第一特征点,计算对应该待排序图像和该查询图像的共视比例,包括:根据该第一特征点确定该目标图像中的第一匹配区域,以及该查询图像中的第二匹配区域;其中,该第一匹配区域为该目标图像中该第一特征点所在的区域块,该第二匹配区域为该查询图像中该第一特征点所在的区域块;采用该第一匹配区域和该第二匹配区域中的更小者,计算该共视比例。
本申请中,通过将更小的匹配区域图像确定为计算共视比例的共视区域,能够使得该共视比例更准确地反映待排序图像与查询图像之间的相似度,根据该共视比例排序得到的排序结果精度更高。
在一种可能的实现中,该采用该第一匹配区域和该第二匹配区域中的更小者,计算该共视比例,包括:若该第一匹配区域小于该第二匹配区域,则计算该第一匹配区域和该目标图像的面积比例,得到该共视比例;若该第一匹配区域大于该第二匹配区域,则计算该第二匹配区域和该查询图像的面积比例,得到该共视比例。
本申请中,通过计算匹配区域和原图像的面积之比作为共视比例,能够直观地反映出匹配特征点在原图像中的分布情况,计算得到的共视比例反映出的目标图像和查询图像之间的相似度更准确。
在一种可能的实现中,该采用该第一匹配区域和该第二匹配区域中的更小者,计算该共视比例,包括:若该第一匹配区域小于该第二匹配区域,则计算该第一匹配区域和该目标图像的第一特征区域的面积比例,得到该共视比例;其中,该第一特征区域为该目标图像中第二特征点所在的区域块,该第二特征点为该目标图像与该目标图像自身之间匹配的特征点;若该第一匹配区域大于该第二匹配区域,则计算该第二匹配区域和该查询图像的第二特征区域的面积比例,得到该共视比例;其中,该第二特征区域为该查询图像中第三特征点所在的区域块,该第三特征点为该查询图像与该查询图像自身之间匹配的特征点。
本申请中,通过计算匹配区域和特征区域的面积之比作为共视比例,能够排除图像中空白区域或无特征区域的影响,以更准确地反映出的目标图像和查询图像之间的匹配特征点分布情况的相似度。
在一种可能的实现中,该根据该第一特征点确定该目标图像中的第一匹配区域,以及该查询图像中的第二匹配区域,包括:将该目标图像和该查询图像分别分割为N个和M个区域块,其中,每个该区域块的大小相同,N和M为大于0的整数;将存在该第一特征点的区域块确定为该第一匹配区域或该第二匹配区域。
本申请中,通过以大小相同的单位区域块中是否存在第一特征点确定该单位区域块是否属于匹配区域,能够更好地反映匹配特征点的分布情况,同时便于面积计数。
在一种可能的实现中,在该根据该共视比例对该多个待排序图像进行排序之前,该方法还包括:删除第一图像集合中该共视比例低于第一阈值的该待排序图像。
本申请中,通过删除共视比例低于第一阈值的待排序图像,能够减少排序的计算量,提高检索结果中候选图像的质量;候选图像的数量更少,以该检索结果中的候选图像作为其他算法的输入时,能够减少对应算法的计算量和运算时间。
在一种可能的实现中,所述根据所述共视比例对所述多个待排序图像进行排序,包括:按照所述共视比例由大到小对所述第一图像集合中的待排序图像进行排序,得到排序结果;在所述根据所述共视比例对所述多个待排序图像进行排序之后,所述方法还包括:将所述排序结果中的前P个图像输入图像定位算法或位姿估计算法,P为大于0的整数。
本申请实施例中,在得到相似度从高到底排序的图像序列后,可以选取其中的前N张图像作为其他算法的输入,能够提高该算法的精度,同时减少该算法的运算量和运算时间。
第二方面,提供了一种图像排序装置,包括用于执行第一方面中任一种方法的单元。该装置可以是电子设备,也可以是电子设备内的芯片。该装置可以包括输入单元和处理单元。
当该装置是电子设备时,该处理单元可以是处理器,该输入单元可以是通信接口;该电子设备还可以包括存储器,该存储器用于存储计算机程序代码,当该处理器执行该存储器所存储的计算机程序代码时,使得该电子设备执行第一方面中的任一种方法。
当该装置是电子设备内的芯片时,该处理单元可以是芯片内部的处理单元,该输入单元可以是输出接口、管脚或电路等;该芯片还可以包括存储器,该存储器可以是该芯片内的存储器(例如,寄存器、缓存等),也可以是位于该芯片外部的存储器(例如,只读存储器、随机存取存储器等);该存储器用于存储计算机程序代码,当该处理器执行该存储器所存储的计算机程序代码时,使得该芯片执行第一方面中的任一种方法。
第三方面,提供了一种电子设备,包括电子设备包括处理器,该处理器用于与存储器耦合,并读取存储器中的指令并根据该指令使得电子设备执行第一方面中的任一种方法。
第四方面,提供了一种计算机可读存储介质,该计算机可读存储介质中存储了计算机程序,当该计算机程序被处理器执行时,使得该处理器执行第一方面中的任一种方法。
第五方面,提供了一种计算机程序产品,包括:计算机程序代码,当该计算机程序代码被处理器执行时,使得该处理器执行执行第一方面中的任一种方法。
附图说明
图1为本申请实施例提供的一种电子设备的结构示意图;
图2为本申请实施例提供的一种电子设备的软件框图;
图3为本申请实施例提供的一种图像排序方法的流程示意图;
图4为本申请实施例提供的一种图像检索方法的流程示意图;
图5为本申请实施例提供的一种查询图像和目标图像的对比示意图;
图6为本申请实施例提供的一种计算共视比例的流程示意图;
图7为本申请实施例提供的一种图像排序装置的结构框图;
图8为本申请实施例提供的一种电子设备的结构框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。以下实施例中所使用的术语只是为了描述特定实施例的目的,而并非旨在作为对本申请的限制。如在本申请的说明书和所附权利要求书中所使用的那样,单数表达形式“一个”、“一种”、“所述”、“上述”、“该”和“这一”旨在也包括例如“一个或多个”这种表达形式,除非其上下文中明确地有相反指示。还应当理解,在本申请实施例中,“一个或多个”是指一个、两个或两个以上;“和/或”,描述关联对象的关联关系,表示可以存在三种关系;例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B的情况,其中A、B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。
在本说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
本申请实施例涉及的多个,是指大于或等于两个。需要说明的是,在本申请实施例的描述中,“第一”、“第二”等词汇,仅用于区分描述的目的,而不能理解为指示或暗示相对重要性,也不能理解为指示或暗示顺序。
本申请实施例提供的图像排序方法,可以应用于电子设备100。
在一些实施例中,电子设备100可以是手机、平板电脑、桌面型、膝上型、笔记本电脑、超级移动个人计算机(ultra-mobile personal computer,UMPC)、手持计算机、上网本、个人数字助理(personal digital assistant,PDA)、可穿戴电子设备、智能手表等设备,本申请实施例对上述电子设备的具体形式不做特殊限制。在本实施例中,电子设备100的结构可以如图1所示。
如图1所示,电子设备100可以包括处理器110,外部存储器接口120,内部存储器121,通用串行总线(universal serial bus,USB)接口130,充电管理模块140,电源管理模块141,电池142,天线1,天线2,移动通信模块150,无线通信模块160,音频模块170,扬声器170A,受话器170B,麦克风170C,耳机接口170D,传感器模块180,按键190,马达191,指示器192,摄像头193,显示屏194,以及用户标识模块(subscriber identification module,SIM)卡接口195等。其中传感器模块180可以包括压力传感器180A,陀螺仪传感器180B,气压传感器180C,磁传感器180D,加速度传感器180E,距离传感器180F,接近光传感器180G,指纹传感器180H,温度传感器180J,触摸传感器180K,环境光传感器180L,骨传导传感器180M等。
可以理解的是,本实施例示意的结构并不构成对电子设备100的具体限定。在另一些实施例中,电子设备100可以包括比图示更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件,软件或软件和硬件的组合实现。
处理器110可以包括一个或多个处理单元,例如:处理器110可以包括应用处理器(application processor,AP),调制解调处理器,图形处理器(graphics processingunit,GPU),图像信号处理器(image signal processor,ISP),控制器,视频编解码器,数字信号处理器(digital signal processor,DSP),基带处理器,和/或神经网络处理器(neural-network processing unit,NPU)等。其中,不同的处理单元可以是独立的器件,也可以集成在一个或多个处理器中。
其中,控制器可以是电子设备100的神经中枢和指挥中心。控制器可以根据指令操作码和时序信号,产生操作控制信号,完成取指令和执行指令的控制。
处理器110中还可以设置存储器,用于存储指令和数据。在一些实施例中,处理器110中的存储器为高速缓冲存储器。该存储器可以保存处理器110刚用过或循环使用的指令或数据。如果处理器110需要再次使用该指令或数据,可从所述存储器中直接调用。避免了重复存取,减少了处理器110的等待时间,因而提高了***的效率。
在一些实施例中,处理器110可以包括一个或多个接口。接口可以包括集成电路(inter-integrated circuit,I2C)接口,集成电路内置音频(inter-integrated circuitsound,I2S)接口,脉冲编码调制(pulse code modulation,PCM)接口,通用异步收发传输器(universal asynchronous receiver/transmitter,UART)接口,移动产业处理器接口(mobile industry processor interface,MIPI),通用输入输出(general-purposeinput/output,GPIO)接口,SIM接口,和/或USB接口等。
I2C接口是一种双向同步串行总线,包括一根串行数据线(serial data line,SDA)和一根串行时钟线(derail clock line,SCL)。在一些实施例中,处理器110可以包含多组I2C总线。处理器110可以通过不同的I2C总线接口分别耦合触摸传感器180K,充电器,闪光灯,摄像头193等。例如:处理器110可以通过I2C接口耦合触摸传感器180K,使处理器110与触摸传感器180K通过I2C总线接口通信,实现电子设备100的触摸功能。
I2S接口可以用于音频通信。在一些实施例中,处理器110可以包含多组I2S总线。处理器110可以通过I2S总线与音频模块170耦合,实现处理器110与音频模块170之间的通信。在一些实施例中,音频模块170可以通过I2S接口向无线通信模块160传递音频信号,实现通过蓝牙耳机接听电话的功能。
PCM接口也可以用于音频通信,将模拟信号抽样,量化和编码。在一些实施例中,音频模块170与无线通信模块160可以通过PCM总线接口耦合。在一些实施例中,音频模块170也可以通过PCM接口向无线通信模块160传递音频信号,实现通过蓝牙耳机接听电话的功能。所述I2S接口和所述PCM接口都可以用于音频通信。
UART接口是一种通用串行数据总线,用于异步通信。该总线可以为双向通信总线。它将要传输的数据在串行通信与并行通信之间转换。在一些实施例中,UART接口通常被用于连接处理器110与无线通信模块160。例如:处理器110通过UART接口与无线通信模块160中的蓝牙模块通信,实现蓝牙功能。在一些实施例中,音频模块170可以通过UART接口向无线通信模块160传递音频信号,实现通过蓝牙耳机播放音乐的功能。
MIPI接口可以被用于连接处理器110与显示屏194,摄像头193等***器件。MIPI接口包括摄像头串行接口(camera serial interface,CSI),显示屏串行接口(displayserial interface,DSI)等。在一些实施例中,处理器110和摄像头193通过CSI接口通信,实现电子设备100的拍摄功能。处理器110和显示屏194通过DSI接口通信,实现电子设备100的显示功能。
GPIO接口可以通过软件配置。GPIO接口可以被配置为控制信号,也可被配置为数据信号。在一些实施例中,GPIO接口可以用于连接处理器110与摄像头193,显示屏194,无线通信模块160,音频模块170,传感器模块180等。GPIO接口还可以被配置为I2C接口,I2S接口,UART接口,MIPI接口等。
USB接口130是符合USB标准规范的接口,具体可以是Mini USB接口,Micro USB接口,USB Type C接口等。USB接口130可以用于连接充电器为电子设备100充电,也可以用于电子设备100与***设备之间传输数据。也可以用于连接耳机,通过耳机播放音频。该接口还可以用于连接其他电子设备,例如AR设备等。
可以理解的是,本实施例示意的各模块间的接口连接关系,只是示意性说明,并不构成对电子设备100的结构限定。在本申请实施例的另一些情况中,电子设备100也可以采用上述实施例中不同的接口连接方式,或多种接口连接方式的组合。
充电管理模块140用于从充电器接收充电输入。其中,充电器可以是无线充电器,也可以是有线充电器。在一些有线充电的实施例中,充电管理模块140可以通过USB接口130接收有线充电器的充电输入。在一些无线充电的实施例中,充电管理模块140可以通过电子设备100的无线充电线圈接收无线充电输入。充电管理模块140为电池142充电的同时,还可以通过电源管理模块141为电子设备供电。
电源管理模块141用于连接电池142,充电管理模块140与处理器110。电源管理模块141接收电池142和/或充电管理模块140的输入,为处理器110,内部存储器121,显示屏194,摄像头193,和无线通信模块160等供电。电源管理模块141还可以用于监测电池容量,电池循环次数,电池健康状态(漏电,阻抗)等参数。在其他一些实施例中,电源管理模块141也可以设置于处理器110中。在另一些实施例中,电源管理模块141和充电管理模块140也可以设置于同一个器件中。
电子设备100的无线通信功能可以通过天线1,天线2,移动通信模块150,无线通信模块160,调制解调处理器以及基带处理器等实现。
天线1和天线2用于发射和接收电磁波信号。电子设备100中的每个天线可用于覆盖单个或多个通信频带。不同的天线还可以复用,以提高天线的利用率。例如:可以将天线1复用为无线局域网的分集天线。在另外一些实施例中,天线可以和调谐开关结合使用。
移动通信模块150可以提供应用在电子设备100上的包括2G/3G/4G/5G等无线通信的解决方案。移动通信模块150可以包括至少一个滤波器,开关,功率放大器,低噪声放大器(low noise amplifier,LNA)等。移动通信模块150可以由天线1接收电磁波,并对接收的电磁波进行滤波,放大等处理,传送至调制解调处理器进行解调。移动通信模块150还可以对经调制解调处理器调制后的信号放大,经天线1转为电磁波辐射出去。在一些实施例中,移动通信模块150的至少部分功能模块可以被设置于处理器110中。在一些实施例中,移动通信模块150的至少部分功能模块可以与处理器110的至少部分模块被设置在同一个器件中。
调制解调处理器可以包括调制器和解调器。其中,调制器用于将待发送的低频基带信号调制成中高频信号。解调器用于将接收的电磁波信号解调为低频基带信号。随后解调器将解调得到的低频基带信号传送至基带处理器处理。低频基带信号经基带处理器处理后,被传递给应用处理器。应用处理器通过音频设备(不限于扬声器170A,受话器170B等)输出声音信号,或通过显示屏194显示图像或视频。在一些实施例中,调制解调处理器可以是独立的器件。在另一些实施例中,调制解调处理器可以独立于处理器110,与移动通信模块150或其他功能模块设置在同一个器件中。
无线通信模块160可以提供应用在电子设备100上的包括无线局域网(wirelesslocal area networks,WLAN)(如无线保真(wireless fidelity,Wi-Fi)网络),蓝牙(bluetooth,BT),全球导航卫星***(global navigation satellite system,GNSS),调频(frequency modulation,FM),近距离无线通信技术(near field communication,NFC),红外技术(infrared,IR)等无线通信的解决方案。无线通信模块160可以是集成至少一个通信处理模块的一个或多个器件。无线通信模块160经由天线2接收电磁波,将电磁波信号调频以及滤波处理,将处理后的信号发送到处理器110。无线通信模块160还可以从处理器110接收待发送的信号,对其进行调频,放大,经天线2转为电磁波辐射出去。
在一些实施例中,电子设备100的天线1和移动通信模块150耦合,天线2和无线通信模块160耦合,使得电子设备100可以通过无线通信技术与网络以及其他设备通信。所述无线通信技术可以包括全球移动通讯***(global system for mobile communications,GSM),通用分组无线服务(general packet radio service,GPRS),码分多址接入(codedivision multiple access,CDMA),宽带码分多址(wideband code division multipleaccess,WCDMA),时分码分多址(time-division code division multiple access,TD-SCDMA),长期演进(long term evolution,LTE),BT,GNSS,WLAN,NFC ,FM,和/或IR技术等。所述GNSS可以包括全球卫星定位***(global positioning system ,GPS),全球导航卫星***(global navigation satellite system,GLONASS),北斗卫星导航***(beidounavigation satellite system,BDS),准天顶卫星***(quasi-zenith satellitesystem,QZSS)和/或星基增强***(satellite based augmentation systems,SBAS)。
电子设备100通过GPU,显示屏194,以及应用处理器等实现显示功能。GPU为图像处理的微处理器,连接显示屏194和应用处理器。GPU用于执行数学和几何计算,用于图形渲染。处理器110可包括一个或多个GPU,其执行程序指令以生成或改变显示信息。
显示屏194用于显示图像,视频等。显示屏194包括显示面板。显示面板可以采用液晶显示屏(liquid crystal display,LCD),有机发光二极管(organic light-emittingdiode,OLED),有源矩阵有机发光二极体或主动矩阵有机发光二极体(active-matrixorganic light emitting diode的,AMOLED),柔性发光二极管(flex light-emittingdiode,FLED),Miniled,MicroLed,Micro-oled,量子点发光二极管(quantum dot lightemitting diodes,QLED)等。在一些实施例中,电子设备100可以包括1个或N个显示屏194,N为大于1的正整数。
电子设备100的显示屏194上可以显示一系列图形用户界面(graphical userinterface,GUI),这些GUI都是该电子设备100的主屏幕。一般来说,电子设备100的显示屏194的尺寸是固定的,只能在该电子设备100的显示屏194中显示有限的控件。控件是一种GUI元素,它是一种软件组件,包含在应用程序中,控制着该应用程序处理的所有数据以及关于这些数据的交互操作,用户可以通过直接操作(direct manipulation)来与控件交互,从而对应用程序的有关信息进行读取或者编辑。一般而言,控件可以包括图标、按钮、菜单、选项卡、文本框、对话框、状态栏、导航栏、Widget等可视的界面元素。例如,在本申请实施例中,显示屏194可以显示虚拟按键(图像检索或图像定位)。
电子设备100可以通过ISP,摄像头193,视频编解码器,GPU,显示屏194以及应用处理器等实现拍摄功能。
ISP 用于处理摄像头193反馈的数据。例如,拍照时,打开快门,光线通过镜头被传递到摄像头感光元件上,光信号转换为电信号,摄像头感光元件将所述电信号传递给ISP处理,转化为肉眼可见的图像。ISP还可以对图像的噪点,亮度,肤色进行算法优化。ISP还可以对拍摄场景的曝光,色温等参数优化。在一些实施例中,ISP可以设置在摄像头193中。
摄像头193用于捕获静态图像或视频。物体通过镜头生成光学图像投射到感光元件。感光元件可以是电荷耦合器件(charge coupled device,CCD)或互补金属氧化物半导体(complementary metal-oxide-semiconductor,CMOS)光电晶体管。感光元件把光信号转换成电信号,之后将电信号传递给ISP转换成数字图像信号。ISP将数字图像信号输出到DSP加工处理。DSP将数字图像信号转换成标准的RGB,YUV等格式的图像信号。在一些实施例中,电子设备100可以包括1个或N个摄像头193,N为大于1的正整数。
数字信号处理器用于处理数字信号,除了可以处理数字图像信号,还可以处理其他数字信号。例如,当电子设备100在频点选择时,数字信号处理器用于对频点能量进行傅里叶变换等。
视频编解码器用于对数字视频压缩或解压缩。电子设备100可以支持一种或多种视频编解码器。这样,电子设备100可以播放或录制多种编码格式的视频,例如:动态图像专家组(moving picture experts group,MPEG)1,MPEG2,MPEG3,MPEG4等。
NPU为神经网络(neural-network,NN)计算处理器,通过借鉴生物神经网络结构,例如借鉴人脑神经元之间传递模式,对输入信息快速处理,还可以不断的自学习。通过NPU可以实现电子设备100的智能认知等应用,例如:图像识别,人脸识别,语音识别,文本理解等。
外部存储器接口120可以用于连接外部存储卡,例如Micro SD卡,实现扩展电子设备100的存储能力。外部存储卡通过外部存储器接口120与处理器110通信,实现数据存储功能。例如将音乐,视频等文件保存在外部存储卡中。
内部存储器121可以用于存储计算机可执行程序代码,所述可执行程序代码包括指令。处理器110通过运行存储在内部存储器121的指令,从而执行电子设备100的各种功能应用以及数据处理。例如,在本实施例中,处理器110可以通过执行存储在内部存储器121中的指令,进行图像检索、图像排序和/或图像定位。内部存储器121可以包括存储程序区和存储数据区。其中,存储程序区可存储操作***,至少一个功能所需的应用程序(比如声音播放功能,图像播放功能等)等。存储数据区可存储电子设备100使用过程中所创建的数据(比如音频数据,电话本等)等。此外,内部存储器121可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件,闪存器件,通用闪存存储器(universalflash storage,UFS)等。处理器110通过运行存储在内部存储器121的指令,和/或存储在设置于处理器中的存储器的指令,执行电子设备100的各种功能应用以及数据处理。
电子设备100可以通过音频模块170,扬声器170A,受话器170B,麦克风170C,耳机接口170D,以及应用处理器等实现音频功能。例如音乐播放,录音等。
音频模块170用于将数字音频信息转换成模拟音频信号输出,也用于将模拟音频输入转换为数字音频信号。音频模块170还可以用于对音频信号编码和解码。在一些实施例中,音频模块170可以设置于处理器110中,或将音频模块170的部分功能模块设置于处理器110中。
扬声器170A,也称“喇叭”,用于将音频电信号转换为声音信号。电子设备100可以通过扬声器170A收听音乐,或收听免提通话。
受话器170B,也称“听筒”,用于将音频电信号转换成声音信号。当电子设备100接听电话或语音信息时,可以通过将受话器170B靠近人耳接听语音。
麦克风170C,也称“话筒”,“传声器”,用于将声音信号转换为电信号。当拨打电话或发送语音信息时,用户可以通过人嘴靠近麦克风170C发声,将声音信号输入到麦克风170C。电子设备100可以设置至少一个麦克风170C。在另一些实施例中,电子设备100可以设置两个麦克风170C,除了采集声音信号,还可以实现降噪功能。在另一些实施例中,电子设备100还可以设置三个,四个或更多麦克风170C,实现采集声音信号,降噪,还可以识别声音来源,实现定向录音功能等。
耳机接口170D用于连接有线耳机。耳机接口170D可以是USB接口130,也可以是3.5mm的开放移动电子设备平台(open mobile terminal platform,OMTP)标准接口,美国蜂窝电信工业协会(cellular telecommunications industry association of the USA,CTIA)标准接口。
压力传感器180A用于感受压力信号,可以将压力信号转换成电信号。在一些实施例中,压力传感器180A可以设置于显示屏194。压力传感器180A的种类很多,如电阻式压力传感器,电感式压力传感器,电容式压力传感器等。电容式压力传感器可以是包括至少两个具有导电材料的平行板。当有力作用于压力传感器180A,电极之间的电容改变。电子设备100根据电容的变化确定压力的强度。当有触摸操作作用于显示屏194,电子设备100根据压力传感器180A检测所述触摸操作强度。电子设备100也可以根据压力传感器180A的检测信号计算触摸的位置。在一些实施例中,作用于相同触摸位置,但不同触摸操作强度的触摸操作,可以对应不同的操作指令。例如:当有触摸操作强度小于第一压力阈值的触摸操作作用于短消息应用图标时,执行查看短消息的指令。当有触摸操作强度大于或等于第一压力阈值的触摸操作作用于短消息应用图标时,执行新建短消息的指令。
陀螺仪传感器180B可以用于确定电子设备100的运动姿态。在一些实施例中,可以通过陀螺仪传感器180B确定电子设备100围绕三个轴(即,x,y和z轴)的角速度。陀螺仪传感器180B可以用于拍摄防抖。示例性的,当按下快门,陀螺仪传感器180B检测电子设备100抖动的角度,根据角度计算出镜头模组需要补偿的距离,让镜头通过反向运动抵消电子设备100的抖动,实现防抖。陀螺仪传感器180B还可以用于导航,体感游戏场景。
气压传感器180C用于测量气压。在一些实施例中,电子设备100通过气压传感器180C测得的气压值计算海拔高度,辅助定位和导航。
磁传感器180D包括霍尔传感器。电子设备100可以利用磁传感器180D检测翻盖皮套的开合。在一些实施例中,当电子设备100是翻盖机时,电子设备100可以根据磁传感器180D检测翻盖的开合。进而根据检测到的皮套的开合状态或翻盖的开合状态,设置翻盖自动解锁等特性。
加速度传感器180E可检测电子设备100在各个方向上(一般为三轴)加速度的大小。当电子设备100静止时可检测出重力的大小及方向。还可以用于识别电子设备姿态,应用于横竖屏切换,计步器等应用。
距离传感器180F,用于测量距离。电子设备100可以通过红外或激光测量距离。在一些实施例中,拍摄场景,电子设备100可以利用距离传感器180F测距以实现快速对焦。
接近光传感器180G可以包括例如发光二极管(LED)和光检测器,例如光电二极管。发光二极管可以是红外发光二极管。电子设备100通过发光二极管向外发射红外光。电子设备100使用光电二极管检测来自附近物体的红外反射光。当检测到充分的反射光时,可以确定电子设备100附近有物体。当检测到不充分的反射光时,电子设备100可以确定电子设备100附近没有物体。电子设备100可以利用接近光传感器180G检测用户手持电子设备100贴近耳朵通话,以便自动熄灭屏幕达到省电的目的。接近光传感器180G也可用于皮套模式,口袋模式自动解锁与锁屏。
环境光传感器180L用于感知环境光亮度。电子设备100可以根据感知的环境光亮度自适应调节显示屏194亮度。环境光传感器180L也可用于拍照时自动调节白平衡。环境光传感器180L还可以与接近光传感器180G配合,检测电子设备100是否在口袋里,以防误触。
指纹传感器180H用于采集指纹。电子设备100可以利用采集的指纹特性实现指纹解锁,访问应用锁,指纹拍照,指纹接听来电等。
温度传感器180J用于检测温度。在一些实施例中,电子设备100利用温度传感器180J检测的温度,执行温度处理策略。例如,当温度传感器180J上报的温度超过阈值,电子设备100执行降低位于温度传感器180J附近的处理器的性能,以便降低功耗实施热保护。在另一些实施例中,当温度低于另一阈值时,电子设备100对电池142加热,以避免低温导致电子设备100异常关机。在其他一些实施例中,当温度低于又一阈值时,电子设备100对电池142的输出电压执行升压,以避免低温导致的异常关机。
触摸传感器180K,也称“触控器件”。触摸传感器180K可以设置于显示屏194,由触摸传感器180K与显示屏194组成触摸屏,也称“触控屏”。触摸传感器180K用于检测作用于其上或附近的触摸操作。触摸传感器可以将检测到的触摸操作传递给应用处理器,以确定触摸事件类型。可以通过显示屏194提供与触摸操作相关的视觉输出。在另一些实施例中,触摸传感器180K也可以设置于电子设备100的表面,与显示屏194所处的位置不同。
骨传导传感器180M可以获取振动信号。在一些实施例中,骨传导传感器180M可以获取人体声部振动骨块的振动信号。骨传导传感器180M也可以接触人体脉搏,接收血压跳动信号。在一些实施例中,骨传导传感器180M也可以设置于耳机中,结合成骨传导耳机。音频模块170可以基于所述骨传导传感器180M获取的声部振动骨块的振动信号,解析出语音信号,实现语音功能。应用处理器可以基于所述骨传导传感器180M获取的血压跳动信号解析心率信息,实现心率检测功能。
按键190包括开机键,音量键等。按键190可以是机械按键。也可以是触摸式按键。电子设备100可以接收按键输入,产生与电子设备100的用户设置以及功能控制有关的键信号输入。
马达191可以产生振动提示。马达191可以用于来电振动提示,也可以用于触摸振动反馈。例如,作用于不同应用(例如拍照,音频播放等)的触摸操作,可以对应不同的振动反馈效果。作用于显示屏194不同区域的触摸操作,马达191也可对应不同的振动反馈效果。不同的应用场景(例如:时间提醒,接收信息,闹钟,游戏等)也可以对应不同的振动反馈效果。触摸振动反馈效果还可以支持自定义。
指示器192可以是指示灯,可以用于指示充电状态,电量变化,也可以用于指示消息,未接来电,通知等。
SIM卡接口195用于连接SIM卡。SIM卡可以通过***SIM卡接口195,或从SIM卡接口195拔出,实现和电子设备100的接触和分离。电子设备100可以支持1个或N个SIM卡接口,N为大于1的正整数。SIM卡接口195可以支持Nano SIM卡,Micro SIM卡,SIM卡等。同一个SIM卡接口195可以同时***多张卡。所述多张卡的类型可以相同,也可以不同。SIM卡接口195也可以兼容不同类型的SIM卡。SIM卡接口195也可以兼容外部存储卡。电子设备100通过SIM卡和网络交互,实现通话以及数据通信等功能。在一些实施例中,电子设备100采用eSIM,即:嵌入式SIM卡。eSIM卡可以嵌在电子设备100中,不能和电子设备100分离。
另外,在上述部件之上,运行有操作***。例如苹果公司所开发的iOS操作***,谷歌公司所开发的Android开源操作***,微软公司所开发的Windows操作***等。在该操作***上可以安装运行应用程序。
电子设备100的操作***可以采用分层架构,事件驱动架构,微核架构,微服务架构,或云架构。本申请实施例以分层架构的Android***为例,示例性说明电子设备100的软件结构。
图2是本申请实施例的电子设备100的软件结构框图。
分层架构将软件分成若干个层,每一层都有清晰的角色和分工。层与层之间通过软件接口通信。在一些实施例中,将Android***分为四层,从上至下分别为应用程序层,应用程序框架层,安卓运行时(Android runtime)和***库,以及内核层。
应用程序层可以包括一系列应用程序包。如图2所示,应用程序包可以包括相机,图库,日历,通话,地图,导航,WLAN,蓝牙,音乐,视频,短信息等应用程序。例如,在本申请实施例中,应用程序包还可以包括专用的图像检索应用、图像定位应用,或包含图像检索功能和图像定位功能的社交应用。在用户需要进行图像检索或图像定位时,上述应用可以访问应用程序框架层提供的图像检索接口或图像定位接口管理服务。
应用程序框架层为应用程序层的应用程序提供应用编程接口(applicationprogramming interface,API)和编程框架。应用程序框架层包括一些预先定义的函数。如图2所示,应用程序框架层可以包括窗口管理器,内容提供器,视图***,电话管理器,资源管理器,通知管理器等。例如,在本申请实施例中,应用程序框架层可以为应用程序层提供图像检索、图像排序或图像定位功能相关的API,并为应用程序层提供接口管理服务,以实现场景编排功能。
窗口管理器用于管理窗口程序。窗口管理器可以获取显示屏大小,判断是否有状态栏,锁定屏幕,截取屏幕等。
内容提供器用来存放和获取数据,并使这些数据可以被应用程序访问。所述数据可以包括视频,图像,音频,拨打和接听的电话,浏览历史和书签,电话簿等。
视图***包括可视控件,例如显示文字的控件,显示图片的控件等。视图***可用于构建应用程序。显示界面可以由一个或多个视图组成的。例如,包括短信通知图标的显示界面,可以包括显示文字的视图以及显示图片的视图。
电话管理器用于提供电子设备100的通信功能。例如通话状态的管理(包括接通,挂断等)。
资源管理器为应用程序提供各种资源,比如本地化字符串,图标,图片,布局文件,视频文件等等。
通知管理器使应用程序可以在状态栏中显示通知信息,可以用于传达告知类型的消息,可以短暂停留后自动消失,无需用户交互。比如通知管理器被用于告知下载完成,消息提醒等。通知管理器还可以是以图表或者滚动条文本形式出现在***顶部状态栏的通知,例如后台运行的应用程序的通知,还可以是以对话窗口形式出现在屏幕上的通知。例如在状态栏提示文本信息,发出提示音,电子设备振动,指示灯闪烁等。
Android Runtime包括核心库和虚拟机。Android runtime负责安卓***的调度和管理。
核心库包含两部分:一部分是java语言需要调用的功能函数,另一部分是安卓的核心库。
应用程序层和应用程序框架层运行在虚拟机中。虚拟机将应用程序层和应用程序框架层的java文件执行为二进制文件。虚拟机用于执行对象生命周期的管理,堆栈管理,线程管理,安全和异常的管理,以及垃圾回收等功能。
***库可以包括多个功能模块。例如:表面管理器(surface manager),媒体库(Media Libraries),三维图形处理库(例如:OpenGL ES),2D图形引擎(例如:SGL)等。
表面管理器用于对显示子***进行管理,并且为多个应用程序提供了2D和3D图层的融合。
媒体库支持多种常用的音频,视频格式回放和录制,以及静态图像文件等。媒体库可以支持多种音视频编码格式,例如: MPEG4,H.264,MP3,AAC,AMR,JPG,PNG等。
三维图形处理库用于实现三维图形绘图,图像渲染,合成,和图层处理等。
2D图形引擎是2D绘图的绘图引擎。
内核层是硬件和软件之间的层。内核层至少包含显示驱动,摄像头驱动,音频驱动,传感器驱动。
需要说明的是,本申请实施例虽然以Android***为例进行说明,但是其基本原理同样适用于基于iOS或Windows等操作***的电子设备。
下面结合具体场景,示例性说明电子设备100的硬件***和软件***的工作流程。
当用户在触摸传感器180K上进行触摸操作时,相应的硬件中断被发送至内核层,内核层将触摸操作加工成原始输入事件,原始输入事件例如包括触摸坐标和触摸操作的时间戳等信息。原始输入事件被存储在内核层,应用程序框架层从内核层获取原始输入事件,识别出原始输入事件对应的控件,并通知该控件对应的应用程序(application,APP)。例如,上述触摸操作为单击操作,上述控件对应的APP为相机APP,相机APP被单击操作唤醒后,可以通过API调用内核层的摄像头驱动,通过摄像头驱动控制摄像头193进行拍摄。
应用场景一
当用户打开搜索APP,想要根据电子设备中的图像搜索类似图像时,电子设备响应于用户选择的查询图像,从互联网或该搜索APP的图像数据库中检索与该查询图像的相似图像,并按照相似度由高到低的顺序通过电子设备的显示屏进行显示。
然而,采用现有的图像检索算法进行图像检索时,电子设备将基于图像特征进行相似度匹配,对于图像特征高度相似的图像,例如不同距离或不同视角下拍摄同一目标的多张图像,电子设备难以进一步排序,造成检索结果中的相似度排序混乱,用户体验不佳。
应用场景二
当用户打开社交APP拍摄景物图像后,想要发布该景物图像并显示自身位置时,电子设备可以响应于该景物图像,从互联网数据库中检索该景物图像,并根据检索结果中的多张图像通过视觉定位***/服务(visual positioning system/service,VPS)确定该景物图像对应的位置信息;最后电子设备可以将该景物图像和该位置信息通过电子设备的显示屏进行显示,以便用户确认是否发布。
然而,采用现有的图像检索算法得到的图像虽然包含于该景物图像特征高度相似的内容,但是其中也可能包含大量的干扰信息,例如该景物图像为金字塔,而检索结果中的较多图像除了金字塔外还包含了狮身人面兽建筑,则电子设备采用检索结果进行定位时,最后可能基于狮身人面兽进行定位,造成定位错误,用户体验不佳。
基于此,本申请实施例提供了一种图像排序方法。
应理解,上述为对应用场景的举例说明,并不对本申请的应用场景作任何限定。
下面结合图3至图6对本申请实施例提供的图像处理方法进行详细描述。
请参阅图3,图3为本申请实施例提供的一种图像排序方法的流程示意图,具体包括步骤301至303。
301、获取第一图像集合。
其中,第一图像集合包括多个待排序图像,每个待排序图像为根据查询图像检索到的图像。
进一步地,每个待排序图像与查询图像之间匹配的特征点的数量大于或等于第二阈值。在一种可能的实现中,获取第一图像集合包括:根据查询图像检索图像数据库,得到第二图像集合,该第二图像集合中包括多个候选图像;删除该第二图像集合中与该查询图像之间的匹配特征点少于第二阈值的候选图像,得到第一图像集合。
其中,查询图像是指用户提供的源图像,设备通过该源图像查询搜索与该源图像相似的图像,从而得到该待排序图像。查询图像具体可以是用户通过电子设备的摄像头拍摄的图像,也可以用户是从电子设备的数据库中选择的图像,第二图像集合可以是根据该查询图像从数据库中检索得到的候选图像集合。
其中,该图像数据库可以是互联网中的公开数据库,也可以是某一APP的私有数据库。
其中,第二阈值可以是预先设置的特征点数量阈值,也可以是根据查询图像的特征点数量确定的阈值,用于筛选第二图像集合中与查询图像更相似的候选图像。
本申请中,电子设备可以通过检索算法检索图像数据库,得到相似评分较高的多个候选图像;再从候选图像中获取匹配的特征点数量大于第二阈值的图像作为待排序图像,以提高最终第一图像集合中待排序图像与查询图像之间的相似度,能够避免特例图像对图像排序进行干扰。例如,查询图像的局部特写图像,该局部特写图像与查询图像的匹配特征点在该局部特写图像中均匀分布,在特定方式下计算得到的共视比例高,但是整体相似度低,可能会对图像排序结果造成干扰,造成排序混乱。
在另一种可能的实现中,电子设备根据查询图像检索得到第一图像集合的流程可以参照图4,图4为本申请实施例提供的一种图像检索方法,包括步骤401至步骤404。
401、图像预处理。
其中,在电子设备获取该查询图像和数据库图像集后,可以先判断该查询图像以及该数据库图像集中的数据库图像是否符合预设图像尺寸的要求。该预设尺寸可以为图像边长的最大值,例如预设最大边长为640像素,也可以为图像的高和宽,例如预设尺寸为640*480像素。
在一种可能的实现中,该预设尺寸为图像边长;若某一图像的高或宽大于该预设边长,则将该图像的高或宽按比例缩小为预设尺寸;若小于该预设尺寸,则将无需进行预处理。
在另一种可能的实现中,该预设尺寸为图像的高和宽;若某一图像的高和宽与预设尺寸不一致,则将该图像按比例进行拉伸,使得该图像的高和宽为符合预设尺寸。
可以理解的是,该预设尺寸的设置与后续的特征提取与匹配的算法相关;通过调整图像尺寸,便于后续图像的特征提取。
402、图像局部特征提取。
其中,电子设备在得到符合预设尺寸要求的查询图像和数据库图像后,可以分别提取查询图像的第一特征点和数据库图像的第二特征点。
具体地,电子设备可以通过尺度不变特征变换(scale-invariant featuretransform,SIFT)算法或超级点(super point)算法进行图像特征提取。
以SIFT算法为例,电子设备可以先构建图像的尺度空间,建立对应的图像金字塔,其中,图像金字塔中的每一层为不同尺度下的图像;再检测尺度空间中的特征点,例如在尺度空间中的一个点,与同尺度的8个相邻点以及相邻尺度的18个相邻点相比,该点为最大值或最小值时,可以确定该点为特征点;然后可以去除低对比度和不稳定的特征点;最后通过给该极值点赋值,生成对应的特征点描述子。
可以理解的是,上述SIFT算法和super point算法仅为举例,实际应用中可以采用其他特征提取算法,此处不作具体限定。
403、图像局部特征匹配。
其中,电子设备在提取得到查询图像的第一特征点和数据库图像的第二特征点后,可以匹配该第一特征点和该第二特征点,得到所有数据库图像和查询图像匹配的特征点。
具体地,电子设备可以通过super glue算法或SIFT算法进行特征匹配。
以SIFT算法为例,在提取得到两张图像的特征点后,可以将该两张图像的特征点描述子进行匹配;具体地,可以根据特征点描述子生成对应的SIFT特征向量,再采用该特征向量的欧式距离来作为两幅图像中关键点的相似性判定度量。例如,取查询图像中的某个特征点,并找出其与数据库图像中欧式距离最近的前两个特征点,在这两个特征点中,如果最近的距离除以次近的距离小于预设比例阈值,则确定查询图像中的该特征点与数据库图像中的该欧式距离最近的特征点为匹配特征点。
可以理解的是,上述SIFT算法和super glue算法仅为举例,实际应用中可以采用其他特征提取算法,此处不作具体限定。
404、剔除外点。
其中,外点(outlier)是指匹配点对中的异常点对,使用外点作为算法输入会引起误差,降低算法精度。特征点匹配过程中会产生外点,通常有两类,第一类主要是由错误的特征匹配引起的;而第二类则来自环境中的运动特征点,如果把运动特征点作为静态点来处理,就会导致算法结果的不一致。
具体地,电子设备可以通过随机抽样一致(random sample consensus,RANSAC)算法、鲁棒估计方法或该两者的结合剔除外点。
以RANSAC算法为例,电子设备可以随机选取一个匹配特征点作为假设内点;根据该假设内点拟合一个模型;判断剩余的匹配特征点是否符合拟合的模型,将其分为内点和外点;若内点过少则标记为无效迭代,根据该假设内点和上一步划分的内点重新拟合模型;计算所有内点的残差,根据残差和或者错误率重新评估模型。
电子设备可以迭代以上步骤,把具有最小残差和的或是最多内点数的模型作为最佳模型,再根据最佳模型获取对应的外点并剔除。
405、图像筛选。
其中,电子设备在剔除外点后,可以根据每张数据库图像与查询图像之间匹配的特征点的数量,从该数据库图像集中筛选得到待排序图像。
302、根据每个待排序图像和查询图像之间匹配的第一特征点,计算对应待排序图像和查询图像的共视比例。
其中,在获取得到第一图像集合时,电子设备可以同步获取所有待排序图像和查询图像之间匹配的第一特征点。
其中,共视比例是指两张图像之间匹配的特征点分布在该两张图像中的匹配区域与该匹配区域所属图像的预设区域的面积比例。
其中,第一特征点包括目标图像中与所述查询图像匹配的特征点,以及查询图像中与所述目标图像匹配的特征点,该目标图像为当前一次计算共视比例的待排序图像。
在获取第一图像集合后,电子设备可以逐个计算每个待排序图像和查询图像之间的共视比例。
在一种可能的实现中,电子设备可以根据该第一特征点确定目标图像中的第一匹配区域,以及查询图像中的第二匹配区域;最后采用第一匹配区域和第二匹配区域中的更小者,计算共视比例。
其中,第一匹配区域为目标图像中第一特征点所在的区域块,第二匹配区域为所述查询图像中第一特征点所在的区域块。
其中,电子设备可以将目标图像和查询图像分别分割为N个和M个区域块,每个区域块大小相同,该区域块可以为m*m大小的网格,也可以为半径为r的圆,还可以是其他形状的单位区域块,N和M为大于0的整数;最后将存在第一特征点的区域块确定为该第一匹配区域或该第二匹配区域。
具体地,电子设备可以通过计数统计目标图像中的第一匹配区域;该目标图像每有一个区域块存在第一特征点,则计数加1,以数值表示第一匹配区域的面积。第二匹配区域的计数同理。
可以理解的是,在目标图像和查询图像中,匹配的第一特征点数量是相同的,而通过将第一特征点所在的区域块作为匹配区域,能够通过匹配区域的大小直观地反映匹配特征点的分布情况;匹配区域越大则说明匹配特征点分布越离散,匹配区域越小则说明匹配特征点分布越集中。
本申请中,共视比例越高表示相似度越高,匹配区域的大小与共视比例成正比,因此采用更小的匹配区域计算共视比例,能够更准确地反映目标图像和查询图像的相似度。例如在查询图像中第一特征点均匀分布的情况下,第一匹配区域小于等于第二匹配区域,以第一匹配区域计算共视比例能够在同一标准的尺度下反映相似度;而在一些第一匹配区域大于第二匹配区域的特殊情况下,例如查询图像中包含大幅的空白导致第一特征点较为集中,而目标图像为查询图像中的非空白区域的特写图像时,采用更小的第二匹配区域计算共视比例也能够更好地反映出两张图像之间的相似度。
如图5所示,图5为查询图像和目标图像的对比示意图,该查询图像是在景物前50米拍摄的图像,目标图像A是在距离景物500米远拍摄的图像,目标图像B是在距离景物10米内拍摄的图像。其中,图像之间的虚线为第一特征点间的连接。可以理解的是,为使附图简洁,图中未示出所有第一特征点的连线。
可以看到,当计算查询图像和目标图像A的共视比例时,第一匹配区域小而第二匹配区域大,采用第一匹配区域计算共视比例,计算设备可以以第一特征点在目标图像A中所分布的区域反映与查询图像的相似度;当计算查询图像和目标图像B的共视比例时,第一匹配区域大而第二匹配区域小,采用第二匹配区域计算共视比例,计算设备可以以第一特征点在查询图像中所分布的区域反映与查询图像的相似度。
在另一些可能的实现中,电子设备可以仅计算上述第一匹配区域或上述第二匹配区域,并根据该第一匹配区域或该第二匹配区域计算共视比例。
在确定第一匹配区域和第二匹配区域后,且确定二者中的更小者作为共视区域后,电子设备可以进一步计算共视比例。
在一种可能的实现中,电子设备可以计算该共视区域和该共视区域所属图像的面积之比作为共视比例。
其中,若该第一匹配区域小于该第二匹配区域,则第一匹配区域为共视区域,电子设备计算该第一匹配区域和该目标图像的面积比例,得到该共视比例;具体地,该目标图像可以在前述计算第一匹配区域的步骤中被分割为N个区域块,N可以表示该目标图像的面积,因此,共视比例为第一匹配区域的区域计数和N之比。
若该第一匹配区域大于该第二匹配区域,则计算该第二匹配区域和该查询图像的面积比例,得到该共视比例。同理,M可以表示该查询图像的面积,该共视比例为第二匹配区域的区域计数和M之比。
在另一种可能的实现中,电子设备可以计算该共视区域和同一图像中的特征区域的面积之比作为共视比例。
具体可以参阅图6,图6为本申请实施例提供的一种共视比例的计算流程图,该计算流程包括步骤601至603。
601、计算匹配区域和特征区域。
其中,电子设备在确定目标图像后,可以先获取目标图像和查询图像之间匹配的第一特征点,并根据该第一特征点计算目标图像中的第一匹配区域A1和查询图像中的第二匹配区域A2。
然后,电子设备可以采用如图4所述的方法实施例中的步骤401至步骤403,获取目标图像和目标图像自身匹配的第二特征点,以及查询图像和查询图像自身匹配的第三特征点;再计算目标图像中的第二特征点所在的第一特征区域B1和查询图像中第三特征点所在的第二特征区域B2。
可以理解的是,上述计算区域面积的方法为统计对应特征点所在的区域块,具体与前述统计区域面积的方法相同,此处不作赘述。
602、判断第一匹配区域是否大于第二匹配区域。
在计算得到A1和A2后,电子设备可以通过比较A1和A2的大小,判断第一匹配区域是否大于第二匹配区域;再将较小的匹配区域作为共视区域,执行步骤603。
603、计算共视比例。
若A1大于A2,则计算第二匹配区域A2和第四特征区域B2的比值,得到共视比例C。
若A1小于A2,则计算第一匹配区域A1和第三特征区域B1的比值,得到共视比例C。
本申请中,通过计算匹配区域和对应特征区域之比作为共视比例,可以排除图像中空白区域或无特征点区域的干扰,得到的共视比例可以更准确地反映第二特征点在两张图像中的分布情况的相似度。
303、根据共视比例对该多个待排序图像进行排序。
其中,电子设备在得到每张待排序图像的共视比例后,可以将第一图像集合中的待排序图像按照共视比例由大到小进行排序。
在一种可能的实现中,电子设备可以先删除第一图像集合中共视比例低于第一阈值的待排序图像,再对剩余的待排序图像进行排序。
其中,第一阈值为预先设置的共视比例阈值。
在一种可能的实现中,电子设备在对该待排序图像排序之后,可以选取前P张图像作为输入图像集合,该输入图像集合用于作为其他算法的输入,P为大于0的整数。
其中,该其他算法可以为图像定位算法或位姿估计算法。
本申请实施例中,在得到相似度从高到底排序的图像序列后,可以选取其中的前N张图像作为其他算法的输入,能够提高该算法的精度,同时减少该算法的运算量和运算时间。
本申请实施例通过在检索得到与查询图像的图像特征相似的待排序图像后,根据待排序图像和查询图像之间匹配的特征点,计算得到反映特征点分布的共视比例;最后根据该共视比例对该待排序图像进行排序,达到根据图像的特征点分布对检索结果进行进一步排序的效果,解决了相似图像的排序精度低的问题。
请参阅图7,图7为本申请实施例提供的一种图像排序装置700的结构框图,该图像排序装置700包括:
获取单元701,用于获取第一图像集合,该第一图像集合包括多个待排序图像,该待排序图像为根据查询图像检索得到的图像;
计算单元702,用于根据该每个待排序图像和该查询图像之间匹配的第一特征点,计算对应该待排序图像和该查询图像的共视比例,该第一特征点包括目标图像中与该查询图像匹配的特征点,以及该查询图像中与该目标图像匹配的特征点,该目标图像为当前一次计算该共视比例的该待排序图像,该共视比例是指两张图像之间匹配的特征点分布在该两张图像中的匹配区域与该匹配区域所属图像的预设区域的面积比例;
排序单元703,用于根据该共视比例对该多个待排序图像进行排序。
在一种可能的实现中,该计算单元702具体用于:根据该第一特征点确定该目标图像中的第一匹配区域,以及该查询图像中的第二匹配区域;其中,该第一匹配区域为该目标图像中该第一特征点所在的区域块,该第二匹配区域为该查询图像中该第一特征点所在的区域块;采用该第一匹配区域和该第二匹配区域中的更小者,计算该共视比例。
在一种可能的实现中,该计算单元702具体用于:若该第一匹配区域小于该第二匹配区域,则计算该第一匹配区域和该目标图像的面积比例,得到该共视比例;若该第一匹配区域大于该第二匹配区域,则计算该第二匹配区域和该查询图像的面积比例,得到该共视比例。
在一种可能的实现中,该计算单元702具体用于:若该第一匹配区域小于该第二匹配区域,则计算该第一匹配区域和该目标图像的第一特征区域的面积比例,得到该共视比例;其中,该第一特征区域为该目标图像中第二特征点所在的区域块,该第二特征点为该目标图像与该目标图像自身之间匹配的特征点;若该第一匹配区域大于该第二匹配区域,则计算该第二匹配区域和该查询图像的第二特征区域的面积比例,得到该共视比例;其中,该第二特征区域为该查询图像中第三特征点所在的区域块,该第三特征点为该查询图像与该查询图像自身之间匹配的特征点。
在一种可能的实现中,该计算单元702具体用于:将该目标图像和该查询图像分别分割为N个和M个区域块,其中,每个区域块的大小相同,N和M为大于0的整数;将存在该第二特征点的区域块确定为该第一匹配区域或该第二匹配区域。
在一种可能的实现中,该装置还包括:删除单元704,用于删除第一图像集合中该共视比例低于第一阈值的该待排序图像。
在一种可能的实现中,该排序单元703具体用于:按照所述共视比例由大到小对所述第一图像集合中的待排序图像进行排序,得到排序结果;该装置还包括:输出单元705,将所述排序结果中的前P个图像输入图像定位算法或位姿估计算法,P为大于0的整数。
本实施例提供的图像排序装置700,用于执行上述实施例的图像排序方法,技术原理和技术效果相似,此处不再赘述。
需要说明的是,上述图像处理装置700以功能单元的形式体现。这里的术语“单元”可以通过软件和/或硬件形式实现,对此不作具体限定。
本申请实施例还提供了一种电子设备,包括上述处理器。本实施例提供的电子设备可以是图1所示的电子设备100,用于执行上述图像排序方法。在采用集成的单元的情况下,电子设备可以包括处理模块、存储模块和通信模块。其中,处理模块可以用于对电子设备的动作进行控制管理,例如,可以用于支持电子设备执行显示单元、检测单元和处理单元执行的步骤。存储模块可以用于支持电子设备执行存储程序代码和数据等。通信模块,可以用于支持电子设备与其它设备的通信。
其中,处理模块可以是处理器或控制器。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,数字信号处理(digital signal processing,DSP)和微处理器的组合等等。存储模块可以是存储器。通信模块具体可以为射频电路、蓝牙芯片、Wi-Fi芯片等与其它电子设备交互的设备。
在一个实施例中,当处理模块为处理器,存储模块为存储器时,本实施例所涉及的电子设备可以为具有图1所示结构的设备。
具体地,可以参阅图8,图8示出了本申请提供的另一电子设备的结构示意图。图8中的虚线表示该单元或该模块为可选的。电子设备800可用于实现上述方法实施例中描述的图像排序方法。
电子设备800包括一个或多个处理器801,该一个或多个处理器801可支持电子设备800实现上述方法实施例中的图像排序方法。
处理器801可以用于对电子设备800进行控制,执行软件程序,处理软件程序的数据。电子设备800还可以包括通信单元805,用以实现信号的输入(接收)和输出(发送)。
电子设备800中可以包括一个或多个存储器802,其上存有程序804,程序804可被处理器801运行,生成指令803,使得处理器801根据指令803执行上述方法实施例中描述的图像排序方法。
可选地,存储器802中还可以存储有数据。可选地,处理器801还可以读取存储器802中存储的数据,该数据可以与程序804存储在相同的存储地址,该数据也可以与程序804存储在不同的存储地址。
处理器801和存储器802可以单独设置,也可以集成在一起;例如,集成在终端设备的***级芯片(system on chip,SOC)上。
本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储了计算机程序,当所述计算机程序被处理器执行时,使得处理器执行上述任一实施例所述的图像排序方法。
该计算机可读存储介质例如是存储器802。存储器802可以是易失性存储器或非易失性存储器,或者,存储器802可以同时包括易失性存储器和非易失性存储器。其中,非易失性存储器可以是只读存储器(read-only memory,ROM)、可编程只读存储器(programmableROM,PROM)、可擦除可编程只读存储器(erasable PROM,EPROM)、电可擦除可编程只读存储器(electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(randomaccess memory,RAM),其用作外部高速缓存。可以理解的是,上述为示例性说明而非限制。
本申请实施例还提供了一种计算机程序产品,当该计算机程序产品在计算机上运行时,使得计算机执行上述相关步骤,以实现上述实施例中的图像排序方法。
该计算机程序产品可以存储在存储器802中,例如是程序804,程序804经过预处理、编译、汇编和链接等处理过程最终被转换为能够被处理器801执行的可执行目标文件。
其中,本实施例提供的电子设备、计算机可读存储介质、计算机程序产品或芯片均用于执行上文所提供的对应的方法,因此,其所能达到的有益效果可参考上文所提供的对应的方法中的有益效果,此处不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个装置,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,更换的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是一个物理单元或多个物理单元,即可以位于一个地方,或者也可以分布到多个不同地方。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上内容,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种图像排序方法,其特征在于,所述方法包括:
获取第一图像集合,所述第一图像集合包括多个待排序图像,所述待排序图像为根据查询图像检索得到的图像;
根据每个所述待排序图像和所述查询图像之间匹配的第一特征点,计算对应所述待排序图像和所述查询图像的共视比例,所述第一特征点包括目标图像中与所述查询图像的特征点匹配的特征点,以及所述查询图像中与所述目标图像的特征点匹配的特征点,所述目标图像为当前一次计算所述共视比例的所述待排序图像,所述共视比例是指两张图像之间匹配的特征点分布在所述两张图像中的匹配区域与所述匹配区域所属图像的预设区域的面积比例;
根据所述共视比例对所述多个待排序图像进行排序。
2.根据权利要求1所述的方法,其特征在于,所述根据每个所述待排序图像和所述查询图像之间匹配的第一特征点,计算对应所述待排序图像和所述查询图像的共视比例,包括:
根据所述第一特征点确定所述目标图像中的第一匹配区域,以及所述查询图像中的第二匹配区域;其中,所述第一匹配区域为所述目标图像中所述第一特征点所在的区域块,所述第二匹配区域为所述查询图像中所述第一特征点所在的区域块;
采用所述第一匹配区域和所述第二匹配区域中的更小者,计算所述共视比例。
3.根据权利要求2所述的方法,其特征在于,所述采用所述第一匹配区域和所述第二匹配区域中的更小者,计算所述共视比例,包括:
若所述第一匹配区域小于所述第二匹配区域,则计算所述第一匹配区域和所述目标图像的面积比例,得到所述共视比例;
若所述第一匹配区域大于所述第二匹配区域,则计算所述第二匹配区域和所述查询图像的面积比例,得到所述共视比例。
4.根据权利要求2所述的方法,其特征在于,所述采用所述第一匹配区域和所述第二匹配区域中的更小者,计算所述共视比例,包括:
若所述第一匹配区域小于所述第二匹配区域,则计算所述第一匹配区域和所述目标图像的第一特征区域的面积比例,得到所述共视比例;其中,所述第一特征区域为所述目标图像中第二特征点所在的区域块,所述第二特征点为所述目标图像与所述目标图像自身之间匹配的特征点;
若所述第一匹配区域大于所述第二匹配区域,则计算所述第二匹配区域和所述查询图像的第二特征区域的面积比例,得到所述共视比例;其中,所述第二特征区域为所述查询图像中第三特征点所在的区域块,所述第三特征点为所述查询图像与所述查询图像自身之间匹配的特征点。
5.根据权利要求2至4中任一项所述的方法,其特征在于,所述根据所述第一特征点确定所述目标图像中的第一匹配区域,以及所述查询图像中的第二匹配区域,包括:
将所述目标图像和所述查询图像分别分割为N个和M个区域块,其中,每个所述区域块的大小相同,N和M为大于0的整数;
将存在所述第一特征点的区域块确定为所述第一匹配区域或所述第二匹配区域。
6.根据权利要求1至4中任一项所述的方法,其特征在于,在所述根据所述共视比例对所述多个待排序图像进行排序之前,所述方法还包括:
删除所述第一图像集合中所述共视比例低于第一阈值的所述待排序图像。
7.根据权利要求1至4中任一项所述的方法,其特征在于,所述根据所述共视比例对所述多个待排序图像进行排序,包括:
按照所述共视比例由大到小对所述第一图像集合中的待排序图像进行排序,得到排序结果;
在所述根据所述共视比例对所述多个待排序图像进行排序之后,所述方法还包括:
将所述排序结果中的前P个图像输入图像定位算法或位姿估计算法,P为大于0的整数。
8.一种电子设备,其特征在于,所述电子设备包括处理器,所述处理器用于与存储器耦合,并读取所述存储器中的指令并根据所述指令使得所述电子设备执行如权利要求1至7中任一项所述的方法。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储了计算机程序,当所述计算机程序被处理器执行时,使得所述处理器执行权利要求1至7中任一项所述的方法。
10.一种计算机程序产品,所述计算机程序产品包括:计算机程序代码,当所述计算机程序代码被处理器执行时,使得处理器执行权利要求1至7中任一项所述的方法。
CN202211364538.1A 2022-11-02 2022-11-02 图像排序方法、电子设备、程序产品及介质 Active CN115437601B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211364538.1A CN115437601B (zh) 2022-11-02 2022-11-02 图像排序方法、电子设备、程序产品及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211364538.1A CN115437601B (zh) 2022-11-02 2022-11-02 图像排序方法、电子设备、程序产品及介质

Publications (2)

Publication Number Publication Date
CN115437601A true CN115437601A (zh) 2022-12-06
CN115437601B CN115437601B (zh) 2024-04-19

Family

ID=84252884

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211364538.1A Active CN115437601B (zh) 2022-11-02 2022-11-02 图像排序方法、电子设备、程序产品及介质

Country Status (1)

Country Link
CN (1) CN115437601B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117131213A (zh) * 2023-04-10 2023-11-28 荣耀终端有限公司 图像处理方法及相关设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220067082A1 (en) * 2020-09-03 2022-03-03 General Electric Company Inspection systems and methods including image retrieval module
CN114782716A (zh) * 2022-04-11 2022-07-22 中国工商银行股份有限公司 图像匹配方法及装置
WO2022161011A1 (zh) * 2021-01-29 2022-08-04 华为技术有限公司 生成图像的方法和电子设备
CN115170893A (zh) * 2022-08-29 2022-10-11 荣耀终端有限公司 共视档位分类网络的训练方法、图像排序方法及相关设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220067082A1 (en) * 2020-09-03 2022-03-03 General Electric Company Inspection systems and methods including image retrieval module
WO2022161011A1 (zh) * 2021-01-29 2022-08-04 华为技术有限公司 生成图像的方法和电子设备
CN114782716A (zh) * 2022-04-11 2022-07-22 中国工商银行股份有限公司 图像匹配方法及装置
CN115170893A (zh) * 2022-08-29 2022-10-11 荣耀终端有限公司 共视档位分类网络的训练方法、图像排序方法及相关设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
易军凯 等: "图像的SIFT特征二阶检索算法", 北京化工大学学报(自然科学版), vol. 43, no. 4, 20 July 2016 (2016-07-20), pages 84 - 89 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117131213A (zh) * 2023-04-10 2023-11-28 荣耀终端有限公司 图像处理方法及相关设备

Also Published As

Publication number Publication date
CN115437601B (zh) 2024-04-19

Similar Documents

Publication Publication Date Title
CN110134316B (zh) 模型训练方法、情绪识别方法及相关装置和设备
CN113794800B (zh) 一种语音控制方法及电子设备
CN113645351B (zh) 应用界面交互方法、电子设备和计算机可读存储介质
CN111061912A (zh) 一种处理视频文件的方法及电子设备
CN113364971A (zh) 图像处理方法和装置
CN112130714B (zh) 可进行学习的关键词搜索方法和电子设备
CN113838490B (zh) 视频合成方法、装置、电子设备及存储介质
CN113542580B (zh) 去除眼镜光斑的方法、装置及电子设备
CN111881315A (zh) 图像信息输入方法、电子设备及计算机可读存储介质
WO2021169370A1 (zh) 服务元素的跨设备分配方法、终端设备及存储介质
CN116070035B (zh) 数据处理方法和电子设备
CN112204532A (zh) 一种终端对ai任务支持能力的评测方法及终端
CN113970888A (zh) 家居设备控制方法、终端设备及计算机可读存储介质
CN114995715A (zh) 悬浮球的控制方法和相关装置
CN115115679A (zh) 一种图像配准方法及相关设备
CN112637477A (zh) 一种图像处理方法及电子设备
CN115437601B (zh) 图像排序方法、电子设备、程序产品及介质
CN112740148A (zh) 一种向输入框中输入信息的方法及电子设备
CN111249728B (zh) 一种图像处理方法、装置及存储介质
CN114911400A (zh) 分享图片的方法和电子设备
CN114444000A (zh) 页面布局文件的生成方法、装置、电子设备以及可读存储介质
CN113380240B (zh) 语音交互方法和电子设备
CN115730091A (zh) 批注展示方法、装置、终端设备及可读存储介质
CN113407300A (zh) 应用误杀评估方法及相关设备
CN114812381A (zh) 电子设备的定位方法及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant