CN111522988B - 图像定位模型获取方法及相关装置 - Google Patents

图像定位模型获取方法及相关装置 Download PDF

Info

Publication number
CN111522988B
CN111522988B CN202010478436.7A CN202010478436A CN111522988B CN 111522988 B CN111522988 B CN 111522988B CN 202010478436 A CN202010478436 A CN 202010478436A CN 111522988 B CN111522988 B CN 111522988B
Authority
CN
China
Prior art keywords
image
positioning
model
loss function
sub
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010478436.7A
Other languages
English (en)
Other versions
CN111522988A (zh
Inventor
葛艺潇
朱烽
王海波
赵瑞
李鸿升
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Sensetime Technology Co Ltd
Original Assignee
Shenzhen Sensetime Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Sensetime Technology Co Ltd filed Critical Shenzhen Sensetime Technology Co Ltd
Priority to CN202010478436.7A priority Critical patent/CN111522988B/zh
Publication of CN111522988A publication Critical patent/CN111522988A/zh
Priority to PCT/CN2020/113099 priority patent/WO2021237973A1/zh
Priority to TW110100513A priority patent/TWI780563B/zh
Application granted granted Critical
Publication of CN111522988B publication Critical patent/CN111522988B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/587Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)
  • User Interface Of Digital Computer (AREA)
  • Image Processing (AREA)

Abstract

本申请实施例提供一种图像定位模型获取方法及相关装置,其中,所述方法包括:根据第一图像定位模型,确定目标图像与K个第一样本定位图像之间的相似度,以得到第一相似度向量,K为大于1的整数;根据所述第一相似度向量,确定第一目标损失函数;根据所述第一目标损失函数对初始模型进行调整,得到第二图像定位模型,所述初始模型为所述第一图像定位模型初始化后得到的模型。能够提升定位模型对在图像进行定位时的准确性。

Description

图像定位模型获取方法及相关装置
技术领域
本申请涉及数据处理技术领域,具体涉及一种图像定位模型获取方法及相关装置。
背景技术
图像定位技术旨在通过在大规模数据库中匹配与目标图像最相似(近)的参考图像,并将其所标注的GPS作为目标图像的地理位置。图像定位技术目前主要通过三种方法进行实现,包括图像检索、3D结构匹配、按地理位置进行分类。
目前的进行模型训练时为了避免被错误的正样本(指代GPS相近但画面没有重叠的图像样本对)误导,只选用排行第一的最佳匹配样本作为正样本进行训练,然而,只通过学习最佳匹配的样本无法获得对不同视角、光线等条件鲁棒性佳的网络,导致了训练后的网络模型在进行图像定位时的准确性较低。
发明内容
本申请实施例提供一种图像定位模型获取方法及相关装置,能够提升定位模型对在图像进行定位时的准确性。
本申请实施例的第一方面提供了一种图像定位模型获取方法,该方法包括:
根据第一图像定位模型,确定目标图像与K个第一样本定位图像之间的相似度,以得到第一相似度向量,K为大于1的整数;
根据第一相似度向量,确定第一目标损失函数;
根据第一目标损失函数对初始模型进行调整,得到第二图像定位模型,初始模型为第一图像定位模型初始化后得到的模型。
本示例中,通过第一图像定位模型确定目标图像与K个第一样本定位图像之间的相似度,得到第一相似度向量,根据该相似度向量确定出第一目标损失函数,根据第一目标损失函数对初始模型进行调整,以得到第二图像定位模型,从而可以根据第一图像定位模型、目标图像和K个第一样本定位图像来确定的第一目标损失函数,对初始模型进行相似度监督学习以得到第二图像定位模型,从而可以提升第二图像定位模型在进行图像定位时的准确性。
结合第一方面,在一个可能的实现方式中,根据第一图像定位模型,确定目标图像与K个第一样本定位图像之间的相似度,以得到第一相似度向量,包括:
将K个第一样本定位图像中的每个第一样本定位图像进行拆分,以得到与每个第一样本定位图像对应的N个子第一样本定位图像;
根据第一图像定位模型确定每个第一样本定位图像对应的N个子第一样本定位图像对应的特征值,以得到与每个第一样本定位图像对应的特征向量;
根据第一图像定位模型确定目标图像的特征值;
根据每个第一样本定位图像对应的特征向量和目标图像的特征值,确定第一相似度向量。
本示例中,通过将K个第一样本定位图像中的每个第一样本定位图像进行拆分得到N个子第一样本定位图像,根据该K*N个子第一样本定位图像的特征值和目标图像的特征值,确定第一相似度向量,从而可以细粒度的确定第一相似度向量,提升了第一相似度向量对样本进行反映的准确性,进而提升了确定第二图像定位模型时的准确性。
结合第一方面,在一个可能的实现方式中,根据第一相似度向量,确定第一目标损失函数,包括:
根据第一相似度向量,确定出第一子损失函数;
根据与目标图像对应的困难负样本图像,确定第二子损失函数;
根据第一子损失函数和第二子损失函数,确定第一目标损失函数。
本示例中,可以根据第一相似度向量确定的第一子损失函数,以及目标图像对应的困难负样本图像确定的第二子损失函数确定出第一目标损失函数,从而可以根据准确的第一相似度向量以及困难负样本图像确定的第二子损失函数确定出第一目标损失函数,从而提升了第一目标损失函数确定时的准确性。
结合第一方面,在一个可能的实现方式中,根据第一相似度向量,确定出第一子损失函数,包括:
根据初始模型获取目标图像与K个第一样本定位图像之间的相似度,以得到第二相似度向量;
根据第一相似度向量和第二相似度向量,确定第一子损失函数。
本示例中,可以通过初始模型确定的第二相似度向量和第一相似度向量确定第一子损失函数,从而可以通过第一图像定位模型确定的相似度向量对第二相似度向量进行监督,提升了第一子损失函数确定时的准确性,由于第一相似度向量对第二相似度向量进行监督,从而也可以提升第二图像定位模型在进行图像定位时的准确性。
结合第一方面,在一个可能的实现方式中,根据第一子损失函数和第二子损失函数,确定第一目标损失函数,包括:
根据与第一子损失函数和第二子损失函数对应的损失加权因子,对第一子损失函数和第二子损失函数进行运算,以得到第一目标损失函数。
结合第一方面,在一个可能的实现方式中,该方法还包括:
接收待标记图像;
获取与待标记图像对应的K个第二样本定位图像;
将K个第二样本定位图像中的每个第二样本定位图像进行拆分,以得到与每个第二样本定位图像对应的N个子第二样本定位图像;
通过第二图像定位模型,确定待标记图像与每个第二样本定位图像对应的N个子第二样本定位图像对应的相似度标签。
本示例中,通过第二图像定位模型确定代标记图像与每个第二样本定位图像对应的N个子第二样本定位图像对应的相似度标签,相对于现有方案中通过单一的样本对(最优样本对)训练得到的图像定位模型确定相似度标签时,能够提升获取到的相似度标签的准确性。
结合第一方面,在一个可能的实现方式中,第一图像定位模型包括基础图像定位模型,基础图像定位模型为包括采用目标图像与K个第一样本定位图像中相似度最高的图像作为样本对进行训练得到的模型。
结合第一方面,在一个可能的实现方式中,方法还包括:
根据第二图像定位模型、目标图像与K个第一样本定位图像,确定第二目标损失函数;
根据第二目标损失函数对初始模型进行调整,得到第三图像定位模型;
采用第三图像定位模型替换第一图像定位模型。
本申请实施例第二方面提供了一种图像定位方法,该方法包括:
接收待检测图像;
根据如第一方面任一项的第二图像定位模型对待检测图像进行定位,得到与待检测图像对应的定位信息。
申请实施例的第三方面提供了一种图像定位模型获取装置,该装置包括:
第一确定单元,用于根据第一图像定位模型,确定目标图像与K个第一样本定位图像之间的相似度,以得到第一相似度向量,K为大于1的整数;
第二确定单元,用于根据第一相似度向量,确定第一目标损失函数;
调整单元,用于根据第一目标损失函数对初始模型进行调整,得到第二图像定位模型,初始模型为第一图像定位模型初始化后得到的模型。
结合第二方面,在一种可能的实现方式中,第一确定单元用于:
将K个第一样本定位图像中的每个第一样本定位图像进行拆分,以得到与每个第一样本定位图像对应的N个子第一样本定位图像;
根据第一图像定位模型确定每个第一样本定位图像对应的N个子第一样本定位图像对应的特征值,以得到与每个第一样本定位图像对应的特征向量;
根据第一图像定位模型确定目标图像的特征值;
根据每个第一样本定位图像对应的特征向量和目标图像的特征值,确定第一相似度向量。
结合第二方面,在一种可能的实现方式中,第二确定单元用于:
根据第一相似度向量,确定出第一子损失函数;
根据与目标图像对应的困难负样本图像,确定第二子损失函数;
根据第一子损失函数和第二子损失函数,确定第一目标损失函数。
结合第二方面,在一个可能的实现方式中,在根据第一相似度向量,确定出第一子损失函数方面,第二确定单元用于:
根据初始模型获取目标图像与K个第一样本定位图像之间的相似度,以得到第二相似度向量;
根据第一相似度向量和第二相似度向量,确定第一子损失函数。
结合第二方面,在一个可能的实现方式中,在根据第一子损失函数和第二子损失函数,确定第一目标损失函数方面,第二确定单元用于:
根据与第一子损失函数和第二子损失函数对应的损失加权因子,对第一子损失函数和第二子损失函数进行运算,以得到第一目标损失函数。
结合第二方面,在一个可能的实现方式中,该装置还用于:
接收待标记图像;
获取与待标记图像对应的K个第二样本定位图像;
将K个第二样本定位图像中的每个第二样本定位图像进行拆分,以得到与每个第二样本定位图像对应的N个子第二样本定位图像;
通过第二图像定位模型,确定待标记图像与每个第二样本定位图像对应的N个子第二样本定位图像对应的相似度标签。
结合第二方面,在一个可能的实现方式中,第一图像定位模型包括基础图像定位模型,基础图像定位模型为包括采用目标图像与K个第一样本定位图像中相似度最高的图像作为样本对进行训练得到的模型。
结合第二方面,在一个可能的实现方式中,该装置还用于:
根据第二图像定位模型、目标图像与K个第一样本定位图像,确定第二目标损失函数;
根据第二目标损失函数对初始模型进行调整,得到第三图像定位模型;
采用第三图像定位模型替换第一图像定位模型。
本申请实施例第四方面提供了一种图像定位装置,该装置包括:
接收单元,用于接收待检测图像;
定位单元,用于根据如第二方面任一项的第二图像定位模型对待检测图像进行定位,得到与待检测图像对应的定位信息。
本申请实施例的第五方面提供一种终端,包括处理器、输入设备、输出设备和存储器,处理器、输入设备、输出设备和存储器相互连接,其中,存储器用于存储计算机程序,计算机程序包括程序指令,处理器被配置用于调用程序指令,执行如本申请实施例第一方面或第二方面中的步骤指令。
本申请实施例的第六方面提供了一种计算机可读存储介质,其中,上述计算机可读存储介质存储用于电子数据交换的计算机程序,其中,上述计算机程序使得计算机执行如本申请实施例第一方面或第二方面中所描述的部分或全部步骤。
本申请实施例的第七方面提供了一种计算机程序产品,其中,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如本申请实施例第一方面或第二方面中所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。
本发明的这些方面或其他方面在以下实施例的描述中会更加简明易懂。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1a为本申请实施例提供了一种图像定位模型的应用场景的示意图;
图1b为本申请实施例提供了一种图像定位模型获取方法的流程示意图;
图2a为本申请实施例提供了一种样本图像的示意图;
图2b为本申请实施例提供了一种第一样本定位图像的拆分示意图;
图2c为本申请实施例提供了另一种第一样本定位图像的拆分示意图;
图2d为本申请实施例提供了一种子第一样本定位图像的示意图;
图3为本申请实施例提供了另一种图像定位模型获取方法的流程示意图;
图4为本申请实施例提供了另一种图像定位模型获取方法的流程示意图;
图5为本申请实施例提供的一种终端的结构示意图;
图6为本申请实施例提供了一种图像定位模型获取装置的结构示意图;
图7为本申请实施例提供了一种图像定位装置的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、***、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
在本申请中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本申请所描述的实施例可以与其它实施例相结合。
本发明实施例所描述电子设备可以包括智能手机(如Android手机、iOS手机、Windows Phone手机等)、平板电脑、掌上电脑、行车记录仪、交通指挥平台、服务器、笔记本电脑、移动互联网设备(MID,Mobile Internet Devices)或穿戴式设备(如智能手表、蓝牙耳机)等,上述仅是举例,而非穷举,包含但不限于上述电子设备,电子设备还可以为服务器,或者,视频矩阵,在此不做限定,电子设备还可以为物联网设备。本申请实施例中终端与电子设备可以是相同的设备。
为了更好的理解本申请实施例提供的一种图像定位模型获取方法,下面首先对通过图像定位模型获取方法确定的图像定位模型的应用场景进行简要的介绍。如图1a所示,图像定位模型可以应用于电子设备中,用户在需要进行位置定位时,例如,用户需要告知其他人自己当前所在的位置,用户可以通过电子设备采集当前所在位置附近的图像,例如,用户在xx大厦旁边,则当前所在位置附近的图像可以是该xx大厦附近的区域的图像,得到待检测图像。电子设备通过图像定位模型,对待检测图像进行定位分析和计算,得到与该待检测图像对应的定位信息,定位信息为该待检测图像所反映的区域的位置信息(xx大厦),例如,位置信息可以是待检测图像中标志性建筑的位置信息等,标志性建筑可以是用户自己选择的建筑物,也可以是通过图像定位模型确定出的建筑物等,当然也可以是其它的标志的位置信息,此处仅为举例说明。如此则可以通过图像定位模型来确定出用户当前所在的位置,给用户带来较高的便捷性。由于现有的图像定位模型对图像进行定位时其定位的准确性不高,其在进行模型训练时,通常采用单一的样本对,对初始模型进行训练,因此需要对图像定位模型进行优化训练,从而来提升图像定位模型对图像进行定位时的准确性。下面实施例中主要阐述了对初始模型进行调整以提升调整后得到的图像定位模型进行图像定位时的准确性。
如图1b所示,图像定位模型获取方法应用于电子设备,该方法包括步骤101-103,具体如下:
101、电子设备根据第一图像定位模型,确定目标图像与K个第一样本定位图像之间的相似度,以得到第一相似度向量,K为大于1的整数。
K个第一样本定位图像可以是根据目标图像的GPS(全球定位***)定位信息确定的样本图像,例如,可以是目标图像GPS定位信息指示的位置处预设范围内的图像,具体可以为,在该指示的位置处10米范围内的地图图像等。目标图像可以通过手机、电脑等移动终端进行采集得到,该目标图像可以用于确定样本对,以通过样本对对初始模型进行调整,即目标图像与K个第一样本定位图像为对初始模型进行调整的样本对。预设范围可以是通过经验值或历史数据设定。
K个第一样本定位图像与目标图像之间的相似度标签可以是0-1之间的值,也可以包括0或1。如图2a所示,图2a中示出了一种可能的目标图像和第一样本定位图像,其中,第一样本定位图像的相似度标签包括有0.45、0.35等。
第一相似度向量中元素可以包括目标图像与第一样本定位图像之间的相似度和目标图像与第一样本定位图像进行拆分后的子图像之间的相似度。第一样本定位图像进行拆分,可以得到多个子第一样本定位图像,进行图像拆分时可以将图像拆分为面积相同的多个子第一样本定位图像,也可以拆分为面积不同的多个子第一样本定位图像等。
电子设备可以用于对初始模型进行调整,也可以用于对初始模型进行调整以及采用图像定位模型进行图像定位。
102、电子设备根据第一相似度向量,确定第一目标损失函数。
可以根据第一相似度向量确定出对应的损失函数,并至少通过该对应的损失函数来确定出第一目标损失函数。
103、电子设备根据第一目标损失函数对初始模型进行调整,得到第二图像定位模型,初始模型为第一图像定位模型初始化后得到的模型。
通过包括目标图像以及K各第一样本定位图像的样本集和第一目标损失函数对初始模型进行训练,以得到第二图像定位模型。初始模型为第一图像定位模型初始化后得到的模型可以理解为,将第一图像定位模型中的模型参数进行初始化,以得到初始模型。第一图像定位模型为通过包括目标图像以及K各第一样本定位图像的样本集对初始模型进行训练得到的模型。
本示例中,通过第一图像定位模型确定目标图像与K个第一样本定位图像之间的相似度,得到第一相似度向量,根据该相似度向量确定出第一目标损失函数,根据第一目标损失函数对初始模型进行调整,以得到第二图像定位模型,从而可以根据第一图像定位模型、目标图像和K个第一样本定位图像来确定的第一目标损失函数,对初始模型进行相似度监督学习以得到第二图像定位模型,从而可以提升第二图像定位模型在进行图像定位时的准确性。
在一个可能的实施例中,一种可能的根据第一图像定位模型,确定目标图像与K个第一样本定位图像之间的相似度,以得到第一相似度向量的方法包括步骤A1-A4,具体如下:
A1、将K个第一样本定位图像中的每个第一样本定位图像进行拆分,以得到与每个第一样本定位图像对应的N个子第一样本定位图像;
A2、根据第一图像定位模型确定每个第一样本定位图像对应的N个子第一样本定位图像对应的特征值,以得到与每个第一样本定位图像对应的特征向量;
A3、根据第一图像定位模型确定目标图像的特征值;
A4、根据每个第一样本定位图像对应的特征向量和目标图像的特征值,确定第一相似度向量。
将第一样本定位图像进行拆分时,可以将图像拆分为面积相同的多个子第一样本定位图像,也可以拆分为面积不同的多个子第一样本定位图像等。一种可能的拆分方式可以为:将第一样本定位图像拆分为面积相等的两个子第一定位图像,以及将第一样本定位图像拆分为面积相等的4个子第一定位图像。具体可以参见图2b所示,可以将第一样本定位图像拆分为上下两个子第一定位图像,也可以将第一样本定位图像拆分为左右两个子第一定位图像;如图2c所示,可以将第一样本定位图像拆分为4个面积相等的子第一样本定位图像。
N个子第一样本图像可以包括多种不同的拆分方式得到的子第一样本图像,例如可以时如图2b和图2c的拆分方式得到的所有子第一样本定位图像,则此时N=8,当然N还可以是其它任意的数值,此处仅为举例说明,不作具体限定。
在确定特征向量以及目标图像的特征值时,可以通过第一图像定位模型进行计算得到。每个第一样本定位图像对应的特征向量可以表示为:
Figure BDA0002516562640000101
其中,
Figure BDA0002516562640000102
为第i个第一样本定位图像的第一个第一子样本定位图像的特征值。
可以通过交叉熵的计算方式来获取第一相似度向量,具体可以为通过如下公式所示的方法来确定第一相似度向量:
Figure BDA0002516562640000103
其中,
Figure BDA0002516562640000104
第一相似度向量,softmax为归一化运算,τω为超参(温度系数),
Figure BDA0002516562640000105
为目标图像的特征值,
Figure BDA0002516562640000106
为第一样本定位图像p1的特征值,
Figure BDA0002516562640000107
为第一样本图像p1的第一个子第一样本定位图像的特征值,
Figure BDA0002516562640000108
为第一样本定位图像pk的特征值,
Figure BDA0002516562640000109
为第一样本图像pk的第一个子第一样本定位图像的特征值。
本示例中,通过将K个第一样本定位图像中的每个第一样本定位图像进行拆分得到N个子第一样本定位图像,根据该K*N个子第一样本定位图像的特征值和目标图像的特征值,确定第一相似度向量,从而可以细粒度的确定第一相似度向量,提升了第一相似度向量对样本进行反映的准确性,进而提升了确定第二图像定位模型时的准确性。
在一个可能的实施例中,一种可能的根据第一相似度向量,确定第一目标损失函数的方法包括步骤B1-B3,具体如下:
B1、根据第一相似度向量,确定出第一子损失函数;
B2、根据与目标图像对应的困难负样本图像,确定第二子损失函数;
B3、根据第一子损失函数和第二子损失函数,确定第一目标损失函数。
第一相似度向量可以与初始模型确定的目标图像与第一样本定位图像之间的相似度向量来确定第一子损失函数。
与目标图像对应的困难负样本图像可以理解为,与目标图像对应的负样本中,相似度低于预设阈值的负样本,预设阈值可以通过经验值或历史数据设定。
确定第二子损失函数时,可以通过如下公式所示的方法来确定第二子损失函数:
Figure BDA0002516562640000111
其中,
Figure BDA0002516562640000112
为第二子损失函数,
Figure BDA0002516562640000113
为相似度标签最高的正样本图像的特征值,
Figure BDA0002516562640000114
为相似度标签最低的负样本图像的特征值,K为第一样本定位图像的个数。
可以对第一子损失函数和第二子损失函数进行加权运算,以得到第一目标损失函数。
本示例中,可以根据第一相似度向量确定的第一子损失函数,以及目标图像对应的困难负样本图像确定的第二子损失函数确定出第一目标损失函数,从而可以根据准确的第一相似度向量以及困难负样本图像确定的第二子损失函数确定出第一目标损失函数,从而提升了第一目标损失函数确定时的准确性。
在一个可能的实施例中,一种可能的根据第一相似度向量,确定出第一子损失函数的方法包括步骤C1-C2,具体如下:
C1、根据初始模型获取目标图像与K个第一样本定位图像之间的相似度,以得到第二相似度向量;
C2、根据第一相似度向量和第二相似度向量,确定第一子损失函数。
获取第二相似度向量的方法可以参考前述实施例中获取第一相似度向量的方法,具体实施时采用初始模型进行计算,以得到第二相似度向量。
第一相似度向量和第二相似度向量可以采用交叉熵的运算,获取到第一子损失函数。例如,可以通过如下公式所示的方式获取到第一子损失函数:
Figure BDA0002516562640000115
其中,Lsoftω)为第一子损失函数,
Figure BDA0002516562640000116
为第二相似度向量,
Figure BDA0002516562640000117
τω-1为第一相似度向量,lec()为交叉熵运算,ω为大于或等于2的正整数。上述公式在用于表示多次调整时ω则可以理解为调整的次数。
lec()可以表示为:
Figure BDA0002516562640000118
其中,y,
Figure BDA0002516562640000119
为需要进行交叉熵运算的元素。
本示例中,可以通过初始模型确定的第二相似度向量和第一相似度向量确定第一子损失函数,从而可以通过第一图像定位模型确定的相似度向量对第二相似度向量进行监督,提升了第一子损失函数确定时的准确性,由于第一相似度向量对第二相似度向量进行监督,从而也可以提升第二图像定位模型在进行图像定位时的准确性。
在一个可能的实施例中,一种可能的根据第一子损失函数和第二子损失函数,确定第一目标损失函数的方法可以为:
根据与第一子损失函数和第二子损失函数对应的损失加权因子,对第一子损失函数和第二子损失函数进行运算,以得到第一目标损失函数。
损失加权因子与第一子损失函数和第二子损失函数相对应,一种可能的加权损失因子的对应方式可以为:第一子损失函数的损失加权因子为
Figure BDA0002516562640000124
第二子损失函数的损失加权因子为1。
获取第一目标损失函数的方法也是通过如下公式所示的方法:
Figure BDA0002516562640000121
其中,L(θω)为第一目标损失函数,
Figure BDA0002516562640000122
为第二子损失函数,
Figure BDA0002516562640000123
为第一子损失函数,λ为加权因子。
在一个可能的实施例中,还可以对代标记图像进行标记,得到代标记图像与对应的样本定位图像之间的相似度标签,具体可以包括步骤D1-D4:
D1、接收待标记图像;
D2、获取与待标记图像对应的K个第二样本定位图像;
D3、将K个第二样本定位图像中的每个第二样本定位图像进行拆分,以得到与每个第二样本定位图像对应的N个子第二样本定位图像;
D4、通过第二图像定位模型,确定待标记图像与每个第二样本定位图像对应的N个子第二样本定位图像对应的相似度标签。
获取第二样本定位图像的方法可以参考前述实施例中获取第一样本定位图像的获取方法,此处不再赘述。步骤D3可以参照前述步骤A1所示的方法,此处不再赘述。
获取相似度标签时,可以通过第二图像定位模型进行计算,以得到待标记图像与每个第二样本定位图像对应的N个子第二样本定位图像对应的相似度标签。具体计算时,可以是通过代标记图像的特征向量与N个子样本定位图像的特征向量之间的距离,确定相似度,以及将该相似度确定为对应的相似度标签。
本示例中,通过第二图像定位模型确定代标记图像与每个第二样本定位图像对应的N个子第二样本定位图像对应的相似度标签,相对于现有方案中通过单一的样本对(最优样本对)训练得到的图像定位模型确定相似度标签时,能够提升获取到的相似度标签的准确性。
在一个可能的实施例中,第一图像定位模型包括基础图像定位模型,基础图像定位模型为包括采用目标图像与K个第一样本定位图像中相似度最高的图像作为样本对进行训练得到的模型。
在一个可能的实施例中,还包括有获取第一图像定位模型的方法,具体包括步骤E1-E3,如下所示:
E1、根据第二图像定位模型、目标图像与K个第一样本定位图像,确定第二目标损失函数;
E2、根据第二目标损失函数对初始模型进行调整,得到第三图像定位模型;
E3、采用第三图像定位模型替换第一图像定位模型。
上述步骤E1的具体实现方法可以参照前述实施例中确定第一目标损失函数,E2的具体实现方法可以参照前述实施例中确定第二图像定位模型的方法。
在一个可能的实施例中,可以采用第二图像定位模型对待检测图像进行定位,得到与待检测图像对应的定位信息,具体可以包括步骤F1-F2,如下:
F1、接收待检测图像;
F2、根据如上述任一实施例中的第二图像定位模型对待检测图像进行定位,得到与待检测图像对应的定位信息。
本示例中,通过第二图像定位模型来对待检测图像进行定位,从而可以提升定位信息获取时的准确性。
在一个可能的实现方式中,包括有多次根据损失函数对图像定位模型进行调整,然后获取到最终的图像定位模型,详细方法如下:
采用包括目标图像与K个第一样本定位图像中相似度最高的图像作为样本对,对初始模型进行训练,得到基础图像定位模型;采用基础定位模型,确定目标图像与K个第一样本定位图像之间的相似度,以得到第一相似度向量,根据该第一相似度向量确定出第一子损失函数;根据初始模型、目标图像和目标图像对应的困难负样本,确定第二子损失函数;对第一子损失函数和第二子损失函数进行加权运算,得到第一目标损失函数,通过第一目标损失函数对初始模型进行调整,得到第二图像定位模型;再次根据第二图像定位模型、目标图像与K个第一样本定位图像,确定第二目标损失函数,并根据第二目标损失函数对初始模型进行调整训练,得到第三图像定位模型,以此,重复执行上述步骤,从而可以获取到最终的图像定位模型。如2d中所示,为三次对初始模型进行调整,在第一次进行调整时,已经将K个第一样本图像进行了拆分(图中未示出),图中示出的相似度条,可以理解为相似度也可以理解为相似度标签,相似度高则相似度标签的值越大,相似度越低则相似度标签的值越小。图2d中,在进行三次调整后的模型计算得到的子第一样本定位图像的相似度标签,相对于第一次调整后的模型计算得到的子第一样本定位图像的相似度标签更加准确。
请参阅图3,图3为本申请实施例提供了另一种图像定位模型获取方法的流程示意图。如图3所示,图像定位模型获取方法包括步骤301-306,具体如下:
301、将K个第一样本定位图像中的每个第一样本定位图像进行拆分,以得到与每个第一样本定位图像对应的N个子第一样本定位图像,K为大于1的整数;
K个第一样本定位图像可以是根据目标图像的GPS定位信息确定的样本图像,例如,可以是目标图像GPS定位信息指示的位置处预设范围内的图像,具体可以为,在该指示的位置处10米范围内的地图图像等。预设范围可以是通过经验值或历史数据设定。
302、根据第一图像定位模型确定每个第一样本定位图像对应的N个子第一样本定位图像对应的特征值,以得到与每个第一样本定位图像对应的特征向量;
特征向量中包括有多个元素。
303、根据第一图像定位模型确定目标图像的特征值;
304、根据每个第一样本定位图像对应的特征向量和目标图像的特征值,确定第一相似度向量;
305、根据第一相似度向量,确定第一目标损失函数;
306、根据第一目标损失函数对初始模型进行调整,得到第二图像定位模型,初始模型为第一图像定位模型初始化后得到的模型。
通过包括目标图像以及K各第一样本定位图像的样本集和第一目标损失函数对初始模型进行训练,以得到第二图像定位模型。初始模型为第一图像定位模型初始化后得到的模型可以理解为,将第一图像定位模型中的模型参数进行初始化,以得到初始模型。第一图像定位模型为通过包括目标图像以及K各第一样本定位图像的样本集对初始模型进行训练得到的模型。
本示例中,通过将K个第一样本定位图像中的每个第一样本定位图像进行拆分得到N个子第一样本定位图像,根据该K*N个子第一样本定位图像的特征值和目标图像的特征值,确定第一相似度向量,从而可以细粒度的确定第一相似度向量,提升了第一相似度向量对样本进行反映的准确性,进而提升了确定第二图像定位模型时的准确性。
请参阅图4,图4为本申请实施例提供了另一种图像定位模型获取方法的流程示意图。如图4所示,图像定位模型获取方法包括步骤401-405,具体如下:
401、根据第一图像定位模型,确定目标图像与K个第一样本定位图像之间的相似度,以得到第一相似度向量,K为大于1的整数;
402、根据第一相似度向量,确定出第一子损失函数;
403、根据与目标图像对应的困难负样本图像,确定第二子损失函数;
404、根据第一子损失函数和第二子损失函数,确定第一目标损失函数;
405、根据第一目标损失函数对初始模型进行调整,得到第二图像定位模型,初始模型为第一图像定位模型初始化后得到的模型。
通过包括目标图像以及K各第一样本定位图像的样本集和第一目标损失函数对初始模型进行训练,以得到第二图像定位模型。初始模型为第一图像定位模型初始化后得到的模型可以理解为,将第一图像定位模型中的模型参数进行初始化,以得到初始模型。第一图像定位模型为通过包括目标图像以及K各第一样本定位图像的样本集对初始模型进行训练得到的模型。
本示例中,可以根据第一相似度向量确定的第一子损失函数,以及目标图像对应的困难负样本图像确定的第二子损失函数确定出第一目标损失函数,从而可以根据准确的第一相似度向量以及困难负样本图像确定的第二子损失函数确定出第一目标损失函数,从而提升了第一目标损失函数确定时的准确性。
与上述实施例一致的,请参阅图5,图5为本申请实施例提供的一种终端的结构示意图,如图所示,包括处理器、输入设备、输出设备和存储器,处理器、输入设备、输出设备和存储器相互连接,其中,存储器用于存储计算机程序,计算机程序包括程序指令,处理器被配置用于调用程序指令,上述程序包括用于执行以下步骤的指令;
一种图像定位模型获取方法,该方法包括:
根据第一图像定位模型,确定目标图像与K个第一样本定位图像之间的相似度,以得到第一相似度向量,K为大于1的整数;
根据第一相似度向量,确定第一目标损失函数;
根据第一目标损失函数对初始模型进行调整,得到第二图像定位模型,初始模型为第一图像定位模型初始化后得到的模型。
在一个可能的实现方式中,根据第一图像定位模型,确定目标图像与K个第一样本定位图像之间的相似度,以得到第一相似度向量,包括:
将K个第一样本定位图像中的每个第一样本定位图像进行拆分,以得到与每个第一样本定位图像对应的N个子第一样本定位图像;
根据第一图像定位模型确定每个第一样本定位图像对应的N个子第一样本定位图像对应的特征值,以得到与每个第一样本定位图像对应的特征向量;
根据第一图像定位模型确定目标图像的特征值;
根据每个第一样本定位图像对应的特征向量和目标图像的特征值,确定第一相似度向量。
在一个可能的实现方式中,根据第一相似度向量,确定第一目标损失函数,包括:
根据第一相似度向量,确定出第一子损失函数;
根据与目标图像对应的困难负样本图像,确定第二子损失函数;
根据第一子损失函数和第二子损失函数,确定第一目标损失函数。
在一个可能的实现方式中,根据第一相似度向量,确定出第一子损失函数,包括:
根据初始模型获取目标图像与K个第一样本定位图像之间的相似度,以得到第二相似度向量;
根据第一相似度向量和第二相似度向量,确定第一子损失函数。
在一个可能的实现方式中,根据第一子损失函数和第二子损失函数,确定第一目标损失函数,包括:
根据与第一子损失函数和第二子损失函数对应的损失加权因子,对第一子损失函数和第二子损失函数进行运算,以得到第一目标损失函数。
在一个可能的实现方式中,方法还包括:
接收待标记图像;
获取与待标记图像对应的K个第二样本定位图像;
将K个第二样本定位图像中的每个第二样本定位图像进行拆分,以得到与每个第二样本定位图像对应的N个子第二样本定位图像;
通过第二图像定位模型,确定待标记图像与每个第二样本定位图像对应的N个子第二样本定位图像对应的相似度标签。
在一个可能的实现方式中,第一图像定位模型包括基础图像定位模型,基础图像定位模型为包括采用目标图像与K个第一样本定位图像中相似度最高的图像作为样本对进行训练得到的模型。
在一个可能的实现方式中,方法还包括:
根据第二图像定位模型、目标图像与K个第一样本定位图像,确定第二目标损失函数;
根据第二目标损失函数对初始模型进行调整,得到第三图像定位模型;
采用第三图像定位模型替换第一图像定位模型。
一种图像定位方法,该方法包括:
接收待检测图像;
根据如前述任一指令中的第二图像定位模型对待检测图像进行定位,得到与待检测图像对应的定位信息。
上述主要从方法侧执行过程的角度对本申请实施例的方案进行了介绍。可以理解的是,终端为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所提供的实施例描述的各示例的单元及算法步骤,本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
本申请实施例可以根据上述方法示例对终端进行功能单元的划分,例如,可以对应各个功能划分各个功能单元,也可以将两个或两个以上的功能集成在一个处理单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。需要说明的是,本申请实施例中对单元的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
与上述一致的,请参阅图6,图6为本申请实施例提供了一种图像定位模型获取装置的结构示意图。如图6所示,该装置包括:
第一确定单元601,用于根据第一图像定位模型,确定目标图像与K个第一样本定位图像之间的相似度,以得到第一相似度向量,K为大于1的整数;
第二确定单元602,用于根据第一相似度向量,确定第一目标损失函数;
调整单元603,用于根据第一目标损失函数对初始模型进行调整,得到第二图像定位模型,初始模型为第一图像定位模型初始化后得到的模型。
在一种可能的实现方式中,第一确定单元601用于:
将K个第一样本定位图像中的每个第一样本定位图像进行拆分,以得到与每个第一样本定位图像对应的N个子第一样本定位图像;
根据第一图像定位模型确定每个第一样本定位图像对应的N个子第一样本定位图像对应的特征值,以得到与每个第一样本定位图像对应的特征向量;
根据第一图像定位模型确定目标图像的特征值;
根据每个第一样本定位图像对应的特征向量和目标图像的特征值,确定第一相似度向量。
在一种可能的实现方式中,第二确定单元602用于:
根据第一相似度向量,确定出第一子损失函数;
根据与目标图像对应的困难负样本图像,确定第二子损失函数;
根据第一子损失函数和第二子损失函数,确定第一目标损失函数。
在一个可能的实现方式中,在根据第一相似度向量,确定出第一子损失函数方面,第二确定单元602用于:
根据初始模型获取目标图像与K个第一样本定位图像之间的相似度,以得到第二相似度向量;
根据第一相似度向量和第二相似度向量,确定第一子损失函数。
在一个可能的实现方式中,在根据第一子损失函数和第二子损失函数,确定第一目标损失函数方面,第二确定单元602用于:
根据与第一子损失函数和第二子损失函数对应的损失加权因子,对第一子损失函数和第二子损失函数进行运算,以得到第一目标损失函数。
在一个可能的实现方式中,该装置还用于:
接收待标记图像;
获取与待标记图像对应的K个第二样本定位图像;
将K个第二样本定位图像中的每个第二样本定位图像进行拆分,以得到与每个第二样本定位图像对应的N个子第二样本定位图像;
通过第二图像定位模型,确定待标记图像与每个第二样本定位图像对应的N个子第二样本定位图像对应的相似度标签。
在一个可能的实现方式中,第一图像定位模型包括基础图像定位模型,基础图像定位模型为包括采用目标图像与K个第一样本定位图像中相似度最高的图像作为样本对进行训练得到的模型。
在一个可能的实现方式中,该装置还用于:
根据第二图像定位模型、目标图像与K个第一样本定位图像,确定第二目标损失函数;
根据第二目标损失函数对初始模型进行调整,得到第三图像定位模型;
采用第三图像定位模型替换第一图像定位模型。
请参阅图7,图7为本申请实施例提供了一种图像定位装置的结构示意图。
如图7所示,该装置包括:
接收单元701,用于接收待检测图像;
定位单元702,用于根据如上述实施例中任一项的第二图像定位模型对待检测图像进行定位,得到与待检测图像对应的定位信息。
本申请实施例还提供一种计算机存储介质,其中,该计算机存储介质存储用于电子数据交换的计算机程序,该计算机程序使得计算机执行如上述方法实施例中记载的任何一种图像定位模型获取方法或图像定位方法的部分或全部步骤。
本申请实施例还提供一种计算机程序产品,所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,该计算机程序使得计算机执行如上述方法实施例中记载的任何一种图像定位模型获取方法或图像定位方法的部分或全部步骤。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在申请明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件程序模块的形式实现。
所述集成的单元如果以软件程序模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储器包括:U盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、只读存储器、随机存取器、磁盘或光盘等。
以上对本申请实施例进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (11)

1.一种图像定位模型获取方法,其特征在于,所述方法包括:
根据第一图像定位模型,确定目标图像与K个第一样本定位图像之间的相似度,以得到第一相似度向量,K为大于1的整数;
根据所述第一相似度向量,确定第一目标损失函数;
根据所述第一目标损失函数对第一初始模型进行调整,得到第二图像定位模型,所述第一图像定位模型为通过包括所述目标图像以及所述K个第一样本定位图像的样本集对第二初始模型进行训练得到的模型;
所述根据第一图像定位模型,确定目标图像与K个第一样本定位图像之间的相似度,以得到第一相似度向量,包括:
将所述K个第一样本定位图像中的每个第一样本定位图像进行拆分,以得到与所述每个第一样本定位图像对应的N个子第一样本定位图像;所述将所述K个第一样本定位图像中的每个第一样本定位图像进行拆分,包括:将所述每个第一样本定位图像拆分为面积相同的多个子第一样本定位图像,和/或拆分为面积不同的多个子第一样本定位图像;
根据所述第一图像定位模型确定所述每个第一样本定位图像对应的N个子第一样本定位图像对应的特征值,以得到与所述每个第一样本定位图像对应的特征向量;
根据所述第一图像定位模型确定所述目标图像的特征值;
根据所述每个第一样本定位图像对应的特征向量和所述目标图像的特征值,确定所述第一相似度向量。
2.根据权利要求1所述的方法,其特征在于,所述根据所述第一相似度向量,确定第一目标损失函数,包括:
根据所述第一相似度向量,确定出第一子损失函数;
根据与所述目标图像对应的困难负样本图像,确定第二子损失函数;
根据所述第一子损失函数和所述第二子损失函数,确定所述第一目标损失函数。
3.根据权利要求2所述的方法,其特征在于,所述根据所述第一子损失函数和所述第二子损失函数,确定所述第一目标损失函数,包括:
根据与所述第一子损失函数和所述第二子损失函数对应的损失加权因子,对所述第一子损失函数和所述第二子损失函数进行运算,以得到所述第一目标损失函数。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
接收待标记图像;
获取与所述待标记图像对应的K个第二样本定位图像;
将K个第二样本定位图像中的每个第二样本定位图像进行拆分,以得到与所述每个第二样本定位图像对应的N个子第二样本定位图像;
通过所述第二图像定位模型,确定所述待标记图像与所述每个第二样本定位图像对应的N个子第二样本定位图像对应的相似度标签。
5.根据权利要求1所述的方法,其特征在于,所述第一图像定位模型包括基础图像定位模型,所述基础图像定位模型为包括采用所述目标图像与所述K个第一样本定位图像中相似度最高的图像作为样本对进行训练得到的模型。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据所述第二图像定位模型、所述目标图像与所述K个第一样本定位图像,确定第二目标损失函数;
根据所述第二目标损失函数对第三初始模型进行调整,得到第三图像定位模型;
采用所述第三图像定位模型替换所述第一图像定位模型。
7.一种图像定位方法,其特征在于,所述方法包括:
接收待检测图像;
根据如权利要求1-6任一项所述的第二图像定位模型对所述待检测图像进行定位,得到与所述待检测图像对应的定位信息。
8.一种图像定位模型获取装置,其特征在于,所述装置包括:
第一确定单元,用于根据第一图像定位模型,确定目标图像与K个第一样本定位图像之间的相似度,以得到第一相似度向量,K为大于1的整数;
第二确定单元,用于根据所述第一相似度向量,确定第一目标损失函数;
调整单元,用于根据所述第一目标损失函数对第一初始模型进行调整,得到第二图像定位模型,所述第一图像定位模型为通过包括所述目标图像以及所述K个第一样本定位图像的样本集对第二初始模型进行训练得到的模型;所述第一确定单元用于:
将所述K个第一样本定位图像中的每个第一样本定位图像进行拆分,以得到与所述每个第一样本定位图像对应的N个子第一样本定位图像;所述将所述K个第一样本定位图像中的每个第一样本定位图像进行拆分,包括:将所述每个第一样本定位图像拆分为面积相同的多个子第一样本定位图像,和/或拆分为面积不同的多个子第一样本定位图像;
根据所述第一图像定位模型确定所述每个第一样本定位图像对应的N个子第一样本定位图像对应的特征值,以得到与所述每个第一样本定位图像对应的特征向量;
根据所述第一图像定位模型确定所述目标图像的特征值;
根据所述每个第一样本定位图像对应的特征向量和所述目标图像的特征值,确定所述第一相似度向量。
9.根据权利要求8所述的装置,其特征在于,所述第二确定单元用于:
根据所述第一相似度向量,确定出第一子损失函数;
根据与所述目标图像对应的困难负样本图像,确定第二子损失函数;
根据所述第一子损失函数和所述第二子损失函数,确定所述第一目标损失函数。
10.一种终端,其特征在于,包括处理器、输入设备、输出设备和存储器,所述处理器、输入设备、输出设备和存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如权利要求1-7任一项所述的方法。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行如权利要求1-7任一项所述的方法。
CN202010478436.7A 2020-05-29 2020-05-29 图像定位模型获取方法及相关装置 Active CN111522988B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202010478436.7A CN111522988B (zh) 2020-05-29 2020-05-29 图像定位模型获取方法及相关装置
PCT/CN2020/113099 WO2021237973A1 (zh) 2020-05-29 2020-09-02 图像定位模型获取方法及装置、终端和存储介质
TW110100513A TWI780563B (zh) 2020-05-29 2021-01-06 圖像定位模型獲取方法、終端和電腦可讀儲存介質

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010478436.7A CN111522988B (zh) 2020-05-29 2020-05-29 图像定位模型获取方法及相关装置

Publications (2)

Publication Number Publication Date
CN111522988A CN111522988A (zh) 2020-08-11
CN111522988B true CN111522988B (zh) 2022-07-15

Family

ID=71909243

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010478436.7A Active CN111522988B (zh) 2020-05-29 2020-05-29 图像定位模型获取方法及相关装置

Country Status (3)

Country Link
CN (1) CN111522988B (zh)
TW (1) TWI780563B (zh)
WO (1) WO2021237973A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111522988B (zh) * 2020-05-29 2022-07-15 深圳市商汤科技有限公司 图像定位模型获取方法及相关装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108898643A (zh) * 2018-06-15 2018-11-27 广东数相智能科技有限公司 图像生成方法、装置与计算机可读存储介质
AU2018101640A4 (en) * 2018-11-01 2018-12-06 Macau University Of Science And Technology A system and method for image processing
CN110413812A (zh) * 2019-08-06 2019-11-05 北京字节跳动网络技术有限公司 神经网络模型的训练方法、装置、电子设备及存储介质
CN110532417A (zh) * 2019-09-02 2019-12-03 河北省科学院应用数学研究所 基于深度哈希的图像检索方法、装置及终端设备
CN111178249A (zh) * 2019-12-27 2020-05-19 杭州艾芯智能科技有限公司 人脸比对的方法、装置、计算机设备及存储介质

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014210334A1 (en) * 2013-06-28 2014-12-31 President And Fellows Of Harvard College Machine learning enchanced by human measurements
CN106202329B (zh) * 2016-07-01 2018-09-11 北京市商汤科技开发有限公司 样本数据处理、数据识别方法和装置、计算机设备
CN107145900B (zh) * 2017-04-24 2019-07-26 清华大学 基于一致性约束特征学习的行人再识别方法
US10896218B2 (en) * 2017-12-22 2021-01-19 Oracle International Corporation Computerized geo-referencing for images
CN110070579A (zh) * 2019-03-16 2019-07-30 平安科技(深圳)有限公司 基于图像检测的定位方法、装置、设备和存储介质
CN110347854B (zh) * 2019-06-13 2022-02-22 西安理工大学 基于目标定位的图像检索方法
CN110472092B (zh) * 2019-07-15 2021-11-16 清华大学 一种街景图片的地理定位方法及***
CN111522988B (zh) * 2020-05-29 2022-07-15 深圳市商汤科技有限公司 图像定位模型获取方法及相关装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108898643A (zh) * 2018-06-15 2018-11-27 广东数相智能科技有限公司 图像生成方法、装置与计算机可读存储介质
AU2018101640A4 (en) * 2018-11-01 2018-12-06 Macau University Of Science And Technology A system and method for image processing
CN110413812A (zh) * 2019-08-06 2019-11-05 北京字节跳动网络技术有限公司 神经网络模型的训练方法、装置、电子设备及存储介质
CN110532417A (zh) * 2019-09-02 2019-12-03 河北省科学院应用数学研究所 基于深度哈希的图像检索方法、装置及终端设备
CN111178249A (zh) * 2019-12-27 2020-05-19 杭州艾芯智能科技有限公司 人脸比对的方法、装置、计算机设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于视频的多目标跟踪算法研究;周娜;《中国优秀硕士学位论文全文库》;20180715;正文第22-40页 *

Also Published As

Publication number Publication date
CN111522988A (zh) 2020-08-11
WO2021237973A1 (zh) 2021-12-02
TWI780563B (zh) 2022-10-11
TW202145075A (zh) 2021-12-01

Similar Documents

Publication Publication Date Title
US20180261005A1 (en) Method and Apparatus for Constructing Three-Dimensional Map
CN108304835A (zh) 文字检测方法和装置
CN111046125A (zh) 一种视觉定位方法、***及计算机可读存储介质
CN107292907B (zh) 一种对跟随目标进行定位的方法以及跟随设备
CN111832447B (zh) 建筑图纸构件识别方法、电子设备及相关产品
CN111323024B (zh) 定位方法及装置、设备、存储介质
CN110765882B (zh) 一种视频标签确定方法、装置、服务器及存储介质
CN111623765B (zh) 基于多模态数据的室内定位方法及***
CN115311730B (zh) 一种人脸关键点的检测方法、***和电子设备
CN111859002B (zh) 兴趣点名称生成方法及装置、电子设备和介质
CN116580257A (zh) 特征融合模型训练及样本检索方法、装置和计算机设备
KR20190114652A (ko) Slam 기반 카메라 추적에서 라벨된 키프레임을 이용한 이미지 특징 매칭 방법 및 장치
CN111784776A (zh) 视觉定位方法及装置、计算机可读介质和电子设备
CN113537254A (zh) 图像特征提取方法、装置、电子设备及可读存储介质
CN113822427A (zh) 一种模型训练的方法、图像匹配的方法、装置及存储介质
CN111522988B (zh) 图像定位模型获取方法及相关装置
CN113592015A (zh) 定位以及训练特征匹配网络的方法和装置
CN111310595B (zh) 用于生成信息的方法和装置
CN116030323B (zh) 图像处理方法以及装置
CN113515983A (zh) 模型训练方法、移动对象识别方法、装置及设备
CN110738194A (zh) 一种基于点云有序编码的三维物体识别方法
CN115618099A (zh) 神经网络架构搜索的方法、装置及电子设备
CN114760684A (zh) 无线定位方法、路径识别模型的训练方法和装置
CN110826568A (zh) 基于路标的室内定位方法、装置和电子设备
CN114417946A (zh) 目标检测方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40026302

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant