CN109189970A - 图片相似度比对方法和装置 - Google Patents

图片相似度比对方法和装置 Download PDF

Info

Publication number
CN109189970A
CN109189970A CN201811096782.8A CN201811096782A CN109189970A CN 109189970 A CN109189970 A CN 109189970A CN 201811096782 A CN201811096782 A CN 201811096782A CN 109189970 A CN109189970 A CN 109189970A
Authority
CN
China
Prior art keywords
picture
measured
target photo
emphasis
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811096782.8A
Other languages
English (en)
Inventor
周佩明
汪振华
李旭峰
梅涛
周伯文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Original Assignee
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Century Trading Co Ltd, Beijing Jingdong Shangke Information Technology Co Ltd filed Critical Beijing Jingdong Century Trading Co Ltd
Priority to CN201811096782.8A priority Critical patent/CN109189970A/zh
Publication of CN109189970A publication Critical patent/CN109189970A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本公开提供了一种图片相似度比对方法和装置,涉及图像识别领域。该方法包括:提取待测图片和目标图片的全局信息,以及待测图片和目标图片的重点信息;将待测图片的全局信息与目标图片的全局信息进行比对确定第一相似度;若第一相似度大于第一阈值,则将待测图片的重点信息与目标图片的重点信息进行比对确定第二相似度;若第二相似度大于第二阈值,则确定待测图片与目标图片相似。本公开在兼顾整体相似度的同时,能够通过比对重点信息来判别图片是否为相似图片,从而兼顾图片相似度比对的准确率和召回率,进而提高了图片识别的准确性。

Description

图片相似度比对方法和装置
技术领域
本公开涉及图像识别领域,尤其涉及一种图片相似度比对方法和装置。
背景技术
现有图片相似度比对,通常在准确率和召回率之间做适当的折衷。比如,在图片搜索领域,更看重其召回率,而在精确的图片比对领域,则更看重准确率。但是,实际上在图片相似度比对领域,对于准确率和召回率都有较高的要求。
例如,比较同一本书的封面照片与网络上的图书封面照片是否相同,是否有版本变化导致的文字不同、封面重新设计等。要求一方面要识别很精细的不同,如文字内容的变化,但另一方面,要求过滤掉光照、反光、污损、尺寸设计不规范、贴有腰封及防伪标签等诸多噪音。前述的流行的图片比对方法能够过滤掉噪音的影响,将相同的一本书判定为“相同”,但无法识别精细的文字区别。而采用类似Siamese Network(孪生网络)等的深度学习方法,将两张图作为网络的差分输入,虽然能够达到精确识别文字区别的目的,却难以忽略过多的噪音影响。
发明内容
本公开要解决的一个技术问题是提供一种图片相似度比对方法和装置,能够兼顾图片相似度比对的准确率和召回率,进而提高了图片识别的准确性。
根据本公开一方面,提出一种图片相似度比对方法,包括:提取待测图片和目标图片的全局信息,以及待测图片和目标图片的重点信息;将待测图片的全局信息与目标图片的全局信息进行比对确定第一相似度;若第一相似度大于第一阈值,则将待测图片的重点信息与目标图片的重点信息进行比对确定第二相似度;若第二相似度大于第二阈值,则确定待测图片与目标图片相似。
可选地,提取待测图片和目标图片的重点信息包括:确定待测图片中的重点子图和目标图片中的重点子图;提取待测图片的重点子图的特征向量以及目标图片的重点子图的特征向量;将待测图片的重点信息与目标图片的重点信息进行比对确定第二相似度包括:将待测图片的重点子图的特征向量,与目标图片对应区域的重点子图的特征向量进行对比,确定第二相似度。
可选地,确定重点子图包括:确定待测图片和/或目标图片中重点内容所在区域;将重点内容所在区域对应的图像作为重点子图。
可选地,重点内容为能够标志图片区分度的内容。
可选地,基于光学文字识别算法和/或物体识别算法确定重点内容所在区域。
可选地,确定待测图片的全局信息以及目标图片的重点信息包括:提取待测图片的特征向量以及目标图片的特征向量;将待测图片的全局信息与目标图片的全局信息进行比对确定第一相似度包括:将待测图片的特征向量与目标图片的特征向量进行比对确定第一相似度。
可选地,基于第一特性向量提取模型提取重点子图的特征向量。
可选地,该方法还包括:对样本图片中的重点子图的特性向量进行标注生成第一标注文件;基于样本图片的重点子图和第一标注文件对第一特征向量提取模型进行训练。
可选地,基于第二特征向量提取模型提取待测图片和目标图片的特征向量。
可选地,对样本图片的特性向量进行标注生成第二标注文件;基于样本图片和第二标注文件对第二特征向量提取模型进行训练。
根据本公开的另一方面,还提出一种图片相似度比对装置,包括:全局信息提取单元,用于提取待测图片和目标图片的全局信息;重点信息提取单元,用于待测图片和目标图片的重点信息;全局信息比对单元,用于将待测图片的全局信息与目标图片的全局信息进行比对确定第一相似度;重点信息比对单元,用于若第一相似度大于第一阈值,则将待测图片的重点信息与目标图片的重点信息进行比对确定第二相似度;相似度确定单元,用于若第二相似度大于第二阈值,则确定待测图片与目标图片相似。
可选地,重点信息提取单元用于确定待测图片中的重点子图和目标图片中的重点子图,提取待测图片的重点子图的特征向量以及目标图片的重点子图的特征向量;重点信息比对单元用于将待测图片的重点子图的特征向量与目标图片对应区域的重点子图的特征向量进行对比,确定第二相似度。
可选地,重点信息提取单元还用于确定待测图片和/或目标图片中重点内容所在区域,将重点内容所在区域对应的图像作为重点子图。
可选地,重点内容为能够标志图片区分度的内容。
可选地,重点信息提取单元用于基于光学文字识别算法和/或物体识别算法确定重点内容所在区域。
可选地,全局信息提取单元用于提取待测图片的特征向量以及目标图片的特征向量;全局信息比对单元用于将待测图片的特征向量与目标图片的特征向量进行比对确定第一相似度。
可选地,重点信息提取单元还用于基于第一特性向量提取模型提取重点子图的特征向量。
可选地,该装置还包括:第一特性向量提取模型训练单元,用于对样本图片中的重点子图的特性向量进行标注生成第一标注文件,基于样本图片的重点子图和第一标注文件对第一特征向量提取模型进行训练。
可选地,全局信息提取单元还用于基于第二特征向量提取模型提取待测图片和目标图片的特征向量。
可选地,该装置还包括:第二特征向量提取模型训练单元,用于对样本图片的特性向量进行标注生成第二标注文件,基于样本图片和第二标注文件对第二特征向量提取模型进行训练。
根据本公开的另一方面,还提出一种图片相似度比对装置,包括:存储器;以及耦接至存储器的处理器,处理器被配置为基于存储在存储器的指令执行如上述的图片相似度对比方法。
根据本公开的另一方面,还提出一种计算机可读存储介质,其上存储有计算机程序指令,该指令被处理器执行时实现上述的图片相似度对比方法的步骤。
与现有技术相比,本公开实施例在兼顾整体相似度的同时,能够通过比对重点信息来判别图片是否为相似图片,从而兼顾图片相似度比对的准确率和召回率,进而提高了图片识别的准确性。
通过以下参照附图对本公开的示例性实施例的详细描述,本公开的其它特征及其优点将会变得清楚。
附图说明
构成说明书的一部分的附图描述了本公开的实施例,并且连同说明书一起用于解释本公开的原理。
参照附图,根据下面的详细描述,可以更加清楚地理解本公开,其中:
图1为本公开图片相似度比对方法的一个实施例的流程示意图。
图2为本公开图片相似度比对方法的另一个实施例的流程示意图。
图3为本公开图片相似度比对方法的再一个实施例的流程示意图。
图4为本公开图片相似度比对装置一个实施例的结构示意图。
图5为本公开图片相似度比对装置另一个实施例的结构示意图。
图6为本公开图片相似度比对装置再一个实施例的结构示意图。
图7为本公开图片相似度比对装置又一个实施例的结构示意图。
具体实施方式
现在将参照附图来详细描述本公开的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。
同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本公开及其应用或使用的任何限制。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为授权说明书的一部分。
在这里示出和讨论的所有示例中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它示例可以具有不同的值。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
为使本公开的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本公开进一步详细说明。
图1为本公开图片相似度比对方法的一个实施例的流程示意图。
在步骤110,提取待测图片和目标图片的全局信息,以及待测图片和目标图片的重点信息。图片的全局信息例如为图片颜色、尺寸大小等整体粗略信息。图片的重点信息例如为局部文字版本、商标等细节信息。
在步骤120,将待测图片的全局信息与目标图片的全局信息进行比对确定第一相似度。该步骤为粗粒度比对,即放松比对的距离阈值,忽略掉小的不同,只关注大面积的画面不同。在整张图片采取粗粒度比对时,主要关注图片的召回率。
在步骤130,若第一相似度大于第一阈值,则将待测图片的重点信息与目标图片的重点信息进行比对确定第二相似度。其中,若第一相似度小于等于第一阈值,则说明图片之间有较大的区别,即待测图片与目标图片不相似。若第一相似度大于第一阈值,则需要比对图片中能够标志图片区分度的重点信息,对图片进行细粒度比对。在细粒度比对时,主要关注图片的准确率。
在步骤140,若第二相似度大于第二阈值,则确定待测图片与目标图片相似。即若通过细粒度比对,图片的相似度大于阈值,则说明两张图片相同。
在该实施例中,在兼顾整体相似度的同时,能够通过比对重点信息来判别图片是否为相似图片,从而兼顾图片相似度比对的准确率和召回率,进而提高了图片识别的准确性。
图2为本公开图片相似度比对方法的另一个实施例的流程示意图。
在步骤210,提取待测图片的特征向量以及目标图片的特征向量。
在一个实施例中,可以基于第二特征向量提取模型提取待测图片和目标图片的特征向量。其中,可以先对样本图片的特性向量进行标注生成第二标注文件,然后基于样本图片和第二标注文件对第二特征向量提取模型进行训练。在训练好第二特征向量提取模型后,将待测图片和目标图片分别输入至该模型,则可以获取待测图片的特征向量以及目标图片的特征向量。
在一个实施例中,该第二特征向量提取模型采用深度学习CNN(ConvolutionalNeural Network,卷积神经网络)技术。
在步骤220,确定待测图片中的重点子图和目标图片中的重点子图。例如,先确定待测图片和目标图片中重点内容所在区域,将重点内容所在区域对应的图像作为重点子图。其中,重点内容为能够标志图片区分度的内容。例如,对于图书,若图书画面的图案基本一致,但文字信息为“第一版”和“第二版”,则说明这两本书不是同一本书,该“第一版”和“第二版”即为重点内容。
在一个实施例中,可以基于光学文字识别算法或者物体识别算法确定重点内容所在区域。例如,可以利用光学文字识别算法检测出文字区域,可以利用物体识别算法检测出图片中的商标图案等。其中,重点内容能够从本质上区分图片的相似性。
在步骤230,提取待测图片的重点子图的特征向量以及目标图片的重点子图的特征向量。
在一个实施例中,可以基于第一特性向量提取模型提取重点子图的特征向量。其中,先对样本图片中的重点子图的特性向量进行标注生成第一标注文件;基于样本图片的重点子图和第一标注文件对第一特征向量提取模型进行训练。在训练好第一特征向量提取模型后,将待测图片中的重点子图和目标图片中的重点子图分别输入至第一特性向量提取模型,可以获得待测图片的重点子图的特征向量以及目标图片的重点子图的特征向量。
在一个实施例中,该第一特征向量提取模型采用深度学习CNN技术。第一特征向量提取模型与第二特征向量提取模型可采用相同结构的网络,通过采用相应的图片来训练,获取不同的识别能力。通过比对第二特征向量提取模型输出的特征向量能够判断较大的图像差别,忽略较小的、细节的不同,通过比对第一特征向量提取模型输出的特征向量能够判断细微的图像差别。
在步骤240,将待测图片的特征向量与目标图片的特征向量进行比对确定第一相似度。
在步骤250,判断第一相似度是否大于第一阈值,若是,则执行步骤260,否则,执行步骤290。
在步骤260,将待测图片的重点子图的特征向量与目标图片对应区域的重点子图的特征向量进行对比,确定第二相似度。
其中,重点子图可以有多个,在进行比对时,应比对图片中同一区域的重点子图。例如,若图片中包含左上角的重点子图和右下角的重点子图,则可以向先比对待测图片左上角的重点子图的特征向量与目标图片左上角的重点子图的特征向量,然后比对待测图片右下角的重点子图的特征向量与目标图片右下角的重点子图的特征向量。
在步骤270,判断第二相似度是否大于第二阈值,若是,则执行步骤280,否则,执行步骤290。其中,第二阈值可以和第一阈值相同,也可以不同。
在步骤280,确定待测图片与目标图片相同。
在步骤290,确定待测图片与目标图片不相同。
在该实施例中,将图片全局信息与重点信息两个维度都进行比对,兼顾粗粒度与细粒度的区别,来提高图片识别的准确率与召回率,提高了图片识别的准确性。
图3为本公开图片相似度比对方法的再一个实施例的流程示意图。该实施例中以图书封面为例进行介绍。
在步骤310,对图书封面1和图书封面2进行预处理。
在步骤320,利用第二特征向量提取模型提取图书封面1和图书封面2的特征向量。
在步骤330,获取图书封面1和图书封面2能够标志图书封面区分度的文字区域。在该实施例中,将文字信息作为判断图书是否是同一本书的最重要和本质的依据,例如“上册”与“下册”标志着两本不是同一本书,“第一版”与“第二版”同样标志着两本不是同一本书,即使画面的图案基本一致。例如,可以利用光学文字识别算法将文字条目区域划分出来,切成一片一片的子图。
在一个实施例中,还可以将商标图案作为重点信息,例如利用物体识别算法识别出图书封面的商标图案。
在步骤340,将文字区域对齐。例如,将图书封面1中文字区域和图书封面2中文字区域的像素点进行平移,使得两个封面中对应的文字区域对齐。如分别判断“第一版”与“第二版”中“第”和“版”字是否对齐,若没对齐,则需要将图书封面1中的“第”与图书封面2中的“第”对齐,将图书封面1中的“版”与图书封面2中的“版”对齐,此时,图书封面1中的“一”与图书封面2中的“二”的区域也就对齐了。
在步骤350,利用第一特征向量提取模型提取图书封面1和图书封面2中文字区域的特征向量。其中,步骤350可以在步骤320之后执行。
在步骤360,判断图书封面1和图书封面2的特征向量的是否相似,若相似,则执行步骤370,否则,执行步骤390。
在步骤370,判断图书封面1和图书封面2中文字区域的特征向量是否相似,若相似,则执行步骤380,否则执行步骤390。
在步骤380,确定图书封面1和图书封面2相同。
在步骤390,确定图书封面1和图书封面2不相同。
在该实施例中,在兼顾整体相似度的同时,能够通过核心的、重点的区域信息,来判别图片是否为相似图片,能够智能的排除掉各种噪声导致的不同,而精确识别到文字的变化,即使对一个字的变化,也能识别出来。
图4为本公开图片相似度比对装置一个实施例的结构示意图。该装置包括全局信息提取单元410、重点信息提取单元420、全局信息比对单元430、重点信息比对单元440和相似度确定单元450。
全局信息提取单元410用于提取待测图片和目标图片的全局信息。
重点信息提取单元420用于待测图片和目标图片的重点信息。
全局信息比对单元430用于将待测图片的全局信息与目标图片的全局信息进行比对确定第一相似度。
重点信息比对单元440用于若第一相似度大于第一阈值,则将待测图片的重点信息与目标图片的重点信息进行比对确定第二相似度。
相似度确定单元450用于若第二相似度大于第二阈值,则确定待测图片与目标图片相似。
在该实施例中,在兼顾整体相似度的同时,能够通过比对重点信息来判别图片是否为相似图片,从而兼顾图片相似度比对的准确率和召回率,进而提高了图片识别的准确性。
在本公开的另一个实施例中,全局信息提取单元410用于提取待测图片的特征向量以及目标图片的特征向量。例如,可以基于第二特征向量提取模型提取待测图片和目标图片的特征向量。
重点信息提取单元420用于确定待测图片中的重点子图和目标图片中的重点子图,提取待测图片的重点子图的特征向量以及目标图片的重点子图的特征向量。例如,确定待测图片和目标图片中重点内容所在区域,将重点内容所在区域对应的图像作为重点子图,基于第一特性向量提取模型提取重点子图的特征向量。在一个实施例中,可以基于光学文字识别算法或者物体识别算法确定重点内容所在区域。
全局信息比对单元430用于将待测图片的特征向量与目标图片的特征向量进行比对确定第一相似度。
重点信息比对单元440用于若第一相似度大于第一阈值,则将待测图片的重点子图的特征向量与目标图片对应区域的重点子图的特征向量进行对比,确定第二相似度
相似度确定单元450用于若第二相似度大于第二阈值,则确定待测图片与目标图片相似。若第二相似度小于等于第二阈值,或者第一相似度小于等于第一阈值,则确定待测图片与目标图片不相似。
在该实施例中,一方面,对整张图片采取粗粒度的比对,识别图片的较大的不同之处,主要关注提高召回率;另一方面,针对图片的实际应用,找出图片中的能标志图片区分度的重点内容,将其位置检测出来,进行细粒度的比对,主要关注其准确率;这样两个维度的比对,提高了图片识别的准确性。
图5为本公开图片相似度比对装置另一个实施例的结构示意图。该装置还包括第一特性向量提取模型训练单元510和第二特征向量提取模型训练单元520。
第一特性向量提取模型训练单元510用于对样本图片中的重点子图的特性向量进行标注生成第一标注文件,基于样本图片的重点子图和第一标注文件对第一特征向量提取模型进行训练。在训练好第一特征向量提取模型后,重点信息提取单元420将待测图片中的重点子图和目标图片中的重点子图分别输入至第一特性向量提取模型,可以获得待测图片的重点子图的特征向量以及目标图片的重点子图的特征向量。
在一个实施例中,该第一特征向量提取模型采用深度学习CNN技术。
第二特征向量提取模型训练单元520用于对样本图片的特性向量进行标注生成第二标注文件,基于样本图片和第二标注文件对第二特征向量提取模型进行训练。在训练好第二特征向量提取模型后,全局信息提取单元410将待测图片和目标图片分别输入至该模型,则可以获取待测图片的特征向量以及目标图片的特征向量。
在一个实施例中,该第二特征向量提取模型采用深度学习CNN技术。
第一特征向量提取模型与第二特征向量提取模型可采用相同结构的网络,通过采用相应的图片来训练,获取不同的识别能力。通过比对第二特征向量提取模型输出的特征向量能够判断较大的图像差别,忽略较小的、细节的不同,通过比对第一特征向量提取模型输出的特征向量能够判断细微的图像差别。
图6为本公开图片相似度比对装置再一个实施例的结构示意图。该装置包括存储器610和处理器620,其中:存储器610可以是磁盘、闪存或其它任何非易失性存储介质。存储器用于存储图1-3所对应实施例中的指令。处理器620耦接至存储器610,可以作为一个或多个集成电路来实施,例如微处理器或微控制器。该处理器620用于执行存储器中存储的指令。
在一个实施例中,还可以如图7所示,该装置700包括存储器710和处理器720。处理器720通过BUS总线730耦合至存储器710。该装置700还可以通过存储接口740连接至外部存储装置750以便调用外部数据,还可以通过网络接口760连接至网络或者另外一台计算机***(未标出),此处不再进行详细介绍。
在该实施例中,通过存储器存储数据指令,再通过处理器处理上述指令,在兼顾整体相似度的同时,能够通过比对重点信息来判别图片是否为相似图片,从而兼顾图片相似度比对的准确率和召回率,进而提高了图片识别的准确性。
在另一个实施例中,一种计算机可读存储介质,其上存储有计算机程序指令,该指令被处理器执行时实现图1-3所对应实施例中的方法的步骤。本领域内的技术人员应明白,本公开的实施例可提供为方法、装置、或计算机程序产品。因此,本公开可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用非瞬时性存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本公开是参照根据本公开实施例的方法、设备(***)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
至此,已经详细描述了本公开。为了避免遮蔽本公开的构思,没有描述本领域所公知的一些细节。本领域技术人员根据上面的描述,完全可以明白如何实施这里公开的技术方案。
虽然已经通过示例对本公开的一些特定实施例进行了详细说明,但是本领域的技术人员应该理解,以上示例仅是为了进行说明,而不是为了限制本公开的范围。本领域的技术人员应该理解,可在不脱离本公开的范围和精神的情况下,对以上实施例进行修改。本公开的范围由所附权利要求来限定。

Claims (22)

1.一种图片相似度比对方法,包括:
提取待测图片和目标图片的全局信息,以及所述待测图片和所述目标图片的重点信息;
将所述待测图片的全局信息与所述目标图片的全局信息进行比对确定第一相似度;
若所述第一相似度大于第一阈值,则将所述待测图片的重点信息与所述目标图片的重点信息进行比对确定第二相似度;
若所述第二相似度大于第二阈值,则确定所述待测图片与所述目标图片相似。
2.根据权利要求1所述的图片相似度比对方法,其中,
提取所述待测图片和所述目标图片的重点信息包括:
确定所述待测图片中的重点子图和所述目标图片中的重点子图;
提取所述待测图片的重点子图的特征向量以及所述目标图片的重点子图的特征向量;
将所述待测图片的重点信息与所述目标图片的重点信息进行比对确定第二相似度包括:
将所述待测图片的重点子图的特征向量,与所述目标图片对应区域的重点子图的特征向量进行对比,确定所述第二相似度。
3.根据权利要求2所述的图片相似度比对方法,其中,确定重点子图包括:
确定所述待测图片和/或所述目标图片中重点内容所在区域;
将所述重点内容所在区域对应的图像作为所述重点子图。
4.根据权利要求3所述的图片相似度比对方法,其中,
所述重点内容为能够标志图片区分度的内容。
5.根据权利要求3所述的图片相似度比对方法,其中,
基于光学文字识别算法和/或物体识别算法确定所述重点内容所在区域。
6.根据权利要求2所述的图片相似度比对方法,其中,确定待测图片的全局信息以及目标图片的重点信息包括:
提取所述待测图片的特征向量以及所述目标图片的特征向量;
将所述待测图片的全局信息与所述目标图片的全局信息进行比对确定第一相似度包括:
将所述待测图片的特征向量与所述目标图片的特征向量进行比对确定所述第一相似度。
7.根据权利要求2-5任一所述的图片相似度对比方法,其中,
基于第一特性向量提取模型提取所述重点子图的特征向量。
8.根据权利要求7所述的图片相似度对比方法,还包括:
对样本图片中的重点子图的特性向量进行标注生成第一标注文件;
基于所述样本图片的重点子图和所述第一标注文件对所述第一特征向量提取模型进行训练。
9.根据权利要求6所述的图片相似度对比方法,其中,
基于第二特征向量提取模型提取所述待测图片和所述目标图片的特征向量。
10.根据权利要求9所述的图片相似度对比方法,还包括:
对样本图片的特性向量进行标注生成第二标注文件;
基于所述样本图片和所述第二标注文件对所述第二特征向量提取模型进行训练。
11.一种图片相似度比对装置,包括:
全局信息提取单元,用于提取待测图片和目标图片的全局信息;
重点信息提取单元,用于所述待测图片和所述目标图片的重点信息;
全局信息比对单元,用于将所述待测图片的全局信息与所述目标图片的全局信息进行比对确定第一相似度;
重点信息比对单元,用于若所述第一相似度大于第一阈值,则将所述待测图片的重点信息与所述目标图片的重点信息进行比对确定第二相似度;
相似度确定单元,用于若所述第二相似度大于第二阈值,则确定所述待测图片与所述目标图片相似。
12.根据权利要求11所述的图片相似度比对装置,其中,
所述重点信息提取单元用于确定所述待测图片中的重点子图和所述目标图片中的重点子图,提取所述待测图片的重点子图的特征向量以及所述目标图片的重点子图的特征向量;
所述重点信息比对单元用于将所述待测图片的重点子图的特征向量与所述目标图片对应区域的重点子图的特征向量进行对比,确定所述第二相似度。
13.根据权利要求12所述的图片相似度比对装置,其中,
所述重点信息提取单元还用于确定所述待测图片和/或所述目标图片中重点内容所在区域,将所述重点内容所在区域对应的图像作为所述重点子图。
14.根据权利要求13所述的图片相似度比对装置,其中,
所述重点内容为能够标志图片区分度的内容。
15.根据权利要求13所述的图片相似度比对装置,其中,
所述重点信息提取单元用于基于光学文字识别算法和/或物体识别算法确定所述重点内容所在区域。
16.根据权利要求12所述的图片相似度比对装置,其中,
所述全局信息提取单元用于提取所述待测图片的特征向量以及所述目标图片的特征向量;
所述全局信息比对单元用于将所述待测图片的特征向量与所述目标图片的特征向量进行比对确定所述第一相似度。
17.根据权利要求12-15任一所述的图片相似度比对装置,其中,
所述重点信息提取单元还用于基于第一特性向量提取模型提取所述重点子图的特征向量。
18.根据权利要求17所述的图片相似度比对装置,还包括:
第一特性向量提取模型训练单元,用于对样本图片中的重点子图的特性向量进行标注生成第一标注文件,基于所述样本图片的重点子图和所述第一标注文件对所述第一特征向量提取模型进行训练。
19.根据权利要求16所述的图片相似度比对装置,其中,
所述全局信息提取单元还用于基于第二特征向量提取模型提取所述待测图片和所述目标图片的特征向量。
20.根据权利要求19所述的图片相似度比对装置,还包括:
第二特征向量提取模型训练单元,用于对样本图片的特性向量进行标注生成第二标注文件,基于所述样本图片和所述第二标注文件对所述第二特征向量提取模型进行训练。
21.一种图片相似度比对装置,包括:
存储器;以及
耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器的指令执行如权利要求1至10任一项所述的图片相似度对比方法。
22.一种计算机可读存储介质,其上存储有计算机程序指令,该指令被处理器执行时实现权利要求1至10任一项所述的图片相似度对比方法的步骤。
CN201811096782.8A 2018-09-20 2018-09-20 图片相似度比对方法和装置 Pending CN109189970A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811096782.8A CN109189970A (zh) 2018-09-20 2018-09-20 图片相似度比对方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811096782.8A CN109189970A (zh) 2018-09-20 2018-09-20 图片相似度比对方法和装置

Publications (1)

Publication Number Publication Date
CN109189970A true CN109189970A (zh) 2019-01-11

Family

ID=64908802

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811096782.8A Pending CN109189970A (zh) 2018-09-20 2018-09-20 图片相似度比对方法和装置

Country Status (1)

Country Link
CN (1) CN109189970A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110033023A (zh) * 2019-03-11 2019-07-19 北京光年无限科技有限公司 一种基于绘本识别的图像数据处理方法及***
CN110533057A (zh) * 2019-04-29 2019-12-03 浙江科技学院 一种单样本与少样本场景下的汉字验证码识别方法
CN110598019A (zh) * 2019-09-11 2019-12-20 腾讯科技(深圳)有限公司 重复图像识别方法及装置
CN110737417A (zh) * 2019-09-30 2020-01-31 深圳市格上视点科技有限公司 一种演示设备及其标注线的显示控制方法和装置
CN110781917A (zh) * 2019-09-18 2020-02-11 北京三快在线科技有限公司 重复图像的检测方法、装置、电子设备及可读存储介质
CN112434727A (zh) * 2020-05-02 2021-03-02 支付宝实验室(新加坡)有限公司 身份证明文件认证方法和***
CN112733578A (zh) * 2019-10-28 2021-04-30 普天信息技术有限公司 车辆重识别方法及***
WO2021244138A1 (zh) * 2020-06-04 2021-12-09 Oppo广东移动通信有限公司 表盘生成方法、装置、电子设备和计算机可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100191722A1 (en) * 2006-08-07 2010-07-29 Oren Boiman Data similarity and importance using local and global evidence scores
CN106933867A (zh) * 2015-12-30 2017-07-07 杭州华为企业通信技术有限公司 一种图像查询方法和装置
CN107239565A (zh) * 2017-06-14 2017-10-10 电子科技大学 一种基于显著性区域的图像检索方法
CN107330359A (zh) * 2017-05-23 2017-11-07 深圳市深网视界科技有限公司 一种人脸对比的方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100191722A1 (en) * 2006-08-07 2010-07-29 Oren Boiman Data similarity and importance using local and global evidence scores
CN106933867A (zh) * 2015-12-30 2017-07-07 杭州华为企业通信技术有限公司 一种图像查询方法和装置
CN107330359A (zh) * 2017-05-23 2017-11-07 深圳市深网视界科技有限公司 一种人脸对比的方法和装置
CN107239565A (zh) * 2017-06-14 2017-10-10 电子科技大学 一种基于显著性区域的图像检索方法

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110033023B (zh) * 2019-03-11 2021-06-15 北京光年无限科技有限公司 一种基于绘本识别的图像数据处理方法及***
CN110033023A (zh) * 2019-03-11 2019-07-19 北京光年无限科技有限公司 一种基于绘本识别的图像数据处理方法及***
CN110533057A (zh) * 2019-04-29 2019-12-03 浙江科技学院 一种单样本与少样本场景下的汉字验证码识别方法
CN110533057B (zh) * 2019-04-29 2022-08-12 浙江科技学院 一种单样本与少样本场景下的汉字验证码识别方法
CN110598019A (zh) * 2019-09-11 2019-12-20 腾讯科技(深圳)有限公司 重复图像识别方法及装置
CN110781917A (zh) * 2019-09-18 2020-02-11 北京三快在线科技有限公司 重复图像的检测方法、装置、电子设备及可读存储介质
CN110781917B (zh) * 2019-09-18 2021-03-02 北京三快在线科技有限公司 重复图像的检测方法、装置、电子设备及可读存储介质
CN110737417A (zh) * 2019-09-30 2020-01-31 深圳市格上视点科技有限公司 一种演示设备及其标注线的显示控制方法和装置
CN110737417B (zh) * 2019-09-30 2024-01-23 深圳市格上视点科技有限公司 一种演示设备及其标注线的显示控制方法和装置
CN112733578A (zh) * 2019-10-28 2021-04-30 普天信息技术有限公司 车辆重识别方法及***
CN112733578B (zh) * 2019-10-28 2024-05-24 普天信息技术有限公司 车辆重识别方法及***
CN112434727A (zh) * 2020-05-02 2021-03-02 支付宝实验室(新加坡)有限公司 身份证明文件认证方法和***
WO2021244138A1 (zh) * 2020-06-04 2021-12-09 Oppo广东移动通信有限公司 表盘生成方法、装置、电子设备和计算机可读存储介质

Similar Documents

Publication Publication Date Title
CN109189970A (zh) 图片相似度比对方法和装置
US11610394B2 (en) Neural network model training method and apparatus, living body detecting method and apparatus, device and storage medium
CN106874909B (zh) 一种图像字符的识别方法及其装置
KR102128533B1 (ko) 머신러닝을 이용한 상품 인식을 위한 특징점 관리 장치 및 방법
US9910847B2 (en) Language identification
CN106294344B (zh) 视频检索方法和装置
CN105956059A (zh) 基于情绪识别的信息推荐方法和装置
CN103838566A (zh) 信息处理装置和信息处理方法
CN110136198A (zh) 图像处理方法及其装置、设备和存储介质
CN113469067B (zh) 一种文档解析方法、装置、计算机设备和存储介质
Silanon Thai Finger‐Spelling Recognition Using a Cascaded Classifier Based on Histogram of Orientation Gradient Features
CN107644105A (zh) 一种搜题方法及装置
CN110363190A (zh) 一种文字识别方法、装置及设备
JP7141518B2 (ja) 指静脈照合方法、装置、コンピュータ機器、及び記憶媒体
CN112200031A (zh) 一种用于生成图像对应文字说明的网络模型训练方法与设备
Singh et al. Face recognition using open source computer vision library (OpenCV) with Python
CN105740879B (zh) 基于多模态判别分析的零样本图像分类方法
Sanalohit et al. TFS recognition: Investigating MPH]{Thai finger spelling recognition: Investigating MediaPipe Hands potentials
CN114282258A (zh) 截屏数据脱敏方法、装置、计算机设备及存储介质
CN110059542A (zh) 基于改进的Resnet的人脸活体检测的方法及相关设备
CN103984415B (zh) 一种信息处理方法及电子设备
CN109660621A (zh) 一种内容推送方法及服务设备
KR20190115509A (ko) 자동 수어 인식 방법 및 시스템
Vidhyalakshmi et al. Text detection in natural images with hybrid stroke feature transform and high performance deep Convnet computing
Zhang et al. Face occlusion detection using cascaded convolutional neural network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination