CN108764068A - 一种图像识别方法和装置 - Google Patents

一种图像识别方法和装置 Download PDF

Info

Publication number
CN108764068A
CN108764068A CN201810431353.5A CN201810431353A CN108764068A CN 108764068 A CN108764068 A CN 108764068A CN 201810431353 A CN201810431353 A CN 201810431353A CN 108764068 A CN108764068 A CN 108764068A
Authority
CN
China
Prior art keywords
image
similarity
feature vector
group
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810431353.5A
Other languages
English (en)
Inventor
沈操
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Dami Technology Co Ltd
Original Assignee
Beijing Dami Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Dami Technology Co Ltd filed Critical Beijing Dami Technology Co Ltd
Priority to CN201810431353.5A priority Critical patent/CN108764068A/zh
Publication of CN108764068A publication Critical patent/CN108764068A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/30Scenes; Scene-specific elements in albums, collections or shared content, e.g. social network photos or video
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开一种图像识别方法,包括:根据每个图像的特征生成一个对应的特征向量;将所有特征向量两两成对比较,计算每两个特征向量的相似度;筛选相似度高于设定值的图像对,并将保留的图像对按照相似度进行排序,本发明还公开了一种图像识别装置。本发明提供了学员运用在线教育***时的身份验证和教学过程中是否是学员本人的检测功能,在图像识别过程中提取图像特征,并通过特征向量间的距离来确定图像间的相似度,比较过程中逐步删除相似度较小的图像来简化计算,识别效率高,节省计算量,提高识别速度,节省存储空间。

Description

一种图像识别方法和装置
技术领域
本发明涉及人脸识别领域。更具体地,涉及一种图像识别方法和装置。
背景技术
随着电脑的普及,互联网的快速发展,让在线教育产业链迎来了春天。在线教育(也称为e-Learning)是通过应用信息科技和互联网技术进行课程内容传播分享和快速学习的方法。在线教育的教学方式以网络为介质,通过网络,学生与教师即使相隔万里也可以开展教学活动;此外,借助网络课件,学生还可以随时随地进行学习,真正打破了时间和空间的限制,为广大学习者提供了更为便捷和有效的学习方式,特别是对于工作繁忙,学习时间不固定的职场人而言网络远程教育是最为便利的学习方式。
现有的在线教育***,包括教师终端、网关服务器、学生终端等设备、教师终端提供课程的视频信息,然后宽带网关设备通过网关服务器将课程视频信息发送到学生终端,学生通过学生终端即可观看老师的讲课内容。然而,现有的***通常使用基于网线的网络,不利于学生分享学***台资源,如何提供更好的在线教育体验给学员成为一大难题。目前大多在线教育***平台,因不是面授课程,所以无法直接的查看学员的学习情况,也无法知道到底是不是学员本人在接受线上教育,从而导致出现不是本人或者上课缺席等现象,通过人脸识别两两比较计算量非常大,不仅耗时且需消耗大量资源。
因此,需要提供一种图像识别方法和装置。
发明内容
本发明的目的在于提供一种图像识别方法和装置,可在在线教育中监督学员自己认真学习并在不同的学习时间内快速搜索到同一个学员。
为达到上述目的,本发明采用下述技术方案:
一种图像识别方法,包括:
根据每个图像的特征分别生成对应于每个图像的特征向量;
将所有生成的特征向量两两成对比较,计算每两个特征向量的相似度;
筛选计算得到的相似度,若图像对的相似度高于设定值则予以保留,并将保留的图像对按照相似度进行排序。
进一步地,所述计算每两个特征向量的相似度包括:计算每两个特征向量之间的距离,距离越小则相似度越高。
进一步地,所述方法还包括:筛选相似度高于设定值的图像对后,将保留的图像对分组,分别对每组中的图像对按相似度排序。
进一步地,所述分别对每组中的图像对进行相似度排序包括:筛选并保留排序后每组中相似度高的前M个图像对,所述M为预先设定好的自然数。
进一步地,将所有分组中的前M个图像对合并后再次按照相似度排序,保留前K个相似度高的图像对,所述K为M与图像对分的组数的乘积。
本发明一个实施例还公开了一种图像识别装置,包括:
处理模块:用于根据每个图像的特征生成一个对应的特征向量;
比较模块:用于将所有特征向量两两成对比较,计算每两个特征向量的相似度;
筛选模块:用于筛选相似度高于设定值的图像对,并将保留的图像对按照相似度进行排序。
进一步地,所述比较模块还用于计算每两个特征向量之间的距离,距离越小则相似度越高。
进一步地,筛选模块还用于将保留的图像对分组,分别对每组中的图像对按相似度排序。
进一步地,所述筛选模块分别对每组中的图像对进行相似度排序包括:筛选并保留排序后每组中相似度高的前M个图像对,所述M为预先设定好的自然数。
进一步地,所述筛选模块还用于将所有分组中的前M个图像对合并后再次按照相似度排序,保留前K个相似度高的图像对,所述K为M与图像对分的组数的乘积。
本发明的一个实施例还公开了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述计算机可读存储介质在计算机上运行时,使得所述计算机执行上述的方法。
本发明的有益效果如下:
本发明所述技术方案提供了学员运用在线教育***时的身份验证和教学过程中是否是学员本人的检测功能,在图像识别过程中提取图像特征,并通过特征向量间的距离来确定图像间的相似度,比较过程中逐步删除相似度较小的图像来简化计算,识别效率高,节省计算量,提高识别速度,节省存储空间。
附图说明
下面结合附图对本发明的具体实施方式作进一步详细的说明;
图1为本发明一个实施例图像识别方法流程图;
图2为本发明一个实施例图像识别装置示意图;
图3为来实现本发明实施例的终端设备或服务器***的结构示意图。
具体实施方式
为了更清楚地说明本发明,下面结合优选实施例和附图对本发明做进一步的说明。附图中相似的部件以相同的附图标记进行表示。本领域技术人员应当理解,下面所具体描述的内容是说明性的而非限制性的,不应以此限制本发明的保护范围。
如图1所示,本发明一个实施例公开了一种图像识别方法,包括:
S1、根据每个图像的特征生成一个对应的特征向量。
本发明的目的在于在远程教育平台中,从N张人脸图片中,要快速找出相似的一对人脸图片。所谓一对人脸图片,就是假设图片P和图片Q,是属于同一个人,同一个人的两张面部图片。应用通用的人脸检测技术,一般是基于深度学习的方法,或者是基于HOG(histogram oriental gradient)特征,找出人脸的区域,以一个矩形框表示。检测到人脸区域后,求取人脸特征,提取的人脸特征是一个128维的向量。
需要说明的是,实施例中所述的图像不仅仅包括人脸图像,也可以为动物或植物图像,均可以使用本方法在大量图像中找出成对的图像。
S2、将所有特征向量两两成对比较,计算每两个特征向量的相似度。
对N个人脸图像进行两两比较,两两比较的相似度以两个特征向量间的距离值来衡量,每次比较产生一个距离值,共需要进行N*(N-1)/2次比较,共产生N*(N-1)/2个距离值。两个向量之间的距离,利用欧氏距离(也叫欧几里得距离)计算:dist(X,Y):
式中:n=128。
X是某个学员的人脸图像;是一个128维向量;
Y是另一个学员的人脸图像;是一个128维向量;
其中距离值dist(X,Y)越小,表示两个图像越相似;如果距离值是0,则表示完全相似,如表1所示:
表1
S3、筛选相似度高于设定值的图像对,并将保留的图像对按照相似度进行排序。
对所有表1中的距离值dist(X,Y),共N*(N-1)/2个距离值进行筛选,例如根据以往经验保留距离值小于等于0.4的图像对,对于图像对间的距离值大于0.4的直接排除,不予考虑。这样,就可以过滤掉很大一部分结果,把可能性不大(即图像相似度低)的结果都抛弃掉,只保留可能性大的(距离小的,相似度大的)结果,极大地简洁了后续的计算及存储空间,也大大缩短了计算所需的时间。
对保留下来的图像对进行分组,例如原始有20000*(20000-1)/2=199990000个距离比较结果,经上述实施例中根据距离阈值过滤后,只保存下来100000个结果,将这100000个结果分成100组,每组包含1000个结果,其中,第一组:第一行到第1000行;第二组:第1001行到第2000行;第三组:第2001行到第3000行;…;第一百组:第99001行到第100000行。
然后分别对每组中的1000个图像对进行排序,本实施例按照相似度降序排列,即排列越靠前的图像对表示相似度越高,相应的向量间距离值越小。此时对排序后的距离值进行再次筛选,只保留每组中预先设置好的若干个结果,例如,本次筛选总共需要相似度最高的K=5000个图像对,根据之前所分的100个分组,每组只保留总数1000个中的前M=50个相似度高的图像对即可满足条件。这样每组中的1000个数据互相独立,互不依赖,可以并行进行处理;排序处理时间大大缩短,并行之后的时间大概只是原来不进行并行计算的1/100。也可在排序时对每组中的1000个图像对进行相似度升序排列,即排列越靠后的图像对表示相似度越高,这样保留每组中后若干个相似度高的图像对即可。
最后,将100个分组的每组中筛选出的前M=50个结果合并后重新进行总的相似度排序,得到的K=5000个图像对,即为本次排序所需的相似度最高的图像对。
如图2所示,本发明的一个实施例还公开了一种图像识别装置,包括:
处理模块1:用于根据每个图像的特征生成一个对应的特征向量;
比较模块2:用于将所有特征向量两两成对比较,计算每两个特征向量的相似度;
筛选模块3:用于筛选相似度高于设定值的图像对,并将保留的图像对按照相似度进行排序。
其中,比较模块还用于计算每两个特征向量之间的距离,距离越小则相似度越高。筛选模块还用于将保留的图像对分组,例如100组,分别对每组中的图像对按相似度排序。筛选模块分别对每组中的图像对进行相似度排序包括:筛选并保留排序后每组中相似度高的前M=50个图像对。将所有分组中的前M=50个图像对合并后再次按照相似度排序,保留前K=5000个相似度高的图像对,所述K为M与图像对分的组数100的乘积。
下面参考图3,其示出了适于用实现本申请实施例的终端设备或服务器的计算机***的结构示意图。
如图3所示,计算机***包括中央处理单元(CPU),其可以根据存储在只读存储器(ROM)中的程序或者从存储部分加载到随机访问存储器(RAM)中的程序而执行各种适当的动作和处理。在RAM中,还存储有***操作所需的各种程序和数据。CPU、ROM以及RAM通过总线彼此相连。输入/输出(I/O)接口也连接至总线。
以下部件连接至I/O接口:包括键盘、鼠标等的输入部分;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分;包括硬盘等的存储部分;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分。通信部分经由诸如因特网的网络执行通信处理。驱动器也根据需要连接至I/O接口。可拆卸介质,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器上,以便于从其上读出的计算机程序根据需要被安装入存储部分。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括有形地包含在机器可读介质上的计算机程序,所述计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分从网络上被下载和安装,和/或从可拆卸介质被安装。
附图中的流程图和框图,图示了按照本发明各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,所述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括获取模块、确定模块和推荐模块。其中,这些模块的名称在某种情况下并不构成对该模块本身的限定,例如,获取模块还可以被描述为“用于图像识别的模块”。
作为另一方面,本申请还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中所述装置中所包含的计算机可读存储介质;也可以是单独存在,未装配入终端中的计算机可读存储介质。所述计算机可读存储介质存储有一个或者一个以上程序,所述程序被一个或者一个以上的处理器用来执行描述于本申请的用于图像识别的方法。
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定,对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动,这里无法对所有的实施方式予以穷举,凡是属于本发明的技术方案所引伸出的显而易见的变化或变动仍处于本发明的保护范围之列。

Claims (11)

1.一种图像识别方法,其特征在于,包括:
根据每个图像的特征分别生成对应于每个图像的特征向量;
将所有生成的特征向量两两成对比较,计算每两个特征向量的相似度;
筛选计算得到的相似度,若图像对的相似度高于设定值则予以保留,并将保留的图像对按照相似度进行排序。
2.根据权利要求1所述的方法,其特征在于,所述计算每两个特征向量的相似度包括:计算每两个特征向量之间的距离,距离越小则相似度越高。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:筛选相似度高于设定值的图像对后,将保留的图像对分组,分别对每组中的图像对按相似度排序。
4.根据权利要求3所述的方法,其特征在于,所述分别对每组中的图像对进行相似度排序包括:筛选并保留排序后每组中相似度高的前M个图像对,所述M为预先设定好的自然数。
5.根据权利要求4所述的方法,其特征在于,将所有分组中的前M个图像对合并后再次按照相似度排序,保留前K个相似度高的图像对,所述K为M与图像对分的组数的乘积。
6.一种图像识别装置,其特征在于,包括:
处理模块:用于根据每个图像的特征生成一个对应的特征向量;
比较模块:用于将所有特征向量两两成对比较,计算每两个特征向量的相似度;
筛选模块:用于筛选相似度高于设定值的图像对,并将保留的图像对按照相似度进行排序。
7.根据权利要求6所述的装置,其特征在于,所述比较模块还用于计算每两个特征向量之间的距离,距离越小则相似度越高。
8.根据权利要求6所述的装置,其特征在于,所述筛选模块还用于将保留的图像对分组,分别对每组中的图像对按相似度排序。
9.根据权利要求8所述的装置,其特征在于,所述筛选模块分别对每组中的图像对进行相似度排序包括:筛选并保留排序后每组中相似度高的前M个图像对,所述M为预先设定好的自然数。
10.根据权利要求8所述的装置,其特征在于,所述筛选模块还用于将所有分组中的前M个图像对合并后再次按照相似度排序,保留前K个相似度高的图像对,所述K为M与图像对分的组数的乘积。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有指令,当所述计算机可读存储介质在计算机上运行时,使得所述计算机执行权利要求1-5中任一项所述的方法。
CN201810431353.5A 2018-05-08 2018-05-08 一种图像识别方法和装置 Pending CN108764068A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810431353.5A CN108764068A (zh) 2018-05-08 2018-05-08 一种图像识别方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810431353.5A CN108764068A (zh) 2018-05-08 2018-05-08 一种图像识别方法和装置

Publications (1)

Publication Number Publication Date
CN108764068A true CN108764068A (zh) 2018-11-06

Family

ID=64010415

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810431353.5A Pending CN108764068A (zh) 2018-05-08 2018-05-08 一种图像识别方法和装置

Country Status (1)

Country Link
CN (1) CN108764068A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110766077A (zh) * 2019-10-24 2020-02-07 上海眼控科技股份有限公司 证据链图像中特写图筛选方法、装置和设备
CN111382635A (zh) * 2018-12-29 2020-07-07 杭州海康威视数字技术股份有限公司 一种商品类别识别方法、装置及电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060059112A1 (en) * 2004-08-25 2006-03-16 Jie Cheng Machine learning with robust estimation, bayesian classification and model stacking
US20060106757A1 (en) * 1996-05-06 2006-05-18 Amada Company, Limited Search for similar sheet metal part models
CN101263514A (zh) * 2005-08-15 2008-09-10 三菱电机株式会社 在图像数据库中进行导航、可视化和聚类的互序次相似度空间
CN101833565A (zh) * 2010-03-31 2010-09-15 南京大学 一种主动选择代表性图像的相关反馈方法
CN103678606A (zh) * 2013-12-12 2014-03-26 天津智迅时代科技有限公司 一种基于距离测量的图像检索方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060106757A1 (en) * 1996-05-06 2006-05-18 Amada Company, Limited Search for similar sheet metal part models
US20060059112A1 (en) * 2004-08-25 2006-03-16 Jie Cheng Machine learning with robust estimation, bayesian classification and model stacking
CN101263514A (zh) * 2005-08-15 2008-09-10 三菱电机株式会社 在图像数据库中进行导航、可视化和聚类的互序次相似度空间
CN101833565A (zh) * 2010-03-31 2010-09-15 南京大学 一种主动选择代表性图像的相关反馈方法
CN103678606A (zh) * 2013-12-12 2014-03-26 天津智迅时代科技有限公司 一种基于距离测量的图像检索方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111382635A (zh) * 2018-12-29 2020-07-07 杭州海康威视数字技术股份有限公司 一种商品类别识别方法、装置及电子设备
CN111382635B (zh) * 2018-12-29 2023-10-13 杭州海康威视数字技术股份有限公司 一种商品类别识别方法、装置及电子设备
CN110766077A (zh) * 2019-10-24 2020-02-07 上海眼控科技股份有限公司 证据链图像中特写图筛选方法、装置和设备

Similar Documents

Publication Publication Date Title
JP7375006B2 (ja) 画像セマンティックセグメンテーションネットワークのトレーニング方法、装置、機器及びコンピュータプログラム
Akhtar et al. Defense against universal adversarial perturbations
CN108229478B (zh) 图像语义分割及训练方法和装置、电子设备、存储介质和程序
CN111563502B (zh) 图像的文本识别方法、装置、电子设备及计算机存储介质
CN108229651A (zh) 神经网络模型迁移方法和***、电子设备、程序和介质
CN113139628B (zh) 样本图像的识别方法、装置、设备及可读存储介质
CN109815955A (zh) 题目辅助方法及***
US12002289B2 (en) Expression recognition method and apparatus, computer device, and readable storage medium
CN111626126A (zh) 一种人脸情绪识别的方法、装置、介质及电子设备
CN111680678A (zh) 目标区域识别方法、装置、设备及可读存储介质
Zhang et al. Research on mine vehicle tracking and detection technology based on YOLOv5
Lakkaraju et al. A bayesian framework for modeling human evaluations
CN106227836B (zh) 基于图像与文字的无监督联合视觉概念学习***及方法
Zhang et al. Web-supervised network for fine-grained visual classification
CN114332911A (zh) 一种头部姿态检测方法、装置及计算机设备
CN108764068A (zh) 一种图像识别方法和装置
CN109325480A (zh) 身份信息的录入方法及终端设备
CN104966109A (zh) 医疗化验单图像分类方法及装置
CN113065069B (zh) 一种基于数据画像的双向就业推荐方法和装置
CN108647629A (zh) 一种图像识别定位方法、视频中图像轨迹识别方法和装置
JP7293658B2 (ja) 情報処理装置、情報処理方法及びプログラム
KR20210097204A (ko) 정보를 출력하는 방법 및 장치
CN113762237B (zh) 文本图像处理方法、装置、设备及存储介质
CN113516735A (zh) 图像处理方法、装置、计算机可读介质及电子设备
CN112749691A (zh) 图像处理方法及相关设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20181106