CN112016444A - 基于Web前端处理人脸识别技术的方法及装置 - Google Patents

基于Web前端处理人脸识别技术的方法及装置 Download PDF

Info

Publication number
CN112016444A
CN112016444A CN202010873964.2A CN202010873964A CN112016444A CN 112016444 A CN112016444 A CN 112016444A CN 202010873964 A CN202010873964 A CN 202010873964A CN 112016444 A CN112016444 A CN 112016444A
Authority
CN
China
Prior art keywords
image
face
recognized
classifier
region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010873964.2A
Other languages
English (en)
Inventor
不公告发明人
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Ophyer Technology Co ltd
Original Assignee
Beijing Ophyer Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Ophyer Technology Co ltd filed Critical Beijing Ophyer Technology Co ltd
Priority to CN202010873964.2A priority Critical patent/CN112016444A/zh
Publication of CN112016444A publication Critical patent/CN112016444A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/32Normalisation of the pattern dimensions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/46Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Biomedical Technology (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Biophysics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及人脸识别技术领域,具体涉及基于Web前端处理人脸识别技术的方法及装置,所述方法包括在Web前端调取图像采集装置采集待识别图像;将所述待识别图像输入至人脸分类器中,以确定所述待识别图像中的人脸区域。该方法通过在本地采集到待识别图像之后,直接在本地将待识别图像输入至人脸分类器中进行人脸区域的识别,而避免了Web前端与服务器之间的通信,提高了人脸识别的效率。

Description

基于Web前端处理人脸识别技术的方法及装置
技术领域
本发明涉及人脸识别技术领域,具体涉及基于Web前端处理人脸识别技术的方法及装置。
背景技术
人脸识别技术是基于人的脸部特征,对输入的人脸图像或者视频流进行分析识别。识别的大致流程为:首先判断是否存在人脸,如果存在则进一步给出人脸的位置、大小和各个主要面部器官的位置信息。现有人脸识别技术已经在我们的日常生活中广泛应用,例如人证核验机、人脸门禁、企业考勤机、服务机器人等。目前人脸识别功能大部分是基于APP软件本地演算或者通过第三方人脸识别平台上传图片通过服务器端演算并将识别结果数据回传。
这种人脸识别方法是在Web前端调用摄像头采集图像,并将采集到的图像上传至服务器,利用服务器计算出该图像中的人脸数据并传回至Web前端。这种方式需要Web前端在短时间内上传大量图像至服务器,对于服务器的负载和CPU运算都会造成较大压力,同时对网络质量要求较高,在应用过程中会出现卡顿延迟的现象,导致人脸识别的效率较低。
发明内容
有鉴于此,本发明实施例提供了一种基于Web前端处理人脸识别技术的方法及装置,以解决人脸识别的效率较低的问题。
根据第一方面,本发明实施例提供了一种基于Web前端处理人脸识别技术的方法,包括:
在Web前端调取图像采集装置采集待识别图像;
将所述待识别图像输入至人脸分类器中,以确定所述待识别图像中的人脸区域。
本发明实施例提供的基于Web前端处理人脸识别技术的方法,在本地采集到待识别图像之后,直接在本地将待识别图像输入至人脸分类器中进行人脸区域的识别,而避免了Web前端与服务器之间的通信,提高了人脸识别的效率。
结合第一方面,在第一方面第一实施方式中,所述将所述待识别图像输入至人脸分类器中,以确定所述待识别图像中的人脸区域,包括:
利用所述人脸分类器中的尺度变化模块,对所述待识别图像进行归一化处理,得到处理后的所述待识别图像中各个像素点的像素值及位置信息;
利用所述人脸分类器中的图像提取模块,依次提取处理后的所述待识别图像中的预设尺寸的图像区域,得到所述图像区域中各个像素点的像素值及位置信息;
分别将所述图像区域中各个像素点的像素值及位置信息输入至分类模块中,确定所述待识别图像中的人脸区域。
本发明实施例提供的基于Web前端处理人脸识别技术的方法,通过对待识别图像进行归一化处理,使得该人脸分类器能够处理不同尺度的待识别图像,增加了该方法的使用范围;且输入值分类模块中的为预设尺寸的图像区域而不是整个待识别人脸图像,可以提高人脸区域识别的准确性。
结合第一方面第一实施方式,在第一方面第二实施方式中,所述分别将所述图像区域中各个像素点的像素值及位置信息输入至分类模块中,确定所述待识别图像中的人脸区域,包括:
依次分别将所述图像区域中各个像素点的像素值及位置信息输入至所述人脸分类器的第一级联分类器中,确定所述图像区域中属于人脸的区域;
将确定出的所述图像区域中属于人脸的区域输入至所述人脸分类器的第二级联分类器中,以确定所述图像区域中属于人脸的区域;
基于确定出的各个所述图像区域中属于人脸的区域,确定所述待识别图像中的人脸区域。
本发明实施例提供的基于Web前端处理人脸识别技术的方法,利用级联分类器对待识别图像中的人脸区域进行识别,提高了人脸区域识别的准确性。
结合第一方面第一实施方式,在第一方面第三实施方式中,所述基于确定出的各个所述图像区域中属于人脸的区域,确定所述待识别图像中的人脸区域,包括:
利用各个所述图像区域中属于人脸的区域的位置信息,得到各个所述人脸的区域的重叠程度;
利用所述重叠程度确定所述待识别图像中的人脸区域。
本发明实施例提供的基于Web前端处理人脸识别技术的方法,在得到对应于多个预设尺寸的图像区域的人脸区域之后,结合多个人脸区域得到待识别图像中的人脸区域,所得到的人脸区域结合了多个人脸区域的特征,提高了待识别图像中人脸区域的准确性。
结合第一方面,或第一方面第一实施方式至第三实施方式中任一项,在第一方面第四实施方式中,所述在Web前端调取图像采集装置采集待识别图像,包括:
调取所述图像采集装置采集待识别视频流;
将所述待识别视频流中的每一帧图像确定为所述待识别图像。
本发明实施例提供的基于Web前端处理人脸识别技术的方法,依次对待识别视频流中的每一帧图像进行处理,可以提高了人脸识别的准确性。
结合第一方面第四实施方式,在第一方面第五实施方式中,所述方法还包括:
获取所述待识别视频流中连续多帧的人脸区域的识别结果,预测下一帧待识别图像中的人脸区域;
将预测出的人脸区域图像输入至所述人脸分类器中,以确定所述下一帧待识别图像中的人脸区域。
本发明实施例提供的基于Web前端处理人脸识别技术的方法,将连续多帧的人脸区域的识别结果结合起来,预测下一帧人脸的可能区域,减小了对下一帧待识别图像的扫描范围,提高了识别效率。
结合第一方面第四实施方式,在第一方面第六实施方式中,所述方法还包括:
基于所述待识别视频流中人脸区域的识别结果,触发本地执行相应的操作;其中,所述人脸区域的识别结果包括人脸眼球的移动距离和/或方向。
本发明实施例提供的基于Web前端处理人脸识别技术的方法,利用人脸区域的识别结果触发本地的相应操作,即,通过眼球追踪替代鼠标操作,从而可以为残障人士提供帮助,无需动手实现网页基本操作,在某些场合也可以通过记录用户目光关注位置,除了停留时长点击这些传统数据外提供一种新的数据支持。
根据第二方面,本发明实施例还提供了一种基于Web前端处理人脸识别技术的装置,包括:
调取模块,用于在Web前端调取图像采集装置采集待识别图像;
分类模块,用于将所述待识别图像输入至人脸分类器中,以确定所述待识别图像中的人脸区域。
本发明实施例提供的基于Web前端处理人脸识别技术的装置,在本地采集到待识别图像之后,直接在本地将待识别图像输入至人脸分类器中进行人脸区域的识别,而避免了Web前端与服务器之间的通信,提高了人脸识别的效率。
根据第三方面,本发明实施例提供了一种电子设备,包括:存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器中存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行第一方面或者第一方面的任意一种实施方式中所述的基于Web前端处理人脸识别技术的方法。
根据第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储计算机指令,所述计算机指令用于使所述计算机执行第一方面或者第一方面的任意一种实施方式中所述的基于Web前端处理人脸识别技术的方法。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例的基于Web前端处理人脸识别技术的方法的流程图;
图2是根据本发明实施例的基于Web前端处理人脸识别技术的方法的流程图;
图3是根据本发明实施例的人脸分类器中分类模块的结构示意图;
图4是根据本发明实施例的基于Web前端处理人脸识别技术的方法的流程图;
图5是根据本发明实施例的基于Web前端处理人脸识别技术的装置的结构框图;
图6是本发明实施例提供的电子设备的硬件结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明实施例中所述的基于Web前端处理人脸识别技术的方法,是在Web前端检测出待识别图像中的人脸区域。进一步地,基于待识别视频中的人脸区域,可以利用识别出的人脸区域中人眼的变化,对本地进行相应的操作,即,通过眼球追踪替代鼠标操作,从而可以为残障人士提供帮助,无需动手实现网页基本操作,在某些场合也可以通过记录用户目光关注位置,除了停留时长点击这些传统数据外提供一种新的数据支持。
根据本发明实施例,提供了一种基于Web前端处理人脸识别技术的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机***中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
在本实施例中提供了一种基于Web前端处理人脸识别技术的方法,可用于电子设备,如电脑、手机、平板电脑等,图1是根据本发明实施例的基于Web前端处理人脸识别技术的方法的流程图,如图1所示,该流程包括如下步骤:
S11,在Web前端调取图像采集装置采集待识别图像。
所述的图像采集装置可以是集成在电子设备上的,也可以是与电子设备连接的,在此对图像采集装置以及电子设备的连接方式并不做任何限制。例如,当电子设备为手机时,所述的图像采集设备可以是手机的摄像头;当电子设备为台式电脑时,所述的图像采集设备可以是台式电脑的摄像头,或外置的摄像头;当电子设备为笔记本电脑时,所述的图像采集装置为笔记本电脑的摄像头等等。
电子设备在Web前端调取图像采集装置所采集的待识别图像,用于识别对待识别图像中的人脸区域。其中,图像采集装置可以是每次采集一张图像,电子设备在Web前端对于该图像进行人脸区域的识别,图像采集装置也可以是采集视频流,电子设备在Web前端每次提取视频流中的一帧图像进行人脸区域的识别等等。当然,图像采集装置也可以利用其他方式采集待识别图像,在此对电子设备获取到待识别图像的具体方式并不做任何限制。例如,当电子设备为手机时,手机通过前置摄像头先采集待识别图像,再对待识别图像进行后续的处理。
例如,电子设备中的摄像头可以用于采集待识别图像,可以在电子设备的Web前端使用HTML5技术,调用API中getUserMedia()方法获取摄像头所采集到的数据,并将获取到的stream视频流绘制在页面中。
S12,将待识别图像输入至人脸分类器中,以确定待识别图像中的人脸区域。
所述的人脸分类器的输入可以为待识别图像,输出为待识别图像中的人脸区域;所述的人脸分类器的输入还可以为待识别图像中的部分区域,输出为所述的部分区域中的人脸区域等等。
人脸分类器可以是基于神经网络模型建立的,在此对人脸分类器的具体模型结构并不做任何限制,只需保证其能够识别出图像中的人脸区域即可。关于该步骤具体将在下文中进行详细描述。
本实施例提供的基于Web前端处理人脸识别技术的方法,在本地采集到待识别图像之后,直接在本地将待识别图像输入至人脸分类器中进行人脸区域的识别,而避免了Web前端与服务器之间的通信,提高了人脸识别的效率。
在本实施例中提供了一种基于Web前端处理人脸识别技术的方法,可用于电子设备,如电脑、手机、平板电脑等,图2是根据本发明实施例的基于Web前端处理人脸识别技术的方法的流程图,如图2所示,该流程包括如下步骤:
S21,在Web前端调取图像采集装置采集待识别图像。
详细请参见图1所示实施例的S11,在此不再赘述。
S22,将待识别图像输入至人脸分类器中,以确定待识别图像中的人脸区域。
具体地,上述S22包括如下步骤:
S221,利用人脸分类器中的尺度变化模块,对待识别图像进行归一化处理,得到处理后的待识别图像中各个像素点的像素值及位置信息。
尺度变化模块用于对输入的待识别图像进行归一化处理,得到归一化后的待识别图像。在进行归一化处理之后,电子设备就可以确定处理后的待识别图像中各个像素点的像素值及位置信息。后续在确定待识别图像中的人脸区域时,再对得到的人脸区域进行反向处理,即可得到待识别图像中的人脸区域。
利用归一化的处理方式,使得该人脸分类器可以处理各种尺度的图像区域,而不需要任何专门的数据结构。通过将处理后的待识别图像中各个像素点的位置信息存储在标准化坐标中,后续可以乘以相应的归一化比例系数,即可确定出待识别图像中的人脸区域。
S222,利用人脸分类器中的图像提取模块,依次提取处理后的待识别图像中的预设尺寸的图像区域,得到图像区域中各个像素点的像素值及位置信息。
预设尺寸可以理解为预设窗口的大小,利用该预设窗口遍历处理后的待识别图像,并提取处理后的待识别图像中对应于预设窗口的图像区域,得到多个预设尺寸的图像区域。
由于在上述S221中已经得到了处理后的待识别图像中各个像素点的像素值及位置信息,那么相应地,就可以得到多个预设尺寸的图像区域中各个像素点的像素值及位置信息。
S223,分别将图像区域中各个像素点的像素值及位置信息输入至分类模块中,确定待识别图像中的人脸区域。
电子设备在确定出多个预设尺寸的图像区域中各个像素点的像素值及位置信息之后,将其输入值分类模块中,即可得到对应于各个预设尺寸的图像区域中的人脸区域。
在得到各个预设尺寸的图像区域中的人脸区域之后,利用人脸区域中各个像素点的位置信息,对其进行拼接,即可确定出待识别图像中的人脸区域。
作为本实施例的一种可选实施方式,所述的人脸分类器包括至少两个级联的分类模块,每个分类模块都能够识别出输入图像中的人脸区域,并丢弃一部分非人脸区域。若一个图像区域通过了级联的所有分类模块,那么该区域就被确定为人脸区域。上述S223包括如下步骤:
(1)依次分别将图像区域中各个像素点的像素值及位置信息输入至人脸分类器的第一级联分类器中,确定图像区域中属于人脸的区域。
图3示出了分类模块的一种可选的实施方式,分类模块中级联的分类器的数量可以根据实际情况进行相应的设置,在此对其数量并不做任何限制。
在本实施例的下文描述中,以分类模块包括两个级联的分类器为例进行描述。电子设备将上述S222中得到的图像区域中各个像素点的像素值及位置信息输入至人脸分类器的第一级联分类器中,得到图像区域中的人脸区域A1以及非人脸区域R1。其中,非人脸区域R1并不会输入至后续的分类器中。
(2)将确定出的图像区域中属于人脸的区域输入至人脸分类器的第二级联分类器中,以确定图像区域中属于人脸的区域。
电子设备再将经过第一级联分类器确定出的人脸区域输入至第二级联分类器中以再次进行人脸区域的检测,得到图像区域中属于人脸的区域。
(3)基于确定出的各个图像区域中属于人脸的区域,确定待识别图像中的人脸区域。
例如,电子设备从处理后的待处理图像中提取出M个图像区域,依次将M个图像区域输入至分类模块中,得到与图像区域一一对应的M个人脸区域F,分别记为F1-FM
电子设备在得到各个图像区域对应的人脸区域之后,对其进行合成,以确定出待识别图像中的人脸区域。具体地,电子设备利用各个图像区域对应的人脸区域中各个像素点的位置信息,依次比对各个图像对应的人脸区域中像素点的位置,去除重复的像素点,得到对应于处理后的待识别图像中的人脸区域。电子设备在得到处理后的待识别图像中的人脸区域之后,再利用归一化处理的比例系数对人脸区域进行反向处理,即可确定出待识别图像中的人脸区域。
可选地,所述的基于确定出的各个图像区域中属于人脸的区域,确定待识别图像中的人脸区域,可以包括如下步骤:
1)利用各个图像区域中属于人脸的区域的位置信息,得到各个人脸的区域的重叠程度。
如上文所述,电子设备在得到各个图像区域中属于人脸的区域的位置信息之后,对比各个人脸区域的位置信息,得到各个人脸的区域的重叠程度。
2)利用重叠程度确定待识别图像中的人脸区域。
在确定出各个图像区域中人脸的区域的重叠部分之后,将存在重叠的部分去除,即可确定出待识别图像中的人脸区域。
本实施例提供的基于Web前端处理人脸识别技术的方法,通过对待识别图像进行归一化处理,使得该人脸分类器能够处理不同尺度的待识别图像,增加了该方法的使用范围;且输入值分类模块中的为预设尺寸的图像区域而不是整个待识别人脸图像,可以提高人脸区域识别的准确性。
作为本实施例的一种可选实施方式,分类模块中级联的分类器可以根据人脸图像的识别结果进行实时的更改。
例如,利用输入至第一级联分类器的图像区域对应的非人脸区域计算真阳率,每经过一个级联的分类器就可以得到一个真阳率。将计算得到的真阳率与预设真阳率进行比较,当计算得到的真阳率小于预设真阳率时,继续利用下一个级联的分类器进行人脸区域的识别;当计算得到的真阳率大于或等于预设真阳率时,输出人脸区域。
其中,真阳率可以采用如下公式计算得到:
Figure BDA0002652029060000091
其中,R为非人脸区域,n为当前级联的分类器的数量,Tt()为对应于第t个级联的分类器的真阳率。
在本实施例中提供了一种基于Web前端处理人脸识别技术的方法,可用于电子设备,如电脑、手机、平板电脑等,图4是根据本发明实施例的基于Web前端处理人脸识别技术的方法的流程图,如图4所示,该流程包括如下步骤:
S31,在Web前端调取图像采集装置采集待识别图像。
具体地,上述S31包括如下步骤:
S311,调取图像采集装置采集待识别视频流。
图像采集装置采集待识别视频流,电子设备通过调用该图像采集装置获取到待识别视频流。
S312,将待识别视频流中的每一帧图像确定为待识别图像。
电子设备在获取到待识别视频流之后,依次提取待识别视频流中的每一帧,以后续对待识别视频流中的每一帧图像进行人脸区域的识别。
S32,将待识别图像输入至人脸分类器中,以确定待识别图像中的人脸区域。
详细请参见图2所示实施例的S22,在此并不赘述。
S33,获取待识别视频流中连续多帧的人脸区域的识别结果,预测下一帧待识别图像中的人脸区域。
电子设备在确定出待识别视频流中连续多帧的人脸区域的识别结果之后,利用多帧的识别结果预测下一帧待识别图像中的人脸区域。具体地,可以是采用神经网络模块的方式进行预测;也可以采用其他方式进行预测,在此对具体的预测方式并不做任何限定。
S34,将预测出的人脸区域图像输入至人脸分类器中,以确定下一帧待识别图像中的人脸区域。
电子设备在预测出下一帧待识别图像中的人脸区域之后,提取该人脸区域并将其输入值人脸分类器中,以确定下一帧待识别图像中的人脸区域。
本实施例提供的基于Web前端处理人脸识别技术的方法,将连续多帧的人脸区域的识别结果结合起来,预测下一帧人脸的可能区域,减小了对下一帧待识别图像的扫描范围,提高了识别效率。
作为本实施例的一种可选实施方式,上述方法还可以包括:基于所述待识别视频流中人脸区域的识别结果,触发本地执行相应的操作;其中,所述人脸区域的识别结果包括人脸眼球的移动距离和/或方向。
其中,可以在电子设备中设置一张人脸移动距离和/或方向与操作对应的关系表,电子设备利用上述方式确定出人脸移动距离和/或方向之后,查找该表即可确定用户当前对电子设备执行的操作。
例如,在PC端可以利用确定出的人脸眼球移动位置和方向,代替鼠标操作浏览网页,为残障人士提供遍历。或者,可以在手机端结合人脸识别制备有创意的应用和游戏等等。
利用人脸区域的识别结果触发本地的相应操作,就可以代替鼠标对本地进行操作,即,通过眼球追踪替代鼠标操作,从而可以为残障人士提供帮助,无需动手实现网页基本操作,在某些场合也可以通过记录用户目光关注位置,除了停留时长点击这些传统数据外提供一种新的数据支持。
在本实施例中还提供了一种基于Web前端处理人脸识别技术的装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
本实施例提供一种基于Web前端处理人脸识别技术的装置,如图5所示,包括:
调取模块41,用于在Web前端调取图像采集装置采集待识别图像;
分类模块42,用于将所述待识别图像输入至人脸分类器中,以确定所述待识别图像中的人脸区域。
本实施例提供的基于Web前端处理人脸识别技术的装置,在本地采集到待识别图像之后,直接在本地将待识别图像输入至人脸分类器中进行人脸区域的识别,而避免了Web前端与服务器之间的通信,提高了人脸识别的效率。
本实施例中的基于Web前端处理人脸识别技术的装置是以功能单元的形式来呈现,这里的单元是指ASIC电路,执行一个或多个软件或固定程序的处理器和存储器,和/或其他可以提供上述功能的器件。
上述各个模块的更进一步的功能描述与上述对应实施例相同,在此不再赘述。
本发明实施例还提供一种电子设备,具有上述图5所示的基于Web前端处理人脸识别技术的装置。
请参阅图6,图6是本发明可选实施例提供的一种电子设备的结构示意图,如图6所示,该电子设备可以包括:图像采集装置(图6中未示出),至少一个处理器51,例如CPU(Central Processing Unit,中央处理器),至少一个通信接口53,存储器54,至少一个通信总线52。其中,通信总线52用于实现这些组件之间的连接通信。其中,通信接口53可以包括显示屏(Display)、键盘(Keyboard),可选通信接口53还可以包括标准的有线接口、无线接口。存储器54可以是高速RAM存储器(Random Access Memory,易挥发性随机存取存储器),也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。存储器54可选的还可以是至少一个位于远离前述处理器51的存储装置。其中处理器51可以结合图5所描述的装置,存储器54中存储应用程序,且处理器51调用存储器54中存储的程序代码,以用于执行上述任一方法步骤。
其中,通信总线52可以是外设部件互连标准(peripheral componentinterconnect,简称PCI)总线或扩展工业标准结构(extended industry standardarchitecture,简称EISA)总线等。通信总线52可以分为地址总线、数据总线、控制总线等。为便于表示,图6中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
其中,存储器54可以包括易失性存储器(英文:volatile memory),例如随机存取存储器(英文:random-access memory,缩写:RAM);存储器也可以包括非易失性存储器(英文:non-volatile memory),例如快闪存储器(英文:flash memory),硬盘(英文:hard diskdrive,缩写:HDD)或固态硬盘(英文:solid-state drive,缩写:SSD);存储器54还可以包括上述种类的存储器的组合。
其中,处理器51可以是中央处理器(英文:central processing unit,缩写:CPU),网络处理器(英文:network processor,缩写:NP)或者CPU和NP的组合。
其中,处理器51还可以进一步包括硬件芯片。上述硬件芯片可以是专用集成电路(英文:application-specific integrated circuit,缩写:ASIC),可编程逻辑器件(英文:programmable logic device,缩写:PLD)或其组合。上述PLD可以是复杂可编程逻辑器件(英文:complex programmable logic device,缩写:CPLD),现场可编程逻辑门阵列(英文:field-programmable gate array,缩写:FPGA),通用阵列逻辑(英文:generic arraylogic,缩写:GAL)或其任意组合。
可选地,存储器54还用于存储程序指令。处理器51可以调用程序指令,实现如本申请图1、2以及4实施例中所示的基于Web前端处理人脸识别技术的方法。
本发明实施例还提供了一种非暂态计算机存储介质,所述计算机存储介质存储有计算机可执行指令,该计算机可执行指令可执行上述任意方法实施例中的基于Web前端处理人脸识别技术的方法。其中,所述存储介质可为磁碟、光盘、只读存储记忆体(Read-OnlyMemory,ROM)、随机存储记忆体(Random Access Memory,RAM)、快闪存储器(FlashMemory)、硬盘(Hard Disk Drive,缩写:HDD)或固态硬盘(Solid-State Drive,SSD)等;所述存储介质还可以包括上述种类的存储器的组合。
虽然结合附图描述了本发明的实施例,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下做出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。

Claims (10)

1.一种基于Web前端处理人脸识别技术的方法,其特征在于,包括:
在Web前端调取图像采集装置采集待识别图像;
将所述待识别图像输入至人脸分类器中,以确定所述待识别图像中的人脸区域。
2.根据权利要求1所述的方法,其特征在于,所述将所述待识别图像输入至人脸分类器中,以确定所述待识别图像中的人脸区域,包括:
利用所述人脸分类器中的尺度变化模块,对所述待识别图像进行归一化处理,得到处理后的所述待识别图像中各个像素点的像素值及位置信息;
利用所述人脸分类器中的图像提取模块,依次提取处理后的所述待识别图像中的预设尺寸的图像区域,得到所述图像区域中各个像素点的像素值及位置信息;
分别将所述图像区域中各个像素点的像素值及位置信息输入至分类模块中,确定所述待识别图像中的人脸区域。
3.根据权利要求2所述的方法,其特征在于,所述分别将所述图像区域中各个像素点的像素值及位置信息输入至分类模块中,确定所述待识别图像中的人脸区域,包括:
依次分别将所述图像区域中各个像素点的像素值及位置信息输入至所述人脸分类器的第一级联分类器中,确定所述图像区域中属于人脸的区域;
将确定出的所述图像区域中属于人脸的区域输入至所述人脸分类器的第二级联分类器中,以确定所述图像区域中属于人脸的区域;
基于确定出的各个所述图像区域中属于人脸的区域,确定所述待识别图像中的人脸区域。
4.根据权利要求3所述的方法,其特征在于,所述基于确定出的各个所述图像区域中属于人脸的区域,确定所述待识别图像中的人脸区域,包括:
利用各个所述图像区域中属于人脸的区域的位置信息,得到各个所述人脸的区域的重叠程度;
利用所述重叠程度确定所述待识别图像中的人脸区域。
5.根据权利要求1-4中任一项所述的方法,其特征在于,所述在Web前端调取图像采集装置采集待识别图像,包括:
调取所述图像采集装置采集待识别视频流;
将所述待识别视频流中的每一帧图像确定为所述待识别图像。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
获取所述待识别视频流中连续多帧的人脸区域的识别结果,预测下一帧待识别图像中的人脸区域;
将预测出的人脸区域图像输入至所述人脸分类器中,以确定所述下一帧待识别图像中的人脸区域。
7.根据权利要求5所述的方法,其特征在于,所述方法还包括:
基于所述待识别视频流中人脸区域的识别结果,触发本地执行相应的操作;其中,所述人脸区域的识别结果包括人脸眼球的移动距离和/或方向。
8.一种基于Web前端处理人脸识别技术的装置,其特征在于,包括:
调取模块,用于在Web前端调取图像采集装置采集待识别图像;
分类模块,用于将所述待识别图像输入至人脸分类器中,以确定所述待识别图像中的人脸区域。
9.一种电子设备,其特征在于,包括:
存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器中存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行权利要求1-7中任一项所述的基于Web前端处理人脸识别技术的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使计算机执行权利要求1-7中任一项所述的基于Web前端处理人脸识别技术的方法。
CN202010873964.2A 2020-08-26 2020-08-26 基于Web前端处理人脸识别技术的方法及装置 Pending CN112016444A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010873964.2A CN112016444A (zh) 2020-08-26 2020-08-26 基于Web前端处理人脸识别技术的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010873964.2A CN112016444A (zh) 2020-08-26 2020-08-26 基于Web前端处理人脸识别技术的方法及装置

Publications (1)

Publication Number Publication Date
CN112016444A true CN112016444A (zh) 2020-12-01

Family

ID=73502703

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010873964.2A Pending CN112016444A (zh) 2020-08-26 2020-08-26 基于Web前端处理人脸识别技术的方法及装置

Country Status (1)

Country Link
CN (1) CN112016444A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140375886A1 (en) * 2013-06-19 2014-12-25 Set Media, Inc. Automatic face discovery and recognition for video content analysis
CN206115454U (zh) * 2016-07-29 2017-04-19 重庆中科云丛科技有限公司 一种人脸识别平板
CN107704842A (zh) * 2017-10-26 2018-02-16 广州云从信息科技有限公司 一种基于人脸识别认证的识别相机工作方法
WO2019096008A1 (zh) * 2017-11-20 2019-05-23 腾讯科技(深圳)有限公司 身份识别方法、计算机设备及存储介质
WO2019119449A1 (zh) * 2017-12-22 2019-06-27 深圳中兴力维技术有限公司 人脸图像特征融合处理方法、装置及设备、存储介质
CN110321829A (zh) * 2019-06-27 2019-10-11 北京蓝城兄弟文化传媒有限公司 一种人脸识别方法及装置、电子设备和存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140375886A1 (en) * 2013-06-19 2014-12-25 Set Media, Inc. Automatic face discovery and recognition for video content analysis
CN206115454U (zh) * 2016-07-29 2017-04-19 重庆中科云丛科技有限公司 一种人脸识别平板
CN107704842A (zh) * 2017-10-26 2018-02-16 广州云从信息科技有限公司 一种基于人脸识别认证的识别相机工作方法
WO2019096008A1 (zh) * 2017-11-20 2019-05-23 腾讯科技(深圳)有限公司 身份识别方法、计算机设备及存储介质
WO2019119449A1 (zh) * 2017-12-22 2019-06-27 深圳中兴力维技术有限公司 人脸图像特征融合处理方法、装置及设备、存储介质
CN110321829A (zh) * 2019-06-27 2019-10-11 北京蓝城兄弟文化传媒有限公司 一种人脸识别方法及装置、电子设备和存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
陈丽枫;王佳斌;郑力新;: "人脸检测与跟踪算法优化及Web端实现", 计算机应用与软件, no. 09, pages 275 - 281 *

Similar Documents

Publication Publication Date Title
US10210415B2 (en) Method and system for recognizing information on a card
CN109448007B (zh) 图像处理方法、图像处理装置及存储介质
KR20180109665A (ko) 객체 검출을 위한 영상 처리 방법 및 장치
WO2019033569A1 (zh) 眼球动作分析方法、装置及存储介质
CN109951635B (zh) 拍照处理方法、装置、移动终端以及存储介质
WO2021051547A1 (zh) 暴力行为检测方法及***
CN113436100B (zh) 用于修复视频的方法、装置、设备、介质和产品
Liu et al. Real-time facial expression recognition based on cnn
CN109598298B (zh) 图像物体识别方法和***
CN113239807B (zh) 训练票据识别模型和票据识别的方法和装置
US11694331B2 (en) Capture and storage of magnified images
CN112991180A (zh) 图像拼接方法、装置、设备以及存储介质
CN111667504B (zh) 一种人脸追踪方法、装置及设备
CN110858316A (zh) 对时间序列图像数据进行分类
US20170053193A1 (en) Fast Image Object Detector
CN113643260A (zh) 用于检测图像质量的方法、装置、设备、介质和产品
CN112732553A (zh) 图像测试方法、装置、电子设备及存储介质
CN113255516A (zh) 活体检测方法、装置和电子设备
CN110751004A (zh) 二维码检测方法、装置、设备及存储介质
CN114724144B (zh) 文本识别方法、模型的训练方法、装置、设备及介质
CN112016444A (zh) 基于Web前端处理人脸识别技术的方法及装置
CN116188846A (zh) 一种基于振动图像的设备故障检测方法及装置
CN115620378A (zh) 多视角牛脸智能采集方法、装置、***及相关设备
CN115004245A (zh) 目标检测方法、装置、电子设备和计算机存储介质
CN112949667A (zh) 图像识别方法、***、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination