CN114140282B

CN114140282B - 一种基于深度学习的普教课堂答题快速评审方法及装置

Info

Publication number: CN114140282B
Application number: CN202111400131.5A
Authority: CN
Inventors: 周斌; 朱志鹏; 李艳红; 胡波
Original assignee: Wuhan Etah Information Technology Co ltd
Current assignee: Wuhan Etah Information Technology Co ltd
Priority date: 2021-11-19
Filing date: 2021-11-19
Publication date: 2023-03-24
Anticipated expiration: 2041-11-19
Also published as: CN114140282A

Abstract

本发明公开了一种基于深度学习的普教课堂答题快速评审方法及装置，涉及智能教学领域，该方法包括基于人脸识别算法对教室内学生人脸进行检测，确定学生身份，并建立学生身份与学生所在位置间的对应关系；基于姿态识别算法，对教室内学生的行为姿态进行识别，得到处于预设姿态的学生，并对处于预设姿态学生的位置进行记录；通过文字识别算法对处于预设姿态的学生的答题结果内容进行识别，得到答题结果；根据学生身份与学生所在位置间的对应关系，将答题结果与学生身份间建立对应关系，并统计所有答题结果以评审。本发明能够实现对教室内所有学生知识掌握情况的自动快速准确统计，且结果统计成本低。

Description

一种基于深度学习的普教课堂答题快速评审方法及装置

技术领域

本发明涉及智能教学领域，具体涉及一种基于深度学习的普教课堂答题快速评审方法及装置。

背景技术

在普教课堂的师生互动场景中，答题互动环节极为重要，其可以充分考验学生对知识的掌握情况。当前，在答题互动环节，现有的考查方式包括老师点名问答方式和答题***方式，

但是，现有的考查方式存在以下问题1、老师点名问答方式，该方式考察学生数量有限，无法获取学生的整体知识掌握度；2、答题***方式，每个学生均需要一个答题器，根据老师问题，在答题器中选择结果，此种方式成本较高，需要不断维护，难以普及。

发明内容

针对现有技术中存在的缺陷，本发明的目的在于提供一种基于深度学习的普教课堂答题快速评审方法及装置，能够实现对教室内所有学生知识掌握情况的自动快速准确统计，且结果统计成本低。

为达到以上目的，本发明提供一种基于深度学习的普教课堂答题快速评审方法，具体包括以下步骤：

基于人脸识别算法对教室内学生人脸进行检测，确定学生身份，并建立学生身份与学生所在位置间的对应关系；

基于姿态识别算法，对教室内学生的行为姿态进行识别，得到处于预设姿态的学生，并对处于预设姿态学生的位置进行记录；

通过文字识别算法对处于预设姿态的学生的答题结果内容进行识别，得到答题结果；

根据学生身份与学生所在位置间的对应关系，将答题结果与学生身份间建立对应关系，并统计所有答题结果以评审。

在上述技术方案的基础上，所述基于人脸识别算法对教室内学生人脸进行检测，确定学生身份，具体步骤包括：

基于retina网络的神经网络模型，对教室内图像进行多维度特征提取；

对提取的多维度特征进行拼接，得到人脸信息，所述人脸信息包括人脸矩形框以及人脸矩形框中人脸的五个关键点坐标；

使用opencv库的仿射变换，将人脸的五个关键点坐标映射到指定位置；

基于arcface技术，并根据映射到指定位置的人脸的五个关键点坐标，提取得到人脸的特征值；

将提取得到的特征值与数据库进行比对，确定学生身份。

在上述技术方案的基础上，

所述arcface技术的网络主干为resnet50网络，arcface技术的损失函数为基于Softmax loss损失函数修改得到的预设损失函数；

所述预设损失函数具体为：

其中，L表示预设损失函数，m表示样本的数量，e表示自然常数，s表示超球面的半径，n和j均表示类别的数量，θ表示权重和特征值间的向量夹角，θ_yi表示输入的类别为第yi个时，权重和特征值间的向量夹角，θ_j表示输入的类别为第j个时，权重和特征值间的向量夹角，y_i表示第i个样本所属的类别。

在上述技术方案的基础上，所述基于姿态识别算法，对教室内学生的行为姿态进行识别，具体步骤包括：

基于vgg16骨干网络，对学生人体的特征图进行关键点以及关键点间连接方式的预测；

将每个stage输出的特征图均与基础网络输出的特征图进行concat，并进行loss设置；

基于均方差算法将每个stage输出的特征图与label间进行损失计算；

根据计算结果得到学生的18个人体关键点，并基于得到的18个人体关键点，以及人体关节的夹角位置和相对关系，确定学生的行为姿态。

在上述技术方案的基础上，所述预设姿态为举牌姿态，且当学生为举牌姿态时，所举牌中含有学生所写的答题结果内容。

在上述技术方案的基础上，通过文字识别算法对处于预设姿态的学生的答题结果内容进行识别，得到答题结果，具体步骤包括：

确定处于举牌姿态的学生所举牌的位置；

通过文字识别算法对学生所举牌中的答题结果内容进行识别，得到学生的答题结果。

在上述技术方案的基础上，所述文字识别算法基于ocr神经网络实现，且通过文字识别算法对答题结果内容进行识别包括文字检测阶段、问题识别阶段和文本角度分类阶段。

在上述技术方案的基础上，所述根据学生身份与学生所在位置间的对应关系，将答题结果与学生身份间建立对应关系，具体包括：

根据处于预设姿态学生的位置、处于预设姿态学生的答题结果，以及学生身份与学生所在位置间的对应关系，建立答题结果与学生身份间的对应关系。

在上述技术方案的基础上，所述统计所有答题结果以评审，具体为：统计所有学生的答题结果，并基于标准答案对学生的答题结果进行判决。

本发明提供的一种基于深度学习的普教课堂答题快速评审装置，包括：

身份确定模块，其用于基于人脸识别算法对教室内学生人脸进行检测，确定学生身份，并建立学生身份与学生所在位置间的对应关系；

姿态识别模块，其用于基于姿态识别算法，对教室内学生的行为姿态进行识别，得到处于预设姿态的学生，并对处于预设姿态学生的位置进行记录；

结果识别模块，其用于通过文字识别算法对处于预设姿态的学生的答题结果内容进行识别，得到答题结果；

结果统计模块，其用于根据学生身份与学生所在位置间的对应关系，将答题结果与学生身份间建立对应关系，并统计所有答题结果以评审。

与现有技术相比，本发明的优点在于：通过基于人脸识别算法对教室内学生人脸进行检测，确定学生身份，并建立学生身份与学生所在位置间的对应关系，以及基于姿态识别算法，对教室内学生的行为姿态进行识别，得到处于预设姿态的学生，并对处于预设姿态学生的位置进行记录，以及通过文字识别算法对处于预设姿态的学生的答题结果内容进行识别，得到答题结果，最后根据学生身份与学生所在位置间的对应关系，将答题结果与学生身份间建立对应关系，并统计所有答题结果以评审，即通过图像识别方式自动对教室内学生所写答题结果内容进行识别，得到学生的答题结果，实现对教室内所有学生知识掌握情况的自动快速准确统计，且结果统计成本低。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例中一种基于深度学习的普教课堂答题快速评审方法的流程图。

具体实施方式

本发明提供一种基于深度学习的普教课堂答题快速评审方法，通过基于人脸识别算法对教室内学生人脸进行检测，确定学生身份，并建立学生身份与学生所在位置间的对应关系，以及基于姿态识别算法，对教室内学生的行为姿态进行识别，得到处于预设姿态的学生，并对处于预设姿态学生的位置进行记录，以及通过文字识别算法对处于预设姿态的学生的答题结果内容进行识别，得到答题结果，最后根据学生身份与学生所在位置间的对应关系，将答题结果与学生身份间建立对应关系，并统计所有答题结果以评审，即通过图像识别方式自动对教室内学生所写答题结果内容进行识别，得到学生的答题结果，实现对教室内所有学生知识掌握情况的自动快速准确统计，且结果统计成本低。本发明实施例相应地还提供了一种基于深度学习的普教课堂答题快速评审装置。

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请的一部分实施例，而不是全部的实施例。

参见图1所示，本发明实施例提供的一种基于深度学习的普教课堂答题快速评审方法，具体包括以下步骤：

S1：基于人脸识别算法对教室内学生人脸进行检测，确定学生身份，并建立学生身份与学生所在位置间的对应关系；

本发明实施例中，可以通过布置摄像头的方式实现对教室内图像的采集，从而基于采集得到的图像并通过人脸识别算法对图像中的人脸进行检测，并根据检测得到的人脸确定学生的身份，同时建立学生身份与学生所在位置间的对应关系，即对教室内每一个座位位置上学生的身份进行确定，并将座位位置与学生身份间进行绑定，后续根据位置信息即可知晓该位置上学生的身份信息。

在一种可能的实施方式中，为保证对教室内学生人脸检测的准确度，可以在教室的不同位置布置多个摄像头，在多个角度对学生人脸图像进行采集，从而提升学生身份识别的准确度。

S2：基于姿态识别算法，对教室内学生的行为姿态进行识别，得到处于预设姿态的学生，并对处于预设姿态学生的位置进行记录；

本发明实施例中，为了答题结果内容识别的触发，可以设定当学生处于预设姿态时，即开始学生答题结果内容识别。因此，需要对学生的姿态进行识别，以判定学生当前是否处于预设姿态。本发明中通过姿态识别算法对学生的姿态进行识别，从而判定学生当前是否处于预设姿态，并当检测得到学生处于预设姿态时，对处于预设姿态学生的位置进行记录，后便后续确定处于预设姿态学生的身份。

S3：通过文字识别算法对处于预设姿态的学生的答题结果内容进行识别，得到答题结果；

本发明实施例中，对于答题结果内容，学生可以采用手写方式，即当老师出题完成后，学生在纸张上进行答题结果内容的书写，然后通过文字识别算法对学生所写的答题结果内容进行识别，得到答题结果。

当然，对于答题结果内容的展现形式，不局限于书写方式，也可以采用其它形式呈现，如具有特定含义的答题标志物(如字字母板)，能被文字识别算法识别即可。

S4：根据学生身份与学生所在位置间的对应关系，将答题结果与学生身份间建立对应关系，并统计所有答题结果以评审。

即根据处于预设姿态学生所在的位置，及该位置对应的学生身份，确定处于预设姿态学生的身份，并根据处于预设姿态学生的答题结果，从而将答题结果与学生身份间建立对应关系，确定每个学生的答题结果。

本发明实施例中，基于人脸识别算法对教室内学生人脸进行检测，确定学生身份，具体步骤包括：

S101：基于retina网络的神经网络模型，对教室内图像进行多维度特征提取；retina网络为一种采用FPN(Feature Pyramid Networks，特征图金字塔网络)网络的网络结构。本发明采用retina网络进行人脸检测识别，能够提高对小人脸的检测效果。

S102：对提取的多维度特征进行拼接，得到人脸信息，所述人脸信息包括人脸矩形框以及人脸矩形框中人脸的五个关键点坐标；人脸的五个关键点包括左眼、右眼、鼻尖、左嘴角和右嘴角。步骤S101和S102相当于人脸识别中的人脸检测。

S103：使用opencv库(一种基于BSD许可发行的跨平台计算机视觉和机器学习软件库)的仿射变换，将人脸的五个关键点坐标映射到指定位置；将人脸的五个关键点坐标映射到指定位置，能够方便后续的人脸特征提取。步骤S103相当于人脸识别中的人脸对齐。

S104：基于arcface技术(一种人脸识别算法)，并根据映射到指定位置的人脸的五个关键点坐标，提取得到人脸的特征值；步骤S104相当于人脸识别中的人脸特征提取和比对。

本发明实施例中，arcface技术的网络主干为resnet50网络(一种多层网络结构)，arcface技术的损失函数为基于Softmax loss损失函数修改得到的预设损失函数。预设损失函数具体为：

其中，L表示预设损失函数，m表示样本的数量，e表示自然常数，s表示超球面的半径，n和j均表示类别的数量，θ表示权重和特征值间的向量夹角，θ_yi表示输入的类别为第yi个时，权重和特征值间的向量夹角，θ_j表示输入的类别为第j个时，权重和特征值间的向量夹角，y_i表示第i个样本所属的类别，cosθ_yi表示类内相似度，cosθ_j表示类间相似度。

对于上述公式，由于损失函数一般是在网络最后阶段使用，在最后阶段，网络输出的是特征值，该特征值由使用前一阶段的输出乘以最后的权重，然后加上偏移计算得到，θ为权重和特征值间的向量夹角，θ_yi的自变量为i，i的取值范围为1～m，θ_j的自变量为j，j的取值范围为1～n；对于θ的具体含义，由于损失函数都是在训练阶段使用，网络的输出存在标签(类别)，例如，输入类别A，则计算得到的权重和特征向量间的夹角为θ_A。

采用本发明修改后的预设损失函数最终训练得到的网络，与其它算法相比：整体识别准确定达到97％以上，人脸识别准确度达到98％以上，显存仅占用0.8G，在对其图片时仅需30ms左右，初次识别时仅需500ms，非首次识别时在10ms以内。

S105：将提取得到的特征值与数据库进行比对，确定学生身份。数据库中含有所有学生的特征值，将提取得到的特征值与数据库中的特征值进行比对，即可确定学生的身份。

本发明实施例中，基于姿态识别算法，对教室内学生的行为姿态进行识别，具体步骤包括：

S201：基于vgg16(一种卷积神经网络)骨干网络，对学生人体的特征图进行关键点以及关键点间连接方式的预测；

S202：将每个stage(目标检测算法)输出的特征图均与基础网络输出的特征图进行concat(连接)，并进行loss设置(即目标函数设置)；即对于每个stage输出的特征图，均会和基础网络输出的特征图进行concat，然后再传入下一个stage，然后重复多个stage，并且在每个stage之后进行loss设置。

S203：基于均方差算法将每个stage输出的特征图与label(分类)间进行损失计算；可以理解为中继监督，让网络在每一个阶段，都向着label的方向进行收敛，加快网络的训练和预测的精度。

S204：根据计算结果得到学生的18个人体关键点，并基于得到的18个人体关键点，以及人体关节的夹角位置和相对关系，确定学生的行为姿态。当得到18个人体的关键点之后，即可根据人体关节的夹角位置和相对关系，判断学生的行为姿态，如站立、举手等。

本发明实施例中，预设姿态为举牌姿态，且当学生为举牌姿态时，所举牌中含有学生所写的答题结果内容。即学生在木板牌上进行答题结果内容的书写，当书写完成后将木板牌举起，形成举牌姿态，从而处于预设姿态。

本发明实施例中，通过文字识别算法对处于预设姿态的学生的答题结果内容进行识别，得到答题结果，具体步骤包括：

S301：确定处于举牌姿态的学生所举牌的位置；即当基于姿态识别算法识别得到学生处于举牌姿态时，将处于举牌姿态的学生所举牌的位置进行记录，方便后续根据位置信息对学生的身份进行确定。

S302：通过文字识别算法对学生所举牌中的答题结果内容进行识别，得到学生的答题结果。文字识别算法基于ocr神经网络实现，且通过文字识别算法对答题结果内容进行识别包括文字检测阶段、问题识别阶段和文本角度分类阶段。

本发明实施例中，根据学生身份与学生所在位置间的对应关系，将答题结果与学生身份间建立对应关系，具体包括：

本发明实施例中，统计所有答题结果以评审，具体为：统计所有学生的答题结果，并基于标准答案对学生的答题结果进行判决。基于每个学生答题结果的正确情况，即可掌握所有学生对知识的掌握情况，方便且快捷。

本发明的普教课堂答题快速评审方法，相机采集教室内学生图片，进行人脸检测、人脸对齐和人脸特征提取，然后进行学生姿态检测，找到处于举牌姿态的学生，将举牌姿态学生和身份进行位置匹配，获得每个学生的举牌内容，最后进行文字识别，获得每个学生的答题结果并上报，最后对答题结果进行判决，该普教课堂答题快速评审方法成本低廉，一次部署，不需要维护答题器，可以快速进行身份验证和答题结果比对，快速生成答题结果报表，极大提高老师课堂授课结果验证效率。在课堂开始后，10秒即可完成全班学生身份识别，答题过程开始后，1秒即可完成学生姿态识别、答题结果识别、答题结果汇总并评审，以及答题结果报表生成。

本发明实施例的基于深度学习的普教课堂答题快速评审方法，通过基于人脸识别算法对教室内学生人脸进行检测，确定学生身份，并建立学生身份与学生所在位置间的对应关系，以及基于姿态识别算法，对教室内学生的行为姿态进行识别，得到处于预设姿态的学生，并对处于预设姿态学生的位置进行记录，以及通过文字识别算法对处于预设姿态的学生的答题结果内容进行识别，得到答题结果，最后根据学生身份与学生所在位置间的对应关系，将答题结果与学生身份间建立对应关系，并统计所有答题结果以评审，即通过图像识别方式自动对教室内学生所写答题结果内容进行识别，得到学生的答题结果，实现对教室内所有学生知识掌握情况的自动快速准确统计，且结果统计成本低。

本发明实施例提供的一种基于深度学习的普教课堂答题快速评审装置，包括身份确定模块、姿态识别模块、结果识别模块和结果统计模块。

身份确定模块用于基于人脸识别算法对教室内学生人脸进行检测，确定学生身份，并建立学生身份与学生所在位置间的对应关系；姿态识别模块用于基于姿态识别算法，对教室内学生的行为姿态进行识别，得到处于预设姿态的学生，并对处于预设姿态学生的位置进行记录；结果识别模块用于通过文字识别算法对处于预设姿态的学生的答题结果内容进行识别，得到答题结果；结果统计模块用于根据学生身份与学生所在位置间的对应关系，将答题结果与学生身份间建立对应关系，并统计所有答题结果以评审。

以上所述仅是本申请的具体实施方式，使本领域技术人员能够理解或实现本申请。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下，在其它实施例中实现。因此，本申请将不会被限制于本文所示的这些实施例，而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。

本发明是参照根据本发明实施例的方法、设备(***)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

Claims

1.一种基于深度学习的普教课堂答题快速评审方法，其特征在于，具体包括以下步骤：

根据学生身份与学生所在位置间的对应关系，将答题结果与学生身份间建立对应关系，并统计所有答题结果以评审；

其中，所述基于人脸识别算法对教室内学生人脸进行检测，确定学生身份，具体步骤包括：

将提取得到的特征值与数据库进行比对，确定学生身份；

其中，

所述预设损失函数具体为：

其中，L表示预设损失函数，m表示样本的数量，e表示自然常数，s表示超球面的半径，n和j均表示类别的数量，θ表示权重和特征值间的向量夹角，θ_yi表示输入的类别为第yi个时，权重和特征值间的向量夹角，θ_j表示输入的类别为第j个时，权重和特征值间的向量夹角，y_i表示第i个样本所属的类别；

其中，所述基于姿态识别算法，对教室内学生的行为姿态进行识别，具体步骤包括：

根据计算结果得到学生的18个人体关键点，并基于得到的18个人体关键点，以及人体关节的夹角位置和相对关系，确定学生的行为姿态；

其中，所述预设姿态为举牌姿态，且当学生为举牌姿态时，所举牌中含有学生所写的答题结果内容；

其中，通过文字识别算法对处于预设姿态的学生的答题结果内容进行识别，得到答题结果，具体步骤包括：

确定处于举牌姿态的学生所举牌的位置；

通过文字识别算法对学生所举牌中的答题结果内容进行识别，得到学生的答题结果；

其中，所述文字识别算法基于ocr神经网络实现，且通过文字识别算法对答题结果内容进行识别包括文字检测阶段、问题识别阶段和文本角度分类阶段。

2.如权利要求1所述的一种基于深度学习的普教课堂答题快速评审方法，其特征在于，所述根据学生身份与学生所在位置间的对应关系，将答题结果与学生身份间建立对应关系，具体包括：

3.如权利要求1所述的一种基于深度学习的普教课堂答题快速评审方法，其特征在于，所述统计所有答题结果以评审，具体为：统计所有学生的答题结果，并基于标准答案对学生的答题结果进行判决。

4.一种基于深度学习的普教课堂答题快速评审装置，其特征在于，包括：

结果统计模块，其用于根据学生身份与学生所在位置间的对应关系，将答题结果与学生身份间建立对应关系，并统计所有答题结果以评审；

将提取得到的特征值与数据库进行比对，确定学生身份；

其中，

所述预设损失函数具体为：

确定处于举牌姿态的学生所举牌的位置；