CN113807214A - 基于deit附属网络知识蒸馏的小目标人脸识别方法 - Google Patents
基于deit附属网络知识蒸馏的小目标人脸识别方法 Download PDFInfo
- Publication number
- CN113807214A CN113807214A CN202111015756.XA CN202111015756A CN113807214A CN 113807214 A CN113807214 A CN 113807214A CN 202111015756 A CN202111015756 A CN 202111015756A CN 113807214 A CN113807214 A CN 113807214A
- Authority
- CN
- China
- Prior art keywords
- network
- teacher
- characteristic
- loss function
- face image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013140 knowledge distillation Methods 0.000 title claims abstract description 24
- 238000000034 method Methods 0.000 title claims abstract description 24
- 238000012549 training Methods 0.000 claims abstract description 38
- 238000004821 distillation Methods 0.000 claims abstract description 17
- 238000005070 sampling Methods 0.000 claims description 6
- 238000007781 pre-processing Methods 0.000 claims description 3
- 230000006870 function Effects 0.000 description 27
- 238000010586 diagram Methods 0.000 description 5
- 238000012544 monitoring process Methods 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 230000036544 posture Effects 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/082—Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明涉及一种基于deit附属网络知识蒸馏的小目标人脸识别方法,包括:构建deit网络作为学生网络,并构建教师网络并在其后增加残差连接模块,利用教师网络先在高像素人脸图像上训练学生网络;对训练好的学生网络输入小目标人脸图像,得到第二分类特征和第二蒸馏特征;对所述教师网络输入与训练好的deit网络相同身份但未降采样的图像,得到第二教师特征;根据所述第二分类特征与真实标签构建第三损失函数,根据所述第二蒸馏特征与第二教师特征构建第四损失函数,并将所述第三损失函数和第四损失函数相加得到第二总损失;在所述第二总损失下,对训练好的deit网络进行二次训练。本发明能够对小目标人脸图像进行有效识别。
Description
技术领域
本发明涉及计算机视觉技术领域,特别是涉及一种基于deit附属网络知识蒸馏的小目标人脸识别方法。
背景技术
随着深度学习算法及相应大规模数据集的不断更新和提出,人脸识别获得了极大的发展。在人脸姿态固定(正脸)、清晰图像、闭环境(没有“不确定”类别)情况下,人脸识别准确率已可高达99%以上。
但是,在监控环境下,由于摄像头分辨率低、人脸目标距离远、目标相对运动模糊等实际问题,实际所采集到的小目标人脸图像往往具有多种姿态(例如侧脸、仰头)、低分辨率(低于32*32像素)和噪声干扰的状态。同时,由于野外监控环境下不是所有检测到的人脸目标都可以和数据库中人物身份匹配,小目标人脸识别问题同时成为一个开环境问题。
由于以上原因,在真实环境下,姿态固定、图像清晰、闭环境下表现优秀的人脸识别算法表现往往急剧下降。算法性能的下降不仅体现在,当算法在高像素人脸图像上训练后,直接在监控环境中小目标人脸图像进行测试,性能会极大的降低,还体现在,即便用此类算法在监控环境小目标人脸图像中进行训练,随后在同样的小目标人脸图像中测试,表现性能也很差。究其原因,如果在高像素数据集训练,小目标人脸图像测试,会由于数据集不同一分布引发“域转移”问题,导致过拟合;而直接在小目标人脸图像训练,会由于小目标人脸图像像素过低(低于32*32像素),难以提取特征,另外目前公开数据集并无大规模真实环境下低像素人脸识别数据集,因此难以形成具有判别能力的网络。
针对真实环境下小目标人脸识别问题的困难,目前性能最好的两种算法都采用了基于CNN网络进行知识蒸馏的方法,具体是:教师网络为在高像素人脸图像预训练好的基于CNN网络的模型,在训练过程中冻结参数,仅作为特征提取器。学生网络和教师网络一致,在训练过程中参与训练。训练时,对教师网络输入高像素人脸图像,对学生网络输入对同样高像素图像降采样后的小目标人脸图像,通过设计损失函数,使学生倒数第二层特征逼近教师对应层,使学生模型能够在知识蒸馏中获得教师模型传递的高像素图像提取特征信息,同时由学生模型自身分类损失函数学习到小目标人脸图像的信息。在设计知识蒸馏损失函数时,传统算法直接将高、低像素人脸图像输出特征输入损失函数,导致损害了高像素人脸图像识别准确率,因此,现有算法对传统算法在此基础上作出改进,增加了一个并行特征层输入损失函数。由于教师网络特征层在高像素人脸图像中有良好的判别能力,通过教师特征层和学生特征层设计损失函数,可以让学生网络在同样ID但是降采样的人脸图像获得期望相同的判别特征,由此增加学生网络在低像素人脸图像的判别能力。
发明内容
本发明所要解决的技术问题是提供一种基于deit附属网络知识蒸馏的小目标人脸识别方法,能够对小目标人脸图像进行有效识别。
本发明解决其技术问题所采用的技术方案是:提供一种基于deit附属网络知识蒸馏的小目标人脸识别方法,包括:
步骤(1):构建deit网络作为学生网络,将选取的训练集进行预处理后输入到所述学生网络,得到第一分类特征和第一蒸馏特征;
步骤(2):选取已在所述数据集中预训练好的教师网络,并对教师网络输入所述预处理后的训练集,得到第一教师特征;
步骤(3):在所述教师网络最后一层判别层之后增加一残差连接模块,所述残差连接模块参与训练;
步骤(4):根据所述第一分类特征与真实标签构建第一损失函数,根据所述第一蒸馏特征与第一教师特征构建第二损失函数,并将所述第一损失函数和第二损失函数相加得到第一总损失;
在所述第一总损失下,利用所述教师网络先在第一人脸图像上训练学生网络;
步骤(5):对训练好的学生网络输入第二人脸图像,得到第二分类特征和第二蒸馏特征;
所述第一人脸图像的像素分辨率高于第二人脸图像;
步骤(6):对所述教师网络输入与训练好的学生网络相同的但未降采样的第二人脸图像,得到第二教师特征;
步骤(7):根据所述第二分类特征与真实标签构建第三损失函数,根据所述第二蒸馏特征与第二教师特征构建第四损失函数,并将所述第三损失函数和第四损失函数相加得到第二总损失;
在所述第二总损失下,对训练好的学生网络进行二次训练;
步骤(8):利用二次训练好的学生网络对输入的新的第二人脸图像进行识别。
所述步骤(1)中将选取的训练集进行预处理后输入到所述学生网络,具体为:通过插值法将训练集中的每幅图像尺寸调整为224*224,并按照16*16大小裁剪出14*14个图像块,再将裁剪好的图像块输入到所述学生网络。
所述步骤(1)中将Vggface2高像素人脸图像作为训练集。
所述步骤(2)具体为:选取已在所述数据集中预训练后的SE+Resnet网络作为教师网络,固定所述SE+Resnet网络参数,使SE+Resnet网络成为特征提取器,对教师网络输入所述预处理后的训练集,得到第一教师特征。
所述步骤(5)中对训练好的学生网络输入第二人脸图像,具体为:对训练好的学生网络输入降采样为16*16,再经过插值放大为224*224的降采样第二人脸图像。
有益效果
由于采用了上述的技术方案,本发明与现有技术相比,具有以下的优点和积极效果:本发明的学生网络采用了非CNN结构的transformer结构作为模型骨架,利用transformer网络非局部注意力机制,将输入图像的每个像素点和整个图像其余像素点信息进行结合,学习到图像整体特征,使得模型在预训练后面临低像素图像时模型的性能损失远小于CNN网络框架,避免了由于降采样图像插值为与高像素图像同一维度导致的模型性能损失和过拟合问题;本发明通过在教师网络中增加附属残差连接模块,参数化了“教师该传授什么样的知识”,避免了“模型容量差距”问题,使知识蒸馏方法变为在线—离线结合知识蒸馏,自适应获得稳定、易收敛的模型,同时让学生网络从教师网络吸收到良好的信息;本发明通过基于deit网络的附属知识蒸馏,获得了在原生低像素人脸数据集Tinyface数据集测试集达到了71.1%准确率,在未对测试集进行增强的端对端人脸识别算法中达到最高。
附图说明
图1是本发明实施方式的deit网络示意图;
图2是本发明实施方式的残差连接模块示意图;
图3是本发明实施方式的教师网络整体架构示意图。
具体实施方式
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
本发明的实施方式涉及一种基于deit附属网络知识蒸馏的小目标人脸识别方法,具体包括以下步骤:
1.构建deit网络作为学生网络(详见图1),选取Vggface2高像素人脸图像作为训练集,通过插值法将图像尺寸调整为224*224,随后按照16*16大小按照图片拼接裁剪出14*14个图像块,输入到deit网络中,得到第一分类特征和第一蒸馏特征。
图1中,patch tokens为图像按照16*16拼接裁剪后经过线性层编码得到的768维度特征,class token和distillation token分别是一个和patch tokens相同维度的可学习嵌入向量,其中class token用于生成最终与真实标签求损失函数的判别层,distillation token用于生成最终与教师网络输出求损失函数的判别层。
2.选取已在Vggface2数据集中预训练后SE+Resnet网络作为教师网络,固定SE+Resnet网络参数,使SE+Resne网络成为特征提取器,对教师网络输入步骤1中同样的人脸图像,得到第一教师特征。
3.根据步骤1中得到的第一分类特征与真实标签构建第一损失函数,根据步骤1中得到的第一蒸馏特征与步骤2中得到的第一教师特征构建第二损失函数,将第一损失函数和第二损失函数相加得到第一总损失,在所述第一总损失下,用教师网络先在高像素人脸图像上训练deit网络。此处真实标签为降采样前人物身份ID,即步骤1中的真实标签。
上述步骤1至步骤3的作用是在用降采样人脸图像信息训练网络之前,先用高像素人脸图像信息对网络进行预训练,使网络对人脸识别学习到基本特征,便于后续用低像素人脸图像进行训练时利用到在高像素人脸图像中学习到的特征,避免了直接训练低像素人脸图像,任务过于复杂导致的模型难以收敛问题。
4.对步骤2中教师网络的最后一层判别层后再加入一个附属的残差连接模块,最后一层判别层及之前部分仍冻结参数,作为特征提取器使用,新加入的残差连接模块参与训练。图3为加入残差连接模块的教师网络整体架构示意图。
图2为附属残差连接模块示意图,通过设置附属残差连接模块,能够参数化“教师该传授什么样的知识”,避免了“模型容量差距”问题,使知识蒸馏方法变为在线—离线结合知识蒸馏,自适应获得稳定、易收敛的模型,同时让学生网络从教师网络吸收到良好的信息。
5.对步骤3中训练好的deit模型输入降采样为16*16,随后插值放大为224*224的降采样小目标人脸图像,得到第二分类特征和第二蒸馏特征。
6.对步骤4中教师网络输入与步骤5学生网络同样身份但未降采样的图像,得到第二教师特征。
7.根据步骤5中得到的第二分类特征与真实标签构建第三损失函数,根据步骤5中得到的第二蒸馏特征与步骤6中第二教师特征构建第四损失函数,将第三损失函数和第四损失函数相加得到第二总损失,在所述第二总损失下,对训练好的deit网络进行二次训练。此处真实标签为降采样后人物身份ID,由于降采样前后人物身份不变,故与步骤1和步骤3中真实标签对应相同。
进一步地,步骤3和步骤7中的第一总损失和第二总损失的公式均可以表达为如下形式:
Lglobal=(1-λ)LCE(ψ(Zs),y)+λτ2KL(ψ(Zs/τ),ψ(Zt/τ))
其中,λ为调节第一总损失或第二总损失和的加权系数,本实施方式选取0.5;ψ(·)为softmax函数,Zs为所训练的deit网络的输出,Zt为教师网络的输出,y为真实标签,即人脸图像对应的人物身份ID,τ为知识蒸馏的程度系数,本实施方式选取1.25;通过对Zs、Zt除以知识蒸馏程度系数τ,可以将教师网络和学生网络(deit网络)的输出进行“软化”,从而更好地进行知识蒸馏;ψ(Zs/τ)、ψ(Zt/τ)分别将软化后的教师网络输出和软化后学生网络输出通过softmax函数的输出。
LCE()为交叉损失函数且LCE()可以表示为:
KL()为KL散度可以表示为:
8.利用二次训练好的deit网络对输入的小目标人脸图像进行识别。
9.通过在公开数据集Tinyface上进行测试,本发明达到了71.1%的Rank-1准确率,为该数据集当前算法中最高准确率方法,具体结果参见表1。
表1实验结果测试对比图
模型 | Rank-1 | Rank-20 | mAP |
DeepId2 | 17.4 | 25.2 | 12.1 |
SphereFace | 22.3 | 35.5 | 16.2 |
VGGFace | 30.4 | 40.4 | 23.1 |
CenterFace | 32.1 | 44.5 | 24.6 |
CSRI | 45.2 | 60.2 | 39.9 |
T-C | 58.6 | 73.0 | 52.7 |
Shi | 63.9 | / | / |
SafwanKhalid | 70.4 | 82.2 | 63.2 |
本实施方式 | 71.13 | 84.09 | 64.58 |
由此可见,本发明的学生网络采用了非CNN结构的transformer结构作为模型骨架,利用transformer网络非局部注意力机制,将输入图像的每个像素点和整个图像其余像素点信息进行结合,学习到图像整体特征,使得模型在预训练后面临低像素图像时模型的性能损失远小于CNN网络框架;本发明通过在教师网络中增加附属残差连接模块,使知识蒸馏方法变为在线—离线结合知识蒸馏,自适应获得稳定、易收敛的模型,同时让学生网络从教师网络吸收到良好的信息。
Claims (5)
1.一种基于deit附属网络知识蒸馏的小目标人脸识别方法,其特征在于,包括:
步骤(1):构建deit网络作为学生网络,将选取的训练集进行预处理后输入到所述学生网络,得到第一分类特征和第一蒸馏特征;
步骤(2):选取已在所述数据集中预训练好的教师网络,并对教师网络输入所述预处理后的训练集,得到第一教师特征;
步骤(3):在所述教师网络最后一层判别层之后增加一残差连接模块,所述残差连接模块参与训练;
步骤(4):根据所述第一分类特征与真实标签构建第一损失函数,根据所述第一蒸馏特征与第一教师特征构建第二损失函数,并将所述第一损失函数和第二损失函数相加得到第一总损失;
在所述第一总损失下,利用所述教师网络先在第一人脸图像上训练学生网络;
步骤(5):对训练好的学生网络输入第二人脸图像,得到第二分类特征和第二蒸馏特征;
所述第一人脸图像的像素分辨率高于第二人脸图像;
步骤(6):对所述教师网络输入与训练好的学生网络相同的但未降采样的第二人脸图像,得到第二教师特征;
步骤(7):根据所述第二分类特征与真实标签构建第三损失函数,根据所述第二蒸馏特征与第二教师特征构建第四损失函数,并将所述第三损失函数和第四损失函数相加得到第二总损失;
在所述第二总损失下,对训练好的学生网络进行二次训练;
步骤(8):利用二次训练好的学生网络对输入的新的第二人脸图像进行识别。
2.根据权利要求1所述的基于deit附属网络知识蒸馏的小目标人脸识别方法,其特征在于,所述步骤(1)中将选取的训练集进行预处理后输入到所述学生网络,具体为:通过插值法将训练集中的每幅图像尺寸调整为224*224,并按照16*16大小裁剪出14*14个图像块,再将裁剪好的图像块输入到所述学生网络。
3.根据权利要求1所述的基于deit附属网络知识蒸馏的小目标人脸识别方法,其特征在于,所述步骤(1)中将Vggface2高像素人脸图像作为训练集。
4.根据权利要求1所述的基于deit附属网络知识蒸馏的小目标人脸识别方法,其特征在于,所述步骤(2)具体为:选取已在所述数据集中预训练后的SE+Resnet网络作为教师网络,固定所述SE+Resnet网络参数,使SE+Resnet网络成为特征提取器,对教师网络输入所述预处理后的训练集,得到第一教师特征。
5.根据权利要求1所述的基于deit附属网络知识蒸馏的小目标人脸识别方法,其特征在于,所述步骤(5)中对训练好的学生网络输入第二人脸图像,具体为:对训练好的学生网络输入降采样为16*16,再经过插值放大为224*224的降采样第二人脸图像。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111015756.XA CN113807214B (zh) | 2021-08-31 | 2021-08-31 | 基于deit附属网络知识蒸馏的小目标人脸识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111015756.XA CN113807214B (zh) | 2021-08-31 | 2021-08-31 | 基于deit附属网络知识蒸馏的小目标人脸识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113807214A true CN113807214A (zh) | 2021-12-17 |
CN113807214B CN113807214B (zh) | 2024-01-05 |
Family
ID=78894457
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111015756.XA Active CN113807214B (zh) | 2021-08-31 | 2021-08-31 | 基于deit附属网络知识蒸馏的小目标人脸识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113807214B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113947801A (zh) * | 2021-12-21 | 2022-01-18 | 中科视语(北京)科技有限公司 | 人脸识别方法、装置和电子设备 |
CN114332007A (zh) * | 2021-12-28 | 2022-04-12 | 福州大学 | 一种基于Transformer的工业缺陷检测和识别方法 |
CN114743243A (zh) * | 2022-04-06 | 2022-07-12 | 平安科技(深圳)有限公司 | 基于人工智能的人脸识别方法、装置、设备及存储介质 |
Citations (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108830813A (zh) * | 2018-06-12 | 2018-11-16 | 福建帝视信息科技有限公司 | 一种基于知识蒸馏的图像超分辨率增强方法 |
US20190180732A1 (en) * | 2017-10-19 | 2019-06-13 | Baidu Usa Llc | Systems and methods for parallel wave generation in end-to-end text-to-speech |
CN110458765A (zh) * | 2019-01-25 | 2019-11-15 | 西安电子科技大学 | 基于感知保持卷积网络的图像质量增强方法 |
CN110674688A (zh) * | 2019-08-19 | 2020-01-10 | 深圳力维智联技术有限公司 | 用于视频监控场景的人脸识别模型获取方法、***和介质 |
CN110674714A (zh) * | 2019-09-13 | 2020-01-10 | 东南大学 | 基于迁移学习的人脸和人脸关键点联合检测方法 |
CN111160533A (zh) * | 2019-12-31 | 2020-05-15 | 中山大学 | 一种基于跨分辨率知识蒸馏的神经网络加速方法 |
CN111291637A (zh) * | 2020-01-19 | 2020-06-16 | 中国科学院上海微***与信息技术研究所 | 一种基于卷积神经网络的人脸检测方法、装置及设备 |
CN111444760A (zh) * | 2020-02-19 | 2020-07-24 | 天津大学 | 一种基于剪枝与知识蒸馏的交通标志检测与识别方法 |
CN112116030A (zh) * | 2020-10-13 | 2020-12-22 | 浙江大学 | 一种基于向量标准化和知识蒸馏的图像分类方法 |
CN112465138A (zh) * | 2020-11-20 | 2021-03-09 | 平安科技(深圳)有限公司 | 模型蒸馏方法、装置、存储介质及设备 |
WO2021047286A1 (zh) * | 2019-09-12 | 2021-03-18 | 华为技术有限公司 | 文本处理模型的训练方法、文本处理方法及装置 |
CN112613303A (zh) * | 2021-01-07 | 2021-04-06 | 福州大学 | 一种基于知识蒸馏的跨模态图像美学质量评价方法 |
CN112784964A (zh) * | 2021-01-27 | 2021-05-11 | 西安电子科技大学 | 基于桥接知识蒸馏卷积神经网络的图像分类方法 |
US20210142164A1 (en) * | 2019-11-07 | 2021-05-13 | Salesforce.Com, Inc. | Multi-Task Knowledge Distillation for Language Model |
WO2021118737A1 (en) * | 2019-12-11 | 2021-06-17 | Microsoft Technology Licensing, Llc | Sentence similarity scoring using neural network distillation |
CN112988975A (zh) * | 2021-04-09 | 2021-06-18 | 北京语言大学 | 一种基于albert和知识蒸馏的观点挖掘方法 |
CN113205002A (zh) * | 2021-04-08 | 2021-08-03 | 南京邮电大学 | 非受限视频监控的低清人脸识别方法、装置、设备及介质 |
CN113240580A (zh) * | 2021-04-09 | 2021-08-10 | 暨南大学 | 一种基于多维度知识蒸馏的轻量级图像超分辨率重建方法 |
CN113257361A (zh) * | 2021-05-31 | 2021-08-13 | 中国科学院深圳先进技术研究院 | 自适应蛋白质预测框架的实现方法、装置及设备 |
-
2021
- 2021-08-31 CN CN202111015756.XA patent/CN113807214B/zh active Active
Patent Citations (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190180732A1 (en) * | 2017-10-19 | 2019-06-13 | Baidu Usa Llc | Systems and methods for parallel wave generation in end-to-end text-to-speech |
CN108830813A (zh) * | 2018-06-12 | 2018-11-16 | 福建帝视信息科技有限公司 | 一种基于知识蒸馏的图像超分辨率增强方法 |
CN110458765A (zh) * | 2019-01-25 | 2019-11-15 | 西安电子科技大学 | 基于感知保持卷积网络的图像质量增强方法 |
CN110674688A (zh) * | 2019-08-19 | 2020-01-10 | 深圳力维智联技术有限公司 | 用于视频监控场景的人脸识别模型获取方法、***和介质 |
WO2021047286A1 (zh) * | 2019-09-12 | 2021-03-18 | 华为技术有限公司 | 文本处理模型的训练方法、文本处理方法及装置 |
CN110674714A (zh) * | 2019-09-13 | 2020-01-10 | 东南大学 | 基于迁移学习的人脸和人脸关键点联合检测方法 |
US20210142164A1 (en) * | 2019-11-07 | 2021-05-13 | Salesforce.Com, Inc. | Multi-Task Knowledge Distillation for Language Model |
WO2021118737A1 (en) * | 2019-12-11 | 2021-06-17 | Microsoft Technology Licensing, Llc | Sentence similarity scoring using neural network distillation |
CN111160533A (zh) * | 2019-12-31 | 2020-05-15 | 中山大学 | 一种基于跨分辨率知识蒸馏的神经网络加速方法 |
CN111291637A (zh) * | 2020-01-19 | 2020-06-16 | 中国科学院上海微***与信息技术研究所 | 一种基于卷积神经网络的人脸检测方法、装置及设备 |
CN111444760A (zh) * | 2020-02-19 | 2020-07-24 | 天津大学 | 一种基于剪枝与知识蒸馏的交通标志检测与识别方法 |
CN112116030A (zh) * | 2020-10-13 | 2020-12-22 | 浙江大学 | 一种基于向量标准化和知识蒸馏的图像分类方法 |
CN112465138A (zh) * | 2020-11-20 | 2021-03-09 | 平安科技(深圳)有限公司 | 模型蒸馏方法、装置、存储介质及设备 |
CN112613303A (zh) * | 2021-01-07 | 2021-04-06 | 福州大学 | 一种基于知识蒸馏的跨模态图像美学质量评价方法 |
CN112784964A (zh) * | 2021-01-27 | 2021-05-11 | 西安电子科技大学 | 基于桥接知识蒸馏卷积神经网络的图像分类方法 |
CN113205002A (zh) * | 2021-04-08 | 2021-08-03 | 南京邮电大学 | 非受限视频监控的低清人脸识别方法、装置、设备及介质 |
CN112988975A (zh) * | 2021-04-09 | 2021-06-18 | 北京语言大学 | 一种基于albert和知识蒸馏的观点挖掘方法 |
CN113240580A (zh) * | 2021-04-09 | 2021-08-10 | 暨南大学 | 一种基于多维度知识蒸馏的轻量级图像超分辨率重建方法 |
CN113257361A (zh) * | 2021-05-31 | 2021-08-13 | 中国科学院深圳先进技术研究院 | 自适应蛋白质预测框架的实现方法、装置及设备 |
Non-Patent Citations (9)
Title |
---|
JI WON YOON等: ""TutorNet: Towards Flexible Knowledge Distillation for End-to-End Speech Recognition"", 《IEEE/ACM TRANSACTIONS ON AUDIO, SPEECH, AND LANGUAGE PROCESSING 》, vol. 29 * |
MENGMENG WU等: ""Contact Angle of an Evaporating Droplet of Binary Solution on a Super Wetting Surface"", 《ARXIV》 * |
NANDAN KUMAR JHA等: ""On the Demystification of Knowledge Distillation: A Residual Network Perspective"", 《ARXIV》 * |
QIANWEI ZHOU等: ""A Seismic-Based Feature Extraction Algorithm for Robust Ground Target Classification"", 《IEEE SIGNAL PROCESSING LETTERS》, vol. 19 * |
QIU XIPENG;SUN TIANXIANG;XU YIGE;SHAO YUNFAN;DAI NING;HUANG XUANJING;: "Pre-trained models for natural language processing: A survey", SCIENCE CHINA(TECHNOLOGICAL SCIENCES), no. 10 * |
姜慧明: ""基于生成对抗网络与知识蒸馏的人脸修复与表情识别"", 《中国硕士学位论文全文数据库》 * |
李唐薇等: ""大视场域的目标检测与识别算法综述"", 《激光与光电子学进展》, vol. 57, no. 12 * |
赵琼等: ""基于改进YOLOv3的目标检测算法"", 《激光与光电子学进展》, vol. 57, no. 12 * |
高新波;路文;查林;惠政;亓统帅;姜建德;: "超高清视频画质提升技术及其芯片化方案", 重庆邮电大学学报(自然科学版), no. 05 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113947801A (zh) * | 2021-12-21 | 2022-01-18 | 中科视语(北京)科技有限公司 | 人脸识别方法、装置和电子设备 |
CN113947801B (zh) * | 2021-12-21 | 2022-07-26 | 中科视语(北京)科技有限公司 | 人脸识别方法、装置和电子设备 |
CN114332007A (zh) * | 2021-12-28 | 2022-04-12 | 福州大学 | 一种基于Transformer的工业缺陷检测和识别方法 |
CN114332007B (zh) * | 2021-12-28 | 2024-06-28 | 福州大学 | 一种基于Transformer的工业缺陷检测和识别方法 |
CN114743243A (zh) * | 2022-04-06 | 2022-07-12 | 平安科技(深圳)有限公司 | 基于人工智能的人脸识别方法、装置、设备及存储介质 |
CN114743243B (zh) * | 2022-04-06 | 2024-05-31 | 平安科技(深圳)有限公司 | 基于人工智能的人脸识别方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113807214B (zh) | 2024-01-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113807214B (zh) | 基于deit附属网络知识蒸馏的小目标人脸识别方法 | |
CN111583263B (zh) | 一种基于联合动态图卷积的点云分割方法 | |
CN112926396B (zh) | 一种基于双流卷积注意力的动作识别方法 | |
CN111612051B (zh) | 一种基于图卷积神经网络的弱监督目标检测方法 | |
CN111652202B (zh) | 利用自适应的时空图模型通过提升视频-语言表征学习来解决视频问答问题的方法及其*** | |
CN104866810A (zh) | 一种深度卷积神经网络的人脸识别方法 | |
JP2015095215A (ja) | 学習装置、学習プログラム、及び学習方法 | |
CN113408343B (zh) | 基于双尺度时空分块互注意力的课堂动作识别方法 | |
CN111598167B (zh) | 基于图学习的小样本图像识别方法及*** | |
CN112036447A (zh) | 零样本目标检测***及可学习语义和固定语义融合方法 | |
CN112307982A (zh) | 基于交错增强注意力网络的人体行为识别方法 | |
CN107247952B (zh) | 基于深层监督的循环卷积神经网络的视觉显著性检测方法 | |
CN112085055A (zh) | 一种基于迁移模型雅克比阵特征向量扰动的黑盒攻击方法 | |
CN112036276A (zh) | 一种人工智能视频问答方法 | |
CN111898566B (zh) | 姿态估计方法、装置、电子设备和存储介质 | |
CN114064627A (zh) | 一种针对多重关系的知识图谱链接补全方法及*** | |
CN113065409A (zh) | 一种基于摄像分头布差异对齐约束的无监督行人重识别方法 | |
CN117201122A (zh) | 基于视图级图对比学习的无监督属性网络异常检测方法及*** | |
CN114241191A (zh) | 一种基于跨模态自注意力的无候选框指代表达理解方法 | |
CN116258990A (zh) | 一种基于跨模态亲和力的小样本参考视频目标分割方法 | |
CN111291705A (zh) | 一种跨多目标域行人重识别方法 | |
CN114663880A (zh) | 基于多层级跨模态自注意力机制的三维目标检测方法 | |
CN112862860A (zh) | 一种用于多模态目标跟踪的对象感知图像融合方法 | |
CN116681128A (zh) | 一种带噪多标签数据的神经网络模型训练方法和装置 | |
CN113159071B (zh) | 一种跨模态图像-文本关联异常检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |