CN112101542A - 机器学习模型的训练方法、装置、人脸的识别方法和装置 - Google Patents
机器学习模型的训练方法、装置、人脸的识别方法和装置 Download PDFInfo
- Publication number
- CN112101542A CN112101542A CN202010723795.4A CN202010723795A CN112101542A CN 112101542 A CN112101542 A CN 112101542A CN 202010723795 A CN202010723795 A CN 202010723795A CN 112101542 A CN112101542 A CN 112101542A
- Authority
- CN
- China
- Prior art keywords
- sample data
- image sample
- classification
- feature similarity
- machine learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000010801 machine learning Methods 0.000 title claims abstract description 77
- 238000012549 training Methods 0.000 title claims abstract description 62
- 238000000034 method Methods 0.000 title claims abstract description 61
- 239000013598 vector Substances 0.000 claims abstract description 39
- 230000006870 function Effects 0.000 claims abstract description 29
- 238000002372 labelling Methods 0.000 claims abstract description 7
- 230000002596 correlated effect Effects 0.000 claims description 14
- 238000012545 processing Methods 0.000 claims description 13
- 230000009467 reduction Effects 0.000 claims description 5
- 238000004590 computer program Methods 0.000 claims description 4
- 238000013473 artificial intelligence Methods 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 12
- 230000000875 corresponding effect Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000014509 gene expression Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
本公开涉及一种机器学习模型的训练方法、装置、人脸的识别方法和装置,涉及人工智能技术领域。该训练方法包括:利用机器学习模型提取各图像样本数据的特征向量,并根据各特征向量确定各图像样本数据中目标的分类结果;根据各图像样本数据中目标的标注结果和分类结果,判断各图像样本数据中目标被分类到了正确分类还是错误分类;在任一个图像样本数据中目标被分类到了错误分类的情况下,降低该图像样本数据与正确分类之间的第一特征相似度,增加该图像样本数据与错误分类之间的第二特征相似度;根据所有降低后的第一特征相似度、增加后的第二特征相似度计算损失函数,用于训练机器学习模型。
Description
技术领域
本公开涉及人工智能技术领域,特别涉及一种机器学习模型的训练方法、机器学习模型的训练装置、人脸的识别方法、人脸的识别装置、电子设备和非瞬时性计算机可读存储介质。
背景技术
近些年来,随着人工智能技术的发展,可以识别图像数据中的目标。例如,人脸识别技术作为目标识别的一个应用,被广泛用于身份核验的相关场景中,如安防,金融,通行等。
在相关技术中,可以使用机器学习模型提取图像数据中的目标特征,然后通过计算特征之间的相似程度,实现目标识别。
发明内容
本公开的发明人发现上述相关技术中存在如下问题:机器学习模型提取的特征不准确,导致目标识别的效果差。
鉴于此,本公开提出了一种机器学习模型的训练技术方案,能够提高机器学习模型提取的特征的准确性,从而提高目标识别的效果。
根据本公开的一些实施例,提供了一种机器学习模型的训练方法,包括:利用机器学习模型提取各图像样本数据的特征向量,并根据各特征向量确定各图像样本数据中目标的分类结果;根据各图像样本数据中目标的标注结果和分类结果,判断各图像样本数据中目标被分类到了正确分类还是错误分类;在任一个图像样本数据中目标被分类到了错误分类的情况下,降低该图像样本数据与正确分类之间的第一特征相似度,增加该图像样本数据与错误分类之间的第二特征相似度;根据所有降低后的第一特征相似度、增加后的第二特征相似度计算损失函数,用于训练机器学习模型。
在一些实施例中,损失函数与降低后的第一特征相似度负相关,与降低后的第一特征相似度和增加后的第二特征相似度之和正相关。
在一些实施例中,降低该图像样本数据与正确分类之间的第一特征相似度,增加该图像样本数据与错误分类之间的第二特征相似度包括:将第二特征相似度大于第一特征相似度的错误分类,确定为该图像样本数据的干扰错误分类;根据干扰错误分类,降低该图像样本数据与正确分类之间的第一特征相似度,增加该图像样本数据与错误分类之间的第二特征相似度。
在一些实施例中,降低该图像样本数据与正确分类之间的第一特征相似度包括:增加该图像样本数据的特征向量与正确分类的特征向量的夹角,夹角的增加幅度与该图像样本数据和每一个干扰错误分类的相似度之和正相关,与干扰错误分类的数量负相关;根据增加后的夹角,计算降低后的第一特征相似度。
在一些实施例中,增加该图像样本数据与错误分类之间的第二特征相似度包括:增加该图像样本数据与每一个干扰错误分类的相应的第二特征相似度。
在一些实施例中,增大后的第二特征相似度与增大前的第二特征相似度呈线性关系。
在一些实施例中,训练方法还包括:在图像样本数据中目标被分类到了正确分类的情况下,降低图像样本数据与正确分类之间的第一特征相似度;根据所有降低后的第一特征相似度计算损失函数。
在一些实施例中,在图像样本数据中目标被分类到了正确分类的情况下,第一特征相似度的降低幅度小于在图像样本数据中目标被分类到了错误分类的情况下,第一特征相似度的降低幅度。
在一些实施例中,图像样本数据为人脸图像样本数据;训练方法还包括:根据人脸图像数据,利用完成训练的机器学习模型,进行人脸识别。
根据本公开的另一些实施例,提供一种机器学习模型的训练装置,包括:分类单元,用于利用机器学习模型提取各图像样本数据的特征向量,并根据各特征向量确定各图像样本数据中目标的分类结果;判断单元,用于根据各图像样本数据中目标的标注结果和分类结果,判断各图像样本数据中目标被分类到了正确分类还是错误分类;相似度处理单元,用于在任一个图像样本数据中目标被分类到了错误分类的情况下,降低该图像样本数据与正确分类之间的第一特征相似度,增加该图像样本数据与错误分类之间的第二特征相似度;训练单元,用于根据所有降低后的第一特征相似度、增加后的第二特征相似度计算损失函数,用于训练机器学习模型。
在一些实施例中,损失函数与降低后的第一特征相似度负相关,与降低后的第一特征相似度和增加后的第二特征相似度之和正相关。
在一些实施例中,相似度处理单元将第二特征相似度大于第一特征相似度的错误分类,确定为该图像样本数据的干扰错误分类;根据干扰错误分类,降低该图像样本数据与正确分类之间的第一特征相似度,增加该图像样本数据与错误分类之间的第二特征相似度。
在一些实施例中,相似度处理单元增加该图像样本数据的特征向量与正确分类的特征向量的夹角,夹角的增加幅度与该图像样本数据和每一个干扰错误分类的相似度之和正相关,与干扰错误分类的数量负相关;根据增加后的夹角,计算降低后的第一特征相似度。
在一些实施例中,相似度处理单元增加该图像样本数据与每一个干扰错误分类的相应的第二特征相似度。
在一些实施例中,增大后的第二特征相似度与增大前的第二特征相似度呈线性关系。
在一些实施例中,相似度处理单元在图像样本数据中目标被分类到了正确分类的情况下,降低图像样本数据与正确分类之间的第一特征相似度;根据所有降低后的第一特征相似度计算损失函数。
在一些实施例中,在图像样本数据中目标被分类到了正确分类的情况下,第一特征相似度的降低幅度小于在图像样本数据中目标被分类到了错误分类的情况下,第一特征相似度的降低幅度。
在一些实施例中,图像样本数据为人脸图像样本数据;分类单元根据人脸图像数据,利用完成训练的机器学习模型,进行人脸识别。
根据本公开的又一些实施例,提供一种人脸的识别方法,包括:
根据人脸图像数据,利用完成训练的机器学习模型,进行人脸识别,所述机器学习模型通过上述任一个实施例中的机器学习模型的训练方法进行训练。
根据本公开的再一些实施例,提供一种人脸的识别装置,包括:识别单元,用于根据人脸图像数据,利用完成训练的机器学习模型,进行人脸识别,所述机器学习模型通过上述任一个实施例中的机器学习模型的训练方法进行训练。
根据本公开的再一些实施例,提供一种电子设备,包括:存储器;和耦接至存储器的处理器,处理器被配置为基于存储在存储器装置中的指令,执行上述任一个实施例中的机器学习模型的训练方法或者人脸的识别方法。
根据本公开的再一些实施例,提供一种非易失性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任一个实施例中的机器学习模型的训练方法或者人脸的识别方法。
在上述实施例中,从图像样本数据与错误分类和正确分类两方面,对机器学习模型进行增强学习。这样,使得训练的机器学习模型能够更准确地提取被错分的图像样本数据的特征向量,从而提高机器学习模型的目标识别效果。
附图说明
构成说明书的一部分的附图描述了本公开的实施例,并且连同说明书一起用于解释本公开的原理。
参照附图,根据下面的详细描述,可以更加清楚地理解本公开:
图1示出本公开的机器学习模型的训练方法的一些实施例的流程图;
图2示出图1中步骤130的一些实施例的流程图;
图3示出本公开的机器学习模型的训练方法的一些实施例的流程图;
图4示出本公开的机器学习模型的训练装置的一些实施例的框图;
图5示出本公开的电子设备的一些实施例的框图;
图6示出本公开的电子设备的另一些实施例的框图。
具体实施方式
现在将参照附图来详细描述本公开的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。
同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本公开及其应用或使用的任何限制。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,技术、方法和设备应当被视为授权说明书的一部分。
在这里示出和讨论的所有示例中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它示例可以具有不同的值。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
如前所述,机器学习模型提取的特征不准确,在大规模人脸识别场景中,会产生机器学习模型的低错误接受率(Low False Accept Rate),从而导致人脸识别的准确率快速下降。
例如,图像样本数据中的目标属于的分类为正确分类,即该图像样本数据的正类;图像样本数据中的目标不属于的分类为错误分类,即该图像样本数据的负类。
如果某个图像样本数据中的目标被分到负类,则该图像样本数据对于其正类和负类均为难例。该图像样本数据对于其正类为难例正样本;该图像样本数据对于其负类为难例负样本。
也就是说,在人脸识别场景中,人脸的年龄变化、姿态变化、表情变化、光照不均匀、存在遮挡等情形会产生机器学习模型的识别难例。在机器学习模型的训练中缺乏从正类、负类两方面对难例的强调,会导致机器学习模型提取的特征向量不准确。
本公开的发明人研究发现,难例对于正类越难识别,对于负类也就越难区分。因此,需要在对机器学习模型中关注这些难例,从而使得机器学习模型获得更强大的特征判别力。
因此,本公开提出根据图像样本数据是否为难例,确定从正类和负类两个方面进行联动强调的训练方法。例如,可以通过下面的实施例实现上述技术方案。
图1示出本公开的机器学习模型的训练方法的一些实施例的流程图。
如图1所示,该方法包括:步骤110,确定分类结果;步骤120,判断分类结果是否正确;步骤130,调整特征相似度;和步骤140,计算用于训练模型的损失函数训练。
在步骤110中,利用机器学习模型提取各图像样本数据的特征向量,并根据各特征向量确定各图像样本数据中目标的分类结果。例如,图像样本数据为人脸图像样本数据,可以根据人脸图像数据,利用完成训练的机器学习模型,进行人脸识别以实现本公开的人脸的识别方法。
在一些实施例中,可以预先生成各图像样本数据作为机器学习模型的训练集。例如,对每张图像进行人脸检测,获得其中人脸所在位置的坐标框;根据坐标框进行人脸关键点检测,利用人脸关键点进行人脸对齐,得到标准的人脸图像;根据每张图像的真实类别标签,构成训练集。
在一些实施例中,可以使用卷积神经网络的卷积层提取图像样本数据的特征向量。对该特征向量以及全连接层中代表各类别的权重向量(特征中心)进行L2范数归一化。计算归一化之后的特征向量和权重向量的内积,得到该图像样本数据与各份类别之间的余弦相似度,以确定该图像样本数据中目标的分类结果。
在步骤120中,根据各图像样本数据中目标的标注结果和分类结果,判断各图像样本数据中目标被分类到了正确分类还是错误分类。
在一些实施例中,对于第i个图像样本数据,其正确分类为y。归一化后的特征向量xi与正确分类的归一化后的权重向量wy之间的余弦相似度作为第一特征相似度。
在一些实施例中,同理可以通过计算图像样本数据i的特征向量与各错误分类j的权重向量的点积,确定余弦相似度cos(θi,j)作为各第二特征相似度。第二特征相似度称为负类(negative)的logit。
在一些实施例中,在cos(θi,y)大于cos(θi,j)的情况下,说明图像样本数据i中的目标被分类到了正确分类;在cos(θi,y)小于或等于cos(θi,j)的情况下,说明图像样本数据i中的目标被分类到了错误分类。
在步骤130中,在任一个图像样本数据中目标被分类到了错误分类的情况下,降低该图像样本数据与正确分类之间的第一特征相似度,增加该图像样本数据与错误分类之间的第二特征相似度。
在一些实施例中,图像样本数据i中的目标被分类到了错误分类j中,则说明图像样本数据i对于正确分类y和错误分类j是难例。在这种情况下,需要在训练过程中从正类和负类两方面强调该图像样本数据。例如,可以通过图2中的实施例实现步骤130。
图2示出图1中步骤130的一些实施例的流程图。
如图2所示,步骤130包括:步骤1310,确定干扰错误分类;和步骤1320,调整特征相似度。
在步骤1310中,将第二特征相似度大于第一特征相似度的错误分类,确定为该图像样本数据的干扰错误分类。也就是说,图像样本数据对于正确分类和干扰错误分类均为难例。
在一些实施例中,可以利用掩膜函数(mask)来确定干扰错误分类,以便判断图像样本数据是否为某一个分类的难例。例如,掩膜函数可以为:
图像样本数据i对于错误分类j的分数大于其对于正确分类y的分数,则图像样本数据i将被视为分类j和分类y的难例。图像样本数据i对于错误分类j是难例负样本,对于正确分类y是难例正样本。
在步骤1320中,根据干扰错误分类,降低该图像样本数据与正确分类之间的第一特征相似度,增加该图像样本数据与错误分类之间的第二特征相似度。
在一些实施例中,可以利用特征向量的夹角,降低特征相似度。例如,增加该图像样本数据的特征向量与正确分类的特征向量的夹角,根据增加后的夹角,计算降低后的第一特征相似度。例如,降低后的第一特征相似度为:
在一些实施例中,m0、m1为小于1的非负数。例如,m0的值范围可以为[0.3,0.5],m1的取值范围可以为[0.1,0.3]。可以根据机器学习模型的测试性能调节m0、m1的取值,如m0=0.4,m1=0.2。
在一些实施例中,可以将干扰错误分类,作为增加特征相似度的对象。例如,增加该图像样本数据与每一个干扰错误分类的相应的第二特征相似度。
在一些实施例中,增大后的第二特征相似度与增大前的第二特征相似度可以呈线性关系。例如,可以通过如下公式增加第二特征相似度:
表示指示函数,当Mi,j=1时,第i个图像样本数据是第j个错误分类的难例负样本,那么f(cos(θi,j),Mi,j)会增大相应的负类logit。这样,可以增大损失函数的值,起到强调该图像样本数据的作用。
在一些实施例中,t大于或等于1,α为正小数。例如,1≤t≤1.2,t-1≤α<0.3。也可以根据机器学习模型的测试性能调节t和α的取值范围,例如,t=1.1,α=0.2。
在一些实施例中,对难例样本的强调可分为两个方面:一方面在正类的logit上进行强调,即通过减少正类的logit,让其判断正确的概率降低,从而增大损失函数的值;另一方面在负类的logit上进行强调,即通过增大负类的logit,让其判断正确的概率降低,从而增大损失函数的值。例如,可以通过图1中的其余步骤实现上述技术方案。
在步骤140中,根据所有降低后的第一特征相似度、增加后的第二特征相似度计算损失函数,用于训练机器学习模型。
在一些实施例中,损失函数与降低后的第一特征相似度负相关,与降低后的第一特征相似度和增加后的第二特征相似度之和正相关。例如,损失函数可以为:
N为图像样本数据的数量,s为可调节的尺度因子。可以根据训练数据集的规模和测试性能设置s的取值范围为[30,64],例如,s可以为64。
在一些实施例中,在图像样本数据中目标被分类到了正确分类的情况下,降低图像样本数据与正确分类之间的第一特征相似度。根据所有降低后的第一特征相似度计算损失函数。
在一些实施例中,在图像样本数据中目标被分类到了正确分类的情况下,第一特征相似度的降低幅度小于在图像样本数据中目标被分类到了错误分类的情况下,第一特征相似度的降低幅度。例如,可以通过如下的公式设置自适应间隔以实现难例和非难例的区别处理:
当时,相应图像样本数据被错分到了负类。相应图像样本数据的与其难例负类的平均余弦相似度相关。该图像样本数据越“难”(与负类越相似),越大,从而体现正类难例与负类难例的联动关系。通过增大来减少正类的logit,可以让其判断正确的概率降低,从而增大损失函数的值。
在上述实施例中,从正类和负类两个方面强调图像样本数据,增大难例样本的损失函数值,在一定程度上增大难例样本对网络学习的贡献程度。这样,能够让机器学习模型在训练过程中更关注难例,从而提高提高难例特征的判别能力。例如,可以根据图3中的实施例训练机器学习模型。
图3示出本公开的机器学习模型的训练方法的一些实施例的流程图。
如图3所示,该方法包括:步骤310,提取特征向量;步骤320,计算特征相似度;步骤330,判断判断是否为难例;步骤340,从负类和正类联动强调训练目标;和步骤350,从正类强调训练目标。
在步骤310中,使用卷积神经网络对每张图像样本数据进行人脸的特征向量提取。例如,可以通过对原数据集图片进行人脸检测与对齐,以生成人脸图像样本数据集。
在步骤320中,使用全连接层对提取的特征向量进行身份类别预测,得到各个身份类别的分数(特征相似度)。判断为正确分类的分数为正类logit,判断为错误分类的分数为负类logit。
在步骤330中,根据预测的分数来判断图像样本数据是否属于难例,即,图像样本数据的正类logit小于或等于负类logit,则该图像样本数据将被视为难例样本,执行步骤340;图像样本数据的正类logit大于负类logit,则该图像样本数据将被视为非难例样本,执行步骤350。
在步骤340中,从正类和负类两个方面联动强调图像样本数据。这样,能够指导机器学习模型更好地学习人脸的特征表达,从而来提高对难例样本的判别力,进而提升机器学习模型的识别性能。
在步骤350中,,从正类的方面强调图像样本数据。
图4示出本公开的机器学习模型的训练装置的一些实施例的框图。
如图4所示,机器学习模型的训练装置4包括分类单元41、判断单元42、相似度处理单元43和训练单元44。
分类单元41利用机器学习模型提取各图像样本数据的特征向量,并根据各特征向量确定各图像样本数据中目标的分类结果。
判断单元42根据各图像样本数据中目标的标注结果和分类结果,判断各图像样本数据中目标被分类到了正确分类还是错误分类。
相似度处理单元43在任一个图像样本数据中目标被分类到了错误分类的情况下,降低该图像样本数据与正确分类之间的第一特征相似度,增加该图像样本数据与错误分类之间的第二特征相似度。
在一些实施例中,相似度处理单元43将第二特征相似度大于第一特征相似度的错误分类,确定为该图像样本数据的干扰错误分类;根据干扰错误分类,降低该图像样本数据与正确分类之间的第一特征相似度,增加该图像样本数据与错误分类之间的第二特征相似度。
在一些实施例中,相似度处理单元43增加该图像样本数据的特征向量与正确分类的特征向量的夹角。夹角的增加幅度与该图像样本数据和每一个干扰错误分类的相似度之和正相关,与干扰错误分类的数量负相关。相似度处理单元43根据增加后的夹角,计算降低后的第一特征相似度。
在一些实施例中,相似度处理单元43增加该图像样本数据与每一个干扰错误分类的相应的第二特征相似度。例如,增大后的第二特征相似度与增大前的第二特征相似度呈线性关系。
在一些实施例中,相似度处理单元43在图像样本数据中目标被分类到了正确分类的情况下,降低图像样本数据与正确分类之间的第一特征相似度;根据所有降低后的第一特征相似度计算损失函数。
在一些实施例中,在图像样本数据中目标被分类到了正确分类的情况下,第一特征相似度的降低幅度小于在图像样本数据中目标被分类到了错误分类的情况下,第一特征相似度的降低幅度。
训练单元44根据所有降低后的第一特征相似度、增加后的第二特征相似度计算损失函数,用于训练机器学习模型。例如,损失函数与降低后的第一特征相似度负相关,与降低后的第一特征相似度和增加后的第二特征相似度之和正相关。
在一些实施例中,图像样本数据为人脸图像样本数据;分类单元41根据人脸图像数据,利用完成训练的机器学习模型,进行人脸识别。
图5示出本公开的电子设备的一些实施例的框图。
如图5所示,该实施例的电子设备5包括:存储器51以及耦接至该存储器51的处理器52,处理器52被配置为基于存储在存储器51中的指令,执行本公开中任意一个实施例中的机器学习模型的训练方法或者人脸的识别方法。
其中,存储器51例如可以包括***存储器、固定非易失性存储介质等。***存储器例如存储有操作***、应用程序、引导装载程序BootLoader、数据库以及其他程序等。
图6示出本公开的电子设备的另一些实施例的框图。
如图6所示,该实施例的电子设备6包括:存储器610以及耦接至该存储器610的处理器620,处理器620被配置为基于存储在存储器610中的指令,执行前述任意一个实施例中的机器学习模型的训练方法或者人脸的识别方法。
存储器610例如可以包括***存储器、固定非易失性存储介质等。***存储器例如存储有操作***、应用程序、引导装载程序BootLoader以及其他程序等。
机器学习模型的训练装置6还可以包括输入输出接口630、网络接口640、存储接口650等。这些接口630、640、650以及存储器610和处理器620之间例如可以通过总线660连接。其中,输入输出接口630为显示器、鼠标、键盘、触摸屏、麦克、音箱等输入输出设备提供连接接口。网络接口640为各种联网设备提供连接接口。存储接口650为SD卡、U盘等外置存储设备提供连接接口。
本领域内的技术人员应当明白,本公开的实施例可提供为方法、***、或计算机程序产品。因此,本公开可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用非瞬时性存储介质包括但不限于磁盘存储器、CD-ROM、光学存储器等上实施的计算机程序产品的形式。
至此,已经详细描述了根据本公开的机器学习模型的训练方法、机器学习模型的训练装置、人脸的识别方法、人脸的识别装置、电子设备和非瞬时性计算机可读存储介质。为了避免遮蔽本公开的构思,没有描述本领域所公知的一些细节。本领域技术人员根据上面的描述,完全可以明白如何实施这里公开的技术方案。
可能以许多方式来实现本公开的方法和***。例如,可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本公开的方法和***。用于方法的步骤的上述顺序仅是为了进行说明,本公开的方法的步骤不限于以上具体描述的顺序,除非以其它方式特别说明。此外,在一些实施例中,还可将本公开实施为记录在记录介质中的程序,这些程序包括用于实现根据本公开的方法的机器可读指令。因而,本公开还覆盖存储用于执行根据本公开的方法的程序的记录介质。
虽然已经通过示例对本公开的一些特定实施例进行了详细说明,但是本领域的技术人员应该理解,以上示例仅是为了进行说明,而不是为了限制本公开的范围。本领域的技术人员应该理解,可在不脱离本公开的范围和精神的情况下,对以上实施例进行修改。本公开的范围由所附权利要求来限定。
Claims (14)
1.一种机器学习模型的训练方法,包括:
利用机器学习模型提取各图像样本数据的特征向量,并根据各特征向量确定所述各图像样本数据中目标的分类结果;
根据所述各图像样本数据中目标的标注结果和所述分类结果,判断所述各图像样本数据中目标被分类到了正确分类还是错误分类;
在任一个图像样本数据中目标被分类到了错误分类的情况下,降低该图像样本数据与所述正确分类之间的第一特征相似度,增加该图像样本数据与所述错误分类之间的第二特征相似度;
根据所有降低后的所述第一特征相似度、增加后的所述第二特征相似度计算损失函数,用于训练所述机器学习模型。
2.根据权利要求1所述的训练方法,其中,
所述损失函数与降低后的所述第一特征相似度负相关,与降低后的所述第一特征相似度和增加后的所述第二特征相似度之和正相关。
3.根据权利要求2所述的训练方法,其中,所述降低该图像样本数据与所述正确分类之间的第一特征相似度,增加该图像样本数据与所述错误分类之间的第二特征相似度包括:
将所述第二特征相似度大于所述第一特征相似度的错误分类,确定为该图像样本数据的干扰错误分类;
根据所述干扰错误分类,降低该图像样本数据与所述正确分类之间的第一特征相似度,增加该图像样本数据与所述错误分类之间的第二特征相似度。
4.根据权利要求3所述的训练方法,其中,所述降低该图像样本数据与所述正确分类之间的第一特征相似度包括:
增加该图像样本数据的特征向量与所述正确分类的特征向量的夹角,所述夹角的增加幅度与该图像样本数据和每一个干扰错误分类的相似度之和正相关,与所述干扰错误分类的数量负相关;
根据增加后的夹角,计算降低后的第一特征相似度。
5.根据权利要求3所述的训练方法,其中,所述增加该图像样本数据与所述错误分类之间的第二特征相似度包括:
增加该图像样本数据与每一个干扰错误分类的相应的第二特征相似度。
6.根据权利要求5所述的训练方法,其中,
增大后的第二特征相似度与增大前的第二特征相似度呈线性关系。
7.根据权利要求1所述的训练方法,还包括:
在所述图像样本数据中目标被分类到了正确分类的情况下,降低所述图像样本数据与所述正确分类之间的第一特征相似度;
根据所有降低后的第一特征相似度计算所述损失函数。
8.根据权利要求7所述的训练方法,其中,
在所述图像样本数据中目标被分类到了正确分类的情况下,所述第一特征相似度的降低幅度小于在所述图像样本数据中目标被分类到了错误分类的情况下,所述第一特征相似度的降低幅度。
9.根据权利要求1-8任一项所述的训练方法,其中,
所述图像样本数据为人脸图像样本数据;
还包括:
根据人脸图像数据,利用完成训练的所述机器学习模型,进行人脸识别。
10.一种机器学习模型的训练装置,包括:
分类单元,用于利用机器学习模型提取各图像样本数据的特征向量,并根据各特征向量确定所述各图像样本数据中目标的分类结果;
判断单元,用于根据所述各图像样本数据中目标的标注结果和所述分类结果,判断所述各图像样本数据中目标被分类到了正确分类还是错误分类;
相似度处理单元,用于在任一个图像样本数据中目标被分类到了错误分类的情况下,降低该图像样本数据与所述正确分类之间的第一特征相似度,增加该图像样本数据与所述错误分类之间的第二特征相似度;
训练单元,用于根据所有降低后的所述第一特征相似度、增加后的所述第二特征相似度计算损失函数,用于训练所述机器学习模型。
11.一种人脸的识别方法,包括:
根据人脸图像数据,利用完成训练的机器学习模型,进行人脸识别,所述机器学习模型通过权利要求1-8任一项所述的机器学习模型的训练方法进行训练。
12.一种人脸的识别装置,包括:
识别单元,用于根据人脸图像数据,利用完成训练的机器学习模型,进行人脸识别,所述机器学习模型通过权利要求1-8任一项所述的机器学习模型的训练方法进行训练。
13.一种电子设备,包括:
存储器;和
耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器中的指令,执行权利要求1-9任一项所述的机器学习模型的训练方法或者权利要求11所述的人脸的识别方法。
14.一种非瞬时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现权利要求1-9任一项所述的机器学习模型的训练方法或者权利要求11所述的人脸的识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010723795.4A CN112101542A (zh) | 2020-07-24 | 2020-07-24 | 机器学习模型的训练方法、装置、人脸的识别方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010723795.4A CN112101542A (zh) | 2020-07-24 | 2020-07-24 | 机器学习模型的训练方法、装置、人脸的识别方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112101542A true CN112101542A (zh) | 2020-12-18 |
Family
ID=73749640
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010723795.4A Pending CN112101542A (zh) | 2020-07-24 | 2020-07-24 | 机器学习模型的训练方法、装置、人脸的识别方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112101542A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112580734A (zh) * | 2020-12-25 | 2021-03-30 | 深圳市优必选科技股份有限公司 | 目标检测模型训练方法、***、终端设备及存储介质 |
CN113283446A (zh) * | 2021-05-27 | 2021-08-20 | 平安科技(深圳)有限公司 | 图像中目标物识别方法、装置、电子设备及存储介质 |
CN113378853A (zh) * | 2021-05-25 | 2021-09-10 | 北京有竹居网络技术有限公司 | 一种图像分类方法、装置、设备及存储介质 |
CN113902898A (zh) * | 2021-09-29 | 2022-01-07 | 北京百度网讯科技有限公司 | 目标检测模型的训练、目标检测方法、装置、设备和介质 |
CN115601618A (zh) * | 2022-11-29 | 2023-01-13 | 浙江华是科技股份有限公司(Cn) | 一种磁芯缺陷检测方法、***及计算机存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109858518A (zh) * | 2018-12-26 | 2019-06-07 | 中译语通科技股份有限公司 | 一种基于MapReduce的大型数据集聚类方法 |
CN110163258A (zh) * | 2019-04-24 | 2019-08-23 | 浙江大学 | 一种基于语义属性注意力重分配机制的零样本学习方法及*** |
CN110516737A (zh) * | 2019-08-26 | 2019-11-29 | 南京人工智能高等研究院有限公司 | 用于生成图像识别模型的方法和装置 |
WO2019233226A1 (zh) * | 2018-06-05 | 2019-12-12 | 腾讯科技(深圳)有限公司 | 人脸识别方法、分类模型训练方法、装置、存储介质和计算机设备 |
US20200143248A1 (en) * | 2017-07-12 | 2020-05-07 | Tencent Technology (Shenzhen) Company Limited | Machine learning model training method and device, and expression image classification method and device |
-
2020
- 2020-07-24 CN CN202010723795.4A patent/CN112101542A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200143248A1 (en) * | 2017-07-12 | 2020-05-07 | Tencent Technology (Shenzhen) Company Limited | Machine learning model training method and device, and expression image classification method and device |
WO2019233226A1 (zh) * | 2018-06-05 | 2019-12-12 | 腾讯科技(深圳)有限公司 | 人脸识别方法、分类模型训练方法、装置、存储介质和计算机设备 |
CN109858518A (zh) * | 2018-12-26 | 2019-06-07 | 中译语通科技股份有限公司 | 一种基于MapReduce的大型数据集聚类方法 |
CN110163258A (zh) * | 2019-04-24 | 2019-08-23 | 浙江大学 | 一种基于语义属性注意力重分配机制的零样本学习方法及*** |
CN110516737A (zh) * | 2019-08-26 | 2019-11-29 | 南京人工智能高等研究院有限公司 | 用于生成图像识别模型的方法和装置 |
Non-Patent Citations (1)
Title |
---|
DAN ZENG等: "NPCFace: A Negative-Positive Cooperation Supervision for Training Large-scale Face Recognition", 《ARXIV》, 20 July 2020 (2020-07-20) * |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112580734A (zh) * | 2020-12-25 | 2021-03-30 | 深圳市优必选科技股份有限公司 | 目标检测模型训练方法、***、终端设备及存储介质 |
CN112580734B (zh) * | 2020-12-25 | 2023-12-29 | 深圳市优必选科技股份有限公司 | 目标检测模型训练方法、***、终端设备及存储介质 |
CN113378853A (zh) * | 2021-05-25 | 2021-09-10 | 北京有竹居网络技术有限公司 | 一种图像分类方法、装置、设备及存储介质 |
CN113378853B (zh) * | 2021-05-25 | 2024-02-13 | 北京有竹居网络技术有限公司 | 一种图像分类方法、装置、设备及存储介质 |
CN113283446A (zh) * | 2021-05-27 | 2021-08-20 | 平安科技(深圳)有限公司 | 图像中目标物识别方法、装置、电子设备及存储介质 |
WO2022247005A1 (zh) * | 2021-05-27 | 2022-12-01 | 平安科技(深圳)有限公司 | 图像中目标物识别方法、装置、电子设备及存储介质 |
CN113283446B (zh) * | 2021-05-27 | 2023-09-26 | 平安科技(深圳)有限公司 | 图像中目标物识别方法、装置、电子设备及存储介质 |
CN113902898A (zh) * | 2021-09-29 | 2022-01-07 | 北京百度网讯科技有限公司 | 目标检测模型的训练、目标检测方法、装置、设备和介质 |
CN115601618A (zh) * | 2022-11-29 | 2023-01-13 | 浙江华是科技股份有限公司(Cn) | 一种磁芯缺陷检测方法、***及计算机存储介质 |
CN115601618B (zh) * | 2022-11-29 | 2023-03-10 | 浙江华是科技股份有限公司 | 一种磁芯缺陷检测方法、***及计算机存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112101542A (zh) | 机器学习模型的训练方法、装置、人脸的识别方法和装置 | |
CN109214360B (zh) | 一种基于ParaSoftMax损失函数的人脸识别模型的构建方法及应用 | |
Ruiz-del-Solar et al. | Offline signature verification using local interest points and descriptors | |
Pfister et al. | Large-scale Learning of Sign Language by Watching TV (Using Co-occurrences). | |
CN106407958B (zh) | 基于双层级联的面部特征检测方法 | |
CN105389593A (zh) | 基于surf特征的图像物体识别方法 | |
US20120170852A1 (en) | Face recognition apparatus and methods | |
Bourennane et al. | Comparison of shape descriptors for hand posture recognition in video | |
CN110070090A (zh) | 一种基于手写文字识别的物流标签信息检测方法及*** | |
Pham et al. | Offline handwritten signature verification using local and global features | |
Kawulok | Energy-based blob analysis for improving precision of skin segmentation | |
CN115937873A (zh) | 一种基于可辨识单字字符的在线笔迹验证***及方法 | |
Guerbai et al. | One-class versus bi-class SVM classifier for off-line signature verification | |
Ali et al. | A novel features and classifiers fusion technique for recognition of Arabic handwritten character script | |
Mehrotra et al. | Biometric match score fusion using RVM: A case study in multi-unit iris recognition | |
CN112183504B (zh) | 一种基于非接触式手掌静脉图像的视频注册方法及装置 | |
Vatsa et al. | Integrating image quality in 2ν-SVM biometric match score fusion | |
WO2015037973A1 (en) | A face identification method | |
Khanam et al. | Analysis of finger vein feature extraction and recognition using DA and KNN methods | |
CN107103289B (zh) | 利用笔迹轮廓特征来进行笔迹鉴别的方法及*** | |
Houtinezhad et al. | Writer-independent signature verification based on feature extraction fusion | |
Singh et al. | Speaker identification using optimal lip biometrics | |
CN103593660A (zh) | 一种稳定特征图像下交叉梯度编码的掌纹识别方法 | |
US20230069960A1 (en) | Generalized anomaly detection | |
CN113111849B (zh) | 人体关键点检测方法、装置、***与计算机可读介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |