CN107430684A

CN107430684A - 用于对象识别***的在线训练

Info

Publication number: CN107430684A
Application number: CN201680014314.4A
Authority: CN
Inventors: D·J·朱利安; A·莎拉
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 2015-03-11
Filing date: 2016-02-22
Publication date: 2017-12-01
Also published as: JP7372730B2; WO2016144523A1; JP2018509712A; US20160267395A1; EP3268896A1; US10210464B2; CN118051836A

Abstract

一种分类器的在线训练的方法包括：确定从对象的一个或多个特征向量到在该分类器的离线训练期间建立的第一预定决策边界的距离。该方法还包括：将决策规则更新为该距离的函数。该方法进一步包括：基于经更新的决策规则来对将来示例进行分类。

Description

用于对象识别***的在线训练

相关申请的交叉引用

本申请根据35 U.S.C.§119(e)要求于2015年3月11日提交的题为“ONLINETRAINING FOR OBJECT RECOGNITION SYSTEM(用于对象识别***的在线训练)”的美国临时专利申请No.62/131,788的权益，其公开通过引用整体明确地纳入于此。

背景

领域

本公开的某些方面一般涉及机器学习，尤其涉及用于改进用于对象分类的在线训练的***和方法。

背景技术

可包括一群互连的人工神经元(例如，神经元模型)的人工神经网络是一种计算设备或者表示将由计算设备执行的方法。

卷积神经网络是一种前馈人工神经网络。卷积神经网络可包括神经元集合，其中每一个神经元具有感受野并且共同地拼出一输入空间。卷积神经网络(CNN)具有众多应用。具体地，CNN已被广泛使用于模式识别和分类领域。

深度学习架构(诸如，深度置信度网络和深度卷积网络)是分层神经网络架构，其中神经元的第一层的输出变成神经元的第二层的输入，神经元的第二层的输出变成神经元的第三层的输入，以此类推。深度神经网络可被训练以识别特征阶层并因此它们被越来越多地用于对象识别应用。类似于卷积神经网络，这些深度学习架构中的计算可在处理节点群体上分发，其可被配置在一个或多个计算链中。这些多层架构可每次训练一层并可使用反向传播微调。

其他模型也可用于对象识别。例如，支持向量机(SVM)是可被应用于分类的学***面(例如，决策边界)。该超平面由监督式学***面增加训练数据的裕量。换言之，超平面应该具有到训练示例的最大的最小距离。

尽管这些解决方案在数个分类基准上取得了优异的结果，但它们的计算复杂度可能极其高。另外，模型的训练可能是有挑战性的。

概述

在本公开的一个方面，公开了一种分类器的在线训练的方法。该方法包括：确定从对象的一个或多个特征向量到在分类器的离线训练期间建立的第一预定决策边界的距离。在一种配置中，该一个或多个特征向量在在线训练期间被接收。该方法还包括：将决策规则更新为至少该距离的函数。该方法进一步包括：基于经更新的决策规则来对将来示例进行分类。

本公开的另一方面涉及一种设备，该设备包括用于确定从对象的一个或多个特征向量到在分类器的离线训练期间建立的第一预定决策边界的距离的装置。在一种配置中，该一个或多个特征向量在在线训练期间被接收。该设备还包括用于将决策规则更新为至少该距离的函数的装置。该设备进一步包括用于基于经更新的决策规则来对将来示例进行分类的装置。

在本公开的另一方面，公开了一种用于分类器的在线训练的计算机程序产品。该计算机程序产品具有其上记录有非瞬态程序代码的非瞬态计算机可读介质。该程序代码由处理器执行并且包括用于确定从对象的一个或多个特征向量到在分类器的离线训练期间建立的第一预定决策边界的距离的程序代码。在一种配置中，该一个或多个特征向量在在线训练期间被接收。该程序代码还包括用于将决策规则更新为至少该距离的函数的程序代码。该程序代码进一步包括用于基于经更新的决策规则来对将来示例进行分类的程序代码。

本公开的另一方面涉及一种用于分类器的在线训练的装置，该装置具有存储器以及耦合至该存储器的一个或多个处理器。(诸)处理器被配置成：确定从对象的一个或多个特征向量到在分类器的离线训练期间建立的第一预定决策边界的距离。在一种配置中，该一个或多个特征向量在在线训练期间被接收。(诸)处理器还被配置成：将决策规则更新为至少该距离的函数。(诸)处理器被进一步配置成：基于经更新的决策规则来对将来示例进行分类。

本公开的附加特征和优点将在下文描述。本领域技术人员应该领会，本公开可容易地被用作修改或设计用于实施与本公开相同的目的的其他结构的基础。本领域技术人员还应认识到，这样的等效构造并不脱离所附权利要求中所阐述的本公开的教导。被认为是本公开的特性的新颖特征在其组织和操作方法两方面连同进一步的目的和优点在结合附图来考虑以下描述时将被更好地理解。然而，要清楚理解的是，提供每一幅附图均仅用于解说和描述目的，且无意作为对本公开的限定的定义。

附图简要说明

在结合附图理解下面阐述的详细描述时，本公开的特征、本质和优点将变得更加明显，在附图中，相同附图标记始终作相应标识。

图1解说了根据本公开的某些方面的使用片上***(SOC)(包括通用处理器)来设计神经网络的示例实现。

图2解说了根据本公开的各方面的***的示例实现。

图3-5是与决策边界相关的肯定和否定示例的一维图解。

图6A-B和7是根据本公开的各方面的与决策边界相关的肯定和否定示例的一维图解。

图8和9是解说根据本公开的各方面的用于在线训练的方法的流程图。

详细描述

以下结合附图阐述的详细描述旨在作为各种配置的描述，而无意表示可实践本文中所描述的概念的仅有的配置。本详细描述包括具体细节以便提供对各种概念的透彻理解。然而，对于本领域技术人员将显而易见的是，没有这些具体细节也可实践这些概念。在一些实例中，以框图形式示出众所周知的结构和组件以避免湮没此类概念。

基于本教导，本领域技术人员应领会，本公开的范围旨在覆盖本公开的任何方面，不论其是与本公开的任何其他方面相独立地还是组合地实现的。例如，可以使用所阐述的任何数目的方面来实现装置或实践方法。另外，本公开的范围旨在覆盖使用作为所阐述的本公开的各个方面的补充或者与之不同的其他结构、功能性、或者结构及功能性来实践的此类装置或方法。应当理解，所披露的本公开的任何方面可由权利要求的一个或多个元素来实施。

措辞“示例性”在本文中用于表示“用作示例、实例或解说”。本文中描述为“示例性”的任何方面不必被解释为优于或胜过其他方面。

尽管本文描述了特定方面，但这些方面的众多变体和置换落在本公开的范围之内。虽然提到了优选方面的一些益处和优点，但本公开的范围并非旨在被限定于特定益处、用途或目标。相反，本公开的各方面旨在能宽泛地应用于不同的技术、***配置、网络和协议，其中一些作为示例在附图以及以下对优选方面的描述中解说。详细描述和附图仅仅解说本公开而非限定本公开，本公开的范围由所附权利要求及其等效技术方案来定义。

在线训练期间，读取器设备(诸如指纹读取器或虹膜扫描仪)可以确定对象是否与经训练的样本匹配。在常规***中，在初始离线训练期间，数个肯定匹配(诸如真实的手指)和否定匹配(诸如假造的手指)被用于训练。肯定匹配和否定匹配也可被用于确定初始决策边界。

另外，在常规***中，决策边界可以在使用指纹读取器时使用在线训练进行细调。对于许多用例(诸如假冒真指纹)，在线训练期间仅提供肯定示例或者提供与否定示例相比增加数目的肯定示例。尽管如此，增加数目的肯定示例可能更新特征向量分类器，使得决策边界移离肯定示例，由此增加伪造手指将被分类为真实手指的概率。

本公开的各方面涉及通过改进关于设备所有者的手指的分类边界来降低伪造手指被分类为真实手指的概率。尽管本说明书是关于手指分类的，但是注意到，手指仅仅是要被分类的对象的一个示例。本公开同等地适用于任何其他类型的对象。

图1解说了根据本公开的某些方面的使用片上***(SOC)100的分类器的前述在线训练的示例实现100，该SOC 100可以包括通用处理器(CPU)或多核通用处理器(CPU)102。变量(例如，神经信号和突触权重)、与计算设备(例如，带有权重的神经网络)相关联的***参数、延迟、频率槽信息、以及任务信息可被存储在与神经处理单元(NPU)108相关联的存储器块中、与CPU 102相关联的存储器块中、与图形处理单元(GPU)104相关联的存储器块中、与数字信号处理器(DSP)106相关联的存储器块中、专用存储器块118中，或者可跨多个块分布。在通用处理器102处执行的指令可从与CPU 102相关联的程序存储器加载或可从专用存储器块118加载。

SOC 100还可包括为具体功能定制的附加处理块(诸如GPU 104、DSP 106、连通性块110(其可包括***长期演进(4G LTE)连通性、无执照Wi-Fi连通性、USB连通性、蓝牙连通性等))以及例如可检测和识别姿势的多媒体处理器112。在一种实现中，NPU实现在CPU、DSP、和/或GPU中。SOC 100还可包括传感器处理器114、图像信号处理器(ISP)、和/或导航120(其可包括全球定位***)。

SOC可基于ARM指令集。在本公开的一方面，加载到通用处理器102中的指令可以包括用于确定从在线训练期间观察到的对象的一个或多个特征向量到在分类器的离线训练期间建立的第一预定决策边界的距离的代码。这些加载到通用处理器102中的指令还可以包括用于将决策规则更新为该距离的函数的代码。这些加载到通用处理器102中的指令可进一步包括用于基于经更新的决策规则来对将来示例进行分类的代码。

图2解说了根据本公开的某些方面的***200的示例实现。如图2中所解说的，***200可具有可执行本文所描述的方法的各种操作的多个局部处理单元202。每个局部处理单元202可包括局部状态存储器204和可存储神经网络的参数的局部参数存储器206。另外，局部处理单元202可具有用于存储局部模型程序的局部(神经元)模型程序(LMP)存储器208、用于存储局部学习程序的局部学习程序(LLP)存储器210、以及局部连接存储器212。此外，如图2中所解说的，每个局部处理单元202可与用于为该局部处理单元的各局部存储器提供配置的配置处理器单元214对接，并且与提供各局部处理单元202之间的路由的路由连接处理单元216对接。

深度学习架构可通过学习在每一层中以逐次更高的抽象程度来表示输入、藉此构建输入数据的有用特征表示来执行对象识别任务。以此方式，深度学习解决了传统机器学习的主要瓶颈。在深度学习出现之前，用于对象识别问题的机器学习办法可能严重依赖人类工程设计的特征，或许与浅分类器相结合。浅分类器可以是两类线性分类器，例如，其中可将特征向量分量的加权和与阈值作比较以预测输入属于哪一类。人类工程设计的特征可以是由拥有领域专业知识的工程师针对具体问题领域定制的模版或内核。相反，深度学习架构可学习以表示与人类工程师可能会设计的相似的特征，但它是通过训练来学习的。此外，深度网络可以学习以表示和识别人类可能还没有考虑过的新类型的特征。

深度学习架构可以学习特征阶层。例如，如果向第一层呈递视觉数据，则第一层可学习去识别输入流中的简单特征(诸如边)。如果向第一层呈递听觉数据，则第一层可学习去识别特定频率中的频谱功率。取第一层的输出作为输入的第二层可以学习以识别特征组合，诸如对于视觉数据识别简单形状或对于听觉数据识别声音组合。更高层可学习去表示视觉数据中的复杂形状或听觉数据中的词语。再高层可学习以识别常见视觉对象或口语短语。

深度学习架构在被应用于具有自然阶层结构的问题时可能表现特别好。例如，机动交通工具的分类可受益于首先学习以识别轮子、挡风玻璃、以及其他特征。这些特征可在更高层以不同方式被组合以识别轿车、卡车和飞机。

神经网络可被设计成具有各种连通性模式。在前馈网络中，信息从较低层被传递到较高层，其中给定层中的每个神经元向更高层中的神经元进行传达。如上所述，可在前馈网络的相继层中构建阶层式表示。神经网络还可具有回流或反馈(也被称为自顶向下(top-down))连接。在回流连接中，来自给定层中的神经元的输出被传达给相同层中的另一神经元。递归架构可有助于识别在时间上展开的模式。从给定层中的神经元到较低层中的神经元的连接被称为反馈(或自顶向下)连接。当高层级概念的识别可辅助辨别输入的特定低层级特征时，具有许多反馈连接的网络可能是有助益的。

在一种配置中，机器学习模型被配置成用于确定从对象的一个或多个特征向量到在分类器的离线训练期间建立的第一预定决策边界的距离。在一种配置中，一个或多个特征向量在在线训练期间被接收。该模型还被配置成用于将决策规则更新为至少该距离的函数。该模型被进一步配置成用于基于经更新的决策规则来对将来示例进行分类。该模型包括确定装置、更新装置、和/或分类装置。在一个方面，该确定装置、更新装置、和/或分类装置可以是配置成执行所叙述功能的通用处理器102、与通用处理器102相关联的程序存储器、存储器块118、局部处理单元202、和/或路由连接处理单元216。在另一配置中，前述装置可以是被配置成执行由前述装置所叙述功能的任何模块或任何装置。

根据本公开的某些方面，每个局部处理单元202可被配置成基于机器学习网络的一个或多个期望功能特征来确定该网络的参数，以及随着所确定的参数被进一步适配、调谐和更新来使这一个或多个功能特征朝着期望的功能特征发展。

用于对象识别***的决策边界改进

如先前所讨论的，在线训练期间，读取器设备(诸如指纹读取器或虹膜扫描仪)可以确定对象是否与经训练的样本匹配。此外，对于一些读取器设备，期望改进读取器以使得该读取器可以确定对象是实际对象还是假造的对象。例如，对象可以是手指。由此，假造的手指是指不是实际手指的对象。例如，假造的手指是可被用来模仿指纹的对象(诸如带有嵌入式指纹的塑料手指)。假造的手指可被称为伪造手指。

在常规***中，在初始离线训练期间，肯定匹配和否定匹配可被用于确定初始决策边界。在一种配置中，经由示例向量分类器来确定初始决策边界。该示例向量分类器可以是支持向量机器(SVM)分类器。此外，分类器可以是线性分类器或非线性分类器。

应注意到，示例向量可以定义边界。也就是说，示例向量是指离线确定的定义/确定决策边界的特征向量组。在一个示例中，对于支持向量机器，示例向量将是支持向量。此外，特征向量是指为每个对象(诸如指纹)确定的向量。另外，最小向量可以指距离D_min(D_最小)处的特征向量。

另外，在常规***中，决策边界可以在使用指纹读取器时使用在线训练进行细调。图3解说了决策边界302的一维示例，该决策边界302是用于确定指纹是否来自真手指的真示例向量(REV)与用来确定指纹是否来自伪造手指的伪造示例向量(FEV)之间的边界。基于裕量最大化，决策边界302被置于真示例向量与伪造示例向量之间的中途。在图3的示例中，手指可以在其在真示例向量与决策边界302之间被检测到的情况下被分类为真。替换地，手指可以在其在决策边界302与伪造示例向量之间被检测到的情况下被分类为伪造。

图4解说了在常规设备中针对决策边界404使用在线训练的示例。如图4中所示，设备可以接收作为在线训练样本的多个指纹R。所描述的多个指纹可以是对应于收到指纹的向量。如图4中所示，多个指纹R1-R3可以比真示例向量更远离决策边界404。由此，在该示例中，因为指纹R1-R3更远离真示例向量，所以不调整决策边界404。

图5解说了在常规设备中针对初始决策边界505使用在线训练的示例。如图5中所示，设备可以接收用于训练的指纹R。另外，如图5中所示，指纹R可以比真示例向量更靠近初始决策边界505。由此，在该示例中，因为指纹R更靠近初始决策边界，所以基于裕量最大化，初始决策边界505被调整以使得经修改的决策边界508位于新指纹R与伪造示例向量之间的中途。在该示例中，因为经修改的决策边界508已被移动到比真示例向量更靠近伪造示例向量，所以假造的手指可能被错误地归类为真实手指。这可能与使用在线指纹来收紧用户的手指的假冒边界的期望效果相反。

此外，在该示例中，真示例向量的位置也可被调整为收到指纹R的位置。由此，在该示例中，经修改的决策边界508可以在接收到比经调整的真示例向量(例如，收到指纹R的位置)更靠近经修改的决策边界508的后续指纹测试样本的情况下进一步朝伪造示例向量移动。

常规***并不基于在线使用来细调或定制指纹读取器。相反，常规***维持离线训练的决策边界。附加或替换地，常规***可以包括在线训练中使用的否定示例。

如先前所讨论的，本公开的各方面涉及通过改进关于设备所有者的手指的分类边界来降低伪造手指被分类为真实手指的概率。尽管本说明书是关于手指分类的，但是注意到，手指仅仅是要被分类的对象的一个示例。本公开同等地适用于任何其他类型的对象。

在一种配置中，设备的边界决策基于增加使用(诸如日常使用)来改进，随着在线训练期间接收到的肯定示例来改进。也就是说，在线训练示例可以是真手指的肯定示例。更具体地，在一种配置中，否定样本在在线训练期间不被接收。改进的决策边界可以随着时间推移产生更安全的指纹识别。也就是说，设备可能更难通过假读取危害。

在本配置中，设备使用离线训练的指纹识别器来初始化。作为示例，离线训练可以生成用于确定手指是真还是伪造的决策边界302(图3)。在初始化期间，距离(D_min)被设为预定值(诸如无穷大或负值)。另外，在初始化期间，收到指纹数目N被设为0。距离(D_min)是在线训练期间接收到的指纹向量与决策边界之间最靠近的距离。距离(D_min)可被称为最小向量距离(D_min)。指纹向量可被称为指纹特征向量。

在初始化之后，用户可以将多个指纹注册为训练样本。设备可以计算每个指纹到决策边界的距离(D_fv)。例如，设备可以使用每个指纹特征向量和决策边界超平面单位向量的内积来计算距离(D_fv)。在这种配置中，具有最靠近决策边界的距离(D_fv)的收到指纹被维持为新向量。该新向量可被称为在线看到的最紧密点(TPSO)。另外，在一种配置中，任何先前高速缓存的指纹特征向量被丢弃。

另外，(D_min)的值被更新为等于与在线看到的最紧密点相关联的指纹距离(D_fv)。此外，收到指纹数目N基于接收到的指纹数目而递增。在这种配置中，离线训练的示例向量被维持并且被用来设置经修改的决策边界的取向。此外，在本配置中，在线看到的最紧密点和收到指纹数目N被用于决策边界调整。在一种配置中，在线看到的最紧密点是在决策边界与真示例向量相关联的一侧上观察到的最小D_fv值。在大多数情形中，随着收到指纹数目N增加，到初始决策边界的新指纹距离(D_fv)应当大于在线看到的最紧密点到决策边界的距离(D_min)加上或减去Δ值。Δ值的使用是可任选的。

在一种配置中，经修改的决策边界可以基于收到指纹的数目来调整。也就是说，如果收到指纹的数目小于阈值，则对经修改的决策边界的调整被扼制，使得经修改的决策边界不被调整达一高数量。替换地，如果收到指纹的数目大于阈值，则对经修改的决策边界的调整量可被增大。具体地，在本配置中，对于真实手指比对假手指的分类器，设备将针对成功的真实手指分类修改的决策边界的位置调整达基于收到指纹数目N和收到指纹与初始决策边界之间最靠近的距离(D_min)的函数的量。

此外，在一种配置中，每当用户成功地使用他们的指纹(例如，成功的指纹识别和成功的真实手指识别)时，就重复初始化之后的前述步骤。

图6A解说了根据本公开的一方面的确定经修改的决策边界的示例。如图6A中所示，基于离线训练来指定真示例向量(REV)、伪造示例向量(FEV)、以及初始决策边界602。在初始化之后(例如，在完成离线训练之后)，设备可以接收多个指纹(R1-R3)以用于测试。如图6A中所示，该设备将每个指纹样本与初始决策边界602之间的距离计算为一组值(D_fv1、D_fv2、D_fv3)。在该示例中，第一手指R1的距离(D_fv1)与其他指纹(R2、R3)的距离(D_fv2、D_fv3)相比最靠近初始决策边界602。因此，第一手指R1的向量被设为在线看到的最紧密点，并且最小向量距离(D_min)被设为第一手指R1的距离(D_fv1)。相应地，如图6B中所示，可以基于最小向量距离(D_min)的值和收到指纹数目N来指定经修改的决策边界604。应当注意，从离线训练计算出的初始决策边界602也被维持。

在一个示例中，用于到离线训练的边界(例如，初始决策边界)的特征向量距离(D_fv)的指定裕量函数为：

在式1中，M_min和k是固定参数，其中M_min控制离最靠近决策边界的真示例向量的最小裕量，而k是控制最小向量距离(D_min)向最靠近初始决策边界的指纹特征向量移动的速率的设计参数。根据本公开的各方面，对于要被分类为真的特征向量应当满足式1。

在一种配置中，注册指纹被用来设置收到指纹数目N和最小向量距离(D_min)的初始值。例如，如果注册了5个指纹，则N等于5，并且最小向量距离(D_min)被设为最靠近初始决策边界的指纹特征向量。在一种配置中，初始最小向量距离(D_min)可以具有特殊值(诸如无穷大)。当最小向量距离(D_min)具有特殊值时，式1不被使用，从而在N等于0时避免除以0。相反，默认边界被使用。另外，一旦第一有效指纹触发先前所讨论的更新，N就被递增到大于或等于1，最小向量距离(D_min)为有限值，并且当式1被满足时，指纹被认为是真。可以使用将具有增加离最小向量距离(D_min)的所要求裕量以及在最小向量距离(D_min)或(D_min–M_min)处饱和的不同速率和权衡的其他方程式。

基于式1中所示的裕量方程式，当收到指纹数目N小于阈值时，真实/假造的手指分类器主要基于初始决策边界。尽管如此，随着收到指纹数目N增大到大于阈值，获得对所有者的手指特征向量的更好理解。由此，经修改的决策边界被调整以针对所有者的手指进行定制。决策边界的取向不变，相反，决策边界的位置改变。因此，在线训练中没有否定示例不具有因对用户的手指过度拟合和改变边界取向而产生的过度不利影响。

由此，每当设备所有者成功地使用他们的指纹来解锁他们的设备或用于其他目的时，真实手指分类器的决策边界就被移动到为真的最靠近的收到手指。

图7解说了使用为特征向量距离指定的裕量函数的示例。如图7中所示，已基于在线训练计算出真示例向量(REV)和经修改的决策边界704。在图7中还示出了初始决策边界702和伪造示例向量(FEV)。此外，如图7中所示，在确定真示例向量、经修改的决策边界704、初始决策边界702和伪造示例向量之后，设备可以接收新指纹测量样本R。在该示例中，设备确定新指纹测量样本R的特征向量距离(D_fv)是否大于其中D_min为真示例向量到初始决策边界702的距离，M_min控制离最靠近决策边界的真示例向量的最小裕量，而是基于看到的指纹的数目的函数。在本配置中，为了被认为是有效的，指纹样本应当超过边界702和704两者。尽管如此，如果最小向量距离(D_min)等于0并且M_min等于1，则(D_min-M_min)等于-1并且边界可以移位到702的右边。由此，在一种配置中，样本应当超过两个边界。在另一配置中，指纹样本基于max(0,式1)的值是大于还是等于0。

也就是说，初始决策边界702是真/假(例如，真/伪)的一个测试，而经修改的决策边界704是真/假或真/伪的第二测试。期望通过超过初始决策边界702和经修改的决策边界704两者(例如，在它们的左边)来将样本分类为真。在一种配置中，确定到初始决策边界702和/或经修改的决策边界704的距离，并将该距离与max(0,式1)的值进行比较。max(0,式1)组合这两个测试。使得，如果式1大于0，则经修改的决策边界704在初始决策边界702的左边并且是有效边界限制。另外，如果式1小于0，这在最小向量距离(D_min)小于M_min时是可能的，则经修改的决策边界704在初始决策边界702的右边，由此初始决策边界702是有效边界限制。

如先前所讨论的，当在线训练期间接收到新指纹测试样本时，如果确定新指纹测试样本R的特征向量距离(D_fv)大于则该新指纹测试样本R和初始决策边界702被用来确定经修改的决策边界704。特征向量距离(D_fv)是从指纹的特征向量到离线训练的决策边界的距离。特征向量距离可以针对在边界的真侧上具有正符号并且针对在该边界的假侧上具有负符号。

在另一示例中，如果新指纹测试样本R的特征向量距离(D_fv)小于则该新指纹测试样本可被拒绝。

在一些情形中，基于图7中所示的示例，当收到指纹数目N大于阈值，使得约等于1时，经修改的决策边界704向左移位到最小向量距离(D_min)处。尽管如此，期望在经修改的决策边界704与最小向量距离(D_min)之间具有一距离。因此，经修改的决策边界704向最小向量距离(D_min)的右边移位一量M_min。当收到指纹数目N小于阈值时，经修改的决策边界704通过将(D_min-M_min)值衰退来进一步向右朝初始决策边界702移位。

在一些情形中，离群者可被用作否定匹配或肯定匹配。在一种配置中，为了减小离群者的影响，当接收到离群者时，代替从收到指纹与初始决策边界之间的最靠近距离(D_fv)计算出的最小向量距离(D_min)，收到指纹的距离(D_fv)可被分拣以确定累积分布。在这种配置中，收到指纹的95百分位的点被用作最小向量距离(D_min)。

也就是说，在一种配置中，设备维持收到指纹的所有距离(D_fv)，并且选择95百分位的最靠近距离(D_fv)或98百分位的最靠近距离(D_fv)，而非最靠近初始决策边界的距离(D_fv)。95百分位和98百分位是两个不同示例。当然，本公开的各方面并不限于95百分位和98百分位，因为构想了其他值。

在一种配置中，维持特定数目(诸如一百)的指纹特征向量。由此，当新指纹特征向量通过测试时，指纹示例向量之一被随机地丢弃以维持特定数目的值。值的数目可以是随机的。

在另一配置中，维持特定数目的最靠近初始决策边界的指纹特征向量(诸如k个最靠近指纹特征向量)。另外，在这种配置中，所维持的指纹特征向量中离初始决策边界最远的指纹特征向量被用来确定最小向量距离(D_min)。在这种配置中，作为潜在离群者的k-1个其他指纹特征向量被丢弃。

在又一配置中，最小向量距离(D_min)可能不被减小超过给定百分比(诸如10％)。由此，在初始注册印记集设置初始最小向量距离(D_min)之后，新的最小向量距离(D_min)随后仅在新的最小向量距离(D_min)大于或等于旧的最小向量距离(D_min)的90％的情况下被更新。在一些情形中，分布通常是较密集的，而离群者可能是稀疏的。由此，随着时间推移，最小向量距离(D_min)可以观察在丢弃离群者时以增量步长减小最小向量距离(D_min)的一系列值。

附加或替换地，设备可以使用外环来以给定假拒绝率(FRR)为目标。例如，目标假拒绝率可以为2％。由此，在一种配置中，每当指纹通过基线/离线训练的决策边界时，随后就对照在线修改的边界来测试指纹。如果指纹基于在线修改的边界通过，则距离被增大一值的98％。在一个示例中，经修改的决策边界位置处的指纹样本关于一百个指纹将通过98次并且失败2次，使得(98*通过)–(2*失败)＝0或者失败值＝(98/2)*通过值。在该示例中，平均而言，经修改的决策边界停留在相同位置。该值被指定为足够小，使得经修改的决策边界不会在一百个试验上移动很多。此外，该值被指定为足够大以使得经修改的决策边界在合理的训练时间上移动。

替换地，如果指纹基于经修改的决策边界失败，则距离被减小一值的2％。本配置的内环应当朝2％的假拒绝率收敛，应当不比初始决策边界更差，和/或应当对照两个边界进行测试。

在一些情形中，经修改的决策边界可以更靠近伪造示例向量移动。在一种配置中，可以为经修改的决策边界的减小指定限制(诸如每25次增大不允许超过2次减小)。在另一配置中，该减小被限制以防止进一步减小直到已存在一次或多次增大。该减小是指将经修改的决策边界更靠近伪造示例向量地移动。

在另一配置中，如果在活性和真印记成功分类的指定时间(诸如2秒)内存在活性失败，则可以将经修改的决策边界更靠近伪造示例向量地移动。活性分类器确定手指是否为真(例如，活)手指。在这种配置中，如果在短的连续预定时间中发生多次尝试，则可以使用故障情形，就像是用于更新最小向量距离(D_min)值的成功情形。在一些情形中，活性失败可被限于不比离线训练的模型差。附加或替换地，对于一般情形，连续尝试可将经修改的决策边界推到更靠近伪造示例向量。

在一些情形中，可能期望将经修改的决策边界推到更靠近伪造示例向量。在一种配置中，对于一些情形(诸如安全性应用)，经修改的决策边界应当不小于离线训练的边界。例如，最小向量距离(D_min)应当大于或等于0。对于其他情形(诸如非安全应用)，经修改的决策边界可被移动超过离线边界。例如，最小向量距离(D_min)可以小于0。

在另一配置中，可以使用样本的统计(诸如所测得的距离(D_fv)的方差)来选择关于经修改的决策边界多么快地改进的参数/模型。例如，如果距离(D_fv)具有小方差，则M_min和k可以很小。替换地，如果距离(D_fv)具有大方差，则M_min和k可以很大。例如，对于a和b的一些选择，k＝a*var(R)+b，或其他函数，其中R是观察到的特征向量距离集，并且可以将所测得的距离(D_fv)用作记号。方差也可被测量并被用来检测离群者(诸如在可指定值1时，将最小向量距离(D_min)减小不超过一个标准偏差)。

在一些情形中，经修改的决策边界可以基于分类器分数来适配。对于一些情形，多个分类器被用来确定指纹身份是否匹配。由此，并非基于通过身份匹配的最靠近印记来增加最小向量距离(D_min)，而是分类器分数或来自身份分类器的置信度被用来适配活性分类器阈值。也就是说，可能期望还使用分类信息。

具体地，在一种配置中，指纹可以具有两个或更多个分类器。一个分类器可以确定指纹是否来自有效用户。第二分类器可以确定印记是否来自真手指。由此，在一种配置中，两个分类器是联合确定的。例如，如果存在印记来自有效用户的强置信度，则其或许更有可能是真指纹。因此，如果指纹来自有效用户，则用于确定指纹是来自真手指还是伪造手指的边界可被放宽。在一种配置中，最小向量距离(D_min)乘以身份置信度(C)，其中身份置信度在0与1之间，并且该置信度是参数。在该示例中，身份置信度越高，活性边界越宽松。

身份置信度是有效用户分类器的归一化分数。也就是说，有效用户分类器可以提供0与1之间的分数C，其中1是指指纹匹配有效用户指纹的高置信度，而0是指指纹不匹配有效用户指纹的高置信度。在该配置中，对于第二活性分类器，指纹在D_fv大于((1-C)*D_min)的情况下为真。

在一种配置中，模型参数(诸如D_min和N、k、以及M_min)被众包到中心位置。模型参数可被推出到现有设备或新设备以改进立即可用的假拒绝率/假接受率性能。

在一些情形中，对于一些肯定类值，可能存在随时间的方差(诸如夜晚和白天、或者从夏天到冬天的差异)。在一种配置中，可以指定时间窗分量。在另一配置中，作为使用指纹的数目N来确定最小向量距离(D_min)的补充或替换，也可以指定时间框。也就是说，如果用户在一时间框(诸如2分钟)内刷他们的手指一千次，则***可能没有接收可以通过使用项来保护的前述变量。由此，式1的可乘以min(1,t/T)，其中t和T定义不同时间。例如，T是365天，而t是自接收到第一在线指纹以来的以天计的时间。由此，在该示例中，在91天之后，t＝91而t/T＝91/365约等于0.25由此，由此，确定经修改的决策边界。在另一示例中，如果t＝4000天，则min(1,4000/365)＝1。相应地，在一年之后，基于本公开中先前所讨论的裕量来指定裕量。尽管如此，在一年(T)结束之前，附加裕量可被指定以收集数据。

因此，基于图7的示例，在t很小时，和min(1,t/T)的乘积接近零并且使用初始决策边界702的阈值。尽管如此，随着t逼近T，和min(1,t/T)变为1并且使用经修改的决策边界704。

应当注意，对于前述配置和基线配置两者，式1均可以使用初始决策边界702直到收到指纹数目N大于收到指纹阈值和/或时间大于时间阈值，此时式1使用(D_min-M_min)。

在另一配置中，代替如上所述地移动决策边界，运行的在线样本标准偏差和平均值基于超过初始离线训练的决策边界的值来计算。在接收到特定数目的指纹之后，可以应用第二测试来确定该值是否通过离线训练的边界并且处于在线计算的平均距离值的数个在线计算机标准偏差内。

在又一配置中，在线训练在经修改的决策边界逼近指定阈值的情况下被停止。例如，在线训练可以在(1-1/N)^k大于0.95的情况下被停止。也就是说，训练可以在满足条件的情况下被停止。例如，训练可以基于收到指纹数目N、经过某一时间量、最小向量距离(D_min)的阈值、和/或其他恰适条件来停止。

此外，外环可以被用来跟踪假拒绝率。具体地，如果假拒绝率大于阈值，则假拒绝率被重置或者收到指纹数目N、K、和/或最小向量距离(D_min)被减小。也就是说，在一些情形中，如果训练被停止，则可能期望再次开始训练。例如，可能已经指定对离群者更稳健的配置(如以上所提及的)。尽管如此，训练可能在具有离群者的状态中被停止。由此，将期望检测何时重新开始训练以及在重新开始训练时做什么。在一个示例中，训练可以通过跟踪假拒绝率并确定假拒绝率是否超过阈值来重新开始。

在一些情形中，可以从一开始就重新开始训练(例如，丢弃先前信息)。在另一配置中，训练可以从先前训练位置重新开始(诸如将训练倒回到特定点)。该倒回可以重置或减少值。在另一配置中，训练可以通过藉由增大用于停止的N阈值或T阈值将停止的准则推出去来继续。在该示例中，阈值可以从0.95增大到0.96。T阈值是指(1-1/N)^k的值。N阈值是指收到指纹的数目。

本公开的各方面并不限于二进制分类用例，并且被构想用于其他用途。例如，在多类分类器中通常存在一组分类器边界。作为示例，多类分类器是对步行者、汽车和卡车进行分类的三类分类器。本公开的各方面可被用来从离线训练的分类器边界改变和适配目标裕量。此外，本公开的各方面并不限于手指、指纹、和/或指纹阅读器。当然，本公开的各方面还被构想用于验证对象(例如，面部、虹膜或任何其他对象)和/或基于对象进行训练的其他用途。

图8示出了根据本公开的一个方面的用于线性分类器的在线训练的方法800。分类器确定从对象的一个或多个特征向量到在该分类器的离线训练期间建立的第一预定决策边界的距离，如框802中所示。在线训练期间观察到一个或多个示例。该分类器将决策规则更新为一个或多个距离的函数，如框804中所示。另外，该分类器基于经更新的决策规则来对将来示例进行分类，如框806中所示。

图9示出了根据本公开的一个方面的线性分类器的在线训练的流程图900。如图9中所示，在框902，在离线训练期间建立预定决策边界。如先前所讨论的，预定决策边界可以通过使用要被分类的对象的真和伪示例来建立。此外，在框904，在线训练期间接收对象。另外，在框906，设备基于该预定决策边界来确定接收到的对象是真对象还是伪造对象。

在一种配置中，如果对象为伪造的，则将接收到的对象分类为伪造(框908)。另外，如果接收到的对象为真，则该设备确定从该对象的特征向量到该预定决策边界的距离(框910)。此外，在确定该距离之后，该设备可以将决策规则更新为至少该距离的函数(框912)。最后，基于经更新的决策规则来对将来对象进行分类(框914)。

在一种配置中，一种机器学习模型被配置成用于：确定从在线训练期间观察到的对象的一个或多个示例到在分类器的离线训练期间建立的第一预定决策边界的距离；将决策规则更新为该距离的函数；并基于经更新的决策规则来对将来示例进行分类。该模型包括确定装置、更新装置、和/或分类装置。在一个方面，该确定装置、更新装置、和/或分类装置可以是配置成执行所叙述功能的通用处理器102、与通用处理器102相关联的程序存储器、存储器块118、局部处理单元202、和/或路由连接处理单元216。在另一配置中，前述装置可以是被配置成执行由前述装置所叙述功能的任何模块或任何装置。

根据本公开的某些方面，每个局部处理单元202可被配置成基于模型的一个或多个期望功能特征来确定模型的参数，以及随着所确定的参数被进一步适配、调谐和更新来使这一个或多个功能特征朝着期望的功能特征发展。

以上所描述的方法的各种操作可由能够执行相应功能的任何合适的装置来执行。这些装置可包括各种硬件和/或(诸)软件组件和/或(诸)模块，包括但不限于电路、专用集成电路(ASIC)、或处理器。一般而言，在附图中有解说的操作的场合，那些操作可具有带相似编号的相应配对装置加功能组件。

如本文所使用的，术语“确定”涵盖各种各样的动作。例如，“确定”可包括演算、计算、处理、推导、研究、查找(例如，在表、数据库或其他数据结构中查找)、探知及诸如此类。另外，“确定”可包括接收(例如接收信息)、访问(例如访问存储器中的数据)、及类似动作。此外，“确定”可包括解析、选择、选取、确立及类似动作。

如本文中所使用的，引述一列项目中的“至少一个”的短语是指这些项目的任何组合，包括单个成员。作为示例，“a、b或c中的至少一个”旨在涵盖：a、b、c、a-b、a-c、b-c、以及a-b-c。

结合本公开所描述的各种解说性逻辑框、模块、以及电路可用设计成执行本文所描述功能的通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列信号(FPGA)或其他可编程逻辑器件(PLD)、分立的门或晶体管逻辑、分立的硬件组件或其任何组合来实现或执行。通用处理器可以是微处理器，但在替换方案中，处理器可以是任何市售的处理器、控制器、微控制器、或状态机。处理器还可以被实现为计算设备的组合，例如DSP与微处理器的组合、多个微处理器、与DSP核心协同的一个或多个微处理器、或任何其它此类配置。

结合本公开描述的方法或算法的步骤可直接在硬件中、在由处理器执行的软件模块中、或在这两者的组合中实施。软件模块可驻留在本领域所知的任何形式的存储介质中。可使用的存储介质的一些示例包括随机存取存储器(RAM)、只读存储器(ROM)、闪存、可擦除可编程只读存储器(EPROM)、电可擦除可编程只读存储器(EEPROM)、寄存器、硬盘、可移动盘、CD-ROM，等等。软件模块可包括单条指令、或许多条指令，且可分布在若干不同的代码段上，分布在不同的程序间以及跨多个存储介质分布。存储介质可被耦合到处理器以使得该处理器能从/向该存储介质读写信息。在替换方案中，存储介质可以被整合到处理器。

本文所公开的方法包括用于达成所描述的方法的一个或多个步骤或动作。这些方法步骤和/或动作可以彼此互换而不会脱离权利要求的范围。换言之，除非指定了步骤或动作的特定次序，否则具体步骤和/或动作的次序和/或使用可以改动而不会脱离权利要求的范围。

所描述的功能可在硬件、软件、固件或其任何组合中实现。如果以硬件实现，则示例硬件配置可包括设备中的处理***。处理***可以用总线架构来实现。取决于处理***的具体应用和整体设计约束，总线可包括任何数目的互连总线和桥接器。总线可将包括处理器、机器可读介质、以及总线接口的各种电路链接在一起。总线接口可用于尤其将网络适配器等经由总线连接至处理***。网络适配器可用于实现信号处理功能。对于某些方面，用户接口(例如，按键板、显示器、鼠标、操纵杆，等等)也可以被连接到总线。总线还可以链接各种其他电路，诸如定时源、***设备、稳压器、功率管理电路以及类似电路，它们在本领域中是众所周知的，因此将不再进一步描述。

处理器可负责管理总线和一般处理，包括执行存储在机器可读介质上的软件。处理器可用一个或多个通用和/或专用处理器来实现。示例包括微处理器、微控制器、DSP处理器、以及其他能执行软件的电路***。软件应当被宽泛地解释成意指指令、数据、或其任何组合，无论是被称作软件、固件、中间件、微代码、硬件描述语言、或其他。作为示例，机器可读介质可包括随机存取存储器(RAM)、闪存、只读存储器(ROM)、可编程只读存储器(PROM)、可擦式可编程只读存储器(EPROM)、电可擦式可编程只读存储器(EEPROM)、寄存器、磁盘、光盘、硬驱动器、或者任何其他合适的存储介质、或其任何组合。机器可读介质可被实施在计算机程序产品中。该计算机程序产品可以包括包装材料。

在硬件实现中，机器可读介质可以是处理***中与处理器分开的一部分。然而，如本领域技术人员将容易领会的，机器可读介质或其任何部分可在处理***外部。作为示例，机器可读介质可包括传输线、由数据调制的载波、和/或与设备分开的计算机产品，所有这些都可由处理器通过总线接口来访问。替换地或补充地，机器可读介质或其任何部分可被集成到处理器中，诸如高速缓存和/或通用寄存器文件可能就是这种情形。虽然所讨论的各种组件可被描述为具有特定位置，诸如局部组件，但它们也可按各种方式来配置，诸如某些组件被配置成分布式计算***的一部分。

处理***可以被配置为通用处理***，该通用处理***具有一个或多个提供处理器功能性的微处理器、以及提供机器可读介质中的至少一部分的外部存储器，它们都通过外部总线架构与其他支持电路***链接在一起。替换地，该处理***可以包括一个或多个神经元形态处理器以用于实现本文所述的神经元模型和神经***模型。作为另一替换方案，处理***可以用带有集成在单块芯片中的处理器、总线接口、用户接口、支持电路***、和至少一部分机器可读介质的专用集成电路(ASIC)来实现，或者用一个或多个现场可编程门阵列(FPGA)、可编程逻辑器件(PLD)、控制器、状态机、门控逻辑、分立硬件组件、或者任何其他合适的电路***、或者能执行本公开通篇所描述的各种功能性的电路的任何组合来实现。取决于具体应用和加诸于整体***上的总设计约束，本领域技术人员将认识到如何最佳地实现关于处理***所描述的功能性。

机器可读介质可包括数个软件模块。这些软件模块包括当由处理器执行时使处理***执行各种功能的指令。这些软件模块可包括传送模块和接收模块。每个软件模块可以驻留在单个存储设备中或者跨多个存储设备分布。作为示例，当触发事件发生时，可以从硬驱动器中将软件模块加载到RAM中。在软件模块执行期间，处理器可以将一些指令加载到高速缓存中以提高访问速度。随后可将一个或多个高速缓存行加载到通用寄存器文件中以供处理器执行。在以下述及软件模块的功能性时，将理解此类功能性是在处理器执行来自该软件模块的指令时由该处理器来实现的。此外，应领会，本公开的各方面产生对处理器、计算机、机器或实现此类方面的其它***的机能的改进。

如果以软件实现，则各功能可作为一条或多条指令或代码存储在计算机可读介质上或藉其进行传送。计算机可读介质包括计算机存储介质和通信介质两者，这些介质包括促成计算机程序从一地向另一地转移的任何介质。存储介质可以是能被计算机访问的任何可用介质。作为示例而非限定，此类计算机可读介质可包括RAM、ROM、EEPROM、CD-ROM或其他光盘存储、磁盘存储或其他磁存储设备、或能用于携带或存储指令或数据结构形式的期望程序代码且能被计算机访问的任何其他介质。另外，任何连接也被正当地称为计算机可读介质。例如，如果软件是使用同轴电缆、光纤电缆、双绞线、数字订户线(DSL)、或无线技术(诸如红外(IR)、无线电、以及微波)从web网站、服务器、或其他远程源传送而来，则该同轴电缆、光纤电缆、双绞线、DSL或无线技术(诸如红外、无线电、以及微波)就被包括在介质的定义之中。如本文中所使用的盘(disk)和碟(disc)包括压缩碟(CD)、激光碟、光碟、数字多用碟(DVD)、软盘、和碟，其中盘(disk)常常磁性地再现数据，而碟(disc)用激光来光学地再现数据。因此，在一些方面，计算机可读介质可包括非瞬态计算机可读介质(例如，有形介质)。另外，对于其他方面，计算机可读介质可包括瞬态计算机可读介质(例如，信号)。上述的组合应当也被包括在计算机可读介质的范围内。

因此，某些方面可包括用于执行本文中给出的操作的计算机程序产品。例如，此类计算机程序产品可包括其上存储(和/或编码)有指令的计算机可读介质，这些指令能由一个或多个处理器执行以执行本文中所描述的操作。

此外，应当领会，用于执行本文中所描述的方法和技术的模块和/或其它恰适装置能由用户终端和/或基站在适用的场合下载和/或以其他方式获得。例如，此类设备能被耦合至服务器以促成用于执行本文中所描述的方法的装置的转移。替换地，本文所述的各种方法能经由存储装置(例如，RAM、ROM、诸如压缩碟(CD)或软盘等物理存储介质等)来提供，以使得一旦将该存储装置耦合至或提供给用户终端和/或基站，该设备就能获得各种方法。此外，可利用适于向设备提供本文所描述的方法和技术的任何其他合适的技术。

将理解，权利要求并不被限定于以上所解说的精确配置和组件。可在以上所描述的方法和装置的布局、操作和细节上作出各种改动、更换和变形而不会脱离权利要求的范围。

Claims

1.一种分类器的在线训练的方法，所述方法包括：

确定从所述在线训练期间观察到的对象的至少一个特征向量到在所述分类器的离线训练期间建立的第一预定决策边界的距离；

将决策规则更新为至少所述距离的函数；以及

至少部分地基于经更新的决策规则来对将来示例进行分类。

2.如权利要求1所述的方法，其特征在于，所述函数进一步至少部分地基于观察到的肯定示例数目、和/或自所述在线训练的开始以来的观察时间量。

3.如权利要求1所述的方法，其特征在于，所述对象是指纹、虹膜、和/或面部。

4.如权利要求1所述的方法，其特征在于，所述决策规则是第二决策边界。

5.如权利要求4所述的方法，其特征在于，进一步包括：至少部分地基于观察到的肯定示例数目来减小所述对象的所述至少一个特征向量与所述第二决策边界之间的裕量。

6.如权利要求1所述的方法，其特征在于，所述决策规则至少部分地基于所测得的平均值、和/或所述距离的方差。

7.如权利要求1所述的方法，其特征在于，进一步包括：至少部分地基于新数据来迭代地更新所述决策规则。

8.如权利要求7所述的方法，其特征在于，进一步包括：至少部分地基于第一组条件来停止对所述决策规则的更新。

9.如权利要求8所述的方法，其特征在于，所述第一组条件包括至少样本数目、和/或时间量。

10.如权利要求8所述的方法，其特征在于，进一步包括：至少部分地基于第二组条件来开始对所述决策规则的更新。

11.如权利要求10所述的方法，其特征在于，所述第二组条件包括假拒绝率。

12.如权利要求10所述的方法，其特征在于，开始对所述决策规则的更新包括：重置、重新使用、或备份至少一个经学习的值。

13.如权利要求10所述的方法，其特征在于，开始对所述决策规则的更新包括：修改所述第一组条件。

14.如权利要求1所述的方法，其特征在于，进一步包括：计算和跟踪假拒绝率(FRR)以及至少部分地基于所述FRR来进一步更新所述决策规则。

15.如权利要求1所述的方法，其特征在于，所述函数进一步包括跟踪多个距离，并且所述决策规则至少部分地基于所述多个距离的统计。

16.一种用于分类器的在线训练的装置，所述装置包括：

存储器单元；以及

耦合至所述存储器单元的至少一个处理器；所述至少一个处理器被配置成：

将决策规则更新为至少所述距离的函数；以及

至少部分地基于经更新的决策规则来对将来示例进行分类。

17.如权利要求16所述的装置，其特征在于，所述函数进一步至少部分地基于观察到的肯定示例数目、和/或自所述在线训练的开始以来的观察时间量。

18.如权利要求16所述的装置，其特征在于，所述对象是指纹、虹膜、和/或面部。

19.如权利要求16所述的装置，其特征在于，所述决策规则是第二决策边界。

20.如权利要求19所述的装置，其特征在于，所述至少一个处理器被进一步配置成：至少部分地基于观察到的肯定示例数目来减小所述对象的所述至少一个特征向量与所述第二决策边界之间的裕量。

21.如权利要求16所述的装置，其特征在于，所述决策规则至少部分地基于所测得的平均值、和/或所述距离的方差。

22.如权利要求16所述的装置，其特征在于，所述至少一个处理器被进一步配置成：至少部分地基于新数据来迭代地更新所述决策规则。

23.如权利要求22所述的装置，其特征在于，所述至少一个处理器被进一步配置成：至少部分地基于第一组条件来停止对所述决策规则的更新。

24.如权利要求23所述的装置，其特征在于，所述第一组条件包括至少样本数目、和/或时间量。

25.如权利要求23所述的装置，其特征在于，所述至少一个处理器被进一步配置成：至少部分地基于第二组条件来开始对所述决策规则的更新。

26.如权利要求25所述的装置，其特征在于，所述第二组条件包括假拒绝率。

27.如权利要求25所述的装置，其特征在于，所述至少一个处理器被进一步配置成：通过重置、重新使用、或备份至少一个经学习的值来开始对所述决策规则的更新。

28.如权利要求25所述的装置，其特征在于，所述至少一个处理器被进一步配置成：通过修改所述第一组条件来开始对所述决策规则的更新。

29.如权利要求16所述的装置，其特征在于，所述至少一个处理器被进一步配置成：计算和跟踪假拒绝率(FRR)以及至少部分地基于所述FRR来进一步更新所述决策规则。

30.如权利要求16所述的装置，其特征在于，所述至少一个处理器被进一步配置成跟踪多个距离，并且所述决策规则至少部分地基于所述多个距离的统计。

31.一种其上记录有程序代码的非瞬态计算机可读介质，所述程序代码由处理器执行并且包括：

用于确定从所述在线训练期间观察到的对象的至少一个特征向量到在分类器的离线训练期间建立的第一预定决策边界的距离的程序代码；

用于将决策规则更新为至少所述距离的函数的程序代码；以及

用于至少部分地基于经更新的决策规则来对将来示例进行分类的程序代码。

32.一种用于分类器的在线训练的设备，所述方法包括：

用于确定从所述在线训练期间观察到的对象的至少一个特征向量到在所述分类器的离线训练期间建立的第一预定决策边界的距离的装置；

用于将决策规则更新为至少所述距离的函数的装置；以及

用于至少部分地基于经更新的决策规则来对将来示例进行分类的装置。