CN101441869A

CN101441869A - 语音识别终端用户身份的方法及终端

Info

Publication number: CN101441869A
Application number: CNA2007101778195A
Authority: CN
Inventors: 闫涛
Original assignee: Lenovo Beijing Ltd
Current assignee: Lenovo Beijing Ltd
Priority date: 2007-11-21
Filing date: 2007-11-21
Publication date: 2009-05-27

Abstract

本发明公开了一种语音识别终端用户身份的方法，包括以下步骤：采集用户的第一语音信息，所述第一语音信息中包括有第一声纹信息和第一声学信息；从所述第一语音信息中提取出所述第一声纹信息和所述第一声学信息；将所述第一声纹信息与预置的声纹模型进行比较，输出第一比较值；当所述第一比较值表明所述第一声纹信息是合法时，将所述第一声学信息与预置的声学模型进行比较，输出第二比较值。由于每个人声音特征的差异，他人不可能获得声学模型的识别，从而完全禁止了他人非法开机的可能性，提高了终端信息的安全。与上述方法相对应，本发明还提供了一种可以通过语音识别用户身份的终端。

Description

语音识别终端用户身份的方法及终端

技术领域

本发明涉及终端安全技术领域，尤其涉及一种语音识别终端用户身份的方法及终端。

背景技术

随着信息安全重要性的不断提高，作为信息载体的终端的安全问题也越来越受到关注。这里所指的终端包括台式计算机、笔记本电脑、移动电话及个人数字助理(Personal Digital Assistant，PDA)设备等。

目前，防止终端被非法用户使用的最常用的方法是对终端以字符串加密。以计算机为例，基本输入输出***(Basic Input and Output System，BIOS)存储用户设置的基准密码；用户每次使用计算机时，通过输入密码来表明自身的合法身份；计算机对用户输入的密码与自身存储的基准密码进行比较，当二者一致时才启动开机，否则，不允许使用计算机，从而保证不知晓密码的非法用户无法使用计算机，保障计算机信息的安全。

然而，这种依赖密码输入的方式仍有不安全的隐患。在实际应用中，很难避免他人获知用户的密码，例如，不经意的透露、输入密码时被他人偷窥等，他人获知密码后就可使用终端，这违背了终端合法用户的意愿，致使终端信息安全受到威胁。而且，这种传统的输入字符串开机的方式有时也不方便，特别是对于手臂伤残人士，则是更加难以采用。

发明内容

有鉴于此，本发明提供一种语音识别终端用户身份的方法，以解决现有技术不安全的问题；

同时，本发明还提供一种终端，该终端可以通过语音识别用户是否合法。

为此，本发明实施例采用如下技术方案：

一种识别终端用户身份的方法，包括：采集用户的第一语音信息，所述第一语音信息中包括有第一声纹信息和第一声学信息；从所述第一语音信息中提取出所述第一声纹信息和所述第一声学信息；将所述第一声纹信息与预置的声纹模型进行比较，输出第一比较值；当所述第一比较值表明所述第一声纹信息是合法时，将所述第一声学信息与预置的声学模型进行比较，输出第二比较值。

所述声纹模型的建立过程是：采集用户语音，提取用户语音的声纹特征；建立与文本无关的声纹模型。

所述方法还包括：采集所述用户的第二语音信息，提取所述第二语音信息的第二声纹特征和第二声学特征，并建立与文本有关的备份声纹模型，或者，建立与文本无关的备份声纹模型以及备份声学模型。

所述输出第二比较值之前还包括：设置阈值；当所述将所述第一声学信息与声学模型进行比较的次数达到所述阈值时，采集所述用户的第三语音信息，从所述第三语音信息中提取出所述第三声纹信息和所述第三声学信息；将所述第三声纹信息与所述备份声纹模型进行比较，输出第三比较值；当所述第三比较值表明所述第三声纹信息是合法时，将所述第三声学信息与所述备份声学模型进行比较。

所述将所述第一声纹信息与声纹模型进行比较之前还包括：设置音量阈值；在所述第一语音信息达到所述音量阈值时，将所述第一声纹信息与声纹模型进行比较。

一种终端，包括：语音信息获取单元，用于采集用户的第一语音信息，所述第一语音信息中包括有第一声纹信息和第一声学信息；处理单元，与所述语音信息获取单元连接，用于将所述第一声纹信息与预置的声纹模型进行比较，输出第一比较值；将所述第一声学信息与预置的声学模型进行比较，输出第二比较值。

还包括：指示单元，在所述第一比较值表明所述用户为合法、且所述第二比较值表明所述第一声学信息为正确时，启动所述终端，否则，禁止启动所述终端。

所述处理单元具体包括：提取子单元，用于从所述第一语音信息中提取出所述第一声纹信息和所述第一声学信息；第一比较子单元，用于将所述第一声纹信息与声纹模型进行比较，输出第一比较值；第二比较子单元，当所述第一比较值表明所述第一声纹信息是合法时，将所述第一声学信息与声学模型进行比较，输出第二比较值。

还包括：声纹模型建立单元，用于提取所述用户的声纹特征，建立声纹模型；语音模型建立单元，用于提取所述用户的声学特征，建立语音模型；存储单元，用于存储所述声纹模型以及所述语音模型。

还包括：设置单元，与所述处理单元连接，用于设置音量阈值；所述处理单元还包括：第三比较子单元，与所述第一比较子单元连接，用于将所述第一语音信息与所述音量阈值进行比较，在所述第一语音信息达到所述音量阈值时，所述第一比较子单元将所述第一声纹信息与声纹模型进行比较。

对于上述技术方案的技术效果分析如下：

由于每个人声音特征的差异，他人不可能获得声学模型的识别，从而完全禁止了他人非法开机的可能性，而且，该方案实现简单，只要用户对着计算机讲话即可实现开机，对于手臂伤残人士更是方便。优选地，本发明通过声纹识别确定用户合法身份，通过语音识别确定开机口令，从而进一步保证方案的安全和实现性；另外，还可以通过备份语音以及设置音量阈值等方式对本发明进一步润色，从而使本发明提供的方案更加人性化。

附图说明

图1为本发明方法实施例一流程图；

图2为本发明方法实施例二流程图；

图3为本发明方法实施例四流程图；

图4为本发明装置结构示意图之一；

图5为本发明装置结构示意图之二。

具体实施方式

本发明摒弃现有单纯依赖输入字符串密码来保证终端安全的方式，提出通过语音识别用户的合法身份的方案，本发明通过声纹识别(VoiceprintRecognition，VPR)技术与终端产品的有效结合，可有效避免他人非法使用终端。

声纹识别也称为说话人识别(Speaker Recognition)，所谓声纹，是携带有言语信息的声波频谱。声纹识别包括文本相关的(Text-Dependent)和文本无关的(Text-Independent)两种，与文本有关的声纹识别要求用户按照规定的内容发音，用户的声纹模型被精确建立，而识别时也必须按规定的内容发音；而与文本无关的声纹识别则不规定用户发音内容，只要用户发音即可识别用户，使用方便。在声纹识别技术中，有两个关键问题，一是特征提取，二是模式匹配(也称模式识别)。特征提取的任务是提取并选择对说话人的声纹具有可分性强、稳定性高等特性的声学或语言特征；对于模式识别，包括模板匹配方法、最近邻方法、神经网络方法、隐式马尔可夫模型(HMM)方法、VQ聚类方法以及多项式分类器方法等。声纹识别技术现已相当成熟，并不断得到完善。

需要说明的是，本发明关键在于将现有的声纹识别技术与终端的结合应用，对于声纹识别的实现过程本文则不过多叙述。

下面结合附图，对本发明提供的各个实施例进行详细阐述。

首先介绍本发明方法实施例一。

概括而言，实施例一通过采集用户基准语音，从而建立并存储声纹模型；用户在开机时需要讲话，以便终端收集语音并通过声纹模型辨别该用户身份是否合法，如果合法，则启动终端，否则，不允许启动终端。

下面以计算机为实例描述实施例一提供的方案。对于实施本发明的计算机，需要包括一个语音采集装置，现有很多计算机已经集成了语音采集装置，那么可直接应用本发明，对于没有集成的，只要连接一个例如麦克风的语音采集装置即可。

参见图1，为实施例一流程图。

实施例一流程包括两部分，一部分是从步骤101～102，主要是完成特征提取的任务；第二部分是步骤103～106，主要完成模式识别任务。

步骤101：计算机语音采集装置采集用户语音；

步骤102：计算机内部处理***对语音采集装置采集的用户语音进行声纹特征提取，建立并存储声纹模型；

步骤103：用户在后续使用计算机时，向计算机语音采集装置讲话；

步骤104：计算机内部处理***通过存储的声纹模型，识别本次采集的语音，若识别出该语音即为步骤101采集的用户的语音，则执行步骤105，否则，执行步骤106；

步骤105：启动计算机；

步骤106：禁止启动计算机。

可见，实施例一中是采用的与文本无关的声纹识别，从而不限制用户具体讲话内容，只要识别出该用户是之前声学模型的用户，即启动开机，否则，不允许开机。

实施例一提供的方案非常安全，由于每个人声音特征的差异，他人不可能获得声学模型的识别，从而完全禁止了他人非法开机的可能性。而且，该方案实现简单，只要用户对着计算机讲话即可实现开机，对于手臂伤残人士更是方便。

另外，为了避免用户不想开机但又在终端前讲话的情况，可以设置音量阈值，只有在用户的语音达到所述阈值后，才启动声纹识别，从而避免这种不便，例如，只有接收到一定分贝以上的语音后，才启动开机，否则，不开机，这种设计更加人性化。

下面介绍本发明方法实施例二。

上面介绍的实施例一中，只要合法用户讲话就可实现开机，而在本实施例中，合法用户必须讲出正确口令，才能开机，从而彻底避免用户无意开机而讲话带来的不便。

实施例二包括以下步骤：

1、采集用户的第一语音信息，所述第一语音信息中包括有第一声纹信息和第一声学信息；

2、从所述第一语音信息中提取出所述第一声纹信息和所述第一声学信息；

3、将所述第一声纹信息与预置的声纹模型进行比较，输出第一比较值；

4、当所述第一比较值表明所述第一声纹信息是合法时，将所述第一声学信息与预置的声学模型进行比较，输出第二比较值。

如前所述，一种声纹识别是与文本有关的，由此，可以在特征提取时，构建与文本有关的模型，在模型识别时，不但要识别出用户身份是否合法，还要识别口令是否正确。

另外，现有的语音识别技术也可以实现特定口令的识别。语音识别***包括声学特征提取、声学模型建立以及语音自适应。由此，除了可以通过与文本有关的声纹识别来实现本实施例外，还可以通过“与文本无关的声纹识别+语音识别”来实现本实施例。

参见图2，是以计算机为例通过与“文本无关的声纹识别+语音识别”实现的实施例二的流程图。包括：

步骤201：计算机语音采集装置采集用户语音，该用户语音为开机使用的特定口令；

步骤202：计算机内部处理***对语音采集装置采集的用户语音进行声纹特征提取，建立并存储声纹模型，同时，对用户语音进行声学特征提取，将输入的口令转化为计算机可识别的数据格式，建立并存储声学模型；

步骤203：用户在后续使用计算机时，向计算机语音采集装置讲话；

步骤204：计算机内部处理***通过存储的声纹模型，识别本次采集语音是否出自合法用户，若是，执行步骤205，否则，执行步骤207；

步骤205：计算机内部处理***通过存储的声学模型，识别本次采集的语音是否为特定口令，若是，执行步骤206，否则，执行步骤207；

步骤206：启动计算机；

步骤207：禁止启动计算机。

其中，只要识别出合法用户，并且该用户语音是特定口令即可，对先识别用户身份还是先识别口令正确与否的顺序则不作限定，也就是说，上述步骤204和步骤205的顺序可以调换。

另外，如前所述，可以通过一次性建立与文本有关的声纹模型来实现本实施例。此时，所述声纹模型的建立过程是：采集用户语音，提取用户语音的声纹特征；建立与文本有关的声纹模型；在识别所述声纹特征之前或之后，还包括：利用所述与文本有关的声纹模型，识别所述用户语音的声学特征，从而确定语音是否正确；而且，只有当用户合法且语音正确的条件下，才允许启动终端。

可见，本实施例可归纳为两个大步骤，一是识别是否为合法用户，二是识别合法用户是否要开机，从而可有效避免用户无意中讲话而开机的现象。

另外，由于计算机BIOS存储空间的限制，以及为了口令识别的简单易用，可以选择一些简单的特定语音作为口令，例如，***数字0～9、字母A～Z等，这样可保证语音识别的准确性，也避免了BIOS空间不足的问题。

下面介绍本发明方法实施例三：

本实施例是在上两个实施例的基础上进行补充和优化，以避免一些意外情况导致无法开机。

在采用实施例一或实施例二时，终端可以允许多个人进行开机，例如，允许用户及他的一个朋友开机，只要提取并存储这两个人的声音特征并分别建立和存储两个模型即可，在模型识别时，分别利用所存储的多个模型进行识别，在有一个匹配时，及启动终端，只有当所有模型均识别失败时，才禁止启动终端。

在采用实施例二时，如果用户遗忘密码，就会导致无法正常开机。此时，可以通过语音备份的方式达到启动终端的目的。也就是说，计算机在提取用户语音特征时，提取一份备份语音，该备份语音可以是用户生日或者其他易记忆的口令，从而当用户遗忘开机口令时也可以通过备份口令开机。所述备份用户语音的过程是：采集用户备份语音，提取用户备份语音的声纹特征和声学特征，并建立与文本有关的备份声纹模型，或者，建立与文本无关的备份声纹模型以及备份声学模型；当用户合法但用户语音不正确次数达到阈值时，重新采集用户语音，并利用所述与文本有关的备份声纹模型或所述备份声学模型，判断该语音是否正确，若正确，启动终端。，此时，本发明实施例三方法可概括为：采集所述用户的第二语音信息，提取所述第二语音信息的第二声纹特征和第二声学特征，并建立与文本有关的备份声纹模型，或者，建立与文本无关的备份声纹模型以及备份声学模型；设置阈值；当所述将所述第一声学信息与声学模型进行比较的次数达到所述阈值时，采集所述用户的第三语音信息，从所述第三语音信息中提取出所述第三声纹信息和所述第三声学信息；将所述第三声纹信息与所述备份声纹模型进行比较，输出第三比较值；当所述第三比较值表明所述第三声纹信息是合法时，将所述第三声学信息与所述备份声学模型进行比较。

下面介绍本发明方法实施例四：

实际上，实施例一还可以与现有手动输入密码形式相结合应用：在确定用户合法之后，读取用户输入的开机密码，并判断该开机密码是否正确；若正确，才启动终端，否则，禁止启动终端。参见图3，为本实施例流程图，包括：

步骤301：计算机语音采集装置采集用户语音；

步骤302：计算机内部处理***对语音采集装置采集的用户语音进行声纹特征提取，建立并存储声纹模型；

步骤303：用户在后续使用计算机时，向计算机语音采集装置讲话；

步骤304：计算机内部处理***通过存储的声纹模型，识别本次采集的语音是否为采集的用户的语音，如果是，执行步骤305，否则，执行步骤307；

步骤305：计算机向用户显示提示框，以便用户输入特定开机密码；

步骤306：计算机读取用户输入的密码，计算机内部处理***通过预先存储的密码判断该次密码是否正确，若正确，执行步骤307，否则，执行步骤308；

步骤307：启动计算机；

步骤308：禁止启动计算机。

本实施例是在现有终端开机保护方案的基础上增加了声纹识别技术的应用，对现有计算BIOS的改动较小，易于实现。

与上述方法相对应，本发明还提供一种语音识别终端用户身份的装置，以及包括该装置的终端，终端的其他功能不作限制，只是对其中该装置进行限制。

参见图4，该装置包括语音获取单元401、声纹模型建立单元402、模型存储单元403、声纹模型识别单元404以及指示单元405。其中，语音获取单元401，用于获取用户基准语音以及用户认证语音；声纹模型建立单元402，用于提取用户基准语音的声纹特征，建立声纹模型；模型存储单元403，用于存储所述声纹模型建立单元402建立的声纹模型；声纹模型识别单元404，用于根据所述声纹模型，识别用户认证语音的声纹特征，从而确定用户是否合法；指示单元405，在所述声纹模型识别单元404确定用户合法时，启动所述终端，否则，禁止启动所述终端。

上述装置实现的功能是通过语音识别出用户是否合法性从而控制是否开机，这种装置中的声纹模型是与文本无关的。

此外，声纹模型可以是与文本有关的，这时，是在用户合法以及语音(口令)正确的基础上才启动终端。此时：所述声纹模型建立单元402在提取用户基准语音的声纹特征基础上，还提取用户基准语音的声学特征，从而建立声纹模型；所述声纹模型识别单元404，用于根据所述声纹模型，识别用户认证语音的声纹特征，从而确定用户是否合法的基础上，还用于根据所述声纹模型402，识别用户认证语音的声学特征，从而确定语音是否正确；所述指示单元405，在所述声纹模型识别单元404确定用户合法且语音正确时，才启动所述终端，否则，禁止启动所述终端。

另外，在与文本无关的声纹模型基础上，也可以实现通过用户合法性以及语音(口令)是否正确来确定是否开机。此时：参见图5，该装置还包括语音模型建立单元501和语音模型识别单元502，其中，语音模型建立单元501，用于提取用户基准语音的声学特征，建立语音模型；语音模型识别单元502，用于根据所述语音模型，识别用户认证语音的声学特征，从而确定语音是否正确；此时，所述模型存储单元403存储所述语音模型；所述指示单元405，在所述声纹模型识别单元404确定用户合法、且所述语音模型识别单元502确定语音正确时，才启动所述终端，否则，禁止启动所述终端。

在具体实现上，本发明提供的装置可以以硬件实现，也可以以软件实现，优选以硬件和软件结合的方式实现。以计算机为例，是对BIOS的改进，从而获得本发明提供装置的功能。

本发明提供的装置可应用于各种终端，只要该终端具有语音采集模块即可。

本发明提供的通过语音识别用户身份的终端重点改进在于上述介绍的装置，它包括：语音采集模块，用于采集用户语音，包括用户基准语音以及用户认证语音；声纹模型建立模块，用于提取用户基准语音的声纹特征，建立声纹模型；模型存储模块，用于存储所述声纹模型建立的声纹模型；声纹模型识别模块，用于根据所述声纹模型，识别用户认证语音的声纹特征，从而确定用户是否合法；指示模块，在所述声纹模型识别模块确定用户合法时，启动所述终端，否则，禁止启动所述终端。

上述终端实现的功能是通过语音识别出用户是否合法性从而控制是否开机，这种终端中的声纹模型是与文本无关的。此外，声纹模型可以是与文本有关的，这时，是在用户合法以及语音(口令)正确的基础上才启动终端。此时：所述声纹模型为与文本无关的声纹模型，所述终端还包括：语音模型建立模块，用于提取用户基准语音的声学特征，建立语音模型；语音模型识别模块，用于根据所述语音模型，识别用户认证语音的声学特征，从而确定语音是否正确；其中，所述模型存储模块存储所述语音模型；所述指示模块，在所述声纹模型识别模块确定用户合法、且所述语音模型识别模块确定语音正确时，才启动所述终端，否则，禁止启动所述终端。

另外，在与文本无关的声纹模型基础上，也可以实现通过用户合法性以及语音(口令)是否正确来确定是否开机。此时：所述声纹模型建立模块在提取用户基准语音的声纹特征基础上，还提取用户基准语音的声学特征，从而建立声纹模型；所述声纹模型识别模块，用于根据所述声纹模型，识别用户认证语音的声纹特征，从而确定用户是否合法的基础上，还用于根据所述声纹模型，识别用户认证语音的声学特征，从而确定语音是否正确；所述指示模块，在所述声纹模型识别模块确定用户合法且语音正确时，才启动所述终端，否则，禁止启动所述终端。

本发明实施例所提供的终端，包括语音信息获取单元和处理单元，其中，语音信息获取单元用于采集用户的第一语音信息，所述第一语音信息中包括有第一声纹信息和第一声学信息；处理单元与所述语音信息获取单元连接，用于将所述第一声纹信息与预置的声纹模型进行比较，输出第一比较值；将所述第一声学信息与预置的声学模型进行比较，输出第二比较值。

此外，该终端还可包括指示单元，该指示单元在所述第一比较值表明所述用户为合法、且所述第二比较值表明所述第一声学信息为正确时，启动所述终端，否则，禁止启动所述终端。

所述处理单元具体包括提取子单元、第一比较子单元和第二比较子单元，其中，提取子单元用于从所述第一语音信息中提取出所述第一声纹信息和所述第一声学信息；第一比较子单元用于将所述第一声纹信息与声纹模型进行比较，输出第一比较值；第二比较子单元，当所述第一比较值表明所述第一声纹信息是合法时，将所述第一声学信息与声学模型进行比较，输出第二比较值。

该终端还包括声纹模型建立单元、语音模型建立单元和存储单元，其中，声纹模型建立单元，用于提取所述用户的声纹特征，建立声纹模型；语音模型建立单元用于提取所述用户的声学特征，建立语音模型；存储单元用于存储所述声纹模型以及所述语音模型。

该终端还包括设置单元，该设置单元与所述处理单元连接，用于设置音量阈值，此时，所述处理单元还包括第三比较子单元，该第三比较子单元与所述第一比较子单元连接，用于将所述第一语音信息与所述音量阈值进行比较，在所述第一语音信息达到所述音量阈值时，所述第一比较子单元将所述第一声纹信息与声纹模型进行比较。

本发明对终端形式不作限制，包括计算机、移动电话以及PDA设备等。

另外，对于本发明方法实施例有关方案同样适用于本发明提供的装置和终端，例如设置音量阈值、备份语音以及声纹识别与输入密码结合的方案等，具体实现细节参见方法实施例，在此不作赘述。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1、一种识别终端用户身份的方法，其特征在于，所述方法包括：

采集用户的第一语音信息，所述第一语音信息中包括有第一声纹信息和第一声学信息；

从所述第一语音信息中提取出所述第一声纹信息和所述第一声学信息；

将所述第一声纹信息与预置的声纹模型进行比较，输出第一比较值；

当所述第一比较值表明所述第一声纹信息是合法时，将所述第一声学信息与预置的声学模型进行比较，输出第二比较值。

2、根据权利要求1所述方法，其特征在于，所述声纹模型的建立过程是：采集用户语音，提取用户语音的声纹特征；建立与文本无关的声纹模型。

3、根据权利要求1或2所述方法，其特征在于，所述方法还包括：

采集所述用户的第二语音信息，提取所述第二语音信息的第二声纹特征和第二声学特征，并建立与文本有关的备份声纹模型，或者，建立与文本无关的备份声纹模型以及备份声学模型。

4、根据权利要求3所述方法，其特征在于，所述输出第二比较值之前还包括：

设置阈值；

当所述将所述第一声学信息与声学模型进行比较的次数达到所述阈值时，采集所述用户的第三语音信息，

从所述第三语音信息中提取出所述第三声纹信息和所述第三声学信息；

将所述第三声纹信息与所述备份声纹模型进行比较，输出第三比较值；

当所述第三比较值表明所述第三声纹信息是合法时，将所述第三声学信息与所述备份声学模型进行比较。

5、根据权利要求1所述方法，其特征在于，所述将所述第一声纹信息与声纹模型进行比较之前还包括：

设置音量阈值；

在所述第一语音信息达到所述音量阈值时，将所述第一声纹信息与声纹模型进行比较。

6、一种终端，其特征在于，包括：

语音信息获取单元，用于采集用户的第一语音信息，所述第一语音信息中包括有第一声纹信息和第一声学信息；

处理单元，与所述语音信息获取单元连接，用于将所述第一声纹信息与预置的声纹模型进行比较，输出第一比较值；将所述第一声学信息与预置的声学模型进行比较，输出第二比较值。

7，根据权利要求6所述的终端，其特征在于，还包括：

指示单元，在所述第一比较值表明所述用户为合法、且所述第二比较值表明所述第一声学信息为正确时，启动所述终端，否则，禁止启动所述终端。

8，根据权利要求6或7所述的终端，其特征在于，所述处理单元具体包括：

提取子单元，用于从所述第一语音信息中提取出所述第一声纹信息和所述第一声学信息；

第一比较子单元，用于将所述第一声纹信息与声纹模型进行比较，输出第一比较值；

第二比较子单元，当所述第一比较值表明所述第一声纹信息是合法时，将所述第一声学信息与声学模型进行比较，输出第二比较值。

9，根据权利要求6或7所述的终端，其特征在于，还包括：

声纹模型建立单元，用于提取所述用户的声纹特征，建立声纹模型；

语音模型建立单元，用于提取所述用户的声学特征，建立语音模型；

存储单元，用于存储所述声纹模型以及所述语音模型。

10，根据权利要求8所述的终端，其特征在于，还包括：

设置单元，与所述处理单元连接，用于设置音量阈值；

所述处理单元还包括：第三比较子单元，与所述第一比较子单元连接，用于将所述第一语音信息与所述音量阈值进行比较，在所述第一语音信息达到所述音量阈值时，所述第一比较子单元将所述第一声纹信息与声纹模型进行比较。