CN113949559A

CN113949559A - 声纹识别攻击防御方法、装置及***

Info

Publication number: CN113949559A
Application number: CN202111200817.XA
Authority: CN
Inventors: 谢晓昕; 曾炜; 丁育祯; 王洁如
Original assignee: Industrial and Commercial Bank of China Ltd ICBC
Current assignee: Industrial and Commercial Bank of China Ltd ICBC
Priority date: 2021-10-14
Filing date: 2021-10-14
Publication date: 2022-01-18

Abstract

一种声纹识别攻击防御方法、装置及***，可用于生物识别领域、金融领域及其他领域。所述方法包括：根据验证请求，确定与验证请求对应的手势注册信息及声纹注册信息；根据手势注册信息，生成与手势注册信息对应的多个动态数字，将手势注册信息与动态数字发送至显示终端；对显示终端发送的用户语音信息进行语音识别，将得到的语音识别结果与动态数字进行比对，得到验证结果；若验证通过，则对用户语音信息进行声纹特征提取，将得到的声纹特征信息与声纹注册信息进行比对，得到声纹识别结果。本发明通过将手势验证与声纹识别相结合，利用临时生成动态数字进行语音信息采集，使得攻击者较难猜测语音内容，难以进行语音拼接，提高了声纹识别的安全性。

Description

声纹识别攻击防御方法、装置及***

技术领域

本发明涉及声纹识别技术领域，尤指一种声纹识别攻击防御方法、装置及***。

背景技术

目前，声纹识别技术活体检测能力较弱，难以防御类似语音重放、语音拼接等攻击行为，安全性较低。声纹识别技术一般需要配合其他手段来检测用户是否为真人，常见的手段有让用户朗读一段8位的随机数字等方法，但是这种方法很容易使用语音拼接攻击手段绕过，安全性不高。

发明内容

针对现有技术中存在的问题，本发明实施例的主要目的在于提供一种声纹识别攻击防御方法、装置及***，实现在不降低声纹识别易用性前提下，提高声纹识别安全性。

为了实现上述目的，本发明实施例提供一种声纹识别攻击防御方法，所述方法包括：

根据显示终端发送的验证请求，确定与所述验证请求对应的手势注册信息及声纹注册信息；

根据所述手势注册信息，生成与所述手势注册信息对应的多个动态数字，并将所述手势注册信息与所述动态数字发送至所述显示终端；

对所述显示终端发送的用户语音信息进行语音识别，得到语音识别结果，并将所述语音识别结果与所述动态数字进行比对，得到验证结果；

若所述验证结果为验证通过，则对所述用户语音信息进行声纹特征提取，得到声纹特征信息，并将所述声纹特征信息与所述声纹注册信息进行比对，得到声纹识别结果。

可选的，在本发明一实施例中，所述方法还包括：将所述声纹识别结果发送至所述显示终端。

可选的，在本发明一实施例中，所述方法还包括：

接收显示终端发送的手势注册信息、语音注册信息以及与手势注册信息对应的注册验证数字；

对所述语音注册信息进行语音识别，得到语音注册结果，并将与手势注册信息对应的注册验证数字与所述语音注册结果进行比对，得到比对结果；

若所述比对结果为比对通过，则对所述语音注册信息进行声纹特征提取，得到声纹注册信息，并对手势注册信息及声纹注册信息进行存储。

本发明实施例还提供一种声纹识别攻击防御方法，所述方法包括：

根据接收到的用户输入信息，生成验证请求，并将所述验证请求发送至服务端；

接收所述服务端发送的手势注册信息及动态数字，根据所述手势注册信息，确定预设显示图像中与所述手势注册信息对应的图形节点；

将所述动态数字顺序填放入与所述手势注册信息对应的图形节点中，并生成多个随机数字，将所述随机数字填放入未被填充的图形节点中；

对完成图形节点填充的预设显示图像进行显示，接收用户语音信息，并将所述用户语音信息发送至所述服务端。

可选的，在本发明一实施例中，所述方法还包括：接收所述服务端发送的声纹识别结果，并对所述声纹识别结果进行显示。

可选的，在本发明一实施例中，所述方法还包括：

对预设显示图像进行显示，并接收用户输入的手势注册信息；

随机生成多个注册验证数字，将所述注册验证数字填放入所述预设显示图像的图形节点中，并确定与手势注册信息对应的注册验证数字；

对完成注册验证数字填充的预设显示图像进行显示，接收用户输入的语音注册信息，并将与手势注册信息对应的注册验证数字、手势注册信息及语音注册信息发送至服务端。

本发明实施例还提供一种声纹识别攻击防御装置，所述装置包括：

注册信息确定模块，用于根据显示终端发送的验证请求，确定与所述验证请求对应的手势注册信息及声纹注册信息；

动态数字生成模块，用于根据所述手势注册信息，生成与所述手势注册信息对应的多个动态数字，并将所述手势注册信息与所述动态数字发送至所述显示终端；

验证结果模块，用于对所述显示终端发送的用户语音信息进行语音识别，得到语音识别结果，并将所述语音识别结果与所述动态数字进行比对，得到验证结果；

声纹识别结果模块，用于若所述验证结果为验证通过，则对所述用户语音信息进行声纹特征提取，得到声纹特征信息，并将所述声纹特征信息与所述声纹注册信息进行比对，得到声纹识别结果。

可选的，在本发明一实施例中，所述装置还包括：结果发送模块，用于将所述声纹识别结果发送至所述显示终端。

可选的，在本发明一实施例中，所述装置还包括：

注册信息接收模块，用于接收显示终端发送的手势注册信息、语音注册信息以及与手势注册信息对应的注册验证数字；

比对结果模块，用于对所述语音注册信息进行语音识别，得到语音注册结果，并将与手势注册信息对应的注册验证数字与所述语音注册结果进行比对，得到比对结果；

注册信息存储模块，用于若所述比对结果为比对通过，则对所述语音注册信息进行声纹特征提取，得到声纹注册信息，并对手势注册信息及声纹注册信息进行存储。

验证请求模块，用于根据接收到的用户输入信息，生成验证请求，并将所述验证请求发送至服务端；

图形节点确定模块，用于接收所述服务端发送的手势注册信息及动态数字，根据所述手势注册信息，确定预设显示图像中与所述手势注册信息对应的图形节点；

图形节点填充模块，用于将所述动态数字顺序填放入与所述手势注册信息对应的图形节点中，并生成多个随机数字，将所述随机数字填放入未被填充的图形节点中；

语音信息接收模块，用于对完成图形节点填充的预设显示图像进行显示，接收用户语音信息，并将所述用户语音信息发送至所述服务端。

可选的，在本发明一实施例中，所述装置还包括：结果显示模块，用于接收所述服务端发送的声纹识别结果，并对所述声纹识别结果进行显示。

可选的，在本发明一实施例中，所述装置还包括：

预设显示图像模块，用于对预设显示图像进行显示，并接收用户输入的手势注册信息；

注册验证数字模块，用于随机生成多个注册验证数字，将所述注册验证数字填放入所述预设显示图像的图形节点中，并确定与手势注册信息对应的注册验证数字；

注册信息发送模块，用于对完成注册验证数字填充的预设显示图像进行显示，接收用户输入的语音注册信息，并将与手势注册信息对应的注册验证数字、手势注册信息及语音注册信息发送至服务端。

本发明实施例还提供一种声纹识别攻击防御***，所述***包括服务端及显示终端，所述服务端与所述显示终端通信连接；

所述显示终端根据接收到的用户输入信息，生成验证请求，并将所述验证请求发送至所述服务端；

所述服务端根据所述验证请求，确定与所述验证请求对应的手势注册信息及声纹注册信息；根据所述手势注册信息，生成与所述手势注册信息对应的多个动态数字，并将所述手势注册信息与所述动态数字发送至所述显示终端；

所述显示终端根据所述手势注册信息，确定预设显示图像中与所述手势注册信息对应的图形节点；将所述动态数字顺序填放入与所述手势注册信息对应的图形节点中，并生成多个随机数字，将所述随机数字填放入未被填充的图形节点中；对完成图形节点填充的预设显示图像进行显示，接收用户语音信息，并将所述用户语音信息发送至所述服务端；

所述服务端对所述用户语音信息进行语音识别，得到语音识别结果，并将所述语音识别结果与所述动态数字进行比对，得到验证结果；若所述验证结果为验证通过，则对所述用户语音信息进行声纹特征提取，得到声纹特征信息，并将所述声纹特征信息与所述声纹注册信息进行比对，得到声纹识别结果。

可选的，在本发明一实施例中，所述服务端还用于将所述声纹识别结果发送至所述显示终端。

可选的，在本发明一实施例中，所述显示终端还用于接收所述服务端发送的声纹识别结果，并对所述声纹识别结果进行显示。

可选的，在本发明一实施例中，所述服务端还用于接收显示终端发送的手势注册信息、语音注册信息以及与手势注册信息对应的注册验证数字；对所述语音注册信息进行语音识别，得到语音注册结果，并将与手势注册信息对应的注册验证数字与所述语音注册结果进行比对，得到比对结果；若所述比对结果为比对通过，则对所述语音注册信息进行声纹特征提取，得到声纹注册信息，并对手势注册信息及声纹注册信息进行存储。

可选的，在本发明一实施例中，所述显示终端还用于对预设显示图像进行显示，并接收用户输入的手势注册信息；随机生成多个注册验证数字，将所述注册验证数字填放入所述预设显示图像的图形节点中，并确定与手势注册信息对应的注册验证数字；对完成注册验证数字填充的预设显示图像进行显示，接收用户输入的语音注册信息，并将与手势注册信息对应的注册验证数字、手势注册信息及语音注册信息发送至服务端。

本发明还提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现上述方法。

本发明还提供一种计算机可读存储介质，所述计算机可读存储介质存储有执行上述方法的计算机程序。

本发明通过将手势验证与声纹识别相结合，利用由用户注册的图形手势临时生成动态数字进行语音信息采集，使得攻击者较难猜测语音内容，难以进行语音拼接，提高了声纹识别的安全性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例一种声纹识别攻击防御方法的流程图；

图2为本发明实施例中声纹识别攻击防御的注册流程图；

图3为本发明另一实施例中声纹识别攻击防御方法的流程图；

图4为本发明另一实施例中声纹识别攻击防御的注册流程图；

图5为本发明实施例一种声纹识别攻击防御***的结构示意图；

图6A-图6C为本发明实施例中注册图形手势示意图；

图7为本发明实施例中验证图形手势示意图；

图8为本发明实施例中声纹识别攻击防御***的整体工作流程图；

图9为本发明实施例中声纹识别攻击防御***的注册过程流程图；

图10为本发明实施例中声纹识别攻击防御***的验证过程流程图；

图11为本发明实施例一种声纹识别攻击防御装置的结构示意图；

图12为本发明一具体实施例中声纹识别攻击防御装置的结构示意图；

图13为本发明另一具体实施例中声纹识别攻击防御装置的结构示意图；

图14为本发明实施例另一种声纹识别攻击防御装置的结构示意图；

图15为本发明实施例中声纹识别攻击防御装置的一具体结构示意图；

图16为本发明实施例中声纹识别攻击防御装置的另一具体结构示意图；

图17为本发明一实施例所提供的电子设备的结构示意图。

具体实施方式

本发明实施例提供一种声纹识别攻击防御方法、装置及***，可用于生物识别领域、金融领域及其他领域，需要说明的是，本发明的声纹识别攻击防御方法、装置及***可用于金融领域，也可用于除金融领域之外的任意领域，本发明的声纹识别攻击防御方法、装置及***应用领域不做限定。

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

如图1所示为本发明实施例一种声纹识别攻击防御方法的流程图，本发明实施例提供的该声纹识别攻击防御方法的执行主体包括但不限于服务端的计算机。图中所示方法包括：

步骤S10，根据显示终端发送的验证请求，确定与所述验证请求对应的手势注册信息及声纹注册信息。

其中，服务端接收显示终端发送的验证请求，验证请求可以通过用户于显示终端进行的交易请求或登录请求生成。具体的，验证请求可以包括用户ID等信息，根据验证请求中用户ID等信息，可以确定与验证请求唯一关联的手势注册信息及声纹注册信息。

进一步的，手势注册信息及声纹注册信息为用户注册时生成的注册信息。具体的，手势注册信息包括用户在注册时，在显示终端上输入的图形手势，声纹注册信息包括用户在注册时，在显示终端上进行的语音输入，进而服务端从输入的语音中提取出的声纹特征，即为声纹注册信息。此外，手势注册信息及声纹注册信息中还可以包括用户ID等信息，以便于与验证请求相对应。具体的，在用户注册成功后，手势注册信息及声纹注册信息存储于服务端的数据库等存储空间内。

步骤S11，根据所述手势注册信息，生成与所述手势注册信息对应的多个动态数字，并将所述手势注册信息与所述动态数字发送至所述显示终端。

其中，服务端根据手势注册信息中记录的图形手势生成动态数字。具体的，如图6A所示，在具有3×3的图形节点(圆圈)的预设显示图像中，若用户注册的图形手势为“U”型，则该手势注册信息对应了7个图形节点。那么，服务端随机生成7个动态数字，动态数字可以为若干位的。

进一步的，服务端将与验证请求对应的手势注册信息与动态数字发送至显示终端，由显示终端在预设显示图像中进行填充及显示操作。具体的，如图7所示的经过填充的预设显示图像，图像中的图形节点均匀填充了2位数字。由此可知，图7中与图6A中图形手势“U”相对应的动态数字，即服务端生成的动态数字应为33235688312593。

步骤S12，对所述显示终端发送的用户语音信息进行语音识别，得到语音识别结果，并将所述语音识别结果与所述动态数字进行比对，得到验证结果。

其中，在显示终端对预设显示图像进行填充及显示操作后，显示终端采集用户发出的语音信息，并将得到的用户语音信息发送至服务端。服务端对用户语音信息进行语音识别，得到语音识别结果。具体的，用户语音信息中包括用户朗读与手势注册信息对应的动态数字，服务端通过语音识别得到的语音识别结果中包括将语音转换为文字的动态数字。例如，如图7所示，若用户注册的图形手势为“U”型，且用户朗读正确，则语音识别结果应为33235688312593。

进一步的，服务端将得到的语音识别结果与生成的动态数字进行比对，生成验证结果。若语音识别结果与动态数字的顺序及内容均一致，则验证结果为验证通过，若不一致，则验证失败，判定声纹识别失败。

步骤S13，若所述验证结果为验证通过，则对所述用户语音信息进行声纹特征提取，得到声纹特征信息，并将所述声纹特征信息与所述声纹注册信息进行比对，得到声纹识别结果。

其中，若验证结果为验证通过，则服务端对用户语音信息进行声纹特征提取，具体可以采用现有常规的声纹提取技术，得到用户的声纹特征信息。将声纹特征信息与声纹注册信息进行比对，生成声纹识别结果。具体的，若声纹特征信息与声纹注册信息比对一致或相似率高于预设阈值，则声纹识别结果为声纹识别通过，否则识别失败，判定声纹识别失败。

作为本发明的一个实施例，方法还包括：将所述声纹识别结果发送至所述显示终端。

其中，服务端将生成的声纹识别结果发送至显示终端，由显示终端向用户显示声纹识别结果。具体的，当验证结果为验证失败，或者声纹识别结果为识别失败，返回给显示终端进行显示的声纹识别结果为声纹识别失败。反之，若声纹识别通过，则返回给显示终端进行显示的声纹识别结果为声纹识别通过。

作为本发明的一个实施例，如图2所示，方法还包括：

步骤S14，接收显示终端发送的手势注册信息、语音注册信息以及与手势注册信息对应的注册验证数字；

步骤S15，对所述语音注册信息进行语音识别，得到语音注册结果，并将与手势注册信息对应的注册验证数字与所述语音注册结果进行比对，得到比对结果；

步骤S16，若所述比对结果为比对通过，则对所述语音注册信息进行声纹特征提取，得到声纹注册信息，并对手势注册信息及声纹注册信息进行存储。

其中，在用户进行交易或登录等需要进行声纹识别验证的过程之前，需要先进行声纹注册。由显示终端向用户显示预设显示图像，具体可以为3×3个圆圈组成的图像，用户通过显示终端输入图形手势，例如“U”型，如图6A所示。同时，显示终端在用户输入图形手势之后，随机生成若干位数的随机数字作为注册验证数字，并填充入预设显示图像的图形节点中，如图7所示。用户按照之前输入的图形手势，顺序朗读各图形节点中的数字，显示终端采集用户语音，将其作为用户的语音注册信息发送至服务端。此外，将图形手势作为手势注册信息，并将与手势注册信息对应的图形节点中的注册验证数字，同时发送至服务端。此外，手势注册信息中还可以包括用户ID等信息。

进一步的，服务端在接收到手势注册信息、语音注册信息以及与手势注册信息对应的注册验证数字后，对语音注册信息进行语音识别，得到语音注册结果。具体的，语音注册结果中包括多个数字。将与手势注册信息对应的注册验证数字与语音注册结果进行比对，得到比对结果。具体的，将与手势注册信息对应的注册验证数字与语音注册结果对应的数字进行比对，若数字的内容与顺序均一致，则比对结果为比对通过。若不一致，则比对失败，判定用户注册失败，同时向显示终端发送注册失败的结果，以向用户显示。

进一步的，若比对结果为比对通过，则服务端对语音注册信息进行声纹特征提取，具体可以采用现有常规的声纹提取技术，得到声纹注册信息。此外，对手势注册信息及声纹注册信息进行存储，以此完成注册，同时向显示终端发送注册成功的结果，以向用户显示。

如图3所示为本发明另一实施例一种声纹识别攻击防御方法的流程图，本发明实施例提供的该声纹识别攻击防御方法的执行主体包括但不限于显示终端的计算机。图中所示方法包括：

步骤S20，根据接收到的用户输入信息，生成验证请求，并将所述验证请求发送至服务端。

其中，当用户进行交易、登录等需要进行声纹识别的验证过程时，通过操作显示终端输入信息，例如用户个人信息等，由此生成验证请求，显示终端向服务端发送验证请求。具体的，验证请求可以包括用户ID等信息，根据验证请求中用户ID等信息，服务端可以确定与验证请求唯一关联的手势注册信息及声纹注册信息。

步骤S21，接收所述服务端发送的手势注册信息及动态数字，根据所述手势注册信息，确定预设显示图像中与所述手势注册信息对应的图形节点。

其中，服务端根据验证请求确定对应的手势注册信息，并生成与手势注册信息对应的动态数字，动态数字可以为若干位的。显示终端接收服务端发送的手势注册信息及动态数字，根据手势注册信息，显示终端在预设显示图像中，确定与手势注册信息相对应的图形节点。

具体的，如图6A所示，若手势注册信息对应的图形手势为“U”型，预设显示图像由3×3个图形节点(圆圈)组成，那么被图形手势覆盖的7个图形节点，就是与手势注册信息相对应的图形节点。

步骤S22，将所述动态数字顺序填放入与所述手势注册信息对应的图形节点中，并生成多个随机数字，将所述随机数字填放入未被填充的图形节点中。

其中，在确定了与手势注册信息相对应的图形节点后，显示终端将动态数字顺序且均匀的填放入图形节点中。具体的，如图7所示，动态数字为33235688312593。均匀填入动态数字后，显示终端随机生成多个随机数字，填放入未被填充的图形节点中。

步骤S23，对完成图形节点填充的预设显示图像进行显示，接收用户语音信息，并将所述用户语音信息发送至所述服务端。

其中，对完成图形节点填充的预设显示图像进行显示，如图7所示。用户按照其注册的图形手势，顺序朗读图形节点中的数字，显示终端采集用户语音，作为用户语音信息发送至服务端。

进一步的，服务端对用户语音信息进行语音识别、声纹特征提取及声纹特征比对等操作，生成声纹识别结果。显示终端接收声纹识别结果并向用户显示。

作为本发明的一个实施例，方法还包括：接收所述服务端发送的声纹识别结果，并对所述声纹识别结果进行显示。

作为本发明的一个实施例，如图4所示，方法还包括：

步骤S24，对预设显示图像进行显示，并接收用户输入的手势注册信息；

步骤S25，随机生成多个注册验证数字，将所述注册验证数字填放入所述预设显示图像的图形节点中，并确定与手势注册信息对应的注册验证数字；

步骤S26，对完成注册验证数字填充的预设显示图像进行显示，接收用户输入的语音注册信息，并将与手势注册信息对应的注册验证数字、手势注册信息及语音注册信息发送至服务端。

其中，在用户进行交易或登录等需要进行声纹识别验证的过程之前，需要先进行声纹注册。由显示终端向用户显示预设显示图像，具体可以为3×3个圆圈组成的图像，用户通过显示终端输入图形手势，例如“U”型，如图6A所示。

进一步的，显示终端在用户输入图形手势之后，随机生成若干位数的随机数字作为注册验证数字，并填充入预设显示图像的图形节点中，如图7所示。用户按照之前输入的图形手势，顺序朗读各图形节点中的数字，显示终端采集用户语音，将其作为用户的语音注册信息发送至服务端。此外，将图形手势作为手势注册信息，并将与手势注册信息对应的图形节点中的注册验证数字，同时发送至服务端。此外，手势注册信息中还可以包括用户ID等信息。

进一步的，服务端在接收到手势注册信息、语音注册信息以及与手势注册信息对应的注册验证数字后，对语音注册信息进行语音识别及声纹特征提取等操作，已完成声纹注册。此外，服务端向显示终端发送注册结果，以便向用户显示。

如图5所示为本发明实施例一种声纹识别攻击防御***的结构示意图，图中所示***包括服务端103及显示终端100，服务端103与显示终端100通信连接；

显示终端100根据接收到的用户输入信息，生成验证请求，并将所述验证请求发送至所述服务端103。

其中，当用户进行交易、登录等需要进行声纹识别的验证过程时，通过操作显示终端输入信息，例如用户个人信息等，由此生成验证请求，显示终端向服务端发送验证请求。具体的，验证请求可以包括用户ID等信息，根据验证请求中用户ID等信息，服务端可以确定与验证请求唯一关联的手势注册信息及声纹注册信息

服务端103根据所述验证请求，确定与所述验证请求对应的手势注册信息及声纹注册信息；根据所述手势注册信息，生成与所述手势注册信息对应的多个动态数字，并将所述手势注册信息与所述动态数字发送至显示终端100。

其中，服务端接收显示终端发送的验证请求，具体的，验证请求可以包括用户ID等信息，根据验证请求中用户ID等信息，可以确定与验证请求唯一关联的手势注册信息及声纹注册信息。

进一步的，服务端根据手势注册信息中记录的图形手势生成动态数字。具体的，如图6A所示，在具有3×3的图形节点(圆圈)的预设显示图像中，若用户注册的图形手势为“U”型，则该手势注册信息对应了7个图形节点。那么，服务端随机生成7个动态数字，动态数字可以为若干位的。

显示终端100根据所述手势注册信息，确定预设显示图像中与所述手势注册信息对应的图形节点；将所述动态数字顺序填放入与所述手势注册信息对应的图形节点中，并生成多个随机数字，将所述随机数字填放入未被填充的图形节点中；对完成图形节点填充的预设显示图像进行显示，接收用户语音信息，并将所述用户语音信息发送至所述服务端103。

其中，显示终端接收服务端发送的手势注册信息及动态数字，根据手势注册信息，显示终端在预设显示图像中，确定与手势注册信息相对应的图形节点。

进一步的，在确定了与手势注册信息相对应的图形节点后，显示终端将动态数字顺序且均匀的填放入图形节点中。具体的，如图7所示，动态数字为33235688312593。均匀填入动态数字后，显示终端随机生成多个随机数字，填放入未被填充的图形节点中。

进一步的，显示终端对完成图形节点填充的预设显示图像进行显示，如图7所示。用户按照其注册的图形手势，顺序朗读图形节点中的数字，显示终端采集用户语音，作为用户语音信息发送至服务端。

服务端103对所述用户语音信息进行语音识别，得到语音识别结果，并将所述语音识别结果与所述动态数字进行比对，得到验证结果；若所述验证结果为验证通过，则对所述用户语音信息进行声纹特征提取，得到声纹特征信息，并将所述声纹特征信息与所述声纹注册信息进行比对，得到声纹识别结果。

进一步的，若验证结果为验证通过，则服务端对用户语音信息进行声纹特征提取，具体可以采用现有常规的声纹提取技术，得到用户的声纹特征信息。将声纹特征信息与声纹注册信息进行比对，生成声纹识别结果。具体的，若声纹特征信息与声纹注册信息比对一致或相似率高于预设阈值，则声纹识别结果为声纹识别通过，否则识别失败，判定声纹识别失败。

作为本发明的一个实施例，服务端103还用于将所述声纹识别结果发送至所述显示终端。

作为本发明的一个实施例，显示终端100还用于接收所述服务端发送的声纹识别结果，并对所述声纹识别结果进行显示。

作为本发明的一个实施例，服务端103还用于接收显示终端发送的手势注册信息、语音注册信息以及与手势注册信息对应的注册验证数字；对所述语音注册信息进行语音识别，得到语音注册结果，并将与手势注册信息对应的注册验证数字与所述语音注册结果进行比对，得到比对结果；若所述比对结果为比对通过，则对所述语音注册信息进行声纹特征提取，得到声纹注册信息，并对手势注册信息及声纹注册信息进行存储。

作为本发明的一个实施例，显示终端100还用于对预设显示图像进行显示，并接收用户输入的手势注册信息；随机生成多个注册验证数字，将所述注册验证数字填放入所述预设显示图像的图形节点中，并确定与手势注册信息对应的注册验证数字；对完成注册验证数字填充的预设显示图像进行显示，接收用户输入的语音注册信息，并将与手势注册信息对应的注册验证数字、手势注册信息及语音注册信息发送至服务端。

在本发明一具体实施例中，如图5所示的声纹识别攻击防御***，具体包括显示终端和服务端，显示终端主要包括屏幕和麦克风，服务端主要包括图形手势模块、动态数字模块、语音识别模块、声纹识别模块和结果校验模块。

其中，声纹识别攻击防御***的工作过程主要分为注册声纹和验证声纹两个部分。注册声纹时需要用户先注册图形手势，并按顺序读出手势对应的数字，服务器先对数字内容和顺序进行验证，验证通过后登记用户声纹特征。验证声纹时(例如声纹登录、声纹支付等)，服务端先生成一组随机数字分布到图形手势的每个圆圈，用户需要根据之前注册的图形手势顺序读出对应的数字，服务端先验证用户朗读的数字内容和顺序是否正确，再验证声纹是否正确。

具体的，显示终端100主要包括显示屏幕101和麦克风102，显示屏幕101用于向用户显示预设显示图像、动态数字、提示文字等信息，麦克风102主要采集用户语音。

服务端103主要包括图形手势模块104、动态数字模块105、语音识别模块106、声纹识别模块107。手势模块104主要接收和存储用户注册的手势信息，并向显示终端发送用户注册的手势信息。动态数字模块105主要根据注册的手势信息生成动态数字信息。语音识别模块106主要判断用户读出的数字内容及顺序是否正确。声纹识别模块107主要根据用户的语音信息进行声纹识别，判断是否为已注册声纹和判断是否为用户本人。

在本实施例中，如图6A-图6C所示的注册图形手势示意图，注册图形手势时需要用户先在屏幕显示的3×3的圆圈之间绘制图形手势连线(图6A)，连线的圆圈数量在服务端可配置(例如4到7个圆圈)，然后需要用户再次绘制图像手势以确认两次绘制的图形手势是否一致，以防止误输入(图6B)，最后提示用户图示手势注册成功(图6C)。

其中，绘制图像手势界面主要包括提示文字200和圆圈201，提示文字200主要向用户展示操作提示信息，圆圈201为3×3布局，辅助用户绘制手势图形。图6A中的轨迹202主要显示用户绘制的图形手势路径。

在本实施例中，如图7所示的验证图形手势示意图，当用户使用声纹登录、声纹支付等功能时，需要先验证之前注册的图形手势。验证图形手势时，服务端根据用户之前注册的图形手势生成若干位动态数字发送到显示终端。动态数字的位数和图形手势的圆圈个数相关联，并且可配置，例如当配置一个圆圈显示1位数字时，如果用户注册的图形手势是7个圆圈，则生成7位动态数字，当配置一个圆圈显示2位时，如果用户注册的图形手势是4个圆圈，则生成8位动态数字。终端显示3×3的圆圈，将动态数字按顺序分布在图形手势对应的圆圈上，并将不对应图形手势的圆圈填充为随机数字。用户需要按图形手势的顺序读出数字才可进行声纹识别验证。

在本实施例中，如图8所示的整体工作流程图，接收用户的注册声纹信息，再在使用声纹登录、声纹支付等功能时进行声纹验证。

具体处理流程如下：

步骤400：注册声纹信息，注册声纹信息需要同时注册图形手势和验证动态数字，具体处理流程见图9。

步骤401：使用声纹登录、声纹支付功能时进行声纹验证，具体流程见图10。

在本实施例中，图9所示的步骤400的处理流程图，具体处理流程如下：

步骤500：显示终端显示3×3的圆圈，接收用户绘制图形手势，图形手势覆盖的圆圈数量一般为4到7个(服务端配置)。

步骤501：接收用户再次绘制的图形手势，并且保证和步骤500绘制的图形手势一致。

步骤502：显示终端显示3×3的圆圈，每个圆圈都显示随机数字，每个圆圈的数字位数相同，一般为2位(也可为1位，具体有服务端配置)。用户按步骤500绘制的图形手势的顺序读出圆圈中的数字。显示终端将用户朗读数字的语音发送给服务端

步骤503：服务端的语音识别模块判断用户朗读的数字内容和顺序是否正确，如果正确则跳转步骤504，如果不正确则注册失败。

步骤504：服务端的声纹识别模块提取用户声纹特征信息，服务端将用户声纹特征信息和图形手势信息一起保存到数据库。

在本实施例中，图10所示的步骤401处理流程图，具体处理流程如下：

步骤600：服务端根据用户注册的图形手势临时生成若干位动态数字发送到显示终端。

步骤601：显示终端显示3×3的圆圈，将动态数字平均匀填充在图形手势对应的圆圈上，并将图形手势未覆盖到的圆圈填充为随机数字。

步骤602：显示终端接收用户按照图形手势对应的顺序读出圆圈中的数字的语音。显示终端将用户语音上传到服务端。

步骤603：服务端语音识别模块判断用户朗读的数字内容和顺序是否正确。如果正确则跳转步骤604，如果不正确则声纹识别失败。

步骤604：服务器声纹识别模块提取用户声纹特征信息，并于之前注册的声纹特征信息比较，如果正确则声纹识别成功，如果不正确则声纹识别失败。

如图11所示为本发明实施例一种声纹识别攻击防御装置的结构示意图，图中所示装置包括：

注册信息确定模块810，用于根据显示终端发送的验证请求，确定与所述验证请求对应的手势注册信息及声纹注册信息；

动态数字生成模块820，用于根据所述手势注册信息，生成与所述手势注册信息对应的多个动态数字，并将所述手势注册信息与所述动态数字发送至所述显示终端；

验证结果模块830，用于对所述显示终端发送的用户语音信息进行语音识别，得到语音识别结果，并将所述语音识别结果与所述动态数字进行比对，得到验证结果；

声纹识别结果模块840，用于若所述验证结果为验证通过，则对所述用户语音信息进行声纹特征提取，得到声纹特征信息，并将所述声纹特征信息与所述声纹注册信息进行比对，得到声纹识别结果。

作为本发明的一个实施例，如图12所示，所述装置还包括：结果发送模块850，用于将所述声纹识别结果发送至所述显示终端。

作为本发明的一个实施例，如图13所示，所述装置还包括：

注册信息接收模块860，用于接收显示终端发送的手势注册信息、语音注册信息以及与手势注册信息对应的注册验证数字；

比对结果模块870，用于对所述语音注册信息进行语音识别，得到语音注册结果，并将与手势注册信息对应的注册验证数字与所述语音注册结果进行比对，得到比对结果；

注册信息存储模块880，用于若所述比对结果为比对通过，则对所述语音注册信息进行声纹特征提取，得到声纹注册信息，并对手势注册信息及声纹注册信息进行存储。

如图14所示为本发明实施例另一种声纹识别攻击防御装置的结构示意图，图中所示装置包括：

验证请求模块910，用于根据接收到的用户输入信息，生成验证请求，并将所述验证请求发送至服务端；

图形节点确定模块920，用于接收所述服务端发送的手势注册信息及动态数字，根据所述手势注册信息，确定预设显示图像中与所述手势注册信息对应的图形节点；

图形节点填充模块930，用于将所述动态数字顺序填放入与所述手势注册信息对应的图形节点中，并生成多个随机数字，将所述随机数字填放入未被填充的图形节点中；

语音信息接收模块940，用于对完成图形节点填充的预设显示图像进行显示，接收用户语音信息，并将所述用户语音信息发送至所述服务端。

作为本发明的一个实施例，如图15所示，所述装置还包括：结果显示模块950，用于接收所述服务端发送的声纹识别结果，并对所述声纹识别结果进行显示。

作为本发明的一个实施例，如图16所示，所述装置还包括：

预设显示图像模块960，用于对预设显示图像进行显示，并接收用户输入的手势注册信息；

注册验证数字模块970，用于随机生成多个注册验证数字，将所述注册验证数字填放入所述预设显示图像的图形节点中，并确定与手势注册信息对应的注册验证数字；

注册信息发送模块980，用于对完成注册验证数字填充的预设显示图像进行显示，接收用户输入的语音注册信息，并将与手势注册信息对应的注册验证数字、手势注册信息及语音注册信息发送至服务端。

基于与上述一种声纹识别攻击防御方法相同的申请构思，本发明还提供了上述一种声纹识别攻击防御装置。由于该一种声纹识别攻击防御装置解决问题的原理与一种声纹识别攻击防御方法相似，因此该一种声纹识别攻击防御装置的实施可以参见一种声纹识别攻击防御方法的实施，重复之处不再赘述。

如图17所示，该电子设备700还可以包括：通信模块110、输入单元120、音频处理单元130、显示器160、电源170。值得注意的是，电子设备700也并不是必须要包括图17中所示的所有部件；此外，电子设备700还可以包括图17中没有示出的部件，可以参考现有技术。

如图17所示，中央处理器1000有时也称为控制器或操作控件，可以包括微处理器或其他处理器装置和/或逻辑装置，该中央处理器1000接收输入并控制电子设备700的各个部件的操作。

其中，存储器140，例如可以是缓存器、闪存、硬驱、可移动介质、易失性存储器、非易失性存储器或其它合适装置中的一种或更多种。可储存上述与失败有关的信息，此外还可存储执行有关信息的程序。并且中央处理器1000可执行该存储器140存储的该程序，以实现信息存储或处理等。

输入单元120向中央处理器1000提供输入。该输入单元120例如为按键或触摸输入装置。电源170用于向电子设备700提供电力。显示器160用于进行图像和文字等显示对象的显示。该显示器例如可为LCD显示器，但并不限于此。

该存储器140可以是固态存储器，例如，只读存储器(ROM)、随机存取存储器(RAM)、SIM卡等。还可以是这样的存储器，其即使在断电时也保存信息，可被选择性地擦除且设有更多数据，该存储器的示例有时被称为EPROM等。存储器140还可以是某种其它类型的装置。存储器140包括缓冲存储器141(有时被称为缓冲器)。存储器140可以包括应用/功能存储部142，该应用/功能存储部142用于存储应用程序和功能程序或用于通过中央处理器1000执行电子设备700的操作的流程。

存储器140还可以包括数据存储部143，该数据存储部143用于存储数据，例如联系人、数字数据、图片、声音和/或任何其他由电子设备使用的数据。存储器140的驱动程序存储部144可以包括电子设备的用于通信功能和/或用于执行电子设备的其他功能(如消息传送应用、通讯录应用等)的各种驱动程序。

通信模块110即为经由天线111发送和接收信号的发送机/接收机110。通信模块(发送机/接收机)110耦合到中央处理器1000，以提供输入信号和接收输出信号，这可以和常规移动通信终端的情况相同。

基于不同的通信技术，在同一电子设备中，可以设置有多个通信模块110，如蜂窝网络模块、蓝牙模块和/或无线局域网模块等。通信模块(发送机/接收机)110还经由音频处理器130耦合到扬声器131和麦克风132，以经由扬声器131提供音频输出，并接收来自麦克风132的音频输入，从而实现通常的电信功能。音频处理器130可以包括任何合适的缓冲器、解码器、放大器等。另外，音频处理器130还耦合到中央处理器1000，从而使得可以通过麦克风132能够在本机上录音，且使得可以通过扬声器131来播放本机上存储的声音。

本领域内的技术人员应明白，本发明的实施例可提供为方法、***、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

本发明中应用了具体实施例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种声纹识别攻击防御方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：将所述声纹识别结果发送至所述显示终端。

3.根据权利要求1所述的方法，其特征在于，所述方法还包括：

4.一种声纹识别攻击防御方法，其特征在于，所述方法包括：

5.根据权利要求4所述的方法，其特征在于，所述方法还包括：接收所述服务端发送的声纹识别结果，并对所述声纹识别结果进行显示。

6.根据权利要求4所述的方法，其特征在于，所述方法还包括：

7.一种声纹识别攻击防御装置，其特征在于，所述装置包括：

8.根据权利要求7所述的装置，其特征在于，所述装置还包括：结果发送模块，用于将所述声纹识别结果发送至所述显示终端。

9.根据权利要求7所述的装置，其特征在于，所述装置还包括：

10.一种声纹识别攻击防御装置，其特征在于，所述装置包括：

11.根据权利要求10所述的装置，其特征在于，所述装置还包括：结果显示模块，用于接收所述服务端发送的声纹识别结果，并对所述声纹识别结果进行显示。

12.根据权利要求10所述的装置，其特征在于，所述装置还包括：

13.一种声纹识别攻击防御***，其特征在于，所述***包括服务端及显示终端，所述服务端与所述显示终端通信连接；

14.根据权利要求13所述的***，其特征在于，所述服务端还用于将所述声纹识别结果发送至所述显示终端。

15.根据权利要求13所述的***，其特征在于，所述显示终端还用于接收所述服务端发送的声纹识别结果，并对所述声纹识别结果进行显示。

16.根据权利要求13所述的***，其特征在于，所述服务端还用于接收显示终端发送的手势注册信息、语音注册信息以及与手势注册信息对应的注册验证数字；对所述语音注册信息进行语音识别，得到语音注册结果，并将与手势注册信息对应的注册验证数字与所述语音注册结果进行比对，得到比对结果；若所述比对结果为比对通过，则对所述语音注册信息进行声纹特征提取，得到声纹注册信息，并对手势注册信息及声纹注册信息进行存储。

17.根据权利要求13所述的***，其特征在于，所述显示终端还用于对预设显示图像进行显示，并接收用户输入的手势注册信息；随机生成多个注册验证数字，将所述注册验证数字填放入所述预设显示图像的图形节点中，并确定与手势注册信息对应的注册验证数字；对完成注册验证数字填充的预设显示图像进行显示，接收用户输入的语音注册信息，并将与手势注册信息对应的注册验证数字、手势注册信息及语音注册信息发送至服务端。

18.一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至6任一项所述方法。

19.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有执行权利要求1至6任一项所述方法的计算机程序。