CN113781059A

CN113781059A - 一种基于智能语音的身份认证反欺诈方法及***

Info

Publication number: CN113781059A
Application number: CN202111335826.XA
Authority: CN
Inventors: 冯鑫
Original assignee: Bairong Zhixin Beijing Credit Investigation Co Ltd
Current assignee: Bairong Zhixin Beijing Credit Investigation Co Ltd
Priority date: 2021-11-12
Filing date: 2021-11-12
Publication date: 2021-12-10

Abstract

本发明提供了一种基于智能语音的身份认证反欺诈方法及***，其中，所述方法包括：采集待确认身份用户的基础信息、行为数据；构建用户画像标签集合；采集语音交互通话信息；进行问题特征筛选，获得待确认身份用户的回答问题集合；生成第一比对结果；生成第二比对结果；判断第一比对结果和第二比对结果是否均比对成功；若第一比对结果，和/或第二笔对结果均未比对成功，将通话声纹信息上传至黑名单声纹库中进行声纹比对筛选，确定待确认身份用户的实际身份信息。解决了现有技术中存在依赖人工和单一AI技术进行身份认证，人工判别主观性过强，单一AI技术确认欺诈准确率不高、科学性差的技术问题。

Description

一种基于智能语音的身份认证反欺诈方法及***

技术领域

本发明涉及金融领域，具体涉及一种基于智能语音的身份认证反欺诈方法及***。

背景技术

随着互联网技术的发展，金融信贷业务逐渐走向线上，但也面临着巨大的欺诈风险，特别是盗用其他身份信息来借款的欺诈行为，随着大数据、AI等技术的发展，借助图像、语音、对话、大数据技术来解决身份确认和是否欺诈的问题，成为金融科技一个重要的技术方向，目前通过电话向用户发起身份一致性认证的方式，主要是通过人工客服询问问题的方式或单一的AI技术来识别，具有明显的缺陷。

但本申请发明人在实现本申请实施例中发明技术方案的过程中，发现上述技术至少存在如下技术问题：

存在依赖人工和单一的AI技术进行身份认证，人工判别主观性过强，单一AI技术确认欺诈准确率不高、科学性差的问题。

发明内容

本申请实施例通过提供了一种基于智能语音的身份认证反欺诈方法及***，解决了现有技术中存在依赖人工和单一的AI技术进行身份认证，人工判别主观性过强，单一AI技术确认欺诈准确率不高、科学性差的技术问题。达到了建立用户画像，通过智能语音交互和多项技术手段进行综合身份认证及欺诈辨别，提高身份认证的准确度及反欺诈方法的准确性和科学性，保护用户的财产安全的技术效果。

鉴于上述问题，本申请实施例提供了一种基于智能语音的身份认证反欺诈方法及***。

第一方面，本申请实施例提供了一种基于智能语音的身份认证反欺诈方法，其中，所述方法包括：基于大数据和用户授权意向，采集待确认身份用户的基础信息、行为数据；根据所述基础信息和所述行为数据，构建所述待确认身份用户的用户画像标签集合；基于大数据，采集所述待确认身份用户的语音交互通话信息；基于待确认问题集合，对所述语音交互通话信息进行问题特征筛选，获得所述待确认身份用户的回答问题集合；将所述回答问题集合输入所述用户画像标签集合进行信息比对，生成第一比对结果；基于说话人确认技术，将所述待确认身份用户的通话声纹信息与所述用户画像标签集合中的实际采集声纹信息进行比对，生成第二比对结果；判断所述第一比对结果和所述第二比对结果是否均比对成功；若所述第一比对结果，和/或所述第二比对结果均未比对成功，基于说话人辨认技术，将所述通话声纹信息上传至黑名单声纹库中进行声纹比对筛选，确定所述待确认身份用户的实际身份信息。

另一方面，本申请实施例提供了一种基于智能语音的身份认证反欺诈***，其中，所述***包括：第一采集单元，所述第一采集单元用于基于大数据和用户授权意向，采集待确认身份用户的基础信息、行为数据；第一构建单元，所述第一构建单元用于根据所述基础信息和所述行为数据，构建所述待确认身份用户的用户画像标签集合；第二采集单元，所述第二采集单元用于基于大数据，采集所述待确认身份用户的语音交互通话信息；第一获得单元，所述第一获得单元用于基于待确认问题集合，对所述语音交互通话信息进行问题特征筛选，获得所述待确认身份用户的回答问题集合；第一生成单元，所述第一生成单元用于将所述回答问题集合输入所述用户画像标签集合进行信息比对，生成第一比对结果；第二生成单元，所述第二生成单元用于基于说话人确认技术，将所述待确认身份用户的通话声纹信息与所述用户画像标签集合中的实际采集声纹信息进行比对，生成第二比对结果；第一判断单元，所述第一判断单元用于判断所述第一比对结果和所述第二比对结果是否均比对成功；第一执行单元，所述第一执行单元用于若所述第一比对结果，和/或所述第二比对结果均未比对成功，基于说话人辨认技术，将所述通话声纹信息上传至黑名单声纹库中进行声纹比对筛选，确定所述待确认身份用户的实际身份信息。

第三方面，本申请实施例提供了一种基于智能语音的身份认证反欺诈***，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其中，所述处理器执行所述程序时实现第一方面任一项所述方法的步骤。

本申请实施例中提供的一个或多个技术方案，至少具有如下技术效果或优点：由于采用了基于大数据和用户授权意向，采集待确认身份用户的基础信息、行为数据；根据所述基础信息和所述行为数据，构建所述待确认身份用户的用户画像标签集合；基于大数据，采集所述待确认身份用户的语音交互通话信息；基于待确认问题集合，对所述语音交互通话信息进行问题特征筛选，获得所述待确认身份用户的回答问题集合；将所述回答问题集合输入所述用户画像标签集合进行信息比对，生成第一比对结果；基于说话人确认技术，将所述待确认身份用户的通话声纹信息与所述用户画像标签集合中的实际采集声纹信息进行比对，生成第二比对结果；判断所述第一比对结果和所述第二比对结果是否均比对成功；若所述第一比对结果，和/或所述第二比对结果均未比对成功，基于说话人辨认技术，将所述通话声纹信息上传至黑名单声纹库中进行声纹比对筛选，确定所述待确认身份用户的实际身份信息的技术方案，本申请实施例通过提供了一种基于智能语音的身份认证反欺诈方法及***，达到了建立用户画像，通过智能语音交互和多项技术手段进行综合身份认证及欺诈辨别，提高身份认证的准确度及反欺诈方法的准确性和科学性，保护用户的财产安全的技术效果。

上述说明仅是本申请技术方案的概述，为了能够更清楚了解本申请的技术手段，而可依照说明书的内容予以实施，并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂，以下特举本申请的具体实施方式。

附图说明

图1为本申请实施例一种基于智能语音的身份认证反欺诈方法的流程示意图；

图2为本申请实施例一种基于智能语音的身份认证反欺诈方法的对语音交互通话信息进行问题特征筛选的流程示意图；

图3为本申请实施例一种基于智能语音的身份认证反欺诈方法的获得目标问题回答信息的流程示意图；

图4为本申请实施例一种基于智能语音的身份认证反欺诈方法的进行分类管理、特征分析的流程示意图；

图5为本申请实施例一种基于智能语音的身份认证反欺诈方法的获得类分布数据集的流程示意图；

图6为本申请实施例一种基于智能语音的身份认证反欺诈方法的判断比对结果是否成功的流程示意图；

图7为本申请实施例一种基于智能语音的身份认证反欺诈***的结构示意图；

图8为本申请实施例示例性电子设备的结构示意图。

附图标记说明：第一采集单元11，第一构建单元12，第二采集单元13，第一获得单元14，第一生成单元15，第二生成单元16，第一判断单元17，第一执行单元18，电子设备300，存储器301，处理器302，通信接口303，总线架构304。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

申请概述

由于现有技术中存在依赖人工和单一的AI技术进行身份认证，人工判别主观性过强，单一AI技术确认欺诈准确率不高、科学性差的问题。本申请通过建立用户画像、智能语音交互和多项技术手段进行综合身份认证及欺诈辨别，提高身份认证的准确度及反欺诈方法的准确性和科学性，保护用户的财产安全。

针对上述技术问题，本申请提出如下技术方案：本申请实施例提供了一种基于智能语音的身份认证反欺诈方法，其中，所述方法包括：基于大数据和用户授权意向，采集待确认身份用户的基础信息、行为数据；根据所述基础信息和所述行为数据，构建所述待确认身份用户的用户画像标签集合；基于大数据，采集所述待确认身份用户的语音交互通话信息；基于待确认问题集合，对所述语音交互通话信息进行问题特征筛选，获得所述待确认身份用户的回答问题集合；将所述回答问题集合输入所述用户画像标签集合进行信息比对，生成第一比对结果；基于说话人确认技术，将所述待确认身份用户的通话声纹信息与所述用户画像标签集合中的实际采集声纹信息进行比对，生成第二比对结果；判断所述第一比对结果和所述第二比对结果是否均比对成功；若所述第一比对结果，和/或所述第二比对结果均未比对成功，基于说话人辨认技术，将所述通话声纹信息上传至黑名单声纹库中进行声纹比对筛选，确定所述待确认身份用户的实际身份信息。

在介绍了本申请基本原理后，下面将结合说明书附图来具体介绍本申请的各种非限制性的实施方式。

实施例一

如图1所示，本申请实施例提供了一种基于智能语音的身份认证反欺诈方法，其中，所述方法包括：

S100：基于大数据和用户授权意向，采集待确认身份用户的基础信息、行为数据；

S200：根据所述基础信息和所述行为数据，构建所述待确认身份用户的用户画像标签集合；

具体而言，基于大数据和用户授权意向采集待确认身份用户的基础信息如：姓名、年龄、地址、声纹、身份证等信息，采集行为数据包括正常操作行为数据（正常使用金融类软件等）和异常操作行为数据（欺诈行为数据、借贷行为数据、失信行为数据等）。根据采集到的所述基础信息和所述行为数据，构建所述待确认身份用户的用户画像标签集合，所述用户画像标签集合包括用户的身份证、年龄、性别、职业、住址、声纹、是否在黑名单等。建立确认个人信息用的用户画像，能够为提高身份认证的准确度奠定基础。

S300：基于大数据，采集所述待确认身份用户的语音交互通话信息；

S400：基于待确认问题集合，对所述语音交互通话信息进行问题特征筛选，获得所述待确认身份用户的回答问题集合；

S500：将所述回答问题集合输入所述用户画像标签集合进行信息比对，生成第一比对结果；

具体而言，在与待确认身份用户的语音交互通话过程中，采集语音交互通话信息。所述待确认问题集合为基于真实可靠的用户信息所设定的问题，基于所述待确认问题集合，对所述语音通话信息进行问题特征筛选。由于通过问答的方式，将要确认的问题（如身份证号后四位）通过语音合成后发送给待确认身份用户，判断说话人是否为待确认身份用户本人。因此，将待确认人说话音频用语音识别技术转化为文字，获得所述待确认身份用户的回答问题集合。将回答问题集合与对应用户画像标签集合（如真实身份证号后四位）做比对，将需要确认的多个信息通过多轮对话后逐个确认，生成所述第一比对结果。通过智能语音交互，对待确认身份用户进行初次身份比对，实现智能语音身份确认。

S600：基于说话人确认技术，将所述待确认身份用户的通话声纹信息与所述用户画像标签集合中的实际采集声纹信息进行比对，生成第二比对结果；

S700：判断所述第一比对结果和所述第二比对结果是否均比对成功；

S800：若所述第一比对结果，和/或所述第二比对结果均未比对成功，基于说话人辨认技术，将所述通话声纹信息上传至黑名单声纹库中进行声纹比对筛选，确定所述待确认身份用户的实际身份信息。

具体而言，声纹识别（Voiceprint Recognition, VPR），也称为说话人识别（Speaker Recognition），分为说话人辨认（Speaker Identification）和说话人确认（Speaker Verification）两类。说话人辨认技术用以判断某段语音是若干人中的哪一个所说的，是“多选一”问题；而说话人确认技术用以确认某段语音是否是指定的某个人所说的，是“一对一判别”问题。根据说话人确认技术，将实际通话过程中采集到的声纹信息，与所述用户画像标签集合中的实际声纹信息进行比对，获得所述第二比对结果。判断所述第一比对结果和所述第二比对结果是否均比对成功，如果两个比对结果均比对成功，那么身份确认成功。如果两个比对结果中至少一个比对结果不成功，那么说明存在身份信息盗用的风险。进一步的，通过所述说话人辨认技术，将所述通话声纹信息上传至所述黑名单声纹库中，进行比对筛选。所述黑名单声纹库为含有历史上出现欺诈行为且收集到对应人声纹的信息库。从而确认所述待确认身份用户的实际身份信息。通过声纹说话人确认、声纹说话人辨认技术综合完成身份认证和欺诈辨别，能够有效提高反欺诈方法的准确性和科学性，提高欺诈辨别能力，保护用户的财产安全，促进金融信贷行业的良性发展。

进一步的，如图2所示，所述对所述语音交互通话信息进行问题特征筛选，步骤S400还包括：

S410：根据所述待确认问题集合，确定第一确认问题；

S420：基于语音合成技术，将所述第一确认问题语音合成为第一问题语音信息，并发送至所述待确认身份用户，获得第一回答反馈音频信息；

S430：基于语音识别技术，将所述第一回答反馈音频信息转换为第一回答反馈文字信息；

S440：将所述第一回答反馈文字信息输入所述用户画像标签集合，基于NLP技术，进行信息比对。

具体而言，所述待确认问题集合为基于真实可靠的用户信息所设定的问题，如身份证后四位、年龄等，基于所述待确认问题集合，确定所述第一确认问题。进一步，通过语音合成技术将所述第一确认问题合成为第一问题语音信息，在电话身份确认场景中，发送给所述待确认身份用户。其中语音合成技术，又称文语转换（Text to Speech）技术，能将任意文字信息实时转化为标准流畅的语音朗读出来，涉及声学、语言学、数字信号处理、计算机科学等多个学科技术，能够将文字信息转化为可听的声音信息。并在通话过程中，采集待确认身份用户的对第一确认问题的回答，即所述第一回答反馈信息。基于语音识别技术，将所述第一回答反馈音频信息转换为文字信息。自动语音识别（Automatic SpeechRecognition, ASR）技术用于将用户端采集的语音转写为文本，与说话人识别及说话人确认不同，ASR技术尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。将所述第一回答反馈文字信息输入所述用户画像标签集合。所述NLP技术全称为自然语言处理（Natural Language Processing）技术，处理自然语言的关键是要让计算机“理解”自然语言，所以自然语言处理又叫做自然语言理解(NLU，NaturalLanguage Understanding)，也称为计算语言学(Computational Linguistics)。进一步，基于NLP技术，进行信息比对，如此将要确认的多个信息通过多轮对话后逐个确认，从而提高欺诈行为判别的准确率。

进一步的，如图3所示，本申请实施例还包括：

S441：根据所述第一回答反馈文字信息，构建回答分布特征卷积核；

S442：基于所述用户画像标签集合，构建用户画像标签分布卷积矩阵；

S443：对所述回答分布特征卷积核和所述用户画像标签分布卷积矩阵，进行卷积运算，获得目标问题回答分布特征图；

S444：根据所述目标问题回答分布特征图，获得所述用户画像标签集合中的目标问题回答信息，其中，所述目标问题回答信息与所述第一确认问题一一对应。

具体而言，所述卷积核为第一回答反馈文字信息训练学习后生成的函数，包括第一回答反馈文字信息。基于所述用户画像标签集合，构建用户画像标签分布卷积矩阵，进一步对所述回答分布特征卷积核和所述用户画像标签分布卷积矩阵，进行卷积运算，获得目标问题回答分布特征图。最后根据所述目标问题回答分布特征图，获得所述用户画像标签集合中的目标问题回答信息，且所述目标问题回答信息与所述第一确认问题一一对应。通过提取得到的回答分布特征卷积核，排除了第一回答反馈文字中的干扰信息，使得所述用户画像标签集合中的目标问题回答信息与第一确认问题的匹配比对更加准确有效，最终达到准确判别所述第一回答反馈文字信息的技术效果。

进一步的，如图4所示，所述基于待确认问题集合，本申请实施例还包括：

S450：对所述用户画像标签集合进行计算机算法的层次聚类分析，生成用户画像标签聚类树；

S460：根据所述用户画像标签聚类树，对所述用户画像标签集合进行分类管理、特征分析，生成所述待确认问题集合。

具体而言，层次聚类方法的基本思想是通过某种相似性测度计算节点之间的相似性，并按相似度由高到低排序，逐步重新连接节点。聚类树为根据相似度从强到弱连接相应节点对，形成的树状图。通过对所述用户画像标签集合进行计算机算法的层次聚类分析，生成用户画像标签聚类树，其中每一个标签为一个节点，将相似性高的用户画像标签聚为一类，生成所述用户画像标签聚类树。进一步根据所述用户画像标签聚类树，对所述用户画像标签集合进行分类管理、特征分析，生成所述待确认问题集合。能够加强对用户画像标签的分析和管理，从而使生成的待确认问题集合更加具有针对性，提高身份认证的准确性。

进一步的，如图5所示，本申请实施例还包括：

S461：对所述用户画像标签集合进行遍历访问处理，生成第一均匀分布数据集；

S462：将所述第一均匀分布数据集中的数据定义为P个聚类；

S463：对所述P个聚类中的各自数据点的两两距离进行平均值计算，获得平均距离数据集；

S464：根据所述平均距离数据集，获得类分布数据集，所述类分布数据集包括距离平均值最小的分类集；

S465：根据所述类分布数据集，对所述平均距离数据集进行逐层递归聚类，直至生成所述用户画像标签集合的用户画像标签聚类树；

S466：根据所述用户画像标签聚类树，对所述用户画像标签集合进行学习分类。

具体而言，通过计算机对所述用户画像标签集合中的所有数据进行遍历访问，可以生成第一均匀分布数据集，然后将所述第一均匀分布数据集中的数据定义为P个聚类。其中，所述聚类是指将相似的事物聚集在一起，而将不相似的事物划分到不同的类别的过程。进一步测算所述P个聚类中的各自数据点之间的两两距离，然后进行平均值计算，可以得到所述P个聚类中的各自数据点之间的平均距离，即为所述平均距离数据集。其中，所述平均距离数据集中共有P个平均值数据，分别与所述P个聚类一一对应。

进一步根据所述平均距离数据集，获得所述P个聚类平均用户画像标签集合的分布数据信息，即所述类分布数据集。其中，所述类分布数据集中包括有距离平均值最小的聚类集。根据所述类分布数据集，对所述平均距离数据集进行逐层递归聚类，直至生成所述用户画像标签集合的用户画像标签聚类树。其中，所述逐层递归聚类是指按照平均距离数据的大小，按照从大到小或从小到大的顺序，将平均距离数据最大或最小的数据合并为一个大的类。最后根据所述用户画像标签聚类树，对所述用户画像标签集合进行学习分类。达到了智能化计算，并对用户画像标签进行学习分类的技术效果。

进一步的，如图6所示，所述判断所述第一比对结果和所述第二比对结果是否均比对成功，步骤S700还包括：

S710：若所述第一比对结果和所述第二比对结果均比对成功，生成第一身份确定结果；

S720：根据所述第一身份确定结果，确定所述待确认身份用户的身份确认成功。

具体而言，如果所述第一比对结果和所述第二比对结果均比对成功，说明通过智能语音身份确认和声纹识别说话人确认技术均能够保证确认结果无误，则生成所述第一身份确定结果。根据该结果，确认所述确认身份用户的身份确认成功。提升电话身份确认的效率和准确率。

综上所述，本申请实施例所提供的一种基于智能语音的身份认证反欺诈方法及***具有如下技术效果：

1.由于采用了基于大数据和用户授权意向，采集待确认身份用户的基础信息、行为数据；根据所述基础信息和所述行为数据，构建所述待确认身份用户的用户画像标签集合；基于大数据，采集所述待确认身份用户的语音交互通话信息；基于待确认问题集合，对所述语音交互通话信息进行问题特征筛选，获得所述待确认身份用户的回答问题集合；将所述回答问题集合输入所述用户画像标签集合进行信息比对，生成第一比对结果；基于说话人确认技术，将所述待确认身份用户的通话声纹信息与所述用户画像标签集合中的实际采集声纹信息进行比对，生成第二比对结果；判断所述第一比对结果和所述第二比对结果是否均比对成功；若所述第一比对结果，和/或所述第二比对结果均未比对成功，基于说话人辨认技术，将所述通话声纹信息上传至黑名单声纹库中进行声纹比对筛选，确定所述待确认身份用户的实际身份信息的技术方案，本申请实施例通过提供了一种基于智能语音的身份认证反欺诈方法及***，达到了建立用户画像，通过智能语音交互和多项技术手段进行综合身份认证及欺诈辨别，提高身份认证的准确度及反欺诈方法的准确性和科学性，保护用户的财产安全的技术效果。

2.由于采用了层次聚类分析方法，对用户画像标签集合进行分类管理、特征分析，生成所述待确认问题集合，达到了实现智能化计算，并对用户画像标签进行学习分类的技术效果。

实施例二

基于与前述实施例中一种基于智能语音的身份认证反欺诈方法相同的发明构思，如图7所示，本申请实施例提供了一种基于智能语音的身份认证反欺诈***，其中，所述***包括：

第一采集单元11，所述第一采集单元11用于基于大数据和用户授权意向，采集待确认身份用户的基础信息、行为数据；

第一构建单元12，所述第一构建单元2用于根据所述基础信息和所述行为数据，构建所述待确认身份用户的用户画像标签集合；

第二采集单元13，所述第二采集单元13用于基于大数据，采集所述待确认身份用户的语音交互通话信息；

第一获得单元14，所述第一获得单元14用于基于待确认问题集合，对所述语音交互通话信息进行问题特征筛选，获得所述待确认身份用户的回答问题集合；

第一生成单元15，所述第一生成单元15用于将所述回答问题集合输入所述用户画像标签集合进行信息比对，生成第一比对结果；

第二生成单元16，所述第二生成单元16用于基于说话人确认技术，将所述待确认身份用户的通话声纹信息与所述用户画像标签集合中的实际采集声纹信息进行比对，生成第二比对结果；

第一判断单元17，所述第一判断单元17用于判断所述第一比对结果和所述第二比对结果是否均比对成功；

第一执行单元18，所述第一执行单元18用于若所述第一比对结果，和/或所述第二比对结果均未比对成功，基于说话人辨认技术，将所述通话声纹信息上传至黑名单声纹库中进行声纹比对筛选，确定所述待确认身份用户的实际身份信息。

进一步的，所述***包括：

第二执行单元，所述第二执行单元用于根据所述待确认问题集合，确定第一确认问题；

第二获得单元，所述第二获得单元用于基于语音合成技术，将所述第一确认问题语音合成为第一问题语音信息，并发送至所述待确认身份用户，获得第一回答反馈音频信息；

第三执行单元，所述第三执行单元用于基于语音识别技术，将所述第一回答反馈音频信息转换为第一回答反馈文字信息；

第四执行单元，所述第四执行单元用于将所述第一回答反馈文字信息输入所述用户画像标签集合，基于NLP技术，进行信息比对。

进一步的，所述***包括：

第二构建单元，所述第二构建单元用于根据所述第一回答反馈文字信息，构建回答分布特征卷积核；

第三构建单元，所述第三构建单元用于基于所述用户画像标签集合，构建用户画像标签分布卷积矩阵；

第三获得单元，所述第三获得单元用于对所述回答分布特征卷积核和所述用户画像标签分布卷积矩阵，进行卷积运算，获得目标问题回答分布特征图；

第四获得单元，所述第四获得单元用于根据所述目标问题回答分布特征图，获得所述用户画像标签集合中的目标问题回答信息，其中，所述目标问题回答信息与所述第一确认问题一一对应。

进一步的，所述***包括：

第三生成单元，所述第三生成单元用于对所述用户画像标签集合进行计算机算法的层次聚类分析，生成用户画像标签聚类树；

第四生成单元，所述第四生成单元用于根据所述用户画像标签聚类树，对所述用户画像标签集合进行分类管理、特征分析，生成所述待确认问题集合。

进一步的，所述***包括：

第五生成单元，所述第五生成单元用于对所述用户画像标签集合进行遍历访问处理，生成第一均匀分布数据集；

第五执行单元，所述第五执行单元用于将所述第一均匀分布数据集中的数据定义为P个聚类；

第五获得单元，所述第五获得单元用于对所述P个聚类中的各自数据点的两两距离进行平均值计算，获得平均距离数据集；

第六获得单元，所述第六获得单元用于根据所述平均距离数据集，获得类分布数据集，所述类分布数据集包括距离平均值最小的分类集；

第六执行单元，所述第六执行单元用于根据所述类分布数据集，对所述平均距离数据集进行逐层递归聚类，直至生成所述用户画像标签集合的用户画像标签聚类树；

第七执行单元，所述第七执行单元用于根据所述用户画像标签聚类树，对所述用户画像标签集合进行学习分类。

进一步的，所述***包括：

第六生成单元，所述第六生成单元用于若所述第一比对结果和所述第二比对结果均比对成功，生成第一身份确定结果；

第八执行单元，所述第八执行单元用于根据所述第一身份确定结果，确定所述待确认身份用户的身份确认成功。

示例性电子设备

下面参考图8来描述本申请实施例的电子设备，

基于与前述实施例中一种基于智能语音的身份认证反欺诈方法相同的发明构思，本申请实施例还提供了一种基于智能语音的身份认证反欺诈***，包括：处理器，所述处理器与存储器耦合，所述存储器用于存储程序，当所述程序被所述处理器执行时，使得***以执行第一方面任一项所述的方法。

该电子设备300包括：处理器302、通信接口303、存储器301。可选的，电子设备300还可以包括总线架构304。其中，通信接口303、处理器302以及存储器301可以通过总线架构304相互连接；总线架构304可以是外设部件互连标(peripheral componentinterconnect，简称PCI)总线或扩展工业标准结构(extended industry Standardarchitecture，简称EISA)总线等。所述总线架构304可以分为地址总线、数据总线、控制总线等。为便于表示，图8中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

处理器302可以是一个CPU，微处理器，ASIC，或一个或多个用于控制本申请方案程序执行的集成电路。

通信接口303，使用任何收发器一类的***，用于与其他设备或通信网络通信，如以太网，无线接入网(radio access network，RAN),无线局域网(wireless local areanetworks，WLAN)，有线接入网等。

存储器301可以是ROM或可存储静态信息和指令的其他类型的静态存储设备，RAM或者可存储信息和指令的其他类型的动态存储设备，也可以是电可擦可编程只读存储器(electrically erasable Programmable read-only memory，EEPROM)、只读光盘(compactdiscread-only memory，CD-ROM)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质，但不限于此。存储器可以是独立存在，通过总线架构304与处理器相连接。存储器也可以和处理器集成在一起。

其中，存储器301用于存储执行本申请方案的计算机执行指令，并由处理器302来控制执行。处理器302用于执行存储器301中存储的计算机执行指令，从而实现本申请上述实施例提供的一种基于智能语音的身份认证反欺诈方法。

可选的，本申请实施例中的计算机执行指令也可以称之为应用程序代码，本申请实施例对此不作具体限定。

本申请实施例提供了一种基于智能语音的身份认证反欺诈方法，其中，所述方法包括：基于大数据和用户授权意向，采集待确认身份用户的基础信息、行为数据；根据所述基础信息和所述行为数据，构建所述待确认身份用户的用户画像标签集合；基于大数据，采集所述待确认身份用户的语音交互通话信息；基于待确认问题集合，对所述语音交互通话信息进行问题特征筛选，获得所述待确认身份用户的回答问题集合；将所述回答问题集合输入所述用户画像标签集合进行信息比对，生成第一比对结果；基于说话人确认技术，将所述待确认身份用户的通话声纹信息与所述用户画像标签集合中的实际采集声纹信息进行比对，生成第二比对结果；判断所述第一比对结果和所述第二比对结果是否均比对成功；若所述第一比对结果，和/或所述第二比对结果均未比对成功，基于说话人辨认技术，将所述通话声纹信息上传至黑名单声纹库中进行声纹比对筛选，确定所述待确认身份用户的实际身份信息。

本领域普通技术人员可以理解：本申请中涉及的第一、第二等各种数字编号仅为描述方便进行的区分，并不用来限制本申请实施例的范围，也不表示先后顺序。“和/或”，描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。“至少一个”是指一个或者多个。至少两个是指两个或者多个。“至少一个”、“任意一个”或其类似表达，是指的这些项中的任意组合，包括单项(个)或复数项(个)的任意组合。例如，a ,b,或c中的至少一项(个、种)，可以表示：a ,b,c,a -b,a-c,b-c,或a-b-c，其中a,b,c可以是单个，也可以是多个。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程***。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包括一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘(Solid State Disk，SSD))等。

本申请实施例中所描述的各种说明性的逻辑单元和电路可以通过通用处理器，数字信号处理器，专用集成电路(ASIC)，现场可编程门阵列(FPGA)或其它可编程逻辑***，离散门或晶体管逻辑，离散硬件部件，或上述任何组合的设计来实现或操作所描述的功能。通用处理器可以为微处理器，可选地，该通用处理器也可以为任何传统的处理器、控制器、微控制器或状态机。处理器也可以通过计算***的组合来实现，例如数字信号处理器和微处理器，多个微处理器，一个或多个微处理器联合一个数字信号处理器核，或任何其它类似的配置来实现。

本申请实施例中所描述的方法或算法的步骤可以直接嵌入硬件、处理器执行的软件单元、或者这两者的结合。软件单元可以存储于RAM存储器、闪存、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可移动磁盘、CD-ROM或本领域中其它任意形式的存储媒介中。示例性地，存储媒介可以与处理器连接，以使得处理器可以从存储媒介中读取信息，并可以向存储媒介存写信息。可选地，存储媒介还可以集成到处理器中。处理器和存储媒介可以设置于ASIC中，ASIC可以设置于终端中。可选地，处理器和存储媒介也可以设置于终端中的不同的部件中。这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管结合具体特征及其实施例对本申请进行了描述，显而易见的，在不脱离本申请的精神和范围的情况下，可对其进行各种修改和组合。相应地，本说明书和附图仅仅是所附权利要求所界定的本申请的示例性说明，且视为已覆盖本申请范围内的任意和所有修改、变化、组合或等同物。显然，本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的范围。这样，倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内，则本申请意图包括这些改动和变型在内。

Claims

1.一种基于智能语音的身份认证反欺诈方法，其中，所述方法包括：

基于大数据和用户授权意向，采集待确认身份用户的基础信息、行为数据；

根据所述基础信息和所述行为数据，构建所述待确认身份用户的用户画像标签集合；

基于大数据，采集所述待确认身份用户的语音交互通话信息；

基于待确认问题集合，对所述语音交互通话信息进行问题特征筛选，获得所述待确认身份用户的回答问题集合；

将所述回答问题集合输入所述用户画像标签集合进行信息比对，生成第一比对结果；

基于说话人确认技术，将所述待确认身份用户的通话声纹信息与所述用户画像标签集合中的实际采集声纹信息进行比对，生成第二比对结果；

判断所述第一比对结果和所述第二比对结果是否均比对成功；

若所述第一比对结果，和/或所述第二比对结果均未比对成功，基于说话人辨认技术，将所述通话声纹信息上传至黑名单声纹库中进行声纹比对筛选，确定所述待确认身份用户的实际身份信息。

2.如权利要求1所述的方法，其中，所述对所述语音交互通话信息进行问题特征筛选，包括：

根据所述待确认问题集合，确定第一确认问题；

基于语音合成技术，将所述第一确认问题语音合成为第一问题语音信息，并发送至所述待确认身份用户，获得第一回答反馈音频信息；

基于语音识别技术，将所述第一回答反馈音频信息转换为第一回答反馈文字信息；

将所述第一回答反馈文字信息输入所述用户画像标签集合，基于NLP技术，进行信息比对。

3.如权利要求2所述的方法，其中，所述方法还包括：

根据所述第一回答反馈文字信息，构建回答分布特征卷积核；

基于所述用户画像标签集合，构建用户画像标签分布卷积矩阵；

对所述回答分布特征卷积核和所述用户画像标签分布卷积矩阵，进行卷积运算，获得目标问题回答分布特征图；

根据所述目标问题回答分布特征图，获得所述用户画像标签集合中的目标问题回答信息，其中，所述目标问题回答信息与所述第一确认问题一一对应。

4.如权利要求1所述的方法，其中，所述基于待确认问题集合，包括：

对所述用户画像标签集合进行计算机算法的层次聚类分析，生成用户画像标签聚类树；

根据所述用户画像标签聚类树，对所述用户画像标签集合进行分类管理、特征分析，生成所述待确认问题集合。

5.如权利要求4所述的方法，其中，所述方法还包括：

对所述用户画像标签集合进行遍历访问处理，生成第一均匀分布数据集；

将所述第一均匀分布数据集中的数据定义为P个聚类；

对所述P个聚类中的各自数据点的两两距离进行平均值计算，获得平均距离数据集；

根据所述平均距离数据集，获得类分布数据集，所述类分布数据集包括距离平均值最小的分类集；

根据所述类分布数据集，对所述平均距离数据集进行逐层递归聚类，直至生成所述用户画像标签集合的用户画像标签聚类树；

根据所述用户画像标签聚类树，对所述用户画像标签集合进行学习分类。

6.如权利要求1所述的方法，其中，所述判断所述第一比对结果和所述第二比对结果是否均比对成功，还包括：

若所述第一比对结果和所述第二比对结果均比对成功，生成第一身份确定结果；

根据所述第一身份确定结果，确定所述待确认身份用户的身份确认成功。

7.一种基于智能语音的身份认证反欺诈***，其中，所述***包括：

第一采集单元，所述第一采集单元用于基于大数据和用户授权意向，采集待确认身份用户的基础信息、行为数据；

第一构建单元，所述第一构建单元用于根据所述基础信息和所述行为数据，构建所述待确认身份用户的用户画像标签集合；

第二采集单元，所述第二采集单元用于基于大数据，采集所述待确认身份用户的语音交互通话信息；

第一获得单元，所述第一获得单元用于基于待确认问题集合，对所述语音交互通话信息进行问题特征筛选，获得所述待确认身份用户的回答问题集合；

第一生成单元，所述第一生成单元用于将所述回答问题集合输入所述用户画像标签集合进行信息比对，生成第一比对结果；

第二生成单元，所述第二生成单元用于基于说话人确认技术，将所述待确认身份用户的通话声纹信息与所述用户画像标签集合中的实际采集声纹信息进行比对，生成第二比对结果；

第一判断单元，所述第一判断单元用于判断所述第一比对结果和所述第二比对结果是否均比对成功；

第一执行单元，所述第一执行单元用于若所述第一比对结果，和/或所述第二比对结果均未比对成功，基于说话人辨认技术，将所述通话声纹信息上传至黑名单声纹库中进行声纹比对筛选，确定所述待确认身份用户的实际身份信息。

8.一种基于智能语音的身份认证反欺诈***，包括：处理器，所述处理器与存储器耦合，所述存储器用于存储程序，当所述程序被所述处理器执行时，使***以执行如权利要求1~6任一项所述的方法。