CN110750774B - 身份识别的方法及装置 - Google Patents
身份识别的方法及装置 Download PDFInfo
- Publication number
- CN110750774B CN110750774B CN201911002444.8A CN201911002444A CN110750774B CN 110750774 B CN110750774 B CN 110750774B CN 201911002444 A CN201911002444 A CN 201911002444A CN 110750774 B CN110750774 B CN 110750774B
- Authority
- CN
- China
- Prior art keywords
- user
- information
- verification
- voiceprint
- parameters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q20/00—Payment architectures, schemes or protocols
- G06Q20/38—Payment protocols; Details thereof
- G06Q20/40—Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
- G06Q20/401—Transaction verification
- G06Q20/4016—Transaction verification involving fraud or risk level assessment in transaction processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/30—Authentication, i.e. establishing the identity or authorisation of security principals
- G06F21/31—User authentication
- G06F21/32—User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q20/00—Payment architectures, schemes or protocols
- G06Q20/38—Payment protocols; Details thereof
- G06Q20/40—Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
- G06Q20/401—Transaction verification
- G06Q20/4014—Identity check for transactions
- G06Q20/40145—Biometric identity checks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Security & Cryptography (AREA)
- Accounting & Taxation (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- General Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- Finance (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Computer Hardware Design (AREA)
- Software Systems (AREA)
- Telephonic Communication Services (AREA)
Abstract
本公开实施例公开了一种身份识别的方法及装置,该方法包括:获取用户的第一声纹信息和所述用户关联人脉的第二声纹信息;计算所述第一声纹信息与所述第二声纹信息的相似度值;若所述相似度值小于预设第一阈值,则生成至少一个验证策略对所述用户和所述用户关联人脉进行验证,生成验证结果;将所述相似度值和所述验证结果作为训练参数或修正参数,训练识别模型或修正识别模型。
Description
技术领域
本公开涉及身份识别领域,具体涉及一种身份识别的方法及装置、电子设备及存储介质。
背景技术
现有技术中,对于身份识别的一般方法是利用人体本身的生物特征信号进行身份识别,例如基于指纹、面部识别等。常见的基于人体生物特征的身份识别方法为对需要识别的用户提取具有代表性的人体生物特征,通过对比提取到的人体生物特征与一个庞大的预先建立的人体生物特征模板进行比较,获取相似度,并根据相似度的大小来确定人体特征合不合法。但是,以上身份识别方法存在很多缺点,一是每次身份识别时需要将待识别人体特征与总模板库中所有人体特征模板进行比较才能判断是否合法,计算量大,耗费时间;二是现有技术中,包括人脸和指纹在内的人体生物特征不具有唯一性,长得很像的兄弟姐妹、双胞胎或者克隆人的出现使得基于面部、指纹等生物特征在内的身份认证的安全性受到威胁;三是现有技术中,获取人体本身的生物特征信号的方法太过复杂,需要专门的设备或时间进行集中采集,成本高且无法实现远程的识别;尤其在金融领域中,现有技术存在的缺点极易导致欺诈情况的发生,很有可能欺诈人员使用多个不同的身份进行借贷诈骗,不利于数字金融行业的良性发展,也对传统金融的创新业务造成了诸多不利的影响。
发明内容
针对现有技术中的上述技术问题,本公开实施例提出了一种身份识别的方法、装置、电子设备及计算机可读存储介质,以解决现有技术中身份识别安全性低、计算量大、人体生物特征采取不方便的问题。
本公开实施例的第一方面提供了一种身份识别的方法,包括:
获取用户的第一声纹信息和所述用户关联人脉的第二声纹信息;
计算所述第一声纹信息与所述第二声纹信息的相似度值;
若所述相似度值小于预设第一阈值,则生成至少一个验证策略对所述用户和所述用户关联人脉进行验证,生成验证结果;
将所述相似度值和所述验证结果作为训练参数或修正参数,训练识别模型或修正识别模型。
在一些实施例中,所述方法还包括:通过智能语音助手获取所述第一声纹信息,并根据所述第一声纹信息获取所述第二声纹信息。
在一些实施例中,所述方法还包括:通过智能语音助手获取用户的实时声纹信息,并根据所述实时声纹信息获取所述第一声纹信息和所述第二声纹信息。
具体地,所述方法还包括:所述智能语音助手将所述实时声纹信息发送至声纹智能控制模块;
当所述声纹智能控制模块分析所述用户处于活跃状态时,从图谱数据库中获取所述用户预存的所述第一声纹信息和所述关联人脉的第二声纹信息。
在一些实施例中,所述第一声纹信息和/或第二声纹信息中均至少包括一个声纹特征值;
所述计算所述第一声纹信息与所述第二声纹信息的相似度值,具体包括:根据所述第一声纹信息的第一声纹特征值和所述第二声纹信息的第二声纹特征值计算所述相似度值。
在一些实施例中,所述相似度值的计算方法包括:欧氏距离方法、曼哈顿距离方法、标准化欧氏距离方法和夹角余弦方法中的至少一种。
在一些实施例中,所述方法还包括:通过检测所述用户和所述用户的关联人脉的状态生成至少一个所述验证策略。
在一些实施例中,所述验证策略具体为:通过智能语音助手同时向所述用户和所述用户关联人脉发起语音通话。
可选地,所述验证策略中至少包含控制对话参数;
其中,所述控制对话参数包括发起语音对话的时间、对话目标、对话通道中的至少一个。
可选地,所述验证策略中至少包括控制对话流参数;
其中,所述控制对话流参数至少包括对话内容和问答逻辑中的至少一个。
进一步地,所述验证策略还用于控制所述智能语音助手输出语音相关信息参数;所述语音相关信息参数包括语音输入参数、语音信号识别出的文本信息中的至少一个。
在一些实施例中,所述方法还包括:接收验证反馈信息,根据所述验证反馈信息生成验证结果。
具体地,所述验证反馈信息具体为语音相关信息参数;其中,所述语音相关信息参数包括语音输入参数、语音信号识别出的文本信息中的至少一个。
在一些实施例中,所述验证策略具体为:从图谱数据库中获取所述用户和所述用户关联人脉的空间数据进行验证。
具体地,所述空间数据包括城市信息、经纬度信息和网络类型信息中的至少一种。
进一步地,所述方法还包括:计算所述用户和所述关联用户的空间相关性;若所述空间相关性小于预设第二阈值的次数大于预设值时,结合所述第一声纹信息与所述第二声纹信息的相似度值,输出验证结果。
在一些实施例中,所述验证策略至少包含验证参数;其中,所述验证参数包括发起验证时间、验证目标和验证内容中的至少一个。
在一些实施例中,所述方法还包括:根据获取到的所述用户和所述用户关联人脉的反馈信息生成验证反馈信息;根据所述验证反馈信息生成所述验证结果。
可选地,所述验证反馈信息至少包括用户反馈相关信息和生物特征信息;
其中,所述用户反馈相关信息具体为用户反馈行为信息和/或用户反馈信息本体。
在一些实施例中,所述方法还包括:根据获取到的所述用户和所述用户关联人脉的反馈信息计算反馈行为信息的时空关联度和生物特征信息相似性;根据所述时空关联度和所述生物特征信息相似度生成所述验证结果。
优选地,所述方法还包括:根据获取到的所述用户和所述用户关联人脉的反馈信息生成信息校验评分和/或交叉验证评分。
优选地,所述方法还包括:根据所述验证反馈信息、信息校验评分和/或交叉验证评分生成所述验证结果;或者,
根据所述时空关联度、所述生物特征信息相似度、信息校验评分和/或交叉验证评分生成所述验证结果。
在一些实施例中,所述将所述相似度值和所述验证结果作为训练参数或修正参数具体包括:将所述相似度值和所述验证结果直接或间接的作为训练参数或修正参数。
具体地,所述间接的作为训练参数或修正参数,具体包括:处理所述相似度值和所述验证结果得到新的变量数据,将所述新的变量数据作为训练参数或修正参数。
本公开实施例的第二方面提供了一种身份识别的装置,包括:
声纹获取单元,用于获取用户的第一声纹信息和所述用户关联人脉的第二声纹信息;
计算单元,用于计算所述第一声纹信息与所述第二声纹信息的相似度值;
验证单元,用于若所述相似度值小于预设第一阈值,则生成至少一个验证策略对所述用户和所述用户关联人脉进行验证,生成验证结果;
提升精度单元,用于将所述相似度值和所述验证结果作为训练参数或修正参数,训练识别模型或修正识别模型。
在一些实施例中,所述声纹获取单元具体用于通过获取所述第一声纹信息,并根据所述第一声纹信息获取所述第二声纹信息。
在一些实施例中,所述声纹获取单元具体用于通过智能语音助手获取用户的实时声纹信息,并根据所述实时声纹信息获取所述第一声纹信息和所述第二声纹信息。
具体地,所述声纹获取单元通过所述智能语音助手将所述实时声纹信息发送至声纹智能控制模块;当所述声纹智能控制模块分析所述用户处于活跃状态时,从图谱数据库中获取所述用户预存的所述第一声纹信息和所述关联人脉的第二声纹信息。
在一些实施例中,所述声纹获取单元获取的所述第一声纹信息和/或第二声纹信息中均至少包括一个声纹特征值;
所述计算单元,具体用于根据所述第一声纹信息的第一声纹特征值和所述第二声纹信息的第二声纹特征值计算所述相似度值。
在一些实施例中,所述计算单元计算所述相似度值的方法包括:欧氏距离方法、曼哈顿距离方法、标准化欧氏距离方法和夹角余弦方法中的至少一种。
在一些实施例中,所述验证单元,用于通过检测所述用户和所述用户的关联人脉的状态生成至少一个所述验证策略。
在一些实施例中,所述验证单元生成的验证策略具体为:通过智能语音助手同时向所述用户和所述用户关联人脉发起语音通话。
可选地,所述验证单元生成的所述验证策略中至少包括控制对话流参数;其中,所述控制对话流参数至少包括对话内容和问答逻辑中的至少一个。
可选地,所述验证单元生成的所述验证策略中至少包括控制对话流参数;其中,所述控制对话流参数至少包括对话内容和问答逻辑中的至少一个。
进一步地,所述验证单元生成的所述验证策略还用于控制所述智能语音助手输出语音相关信息参数;所述语音相关信息参数包括语音输入参数、语音信号识别出的文本信息中的至少一个。
在一些实施例中,所述验证单元还用于接收验证反馈信息,根据所述验证反馈信息生成验证结果。
在一些实施例中,所述验证单元接收的所述验证反馈信息,具体为语音相关信息参数;其中,所述语音相关信息参数包括语音输入参数、语音信号识别出的文本信息中的至少一个。
进一步地,所述验证单元生成的验证策略具体为:从图谱数据库中获取所述用户和所述用户关联人脉的空间数据进行验证。
在一些实施例中,所述空间数据包括城市信息、经纬度信息和网络类型信息中的至少一种。
在一些实施例中,所述验证单元包括:
计算空间相关性子单元,用于计算所述用户和所述关联用户的空间相关性;
验证子单元,用于比较若所述空间相关性小于预设第二阈值的次数大于预设值时,结合所述第一声纹信息与所述第二声纹信息的相似度值,输出验证结果。
可选地,所述验证单元生成的验证策略至少包含验证参数;其中,所述验证参数包括发起验证时间、验证目标和验证内容中的至少一个。
在一些实施例中,所述验证单元具体用于:根据获取到的所述用户和所述用户关联人脉的反馈信息生成验证反馈信息;根据所述验证反馈信息生成所述验证结果。
优选地,所述验证反馈信息至少包括用户反馈相关信息和生物特征信息;其中,所述用户反馈相关信息具体为用户反馈行为信息和/或用户反馈信息本体。
优选地,所述验证单元具体用于根据获取到的所述用户和所述用户关联人脉的反馈信息计算反馈行为信息的时空关联度和生物特征信息相似性;根据所述时空关联度和所述生物特征信息相似度生成所述验证结果。
所述验证单元还用于根据获取到的所述用户和所述用户关联人脉的反馈信息生成信息校验评分和/或交叉验证评分。
优选地,所述验证单元还用于根据所述验证反馈信息、信息校验评分和/或交叉验证评分生成所述验证结果;
或者,根据所述时空关联度、所述生物特征信息相似度、信息校验评分和/或交叉验证评分生成所述验证结果。
在一些实施例中,所述提升精度单元,具体用于将所述相似度值和所述验证结果直接或间接的作为训练参数或修正参数。
具体地,所述提升精度单元具体用于处理所述相似度值和所述验证结果得到新的变量数据,将所述新的变量数据作为训练参数或修正参数。
本公开实施例的第三方面提供了一种电子设备,包括:
存储器以及一个或多个处理器;
其中,所述存储器与所述一个或多个处理器通信连接,所述存储器中存储有可被所述一个或多个处理器执行的指令,所述指令被所述一个或多个处理器执行时,所述电子设备用于实现如前述各实施例所述的方法。
本公开实施例的第四方面提供了一种计算机可读存储介质,其上存储有计算机可执行指令,当所述计算机可执行指令被计算装置执行时,可用来实现如前述各实施例所述的方法。
本公开实施例的第五方面提供了一种计算机程序产品,所述计算机程序产品包括存储在计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,可用来实现如前述各实施例所述的方法。
本公开实施例,通过比较用户和用户关联人的声纹信息,生成至少一个验证策略,对用户和用户关联人脉进行身份识别和验证,同时将生成的声纹相似度值和验证结果作为识别模型的训练参数或修正参数,方便快捷的实现身份识别,大大提高了身份识别精确度,安全度大幅提升,用户体验良好。
附图说明
通过参考附图会更加清楚的理解本公开的特征和优点,附图是示意性的而不应理解为对本公开进行任何限制,在附图中:
图1是根据本公开的一些实施例所示的一种现有的基于知识图谱和人工智能的风险控制***示意图;
图2是根据本公开的一些实施例所示的一种现有某金融APP贷款页面示意图;
图3是根据本公开的一些实施例所示的一种智能语音助手结构示意图;
图4是根据本公开的一些实施例所示的一种现有图谱数据库结构示意图;
图5是根据本公开的一些实施例所示的一种加入声纹进项的图谱数据库结构示意图;
图6是根据本公开的一些实施例所示的一种基于知识图谱和人工智能的风险控制***结构示意图;
图7是根据本公开的一些实施例所示的一种身份识别的方法的流程示意图;
图8是根据本公开的一些实施例所示的一种策略模块和验证模块工作示意图;
图9是根据本公开的一些实施例所示的另一种图谱数据库结构的示意图;
图10是根据本公开的一些实施例所示的一种策略模块工作示意图;
图11是根据本公开的一些实施例所示的一种验证模块验证步骤示意图;
图12是根据本公开的一些实施例所示的一种身份识别的装置的结构框图
图13是根据本公开的一些实施例所示的一种电子设备的结构示意图。
具体实施方式
在下面的详细描述中,通过示例阐述了本公开的许多具体细节,以便提供对相关披露的透彻理解。然而,对于本领域的普通技术人员来讲,本公开显而易见的可以在没有这些细节的情况下实施。应当理解的是,本公开中使用“***”、“装置”、“单元”和/或“模块”术语,是用于区分在顺序排列中不同级别的不同部件、元件、部分或组件的一种方法。然而,如果其他表达式可以实现相同的目的,这些术语可以被其他表达式替换。
应当理解的是,当设备、单元或模块被称为“在……上”、“连接到”或“耦合到”另一设备、单元或模块时,其可以直接在另一设备、单元或模块上,连接或耦合到或与其他设备、单元或模块通信,或者可以存在中间设备、单元或模块,除非上下文明确提示例外情形。例如,本公开所使用的术语“和/或”包括一个或多个相关所列条目的任何一个和所有组合。
本公开所用术语仅为了描述特定实施例,而非限制本公开范围。如本公开说明书和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的特征、整体、步骤、操作、元素和/或组件,而该类表述并不构成一个排它性的罗列,其他特征、整体、步骤、操作、元素和/或组件也可以包含在内。
参看下面的说明以及附图,本公开的这些或其他特征和特点、操作方法、结构的相关元素的功能、部分的结合以及制造的经济性可以被更好地理解,其中说明和附图形成了说明书的一部分。然而,可以清楚地理解,附图仅用作说明和描述的目的,并不意在限定本公开的保护范围。可以理解的是,附图并非按比例绘制。
本公开中使用了多种结构图用来说明根据本公开的实施例的各种变形。应当理解的是,前面或下面的结构并不是用来限定本公开。本公开的保护范围以权利要求为准。
如图l所示,给出了一种现有的基于知识图谱和人工智能的风险控制***示意图,例如某公司的智能风险控制***。其中,用户通过互联网前端***,例如SDK(SoftwareDevelopment Kit)、H5页面、互联网金融APP程序提交一个金融进项申请,其中金融APP还可以提供智能语音助手功能,如图1所示的APP模块中右下角图标即代表智能语音助手,该功能的推出很大程度上可以减轻用户通过手机软键盘录入个人相关资料的压力,用户只需要通过语音就可以完成资料的录入,当不适合通过手机软键盘输入信息时该功能将非常有用;然后通过有线或无线通信网络,将该金融进项接入到任务匹配服务器;在任务分配服务器中一个金融进项会被自动匹配到不同的金融服务供应商;一般地,匹配服务器为第三方金融机构所拥有;进一步,对于进入金融服务***中的进项数据,首先会经过数据预处理,然后存入图谱数据库中;所述图谱数据库,可以是NEO4J的图数据库,用于存储大量关于金融业务的知识图谱数据。进一步地,该金融进项会生成一个风险控制分析任务,该任务通过图查询的方式从图谱数据库中得到基于关系的数据,得到与该进项相关的关系数据。将这些关系数据输入至变量计算模块,得到关系数据对应的评估变量。进一步地,将评估变量输入至一个反欺诈评估模型,完成反欺诈识别;其中反欺诈评估模型可以基于机器学习的评估模型,例如该模型可以是基于决策树的GDBT模型或基于神经网络的深度模型。进一步地,将反欺诈识别的结果和变量数据输入至反欺和风控***模块,该模块基于对应的决策流以及可选的人工的干预,完成对该进项的评估。
如图2所示,给出了一种现有某金融APP贷款页面示意图,当贷款申请人申请易分期贷款时需要填写大量有关个人的相关信息,比如电子邮件、居住城市、详细地址等信息。在没有智能语音助手功能之前,贷款申请人对个人资料的输入都要通过手机软键盘手动输入,而增加了智能语音助手功能后,贷款申请人可以通过与智能语音助手交互来实现个人资料的录入。
如图3所示,给出了一种智能语音助手结构示意图。贷款申请人语音通过话筒接收用户语音输入,语音识别模块将接收到的语音进行识别并提取出格式为域、意图、槽(Slot)等特定类型的文本,进一步将所提取的文本与存储在代理定义结构(分类器)中的可能的用户命令的列表相比较以确定最可能与用户的意图匹配的命令。如果匹配到与用户的意图匹配的命令,则执行语音中所需的操作;如果不匹配,则通过与分类器中的一者或多者进行匹配确定置信度分数,基于置信度分数来选择分类器,并基于与该分类器相关联的命令来确定最可能与用户的意图匹配的命令;其中,该匹配可以是基于统计、概率方法、决策树、其它规则、其它合适的匹配准则中的一个或多个组合;如果置信度分数大于等于设定的阈值,则执行语音中所需的操作;如果置信度分数低于设定的阈值,则认为分类器中不存在与用户语音相关的内容,将通过用户使用标记工具来输入请求,***在得到用户的文字输入后,更新分类器模型,同时执行用户的请求。
如图4所示,给出了一种现有图谱数据库结构示意图,该图谱数据库使用了与传统结构性数据库不同的方式来存储用于反欺诈或风控的金融数据,一个图谱数据库主要按现实世界中的实体与关系来存储数据。其中不同的实体对应于不同的节点,如图4所示的圆形节点及多边形节点;不同的实体间通过关系来完成连接,如图4所示的不同节点之间的连线。其中,节点与关系还进一步包括不同的属性,用于定义实体的类型和关系的类型。在本公开所涉及的金融大数据***中,图谱数据库中存储的是与金融相关的个人数据,如图4所示,“张明”和“***”为两个个人实体,每个实体通过例如“工作于”或“拥有电话”等关系与其他的“手机号”或“公司”等实体相连。其中,相比其他领域的知识图谱较为独特的一点在于金融图谱数据中存储着大量的“进项”实体,其具体记录了一个个人对应的金融服务进项,例如一项信用贷款等。在一个实用的金融图谱数据库中,点和边的数量能够达到上亿个。
类似于人类的指纹和DNA,声纹也是人体独特的个性生物特征,表征一个人声纹信息的特征可以是多方面的:与发音机制相关的声学特征(如频谱、倒频谱、共振峰、基音、反射系数等等)、鼻音、带深呼吸音、沙哑音、笑声等;或者受社会经济状况、受教育水平、出生地等影响的语义、修辞、发音、言语习惯等;或者个人特点或受父母影响的韵律、节奏、速度、语调、音量等特征;总之,从利用数学方法可以建模的角度出发,声纹识别模型可以使用的特征包括:(1)声学特征(倒频谱);(2)词法特征(说话人相关的词N-Gram,音素N-Gram);(3)韵律特征(利用N-Gram描述的基音和能量“姿势”);(4)语种、方言和口音信息等等,在特定的***中具体使用何种类型的声纹特征,或者是使用多种类型声纹特征的组合根据具体情况确定即可,也可以采用其他类型的声纹特征来表征声纹信息,这里不做具体限定。
声纹识别,作为生物识别技术的一种,也称为说话人识别,包括说话人辨认和说话人确认。声纹识别就是把声信号转换成电信号,再用计算机进行识别。不同的任务和应用会使用不同的声纹识别技术,如缩小刑侦范围时可能需要辨认技术,而银行交易时则需要确认技术。由于声纹不同于其他生物识别技术(如人脸识别、指纹识别、掌纹识别、虹膜识别等),具有不会遗失、改变、不需记忆等优点,只需通过麦克风或电话输入语音即可进行识别,无需特殊的设备、特定的文本内容,数据采集极为方便,造价低廉,是最为经济、可靠、简便、安全和有效的身份识别方式。这些优点会成为声纹识别广泛应用的基础。
如图5所示,给出了本公开的一些实施例中所示的一种加入声纹进项的图谱数据库结构示意图,当贷款申请人使用智能语言助手录入信息时,***一方面提供智能语音助手服务,例如通过智能语音助手提供贷款资料填写指导,同时***通过接收用户语音输入并将该贷款申请人的声纹特征进行提取并保存在该人员对应的图谱数据库节点中,由于每个人在不同的环境下(内容、方式、身体状况、时间、年龄等),声纹特征会有细微的变化,所以每个个体可以有多个声纹信息。如图5中所示,张明包含“声纹1”和“声纹2”两个声纹进项,张成包含“声纹3”一个声纹进项,***包含“声纹4”一个声纹进项,王东没有声纹信息(可能王东还未使用过智能语音助手,目前还没有提取到王东的声纹信息)。
如图6所示,给出了本公开的一些实施例中所示的一种基于知识图谱和人工智能的风险控制***结构示意图,在现有风险控制***的基础上做了进一步的优化,增加了声纹智能控制模块。其中,声纹智能控制模块是对贷款申请人现有的声纹信息进行分析,发现高度相似的两个声纹信息后,向该声纹信息对应的两个申请人通过智能语音助手发起语音通话,从而根据用户和用户关联人脉的回复同步情况来判断这两人是否为同一个人,从而为识别模块或者反欺和风控***模块提供建议,进一步降低欺诈的风险,以下将对本发明实施步骤做具体分析。
如图7所示,是根据本公开的一些实施例所示的一种身份识别的方法示意图。在一些实施例中,所述身份识别的方法由身份识别***执行。如图7所示,所述一种身份识别的方法包括以下步骤:
S202,获取用户的第一声纹信息和所述用户关联人脉的第二声纹信息。
具体地,智能语音助手接收用户的实时声纹信息后,发送给声纹智能控制模块;所述声纹智能模块接收用户的实时声纹信息且分析此用户目前处于活跃状态时,则从图谱数据库中获取该用户预存的第一声纹信息以及其关联人脉的第二声纹信息;其中,活跃状态可以具体为该用户近期有过贷款尝试/贷款记录或者曾经打开过某金融APP等一系列预设行为。
在一些实施例中,将在图谱数据库中获取的用户预存的声纹信息作为第一声纹信息,将用户关联人脉的声纹信息作为第二声纹信息;由于关联人脉可能包括一个或多个,相应地,第二声纹信息也可能包括一个或多个。
在一些实施例中,还可以将智能语音助手接收的用户的实时声纹信息作为第一声纹信息;将所述第一声纹信息发送至声纹智能控制模块,所述声纹智能模块接收第一声纹信息且分析此用户目前处于活跃状态时,从图谱数据库中仅获取用户关联人脉的第二声纹信息。
在一些实施例中,以图5所示的图谱数据库结构示意图为例,假如检测到用户张明近期为活跃状态,则声纹智能控制模块从图谱数据库中获取张明的声纹1、声纹2数据以及张明的关联人脉张成的声纹3数据和***的声纹4数据;其中,本公开以一度人脉为例介绍操作步骤,张成和***均是张明的一度人脉。
S204,计算所述第一声纹信息与所述第二声纹信息的相似度值。
具体地,所述第一声纹信息和/或第二声纹信息中至少包括一个声纹特征值;S204具体包括:根据所述第一声纹信息的第一声纹特征值和所述第二声纹信息的第二声纹特征值计算所述相似度值。假设该***的声纹信息是由三个声纹特征值来表征,则S202中从图谱数据库中获得的声纹特征值分别为:张明声纹1的声纹特征值为(ZM1,ZM2,ZM3),张成声纹3特征值为(ZC1,ZC2,ZC3),***声纹4特征值为(LQ1,LQ2,LQ3),分别计算得到张明和张成、***声纹特征值的相似度值大小为Szm-zc和Szm-lq。其中,相似度值的计算方法包括:欧氏距离方法、曼哈顿距离方法、标准化欧氏距离方法和夹角余弦方法中的至少一种,本公开对计算相似度值的算法不做限定,可以根据实际情况自行选择;本公开以欧氏距离为例,计算声纹特征相似度值的公式如下所示:
S206,若所述相似度值小于预设第一阈值,则生成至少一个验证策略对所述用户和所述用户关联人脉进行验证,生成验证结果。
具体地,根据S204得到该用户和一度人脉声纹相似度值的大小S,然后分别将相似度值和预设第一阈值进行比较,第一阈值M的设定可以根据历史统计数据或者经验值来设定。
在一些实施例中,以S204中相似度值算法采用欧式距离为例,如果张明和张成的声纹数据相似度值大小为Szm-zc<M,则认为张明和张成两者间声纹数据相似度值很高,存在张明、张成是同一个人的可能,则生成至少一个验证策略进行进一步的核实;如果张明和张成的声纹数据相似度值大小为Szm-zc≥M,则不能做同一人认定,身份识别结束,执行S208。
更具体地,由上述描述得知张明和张成的声纹数据相似度很高,有可能张明和张成是同一人,为了欺诈贷款才设置了虚假身份,为了验证是否为同一个人,***将利用策略模块和验证模块协同配合进行验证。
在一些实施例中,所述方法还包括:策略模块通过检测所述用户和所述用户的关联人脉的状态生成至少一个所述验证策略;所述验证策略可以具体为:通过智能语音助手同时向所述用户和所述用户关联人脉发起语音通话。
在一些实施例中,策略模块通过检测张明和张成的活动来生成验证策略,例如张明和张成同时登陆某金融APP时,策略模块发起第一策略;具体地,第一策略为向张明和张成通过智能语音助手同时发起语音通话,向其询问一组第一策略中涉及到该人的私人问题(例如,你的推荐人是谁等);进一步地,验证模块能根据收到的来自张明和张成的语音回复统计次数;在一个简单的一致性检测方法中,如果存在同时收到来自张明和张成的语音回复,则认为该两人为不同的人,这是由于同一个人一般是无法同时回复两个语音通话的;如 果两人的回复每次都无法达到同步,则认为这两人有可能为同一人,存在欺诈的风险,如表1所示;表1中给出的同步性仅为智能语音助手发起的时间作为输入而得到的一个简单一致性验证信息。
统计次数 | 回复是否同步 |
第一次 | 否 |
第二次 | 否 |
第三次 | 否 |
第四次 | 否 |
第五次 | 否 |
…… | 否 |
表1.回复是否同步统计表
在一些实施例中,如图8所示,给出了一种策略模块和验证模块工作示意图。策略模块通过智能语音助手主动发起与用户的对话,并将更多的参数输入至一个验证模块中,此时智能语音助手发起对话的时间和是否接通仅为一个变量输入至验证模块中的一致性识别模型中。一致性识别模型可以利用大量的训练数据,并应用机器学习的方式得到一致性的结果。策略模块可以生成至少一个验证策略,一个验证策略中至少包含一组控制对话参数,其中,所述控制对话参数包括发起语音对话的时间、对话目标、对话通道中的至少一个;进一步,一个验证策略至少还包括一个控制对话流参数,控制对话流参数包含了对话的内容、问答逻辑中的至少一个,例如对话流控制了发起的对话的内容,是否在对话后接收语音,是否结束对话,用户引导流程等内容;进一步地,一个策略还可以包括其他辅助信息,例如通过APP展示的图像或控制APP完成用户信息采集等。
优选地,验证策略还可以控制智能语音助手输出验证反馈信息,具体地,所述验证反馈信息可以具体为语音相关信息参数;进一步地,智能语音助手收到用户输入,并生成一组参数、一组信息中的至少一个;所述参数为语音输入参数,例如用户输入时间、用户输入通道、用户所在地理位置等信息;所述一组信息为语音信号识别出的文本信息;更进一步,智能语音助手输入也可以包括其他增强信息,例如利用用户界面的输入信息。
进一步地,智能语音助手将参数和信息输入至验证模块,输出多个输出变量,所述输出变量用于指示通过智能语音助手交互后确认相关用户的身份真实性,即验证结果。
S208,将所述相似度值和所述验证结果作为训练参数或修正参数,训练识别模型或修正识别模型。
在一些实施例中,将S204、S206得到的声纹信息的相似度值、智能语音助手对话同步数据、智能语音助手对话得到的用户反馈信息直接或间接的作为训练参数或修正参数,训练识别模型或修正识别模型;其中,间接作为训练参数或修正参数具体为:处理声纹信息的相似度值、智能语音助手对话同步数据、智能语音助手对话得到的用户反馈信息得到一组新的变量数据,将新的变量数据作为训练参数或修正参数。
在上述的实施例中,采用与智能语音助手、知识图谱相结合的身份识别的方法,实现对用户身份的进一步验证,该方法很大程度上能够识别用户是否存在欺诈风险,从而降低欺诈风险的概率。
在一些可选地实施例中,将声纹信息的相似度值、智能语音助手对话同步数据、智能语音助手对话得到的用户反馈信息输入至风控和反欺诈识别模型,用来修正风控和反欺诈识别的计算结果,提升风控和反欺诈识别的精度。在一种实施方式中,可以将S202-S206的验证结果直接生成反欺诈输出,也就是当用户无法通过验证模块时,直接输出验证结果为当前用户为欺诈人。
在一些可选的实施例中,如图9所示,给出了另一种图谱数据库结构的示意图;该图谱数据库中每个人包含的节点信息可能较图5所示的图谱数据库结构会有所不同,比如张明包含的节点信息有:声纹1、声纹2、电话1、位置1、生物姿态1等;***包含的节点信息有:声纹4、位置2、生物姿态2、生物姿态2等;张成包含的节点信息有:声纹3、电话3、位置3等;王东包含的节点信息有:声纹5、电话4、位置4、生物姿态4等;其中,位置信息是指利用包括IP、基站、Wi-Fi、身份证、手机号及银行卡等多维度的地理位置信息的信息库,精准定位网络访问者的信息,包括城市信息、经纬度信息及网络类型信息等,例如,在某***中主要是通过经纬度来表征;生物姿态信息是指通过客户端等途径采集到的用户在使用过程中的多项指标,如按压力度、设备仰角、手指触面、线性加速度、触点间隔等,由于不同设备的性能存在差异,例如性能差的设备只能采集压力度、设备仰角,但是无法采集到线性加速度;性能优异的设备按压力度、设备仰角、手指触面、线性加速度、触点间隔都可以采集到,所以使用生物姿态这个进项时根据设备的实际性能确定即可,可以使用一个指标来表征生物姿态信息,例如设备仰角;也可以多个指标来表征生物姿态,例如配合使用设备仰角、触点间隔等这里不做具体限定。
相应地,S206中生成至少一个验证策略对所述用户和所述用户关联人脉进行验证,可以具体包括:策略模块输出一验证策略为从图谱数据库中获取所述用户和所述用户关联人脉的空间数据进行验证;所述空间数据包括城市信息、经纬度信息和网络类型信息中的至少一种。
在一些实施例中,从图谱数据库中获取所述用户和所述用户关联人脉的空间数据进行验证的方法包括:计算所述用户和所述关联用户的空间相关性;若所述空间相关性小于预设第二阈值的次数大于预设值时,结合所述第一声纹信息与所述第二声纹信息的相似度值,输出验证结果。
具体地,从图谱数据库中获取用户和用户关联人脉的位置信息;在一些实施例中,策略模块从图谱数据库中获取张明的位置1经纬度数据(LonZM,LatZM),***的位置2经纬度数据(LonLQ,LatLQ)和张成的位置3经纬度数据(LonWD,LatLWD)发送至验证模块;
进一步地,验证模块计算得到张明和***、张成的空间相关性大小为Szm-lq和Szm-wd,计算两者间空间相关性可以有很多种方法,这里不做限定,在一种实施方式中,可以通过如下公式进行计算:
Szm-lq=R*arccos(C)*Pi/180
其中,
C=sin(LatZM)*sin(LatLQ)*cos(LonZM-LonLQ)+cos(LatZM)*cos(LatLQ),R为地球平均半径6371.004km。
同理,
Szm-wd=R*arccos(C)*Pi/180
其中,
C=sin(LatZM)*sin(LatWD)*cos(LonZM-LonWD)+cos(LatZM)*cos(LatWD),R为地球平均半径6371.004km。
随后验证模块分别将空间相关性Szm-lq和Szm-wd与预设第二阈值M’进行比较,第二阈值M’的设定可以根据历史统计数据或者经验值来设定。如果张明和***的空间相关性大小Szm-lq<M’,则认为张明和***两者间空间相关性很高;
进一步地,统计一段时间内空间相关性小于阈值的连续次数:由于在某一时刻两个账户间空间相关性存在一定偶然性,例如张明和***有可能是在一起参加聚会,所以可能需要统计一段时间内两个账户的空间相关性小于阈值的连续次数,当连续次数超过预设值N时,才认为这两者的时空相关性很高。预设值N的设定可以根据历史统计数据或者经验值来设定。
在一种实施例中,假设每天计算一次张明和***的空间相关性大小Szm-lq,连续N次计算的Szm-lq均小于M’,则认为张明和***的时空相关性很高,存在张明、***是同一个人的可能。
更进一步地,验证模块可以结合根据图谱数据库计算的空间相关性和声纹智能控制模块计算的声纹相似度对用户和用户关联人脉进行验证,并输出验证结果。
在一些实施例中,如图10所示,给出了一种策略模块工作示意图;策略模块验证方式包括但不限于:向用户和用户关联人脉同时发送验证消息;或者,按照一个预定义时间序列依次给用户、用户关联人脉发送消息;或者在一段时间内间隔给用户、用户关联人脉发送消息等;当然,策略模块还可以设定其他不同的策略,这里不做具体限定。策略模块生成至少一个验证策略,一个验证策略至少包含一组验证参数,例如发起验证时间、验证目标、验证内容等参数。具体的,上述反馈需求信息指示用户按照预设的模式来输入反馈信息,例如,反馈需求信息可以为要求用户在APP界面中点选多个预设类型的目标(例如图片中的汽车);再例如,反馈需求信息可以为通过短信息应用输入验证码等;其中,输入设备、发送时间、发送目标等变量构成了策略所生成的内容。
在一些实施例中,验证模块还可以根据获取到的所述用户和所述用户关联人脉的反馈信息生成验证反馈信息;根据所述验证反馈信息生成所述验证结果;所述验证反馈信息至少包括用户反馈相关信息和生物特征信息;其中,所述用户反馈相关信息具体为用户反馈行为信息和/或用户反馈信息本体。
进一步地,如图11所示,给出了一种验证模块验证步骤示意图;客户端通过接收用户和用户关联人脉的输入,并至少生成两组参数作为验证反馈信息;其中一组参数为用户反馈相关信息;另一组参数为生物特征信息,例如输入时间、输入间隔、设备仰角等信息;其中用户反馈相关信息包括用户反馈行为信息和/或用户反馈信息本体;本公开以生成三组参数为例进行说明。
相应地,验证模块用于根据接收到的反馈信息进行验证;其中需要接收到反馈消息包括三部分:第一部分为用户反馈的行为信息,比如不同用户反馈的时间长短;第二部分为每个用户对应设备的生物特征信息,比如按压力度、设备仰角、手指触面、线性加速度、触点间隔等;第三部分为用户反馈信息本体,即用户输入的数据;其中,用户的输入数据可以为结构化的数据,例如按照表单格式输入的个人信息;用户的输入数据也可以为非结构化的数据,例如用户输入的自由文本。
进一步地,验证模块基于用户反馈相关信息和生物特征信息验证是否是同一个人并输出验证结果;具体地,验证模块依次或同时判断用户反馈相关信息、生物特征信息的一致性。
在一些实施例中,根据获取到的所述用户和所述用户关联人脉的反馈信息计算反馈行为信息的时空关联度和生物特征信息相似性;根据所述时空关联度和所述生物特征信息相似度生成所述验证结果。
在一种实施方式中,验证模块可以通过如下方法进行验证:假如用户针对同时发送的验证消息要求的反馈不能同时完成操作或者用户操作间隔一致,并且生物信息具有较高的一致性,则输出的验证结果为同一用户;在另外一种情况中,假如按照一个预定义时间序列发送消息,若返回顺序跟发送顺序完全一致并且间隔接近,并且生物信息具有较高的一致性,则输出的验证结果为同一用户;在一种实施方式中,在一段时间内间隔发送消息,若回复时间在同一个时间点,则输出的验证结果为同一用户;当然,验证模块的验证原则如何设置这里不做限定,仅提供几种可能的方式进行参考。
在一个真实验证过程中,多个账户是由多个真实的用户控制,策略模块发送较强模式的验证策略,需要用户输入对应的反馈,而多个申请人的操作具有随机性,因此反馈信息将呈现随机化的结果;然而,在欺诈行为下,多个账户为单个人操控,其反馈也将存在较强的一致性,因此检测模块能够根据多个维度信息中呈现的较强模式,识别处潜在的欺诈行为。
在一种实施方式中,验证模块还可以通过如下方法进行验证:根据用户反馈信息计算用户和用户关联人脉的反馈行为信息的时空关联度,并进一步计算生物特征信息的相似性,并根据两者计算结果得到验证结果,即用户识别结果;此处,时空关联度计算取值与所选取的发送策略的复杂度相关,这是由于在一个发送策略下,正常用户的反馈时空关联度由多个独立用户控制,因此将呈现较为随机的分布;例如在一种策略中,***按一定时间间隔发送验证信息,此时在多个真实用户反馈下,反馈信息的时间和地点将呈现完全随机化的结果。其中,时空关联度计算可以计算多个变量,例如接收顺序与发送顺序的相关度、多个账户反馈信息的接收时间关联度、多个账户反馈信息的空间关联度等。
在另外一种实施方式中,客户端通过接收不同用户的输入,至少生成两组参数作为反馈信息,将反馈信息分别输入至信息校验模块、信息交叉验证模块,得到用户信息真实性评估得分,该评分可以与前述的用户反馈相关信息、生物特征信息一起作为验证模块的输入,所述验证模块生成最终的验证结果输出。
进一步地,所述信息校验模块可以通过访问第三方数据库的数据和/或图谱数据库,对用户信息进行二次确认,由于策略模块发送了多个验证策略,则意味着信息校验模块将一次性得到多个账户的校验信息,对多个校验结果计算得到信息校验评分。
进一步地,信息交叉验证模块为对多个用户的关系进行交叉验证。例如,如果大量用户存在共同推荐人A,则策略模块发送的验证策略中包括向多个用户发送推荐人A的个人信息请求,其中,该个人信息可以为图谱数据库中不存在的个人数据;此时,信息交叉验证模块根据多个用户输入信息的一致性生成交叉验证评分。在具体实施中,可以设置用户反馈截止日期,抛弃截止日期以外的数据,确保反馈信息为用户即时反馈而非进一步伪造数据。
更进一步地,将信息校验评分和交叉验证评分输入至验证模块,验证模块结合用户反馈行为数据和生物特征数据共同完成用户的识别。
相应地,在一些实施例中,***将得到的时空相关性、用户反馈行为、生物特征信息和验证结果直接或间接的作为训练参数或修正参数,训练识别模型或修正识别模型;其中,间接作为训练参数或修正参数具体为:处理时空相关性、用户反馈行为、生物特征信息和验证结果得到一组新的变量数据,将新的变量数据作为训练参数或修正参数。
在一些可选地实施例中,将时空相关性、用户反馈行为、生物特征信息和验证结果输入至风控和反欺诈识别模型,用来修正风控和反欺诈识别的计算结果,提升风控和反欺诈识别的精度。在一种实施方式中,可以将S202-S206的验证结果直接生成反欺诈输出,也就是当用户无法通过验证模块时,直接输出验证结果为当前用户为欺诈人。
本公开的实施例还通过采用与生物特征、个人信息与知识图谱相结合的身份识别的方法,该方法很大程度上能够识别用户是否存在欺诈风险,从而降低欺诈风险的概率。
通过以上方法,方便快捷的实现身份识别的进一步验证,大大提高了身份识别精确度,安全度大幅提升,用户体验良好;而且整个金融大数据***仍然保持自动化运行的状态,而无需风控人员的干预。
以上是本公开提供的一种身份识别的方法的具体实施方式。
图12是根据本公开的一些实施例所示的一种身份识别的装置示意图。如图12所示,身份识别的装置300包括声纹获取单元302、计算单元304、验证单元306和提升精度单元308;其中,
声纹获取单元302,用于获取用户的第一声纹信息和所述用户关联人脉的第二声纹信息;
计算单元304,用于计算所述第一声纹信息与所述第二声纹信息的相似度值;
验证单元306,用于若所述相似度值小于预设第一阈值,则生成至少一个验证策略对所述用户和所述用户关联人脉进行验证,生成验证结果;
提升精度单元308,用于将所述相似度值和所述验证结果作为训练参数或修正参数,训练识别模型或修正识别模型。
在一些实施例中,所述声纹获取单元302具体用于通过获取所述第一声纹信息,并根据所述第一声纹信息获取所述第二声纹信息。
在一些实施例中,所述声纹获取单元302具体用于通过智能语音助手获取用户的实时声纹信息,并根据所述实时声纹信息获取所述第一声纹信息和所述第二声纹信息。
具体地,所述声纹获取单元302通过所述智能语音助手将所述实时声纹信息发送至声纹智能控制模块;当所述声纹智能控制模块分析所述用户处于活跃状态时,从图谱数据库中获取所述用户预存的所述第一声纹信息和所述关联人脉的第二声纹信息。
在一些实施例中,所述声纹获取单元302获取的所述第一声纹信息和/或第二声纹信息中均至少包括一个声纹特征值;
所述计算单元304,具体用于根据所述第一声纹信息的第一声纹特征值和所述第二声纹信息的第二声纹特征值计算所述相似度值。
在一些实施例中,所述计算单元304计算所述相似度值的方法包括:欧氏距离方法、曼哈顿距离方法、标准化欧氏距离方法和夹角余弦方法中的至少一种。
在一些实施例中,所述验证单元306,用于通过检测所述用户和所述用户的关联人脉的状态生成至少一个所述验证策略。
在一些实施例中,所述验证单元306生成的验证策略具体为:通过智能语音助手同时向所述用户和所述用户关联人脉发起语音通话。
可选地,所述验证单元306生成的所述验证策略中至少包括控制对话流参数;其中,所述控制对话流参数至少包括对话内容和问答逻辑中的至少一个。
可选地,所述验证单元306生成的所述验证策略中至少包括控制对话流参数;其中,所述控制对话流参数至少包括对话内容和问答逻辑中的至少一个。
进一步地,所述验证单元306生成的所述验证策略还用于控制所述智能语音助手输出语音相关信息参数;所述语音相关信息参数包括语音输入参数、语音信号识别出的文本信息中的至少一个。
在一些实施例中,所述验证单元306还用于接收验证反馈信息,根据所述验证反馈信息生成验证结果。
在一些实施例中,所述验证单元306接收的所述验证反馈信息,具体为语音相关信息参数;其中,所述语音相关信息参数包括语音输入参数、语音信号识别出的文本信息中的至少一个。
进一步地,所述验证单元306生成的验证策略具体为:从图谱数据库中获取所述用户和所述用户关联人脉的空间数据进行验证。
在一些实施例中,所述空间数据包括城市信息、经纬度信息和网络类型信息中的至少一种。
在一些实施例中,所述验证单元306包括:
计算空间相关性子单元,用于计算所述用户和所述关联用户的空间相关性;
验证子单元,用于比较若所述空间相关性小于预设第二阈值的次数大于预设值时,结合所述第一声纹信息与所述第二声纹信息的相似度值,输出验证结果。
可选地,所述验证单元306生成的验证策略至少包含验证参数;其中,所述验证参数包括发起验证时间、验证目标和验证内容中的至少一个。
在一些实施例中,所述验证单元306具体用于:根据获取到的所述用户和所述用户关联人脉的反馈信息生成验证反馈信息;根据所述验证反馈信息生成所述验证结果。
优选地,所述验证反馈信息至少包括用户反馈相关信息和生物特征信息;其中,所述用户反馈相关信息具体为用户反馈行为信息和/或用户反馈信息本体。
优选地,所述验证单元306具体用于根据获取到的所述用户和所述用户关联人脉的反馈信息计算反馈行为信息的时空关联度和生物特征信息相似性;根据所述时空关联度和所述生物特征信息相似度生成所述验证结果。
所述验证单元306还用于根据获取到的所述用户和所述用户关联人脉的反馈信息生成信息校验评分和/或交叉验证评分。
优选地,所述验证单元306还用于根据所述验证反馈信息、信息校验评分和/或交叉验证评分生成所述验证结果;
或者,根据所述时空关联度、所述生物特征信息相似度、信息校验评分和/或交叉验证评分生成所述验证结果。
在一些实施例中,所述提升精度单元308,具体用于将所述相似度值和所述验证结果直接或间接的作为训练参数或修正参数。
具体地,所述提升精度单元308具体用于处理所述相似度值和所述验证结果得到新的变量数据,将所述新的变量数据作为训练参数或修正参数。
参考附图13,为本申请一个实施例提供的电子设备示意图。如图13所示,该电子设备500包括:
存储器530以及一个或多个处理器510;
其中,所述存储器530与所述一个或多个处理器510通信连接,所述存储器530中存储有可被所述一个或多个处理器执行的指令532,所述指令532被所述一个或多个处理器510执行,以使所述一个或多个处理器510执行本申请前述实施例中的方法。
具体地,处理器510和存储器530可以通过总线或者其他方式连接,图13中以通过总线540连接为例。处理器510可以为中央处理器(Central Processing Unit,CPU)。处理器510还可以为其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。
存储器530作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块,如本申请实施例中的级联渐进网络等。处理器510通过运行存储在存储器530中的非暂态软件程序、指令以及模块532,从而执行处理器的各种功能应用以及数据处理。
存储器530可以包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需要的应用程序;存储数据区可存储处理器510所创建的数据等。此外,存储器530可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器530可选包括相对于处理器510远程设置的存储器,这些远程存储器可以通过网络(比如通过通信接口520)连接至处理器510。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
本申请的一个实施例还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机可执行指令,所述计算机可执行指令被执行后执行本申请前述实施例中的方法。
前述的计算机可读取存储介质包括以存储如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方式或技术来实现的物理易失性和非易失性、可移动和不可移动介质。计算机可读取存储介质具体包括,但不限于,U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、可擦除可编程只读存储器(EPROM)、电可擦可编程只读存储器(EEPROM)、闪存或其他固态存储器技术、CD-ROM、数字多功能盘(DVD)、HD-DVD、蓝光(Blue-Ray)或其他光存储设备、磁带、磁盘存储或其他磁性存储设备、或能用于存储所需信息且可以由计算机访问的任何其他介质。
尽管此处所述的主题是在结合操作***和应用程序在计算机***上的执行而执行的一般上下文中提供的,但本领域技术人员可以认识到,还可结合其他类型的程序模块来执行其他实现。一般而言,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、组件、数据结构和其他类型的结构。本领域技术人员可以理解,此处所述的本主题可以使用其他计算机***配置来实践,包括手持式设备、多处理器***、基于微处理器或可编程消费电子产品、小型计算机、大型计算机等,也可使用在其中任务由通过通信网络连接的远程处理设备执行的分布式计算环境中。在分布式计算环境中,程序模块可位于本地和远程存储器存储设备的两者中。
本领域普通技术人员可以意识到,结合本文中所本申请的实施例描述的各示例的单元及方法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对原有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。
综上所述,本公开提出了一种身份识别的方法、装置、电子设备及其计算机可读存储介质。本公开实施例通过比较用户和用户关联人的声纹信息,生成至少一个验证策略,对用户和用户关联人脉进行身份识别和验证,同时将生成的声纹相似度值和验证结果作为识别模型的训练参数或修正参数,方便快捷的实现身份识别,大大提高了身份识别精确度,安全度大幅提升,用户体验良好。
此外,本公开实施例还通过采用与智能语音助手、知识图谱相结合的身份识别的方法,该方法很大程度上能够识别用户是否存在欺诈风险,从而降低欺诈风险的概率。
应当理解的是,本公开的上述具体实施方式仅仅用于示例性说明或解释本公开的原理,而不构成对本公开的限制。因此,在不偏离本公开的精神和范围的情况下所做的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。此外,本公开所附权利要求旨在涵盖落入所附权利要求范围和边界、或者这种范围和边界的等同形式内的全部变化和修改例。
Claims (10)
1.一种身份识别的方法,其特征在于,包括:
语音助手接收用户语音输入并提取所述用户的声纹特征,将所述用户的声纹特征保存在图谱数据库节点中,所述图谱数据库按现实世界中的实体与关系来存储数据,不同的实体对应于不同的节点,不同的实体间通过人脉关系来完成连接,将在图谱数据库中获取的用户预存的声纹信息作为第一声纹信息,将用户关联人脉的声纹信息作为第二声纹信息;
获取用户的第一声纹信息和所述用户关联人脉的第二声纹信息;
计算所述第一声纹信息与所述第二声纹信息的相似度值;
若所述相似度值小于预设第一阈值,则生成至少一个验证策略对所述用户和所述用户关联人脉进行验证,至少一个所述验证策略中至少包含一组控制对话参数或控制对话流参数中任意一组参数,其中,所述控制对话参数包括发起语音对话的时间、对话目标、对话通道中的至少一个,控制对话流参数包含了对话的内容、问答逻辑中的至少一个,生成验证结果;
将所述相似度值和所述验证结果作为训练参数或修正参数,训练识别模型或修正识别模型。
2.根据权利要求1所述的身份识别的方法,其特征在于,所述方法还包括:
计算所述用户和关联用户的空间相关性;
若所述空间相关性小于预设第二阈值的次数大于预设值时,结合所述第一声纹信息与所述第二声纹信息的相似度值,输出验证结果。
3.根据权利要求1所述的身份识别的方法,其特征在于,所述方法还包括:
根据获取到的所述用户和所述用户关联人脉的反馈信息生成验证反馈信息;
根据所述验证反馈信息生成所述验证结果。
4.根据权利要求1所述的身份识别的方法,其特征在于,所述方法还包括:
根据获取到的所述用户和所述用户关联人脉的反馈信息计算反馈行为信息的时空关联度和生物特征信息相似性;
根据所述时空关联度和所述生物特征信息相似度生成所述验证结果。
5.根据权利要求1所述的身份识别的方法,其特征在于,所述将所述相似度值和所述验证结果作为训练参数或修正参数具体包括:
将所述相似度值和所述验证结果直接作为训练参数或修正参数;
或者,处理所述相似度值和所述验证结果得到新的变量数据,将所述新的变量数据作为训练参数或修正参数。
6.一种身份识别的装置,其特征在于,包括:
图谱数据库单元,用于提供语音助手接收用户语音输入并提取所述用户的声纹特征,将所述用户的声纹特征保存在图谱数据库节点中,所述图谱数据库按现实世界中的实体与关系来存储数据,不同的实体对应于不同的节点,不同的实体间通过人脉关系来完成连接,将在图谱数据库中获取的用户预存的声纹信息作为第一声纹信息,将用户关联人脉的声纹信息作为第二声纹信息;
声纹获取单元,用于获取用户的第一声纹信息和所述用户关联人脉的第二声纹信息;
计算单元,用于计算所述第一声纹信息与所述第二声纹信息的相似度值;
验证单元,用于若所述相似度值小于预设第一阈值,则生成至少一个验证策略对所述用户和所述用户关联人脉进行验证,至少一个所述验证策略中至少包含一组控制对话参数或控制对话流参数中任意一组参数,其中,所述控制对话参数包括发起语音对话的时间、对话目标、对话通道中的至少一个,控制对话流参数包含了对话的内容、问答逻辑中的至少一个,生成验证结果;
提升精度单元,用于将所述相似度值和所述验证结果作为训练参数或修正参数,训练识别模型或修正识别模型。
7.根据权利要求6所述的装置,其特征在于,所述验证单元包括:
空间相关性子单元,用于计算所述用户和关联用户的空间相关性;
验证子单元,用于在所述空间相关性小于预设第二阈值的次数大于预设值时,结合所述第一声纹信息与所述第二声纹信息的相似度值,输出验证结果。
8.根据权利要求6所述的装置,其特征在于,所述验证单元还用于:
根据获取到的所述用户和所述用户关联人脉的反馈信息生成验证反馈信息;
根据所述验证反馈信息生成所述验证结果。
9.根据权利要求6所述的装置,其特征在于,所述验证单元还用于:
根据获取到的所述用户和所述用户关联人脉的反馈信息计算反馈行为信息的时空关联度和生物特征信息相似性;
根据所述时空关联度和所述生物特征信息相似度生成所述验证结果。
10.根据权利要求6所述的装置,其特征在于,所述提升精度单元还用于:
将所述相似度值和所述验证结果直接作为训练参数或修正参数;
或者,处理所述相似度值和所述验证结果得到新的变量数据,将所述新的变量数据作为训练参数或修正参数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911002444.8A CN110750774B (zh) | 2019-10-21 | 2019-10-21 | 身份识别的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911002444.8A CN110750774B (zh) | 2019-10-21 | 2019-10-21 | 身份识别的方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110750774A CN110750774A (zh) | 2020-02-04 |
CN110750774B true CN110750774B (zh) | 2021-12-03 |
Family
ID=69279193
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911002444.8A Active CN110750774B (zh) | 2019-10-21 | 2019-10-21 | 身份识别的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110750774B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111324878A (zh) * | 2020-02-05 | 2020-06-23 | 重庆特斯联智慧科技股份有限公司 | 一种基于人脸识别的身份验证方法、装置、存储介质及终端 |
CN111325267B (zh) * | 2020-02-18 | 2024-02-13 | 京东城市(北京)数字科技有限公司 | 数据融合方法、装置和计算机可读存储介质 |
TWI752474B (zh) * | 2020-04-22 | 2022-01-11 | 莊連豪 | 無障礙智能語音系統及其控制方法 |
CN113689291B (zh) * | 2021-09-22 | 2022-11-01 | 杭银消费金融股份有限公司 | 基于异常移动的反欺诈识别方法及*** |
CN116993371A (zh) * | 2023-09-25 | 2023-11-03 | 中邮消费金融有限公司 | 一种基于生物特征的异常检测方法及*** |
CN117493618B (zh) * | 2023-12-29 | 2024-04-09 | 深圳市加推科技有限公司 | 一种基于人脉图谱的客户关系管理方法、装置及相关介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105391594A (zh) * | 2014-09-03 | 2016-03-09 | 阿里巴巴集团控股有限公司 | 识别特征账号的方法及装置 |
US9837079B2 (en) * | 2012-11-09 | 2017-12-05 | Mattersight Corporation | Methods and apparatus for identifying fraudulent callers |
CN109035010A (zh) * | 2018-05-25 | 2018-12-18 | 中国地质大学(武汉) | 针对区块链密码货币可疑交易和可疑账户分析方法及*** |
CN109753778A (zh) * | 2018-12-30 | 2019-05-14 | 北京城市网邻信息技术有限公司 | 用户的审核方法、装置、设备及存储介质 |
CN110110093A (zh) * | 2019-04-08 | 2019-08-09 | 深圳众赢维融科技有限公司 | 一种基于知识图谱的识别方法、装置、电子设备及存储介质 |
-
2019
- 2019-10-21 CN CN201911002444.8A patent/CN110750774B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9837079B2 (en) * | 2012-11-09 | 2017-12-05 | Mattersight Corporation | Methods and apparatus for identifying fraudulent callers |
CN105391594A (zh) * | 2014-09-03 | 2016-03-09 | 阿里巴巴集团控股有限公司 | 识别特征账号的方法及装置 |
CN109035010A (zh) * | 2018-05-25 | 2018-12-18 | 中国地质大学(武汉) | 针对区块链密码货币可疑交易和可疑账户分析方法及*** |
CN109753778A (zh) * | 2018-12-30 | 2019-05-14 | 北京城市网邻信息技术有限公司 | 用户的审核方法、装置、设备及存储介质 |
CN110110093A (zh) * | 2019-04-08 | 2019-08-09 | 深圳众赢维融科技有限公司 | 一种基于知识图谱的识别方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN110750774A (zh) | 2020-02-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110750774B (zh) | 身份识别的方法及装置 | |
AU2013203139B2 (en) | Voice authentication and speech recognition system and method | |
WO2018113526A1 (zh) | 基于人脸识别和声纹识别的交互式认证***及方法 | |
US8209174B2 (en) | Speaker verification system | |
CN111883140B (zh) | 基于知识图谱和声纹识别的认证方法、装置、设备及介质 | |
US20110320202A1 (en) | Location verification system using sound templates | |
AU2013203139A1 (en) | Voice authentication and speech recognition system and method | |
US20170294192A1 (en) | Classifying Signals Using Mutual Information | |
CN104835497A (zh) | 一种基于动态口令的声纹打卡***及方法 | |
US10909991B2 (en) | System for text-dependent speaker recognition and method thereof | |
CN103207961A (zh) | 用户验证方法和装置 | |
CN113823293B (zh) | 一种基于语音增强的说话人识别方法及*** | |
KR100779242B1 (ko) | 음성 인식/화자 인식 통합 시스템에서의 화자 인식 방법 | |
CN112309372B (zh) | 基于语调的意图识别方法、装置、设备及存储介质 | |
JP2021064110A (ja) | 音声認証装置、音声認証システム、および音声認証方法 | |
US20050232470A1 (en) | Method and apparatus for determining the identity of a user by narrowing down from user groups | |
Vivaracho-Pascual et al. | Client threshold prediction in biometric signature recognition by means of Multiple Linear Regression and its use for score normalization | |
JP2003302999A (ja) | 音声による個人認証システム | |
Samal et al. | On the use of MFCC feature vector clustering for efficient text dependent speaker recognition | |
US20220366916A1 (en) | Access control system | |
Gupta et al. | Text dependent voice based biometric authentication system using spectrum analysis and image acquisition | |
CN113593580A (zh) | 一种声纹识别方法及装置 | |
Pinheiro et al. | Type-2 fuzzy GMM-UBM for text-independent speaker verification | |
CN204496911U (zh) | 一种基于动态口令的声纹打卡装置 | |
Tsang et al. | Speaker verification using type-2 fuzzy gaussian mixture models |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20220613 Address after: 510000 floor 7, building S6, poly Yuzhu port, No. 848, Huangpu Avenue East, Huangpu District, Guangzhou, Guangdong Patentee after: Jianlian Technology (Guangdong) Co.,Ltd. Address before: 510623 Room 201, building a, No. 1, Qianwan 1st Road, Qianhai Shenzhen Hong Kong cooperation zone, Shenzhen, Guangdong Patentee before: SHENZHEN ZHONGYING WEIRONG TECHNOLOGY Co.,Ltd. |