CN113515643A

CN113515643A - 用户身份核实方法及装置

Info

Publication number: CN113515643A
Application number: CN202110543819.2A
Authority: CN
Inventors: 董鑫; 黄炎哲; 初敏
Original assignee: Sipic Technology Co Ltd
Current assignee: Sipic Technology Co Ltd
Priority date: 2021-05-19
Filing date: 2021-05-19
Publication date: 2021-10-19

Abstract

本发明公开一种用户身份核实方法及装置。在该方法中，获取待核身份的目标用户的用户资料信息；基于所述用户资料信息和预设的知识图谱，确定用户问答知识库；其中，所述用户问答知识库包含针对所述目标用户的多个问题和相应的标准答案；基于所述用户问答知识库中的第一问题对所述目标用户进行语音回访，并检测针对所述第一问题的用户反馈语音；基于所述用户问答知识库中与所述第一问题对应的第一标准答案和所述用户反馈语音，评估所述目标用户的身份的可靠性。由此，通过融合知识图谱技术和语音识别技术，可以智能地对用户进行核身。

Description

用户身份核实方法及装置

技术领域

本发明属于互联网技术领域，尤其涉及一种用户身份核实方法及装置。

背景技术

客户在金融机构提出贷款申请、***申请、参保申请、证券开户申请等后，金融机构会对客户的身份进行核验，确保客户在申请时填写内容、证件信息等是本人的真实情况。

目前，核身方式主要有两种：一是传统线下方式，主要是人工核查，由人工审核员核查相关材料，并致电申请人，通过申请资料对客户进行提问来进行人工审查；二是线上方式，通过人脸识别、活体检测、证件OCR技术等个技术对比技术，确保申请人的真实身份。

然而，目前金融行业的核身方法时有如下缺点：其一，人工核查方式耗费人力、时间，效率低。金融机构需要对人工审核员进行专门培训才能保证审核内容的有效性；人工审核员在核对申请资料时也可能因为疏漏而将客户的信息匹配错误；一个人工审核员一次只能审核一个客户，不能同时审核多个客户。其二，人脸识别的验证方式虽然能在一定程度上规避人工核查的缺陷，但是核对的信息单一，仅能核对本人与证件照片是否一致，而无法核对其他信息，比如学历、工作情况等。对于使用他人证件的申请人，在被审核时容易存在作弊途径，将导致金融机构的审核疏漏，从而带来隐患。针对上述问题，目前业界暂时并未提供较佳的解决方案。

发明内容

本发明实施例提供一种用户身份核实方法及装置，用于至少解决上述技术问题之一。

第一方面，本发明实施例提供一种用户身份核实方法，包括：获取待核身份的目标用户的用户资料信息；基于所述用户资料信息和预设的知识图谱，确定用户问答知识库；其中，所述用户问答知识库包含针对所述目标用户的多个问题和相应的标准答案；基于所述用户问答知识库中的第一问题对所述目标用户进行语音回访，并检测针对所述第一问题的用户反馈语音；基于所述用户反馈语音和所述用户问答知识库中与所述第一问题对应的第一标准答案，评估所述目标用户的身份的可靠性。

第二方面，本发明实施例提供一种用户身份核实装置，包括：用户资料获取单元，被配置为获取待核身份的目标用户的用户资料信息；问答库构建单元，被配置为基于所述用户资料信息和预设的知识图谱，确定用户问答知识库；其中，所述用户问答知识库包含针对所述目标用户的多个问题和相应的标准答案；语音回访单元，被配置为基于所述用户问答知识库中的第一问题对所述目标用户进行语音回访，并检测针对所述第一问题的用户反馈语音；身份核实单元，被配置为基于所述用户反馈语音和所述用户问答知识库中与所述第一问题对应的第一标准答案，评估所述目标用户的身份的可靠性。

第三方面，本发明实施例提供一种网关设备，其包括：至少一个处理器，以及与所述至少一个处理器通信连接的存储器，其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行上述方法的步骤。

第四方面，本发明实施例提供一种存储介质，其上存储有计算机程序，该程序被处理器执行时实现上述方法的步骤。

本发明实施例的有益效果在于：

在待核身份的目标用户上传用户资料信息之后，可以调用知识图谱来确定针对此目标用户的问答知识库，利用问答知识库中的问题来对目标用户进行语音回访而得到相应的用户反馈语音，并结合问答知识库中的答案来进行评估，从而得到目标用户的身份是否可靠的识别结果。由此，通过融合知识图谱技术和语音识别技术，实现智能地对用户进行核身。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1示出了根据本发明实施例的用户身份核实方法的一示例的流程图；

图2示出了根据本发明实施例的基于用户资料信息和知识图谱确定用户问答知识库的一示例的流程图；

图3A示出了根据本发明实施例的针对“高校”实体的一示例的知识图谱；

图3B示出了根据本发明实施例的针对“公司”实体的一示例的知识图谱；

图3C示出了根据本发明实施例的利用问题-答案生成器生成问答知识库的过程的一示例的示意图；

图4示出了根据本发明实施例的根据目标问题模板确定用户变量问题的一示例的流程图；

图5示出了根据本发明实施例的评估目标用户的身份的可靠性的一示例的流程图；

图6示出了根据本发明实施例的综合多维度信息来评估目标用户的身份的可靠性的一示例的流程图；

图7示出了根据本发明实施例的对话式人工智能驱动的智能核身***的一示例的架构示意图；

图8示出了根据本发明实施例的用户身份核实装置的一示例的架构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

需要说明的是，在不冲突的情况下，本发明中的实施例及实施例中的特征可以相互组合。

本发明可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、元件、数据结构等等。也可以在分布式计算环境中实践本发明，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

在本发明中，“模块”、“***”等等指应用于计算机的相关实体，如硬件、硬件和软件的组合、软件或执行中的软件等。详细地说，例如，元件可以、但不限于是运行于处理器的过程、处理器、对象、可执行元件、执行线程、程序和/或计算机。还有，运行于服务器上的应用程序或脚本程序、服务器都可以是元件。一个或多个元件可在执行的过程和/或线程中，并且元件可以在一台计算机上本地化和/或分布在两台或多台计算机之间，并可以由各种计算机可读介质运行。元件还可以根据具有一个或多个数据包的信号，例如，来自一个与本地***、分布式***中另一元件交互的，和/或在因特网的网络通过信号与其它***交互的数据的信号通过本地和/或远程过程来进行通信。

最后，还需要说明的是，在本文中，术语“包括”、“包含”，不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

目前，随着互联网的蓬勃发展，盗用他人信息牟取利益的事件数量日益上升。一些银行信贷风控产品可以实现对客户信用/风险的评估，但在金融核身场景中会存在如下缺点：其一，大部分人脸核身平台都是以人脸识别维度来对客户身份进行验证，并不能对客户提交的其他材料进行审核；其二，很多平台只是提供底层的语音识别、语义理解、知识图谱等底层技术，难以针对不用客户定制相应的问答知识库。

在本发明实施例中，借助知识图谱与自然语言处理技术，大大提高了问题定制的可行性与有效性。

图1示出了根据本发明实施例的用户身份核实方法的一示例的流程图。需说明的是，本发明的方法实施例的执行主体可以是各种类型的电子设备，例如服务器、台式机或笔记本电脑等，在此应不加限制。

如图1所示，在步骤110中，获取待核身份的目标用户的用户资料信息。例如，用户可以对客户端(例如，核身机器人)进行交互操作来输入用户资料，以上传相应的用户资料信息。

这里，用户身份核实的业务应用场景可能是多样化的，在此应不加限制，例如在互联网金融业务场景中，用户可以填写用户资料并发起贷款申请请求。

在步骤120中，基于用户资料信息和预设的知识图谱，确定用户问答知识库。在本文中，术语“知识图谱”(Knowledge Graph)表示知识域可视化或知识领域映射地图，是显示知识发展进程与结构关系的一系列各种不同的图形，用可视化技术描述知识资源及其载体，挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。另外，知识图谱可以表示利用大数据分析所确定的针对各类用户实体(例如，公司实体集合和个人实体集合等)的知识图谱，可以充分挖掘并展示实体之间的关联信息。

这里，用户问答知识库包含针对目标用户的多个问题和相应的标准答案。示例性地，可以在用户资料信息中解析变量(例如，用户工作单位)，并利用变量和知识图谱来构建相应的标准问答数据(例如，问题：用户工作单位是什么？—标准答案：A公司)。

示例性地，在构建问答知识库时，可以借助已经构建好的知识图谱，通过自然语言理解、自然语言生成等技术构建相关的问题。比如，如果客户提供材料显示毕业于北京邮电大学信息与通信工程学院，通过构建的实体-关系-实体三元组样例，可以生成问题：“北京邮电大学信息与通信工程学院的一级学科是什么？”。

在步骤130中，基于用户问答知识库中的第一问题对目标用户进行语音回访，并检测针对第一问题的用户反馈语音。这里，可以使用语音对话机器人对客户进行电话外呼，介绍电话来意后，从问答知识库中挑选多道问题，并通过已设计好的问题来询问客户，对客户的回答进行记录。

在本发明实施例的一个示例中，用户资料信息中可以包含用户的联系信息，并且依据联系信息来对目标用户进行语音回访，进而，可以调用麦克风来采集相应的用户反馈语音。在本发明实施例的另一示例中，用户通过操作核身机器人上传资料，并可以通过此核身机器人来接收相应的回访语音，进行语音交互操作。

在步骤140中，基于用户反馈语音和用户问答知识库中与第一问题对应的第一标准答案，评估目标用户的身份的可靠性。

通过本发明实施例，基于知识图谱对不同目标用户分别构建相应的用户问答知识库，并利用问答知识库中的问题来对用户进行语音回访以采集用户反馈语音，结合问答知识库中的答案来验证用户反馈语音，可以有效核实目标用户的身份。

图2示出了根据本发明实施例的基于用户资料信息和知识图谱确定用户问答知识库的一示例的流程图。

如图2所示，在步骤210中，根据用户资料信息，确定相应的多个用户变量。具体地，可以结合具有多个预设变量的变量模板(如表1所示)和用户资料信息，从而确定相应的多个用户变量。示例性地，变量模板中可以存在“学校”、“公司”、“毕业年份”等多个预设变量，而用户资料信息中只有学校信息而没有公司信息，相应地在所确定的用户变量中可以不含变量“公司”，例如可以基于变量“学校”挖掘相应的问答知识点。

变量	含义
		${IDcard}	身份证号
${Phonenum}	电话号码
		${University}	高校
${Academy}	学院
		${Graduation_year}	毕业年份
${Company}	公司
		……	……

表1 示例性的变量模板表

在步骤220中，根据预设的多个问题模板中与各个用户变量相匹配的目标问题模板，确定用户变量问题。示例性地，在变量模板中的每个变量分别存在相应的问题模板，可以直接通过用户变量匹配来找到相应的目标问题模板。举例来说，与变量“学校”相应的问题模板可以是“您的毕业院校的校长是？”，与变量“公司”相应的问题模板可以是“您所在的公司的CEO是？”。

在步骤230中，根据知识图谱中对应各个用户变量的实体内容信息，确定用户变量标准答案。这里，知识图谱包括多个实体和相应的实体内容信息，并且实体内容信息包含实体属性信息和/或实体关系信息。

具体地，知识图谱本质上是一种语义网络，以结构化的形式描述客观世界中概念、实体及其关系，在一些示例中，知识图谱中的基本元素可以包含实体、属性、关系。图3A示出了根据本发明实施例的针对“高校”实体的一示例的知识图谱。图3B示出了根据本发明实施例的针对“公司”实体的一示例的知识图谱。

如图3A和3B所示，知识图谱中的圆形可以被用来描述相应的对象，例如一所高校、一家公司等。知识图谱中的长方形可以表示实体属性，其用于描述实体的相关属性，比如高校校长的性别、公司的成立日期等。知识图谱中的连线可以表示实体关系，其用于描述将多个实体联系起来，比如某高校所在城市是某地，某公司的首席执行官是某人等。优选地，在客户提交发明材料时，经常包含高校、公司、省市等主要实体集合，可以通过综合实体的联系与属性，有助于生成更加灵活的问题。

如图3A所示，以高校实体集合中的“北京邮电大学”为例，可以通过校区地址、院系名称、学科名称、专业名称校长姓名等一系列关系或属性与其它实体或者属性值建立联系。如图3B所示，以公司实体集合中的“思必驰公司”为例，其关系有公司首席执行官、总部所在城市、产品等；属性有创建时间等。进而，通过思必驰执行官还可以得到与剑桥大学、英国等实体的联系。

示例性地，在构建知识图谱时，可以结合信息获取、知识融合、知识处理，而形成有关系、属性连接的知识结构。针对如图3A的示例，对于现有信息“北京邮电大学信息与通信工程学院以信息科技为特色，在全国信息通信领域享有很高的声誉。重点建设的一级学科‘信息与通信工程’是国家级重点学科”，可以提取到“北京邮电大学”“信息与通信工程学院”、“一级学科”、“信息与通信工程”等实体；“信息与通信工程学院”是“北京邮电大学”的学院，“信息与通信工程”是“北京邮电大学”的“信息与通信工程学院”的一级学科。以此类推，建立“北京邮电大学”的知识结构。

继续上文中的示例，可以结合表1中的变量而生成相应的问题模板。这里，问题模板可以被分类为事实陈述性问题和知识图谱类定制问题。

表2 事实陈述性问题

在如表2所示的事实陈述性问题中，可以通过客户提交材料中的身份证号、电话号码、毕业学校、所在公司等信息对客户进行简单提问，并以材料中的内容为标准答案，将标准答案记录在不同变量中。

表3 知识图谱类定制问题

在如表3所示的知识图谱类定制问题中，在问题模板中设有变量，并可以借助知识图谱，获取与变量更多相关的实体、属性、关系，从而生成更加灵活和有针对性的问题。

在步骤240中，根据各个用户变量问题和相应的用户变量标准答案，构建用户问答知识库。

图3C示出了根据本发明实施例的利用问题-答案生成器生成问答知识库的过程的一示例的示意图。

如图3C所示，问题-答案生成器的输入主要包括构建好的知识图谱、客户提交信息和问题模板，其输出主要包括问题、答案。由此，可以利用已构建好的知识图谱、客户提交信息、问题模板生成相应的定制问题与答案。

示例性地，如果客户提交的材料中显示他是2020年从北京邮电大学信息与通信工程学院毕业的学生，可以获知变量${University}＝北京邮电大学，${Academy}＝信息与通信工程学院，${Graduation_year}＝2020。根据表3，除了询问身份证号和手机号码等常规问题，还可以生成如下定制问题：“您在校期间北京邮电大学的校长是谁？”、“您在校期间北京邮电大学信息与通信工程学院的学科有？”来核查客户提交的学历信息。通过知识图谱，可以找到对应问题的标准答案分别为：“乔建永”、“信息与通信工程/电子信息”。

通过本发明实施例，基于用户资料信息提取用户变量，并利用用户变量在知识图谱中挖掘问题和相应的标准答案，可以实现自动构建与用户相关的问答知识库。

图4示出了根据本发明实施例的根据目标问题模板确定用户变量问题的一示例的流程图。

如图4所示，在步骤410中，从多个问题模板中确定与第一用户变量相应的第一目标问题模板，并检测第一目标问题模板中是否存在第二用户变量。

如果在步骤410中的检测结果指示第一目标问题模板中不存在第二用户变量，则跳转至步骤421。如果在步骤410中的检测结果指示第一目标问题模板中存在第二用户变量，则跳转至步骤423。

在步骤421中，将第一目标问题模板确定为相应的用户变量问题。

在步骤423中，根据知识图谱中对应第二用户变量的实体内容信息填充第一目标问题模板中的第二用户变量，以确定用户变量问题。

在本发明实施例的一些示例中，为了提高身份核实过程中提问信息的丰富度，在问题模板中可以额外设置变量，并能利用目标用户在知识图谱中的信息来完善问题模板，实现了针对同一提问变量可以向不同目标用户提出定制化问题。举例来说，针对变量“毕业院校校长”的问题模板可以是“您在校期间${University}的校长是谁？”，此时可以通过查询知识图谱来找到目标用户的毕业院校是“北京邮电大学”，进而得到用户变量问题为“您在校期间北京邮电大学的校长是谁？”。

图5示出了根据本发明实施例的评估目标用户的身份的可靠性的一示例的流程图。

如图5所示，在步骤510中，识别用户反馈语音所对应的反馈文本信息。这里，可以利用各种已知的或潜在的语音识别算法来进行语音识别操作，得到与用户反馈语音所对应的文本信息。

在步骤520中，确定反馈文本信息相对于第一标准答案的答案准确度。例如，可以将第一标准答案与反馈文本信息进行文本语义匹配，并根据相应的文本语义匹配度来确定答案准确度。

在步骤530中，至少基于答案准确度，评估目标用户的身份的可靠性。在本发明实施例的一个示例中，如果答案准确度低于或等于预设阈值时，则可以确定目标用户的身份虚假，另外，如果答案准确度高于预设阈值时，则可以确定目标用户的身份可靠。

在本发明实施例的另一示例中，还可以综合除答案准确度之外的其他维度，对目标用户的身份的可靠性进行评估。由此，可以提高身份核实结果的可靠程度。

图6示出了根据本发明实施例的综合多维度信息来评估目标用户的身份的可靠性的一示例的流程图。

如图6所示，在步骤610中，获取用户反馈语音所对应的问答反应时间和反馈流畅度。这里，问答反应时间可以是从语音回访时的问题提出到用户反馈语音的检测之间的时间段，其可以是通过预设的计时器而确定的。另外，反馈流畅度可以是用户在语音回复提问时的流畅程度，其可以通过预设的流畅度识别算法对用户反馈语音进行识别而确定的。

在步骤620中，基于问答反应时间、反馈流畅度和答案准确度，评估目标用户的身份的可靠性。由此，在问答环节结束后，可以根据记录结果，将客户回答与知识图谱中的标准答案进行比对，从用户回答的准确性、反应时间、回答问题流畅度等多个维度上对目标用户的语音回访情况进行风险分析，可以有效保障用户身份的核实结果的真实性。

在一些情况下，在语音回访的过程中提出了多个问题，并需要结合用户针对各个问题的回复情况来综合识别用户的身份是否可靠。

具体地，第一问题的数量为多个，并且用户反馈语音包含与各个第一问题分别对应的用户答复语音。此时，针对各个用户答复语音，基于用户答复语音所对应的问答反应时间、反馈流畅度和答案准确度，确定相应的答复可靠评分。进而，根据各个用户答复语音所对应的答复可靠评分，确定目标用户的身份的是否可靠。例如，可以将各个用户答复语音所对应的答复可靠评分进行汇总，以从整体上识别目标用户的身份是否可靠。

在一些实施方式中，还可以为不同的问题设置权重，以调控不同问题所对应的答复可靠评分对用户身份的整体识别结果的影响程度。具体地，可以获取各个第一问题所对应的问题权重，例如问题权重可以基于与问题相应的变量所预设的变量权重而确定的(例如，学校变量的权重是0.3，公司变量的权重是0.2，等等)。此外，还可以将各个第一问题所对应的答复可靠评分和相应的问题权重进行加权求和，以得到相应的身份可靠度。进而，将身份可靠度和预设的可靠度阈值进行比较，以确定目标用户的身份是否可靠。

示例性地，可以设计五个问题，5道题满分100分，每道题根据回答情况按照0-20分打分，由此可以按照不同的分数档对客户的风险值进行评估。举例来说，在问申请人毕业高校的校长是谁(仍以北京邮电大学为例)，客户回答乔建永比“乔校长”更为准确，前者可得20分满分，后者会扣除10分得到20分。因此，总得分越高，用户的身份伪造的风险值越低。

在本发明实施例的一些应用场景中，可以集成在机器人(即，智能核身机器人)中，使得金融行业的语音机器人不再局限于销售、推荐、催收等，并可以通过对话式人工智能的方式来对用户身份进行审查。

图7示出了根据本发明实施例的对话式人工智能驱动的智能核身***的一示例的架构示意图。

如图7所示，对话式人工智能驱动的智能核身***主要包含知识图谱模块、问题-答案生成器模块、语音机器人模块和风险评估模块。在问题-答案生成器构建好后，对话机器人对客户进行电话外呼，开始语音交互，通过语音合成技术将相关问题播报给客户，并借助语音识别技术对客户的回答进行记录，方便后续比对客户回答与标准答案，给出得分并最后进行风险评估。

结合金融行业的核身场景来说，可以先由客户提出贷款申请、***申请、参保申请等金融业务申请，在客户提交相关材料后，可以结合申请材料和知识图谱来生成问题和答案，然后通过语音机器人对客户进行电话回访，询问相关问题，最后结合客户在回答过程中的综合表现，对客户进行的身份进行审核，实现风险评估。

以***申请场景为例，假设有两个申请人张三、李四，根据填写的信息，两人均为北京邮电大学2020届毕业生。本方法将给出一个风险评估较低(张三)和一个风险评估较高(李四)的案例。

Ⅰ对应张三的风险评估案例：

--------------------------基本信息核对---------------------------

语音机器人：您好！这里是XX银行，我的工号是****，请问您是张三先生吗/女士吗？

客户：是的

语音机器人：耽误您几分钟的时间，简单为您做一个审核，请问您现在方便么？

客户：方便

语音机器人：请问您是否要办理**业务？

客户：是的

-------------------问题-答案生成器生成问题5个-------------------

语音机器人：您的身份证号是？

客户：***(回答正确、反应及时、回答流畅)

语音机器人：您研究生毕业的学校是？

客户：北京邮电大学(回答正确、反应及时、回答流畅)

语音机器人：您在校期间北京邮电大学的校长是谁？

客户：乔建永(回答正确、反应及时、回答流畅)

语音机器人：您在校期间北京邮电大学信息与通信工程学院的学科有？

客户：信息与通信工程(回答正确、反应及时、回答流畅)

语音机器人：请说出北京邮电大学一位老师的名字？

客户：MMM(回答正确、反应及时、回答流畅)

------------------------------结尾语----------------------------

语音机器人：好的，感谢您的回答，祝您生活愉快，再见。

表3 张三的风险评估表

参照如图3所示的风险评估表可知，张三在问答过程中表现优秀，在第4个问题：“您在校期间北京邮电大学信息与通信工程学院的学科有”中没有答全，被扣除5分。总分95分，风险值评估为风险很低。

Ⅱ对应张三的风险评估案例：

--------------------------基本信息核对---------------------------

语音机器人：您好！这里是XX银行，我的工号是****，请问您是李四先生吗/女士吗？

客户：是的

客户：方便

语音机器人：请问您是否要办理**业务？

客户：是的

---------------------问题-答案生成器生成问题5个-----------------

语音机器人：您的身份证号是？

客户：***(回答正确、反应及时、回答不流畅)

语音机器人：您研究生毕业的学校是？

客户：北京邮电大学(回答正确、反应及时、回答流畅)

语音机器人：您在校期间北京邮电大学的校长是谁？

客户：……姓乔(回答正确、反应慢、回答流畅)

客户：……通信？(回答错误、反应慢、回答不流畅)

语音机器人：请说出北京邮电大学一位老师的名字？

客户：……好像是……？(回答错误、反应慢、回答不流畅)

------------------------------结尾语----------------------------

语音机器人：好的，感谢您的回答，祝您生活愉快，再见。

表4 李四的风险评估表

参照如图4所示的风险评估表可知，李四在问答过程中表现很差，整体回答准确度低、反应时间长、流畅度差。对于第4和第5个问题回答严重错误，第3个问题回答较为模糊，回答身份证号码时流畅度低于正常人。李四得分40，评估风险值较高。由此可以推断，李四有很大可能借用他人信息申请金融业务。

在本发明实施例中，通过对话式人工智能方法，高效、精准地帮助金融机构进行智能核身，可以有效避免主观失误、降低人工审核成本，还能得出客户风险值，协助机构人员判断客户信息的准确性，强化身份验证，降低金融机构被虚假信息欺骗的风险，有效防范团伙欺诈。

如图8所示，用户身份核实装置800包括用户资料获取单元810、问答库构建单元820、语音回访单元830和身份核实单元840。

用户资料获取单元810被配置为获取待核身份的目标用户的用户资料信息。

问答库构建单元820被配置为基于所述用户资料信息和预设的知识图谱，确定用户问答知识库；其中，所述用户问答知识库包含针对所述目标用户的多个问题和相应的标准答案。

语音回访单元830被配置为基于所述用户问答知识库中的第一问题对所述目标用户进行语音回访，并检测针对所述第一问题的用户反馈语音。

身份核实单元840被配置为基于所述用户反馈语音和所述用户问答知识库中与所述第一问题对应的第一标准答案，评估所述目标用户的身份的可靠性。

上述本发明实施例的装置可用于执行本发明中相应的方法实施例，并相应的达到上述本发明方法实施例所达到的技术效果，这里不再赘述。

本发明实施例中可以通过硬件处理器(hardware processor)来实现相关功能模块。

另一方面，本发明实施例提供一种存储介质，其上存储有计算机程序，该程序被处理器执行如上的用户身份核实方法的步骤。

上述产品可执行本发明实施例所提供的方法，具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节，可参见本发明实施例所提供的方法。

本发明实施例的网关设备以多种形式存在，包括但不限于:

(1)移动通信设备:这类设备的特点是具备移动通信功能，并且以提供话音、数据通信为主要目标。这类终端包括:智能手机(例如iPhone)、多媒体手机、功能性手机，以及低端手机等。

(2)超移动个人计算机设备:这类设备属于个人计算机的范畴，有计算和处理功能，一般也具备移动上网特性。这类终端包括:PDA、MID和UMPC设备等，例如iPad。

(3)便携式娱乐设备:这类设备可以显示和播放多媒体内容。该类设备包括:音频、视频播放器(例如iPod)，掌上游戏机，电子书，以及智能玩具和便携式车载导航设备。

(4)其他具有数据交互功能的电子装置。

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种用户身份核实方法，包括：

获取待核身份的目标用户的用户资料信息；

基于所述用户资料信息和预设的知识图谱，确定用户问答知识库；其中，所述用户问答知识库包含针对所述目标用户的多个问题和相应的标准答案；

基于所述用户问答知识库中的第一问题对所述目标用户进行语音回访，并检测针对所述第一问题的用户反馈语音；

基于所述用户反馈语音和所述用户问答知识库中与所述第一问题对应的第一标准答案，评估所述目标用户的身份的可靠性。

2.根据权利要求1所述的方法，其中，所述知识图谱包括多个实体和相应的实体内容信息，所述实体内容信息包含实体属性信息和/或实体关系信息；

其中，所述基于所述用户资料信息和预设的知识图谱，确定用户问答知识库，包括：

根据所述用户资料信息，确定相应的多个用户变量；

根据预设的多个问题模板中与各个所述用户变量相匹配的目标问题模板，确定用户变量问题；以及

根据所述知识图谱中对应各个所述用户变量的实体内容信息，确定用户变量标准答案；

根据各个所述用户变量问题和相应的所述用户变量标准答案，构建用户问答知识库。

3.根据权利要求2所述的方法，其中，所述根据预设的多个问题模板中与各个所述用户变量相匹配的目标问题模板，确定用户变量问题，包括：

从所述多个问题模板中确定与第一用户变量相应的第一目标问题模板，并检测所述第一目标问题模板中是否存在第二用户变量；

当存在时，根据所述知识图谱中对应所述第二用户变量的实体内容信息填充所述第一目标问题模板中的所述第二用户变量，以确定用户变量问题。

4.根据权利要求1所述的方法，其中，所述基于所述用户反馈语音和所述用户问答知识库中与所述第一问题对应的第一标准答案，评估所述目标用户的身份的可靠性，包括：

识别所述用户反馈语音所对应的反馈文本信息；

确定所述反馈文本信息相对于所述第一标准答案的答案准确度；

至少基于所述答案准确度，评估所述目标用户的身份的可靠性。

5.根据权利要求4所述的方法，其中，所述至少基于所述答案准确度，评估所述目标用户的身份的可靠性，包括：

获取所述用户反馈语音所对应的问答反应时间和反馈流畅度；

基于所述问答反应时间、反馈流畅度和所述答案准确度，评估所述目标用户的身份的可靠性。

6.根据权利要求5所述的方法，其中，所述第一问题的数量为多个，并且所述用户反馈语音包含与各个所述第一问题分别对应的用户答复语音；

其中，所述基于所述问答反应时间、反馈流畅度和所述答案准确度，评估所述目标用户的身份的可靠性，包括：

针对各个所述用户答复语音，基于所述用户答复语音所对应的问答反应时间、反馈流畅度和答案准确度，确定相应的答复可靠评分；

根据各个所述用户答复语音所对应的答复可靠评分，确定所述目标用户的身份的是否可靠。

7.根据权利要求6所述的方法，其中，所述根据各个所述用户答复语音所对应的答复可靠评分，确定所述目标用户的身份的是否可靠，包括：

获取各个所述第一问题所对应的问题权重；

将各个所述第一问题所对应的答复可靠评分和相应的问题权重进行加权求和，以得到相应的身份可靠度；

将所述身份可靠度和预设的可靠度阈值进行比较，以确定所述目标用户的身份是否可靠。

8.一种用户身份核实装置，包括：

用户资料获取单元，被配置为获取待核身份的目标用户的用户资料信息；

问答库构建单元，被配置为基于所述用户资料信息和预设的知识图谱，确定用户问答知识库；其中，所述用户问答知识库包含针对所述目标用户的多个问题和相应的标准答案；

语音回访单元，被配置为基于所述用户问答知识库中的第一问题对所述目标用户进行语音回访，并检测针对所述第一问题的用户反馈语音；

身份核实单元，被配置为基于所述用户反馈语音和所述用户问答知识库中与所述第一问题对应的第一标准答案，评估所述目标用户的身份的可靠性。

9.一种网关设备，其包括：至少一个处理器，以及与所述至少一个处理器通信连接的存储器，其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-7中任一项所述方法的步骤。

10.一种存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现权利要求1-7中任一项所述方法的步骤。