CN108172225A

CN108172225A - 语音交互方法及机器人、计算机可读存储介质、终端

Info

Publication number: CN108172225A
Application number: CN201711442348.6A
Authority: CN
Inventors: 张家重; 白喜阳; 王玉奎
Original assignee: Inspur Financial Information Technology Co Ltd
Current assignee: Inspur Financial Information Technology Co Ltd
Priority date: 2017-12-27
Filing date: 2017-12-27
Publication date: 2018-06-15

Abstract

一种语音交互方法机器人、计算机可读存储介质、终端，所述方法包括：对预设的监控区域进行人脸识别；当识别出人脸图像时，与所述人脸图像对应的用户进行对话，并执行相应的操作。上述的方案，可以提高语音交互的智能化程度，提升用户的使用体验。

Description

语音交互方法及机器人、计算机可读存储介质、终端

技术领域

本发明涉及调试技术领域，特别是涉及一种语音交互方法及机器人、计算机可读存储介质、终端。

背景技术

自助终端设备已经被广泛应用于各个领域，如金融、运输、医疗、移动通信、餐饮等。用户通过自助终端设备可以办理多种自助业务，而无需去窗口排队等待，节省了人力资源，提高了业务办理的效率。

用户办理相应的自助业务时，将相应的介质卡放置在对应的自助终端上进行自助业务的办理。

但是，现有的语音交互方法存在着智能化程度低的问题，严重影响了用户的使用体验。

发明内容

本发明实施例解决的技术问题是如何提高语音交互的智能化程度，提升用户的使用体验。

为解决上述问题，本发明实施例提供了一种语音交互方法，所述方法包括：

对预设的监控区域进行人脸识别；

当识别出人脸图像时，与所述人脸图像对应的用户进行对话，并执行相应的操作。

可选地，所述与所述人脸图像对应的用户进行对话，并执行相应的操作，包括：

获取所述用户输入的语音；

对所述用户输入的语音进行识别，得到对应的文字；

判断识别得到的文字为命令式语句还是非命令式语句；

当确定识别得到的文字是命令式语句时，执行所述命令式语句对应的操作。

可选地，当确定识别得到的文字为非命令式语句时，所述方法还包括：

当从预设的语料数据库中匹配出对应的答案语句时，输出匹配得到的答案语句语音。

可选地，当从预设的语料数据库中未匹配出对应的答案语句时，还包括：

通过网络搜索确定对应的答案语句，并输出所确定的答案语句语音。

本发明实施例还提供了一种语音交互机器人，所述机器人包括：

人脸识别单元，适于对预设的监控区域进行人脸识别；

互动操作单元，适于当识别出人脸图像时，与所述人脸图像对应的用户进行对话，并执行相应的操作。

可选地，所述互动操作单元，适于获取所述用户输入的语音；对所述用户输入的语音进行识别，得到对应的文字；判断识别得到的文字为命令式语句还是非命令式语句；当确定识别得到的文字是命令式语句时，执行所述命令式语句对应的操作。

可选地，所述互动操作单元，还适于当确定识别得到的文字为非命令式语句时且从预设的语料数据库中匹配出对应的答案语句时，输出匹配得到的答案语句语音。

可选地，所述互动操作单元，还适于当从预设的语料数据库中未匹配出对应的答案语句时，通过网络搜索确定对应的答案语句，并输出所确定的答案语句语音。

本发明实施例还提供了一种计算机可读存储介质，其上存储有计算机指令，所述计算机指令运行时执行上述任一项所述的语音交互方法的步骤。

本发明实施例还提供了一种终端，包括存储器和处理器，所述存储器上储存有能够在所述处理器上运行的计算机指令，所述处理器运行所述计算机指令时执行上述任一项所述的语音交互方法的步骤。

与现有技术相比，本发明的技术方案具有以下的优点：

上述的方案，通过对预设的监控区域进行人脸识别，当识别出人脸图像时，与所述人脸图像对应的用户进行对话，并执行相应的操作，可以提高机器人的智能化服务程度，提升用户的使用体验。

进一步地，当从预设的语料数据库中未匹配出对应的答案语句时，通过网络搜索确定对应的答案语句，并输出所确定的答案语句语音，可以进一步提高语音交互的准确性，提升用户的使用体验。

附图说明

图1是本发明实施例中的一种语音交互方法的流程图；

图2是本发明实施例中的另一种语音交互方法的流程图；

图3是本发明实施例中的一种语音交互机器人的结构示意图。

具体实施方式

为解决现有技术中存在的上述问题，本发明实施例采用的技术方案通过对预设的监控区域进行人脸识别，当识别出人脸图像时，与所述人脸图像对应的用户进行对话，并执行相应的操作，可以提高机器人的智能化服务程度，提升用户的使用体验。

为使本发明的上述目的、特征和优点能够更为明显易懂，下面结合附图对本发明的具体实施例做详细的说明。

图1示出了本发明实施例中的一种语音交互方法的流程图。如图1所示的语音交互方法，具体可以包括如下的操作：

步骤S101：对预设的监控区域进行人脸识别。

步骤S102：当识别出人脸图像时，与所述人脸图像对应的用户进行对话，并执行相应的操作。

下面将结合图2对本发明实施例中的语音交互方法进行进一步详细的介绍。

图2示出了本发明实施例中的一种语音交互方法的流程图。参见图2，一种语音交互方法，适于与用户进行语音互动，具体可以包括如下的操作：

步骤S201：对预设的监控区域进行人脸识别。

在具体实施中，所述预设的监控区域，为本发明实施例中的语音交互机器人的摄像头所能拍摄到的区域。通过设置在本发明实施例中的语音交互机器人的摄像头可以对所述监控区域进行图像拍摄，并对所拍摄的图像进行人脸识别，以识别出对应的人脸图像。

步骤S202：当识别出人脸图像时，获取所述人脸图像对应的用户输入的语音信息。

在具体实施中，当从所拍摄得到的图像中识别出对应的人脸图像时，本发明实施例中的语音交互机器人可以与所识别出的人脸图像对应的用户进行语音交互。具体而言，本发明实施例中的语音交互机器人可以首先获取所述用户输入的语音信息。

步骤S203：对所述用户输入的语音进行识别，得到对应的文字。

在具体实施中，当获取到用户输入的语音信息时，本发明实施例中的语音交互机器人可以采用相应的语音识别方法识别出用户输入的语音，并转换为对应的文字。

步骤S204：判断识别得到的文字是否为命令式语句；当判断结果为是时，可以执行步骤S205；反之，则可以执行步骤S206。

在具体实施中，当通过语音识别得到用户输入的语音对应的文字时，本发明实施例中的语音交互机器人可以对识别得到的文字进行句式判断，以得到识别出的文字为命令式语句还是非命令式语句。

步骤S205：执行所述命令式语句对应的操作。

在具体实施中，当识别得到所述文字为命令式语句时，本发明实施例中的语音交互机器人可以基于所识别出的文字对应的命令式语句与所执行的操作之间的对应关系，确定对应的操作，并执行所确定的操作，从而完成用户指示的操作。

在本发明一实施例中，所述语音交互方法还可以进一步包括：

步骤S206：判断从预设的语料数据库中是否匹配得到对应的答案语句；当判断结果为是时，可以执行步骤S207；反之，则可以执行步骤208。

步骤S207：输出匹配得到的答案语句语音。

在具体实施中，当确定识别得到的文字为非命令式语句时，本发明实施例中的语音交互机器人可以从所述预设的语料数据库中检索出与所识别出的文字对应的答案语句，并将从所述语料数据库中检索出的答案语句转换为对应的语音并输出，从而与所述用户进行语音交互。

在本发明一实施例中，所述方法还包括：

步骤S208：通过网络搜索确定对应的答案语句，并输出所确定的答案语句语音。

在具体实施中，当确定识别得到的文字为非命令式语句时，且从预设的语料数据库中未匹配出对应的答案语句时，本发明实施例中的语音交互机器人可以在通过网络搜索得到出与所述文字对应的答案语句，并将搜索得到的答案语句转换为对应的语音并输出，从而与所述用户进行交互。

在具体实施中，本发明实施例中的语料数据库可以通过自学习的方式建立并不断丰富其中所存储的问句与答案。例如，当执行网络搜索确定出对应的答案语句时，可以在所述语料数据库中可以添加对应的非命令式语句与搜索得到的答案语句之间的对应关系。当下次所识别出的对应的非命令式文字语句时，可以直接通过检索所述语料数据库得到对应的答案语句，可以进一步提高本发明实施例语音检索的效率和准确率，提高语音交互的智能化程度，提升用户的使用体验。

上述对本发明实施例中的方法进行了详细的描述，下面将对上述的方法对应的装置进行介绍。

图3示出了本发明实施例中的一种语音交互机器人的结构。参见图3，一种语音交互机器人30，可以包括人脸识别单元301和互动操作单元302，其中：

所述人脸识别单元301，适于对预设的监控区域进行人脸识别。

所述互动操作单元302，适于当识别出人脸图像时，与所述人脸图像对应的用户进行对话，并执行相应的操作。

在具体实施中，所述互动操作单元302，适于获取所述用户输入的语音；对所述用户输入的语音进行识别，得到对应的文字；判断识别得到的文字为命令式语句还是非命令式语句；当确定识别得到的文字是命令式语句时，执行所述命令式语句对应的操作。

在具体实施中，所述互动操作单元302，还适于当确定识别得到的文字为非命令式语句时且从预设的语料数据库中匹配出对应的答案语句时，输出匹配得到的答案语句语音。

在具体实施中，所述互动操作单元302，还适于当从预设的语料数据库中未匹配出对应的答案语句时，通过网络搜索确定对应的答案语句，并输出所确定的答案语句语音。

本发明实施例还提供了一种计算机可读存储介质，其上存储有计算机指令，所述计算机指令运行时执行所述的语音交互方法的步骤。其中，所述的语音交互方法的步骤请参照前述部分的介绍，在此不再赘述。

本发明实施例还提供了一种终端，包括存储器和处理器，所述存储器上储存有能够在所述处理器上运行的计算机指令，所述处理器运行所述计算机指令时执行所述的语音交互方法的步骤。其中，所述的语音交互方法的步骤请参照前述部分的介绍，在此不再赘述。

采用本发明实施例的上述方案，对预设的监控区域进行人脸识别，当识别出人脸图像时，与所述人脸图像对应的用户进行对话，并执行相应的操作，可以提高机器人的智能化服务程度，提升用户的使用体验。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于计算机可读存储介质中，存储介质可以包括：ROM、RAM、磁盘或光盘等。

以上对本发明实施例的方法及***做了详细的介绍，本发明并不限于此。任何本领域技术人员，在不脱离本发明的精神和范围内，均可作各种更动与修改，因此本发明的保护范围应当以权利要求所限定的范围为准。

Claims

1.一种语音交互方法，其特征在于，包括：

对预设的监控区域进行人脸识别；

2.根据权利要求1所述的语音交互方法，其特征在于，所述与所述人脸图像对应的用户进行对话，并执行相应的操作，包括：

获取所述用户输入的语音；

对所述用户输入的语音进行识别，得到对应的文字；

判断识别得到的文字为命令式语句还是非命令式语句；

3.根据权利要求2所述的语音交互方法，其特征在于，当确定识别得到的文字为非命令式语句时，还包括：

4.根据权利要求3所述的语音交互方法，其特征在于，当从预设的语料数据库中未匹配出对应的答案语句时，还包括：

5.一种语音交互机器人，其特征在于，包括：

人脸识别单元，适于对预设的监控区域进行人脸识别；

6.根据权利要求5所述的语音交互机器人，其特征在于，所述互动操作单元，适于获取所述用户输入的语音；对所述用户输入的语音进行识别，得到对应的文字；判断识别得到的文字为命令式语句还是非命令式语句；当确定识别得到的文字是命令式语句时，执行所述命令式语句对应的操作。

7.根据权利要求6所述的语音交互机器人，其特征在于，所述互动操作单元，还适于当确定识别得到的文字为非命令式语句时且从预设的语料数据库中匹配出对应的答案语句时，输出匹配得到的答案语句语音。

8.根据权利要求7所述的语音交互机器人，其特征在于，所述互动操作单元，还适于当从预设的语料数据库中未匹配出对应的答案语句时，通过网络搜索确定对应的答案语句，并输出所确定的答案语句语音。

9.一种计算机可读存储介质，其上存储有计算机指令，其特征在于，所述计算机指令运行时执行权利要求1至4任一项所述的语音交互方法的步骤。

10.一种终端，其特征在于，包括存储器和处理器，所述存储器上储存有能够在所述处理器上运行的计算机指令，所述处理器运行所述计算机指令时执行权利要求1至4任一项所述的语音交互方法的步骤。