CN108172225A - 语音交互方法及机器人、计算机可读存储介质、终端 - Google Patents
语音交互方法及机器人、计算机可读存储介质、终端 Download PDFInfo
- Publication number
- CN108172225A CN108172225A CN201711442348.6A CN201711442348A CN108172225A CN 108172225 A CN108172225 A CN 108172225A CN 201711442348 A CN201711442348 A CN 201711442348A CN 108172225 A CN108172225 A CN 108172225A
- Authority
- CN
- China
- Prior art keywords
- voice
- interactive
- answer sentence
- user
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000002452 interceptive effect Effects 0.000 title claims abstract description 58
- 238000000034 method Methods 0.000 title claims abstract description 36
- 230000001815 facial effect Effects 0.000 claims abstract description 27
- 238000012544 monitoring process Methods 0.000 claims abstract description 14
- 238000005516 engineering process Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G07—CHECKING-DEVICES
- G07F—COIN-FREED OR LIKE APPARATUS
- G07F9/00—Details other than those peculiar to special kinds or types of apparatus
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Manipulator (AREA)
Abstract
一种语音交互方法机器人、计算机可读存储介质、终端,所述方法包括:对预设的监控区域进行人脸识别;当识别出人脸图像时,与所述人脸图像对应的用户进行对话,并执行相应的操作。上述的方案,可以提高语音交互的智能化程度,提升用户的使用体验。
Description
技术领域
本发明涉及调试技术领域,特别是涉及一种语音交互方法及机器人、计算机可读存储介质、终端。
背景技术
自助终端设备已经被广泛应用于各个领域,如金融、运输、医疗、移动通信、餐饮等。用户通过自助终端设备可以办理多种自助业务,而无需去窗口排队等待,节省了人力资源,提高了业务办理的效率。
用户办理相应的自助业务时,将相应的介质卡放置在对应的自助终端上进行自助业务的办理。
但是,现有的语音交互方法存在着智能化程度低的问题,严重影响了用户的使用体验。
发明内容
本发明实施例解决的技术问题是如何提高语音交互的智能化程度,提升用户的使用体验。
为解决上述问题,本发明实施例提供了一种语音交互方法,所述方法包括:
对预设的监控区域进行人脸识别;
当识别出人脸图像时,与所述人脸图像对应的用户进行对话,并执行相应的操作。
可选地,所述与所述人脸图像对应的用户进行对话,并执行相应的操作,包括:
获取所述用户输入的语音;
对所述用户输入的语音进行识别,得到对应的文字;
判断识别得到的文字为命令式语句还是非命令式语句;
当确定识别得到的文字是命令式语句时,执行所述命令式语句对应的操作。
可选地,当确定识别得到的文字为非命令式语句时,所述方法还包括:
当从预设的语料数据库中匹配出对应的答案语句时,输出匹配得到的答案语句语音。
可选地,当从预设的语料数据库中未匹配出对应的答案语句时,还包括:
通过网络搜索确定对应的答案语句,并输出所确定的答案语句语音。
本发明实施例还提供了一种语音交互机器人,所述机器人包括:
人脸识别单元,适于对预设的监控区域进行人脸识别;
互动操作单元,适于当识别出人脸图像时,与所述人脸图像对应的用户进行对话,并执行相应的操作。
可选地,所述互动操作单元,适于获取所述用户输入的语音;对所述用户输入的语音进行识别,得到对应的文字;判断识别得到的文字为命令式语句还是非命令式语句;当确定识别得到的文字是命令式语句时,执行所述命令式语句对应的操作。
可选地,所述互动操作单元,还适于当确定识别得到的文字为非命令式语句时且从预设的语料数据库中匹配出对应的答案语句时,输出匹配得到的答案语句语音。
可选地,所述互动操作单元,还适于当从预设的语料数据库中未匹配出对应的答案语句时,通过网络搜索确定对应的答案语句,并输出所确定的答案语句语音。
本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机指令,所述计算机指令运行时执行上述任一项所述的语音交互方法的步骤。
本发明实施例还提供了一种终端,包括存储器和处理器,所述存储器上储存有能够在所述处理器上运行的计算机指令,所述处理器运行所述计算机指令时执行上述任一项所述的语音交互方法的步骤。
与现有技术相比,本发明的技术方案具有以下的优点:
上述的方案,通过对预设的监控区域进行人脸识别,当识别出人脸图像时,与所述人脸图像对应的用户进行对话,并执行相应的操作,可以提高机器人的智能化服务程度,提升用户的使用体验。
进一步地,当从预设的语料数据库中未匹配出对应的答案语句时,通过网络搜索确定对应的答案语句,并输出所确定的答案语句语音,可以进一步提高语音交互的准确性,提升用户的使用体验。
附图说明
图1是本发明实施例中的一种语音交互方法的流程图;
图2是本发明实施例中的另一种语音交互方法的流程图;
图3是本发明实施例中的一种语音交互机器人的结构示意图。
具体实施方式
为解决现有技术中存在的上述问题,本发明实施例采用的技术方案通过对预设的监控区域进行人脸识别,当识别出人脸图像时,与所述人脸图像对应的用户进行对话,并执行相应的操作,可以提高机器人的智能化服务程度,提升用户的使用体验。
为使本发明的上述目的、特征和优点能够更为明显易懂,下面结合附图对本发明的具体实施例做详细的说明。
图1示出了本发明实施例中的一种语音交互方法的流程图。如图1所示的语音交互方法,具体可以包括如下的操作:
步骤S101:对预设的监控区域进行人脸识别。
步骤S102:当识别出人脸图像时,与所述人脸图像对应的用户进行对话,并执行相应的操作。
上述的方案,通过对预设的监控区域进行人脸识别,当识别出人脸图像时,与所述人脸图像对应的用户进行对话,并执行相应的操作,可以提高机器人的智能化服务程度,提升用户的使用体验。
下面将结合图2对本发明实施例中的语音交互方法进行进一步详细的介绍。
图2示出了本发明实施例中的一种语音交互方法的流程图。参见图2,一种语音交互方法,适于与用户进行语音互动,具体可以包括如下的操作:
步骤S201:对预设的监控区域进行人脸识别。
在具体实施中,所述预设的监控区域,为本发明实施例中的语音交互机器人的摄像头所能拍摄到的区域。通过设置在本发明实施例中的语音交互机器人的摄像头可以对所述监控区域进行图像拍摄,并对所拍摄的图像进行人脸识别,以识别出对应的人脸图像。
步骤S202:当识别出人脸图像时,获取所述人脸图像对应的用户输入的语音信息。
在具体实施中,当从所拍摄得到的图像中识别出对应的人脸图像时,本发明实施例中的语音交互机器人可以与所识别出的人脸图像对应的用户进行语音交互。具体而言,本发明实施例中的语音交互机器人可以首先获取所述用户输入的语音信息。
步骤S203:对所述用户输入的语音进行识别,得到对应的文字。
在具体实施中,当获取到用户输入的语音信息时,本发明实施例中的语音交互机器人可以采用相应的语音识别方法识别出用户输入的语音,并转换为对应的文字。
步骤S204:判断识别得到的文字是否为命令式语句;当判断结果为是时,可以执行步骤S205;反之,则可以执行步骤S206。
在具体实施中,当通过语音识别得到用户输入的语音对应的文字时,本发明实施例中的语音交互机器人可以对识别得到的文字进行句式判断,以得到识别出的文字为命令式语句还是非命令式语句。
步骤S205:执行所述命令式语句对应的操作。
在具体实施中,当识别得到所述文字为命令式语句时,本发明实施例中的语音交互机器人可以基于所识别出的文字对应的命令式语句与所执行的操作之间的对应关系,确定对应的操作,并执行所确定的操作,从而完成用户指示的操作。
在本发明一实施例中,所述语音交互方法还可以进一步包括:
步骤S206:判断从预设的语料数据库中是否匹配得到对应的答案语句;当判断结果为是时,可以执行步骤S207;反之,则可以执行步骤208。
步骤S207:输出匹配得到的答案语句语音。
在具体实施中,当确定识别得到的文字为非命令式语句时,本发明实施例中的语音交互机器人可以从所述预设的语料数据库中检索出与所识别出的文字对应的答案语句,并将从所述语料数据库中检索出的答案语句转换为对应的语音并输出,从而与所述用户进行语音交互。
在本发明一实施例中,所述方法还包括:
步骤S208:通过网络搜索确定对应的答案语句,并输出所确定的答案语句语音。
在具体实施中,当确定识别得到的文字为非命令式语句时,且从预设的语料数据库中未匹配出对应的答案语句时,本发明实施例中的语音交互机器人可以在通过网络搜索得到出与所述文字对应的答案语句,并将搜索得到的答案语句转换为对应的语音并输出,从而与所述用户进行交互。
在具体实施中,本发明实施例中的语料数据库可以通过自学习的方式建立并不断丰富其中所存储的问句与答案。例如,当执行网络搜索确定出对应的答案语句时,可以在所述语料数据库中可以添加对应的非命令式语句与搜索得到的答案语句之间的对应关系。当下次所识别出的对应的非命令式文字语句时,可以直接通过检索所述语料数据库得到对应的答案语句,可以进一步提高本发明实施例语音检索的效率和准确率,提高语音交互的智能化程度,提升用户的使用体验。
上述对本发明实施例中的方法进行了详细的描述,下面将对上述的方法对应的装置进行介绍。
图3示出了本发明实施例中的一种语音交互机器人的结构。参见图3,一种语音交互机器人30,可以包括人脸识别单元301和互动操作单元302,其中:
所述人脸识别单元301,适于对预设的监控区域进行人脸识别。
所述互动操作单元302,适于当识别出人脸图像时,与所述人脸图像对应的用户进行对话,并执行相应的操作。
在具体实施中,所述互动操作单元302,适于获取所述用户输入的语音;对所述用户输入的语音进行识别,得到对应的文字;判断识别得到的文字为命令式语句还是非命令式语句;当确定识别得到的文字是命令式语句时,执行所述命令式语句对应的操作。
在具体实施中,所述互动操作单元302,还适于当确定识别得到的文字为非命令式语句时且从预设的语料数据库中匹配出对应的答案语句时,输出匹配得到的答案语句语音。
在具体实施中,所述互动操作单元302,还适于当从预设的语料数据库中未匹配出对应的答案语句时,通过网络搜索确定对应的答案语句,并输出所确定的答案语句语音。
本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机指令,所述计算机指令运行时执行所述的语音交互方法的步骤。其中,所述的语音交互方法的步骤请参照前述部分的介绍,在此不再赘述。
本发明实施例还提供了一种终端,包括存储器和处理器,所述存储器上储存有能够在所述处理器上运行的计算机指令,所述处理器运行所述计算机指令时执行所述的语音交互方法的步骤。其中,所述的语音交互方法的步骤请参照前述部分的介绍,在此不再赘述。
采用本发明实施例的上述方案,对预设的监控区域进行人脸识别,当识别出人脸图像时,与所述人脸图像对应的用户进行对话,并执行相应的操作,可以提高机器人的智能化服务程度,提升用户的使用体验。
进一步地,当从预设的语料数据库中未匹配出对应的答案语句时,通过网络搜索确定对应的答案语句,并输出所确定的答案语句语音,可以进一步提高语音交互的准确性,提升用户的使用体验。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于计算机可读存储介质中,存储介质可以包括:ROM、RAM、磁盘或光盘等。
以上对本发明实施例的方法及***做了详细的介绍,本发明并不限于此。任何本领域技术人员,在不脱离本发明的精神和范围内,均可作各种更动与修改,因此本发明的保护范围应当以权利要求所限定的范围为准。
Claims (10)
1.一种语音交互方法,其特征在于,包括:
对预设的监控区域进行人脸识别;
当识别出人脸图像时,与所述人脸图像对应的用户进行对话,并执行相应的操作。
2.根据权利要求1所述的语音交互方法,其特征在于,所述与所述人脸图像对应的用户进行对话,并执行相应的操作,包括:
获取所述用户输入的语音;
对所述用户输入的语音进行识别,得到对应的文字;
判断识别得到的文字为命令式语句还是非命令式语句;
当确定识别得到的文字是命令式语句时,执行所述命令式语句对应的操作。
3.根据权利要求2所述的语音交互方法,其特征在于,当确定识别得到的文字为非命令式语句时,还包括:
当从预设的语料数据库中匹配出对应的答案语句时,输出匹配得到的答案语句语音。
4.根据权利要求3所述的语音交互方法,其特征在于,当从预设的语料数据库中未匹配出对应的答案语句时,还包括:
通过网络搜索确定对应的答案语句,并输出所确定的答案语句语音。
5.一种语音交互机器人,其特征在于,包括:
人脸识别单元,适于对预设的监控区域进行人脸识别;
互动操作单元,适于当识别出人脸图像时,与所述人脸图像对应的用户进行对话,并执行相应的操作。
6.根据权利要求5所述的语音交互机器人,其特征在于,所述互动操作单元,适于获取所述用户输入的语音;对所述用户输入的语音进行识别,得到对应的文字;判断识别得到的文字为命令式语句还是非命令式语句;当确定识别得到的文字是命令式语句时,执行所述命令式语句对应的操作。
7.根据权利要求6所述的语音交互机器人,其特征在于,所述互动操作单元,还适于当确定识别得到的文字为非命令式语句时且从预设的语料数据库中匹配出对应的答案语句时,输出匹配得到的答案语句语音。
8.根据权利要求7所述的语音交互机器人,其特征在于,所述互动操作单元,还适于当从预设的语料数据库中未匹配出对应的答案语句时,通过网络搜索确定对应的答案语句,并输出所确定的答案语句语音。
9.一种计算机可读存储介质,其上存储有计算机指令,其特征在于,所述计算机指令运行时执行权利要求1至4任一项所述的语音交互方法的步骤。
10.一种终端,其特征在于,包括存储器和处理器,所述存储器上储存有能够在所述处理器上运行的计算机指令,所述处理器运行所述计算机指令时执行权利要求1至4任一项所述的语音交互方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711442348.6A CN108172225A (zh) | 2017-12-27 | 2017-12-27 | 语音交互方法及机器人、计算机可读存储介质、终端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711442348.6A CN108172225A (zh) | 2017-12-27 | 2017-12-27 | 语音交互方法及机器人、计算机可读存储介质、终端 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108172225A true CN108172225A (zh) | 2018-06-15 |
Family
ID=62521891
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711442348.6A Pending CN108172225A (zh) | 2017-12-27 | 2017-12-27 | 语音交互方法及机器人、计算机可读存储介质、终端 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108172225A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108920639A (zh) * | 2018-07-02 | 2018-11-30 | 北京百度网讯科技有限公司 | 基于语音交互的上下文获取方法及设备 |
CN109272673A (zh) * | 2018-08-22 | 2019-01-25 | 深圳怡化电脑股份有限公司 | 金融自助设备及其工作方法 |
CN110111784A (zh) * | 2019-04-11 | 2019-08-09 | 苏宁云计算有限公司 | 一种夜间无人店的顾客远程协助的处理方法及*** |
WO2020125252A1 (zh) * | 2018-12-20 | 2020-06-25 | 达闼科技(北京)有限公司 | 机器人会话切换方法、装置及计算设备 |
CN111429924A (zh) * | 2018-12-24 | 2020-07-17 | 同方威视技术股份有限公司 | 语音交互方法、装置、机器人及计算机可读存储介质 |
CN115101048A (zh) * | 2022-08-24 | 2022-09-23 | 深圳市人马互动科技有限公司 | 科普信息交互方法、装置、***、交互设备和存储介质 |
-
2017
- 2017-12-27 CN CN201711442348.6A patent/CN108172225A/zh active Pending
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108920639A (zh) * | 2018-07-02 | 2018-11-30 | 北京百度网讯科技有限公司 | 基于语音交互的上下文获取方法及设备 |
CN108920639B (zh) * | 2018-07-02 | 2022-01-18 | 北京百度网讯科技有限公司 | 基于语音交互的上下文获取方法及设备 |
CN109272673A (zh) * | 2018-08-22 | 2019-01-25 | 深圳怡化电脑股份有限公司 | 金融自助设备及其工作方法 |
WO2020125252A1 (zh) * | 2018-12-20 | 2020-06-25 | 达闼科技(北京)有限公司 | 机器人会话切换方法、装置及计算设备 |
CN111429924A (zh) * | 2018-12-24 | 2020-07-17 | 同方威视技术股份有限公司 | 语音交互方法、装置、机器人及计算机可读存储介质 |
CN110111784A (zh) * | 2019-04-11 | 2019-08-09 | 苏宁云计算有限公司 | 一种夜间无人店的顾客远程协助的处理方法及*** |
CN115101048A (zh) * | 2022-08-24 | 2022-09-23 | 深圳市人马互动科技有限公司 | 科普信息交互方法、装置、***、交互设备和存储介质 |
CN115101048B (zh) * | 2022-08-24 | 2022-11-11 | 深圳市人马互动科技有限公司 | 科普信息交互方法、装置、***、交互设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108172225A (zh) | 语音交互方法及机器人、计算机可读存储介质、终端 | |
CN110377911B (zh) | 对话框架下的意图识别方法和装置 | |
CN106600298B (zh) | 基于工单数据分析的电力信息***客服知识库构建方法 | |
US11138250B2 (en) | Method and device for extracting core word of commodity short text | |
WO2019084810A1 (zh) | 一种信息处理方法及终端、计算机存储介质 | |
CN109635117A (zh) | 一种基于知识图谱识别用户意图方法及装置 | |
CN111428010B (zh) | 人机智能问答的方法和装置 | |
CN106297777A (zh) | 一种唤醒语音服务的方法和装置 | |
CN110262273A (zh) | 一种家居设备控制方法、装置、存储介质及智能家居*** | |
CN110349564A (zh) | 一种跨语言语音识别方法和装置 | |
WO2020047861A1 (zh) | 用于生成排序模型的方法和装置 | |
CN109344395A (zh) | 一种数据处理方法、装置、服务器及存储介质 | |
CN106294505B (zh) | 一种反馈答案的方法和装置 | |
CN108509416A (zh) | 句意识别方法及装置、设备和存储介质 | |
US20220301547A1 (en) | Method for processing audio signal, method for training model, device and medium | |
CN112966089A (zh) | 基于知识库的问题处理方法、装置、设备、介质和产品 | |
CN114625923B (zh) | 视频检索模型的训练方法、视频检索方法、装置以及设备 | |
CN114817478A (zh) | 基于文本的问答方法、装置、计算机设备及存储介质 | |
CN114090792A (zh) | 基于对比学习的文档关系抽取方法及其相关设备 | |
CN112560480B (zh) | 任务社区发现方法、装置、设备和存储介质 | |
US20230274161A1 (en) | Entity linking method, electronic device, and storage medium | |
EP4145306A1 (en) | Method and apparatus of processing data, electronic device, and medium | |
CN116226355A (zh) | 一种智能客服方法、***、电子设备及可读存储介质 | |
CN109684357A (zh) | 信息处理方法及装置、存储介质、终端 | |
CN110580899A (zh) | 语音识别方法及装置、存储介质、计算设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180615 |
|
RJ01 | Rejection of invention patent application after publication |