CN108231061A

CN108231061A - 一种基于文本解析和语音合成的网络人机交互方法

Info

Publication number: CN108231061A
Application number: CN201711474011.3A
Authority: CN
Inventors: 秦谦
Original assignee: Jiangsu Mingtong Tech Co Ltd
Current assignee: Jiangsu Mingtong Tech Co Ltd
Priority date: 2017-12-29
Filing date: 2017-12-29
Publication date: 2018-06-29

Abstract

本发明公开一种基于文本解析和语音合成的网络人机交互方法，其特征在于，包括如下步骤：步骤SS1：获取用户信息，建立用户特征信息集；步骤SS2：接收用户发出的语音请求进行特征信息匹配；步骤SS3：输出与所述用户的请求分类关系最接近的关联内容。本发明提出一种基于文本解析和语音合成的网络人机交互方法，通过获取用户信息，建立用户特征信息集；接收用户发出的语音请求进行特征信息匹配；输出与所述用户的请求分类关系最接近的关联内容，通过不断完善的用户特征信息集支持用户不断更新的提问请求，实现网络人机交互的深度关联。

Description

一种基于文本解析和语音合成的网络人机交互方法

技术领域

本发明涉及一种基于文本解析和语音合成的网络人机交互方法，属于人机交互技术领域。

背景技术

随着网络传输和大数据科技的发展以及硬件处理能力的提升，越来越多的人机交互智能设备走进了人们的生活。当前的人机交互方式基本都是人问机器答，尽管回答方式多种多样，但大多是智能设备被动接收用户的提问信息，智能设备和用户之间缺乏深度联系。

发明内容

本发明的目的在于，克服现有技术存在的缺陷，解决上述技术问题，提出一种基于文本解析和语音合成的网络人机交互方法。

本发明采用如下技术方案：一种基于文本解析和语音合成的网络人机交互方法，其特征在于，包括如下步骤：

步骤SS1：获取用户信息，建立用户特征信息集；

步骤SS2：接收用户发出的语音请求进行特征信息匹配；

步骤SS3：输出与所述用户的请求分类关系最接近的关联内容。

作为一种较佳的实施例，所述步骤SS1具体包括：所述用户将需要转化为音频的信息发送给用于提供服务的账号；利用社交平台官方开放接口或者利用社交平台网页版本的接口，将用户所发送的信息经过社交平台的预处理后传递给服务器；服务器对用户发送的信息加工处理，生成对应的音频或者包含音频信息的网页的用户特征信息集。

作为一种较佳的实施例，所述步骤SS2还包括：根据所述语音请求从所述用户特征信息集提取关联内容，预判所述关联内容后应答所述用户的语音请求。

作为一种较佳的实施例，所述步骤SS2还包括：建立所述特征信息集的特征信息分类关系表；从所述语音请求中提取匹配关键词；根据所述匹配关键词从不断完善的所述特征信息集提取分类关系最接近的关联内容，根据所述关联内容从所述用户特征信息集中提出对应的音频或者包含音频信息的网页进行输出。

作为一种较佳的实施例，所述用于提供服务的账号包括以下所列中的一个或若干：微博账号、微信账号、QQ账号、Facebook账号、推特账号。

作为一种较佳的实施例，所述步骤SS1中的所述信息加工处理包括：信息压缩，图像识别，音频提取，网页链接生成；所述信息压缩是将用户输入的信息通过摘要算法缩短文本通过语音合成技术转换成音频文件；所述图像识别采用OCR光学字符识别技术，将图片中的文本提取出来；所述音频提取是将视频文件中的音频提取出来生成独立的音频文件；所述网页链接生成是将合成的音频文件和对应的文本、图片一起，缓存到服务器的数据库中，所述数据库的值包括用户ID、请求ID和呈现顺序，所述数据库的值即为基于用户ID和请求ID生成的新的链接。

本发明所达到的有益效果：本发明提出一种基于文本解析和语音合成的网络人机交互方法，通过获取用户信息，建立用户特征信息集；接收用户发出的语音请求进行特征信息匹配；输出与所述用户的请求分类关系最接近的关联内容，通过不断完善的用户特征信息集支持用户不断更新的提问请求，实现网络人机交互的深度关联。

附图说明

图1是本发明的方法流程图。

具体实施方式

下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案，而不能以此来限制本发明的保护范围。

图1是本发明的方法流程图。本发明提出一种基于文本解析和语音合成的网络人机交互方法，其特征在于，包括如下步骤：

步骤SS1：获取用户信息，建立用户特征信息集；

步骤SS2：接收用户发出的语音请求进行特征信息匹配；

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明技术原理的前提下，还可以做出若干改进和变形，这些改进和变形也应视为本发明的保护范围。

Claims

1.一种基于文本解析和语音合成的网络人机交互方法，其特征在于，包括如下步骤：

步骤SS1：获取用户信息，建立用户特征信息集；

步骤SS2：接收用户发出的语音请求进行特征信息匹配；

2.根据权利要求1所述的一种基于文本解析和语音合成的网络人机交互方法，其特征在于，所述步骤SS1具体包括：所述用户将需要转化为音频的信息发送给用于提供服务的账号；利用社交平台官方开放接口或者利用社交平台网页版本的接口，将用户所发送的信息经过社交平台的预处理后传递给服务器；服务器对用户发送的信息加工处理，生成对应的音频或者包含音频信息的网页的用户特征信息集。

3.根据权利要求2所述的一种基于文本解析和语音合成的网络人机交互方法，其特征在于，所述步骤SS2还包括：根据所述语音请求从所述用户特征信息集提取关联内容，预判所述关联内容后应答所述用户的语音请求。

4.根据权利要求3所述的一种基于文本解析和语音合成的网络人机交互方法，其特征在于，所述步骤SS2还包括：建立所述特征信息集的特征信息分类关系表；从所述语音请求中提取匹配关键词；根据所述匹配关键词从不断完善的所述特征信息集提取分类关系最接近的关联内容，根据所述关联内容从所述用户特征信息集中提出对应的音频或者包含音频信息的网页进行输出。

5.根据权利要求2所述的一种基于文本解析和语音合成的网络人机交互方法，其特征在于，所述用于提供服务的账号包括以下所列中的一个或若干：微博账号、微信账号、QQ账号、Facebook账号、推特账号。

6.根据权利要求2所述的一种基于文本解析和语音合成的网络人机交互方法，其特征在于，所述步骤SS1中的所述信息加工处理包括：信息压缩，图像识别，音频提取，网页链接生成；所述信息压缩是将用户输入的信息通过摘要算法缩短文本通过语音合成技术转换成音频文件；所述图像识别采用OCR光学字符识别技术，将图片中的文本提取出来；所述音频提取是将视频文件中的音频提取出来生成独立的音频文件；所述网页链接生成是将合成的音频文件和对应的文本、图片一起，缓存到服务器的数据库中，所述数据库的值包括用户ID、请求ID和呈现顺序，所述数据库的值即为基于用户ID和请求ID生成的新的链接。