CN113113019A

CN113113019A - 一种语音库生成***及方法

Info

Publication number: CN113113019A
Application number: CN202110328947.5A
Authority: CN
Inventors: 尤文杰; 邬锡敏
Original assignee: Shanghai Hongzhen Information Science & Technology Co ltd
Current assignee: Shanghai Hongzhen Information Science & Technology Co ltd
Priority date: 2021-03-27
Filing date: 2021-03-27
Publication date: 2021-07-13

Abstract

本发明公开了一种语音库生成***及方法，属于语音库***技术领域，包括客户端、语音收录***、服务器和指令输出端，所述语音收录***连接至服务器，通过语音收录***对语音数据进行收集，并且将收集到的语音数据传送至服务器中，通过服务器进行数据对比和储存，所述客户端连接至服务器，客户端将语音指令输入至服务器内进行，通过服务器对声音指令进行对比后将声音指令通过指令输出端进行输出，从而完成语音指令输出。

Description

一种语音库生成***及方法

技术领域

本发明涉及语音库***技术领域，尤其涉及一种语音库生成***及方法。

背景技术

随着语音识别技术、数字化设备以及多媒体技术的发展，语音端点检测技术得到了良好的发展，语音端点检测是在连续信号中检测出语音片段的技术，语音端点检测可以和自动语音识别***、声纹识别***相结合，为了便于用语言直接多设备下达指令需要进一步对语音库进行完善。

发明内容

本发明实施例提供一种语音库生成***及方法，以解决现有技术中的现有技术中的语音库需要进行进一步完善的技术问题。

本发明实施例采用下述技术方案：一种语音库生成***，包括客户端、语音收录***、服务器和指令输出端，所述语音收录***连接至服务器，通过语音收录***对语音数据进行收集，并且将收集到的语音数据传送至服务器中，通过服务器进行数据对比和储存，所述客户端连接至服务器，客户端将语音指令输入至服务器内进行，通过服务器对声音指令进行对比后将声音指令通过指令输出端进行输出，从而完成语音指令输出。

进一步，所述服务器由语音匹配分类模块、语音数据储存库、语音接收模块和声音对照模块组成，语音收录***连接至语音匹配分类模块，通过语音匹配分类模块能够将语音收录***收录的语音数据以及指令进行对应分类，并且将分类后的语音数据输送至语音数据储存库中进行储存，客户端发出的语音指令通过语音接收模块输入语音数据库中，通过声音对照模块将客户端输入的语音指令与语音数据储存库中的声音数据进行对照，从而适配处相对指令并且通过指令输出端进行输出。

进一步，服务器中还设有无效语音库，语音匹配分类模块与语音数据储存库均连接至无效语音库中，在语音匹配分类模块中收录的无法识别的语音输送至无效语音库中，语音数据库中对失效声音数据输入至无效语音库中，以此能够缩减无效声音数据占用语音数据储存库中的空间，管理员可以定期检查无效语音库中的声音数据进行调试。

进一步，服务器中设有错误反馈模块，当客户端输出的声音数据与其意愿相互违和时可以通过错误反馈模块进行反馈，以此能够便于服务器根据客户需求进行改进。

进一步，所述语音收录***由任务部署模块和收录端组成，收录端设有若干个，通过任务部署模块对若干个收录端进行任务的部署，若干个收录端根据任务部署模块部署的任务进行声音数据录入，并将收录的声音数据输送至服务器中进行集中处理存放，以此对声音数据进行收集并学习。

进一步，在收录端处设有网络上传模块，收录端录制的声音数据通过网络上传模块输送至服务器中，以此能够大大提高收录端的收录效率，从各地收录用有不同声音数据。

一种语音库生成方法，包括以下步骤：

S1：任务部署模块对若干个收录端进行任务部署。

S2：收录端根据任务部署模块布置的任务对指定声音数据进行录制并且通过网络上传模块将声音数据上传至服务器中。

S3：通过语音匹配分类模块对声音数据进行匹配分类，并将完成分类后的声音数据传输至声音数据储存库中进行储存，其中将无法识别的语音输送至无效语音库中。

S4：客户端通过语音接收模块将指令声音输送至声音对照模块中，通过声音对照模块对直流声音与语音数据储存库中的声音数据进行对照，从而获取匹配的指令。

S5：通过指令输出端将指令声音进行输出。

S6：客户端输出的声音数据与其意愿相互违和时可以通过错误反馈模块进行反馈。

本发明实施例采用的上述至少一个技术方案能够达到以下有益效果：

其一，该***通过服务器进行数据对比和储存，客户端将语音指令输入至服务器内进行，通过服务器对声音指令进行对比后将声音指令通过指令输出端进行输出，客户端发出的语音指令通过语音接收模块输入语音数据库中，通过声音对照模块将客户端输入的语音指令与语音数据储存库中的声音数据进行对照，从而适配处相对指令并且通过指令输出端进行输出。

其二，该***中设有无效语音库，语音匹配分类模块与语音数据储存库均连接至无效语音库中，在语音匹配分类模块中收录的无法识别的语音输送至无效语音库中，语音数据库中对失效声音数据输入至无效语音库中，以此能够缩减无效声音数据占用语音数据储存库中的空间，管理员可以定期检查无效语音库中的声音数据进行调试。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本发明的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1为本发明的***架构图；

图2为本发明中语音收录***的架构图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合本发明具体实施例及相应的附图对本发明技术方案进行清楚、完整地描述。显然，所描述的实施例仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

以下结合附图，详细说明本发明各实施例提供的技术方案。

一种语音库生成***，包括客户端、语音收录***、服务器和指令输出端，所述语音收录***连接至服务器，通过语音收录***对语音数据进行收集，并且将收集到的语音数据传送至服务器中，通过服务器进行数据对比和储存，所述客户端连接至服务器，客户端将语音指令输入至服务器内进行，通过服务器对声音指令进行对比后将声音指令通过指令输出端进行输出，从而完成语音指令输出。

优选的，所述服务器由语音匹配分类模块、语音数据储存库、语音接收模块和声音对照模块组成，语音收录***连接至语音匹配分类模块，通过语音匹配分类模块能够将语音收录***收录的语音数据以及指令进行对应分类，并且将分类后的语音数据输送至语音数据储存库中进行储存，客户端发出的语音指令通过语音接收模块输入语音数据库中，通过声音对照模块将客户端输入的语音指令与语音数据储存库中的声音数据进行对照，从而适配处相对指令并且通过指令输出端进行输出。

优选的，服务器中还设有无效语音库，语音匹配分类模块与语音数据储存库均连接至无效语音库中，在语音匹配分类模块中收录的无法识别的语音输送至无效语音库中，语音数据库中对失效声音数据输入至无效语音库中，以此能够缩减无效声音数据占用语音数据储存库中的空间，管理员可以定期检查无效语音库中的声音数据进行调试。

优选的，服务器中设有错误反馈模块，当客户端输出的声音数据与其意愿相互违和时可以通过错误反馈模块进行反馈，以此能够便于服务器根据客户需求进行改进。

优选的，所述语音收录***由任务部署模块和收录端组成，收录端设有若干个，通过任务部署模块对若干个收录端进行任务的部署，若干个收录端根据任务部署模块部署的任务进行声音数据录入，并将收录的声音数据输送至服务器中进行集中处理存放，以此对声音数据进行收集并学习。

优选的，在收录端处设有网络上传模块，收录端录制的声音数据通过网络上传模块输送至服务器中，以此能够大大提高收录端的收录效率，从各地收录用有不同声音数据。

一种语音库生成方法，包括以下步骤：

S1：任务部署模块对若干个收录端进行任务部署。

S5：通过指令输出端将指令声音进行输出。

以上所述仅为本发明的实施例而已，并不用于限制本发明。对于本领域技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本发明的权利要求范围之内。

Claims

1.一种语音库生成***，其特征在于：包括客户端、语音收录***、服务器和指令输出端，所述语音收录***连接至服务器，通过语音收录***对语音数据进行收集，并且将收集到的语音数据传送至服务器中，通过服务器进行数据对比和储存，所述客户端连接至服务器，客户端将语音指令输入至服务器内进行，通过服务器对声音指令进行对比后将声音指令通过指令输出端进行输出，从而完成语音指令输出。

2.根据权利要求1所述的一种语音库生成***，其特征在于：所述服务器由语音匹配分类模块、语音数据储存库、语音接收模块和声音对照模块组成，语音收录***连接至语音匹配分类模块，通过语音匹配分类模块能够将语音收录***收录的语音数据以及指令进行对应分类，并且将分类后的语音数据输送至语音数据储存库中进行储存，客户端发出的语音指令通过语音接收模块输入语音数据库中，通过声音对照模块将客户端输入的语音指令与语音数据储存库中的声音数据进行对照，从而适配处相对指令并且通过指令输出端进行输出。

3.根据权利要求1所述的一种语音库生成***，其特征在于：服务器中还设有无效语音库，语音匹配分类模块与语音数据储存库均连接至无效语音库中，在语音匹配分类模块中收录的无法识别的语音输送至无效语音库中，语音数据库中对失效声音数据输入至无效语音库中，以此能够缩减无效声音数据占用语音数据储存库中的空间，管理员可以定期检查无效语音库中的声音数据进行调试。

4.根据权利要求1所述的一种语音库生成***，其特征在于：服务器中设有错误反馈模块，当客户端输出的声音数据与其意愿相互违和时可以通过错误反馈模块进行反馈，以此能够便于服务器根据客户需求进行改进。

5.根据权利要求1所述的一种语音库生成***，其特征在于：所述语音收录***由任务部署模块和收录端组成，收录端设有若干个，通过任务部署模块对若干个收录端进行任务的部署，若干个收录端根据任务部署模块部署的任务进行声音数据录入，并将收录的声音数据输送至服务器中进行集中处理存放，以此对声音数据进行收集并学习。

6.根据权利要求1所述的一种语音库生成***，其特征在于：在收录端处设有网络上传模块，收录端录制的声音数据通过网络上传模块输送至服务器中，以此能够大大提高收录端的收录效率，从各地收录用有不同声音数据。

7.基于权利要要求1-6所述的一种语音库生成***的方法，包括以下步骤：

S1：任务部署模块对若干个收录端进行任务部署；

S2：收录端根据任务部署模块布置的任务对指定声音数据进行录制并且通过网络上传模块将声音数据上传至服务器中；

S3：通过语音匹配分类模块对声音数据进行匹配分类，并将完成分类后的声音数据传输至声音数据储存库中进行储存，其中将无法识别的语音输送至无效语音库中；

S4：客户端通过语音接收模块将指令声音输送至声音对照模块中，通过声音对照模块对直流声音与语音数据储存库中的声音数据进行对照，从而获取匹配的指令；

S5：通过指令输出端将指令声音进行输出；