CN108417200A

CN108417200A - 语音合成播报方法和装置

Info

Publication number: CN108417200A
Application number: CN201810161931.8A
Authority: CN
Inventors: 陈锡俊; 陈耀; 胡建文
Original assignee: Hunan Shijie Information Technology Co Ltd
Current assignee: Hunan Shijie Information Technology Co Ltd
Priority date: 2018-02-27
Filing date: 2018-02-27
Publication date: 2018-08-17

Abstract

本申请涉及一种语音合成播报方法，包括：获取用户输入的预设播报时间、播报次数和待播报的文本；文本包括至少一个词汇；从动态语音库中获取文本包含的词汇对应的语音；将获取的文本包含的词汇对应的语音，合成待播报的语音并存储；将已合成并存储的待播报的语音，按照预设播报时间、播报次数进行语音播报。当使用本申请提供的方法进行语音的合成播报时，可以通过预设播报时间和播报次数来控制对于待播报的文本的语音合成播报，满足了在预设时间播报文本的需求。

Description

语音合成播报方法和装置

技术领域

本发明涉及语音合成领域，尤其涉及一种语音合成播报方法和装置。

背景技术

相关技术，存在大量的语音合成播报的装置，但现在的语音合成播报的装置中，都只是简单的对语音进行合成播报，功能单一。

发明内容

为至少在一定程度上克服相关技术中存在的问题，本申请提供一种语音合成播报方法和装置。

根据本申请实施例的第一方面，提供一种语音合成播报方法，包括：

获取用户输入的预设播报时间、播报次数和待播报的文本；所述文本包括至少一个词汇；

从动态语音库中获取所述文本包含的所述词汇对应的语音；

将获取的所述文本包含的所述词汇对应的语音，合成待播报的语音并存储；

将已合成并存储的所述待播报的语音，按照所述预设播报时间、播报次数进行语音播报。

可选的，还包括获取用户输入的预设播报音质；

所述从动态语音库中获取所述文本包含的所述词汇对应的语音，包括：

根据预设播报音质，从动态语音库中获取所述文本包含的所述词汇对应的语音。

可选的，还包括将所述待播报的语音添加到所述动态语音库。

可选的，所述文本包括汉字、英文单词、希腊字母、数字和通用符号中的至少一项。

可选的，所述动态语音库中的语音以MFCC或MR的方式编码。

根据本申请实施例的第二方面，提供了一种语音合成播报装置，包括：

第一获取模块，用于获取用户输入的预设播报时间、播报次数和待播报的文本；所述文本包括至少一个词汇；

第二获取模块，用于从动态语音库中获取所述文本包含的所述词汇对应的语音；

合成模块，用于将获取的所述文本包含的所述词汇对应的语音，合成待播报的语音并存储；

语音播报模块，用于将已合成并存储的所述待播报的语音，按照所述预设播报时间、播报次数进行语音播报。

可选的，所述第一获取模块，还用于获取用户输入的预设播报音质；

所述第二获取模块，用于根据预设播报音质，从动态语音库中获取所述文本包含的所述词汇对应的语音。

可选的，还包括添加模块；所述添加模块，用于将所述待播报的语音添加到所述动态语音库。

可选的，所述动态语音库中的语音以MFCC或MR的方式编码。

根据本申请实施例的第三方面，提供一种非临时性计算机可读存储介质，当所述存储介质中的指令由语音合成播报装置的处理器执行时，使得语音合成播报装置能够执行一种语音合成播报方法，所述方法包括：处理器；所述处理器，用于存储处理器可执行指令的存储器；其中，所述处理器被配置为：获取用户输入的预设播报时间、播报次数和待播报的文本；所述文本包括至少一个词汇；

从动态语音库中获取所述文本包含的所述词汇对应的语音；

可选的，还包括获取用户输入的预设播报音质；

可选的，还包括：将所述待播报的语音添加到所述动态语音库。

可选的，所述动态语音库中的语音以MFCC或MR的方式编码。

根据本申请实施例的第四方面，提供一种语音合成播报装置，包括：处理器；用于存储处理器可执行指令的存储器；其中，所述处理器被配置为：获取用户输入的预设播报时间、播报次数和待播报的文本；所述文本包括至少一个词汇；

从动态语音库中获取所述文本包含的所述词汇对应的语音；

可选的，还包括获取用户输入的预设播报音质；

可选的，所述动态语音库中的语音以MFCC或MR的方式编码。

本申请的实施例提供的技术方案可以包括以下有益效果：

由于获取用户输入的预设播报时间、播报次数和待播报的文本，可以按照所述预设播报时间、播报次数进行语音播报。当使用本申请提供的方法进行语音的合成播报时，可以通过预设播报时间和播报次数来控制对于待播报的文本的语音合成播报，满足了在预设时间播报文本的需求。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本申请。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本申请的实施例，并与说明书一起用于解释本申请的原理。

图1是本申请一个实施例提供的一种语音合成播报方法的流程示意图。

图2是本申请一个实施例提供的一种语音合成播报装置的结构示意图。

图3是本申请另一个实施例提供的一种语音合成播报装置的结构示意图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法相一致的例子。

图1是本申请一个实施例提供的语音合成播报的流程图。参见图1，本实施例的方法可以包括：

步骤110、获取用户输入的预设播报时间、播报次数和待播报的文本；文本包括至少一个词汇。

本步骤中，文本包括汉字、英文单词、希腊字母、数字和通用符号中的至少一项。词汇可以是单个的汉字，组成词语的多个汉字，英语单词、通用符号等。通用符号可以使“@”“π”等符号。

步骤120、从动态语音库中获取文本包含的词汇对应的语音。

本步骤中，动态语音库内部存储有常用的词汇对应的语音。当发现动态语音库内部存储没有储存待播报的文本中的词汇对应的语音时，可以通过外部设备将使将待播报的语音添加到动态语音库，以避免出现因动态语音库内部没有存储词汇对应的语音而无法获取的问题。

其中，动态语音库中的语音以MFCC或MR的方式编码。

步骤130、将获取的文本包含的词汇对应的语音，合成待播报的语音并存储。

步骤140、将已合成并存储的待播报的语音，按照预设播报时间、播报次数进行语音播报。

由于获取用户输入的预设播报时间、播报次数和待播报的文本，可以按照预设播报时间、播报次数进行语音播报。当使用本申请提供的方法进行语音的合成播报时，可以通过预设播报时间和播报次数来控制对于待播报的文本的语音合成播报，满足了在预设时间播报文本的需求。

步骤110，获取用户输入的预设播报时间、播报次数和待播报的文本；文本包括至少一个词汇。

本步骤中，还可以获取用户输入的预设播报音质；步骤120中、可以根据预设播报音质，从动态语音库中获取文本包含的词汇对应的语音。这样就可以根据预设播报音质，播放不同音质的语音。

图2是本申请另一个实施例提供的语音合成播报装置的结构示意图。参见图2，本实施例的装置包括第一获取201、第二获取模块202、合成模块203和语音播报模块204。其中：

第一获取模块201，用于获取用户输入的预设播报时间、播报次数和待播报的文本；文本包括至少一个词汇；

第二获取模块202，用于从动态语音库中获取文本包含的词汇对应的语音；

合成模块203，用于将获取的文本包含的词汇对应的语音，合成待播报的语音并存储；

语音播报模块204，用于将已合成并存储的待播报的语音，按照预设播报时间、播报次数进行语音播报。

较佳的，第一获取模块201，还用于获取用户输入的预设播报音质；第二获取模块202，还用于根据预设播报音质，从动态语音库中获取文本包含的词汇对应的语音。

基于上述相关实施例，语音合成播报装置还包括：添加模块；添加模块，用于将待播报的语音添加到动态语音库。

其中，文本包括汉字、英文单词、希腊字母、数字和通用符号中的至少一项。

其中动态语音库中的语音以MFCC或MR的方式编码。

图3是本申请另一个实施例提供的一种语音合成播报装置的结构示意图。参见图3，本实施例的装置包括：处理器301；用于存储处理器可执行指令的存储器302；其中，处理器301被配置为获取用户输入的预设播报时间、播报次数和待播报的文本；文本包括至少一个词汇；

从动态语音库中获取文本包含的词汇对应的语音；

将获取的文本包含的词汇对应的语音，合成待播报的语音并存储；

将已合成并存储的待播报的语音，按照预设播报时间、播报次数进行语音播报。

较佳的，处理器301，还被配置为，将待播报的语音添加到动态语音库。

基于上述相关实施例，当预设信息中包括预设播报音质时，处理器301，具体被配置为：获取用户输入的预设播报音质；

从动态语音库中获取文本包含的词汇对应的语音，包括：

根据预设播报音质，从动态语音库中获取文本包含的词汇对应的语音。

其中，动态语音库中的语音以MFCC或MR的方式编码。

关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

可以理解的是，上述各实施例中相同或相似部分可以相互参考，在一些实施例中未详细说明的内容可以参见其他实施例中相同或相似的内容。

需要说明的是，在本申请的描述中，术语“第一”、“第二”等仅用于描述目的，而不能理解为指示或暗示相对重要性。此外，在本申请的描述中，除非另有说明，“多个”的含义是指至少两个。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本申请的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本申请的实施例所属技术领域的技术人员所理解。

应当理解，本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行***执行的软件或固件来实现。例如，如果用硬件来实现，和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(PGA)，现场可编程门阵列(FPGA)等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，该程序在执行时，包括方法实施例的步骤之一或其组合。

此外，在本申请各个实施例中的各功能单元可以集成在一个处理模块中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。

上述提到的存储介质可以是只读存储器，磁盘或光盘等。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

尽管上面已经示出和描述了本申请的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本申请的限制，本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims

1.一种语音合成播报方法，其特征在于，包括：

从动态语音库中获取所述文本包含的所述词汇对应的语音；

2.根据权利要求1所述的方法，其特征在于，该方法还包括：获取用户输入的预设播报音质；

3.根据权利要求1所述方法，其特征在于，该方法还包括：将所述待播报的语音添加到所述动态语音库。

4.根据权利要求1所述的方法，其特征在于，所述文本包括汉字、英文单词、希腊字母、数字和通用符号中的至少一项。

5.根据权利要求1所述的方法，其特征在于，所述动态语音库中的语音以MFCC或MR的方式编码。

6.一种语音合成播报装置，其特征在于，包括：

7.根据权利要求1所述的装置，其特征在于，所述第一获取模块，还用于获取用户输入的预设播报音质；

8.根据权利要求1所述的装置，其特征在于，该装置还包括：添加模块；所述添加模块，用于将所述待播报的语音添加到所述动态语音库。

9.根据权利要求1所述的装置，其特征在于，所述文本包括汉字、英文单词、希腊字母、数字和通用符号中的至少一项。

10.根据权利要求1所述的装置，其特征在于，所述动态语音库中的语音以MFCC或MR的方式编码。