CN107886938B

CN107886938B - 虚拟现实引导催眠语音处理方法及装置

Info

Publication number: CN107886938B
Application number: CN201610868130.6A
Authority: CN
Inventors: 李荣茂; 臧珊珊; 刘燕君; 陈昳丽; 朱艳春; 陈鸣闽; 谢耀钦
Original assignee: Shenzhen Institute of Advanced Technology of CAS
Current assignee: Shenzhen Institute of Advanced Technology of CAS
Priority date: 2016-09-29
Filing date: 2016-09-29
Publication date: 2020-11-17
Anticipated expiration: 2036-09-29
Also published as: CN107886938A

Abstract

本发明公开了一种虚拟现实引导催眠语音处理方法及装置，其中方法包括：对催眠引导语进行文本分析，获得催眠引导语的文本层次信息；对催眠引导语进行语音分析，获得催眠引导语的语音韵律信息；根据催眠引导语的文本层次信息和语音韵律信息，从催眠语音库中查找相应的语音单元，所述催眠语音库存储有根据使用者易感者录入的语料生成的语音单元；将查找到的语音单元合成催眠语音数据；将催眠语音数据与虚拟现实催眠场景合成，输出虚拟现实引导催眠语音。本发明可以提升使用者的催眠易感性，优化催眠效果。

Description

虚拟现实引导催眠语音处理方法及装置

技术领域

本发明涉及虚拟现实引导催眠技术领域，尤其涉及虚拟现实引导催眠语音处理方法及装置。

背景技术

现有的虚拟现实引导催眠技术，一般用固定的标准化的催眠语音(由专业播音员录制)与虚拟现实催眠场景合成，来引导使用者进入催眠状态。由固定的标准化的催眠语音引导使用者催眠虽然在音调、音色等各个方面能贴近催眠过程语音要求，但是却无法满足使用者更快、更好的催眠需求，催眠效果不佳。

发明内容

本发明实施例提供一种虚拟现实引导催眠语音处理方法，用以提升使用者的催眠易感性，优化催眠效果，该方法包括：

对催眠引导语进行文本分析，获得催眠引导语的文本层次信息；

对催眠引导语进行语音分析，获得催眠引导语的语音韵律信息；

根据催眠引导语的文本层次信息和语音韵律信息，从催眠语音库中查找相应的语音单元，所述催眠语音库存储有根据使用者易感者录入的语料生成的语音单元；

将查找到的语音单元合成催眠语音数据；

将催眠语音数据与虚拟现实催眠场景合成，输出虚拟现实引导催眠语音。

一个实施例中，所述对催眠引导语进行文本分析，获得催眠引导语的文本层次信息，包括：对催眠引导语进行文本语言、语法及语义分析，获得催眠引导语中词语信息、词组信息、句子信息、及词语、词组、句子之间的关系信息。

一个实施例中，所述语料是由使用者易感者根据催眠语音特征录入的；和/或，所述语料是由使用者易感者在指定的采样率和语音分辨率下录入的。

一个实施例中，所述语料是由使用者易感者使用方言录入的；和/或，所述语料是由使用者易感者使用个性化的语言录入的。

一个实施例中，所述的方法还包括：根据使用者易感者录入的语料建立、并实时更新所述催眠语音库；其中，使用隐马尔科夫模型在所述催眠语音库对语料进行拆分，构造语音单元；

所述将查找到的语音单元合成催眠语音数据，包括：使用隐马尔科夫模型对查找到的语音单元进行挑选、拼接及合成处理。

本发明实施例还提供一种虚拟现实引导催眠语音处理装置，用以提升使用者的催眠易感性，优化催眠效果，该装置包括：

文本分析模块，用于对催眠引导语进行文本分析，获得催眠引导语的文本层次信息；

语音分析模块，用于对催眠引导语进行语音分析，获得催眠引导语的语音韵律信息；

语音查询模块，用于根据催眠引导语的文本层次信息和语音韵律信息，从催眠语音库中查找相应的语音单元，所述催眠语音库存储有根据使用者易感者录入的语料生成的语音单元；

语音合成模块，用于将查找到的语音单元合成催眠语音数据；

语音输出模块，用于将催眠语音数据与虚拟现实催眠场景合成，输出虚拟现实引导催眠语音。

一个实施例中，所述文本分析模块进一步用于：对催眠引导语进行文本语言、语法及语义分析，获得催眠引导语中词语信息、词组信息、句子信息、及词语、词组、句子之间的关系信息。

一个实施例中，所述的装置还包括：语料库处理模块，用于根据使用者易感者录入的语料建立、并实时更新所述催眠语音库；其中，使用隐马尔科夫模型在所述催眠语音库对语料进行拆分，构造语音单元；

所述语音合成模块进一步用于：使用隐马尔科夫模型对查找到的语音单元进行挑选、拼接及合成处理。

本发明实施例中考虑催眠过程语音与使用者的催眠易感性匹配，使用语音合成技术，改变了原有的标准化的催眠语音，将使用者易感者的语音进行合成，同时结合催眠引导的特性，最后输出使用者所敏感的催眠语音，从而提升使用者的催眠易感性，优化催眠效果。同时，本发明实施例提供了一种自动化合成语音的方案，免去了现场人工录制的繁琐，满足使用者需求，可以帮助没有任何催眠知识背景的人群自动输出催眠语音，完成催眠过程，帮助使用者更好的进入催眠状态。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。在附图中：

图1为本发明实施例中虚拟现实引导催眠语音处理方法的示意图；

图2为本发明实施例中虚拟现实引导催眠语音处理方法的一个具体实例的示意图；

图3为本发明实施例中虚拟现实引导催眠语音处理装置的示意图；

图4为本发明实施例中虚拟现实引导催眠语音处理装置的一个具体实例的示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚明白，下面结合附图对本发明实施例做进一步详细说明。在此，本发明的示意性实施例及其说明用于解释本发明，但并不作为对本发明的限定。

发明人考虑到，目前的虚拟现实引导催眠技术，使用固定的标准化的催眠语音，无法满足使用者需求，对催眠效果有所影响。而如果考虑催眠过程语音与使用者的催眠易感性匹配，则能更快、更好地实现预期效果。另一方面，使用者的催眠易感声音对象往往没有专业的催眠技术背景，不能为使用者提供专业、有效的催眠引导过程。基于此，在本发明实施例中提供一种虚拟现实引导催眠语音处理方法，通过提升使用者的催眠易感性，来优化催眠效果。

图1为本发明实施例中虚拟现实引导催眠语音处理方法的示意图，如图1所示，该方法可以包括：

步骤101、对催眠引导语进行文本分析，获得催眠引导语的文本层次信息；

步骤102、对催眠引导语进行语音分析，获得催眠引导语的语音韵律信息；

步骤103、根据催眠引导语的文本层次信息和语音韵律信息，从催眠语音库中查找相应的语音单元，所述催眠语音库存储有根据使用者易感者录入的语料生成的语音单元；

步骤104、将查找到的语音单元合成催眠语音数据；

步骤105、将催眠语音数据与虚拟现实催眠场景合成，输出虚拟现实引导催眠语音。

由图1所示流程可以得知，本发明实施例充分考虑到在引导催眠过程中对使用者采用不同的催眠声音特质将对其进入催眠的效果产生不同的影响，其中采用使用者易感者的语音更容易使其进入特定的催眠状态，从而达到更好的催眠效果。同时，本发明实施例提供了一种自动化合成语音的方案，免去了现场人工录制的繁琐，实现催眠完全由机器生成的阶段性成果，可输出具有使用者易感者语音特色的催眠语音，满足使用者需求。另一方面，本发明实施例借助语音合成技术，可以帮助没有任何催眠知识背景的人群自动输出催眠语音，完成催眠过程，帮助使用者更好的进入催眠状态。

具体实施时，可以在前期对使用者易感者进行语料搜集，以建立催眠语音库。催眠语音库存储有根据使用者易感者录入的语料生成的语音单元。实施例中可以根据将要输出的催眠语音特征设计语料，然后让使用者易感者在特定的要求下录制语料，接下来对所录制的语料进行分析，设置，建立所需要的催眠语音库。具体实施时，使用者易感者录入的语料，可以是由使用者易感者根据催眠语音特征录入的。根据催眠语音特征，使用者易感者应在特定的要求下录入语料，例如，在录制语料时，要求录制者音量一致、语速平缓、发音清晰、感情和缓。使用者易感者录入的语料，也可以是由使用者易感者在指定的采样率和语音分辨率下录入的。例如要求录制者在特定的采样率、语音分辨率下录制高信噪比语音，使得语料更加标准。

此外，考虑到本发明实施例旨在借助语音合成技术解决在虚拟现实引导催眠过程中由于使用者对催眠师语音的不熟悉、不敏感，致使催眠效果受到影响的问题，使用语音合成技术，实现在虚拟现实引导催眠过程中自动输出使用者催眠易感的声音，从而在语言特质方面，与使用者建立起感情联结，优化催眠效果；而使用者的方言、或其信任的人的声音更容易使其进入特定的催眠状态，从而达到更好的催眠效果，因此，使用者易感者录入的语料可以是由使用者易感者使用方言录入的，和/或，是由使用者易感者使用个性化的语言录入的。这样，通过输出具有本地特色、个性化的催眠语音，满足使用者的需求。鉴于本发明实施例引入语音合成技术的关键是为了输出使用者催眠易感者的语音，所以前期语料的录制者建议经过特定选择。

在使用者易感者录入语料后，根据使用者易感者录入的语料建立、并实时更新催眠语音库。在建立、更新催眠语音库的过程中，可以使用隐马尔科夫模型在所述催眠语音库对语料进行拆分，构造语音单元。

在需要输出虚拟现实引导催眠语音时，需要先对催眠引导语进行文本分析，获得催眠引导语的文本层次信息；对催眠引导语进行语音分析，获得催眠引导语的语音韵律信息。其中，对催眠引导语进行文本分析，获得催眠引导语的文本层次信息，例如可以包括：对催眠引导语进行文本语言、语法及语义分析，获得催眠引导语中词语信息、词组信息、句子信息、及词语、词组、句子之间的关系信息。

在具体的实施例中，进行催眠引导语的文本分析和语音层韵律分析时，可以首先对文字版的催眠引导语进行文本分析，分别在语言层、语法层、语义层方面进行分析，得到催眠引导语的层次信息，也就是词组、短语、句子等的层次关系；例如结合虚拟现实催眠特点，与专业催眠师协商完成的催眠引导语主要包含有渐进式放松引导、催眠场景引导等，通过对文本信息进行语法、语义的分析，得到催眠引导语中词语、词组、句子等信息。然后，在催眠引导语的语音层的基础上进行韵律分析，例如分析催眠引导语对应声音的音色、语调、响度等信息，得到语音层面的韵律信息。

在获得催眠引导语的文本层次信息和语音韵律信息后，根据催眠引导语的文本层次信息和语音韵律信息，从催眠语音库中查找相应的语音单元，然后将查找到的语音单元合成催眠语音数据。具体实施时，可以使用隐马尔科夫模型对查找到的语音单元进行挑选、拼接及合成处理。对从催眠语音库中提取的语音单元进行相应合成处理，得到所需要的语音数据，也即是使用者易感的催眠语音数据。在具体的实例中，催眠引导语以一种缓和且有感情的方式输出，所以在语音合成过程中，需要控制速度且将感情赋予催眠语音中。

最后，将催眠语音数据与虚拟现实催眠场景合成，输出虚拟现实引导催眠语音。例如可以在专业催眠师的指导下，对合成的催眠语音数据进行调整、优化，最后成型，再将其导入到虚拟现实催眠场景中，输出虚拟现实引导催眠语音。

图2为本发明实施例中虚拟现实引导催眠语音处理方法的一个具体实例的示意图，如图2所示，本例中，对于虚拟现实催眠场景，先设计语料，由使用者易感者输入录制语料，以此建立催眠语音库，使用隐马尔科夫模型(HMM)构造语音单元在催眠语音库中进行存储；在确定催眠引导语后，对催眠引导语进行文本分析，获得催眠引导语的文本层次信息，对催眠引导语进行语音分析，获得催眠引导语的语音韵律信息；然后，根据催眠引导语的文本层次信息和语音韵律信息，从催眠语音库中查找相应的语音单元，将查找到的语音单元合成催眠语音数据；对催眠语音数据进行优化，与虚拟现实催眠场景合成，最后输出虚拟现实引导催眠语音。

由上述实施例可以得知，本发明实施例使用语音合成技术，通过前期对使用者易感者进行语料搜集，搜集到使用者催眠易感声音的特定语句，由此建立催眠语音库，然后只需提供文字信息，进行语音分析、语音单元提取及合成等工作，最后实现输出使用者更敏感的人的催眠语音，增强催眠效果，催眠过程将在原始催眠效果的基础上增加情感维度，提升使用者的情感认知，从而提升催眠效果。

基于同一发明构思，本发明实施例中还提供了一种虚拟现实引导催眠语音处理装置，如下面的实施例所述。由于该装置解决问题的原理与虚拟现实引导催眠语音处理方法相似，因此该装置的实施可以参见虚拟现实引导催眠语音处理方法的实施，重复之处不再赘述。

图3为本发明实施例中虚拟现实引导催眠语音处理装置的示意图，如图3所示，该装置可以包括：

文本分析模块301，用于对催眠引导语进行文本分析，获得催眠引导语的文本层次信息；

语音分析模块302，用于对催眠引导语进行语音分析，获得催眠引导语的语音韵律信息；

语音查询模块303，用于根据催眠引导语的文本层次信息和语音韵律信息，从催眠语音库中查找相应的语音单元，所述催眠语音库存储有根据使用者易感者录入的语料生成的语音单元；

语音合成模块304，用于将查找到的语音单元合成催眠语音数据；

语音输出模块305，用于将催眠语音数据与虚拟现实催眠场景合成，输出虚拟现实引导催眠语音。

具体实施时，文本分析模块301可以进一步用于：对催眠引导语进行文本语言、语法及语义分析，获得催眠引导语中词语信息、词组信息、句子信息、及词语、词组、句子之间的关系信息。

具体实施时，所述语料可以是由使用者易感者根据催眠语音特征录入的；和/或，所述语料可以是由使用者易感者在指定的采样率和语音分辨率下录入的。

具体实施时，所述语料可以是由使用者易感者使用方言录入的；和/或，所述语料可以是由使用者易感者使用个性化的语言录入的。

图4为本发明实施例中虚拟现实引导催眠语音处理装置的一个具体实例的示意图，如图4所示，图3所示装置还可以包括：语料库处理模块401，用于根据使用者易感者录入的语料建立、并实时更新所述催眠语音库；其中，使用隐马尔科夫模型在所述催眠语音库对语料进行拆分，构造语音单元；

语音合成模块304可以进一步用于：使用隐马尔科夫模型对查找到的语音单元进行挑选、拼接及合成处理。

综上所述，本发明实施例在现有的虚拟现实催眠技术的基础上，考虑到不同敏感度的语言特质对使用者的催眠效果有着不同的影响，将语音合成技术与虚拟现实催眠场景进行结合，在原有的标准化(由专业播音员录制)的催眠语音基础上进行改进，最后输出使用者催眠易感的引导语音，从而达到更有效的催眠的状态。本发明实施例提供了一种自动化合成语音的方案，并可输出各种具有本地特色的催眠语音、满足使用者需求。另一方面，借助语音合成技术，可以合成输出标准化的催眠易感特异性催眠语音，完成催眠过程，帮助使用者更好的进入催眠状态。

本发明实施例可以应用于胸腹部肿瘤患者放疗临床呼吸控制的虚拟现实引导催眠过程中。

本领域内的技术人员应明白，本发明的实施例可提供为方法、***、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上所述的具体实施例，对本发明的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本发明的具体实施例而已，并不用于限定本发明的保护范围，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种虚拟现实引导催眠语音处理方法，其特征在于，包括：

将查找到的语音单元合成催眠语音数据；

将催眠语音数据与虚拟现实催眠场景合成，输出虚拟现实引导催眠语音；

其中，所述语料是根据催眠语音特征由使用者易感者根据要求使用方言录入的；和/或，所述语料是由使用者易感者在指定的采样率和语音分辨率下使用个性化的语言录入的。

2.如权利要求1所述的方法，其特征在于，所述对催眠引导语进行文本分析，获得催眠引导语的文本层次信息，包括：对催眠引导语进行文本语言、语法及语义分析，获得催眠引导语中词语信息、词组信息、句子信息、及词语、词组、句子之间的关系信息。

3.如权利要求1至2任一项所述的方法，其特征在于，还包括：根据使用者易感者录入的语料建立、并实时更新所述催眠语音库；其中，使用隐马尔科夫模型在所述催眠语音库对语料进行拆分，构造语音单元；

4.一种虚拟现实引导催眠语音处理装置，其特征在于，包括：

语音输出模块，用于将催眠语音数据与虚拟现实催眠场景合成，输出虚拟现实引导催眠语音；

5.如权利要求4所述的装置，其特征在于，所述文本分析模块进一步用于：对催眠引导语进行文本语言、语法及语义分析，获得催眠引导语中词语信息、词组信息、句子信息、及词语、词组、句子之间的关系信息。

6.如权利要求4至5任一项所述的装置，其特征在于，还包括：语料库处理模块，用于根据使用者易感者录入的语料建立、并实时更新所述催眠语音库；其中，使用隐马尔科夫模型在所述催眠语音库对语料进行拆分，构造语音单元；