CN107886938B - 虚拟现实引导催眠语音处理方法及装置 - Google Patents
虚拟现实引导催眠语音处理方法及装置 Download PDFInfo
- Publication number
- CN107886938B CN107886938B CN201610868130.6A CN201610868130A CN107886938B CN 107886938 B CN107886938 B CN 107886938B CN 201610868130 A CN201610868130 A CN 201610868130A CN 107886938 B CN107886938 B CN 107886938B
- Authority
- CN
- China
- Prior art keywords
- voice
- hypnosis
- hypnotic
- guide
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000000147 hypnotic effect Effects 0.000 title claims abstract description 260
- 238000003672 processing method Methods 0.000 title claims abstract description 13
- 238000004458 analytical method Methods 0.000 claims abstract description 42
- 230000002194 synthesizing effect Effects 0.000 claims abstract description 28
- 238000000034 method Methods 0.000 claims abstract description 20
- 230000033764 rhythmic process Effects 0.000 claims abstract description 17
- 230000015572 biosynthetic process Effects 0.000 claims description 16
- 238000003786 synthesis reaction Methods 0.000 claims description 16
- 238000005070 sampling Methods 0.000 claims description 7
- 230000000694 effects Effects 0.000 abstract description 10
- 238000010586 diagram Methods 0.000 description 16
- 230000008569 process Effects 0.000 description 13
- 238000005516 engineering process Methods 0.000 description 11
- 238000004590 computer program Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 4
- 230000008451 emotion Effects 0.000 description 2
- 230000002996 emotional effect Effects 0.000 description 2
- 206010028980 Neoplasm Diseases 0.000 description 1
- 210000001015 abdomen Anatomy 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000003631 expected effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000003326 hypnotic agent Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000001959 radiotherapy Methods 0.000 description 1
- 230000029058 respiratory gaseous exchange Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Signal Processing (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了一种虚拟现实引导催眠语音处理方法及装置,其中方法包括:对催眠引导语进行文本分析,获得催眠引导语的文本层次信息;对催眠引导语进行语音分析,获得催眠引导语的语音韵律信息;根据催眠引导语的文本层次信息和语音韵律信息,从催眠语音库中查找相应的语音单元,所述催眠语音库存储有根据使用者易感者录入的语料生成的语音单元;将查找到的语音单元合成催眠语音数据;将催眠语音数据与虚拟现实催眠场景合成,输出虚拟现实引导催眠语音。本发明可以提升使用者的催眠易感性,优化催眠效果。
Description
技术领域
本发明涉及虚拟现实引导催眠技术领域,尤其涉及虚拟现实引导催眠语音处理方法及装置。
背景技术
现有的虚拟现实引导催眠技术,一般用固定的标准化的催眠语音(由专业播音员录制)与虚拟现实催眠场景合成,来引导使用者进入催眠状态。由固定的标准化的催眠语音引导使用者催眠虽然在音调、音色等各个方面能贴近催眠过程语音要求,但是却无法满足使用者更快、更好的催眠需求,催眠效果不佳。
发明内容
本发明实施例提供一种虚拟现实引导催眠语音处理方法,用以提升使用者的催眠易感性,优化催眠效果,该方法包括:
对催眠引导语进行文本分析,获得催眠引导语的文本层次信息;
对催眠引导语进行语音分析,获得催眠引导语的语音韵律信息;
根据催眠引导语的文本层次信息和语音韵律信息,从催眠语音库中查找相应的语音单元,所述催眠语音库存储有根据使用者易感者录入的语料生成的语音单元;
将查找到的语音单元合成催眠语音数据;
将催眠语音数据与虚拟现实催眠场景合成,输出虚拟现实引导催眠语音。
一个实施例中,所述对催眠引导语进行文本分析,获得催眠引导语的文本层次信息,包括:对催眠引导语进行文本语言、语法及语义分析,获得催眠引导语中词语信息、词组信息、句子信息、及词语、词组、句子之间的关系信息。
一个实施例中,所述语料是由使用者易感者根据催眠语音特征录入的;和/或,所述语料是由使用者易感者在指定的采样率和语音分辨率下录入的。
一个实施例中,所述语料是由使用者易感者使用方言录入的;和/或,所述语料是由使用者易感者使用个性化的语言录入的。
一个实施例中,所述的方法还包括:根据使用者易感者录入的语料建立、并实时更新所述催眠语音库;其中,使用隐马尔科夫模型在所述催眠语音库对语料进行拆分,构造语音单元;
所述将查找到的语音单元合成催眠语音数据,包括:使用隐马尔科夫模型对查找到的语音单元进行挑选、拼接及合成处理。
本发明实施例还提供一种虚拟现实引导催眠语音处理装置,用以提升使用者的催眠易感性,优化催眠效果,该装置包括:
文本分析模块,用于对催眠引导语进行文本分析,获得催眠引导语的文本层次信息;
语音分析模块,用于对催眠引导语进行语音分析,获得催眠引导语的语音韵律信息;
语音查询模块,用于根据催眠引导语的文本层次信息和语音韵律信息,从催眠语音库中查找相应的语音单元,所述催眠语音库存储有根据使用者易感者录入的语料生成的语音单元;
语音合成模块,用于将查找到的语音单元合成催眠语音数据;
语音输出模块,用于将催眠语音数据与虚拟现实催眠场景合成,输出虚拟现实引导催眠语音。
一个实施例中,所述文本分析模块进一步用于:对催眠引导语进行文本语言、语法及语义分析,获得催眠引导语中词语信息、词组信息、句子信息、及词语、词组、句子之间的关系信息。
一个实施例中,所述语料是由使用者易感者根据催眠语音特征录入的;和/或,所述语料是由使用者易感者在指定的采样率和语音分辨率下录入的。
一个实施例中,所述语料是由使用者易感者使用方言录入的;和/或,所述语料是由使用者易感者使用个性化的语言录入的。
一个实施例中,所述的装置还包括:语料库处理模块,用于根据使用者易感者录入的语料建立、并实时更新所述催眠语音库;其中,使用隐马尔科夫模型在所述催眠语音库对语料进行拆分,构造语音单元;
所述语音合成模块进一步用于:使用隐马尔科夫模型对查找到的语音单元进行挑选、拼接及合成处理。
本发明实施例中考虑催眠过程语音与使用者的催眠易感性匹配,使用语音合成技术,改变了原有的标准化的催眠语音,将使用者易感者的语音进行合成,同时结合催眠引导的特性,最后输出使用者所敏感的催眠语音,从而提升使用者的催眠易感性,优化催眠效果。同时,本发明实施例提供了一种自动化合成语音的方案,免去了现场人工录制的繁琐,满足使用者需求,可以帮助没有任何催眠知识背景的人群自动输出催眠语音,完成催眠过程,帮助使用者更好的进入催眠状态。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1为本发明实施例中虚拟现实引导催眠语音处理方法的示意图;
图2为本发明实施例中虚拟现实引导催眠语音处理方法的一个具体实例的示意图;
图3为本发明实施例中虚拟现实引导催眠语音处理装置的示意图;
图4为本发明实施例中虚拟现实引导催眠语音处理装置的一个具体实例的示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚明白,下面结合附图对本发明实施例做进一步详细说明。在此,本发明的示意性实施例及其说明用于解释本发明,但并不作为对本发明的限定。
发明人考虑到,目前的虚拟现实引导催眠技术,使用固定的标准化的催眠语音,无法满足使用者需求,对催眠效果有所影响。而如果考虑催眠过程语音与使用者的催眠易感性匹配,则能更快、更好地实现预期效果。另一方面,使用者的催眠易感声音对象往往没有专业的催眠技术背景,不能为使用者提供专业、有效的催眠引导过程。基于此,在本发明实施例中提供一种虚拟现实引导催眠语音处理方法,通过提升使用者的催眠易感性,来优化催眠效果。
图1为本发明实施例中虚拟现实引导催眠语音处理方法的示意图,如图1所示,该方法可以包括:
步骤101、对催眠引导语进行文本分析,获得催眠引导语的文本层次信息;
步骤102、对催眠引导语进行语音分析,获得催眠引导语的语音韵律信息;
步骤103、根据催眠引导语的文本层次信息和语音韵律信息,从催眠语音库中查找相应的语音单元,所述催眠语音库存储有根据使用者易感者录入的语料生成的语音单元;
步骤104、将查找到的语音单元合成催眠语音数据;
步骤105、将催眠语音数据与虚拟现实催眠场景合成,输出虚拟现实引导催眠语音。
由图1所示流程可以得知,本发明实施例充分考虑到在引导催眠过程中对使用者采用不同的催眠声音特质将对其进入催眠的效果产生不同的影响,其中采用使用者易感者的语音更容易使其进入特定的催眠状态,从而达到更好的催眠效果。同时,本发明实施例提供了一种自动化合成语音的方案,免去了现场人工录制的繁琐,实现催眠完全由机器生成的阶段性成果,可输出具有使用者易感者语音特色的催眠语音,满足使用者需求。另一方面,本发明实施例借助语音合成技术,可以帮助没有任何催眠知识背景的人群自动输出催眠语音,完成催眠过程,帮助使用者更好的进入催眠状态。
具体实施时,可以在前期对使用者易感者进行语料搜集,以建立催眠语音库。催眠语音库存储有根据使用者易感者录入的语料生成的语音单元。实施例中可以根据将要输出的催眠语音特征设计语料,然后让使用者易感者在特定的要求下录制语料,接下来对所录制的语料进行分析,设置,建立所需要的催眠语音库。具体实施时,使用者易感者录入的语料,可以是由使用者易感者根据催眠语音特征录入的。根据催眠语音特征,使用者易感者应在特定的要求下录入语料,例如,在录制语料时,要求录制者音量一致、语速平缓、发音清晰、感情和缓。使用者易感者录入的语料,也可以是由使用者易感者在指定的采样率和语音分辨率下录入的。例如要求录制者在特定的采样率、语音分辨率下录制高信噪比语音,使得语料更加标准。
此外,考虑到本发明实施例旨在借助语音合成技术解决在虚拟现实引导催眠过程中由于使用者对催眠师语音的不熟悉、不敏感,致使催眠效果受到影响的问题,使用语音合成技术,实现在虚拟现实引导催眠过程中自动输出使用者催眠易感的声音,从而在语言特质方面,与使用者建立起感情联结,优化催眠效果;而使用者的方言、或其信任的人的声音更容易使其进入特定的催眠状态,从而达到更好的催眠效果,因此,使用者易感者录入的语料可以是由使用者易感者使用方言录入的,和/或,是由使用者易感者使用个性化的语言录入的。这样,通过输出具有本地特色、个性化的催眠语音,满足使用者的需求。鉴于本发明实施例引入语音合成技术的关键是为了输出使用者催眠易感者的语音,所以前期语料的录制者建议经过特定选择。
在使用者易感者录入语料后,根据使用者易感者录入的语料建立、并实时更新催眠语音库。在建立、更新催眠语音库的过程中,可以使用隐马尔科夫模型在所述催眠语音库对语料进行拆分,构造语音单元。
在需要输出虚拟现实引导催眠语音时,需要先对催眠引导语进行文本分析,获得催眠引导语的文本层次信息;对催眠引导语进行语音分析,获得催眠引导语的语音韵律信息。其中,对催眠引导语进行文本分析,获得催眠引导语的文本层次信息,例如可以包括:对催眠引导语进行文本语言、语法及语义分析,获得催眠引导语中词语信息、词组信息、句子信息、及词语、词组、句子之间的关系信息。
在具体的实施例中,进行催眠引导语的文本分析和语音层韵律分析时,可以首先对文字版的催眠引导语进行文本分析,分别在语言层、语法层、语义层方面进行分析,得到催眠引导语的层次信息,也就是词组、短语、句子等的层次关系;例如结合虚拟现实催眠特点,与专业催眠师协商完成的催眠引导语主要包含有渐进式放松引导、催眠场景引导等,通过对文本信息进行语法、语义的分析,得到催眠引导语中词语、词组、句子等信息。然后,在催眠引导语的语音层的基础上进行韵律分析,例如分析催眠引导语对应声音的音色、语调、响度等信息,得到语音层面的韵律信息。
在获得催眠引导语的文本层次信息和语音韵律信息后,根据催眠引导语的文本层次信息和语音韵律信息,从催眠语音库中查找相应的语音单元,然后将查找到的语音单元合成催眠语音数据。具体实施时,可以使用隐马尔科夫模型对查找到的语音单元进行挑选、拼接及合成处理。对从催眠语音库中提取的语音单元进行相应合成处理,得到所需要的语音数据,也即是使用者易感的催眠语音数据。在具体的实例中,催眠引导语以一种缓和且有感情的方式输出,所以在语音合成过程中,需要控制速度且将感情赋予催眠语音中。
最后,将催眠语音数据与虚拟现实催眠场景合成,输出虚拟现实引导催眠语音。例如可以在专业催眠师的指导下,对合成的催眠语音数据进行调整、优化,最后成型,再将其导入到虚拟现实催眠场景中,输出虚拟现实引导催眠语音。
图2为本发明实施例中虚拟现实引导催眠语音处理方法的一个具体实例的示意图,如图2所示,本例中,对于虚拟现实催眠场景,先设计语料,由使用者易感者输入录制语料,以此建立催眠语音库,使用隐马尔科夫模型(HMM)构造语音单元在催眠语音库中进行存储;在确定催眠引导语后,对催眠引导语进行文本分析,获得催眠引导语的文本层次信息,对催眠引导语进行语音分析,获得催眠引导语的语音韵律信息;然后,根据催眠引导语的文本层次信息和语音韵律信息,从催眠语音库中查找相应的语音单元,将查找到的语音单元合成催眠语音数据;对催眠语音数据进行优化,与虚拟现实催眠场景合成,最后输出虚拟现实引导催眠语音。
由上述实施例可以得知,本发明实施例使用语音合成技术,通过前期对使用者易感者进行语料搜集,搜集到使用者催眠易感声音的特定语句,由此建立催眠语音库,然后只需提供文字信息,进行语音分析、语音单元提取及合成等工作,最后实现输出使用者更敏感的人的催眠语音,增强催眠效果,催眠过程将在原始催眠效果的基础上增加情感维度,提升使用者的情感认知,从而提升催眠效果。
基于同一发明构思,本发明实施例中还提供了一种虚拟现实引导催眠语音处理装置,如下面的实施例所述。由于该装置解决问题的原理与虚拟现实引导催眠语音处理方法相似,因此该装置的实施可以参见虚拟现实引导催眠语音处理方法的实施,重复之处不再赘述。
图3为本发明实施例中虚拟现实引导催眠语音处理装置的示意图,如图3所示,该装置可以包括:
文本分析模块301,用于对催眠引导语进行文本分析,获得催眠引导语的文本层次信息;
语音分析模块302,用于对催眠引导语进行语音分析,获得催眠引导语的语音韵律信息;
语音查询模块303,用于根据催眠引导语的文本层次信息和语音韵律信息,从催眠语音库中查找相应的语音单元,所述催眠语音库存储有根据使用者易感者录入的语料生成的语音单元;
语音合成模块304,用于将查找到的语音单元合成催眠语音数据;
语音输出模块305,用于将催眠语音数据与虚拟现实催眠场景合成,输出虚拟现实引导催眠语音。
具体实施时,文本分析模块301可以进一步用于:对催眠引导语进行文本语言、语法及语义分析,获得催眠引导语中词语信息、词组信息、句子信息、及词语、词组、句子之间的关系信息。
具体实施时,所述语料可以是由使用者易感者根据催眠语音特征录入的;和/或,所述语料可以是由使用者易感者在指定的采样率和语音分辨率下录入的。
具体实施时,所述语料可以是由使用者易感者使用方言录入的;和/或,所述语料可以是由使用者易感者使用个性化的语言录入的。
图4为本发明实施例中虚拟现实引导催眠语音处理装置的一个具体实例的示意图,如图4所示,图3所示装置还可以包括:语料库处理模块401,用于根据使用者易感者录入的语料建立、并实时更新所述催眠语音库;其中,使用隐马尔科夫模型在所述催眠语音库对语料进行拆分,构造语音单元;
语音合成模块304可以进一步用于:使用隐马尔科夫模型对查找到的语音单元进行挑选、拼接及合成处理。
综上所述,本发明实施例在现有的虚拟现实催眠技术的基础上,考虑到不同敏感度的语言特质对使用者的催眠效果有着不同的影响,将语音合成技术与虚拟现实催眠场景进行结合,在原有的标准化(由专业播音员录制)的催眠语音基础上进行改进,最后输出使用者催眠易感的引导语音,从而达到更有效的催眠的状态。本发明实施例提供了一种自动化合成语音的方案,并可输出各种具有本地特色的催眠语音、满足使用者需求。另一方面,借助语音合成技术,可以合成输出标准化的催眠易感特异性催眠语音,完成催眠过程,帮助使用者更好的进入催眠状态。
本发明实施例可以应用于胸腹部肿瘤患者放疗临床呼吸控制的虚拟现实引导催眠过程中。
本领域内的技术人员应明白,本发明的实施例可提供为方法、***、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (6)
1.一种虚拟现实引导催眠语音处理方法,其特征在于,包括:
对催眠引导语进行文本分析,获得催眠引导语的文本层次信息;
对催眠引导语进行语音分析,获得催眠引导语的语音韵律信息;
根据催眠引导语的文本层次信息和语音韵律信息,从催眠语音库中查找相应的语音单元,所述催眠语音库存储有根据使用者易感者录入的语料生成的语音单元;
将查找到的语音单元合成催眠语音数据;
将催眠语音数据与虚拟现实催眠场景合成,输出虚拟现实引导催眠语音;
其中,所述语料是根据催眠语音特征由使用者易感者根据要求使用方言录入的;和/或,所述语料是由使用者易感者在指定的采样率和语音分辨率下使用个性化的语言录入的。
2.如权利要求1所述的方法,其特征在于,所述对催眠引导语进行文本分析,获得催眠引导语的文本层次信息,包括:对催眠引导语进行文本语言、语法及语义分析,获得催眠引导语中词语信息、词组信息、句子信息、及词语、词组、句子之间的关系信息。
3.如权利要求1至2任一项所述的方法,其特征在于,还包括:根据使用者易感者录入的语料建立、并实时更新所述催眠语音库;其中,使用隐马尔科夫模型在所述催眠语音库对语料进行拆分,构造语音单元;
所述将查找到的语音单元合成催眠语音数据,包括:使用隐马尔科夫模型对查找到的语音单元进行挑选、拼接及合成处理。
4.一种虚拟现实引导催眠语音处理装置,其特征在于,包括:
文本分析模块,用于对催眠引导语进行文本分析,获得催眠引导语的文本层次信息;
语音分析模块,用于对催眠引导语进行语音分析,获得催眠引导语的语音韵律信息;
语音查询模块,用于根据催眠引导语的文本层次信息和语音韵律信息,从催眠语音库中查找相应的语音单元,所述催眠语音库存储有根据使用者易感者录入的语料生成的语音单元;
语音合成模块,用于将查找到的语音单元合成催眠语音数据;
语音输出模块,用于将催眠语音数据与虚拟现实催眠场景合成,输出虚拟现实引导催眠语音;
其中,所述语料是根据催眠语音特征由使用者易感者根据要求使用方言录入的;和/或,所述语料是由使用者易感者在指定的采样率和语音分辨率下使用个性化的语言录入的。
5.如权利要求4所述的装置,其特征在于,所述文本分析模块进一步用于:对催眠引导语进行文本语言、语法及语义分析,获得催眠引导语中词语信息、词组信息、句子信息、及词语、词组、句子之间的关系信息。
6.如权利要求4至5任一项所述的装置,其特征在于,还包括:语料库处理模块,用于根据使用者易感者录入的语料建立、并实时更新所述催眠语音库;其中,使用隐马尔科夫模型在所述催眠语音库对语料进行拆分,构造语音单元;
所述语音合成模块进一步用于:使用隐马尔科夫模型对查找到的语音单元进行挑选、拼接及合成处理。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610868130.6A CN107886938B (zh) | 2016-09-29 | 2016-09-29 | 虚拟现实引导催眠语音处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610868130.6A CN107886938B (zh) | 2016-09-29 | 2016-09-29 | 虚拟现实引导催眠语音处理方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107886938A CN107886938A (zh) | 2018-04-06 |
CN107886938B true CN107886938B (zh) | 2020-11-17 |
Family
ID=61769106
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610868130.6A Active CN107886938B (zh) | 2016-09-29 | 2016-09-29 | 虚拟现实引导催眠语音处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107886938B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109473090A (zh) * | 2018-09-30 | 2019-03-15 | 北京光年无限科技有限公司 | 一种面向智能机器人的故事数据处理方法及装置 |
CN113545781B (zh) * | 2021-07-20 | 2024-06-07 | 浙江工商职业技术学院 | 虚拟现实促眠的方法及装置 |
Citations (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020002460A1 (en) * | 1999-08-31 | 2002-01-03 | Valery Pertrushin | System method and article of manufacture for a voice messaging expert system that organizes voice messages based on detected emotions |
CN1717720A (zh) * | 2003-09-05 | 2006-01-04 | 松下电器产业株式会社 | 声处理***、声处理装置、声处理方法、声处理程序及存储媒体 |
CN1815551A (zh) * | 2006-02-28 | 2006-08-09 | 安徽中科大讯飞信息科技有限公司 | 在方言语音合成***中进行文本方言化处理的方法 |
CN1929655A (zh) * | 2006-09-28 | 2007-03-14 | 中山大学 | 一种可实现文本与语音转换的手机 |
CN101051458A (zh) * | 2006-04-04 | 2007-10-10 | 中国科学院自动化研究所 | 基于组块分析的韵律短语预测方法 |
CN101064104A (zh) * | 2006-04-24 | 2007-10-31 | 中国科学院自动化研究所 | 基于语音转换的情感语音生成方法 |
CN101187990A (zh) * | 2007-12-14 | 2008-05-28 | 华南理工大学 | 一种会话机器人*** |
CN101198277A (zh) * | 2005-02-22 | 2008-06-11 | 海尔思-斯玛特有限公司 | 用于生理学和心理生理学监控的方法和***及其应用 |
CN101488342A (zh) * | 2008-12-31 | 2009-07-22 | 广东协联科贸发展有限公司 | 人机语言交互演绎***及人机语言交互需求应答的智能化实现方法 |
US20090306979A1 (en) * | 2008-06-10 | 2009-12-10 | Peeyush Jaiswal | Data processing system for autonomously building speech identification and tagging data |
CN101685634A (zh) * | 2008-09-27 | 2010-03-31 | 上海盛淘智能科技有限公司 | 一种儿童语音情感识别方法 |
CN201453284U (zh) * | 2009-06-17 | 2010-05-12 | 上海风点信息科技有限公司 | 一种心理治疗*** |
CN101772015A (zh) * | 2008-12-29 | 2010-07-07 | 卢中江 | 移动终端语音密码开机的方法 |
CN102063903A (zh) * | 2010-09-25 | 2011-05-18 | 中国科学院深圳先进技术研究院 | 言语交互训练***及方法 |
CN102201234A (zh) * | 2011-06-24 | 2011-09-28 | 北京宇音天下科技有限公司 | 一种基于音调自动标注及预测的语音合成方法 |
CN102294068A (zh) * | 2010-06-22 | 2011-12-28 | 上海迈辉信息技术有限公司 | 一种智能反馈型音乐放松催眠治疗***及实现方法 |
CN102430182A (zh) * | 2011-09-01 | 2012-05-02 | 汪卫东 | 反馈式催眠治疗仪 |
CN102496363A (zh) * | 2011-11-11 | 2012-06-13 | 北京宇音天下科技有限公司 | 一种用于汉语语音合成的音调修正方法 |
CN102527045A (zh) * | 2012-01-14 | 2012-07-04 | 李慈 | 智能学习娃娃玩具及其实现方法和电路*** |
CN102779508A (zh) * | 2012-03-31 | 2012-11-14 | 安徽科大讯飞信息科技股份有限公司 | 语音库生成设备及其方法、语音合成***及其方法 |
CN103035241A (zh) * | 2012-12-07 | 2013-04-10 | 中国科学院自动化研究所 | 模型互补的汉语韵律间断识别***及方法 |
CN103117057A (zh) * | 2012-12-27 | 2013-05-22 | 安徽科大讯飞信息科技股份有限公司 | 一种特定人语音合成技术在手机漫画配音中的应用方法 |
CN103236259A (zh) * | 2013-03-22 | 2013-08-07 | 乐金电子研发中心(上海)有限公司 | 语音识别处理及反馈***、语音回复方法 |
CN103500244A (zh) * | 2013-09-06 | 2014-01-08 | 雷路德 | 一种虚拟朋友会话***及其方法 |
CN103544140A (zh) * | 2012-07-12 | 2014-01-29 | 国际商业机器公司 | 一种数据处理方法、展示方法和相应的装置 |
CN104050962A (zh) * | 2013-03-16 | 2014-09-17 | 李军 | 基于语音合成技术的多功能阅读器 |
CN104217713A (zh) * | 2014-07-15 | 2014-12-17 | 西北师范大学 | 汉藏双语语音合成方法及装置 |
US20150174362A1 (en) * | 2013-12-17 | 2015-06-25 | Juliana Stoianova Panova | Adjuvant Method for the Interface of Psychosomatic Approaches and Technology for Improving Medical Outcomes |
CN105596007A (zh) * | 2014-11-24 | 2016-05-25 | 张湘民 | 鼾声***微型记录仪 |
CN105749402A (zh) * | 2016-02-24 | 2016-07-13 | 陕西科技大学 | 一种基于反馈机理的深度催眠***及方法 |
CN105892616A (zh) * | 2016-03-29 | 2016-08-24 | 宇龙计算机通信科技(深圳)有限公司 | 终端控制方法、终端控制装置和终端 |
CN105912104A (zh) * | 2016-04-01 | 2016-08-31 | 宇龙计算机通信科技(深圳)有限公司 | 一种虚拟现实设备电源管理方法及装置 |
-
2016
- 2016-09-29 CN CN201610868130.6A patent/CN107886938B/zh active Active
Patent Citations (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020002460A1 (en) * | 1999-08-31 | 2002-01-03 | Valery Pertrushin | System method and article of manufacture for a voice messaging expert system that organizes voice messages based on detected emotions |
CN1717720A (zh) * | 2003-09-05 | 2006-01-04 | 松下电器产业株式会社 | 声处理***、声处理装置、声处理方法、声处理程序及存储媒体 |
CN101198277A (zh) * | 2005-02-22 | 2008-06-11 | 海尔思-斯玛特有限公司 | 用于生理学和心理生理学监控的方法和***及其应用 |
CN1815551A (zh) * | 2006-02-28 | 2006-08-09 | 安徽中科大讯飞信息科技有限公司 | 在方言语音合成***中进行文本方言化处理的方法 |
CN101051458A (zh) * | 2006-04-04 | 2007-10-10 | 中国科学院自动化研究所 | 基于组块分析的韵律短语预测方法 |
CN101064104A (zh) * | 2006-04-24 | 2007-10-31 | 中国科学院自动化研究所 | 基于语音转换的情感语音生成方法 |
CN1929655A (zh) * | 2006-09-28 | 2007-03-14 | 中山大学 | 一种可实现文本与语音转换的手机 |
CN101187990A (zh) * | 2007-12-14 | 2008-05-28 | 华南理工大学 | 一种会话机器人*** |
US20090306979A1 (en) * | 2008-06-10 | 2009-12-10 | Peeyush Jaiswal | Data processing system for autonomously building speech identification and tagging data |
CN101685634A (zh) * | 2008-09-27 | 2010-03-31 | 上海盛淘智能科技有限公司 | 一种儿童语音情感识别方法 |
CN101772015A (zh) * | 2008-12-29 | 2010-07-07 | 卢中江 | 移动终端语音密码开机的方法 |
CN101488342A (zh) * | 2008-12-31 | 2009-07-22 | 广东协联科贸发展有限公司 | 人机语言交互演绎***及人机语言交互需求应答的智能化实现方法 |
CN201453284U (zh) * | 2009-06-17 | 2010-05-12 | 上海风点信息科技有限公司 | 一种心理治疗*** |
CN102294068A (zh) * | 2010-06-22 | 2011-12-28 | 上海迈辉信息技术有限公司 | 一种智能反馈型音乐放松催眠治疗***及实现方法 |
CN102063903A (zh) * | 2010-09-25 | 2011-05-18 | 中国科学院深圳先进技术研究院 | 言语交互训练***及方法 |
CN102201234A (zh) * | 2011-06-24 | 2011-09-28 | 北京宇音天下科技有限公司 | 一种基于音调自动标注及预测的语音合成方法 |
CN102430182A (zh) * | 2011-09-01 | 2012-05-02 | 汪卫东 | 反馈式催眠治疗仪 |
CN102496363A (zh) * | 2011-11-11 | 2012-06-13 | 北京宇音天下科技有限公司 | 一种用于汉语语音合成的音调修正方法 |
CN102527045A (zh) * | 2012-01-14 | 2012-07-04 | 李慈 | 智能学习娃娃玩具及其实现方法和电路*** |
CN102779508A (zh) * | 2012-03-31 | 2012-11-14 | 安徽科大讯飞信息科技股份有限公司 | 语音库生成设备及其方法、语音合成***及其方法 |
CN103544140A (zh) * | 2012-07-12 | 2014-01-29 | 国际商业机器公司 | 一种数据处理方法、展示方法和相应的装置 |
CN103035241A (zh) * | 2012-12-07 | 2013-04-10 | 中国科学院自动化研究所 | 模型互补的汉语韵律间断识别***及方法 |
CN103117057A (zh) * | 2012-12-27 | 2013-05-22 | 安徽科大讯飞信息科技股份有限公司 | 一种特定人语音合成技术在手机漫画配音中的应用方法 |
CN104050962A (zh) * | 2013-03-16 | 2014-09-17 | 李军 | 基于语音合成技术的多功能阅读器 |
CN103236259A (zh) * | 2013-03-22 | 2013-08-07 | 乐金电子研发中心(上海)有限公司 | 语音识别处理及反馈***、语音回复方法 |
CN103500244A (zh) * | 2013-09-06 | 2014-01-08 | 雷路德 | 一种虚拟朋友会话***及其方法 |
US20150174362A1 (en) * | 2013-12-17 | 2015-06-25 | Juliana Stoianova Panova | Adjuvant Method for the Interface of Psychosomatic Approaches and Technology for Improving Medical Outcomes |
CN104217713A (zh) * | 2014-07-15 | 2014-12-17 | 西北师范大学 | 汉藏双语语音合成方法及装置 |
CN105596007A (zh) * | 2014-11-24 | 2016-05-25 | 张湘民 | 鼾声***微型记录仪 |
CN105749402A (zh) * | 2016-02-24 | 2016-07-13 | 陕西科技大学 | 一种基于反馈机理的深度催眠***及方法 |
CN105892616A (zh) * | 2016-03-29 | 2016-08-24 | 宇龙计算机通信科技(深圳)有限公司 | 终端控制方法、终端控制装置和终端 |
CN105912104A (zh) * | 2016-04-01 | 2016-08-31 | 宇龙计算机通信科技(深圳)有限公司 | 一种虚拟现实设备电源管理方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN107886938A (zh) | 2018-04-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Bigi | SPPAS-multi-lingual approaches to the automatic annotation of speech | |
EP3994683B1 (en) | Multilingual neural text-to-speech synthesis | |
CN108806656B (zh) | 歌曲的自动生成 | |
US8825486B2 (en) | Method and apparatus for generating synthetic speech with contrastive stress | |
CN108806655B (zh) | 歌曲的自动生成 | |
US8914291B2 (en) | Method and apparatus for generating synthetic speech with contrastive stress | |
CN112164379A (zh) | 音频文件生成方法、装置、设备及计算机可读存储介质 | |
McAuliffe et al. | ISCAN: A system for integrated phonetic analyses across speech corpora | |
El Ouahabi et al. | Toward an automatic speech recognition system for amazigh-tarifit language | |
CN111477210A (zh) | 语音合成方法和装置 | |
US10665221B2 (en) | Virtual reality guide hypnosis speech processing method and apparatus | |
CN107886938B (zh) | 虚拟现实引导催眠语音处理方法及装置 | |
Saratxaga et al. | Designing and Recording an Emotional Speech Database for Corpus Based Synthesis in Basque. | |
Latif et al. | Sparks of large audio models: A survey and outlook | |
Koudounas et al. | Italic: An italian intent classification dataset | |
US11176943B2 (en) | Voice recognition device, voice recognition method, and computer program product | |
Erro et al. | ZureTTS: Online platform for obtaining personalized synthetic voices | |
Krug et al. | Modelling microprosodic effects can lead to an audible improvement in articulatory synthesis | |
CN112420022B (zh) | 一种噪声提取方法、装置、设备和存储介质 | |
Sannino et al. | Lessonable: leveraging deep fakes in MOOC content creation | |
Hämäläinen et al. | The CNG corpus of European Portuguese children’s speech | |
Kastrati et al. | The opportunity of using eSpeak as Text-to-Speech synthesizer for Albanian Language | |
Boroș et al. | Rss-tobi-a prosodically enhanced romanian speech corpus | |
Ekpenyong et al. | Towards an unrestricted domain TTS system for African tone languages | |
Kraleva | Design and development a children's speech database |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
EE01 | Entry into force of recordation of patent licensing contract |
Application publication date: 20180406 Assignee: Shenzhen achievement transformation Center Co.,Ltd. Assignor: SHENZHEN INSTITUTES OF ADVANCED TECHNOLOGY CHINESE ACADEMY OF SCIENCES Contract record no.: X2023980044076 Denomination of invention: Virtual reality guided hypnotic speech processing method and device Granted publication date: 20201117 License type: Common License Record date: 20231023 |
|
EE01 | Entry into force of recordation of patent licensing contract |