CN111611208A - 文件存储与查询的方法及装置、存储介质 - Google Patents
文件存储与查询的方法及装置、存储介质 Download PDFInfo
- Publication number
- CN111611208A CN111611208A CN202010464465.8A CN202010464465A CN111611208A CN 111611208 A CN111611208 A CN 111611208A CN 202010464465 A CN202010464465 A CN 202010464465A CN 111611208 A CN111611208 A CN 111611208A
- Authority
- CN
- China
- Prior art keywords
- voice
- text
- file
- file name
- hash value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 33
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 48
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 48
- 238000004364 calculation method Methods 0.000 claims description 15
- 230000006835 compression Effects 0.000 abstract description 11
- 238000007906 compression Methods 0.000 abstract description 11
- 238000012545 processing Methods 0.000 abstract description 10
- 238000011161 development Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 241001672694 Citrus reticulata Species 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/14—Details of searching files based on file metadata
- G06F16/148—File search processing
- G06F16/152—File search processing using file content signatures, e.g. hash values
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/16—File or folder operations, e.g. details of user interfaces specifically adapted to file systems
- G06F16/164—File meta data generation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/17—Details of further file system functions
- G06F16/172—Caching, prefetching or hoarding of files
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/17—Details of further file system functions
- G06F16/174—Redundancy elimination performed by the file system
- G06F16/1744—Redundancy elimination performed by the file system using compression, e.g. sparse files
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/04—Details of speech synthesis systems, e.g. synthesiser structure or memory management
- G10L13/047—Architecture of speech synthesisers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Library & Information Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种文件存储与查询的方法及装置、存储介质,所述方法包括:获取待进行语音合成的文本,对所述文本进行HASH值计算,得到所述文本的HASH值;以所计算的HASH值作为文件名,在设定的语音文件目录下查询是否存在相同文件名的语音文件;查询到存在相同文件名的语音文件,调用所述相同文件名的语音文件,将所述相同文件名的语音文件作为所述文本的语音文件;未查询到相同文件名的语音文件时,基于所述文本进行语音合成,以所计算的HASH值作为所合成的语音文件的文件名,将所合成的语音文件存储在所述设定的语音文件目录中。本发明由于通过了严格的文本压缩算法,保证了文本精确去重,防止同样的文本合成多次,节约了处理资源。
Description
技术领域
本发明涉及智能语音处理中的文件存储技术,尤其涉及一种文件存储与查询的方法及装置、存储介质。
背景技术
在智能语音技术中,存在一个必不可少的环节,就是文本转语音(TTS,Text ToSpeech),语音合成时需要处理文本、文本转拼音、拼音转矩阵等一系列的消耗***资源及耗时的过程,对于已经合成过的文本,希望通过缓存来查找语音。
对于缓存方案,就是要找到合成文本与合成语音文件的对应关系,这种对应关系可以在数据库中保存,像关系型数据库管理***(MySQL,Structured Query Language)、postgresql这种关系型数据库,通过表结构来反应对应关系,或者像redis、memcache这种非关系型数据库存储,通过键值对来反应对应关系,但是无论哪种对应关系的存储方案,都需要以下几个步骤:合成语音的生成、语音文件在文件***的存储、保存或设置文本及文件存储路径的对应关系、查询文本及文件存储路径的对应关系是否存在、根据是否存在来合成语音或者返回存在的语音文件。这样的方式从开发上,会和数据库进行多次交互;从效率上讲,需要借助于数据库的***和查询,会有一定的耗时;从安全上讲,数据库中的数据一旦丢失,就会丢失所有的对应关系。
发明内容
有鉴于此,本发明的一个方式提供一种文件存储与查询的方法及装置、存储介质。
本发明一方面提供一种文件存储与查询的方法,包括:
获取待进行语音合成的文本,对所述文本进行哈希HASH值计算,得到所述文本的HASH值;
以所计算的HASH值作为文件名,在设定的语音文件目录下查询是否存在相同文件名的语音文件;
查询到存在相同文件名的语音文件,调用所述相同文件名的语音文件,将所述相同文件名的语音文件作为所述文本的语音文件;未查询到相同文件名的语音文件时,基于所述文本进行语音合成,以所计算的HASH值作为所合成的语音文件的文件名,将所合成的语音文件存储在所述设定的语音文件目录中。
作为一种优选实现方式,所述方法还包括:
获取所述文本的声优、音量、语速、口音的信息至少之一,将所获取的声优、音量、语速、口音中的至少之一与所述文本拼接,形成拼接文本,对所述拼接文本进行哈希HASH值计算,得到所述拼接文本的HASH值。
以所计算的HASH值作为文件名,在设定的语音文件目录下查询是否存在相同文件名的语音文件;
查询到存在相同文件名的语音文件,调用所述相同文件名的语音文件,将所述相同文件名的语音文件作为所述拼接文本的语音文件;未查询到相同文件名的语音文件时,基于所述拼接文本进行语音合成,以所计算的HASH值作为所合成的语音文件的文件名,将所合成的语音文件存储在所述设定的语音文件目录中。
作为一种优选实现方式,所述方法还包括:
设定存储语音文件的固定地址池,将所述固定地址池作为所述语音文件目录;或者
获取所述文本的HASH散列值,将所述HASH散列值中指定开始位置和结束位置对应的字符串作为语音文件目录。
作为一种优选实现方式,所述方法还包括:
根据所述文本的HASH散列值,将所述文本对应的语音文件、所述文本的声优、音量、语速、口音的信息至少之一的属性信息进行多级分层存储。
本发明另一方面提供一种文件存储与查询的装置,包括:
获取单元,用于获取待进行语音合成的文本;
计算单元,用于对所述文本进行哈希HASH值计算,得到所述文本的HASH值;
查询单元,用于以所计算的HASH值作为文件名,在设定的语音文件目录下查询是否存在相同文件名的语音文件;
调用单元,用于在所述查询单元查询到存在相同文件名的语音文件,调用所述相同文件名的语音文件,将所述相同文件名的语音文件作为所述文本的语音文件;
语音合成单元,用于在所述查询单元未查询到相同文件名的语音文件时,基于所述文本进行语音合成;
存储单元,用于以所计算的HASH值作为所合成的语音文件的文件名,将所合成的语音文件存储在所述设定的语音文件目录中。
作为一种优选实现方式,所述获取单元,还用于获取所述文本的声优、音量、语速、口音的信息至少之一;
所述装置还包括:
拼接单元,用于将所获取的声优、音量、语速、口音中的至少之一与所述文本拼接,形成拼接文本;
所述计算单元,还用于对所述拼接文本进行哈希HASH值计算,得到所述拼接文本的HASH值;
所述查询单元,还用于以所计算的HASH值作为文件名,在设定的语音文件目录下查询是否存在相同文件名的语音文件;
所述调用单元,还用于在所述查询单元查询到存在相同文件名的语音文件,调用所述相同文件名的语音文件,将所述相同文件名的语音文件作为所述拼接文本的语音文件;
所述语音合成单元,还用于在所述查询单元未查询到相同文件名的语音文件时,基于所述拼接文本进行语音合成;
所述存储单元,还用于以所计算的HASH值作为所合成的语音文件的文件名,将所合成的语音文件存储在所述设定的语音文件目录中。
作为一种优选实现方式,所述装置还包括:
设定单元,用于设定存储语音文件的固定地址池,将所述固定地址池作为所述语音文件目录。
作为一种优选实现方式,所述计算单元,还用于计算所述文本的HASH散列值;
所述设定单元,还用于将所述HASH散列值中指定开始位置和结束位置对应的字符串作为语音文件目录。
作为一种优选实现方式,所述存储单元,还用于根据所述文本的HASH散列值,将所述文本对应的语音文件、所述文本的声优、音量、语速、口音的信息至少之一的属性信息进行多级分层存储。
本发明又一方面提供一种计算机可读存储介质,其上存取有计算机指令,所述指令被处理器执行时实现如前述的文件存储与查询的方法。
本发明中,针对智能语音机器人的智能语音播报这一应用场景,对于输入的文本,并不直接进行语音合成,而是利用文本与语音文件之间的高度对应性,将文本及文本语音合成后的语音文件进行对应存储,以方便后续有相同的文本时,直接调用所合成的语音文件即可。而现有技术中,存储对应关系的数据时,除了关系数据库之外,再无其他存储方式,而本发明基于文本可进行熵压缩且压缩值唯一这一特性,将文本压缩后的信息作为语音文本的标识名称,以此仅保存语音文件,通过同样的压缩算法即可确定当前待合成的文本是否存在已合成的语音文件,以此来提升语音合成的效率。本发明的技术方案,智能语音无需借助于数据库进行***和查询操作,提高了开发效率、查询效率,且无数据安全问题。本发明由于通过了严格的文本压缩算法,保证了文本精确去重,防止同样的文本合成多次,节约了处理资源。
附图说明
图1为本发明的文件存储与查询的方法的流程示意图;
图2为本发明的文件存储与查询装置的组成结构示意图。
具体实施方式
以下结合附图,详细阐明本发明技术方案的实质。
本发明的技术方案就是利用文件***存储,结合基于文本内容的HASH算法存储的缓存方法,来提高语音文件的缓存效率,由于在一系列的过程中,文件存储在文件***上这一过程是必不可少的,在这一过程中利用文本的HASH散列形成唯一值,解决文本及文件存储路径的对应关系的存储,开发起来简单,无需借助于数据库来保存对应关系,在保证文件***正常的情况下,无数据安全问题。
通过文本HASH算法,将任意长度的内容转换为一个长度固定的字符串,通过这一固定值对应文本自身,结合文件***存储,解决缓存方案中引入数据库的效率问题和数据安全问题。对于要进行语音合成的文本,进行HASH值计算,产生一个32位的唯一值,将这个唯一值作为文件名,根据约定的文件目录下,查询文件是否存在。如存在,则返回所存储的与相应文件名相同的语音文件,如不存在,则进行语音合成,合成的语音文件以文本的HASH值作为文件名,存储在约定的文件目录下。
本发明实施例中,约定的文件目录,可以为指定的固定值,如设定的固定的地址池等。也可以取HASH值中指定开始位置和结束位置的字符串作为上级目录名,可进行多级分层。
以下结合附图,对本发明的技术方案作进一步详细阐明。
图1为本发明的文件存储与查询的方法的流程示意图,如图1所示,本发明的文件存储与查询的方法包括以下处理步骤:
步骤101,获取待进行语音合成的文本,对所述文本进行哈希HASH值计算,得到所述文本的HASH值。
作为一种实现方式,也可以获取所述文本的声优、音量、语速、口音的信息至少之一,将所获取的声优、音量、语速、口音中的至少之一与所述文本拼接,形成拼接文本,对所述拼接文本进行哈希HASH值计算,得到所述拼接文本的HASH值。
本发明实施例中,还支持文本的声优选择,即将文本进行语音合成时,可以选择声优来进行语音合成,还支持音量、语速等的选择。本发明实施例中,还支持口音的选择,即可以选择普通话、方言等口音的语音合成处理。而当文本含有这些属性信息时,可以将这些属性信息作为文本中内容的一部分,进行HASH计算,以确定相同的文本在进行语音合成时是否具有相同的属性要求,即文本内容相同时,若其属性信息如口音不同,则HASH值不同,将作为不同的语音文件进行存储。
本发明实施例中,所采用的HASH算法包括以下之一:MD4、MD5、SHA-1等。
步骤102,以所计算的HASH值作为文件名,在设定的语音文件目录下查询是否存在相同文件名的语音文件。
本发明实施例中,在对文本进行语音合成之前,首先计算其HASH值,并以该计算的HASH值在设定的语音文件目录下查询是否存在相同文件名的语音文件。
步骤103,查询到存在相同文件名的语音文件,调用所述相同文件名的语音文件,将所述相同文件名的语音文件作为所述文本的语音文件。
也就是说,本发明实施例中,首先确定欲进行语音合成的文本是否已在之前被处理过,当之前被处理即被语音合成处理过时,则相应的语音文件目录下应当存储有该文本的语音合成文件,当查询到与文本的HASH值相同名称的语音文件时,直接调用该语音文件,并将该语音文件作为所述文本的语音合成后的文件,即智能播报***直接将该语音文件进行输出,作为待语音合成的语音文件直接进行处理即可,不必对文本再执行语音合成的操作。
步骤104,未查询到相同文件名的语音文件时,基于所述文本进行语音合成,以所计算的HASH值作为所合成的语音文件的文件名,将所合成的语音文件存储在所述设定的语音文件目录中。
当未查询到相同文件名的语音文件时,则意味着该文本之前未被语音合成处理过,则将文本进行语音合成处理。这里,语音合成处理即将文本中的文字转换为播放语音文件,将文本中的汉字、字母、数字、英文字符或语句等转换为相应的读音文件,并将语音合成后的语音文件进行输出。
作为一种优选实现方式,所述方法还包括:
设定存储语音文件的固定地址池,将所述固定地址池作为所述语音文件目录;或者
获取所述文本的HASH散列值,将所述HASH散列值中指定开始位置和结束位置对应的字符串作为语音文件目录。本发明实施例中,哈希表(Hash table,也叫散列表)是根据关键码值(Key value)而直接进行访问的数据结构。也就是说,它通过把关键码值映射到表中一个位置来访问记录,以加快查找的速度。
根据所述文本的HASH散列值,将所述文本对应的语音文件、所述文本的声优、音量、语速、口音的信息至少之一的属性信息进行多级分层存储。
本发明中,针对智能语音机器人的智能语音播报这一应用场景,对于输入的文本,并不直接进行语音合成,而是利用文本与语音文件之间的高度对应性,将文本及文本语音合成后的语音文件进行对应存储,以方便后续有相同的文本时,直接调用所合成的语音文件即可。而现有技术中,存储对应关系的数据时,除了关系数据库之外,再无其他存储方式,而本发明基于文本可进行熵压缩且压缩值唯一这一特性,将文本压缩后的信息作为语音文本的标识名称,以此仅保存语音文件,通过同样的压缩算法即可确定当前待合成的文本是否存在已合成的语音文件,以此来提升语音合成的效率。本发明的技术方案,智能语音无需借助于数据库进行***和查询操作,提高了开发效率、查询效率,且无数据安全问题。由于通过了严格的文本压缩算法,保证了文本精确去重,防止同样的文本合成多次,节约了处理资源。
图2为本发明的文件存储与查询装置的组成结构示意图,如图2所示,本发明的文件存储与查询装置包括:
获取单元20,用于获取待进行语音合成的文本;
计算单元21,用于对所述文本进行哈希HASH值计算,得到所述文本的HASH值;
查询单元22,用于以所计算的HASH值作为文件名,在设定的语音文件目录下查询是否存在相同文件名的语音文件;
调用单元23,用于在所述查询单元查询到存在相同文件名的语音文件,调用所述相同文件名的语音文件,将所述相同文件名的语音文件作为所述文本的语音文件;
语音合成单元24,用于在所述查询单元未查询到相同文件名的语音文件时,基于所述文本进行语音合成;
存储单元25,用于以所计算的HASH值作为所合成的语音文件的文件名,将所合成的语音文件存储在所述设定的语音文件目录中。
作为一种优选实现方式,所述获取单元,还用于获取所述文本的声优、音量、语速、口音的信息至少之一;
所述装置还包括:
拼接单元,用于将所获取的声优、音量、语速、口音中的至少之一与所述文本拼接,形成拼接文本;
所述计算单元,还用于对所述拼接文本进行哈希HASH值计算,得到所述拼接文本的HASH值;
所述查询单元,还用于以所计算的HASH值作为文件名,在设定的语音文件目录下查询是否存在相同文件名的语音文件;
所述调用单元,还用于在所述查询单元查询到存在相同文件名的语音文件,调用所述相同文件名的语音文件,将所述相同文件名的语音文件作为所述拼接文本的语音文件;
所述语音合成单元,还用于在所述查询单元未查询到相同文件名的语音文件时,基于所述拼接文本进行语音合成;
所述存储单元,还用于以所计算的HASH值作为所合成的语音文件的文件名,将所合成的语音文件存储在所述设定的语音文件目录中。
作为一种优选实现方式,所述装置还包括:
设定单元,用于设定存储语音文件的固定地址池,将所述固定地址池作为所述语音文件目录。
作为一种优选实现方式,所述计算单元,还用于计算所述文本的HASH散列值;
所述设定单元,还用于将所述HASH散列值中指定开始位置和结束位置对应的字符串作为语音文件目录。
作为一种优选实现方式,所述存储单元,还用于根据所述文本的HASH散列值,将所述文本对应的语音文件、所述文本的声优、音量、语速、口音的信息至少之一的属性信息进行多级分层存储。
本发明实施例的文件存储与查询装置中各处理单元的功能,可参见本发明实施例的文件存储与查询方法中的相关描述而理解,这里不再赘述其细节。
本发明还提供一种计算机可读存储介质,其上存取有计算机指令,所述指令被处理器执行时实现前述实施例的文件存储与查询方法的步骤。
在本实施例中,至少一个处理器可以构成具有对一个或多个输入执行逻辑运算的电路的任何物理设备。例如,至少一个处理器可以包括一个或多个集成电路(IC),包括专用集成电路(ASIC)、微芯片、微控制器、微处理器、中央处理单元(CPU)的全部或部分、图形处理单元(GPU)、数字信号处理器(DSP)、现场可编程门阵列(FPGA)或者适于执行指令或执行逻辑运算的其它电路。由至少一个处理器执行的指令可以例如被预加载到与控制器集成的或嵌入在控制器中的存储器中,或者可以存储在分离的存储器中。存储器可以包括随机存取存储器(RAM)、只读存储器(ROM)、硬盘、光盘、磁介质、闪存,其它永久、固定或易失性存储器,或者能够存储指令的任何其它机制。可选的是,至少一个处理器可以包括多于一个处理器。每个处理器可以具有相似的结构,或者处理器可以具有彼此电连接或断开的不同构造。例如,处理器可以是分离的电路或集成在单个电路中。当使用多于一个处理器时,处理器可以被配置为独立地或协作地操作。处理器可以以电、磁、光学、声学、机械或通过允许它们交互的其它手段来耦合。
在本实施例中,非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
此外,本发明的特征和益处通过参考示例性实施例进行说明。相应地,本发明明确地不应局限于这些说明一些可能的非限制性特征的组合的示例性的实施例,这些特征可单独或者以特征的其它组合的形式存在。
本领域技术人员在考虑说明书及实践这里公开的公开后,将容易想到本公开的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神以权利要求书为准。
Claims (10)
1.一种文件存储与查询的方法,其特征在于,所述方法包括:
获取待进行语音合成的文本,对所述文本进行哈希HASH值计算,得到所述文本的HASH值;
以所计算的HASH值作为文件名,在设定的语音文件目录下查询是否存在相同文件名的语音文件;
查询到存在相同文件名的语音文件,调用所述相同文件名的语音文件,将所述相同文件名的语音文件作为所述文本的语音文件;未查询到相同文件名的语音文件时,基于所述文本进行语音合成,以所计算的HASH值作为所合成的语音文件的文件名,将所合成的语音文件存储在所述设定的语音文件目录中。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取所述文本的声优、音量、语速、口音的信息至少之一,将所获取的声优、音量、语速、口音中的至少之一与所述文本拼接,形成拼接文本,对所述拼接文本进行哈希HASH值计算,得到所述拼接文本的HASH值;
以所计算的HASH值作为文件名,在设定的语音文件目录下查询是否存在相同文件名的语音文件;
查询到存在相同文件名的语音文件,调用所述相同文件名的语音文件,将所述相同文件名的语音文件作为所述拼接文本的语音文件;未查询到相同文件名的语音文件时,基于所述拼接文本进行语音合成,以所计算的HASH值作为所合成的语音文件的文件名,将所合成的语音文件存储在所述设定的语音文件目录中。
3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
设定存储语音文件的固定地址池,将所述固定地址池作为所述语音文件目录;或者
获取所述文本的HASH散列值,将所述HASH散列值中指定开始位置和结束位置对应的字符串作为语音文件目录。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
根据所述文本的HASH散列值,将所述文本对应的语音文件、所述文本的声优、音量、语速、口音的信息至少之一的属性信息进行多级分层存储。
5.一种文件存储与查询的装置,其特征在于,所述装置包括:
获取单元,用于获取待进行语音合成的文本;
计算单元,用于对所述文本进行哈希HASH值计算,得到所述文本的HASH值;
查询单元,用于以所计算的HASH值作为文件名,在设定的语音文件目录下查询是否存在相同文件名的语音文件;
调用单元,用于在所述查询单元查询到存在相同文件名的语音文件,调用所述相同文件名的语音文件,将所述相同文件名的语音文件作为所述文本的语音文件;
语音合成单元,用于在所述查询单元未查询到相同文件名的语音文件时,基于所述文本进行语音合成;
存储单元,用于以所计算的HASH值作为所合成的语音文件的文件名,将所合成的语音文件存储在所述设定的语音文件目录中。
6.根据权利要求5所述的装置,其特征在于,所述获取单元,还用于获取所述文本的声优、音量、语速、口音的信息至少之一;
所述装置还包括:
拼接单元,用于将所获取的声优、音量、语速、口音中的至少之一与所述文本拼接,形成拼接文本;
所述计算单元,还用于对所述拼接文本进行哈希HASH值计算,得到所述拼接文本的HASH值;
所述查询单元,还用于以所计算的HASH值作为文件名,在设定的语音文件目录下查询是否存在相同文件名的语音文件;
所述调用单元,还用于在所述查询单元查询到存在相同文件名的语音文件,调用所述相同文件名的语音文件,将所述相同文件名的语音文件作为所述拼接文本的语音文件;
所述语音合成单元,还用于在所述查询单元未查询到相同文件名的语音文件时,基于所述拼接文本进行语音合成;
所述存储单元,还用于以所计算的HASH值作为所合成的语音文件的文件名,将所合成的语音文件存储在所述设定的语音文件目录中。
7.根据权利要求5或6所述的装置,其特征在于,所述装置还包括:
设定单元,用于设定存储语音文件的固定地址池,将所述固定地址池作为所述语音文件目录。
8.根据权利要求7所述的装置,其特征在于,所述计算单元,还用于计算所述文本的HASH散列值;
所述设定单元,还用于将所述HASH散列值中指定开始位置和结束位置对应的字符串作为语音文件目录。
9.根据权利要求8所述的方法,其特征在于,所述存储单元,还用于根据所述文本的HASH散列值,将所述文本对应的语音文件、所述文本的声优、音量、语速、口音的信息至少之一的属性信息进行多级分层存储。
10.一种计算机可读存储介质,其上存取有计算机指令,其特征在于,所述指令被处理器执行时实现如权利要求1至4中任一项所述的文件存储与查询的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010464465.8A CN111611208A (zh) | 2020-05-27 | 2020-05-27 | 文件存储与查询的方法及装置、存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010464465.8A CN111611208A (zh) | 2020-05-27 | 2020-05-27 | 文件存储与查询的方法及装置、存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111611208A true CN111611208A (zh) | 2020-09-01 |
Family
ID=72200010
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010464465.8A Pending CN111611208A (zh) | 2020-05-27 | 2020-05-27 | 文件存储与查询的方法及装置、存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111611208A (zh) |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5758323A (en) * | 1996-01-09 | 1998-05-26 | U S West Marketing Resources Group, Inc. | System and Method for producing voice files for an automated concatenated voice system |
US20080243511A1 (en) * | 2006-10-24 | 2008-10-02 | Yusuke Fujita | Speech synthesizer |
CN101685633A (zh) * | 2008-09-28 | 2010-03-31 | 富士通株式会社 | 基于韵律参照的语音合成装置和方法 |
CN102096982A (zh) * | 2010-12-29 | 2011-06-15 | 中国科学院计算技术研究所 | 一种用于服务器监控的语音报警***和方法 |
CN102237088A (zh) * | 2011-06-17 | 2011-11-09 | 盛乐信息技术(上海)有限公司 | 语音识别多信息文本获取装置及方法 |
CN106453455A (zh) * | 2015-08-10 | 2017-02-22 | 中兴通讯股份有限公司 | 一种语音文件同步方法和装置 |
CN107562786A (zh) * | 2017-07-27 | 2018-01-09 | 平安科技(深圳)有限公司 | 文件存储方法、终端和计算机可读存储介质 |
CN107844483A (zh) * | 2016-09-18 | 2018-03-27 | 腾讯科技(深圳)有限公司 | 文件管理方法及装置 |
CN110444190A (zh) * | 2019-08-13 | 2019-11-12 | 广州国音智能科技有限公司 | 语音处理方法、装置、终端设备及存储介质 |
CN110767240A (zh) * | 2019-10-31 | 2020-02-07 | 广东美的制冷设备有限公司 | 儿童口音识别的设备控制方法、设备、存储介质及装置 |
CN110888842A (zh) * | 2019-12-02 | 2020-03-17 | 中国银行股份有限公司 | 一种文件存储方法、文件查询方法、装置及设备 |
CN110933330A (zh) * | 2019-12-09 | 2020-03-27 | 广州酷狗计算机科技有限公司 | 视频配音方法、装置、计算机设备及计算机可读存储介质 |
-
2020
- 2020-05-27 CN CN202010464465.8A patent/CN111611208A/zh active Pending
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5758323A (en) * | 1996-01-09 | 1998-05-26 | U S West Marketing Resources Group, Inc. | System and Method for producing voice files for an automated concatenated voice system |
US20080243511A1 (en) * | 2006-10-24 | 2008-10-02 | Yusuke Fujita | Speech synthesizer |
CN101685633A (zh) * | 2008-09-28 | 2010-03-31 | 富士通株式会社 | 基于韵律参照的语音合成装置和方法 |
CN102096982A (zh) * | 2010-12-29 | 2011-06-15 | 中国科学院计算技术研究所 | 一种用于服务器监控的语音报警***和方法 |
CN102237088A (zh) * | 2011-06-17 | 2011-11-09 | 盛乐信息技术(上海)有限公司 | 语音识别多信息文本获取装置及方法 |
CN106453455A (zh) * | 2015-08-10 | 2017-02-22 | 中兴通讯股份有限公司 | 一种语音文件同步方法和装置 |
CN107844483A (zh) * | 2016-09-18 | 2018-03-27 | 腾讯科技(深圳)有限公司 | 文件管理方法及装置 |
CN107562786A (zh) * | 2017-07-27 | 2018-01-09 | 平安科技(深圳)有限公司 | 文件存储方法、终端和计算机可读存储介质 |
CN110444190A (zh) * | 2019-08-13 | 2019-11-12 | 广州国音智能科技有限公司 | 语音处理方法、装置、终端设备及存储介质 |
CN110767240A (zh) * | 2019-10-31 | 2020-02-07 | 广东美的制冷设备有限公司 | 儿童口音识别的设备控制方法、设备、存储介质及装置 |
CN110888842A (zh) * | 2019-12-02 | 2020-03-17 | 中国银行股份有限公司 | 一种文件存储方法、文件查询方法、装置及设备 |
CN110933330A (zh) * | 2019-12-09 | 2020-03-27 | 广州酷狗计算机科技有限公司 | 视频配音方法、装置、计算机设备及计算机可读存储介质 |
Non-Patent Citations (1)
Title |
---|
码农家园: "python中最短的哈希值,用于命名缓存文件", 《HTTPS://WWW.CODENONG.COM/1303021/》 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7979268B2 (en) | String matching method and system and computer-readable recording medium storing the string matching method | |
WO2018149209A1 (zh) | 语音识别方法、电子设备以及计算机存储介质 | |
CN1176456C (zh) | 数据档案***中基于语义单元的自动索引和搜索方法及设备 | |
US20070156404A1 (en) | String matching method and system using phonetic symbols and computer-readable recording medium storing computer program for executing the string matching method | |
US9196251B2 (en) | Contextual conversion platform for generating prioritized replacement text for spoken content output | |
KR20090079169A (ko) | 단편을 이용한 대용량 리스트의 음성 인식 방법 및 시스템 | |
JP4570509B2 (ja) | 読み生成装置、読み生成方法及びコンピュータプログラム | |
CN100429648C (zh) | 一种文本自动分块的方法、分块器和文本到语言合成*** | |
US20200218760A1 (en) | Music search method and device, server and computer-readable storage medium | |
CN104464734A (zh) | 声音同时处理装置、方法及程序 | |
CN108885618A (zh) | 意图估计装置和意图估计方法 | |
JP2017097062A (ja) | 読み付与装置、音声認識装置、読み付与方法、音声認識方法、およびプログラム | |
JP2022554149A (ja) | テキスト情報処理方法及び装置 | |
CN110825840B (zh) | 词库扩充方法、装置、设备及存储介质 | |
US10791240B2 (en) | Systems and methods for rendering a secure document with a text selection capability | |
CN116451645A (zh) | 文本处理方法、装置、电子设备和计算机可读存储介质 | |
JP2010134922A (ja) | 類似語決定方法およびシステム | |
KR20220168062A (ko) | 인공지능을 활용한 기사 작성 솔루션 및 장치 | |
CN111611208A (zh) | 文件存储与查询的方法及装置、存储介质 | |
EP1632932B1 (en) | Voice response system, voice response method, voice server, voice file processing method, program and recording medium | |
KR20120045906A (ko) | 코퍼스 오류 교정 장치 및 그 방법 | |
KR101982490B1 (ko) | 문자 데이터 변환에 기초한 키워드 검색 방법 및 그 장치 | |
CN109065016B (zh) | 语音合成方法、装置、电子设备及非暂态计算机存储介质 | |
JP2022002034A (ja) | 抽出方法、抽出プログラム、及び、抽出装置 | |
CN111489752A (zh) | 语音输出方法、装置、电子设备和计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200901 |