BR9612624A

BR9612624A - Speech synthesizer having acoustic element database

Info

Publication number: BR9612624A
Application number: BR9612624-8A
Authority: BR
Inventors: Bernd Moebius; Joseph Philip Olive; Michael Abraham Tanenblatt; Jan Pieter Van Santen
Original assignee: Lucent Technologies Inc
Priority date: 1995-08-16
Filing date: 1996-08-02
Publication date: 2000-05-23
Also published as: EP0845139B1; US5751907A; DE69627865D1; DE69627865T2; MX9801086A; EP0845139A1; CA2222582A1; CA2222582C; EP0845139A4; WO1997007500A1; JP3340748B2; TW305990B; AU6645096A; JP2000509157A

Abstract

<B>SINTETIZADOR DE FALA TENDO BASE DE DADOS DE ELEMENTO ACúSTICO<D> Um método de síntese de fala emprega uma base de dados de elemento acústico que é estabelecida a partir de seq³ências fonéticas ocorridas em um intervalo de um sinal de fala. ao estabelecer a base de dados, trajetórias são determinadas (220) para cada uma das seq³ências fonéticas contendo um segmento fonético que corresponde a um fonema particular (210). Uma região de tolerância é então identificada baseada em uma concentração de trajetórias que correspondem às seq³ências de fonemas diferentes (230). Os elementos acústicos para a base de dados (260) são formados por porções das seq³ências fonéticas ao identificar pontos de corte (250) nas seq³ências fonéticas que correspondem aos pontos de tempo ao longo das trajetórias respectivas próximas à região de tolerância (240). Desta maneira, é possível concatenar os elementos acústicos tendo um fonema de junção comum, de modo que descontinuidades perceptíveis nos fonemas de junção sejam minimizadas. Métodos computacionalmente simples e rápidos para determinar a região de tolerância são também expostos.<B> SPEAK SYNTHESIZER HAVING ACOUSTIC ELEMENT DATABASE <D> A speech synthesis method employs an acoustic element database that is established from phonetic sequences occurring in an interval of a speech signal. when establishing the database, trajectories are determined (220) for each of the phonetic sequences containing a phonetic segment that corresponds to a particular phoneme (210). A tolerance region is then identified based on a concentration of trajectories that correspond to the different phoneme sequences (230). The acoustic elements for the database (260) are formed by portions of the phonetic sequences when identifying cutoff points (250) in the phonetic sequences that correspond to the time points along the respective trajectories close to the tolerance region (240). In this way, it is possible to concatenate the acoustic elements having a common junction phoneme, so that discernible discontinuities in the junction phonemes are minimized. Computationally simple and fast methods for determining the tolerance region are also exposed.