DE3037276C2 - Tonsynthesizer - Google Patents

Tonsynthesizer

Info

Publication number
DE3037276C2
DE3037276C2 DE19803037276 DE3037276A DE3037276C2 DE 3037276 C2 DE3037276 C2 DE 3037276C2 DE 19803037276 DE19803037276 DE 19803037276 DE 3037276 A DE3037276 A DE 3037276A DE 3037276 C2 DE3037276 C2 DE 3037276C2
Authority
DE
Germany
Prior art keywords
filter
parameters
signal
output
adder
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
DE19803037276
Other languages
English (en)
Other versions
DE3037276A1 (de
Inventor
Fumitada Houya Tokio/Tokyo Itakura
Noboru Iruma Saitama Sugamura
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP12836679A external-priority patent/JPS5651116A/ja
Priority claimed from JP54128365A external-priority patent/JPS5853352B2/ja
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Publication of DE3037276A1 publication Critical patent/DE3037276A1/de
Application granted granted Critical
Publication of DE3037276C2 publication Critical patent/DE3037276C2/de
Expired legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/04Details of speech synthesis systems, e.g. synthesiser structure or memory management
    • G10L13/047Architecture of speech synthesisers

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Signal Processing (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Stereophonic System (AREA)

Description

Die Erfindung betrifft einen Tonsynthesizer nach dem Oberbegriff des Anspruchs 1 sowie ein Verfahren zur Tonsynthese nach dem Oberbegriff des Anspruchs i 8.
Beispielsweise im Fall des Aufbaus von Sprache aus charakteristischen Parametern der Originalsprache werden beim Stand der Technik das Ausgangssignal eines impulsgenerator, der die Vibration der Stimmbänder simuliert, und das Ausgangssignal eines Rauschgenerators, der die Turbulenz simuliert, in Abhängigkeit davon umgeschaltet oder zusammengemischt, ob ein stimmhafter oder ein stimmloser Laut vorliegt. Das resultierende Ausgangssignal wird entsprechend der Sprachamplitude amplitudenmoduliert, um ein Anregungsquellensignal zu erzeugen, das an ein Filter geliefert wird, welches zum Erhalt der synthetischen oder Kunstsprache den Stimmtrakt simuliert. Ein Synthesesystem, bei dem partielle Autokorrelationskoeffizienten (PARCOR) verwendet werden, sowie ein Formantsynthesesystem sind Beispiele solcher Sprachsynthesesysteme, die charakteristische Parameter benutzen. Das erstere ist beispielsweise dargestellt in ). D. Marke! et al., »Linear Prediction of Speech«, Seiten 92 bis 128, Springer-Verlag, 1976. Bei diesem System werden die partiellen Autokorrelationskoeffizienten oder sog. PARCOR-Koeffizienten einer Sprachwellenform als charakteristische Parameter verwendet. Wenn die absoluten Werte dieser PARCOR-Koeffizienten alle kleiner als 1 sind, dann ist das Sprachsynthesefilter stabil. Die PARCOR-Koeffizienten mögen eine relativ geringe Informationsmenge zur Sprachsynthese erfordern und lassen sich relativ leicht automatisch gewinnen, jedoch unterscheiden sich die einzelnen Parameter sehr stark bezüglich der Spektralempfindlichkeit. Wenn demzufolge alle Parameter unter Verwendung derselben Bitanzahl quantisiert werden, dann ergeben sich große Unterschiede bei der Spekiralvcrzcrrung, die auf Quantisierungsfehlern bei den jeweiligen Parametern beruhen. Ferner sind die PARCOR-Koeffizienten ungünstig bezüglich ihrer Interpolationseigenschaften. Bei der Interpolation dieser Parameter treten Kauschoder Störsignale auf, die zu einer undeutlichen Sprache führen. Besonders bei einer niedrigen Bitrate wird die Sprachqualität durch die Spektralverzerrung verschlechtert, so daß sich keine zufriedenstellende Qualität der Kunstsprache erzielen läßt. Außerdem entsprechen die PARCOR-Koeffizienten nicht direkt Spektraleigentümlichkeiten wie Formantfrequenzen, so daß PARCOR-Koeffizienten in der Regel für die Sprachsynthese nicht geeignet sind.
Das Formantsynthesesystem ist beispielsweise in J. L Flanagan, »Speech Analysis, Synthesis and Perception«, Seiten 339 bis 347, Springer-Verlag, 1972, offenbart. Es handelt sich hier um ein System, das Kunstsprache unter Verwendung der Formantfrequenzen und ihrer Intensität als Parameter bildet und insofern vorteilhaft ist, als die Informationsmenge für die Parameter gering sein kann, und tiwofern, als die Beziehung der Parameter zu Spektralgrößen leicht zu erhalten ist. Zur Gewinnung der Formantfrequenz und ihrer Intensität ist es jedoch nötig, Gebrauch von allgemeinen dynamischen Charakteristiken und statistischen Eigentümlichkeiten der Parameter zu machen, so daß eine völlig automatische Gewinnung der Formantfrequenz und ihrer Intensität schwierig ist. Demzufolge ist es schwierig, automatisch Kunstsprache hoher Qualität zu erhalten und wahrscheinlich, daß eine merkliche Verschlechterung der Qualität der Kunstsprache durch einen Fehler bei der Gewinnung der Parameter auftritt.
Es ist bekannt, bei Tonsynthesizern von einer Allpol-Filterschaltung Gebrauch zu machen, deren Übertragungsfunktion durch den Ausdruck
AJZ) 1 +ai Z + a2Z2 +■■ - + apZ
gegeben ist. Die Koeffizienten λ, sind die »linearen Prädiktorkoeffizienten« (LPC), und es ist bekannt, diese Koeffizienten nach einem bestimmten Verfahren von einem gegebenen Ton abzuleiten. Die Verwendung dieser Koeffizienten λ, ist jedoch insofern nachteilig, als für die Quantisierung der Koeffizienten eine relativ große Anzahl von Bits notwendig ist, da die Filterschaltung bei einer geringen Bitzahl nicht stabil arbeitet.
Ein Tonsynthesizer der eingangs genannten Art ist aus der US-PS 36 24 302 bekannt Diese bekannte Schaltung besitzt einen Rechner zum Berechnen der Prädiktorkoeffizienten als Steuerparameter, und in der Filterschaltung werden die Steuerparameter mit stufenweise verzögerten Abtastwerten des Ausgangssignals des Filters multipliziert, bevor die Produkte in dem Addierer addiert werden. Die Übertragungsfunktion wird bei
so dieser bekannten Vorrichtung also auf direktem Wege gebildet. Wenn die Nullstellen des auf diese Weise gebildeten Polynoms innerhalb des Einheitskreises liegen, arbeitet das Filter stabil, wenn die Nullstellen außerhalb des Einheitskreises liegen, arbeitet das Filter nicht stabil. Daher besteht bei der bekannten Vorrichtung die Gefahr, daß das Filter nicht stabil arbeitet, wenn die Koeffizienten bestimmte Werte annehmen.
Um eine stabilere Arbeitsweise des Filters zu gewährleisten, wurde auch ein anderes Verfahren vorgeschlagen, nach dem der Ausdruck Ap (Z) durch ein rekursives Verfahren ermittelt wird. Die Realisierung dieses Verfahrens entspricht einem Kreuzgliedfiiter. Dadurch, daß die nach diesem Verfahren berechneten PARCOR-Koeffizienten absolut kleiner als 1 sind, kann die stabile Arbeitsweise des Filters gewährleistet werden. Nachteilig bei diesem Verfahren ist jedoch, daß relativ lange Zeit für die Neuberechnung der Parameter benötigt wird, und daß grundsätzlich eine Parameterinterpolation erforderlich ist, die zu Verzerrungen führt
Der Erfindung liegt die Aufgabe zugrunde, einen Tonsyinhesizer und ein Verfahren zur Tonsynthese der eingangs genannten Art anzugeben, der bzw. das die Synthese eines Tons hoher Qualität unter Verwendung einer geringen Informationsmenge gestattet so daß auf synthetischem Wege ein Ton erzeugt werden kann, der eine mit dem Originalton vergleichbare Qualität besitzt.
Diese Aufgabe wird durch die im kennzeichnenden Teil des Anspruchs 1 bzw. des Anspruchs 18 angegebenen Merkmale gelöst Im Gegensatz zu der eingangs beschriebenen bekannten Vorrichtung gemäß der US-PS 36 24 302, bei der die Summenkoeffizienten von Ap(Z) direkt verarbeitet werden, sind bei dem erflndungsgernä-Ben Tonsynthesizer zwei Rückkopplungsanordnungen mit Filterschaltungen zweiter Ordnung vorgesehen. Die hierdurch gebildeten Übertragungsfunktionen P(Z) und Q(Z) werden faktorisiert, die Lösungen der beiden
Polynome P(Z) und Q(Z) liegen auf dem Einheitskreis. Hierdurch ist die stabile Arbeitsweise der Filterschaltung gewährleistet.
Ap(Z) läßt sich also durch die Summe von zwei Polynomen darstellen, was wie folgt ausgedrückt werden kann:
Ap(Z) =\/2[P(Z)+ Q(Z)) (2)
P(Z) = Ap(Z) - Z ■ ZPAp(Z-*) (3)
Q(Z) -Ap(Z)+ Z-ZPAp(Z-') (4)
(a) Wenn der Analysegrad ρ gerade ist, können die Gleichungen (3) und (4) wie folgt in Faktoren zerlegt werden:
pH
' P(Z) = (1-Z) 77(1 - 2 cos ω,-Z+ Z2)
'"'
mi (5)
77C -2cos6>,Z + Z2)
/ I
(b) Wenn der Analysegrad ρ ungerade ist, werden Gleichungen (3) und (*) wie folgt in Faktoren zerlegt:
tr II/2
P(Z) = (1-Z2) 77(l-2cos<y,Z + Z2)
' '
(,MW (6)
Q(Z)= 77(l-2cose,Z + Z2)
i-l
ω, und ft in den Ausdrücken (5) und (6) werden ein Linienspektrumpaar (nachfolgend als LSP bezeichnet) gekannt und bei der Erfindung als Parameter zur Darstellung der Spektralumhüllenden-Information verwendet.
Durch Umschreiben von Gleichung (1) und Ersetzen von Ap (Z) gemäß Gleichung (2) ergibt sich die Übertragungsfunktion H(Z) wie folgt:
a ££
(7) A„(Z) \+(Ap(Z)-\) 1 + 1/2 [P(Z)-1+Q(Z)-I] "
Wie man aus (7) ersieht, wird die Übertragungsfunktion H(Z) auch als Filter mit zwei Rückkopplungskreisen gebildet, deren Übertragungsfunktionen P(Z) — 1 bzw. Q(Z) — i sind. Die Übertragungsfunktionen P(Z) und ζ)(Z) sind die von Antiresonanzkreisen, deren Ausgangssignal bei ft bzw. ω, Null wird. Die Frequenzkennlinie von Ap (Z) wird wie folgt:
[pH p/2 -.
c°s2 y IJ (cos ω - cos Θ<Ϋ + sin2 ^ JJ (cos ω - cos a,,)2 J (8)
wobei Z = e->'. Nach Gleichung (8) scheint, daß in einem Bereich, in dem benachbarte Linienspektralfrequenzen dicht beieinanderliegen, |/1Ρ(Ζ)|2 klein ist und die Übertragungsfunktion H(Z) eine starke Resonanzcharakteristik zeigt. Durch Ändern der Werte der LSP-Parameter <y,· und ft, die die Resonanzcharakteristik der Übertragungsfunktionen beschreiben, kann eine willkürliche Sprachspektralumhüllende erhalten werden.
Die Prozedur zur Gewinnung der LSP-Parameter ist folgende:
In einem ersten Schritt erhält man Autokorrelationskoeffizieuten einer Sprachwelle in Intervallen von beispielsweise 10 bis 20 ms. im zweiten Schritt erhält man von den Autokorrelationskoeffizienten Prädiktorkoeffizienten x, der Übertragungsfunktion H(Z)-Im dritten Schritt erhält man von den Prädiktorkoeffizienten auf der Basis der Beziehung der Gleichung (2) die Lösungen der beiden Polynome P(Z) und Q(Z), und auf diese Weise die LSP-Parameter ω-, und ft. Durch Steuerung der Koeffizienten des Synthesefilters unter Verwendung der Parameter, die die information über die Sprachspektralumhüllende darstellen, kann man ein Filter erhalten, dessen Übertragungsfunktion H(Z) der Sprachspektralumhüllenden äquivalent ist Die Übertragungsfunktion der Rückkopplungsschleife im Synthesefilter ist in Form einer Kaskadenschaltung von Filtern zweiter Ordnung ω vorgesehen, deren Nullstellen auf einem Einheitskreis in einer Ebene Z liegen, wie durch die Ausdrücke (5) und (6) angegeben. Da diese beiden Filter zweiter Ordnung im Aufbau identisch sind, kann man den Aufbau auch durch Mehrfachverwendung von einem Filter zweiter Ordnung unter Einsatz eines Zeitteilungsbetriebs oder einer sog. Pipeline-Operation vereinfachen. Es ist auch möglich, den Filterbetrieb durch Verarbeitung eines elektronischen Rechners ohne Ausbildung der Filter zweiter Ordnung als Schaltungskreise durchzuführen.
Wie oben beschrieben, werden bei der vorliegenden Erfindung die Eigenschaften oder Kennwerte des Synthesefilters durch die vorgenannten Parameter ft und ω-, gesteuert Zusätzlich zu diesen LSP-Parametern ft und ω: werden aber ein Grundfrequenzparameter und ein Amplitudenparameter eingesetzt, wie dies auch bei -
bislang benutzten Sprachsynthesizern der Fall ist. Durch den Grundfrequenzparameter wird eine stimmhafte Tonquelle gesteuert, einen Impuls oder eine Gruppe von Impulsen der durch den Parameter angezeigten Frequenz zu erzeugen. Das Ausgangssignal dieser stimmhaften Tonquellu oder das Ausgangssignal von einer Rauschquelle wird abhängig davon ausgewählt, ob der zu rekonstruierende Ton bzw. Laut stimmhaft oder stimmlos ist. Das ausgewählte Ausgangssignal wird an das Tonsynthesefilier angelegt. Die Größe eines Signals am Eingang oder am Ausgang des Synthesefilters wird mittels des Amplitudenparameters gesteuert. Die LSP-Parameter ft und <y, werden mittels einer Parametertransformierungseinrichtung einer Kosinustransformation zu - 2 cos Wi und — 2 cos ft unterworfen, und diese transformierten Parameter als Steuerparameter zur Steuerung d.r Koeffizienten der den jeweiligen Parametern entsprechenden Filter zweiter Ordnung des Tonsynthesefilters verwendet. Die Steuerparameter werden mittels einer Interpolationseinrichtung in der Form von kosinustransformierten LSP-Parametern — 2 cos ft und — 2 cos <y, interpoliert. Die Interpolationseinrichtung kann auch für die Interpolation des Amplitudenparameters eingesetzt werden. Die LSP-Parameter ft und <y,sind sehr gut interpolationsfähig, und die Interpolation wird in Zeitintervallen, die gleich oder zweimal so groß wie die Abtastperiode des zur Erzeugung der Parameter dienenden Originaltons sind, durchgeführt. Beispielsweise werden die LSP-Parameter ft und &i, nach jeder Blockzeit von 20 ms erneuert und die Parameter in jedem Block bei einer 8-kHz-Abtastung alle 125 us interpoliert. Es ist auch möglich, die Interpolation im Stadium der LSP-Parameter ft und ω,durchzuführen und diese dann in die Steuerparameter umzusetzen.
Die Informationsmenge pro Block ist bei den LSP-Parametern ft und ω, gering im Vergleich zu den Steuerparametern für das Synthesefilter zur Sprachsynthese in der Vergangenheit. Sie sind ferner ausgezeichnet interpolationsfähig. Demzufolge ist es möglich, die LSP-Parameter ft und in. 7i> übertragen oder 711 speichern wie s'e sind, und ebenfalls möglich, die empfangenen oder rekonstruierten LSP-Parameter ft und ω, in die Steuerparameter für das Synthesefilter, das bei anderen Sprachsynthesesystemen verwendet wird, d. h. die PARCOR-Koeffizienten oder lineare Prädiktorkoeffizienten umzusetzen. Auf diese Weise können die LSP-Parameter ft und ω, auch bei vorhandenen Sprachsynthesizern verwendet werden. Der Tonsynthesizer der vorliegenden Erfindung eignet sich nicht nur zur Synthese gewöhnlicher Sprache, sondern auch solcher von Tönen eines Zeitsignaltons, eines Alarmtons, eines Musikinstrumenttons usw.
Die Erfindung wird nachfolgend unter Bezug auf die Zeichnungen an Ausführungsbeispielen näher erläutert. Es zeigt
F i g. 1 ein Blockschaltbild des grundsätzlichen Aufbaus einer Ausführungsform des erfindungsgemäßen Ton-Synthesizers,
F i g. 2 ein Blockschaltbild eines speziellen Betriebsbeispiels des Tonsynthesizers,
F i g. 3 ein Schaltbild eines Beispiels eines Filters erster Ordnung oder zweiler Ordnung, die den Synthesefilterschaltungsteil bilden,
Fig.4A ein Schaltbild zur Erläuterung eines Beispiels des Synthesefilterschaltungsteils für den Fall, daß der Analysegrad gerade ist,
F i g. 4B ein Schaltbild zur Erläuterung eines Beispiels des Synthesefilterschaltungsteils für den Fall, daß der Analysegrad ungerade ist,
F i g. 5 ein Diagramm des Verhältnisses zwischen den LSP-Parametern ft und ω, und der Sprachspektralumhüllenden,
F i g. 6 ein Schaltbild eines speziellen Betriebsbeispiels des Synthesefilterschaltungsteils für den Fall, daß der Analysegrad 4 ist,
Fig. 7 ein Schaltbild eines speziellen Betriebsbeispiels des Synthesefilterschaltungsteils, das sich di^ch eine äquivalente Umwandlung der in F i g. 6 gezeigten Schaltung ergibt,
F i g. 8 ein Schattbild eines speziellen Beispiels des Synthesefilterschaltungsteils für den Fall, da3 der Analysegrad 5 ist,
Fig.9 ein Schaltbild eines speziellen Bctriebsbeispiels des Synthesefilterschaltungsteils, das sich durch eine äquivalente Umwandlung der in F i g. 8 gezeigten Schaltung ergibt,
Fig. 10 ein Blockschaltbild eines Beispiels des Synthesefiltersehaltungsteils, das von einem Pipeline-Rechensystem Gebrauch macht,
F i g. 11A bis 111 Zeittafeln, die die Änderungen von Signalen an jeweiligen Stellen beim Betrieb des in F i g. 10 gezeigten Synthesefilterschaltungsteils wiedergeben,
Fig. 12 ein Schaltbild, das den Fall zeigt, bei dem die durch den in Fig. 11 gezeigten Betrieb erreichte Filterarbeitsweise durch eine Reihenschaltung von Filtern erzielt wird,
F i g. 13 ein Blockschaltbild eines Beispiels des einen Mikrocomputer verwendenden Synthesefilters,
Fig. 14A ein Diagramm, das die Änderungen der Stärke mit der Zeit für den Fall einer Lautfolge »ba kuo N ga« wiedergibt,
F i g. 14B ein Diagramm, das die Schwankungen der LSP-Parameter 9- und ω,- mit der Zeit für den Fall dieser Lautfoige zeigt.
Fig. 15 ein Diagramm, das die Verteilungen der relativen Frequenz der LSP-Parameter ft und ω, über der Frequenz zeigt,
Fig. 16 ein Diagramm, das die Beziehung zwischen der Anzahl von Quantisierungsbits pro Block und der Spektralverzerrung durch die Quantisierung zeigt,
F i g. 17 ein Diagramm, das die Beziehung der Spektralverzemi ng durch Interpolation über der Biocklänge für den Fall zeigt, daß die Parameter interpoliert wurden, und
F i g. 18 ein Schaltbild, das ein Beispiel zur Sprachsynthese durch Umwandlung der LSP-Parameter ft und to, zu Λ-Parametern zeigt.
Es wird zunächst auf Fig.! Bezug genommen, bei der die charakteristischen Parameter von synthetisch zu bildender Sprache (Kunstsprache) von einem Eingangsanschluß 11 nach jeweils einer konstanten Zeitperiode
(die nachfolgend als Blockperiode bezeichnet werden soll) von beispielsweise jeweils 20 ms an einen Interface-Schaitungsteil 12 angelegt und dort festgehalten werden. Von diesen so eingegebenen Parametern werden die LSP-Parameter Θ, und &»,, die eine Information über die Spektralumhüllende darstellen, an einen Parameter-(ransformierungs-Schaltungstei! (PT-Schaltungsteil) 13 geliefert. Von den Parametern, die eine Tonquelleninformation darstellen, wird die Amplitudeninformation an einen Parameterinterpolations-Schaltungsteil (Pl-Schaltungsteil) 14 geliefert, während die anderen Parameter, d. h. die die Grundperiode (Tonhöhe) der Sprache angebene Information und die Information, die angibt, ob es sich um einen stimmhaften oder stimmlosen Laut handelt, an einen Tonquellensignalgenerator-Schaltungsteil (TQSG-Schaltungsteil) 15 geliefert wurden.
In dem PT-Schaltungsteil 13 werden die eingegebenen LSP-Parameter Θ, und ω, in Steuerparameter
— 2 cos θί und — 2 cos ω, für einen Synthesefilter-Schaltungsteil (SF-Schaltungsteil) 16 transformiert und diese Parameter dem Pl-Schaltungsteil 14 geliefert. Im Pl-Schaltungsteil 14 werden in regelmäßigen Zeitintervallen die jeweiligen Interpolationswerte für die Steuerparameter und den Tonquellenamplitudenparameter errechnet, so daß die Spektralumhüllende einer stetigen Änderung unterliegen kann. Die so interpolierten Steuerparameter werden dem SF-Schaltungsteil 16 geliefert, während der Tonquellenamplitudenparameter an den TQSG-Schaltungsteil 15 angelegt wird. Im TQSG-Schaltungsteil 15 wird abhängig von den Eigenheiten der Sprache ein Tonqucllsnsignal auf der Basis der Tonhöheninformatior; und der Information, ob der Laut stimmhaft oder stimmlos, erzeugt und dieses Tonquellensignal zusammen mit dem interpolierten Tonquellenamplitudenparameter an den SF-Schaltungsteil 16 angelegt. Im SF-Schaltungsteil 16 wird aus dem Tonquellensignal und den Steuerparametern Kunstsprache erzeugt. Das Ausgangssignal vom SF-Schaltungsteil 16 wird zu einem Digital/ Analog-Umsetzschaltungsteil (DAU-Schaltungsteil) 17 geliefert und an dessen Ausgangsanschluß 18 als Analog- ;>o signal abgenommen. Ein StcUcrscnalturigstcu J9 erzeugt verschiedene Täkisignalc zur ncMügcn Aktivierung des Sprachsynthesizers und liefert diese den jeweiligen Schaltungsteilen.
Fi g. 2 zeigt in etwas konkreterer Form die einzelnen Schaltungsteiie von Fig. 1. Nach jeder Blockperiode wird die Information darüber, ob der Sprachlaut stimmhaft oder stimmlos ist, vom Interface-Schaltungsteil 12 an ein Stimmhaft-Register 23 und ein Stimmlos-Register 24 angelegt, während ein Sprachfrequenzparameter, der die Sprachtonhöhe angibt, in einem Tonhöhenregister 25 gespeichert wird. Ein Abwärtszähler 27 wird auf den Inhalt des Tonhöhenregisters 25 voreingestellt. Der Abwärtszähler 27 zählt in Abwärtsrichtung Impulse einer Abtastfrequenz, die an einem Anschluß 26 anstehen. Jedesmal, wenn der Zählerinhalt Null wird, liefert er einen Impuls an ein Tor oder Verknüpfungsglied 31 und wird gleichzeitig auf den Inhalt des Tonhöhenregisters 25 voreingestellt. An das Verknüpfungsglied 31 werden der Ausgang vom Stimmhaft-Register 23 und ein Aus- .:io gangsimpuls oder Ausgangsin.pulse von einem Impulsgenerator 28 angelegt, und, wenn diese Eingangssignale übereinstimmen, der Inhalt eines Tonquellenamplitudenregisters (nachfolgend einfach als Amplitudenregister bezeichnet) 34 über des Verknüpfungsglied 31 an einen Addierer 32 angelegt. Mit anderen Worten wird die Amplitudeninformation vom Amplitudenregister 34 nach jeweils einer Periode entsprechend der Sprachgrundfrequenz im Tonhöhenregister 25 an den Addierer 32 angelegt, wenn der zu erzeugende Kunstsprachlaut :i5 stimmhaft ist. Die Amplitudeninformation vom Amplitudenregister 34 wird in diesem vom Pl-Schaltungsteil 14 voreingestellt.
Handelt es sich bei dem zu erzeugenden Kunstsprachlaut um einen stimmlosen Laut, werden das Ausgangssignal vom Stimmlosregister 24 und ein Pseuriozufaälsserienimpuls von einem Pseudozuia!!ss!gna!-(PZS-)Generator 36 an ein Tor oder Verknüpfungsglied 37 geliefert. Bei jedem Zusammenfallen beider Eingangssignale wird die Amplitudeninformation aus dem Amplitudenregister 34 über das Verknüpfungsglied 37 an den Addierer 32 geliefert. Das in dieser Weise vom Addierer 32 abgeleitete Tonquellensignal wird, falls nötig, von einem Verstärker 39 verstärkt und dann an den SF-Schaltungsteil 16 angelegt.
Im PT-Schaltungsteil 13 werden die LSP-Paranieter θί und ω-, und der Amplitudenparameter von dem Interfacc-Schaltungsteil 12 nach jeder Blockperiode an ein Register 21 eingegeben. Die LSP-Parameter Θ, ur-d ω, werden einem Parameterumsetzer 22 geliefert, in welchem sie zu den Steuerparametern — 2 cos θί und
— 2 cos ω, transformiert werden. Der Parameterumsetzer 22 ist beispielsweise durch eine Umsetzungstabelle eines Festwertspeichers (ROM) gebildet, der bei Zugriff mit Adressen, die ft und ω> entsprechen, - 2 cos Θ, bzw.
— 2 cos ω, ausgibt Ein Schieberegister 20 erhält abwechselnd das Ausgangssignal vom Parameterumsetzer 22 und den im Register 21 gespeicherten Amplitudenparameter und setzt diese in ein serielles Signal um, das an den Pl-Schaltungsteil 14 angelegt wird.
Beim dargestellten Ausführungsbeispiel führt der Pl-Schaltungsteil 14 eine lineare Interpolation durch. Nach Einschalten eines Schalters 29 werden die Parameter eines Blocks einem Subtrahierer 30 geliefert, der eine Differenz zwischen diesem Parameter und demjenigen des vorigen Blocks von einem Addierer 33 ermittelt Diese Differenz wird in einem Differenzwertregister 38 über einen Schalter 91 gespeichert. Danach wird der Schalter 91 auf die Ausgangsseite des Differenzwertregisters 38 umgeschaltet und desser Inhalt in Umlauf gebracht. Hierbei wird der Inhalt des Differenzwertregisters 38 für Bitstellen, die höher a!s eine vorgegebene Bitstelle sind, herausgezogen und dem Addierer 33 geliefert wo er zum Inhalt eines Interpolationsergebnisregisters 92 hinzuaddiert wird. Wenn beispielsweise die Parameterauffrischungsperiode oder Blockperiode 16 ms ist und Interpolationsparameter 128mal während einer Blockperiode geliefert werden sollen, dann ist die Interpolationsschrittbreite ein Wert, der sich aus der Division des Differenzwerts durch 128 ergibt Diesen Wert erhält man durch Verschieben des Differenzwerts im Differenzwertregister 38 um 7 Bits zur Seite des niedrigeren Stellenwerts hin. Das Ergebnis der vom Addierer 33 durchgeführten Addition wird dem Interpolationsergebnisregister 92 geliefert und gleichzeitig als Ausgangsgröße des PI-Schaltungsteils 14 verwendet. Auf diese Weise werden vom Addierer 33 die Werte abgeleitet die dadurch erhalten werden, daß sequentiell mit jedem Umlauf des Differenzwertregisters 38 einmal, zweimal, dreimal,... der verschobene Wert des Differenzwertregisters 38 zum Parameter des vorigen Blocks im Interpolationsergebnisregister 92 addiert wird.
Bei diesem Beispiel wird der Pl-Schaitungsteil 14 für den Steuerparameter und den Amplitudenparai neter auf einer Zeitteilungsbasis verwendet, so daß, obwohl nicht gezeigt, der Steuerparameter und der Amplitudenparameter abwechselnd interpoliert werden und das Interpolationsergebnisregister S2 für beide Parameter gemeinsam genutzt wird. Der im Pl-Schaltungsteil 14 interpolierte Amplitudenparameter wird dem Amplitudenregister 34 im TQSG-Schaltungsteil 15 zugeführt, während der in oben erwähnter Weise interpolierte Steuerparameter . als Information zur Steuerung des Filterkoeffizienten des SF-Schaltungsteils 16 diesem zugeführt wird. Die Blockperiode, d. h. die Zeitspanne, nach der die Parameter erneuert werden, wird so ausgewählt, daß sie im Bereich von 10 bis 20 ms üegt, während die Interpolationsperiode so ausgewählt wird, daß sie im Bereich von 1 bis 2 AbtastintervaUen liegt. Die Art der Interpolation ist nicht speziell auf die lineare Interpolation beschränkt, es können auch andere Interpolationsarten sein. Wichtig ist, daß stetige Änderungen der interpolierten Parameter sichergestellt sind.
Der SF-Schaltungsteil 16 ist mit einer Rückkopplungsschleife zur Rückführung des Ausgangssignals über zueinander parallelgeschaltete FHterschaltungen (Rückkopplungseinrichtungen) 41 und 42 versehen. Die Filterschaltungen 41 und 42 werden über einen Eingangsanschluß 44 mit dem interpolierten Steuerparameter ver-
Id sorgt, während ihre Ausgangssignale mit Hilfe eines Addierers 43 addiert werden, dessen Ausgangssignal seinerseits in einem Addierer 45 dem Eingangssignal des SF-Schaltungsteils hinzuaddiert wird. Das addierte Ausgangssignal vom Addierer 45 wird über die Filterschaltungen 41 und 42 zurückgeführt und gleichzeitig an einem Ausgangsanschluß 55 abgenommen.
Für beide Filterschaltungen 41 und 42 wird von einem Schaltungskreis Gebrauch gemacht, der in Kaskade geschaltete Filter zweiter Ordnung mit Nullstellen auf dem Einheitskreis in der komplexen Ebene aufweist Beide Filterschaltungen 41 und 42 können durch eine mehrstufige Kaskadenverbindung von Filtern erster Ordnung und/oder zweiter Ordnung gebildet sein. Bei Ausbildung der Filterschaltungen als Digitalfilter kann von einem Filter erster Ordnung Gebrauch geflacht werden, wie es als Beispiel in F i g. 3A gezeigt ist, von einem Filter zweiter Ordnung, wie es in F i g. 3B gezeigt ist und von einem Filter zweiter Ordnung, wie es in F i g. 3C gezeigt ist. Das Filter gemäß F i g. 3A ist aus einer Verzögerungsschaltung 51 mit einer Verzögerung von einer Abtastperiode und einem Addierer 52 zusammengesetzt, der das verzögerte Ausgangssignal und ein unverzögertes Eingangssignal addiert. Das Filter gemäß F i g. 3B besteht aus zwei Stufen von Verzögemngsschaltungen 51 und einem Addierer 52, der das verzögerte Ausgangssignal und das nicht verzögerte Eingangssignal addiert. Das Filter gemäß Fig.3C enthält einen Multiplizierer 53, der das verzögc.-te Ausgangssignal von einer Stufe einer Verzögerungsschaltung 51 mit - 2 cos ω, multipliziert, sowie einen Addierer 52, der das verzögerte Ausgangssignal von zwei Stufen von Verzögerungsschaltungen 51, das nicht verzögerte Eingangssignal und das Ausgangssignal des Multiplizierers 53 addiert Die Übertragungsfunktionen der in den Fig.3A, 3B und 3C gezeigten Filter sind 1 ± Z, 1 — Z2 bzw. 1 — 2 cos ω-, Z + Z2. Es ist auch möglich, Filter höherer Ordnung einzusetzen.
Die Kombination und die Anzahl solcher Filter hängt vom Grad der Analyse ab und wird gemäß F i g. 4A oder 4B in Abhängigkeit davon ausgewählt, ob der Analysegrad gerade oder ungerade ist. In Fig.4A ist der Analysegrad 10, d. h. eine gerade Zahl, und die Filterschaltung 41 ist gebildet von einer Reihenschaltung aus einem Filter 56 erster Ordnung mit der Übertragungsfunktion 1 — Z und Filtern 57 bis 61 zweiter Ordnung, deren jeweilige Übertragungsfunktion 1 — 2 cos ω,Ζ + Z2 ist. Das Ausgangssignal am Ausgangsanschluß 55 wird in einem Multiplizierer 63 mit +1/2 multipliziert und an die Reihenschaltung 56—61 angelegt. Das Ausgangssignal des Filters 61 der letzten Stufe und das Ausgangssignal vom Multiplizierer 63 werden mittels eines Addierers 62 addiert und dessen Additionsausgangssignal zum Addierer 43 geliefert. In der Filterschaltung 42 wird das Ausgangssignal vom Multiplizierer 63 einer Reihenschaltung aus einem Filter 64 erster Ordnung mit der Übertragungsfunktion 1 + Z und Filtern 65 bis 69 zweiter Ordnung, die jeweils die Übertragungsfunktion 1—2 cos Θ,Ζ + Z2 besitzen, zugeführt. Das Ausgangssignal der Reihenschaltung 65—73 und das Ausgangssignal vom Multiplizierer 63 werden in einem Addierer 71 addiert und dessen Additionsausgangssignal dem Addierer 43 zugeführt. Den Multiplizierern 53 (vgl. F i g. 3C) der Filter 57 bis 61 zweiter Ordnung werden jeweils Steuerparameter
a\ = — 2 cos ω\ bis 35 = - 2 cos ω*,
eingegeben, während den Multiplizierern 53 der Filter 65 bis 69 zweiter Ordnung jeweils Steuerparameter
AfI = — 2 cos Θ] bis i>5 = - 2 cos ft
55
eingegeben werden.
F i g. 4B zeigt den Fall, daß der Analysegrad 11, d. h. eine ungerade Zahl ist. In der Filterschaltung 41 ist das Filter 56 erster Ordnung, das im Fall von F i g. 4A verwendet wird, weggelassen, und stattdessen wird ein Filter 72 zweiter Ordnung mit einer Übertragungsfunktion 1 - Z2 verwendet. In der Filterschaltung 42 ist das Filter 64 erster Ordnung weggelassen und stattdessen ein Filter 73 zweiter Ordnung verwendet, dem ein Parameter 06 = - 2 cos ft eingegeben wird.
In den Filterschaltungen 41 und 42 stellen die Steuerparameter ω, und Θ, Antiresonanzfrequenzen dar. bei denen die Ausgangswerte der Filterschaltungen 41 und 42 0,5 werden. Für den Fall, daß die den Filterschaltungen 41 und 42 zugeführten Antiresonanzfrequenzen nahe beieinanderliegen, kommt der Ausgangswert des Addierers 43 nahe an I, so daß sich auch die Verstärkung der Rückkopplungsschleife dem Wert I annähen. Als Folge tritt am Ausgangsanschluß 55 eine hohe Resonanzcharakteristik auf. 0)\ und ω% und θ\ bis ft sind hier Antiresonanzfrequenzen, die charakteristisch für die SprachspektralumhüHungsinformation sind. Diese Parameter und die Sprachumhüllungscharakteristik besitzen ein Verhältnis, wie es in Fig. 5 wiedergegeben ist.
Aus F i g. 5 ist ersichtlich, daß die Resonanzcharakteristik des Spektrums durch den Abstand zwischen benachbarten Parametern ausgedrückt werden kann. Diese Parameter stehen der Reihe nach in folgender Beziehung zueinander:
0 < Θ, < ω, < θι < O)2... < θ,< ω,<ιτ (8')
Eigenart des Synthesefilters ist, daß es stabil ist, wenn diese Voraussetzung erfüllt ist
Als nächstes soll ein spezielles Beispiel des SF-Schaltungsteils 16 beschrieben werden. Entsprechend dem in Klammem gesetzten Term im Nenner von Gleichung (7) erhält man die folgenden identischen Gleichungen aus Gleichung (5):
P(Z)- 1 = (1-Z) 77(l-2cosfi>,Z + Z2)-l
I = I
{ρΠ-\ i p/2 Λ
(a, +Z) + Σ (a,+ I +Z) JJ (1 +fl,Z+Z2) - JJ (1 +a,Z + Z2) } (9) '5
/-1 ,-i j.i )
{pll-1 i p/2 \
(b, +Z) + Σ (*/+ι +Z) JJ (1 +bjZ+Z2) + JJ (l+bjZ+Z2) \ (10)
a, = -2 cos ω,
bi = -2 cos β,
0<6>,, 8i<n (11)
Es wird ein Digitalfilter gebildet, das eine Allpolübertragungsfunktion besitzt, die die Sprachspektralumhüllende annähen und unter Verwendung der durch die Gleichungen (7), (9) und (10) gegebenen Beziehungen durch Gleichung (1) gegeben ist F i g. 6 zeigt den Fall for ρ = 4. In F i g. 6 sind Teile, die solchen in F i g. 4A entsprechen, mit denselben Bezugszahlen bezeichnet Das Eingangssignal bzw. der Eingangswert vom Anschluß 54 wird mit Hilfe des Addierers 45 zum Ausgangssignal bzw. Ausgangswert vom Addierer 43 hinzuaddiert Das Additionsergebnis wird an den Ausgangsanschluß 55 geliefert und gleichzeitig im Multiplizierer 63 mit +1 /2 multipliziert. Diese Multiplikation mit 1/2 entspricht derjenigen im Nenner von Gleichung (7). Das Ausgangssignal vom Multiplizierer 63 wird an eine Verzögerungsschaltung 74 angelegt, deren Verzögerungszeit eine Abtastperiode, d. h. gleich der Zeiteinheit ist Das verzögerte Ausgangssignal wird als Eingangssignal an die beiden Filter 57 und 65 zweiter Ordnung angelegt, in denen es den Verzögerungsschaltungen 51, den Multiplizierern 53 und den Addierern 52 zugeführt wird. In beiden Multiplizierern 53 werden die jeweiligen Eingangssignale mit a\ bzw. b\ multipliziert und die multiplizierten Ausgangssignale in beiden Filtern 57 und 65 jeweils an einen Addierer 94 zur Addition mit dem Ausgangssignal der zugehörigen Verzögerungsschaltung 51 angelegt. Die Ausgangssignale beider Addierer 94 werden an einen gemeinsamen Addierer 81 angelegt und gleichzeitig in beiden Filtern 57 und 65 über eine jeweilige Verzögerungsschaltung 95 mit einer Verzögerungszeit gleich einer Abtastperiode an den Addierer 52 angelegt. Die Ausgangssignale von beiden Addierern 52 werden als jeweilige Ausgangssignale der Filter 57 und 65 den Filtern 58 und 66 zweiter Ordnung der nächsten Stufe zugeführt. Die Filter 58 und 66 stimmen im Aufbau mit den Filtern 57 und 65 überein, nur sind hier die Koeffizienten für die Multiplizierer 53 a2 bzw. b}. Das Ausgangssignal vom Addierer 94 jedes dieser Filter 58 und 66 wird an einen Addierer 82 zur Addition mit dem Ausgangssignal vom Addierer 81 angelegt. Die Ausgangssignale von den Addierern 52 der beiden Filter 58 und 66 werden dem Addierer 43 zugeführt, um voneinander subtrahiert zu werden. Der Addierer 43 erhält ferner das Ausgangssignal vom Addierer 82.
Die Verzögerungsschaltung 74 entspricht Zaußerhalb der Klammern in den Gleichungen (9) und (10), und die Filter 57 und 58 stellen je ein Filter zweiter Ordnung mit einer Übertragungsfunktion 1 + Z(aj + Z) dar. In ähnlicher Weise stellen die Filter 65 und 66 je ein Filter zweiter Ordnung mit einer Übertragungsfunktion 1 + Z(bj + Z) dar. Demzufolge wird mitteis der Reihenschaltung der Filter 57 und 58 der dritte Term in der Klammer in Gleichung (9) realisiert, während die Verzögerungsschaltung 51, der Multiplizierer 53 und der Addierer 94 im Filter 58 (a, + 1 + Z) realisieren. Folglich wird durch diese Schaltung und das Filter 57 der zweite Term in der Klammer in Gleichung (9) realisiert, wobei das Ausgangssignal über den Addierer 82 zum Addierer 83 geliefert wird. Die Verzögerungsschaltung 51, der Multiplizierer 53 und der Addierer 94 im Filter 57 realisieren (3, + 1 + Z), und das Ausgangssignal wird dem Addierer 43 über die Addierer 81 und 82 geliefert. Auf diese Weise werden die Terme in den Klammern in Gleichung (9) durch die Filter 57 und 58 zweiter Ordnung und die Addierer 43,81 und 82 realisiert. In ähnlicher Weise werden die Terme in den Klammern in Gleichung (10) durch die Filter 65 und 66 zweiter Ordnung und die Addierer 43,81 und 82 realisiert. Die Gleichungen (9) und (10) unterscheiden sich formal nur dadurch, daß die Vorzeichen der dritten Terme in den Klammern unterschiedlich sind und daß deshalb das Vorzeichen des Eingangssignals zum Addierer 43 sich unterscheidet. Demzufolge realisieren der Addierer 43, die Filter 57,58,65 und 66, der Multiplizierer 63 und die Verzögerungsschaltung 74 die Gleichung (2). während die Schaltungsanordnung von F i g. 6 als Ganzes der Anzapfung 97 zum Addierer 43
dem zweiten Term in den Klammern in Gleichung (9) entspricht Die Filter 65 und 66 zweiter Ordnung der Filterschaltung 41 sind in ähnlicher Weise ausgebildet In Verbindung mit der Filterschaltung 41 wird das Ausgangssignal von der Verzögerungsschaltung 74 in einem Multiplizierer 98 mit -1 multipliziert, um das Minuszeichen für den dritten Term in den Klammern der Gleichung (9) zu verwirklichen.
Für den Fall, daß ρ ungerade ist, erhält man aus Gleichung (8) die folgende identische Gleichung, die dem Term in den Klammern im Nenner der Gleichung (7) entspricht:
I O.-3I/2 / (,,-11/2 ι
P(Z)- I = Z<(a,+Z) + 2 (fl/+i+Z) JJ U+fjZ+Z2) - Z JJ (1+α,Ζ + ζΜ (12)
Q(Z)-I= Z J(A1+Z) + Σ (Äf+i+Z) x /7 (1+Λ,Ζ+Ζ2)} (13)
a, = -2 cos ω,
ί, = -2 cose,
0<<y,, 0,<ff (14)
Wie in dem oben beschriebenen Fall, daß ρ gerade ist, lassen sich, wenn ρ ungerade ist, zwei Arten von Digitalfiltern, die als Anzapfungsausgangstyp und als Anzapfungseingangstyp bezeichnet werden können, aus den Verhältnissen der Gleichungen (7), (12) und (13) in den in den Fig. 8 und 9 gezeigten Formen realisieren. In den F i g. 8 und 9 ist angenommen, daß ρ = 5 ist In den F i g. 8 und 9 entspricht das Filter 72 erster Ordnung Z im dritten Term in den Klammer?, in Gleichung (13), während das Filter 73 zweiter Ordnung zur Erzielung einer solchen Charakteristik dient, daß die Produkte der Übertragungsfunktionen
(1 + b,Z + Z2) und (1 + biZ + Z2)
der Filter 65 und 66 mit (O3 + Z) multipliziert werden.
Wie man den Fig.6 bis 9 entnehmen kann, können der Multiplizierer 63 zur Multiplikation mit 1/2 und die Verzögerungsschaltung ,74 an irgendwelchen Stellen in der Rückkopplungsschleife angeordnet werden. Da die
ZS Filter zweiter Ordnung voü glei hem Typ sind, ist es möglich, die Hardware dadurch zu vereinfachen, daß die Schaltungsanordnung so ausgebildet wird, daß ein sog. Pipelinebetrieb unter Verwendung eines Multiplizierers 53, der Vielzahl von Addierern 53 und 94 und der Vielzahl von Verzögerungsschaltungen 51 und 95, die ein Filter zweiter Ordnung ausmachen, auf einer Zeitmultiplexbasis durchgeführt wird. Fig. 10 zeigt den Fall, daß das Beispiel des in Fig. 12 gezeigten Filters zur Durchführung des Pipelinebetriebs angecidnet ist. Bei diesem Beispiel ist ρ = 10, und die Verarbeitung eines Satzes von Parametern, die vom Pl-Schahj.jgsteil angelegt werden, ist innerhalb einer Periode von 176 Takten beendet. In Fig. 10 sind Teile, die solchen von Fig. 12 entsprechen, mit denselben Bezugszahlen bezeichnet. Die Eingangsseite eines statischen 16-Bit-Schieberegisters 74, das die Funktion der Verzögerungsschaltung 74 ausführt, wird mit Hilfe eines Schalters Si zwischen der Ausgangsseite des Schieberegisters selbst und der Ausgangsseite des Addierers 45 umgeschaltet. Die Multiplikanden-Eingangsseite des Multiplizierers 53 und die Eingangsseite des Addierers 52 werden mittels eines Schalters S2 zwischen der Ausgangsseite des Schieberegisters 74, der Ausgangsseite einer (27 — d)-lcn Stufe des Schieberegisters (vom Eingang des Schieberegisters 74 an gezählt) und der Ausgangsseite eines 31-Bit-Schieberegisters 101 umgeschaltet, wobei deine Betriebsverzögerung des Multiplizierers 53 ist. Der Multiplizierer 53 ist an einem Ende mit dem Ausgangsanschluß 55 und der Eingangsseiw des Addierers 94 verbunden und leitet am anderen Ausgangsende das um Takte verzögerte Multiplikanden-Eingangssignal ab, das dem (154 + d)-Bh-Schieberegister 51 geliefert wird. Das Ausgangssignal vom Addierer 81 wird über ein Verknüpfungsglied 102 und ein 16-Bit-Schieberegister 103 zu seiner Eingangsseite zurückgeführt, wodurch mittels der Addierer 81 und 82 in F i g. 10 eine kumulative Addition durchgeführt wird. Ein Verknüpfungsglied 102 ist nur während des Zeitintervalls zwischen d + 2 und 145 + d durchgeschaltet. Eine Eingangsseite des Addierers 43 wird mittels eines Umschalters S3 zwischen den Ausgangsseiten der Addierer 52 und 81 umgeschaltet, während die andere Eingangsseite des Addierers 43 mittels eines Schalters S« zwischen den Ausgangsseiten einer 16. und einer (d + l)-ten Stufe des Schieberegisters 101 umgeschaltet wird. Die Eingangsseite des Schieberegisters 101 wird mittels eines Schalters S5 zwischen den Ausgangsseiten der Addierer 43 und 52 umgeschaltet.
Die Schalter Si bis S5 sind während einer Arbeitsperiode, d. h. 176 Takten, während einer bei den jeweiligen Kontakten angegebenen Taktperiode mit diesen verbunden. Die Schieberegister 51, 95, 101 und 103 sind (154 + d)-Bit, (175 - c/)-Bit,31-Bit bzw. 16-Bit dynamische Schieberegister, die ständig mit Schiebetaktimpulsen versorg! werden. Die jeweilige gestrichelte Eingangslcitung zu den Addierern 43, 45, 52 und 81 gibt die Zeitsteuerung der Betriebsgreii/.c für die einzelnen Parameter an. Beispielsweise kennzeichnet Φα eine Wiederholung nach jeweils Ib Takten. Die Betriebsvcrzogerutig der einzelnen Addierer ist zu einem Takt gewählt.
b? F i g. 11 ist eine Zeittafel des Betriebs der einzelnen Teile in F i p. 10. F i g. 11A zeigt die Taktzcitpunktc. Fig. 11B die Zeitpunkte der Eingabe der interpolierten Koeffizienten a„ 6, und der interpolierten Amplitude A in die Multiplizierer 53 vom Eingangsanschluß 44, Fig. 1 IC die der Eingabe des Multiplikandendes Multiplizierers 53. F i g. 11D die eines Eingangssignals zum Addierer 94 vom Multiplizierer 53, F i g. 11E die des anderen Eingungs-
signals zum Addierer 94, F i g. 11F die des Ausgangssignals vom Addierer 94, F i g. 1 IG die des Ausgangssignals vom Addierer 81 und folglich des Inhalts des Registers 103, F i g. 11H die des Eingangssignals zum Addierer 52 vom Schieberegister 95 und F i g. 111 die des Ausgangssignals vom Addierer 52. F i g. 12 zeigt, diese Eingangssignale und Ausgangssignale in Form von an den jeweiligen Baugliedern auftretenden Signalen für den Fall einer Kaskadenschaltung der Filter zweiter Ordnung. '
Wie aus F i g. 11 ersichtlich, werden in der Zeitspanne zwischen den Takten 0 und 16 ein Koeffizient a\(t) und ein Multiplikand x\{t) im Multiplizierer 53 miteinander multipliziert, um die Multiplikation im Filter zweiter Ordnung 57 in Fi g. 12 zu bewirken. Das Ergebnis dieser Multiplikation erhält man beim d-len Takt. Wie in den F i g. 11B und 1 IC gezeigt, werden in der Zeitspanne zwischen den Takten 16 und 32 ein Koeffizient b\ U) und ein Multiplikand y-, (f) multipliziert, um die Multiplikation im Filter 65 zweiter Ordnung auszuführen. Der Multiplikand x\ (f) wird durch das Schieberegister 51 zusammen mit 22 Bits des Multipüzierers 53 um (176 + d) Takte verzögert, so daß, wie F i g. 11E zeigt ein Multiplikand X\ (f — 1) beim d-ten Takt an den Addierer 94 angelegt und zu dem zu diesem Zeitpunkt vom Multiplizierer 53 abgeleiteten Ausgangssignal ajXi addiert wird. Das addierte Ausgangssignal x·.' (/) wird über den Addierer 81 zwecks Akkumulation an das Schieberegister 103 geliefert Das heißt das Ausgangssignal vom Addierer 81 wird dem Signalsystem der Addierer 81, 82 ... in is Fig. 12 zugeführt
Wie Fig. HH zeigt wird das Ausgangssignal vom Addierer 94 auch dem (175 - d)-Bit-Schieberegister 95 geliefert Demgemäß ist in der Zeitspanne zwischen den Takten 0 und 16 das Ausgangssigna! vom Schieberegister X]' U — 1), wie dies in Fi g. 11H gezeigt ist und wird im Addierer 52 zum Multiplikanden Xi (f) addiert Das Ausgangssignal x2(t) des Addierers 52 wird dem Filter zweiter Ordnung 58 in Fig. 12 als Eingangssigna! geliefert Das Ausgangssignal X2 (t) vom Addierer 52 wird über das Schieberegister 101 dem Multiplizierer 53 zugeführt Wie in F i g. 1 IC gezeigt wird das Ausgangssignal X2U) in der Zeitspanne zwischen dez,Takten 32 und 48 im Multiplizierer 53 mit dem Koeffizienten aj(i) multipliziert Vor dieser Multiplikation werde:, b\ (f) und yx U), wie zuvor beschrieben, multipliziert und das multiplizierte Ausgangssignal in ähnlicher Weise verarbeitet, um hierdurch in der Zeitspanne zwischen den Takten 48 und 64 vom Filter zweiter Ordnung 65 das Ausgangssignal y2 (/) zu erhalten. Auf diese Weise werden die Multiplikation des Koeffizienten a und des Multiplikanden χ und die Multiplikation des Koeffizienten b und des Multiplikanden y abwechselnd alle 16 Takte ausgeführt und die Produkte an das Schieberegister51 angelegt, wie dies durch a\X\, b\y\, a2x2, biyi*.... in Fi g. 11D angedeutet ist. Ferner leiten die Filter zweiter Ordnung 57,58,59,60 und 61 x\ U), χΐ U), xj (t), x* (t) bzw. X5' (t) und X2 (t), xj (0. *4 (')· *s(0 bzw. X6 (0· die den Schieberegistern 95 und 101 geliefert werden, von den Produkten ab. In ähnlicher Weise werden y,' U) bisys' U) bzw.y2 U) bis ye (/) von den Filtern zweiter Ordnung 65 bis 69 erhalten und diese Ausgangssignale abwechselnd mit x'U) bzw. χ (ί) an die Schieberegister 95 und 101 angelegt. In der Zeitspanne zwischen den Takten 145 und 16! wird das zu diesem Zeitpunkt vom Addierer 52 abgeleitete Ausgangssignal ye und das vorher im Schieberegister vorgesehene xe im Addierer 43 voneinander subtrahiert und (*6 — ^e) über den Schalter 5s dem Schieberegister 101 geliefert, wo diese Differenz um (d + 1) Takte verzögert wird. Das verzögerte Ausgangssignal wird vom Schalter S4 abgenommer, und in der Zeitspanne zwischen den Takten 147 + d und 163 + d in den Addierer 43 eingegeben. Das zu diesem Zeitpunkt vom Schieberegister 103 gewonnene Ausgangssignal wird dem Addierer 43 über den Addierer 81 und den Schalter Sz geliefert Das Ausgangssignal vom Addierer 43 zu diesem Zeitpunkt wird das Ausgangssignal vom Addierer in F i g. 12. Dieses Ausgangssignal wird an den Addierer 45 angelegt wo es zur Bildung von ZU) zum Eingang&cignal am Anschluß 54 addiert wird. Das addierte Ausgangssignal ZU) wird an das Register 74 geliefert das die Verzögerung der Verzögerungsschaltung 74 von Fig. 12 ausführt Das verzögerte Ausgangssignal wird an den Multiplizierer 53 angelegt und zu diesem Zeitpunkt der Koeffizient A als Amplitudeninterpolations-Ausgangssignal am Anschluß 44 bereitgestellt, so daß vom Multiplizierer 53 am Ausgangsanschluß 55 A ■ ZU) abgenommen werden kann. Diese Multiplikation wird in dem Fall ausgeführt, daß das Ausgangssignal vom SF-Schaltungsteil 16 in einem Multiplizierer 104 in Fig. 12 mit der Amplitudeninformation A multipliziert wird. Vom Schieberegister 74· wird ein Ausgangssignal ZU)Il abgenommen, das um 1 Bit nach unten verschoben wurde. Dieses Ausgangssignal wird in der nächstfolgenden Arbeitsperiode für einen neuen Satz von Parametern über den Schalter S2 dem Multiplizierer 53 als ZU - l)/2, d. h. als xU) und y(t) zugeführt. Das Ausgangssignal am Ausgangsanschluß 55 kann auch über einen Ausgangspuffer 105 eines statischen Schieberegisters als Parallels!- gnal erhalten werden.
Der voranstehend beschriebene Pipelinebetrieb ist auf andere Arten von SF-Schaltungsteilen 16 anwendbar. Es dürfte aus dem Aufbau von F i g. 10 ferner entnehmbar sein, daß die Filterfunktion durch Addition, Multiplikation und Verzögerung erreicht wird, so daß diese Filterverarbeitung auch unter Verwendung eines Mikrocomputers durchgeführt werden könnte. In Fig. 13 beispielsweise werden durch aufeinanderfolgendes Auslesen, Interpretieren unti Durchführen von Programmen in einem Programmspeicher 107 von einem Eingangstor 111 ein Tonquellensignal bzw. Steuerparameter eingegeben, die von dem TQSC-Schaltungsteil 15 und dem Pl-Schaltungsteil 14 an Anschlüsse 108 und 109 angelegt werden. Die Zentraleinheit 106 führt daraufhin nacheinander die zuvor auf Fig. 11 beschriebenen Operationen aus. Ein Schreib-Lese-Speicher 112 wird anstelle der Register 51, 74, 95, 101, 103 und 105 in Fig. 10 verwendet. Die Ergebnisse der Operationen werden in den Speicher 112 eingeschrieben und zum geeigneten Zeitpunkt aus ihm ausgelesen, um Operationen auszuführen. Das so erzielte Ausgangssignal wird von einem Ausgangstor 113 an den Ausgangsanschluß 55 angelegt. Die Zentraleinheit 6, die Speicher 107 und 112 und die Tore 111 und 113 sind mit einem Bus 114 verbunden.
Das Ausgangssignal vom SF-Schaltungsteil, d. h. vom Synthesefilterschaltungsteil 16 läßt sich auf irgendeine der oben erwähnten Weisen erzielen. Das Ausgangssignal wird in F i g. 2 mit Hilfe des DAU-Schaltungsteils 17 in ein analoges Signal umgesetzt, um ein Sprachausgangssignal zu erhalten. Wenn das Eingangssignal zum DAU-Schaltungsteil 17 ein serielles Signal ist, dann wird es an ein Schieberegister 115 angelegt und der Inhalt des Schieberegisters 115 livtt.els eines DA-Umsetzers in analoge Form umgesetzt.
Wie zuvor beschrieben, können die LSP-Parameter ω, und B1 in den charakteristischen Sprachparametern, die bei der Erfindung verwendet werden, durch Lösen der Gleichungen (5) und (b) erhalten werden. In den Fig. 14A und 14B sind die Ergebnisse einer Analyse der Lautfolge »bakuoNga« unter Verwendung der LSP-Parameter ω, ■
und Θ, gezeigt. In den Fig. HA und 14B ist auf der Abszisse die Zeit /,in Fi g. 14A auf der Ordinate die Stärke und in Fig. 14B auf der Ordinate die normierte Kreisfrequenz aufgetragen. Betrachtet man Momentanpunkte in Fig. 14B, dann steigt die Frequenz in der Reihenfolge der Parameter θ\, ω\, θϊ,ω-ι... θ%, ci*$. Diese Reihenfolge ändert sich nicht, und Θ, und ω, fallen innerhalb eines Blocks nicht zusammen. Es ist demzufolge garantiert, daß der SF-Schaltungsteil 16 ständig stabil ist. Die Frsquenzverteilungen der LSP-Parameter 6>, und ω, sind in F i g. IS gezeigt, in der auf der Abszisse die normierte Kreisfrequenz /und auf der Ordinate die relative Frequenz
ίο D aufgetragen sind. Wie in F i g. 15 gezeigt, sind die einzelnen Parameter nicht über ein breites Frequenzband verteilt, sondern auf ein relativ schmales Frequenzband beschränkt, so daß die LSP-Parameter ω, und 6*, in Verbindung mit dem Frequenzbereich, über den sie sich erstrecken, quantisiert werden können.
Die LSP-Parameter «,und Θ, sind gering bezüglich Quantisierungsverzerrung. Fig. 16 zeigt eine Spektralverzerrung Ds einer Kunstsprache, wenn verschiedene Parameter verschieden quantisiert werden. Die Abszisse stellt die Anzahl von Quantisierungsbits B per Block und die Ordinate die Spektralverzerrung Ds dar. Die Linie 117 zeigt den Fall, wo unter Berücksichtigung allein der Parameterverteilung der I'ARCOR-Koeffizient linear quantisiert ist nur in dem Koeffizienten, der verteilt war. Die Linie 118 zeigt den Fall, daß die Anzahl von Quantisierungsbits für den PARCOR-Koeffizient unter Berücksichtigung der Spektralempfindlichkeit zusätzlich I
zur Pnrnmeterverteilung im Fall von Linie 117. speziell im Fall einer merklichen Beeinflussung des Spektrums.
vergrößert wurde. Die Linie 119 zeigt den Fall, daß die LSP-Parameter ω, und Θ, unter Berücksichtigung nur der Parameterverteilung quantisiert wurden. Die Linie 121 zeigt den Fall, daß die LSP-Parameter ω, und Θ, unter Berücksichtigung der Parameterverteilung und der Spektralempfindlichkeit quantisiert wurden. Man kann Fig. 16 entnehmen, daß im Fall der Verwendung der gleichen Anzahl von Quantisierungsbits die Spektralverzerrung in der Reihenfolge der Linien 117, 118, 119 und 121 kleiner wird. Da die Linien 119 und 121 nahe beieinanderliegen, werden die LSP-Parameter ω, und Θ, bezüglich der Spektralverzerrung nicht so sehr beeinflußt, auch wenn die Spektralempfindlichkeit nicht in Betracht gezogen wird. Da es also ausreicht, die Quantisie- ι rung unter Berücksichtigung des Parameterverteilungsbereichs allein durchzuführen, ist diese Quantisierung einfach. Teilt man die Anzahl von Quantisierungsbits pro Block, b-^i der die Spektralverzerrung im Fall der Linie 119 ein dB ist durch die Anzahl der Quantisierungsbits im Fall der Linie 117, ergibt sich ein Wert 0,7. In ähnlicher Weise wird das Verhältnis der Anzahl von Quantisierungsbits pro Block, bei der die Spcktralverzerrung 1 dB ist, zwischen den Linien 118 und 121.0,8.
Hieraus geht hervor, daß die LSP-Parameter ω, und ft ausgezeichnet sind. Ein dB ist eine Differenzempfindungsgrenze der Spektralverzerrung von Kunstsprache.
Fig. 17 zeigt Interpolationseigenschaften, wobei die Abszisse eine Blocklänge 7}und die Ordinate die Spek-
tralverzerrun« Ds darstellen. Fig. 17 zeigt die Spektralverzerrung von Kunstsprache für den Fall, daß ein Block, <
in dem Originalsprachlaute in 10 ms analysiert wurden, als Bezug verwendet wurde, die Blocklänge auf 20 bis 70 ms erhöht wurde und die Parameter alle 10 ms interpoliert wurden. Die Linie 122 zeigt den Fall, wo die PARCOR-Koeffizienten verwendet wurden, während die Linie 123 den Fall zeigt, daU die LSP-Parameter &>, und Θ, verwendet wurden. Wie aus Fig. 17 erkennbar, kann bei derselben Verzerrung die Locklänge Tf bei Verwendung der LSP-Parameter länger als die Blocklänge Tr bei Verwendung der PARCOR-Koeffizienten gemacht werden, d. h. die Periode zur Erneuerung der Parameter kann verlängert werden, so daß die Gesamt-Informationsmenge hierdurch verringert werden kann. Da ferner die Anzahl von Bits pro Block bei den LSP-Parametern geringer als bei den PARCOR-Koeffizienten ist, wie man aus Fig. 16 entnimmt, wird die Informationsmenge bei derselben Verzerrung um das Produkt der Verminderungsverhältnisse in den Fig. 16 und 17 geringer. Das heißt im Fall der LSP-Parameter kann die Informationsmenge etwa 60% derjenigen im Fall der PARCOR-Koeffizienten betragen.
Bei Einsatz der LSP-Parameter ist es wie im Fall anderer Parameter ohne Bedeutung, daß sie mit einer kürzeren Periode als der Abtastperiode der Originalsprache, die zur Gewinnung der Parameter verwendet wird, interpoliert werden. Experimente ergaben, daß die Interpolationsperiode etwa zweimal so groß oder weniger als die Abtastperiode der Originalsprache sein kann, daß jedoch, wenn die erstere etwa zweimal so groß wie die letztere ist. Störungen oder Rauschen eingeführt wird, das die Kunstsprache undeutlich macht Es ist d.her vorzuziehen, daß die Interpolationsperiode gleich der oder zweimal so groß wie die Abtastperiode der Originalsprache ist : Wie im Vorangehenden beschrieben, ist es relativ leicht, die LSP-Parameter automatisch herauszuziehen, so daß dies auf Echtzeitbasis erfolgen kann. Ferner sind die LSP-Parameter ausgezeichnet bezüglich der Interpolationseigenschaft, haben geringe Abweichung bezüglich der Quantisierungseigenschaft und erlauben Übertragung und Speicherung von Sprache mit geringer Informationsmenge. Bei der Sprachsynthese kann Sprache hoher Qualität wiedergewonnen und mit einer geringen Informationsmenge künstlich aufgebaut werden, wobei die Stabilität des Synthetisierungsfilters garantiert ist, solange das Verhältnis von Gleichung (8') gilt :■
Bei der Anordnung gemäß F i g. 2 ist es auch möglich, das Spektrum dadurch auszuweiten, daß vom Impulsge- y
nerator 28 eine Kette von Impulsgruppen, wie etwa die Barker-Folge, anstelle der Impulskette erzeugt wird. Der f
Pl-Schaltungsteil 14 kann auch in der dem PT-Schaltungsteil 13 vorangehenden Stufe vorgesehen werden. Das ;; heißt, die LSP-Parameter vom Interface-Schaltungsteil 12 können auch nach ihrer Interpolation der Kosinus- ?<i transformation im PT-Schaltungsabschnitt 13 unterzogen werden. In diesem Fall ist die Verwendung eines ei'.
Festspeichers unwirtschaftlich, da seine Speicherkapazität enorm sein müßte. Demzufolge ist es vorzuziehen, die v! Parameterumsetzung unter Verwendung einer Näherungsfunktion des Kosinus durchzuführen, statt den in % Verbindung mit dem Beispiel von F i g. 2 beschriebenen Festspeicher zu verwenden. In F i g. 2 wird die Informa- §■ tion, die angibt, ob es sich um einen stimmhaften oder stimmlosen Sprachlaut handelt, in das Stimmhaftregister |:.
12 I
23 und das Stimmlosregister 24 eingespeichert. Diese Information muß jedoch nicht immer vorgesehen werden. Das heißt, es wird eine Detektorschaltung vorgesehen, die ermittelt, ob der an das Tonhöhenregister 25 angelegte Grundperiodenparameter Null ist oder nicht. Wird festgestellt, daß dieser Parameter Null ist, dann gilt dies als Entscheidung, daß der Laut stimmlos ist, so daß das Verknüpfungsglied 37 durchgeschaltet wird. Im Fall von von Null abweichenden Werten wird der Laut als stimmhaft betrachtet und das Verknüpfungsglied 31 durchgeschaltet. Die Steuerung durch den Amplitudenparameter kann auch in Verbindung mit dem Ausgang des SF-Schaltungsteils 16 durchgeführt werden, wie dies vorangehend unter Bezug auf die Ausführungsform von Fig. 12erläutert wurde.
Jiii der vorangehenden Beschreibung wurde als Synthesefilter ein Filter verwendet, das im Rückkopplungskreis Mittel enthält, um eine Vielzahl von Filtern erster Ordnung und zweiter Ordnung unterschiedlicher Koeffizienten in Reihe zu schalten, die die Nullstelle auf einem Einheitskreis besitzen. Dies erfolgte unter Benutzung der LSP-Parameter. Das Synthesefilter muß jedoch nicht immer speziell auf solch ein Filter beschränkt sein. Vielmehr kann die Sprachsynthese auch durchgeführt werden, indem die LSP-Parameter in andere Parametertypen transformiert werden und andere Filter verwendet werden. In Fig. 18 z. B., in der Teile, die solchen von F i g. 1 entsprechen, mit gleicher Bezugszahl bezeichnet sind, wird der Grundperiodenparameter in den charakteristischen Parametern, die dem Interface-Schaltungsabschnitt 12 zugeführt werden, dem TQSG-Schaltungsteil 15 zugeführt, während der Amplitudenparameter dem Pl-Schaltungsteil 14 geliefert wird. Der auf diese Weise interpolierte Amplitudenparameter wird an den TQSG-Schaltungsteil 15 angelegt und in diesem in der zuvor unter Bezug auf F i g. 2 erläuterten Weise verarbeitet, wobei an den SF-Schaltungsteil 16 ein TonquellensiiJnal ppüpfprt wird. Dip I^P-PariirriPtPr u/prHpn pinpm L-SP-Pärsrnctcrtränsforrnierun^S-Schsitun^Stei! i24 geliefert, in welchem sie zu anderen Parametertypen, etwa einem ar-Farameter, PARCOR-Parameter oder andere transformiert werden. Beispielsweise werden von den LSP-Parametern unter Verwendung der Gleichung (5) oder (6) Polynome P(Z) und Q(Z) gewonnen und von den Polynomen unter Verwendung der Gleichungen (1) und (2) die Prädiktorkoeffizienten λ, der Übertragungsfunktion H(Z). Durch Interpolation der so erhaltenen Prädiktorkoeffizienten λ, im Pl-Schaltungsteil 14 in der erforderlichen Weise werden die Eigenschäften des SF-Schaltungsteils 16 gesteuert. Der SF-Schaltungsteil 16 ist beispielsweise als ein zyklisches Filter ausgebildet, in dem, wie in Fig. 18 gezeigt, das Tonquellensignal vom TQSG-Schaltungsteil 15 mittels eines Multiplizierers 125 um ο vervielfacht und zur Subtraktion vom Ausgangssignal eines Addierers 127 an einen Addierer 126 angelegt wird. Das Ausgangssignal vom Addierer 126 wird dem Ausgangsanschluß 55 geliefert. Das so gewonnene Ausgangssignal am Ausgangsanschluß 55 wird an eine Reihenschaltung von Verzögerungsschaltungen D\ bis Dp angelegt, von denen jede eine Verzögerungszeit gleich einer Abtastperiode besitzt. Die A sgangssignaie von den Verzögerungsschaltungen D\ bis DP werden mit jeweiligen Koeffizienten X\ bis <xp vom Pl-Schaltungsteil 14 in Multiplizierern M\ bis Mp multipliziert. Die multiplizierten Ausgangssignale werden der Reihe nach addiert und dann im Addierer 127 zusammenaddiert.
35
Hierzu 11 Blatt Zeichnungen

Claims (1)

  1. Patentansprüche:
    1. Thonsynthesizer, mit einer Signalquelle (15) zum Erzeugen eines Tonquellensignals, einer Steuerparameterquelle (11), die Steuerparameter zum Steuern der Eigenschaften eines Filters abgibt, einer Aüpol-Syn-
    thesefilterschaltung (16), die unter Steuerung durch die Steuerparameter ein synthetisches Tonsignal erzeugt und einen Addierer und eine mit dem Ausgang der Synthesefilterschaltung (16) verbundene Rückkopplungsanordnung enthält, dadurchgekennzeichnet, daß die Steuerparameter die Form
    a, = —2cos/y, und b,= -2cosft (/= 1,2,3...)
    aufweisen, wobei &», und Θ-, LSP-(Linearspektrumpaar-)Parameter sind und der Bedingung
    0 < θ\ < oh <θτ<ωι<θϊ...<π
    genügen, daß einem Eingang des Addierers (45) das Tonquellensignal zugeführt wird, daß eine erste und eine zweite Rückkopplungseinrichtung (41,42) vorgesehen sind, wobei die Eingänge der ersten und der zweiten Rückkopplungseinrichtung (41,42) jeweils das Ausgangssignal der Synthesefilterschaltung (16) empfangen und die Ausgangssignale beider Rückkopplungseinrichtungen (41,42) auf einen weiteren Eingang des Addierers (45) gegeben werden, so daß eine erste und eine zweite Rückkopplungsschleife gebildet werden, u;id daß
    die erste bzw. die zweite Rückkopplungseinrichtung eine erste bzw. eine zweite im Kaskadenbetrieb arbeitende Bl leranordnung (41,42) zweiter Ordnung, ausgedrückt durch
    (1 + aZ + Z2) bzw. (1 + biZ + Z2)
    mit Z = e-J" aufweisen.
    2. Tonsynthesizer nach Anspruch 1, dadurch gekennzeichnet, daß die Signalquelle (15) aus einer Grundperiodentonquelte (25,27), eiper Rauschquelle (36) zum Erzeugen von Zufallsimpulsen und einer Auswahleinrichtung (31,37) besteht, wobei die Grundperiodentonquelle (25, 27) von einem Grundperiodenparameter zum Erzeugen eines Impulses oder einer Impulsgruppe einer durch den Parameter bestimmten Periode steuerbar ist und die Auswahleinrichtung (31,37) das Ausgangssignal von der Grundperiodentonquelle oder das Ausgangssignal von der Rauschquelle abhängig davon auswählt, ob es sich bei einem synthetisch zusammengesetzten Sprachlaut um einen stimmhaften oder einen stimmlosen Laut handelt.
    3. Tonsynthesizer nach ei"em der vorhergehenden Ansprüche, gekennzeichnet ferner durch eine Amplitudensteuereinrichtung (34) zum Steuern der Größe eines Signals am Eingang oder am Ausgang der Synthesefilterschaltung (16) durch ein'ι Amplitudenparameter.
    4. Tonsynthesizer nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, daß die Filteranordnungen zweiter Ordnung (41,42) jeweils ein erstes Verzögerungsglied (95) zum Verzögern des Eingangssignals um eine Einheitszeit, ein zweites Verzögerungsglied (51) zum Verzögern des Ausgangssignals des ersten Verzögerungsglieds (95) um eine Einheitszeit, einen Multiplizierer (53) zum Multiplizieren des Aus-
    gangssignals des ersten Verzögerungsglieds (95) mit einem entsprechenden Steusrparicrster (a„ b) und einem ersten Addierer (94) aufweisen, der das Multiplizierer-Ausgangssignal, das Ausgangssignal des zweiten Verzögerungsglieds (51) und das Eingangssignal der Filteranordnung zweiter Ordnung (41,42) zu deren Ausgangssignal zusammenaddiert.
    5. Tonsynthesizer nach Anspruch 4, dadurch gekennzeichnet, daß der ersten Rückkopplungseinrichtung (57,58) eingangsseitig ein Multiplizierer (98) vorgeschaltet ist, um ihr Eingangssignal mit -1 zu multiplizieren, und daß beiden Rückkopplungsschleifen ein Verzögerungsglied (74) vorgeschaltet ist, um deren Eingangssignal um eine Einheitszeit zu verzögern.
    6. Tonsynthesizer nach Anspruch 4 oder 5, dadurch gekennzeichnet, daß der ersten Rückkopplungseinrichtung (57,58) ein erstes Filter erster Ordnung (72) vorgeschaltet ist, daß der zweiten Rückkopplungseinrichtung (65,66) ein zweites Filter erster Ordnung (73) vorgeschaltet ist, welches ein weiteres Verzögerungsglied (51) zum Verzögern des Eingangssignals um eine Einheitszeit, einen zweiten Multiplizierer (53) zum Multiplizieren des Eingangssignals der zweiten Rückkopplungseinrichtung (65,66) mit einem entsprechenden Steuerparameter und einem Addierer (94) enthält, der das Ausgangssignal des weiteren Verzögerungsglieds (51) und das Ausgangssignal des Multiplizierers (53) addiert, um das Ausgangssignal des zweiten Filters erster Ordnung (73) zu erzeugen.
    7. Tonsynthesizer nach einem der Ansprüche 1 bis 3, dadurch gekennzeichnet, daß die Filteranordnungen zweiter Ordnung (57, 58, 65, 66) jeweils ein erstes Verzögerungsglied (51) zum Verzögern des Eingangssignals der Filteranordnung um eine Einheitszeit, einen Multiplizierer (53) zum Multiplizieren des Eingangssignals des ersten Verzögerungsglieds (51) mit dem entsprechenden Steuerparameter (a/, b,), einen ersten
    bo Addierer (94) zum Addieren des Multiplizierer-Ausgangssignals und des Ausgangssignals des ersten Verzögerungsglieds (51), ein zweites Verzögerungsglied (95) zum Verzögern des Addierer-Ausgangssignals um eine Einheitszeit und einen zweiten Addierer (52) aufweisen zum Addieren des Ausgangssignals des zweiten Verzögerungsglieds (95) und des Eingangssignals des ersten Verzögerungsglieds (51) und zur Lieferung des Ausgangssignals der Filteranordnung.
    8. Tonsynthesizer nach Anspruch 7, dadurch gekennzeichnet, daß eine Summiereinrichtung (81,82,43) die Ausgangssignale der ersten Addierer (94) und die Ausgangssignale der Filteranordnungen zweiter Ordnung summiert, und daß beiden Rückkopplungsschleifen ein Verzögerungsglied (74) vorgeschaltet ist, um deren Eingangssignal um eine Einheitszeit zu verzögern.
    9. Tonsynthesizer nach Anspruch 8, dadurch gekennzeichnet, daß der ersten Rückkopplungseinrichtung (41) ein Filter (72) erster Ordnung nachgeschaltet ist, daß der zweiten Rückkopplungseinrichtung (42) auch ein Filter erster Ordnung (73) nachgeschaltet ist, welches ein weiteres Verzögerungsglied (51) zum Verzögern des ihm zugeführten Eingangssignals um eine Einheitszeit, einen zweiten Multiplizierer (53) zum Multiplizieren des Eingangssignals des weiteren Verzögerungsglieds (51) mit einem entsprechenden Steuerparameter und einen Addierer (94) aufweist der das Ausgangssignal des zweiten Multiplizierers (53) und das des weiteren Verzögerungsglieds (51) addiert, um das Ausgangssignal des Filters erster Ordnung (73) zu je? bilden.
    13 10. Tonsynthesizer nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, daß die erste und
    || die zweite Filteranordi<ung (41,42) jeweils aus mehreren in Kaskade geschalteten Filtern zweiter Ordnung
    |ΐ (57—61, PS—69) gebildet sind, und daß ein Paar von in Kaskade geschalteten Filterschaltungen zweiter
    H Ordnung (57,58; 65S 66) unterschiedlicher Filterkoeffizienten die beiden Rückkopplungseinrichtungen (41,
    I 42) bildet.
    φ 11. Tonsynthesizer nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, daß die Filteran-
    rf Ordnung zweiter Ordnung als Digitalfilterschaltung (51,52,53,94,95) ausgebildet ist, die im Zeitmultiplexbe-
    φ trieb arbeitet, indem sie innerhalb einer Einheitszeit mehrere Male betrieben wird, wobei für jeden Betriebs-
    !:" zyklus die Steuerparameter der Filterschaltung geändert werden.
    P 12. Tonsynthesizer nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, daß die Filteran-
    l': Ordnungen und der Kaskadenbetrieb durch einen elektronischen Rechner realisiert werden.
    ί f J. Tonsynthesizer nach einem der vorhergehenden Ansprüche, gekennzeichnet durch eine Parameter-
    ίΐ transformierungsschaltung (13) zur Kosinustransformation der LSP-Parameter (ω* θϊ).
    14. Tonsynthesizer nach einem der vorhergehenden Ansprüche, gekennzeichnet durch einr "nterpolationsscSialiung (14) zum interpolieren der Steuerpararneter (.7» bft.
    Ii i5. Tonsynthesizer nach Anspruch 13, dadurch gekennzeichnet, daß eine Interpolationsschaltung (14) die
    II LSP-Parameter (&>* Θ,) interpoliert, und daß die interpolierten Parameter in der Parametertransformierungs-S schaltung (13) einer Kosinustransformation unterworfen werden.
    si 16. Tonsynthesizer nach Anspruch 14 oder 15, dadurch gekennzeichnet, daß die Interpolationsperiode in
    §j der Interpolationsschaltung (14) gleich oder zweimal so groß wie die Einheitszeit ist
    ?j 17. Tonsynthesizer nach einem der Ansprüche 14 bis 16, dadurch gekennzeichnet, daß die Interpolations-
    fi schaltung (14) im Zeitmultiplexbetrieb einen Amplitudenparameter interpoliert
    ?ί 18. Verfahren zur Tonsynthese, bei den aus einem ursprünglichen Tonsignal Tonquellensignalparameter
    fl betreffend die Tonhöhe, Amplitude, Stimmhaftigkeit und Stimmlosigkeit extrahiert werden, die ein Tonque!-
    B lensignal repräsentieren und eine Synthesefilteranordnung erregen, die folgende Übertragungsfunktion
    % H(Z) aufweist:
    H(Z) = -
    A„(Z) l+ar,Z+c2Z2-f--· ■ + β,Ζ'"
    die Kennlinie der Synthesefilteranordnung von Steuerparametern gesteuert wird, damit die Synthesefilteranordnung ein synthetisches Tonsignal abgibt, wobei die Steuerparameter dadurch erzeugt werden, daß von Abtastwerten des ursprünglichen Tonsignals Autokorrelationskoeffizienten gebildet und von diesen Prädiktorkoe.Tizienten \«,](i = 1,2,... p) der Funktion A9[Z) gebildet werden, gekennzeichnet durch folgende Schritte:
    es werden Merkmalsparameter (LSP-Parameter) {ω,\ (#} berechnet, bei denen die Polynome P(Z) und Q (Z) Null werden, wobei die Polynome P(Z) und Q(Z) folgendermaßen definiert sind:
    AP(Z) -y\P{Z) + Q(Z')}
    P(Z) =Ap(Z)-Zr+<Ap(Z-<)
    Q(Z) -AP(Z)+ 2"'Ap(Z-*)
    die Merkmalspararru'ter {&>,} und {Θ,) werden zu Steuerparametern
    a, = — 2 cos &», und b, = — 2 cos ö,
    transformiert, damit diese die Kennlinie der Synthesefilteranordnung steuern, wobei Z = e->", σ eine Konstante, ω eine normierte Kreisfrequenz 2 πίΔΤχχαΛ ρ der Analysegrad ist, urd wobei die Synthesefilleranordnung zwei Rückkopplungseinrichtungen mit den Übertragungsfunktionen P(Z)-1 bzw. Q(Z)-1 aufweist, die eine im Kaskadenbetrieb arbeitende Filteranordnung zweiter Ordnung, ausgedrückt durch
    (1 + aiZ +Z2) bzw. (1 + biZ+ Z1),
    enthalten.
    65
DE19803037276 1979-10-03 1980-10-02 Tonsynthesizer Expired DE3037276C2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP12836679A JPS5651116A (en) 1979-10-03 1979-10-03 All pole type digital filter
JP54128365A JPS5853352B2 (ja) 1979-10-03 1979-10-03 音声合成器

Publications (2)

Publication Number Publication Date
DE3037276A1 DE3037276A1 (de) 1981-04-09
DE3037276C2 true DE3037276C2 (de) 1985-08-01

Family

ID=26464060

Family Applications (2)

Application Number Title Priority Date Filing Date
DE19803037276 Expired DE3037276C2 (de) 1979-10-03 1980-10-02 Tonsynthesizer
DE19803050742 Expired DE3050742C2 (de) 1979-10-03 1980-10-02

Family Applications After (1)

Application Number Title Priority Date Filing Date
DE19803050742 Expired DE3050742C2 (de) 1979-10-03 1980-10-02

Country Status (5)

Country Link
DE (2) DE3037276C2 (de)
FR (1) FR2466826A1 (de)
GB (2) GB2059726B (de)
NL (1) NL189320C (de)
SE (1) SE444730B (de)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5814898A (ja) * 1981-07-20 1983-01-27 ヤマハ株式会社 反射残響音付加装置
US4660163A (en) * 1983-01-17 1987-04-21 OKI Electric Co. Ltd Adaptive digital filter
US4731835A (en) * 1984-11-19 1988-03-15 Nippon Gakki Seizo Kabushiki Kaisha Reverberation tone generating apparatus
BE1007428A3 (nl) * 1993-08-02 1995-06-13 Philips Electronics Nv Transmissiesysteem met reconstructie van ontbrekende signaalmonsters.
US5704001A (en) * 1994-08-04 1997-12-30 Qualcomm Incorporated Sensitivity weighted vector quantization of line spectral pair frequencies
JPH09230896A (ja) * 1996-02-28 1997-09-05 Sony Corp 音声合成装置
ES2709329T3 (es) * 2014-04-25 2019-04-16 Ntt Docomo Inc Dispositivo de conversión de coeficiente de predicción lineal y procedimiento de conversión de coeficiente de predicción lineal

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3624302A (en) * 1969-10-29 1971-11-30 Bell Telephone Labor Inc Speech analysis and synthesis by the use of the linear prediction of a speech wave
FR2199427A5 (de) * 1972-09-12 1974-04-05 Ibm France
GB1603993A (en) * 1977-06-17 1981-12-02 Texas Instruments Inc Lattice filter for waveform or speech synthesis circuits using digital logic

Also Published As

Publication number Publication date
GB2059726A (en) 1981-04-23
NL189320C (nl) 1993-03-01
SE8006850L (sv) 1981-04-04
NL189320B (nl) 1992-10-01
GB2131659B (en) 1984-12-12
DE3037276A1 (de) 1981-04-09
SE444730B (sv) 1986-04-28
GB8318893D0 (en) 1983-08-17
GB2059726B (en) 1984-06-27
GB2131659A (en) 1984-06-20
NL8005449A (nl) 1981-04-07
FR2466826B1 (de) 1984-09-14
DE3050742C2 (de) 1987-01-15
FR2466826A1 (fr) 1981-04-10

Similar Documents

Publication Publication Date Title
EP0401562B1 (de) Anordnung zur Umsetzung eines Signals mit einer ersten Abtastrate in ein Signal mit einer zweiten Abtastrate
DE3883034T2 (de) System zur Sprachsynthese.
DE2524497C3 (de) Verfahren und Schaltungsanordnung zur Sprachsynthese
DE3688600T2 (de) Musikinstrument mit digitalem Filter mit programmierten variablen Koeffizienten.
DE2551632C2 (de) Verfahren zum Zusammensetzen von Sprachnachrichten
DE3510660C2 (de)
DE2229149A1 (de) Verfahren zur Übertragung von Sprache
DE2431161C2 (de) Tonerzeugungseinrichtung für ein elektronisches Musikinstrument
DE2115258A1 (de) Sprachsynthese durch Verkettung von in Formant Form codierten Wortern
DE2818204A1 (de) Signalverarbeitungsanlage, insbesondere zur beseitigung von raumnachhall
DE2706045C3 (de) Elektronisches Tastenmusikinstrument mit Sinustabellenspeicher
DE2920298A1 (de) Binaere interpolatorschaltung fuer ein elektronisches musikinstrument
DE3019823C2 (de)
DE69017842T2 (de) Verfahren und Einrichtung zur Codierung von Prädiktionsfiltern in Vocodern mit sehr niedriger Datenrate.
DE2622423B2 (de) Elektrische Anordnung zur Übertragung oder Speicherung eines Sprachoder Tonsignals in kodierter Form
CH622113A5 (de)
DE3037276C2 (de) Tonsynthesizer
DE3226538C2 (de) LSP-Stimmsynthetisierer
DE3226619C2 (de)
EP0036074A1 (de) Syntheseschaltung für periodische Signale, insbesondere als Teil eines Musikinstruments
DE2513127C2 (de) Verfahren zum künstlichen Erzeugen eines musikalischen Klangs
DE2826570C2 (de)
DE3246712A1 (de) Verfahren zur zusammensetzung einer stimmenanalyse
DE2435654C2 (de) Verfahren und Vorrichtung zur Analyse und Synthese von menschlicher Sprache
DE60125491T2 (de) Tiefpaßfilterung des Anregungssignals für die Sprachkodierung

Legal Events

Date Code Title Description
8172 Supplementary division/partition in:

Ref country code: DE

Ref document number: 3050742

Format of ref document f/p: P

Q171 Divided out to:

Ref country code: DE

Ref document number: 3050742

D2 Grant after examination
8364 No opposition during term of opposition
8327 Change in the person/name/address of the patent owner

Owner name: NIPPON TELEGRAPH AND TELEPHONE CORP., TOKIO/TOKYO,

AH Division in

Ref country code: DE

Ref document number: 3050742

Format of ref document f/p: P

8328 Change in the person/name/address of the agent

Free format text: HOFFMANN, E., DIPL.-ING., PAT.-ANW., 82166 GRAEFELFING