DE3114189A1 - Phonemorientierter sprachgenerator in integrierter schaltung - Google Patents

Phonemorientierter sprachgenerator in integrierter schaltung

Info

Publication number
DE3114189A1
DE3114189A1 DE19813114189 DE3114189A DE3114189A1 DE 3114189 A1 DE3114189 A1 DE 3114189A1 DE 19813114189 DE19813114189 DE 19813114189 DE 3114189 A DE3114189 A DE 3114189A DE 3114189 A1 DE3114189 A1 DE 3114189A1
Authority
DE
Germany
Prior art keywords
signal
output
phoneme
circuit
pulse
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE19813114189
Other languages
English (en)
Inventor
Carl Lawrence 48044 Mount Clemens Mich. Ostrowski
Bertram John 92680 Tustin Calif. White
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Federal Screw Works
Original Assignee
Federal Screw Works
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Federal Screw Works filed Critical Federal Screw Works
Publication of DE3114189A1 publication Critical patent/DE3114189A1/de
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/04Details of speech synthesis systems, e.g. synthesiser structure or memory management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Analogue/Digital Conversion (AREA)

Description

31U189
Beschreibung:
Die Erfindung betrifft die Spracherzeugung, insbesondere einen phonemorientierten Sprachgenerator, der sich besonders für die praktische Ausführung auf einer einzigen verkapselten integrierten Schaltung eignet.
Bekannte phonemorientierte Sprachgeneratorn wiesen hauptsächlich einen Rachenraum aus mehreren Resonanzfiltern auf. Aus mehreren wichtigen Gründen wurde es somit als unzweckmäßig betrachtet, Rachenräume dieser Art in integrierter Schaltung herzustellen. Zuerst brauchen abstimmbare Resonanzfilter dieser Art, die meist bei Rachenräumen verwendet werden, Widerstände und Kondensatoren mit verhältnismäßig hohen Werten, um im verhältnismäßig niedrigen Frequenzbereich der menschlichen Stimme Resonanzfrequenzen zu erzeugen. Bauteile mit hohen Werten vergrößern erheblich den Umfang einer integrierten Schaltung. Zweitens sind die Resonanzfilter des Rachenraumes Präzisionsfilter, die schwer in integrierter Schaltung innerhalb der erforderlichen Toleranzgrenzen herzustellen sind.
Die Erfindung verwendet eine neuartige kapazitive Schalttechnik zur Schaffung des Rachenraumes sowie von Funktionen, die von zusätzlichen Parametern gesteuert werden, wodurch die vorstehenden erwähnten Schwierigkeiten vermieden werden und der erfindungsgemäße Sprachgenerator sich besonders für die Ausführung als ein einziges Siliciumplättchen in integrierter Schaltung eignet. Die kapazitive Schalttechnik erübrigt nicht nur Bauteile mit hohen Werten im Rachenraum, sondern auch die genaue Steuerung oder Regelung dieser Werte und damit auch der Größe der abstimmbaren Bau-
1 30064/0774
teile im Rachenraum. Bei der erfindungsgemäßen kapazitiven Schalttechnik ist es lediglich von Bedeutung, daß das Verhältnis der Werte des abstimmbaren Bauteils genau gesteuert wird, wodurch es erheblich leichter wird, das während der Herstellung erforderliche hohe Genauigkeitsniveau einzuhalten.
Außerdem umfaßt der erfindungsgemäße Sprachgenerator eine neuartige digitale Übergangsschaltung, welche Werte von bestimmten Steuersignalparametern zwischen den verschiedenen, verschiedenen Phonemen zugeordneten Werten für den eingeschwungenen Zustand fortschreitend überträgt. Auf diese Weise werden benachbarte phonetische Töne richtig integriert, wodurch sie eine natürlich klingende Sprache erzeugen.
Der erfindungsgemäße Sprachgenerator umfaßt auch eine neuartige Schaltung zur Darstellung der Stimmritze, welche das Stimmritzenimpulssignal digital so erzeugt, daß seine Wellenform in jeder gewünschten Weise spektral geformt werden kann. Der erfindungsgemäße Sprachgenerator weist einen einzigen verkapselten Siliciummikrobaustein oder Chip auf, der phonetisch ununterbrochene Sprache unbegrenztem Vokabulars aus niedrigen Dateneingabegeschwindigkeiten erzeugt. Die Anlage umfaßt einen Festspeicher (ROM) mit Parameterwerten für vierundsechzig verschiedene Phoneme, die durch ein 6-Bit-Befehlswort abgerufen werden. Zwei weitere Eingabebits sind zur Veränderung der Tonhöhe oder Modulation der stimmhaften Phoneme vorgesehen. Die Steuerparameter werden durch den .Festspeicher in Multiplex-Weise auf einer parallelen 8-Bit-Ausgangssammelschiene erzeugt. Die Steuer- oder Regelparameter, die zur Regelung des Rachenraumes dienen, werden zunächst an eine neuarti-
130064/0774
ge digitale Übergangsschaltung angelegt, welche den fortschreiten-1 den Übergang der Veränderungen der Werte für den eingeschwungenen Zustand der Parameter sorgt, die von Phonem zu Phonem auftreten. Die digitale Übergangsschaltung erfüllt diese Aufgabe in einer neuartigen Weise, indem sie laufend 1/8 der Differenz zwischen dem Sollparameterwert und dem Istparameterwert zum Sollparameterwert addiert und das Ergebnis als neuen Sollparameterwert verwendet. Beim bevorzugten Ausführungsbeispiel wird die Übergangsschaltung mit einer Frequenz taktgesteuert, die einen Parameter ergibt, der annähernd 70 % seines Sollwertes in 33 msec erreicht.
Die von der digitalen Übertragungsschaltung abgegebenen Steuersignalparameter gelangen an den Rachenraum, wo sie die Resonanzfrequenzen der Resonanzfilter sowie das Einprägen der Erregerenergie für die Vokale und Reiblaute in den Rachenraum regeln. Außerdem ist wie üblich die Güte (Q) oder Bandbreite des nasale Phoneme erzeugenden Resonanzfilters getrennt regelbar. Die verschiedenen parametergesteuerten Funktionen werden durch parallele digitale 4-Bit-Parameter-Signale in die Praxis umgesetzt, wobei das Kapazitätsverhältnis von Kondensatornetzwerken in den geregelten Schaltungen wahlweise gesteuert werden. Die Kondensatorkreise werden dann bei einer bestimmten Frequenz an- und abgeschaltet, so daß sie in wirksamer Weise ein Potentiometer simulieren.
Der Stimmritzengenerator erzeugt einen Stimmritzenimpuls, dessen Grundfrequenz sich in Abhängigkeit von der Einstellung der beiden Stimmodulationsbits verändert. Außerdem ist ein bestimmter Grad von automatischer Stimmodulationssteuerung vorgesehen, indem auch die Grundfrequenz des Stimmritzensignals im umgekehrten Verhältnis
130064/0774
11 ; ^
zur Bewegung der Resonanzfrequenz des Resonanzfilters im Rachenraum verändert wird. Der spektrale Verlauf des Stimmritzenimpulses wird durch wahlweise Einstellung der analogen Gleichspannungssignalpegel gestuert, die an den parallelen Eingängen einer Multiplex-Schaltung anliegen. Die Wahleingänge des Multiplexers sind an den Ausgang eines Zählers geführt, der mit einer bestimmten Frequenz taktgesteuert wird. Die Wellenform des am seriellen Ausgang des Multiplexers erzeugten Stimmritzensignals enthält daher eine in Segmenten ausgedrückte Annäherung eines analogen Stimmritzenimpulses, wobei die Pegel der verschiedenen Segmente durch vorgegebene Gleichspannungspegel bestimmt werden.
Die Erfindung ist nachstehend näher erläutert. Alle in der Beschreibung enUiall-c>m>n Merkmale und Maßnahmen können von orfindungswesentlicher Bedeutung sein. Die Zeichnungen zeigen: Fig. 1 ein Gesamtblockschaltbild des erfindungsgemäßen
Sprachgenerators.
Fig. 2-8 einen Stromlaufplan des Sprachgenerators der
Fig. I.
Fig. 9 ein Widerstandsersatzschaltbild des in Fig. 4
gezeigten Teiles der Rachenraumschaltung.
Fig. 10 ein Wellenformbeispiel eines Stimmritzenimpulses. Fig. 11 ein Taktsignaldiagramm mit Darstellung der Beziehung zwischen verschiedenen Taktsignalen und der Multiplexanordnung, welche die Regelparameter durch einen Parameterfestspeicher erzeugt.
Fig. 12 eine schematische Ansicht des Parameterfestspei
chers mit Darstellung der Art und Weise, in welcher die Regelparameterwerte im Festspeicher ge-
130064/0774
IZ
speichert werden.
Fig. 13 eine Modellschaltung zur Darstellung der Arbeits
weise der erfindungsgemäßen kapazitiven Schalttechnik.
Fig. 14 ein Taktsignaldiagramm mit Darstellung der Be
ziehung zwischen sich nicht überlappenden Taktsignalen 01 und 02 des kapazitiven Schaltkreises.
Fig. 1 zeigt ein Gesamtblockschaltbild des erfindungsgemäßen phonemorientierten Sprachgenerators 20. Die erfindungsgemäße Anlage soll durch einen digitalen 8-Bit-Eingangsbefehl gesteuert werden. Sechs der Eingangsbits 22 aus dem digitalen Befehl dienen zur Phonemwahl, und die restlichen zwei Bits 56 zur Veränderung des Modulationspegels oder der Tonhöhe des Audioausgangssignals. Die sechs Phonemwahlbits 22 werden durch ein Übergabesignal auf einer Übergabeleitung 24 in einen 6-Bit-Signalspeicher 26 eingegeben, dessen sechs parallele Ausgänge an die sechs Adresseneingänge höherer Ordnung eines Parameterfestspeichers 40 geführt sind. Das Übernahmesignal auf der Leitung 24 löscht auch einen Ausgabesignalspeicher 28, welcher die Ausgangsleitung 30 für Bestätigungs- und Anforderungssignale (A/R) auf einer Ausgangsleitung 30 niederpegelig schaltet, um den Eingang neuer Daten zu bestätigen. Das niederpegelige Signal auf der A/R-Leitung 30 gelangt auch an eine Phonemtaktgeber-, Verzögerungs- und Pausentaktgeberschaltung 44, wo der Phonemtaktzähler beaufschlagt wird.
Der Parameterfestspeicher 40 (ROM 40) enthält Daten für vierundsechzig verschiedene Phoneme, die durch die sechs Phonemwahlbits 22 abgerufen werden. Für jedes der vierundsechzig Phoneme enthält
130064/0774
/3
-*- 31U189
ROM 40 zwölf Regelsignalparameter, welche die Phoneme elektronisch darstellen. Die einzelnen in ROM 40 gespeicherten Regelsignalparameter weisen vorzugsweise vier Auflösungsbits auf, wodurch sechzehn verschiedene Werte für jeden Parameter geschaffen werden mit Ausnahme des Phonemtaktsteuerparameters, der sieben Auflösungsbits und damit hundertachtundzwanzig mögliche Werte enthält. Der Parameterfestspeicher 40 soll den entsprechenden Satz von Steuersignalparameterwerten erzeugen, welche das durch die Phonemwahlbits 22 auf seinen acht Datenausgangsleitungen im Mehrfachbetrieb gekennzeichnete spezielle Phonem bilden, so daß zu jedem gegebenen Zeitpunkt jeweils zwei 4-Bit-Regelparameter auf den acht Datenausgangsleitungen anliegen, wieder ausgenommen jedoch der Phonemtaktsteuerparameter, der sieben der acht Datenausgangsleitungen verwendet.
Der ROM 40 wird außerdem durch drei Parameterwahlbits 48 abgerufen, die vom Ausgang einer Taktgeberschaltung 38 an seinen drei niederpegeligen Adresseingängen anliegen. Der Taktgeber 38 besitzt einen Haupttaktgeber 32, der ein Haupttaktsignal mit einer Frequenz erzeugt, die von den Werten eines externen RC-Gliedes abhängt, das mit dem Eingangsanschluß MCRC verbunden ist. Der Eingang MCRC kann auch an Masse gelegt sein und ein externes Taktsignal direkt am Zusatztakteingang MCX anliegen. Das Ausgangssignal des Haupttaktgebers 32 gelangt an einen Welligkeitszähler 34, der acht Ausgangstaktsignale mit verschiedenen vorgegebenen Frequenzen erzeugt. Drei der vier Taktsignale sind Parameterwahlbits, die über die Leitung 48 an die niederpegeligen Adresseneingänge des ROM4 0 gelangen. Die Ausgangssignale des Welligkeitszählers 34 liegen dann an einem Signalspeicher mit nicht überlappendem Zweiphasentaktkreis 36 an,
130064/0774
der zwölf Taktsignale erzeugt, die in allen Teilen der Anlage verwendet werden.
Zusammenfassend kennzeichnet somit die sechs Phonemwahlbits 22 das gewünschte Phonem, und die drei Parameterwahlbits 48 bestimmen, welcher der zwölf Regelsignalparameter, die das gekennzeichnete Phonem bilden, an den Datenausgangsleitungen des ROM40 zu einem gegebenen Zeitpunkt während der Phonemzeitspanne anliegen. Bestimmte RegelSignalparameter, die in den Rachenraum gelangen sollen, bedürfen einer Übergangsbehandlung, um die abrupten Veränderungen zu glätten, die in den Werten der Regelparameter von einem Phonem zum nächsten auftreten. Somit sind die Datenausgangsleitungen, welche diese Regelsignalparameter des Parameterfestspeichers führen, an eine digitale Übergangsschaltung 50, welche die gewünschte übergangsfunktion digital durchführt. Die vom Parameterfestspeicher abgehenden Datenausgangsleitungen, welche die restlichen, verschiedene Taktgabeaufgaben betreffende Regelsignalparameter führen und die keiner Übergangsbehandlung bedürfen, gelangen direkt zur Phonemtaktgeber-, Stimm- und Schließverzögerungs- und Pausentaktsteuerungsschaltung 44. Diese nachstehend näher beschriebene Schaltung 44 umfaßt einen Zähler, der mit einer Frequenz taktgesteuert ist, welche durch den Phonemtaktsteuerparameter festgelegt wird, um die Dauer eines jeden Phonems zu steuern. Die Zählgeschwindigkeit des Zählers wird von der Frequenz des Taktsignals auf der Leitung 43 vom Ausgang des Phonemnebentaktgeberkreises 42 bestimmt, der hauptsächlich aus einem Oszillator besteht, dessen Frequenz durch den Phonemtaktsteuerparameter geregelt wird. Erreicht der Zähler eine bestimmte Zählung, so wird auf einer Leitung 45 ein Ausgangssignal erzeugt, welches den Ausgangssignalspeicher 28 ansteuert, wodurch
130064/0774
/5*
die A/R-Ausgangsleitung 30 hochpegelig wird und anzeigt, daß neue Phonemdaten angefordert werden.
Der Taktgeber 44 besitzt auch ein Stimm- und Schließverzögerungsnetzwerk, das hauptsächlich aus einer Größenvergleichseinrichtung besteht, welche die Ausgangszählung des Phonemtaktzählers mit den Werten der Regelsignalparameter der Stimm- und Schließverzögerung vergleichen soll, wenn die Signale an den Ausgängen des ROM40 anliegen. Greift die Größenvergleichsschaltung einen gleichwertigen Zustand ab, wird die Verzögerungszeit beendet. Der Zweck des Regelsignalparameters für die Stimmverzögerung besteht darin, die Übertragung der Steuersignale für die Amplitude der Stimme zu verzögern und damit auch die Einspeisung der Stimmerregungsenergie in den Rachenraum für eine Zeitspanne während bestimmter phonetischer übergänge von Reiblaut zu Vokal zu verzögern oder beizubehalten, die kleiner ist als die Dauer eines Einzelphonems, wobei die Amplitude des Reiblautanteils schnell abklingt, während gleichzeitig die Amplitude des Selbstlautanteils rasch ansteigt. Die Verzögerungsfunktion wird immer dann durchgeführt, wenn ein Stimmverzögerungs- oder Schließverzögerungssteuersignal anliegt, indem die digitale Übergangsschaltung 50 während der Übertragungszeit der Regelsignalparameter für die Selbstlaut- und die Reiblautamplitude praktisch "eingefroren" wird, wobei der Zeitraum durch den Wert der Regelparameter für die Stimmverzögerung und Schließverzögerung gegeben wird. Diese Funktion wird durch einen nachstehend näher erläuterten Starrhaiteübergangskreis 46 durchgeführt, der die Lesen/Schreiben-Leitung 47 (R/W) mit einem Speicher mit wahlfreiem Zugriff (RAM) in der digitalen Übergangsschaltung 50 verklammert.
130064/0774
-π- 31Η189
Die von der digitalen Übergangsschaltung 50 abgegebenen Steuersignale werden durch eine Verriegelungsschaltung 52 in Abhängigkeit von entsprechenden Taktsignalen des Taktgebers 38 entschachtelt, die über einen Synchronisiertaktgeber 54 zur Taktsteuerung der Verriegelungsschaltungen 52 her anliegen. Außerdem erzeugt eine Stimmritzenschaltung 58 ein Stimmritzensynchronisiersignal zu Beginn einer jeden Stimmritzenimpulsperiode, das auch am Synchrotaktgeber 54 über eine Leitung 55 her anliegt, um die Steuersignale F1,F2,F2Q und F3 gegen die Übergangsschaltung 50 zu sperren.
Das Stimmerregungssignal wird durch einen Stimmritzengenerator 58 in Abhängigkeit von zwei Modulationswahlbits 56 des digitalen 8-Bit-Eingangsbefehls erzeugt, welche die Grundfrequenz des Stimmritzensignals regeln. Außerdem wird ein bestimmter Grad von automatischer Modulationssteuerung dadurch gegeben, daß auch die Grundfrequenz des Stimmerregungssignals in Abhängigkeit vom umgekehrten Wert (F1) des Steuersignals F1 verändert wird. Das daraus entstehende Stimmerregungssignal gelangt dann an eine Stimmamplitudenschaltung 62, welche die Amplitude des Stimmerregungssignals in Abhängigkeit vom Parameter des Stimmamplitudenregelsignals moduliert, bevor es in den Rachenraum 60 eingespeist wird.
Das Reiblauterregungssignal wird von einem Generator 64 für weißes Rauschen erzeugt. Bei stimmhaften Reiblauten (z.B. weiches s, v), wenn sowohl Reiblaut- als auch Selbstlauterregungsenergie vorhanden sind, wird der Erreger 64 für weißes Rauschen nur während des letzten oder "Ruhe"-Teils des Stimmritzenimpulses unter Steuerung des Signals FGLIED auf der Leitung 65 vom Stimmritzengenerator 58 angeschaltet. Das sich ergebende aus weißem Rauschen bestehende
130064/0774
Ausgangssignal des Generators 64 gelangt an ein Formnetzwerk 66 für Reiblautamplitude und Hochpaßrauschen, welches das Reiblauterregungssignal filtert und seine Amplitude in Abhängigkeit vom Steuersignal für die Reiblautamplitude moduliert, ehe es unter Steuerung des Reiblautregelparameters (FC) und des umgekehrten Reiblautregelparameters (FC) in den Rachenraum 6 0 eingespeist wird.
Beim bevorzugten Ausführungsbeispiel umfaßt der Rachenraum 60 vier in Reihe geschaltete Resonanzfilter F1,F2,F3 und F5. Die Resonanzfrequenzen der Filter F1-F3 werden in Abhängigkeit von den Steuersignalparametern F1,F2 und F3 gesteuert. Die Bandbreite oder Güte der Resonanzfilter zweiter Ordnung (F2) im Rachenraum 60 wird ebenso durch den Steuersignalparameter F2Q geregelt. Dann gelangt das Ausgangssignal des Rachenraumes 60 an einen Schließkreis 68, welcher die Amplitude des Audioausgangssignals in Abhängigkeit von einem Schließsteuersignal (CL) abrupt moduliert.
Die Fig. 2-8, vor allem Fig. 2 zeigt einen Stromlaufplan des erfindungsgemäßen Sprachgenerators 20. Wie bereits anhand der Besprechung der Fig. 1 erwähnt, wird der erfindungsgemäße Sprachgenerator 20 durch einen digitalen 8-Bit-Eingangsbefehl gesteuert. Die sechs Phonemwahlbits 22 (P0-P5) werden parallel den Dateneingängen (D) eines 6-Bit-Signalspeichers 26 eingespeist. Die an den Phonemwahlleitungen (P0-P5) anliegenden Daten werden in den Signalspeicher 26 durch ein Freigabesignal auf der Leitung 24 eingesteuert, das auch zur Löschung eines Ausgabesignalspeichers 28 dient, wodurch die Bestätigungs-Anforderungsleitung 30 niederpegelig wird, um den Eingang der neuen Phonemdaten zu bestätigen- Das niederpe-
130064/0774
gelige Ausgangssignal der Bestätigungs-Änforderungsleitung (A/R) 30 dient auch zum Löschen des Phonemtaktzählers 84, dessen Zweck nachstehend näher erläutert wird. Die Ausgänge Q des Signalspeichers 26 sind an hochpegelige Adresseneingänge (A3-A8) des Parameterfestspeichers 40 geführt. Die drei übrigen niederpegeligen Adresseneingänge (A0-A2) des Festspeichers ROM40 führen die Parameterwahlbits 48 vom Ausgang des Taktgebers 38. Wie bereits erwähnt, werden die durch die Phonemwahlbits 22 gekennzeichneten Steuersignalparameter, die das Phonem bilden, an den Datenausgängen (D0-D7) des ROM40 in Abhängigkeit von den drei Parameterwahlbits 48 in Multiplexweise gebildet.
Obwohl allgemein bekannt, werden die vom ROM40 erzeugten verschiedenen Steuersignalparameter kurz zusammengefaßt, um eine bessere Erläuterung der Arbeitsweise der erfindungsgemäßen Einrichtung zu bieten.
Die Regelparameter F1,F2,F3 bestimmen die Stellen der Resonanzfrequenzpunkte in den ersten drei regelbaren Resonanzfiltern des Rachenraumes. Der Reiblautregelparameter (FC) ersetzt zwei Regelparameter, die normalerweise bei Sprachgeneratoren dieser Art vorgesehen sind, d.h., die Regelparameter für die Reiblautfrequenz und den Reiblauttiefpaß. Wenn ein Reiblautphonem niederfrequente Reiblautenergie im Bereich des Formanten F2 braucht, so wurde allgemein ermittelt, braucht er nicht auch eine erhebliche Menge an hochfrequenter Reiblautenergie im Bereich des Formanten F5 und umgekehrt. Daher verwendet die Erfindung einen einzigen Reiblautregelparameter (FC) und seine Umkehrung (FC), um die parallele Einspeisung von nieder- und hochfrequenter Reiblautenergie in den Rachen-
130064/0774
311418a
raum zu regeln. Der Regelparameter F2Q verändert das "Q" oder die Bandbreite des Resonanzfilters (F2) zweiter Ordnung im Rachenraum und wird hauptsächlich bei der Erzeugung der Nasalphoneme "n", "m" und "ng" eingesetzt. Nasalphoneme weisen meist eine höhere Energiemenge am ersten Formanten (F1) und einen erheblich niedrigeren und breiteren Energiegehalt bei den höheren Formanten auf. Wird der Regelparameter F2Q beim Auftreten von Nasalphonemen erzeugt, um das Q zu verringern oder die Bandbreite des Resonanzfilters F2 zu vergrößern, wobei das Filter wegen der Kaskadenanordnung der Resonanzfilter im Rachenraum verhindert, daß bedeutende Energiemengen die höheren Formanten erreichen. Der Regelparameter (VA) für die Selbstlautamplitude wird erzeugt, wenn ein Phonem mit einem stimmhaften Anteil auftritt. Der stimmhafte oder Vokalamplitudenregelparameter sorgt für die Intensität der stimmhaften Komponente im Tonfrequenz- oder Audioausgang. Der Regelparameter (FA) für die Reiblautamplitude wird erzeugt, wenn ein Phonem mit einer stimmlosen Komponente anwesent ist und dient zur Regelung der Intensität des stimmlosen Anteils im tonfrequenten Ausgang. Der Schließparameter (CL) dient zur Simulierung der Phonemwechselwirkung, die beispielsweise auftritt, wenn das vom Phonem "e" gefolgte Phonem "b" erzeugt wird. Der am Schließkreis 68 anliegende Schließregelparameter soll eine abrupte Amplitudenmodulation im Audioausgang auslösen, die den Aufbau und die plötzliche Freigabe von Energie simuliert, die während der Aussprache solcher Phonemkombinationen auftritt. Der Regelparameter (VD) für die stimmhafte oder Vokalverzögerung dient hauptsächlich während bestimmter phonetischer Reiblaut-Selbstlautübergänge, bei denen die Amplitude des Reiblautbestandteils sonst schnell zur gleichen Zeit mit dem schnellen Anstieg der Amplitude des Vokalbstandteils abklingen
130064/0774
würde. Der Regelparameter für die Vokalverzögerung dient somit unter diesen Umständen der Übertragungsverzögerung des Regelsignals (VA) für die Selbstlautamplitude. Der Regelparameter für die Schließverzögerung (CLD) dient ebenfalls hauptsächlich bei bestimmten phonetischen Vokal-Reiblautübergängen, bei denen die übertragung der Regelparameter für das Schließen (CL) und die Reiblautamplitude (FA) in der gleichen Weise verzögert werden sollen, wie beim Regelparameter für die Vokalverzögerung. Der Pausenregelparameter (PAC) wird erzeugt, wenn ein Pausenphonem ausgewählt wird, um eine Zeitspanne des Schweigens in das Sprachbild einzuführen. Da jedoch das Ausdrucksbild oder die Ausdrucksfunktion des Rachenraumes während des Auftretens eines Pausenphonems so lange "eingefroren" ist, bis die gesamte Erregungsenergie im Rachenraum vollständig verbraucht ist, erfüllt das Pausenphonem auch eine weitere wichtige Aufgabe. Bestimmte Wörter, deren Endungen bestrebt sind, "nachzuhängen" wie Wörter, die in Nasalphoneme auslaufen, klingen, als ob ein zusätzliches Phonem mit eingeschlossen worden wäre, wenn das Lautbild des letzten Phonems abrupt verändert wird, ehe die Erregungsenergie im Rachenraum vollkommen verbraucht ist. Beispielsweise kann das Wort "Mond" wie "Monda" klingen. Dies beruht auf der Tatsache, daß die restliche Erregungsenergie im Rachenraum als etwas anderes als ein "d" nach der Beendigung seiner Phonemzeitspanne vokalisiert wird. Das Einschieben eines Pausenphonems nach dem Phonem "d" in diesem Beispiel verbessert somit die Spracherkennung durch Einfrieren des Lautbildes für das Phonem "d", bis die gesamte Reiblaut- und Selbstlauterregungsenergie verbraucht ist. Der letzte Regelparameter ist der Regelparameter für die Phonemtaktsteuerung, der für jedes Phonem erzeugt wird und dazu dient, die Erzeugungsperiode
130064/0774
31U189
für das Phonem festzulegen.
Der Parameterfestspeicher 40 (ROM) ist beim bevorzugten Ausführungsbeispiel wie in Fig. 12 ausgelegt. Der ROM40 speichert zwölf Regelsignalparameter für jedes der vierundsechzig durch die Phoneinwahlbits 22 zu kennzeichnenden Phoneme. Die einzelnen Regelsignalparameter weisen vier Auflösungsbits mit Ausnahme des Phonemtaktsteuersignals auf, das sieben Auflösungsbits besitzt. Wenn die Parameterwahlbits 48 gleich sind 011 (Fig. 12), dann liegt beispielsweise der Schließregelsignalparameter (CL) an den Datenausgängen D0-D3 des ROM40 an, und der Regelsignalparameter F3 steht an den Datenausgängen D4-D7 an. Auch wenn die Parameterbits 48 gleich sind 100, dann liegen das Schließverzögerungs- (CLD) und das F2Q-Regelsignal an den Datenausgängen D0-D3 und D4-D7 des ROM40 an. Beim bevorzugten Ausführungsbeispiel liegen die Parameterwahlbits 48 auf 40 kHz, 20 kHz und 10 kHz. Da die Dauer der Phoneme von zirka 50 bis 250 msec schwanken, werden die einzelnen Regelsignalparameter auf den Datenausgangsleitungen D0-D7 des ROM40 mindestens zirka 500 Mal während der Periode eines jeden Phonems erzeugt. Fig. 11 zeigt ein Taktsteuerdiagramm mit Darstellung der Beziehung zwischen den Parameterwahlbits 48 an den Adresseneingängen A0-A2 des ROM40 und seinen Datenausgängen D0-D7.
Die Parameterwahlsignale auf den Leitungen 48 werden an den Ausgängen Q4-Q6 eines 1O-Bit-Welligkeitszählers 34 erzeugt, der durch das Haupttaktsignal gesteuert wird, das beim bevorzugten Ausführungsbeispiel auf 1,28 MHz eingestellt ist. Wie bekannt, verändert eine FrequenzSchwankung des Haupttaktsignals die Gesamtzusammensetzung von Tonhöhe und Frequenz des niederfrequenten Ausgangssi-
130064/0774
21 31141
gnals. Außerdem kann die erfindungsgemäße Einrichtung durch Veränderung der Haupttaktfrequenz über oder unter den für Normalsprache erforderlichen Bereich dazu verwendet werden, äußerst künstliche Toneffekte zu erzeugen.
Die Ausgangssignale Q0-Q3 des Welligkeitszählers 34 gelangen an die Dateneingänge (D) eines ersten 4-Bit-Signalspeichers, und die Ausgänge Q4-Q6 sowie Q9 liegen an den Dateneingängen (D) eines zweiten 4-Bit-Signalspeichers 72 an. Die drei hochpegeligen Ausgangssignale Q des Signalspeichers 70 umfassen die Taktsignale Bit 0, Bit 1 und Bit 2, die der nachfolgend näher erläuterten digitalen Übergangsschaltung 50 eingespeist werden. Das restliche Ausgangssignal Q des Signalspeichers 70 gelangt über eine Leitung 73 an eine RS-Kippstufe (Flip-Flop 74), an dessen Einstellausgang (SET) ein Taktsignal (ß1) von der doppelten Frequenz und entgegengesetzter Phase des Taktsignals Bit 0 erzeugt wird. Das Taktsignal ß1 wird auch in der digitalen Übergangsschaltung 50 verwendet. Die drei niederpegeligen Ausgangssignale Q des Signalspeichers 72 umfassen die Taktsignale A0-A2, die in verschiedenen Abteilungen der Einrichtung zur Überwachung dafür verwendet werden, welcher Regelparameter anliegt sowie dazu, die Übergangsregelparameter zu entschachteln. Die Taktsignale A0-A2 haben dieselben Frequenzen wie die Parameterwahlsignale auf den Leitungen 48 für die Adresseneingänge A0-A2 des ROM40 und sind nur gegenüber diesen etwas verzögert.
Außerdem liegt das Ausgangssignal Q3 des Welligkeitszählers 34 auch an zwei RS-Flip-Flops oder Kippstufen 77 und 78 an, wodurch an dessen Löschausgängen die sich gerade nicht mehr überlappenden
1 30064/0774
Taktsignale 01 und 02 erzeugt werden. Die Taktsignale 01 und 02 sind zueinander phasenverkehrt (Fig. 14) und weisen beim bevorzugten Ausführungsbeispiel eine Frequenz von 20 kHz auf. Die Taktsignale 01 und 02 dienen hauptsächlich für das erfindungsgemäße Regelverfahren zur kapazitiven Parameteruinschaltung, das nachstehend näher erläutert wird, obwohl beide Signale auch ganz einfach als herkömmliche Taktsignale eingesetzt werden. Auch das Ausgangssignal Q5 des Welligkeitszählers 34 gelangt zusätzlich zu zwei RS-Kippstufen 75 und 76, wodurch an deren Löschausgang ein zweites Paar von sich gerade nicht mehr überlappenden Taktsignalen P1 und P2 erzeugt wird, die wie die Taktsignale 01 und 02 zueinander phasenverkehrt sind und beim bevorzugten Ausführungsbeispiel eine Frequenz von 5 kHz aufweisen. Die Taktsignale P1 und P2 dienen ausschließlich im Nebenphonemtaktgeberkreis 42 (Fig. 7) der nachstehend näher erläutert wird.
Die im ROM40 gespeicherten Parameter, die auf den hochpegeligen Datenausgangsleitungen D4-D7 erzeugt werden, umfassen die Regelparameter für den Rachenraum, die einen dynamischen übergang erfordern und daher der digitalen tibergangsschaltung 50 eingespeist werden. Die im ROM40 gespeicherten Parameterwerte, die auf den niederpegeligen Datenausgangsleitungen D0-D3 erzeugt werden, sind jedoch im wesentlichen An-, Abschalt- oder Taktsignale, die keinen Übergang erfordern und daher direkt der Phonemtakt-, Pausentakt- und Verzögerungsschaltung eingespeist werden.
Nachstehend wird die Arbeitsweise der Phonemtaktgeberschaltung erklärt. Die sieben Bits für die letzten Stellenzahlen D0-D6 der Datenausgabe des ROM40 gelangen an die Dateneingänge (D) eines 7-Bit-
130064/0774
311 A189
Signalspeichers 80,der durch ein Signal auf der Leitung 85 vom Ausgangskanal Nr. 7 eines achtkanaligen Multiplexers 86 taktgesteuert wird. An den binären Steuereingängen A,B,C des Multiplexers 86 liegen die Taktsignale A0-A2 vom Ausgang des Signalspeichers in Taktgeber 38 an. Wenn somit die Parameterwahlbits A0-A2 gleich sind 111 und damit anzeigen, daß der Signalparameter für die Phonemtaktsteuerung an den Datenausgängen (D0-D7) des ROM40 anliegen, dann wird der Ausgangskanal Nr. 7 des Multiplexers 86 hochpegelig, wodurch der Wert des Steuersignalparameters für die Pronemtaktgabe in den Signalspeicher 80 eingespeist wird.
Die sieben parallelen Ausgangssignale (PH0-PH6) des Signalspeichers 80 gelangen an den Nebenphonemtaktgeberkreis 42, der einen Oszillator aufweist, dessen Frequenz durch den Wert der sieben Ausgangsbits des Signalspeichers 80 gesteuert wird. Die Ausgangssignale des Signalspeichers 80 (PH0-PH6) steuern die Ein-Ausschaltung von sieben Analogschaltern, die jeweils mit einem von sieben parallelgeschalteten Kondensatoren mit Binärstellenzahl in Reihe geschaltet sind. Wie nachstehend in Verbindung mit der Beschreibung des Rachenraumes näher erläutert wird, wird ein Widerstandswert, der gleich ist dem Umkehrwert des Produktes der Schaltfrequenz (P1) mit dem resultierenden Kapazitätswert der Kondensatorschaltung 79 simuliert, indem diese Kondensatorschaltung 79 unter Steuerung der sich nicht überlappenden Taktsignale P1 und P2 sehr schnell umschaltet. D.h., daß der simulierte Wert R beim bevorzugten Ausführungsbeispiel durch die folgende Gleichung bestimmt wird:
5K
1 30064/0774
Daher ergibt sich die Frequenz des Ausgangssignals des Oszillators 42 auf der Leitung 88 durch das Produkt des resultierenden Widerstandswertes (R) mit dem feststehenden Kapazitätswert (C) im RC-Taktgeberglied des Oszillators 42.
Das Ausgangssignal auf der Leitung 88 des Nebenphonemtaktgeberkreises 42 liegt am Takteingang eines Phonemtakt- oder Frequenzzählers 84 an und bestimmt damit die Zählfrequenz des Zählers. Die Dauer der Phoneme wird von der Zeitspanne bestimmt, die der Zähler 84 braucht, um eine Zählung von sechszehn zu erreichen. Wenn die Zählungsausgangssignale (Q0-Q3) des Zählers 84 gleich sind 0000 wird das Ausgangssignal des NOR-Gliedes 90 hochpegelig, wodurch ein hochpegeliges Signal am Dateneingang des Flip-Flops 92 anliegt. Nach einer kurzen Verzögerung von zwei Impulsen des Taktsignals P2 wird das Ausgangssignal eines NAND-Gliedes 94 niederpegelig, wodurch der Ausgangssignalspeicher 28 über eine Inversionsstufe 96 angesteuert und dadurch die A/R-Leitung hochpegelig wird, um zu melden, das neue Phonemdaten angefordert werden.
Nachstehend wird der Betrieb der Vokal- und Schließverzögerungsschaltung näher beschrieben. Wie bereits erwähnt, besteht der Zweck der Vokal- oder Stimm- und Schließverzögerungsregelparameter darin, die übertragung der Regelsignale für die Vokal- und Reiblautamplituden während eines bestimmten Abschnittes der Phonemperiode bzw. bei bestimmten phonetischen Vokal-Reiblautübergängen zu verzögern. Dies wird wie folgt erreicht: Die vier Zählausgangssignale (Q0-Q3) des Phonemtaktzählers 84 gelangen über Inversionsstufen 100 an die Eingänge B einer 4-Bit-Größenvergleichsschaltung 82. Die Eingänge A der Größenvergleichsschaltung 82 sind an die Da-
130064/0774
tenausgänge D0-D3 des ROM40 geführt. Das Ausgangssignal A=B der Größenvergleichsschaltung 82 gelangt über eine Leitung 102 an zwei NAND-Glieder 104 und 106. Der andere Eingang des NAND-Gliedes 104 ist über eine Leitung 110 mit dem Ausgangskanal Nr. 5 des Multiplexers 86, und der andere Eingang des NAND-Tors 106 über eine Leitung 108 an den Ausgangskanal Nr. 4 des Multiplexers 86 geführt. Wenn daher die an den Binärsteuereingängen A,B und C des Multiplexers 86 anliegenden Taktsignale A2-A0 gleich 101 sind und anzeigen, daß der Regelparameter für die Vokalverzögerung (VD) an den Datenausgängen D0-D3 des ROM40 anliegen, und wenn die Zählaus gangs Signa Ie (Q0-Q3) des Phonemtaktzählers 84 gleich dem Parameterwert des Regelsignals für die Vokalverzögerung sind, dann sind beide Eingänge des NAND-Gliedes 104 hochpegelig, wodurch sein Ausgangssignal niederpegelig wird und einen Flip-Flop 112 ansteuert. Auch wenn die Taktsignale A2-A0 gleich 100 sind, wird der Ausgangskanal Nr. 4 des Multiplexers 86 auf der Leitung 108 hochpegelig, das anzeigt, daß das Regelsignal für die Schließverzögerung an den Datenausgängen D0-D3 des ROM40 anliegt. Wenn somit der Zählausgang des Phonemzählers 84 gleichzeitig eine dem Parameterwert des Regelsignals für die Schließverzögerung gleiche Zählung erreicht, wird auch das Signal A=B der Größenvergleichsschaltung 82 auf einer Leitung 102 hochpegelig, wodurch hochpegelige Signale an beiden Eingängen eines NAND-Gliedes 106 anliegen, dessen Ausgang darauf niederpegelig wird und den Flip-Flop 114 ansteuert. Wie nachstellend erläutert wird, dienen die Ausgangssignale der Flip-Flops 112 und 114 dazu, die Übergangsschaltung 46 (Fig.3) zu sperren, wodurch der Übergangsprozeß in der digitalen Übergangsschaltung 50 während des Überganges der Regelsignalparameter der Vokal- und Reiblautamplituden verhindert wird. Am Ende einer jeden
130064/0774
31H189
Phonemperiode werden die Flip-Flops 112 und 114 durch einen niederpegeligen Löschimpuls auf der Leitung 124 vom Ausgang eines UND-Gliedes 122 gelöscht. Das Ausgangssignal des UND-Gliedes 122 wird am Ende einer jeden Phonemperiode durch den hochpegeligen Löschimpuls des Phonemzählers 84 auf der Leitung 30 niederpegelig, wobei es von der Inversionsstufe 120 umgekehrt wird und am Eingang des UND-Tores 122 anliegt. Auch der mit Gleichheitszeichen gekennzeichnete Ausgangssignal der Größenvergleichsschaltung 82 wird auf einen niedrigen Pegel zu Beginn einer jeden neuen Phonemperiode zurückgestellt, wenn die Ausgangszählung (Q0-Q3) des Phonemzählers 84 infolge des resultierenden hochpegeligen Signals gleich 0000 ist, das am Ausgang eines NOR-Gliedes 90 erzeugt wird und durch eine Inversionsstufe 98 umgekehrt wird.
Außerdem sei bemerkt, daß dor Regelsiqnalparameter für die Üch.1. LL'ßvt-iirzijyuruH'j (CLD) auch zum Sperren der Übertragung des Regelparameters für das Schließsignal (CL) an den Schließkreis 68 (Fig. 1) dient. Während der Schließverzögerungsperiode ist das Ausgangssignal des Flip-Flops 114 niederpegelig, wodurch ein nie-(]erpo<jt'liges Signal über eine Leitung 120 an einen Eingang eines NAND-Gliedes 128 mit drei Eingängen gelangt. Die beiden übrigen Eingänge des NAND-Gliedes 128 sind an eine Leitung 116 geführt, die mit dem Ausgangskanal Nr. 3 des Multiplexers 86 verbunden ist sowie mit einer Leitung 115, die an den Datenausgang D3 des ROM40 angeschlossen ist. Liegt ein Schließsignal an, so werden die Datenausgänge D0-D2 des ROM40 nicht belegt, da das Schließsteuersignal einfach ein Ein-Aus-Signal ist. Daher wird nur der Schaltzustand des Datenausgangs D3 des ROM40 auf der Leitung 115 während der Schließperiode überwacht, wenn die Taktsignale A2-A0 gleich
130064/0774
31 H189
011 sind und der Ausgangskanal des Multiplexers 86 auf der Leitung 116 hochpegelig ist. Selbst wenn hochpegelige Signale auf beiden Leitungen 115 und 116 anliegen, bleibt das Ausgangssignal des NAND-Gliedes 128 niederpegelig, um den Flip-Flop 132 zu löschen, wobei ein niederpegeliges Schließsignal am Ausgang eines UND-Tors 136 so lange anliegt, bis der Flip-Flop 114 am Ende der Schließverzögerungszeit angesteuert wird und auf der Leitung 126 ein hochpegeliges Signal anliegt. Tritt die Schließverzögerungsfunktion nicht in Kraft, und ist der Ausgang des Flip-Flops 114 hochpegelig, dann wird ein niederpegeliges Schließsignal am Ausgang des UND-Gliedes 136 erzeugt, wenn die hochpegeligen Signale gleichzeitig auf der Leitung 115 vom Datenausgang D3 des ROM40 und vom Ausgangskanal Nr. 3 des Multiplexers 86 auf der Leitung 116 abgegriffen werden. Das Schließsignal endet, wenn das Ausgangssignal des NAND-Tores 130 niederpegelig wird, um den Flip-Flop anzusteuern, was geschieht, wenn der Ausgangskanal Nr. 3 des Multiplexers 86 auf der Leitung 116 hochpegelig und das Datenausgangssignal D3 des ROM40 niederpegelig ist und damit anzeigt, daß die Schließfunktion nicht mehr gebraucht wird. Dies erfolgt meist zu Beginn der folgenden Phonemperiode, wenn das folgende Phonem nicht ebenfalls die Schließfunktion fordert, da das Ausgangssignal des Schließverzögerungs-Flip-Flops 114 stets mindestens kurzfristig zu Beginn einer jeden Phonemperiode hochpegelig ist.
Außerdem sei bemerkt, daß ein Schließverzögerungsregelsignal auch erzeugt wird, wenn die Regelparameter für die Vokalamplitude (VA) und die Reiblautamplitude (FA) gleich Null sind. D.h., wenn sowohl die Signale VA und FA der NOR-Glieder 190 und 192 (Fig. 3)hochpegelig sind, wird das Ausgangssignal eines NAND-Gliedes 134 nie-
130064/0774
derpegelig, wodurch ein niederpegeliges Schließsignal am Ausgang des UND-Tores 136 anliegt. Dadurch wird der Rachenraum in den Perioden vollkommen stillgelegt, wenn keine Erregungsenergie vorhanden ist, damit während der Pausenzeiten kein Summen oder andere Arten von Störgeräuschen erzeugt werden können.
Der übrige Regelparameter für NichtÜbergänge, der an den Datenausgängen D0-D3 des ROM40 anliegt, ist der Pausenregelparameter (PAC). Wie bereits erwähnt, wird der Pausenregelparameter erzeugt, wenn ein lautloses Phonem angefordert wird, wobei er auch dazu dient, die Formantenstellungen des Rachenraumes zu arretieren/ bis die gesamte Erregungsenergie verbraucht ist. Der Pausenregelparameter ist insofern gleich dem Schließregelparameter (CL), daß es sich um einen Ein-Aus-Parameter handelt, der nur ein einziges Signaldatenbit erfordert. Aus Zweckmäßigkeitsgründen wird der Datenausgang D3 des ROM40 wieder gewählt, und die Datenausgänge D0-D2 bleiben unbelegt. Das Ausgangssignal D3 des ROM40 auf der Leitung 115 gelangt an den Eingang eines NAND-Tores 138, dessen anderer Eingang an den Ausgangskanal Nr. 6 des Multiplexers 86 geführt ist. Wenn somit die Taktsignale A2-A0 gleich 110 und damit den Ausgangskanal Nr. 6 des Multiplexers 86 hochpegelig schalten, wobei angezeigt wird, daß der Pausenregelparameter an den Datenausgängen D0-D3 des ROM40 anliegt und auch, daß der Datenausgang D3 auf der Leitung 115 hochpegelig ist, dann wird auch das Ausgangssignal des NAND-Gliedes 138 niederpegelig und steuert den Flip-Flop 142 an. Das Ausgangssignal des Flip-Flops 142 liegt seinerseits am Eingang eines UND-Gliedes 146 an, dessen anderer Eingang mit dem Ausgang eines NAND-Gliedes 144 verbunden ist. An den Eingängen des NAND-Tors 144 liegen die Signale VA und FA von den Aus-
130064/0774
gangen der NOR-Glieder 190 und 192 in Fig. 3 an. Da jedoch die Selbstlaut- bzw. die Reiblauterregungsenergie stets bei nicht-tonlosen Phonemen vorhanden ist, ist das Ausgangssignal des NAND-Tors 144 normalerweise hochpegelig. Wenn daher der Flip-Flop 142 zu Beginn eines Pausenphonems angesteuert wird, entwickelt sich ein hochpegeliges Signal am Ausgang des UND-Gliedes 146, das dann am ÜbergangsSperrkreis 46 (Fig. 3) anliegt und die digitale übergangsschaltung sperrt, wodurch die übergangsregelparameter auf ihren laufenden Werten gehalten werden. Das hochpegelige Signal für die "Sperrformanten" am Ausgang des UND-Gliedes 146 schaltet jedoch entweder am Ende eines Pausenphonems oder sobald die gesamte Selbstlaut- und Reiblauterregungsenergie vollständig verbraucht ist, je nachdem welches Ereignis früher eintritt. Wenn beide Signale VA und FA hochpegelig sind, wird das Ausgangssignal des NAND-Gliedes 144 niederpegelig, wodurch auch das Ausgangssignal des UND-Gliedes 146 niederpegelig wird. Wenn umgekehrt das Ausgangssignal des NAND-Gliedes 144 am Ende der Phonempausenzeitspanne noch hochpegelig ist, wenn der Datenausgang D3 des ROM40 auf der Leitung 115 niederpegelig wird, dann bewirkt das durch das sich ergebende niederpegelige Signal am Ausgang des NAND-Gliedes 140 ein Löschen des Flip-Flops 142, wodurch auch das Ausgangssignal des UND-Gliedes 146 niederpegelig wird.
Anhand der Fig. 3 wird nun die Arbeitsweise der digitalen Übergangsschaltung 50 näher erläutert. Wie bereits erwähnt ,besteht der Zweck der digitalen Übergangsschaltung 50 darin, die fortschreitende Veränderung der Werte der Regelparameter des Rachenraumes von gegenwärtigen Istwerten auf neue Sollwerte zu bewirken. Die vier Parameterleitungen T0-T3 von den Datenausgängen D4-D7 des Parameter-
130064/0774
festspeichers ROM40 gelangen an die Eingangskanäle 1-4 eines achtkanaligen Multiplexers 150. An den binären Regeleingängen A,B,C des Multiplexers 150 liegen die Übergangstaktsignale BIT 0, BIT und BIT 2 vom Taktgeber 38 (Fig. 2) her an. Das Taktverhältnis zwischen den Übergangstaktsignalen BIT 0 - BIT 2 und den Parametertaktsignalen A0-A2 ist in Fig. 11 gezeigt. Aus dem Taktdiagramm der Fig. 11 ergibt sich, daß die Taktsignale BIT 0 - BIT 2 acht Schaltzustände innerhalb eines jeden Schaltzustandes darstellen, der durch die Taktsignale A0-A2 gebildet wird. Wie erwähnt, bestimmen die Taktsignale A0-A2, welcher Parameter an den vier Parameterleitungen T0-T3 von den Datenausgängen des ROM40 D4-D7 anliegt.
Damit dient der Multiplexer 150 dazu, die parallelen Eingangsdaten auf den Parameterleitungen T0-T3 in serielle Daten auf der Eingangsleitung 151 in Vorbereitung für die nachfolgend durchzuführenden arithmetischen Rechnungen umzusetzen. Da jedoch die vier stellenhöchsten Bits im parallel 8-Bit-Ausgangssignal der Ausgangssignalspeicher 168 und 170 des parallelen Ausgangs der digitalen Übergangsschaltung schließlich unterdrückt werden, und die Parametereingangsleitungen T0-T3 der Übergangsschaltung an die Kanäle 1-4 des Multiplexers 150 angeschlossen sind und daher gegenüber dem Ausgangssignal um drei Bits oder Stellen abwärts verschoben werden, dient der Multiplexer 150 auch zur Teilung des Sollparameterwertes durch 2 oder Acht. Das serielle Ausgangssignal des Multiplexers 150, das somit gleich ist einem Achtel des Sollparameterwerts, gelangt auf der Leitung 151 an den Eingang B eines Einzelbitaddierwerks 158. Der Eingang A des Addierwerks 158 ist an den Summensignalausgang (Z) eines zweiten Einzelbitaddierwerks 156 geführt. Der Eingang A des Addierwerks 156 ist mit dem seriellen
130064/0774
_ J 31ΊΑ189
Ausgang des zweiten achtkanaligen Multiplexers 152 verbunden, der nur dazu dient, das sich ergebende parallele Ausgangssignal der digitalen Übergangsschaltung 50 in ein serielles Signal zurückzuverwandeln. Somit stellt das auf der Leitung 153 anliegende serielle Ausgangssignal des Multiplexers 152 den letzten oder Istwert des Regelparameters dar. Der Eingang B des Addierwerks 156 ist an den seriellen Ausgang eines dritten achtkanaligen Multiplexers 154 geführt, der ebenfalls parallele Ausgangssignale der digitalen Übergangsschaltung 50 in ein serielles Signal umsetzt. Da jedoch die vier Bits mit dem höchsten Stellenwert im Ausgangssignal des Signalspeichers 168 um drei Bits herunterversetzt werden und den Eingangskanälen 1-4 des Multiplexers 154 zugeleitet werden, teilt dieser auch den Stromparameterwert durch Acht. Da das serielle Ausgangssignal des Multiplexers 144 auf der Leitung 155 über eine Inversionsstufe 172 am Eingang B des Addierwerks 156 anliegt, subtrahiert das Addierwerk 156 ein Achtel des Stromparameterwertes vom Parameteristwert und gibt das Ergebnis an den Eingang A des Addierwerks 158 ab. Dieser addiert dann ein Achtel des Parametersollwertes zum Gesamtwert des Addierwerks 156. Der Wert des daraus entstehenden Signals am Summierausgang CE) des Addierwerks 158 auf der Leitung 156, der den "neuen" Parameteristwert darstellt, kann daher durch die folgende Gleichung angegeben werden:
(Istwert - 1/8 Istwert) +1/8 Sollwert = neuer Istwert.
Das serielle Signal auf der Leitung 165 des Summxerungsausgangs (E) des Addierwerks 158 wird durch zwei Dezimale D-Flip-Flops 160 und 162 in ein Parallelsignal zurückverwandelt, das dann als 8-Bit-
130064/0774
Signal an den acht Dateneingängen (D0-D3) zweier Zwischenspeicher mit wahlfreiem Zugriff RAM 164 und 166 anliegt. Die Adresseneingänge (A0-A2) der RAM 164 und 166 sind mit den Parametertaktsignalleitungen A0-A2 verbunden. D.h., daß jeder folgende neue Istparameterwert an den durch die Parametertaktsignale A0-A2 gekennzeichneten Adressenstellen in den RAM 164 und 166 gespeichert werden, solange ihre Eingänge R/W beaufschlagt bleiben. Die Lese-/Schreibeingänge (R/W) der beiden RAM 164 und 166 sind an den Ausgang eines ODER-Gliedes 172 geführt, von dem ein Eingang an den seriellen Ausgang eines Multiplexers 174 und der andere Eingang über eine Inversionsstufe 173 an die Taktsignalleitung 02 angeschlossen ist. Die binären Steuereingänge A,B und C des Multiplexers 174 sind auch an die Parametertaktleitungen A0-A2 gekoppelt. Die fünf niederpegeligen Eingangskanäle des Multiplexers 174 (Nr. 0-4) sind mit dem Ausgang eines ersten NAND-Gliedes 176, der Eingangskanal Nr. 5 mit dem Ausgang eines zweiten NAND-Gliedes 178 und der Eingangskanal Nr. 6 mit dem Ausgang eines dritten NAND-Gliedes 180 verbunden. Einer der Eingänge des NAND-Gliedes 176 ist über eine Inverionsstufe 182 an die Signalleitung FF zum Sperren der Formants gekoppelt, so daß bei Erzeugung eines hochpegeligen Sperrsignals das Ausgangssignal des NAND-Gliedes 176 hochpegelig wird. Auch einer der Eingänge der einzelnen NAND-Glieder 178 und 180 ist an die Vokalverzögerungs- (VD) und Schließverzögerungssignalleitung (CLD) gekoppelt, so daß bei Erzeugung eines niederpegeligen Vokalverzögerungs- oder Schließverzögerungssignals die Ausgänge der NAND-Glieder 178 und 180 hochpegelig werden.
Wenn kein Vokalverzögerungs- (VD), Schließverzögerungs- (CLD) oder Sperrformantensignal (FF) anliegt, bleibt das serielle Ausgangs-
1300Θ4/0774
signal des Multiplexers 174 niederpegelig, und die Eirgangssignale R/W werden in die RAM 164 und 166 vom Taktsignal 02 eingesteuert. Daher werden die neuen Istwerte für jeden Parameter in die RAM und 166 eingeschrieben und anschließend auf ihren Datenausgängen Q0-Q3 ausgelesen. Da die Frequenz des Taktsignals 02 beim bevorzugten Ausführungsbeispiel auf 20 kHz eingestellt ist, geht ein Parameter normalerweise auf etwa 70 % seines neuen Sollwertes in 33 msec über.
Wenn jedoch ein Formantensperrsignal (FF) erzeugt wird, wird das serielle Ausgangssignal des Multiplexers 174 hochpegelig, um die Eingänge R/W der RAM 164 und 166 in den Zeitspannen zu sperren, wenn die Parameterbits A2-A0 gleich sind 000, 001, 010, 011 und 100, was den Erzeugungszeiten der Regelparameter F1,F2,FC,F3 und F2Q entspricht. Wenn dies auftritt, werden keine neuen Werte für diese Parameter in die RAM 164 und 166 eingeschrieben, wobei die Werte dieser Regelparameter auf ihren Istwerten "eingefroren" oder gesperrt bleiben, bis das Signal FF anliegt. Auch das Anstehen eines Vokalverzögerungssignals (VD) bewirkt, daß das serielle Ausgangssignal des Multiplexers 174 hochpegelig wird und die R/W-Leitung 47 für die RAM 164 und 166 während der Zeitspanne "101" oder der Vokalamplitude (VA) der Parameterperiode sperrt und verhindert, daß neue Werte für den Vokalamplitudenparameter in die RAM 164 und 166 eingeschrieben werden, bis das Vokalverzögerungssignal abschaltet. Wenn dann ein Schließverzögerungssignal (CLD) erzeugt wird, wird das serielle Ausgangssignal des Multiplexers 174 hochpegelig während der Zeitspanne "110" oder Reiblautamplitude (FA) der Parameterperiode, wobei der Wert des Reiblautamplitudenparameters so lange beibehalten wird, bis das Schließverzö-
130064/0774
31U189
gerungssignal abschaltet.
Die acht parallelen Datenausgänge Q0-Q3 der RAM 164 und 166 werden vom Taktsignal 01 in zwei 4-Bit-Ausgangssignalspeicher 168 und eingesteuert. Die vier Bits mit den höchsten Stellenzahlen oder die Ausgangssignale Q des Ausgangssignalspeichers 168 werden dann durch Signalspeicher 194-200 entschachtelt, wobei sich die Übergang sregelsignale F1,F2,FC,FC,F3,F2Q,VA und FA ergeben, die dann an verschiedenen Abschnitten des Rachenraums 60 anliegen. Die vier Ausgangssignale Q des Signalspeichers 168 sind parallel zu den Dateneingängen (D) der einzelnen Demultiplex- oder Entschachtelungsspeicher 194-200 geschaltet. Die Signalspeicher 194-200 werden von den Parametertaktsignalen A0-A2 gesteuert, die an den Eingängen A,B und E eines 3-8-Kanal-Dekodiergeräts 210 anliegen. Die Ausgangskanäle 2,5 und 6 des Dekodiergeräts 210 sind direkt an die Taktsignaleingänge (CK) der Signalspeicher 196,199 und 200 angekoppelt. Die Ausgangskanäle 0,1,3 und 4 sind mit dem Stimmritzensynchronimpuls auf der Leitung 55 an UND-Glieder 202-208 geführt, ehe sie an den Taktsignaleingängen (CK) der Speicher 194,195,197 und 198 anliegen. Damit werden die übergangswerte für die Parameter FC,FC VA und FA unmittelbar bei ihrer FortSchreibung in die Speicher 196, 199 und 200 taktgesteuert, während die vorhergehenden übergangswerte für die Parameter F1,F2,F3 und F2Q in die Speicher 194,195, 197 und 198 synchron mit dem Stimmritzenimpuls des Stimmritzengenerators (Fig. 6) eingegeben werden.
Außerdem liegt am Entschachtelungsspeicher 195, der auch das Übergangsregelsignal F2 erzeugt, das Bit mit der fünfhöchsten Stelle (1/2 LSB) des 8-Bit-Ausgangssignals der digitalen Übergangsschaltung
130064/0774
50 an, so daß der übertragene übergangswert für den Regelparameter F2 fünf Auflösungsbits aufweist. Damit wird die Sprungauflösung des Regelparameters F2 wegen der größeren Frequenzspannweite des Resonanzfilters F2 im Rachenraum 60 (Fig. 4) vergrößert.
Der erfindungsgemäße Stxmmritzengenerator 58 wird nun anhand der Fig. 6 erläutert. Die Periode des Stimmritzenimpulses wird durch die Zeit bestimmt, die ein 8-Bit-Zähler, bestehend aus zwei in Kaskadenschaltung angeordneten 4-Bit-Kartenanstoßzählern 220 und 222, um vor einer eingestellten Zählung bis zu allen Einem zu zählen. Die Zählers 220 und 222 werden durch das Taktsignal 02 von 20 kHz gesteuert. Die drei Dateneingänge für die höchsten Stellenwerte (L1-L3) des Zählers 222 sind an die Inversionsstufe für die drei Bits mit den geringsten Stellen (F10,F12) im übertragenen Regelparameter F1 vom Ausgang des Speichers 194 (Fig. 3) gekoppelt. Der Umkehrwert des höchststelligen Bits (F13) im Übergangsregelparameter F1 und die beiden Modulationsregelbits (11,12) 56 des 8-Bit-Eingangsbefehls liegen an den Dateneingängen für die Bits mit den geringsten Stellenzahlen (L0-L2) des Zählers 220 an. Die an den Eingängen (L0-L3) der Zähler 220 und 222 anstehenden Daten werden den Zählern eingegeben, um diese am Ende eines Stimmritzenimpulses einzustellen, wenn am Übertragsausgang (TC) des Zählers 220 ein hochpegeliges Signal entsteht, das durch die Inversionsstufe 228 umgekehrt wird und über eine Leitung 230 den Eingabeeingängen (LD) der Zähler 220 und 222 eingespeist wird. Da auch die Frequenz des Übertragsignals für die nächsthöhere Stelle des Zählers 220 die Frequenz des Stimmritzenimpulses bestimmt, wird die Grundfrequenz des Stimmritzenimpulses durch die Einstellung des Modulationsregelbits 56 geregelt und, in einem geringeren Grade, durch den Wert
130064/0774
' 31U189
des Regelparameters F1. Da der Regelparameter F1 invertiert ist, verändert sich die Grundfrequenz des Stimmritzensignals in umgekehrtem Verhältnis zu diesem. D.h., wenn der Wert des Parameters F1 abnimmt, erhöht sich die Höhe des niederfrequenten Ausgangssignals. Damit wird ein Grad von automatischer Modulationsregelung im Audioausgangssignal zusätzlich zu den programmierbaren Tonhöhenschwankungen erreicht, die sich mit den Modulationsregelbits 56 durchführen lassen. Da aber die beiden Modulationsregelbits 56 an hochpegeligeren Dateneingängen der Zähler 220 und 222 anliegen als die Parameterbits F1, besitzen die automatischen Modulationsänderungen, die sich aus einer Bewegung der Resonanzfrequenz des Resonanzfilters F1 ergeben, eine geringere Wirkung auf die Tonhöhe des Audioausgangssignals als die programmierten Änderungen über die Modulationsregelbits 56.
Außerdem ist ein dritter 4-Bit-Kartenanstoßzähler 224 vorgesehen, in welchen die gleichen Daten wie in den Zähler 220 eingegeben werden und, der gleichzeitig mit diesem beaufschlagt wird. Der einzige Unterschied besteht darin, daß der Zähler 224 durch das Taktsignal AO gesteuert wird und damit doppelt so schnell zählt wie der Zähler 220. Das Übertragsausgangssignal (TC) des Zählers 224 ist an den Anschalteingang des RS-Flip-Flops 226 geführt, dessen Löscheingang mit dem Übertragsausgang (TC) des Zählers 220 verbunden ist. Damit ist das Ausgangssignal des Flip-Flops 226 auf der Leitung 65 zu Beginn eines jeden Stimmritzenimpulses niederpegelig eingestellt und wird auf der Hälfte seiner Periode hochpegelig. Das Signal auf der Leitung 65, das mit F-Glied bezeichnet ist, liegt an einem Generator für weißes Rauschen 64 (Fig. 8) an, um das Signal für weißes Rauschen während der ersten Hälfte der
130064/0774
SS
31U189
Zeitspanne des Stimmritzenimpulses für stimmhafte Reiblautphoneme zu unterdrücken, wenn gleichzeitig Vokal- und Reiblauterregungsenergie vorhanden sind.
Die Wellenform des Stimmritzenimpulses wird durch einen 4-Bit-Zähler 234 und zwei 8:1-Analogmultiplexer 242 und 244 erzeugt. Der Zähler 234 wird durch das Ausgangssignal Q1 eines anderen 4-Bit-Zählers 236 taktgesteuert, der seinerseits durch das 20 kHz Taktsignal 02 gesteuert wird. Somit teilt der Zähler 236 die Frequenz des 20 kHz-Taktsignals 02 durch vier, so daß die Frequenz des am Zähler 234 anliegenden Taktsignals 5 kHz ist. Die drei Ausgangssignale des Zählers 234 (Q0-Q2) mit den niedrigsten Stellenwerten sind parallel zu den binären Steuereingängen A,B und C der Multiplexer 242 und 244 geschaltet. Das Ausgangssignal des Zählers 234 mit dem höchsten Stellenwert (Q3) sperrt den Eingang (INH) des Multiplexers 242 und auch, über eine Inversionsstufe 245, den Sperreingang (INH) des Multiplexers 244, so daß dieser während der ersten sieben Zählschritte (0-7) des Zählers 234 abschaltet, wobei der Multiplexer 242 während der zweiten acht Zählschritte (8-15) des Zählers 234 nicht beaufschlagt ist. Die paralleln Eingänge (0-7) beider Multiplexer 242 und 244 sind an ein Potentiometer geführt, das zwischen eine Spannungsquelle (V ) und Masse geschaltet ist und einen einstellbaren Gleichspannungspegel darstellen soll. Die Gleichspannungspegel werden auf entsprechende Werte voreingestellt, um die gewünschte Annäherung an die Stimmritzenwellenform zu schaffen.
Die seriellen Ausgangssignale der Multiplexer 242 und 244 werden zusammengeschaltet und bilden das Stimmritzenausgangssignal auf
130064/0774
-JkT-
einer Leitung 246. Der auf der Leitung 246 anliegende analoge Gleichspannungspegel wird somit durch das Ausgangszählsignal des Zählers 234 bestimmt, das an den BinärSteuereingängen A,B und C der Multiplexer 242 und 244 anliegt. D.h., daß jedes der sechzehn Zählsignale am Ausgang des Zählers 234 ausschließlich eines der sechzehn Eingangssignale der Multiplexer 242 und 244 bestimmt. Wenn beispielsweise die Ausgangszählung des Zählers 234 gleich ist 0110, dann wird der am Eingangskanal Nr. 6 des Multiplexers 242 anliegende Gleichspannungspegel an der Ausgangsleitung 246 erzeugt. Wenn dann die Ausgangszählung des Zählers 234 gleich ist 1101, dann wird der Eingangskanal Nr. 5 des Multiplexers 244 anliegende Gleichspannungspegel an die Ausgangsleitung 246 abgegeben. Beim bevorzugten Ausführungsbeispiel, bei dem das Taktsignal 02 auf 20 kHz eingestellt ist, ergibt die Zählfrequenz von 5 kHz des Zählers 234 einen Ausschnitt von 0,2 msec im Stimmritzenausgangssignal auf der Leitung 246 bei jeder Zählung des Zählers 234. Somit kann durch entsprechende Voreinstellung der Gleichspannungssignalpegel an den Eingängen der Multiplexer 242 und 244 jede gewünschte Stimmritzenwellenform erzeugt werden. Beim bevorzugten Ausführungsbeispiel wurde festgelegt, daß ein Stimmritzenimpuls mit acht Segmenten (Fig. 10) ausreichend sein würde, und daher wurde nur ein einziger 8:1-Multiplexer verwendet.
Das Übertragsausgangssignal (TC) des Zählers 234 wird an seinen Anschalteingang (EP) über eine Inversionsstufe 238 zurückgeführt, um den Zähler abzuschalten, nachdem er eine Zählung von 1111 erreicht hat und ihn daran zu hindern, auf weitere Taktimpulse anzusprechen. Das Übertragsausgangssignal des Zählers 220, welches die Zeitspanne des Stimmritzensignals bestimmt, wird über eine In-
130064/0774
versionsstufe 228 auf der Leitung 230 an den Eingang eines ODER-Gliedes 232 geführt, an dessen anderen Eingang das Taktsignal 01 über eine Inversionsstufe 231 her anliegt. Das Ausgangssignal des ODER-Gliedes 232 gelangt an die Löscheingänge (CLR) der beiden Zähler 234 und 236. Wenn am Ende eines Stimmritzenimpulses am Übertragsausgang (TC) des Zählers 220 ein hochpegeliges Signal erzeugt wird, liegt ein niederpegeliges Signal an den Eingängen (CLR) der Zähler 234 und 236 an, wodurch alle vier Ausgänge (Q0-Q3) der beiden Zähler auf Null zurückgestellt werden, um einen neuen Stimmritzenimpuls einzuleiten.
Wenn die Ausgangszählimpulse Q0-Q3 des Zählers 234 zu Beginn eines jede Stimmritzenimpulses gelöscht werden, liegt ein hochpegeliger Ausgangsimpuls auf der Stimmritzensynchronisationsleitung 55 am Ausgang eines NOR-Gliedes 240 an, dessen vier Eingänge mit den vier Ausgängen des Zählers 234 verbunden sind. Wie bereits bemerkt, wird der Stimmritzensynchronisationsimpuls auf der Leitung 55 an die Übergangsschaltung (Fig. 3) geführt, um die Regelparameterwerte F1,F2,P3 und F2Q an den Ausgangssignalspeichern 194,195,197 und 198 mit dem Beginn eines jeden Stimmritzenimpulses zu synchronisieren. Der Zweck der Synchronisation des Überganges der Rege lparameterwerte F1,F2,F3 und F2Q mit dem Anfang des Stimmritzenimpulses besteht darin, die Erzeugung von hörbaren statistischen Störgeräuschen zu verhindern, die sich ergäben, wenn die CMOS-Schalter der regelbaren Kapazitätsnetzwerke im Rachenraum während der "Ruheperiode" des Stimmritzenimpulses umschalten könnten, wenn im Rachenraum keine Erregungsenergie vorhanden ist.
Das Reiblauterregungssignal wird von einem Generator für weißes
130064/0774
Rauschen erzeugt (Fig. 8), der aus einem Kartenanstoßzähler 250 und einem achtzehnstufigen statischen Schieberegister 252 besteht, welches ein statistisches Ausgangssignal mit weißem Rauschen auf einer Leitung 256 erzeugt. Sowohl der Anstoßzähler 250 als auch ein Schieberegister 252 werden durch das Taktsignal P1 gesteuert, das an ihren Taktsignaleingängen (CK) über ein NOR-Glied 254 her anliegt. Der andere Eingang des NOR-Gliedes 254 ist an den Inversionsausgang (FA) für den Reiblautregelparameter des NOR-Gliedes (Fig. 3B).Wenn keine Reiblauterregungsenergie gebraucht wird, wird der Rauschgenerator abgeschaltet, um unnötige Störungen für den Rest der Anlage zu vermeiden.
Das Ausgangssignal mit weißem Rauschen auf der Leitung 256 gelangt an den Eingang eines NAND-Gliedes 258, dessen anderer Eingang an den Ausgang eines ODER-Gliedes 260 geführt ist. Die Eingangssignale des ODER-Gliedes 260 sind an die Signalleitung F-Glied 65 sowie VA vom Ausgang des NOR-Gliedes 190 (Fig.3B). Bei stimmhaften Reiblautphonemen, die sowohl Vokal- als auch Reiblauterregungsenergie erfordern, bleiben die beiden Signale VA und FA niederpegelig. Wenn somit das Signal F-Glied auf der Leitung 65 während der zweiten Hälfte oder des "Ruheabschnittes" der Periode des Stimmritzensignals hochpegelig wird, so wird das NAND-Glied 258 angesteuert, wobei es während des zweiten Ruheabschnittes der Stimmritzensignalperiode das NAND-Glied 258 ansteuert.
Das Signal mit weißem Rauschen gelangt dann vom Ausgang des NAND-Gliedes 258 an den Reiblautamplitudenregelkreis 260, welcher die Amplitude des Signals mit weißem Rauschen in Abhängigkeit von dem Wert des Reiblautamplitudenregelparameters (FA) regelt. Das daraus
130064/0774
entstehende Signal mit weißem Rauschen wird dann durch ein Hochpaßrauschfilter gefiltert, ehe es in den Rachenraum 60 durch den Reiblautregelsignalparameter (FC) und seinen Umkehrwert (FC) in den Rachenraum eingesteuert wird. Die Arbeitsweise des Reiblautamplitudenregelkreises 260 und des Hochpaßrauschfilters 262, welche die gleiche kapazitive Schalttechnik im Rachenraum 60 verwenden, ergibt sich aus der folgenden Beschreibung des Rachenraums 60.
Anhand der Fig. 4 und 5 ist ein Stromlaufplan des neuartigen erfindungsgemäßen Rachenraums 60 gezeigt. Dieser besteht im Prinzip aus vier in Kaskadenschaltung angeordneten Resonanzfiltern F1,F2, F3 und F5. Die Resonanzfrequenzen der Filter F1,F2 und F3 sind regelbar und werden in Abhängigkeit von den Regelparametern F1, F2 und F3 gesteuert, während die Resonanzfrequenz des Filters F5 fest ist. Das Stimmritzen- oder Vokalerregungssignal gelangt über den Vokalamplitudenregelkreis 62, der die Amplitude des Stimmritzensignals in Abhängigkeit vom Regelparameter für die Vokalamplitude (VA) steuert, seriell zum Resonanzfilter F1 des Rachenraumes. Das Reiblauterregungssignal wird parallel in die Resonanzfilter F1 und F5 des Rachenraumes 60 eingespeist, wobei es durch den Regelparameter für die Reiblaute (FC) und dessen Umkehrwert (FC) gesteuert wird. Außerdem wird der Wert "Q" oder die Bandbreite des Resonanzfilters F2 durch den Regelparameter F2Q gesteuert, der hauptsächlich bei Nasalphonemen eingesetzt wird, um das "Q" zu verkleinern und damit die Bandbreite des Resonanzfilters F2 zu vergrößern. Nachstehend wird das erfindungsgemäße Verfahren erläutert, nach welchem die Parameterregelfunktionen erfindungsgemäß in die Praxis umgesetzt werden.
130064/0774
j/3 "" 31U189
Wie bereits erwähnt, eignet sich das bevorzugte Ausführungsbeispiel der Erfindung besonders für einen einzigen integrierten Schaltkreis unter Verwendung der Komplementär-MOS-Technik (CMOS). In dem Bestreben, einen vollständigen Sprachgenerator zu schaffen, der auf einem einzigen Siliciumbaustein aufgebaut werden kann, ergab sich eine ausschließliche Lösung für das Verfahren, mit welchem die Parameterregelfunktionen durchgeführt werden. Anstelle zeitorientierte Impulsperioden für die Regelsignale wie bei vielen früheren Sprachgeneratore zu verwenden, bedient sich die Erfindung einer kapazitiven Schalttechnik, um die Abstimmung des Rachenraumes sowie die der anderen Parameter-geregelten Funktionen zu steuern.
Fig. 13 zeigt ein Schaltkreismodell zur Erläuterung der theoretischen Arbeitsweise der erfindungsgemäßen kapazitiven Schalttechnik. Nach Fig. 13 wird der Strom (I) für den negativen Eingang des Rechenverstärkers durch die Ladung des Kondensators (C ) und die Frequenz bestimmt, mit welcher dieser hin- und hergeschaltet wird (F01). Als Gleichung ausgedrückt ergibt sich somit:
1 = F01CrVi
Da der Strom (I) natürlich auch gleich ist (V./R), ergibt sich die folgende Beziehung:
01 r
Daraus erhellt, daß ein nach dem Verfahren der Fig. 13 umgeschalteter Kondensator im wesentlichen einem Widerstand gleich ist. Da außerdem die Zeitkonstante (T) der Schaltung durch die folgende
130064/0774
3114183
Gleichung gegeben ist,
fr,
__£ ι cr
ist der Frequenzganz (F) der Schaltung gleich:
Daraus ergibt sich, daß die Zeitkonstante und der Frequenzgang eines durch die vorstehend erläuterte kapazitive Schalttechnik simulierten RC-Gliedes nicht allein von der Schaltfrequenz (FQ1), sondern auch erheblich vom Kondensatorverhältnis zwischen C und C- abhängt. Um somit einen Frequenzgang im unteren Frequenzbereich der menschlichen Stimme zu erreichen, braucht man nicht nur große Kondensatoren, sondern einfach Kondensatoren mit dem richtigen Verhältnis. Wenn beispielsweise die Umschaltfrequenz (F_1) gleich 20 kHz ist, so ergeben die Werte für C = 1 pf und Cf = 3,183 pf einen uberlagerungsfrequenzgang von 1000 Hz. Daraus ergibt sich, daß die körperlichen Abmessungen des Siliciumbausteins durch den Fortfall der Notwendigkeit für große Kondensatoren minimal gehalten werden können. Da auch der uberlagerungsfrequenzgang vom Kondensatorverhältnis und nicht von ihrer tatsächlichen physischen Größe abhängt, kann die Fertigungstoleranz zwischen den einzelnen Fertigungslosen des Siliciumbausteins leicht auf einem hohen Genauigkeitsniveau gehalten werden.
Wie die Schaltungen der Fig. 4,5,7 und 8 zeigen, dient die erfindungsgemäße kapazitive Schalttechnik beim bevorzugten Ausführungsbeispiel dazu, die von den Parametern F1,F2,F3,F2Q,FC,FC, VA,FA
130064/0774
sowie der Phonemtaktgeberfunktionen in die Praxis umzusetzen. Für jeden Augenblick dient der Regelsignalparameter dazu, den Wert des Kondensatorverhältnisses der speziellen Schaltung zu regeln und damit auch den Widerstandswert der Schaltung, indem der Ein-Ausschaltzustand mehrerer CMOS-Schalter geregelt wird, die einzeln in Reihe mit einer entsprechenden Anzahl von binärorientierten parallelgeschalteten Kondensatoren verbunden sind. Die Schaltfrequenz (F01) ist auf 20 kHz eingestellt, wie sie durch die Taktsignale 01 und 02 des Taktgebers 38 festgesetzt sind, mit Ausnahme beim Nebenphonemtaktgeber 42 (Fig. 7), welcher die Taktsignale P1 und P2 mit 5 kHz des Taktgebers 38 verwendet. Die Taktsignale 01 und 02 sind digitale zweiphasige Taktsignale mit einer Frequenz von 20 kHz. Wie Fig. 14 zeigt, sind die Taktsignale 01 und 02 phasenverkehrt und überlappen sich nicht. Der Zweck des zweiten sich nicht überlappenden Taktsignals (02) besteht darin, auf den Rechenverstärker und die Schaltungsauslegung zurückzuführende Störkapazitäten auszuschalten.
Die Arbeitsweise der kapazitiven Parameterregelschaltung erklärt sich wahrscheinlich am besten durch einen Vergleich des Stromlaufplanes der Vokalamplitudenschaltung 62 und der Resonanzfilter F1 und F2 der Rachenraumschaltung 60 in Fig. 4 mit dem Widerstand-Ersatzschaltbild dieser Schaltung in Fig. 9. Die Regelsignalparameter VA,F1,F2,F2Q und FC regeln den Effektivwiderstand einer Potentiometer-Ersatzschaltung durch Einstellen ihres Kapazitätsverhältnisses auf einen von sechzehn eigenen Werten. Diese sechzehn verschiedenen Werte werden natürlich durch den Schaltzustand der vier Bits in jedem RegelSignalparameter bestimmt. Dies gilt für alle Parameter ausgenommen den Regelparametern F2, welcher die Fre-
130064/0774
- 31U189
quenz des Resonanzfilters F2 steuert. Obwohl der Regelsignalparameter F2 vier Auflösungsbits enthält, die sechzehn verschiedene Sollstellungen wie bei den anderen Regelparametern bilden, wird ein fünftes Auflösungsbit dem Regelparameter F2 während des Übergangs (wie vorstehend beschrieben) zugefügt, um den Einzelzuwachsschritt der Grundfrequenz des Resonanzfilters F2 zu verkleinern, wenn es dynamisch auf eine neue Sollstellung übergeht. Das fünfte Auflösungsbit des Regelparameters F2 ist beim bevorzugten Ausführungsbeispiel vorgesehen, weil die Frequenzspanne etwa das Doppelte der des Resonanzfilters F1 beträgt, das ebenfalls vier Auflösungsbits für sechzehn einzelne Zuwachsschritte verwendet. Da die Zuwachsänderungen so klein wie möglich sein sollen, damit die schrittweise Übergangsbewegung als fortschreitende Änderung vom menschlichen Ohr empfunden wird, fand man es erforderlich, ein fünftes Auflösungsbit dem Regelparameter F2 zuzuteilen, um die Größe der Bewegung bei jedem Einzelschritt zu verkleinern.
Außer dem vorstehend beschriebenen Ausführungsbeispiel sind noch weitere möglich, ohne den Rahmen der Erfindung zu verlassen.
130064/0774
Leerseite

Claims (16)

  1. Patentansprüche
    (1 ·) Phonemorientierter Sprachgenerator mit dem Modell eines Rachenraumes, der in Abhängigkeit von mehreren Regelparametern, die für jedes einzelne Phonem erzeugt werden, geregelt wird, dadurch gekennzeichnet, daß eine digitale Übergangsschaltung (50) den Wert eines Regelparameters (F1,F2,F3,F2Q,FC,FC,VA,FA) von einem Istwert (C) fortschreitend in einen Sollwert (T) verändert, wobei die digitale Übergangsschaltung (50) folgende Baugruppen umfaßt: eine Eingangsschaltung (150) zur Erzeugung des Sollwertes (T) des Regelparameters, eine Ausgangsschaltung (168, 170) zur Erzeugung des Istwertes (C) des Regelparameters und eine Schaltung (158) zur fortlaufenden Addition mit einer bestimmten Frequenz eines bestimmten Prozentsatzes der Differenz (-nc) zwischen dem Sollwert (T) und dem Istwert (C) zum Istwert (C), wobei der daraus entstehende Wert (nC) den Endstufen (168,170) eingegeben wird, so daß dieser entstehende Wert (nC)
    130064/0774
    den neuen Istwert darstellt.
  2. 2. Sprachgenerator nach Anspruch 1, dadurch gekennzeichnet, daß der gegebene Prozentsatz zirka 12,5 % beträgt.
  3. 3. Sprachgenerator nach Anspruch 1, dadurch gekennzeichnet, daß die Schaltung (158) eine erste Schaltung (158) bildet, die an die Eingangsschaltung (150) geführt ist, um ein erstes Signal für den vorgegebenen Prozentsatz (nT) des Sollwertes (T) zu erzeugen, daß eine zweite Schaltung (154) an die Ausgangsschaltung (168) gekoppelt ist, um ein zweites Signal gleich dem vorgegebenen Prozentsatz des Istwertes (C) zu erzeugen, daß eine dritte Schaltung (156) das zweite Signal vom Istwert (C) abzieht und ein drittes Signal für die Differenz (-nC) erzeugt sowie dadurch, daß eine vierte Schaltung (152) das erste Signal (nT) zum dritten Signal (-nC) addiert und das sich ergebende Signal (neuer Istwert) der Ausgangsschaltung (168) einspeist.
  4. 4. Verfahren zur digitalen Erzeugung eines fortschreitenden Übergangs des Wertes eines Regelparameters in einem phonemorientierten Sprachgenerator mit dem Modell eines Rachenraumes, der in Abhängigkeit von mehreren Regelparametern gesteuert wird, die für jedes einzelne Phonem erzeugt werden, gekennzeichnet durch Bilden eines Sollwertes für den Regelparameter, Bilden eines Istwertes für den Regelparameter, Addieren eines bestimmten Prozentsatzes der Differenz zwischen dem Sollwert und dem Istwert zum Istwert, Einsetzen dieses Ergebnisses für den Istwert, um einen neuen Istwert zu bilden und laufendes Wiederholen des vorstehenden dritten und vierten Verfahrensschritts mit
    1 30064/0774
    -3- 31 U 189
    einer bestimmten Frequenz.
  5. 5. Verfahren nach Anspruch 4, dadurch gekennzeichnet, daß,der bestimme Prozentsatz im wesentlichen gleich 12,5 % ist.
  6. 6. Verfahren nach Anspruch 4, dadurch gekennzeichnet, daß die dritte Verfahrensstufe folgende Arbeitsgänge umfaßt: Subtraktion des vorgegebenen Prozentsatzes des Istwertes vom Istwert sowie Addition des vorgegebenen Prozentsatzes des Sollwerts zur Differenz.
  7. 7. Verfahren nach Anspruch 4, dadurch gekennzeichnet, daß die bestimmte Frequenz so gewählt wird, daß der Istwert zirka 70 % des Sollwertes innerhalb einer Zeitspanne von zirka 33 msec ist.
  8. 8. Phonemorientierter Sprachgenerator mit dem Modell eines Rachenraumes, das in Abhängigkeit von mehreren Regelparametern gesteuert wird, die für jedes Phonem erzeugt werden, dadurch gekennzeichnet, daß ein Stimmritzengenerator (58) digital einen Stimmritzenimpuls erzeugt, der dem Rachenraum (60) eingespeist wird, um diesen mit Vokalerregungsenergie zu versorgen, wobei der Stimmritzengenerator (58) folgende Baugruppen umfaßt: parallel-serielle Umsetzer (242,244) mit mehreren parallelen Eingängen (0-7), die jeweils an einen bestimmten Gleichspannungspegel (V ) gekoppelt sind, einen seriellen Ausgang (246) , auf welchem der Stimmritzenimpuls erzeugt wird, sowie mehrere Wahleingänge (A,B,C), die wählen, welche der parallelen Eingänge (0-7) zum seriellen Ausgang (246) durchgeschaltet wird und einen
    130064/0774
    Zähler (234) mit einem Taktsignaleingang, an dem ein Taktsignal (02) mit einer bestimmten Frequenz (20 kHz) anliegt, damit der Zähler (234) mit einer bestimmten Frequenz (20 kHz) zähle, sowie mit mehreren Zählausgängen, die an die Wahleingänge (A,B, C) der parallel-seriellen Umsetzer (242,244) geführt sind, so daß jeder Zählschritt des Zählers (234) bewirkt, daß jeweils ein anderer der parallelen Eingänge (0-7) mit dem seriellen Ausgang (246) verbunden wird.
  9. 9. Sprachgenerator nach Anspruch 8, dadurch gekennzeichnet, daß der Stimmritzengerantor (58) auch einen Taktgeber (220) enthält, welcher die Dauer des Stimmritzenimpulses dadurch bestimmt, daß ein Ausgangssignal (CT) am Ende eines jeden Stimmritzenimpulses erzeugt wird, das an den Zählern (234,236) anliegt, worauf diese gelöscht werden.
  10. 10.Sprachgenerator nach Anspruch 9, dadurch gekennzeichnet, daß der Sprachraum (60) ein erstes regelbares Resonanzfilter (F1) umfaßt, das von einem (F1) der Regelparameter (F1,2,3,F2Q,FC, FC,VA,FA) eingestellt wird und eine erste Resonanzformante (FF) im Frequenzspektrum eines Phonems erzeugt,und daß der Taktgeber (220) automatisch die Zeitdauer des Stimmritzenimpulses in Abhängigkeit vom Wert des ersten Regelparameters (F1) verändert.
  11. 11.Phonemorientierter Sprachgenerator mit einem Rachenraummodell, das in Abhängigkeit von mehreren Regelparametern, die für jedes Phonem erzeugt werden, geregelt wird, wobei die Parameter den eingeschwungenen Zustand von jedem Phonem bilden, dadurch ge-
    130064/0774
    - 5 - '31U189
    kennzeichnet, daß ein Stimmritzengenerator (58) einen Stimmritzenimpuls erzeugt, der am Rachenraum (60) anliegt und Vokalerregungsenergie dort einspeist, wobei der Stimmritzenimpuls (226) mit einer Grundfrequenz (5 kHz) schwingt und jede Periode einen aktiven und einen passiven Abschnitt umfaßt, daß der Stimmritzengenerator (58) Vorrichtungen (242,244) zur Erzeugung eines Stimmritzensynchronisierimpulses zu Beginn des aktiven Abschnittes aufweist sowie dadurch, daß eine digitale Übergangsschaltung (50) Werte der Regelparameter (F1,2,3,F2Q,FC, FC,VA,FA) von einem ersten Wert für den eingeschwungenen Zustand in einen zweiten Wert für den eingeschwungenen Zustand schrittweise verändert, wobei Einrichtungen (54,52) die einzelnen schrittweisen Veränderungen der Werte der Regelparameter mit der Erzeugung des Stimmrxtzensynchronisierimpulses synchronisieren.
  12. 12.Sprachgenerator nach Anspruch 11, dadurch gekennzeichnet, daß der Stimmritzengenerator (58) folgende Einrichtungen umfaßt: Parallel-Seriellumsetzer (242,244) mit mehreren parallelen Eingängen (0-7) , die jeweils an einen bestimmten Gleichspannungspegel (V ) geführt sind, einem seriellen Ausgang (246) zur Erzeugung des Stimmritzenimpulses sowie mehreren Wahleingängen (A,B,C), welche den parallelen Eingang (0-7) wählen, der mit dem seriellen Ausgang (246) verbunden wird und einen Zähler (236) mit einem Taktsignaleingang,an dem ein Taktsignal (02) mit einer bestimmten Frequenz (20 kHz) anliegt, damit der Zähler (236) mit einer bestimmten Frequenz (20 kHz) zähle, sowie mit mehreren Zählausgängen (Q0-Q3), die an die Wahleingänge der Parallel-Seriellumsetzer (242,244) geführt sind, so daß bei je-
    130064/0774
    der Zählung des Zählers (236) ein anderer der parallelen Eingänge (0-7) mit dem seriellen Ausgang (246) verbunden wird.
  13. 13.Sprachgenerator nach Anspruch 12, dadurch gekennzeichnet, daß der Stimmritzengenerator (58) auch einen Taktgeber (220) umfaßt, welcher die Zeitspanne des Stimmritzenimpulses dadurch bestimmt, daß er ein Ausgangssignal (CT) am Ende eines jeden Stimmritzenimpulses erzeugt, das an den Zählern (234,236) anliegt, um diese zu löschen.
  14. 14.Sprachgenerator nach Anspruch 13, dadurch gekennzeichnet, daß der Stimmritzensynchronisierimpuls dann erzeugt wird, wenn der Zähler (234) gelöscht wird.
  15. 15.Sprachgenerator nach Anspruch 11, dadurch gekennzeichnet, daß das Rachenraummodell (60) mehrere umschaltbare Kondensator-Resonanzfilter (F1,F2,P3,F5) umfaßt, die von mehreren parallelgeschalteten und binärorientierten Kondensatoren (Fig. 4,5) digital abgestimmt werden, wobei die Kondensatoren in Reihe mit einem elektrischen Schalter geschaltet sind, der durch einen der Regelparameter (F1,2,3,F2Q,FC,FC7VA,FA) gesteuert wird.
  16. 16.Phonemorientierter Sprachgenerator, dadurch gekennzeichnet, daß eine Vorrichtung (150) in Abhängigkeit von Eingabedaten eine gewünschte Folge von Phonemen identifiziert, um mehrere parallele digitale Regelparameter zu erzeugen, welche elektronisch den eingeschwungenen Zustand der einzelnen Phoneme in der gewünschten Folge bilden, daß ein Stimmritzengenerator (58) einen Stimmritzenimpuls mit einer Grundfrequenz (20 kHz) er-
    130064/0774
    -7- 31U189
    zeugt, der einen aktiven und einen passiven Abschnitt aufweist, wobei der Stxmmritzengenerator (58) auch eine Vorrichtung (240) besitzt, um einen Stimmritzensynchronisierimpuls zu Beginn des aktiven Abschnittes zu erzeugen, und, daß eine digitale Übergangsschaltung (50) die Werte der Regelparameter (F1,2,3,F2Q,FC, FC,VA,FA) schrittweise von einem ersten Wert für einen eingeschwungenen Zustand in einen zweiten Wert für einen eingeschwungenen Zustand verändert, wobei auch eine Vorrichtung (54) zur Synchronisation der einzelnen schrittweisen Werteänderungen der Regelparameter mit der Erzeugung des Stimmritzensynchronisationsimpulses vorgesehen ist sowie dadurch, daß das Modell eines Rachenraumes (60) in Abhängigkeit vom Stimmritzenimpuls im wesentlichen das Frequenzspektrum der einzelnen Phoneme der gewünschten Folge erzeugt, wobei mehrere umschaltbare kapazitive Resonanzfilter (F1,F2,F2,F5) digital durch mehrere parallelgeschaltete binärorientierte Kondensatoren (Fig. 4,5) abgestimmt werden, von denen jeder in Reihe mit einem elektronischen Schalter gelegt ist, der durch einen der Regelparameter gesteuert wird (Fig. 4,5).
    1 3006Λ/0774
DE19813114189 1980-06-04 1981-04-08 Phonemorientierter sprachgenerator in integrierter schaltung Withdrawn DE3114189A1 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US15648380A 1980-06-04 1980-06-04

Publications (1)

Publication Number Publication Date
DE3114189A1 true DE3114189A1 (de) 1982-01-28

Family

ID=22559768

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19813114189 Withdrawn DE3114189A1 (de) 1980-06-04 1981-04-08 Phonemorientierter sprachgenerator in integrierter schaltung

Country Status (8)

Country Link
JP (1) JPS5936276B2 (de)
BR (1) BR8103517A (de)
CA (1) CA1162650A (de)
DE (1) DE3114189A1 (de)
FR (1) FR2484117B1 (de)
GB (1) GB2077558B (de)
IT (1) IT1138314B (de)
MX (1) MX149882A (de)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3272234D1 (en) * 1982-01-29 1986-09-04 Ibm Audio response terminal for use with data processing systems
JPS61103715A (ja) * 1984-10-26 1986-05-22 Ube Ind Ltd 筒状ビレツトのスケ−ル除去方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE1524194B2 (de) * 1966-08-17 1971-03-18 Licentia Patent-Verwaltungs-Gmbh, 6000 Frankfurt Anordnung zur interpolatn einer bahnkurve
JPS5236406B2 (de) * 1972-01-17 1977-09-16
GB1449812A (en) * 1972-12-22 1976-09-15 Electronic Music Studios Londo Interpolators

Also Published As

Publication number Publication date
BR8103517A (pt) 1982-02-24
IT8121532A0 (it) 1981-05-06
JPS5726900A (en) 1982-02-13
GB2077558A (en) 1981-12-16
JPS5936276B2 (ja) 1984-09-03
GB2077558B (en) 1985-01-09
FR2484117B1 (fr) 1985-07-12
CA1162650A (en) 1984-02-21
MX149882A (es) 1984-01-25
FR2484117A1 (fr) 1981-12-11
IT1138314B (it) 1986-09-17

Similar Documents

Publication Publication Date Title
DE2115258C3 (de) Verfahren und Anordnung zur Sprachsynthese aus Darstellungen von individuell gesprochenen Wörtern
DE2613258C2 (de) Schaltungsanordnung zum Erkennen von einem oder mehreren Schlüsselworten in kontinuierlicher Sprache
DE2945413C1 (de) Verfahren und Vorrichtung zur Synthetisierung von Sprache
DE69831991T2 (de) Verfahren und Vorrichtung zur Sprachdetektion
DE3883034T2 (de) System zur Sprachsynthese.
DE3244476C2 (de)
DE69231266T2 (de) Verfahren und Gerät zur Manipulation der Dauer eines physikalischen Audiosignals und eine Darstellung eines solchen physikalischen Audiosignals enthaltendes Speichermedium
DE2840596A1 (de) Sprachsynthesizer
DE2850286A1 (de) Elektronische schlagwerksuhr
DE2300320A1 (de) Elektronische verstaerkeranordnung
DE2530380A1 (de) Sprachsynthetisatorsystem
DE60305716T2 (de) Verfahren zum synthetisieren eines nicht stimmhaften sprachsignals
DE2736082A1 (de) Elektronisches geraet zur phonetischen synthetisierung menschlicher sprache (sprach-synthesizer)
DE1965480C3 (de) Gerat zur Umwandlung eines in graphischen Zeichen gedruckten Textes in gesprochene Worte
DE2920298A1 (de) Binaere interpolatorschaltung fuer ein elektronisches musikinstrument
DE1811040C3 (de) Anordnung zum Synthetisieren von Sprachsignalen
DE4138016A1 (de) Einrichtung zur erzeugung einer ansageinformation
DE1937464B2 (de) Sprachanalysiergeraet
DE3114189A1 (de) Phonemorientierter sprachgenerator in integrierter schaltung
DE3246712C2 (de)
DE3236830C2 (de) Elektronische Uhr mit Schallspeicherung
DE4441906C2 (de) Anordnung und Verfahren für Sprachsynthese
DE2854601A1 (de) Ton-synthesizer und verfahren zur ton-aufbereitung
DE2051589A1 (de) Anordnung zur Synthese eines Signals
DE2238136C2 (de) Gesteuerter Signalprozessor für die Verarbeitung von elektrischen Signalen

Legal Events

Date Code Title Description
8141 Disposal/no request for examination