DE1547027A1 - Verfahren und Anordnung zur Analyse von Sprachsignalen - Google Patents

Verfahren und Anordnung zur Analyse von Sprachsignalen

Info

Publication number
DE1547027A1
DE1547027A1 DE1966J0029848 DEJ0029848A DE1547027A1 DE 1547027 A1 DE1547027 A1 DE 1547027A1 DE 1966J0029848 DE1966J0029848 DE 1966J0029848 DE J0029848 A DEJ0029848 A DE J0029848A DE 1547027 A1 DE1547027 A1 DE 1547027A1
Authority
DE
Germany
Prior art keywords
signals
formant
output
transistor
frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
DE1966J0029848
Other languages
English (en)
Other versions
DE1547027B2 (de
DE1547027C3 (de
Inventor
Clapper Genung Leland
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of DE1547027A1 publication Critical patent/DE1547027A1/de
Publication of DE1547027B2 publication Critical patent/DE1547027B2/de
Application granted granted Critical
Publication of DE1547027C3 publication Critical patent/DE1547027C3/de
Expired legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/21Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Use Of Switch Circuits For Exchanges And Methods Of Control Of Multiplex Exchanges (AREA)
  • Telephonic Communication Services (AREA)

Description

Patentanwalt Dipl. -Ing. H. E. Böhmer, Böblingen/Württ., Sindelfinger Str. Tel.: (07031) 6613040
An das
Deutsche Patentamt
8000 München 2
Zweibrückenstr. 12
Böblingen, 14. Jan. 1966 bi-sz
Anmelderin: International Business Machines Corporation,
• Armonk 10 504, N. Y. Amtl.Aktenz.: Neuanmeldung
Aktenz. d. Anm.: Docket 6604
Verfahren und Anordnung zur Analyse von Sprachsignalen
Die Erfindung betrifft ein Verfahren zur Analyse von in Form elektrischer Signale dargebotenen Sprachsignalen.
Bisher bekannte Spracherkennungsverfahren beschränken sich auf das Erkennen einer geringen Anzahl von Worten, meist Zahlworten· Beim Versuch, den Wortschatz des Erkennungsverfahrens zu vergrößern, wurden sehr hohe Aufwendungen an Schaltungen und Speicherplatz erforderlich. Trotz des Aufwandes waren die Verfahren auf Stimmen sehr verwandter Charakteristik beschränkt, wenn die Fehlerhäufigkeit nicht stark zunehmen sollte* Deshalb wurde auch der Versuch gemacht, die Erkennungseinrichtungen an den einzelnen Sprecher anpaßbar zu machen.
Aue der Erkenntnis, daß in den Sprachlauten die Energie an bestimmten verhältnismäßig wenig variablen Stellen konzentriert ist, welche Stellen al«
909845/0495 . ßAD original
Formanten bezeichnet werden, wurde schon frühzeitig die Zerlegung des zu analysierenden Frequenzspektrums in Frequenzbänder vorgenomment Es ist auch bekannt, das Auftreten von Formanten innerhalb der Frequenz* bänder festzustellen (DBP 1 156 996). ,
Während des Sprechvorganges verändern die Formanten teilweise ihre Lage und bewegen sich von einem Frequenzband zu einem anderen; teilweise verbleiben die Formanten jedoch auch in dem anfänglich eingenommenen Frequenzband. Die Bestimmung dieses Verhaltens der Formanten gibt nützliche Merkmale für die Sprachauswertung. Beim vorliegenden Verfahren werden diese Formanteigenschaften zu dem mit nur einem Bestimmungsmerkmal erfaßt.
Außerdem werden bei dem vorliegenden Verfahren aus den Formanten stimmhafte Laute und Reibelaute ermittelt und mit den vorgenannten Merk- ' malen kombiniert. Die gewonnenen Analysenergebnisse sind in codierter Form leicht darstellbar.
Gegenstand der Erfindung ist demnachj ein Verfahren zur Analyse von in Form elektrischer Signale dargebotenen Sprachsignalen, bei dem das Frequenzspektrum in mehrere Frequenzbänder zerlegt und das Auftreten von Formanten in den Frequenzbändern bestimmt wird, mit dem Merkmal, daß zur Vokalbestimmung für jedes Frequenzband der Übergang eines Formanten in ein benachbartes Frequenzband oder das Verbleiben des
909845/0495 · BAD
Formanten im anfänglich eingenommenen Frequenzband ermittelt und jeder solche Vorgang in Binärform gespeichert wird und daß zur Konsonantbestimmung für einige Frequenzbänder das Auftreten von stimmhaften Lauten und von Reibelauten ermittelt und mit daraus gebildeten Signalen eine Tfcordinate einer Matrix aus speichernden Elementen angesteuert wird» deren anderer Koordinate die Formanten aller Frequenzbänder darstellenden Signale zur Erzeugung eines Ausgangssignals zugeführt werden.
Die nachfolgende Beschreibung eines Ausführungsbeispiele wird durch Zeichnungen erläutert.
909845/0495 * BAD
Fig. 1 ist ein Blockschaltbild mit den hauptsächlichenxBestand* teilen der erfindungsgemäßen Anordnung;
Fig. 2a angeordnet nach Fig. 2 zeigen zusammen Einzelheiten der bis 2f, -
Anordnung;
Fig. 3 zeigt Einzelheiten des Vorverstärkers;
Fig. 4 zeigt Einzelheiten der automatischen Verstärkungsregelung;
Fig. 5 zeigt Einzelheiten des Steigungsanzeigers;
Fig. 6 zeigt Einzelheiten eines aktiven Bandfiltere;
Fig. 7 ist das Schaltbild eines Gleichrichters;
Fig. 8 zeigt Einzelheiten des Vergleichers;
Fig. θ zeigt Einzelheiten eines Und-Inverters;
Fig. 10 zeigt Einzelheiten eines Hochpasses;
Fig. 11 zeigt Einzelheiten einer an den Hochpass von Fig. angeschlossenen Integrierschaltung;
•Fig. 12 ist ein Bandpass;
'Fig. 13 zeigt eine an den Bandpass angeschlossene Integrierechaltung;
Fig. 14 zeigt Einzelheiten der Sprech-Steuerschaltung;
Fig. 15 ist ein Impulsformer;
BAD ORlGJNAL
909845/0495
Fig. 16a ist eine Differenzierschaltung; · .
Fig. 16b ist ein Zeitdiagramm zu Fig. 16a; Fig. 17 zeigt eine Verriegelungsschaltung; Fig. 18 zeigt Einzelheiten einer NOR-Schaltung zum Anschluß an Fig. 17.
i
Wie schon eingangs erwähnt, werden bei der vorliegenden Erfindung Formanten nicht in eine Matrix gespeist, deren Koordinaten durch Frequenz und Zeit gegeben sind. Dabei sind nämlich die Speicheranforderungen hoch; außerdem macht die Feststellung von Konsonanten Schwierigkeiten und ist u. U. ungenau.
Bei der vorliegenden Erfindung werden neue Maßnahmen für die Bestimmung der Konsonanten und einfachere Verfahren zur Bestimmung von Formantübergängen vorgeschlagen. Weiter werden Einrichtungen zur Bestimmung von Reibelauten und stimmhaften Lauten kombiniert jnit Formantbestimmungs-Einrichtungen, um Konsonanten festzustellen; es ergeben sich dabei verschlüsselte Lautmerkmale, die für die Erkennung aussagekräftiger sind. Es zeigte sich, daß die erfindungsgemäß· Anordnung weniger sprecherabhängig ist als die früher benutzten Anordnungen»
BAD 909845/0495
Allgemeine Beschreibung
In dem Übersichtsschaltbüd der Fig. 1 gelangen Sprachlaute oder Laute
innerhalb des Sprachspektrums zum Mikrophon 1, das sie in elektrische Sjnale verwandelt, welche vom Vorverstärker 2 verstärkt werden. Die Eingangsempfindlichkeit des Vorverstärkers kann bei 3 eingestellt werden. Der Vorverstärker 2 steht mit der automatischen Verstärkungsregelung 35 in Verbindung, welche das Ausgangssignal des Vorverstärkers auf einem konstanten Pegel hält. Dieses Ausgangssignal hat die Form einer komprimierten Umhüllenden des Sprachsignals; es gelangt über die Leitung 30 zum Frequenzanalysator FS, der mehrere Bandfilter enthält. Jedes der Bandfilter liegt zwischen 260 und 3750 Hz. Bei Auftragung in eine logarithmische Skala ist das Sprachspektrum zu der Frequenz von 1000 Hz symmetrisch aufgeteilt, Weiter ist im Frequenzanalysator ein als Reibelaut-Selektor wirkender Hochpass großer Bandbreite enthalten, der den Bereich von 4 000 bis 10 000 Hz überdeckt. Außerdem ist ein Bandpass für den Bereich von 100 bis 250 Hz enthalten. Der Frequenzbereich von 250 bis 3 750 Hz ist in 14 durch die Bandfilter bestimmten Bänder unterteilt. Mittels dieser Bandfilter können lokale Maxima (Formanten) mittels des angeschlossenen Formant-Beet immungs sy st en» FL erkannt werden; letzteres enthält Gleich-
8098A5/0495 . bad original
richter. Vergleicher, Und-Schaltungen und ImpuKormer.. Das Vorfinden dieser Formanten wird zur Formantüberwachungseinrichtung FTS gemeldet, in welcher der Obergang eines Formanten von einem Band zu einem anderen durch Differentiation und Vergleich ermittelt wird. In der Überwachungseinrichtung sind auch Speicher zum Festhalten dieser Vorgänge vorgesehen. Formanten, die ihre Lage nicht verändern, werden in der mit IFD bezeichneten Festformant-Überwachungse in richtung entdeckt und gespeichert.
Allgemein ausgedrückt können Formantübergänge folgendermaßen entstehen:
1. Ein lokales Maximum Mi, endet und das nächst niedere Frequenzband beginnt mit einem Übergang« Mj. Der Übergang von Mi nach Mj wird
. fallender Übergang genannt und mit MiF bezeichnet·
Dieser Übergang wird in einer entsprechend bezeichneten Verriegelungsschaltung (F) gespeichert.
2. Ein lokales Maximum,Mi, endet und das nächst höhere Frequenzband beginnt mit einem Übergang, Mh. Der Übergang von Mi nach Mh wird steigender
909845/0495 . bad
1*47027
Übergang genannt und mit MiR bezeichnet. Dieser · Übergang wird in einer mit H bezeichneten Verrie- " ■ gelungsschaltung gespeichert. . '
3.' Ein lokales Maximum« Mi, endet und es findet weder
zu dem nächst niedrigeren noch zu dem nächst höheren Band ein Übergang statt; in diesem Falle wird das Ιο-kale Maximum, Mi, als Feetformant mit MiS bezeichnet. Dieses lokale Maximum wird in einer mit S bezeichneten. Verriegelungsschaltung gespeichert.
Das Ende eines Formanten wird durch eine Vielzahl von Differenzierechaltungen DF (insgesamt 14) entdeckt, von denen eine für jedes Frequenzband des Spektrums vorgesehen ist. Ein zweiter Satz von (wiederum 14) mit D2F
I ·
bezeichneten Differenzierschaltungen dient zur Feetetdlung von Festformant en» Die Ausgangseignale dieser Differenzierschaltungen speisen die zugeordneten Verriegelungsschaltungen, die demnach fallende, steigende und unveränderliche Formantverhältnisse anzeigen, eine Anzeige für insgesamt 40 Vektorgrößen für im Sprachspektrum auftretende Vokale.
Die Erfindung sieht außerdem Einrichtungen zur Feststellung von Konsonanten
909845/0495
„ 1iS47027
im Sprachspektrum vor. Dazu werden die Reibelaute und stimmhafte Laut· darstellenden Energieanteile in die zugeordneten Frequenzanalysatoren eingegeben« deren Ausgänge über erste und zweite Integrierschaltungen geleitet werden. Der Reibelaut-Ausgang FO und der stimmhafte Ausgang
VO gelangen in die Schaltung für Reibelaute und stimmhafte Laute FVD,
Signale in denen mittels Invertern und Koinzidenzschaltunger/für die folgenden
Zustände erzeugt werden;
1. F . V Reibelaut ohne stimmhaften Laut
2. F . V stimmhafter Laut ohne Reibelaut
3. F . V gleichzeitig Reibelaut und stimmhafter Laut
4. F . V weder Reibelaut noch stimmhafter Laut
Dieie vier Bedingungen steilen die vier Hauptklantn von Konsonanten dar, nämlich: . . ·.
1. Reibelaute und Zischlaute f, s/(englieche·) eh, k, t (englisches) ch
2. Stimmhafte Laute oder Halbvokale w, b, g, b, 1, y
3. Stimmhafte Reibelaute v, d, (englisch) S, *h, j, dj
4. Stimmlose Hauchlaute h, weiche» k, p*
9098A5/ÖA95
Konsonanten sind weiter gekennzeichnet durch das Vorliegen öder Fehlen von Energiestößen, welche durch Überwachung der Steigung des Verstärkungsregelungs-Signals gefunden werden; letzteres wird über Leitung 37 dem Steigungsdetektor 145 (Fig. 1) zugeführt, dessen
Ausgangs signal über die Und-Schaltung 12Or und die Leitung 148 der Konsonanten-Matrix CMS zugeführt und dort gespeichert wird. Letztere vereinigt die Formantenergie aus dem Formantbestimmungssystem FL mit den 4 Bedingungen der Formantklassen und liefert im ganzen 15 Vektoren, welche die verschiedenen Konsonantenlaute des Sprachspektrume darstellen. Die Formanten gelangen über die Leitungen MIa bis Ml3a in den Formant-Geber FD, aus dem fünf Leitungen FDa bis FDe der Formantenergie entsprechende Signafe zur Konsonantenmatrix bringen. Die Energiespitze auf Leitung 148 wird in einer entsprechenden Verriegelungsschaltung ebenfalls gespeichert und liefert ein zusätzliches Merkmal für die Konsonanterkennung. Die erfindungsgemäße Einrichtung liefert also 56 Vektor größen, die allen Spracheigenheiten der zu erkennenden Sprachlaute wiedergeben.
Vor dem Eintritt in die Gesamtbeschreibung der erfindungsgemäßen Einrichtung erscheint e· zweckmäßig. Einzelheiten der Bausteine asu geben, die durchweg benutzt werden» Diese Bausteine sind im wesentlichen*
909845/0495 bad
der Vorverstärker,
die automatische.Verstärkungsregelung,
die Bandfilter, ■
der Hochpass,
der Bandpass,
die Integrierschaltungen des Hochpasses und des Bandpasses,
Gleichrichter, Vergleicher,
integrierende Impulsformer,
D if f e re nz ie rs chaltungen, Verriegelungsschaltungen, Sprech-Steuerechaltung und Verzögerungsschaltungen. Vorverstärker .
Die Aufgabe des Vorverstärkers 2 ist es, daß schwache Signale des Mikrophons 1 zu verstärken und zusammen mit der automatischen Verstärkungsregelung ein gleichförmiges Ausgangssignal zu liefern. Der Vorverstärker (Fig. 3) besteht im wesentlichen aus fünf PNP-Transistoren 5, 15, 20» 25, 29 in der angegebenen Schaltung. Die
809845/0495 .bad orig'NAl
ersten beiden Transistoren 5 und 15 dienen hauptsächlich zur Verstärkung· Mit dem Potentiometer 3 wird der Pegel voreingestellt. Das Ausgange· signal des zweiten Transistors 15 gelangt zum dritten Transistor 20, der , zusammen mit dem vierten Transistor 25 einen Spannungsverstärker mit Kompressionseingenschaften darstellt. Das Ausgangesignal des Transistor« 25 gelangt über den Kondensator 26 zum Transistor 29« der als Anpassungen verstärker auf die niederohmige Leitung 30 dient; letztere führt zu den Band* filtern FO bis F15. Der Ausgang des Transistors 25 wird außerdem fiber Leitung 51 der automatischen Verstärkungsregelung 35 zugeführt.
Automatische Verstärkungsregelung
Die automatische Verstärkungsregelung 35 der Fig. 4 liefert dem Vorverstärker 2 eine Regelspannung und gibt außerdem bei der Anzeigevorrichtung 36 ein optisches Signal sobald die Spannung einen vorgegebenen Pegel überschreitet. Die Regelspannung wird dem Transistor 50 zugeführt und ändert dessen wirksamen Widerstand; diese Änderung wird über die Leitung 51 zum Vorverstärker übertragen, wo sie (über die Leitung 28)der Basis des Transistors 29 sowie über den Kondensator 26 dem Kollektor 24 des Transistors 25 zugeführt wird.
i BAD ORIGINAL
9098A5/0U5
1S47O27
Der normale Arbeitsbereich der automatischen Verstärkungsregelung
Λ -
liegt zwischen + ö,4 V, ein Bereich, der durch das Potentiometer 3 des Vorverstärkers 2 eingestellt wird. Die Verstärkungsregelung ist wirksam bis + oder - 0, 5 V und der Schwellwert liegt bei + oder - . " o, 3 V. Wenn eine positive Spannung über O1 3 V auftritt, wird der Transistor 41 leitend; dadurch wird der Transistor 47 ebenfalls leitend und liefert ein Signal zu dem integrierenden Transistor 52. Wenn andererseits das Eingangssignal - 0, 3 V überschreitet, wird der Transistor 44 leitend und speist den integrierenden Transistor 52. Der Ausgang des, Transistors 52 verändert dabei die Impedanz des Transistors 50, der (wie gesagt) den Vorverstärker beeinflußt. Das Ausgangssignal dea Transistors 52 gelangt über Leitung 37 außerdem zum Steigungsanzeiger 145. .
Bandfilter'
Jede der 14 Schaltungen 80 (Fig, 6) hat eine sehr scharfe Bandfilter· Eigenschaft für einen der nachfolgend aufgeführten Frequenzbereiches
Filter Mittelfrequenz " Bandbreite (Hz)
Fl 3400 3120 - 3750
F2 2840 35Ö0 - 3120
9098*5/0495 . ' bad
IS47027
Filter Mittelfrequenz Bandbreite (Hz)
F3 2340 2140 - 2590
F4 1940 1765 - 2140
F5 1590 1458 - 1765
F6 1325 1192 - 1458
; F7 1060 970 - 1192
F8 880 800 - 970
F9 720 655 - 800
FlO 590 535 - 655
FIl 480 444 - 535
F12 408 375 - 444
F13 340
1
312 - 375
FU 284
H* at α Vit ana Aon Tfanolotn«·!
260 - 312
»η Α9 iinr? 2ß rl ie al« Γ
tialverstärker arbeite feinem Zwillings-T-Filter und einem als Ausgangsverstärker wirkenden Transistor 94, Ein Betrieb speist der Vorverstärker 2 über den Regler 82 den Transistor 83. Der Auegang de· letzteren wird vom Transistor 94 verstärkt« dessen Ausgangssignal Ober das Zwillings-T»Filter 88 zum Transistor 86 gelangt» Für all· Frequenzen mit Ausnahm» der Frequenzen des gewünschten Bereiche
ORIGINAL
909845/0495
sind die Eingangseignale für die Transistoren 83 und 36 also praktisch gleich, so daß dafür ein relativ niedriges Auegangssignal besteht. Bei der gewünschten Frequenz läßt das Filter 88 nur ein sehr kleines Signal passieren, so daß das Ausgangssignal des Verstärkers einen Höchstwert hat. Dieses Signal liegt auf Leitung 95 an und wird über den Kondensator 96 und Leitung 97 zum Formantbestimmungs-System weitergegeben.
Hochpass
Der in Fig. 10 dargestellte Hochpass 60 entnimmt dem Sprachsignal auf Leitung 30 hochfrequente Rauschspannungen. Der Hochpass besteht im wesentlichen aus einem Regler 61, einem Transistortreiber 62 und einem Differenzialverstärker aus den Transistoren 65 und 66 sowie einem Verzögerungsnetzwerk 67 aus einer Induktivität 67a und einer Kapazität 67b. Das Ausgangssignal des Differenzialverstärker enthält Rauschsignale oberhalb 4 000 Hz.
Integrierschaltung
Der Ausgang des Hochpasses gelangt über einen Kundensator 69 zur Integrierschaltung 70 der Fig. 11. Sie enthält eine Eingangs-Schwell-
• BAD
909845/0495
wertschaltung, so daß Rauschen nur bei Überschreiten eines Mindestwertes dem Transistor 72 zugeführt wird. Das Aus gange signal des Transistors gelangt zur Integrierschaltung 73 aus der Diode 74 und dem Kondensator 75. Das teilweise integrierte Signal gelangt dann zur ünd-Schaltung 12Qo.
J'jer Biac:-;\iS ■ ■; ■■'■"■'Lg, Ii) ist em Broitbanaiilter, das Frequenzen unterhalb IQt) J.r:··. &%τ?;ζηΑάζΏ, soll» um den Netzbrumm zu eliminieren. O&r Bandt- -:r. iver^-sc-ii de;: Sprachbereich von 100 bis 250 Hz und erfaßt Q,'i?.i;L- -.:-;: ·:-;γ: .;λ ;·«& Laittc: für Männer-und Frauenstimmen. Der Band- £~j.cc' L/. :[Ij ~$}:-:/i^-v?c?-;iilnqßf z, B1 iJnterbrechungen, bei denen die Lip-« ■ν. ■"-." -" ";."?':Π:-:'~".-.'-.ΐ;:;ί "-:>>va<?nt er-hr smpfirdlbh» Der Bandpass (Fig. 12) ■:;-U^7- '-?.i. ''/'-!e.-'"^:-;?-I^iB-.i-^'^-trw.r-.rk H^ das η:Ιί dem als Ernitiprverstärker ^:v\-r-:- ;-.- . 'Γγ;.:;; .1: :.c-- ."£. v-.-.:tr,::-iä.; isi« Dae A'asgangseigual dee Transistore öii sp2:;;v ü.-a 'Ϊ2ϊ;.:;·2Ϊ3ίοΐ£ 56# üvSrsan 'Basis göt-rdet ist und dt? als SpamiUKgs^ verstärk-sr .irbil'Lü v"A ΐΐίΐο teschnivia^e Sln^=r-]a'.rva liefert, Bie&en /\u&- gangssignal Vfivx -'i©r Intsgrierschaltung ?0a über den Kondensator 5? zu« geführte Dis In^g^isysohaltung 10a der Fig* 13 besteht im wesentlichen aus siiieri Integrier^ndeti Netzwerk mit dem Transistor 58, der ein Gleich* oii»=/.yepngs3i3^al mit ger.ü?.g3js? B&uschaKteil abgibt.
BAD ORIGINAL
:Λ fi I
Gleichrichter, Vergleicher s
Die Formantlokalisierung macht wesentlichen Gebrauch von den drei Bausteinen: Gleichrichter 100, Vergleicher 110, negative Und-Schaltung 120. Der. Gleichrichter 100 formt den Ausgang des Bandfilters in einen Gleichstrompegel um, der proportional zum Spitze-Spitze-Wert des Bandfilterausgangs ist.
Der in Fig. 7 dargestellte Gleichrichter 100 enthält einen Begrenzungswiderstand 102, eine Diode 10 3 und den als Emitterverstärker gesc haltete NPN-Transistor 104, an dessen Ausgangsklemme ein Begrenzungswiderstand 106 und ein Siebkondensator 107 liegen. Die Diode 103 und der Transistor 104 wirken zusammen als ein Frequenzverdoppler, mit dessen Hilfe der Kondensator 107 auf den vollen Spitze-Spitze-Wert des Eingangs signals aufgeladen wird. ·
Der in Fig. 8 dargestellte Vergleicher 110 enthält die Transistoren 112 und 115, deren Emitter beide an den Transistor 117 angeschlossen sind. Letztere dient zur Begrenzung des Gesamtstromes durch die beiden erstgenannten Transistoren*
BAD ORIGINAL 909845/0495
U*
Die Arbeitsweise ist etwa folgende: Der Ausgang dee Gleichrichte re R2 erscheine auf Leitung 108 und gelange zu demTransistor 112 des Vergleichers Nr. 2; der Ausgang des Gleichrichters R 3 gelange auf Leitung 108a zum Transistor 115. We.nn die beiden zugeführten Signale gleich sind, und wenn der Transistor 117 den Gesamtstrom durch die beiden Transistoren 112 und 115 auf 4mA begrenzt, fließt durch beide Transistoren 112 und 115 ein gleicher Strom von je 2mA. An jedem der beiden Widerstände 113 und 114 {vom Werte 2k Ohm) entsteht ein Spannungsabfall von 4 V; die Ausgangsklemmen liegen also um + 2 V über dem Missepotential. Dies ist die hohe Lage. Eine Arbeitslage entsteht, wenn die beiden Eingangs signale auf den Leitungen 108 und 108a voneinander abweichen. Der Transistor 112 möge ein höheres Eingangssignal erhalten als der Transistor 115. Der Transistor 112 wird dann praktisch den Gesamtstrom des Transistors 117 von 4mA an sich ziehen. Der Spannungsabfall über dem Widerstand 113 erreicht dann den Wert 8 V und die Ausgangsklemme hat eia Potential vor; *2 V gegen Maase. Ein® umgekehrte Verlagerung das Stromes tritt ein, wenn die Leitung 108a das höhere Signal führt.
Der Arbeitszustand des Yergleichers zeigt also die Ungleichheit eines Paares von Gleichrichteraus gangen an. Der Vergleicher Nr.· 2 kann also anzeigen, daß das Ausgangssignal des Gleichrichters Nr. 2 grcßer
. BAD ORiGiNAU
909845/0495
154702
oder kleiner ist als das Ausgangssignal des Gleichrichters Nr. 3.
Die invertierenden Und-Schaltungen 120 dienen zur Bestimmung zweier Ungleichheiten, die ein lokales Maximum anzeigen. Die Ausgänge benachbarter Paa.re von Vergleichern, z. B. der Vergleicher Nr. 2 und 3 wer» den an die negative Und-schaltung Nr. 3 angeschlossen, die auf ihrer Ausgangsleitung ein lokales Maximum bildet als Anzeige dafür, daE das Aurs gangs signal des Gleichrichters Nr1. 3 größer ist als das der Gl'-vlti« richtür Nr. 2 oder Ni% 4.r Ks werden a].eo tut: Vv-rgteichsraüßgling·? :' c.-. -s 2 Ausgänge von jedem der Verglcicnvr ! bis H) aa di'2 Urid«Scha3.t'ai?;V-in IZ angelegt.
Wie aus Fig. 2a .ersichtlich ii>t4 i'üiiren die Ansgangskleniaisn der Yer- * gleicher 110 zu den Und-SchaXturgen 120» Die Ausgangsklemmen zum Beispiel des Vergleichers Nr. 2 führen zu den Und-Schalfcungen. Nr. 2 und 3. Die Aufgabe der Und-Schaltunger* ist es,, die Koinzidenz der negativen Ar« beJtssignale ans den Y er gleicher η
Eine negative Unä-Schaltung 120 is. auch Fig. Sj enthält drei Eingasgsdioden 121, 122 und 328; einen Widerstand 123 und einen Transistor 124. Wenn beim Betrieb beide Eingangs signale die Arbeitsstellung einge-
BAD ORIGINAL
909845/0435
to
nommen haben (d. h. die Außgangssignale der Vergleicher sind negativ gegenüber Masse) und an der Diode 326 ein Signal anliegt, darm sind alle drei Dioden. 121, 122 und 326 in Sperr-Richtung vorgespannt, so daß durch den Transistor 224 vorn Emitter 124a über die Basis und den Widerstand 12S zuc Klemme - 12 V ein Strom fließt. Dieser Strom hat einen Strom cfcreh den Transistor vom Emitter zum Kollelttor 124b und den Wic9r£.,?.nd 125 aar Klemme - 12 V zur Folge. Die Kollektor· spannung ηΐκϋϊ,'; dadurch praktisch Massepotential an und liefert auf Leitung 126 ein Ausgangs signal, das Bin lokales Maximum anzeigt.
Wt--■■·:·. υ;Γ\γ5ϊπ ^r Anwesenheit eines Signals rar Diode 326 an einer de:· :' :r-ν-^,ίί!: ^:e,n 131. oder 122 fciß poaiüvss Signal anliegt, nimmt Ul. "■·■ '.si-.- άΒΊ T::i?i*::£torc 134 *.?Jn Potential tibsr Masse-iOtential an, dr"; '"ran,jimor \d<cü ϊύ€ΐΛ leitend und um Ausgangslejtung teilt das Pc;enüaj der ICL'iinms - 12 V. Die Aus gangs signale der negativen UiKv<Seh:iltwngö3 1 Με 14 werden dsn (integrierenden) Impulsformern ISO i^^geiülir^ 7.'31^h? a^s den lckalen Maxima, darstellender» Signalen
C>: Λ i;
ORIGINAL
zugeführten Signalen zu beseitigen und ßin integriertes und geformte» Signal zu bilden. Die Schaltung, s. Fig. 15a, enthält die Transistoren . 134 und 138 und ein integrierendes Netzwerk 131 am Eingang des Transistors 134; weiter ist ein Rückkopplungspfad 137 vom Ausgang des Transistors 136 zum Eingang des Transistors 134 vorgesehen. Letzteres hat Hyßtereseeigenschaiten.
Die Hysteresewirkung, die mit Fig. 15b graphisch dargestellt ist, kann folgendermaßen beschrieben werden: ein stetig anwachsendes Gleichstromsignal am Eingang des Impulsformers folgt der Hystereseschleife vom Punkt A an auf dem langsam ansteigenden Ast zum Punkt B, wenn sich die Spannung von - 12 V zu etwa - 4 V verändert. Bei einem Spannungswert knapp über - 4 V steigt die Kollektorspannung des Transistors 135 scharf vom Punkt B zum Punkt C und eine geringe Änderung der Spannung am Punkt C kann die Ausgangsspannung am Kollektor von 136 nicht mehr beeinflussen. Um das Ausgangs signal abzuschalten, muß die Eingangsspannung auf einen Wert von etwa - 8 V verringert werden; dann fällt die Ausgangsspannung scharf vom Punkt D zum Punkt E der Hystereseschleife.
Für Wechselstromeingangsignale tritt" wegen der Wirkung des Eingangs-Widerstandes und des Eingangskondensators zwischen Basis und Kollektor
9Q9845/CU95 < bad original
des Transistors 134. eine Integration auf. Dadurch werden Wechselstrom« Eingangs signale in ein Gleichstromsignal umgewandelt, für welche die soeben beschriebene Hysteresewirkung .eintritt.
Die impulsformende Eigenschaft der Schaltung wird von dem Rückkopplungspfad 137 zwischen dem Kollektor des Transistors 136 und der Basis des Transistors 134 hervorgerufen. Wenn das Eingangssignal auf - 4 V ansteigt, wird der Transistor 134 leitend, s ο daß seine Kollektorspannung auf einen Wert unter Masspotential fällt. Daraufhin wird der Transistor 136 leitend, sein Kollektorpotential steigt, dieser Anstieg wird über den Rückkopplungspfad 137 weitergeleitet und erhöht die Leitfähigkeit des Transistors 134. Es ergibt sich daraus ein rascher Anstieg der Vorderkante des Ausgangssignals auf der leitung M(FIg. 1: Ausgang von FL; Fig. 2a: rechte Seite). Wenn das Eingangssignal auf einen Wert von etwa - 8 V fällt, sperrt der Transistor 134, seine Kollektor spannung steigt und sperrt damit die Leitfähigkeit des Transistors 136- Der Spannungsabfall dgs Kollektors von 13*3 wird übet :■ 37 räckgtikopF^lt und besclileunigt die Abschaltung des Transistors i34. £adurcii vird auch ein rascher Abfall des Ausgangs signals bewirkt. Das Ausgangssignal des Impulsformers ist somit eine Rechteckkurve mit scharfem Ansttg und Abfall.
909845/0495
Differenzierschaltungen
Die Differenzierschaltungeii DF Hind DJF sind gleichartig; sie unterschei-. den sich nur in der die Länge des abgehenden impulses festlegenden Zelt* konstanten. In den Fig. 2 sind diese Integrierechaltungen mit DFi bis DF14 und mit D„F1 bis I>„F14 bezeichnet. Die Differenzierschaltung 330 der Fig. 16a enthält eine eingangsseitige Differenzierschaltung mit einer vorgespannten Trenndiode 332a, welche die Einwirkung voL· Nadelimpulsen TrntGrdrückt* Zwe; Transistoren 335 und 338 bilden efeiie' monostab il<m Impulsgenerator,, d&^o^?;:. Aiwganf«si?p5l-Paiier eine Ptiafction des Produktes HC dt ε Zeitkicwes S4Q *3*e ',vciahör aüt des. Transistors S38 verbunden i&U &ie ^elibEs^iianifeiitie 340a ist von der AttsgangsieitWHg durcii die Diode 341 getrennt. Das Signal an der Ausgangüleitung feaa infolgedessen am Ende eine« erzeugten Impulses scharf abfallen; es entstehen dadurch günstige Verhältnisse für die folgende Impulsformerstufe D^F. Letztere arbeitet ebenso wie die gerade beschriebene, nur ist ihre Impulsdauer !deiner.
Beim Betrieb ist dar1 Transistor 33£ Erfolgs ues wii - S V über des Widerstand SiGc (vom W<srv lö leg Gkitf: auf der Basieemittersfrecfce fließenden Stromes leitend* De? KuHefctor des Traasistors 3SS ist f dabei nah dem Hizlipotentl^l, Der Traaaistei? SS5 ist infolgeclessen gesperrt, da cfer Siroxa cii^eL ^?d cu -Ιϊγ Esslg ":\::1ϊ SSS -m,
BADORIQINAL
nach + 6 V führenden Spannungsteiler die Basis von 335 auf etwa + 0, 9 V hält. Die Diode 332a, die einerseits an der Basis von 335 liegt, wird andererseits durch e inen Spannungsteiler auf + 3 V gehalten. Die Diode ist also mit wenigstens. 2 V in Sperr-Richtung vorgespannt. Ein vorübergehendes Eingangssignal von weniger als 2 V kann also auf die Leitfähigkeit der Diode keinen Einfluß ausüben und nur eine Spannung von wenigstens 3 V kann den Transistor leitfähig machen. In praxi wird ein Eingangssignal zwischen 9 und 12 V zum Einschalten des Transistors 335 vorgesehen. Bei einem solchen (negativen) Eingangssignal an die Differenzierschaltung wird der Transistor 335 leitend und an seinem Kollektor erscheint ein positives Signal von - 12 V. Dieses wird von der Diode 341 an die negative Seite des zeitbestimmenden Kondensators 340a (ca. 3, 3,Uf) gelegt und gelangt damit an die Basis des Transistors 330. Der Kollektorstrom dieses Transistor« wird dadurch rasch unterbrochen, die Kollektorepftnnung fällt scharf ab und unterstützt die Leitfähigkeit des Transistors 335 solange als der Transistor 338 gesperrt ist. Kondensator 340a und Widerstand 340 c bestimmen also die Dauer des Ausgangsimpulses. Nach etwa 35ms fällt die Basis des Transistors 338 etwa auf Massepotential und der Transistor v/ird leitend. Der Anstieg der Kollektor* tpannung spsrrt den Transistor 335, dessen Kollektorspannung zu Beendigung des Ausgangsimpulses scharf abfällt. Die Diode 341 entkoppelt jetzt den Zeitkreis und der Zeitkondensator kann sich über
909845/0495 · 8AD
IS47027
-■weif
den Widerstand 340 b auf - 12 V aufladen. Das negative Ausgangssignal der Differenzierschaltung DF (Fig. 2b) läßt die Differenzierschaltung D»F einen Impuls von 5 ms Dauer abgeben. Auf einen 35 ms - Impuls von DF folgt also ein 5 ms-Impuls von D2F. Die Differenzierechaliungen DFl bis DF14 dienen zur Aussendung von 35 ms-Impulsen, sobald das Ende eines lokalen Maximums in einem Frequenzband festgestellt wird. Das Ende dieses 35 ms-Impulses wird von den Differenzierschaltungen D0Fl bis DOF14 abgefühlt und jede sendet daraufhin einen 5 ms-Impuls aus.
Nor-Schaltung
Wie schon früher festgestellt wurde, werden die Speicherverriegelungen für die Übergänge eingestellt bei Koinzidenz eines Impulses DF (Anzeige für das Ende eines lokalen Maximums) und eines Impulses, der ein benachbartes lokales Maximum anzeigt. Die Einschaltung einer solchen Verriegelungsschaltung verhindert die Einschalung der zugeordneten Festformant-Verriegelungen. Diese Sperrwirkung wird von der Nor-Schaltung nach Fig. 18 bewirkt und zwar in der Zeit von 60 ms nach dem Einstellen einer Übergangs-Verriegelung. ·
BAD ORIGINAL 909845/0495
Die Schaltung der Fig. 18 enthält einen Transistor 261, der infolge des Stromes in der Basis-Emitterstrecke normalerweise leitend ist. Der Basisstrom fließt von Masse kommend über einen Spannungsteiler aus den Widerständen 362 und 363 nachN- 12 V. Der KoHektorstrom fließt durch einen Widerstand 3S4 (ein k Ohm) zur selben Spannungsklemme. Der Kollektor ist dadurch nah Massepotential gehalten; an ihn ist die Leitung 351 angeschlossen, die zu der später noch zu beschreibenden Festwert-Verriegelung führt. Die Eingangskapazität 360d der Schaltung ist auf etwa 10 V aufgeladen (positive Seite bei - 2 V1 negative Seite bei - 12 V). Wenn eine der Dioden 360a oder 360b infolge des Einschal tens einer'Übergangs-Verriegelung eine Erhöhung ihres Eingangspotentials erfährt, geht die niedrige Seite des Kondensators 36Od gegen 0 V. Dadurch verändert sich das Potential des Punktes e von - 2 V auf etwa + 12 V und sperrt den Transistor; darauf fällt die Spannung auf der Ausgangsleitung 351 auf - 12 V. Der Kondensator 360 d entlädt sich nun und die Basisspannung des Transistors nähert sich dem Massepotential/ür das die Leitfähigkeit des Transistors wieder einsetzt. Dieser Vorgang dauert etwa 60 ms und genügt, um die Einstellung der Festformanten-Verriegelungen durch anen Impuls von D3F zu verhindern.
Steigungsanzeiger
Der Steigungsanzeiger 145 nach Fig. 5 untersucht die Kurvenform der
9G9845/04S5
t*
automatischen Verstärkungsregelung nach dem Auftraten scharfer Übergänge, die auf rasche Änderungsvorgänge im Sprachsignal hinweisen. Das Eingangssignal auf Leitung 37 gelangt zunächst zu einem Eingangsnetzwerk 146. Der Transistor 154 leitet in Abhängigkeit von der negativen Steigung des Signals auf Leitung 37. Wenn die Steigung einen bestimmten Wert erreicht, ist der Strom ausreichend, um den Transistor 160 leitfähig zu machen. Letzterer liefert danr über den Kondensator 155 einen positiven Impuls zur Basis des Transistors 145; die Folge ist eine Impulsformung. Der gleiche Impuls gelangt über den Widerstand 184 jsur Basis des Transistors 1G5. Die Ausgangsklemme dieses Transistors ist normalerweise bei + GV. Rasche Lautänderungen wirken sich in einer Spannungsänderung auf - 6 V einer Ausgangsklemme aus. Dieses Signal gelangt über die Und-Schaltung 120 r zu einer die Lautändenmg anzeigenden Verriegelung (Fig. 2f),
Verriegelung
Die Speicherung des Auftretens von Formanten und Anzeigefunktionen werden durch Verriegelungen bewirkt, von denen in Fig. 17 eine typische Ausführangsforra wiedergegeben ist* Die Verriegelungsschaltung muß vor Beginn einer Operation zurückgestellt werden. Dabei werden beide Transistoren 353 und 356 gesperrt. Die Basis des Transistors 353 wird durch
BAD ORIGINAL
tS47027 to
die Ausgangsklemme, den Kolloktor, des Transistors 356 bei - 6 V gehalten. Letzterer wird über Leitung 354, angeschlossen an den Kollektor des Transistors 353 bei beinahe + 6 V gehalten. Solange beide Eingangsklemmen 351a und 351b bei etwa - 12 V sind, liegt die Basis des Transistors 353 ebenfalls bei diesem Wert. Hat ein Eingangssignal den Wert - 12 V und das andere Massepotential bleibt die Verriegelung ausgeschaltet. Der äquivalente Widerstand am Eingang ist nämlich 5k Ohm an - 6 V und es entsteht ein effektiver Abfall von 2 V unter die Eingangsspannung von - 6 V, da ein Wert von 10 k Ohm des Widerstands 352a in der mit - 12 V verbundenen Ausgangsleitung 352 den Stromfluß auf etwa 0, 4 mA im äquivalenten Eingangswiderstand von 5 k Ohm begrenzt.
Wenn beide Eingangsklemmen auf etwa Magsepotential (0 V) gebracht werden, entsteht ein Basisstrom im Transistor 353 und schaltet diesen ein. Die Kollektor spannung fällt und schaltet den Transistor 356 ein, dessen Kollektorspannung sich gegen Massepotential erhöht und die Anzeigelampe 358 zum Leuchten bringt. Der Widerstand 352a von 10 k Ohm vom Ausgang zur Basis des Transistors 353 liefert nun genug Basisstrom um diesen Transistor eingeschaltet 2.u halten, auch wenn beide Eingangsklemmen wieder auf - 12 V gehen. Die Trenndiode 351 d ist dabei in Sperr-Hichtung vorgespannt, so daß kein Basisstrom aus demTransistor 353 fließen kann. Die Verriegelung bleibt also eingeschaltet.
9098^6/0495
BAD ORIGINAL
1S47O27
Wenn die Rückstelltaste R (Fig. 2f) betätigt wird, gelangt ein von 0 bis. - 12 V gehender Rückstellimpuls zum Emitter des Transistors 356, schaltet den letzteren aus, bringt die Lampe zum Erlöschen und verursacht auch die Sperrung des Transistors 353. Die Basis des Transistor* 356 geht dann auf + 6 V, so daß der Transistor ausgeschaltet bleibt, auch wenn die gemeinsame Rucks teil-Leitung zu 0 V zurückkehrt. In die Rückstell-Leitung kann eine Verzögernngseinrichtung eingeschaltet sein (s. Fig. 2 f), um die Rückstellung sicherzustellen, auch wenn zum Zeitpunkt der Betätigung der Rückstelltaste Signale anliegen. Die Verriege* lungen sind in den Blöcken FTS und IFD enthalten und dienen zur Speicherung "fallender" (F) und "steigender" (R) FormantÜbergänge sowie von Festformanten. Die Verriegelungen finden auch zur Speicherung von Vektorkennungen für Konsonanten des Sprachspektrums in der Konsonantmatrix CMS Verwendung.
Sprech-Steuerschaltung
Die Sprech-Steuerschaltung 303 nach Fig. 14 wird beim Betätigen der Sprechtaste PT erregt, wenn ein Wort zur Erkennung in das Mikrophon 1 • gesprochen wird. Der Ausgang dieser Schaltung erregt die Torleitung 325, die mit allen Und-Schaltungen 120 des Systems verbunden ist und die es dadurch ermöglicht, alle erkannten FormanUn einachlieolich der stimmhaften und Reibelaute in die Formantüberwachungseinrichtung und die Konsonantenmatrix einzugeben. Kein Sprachereignis wird aur Erkennung
gespeichert, wenn nicht diese Schaltung eingeschaltet ist. '■
' ■ 9098A5/Q49S bad original
Die Sprech-Steuerschaltung nach Flg. 14 1st eine bistabile Schaltung; sie enthält vier Transistoren 208 , 312, J14 und 220 sowie einen zeitbestimmenden Kondensator 306", welcher mit der die Basis des Transistors 208 speisenden Eingangsschaltung verbunden 1st. Öle Ein- und Ausschaltung erfolgt über die Sprachtaste PT, di« swsi Ruhekontakte a.und b ent* ■ hält. Mit dem Einschaltkreis ist eine Verzögerungseinrichtung 200 zum Sohutz gegen Kontakprellen verbunden.
Wenn die Taste In der Rinelage 1st, führt der Transistor 208 kelnfti Strom und der Kondensator 206 (von 5 /Uf) 1st voll^eladen. Der Transistor 214 1st ebenfalls gesperrt und zwar über die negative Vorspannung über den Kontakt b der
202
Taste, die Leitung/und die Diode 215; die Basis des Transistors wird bei minus 12 Volt gehalten· Die Transistoren 212 und 220 sind leitend, da ihre Basi«anschlüsse an die Kollektoren der Transistoren 208 bzw. 214 angeschlossen sind* Die Ausgangsklemme der Schaltung (Leitung 225) Hegt also nahe plus β Volt, dem wAus"-Potential der von ihr gesteuerten NAND-Schaltungen.
Bei Betätigung der Taste FT beginnt sich der Kondensator 206 über den Widerstand 204 von 10 k. Ohio nach Erd zu entladen. Die Blookiersohaltung zur Basis des Transistors wird aubh geöfftieti der Transistor 21^ bleibt Jedoch gesperrt solange der Transistor 212 leitet. Nach einem Zelt raum von 50 ms wird der Transistor 208 leitend und sperrt
909845/0495 bad original
1&47027
den Transistor 212 dessen Kollektoreparmu'?5;; steigt und dadurch den Transistor 314 leitend machts Die Anzeigelampe 316 leuchtet nun und der Translator 520 wird gesperrt« Die Ausgangsleitung 525 fällt nun auf den "EIN"-Pegel von · etwa minus 6 Volt. Alle mit dieser Leitung verbundenen negativen Und-Schaltungen sind nun vorbereitet. Am Ende des gesprochenen Wortes nach dem Loala»en der Taste wird die Basis des Transistors J5l4 wieder bei minus 12 Volt festgehalten« so daß der Transistor 220 leitfähig wird und die Außgangsleltung JJ25 auf etwa plus 6 Volt ansteigt* Dadurch werden alle NAND-Schaltungen gesperrt« DEr Kondensator 306 lädt sich Über den 100 Ohm Widerstand wieder auf n?inus 12 Volt auf.
Di« unten in Figo 2 f gezeigte Verzögerungeschaltung bewirkt eine Verzögerung von einer Sekunde Dauer für die Rückstellung der Verriegelungsschaltungen·
Durch Betätigen der In Fig. 2o enthaltenen Sprachfcaste PT wird die Spreoh-Steuerachaltung 20,5 eingesohaifcefci si« liefert Über die Leitungen j}2£ an alle Und-Schaltungen 120a bis JLSOn (Fi«. 2a), an di· Und-Soh*ltun«<m 120o, 180p und (Pig· 2c).Vorbereitungssignale. Sobald das Mikrophon 1
3098^5/0435
BAD ORIGINAL
von akuatiaehen Signalen (β. ö. der Stimme der Bedienung·- person) getroffen wird, erhält der Vorverstärker 2 Eingangesignale und liefert eine komprimierte umhüllende derselben (eine Folge der automatischen Verstärkungsregelung 25) mit konstantem Pegel. Dieses Signal wird den Bandfiltern FS zugeführt, die in Fig. 2a mit 80 bezeichnet sind. Diese 14 Bandfilter sind alle auf bestimmte Frequenzen im Bereich zwischen 260 und JJ 750 Hz abgestimmt. Das gleiche Signal wird auch nooh dem Hochpaß 60 und dem Bandpaß 59 der Fig« 2c zugeführt, welch letztere invertierte und integrierte Signale abgeben, wenn im Lautspektrum Reibelaute und stimm- * harte Laute enthalten sind. Die Ausgänge der Bandfilter gehen auf Leitungen 95 zum Formant-Bestimmungseystena FL (Fig. 2a).
Das Formant-Bestimmungssystem enthält drei wesentliche Einheiten: die Gleichrichter 100, dia Vergleicher 110 und die Und-Sohaltungen 120. Beim Vorliegen von Formanten, d. h. von"Energiespitzen in bestimmten Frequenzbändern erhalten die Vergleioher 110, im Beispiel IjJ an der Zahl, Eingangssignale. Es werde der Vergleicher BD2 betrachtet. Die obere Ausgangsleitung dieses Vergleichers mit dem Bezugszeichen Rß^ R2 liefert ein negatives Signal, wenn der Betrag R2 (der Ausgang vom Gleichrichter 2) größer ist als RjS (der Ausgang vom Gleichrichter j5). Wenn umgekehrt der Betrag
909845/0495
größer ist als R2 so liefert die untere mit Rj5>"R2 bezeichnete Leitung ein negatives Signal. Waren die Eingänge zu dem Vergleicher BD2 von gleioher Größe, dann erscheint auf keiner der beiden Ausgingsleltungen ein Signal. Sobald irgendwo ein lokales Maximum vorliegt, zeigen zwei Ausgangsleitungen eine Koinzidenz negativer Signale, durch welche die zugeordnete Und-Schaltung, 12Oa bis 12On, zur Abgabe eines Ausgangssignals an die Nachgeordnete Impulsformersohaltung IJO veranlaßt wird, von denen 14 vorgesehen und mit IPS1 bis 1PS14 bezeichnet sind. Die Impulsformer sollen unerwünschte Ausgleichsvorgänge in den Formantien darsteilenden Signalen beseitigen.
Am Ausgang der verschiedenen Impulsformer enthalten die Formantsignale sowohl Vokal- als auch Konsonantenbestandteile. Nachfolgend wird zu erläutern sein» wie au· den fallenden und steigenden übergängen und aus Festwertenteilen Vokalcharakteristiken entnommen werden.
Die Bestimmung der steigenden und fallender* übergänge geschieht mittels der Differentialschaltungen DPI bis DF14 , in Verbindung mit den "steigenden und fallenden" Verriegelungen 1F, 1Rj 2F, }R; usw. der Figuren 2b und 2d. Die F'estformanten werden mittels der Differentialschaltungen i>2.F.1 . bis DgFi4 in Verbindung mit den NOR-Schaltungen 36O
" BAD ORHa1NAL 909845/0495
und den Festwert-Verriegelungen 350 (ebenfalls in Figuren 2b und 2d) ermittelt.
Die Bestimmung eines fallenden oder steigenden Übergangs kann am leichtesten beschrieben werden an der Wirkung eines Frequenzbandes, das oberhalb >der unterhalb eines gegebenen Bandes liegt. Ein steigender übergang kann definiert werden als eine Signaländerung in einem Frequenzband, das unmittelbar über einem gegebenen Frequenzband liegt, in welchem ein Formantsignal endet. Umgekehrt kann ein fallender übergang definiert werden als eine Signaländerung in einem Frequenzband unmittelbar unterhalb eines gegebenen Frequenzbandes, in welchem ein Formantsignal endete.
Zum Zweck der Erläuterung werde angenommen, daß auf der Ausgangsleitung M2 des Impulsformer IPS2 (Fig. 2a) ein lokales Maxlmum(d.h. ein Formant) endet, welches zu der gegebenen Frequenz des Bandfilters F2 gehört. Die Leitung M2 führt zum oberen Eingang der Verriegelung J5R und über die Zweigleitung M2' zum unteren Eingang der Verriegelung IF; außerdem ist noch der Block DF2 angeschlossen. Weiter werde angenommen, daß auf der Leitung M1 ein steigender Übergang vorliegt zur gleichen Zeit, wo das lokale Maximum auf der Leitung M2 endet. Dann folgt, daß der steigende übergang auf der Leitung M1 zum unteren Eingang der Verriegelung 1R geht und dort den Nullpegel hervorruft. Infolge der Beendigung
90984 5/049 5 ßAD original
des lokalen Maximums auf der Leitung M2 enij/c/sht am Eingang der Differentierschaltung DP2 ein Signalpe^jl von minus 12 Volt, der einen Ausgangswert '/on 0 Volt für die Leitung DF2a zur Folge hat. Dieses Signal bleibt während 25 ms bestehen (siehe Zeitdiagramm von Fig. l6b). Dieser Nullpegel wird dem unteren Eingang der Verriegelung IH zugeführt. Naohdem der Nullpegel an beiden Eingängen der Verriegelung 1H ansteht, wird diese eingeschalt« wie früher beschrieben wurde. An ihrem Ausgang M2 H entsteht dann ein Signal, das eine Vokalcharakteristik für steigenden Übergang anzeigt.
Um den Vorgang eines fallenden Übergangs bei der Beendigung eines lokalen Maximums auf Leitung M2 zu beschreiben, wird angenommen, daß auf der Leitung M> eins Signaländerung stattfindet ( ohne, einen Vorgang auf M1) während das lokale Haxlmum auf 4er Leitung M2 eaciete ynfeer ließen Voraussetzungen entsteht auf dem unteren Eingang der Verriegelung 2F ein Nullpegel. Etwa gleichzeitig legt die Leitung DP2a an den oberen Eingang ven 2F Nullpsgel an. Diese Verriegelung wird also eingeschaltet und liefert; auf der Leitung M2 P ein 'Signal, das eine Vokalohä^aktsrlstik Uli8 fallenden übergang bedeutet«
Bei gleichbleibendem Zustand, d.ft* wenn ein Formant-Signal beständig ist, möge auf den Leitungen M1 lind M$ keine Signaländerung stattfinden während das lokale Maximum auf der Leitung M2 endet. Nun liefern die Leitungen M3 und M1 einen Signalpegel von miitus 1*1 Volt f^f Sen unteren Eingang der
909845/0495
BAD ORIGINAL
1S47027
Verriegelung 2F und auf den oberen Eingang der Verriegelung 1R. Die übrigen Eingänge für diese beiden Verriegelungen sind während ca. 25 ms wegen der Zeitkonstante der Differentialschaltung DF2 auf dem Potential Null. Da also nur je ein Eingang der Verriegelungen 1R und 2F bei Null liegt, können diese Verriegelungen nicht eingeschaltet werden. Nach dem Ende des Impulses von J55 ms von der Differentialschaltung DF2 liefert die Differentialschaltung DgF2 einen Impuls von 5 ms an den oberen Eingang der Verriegelung 23, welche zur Speicherung eines Festformanten dient. Der untere Ein« gang dieser Verriegelung ist mit dem Ausgang der Schaltung NOR 2 verbunden, die von den Ausgängen der Verriegelungen IR und 2F gespeist wird und welche beide ausgeschaltet sind. Mangels eines Eingangssignals'liefert die Schaltung NOR 2 keinen Sperrimpuls, so daß am unteren Eingang der Verriegelung 2S ein Nullpegel besteht. Da gleichzeitig auoh am oberen Eingang das Potential 0 Volt anliegt, wird diese Verriegelung eingeschaltet. Ihr Ausgang speist die Leitung M2S, welche damit ein Fastwert-Charakteristikmn für einen Vokal des Sprachspektrums liefert.
Auf diese Weise entstehen 14 Festwert-Merkmale auf den Leitungen M1S bis M14S, IJ Merkmale für fallende übergänge auf den Leitungen M1F bis M1£F und 13 Merkmale für ,eteigende übergänge auf den Leitungen M2R bis M14R, insgesamt also
9098A5/Q495
4o Vektoren für die Vokaleigenschaften des Sprabhspektruma.
Es soil nun die Bestimmung der Konsonanten-Merkmale beschrieben werden. Diese Bestimmung geht aus von der Formantbestiramung durch das in Fig. 2a mit PL bezeichnete System, das » auf den Leitungen M1 bis M 14 Formant-Signale liefert. Diese Signale werden auf den "Abzweigleitungen M1a bis M1^a mit dem Formant-Geber FD der Fig. 2e verbunden. Dieser enthält Oder-Schaltungen 270, mit DI bezeichnete Inverter 290, ünd-Schaltungen 275, den Emitberverstärker 2Ö5 sowie NOR-Schaltungen 410. Den Formantgeber verlassen 5 Ausgangsleitungen FDa, FDb, FDc, FDd und FDe. Diese Ausgänge werden in der Konsonanten-Matrix der Fig. 2f mit den vier Konsonantenklassen F * V, F ' V, F .· V und F · V* kombiniert. Die vier Konsonantenklassen werden vom Reibelaut-Geber FVD der Fig. 2c gebildet. Sie liegen auf den Leitungen PO und VO an, welche zwei Elngangsinverter 290 speisen; die Inverter liefern komplementäre Ausgänge auf vier Leitungen Dia, DIb, DIo und Dia an vier Und-Schaltungen, deren Ausgänge mit den obengenannten Klassenbezeichnungen versehen sind, Die Und-Schaltungen des Gebers FVD haben eine gemeinsame Vorbereitungsleitung, die an einen Konsonantschalter CS angeschlossen ist. Die Charakter!stika dieser vier Konsonantklassen wurden eingangs aufgezählt.
' : . . ' '■.".'"'. " BAD 909845/0495
Duroh die Kombination der vier Konsonant-Klassen und der Signale auf den Leitungen M1a bis M1 J5a in der Konsonanten-Matrix CMS entstehen auf den mit f, w, v, s, in, z, sh, 1, zh, k, g, j, h, k1 und h' bezeichneten Leitungen Signale. Das vorliegende System liefert also 15 Konsonantenmerkniale, 40 Vokalmerkmale sowie ein Άηύerungsmerkmal; insgesamt stehen also 56 Merkmale a^r Verfügung.
Als Beispiel für die Vokalbestimrnung mittels der Vektoren möge der (englische) Vokal "i" dienen, der wie "al" ausgesprochen wird. Er wird im vorliegenden System durch ein Vektorzeichen mit 9 Bits dargestellt, welche auf den Leitungen M2F, M^S, M5S, M6R, M7R, M9P, MIOF, M11S und MI3S erscheinen. Diese eindeutige Verschlüsselung für den genannten Vokal geht auf das folgende Forraant-Verhalten zu-
-■■ i <
1. Die niedrigste Formantfrequenz ist beständig und durch den Vektor M1^S angezeigt.
2. Der nächsthöhere Formant beginnt bei M9 und fällt durch zwei Frequenzbänder nach M11 wo er endet. Dies wird angezeigt durch die Vektoren M9F, M10F und M11S.
3. Der nächsthöhere Formant beginnt bei M7 und steigt
ORIG«NAL 909845/0495
- 5Θ--
durch zwei Frequenzbänder nach Mf woN er endet; ; das wird durch die Vektoren M7R, MöR und M5S angezeigt.
4. Dieser höchste Formant beginnt in M2 und fällt naoh M3 wo er beständig bleibt; dies ist ange-' zeigt durch die Vektoren M2F und Mj5S.
Mit einer Information von 9 Bits ist also ein ziemlich schwie riger Vokal dargestellt. Was aber noch wichtiger istt «ine* eindeutige Verschlüsselung liefert eine vollständige Darstellung des Vokalablaufs.
BAD ORIGINAL 90 984 5/0495

Claims (4)

PATENTANSPRÜCHE
1. Verfahren zur Analyse von in Form elektrischer Signale dargebotenen Sprachsignalen, bei dem das Frequenzspektrum in mehrere Frequenzbänder zerlegt-und das Auftreten von Formanten in den Frequenzbändern bestimmt wird, dadurch gekennzeichnet, daß zur Vokajbestimmung für jedes Frequenzband der Übergang eines Formanten in ein benachbartes Frequenzband oder das Verbleiben des Formanten im anfänglich eingenommenen Frequenzband ermittelt und jeder solche Vorgang in Binärform gespeichert wird und daß zur Konsonantbestimmung für einige Frequenzbänder das Auftreten von stimmhaften Lauten und von Hebelauten ermittelt und mit daraus gebildeten Signalen eine Koordinate einer Matrix aus speichernden Elementen angesteuert wird, deren anderer Koordinate die Formanten aler Frequenzbänder darstellenden Signale zur Erzeugung eines Ausgangssignals zugeführt werden.
2. Anordnung zur Durchführung des Verfahrens nach Anspruch 1«
gekennzeichnet durch zwei je einem Frequenzband zugeordnete, durch deren Formant-Signale gespeiete, hintereinander liegende monostabile Multivibratoren, durch erste Verriegelungsschaltungen, deren beide Eingänge von dem Ausgang des ersten Multivibrators eine« Frequenzbandes und vom Formant-Signal eines benachbarten
6AD ORIGINAL 909846/04*35
-«*■- 15Λ7027
Frequenzbandes gesteuert werden und durch zweite Verriegelungsschaltungen, deren beide Eingänge vom Ausgang des zweiten Multivibrators und von einem Signal gesteuert werden, welches das Fehlen von Signalenan den Ausgängen beidseits benachbarter erster Verriegelungsschaltungen anzeigt (Fig. 2b und 2d).
3. Anordnung zur Durchführung des Verfahrens nach Anspruch 1,
gekennzeichnet durch eine Verriegelungsschaltungen mit zwei Eingängen als Speicherelemente enthaltende Matrix, deren vier Spalten der Minterm aus den beiden Signalen für stimmhaften Laut und Reibelaut und deren Zeilen die durch logische Verknüpfung gruppenweise zusammengefaßten Formantsignale aller Frequenzbänder zugeführt werden.
4. Anordnung nach Anspruch 3, dadurch gekennzeichnet, daß das
Signal für stimmhaften Laut aus dem Frequenzband 100 bi· 250 Hz und das Signal für Reibelaute aus dem Frequenzbereich über 4000 Hz gebildet werden.,
909845/0495 ' BAD ORIG'NAL
DE1547027A 1965-01-22 1966-01-15 Verfahren und Anordnung zur Konsonantenbestimmung in Sprachsignalen Expired DE1547027C3 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US427371A US3368039A (en) 1965-01-22 1965-01-22 Speech analyzer for speech recognition system

Publications (3)

Publication Number Publication Date
DE1547027A1 true DE1547027A1 (de) 1969-11-06
DE1547027B2 DE1547027B2 (de) 1977-08-25
DE1547027C3 DE1547027C3 (de) 1978-04-27

Family

ID=23694583

Family Applications (1)

Application Number Title Priority Date Filing Date
DE1547027A Expired DE1547027C3 (de) 1965-01-22 1966-01-15 Verfahren und Anordnung zur Konsonantenbestimmung in Sprachsignalen

Country Status (7)

Country Link
US (1) US3368039A (de)
BE (1) BE674341A (de)
CH (1) CH441791A (de)
DE (1) DE1547027C3 (de)
FR (1) FR1466645A (de)
GB (1) GB1070247A (de)
SE (1) SE342104B (de)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3679830A (en) * 1970-05-11 1972-07-25 Malcolm R Uffelman Cohesive zone boundary detector
US4862503A (en) * 1988-01-19 1989-08-29 Syracuse University Voice parameter extractor using oral airflow
CA2056110C (en) * 1991-03-27 1997-02-04 Arnold I. Klayman Public address intelligibility system
US6993480B1 (en) 1998-11-03 2006-01-31 Srs Labs, Inc. Voice intelligibility enhancement system
US8050434B1 (en) 2006-12-21 2011-11-01 Srs Labs, Inc. Multi-channel audio enhancement system
WO2015118324A1 (en) * 2014-02-04 2015-08-13 Chase Information Technology Services Limited A system and method for contextualising a stream of unstructured text representative of spoken word

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2938079A (en) * 1957-01-29 1960-05-24 James L Flanagan Spectrum segmentation system for the automatic extraction of formant frequencies from human speech
US3215934A (en) * 1960-10-21 1965-11-02 Sylvania Electric Prod System for quantizing intelligence according to ratio of outputs of adjacent band-pass filters
US3238303A (en) * 1962-09-11 1966-03-01 Ibm Wave analyzing system

Also Published As

Publication number Publication date
BE674341A (de) 1966-04-15
DE1547027B2 (de) 1977-08-25
SE342104B (de) 1972-01-24
FR1466645A (fr) 1967-01-20
CH441791A (de) 1967-08-15
DE1547027C3 (de) 1978-04-27
GB1070247A (en) 1967-06-01
US3368039A (en) 1968-02-06

Similar Documents

Publication Publication Date Title
DE69831991T2 (de) Verfahren und Vorrichtung zur Sprachdetektion
DE2357067C3 (de) Elektrische Schaltungsanordnung in Verbindung mit einer Spracherkennungseinrichtung
DE2524804A1 (de) Verfahren und vorrichtung zur automatischen spracherkennung
DE2443253A1 (de) System zur ueberwachung von ueber eine fernsprechleitung gewaehlten nummern
DE2000353A1 (de) Verfahren und automatische Vorrichtung zur Messung des Geraeuschabstandes von Fernsehsignalen
DE3878895T2 (de) Verfahren und einrichtung zur spracherkennung.
DE1412924A1 (de) Verfahren und Einrichtung zur redundanzarmen Signalabtastung
DE1273874B (de) Vorrichtung zur selbsttaetigen Berechnung von Korrelationsfunktionen
DE1547027A1 (de) Verfahren und Anordnung zur Analyse von Sprachsignalen
DE2237404A1 (de) Schaltung zur anzeige der qualitaet eines nf-signals
DE1937464A1 (de) Sprachanalysiergeraet
DE60004403T2 (de) Vorrichtung und verfahren zur signalqualitätserfassung
DE2830678A1 (de) Automatische musik-stimmeinrichtung
DE1512840A1 (de) Signaluebertragungssystem
DE2535730A1 (de) Verfahren und vorrichtung zur feststellung vielfrequenter toene
DE1547029A1 (de) Spracherkennungsgeraet
DE1816736A1 (de) Verfahren zum selbsttaetigen Anhalten und Wiederfreigeben des Tontraeger-Transports bei einem Schallaufzeichnungs- insbesondere Diktier-Geraet sowie Vorrichtung zur Ausuebung dieses Verfahrens
DE1772633A1 (de) Verfahren zur Spracherkennung
DE1202517B (de) Einrichtung zur automatischen Erkennung von gesprochenen Silben oder Woertern
DE1802502A1 (de) Schaltungsanordnung zur Festellung der Anwesenheit von Sprachlauten
DE2361700C3 (de) Kabeladerprüfgerät
DE10010232B4 (de) Verfahren und Vorrichtung zur Spracherkennung
DE934532C (de) Entzerrer fuer Fernschreiber-Signalkombinationen
DE1797314C3 (de) Elektrische Schaltungsanordnung zur Bestimmung von Formanten in Sprachsignalen &#39;
AT278104B (de) Verfahren und Vorrichtung zur Registrierung bzw. Messung von Hörer- und bzw. oder Fernseherdichten

Legal Events

Date Code Title Description
C3 Grant after two publication steps (3rd publication)
EHJ Ceased/non-payment of the annual fee