DE1937464A1 - Sprachanalysiergeraet - Google Patents
SprachanalysiergeraetInfo
- Publication number
- DE1937464A1 DE1937464A1 DE19691937464 DE1937464A DE1937464A1 DE 1937464 A1 DE1937464 A1 DE 1937464A1 DE 19691937464 DE19691937464 DE 19691937464 DE 1937464 A DE1937464 A DE 1937464A DE 1937464 A1 DE1937464 A1 DE 1937464A1
- Authority
- DE
- Germany
- Prior art keywords
- signal
- frequency
- circuit
- speech
- output
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000011159 matrix material Substances 0.000 claims description 33
- 230000010355 oscillation Effects 0.000 claims description 8
- 102100028043 Fibroblast growth factor 3 Human genes 0.000 claims description 5
- 108050002021 Integrator complex subunit 2 Proteins 0.000 claims description 5
- 238000001228 spectrum Methods 0.000 claims description 5
- 101710092886 Integrator complex subunit 3 Proteins 0.000 claims description 4
- 102100025254 Neurogenic locus notch homolog protein 4 Human genes 0.000 claims description 4
- 230000004069 differentiation Effects 0.000 claims 1
- 238000010606 normalization Methods 0.000 claims 1
- 239000003990 capacitor Substances 0.000 description 5
- 210000000214 mouth Anatomy 0.000 description 4
- 230000007423 decrease Effects 0.000 description 3
- 238000000034 method Methods 0.000 description 3
- 102100024061 Integrator complex subunit 1 Human genes 0.000 description 2
- 101710092857 Integrator complex subunit 1 Proteins 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 230000001960 triggered effect Effects 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 210000001260 vocal cord Anatomy 0.000 description 2
- 206010002953 Aphonia Diseases 0.000 description 1
- 101150034680 Lis-1 gene Proteins 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 101150084844 PAFAH1B1 gene Proteins 0.000 description 1
- 210000000941 bile Anatomy 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/065—Adaptation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/065—Adaptation
- G10L15/07—Adaptation to the speaker
Landscapes
- Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Electrophonic Musical Instruments (AREA)
Description
Patentanwälte 1837464
ϊΐρΐ.-ing. Leinweber
Di^i.-inglimmermann * Λ
nchen 2, Resental7
Tel. 261989 ■ ■ ■ l
2% Juli 3
MATSUSHITA ELECTRIC INDUSTRIAL CO., LT]D.
Osaka, Japan
Die Erfindung bezieht sich auf einen Sprachanalysator.
In der Energieverteilung eines Sprächspektrums finden sich
für jeden Zeitabschnitt für gewöhnlich, ein bis vier Energieballungen
(örtliche Höclistwerte) oder Formanten, die in der Mund- und Hasenhöhle,
dem Stimmorgan des Menschen, gebildet werden. Für diese Formanten sind die Ausbildung und das Volumen der Mundhöhle in Erstrekkung
von den Stimmbändern bis zur Zunge bestimmend. Genauer gesagt, je größer die Mundhöhle, um so geringer ist die Formantenfrequenz
insgesamt, und je kleiner die Mundhöhle, um so höher insgesamt die
Formantenfrequenz. In der Ausbildung und im Volumen der Mundhöhle
von den Stimmbändern bis zur Zunge bestehen individuelle Unterschiede.
So ergeben sich in der Frequenzverteilung des Formanten .
auch bei dem gleichen Sprachlaut individuelle Unterschiede. Ungeachtet dieser individuell bedingten Unterschiede in der Formantenfrequenzverteilung
wird gleichwohl aber die Wortbedeutung richtig erfaßt, weshalb davon auszugehen ist, daß die Beziehungen zwischen
den Formanten relativ konstant sind.
. ■ Die
109808/0847
1S37464
- 2 - "■"■■■"
Die nach dem Stand der Technik bekannten Sprachanalysiergeräte
"beruhen in ihrer Wirkweise lediglich darauf, daß ein Sprachlautsignal mit Hilfe einer Vielzahl von Bandpässen, deren jeder
'einem bestimmten Frequenzband entspricht, gefiltert wird, worauf die Ausgänge der einzelnen Bandpässe zur Speicherung in zeitlicher
Aufeinanderfolge einer Speichermatrixschaltung zugeführt werden.
Die erwähnten Bandfilter sind im übrigen so aufgebaut, daß deren
Durchlaßfrequenzbereiche in ihrer Gesamtheit den Sprechfrequenzbereich ganz erfassen. ' ·
■ Bei einem solchen bekannten System besteht die Tendenz,
daß das Frequenz-Zeit-Schema der Speichermatrixschaltung infolge individueller Stimmunterschiedlichkeiten von Sprecher zu Sprecher
Unterschiede aufweist, beispielsweise also Unterschiede in der Tonhöhenfrequenz. Mit anderen Worten, wenn also verschiedene Personen
zum Beispiel den Laut "a" artikulieren, so lassen sich Unterschiede
im Frequenz-Zeit-Schema feststellen. Es1st somit die Möglichkeit
in Rechnung zu stellen, daß in der- Sprachanalyse und Auffassung des
Gesprochenen Fehler auftauchen, falls das obige System bei einem
Gerät Anwendung findet, das einerseits zur Sprachanalyse dienen soll, daneben aber auch zur Sprachsinnerfassung.
Durch die Erfindung sollen die yorbezeichneten Mängel beseitigt werden. ■
Die Erfindung hat' zur Hauptaufgabe, eine Kodierung der
Beziehung zwischen Formantenfrequenz und Zelt, die unter Ausschaltung individueller Sprachlautunterschiedlichkeiten normalisiert wird,
zu ermöglichen, so daß also ein Gerat zur Sprachsinnerfassung und
Sprachübertragung geschaffen wird, das wesentliche- Vorteile gegen- ■
über den bekannten Geräten zur Sprachsinnerfassung verbürgt. . -
Weiterhin hat die -Erfindung zur Aufgabe, Möglichkeiten '
für eine mit hoher Geschwindigkeit erfolgende Stimmanalyse zu schaffen, so daß eine Unterscheidung zwischen Vokal und Konsonant, insbesondere einem kurzen Konsonanten, ermöglicht wird,. ~ ν
Die Erfindung geht davon aus, daß zwischen den Formanten
bestimmte konstante Beziehungen bestehen, und zwar unbeschadet der
•Tatsache, daß sich die von den einzelnen Sprechern artikulierten
• Spraohlaute
109808/0847
Sürachläute in ihrer.Tonhöhenfrequenz voneinander unterscheiden. Pur.
die Erfindung, ist kennzeichnend, daß in Abhängigkeit von den Schwankungen
in der Touhöhenfrequenz ein Signal erzeugt, die Summe oder .
Differenz aus diesem Signal und einem zu analysierenden. Sprachlautsignal
ermittelt und hierauf ein Frequenz-Zeit-Schema in bezug auf
das so verarbeitete Signal erhalten wird. Auf diesem Wege ist es möglich, individuell bedingte Unterschiede aus dem vorerwähnten
Schema zu eliminieren und dieses zu normalisieren.
Weitere Ziele, Merkmale und Torteile der Erfindung erge- ,
ben sich aus dem Zusammenhang der nachfolgenden Beschreibung in Verbindung mit den Tbeigegebenen Zeichnungen. In den Zeichnungen
zeigen:
'ELgux 1 eine schematische Darstellung einer Ausführungsform des durch die Erfindung geschaffenen Sprachanalysators;
Figuren. 2a und 2b graphische Darstellungen der Charakteristik
jeweils eines darin enthaltenen Schaltelements;
Figuren 3 bis 10 Darstellungen zur Erläuterung der einzelnen
Scnaltaittei, die, in ihrer Gesamtheit die in Figur 1 gezeigte
Anordnung !bilden*
figur 11 eine schematische Darstellung-einer zweiten Ausführungsform
des durch die Erfindung geschaffenen Sprachanalysatorsj
und
Figur 12 eine Darstellung der Anordnung des für die Erfindung
typischsten Schaltmittels.
Die Erfindung soll nun anhand der in Figur 1 dargestellten
Ausführungsfonn beschrieben werden, bei der Schallwellen mit
Hilfe eines Mikrophons 1 in ein elektrisches Signal umgewandelt werden,
worauf das so erhaltene elektrische Signal in einem Verstärker 2 verstärkt -wird, dessen Ausgang dann einem Tiefpaßfilter 3, einem
Spracheinsatzdetektor 4 und einem Tonhöhenfrequenzdetektor 5 zugeführt
wird. Der Spracheinsatzdetektor 4 stellt das Einsetzen eines eingehenden Sprachsignals fest und liefert ein Impulssignal. Beim
Auftreten dieses Signale werden verschiedene Schaltmittel in Betrieb
genommen, auf die weiter unten näher eingegangen werden soll. Der
10980R/0847 .
■,.■■■ - - 4 - - . . / '■'■
Toiihöhenfrequenzdetektor, 5 ermittelt die Tonhöhenfrequenz eines eingehenden Sprachsignals und liefert ein Impulssignal mit einer FoIgQ-frequenz
f , die gleich der Tonhöhenfrequenz ist. Dieses Impulssignal wird dem einen der Eingangsanschlüsse eines Frequenzunterschiedsdetektors
6 zugeleitet, nämlich dem Anschluß f. Der Frequenzunterschiedsdetektor
6 liefert entsprechend einem Frequenzunter- .. ■
schied (f - f ) zwischen einem über einen anderen Anschluß 8 zuge-
s P
führten Signal mit einer Vergleichsfrequenz f und dem vorerwähnten Impülssignal eine Ausgangsgleichspannung V . In der Praxis ist es leichter, eine der Frequenz f entsprechende Spannung Y und eine ν der Vergleichsfrequenz f entsprechende Spannung V miteinander zu
führten Signal mit einer Vergleichsfrequenz f und dem vorerwähnten Impülssignal eine Ausgangsgleichspannung V . In der Praxis ist es leichter, eine der Frequenz f entsprechende Spannung Y und eine ν der Vergleichsfrequenz f entsprechende Spannung V miteinander zu
S . S
vergleichen. Zwischen dem Frequenzunterschied (f - f ) und der
ρ s
Ausgang sgl eich spannung Yn besteht eine lineare Beziehung nach Art
der in Figur 2a dargestellten, so daß sich .die Ausgangsgi eich spannung
V^ mit steigendem Frequenzunterschied erhöht. Die Ausgangs- '
gleichspannung Y_ wird einem frei schwingenden Oszillator 9 zugeführt,
der hierauf ein Sinuswellensignal mit einer Frequenz f abzugeben
vermag. Zwischen der aus dem frei schwingenden Oszillator 9 erhältlichen Schwingungsfrequenz f und der von dem Frequenzunterschi
edsdetek tor 6 abgegebenen Ausgangsgleich spannung V7^ besteht
eine lineare Beziehung wie die in Figur 2b veranschaulichte. Mit anderen Worten, die Schwingungsfrequenz ist f _ bei einer Spannung
V-. gleich Null; sie erhöht sich mit einer in positiver Richtung ansteigenden
Spannung V , und sie verringert sich mit einer in negativer Richtung ansteigenden Spannung V .
Das eingehende Sprachsignal, das zum Eliminieren höherer Frequenzkomponenten als der zur Sprachanalyse erforderlichen durch
das Tiefpaßfilter 3 gefilterttst, wird dem einen der Eingangsanschlüsse
eines Frequenzwandlers 10 zugeführt, dem über den anderen
Anschluß der Ausgang des freischwingenden Oszillators 9 zugeleitet
wird. Ist nun die Frequenz des gefilterten Sprachsignals f , so wird
am Ausgangsanschluß des Frequenzwandlers, nämlich eines noch zu beschreibenden Ringmodulators, ein umgewandeltes Signal mit einer
Frequenz (fjj + fy) erhalten. Dieses Signal mit einer Frequenz
(f M + f v) wir<i einer aus einer Vielzahl von Filtern aufgebauten
Frequenzwahlschaltung 11 zugeführt. Bevorzugterweise wird die höhere
Frequenz
8/0847
"Frequenz (f.. + f ) zur Erhöhung der Analysiergeschwindigkeit durch
eine Verringerung der'Zeitkonstanten nachfolgender Schaltelemente
wie beispielsweise Integratoren gleichgerichtet. Jedes der in der erwähnten Frequenzwahlschaltung 11 vorgesehenen Filter weist eine
solche Bandbreite auf, daß ein vorbestimmtes Frequenzband in einem
Frequenzbereich von (f™ + 200) Hz bis (*"Μ0 + 5000) Hz durchgelassen werden kann.
Die Frequenzwahlschaltung 11 ist so aufgebaut, daß eine
eingehende Sprechfrequenz in eine Vielzahl von Bändern unterteilt
wird, die ihrerseits einem Formantendetektor 12 zugeführt werden,
der geeignet ist, einen Formanten in den unterteilten Bandsignalen
festzustellen. Der Formant wird in einer Matrizenschaltung IJ gespeichert,
die in zeitlicher Zuordnung vom Beginn des Sprachlauteinsatzes
an als Informationsspeicher dient. Zu diesem Zeitpunkt wird durch den Ausgang des Spracheinsatzdetektors 4 eine Matrizentreiberschaltung 14 zum Durchsteuern der Matrizenschaltung 13 in
Betrieb genommen, so daß die "Schreib"-spalten der Matrizenschaltung
13 in vorbestimmten Zeitabständen vom Zeitpunkt des Spracheinsatzes
festgelegt werden. So wird ein kurz nach dem Einsetzen des
Sprechens auftretender Formant in derjenigen Spalte der Matrizenschaltung 13 gespeichert, die in der Betrachtungsrichtung der Figur
am weitesten links liegt, und ein in einem hierauf folgenden Zeitintervall auftretender Formant wird in der zweiten Spalte gespeichert.
In dieser Weise wird in jedem Zeitintervall in der Matrizen*·
schaltung 13 ein Formant gespeichert. Tritt in einem bestimmten Band
in einem festgelegten Zeitintervall eine Energieballung auf, so wird
in die Matrizenelemente der diesem Band entsprechenden Zeile "1" eingeschrieben, und falls in den änderen Bändern keine Energieballung
vorhanden ist, wird in alle anderen Elemente als die vorbezeichneten
11O" eingeschrieben.
Es soll nun auf die einzelnen Schaltmittel näher eingegangen
werden, die in der Anordnung der Figur 1 vorgesehen sind. Figur 3 zeigt den Tonhöhenfrequenzdetektor 5 und die dazugehörigen Anordnungen, wobei ein Sprachlaut mittels des Mikrophons 1 in ein elektrisches
Signal umgewandelt wird, das hierauf in dem Verstärker 2 "
verstärkt und dann durch ein Tiefpaßfilter 51 mit einer oberen Fre-
1098087084
■■-'■. :: ; ''.V ■■■■■■■ - 6 - .-■■■■■ ..■■■■.■■■" ■ ■ '.
quenz von 300 Hz gefiltert wird. Der Ausgang des Filters 51 wird
durch einen Integrator 52 integriert, so daß ein mit der Tönhöhenfrequenz oszillierendes Signal erzeugt wird, dasmittels einer
Schmitt-Triggerschaltung 53 wiederum in ein Rechtecksignal mit einer
FoIgefrequenz, die gleich der Tonhöhenfrequenz ist, umgewandelt wird.
Das resultierende Rechtecksignal wird über eine Torschaltung 54 j die
in ihrer Torwirkung durch ein Steuersignal gesteuert ist, einem Zähler
55 zugeführt, so daß die Tonhöhenfrequenz des Eingangssignals "
gezählt wird. Das in dem Zähler 55 durch den Zählvorgang ermittelte
Ergebnis wird durch einen Digital-Analog-Umsetzer 56 in ein Analogsignal
umgewandelt, wobei der von dem Umsetzer 56 abgegebene Ausgang
sgleichstrom Y der Tonhöhenfrequenz des Eingangssignals proportional
ist. -
Die Matrizenschaltung 13 baut sich im allgemeinen aus bistabilen
Schaltungen oder aus Magnetkernspeiehern auf.
In Figur 4 ist ein Frequenzunterschiedsdetektor 6 dargestellt, der einen Unterschied zwischen den Frequenzen zweier Eingangssignale
festzustellen vermag, nämlich einen Unterschied zwischen der Tonhöhenfrequenz eines'eingehenden Sprachsignals und der
Frequenz eines Sprachbezugssignals, und der hierauf eine diesem
Unterschied proportionale Gleichspannung erzeugt und hält. An den
einen Eingangsanschluß I4 eines Differentialvexstärkers 6l wird die
vorerwähnte, aus dem Tonhöhenfrequenzdetektor 5herrührende Gleichspannung
Y angelegt, die der Tonhöhenfrequenz f proportional ist>
während an den anderen EingangsanSchluß I5 über einen Umschalter S*
eine Gleichspannung angelegt wird» deren Pegel der fönhöhenbezugsfrequenz
für die Laute "a", "e", "i", "o" öder "unproportional ist.
Der Different!alVerstärker ist im übrigen so aufgebaut, daß er keinen Ausgang liefert, falls die an seine beiden Eingangsanschlüsse
angelegten Gleichspannungen einander gleich sind.
Artikuliert ein Sprecher den Laut"a", der auch einer der
japanischen Vokale ist, während an den.Eingangsanschlüß I5 des Differentialverstärkers 61 über den Umschalter S, eine dem Ständard-·
vokal "a" entsprechende Gleichspannung angelegt ist, so läßt sich
am Ausgang des Differentialverstärkers 61 eine dem Unterschied zwischen der Tonhöhenbezugsfreqüenz und der Tonhöhenfrequenz des Sprechers
. 1Q98Q8/084T
ehe rs entsprechende Spannung e-j^ abnehmen. Diese Spannung βχ wird
durch einen Analog-Digital-Umsetzer 62 in ein Digital signal umgewandelt und dann in einem Speicherkreis 63 gespeichert. Durch Umschalten des Schalters S1 werden hierauf die Unterschiede zwischen
den Tonhöhenbezugsfrequenzen für "e", "i", "o" und "u" und den betreffenden
Tonhöhenfrequenzen des Sprechers ermittelt und die jeweils diesen Unterschieden entsprechenden Spannungen e^, e„, e
beziehungsweise e,_ in der obenbeschriebenen Weise in dem Speicherkreis
63 gespeichert. Eine Logikschaltung 64 liefert entsprechend
dem arithmetischen Mittel der aus deia Speicherkreis 63 verfügbaren
Ausgangsspannungen gemäß
ein Digitalsignal. Dieses Digitalsignal wird mit Hilfe des Digital-Analog-Umsetzers
65 in ein Analogsignal wie beispielsweise eine
Gleichspannung V umgewandelt und festgehalten.
In Figur 5 ist der freischwingende Oszillator 9dargestellt,
dessen Ausgangsfrequenz mit der über den Eingangsanschluß 91 angelegten Ausgangsspannung VL des Fre.quenzuntersohiedsdetektors
6 veränderlich ist. Hierbei ist im einzelnen eine kapazitätsvariable
Diode VC mit einem Kondensator C parallelgeschaltet und bildet zusammen
mit einem Kondensator C? und einer Spule L einen Serienresonanzkreis. Einem Transistor Q wird über Widerstände IL und E. eine
Basisvorspannung erteilt', und eine durch die Kondensatoren C und
Cg5 die kapazitätsvariable Diode VC und die Spule L bestimmte Serieriresonanzspannung
wird über einen Kondensator C zur Basis zurückgespeist,
so daß der Oszillationsvorgang vonstatten gehen kann. Das
Potential an der Katode der kapazitätsvariablen Diode erhöht sich,
beim Anlegen der Spannung V an den Anschluß 9I, so daß sich, die
Kapazität der kapazitätsvariablen Diode VC bei einem Ansteigen der
Spannung V^ verringert. Die Eesonanzfrequenz des vorerwähnten Serienresonanzkreises
erhöht sich somit, so daß sich also auch die Schwingurigsfrequenz
erhöht. Verringert sich hingegen die Spannung V , so
verringert sich auch die Schwingungsfrequenz. Der Schwingungsausgang
kann am Kollektor <des Transistors Q abgenommen werden.
Figur
-0 8/0'84 7 ·
Figur 6 zeigt den Frequenzwandler 10, der beispielsweise
als Eingmodulator ausgebildet sein kann, wobei der Ausgang (die ■
Schwingungsfrequenz f ) des frei schwingenden Oszillators 9 über die
Anschlüsse 101 und 102 zugeführt wird, ein Sprachsignal (die Frequenz f ) dagegen über die Anschlüsse 103 und 104, so daß an den
Ausgangsanschlüssen 105 und 106 Signale (f + f^) erscheinen. Von ■
hier wird das Summen signal (f.. + f ) in der vorbeschriebenen Y/eise
an die nachfolgenden Stufen weitergelei.tet. Für den Fachmann bedarf
es keiner weiteren Erläuterungen, daß statt des Ringmodulators auch
ein Amplitudenmodler vorgesehen sein kann.
Bei Figur 7 handelt es sich um eine Darstellung zur Erläuterung der AusgangsCharakteristik an den Ausgangsanschlüssen 105
und 106, wobei mit der Bezugszahl 107 das Sprechfrequenzband eines
Sprechers bezeichnet ist, dessen Tonhöhenfrequenz f ·.. sei, mit der
Bezugszahl 108 das Sprechfrejquenzband eines Spreehers, dessen Ton- höhenfrequenz
f sei, und mit der Bezugszahl 109 das Ausgangsfrequenzband
für den Fall, daß über die Anschlüsse 103 und 104 ein
innerhalb des Sprechfrequenzbandes 107 liegendes Sprachsignal zugeführt wird, wobei die von der Tonhöhenfrequenz f■. abhängige Ausgangsfrequenz
f'„ des frei schwingenden Oszillators 9 zur Verschiebung
in den hohen Frequenzbereich über die Anschlüsse 101 und 102 zugeführt wird und die Tonhöhenfrequenz eine Änderung zu f . , erfährt.
Die Bezugszahl 110 bezeichnet das Aüsgangsfrequenzband für
den Fall, daß über die Anschlüsse 103 und 1Ö4 ein innerhalb des
Sprechfrequenzbandes 108 liegendes Sprachsignal zugeführt wird,
wobei die Ausgangsfrequenz f des freischwingenden Oszillators 9
zugeleitet und die Tonhöhenfrequenz zu f „( verschoben wird. Es
gelten also die folgenden Beziehungen:
'Vv=V+ 1Mi und V' - V + >M2 '}■:/
Es bereitet keine Schwierigkeiten, den freischwingenden Oszillator
■9. so. aufzubauen, daß dessen Ausgangsfrequenzen f und fM in der
Weise mit der Tonhöhenfrequenz veränderlich sind, daß der Bedingung
Genüge geleistet wird. Sieht man einen Oszillator 9 vor, der dieser
109808/0847
Anforderung gerecht wird, so ist im wesentlichen eine Angleichung
der Tonhöhenfrequenz unabhängig von der Stimmeigenart des jeweiligen
Sprechers möglich. Es wird also das Sprachsignal frequenzmäßig korrigiert und normalisiert.
Figur 8' zeigt die Anordnung der Frequenzwahlschaltung 11
und des Formantendetektors 12. Das in dem Frequenzwandler 10 normalisierte
Sprachsignal wird zunächst über einen Anschluß 111 der Frequenzwahl schaltung 11 zugeführt. Die Frequenzwahlschaltung 11
ist aus einer Vielzahl von Bandpaßfiltern BPFl, BPF2, BPF3, ... · aufgebaut,
durch die das Sprachsignal auf die betreffenden Durchlaßbereiöhe aufgeteilt wird. Die Ausgänge der einzelnen Bandfilter
BPFl, BP F2, BPF3, ... werden Emitterfolge schaltungen EFl, EF2,
EFJ, c. zugeleitet, die jeweils dem Formantendetektor 12 entsprechen.
Die Ausgänge der Emitterfolge schaltungen EFl, EF2, EF3, ...
werden Integratoren INTl, INT2 , INT3, ...zugeführt, um in diesen
integriert zu werden. Der Integrator INTl ist mit der Emitterfolgeschaltung
EFl über einen Transformator T gekoppelt, der den Gleichstrompegel
im Ausgang des Emitterfolgers sperrt, so daß ein über
die Sekundärspule des Transformators T induziertes Signal durch eine
Diode D gleichgerichtet und dann durch eine aus einem Kondensator C
und einem Widerstand R bestehende Parallelschaltung integriert wird. Die übrigen Integratoren INT2, INT3t «♦· haben den gleichen Aufbau.
Weiterhin werden die Ausgänge der Integratoren INTl, INT2, INT3, ...
jeweils den betreffenden Pufferverstärkern Bl, B2, B3 , ... zugeführt,
während die Ausgänge e,, e?, e_, ... der Pufferverstärker
Bl, B2, B3, ... den betreffenden Di ffere.nzver stärkern DAl, DA2,
DA3> ... zugeleitet werden. Jeder dieser Differenzverstärker DAl,
DA2, DA3, ... verstärkt die Differenz zwischen den einander jeweils
benachbarten der Ausgänge e1, e2, e,, .-.. der Pufferverstärker Bl,
B2, BJ, «... So werden beispielsweise die Ausgängen, und e„ der
Pufferverstärker Bl und B2 dem Differenzverstärker DAl zugeführt,
so daß die Differenz zwischen diesen beiden Ausgängen oder (en - e_)
darin verstärkt wird. Der Ausgang des Differenzverstärkers DAl wird
einem Oberpegeldiskriminator ULDl und einem Unterpegeldiskriminator
LLDl zugeführt. In ähnlicher Weise werden die Differenzspannungen
(®2 ~ 8O » (ex - 8^)* ··· Jeweils duroh die betreffenden der übrigen
109808/0847
Differenzverstärker DA2, DA3, ■-... verstärkt und die Ausgänge dieser
Differenzverstärker DA2, DA3, ... werden den Oberpegel- und den Unterpegeldiskriminatoren ULD2 und LLD2 beziehungsweise ULD3 -und
LLD3, ... zugeführt. Die Oberpegeldiskriminatoren TJLDl, ULD 2, ULD3,
... sprechen auf positive Ausgangspegel der vorgeschalteten Differenzverstärker DAl, DA2, DA3, ... an und erzeugen Rechteoksignale,
deren Impulsbreite jeweils gleich der Zeitspanne ist, in welcher der
Ausgangspegel positiv ist. Die Unterpegeldiskriminatoren LLDl, LLD2,
LLD3, o.. sprechen demgegenüber auf negative Ausgangspegel der Differenzverstärker
DAl, DA2, DA3,* ... an und erzeugen Rechtecksignale,
deren Impulsbreite jeweils gleich der Zeitspanne ist, in welcher der Ausgangspegel negativ ist. Mit anderen Worten, jeder der Oberpegeldiskriminatoren vermag einen Ausgang zu liefern, wenn
ei> ei+1 C1 = L>
2> 3».·■··*■)■
und jeder der Unterpegeldiskriminatoren liefert einen Ausgang wenn
8I^V+1 (i = 1, 2, 3, ..·)
Der Ausgang des Oberpegeldiskriminators ULDl wird unverändert als
Formantenausgang entnommen. Die Ausgänge des Unterpegeldiskriminator
s LLDl und des Oberpegeldiskriminators ULD2 werden einer Moht-Und-Schaltung
HGl- züge führt-und; die Ausgänge des Unterpegel diskriminators
LLD2 und des Oberpegeldiskriminators ULD3 einer Nicht-Und-Schaltung
HG2. Anders ausgedrückt, der Ausgangsanschluß eines auf
einen positiven Pegelwert des Ausgangs eines Differenzverstärkers
ansprechenden Oberpegeldiskriminators und der Ausgangsanschluß einesauf
einen negativen Pegelwert des Ausgangs eines Differenzverstärkers ansprechenden Unterpegeldiskriminators sind mit einer gemeinsamen
Kicht-Und-Schaltung verbunden. ■
_ ITimmt man an, daß beispielsweise im Durchläßbereich des
Bandpaßfilters BPP2 eine Energie spitze vorhanden iat, so gelten zwischen
den Ausgängen e, , e^ und e, der Puff erver stärker Bl, B2 und
B3 die folgenden Beziehungen:
ei<e2 - ..;'■ ."'■-. ■ :
Der Differenzverstärker DAl liefert mithin einen negativen Ausgang
und der Differenzverstärker DA2 liefert einen positiven Ausgang.
Auf den Ausgang des Differenzverstärkers DAl spricht daher der
Unterpegeldiskriminator LLDl an, auf den Ausgang des Differenzverstärkers
DA2 dagegen der Oberpege!diskriminator ÜLD2, so daß der
Ausgang der i\icht-ünd-Schaltung IiGl- verändert wird und erkennen
läßt, daß in dem Band des Bandfilters EPF2-eine Energie spitze vorhanden
ist. Dieses Signal, welches das Vorhandensein eines Pormanten
anzeigt, wird mit einem Zeitsignal in. Koinzidenz gebracht, das
als Ausgang der Matrizentreiberschaltung mit dem nachstehend beschriebenen
Aufbau erhalten wird, und wird hierauf in ein vorbestimmtes der die llatri ze η schaltung 13 bildenden Matrizenelemente
eingeschrieben und darin gespeichert.
In Figur 9 ist die llatrizentreiberschaltung 14 dargestellt,
bei der eine einzige bista.bile Schaltung BS mit mono stabilen Schaltungen
"MSl, I.IS2, IJS3> ··· in Reihe geschaltet ist, die jeweils den
Spalten der Matrizenschaltung 13 entsprechen. Die bistabile Schaltung
BS wird durch den Ausgang des Spracheinsatzdetektors 4 zum
Durchsteuern der folgenden mono stabilen Schaltung MSl getriggert.
Diese mono stabile Schaltung liefert für eine vorbestimmte Zeitspanne,
deren Dauer von den Leitungskonstanten abhängt, einen Ausgang. Die mono stabile Schaltung LIS2 wird durch die Hinterflanke
eines aus der vorgeschalteten mono stabilen Schaltung 1,ISl herrührenden Ausgangsimpulses getriggert. In dieser Y/eise können die monostabilen Schaltungen LIS2, M S3
> ··· den Betriebsablauf in der mono-. stabilen Schaltung MSl nachvollziehen, und der Schreibvorgang erfolgt
bei Betätigung der monostabilen Schaltungen LiSl, MS2, M S3,
jeweils in der betreffenden Spalte der Matrizenschaltung 13. Figur
10 gibt die resultierenden Wellenformen wieder, wobei ersichtlich ist, daß die Arbeitszeiten ti, t2, t3, ... der mono stabilen Schaltungen
MSl, MS2, MS3» ...so gewählt sind, daß sie sich zur Wortanalyse und Wortsinnerfassung eignen. Es läßt sieh ohne weiteres eine
Anordnung vorsehen, bei der die Gewähr gegeben ist, daß der Rückstellimpuls zum Rückstellen der bistabilen Schaltung BS zugeführt
wird, nachdem das Sprachsignal erloschen ist.
109808/0847
Bei der obenbeschriebenen Anordnung wird bei spiel swei se
ein während der .Arbeitszeit der mono stabilen Schaltung MSl eingehender
Formant in ein Matrizenelement eingeschrieben, das in die erste
'Spalte der Matrizenschaltung 15 eingegliedert ist und das demjenigen
Frequenzband entspricht, in dem der Formant auftritt. Ähnliche Betriebsvorgänge erfolgen auch in der zweiten und in den folgenden Spalten
der Matrizenschaltung IJ. In der Matrizenschaltung 13 entsteht
demgemäß ein Schema zeitlicher Zuordnung der durch das Sprachsignal
repräsentierten Information.
Durch Verschieben der Sprechfrequenz eines Sprechers in
der vorbeschriebenen Weise in Entsprechung zur Tonhöhenfrequenz kann
das Frequenz-Zeit-Schema ohne Schwierigkeiten normalisiert werden.
Durch ein einfaches Verschieben der Sprechfrequenz' in einen höheren
Frequenzbereich können die Zeitkonstanten der einzelnen Filter wie
auch die der Integratoren verringert werden, so daß die Sprachanalyse mit hoher Geschwindigkeit erfolgen kann.
Bei dem obenbeschriebenen Gerät können allerdings noch
Schwierigkeiten auftauchen, wenn ein stimmloser Laut, beispielsweise
ein Konsonant, analysiert werden soll, wenngleich das Gerät bei der
Analyse eines stimmhaften Lauts, beispielsweise eines Vokals, einwandfrei
arbeitet. Es ist also erforderlich, eine Vorrichtung zu
schaffen, die geeignet ist, auch stimmlose Laute mit hoher Geschwindigkeit
und mit hoher Präzision zu analysieren.
Figur 11 zeigt den Aufbau eines Geräts, ,das auch die Analyse stimmloser Laute ermöglicht, wobei dessen Hauptteil mit der
Anordnung der Figur 1 übereinstimmt. Diejenigen Schaltmittel, deren
Wirkweise die gleiche ist wie die der in Figur 1 dargestellten, sind
daher auch mit den gleichen Bezugszahlen wie dort versehen, und es
braucht darauf nicht näher eingegangen zu werden.
. In der Darstellung der Figur 11 ist mit der Bezugszahl
eine Schaltung zur Unterscheidung stimmhafter und stimmloser Laute
bezeichnet, der das Ausgangssignal des Frequenzwandlers 10 zugeführt
wird. Diese Schaltung 15 zur Unterscheidung stimmhaft/stimmlos ist
so aufgebaut, daß durch einen Vergleich der Energie des unteren Frequenzbandes
im Ausgangssignal des Frequenzwandlers 10 mit der Ener-
109808/0847
gie in dessen oberem Frequenzband jederzeit eine Unterscheidung
möglich ist, ob es sich bei einem Sprachlautum einen stimmhaften
oder stimmlosen Laut handelt. Die zum Speichern eines Freqiienz-Zeit-Schemas
dienende Matrizenschaltung 13 weist außer dem Matrizenteil
13A, das in der im obigen unter Bezugnahme auf Figur 1 beschriebenen
Weise zum Speichern eines im Sprechfrequenzbereich auftretenden Forr
manten dient, zusätzlich noch Matrizenschaltungsteile 13B und
mit gemeinsamen Zeitspalten auf. Der Ausgang der Schaltung 15 zum
Unterscheiden stimmhaft/stimmlos wird den Matrizensohaltungsteilen
13B und 13c zugeführt, so daß das Vorhandensein, oder die Abwesenheit
eines stimmhaften Lauts beispielsweise in die Schaltung I3B eingeschrieben
wird, Vorhandensein oder Abwesenheit eines stimmlosen
Lauts dagegen in die Schaltung 13C. Das heißt mit anderen Worten,
in die betreffenden Elemente der Matrizens'chaltung 13B wird bei Eingang
eines Signals» welches das Vorhandensein eines stimmhaften
Lauts anzeigt, 11I"- eingeschrieben, in Abwesenheit eines solchen
Signals dagegen "0". Dementsprechend wird in die Matrizenschaltung
13c beim Auftreten eines stimmlosen Lauts "1" eingeschrieben, beim
Ausbleiben eines stimmlosen Lauts hingegen "0". Aus den in den Matrizenschaltungsteilen I3B und 13c gespeicherten Daten läßt sich
also das Vorhandensein oder die Abwesenheit eines stimmhaften oder
aber stimmlosen Lauts bestimmen. Auch die Reihenfolge des Auftretens
wird gespeichert. '
Figur 12 zeigt die Anordnung der Schaltung I5 zur Unterscheidung stimmhafter und stimmloser Laute, in der das aus dem Frequenzwandler 10 verfügbare normalisierte Ausgangssignal zunächst
mittels eines Bandpaßfilters BPFIl mit einem Durchlaßbereich von
(fM0 + 200) Hz bis (fM0 +1500) Hz und eines Bandpaßfilters BPF12
mit-einem Durchlaßbereich von (fMQ + 2000) Hz bis (fMQ + 7OOO) Hz
ausgefiltert wird. Der Grund hierfür ist folgender: Bei einem stimmhaften
Laut ist die Energie in der Hauptsache in einem unteren Frequenzbereich des Sprechfrequenzbandes konzentriert, während bei
einem stimmlosen Laut eine Energiekonzentration in einem höheren Frequenzbereich zu konstatieren ist. Die Ausgänge der Bandfilter
BPFIl und BPF12 werden durch Integratoren INTlI beziehungsweise
IKT12 integriert und die Integrationsausgänge e,, und -ey« werden"
einem
109808/0847
BAO ORIGINAL
einem Differenzverstärker DAIl zugeführt^ in dem die Differenz
(e _ e, ) der Eingänge verstärkt wird und der einen positiven Ausgang liefert falls
6Il^ e12
sowie einen negativen Ausgang falls -
sowie einen negativen Ausgang falls -
11 s 12
Liefert also der Oberpegeldiskriminator ULDll einen Ausgang, so ist
der Ausgang des Differenzverstärkers DAIl positiv, woran ersichtlich
wird, daß es sich bei dem eingegangenen Sprachlaut um einen stimmhaften
Laut handelt. Liefert andererseits der Unterpegeldiskriminator
LLDIl einen Ausgang, so zeigt dies das Eingehen eines stimmlosen
Lauts an. Geht zum Beispiel ein .Wort "san" ein (der japanische Begriff für "drei"), so erzeugt zunächst der Unterpegeldiskriminator
LLDIl einen Ausgang .für den Reibelaut "s", wonach der Oberpegeldi skriminator
ULDll einen Ausgang für den Selbstlaut "ae" liefert. Für "n" erscheint kein Ausgang, da die Eingänge des Differenzverstärkers DAIl in diesem Fall einander gleich sind, so daß über die
Stimmhaftigkeit oder Stimmlosigkeit des eingehenden Lauts nichts
ausgesagt wird. In die Elemente des Matrizenschaltungsteils 13B, in
denen das Auftreten stimmhafter Laute in der Eingahgsreihenfolge
verzeichnet wird, wird also "010" eingeschrieben, während in die
Elemente des Matrizenschaltungsteils 13P, die in. ähnlicher Weise
das Auftreten stimmloser Laute festhalten, "100" eingeschrieben
wird. Im Fall des Wortes "itschi" (dem japanischen Begriff für "eins"
oder "ein") speichert das Matrizenschaltungsteil 13B zunächst den
Selbstlaut "1", anschließend wird der Reibelaut "tsch" in dem Matrizenschaltungsteil 13G gespeichert und schließlich der letzte Selbstlaut "i" in dem Matrizenschaltungsteil 13B. Das Schema des Matrizenschal tungsteil s 1.33 wäre demgemäß .11IOI". zu lesen, das des Matrizenschaltungsteils
13c hingegen "010".
Aus dem Obengesagten ergibt sich also, daß bei der letztbeschriebenen Anordnung Vorkehrungen getroffen sind, um den beim
Sprechen auftretenden Formantenübergang unabhängig von der Art der
individuellen Stimmunterschiede zu normalisieren und das Zeitschema
; : ■ ■■" ' - -Ib
109808/0847
in der Matrizenschaltung zu speichern, und zwar in Kombination mit
einer Vorrichtung zum Unterscheiden stimmhafter und stimmloser Laute
Mit einer solchen Anordnung lassen sich daher Schemata aufstellen, welche die stimmtypischen zeitlichen Va.rian.zen vorwegnehmen, was
für die Sprächsinnei-fassung von großer Bedeutung ist. Es hat sich
gezeigt, daß die so gebildeten Kodes zur Sprachsinnerfassung geeignet
sind, da ein Konsonant, insbesondere auch ein kurzer Konsonant, im Unterschied zu dem bei der bekannten Methode benutzten Schema
einwandfrei erkannt werden kann.
109Ö08/0 847 ·
βΑΟ ORIGINAL
Claims (10)
- P a t e n t an s ρ r ü ehe ■ ·. .(1,9 Vorrichtung zur Sprachanalyse, gekennzeichnet durch eine zum Ermitteln des Prequenzunterschiedes zwischen einem eingehenden Sprachsignal und einem Sprachbezugssignal betätigbare Schaltung (6), eine zum Erzeugen eines Signals mit einer dem Ausgang der Schaltung. (6) zum Ermitteln dieses Prequenzunterschiedes entsprechenden Frequenzbetätigbare Schaltung (9), eine zum Verschieben des Frequenzbandes des eingehenden Sprach signals entsprechend dem Ausgang der zum Erzeugen eines Signals betätigbaren Schaltung (9) im Sinne einer l\Tormalisierung dieses Frequenzbandes auf einer Frequenzachse betätigbare Schaltung (lO) , eine Freq.uenzwahl schaltung (ll) mit einer Vielzahl von. dem das verschobene Frequenzband aufweisenden Sprächsignal zugeordneten Durchlaßbereichen, eine zum Feststellen eines die Amplitude einer in jeder der Vielzahl vonDurchlaßbereichen auftretenden Signalkomponente repräsentierenden Signals und zum Vergleichen der Amplitude des festgestellten Signals mit der eines in dem benachbarten Durchlaßbereich erscheinenden Signals zwecks Ermittlung lokaler Maximalwerte im Stimmspektrum betätigbare Schaltung (12) und eine Speicherschaltung (13) zum Speichern dieser lokalen Maximalwerte in der Reihenfolge ihres Auftretens..
- 2. Vorrichtung zur Sprachanalyse nach Anspruch 1, dadurch gekennzeichnet, daß weiterhin eine Schaltung (IJj) zum Unterteilen des durch Verschieben des Frequenzbandes des eingehenden Sprachsignals erhaltenen Signals in eine Signalkomponente in einem in dem Stimmspektrum enthaltenen unteren Frequenzbereich und in eine Signalkomponente in einem in diesem enthaltenen oberen Frequenzbereich vorgesehen ist, in der durch eine Anordnung (DAIl, ULDIl, LLDIl) zum Vergleichen der , Energiebeträge der beiden Signalkomponenten eine Unterscheidung zwischen einem stimmhaften Laut und einem stimmlosen Laut treffbar ist, wobei das Ergebnis dieses Unterscheidungsvorganges in zeitlicher Zuordnung in der Speicherschaltung 13 speicherbar ist.
- 3· Vorrichtung zur Sprachanalyse nach Anspruch 1, dadurch gekennzeichnet, daß das eingehende Sprachsignal entsprechend dem Ausgang der Schaltung (6) zum Ermitteln des Frequenzunterschiedes zwischen dem eingehenden Sprachsignal und dem Sprachbezugssignal in einen oberen Frequenzbereich verschiebbar ist.ORIGINAL
- 4·"""Vorrichtung zur Sprachanalyse nach Anspruch 1, dadurch gekennzeichnet, daß die zum Erzeugen eines dem.Frequenzunterschied zwischen dem eingehenden Sprachsignal und dem Sprachbezugssignal entsprechenden Signals betätigbare Schaltung (9) als LC-Oszillator ausgebildet ist, der ein kapazitätsvariables Element (VC) und ein Induktivitätselement (l) aufweist, wobei ein aus der Ermittlung des Frequenzunterschiedes zwischen dem eingehenden Sprachsignal und dem Sprachbezugssignal resultierender Ausgang dem kapazitätsvariablen Element (YC) zur Änderung der Schwingungsfrequenz durch ein diesem; Ausgang entsprechendes Verändern der Kapazität des kapazitätsyariablen Elements (VC) zuführbar ist. ' *
- 5. Vorrichtung zur'Sprachanalyse nach Anspruch 1, dadurch gekennzeichnet, daß die zum Ermitteln des Frequenzunterschiedes zwischen dem eingehenden Sprachsignal und dem Sprachbezugssignal betatigbare Schaltung (6) mit einem Differentialverstärker (6l) zum Vergleichen der Amplitude^ eines der Tonhöhenfrequenz des eingehenden Sprachsignals entsprechenden Analögsignals mit der eines dem Sprachbezugssignal entsprechenden Analogsignals ausgebildet ist.
- 6. Vorrichtung zur Sprachanalyse nach Anspruch 1, dadurch gekennzeichnet, daß die zum Normalisieren des eingehenden Spraohsignals auf der Frequenzaohse betatigbare Schaltung (lO) als Ringmodulator ausgebildet ist. '.-"-..."■
- 7· Vorrichtung zur Sprachanalyse nach Anspruch 1, dadurch gekennzeichnet, daß die zum Normalisieren des eingehenden Sprachsignals auf der Frequenzachse betatigbare Schaltung (lO) als Frequenzmodler ausgebildet ist."
- 8. Vorrichtung zur Sprachanalyse nach Anspruch 1, dadurch gekennzeichnet, daß die zum Ermitteln lokaler Maximalwerte im Stimmspektrum betatigbare Schaltung (l2) mit jeweils mindestens einem Integrator. (iNTl, INT2, INT3), einem Differenzverstärker (DAl, DA2, DA3), einem Oberpegeldiskriminator (TJLDl, ÜLD2, ULDJ), einem Unterpegeldiskriminator (LLDl* LLD2, LLD?) und einer Torschaltung (NGl, NG2, NGj) ausgebildet ist, wobei die Größen der Ausgänge eines für ein benachbartes Frequenzband vorgesehenen Integrators (INT2>■ INT3) und des je- .'■ weil» betreffenden Integrators (INTI» INT2f HfTj) in dem Dlfferenz- j veretärker (DA1| DA2| DA3) miteinander vergleiohbar sind und wobei ■; - - ; ----- ; der109808/0847der Ausgang des Unterpegeldiskriminators (LLDIr LLD2; LLD3) und der des Oberpegeldiskriminators (ULDl; ULD2j ULD3) für das betreffende Frequenzband der entsprechenden Torschaltung (iTGl; NG2i NG3) zuführbar sind.
- 9. Torrichtung zur Sprachanalyse nach Anspruch 1, dadurch gekennzeichnet, daß die Speicherschaltung (13) als Matrizeηschaltung ausgebildet ist, wobei die lokalen Maximalwerte des Stimmspektrums in dem betreffenden Matrizenelement in der für den Ausgang der Prequenzwahlschaltung (ll) durch ein Schieberegister gewählten Spalte in der Reihenfolge ihres Auftretens speicherbar sind.
- 10. Vorrichtung zur Sprachanalyse nach Anspruch 2, dadurch gekennzeichnet, daß die Schaltung (l5) zum Vergleichen der Größen der beiden im unteren beziehungsweise im oberen Frequenzbereich auftretenden Signalkomponenten mit Differenzverstärkern -(DAlI) ausgebildet ist, wobei die beiden Signalkomponenten integrierbar und hierauf den Differenzverstärkern '(-DAIl). zur Erzeugung von der wechselseitigen Amplitudenbeziehung der beiden Signalkomponenten entsprechenden Ausgängen zuführbar sind und wobei diese Ausgänge den Oberpegeldiskrimihatoren (üLDll) und den Unterpegeldiskriminatoren (LLDIl) zuführbar sind.109808/0847
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP5289768 | 1968-07-24 | ||
JP4342169 | 1969-05-27 |
Publications (3)
Publication Number | Publication Date |
---|---|
DE1937464A1 true DE1937464A1 (de) | 1971-02-18 |
DE1937464B2 DE1937464B2 (de) | 1977-09-22 |
DE1937464C3 DE1937464C3 (de) | 1978-05-18 |
Family
ID=26383176
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE1937464A Expired DE1937464C3 (de) | 1968-07-24 | 1969-07-23 | Sprachanalysiergerät |
Country Status (5)
Country | Link |
---|---|
US (1) | US3592969A (de) |
DE (1) | DE1937464C3 (de) |
FR (1) | FR2014696A1 (de) |
GB (1) | GB1261385A (de) |
NL (1) | NL6911293A (de) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3732405A (en) * | 1971-08-11 | 1973-05-08 | Nasa | Apparatus for statistical time-series analysis of electrical signals |
GB1435779A (en) * | 1972-09-21 | 1976-05-12 | Threshold Tech | Word recognition |
US3855416A (en) * | 1972-12-01 | 1974-12-17 | F Fuller | Method and apparatus for phonation analysis leading to valid truth/lie decisions by fundamental speech-energy weighted vibratto component assessment |
US3855418A (en) * | 1972-12-01 | 1974-12-17 | F Fuller | Method and apparatus for phonation analysis leading to valid truth/lie decisions by vibratto component assessment |
JPS50155105A (de) * | 1974-06-04 | 1975-12-15 | ||
US3943295A (en) * | 1974-07-17 | 1976-03-09 | Threshold Technology, Inc. | Apparatus and method for recognizing words from among continuous speech |
US4032710A (en) * | 1975-03-10 | 1977-06-28 | Threshold Technology, Inc. | Word boundary detector for speech recognition equipment |
US4107460A (en) * | 1976-12-06 | 1978-08-15 | Threshold Technology, Inc. | Apparatus for recognizing words from among continuous speech |
US4586191A (en) * | 1981-08-19 | 1986-04-29 | Sanyo Electric Co., Ltd. | Sound signal processing apparatus |
FR2515851A1 (fr) * | 1981-10-29 | 1983-05-06 | Camion Jean | Multi-capteur instantane de frequences, transformateur analogique-digital de la voix humaine en vue de l'interface homme/machine par le langage |
JPS6024597A (ja) * | 1983-07-21 | 1985-02-07 | 日本電気株式会社 | 音声登録方式 |
US6577998B1 (en) * | 1998-09-01 | 2003-06-10 | Image Link Co., Ltd | Systems and methods for communicating through computer animated images |
US7089184B2 (en) * | 2001-03-22 | 2006-08-08 | Nurv Center Technologies, Inc. | Speech recognition for recognizing speaker-independent, continuous speech |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3384839A (en) * | 1965-09-24 | 1968-05-21 | Bell Telephone Labor Inc | Pulse code modulator including a multifrequency oscillator |
NL151593B (nl) * | 1966-11-22 | 1976-11-15 | Philips Nv | Stelsel voor signaaloverdracht met behulp van pulsdeltamodulatie. |
-
1969
- 1969-07-09 GB GB34692/69A patent/GB1261385A/en not_active Expired
- 1969-07-22 US US843573A patent/US3592969A/en not_active Expired - Lifetime
- 1969-07-23 NL NL6911293A patent/NL6911293A/xx unknown
- 1969-07-23 DE DE1937464A patent/DE1937464C3/de not_active Expired
- 1969-07-23 FR FR6925110A patent/FR2014696A1/fr not_active Withdrawn
Also Published As
Publication number | Publication date |
---|---|
US3592969A (en) | 1971-07-13 |
DE1937464B2 (de) | 1977-09-22 |
FR2014696A1 (de) | 1970-04-17 |
DE1937464C3 (de) | 1978-05-18 |
GB1261385A (en) | 1972-01-26 |
NL6911293A (de) | 1970-01-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE1547032A1 (de) | Einrichtung zum Identifizieren einer Person | |
EP0296588B1 (de) | Verfahren und Schaltungsanordnung zum automatischen Wiedererkennen von Signalfolgen | |
DE2753707A1 (de) | Einrichtung zur erkennung des auftretens eines kommandowortes aus einer eingangssprache | |
DE1937464A1 (de) | Sprachanalysiergeraet | |
DE2240557A1 (de) | Spracherkennungsvorrichtung zum steuern von maschinen | |
DE2326517A1 (de) | Verfahren und schaltungsanordnung zum erkennen von gesprochenen woertern | |
DE2820645A1 (de) | Vorrichtung und verfahren zur spracherkennung | |
DE2524804A1 (de) | Verfahren und vorrichtung zur automatischen spracherkennung | |
EP1214703B1 (de) | Verfahren zum trainieren der grapheme nach phonemen regeln für die sprachsynthese | |
DE2020753A1 (de) | Einrichtung zum Erkennen vorgegebener Sprachlaute | |
DE2422028A1 (de) | Schaltungsanordnung zur identifizierung einer formantfrequenz in einem gesprochenen wort | |
DE2357067A1 (de) | Vorrichtung zur sprachanalyse | |
DE3043516C2 (de) | Verfahren und Vorrichtung zur Spracherkennung | |
DE3102385C2 (de) | ||
DE1206167B (de) | Schaltung zur Verbesserung der Erkennbarkeit von Lauten bei der Schallanalyse | |
DE2021126B2 (de) | Spracherkennungsanordnung | |
EP0035761A2 (de) | Verfahren zum Betrieb eines Spracherkennungsgerätes | |
DE19851287A1 (de) | Datenverarbeitungssystem oder Kommunikationsendgerät mit einer Einrichtung zur Erkennugn gesprochener Sprache und Verfahren zur Erkennung bestimmter akustischer Objekte | |
DE2431458C2 (de) | Verfahren und Anordnung zur automatischen Sprechererkennung | |
DE1422056A1 (de) | Phonetische Schreibmaschine | |
DE1815189A1 (de) | Verfahren zum Erzeugen eines oszillographischen Bildes | |
DE2349626A1 (de) | Sprachaudiometer mit einem tonwiedergabegeraet | |
DE1547027B2 (de) | Verfahren und anordnung zur konsonantenbestimmung in sprachsignalen | |
DE1202517B (de) | Einrichtung zur automatischen Erkennung von gesprochenen Silben oder Woertern | |
DE2334459C3 (de) | Unterscheidung zwischen stimmhaften und stimmlosen Lauten bei der Sprachsignalauswertung |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C3 | Grant after two publication steps (3rd publication) | ||
8339 | Ceased/non-payment of the annual fee |