DE3732394A1 - Verfahren zur kompensation von stoergeraeuschen fuer in fahrzeugen installierte sprecherabhaengige spracherkennungssysteme - Google Patents
Verfahren zur kompensation von stoergeraeuschen fuer in fahrzeugen installierte sprecherabhaengige spracherkennungssystemeInfo
- Publication number
- DE3732394A1 DE3732394A1 DE19873732394 DE3732394A DE3732394A1 DE 3732394 A1 DE3732394 A1 DE 3732394A1 DE 19873732394 DE19873732394 DE 19873732394 DE 3732394 A DE3732394 A DE 3732394A DE 3732394 A1 DE3732394 A1 DE 3732394A1
- Authority
- DE
- Germany
- Prior art keywords
- noise
- speech
- interference signal
- speech recognition
- voltage
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims description 13
- 230000004913 activation Effects 0.000 claims abstract description 3
- 230000001419 dependent effect Effects 0.000 claims description 6
- 238000001514 detection method Methods 0.000 description 6
- 230000003595 spectral effect Effects 0.000 description 2
- 238000013139 quantization Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
Description
Die Erfindung betrifft ein Verfahren zur Kompensation von
Störgeräuschen für in Fahrzeugen installierte sprecherabhängige
Spracherkennungssysteme.
Derartige sprechabhängige Spracherkennungssysteme arbeiten
prinzipiell derart, daß eine erstmalige Spracheingabe innerhalb
einer Lernphase erfolgt, in der die Merkmale der zu erkennenden
Worte analysiert und in einen Referenzspeicher geladen werden.
In sogenannten späteren Erkennungsphasen werden die relevanten
Merkmale eingegebener Wörter sogenannte Analyseparameter mit
den abgespeicherten Referenzmustern verglichen und der jewei
lige Ähnlichkeitsgrad festgestellt. Innerhalb einer Umgebung, in
der die Störgeräusche annähernd konstant sind, arbeiten die
heutigen Spracherkennungssysteme zufriedenstellend. Die Er
kennungsdaten der heutigen Spracherkennungssysteme sinken aber
drastisch herab, wenn sich die Umgebungsgeräusche während der
Lernphase und der Erkennungsphase wesentlich unterscheiden.
Dies ist z. B. in einem Kraftfahrzeug der Fall, bei dem unter
schiedliche Betriebsarten von z. B. Standbetrieb bis Autobahn
betrieb mit unterschiedlichster Geräuschbelastung möglich sind.
Aufgabe der vorliegende Erfindung ist es, ein Verfahren der
eingangs genannten Art anzugeben, welches die Anwendung
sprecherabhängiger Spracherkennungssysteme z. B. in Kraftfahr
zeugen ermöglicht.
Diese Aufgabe wird erfindungsgemäß dadurch gelöst, daß das
im Fahrzeug maximal auftretende Störgeräusch einmalig abge
speichert wird, und daß nach jeder Aktivierung des Spracher
kennungssystems vor einer Spracheingabe die Differenz zwischen
dem jeweils aktuellen Störsignal und dem dem maximal auf
tretenden Störgeräusch entsprechenden Störsignal zum aktuellen
Störsignal hinzu addiert wird.
Durch das erfindungsgemäße Verfahren wird erreicht, daß am
Eingang des Spracherkennungssystems immer ein konstanter Stör
pegel anliegt. Hierdurch ergeben sich sowohl in ruhiger
Umgebung (Standbetrieb) als auch in maximaler Störumgebung
(Autobahnbetrieb) immer identische Verhältnisse für das Sprach
erkennungssystem während unterschiedlicher Erkennungsvorgänge.
Die Anwendung eines Spracherkennungssystems, bei dem das er
findungsgemäße Verfahren Anwendung findet, kann z. B. zum An
steuern eines Autotelefons dienen, wodurch sich für den Fahrer
eine erhebliche Entlastung bei der Bedienung des Gerätes ver
bunden mit einer Erhöhung der Fahrsicherheit ergibt.
Eine zweckmäßige Schaltungsanordnung zur Durchführung des Ver
fahrens gemäß der vorliegenden Erfindung ist dadurch gekenn
zeichnet, daß das dem maximal auftretenden Störgeräusch ent
sprechende Störsignal in einem Rauschgenerator abgespeichert
ist und über ein spannungsgesteuertes Dämpfungsglied einer
Addierschaltung zugeführt wird, während das aktuelle Störsignal
über ein Nahbesprechungsmikrofon und einem nachgeschalteten
Mikrofonverstärker der Addierschaltung zugeführt wird, wobei
das spannungsgesteuerte Dämpfungsglied von in zwei Gleich
richterschaltungen erzeugten den beiden Störsignalen
proportionalen Gleichspannungssignalen angesteuert wird, und
das Ausgangssignal der Addierschaltung dem eigentlichen Eingang
des Spracherkennungssystems zugeleitet wird. Eine derartige
gemäß der vorliegenden Erfindung aufgebaute Schaltungsanordnung
ermöglicht ohne großen technischen Schaltungsaufwand die Ein
haltung eines konstanten Störpegels am Eingang des Spracher
kennungssystems.
Eine andere zweckmäßige Ausgestaltung der Erfindung ist dadurch
gekennzeichnet, daß zwischen der Gleichrichterschaltung für das
aktuelle Störsignal und dem spannungsgesteuerten Dämpfungsglied
ein Speicher angeordnet ist. Auf diese Weise wird erreicht, daß
während einer Spracheingabe, die in der Regel aus einem Wort
besteht, die Störsignalkompensation konstant gehalten wird, da
man in der Regel davon ausgehen kann, daß sich während einer
Spracheingabe die Umgebungsgeräusche nicht wesentlich ändern.
Die Erfindung wird nachfolgend anhand eines in der Zeichnung
dargestellten Ausführungsbeispiels näher erläutert.
Die dargestellte Figur zeigt den prizipiellen Aufbau einer
Eingangsschaltung ES, mit der das erfindungsgemäße Verfahren
durchgeführt werden kann, sowie ein beliebiges Spracherkennungs
system SES.
Auf den genauen Aufbau des Spracherkennungssystems soll im
folgenden nur kurz eingegangen werden, da dieser Aufbau das
erfindungsgemäße Verfahren nicht betrifft und den einschlägigen
Fachleuten bekannt sein dürfte. Ein sprecherabhängiges Sprach
erkennungssystem besteht im wesentlichen aus drei Bausteinen,
einem Analog-Interface, einem Arithmetikprozessor und einem
Controller nebst einem Referenzspeicher. Durch das Anwender
system wird das Spracherkennungssystem über die Befehle Ver
stärkungseinstellung, Lernen und Erkennen gesteuert. Die Ver
stärkungseinstellung bewirkt eine Anpassung des Signalpegels an
die individuelle Sprachlautstärke, außerdem wird ein Pegel
schwellwert berechnet, der eine Wortgrenzendetektion ermöglicht.
Ein sprecherabhängiges Spracherkennungssytem erfordert eine
Lernphase, in der die Merkmale der zu erkennenden Worte
analysiert und in den Referenzspeicher geladen werden. In der
Erkennungsphase werden die relevanten Merkmale des eingegebenen
Wortes mit den abgespeicherten Referenzmustern verglichen und
der Ähnlichkeitsgrad festgestellt.
Mittels des Analog-Interface erfolgt die Verstärkungseinstellung
sowie eine spektrale Entzerrung und eine Begrenzung des
Frequenzbereichs des Sprachsignals auf z. B. 5 kHz als Vorbe
dingung für die anschließende Digitalisierung des Sprachsignals,
die z. B. durch Abtastung mit einer Frequenz von 10 kHz und
einer logarithmischen Quantisierung mit 8 Bit Auflösung erfol
gen kann. Der Artithmetikprozessor führt eine Spektralanalyse
der digitalisierten Sprache und den Vergleich der Sprachmuster
in der Erkennungsphase durch. Während der Sprachanalyse wird
z. B. alle 10 Millisekunden ein Satz spektraler Intensitätswerte
ausgegeben und dem nachfolgenden Controller zugeführt. Der
Controller steuert die beiden anderen Bausteine, empfängt
Commandos vom Anwendersystem, verwaltete den Referenzspeicher
und sendet das Ergebnis der Einzelworterkennung an das
Anwendersystem.
Nachfolgend wird der Aufbau der Eingangsschaltung ES be
schrieben. Voraussetzung für die einwandfreie Funktion des
nachgeschalteten Spracherkennungssystems SES ist das einmalige
Abspeichern des maximal im Auto auftretenden Umgebungsgeräusches
in einem Rauschgenerator RG. Das einmalige Abspeichern kann
z. B. über einen Zeitraum von ca. 10 Millisekunden Dauer bei
Autobahnbetrieb erfolgen. Im Rauschgenerator RG erfolgt dann
eine Wiedergabe dieser aufgenommenen Sequenz im "Endlosschleifen
betrieb". Dabei kann die Abspeicherung sowohl analog als auch,
was technisch einfacher zu realisieren ist, digital abgespeichert
werden. Der Rauschgenerator RG erzeugt an seinem Ausgang ein
maximal auftretendes Störsignal, das über ein spannungsgesteuer
tes Dämpfungsglied DG einem Eingang einer Addierschaltung Add
zugeführt wird. Das jeweils aktuelle Störsignal wird über ein
Nahbesprechungsmikrofon M, welches z. B. im Handapparat eines
Autotelefons angeordnet ist, und einen Mikrofonverstärker MV
einem zweiten Eingang der Addierschaltung Add zugeführt.
Mit Aktivierung des Spracherkennungssystems SES und vor einer
Spracheingabe, wird auch die Eingangsschaltung ES aktiviert
und das jeweils aktuelle Störsignal der Addierschaltung Add
zugeführt. Gleichzeitig werden mit Hilfe der beiden Gleich
richterschaltungen GS 1 und GS 2 proportionale Gleichspannungen
zur Ansteuerung des Dämpfungsgliedes DG gebildet. Hierbei
repräsentieren die jeweiligen proportionalen Gleichspannungen
die Größe der beidenStörsignale. Das spannungsgesteuerte
Dämpfungsglied DG arbeitet nun derart, daß bei kleiner werden
dem aktuellem Störsignal der Anzahl des maximal auftretenden
Störsignals, welcher der Addierschaltung Add zugeführt wird,
so eingestellt wird, daß am Ausgang der Addierschaltung Add
immer ein Störsignal mit gleichem Pegel anliegt.
Mit Hilfe dieser Eingangsschaltung ES ist es also möglich,
sowohl für die Lern- als auch für die Erkennungsphase am Eingang
eines Spracherkennungssystems gleiche "Umgebungsverhältnisse"
zu schaffen, so daß eine sichere Worterkennung gewährleistet
ist.
Der Speicher Sp dient dazu, die das aktuelle Störsignal re
präsentierende proportionale Gleichspannung während der nach
folgenden Spracheingabe konstant zu halten, da vorausgesetzt
wird, daß während einer Spracheingabe von einem Wort keine
wesentlichen Änderungen der aktuellen Umgebungsgeräusche ein
treten.
Bei der Anwendung der vorliegenden Erfindung stand die
Anwendung von Spracheingabe in Verbindung mit einem Autotelefon
zur Entlastung des Fahrers bei Bedienung des Gerätes im Vorder
grund. Denkbar ist jedoch auch die Anwendung des erfindungsge
mäßen Verfahrens mit einem Spracherkennungssystem in Verbindung
mit anderen Anwendersystemen.
Durch den Einsatz von Spracheingabe bei Autotelefonen reduziert
sich der Wählvorgang auf das Abnehmen des Handapparates und das
anschließende Einsprechen des gewünschten Teilnehmernamens
bzw. der Teilnehmerziffern. Nach der Erkennung stellt das
System automatisch die betreffende Telefonverbindung her, so
daß der Fahrer während des ganzen Vorgangs seine uneingeschränkte
Aufmerksamkeit dem Straßenverkehr widmen kann. Eine Wahlwieder
holung im Falle eines erfolglosen Rufes könnte ebenfalls durch
Spracheingabe aktiviert werden.
Claims (3)
1. Verfahren zur Kompensation von Störgeräuschen für in Fahr
zeugen installierte sprecherabhängige Spracherkennungssysteme,
dadurch gekennzeichnet, daß das im
Fahrzeug maximal auftretende Störgeräusch einmalig abgespeichert
wird und daß nach jeder Aktivierung des Spracherkennungssystems
vor einer Spracheingabe die Differenz zwischen dem jeweils
aktuellen Störsignal und dem dem maximal auftretenden Stör
geräusch entsprechenden Störsignal zum aktuellen Störsignal
hinzuaddiert wird.
2. Schaltungsanordnung zur Durchführung des Verfahrens nach
Anspruch 1,
dadurch gekennzeichnet, daß das dem
maximal auftretenden Störgeräusch entsprechende Störsignal in
einem Rauschgenerator (RG) abgespeichert ist und über ein
spannungsgesteuertes Dämpfungsglied (DG) einer Addierschaltung
(Add) zugeführt wird, während das aktuelle Störsignal über ein
Nahbesprechungsmikrofon (M) und einen nachgeschalteten Mikro
fonverstärker (MV) der Addierschaltung (Add) zugeführt wird,
wobei das spannungsgesteuerte Dämpfungsglied (DG) von in zwei
Gleichrichterschaltungen (GS 1, GS 2) erzeugten den beiden Stör
signalen proportionalen Gleichspannungssignalen gesteuert wird,
und das Ausgangssignal der Addierschaltung (Add) dem eigent
lichen Eingang des Spracherkennungssystems zugeleitet wird.
3. Schaltungsanordnung nach Anspruch 2,
dadurch gekennzeichnet, daß zwischen
der Gleichrichterschaltung (GS 1) für das aktuelle Störsignal
und dem spannungsgesteuerten Dämpfungsglied (DG) ein Speicher
(Sp) angeordnet ist.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE19873732394 DE3732394A1 (de) | 1987-09-25 | 1987-09-25 | Verfahren zur kompensation von stoergeraeuschen fuer in fahrzeugen installierte sprecherabhaengige spracherkennungssysteme |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE19873732394 DE3732394A1 (de) | 1987-09-25 | 1987-09-25 | Verfahren zur kompensation von stoergeraeuschen fuer in fahrzeugen installierte sprecherabhaengige spracherkennungssysteme |
Publications (1)
Publication Number | Publication Date |
---|---|
DE3732394A1 true DE3732394A1 (de) | 1989-04-06 |
Family
ID=6336909
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE19873732394 Withdrawn DE3732394A1 (de) | 1987-09-25 | 1987-09-25 | Verfahren zur kompensation von stoergeraeuschen fuer in fahrzeugen installierte sprecherabhaengige spracherkennungssysteme |
Country Status (1)
Country | Link |
---|---|
DE (1) | DE3732394A1 (de) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE19813285A1 (de) * | 1998-03-26 | 1999-09-30 | Bayerische Motoren Werke Ag | Verfahren zur automatischen Messung der Sprachverständlichkeit in Kraftfahrzeugen |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE1512758C1 (de) * | 1967-02-14 | 1977-09-15 | Sennheiser Electronic | Vocoder fuer hohe Stoerlautstaerken |
US4532648A (en) * | 1981-10-22 | 1985-07-30 | Nissan Motor Company, Limited | Speech recognition system for an automotive vehicle |
US4610023A (en) * | 1982-06-04 | 1986-09-02 | Nissan Motor Company, Limited | Speech recognition system and method for variable noise environment |
DE3642591A1 (de) * | 1985-12-20 | 1987-11-12 | Bayerische Motoren Werke Ag | Verfahren zur spracherkennung in geraeuschvoller umgebung |
-
1987
- 1987-09-25 DE DE19873732394 patent/DE3732394A1/de not_active Withdrawn
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE1512758C1 (de) * | 1967-02-14 | 1977-09-15 | Sennheiser Electronic | Vocoder fuer hohe Stoerlautstaerken |
US4532648A (en) * | 1981-10-22 | 1985-07-30 | Nissan Motor Company, Limited | Speech recognition system for an automotive vehicle |
US4610023A (en) * | 1982-06-04 | 1986-09-02 | Nissan Motor Company, Limited | Speech recognition system and method for variable noise environment |
DE3642591A1 (de) * | 1985-12-20 | 1987-11-12 | Bayerische Motoren Werke Ag | Verfahren zur spracherkennung in geraeuschvoller umgebung |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE19813285A1 (de) * | 1998-03-26 | 1999-09-30 | Bayerische Motoren Werke Ag | Verfahren zur automatischen Messung der Sprachverständlichkeit in Kraftfahrzeugen |
DE19813285B4 (de) * | 1998-03-26 | 2005-12-01 | Bayerische Motoren Werke Ag | Verfahren zur automatischen Messung der Sprachverständlichkeit in Kraftfahrzeugen |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE69117014T2 (de) | Methode und Einrichtung zur Spracherkennung | |
DE69324629T2 (de) | Verfahren und Vorrichtung zur Spracherkennung | |
DE3752288T2 (de) | Sprachprozessor | |
DE4017596A1 (de) | Vorrichtung zur automatischen lautstaerkesteuerung in fahrzeugen | |
EP0747880B1 (de) | Spracherkennungssystem | |
DE69322588T2 (de) | Anordnung zum Demodulieren von Sprachsignalen, welche diskontinuierlich von einer mobilen Einheit übertragen werden | |
DE4031638C2 (de) | ||
DE69532026T2 (de) | Schaltung zum automatischen Variieren des Pegels eines Empfangssprachsignals in einem Fernprechgerät | |
DE19611026C1 (de) | Klirrunterdrückung bei Hörgeräten mit AGC | |
EP1077448A2 (de) | Spracherkennung unter Berücksichtigung der Lautstärkeschwankungen | |
EP0623995B1 (de) | Anordnung zur geräuschabhängigen Regelung der Lautstärke eines Autoradios | |
DE4010028C2 (de) | Spracherkennungsverfahren | |
DE3733983A1 (de) | Verfahren zum daempfen von stoerschall in von hoergeraeten uebertragenen schallsignalen | |
DE3141254C2 (de) | Sprachausgabevorrichtung | |
EP0467157B1 (de) | Sprachgesteuertes Gerät der Unterhaltungselektronik, insbesondere Videorecorder | |
DE3732394A1 (de) | Verfahren zur kompensation von stoergeraeuschen fuer in fahrzeugen installierte sprecherabhaengige spracherkennungssysteme | |
DE10025655B4 (de) | Verfahren zum Entfernen einer unerwünschten Komponente aus einem Signal und System zum Unterscheiden zwischen unerwünschten und erwünschten Signalkomponenten | |
DE19827197A1 (de) | Verfahren und Einrichtung zur Beeinflussung der Lautstärke von Audiowiedergabegeräten in Kraftfahrzeugen | |
WO1999048086A1 (de) | Mikrophonanordnung für die spracherkennung unter variablen räumlichen bedingungen | |
DE3734446A1 (de) | Verfahren und schaltungsanordnung zur stoergeraeuschkompensation fuer ein mikrofon | |
DE19839466A1 (de) | Verfahren und Steuereinrichtung zur Bedienung technischer Einrichtungen eines Fahrzeugs | |
DE102004001863A1 (de) | Verfahren und Vorrichtung zur Bearbeitung eines Sprachsignals | |
EP0309869B1 (de) | Verfahren zur Kompensation von mit Störungen behafteten Sprachsignalen für Spracherkennungssysteme | |
DE2312356A1 (de) | Verfahren und vorrichtung zur bestimmung der grundfrequenz von sprachsignalen | |
EP0527535A2 (de) | Anordnung zur Sprachübertragung |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8110 | Request for examination paragraph 44 | ||
8139 | Disposal/non-payment of the annual fee |