DE3129282A1 - Verfahren zur sprecherabhaengigen erkennung von einzelnen gesprochenen worten in fernmeldesystemen - Google Patents

Verfahren zur sprecherabhaengigen erkennung von einzelnen gesprochenen worten in fernmeldesystemen

Info

Publication number
DE3129282A1
DE3129282A1 DE19813129282 DE3129282A DE3129282A1 DE 3129282 A1 DE3129282 A1 DE 3129282A1 DE 19813129282 DE19813129282 DE 19813129282 DE 3129282 A DE3129282 A DE 3129282A DE 3129282 A1 DE3129282 A1 DE 3129282A1
Authority
DE
Germany
Prior art keywords
words
parameters
person
speech
input device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE19813129282
Other languages
English (en)
Inventor
Werner Dipl.-Ing. 8000 München Liegl
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens AG
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG filed Critical Siemens AG
Priority to DE19813129282 priority Critical patent/DE3129282A1/de
Publication of DE3129282A1 publication Critical patent/DE3129282A1/de
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07CTIME OR ATTENDANCE REGISTERS; REGISTERING OR INDICATING THE WORKING OF MACHINES; GENERATING RANDOM NUMBERS; VOTING OR LOTTERY APPARATUS; ARRANGEMENTS, SYSTEMS OR APPARATUS FOR CHECKING NOT PROVIDED FOR ELSEWHERE
    • G07C9/00Individual registration on entry or exit
    • G07C9/20Individual registration on entry or exit involving the use of a pass
    • G07C9/22Individual registration on entry or exit involving the use of a pass in combination with an identity check of the pass holder
    • G07C9/25Individual registration on entry or exit involving the use of a pass in combination with an identity check of the pass holder using biometric data, e.g. fingerprints, iris scans or voice recognition
    • G07C9/257Individual registration on entry or exit involving the use of a pass in combination with an identity check of the pass holder using biometric data, e.g. fingerprints, iris scans or voice recognition electronically

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Character Discrimination (AREA)

Description

  • Verfahren zur sprecherabhängigen Erkennung von einzelnen
  • gesprochenen Worten in Fernmeldesystemen.
  • Die Erfindung betrifft ein Verfahren zur sprecherabhängigen Erkennung von einzelnen gesprochenen Worten in Fernmeldesystemen, wobei nach Eingabe einer Kennnummer über ein Eingabegerät, z.B. einen Fernsprechapparat und Erkennung dieser Kennummer als einer bebestimmten Person zugeordnet, aus einer bestimmten Anzahl von dieser Person ursprünglich in einen Sprachmusterspeicher eines zentral angeordneten Spracherkennungssystems eingesprochener und dort in Sprachparameterform gespeicherter Worte willkürlich ein Teil dieser Worte ausgewählt und über z.B. ein Display am Eingabegerät der dort befindlichen Person angezeigt wird und daß nach Einsprechen dieser angezeigten Worte in das Eingabegerät durch die dort befindliche Person diese Worte in einer Aufbereitungseinheit des Spracherkennungssystems in die einzelnen charakteristischen Sprachparameter zerlegt und mit den den ausgewählten Worten entsprechenden im Sprachmusterspeicher befindlichen Sprachparametern verglichen werden.
  • Es ist bereits ein Verfahren bekannt (Electronics Januar 27,1981, S.53, Hamilton: Just a phone call will transfer funds), bei welchem eine berechtigte Person über ein Eingabegerät - z.B. einen Fernsprechapparat mit Display - eine personenbezogene Kennummer zu einem Spracherkennungssystem durchgibt. Dieses Spracherkennungssystem enthält einen dieser Kennummer zugeordneten Sprachmusterspeicher, in welchem ca. 10 von dieser Person ursprünglich eingesprochene Worte in Form von sprachcharakteristischen auf diese Person be- zogenen Sprachparameter eingespeichert sind. Das Spracherkennungssystem wählt willkürlich z.B. vier von diesen Worten aus und gibt diese nacheinander in Schriftform auf eine Anzeige (Display) des Eingabegerätes. Damit wird die eingebende Person aufgefordert, diese vier Worte einzusprechen. Eine in dem Spracherkennungssystem enthaltene Aufbereitungseinheit setzt diese gesprochenen Worte in die sprechercharakteristischen, Sprachparameter um und diese werden dann mit dem im Sprachmusterspeicher enthaltenen, den vier Worten entsprechenden Sprachparametern verglichen. Stimmen die von der Aufbereitungsein heit gelieferten und die im Sprachmusterspeicher enthaltenen Parameter in einem bestimmten Mindestmaß überein, dann erfolgt eine positive Erkennung, die beispielsweise die Bearbeitung eines Auftrages oder die Zugangsmöglichkeit zu einem Raum usw. ermöglicht. Stimmen die Parameter nicht ausreichend überein, dann kann die Aufforderung zum wiederholten Einsprechen oder z.B. eine Sperrreaktion erfolgen.
  • Die Aufgabe der Erfindung soll darin bestehen, ein Verfahren zu finden, mit Hilfe dessen man auf die Eingabe einer Kennummer verzichten kann und bei dem vor allem ein bei einem großen Personenkreis relativ großer Wortmusterspeicher entfallen kann, wobei die Sicherheit der Erkennung und die Fälschungssicherheit gewahrt bleiben soll.
  • Dies wird nach dem erfindungsgemäßen Verfahren dadurch erreicht, daß am Eingabegerät eine zur Abtastung eines Magnetstreifens geeignete Abtasteinrichtung vorgesehen ist, in welche von der eingebenden Person ein Magnetstreifenträger einschiebbar ist, wobei der Magnetstreifen eine Anzahl von der eingebenden Person ursprünglich gesprochener Worte in Sprachparameterform gespeichert enthält und wobei nach Aufnahme dieser Sprachparameter im Spracherkennungssystem nach Auswahl eines kleineren Teiles der auf dem Magnetstreifen vorhandenen Worte bzw.
  • deren Sprachparameter und Durchgabe der Worte mit Sprechaufforderung an das Eingabegerät die von der eingebenden Person gesprochenen Worte in der Aufbereitungseinheit in die charakteristischen Sprachparameter umgesetzt und als solche mit den entsprechenden aus dem Magnetstreifen gewonnenen Sprachparametern verglichen werden.
  • Hieraus ergibt sich der Vorteil, daß man auf die Eingabe einer Kennummer verzichten kann und daß der bei einem großen Personenkreis relativ große Wortmusterspeicher entfällt. Außerdem ergibt sich der Vorteil, daß bei Vorhandensein einer Vorrichtung zur Sprachanalyse und Eingabe für den Magnetstreifen das Belegen des Magnetstreifens mit Information von dem Ort des Spracherkennungssystems unabhängig ist und daß jederzeit eine Informationsänderung auf einem einzelnen Magnetstreifen ohne Eingriff in das Spracherkennungssystem vorgenommen werden kann, Auch ist die Anzahl der Magnetstreifenbesitzer unbegrenzt.
  • Zum besseren Verständnis des erfindungsgemäßen Verfahrens soll nachstehend kurz auf die Wirkungsweise eines die menschliche Sprache erkennenden Spracherkennungssystems eingegangen werden.
  • Ein elektronisches Spracherkennungssystem analysiert die akustischen Parameter eines gesprochenen Wortes und vergleicht diese mit den Parametern eines vorher von diesem Sprecher in einer Lernphase gesprochenen und in einem Sprachmusterspeicher abgespeicherten Musterwortes. Unter "Lernenn ist dabei zu verstehen, daß die Person das oder die einzelnen Wörter mehrmals über ein Eingabegerät in den Aufbereitungsteil des Spracherkennungssystems eingibt, so daß dort die charakteristischen Parameter ge- wonnen und abgespeichert werden können. Unter Wortparameter sind Parameter zu verstehen, die z.3. Aussagen machen über die Grundfrequenz der Stimme der einsprechenden Person, über Sprechgeschwindigkeit, Sprechlautstärke und Bestimmung anderer sprecherunterschiedlicher Parameter. Werden später eingesprochene Worte in ihre Parameter zerlegt, dann wird sich eine Ubereinstimmung dieser Parameter mit den Parametern des gleichen Wortes in Wortmusterspeicher nur ergeben, wenn das Einsprechen der Worte durch die gleiche Person erfolgt.
  • Hat die berechtigte Person ihre Kennummer in das Spracherkennungssystem eingegeben, dann wird dort der Zugriff zu einem Speicherplatz im Wortmusterspeicher ermöglicht, der alle von der der Kennummer entsprechenden Person ursprünglichen eingesprochenen, d.h. "gelernten" Worte in Parameterform enthält. In dem bekannten System erfolgt nun eine Auswahl von einigen Worten aus der Gesamtzahl der von dieser Person "gelernten" Worte und diese werden im allgemeinen nach einer Umsetzung in eine für eine Displayanzeige auswertbare Information am Eingabegerät sichtbar gemacht. Die entsprechende Person muß nun über das Eingabegerät diese Worte möglichst in der gelerntenn Form (entsprechende Betonung, Sprechgeschwindigkeit) einsprechen. Die Worte werden in einer Aufbereitungseinheit nach einer Wortanfang- und -wortende erkennung in die sprechercharakteristischen Parameter umgesetzt. Waren beispielsweise 4 Worte aus der Zahl der gelernten Worte einzusprechen, dann werden Jetzt die Parameter der eingegebenen mit den entsprechenden Parametern der in Parameterform gespeicherten 4 Worte verglichen. Es kommt zu einem Erkennen der Person oder zu einer Rückweisungsanzeige, wenn alle oder auch nur eines der Worte als von dieser Person gesprochen nicht erkannt wurde.
  • Bei dem erfindungsgemäßen Verfahren ist in dem Spracherkennungssystem kein Wortmusterspeicher mit einem festen Speicherplatz für jeweils eine Person vorgesehen, sondern es ist nur ein Kurzzeitspeicher (überschreibbar) vorgesehen, der für kurze Zeit die Sprachparameter aller ttgelernten" Worte einer einzigen Person aufnimmt.
  • Der Lernvorgang ist in diesem Fall so zu verstehen, daß sich zum Beispiel auf einem Ausweis der bestimmten Person ein Magnetstreifen befindet, welcher von dem Eigentümer über eine Eingabevorrichtung besprochen wurde.
  • Dabei ist eine bestimmte Anzahl von Worten vorgeschrieben, die als oben geschilderte Sprachparameter vorliegen.
  • An dem Eingabegerät, über welches im Bedarfsfall die Verbindung zu dem Spracherkennungssystem hergestellt wird, befindet sich eine Abtastvorrichtung, welche den Informationsinhalt des Magnetstreifens zum Spracherkennungssystem überträgt. Das Spracherkennungssystem wählt jetzt aus dem in Parameterform vorliegenden Worten z.B. 4 Worte aus und sendet diese zur Sichtbarmachung auf einer Displayanzeige zum Eingabegerät mit einer Einsprechaufforderung zurück. Die betreffende Person muß nun diese 4 Worte einsprechen und diese werden durch die Aufbereitungseinheit in die charakteristischen Parameter zerlegt. Anschließend erfolgt ein Vergleich dieser durch Zerlegung gewonnenen Parameter mit den im Kurzzeitspeicher enthaltenen, den vier Worten entsprechenden Parametern. Stimmen die Parameter in einem bestimmten Mindestmaß überein, dann erfolgt eine positive Kennung und Freigabe des angeforderten Dienstes. Im negativen Falle erfolgt eine Wiederholungsaufforderung oder z.B.
  • eine endgültige Rückweisung. In allen Fällen wird der Kurzzeitspeicher freigegeben und ist für eine erneute Einspeicherung (Uberschreibung) frei.
  • Aus dem Vorstehenden geht hervor, daß es nach dem erfindungsgemäßen Verfahren in einfacher Weise möglich ist, die Eingabe einer Kennummer zu vermeiden und einen großen Festspeicher zur Einspeicherung der Musterworte aller Worte der berechtigten Personen durch einen wesentlich kleineren Kurzzeitspeicher zu ersetzen.
  • Außerdem erhöht sich die Bedienungsfreundlichkeit.
  • 1 Patentanspruch

Claims (1)

  1. Patentanspruch Verfahren zur sprecherabhängigen Erkennung von einzelnen gesprochenen Worten in Fernmeldesystemen, wobei nach Eingabe einer Kennummer über ein Eingabegerät, z.B. einen Fernsprechapparat und Erkennung dieser Kennummer als einer bestimmten Person zugeordnet, aus einer bestimmten Anzahl von dieser Person ursprünglich in einen Sprachmusterspeicher eines zentral angeordneten Spracherkennungssystems eingesprochener und dort in Sprachparameterform gespeichermeter Worte willkürlich ein Teil dieser Worte ausgewählt und über z.B. ein Display am Eingabegerät der :dort befindlichen Person angezeigt wird und daß nach Einsprechen dieser angezeigten Worte in das Eingabegerät durch die dort befindliche Person diese Worte in einer Aufbereitungseinheit des Spracherkennungssystems in die einzelnen charakteristischen Sprachparameter zerlegt und mit den den ausgewählten Worten entsprechenden im Sprachmusterspeicher befindlichen Sprachparametern verglichen werden, d a d u r c h g e k e n n z e i c h n e t , daß am Eingabegerät eine zur Abtastung eines Magnetstreifens geeignete Abtastvorrichtung vorgesehen ist, in welche von der eingebenden Person ein Magnetstreifenträger einschiebbar ist, wobei der Magnetstreifen eine Anzahl von der eingebenden Person ursprünglich eingesprochener Worte in Form von Sprachparametern gespeichert enthält und wobei nach Aufnahme dieser Sprachparameter im Spracherkennungssystem nach Auswahl eines kleineren Teiles der auf dem Magnetstreifen vorhandenen Worte bzw.
    deren Sprachparameter und Durchgabe der Worte mit Sprechaufforderung an das Eingabegerät die von der eingebenden Person gesprochenen Worte in der Aufbereitungseinheit in die charakteristischen Sprachparameter umgesetzt und als solche mit den entsprechenden aus dem Magnetstreifen gewonnenen Sprachparametern verglichen werden.
DE19813129282 1981-07-24 1981-07-24 Verfahren zur sprecherabhaengigen erkennung von einzelnen gesprochenen worten in fernmeldesystemen Withdrawn DE3129282A1 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE19813129282 DE3129282A1 (de) 1981-07-24 1981-07-24 Verfahren zur sprecherabhaengigen erkennung von einzelnen gesprochenen worten in fernmeldesystemen

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE19813129282 DE3129282A1 (de) 1981-07-24 1981-07-24 Verfahren zur sprecherabhaengigen erkennung von einzelnen gesprochenen worten in fernmeldesystemen

Publications (1)

Publication Number Publication Date
DE3129282A1 true DE3129282A1 (de) 1983-02-10

Family

ID=6137676

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19813129282 Withdrawn DE3129282A1 (de) 1981-07-24 1981-07-24 Verfahren zur sprecherabhaengigen erkennung von einzelnen gesprochenen worten in fernmeldesystemen

Country Status (1)

Country Link
DE (1) DE3129282A1 (de)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0086064A1 (de) * 1982-01-29 1983-08-17 Kabushiki Kaisha Toshiba Einrichtung zur Identitätsüberprüfung
DE3643838A1 (de) * 1986-12-20 1988-06-30 Telefonbau & Normalzeit Gmbh Spracherkennungseinrichtung fuer dienste-integrierende kommunikationsanlagen, insbesondere fernsprechvermittlungsanlagen
DE3708001A1 (de) * 1987-03-12 1988-09-22 Telefonbau & Normalzeit Gmbh Verfahren zum testen von spracherkennern und sprechererkennern
DE3819178A1 (de) * 1987-06-04 1988-12-22 Ricoh Kk Spracherkennungsverfahren und -einrichtung
DE3834869A1 (de) * 1988-10-13 1990-04-26 Telefonbau & Normalzeit Gmbh Verfahren zur sprachabhaengigen identifizierung von personen
FR2642882A1 (fr) * 1989-02-07 1990-08-10 Ripoll Jean Louis Appareil de traitement de la parole
EP0407882A1 (de) * 1989-07-11 1991-01-16 Siemens Aktiengesellschaft Anordnung zur Verifikation einer Systemzugangsberechtigung einer Person
US5040213A (en) * 1989-01-27 1991-08-13 Ricoh Company, Ltd. Method of renewing reference pattern stored in dictionary
US5144672A (en) * 1989-10-05 1992-09-01 Ricoh Company, Ltd. Speech recognition apparatus including speaker-independent dictionary and speaker-dependent
US5231691A (en) * 1989-10-06 1993-07-27 Ricoh Company, Ltd. Speech recognition system including interrupt scheme that avoids operational and interfacing conflicts
EP0589184A2 (de) * 1992-09-24 1994-03-30 Robert Bosch Gmbh Verfahren zum Feststellen der Identität des Inhabers einer Chipkarte, insbesondere Kreditkarte
US5347612A (en) * 1986-07-30 1994-09-13 Ricoh Company, Ltd. Voice recognition system and method involving registered voice patterns formed from superposition of a plurality of other voice patterns
US5355433A (en) * 1990-03-26 1994-10-11 Ricoh Company, Ltd. Standard pattern comparing system for eliminating duplicative data entries for different applications program dictionaries, especially suitable for use in voice recognition systems

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0086064A1 (de) * 1982-01-29 1983-08-17 Kabushiki Kaisha Toshiba Einrichtung zur Identitätsüberprüfung
US5347612A (en) * 1986-07-30 1994-09-13 Ricoh Company, Ltd. Voice recognition system and method involving registered voice patterns formed from superposition of a plurality of other voice patterns
DE3643838A1 (de) * 1986-12-20 1988-06-30 Telefonbau & Normalzeit Gmbh Spracherkennungseinrichtung fuer dienste-integrierende kommunikationsanlagen, insbesondere fernsprechvermittlungsanlagen
DE3708001A1 (de) * 1987-03-12 1988-09-22 Telefonbau & Normalzeit Gmbh Verfahren zum testen von spracherkennern und sprechererkennern
DE3819178A1 (de) * 1987-06-04 1988-12-22 Ricoh Kk Spracherkennungsverfahren und -einrichtung
US5091947A (en) * 1987-06-04 1992-02-25 Ricoh Company, Ltd. Speech recognition method and apparatus
DE3834869A1 (de) * 1988-10-13 1990-04-26 Telefonbau & Normalzeit Gmbh Verfahren zur sprachabhaengigen identifizierung von personen
US5040213A (en) * 1989-01-27 1991-08-13 Ricoh Company, Ltd. Method of renewing reference pattern stored in dictionary
WO1990009656A1 (fr) * 1989-02-07 1990-08-23 Alcept Appareil de traitement de la parole
FR2642882A1 (fr) * 1989-02-07 1990-08-10 Ripoll Jean Louis Appareil de traitement de la parole
EP0407882A1 (de) * 1989-07-11 1991-01-16 Siemens Aktiengesellschaft Anordnung zur Verifikation einer Systemzugangsberechtigung einer Person
US5144672A (en) * 1989-10-05 1992-09-01 Ricoh Company, Ltd. Speech recognition apparatus including speaker-independent dictionary and speaker-dependent
US5231691A (en) * 1989-10-06 1993-07-27 Ricoh Company, Ltd. Speech recognition system including interrupt scheme that avoids operational and interfacing conflicts
US5355433A (en) * 1990-03-26 1994-10-11 Ricoh Company, Ltd. Standard pattern comparing system for eliminating duplicative data entries for different applications program dictionaries, especially suitable for use in voice recognition systems
EP0589184A2 (de) * 1992-09-24 1994-03-30 Robert Bosch Gmbh Verfahren zum Feststellen der Identität des Inhabers einer Chipkarte, insbesondere Kreditkarte
EP0589184A3 (de) * 1992-09-24 1995-03-01 Telefonbau & Normalzeit Gmbh Verfahren zum Feststellen der Identität des Inhabers einer Chipkarte, insbesondere Kreditkarte.

Similar Documents

Publication Publication Date Title
DE69427322T2 (de) Verfahren und System zur Identitätsprüfung eines Sprechers
DE3129282A1 (de) Verfahren zur sprecherabhaengigen erkennung von einzelnen gesprochenen worten in fernmeldesystemen
DE69617544T2 (de) Verfahren und -vorrichtung zur erzeugung eines mensch/maschine-dialogs mit bedienereingriff
DE2753707A1 (de) Einrichtung zur erkennung des auftretens eines kommandowortes aus einer eingangssprache
DE10036851A1 (de) Verfahren zur Auswahl einer Ortsbezeichnung in einem Navigationssystem durch Spracheingabe
DE69702454T2 (de) Sicherheitsvorrichtungen und systeme
DE4134410A1 (de) Verkaufssystem mit einer vorgegebenen anzahl von faechern
EP0980565B1 (de) Verfahren zur anpassung eines referenzdatensatzes anhand mindestens eines eingabedatensatzes durch einen rechner
DE19942178C1 (de) Verfahren zum Aufbereiten einer Datenbank für die automatische Sprachverarbeitung
DE2422028A1 (de) Schaltungsanordnung zur identifizierung einer formantfrequenz in einem gesprochenen wort
EP0097203B1 (de) Verfahren zur Erkennung von gefälschten Datenträgern sowie Datenträger zur Durchführung des Verfahrens
DE3853702T2 (de) Spracherkennung.
DE10127559A1 (de) Benutzergruppenspezifisches Musterverarbeitungssystem
DE3029823C2 (de)
EP1125278B1 (de) Datenverarbeitungssystem oder kommunikationsendgerät mit einer einrichtung zur erkennung gesprochener sprache und verfahren zur erkennung bestimmter akustischer objekte
EP1749395B1 (de) Verfahren zum autorisieren einer fernmündlichen transaktion und vermittlungsknoten
DE68910258T2 (de) System zum Abtasten und Kodieren einer von einem Dokument getragenen magnetischen Spur bei Bewegung des Dokuments von Hand.
DE3784872T2 (de) Persoenliche stimmuster tragendes kartensystem.
EP1224661B1 (de) Verfahren und anordnung zur verifikation eines sprechers anhand eines rechners
DE4231937C1 (de) Verfahren zum Feststellen der Identität des Inhabers einer Chipkarte, inbesondere Kreditkarte
DE19710664C2 (de) Verfahren und Vorrichtung zur Personenerkennung
DE4240372A1 (en) Time logging system for workers in commercial organisation - has start and finish times logged and printed on card together with remaining work time in period
DE3006677A1 (de) Einrichtung zur sicherung des zugangs zu raeumen
DE2706154C2 (de) Zugangskontrollvorrichtung mit einem zentralen Computer und wenigstens einem vom Computer entfernt angeordneten Terminal
DE3834869C2 (de) Verfahren zur Identifizierung von Personen anhand gesprochener Worte

Legal Events

Date Code Title Description
8141 Disposal/no request for examination