DE10131157C1 - Dynamic grammatical weighting method for speech recognition system has existing probability distribution for grammatical entries modified for each identified user - Google Patents

Dynamic grammatical weighting method for speech recognition system has existing probability distribution for grammatical entries modified for each identified user

Info

Publication number
DE10131157C1
DE10131157C1 DE2001131157 DE10131157A DE10131157C1 DE 10131157 C1 DE10131157 C1 DE 10131157C1 DE 2001131157 DE2001131157 DE 2001131157 DE 10131157 A DE10131157 A DE 10131157A DE 10131157 C1 DE10131157 C1 DE 10131157C1
Authority
DE
Germany
Prior art keywords
probability distribution
user
speech recognition
recognition system
user profile
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn - After Issue
Application number
DE2001131157
Other languages
German (de)
Inventor
Florian M Unterkircher
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
EXCELSIS INFORMATIONSSYSTEME GMBH, 70178 STUTT, DE
Original Assignee
PROJECT49 AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by PROJECT49 AG filed Critical PROJECT49 AG
Priority to DE2001131157 priority Critical patent/DE10131157C1/en
Application granted granted Critical
Publication of DE10131157C1 publication Critical patent/DE10131157C1/en
Anticipated expiration legal-status Critical
Withdrawn - After Issue legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/065Adaptation
    • G10L15/07Adaptation to the speaker

Landscapes

  • Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)

Abstract

The grammatical weighting method identifies a user of the speech recognition system and provides an individual probability distribution for grammatic entries by adapting an existing probability distribution via a user profile for the identified user, the individual probability distribution employed by the speech recognition system during a spoken input. Also included are Independent claims for the following: (a) a computer program for a grammatical weighting method for a speech recognition system; (b) a speech identification system; (c) an application of a speech recognition system with grammatical weighting for automatic banking transactions

Description

Die Erfindung betrifft ein dynamisches Grammatik­ gewichtungsverfahren für Spracherkennungssysteme, worin eine Wahrscheinlichkeitsverteilung pn für Grammatikeinträge in ein Spracherkennungssystem implementiert wird, wobei die Implementierung erfolgt, während ein Benutzer mit dem Spracherkennungssystem verbunden ist.The invention relates to a dynamic grammar weighting method for speech recognition systems, in which a probability distribution p n for grammar entries is implemented in a speech recognition system, the implementation taking place while a user is connected to the speech recognition system.

Die Erfindung betrifft weiterhin ein Computerprogramm mit einem Programmcode zur Durchführung dieses Verfahrens und ein entsprechendes Spracherkennungssystem. Darüber hinaus betrifft die Erfindung eine Verwendung des Verfahrens oder des Computerprogramms im Bankenbereich zur Abwicklung von Bankgeschäften.The invention further relates to a computer program a program code for performing this method and a corresponding speech recognition system. Furthermore The invention relates to a use of the method or the computer program in the banking sector for the processing of Banking transactions.

Aus dem Stand der Technik sind Spracherkennungssysteme, wie in Fig. 5 dargestellt, grundsätzlich bekannt. Da in Fig. 5 beschriebene, aus dem Stand der Technik bekannte Spracherkennungssystem 520 dient zur Spracherkennung, d. h. zur Umsetzung von eingegebener Sprache mit möglichst hoher Wahrscheinlichkeit in eine entsprechende richtige Wortfolge. Die Sprache kann entweder direkt in das Spracherkennungssystem eingegeben oder diesem über ein Kommunikationssystem 510, z. B. in Form eines Telefonsystems, eines Mobilfunknetzes oder eines Local Area Networks etc. zugeführt werden.Speech recognition systems, as shown in FIG. 5, are known in principle from the prior art. Since the speech recognition system 520 described in FIG. 5 and known from the prior art is used for speech recognition, ie for converting input speech with the highest possible probability into a corresponding correct word sequence. The speech can either be entered directly into the speech recognition system or via a communication system 510 , e.g. B. in the form of a telephone system, a cellular network or a local area network, etc. are supplied.

Zur Durchführung der Spracherkennung sind in dem bekannten Spracherkennungssystem 520 eine Segmentierungseinheit 522 sowie ein akustisches Modell 524 und eine sogenannte Grammatik 526 üblicherweise als Software implementiert. Die Segmentierungseinheit 522 dient zur Zerlegung der eingegebenen Sprache in Sprachsegmente. Jedes dieser Sprachsegmente wird mit Hilfe des akustischen Modells 524 in eine Vielzahl von Phonemen abgebildet, wobei die einzelnen Phoneme jeweils mit einer unterschiedlichen Wahrscheinlichkeit das Sprachsegment repräsentieren. Danach erfolgt durch die Grammatik 526 eine Auswertung der Vielzahl der Phoneme, um letzten Endes eine Wortfolge zu bestimmen und über das Spracherkennungssystem auszugeben, welche dem Sprachsegment mit der größten Wahrscheinlichkeit entspricht.A segmentation unit 522 as well as an acoustic model 524 and a so-called grammar 526 are usually implemented as software in the known speech recognition system 520 to carry out the speech recognition. The segmentation unit 522 is used to break down the input language into language segments. Each of these speech segments is mapped into a plurality of phonemes using acoustic model 524 , the individual phonemes each representing the speech segment with a different probability. The grammar 526 then evaluates the plurality of phonemes in order to ultimately determine a word sequence and output it via the speech recognition system which corresponds to the speech segment with the greatest probability.

Aus der WO 00/68933 ist es bekannt, Sprachmuster einer Spracheingabe eines Benutzers dazu zu verwenden, um das akustische Modell eines Spracherkennungssystems an den Benutzer anzupassen. Es wird vorgeschlagen, diese Anpassung rekursiv bei einer Vielzahl von Spracheingaben des Benutzers vorzunehmen, um das akustische Modell sukzessive zu optimieren. Auf diese Weise wird die Genauigkeit, mit welcher das Spracherkennungssystem die Spracheingabe des Benutzers erkennt, ebenfalls sukzessive verbessert. From WO 00/68933 it is known to use a speech pattern Use a user's voice input to do this acoustic model of a speech recognition system to the Customize users. It is suggested this Recursive adjustment for a large number of voice inputs of the user to make the acoustic model to optimize successively. In this way the Accuracy with which the speech recognition system Recognizes the user's voice input, also successively improved.  

Die US 6 154 722 lehrt demgegenüber eine Adaption des Sprachmodells bzw. der Grammatik des Spracherkennungssystems zur Steigerung der Erkennungsgenauigkeit eines Spracherkennungssystems. Zur Adaption des Sprachmodells wird vorgeschlagen, eine n- Gram-Wahrscheinlichkeit nach Maßgabe durch Informationen, welche aus einer Wahrscheinlichkeit für eine kontextfreie Grammatik gewonnen werden, zu modifizieren.US 6 154 722, on the other hand, teaches an adaptation of the Language model or the grammar of the Speech recognition system to increase the Accuracy of recognition of a speech recognition system. to Adaptation of the language model is proposed, an n- Gram probability based on information, which is from a probability for a context-free Grammar can be obtained to modify.

Ausgehend von der US 6 154 722 als nächstliegendem Stand der Technik lag der Erfindung die Aufgabe zugrunde, ein bekanntes Grammatikgewichtungsverfahren, ein entsprechendes Computerprogramm und ein Spracherkennungssystem derart weiterzubilden, dass die Genauigkeit, mit welcher das Spracherkennungssystem von einem individuellen Benutzer eingegebene Sprache erkennt, weiter verbessert wird.Starting from US 6 154 722 as the closest stand the object of the invention was based on the technology known grammar weighting method, a corresponding computer program and a To further develop the speech recognition system in such a way that the Accuracy with which the speech recognition system from recognizes the language entered by an individual user, is further improved.

Diese Aufgabe wird durch den Gegenstand des Verfahrensanspruchs 1 gelöst. Genauer gesagt wird die Aufgabe dadurch gelöst, dass bei dem Verfahren folgende Schritte ausgeführt werden: Identifizieren des Benutzers; Ermitteln der Wahrscheinlichkeitsverteilung pn durch Adaptieren einer a-priori Wahrscheinlichkeitsverteilung Pn-1 anhand eines für den identifizierten Benutzer erstellten Benutzerprofils, welches Informationen zur Gewichtung von Grammatikeinträgen enthält, die für den identifizierten Benutzer spezifisch sind und Implementieren der Wahrscheinlichkeitsverteilung pn in das Spracherkennungssystem anstelle der a-priori Wahrscheinlichkeitsverteilung pn-1 bevor oder während der identifizierte Benutzer eine Spracheingabe durchführt. This object is achieved by the subject matter of method claim 1 . More precisely, the object is achieved in that the following steps are carried out in the method: identifying the user; Determining the probability distribution p n by adapting an a-priori probability distribution P n-1 based on a user profile created for the identified user, which contains information on the weighting of grammar entries that are specific for the identified user and implementing the probability distribution p n in the speech recognition system instead the a-priori probability distribution p n-1 before or during the identified user carries out a voice input.

Die a-priori Wahrscheinlichkeitsverteilung pn-1 sowie die aus deren Adaption resultierende Wahrscheinlichkeitsverteilung pn repräsentieren jeweils eine Gewichtung, mit welcher das Spracherkennungssystem die einzelnen Einträge der Grammatik zum Auswerten der von dem Benutzer in das Spracherkennungssystem eingegebenen Sprache heranzieht.The a-priori probability distribution p n-1 and the probability distribution p n resulting from their adaptation each represent a weighting with which the speech recognition system uses the individual entries of the grammar for evaluating the language entered by the user in the speech recognition system.

Ein Benutzerprofil ist eine für den identifizierten Benutzer spezifische Gewichtung der Einträge der Grammatik. Es repräsentiert z. B. die absoluten Häufigkeiten, mit welchen ein Benutzer während einer Spracheingabe bestimmte Vokabeln verwendet. Eine aus diesem Benutzerprofil abgeleitete Wahrscheinlichkeitsverteilung pB könnte in diesem Fall z. B. die den absoluten Häufigkeiten entsprechenden relativen Häufigkeiten repräsentieren.A user profile is a specific weighting of the entries in the grammar for the identified user. It represents e.g. B. the absolute frequencies with which a user uses certain vocabulary during speech input. A probability distribution p B derived from this user profile could in this case, for. B. represent the relative frequencies corresponding to the absolute frequencies.

Die Wahrscheinlichkeitsverteilung pn ist durch die beschriebene Adaption auf Basis benutzerspezifischer Informationen erstellt worden und insofern an den identifizierten aktuellen Benutzer angepasst. Ein Spracherkennungssystem in welchem die Wahrscheinlichkeitsverteilung für den identifizierten Benutzer individuell implementiert wurde, zeichnet sich deshalb vorteilhafterweise gegenüber bekannten Spracherkennungssystemen durch eine wesentlich verbesserte Erkennungsgenauigkeit bei Spracheingaben des identifizierten Benutzers aus.The probability distribution p n has been created by the adaptation described on the basis of user-specific information and, in this respect, has been adapted to the identified current user. A speech recognition system in which the probability distribution for the identified user has been implemented individually is therefore advantageously distinguished from known speech recognition systems by a significantly improved recognition accuracy in the case of voice input by the identified user.

Die oben beschriebene Aufgabe wird weiterhin durch ein Computerprogramm gemäß Patentanspruch 10 sowie durch ein Spracherkennungssystem gemäß Patentanspruch 12 gelöst. Die Vorteile dieses Computerprogramms und des Spracherkennungssystems entsprechen den oben für das Verfahren genannten Vorteilen.The task described above is continued by a Computer program according to claim 10 and by a Speech recognition system according to claim 12 solved. The  Advantages of this computer program and Speech recognition system correspond to that for the above Advantages mentioned procedure.

Das erfindungsgemäße Verfahren und Computerprogramm finden vorzugsweise Anwendung im Bankenbereich, insbesondere zur Wertpapierorder durch online Spracheingabe; es ist allerdings keineswegs auf diese Anwendung beschränkt. Vielmehr eignet es sich generell für jede Anwendung einer Spracherkennung.Find the inventive method and computer program preferably used in the banking sector, especially for Securities order through online voice input; it is however, in no way limited to this application. Rather, it is generally suitable for any application Voice recognition.

Weitere vorteilhafte Ausgestaltungen der Erfindung sind Gegenstand der Unteransprüche.Further advantageous embodiments of the invention are Subject of the subclaims.

Der Beschreibung sind insgesamt fünf Figuren beigefügt, wobei:A total of five figures are attached to the description, in which:

Fig. 1 ein erstes Ausführungsbeispiel für das erfindungsgemäße Verfahren; Fig. 1 shows a first embodiment of the inventive method;

Fig. 2 ein Beispiel für eine a-priori Wahrscheinlichkeitsverteilung von Einträgen einer Grammatik; FIG. 2 shows an example of an a priori probability distribution of entries of a grammar;

Fig. 3 ein Beispiel für eine Adaption einer Wahrscheinlichkeitsverteilung für Einträge einer Grammatik; FIG. 3 shows an example of an adaptation of a probability distribution for the entries of a grammar;

Fig. 4 ein zweites Ausführungsbeispiel für das erfindungsgemäße Verfahren; und Fig. 4 shows a second embodiment of the inventive method; and

Fig. 5 den Aufbau eines aus dem Stand der Technik bekannten Spracherkennungssystems zeigt. Fig. 5 shows the structure of a known prior art speech recognition system.

Es folgt eine detaillierte Beschreibung bevorzugter Ausführungsbeispiele der Erfindung unter Bezugnahme auf die angeführten Fig. 1 bis 5. Der aus dem Stand der Technik bekannte und oben unter Bezugnahme auf Fig. 5 beschriebene Aufbau eines Spracherkennungssystems und dessen grundsätzliche Funktionsweise gelten auch für die Erfindung. Zur Veranschaulichung wird bei der Beschreibung der Ausführungsbeispiele auf eine Anwendung der Erfindung im Bankenbereich Bezug genommen.The following is a detailed description of preferred exemplary embodiments of the invention with reference to FIGS. 1 to 5. The structure of a speech recognition system known from the prior art and described above with reference to FIG. 5 and its basic mode of operation also apply to the invention. By way of illustration, reference is made to an application of the invention in the banking field in the description of the exemplary embodiments.

Fig. 1 zeigt ein erstes Ausführungsbeispiel für den Ablauf des erfindungsgemäßen Verfahrens. In Verfahrensschritt 101 erfolgt zunächst der Aufbau einer Verbindung eines Benutzers mit einem Spracherkennungssystem 520, z. B. über ein Kommunikationssystem 510, wie dies in Fig. 5 dargestellt ist. Fig. 1 shows a first embodiment for the execution of the method according to the invention. In method step 101 , a connection of a user with a speech recognition system 520 , e.g. B. via a communication system 510 , as shown in Fig. 5.

In Verfahrensschritt 102 wird der Benutzer durch das Spracherkennungssystem 520 identifiziert. Das kann z. B. dadurch erfolgen, dass sich der Benutzer selber durch Angabe seines Namens, seiner Personal Identification Number PIN oder seiner Kontonummer identifiziert. Alternativ dazu kann der Benutzer auch automatisch identifiziert werden, z. B. durch automatische Erkennung seiner Rufnummer, wenn er sich über Telefon mit dem Spracherkennungssystem in Verbindung setzt, oder durch Sprechererkennung. In step 102 , the user is identified by the speech recognition system 520 . That can e.g. B. done by the user identifying himself by specifying his name, his personal identification number PIN or his account number. Alternatively, the user can also be identified automatically, e.g. B. by automatic recognition of his number when he connects to the voice recognition system by phone, or by speaker recognition.

Nach der Identifikation des Benutzers wird in Verfahrensschritt 103 festgestellt, ob dieser bereits zu einem früheren Zeitpunkt mit dem Spracherkennungssystem 520 in einem bestimmten Kontext, z. B. in Sachen Wertpapierorder, interagiert hat oder nicht. Die Feststellung erfolgt in der Weise, dass die in Verfahrensschritt 102 ermittelte Identität des Benutzers mit gespeicherten Einträgen über ehemalige Benutzer des Spracherkennungssystems 520 verglichen wird. Die Speicherung der Einträge muss nicht in dem Spracherkennungssystem 520 selber, sondern kann auch extern erfolgen, wobei dann ein Zugriff auf diese Daten von dem Spracherkennungssystem aus, z. B. über eine Netzwerkanbindung, vorgesehen werden sollte.After the user has been identified, it is determined in method step 103 whether the user has already used speech recognition system 520 in a certain context, eg. B. interacted in matters of securities orders or not. The determination is made in such a way that the identity of the user determined in method step 102 is compared with stored entries about former users of the speech recognition system 520 . The entries do not have to be stored in the speech recognition system 520 itself, but can also be done externally, in which case access to this data from the speech recognition system, e.g. B. should be provided via a network connection.

Das Spracherkennungssystem 520 erkennt grundsätzlich alle Spracheingaben aufgrund von Grammatiken, welche alle möglichen Einträge spezifizieren, die das Spracherkennungssystem 520 in einem bestimmten Kontext, hier beispielhaft die Wertpapierorder, erkennen soll. Den Einträgen der Grammatiken sind individuell Wahrscheinlichkeiten zugeordnet, welche eine Gewichtung repräsentieren, mit welcher das Spracherkennungssystem 520 die einzelnen Einträge der Grammatik zum Auswerten der von einem Benutzer in das Spracherkennungssystem eingegebenen Sprache heranzieht.The speech recognition system 520 basically recognizes all speech inputs on the basis of grammars which specify all possible entries which the speech recognition system 520 is to recognize in a specific context, for example the securities order here. Probabilities are assigned to the entries of the grammars, which represent a weighting with which the speech recognition system 520 uses the individual entries of the grammar for evaluating the language entered by a user into the speech recognition system.

Wenn in Schritt 103 festgestellt wird, dass es sich um einen erstmaligen Benutzer des Spracherkennungssystems 520 handelt, wird das Verfahren mit Schritt 104 fortgesetzt. In das Spracherkennungssystem 520 wird dann beispielsweise eine objektive Grammatik zur Spracherkennung implementiert. Eine solche objektive Grammatik zeichnet sich dadurch aus, dass die Wahrscheinlichkeitsverteilung ihrer Einträge entweder gleichverteilt oder nach objektiven, d. h. benutzerunabhängigen Kriterien gewichtet ist. Ist der Benutzer beispielsweise ein Bankkunde und möchte er erstmalig eine Wertpapierorder per Spracheingabe aufgeben, so könnten die Einträge der Grammatik, wie in Fig. 2 gezeigt, beispielsweise Aktientitel sein und die ihnen jeweils zugeordneten Wahrscheinlichkeiten deren relative Handelsvolumen an der Börse während eines bestimmten Zeitraumes in der Vergangenheit repräsentieren.If it is determined in step 103 that it is a first-time user of the speech recognition system 520 , the method continues with step 104 . Then, for example, an objective grammar for speech recognition is implemented in the speech recognition system 520 . Such an objective grammar is characterized by the fact that the probability distribution of its entries is either equally distributed or weighted according to objective, ie user-independent criteria. If the user is a bank customer, for example, and would like to place a security order for the first time by voice input, the entries in the grammar, as shown in FIG. 2, could be stock titles, for example, and the associated probabilities could be their relative trading volume on the stock exchange during a specific period in represent the past.

Bei dem in Fig. 1 dargestellten Verfahrensschritt 104 wird davon ausgegangen, dass für den erstmaligen Benutzer noch kein Benutzerprofil vorliegt, so dass in diesem Fall keine erfindungsgemäße benutzerspezifische Adaption der objektiven Wahrscheinlichkeitsverteilung stattfinden kann. Ein Benutzerprofil ist eine für den identifizierten Benutzer spezifische Gewichtung der Einträge der Grammatik.In method step 104 shown in FIG. 1, it is assumed that there is still no user profile for the first-time user, so that in this case no user-specific adaptation of the objective probability distribution according to the invention can take place. A user profile is a specific weighting of the entries in the grammar for the identified user.

Alternativ zu dem dargestellten Verfahrensschritt 104 ist es jedoch unter einer bestimmten Voraussetzung trotzdem möglich, auch für den erstmaligen Benutzer eine erfindungsgemäße Adaption der objektiven Wahrscheinlichkeitsverteilung vorzunehmen. Voraussetzung dafür ist, dass für den identifizierten Benutzer bereits vor dessen erster Spracheingabe ein Benutzerprofil vorliegt. Dies ist kann z. B. ein Benutzerprofil sein, welches nicht auf einer vom Benutzer durchgeführten kontextbezogenen Spracheingabe, sondern auf Grundlage anderer dem Benutzer zugeordneten Informationen erstellt wurde. Die erfindungsgemäße Adaption kann dann in der Weise erfolgen, dass die oben beschriebene objektive Wahrscheinlichkeitsverteilung der Einträge als a-priori Wahrscheinlichkeitsverteilung mathematisch mit einer aus dem Benutzerprofil abgeleiteten Wahrscheinlichkeitsverteilung pB zu einer adaptierten Wahrscheinlichkeitsverteilung pn verknüpft wird. Die Wahrscheinlichkeitsverteilung pn ist gegenüber der a- priori Wahrscheinlichkeitsverteilung besser auf den Benutzer abgestimmt und erhöht deshalb die Erkennungsgenauigkeit bei zukünftigen Spracheingaben des identifizierten Benutzers. Ein Beispiel für die Durchführung einer konkreten erfindungsgemäßen Adaption wird weiter unten unter Bezugnahme auf Fig. 3 gegeben.As an alternative to the method step 104 shown , it is nevertheless possible under a certain condition to also carry out an adaptation of the objective probability distribution according to the invention for the first-time user. The prerequisite for this is that a user profile already exists for the identified user before the user enters his first voice. This can be e.g. B. be a user profile which was not created on the basis of a context-related voice input carried out by the user, but on the basis of other information assigned to the user. The adaptation according to the invention can then take place in such a way that the above-described objective probability distribution of the entries is mathematically linked as an a priori probability distribution with a probability distribution p B derived from the user profile to form an adapted probability distribution p n . Compared to the a priori probability distribution, the probability distribution p n is better matched to the user and therefore increases the recognition accuracy in future voice inputs by the identified user. An example for the implementation of a specific adaptation according to the invention is given below with reference to FIG. 3.

Für den Fall, dass in Verfahrensschritt 103 festgestellt wurde, dass der Benutzer zu einem früheren Zeitpunkt bereits zumindest einmal mit dem Spracherkennungssystem interagiert hatte, dann wird das Verfahren mit Schritt 105 fortgesetzt. Dieser Schritt setzt voraus, dass sowohl eine a-priori Wahrscheinlichkeit pn-1 wie auch ein Benutzerprofil für den in Schritt 102 identifizierten Benutzer vorhanden ist.In the event that it was determined in method step 103 that the user had already interacted with the speech recognition system at least once before, the method continues with step 105 . This step presupposes that both an a-priori probability p n-1 and a user profile for the user identified in step 102 are present.

Fig. 2 zeigt beispielhaft eine a-priori Wahrscheinlichkeitsverteilung. Demnach wird der Eintrag "Microsoft" mit einer Gewichtung von 80%, der Eintrag "Cisco" mit einer Gewichtung von 20%, der Eintrag "Callaway Golf" mit einer Gewichtung von 9% und der Eintrag "Macrosoft" mit einer Gewichtung von 1% bei der Auswertung einer Spracheingabe des Benutzers von dem Spracherkennungssystem herangezogen. Die a-priori Wahrscheinlichkeit pn-1 kann dabei entweder objektiv, d. h. benutzerunabhängig oder benutzerabhängig, z. B. auf Basis vorangegangener Auswertungen von Spracheingaben des Benutzers, erstellt worden sein. Fig. 2 is an a-priori shows an example of probability distribution. Accordingly, the entry "Microsoft" with a weighting of 80%, the entry "Cisco" with a weighting of 20%, the entry "Callaway Golf" with a weighting of 9% and the entry "Macrosoft" with a weighting of 1% used in the evaluation of a voice input by the user from the voice recognition system. The a priori probability p n-1 can be either objective, ie user-independent or user-dependent, e.g. B. on the basis of previous evaluations of the user's voice input.

Das Benutzerprofil kann entweder unabhängig von einer vorherigen Spracheingabe des identifizierten Benutzers oder aber abhängig von einer solchen vorherigen Spracheingabe angefertigt worden sein. Es kann entweder aus Massenspeicher innerhalb des Spracherkennungssystem oder von einem externen Speicher, welcher z. B. über eine Netzwerkanbindung angesprochen werden kann, abgerufen werden.The user profile can either be independent of a previous voice input by the identified user or depending on such a previous one Voice input have been made. It can either from mass storage within the speech recognition system or from an external memory, which, for. B. via a Network connection can be accessed become.

In jedem Fall erfolgt in Schritt 105 in Fig. 1 eine erfindungsgemäße Adaption einer a-priori Wahrscheinlichkeitsverteilung pn-1, d. h. einer bereits vor der Adaption vorhandenen Wahrscheinlichkeitsverteilung pn-1 mit einer aus dem Benutzerprofil des identifizierten Benutzers gewonnenen Wahrscheinlichkeitsverteilung pB.In any case, step 105 in FIG. 1 adapts an a-priori probability distribution p n-1 according to the invention, ie an already existing probability distribution p n-1 with a probability distribution pB obtained from the user profile of the identified user.

Ergebnis der Adaption ist eine auf den identifizierten Benutzer abgestimmte Wahrscheinlichkeitsverteilung pn der Einträge der Grammatik. Diese wird gemäß Verfahrensschritt 106 anstelle der bisherigen a-priori Wahrscheinlichkeitsverteilung pn-1 in das Spracherkennungssystem 520 implementiert.The result of the adaptation is a probability distribution p n of the entries in the grammar that is matched to the identified user. In accordance with method step 106, this is implemented in the speech recognition system 520 instead of the previous a-priori probability distribution p n-1 .

Ein Beispiel für eine konkrete Durchführung der erfindungsgemäßen Adaption und eine daraus resultierende Wahrscheinlichkeitsverteilung pn folgt weiter unten unter Bezugnahme auf Fig. 3.An example of a specific implementation of the adaptation according to the invention and a resulting probability distribution p n follows below with reference to FIG. 3.

Gemäß Verfahrensschritt 107 wird die Wahrscheinlichkeitsverteilung pn für die Einträge der Grammatik nach ihrer Implementierung von dem Spracherkennungssystem zum Erkennen zukünftiger Spracheingaben des identifizierten Benutzers verwendet. Wie bereits oben unter Bezugnahme auf Fig. 5 beschrieben wurde, wird dabei die akustische Spracheingabe des identifizierten Benutzers in eine entsprechende Wortfolge abgebildet.According to method step 107 , the probability distribution p n for the entries of the grammar after their implementation is used by the speech recognition system for recognizing future speech inputs by the identified user. As has already been described above with reference to FIG. 5, the acoustic voice input of the identified user is represented in a corresponding word sequence.

Die akustische Spracheingabe des identifizierten Benutzers wird in Verfahrensschritt 108 zur Erstellung eines gegenüber dem in Verfahrensschritt 105 verbesserten Benutzerprofils verwendet. Genauer gesagt wird insbesondere das von dem Benutzer bei der Spracheingabe verwendete Vokabular oder dessen Aussprache für die Erstellung des verbesserten Benutzerprofils ausgewertet. Diese Informationen aus der aktuellen Spracheingabe bilden, gegebenenfalls zusammen mit ähnlichen Informationen aus vorangegangenen Spracheingaben, eine sprachliche Benutzungshistorie des identifizierten Benutzers. Die Benutzungshistorie ist ein Indiz dafür, welche Einträge der Grammatik in Zukunft von dem Spracherkennungssystem mit erhöhter Wahrscheinlichkeit zur Auswertung von Spracheingaben des Benutzers heranzuziehen sind. Neben der sprachlichen Benutzungshistorie können aber auch andere benutzerspezifische Informationen für die Erstellung des verbesserten Benutzerprofils herangezogen werden; insbesondere kann das verbesserte Benutzerprofil durch Modifikation eines bisher verwendeten Benutzerprofils erstellt werden.The acoustic voice input of the identified user is used in method step 108 to create a user profile that is improved compared to method step 105 . More specifically, the vocabulary used by the user during speech input or its pronunciation is used to create the improved user profile. This information from the current voice input, possibly together with similar information from previous voice inputs, forms a language usage history of the identified user. The usage history is an indication of which entries of the grammar are to be used in the future by the speech recognition system with an increased probability for evaluating speech inputs of the user. In addition to the language usage history, other user-specific information can also be used to create the improved user profile; in particular, the improved user profile can be created by modifying a previously used user profile.

Das verbesserte Benutzerprofil wird gemäß Verfahrensschritt 109 entweder in einem Speicher des Spracherkennungssystems oder in einem externen Speicher, abgespeichert.According to method step 109, the improved user profile is stored either in a memory of the speech recognition system or in an external memory.

Solange wie in Schritt 110 festgestellt wird, dass eine aktuelle Verbindung des Benutzers mit dem Spracherkennungssystem 520 noch besteht, werden die beschriebenen Verfahrensschritte 102 bis 110 immer wieder neu durchlaufen. Insofern findet dann während der aktuellen Verbindung eine permanente Optimierung der implementierten Grammatik, insbesondere der Wahrscheinlichkeitsverteilung von deren Einträgen statt. Damit einhergehend erfolgt eine stetige Verbesserung der Erkennungsgenauigkeit des Spracherkennungssystems für die Spracheingaben des identifizierten Benutzers.As long as it is determined in step 110 that the user is still connected to the speech recognition system 520 , the described method steps 102 to 110 are carried out again and again. In this respect, a permanent optimization of the implemented grammar, in particular the probability distribution of its entries, then takes place during the current connection. This is accompanied by a constant improvement in the recognition accuracy of the speech recognition system for the voice inputs of the identified user.

Wird jedoch in Schritt 110 festgestellt, dass die aktuelle Verbindung des identifizierten Benutzers mit dem Spracherkennungssystem 520 abgebrochen wurde, dann ist das in Fig. 1 dargestellt Verfahren grundsätzlich abgeschlossen (Schritt 111). Das im letzten Durchlauf gemäß Fig. 1 verbesserte Benutzerprofil für den identifizierten Benutzer bleibt jedoch gespeichert bis dieser sich zu einem späteren Zeitpunkt erneut mit dem Spracherkennungssystem 520 in Verbindung setzt. Dann würde genau dieses Benutzerprofil aus dem Speicher abgerufen und gemäß Schritt 105 zur Adaption einer bisher verwendeten a- priori Wahrscheinlichkeitsverteilung verwendet.However, if it is determined in step 110 that the current connection of the identified user to the speech recognition system 520 has been terminated, then the method shown in FIG. 1 is fundamentally completed (step 111 ). The improved user profile for the identified user in the last run according to FIG. 1, however, remains stored until the user is contacted again at a later point in time with the speech recognition system 520 . Then exactly this user profile would be called up from the memory and used according to step 105 to adapt a previously used a priori probability distribution.

Fig. 3 zeigt ein Beispiel für die konkrete Durchführung der erfindungsgemäßen Adaption, d. h. wie mit Hilfe von Informationen über den Benutzer eine Neugewichtung der Einträge in der Grammatik vorgenommen wird. FIG. 3 shows an example of the specific implementation of the adaptation according to the invention, ie how information about the user is used to re-weight the entries in the grammar.

In Spalte 301 ist als Ausgangsbasis für die Neugewichtung eine vorgegebene objektive a-priori Wahrscheinlichkeitsverteilung pn-1 für bestimmte Aktientitel beispielhaft dargestellt. Genauer gesagt, ist in Spalte 301 angezeigt, dass laut der a-priori Wahrscheinlichkeitsverteilung das Spracherkennungssystem 520 den Aktientitel "Microsoft" mit einer Gewichtung von 70% zum Auswerten der von dem Benutzer in das Spracherkennungssystem eingegebenen Sprache heranzieht. Analog verwendet es den Aktientitel "Cisco" mit 20%, den Aktientitel "Callaway Golf" mit 9% und den Aktientitel "Macrosoft" mit einer Gewichtung von 1%.In column 301 , a predetermined objective a-priori probability distribution p n-1 for certain equity stocks is shown as an example for the basis of the new weighting. More specifically, it is indicated in column 301 that, according to the a priori probability distribution, the speech recognition system 520 uses the stock title "Microsoft" with a weighting of 70% for evaluating the language entered by the user into the speech recognition system. Similarly, it uses the "Cisco" share with 20%, the "Callaway Golf" share with 9% and the "Macrosoft" share with a weighting of 1%.

In Spalte 302 in Fig. 3 ist die aus dem vorhandenen Benutzerprofil abgeleitete Verteilung der Wahrscheinlichkeiten pB für die Einträge der Grammatik des Spracherkennungssystems dargestellt. Das Benutzerprofil könnte hier z. B. die absoluten Häufigkeiten angeben, mit welchen der Benutzer während einer Spracheingabe bestimmte Vokabeln, hier z. B. Aktientitel, verwendet. Eine aus diesem Benutzerprofil abgeleitete Wahrscheinlichkeitsverteilung pB, wie Spalte 302 dargestellt, könnte dann z. B. die aus den absoluten Häufigkeiten abgeleiteten relativen Häufigkeiten repräsentieren. Demnach würden in diesem Beispiel die Aktientitel "Microsoft" und "Cisco" überhaupt nicht, der Aktientitel "Callaway Golf" mit 30% und der Titel "Macrosoft" mit einer Wahrscheinlichkeit von 70% bei einer Spracheingabe des Benutzers verwendet.Column 302 in FIG. 3 shows the distribution of the probabilities p B derived from the existing user profile for the entries of the grammar of the speech recognition system. The user profile could e.g. B. indicate the absolute frequencies with which the user during certain speech input certain vocabulary, here z. B. stock titles used. A probability distribution p B derived from this user profile, as shown in column 302 , could then e.g. B. represent the relative frequencies derived from the absolute frequencies. Accordingly, in this example, the stock titles "Microsoft" and "Cisco" would not be used at all, the stock title "Callaway Golf" with 30% and the title "Macrosoft" with a probability of 70% when the user entered a voice.

Erfindungsgemäß erfolgt eine Adaption der a-priori Wahrscheinlichkeitsverteilung pn-1 gemäß Spalte 301 dadurch, dass sie mit der aus dem Benutzerprofil abgeleiteten Wahrscheinlichkeitsverteilung pB in Spalte 302 mathematisch kombiniert wird. Gemäß Fig. 3 erfolgt die Kombination gemäß folgender Rekursionsformel:
According to the invention, the a-priori probability distribution p n-1 is adapted according to column 301 by mathematically combining it with the probability distribution p B derived from the user profile in column 302 . According to FIG. 3, the combination takes place according to the following recursion formula:

pn-1.a + pB.b = pn (1)
p n-1 .a + p B .b = p n (1)

wobei:
n: den Adaptionszustand der Wahrscheinlichkeitsverteilungen zum Zeitpunkt n;
pn-1: die a-priori Wahrscheinlichkeitsverteilung;
pB: die Wahrscheinlichkeitsverteilung gemäß dem Benutzerprofil;
pn: die adaptierte Wahrscheinlichkeitsverteilung; und
a, b: Gewichte mit a + b = 1
bedeutet.
in which:
n: the adaptation state of the probability distributions at time n;
p n-1 : the a priori probability distribution;
p B : the probability distribution according to the user profile;
p n : the adapted probability distribution; and
a, b: weights with a + b = 1
means.

Bei dem Beispiel gemäß Fig. 3 geht die a-priori Wahrscheinlichkeitsverteilung pn-1 mit einer Gewichtung von a = 40% und die Wahrscheinlichkeitsverteilung pB mit einer Gewichtung von b = 60% in die Berechnung der Wahrscheinlichkeitsverteilung pn für die Einträge der Grammatik ein.In the example according to FIG. 3, the a-priori probability distribution p n-1 with a weighting of a = 40% and the probability distribution p B with a weighting of b = 60% are included in the calculation of the probability distribution pn for the entries of the grammar ,

Grundsätzlich ist die Dimensionierung der Gewichte a und b variabel; sie kann z. B. davon abhängig gemacht werden, wie viele benutzerspezifische Informationen überhaupt vorliegen. Insbesondere die Dimensionierung von b kann z. B. nach Maßgabe durch die Größe derjenigen Zeitspanne erfolgen, welche zwischen der Erstellung des Benutzerprofils, welches als Grundlage für die Wahrscheinlichkeitsverteilung pB dient, und der Berechnung der Wahrscheinlichkeitsverteilung pn liegt. So fließen Spracheingaben des Benutzers, welche am vergangenen Tag erfolgt sind, vorzugsweise stärker in die Gewichtung ein, als Spracheingaben, welche einige Monate zurückliegen.In principle, the dimensions of weights a and b are variable; it can e.g. B. be made dependent on how much user-specific information is available. In particular, the dimensioning of b can e.g. B. take place in accordance with the size of the period of time that lies between the creation of the user profile, which serves as the basis for the probability distribution p B , and the calculation of the probability distribution p n . Thus, voice inputs from the user that were made on the previous day preferably flow into the weighting more than voice inputs that occurred a few months ago.

Die erfindungsgemäße Adaption der beiden Wahrscheinlichkeitsverteilungen pn-1 und pB führt mit dem Ergebnis der Wahrscheinlichkeitsverteilung pn zu einer Gewichtung, mit welcher das Spracherkennungssystem die einzelnen Einträge der Grammatik zum Auswerten der von einem Benutzer in das Spracherkennungssystem 520 eingegebenen Sprache heranzieht.The adaptation according to the invention of the two probability distributions p n-1 and p B leads to a weighting with the result of the probability distribution pn, with which the speech recognition system uses the individual entries of the grammar to evaluate the language entered by a user into the speech recognition system 520 .

Einträge der Grammatik, welche stärker gewichtet sind, werden im Resultat von dem Spracherkennungssystem mit größerer Wahrscheinlichkeit richtig erkannt, als solche, die geringer gewichtet worden sind. So wird gemäß der adaptierten Wahrscheinlichkeitsverteilung pn, wie sie in Spalte 303 in Fig. 3 dargestellt ist, der Eintrag "Macrosoft" mit der größten und der Eintrag "Cisco" mit der geringsten Wahrscheinlichkeit richtig erkannt. Die Einträge "Microsoft" und "Callaway Golf" werden dagegen mit einer etwa gleich großen Wahrscheinlichkeit von 28% bzw. 22% richtig erkannt. Im Ergebnis führt die erfindungsgemäße Adaption schließlich dazu, dass die Erkennungsgenauigkeit für den einzelnen identifizierten Benutzer des Spracherkennungssystems wesentlich verbessert wird. As a result, entries of the grammar that are weighted more are more likely to be correctly recognized by the speech recognition system than those that have been weighted less. Thus, according to the adapted probability distribution p n , as shown in column 303 in FIG. 3, the entry "Macrosoft" with the largest and the entry "Cisco" with the lowest probability are correctly recognized. The entries "Microsoft" and "Callaway Golf", on the other hand, are correctly recognized with an approximately equal probability of 28% and 22%, respectively. As a result, the adaptation according to the invention ultimately leads to the recognition accuracy for the individually identified user of the speech recognition system being significantly improved.

Fig. 4 zeigt ein zweites Ausführungsbeispiel für das erfindungsgemäß beanspruchte Verfahren. Dabei entsprechen die Verfahrensschritte 401 bis 411 jeweils den in Fig. 1 beschriebenen Verfahrensschritten 101 bis 111, mit Ausnahme der Schritte 105 und 405. In Schritt 405 wird im Unterschied zum Schritt 105 nach Fig. 1 für die Adaption der a-priori Wahrscheinlichkeitsverteilung der Einträge neben dem Benutzerprofil noch eine benutzerspezifische Negativliste von Grammatikeinträgen verwendet. Diese Negativliste wird aufgrund von Erkennungsresultaten bei vorangegangenen Spracheingaben des identifizierten Benutzers erstellt, welche falsch waren. Ob ein Erkennungsresultat falsch war, kann z. B. dadurch festgestellt werden, dass der Benutzer eine Spracheingabe wiederholt, nachdem er im Falle eines von dem Spracherkennungssystems falsch erkannten Eintrags, diesen als falsch zurückweist oder korrigiert. Die Negativliste, die auch als Skipliste bezeichnet wird, verhindert, dass eine Spracheingabe mehrfach zum selben falschen Erkennungsresultat führt. Fig. 4 shows a second embodiment of the invention claimed. Method steps 401 to 411 each correspond to method steps 101 to 111 described in FIG. 1, with the exception of steps 105 and 405 . In step 405 , in contrast to step 105 according to FIG. 1, a user-specific negative list of grammar entries is used for the adaptation of the a-priori probability distribution of the entries in addition to the user profile. This negative list is created on the basis of recognition results in previous voice inputs from the identified user which were incorrect. Whether a recognition result was wrong can e.g. B. can be determined by the user repeating a voice input after rejecting or correcting an entry that has been incorrectly recognized by the speech recognition system. The negative list, which is also referred to as the skip list, prevents a voice entry from repeatedly leading to the same incorrect recognition result.

Ähnlich wie das Benutzerprofil wird auch die Negativliste erfindungsgemäß sukzessive verbessert. Dafür wird zunächst in Schritt 407a in Fig. 4 festgestellt, ob eine aktuelle Spracheingabe richtig analysiert, d. h. eine richtige Wortfolge für die Spracheingabe erkannt worden ist. Wenn dies der Fall ist, braucht die Negativliste nicht verändert zu werden und das Verfahren wird mit Schritt 408 fortgesetzt. Wenn das Spracherkennungssystem einer Spracheingabe jedoch eine falsche Wortfolge zuordnet, so wird die Negativliste gemäß Schritt 412 modifiziert. Während einer aktuellen Verbindung des identifizierten Benutzers mit dem Spracherkennungssystem 520 wird diese Liste immer wieder für eine erneute Adaption der Wahrscheinlichkeitsverteilung in Schritt 405 verwendet. Nach Abbruch der aktuellen Verbindung wird die Negativliste gespeichert, um bei einer späteren erneuten Verbindung des identifizierten Benutzers mit dem Spracherkennungssystem wieder zwecks Adaption der Grammatik abgerufen zu werden.Similar to the user profile, the negative list is successively improved according to the invention. For this purpose, it is first determined in step 407 a in FIG. 4 whether a current speech input has been correctly analyzed, ie whether a correct word sequence for the speech input has been recognized. If this is the case, the negative list need not be changed and the method continues with step 408 . However, if the speech recognition system assigns an incorrect word sequence to a speech input, the negative list is modified in accordance with step 412 . During a current connection of the identified user to the speech recognition system 520 , this list is used again and again for a new adaptation of the probability distribution in step 405 . After the current connection has been terminated, the negative list is stored in order to be called up again when the identified user is later connected to the speech recognition system for the purpose of adapting the grammar.

Claims (13)

1. Dynamisches Grammatikgewichtungsverfahren für Spracherkennungssysteme, worin eine Wahrscheinlichkeitsverteilung pn für Grammatikeinträge in ein Spracherkennungssystem implementiert wird, wobei die Implementierung erfolgt, während ein Benutzer mit dem Spracherkennungssystem verbunden ist, gekennzeichnet durch mindestens folgende Schritte:
  • - Identifizieren des Benutzers (102);
  • - Ermitteln der Wahrscheinlichkeitsverteilung pn durch Adaptieren einer a-priori Wahrscheinlichkeitsverteilung pn-1 anhand eines für den identifizierten Benutzer erstellten Benutzerprofils, welches Informationen zur Gewichtung von Grammatikeinträgen enthält, die für den identifizierten Benutzer spezifisch sind (105); und
  • - Implementieren der Wahrscheinlichkeitsverteilung pn in das Spracherkennungssystem anstelle der a-priori Wahrscheinlichkeitsverteilung pn-1 bevor oder während der identifizierte Benutzer eine Spracheingabe durchführt (106).
1. Dynamic grammar weighting method for speech recognition systems, in which a probability distribution p n for grammar entries is implemented in a speech recognition system, the implementation taking place while a user is connected to the speech recognition system, characterized by at least the following steps:
  • - identifying the user ( 102 );
  • - Determining the probability distribution p n by adapting an a-priori probability distribution p n-1 based on a user profile created for the identified user, which contains information on the weighting of grammar entries that are specific to the identified user ( 105 ); and
  • - Implementing the probability distribution p n in the speech recognition system instead of the a-priori probability distribution p n-1 before or during the identified user carries out a speech input ( 106 ).
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass das Benutzerprofil auf Grundlage von dem identifizierten Benutzer zugeordneten Informationen erstellt wird, welche unabhängig von einer von dem Benutzer durchgeführten Spracheingabe vorliegen.2. The method according to claim 1, characterized in that that the user profile based on that  identified user associated information is created, which is independent of one of the Voice input performed by users. 3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass wenn die Implementierung der Wahrscheinlichkeitsverteilung pn in das Spracherkennungssystem vor der aktuellen Spracheingabe durch den identifizierten Benutzer erfolgt, das Benutzerprofil durch Auswerten von mindestens einer zeitlich vor der aktuellen Verbindung erfolgten Spracheingabe des identifizierten Benutzers in das Spracherkennungssystem erstellt wurde.3. The method according to claim 1 or 2, characterized in that if the implementation of the probability distribution p n in the speech recognition system takes place before the current voice input by the identified user, the user profile by evaluating at least one voice input of the identified user before the current connection was created in the speech recognition system. 4. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass, wenn die Implementierung der Wahrscheinlichkeitsverteilung pn in das Spracherkennungssystem während der aktuellen Spracheingabe durch den identifizierten Benutzer erfolgt, das Benutzerprofil durch Auswerten von mindestens einer zeitlich vor der aktuellen Verbindung erfolgten Spracheingabe und/oder durch Auswerten der aktuellen Spracheingabe des identifizierten Benutzers erstellt wurde.4. The method according to claim 1 or 2, characterized in that if the implementation of the probability distribution p n in the speech recognition system takes place during the current speech input by the identified user, the user profile by evaluating at least one speech entry made before the current connection and / or was created by evaluating the current voice input of the identified user. 5. Verfahren nach Anspruch 3 oder 4, dadurch gekennzeichnet, dass das Benutzerprofil durch Modifikation eines bisher gültigen Benutzerprofil erstellt wird.5. The method according to claim 3 or 4, characterized characterized by the user profile Modification of a previously valid user profile is created. 6. Verfahren nach einem der vorangegangenen Ansprüche, dadurch gekennzeichnet, dass die Ermittlung der Wahrscheinlichkeitsverteilung der Einträge der Grammatik durch mathematische Verknüpfung von zumindest einer a-priori Wahrscheinlichkeitsverteilung pn-1 mit einer Wahrscheinlichkeitsverteilung pB erfolgt, welche das erstellte Benutzerprofil repräsentiert.6. The method according to any one of the preceding claims, characterized in that the determination of the probability distribution of the entries of the grammar is carried out by mathematically linking at least one a-priori probability distribution p n-1 with a probability distribution p B , which represents the created user profile. 7. Verfahren nach Anspruch 6, dadurch gekennzeichnet, dass die Adaption der Wahrscheinlichkeitsverteilung rekursiv gemäß folgender Formel erfolgt:
pn-1.a + pB.b = pn (1)
wobei:
n: den Adaptionszustand der Wahrscheinlichkeitsverteilungen zum Zeitpunkt n;
pn-1: die a-priori Wahrscheinlichkeitsverteilung;
pB: die Wahrscheinlichkeitsverteilung gemäß dem Benutzerprofil;
pn: die adaptierte Wahrscheinlichkeitsverteilung; und
a, b: Gewichte mit a + b = 1
bedeutet.
7. The method according to claim 6, characterized in that the adaptation of the probability distribution is carried out recursively according to the following formula:
p n-1 .a + p B .b = p n (1)
in which:
n: the adaptation state of the probability distributions at time n;
p n-1 : the a priori probability distribution;
p B : the probability distribution according to the user profile;
p n : the adapted probability distribution; and
a, b: weights with a + b = 1
means.
8. Verfahren nach Anspruch 7, dadurch gekennzeichnet, dass die Dimensionierung der Gewichte a, b nach Maßgabe durch die Größe derjenigen Zeitspanne erfolgt, welche zwischen der Erstellung des Benutzerprofils und der Adaption der a-priori Wahrscheinlichkeitsverteilung liegt.8. The method according to claim 7, characterized in that that the dimensioning of weights a, b in accordance with by the size of the period of time which between the creation of the user profile and the Adaptation of the a priori probability distribution  lies. 9. Verfahren nach einem der vorangegangenen Ansprüche, dadurch gekennzeichnet, dass die Ermittlung der Wahrscheinlichkeitsverteilung pn unter zusätzlicher Berücksichtigung einer Negativliste für die Einträge der Grammatik erfolgt.9. The method according to any one of the preceding claims, characterized in that the probability distribution p n is determined with additional consideration of a negative list for the entries of the grammar. 10. Computerprogramm mit einem Programmcode, welcher ausgebildet ist zur Durchführung des Verfahrens gemäß einem der Ansprüche 1 bis 9, wenn es auf einem Prozessor eines Spracherkennungssystems abläuft.10. Computer program with a program code, which is trained to carry out the method according to any of claims 1 to 9 when it is on a processor of a speech recognition system is running. 11. Computerprogramm nach Anspruch 10, dadurch gekennzeichnet dass es auf einem Speichermedium gespeichert ist.11. Computer program according to claim 10, characterized characterized that it is on a storage medium is saved. 12. Spracherkennungssystem, welches ausgebildet ist zum Ablaufen des Computerprogramms nach einem der Ansprüche 10 oder 11.12. Speech recognition system which is designed for Running the computer program according to one of the claims 10 or 11. 13. Verwendung der Verfahrens gemäß einem der Ansprüche 1 bis 9 oder des Computerprogramms gemäß einem der Ansprüche 10 oder 11 im Bankenwesen, wobei der Benutzer ein Bankkunde ist und durch Spracheingabe in ein Spracherkennungssystem Bankgeschäfte, insbesondere Wertpapierorder, abwickelt; und wobei das Verfahren und/oder das Computerprogramm ausgebildet sind, das Benutzerprofil auf Basis der Namen von am häufigsten durch den Benutzer während eines Betrachtungszeitraumes durch Spracheingabe georderten Wertpapieren und/oder auf Basis der Namen der Wertpapiere in einem Depot des Benutzers zu erstellen.13. Use of the method according to one of the claims 1 to 9 or the computer program according to one of the Claims 10 or 11 in banking, the user is a bank customer and by voice input into one Speech recognition system banking, in particular Securities order, settled; and the method and / or the computer program are trained, the user profile based on the name most often by the user during a Viewing period ordered by voice input Securities and / or based on the names of the securities to create in a depot of the user.
DE2001131157 2001-06-29 2001-06-29 Dynamic grammatical weighting method for speech recognition system has existing probability distribution for grammatical entries modified for each identified user Withdrawn - After Issue DE10131157C1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE2001131157 DE10131157C1 (en) 2001-06-29 2001-06-29 Dynamic grammatical weighting method for speech recognition system has existing probability distribution for grammatical entries modified for each identified user

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE2001131157 DE10131157C1 (en) 2001-06-29 2001-06-29 Dynamic grammatical weighting method for speech recognition system has existing probability distribution for grammatical entries modified for each identified user

Publications (1)

Publication Number Publication Date
DE10131157C1 true DE10131157C1 (en) 2002-07-04

Family

ID=7689748

Family Applications (1)

Application Number Title Priority Date Filing Date
DE2001131157 Withdrawn - After Issue DE10131157C1 (en) 2001-06-29 2001-06-29 Dynamic grammatical weighting method for speech recognition system has existing probability distribution for grammatical entries modified for each identified user

Country Status (1)

Country Link
DE (1) DE10131157C1 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102008007698A1 (en) * 2008-02-06 2009-08-13 Siemens Aktiengesellschaft Method for detecting an input in a speech recognition system
DE102008021954A1 (en) * 2008-02-29 2009-09-03 Navigon Ag Method for operating an electronic assistance system
CN117556832A (en) * 2023-11-23 2024-02-13 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) Semantic constraint-based emotion support dialogue bidirectional generation method

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0834862A2 (en) * 1996-10-01 1998-04-08 Lucent Technologies Inc. Method of key-phrase detection and verification for flexible speech understanding
WO2000019410A1 (en) * 1998-09-30 2000-04-06 Lernout & Hauspie Speech Products N.V. Graphic user interface for navigation in speech recognition system grammars
WO2000068933A1 (en) * 1999-05-10 2000-11-16 Nuance Communications, Inc. Adaptation of a speech recognition system across multiple remote sessions with a speaker
US6154722A (en) * 1997-12-18 2000-11-28 Apple Computer, Inc. Method and apparatus for a speech recognition system language model that integrates a finite state grammar probability and an N-gram probability
JP2001157137A (en) * 1999-08-26 2001-06-08 Matsushita Electric Ind Co Ltd Automatic filtering for television contents using voice recognition and natural language

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0834862A2 (en) * 1996-10-01 1998-04-08 Lucent Technologies Inc. Method of key-phrase detection and verification for flexible speech understanding
US6154722A (en) * 1997-12-18 2000-11-28 Apple Computer, Inc. Method and apparatus for a speech recognition system language model that integrates a finite state grammar probability and an N-gram probability
WO2000019410A1 (en) * 1998-09-30 2000-04-06 Lernout & Hauspie Speech Products N.V. Graphic user interface for navigation in speech recognition system grammars
WO2000068933A1 (en) * 1999-05-10 2000-11-16 Nuance Communications, Inc. Adaptation of a speech recognition system across multiple remote sessions with a speaker
JP2001157137A (en) * 1999-08-26 2001-06-08 Matsushita Electric Ind Co Ltd Automatic filtering for television contents using voice recognition and natural language

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102008007698A1 (en) * 2008-02-06 2009-08-13 Siemens Aktiengesellschaft Method for detecting an input in a speech recognition system
DE102008021954A1 (en) * 2008-02-29 2009-09-03 Navigon Ag Method for operating an electronic assistance system
CN117556832A (en) * 2023-11-23 2024-02-13 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) Semantic constraint-based emotion support dialogue bidirectional generation method
CN117556832B (en) * 2023-11-23 2024-04-09 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) Semantic constraint-based emotion support dialogue bidirectional generation method

Similar Documents

Publication Publication Date Title
DE69818231T2 (en) METHOD FOR THE DISCRIMINATIVE TRAINING OF VOICE RECOGNITION MODELS
DE602004012909T2 (en) A method and apparatus for modeling a speech recognition system and estimating a word error rate based on a text
EP0797185B1 (en) Method and device for speech recognition
DE602006000090T2 (en) Confidence measure for a speech dialogue system
DE60004862T2 (en) AUTOMATICALLY DETERMINING THE ACCURACY OF A SPEECH DICTIONARY IN A VOICE RECOGNITION SYSTEM
DE69937176T2 (en) Segmentation method to extend the active vocabulary of speech recognizers
DE60111329T2 (en) Adapting the phonetic context to improve speech recognition
DE69822296T2 (en) PATTERN RECOGNITION IN A DISTRIBUTED SYSTEM
DE69725802T2 (en) Pre-filtering using lexical trees for speech recognition
DE69919842T2 (en) LANGUAGE MODEL BASED ON THE LANGUAGE RECOGNITION HISTORY
EP1611568B1 (en) Three-stage word recognition
DE69925479T2 (en) DYNAMIC CONFIGURABLE ACOUSTIC MODEL FOR LANGUAGE RECOGNITION SYSTEMS
DE602004002230T2 (en) Speech recognition system for a mobile device
DE3236834A1 (en) METHOD AND DEVICE FOR VOICE ANALYSIS
DE602005000308T2 (en) Device for voice-controlled applications
DE19847419A1 (en) Procedure for the automatic recognition of a spoken utterance
EP1273003B1 (en) Method and device for the determination of prosodic markers
DE19942178C1 (en) Method of preparing database for automatic speech processing enables very simple generation of database contg. grapheme-phoneme association
DE60133537T2 (en) AUTOMATIC UMTRAINING OF A LANGUAGE RECOGNITION SYSTEM
DE602004004310T2 (en) System with combined statistical and rule-based grammar model for speech recognition and understanding
WO2006111230A1 (en) Method for the targeted determination of a complete input data set in a voice dialogue system
DE102006055864A1 (en) Dialogue adaptation and dialogue system for implementation
DE602004008666T2 (en) Tracking vocal tract resonances using a nonlinear predictor
EP1456837B1 (en) Method and device for voice recognition
EP0285222A2 (en) Method for detecting associatively pronounced words

Legal Events

Date Code Title Description
8100 Publication of the examined application without publication of unexamined application
D1 Grant (no unexamined application published) patent law 81
8364 No opposition during term of opposition
8327 Change in the person/name/address of the patent owner

Owner name: EXCELSIS INFORMATIONSSYSTEME GMBH, 70178 STUTT, DE

R120 Application withdrawn or ip right abandoned