DE4394624B4

DE4394624B4 - Cursive handwritten word recognition from sequential input information - using construction word correlation tables to select strings of vocabulary metastrokes corresponding to candidate word and identifies most likely match

Info

Publication number: DE4394624B4
Application number: DE4394624A
Authority: DE
Inventors: Shelja A. Guberman; Ilia Lossev; Alexander V. Pashintsev
Original assignee: Microsoft Corp
Current assignee: Microsoft Corp
Priority date: 1992-09-24
Filing date: 1993-08-26
Publication date: 2004-08-12
Anticipated expiration: 2013-08-27

Abstract

The recognition method involves receiving input signals having values representative of a sequence of points symbolizing handwriting. A beginning point and ending point of the sequence is also provided by the input signals. A sequence of points, bounded by the beginning point and the end point, is selected as a candidate word. The candidate word is replaced with a string of input metastrokes in sequential order. Each metastroke is representative of an element of a cursive handwritten cipher to obtain a preliminary metastroke string for each candidate word. Word correlation tables are constructed by using a feature correlation table of all metastrokes forming a vocabulary. The feature correlation table relates input metastrokes to vocabulary metastrokes. Strings of vocabulary metastrokes are selected corresponding to the candidate word. The strings of vocabulary metastrokes comprise a listing of entries compiled from variants of known strings of the metastrokes. A single candidate maximum score is extracted for each one of the word correlation tables only upon completion of the word correlation table. The most likely match between the candidate word and one of the strings of the vocabulary metastrokes is identified to an output device.

Description

Die Erfindung betrifft die Handschriftenkennung und bezieht sich insbesondere auf Handschrifterkennungsverfahren und eine Vorrichtung zur Handschrifterkennung, d.h. die Erkennung von aus einem durchgehenden Linienzug bestehenden Zeichen und Wörtern, wobei Informationen über die Strichfolge in Verbindung mit der Eingabe von Strichpositionsinformationen vorgesehen sind.The invention relates to handwriting recognition and relates in particular to handwriting recognition processes and a handwriting recognition device, i.e. the detection of characters and words consisting of a continuous line, where information about the stroke order in connection with the input of stroke position information are provided.

Der Bereich der computerunterstützten Handschriftenkennung ist von Interesse, seitdem viele Menschen nicht die Fähigkeit haben, über eine Tastatur zu kommunizieren und seitdem viele Aufgaben durch eine direkte Eingabe in einen Computer mit einem vertrauten Schreibinstrument, z.B. einem Stift, Kugelschreiber oder Füller entscheidend beschleunigt werden. Die Handschrifterkennung ist insbesondere deshalb eine Herausforderung, weil die Schriftzeichen aus durchgehenden Strichen bestehen und weil sich die Handschriften der Menschen stark voneinander unterscheiden.The field of computer-assisted handwriting recognition has been of interest since many people have not had the ability have about a keyboard to communicate and through many tasks since then direct input into a computer with a familiar writing instrument, e.g. a pen, ballpoint pen or fountain pen become. Handwriting recognition is particularly challenging because the characters consist of solid lines and because people's handwriting is very different.

Die Arbeit des Herrn Dr. Shelja A. Guberman der ehemaligen Sowjetunion, einer der Miterfinder, bildet die Grundlage der Erfindung. In einem Aufsatz, der in russischer Sprache in der Zeitschrift Avtomatika i Telemekhanika, von Shelja A. Guberman und V. V. Rozentsveig unter dem Titel "Algorithmus zur Erkennung eines handgeschriebenen Textes" (Nr. 5, Mai, 1976, Seiten 122–129, UDC, 681.39.06) veröffentlicht wurde; beschreiben die Erfinder den Stand der Technik der Handschrifterkennung und schlagen vor, daß die dynamischen Parameter der Schreibstiftlinienführung in Verbindung mit verschiedenen Erkennungsalgorithmen herangezogen werden. Zu den Erkennungsalgorithmen zählen eine Merkmalsgegenüberstellung zur Identifikation der Striche, die Erkennung des Anfangs und Endes der Trajektorie und die Unterteilung einer Trajektorie in Elemente, die nachfolgend auch als Metastriche bezeichnet werden. Die Erfinder haben ihr Metastrich-Alphabet auf gerade sieben sich selbst schneidende Elemente und drei Bogenelemente beschränkt: Die Arbeit schweigt aber zu der Möglichkeit einer Verwirrung der Elemente in dem Erkennungsprozeß und berücksichtigt nicht die Verwendung von dynamischen Programmierungstechniken. Folglich war die weitere Entwicklung darauf gerichtet, die Zuverlässigkeit und Brauchbarkeit der Erkennung zu verbessern.The work of Dr. Shelja A. Guberman of the former Soviet Union, one of the co-inventors, forms the Basis of the invention. In an essay in Russian in Avtomatika i Telemekhanika, by Shelja A. Guberman and V. V. Rozentsveig under the title "Algorithm for recognition of a handwritten Textes "(No. 5, May, 1976, pages 122-129, UDC, 681.39.06) has been; the inventors describe the prior art of handwriting recognition and suggest that the dynamic parameters of the pen line in connection with various Detection algorithms can be used. To the detection algorithms counting a feature comparison to identify the lines, the detection of the beginning and end the trajectory and the division of a trajectory into elements, which are also referred to below as meta lines. The inventors have their metastrich alphabet on just seven self-intersecting Elements and three arch elements limited: The work is silent to the possibility a confusion of the elements in the recognition process and considered not the use of dynamic programming techniques. consequently the further development was aimed at reliability and improve usability of detection.

In der Vergangenheit wurden Elemente von verschiedenen Techniken offenbart, die denen ähnlich sind, die in Verbindung mit der Erfindung benutzt werden. Diese Entgegenhaltungen dienen dazu, den Stand der Technik zu veranschaulichen. Daher sind Details von speziellen Ausführungsformen der Erfindung, die von diesen bekannten Techniken Gebrauch machen, nicht im einzelnen beschrieben. Die folgenden Druckschriften sind aber dennoch auf dem Gebiet der Handschrifterkennung von Bedeutung.In the past there were elements disclosed by various techniques similar to those which are used in connection with the invention. These citations serve to illustrate the state of the art. Therefore are Details of specific embodiments of the invention using these known techniques not described in detail. The following are publications but still important in the field of handwriting recognition.

Ehrich und Koehler, "Experiments in the Contextual Recognition of Cursive Script," IEEE Transactions on Computers, Vol. C-24, Nr. 2, Februar 1975, Seiten 182–194. Dieser Aufsatz beschreibt die Verwendung von Trennungstechniken zwischen den Hauptteilen der Buchstaben und den Ober- und Unterlängen der Buchstaben als Teil eines Vorerkennungsschemas.Ehrich and Koehler, "Experiments in the Contextual Recognition of Cursive Script, "IEEE Transactions on Computers, Vol. C-24, No. 2, February 1975, pages 182-194. This essay describes the use of separation techniques between the main parts of the Letters and the ascenders and descenders of the letters as part of a pre-recognition scheme.

US A 3,996,557 (Donahey) beschreibt eine Technik, die der von Ehrich u.a. ähnlich ist. US A 3,996,557 (Donahey) describes a technique that is similar to that of Ehrich and others.

US A 3,133,266 (Frischkopf) beschreibt die Standardisierung in Y Richtung, die Verwendung von Wörterbuchgegenüberstellungen zur Erkennung und Abschätzung der Wahrscheinlichkeit der Genauigkeit der Erkennung von einzelnen Wörtern. US A 3,133,266 (Frischkopf) describes the standardization in the Y direction, the use of dictionary comparisons for recognizing and estimating the probability of the accuracy of the recognition of individual words.

US A 3,969,698 (Bollinger u.a.) beschreibt eine Vorrichtung zur nachträglichen Verarbeitung von Wörtern, die von einer Worterkennungsmaschine, einem Sprachanalysator oder einer standardmäßigen Tastatur falsch erkannt wurden. US A 3,969,698 (Bollinger et al.) Describes a device for the subsequent processing of words which have been incorrectly recognized by a word recognition machine, a speech analyzer or a standard keyboard.

US A 4,610,025 (Blum u.a.) beschreibt die Isolation von Ober- und Unterlängen der Buchstaben als Bestandteil eines vorausgehenden analytischen Schrittes und die Isolation von Wörtern zur Identifikation. US A 4,610,025 (Blum et al.) Describes the isolation of ascenders and descenders of the letters as part of a preceding analytical step and the isolation of words for identification.

US-A-4,731,857 (Tappert) und US A-4,764,972 (Yoshida u.a.) beschreiben die Wortisolation als Bestandteil eines Analyseverfahrens. US-A-4,731,857 (Tappert) and US A-4,764,972 (Yoshida et al.) Describe word isolation as part of an analysis process.

US-A-4,933,977 und US-A-4,987,603 (Ohnishi u.a.) beschreiben die Elimination von fremden Zeichen in einem Eingabemuster sowie das Konzept der Erkennung von Elementen, die nichtvollständige Zeichen darstellen, z.B. gerade Striche, Bögen und Schleifen. US-A-4,933,977 and US-A-4,987,603 (Ohnishi et al.) Describe the elimination of foreign characters in an input pattern as well as the concept of recognizing elements that represent incomplete characters, such as straight lines, arcs and loops.

US-A 3,111,646 und US-A-13,127,588 (Harmon) beschreiben Systeme, die von Erkennungstechniken für die Exatrktion charakteristischer Merkmale sowie Strichsequenzinformationen Gebrauch machen. US-A 3,111,646 and US-A-13,127,588 (Harmon) describe systems that make use of recognition techniques for the extraction of characteristic features and stroke sequence information.

US-A-4,754,489 (Bosker) beschreibt ein System zur Erkennung von Buchstabengruppen, die als Digramms und Trigramms bezeichnet werden. US-A-4,754,489 (Bosker) describes a system for recognizing groups of letters, which are referred to as digrams and trigrams.

US-A-5,034,989 (Loh) beschreibt ein Verfahren zur Identifikation einzelner handgeschriebener Buchstaben. US-A-5,034,989 (Loh) describes a method for identifying individual handwritten letters.

GB 2087616 A beschreibt ein System zum Nachbilden von stenographischen Zeichen, wobei mittels Erkennens von winkelförmigen Unterbrechungen und der winkelförmigen Ausrichtung eine stenographische Kurzdarstellung in Merkmale aufgespaltet wird, welche die Konsonanten darstellen. GB 2087616 A describes a system for reproducing stenographic characters, wherein by recognizing angular interruptions and the angular alignment, a short stenographic representation is split up into features which represent the consonants.

US 4718102 A beschreibt ein Verfahren und eine Vorrichtung zum Erkennen von Zeichen in zwei Teilen. Ein algorithmischer Teil erzeugt Gruppen von verwechselbaren Zeichen in dem Regeln gleichmäßig auf alle oder auf große Gruppen von Zeichen angewendet werden. Ein nicht algorithmischer Teil eliminiert bis auf ein bestimmtes Zeichen alle Zeichen in jeder der erzeugten Gruppen aus verwechselbaren Zeichen. US 4718102 A describes a method and an apparatus for recognizing characters in two parts. An algorithmic part creates groups of confusing characters by applying rules evenly to all or to large groups of characters. A non-algorithmic part eliminates all characters in each of the generated groups from confusing characters except for a certain character.

US 5140645 A beschreibt ein computerkompatibles Zeichen, das aus einem Punkt und acht Armen mit gleichem Abstand besteht, wobei einzelne Zeichen aus Untergruppen dieser acht Arme erzeugt werden. US 5140645 A describes a computer-compatible character consisting of a point and eight arms with the same spacing, individual characters being generated from subgroups of these eight arms.

Kamel, K.; Imam, I. "A computerized transcription system for cursive shorthand writing" Southeastcon '88.; IEEE Conference Proceedings, 11–13, Apr 1988, Pages: 336–339 beschreibt ein Verfahren zum extrahieren kritischer Punkte und Segmente aus stenographischen Kurzdarstellungen. Die stenographischen Kurzzeichen werden mittels einer Software durch Permutieren der kritischen Punkte erkannt.Kamel, K .; Imam, I. "A computerized transcription system for cursive shorthand writing "Southeastcon '88.; IEEE Conference Proceedings, 11-13, Apr. 1988, Pages: 336-339 describes a method for extracting critical points and segments from short stenographs. The shorthand shorthand using software by permuting the critical points recognized.

Es ist die Aufgabe der vorliegenden Erfindung ein verbessertes Verfahren und System zur Handschriftenkennung bereitzustellen.It is the task of the present Invention an improved method and system for handwriting recognition provide.

Diese Aufgabe ist durch den Gegenstand der unabhängigen Ansprüche gelöst. Bevorzugte Ausführungsformen werden in den Unteransprüchen definiert.This task is through the subject the independent Expectations solved. Preferred embodiments are in the subclaims Are defined.

Das erfindungsgemäße Verfahren und die erfindungsgemäße Vorrichtung für die Handschrifterkennung macht von einer Zwischenbeschreibungssprache für handgeschriebene Wörter Gebrauch, die aus Metastrichen zusammengesetzt ist. Metastriche sind Elemente oder Abschnitte einer Strichform, die benutzt werden, um einen Strich darzustellen. Ein Strich ist als zusammenhängendes Segment definiert, das beginnt, wenn der Stift die Oberfläche des Tableaus des Digitalisierers berührt und das endet, wenn der Stift von der Oberfläche abgehoben wird, wobei der Strich ein oder mehrere geschriebene Buchstaben umfaßt. Ein Kursivwort kann ein oder mehrere Striche umfassen, je nachdem, ob der Stift während des Schreibens des Wortes von der Oberfläche abgehoben wird oder nicht. Nach der Erfindung sind im allgemeinen wenigstens zwanzig Metastriche erforderlich, um das notwendige Vokabular oder einen Satz von zulässigen elementaren Strichformen zu bilden, obwohl nicht weniger als siebzig Metastriche benutzt werden können. Zusätzliche Metastriche verbessern die Erkennungsgenauigkeit der Erfindung auf Kosten einer wachsenden Rechenzeit. Die Techniken zur Interpretation der Eingabe-Metastrichsegmente als Wörter umfaßt das Vergleichen der Eingabe-Metastrichsegmente mit Metastrichsegmenten aus einem Wörterbuch von als Metastriche "geschriebenen" Wörtern und das Zuordnen eines Wahrscheinlichkeitswertes eines Übereinstimmungswertes für jedes so identifizierte Wort. Der zugeordnete Wert für die Wahrscheinlichkeit der Übereinstimmung wird als "Wortmaß" bezeichnet. Diese Technik umfaßt im einzelnen das Vergleichen der Eingabe mit jedem Wort in dem Wörterbuch, Metastrich für Metastrich, das Zuordnen einer Metastrichbewertung zu jeder Position, an der ein Metastrichübereinstimmung gefunden wurde, das Addieren der Bewertungen für die Metastrichübereinstimmungen für jedes so getestete Segment, um das Wortmaß zu erhalten, Anordnen der Wörter nach dem Wortmaß, indem die Wortmaße sowohl mit einem vorbestimmten Grenzwert als auch untereinander im Hinblick auf ihre Übereinstimmung verglichen werden, das Substituieren, Addieren und Löschen von Metastrichen in der Sequenz entweder gleichzeitig oder fortlaufend und dann das Vergleichen des so modifizierten Eingabe-Metastrichsegmentes mit dem Wörterbuch, um weitere Wortmaße zu erhalten, bis ein Wortmaß gefunden wurde, das den Grenzwertkriterien genügt. Wegen der unterschiedlichen Handschriften sind in jedem Wörterbuch normalerweise viele vordefinierte Metastrich-Beschreibungen ("Buchstabierungen") für jedes mögliche Wort abgelegt. Das erfindungsgemäße Verfahren umfaßt die Erkennung ganzer Wörter und nicht einzelner Buchstaben, wie von anderen vorgeschlagen worden ist. Anstelle des Durchsuchens, um ein handgeschriebenes Wort in einzelne Buchstaben zu zerlegen und anstelle des Suchens nach dem besten ersten Buchstaben, dann dem besten zweiten Buchstaben etc., macht die Erfindung von einem Verfahren des Berechnens von Rechenbewertungen der Übereinstimmungen Gebrauch. Für typische Metastrich-Sequenzen ist die Anzahl der möglichen Übereinstimmungen sehr groß und folglich umfaßt das erfindungsgemäße Verfahren das Addieren, Löschen und Substituieren, um sowohl den Umfang der Suche zu verringern als auch die Geschwindigkeit des Vergleichsverfahrens zu erhöhen.The method according to the invention and the device according to the invention for the Handwriting recognition makes of an intermediate description language for handwritten words Use composed of metastrokes. metastrokes are elements or sections of a stroke shape that are used to represent a line. A dash is a coherent Defines segment that starts when the stylus hits the surface of the Touches the digitizer's panels and that ends when the pen is lifted off the surface, the Dash contains one or more written letters. On Italic word can include one or more dashes, depending on whether the pen during of writing the word is lifted off the surface or not. According to the invention there are generally at least twenty meta lines required to have the necessary vocabulary or set of permissible elementary To form stroke shapes, though no less than seventy meta strokes can be used. additional Meta lines improve the recognition accuracy of the invention Cost of growing computing time. The techniques of interpretation the input metastroke segments as words includes comparing the input metastroke segments with meta segments from a dictionary of words "written" as meta lines and assigning a probability value to a match value for each so identified word. The associated match probability value is referred to as "word measure". This Technology includes specifically comparing the input with each word in the dictionary, Metastrich for Metastrich, assigning a metastrich rating to each position, at the one meta match was found adding the ratings for the metastick matches for each segment so tested to get word size, arranging the words according to the word measure, by the word measures both with a predetermined limit and with each other in terms of their agreement be compared, the substitution, addition and deletion of Meta strokes in the sequence either simultaneously or continuously and then comparing the input metastroke segment so modified with the dictionary, for more words to get until a word measure is found that meets the limit criteria. Because of the different Manuscripts are in every dictionary usually lots of predefined metastrich descriptions ("spellings") for each possible Word filed. The method according to the invention comprises the recognition of whole words and not single letters as suggested by others is. Instead of searching for a handwritten word in decompose individual letters and instead of looking for the best first letter, then the best second letter etc., makes the invention of a method of computing arithmetic scores of matches Use. For typical metastrich sequences the number of possible matches is very high big and therefore embraced the inventive method adding, deleting and substitute to both reduce the scope of the search as well as increasing the speed of the comparison process.

In einer besonderen Ausführungsform der Erfindung umfaßt die Erkennungseinrichtung eine digitalisierende Tastatur zur Eingabe von Signalen mit Werten, die eine Sequenz von Punkten in einem Koordinatensystem mit Indizien von einem Anfangs- und einem Endpunkt darstellen, und eine Verarbeitungseinrichtung zum Durchführen von verschiedenen Funktionen mit den Signalen, die in einer dedizierten Computereinrichtung oder in einer Datenvorverarbeitungseinrichtung eines computerunterstützten Systems eingeschlossen sein kann. Die Vorverarbeitungseinrichtung kann die folgenden Verfahren durchführen: Das Unterteilen der Sequenz der zwischen dem Anfangs- und dem Endpunkt liegenden Punkte in Prüfwörter, Zeichenfolgen oder Segment, das Unterscheiden zwischen dem Anfangspunkt eines Wortsegmentes und dem eines einzelnen Wortes, das Kombinieren der Wortsegmente zur Bildung vollständiger Wörter, das Festsetzen einer unteren Basislinie und einer oberen Basislinie für das Prüfwort, um die Größe und den Maßstab des Prüfwortes festzustellen, das Rekonstruieren des Prüfwortes als ein rekonstruiertes Wort mit einer Ersatzsequenz von Punkten, wobei interpolierte Punkte eingefügt und falsche Punkte gelöscht werden, das Lokalisieren und Tabellieren von kritischen Punkten in dem rekonstruierten Wort in sequentieller Reihenfolge, wobei die Punkte Maxima, Minima, Schnittpunkte, Punkte und Kreuzungspunkte umfassen, das Wiedereinsetzen des rekonstruierten Wortes mit einer Sequenz von Metastrichen, die dem erfindungsgemäßen Metastrich-Vokabular entspricht, wobei jeder Metastrich ein Element eines handgeschriebenen Schriftzeichens darstellt. Dieser Wiedereinsetzungsschritt kann im einzelnen das Vergleichen der kritischen Punkte mit Indizien von bekannten kritischen Punkten umfassen, um eine vorläufige Metastrich-Sequenz für jedes rekonstruierte Wort zu erhalten. Demgemäß basiert die Erfindung auf dem Auswählen von vielen der am besten passenden Übereinstimmungen in einer Wahrscheinlichkeitsreihenfolge aus den Einträgen in einem zusammengestellte Einträge aus bekannten Metastrich-Sequenzvarianten umfassenden Wörterbuch mittels einer Matrix der Übereinstimmungswahrscheinlichkeit der einzelnen Metastriche. Dieser Auswahlschritt kann das Auswählen eines bevorzugten Metastrichs an ausgewählten Positionen in Abhängigkeit von einer Maximalbewertungsberechnung umfassen. Es kann eine Analyse auf i) einer Vorwärtssequenz der Metastriche, ii) einer Rückwärtssequenz der Metastriche und iii) der am besten passenden Wortanfänge und gleichzeitig der am besten passenden Wortenden durchgeführt werden. Die Maximalbewertungsberechnung kann eine Analyse der Gewichtung der Ergebnisse, der Additionen, der Löschungen und der Substitutionen der Metastriche in bezug auf die benachbarten Metastriche umfassen. Die Ergebnisse werden bevorzugt in der Form eines, möglicherweise auch in der Form von mehreren Prüfwörtern auf der Grundlage einer Liste der am besten passenden Übereinstimmungen aus dem Wörterbuch an eine Ausgabeeinrichtung abgegeben. Normalerweise wird eine positive Erkennung eines einzelnen Prüfworts angezeigt, wenn die Wahrscheinlichkeit der Übereinstimmungsfigur der Wertigkeit einen vorbestimmten Grenzwert überschreitet.In a particular embodiment of the invention, the recognition device comprises a digitizing keyboard for entering signals with values that represent a sequence of points in a coordinate system with indications of a start and an end point, and a processing device for performing various functions with the signals, which can be included in a dedicated computer device or in a data preprocessing device of a computer-aided system. The preprocessor can perform the following methods: dividing the sequence of points between the start and end points into check words, strings or segments, distinguishing between the start point of a word segment and that of a single word, combining the word segments to form complete words , setting a lower baseline and an upper baseline for the test word to determine the size and scale of the test word deliver, the reconstruction of the test word as a reconstructed word with a replacement sequence of points, interpolated points being inserted and incorrect points being deleted, the localization and tabulation of critical points in the reconstructed word in sequential order, the points being maxima, minima, intersections, Dots and crossing points include the reinsertion of the reconstructed word with a sequence of metastrokes which corresponds to the metastrich vocabulary according to the invention, each metastank representing an element of a handwritten character. This reinsertion step can include comparing the critical points with evidence of known critical points to obtain a preliminary metastrich sequence for each reconstructed word. Accordingly, the invention is based on selecting many of the best-fitting matches in a probability order from the entries in a dictionary comprising compiled entries from known metastrich sequence variants by means of a matrix of the likelihood of matching of the individual metastrokes. This selection step can include the selection of a preferred meta line at selected positions depending on a maximum rating calculation. Analysis can be performed for i) a forward sequence of the meta dashes, ii) a backward sequence of the meta dashes, and iii) the most suitable word starts and at the same time the most suitable word ends. The maximum score calculation may include an analysis of the weighting of the results, additions, deletions and substitutions of the meta-ticks with respect to the neighboring meta-ticks. The results are preferably given to an output device in the form of one, possibly also in the form of several test words on the basis of a list of the most suitable matches from the dictionary. Normally, a positive recognition of a single check word is displayed if the probability of the correspondence figure of the significance exceeds a predetermined limit value.

In einer besonderen Ausführungsform kann das Verfahren das Messen der durchschnittlichen Neigung von Punktsequenzen jedes Prüfwortsegments und das Teilen des Prüfwortsegments entlang horizontaler Grenzen in eine mittlere Zone zwischen einer unteren und einer oberen Basislinie umfassen, wobei angenommen wird, daß sich die Körper der Buchstaben in einem oberen Bereich, in dem die Oberlängen der Buchstaben angenommen werden, und in einem unteren Bereich befinden, in dem die Unterlängen der Buchstaben angenommen werden. Diese Größeninformation unterstützt in Verbindung mit der durch die Identifikation der Metastriche erlangten Konturinformation das Wörterbuch darin, den Wert jedes Metastrichs an einer Position in einer Sequenz von akzeptablen Metastrichen in dem Wörterbuch zu bestimmen. Die Größeninformation ist auch als Teil der Korrelation gewichtet.In a special embodiment the method can measure the average slope of Dot sequences of each checkword segment and sharing the checkword segment along horizontal boundaries in a middle zone between one include lower and upper baseline, assuming that itself the body the letters in an upper area where the ascenders of the Letters are accepted and are in a lower area in which the descenders the letters are accepted. This size information supports in conjunction with the contour information obtained by identifying the metastrokes the dictionary in it, the value of each metastroke at one position in a sequence to determine acceptable metastrokes in the dictionary. The size information is also weighted as part of the correlation.

Unter Bezugnahme auf die nachfolgende detaillierte Beschreibung in Verbindung mit den zugehörigen Zeichnungen wird die Erfindung besser verständlich und weitere Details der Aspekte der Erfindung werden deutlich.Referring to the following detailed description in connection with the accompanying drawings the invention will be better understood and further details of aspects of the invention will become apparent.

FIGURENKURZBESCHREIBUNGBRIEF DESCRIPTION

1 zeigt ein Blockdiagramm des allgemeinen erfindungsgemäßen Erkennungssystems. 1 shows a block diagram of the general recognition system according to the invention.

2 zeigt ein Blockdiagramm der Funktionselemente der Erfindung. 2 shows a block diagram of the functional elements of the invention.

3 zeigt eine Tabelle, welche die Metastriche entsprechend einer bevorzugten Ausführungsform der Erfindung veranschaulicht. 3 Figure 12 shows a table illustrating the meta lines according to a preferred embodiment of the invention.

4 zeigt ein erstes Flußdiagramm des erfindungsgemäßen Verfahrens. 4 shows a first flow chart of the method according to the invention.

5 zeigt ein zweites Flußdiagramm des erfindungsgemäßen Verfahrens. 5 shows a second flow chart of the method according to the invention.

6A zeigt eine Darstellung des handgeschriebenen Wortes "may" . 6A shows an illustration of the handwritten word "may".

6B zeigt eine mögliche Metastrich-Sequenz, die auf dem Wort "may" in 6A beruht. 6B shows a possible metastrich sequence that is based on the word "may" in 6A based.

7 zeigt eine mögliche Wörterbuch-Schreibweise des Wortes "may". 7 shows a possible dictionary spelling of the word "may".

8 zeigt eine mögliche Korrelationsmatrix für das Wort "may". 8th shows a possible correlation matrix for the word "may".

9 zeigt eine Darstellung einer Metastrichproben-Merkmalkorrelationstabelle von Daten für Substitutionen, um eine Eingabesequenz einer Vokabelsequenz in ihrem Aussehen anzupassen. 9 shows a representation of a meta-sample feature correlation table of data for substitutions to adapt an input sequence of a vocabulary sequence in its appearance.

10A veranschaulicht Probenerschwerungen für die Addition von ausgewählten Metastrichen, um eine Eingabesequenz in ihrem Aussehen an eine Vokabelsequenz anzupassen. 10A illustrates sample complications for the addition of selected meta lines to match an input sequence in appearance to a vocabulary sequence.

10B veranschaulicht Probenerschwerungen zum Löschen von ausgewählten Metastrichen, um eine Eingabesequenz in ihrem Aussehen an eine Vokabelsequenz anzupassen. 10B illustrates sample complications for deleting selected meta lines to match an input sequence in appearance to a vocabulary sequence.

11 ist eine Darstellung einer Größenkorrelationstabelle entsprechend der Tabelle von 9, um in Substitutionen eine Eingabesequenz ihrem Aussehen nach an eine Vokabelsequenz anzupassen. 11 FIG. 4 is an illustration of a size correlation table corresponding to the table of FIG 9 to adapt an input sequence to a vocabulary sequence in terms of its appearance.

12A zeigt Probengrößenerchwerungen entsprechend der Tabelle von 10A, um in Additionen eine Eingabesequenz ihrem Aussehen nach an eine Vokabelsequenz anzupassen. 12A shows sample size calculations according to the table of 10A to adapt an input sequence to a vocabulary sequence in appearance.

12B zeigt Probengrößenerschwerungen entsprechend der Tabelle von 10B, um in Löschungen eine Eingabesequenz ihrem Aussehen nach einer Vokabelsequenz anzupassen. 12B shows sample size complications according to the table of 10B to change an input sequence in terms of appearance to a vocabulary sequence.

13 zeigt eine vollständige Metastrich-Merkmalkorrelationstabelle von Daten für Gewichte für Substitutionen, um eine Eingabesequenz ihrem Aussehen nach einer Vokabelsequenz anzupassen, für Erschwerungen für Additionen (Spalte 1) und für Erschwerungen für Löschungen (Reihe 1), die das Ähnlichkeitsmaß für die Metastriche für eine Ausführungsform der Erfindung definieren. 13 shows a complete Metastrich feature correlation table of data for weights for substitutions in order to adapt an input sequence to its appearance according to a vocabulary sequence, for complications for additions (column 1 ) and for complications for deletions (row 1 ) which define the degree of similarity for the meta lines for an embodiment of the invention.

14 zeigt eine vollständige Größenkorrelationstabelle für die Ausführungsform entsprechend der Merkmalkorrelationstabelle von 13, welche die Gewichte und Erschwerungen für Substitutionen, Additionen (Spalte 1) und Löschungen (Reihe 1) veranschaulicht, um eine Eingabesequenz ihrem Aussehen nach einer Vokabelsequenz anzupassen. 14 FIG. 10 shows a full size correlation table for the embodiment corresponding to the feature correlation table of FIG 13 , which the weights and difficulties for substitutions, additions (column 1 ) and deletions (row 1 ) to adapt an input sequence to its appearance according to a vocabulary sequence.

BESCHREIBUNG DER BEVORZUGTEN AUSFÜHRUNGSFORMENDESCRIPTION OF THE PREFERRED EMBODIMENTS

1 zeigt die erfindungsgemäße Erkennungseinrichtung 10 für kursive Handschrift. Die Einrichtung 10 weist zunächst als Eingabeeinrichtung eine Digitalisierungstastatur 12 oder einen ähnlichen Mechanismus auf, der in Abhängigkeit von der Eingabe mittels eines Stiftes 14 als Ausgang "Eingabesignale" erzeugt, die charakteristische Werte für eine Sequenz von Punkten haben, welche die Handschrift in einem Koordinatensystem symbolisieren, das durch den Digitalisierer zusammen mit einem Symbol oder einer Anzeige des Anfangs- und Endpunktes jeder Sequenz von Punkten definiert ist. Das Signal für den Anfangspunkt und den Endpunkt kann einfach ein negativer Wert sein, der automatisch dann generiert wird, wenn der Stift 14 von dem Digitalisierer 12 abgehoben wird. Die X-Y-Koordinaten-Punktesequenz wird an eine Eingabeschnittstelle gelegt, welche die Werte dieser Koordinatenpunkte wiederum an eine Eingabepuffereinrichtung 18 abgibt. Die Eingabepuffereinrichtung 18 bewirkt eine vorübergehende oder systemunabhängige Speicherung, während die Eingabesequenz verarbeitet wird. Die Einrichtung 10 umfaßt ferner einen Prozessor 20 mit einer zugehörigen Programmspeichereinrichtung 22, z.B. einen Festspeicher (ROM), und eine innerprozessuale Speichereinrichtung 24, z.B. einen Direktzugriffsspeicher (RAM). Zwischen dem Prozessor 20 und der innerprozessualen Speichereinrichtung 24 und der Programmspeichereinrichtung 22 sind Kontroll- und Datenleitungen vorgesehen. Die Programmspeichereinrichtung 22 dient zum permanenten oder semipermanenten Speichern von ausführbaren Computerprogrammen, einer Merkmaltabelle zur Identifikation der Metastriche, wie nachfolgend beschrieben wird, sich auf die Metastriche beziehende Korrelationsmatrizen oder Tabellen und Wörterverzeichnisse von Metastrichen zur Identifikation von Worten etc.. 1 shows the detection device according to the invention 10 for italic handwriting. The facility 10 first has a digitizing keyboard as an input device 12 or a similar mechanism depending on the input using a pen 14 generated as an output "input signals" which have characteristic values for a sequence of points which symbolize the handwriting in a coordinate system which is defined by the digitizer together with a symbol or an indication of the start and end point of each sequence of points. The signal for the start point and the end point can simply be a negative value that is automatically generated when the pen 14 from the digitizer 12 is lifted off. The XY coordinate point sequence is applied to an input interface, which in turn sends the values of these coordinate points to an input buffer device 18 emits. The input buffer facility 18 causes temporary or system-independent storage while the input sequence is being processed. The facility 10 also includes a processor 20 with an associated program storage device 22 , for example a read-only memory (ROM), and an internal process memory device 24 , eg a random access memory (RAM). Between the processor 20 and the internal process storage device 24 and the program storage device 22 control and data lines are provided. The program storage facility 22 is used for permanent or semi-permanent storage of executable computer programs, a feature table for identifying the meta lines, as described below, correlation matrices relating to the meta lines or tables and dictionaries of meta lines for identifying words etc.

Die innerprozessuale Speichereinrichtung 24 dient zur Zwischenspeicherung von Prüfwörtern, die von den Eingabedaten abgeleitet werden, von aus den Wörtern berechneten Basislinien, von rekonstruierten auf Interpretation und Normalisierung beruhenden Wörtern sowie von anderen verwandten Prozessen, von kritischen Punkten der rekonstruierten Wörter für den Vergleich mit den Merkmalen, von den Merkmaltabellen abgeleiteten Metastrichsequenzen, als Ergebnis der Maximalbewertungsberechnungen erzeugten Ersatz-Metastrichsequenzen und Figuren der Wertigkeit von verschiedenen aus den Korrelationstabellen entwickelten Maximalbewertungsberechnungen. Der Prozessor 20 führt die Programme der Programmspeichereinrichtung 22 aus, um schließlich eine Wortidentifikation oder ein Wort zu erzeugen, das an ein Ausgabegerät oder eine Ausgabeschnittstelle 26 geliefert werden soll.The internal process storage device 24 is used for the temporary storage of check words derived from the input data, from baselines calculated from the words, from reconstructed words based on interpretation and normalization as well as from other related processes, from critical points of the reconstructed words for comparison with the features, from the feature tables derived meta-strobe sequences, replacement meta-strobe sequences generated as a result of the maximum weighting calculations and figures of the value of various maximum weighting calculations developed from the correlation tables. The processor 20 runs the programs of the program storage device 22 to finally generate a word identification or a word that is sent to an output device or an output interface 26 to be delivered.

2 zeigt in einer detaillierteren Darstellung die funktionalen Elemente der erfindungsgemäßen Einrichtung 10. Über die Eingabeschnittstelle 16 gibt der Digitalisierer 12 die Startmarke, die Stoppmarke und die Positionsdaten an die Puffereinrichtung 18 aus. Die Eingabepuffereinrichtung 18 kann die Grenzen eines Prüfwortes mittels der Start- und Stoppmarken identifizieren, welche eine Unterbrechung in der Dateneingabesequenz anzeigen. Die Eingabepuffereinrichtung 18 kann auch die Grenzen eines Prüfwortsegments durch den Vergleich der Länge von verschiedenen Datensequenzunterbrechungen identifizieren, wobei festgestellt wird, welche Unterbrechungen eine Wortunterbrechung und welche Unterbrechungen eine Unterbrechung innerhalb eines Wortes anzeigen. Die Einrichtung 28 ist vorgesehen, um eine Orientierung festzulegen und insbesondere um die Richtung der Schrift derart zu bestimmen, daß die Schrift parallel zu einer horizontalen Referenz ausgerichtet ist. 2 shows in a more detailed representation the functional elements of the device according to the invention 10 , Via the input interface 16 gives the digitizer 12 the start mark, the stop mark and the position data to the buffer device 18 out. The input buffer facility 18 can identify the boundaries of a check word using the start and stop marks that indicate an interruption in the data entry sequence. The input buffer facility 18 can also identify the boundaries of a check word segment by comparing the length of different data sequence breaks, determining which breaks indicate a word break and which breaks indicate a break within a word. The facility 28 is provided to determine an orientation and in particular to determine the direction of the font in such a way that the font is aligned parallel to a horizontal reference.

Die Einrichtung 30 ist entsprechend vorgesehen, um das Prüfwort (als ein "rekonstruiertes Wort") mit einer Ersatzsequenz von Punkten zu rekonstruieren. Die Ersatzsequenz von Punkten kann in dem Prüfwort an interpolierten Stellen eingesetzte Punkte und aus dem Prüfwort gelöschte falsche Punkte umfassen. Falsche Punkte sind derartige Punkte, die keine Beziehung zu irgendeiner Sequenz von Strichen haben, weder als eine Fortsetzung eines Segmentes noch als ein Punkt, z.B. als eine Periode oder ein Betonungsmerkmal.The facility 30 is accordingly provided to reconstruct the check word (as a "reconstructed word") with a replacement sequence of points. The replacement sequence of points can include points inserted at interpolated points in the check word and incorrect points deleted from the check word. False points are those points that have no relation to any sequence of dashes, neither as a continuation of a segment nor as a point, for example, as a period or an emphasis feature.

Die Einrichtung 32 ist entsprechend vorgesehen, um eine untere Basislinie und eine obere Basislinie für jedes Prüfwort zur Bestimmung der Größe und des Maßstabes festzulegen. Die Basislinien-Feststellungseinrichtung 32 umfaßt eine Einrichtung zum horizontalen Aufteilen des Prüfwortes in einen mittleren Bereich zwischen einer unteren Basislinie und einer oberen Basislinie, die durch das Prüfen z.B. der Dichte der Punkte ober- und unterhalb jeder Basislinie berechnet werden und kennzeichnet den Raum oberhalb der Basislinie als Oberlängen der Buchstaben und kennzeichnet den Bereich unterhalb der Basislinie als Unterlängen der Buchstaben. Das Element 32 umfaßt ferner eine Einrichtung zum Messen der Durchschnittsneigung der ausgewählten Punktsequenzen, wie beispielsweise durch die durchschnittliche Trajektorie jeder der ausgewählten Ober- bzw. Unterlängen in der Ober- bzw. Unterlängenzone bestimmt sind. Die Einrichtung 32 umfaßt auch eine Einrichtung zum Normalisieren der Daten in einen gewünschten Maßstab.The facility 32 is accordingly provided to define a lower baseline and an upper baseline for each test word for determining the size and scale. The baseline notifier 32 comprises means for horizontally dividing the test word into a middle region between a lower baseline and an upper baseline, which are calculated by checking, for example, the density of the points above and below each baseline, and identifies the space above the baseline as Ascenders of the letters and marks the area below the baseline as descenders of the letters. The element 32 further includes means for measuring the average slope of the selected point sequences as determined, for example, by the average trajectory of each of the selected ascenders or descenders in the ascension and descent zone. The facility 32 also includes means for normalizing the data to a desired scale.

Die Einrichtung 32 liefert ihre Daten dann an eine Lokalisierungseinrichtung 34 für kritische Punkte. Die Aufgabe der Lokalisierungseinrichtung 34 für kritische Punkte liegt darin, alle relevanten kritischen Punkte in dem rekonstruierten Wortsegment, das durch den Punktinterpolator 32 erzeugt wird, in sequentieller Reihenfolge zu lokalisieren und tabellieren. Kritische Punkte sind beispielsweise Maxima, Minima, Schnittpunkte von Liniensegmenten, Punkte und Kreuzungspunkte. Die so tabellierten kritischen Punkte können dann mit einer Tabelle verglichen werden, die Metastriche identifizierende bekannte kritische Punkte enthält.The facility 32 then delivers their data to a localization facility 34 for critical points. The task of the localization facility 34 For critical points, all relevant critical points are in the reconstructed word segment by the point interpolator 32 is generated to locate and tabulate in sequential order. Critical points are, for example, maxima, minima, intersections of line segments, points and crossing points. The critical points tabulated in this way can then be compared with a table which contains known critical points identifying metastrokes.

Eine Metastrich-Erkennungseinrichtung 36 ist gemäß der Erfindung vorgesehen, welche die als kritische Punkte herausgestellten Merkmale verarbeitet und ein rekonstruiertes Wortsegment durch eine Zeichenfolge von Metastrich-Identifizierungscodierungen ersetzt. Im allgemeinen bilden wenigstens zwanzig Metastriche das erforderliche Vokabular oder den erforderlichen Satz von zulässigen Strichelementformen, obwohl nicht weniger als siebzig Metastriche benutzt werden können. Zusätzliche Metastriche verbessern die Erkennungsgenauigkeit der Erfindung. In einer bevorzugten Ausführungsform gibt es dreiunddreißig unterschiedlich definierte Metastriche oder Kursivschriftmerkmale.A Metastrich detection facility 36 is provided according to the invention, which processes the features highlighted as critical points and replaces a reconstructed word segment with a string of metastrich identification codes. Generally, at least twenty meta-strokes form the required vocabulary or set of acceptable stroke element shapes, although no less than seventy meta-strokes can be used. Additional meta lines improve the recognition accuracy of the invention. In a preferred embodiment, there are thirty-three differently defined meta lines or italics.

3 zeigt eine Tabelle von Metastrichen mit ihren Definitionen für die bevorzugte Ausführungsform. Diese Metastriche sind entsprechend der Erfindung festgelegt worden, um englischsprachige Wörter in einem computergespeicherten Wörterbuch identifizieren zu können. 3 shows a table of metastars with their definitions for the preferred embodiment. These meta lines have been defined in accordance with the invention in order to be able to identify English words in a computer-stored dictionary.

In der Tabelle von 3 sind die folgenden Metastriche identifiziert:
ein Strich mit einer breiten Unterbrechung,
ein "wild card" Strich, der alles bedeuten kann,
ein allgemeiner horizontaler Strich,
ein Maximalmerkmal,
ein Minimalmerkmal,
ein Winkel ohne Schleife,
ein Strich mit einer schmalen Unterbrechung,
ein Punkt, der beispielsweise eine Periode repräsentiert,
ein Kreuzungspunkt,
ein rückwärts nach oben gerichteter Bogen mit einem freien Ende am Bogenanfang,
ein rückwärts nach oben gerichteter Bogen mit einem freien Ende am Bogenende,
ein rückwärts nach oben gerichteter Bogen ohne freies Ende,
ein mit entgegen dem Uhrzeigersinn gerichteten Strichen gezeichnetes umgekehrtes Gamma,
ein mit entgegen dem Uhrzeigersinn gerichteten Strichen gezeichneter Kreis,
ein mit einem im Uhrzeigersinn gerichteten Strich gezeichnetes Gamma,
ein vorwärts nach unten gerichteter Bogen ohne freies Ende,
ein vorwärts nach unten gerichteter Bogen mit einem freien Ende am Anfang;
ein vorwärts nach unten gerichteter Bogen mit einem freien Ende an seinem Ende,
ein vorwärts nach oben gerichteter Bogen mit einem freien Ende an seinem Ende;
ein vorwärts nach oben gerichteter Bogen mit einem freien Ende an seinem Anfang,
ein vorwärts nach oben gerichteter Bogen ohne ein freies Ende,
ein im Uhrzeigersinn gezeichnetes umgekehrtes Gamma,
ein im Uhrzeigersinn gezeichneter Kreis,
ein im Uhrzeigersinn gezeichnetes Gamma,
ein rückwärts nach unten gerichteter Bogen ohne ein freies Ende,
ein rückwärts nach unten gerichteter Bogen mit einem freien Ende an seinem Anfang,
ein rückwärts nach unten gerichteter Bogen mit seinem freien Ende am Anfang,
irgendein nach links gerichteter oder horizontaler Bogen,
irgendein nach rechts gerichteter oder horizontaler Bogen,
eine allgemeine vertikale Komponente,
ein allgemeiner Bogenabschnitt an dem am weitesten links liegenden Ende von einem Segment, und
ein nach unten gerichteter Bogen irgendeiner Richtung und ein Bogenabschnitt am weitesten rechts liegenden Ende von irgendeinem Wortsegment.In the table of 3 the following meta lines are identified:
a line with a wide break,
a "wild card" stroke that can mean anything
a general horizontal stroke,
a maximum feature,
a minimal feature,
an angle without a loop,
a line with a narrow break,
a point that represents a period, for example,
a crossing point,
a backward-facing sheet with a free end at the beginning of the sheet,
a backward-facing sheet with a free end at the end of the sheet,
a backward-facing sheet with no free end,
an inverted gamma drawn with counter-clockwise strokes,
a circle drawn with counter-clockwise strokes,
a gamma drawn with a clockwise line,
a forward-facing bow with no free end,
a forward-facing bow with a free end at the beginning;
a forward-facing bow with a free end at its end,
a forward upward arc with a free end at its end;
a forward-facing arc with a free end at the beginning,
a bow pointing upwards without a free end,
an inverted gamma drawn clockwise,
a clockwise drawn circle,
a clockwise drawn gamma,
a backward-facing bow without a free end,
a backward-facing bow with a free end at the beginning,
a backward-facing bow with its free end at the beginning,
any left or horizontal arc,
any right or horizontal arc,
a general vertical component,
a general arc section at the leftmost end of a segment, and
a downward arc of any direction and a right most arc portion of any segment of a word.

Die durch die Metastrich-Erkennungseinrichtung 36 erzeugte Metastrichcode-Zeichenfolge (nachfolgend als Metastrich-Zeichenfolge bezeichnet) wird nach der Erfindung einem Worterkennungsteilsystem 38 zugeführt, um die Worte in einer speziellen Sprache zu erkennen, z.B. Englisch. Die Verarbeitungsweise von einem dieser Elemente wird nachfolgend im einzelnen erläutert. Die Elemente des Worterkennungsteilsystems 38 umfassen eine auf einem "ganzen Wort" basierende Analysatoreinrichtung 44 zur Durchführung einer Maximalbewertungsanalyse in dynamischen Programmierungsprozeduren, wie nachfolgend erklärt wird, um eine optimale Übereinstimmung zwischen einer Zeichenfolge von Eingabe-Metastrichen und einer ein bekanntes ganzes Wort bildende "Vokabular"-Metastrichzeichenfolge zu erhalten. Das Teilsystem 38 kann also wahlweise eine auf "Buchstaben" beruhende Analysatoreinrichtung 42 zum Analysieren von Metastrichen durch Buchstaben (alphanumerische Zeichen) umfassen. Einige von diesen auf Buchstaben beruhenden Analysatoreinrichtungstypen 42 sind in Verbindung mit einer auf Buchstaben oder aufgeteilten Zeichenfolgen basierenden Erkennung bekannt. Eine derartige Analyse darf nicht mit den auf ganzen Worten basierenden Analysiertechniken verwechselt werden, die nachfolgend beschrieben werden.The through the Metastrich recognition facility 36 generated metastrich code string (hereinafter referred to as metastrich string) becomes a word recognition subsystem according to the invention 38 fed to recognize the words in a special language, e.g. English. The processing of one of these elements is explained in detail below. The elements of the word recognition subsystem 38 comprise an "entire word" based analyzer device 44 to carry out a Ma ximal score analysis in dynamic programming procedures, as explained below, to obtain an optimal match between a string of input metastrokes and a known whole-word "vocabulary" meta-string. The subsystem 38 can optionally be an analyzer device based on "letters" 42 for analyzing meta-strokes by letters (alphanumeric characters). Some of these letter-based analyzer types 42 are known in connection with a recognition based on letters or split strings. Such an analysis should not be confused with the whole-word analysis techniques described below.

Die auf Buchstaben basierende Analysatoreinrichtung 42 kann in Kombination oder Ergänzung mit der auf ganzen Wörtern beruhenden Analysatoreinrichtung 44 arbeiten. Die Worterkennungseinrichtung 38 kann z.B. ein gespeichertes Wörterverzeichnis von ganzen Wörtern umfassen, die Metastriche in direkter und in umgekehrter Reihenfolge aufweisen.The letter-based analyzer device 42 can be combined or complemented with the whole-word analyzer facility 44 work. The word recognition device 38 can, for example, include a stored dictionary of whole words that have metastrokes in direct and reverse order.

Die auf Buchstaben beruhende Analysatoreinrichtung 42 kann in Prozeduren, die unabhängig und parallel zu der auf ganzen Wörtern beruhenden Analysatoreinrichtung arbeiten, einige von denselben Wörterbucheinträgen wie die auf ganzen Wörtern beruhende Analysatoreinrichtung 44 heranziehen, um zu versuchen, die Zeichen als eine Zeichenfolge von Buchstaben zu erkennen, die sinnvolle Wörter bilden.The analyzer device based on letters 42 can, in procedures that operate independently and in parallel to the whole-word analyzer, some of the same dictionary entries as the whole-word analyzer 44 to try to recognize the characters as a string of letters that make up meaningful words.

Die Ausgabe der Worterkennungseinrichtung 38, die eine Form haben kann, die der besten Auswahl aus verschiedenen Auswertungsprozeduren entspricht, wird an ein Wortausgabegerät 26 geliefert, wie zuvor erwähnt wurde.The output of the predictive text device 38 which can have a shape that corresponds to the best selection from various evaluation procedures is sent to a word output device 26 delivered as previously mentioned.

4 zeigt ein Flußdiagramm von erfindungsgemäßen Programmabläufen zwischen der Eingabe und Ausgabe der Metastrich-Erkennungseinrichtung 36. Nach der Erfindung wird die Eingabesequenz als eine Zeichenfolge von X- und Y-Koordinatenwerten für Punkte zusammen mit einem Start- und Stoppanzeiger (Schritt A) gebildet, dann wird aus der von dem Eingabegerät (Schritt B) erhaltenen Eingabezeichenfolge eine abgegrenzte Zeichenfolge als ein ganzes Prüfwort ausgewählt; danach wird die Richtung der Schrift festgelegt und das Prüfwort wird "rotiert" (orientiert in seinem Referenzrahmen), um die Schrift parallel zu einer horizontalen Referenz auszurichten (Schritt C). Dann wird das Prüfwort als ein rekonstruiertes Wort rekonstruiert, um die falschen Punkte zu entfernen und fehlende Punkte hinzuzufügen (Schritt D). Daraufhin werden eine untere Basislinie und eine obere Basislinie festgelegt (Schritt E), und das Prüfwort wird normalisiert (Schritt F). 4 shows a flow diagram of program sequences according to the invention between the input and output of the metastrich detection device 36 , According to the invention, the input sequence is formed as a string of X and Y coordinate values for points together with a start and stop indicator (step A), then a delimited string as a whole is made from the input string obtained from the input device (step B) Test word selected; the direction of the font is then determined and the test word is "rotated" (oriented in its reference frame) in order to align the font parallel to a horizontal reference (step C). Then the check word is reconstructed as a reconstructed word to remove the wrong points and add missing points (step D). A lower baseline and an upper baseline are then determined (step E) and the check word is normalized (step F).

Danach werden die kritischen Punkte in der Sequenz von Punkten lokalisiert (Schritt G). Sowohl die kritischen Punkte, z.B. Maxima, Minima und Schnittpunkte, als auch die Reihenfolge der kritischen Punkte sind für die Identifikation der Metastriche und der Reihenfolge der Metastriche nützlich. Die kritischen Punkte werden dann zulässigen Vokabular-Metastrichen gegenübergestellt, um die Zeichenfolge der Eingabe-Metastriche zu identifizieren, die zum "Schreiben" eines Prüfwortes herangezogen werden (Schritt H). Schritt H wird für jeden kritischen Punkt des Eingabewortes so lange wiederholt, bis alle kritischen Punkte den Metastrichen gegenübergestellt wurden (Schritt I). Das Ergebnis ist eine Zeichenfolge von Eingabe-Metastrichen, die zum "Schreiben" des Prüfwortes benutzt wird. Die Metastrich-Zeichenfolge wird dann für die weitere Verarbeitung tabelliert (Schritt J).After that, the critical points localized in the sequence of points (step G). Both the critical Points, e.g. Maxima, minima and intersections, as well as the order of critical points are for the identification of the meta lines and the order of the meta lines useful. The critical points then become allowable vocabulary metastrokes faced, to identify the string of input meta dashes that for "writing" a test word can be used (step H). Step H is for everyone critical point of the input word is repeated until all critical points were compared to the metastrokes (step I). The result is a string of input metastrokes that to "write" the test word is used. The metastrich string is then for the further processing is tabulated (step J).

5 zeigt ein Flußdiagramm für einen Teil des erfindungsgemäßen auf ganzen Wörtern beruhenden Analysatorsystems 44. In diesem Verfahren werden Wörter in dem Wörterbuch ausgeschlossen, so daß sie nicht weiter analysiert werden brauchen. Die Tests erfolgen in dem Prozeß zunächst unter Verwendung des direkten Vokabulars (die Vorwärtsrichtung) und dann unter Verwendung des entgegengesetzten Vokabulars (in der Rückwärtsrichtung). 5 shows a flow diagram for a portion of the whole-word analyzer system of the present invention 44 , In this process, words are excluded from the dictionary so that they do not need to be analyzed further. The tests are done in the process first using the direct vocabulary (the forward direction) and then using the opposite vocabulary (in the backward direction).

Zuerst wird ein "leeres" Wort erzeugt (Schritt K) und in einen Puffer (Schritt L) abgelegt. Ein "leeres" Wort ist ein "Null"-Satz, d.h. ein Wort, das alle Merkmale von Wörtern hat, aber keine Bedeutung hat. Es ist ein Platzhalter, so wie Null ein Platzhalter in einem initialisierten Speicherregister ist.First an "empty" word is created (step K) and into one Buffer (step L) filed. An "empty" word is a "zero" sentence, i.e. a word that has all the characteristics of words but no meaning Has. It is a placeholder, like zero a placeholder in one initialized memory register.

Der Inhalt des Wortpuffers wird dann getestet, um zu sehen, ob der Wortpuffer leer ist (Schritt M). Falls der Wortpuffer nicht leer ist, wird der nächste Eintrag (die das Prüfwort darstellende Zeichenfolge) aus dem Wortpuffer für die Auswertung gegenüber dem Wörterbuch herausgefunden (Schritt N). Dies findet immer dann statt, wenn eine Eingabezeichenfolge von dem Eingabegerät in dem Wortpuffer abgelegt ist. Unter Verwendung des Wörterverzeichnisses von ganzen Wörtern als Quelle, wird dann eine Liste von allen ("n") möglichen Wörtern kompiliert, die Prüfwörter sind, welche mit dem letzten aus dem Wortpuffer herausgefundenen Eintrag übereinstimmen (Schritt O). Die kompilierte Liste wird dann getestet, um sicher zu sein, daß diese nicht leer ist (Schritt P). (Die Liste kann am Anfang leer sein, wenn der oben erwähnte Test der kritischen Punkte durchgeführt worden ist und keine Übereinstimmungen gefunden wurden. Die Liste kann auch am Ende der auf ganzen Wörtern beruhenden Analyse leer sein, wenn die Liste verbraucht worden ist.) Nach dem Testen zur Bestimmung, daß diese Liste nicht leer ist, wird das "nächste" Vokabularwort in der Liste herausgefunden, um in der Analyse gegenüber dem herausgefundenen Eintrag, d.h. gegenüber dem aus dem Wortpuffer herausgefundenen Eingabeprüfwort, verwendet zu werden (Schritt Q). Das wiederaufgefundene Vokabularwort wird als ganzes Wort mit dem herausgefundenen Eingabeeintrag nach der Erfindung durch die nachfolgend erläuterten dynamischen Programmierungstechniken verglichen, aus denen ein "optimaler Kostenwert" oder eine Maximalbewertung abgeleitet wird, um den Grad der Übereinstimmung zwischen dem Eingabeprüfwort und dem Vokabelwort zu bestimmen (Schritt R). Die Schritte P bis R werden wiederholt, bis die Liste, erschöpft ist (Schritt P) oder bis die Maximalbewertung gewissen Akzeptabilitätskriterien genügt (Schritt S). Falls die Liste geleert ist, wird ein Signal "keine Übereinstimmung" ("no match" signal) erzeugt und der Prozeß wird fortgesetzt, indem nach dem nächsten Wort in dem Eingabewortpuffer Ausschau gehalten wird. Falls die Akzeptanzkriterien erfüllt sind, was auch immer für Akzeptanzkriterien dann anwendbar sind, wird das Wort an den Wortausgabepuffer (Schritt T) zur weiteren Verendung, z.B. zur Anzeige oder zur Verarbeitung abgegeben. Der Prozeß geht dann zu der nächsten Eingabe-Metastrichsequenz in dem Eingabepuffer über (Schritte K und L).The content of the word buffer is then tested to see if the word buffer is empty (step M). If the word buffer is not empty, the next entry (the character string representing the check word) is found from the word buffer for evaluation in relation to the dictionary (step N). This always takes place when an input string from the input device is stored in the word buffer. Using the dictionary of whole words as the source, a list of all ("n") possible words which are check words which match the last entry found from the word buffer is then compiled (step O). The compiled list is then tested to be sure that it is not empty (step P). (The list may be empty at the beginning when the above-mentioned critical point test has been performed and no matches have been found. The list may also be empty at the end of the whole-word analysis when the list has been used up.) After After testing to determine that this list is not empty, the "next" vocabulary word in the list is found to be used in the analysis against the found entry, ie against the input check word found from the word buffer (step Q). The retrieved vocabulary word is compared as a whole word with the input entry found according to the invention by the dynamic programming techniques explained below, from which an "optimal cost value" or a maximum evaluation is derived to determine the degree of correspondence between the input check word and the vocabulary word (step R). Steps P to R are repeated until the list is exhausted (step P) or until the maximum rating meets certain acceptability criteria (step S). If the list is cleared, a "no match" signal is generated and the process continues by looking for the next word in the input word buffer. If the acceptance criteria are met, whatever the acceptance criteria are then applicable, the word is sent to the word output buffer (step T) for further use, for example for display or processing. The process then proceeds to the next input metastroke sequence in the input buffer (steps K and L).

Der Schritt der Berechnung der optimalen Anpassung umfaßt zwei Eingaben: Die Eingabesequenz von Metastrichen, die eine Zeichenfolge für ein Wort bilden und das Muster oder die Zeichenfolge von ein bekanntes Wort darstellenden "Vokabular"-Metastrichen aus dem Wörterbuch. Jede Vokabularsequenz von Metastrichen beschreibt einen der zugelassenen Wege zur Wiedergabe eines Wortes. Die Daten zum Analysieren der optimalen Anpassung werden dann aus einer Merkmalkorrelationstabelle und einer Größenkorrelationstabelle extrahiert, wie nachfolgend beschrieben wird.The step of calculating the optimal Accommodation includes two inputs: the input sequence of meta dashes, which is a string for a Form word and the pattern or string from a known one Word representing "vocabulary" meta dashes from the dictionary. Each meta-stroke vocabulary sequence describes one of the permitted ones Ways to play a word. The data to analyze the optimal adjustment are then from a feature correlation table and a size correlation table extracted as described below.

Nur zur Veranschaulichung folgt ein vereinfachtes Beispiel der Erkennungsprozedur für ganze Wörter. Falls das Wort "run" mit der Hand auf ein Digitalisierungstableau geschrieben wird, besteht der erste Schritt darin, eine Eingabe-Metastrichzeichenfolge zu konstruieren oder eine Sequenz von ausgewählten strichähnlichen Ziffern, die auf zugelassenen Strichformen basieren, welche durch die Analyse der kursiven Handschrift erhalten werden. Die Eingabe-Metastrichzeichenfolge ist eher eine Serie von Metastrichen als von Punkten oder Buchstaben. Das Vokabular der Metastriche für diese Zeichenfolge ist auf eine festgelegte Anzahl von Wahlmöglichkeiten begrenzt, z.B. auf 20, 30, 40 oder 50 verschiedene Strichformen. Die obige 3 ist ein Beispiel einer funktionalen Ausführungsform. Die Eingabenzeichenfolge kann in einem Computer zusammenhängend durch eine Zeichenfolge von Symbolen dargestellt werden, z.B. die Zeichenfolge von Zufallssymbolen oder deren ASCII-Äquivalente:

Die Sequenz, die die Eingabe-Metastrichzeichenfolge bildet, wird dann in ihrer symbolischen Form in einem Wortpuffer abgelegt und entsprechend der auf ganzen Wörtern basierenden Auswertungsprozedur der Erfindung als ein ganzes Wortsegment mit allen relevanten Einträgen in einem "Wörterverzeichnis" von ganzen Wörtern verglichen, die als Metastriche geschrieben sind, wobei als Vokabular dieselben symbolischen Formen benutzt werden, welche die Eingabe-Metastrichzeichenfolge bilden. Ein Beispielwörterverzeichnis kann beispielsweise die folgenden Einträge umfassen:

For illustrative purposes only, there follows a simplified example of the recognition procedure for whole words. If the word "run" is handwritten on a digitizing tablet, the first step is to construct an input metastroke string or a sequence of selected stroke-like digits based on approved stroke shapes obtained by analyzing the italic handwriting , The input meta-string is a series of meta-strokes rather than periods or letters. The vocabulary of the meta lines for this string is limited to a fixed number of options, for example 20, 30, 40 or 50 different line shapes. The above 3 is an example of a functional embodiment. The input string can be represented in a computer by a string of symbols, for example the string of random symbols or their ASCII equivalents:

The sequence forming the input metastroke string is then stored in its symbolic form in a word buffer and, according to the whole-word evaluation procedure of the invention, is compared as a whole word segment with all relevant entries in a "dictionary" of whole words that are as Meta dashes are written using the same symbolic forms as the vocabulary that form the input meta-string. An example dictionary can include the following entries:

(Dies ist ein sehr einfaches Wörterbuch mit zwei Wörtern und sieben Zeichenfolgen.) Während der Vergleich dadurch erfolgen kann, daß die Eingabe-Metastrichzeichenfolge und jedes in Metastrichen buchstabierte Wort in dem Wörterverzeichnis auf Übereinstimmung hin geprüft werden, Metastrich für Metastrich, daß mit einer Bewertung oder einem Wert jede Position festgehalten wird, an der eine Übereinstimmung zwischen den Eingabe-Metastrichen und den Vokabular-Metastrichen festgestellt wird und daß die Bewertungen für die Metastrichübereinstimmungen für jedes auf diese Weise getestete Eingabe-Metastrichsegment dann addiert werden, um für jeden Eintrag ein "Wort"-Maß (Metrik) (d.h. eine Übereinstimmungsbewertung) zu erhalten, ist dieser Prozeß nicht das, was entsprechend der bevorzugten Ausführungsform der Erfindung in der Wortanalysatoreinrichtung 44 durchgeführt wird. Dieses Übereinstimmungsschema wird nur zum Zwecke der Veranschaulichung beschrieben, um das Verständnis des nachfolgenden komplexeren Ausführungsbeispiels zu erleichtern.(This is a very simple dictionary with two words and seven strings.) While the comparison can be done by checking the input meta-string and each word spelled out in meta-strokes in the dictionary for match, meta-meta for meta-that with a rating or a value of each position where there is a match between the input meta and vocabulary meta and the meta match scores for each input meta segment tested in this way are then added to give a " To obtain word "metric (ie, a match score), this process is not what is according to the preferred embodiment of the invention in the word analyzer device 44 is carried out. This matching scheme is described for the purpose of illustration only to facilitate understanding of the more complex embodiment below.

In der obigen Tabelle ergeben sich aus dem vereinfachten Vergleichsverfahren die folgenden Ergebnisse unter der Annahme, daß die Maximalbewertungsberechnung eine einfache Summation der Gewichtungen erlaubt und eine Maximalbewertung für eine einzelne Metastrich-Übereinstimmung 6 gleich ist:

In the table above, the following comparison results from the simplified comparison procedure, assuming that the maximum evaluation calculation is a simple summation of the weights allowed and a maximum rating for a single metastrich match 6 is equal to:

Der Bindestrich "–" tritt an der Stelle auf, an der eine Übereinstimmung mit dem Metastrich nicht vorliegt. Die als Metastriche buchstabierten Wörter sind normalerweise durch eine englischsprachige Definition zusammengefaßt, so daß der "Treffer" als ein englischsprachiges Wort mit einer Bewertung dargestellt (gelistet) wird, welche die höchste Bewertung von allen als Metastriche geschriebenen Wörtern in dieser Gruppe ist. Dies wird durch den Asterix "*" am linken Rand, siehe oben, angezeigt.The hyphen "-" occurs in the place on at which a match not available with the metastrich. Those spelled out as metastrokes words are usually summarized by an English language definition, so that the "hit" as an English language Word is shown (listed) with a rating, which the highest Rating of all words written as metastrokes in of this group. This is indicated by the asterix "*" on left margin, see above.

Die englischsprachigen Wörter, die Treffer sind, werden durch ihr höchstes Wortmaß klassifiziert, wobei dieses Maß zuerst normalisiert wird. Es ergibt sich:

The English-language words that are hits are classified by their highest word size, which is normalized first. The result is:

Die normalisierten Wortmaße können in diesem vereinfachten Beispiel dann sowohl mit einem vorbestimmten Grenzwert verglichen werden, um die Akzeptabilität zu bestimmen, als auch untereinander im Hinblick auf ihre Übereinstimmung verglichen werden, um die "Verwirrung" zu bestimmen. Wenn festgestellt wird, daß das Wort akzeptabel ist, wird das Wort dann an einen Wortausgabepuffer ausgegeben. Wenn das Wortmaß den Grenzwert nicht überschreitet, wird das Eingabe-Metastrichsegment durch Substituieren, Addieren und Löschen der Metastriche aus der Liste der englischsprachigen Prüfwörter verändert.The normalized word measures can be in this simplified example then both with a predetermined Limit values are compared to determine acceptability, as well as among themselves in terms of their agreement be compared to determine the "confusion". If it is found that the Word is acceptable, the word is then sent to a word output buffer output. If the word measure the Limit does not exceed the input metastroke segment is substituted, added, and Clear changed the meta lines from the list of English-language test words.

Wenn in dem obigen Beispiel ein normalisiertes Maß von 0,77 den Grenzwert nicht überschritten hat, werden verschiedene Metastriche in der Eingabe-Metastrichzeichenfolge addiert, gelöscht oder substituiert, um zu versuchen, eine bessere Übereinstimmung mit einer bekannten Zeichenfolge in dem Wörterverzeichnis zu erhalten und es wird ein weiterer Vergleich mit dem Wort aus dem Wörterverzeichnis gemacht. Additionen und Löschungen werden durch negative Gewichtungen gekennzeichnet, während Substitutionen durch positive Gewichtungen in Abhängigkeit von der "Richtung" und Position der Substitutionen gekennzeichnet werden. Wenn der letzte Metastrich des Eingabesegmentes gelöscht wird, nimmt das normalisierte Maß der ersten "Definition" von "run" von 0,77 auf 0,83 zu, wobei es möglicherweise einen vorbestimmten Grenzwert trifft.If in the example above a normalized Measure of 0.77 does not exceed the limit has different meta-strokes in the input meta-string added, deleted or substituted to try to get a better match with a known string in the dictionary and it becomes another comparison with the word from the dictionary made. Additions and deletions are characterized by negative weights during substitutions through positive weightings depending on the "direction" and position of the Substitutions are marked. If the last metastrich of the input segment deleted the normalized measure of the first "definition" of "run" increases from 0.77 to 0.83 to where it may be meets a predetermined limit.

Die 6 bis 12 zeigen ein zweites genaueres Beispiel eines Erkennungsverfahrens für ganze. Wörter nach der Erfindung, welches genauer veranschaulicht, wie der erfindungsgemäße dynamische Programmierungsprozeß ausgeführt wird, um ein ganzes Wort erkennen zu können. 6A zeigt das handgeschriebene Wort "may". In einer Ausführungsform der Erfindung kann dieses Wort als eine Zeichenfolge der in 8B gezeigten Metastriche ausgedrückt werden. Die Zahlen in der Nähe von besonderen Merkmalen des Wortes zeigen die entsprechenden Metastriche an (vgl. die horizontale Achse von 6B).The 6 to 12 show a second more accurate example of a detection method for whole. Words according to the invention, which illustrates in more detail how the dynamic programming process according to the invention is carried out in order to be able to recognize an entire word. 6A shows the handwritten word "may". In one embodiment of the invention, this word can be understood as a string of characters in the 8B metastrokes shown are expressed. The numbers near special features of the word indicate the corresponding meta dashes (see the horizontal axis of 6B ).

Wie oben angegeben ist, kann das Wörterverzeichnis infolge der Unterschiede in den möglichen Handschriftarten zahlreiche Metastrich-"Schreibweisen" für ein einzelnes Wort haben. In diesem Beispiel wird angenommen, daß es nur eine Schreibweise von "may" in dem Wörterverzeichnis gibt, wie in 7 gezeigt ist. Ein Vergleich der Metastrichsequenz von 6B mit der von 7 zeigt, daß die Übereinstimmung nicht exakt ist. (Beachte den Buchstaben "a".) Dies ist im allgemeinen infolge der verschiedenen Variationen in den Handschriftarten der Fall.As noted above, the dictionary may have numerous meta-dash "spellings" for a single word due to the differences in possible handwriting. In this example it is assumed that there is only one spelling of "may" in the dictionary, as in 7 is shown. A comparison of the metastroke sequence from 6B with that of 7 shows that the match is not exact. (Note the letter "a".) This is generally due to the different variations in the handwriting.

Um festzustellen, ob die Wörterbuchschreibweise von "may" als mit der Eingabesequenz übereinstimmend angesehen wird, wird eine Wortkorrelationstabelle geschaffen, die als Ganzes die Eingabe-Metastrichzeichenfolge mit jeder Vokabular-Metastrichzeichenfolge vergleicht, welche für eine Übereinstimmung in Frage kommt. Als eine Folge des erfindungsgemäßen Verfahrens, und ein Wortmaß (d.h. ein durch die Wahrscheinlichkeit einer existierenden Übereinstimmung definierter Wert) und ein optimaler "Pfad" durch die Sequenz der Metastrich-Ergebnisse, aber nur nachdem die Verarbeitung der ganzen Metastrichzeichenfolge beendet ist. Je größer das Wortmaß ist, desto größer ist die Übereinstimmung.To determine whether the dictionary spelling of "may" is considered to match the input sequence, a word correlation table is created that, as a whole, compares the input meta-string to any vocabulary meta-string that is matched. As a consequence of the method according to the invention, and a word measure (ie a value defined by the probability of an existing match) and an optimal "path" through the sequence of the metastrich results, but only after the processing of the entire metastrich string has ended. ever the larger the word size, the greater the match.

10 zeigt ein Beispiel einer sich aus dem Wort "may" ergebenden Wortkorrelationstabelle, worin die Eingabe-Metastrichzeichenfolge von 6B der Vokabular-Metastrichzeichenfolge von 7 gegenübergestellt wird. Die Werte in jeder Zelle werden aus der Berechnung eines Additionswertes abgeleitet, der auf den Übergängen zwischen einer vorausgehenden diagonalen Position, einer vorausgehenden Zeilenposition und einer vorausgehenden Spaltenposition beruht, wobei aus diesen drei ausgewählten Werten der Übergang mit dem höchsten Wert ausgewählt wird und dann der Zelle die Summe von dem Gewicht des Übergangs und der Wert der vorausgehenden Zelle zugeordnet wird. Dies ist ein Prozeß von dynamischem Programmieren. Die Quelle der Gewichtungen wird unter Bezugnahme auf eine Merkmalkorrelationstabelle und eine Größenkorrelationstabelle erhalten, deren Werte auf der Größe und der Art des Metastrichvokabulars und einer Analyse der zulässigen und nichtzulässigen Substitutionen, Einfügungen und Löschungen zwischen allen Metastrichen in dem Wörterverzeichnis beruhen. 10 shows an example of a word correlation table resulting from the word "may", where the input meta-string of 6B the vocabulary meta-string of 7 is compared. The values in each cell are derived from the calculation of an addition value based on the transitions between a previous diagonal position, a previous row position and a preceding column position, the transition with the highest value being selected from these three selected values and then the cell the sum of the weight of the transition and the value of the preceding cell is assigned. This is a process of dynamic programming. The source of the weights is obtained with reference to a feature correlation table and a size correlation table, the values of which are based on the size and nature of the meta-stroke vocabulary and an analysis of the allowable and non-allowable substitutions, insertions and deletions between all meta-strokes in the dictionary.

9 zeigt beispielsweise eine Merkmalkorrelationstabelle, welche die Wahrscheinlichkeit einer Übereinstimmung anzeigt, die zwischen einzelnen Metastrichen in einem Wörterverzeichnis von nur acht Metastrichen auftritt. Jeder Spalteneintrag stellt einen in der Eingabezeichenfolge gefundenen Metastrich dar. Jeder Zeileneintrag stellt einen Metastrich dar, der in dem Wörterverzeichnis gefunden wurde, das sich aus diesem (begrenzten) Metastrichvokabular zusammensetzt. Der höchste Wert oder das höchste Maß wird einer Substitution eines identischen Eingabe-Metastrichs durch einen Metastrich aus dem Wörterverzeichnis zugeordnet, d.h. entlang der Diagonalen. Niedrige Maße werden Substitutionen von Eingabe-Metastrichen durch Metastriche aus dem Wörterverzeichnis zugeordnet, die sich in der Form nahe kommen. In der Tabelle werden unzulässige Substitutionen durch Leerzeichen dargestellt und ein großer negativer Wert wird diesen Positionen in der Tabelle zugeordnet: (–1000), so daß die auf diesen Substitutionen beruhenden Berechnungen immer zu einem Ergebnis führen, das außerhalb des Betrachtungsbereichs für eine völlige Übereinstimmung liegt. 9 For example, Figure 11 shows a feature correlation table that indicates the likelihood of a match that occurs between individual meta-strokes in a dictionary of only eight meta-strokes. Each column entry represents a meta-stroke found in the input string. Each row entry represents a meta-stroke which was found in the dictionary which is composed of this (limited) meta-stroke vocabulary. The highest value or the highest measure is assigned to a substitution of an identical input metastrich by a metastrich from the dictionary, ie along the diagonal. Low levels are associated with substitutions of input meta-strokes with meta-strokes from the dictionary that approximate in form. In the table, illegal substitutions are represented by spaces and a large negative value is assigned to these positions in the table: (–1000), so that the calculations based on these substitutions always lead to a result that is outside the scope for complete agreement ,

Eingabe-Metastrich-Additionen und Löschungen sind gemäß der Erfindung zulässig, obwohl mit jeder eine Erschwerung verbunden ist. 10A zeigt Beispielerschwerungen für die Addition von ausgewählten Metastrichen, während 10B Beispielerschwerungen für das Löschen der ausgewählten Metastriche zeigt. Abgesehen von der Beobachtung der Korrelation zwischen Metastrichen (positive Werte) und mit addierten und gelöschten Metastrichen verbundenen Erschwerungen (negative Werte oder Erschwerungswerte), wird auch ein Größenvergleich (in Bezug auf die Basislinie des Wortes) ausgeführt. 11 zeigt eine Größenkorrelationstabelle, während die 12A–B Größenerschwerungen anzeigen, die den Tabellen von den 10A-B zugeordnet sind und sich auf Additionen bzw. Löschungen beziehen.Input metastrich additions and deletions are permitted according to the invention, although each is associated with an aggravation. 10A shows sample complications for the addition of selected meta lines while 10B Example complications for deleting the selected meta lines shows. In addition to observing the correlation between meta lines (positive values) and aggravations associated with added and deleted meta lines (negative values or aggravation values), a size comparison (in relation to the baseline of the word) is also carried out. 11 shows a size correlation table while the 12A-B Show size increases that the tables of the 10A-B are assigned and refer to additions or deletions.

Die Wortkorrelationstabelle von 8 für jedes Wort aus dem Wörterverzeichnis kann von den Daten von Tabellen der 9, 10A, 10B, 11, 12A und 12B abgeleitet werden, was ein vereinfachtes Beispiel ist, oder aus Daten von den 13 oder 14, was dem tatsächlichen Arbeitssystem entspricht. (In den 13 und 14 sind die jeweils den 10A und 12A entsprechenden Additionsvektoren in den Kopfzeilen der Tabelle gezeigt und die jeweils den 10B und 12B entsprechenden Löschvektoren sind in der linken Spalte der Tabellen gezeigt.) Die Wortkorrelationstabelle von 8 wird auf der Grundlage einer dynamischen Programmierungstechnik zum Berechnen von "optimalen Kosten" berechnet, wie dies in der Technik bezeichnet wird, und auf der Grundlage "eines Pfades" für die Transformation einer Sequenz in eine andere. Bei der Erfindung wird die Transformation oder Abbildung auf der Grundlage einer ganzen Eingabesequenz gemacht, um diese in Länge und Form irgendeiner Zeichenfolge einer Anzahl von bekannten Metastrichzeichenfolgen aus dem Wörterverzeichnis zu bringen. Daher ist es notwendig, die Transformation auf der ganzen Sequenz auszuführen, bevor aus den Ergebnissen Schlußfolgerungen gezogen werden können.The word correlation table of 8th For each word from the dictionary, the data from tables of 9 . 10A . 10B . 11 . 12A and 12B derived, which is a simplified example, or from data from the 13 or 14 which corresponds to the actual work system. (In the 13 and 14 are each the 10A and 12A corresponding addition vectors shown in the headers of the table and each of the 10B and 12B corresponding delete vectors are shown in the left column of the tables.) The word correlation table of 8th is calculated based on a dynamic programming technique for computing "optimal costs" as referred to in the art and based on "one path" for transforming one sequence into another. In the invention, the transformation or mapping is done based on an entire input sequence to bring it out of the dictionary in length and shape of any string of a number of known meta-strings. It is therefore necessary to carry out the transformation on the entire sequence before conclusions can be drawn from the results.

13 zeigt eine Datentabelle zur Veranschaulichung der Transformationen von Eingabe-Metastrichen in Vokabular-Metastriche. Am linken Rand sind die Vokabular-Metastriche aufgelistet, d.h. die in dem Wörterverzeichnis gefundenen Metastriche. Der obere Rand kann mit denselben Metastrichen in derselben Reihenfolge gekennzeichnet werden. Die Diagonale von der Tabelle ist ein Wert, der einer direkten Transformation eines Eingabe-Metastrichs in den identischen Metastrich in dem Wörterverzeichnis zugeordnet wird. Nicht auf der Diagonale liegende Werte stellen Werte dar, die für die Substitution von einem Eingabe-Metastrich durch andere Vokabular-Metastriche in einem Prozeß zugeordnet sind, in dem eine Metastrich-Zeichenfolge aufgebaut wird, die mit einer in dem Wörterverzeichnis gefundenen Metastrich-Zeichenfolge übereinstimmt. 14 zeigt eine Größenkonelationstabelle für neun Größenpegel. Erschwerungen werden für Löschungen bzw. Additionen zugeordnet, wie entlang der Null-Reihe bzw. der Null-Spalte von 13 veranschaulicht wird und in dem Beispiel gemäß 10A (diese entspricht Spalte Null von 13) und 10B (diese entspricht Reihe Null von 13) separat gezeigt wird. In einer Löschung wird ein Metastrich aus der Eingabe-Zeichenfolge gelöscht. Eine Löschung wird durch einen negativen Wert einer ausgewählten Größe (Reihe Null, irgendeine Spalte) angezeigt. Mit der Addition wird entsprechend ein Metastrich an einer Position in der Eingabe-Metastrichzeichenfolge hinzugefügt und die Aktion wird durch einen negativen Wert einer ausgewählten Größe (Spalte Null, irgendeine Zeile) angezeigt. Auf eine "Substitution" (wo ein Eingabe-Metastrich durch einen Vokabular-Metastrich substituiert wird) wird durch einen positiven Wert hingewiesen, wie durch die Position in der Matrix angegeben wird. Der spezielle Fall einer "Substitution" eines Metastrichs durch sich selbst ist die Diagonale und dieser ist deshalb der größte Wert zugeordnet. Es ist absolut nicht erforderlich, daß die Merkmalkorrelationstabelle symmetrisch ist, da die Substitution kein symmetrischer Prozeß ist. 13 shows a data table illustrating the transformations of input meta-strokes into vocabulary meta-strokes. The vocabulary meta strokes are listed on the left margin, ie the meta strokes found in the dictionary. The top margin can be marked with the same meta lines in the same order. The diagonal from the table is a value associated with a direct transformation of an input metastrich into the identical metastrich in the dictionary. Values that are not on the diagonal represent values that are assigned for the substitution of an input meta-stroke by other vocabulary meta-strokes in a process in which a meta-stroke string is built up that matches a meta-stroke string found in the dictionary , 14 shows a size correlation table for nine size levels. Difficulties are assigned for deletions or additions, such as along the zero row or column of 13 is illustrated and in the example according to 10A (this corresponds to column zero of 13 ) and 10B (this corresponds to row zero of 13 ) is shown separately. In a deletion, a metastroke is deleted from the input string. Deletion is indicated by a negative value of a selected size (row zero, any column). With the addition, a metastroke is added accordingly at a position in the input metastroke string and the action is indicated by a negative value of a selected size (column zero, any row). On a "substitution" (where an input metastroke is substituted by a vocabulary meta-stroke) is indicated by a positive value, as indicated by the position in the matrix. The special case of a "substitution" of a metastroke by itself is the diagonal and this is therefore assigned the greatest value. It is absolutely not necessary that the feature correlation table be symmetrical, since the substitution is not a symmetrical process.

Die Technik zum Interpretieren der Eingabe-Metastrichzeichenfolge als ein Wort ist unkompliziert, aber erfordert eine umfangreiche Programmierung. In dem dynamischen Programmierungsversuch werden Vergleichs-, Gewichtungs- und Modifizierungsverfahren gleichzeitig ausgeführt. Der Prozeß entspricht dem "Schlängeln" eines "Wurms", um zu sehen, ob dieser auf die Gestalt von "Musterwürmern" ausgerichtet werden kann. Die Additionen, Löschungen und Substitutionen führen dazu, daß sich der Wurm schlängelt. Jede Aktion resultiert in einer Gewichtung oder einer Erschwerung.The technique for interpreting the Input meta-string as a word is straightforward, but requires extensive programming. In the dynamic programming attempt are comparison, weighting and modification methods at the same time executed. The process corresponds the "snake" of a "worm" to see if these are aligned to the shape of "model worms" can. The additions, deletions and lead substitutions to the fact that the worm meanders. Each action results in weighting or aggravation.

Die Schritte der dynamischen Programmierungstechnik umfassen einen Prozeß, in dem eine ganze Metastrich-Zeichenfolge mit allen relevanten Metastrich-Zeichenfolgen in einem Wörterbuch von Wörtern verglichen werden, die als Metastriche "geschrieben" werden, um einen Pfad für die Transformation der Eingabezeichenfolge in eine der Wörterbuch-Metastrichzeichenfolgen aufzubauen und in dem ein Maximalwert oder sogenannte "optimale Kosten" ("optimal cost") bestimmt werden, um die ganze Eingabe-Metastrichzeichenfolge gegenüber jeder Vokabular-Metastrichzeichenfolge zu verarbeiten. Theoretisch kann die gesamte Eingabe-Metastrichzeichenfolge gegenüber allen Zeichenfolgen in dem Wörterbuch verarbeitet werden. Es werden aber normalerweise gewisse beschleunigende Schritte ausgeführt, um den Prozeß zu beschleunigen. (Um den Prozeß zu beschleunigen, brauchen nicht alle Wörterbucheinträge geprüft zu werden, obgleich die Techniken, den Prozeß auf diese Weise zu begrenzen, nicht ein Teil dieses Aspekts der Erfindung sind. Diese Optimierungstechniken nutzen die Merkmale des Wörterbuchs aus. Das Wörterbuch kann z.B. durch eine Anzahl von Strichen ausgebildet sein, oder es kann durch Metastriche "alphabetisiert" sein. Die Auswertung kann auf einer vorwärts gerichteten Metastrichsequenz erfolgen, auf einer entgegengesetzt gerichteten Metastrichsequenz, auf den am besten passenden Wortanfängen und den am besten passenden Wortendungen.) Wie zuvor beschrieben worden ist, umfaßt das Wörterbuch eine "Definition", ein englischsprachiges Wort (oder ein Wort in einer anderen Sprache), das in romanischen Schriftzeichen, d.h. den romanischen Schriftzeichen entsprechenden ASCII-Zeichenfolgen geschrieben ist, was das einzige zu erkennende Wort ist. Folglich gibt es verschiedene Wörterbucheinträge mit derselben "Definition", um den Variationen in der Handschrift Rechnung zu tragen.The steps of dynamic programming technology involve a process in which a whole metastrich string with all relevant metastrich strings in a dictionary of words be compared, which are "written" as metastrokes to a path for the transformation the input string into one of the dictionary meta-strings to build up and in which a maximum value or so-called "optimal cost" ("optimal cost") are determined, around the whole input metastroke string to everyone Process vocabulary meta-string. Theoretically can the entire input meta-string against all strings in the dictionary are processed. But there are usually certain accelerating ones Steps performed to the process too accelerate. (To the process speed up, not all dictionary entries need to be checked, although the techniques to limit the process in this way are not part of this aspect of the invention. These optimization techniques take advantage of the features of the dictionary out. The dictionary can e.g. be formed by a number of lines, or it can be "alphabetized" by meta dashes. The evaluation can on a forward directed metastrich sequence are done on an opposite directed metastroke sequence, on the most appropriate word starts and the most suitable word endings.) As described above is included the dictionary a "definition", an English language Word (or a word in another language) that is in Romance Characters, i.e. corresponding to the Roman characters ASCII strings are written, which is the only thing to be recognized Word is. As a result, there are different dictionary entries with the same "definition" to accommodate the variations to take into account in the manuscript.

Die Metastrich-Merkmalkorrelationsmatrix (d.h. die Daten für die Transformation von allen Metastrichen in andere) wird als integraler Bestandteil, wie 13 zeigt, des dynamischen Programmierungsprozesses benutzt, nämlich in dem Pfadaufbau und in der optimalen Kostenkalkulation. Die Größenkorrelationsmatrix wird auch in denselben Prozeßschritten verwendet. Die optimale Kostenkalkulation ist eine Kalkulation der folgenden drei Formeln, der eine Auswahl eines Maximums folgt, das auf einem einfachen Vergleich beruht. Das Maximum von den drei Werten wird in die Zelle eingesetzt, die der Transformation von Eingabe-Metastrichen in Vokabular-Metastriche in der Wortkorrelationstabelle (z.B. 8) für jedes so verarbeitete Wort aus dem Wörterverzeichnis entspricht. 8 zeigt ein Beispiel, das sich aus dem dynamischen Programmierungsprozeß ergibt, der die Daten von den 9 bis 12 verwendet.The Metastrich feature correlation matrix (ie the data for transforming all metastrokes into others) is considered an integral part of how 13 shows, the dynamic programming process used, namely in the path structure and in the optimal cost calculation. The size correlation matrix is also used in the same process steps. The optimal cost calculation is a calculation of the following three formulas, followed by a selection of a maximum based on a simple comparison. The maximum of the three values is inserted into the cell that corresponds to the transformation of input meta-strokes into vocabulary meta-strokes in the word correlation table (e.g. 8th ) for each word processed in this way from the dictionary. 8th shows an example resulting from the dynamic programming process that takes the data from the 9 to 12 used.

Zur Veranschaulichung wird auf 8 Bezug genommen. Die Berechnung wird durchgeführt, indem der Maximalwert (a) für die Zelle in Position (a, b) in der Wortkorrelationstabelle aus αWerten ausgewählt wird, die für die Addition, Löschung und Substitution an diesen Zellenpositionen berechnet worden sind. Die Maxima werden in jedem Beispiel von 8 wie folgt bestimmt: Für die Substitutionen:

For illustration purposes, click on 8th Referred. The calculation is carried out by selecting the maximum value (a) for the cell in position (a, b) in the word correlation table from α values which have been calculated for the addition, deletion and substitution at these cell positions. The maxima are in each example of 8th determined as follows: For the substitutions:

Für die Einfügungen oder Additionen:

For the insertions or additions:

Für die Löschungen:

worin:
a1^j _i der "Kostenwert" (der in dem Vokabular des dynamischen Programmierens benutzt wird) oder die kumulative Bewertung in Element (i, j) für das Passieren vom Ursprung über Element (i – 1, j – 1) ist, indem der Eingabe-Metastrich "b" in der Spaltenposition (j) durch den Vokabular-Metastrich "a" in der Reihenposition (i) ersetzt wird (8);
p(a_i,b_j) ein (aus 13 oder 9 gewonnener) Ähnlichkeitsgewichtungswert der Substitution eines Eingabe-Metastrichs "a;" durch einen Vokabular-Metastrich "b_j" ist;
q(a_j,b_j) der (aus der Größenkorrelationstabelle gewonnene, 14 oder 12) Größengewichtungswert für die Größensubstitution ist, die in der vorausgehenden Substitution des Eingabe-Metastrichs "a_i" durch den Vokabular-Metastrich "b_j" erfolgt;
α2 der "Kostenwert" oder die kumulative Bewertung für das Passieren vom Ursprung über Element (i – 1, j) nach Element (i, j) ist, indem der Vokabular-Metastrich "a" in der Zeilenposition (i) nach dem Eingabe-Metastrich "b" in Spaltenposition (j) eingefügt wird;
α3 der "Kostenwert" für die kumulative Bewertung zum Passieren vom Ursprung über Element (i, j – 1) nach Element (i, j) ist, indem der Eingabe-Metastrich "b" in Spalte (j) entlang einer Sequenz von Metastrichen gelöscht wird;
p(a_i) ein Erschwerungswert (aus 13, Spalte 0, Zeile i; oder aus Position i von 10A) zum Einsetzen des Vokabel-Metastrichs "a" in Zeilenposition (i) nach dem Eingabe-Metastrich "b" in Spaltenposition (j) ist;
q(a_i) der Erschwerungswert für die der vorhergehenden Einfügung zugeordneten Größe ist (14 oder 12A);
p(b_j) ein Erschwerungswert (aus 13, Zeile 0, Spalte j; oder aus Position j von 10B) zum Löschen eines Metastrichs "b_j" ist;
q(b_j) ein Erschwerungswert für die der vorgehenden Löschung zugeordneten Größe ist (14 oder 12B).For the deletions:

wherein:
a1 ^j _{i is} the "cost value" (used in the dynamic programming vocabulary) or the cumulative rating in element (i, j) for passing from the origin over element (i - 1, j - 1) by input -Metal dash "b" in the column position (j) is replaced by the vocabulary meta dash "a" in the row position (i) ( 8th );
p (a _i , b _j ) on (off 13 or 9 ) similarity weighting value of the substitution of an input metastroke "a;" by a vocabulary metastroke "b _j ";
q (a _j , b _j ) the (obtained from the size correlation table 14 or 12 ) Size weight value for is the size substitution made in the previous substitution of the input meta "a _i " by the vocabulary meta "b _j ";
α2 is the "cost value" or the cumulative rating for passing from the origin via element (i - 1, j) to element (i, j), in that the vocabulary metastroke "a" in the line position (i) after the input - Meta dash "b" is inserted in column position (j);
α3 is the "cost value" for the cumulative rating to pass from the origin via element (i, j-1) to element (i, j) by deleting the input meta-dash "b" in column (j) along a sequence of meta-dashes becomes;
p (a _i ) an aggravation value (from 13 , Column 0, row i; or from position i of 10A ) to insert the vocabulary meta "a" in row position (i) after the input meta "b" in column position (j);
q (a _i ) is the aggravation value for the size associated with the previous insertion ( 14 or 12A );
p (b _j ) an aggravation value (from 13 , Row 0, column j; or from position j of 10B ) for deleting a metastroke is "b _j ";
q (b _j ) is an aggravation value for the size associated with the previous deletion ( 14 or 12B ).

Die bevorzugte Metastrich-Zeichenfolge in jeder Zelle (i, j) ist der maximale kumulative Bewertungswert Alpha (α) in Zelle (i, j), die aus dem ersten kumulativen Bewertungswert (α1), dem zweiten kumulativen Bewertungswert (α2) und dem dritten kumulativen Bewertungswert (α3) ausgewählt wird. Diese Maximalbewertung in jeder Zelle stellt die "optimalen Kosten" in dieser Zelle entlang irgendeinem Pfad von dem Ursprung in der Wortkorrelationstabelle von 8 dar.The preferred metastrich string in each cell (i, j) is the maximum cumulative score alpha (α) in cell (i, j), which is the first cumulative score (α1), the second cumulative score (α2) and the third cumulative evaluation value (α3) is selected. This maximum score in each cell represents the "optimal cost" in that cell along any path from the origin in the word correlation table of 8th represents.

Ein besonderes Beispiel kann hilfreich sein. Es sei auf das Element in Zeile i = 4, Spalte j = 4 in 8 hingewiesen. Dieses Element enthält den Maximalwert aus den berechneten Alphathermen α1, α2 oder α3 für diese Position.A particular example can be helpful. Let the element in row i = 4, column j = 4 in 8th pointed. This element contains the maximum value from the calculated alpha terms α1, α2 or α3 for this position.

Zum Berechnen von α1, wird Gleichung [1] herangezogen. Aus der Überprüfung der benachbarten diagonalen Zelle (10) ergibt sich für α^j–1 _i–1 ein Wert von 7. Die in 8 gezeigte Substitution für Zelle (4,4) ist von dem nach oben gerichteten Bogen (entlang der Kopfzeile) bis zu einem nach unten gerichteten Punkt (entlang der Seitenspalte). Aus 9, die Substitution von dem nach oben gerichteten Bogen zu einem nach unten gerichteten Pfeil, ist der Wert p(a_i, b_j) gleich –1000, der eine unzulässige Übertragung angibt. Die entsprechende Größensubstitution von der vierten Position von 6B bis zu der vierten Position von 7 ist von Größe 3 bis Größe 5. Eine Übertragung von Größe 3 nach Größe 5 hat einen Wert von 1000 gemäß 11. Die Summe von α^j–1 _i–1, p und q ist so gleich –1993.Equation [1] is used to calculate α1. From the examination of the neighboring diagonal cell ( 10 ) results in a value of 7 for α ^{j – 1} _{i – 1.} The in 8th shown substitution for cell ( 4 . 4 ) is from the upward arc (along the header) to a downward point (along the side column). Out 9 , the substitution from the upward bow to a downward arrow, the value p (a _i , b _j ) is equal to -1000, which indicates an illegal transfer. The corresponding size substitution from the fourth position of 6B up to the fourth position from 7 is of size 3 up to size 5 , A transfer of size 3 by size 5 has a value of 1000 according to 11 , The sum of α ^{j – 1} _{i – 1} , p and q is thus equal to –1993.

Zum Berechnen von 2 wird Gleichung [2] zum Einsetzen herangezogen. Aus der benachbarten Zeile oberhalb der Zelle (4,4) in 8 ergibt sich ein Wert α^j _i–1 von 11. Für das Einsetzen eines nach unten gerichteten Pfeils ist der Erschwerungswert p(a_i) von 10A gleich –2. Der entsprechende Größenerschwerungswert q(a_i) für den nach unten gerichteten Pfeil in Höhe 5 (7) ist nach 12A gleich 0. So ist die Summe α2 und ein Prüfwert für Zelle (4,4) gleich 9.To calculate 2, equation [2] is used for insertion. From the adjacent row above the cell ( 4 . 4 ) in 8th The result is a value α ^j _{i – 1} of 11. For the insertion of an arrow pointing downwards, the aggravation value p (a _i ) is of 10A equal to –2. The corresponding magnitude value q (a _i ) for the downward arrow in height 5 ( 7 ) is after 12A is equal to 0. So the sum is α2 and a test value for cell ( 4 . 4 ) equal to 9.

Zum Berechnen von a3, wird Gleichung [3] zum Einsetzen herangezogen. Aus der benachbarten links von Zelle (4,4) liegenden Spalte in 8 ergibt sich für α^j–1 _i ein Wert von 12. Für das Löschen von einem nach oben gerichteten Bogen ist der Erschwerungswert p(b_j) von 10B gleich –2. Der entsprechende Größenerschwerungswert q(a_i) für einen nach oben gerichteten Bogen in Höhe 3 ( 7) ist nach 12B gleich 0. So ist die Summe α3 und der Prüfwert für Zelle (4,4) gleich 10. Aus einem einfachen Vergleich von α1, α2 und α3 ergibt sich ein Maximalwert von 10. Der Wert von 10 wird so in Zelle (4,4) eingesetzt.To calculate a3, equation [3] is used for insertion. From the neighboring left of cell ( 4 . 4 ) lying column in 8th For α ^{j – 1} _{i there is} a value of 12. For the deletion of an upward arc, the aggravation value p (b _j ) is of 10B equal to –2. The corresponding size aggravation value q (a _i ) for an upward curve in height 3 ( 7 ) is after 12B is equal to 0. So the sum is α3 and the test value for cell ( 4 . 4 ) equal to 10. A simple comparison of α1, α2 and α3 results in a maximum value of 10. The value of 10 is thus in cell ( 4 . 4 ) used.

Dieses Verfahren wird für jede Zelle der Wortkorrelationstabelle durchgeführt. Für jede Zelle wird das Maximum α von der Substitution, Addition und Löschung benutzt. Wenn die Wortkorrelationstabelle berechnet wird, wird der Pfad zu jeder Zelle von der benachbarten Zelle, was die Maximalbewertung ergibt, tabelliert. Am Ende des Verfahrens können die Pfade von jeder Zelle (z.B. von der rechten Grenze oder unteren Grenze) zu dem Ursprung (0,0) zurückgeführt werden. Jeder von diesen Pfaden stellt den optimalen Pfad zwischen dem Ursprung und der ausgewählten Zelle dar. Nach der Erfindung stellt die Zellenposition ganz rechts und ganz unten vom Ursprung den "optimalen Kostenwert" für den optimalen Pfad durch die Wortkorrelationsmatrix für die spezifische mit ihrer Endmarke getesteten und bestimmten Eingabe-Zeichenfolge dar. Die spezifische Eingabe-Metastrichzeichenfolge wird jeder Vokabular-Metastrichzeichenfolge aus dem (sich aus dem Vokabular der zulässigen Metastrichzeichenfolgen zusammensetzenden) Wörterbuch gegenübergestellt, um zahlreiche Wortkorrelationstabellen zu schaffen. Der optimale Kostenwert für die Eingabe-Metastrichzeichenfolge (deren Wert sich aus der Zelle in der letzten Spalte und letzten Zeile ergibt und die dem Ende der Eingabe-Metastrichzeichenfolge und der Vokabular-Metastrichzeichenfolge entspricht) von jeder Wortkorrelationstabelle wird dann mit allen entsprechenden optimalen Kostenwerten von den anderen Wortkorrelationstabellen verglichen. Das Maximum von diesen verschiedenen optimalen Kostenwerten wird dann herangezogen, um die Vokabular- Metastrichzeichenfolge zu identifizieren, welche die Eingabe-Metastrichzeichenfolge am besten mit einem Wort ("Definition") aus dem Wörterbuch korreliert, wobei angenommen wird, daß den minimalen Erkennungskriterien genügt wird. (In anderen Worten bildet ein Maximum, das unterhalb eines akzeptablen Minimums liegt, eine Grundlage für die Anzeige eines Fehlers, die Eingabe-Zeichenfolge als ein Wort zu erkennen.)This procedure is performed for each cell in the word correlation table. The maximum α of the substitution, addition and deletion is used for each cell. When the word correlation table is calculated, the path to each cell from the neighboring cell, which gives the maximum rating, is tabulated. At the end of the process, the paths from each cell (e.g. from the right border or lower border) to the origin ( 0 . 0 ) to be led back. Each of these paths represents the optimal path between the origin and the selected cell. According to the invention, the cell position at the far right and at the bottom of the origin represents the "optimal cost value" for the optimal path through the word correlation matrix for the specific one tested and with its end mark specific input string. The specific input meta-string is compared to each vocabulary meta-string from the dictionary (made up of the vocabulary of allowed meta-strings) to create numerous word correlation tables. The optimal cost value for the input meta-string (the value of which is derived from the cell in the last column and last row and which corresponds to the end of the input meta-string and the vocabulary meta-string) from each word correlation table is then compared with all corresponding optimal cost values compared to other word correlation tables. The maximum of these various optimal cost values is then used to identify the vocabulary meta-string that best correlates the input meta-string with a word ("definition") from the dictionary, assuming that the minimum recognition criteria are met. (In other words, forms a maximum that is below an acceptable minimum is a basis for displaying an error recognizing the input string as a word.)

Mit dem erfindungsgemäßen System können Wörter, die kursiv mit der Hand geschrieben werden, mit großer Wahrscheinlich erkannt werden. In dem System ist eine genügende Redundanz vorgesehen, das mit einer angemessenen Wahrscheinlichkeit selbst Wörter erkannt werden können, die in einer schlechten Handschrift mit fehlenden Buchstaben und Schreibfehlern geschrieben sind.With the system according to the invention can words, that are written in italics by hand, most likely be recognized. There is sufficient redundancy in the system, that with a reasonable probability even recognized words can be those in poor handwriting with missing letters and Misspellings are written.

Die Erfindung wird nachfolgend unter Bezugnahme auf bevorzugte Ausführungsformeln erläutert. Andere Ausführungsformen können von den Fachleuten daraus abgeleitet werden.The invention is described below Reference to preferred embodiments explained. Other embodiments can derived from it by the experts.

Claims

Verfahren zum Erkennen kursiver handgeschriebener Wörter aus der Dynamik von Eingabestrichen mit folgenden Verfahrensschritten: Empfangen von Eingabesignalen mit Werten, die eine Sequenz von die Handschrift symbolisierenden Punkten und einen Anfangs- und einen Endpunkt der Punktesequenz darstellen; Auswählen der Sequenz von Punkten als ein Prüfwort, die durch den Anfangs- und Endpunkt begrenzt sind; Ersetzen des Prüfwortes durch eine Zeichenfolge von Eingabe-Metastrichen in sequentieller Reihenfolge, wobei jeder Metastrich ein Element eines kursiven handgeschriebenen Zeichens darstellt, um eine vorläufige Metastrich-Zeichenfolge für jedes Prüfwort zu erhalten; Aufstellen von Wortkorrelationstabellen unter Verwendung einer Merkmalkorrelationstabelle von allen ein Vokabular bildenden Metastrichen, wobei die Merkmalkorrelationstabelle Eingabe-Metastriche mit Vokabular-Metastrichen in Verbindung bringt, um dem Prüfwort entsprechende Vakabular-Metastrichzeichenfolgen auszuwählen, die eine Liste von Einträgen aufweisen, die aus Varianten von bekannten Metastrichzeichenfolgen zusammengestellt sind; Extrahieren einer einzelnen Maximalprüfbewertung für jede der Wortkonelationstabellen nur nach der Vervollständigung der Wortkonelationstabelle; und Identifizieren, für ein Ausgabegerät, nach der Beendigung des Aufstellungsschritts, einer am besten passenden Übereinstimmung zwischen dem Prüfwort und einer der Vokabular-Metastrichzeichenfoigen basierend auf der höchsten Bewertung der Maximalbewertungen.Method for recognizing italic handwritten words from the dynamics of input dashes with the following procedural steps: Receive of input signals with values that are a sequence of the handwriting symbolizing points and a start and an end point of the Represent point sequence; Select the sequence of points as a checkword, which are limited by the start and end point; Replace the test word through a string of input meta strokes in sequential Order, with each metastank an element of an italic handwritten Character represents a preliminary Metastrich string for every checkword to obtain; Setting up word correlation tables under Using a feature correlation table from all of a vocabulary forming meta-strings, the feature correlation table being input meta-strokes associated with vocabulary metastrokes to match the checkword Select vacabular metastroke strings that have a list of entries, which are compiled from variants of known metastroke strings are; Extract a single maximum test rating for each of the Word correlation tables only after completion of the word correlation table; and Identify for an output device, after completing the setup step, a most appropriate match between the check word and one of the vocabulary meta-dash characters based on the highest Rating of the maximum ratings.

Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass der Schritt des Aufstellens eine dynamische Programmierung der Wortkorrelationstabellen umfasst, die auf der Strichfolge und der Strichposition bezüglich einer Basislinie beruht.A method according to claim 1, characterized in that the step of putting up a dynamic programming of the word correlation tables included on the stroke order and the stroke position with respect to a Baseline based.

Verfahren zum Erkennen kursiver handgeschriebener Wörter aus der Dynamik von Eingabestrichchen mit folgenden Verfahrensschritten: Empfangen von Eingabesignalen mit Werten, die eine Sequenz von die Handschrift symbolisierenden Punkten und einen Anfangs- und einen Endpunkt der Punktesequenz darstellen; Auswählen der Sequenz von Punkten als ein Prüfwort, die durch den Anfangs- und Endpunkt begrenzt sind; Ersetzen des Prüfwartes durch eine Zeichenfolge von Eingabe-Matastrichen in sequentieller Reihenfolge, wobei jeder Metastrich ein Element eines kursiven handgeschriebenen Zeichens darstellt, um eine vorläufige Metastrich-Zeichenfolge für jedes Prüfwort zu erhalten; Aufstellen von Wortkorrelationstabellen durch das dynamische Programmieren der Wortkorrelationstabellen auf der Grundlage der Strichfolge und Strichposition in Bezug auf die Basislinie unter Verwendung einer Merkmalkorrelationstabelle von allen ein Vokabular bildenden Metastrichen, wobei die Merkmalkorrelationstabelle Eingabe-Metastriche mit Vokabular-Metastrichen in Verbindung bringt, um dem Prüfwort entsprechende Vokabular-Metastrichzeichenfolgen auszuwählen, die eine Liste von Einträgen aufweisen, die aus Varianten von bekannten Metastrich-Zeichenfolgen zusammenstellt sind; dadurch gekennzeichnet, dass der Schritt der dynamischen Programmierung folgende Schritte umfasst: Ermitteln einer ersten Maximalprüfbewertung zum Substituieren eines zweiten Metastrichs durch einen ersten Metastrich für jede Zelle in jeder Wortkorrelationstabelle, wobei von der Substitutionsgewichtung aus der Merkmalkonelationstabelle Gebrauch gemacht wird; Ermitteln einer zweiten Maximalprüfbewertung zum Einsetzen eines Metastrichs aus der Vokabular-Metastrichzeichenfolge in das Prüfwort für jede Zelle in jeder Wortkorrelationstabelie, wobei von der Additionserschwerungsgewichtung aus der Merkmalkoneltaionstabelle Gebrauch gemacht wird; Ermitteln einer dritten Maximalprüfbewertung zum Löschen eines Metastrichs aus dem Prüfwort für jede Zelle jeder Wortkorrelationstabelle, um eine mögliche Übereinstimmung mit der Vokabular-Metastrichzeichenfolge zu erhalten, wobei von der Erschwerungsgewichtung aus der Merkmalkorrelationstabelle Gebrauch gemacht wird; und Einsetzen der höchsten Bewertung aus der ersten Maximalprüfbewertung, der zweiten Maximalprüfbewertung und der dritten Maximalprüfbewertung in jede Zelle; Danach Extrahieren einer einzelnen Maximalprüfbewertung für jede der Wortkonelationstabellen nur nach der Vervollständigung der Wortkonelationstabelle; und Identifizieren, für ein Ausgabegerät, nach der Beendigung des Aufstellungsschritts, einer am besten passenden Übereinstimmung zwischen dem Prüfwort und einer der Vokabular-Metastrichzeichenfolgen basierend auf der höchsten Bewertung der Maximalbewertungen.Method for recognizing italicized handwritten words from the dynamics of input dashes with the following method steps: receiving input signals with values which represent a sequence of points symbolizing the handwriting and a start and an end point of the point sequence; Selecting the sequence of points as a check word delimited by the start and end points; Replacing the checker with a string of input matrices in sequential order, each meta-dash being an element of an italic handwritten character to obtain a preliminary meta-dash for each checkword; Establishing word correlation tables by dynamically programming the word correlation tables based on the stroke order and stroke position with respect to the baseline using a feature correlation table of all meta-strokes forming a vocabulary, the feature correlation table associating input meta-strokes with vocabulary meta-strokes to match the check word Select vocabulary meta-strings that have a list of entries composed of variations of known meta-strings; characterized in that the step of dynamic programming comprises the steps of: determining a first maximum test score for substituting a second metastroke for each cell in each word correlation table by substituting a first metastroke using the substitution weighting from the feature correlation table; Determining a second maximum test score for inserting a meta-dash from the vocabulary meta-string into the check word for each cell in each word correlation table using the add-on weighting from the feature correlation table; Determining a third maximum test score for deleting a metastroke from the test word for each cell of each word correlation table to obtain a possible match with the vocabulary meta-string of strings using the weighting weighting from the feature correlation table; and inserting the highest rating from the first maximum test rating, the second maximum test rating and the third maximum test rating into each cell; Then extracting a single maximum check score for each of the word correlation tables only after completing the word correlation table; and identifying, for an output device, after the completion of the setting up step, a best match between the check word and one of the vocabulary meta-strings based on the highest rating of the maximum ratings.

Verfahren zum Erkennen kursiver handgeschriebener Wörter aus der Dynamik von Eingabestrichen nach Anspruch 1, das folgenden Schritt aufweist: Lokalisieren und Tabellieren der kritischen Punkte in dem Prüfwort in sequentieller Reihenfolge, wobei die kritischen Punkte Maxima, Minima, Schnittpunkte, Punkte und Kreuzungspunkte umfassen; wobei der Schritt des Ersetzens das Vergleichen der kritischen Punkte mit Indizien von bekannten kritischen Punkten von einer Auswahl von den Metastrichen umfaßt, um eine vorläufige Metastrich-Zeichenfolge für jedes Prüfwort zu erhalten; wobei das Verfahren des weiteren die folgenden Schritte aufweist: Auswählen von bevorzugten Metastrich-Zeichenfolgen entsprechend einer optimalen Kostenkalkulation, welche die Gewichtung von Additionen, Löschungen und Substitutionen von Metastrichen in Bezug auf benachbarte Metastriche umfasst; und wobei der Schritt des Identifizierens das Identifizieren von Prüfwörtern aus einer Liste der am besten passenden Übereinstimmung aus dem Wörterbuch mit einem Hinweis auf die positive Erkennung eines einzelnen Prüfwortes auf das Erreichen einer Übereinstimmungswahrscheinlichkeit hin, die einen vorbestimmten Grenzwert überschreitet, umfasst.Method for recognizing italic handwritten words from the dynamics of input strokes according to claim 1, the following Step has: Locating and tabulating the critical Points in the checkword in sequential order, the critical points maxima, Include minima, intersection points, and intersection points; in which the step of replacing comparing critical points with evidence of known critical points from a selection covered by the metastrokes, to a preliminary Metastrich string for every checkword to obtain; in which the procedure further follows Steps comprises: Choose of preferred metastrich strings corresponding to an optimal one Cost calculation, which is the weighting of additions, deletions and substitutions of meta lines with respect to neighboring meta lines includes; and where the step of identifying identifying from checkwords a list of the best match from the dictionary with a reference to the positive recognition of a single test word on reaching a match probability out that exceeds a predetermined limit.

Verfahren nach Anspruch 4, dadurch gekennzeichnet, dass das Verfahren den folgenden Schritt umfasst: Festlegen einer unteren Basislinie und einer oberen Basislinie für das Prüfwort, um die Größe und das Maß zu bestimmten.A method according to claim 4, characterized in that the process includes the following step: Establish a lower baseline and an upper baseline for the check word to the size and that Measure to certain.

Verfahren nach Anspruch 5, dadurch gekennzeichnet, dass der Festlegungsschritt folgende Schritte umfasst: Messen der Durchschnittsneigung von ausgewählten Punktsequenzen des Prüfwortes; und Aufteilen des Prüfwortes in einen mittleren Bereich zwischen der unteren Basislinie und der oberen Basislinie, wobei angenommen wird, dass sich die Körper der Buchstaben in einem oberen Bereich und in einem unteren Bereich befinden, wobei angenommen wird, dass sich in dem oberen Bereich die Oberlängen der Buchstaben und in dem unteren Bereich die Unterlängen der Buchstaben befinden.A method according to claim 5, characterized in that the determination step includes the following steps: measure up the average inclination of selected point sequences of the test word; and Splitting the check word in a middle area between the lower baseline and the upper baseline, assuming that the body of the Letters in an upper area and in a lower area are located, it is assumed that in the upper area the ascenders the letters and in the lower area the descenders of the Letters.

Verfahren nach Anspruch 4, dadurch gekennzeichnet, dass das Aufstellen i) eine Vorwärtssequenz von Metastrichen, ii) eine Rückwärtssequenz von Metastrichen und iii) die am besten passenden Wortanfänge und die am besten passenden Wortenden benutzt.A method according to claim 4, characterized in that putting up i) a forward sequence von Metastrichen, ii) a backward sequence of meta strokes and iii) the most appropriate word starts and the best used word ends.

Verfahren nach Anspruch 4, dadurch gekennzeichnet, dass die Maximalbewertungsextraktion die folgenden Schritte umfasst: Bestimmen einer ersten Maximalprüfbewertung zum Substituieren eines zweiten Metastrichs durch einen ersten Metastrich für jede Zelle in jeder Wortkorrelationstabelle, wobei von der Substitutionsgewichtung aus der Merkmalkorrelationstabelle Gebrauch gemacht wird; Bestimmen einer zweiten Maximalprüfbewertung zum Einsetzen eines Metastrichs aus der Vokabular-Metastrichzeichenfolge in das Prüfwort für jede Zelle in jeder Wortkorrelationstabelle, wobei von der Additionserschwerungsgewichtung aus der Merkmalkorrelationstabelle Gebrauch gemacht wird; Bestimmen einer dritten Maximalprüfbewertung zum Löschen eines Metastrichs aus dem Prüfwort für jede Zelle jeder Wortkorrelationstabelle, um eine mögliche Übereinstimmung mit der Vokabular-Metastrichzeichenfolge zu erhalten, wobei von der Erschwerungsgewichtung aus der Merkmalkorrelationstabelle Gebrauch gemacht wird; und Einsetzen der höchsten Bewertung aus der ersten Maximalprüfbewertung, der zweiten Maximalprüfbewertung und der dritten Maximalprüfbewertung in jede Zelle.A method according to claim 4, characterized in that the maximum rating extraction includes the following steps: Determine a first maximum test rating for substituting a second meta line with a first meta line for every Cell in each word correlation table, by substitution weighting use is made of the feature correlation table; Determine a second maximum test rating to insert a meta-string from the vocabulary meta-string in the checkword for every Cell in each word correlation table, taking from the additive weighting use is made of the feature correlation table; Determine a third maximum test rating to delete a metastroke from the check word for every Cell each word correlation table to make a possible match with the vocabulary meta-string to get, from the weighting of the aggravation from the feature correlation table Use is made; and Insert the highest rating from the first Maximalprüfbewertung, the second maximum test rating and the third maximum test rating in every cell.

Verfahren zum Erkennen von kursiven handgeschriebenen Wörtern aus der Dynamik von Eingabestrichen nach Anspruch 1, wobei die Punktesequenz in dem Schritt des Empfangens innerhalb eines Koordinatensystems definiert ist; wobei das Verfahren des weiteren die folgenden Schritte aufweist: Rekonstruieren des Prüfwortes als ein rekonstruiertes Wort mit einer Substitutionssequenz von Punkten, die eingesetzte interpolierte Punkte und gelöschte falsche Punkte aufweist; Festlegen einer unteren Basislinie und einer oberen Basislinie für das Prüfwort um die Größe und das Maß zu bestimmen; Lokalisieren und Tabellieren der kritischen Punkte in sequentieller Reihenfolge in dem rekonstruierten Wort, wobei die kritischen Punkte Maxima, Minima, Schnittpunkte, Punkte und Kreuzungspunkte aufweisen; wobei der Schritt des Ersetzens das Ersetzen des rekonstruierten Wortes durch eine Zeichenfolge von Metastrichen in sequentieller Reihenfolge umfasst und wobei der Schritt des Ersetzens den Vergleich der kritischen Punkte mit Indizien von bekannten kritischen Punkten von wenigstens zwanzig Metastrichen aufweist, um für jedes rekonstruierte Wort eine vorläufige Metastrich-Zeichenfolge zu erhalten; wobei das Verfahren des weiteren den folgenden Schritt aufweist: Auswählen von bevorzugten Metastrich-Zeichenfolgen entsprechend einer optimalen Kostenkalkulation, welche die Gewichtung von Additionen, Löschungen und Substitutionen von Metastrichen in Bezug auf benachbarte Metastriche umfasst; wobei der Schritt des Identifizierens auf das Erreichen einer Maximalbewertung hin, die einen vorbestimmten Grenzwert überschreitet, identifiziert.A method for recognizing italic handwritten words from the dynamics of input strokes according to claim 1, wherein the sequence of dots is defined in the step of receiving within a coordinate system; the method further comprising the steps of: reconstructing the check word as a reconstructed word with a substitution sequence of points having interpolated points inserted and deleted incorrect points; Defining a lower baseline and an upper baseline for the check word to determine size and measure; Locating and tabulating the critical points in sequential order in the reconstructed word, the critical points having maxima, minima, intersection points, points and crossing points; wherein the step of replacing comprises replacing the reconstructed word with a string of metastrokes in sequential order, and wherein the step of replacing comprises comparing the critical points with evidence of known critical points of at least twenty meta dashes to provide a preliminary metastroke for each reconstructed word - get string; the method further comprising the step of: selecting preferred meta-strings according to an optimal cost calculation which includes weighting additions, deletions and substitutions of meta-strokes with respect to adjacent meta-strokes; wherein the step of identifying upon reaching a maximum rating that exceeds a predetermined threshold is identified.

Verfahren nach Anspruch 9, dadurch gekennzeichnet, dass der Festlegungsschritt das Messen der Durchschnittsneigung von ausgewählten Punktsequenzen des Prüfwortes und das Aufteilen des Prüfwortes in einen mittleren Bereich zwischen der unteren Basislinie und der oberen Basislinie umfasst, wobei angenommen wir, dass sich die Körper der Buchstaben in einem oberen Bereich und in einem unteren Bereich befinden, wobei angenommen wird, dass sich in dem oberen Bereich die Oberlängen der Buchstaben und in dem unteren Bereich die Unterlängen der Buchstaben befinden.A method according to claim 9, characterized in that the determining step is measuring the average slope of selected Dot sequences of the test word and dividing the checkword in a middle area between the lower baseline and the upper baseline, assuming that the body of the Letters in an upper area and in a lower area are located, it is assumed that in the upper area the ascenders the letters and in the lower area the descenders of the Letters.

Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass der Schritt des Aufstellens die dynamische Programmierung der Wortkorrelationstabellen umfasst, die auf der Strichfolge und der Strichposition in Bezug auf die Basislinien beruht.A method according to claim 1, characterized in that the step of setting up the dynamic programming of the Includes word correlation tables based on the stroke order and the Stroke position based on the baselines.

Verfahren nach Anspruch 9, dadurch gekennzeichnet, dass die Merkmalkorrelationstabelle eine positive Gewichtung für die Substitutionen und eine Erschwerungsgewichtung für Additionen und Löschungen umfasst.A method according to claim 9, characterized in that the feature correlation table has a positive weighting for the substitutions and an aggravation weight for additions and deletions includes.

Verfahren zum Erkennen kursiver handgeschriebener Wort aus der Dynamik von Eingabestrichen mit folgenden Verfahrensschritten: Empfangen von Eingabesignalen mit Werten, die eine Sequenz von die Handschrift symbolisierenden Punkten und einen Anfangs- und einen Endpunkt der Punktesequenz darstellen; Auswählen der Sequenz von Punkten als ein Prüfwort, die durch den Anfangspunkt und Endpunkt begrenzt sind; Lokalisieren und Tabellieren der kritischen Punkte in dem Prüfwort in sequentieller Reihenfolge, wobei die kritischen Punkte Maxima, Minima, Schnittpunkte, Punkte und Kreuzungspunkte umfassen; Ersetzen des Prüfwortes durch eine Zeichenfolge von Metastirchen in sequentieller Reihenfolge, wobei jeder Metastrich ein Element eines kursiven handgeschriebenen Zeichens darstellt und wobei der Schritt des Ersetzens das Vergleichen der kritischen Punkte mit Indizien der bekannten kritischen Punkte von einer Auswahl von Metastrichen umfasst, um eine vorläufige Metastrich-Zeichenfolge für jedes Prüfwort zu erhalten; Aufstellen von Wortkorrelationstabellen unter Verwendung einer Merkmalkorrelationstabelle von allen ein Vokabular bildenden Metastrichen, wobei die Merkmalkorrelationstabelle Eingabe-Metastriche mit die Vokabular-Metastrichen in Verbindung bring, um dem Prüfwort entsprechende Vokabular-Metastrichzeichenfolgen auszuwählen, wobei die Vokabular-Metastrichzeichenfolgen eine Liste von Einträgen aufweist, die aus Varianten von bekannten Metastrich-Zeichenfolgen zusammengestellt sind; Auswählen von bevorzugten. Metastrich-Zeichenfolgen entsprechend einer optimalen Kostenkalkulation, welche die Gewichtung von Additionen, Löschungen und Substitutionen von Metastrichen in Bezug auf benachbarte Metastriche umfasst; Extrahieren einer einzelnen Maximalprüfbewertung für jede der Wortkonelationstabellen nur nach der Vervollständigung der Wortkonelationstabelle; und Identifizieren von Prüfwörtern, für ein Ausgabegerät, aus einer Liste der am besten passenden Übereinstimmung aus dem Wörterbuch mit einem Hinweis auf die positive Erkennung eines einzelnen Prüfwortes auf das Erreichen einer Übereinstimmungswahrscheinlichkeit hin, die einen vorbestimmten Grenzwert überschreitet; dadurch gekennzeichnet, dass die optimale Kostenkalkulation die folgenden Schritte umfasst: Ermitteln eines ersten Maximalprüfbewertungswertes aus einem Austausch eines ersten Prüfmetastriches durch einen zweiten Prüfmetastrich in einer Zelle in der Wortkonelationstabelle, wobei die Daten aus der Merkmalkorrelationstabelle und der Größenkonelationstabelle benutzt werden entsprechend er Gleichung:

Ermitteln eines zweiten Maximalprüfbewertungswertes aus einer Addition von einem zweiten Prüfmetastrich in einer Zelle in der Wortkonelationstabelle entsprechend der Gleichung:

Ermitteln eines dritten Maximalprüfbewertungswertes aus einer Löschung des ersten Prüfmetastriches in einer Zelle in der Wortkorrelationstabelle entsprechend der Gleichung: i

worin: α1^j _i der „Kostenwert" (der in dem Vokabular des dynamischen Programmierens benutzt wird) oder die kumulative Bewertung in Element (i, j) für das Passieren vom Ursprung über Element (i – 1, j – 1) ist, indem der Eingabe-Metastrich "b" in der Spaltenposition (j) durch den Vokabular-Metastrich „a" in der Reihenposition (i) ersetzt wird; p(a_i, b_j) ein Ähnlichkeitsgewichtungswert der Substitution eines Eingabe-Metastrichs „a_i" durch einen Vokabular-Metastrich „b_j" ist; q(a_j, b_j) der Größengewichtungswert für die Größensubstitution ist, die in der vorausgehenden Substitution des Eingabe-Metastrichs „a_i" durch den Vokabular-Metastrich „b_j" erfolgt; α2 der „Kostenwert" oder die kumulative Bewertung für das Passieren vom Ursprung über Element (i – 1, j) nach Element (i, j) ist, indem der Vokabular-Metastrich „a" in der Zeilenposition (i) nach dem Eingabe-Metastrich „b" in Spaltenposition (j) eingefügt wird; α3 der „Kostenwert" für die kumulative Bewertung zum Passieren vom Ursprung über Element (i, j – 1) nach Element (i, j) ist, indem der Eingabe-Metastrich „b" in Spalte (j) entlang einer Sequenz von Metastrichen gelöscht wird; p(a_i) ein Erschwerungswert zum Einsetzen des Vokabel-Metastrichs „a" in Zeilenposition (i) nach dem Eingabe-Metastrich „b" in Spaltenposition (j) ist; q(a_i) der Erschwerungswert für die der vorhergehenden Einfügung zugeordneten Größe ist (14 oder 12A); p(b_j) ein Erschwerungswert zum Löschen eines Metastrichs „b_j" ist; q(b_j) ein Erschwerungswert für die der vorgehenden Löschung zugeordneten Größe ist.Method for recognizing cursive handwritten word from the dynamics of input strokes with the following method steps: receiving input signals with values which represent a sequence of points symbolizing the handwriting and a start and an end point of the point sequence; Selecting the sequence of points as a check word delimited by the start point and end point; Locating and tabulating the critical points in the check word in sequential order, the critical points including maxima, minima, intersection points, points, and crossing points; Replacing the checkword with a string of metasthones in sequential order, each metastank representing an element of an italic handwritten character, and the step of replacing comprising comparing the critical points with indications of the known critical points from a selection of metastrokes to a preliminary metastroke - get string for each check word; Setting up word correlation tables using a feature correlation table of all vocabulary meta-strings, the feature correlation table associating input meta-strings with the vocabulary meta-strings to select vocabulary meta-short strings corresponding to the check word, the vocabulary meta-short strings having a list of entries are composed of variants of known metastrich strings; Choosing preferred. Meta-strings according to an optimal cost calculation, which includes the weighting of additions, deletions and substitutions of meta-strokes in relation to neighboring meta-strokes; Extracting a single maximum check score for each of the word correlation tables only after completing the word correlation table; and identifying check words for an output device from a list of the best match from the dictionary with an indication of the positive recognition of a single check word upon reaching a match probability that exceeds a predetermined threshold; characterized in that the optimal cost calculation comprises the following steps: ascertaining a first maximum test evaluation value from an exchange of a first test metastructure by a second test metastructure in a cell in the word correlation table, the data from the feature correlation table and the size correlation table being used in accordance with the equation:

Determining a second maximum test evaluation value from an addition of a second test metastrich in a cell in the word correlation table according to the equation:

Determining a third maximum test evaluation value from deletion of the first test meta in a cell in the word correlation table in accordance with the equation: i

where: α1 ^j _{i is} the "cost value" (used in the dynamic programming vocabulary) or the cumulative rating in element (i, j) for passing from the origin over element (i-1, j-1) by the input meta "b" in column position (j) is replaced by vocabulary meta "a" in row (i); p (a _i , b _j ) is a similarity weighting value of the substitution of an input meta "a _i " by a vocabulary meta "b _j "; q (a _j , b _j ) is the size weighting value for the size substitution that occurs in the previous substitution of the input meta "a _i " by the vocabulary meta "b _j "; α2 is the "cost value" or the cumulative evaluation for the passage from the origin via element (i - 1, j) to element (i, j), in that the vocabulary meta dash "a" in the line position (i) after the input Meta dash "b" is inserted in column position (j); α3 is the "cost value" for the cumulative evaluation for passing from the origin via element (i, j - 1) to element (i, j) by entering the input meta dash "b "is deleted in column (j) along a sequence of meta lines; p (a _i ) is an aggravation value for inserting the vocabulary meta line" a "in row position (i) after the input meta line" b "in column position (j); q (a _i ) is the aggravation value for the size associated with the previous insertion ( 14 or 12A ); p (b _j ) is an aggravation value for deleting a metastroke "b _j "; q (b _j ) is an aggravation value for the size associated with the previous deletion.

Vorrichtung zum Erkennen kursiver handgeschriebener Wörter aus der Dynamik von Eingabestrichen mit einer Einrichtung zum Empfangen von Eingabesignalen mit Werten, die eine Sequenz von die Handschrift symbolisierenden Punkten und einen Anfangspunkt und einen Endpunkt der Punktesequenz darstellen; eine mit der Empfangseinrichtung verbundene Einrichtung zum Auswählen einer durch den Anfangspunkt und Endpunkt begrenzten Punktesequenz als ein Prüfwort; einer mit der Verbindungseinrichtung verbundenen Einrichtung zum Lokalisieren und Tabellieren der kritischen Punkte in dem Prüfwort in sequentieller Reihenfolge, wobei die kritischen Punkte Maxima, Minima, Schnittpunkte, Punkte und Kreuzungspunkte umfassen; eine mit der Lokalisierungs- und Tabellierungseinrichtung verbundene Einrichtung zum Ersetzen des Prüfwortes durch eine Sequenz von Metastrichen in sequentieller Reihenfolge, wobei jeder Metastrich ein Element eines kursiven, hangeschriebenen Zeichens darstellt und wobei die Ersetzungseinrichtung eine Einrichtung zum Vergleich der kritischen Punkte mit Indizien von bekannten kritischen Punkten aufweist, um für jedes Prüfwort eine vorläufige Metastrich-Sequenz zu erhalten; eine Einrichtung zum Aufstellen von Wortkorrelationstabellen unter Verwendung einer Merkmalkorrelationstabelle von allen ein Vokabular bildenden Metastrichen, wobei die Merkmalkorrelationstabelle Eingabe-Metastriche mit Vokabular-Metastrichen in Verbindung bringt, um dem Prüfwort entsprechende Vokabular-Metastrichzeichenfolgen auszuwählen, die eine Liste von Einträgen aufweisen, die aus Varianten der bekannten Metastrich-Zeichenfolgen zusammengestellt sind; eine Einrichtung zum Auswählen bevorzugter Metastrich-Zeichenfolgen entsprechend einer optimalen Kostenkalkulation, die eine Einrichtung zum Gewichten von Additionen, Löschungen und Substitutionen von Metastrichen in Bezug auf benachbarte Metastriche aufweist; eine Einrichtung zum Extrahieren einer einzelnen Maximalprüfbewertung für jede der Wortkorrelationstabellen nur nach der Vervollständigung der Wortkorrelationstabelle, und eine Einrichtung zum Identifizieren von Prüfwörtern, für ein Ausgabegerät, aus einer Liste der am besten passenden Übereinstimmungen aus dem Wörterbuch mit einem Hinweis auf eine positive Erkennung von einem einzelnen Prüfwort auf das Erreichen einer Übereinstimmungswahrscheinlichkeit hin, die einen vorbestimmten Grenzwert überschreitet.Device for recognizing italicized handwritten words from the dynamics of input strokes with a device for receiving input signals with values which represent a sequence of points symbolizing the handwriting and a starting point and an end point of the point sequence; means connected to the receiving means for selecting a sequence of points delimited by the start point and end point as a check word; means connected to the connector for locating and tabulating the critical points in the test word in sequential order, the critical points including maxima, minima, intersection points, points and intersection points; means connected to the locating and tabulating means for replacing the check word with a sequence of meta lines in sequential order, each meta line representing an element of an italic, handwritten character, and the replacing means means for comparing the critical points with indications of known critical points to obtain a preliminary metastrich sequence for each check word; means for constructing word correlation tables using a feature correlation table of all vocabulary meta-strings, the feature correlation table associating input meta-strings with vocabulary meta-strings to select vocabulary meta-strings corresponding to the check word having a list of entries consisting of variants the known metastrich strings are compiled; means for selecting preferred meta-strings in accordance with an optimal cost calculation, comprising means for weighting additions, deletions and substitutions of meta-strokes with respect to adjacent meta-strokes; means for extracting a single maximum test score for each of the word correlation tables only after completion of the word correlation table, and means for identifying test words for an output device from a list of the best match send matches from the dictionary with an indication of positive recognition of a single check word upon reaching a match probability that exceeds a predetermined threshold.

Vorrichtung nach Anspruch 14, dadurch gekennzeichnet, dass die Vorrichtung ferner eine Einrichtung zum Festlegen einer unteren Basislinie und einer oberen Basislinie für das Prüfwort aufweist, um die Größe und das Maß zu bestimmen.Device according to claim 14, characterized in that the device further comprises a device for setting a has lower baseline and an upper baseline for the checkword to size and that Measure too determine.

Vorrichtung nach Anspruch 15, dadurch gekennzeichnet, dass die Festlegungseinrichtung aufweist: eine Einrichtung zum Teilen des Prüfwortes in einen mittleren Bereich zwischen einer unteren Basislinie und einer oberen Basislinie unter der Annahme, dass die Körper der Buchstaben in einem oberen Bereich und in einem unteren Bereich liegen, wobei die Oberlängen der Buchstaben in dem oberen Bereich und die Unterlängen der Buchstaben in dem unteren Bereich angenommen werden; und eine Einrichtung zum Messen der Durchschnittsneigung von ausgewählten Sequenzen von Punkten des Prüfwortes.Apparatus according to claim 15, characterized in that the fixing device has: An institution to share the test word in a middle range between a lower baseline and a upper baseline assuming that the body of the letters in one lie in the upper area and in a lower area, the ascenders of the Letters in the upper area and the descenders of the letters in the lower area to be adopted; and a facility for Measure the average slope of selected sequences of points of the check word.

Vorrichtung nach Anspruch 15, dadurch gekennzeichnet, dass die Metastrich-Ersetzungseinrichtung eine Einrichtung zum Durchführen einer Übereinstimmungswahrscheinlichkeitsmessung aufweist, wobei die Übereinstimmungswahr scheinlichkeitsmessung auf einem Vergleich zwischen den kritischen Punkten und den Indizien der bekannten kritischen Punkte und auf der Höhe eines Metastrichs in Bezug auf die untere Basislinie und die obere Basislinie beruht.Apparatus according to claim 15, characterized in that the Metastrich replacement facility is a Implementation facility a match probability measurement has, the match probability measurement on a comparison between the critical points and the evidence the known critical points and at the level of a metastroke in relation is based on the lower baseline and the upper baseline.

Vorrichtung nach Anspruch 14, dadurch gekennzeichnet, dass die Maximalbewertungsberechnungseinrichtung an ausgewählten Positionen der Metastrich-Sequenz aufweist: eine Einrichtung zum Ermitteln einer ersten Maximalprüfbewertung zum Substituieren eines zweiten Metastrichs durch einen ersten Metastrich für jede Zelle in jeder Wortkorrelationstabelle, wobei von der Substitutionsgewichtung aus der Merkmalkorrelationstabelle Gebrauch gemacht wird; eine Einrichtung zum Ermitteln einer zweiten Maximalprüfbewertung zum Einsetzen eines Metastrichs aus der Vokabular-Metastrichzeichenfolge in das Prüfwort für jede Zelle in jeder Wortkorrelationstabelle, wobei von einer Additionserschwerungsgewichtung aus der Merkmalkorrelationstabelle Gebrauch gemacht wird; eine Einrichtung zum Ermitteln einer dritten Maximalprüfbewertung zum Löschen eines Metastrichs aus dem Prüfwort für jede Zelle jeder Wortkorrelationstabelle, um eine mögliche Übereinstimmung mit der Vokabular-Metastrichzeichenfolge zu erhalten, wobei von der Erschwerungsgewichtung aus der Merkmalkorrelationstabelle Gebrauch gemacht wird; und einer Einrichtung zum Einsetzen der höchsten Bewertung aus der ersten Maximalpüfbewertung, der zweiten Maximalprüfbewertung und der dritten Maximalprüfbewertung in jede Zelle.Device according to claim 14, characterized in that the maximum rating calculator at selected positions the Metastrich sequence has: a facility for discovery a first maximum test rating for substituting a second meta line with a first meta line for every Cell in each word correlation table, by substitution weighting use is made of the feature correlation table; a Device for determining a second maximum test rating to insert a meta-string from the vocabulary meta-string in the checkword for every Cell in each word correlation table, with an addition weighting use is made of the feature correlation table; a Device for determining a third maximum test rating to delete a metastroke from the check word for every Cell each word correlation table to make a possible match with the vocabulary meta-string to get, from the weighting of the aggravation from the feature correlation table Use is made; and a device for insertion the highest Evaluation from the first maximum test evaluation, the second maximum test evaluation and the third maximum test rating in every cell.

Vorrichtung nach Anspruch 14, dadurch gekennzeichnet, dass die Aufstellungseinrichtung mit i) einer Vorwärtssequenz von Metastrichen mit ü) einer Rückwärtssequenz von Metastrichen, mit iii) den am besten passenden Wortanfängen und mit iv) den am besten passenden Wortenden arbeitet.Device according to claim 14, characterized in that the setup facility with i) a forward sequence of meta lines with ü) a backward sequence of metastrokes, with iii) the most appropriate word starts and works with iv) the best fitting word ends.

Vorrichtung nach Anspruch 14, dadurch gekennzeichnet, dass die Auswahleinrichtung aufweist: eine Einrichtung zum Ermitteln eines ersten Maximalprüfbewertungswertes aus einem Austausch eines ersten Prüfmetastriches durch einen zweiten Prüfmetastrich in einer Zelle in der Wortkorrelationstabelle, wobei die Daten aus der Merkmalkorrelationstabelle und der Größenkonelationstabelle benutzt werden entsprechend der Gleichung:

einer Einrichtung zum Ermitteln eines zweiten Maximalprüfbewertungswertes aus einer Addition von einem zweiten Prüfmetastrich in einer Zelle in der Wortkorrelationstabelle entsprechend der Gleichung:

einer Einrichtung zum Ermitteln eines dritten Maximalprüfbewertungswertes aus einer Löschung des ersten Prüfmetastriches in einer Zelle in der Wortkorreltaionstabelle entsprechend der Gleichung:

worin: α1^j _i der "Kostenwert" (der in dem Vokabular des dynamischen Programmierens benutzt wird) oder die kumulative Bewertung in Element (i, j) für das Passieren vom Ursprung über Element (i – 1, j – 1) ist, indem der Eingabe-Metastrich "b" in der Spaltenposition (j) durch den Vokabular-Metastrich "a" in der Reihenposition (i) ersetzt wird; p(a_i, b_j) ein Ähnlichkeitsgewichtungswert der Substitution eines Eingabe-Metastrichs "a_i" durch einen Vokabular-Matastrich "b_j" ist; q(a_j, b_j) der Größengewichtungswert für die Größensubstitution ist, die in der vorausgehenden Substitution des Eingabe-Metastrichs "a_i" durch den Vokabular-Metastrich "b_j" erfolgt; α2 der "Kostenwert" oder die kumulative Bewertung für das Passieren vom Ursprung über Element (i – 1, j) nach Element (i, j) ist, indem der Vokabular-Metastrich "a" in der Zeilenposition (i) ist, indem der Vokabular-Metastrich "a" in der Zeilenposition (i) nach dem Eingabe-Metastrich "b" in Spaltenposition (j) eingefügt wird; α3 der "Kostenwert" für die kumulative Bewertung zum Passieren vom Ursprung über Element (i, j – 1) nach Element (i, j) ist, indem der Eingabe-Metastrich "b" in Spalte (j) entlang einer Sequenz von Metastrichen gelöscht wird; p(a_i) ein Erschwerungswert zum Einsetzen des Vokabel-Metastrichs "a" in Zeilenposition (i) nach dem Eingabe-Metastrich "b" in Spaltenposition (j) ist; q(a_i) der Erschwerungswert für die der vorhergehenden Einfügung zugeordneten Größe ist; p(b_j) ein Erschwerungswert zum Löschen eines Metastrichs "b_j" ist; q(b_j) ein Erschwerungswert für die der vorgehenden Löschung zugeordneten Größe ist.Apparatus according to claim 14, characterized in that the selection device comprises: a device for determining a first maximum test evaluation value from an exchange of a first test meta by a second test meta in a cell in the word correlation table, the data from the feature correlation table and the size correlation table being used in accordance with the Equation:

a device for determining a second maximum test evaluation value from an addition of a second test metastrich in a cell in the word correlation table according to the equation:

a device for determining a third maximum test evaluation value from deletion of the first test meta in a cell in the word correlation table according to the equation:

wherein: α1 ^j _{i is} the "cost value" (used in the dynamic programming vocabulary) or the cumulative rating in element (i, j) for passing from the origin over element (i-1, j-1) by input - Meta dash "b" in column position (j) is replaced by vocabulary meta dash "a" in row position (i); p (a _i , b _j ) is a similarity weighting value of the substitution of an input meta "a _i " by a vocabulary mat "b _j "; q (a _j , b _j ) is the size weighting value for the size substitution that occurs in the previous substitution of the input meta "a _i " by the vocabulary meta "b _j "; α2 is the "cost value" or the cumulative rating for passing from the origin via element (i-1, j) to element (i, j), with the vocabulary metastroke "a" in the line position (i), by the Vocabulary meta "a" is inserted in row position (i) after input meta "b" in column position (j); α3 is the "cost value" for the cumulative rating to pass from the origin over element (i, j-1) to element (i, j) by deleting the input meta-dash "b" in column (j) along a sequence of meta-dashes becomes; p (a _i ) is an aggravation value for inserting the vocabulary meta "a" in row position (i) after the input meta "b" in column position (j); q (a _i ) is the aggravation value for the size associated with the previous insertion; p (b _j ) is a difficulty value for deleting a metastroke "b _j "; q (b _j ) is an aggravation value for the size associated with the previous deletion.