DE4394624B4 - Cursive handwritten word recognition from sequential input information - using construction word correlation tables to select strings of vocabulary metastrokes corresponding to candidate word and identifies most likely match - Google Patents
Cursive handwritten word recognition from sequential input information - using construction word correlation tables to select strings of vocabulary metastrokes corresponding to candidate word and identifies most likely match Download PDFInfo
- Publication number
- DE4394624B4 DE4394624B4 DE4394624A DE4394624A DE4394624B4 DE 4394624 B4 DE4394624 B4 DE 4394624B4 DE 4394624 A DE4394624 A DE 4394624A DE 4394624 A DE4394624 A DE 4394624A DE 4394624 B4 DE4394624 B4 DE 4394624B4
- Authority
- DE
- Germany
- Prior art keywords
- meta
- word
- vocabulary
- correlation table
- points
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/22—Character recognition characterised by the type of writing
- G06V30/226—Character recognition characterised by the type of writing of cursive writing
- G06V30/2264—Character recognition characterised by the type of writing of cursive writing using word shape
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/142—Image acquisition using hand-held instruments; Constructional details of the instruments
- G06V30/1423—Image acquisition using hand-held instruments; Constructional details of the instruments the instrument generating sequences of position coordinates corresponding to handwriting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/22—Character recognition characterised by the type of writing
- G06V30/226—Character recognition characterised by the type of writing of cursive writing
- G06V30/2268—Character recognition characterised by the type of writing of cursive writing using stroke segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/22—Character recognition characterised by the type of writing
- G06V30/226—Character recognition characterised by the type of writing of cursive writing
- G06V30/2268—Character recognition characterised by the type of writing of cursive writing using stroke segmentation
- G06V30/2272—Character recognition characterised by the type of writing of cursive writing using stroke segmentation with lexical matching
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/26—Techniques for post-processing, e.g. correcting the recognition result
- G06V30/262—Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Character Discrimination (AREA)
Abstract
Description
Die Erfindung betrifft die Handschriftenkennung und bezieht sich insbesondere auf Handschrifterkennungsverfahren und eine Vorrichtung zur Handschrifterkennung, d.h. die Erkennung von aus einem durchgehenden Linienzug bestehenden Zeichen und Wörtern, wobei Informationen über die Strichfolge in Verbindung mit der Eingabe von Strichpositionsinformationen vorgesehen sind.The invention relates to handwriting recognition and relates in particular to handwriting recognition processes and a handwriting recognition device, i.e. the detection of characters and words consisting of a continuous line, where information about the stroke order in connection with the input of stroke position information are provided.
Der Bereich der computerunterstützten Handschriftenkennung ist von Interesse, seitdem viele Menschen nicht die Fähigkeit haben, über eine Tastatur zu kommunizieren und seitdem viele Aufgaben durch eine direkte Eingabe in einen Computer mit einem vertrauten Schreibinstrument, z.B. einem Stift, Kugelschreiber oder Füller entscheidend beschleunigt werden. Die Handschrifterkennung ist insbesondere deshalb eine Herausforderung, weil die Schriftzeichen aus durchgehenden Strichen bestehen und weil sich die Handschriften der Menschen stark voneinander unterscheiden.The field of computer-assisted handwriting recognition has been of interest since many people have not had the ability have about a keyboard to communicate and through many tasks since then direct input into a computer with a familiar writing instrument, e.g. a pen, ballpoint pen or fountain pen become. Handwriting recognition is particularly challenging because the characters consist of solid lines and because people's handwriting is very different.
Die Arbeit des Herrn Dr. Shelja A. Guberman der ehemaligen Sowjetunion, einer der Miterfinder, bildet die Grundlage der Erfindung. In einem Aufsatz, der in russischer Sprache in der Zeitschrift Avtomatika i Telemekhanika, von Shelja A. Guberman und V. V. Rozentsveig unter dem Titel "Algorithmus zur Erkennung eines handgeschriebenen Textes" (Nr. 5, Mai, 1976, Seiten 122–129, UDC, 681.39.06) veröffentlicht wurde; beschreiben die Erfinder den Stand der Technik der Handschrifterkennung und schlagen vor, daß die dynamischen Parameter der Schreibstiftlinienführung in Verbindung mit verschiedenen Erkennungsalgorithmen herangezogen werden. Zu den Erkennungsalgorithmen zählen eine Merkmalsgegenüberstellung zur Identifikation der Striche, die Erkennung des Anfangs und Endes der Trajektorie und die Unterteilung einer Trajektorie in Elemente, die nachfolgend auch als Metastriche bezeichnet werden. Die Erfinder haben ihr Metastrich-Alphabet auf gerade sieben sich selbst schneidende Elemente und drei Bogenelemente beschränkt: Die Arbeit schweigt aber zu der Möglichkeit einer Verwirrung der Elemente in dem Erkennungsprozeß und berücksichtigt nicht die Verwendung von dynamischen Programmierungstechniken. Folglich war die weitere Entwicklung darauf gerichtet, die Zuverlässigkeit und Brauchbarkeit der Erkennung zu verbessern.The work of Dr. Shelja A. Guberman of the former Soviet Union, one of the co-inventors, forms the Basis of the invention. In an essay in Russian in Avtomatika i Telemekhanika, by Shelja A. Guberman and V. V. Rozentsveig under the title "Algorithm for recognition of a handwritten Textes "(No. 5, May, 1976, pages 122-129, UDC, 681.39.06) has been; the inventors describe the prior art of handwriting recognition and suggest that the dynamic parameters of the pen line in connection with various Detection algorithms can be used. To the detection algorithms counting a feature comparison to identify the lines, the detection of the beginning and end the trajectory and the division of a trajectory into elements, which are also referred to below as meta lines. The inventors have their metastrich alphabet on just seven self-intersecting Elements and three arch elements limited: The work is silent to the possibility a confusion of the elements in the recognition process and considered not the use of dynamic programming techniques. consequently the further development was aimed at reliability and improve usability of detection.
In der Vergangenheit wurden Elemente von verschiedenen Techniken offenbart, die denen ähnlich sind, die in Verbindung mit der Erfindung benutzt werden. Diese Entgegenhaltungen dienen dazu, den Stand der Technik zu veranschaulichen. Daher sind Details von speziellen Ausführungsformen der Erfindung, die von diesen bekannten Techniken Gebrauch machen, nicht im einzelnen beschrieben. Die folgenden Druckschriften sind aber dennoch auf dem Gebiet der Handschrifterkennung von Bedeutung.In the past there were elements disclosed by various techniques similar to those which are used in connection with the invention. These citations serve to illustrate the state of the art. Therefore are Details of specific embodiments of the invention using these known techniques not described in detail. The following are publications but still important in the field of handwriting recognition.
Ehrich und Koehler, "Experiments in the Contextual Recognition of Cursive Script," IEEE Transactions on Computers, Vol. C-24, Nr. 2, Februar 1975, Seiten 182–194. Dieser Aufsatz beschreibt die Verwendung von Trennungstechniken zwischen den Hauptteilen der Buchstaben und den Ober- und Unterlängen der Buchstaben als Teil eines Vorerkennungsschemas.Ehrich and Koehler, "Experiments in the Contextual Recognition of Cursive Script, "IEEE Transactions on Computers, Vol. C-24, No. 2, February 1975, pages 182-194. This essay describes the use of separation techniques between the main parts of the Letters and the ascenders and descenders of the letters as part of a pre-recognition scheme.
Kamel, K.; Imam, I. "A computerized transcription system for cursive shorthand writing" Southeastcon '88.; IEEE Conference Proceedings, 11–13, Apr 1988, Pages: 336–339 beschreibt ein Verfahren zum extrahieren kritischer Punkte und Segmente aus stenographischen Kurzdarstellungen. Die stenographischen Kurzzeichen werden mittels einer Software durch Permutieren der kritischen Punkte erkannt.Kamel, K .; Imam, I. "A computerized transcription system for cursive shorthand writing "Southeastcon '88.; IEEE Conference Proceedings, 11-13, Apr. 1988, Pages: 336-339 describes a method for extracting critical points and segments from short stenographs. The shorthand shorthand using software by permuting the critical points recognized.
Es ist die Aufgabe der vorliegenden Erfindung ein verbessertes Verfahren und System zur Handschriftenkennung bereitzustellen.It is the task of the present Invention an improved method and system for handwriting recognition provide.
Diese Aufgabe ist durch den Gegenstand der unabhängigen Ansprüche gelöst. Bevorzugte Ausführungsformen werden in den Unteransprüchen definiert.This task is through the subject the independent Expectations solved. Preferred embodiments are in the subclaims Are defined.
Das erfindungsgemäße Verfahren und die erfindungsgemäße Vorrichtung für die Handschrifterkennung macht von einer Zwischenbeschreibungssprache für handgeschriebene Wörter Gebrauch, die aus Metastrichen zusammengesetzt ist. Metastriche sind Elemente oder Abschnitte einer Strichform, die benutzt werden, um einen Strich darzustellen. Ein Strich ist als zusammenhängendes Segment definiert, das beginnt, wenn der Stift die Oberfläche des Tableaus des Digitalisierers berührt und das endet, wenn der Stift von der Oberfläche abgehoben wird, wobei der Strich ein oder mehrere geschriebene Buchstaben umfaßt. Ein Kursivwort kann ein oder mehrere Striche umfassen, je nachdem, ob der Stift während des Schreibens des Wortes von der Oberfläche abgehoben wird oder nicht. Nach der Erfindung sind im allgemeinen wenigstens zwanzig Metastriche erforderlich, um das notwendige Vokabular oder einen Satz von zulässigen elementaren Strichformen zu bilden, obwohl nicht weniger als siebzig Metastriche benutzt werden können. Zusätzliche Metastriche verbessern die Erkennungsgenauigkeit der Erfindung auf Kosten einer wachsenden Rechenzeit. Die Techniken zur Interpretation der Eingabe-Metastrichsegmente als Wörter umfaßt das Vergleichen der Eingabe-Metastrichsegmente mit Metastrichsegmenten aus einem Wörterbuch von als Metastriche "geschriebenen" Wörtern und das Zuordnen eines Wahrscheinlichkeitswertes eines Übereinstimmungswertes für jedes so identifizierte Wort. Der zugeordnete Wert für die Wahrscheinlichkeit der Übereinstimmung wird als "Wortmaß" bezeichnet. Diese Technik umfaßt im einzelnen das Vergleichen der Eingabe mit jedem Wort in dem Wörterbuch, Metastrich für Metastrich, das Zuordnen einer Metastrichbewertung zu jeder Position, an der ein Metastrichübereinstimmung gefunden wurde, das Addieren der Bewertungen für die Metastrichübereinstimmungen für jedes so getestete Segment, um das Wortmaß zu erhalten, Anordnen der Wörter nach dem Wortmaß, indem die Wortmaße sowohl mit einem vorbestimmten Grenzwert als auch untereinander im Hinblick auf ihre Übereinstimmung verglichen werden, das Substituieren, Addieren und Löschen von Metastrichen in der Sequenz entweder gleichzeitig oder fortlaufend und dann das Vergleichen des so modifizierten Eingabe-Metastrichsegmentes mit dem Wörterbuch, um weitere Wortmaße zu erhalten, bis ein Wortmaß gefunden wurde, das den Grenzwertkriterien genügt. Wegen der unterschiedlichen Handschriften sind in jedem Wörterbuch normalerweise viele vordefinierte Metastrich-Beschreibungen ("Buchstabierungen") für jedes mögliche Wort abgelegt. Das erfindungsgemäße Verfahren umfaßt die Erkennung ganzer Wörter und nicht einzelner Buchstaben, wie von anderen vorgeschlagen worden ist. Anstelle des Durchsuchens, um ein handgeschriebenes Wort in einzelne Buchstaben zu zerlegen und anstelle des Suchens nach dem besten ersten Buchstaben, dann dem besten zweiten Buchstaben etc., macht die Erfindung von einem Verfahren des Berechnens von Rechenbewertungen der Übereinstimmungen Gebrauch. Für typische Metastrich-Sequenzen ist die Anzahl der möglichen Übereinstimmungen sehr groß und folglich umfaßt das erfindungsgemäße Verfahren das Addieren, Löschen und Substituieren, um sowohl den Umfang der Suche zu verringern als auch die Geschwindigkeit des Vergleichsverfahrens zu erhöhen.The method according to the invention and the device according to the invention for the Handwriting recognition makes of an intermediate description language for handwritten words Use composed of metastrokes. metastrokes are elements or sections of a stroke shape that are used to represent a line. A dash is a coherent Defines segment that starts when the stylus hits the surface of the Touches the digitizer's panels and that ends when the pen is lifted off the surface, the Dash contains one or more written letters. On Italic word can include one or more dashes, depending on whether the pen during of writing the word is lifted off the surface or not. According to the invention there are generally at least twenty meta lines required to have the necessary vocabulary or set of permissible elementary To form stroke shapes, though no less than seventy meta strokes can be used. additional Meta lines improve the recognition accuracy of the invention Cost of growing computing time. The techniques of interpretation the input metastroke segments as words includes comparing the input metastroke segments with meta segments from a dictionary of words "written" as meta lines and assigning a probability value to a match value for each so identified word. The associated match probability value is referred to as "word measure". This Technology includes specifically comparing the input with each word in the dictionary, Metastrich for Metastrich, assigning a metastrich rating to each position, at the one meta match was found adding the ratings for the metastick matches for each segment so tested to get word size, arranging the words according to the word measure, by the word measures both with a predetermined limit and with each other in terms of their agreement be compared, the substitution, addition and deletion of Meta strokes in the sequence either simultaneously or continuously and then comparing the input metastroke segment so modified with the dictionary, for more words to get until a word measure is found that meets the limit criteria. Because of the different Manuscripts are in every dictionary usually lots of predefined metastrich descriptions ("spellings") for each possible Word filed. The method according to the invention comprises the recognition of whole words and not single letters as suggested by others is. Instead of searching for a handwritten word in decompose individual letters and instead of looking for the best first letter, then the best second letter etc., makes the invention of a method of computing arithmetic scores of matches Use. For typical metastrich sequences the number of possible matches is very high big and therefore embraced the inventive method adding, deleting and substitute to both reduce the scope of the search as well as increasing the speed of the comparison process.
In einer besonderen Ausführungsform der Erfindung umfaßt die Erkennungseinrichtung eine digitalisierende Tastatur zur Eingabe von Signalen mit Werten, die eine Sequenz von Punkten in einem Koordinatensystem mit Indizien von einem Anfangs- und einem Endpunkt darstellen, und eine Verarbeitungseinrichtung zum Durchführen von verschiedenen Funktionen mit den Signalen, die in einer dedizierten Computereinrichtung oder in einer Datenvorverarbeitungseinrichtung eines computerunterstützten Systems eingeschlossen sein kann. Die Vorverarbeitungseinrichtung kann die folgenden Verfahren durchführen: Das Unterteilen der Sequenz der zwischen dem Anfangs- und dem Endpunkt liegenden Punkte in Prüfwörter, Zeichenfolgen oder Segment, das Unterscheiden zwischen dem Anfangspunkt eines Wortsegmentes und dem eines einzelnen Wortes, das Kombinieren der Wortsegmente zur Bildung vollständiger Wörter, das Festsetzen einer unteren Basislinie und einer oberen Basislinie für das Prüfwort, um die Größe und den Maßstab des Prüfwortes festzustellen, das Rekonstruieren des Prüfwortes als ein rekonstruiertes Wort mit einer Ersatzsequenz von Punkten, wobei interpolierte Punkte eingefügt und falsche Punkte gelöscht werden, das Lokalisieren und Tabellieren von kritischen Punkten in dem rekonstruierten Wort in sequentieller Reihenfolge, wobei die Punkte Maxima, Minima, Schnittpunkte, Punkte und Kreuzungspunkte umfassen, das Wiedereinsetzen des rekonstruierten Wortes mit einer Sequenz von Metastrichen, die dem erfindungsgemäßen Metastrich-Vokabular entspricht, wobei jeder Metastrich ein Element eines handgeschriebenen Schriftzeichens darstellt. Dieser Wiedereinsetzungsschritt kann im einzelnen das Vergleichen der kritischen Punkte mit Indizien von bekannten kritischen Punkten umfassen, um eine vorläufige Metastrich-Sequenz für jedes rekonstruierte Wort zu erhalten. Demgemäß basiert die Erfindung auf dem Auswählen von vielen der am besten passenden Übereinstimmungen in einer Wahrscheinlichkeitsreihenfolge aus den Einträgen in einem zusammengestellte Einträge aus bekannten Metastrich-Sequenzvarianten umfassenden Wörterbuch mittels einer Matrix der Übereinstimmungswahrscheinlichkeit der einzelnen Metastriche. Dieser Auswahlschritt kann das Auswählen eines bevorzugten Metastrichs an ausgewählten Positionen in Abhängigkeit von einer Maximalbewertungsberechnung umfassen. Es kann eine Analyse auf i) einer Vorwärtssequenz der Metastriche, ii) einer Rückwärtssequenz der Metastriche und iii) der am besten passenden Wortanfänge und gleichzeitig der am besten passenden Wortenden durchgeführt werden. Die Maximalbewertungsberechnung kann eine Analyse der Gewichtung der Ergebnisse, der Additionen, der Löschungen und der Substitutionen der Metastriche in bezug auf die benachbarten Metastriche umfassen. Die Ergebnisse werden bevorzugt in der Form eines, möglicherweise auch in der Form von mehreren Prüfwörtern auf der Grundlage einer Liste der am besten passenden Übereinstimmungen aus dem Wörterbuch an eine Ausgabeeinrichtung abgegeben. Normalerweise wird eine positive Erkennung eines einzelnen Prüfworts angezeigt, wenn die Wahrscheinlichkeit der Übereinstimmungsfigur der Wertigkeit einen vorbestimmten Grenzwert überschreitet.In a particular embodiment of the invention, the recognition device comprises a digitizing keyboard for entering signals with values that represent a sequence of points in a coordinate system with indications of a start and an end point, and a processing device for performing various functions with the signals, which can be included in a dedicated computer device or in a data preprocessing device of a computer-aided system. The preprocessor can perform the following methods: dividing the sequence of points between the start and end points into check words, strings or segments, distinguishing between the start point of a word segment and that of a single word, combining the word segments to form complete words , setting a lower baseline and an upper baseline for the test word to determine the size and scale of the test word deliver, the reconstruction of the test word as a reconstructed word with a replacement sequence of points, interpolated points being inserted and incorrect points being deleted, the localization and tabulation of critical points in the reconstructed word in sequential order, the points being maxima, minima, intersections, Dots and crossing points include the reinsertion of the reconstructed word with a sequence of metastrokes which corresponds to the metastrich vocabulary according to the invention, each metastank representing an element of a handwritten character. This reinsertion step can include comparing the critical points with evidence of known critical points to obtain a preliminary metastrich sequence for each reconstructed word. Accordingly, the invention is based on selecting many of the best-fitting matches in a probability order from the entries in a dictionary comprising compiled entries from known metastrich sequence variants by means of a matrix of the likelihood of matching of the individual metastrokes. This selection step can include the selection of a preferred meta line at selected positions depending on a maximum rating calculation. Analysis can be performed for i) a forward sequence of the meta dashes, ii) a backward sequence of the meta dashes, and iii) the most suitable word starts and at the same time the most suitable word ends. The maximum score calculation may include an analysis of the weighting of the results, additions, deletions and substitutions of the meta-ticks with respect to the neighboring meta-ticks. The results are preferably given to an output device in the form of one, possibly also in the form of several test words on the basis of a list of the most suitable matches from the dictionary. Normally, a positive recognition of a single check word is displayed if the probability of the correspondence figure of the significance exceeds a predetermined limit value.
In einer besonderen Ausführungsform kann das Verfahren das Messen der durchschnittlichen Neigung von Punktsequenzen jedes Prüfwortsegments und das Teilen des Prüfwortsegments entlang horizontaler Grenzen in eine mittlere Zone zwischen einer unteren und einer oberen Basislinie umfassen, wobei angenommen wird, daß sich die Körper der Buchstaben in einem oberen Bereich, in dem die Oberlängen der Buchstaben angenommen werden, und in einem unteren Bereich befinden, in dem die Unterlängen der Buchstaben angenommen werden. Diese Größeninformation unterstützt in Verbindung mit der durch die Identifikation der Metastriche erlangten Konturinformation das Wörterbuch darin, den Wert jedes Metastrichs an einer Position in einer Sequenz von akzeptablen Metastrichen in dem Wörterbuch zu bestimmen. Die Größeninformation ist auch als Teil der Korrelation gewichtet.In a special embodiment the method can measure the average slope of Dot sequences of each checkword segment and sharing the checkword segment along horizontal boundaries in a middle zone between one include lower and upper baseline, assuming that itself the body the letters in an upper area where the ascenders of the Letters are accepted and are in a lower area in which the descenders the letters are accepted. This size information supports in conjunction with the contour information obtained by identifying the metastrokes the dictionary in it, the value of each metastroke at one position in a sequence to determine acceptable metastrokes in the dictionary. The size information is also weighted as part of the correlation.
Unter Bezugnahme auf die nachfolgende detaillierte Beschreibung in Verbindung mit den zugehörigen Zeichnungen wird die Erfindung besser verständlich und weitere Details der Aspekte der Erfindung werden deutlich.Referring to the following detailed description in connection with the accompanying drawings the invention will be better understood and further details of aspects of the invention will become apparent.
FIGURENKURZBESCHREIBUNGBRIEF DESCRIPTION
BESCHREIBUNG DER BEVORZUGTEN AUSFÜHRUNGSFORMENDESCRIPTION OF THE PREFERRED EMBODIMENTS
Die innerprozessuale Speichereinrichtung
Die Einrichtung
Die Einrichtung
Die Einrichtung
Eine Metastrich-Erkennungseinrichtung
In der Tabelle von
ein
Strich mit einer breiten Unterbrechung,
ein "wild card" Strich, der alles
bedeuten kann,
ein allgemeiner horizontaler Strich,
ein
Maximalmerkmal,
ein Minimalmerkmal,
ein Winkel ohne Schleife,
ein
Strich mit einer schmalen Unterbrechung,
ein Punkt, der beispielsweise
eine Periode repräsentiert,
ein
Kreuzungspunkt,
ein rückwärts nach
oben gerichteter Bogen mit einem freien Ende am Bogenanfang,
ein
rückwärts nach
oben gerichteter Bogen mit einem freien Ende am Bogenende,
ein
rückwärts nach
oben gerichteter Bogen ohne freies Ende,
ein mit entgegen dem
Uhrzeigersinn gerichteten Strichen gezeichnetes umgekehrtes Gamma,
ein
mit entgegen dem Uhrzeigersinn gerichteten Strichen gezeichneter
Kreis,
ein mit einem im Uhrzeigersinn gerichteten Strich gezeichnetes
Gamma,
ein vorwärts
nach unten gerichteter Bogen ohne freies Ende,
ein vorwärts nach
unten gerichteter Bogen mit einem freien Ende am Anfang;
ein
vorwärts
nach unten gerichteter Bogen mit einem freien Ende an seinem Ende,
ein
vorwärts
nach oben gerichteter Bogen mit einem freien Ende an seinem Ende;
ein
vorwärts
nach oben gerichteter Bogen mit einem freien Ende an seinem Anfang,
ein
vorwärts
nach oben gerichteter Bogen ohne ein freies Ende,
ein im Uhrzeigersinn
gezeichnetes umgekehrtes Gamma,
ein im Uhrzeigersinn gezeichneter
Kreis,
ein im Uhrzeigersinn gezeichnetes Gamma,
ein rückwärts nach
unten gerichteter Bogen ohne ein freies Ende,
ein rückwärts nach
unten gerichteter Bogen mit einem freien Ende an seinem Anfang,
ein
rückwärts nach
unten gerichteter Bogen mit seinem freien Ende am Anfang,
irgendein
nach links gerichteter oder horizontaler Bogen,
irgendein nach
rechts gerichteter oder horizontaler Bogen,
eine allgemeine
vertikale Komponente,
ein allgemeiner Bogenabschnitt an dem
am weitesten links liegenden Ende von einem Segment, und
ein
nach unten gerichteter Bogen irgendeiner Richtung und ein Bogenabschnitt
am weitesten rechts liegenden Ende von irgendeinem Wortsegment.In the table of
a line with a wide break,
a "wild card" stroke that can mean anything
a general horizontal stroke,
a maximum feature,
a minimal feature,
an angle without a loop,
a line with a narrow break,
a point that represents a period, for example,
a crossing point,
a backward-facing sheet with a free end at the beginning of the sheet,
a backward-facing sheet with a free end at the end of the sheet,
a backward-facing sheet with no free end,
an inverted gamma drawn with counter-clockwise strokes,
a circle drawn with counter-clockwise strokes,
a gamma drawn with a clockwise line,
a forward-facing bow with no free end,
a forward-facing bow with a free end at the beginning;
a forward-facing bow with a free end at its end,
a forward upward arc with a free end at its end;
a forward-facing arc with a free end at the beginning,
a bow pointing upwards without a free end,
an inverted gamma drawn clockwise,
a clockwise drawn circle,
a clockwise drawn gamma,
a backward-facing bow without a free end,
a backward-facing bow with a free end at the beginning,
a backward-facing bow with its free end at the beginning,
any left or horizontal arc,
any right or horizontal arc,
a general vertical component,
a general arc section at the leftmost end of a segment, and
a downward arc of any direction and a right most arc portion of any segment of a word.
Die durch die Metastrich-Erkennungseinrichtung
Die auf Buchstaben basierende Analysatoreinrichtung
Die auf Buchstaben beruhende Analysatoreinrichtung
Die Ausgabe der Worterkennungseinrichtung
Danach werden die kritischen Punkte in der Sequenz von Punkten lokalisiert (Schritt G). Sowohl die kritischen Punkte, z.B. Maxima, Minima und Schnittpunkte, als auch die Reihenfolge der kritischen Punkte sind für die Identifikation der Metastriche und der Reihenfolge der Metastriche nützlich. Die kritischen Punkte werden dann zulässigen Vokabular-Metastrichen gegenübergestellt, um die Zeichenfolge der Eingabe-Metastriche zu identifizieren, die zum "Schreiben" eines Prüfwortes herangezogen werden (Schritt H). Schritt H wird für jeden kritischen Punkt des Eingabewortes so lange wiederholt, bis alle kritischen Punkte den Metastrichen gegenübergestellt wurden (Schritt I). Das Ergebnis ist eine Zeichenfolge von Eingabe-Metastrichen, die zum "Schreiben" des Prüfwortes benutzt wird. Die Metastrich-Zeichenfolge wird dann für die weitere Verarbeitung tabelliert (Schritt J).After that, the critical points localized in the sequence of points (step G). Both the critical Points, e.g. Maxima, minima and intersections, as well as the order of critical points are for the identification of the meta lines and the order of the meta lines useful. The critical points then become allowable vocabulary metastrokes faced, to identify the string of input meta dashes that for "writing" a test word can be used (step H). Step H is for everyone critical point of the input word is repeated until all critical points were compared to the metastrokes (step I). The result is a string of input metastrokes that to "write" the test word is used. The metastrich string is then for the further processing is tabulated (step J).
Zuerst wird ein "leeres" Wort erzeugt (Schritt K) und in einen Puffer (Schritt L) abgelegt. Ein "leeres" Wort ist ein "Null"-Satz, d.h. ein Wort, das alle Merkmale von Wörtern hat, aber keine Bedeutung hat. Es ist ein Platzhalter, so wie Null ein Platzhalter in einem initialisierten Speicherregister ist.First an "empty" word is created (step K) and into one Buffer (step L) filed. An "empty" word is a "zero" sentence, i.e. a word that has all the characteristics of words but no meaning Has. It is a placeholder, like zero a placeholder in one initialized memory register.
Der Inhalt des Wortpuffers wird dann getestet, um zu sehen, ob der Wortpuffer leer ist (Schritt M). Falls der Wortpuffer nicht leer ist, wird der nächste Eintrag (die das Prüfwort darstellende Zeichenfolge) aus dem Wortpuffer für die Auswertung gegenüber dem Wörterbuch herausgefunden (Schritt N). Dies findet immer dann statt, wenn eine Eingabezeichenfolge von dem Eingabegerät in dem Wortpuffer abgelegt ist. Unter Verwendung des Wörterverzeichnisses von ganzen Wörtern als Quelle, wird dann eine Liste von allen ("n") möglichen Wörtern kompiliert, die Prüfwörter sind, welche mit dem letzten aus dem Wortpuffer herausgefundenen Eintrag übereinstimmen (Schritt O). Die kompilierte Liste wird dann getestet, um sicher zu sein, daß diese nicht leer ist (Schritt P). (Die Liste kann am Anfang leer sein, wenn der oben erwähnte Test der kritischen Punkte durchgeführt worden ist und keine Übereinstimmungen gefunden wurden. Die Liste kann auch am Ende der auf ganzen Wörtern beruhenden Analyse leer sein, wenn die Liste verbraucht worden ist.) Nach dem Testen zur Bestimmung, daß diese Liste nicht leer ist, wird das "nächste" Vokabularwort in der Liste herausgefunden, um in der Analyse gegenüber dem herausgefundenen Eintrag, d.h. gegenüber dem aus dem Wortpuffer herausgefundenen Eingabeprüfwort, verwendet zu werden (Schritt Q). Das wiederaufgefundene Vokabularwort wird als ganzes Wort mit dem herausgefundenen Eingabeeintrag nach der Erfindung durch die nachfolgend erläuterten dynamischen Programmierungstechniken verglichen, aus denen ein "optimaler Kostenwert" oder eine Maximalbewertung abgeleitet wird, um den Grad der Übereinstimmung zwischen dem Eingabeprüfwort und dem Vokabelwort zu bestimmen (Schritt R). Die Schritte P bis R werden wiederholt, bis die Liste, erschöpft ist (Schritt P) oder bis die Maximalbewertung gewissen Akzeptabilitätskriterien genügt (Schritt S). Falls die Liste geleert ist, wird ein Signal "keine Übereinstimmung" ("no match" signal) erzeugt und der Prozeß wird fortgesetzt, indem nach dem nächsten Wort in dem Eingabewortpuffer Ausschau gehalten wird. Falls die Akzeptanzkriterien erfüllt sind, was auch immer für Akzeptanzkriterien dann anwendbar sind, wird das Wort an den Wortausgabepuffer (Schritt T) zur weiteren Verendung, z.B. zur Anzeige oder zur Verarbeitung abgegeben. Der Prozeß geht dann zu der nächsten Eingabe-Metastrichsequenz in dem Eingabepuffer über (Schritte K und L).The content of the word buffer is then tested to see if the word buffer is empty (step M). If the word buffer is not empty, the next entry (the character string representing the check word) is found from the word buffer for evaluation in relation to the dictionary (step N). This always takes place when an input string from the input device is stored in the word buffer. Using the dictionary of whole words as the source, a list of all ("n") possible words which are check words which match the last entry found from the word buffer is then compiled (step O). The compiled list is then tested to be sure that it is not empty (step P). (The list may be empty at the beginning when the above-mentioned critical point test has been performed and no matches have been found. The list may also be empty at the end of the whole-word analysis when the list has been used up.) After After testing to determine that this list is not empty, the "next" vocabulary word in the list is found to be used in the analysis against the found entry, ie against the input check word found from the word buffer (step Q). The retrieved vocabulary word is compared as a whole word with the input entry found according to the invention by the dynamic programming techniques explained below, from which an "optimal cost value" or a maximum evaluation is derived to determine the degree of correspondence between the input check word and the vocabulary word (step R). Steps P to R are repeated until the list is exhausted (step P) or until the maximum rating meets certain acceptability criteria (step S). If the list is cleared, a "no match" signal is generated and the process continues by looking for the next word in the input word buffer. If the acceptance criteria are met, whatever the acceptance criteria are then applicable, the word is sent to the word output buffer (step T) for further use, for example for display or processing. The process then proceeds to the next input metastroke sequence in the input buffer (steps K and L).
Der Schritt der Berechnung der optimalen Anpassung umfaßt zwei Eingaben: Die Eingabesequenz von Metastrichen, die eine Zeichenfolge für ein Wort bilden und das Muster oder die Zeichenfolge von ein bekanntes Wort darstellenden "Vokabular"-Metastrichen aus dem Wörterbuch. Jede Vokabularsequenz von Metastrichen beschreibt einen der zugelassenen Wege zur Wiedergabe eines Wortes. Die Daten zum Analysieren der optimalen Anpassung werden dann aus einer Merkmalkorrelationstabelle und einer Größenkorrelationstabelle extrahiert, wie nachfolgend beschrieben wird.The step of calculating the optimal Accommodation includes two inputs: the input sequence of meta dashes, which is a string for a Form word and the pattern or string from a known one Word representing "vocabulary" meta dashes from the dictionary. Each meta-stroke vocabulary sequence describes one of the permitted ones Ways to play a word. The data to analyze the optimal adjustment are then from a feature correlation table and a size correlation table extracted as described below.
Nur zur Veranschaulichung folgt ein
vereinfachtes Beispiel der Erkennungsprozedur für ganze Wörter. Falls das Wort "run" mit der Hand auf
ein Digitalisierungstableau geschrieben wird, besteht der erste
Schritt darin, eine Eingabe-Metastrichzeichenfolge zu konstruieren
oder eine Sequenz von ausgewählten
strichähnlichen
Ziffern, die auf zugelassenen Strichformen basieren, welche durch
die Analyse der kursiven Handschrift erhalten werden. Die Eingabe-Metastrichzeichenfolge
ist eher eine Serie von Metastrichen als von Punkten oder Buchstaben.
Das Vokabular der Metastriche für
diese Zeichenfolge ist auf eine festgelegte Anzahl von Wahlmöglichkeiten
begrenzt, z.B. auf 20, 30, 40 oder 50 verschiedene Strichformen.
Die obige
(Dies ist ein sehr einfaches Wörterbuch
mit zwei Wörtern
und sieben Zeichenfolgen.) Während
der Vergleich dadurch erfolgen kann, daß die Eingabe-Metastrichzeichenfolge
und jedes in Metastrichen buchstabierte Wort in dem Wörterverzeichnis
auf Übereinstimmung
hin geprüft
werden, Metastrich für
Metastrich, daß mit
einer Bewertung oder einem Wert jede Position festgehalten wird,
an der eine Übereinstimmung
zwischen den Eingabe-Metastrichen und den Vokabular-Metastrichen
festgestellt wird und daß die
Bewertungen für
die Metastrichübereinstimmungen
für jedes
auf diese Weise getestete Eingabe-Metastrichsegment dann addiert werden,
um für
jeden Eintrag ein "Wort"-Maß (Metrik)
(d.h. eine Übereinstimmungsbewertung)
zu erhalten, ist dieser Prozeß nicht
das, was entsprechend der bevorzugten Ausführungsform der Erfindung in
der Wortanalysatoreinrichtung
In der obigen Tabelle ergeben sich
aus dem vereinfachten Vergleichsverfahren die folgenden Ergebnisse
unter der Annahme, daß die
Maximalbewertungsberechnung eine einfache Summation der Gewichtungen
erlaubt und eine Maximalbewertung für eine einzelne Metastrich-Übereinstimmung
Der Bindestrich "–" tritt an der Stelle auf, an der eine Übereinstimmung mit dem Metastrich nicht vorliegt. Die als Metastriche buchstabierten Wörter sind normalerweise durch eine englischsprachige Definition zusammengefaßt, so daß der "Treffer" als ein englischsprachiges Wort mit einer Bewertung dargestellt (gelistet) wird, welche die höchste Bewertung von allen als Metastriche geschriebenen Wörtern in dieser Gruppe ist. Dies wird durch den Asterix "*" am linken Rand, siehe oben, angezeigt.The hyphen "-" occurs in the place on at which a match not available with the metastrich. Those spelled out as metastrokes words are usually summarized by an English language definition, so that the "hit" as an English language Word is shown (listed) with a rating, which the highest Rating of all words written as metastrokes in of this group. This is indicated by the asterix "*" on left margin, see above.
Die englischsprachigen Wörter, die Treffer sind, werden durch ihr höchstes Wortmaß klassifiziert, wobei dieses Maß zuerst normalisiert wird. Es ergibt sich: The English-language words that are hits are classified by their highest word size, which is normalized first. The result is:
Die normalisierten Wortmaße können in diesem vereinfachten Beispiel dann sowohl mit einem vorbestimmten Grenzwert verglichen werden, um die Akzeptabilität zu bestimmen, als auch untereinander im Hinblick auf ihre Übereinstimmung verglichen werden, um die "Verwirrung" zu bestimmen. Wenn festgestellt wird, daß das Wort akzeptabel ist, wird das Wort dann an einen Wortausgabepuffer ausgegeben. Wenn das Wortmaß den Grenzwert nicht überschreitet, wird das Eingabe-Metastrichsegment durch Substituieren, Addieren und Löschen der Metastriche aus der Liste der englischsprachigen Prüfwörter verändert.The normalized word measures can be in this simplified example then both with a predetermined Limit values are compared to determine acceptability, as well as among themselves in terms of their agreement be compared to determine the "confusion". If it is found that the Word is acceptable, the word is then sent to a word output buffer output. If the word measure the Limit does not exceed the input metastroke segment is substituted, added, and Clear changed the meta lines from the list of English-language test words.
Wenn in dem obigen Beispiel ein normalisiertes Maß von 0,77 den Grenzwert nicht überschritten hat, werden verschiedene Metastriche in der Eingabe-Metastrichzeichenfolge addiert, gelöscht oder substituiert, um zu versuchen, eine bessere Übereinstimmung mit einer bekannten Zeichenfolge in dem Wörterverzeichnis zu erhalten und es wird ein weiterer Vergleich mit dem Wort aus dem Wörterverzeichnis gemacht. Additionen und Löschungen werden durch negative Gewichtungen gekennzeichnet, während Substitutionen durch positive Gewichtungen in Abhängigkeit von der "Richtung" und Position der Substitutionen gekennzeichnet werden. Wenn der letzte Metastrich des Eingabesegmentes gelöscht wird, nimmt das normalisierte Maß der ersten "Definition" von "run" von 0,77 auf 0,83 zu, wobei es möglicherweise einen vorbestimmten Grenzwert trifft.If in the example above a normalized Measure of 0.77 does not exceed the limit has different meta-strokes in the input meta-string added, deleted or substituted to try to get a better match with a known string in the dictionary and it becomes another comparison with the word from the dictionary made. Additions and deletions are characterized by negative weights during substitutions through positive weightings depending on the "direction" and position of the Substitutions are marked. If the last metastrich of the input segment deleted the normalized measure of the first "definition" of "run" increases from 0.77 to 0.83 to where it may be meets a predetermined limit.
Die
Wie oben angegeben ist, kann das
Wörterverzeichnis
infolge der Unterschiede in den möglichen Handschriftarten zahlreiche
Metastrich-"Schreibweisen" für ein einzelnes
Wort haben. In diesem Beispiel wird angenommen, daß es nur
eine Schreibweise von "may" in dem Wörterverzeichnis
gibt, wie in
Um festzustellen, ob die Wörterbuchschreibweise von "may" als mit der Eingabesequenz übereinstimmend angesehen wird, wird eine Wortkorrelationstabelle geschaffen, die als Ganzes die Eingabe-Metastrichzeichenfolge mit jeder Vokabular-Metastrichzeichenfolge vergleicht, welche für eine Übereinstimmung in Frage kommt. Als eine Folge des erfindungsgemäßen Verfahrens, und ein Wortmaß (d.h. ein durch die Wahrscheinlichkeit einer existierenden Übereinstimmung definierter Wert) und ein optimaler "Pfad" durch die Sequenz der Metastrich-Ergebnisse, aber nur nachdem die Verarbeitung der ganzen Metastrichzeichenfolge beendet ist. Je größer das Wortmaß ist, desto größer ist die Übereinstimmung.To determine whether the dictionary spelling of "may" is considered to match the input sequence, a word correlation table is created that, as a whole, compares the input meta-string to any vocabulary meta-string that is matched. As a consequence of the method according to the invention, and a word measure (ie a value defined by the probability of an existing match) and an optimal "path" through the sequence of the metastrich results, but only after the processing of the entire metastrich string has ended. ever the larger the word size, the greater the match.
Eingabe-Metastrich-Additionen und
Löschungen
sind gemäß der Erfindung
zulässig,
obwohl mit jeder eine Erschwerung verbunden ist.
Die Wortkorrelationstabelle von
Die Technik zum Interpretieren der Eingabe-Metastrichzeichenfolge als ein Wort ist unkompliziert, aber erfordert eine umfangreiche Programmierung. In dem dynamischen Programmierungsversuch werden Vergleichs-, Gewichtungs- und Modifizierungsverfahren gleichzeitig ausgeführt. Der Prozeß entspricht dem "Schlängeln" eines "Wurms", um zu sehen, ob dieser auf die Gestalt von "Musterwürmern" ausgerichtet werden kann. Die Additionen, Löschungen und Substitutionen führen dazu, daß sich der Wurm schlängelt. Jede Aktion resultiert in einer Gewichtung oder einer Erschwerung.The technique for interpreting the Input meta-string as a word is straightforward, but requires extensive programming. In the dynamic programming attempt are comparison, weighting and modification methods at the same time executed. The process corresponds the "snake" of a "worm" to see if these are aligned to the shape of "model worms" can. The additions, deletions and lead substitutions to the fact that the worm meanders. Each action results in weighting or aggravation.
Die Schritte der dynamischen Programmierungstechnik umfassen einen Prozeß, in dem eine ganze Metastrich-Zeichenfolge mit allen relevanten Metastrich-Zeichenfolgen in einem Wörterbuch von Wörtern verglichen werden, die als Metastriche "geschrieben" werden, um einen Pfad für die Transformation der Eingabezeichenfolge in eine der Wörterbuch-Metastrichzeichenfolgen aufzubauen und in dem ein Maximalwert oder sogenannte "optimale Kosten" ("optimal cost") bestimmt werden, um die ganze Eingabe-Metastrichzeichenfolge gegenüber jeder Vokabular-Metastrichzeichenfolge zu verarbeiten. Theoretisch kann die gesamte Eingabe-Metastrichzeichenfolge gegenüber allen Zeichenfolgen in dem Wörterbuch verarbeitet werden. Es werden aber normalerweise gewisse beschleunigende Schritte ausgeführt, um den Prozeß zu beschleunigen. (Um den Prozeß zu beschleunigen, brauchen nicht alle Wörterbucheinträge geprüft zu werden, obgleich die Techniken, den Prozeß auf diese Weise zu begrenzen, nicht ein Teil dieses Aspekts der Erfindung sind. Diese Optimierungstechniken nutzen die Merkmale des Wörterbuchs aus. Das Wörterbuch kann z.B. durch eine Anzahl von Strichen ausgebildet sein, oder es kann durch Metastriche "alphabetisiert" sein. Die Auswertung kann auf einer vorwärts gerichteten Metastrichsequenz erfolgen, auf einer entgegengesetzt gerichteten Metastrichsequenz, auf den am besten passenden Wortanfängen und den am besten passenden Wortendungen.) Wie zuvor beschrieben worden ist, umfaßt das Wörterbuch eine "Definition", ein englischsprachiges Wort (oder ein Wort in einer anderen Sprache), das in romanischen Schriftzeichen, d.h. den romanischen Schriftzeichen entsprechenden ASCII-Zeichenfolgen geschrieben ist, was das einzige zu erkennende Wort ist. Folglich gibt es verschiedene Wörterbucheinträge mit derselben "Definition", um den Variationen in der Handschrift Rechnung zu tragen.The steps of dynamic programming technology involve a process in which a whole metastrich string with all relevant metastrich strings in a dictionary of words be compared, which are "written" as metastrokes to a path for the transformation the input string into one of the dictionary meta-strings to build up and in which a maximum value or so-called "optimal cost" ("optimal cost") are determined, around the whole input metastroke string to everyone Process vocabulary meta-string. Theoretically can the entire input meta-string against all strings in the dictionary are processed. But there are usually certain accelerating ones Steps performed to the process too accelerate. (To the process speed up, not all dictionary entries need to be checked, although the techniques to limit the process in this way are not part of this aspect of the invention. These optimization techniques take advantage of the features of the dictionary out. The dictionary can e.g. be formed by a number of lines, or it can be "alphabetized" by meta dashes. The evaluation can on a forward directed metastrich sequence are done on an opposite directed metastroke sequence, on the most appropriate word starts and the most suitable word endings.) As described above is included the dictionary a "definition", an English language Word (or a word in another language) that is in Romance Characters, i.e. corresponding to the Roman characters ASCII strings are written, which is the only thing to be recognized Word is. As a result, there are different dictionary entries with the same "definition" to accommodate the variations to take into account in the manuscript.
Die Metastrich-Merkmalkorrelationsmatrix
(d.h. die Daten für
die Transformation von allen Metastrichen in andere) wird als integraler
Bestandteil, wie
Zur Veranschaulichung wird auf
Für die Einfügungen oder Additionen: For the insertions or additions:
Für
die Löschungen: worin:
a1j
i der "Kostenwert" (der in dem Vokabular
des dynamischen Programmierens benutzt wird) oder die kumulative
Bewertung in Element (i, j) für
das Passieren vom Ursprung über
Element (i – 1,
j – 1)
ist, indem der Eingabe-Metastrich "b" in
der Spaltenposition (j) durch den Vokabular-Metastrich "a" in der Reihenposition (i) ersetzt wird
(
p(ai,bj) ein (aus
q(aj,bj) der (aus der
Größenkorrelationstabelle
gewonnene,
α2 der "Kostenwert" oder die kumulative
Bewertung für
das Passieren vom Ursprung über
Element (i – 1,
j) nach Element (i, j) ist, indem der Vokabular-Metastrich "a" in der Zeilenposition (i) nach dem
Eingabe-Metastrich "b" in Spaltenposition
(j) eingefügt
wird;
α3
der "Kostenwert" für die kumulative
Bewertung zum Passieren vom Ursprung über Element (i, j – 1) nach Element
(i, j) ist, indem der Eingabe-Metastrich "b" in
Spalte (j) entlang einer Sequenz von Metastrichen gelöscht wird;
p(ai) ein Erschwerungswert (aus
q(ai) der Erschwerungswert
für die
der vorhergehenden Einfügung
zugeordneten Größe ist (
p(bj)
ein Erschwerungswert (aus
q(bj) ein Erschwerungswert für die der vorgehenden Löschung zugeordneten
Größe ist (
a1 j i is the "cost value" (used in the dynamic programming vocabulary) or the cumulative rating in element (i, j) for passing from the origin over element (i - 1, j - 1) by input -Metal dash "b" in the column position (j) is replaced by the vocabulary meta dash "a" in the row position (i) (
p (a i , b j ) on (off
q (a j , b j ) the (obtained from the size correlation table
α2 is the "cost value" or the cumulative rating for passing from the origin via element (i - 1, j) to element (i, j), in that the vocabulary metastroke "a" in the line position (i) after the input - Meta dash "b" is inserted in column position (j);
α3 is the "cost value" for the cumulative rating to pass from the origin via element (i, j-1) to element (i, j) by deleting the input meta-dash "b" in column (j) along a sequence of meta-dashes becomes;
p (a i ) an aggravation value (from
q (a i ) is the aggravation value for the size associated with the previous insertion (
p (b j ) an aggravation value (from
q (b j ) is an aggravation value for the size associated with the previous deletion (
Die bevorzugte Metastrich-Zeichenfolge
in jeder Zelle (i, j) ist der maximale kumulative Bewertungswert
Alpha (α)
in Zelle (i, j), die aus dem ersten kumulativen Bewertungswert (α1), dem zweiten
kumulativen Bewertungswert (α2)
und dem dritten kumulativen Bewertungswert (α3) ausgewählt wird. Diese Maximalbewertung
in jeder Zelle stellt die "optimalen
Kosten" in dieser
Zelle entlang irgendeinem Pfad von dem Ursprung in der Wortkorrelationstabelle
von
Ein besonderes Beispiel kann hilfreich
sein. Es sei auf das Element in Zeile i = 4, Spalte j = 4 in
Zum Berechnen von α1, wird Gleichung
[1] herangezogen. Aus der Überprüfung der
benachbarten diagonalen Zelle (
Zum Berechnen von 2 wird Gleichung
[2] zum Einsetzen herangezogen. Aus der benachbarten Zeile oberhalb
der Zelle (
Zum Berechnen von a3, wird Gleichung
[3] zum Einsetzen herangezogen. Aus der benachbarten links von Zelle
(
Dieses Verfahren wird für jede Zelle
der Wortkorrelationstabelle durchgeführt. Für jede Zelle wird das Maximum α von der
Substitution, Addition und Löschung
benutzt. Wenn die Wortkorrelationstabelle berechnet wird, wird der
Pfad zu jeder Zelle von der benachbarten Zelle, was die Maximalbewertung
ergibt, tabelliert. Am Ende des Verfahrens können die Pfade von jeder Zelle
(z.B. von der rechten Grenze oder unteren Grenze) zu dem Ursprung
(
Mit dem erfindungsgemäßen System können Wörter, die kursiv mit der Hand geschrieben werden, mit großer Wahrscheinlich erkannt werden. In dem System ist eine genügende Redundanz vorgesehen, das mit einer angemessenen Wahrscheinlichkeit selbst Wörter erkannt werden können, die in einer schlechten Handschrift mit fehlenden Buchstaben und Schreibfehlern geschrieben sind.With the system according to the invention can words, that are written in italics by hand, most likely be recognized. There is sufficient redundancy in the system, that with a reasonable probability even recognized words can be those in poor handwriting with missing letters and Misspellings are written.
Die Erfindung wird nachfolgend unter Bezugnahme auf bevorzugte Ausführungsformeln erläutert. Andere Ausführungsformen können von den Fachleuten daraus abgeleitet werden.The invention is described below Reference to preferred embodiments explained. Other embodiments can derived from it by the experts.
Claims (20)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE4345583A DE4345583B4 (en) | 1992-09-24 | 1993-08-26 | Cursive handwritten word recognition from sequential input information - using construction word correlation tables to select strings of vocabulary metastrokes corresponding to candidate word and identifies most likely match |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US954351 | 1992-09-24 | ||
US07/954,351 US5313527A (en) | 1991-06-07 | 1992-09-24 | Method and apparatus for recognizing cursive writing from sequential input information |
DE4345583A DE4345583B4 (en) | 1992-09-24 | 1993-08-26 | Cursive handwritten word recognition from sequential input information - using construction word correlation tables to select strings of vocabulary metastrokes corresponding to candidate word and identifies most likely match |
PCT/US1993/008024 WO1994007214A1 (en) | 1992-09-24 | 1993-08-26 | Method and apparatus for recognizing cursive writing from sequential input information |
Publications (1)
Publication Number | Publication Date |
---|---|
DE4394624B4 true DE4394624B4 (en) | 2004-08-12 |
Family
ID=32714433
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE4394624A Expired - Lifetime DE4394624B4 (en) | 1992-09-24 | 1993-08-26 | Cursive handwritten word recognition from sequential input information - using construction word correlation tables to select strings of vocabulary metastrokes corresponding to candidate word and identifies most likely match |
Country Status (1)
Country | Link |
---|---|
DE (1) | DE4394624B4 (en) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2087616A (en) * | 1980-01-08 | 1982-05-26 | Nat Res Dev | Apparatus and Method for Generating an Alpha Numeric Output from Shorthand |
US4718102A (en) * | 1983-01-19 | 1988-01-05 | Communication Intelligence Corporation | Process and apparatus involving pattern recognition |
US5140645A (en) * | 1987-10-08 | 1992-08-18 | Whitaker Ranald O | Computer compatible character for reliable reading by photoreader |
-
1993
- 1993-08-26 DE DE4394624A patent/DE4394624B4/en not_active Expired - Lifetime
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2087616A (en) * | 1980-01-08 | 1982-05-26 | Nat Res Dev | Apparatus and Method for Generating an Alpha Numeric Output from Shorthand |
US4718102A (en) * | 1983-01-19 | 1988-01-05 | Communication Intelligence Corporation | Process and apparatus involving pattern recognition |
US5140645A (en) * | 1987-10-08 | 1992-08-18 | Whitaker Ranald O | Computer compatible character for reliable reading by photoreader |
Non-Patent Citations (4)
Title |
---|
EHRICH, KOEHLER: "Experiments in the Contextual Recognition of Cursive Script" IEEE Transactions on Computer, Vol. C-24, Nr. 2,Feb. 1975,S.182-194 * |
IMAM, I.: "A computerized transcrip- tion system for cursive shorthand writing" Southeastcon '88, IEEE Conference Proceedings, 11-13. Apr. 1988, Pages: 336-339 * |
KAMEL, K. * |
KAMEL, K.; IMAM, I.: "A computerized transcrip- tion system for cursive shorthand writing" Southeastcon '88, IEEE Conference Proceedings, 11-13. Apr. 1988, Pages: 336-339 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE60224128T2 (en) | Apparatus and method for recognizing characters and mathematical expressions | |
DE69730930T2 (en) | Method and device for character recognition | |
EP1665132B1 (en) | Method and system for collecting data from a plurality of machine readable documents | |
DE69333431T2 (en) | Method for recognizing handwritten symbols | |
DE19547812C2 (en) | Character string reader | |
DE60204005T2 (en) | METHOD AND DEVICE FOR RECOGNIZING A HANDWRITTEN PATTERN | |
DE69829074T2 (en) | IDENTIFICATION OF LANGUAGE AND SYMBOLS FROM TEXT-REPRESENTATIVE DATA | |
DE3926327C2 (en) | Method and system for recognizing characters on a medium | |
DE112012003640B4 (en) | Generating a rhythmic password and performing authentication based on the rhythmic password | |
Munson | Experiments in the recognition of hand-printed text, part I: character recognition | |
DE60217299T2 (en) | HOLISTIC-ANALYTICAL DETECTION OF HAND-WRITTEN TEXT | |
DE60225170T2 (en) | METHOD AND DEVICE FOR DECODING HANDWRITCH SIGNS | |
US5313527A (en) | Method and apparatus for recognizing cursive writing from sequential input information | |
DE19705757C2 (en) | Method for recognizing an input pattern and for generating a database and character recognition system | |
DE2640537A1 (en) | METHOD AND DEVICE FOR DISTINCTIONING BETWEEN N LARGER THAN 2 CHARACTERS BELONGING TO ALPHABETS | |
DE102011079443A1 (en) | Learning weights of typed font fonts in handwriting keyword retrieval | |
DE102018006481A1 (en) | Use of deep learning techniques to determine a contextual reading order in a document | |
DE112010005297T5 (en) | Search device and search program | |
EP1671262B1 (en) | Method and system for acquiring data from machine-readable documents | |
CN110178139A (en) | Use the system and method for the character recognition of the full convolutional neural networks with attention mechanism | |
Springmann et al. | Automatic quality evaluation and (semi-) automatic improvement of OCR models for historical printings | |
DE60031502T2 (en) | Method and device for determining the type of a form | |
DE2435889B2 (en) | METHOD AND DEVICE FOR DISTINCTIONING GROUPS OF CHARACTERS | |
WO2008074477A1 (en) | Device, method and computer program for identifying characters in an image | |
DE202023104138U1 (en) | Handwriting text recognition device with support for multiple writing directions |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8127 | New person/name/address of the applicant |
Owner name: VADEM, SAN JOSE, CALIF., US |
|
8110 | Request for examination paragraph 44 | ||
8127 | New person/name/address of the applicant |
Owner name: MICROSOFT CORP., REDMOND, WASH., US |
|
8172 | Supplementary division/partition in: |
Ref document number: 4345583 Country of ref document: DE Kind code of ref document: P |
|
Q171 | Divided out to: |
Ref document number: 4345583 Country of ref document: DE Kind code of ref document: P |
|
8364 | No opposition during term of opposition | ||
R071 | Expiry of right |