DE10308550A1 - System und Verfahren zur automatischen Daten-Prüfung und -Korrektur - Google Patents

System und Verfahren zur automatischen Daten-Prüfung und -Korrektur

Info

Publication number
DE10308550A1
DE10308550A1 DE10308550A DE10308550A DE10308550A1 DE 10308550 A1 DE10308550 A1 DE 10308550A1 DE 10308550 A DE10308550 A DE 10308550A DE 10308550 A DE10308550 A DE 10308550A DE 10308550 A1 DE10308550 A1 DE 10308550A1
Authority
DE
Germany
Prior art keywords
attribute
attribute values
attributes
attribute value
elements
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE10308550A
Other languages
English (en)
Inventor
Steven J Simske
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HP Inc
Original Assignee
Hewlett Packard Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hewlett Packard Co filed Critical Hewlett Packard Co
Publication of DE10308550A1 publication Critical patent/DE10308550A1/de
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/232Orthographic correction, e.g. spell checking or vowelisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Abstract

Ein Verfahren zur automatischen Daten-Prüfung und -Korrektur weist die Schritte des Empfanges einer Texteingabe und des Zuordnens von zumindest einem Datentwert in der Texteingabe zu zumindest einem jeweiligen Element und Attribut in der Texteingabe auf. Das Verfahren weist ferner die Schritte des Vergleichens des zumindest einen Attributwerts aus der Texteingabe mit zumindest einem Attributwert auf, der in einer Datenbank für das jeweilige Element und Attribut gespeichert ist, und das Ersetzen des zumindest einen Attributwerts in der Texteingabe durch den gespeicherten Atrributwert auf, ansprechend darauf, daß sich der zumindest eine Attributwert von dem jeweiligen gespeicherten Attributwert unterscheidet. Ein System zum Durchführen desselben wird ebenfalls beschrieben.

Description

  • Die vorliegende Erfindung bezieht sich allgemein auf das Gebiet von Computern und Computersoftware und insbesondere auf ein System und ein Verfahren für eine automatische Daten-Prüfung und -Korrektur.
  • Geschwindigkeit und Effizienz sind Charakteristika, die durch heutige Unternehmen und Unternehmensangestellte geschätzt werden, um eine sogar noch höhere Produktivität zu erreichen. Ein Großteil dessen, was heutige Angestellte durchführen, umfaßt Tatsachen und Daten. Informationen werden gesammelt, eingegeben, verarbeitet, analysiert, weitergeleitet, neu formatiert und erneut mit hoher Geschwindigkeit verbreitet.
  • Momentan bietet eine Textverarbeitungssoftware eine automatische Rechtschreib- und Grammatik-Prüfung und -Korrektur. Wenn der Benutzer Text in ein Dokument eingibt, werden falsch geschriebene Wörter und grammatikalisch inkorrekte Phrasen oder Sätze hervorgehoben. Ferner kann der Benutzer das Programm konfigurieren, um korrigierte Wörter während des Betriebs (on the fly) durch üblicherweise falsch eingegebene Wörter zu ersetzen. Diese Merkmale helfen dabei, die Effizienz des Benutzers zu verbessern, durch automatisches Bereitstellen von Rechtschreib- und Grammatik-Korrekturen und somit durch Beseitiger des Bedarfs des Benutzers, die Wörter und Grammatikregeln manuell nachzuschlagen.
  • Es ist die Aufgabe der vorliegenden Erfindung, ein Verfahren und ein System zur automatischen Daten-Prüfung und -Korrektur und ein Verfahren zur automatischen Sachdatenlieferung an das Desktop mit verbesserten Charakteristika zu schaffen.
  • Diese Aufgabe wird durch ein System und ein Verfahren zur automatischen Daten-Prüfung und -Korrektur gemäß Anspruch 1 und 19 und durch ein Verfahren zur automatischen Sachdatenlieferung an das Desktop gemäß Anspruch 11 gelöst.
  • Gemäß einem Ausführungsbeispiel der vorliegenden Erfindung weist ein Verfahren zur automatischen Daten-Prüfung und - Korrektur das Empfangen einer Texteingabe und das Zuc>rdnen von zumindest einem Attributwert in der Texteingabe zu einem jeweiligen zumindest einen Element und Attribut in der Texteingabe auf. Das Verfahren weist ferner das Vergleichen des zumindest einen Attributwerts aus der Texteingabe mit zumindest einem Attributwert auf, der in der Datenbank für das jeweilige Element und Attribut gespeichert ist, und das Ersetzen des zumindest einen Attributwerts in der Texteingabe durch den gespeicherten Attributwert, ansprechend darauf, daß der zumindest eine Attributwert unterschiedlich von dem zumindest einen jeweiligen gespeicherten Attributwert ist.
  • Gemäß einem anderen Ausführungsbeispiel der Erfindung weist ein Verfahren der automatischen Sachdatenlieferung zu dem Desktop das Empfangen einer Texteingabe, und das Zuordnen des zumindest einen Attributwerts in der Texteingabe zu einem jeweiligen mindestens einen Element und Attribut in der Texteingabe auf. Das Verfahren weist ferner das Abfragen einer Datenbank im Hinblick auf den zumindest einen Attributwert, der dem zumindest einen Element und Attribut zugeordnet ist, und das Wiedergewinnen des zumindest einen abgefragten Attributwerts auf. Der zumindest eine Attributwert aus der Texteingabe wird mit dem zumindest einen Attributwert verglichen, der aus der Datenbank für das jeweilige Element und Attribut wiedergewonnen wird. Der zumindest eine Attributwert in der Texteingabe wird dann durch den zumindest einen gespeicherten Attributwert ersetzt, wenn sich der zumindest eine Attributwert von dem jeweiligen wiedergewonnenen Attributwert unterscheidet.
  • Gemäß einem wiederum anderen Ausführungsbeispiel der vorliegenden Erfindung weist ein System zur automatischen Daten-Prüfung und -Korrektur ein computerlesbares Medium auf, das auf demselben einen codierten Prozeß aufweist. Der Prozeß ist wirksam, um eine Eingabe zu empfangen und Attributwerte in der Eingabe mit Attributwerten zu vergleichen, die in einer Datenbank für jeweilige Elemente und Attribute gespeichert sind, und um die Attributwerte in der Eingabe durch gespeicherte Attributwerte zu ersetzen, wenn siclt die Attributwerte von den jeweiligen gespeicherten Attributwerten unterscheiden.
  • Bevorzugte Ausführungsbeispiele der vorliegenden Erfindung werden nachfolgend Bezug nehmend auf die beiliegenden Zeichnungen näher erläutert. Es zeigen:
  • Fig. 1 ein vereinfachtes Blockdiagramm eines Ausführungsbeispiels eines Systems für eine automatische Daten-Prüfung und -Korrektur gemäß der vorliegenden Erfindung;
  • Fig. 2 ein Flußdiagramm eines Ausführungsbeispiels eines Datensammlungsprozesses gemäß den Lehren der vorliegenden Erfindung;
  • Fig. 3 ein Flußdiagramm eines Ausführungsbeispiels eines Datenautokorrekturprozesses gemäß den Lehren der vorliegenden Erfindung; und
  • Fig. 4 eine graphische Darstellung eines exemplarischen Aufklapp-Benachrichtigungsfensters gemäß den Lehren der vorliegenden Erfindung.
  • Das bevorzugte Ausführungsbeispiel der vorliegenden Erfindung und dessen Vorteile sind am besten durch Bezugnahme auf die Fig. 1 bis 4 der Zeichnungen verständlich, wobei gleiche Bezugszeichen für gleiche und entsprechende Teile der verschiedenen Zeichnungen verwendet werden.
  • Fig. 1 ist ein vereinfachtes Blockdiagramm eines Systems zur automatischen Daten-Prüfung und -Korrektur 10 gemäß einem Ausführungsbeispiel der vorliegenden Erfindung. Das automatische Daten-Prüfungs- und Korrektur-System 10 kann einen oder mehrere Computer 12 und 14 aufweisen, die eine oder mehrere Softwareanwendungen ausführen, wie z. B. Webbrowseranwendungen, Applets, Textverarbeitungsanwendungen und andere herkömmliche Software, bei der Textdaten empfangen, angezeigt, oder anderweitig auf eine bestimmte Weise verarbeitet werden. Zu derartigen Softwareanwendungen wird ein neues Merkmal hinzugefügt, das eine automatische Daten-Prüfung und -Korrektur gemäß den Lehren der vorliegenden Erfindung ausführt. Das Daten-Prüfungs- und Korrektur-Merkmal der vorliegenden Erfindung kann in der Form einer Einsteckanwendung implementiert sein oder einfach ein einstückiger Teil der Softwareanwendungen sein, die Text verarbeiten. Daten, die als sachlich betrachtet werden und verwendet werden, um eine Daten-Prüfung und -Korrektur auszuführen, können in einer Speicherdatenbank 16 gespeichert sein, die gemeinsam mit dem Computer 14 (wie gezeigt ist) angeordnet ist, oder in einem Speicher oder einer Datenbank 20, die entfernt von demselben angeordnet ist. Ein Computernetzwerk 17 liefert die Konnektivität zwischen den Computern 12 und 14 und entfernten Computerservern 18 und Sachdatenbanken 20, die denselben zugeordnet sind. Das Computernetzwerk 17 kann eines oder mehrere Netzwerke umfassen, wie z. B. lokale Netze, Intranetzwerke, Extranetzwerke und auch das Internet, das eine weitere Konnektivität zu dem World Wide Web liefert. Ferner können die Computer 12 und 14 Rechenvorrichtungen sein, die in der Ausführungsleistung in dem Bereich von z. B. persönlichen digitalen Assistenten, Laptops, Personalcomputern, Arbeitsstationen, etc. liegen.
  • Fig. 2 ist ein Flußdiagramm eines Ausführungsbeispiels eines Datensammlungsprozesses 26 gemäß den Lehren der vorliegenden Erfindung. Der Datensammlungsprozeß 26 kann durch Empfangen eines einheitlichen Webseiten-Ressourcenlokalisierers (URL) von einer spezifischen Datei oder von einem Benutzer beginnen, wie bei Block 28 gezeigt ist. Die spezifizierte Website wurde vorangehend als eine Quelle von Sachdaten identifiziert. Der Prozeß 26 liest dann die Daten aus der identifizierten Website, wie bei Block 30 gezeigt ist. Die Schritte 28 und 30 sind als ein Beispiel einer Datenquelle bereitgestellt. Alternativ können Daten aus einer spezifizierten Datei erhalten werden, die an einer gemeinsam angeordneten Datenbank 16 oder einer entfernten Datenbank 20 angeordnet ist. Die Daten, die auf diese Weise erhalten werden, können sich in einem spezifischen Format befinden, wie z. B. einer XML (eXtensible Markup Language), einem Datenbankformat oder einem anderen geeigneten Format. Die Daten können ferner in einem formatierten oder unformatierten Text oder einem ASCII-Format (American Standard Code for Information Interchange) vorliegen. Andere mögliche Datenquellen umfassen Telefon- und Adreß-Verzeichnisse, Enzyklopädien, medizinische Referenzbücher, pharmazeutische Referenzbücher, Biographien, Autobiographien, Textlaücher etc. Bei Block 32 werden die Daten empfangen und als ein Element, ein Attribut oder ein Wert identifiziert. Wenn die Daten jedoch in einem spezifischen und strukturierten Format empfangen werden, wie z. B. einer XML oder einem Datenbankformat, wie z. B. einem relationalen Datenbankformat oder einem Tabellenkalkulationsformat, können die Daten als solches einfach identifiziert werden. Wenn die Daten jedoch als formatierter oder unformatierter Text empfangen werden, kann eine Textverarbeitung durchgeführt werden, um Teile des Gesprochenen oder des Textes zu etikettieren oder zu identifizieren. Dieser Schritt wird nachfolgend detaillierter in Verbindung mit dem Datenautokorrekturprozeß erörtert, der in Fig. 3 gezeigt ist. Bei Block 34 werden die Daten dann in eine spezifische Darstellung umgewandelt, wie z. B. XML oder eine andere SGML-basierte Darstellung (SGML Standard Generalized Markup Language). Die Daten werden dann in einer entfernten oder gemeinsam angeordneten Datenbank gespeichert, wie bei Block 36 gezeigt ist. Der Prozeß endet bei Block 38.
  • Die Daten können z. B. in einem Format gespeichert werden, das einfach für eine Element-/Attribut-/Wert-Struktur verwendet werden kann. Die Daten können anfänglich etikettiert und auf diese Weise gespeichert werden:


  • Nachfolgend können die Daten in einer exemplarischen Element-, Attribut-, Attributwert-Datenstruktur gespeichert werden:


  • Die oben gezeigte Tabellenform ist lediglich zu darstellenden Zwecken. Die XML-Darstellung für die obigen Daten kann wie folgt lauten:


  • Das Element-/Attribut-/Wert-Format ist flexibel und kann einfach erweitert werden, um den Großteil von Sachmustern abzudecken. Die Struktur kann z. B. auf historische und konditionale Tatsachen erweitert werden, sowie um. Element/Attribut/Wert, das keine Eins-Zu-Eins-Abbildung ist. Ein Beispiel davon ist:


  • Die obigen Daten sind einem Datum zugeordnet, um einen Zeitrahmen auf die Daten zu legen. Ferner, da Bolivien zwei Hauptstädte hat, werden beide Attributwerte aufgelistet, wenn der Zustand "Alle" ist. Eine derartige Struktur kann leicht erweitert werden, um zusätzliche Attribute und Attributwerte zu umfassen und Attribute und Attributwerte zu verschachteln. Zum Beispiel:




  • Fig. 3 ist ein Flußdiagramm eines Ausführungsbeispiels eines Datenautokorrekturprozesses 40 gemäß den Lehren der vorliegenden Erfindung. Der Prozeß 40 empfängt Text von einer Quelle, wie z. B. ein Dokument von einer Textverarbeitungsanwendung, Tastendrücke und Zeigevorrichtungseingabe eines Benutzers, eine E-Mail-Nachricht von einer E-Mail- Anwendung, eine Website von einem Browser, eine Datertdatei von einem Verzeichnis oder eine andere Form eines Dokuments, wie bei Block 42 gezeigt ist. Der Prozeß 40 analysiert dann die Daten und etikettiert die Teile des Gesprochenen, um die grammatikalische Rolle und Teile des Gesprochenen zu identifizieren, wie z. B. Nomen, Verb, Adjektiv, Adverb etc., wie bei Block 44 gezeigt ist. Die meisten Gesprächsteil-Etikettierungsanwendungen verlassen sich auf die Verwendung von großen Textkörpern und verdeckten Markov-Modellen zum Identifizieren und Bestimmen der Teile des Gesprochenen. Da die meisten nützlichen Tatsachen zur Korrektur für Eigennamen sind, kann dieser Schritt einfach die Eigennamen suchen und identifizieren. Zusätzlich dazu sucht und identifiziert dieser Schritt Sachdaten, wie z. B. Nomen, Kardinalzahlen, Richtungen, etc. Bei Block 46 werden die Eigennamen (Elemente und Attribute) und die Sachdaten (Attributwerte) identifiziert und einander richtig zugeordnet. Eine fortgeschrittene Weise, diese Funktion zu erreichen ist es, eine semantische Analyse der Sätze und eine Suche nach Zuordnungen innerhalb des Satzes und zwischen den Sätzen durchzuführen. Wenn z. B. ein "Einwohner"- Attribut identifiziert wird, wird das nächste identifizierte "Stadt"-Element und das nächste "Zahl"-Attribut für das "Einwohner"-Attribut identifiziert. Es ist offensichtlich, daß die Fehlerrate eines inkorrekten Attributwerts zu dem Attribut reduziert werden würde, wenn die Gesprächsteileetikettierung fortschrittlicher werden würde. Eine wiederum andere Möglichkeit, die Genauigkeit dieser Funktion zu verbessern ist zu überprüfen, ob die gelieferte Tatsache näher an einem naheliegenden Pronomen liegt. Wenn z. B. eine Zahl für ein "Bevölkerung"-Attribut identifiziert wurde und einen Wert von 1 Million aufweist, dann kann eine Zuordnung zu der Stadt La Paz gemacht werden, da die Einwohnerzahl 1 Million näher an der tatsächlichen Einwohnerzahl von La Paz liegt als an der von Bolivien oder Sucre.
  • Nachfolgend werden bei Block 48 die Attributwerte mit den Daten verglichen, die in der Sachdatenbank für das selbe Element und Attribut gespeichert sind. Wenn die Werte unterschiedlich sind, wie bei Block 50 bestimmt wird, dann kann eine vorgeschlagene Änderung für die Daten durchgeführt werden, wie bei Block 52 gezeigt ist. Ein Aufklappfenster 60 kann z. B. auf dem Bildschirm erscheinen, wie z. B. das, das in Fig. 4 gezeigt ist. Ein exemplar:Lsches Warnfenster 60 weist eine Meldung 62 auf, die Informationen über das Element und das Attribut liefert, die den fehlerhaften Attributwert, den fehlerhaften Wert und den richtigen Wert aufweisen. Ferner können zwei anklickbare Schaltflächen 64 und 66 bereitgestellt sein, um dem Benutzer zu ermöglichen auszuwählen, um die Ersetzung durchzuführen bzw. den Vorschlag zu ignorieren. Derartige Aufklappfenster sind wahrscheinlich am besten für Textverarbeitungsanwendungen geeignet, bei denen der Benutzer die Daten eingibt. Alternativ kann der Attributwert auf dem Bildschirm hervorgehoben werden, um dem Benutzer zu ermöglichen, denselben anzuklicken und zu erhalten und ihn durch die korrekten Daten zu ersetzen. Bei bestimmten anderen Anwendungen kann der Benutzer den Prozeß 40 konfigurieren, um automatisch Sachdaten in Echtzeit zu korrigieren, wenn fehlerhafte Daten identifiziert werden, ohne den Benutzer zu warnen oder anderweitig zu erfordern, daß der Benutzer zusätzliche Schritte unternimmt, um die Tatsachen zu korrigieren.
  • Das automatische Daten-Prüfungs- und Korrektur-System und -Verfahren löst das Problem, die Tatsachen getrennt und manuell verifizieren zu müssen, wenn ein Dokument vorioereitet oder ein Dokument gelesen wird. Fachleute, wie z. B. Versicherungsstatistiker, Buchhalter, Manager, Techniker, Lehrer und andere werden davon profitieren, daß ihre Datenbank an ihre Dokumenterzeugungssoftware gebunden ist. Auf diese Weise sind die Daten dem Benutzer zur Hand und werden automatisch aktiviert, um sicherzustellen, daß Dokumente die richtigen Tatsachen enthalten. Ein anderer Vorteil für den Benutzer ist die Fähigkeit, gute Daten von schlechten Daten zu unterscheiden. Dies ist heute besonders wichtig, da Benutzer mit Datenmengen aus dem World Wide Web überschwemmt werden, wo die Daten falsch, falsch zitiert, falsch charakterisiert oder veraltet sein können. Studenten, die für Schulprojekte Untersuchungen durchführen, werden ein derartiges Tool zum Verifizieren von Daten, die aus verschiedenen Quellen erhalten werden, besonders zu schätzen wissen. Es ist offensichtlich, daß die Benutzer durch die steigende Produktivität und durch das Verbessern der Genauigkeit des Arbeitsprodukts davon profitieren.
  • Das automatische Daten-Prüfungs- und Korrektur-System und - Verfahren kann mit verschiedenen Softwareanwendungen gebündelt sein, wie z. B. Textverarbeitungsanwendungen und Webbrowsern. Ferner ist das automatische Daten-Prüfungs- und Korrektur-System und -Verfahren ein automatisiertes Datenlieferungssystem und ein Dienst für Datenspeicher und Datenbanken. Ein Enzyklopädieherausgeber kann z. B. wünschen, die Enzyklopädiedaten in eine Datenbank einzugeben, um den Abonnenten zu ermöglichen, auf die Daten unter Verwendung des Systems und des Verfahrens der vorliegenden Erfindung zuzugreifen und dieselben zu verwenden. Wenn der Herausgeber die Daten in deren Datenbank aktualisiert, profitieren die Abonnenten dadurch davon, daß sie Zugriff auf die neuesten Daten haben und dieselben auf automatische Weise verwenden, um die Dokumente zu prüfen, die sie vorbereiten oder lesen. Herausgeber anderer Dokumente und Bücher, wie z. B. Textbücher, die Bibel, Zeitschriften und Zeitungen und ähnlichem profitieren ebenfalls von dieser Dienstliefermethode. Verschiedene Tatsachen, Bagatellen, Ortsnamen, Personennamen etc. können unter Verwendung dieser Datenbank automatisch geprüft werden. Nicht nur die eigenen Angestellten können vom Zugreifen auf eine solche Datenbank profitieren, sondern auch zahlende Abonnenten profitieren davon, Sachdaten so leicht auf dem Desktop verfügbar zu haben.

Claims (24)

1. Verfahren (10) zur automatischen Daten-Prüfung und -Korrektur, das folgende Schritte aufweist:
Empfangen einer Texteingabe, die zumindest einen Attributwert (42, 43) aufweist;
Zuordnen des zumindest einen Attributwerts zu zumindest einem jeweiligen Element und Attribut (46);
Vergleichen des zumindest einen Attributwerts aus der Texteingabe mit Attributwerten, die in einer Datenbank für die jeweiligen Elemente und Attribute (48) gespeichert sind; und
Ersetzen des zumindest einen Attributwerts in der Texteingabe durch den gespeicherten Attributwert, ansprechend darauf, daß der zumindest eine Attributwert sich von dem jeweiligen gespeicherten Attributwert unterscheidet (52).
2. Verfahren gemäß Anspruch 1, das ferner das Identifizieren von Elementen, Attributen und Attributwerten in der Texteingabe (44) aufweist.
3. Verfahren gemäß Anspruch 2, bei dem das Identifizieren von Elementen, Attributen und Attributwerten das Identifizieren von Gesprächsteilen in der Texteingabe aufweist (44).
4. Verfahren gemäß Anspruch 2 oder 3, bei dem das Identifizieren von Elementen, Attributen und Attributwerten das Identifizieren von Eigennamen und Sachdaten in der Texteingabe aufweist.
5. Verfahren gemäß einem der Ansprüche 1 bis 4, bei dem das Empfangen einer Texteingabe aus der Gruppe bestehend aus dem Lesen eines Textdokuments, dem Lesen einer Webseite (30) und dem Empfangen einer Tastatureingabe eines Benutzers ausgewählt ist.
6. Verfahren gemäß einem der Ansprüche 1 bis 5, das ferner folgende Schritte aufweist:
Warnen eines Benutzers, daß eine fehlerhafte Tatsache vorhanden ist, ansprechend darauf, daß sich die identifizierten Attributwerte von den jeweiligen gespeicherten Attributwerten unterscheiden (52); und
Ersetzen der identifizieren Attributwerte durch die gespeicherten Attributwerte in der Texteingabe auf Anfrage des Benutzers (52).
7. Verfahren gemäß einem der Ansprüche 1 bis 6, das ferner folgende Schritte aufweist:
Empfangen von Daten (32, 42);
Identifizieren von Elementen, Attributen und Attributwerten in den empfangenen Daten (44, 46);
Zuordnen der identifizierten Attributwerte zu jeweiligen Elementen und Attributen (46); und
Speichern der identifizierten Elemente, Attribute und Attributwerte (36).
8. Verfahren gemäß einem der Ansprüche 1 bis 7 das ferner folgende Schritte aufweist:
Empfangen von Daten, die identifizierte Elemente und Attribute aufweisen, und von Attributwerten, die denselben zugeordnet sind (32); und
Speichern der identifizierten Elemente, der Attribute und der zugeordneten Attributwerte in einer Datenbank (36).
9. Verfahren gemäß einem der Ansprüche 1 bis 8, das ferner folgende Schritte aufweist:
Empfangen von Daten, die zumindest ein identifiziertes Element und Attribut und zumindest einen Attributwert aufweisen, der denselben zugeordnet ist;
Speichern des zumindest einen identifizierten Elements, des Attributs und des zugeordneten Attributwerts in einer Datenbank;
Empfangen von zumindest einer Abfrage im Hinblick auf den spezifischen Attributwert, der dem spezifischen Element und dem Attribut zugeordnet ist; und
Wiedergewinnen des abgefragten spezifischen Attributwerts und Liefern desselben zu einem Benutzer, der die zumindest eine Abfrage initiiert.
10. Verfahren gemäß einem der Ansprüche 1 bis 9, das ferner folgende Schritte aufweist:
Erzeugen einer Abrage im Hinblick auf einen spezifischen Attributwert, der einem spezifischen Element und Attribut zugeordnet ist; und
Senden der Abfrage zu der Datenbank;
Empfangen des spezifischen Attributwerts und Liefern desselben zu einem Benutzer, der die Abfrage initiiert.
11. Verfahren zur automatischen Sachdatenlieferung zu dem Desktop, das folgende Schritte aufweist:
Empfangen einer Texteingabe (42);
Zuordnen zumindest eines Attributwerts zu zumindest einem jeweiligen Element und Attribut in der Texteingabe;
Abfragen einer Datenbank im Hinblick auf den zumindest einen Attributwert;
Wiedergewinnen von zumindest einem gespeicherten Attributwert aus der Datenbank;
Vergleichen des zumindest einen Attributwerts aus der Texteingabe mit dem zumindest einen gespeicherten Attributwert, der aus der Datenbank für das zumindest eine jeweilige Element und das Attribut wiedergewonnen wurde; und
Ersetzen des zumindest einen Attributwerts in der Texteingabe durch den zumindest einen gespeicherten Attributwert ansprechend darauf, daß sich der zumindest eine Attributwert von dem zumindest einen gespeicherten Attributwert unterscheidet.
12. Verfahren gemäß Anspruch 11, das ferner das Identifizieren von zumindest einem Element, Attribut und Attributwert in der Texteingabe aufweist.
13. Verfahren gemäß Anspruch 12, bei dem das Identifizieren von zumindest einem Element, Attribut und Attributwert das Identifizieren von Gesprächsteilen in der Texteingabe aufweist.
14. Verfahren gemäß Anspruch 12 oder 13, bei dem das Identifizieren von zumindest einem Element, Attribut und Attributwert das Identifizieren von Eigennamen und Sachdaten in der Texteingabe aufweist.
15. Verfahren gemäß einem der Ansprüche 12 bis 14, bei dem das Empfangen einer Texteingabe aus der Gruppe bestehend aus dem Eingeben eines Textdokuments, dem Herunterladen einer Webseite und dem Empfangen einer Tastatureingabe eines Benutzers ausgewählt ist.
16. Verfahren gemäß einem der Ansprüche 12 bis 15, das ferner folgende Schritte aufweist:
Warnen eines Benutzers, daß eine fehlerhafte Tatsache vorhanden ist, ansprechend darauf, daß sich der zumindest eine identifizierte Attributwert von dem jeweiligen gespeicherten Attributwert unterscheidet; und
Ersetzen des zumindest einen identifizierten Attributwerts durch den gespeicherten Attributwert in der Texteingabe auf die Anfrage des Benutzers.
17. Verfahren gemäß einem der Ansprüche 12 bis 16, das ferner folgende Schritte aufweist:
Empfangen von Daten (32, 42);
Identifizieren von Elementen, Attributen und Attributwerten in den empfangenen Daten (44, 46);
Zuordnen der identifizierten Attributwerte zu den jeweiligen Elementen und Attributen (46); und
Speichern der identifizierten Elemente, Attribute und Attributwerte (36).
18. Verfahren gemäß einem der Ansprüche 12 bis 17, das ferner folgende Schritte aufweist:
Empfangen von Daten, die identifizierte Elemente und Attribute und Attributwerte aufweisen (32), die denselben zugeordnet sind; und
Speichern der identifizierten Elemente, der Attribute und der zugeordneten Attributwerte in einer Datenbank (36).
19. System (10) zur automatischen Daten-Prüfung und -Korrektur, das folgende Merkmale aufweist:
ein computerlesbares Medium, auf dem ein Prozeß codiert ist, der wirksam ist zum:
Empfangen einer Eingabe, die Elemente, Attribute und Attributwerte aufweist (30, 32, 42);
Zuordnen der Attributwerte zu jeweiligen Elementen und Attributen (46);
Vergleichen der Attributwerte aus der Eingabe mit. Attributwerten, die in einer Datenbank für die jeweiligen Elemente und Attribute gespeichert sind (36); und
Ersetzen der Attributwerte durch die gespeicherten Attributwerte in der Eingabe, ansprechend darauf, daß sich die Attributwerte in der Eingabe von den jeweiligen gespeicherten Attributwerten unterscheiden (52).
20. System gemäß Anspruch 19, bei dem der Prozeß ferner wirksam ist, um Gesprächsteile in der Eingabe zu identifizieren, um die Elemente, Attribute und Attributwerte zu identifizieren.
21. System (10) gemäß Anspruch 19 oder 20, bei dem der Prozeß ferner wirksam ist, um eine Texteingabe zu empfangen, die aus der Gruppe bestehend aus einem Textdokument, einer Webseite (30) und einer Tastatur eines Benutzers und einer Zeigevorrichtungseingabe ausgewählt ist.
22. System (10) gemäß einem der Ansprüche 19 bis 21, bei dem der Prozeß ferner wirksam ist zum:
Warnen eines Benutzers, daß eine fehlerhafte Tatsache vorhanden ist, ansprechend darauf, daß sich die Attributwerte in der Eingabe von den jeweiligen gespeicherten Attributwerten unterscheiden; und
Ersetzen der Attributwerte in der Eingabe durch die gespeicherten Attributwerte ansprechend auf eine Anforderung von dem Benutzer.
23. System (10) gemäß einem der Ansprüche 19 bis 22, bei dem der Prozeß ferner wirksam ist zum:
Empfangen von Daten, die identifizierte Elemente, Attribute und Attributwerte aufweisen;
Zuordnen der identifizierten Attributwerte zu jeweiligen Elementen und Attributen; und
Speichern der identifizierten Elemente, Attribute und Attributwerte.
24. System gemäß Anspruch 23, bei dem der Prozeß ferner wirksam ist zum:
Empfangen von Abfragen im Hinblick auf spezifische Attributwerte, die spezifischen Elementen und Attributen zugeordnet sind; und
Wiedergewinnen der abgefragten spezifischen Attributwerte und Liefern zu einem Benutzer, der die Abfragen initiiert.
DE10308550A 2002-05-08 2003-02-27 System und Verfahren zur automatischen Daten-Prüfung und -Korrektur Withdrawn DE10308550A1 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US10/141,303 US20030210249A1 (en) 2002-05-08 2002-05-08 System and method of automatic data checking and correction

Publications (1)

Publication Number Publication Date
DE10308550A1 true DE10308550A1 (de) 2003-11-27

Family

ID=29399628

Family Applications (1)

Application Number Title Priority Date Filing Date
DE10308550A Withdrawn DE10308550A1 (de) 2002-05-08 2003-02-27 System und Verfahren zur automatischen Daten-Prüfung und -Korrektur

Country Status (3)

Country Link
US (1) US20030210249A1 (de)
DE (1) DE10308550A1 (de)
GB (1) GB2389437A (de)

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7503071B1 (en) * 2003-10-01 2009-03-10 Symantec Corporation Network traffic identification by waveform analysis
US20070005781A1 (en) * 2005-06-30 2007-01-04 Herman Rodriguez Method and system for using confirmation objects to substantiate statements in documents
US7562811B2 (en) 2007-01-18 2009-07-21 Varcode Ltd. System and method for improved quality management in a product logistic chain
EP2024863B1 (de) 2006-05-07 2018-01-10 Varcode Ltd. System und verfahren zur verbesserten qualitätsverwaltung in einer produktlogistikkette
US8528808B2 (en) 2007-05-06 2013-09-10 Varcode Ltd. System and method for quality management utilizing barcode indicators
CN101802812B (zh) 2007-08-01 2015-07-01 金格软件有限公司 使用互联网语料库的自动的上下文相关的语言校正和增强
US8500014B2 (en) 2007-11-14 2013-08-06 Varcode Ltd. System and method for quality management utilizing barcode indicators
US11704526B2 (en) 2008-06-10 2023-07-18 Varcode Ltd. Barcoded indicators for quality management
JP5764119B2 (ja) * 2009-04-23 2015-08-12 アイティーアイピー・ディヴェロップメント・エルエルシーItip Development, Llc 法的文書を提出するためのシステムおよび方法
CN102884518A (zh) * 2010-02-01 2013-01-16 金格软件有限公司 尤其用于小键盘装置的使用互联网语料库的自动的上下文相关的语言校正
US8185448B1 (en) * 2011-06-10 2012-05-22 Myslinski Lucas J Fact checking method and system
US8768782B1 (en) 2011-06-10 2014-07-01 Linkedin Corporation Optimized cloud computing fact checking
US9015037B2 (en) 2011-06-10 2015-04-21 Linkedin Corporation Interactive fact checking system
US9087048B2 (en) 2011-06-10 2015-07-21 Linkedin Corporation Method of and system for validating a fact checking system
US9176957B2 (en) 2011-06-10 2015-11-03 Linkedin Corporation Selective fact checking method and system
US20130159127A1 (en) * 2011-06-10 2013-06-20 Lucas J. Myslinski Method of and system for rating sources for fact checking
US10380707B2 (en) 2012-02-24 2019-08-13 Itip Development, Llc Patent life cycle management system
US8807422B2 (en) 2012-10-22 2014-08-19 Varcode Ltd. Tamper-proof quality management barcode indicators
US9483159B2 (en) 2012-12-12 2016-11-01 Linkedin Corporation Fact checking graphical user interface including fact checking icons
US10169424B2 (en) 2013-09-27 2019-01-01 Lucas J. Myslinski Apparatus, systems and methods for scoring and distributing the reliability of online information
US20150095320A1 (en) 2013-09-27 2015-04-02 Trooclick France Apparatus, systems and methods for scoring the reliability of online information
US9643722B1 (en) 2014-02-28 2017-05-09 Lucas J. Myslinski Drone device security system
US9972055B2 (en) 2014-02-28 2018-05-15 Lucas J. Myslinski Fact checking method and system utilizing social networking information
US8990234B1 (en) 2014-02-28 2015-03-24 Lucas J. Myslinski Efficient fact checking method and system
US9189514B1 (en) 2014-09-04 2015-11-17 Lucas J. Myslinski Optimized fact checking method and system
US9483582B2 (en) 2014-09-12 2016-11-01 International Business Machines Corporation Identification and verification of factual assertions in natural language
CN107615027B (zh) 2015-05-18 2020-03-27 发可有限公司 用于可激活质量标签的热致变色墨水标记
JP6898298B2 (ja) 2015-07-07 2021-07-07 バーコード リミティド 電子品質表示指標
US10601752B2 (en) * 2017-01-03 2020-03-24 International Business Machines Corporation Responding to an electronic message communicated to a large audience
WO2022041163A1 (en) * 2020-08-29 2022-03-03 Citrix Systems, Inc. Identity leak prevention

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61220027A (ja) * 1985-03-27 1986-09-30 Hitachi Ltd 文書ファイリングシステム及び情報記憶検索システム
JPH0821030B2 (ja) * 1986-12-29 1996-03-04 ブラザー工業株式会社 文書処理装置
JP3571408B2 (ja) * 1995-03-31 2004-09-29 株式会社日立製作所 文書加工方法および装置
US6377965B1 (en) * 1997-11-07 2002-04-23 Microsoft Corporation Automatic word completion system for partially entered data
US5896321A (en) * 1997-11-14 1999-04-20 Microsoft Corporation Text completion system for a miniature computer
JP3936453B2 (ja) * 1997-12-04 2007-06-27 富士通株式会社 文書校正装置
US6424983B1 (en) * 1998-05-26 2002-07-23 Global Information Research And Technologies, Llc Spelling and grammar checking system
US6401060B1 (en) * 1998-06-25 2002-06-04 Microsoft Corporation Method for typographical detection and replacement in Japanese text
US20020087604A1 (en) * 2001-01-04 2002-07-04 International Business Machines Corporation Method and system for intelligent spellchecking
JP2003223437A (ja) * 2002-01-29 2003-08-08 Internatl Business Mach Corp <Ibm> 正解語の候補の表示方法、スペルチェック方法、コンピュータ装置、プログラム

Also Published As

Publication number Publication date
GB2389437A (en) 2003-12-10
US20030210249A1 (en) 2003-11-13

Similar Documents

Publication Publication Date Title
DE10308550A1 (de) System und Verfahren zur automatischen Daten-Prüfung und -Korrektur
DE69428590T2 (de) Auf kombiniertem lexikon und zeichenreihenwahrscheinlichkeit basierte handschrifterkennung
DE4440598C1 (de) Durch gesprochene Worte steuerbares Hypertext-Navigationssystem, Hypertext-Dokument für dieses Navigationssystem und Verfahren zur Erzeugung eines derartigen Dokuments
DE69829074T2 (de) Identifizierung der sprache und des zeichensatzes aus text-repräsentierenden daten
DE69829389T2 (de) Textnormalisierung unter verwendung einer kontextfreien grammatik
DE3853894T2 (de) Auf Paradigmen basierende morphologische Textanalyse für natürliche Sprachen.
DE69129107T2 (de) Automatisches übersetzungs-und fernübertragungssystem
EP1902407B1 (de) System zum übertragen von daten aus einer dokumentenanwendung in eine datenanwendung
DE69811066T2 (de) Datenzusammenfassungsgerät.
DE68928230T2 (de) System zur grammatikalischen Verarbeitung eines aus natürlicher Sprache zusammengesetzten Satzes
DE112018000334T5 (de) System und Verfahren zur domänenunabhängigen Aspektebenen-Stimmungserkennung
DE102013205737A1 (de) System und Verfahren zum automatischen Erkennen und interaktiven Anzeigen von Informationen über Entitäten, Aktivitäten und Ereignisse aus multimodalen natürlichen Sprachquellen
DE10124429B4 (de) System und Verfahren für eine verbesserte Rechtschreibprüfung
DE10343228A1 (de) Verfahren und Systeme zum Organisieren elektronischer Dokumente
DE102004003878A1 (de) System und Verfahren zum Identifizieren eines speziellen Wortgebrauchs in einem Dokument
WO2012038014A1 (de) System und verfahren für relevanzbasiertes kategorisieren und zeitnahes lernen von vokabeln
DE102019001267A1 (de) Dialogartiges System zur Beantwortung von Anfragen
DE102004046252A1 (de) Einrichtung zum Trennen zusammengesetzter Wörter und zur Rechtschreibprüfung
DE60101668T2 (de) Verfahren und gerät zum erzeugen eines auf einer formatvorlage basierten index für ein strukturiertes dokument
DE102018007165A1 (de) Vorhersage von stilbrüchen innerhalb eines textinhalts
DE10129636A1 (de) Verfahren und Vorrichtung zum Verknüpfen elektronischer Tinte mit personengebundenen elektronischen Informationssystemen
DE19706419A1 (de) Verfahren und Vorrichtung zur Steuerung von Prozessen unter Verwendung einer Technologie zur maschinellen Sprachverarbeitung
DE69733294T2 (de) Einrichtung und Verfahren zum Zugriff auf eine Datenbank
DE102004018446A1 (de) Dokumenteninformations-Verarbeitungsvorrichtung
DE69229583T2 (de) Verfahren zur Flektieren von Wörtern und Datenverarbeitungseinheit zur Durchführung des Verfahrens

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
8130 Withdrawal