DE102012102797A1 - Konvertierung eines Dokuments anhand von aufgenommenen Bildern in ein Format zur optimierten Anzeige auf einem Mobilfunkgerät - Google Patents
Konvertierung eines Dokuments anhand von aufgenommenen Bildern in ein Format zur optimierten Anzeige auf einem Mobilfunkgerät Download PDFInfo
- Publication number
- DE102012102797A1 DE102012102797A1 DE102012102797A DE102012102797A DE102012102797A1 DE 102012102797 A1 DE102012102797 A1 DE 102012102797A1 DE 102012102797 A DE102012102797 A DE 102012102797A DE 102012102797 A DE102012102797 A DE 102012102797A DE 102012102797 A1 DE102012102797 A1 DE 102012102797A1
- Authority
- DE
- Germany
- Prior art keywords
- text
- mobile device
- display
- format
- letter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 claims abstract description 35
- 238000012015 optical character recognition Methods 0.000 claims description 13
- 238000004458 analytical method Methods 0.000 claims description 8
- FGUUSXIOTUKUDN-IBGZPJMESA-N C1(=CC=CC=C1)N1C2=C(NC([C@H](C1)NC=1OC(=NN=1)C1=CC=CC=C1)=O)C=CC=C2 Chemical compound C1(=CC=CC=C1)N1C2=C(NC([C@H](C1)NC=1OC(=NN=1)C1=CC=CC=C1)=O)C=CC=C2 FGUUSXIOTUKUDN-IBGZPJMESA-N 0.000 claims 2
- 230000000295 complement effect Effects 0.000 claims 1
- 238000001914 filtration Methods 0.000 claims 1
- 238000006243 chemical reaction Methods 0.000 description 8
- 238000007781 pre-processing Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- BUHVIAUBTBOHAG-FOYDDCNASA-N (2r,3r,4s,5r)-2-[6-[[2-(3,5-dimethoxyphenyl)-2-(2-methylphenyl)ethyl]amino]purin-9-yl]-5-(hydroxymethyl)oxolane-3,4-diol Chemical compound COC1=CC(OC)=CC(C(CNC=2C=3N=CN(C=3N=CN=2)[C@H]2[C@@H]([C@H](O)[C@@H](CO)O2)O)C=2C(=CC=CC=2)C)=C1 BUHVIAUBTBOHAG-FOYDDCNASA-N 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000012946 outsourcing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
- G06F40/106—Display of layout of documents; Previewing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
- G06T11/60—Editing figures and text; Combining figures or text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/10—Selection of transformation methods according to the characteristics of the input images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/22—Character recognition characterised by the type of writing
- G06V30/224—Character recognition characterised by the type of writing of printed characters having additional code marks or containing code marks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/414—Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Geometry (AREA)
- Computer Graphics (AREA)
- Character Input (AREA)
Abstract
Die vorliegende Erfindung betrifft ein Verfahren und ein Serversystem zur Aufnahme eines Dokuments mit einem kamerabasierten Mobilfunkgerät und zur Konversion von Textinformation des Dokuments in ein Format zu einer geeigneten Darstellung auf dem Mobilfunkgerät, die folgenden Schritte umfassend a) Aufnehmen des Dokuments mit dem Mobilfunkgerät durch mindestens ein Bild; b) Erkennen einer jeweiligen Layout-Struktur mit mindestens einem Textblock in dem jeweiligen Bild; c) Erkennen von Buchstabentext in dem jeweiligen Textblock durch Anwenden eines OCR und Abspeichern des jeweiligen Buchstabentexts zu dem jeweiligen Textblock; gekennzeichnet durch: d) Bestimmen und Abspeichern einer Reihenfolge der jeweiligen Textblöcke in dem Dokument unter Berücksichtigung der jeweiligen Layout-Struktur; e) Selektieren eines geeigneten Formats für die Darstellung der Buchstabentexte auf einem Display des Mobilfunkgeräts, wobei das geeignete Format an eine Breite des Displays angepasst ist, so dass beim Lesen der Buchstabentexte auf dem Display im Wesentlichen nur vertikal gescrollt werden muss; f) Erzeugen einer Datei (40) in dem geeigneten Format mit den jeweiligen Buchstabentexten in der bestimmten Reihenfolge der jeweiligen Textblöcke; g) Bereitstellen der Datei (40) für das Mobilfunkgerät zur Darstellung auf dem Display.
Description
- Erfindungsgebiet
- Die vorliegende Erfindung betrifft ein Verfahren und eine Vorrichtung zur Aufnahme eines Dokuments mit einem kamerabasierten Mobilfunkgerät und zur Konvertierung des Dokuments mit darin enthaltenen Text- und Bildinformationen in ein Format, das vor allem in der Breite einem Display des Mobilfunkgeräts angepasst ist.
- Hintergrund der Erfindung
- Mobilfunkgeräte, wie beispielsweise ein Mobiltelefon, ein Smartphone, ein iPAD® oder ähnliches, weisen aktuell zum größten Teil schon integrierte Kameras mit einer Auflösung von 5–12 Megapixel auf. Die Mobilfunkgeräte gelten als ständige Begleiter der jeweiligen Benutzer, und vor allem Geschäftsleute wünschen sich daher auch immer weitreichendere Einsatzmöglichkeiten. Oft werden die kamerabasierten Mobilfunkgeräte auch dafür genutzt, sich durch Kameraaufnahmen Notizen über einen Zeitungsartikel oder ein Dokument zu machen, oder sie für Übersetzungszwecke zu nutzen.
- Aus
US2001/0280,450A1 - Aus
US2009/244,293A1 - Aus
WO2009/104193A1 -
KR2008/0050272A -
WO2006/124473 -
US12/455252 - Die oben beschriebenen Verfahren oder Systeme sind nicht jedoch darauf ausgerichtet, das jeweilige aufgenommene Dokument, das beispielsweise durch mehrere aufeinanderfolgende Bilder aufgenommen worden ist, geeignet auf einem kleinen Display eines Mobilfunkgerät adäquat darzustellen. Bei einem Lesen des Dokumentes ist meist ein Scrollen auch zur Seite nötig, wodurch ein Lesen einer breiten Zeitschrift für den Nutzer sehr umständlich und beschwerlich ist.
-
US2010/0199197A1 - Eine befriedigende Darstellung von mit dem Mobilfunkgerät aufgenommenen Textdokumenten auf dem Mobilfunkgerät ist nicht verfügbar, ohne dass beispielsweise seitlich auch gescrollt werden müsste.
- Zusammenfassung der Erfindung
- Daher besteht eine Aufgabe der Erfindung, in der Bereitstellung eines Verfahrens und einer Vorrichtung zum Aufnehmen eines Dokuments mit einem Mobilfunkgerät mit integrierter Kamera und zum Konvertieren von Textinformationen der aufgenommenen Bilder des Dokuments in ein Format, das in einer Breite einem Display des Mobilfunkgeräts angepasst ist, um dadurch einem Anwender beim Lesen ein seitliches Scrollen zu ersparen. Dabei soll die richtige Reihenfolge von Textstellen erkannt und beibehalten werden. Dadurch sollen auch die Nachteile aus dem Stand der Technik beseitigt werden.
- Offenbarung der Erfindung
- Die vorstehenden Aufgaben sowie weitere der Beschreibung zu entnehmende Aufgaben werden von einem Verfahren und von einer Vorrichtung zum Aufnehmen und zum Konvertieren eines Dokuments mit einem kamerabasierten Mobilfunkgerät gemäß dem unabhängigen Anspruch 1 bzw. 14 gelöst. Weitere vorteilhafte Ausbildungen der Erfindung sind in den abhängigen Ansprüchen angegeben.
- Die durch die Erfindung erreichten Vorteile bestehen darin, dass Dokumente mit einem Mobilfunkgerät einfach der Reihe nach, seitenweise oder Textbaustein für Textbaustein aufgenommen können und danach eine automatische Konvertierung der Texte so erfolgt, dass aufeinanderfolgende Textbausteine in der richtigen Reihenfolge untereinander gesetzt werden und so auf dem Mobilfunkgerät dargestellt werden. Demgemäß müssen bei im Originaldokument nebeneinander angeordneten, aufeinanderfolgenden Textblöcken nicht seitlich sondern nur vertikal gescrollt werden, was auf Mobilfunkgeräten für einen Nutzer sehr umständlich wäre. Dahingegen werden aufeinanderfolgende Textbausteine eines Dokuments in der Reihenfolge erkannt und neu angeordnet, indem sie in ein geeignetes Layout bzw. Format gebracht werden, das gerade so breit ist, das es einem Display des Mobilfunkgeräts entspricht. Die Textblöcke werden entsprechend dem geeigneten Format als Datei abgespeichert und stehen so bequem lesbar als ein Textdokument auf dem Mobilfunkgerät zur Verfügung. Insbesondere bei breiten Dokumenten, wie beispielsweise bei Zeitungen oder bei Dokumenten im Querformat ist diese Art der Konvertierung sehr angenehm, einen Fließtext auf dem Display des Mobilfunkgeräts dargestellt zu bekommen, der automatisch der Breite des Displays angepasst ist, und bei dem nur vertikal, entlang dem Text und nicht seitlich gescrollt zu werden braucht.
- Zwei vorteilhafte Verfahren werden vorgestellt. Bei dem einen Verfahren wird die Konvertierung der Bilder bevorzugt ganz auf dem Mobilfunkgerät bearbeitet, bei dem anderen Verfahren wird die Konvertierung der Bilder bevorzugt zum überwiegenden Teil auf einem Server bearbeitet, um Rechenleistung zu sparen und zugleich eine Kopie in einem Dokumentenarchiev abzulegen.
- Auch können zusätzlich Dokumente in einer zusätzlichen zweiten Form abgespeichert werden, die beispielsweise auf PC Monitore angepasst sind. So kann auch der Textinhalt von Zeitungen, die ein Vielfaches breiter als DIN A4 sind, auf eine DIN A4 Breite reduziert und abgespeichert werden. Eine solche Optimierung der Darstellung macht es dem Nutzer angenehm, einen abfotografierten Dokumententext ohne Klimmzüge und Suchen, wo eine aktuelle Textpassage fortgesetzt wird, lesen zu können.
- Eine bevorzugte Ausführungsform gemäß der vorliegenden Erfindung ist in nachfolgenden Zeichnungen und in einer detaillierten Beschreibung dargestellt, soll aber die vorliegende Erfindung nicht darauf begrenzen.
- Kurzbeschreibung der Zeichnungen
-
1a zeigt ein Bild eines Dokuments mit verschiedenen Textblöcken, Artikelüberschriften und zwei Abbildungen. -
1b zeigt ein weiteres Bild eines Dokuments mit verschiedenen Textblöcken, Artikelüberschriften und drei Abbildungen. -
2 zeigt links im Bild eine Darstellung eines ersten Teils einer Datei in einem geeigneten Format für eine Darstellung auf einem Mobilfunkgerät mit den Textblöcken aus1a , wobei rechts im Bild ein zweiter Teil der Datei dargestellt ist, der den ersten Teil der Datei fortsetzt. -
3 zeigt das gleiche Dokument mit den verschiedenen Textblöcken aus1a , wobei die verschiedenen Textblöcken durch drei Bilder von einem kamerabasierten Mobilfunkgerät aufgenommen werden. - Detaillierte Beschreibung eines Ausführungsbeispiels
-
1a und1b repräsentieren jeweils eine Seite eines beispielhaften Dokuments, wobei1a eine erste Seite und1b eine zweite Seite des Dokuments zeigen. Die erste Seite des Dokuments zeigt beispielsweise eine erste Überschrift an einer Stelle1 eines ersten Artikels mit zugehörigen Textblöcken an Stellen3 ,5 ,6 und Abbildungen an Stellen2 ,4 und eine zweite Überschrift an einer Stelle7 eines zweiten Artikels mit zugehörigen Textblöcken an Stellen8 ,9 . Auf der zweiten Seite in1b wird der zweite Artikel fortgesetzt durch entsprechende weitere Textblöcke an Stellen10 ,12 ,13 und durch eine Abbildung an einer Stelle11 . Auf der zweiten Seite folgt dann noch ein dritter Artikel mit einer dritten Überschrift an einer Stelle14 , mit zugehörigen Textblöcken an Stellen15 ,17 ,19 und zwei Abbildungen an Stellen16 ,18 . - Mit dem Ziel das in
1a und1b dargestellte Dokument zu registrieren bzw. zu archivieren und auf einem Mobilfunkgerät lesbar zu machen, werden die erste und die zweite Seite vorzugsweise mit dem Mobilfunkgerät abfotografiert, wobei in diesem Beispiel von der Kamera des Mobilfunkgeräts ein erstes30 und ein zweites Bild31 erhalten abgespeichert werden. Im dargestellten Beispiel umfasst das erste Bild30 einen ersten Bildbereich und das zweite Bild32 einen zweiten Bildbereich. Bei Dokumenten mit mehreren Seiten werden entsprechend alle Seiten, die archiviert werden sollen, abfotografiert. Denkbar ist bei der Aufnahme des Dokuments durch das Mobilfunkgerät auch eine Erkennung einer genügend guten Ausrichtung der Kamera zu dem aufzunehmenden Text. Dabei können beispielsweise auch akustische Feed-back Verfahren zur genügend guten Ausrichtung eingesetzt werden. - Bevorzugt wird das erste Bild
30 durch einen Layout Erkennungsalgorithmus verarbeitet, so dass in dem ersten Bild30 die Textblöcke an den Stellen1 ,3 ,5 ,6 ,7 ,8 ,9 und bevorzugt die Abbildungen an den Stellen2 ,4 erkannt werden. Dabei wird auch eine Layout-Struktur, bzw. eine Verteilung der Textblöcke und bevorzugt der Abbildungen in dem ersten Bild30 erkannt und abgespeichert. Die Layout-Struktur wird danach ausgewertet, um festzustellen, welche jeweils benachbarten Textblöcke und Abbildungen zu jeweils einem Artikel gehören und welche zu einem weiteren Artikel. Der Layout Erkennungsalgorithmus basiert auf bekannten Algorithmen zur digitalen Bildverarbeitung, um bevorzugt Kanten zu erkennen und Textblöcke, die Bereiche mit Text sind. Auch können dabei bevorzugt Abbildungen erkannt werden. Der Layout Erkennungsalgorithmus erkennt dabei bevorzugt auch Abstände zwischen den Textblöcken und Abbildungen. Desweiteren erkennt der Layout Erkennungsalgorithmus auch bevorzugt Überschriften in einem Textblock, das heißt, ob ein bestimmter Textblock eine Überschrift ist, wie beispielsweise an den Stellen1 und7 in1a . Zur Erkennung einer Überschrift kann der Layout Erkennungsalgorithmus eine Erkennung entweder durch eine Schriftgrößenbestimmung bei einem Vergleich mit der Schriftgröße benachbarter Textblöcke vornehmen oder auch beispielsweise syntaktische Charakteristika berücksichtigen. Es können dazu auch Ausgabeparameter aus einer nachfolgenden OCR Analyse mit verwendet werden. Mit dem zweiten Bild31 und mit weiteren Bildern, falls vorhanden, wird wie mit dem ersten Bild30 verfahren. - Die erkannten Textblöcke werden jeweils einem Optical Character Recognition (OCR) Algorithmus zugeführt, der darin Buchstabentext erkennt uns ausgibt. Alternativ kann auch das gesamte erste Bild
30 dem OCR Algorithmus zugeführt werden. Der Buchstabentext oder die Buchstabentexte werden bevorzugt in einem Standard-Text-Format oder als Fließtext abgespeichert und mit dem entsprechenden Textblock verknüpft. Trennstriche zu einer Zeilenumbruchtrennung werden bevorzugt entfernt. Dabei ist es auch denkbar, dass noch weitere digitale Vorverarbeitungsalgorithmen zur Bildverbesserung angewendet werden, um dadurch eine bessere Erkennung des Buchstabentextes zu ermöglichen. Mit dem zweiten Bild31 und mit weiteren Bildern, falls vorhanden, wird wie mit dem ersten Bild30 verfahren. - In einem folgenden Schritt wird durch einen Reihenfolgeerkennungsalgorithmus eine Reihenfolge der zuvor bestimmten Textblöcke und bevorzugt auch der Abbildungen bestimmt. Der Reihenfolgeerkennungsalgorithmus berücksichtigt dabei bevorzugt folgende Parameter und Sub-Funktionen bzw. Sub-Algorithmen:
- – ein Abstand der Textblöcke zueinander;
- – eine syntaktische Verknüpfung, wenn beispielsweise ein letzer Satz in einem Textblock in einem nächsten Textblock weitergeführt und dort beendet wird;
- – eine Anordnungsregel, die erkannt wird, wie beispielsweise links oben – links unten, rechts oben – rechts unten;
- – Trennstriche und/oder Rahmen um Textblöcke;
- – Weiterführung von Trennstrichen und/oder Rahmen um Textblöcke in benachbarten Bildern;
- – Erkennung und Analyse von mindestens einem Schlüsselwort in benachbarten Textblöcken;
- – Erkennung von aufeinanderfolgenden Texten mit neuronalen Netzen.
- Anschließend wird ein geeignetes Format bestimmt, in dem die Buchstabentexte und bevorzugt die Abbildungen abgespeichert werden. Das geeignete Format wird so bestimmt, dass eine Breite der darin eingefüllten Buchstabentexte, also die Zeilenbreite, und bevorzugt eine weitere Breite der Abbildungen eine Breite eines Displays des Mobilfunkgeräts nicht übersteigt, oder in anderen Worten wird die Breite des geeigneten Formats so bestimmt, dass die Zeilenbreite gerade der Breite des Displays entspricht. Das geeignete Format weist ferner eine Schriftart und eine Schriftgröße auf, mit denen die Buchstabentexte auf dem Display dargestellt werden und die vom Nutzer gut lesbar sein sollen. Vorzugsweise kann der Nutzer die gewünschte Schriftart und Schriftgröße einstellen, wie beispielsweise Arial 10, Times 11, oder dergleichen. Nun werden die Buchstabentexte in der vorher bestimmten Reihenfolge in dem geeigneten Format abgespeichert, wobei entsprechende Zeilenumbrüche und bevorzugt Worttrennungen eingefügt werden. Sind Abbildungen in der Layout-Struktur erkannt und abgespeichert worden, werden die Abbildungen bevorzugt auch an den entsprechenden Stellen zwischen den Buchstabentexten in der entsprechenden Reihenfolge mit abgespeichert. Das geeignete Format ist entweder ein festes Format, das in einem Speicher abgespeichert ist, oder es ist ein variables Format, das Parameter berücksichtigt, die entweder vom Nutzer eingegeben werden oder vom Mobilfunkgerät abgerufen werden können, wie beispielsweise die gewünschte Schriftgröße und Schriftart im Display.
-
2 zeigt eine Darstellung einer Datei40 , die Buchstabentexte und Abbildungen umfasst, die in dem geeigneten Format in der bestimmten Reihenfolge abgespeichert worden sind. Dabei wird die erkannte erste Überschrift an Stelle1 des ersten Bilds30 gemäß1a ganz oben in der Reihenfolge an Stelle1 in der Datei40 abgespeichert. Auf die Überschrift an der Stelle1 folgt der Buchstabentext an Stelle3 in der Datei40 , der vom Textblock an der Stelle3 aus dem ersten Bild30 stammt. Als nächstes in der Reihenfolge wird die Abbildung2 und dann Abbildung4 in der Datei40 abgespeichert, genauso, wie sie in der Reihenfolge im ersten Bild30 erkannt worden sind. Nach dem Buchstabentext an Stelle5 folgt der Buchstabentext an Stelle6 in der Datei40 . Eine zweite Länge des Buchstabentexts an Stelle6 der Datei40 ist länger als eine erste Länge des gleichen Buchstabentexts des Textblocks an der Stelle6 im ersten Bild30 , was darauf zurückzuführen ist, dass die Schriftgröße in der Datei40 größer ist als im entsprechenden Textblock an der Stelle6 im ersten Bild30 . - An Stelle
7 in der Datei40 folgt eine neue Überschrift, die im Textblock an Stelle7 im ersten Bild30 erkannt worden ist. Anschließend folgen die Buchstabentexte an den Stellen8 ,9 und10 , dann die Abbildung an Stelle11 in der Datei40 und weitere Buchstabentexte und Abbildungen, die in2 nicht mehr dargestellt worden sind. Die Datei40 kann beliebig kurz oder lang sein und umfasst eben die Buchstabentexte und bevorzugt die Abbildungen, die in den aufgenommenen Bildern30 ,31 des Dokuments erkannt worden sind. - Die Datei
40 zeigt eine Breite41 des Formats, und es ist dabei auch strichliert ein Ausschnitt42 zu sehen, der jeweils am Display des Mobilfunkgeräts darstellt wird. Wenn der Fachmann Bild2 betrachtet, ist es für ihn leichtvorstellbar, dass bei einem Lesen des Dokuments in der oben beschriebenen konvertierten Form in dem geeigneten Format kein seitliches Scrollen mehr notwendig ist, sondern dass der Nutzer einfach auf- und abwärts zu scrollen braucht, um den Text fortlaufend zu lesen. - Die Datei
40 kann dabei auf dem Mobilfunkgerät abgespeichert werden, wobei die Datei40 bevorzugt eine Standard-Text-Datei ohne Abbildungen ist, wie beispielsweise eine ASCII-Text-Datei, oder ein PDF-File bevorzugt mit Abbildungen ist, eine Microsoft-Word-Datei ist oder eine Datei in einem anderen Standard Format ist. Die Datei40 kann dabei ebenso auf einem Server abgespeichert werden, falls die vorangegangenen Verarbeitungsschritte auf einem Server stattgefunden haben. - In
3 ist dargestellt, dass die erste Seite des Dokuments, die in1a durch das erste Bild30 abfotografiert worden ist, auch durch drei Bilder, bzw. durch ein drittes Bild32 , ein viertes Bild33 und ein fünftes Bild34 abfotografiert werden kann. Durch ein Abfotografieren einer Dokumentenseite durch mehrere Bilder, kann für jedes Bild eine höhere Auflösung der jeweils darin enthaltenen Textblöcke erreicht werden. Durch die höhere Auflösung wird in der Regel eine bessere OCR-Erkennungsrate ermöglicht, was den höheren Aufwand je nach Dokumentenmaterial und Qualität der Kamera des Mobilfunkgeräts rechtfertigen kann. Im Beispiel von3 werden im dritten Bild32 zwei Textblöcke und eine halbe Abbildung an Stelle4 erkannt. Im folgenden vierten Bild33 werden zwei Textblöcke und die Abbildung an der Stelle4 erkannt. - Dies macht deutlich, dass der Reihenfolgeerkennungsalgorithmus zweckmäßigerweise auch überlappende gemeinsame Bereiche zwischen Bilden erkennt. Auf diese Weise kann in dem dritten Bild
32 und in dem vierten Bild33 beispielsweise erkannt werden, dass nach dem Textblock an Stelle3 aus dem dritten Bild32 die Abbildung an Stelle4 aus dem vierten Bild33 folgt und nach der Abbildung an Stelle4 der Textblock an Stelle5 aus dem vierten Bild33 folgt. - Die Reihenfolgeerkennung umfasst bevorzugt auch einen Algorithmus zum Erkennen bzw. Zusammensetzen benachbarter Bilder
32 –34 (Stitching), um dadurch besser benachbarte und aufeinander folgende Textblöcke erkennen bzw. bestimmen zu können. - Desweiteren ist es auch denkbar, dass anstelle dass alle Verarbeitungsprozesse auf dem Mobilfunkgerät ausgeführt werden, ein Teil der Verarbeitungsprozesse auf einem externen Server ausgeführt werden. So ist es gut denkbar, dass die aufgenommenen Bilder
30 –31 bzw.32 –34 , wie beispielsweise das erste Bild30 und das zweite Bild31 , sowie weitere Bilder32 –34 des Dokuments durch das Mobilfunkgerät an einen Server übertragen werden. Der Server verarbeitet die Bilder30 –31 bzw.32 –34 durch Erkennung der entsprechenden Layout-Strukturen, führt eine OCR Erkennung und eine Reihenfolgeerkennung durch und bildet die Datei40 , wie oben beschrieben. Danach sendet der Server die Datei40 an das Mobilfunkgerät zurück, wo die Datei40 bzw. das Dokument dann auf dem Mobilfunkgerät in dem geeigneten Format angesehen werden kann. Dabei sind auch andere Teilprozesse als Auslagerung auf den Server denkbar, beispielsweise nur die OCR-Konvertierung oder die Reihenfolgeerkennung und dergleichen. - Ein Vorteil die Bilder
30 –31 bzw.32 –34 zu einem Server zu senden besteht auch darin, dass auf dem Server dann zugleich auch eine Datei40 in einem zweiten Format erstellt werden kann, wobei das zweite Format im Wesentlichen für die Darstellung auf einem PC-Monitor oder für einen Ausdruck auf standardisiertem Druckerpapier geeignet ist. Das zweite Format weist dabei eine zweite Breite auf, die beispielsweise einer Breite des DIN A4 Formats oder des US Letter-Formats entspricht. Dabei kann beispielsweise auch eingestellt werden, ob das zweite Format an ein Längs- oder an ein Querformat angepasst sein soll oder eine andere Breite aufweisen soll. Bevorzugt kann dabei ebenso die Schriftart und/oder die Schriftgröße eingestellt werden. - Eine weitere Art der Konvertierung der aufgenommenen Bilder
30 –31 bzw.32 –34 des Dokuments in ein anderes geeignetes Format ist zunächst wieder eine Erkennung der Layout-Struktur und der Reihenfolge der Textblöcke und bevorzugt der Abbildungen. Bei der weiteren Art werden die Textblöcke und bevorzugt die Abbildungen dann jedoch in dem anderen geeigneten Format als Bildteile zusammengesetzt. Dabei wird also keine OCR-Konvertierung der Textinformation durchgeführt, sondern es werden lediglich die Bildteile der Textblöcke und der Abbildungen, die aus dem jeweiligen Bild automatisch digital ausgeschnitten werden, in der bestimmten Reihenfolge angeordnet und zu einer Datei40 zusammengefügt. - Weitere mögliche Ausbildungsformen sind in den folgenden Ansprüchen beschrieben.
- Die In den Ansprüchen genannten Bezugszeichen dienen der besseren Verständlichkeit, beschränken aber die Ansprüche nicht auf die in den Figuren dargestellten Formen.
- Bezugszeichenliste
-
- 1–19
- Stelle
- 30
- erstes Bild
- 31
- zweites Bild
- 32
- drittes Bild
- 33
- viertes Bild
- 34
- fünftes Bild
- 40
- Datei
- 41
- Breite des Formats
- 42
- Ausschnitt
- ZITATE ENTHALTEN IN DER BESCHREIBUNG
- Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
- Zitierte Patentliteratur
-
- US 2001/0280450 A1 [0003]
- US 2009/244293 A1 [0004]
- WO 2009/104193 A1 [0005]
- KR 2008/0050272 A [0006]
- WO 2006/124473 [0007]
- US 12/455252 [0008]
- US 2010/0199197 A1 [0010]
Claims (15)
- Verfahren zur Aufnahme eines Dokuments mit einem kamerabasierten Mobilfunkgerät und zur Konversion von Textinformation des Dokuments in ein Format zu einer geeigneten Darstellung auf dem Mobilfunkgerät, die folgenden Schritte umfassend: a) Aufnehmen des Dokuments mit dem Mobilfunkgerät durch mindestens ein Bild und Abspeichern des mindestens einen Bildes; b) Erkennen einer jeweiligen Layout-Struktur mit mindestens einem Textblock in dem jeweiligen Bild; c) Erkennen von Buchstabentext in dem jeweiligen Textblock durch Anwenden eines Optical Character Recognition Algorithmus (OCR) und Abspeichern des jeweiligen Buchstabentexts zu dem jeweiligen Textblock; gekennzeichnet durch: d) Bestimmen und Abspeichern einer Reihenfolge der jeweiligen Textblöcke in dem Dokument unter Berücksichtigung der jeweiligen Layout-Struktur; e) Selektieren eines geeigneten Formats für die Darstellung der Buchstabentexte auf einem Display des Mobilfunkgeräts, wobei das geeignete Format an eine Breite des Displays angepasst ist, so dass beim Lesen der Buchstabentexte auf dem Display nur vertikal gescrollt werden muss; f) Erzeugen einer Datei (
40 ) in dem geeigneten Format mit den jeweiligen Buchstabentexten in der bestimmten Reihenfolge der jeweiligen Textblöcke; g) Bereitstellen der Datei (40 ) für das Mobilfunkgerät zur Darstellung auf dem Display. - Verfahren gemäß Anspruch 1, wobei in Schritt b) in der Layout-Struktur auch Abbildungen erkannt werden, wobei in Schritt d) die Abbildungen in der Reihenfolge der Textblöcke mit einbezogen werden, so dass eine Reihenfolge aus den Textblöcken und den Abbildungen erzeugt wird, und wobei in Schritt f) die Abbildungen der Breite des Displays angepasst werden, so dass bei der Darstellung auf dem Mobilfunkgerät nur vertikal gescrollt werden muss.
- Verfahren gemäß Anspruch 1 oder 2, wobei die Erkennung der Layout-Struktur auf Basis einer Histogramm-Analyse der Schwärzungsverteilung in dem jeweiligen Bild erfolgt.
- Verfahren gemäß einem oder mehreren der vorstehenden Ansprüche, wobei in Schritt d) bei der Bestimmung der Reihenfolge der jeweiligen Textblöcke ferner – die Reihenfolge untereinander stehender Textblöcke berücksichtigt wird; – eine syntaktische Verbindung zwischen nebeneinanderstehenden Textblöcken analysiert wird, wobei sich beispielsweise nebeneinanderstehende Textblöcke syntaktisch ergänzen und so mit hoher Wahrscheinlichkeit auf einander folgen.
- Verfahren gemäß einem oder mehreren der vorstehenden Ansprüche, wobei in Schritt d) bei der Bestimmung der Reihenfolge der jeweiligen Textblöcke ferner – eine semantische Verbindung zwischen benachbarten Textblöcken analysiert wird, um festzustellen, ob diese dem gleichen oder einem nächsten Themengebiet zugehören.
- Verfahren gemäß einem oder mehreren der vorstehenden Ansprüche, wobei in Schritt d) bei der Bestimmung der Reihenfolge der jeweiligen Textblöcke ferner – bei benachbarten Textblöcken eine Histogramm-Wortanalyse oder eine Kantenfilterung mit anschließender Cluster-Bestimmung vorgenommen und berücksichtigt wird, um festzustellen, ob diese dem gleichen oder einem nächsten Themengebiet zugehören.
- Verfahren gemäß Anspruch 6, wobei bei der Histogramm-Wortanalyse Schlüsselworte wie beispielsweise die Schlüsselworte einer Überschrift eines jeweiligen Artikels des Dokuments verwendet werden.
- Verfahren gemäß einem oder mehreren der vorstehenden Ansprüche, wobei in Schritt d) bei der Bestimmung der Reihenfolge der jeweiligen Textblöcke ferner – auch die Abfolge der aufeinander folgenden Bilder berücksichtigt wird.
- Verfahren gemäß einem oder mehreren der vorstehenden Ansprüche, wobei in Schritt d) bei der Bestimmung der Reihenfolge der jeweiligen Textblöcke ferner – auch semantisch zusammengehörende Textblöcke aufeinander folgender Bilder untersucht und berücksichtigt werden.
- Verfahren gemäß einem oder mehreren der vorstehenden Ansprüche, wobei in Schritt e) das selektierte geeignete Format ein PDF Format mit einer Breite ist, die der Breite des Displays des Mobilfunkgeräts entspricht.
- Verfahren gemäß einem oder mehreren der Ansprüche 1–9, wobei in Schritt e) das selektierte geeignete Format ein Standard-Text-Format mit einer Breite ist, die der Breite des Displays des Mobilfunkgeräts entspricht.
- Verfahren gemäß einem oder mehreren der vorstehenden Ansprüche, wobei das abgespeicherte, mindestens eine Bild in Schritt a) an einen Server übertragen wird, wobei die Schritte b–d) im Server ausgeführt werden und die Buchstabentexte und die geeignete Reihenfolge der jeweiligen Textblöcke zum Mobilfunkgerät zurückgesendet werden.
- Verfahren gemäß Anspruch 12, wobei die Schritte e–f) ebenfalls im Server ausgeführt werden und wobei die in Schritt f) erzeugte Datei (
40 ) anschließend zum Mobilfunkgerät zur Ansicht zurückgesendet wird. - Verfahren gemäß einem oder mehreren der vorstehenden Ansprüche, wobei die jeweiligen Buchstabentexte in der bestimmten Reihenfolge der jeweiligen Textblöcke zudem in einem zweiten Format abgespeichert werden, wobei das zweite Format ein gut ausdruckbares Standardpapierformat ist und gut auf PC-Monitoren zum Lesen von Text verwendbar ist, wie beispielsweise das DIN A4 Format oder das US Letter-Format.
- Serversystem zur Konvertierung eines Textinhalts aus Bildern, die durch ein Mobilfunkgerät von einem Dokuments aufgenommen und an das Serversystem übermittelten worden sind, wobei der Textinhalt in ein Format konvertiert wird, das für die Darstellung auf dem Mobilfunkgerät geeignet ist und an das Mobilfunkgerät zurückgesendet wird, umfassend: a) Erste Mittel zum Empfangen der Bilder von dem Mobilfunkgerät, wobei die Bilder jeweils mindestens einen Textblock enthalten; b) Zweite Mittel zum Erkennen einer jeweiligen Layout-Struktur mit dem mindestens einem Textblock in dem jeweiligen Bild; c) Dritte Mittel zum Erkennen von Buchstabentext in dem jeweiligen Textblock durch Anwenden eines Optical Character Recognition Algorithmus (OCR) und zum Abspeichern des jeweiligen Buchstabentexts zu dem jeweiligen Textblock; d) Vierte Mittel zum Bestimmen und Abspeichern einer Reihenfolge der jeweiligen Textblöcke in dem Dokument unter Berücksichtigung der jeweiligen Layout-Struktur; e) Fünfte Mittel zur Auswahl eines geeigneten Formats für die Darstellung der Buchstabentexte auf einem Display des Mobilfunkgeräts, wobei das geeignete Format an eine Breite des Displays angepasst ist, so dass beim Lesen der Buchstabentexte auf dem Display nur vertikal gescrollt werden muss; f) Sechste Mittel zur Erzeugung einer Datei (
40 ) in dem geeigneten Format mit den jeweiligen Buchstabentexten in der bestimmten Reihenfolge der jeweiligen Textblöcke; g) Siebte Mittel zum Zurücksenden der erzeugten Datei (40 ) an das Mobilfunkgerät.
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102012102797.8A DE102012102797B4 (de) | 2012-03-30 | 2012-03-30 | Kamerabasiertes Mobilfunkgerät zur Konvertierung eines Dokuments anhand von aufgenommenen Bildern in ein Format zur optimierten Anzeige auf dem kamerabasierten Mobilfunkgerät |
US13/852,937 US20130259377A1 (en) | 2012-03-30 | 2013-03-28 | Conversion of a document of captured images into a format for optimized display on a mobile device |
US14/328,304 US20140325348A1 (en) | 2012-03-30 | 2014-07-10 | Conversion of a document of captured images into a format for optimized display on a mobile device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102012102797.8A DE102012102797B4 (de) | 2012-03-30 | 2012-03-30 | Kamerabasiertes Mobilfunkgerät zur Konvertierung eines Dokuments anhand von aufgenommenen Bildern in ein Format zur optimierten Anzeige auf dem kamerabasierten Mobilfunkgerät |
Publications (2)
Publication Number | Publication Date |
---|---|
DE102012102797A1 true DE102012102797A1 (de) | 2013-10-02 |
DE102012102797B4 DE102012102797B4 (de) | 2017-08-10 |
Family
ID=49154591
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE102012102797.8A Active DE102012102797B4 (de) | 2012-03-30 | 2012-03-30 | Kamerabasiertes Mobilfunkgerät zur Konvertierung eines Dokuments anhand von aufgenommenen Bildern in ein Format zur optimierten Anzeige auf dem kamerabasierten Mobilfunkgerät |
Country Status (2)
Country | Link |
---|---|
US (2) | US20130259377A1 (de) |
DE (1) | DE102012102797B4 (de) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6099961B2 (ja) * | 2012-12-18 | 2017-03-22 | キヤノン株式会社 | 画像表示装置、画像表示装置の制御方法およびコンピュータプログラム |
US9746576B2 (en) * | 2014-05-27 | 2017-08-29 | Baker Hughes Incorporated | Wettability estimation using magnetic resonance |
JP6559415B2 (ja) * | 2014-11-20 | 2019-08-14 | シャープ株式会社 | 文書画像処理装置、それを備えた情報処理装置、プログラム、及び記録媒体 |
CN105988568B (zh) | 2015-02-12 | 2020-07-24 | 北京三星通信技术研究有限公司 | 获取笔记信息的方法和装置 |
JP6598600B2 (ja) * | 2015-09-03 | 2019-10-30 | コニカミノルタ株式会社 | 文書生成システム、文書サーバ、端末装置、文書生成方法、およびコンピュータプログラム |
US20170212870A1 (en) * | 2016-01-26 | 2017-07-27 | Issuu, Inc. | Method and System to Display Content from a PDF Document on a Small Screen |
JP7003457B2 (ja) * | 2017-06-26 | 2022-01-20 | コニカミノルタ株式会社 | 文書再構成装置 |
JP7225548B2 (ja) * | 2018-03-22 | 2023-02-21 | セイコーエプソン株式会社 | 画像処理装置、画像処理方法および画像処理プログラム |
US11100160B2 (en) | 2018-07-31 | 2021-08-24 | International Business Machines Corporation | Intelligent image note processing |
US11238215B2 (en) | 2018-12-04 | 2022-02-01 | Issuu, Inc. | Systems and methods for generating social assets from electronic publications |
CN110119743B (zh) * | 2019-05-06 | 2023-04-04 | 上海创功通讯技术有限公司 | 一种图片识别方法、服务器及计算机可读存储介质 |
US11803689B2 (en) * | 2020-08-05 | 2023-10-31 | Microstrategy Incorporated | System and method for dossier creation with responsive view handling for free-form layout |
CN112862926B (zh) * | 2021-01-29 | 2023-08-01 | 成都环宇知了科技有限公司 | 一种基于Swoole框架的智能图片合成方法及*** |
US11886815B2 (en) * | 2021-05-28 | 2024-01-30 | Adobe Inc. | Self-supervised document representation learning |
US20230046344A1 (en) * | 2021-08-09 | 2023-02-16 | Nintex Uk Ltd | Systems, Methods, and Devices for a Form Converter |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006124473A2 (en) | 2005-05-18 | 2006-11-23 | Scanr, Inc. | System and method for capturing and processing business data |
KR20080050272A (ko) | 2006-12-02 | 2008-06-05 | 한국전자통신연구원 | 화소 이동 문서 영상 조합 인식 방법을 이용한 카메라 문자인식 장치 및 방법 |
WO2009104193A1 (en) | 2008-02-24 | 2009-08-27 | Xsights Media Ltd. | Provisioning of media objects associated with printed documents |
US20090244293A1 (en) | 2002-10-08 | 2009-10-01 | Schaffner Edwin K | Mobile issuance of official documents with biometric information encoded thereon |
US20100199197A1 (en) | 2008-11-29 | 2010-08-05 | Handi Mobility Inc | Selective content transcoding |
Family Cites Families (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6175844B1 (en) * | 1997-05-29 | 2001-01-16 | Adobe Systems Incorporated | Ordering groups of text in an image |
US6303921B1 (en) * | 1999-11-23 | 2001-10-16 | Hewlett-Packard Company | Method and system for capturing large format documents using a portable hand-held scanner |
EP1170674A3 (de) * | 2000-07-07 | 2002-04-17 | LION Bioscience AG | Verfahren und Gerät um elektronische Daten zu bestellen |
US6704024B2 (en) * | 2000-08-07 | 2004-03-09 | Zframe, Inc. | Visual content browsing using rasterized representations |
US7046401B2 (en) * | 2001-06-01 | 2006-05-16 | Hewlett-Packard Development Company, L.P. | Camera-based document scanning system using multiple-pass mosaicking |
JP3824165B2 (ja) * | 2002-04-10 | 2006-09-20 | 松下電器産業株式会社 | コンテンツ生成装置、受信装置、印刷装置およびコンテンツ印刷システム |
US7272258B2 (en) * | 2003-01-29 | 2007-09-18 | Ricoh Co., Ltd. | Reformatting documents using document analysis information |
US7362311B2 (en) * | 2003-04-07 | 2008-04-22 | Microsoft Corporation | Single column layout for content pages |
US20050195221A1 (en) * | 2004-03-04 | 2005-09-08 | Adam Berger | System and method for facilitating the presentation of content via device displays |
US20050216846A1 (en) * | 2004-03-26 | 2005-09-29 | Mika Kalenius | Normal versus small screen rendering with given URL |
US20060062362A1 (en) * | 2004-09-22 | 2006-03-23 | Davis Franklin A | System and method for server assisted browsing |
DE102004049676A1 (de) * | 2004-10-12 | 2006-04-20 | Infineon Technologies Ag | Verfahren zur rechnergestützten Bewegungsschätzung in einer Vielzahl von zeitlich aufeinander folgenden digitalen Bildern, Anordnung zur rechnergestützten Bewegungsschätzung, Computerprogramm-Element und computerlesbares Speichermedium |
US9208480B2 (en) * | 2004-11-05 | 2015-12-08 | Rdm Corporation | Mobile deposit system for digital image and transaction management |
US20060103893A1 (en) * | 2004-11-15 | 2006-05-18 | Kouros Azimi | Cellular telephone based document scanner |
US7330608B2 (en) * | 2004-12-22 | 2008-02-12 | Ricoh Co., Ltd. | Semantic document smartnails |
US7930647B2 (en) * | 2005-12-11 | 2011-04-19 | Topix Llc | System and method for selecting pictures for presentation with text content |
US20070292026A1 (en) * | 2006-05-31 | 2007-12-20 | Leon Reznik | Electronic magnification device |
US20080059453A1 (en) * | 2006-08-29 | 2008-03-06 | Raphael Laderman | System and method for enhancing the result of a query |
US7801358B2 (en) * | 2006-11-03 | 2010-09-21 | Google Inc. | Methods and systems for analyzing data in media material having layout |
JP2008117308A (ja) * | 2006-11-07 | 2008-05-22 | Lab At Site Ltd | 通信ネットワークを利用した画像レイアウトシステム |
US20080235564A1 (en) * | 2007-03-21 | 2008-09-25 | Ricoh Co., Ltd. | Methods for converting electronic content descriptions |
HK1111566A2 (en) * | 2007-07-20 | 2008-08-08 | Pccw Hkt Datacom Services Ltd | An iptv trading system and method |
KR100958786B1 (ko) * | 2007-10-08 | 2010-05-18 | 엔에이치엔(주) | 웹문서 편집 방법 및 장치 |
JP5343861B2 (ja) * | 2007-12-27 | 2013-11-13 | 日本電気株式会社 | テキスト分割装置とテキスト分割方法およびプログラム |
JP2009169536A (ja) * | 2008-01-11 | 2009-07-30 | Ricoh Co Ltd | 情報処理装置、画像形成装置、ドキュメント生成方法、ドキュメント生成プログラム |
US8582862B2 (en) * | 2010-05-12 | 2013-11-12 | Mitek Systems | Mobile image quality assurance in mobile document image processing applications |
US20090214134A1 (en) * | 2008-02-27 | 2009-08-27 | Motorola, Inc. | System and method for image data extraction and assembly in digital cameras |
US20090224047A1 (en) * | 2008-03-05 | 2009-09-10 | Konica Minolta Systems Laboratory, Inc. | Contactless Scan Position Orientation Sensing |
EP2189926B1 (de) * | 2008-11-21 | 2012-09-19 | beyo GmbH | Verfahren zur Bereitstellung von kamerabasierten Diensten bei Verwendung eines tragbaren Kommunikationsgerätes eines Benutzers und tragbares Kommunikationsgerät eines Benutzers |
US20110044554A1 (en) * | 2009-08-21 | 2011-02-24 | Konica Minolta Systems Laboratory, Inc. | Adaptive deblurring for camera-based document image processing |
US20130033521A1 (en) * | 2010-04-19 | 2013-02-07 | Tactile World Ltd. | Intelligent display system and method |
US8811711B2 (en) * | 2011-03-08 | 2014-08-19 | Bank Of America Corporation | Recognizing financial document images |
US8834251B2 (en) * | 2011-09-16 | 2014-09-16 | Elottery, Inc. | Location and age verification for mobile lottery play |
-
2012
- 2012-03-30 DE DE102012102797.8A patent/DE102012102797B4/de active Active
-
2013
- 2013-03-28 US US13/852,937 patent/US20130259377A1/en not_active Abandoned
-
2014
- 2014-07-10 US US14/328,304 patent/US20140325348A1/en not_active Abandoned
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090244293A1 (en) | 2002-10-08 | 2009-10-01 | Schaffner Edwin K | Mobile issuance of official documents with biometric information encoded thereon |
WO2006124473A2 (en) | 2005-05-18 | 2006-11-23 | Scanr, Inc. | System and method for capturing and processing business data |
KR20080050272A (ko) | 2006-12-02 | 2008-06-05 | 한국전자통신연구원 | 화소 이동 문서 영상 조합 인식 방법을 이용한 카메라 문자인식 장치 및 방법 |
WO2009104193A1 (en) | 2008-02-24 | 2009-08-27 | Xsights Media Ltd. | Provisioning of media objects associated with printed documents |
US20100199197A1 (en) | 2008-11-29 | 2010-08-05 | Handi Mobility Inc | Selective content transcoding |
Non-Patent Citations (4)
Title |
---|
COLLINS-THOMPSON K, NICKOLOV R.: A Clustering-Based Algorithm for Automatic Document Separation, 2002, [http://research.microsoft.com/en-us/um/people/kevynct/pubs/sigir02_docsep.pdf] * |
HU J, KASHI R, WILFON G.: Document Image Layout Comparison and Classification, In Proc. of the Conf. on Document Analysis and Recognition, 1999, S. 285-288 |
HU J, KASHI R, WILFON G.: Document Image Layout Comparison and Classification, In Proc. of the Conf. on Document Analysis and Recognition, 1999, S. 285-288 * |
MARINAI S.: Introduction to Document Analysis and Recognition; In: Machine Learning in Document Analysis and Recognition; 2008; S. 1-20 * |
Also Published As
Publication number | Publication date |
---|---|
US20130259377A1 (en) | 2013-10-03 |
US20140325348A1 (en) | 2014-10-30 |
DE102012102797B4 (de) | 2017-08-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE102012102797B4 (de) | Kamerabasiertes Mobilfunkgerät zur Konvertierung eines Dokuments anhand von aufgenommenen Bildern in ein Format zur optimierten Anzeige auf dem kamerabasierten Mobilfunkgerät | |
DE102017008430A1 (de) | Verfahren und Systeme zum Erzeugen von virtuelle Realität-Umgebungen aus elektronischen Dokumenten | |
EP0814611A2 (de) | Kommunikationssystem und Verfahren zur Aufnahme und Verwaltung digitaler Bilder | |
DE10105941A1 (de) | System und Verfahren zum automatischen Zuweisen eines Dateinamens zu einem gescannten Dokument | |
DE10308014A1 (de) | System und Verfahren zum Lokalisieren eines nichttextlichen Bereichs eines elektronischen Dokumentes oder Bildes, der mit einer benutzerdefinierten Beschreibung des Bereichs übereinstimmt | |
DE212017000257U1 (de) | Systeme zum Anwenden eines Layouts auf Dokumente | |
DE112015005985T5 (de) | Klassifizierung und speicherung von dokumenten | |
EP3298594B1 (de) | System und verfahren zur bearbeitung von wertdokumenten | |
DE102007052622A1 (de) | Verfahren zur Bildanalyse, insbesondere für ein Mobilfunkgerät | |
DE102008041944A1 (de) | Datenverarbeitungsverfahren zur Generierung eines Klassifikators und zur Überprüfung der Echtheit eines Dokuments, Vorrichtung zur Überprüfung der Echtheit eines Dokuments und Computerprogrammprodukt | |
EP2203900A1 (de) | Personenkontrollsystem und verfahren zum durchführen einer personenkontrolle | |
DE60123441T2 (de) | Verfahren und mittel zur mobilen erfassung, verarbeitung, speicherung und übertragung von text und gemischten informationen, die zeichen und bilder enthalten | |
DE102020120953A1 (de) | Digitalzwilling-überwachungssysteme und -verfahren | |
DE112012004847B4 (de) | Verfahren und System zum Detektieren von Linien in einem Bild und Spurdetektionssystem zum Analysieren von Straßenbildern | |
DE102014107384A1 (de) | Verfahren und Vorrichtung zur Steuerung und Regelung eines digitalen Druckprozesses | |
EP1211099A2 (de) | Verfahren zum digitalen Drucken von zusammengesetzten Dokumenten | |
DE102007037032A1 (de) | Verfahren zum Erzeugen eines Templates | |
EP1013070B1 (de) | Verfahren und gerät zur elektronischen archivierung eines computer-datenstroms | |
DE102006047436A1 (de) | Verfahren und System zum automatischen Aufbereiten von Druckdaten für einen Druckvorgang | |
DE102011003156A1 (de) | Kartendaten, Speichermedium und Navigationsvorrichtung | |
EP1553507A2 (de) | Verfahren zur informativen Beschreibung von Bildobjekten | |
DE102007036985B4 (de) | Verfahren, System und Computerprogrammprodukt zum automatischen Aufbereiten von Dokumentenbearbeitungsdaten | |
DE102016222301B4 (de) | Verfahren zum Bereitstellen einer gleichartigen Kopie eines unterschriebenen Dokumentes | |
DE102016124123A1 (de) | Verfahren zum Erzeugen eines Clusters von Bildbereichen zum Erfassen eines Zielobjekts in einem Bild, Computerprogrammprodukt, Kamerasystem und Kraftfahrzeug | |
WO2011054858A1 (de) | Verfahren und vorrichtung zum rechnergestützten annotieren von multimediadaten |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
R012 | Request for examination validly filed | ||
R083 | Amendment of/additions to inventor(s) | ||
R016 | Response to examination communication | ||
R016 | Response to examination communication | ||
R016 | Response to examination communication | ||
R018 | Grant decision by examination section/examining division | ||
R020 | Patent grant now final | ||
R081 | Change of applicant/patentee |
Owner name: NUANCE COMMUNICATIONS, INC., BURLINGTON, US Free format text: FORMER OWNER: BEYO GMBH, 14467 POTSDAM, DE |
|
R082 | Change of representative |
Representative=s name: FARAGO, PETER, DIPL.-ING.UNIV., DE Representative=s name: FARAGO-SCHAUER, PETER, DIPL.-ING. UNIV., DE |