WO2013045547A1 - Method of managing marked documents - Google Patents

Method of managing marked documents Download PDF

Info

Publication number
WO2013045547A1
WO2013045547A1 PCT/EP2012/069077 EP2012069077W WO2013045547A1 WO 2013045547 A1 WO2013045547 A1 WO 2013045547A1 EP 2012069077 W EP2012069077 W EP 2012069077W WO 2013045547 A1 WO2013045547 A1 WO 2013045547A1
Authority
WO
WIPO (PCT)
Prior art keywords
data
document
management
metadata
physical document
Prior art date
Application number
PCT/EP2012/069077
Other languages
French (fr)
Inventor
Thomas Henry
Original Assignee
Xamance
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xamance filed Critical Xamance
Publication of WO2013045547A1 publication Critical patent/WO2013045547A1/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/08Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/08Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
    • G06Q10/087Inventory or stock management, e.g. order filling, procurement or balancing against orders
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N1/32101Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N1/32144Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title embedded in the image data, i.e. enclosed or integrated in the image, e.g. watermark, super-imposed logo or stamp
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/328Processing of the additional information
    • H04N2201/3281Encryption; Ciphering

Definitions

  • the field of the invention is that of the management of physical documents and electronic documents. More specifically, the invention relates to a technique for creating an electronic document from a paper document.
  • the invention applies in particular, but not exclusively, to large paper documents such as, for example, insurance contracts, deeds of ownership, administrative documents, etc.
  • an electronic document is described by data and metadata.
  • the electronic document can be a PDF document, a Word (registered trademark) document, an Excel (registered trademark) document and more generally any document that has been created by an office software.
  • the term "electronic document” does not include documents in Hypertext Markup Language (or HTML) (ie, web pages).
  • the metadata are descriptive information of the electronic document. They make it possible to give an identity to the electronic document and thus to distinguish it from the others.
  • an electronic document may have a metadata element specifying the type of document (contract, invoice, documentation, ...), a metadata element specifying the author or the entity issuing the document (insurance, bank, particular, ...), and a metadata element specifying a date (creation, reception, modification, deadline, ).
  • Such metadata can be created and assigned to the electronic document in a fully automated manner.
  • An electronic document has the advantage of being able to be duplicated, transferred, archived and secured quickly at low cost.
  • a paper document has the advantage of ensuring the durability of the information and of adding probative value to the document, especially in the event of a signature.
  • This scan operation converts a paper document into a scanned document.
  • LAD automatic reading of documents
  • an application LAD implements an automatic recognition module of documents (or RAD) and an optical character recognition module (or OCR).
  • the RAD module is responsible for recognizing the type of document to be processed. Thus, after analyzing the layout of the document as the image location, the box RAD compares it to predetermined models to determine whether it is a quote, a bill , an order or any other document.
  • the OCR module is responsible for reading the document to detect shapes, then comparing them to shape libraries to match a character.
  • Automatic document reading technologies have been an important advance in the process of creating and managing digitized documents. However, they have a number of disadvantages. Firstly, the performance of automatic document reading depends on the print quality of the paper document to be scanned, but also on the quality of the paper, its color, the font used, etc. and the scan quality of the scanner used. Thus, poor print quality or poor scanning quality can produce an electronic version of the paper document that is not usable, in the sense that it is not possible to perform a keyword search. To solve this problem, it is proposed to integrate a dictionary in the OCR module. Thus, if errors occur during the recognition of a character, the OCR then compares the entire word to the content of the dictionary to deduce the closest equivalence and thus correct the misread character. However, this solution requires computing resources and significant processing times.
  • the OCR, the LAD and the RAD are based on statistical methods and can not thus claim a reliability of 100%.
  • the implementation of an automatic reading of documents during the scanning has the disadvantage of increasing the scanning time (that is to say the time of creation of the electronic document).
  • the scanning time of a large paper document such as for example an insurance contract or an authentic document
  • each page of the document is scanned (that is to say scanned) to obtain an image, then the image is processed by a RAD module and / or an OCR module.
  • the invention in at least one embodiment, is intended in particular to overcome the disadvantages described above.
  • an objective is to provide a technique for matching the data and metadata of an electronic document to a corresponding paper document.
  • an objective is to provide a technique for digitizing a paper document without implementing the conventional LAD technologies described above.
  • One such technique aims in particular to quickly create a scanned document while improving its indexing, to allow a user to more reliably find information contained in the document scanned from a keyword.
  • Such a technique is also aimed at obtaining structured data to facilitate the processing carried out, for example, by a rule engine or a statistical analysis tool.
  • Another objective of at least one embodiment of the invention is to provide such a technique which is particularly well suited to the case of scanning a large paper document.
  • Another objective is to provide such a technique that is simple to implement and inexpensive.
  • the tagging method is such that it comprises a step of recording in a database a pair of data associating the management identifier and at least a part of said set of data and metadata.
  • the metadata can be descriptive metadata, structure metadata, and administrative metadata.
  • the data and / or metadata to which the physical marking points can be manually selected by a user (who may be the recipient or issuer of the physical document) or automatically according to predetermined selection criteria.
  • the data and metadata of the electronic document are for example stored in a dedicated information system or a dedicated database.
  • the physical marking is intended to be matched to the physical document.
  • the physical marking may be pasted, stapled, formed, or printed on the physical document.
  • the physical marking results from the coding of a management identifier.
  • the invention relates to a management method by a management system of a marked document obtained by the aforementioned marking method, the management system comprising a scanning system and a storage system, the system scanning process performing steps of:
  • the storage system is such that it performs steps of:
  • the scanning system is such that, upon receiving the at least part of a set of data and metadata, it performs a step f) of recording in a second database of a digital object associating the image of the marked document and the at least part of a set of data and metadata.
  • a tag according to the invention to extract from a database (called the first database) descriptive elements (data and / or metadata) of an electronic document.
  • the marking according to the invention is configured so as to point to all or part of the data and metadata of an electronic document.
  • the technique of the invention can therefore be advantageously used to quickly create an electronic version (that is to say a digital object) of a large paper document.
  • an electronic version that is to say a digital object
  • the digital object of the invention associates an image of a marked document (that is to say a physical document bearing a marking according to the invention) and data and / or metadata.
  • the digital object of the invention comprises structure metadata.
  • these structure metadata make it possible to format the digital object.
  • the processing of the digital object is facilitated by a rule engine or a statistical analysis tool, or an export to a third-party solution (for example, an accounting software).
  • the management method is such that it comprises steps consisting of: - archive the marked document in a physical archive area;
  • the digital object includes an indication of the physical location of the marked document.
  • the physical position information can be generated (and in this sense obtained) automatically by a location device, or manually provided by a user.
  • the physical position information thus confers on the digital object probative value that a conventional digitized document does not have.
  • step e) comprises the steps of:
  • the management method comprises a preliminary step of modifying said marked document, so that steps a), b) and f) are performed with the modified marked document.
  • the marked document can be manually edited by a user.
  • the user can sign or annotate the document by hand.
  • said marking comprises one of the following elements:
  • the invention relates to a computer program product that includes program code instructions for the implementation of implementation of the above management method (in any of its various embodiments), when said program is run on a computer.
  • the invention in another embodiment, relates to a computer readable storage means storing a computer program comprising a set of computer executable instructions for implementing the aforesaid management method (in any one of of its different embodiments).
  • the invention relates to a management system of a marked document obtained by the aforementioned marking method, the management system comprising a scanning system and a storage system, the scanning system comprising:
  • the storage system is such that it includes:
  • the scanning system is such that it includes means for storing in a second database a digital object associating the image of the marked document with the at least part of a set of data and metadata.
  • the management system comprises means for implementing the steps of the management method as described above, in any one of its various embodiments. 5. LIST OF FIGURES
  • FIG. 1 shows a marking system according to a particular embodiment of the present invention.
  • Figure 2 shows a management system according to a particular embodiment of the present invention.
  • FIG. 1 represents by way of illustration a marking system according to a particular embodiment of the present invention.
  • the marking system 1 comprises a processing unit 11 (for example, a computer), a printing unit 12 and a remote database 13.
  • the processing unit 11 communicates with the printing unit 12 via a cable 14.
  • the processing unit 11 communicates with the remote database 13 via a communication network 18 such as that, for example, the Internet network or any intranet network.
  • a user uses the processing unit 11 to create an electronic document.
  • the electronic document is, for example, a text document 15.
  • the text document 15 corresponds, for example, to a dissertation thesis.
  • the text document created by the user is described by a set of data and metadata.
  • the data are, for example, data corresponding to the text itself, data corresponding to character formatting templates, paragraphs and pages, and data corresponding to non-textual elements such as tables, images and objects of the text. drawings.
  • the metadata are, for example:
  • the processing unit 11 then generates a unique management identifier which is, for example, in the form of a number or a string of characters.
  • the management identifier consists of a prefix identifying the author of the document, followed by the reference of the document.
  • the processing unit 11 associates (step E10) the management identifier with all the data and metadata of the created text document.
  • the processing unit 11 could associate the management identifier with a part of this data and / or metadata.
  • the processing unit 11 creates a data pair 19 comprising the management identifier and the set of data and metadata of the text document 15.
  • the processing unit 11 then records (step E20) this pair of data 19 in the database 13.
  • the processing unit 11 encodes the management identifier to obtain a marking 16.
  • the marking is a two-dimensional barcode.
  • the processing unit 11 inserts the marking 16, for example, into a zone provided for this purpose at the bottom of the first page of the text document 15.
  • the processing unit 11 transmits (step E30), via the cable 14, the data of the text document 15 to the printing unit 12.
  • the printing unit 12 prints the text document, for example, on a paper support.
  • the printing unit 12 generates (step E40) thus a physical document 17 whose first page of paper bears the marking 16. In other words, the marking 16 is matched to the physical document 17.
  • the tagging could be an RFID tag.
  • the marking system 1 could comprise an RFID tag production unit. Once the physical document 17 has been printed by the printing unit 12, the RFID tag is matched to the physical document 17. For example, the RFID tag is pasted on the first page of the physical document 17.
  • the user transmits, for example, by mail the physical document 17 to a recipient, for example, the secretariat of his university.
  • FIG. 2 represents by way of illustration a management system according to a particular embodiment of the present invention.
  • the management system 2 comprises a scanning system 21 and a storage system 22.
  • the scanning system 21 communicates with the storage system 22 via a communication network 23 such as, for example, the Internet network or any intranet network .
  • the scanning system 21 comprises a processing unit 212 (for example, a computer) which cooperates with a scanning unit 211 (scanner).
  • the storage system 22 comprises a management unit 221 which cooperates with the database 13 described above in connection with FIG. 1 and a database 50.
  • the database 13 is in charge of storing data pairs. each associating a management identifier and all or part of a set of data and metadata describing an electronic document.
  • the database 50 is in charge of storing digital objects according to the invention, which are described below.
  • the recipient receives by mail the physical document 17 (for example, a thesis).
  • the recipient modifies the document 17.
  • the recipient affixes his stamp and his signature 30 on the first page of the physical document 17.
  • the recipient scans (step El 10) the first page of the modified physical document 17 'by means of the scanning unit 21 1 (scanner).
  • the digitizing unit 211 generates an image 40 representing the first page of the modified physical document 17 '.
  • the scanning unit 211 could generate a PDF document corresponding to the first page of the modified physical document 17 '.
  • the digitizing unit 211 transmits (step E120) then this image 40 to the processing unit 212.
  • the processing unit 212 cooperates with a device 213 for reading two-dimensional bar codes.
  • the device 213 is in charge of reading and decoding the marking 16 carried by the modified physical document 17 '.
  • the device 213 could transmit the marking 16 to the processing unit 212 which would be in charge of decoding it.
  • the device 213 could transmit the marking 16 to a remote server 214 which would be in charge of decoding it and transmitting the result of the decoding to the processing unit 212.
  • the device 213 obtains a management identifier. Then, the device 213 transmits the management identifier to the processing unit 212.
  • the processing unit 212 transmits the management identifier to the management unit 221 via the network 23 and according to a predetermined communication protocol.
  • the communication protocol used is secure.
  • the management unit 221 receives (step E140) therefore the management identifier from the processing unit 212.
  • the management unit 221 identifies (step El 50), among the pairs of data recorded in the database 13, the one that includes the management identifier received in the step E130.
  • the management unit 221 extracts the data and metadata included in the data pair that has been identified in step El 50.
  • the management unit 221 transmits the extracted data and metadata to the processing unit 212.
  • the processing unit 212 creates a digital object associating the image 40 of the first page of the modified physical document 17 'and the data and metadata that have been extracted by the management unit 221.
  • the processing unit 212 records (step El 60) the digital object in the database 50.
  • the management method of the invention makes it possible to quickly create an electronic version (that is to say a digital object) of the physical document 17 '(for example, a memory of thesis).
  • the management method of the invention proposes to read and decode the worn marking. by the physical document 17 'to obtain, for example, all or part of the data corresponding to the actual text of this document.
  • the management method of the present invention could be further secured by the implementation by the management unit 221 of a step of identifying the processing unit 212.
  • the management unit 221 could perform the steps described below.
  • the management unit 221 receives from the processing unit 212 the management identifier and current identification data, for example, its IP address.
  • the management unit 221 identifies, among the pairs of data recorded in the database 13, the one that includes the management identifier received.
  • the management unit 221 verifies that the processing unit 212 is authorized to access the information of the pair of data. data identified, from the current identification data (transmitted by the processing unit 212) and the administrative metadata (access and read rights) included in the identified data pair.
  • the management unit 221 If the management unit 221 detects that the processing unit 212 is authorized to access the information of the identified data pair, then the management unit 221 transmits the data and metadata of the identified data pair to the processing unit. 212. In the opposite case, the management unit 221 transmits to the processing unit 212 a message of the "Access denied" type.
  • the recipient archives this document 17' in a physical storage area (not shown) provided for this purpose.
  • the physical storage area is, for example, an archive room with ordered and numbered storage bins.
  • the recipient uses, for example, the processing unit 212 to add to a specific data field of the digital object (registered in the database). data 50) information on the physical location of the archived document 17 '(for example, the number and position of the given storage bin). The information on the physical location thus gives the digital object probative value that a conventional digitized document does not have.
  • the information on the physical location of the archived document 17 'could be transmitted to the database 13, so as to enrich this database 13.
  • the database 13 and the database 50 could form a single database.
  • the issuer could follow (in the sense of visualizing) the various modifications made (signatures, buffers, annotations ...) to his original document.

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)

Abstract

A digitization system obtains (E110) an image of a marked physical document, then reads same and decodes (E130) a marking so as to obtain a management identifier. The storage system receives (E140) this management identifier, then it identifies (E150) the data pair comprising the management identifier received, from among a plurality of data pairs recorded in a first database (13) and each associating a management identifier and at least one part of a set of data and of metadata describing an electronic document. On receipt (from the storage system) of the at least one part of a set of data and of metadata included in the data pair identified, the digitization system records (E160) in a second database (50) a digital object associating the image of the marked physical document and this at least one part of a set of data and of meta data.

Description

Procédé de gestion de documents marqués.  Process for managing marked documents
1. DOMAINE DE L'INVENTION  1. DOMAIN OF THE INVENTION
Le domaine de l'invention est celui de la gestion de documents physiques et de documents électroniques. Plus précisément, l'invention concerne une technique permettant de créer un document électronique à partir d'un document papier. L'invention s'applique notamment, mais non exclusivement, à des documents papier volumineux tels que, par exemple, des contrats d'assurance, des actes de propriété, des documents administratifs, etc.  The field of the invention is that of the management of physical documents and electronic documents. More specifically, the invention relates to a technique for creating an electronic document from a paper document. The invention applies in particular, but not exclusively, to large paper documents such as, for example, insurance contracts, deeds of ownership, administrative documents, etc.
2. ART ANTERIEUR  2. PRIOR ART
Chaque jour un nombre important de documents papier est produit.  Every day a large number of paper documents are produced.
L'informatique a profondément modifié la manière de produire de tels documents papier. En effet, les outils informatiques permettent de créer de manière simple des documents électroniques et de les imprimer sur des supports papier.  IT has profoundly changed the way of producing such paper documents. In fact, computer tools make it possible to easily create electronic documents and print them on paper.
Généralement, un document électronique est décrit par des données et des métadonnées. Par exemple, le document électronique peut être un document PDF, un document Word (marque déposée), un document Excel (marque déposée) et plus généralement tout document ayant été crée par un logiciel de bureautique. Dans le présent document, le terme « document électronique » n'inclut pas les documents en Hypertext Markup Language (ou HTML) (c'est-à-dire les pages web).  Generally, an electronic document is described by data and metadata. For example, the electronic document can be a PDF document, a Word (registered trademark) document, an Excel (registered trademark) document and more generally any document that has been created by an office software. In this document, the term "electronic document" does not include documents in Hypertext Markup Language (or HTML) (ie, web pages).
On rappelle que les métadonnées sont des informations descriptives du document électronique. Elles permettent de donner une identité au document électronique et donc de le distinguer des autres. Par exemple, un document électronique peut avoir un é lément de métadonnées précisant le type du document (contrat, facture, documentation,...), un élément de métadonnées précisant l'auteur ou l'entité émettrice du document (assurance, banque, particulier,...), et un élément de métadonnées précisant une date (création, réception, modification, échéance,...). De telles métadonnées peuvent être créées et assignées au document électronique de façon entièrement automatisée.  It is recalled that the metadata are descriptive information of the electronic document. They make it possible to give an identity to the electronic document and thus to distinguish it from the others. For example, an electronic document may have a metadata element specifying the type of document (contract, invoice, documentation, ...), a metadata element specifying the author or the entity issuing the document (insurance, bank, particular, ...), and a metadata element specifying a date (creation, reception, modification, deadline, ...). Such metadata can be created and assigned to the electronic document in a fully automated manner.
Un document électronique présente l'avantage de pouvoir être dupliqué, transféré, archivé et sécurisé rapidement à faible coût. Un document papier a pour avantage d'assurer une pérennité de l'information et d'apporter une valeur probante au document, notamment en cas de signature. An electronic document has the advantage of being able to be duplicated, transferred, archived and secured quickly at low cost. A paper document has the advantage of ensuring the durability of the information and of adding probative value to the document, especially in the event of a signature.
Les conditions pour qu'un document électronique porte valeur probante impliquent une mise en oeuvre relativement coûteuse et complexe. De plus, ces conditions évoluent au fil du temps et sont différentes d'un pays à un autre. Par ailleurs, il est aujourd'hui impossible d'apporter la continuité de valeur probante entre un document papier et un document numérisé.  The conditions for an electronic document to have probative value imply a relatively expensive and complex implementation. In addition, these conditions change over time and are different from one country to another. Moreover, it is today impossible to bring the continuity of probative value between a paper document and a digitized document.
On cherche donc des techniques de gestion de documents permettant de combiner les avantages du document papier et du document électronique.  We are therefore looking for document management techniques to combine the advantages of the paper document and the electronic document.
Ainsi, de plus en plus d'usagers numérisent les documents papier qu'ils reçoivent. Cette opération de numérisation permet de convertir un document papier en un document numérisé.  As a result, more and more users are digitizing the paper documents they receive. This scan operation converts a paper document into a scanned document.
Actuellement, des technologies de lecture automatique de documents (ou LAD) peuvent être mises en œuvre lors de la numérisation. Ces technologies LAD sont bien connues de l'Homme du Métier et donc pas décrites en détail dans ce document.  Currently, technologies of automatic reading of documents (or LAD) can be implemented during the scanning. These LAD technologies are well known to those skilled in the art and therefore not described in detail in this document.
On rappelle uniquement qu'une application LAD met en œuvre un module de reconnaissance automatique de documents (ou RAD) et un module de reconnaissance optique des caractères (ou OCR).  It is recalled only that an application LAD implements an automatic recognition module of documents (or RAD) and an optical character recognition module (or OCR).
Le module RAD est en charge de reconnaître le type du document à traiter. Ainsi, après avoir analysé la mise en page du document comme l'emplacement d'image, d'encadré, le module RAD la compare à des modèles prédéterminés afin de déterminer s'il s'agit d'un devis, d'une facture, une commande ou tout autre document.  The RAD module is responsible for recognizing the type of document to be processed. Thus, after analyzing the layout of the document as the image location, the box RAD compares it to predetermined models to determine whether it is a quote, a bill , an order or any other document.
Le module OCR est en charge de lire le document pour détecter les formes, puis les comparer à des bibliothèques de formes pour en faire correspondre un caractère.  The OCR module is responsible for reading the document to detect shapes, then comparing them to shape libraries to match a character.
Ainsi, les techniques de numérisation classiques basées sur les technologies LAD permettent d'obtenir une version électronique d'un document papier avec laquelle il est possible d'effectuer une recherche par mots clés ou une recherche structurée.  Thus, conventional scanning techniques based on LAD technologies make it possible to obtain an electronic version of a paper document with which it is possible to carry out a search by keywords or a structured search.
Les technologies de lecture automatique de documents ont représentés un progrès important dans le mécanisme de création et de gestion de documents numérisés. Cependant, elles présentent un certain nombre d'inconvénients. Tout d'abord, les performances de la lecture automatique de documents sont dépendantes de la qualité d'impression du document papier à numériser, mais aussi de la qualité du papier, de sa couleur, de la police utilisée etc. et de la qualité de numérisation du scanner utilisé. Ainsi, une mauvaise qualité d'impression ou une mauvaise qualité de numérisation peut produire une version électronique du document papier qui n'est pas exploitable, dans le sens où il n'est pas possible d'effectuer une recherche par mots clés. Pour résoudre ce problème, il est proposé d'intégrer un dictionnaire dans le module OCR. Ainsi, si des erreurs surviennent lors de la reconnaissance d'un caractère, l'OCR compare alors le mot entier au contenu du dictionnaire pour en déduire l'équivalence la plus proche et ainsi corriger le caractère mal lu. Cependant, cette solution nécessite des ressources de calcul et des temps de traitement importants. Automatic document reading technologies have been an important advance in the process of creating and managing digitized documents. However, they have a number of disadvantages. Firstly, the performance of automatic document reading depends on the print quality of the paper document to be scanned, but also on the quality of the paper, its color, the font used, etc. and the scan quality of the scanner used. Thus, poor print quality or poor scanning quality can produce an electronic version of the paper document that is not usable, in the sense that it is not possible to perform a keyword search. To solve this problem, it is proposed to integrate a dictionary in the OCR module. Thus, if errors occur during the recognition of a character, the OCR then compares the entire word to the content of the dictionary to deduce the closest equivalence and thus correct the misread character. However, this solution requires computing resources and significant processing times.
De manière générale, l'OCR, la LAD et la RAD sont basées sur des méthodes statistiques et ne peuvent donc prétendre à une fiabilité de 100%.  In general, the OCR, the LAD and the RAD are based on statistical methods and can not thus claim a reliability of 100%.
Par ailleurs, la mise en œuvre d'une lecture automatique de documents lors de la numérisation a pour inconvénient d'augmenter le temps de numérisation (c'est-à-dire le temps de création du document électronique). Ainsi, le temps de numérisation d'un document papier volumineux, tel que par exemple un contrat d'assurance ou un acte authentique, est relativement long. En effet, chaque page du document est scannée (c'est-à-dire numérisée) pour obtenir une image, puis l'image est traitée par un module RAD et/ou un module OCR.  Moreover, the implementation of an automatic reading of documents during the scanning has the disadvantage of increasing the scanning time (that is to say the time of creation of the electronic document). Thus, the scanning time of a large paper document, such as for example an insurance contract or an authentic document, is relatively long. Indeed, each page of the document is scanned (that is to say scanned) to obtain an image, then the image is processed by a RAD module and / or an OCR module.
3. OBJECTIFS DE L'INVENTION 3. OBJECTIVES OF THE INVENTION
L'invention, dans au moins un mode de réalisation, a notamment pour objectif de pallier les inconvénients décrits plus haut.  The invention, in at least one embodiment, is intended in particular to overcome the disadvantages described above.
Plus précisément, dans au moins un mode de réalisation de l'invention, un objectif est de fournir une technique permettant d'apparier les données et métadonnées d'un document électronique à un document papier correspondant.  More specifically, in at least one embodiment of the invention, an objective is to provide a technique for matching the data and metadata of an electronic document to a corresponding paper document.
Dans au moins un autre mode de réalisation de l'invention, un objectif est de fournir une technique permettant de numériser un document papier sans mettre en œuvre les technologies LAD classiques décrites plus haut. Une telle technique vise notamment à créer rapidement un document numérisé tout en améliorant son indexation, afin de permettre à un utilisateur de retrouver de manière plus fiable une information contenue dans le document numérisé à partir d'un mot-clé. Une telle technique vise également à obtenir des données structurées pour faciliter le traitement effectué, par exemple, par un moteur de règle ou un outil d'analyse statistique. In at least one other embodiment of the invention, an objective is to provide a technique for digitizing a paper document without implementing the conventional LAD technologies described above. One such technique aims in particular to quickly create a scanned document while improving its indexing, to allow a user to more reliably find information contained in the document scanned from a keyword. Such a technique is also aimed at obtaining structured data to facilitate the processing carried out, for example, by a rule engine or a statistical analysis tool.
Un autre objectif d'au moins un mode de réalisation de l'invention est de fournir une telle technique qui soit notamment bien adaptée au cas de la numérisation d'un document papier volumineux.  Another objective of at least one embodiment of the invention is to provide such a technique which is particularly well suited to the case of scanning a large paper document.
Enfin, dans au moins un mode de réalisation de l'invention, un autre objectif est de fournir une telle technique qui soit simple à mettre en œuvre et peu coûteuse.  Finally, in at least one embodiment of the invention, another objective is to provide such a technique that is simple to implement and inexpensive.
4. EXPOSÉ DE L'INVENTION 4. PRESENTATION OF THE INVENTION
Dans un mode de réalisation particulier de l'invention, il est proposé un procédé de marquage d'un document physique ayant été généré à partir d'un document électronique, le document électronique étant décrit par un ensemble de données et de métadonnées, ledit procédé comprenant des étapes consistant à :  In a particular embodiment of the invention, there is provided a method for marking a physical document that has been generated from an electronic document, the electronic document being described by a set of data and metadata, said method comprising steps of:
- coder un identifiant de gestion, afin d'obtenir un marquage ;  - code a management identifier, in order to obtain a marking;
- apparier ledit marquage audit document physique, afin d'obtenir un document marqué portant ledit marquage.  - Matching said marking to said physical document, in order to obtain a marked document bearing said marking.
Le procédé de marquage est tel qu'il comprend une étape consistant à enregistrer dans une base de données un couple de données associant l'identifiant de gestion et au moins une partie dudit ensemble de données et de métadonnées.  The tagging method is such that it comprises a step of recording in a database a pair of data associating the management identifier and at least a part of said set of data and metadata.
Ainsi, il est proposé de créer un lien entre un document physique et les données et les métadonnées du document électronique correspondant. Les métadonnées peuvent être des métadonnées descriptives, des métadonnées de structure et des métadonnées administratives.  Thus, it is proposed to create a link between a physical document and the data and metadata of the corresponding electronic document. The metadata can be descriptive metadata, structure metadata, and administrative metadata.
En effet, il est proposé de créer un marquage physique permettant de pointer de manière fiable sur tout ou partie des données et métadonnées du document électronique. Les données et/ou métadonnées sur lesquelles pointe le marquage physique peuvent être choisies manuellement par un utilisateur (qui peut être le destinataire ou l'émetteur du document physique) ou de manière automatique en fonction de critères de sélection prédéterminés.  Indeed, it is proposed to create a physical marking to point reliably all or part of the data and metadata of the electronic document. The data and / or metadata to which the physical marking points can be manually selected by a user (who may be the recipient or issuer of the physical document) or automatically according to predetermined selection criteria.
Les données et métadonnées du document électronique sont par exemple stockées dans un système d'information dédié ou une base de données dédiée. Le marquage physique est destiné à être apparié au document physique. Par exemple, le marquage physique peut être collé, agrafé, formé ou imprimé sur le document physique. The data and metadata of the electronic document are for example stored in a dedicated information system or a dedicated database. The physical marking is intended to be matched to the physical document. For example, the physical marking may be pasted, stapled, formed, or printed on the physical document.
Le marquage physique résulte du codage d'un identifiant de gestion. Selon l'invention, il est proposé d'accoupler l'identifiant de gestion à tout ou partie des données et métadonnées du document électronique.  The physical marking results from the coding of a management identifier. According to the invention, it is proposed to couple the management identifier to all or part of the data and metadata of the electronic document.
Dans un autre mode de réalisation, l'invention concerne un procédé de gestion par un système de gestion d'un document marqué obtenu par le procédé de marquage précité, le système de gestion comprenant un système de numérisation et un système de stockage, le système de numérisation effectuant des étapes consistant à :  In another embodiment, the invention relates to a management method by a management system of a marked document obtained by the aforementioned marking method, the management system comprising a scanning system and a storage system, the system scanning process performing steps of:
a) numériser le document marqué, afin d'obtenir une image du document marqué ;  a) scan the marked document to obtain an image of the marked document;
b) lire et décoder un marquage porté par le document marqué, afin d'obtenir un identifiant de gestion.  b) read and decode a mark carried by the marked document, in order to obtain a management identifier.
Le système de stockage est tel qu'il effectue des étapes consistant à :  The storage system is such that it performs steps of:
c) recevoir en provenance du système de numérisation ledit identifiant de gestion ;  c) receiving from the scanning system said management identifier;
d) parmi une pluralité de couples de données enregistrés dans une première base de données et associant chacun un identifiant de gestion et au moins une partie d'un ensemble de données et de métadonnées décrivant un document électronique, identifier le couple de données comprenant l'identifiant de gestion reçu ;  d) among a plurality of pairs of data recorded in a first database and each associating a management identifier and at least a portion of a set of data and metadata describing an electronic document, identifying the data pair comprising the management identifier received;
e) transmettre vers le système de numérisation la au moins une partie d'un ensemble de données et de métadonnées comprise dans le couple de données identifié.  e) transmitting to the scanning system the at least part of a set of data and metadata included in the identified data pair.
Le système de numérisation est tel qu'il effectue, sur réception de la au moins une partie d'un ensemble de données et de métadonnées, une étape f) d'enregistrement dans une deuxième base de données d'un objet numérique associant l'image du document marqué et la au moins une partie d'un ensemble de données et de métadonnées.  The scanning system is such that, upon receiving the at least part of a set of data and metadata, it performs a step f) of recording in a second database of a digital object associating the image of the marked document and the at least part of a set of data and metadata.
Il est donc proposé de créer une version électronique d'un document physique sans utiliser les technologies LAD classiques décrites ci-dessus en relation avec l'art antérieur. Plus précisément, il est proposé ici d'utiliser un marquage selon l'invention pour extraire d'une base de données (appelée première base de données) des éléments descriptifs (données et/ou métadonnées) d'un document électronique. Comme indiqué plus haut, le marquage selon l'invention est configuré de telle sorte à pointer sur tout ou partie des données et métadonnées d'un document électronique. It is therefore proposed to create an electronic version of a physical document without using the conventional LAD technologies described above in connection with the prior art. More specifically, it is proposed here to use a tag according to the invention to extract from a database (called the first database) descriptive elements (data and / or metadata) of an electronic document. As indicated above, the marking according to the invention is configured so as to point to all or part of the data and metadata of an electronic document.
Ainsi, il est proposé de remplacer les opérations de lecture automatique classiques (reconnaissance automatique de documents et reconnaissance optique des caractères) par une opération d'extraction d'éléments descriptifs (données et/ou métadonnées) enregistrés dans une base de données. L'opération d'extraction de l'invention est donc plus simple et plus rapide à exécuter par rapport aux opérations de lecture automatique classiques. De cette façon, l'objet numérique de l'invention est créé plus rapidement qu'un document numérisé.  Thus, it is proposed to replace the conventional automatic reading operations (automatic recognition of documents and optical character recognition) by an extraction operation of descriptive elements (data and / or metadata) recorded in a database. The extraction operation of the invention is therefore simpler and faster to execute compared to conventional automatic reading operations. In this way, the digital object of the invention is created faster than a scanned document.
La technique de l'invention peut donc être avantageusement utilisée pour créer rapidement une version électronique (c'est-à-dire un objet numérique) d'un document papier volumineux. En effet, il n'est plus nécessaire de numériser toutes les pages du document papier, il suffit simplement de lire et décoder le marquage porté par le document papier pour obtenir les données et métadonnées du document électronique correspondant, et donc obtenir tout ou partie de l'information contenue dans le document papier.  The technique of the invention can therefore be advantageously used to quickly create an electronic version (that is to say a digital object) of a large paper document. In fact, it is no longer necessary to scan all the pages of the paper document, all that is necessary is to simply read and decode the marking carried by the paper document to obtain the data and metadata of the corresponding electronic document, and thus obtain all or part of the information contained in the paper document.
Avantageusement, l'objet numérique de l'invention associe une image d'un document marqué (c'est-à-dire un document physique portant un marquage selon l'invention) et des données et/ou métadonnées.  Advantageously, the digital object of the invention associates an image of a marked document (that is to say a physical document bearing a marking according to the invention) and data and / or metadata.
De façon avantageuse, il est possible d'effectuer une recherche par mots clés sur les données et/ou métadonnées compris dans l'objet numérique.  Advantageously, it is possible to perform a keyword search on the data and / or metadata included in the digital object.
Avantageusement, l'objet numérique de l'invention comprend des métadonnées de structure. Ainsi, ces métadonnées de structure permettent de formater l'objet numérique. De cette façon, on facilite le traitement de l'objet numérique par un moteur de règle ou un outil d'analyse statistique, ou un export vers une solution tierce (par exemple, un logiciel de comptabilité).  Advantageously, the digital object of the invention comprises structure metadata. Thus, these structure metadata make it possible to format the digital object. In this way, the processing of the digital object is facilitated by a rule engine or a statistical analysis tool, or an export to a third-party solution (for example, an accounting software).
Avantageusement, le procédé de gestion est tel qu'il comprend des étapes consistant à : - archiver le document marqué dans une zone d'archivage physique ; Advantageously, the management method is such that it comprises steps consisting of: - archive the marked document in a physical archive area;
- obtenir une information de position physique relative à ladite zone d'archivage physique ;  obtaining physical position information relating to said physical archive area;
- insérer ladite information de position physique dans l'objet numérique.  inserting said physical position information in the digital object.
Ainsi, l'objet numérique comprend une indication sur l'emplacement physique du document marqué. L'information de position physique peut être générée (et dans ce sens obtenu) de manière automatique par un dispositif de localisation, ou fournie manuellement par un utilisateur. L'information de position physique confère ainsi à l'objet numérique une valeur probante qu'un document numérisé classique n'a pas.  Thus, the digital object includes an indication of the physical location of the marked document. The physical position information can be generated (and in this sense obtained) automatically by a location device, or manually provided by a user. The physical position information thus confers on the digital object probative value that a conventional digitized document does not have.
De façon avantageuse, l'étape e) comprend des étapes consistant à :  Advantageously, step e) comprises the steps of:
- recevoir en provenance du système de numérisation des données d'identification courantes ;  - receive from the scanning system current identification data;
- détecter un accès autorisé par comparaison desdites données d'identification courantes et de données d'identification de référence comprises dans la au moins une partie d'un ensemble de données et de métadonnées ;  detecting authorized access by comparing said current identification data and reference identification data included in the at least part of a set of data and metadata;
- sur détection positive d'un accès autorisé, transmettre vers le système de numérisation la au moins une partie d'un ensemble de données et de métadonnées.  - On positive detection of an authorized access, transmit to the scanning system the at least part of a set of data and metadata.
Il est donc proposé de sécuriser l'accès aux données et métadonnées.  It is therefore proposed to secure access to data and metadata.
Avantageusement, le procédé de gestion comprend une étape préalable de modification dudit document marqué, de sorte que les étapes a), b) et f) sont effectuées avec le document marqué modifié.  Advantageously, the management method comprises a preliminary step of modifying said marked document, so that steps a), b) and f) are performed with the modified marked document.
Ainsi, le document marqué peut être modifié manuellement par un utilisateur. Par exemple, l'utilisateur peut signer ou annoter à la main le document.  Thus, the marked document can be manually edited by a user. For example, the user can sign or annotate the document by hand.
Dans un mode de réalisation avantageux, ledit marquage comprend l'un des éléments suivants :  In an advantageous embodiment, said marking comprises one of the following elements:
- un code barre ;  - a bar code ;
- une étiquette RFID ; et  - an RFID tag; and
- un marquage magnétique.  - a magnetic marking.
Dans un autre mode de réalisation, l'invention concerne un produit programme d'ordinateur qui comprend des instructions de code de programme pour la mise en œuvre du procédé de gestion précité (dans l'un quelconque de ses différents modes de réalisation), lorsque ledit programme est exécuté sur un ordinateur. In another embodiment, the invention relates to a computer program product that includes program code instructions for the implementation of implementation of the above management method (in any of its various embodiments), when said program is run on a computer.
Dans un autre mode de réalisation, l'invention concerne un moyen de stockage lisible par ordinateur, stockant un programme d'ordinateur comprenant un jeu d'instructions exécutables par un ordinateur pour mettre en œuvre le procédé de gestion précité (dans l'un quelconque de ses différents modes de réalisation).  In another embodiment, the invention relates to a computer readable storage means storing a computer program comprising a set of computer executable instructions for implementing the aforesaid management method (in any one of of its different embodiments).
Dans un autre mode de réalisation, l'invention concerne un système de gestion d'un document marqué obtenu par le procédé de marquage précité, le système de gestion comprenant un système de numérisation et un système de stockage, le système de numérisation comprenant :  In another embodiment, the invention relates to a management system of a marked document obtained by the aforementioned marking method, the management system comprising a scanning system and a storage system, the scanning system comprising:
des moyens pour numériser le document marqué et permettant d'obtenir une image du document marqué ;  means for digitizing the marked document and making it possible to obtain an image of the marked document;
des moyens pour lire et décoder un marquage porté par le document marqué et permettant d'obtenir un identifiant de gestion.  means for reading and decoding a marking carried by the marked document and making it possible to obtain a management identifier.
Le système de stockage est tel qu'il comprend :  The storage system is such that it includes:
des moyens pour recevoir en provenance du système de numérisation ledit identifiant de gestion ;  means for receiving from the digitizing system said management identifier;
des moyens pour identifier, parmi une pluralité de couples de données enregistrés dans une première base de données et associant chacun un identifiant de gestion et au moins une partie d'un ensemble de données et de métadonnées décrivant un document électronique, celui comprenant l'identifiant de gestion reçu par lesdits moyens pour recevoir ;  means for identifying, among a plurality of pairs of data recorded in a first database and each associating a management identifier and at least a part of a set of data and metadata describing an electronic document, the one comprising the identifier management system received by said means for receiving;
des moyens pour transmettre vers le système de numérisation la au moins une partie d'un ensemble de données et de métadonnées comprise dans le couple de données identifié par lesdits moyens pour identifier.  means for transmitting to the scanning system the at least part of a set of data and metadata included in the data pair identified by said means for identifying.
Le système de numérisation est tel qu'il comprend des moyens pour enregistrer dans une deuxième base de données un objet numérique associant l'image du document marqué et la au moins une partie d'un ensemble de données et de métadonnées.  The scanning system is such that it includes means for storing in a second database a digital object associating the image of the marked document with the at least part of a set of data and metadata.
Avantageusement, le système de gestion comprend des moyens de mise en œuvre des étapes du procédé de gestion tel que décrit précédemment, dans l'un quelconque de ses différents modes de réalisation. 5. LISTE DES FIGURES Advantageously, the management system comprises means for implementing the steps of the management method as described above, in any one of its various embodiments. 5. LIST OF FIGURES
D'autres caractéristiques et avantages de l'invention apparaîtront à la lecture de la description suivante, donnée à titre d'exemple indicatif et non limitatif, et des dessins annexés, dans lesquels :  Other features and advantages of the invention will appear on reading the following description, given by way of indicative and nonlimiting example, and the appended drawings, in which:
- la figure 1 représente un système de marquage selon un mode de réalisation particulier de la présente invention ; et - Figure 1 shows a marking system according to a particular embodiment of the present invention; and
la figure 2 représente un système de gestion selon un mode de réalisation particulier de la présente invention.  Figure 2 shows a management system according to a particular embodiment of the present invention.
6. DESCRIPTION D'UN MODE DE REALISATION  6. DESCRIPTION OF AN EMBODIMENT
La figure 1 représente à titre illustratif un système de marquage selon un mode de réalisation particulier de la présente invention.  FIG. 1 represents by way of illustration a marking system according to a particular embodiment of the present invention.
Le système de marquage 1 comprend une unité de traitement 11 (par exemple, un ordinateur), une unité d'impression 12 et une base de données 13 distante. Dans l'exemple de la figure 1, l'unité de traitement 11 communique avec l'unité d'impression 12 via un câble 14. L'unité de traitement 11 communique avec la base de données 13 distante via un réseau de communication 18 tel que, par exemple, le réseau Internet ou un réseau Intranet quelconque.  The marking system 1 comprises a processing unit 11 (for example, a computer), a printing unit 12 and a remote database 13. In the example of FIG. 1, the processing unit 11 communicates with the printing unit 12 via a cable 14. The processing unit 11 communicates with the remote database 13 via a communication network 18 such as that, for example, the Internet network or any intranet network.
Un utilisateur (aussi appelé par la suite émetteur) utilise l'unité de traitement 11 pour créer un document électronique. Le document électronique est, par exemple, un document texte 15. Le document texte 15 correspond, par exemple, à un mémoire de thèse.  A user (hereinafter also called sender) uses the processing unit 11 to create an electronic document. The electronic document is, for example, a text document 15. The text document 15 corresponds, for example, to a dissertation thesis.
Le document texte 15 créée par l'utilisateur est décrit par un ensemble de données et de métadonnées.  The text document created by the user is described by a set of data and metadata.
Les données sont, par exemple, des données correspondant au texte proprement dit, des données correspondant aux modèles de formatage des caractères, des paragraphes et des pages, et des données correspondant aux éléments non textuels tels que des tableaux, des images et des objets de dessins.  The data are, for example, data corresponding to the text itself, data corresponding to character formatting templates, paragraphs and pages, and data corresponding to non-textual elements such as tables, images and objects of the text. drawings.
Les métadonnées sont, par exemple :  The metadata are, for example:
- des métadonnées descriptives pour : - descriptive metadata for:
o donner une description bibliographique approfondie et détaillée dans un format normalisé permettant l'échange de données ; o rattacher le document à l'original ou à différentes versions d'un document ; o donner accès à la copie numérique, o provide a thorough and detailed bibliographic description in a standardized format for data exchange; o attach the document to the original or different versions of a document; o give access to the digital copy,
- des métadonnées de structure pour :  - structure metadata for:
o rattacher les fichiers d'un même document entre eux ;  o attach the files of the same document to each other;
o reconstituer la structure du document : connaître tous les fichiers qui composent un document (fichiers textes, images...), connaître la relation physique entre ces fichiers (ordre d'affichage, fichier cible donnant accès à l'ensemble),  o reconstitute the structure of the document: know all the files that make up a document (text files, images ...), know the physical relation between these files (order of display, target file giving access to the whole),
- des métadonnées administratives pour :  - administrative metadata for:
o gérer les droits : d'accès (droits d'auteur, confidentialité) et d'usage (droits d'impression, de reproduction, de modification...) ;  o manage the rights: access (copyright, confidentiality) and use (rights of printing, reproduction, modification ...);
o préserver les informations techniques nécessaires à la lecture des fichiers ; o garantir l'intégrité des fichiers et le suivi de leurs éventuelles modifications. o preserve the technical information needed to read the files; o guarantee the integrity of the files and the follow-up of their possible modifications.
Dans un mode de réalisation particulier, lorsque l'utilisateur a terminé l'édition de son document texte, il sélectionne, par exemple, dans un menu une option permettant d'effectuer un marquage de son document texte 15. In a particular embodiment, when the user has finished editing his text document, he selects, for example, in a menu an option for marking his text document 15.
L'unité de traitement 11 génère alors un identifiant unique de gestion qui se présente, par exemple, sous la forme d'un numéro ou d'une chaîne de caractères. Dans un exemple de réalisation, l'identifiant de gestion consiste en un préfixe identifiant l'auteur du document, suivi de la référence du document.  The processing unit 11 then generates a unique management identifier which is, for example, in the form of a number or a string of characters. In an exemplary embodiment, the management identifier consists of a prefix identifying the author of the document, followed by the reference of the document.
Selon un exemple de réalisation particulier de l'invention, l'unité de traitement 11 associe (étape E10) l'identifiant de gestion à l'ensemble des données et métadonnées du document texte 15 créée. Bien entendu, l'unité de traitement 11 pourrait associer l'identifiant de gestion à une partie de ces données et/ou métadonnées. Ainsi à cette étape E10, l'unité de traitement 11 créée un couple de données 19 comprenant l'identifiant de gestion et l'ensemble des données et métadonnées du document texte 15.  According to a particular embodiment of the invention, the processing unit 11 associates (step E10) the management identifier with all the data and metadata of the created text document. Of course, the processing unit 11 could associate the management identifier with a part of this data and / or metadata. Thus, at this step E10, the processing unit 11 creates a data pair 19 comprising the management identifier and the set of data and metadata of the text document 15.
L'unité de traitement 11 enregistre (étape E20) ensuite ce couple de données 19 dans la base de données 13.  The processing unit 11 then records (step E20) this pair of data 19 in the database 13.
L'unité de traitement 11 code l'identifiant de gestion pour obtenir un marquage 16. Dans l'exemple de la figure 1, le marquage est un code barres en deux dimensions. L'unité de traitement 11 insère le marquage 16, par exemple, dans une zone prévue à cet effet en bas de la première page du document texte 15. The processing unit 11 encodes the management identifier to obtain a marking 16. In the example of FIG. 1, the marking is a two-dimensional barcode. The processing unit 11 inserts the marking 16, for example, into a zone provided for this purpose at the bottom of the first page of the text document 15.
L'utilisateur sélectionne, par exemple, dans un menu une option permettant d'imprimer le document texte 15. Ainsi, l'unité de traitement 11 transmet (étape E30), via le câble 14, les données du document texte 15 vers l'unité d'impression 12. L'unité d'impression 12 imprime le document texte, par exemple, sur un support papier. L'unité d'impression 12 génère (étape E40) ainsi un document physique 17 dont la première page de papier porte le marquage 16. En d'autres termes, le marquage 16 est apparié au document physique 17.  The user selects, for example, in a menu an option to print the text document 15. Thus, the processing unit 11 transmits (step E30), via the cable 14, the data of the text document 15 to the printing unit 12. The printing unit 12 prints the text document, for example, on a paper support. The printing unit 12 generates (step E40) thus a physical document 17 whose first page of paper bears the marking 16. In other words, the marking 16 is matched to the physical document 17.
Dans un autre mode de réalisation de la présente invention, le marquage pourrait être une étiquette RFID. Dans ce cas particulier, le système de marquage 1 pourrait comprendre une unité de production d'étiquette RFID. Une fois que le document physique 17 a été imprimé par l'unité d'impression 12, l'étiquette RFID est appariée au document physique 17. Par exemple, l'étiquette RFID est collée sur la première page du document physique 17.  In another embodiment of the present invention, the tagging could be an RFID tag. In this particular case, the marking system 1 could comprise an RFID tag production unit. Once the physical document 17 has been printed by the printing unit 12, the RFID tag is matched to the physical document 17. For example, the RFID tag is pasted on the first page of the physical document 17.
Enfin, l'utilisateur transmet, par exemple, par courrier le document physique 17 vers un destinataire, par exemple, le secrétariat de son université.  Finally, the user transmits, for example, by mail the physical document 17 to a recipient, for example, the secretariat of his university.
La figure 2 représente à titre illustratif un système de gestion selon un mode de réalisation particulier de la présente invention.  FIG. 2 represents by way of illustration a management system according to a particular embodiment of the present invention.
Le système de gestion 2 comprend un système de numérisation 21 et un système de stockage 22. Le système de numérisation 21 communique avec le système de stockage 22 via un réseau de communication 23 tel que, par exemple, le réseau Internet ou un réseau Intranet quelconque.  The management system 2 comprises a scanning system 21 and a storage system 22. The scanning system 21 communicates with the storage system 22 via a communication network 23 such as, for example, the Internet network or any intranet network .
Dans l'exemple de la figure 2, le système de numérisation 21 comprend une unité de traitement 212 (par exemple, un ordinateur) qui coopère avec une unité de numérisation 211 (scanner). Le système de stockage 22 comprend une unité de gestion 221 qui coopère avec la base de données 13 décrite ci-dessus en relation avec la figure 1 et une base de données 50. La base de données 13 est en charge de stocker des couples de données associant chacun un identifiant de gestion et tout ou partie d'un ensemble de données et de métadonnées décrivant un document électronique. La base de données 50 est en charge de stocker des objets numériques selon l'invention, qui sont décrits ci- après. In the example of Figure 2, the scanning system 21 comprises a processing unit 212 (for example, a computer) which cooperates with a scanning unit 211 (scanner). The storage system 22 comprises a management unit 221 which cooperates with the database 13 described above in connection with FIG. 1 and a database 50. The database 13 is in charge of storing data pairs. each associating a management identifier and all or part of a set of data and metadata describing an electronic document. The database 50 is in charge of storing digital objects according to the invention, which are described below.
On décrit maintenant en référence à la figure 2, un mode de réalisation particulier du procédé de gestion selon la présente invention.  A particular embodiment of the management method according to the present invention will now be described with reference to FIG.
Le destinataire (par exemple le secrétariat d'une université) reçoit par courrier le document physique 17 (par exemple, un mémoire de thèse).  The recipient (for example the university secretariat) receives by mail the physical document 17 (for example, a dissertation).
Pour accuser réception du document physique 17, le destinataire modifie le document 17. Dans l'exemple de la figure 2, le destinataire appose son cachet et sa signature 30 sur la première page du document physique 17.  To acknowledge receipt of the physical document 17, the recipient modifies the document 17. In the example of Figure 2, the recipient affixes his stamp and his signature 30 on the first page of the physical document 17.
Le destinataire numérise (étape El 10) la première page du document physique modifié 17' au moyen de l'unité de numérisation 21 1 (scanner). A l'issue de cette étape El 10, l'unité de numérisation 211 génère une image 40 représentant la première page du document physique modifié 17'. Dans une variante de réalisation, l'unité de numérisation 211 pourrait générer un document PDF correspondant à la première page du document physique modifié 17'.  The recipient scans (step El 10) the first page of the modified physical document 17 'by means of the scanning unit 21 1 (scanner). At the end of this step El 10, the digitizing unit 211 generates an image 40 representing the first page of the modified physical document 17 '. In an alternative embodiment, the scanning unit 211 could generate a PDF document corresponding to the first page of the modified physical document 17 '.
L'unité de numérisation 211 transmet (étape E120) ensuite cette image 40 à l'unité de traitement 212.  The digitizing unit 211 transmits (step E120) then this image 40 to the processing unit 212.
L'unité de traitement 212 coopère avec un dispositif 213 de lecture de codes barres en deux dimensions.  The processing unit 212 cooperates with a device 213 for reading two-dimensional bar codes.
Le dispositif 213 est en charge de lire et décoder le marquage 16 porté par le document physique modifié 17'. Dans un autre mode de réalisation, le dispositif 213 pourrait transmettre le marquage 16 vers l'unité de traitement 212 qui serait en charge de le décoder. Dans un autre mode de réalisation, le dispositif 213 pourrait transmettre le marquage 16 vers un serveur distant 214 qui serait en charge de le décoder et de transmettre le résultat du décodage vers l'unité de traitement 212.  The device 213 is in charge of reading and decoding the marking 16 carried by the modified physical document 17 '. In another embodiment, the device 213 could transmit the marking 16 to the processing unit 212 which would be in charge of decoding it. In another embodiment, the device 213 could transmit the marking 16 to a remote server 214 which would be in charge of decoding it and transmitting the result of the decoding to the processing unit 212.
Suite au décodage (étape El 30) du marquage 16, le dispositif 213 obtient un identifiant de gestion. Ensuite, le dispositif 213 transmet l'identifiant de gestion à l'unité de traitement 212.  Following decoding (step El 30) of the marking 16, the device 213 obtains a management identifier. Then, the device 213 transmits the management identifier to the processing unit 212.
L'unité de traitement 212 transmet l'identifiant de gestion vers l'unité de gestion 221, via le réseau 23 et selon un protocole de communication prédéterminé. Avantageusement, le protocole de communication utilisé est sécurisé. L'unité de gestion 221 reçoit (étape E140) donc l'identifiant de gestion en provenance de l'unité de traitement 212. The processing unit 212 transmits the management identifier to the management unit 221 via the network 23 and according to a predetermined communication protocol. Advantageously, the communication protocol used is secure. The management unit 221 receives (step E140) therefore the management identifier from the processing unit 212.
L'unité de gestion 221 identifie (étape El 50), parmi les couples de données enregistrés dans la base de données 13, celui qui comprend l'identifiant de gestion reçu à l'étape E130.  The management unit 221 identifies (step El 50), among the pairs of data recorded in the database 13, the one that includes the management identifier received in the step E130.
Ensuite, l'unité de gestion 221 extrait les données et métadonnées comprises dans le couple de données qui a été identifié à l'étape El 50.  Then, the management unit 221 extracts the data and metadata included in the data pair that has been identified in step El 50.
Puis, l'unité de gestion 221 transmet les données et métadonnées extraites vers l'unité de traitement 212.  Then, the management unit 221 transmits the extracted data and metadata to the processing unit 212.
Enfin, l'unité de traitement 212 créée un objet numérique associant l'image 40 de la première page du document physique modifié 17' et les données et métadonnées qui ont été extraites par l'unité de gestion 221. L'unité de traitement 212 enregistre (étape El 60) l'objet numérique dans la base de données 50.  Finally, the processing unit 212 creates a digital object associating the image 40 of the first page of the modified physical document 17 'and the data and metadata that have been extracted by the management unit 221. The processing unit 212 records (step El 60) the digital object in the database 50.
Ainsi, dans l'exemple de la figure 2, le procédé de gestion de l'invention permet de créer rapidement une version électronique (c'est-à-dire un objet numérique) du document physique 17' (par exemple, un mémoire de thèse). En effet, comparativement aux techniques de lecture automatique de documents (reconnaissance automatique de documents et reconnaissance optique des caractères) décrites ci-dessus en relation avec l'art antérieur, le procédé de gestion de l'invention propose de lire et décoder le marquage porté par le document physique 17' pour obtenir, par exemple, tout ou partie des données correspondant au texte proprement dit de ce document.  Thus, in the example of FIG. 2, the management method of the invention makes it possible to quickly create an electronic version (that is to say a digital object) of the physical document 17 '(for example, a memory of thesis). Indeed, compared to automatic document reading techniques (automatic recognition of documents and optical character recognition) described above in relation with the prior art, the management method of the invention proposes to read and decode the worn marking. by the physical document 17 'to obtain, for example, all or part of the data corresponding to the actual text of this document.
Avantageusement, dans une variante de réalisation, le procédé de gestion de la présente invention pourrait être davantage sécurisé par la mise en œuvre par l'unité de gestion 221 d'une étape d'identification de l'unité de traitement 212. Dans cette variante de réalisation, l'unité de gestion 221 pourrait effectuer les étapes décrites ci-après.  Advantageously, in an alternative embodiment, the management method of the present invention could be further secured by the implementation by the management unit 221 of a step of identifying the processing unit 212. In this variant realization, the management unit 221 could perform the steps described below.
L'unité de gestion 221 reçoit en provenance de l'unité de traitement 212 l'identifiant de gestion et des données d'identification courantes, par exemple, son adresse IP. L'unité de gestion 221 identifie, parmi les couples de données enregistrés dans la base de données 13, celui qui comprend l'identifiant de gestion reçu.  The management unit 221 receives from the processing unit 212 the management identifier and current identification data, for example, its IP address. The management unit 221 identifies, among the pairs of data recorded in the database 13, the one that includes the management identifier received.
Une fois que le couple de données a été identifié, l'unité de gestion 221 vérifie que l'unité de traitement 212 est autorisée à accéder aux informations du couple de données identifié, à partir des données d'identification courantes (transmises par l'unité de traitement 212) et les métadonnées administratives (droits d'accès et de lecture) comprises dans le couple de données identifié. Once the data pair has been identified, the management unit 221 verifies that the processing unit 212 is authorized to access the information of the pair of data. data identified, from the current identification data (transmitted by the processing unit 212) and the administrative metadata (access and read rights) included in the identified data pair.
Si l'unité de gestion 221 détecte que l'unité de traitement 212 est autorisée à accéder aux informations du couple de données identifié, alors l'unité de gestion 221 transmet les données et métadonnées du couple de données identifié vers l'unité de traitement 212. Dans le cas contraire, l'unité de gestion 221 transmet vers l'unité de traitement 212 un message du type "Accès refusé"  If the management unit 221 detects that the processing unit 212 is authorized to access the information of the identified data pair, then the management unit 221 transmits the data and metadata of the identified data pair to the processing unit. 212. In the opposite case, the management unit 221 transmits to the processing unit 212 a message of the "Access denied" type.
Avantageusement, une fois que le document physique modifié 17' a été numérisé, le destinataire archive ce document 17' dans une zone physique de stockage (non représentée) prévue à cet effet. La zone physique de stockage est, par exemple, une salle d'archives comprenant des bacs de rangement ordonnés et numérotés. Une fois que le document physique modifié 17' a été archivé dans un bac de rangement donné, le destinataire utilise, par exemple, l'unité de traitement 212 pour ajouter dans un champs de données spécifique de l'objet numérique (enregistré dans la base de données 50) une information sur l'emplacement physique du document 17' archivé (par exemple, le numéro et la position du bac de rangement donné). L'information sur l'emplacement physique confère ainsi à l'objet numérique une valeur probante qu'un document numérisé classique n'a pas.  Advantageously, once the modified physical document 17 'has been digitized, the recipient archives this document 17' in a physical storage area (not shown) provided for this purpose. The physical storage area is, for example, an archive room with ordered and numbered storage bins. Once the modified physical document 17 'has been archived in a given storage bin, the recipient uses, for example, the processing unit 212 to add to a specific data field of the digital object (registered in the database). data 50) information on the physical location of the archived document 17 '(for example, the number and position of the given storage bin). The information on the physical location thus gives the digital object probative value that a conventional digitized document does not have.
Avantageusement, l'information sur l'emplacement physique du document 17' archivé pourrait être transmise à la base de données 13, de façon à enrichir cette base 13.  Advantageously, the information on the physical location of the archived document 17 'could be transmitted to the database 13, so as to enrich this database 13.
Avantageusement, la base de données 13 et la base de données 50 pourrait former une seule base de données. Ainsi, l'émetteur pourrait suivre (dans le sens visualiser) les différentes modifications apportées (signatures, tampons, annotations...) à son document d'origine.  Advantageously, the database 13 and the database 50 could form a single database. Thus, the issuer could follow (in the sense of visualizing) the various modifications made (signatures, buffers, annotations ...) to his original document.

Claims

REVENDICATIONS
1. Procédé de gestion, par un système de gestion, d'un document physique marqué, le système de gestion comprenant un système de numérisation et un système de stockage, le système de numérisation effectuant des étapes consistant à :  A method of management, by a management system, of a marked physical document, the management system comprising a scanning system and a storage system, the scanning system performing steps of:
a) numériser (E l 10) le document physique marqué, afin d'obtenir une image du document physique marqué ; a) digitizing (E l 10) the marked physical document, in order to obtain an image of the marked physical document;
b) lire et décoder (El 30) un marquage porté par le document physique marqué, afin d'obtenir un identifiant de gestion ; b) read and decode (El 30) a marking carried by the marked physical document, in order to obtain a management identifier;
caractérisé en ce que le système de stockage effectue des étapes consistant à : characterized in that the storage system performs steps of:
c) recevoir (El 40) en provenance du système de numérisation ledit identifiant de gestion ; c) receiving (El 40) from the scanning system said management identifier;
d) parmi une pluralité de couples de données enregistrés dans une première base de données (13) et associant chacun un identifiant de gestion et au moins une partie d'un ensemble de données et de métadonnées décrivant un document électronique, identifier (El 50) le couple de données comprenant l'identifiant de gestion reçu ; e) transmettre vers le système de numérisation la au moins une partie d'un ensemble de données et de métadonnées comprise dans le couple de données identifié, d) among a plurality of pairs of data recorded in a first database (13) and each associating a management identifier and at least a part of a set of data and metadata describing an electronic document, identifying (El 50) the data pair comprising the received management identifier; e) transmitting to the scanning system the at least part of a set of data and metadata included in the identified data pair,
et en ce que, sur réception de la au moins une partie d'un ensemble de données et de métadonnées, le système de numérisation effectue une étape f) d'enregistrement (El 60) dans une deuxième base de données (50) d'un objet numérique associant l'image du document physique marqué et la au moins une partie d'un ensemble de données et de métadonnées. and in that, upon receiving the at least part of a set of data and metadata, the scanning system performs a f) recording step (El 60) in a second database (50) of a digital object associating the image of the marked physical document with the at least part of a set of data and metadata.
2. Procédé de gestion selon la revendication 1, caractérisé en ce qu'il comprend des étapes consistant à :  2. Management method according to claim 1, characterized in that it comprises the steps of:
- archiver le document physique marqué dans une zone d'archivage physique ;  - archive the marked physical document in a physical archive area;
- obtenir une information de position physique relative à ladite zone d'archivage physique ;  obtaining physical position information relating to said physical archive area;
- insérer ladite information de position physique dans l'objet numérique.  inserting said physical position information in the digital object.
3. Procédé de gestion selon l'une quelconque des revendications 1 et 2, caractérisé en ce que l'étape e) comprend des étapes consistant à : - recevoir en provenance du système de numérisation des données d'identification courantes ; 3. Management method according to any one of claims 1 and 2, characterized in that step e) comprises steps consisting of: - receive from the scanning system current identification data;
- détecter un accès autorisé par comparaison desdites données d'identification courantes et de données d'identification de référence comprises dans la au moins une partie d'un ensemble de données et de métadonnées ;  detecting authorized access by comparing said current identification data and reference identification data included in the at least part of a set of data and metadata;
- sur détection positive d'un accès autorisé, transmettre vers le système de numérisation la au moins une partie d'un ensemble de données et de métadonnées. - On positive detection of an authorized access, transmit to the scanning system the at least part of a set of data and metadata.
4. Procédé de gestion selon l'une quelconque des revendications 1 à 3, caractérisé en ce qu'il comprend une étape préalable de modification dudit document physique marqué, de sorte que les étapes a), b) et f) sont effectuées avec le document physique marqué modifié. 4. Management method according to any one of claims 1 to 3, characterized in that it comprises a preliminary step of modifying said marked physical document, so that steps a), b) and f) are performed with the modified marked physical document.
5. Procédé de gestion selon l'une quelconque des revendications 1 à 4, caractérisé en ce que ledit marquage comprend l'un des éléments suivants :  5. Management method according to any one of claims 1 to 4, characterized in that said marking comprises one of the following elements:
- un code barre ;  - a bar code ;
- une étiquette RFID ; et  - an RFID tag; and
- un marquage magnétique.  - a magnetic marking.
6. Produit programme d'ordinateur, caractérisé en ce qu'il comprend des instructions de code de programme pour la mise en œuvre du procédé de gestion selon au moins une des revendications 1 à 5, lorsque ledit programme est exécuté sur un ordinateur.  6. Computer program product, characterized in that it comprises program code instructions for implementing the management method according to at least one of claims 1 to 5, when said program is executed on a computer.
7. Moyen de stockage lisible par ordinateur, stockant un programme d'ordinateur comprenant un jeu d'instructions exécutables par un ordinateur pour mettre en œuvre le procédé de gestion selon au moins une des revendications 1 à 5.  A computer readable storage medium storing a computer program comprising a set of computer executable instructions for implementing the management method according to at least one of claims 1 to 5.
8. Système de gestion (2) d'un document physique marqué, le système de gestion comprenant un système de numérisation (21) et un système de stockage (22), le système de numérisation comprenant :  8. Management system (2) of a marked physical document, the management system comprising a scanning system (21) and a storage system (22), the scanning system comprising:
des moyens pour numériser (21 1) le document physique marqué et permettant d'obtenir une image du document physique marqué ;  means for digitizing (21 1) the marked physical document and making it possible to obtain an image of the marked physical document;
des moyens pour lire et décoder (213) un marquage porté par le document physique marqué et permettant d'obtenir un identifiant de gestion ;  means for reading and decoding (213) a marking carried by the marked physical document and making it possible to obtain a management identifier;
caractérisé en ce que le système de stockage comprend : des moyens pour recevoir en provenance du système de numérisation ledit identifiant de gestion ; characterized in that the storage system comprises: means for receiving from the digitizing system said management identifier;
des moyens pour identifier (221), parmi une pluralité de couples de données enregistrés dans une première base de données (13) et associant chacun un identifiant de gestion et au moins une partie d'un ensemble de données et de métadonnées décrivant un document électronique, celui comprenant l'identifiant de gestion reçu par lesdits moyens pour recevoir ;  means for identifying (221), among a plurality of pairs of data recorded in a first database (13) and each associating a management identifier and at least a portion of a set of data and metadata describing an electronic document the one comprising the management identifier received by said means for receiving;
des moyens pour transmettre vers le système de numérisation la au moins une partie d'un ensemble de données et de métadonnées comprise dans le couple de données identifié par lesdits moyens pour identifier,  means for transmitting to the digitization system the at least part of a set of data and metadata included in the data pair identified by said means for identifying,
et en ce que le système de numérisation comprend des moyens pour enregistrer dans une deuxième base de données (50) un objet numérique associant l'image du document physique marqué et la au moins une partie d'un ensemble de données et de métadonnées. and in that the digitizing system comprises means for storing in a second database (50) a digital object associating the image of the marked physical document with the at least part of a set of data and metadata.
PCT/EP2012/069077 2011-09-30 2012-09-27 Method of managing marked documents WO2013045547A1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR1158844 2011-09-30
FR1158844A FR2980871B1 (en) 2011-09-30 2011-09-30 METHOD FOR MARKING DOCUMENTS AND METHOD FOR MANAGING TRADEMARK DOCUMENTS.

Publications (1)

Publication Number Publication Date
WO2013045547A1 true WO2013045547A1 (en) 2013-04-04

Family

ID=46924460

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/EP2012/069077 WO2013045547A1 (en) 2011-09-30 2012-09-27 Method of managing marked documents

Country Status (2)

Country Link
FR (1) FR2980871B1 (en)
WO (1) WO2013045547A1 (en)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006309282A (en) * 2005-04-26 2006-11-09 Hitachi Ltd Hybrid document management system
JP2007034446A (en) * 2005-07-25 2007-02-08 Fuji Xerox Co Ltd Document management system and document management method
EP2166498A1 (en) * 2008-09-08 2010-03-24 Brother Kogyo Kabushiki Kaisha Document management system
US20110085198A1 (en) * 2009-10-13 2011-04-14 Samsung Electronics Co., Ltd Image forming apparatus and document management method thereof

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006309282A (en) * 2005-04-26 2006-11-09 Hitachi Ltd Hybrid document management system
JP2007034446A (en) * 2005-07-25 2007-02-08 Fuji Xerox Co Ltd Document management system and document management method
EP2166498A1 (en) * 2008-09-08 2010-03-24 Brother Kogyo Kabushiki Kaisha Document management system
US20110085198A1 (en) * 2009-10-13 2011-04-14 Samsung Electronics Co., Ltd Image forming apparatus and document management method thereof

Also Published As

Publication number Publication date
FR2980871B1 (en) 2017-07-28
FR2980871A1 (en) 2013-04-05

Similar Documents

Publication Publication Date Title
KR100980748B1 (en) System and methods for creation and use of a mixed media environment
US10242004B2 (en) Method for automatically tagging documents with matrix barcodes and providing access to a plurality of said document versions
US9811728B2 (en) Adding value to a rendered document
US20180096203A1 (en) Adding value to a rendered document
US7672543B2 (en) Triggering applications based on a captured text in a mixed media environment
US8713418B2 (en) Adding value to a rendered document
US7587412B2 (en) Mixed media reality brokerage network and methods of use
US7920759B2 (en) Triggering applications for distributed action execution and use of mixed media recognition as a control input
US7639387B2 (en) Authoring tools using a mixed media environment
US9002838B2 (en) Distributed capture system for use with a legacy enterprise content management system
US20070177824A1 (en) Document management method using barcode to store access history information
US20070046982A1 (en) Triggering actions with captured input in a mixed media environment
WO2008031625A2 (en) Capture and display of annotations in paper and electronic documents
US9390089B2 (en) Distributed capture system for use with a legacy enterprise content management system
WO2005106643A2 (en) Adding value to a rendered document
CN101297318A (en) Data organization and access for mixed media document system
EP2482210A2 (en) System and methods for creation and use of a mixed media environment
US20070185832A1 (en) Managing tasks for multiple file types
US8294959B2 (en) Electronic document update based on handwritten edits
WO2013045547A1 (en) Method of managing marked documents
EP1889187A1 (en) Devices and methods allowing a user to manage a plurality of objects in particular paper documents
EP3053059B1 (en) A computer implemented system and method for collating and presenting multi-format information
EP3213255B1 (en) Device and method for recording a document exhibiting a marking
EP2200839B1 (en) Security document, manufacturing and authenticating devices, and corresponding methods
CN114090857A (en) Contract management method and system based on OCR recognition

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 12762622

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 12762622

Country of ref document: EP

Kind code of ref document: A1