CH716889A2 - Méthode mise en oeuvre par ordinateur pour l'allocation d'une pièce comptable à un couple de comptes débiteur/créditeur et son écriture comptable. - Google Patents

Méthode mise en oeuvre par ordinateur pour l'allocation d'une pièce comptable à un couple de comptes débiteur/créditeur et son écriture comptable. Download PDF

Info

Publication number
CH716889A2
CH716889A2 CH01539/19A CH15392019A CH716889A2 CH 716889 A2 CH716889 A2 CH 716889A2 CH 01539/19 A CH01539/19 A CH 01539/19A CH 15392019 A CH15392019 A CH 15392019A CH 716889 A2 CH716889 A2 CH 716889A2
Authority
CH
Switzerland
Prior art keywords
accounting
accounts
vector
information
self
Prior art date
Application number
CH01539/19A
Other languages
English (en)
Inventor
Blayo François
Original Assignee
Neoinstinct Sa
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Neoinstinct Sa filed Critical Neoinstinct Sa
Priority to CH01539/19A priority Critical patent/CH716889A2/fr
Priority to PCT/EP2020/084308 priority patent/WO2021110763A1/fr
Priority to EP20819700.4A priority patent/EP4070265A1/fr
Publication of CH716889A2 publication Critical patent/CH716889A2/fr

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/12Accounting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Finance (AREA)
  • Tourism & Hospitality (AREA)
  • Accounting & Taxation (AREA)
  • Technology Law (AREA)
  • Data Mining & Analysis (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Development Economics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

La présente invention se rapporte à une méthode mise en oeuvre par ordinateur pour l'allocation automatique d'une pièce comptable à un couple de comptes débiteur/créditeur d'un plan comptable et pour l'écriture comptable associée à cette pièce comptable comprenant les étapes : a. Extraction d'une information „description“ correspondant à un texte descriptif ainsi que d'une information „comptable“ correspondant au couple de comptes débiteur/créditeur pour chacune d'un nombre Z d'écritures comptables enregistrées précédemment dans un ou plusieurs Grands livres comptables ; b. Transformation de l'information „description“ d'un format alphanumérique en une valeur numérique de dimension K par l'intermédiaire d'une fonction de vectorisation de mots F pour chacune des Z écritures numériques extraites ; c. Attribution d'un vecteur V de dimension K+M à chacune des Z écritures comptables extraites, le vecteur V comprenant les K valeurs numériques de l'information „description“ transformée par la fonction F et M distances entre le compte débiteur et le compte créditeur associées à l'écriture comptable et tous les autres comptes du plan comptable. d. Apprentissage d'une carte auto-organisée C sur la base des vecteurs V, chaque nœud de la carte auto-organisée C correspondant à un vecteur poids P de dimension K+M ; e. Extraction d'une information „description“ et d'une information „montant“ d'une nouvelle pièce comptable ; f. Transformation de la valeur alphanumérique de l'information „description“ de la nouvelle pièce comptable en une valeur numérique de dimension K par l'intermédiaire de la fonction de vectorisation de mots F ; g. Attribution d'un vecteur W de dimension K et comprenant les valeurs numériques de l'information „description“ transformée par la fonction F; h. Détermination d'un vecteur BMU de la carte auto-organisée C comme étant le vecteur poids P le plus proche de W ; i. Extraction du compte débiteur Dmin correspondant à la composante la plus petite parmi les composantes M du vecteur BMU correspondent aux composantes des comptes débiteurs ; j. Extraction du compte créditeur Cmin correspondant à la composante la plus petite parmi les composantes M du vecteur BMU correspondent aux composantes des comptes créditeurs ; k. Allocation à la nouvelle pièce comptable le couple de comptes débiteur/créditeur Dmin / Cmin ; et l. Ecriture de l'information „montant“ extraite de la nouvelle pièce comptable dans le compte débiteur et le compte créditeur attribués à la pièce comptable.

Description

Domaine technique de l'invention
[0001] La présente invention se rapporte au domaine des méthodes mises en oeuvre par ordinateur pour l'allocation automatique des pièces comptables. Plus particulièrement, la présente invention concerne une méthode mise en oeuvre par ordinateur par laquelle une pièce comptable est automatiquement allouée à un couple de comptes débiteur/créditeur et par laquelle l'écriture comptable correspondante est automatiquement effectuée dans ce couple de comptes. En particulier, la présente invention se rapporte à une méthode pour l'allocation automatique de pièces comptables fondée sur un apprentissage basé sur un algorithme dit de carte auto-organisée qui prend en compte les écritures comptables du passé.
État de la technique
[0002] La réalisation d'un bilan et d'un compte de pertes et profits requièrent le traitement de toutes les données comptables telles que les factures, les relevés de banques, les relevés de cartes bancaires, les justificatifs. Ce traitement exige un traitement manuel pour procéder à l'allocation des comptes en accord avec le plan comptable de chaque société. Ce traitement manuel est fastidieux, source de nombreuses erreurs et sujet à interprétations. Il est souvent réalisé par des aides comptables sous la supervision d'un expert-comptable.
[0003] La tenue d'une comptabilité est, dans la majorité de pays, une obligation légale pour toute entité réalisant des opérations commerciales. Correctement tenue, la comptabilité représente un véritable outil de preuve permettant de justifier et de suivre différentes opérations. En matière juridique, elle est un moyen de preuve recevable en justice en cas de litige entre commerçants. En matière fiscale, elle permet d'éviter une procédure d'imposition d'office calculée sur des bases recalculées par l'administration. Enfin, la comptabilité est un outil d'information essentiel au profit des tiers (dirigeants, associés, salariés, administrations et institutions, etc.).
[0004] La bonne tenue d'une comptabilité nécessite de réaliser systématiquement des opérations d'enregistrement d'informations relatives à l'activité exercée par l'entité : conserver un justificatif pour chacune des transactions effectuées, classer les justificatifs par ordre chronologique de date de paiement ou d'encaissement, tenir un livre de caisse, de poste ou de banque, avec mises à jour quotidiennes ou hebdomadaires selon le volume d'activités de l'entreprise, enregistrer chaque opération en inscrivant la date, le numéro de la pièce justificative, la nature de l'opération (par exemple achat, frais, encaissement, etc.), le montant correspondant et le solde du jour et enfin enregistrer régulièrement les mouvements bancaires (par exemple versements effectués par les débiteurs ou les payement au profit des créditeurs).
[0005] Un plan comptable d'une entité est une liste de numéros de comptes où sont enregistrées les différentes opérations réalisés par cette entité. Chaque numéro de compte représente un poste permettant l'élaboration du bilan et du compte de résultat. Le plan comptable est ainsi composé de numéros de comptes et de leurs libellés. Les numéros de comptes sont regroupés en un certain nombre de classes de comptes.
[0006] Usuellement, les enregistrements des opérations sont effectués sur la base des informations disponibles (factures, relevés bancaires, frais, etc.) sous forme papier ou électronique. Ils sont généralement réalisés manuellement par un comptable utilisant un logiciel de comptabilité qui permet de manier facilement le plan comptable de l'entreprise.
[0007] La tenue de la comptabilité d'une entité est une action qui requiert deux phases : 1. la création du plan comptable de l'entité et 2. l'enregistrement régulier de toutes les opérations. La création du plan comptable est effectuée lors de la création de l'entité et le plan comptable n'est normalement plus modifié par la suite. L'enregistrement des opérations est effectué continuellement durant toute l'existence légale de l'entité. Cet enregistrement se fait pour une grande partie manuellement car cela requiert une lecture et une interprétation des informations contenues dans les pièces comptables ainsi que le respect des règles édictées par les tiers (par exemple fisc, organismes sociaux, banques, etc.).
[0008] Il est important de souligner que l'immense majorité des pièces comptables sont présentées dans un format non structuré (par exemple papier, fax, e-mail, documents bureautiques) et cela particulièrement dans le cas de la comptabilité fournisseurs.
[0009] Lorsque le nombre de transactions s'accroit (par exemple pour de grandes entités), le temps de traitement s'allonge ou le nombre de comptables augmente pour tenir les délais imposés par la loi : produire un bilan et un compte de résultat au moins une fois par an. De plus, les tiers concernés par les informations contenues dans le bilan et le compte de résultat n'en disposent que tardivement, au moins 3 mois après la clôture de l'exercice comptable. Bilans et compte de résultat, censés être utiles pour la prise de décision, ne sont ainsi que des photographies du passé. Dans le contexte économique actuel caractérisé par une vitesse de changement de plus en plus élevée, ce délai devient inacceptable.
[0010] Les principales difficultés rencontrées par les comptables se résument en quelques points : Le traitement de gros volumes de factures provenant de différents fournisseurs ou centres de coûts, dans de nombreux modèles / modèles et formats de livraison variés - courrier, fax, courrier électronique, EDI ; Les erreurs associées à la saisie manuelle des données - il est souvent nécessaire de saisir la même transaction plusieurs fois, ce qui augmente le coût de la transaction ; La complexité accrue des processus de saisie des données s'ils sont liés à différents centres de coûts et / ou impliquent une conversion de devise ; Les délais allongés à cause des procédures de routage, de traitement et de validation manuelles impliquant des personnes appartenant à des départements différents et éventuellement à des pays différents - des ristournes pour paiement anticipé sont souvent perdues et des frais peuvent être engagés pour les paiements en retard ; L'inefficacité due au temps passé à rassembler des documents physiques afin de faire correspondre les factures aux bons de commande, bons de livraison, contrats et enregistrements du système comptable ; Le risque de perte ou de dégradation des documents, car les documents sont reçus à plusieurs points d'entrée et peuvent être acheminés ou classés incorrectement ; Les coûts associés à l'acheminement manuel des documents, à l'expédition, à la messagerie, au stockage, à l'archivage et à l'audit ; L'impossibilité de contrôler facilement le traitement des factures et les paiements pour faire correspondre le flux de documents au système comptable.
[0011] Différentes mesures ont été proposées pour faciliter la fluidification des processus d'échange de données comptables et permettent ainsi de participer à une réduction du temps de traitement. Le stockage sous forme numérique améliore la capacité de recherche de ces données et accroît la sécurité lors des audits et des contrôles.
[0012] Néanmoins, l'interprétation des données reste pour une grande partie réalisée manuellement pour affecter l'allocation d'une pièce comptable à un couple de comptes débiteur/créditeur et pour effectuer l'écriture comptable correspondante de la saisie comptable.
[0013] Afin de circonvenir aux problèmes mentionnés ci-dessus, plusieurs solutions sont connues de l'art antérieur. Par exemple, dans le brevet US 8 126 785 B2 les données comptables sont classées afin de faciliter le traitement et la gestion des transactions. Des règles basées sur des bases de données sont implémentées pour classer les données relatives aux transactions dans des catégories comptables. Les informations comptables sont traitées en fonction des règles basées sur les données et classées en conséquence. Cette approche implique l'identification de règles particulières basées sur des bases de données à appliquer aux informations comptables, l'application des règles et le traitement. La principale difficulté de cette solution consiste à trouver les règles manuellement pour pouvoir les appliquer ensuite automatiquement.
[0014] Dans la demande de brevet US 5 117 356, l'automatisation de la production de la balance des comptes est abordée. Un système automatisé de tenue des comptes du Grand livre, c'est-à-dire l'ensemble des comptes débiteurs et des comptes créditeurs du plan comptable organisé dans une arborescence en „T“, fournit les soldes à la minute près dans tous les comptes du Grand livre chaque fois que des données relatives à une transaction terminée sont saisies. Le respect des procédures comptables définissables par l'utilisateur est assuré par l'utilisation d'un tableau de contrôle comptable qui contient les codes symboliques utilisés par les procédures de tenue de documents pour autoriser et contrôler la création et la mise à jour des fichiers de données des comptes du grand livre et des enregistrements de transactions. Dans ce brevet, l'affectation automatique des comptes à partir des écritures n'est pas abordée. Cette phase reste à réaliser manuellement.
[0015] Dans la demande de brevet US 2005/0055289 A1, un moteur de logiciel de comptabilité accepte l'entrée d'information textuelle ou numérique propre à l'entreprise définie par l'utilisateur et des données de comptabilité financière conventionnelles et les convertit en données informatiques multidimensionnelles sur un schéma en étoile indexées comme une entrée de journal. Sur demande de l'utilisateur, l'écriture de journal est analysée selon une méthodologie relationnelle ou une autre méthodologie de base de données pour générer des états comptables conventionnels tels que le Grand livre, le bilan, les états des flux de trésorerie, les états des profits et des pertes et les états du revenu gagné pour des périodes de temps spécifiées par l'utilisateur. Le moteur logiciel de comptabilité d'informations commerciales multidimensionnelles peut également générer des états comptables de données découpées selon une gamme d'informations numériques spécifiques à l'entreprise ou des états comptables pertinents pour un sujet spécifique à l'entreprise, des informations spécifiques pour une période de temps spécifiée, fournissant à l'utilisateur la sensibilité des différentes informations spécifiques sur les états comptables, afin que l'utilisateur puisse modifier ses pratiques commerciales en temps réel. Dans ce brevet, le principale développement tient à la manière de coder l'information comptable. En règle générale, l'information comptable entrée dans un système comptable est généralement codée à trois emplacements : dans un journal et dans deux comptes débiteur/créditeur du Grand livre lorsqu'on se réfère à une comptabilité en partie double. Dans cette demande de brevet, l'information comptable n'est plus codée dans les comptes crédit et débit, elle est uniquement codée dans le journal. Ce dernier devient la seule source d'information pour l'établissement de la comptabilité. A ce titre, la question de l'allocation débiteur/créditeur ne se pose pas et n'est donc pas abordée dans ce document.
[0016] Le brevet US 6 330 545 B1 propose une méthode et un système de comptabilité de l'information basé sur l'activité. Le système de comptabilisation des informations d'activité enregistre un tableau de titres de compte correspondant aux informations d'activité et exécute les procédures comptables sur la base des informations d'activité saisies et d'un titre de compte correspondant aux informations d'activité saisies. Le système comptable affiche les types d'activités du système, y compris les activités d'achat et d'acquisition, les activités de vente et de recettes, les activités de dépenses, les activités d'investissement et de financement, et les activités de production. Si un utilisateur sélectionne l'un des types d'activité affichés, le système comptable affiche un écran permettant à l'utilisateur de saisir des informations d'activité pour le type d'activité sélectionné. Le système comptable détermine si l'information de l'activité d'entrée est une activité interne ou une activité externe, exécute les procédures comptables sur la base du résultat déterminé et du tableau des titres des comptes. La méthode et le système de comptabilité permettent à ceux qui ne sont pas formés dans le domaine de la comptabilité de préparer des rapports comptables en saisissant simplement des informations sur l'activité commerciale. Les rapports comptables préparés comprennent des bilans, des états des résultats, des états des flux de trésorerie et d'autres rapports comptables qui fournissent différentes mesures de la valeur et de la performance globale de l'entreprise, sans avoir à passer par le processus complexe des écritures au journal. La méthode et le système comptables divulgués ne fournissent pas d'information financière. La méthode et le système de comptabilité divulgués ne fournissent pas d'information financière combinée à de l'information commerciale puisqu'ils ne recueillent que l'information sur les activités saisies par l'utilisateur.
[0017] Il existe par conséquent un besoin pour une méthode mise en oeuvre par ordinateur qui permet de manière sûre et rapide l'allocation automatique d'une pièce comptable à un couple de comptes débiteur/créditeur et d'effectuer automatiquement l'écriture comptable correspondante.
Résumé de l'invention
[0018] Un but de la présente invention est donc de proposer une méthode mise en oeuvre par ordinateur pour l'allocation automatique d'un couple de comptes débiteur/créditeur à nouvelle pièce comptable et pour l'écriture comptable associée à cette pièce comptable permettant de surmonter les limitations mentionnées préalablement.
[0019] Selon l'invention, ces buts sont atteints grâce aux objets de la revendication indépendante. Les aspects plus spécifiques de la présente invention sont décrits dans les revendications dépendantes ainsi que dans la description.
[0020] De manière plus spécifique, un but de l'invention est atteint grâce à une méthode mise en oeuvre par ordinateur pour l'allocation automatique d'une pièce comptable à un couple de comptes débiteur/créditeur d'un plan comptable et pour l'écriture comptable associée à cette pièce comptable comprenant les étapes : a. Extraction d'une information „description“ correspondant à un texte descriptif ainsi que d'une information „comptable“ correspondant au couple de comptes débiteur/créditeur pour chacune d'un nombre Z d'écritures comptables enregistrées précédemment dans un ou plusieurs Grand livre comptable ; b. Transformation de l'information „description“ d'un format alphanumérique en une valeur numérique de dimension K par l'intermédiaire d'une fonction de vectorisation de mots F pour chacune des Z écritures numériques extraites ; c. Attribution d'un vecteur V de dimension K+M à chacune des Z écritures comptables extraites, le vecteur V comprenant les K valeurs numériques de l'information „description“ transformée par la fonction F et M distances entre le compte débiteur et le compte créditeur associées à l'écriture comptable et tous les autres comptes du plan comptable, la distance entre deux comptes étant définie comme le nombre de sauts qu'il faut effectuer dans l'arbre du plan comptable pour joindre deux comptes par le plus court chemin ; d. Apprentissage d'une carte auto-organisée C sur la base des vecteurs V, chaque noeud de la carte auto-organisée C correspondant à un vecteur poids P de dimension K+M ; e. Extraction d'une information „description“ et d'une information „montant“ d'une nouvelle pièce comptable ; f. Transformation de la valeur alphanumérique de l'information „description“ de la nouvelle pièce comptable en une valeur numérique de dimension K par l'intermédiaire de la fonction de vectorisation de mots F ; g. Attribution d'un vecteur W de dimension K et comprenant les valeurs numériques de l'information „description“ transformée par la fonction F; h. Détermination d'un vecteur BMU de la carte C comme étant le vecteur poids P le plus proche de W ; i. Extraction du compte débiteur Dmin correspondant à la composante la plus petite parmi les composantes M du vecteur BMU correspondent aux composantes des comptes débiteurs ; j. Extraction du compte créditeur Cmin correspondant à la composante la plus petite parmi les composantes M du vecteur BMU correspondent aux composantes des comptes créditeurs ; k. Allocation à la nouvelle pièce comptable le couple de comptes débiteur/ créditeur Dmin / Cmin ; et l. Ecriture de l'information „montant“ extraite de la nouvelle pièce comptable dans le compte débiteur et le compte créditeur attribués à la pièce comptable.
[0021] Grâce à la méthode de la présente invention, il est possible d'allouer automatiquement un couple de comptes débiteur/créditeur à une nouvelle pièce comptable sur la base des écritures comptables passées. De plus, après avoir déterminé le couple de comptes débiteur/créditeur pour la nouvelle pièce comptable, l'écriture comptable complète peut être effectuée automatiquement. La présente méthode ne permet pas uniquement un gain de temps grâce à l'automatisation de l'allocation des comptes mais elle permet surtout d'éviter des erreurs. En effet, les informations extraites de la nouvelle pièce comptable sont extraites et objectivées avant d'être comparées aux informations correspondantes des écritures comptables passées qui ont été organisées dans une carte auto-organisée. Ainsi, une bonne partie des erreurs d'allocation de comptes qui se produisent souvent et qui sont dues à une interprétation subjective erronée des informations contenues dans les pièces comptables peuvent être évitées. L'allocation de la nouvelle pièce comptable à un couple de comptes se fait donc sur la base d'informations objectives et non pas, comme dans les méthodes normalement utilisées, sur des informations subjectives.
[0022] A noter que l'extraction des informations „description“ des écritures comptables enregistrées dans un ou plusieurs Grands livres comptables peut se faire aisément pas des moyens connus de l'homme du métier. En particulier, cela peut se faire de manière automatisée si les Grands livres des années comptables précédentes existent sous forme électronique par exemple dans un logiciel de comptabilité. Néanmoins, il est important de remarquer que la présente méthode peut être mise en oeuvre également si ces informations n'existent que sur papier. Dans ce cas, les informations peuvent être introduites à la main dans un logiciel de traitement de données ou elles peuvent être extraites automatiquement de copies scannées des Grands livres. D'une manière similaire, les informations „description“ et „montant“ de la nouvelle pièce comptable peuvent être entrées manuellement dans un logiciel mettant en oeuvre la présente invention ou extraites de copies scannées.
[0023] De plus, il est important de noter également que la présente méthode de dépend pas du format du plan comptable sur lequel sont basés les Grands livres des années comptables précédentes. Il suffit qu'il soit possible de définir la notion de distance entre comptes pour pouvoir mettre en oeuvre la présente méthode.
[0024] L'apprentissage de la carte auto-organisée C à l'étape d. peut être mis en oeuvre par tout algorithme d'apprentissage non-supervisé connus de l'art antérieur, tel que par exemple, l'algorithme dit de Kohonen.
[0025] Dans un tel algorithme, la carte auto-organisée C est composée d'une grille de neurones de faible dimension. Quand la grille est unidimensionnelle, chaque neurone a deux voisins. Quand la grille est bidimensionnelle, l'arrangement des neurones se fait d'une façon rectangulaire où chaque neurone possède 4 voisins (topologie rectangulaire) ou d'une façon hexagonale où chaque neurone possède 6 voisins (topologie hexagonale). Les neurones sont reconnus par leur numéro et leur emplacement sur la grille.
[0026] Les vecteurs de données V sont projetés de leur espace initial, ou espace d'entrée, vers la carte ou espace de sortie. A chaque neurone de la carte est associé un vecteur référent, appelé aussi vecteur prototype ou prototype, appartenant à l'espace d'entrée. En désignant par P le nombre total des neurones de la carte, le vecteur référent du neurone p de dimension N est désigné par : wpavec p ∈ {1, ..., P} et wp∈ R<N>
[0027] L'objectif de l'apprentissage de la carte consiste à mettre à jour les vecteurs référents de façon à approximer au mieux la distribution des vecteurs d'entrée tout en reproduisant l'auto-organisation des neurones de la carte. L'apprentissage de la carte se fait en mode séquentiel appelé aussi incrémental, ou en mode différé (batch).
[0028] Chaque itération t de l'apprentissage séquentiel comprend deux étapes. La première étape consiste à choisir au hasard une observation x(t) de l'ensemble Ω, et à la présenter au réseau dans le but de déterminer son neurone vainqueur. Le neurone vainqueur (Best Matching Unit), d'une observation est le neurone dont le vecteur référent en est le plus proche au sens d'une distance donnée (ex : distance euclidienne). Si c est le neurone vainqueur du vecteur x(t), c est déterminé comme suit :
[0029] Dans la deuxième étape, le neurone vainqueur est activé. Son vecteur référent est mis à jour pour se rapprocher du vecteur d'entrée présenté au réseau. Cette mise à jour ne concerne pas seulement le neurone vainqueur comme dans les méthodes de l'apprentissage par compétition (Winner take ail), mais aussi les neurones qui lui sont voisins et qui voient alors leurs vecteurs référents s'ajuster vers ce vecteur d'entrée. L'amplitude de cet ajustement est déterminée par la valeur d'un pas d'apprentissage α(t) et la valeur d'une fonction de voisinage h(t).
[0030] Le paramètre α(t) règle la vitesse de l'apprentissage. Il est initialisé avec une grande valeur au début puis décroît avec les itérations en vue de ralentir au fur et à mesure le processus d'apprentissage. La fonction h(t) définit l'appartenance au voisinage. Elle dépend à la fois de l'emplacement des neurones sur la carte et d'un certain rayon de voisinage. Dans les premières itérations, le rayon de voisinage est assez large pour mettre à jour un grand nombre de neurones voisins du neurone vainqueur, mais ce rayon se rétrécit progressivement pour ne contenir que le neurone vainqueur avec ses voisins immédiats, ou bien même le neurone vainqueur seulement. La règle de mise à jour des vecteurs référents est la suivante : wp(t+1) = wp(t)+α(t)hcp(t)[x(t)-wp(t)] avec p ∈ {1, ..., P} où c est le neurone vainqueur du vecteur d'entrée x(t) présenté au réseau à l'itération t et h est la fonction de voisinage qui définit la proximité entre les neurones c et p.
[0031] Une fonction de voisinage entre le neurone vainqueur c et un neurone p de la carte vaut 1 si le neurone p se trouve à l'intérieur du carré centré sur le neurone c et 0 dans les autres cas. Le rayon de ce carré est appelé rayon de voisinage. Il est large au début, puis se rétrécit avec les itérations pour contenir seulement le neurone c avec ses voisins immédiats à la fin de l'apprentissage ou même seulement le neurone c. Une fonction de voisinage plus flexible et plus commune est la fonction gaussienne définie ci-dessous :
où rcet rpsont respectivement l'emplacement du neurone c et du neurone p sur la carte, et σ(t) est le rayon du voisinage à l'itération t du processus d'apprentissage.
[0032] Avec une telle fonction de voisinage, l'amplitude de l'ajustement est graduée selon l'éloignement du neurone vainqueur qui réserve à lui-même l'amplitude maximale. Le résultat de cet apprentissage non supervisé est la projection non linéaire de l'ensemble des observations sur la carte. Chaque observation est attribuée à son neurone vainqueur. Outre la tâche de quantification, cette projection préserve la topologie des données grâce à l'utilisation de la fonction de voisinage. Deux neurones voisins sur la carte représenteront des observations proches dans l'espace de données.
[0033] Une variante de l'apprentissage est dite „en mode différé“. En mode différé, à chaque itération t, toutes les observations sont présentées au réseau et la mise à jour des vecteurs prototypes se fait en prenant en compte toutes les observations de l'ensemble de données. Chaque vecteur prototype est une moyenne pondérée des vecteurs d'observations (Xi, i ∈ {1, ... , n}) quand le carré de la distance euclidienne est utilisée pour le calcul du neurone vainqueur, les poids correspondants étant les valeurs de la fonction de voisinage h(t) .
[0034] La règle de mise à jour des vecteurs prototypes est donnée par :
où h est la valeur de la fonction de voisinage entre le neurone vainqueur cidu vecteur xiet le neurone p.
[0035] La mise à jour des vecteurs prototypes peut être formulée autrement en utilisant le fait que les observations qui ont le même neurone vainqueur ont la même valeur pour la fonction de voisinage et appartiennent à la région de Voronoï dont le centre est leur neurone vainqueur :
où nlest le nombre d'observations appartenant à la région de Voronoï représentée par le neurone l et xl , est la moyenne des observations de cette même région.
[0036] Vers la fin de l'apprentissage, quand le rayon de voisinage devient trop petit pour activer seulement le neurone vainqueur, chaque vecteur prototype constitue le centre de gravité des observations qu'il représente et on retombe alors sur l'algorithme des centres-mobiles, ce qui garantit une meilleure approximation de la fonction de densité des observations. De plus, avec l'absence du pas d'apprentissage, cet algorithme ne présente pas de problèmes de convergence.
[0037] Cependant, le mode différé pourrait causer des torsions dans les cartes à grandes dimensions. Pour cette raison, on procède à une analyse en composantes principales pour initialiser les vecteurs prototypes.
[0038] De manière avantageuse, la carte auto-organisée est une carte bidimensionnelle ou tridimensionnelle. L'initialisation de la carte C avant la procédure d'apprentissage en tant que telle peut être effectuée de plusieurs façons. Par exemple, une première méthode d'initialisation consiste à assigner un vecteur de poids P initial à chaque noeud de la carte auto-organisée C. Cette d'attribution initiale des vecteurs de poids peut être par exemple une attribution aléatoire d'un nombre à chaque vecteur scalaire des vecteurs de poids, sans stimulation. Le terme „aléatoire“ désigne probabilité égale pour n'importe lequel d'un ensemble de résultats possibles. La valeur numérique de ces valeurs scalaires assignées au hasard peut être approximativement limitée à la borne inférieure et supérieure par l'extrema correspondant observé dans les vecteurs d'entraînement, c'est-à-dire les vecteurs V. Une autre méthode d'initialisation des vecteurs de poids P comprend une variation systématique, par exemple une variation linéaire, dans la plage de chaque dimension de chaque vecteur de poids pour recouper approximativement la plage correspondante observée dans les vecteurs d'entraînement V. Dans une autre méthode d'initialisation, les vecteurs poids sont initialisés par les valeurs des vecteurs ordonnés le long d'un sous-espace bidimensionnel traversé par les deux vecteurs propres principaux des vecteurs d'entraînement V obtenus par des méthodes d'orthogonalisation bien connues dans l'art, par exemple par l'orthogonalisation dite de Gram-Schmidt. Dans une autre procédure d'initialisation, les valeurs initiales sont fixées sur des échantillons choisis au hasard parmi les vecteurs d'apprentissage V.
[0039] La détermination du vecteur BMU de la carte auto-organisée C peut se faire selon plusieurs critères bien connus de l'homme du métier. Cela peut par exemple être effectué sur la base, d'une distance par exemple la distance Euclidienne minimale entre tous les vecteurs poids P de la carte auto-organisée C et le vecteur W. D'autres méthodes peuvent pour la détermination de BMU telles que celles utilisant la corrélation entre vecteurs qui présente l'avantage d'offrir plus de robustesse au décalage entre vecteurs, l'écart angulaire entre vecteurs qui offre l'avantage de mettre l'accent sur la longueur mutuelle des vecteurs pour autant que l'information soit portée par ces grandeurs, la mesure de distance de Minkowsky qui est une généralisation de la mesure de distance euclidienne et qui est avantageuse lorsque les vecteurs portent des données de nature qualitatives peuvent être aussi mises en oeuvre.
[0040] Dans un mode de réalisation préféré de la présente invention, la distance entre deux comptes est déterminée par le nombre de sauts qu'il faut effectuer dans l'arbre du plan comptable pour joindre deux comptes par le plus court chemin. Ceci permet tout d'abord de définir une distance qui pourra être mesurée entre deux comptes et de déterminer facilement et rapidement la distance entre deux comptes indépendamment de l'organisation exacte du plan comptable sous-jacent.
[0041] Dans un autre mode de réalisation préféré de la présente invention, la détermination du vecteur BMU à l'étape h. est effectuée sur la base d'une mesure de distance euclidienne entre le vecteur BMU et le vecteur W. La distance Euclidienne entre vecteurs est une mesure qui peut être déterminée très rapidement quelle que soit la dimension de la carte auto-organisée C ce qui permet une mise en oeuvre rapide de la présente méthode et donc une allocation également rapide de la nouvelle pièce comptable. De plus, la détermination d'une distance Euclidienne entre deux vecteurs ne demande que peu de ressources de calcul. Elle peut donc se faire sur des ordinateurs de bureau ordinaires.
[0042] Dans un mode de réalisation préféré suivant de la présente invention, la carte auto-organisée C est mise à jour après chaque nouvelle écriture comptable, après chaque dixième nouvelle écriture comptable ou après chaque centième nouvelle écriture comptable. Cela permet que la carte auto-organisée C et donc l'allocation des comptes pour les nouvelles pièces comptables s'améliorent sur la base des nouvelles pièces comptables qui ont déjà été allouées. La présente méthode devient donc „self-learning“. Plus le nombre de pièces comptables traitées par la présente méthode augmente plus cette dernière devient précise.
[0043] Dans un autre mode de réalisation préféré de la présente invention, l'étape b. est réalisée à l'aide d'une fonction F dite de hashage. Cette fonction permet de gérer des variables catégorielles, c'est-à-dire des variables qui n'ont pas de représentation numérique naturelle. La fonction de hashage offre une solution pour convertir les variables catégorielles en variables numériques. Il y a plusieurs façons de le faire. Le „Label encoding“ où l'on choisit un nombre arbitraire pour chaque catégorie. L'encodage „1 parmi N“ où l'on crée une colonne binaire par catégorie. Le „Hasking trick“ où l'on trouve un sous-espace de petite dimension qui correspond aux données. Le „Binning optimal“ lorsque l'on s'appuie sur des apprenants tels que LightGBM ou CatBoost. Le „Codage cible“ où l'on calcule la moyenne de la valeur cible par catégorie.
[0044] Chacune de ces méthodes a ses avantages et ses inconvénients, et cela dépend généralement des données et des besoins. Si une variable comporte de nombreuses catégories, un schéma de codage à „1 parmi N“ produira plusieurs colonnes pouvant entraîner des problèmes de mémoire. Le „Hashing trick“ est une solution efficace mais qui requiert l'ajustement de plusieurs paramètres.
[0045] Grâce à une méthode de hashage, il est aisé de transformer une information alphanumérique en une information numérique. De plus, la fonction de hashage spécifique peut être choisie en relation avec le nombre de données comprises dans les écritures comptables passées. Si le nombre de mots correspondant aux informations „description“ est petit il est suffisant que la fonction de hashage transforme ces mots en une valeur numérique avec un nombre petit de chiffres par exemple 128 ou 256 chiffres. Par contre si le nombre de mots est important, il est préférable que la fonction de hashage vectorise les mots dans des valeurs numériques avec au minimum 512, 1024 ou 2048 chiffres.
[0046] Dans un mode de réalisation préféré suivant de la présente invention, les informations „description“ et „montant“ sont extraites depuis une copie scannée de la nouvelle pièce comptable. Ceci permet d'atteindre une allocation de la nouvelle pièce comptable totalement automatisée.
Brève description des dessins
[0047] Les particularités et les avantages de la présente invention apparaîtront avec plus de détails dans le cadre de la description qui suit avec un exemple de réalisation donné à titre illustratif et non limitatif en référence aux onze dessins ci-annexés qui représentent : La figure 1 représente un schéma fonctionnel d'une méthode selon un mode de réalisation de la présente invention ; La figure 2 représente un schéma fonctionnel d'un exemple de mise en oeuvre de l'étape d'extraction des écritures comptables passées ; La figure 3 représente un schéma d'un processeur de transaction utilisé dans le mode de réalisation de la présente invention ; La figure 4 représente un exemple de la partie „Bilan“ d'un plan comptable ; Les figures 5a et 5b représentent un exemple de la partie „Compte de résultat“ d'un plan comptable ; La figure 6 illustre la distance entre deux comptes ; La figure 7 illustre l'étape d'apprentissage de la carte auto-organisée C ; La figure 8 représente un schéma fonctionnel de l'adaptation de la carte auto-organisée ; La figure 9 illustre les deux sous-groupes de composantes des vecteurs poids P de la carte auto-organisée ; La figure 10 illustre la détermination du vecteur BMU correspondant à la nouvelle pièce comptable ; et La figure 11 illustre la détermination du couple de comptes débiteurs/créditeurs sur la base du vecteur BMU.
Description détaillée d'un mode de réalisation
[0048] L'invention présentée ici consiste à permettre une allocation des comptes débiteurs et créditeurs à partir des données extraites des pièces comptables et notamment des descriptions associées à chaque pièce. Cette approche requiert la modélisation des allocations effectuées par le comptable lors des exercices précédent l'exercice en cours. Le principe de l'invention repose donc sur le constat que les écritures comptables réalisées par une entité se répètent d'année en année. Chaque écriture liée à une pièce comptable provoque le mouvement de deux comptes : le compte débiteur et le compte créditeur ou couple comptes débiteur/compte créditeur. C'est ce que l'on nomme l'allocation d'une pièce comptable à un couple de comptes.
[0049] Chaque allocation résulte de l'analyse, par le comptable, des informations dites „comptables“ contenues dans les pièces comptables (client, fournisseur, montant individuel par article, montant total, TVA, taux de TVA, etc,) mais aussi d'éléments „contextuels“ relatif à la pièce comptable (descriptifs, vendeur, commentaires, etc.). L'ensemble de ces informations constitue un espace contextuel pluridimensionnel dans lequel chaque pièce peut être représentée par un point ou un vecteur.
[0050] La présente invention repose sur l'idée selon laquelle il est possible de cartographier les allocations des couples comptes débiteurs/créditeurs réalisées par le passé et de s'en servir pour déterminer automatique l'allocation des couples débiteurs/créditeurs pour les nouvelles pièces comptables. Comme il sera expliqué en détail ci-dessous, la cartographie repose sur une projection non-linéaire des points de l'espace contextuel multidimensionnel vers une carte en 2 dimensions.
[0051] La figure 1 présente un mode de réalisation de la présente invention. La méthode mise en oeuvre par ordinateur pour l'allocation automatique d'une pièce comptable à un couple de comptes débiteur/compte créditeur selon ce mode de réalisation comprend les étapes suivantes : 110 : Extraction des écritures comptables réalisées dans le passé ; 120 : Conversion de chaque écriture comptable passée en un vecteur V d'un espace contextuel ; 130 : Apprentissage d'une carte auto-organisée C sur la base des vecteurs V des écritures comptables passées ; 140 : Extraction d'une nouvelle pièce comptable l'information „description“ et l'information „montant“ ; 150 : Conversion de l'information „description“ de la nouvelle pièce comptable en un vecteur W ; 160 : Détermination du vecteur BMU de la carte auto-organisée le plus proche du vecteur W ; 170 : Extraction sur la base des composantes du vecteur BMU des comptes débiteurs et créditeurs les plus proches ; 180 : Allocation à la nouvelle pièce du couple de comptes débiteur / créditeur extraits à l'étape précédentes ; 190 : Ecriture de l'information „montant“ de la nouvelle pièce comptable dans les comptes débiteur et créditeur alloués.
[0052] Il est évident que ces étapes peuvent être mises en oeuvre dans un ordre différent. Il est par exemple tout à fait possible d'effectuer l'apprentissage de la carte auto-organisée C sur la base des écritures comptable passées avant d'extraire les informations de la nouvelle pièce comptable.
[0053] Un exemple de réalisation de l'étape 110 de la figure 1, c'est-à-dire l'extraction des écritures comptables réalisées dans le passé est illustré dans la figure 2. Cette extraction peut se faire par exemple sur la base des informations contenues dans le logiciel de comptabilité de l'entité. Les écritures comptables à extraire sont par exemples contenues dans le Grand Livre de la comptabilité des années précédentes. Comme illustré dans la figure 2, les écritures comptables 220 sont lues et analysées par un processeur de transaction 230. Ce dernier recherche les données des écritures comptables contenant la date de l'écriture, le numéro de compte débiteur affecté à l'écriture, le numéro de compte créditeur affecté à l'écriture, la description de l'écriture et le montant. Le processeur de transaction 230 écrit les données correspondant à son analyse dans une base de données 240 qui peut être structurée comme illustré dans le tableau 1. A la fin du traitement d'extraction des données comptables des années précédentes, la base de données 240 contient toutes les données correspondant aux écritures des années choisies et issues du logiciel de comptabilité. Bien entendu, il est possible de mettre en oeuvre l'étape 110 d'une autre manière connue d'un homme du métier. Il est par exemple possible d'introduire manuellement dans la base de données 240 les écritures effectuées dans le passé. Il est ainsi possible de mettre en oeuvre la présente invention même si la comptabilité de l'entité a été jusqu'à présent effectuée sur papier. Il serait également possible de scanner la comptabilité papier et d'extraire des documents scannés les données nécessaires à l'établissement de la base de données 240. Jour d'émission de la pièce comptable Mois d'émission de la pièce comptable Numéro de compte débiteur Numéro de compte créditeur Description de l'opération Montant de l'opération Valeur de 1 à 31 Valeur de 1 à 12 Nombre entier Nombre entier Texte Nombre réel
Tableau 1 : exemple de données comptables extraites des écritures de comptabilité passées
[0054] Les données comptables extraites des écritures effectuées dans le passé doivent être converties pour faciliter leur compréhension par un système additionnel. Cette opération est réalisée par exemple par le processeur de transactions 230 représenté sur la figure 3. Comme illustré dans cette figure, le processeur de transactions 230 est avantageusement composé de deux mécanismes qui réalisent la conversion des numéros de comptes en distances entre comptes (étape 231) et la conversion des mots contenus dans le champ „description“ en valeurs numériques par une fonction de hashage (étape 232).
[0055] L'analyse de la pratique professionnelle des comptables a mis en évidence le fait que ces derniers effectuent l'allocation d'une pièce comptable à un couple de comptes débiteur/compte créditeur sur la base d'informations contextuelles contenues dans la pièce comptable. Ces informations se retrouvent dans les écritures qui ont été effectuées dans le passé. Elles se retrouvent spécifiquement dans les allocations de comptes ainsi que dans le champ „description de l'opération“ rempli normalement par le comptable.
[0056] L'allocation des comptes réalisée par le comptable est une donnée numérique qui désigne un compte dans un plan comptable. En se référant par exemple au plan comptable suisse standard, le compte „6200“ désigne les charges de véhicule et de transport. Cette donnée numérique n'a pas de sens en tant que telle. Elle désigne en fait le noeud d'un arbre dont la racine est le plan comptable et qui se divise en deux branches : le bilan et le compte de résultats ou flux de trésorerie. Le plan comptable peut être représenté sous la forme d'un arbre comme cela est montré dans les figures 4, 5a et 5b.
[0057] La notion de distance entre les comptes du plan comptable est illustrée dans la figure 6. La distance entre deux comptes du plan comptable se définit comme le nombre de sauts qu'il faut effectuer dans l'arbre pour joindre ces comptes par le plus court chemin. Par exemple, la distance entre les comptes „1022-Banque 2“ et „6281-Frais de transport“ vaut 10 car il faut effectuer 10 sauts pour établir le plus court chemin entre ces comptes dans l'arbre du plan comptable. Pour chaque compte du Grand livre, il est ainsi possible de déterminer toutes les distances qui le séparent des autres comptes dans l'arbre du plan comptable. Par exemple, les distances qui séparent le compte „6281-Frais de transport“ de tous les autres comptes du plan comptable sont reportées dans le tableau 2. Depuis le compte 6281 6 6 6 6 4 4 2 2 2 - 4 4 4 4 4 4 4
Tableau 2 : exemple d'un extrait des distances entre un compte du plan comptable et tous les autres comptes
[0058] L'ensemble des distances séparant tous les comptes du Grand livre d'une entité peuvent être évaluées une seule fois et sont stockées dans une base de données sous la forme d'une table à NxN entrées, N correspondant au nombre de „feuilles“ de l'arbre du plan comptable. Il faut noter que seules les feuilles du plan comptables sont utiles pour la construction de cette table. Les autres noeuds de l'arbre ne servent qu'à calculer le chemin le plus court entre les paires de feuilles. Dans le contexte d'un exemple concret d'une mise en oeuvre de la présente invention sur la base du plan comptable Suisse standard, la table des distances entre les comptes comprend donc 229 X 229 entrées.
[0059] Les données „description“ de l'opération, qui ont été extraites des écritures comptables passées, contiennent des informations que l'on peut exploiter pour modéliser la distribution des opérations. On entend par „distribution des opérations“ la distribution statistique des opérations au regard des codes comptables. Chaque opération est un point dans un espace multidimensionnel et l'ensemble des opérations est ainsi un nuage de point dans cet espace constituant une distribution statistique.
[0060] A cet effet, la donnée „description“ pour chaque écriture du passée extraite est convertie dans un espace contextuel. L'espace contextuel est composé de tous les mots d'un vocabulaire extrait des descriptions disponibles. Le principe consiste à représenter chaque description d'une opération en tant que vecteur dans un espace euclidien de dimension t où chaque dimension correspond à un mot du vocabulaire. A titre d'exemple, une partie du vocabulaire extrait dans le champ „description de l'opération“ issu des historiques des comptabilités est illustrée dans le tableau 3. Vocabulaire Acompte Activation Adaptation Administratifs Administration Adobe Adresse Afc Affaire agip
Tableau 3 : extrait du vocabulaire issu de l'information „description“ des écritures comptables du passé
[0061] Afin de pouvoir traiter ces mots comme grandeurs numériques qui seront être exploitées l'algorithme d'apprentissage de la présent invention, les valeurs alphanumériques de ces mots sont transformée par une méthode dite de „vectorisation“ des mots. Cette transformation peut être par exemple réalisée par l'intermédiaire d'une fonction F de hashage. Cette technique est connue sous le nom de „hashing vectorization“ ou „hashing tricks“. La fonction de hashage F prend en entrée tous les mots du vocabulaire issu des descriptions associées à toutes les écritures et les transforme en une valeur numérique.
[0062] Dans le contexte d'un exemple concret de mise en œuvre de la présente invention, le nombre de valeurs numériques différentes pour représenter toutes les descriptions disponibles est fixé à 1024. Ce choix permet de fixer la longueur du vecteur qui devient ainsi indépendante du nombre de mots utilisés pour la description de chaque écriture.
[0063] A l'issue du processus de retraitement des données comptables des années précédentes, chaque opération comptable peut donc être représentée par 1482 valeurs organisées dans un vecteur V suivant la structure illustrée dans le tableau 4. Ces données sont stockées dans la base de données 240 représentée dans la figure 2. La base de données contiendra donc Z lignes de 1482 valeurs, où Z est le nombre d'écritures disponibles pour l'année N. Description de l'opération Numéro de compte créditeur Numéro de compte débiteur Tableau de 1024 nombres réels Tableau de distances Tableau de distance 1024 valeurs 229 valeurs 229 valeurs
Tableau 4 : exemple structure des données comptables après retraitement
[0064] Comme illustré dans la figure 1, une cartographie des classes des écritures comptables à partir des écritures comptable réalisées dans le passé est établie à l'étape 130. Les données stockées dans la base de données 240 et par exemple organisées selon le tableau 4 sont utilisées pour alimenter un système de classification automatique des écritures comptables qui est basé sur un algorithme dit des „self-organizing maps (SOM)“ ou „carte auto-organisée“ (voir figure 7).
[0065] Tel qu'utilisée dans le contexte de la présente invention, la carte auto-organisée C (250 dans la Figure 7), fait référence à une technique de regroupement et à la représentation du résultat, technique qui regroupe les données dans des classes de telle sorte que les données similaires sont généralement regroupées dans une même classe alors que les données dissemblables ne le sont pas.
[0066] Les termes „plus proche“, „plus proche“, „proche“ et les termes d'importance semblable, dans ce contexte, désignent la proximité littérale dans une carte auto-organisée. Des variations mineures dans le positionnement des données comprenant une auto-organisée peuvent être tolérées sans s'écarter de la description sous-jacente de la carte auto-organisée telle que fournie dans les présentes et dans les références citées dans les présentes et connues dans l'état de l'art. La carte auto-organisée, d'abord énoncée est un modèle de réseau neuronal capable de projeter des données d'entrée de grande dimension (c'est-à-dire des vecteurs de données multivariés) sur un tableau de dimension inférieure, généralement à deux dimensions.
[0067] Cette projection produit une représentation de dimension inférieure qui est utile pour détecter et analyser les caractéristiques de l'espace d'entrée de dimension supérieure. Le terme „dimension“ dans le contexte d'un vecteur de données multivarié fait référence à la longueur du vecteur de données, de sorte que chacune de ses variables multiples décrit une dimension unique. Par exemple, une dimension peut faire référence à une distance entre comptes, éventuellement normalisée. Le terme „dimension“ dans le contexte d'une représentation (par exemple, une représentation visuelle) désigne les présentations à une, deux ou trois dimensions généralement utilisées pour fournir des informations à un humain.
[0068] Dans le contexte de la présente invention, la auto-organisée C permet d'organiser les données multidimensionnelles de la base de données 240, c'est-à-dire les Z écritures du passé sous forme de vecteurs V avec leur 1482 composantes et de représenter ces écritures sous forme d'une carte à deux dimensions dans laquelle les écritures „semblables“ sont regroupées dans des classes qui représentées dans la auto-organisée C par les noeuds de cette carte. La construction de la carte auto-organisée par l'intermédiaire de l'algorithme „auto-organisé“ peut par exemple suivre les étapes décrites dans la figure 8.
[0069] Initialement, un vecteur poids initial P (étape 810) est assigné à chaque noeud de la carte auto-organisée. De nombreuses méthodes d'attribution initiale des vecteurs poids P sont connues de l'homme de l'art, y compris l'attribution aléatoire d'un nombre à chaque vecteur scalaire des vecteurs poids, sans stimulation. Le terme „aléatoire“ désigne probabilité égale pour n'importe lequel d'un ensemble de résultats possibles. La valeur numérique de ces valeurs scalaires assignées au hasard peut être approximativement limitée à la borne inférieure et supérieure par l'extrema correspondant observé dans les vecteurs d'entraînement, ici les vecteurs V. Une autre méthode d'initialisation des vecteurs de poids comprend une variation systématique (p. ex. linéaire) dans la plage de chaque dimension de chaque vecteur poids P pour recouper approximativement la plage correspondante observée dans les vecteurs d'entraînement. Dans une autre méthode d'initialisation, les vecteurs poids P sont initialisés par les valeurs des vecteurs ordonnés le long d'un sous-espace bidimensionnel traversé par les deux vecteurs propres principaux des vecteurs d'entraînement obtenus par des méthodes d'orthogonalisation bien connues dans l'art (par exemple, l'orthogonalisation de Gram-Schmidt). Dans une autre procédure d'initialisation, les valeurs initiales sont fixées sur des échantillons choisis au hasard de la base d'apprentissage. Dans le contexte de l'exemple concret de la mise en oeuvre de la présente invention, à chaque noeud de la carte auto-organisée est attribué lors de l'étape 810 un vecteur poids P de dimension 1482, dont les valeurs des 1482 composantes peuvent initialement attribuées de différentes manières, de préférence de manière aléatoire.
[0070] Dans l'étape 820, un vecteur d'apprentissage V, c'est-à-dire une des lignes de la base de données 240, est sélectionné. La sélection peut être aléatoire ou systématique, de préférence aléatoire. Quand un vecteur d'apprentissage est sélectionné, la distance euclidienne entre le vecteur d'entraînement sélectionné et chaque vecteur poids P associés aux noeuds de la carte auto-organisée C est calculé.
[0071] À l'étape 830, le vecteur poids P, et donc le noeud de la carte auto-organisée C correspondant, ayant la plus petite distance euclidienne est défini comme étant „l'unité qui correspond le mieux“ (Best Matching Unit ou BMU). Une fois qu'un vecteur BMU correspondant est identifié, le voisinage de ce vecteur BMU, c'est-à-dire les valeurs attribuées aux noeuds voisins, est éventuellement mise à l'échelle (étape 840) par des méthodes bien connu dans l'art.
[0072] À l'étape 850, il est décidé s'il faut répéter les étapes 820-840 ou mettre fin à la construction de la carte auto-organisée C. Cette décision est fondée sur le respect ou non d'un critère de convergence prédéfini. Le terme „critère de convergence“, dans le contexte de la construction de la carte auto-organisée C, se réfère à l'un quelconque des éléments suivants correspondant à une variété de métriques à la disposition de l'homme de l'art. Ces critères comprennent par exemple une limite d'itération absolue (p. ex. 100, 200, 500, 1000, 2000, 5000 ou même plus), un changement de la distance euclidienne entre le vecteur d'entraînement V choisi et chaque vecteur poids P de la carte C (p. ex, 100, 10, 1, 0,1, 0,01, 0,01, 0,001 et même moins), un changement relativement important de la distance euclidienne entre le vecteur d'entraînement V choisi et chaque vecteur poids P de la carte C (p. ex. 10 %, 1 %, 0,1 %, 0,1 %, 0,01 % et même moins), ou l'un quelconque de ces critères couplé en outre à une exigence du nombre de sélection minimale des vecteurs de d'apprentissage V (p. ex. 1, 2, 3, 4, 5, 10, 20, 50, 100 ou encore plus). Une fois la convergence atteinte, la procédure d'apprentissage de la carte auto-organisée C se termine (étape 860).
[0073] Une fois que l'apprentissage de la carte auto-organisée C a été effectué sur la base de la base de données 240 qui contient les écritures comptable du passé cette carte C peut être utilisée pour allouer automatiquement un couple de comptes débiteur/créditeur à une nouvelle pièce comptable. En effet, à l'issue de la phase d'apprentissage de la carte C, chaque vecteur poids P, c'est-à-dire chaque de noeud de la carte auto-organisée C, code un couple d'un compte débiteur et d'un compte créditeur et leurs distances à tous les autres comptes du plan comptable. Dans le contexte de l'exemple concret de la mise en oeuvre de la présente invention chaque noeud de la carte auto-organisée C code 1024 valeurs correspondant à un vecteur de hashage des données de description ainsi que 2 x 229 valeurs correspondant aux distances entre les comptes. D'un point de vue mathématique chaque noeud peut donc être représenté par un vecteur de dimension 1482. D'un point de vue mathématique, si la mesure de distance retenue pour organiser la carte auto-organisée C est une distance euclidienne, chaque vecteur poids P associé à un nœud de la carte C regroupe toutes les valeurs situées dans son hypercube de Voronoï.
[0074] Durant la phase d'utilisation de la carte auto-organisée C, les vecteurs poids P associés aux nœuds ne sont plus modifiés. L'utilisation de la carte pour l'allocation automatique d'une nouvelle pièce comptable, consiste sur la base de l'information „description“ extraite de cette pièce à l'étape 140 (voir figure 1), à déterminer quel est le couple de comptes débiteur/créditeur qu'il convient de lui associer en fonction de ce qui a été précédemment affecté par le comptable. Cette étape correspond aux étapes 160 et 170 de la figure 1.
[0075] La figure 1 détaille les étapes 150 à 180 requises pour l'obtention de la classe, c'est-à-dire le noeud correspondant de la carte auto-organisée C, d'une nouvelle pièce comptable. Pour une nouvelle pièce comptable, l'information „description“ peut provenir de la pièce comptable elle-même si elle est identifiable en tant que telle dans un fichier numérique, d'une métadonnée associée à la pièce comptable, d'une mention additionnelle à la pièce comptable ajoutée par un opérateur manuel, d'un système d'analyse automatique capable d'extraire des informations de la pièce comptable et en général de tout système capable de donner une information contextuelle codée sous forme numérique en relation avec la pièce comptable et capable d'aider à son interprétation. En d'autres termes, l'information „description“ sous forme alphanumérique extraite de la pièce comptable est transformée en une valeur numérique grâce à la même fonction de hashage F qui a été utilisée pour créer la base de données 240. Par cet intermédiaire, pour chaque nouvelle pièce comptable un vecteur de valeurs numériques W est créé. Dans le contexte de l'exemple concret de mise en oeuvre de la présente invention, pour chaque pièce nouvelle pièce comptable un vecteur W de dimension 1024 est créé sur la base de l'information „description“ extraite de cette pièce.
[0076] La description de la nouvelle pièce comptable, transformée en un vecteur W de valeurs numériques, est fournie comme donnée de l'étape durant laquelle nous utilisons la carte auto-organisée C pour obtenir la classe (le noeud de la carte) pour la nouvelle pièce comptable. Les valeurs de chaque noeud de la carte auto-organisée correspondent à deux sous-ensembles d'informations : celles qui correspondent à une nouvelle description et celles qui correspondent aux deux distances associées à la description, comme cela est montrés dans figure 9. En d'autres termes, le vecteur poids associé à chaque noeud de la carte peut être subdivisé un premier sous-ensemble de „coordonnées“ qui représentent les informations „description“ et un deuxième sous-ensemble qui correspond aux distances entres les comptes.
[0077] Dans le contexte de l'exemple concret de mise en oeuvre de la présente invention, le premier sous-ensemble contient 1024 valeurs numériques et le deuxième sous-ensemble 458 (2x229) valeurs numériques. En se référant à la figure 9, le sous-ensemble correspondant à porte l'information sur la description de la pièce comptable sous forme de 1024 valeurs numériques. Le sous-ensemble comprenant et portent les informations relatives aux distances entres comptes codés par le noeud j de la carte.
[0078] En phase d'utilisation de la carte auto-organisée uniquement un vecteur W de dimension égale à la dimension du sous-ensemble est à disposition après l'extraction et la transformation de l'information „description“ de la nouvelle pièce comptable. Ce vecteur W qui, dans le contexte de l'exemple concret de mise en oeuvre de la présente invention, a une dimension égale à 1024, est représenté dans la figure 10 par W1,1024.
[0079] La détermination du noeud (ou de la classe) de la carte auto-organisée C auquel la nouvelle pièce comptable doit être attribuée est effectuée en utilisant un algorithme qui détermine la distance euclidienne entre le vecteur d'entrée x1,1024et les composantes du vecteur poids P associé à chaque noeud de la carte. Le vecteur poids P, et donc le noeud correspondant, ayant la plus petite distance euclidienne avec le vecteur d'entrée x1,1024est déclarée BMU comme cela est illustré dans la figure 11. Le nœud de la carte correspondant est donc attribué à la nouvelle pièce comptable.
[0080] Une fois qu'un vecteur BMU est identifié, les composantes et de BMU qui correspondent donc aux distances aux comptes créditeurs respectivement débiteurs sont extraites. Une fois ces valeurs composantes extraites, il faut déterminer les comptes qui leur correspondent ce qui permet d'allouer ce couple de comptes à la nouvelle pièce comptable.
[0081] Il est important de noter que durant la phase d'apprentissage de la carte auto-organisée, les valeurs et ont été adaptées en fonction des distances de comptes associées à chaque écriture. Rappelons que suivant le tableau 4, qui illustre la structure des données comptables du passé extraites et après retraitement, les entrées correspondant aux distances sont toutes différentes de zéro sauf celle qui correspond exactement au compte d'allocation de l'écriture en crédit ou débit. Néanmoins, comme conséquence de l'apprentissage de la carte auto-organisée C, les valeurs de distances ne contiennent pas obligatoirement des composantes à valeur égale à 0.
[0082] Pour déterminer l'indice des composantes du sous-ensemble et que nous allons choisir afin d'extraire le couple de comptes débiteur/créditeur, nous allons rechercher la plus petite valeur des distances parmi celles correspondant aux composantes créditeurs et débiteurs du BMU. Cela nous donnera immédiatement l'indice des comptes à utiliser et ce de manière indépendante pour la partie débit et la partie crédit.
[0083] Le tableau 5 montre un exemple des valeurs du sous-ensemble dans le contexte de l'exemple concret de mise en oeuvre de la présente invention. Afin de déterminer quel compte créditeur doit être alloué à la nouvelle pièce comptable, il suffit de déterminer le compte qui a la distance la plus petite. Dans cet exemple concret, le compte correspondant est le compte „5274“. De même manière le compte débiteur peut être déterminé à partir des distances du sous-ensemble correspondant au de noeud de la carte identifié. A l'issue de ce processus, deux comptes sont donc obtenus qui déterminent exactement le couple de comptes débiteur/créditeur dans lequel nous allons écrire la valeur „montant“ du tableau 1, ce qui correspond à la dernière étape 190 de la figure 1.
[0084] Avantageusement, la présente méthode est mise en oeuvre en utilisant un programme informatique pour effectuer des opérations sur des aspects de la présente invention qui peut être écrit dans n'importe quelle combinaison d'un ou plusieurs langages de programmation, y compris un langage de programmation orienté objet tel que Java, Python, C++, ou similaire et des langages de programmation procédurale classiques, tels que le langage de programmation „C“ ou des langages de programmation similaires. Le code du programme peut être exécuté entièrement sur l'ordinateur de l'utilisateur, en partie sur l'ordinateur de l'utilisateur, en tant que progiciel autonome, en partie sur l'ordinateur de l'utilisateur et en partie sur un ordinateur distant ou entièrement sur l'ordinateur distant ou un serveur. Dans ce dernier scénario, l'ordinateur distant peut être connecté à l'ordinateur de l'utilisateur via n'importe quel type de réseau, y compris un réseau local (LAN) ou un réseau étendu (WAN), ou la connexion peut être établie à un ordinateur externe (par exemple, par le biais de la fonction Internet à l'aide d'un fournisseur de services Internet).
[0085] L'ordinateur exécutant le programme sera composé au minimum d'un processeur standard (CPU) avec sa mémoire RAM d'au minimum 30Giga octets, un disque dur de capacité minimum 1Tera Octet. Il pourra être aussi composé d'un processeur d'exécuter plusieurs threads simultanément (multithread). Enfin, il peut lui être adjoint des cartes d'accélération matérielles telles que les GPU (graphie processor Units), les TPU (Tensor Processing Units) et en général tout dispositif d'accélération matérielle disponible sur le marché tels que RTX2060, RTX 2070, GTX 1070.
[0086] Il est évident que la présente invention est sujette à de nombreuses variations quant à sa mise en oeuvre. Bien qu'un mode de réalisation non limitatif ait été décrit à titre d'exemple, on comprend bien qu'il n'est pas concevable d'identifier de manière exhaustive toutes les variations possibles. Il est bien sûr envisageable de remplacer un moyen décrit par un moyen équivalent sans sortir du cadre de la présente invention. Toutes ces modifications font partie des connaissances communes d'un homme du métier dans le domaine technique de la présente invention.

Claims (7)

1. Méthode mise en oeuvre par ordinateur pour l'allocation automatique d'une pièce comptable à un couple de comptes débiteur/créditeur d'un plan comptable et pour l'écriture comptable associée à cette pièce comptable comprenant les étapes : a. Extraction d'une information „description“ correspondant à un texte descriptif ainsi que d'une information „comptable“ correspondant au couple de comptes débiteur/créditeur pour chacune d'un nombre Z d'écritures comptables enregistrées précédemment dans un ou plusieurs Grands livres comptables ; b. Transformation de l'information „description“ d'un format alphanumérique en une valeur numérique de dimension K par l'intermédiaire d'une fonction de vectorisation de mots F pour chacune des Z écritures numériques extraites ; c. Attribution d'un vecteur V de dimension K+M à chacune des Z écritures comptables extraites, le vecteur V comprenant les K valeurs numériques de l'information „description“ transformée par la fonction F et M distances entre le compte débiteur et le compte créditeur associées à l'écriture comptable et tous les autres comptes du plan comptable. d. Apprentissage d'une carte auto-organisée C sur la base des vecteurs V, chaque nœud de la carte auto-organisée C correspondant à un vecteur poids P de dimension K+M ; e. Extraction d'une information „description“ et d'une information „montant“ d'une nouvelle pièce comptable ; f. Transformation de la valeur alphanumérique de l'information „description“ de la nouvelle pièce comptable en une valeur numérique de dimension K par l'intermédiaire de la fonction de vectorisation de mots F ; g. Attribution d'un vecteur W de dimension K et comprenant les valeurs numériques de l'information „description“ transformée par la fonction F ; h. Détermination d'un vecteur BMU de la carte auto-organisée C comme étant le vecteur poids P le plus proche de W ; i. Extraction du compte débiteur Dmin correspondant à la composante la plus petite parmi les composantes M du vecteur BMU correspondent aux composantes des comptes débiteurs ; j. Extraction du compte créditeur Cmin correspondant à la composante la plus petite parmi les composantes M du vecteur BMU correspondent aux composantes des comptes créditeurs ; k. Allocation à la nouvelle pièce comptable le couple de comptes débiteur/créditeur Dmin / Cmin ; et l. Ecriture de l'information „montant“ extraite de la nouvelle pièce comptable dans le compte débiteur et le compte créditeur attribués à la pièce comptable.
2. Méthode selon la revendication, dans laquelle la distance entre deux comptes est déterminée par le nombre de sauts qu'il faut effectuer dans l'arbre du plan comptable pour joindre deux comptes par le plus court chemin ;
3. Méthode selon l'une des revendications 1 ou 2, dans laquelle la détermination du vecteur BMU à l'étape h. est effectuée sur la base d'une mesure de distance euclidienne entre le vecteur BMU et le vecteur W ;
4. Méthode selon l'une des revendications précédentes, dans laquelle la carte auto-organisée C est mise à jour après chaque nouvelle écriture comptable, après chaque dixième nouvelle écriture comptable ou après chaque centième nouvelle écriture comptable.
5. Méthode selon l'une des revendications précédentes, dans laquelle l'étape b. est réalisée à l'aide d'une fonction F dite de hashage, telle que le „Label encoding“, l'encodage „1 parmi N“, le „Hasking trick“, ou le „Binning optimal“.
6. Méthode selon l'une des revendications précédentes, dans laquelle l'apprentissage de la carte auto-organisée C est réalisée par un algorithme de Self-Organizing maps.
7. Méthode selon l'une des revendications précédentes, dans laquelle les informations „description“ et „montant“ sont extraites depuis une copie scannée de la nouvelle pièce comptable.
CH01539/19A 2019-12-04 2019-12-04 Méthode mise en oeuvre par ordinateur pour l'allocation d'une pièce comptable à un couple de comptes débiteur/créditeur et son écriture comptable. CH716889A2 (fr)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CH01539/19A CH716889A2 (fr) 2019-12-04 2019-12-04 Méthode mise en oeuvre par ordinateur pour l'allocation d'une pièce comptable à un couple de comptes débiteur/créditeur et son écriture comptable.
PCT/EP2020/084308 WO2021110763A1 (fr) 2019-12-04 2020-12-02 Méthode mise en œuvre par ordinateur pour l'allocation d'une pièce comptable à un couple de comptes débiteur/créditeur et l'écriture comptable
EP20819700.4A EP4070265A1 (fr) 2019-12-04 2020-12-02 Méthode mise en uvre par ordinateur pour l'allocation d'une pièce comptable à un couple de comptes débiteur/créditeur et l'écriture comptable

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CH01539/19A CH716889A2 (fr) 2019-12-04 2019-12-04 Méthode mise en oeuvre par ordinateur pour l'allocation d'une pièce comptable à un couple de comptes débiteur/créditeur et son écriture comptable.

Publications (1)

Publication Number Publication Date
CH716889A2 true CH716889A2 (fr) 2021-06-15

Family

ID=73698834

Family Applications (1)

Application Number Title Priority Date Filing Date
CH01539/19A CH716889A2 (fr) 2019-12-04 2019-12-04 Méthode mise en oeuvre par ordinateur pour l'allocation d'une pièce comptable à un couple de comptes débiteur/créditeur et son écriture comptable.

Country Status (3)

Country Link
EP (1) EP4070265A1 (fr)
CH (1) CH716889A2 (fr)
WO (1) WO2021110763A1 (fr)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117078281A (zh) * 2023-10-17 2023-11-17 肥城恒丰塑业有限公司 一种防音布生产防伪溯源管理方法及***

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5117356A (en) 1989-07-28 1992-05-26 Dns, Inc. Automated ledger account maintenance system
US6330545B1 (en) 1993-07-27 2001-12-11 Eastern Consulting Company, Ltd. Activity information accounting method and system
US20050055289A1 (en) 2001-08-09 2005-03-10 Mehldahl Robert Allen Multi-dimensional business information accounting software engine
US8126785B2 (en) 2004-06-09 2012-02-28 Syncada Llc Automated transaction accounting processing engine and approach
US9063978B1 (en) * 2009-10-16 2015-06-23 Igor US Inc. Apparatuses, methods and systems for a financial transaction tagger
WO2015070314A1 (fr) * 2013-11-13 2015-05-21 Yong Liu Classifieur de crédit supervisé ayant ratios comptables
KR101914620B1 (ko) * 2018-05-15 2018-11-06 (주)아이퀘스트 빅데이터 및 기계학습을 이용한 자동 분개 수행 방법 및 이를 실현하는 서버

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117078281A (zh) * 2023-10-17 2023-11-17 肥城恒丰塑业有限公司 一种防音布生产防伪溯源管理方法及***
CN117078281B (zh) * 2023-10-17 2024-01-09 肥城恒丰塑业有限公司 一种防音布生产防伪溯源管理方法及***

Also Published As

Publication number Publication date
EP4070265A1 (fr) 2022-10-12
WO2021110763A1 (fr) 2021-06-10

Similar Documents

Publication Publication Date Title
Amani et al. Data mining applications in accounting: A review of the literature and organizing framework
Stevenson et al. The value of text for small business default prediction: A deep learning approach
Rattenbury et al. Principles of data wrangling: Practical techniques for data preparation
CH716790A2 (fr) Appareil et procédé de gestion de trésorerie à l&#39;aide de l&#39;apprentissage automatique.
FR3069357A1 (fr) Systeme d&#39;apprentissage machine pour diverses applications informatiques
US20240203149A1 (en) System and method for domain aware document classification and information extraction from consumer documents
Milner et al. Tax analytics—Artificial intelligence and machine learning—Level 5
US11048711B1 (en) System and method for automated classification of structured property description extracted from data source using numeric representation and keyword search
Kulkarni et al. Advanced credit score calculation using social media and machine learning
Skyrius et al. The potential of big data in banking
CN110046188A (zh) 业务处理方法及其***
WO2021110763A1 (fr) Méthode mise en œuvre par ordinateur pour l&#39;allocation d&#39;une pièce comptable à un couple de comptes débiteur/créditeur et l&#39;écriture comptable
Rahaman et al. Bitcoin trading indicator: a machine learning driven real time bitcoin trading indicator for the crypto market
CN108734021A (zh) 一种基于去隐私数据的金融贷款大数据风险评估方法与***
Park et al. Estimating the bis capital adequacy ratio for korean banks using machine learning: Predicting by variable selection using random forest algorithms
US10510009B1 (en) Predictive machine learning models
CN117114812A (zh) 一种针对企业的金融产品推荐方法及装置
Agin Predicting Chapter 11 Bankruptcy Case Outcomes Using the Federal Judicial Center IDB and Ensemble Artificial Intelligence
Mitra et al. Code & Coin: Financial Analytics powered by AIML
Chataigner Some contributions of machine learning to quantitative finance: volatility, nowcasting, CVA compression
Guerrazzi et al. Using meta-analytic structural equation modelling to advance entrepreneurship research: A study on the liabilities of newness and smallness
Hayek Data science and external audit
Ranjan et al. Overview of big data and natural language processing: A powerful combination for research
Price et al. Making monitoring manageable: a framework to guide learning
Mehta et al. Analysis of Stocks by the Use of Clustering and Classification Algorithms