FR3110740A1

FR3110740A1 - Procédé de conversion automatique de fichiers numériques

Info

Publication number: FR3110740A1
Application number: FR2005363A
Authority: FR
Inventors: Paul Poupet; Erwan BOEHM
Original assignee: Seed Up; Seed-Up
Current assignee: Seed Up; Seed-Up
Priority date: 2020-05-20
Filing date: 2020-05-20
Publication date: 2021-11-26

Abstract

L’invention concerne un procédé de conversion automatique, totale ou partielle, de fichiers numériques enregistrés chacun dans une mémoire indexée sous une première forme originelle, ledit procédé comportant au moins une étape de conversion d’un fichier numérique en fichier numérique simplifié pour un niveau d’accessibilité déterminé. Ledit procédé comporte, lors de la requête d’un desdits fichiers numériques par l’équipement informatique d’un utilisateur la transmission d’un fichier numérique comprenant un contenu requêté et la mise à disposition dudit utilisateur d’un moyen d’interaction exécutable sur l’équipement dudit utilisateur, ledit contenu requêté étant constitué : par le contenu du fichier originel requêté transformé par un traitement de simplification fonction de la combinaison des indicateurs de déficiences de l‘utilisateur, dans le cas où : ladite requête contient la combinaison d’indicateurs de déficiences de l’utilisateur, ou ladite requête provient d’un utilisateur préalablement enregistré dans une table numérique associant un identifiant de l’utilisateur à sa combinaison d’indicateurs de déficiences dans mémoire locale ou sur un serveur, par défaut par le contenu du fichier requêté originel. Le procédé comportant, en cas d’activation dudit moyen d’interaction, une étape récursive de transformation du fichier transmis audit utilisateur, ladite transformation consistant à réévaluer les indicateurs de déficiences et à générer un nouveau traitement de simplification. Figure de l’abrégé : Figure 1

Description

Procédé de conversion automatique de fichiers numériques

Domaine de l’invention

La présente invention concerne le domaine du traitement automatique de l’information numérique, et plus précisément du retraitement automatique d’un contenant numérique comportant une ou plusieurs informations textuelles, ainsi que des images, des séquences sonores, graphiques ou audio, des informations de style, code informatique, etc. pour la rendre plus facile à lire et à comprendre notamment par des lecteurs souffrant de déficiences intellectuelles ou de handicaps légers (dyslexie, capacités oculaires réduites,…) mais également par un public plus large comprenant les personnes âgées, illettrées, étrangères maîtrisant mal notre langue, les enfants d’écoles primaires, etc.

L'Union européenne, en lien avec les associations représentatives des personnes handicapées, s’est engagée depuis 2009 à produire un ensemble de recommandations à destination des producteurs d'écrits pour les aider à élaborer des documents compréhensibles, accessibles au plus grand nombre, selon le principe "N'écrivez pas pour nous sans nous" afin de lutter contre le « Difficile à lire et à comprendre » (DALC).

État de la technique

On connaît dans l’état de la technique un document énonçant les règles européennes pour une information facile à lire et à comprendre

https://easy-to-read.eu/wp-content/uploads/2014/12/FR_Information_for_all.pdf

Ce document propose une série de règles à appliquer lors de la conception d’un texte pour le rendre accessibles par une population élargie. Cela se fait toutefois au détriment de la richesse du contenu, car elle oblige à appliquer les règles les plus sévères et réductrices pour prendre en compte toutes les déficiences et tous les handicaps connus. La mise en œuvre sur un corpus de contenus existant serait par ailleurs extrêmement fastidieuse et chronophage.

On connaît aussi dans l’état de la technique le brevet américain US6665642B2 décrivant un procédé pour fournir des pages Web transformées à des utilisateurs ayant des besoins spéciaux. Dans un aspect du système et de la méthode, un serveur d’adaptation est situé entre l'utilisateur et le site Web. Ce serveur d’adaptation traduit et transforme les pages Web que l'utilisateur demande au site Web dans un format adapté à un utilisateur ayant tout type de besoin particulier. La traduction et la transformation des pages Web sont orientées vers les besoins particuliers de l'utilisateur. Ce document de l’art antérieur propose deux modes de mise en œuvre :

Dans le premier modèle commercial, dénommé «service fournisseur», le propriétaire d'un site Web particulier peut payer pour que le serveur d’adaptation fournisse des pages Web traduites à tout utilisateur ayant des besoins spéciaux qui tente d'y accéder.
Dans le deuxième modèle commercial, appelé le « service aux utilisateurs », un ou plusieurs utilisateurs ayant des besoins spéciaux paient le serveur d’adaptation pour leur fournir des pages Web traduites de manière appropriée pour tout site Web auquel ils accèdent.

Ce document décrit aussi une solution consistant à utiliser la mise en cache des pages adaptées pour permettre leur réutilisation en cas de nouvelle demande par un utilisateur présentant les mêmes déficiences.

Cette solution n’est pas satisfaisante car le serveur d’adaptation doit présenter une très forte capacité de traitement pour pouvoir transformer les contenus provenant d’un grand nombre de serveurs de contenus vers un grand nombre d’utilisateurs.

De plus, cette solution ne permet pas d’optimiser l’adaptation du contenu aux déficiences et handicaps de chaque utilisateur, mais applique un traitement uniforme et figé, comme l’indique la désignation de « Universal Translator/Mediator Server » du serveur d’adaptation.

Par ailleurs, les solutions connues présupposent un traitement en amont, sur chacun des sites diffusant les contenus numériques, et prévoient une simplification par grandes catégories, et non une personnalisation à chaque cas particulier de combinaison de déficiences et de handicaps.

Les solutions de l’art antérieur sont par ailleurs “figées” et ne permettent aucune interaction entre le lecteur et le contenu affiché, en ce qui concerne le niveau et la nature de la simplification ni la compréhension des difficultés réelles de l’utilisateur.

Solution apportée par l’invention

L’invention vise à remédier à ces inconvénients en permettant le traitement en temps réel de contenus numériques pour les adapter au niveau de compréhension optimum et personnalisé pour une grande diversité d’utilisateurs présentant des défaillances variées, en optimisant les conversions afin de préserver au mieux la richesse et l’intégrité de la présentation du contenu, tout en prenant en compte les limites de l’utilisateur concernant la compréhension de ce contenu.

Elle vise également à automatiser l’adaptation de la sévérité de la conversion des contenus textuels par l’exploitation, par le serveur, des informations techniques représentatives du niveau de compréhension de chacun des utilisateurs et selon une variante préférée une solution pour l’amélioration automatique permanente, par un apprentissage, des traitements appliqués.

Selon une autre variante avantageuse, l’invention propose à l’utilisateur un moyen d’interaction avec une page transmise pour adapter dynamiquement son contenu.

Selon une autre variante avantageuse, l’invention permet à un utilisateur d'avoir une transcription sans nécessairement avoir eu un travail amont par l'éditeur du site (ni sur le contenu, ni sur l'intégration d'un module).

A cet effet, la présente invention concerne plus particulièrement un procédé

de conversion automatique, totale ou partielle, de fichiers numériques enregistrés chacun dans une mémoire indexée sous une première forme originelle, ledit procédé comportant au moins une étape de conversion d’un fichier numérique en fichier numérique simplifié pour un niveau d’accessibilité déterminé, caractérisé en ce qu’il comporte, lors de la requête d’un desdits fichiers numériques par l’équipement informatique d’un utilisateur la transmission d’un fichier numérique comprenant un contenu requêté et la mise à disposition dudit utilisateur d’un moyen d’interaction exécutable sur l’équipement dudit utilisateur, ledit contenu requêté étant constitué :

par le contenu du fichier originel requêté transformé par un traitement de simplification fonction de la combinaison des indicateurs de déficiences de l‘utilisateur, dans le cas où :
- ladite requête contient la combinaison d’indicateurs de déficiences de l’utilisateur,
- ou ladite requête provient d’un utilisateur préalablement enregistré dans une table numérique associant un identifiant de l’utilisateur à sa combinaison d’indicateurs de déficiences dans mémoire locale ou sur un serveur,
par défaut par le contenu du fichier requêté originel.

Le procédé comportant, en cas d’activation dudit moyen d’interaction, une étape récursive de transformation du fichier transmis audit utilisateur, ladite transformation consistant à réévaluer les indicateurs de déficiences et à générer un nouveau traitement de simplification.

Selon un mode de réalisation particulier, le procédé comporte en outre une étape préalable de recherche d’une version simplifiée du fichier requêté, dont la combinaison des indicateurs de déficiences associés est la plus proche de la combinaison de déficiences enregistrée dans ladite table numérique, en relation avec l’identifiant de l’utilisateur, et, s’il existe au moins une version simplifiée proche, la préparation d’un fichier éditable , contenant ladite version simplifiée la plus proche du fichier requêté ainsi que la mise à disposition d’un moyen d’interaction exécutable sur l’équipement de l’utilisateur.

Selon une autre variante de mise en œuvre, il comporte en outre une étape de validation consistant à transmettre à un équipement tiers un fichier contenant la version simplifiée dudit contenu et des moyens de validation ou de modification.

Avantageusement, ledit moyen d’interaction est constitué par un formulaire numérique. On entend par “formulaire numérique” tout moyen d’interaction permettant de sélectionner ou modifier des paramètres représentés de manière graphique ou textuelle, par exemple sous forme de “cases à cocher, de curseurs, une interaction via le pointeur, tel qu’un “click droit” lorsque le pointeur est positionné dans une zone d’intérêt, etc.

Selon une variante, il comporte en outre une analyse des signaux numériques représentatifs des interactions effectuées sur l’équipement informatique de l’utilisateur, pour déterminer au moins un indicateur d’accessibilité effective personnalisée par ledit utilisateur.

On entend par “analyse des interactions ” l’analyse des déplacements d’un pointeur, le temps passé sur chaque portion page, le comportement du pointeur, la présence d’un équipement périphérique tel qu’une liseuse, le suivi du regard à l’aide de la caméra, l’analyse morphologique, gestique ou émotionnelle à partir de l’image de l’utilisateur captée par la caméra ou de ses diverses interactions, l’analyse des sons ou la reconnaissance vocale.

Selon une première variante, lesdits traitements de simplification sont exécutés sur un serveur d’application.

Le serveur d’application peut être le serveur du client, le serveur d’un fournisseur de contenu ou le serveur d’un tiers mutualisant les traitements de simplification pour une pluralité de serveurs de contenus.

Selon une autre variante, lesdits traitements de simplification sont exécutés sur l’équipement de l’utilisateur.

Avantageusement, en l’absence d’application de simplification sur le serveur de fichiers commandant l’accès audit fichier-cible, ledit serveur de fichiers transmet à l’équipement informatique le fichier requêté natif, et une application commande la redirection dudit fichier-cible vers un serveur de simplification générique commandant l’exécution d’une application de simplification dudit fichier-cible.

Selon une variante, le procédé comporte une étape d’enregistrement d’une partie au moins des fichiers simplifiés calculés en réponse à une requête d’un utilisateur, lesdits fichiers simplifiés étant associés à la combinaison d’indicateurs de déficience dudit utilisateur.

Avantageusement, ladite séquence de traitement exécutée par ledit serveur comporte en outre la mise à jour de la combinaison d’indicateurs de déficiences associée audit utilisateur.

De préférence, ladite séquence de traitement exécutée par ledit serveur comporte en outre la mise à jour des règles / modèles par apprentissage.

La présente invention propose un système qui permet à un premier utilisateur U1 ayant des difficultés D1 et disposant d’un logiciel tel qu’un navigateur spécifique, ou une extension vers un site de simplification de contenus numériques, ou se rendant sur un site équipé d’une application de simplification de contenus numériques, de demander l'accès à une page P adaptée à ses difficultés propres. La page P qui n’est pas déjà traduite pour D1 est traduite instantanément par notre moteur de traduction selon des règles/algorithmes T1, sauvegardée en base de données et est renvoyée à l’utilisateur.

Un deuxième utilisateur U2 présentant les mêmes difficultés D1, ayant l’extension de simplification installée ou se rendant sur un site équipé du plugin, demande l'accès à la même page P. La page P ayant déjà été traduite pour D1, elle est renvoyée à l’utilisateur U2 sans avoir à faire appel au moteur de traduction.

Les difficultés Di sont déterminées soit lors de la création du compte, soit en remplissant un champ, soit (ou en plus) par la détection d’interactions (passées et présentes).

Les utilisateurs U1 et U2 peuvent procéder par une interaction simplifiée (sans forcément être connus du système - extension sans compte, ou site équipé du plugin mais sans identification sollicitée/acceptée par l’utilisateur -, et vont mettre à jour le contenu adapté.

Les sauvegardes des pages étant faites indépendamment de l'existence du plugin. Les sauvegardes des pages étant enregistrées dans une base de données dans le système d’information de l’invention.

Description détaillée d’un exemple non limitatif de réalisation

La présente invention sera mieux comprise à la lecture de la description qui suit, concernant un exemple non limitatif de réalisation, se référant aux dessins annexés, où :

- La figure 1 représente une vue schématique de l’architecture informatique d’un système de publication de contenus à accessibilité personnalisée selon l’invention

- La figure 2 représente un schéma fonctionnel de l’invention

- La figure 3 représente le diagramme fonctionnel d’une solution de publication de contenus à accessibilité personnalisée selon l’invention.

Contexte général de l’invention

La notion de FALC (facile à lire et à comprendre, en anglais « Easy to read ») a été développée depuis une dizaine d’années pour réduire le risque d’exclusion de la vie sociale et économique des personnes souffrant de handicaps ou de déficits légers voire de difficultés d’adaptation culturelles ou intellectuelles afin de leur faciliter l’accès à l’information et la lecture de contenus de toutes sortes. Il s’agit notamment de faciliter l’insertion dans la vie normale de personnes dyslexiques, malvoyantes mais aussi de personnes étrangères maîtrisant mal une langue, illettrées, de personnes âgées, d'enfants du primaire, de personnes souffrant de troubles cognitifs divers. Les profils des usagers potentiels sont certes différents.

Cette démarche visant à améliorer l’accessibilité de l’information écrite à un public élargi s’inscrit aussi dans la volonté des administrations de faciliter la compréhension de leur production réglementaire.

La mise en œuvre de ces mesures se traduit à ce jour par la prise en compte des rédacteurs de contenus textuels de quelques règles de bon sens telles que :

L’utilisation exclusive de mots d'usage courant. Par exemple, mouchoir « à usage unique » est remplacé par « papier ».
L’utilisation exclusive de phrases courtes.
L’association systématique d’un pictogramme au texte.
La simplification de la mise en page et à travers des typographies simples, des lettres en minuscule, des contrastes de couleur.
La réduction des messages informatifs pour aller tout de suite à l’essentiel.

Il est évident que l’application de ces règles conduit à un appauvrissement préjudiciable de la rédaction de contenus, à une lourdeur et lenteur du processus, et à une littérature infantilisante et dépourvue de saveur et de nuances notamment pour ceux qui ne souffrent d’aucune déficience.

Enfin, elle suppose la co-existence de deux versions d'un document ou site : normale et handicap (ce qui est excluant), ou alors l'uniformisation de celui-ci (nivellement par le bas).

Diverses solutions techniques ont été proposées pour permettre une personnalisation du niveau de simplification en fonction des aptitudes du lecteur cible. La présente invention s’inscrit dans cette démarche, en résolvant par ailleurs les problèmes techniques liés à la personnalisation voire à l’individualisation en temps réel de grands volumes d’informations textuels, pour un grand nombre d’utilisateurs potentiels, mais dont chacun ne consultera qu’une infime proportion des contenus proposés ; et ce sans procéder à l’enregistrement de la totalité des contenus dans la totalité des formes simplifiés nécessaires.

Optionnellement l’invention permet aussi d’adapter de manière flexible le degré de simplification du contenu, avec une adaptation automatique à la meilleure accessibilité de l’usager, même sans connaissance préalable de la nature de ses déficiences et handicaps.

L’invention consiste à mettre à la disposition des producteurs de contenus textuels une solution simple et peu impactante sur ses habitudes rédactionnelles, et aux usagers des contenus une solution simple pour accéder à ces contenus informationnels sous une forme personnalisée à ses éventuelles déficiences et handicaps, en temps réel et de manière automatique.

Description de l’architecture informatique

L’invention exploite une architecture informatique sous forme de réseau avec des équipements d’utilisateurs (100, 101, 102) équipés d’une interface utilisateur telle qu’un logiciel d’édition de contenus numériques, par exemple un navigateur, et connectés, par Internet par exemple, à un serveur WEB (200) chargé de la mise à disposition et la présentation de contenus numériques préparé par un serveur d’application (210). Ce serveur d’application (210) est commandé par les programmes informatiques assurant les traitements objet de l’invention, ainsi que le pilotage d’un serveur de bases de données (220) associé à une mémoire de masse (225).

La mémoire de masse (225) contient les fichiers numériques correspondant à des contenus déjà existants, ainsi que des contenus numériques nouvellement créés.

Les producteurs de contenus numériques (300) disposent d’un équipement informatique (310, 320) permettant de préparer et valider le cas échéant des contenus numériques comportant des textes, avec une application informatique usuelle, et éventuellement avec une application informatique d’aide à la simplification générique de contenus textuels.

Cet équipement (310, 320) peut être un simple éditeur de textes ou de contenus multimédias, ou encore un équipement comprenant des fonctionnalités pour la préparation de textes et de contenus respectant un premier niveau générique de simplification FALC.

Bien entendu, cette architecture est décrite à titre d’exemple non limitatif, les différents serveurs (200, 210, 220) pouvant également être regroupés en un seul ordinateur.

La solution décrite permet la mise en œuvre de la simplification sous différents modes :

Extension ou logiciel du côté utilisateur sans lien avec le producteur de contenu
Plugin du côté producteur, avec reformulation/validation ou non du contenu adapté
Outil - logiciel ou web - de transcription d'un document/site.

Principes fonctionnels

L’invention se compose de plusieurs parties fonctionnelles optionnelles :

L’enregistrement de contenus originels, optionnellement prétraités pour présenter un niveau de simplification générique n’altérant pas la richesse sémantique et informative du contenu.
L’utilisation optionnelle d’une version déjà simplifiée pour un nouvel utilisateur présentant les mêmes handicaps et/ou déficiences qu’un précédent utilisateur (par « mêmes handicaps et/ou déficiences », on entendra des handicaps et/ou déficiences s’exprimant dans les deux cas par des descripteurs communs, au moins en partie).
La transmission en temps réel des contenus enregistrés soit sous une forme brute pour les utilisateurs non référencés par le serveur WEB (200), soit sous une forme faisant l’objet d’une personnalisation de premier niveau pour les utilisateurs référencés par le serveur WEB (200).
L’affinement de la simplification personnalisée en réponse à des interactions entre l’utilisateur et le contenu reçu.
Une simplification partielle ou totale en réponse à des interactions entre l’utilisateur et le contenu reçu, que celui-ci ait été transformé par l’algorithme ou non.
La gestion dynamique de la base de données de déficiences et des règles de simplification.

Le traitement “de premier niveau” est optionnel : l’invention n’est pas limitée à un tel pré-traitement, et s’applique bien entendu aussi à des textes “bruts” ; notamment à des corpus de textes rédigés anciennement sans prise en compte des concepts FALC.

Schéma fonctionnel

La première étape (1000) concerne la préparation d’une requête comportant un identifiant d’un contenu numérique recherché ainsi qu’un identifiant de l’équipement de l’utilisateur.

Cette requête fait l’objet d’un traitement (1010) soit sur l’équipement de l’utilisateur, soit sur un serveur, pour vérifier :

Si la requête contient une combinaison d’indicateurs de déficience
Et à défaut, s’il existe une base de données (1020) dans laquelle sont enregistrés, pour l’utilisateur correspondant à l’identifiant contenu dans la requête, une combinaison de d’indicateurs de déficience.

Si la requête ne permet pas de connaître les indicateurs de déficience de l’utilisateur, le traitement (1010) se poursuit par un traitement (1030) exécuté sur l’équipement de l’utilisateur, ou sur le serveur dont la mémoire contient le fichier originel objet de la requête, ou encore sur un serveur dédié réalisant optionnellement un traitement en mode SaaS (logiciel en tant que service). Ce traitement consiste à générer un fichier éditable comprenant le fichier originel non simplifié ainsi qu’un code exécutable générant un moyen d’évaluation des indicateurs de déficience. Ce code génère par exemple une liste de cases à cocher, une série de curseur, ou encore un code permettant de réévaluer les indicateurs de déficience par des actions de type « pop-up » consistant à pointer une zone affichée correspondant à une difficulté rencontrée par l’utilisateur.

Lorsque l’utilisateur interagit avec ledit moyen d’évaluation, une étape (1040) actualise les indicateurs de déficience, qui actualise la requête de l’étape (1000) qui est réitérée.

Dans le cas où l’étape (1010) permet d’identifier une combinaison d’indicateurs de déficience, une étape (1050) réalise une recherche de fichiers correspondant à l’identifiant du fichier visé dans la requête dont le mode de simplification correspondant à la combinaison d’indicateurs de déficience, ou est proche de la combinaison d’indicateurs de déficience contenu dans la requête.

La proximité est déterminée par exemple par un traitement de distance euclidienne ou de distance vectorielle, ou tout autre solution connue de calcul de distance mathématique. Le niveau de proximité est déterminé par référence à une valeur-seuil prédéterminée. Cette valeur-seuil pourra être ajustée par tout moyen, par exemple par apprentissage-machine, par exemple en fonction du nombre d’itérations, ou par ajustement manuel. Éventuellement, cette étape comporte une intervention manuelle pour prévalider le texte généré ou pour demander la validation d’un texte ou sa correction.

Dans le cas où aucune version simplifiée proche du fichier requêté n’est disponible, le procédé consiste à appliquer un traitement (1060) de simplification du fichier originel par application des algorithmes de simplification correspondant aux indicateurs de déficiences contenus dans la requête. Optionnellement, le fichier simplifié est enregistré dans une mémoire en liaison avec les indicateurs de déficience utilisés et l’identifiant du fichier originel.

Le fichier simplifié préexistant issu de l’étape (1050) ou calculé spécifiquement de l’étape (1060) fait l’objet d’un traitement consistant à associer un code dont l’exécution sur l’équipement de l’utilisateur génère une interface de personnalisation des indicateurs de déficience avec le fichier simplifié, pour générer un fichier éditable qui est ensuite transmis à l’équipement de l’utilisateur.

Le procédé susvisé peut être réitéré plusieurs fois, tant que l’utilisateur interagit avec l’interface d’actualisation des indicateurs de déficience.

Préparation du contenu numérique primaire

Les contenus numériques sont préparés par un opérateur disposant d’un équipement informatique (310, 320) avec un programme informatique d’édition, par exemple un logiciel de traitement de texte, ou un éditeur de page HTML. Il produit ainsi un contenu comportant de manière connue des données textuelles, éventuellement des données textuelles enrichies (police, caractères gras, italiques,…), et le cas échéant des balises de mise en page, ainsi qu’éventuellement des données graphiques, sonores ou des appels à des ressources extérieures.

Ce contenu numérique est ensuite transmis sous forme de fichier numérique (300) au serveur d’application (210) qui procède à l’enregistrement dans la mémoire (225) et à son indexation pour le rendre accessible par des équipements extérieurs (100 à 102) via le serveur WEB (200)

Prétraitement générique

Optionnellement, le serveur d’application (210) procède à un prétraitement générique de simplification consistant à appliquer un traitement automatique de remplacement de séquences textuelles selon une première base de règles ou par le traitement par un moteur d’apprentissage machine. Cette base de règles contient les règles de détection et de correction d’éléments formels du fichier numérique, comprenant des règles telles que :

Contraste entre caractères et fond inférieur à une valeur seuil ou à des règles chromatiques et modification des paramètres d’enrichissement graphique des caractères concernés
Remplacement automatique d’abréviations inhabituelles par les mots ou le groupes de mots complets
Remplacement automatique des mots en majuscule par les mots en majuscule pour le premier caractère seulement
Transformation de structures grammaticales complexes en structures plus simples
Découpage de phrases longues en plusieurs phrases / notions
Insertion d’éléments graphiques, audio ou textuels (image to text, text to speech)
Ajout et/ou modification de balises html, ...

Certaines règles peuvent en outre prendre en compte une analyse automatique du contexte du document, pour déterminer le caractère inhabituel ou non de certains éléments, tels que les abréviations et sigles. Ainsi, le sigle EPO sera classifié comme usuel pour un document dont le contexte général est analysé comme relevant de la propriété intellectuelle, où le lecteur normal comprend qu’il s’agit de l’abréviation de « european patent office »

Il sera aussi classifié comme usuel pour un document dont le contexte général est analysé comme relevant du dopage dans le domaine sportif, où le lecteur normal comprend qu’il s’agit de l’abréviation de « érythropoïétine ».

L’analyse du contexte conduira à maintenir le sigle lorsqu’il est utilisé dans un contexte totalement homogène, et à le remplacer automatiquement lorsque l’analyse conduit à un contexte hybride. Dans le cas où le remplacement automatique est incertain, la règle conduit à un marquage du sigle ambigu, pour permettre à un opérateur de procéder manuellement au remplacement du sigle par son développé.

Consultation d’un site par un utilisateur

La figure 2 représente le diagramme fonctionnel d’une consultation d’un site selon le procédé conforme à l’invention

Étape (1) : Lorsqu’un utilisateur consulte un site en ligne à partir d’un équipement (100 à 102), il transmet une requête au serveur WEB (200).

Étape (2) : Si ce serveur WEB (200) dispose d’un moyen de communication avec un programme applicatif de simplification, par exemple sous la forme d’un plug-in, assurant la connexion avec le serveur applicatif (210), ce dernier renverrait une version simplifiée à l’utilisateur.

Étape (3) : dans le cas où le serveur WEB (200) ne permet pas l’accès à une application de simplification, l’équipement (100 à 102) de l’utilisateur peut exécuter une application locale de simplification ou de connexion à un serveur exécutant une application de simplification en mode SaaS (sigle de « Software as a Service », en français « logiciel en tant que service ») par exemple.

Étape (4) correspond au cas spécifique d’absence d’application sur le site et sur l’équipement local (100 à 102). Dans ce cas, le traitement se poursuit de manière habituelle, la requête aboutissant à l’accès via le serveur WEB (200) à la page du site, sans traitement de simplification. Ainsi, dans tous les cas, le fonctionnement normal du navigateur WEB perdure, sans perturbation.

Dans les deux autres cas (situation (2) ou situation (3)), le serveur applicatif (210) vérifie si l’identifiant de l’utilisateur contenu dans la requête correspond à un compte déjà enregistré (étape (5)).

Processus technique pour un utilisateur déjà enregistré

Pour les utilisateurs enregistrés, et acceptant (vérification (6)) la consultation de leurs informations relatives à leurs déficiences et handicaps, la base de données (225) du serveur de base de données (220) contient un enregistrement numérique associant un identifiant de l’utilisateur avec les indicateurs de déficits et de handicaps dont souffre ledit utilisateur. L’enregistrement est par exemple constitué par une table contenant pour chacune des typologies de handicap une valeur numérique binaire (« 0 » ou « 1 ») ou d’une valeur quantitative, codée sur plusieurs bits.

L’étape suivante (7) consiste à vérifier si la base de données (225) contient déjà une version du fichier ciblé par la requête sous une forme simplifiée selon une combinaison d’indicateurs identique ou voisine (au sens de distance euclidienne, et par référence à une valeur-seuil) avec la combinaison d’indicateurs de l’utilisateur enregistré. Si c’est le cas, le serveur d’application (210) sélectionne le fichier simplifié ad-hoc dans la base de données (8) qui constitue un sous-ensemble de la mémoire (225) et le transmet au serveur WEB (210) pour la communication à l’équipement connecté (100 à 102) de l’utilisateur et son édition par le logiciel applicatif de visualisation, par exemple le navigateur.

Dans le cas contraire, le serveur d’application (210) commande l’exécution d’un ensemble de traitements de simplification (9) spécifique prenant en compte la combinaison d’indicateurs de déficiences de l’utilisateur. Ces traitements comprennent le calcul d’un score initial d’accessibilité du document cible enregistré dans la base de données (225).

Ce traitement comprend par exemple un procédé (10) d’évaluation des « scores de complexité de source ». Ces scores de complexité de source prédits présentent un certain nombre d'avantages, tels que, mais sans s'y limiter, une meilleure efficacité pour l'utilisateur et de meilleures performances d'interaction avec les utilisateurs grâce à l'identification de contenus sources, ou de sous-sections de ce contenu, dont la localisation risque d'être longue ou difficile pour les utilisateurs. En outre, ces scores de complexité de source permettent aux utilisateurs de modifier un contenu source avant la localisation pour faire baisser les scores de complexité de source, ce qui permet de réduire les taux d'erreur concernant le texte ou la langue localisé(e) présenté(e) dans des applications logicielles ou d'autres médias tels que, mais sans s'y limiter, des localisations parlées ou écrites du contenu source. A titre d’exemple, les brevets européens EP3230896B1, EP3230896B1, EP3230896B1, EP1544746A2 ou encore la demande de brevet américain US20110082683A1 décrivent des solutions pour procéder à un tel traitement.

Ce traitement comprend aussi un procédé (11) de simplification prenant en compte le résultat du procédé d’évaluation des « scores de complexité de source » (10) et la combinaison d’indicateurs de déficiences de l’utilisateur. Ce procédé comporte entre autres des étapes de :

Remplacement mot à mot (depuis un dictionnaire (12) ou apprentissage) en fonction du domaine, du contexte, par exemple en application des solutions proposées par les brevets US20110184959A1, US4887212A ou encore US9122673 B2, US9122673 B2, US20020078090A1, US9471561B2, US4887212A (avec personnalisation selon sujet/secteur/domaine)
Règles syntaxiques (sujet verbe objet…), structure de la phrase, modification des images (par exemple selon l’enseignement des brevets US7010581B2, US7844907B2, US20030187656A1…)
Préapprentissage automatique par apprentissage machine depuis un moteur d’apprentissage (13) (par exemple selon l’enseignement du brevet US10423709B1)
Conservation de l’information par calcul d’un vecteur de sens pour la phrase source, ainsi que pour la phrase cible, et comparaison des deux vecteurs comme décrit par exemple dans les brevets EP2811414A2 ou EP3230896B1
Modification du code selon une bibliothèque de règle (14) : balises, description d'images dans le code, adaptation aux standards‚ comme proposé dans les brevets US10423709B1, US7844907B2, US7844907B2, US20030187656A1, US8090800B2
Avatar ou langue des signes ou encore fichier de synthèse vocal ou de pictogrammes tel que proposé dans les brevets US6665642B2, US7194411B2, US20060063138A1
Adaptations à des formats spécifiques à certains handicaps (braille, claviers, liseuses, commande vocale...) comme proposé dans le brevet US20060063138A1.

Le résultat de ses traitements est constitué par un fichier numérique converti (15) spécifiquement adapté à la combinaison d’identifiants de déficiences et de handicaps de l’utilisateur concerné. Ce fichier (15) est par ailleurs enregistré dans la base de données (8) en relation avec les indicateurs de déficiences associés, pour permettre, lors d’une requête provenant d’un utilisateur similaire, d’éviter la réitération du calcul d’un fichier converti.

L’étape suivante (16) consiste à transmettre le fichier spécifique ainsi converti via le serveur WEB (200) à l’équipement informatique (100 à 102) de l’utilisateur considéré pour permettre son affichage en remplacement du fichier cible originel.

Si aucune solution de retraitement n’est possible, le serveur WEB (200) transmet à l’équipement (100 à 102) de l’utilisateur le fichier originel (étape (17) du diagramme objet de la figure 2).

Interaction de l’utilisateur pour une simplification additionnelle

Selon une variante particulière, le fichier transmis par le serveur WEB (200) – fichier numérique originel ou fichier transformé – est enrichi avec un moyen numérique d’interaction entre l’utilisateur et le contenu du fichier.

Ces interactions peuvent être de différentes natures et incidences :

Interactions que l'on détecte pour mieux cibler les difficultés de l'utilisateur
Interactions que l'on détecte pour mieux scorer la difficulté de la page, ou si elle est déjà simplifiée, améliorer l'utilisation des règles et algorithmes (si un utilisateur rencontre une difficulté se traduisant par des interactions caractéristiques, sur une version censée être adaptée, il faut que le système comprenne pourquoi et adapte ses règles/algorithmes)

On peut laisser ouvert l'idée d'un retraitement non sollicité par l'utilisateur mais détecté par un temps particulièrement long sur un morceau de la page (ou un comportement étrange de la souris, ou par détection du regard ou autres comportements anormaux détectables).

interactions sollicitées : par exemple « clic droit simplifier ». Qui déclenchent un retraitement.

Cette étape (18) consiste par exemple à introduire dans le fichier numérique un lien hypertexte permettant d’activer une fonctionnalité de simplification personnalisée, ou encore un code informatique, par exemple selon le langage « ADOBE Flash » ou « ActionScript » (noms commerciaux) ou encore du code “Java” ou “Swift” (noms commerciaux), qui est exécuté sur l’équipement local (100 à 102).

Ce code peut dans une première version commander l’affichage interactif d’une interface de paramétrage des déficiences et handicaps de l’utilisateur, par exemple sous forme d’une page contenant des cases à cocher permettant de saisir localement les indicateurs de déficiences, les enregistrer localement, et le cas échéant les transmettre en relation avec l’identifiant de l’utilisateur pour l’enregistrement dans la base de données (225). En fonction des actions de l’utilisateur (pointage d’une case graphique, activation par un « click droit » par exemple), le code informatique inséré dans le fichier commande l’enregistrement d’une séquence numérique de personnalisation des paramètres de handicap, qui pourront ensuite être automatiquement réexploités pour le calcul de la simplification de futures informations textuelles.

Dans une deuxième version, le code embarqué dans le fichier permet de sélectionner des zones de l’écran d’affichage pour enregistrer les parties du contenu numérique mal comprises, et transmettre cette information au moteur d’apprentissage machine (13). Le texte surligné va être identifié comme complexe pour la cible ce qui va permettre d'entraîner les modèles de scoring.

Dans une troisième version, le code embarqué dans le fichier commande un traitement local consistant à enregistrer les données numériques représentatives directement ou indirectement des interactions de l’utilisateur, de manière automatique, sous forme d’un fichier numérique. Ces données sont par exemple :

Le temps passé sur la page, constituant un marqueur d’accessibilité indirect
Les parcours du pointeur et des balayages de la page
Les actions sur des demandes de validation
Une action de type « clic droit » pour une commande de simplification
Les informations de suivi du regard (« eye tracking ») fournies par la caméra de l’équipement informatique (100 à 102)
les textes générés par l’utilisateur
etc…

A titre d’exemple, les brevets US20100251217A1 et US20150127665A1 proposent de tels traitements.

Ces données sont acquises et enregistrées localement et transmises ensuite (étape (19)) pour alimenter le moteur d’apprentissage (13).

Ce post-traitement conduit à améliorer le calcul d’une version simplifiée, avec des critères plus sévères, aboutissant à la visualisation d’une page révisée (20).

Mise en œuvre locale

L’invention peut aussi être mise en œuvre sur un équipement uniquement local. Dans ce cas, l’algorithme de simplification applique sur le calculateur local le procédé d’apprentissage susvisé localement ou par un apprentissage fédéré et des mises à jour pour permettre une exécution en temps réel sur une page – soit en étant intégré à la page, soit à l’extension, soit sur un logiciel téléchargé par l’utilisateur/un navigateur spécifique.

Autres alternatives

Dans le cas de l’outil d’aide à la rédaction (utilisation pour prétraitement) on peut avoir simplement un système de suggestions de modifications, permettant de définir le degré de complexité et le niveau de déficience de la cible prise en compte lors de la rédaction du contenu originel.

On peut prévoir une validation humaine ou la demande d’une validation humaine.

Claims

Procédé de conversion automatique, totale ou partielle, de fichiers numériques enregistrés chacun dans une mémoire indexée sous une première forme originelle, ledit procédé comportant au moins une étape de conversion d’un fichier numérique en fichier numérique simplifié pour un niveau d’accessibilité déterminé, caractérisé en ce qu’il comporte, lors de la requête d’un desdits fichiers numériques par l’équipement informatique d’un utilisateur la transmission d’un fichier numérique comprenant un contenu requêté et la mise à disposition dudit utilisateur d’un moyen d’interaction exécutable sur l’équipement dudit utilisateur, ledit contenu requêté étant constitué :
par le contenu du fichier originel requêté transformé par un traitement de simplification fonction de la combinaison des indicateurs de déficiences de l‘utilisateur, dans le cas où :

ladite requête contient la combinaison d’indicateurs de déficiences de l’utilisateur,

ou ladite requête provient d’un utilisateur préalablement enregistré dans une table numérique associant un identifiant de l’utilisateur à sa combinaison d’indicateurs de déficiences dans mémoire locale ou sur un serveur,

par défaut par le contenu du fichier requêté originel.
Le procédé comportant, en cas d’activation dudit moyen d’interaction, une étape récursive de transformation du fichier transmis audit utilisateur, ladite transformation consistant à réévaluer les indicateurs de déficiences et à générer un nouveau traitement de simplification.
Procédé de conversion automatique, totale ou partielle, de fichiers numériques selon la revendication 1 caractérisé en ce qu’il comporte en outre une étape préalable de recherche d’une version simplifiée du fichier requêté, dont la combinaison des indicateurs de déficiences associés est la plus proche de la combinaison de déficiences enregistrée dans ladite table numérique, en relation avec l’identifiant de l’utilisateur, et, s’il existe au moins une version simplifiée proche, la préparation d’un fichier éditable, contenant ladite version simplifiée la plus proche du fichier requêté ainsi que la mise à disposition d’un moyen d’interaction exécutable sur l’équipement de l’utilisateur.
Procédé de conversion automatique, totale ou partielle, de fichiers numériques selon la revendication 1 caractérisé en ce qu’il comporte en outre une étape de validation consistant à transmettre à un équipement tiers un fichier contenant la version simplifiée dudit contenu et des moyens de validation ou de modification.
Procédé de conversion automatique, totale ou partielle, de fichiers numériques selon la revendication 1 caractérisé en ce que ledit moyen d’interaction est constitué par un formulaire numérique.
Procédé de conversion automatique, totale ou partielle, de fichiers numériques selon la revendication 1 caractérisé en ce que ledit moyen d’interaction est constitué par une application d’analyse des interactions effectuées par l’utilisateur sur l’interface de visualisation dudit fichier simplifié.
Procédé de production et de conversion automatique de fichiers numériques selon la revendication 2 caractérisé en ce que lesdits traitements de simplification sont exécutés sur un serveur d’application.
Procédé de production et de conversion automatique de fichiers numériques selon la revendication 1 caractérisé en ce que lesdits traitements de simplification sont exécutés sur l’équipement de l’utilisateur.
Procédé de conversion automatique de fichiers numériques selon la revendication 1 caractérisé en ce qu’en l’absence d’application de simplification sur le serveur de fichiers (210, 220) commandant l’accès audit fichier-cible, ledit serveur de fichiers (210, 220) transmet à l’équipement informatique (100 à 102) le fichier requêté natif, et en ce qu’une application commande la redirection dudit fichier-cible vers un serveur de simplification générique commandant l’exécution d’une application de simplification dudit fichier-cible.
Procédé de conversion automatique de fichiers numériques selon la revendication 1 caractérisé en ce qu’il comporte une étape d’enregistrement d’une partie au moins des fichiers simplifiés calculés en réponse à une requête d’un utilisateur, lesdits fichiers simplifiés étant associés à la combinaison d’indicateurs de déficiences dudit utilisateur.
Procédé de production et de conversion automatique de fichiers numériques selon la revendication 3 ou 4 caractérisé en ce que ladite séquence de traitement exécutée par ledit serveur comporte en outre la mise à jour de la combinaison d’indicateurs de déficiences associé audit utilisateur.
Procédé de production et de conversion automatique de fichiers numériques selon la revendication 3 ou 4 caractérisé en ce que ladite séquence de traitement exécutée par ledit serveur comporte en outre la mise à jour des règles / modèles par apprentissage.