FR2676560A1 - Procede pour consulter plusieurs dictionnaires et systemes pour sa mise en óoeuvre. - Google Patents

Procede pour consulter plusieurs dictionnaires et systemes pour sa mise en óoeuvre. Download PDF

Info

Publication number
FR2676560A1
FR2676560A1 FR9106030A FR9106030A FR2676560A1 FR 2676560 A1 FR2676560 A1 FR 2676560A1 FR 9106030 A FR9106030 A FR 9106030A FR 9106030 A FR9106030 A FR 9106030A FR 2676560 A1 FR2676560 A1 FR 2676560A1
Authority
FR
France
Prior art keywords
word
dictionaries
consultation
dictionary
storing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
FR9106030A
Other languages
English (en)
Inventor
Gachot Jean
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to FR9106030A priority Critical patent/FR2676560A1/fr
Publication of FR2676560A1 publication Critical patent/FR2676560A1/fr
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/247Thesauruses; Synonyms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

Procédé pour consulter, sur un mot donné, plusieurs dictionnaires parmi un ensemble prédéterminé de dictionnaires, chaque dictionnaire présentant une langue d'origine et une langue cible prédéterminées ou un domaine spécialisé. Le procédé comprend une étape de saisie du mot effectuée une seule fois à l'issue d'une étape préalable pour choisir un couple de langues constitué d'une langue d'origine et d'une langage cible. Le système (1) pour la mise en œuvre du procédé comprend des moyens (13) pour générer selon un algorithme prédéterminé, un code à partir de chaque mot saisi, des moyens pour stocker un fichier clé (12) comprenant un ensemble de codes, et des moyens pour stocker plusieurs fichiers de données (11a, 11b, 11n) associés respectivement à chaque dictionnaire et accessibles directement à partir de l'un desdits codes contenus dans le fichier clé (12). Utilisation notamment pour l'aide à la traduction.

Description

La présente invention concerne un procédé pour consulter plusieurs dictionnaires.
Elle vise également des systèmes pour sa mise en oeuvre.
La traduction de documents, notamment de documents techniques, d'une langue d'origine vers une langue cible, nécessite l'emploi de dictionnaires qui peuvent être spécialisés dans un domaine particulier du savoir et des sciences, soit généralistes. Or, la consultation de ces dictionnaires peut être longue et fastidieuse lorsqu'un mot que l'on souhaite traduire présente par exemple plusieurs acceptions ou se trouve au sein d'expressions particulières. Il faut alors consulter plusieurs dictionnaires afin d'en déterminer la traduction la plus appropriée.
Il existe déjà des procédés de consultation de dictionnaires mettant en oeuvre des terminaux vidéotexte, notamment des terminaux Minitel, ou des postes de travail autonomes, notamment des microordinateurs. Cependant, les procédés actuels présentent l'inconvénient d'être dédiés chacun à un dictionnaire et à un couple de langues déterminés,
Le but de la présente invention est de remédier à ces inconvénients en proposant un procédé pour consulter, sur un mot donné, plusieurs dictionnaires parmi un ensemble prédéterminé de dictionnaires, chaque dictionnaire présentant une langue d'origine et une langue cible prédéterminées ou un domaine spécialisé.
Suivant l'invention, le procédé comprend une étape de saisie dudit mot effectuée une seule fois à l'issue d'une étape préalable pour choisir un couple de langues constitué d'une langue d'origine et d'une langage cible.
Ainsi, avec le procédé selon l'invention, l'utilisateur n'a plus à frapper le mot recherché qu'une seule fois quel que soit le nombre de dictionnaires et quel que soit le dictionnaire, ce qui contribue à diminuer significativement la duré totale d'interrogation de ces dictionnaires et fournir effectivement une aide à la traduction.
Selon une caractéristique avantageuse de l'invention, 11 exécution de l'étape de choix du couple de langues fournit une liste de dictionnaires disponibles pour le couple de langues choisi.
Ainsi, l'utilisateur est informé directement des dictionnaires concernés par le couple de langues choisi, lui évitant des manipulations supplémentaires.
Dans une version préférée de l'invention, le procédé comprend en outre, à l'issue de l'étape de saisie du mot objet des consultations, une étape pour indiquer en retour, un ensemble d'options de consultation correspondant au mot saisi, chaque option de consultation étant associée à un code de référence, à une limitation du mot saisi et à une indication d'un dictionnaire consulté.
De cette façon, l'utilisateur est directement orienté dans sa recherche vers des dictionnaires pertinents, ce qui contribue encore à optimiser notablement les opérations de consultation.
Suivant un autre aspect de l'invention, le système pour consulter sur un mot donné, plusieurs dictionnaires parmi un ensemble de dictionnaires prédéterminés, chaque dictionnaire présentant une langue d'origine et une langue cible prédéterminées ou un domaine spécialisé, mettant en oeuvre le procédé selon l'invention, comprenant des moyens pour saisir des informations d'entrée, notamment des mots et des commandes, des moyens pour afficher des informations de sortie, notamment des résultats de consultation, et des moyens de contrôle et de traitement recevant des informations issues des moyens de saisie et délivrant des informations aux moyens d'affichage, est caractérisé en ce qu'il comprend en outre, en relation avec les moyens de contrôle et de traitement, des moyens pour générer selon un algorithme prédéterminé, un code à partir de chaque mot saisi, des moyens pour stocker un fichier clé comprenant un ensemble de codes, et des moyens pour stocker plusieurs fichiers de données associés respectivement à chaque dictionnaire et accessibles directement à partir de l'un desdits codes contenus dans le fichier clé.
D'autres particularités et avantages de l'invention apparaîtront encore dans la description ciaprès. Aux dessins annexés donnés à titre d'exemples non limitatifs
- la figure 1 illustre de façon schématique une première forme de réalisation d'un système de consultation selon l'invention, mettant en oeuvre un réseau télématique
- la figure 2 illustre une seconde forme de réalisation d'un système de consultation selon l'invention, mettant en oeuvre un poste de travail autonome
- la figure 3 représente un ensemble de pagesécrans représentatives du procédé selon l'invention, ainsi qu'un organigramme simplifié de ce procédé.
Dans une première forme de réalisation de l'invention représentée en figure 1, le système 1 comprend d'une part, un ensemble de postes 2, 6, 18, 19 d'interrogation accessibles à des utilisateurs dudit système et intégrant notamment des moyens de saisie, généralement un clavier alphanumérique 4, 4' et des moyens d'affichage, tels que des écrans 3, 3', et d'autre part, un centre serveur 10 situé à distance desdits postes d'interrogation 2, 6, 18, 19. Ce centre serveur 10, qui peut être par exemple un ordinateur ou un miniordinateur, est relié aux postes d'interrogation à travers un réseau télématique 5, qui peut être le réseau téléphonique ou un encore un réseau spécialisé ou numérique à intégration de service (RNIS).
Le centre serveur 10 abrite une unité de contrôle et de traitement 14, des supports de mémoire contenant notamment un fichier clé 12 et un ensemble 11 de fichiers de données pila, llb, lln associés respectivement à un des dictionnaires consultables au sein du système 1.
La nature et la fonction de ces fichiers sera décrite dans la suite de la description. L'unité de contrôle et de traitement 14 commande des moyens 13 pour générer selon un algorithme prédéterminé un code, notamment hexadécimal, à partir de chaque mot saisi sur les claviers 4, 4' des postes d'interrogation 2, 6. Ces moyens de génération de code, représentés de façon symbolique sur la figure 1, peuvent être intégrés au sein de l'unité de contrôle et de traitement 14, ou encore être matérialisés par un circuit spécialisé de codage. L'ensemble des informations numériques traitées par le centre serveur transite via un interface de télécommunication réalisé suivant des techniques connues. Il est à noter que l'ensemble des fonctions assurées par le centre serveur 10 peut être réalisé avec des équipements standard dans le domaine de la télématique. Il est prévu en outre un fichier 15 destiné à contenir certains résultats d'interrogation en vue d'une utilisation ultérieure.
Les postes d'interrogation peuvent être indifféremment des terminaux vidéotexte 2 reliés au réseau téléphonique, par exemple des postes Minitel, ou encore des microordinateurs 6, notamment de type compatible PC ou
PS, équipés de cartes de modulation-démodulation (modem).
Dans une seconde forme de réalisation de l'invention illustrée en figure 2, le procédé de consultation selon l'invention est mis en oeuvre au sein d'un poste de travail autonome 20, par exemple un microordinateur compatible de type PC ou PS, normalement équipé d'un écran 23 pour la visualisation de pages-écrans générées par le procédé de consultation et d'un clavier 24 pour la saisie de commandes et de mots.Dans ce cas, l'unité centrale 28 du microordinateur 20 assure l'ensemble des fonctions précédemment allouées au centre serveur 10 présenté en figure 1, les fichiers clé et de données étant stockés soit au sein d'un support magnétique d'informations, en pratique un disque dur 27 de très grande capacité, soit au sein d'un support optique 26 de type CD-ROM ("Compact Disk Read Only Memory": disque compact permettant uniquement la lecture d'informations) auquel est associé un lecteur 25 de CD-ROM relié au microordinateur 20.
On va maintenant décrire, en référence à la figure 3, un ensemble de pages écrans représentatives générées par le procédé selon l'invention, en même temps que les étapes essentielles de consultation prévues par ce procédé.
Lors de la phase d'initialisation I, entreprise à la suite d'une demande de consultation, une première étape 40 est effectuée pour déterminer le choix d'un couple de langues (langue d'origine et langue cible). A cette fin, une première page-écran 30 est générée (étape 40a) et contient une liste 30a de langues d'origine, une liste 30b de langues cibles, et un message 30c d'invitation à choisir un couple de langues. A titre d'exemple, les langues disponibles peuvent être le
Français, l'Anglais, l'Allemand et l'Espagnol.L'opérateur entre alors son choix (étape 40b) et une étape 41 de traitement de la réponse est entreprise pour générer en retour (41a) une page-écran 31 indiquant à l'opérateur une liste 31a des dictionnaires disponibles pour le couple de langues choisi et comprenant un message 31b d'invitation à entrer (41b) à partir du clavier un mot qui sera l'objet de l'interrogation ou consultation. Les dictionnaires disponibles peuvent inclure des dictionnaires correspondant à un domaine spécialisé, par exemple l'aéronautique ou la chimie. Lorsque la saisie est validée, une étape de recherche 50 est entreprise au cours de laquelle un code hexadécimal est généré à partir du mot saisi et le fichier clé est mis en oeuvre pour fournir des pointeurs ou numéroteurs permettant un accès très rapide aux informations contenues dans les différents fichiers de données.A l'issue de cette étape de traitement 50, une étape 42 d'indication du résultat de la recherche est entreprise au cours de laquelle une page-écran 32 est générée (étape 42a). Cette page-écran 32 contient un ensemble d'options de consultation 32a constituées chacune d'un numéro de référence 32c, d'une limitation du mot, à savoir du mot accompagné éventuellement d'un qualitatif ou d'une expression définissant plus précisément un contexte d'utilisation précis de ce mot, et du nom du dictionnaire.
Par exemple, si le mot saisi est AVION, des options de consultation proposées par le procédé selon l'invention incluent : AVION BIREACTEUR ou encore AVION
CITERNE, qui sont des limitations intéressantes du mot initial.
La page-écran 32 comprend en outre un message 32b d'invitation à choisir un numéro d'option de consultation. A l'issue d'une entrée 42b par l'opérateur d'un numéro d'option n, le système de consultation entreprend une étape 60 de recherche dans le fichier de données approprié, des informations lexicales associées à l'option de consultation choisie, à l'issue de laquelle une étape 43 de visualisation desdites informations lexicales est exécutée. Elle conduit à la génération 43a d'une page-écran 33 comprenant l'indication 33a du dictionnaire n correspondant à l'option choisie, du mot ou de sa limitation 33b (par exemple, AVION BIREACTEUR) et des informations lexicales 33c fournies par le dictionnaire considéré (par exemple, traduction du mot dans la langue cible, définition de ce mot, orthographe, traductions d'expressions incluant ce mot).Cette pageécran comprend en outre un message 33d proposant soit de poursuivre la consultation d'une page écran complémentaire, lorsque l'ensemble des informations lexicales ne peut tenir dans une seule page-écran, ou d'une page-écran correspondant à l'option de consultation immédiatement suivante n+1, soit de revenir à la pageécran précédente. L'opérateur peut aussi demander un retour au sommaire de début. Lorsqu'une commande appropriée 43b a été effectuée par l'opérateur, le système entreprend soit une nouvelle recherche 70 d'informations conduisant à la génération 44a d'une nouvelle page-écran 34 contenant l'indication du dictionnaire n+1, le mot considéré ou sa limitation, des informations lexicales résultantes 34c et un message de commandes 34d, soit un retour au début du procédé.L'ensemble des dictionnaires peut ainsi être consulté séquentiellement sur un mot (par exemple, étape 44: génération 44a d'une page-écran, entrée 44b d'une nouvelle commande concernant le même mot) sans qu'il soit nécessaire de le saisir à chaque fois.
Bien entendu, l'invention n'est pas limitée aux exemples décrits et de nombreux aménagements peuvent être apportés à ces exemples sans sortir du cadre de l'invention.
Ainsi, on peut envisager la prise en compte d'autant de langues d'origine et de langues cibles que nécessaire. Il en est de même pour les dictionnaires traités dans le procédé selon l'invention, dont le nombre et la nature n'est limité que par les capacités de traitement et de stockage de fichier.
De plus, l'invention n'est pas limitée à un type particulier de centre serveur ou de poste de travail informatique, mais peut être mise en oeuvre sur tout type de matériel informatique présentant des caractéristiques suffisantes en capacité mémoire. Dans le mode de réalisation télématique, tout type de terminal vidéotexte peut être envisagé au sein de réseaux qui peuvent être soit téléphoniques ou spécialisés.

Claims (11)

REVENDICATIONS
1. Procédé pour consulter, sur un mot donné, plusieurs dictionnaires parmi un ensemble prédéterminé de dictionnaires, chaque dictionnaire présentant une langue d'origine et une langue cible prédéterminées ou un domaine spécialisé, caractérisé en ce qu'il comprend une étape de saisie (41b) dudit mot effectuée une seule fois à l'issue d'une étape préalable (40) pour choisir un couple de langues constitué d'une langue d'origine (30a) et d'une langage cible (30b).
2. Procédé selon la revendication 1, caractérisé en ce que l'exécution de l'étape (40) de choix du couple de langues fournit une liste de dictionnaires disponibles (31a) pour le couple de langues choisi.
3. Procédé selon la revendication 2, caractérisé en ce qu'il comprend en outre, à l'issue de l'étape de saisie (41) du mot objet des consultations, une étape (42a) pour indiquer en retour, un ensemble d'options de consultation (32a) correspondant au mot saisi, chaque option de consultation étant associée à un code de référence (32c) associé, à une limitation du mot saisi (32d) et à une indication d'un dictionnaire consulté (32e).
4. Procédé selon la revendication 3, caractérisé en ce qu'il comprend en outre, à l'issue de l'étape (42a) d'indication des options de consultation, une étape (42b) pour choisir une option donnée parmi lesdites options de consultation (32a), conduisant à une étape (43a) pour délivrer un ensemble d'informations (33c) issues du dictionnaire consulté (33a) et associées au mot saisi (33b).
5. Procédé selon la revendication 4, caractérisé en ce chaque option indiquée peut être consultée séquentiellement.
6. Système (1, 20) pour consulter, sur un mot donné, plusieurs dictionnaires parmi un ensemble de dictionnaires prédéterminés, chaque dictionnaire présentant une langue d'origine et une langue cible prédéterminées ou un domaine spécialisé, mettant en oeuvre le procédé selon les revendications précédentes, comprenant des moyens (4, 4', 24) pour saisir des informations d'entrée, notamment des mots et des commandes, des moyens (3, 3', 23) pour afficher des informations de sortie, notamment des résultats de consultation, et des moyens de contrôle et de traitement (14) recevant des informations issues des moyens de saisie (4, 4', 24) et délivrant des informations aux moyens d'affichage (3, 3', 23), caractérisé en ce qu'il comprend en outre, en relation avec les moyens de contrôle et de traitement (14), des moyens (13) pour générer selon un algorithme prédéterminé, un code à partir de chaque mot saisi, des moyens pour stocker un fichier clé (12) comprenant un ensemble de codes, et des moyens pour stocker plusieurs fichiers de données (lia, llb, lln) associés respectivement à chaque dictionnaire et accessibles directement à partir de l'un desdits codes contenus dans le fichier clé (12), chaque fichier de données pouvant être successivement consulté à partir d'une saisie unique d'un même mot.
7. Système (1) selon la revendication 6, caractérisé en ce qu'il comprend d'une part, un ensemble de postes d'interrogation (2, 6, 18, 19) accessibles à des utilisateurs dudit système (1) et intégrant notamment des moyens de saisie (4, 4') et des moyens d'affichage (3, 3'), et d'autre part, un centre serveur (10) situé à distance desdits postes d'interrogation (2, 6, 18, 19), intégrant les moyens pour stocker le fichier clé (12) et les fichiers de données (lia, llb, lIn), les moyens générateurs de code (13) et les moyens de contrôle et de traitement (14), ledit centre serveur (10) étant relié aux postes d'interrogation (2, 6, 18, 19) à travers un réseau télématique (5).
8. Système selon la revendication 6, caractérisé en ce qu'il est inclus au sein d'un poste de travail informatique autonome (20), notamment un microordinateur de type compatible, intégrant les moyens de contrôle et de traitement (28), les moyens de génération de code, les moyens de saisie (24) et les moyens d'affichage (23).
9. Système (20) selon la revendication 8, caractérisé en ce qu il comprend en outre, au titre des moyens pour stocker le fichier clé et les fichiers de données, un support magnétique d'informations (27), notamment un disque dur de grande capacité.
10. Système (20) selon la revendication 8, caractérisé en ce qu'il comprend en outre, au titre des moyens pour stocker le fichier clé et les fichiers de données, un support optique d'informations (26), notamment de type CD-ROM.
11. Système (1, 20) selon l'une des revendications précédentes, caractérisé en ce qu'il comprend en outre un fichier (15) pour stocker sélectivement des informations obtenues par consultation et associées à des mots saisis, ce fichier (15) étant directement accessible par commande à partir des moyens de saisie (4, 4', 24).
FR9106030A 1991-05-17 1991-05-17 Procede pour consulter plusieurs dictionnaires et systemes pour sa mise en óoeuvre. Withdrawn FR2676560A1 (fr)

Priority Applications (1)

Application Number Priority Date Filing Date Title
FR9106030A FR2676560A1 (fr) 1991-05-17 1991-05-17 Procede pour consulter plusieurs dictionnaires et systemes pour sa mise en óoeuvre.

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR9106030A FR2676560A1 (fr) 1991-05-17 1991-05-17 Procede pour consulter plusieurs dictionnaires et systemes pour sa mise en óoeuvre.

Publications (1)

Publication Number Publication Date
FR2676560A1 true FR2676560A1 (fr) 1992-11-20

Family

ID=9412904

Family Applications (1)

Application Number Title Priority Date Filing Date
FR9106030A Withdrawn FR2676560A1 (fr) 1991-05-17 1991-05-17 Procede pour consulter plusieurs dictionnaires et systemes pour sa mise en óoeuvre.

Country Status (1)

Country Link
FR (1) FR2676560A1 (fr)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0788062A2 (fr) * 1996-01-30 1997-08-06 Sun Microsystems, Inc. Système de dictionnaire basé sur internet pour vérification de l'orthographe avec mise à jour automatique

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2131583A (en) * 1980-04-15 1984-06-20 Sharp Kk Electronic translator
GB2213971A (en) * 1987-12-24 1989-08-23 Sharp Kk Output system of a dictionary name for translation machine
EP0388148A2 (fr) * 1989-03-13 1990-09-19 Fujitsu Limited Système de traduction d'une pluralité de langages

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2131583A (en) * 1980-04-15 1984-06-20 Sharp Kk Electronic translator
GB2213971A (en) * 1987-12-24 1989-08-23 Sharp Kk Output system of a dictionary name for translation machine
EP0388148A2 (fr) * 1989-03-13 1990-09-19 Fujitsu Limited Système de traduction d'une pluralité de langages

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0788062A2 (fr) * 1996-01-30 1997-08-06 Sun Microsystems, Inc. Système de dictionnaire basé sur internet pour vérification de l'orthographe avec mise à jour automatique
EP0788062A3 (fr) * 1996-01-30 1998-07-08 Sun Microsystems, Inc. Système de dictionnaire basé sur internet pour vérification de l'orthographe avec mise à jour automatique

Similar Documents

Publication Publication Date Title
US20170024431A1 (en) Generating and executing query language statements from natural language
US10558756B2 (en) Unsupervised information extraction dictionary creation
US20200265074A1 (en) Searching multilingual documents based on document structure extraction
US9471601B2 (en) Images for a question answering system
US8606726B2 (en) Detecting correlations between data representing information
FR2809509A1 (fr) Systeme et procede d'internationalisation du contenu de documents a balises dans un systeme informatique
US11468050B2 (en) Learning user synonyms from sequenced query sessions
US7630961B2 (en) Method of processing multi-lingual queries
FR2824160A1 (fr) Conteneur generique configurable de facon dynamique
US10360280B2 (en) Self-building smart encyclopedia
US11416539B2 (en) Media selection based on content topic and sentiment
US11487801B2 (en) Dynamic data visualization from factual statements in text
US20180121444A1 (en) Unsupervised information extraction dictionary creation
US11436249B1 (en) Transformation of composite tables into structured database content
US11694025B2 (en) Cognitive issue description and multi-level category recommendation
US11144705B2 (en) Cognitive multiple-level highlight contrasting for entities
US20200242178A1 (en) Search processing method and apparatus based on clipboard data
FR2676560A1 (fr) Procede pour consulter plusieurs dictionnaires et systemes pour sa mise en óoeuvre.
US11157477B2 (en) Handling queries in document systems using segment differential based document text-index modelling
KR20000049928A (ko) 다국어 검색엔진의 운영 장치 및 방법
EP1745393A1 (fr) Systeme automatique de traitement des informations portees par des textes courts
CN113868375A (zh) 基于结构化查询语言的数据查询方法、装置、设备及存储介质
CN112650839A (zh) 检索信息优化方法以及装置
US11822591B2 (en) Query-based granularity selection for partitioning recordings
US11314931B2 (en) Assistant dialog model generation

Legal Events

Date Code Title Description
RE Withdrawal of published application