FR2998998A1 - Selection de documents dans une base de donnees - Google Patents

Selection de documents dans une base de donnees Download PDF

Info

Publication number
FR2998998A1
FR2998998A1 FR1261493A FR1261493A FR2998998A1 FR 2998998 A1 FR2998998 A1 FR 2998998A1 FR 1261493 A FR1261493 A FR 1261493A FR 1261493 A FR1261493 A FR 1261493A FR 2998998 A1 FR2998998 A1 FR 2998998A1
Authority
FR
France
Prior art keywords
document
response
request
keyword
current request
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
FR1261493A
Other languages
English (en)
Inventor
Romain Laroche
Remi Bars
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Orange SA
Original Assignee
France Telecom SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by France Telecom SA filed Critical France Telecom SA
Priority to FR1261493A priority Critical patent/FR2998998A1/fr
Publication of FR2998998A1 publication Critical patent/FR2998998A1/fr
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3325Reformulation based on results of preceding query
    • G06F16/3326Reformulation based on results of preceding query using relevance feedback from the user, e.g. relevance feedback on documents, documents sets, document terms or passages

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

L'invention se rapporte à un procédé d'obtention et à un procédé de transmission d'au moins un ensemble de métadonnées associé à au moins un document sélectionné parmi une pluralité de documents Selon l'invention, le procédé de transmission est adapté à recevoir une requête courante comportant au moins un mot clé, à sélectionner au moins un document en fonction d'au moins une valeur de pertinence déterminée pour le document en fonction d'au moins une valeur de pondération associée à au moins un mot clé de ladite requête courante associé audit document et prédéterminée en fonction d'au moins un avis utilisateur relatif à au moins une réponse à au moins une première requête préalable et à transmettre une réponse à ladite requête courante contenant au moins un ensemble de métadonnées relatif à au moins un document sélectionné. Le procédé d'obtention est adapté à transmettre la requête courante et à recevoir la réponse à la requête courante. L'invention se rapporte également à un serveur (S), respectivement un terminal (T), mettant en œuvre le procédé de transmission, respectivement d'obtention.

Description

-1- Sélection de documents dans une base de données L'invention se rapporte au domaine de la recherche de documents dans une ou plusieurs bases de données de documents. Des techniques connues permettent de rechercher des documents dans des bases de données de documents. Ces techniques connues sont basées sur des moteurs de recherche qui, à partir de mots clés saisis par exemple par un utilisateur, recherchent dans une ou plusieurs bases de données, des documents contenant les mots clés sélectionnés. Ces systèmes comportent, outre un moteur de recherche, une zone mémoire dans laquelle est enregistré un dictionnaire de mots clés, appelé généralement vocabulaire ou corpus. Ce vocabulaire est préétabli. Une valeur de pondération est associée à chaque mot du vocabulaire.
Lors de la recherche d'un document, suite à la saisie de mots clés, le moteur de recherche détermine si les mots clés saisis sont présents dans le vocabulaire et effectue une recherche à partir des mots clés saisis présents dans le vocabulaire. Ces systèmes sont particulièrement adaptés pour la recherche de documents dans un domaine technique particulier bien circonscrit. En effet, les mots clés associés à un domaine technique sont connus et varient peu. De plus, le poids de ces mots les uns par rapport aux autres ne varie pas au cours du temps. Les valeurs de pondération sont donc définies une seule fois. De ce fait, le vocabulaire et les valeurs de pondération restent adaptés même lorsque des documents sont ajoutés ou enlevés de la base de documents. Ces systèmes ne sont donc pas bien adaptés à la recherche de documents dans des bases de données regroupant des documents portant sur un ou plusieurs thèmes dont les limites sont mal définies, par exemple pour la recherche dans un forum de discussion. Dans ce cas, les résultats obtenus ne sont pas suffisamment pertinents. Il existe donc un besoin d' améliorer les résultats fournis en réponse à une requête de documents d'une base de données comportant des documents traitant d'une pluralité de 30 thèmes. L'invention vient améliorer la situation. A cet effet, l'invention se rapporte à un procédé d'obtention d'au moins un ensemble de métadonnées associé à au moins un document sélectionné parmi une pluralité de documents caractérisé en ce qu'il comporte les étapes suivantes : 35 - transmission d'une requête courante comportant au moins un mot clé ; -2- - réception d'une réponse à ladite requête courante contenant au moins un ensemble de métadonnées associé à au moins un document, ledit au moins un document étant sélectionné parmi les documents de la pluralité de documents en fonction d' au moins une valeur de pertinence déterminée pour ledit au moins un document en fonction d' au moins une valeur de pondération associée à au moins un mot clé de ladite requête courante associé audit document, ladite valeur de pondération étant prédéterminée en fonction d' au moins un avis utilisateur relatif à au moins une réponse à au moins une première requête préalable à ladite requête courante. Des avis utilisateur formulés par des utilisateurs suite à la réception de réponses à des requêtes antérieures permettent de déterminer une ou plusieurs valeurs de pondération pour un ou plusieurs mots clés. L'avis utilisateur exprime l'intérêt qu'a trouvé un utilisateur à une réponse fournie pour une requête qu'il a formulé et en conséquence la pertinence d'un ou plusieurs documents cités dans cette réponse. L'information sur la pertinence d'un ou plusieurs documents est utilisée pour attribuer une valeur de pondération aux mots clés des documents. Grâce aux valeurs de pondération ainsi déterminée, une réponse à une requête courante formulée par un utilisateur est plus pertinente. Elle correspond davantage aux attentes de l'utilisateur. Selon un mode de réalisation particulier, le procédé d'obtention comprend une étape d'affichage de métadonnées extraites dudit au moins un ensemble reçu suivie d'une étape de transmission d'un avis utilisateur relatif à au moins un document ciblé dans ladite réponse. L'avis utilisateur transmis contribue à la mise à jour ultérieure de valeurs de pondération. Selon un mode de réalisation particulier du procédé d'obtention, lesdites métadonnées comprennent un pointeur permettant d'accéder à un document et dans lequel le procédé comprend une étape d'affichage dudit pointeur, une étape d' accès audit document via ledit pointeur, une étape de réception d'une demande d'avis utilisateur pour ledit document et d'une étape de transmission d'un avis utilisateur sur la pertinence dudit document en réponse à ladite demande d'avis utilisateur.
La réception d'une demande d'avis suite à un accès de l'utilisateur à un document permet à l'utilisateur de formuler un avis sur la pertinence de ce document pour la requête en cours. L'envoi d'un avis utilisateur en réponse à une demande d'avis est un moyen simple pour l'utilisateur pour exprimer son avis. L'invention se rapporte également à un procédé de transmission d'au moins un ensemble de métadonnées associé à au moins un document sélectionné parmi une pluralité de documents. Selon l'invention, le procédé de transmission comporte les étapes suivantes : -3- - réception d'une requête courante comportant au moins un mot clé ; - sélection parmi les documents de la pluralité de documents d' au moins un document en fonction d' au moins une valeur de pertinence déterminée pour ledit au moins un document en fonction d' au moins une valeur de pondération associée à au moins un mot clé de ladite requête courante associé audit document, ladite valeur de pondération étant prédéterminée en fonction d' au moins un avis utilisateur relatif à au moins une réponse à au moins une première requête préalable à ladite requête courante ; - transmission d'une réponse à ladite requête courante contenant au moins un ensemble de métadonnées relatif à au moins un document sélectionné.
Les valeurs de pondération attribuées aux mots clés en fonction d'avis utilisateur reçus préalablement permettent de sélectionner des documents pertinents lors de requêtes courantes et ainsi d'obtenir des réponses aux requêtes satisfaisantes pour l'utilisateur, quel que soit le type de documents composant la pluralité de documents. Selon une caractéristique particulière du procédé de transmission, ladite valeur de pertinence est en outre déterminée en fonction d'un nombre d'occurrence dudit au moins un mot clé de la requête associé audit au moins un document. Le nombre d'occurrence d'un mot clé associé à un document est significatif de l'importance du mot clé pour ce document. La prise en compte de cette caractéristique dans la détermination de la valeur de pondération associée au mot clé permet de présenter à l'utilisateur des réponses aux requêtes adaptées à sa recherche. Selon un mode de réalisation particulier, le procédé de transmission comporte les étapes suivantes, exécutées préalablement à ladite étape de réception d'une requête courante : - des étapes de réception en provenance d'une pluralité de terminaux, de premières requêtes contenant au moins un mot clé ; - des étapes de transmission de réponses aux premières requêtes, comportant respectivement au moins un ensemble de métadonnées associé à au moins un document sélectionné parmi la pluralité de documents en fonction d'au moins un mot clé d'une première requête ; - des étapes de réception d'avis utilisateur pour au moins une des réponses transmises ; - une étape de détermination d' au moins une valeur de pondération d' au moins un mot clé en fonction d'au moins un avis utilisateur reçu. Le recueil d'avis utilisateur sur des réponses à des premières requêtes permet de déterminer des valeurs de pondération de mots clés. Les valeurs de pondération permettent ensuite de sélectionner des documents qui sont adaptés aux attentes des utilisateurs. Le recueil d'avis en provenance d'une pluralité d'utilisateurs permet de fournir des valeurs de pondération adaptées à ces utilisateurs. Ces étapes réalisées lors d'une phase d'apprentissage permettent d'initialiser le système. -4- Selon un mode de réalisation du procédé de transmission, l'avis utilisateur est relatif à la pertinence d'un document ciblé dans une réponse à une première requête et l'étape de réception de l' avis est suivie d'une étape de détermination d'au moins une relation d'ordre entre ledit document ciblé et un autre document ciblé dans ladite réponse et ladite au moins une valeur de pondération d' au moins un mot clé est déterminée en fonction d' au moins une relation d'ordre déterminée. Dans ce mode de réalisation, l'avis d'un utilisateur est traduit sous la forme d'une ou plusieurs relations d'ordre entre les documents. Une telle relation d'ordre permet de définir pour deux documents quel est le plus pertinent des deux. Cette information est ensuite utilisée pour déterminer des valeurs de pondération de mots clé contenus dans la requête considérée. Selon un mode de réalisation particulier du procédé de transmission, l'étape de transmission d'une réponse à une requête courante est suivie des étapes suivantes : - détection d'une action utilisateur relative à un document ciblé dans la réponse ; - transmission d'une demande d'avis utilisateur suite à la dite détection d'une action utilisateur ; - réception d'un avis utilisateur relatif audit document ; - détermination d'au moins une relation d'ordre entre au moins un mot clé de la requête courante associé audit document et au moins un mot clé de la requête courante associé à un autre document ciblé dans ladite réponse ; - enregistrement de ladite au moins une relation d'ordre déterminée Dans ce mode de réalisation, l'avis d'un utilisateur est traduit sous la forme d'une ou plusieurs relations d'ordre entre mots clés de la requête. Cette information est ensuite utilisée pour déterminer des valeurs de pondération de mots clé. Selon un mode de réalisation particulier, le procédé de transmission comporte une étape de mise à jour d'au moins une valeur de pondération d'au moins un mot clé en fonction d'au moins une relation d'ordre enregistrée. Les relations d'ordre déterminées au fur et à mesure du recueil des avis des utilisateurs, c'est-à-dire au fur et à mesure de la réception de requêtes, sont ensuite utilisées pour mettre à jour les valeurs de pondération. La mise à jour permet de prendre en compte l'évolution dans le temps de la pertinence des documents, et en conséquence de l'évolution dans le temps de la pertinence des mots clés. L'invention se rapporte également à un terminal caractérisé en ce qu'il comporte : - un module de transmission d'une requête courante comportant au moins un mot clé ; - un module de réception d'une réponse à ladite requête courante contenant au moins un ensemble de métadonnées associé à au moins un document, ledit au moins un document étant sélectionné parmi des documents d'une pluralité de documents en fonction d'au moins une valeur de pertinence déterminée pour ledit au moins un document en fonction d'au moins une -5- valeur de pondération associée à au moins un mot clé de ladite requête courante associé audit document, ladite valeur de pondération étant prédéterminée en fonction d' au moins un avis utilisateur relatif à au moins une réponse à au moins une première requête préalable à ladite requête courante.
L'invention se rapporte encore à un serveur caractérisé en ce qu'il comporte : - un module de réception d'une requête courante comportant au moins un mot clé ; - un module de sélection parmi des documents d'une pluralité de documents d' au moins un document en fonction d' au moins une valeur de pertinence déterminée pour ledit au moins un document en fonction d' au moins une valeur de pondération associée à au moins un mot clé de ladite requête courante associé audit document, ladite valeur de pondération étant prédéterminée en fonction d' au moins un avis utilisateur relatif à au moins une réponse à au moins une première requête préalable à ladite requête courante ; - un module de transmission d'une réponse à ladite requête courante contenant au moins un ensemble de métadonnées relatif à au moins un document sélectionné.
L'invention se rapporte aussi à un produit programme d'ordinateur comprenant des instructions pour mettre en oeuvre les étapes du procédé d'obtention tel que décrit précédemment, lorsqu'il est chargé et exécuté par un processeur. L'invention se rapporte enfin à un produit programme d'ordinateur comprenant des instructions pour mettre en oeuvre les étapes du procédé de transmission tel que décrit précédemment, lorsqu'il est chargé et exécuté par un processeur. D'autres particularités et avantages de la présente invention apparaitront dans la description suivante de modes de réalisation donnés à titre d'exemples non limitatifs, en référence aux dessins annexés, dans lesquels : - la figure 1 est un schéma illustrant un système selon un premier mode de réalisation de l'invention, - la figure 2 est un organigramme illustrant les différentes étapes d'un procédé d'obtention, respectivement d'un procédé de transmission, selon un premier mode de réalisation, - la figure 3 est un schéma illustrant un système selon un deuxième mode de réalisation de l'invention, - les figures 4a et 4b représentent respectivement une première et une deuxième partie d'un organigramme illustrant les différentes étapes d'un procédé d'obtention, respectivement d'un procédé de transmission, selon un deuxième mode de réalisation, - la figure 5 est un schéma bloc représentant un serveur mettant en oeuvre un procédé de transmission selon un mode de réalisation de l'invention, -6- - la figure 6 est un schéma bloc représentant un terminal mettant en oeuvre un procédé d'obtention selon un mode de réalisation de l'invention. Un premier mode de réalisation d'un procédé d'obtention, respectivement d'un procédé de transmission d' au moins un ensemble de métadonnées associé à au moins un document sélectionné parmi une pluralité de documents, va maintenant être décrit en référence aux figures 1 et 2. En référence à la figure 1, un système SY1 comprend un terminal T d'un utilisateur U et un serveur S accessible par le terminal T via un réseau de communication R.
Le système SY1 comporte également une base de données BD accessible par le serveur S et hébergeant une pluralité de documents. A titre d'alternative, le système SY1 comporte plusieurs bases de données BD hébergeant chacune une pluralité de documents. La ou les bases de données BD sont accessibles par le serveur S par un lien direct, par exemple une liaison filaire ou sans fil, ou via le réseau de communication R. La ou les bases de données hébergent N documents Dl, D2...Di...Dn. Un document Di enregistré dans la base de données BD est par exemple un contenu audio et/ou vidéo, une page Web, un fichier de type texte, un fichier contenant du texte, une ou plusieurs images, dessins, photographies...
Le système SY1 comporte également un espace mémoire MD, accessible par le serveur S, dans lequel sont enregistrés des ensembles de métadonnées MD1, MD2...MDi...MDn définis respectivement pour les documents Dl, D2...Di...Dn. Un ensemble de métadonnées MDi est par exemple enregistré en association avec une référence du document Di auquel il est associé.
Un ensemble de métadonnées MDi associé à un document Di comprend par exemple des données décrivant le document Di, par exemple un résumé du contenu du document, un ou plusieurs auteurs, une date...et/ou des données permettant d'accéder au document. Les données permettant d'accéder à un document sont par exemple une adresse ou un pointeur vers le document, par exemple une URL (pour `Uniform Ressource Location').
Un ou plusieurs mots clés sont également définis pour chaque document et enregistrés en association avec les métadonnées associées au document considéré dans l'espace mémoire MD. A titre d'alternative, les mots clés définis pour chaque document sont enregistrés séparément des ensembles de métadonnées, par exemple dans une autre mémoire accessible par le serveur S. A titre d' alternative, chaque ensemble de métadonnées MDi est enregistré dans la base de données BD en association avec le document Di auquel il est associé. -7- Un mot clé défini pour un document représente un mot clé associé à ce document. Le système SY1 comporte également un espace mémoire, accessible par le serveur S, dans lequel est enregistrée une table de mots clés TAB. La table TAB regroupe des mots clés Ml, M2...Mi...Mz extraits des documents Dl, D2.. . Di ...Dn. Chaque mot clé Mi est un mot clé défini pour au moins un document de la pluralité de documents. Les étapes d'un procédé de réception et d'un procédé de transmission d'au moins un ensemble de métadonnées associé à au moins un document sélectionné parmi une pluralité de documents mis en oeuvre dans le système SY1 sont illustrées en référence à la figure 2. Les étapes E2 et E12 représentent les étapes du procédé d'obtention mises en oeuvre par exemple par le terminal T. Les étapes E4, E6, E8 et El0 représentent les étapes du procédé de transmission mises en oeuvre par exemple par le serveur S.
Lors d'une étape préalable EO, une valeur de pondération Pi est déterminée pour chaque mot clé Mi de la table des mots clés TAB et enregistrée en association avec ce mot clé dans la table de mots clés TAB. La valeur de pondération Pi est déterminée en fonction d'au moins un avis utilisateur relatif à au moins une réponse à au moins une première requête préalable. Un mode de réalisation de la détermination de valeurs de pondération est décrit dans la suite de la description. Lors d'une étape E2, l'utilisateur U du terminal T formule une requête courante RQ1 contenant au moins un mot clé. La requête RQ1 est par exemple saisie au moyen d'une interface d'un navigateur installé sur le terminal T.
La requête RQ1 est rédigée en langage naturel. Elle comprend une ou plusieurs phrases, par exemple 'je recherche des documents sur Zidane'. A titre d'alternative, la requête courante RQ1 contient par exemple une suite d'un ou plusieurs mots clés, par exemple « Zidane ». La requête RQ1 est ensuite transmise au serveur S via le réseau de télécommunications R. La requête courante RQ1 est reçue par le serveur S lors d'une étape E4. Lors d'une étape E6, une valeur de pertinence VPi est déterminée pour chaque document Di de la pluralité. La valeur de pertinence VPi de la requête courante RQ1 pour un document Di enregistré dans la base de données BD est calculée en fonction d'au moins une valeur de pondération Pj associée à au moins un mot clé Mj extrait de la requête courante RQ1 et -8- associé au document Di et en fonction du nombre d'occurrence du ou des mots clés pour le document Di. Le nombre d'occurrences de chaque mot clé pour le document Di est par exemple prédéfini lors d'une étape préalable et enregistré en association avec le mot clé considéré.
La valeur de pertinence VPi d'un document Di pour la requête courante RQ1 est par exemple déterminée par l'équation : VPi = Pj ln(1 + (e - 1) nbr(Mj) nbd(MD) MjERQ1nDi dans laquelle Mj est un mot clé, Pj la valeur de pondération associé au mot clé Mj dans la table des mots clés TAB, ln est le logarithme népérien, e est la constante de Neper (environ égale à 2,7), nbr(Mj) est le nombre d'occurrences du mot Mj dans la requête courante RQ1 et nbd(Mj) est le nombre d'occurrences du mot Mj pour le document Di. A titre d'alternative, la valeur de pertinence VPi déterminée pour un document Di enregistré dans une base de données BD est calculée en fonction d' au moins une valeur de pondération associée à au moins un mot clé de la requête courante RQ1 associé au document Di et ne tient pas compte du nombre d'occurrences.
Dans le cas où la requête RQ1 est formulée en langage naturel, des mots clés sont préalablement extraits du contenu de la requête RQ1. Un mot clé est un mot extrait de la requête RQ1 et figurant dans la table des mots clés TAB. Lors d'une étape E8, des documents Dk sont sélectionnés parmi la pluralité de documents en fonction des valeurs de pertinence calculées lors de l'étape E6.
Par exemple, les 5 documents Da, Db, Dc, Dd et De pour lesquels la valeur de pertinence est la plus élevée pour la requête courante RQ1 considérée sont sélectionnés. A titre d' alternative, seuls les documents Dk pour lequel la valeur de pertinence est supérieure à un seuil prédéfini sont sélectionnés. Plus généralement, les documents sont sélectionnés en fonction d'un ou plusieurs critères prédéfinis relatifs aux valeurs de pertinence des documents de la pluralité de documents déterminées pour la requête courante RQ1. Puis, lors d'une étape E10, une réponse RP1 à la requête courante RQ1 est transmise par le serveur S à destination du terminal T. La réponse RP1 contient pour chaque document Dk sélectionné lors de l'étape E8, tout ou partie de l'ensemble des métadonnées MDk associé au document Dk. La réponse RP1 est reçue par le terminal T et affichée sur un écran du terminal T lors d'une étape E12. Un deuxième mode de réalisation d'un procédé d'obtention, respectivement d'un procédé de transmission d'au moins un ensemble de métadonnées associées à au moins un -9- document sélectionné parmi une pluralité de documents, va maintenant être décrit en référence aux figures 3, 4a et 4b. En référence à la figure 3, un système SY2 comprend une pluralité de terminaux Ti, T2, T3...Tk et un serveur S accessible par les terminaux Ti, T2, T3...Tk via un réseau de communication R. Le système SY2 comporte également une base de données BD accessible par le serveur S et hébergeant une pluralité de documents Dl, D2...Di...Dn. Un document Di enregistré dans la base de données BD est par exemple un contenu audio et/ou vidéo, une page Web, un fichier de type texte... Le document Di peut également comporter un ou plusieurs images, dessins, photographies... Une description est associée à chaque document. La description est un contenu sous forme de texte décrivant le contenu du document. La description d'un document est enregistrée en association avec ce document dans la base de données BD. Le système SY2 comporte également un espace mémoire MD, accessible par le serveur S, dans lequel sont enregistrés des ensembles de métadonnées MD1, MD2...MDi...MDn définis respectivement pour les documents Dl, D2...Di...Dn. L'ensemble de métadonnées MDi est par exemple enregistré en association avec une référence du document Di auquel il est associé. L'ensemble de métadonnées MDi associé à un document Di comprend des données permettant d'accéder au document, par exemple une adresse ou un pointeur vers le document, par exemple une URL (pour `Uniform Ressource Location'). A titre d'alternative, un ensemble de métadonnées est associé à plusieurs documents. A titre d'alternative, la description associée à un document est enregistrée en association avec les métadonnées du document dans l'espace mémoire MD.
Egalement, à titre d'alternative, l'ensemble de métadonnées comprend également des données décrivant le document Di, par exemple un résumé du contenu du document, un ou plusieurs auteurs, une date... Le système 5Y2 comporte également un espace mémoire, accessible par le serveur S, dans lequel est enregistrée une table de mots clés TAB.
Les étapes d'un procédé de réception et d'un procédé de transmission d'au moins un ensemble de métadonnées associé à au moins un document sélectionné parmi une pluralité de documents, mis en oeuvre dans le système 5Y2, sont illustrées en référence à la figure 4a et 4b. Lors d'une première étape E20 (figure 4a), un ou plusieurs mots clés Mij sont déterminés pour chaque document Di de la pluralité de documents. La détermination des mots clés Mij comprend par exemple une étape d'extraction des mots de la description associée au document Di considéré puis une étape de filtrage de mots indésirables. Les mots indésirables -10- sont par exemple les mots courts tels que les articles, les ponctuations... De plus, les mots apparaissant plusieurs fois dans la description associée au document Di ne sont représentés qu'une seule fois. L'extraction de mots est par exemple effectuée selon une méthode décrite dans le document intitulé « Foundations of statistical natural language processing » de Christophe D. Manning et Hinrich Schütze, édité par "MIT Press ". Le ou les mots clés Mij déterminés pour chaque document Di sont ensuite enregistrés dans une mémoire accessible par le serveur S en association avec un identifiant du document Di.
Un nombre d'occurrence nbd(Mij) de chaque mot clé Mij dans la description associée au document Di est déterminé et enregistré en association avec le mot clé considéré. Le nombre d'occurrence nbd(Mij) d'un mot clé Mij du document Dl représente un nombre d'occurrence du mot clé Mij pour le document Di. Lors d'une étape E22, une table de mots clés TAB est déterminée et enregistrée dans une mémoire accessible par le serveur S. La table de mots clés TAB comprend des mots clés Ml, M2...Mi...Mz. La table de mots clés TAB contient les mots clés déterminés pour chaque document de la pluralité de documents lors de l'étape E20. Les mots clés représentés dans plusieurs documents Di ne sont représentés qu'une seule fois dans la table des mots clés TAB.
Lors d'une étape E24, une valeur de pondération Pi associée à chaque mot clé Mi de la table de mots clés est initialisée à une valeur prédéfinie, par exemple la valeur 1, puis elle est enregistrée dans la table des mots clés TAB en association avec le mot clé Mi auquel elle est associée. Lors d'une étape E26, une requête utilisateur RQ contenant un ou plusieurs mots clés est transmise par un des terminaux Ti, T2...Tk à destination du serveur S. La requête RQ représente une première requête utilisateur. La requête RQ est reçue par le serveur S lors d'une étape E28. Lors d'une étape E30, le serveur S sélectionne un ou plusieurs documents parmi les documents de la pluralité, par exemple D5, D10 et D77. La sélection comprend par exemple le calcul d'une valeur de pertinence de chaque document de la pluralité, pour la requête RQ et la sélection des documents ayant la plus forte valeur de pertinence. La valeur de pertinence d'un document est déterminée en fonction de la présence ou de l'absence d'un ou de plusieurs mots clés de la requête RQ dans le document et de la valeur de pondération associée aux mots clés dans la table des mots clés TAB.
La valeur de pertinence VPi d'un document Di pour la requête courante RQ est par exemple déterminée par l'équation : VPi = Pj 16(1 + (e - 1)nbr(MDribd(MD) MjERQnDi dans laquelle Mj est un mot clé, Pj la valeur de pondération associé au mot clé Mj, ln est le logarithme népérien, e est la constante de Neper (environ égale à 2,7), nbr(Mj) est le nombre d'occurrences du mot Mj dans la requête courante RQ et nbd(Mj) est le nombre d'occurrences du mot Mj dans la description associée au document Di.
A titre d'alternative, la valeur de pertinence ne prend pas en compte la valeur de pondération des mots clés. Par exemple, la valeur de pertinence d'un document est déterminée en fonction du nombre d'occurrence de chaque mot clé dans la description associée au document. Une réponse RP à la requête RQ est transmise, lors d'une étape E32 via le réseau de télécommunications R par le serveur S à destination du terminal ayant transmis la requête RQ. La réponse RP contient par exemple, pour chaque document sélectionné, une adresse URL de stockage du document dans la base de données BD. L'adresse URL représente un ensemble de métadonnées associées à un document, déterminé lors d'une étape préalable et enregistré dans une mémoire accessible par le serveur S. La réponse RP comprend par exemple les adresses URL5, URL10 et URL77 permettant d'accéder respectivement aux documents sélectionnés D5, D10 et D77. Lors d'une étape E34, la réponse RP est reçue par le terminal ayant transmis la requête RQ puis le contenu de la réponse RP, c'est-à-dire les adresses URL, est affiché sur l'écran de ce terminal. Lors d'une étape E36, un utilisateur du terminal considéré sélectionne une adresse URL parmi les adresses URL affichées sur l'écran, par exemple l'adresse URL10. La sélection est par exemple effectuée de façon connue en cliquant sur l'écran du terminal à une position sur l'écran où est affichée l'adresse URL au moyen d'une souris d'ordinateur. Cette sélection représente une action utilisateur AC vis-à-vis du document associé. De façon connue, le « clic » sur l'adresse URL10 provoque l'envoi par le terminal d'une requête d'accès au document D10 associé à l'URL sélectionnée. Le document D10 est reçu en réponse et affiché sur l'écran du terminal. Lors d'une étape E38, le serveur S détecte l'action utilisateur AC, c'est-à-dire la sélection d'un document par l'utilisateur, et envoie à destination du terminal considéré, une demande d'avis utilisateur DA relative au document sélectionné D10 lors de l'action utilisateur AC. La demande d'avis utilisateur DA est par exemple un message de type texte demandant à l'utilisateur si le document D10 est pertinent vis-à-vis de sa requête RQ. Lors d'une étape E40, le terminal envoie une réponse RA à la demande d'avis DA. La réponse contient un avis AV formulé par l'utilisateur. -12- La réponse est reçue par le serveur S lors d'une étape E42. Lors d'une étape E44, le serveur S analyse la réponse RA reçue. Plus précisément, le serveur S analyse l' avis utilisateur AV contenu dans la réponse RA et détermine si l'avis utilisateur AV est positif, négatif ou indéterminé.
Si le serveur S ne peut déterminer si l'avis utilisateur AV est positif ou négatif, l'avis utilisateur AV est de type indéterminé et le processus se poursuit par une nouvelle étape E28, par une étape E50 décrite dans la suite de la description ou par une étape E52 décrite dans la suite de la description. Si l'avis utilisateur AV est un avis négatif, le processus se poursuit par une nouvelle étape E28, par une étape E50 décrite dans la suite de la description ou par une étape E52 décrite dans la suite de la description. Si l'avis utilisateur AV est un avis positif, le serveur S détermine une ou plusieurs relations d'ordre ORD entre le document pour lequel un avis a été émis dans la réponse RA et les autres documents ciblés dans la réponse RP, c'est-à-dire les autres documents sélectionnés lors de l'étape E30. Une relation d'ordre ORD est une relation entre le document pour lequel l'avis utilisateur AV est formulé et un autre document ciblé dans la réponse RP à la première requête RQ. Un document ciblé dans la réponse RP est un document sélectionné par le serveur S lors de l'étape E30, c'est-à-dire un document pour lequel un ensemble de métadonnées est contenu dans la réponse RP. Par exemple, le serveur S détermine une première relation d'ordre entre D10 et D5 et une deuxième relation d'ordre entre D10 et D77. Une relation d'ordre ORD est définie par un premier document, un deuxième document et un opérateur définissant une relation entre les deux documents. L'opérateur est par exemple « pertinence supérieur à ». Une relation d'ordre ORD entre un document pour lequel l' avis utilisateur AU est émis, par exemple D10, et un autre document sélectionné lors de l'étape E30, par exemple D77, est par exemple du type : (pertinence du document pour lequel l'avis utilisateur AV est émis) supérieur à (pertinence d'un autre document sélectionné lors de l'étape E30). Par exemple : (Pertinence de D10) > (pertinence de D5) A titre d'alternative, des relations d'ordre sont également déterminées lorsque la réponse RA est négative. A titre d' alternative, la demande d'avis DA est du type « quel document correspond le mieux à votre requête ? » et est par exemple transmise après l'envoi de la réponse RP (étape 34), avant ou après la détection d'une ou plusieurs actions de l'utilisateur pour accéder à un ou plusieurs des documents cités. -13- Lors d'une étape E46, des relations d'ordre ORM entre mots clés contenus dans la première requête RQ sont déterminées à partir des relations d'ordre ORD entre documents. Plus précisément, une deuxième valeur de pertinence Vi est déterminée pour chaque document Di contenu dans une relation d'ordre ORD entre documents, vis-à-vis de la première requête RQ. La valeur de pertinence Vi d'un document Di pour la première requête RQ est par exemple déterminée par l'équation : Vi = Xk ln(1 + (e - 1)nbr(Mk)nbd(Mk)) MkERQnDi dans laquelle Mk est un mot clé de la requête RQ contenu dans le document Di, Xk la valeur de pondération associé au mot clé Mk, ln est le logarithme népérien, e est la constante de Neper, nbr(Mk) est le nombre d'occurrences du mot Mk dans la requête RQ et nbd(Mk) est le nombre d'occurrences du mot Mk dans la description associée au document Di. Dans l'équation ci-dessus, la valeur de pondération Xk d'un mot clé Mk est une inconnue. Puis chaque relation d'ordre ORD entre deux documents est transformée en une relation entre deux deuxièmes valeurs de pondération. La relation d'ordre « Di plus pertinent que Dj « est convertie en une relation du type « Vi > Vj». On obtient ainsi une relation d'ordre ORM entre mots clés du type : Xk ln(1 + (e - 1)nbr(Mk)nbd(Mk)) MkERQnDi > Xk ln(1 + (e - 1)nbr(Mk)nbd(Mk)) MkERQnDi Les relations d'ordre ORM déterminées sont enregistrées dans une mémoire accessible par le serveur S, par exemple une table des relations TR. Une relation d'ordre entre mot clés est une inégalité définie des valeurs de pondération de mots clés. Comme décrit ultérieurement dans la suite de la présente description, les relations d'ordre ORM sont ensuite utilisées pour déterminer la valeur de pondération d'un ou plusieurs mots clés. Les étapes E28 à E46 sont réitérées pour d'autres requêtes utilisateur émises par le même terminal ou par un autre terminal de la pluralité de terminaux. On obtient ainsi une pluralité de relations d'ordre ORM entre mots clés. Lors d'une étape E50, le serveur S détermine une valeur de pondération Pi pour un ou plusieurs mots clés enregistrés dans la table des mots clés TAB en fonction des relations d'ordre ORM enregistrées dans la table des relations TR. -14- Les valeurs de pondération sont par exemple déterminées par une Machine à Vecteurs Supports ou SVM ( pour 'Support Vector Machine' en anglais) appliquant un algorithme de classification aux relations d'ordre ORM enregistrées. Le document « a Tutorial on Support Vector Machines for Pattern Recognition » de Christopher J.C. Burges (Data Mining and Knowledge Discovery - 1998 - volume 2 - pages 121 à 167) décrit un exemple de SVM. Les SVM sont alors des outils statistiques utilisés pour déterminer les valeurs de pondération Xk des mots clés Mk. Ils permettent de maximiser la satisfaction des relations d'ordre entre documents ORM Les valeurs de pondération Pk des mots clés Mk sont les valeurs Xk ainsi déterminées.
L'algorithme permet donc d'attribuer une valeur de pondération élevée à un mot clé contenu dans un document dont la pertinence est estimée élevée et au contraire d'attribuer une valeur de pondération faible à un mot clé contenu dans un document dont la pertinence est estimée faible. Chaque valeur de pondération Pk ainsi obtenue pour un mot clé Mk est ensuite enregistrée en association avec le mot clé Mk dans la table des mots clés TAB. A titre d'alternative, lors de l'étape E44, les relations d'ordre ORD sont enregistrées dans la table des relations TR en association avec les mots clés de la première requête RQ et l'étape E46 de détermination des relations ORM entre mots clés est réalisée pour chaque relation d'ordre ORD entre documents juste avant la réalisation de l'étape E50 de détermination des valeurs de pondération. Lors d'une étape E52 (figure 4b), une requête utilisateur RQ2 contenant un ou plusieurs mots clés est transmise par un terminal de la pluralité, par exemple le terminal T3, au serveur S. La requête RQ2 représente une requête courante.
La requête RQ2 est reçue par le serveur S lors d'une étape E54. Lors d'une étape E56, une valeur de pertinence VPi est déterminée, pour la requête courante RQ2, pour chaque document Di de la pluralité de documents. La valeur de pertinence VPi représente la pertinence d'un document Di considéré par rapport à la requête courante RQ2.
La valeur de pertinence VPi déterminée pour un document Di enregistré dans une base de données BD est calculée d'une part en fonction d'au moins une valeur de pondération Pj associée à au moins un mot clé Mj extrait de la requête courante RQ2 et associé au document Di et d'autre part en fonction d'au moins un nombre d'occurrence du au moins un mot clé dans la description associé au document Di.
La valeur de pertinence VPi d'un document Di pour la requête courante RQ2 est par exemple déterminée par l'équation : -15- VPi = Pj ln(1 + (e - 1)nbr(Mpnbd(MD) MjERQ2nDi dans laquelle Mj est un mot clé, Pj la valeur de pondération associé au mot clé Mj, ln est le logarithme népérien, e est la constante de Neper, nbr(Mj) est le nombre d'occurrences du mot Mj dans la requête courante RQ2 et nbd(Mj) est le nombre d'occurrences du mot Mj dans la description associée au document Di.
A titre d'alternative, la valeur de pertinence VPi déterminée pour un document Di enregistré dans une base de données BD est calculée en fonction d'au moins une valeur de pondération associée à au moins un mot clé de la requête courante RQ2 associé au document Di et ne tient pas compte du nombre d'occurrences. Lors d'une étape E58, des documents sont sélectionnés parmi la pluralité de documents en fonction des valeurs de pertinence VPi calculées. Par exemple, les 3 documents Dx, Dy, Dz pour lesquels la valeur de pertinence est la plus élevée sont sélectionnés. A titre d'alternative, seuls les documents pour lequel la valeur de pertinence est supérieure à un seuil prédéfini sont sélectionnés.
Plus généralement, les documents sont sélectionnés en fonction d'un ou plusieurs critères prédéfinis relatifs à la valeur de pertinence des documents de la pluralité de documents. Puis, lors d'une étape E60, une réponse RP2 à la requête courante RQ2 est transmise par le serveur S à destination du terminal T3.
La réponse RP2 contient pour chaque document sélectionné lors de l'étape E58, tout ou partie de l'ensemble des métadonnées associé au document. Dans le mode de réalisation décrit, la réponse RP2 contient pour chaque document sélectionné, une adresse URL du document. La réponse RP2 est reçue par le terminal T3 ayant transmis la requête RQ2 et son contenu, c'est-à-dire les adresses URL, est affiché sur un écran du terminal T3 lors d'une étape E62. Lors d'une étape E64, un utilisateur du terminal T3 sélectionne une adresse URL parmi les adresses URL affichées sur l'écran. La sélection est par exemple effectuée de façon connue en cliquant sur l'écran à la position sur l'écran où est affichée l'adresse URL au moyen d'une souris d'ordinateur. Cette sélection représente une action utilisateur AC2 vis-à- vis du document associé. De façon connue, le « clic » sur l'adresse URL provoque l'envoi par le terminal d'une requête d'accès au document associé à l'URL sélectionnée, par exemple le document Dz. Le document Dz est reçu par le terminal T3, en réponse au « clic » et affiché sur l'écran du terminal T3. -16- Lors d'une étape E66, le serveur S détecte l' action utilisateur AC2 et lors d'une étape E68, le serveur S envoie à destination du terminal T3, une demande d'avis utilisateur DA2 relative au document Dz. La demande d' avis utilisateur DA2 est par exemple un message de type texte demandant à l'utilisateur si le document Dz est pertinent vis-à-vis de la requête courante RQ2. Lors d'une étape E70, le terminal T3 envoie au serveur S, une réponse RA2 à la demande d'avis DA2. La réponse RA2 contient un avis AV2 formulé par l'utilisateur. La réponse RA2 est reçue par le serveur S lors d'une étape E72. Lors d'une étape E74, le serveur S analyse la réponse reçue et détermine, en fonction de cette réponse, une ou plusieurs relations d'ordre ORD entre le document pour lequel un avis a été émis, ici le document Dz, et les autres documents ciblés dans la réponse RP2, c'est-à-dire les autres documents sélectionnés lors de l'étape E58. L'étape E74 est similaire à l'étape E44 décrite précédemment. L'étape E74 est suivie d'une étape E76 de détermination de relations d'ordre ORM entre mots clés de la requête RQ2. L'étape E76 est similaire à l'étape E46 décrite précédemment. Les relations d'ordre entre mots clés ORM déterminées sont enregistrées dans la table des relations TR. Elles sont par exemple ajoutées aux relations d'ordre ORM enregistrées lors de l'exécution d'étapes E46 réalisées antérieurement.
A titre d'alternative, les relations d'ordre ORM ayant coopéré à la détermination de valeurs de pondération sont effacées et les relations d'ordre déterminées lors de l'étape E76 contribuent à l'établissement d'une nouvelle liste de relations d'ordre. A titre d'alternative, la demande d'avis est du type « quel document correspond le mieux à votre requête ? » et est par exemple transmise après l'envoi de la réponse RP2, avant ou après la détection d'un ou plusieurs clic de l'utilisateur. Les étapes E54 à E76 sont réitérées par le serveur S pour d'autres requêtes utilisateur courantes émises par le même terminal ou par un autre terminal de la pluralité de terminaux. Ultérieurement, lors d'une étape E78, les valeurs de pondération Pi d'un ou plusieurs mots clés Mi sont mises à jour à partir des relations d'ordre entre mots clés ORM enregistrées.
Les relations d'ordre ORM enregistrées sont utilisées en entrée d'une SVM pour déterminer des nouvelles valeurs de pondération. L'étape E78 est similaire à l'étape E50 décrite précédemment. L'étape E78 est par exemple effectuée périodiquement, par exemple une fois par jour ou une fois par semaine.
Dans les modes de réalisation décrit, la base de documents est indifféremment une base de données contenant des documents prédéfinis, c'est-à-dire une base de données dont le contenu n'évolue pas ou une base de données dont le contenu évolue régulièrement. Ainsi, à -17- n'importe quel moment du processus, des documents peuvent être ajoutés à la base de données BD. De même, des documents peuvent être retirés de cette base. Dans le mode de réalisation décrit, les relations d'ordre entre mots clés ORM sont conservées dans la table des relations TR et utilisées pour mettre à jour les valeurs de pondération des mots clés. Ces relations sont donc utilisées même lorsque les documents utilisés pour déterminer ces relations ont été enlevés de la base de données BD. La figure 5 représente un serveur S selon un mode de réalisation de l'invention. Le serveur S comporte un module de réception d'une requête courante RRQ, un module de sélection de documents SEL et un module de transmission TRP d'une réponse à une requête courante. Le module de réception d'une requête courante RRQ est apte à recevoir une requête de documents contenant un ou plusieurs mots clés transmise par un terminal utilisateur distant. Le module de sélection SEL est apte à sélectionner parmi les documents de la pluralité, au moins un document en fonction d' au moins une valeur de pertinence déterminée pour ledit au moins un document en fonction d' au moins une valeur de pondération associée à au moins un mot clé de ladite requête courante associé audit document, ladite valeur de pondération étant prédéterminée en fonction d' au moins un avis utilisateur relatif à au moins une réponse à au moins une première requête préalable à ladite requête courante.
Le module de transmission TRP est apte à transmettre une réponse à la requête courante contenant au moins un ensemble de métadonnées relatif à au moins un document sélectionné. Le serveur S peut également comporter une module de détermination DET adapté à déterminer au moins une valeur de pondération d' au moins un mot clé en fonction d'au moins un avis utilisateur relatif à au moins une réponse à au moins une première requête préalable à ladite requête courante. Le serveur S mettant en oeuvre l'invention est par exemple un micro-ordinateur qui comporte de façon connue, notamment une unité de traitement MT équipée d'un microprocesseur, une mémoire morte de type ROM, une mémoire vive de type RAM. Le serveur S peut comporter de manière classique et non exhaustive les éléments suivants: un clavier, un écran, un microphone, un haut-parleur, une interface de communication, un lecteur de disque, un moyen de stockage... La mémoire morte de type ROM comporte des registres mémorisant un programme d'ordinateur PG1 comportant des instructions de programme adaptées à mettre en oeuvre un procédé de transmission d' au moins un ensemble de métadonnées associé à au moins un document sélectionné parmi une pluralité de documents décrit en référence aux figures 2, 4a et 4b. -18- Ce programme PG1 est ainsi adapté à recevoir une requête courante comportant au moins un mot clé, à sélectionner parmi les documents de la pluralité de documents, au moins un document en fonction d'au moins une valeur de pertinence déterminée pour ledit au moins un document en fonction d' au moins une valeur de pondération associée à au moins un mot clé de ladite requête courante associé audit document, ladite valeur de pondération étant prédéterminée en fonction d' au moins un avis utilisateur relatif à au moins une réponse à au moins une première requête préalable à ladite requête courante, et à transmettre une réponse à ladite requête courante contenant au moins un ensemble de métadonnées relatif à au moins un document sélectionné.
Le programme PG1 est également adapté à déterminer au moins une valeur de pondération d' au moins un mot clé en fonction d' au moins un avis utilisateur relatif à au moins une réponse à au moins une première requête préalable à ladite requête courante. Lors de la mise sous tension, le programme PG1 stocké dans la mémoire morte ROM est transféré dans la mémoire vive qui contiendra alors le code exécutable de l'invention ainsi que des registres pour mémoriser les variables nécessaires à la mise en oeuvre de l'invention. De manière plus générale un moyen de stockage, lisible par un ordinateur ou par un microprocesseur, intégré ou non au dispositif, éventuellement amovible, mémorise un programme mettant en oeuvre le procédé de transmission.
La figure 6 représente un terminal T selon un mode de réalisation de l'invention. Le terminal T comporte un module de transmission d'une requête courante TRQ et un module de réception RRP d'une réponse à une requête courante. Le module de transmission d'une requête courante TRQ est apte à transmettre une requête de documents contenant au moins un mot clé à destination d'un serveur S.
Le module de réception RRP est apte à recevoir une réponse à la requête courante contenant au moins un ensemble de métadonnées relatif à au moins un document, ledit document étant sélectionné parmi les documents de la pluralité de documents, en fonction d'au moins une valeur de pertinence déterminée pour ledit au moins un document en fonction d'au moins une valeur de pondération associée à au moins un mot clé de ladite requête courante associé audit document, ladite valeur de pondération étant prédéterminée en fonction d'au moins un avis utilisateur relatif à au moins une réponse à au moins une première requête préalable à ladite requête courante. Le terminal T mettant en oeuvre l'invention est par exemple un micro-ordinateur qui comporte de façon connue, notamment une unité de traitement UT équipée d'un 35 microprocesseur, une mémoire morte de type ROM, une mémoire vive de type RAM, un écran ECR. Le terminal T peut comporter de manière classique et non exhaustive les éléments -19- suivants: un clavier, un microphone, un haut-parleur, une interface de communication, un lecteur de disque, un moyen de stockage... La mémoire morte de type ROM comporte des registres mémorisant un programme d'ordinateur PG2 comportant des instructions de programme adaptées à mettre en oeuvre un procédé de d'obtention d'au moins un ensemble de métadonnées associé à au moins un document sélectionné parmi une pluralité de documents décrit en référence aux figures 2, 4a et 4b. Ce programme PG2 est ainsi adapté à transmettre une requête courante comportant au moins un mot clé et à recevoir une réponse à ladite requête courante contenant au moins un ensemble de métadonnées relatif à au moins un document sélectionné parmi les documents de la pluralité de documents en fonction d' au moins une valeur de pertinence déterminée pour ledit au moins un document en fonction d'au moins une valeur de pondération associée à au moins un mot clé de ladite requête courante associé audit document, ladite valeur de pondération étant prédéterminée en fonction d' au moins un avis utilisateur relatif à au moins une réponse à au moins une première requête préalable à ladite requête courante. De manière plus générale un moyen de stockage, lisible par un ordinateur ou par un microprocesseur, intégré ou non au dispositif, éventuellement amovible, mémorise un programme mettant en oeuvre le procédé de transmission.
L'invention est mise en oeuvre au moyen de composants logiciels et/ou matériels. Dans cette optique, le terme "module" peut correspondre dans ce document aussi bien à un composant logiciel, qu'à un composant matériel ou à un ensemble de composants matériels et/ou logiciels, apte à mettre en oeuvre une fonction ou un ensemble de fonctions, selon ce qui est décrit ci-dessous pour le module concerné.
Un composant logiciel correspond à un ou plusieurs programmes d'ordinateur, un ou plusieurs sous-programmes d'un programme, ou de manière plus générale à tout élément d'un programme ou d'un logiciel. Un tel composant logiciel est stocké en mémoire puis chargé et exécuté par un processeur de données d'une entité physique (terminal, serveur, passerelle, settop-box, routeur, etc) et est susceptible d'accéder aux ressources matérielles de cette entité physique (mémoires, supports d'enregistrement, bus de communication, cartes électroniques d'entrées/sorties, interfaces utilisateur, etc). De la même manière, un composant matériel correspond à tout élément d'un ensemble matériel (ou hardware). Il peut s'agir d'un composant matériel programmable ou avec processeur intégré pour l'exécution de logiciel, par exemple un circuit intégré, une carte à puce, une carte électronique pour l'exécution d'un micrologiciel (firmware), etc.

Claims (7)

  1. REVENDICATIONS1. Procédé d'obtention d' au moins un ensemble de métadonnées associé à au moins un document sélectionné parmi une pluralité de documents caractérisé en ce qu'il comporte les étapes suivantes : - transmission (E2, E52) d'une requête courante (RQ1, RQ2) comportant au moins un mot clé ; - réception (E12, E62) d'une réponse (RP1, RP2) à ladite requête courante contenant au moins un ensemble de métadonnées associé à au moins un document, ledit au moins un document (Di) étant sélectionné parmi les documents de la pluralité de documents en fonction d'au moins une valeur de pertinence (VPi) déterminée pour ledit au moins un document (Di) en fonction d'au moins une valeur de pondération (Pj) associée à au moins un mot clé (Mj) de ladite requête courante (RQ1, RQ2) associé audit document (Di), ladite valeur de pondération (VPi) étant prédéterminée en fonction d'au moins un avis utilisateur (DA) relatif à au moins une réponse (RP) à au moins une première requête (RQ) préalable à ladite requête courante.
  2. 2. Procédé d'obtention selon la revendication 1 caractérisé en ce qu'il comprend une étape d'affichage (E62) de métadonnées extraites dudit au moins un ensemble reçu suivie d'une étape de transmission d'un avis utilisateur (DA2) relatif à au moins un document ciblé dans ladite réponse.
  3. 3 Procédé d'obtention selon la revendication 1 dans lequel lesdites métadonnées comprennent un pointeur permettant d'accéder à un document et dans lequel le procédé comprend une étape d'affichage dudit pointeur, une étape d' accès audit document via ledit pointeur, une étape de réception d'une demande d'avis utilisateur pour ledit document et d'une étape de transmission d'un avis sur la pertinence dudit document en réponse à ladite demande d' avis utilisateur.
  4. 4 Procédé de transmission d'au moins un ensemble de métadonnées associé à au moins un document sélectionné parmi une pluralité de documents caractérisé en ce qu'il comporte les étapes suivantes : - réception (E4, E54) d'une requête courante (RQ1, RQ2) comportant au moins un mot clé ; - sélection (E8, E58) parmi les documents de la pluralité d' au moins un document en fonction d'au moins une valeur de pertinence déterminée pour ledit au moins un document en fonction d'au moins une valeur de pondération associée à au moins un mot clé de ladite requête courante associé audit document, ladite valeur de pondération étant prédéterminée en fonction-21- d'au moins un avis utilisateur relatif à au moins une réponse à au moins une première requête préalable à ladite requête courante ; - transmission (E10, E60) d'une réponse (RP1, RP2) à ladite requête courante contenant au moins un ensemble de métadonnées relatif à au moins un document sélectionné.
  5. 5 Procédé de transmission selon la revendication 4 dans lequel ladite valeur de pertinence est en outre déterminée en fonction d' au moins un nombre d'occurrence dudit au moins un mot clé de la requête pour ledit au moins un document.
  6. 6 Procédé de transmission selon la revendication 4 caractérisé en ce qu'il comporte les étapes suivantes, exécutées préalablement à ladite étape de réception d'une requête courante : - des étapes de réception (E28) en provenance d'une pluralité de terminaux, de premières requêtes (RQ) contenant au moins un mot clé ; - des étapes de transmission (E32) de réponses (RP) aux premières requêtes, comportant respectivement au moins un ensemble de métadonnées associé à au moins un document sélectionné parmi la pluralité de documents en fonction d' au moins un mot clé d'une première requête ; - des étapes de réception (E42) d'avis utilisateur (AV) pour au moins une des réponses transmises ; - une étape de détermination (E50) d'au moins une valeur de pondération d'au moins un mot clé en fonction d' au moins un avis utilisateur (AV) reçu.
  7. 7 Procédé de transmission selon la revendication 6 dans lequel l'avis utilisateur est relatif à la pertinence d'un document ciblé dans une réponse à une première requête et dans lequel l'étape de réception de l'avis est suivie d'une étape de détermination d'au moins une relation d'ordre (ORD) entre ledit document ciblé et un autre document ciblé dans ladite réponse et dans lequel ladite au moins une valeur de pondération d' au moins un mot clé est déterminée en fonction d' au moins une relation d'ordre déterminée 8 Procédé de transmission selon la revendication 4 caractérisé en ce que l'étape de transmission d'une réponse à une requête courante est suivie des étapes suivantes : - détection (E66) d'une action utilisateur (AC2) relative à un document ciblé dans la réponse (RP2) ; - transmission (E68) d'une demande d'avis utilisateur (DA2) suite à la dite détection d'une action utilisateur ; - réception (E72) d'un avis utilisateur (AV2) relatif audit document ;-22- - détermination (E76) d'au moins une relation d'ordre (ORM) entre au moins un mot clé de la requête courante associé audit document et au moins un mot clé de la requête courante associé à un autre document ciblé dans ladite réponse ; - enregistrement de ladite au moins une relation d'ordre déterminée 9 Procédé de transmission selon la revendication 8 caractérisé en ce qu'il comporte une étape (E78) de mise à jour d'au moins une valeur de pondération d'au moins un mot clé en fonction d' au moins une relation d'ordre (ORM) enregistrée. 10. Terminal (T, T3) caractérisé en ce qu'il comporte : - un module de transmission (TRQ) d'une requête courante (RQ1, RQ2) comportant au moins un mot clé ; - un module de réception (RRP) d'une réponse (RP1, RP2) à ladite requête courante contenant au moins un ensemble de métadonnées associé à au moins un document, ledit au moins un document étant sélectionné parmi des documents d'une pluralité de documents en fonction d'au moins une valeur de pertinence déterminée pour ledit au moins un document en fonction d'au moins une valeur de pondération associée à au moins un mot clé de ladite requête courante associé audit document, ladite valeur de pondération étant prédéterminée en fonction d'au moins un avis utilisateur relatif à au moins une réponse à au moins une première requête préalable à ladite requête courante. 11. Serveur (S) caractérisé en ce qu'il comporte : - un module de réception (RRQ) d'une requête courante (RP1, RP2) comportant au moins un mot clé ; - un module de sélection (SEL) parmi des documents d'une pluralité de documents d' au moins un document en fonction d'au moins une valeur de pertinence déterminée pour ledit au moins un document en fonction d' au moins une valeur de pondération associée à au moins un mot clé de ladite requête courante associé audit document, ladite valeur de pondération étant prédéterminée en fonction d'au moins un avis utilisateur ou d'au moins une action utilisateur relatifs à au moins une réponse à au moins une première requête préalable à ladite requête courante ; - un module de transmission (TRP) d'une réponse (RP1, RP2) à ladite requête courante contenant au moins un ensemble de métadonnées relatif à au moins un document sélectionné.35
FR1261493A 2012-11-30 2012-11-30 Selection de documents dans une base de donnees Withdrawn FR2998998A1 (fr)

Priority Applications (1)

Application Number Priority Date Filing Date Title
FR1261493A FR2998998A1 (fr) 2012-11-30 2012-11-30 Selection de documents dans une base de donnees

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR1261493A FR2998998A1 (fr) 2012-11-30 2012-11-30 Selection de documents dans une base de donnees

Publications (1)

Publication Number Publication Date
FR2998998A1 true FR2998998A1 (fr) 2014-06-06

Family

ID=48170567

Family Applications (1)

Application Number Title Priority Date Filing Date
FR1261493A Withdrawn FR2998998A1 (fr) 2012-11-30 2012-11-30 Selection de documents dans une base de donnees

Country Status (1)

Country Link
FR (1) FR2998998A1 (fr)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8185523B2 (en) * 2005-03-18 2012-05-22 Search Engine Technologies, Llc Search engine that applies feedback from users to improve search results

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8185523B2 (en) * 2005-03-18 2012-05-22 Search Engine Technologies, Llc Search engine that applies feedback from users to improve search results

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
WEIGUO FAN ET AL: "Genetic Programming-Based Discovery of Ranking Functions for Effective Web Search", JOURNAL OF MANAGEMENT INFORMATION SYSTEMS, vol. 21, no. 4, 1 January 2005 (2005-01-01), pages 37 - 56, XP055069836 *

Similar Documents

Publication Publication Date Title
US10795939B2 (en) Query method and apparatus
US20160117729A1 (en) Method and apparatus for providing search capability and targeted advertising for audio, image, and video content over the internet
Yao et al. Recommending web services via combining collaborative filtering with content-based features
WO2018149115A1 (fr) Procédé et appareil de fourniture de resultats de recherche
US7505956B2 (en) Method for classification
US20140372216A1 (en) Contextual mobile application advertisements
US9070085B2 (en) Organically ranked knowledge categorization in a knowledge management system
US20090281966A1 (en) Virtual robot integration with search
US20100191758A1 (en) System and method for improved search relevance using proximity boosting
US20080160490A1 (en) Seeking Answers to Questions
US8655902B2 (en) Identifying superphrases of text strings
US20100057688A1 (en) Adaptive multi-channel answering service for knowledge management systems
US20180060331A1 (en) Prioritizing Items Based on User Activity
FR2960084A1 (fr) Procede de classement de l'influence d'un site web
US20190163828A1 (en) Method and apparatus for outputting information
US11947618B2 (en) Identifying and storing relevant user content in a collection accessible to user in website subscribed to service
WO2017136295A1 (fr) Étiquetage adaptatif d'utilisateur désigné pour identification d'un contenu ciblé
US8843536B1 (en) Methods and systems for providing relevant advertisements or other content for inactive uniform resource locators using search queries
US20110225134A1 (en) System and method for enhanced find-in-page functions in a web browser
JP2007299292A (ja) 検索装置による情報検索方法、情報検索装置及び情報検索処理プログラム
US20140289255A1 (en) Application of community-defined descriptors to mobile content
CN104156359B (zh) 内链信息推荐方法及装置
JP2019095940A (ja) 情報処理装置、情報処理方法、および情報処理プログラム
CN112182414A (zh) 文章推荐方法、装置及电子设备
US20160055203A1 (en) Method for record selection to avoid negatively impacting latency

Legal Events

Date Code Title Description
ST Notification of lapse

Effective date: 20150731