FR3032538A1 - COMPUTER SYSTEM FOR AUTOMATIC DATA COLLECTION - Google Patents

COMPUTER SYSTEM FOR AUTOMATIC DATA COLLECTION Download PDF

Info

Publication number
FR3032538A1
FR3032538A1 FR1550992A FR1550992A FR3032538A1 FR 3032538 A1 FR3032538 A1 FR 3032538A1 FR 1550992 A FR1550992 A FR 1550992A FR 1550992 A FR1550992 A FR 1550992A FR 3032538 A1 FR3032538 A1 FR 3032538A1
Authority
FR
France
Prior art keywords
data
database
computer system
information
prospectors
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
FR1550992A
Other languages
French (fr)
Other versions
FR3032538B1 (en
Inventor
Stephane Chaillou
Olivier Piscart
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
MANAGEO, FR
Original Assignee
Orbite SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Orbite SAS filed Critical Orbite SAS
Priority to FR1550992A priority Critical patent/FR3032538B1/en
Publication of FR3032538A1 publication Critical patent/FR3032538A1/en
Application granted granted Critical
Publication of FR3032538B1 publication Critical patent/FR3032538B1/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/254Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

La présente invention concerne un système informatique pour la collecte automatique de données de prospection et la mise à disposition des équipements informatiques distants de prospecteurs, comprenant un robot de recherche sur la toile pour la capture d'informations non structurées, ainsi qu'un moyen d'importation des données enregistrées dans les bases de données des prospecteurs et de traitement desdites données préalablement à l'enregistrement de données standardisées dans ladite base de données partagée entre une pluralité de prospecteurs et un moteur de règles commandant le robot de recherche d'enrichissement ladite base de données par une recherche automatique sur une pluralité de sources d'informations, en fonction de données relatives à au moins un descripteur numérique d'événements provenant de l'équipement informatique des prospecteurs, ou d'un traitement de données enregistrées dans ladite base de données.The present invention relates to a computer system for the automatic collection of prospecting data and the provision of remote computing equipment of prospectors, including a web-based search robot for capturing unstructured information, and a means for searching the web. importing the data stored in the prospector databases and processing said data prior to storing standardized data in said database shared between a plurality of prospectors and a rule engine controlling the enrichment search robot said database by automatically searching for a plurality of information sources, based on data relating to at least one digital descriptor of events from the prospectors computer equipment, or processing data stored in said database of data.

Description

-1- SYSTEME INFORMATIQUE POUR LA COLLECTE AUTOMATIQUE DE DONNEES Domaine de l'invention La présente invention concerne le domaine des systèmes informatiques destinés à automatiser la prospection marketing et commerciale. Etat de la technique On connaît dans l'état de la technique des solutions d'automatisation de la prospection consistant à construire automatiquement une base de données à partir d'informations non structurées provenant d'un robot d'exploration de la toile numérique. On connaît en particulier le brevet européen délivré sous le numéro EP2037377 décrivant un procédé mis oeuvre par ordinateur, et à un système pour fournir un contenu supplémentaire, qui comprend les étapes suivantes : - entrer une information média primaire d'une source d'informations, comprenant les métadonnées de contenu primaire, - accéder à une base de données de contenu supplémentaire et - générer des éléments média supplémentaires en utilisant le sélecteur de contenu supplémentaire, en fonction de la logique de contenu supplémentaire de la base de données. Le brevet européen délivré sous le numéro EP0932876 concerne un procédé et un système d'échange de données dans un réseau, servant notamment aux appels d'offres automatiques. Ce système comprend au moins un serveur central avec une mémoire de données, qui est pourvu d'une unité de connexion d'entrée 3032538 -2 et d'une unité de connexion de sortie, ainsi qu'au moins un client et un fournisseur de données (pour introduire des données dans la mémoire de données du serveur central et/ou les en extraire), qui peuvent être connectés à des terminaux 5 avec une unité de connexion d'entrée et/ou de sortie, par l'intermédiaire d'un réseau. Ce système se caractérise en ce que le serveur comporte des modules de sélection automatique de fournisseurs de données en fonction de la demande d'un client et d'acheminement automatique ultérieur de la demande 10 aux fournisseurs de données. Le brevet européen délivré sous le numéro EP1877932 concerne un système et un procédé d'agrégation et de contrôle de données multimédia enregistrées de façon décentralisée. On connaît aussi le brevet américain US7096220 décrivant 15 un système de collecte de prospects sur le Web. Le système est basé sur un modèle de service SaaS (Software as a Service : logiciel accessible en ligne) accessible à des utilisateurs par l'intermédiaire de navigateurs Web et Internet. Les utilisateurs, qui sont généralement des entreprises, peuvent 20 accéder au système de recherche de données non structurées disponibles sur la toile pour constituer une base de prospects et de clients potentiels. L'utilisateur décrit un ou plusieurs types de clients potentiels, ainsi que les adresses de sites Internet d'intérêt. Un processus automatisé récupère les 25 données du site Web, et stocke les données dans une archive Web. Un moteur de recherche récupère les données Internet selon les critères fournis par le client. Le système renvoie les noms ou les informations d'identification sur les prospects avec un lien vers le document qui permet de vérifier 30 la concordance avec les critères. La demande de brevet US20060195338 décrit un système basé sur un modèle de service d'application. Les utilisateurs, qui sont généralement des entreprises, peuvent accéder au système de recherche de données non structurées pour obtenir des prospects pour les ventes potentielles. Le système reçoit les 3032538 -3 critères de l'utilisateur qui décrit un ou plusieurs types de clients potentiels, ainsi que les adresses de sites Internet d'intérêt. Un processus de robot récupère les données du site Web, et stocke les données dans une archive Web. Un processus 5 de recherche collecte les données Internet selon les critères fournis par le client. Le système renvoie les noms ou les informations d'identification de la perspective avec un lien vers le document qui vérifie le match de la perspective aux critères.FIELD OF THE INVENTION The present invention relates to the field of computer systems for automating marketing and commercial prospecting. State of the art It is known in the state of the art prospecting automation solutions consisting of automatically constructing a database from unstructured information from a crawler of the digital web. In particular, the European patent issued under the number EP2037377 describes a method implemented by computer, and a system for providing additional content, which comprises the following steps: - enter a primary media information from an information source, including the primary content metadata, - accessing an additional content database, and - generating additional media items using the additional content selector, depending on the additional content logic of the database. The European patent issued under the number EP0932876 relates to a method and a system for exchanging data in a network, in particular for automatic tendering. This system comprises at least one central server with a data memory, which is provided with an input connection unit 3032538 -2 and an output connection unit, as well as at least one client and one service provider. data (for inputting data to and / or extracting from the data memory of the central server), which can be connected to terminals with an input and / or output connection unit, via a network. This system is characterized in that the server includes automatic data provider selection modules based on the request of a client and subsequent automatic routing of the request to the data providers. The European patent issued under the number EP1877932 relates to a system and a method of aggregation and control of multimedia data recorded in a decentralized manner. Also known is US Patent US7096220 describing a web-based lead collection system. The system is based on a Software as a Service (SaaS) service model accessible to users via web browsers and the Internet. Users, who are generally businesses, can access the unstructured data search system available on the web to build a base of prospects and potential customers. The user describes one or more types of potential customers, as well as the addresses of Internet sites of interest. An automated process retrieves the data from the website, and stores the data in a web archive. A search engine retrieves Internet data according to the criteria provided by the customer. The system returns the names or credentials on the leads with a link to the document that checks for agreement with the criteria. The patent application US20060195338 describes a system based on an application service model. Users, who are typically businesses, can access the unstructured data search system to gain leads for potential sales. The system receives the 3032538 -3 criteria from the user that describes one or more types of potential customers, as well as the addresses of Internet sites of interest. A robot process retrieves the data from the website, and stores the data in a web archive. A search process collects Internet data according to the criteria provided by the client. The system returns the names or credentials of the prospect with a link to the document that checks the match from perspective to criteria.

10 Le brevet américain US6868389 décrit un procédé de génération d'une base de prospects et un système informatique distribué. Le procédé comprend les étapes de l'identification d'indicateurs d'achat et l'extraction des identifiants de prospects à partir des indicateurs d'achat. Par exemple, une 15 annonce classée en ligne vendant une automobile est un indicateur d'achat pour un achat éventuel d'une nouvelle voiture par l'ancien vendeur de voiture. L'identificateur, par exemple un numéro de téléphone ou adresse e-mail, identifie de manière unique la perspective 20 susceptible de faire l'achat futur. La méthode comprend également les étapes d'obtention d'informations de contact complet pour la perspective d'une base de données de profil, l'application d'un modèle de prévision pour les perspectives pour sélectionner les fils de prospection et la transmission à 25 une partie intéressée, comme un service de marketing direct ou force de vente. Le brevet américain RE42870 décrit un système d'extraction de texte pour la collecte de données de prospection, pour une utilisation accessible par le client via 30 Internet. Le système comporte divers composants, y compris un processus d'acquisition de données qui extrait des données textuelles à partir de sites Web sur Internet. Le système compare les données au contenu et traite les données pour fournir un fil de prospection. 35 3032538 -4 Inconvénient de l'art antérieur Les solutions de l'art antérieur présentent 5 l'inconvénient d'un manque de pertinence des données enregistrées dans la base de données de prospection. Le robot de recherche de l'art antérieur collecte des informations à partir de critères figés consistant par exemple en une définition de mots clés. Le problème technique qui en résulte 10 est celui de l'augmentation des capacités de traitement et de stockage d'informations dont une partie significative est sans utilité, et la nécessiter de prévoir des moyens supplémentaires pour qualifier et filtrer les données. Dans l'art antérieur, l'étape de constitution automatique 15 de la base de données par le robot de recherche est indépendante de l'exploitation de ces données par le prospecteur. Ceci a pour inconvénient de mobiliser des ressources informatiques pour des résultats mal appropriés et donc de dégrader l'efficacité des moyens techniques mis en 20 oeuvre. Dans l'art antérieur, la seule interaction entre l'étape de recherche et l'étape d'exploitation des données consiste à définir les critères de recherche. Si ces critères de recherche sont mal définis ou 25 inappropriés, ou évolutifs dans le temps, la base de données sera « encombrée » de données peu pertinentes, sans réelle possibilité de les éliminer ou de les distinguer des données pertinentes. Les solutions de l'art antérieur conduisent donc à 30 enregistrer un grand nombre de données inutiles, ou sans valeur, limitant l'efficacité de la prospection. Solution apportée par l'invention 3032538 -5 Afin de remédier à ces inconvénients, la présente invention concerne, selon son acception la plus générale, un système informatique pour la collecte automatique de données 5 de prospection et la mise à disposition des équipements informatiques distants de prospecteurs, comprenant : - Un robot de recherche sur la toile pour la capture d'informations non structurées - Une base de données pour l'enregistrement des 10 informations non structurées provenant dudit robot de recherche - Un moyen de traitement pour extraire desdites informations non structurées des données numériques standardisées correspondant à chaque prospect 15 - Une interface pour l'extraction d'une partie desdites données standardisées par l'équipement informatique de prospecteurs Caractérisé en ce que ledit système informatique comporte en outre : 20 - Un moyen d'importation des données enregistrées dans les bases de données des prospecteurs et de traitement desdites données préalablement à l'enregistrement de données standardisées dans ladite base de données partagée entre une pluralité de 25 prospecteurs - Un moteur de règles commandant le robot de recherche d'enrichissement de ladite base de données par une recherche automatique sur une pluralité de sources d'informations, en fonction de données 30 relatives à au moins un descripteur numérique d'événements provenant de l'équipement informatique des prospecteurs, ou d'un traitement de données enregistrées dans ladite base de données 3032538 -6 - ledit moteur de règles réalisant un calcul de pertinence des données provenant du robot de recherche en fonction des informations d'un traitement réalisé sur les données importées.US Patent US6868389 discloses a method of generating a prospect database and a distributed computer system. The method includes the steps of identifying purchase indicators and extracting prospect identifiers from the purchase indicators. For example, an online classified ad selling an automobile is a buying indicator for a possible purchase of a new car by the former car salesman. The identifier, for example a telephone number or email address, uniquely identifies the prospect 20 likely to make the future purchase. The method also includes the steps of obtaining full contact information for the perspective of a profile database, applying a forecasting model for prospects to select the prospecting leads, and transmitting to 25 an interested party, such as a direct marketing service or sales force. US Patent RE42870 discloses a text extraction system for the collection of prospecting data, for use accessible by the customer via the Internet. The system includes various components, including a data acquisition process that extracts textual data from web sites on the Internet. The system compares the data with the content and processes the data to provide a survey thread. Disadvantage of the prior art The solutions of the prior art have the drawback of a lack of relevance of the data recorded in the prospecting database. The prior art search robot collects information from fixed criteria consisting for example of a definition of keywords. The resulting technical problem is that of increasing the capacity for processing and storing information, a significant part of which is useless, and requiring it to provide additional means for qualifying and filtering the data. In the prior art, the step of automatic constitution of the database by the search robot is independent of the exploitation of these data by the prospector. This has the drawback of mobilizing computer resources for poorly adapted results and thus of degrading the efficiency of the technical means used. In the prior art, the only interaction between the search step and the data exploitation step is to define the search criteria. If these search criteria are poorly defined or inappropriate, or evolving over time, the database will be "cluttered" with irrelevant data, with no real possibility of eliminating them or distinguishing them from relevant data. The solutions of the prior art thus lead to the recording of a large number of useless or worthless data limiting the effectiveness of the survey. Solution Provided by the Invention In order to overcome these drawbacks, the present invention relates, in its most general sense, to a computer system for the automatic collection of prospecting data and the provision of remote computer equipment. prospectors, comprising: - A web search robot for unstructured information capture - A database for recording unstructured information from said search robot - A processing means for extracting said unstructured information standardized digital data corresponding to each prospect 15 - An interface for extracting a portion of said data standardized by the prospector computer equipment Characterized in that said computer system further comprises: - Data importing means stored in the databases of prospectors and t processing said data prior to storing standardized data in said shared database among a plurality of prospectors - A rule engine controlling the search engine for enriching said database by an automatic search on a plurality of sources information, based on data relating to at least one digital descriptor of events from the prospectors' computer equipment, or a data processing recorded in said database 3032538 -6 - said engine of rules realizing a calculation of relevance of the data coming from the search robot according to the information of a processing carried out on the imported data.

5 Avantageusement, ledit moyen d'importation des données enregistrées dans les bases de données des prospecteurs comprend une interface permettant l'ouverture par un prospecteur d'une session pour la transmission des informations stockées localement sur l'équipement dudit 10 prospecteur. Selon un mode de réalisation particulier, lesdits moyens de traitement des données des prospecteurs comprennent le formatage selon le format des données standardisées et l'enrichissement par la recherche automatique de données 15 complémentaires sur des sources d'informations externes. De préférence, lesdits moyens de traitement des données des prospecteurs comprennent au moins un moteur de dédoublonnage, un moteur d'annotation avec une information numérique de fiabilité, et/ou un moteur de fusion de données.Advantageously, said means for importing the data recorded in the prospector databases comprises an interface allowing a prospector to open a session for the transmission of the information stored locally on the equipment of said prospector. According to a particular embodiment, said prospector data processing means comprise the formatting according to the standardized data format and the enrichment by the automatic search for additional data on external information sources. Preferably, said prospector data processing means comprise at least one de-duplication engine, an annotation engine with digital reliability information, and / or a data fusion engine.

20 Selon une variante avantageuse, ledit moteur de règles comprend des moyens de communication avec les équipements informatiques des prospecteurs, pour la transmission de données numériques calculées sur l'équipement du prospecteur, et des moyens de déclenchement automatique d'une nouvelle 25 recherche automatique pour compléter et/ou valider les données enregistrées dans ladite base de données. Description détaillée d'un exemple non limitatif de réalisation 30 La présente invention sera mieux comprise à la lecture de la description qui suit, se référant aux dessins annexés correspondant à un exemple non limitatif de réalisation, où : - la figure 1 représente une vue schématique de 35 l'architecture informatique du système selon l'invention 3032538 -7 - la figure 2 représente le schéma d'architecture fonctionnelle du système selon l'invention. Architecture informatique 5 La figure 1 représente un exemple d'architecture d'une plate-forme informatique pour l'automatisation de la prospection. Le système comprend un proxy inverse (1) installé du côté 10 des serveurs Internet. Le proxy inverse (1) permet l'accès aux applications de serveurs internes et réalise de façon connue les fonctions suivantes : - Intermédiaire de sécurité : le proxy inverse protège un serveur Web des attaques provenant de l'extérieur. En effet, 15 la couche supplémentaire apportée par les proxys inverses peut apporter une sécurité supplémentaire. La réécriture programmable des URL permet de masquer et de contrôler, par exemple, l'architecture d'un site Web interne. Mais cette architecture permet surtout le filtrage en un point unique des 20 accès aux ressources Web. - Répartition de charge : le proxy inverse distribue la charge d'un site unique sur plusieurs serveurs Web applicatifs. Ce proxy inverse (1) comporte les ports d'entrée-sortie 25 pour la communication avec les équipements informatiques des prospecteurs et assure la gestion de la communication des données entre la plate-forme et les équipements des prospecteurs. Les flux de données du proxy inverse (1) sont échangés 30 avec un ou plusieurs serveurs d'application (2) qui hébergent les différentes applications logicielles commandant le fonctionnement de la plate-forme. Ces applications logicielles commandent également les interfaces avec les prospecteurs et 3032538 -8 la numérisation des informations pour alimenter les autres serveurs (3 à 6). Le serveur (3) du moteur de règles comporte une mémoire pour l'enregistrement des règles et un calculateur pour le 5 traitement de l'information, le déclenchement d'un robot de recherche (4), l'alimentation du serveur de base de données (6) et de l'index associé (7). Le serveur (4) réalise la fonction de robot de recherche en charge de la collecte des informations sur internet via un 10 ou plusieurs proxys internet (8). Ce proxy (8) assure la sécurité informatique en relayant les requêtes vers l'internet. Le serveur d'événements (5) reçoit les informations venant des équipements des prospecteurs par l'intermédiaire du 15 serveur logiciel (2) pour déclencher la collecte d'informations appropriées en commandant le serveur robot de collecte (4) et en accédant aux données de la base (6), puis en notifiant le serveur logiciel (2). Le serveur de base de données (6) assure le stockage des 20 données et donne l'accès aux différentes ressources de la plate-forme à ces données. Le serveur d'indexation (7) assure un accès rapide aux données enregistrées dans la base de données (6).According to an advantageous variant, said rule engine comprises means of communication with the prospectors' computer equipment, for the transmission of numerical data calculated on the prospector's equipment, and means for automatically triggering a new automatic search for complete and / or validate the data recorded in said database. DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENT The present invention will be better understood on reading the description which follows, with reference to the appended drawings corresponding to a non-limiting example of embodiment, in which: FIG. 1 represents a diagrammatic view The computer architecture of the system according to the invention 3032538 -7 - Figure 2 shows the functional architecture diagram of the system according to the invention. Computer Architecture 5 Figure 1 shows an example architecture of a computer platform for automating prospecting. The system includes a reverse proxy (1) installed on the side of the Internet servers. The reverse proxy (1) allows access to internal server applications and performs the following functions in a known manner: - Security intermediary: the reverse proxy protects a Web server from attacks coming from outside. Indeed, the additional layer provided by the reverse proxies can provide additional security. Programmable URL rewrite allows you to hide and control, for example, the architecture of an internal website. But this architecture allows above all the single-point filtering of the 20 accesses to the web resources. - Load balancing: The reverse proxy distributes the load of a single site across multiple web application servers. This reverse proxy (1) has the input-output ports 25 for communication with the prospectors 'computer equipment and manages the communication of data between the platform and the prospectors' equipment. The reverse proxy data streams (1) are exchanged with one or more application servers (2) which host the different software applications controlling the operation of the platform. These software applications also control the interfaces with the prospectors and the scanning of the information to feed the other servers (3 to 6). The server (3) of the rules engine includes a memory for storing the rules and a computer for processing the information, triggering a search robot (4), feeding the base server of data (6) and associated index (7). The server (4) performs the search robot function in charge of collecting information on the internet via one or more internet proxies (8). This proxy (8) provides computer security by relaying requests to the internet. The event server (5) receives the information from the prospectors' equipment via the software server (2) to trigger the collection of appropriate information by controlling the collection robot server (4) and accessing the data. from the base (6), then notifying the software server (2). The database server (6) stores the data and gives access to the various platform resources to this data. The indexing server (7) provides quick access to the data stored in the database (6).

25 Architecture fonctionnelle La figure 2 représente une vue schématique de l'architecture fonctionnelle. Le prospecteur dispose d'un équipement informatique (9), 30 par exemple un micro-ordinateur relié à un réseau, par exemple Internet. Optionnellement, le prospecteur dispose de données de prospections enregistrées dans une mémoire locale (10). Ces données sont par exemple constituées par un fichier de 3032538 -9 contacts, et/ou des informations sur l'environnement de prospection. Pour la mise en oeuvre de l'invention, la solution décrite à titre d'exemple utilise un mode « SaaS » évitant 5 l'installation sur l'équipement du prospecteur d'une application spécifique. Le prospecteur accède à la plate-forme à partir de son navigateur, pour ouvrir une session après une identification de manière connue par une combinaison de plusieurs facteurs, comprenant un identifiant, une empreinte 10 de l'équipement informatique utilisé pour accéder à la plate-forme et un mot de passe. Alimentation de la base de données (6) 15 Lors de la première utilisation par un nouveau prospecteur, ce dernier procède à la création d'un compte utilisateur. Ce compte donne accès à la plate-forme et aux logiciels permettant de transférer des données, notamment les données de 20 prospection locales, et d'accéder aux outils permettant d'automatiser la prospection marketing et commerciale. On entendra au sens du présent brevet par « données locales » les données appartenant à un prospecteur. Ces données peuvent être physiquement « locales », car 25 enregistrées sur l'équipement informatique local, ou enregistrées dans un espace mémoire privé ou mutualisé dans le nuage (« cloud ») ou encore enregistré sur un serveur distant, par exemple un serveur de contacts. La plate-forme réalise un prétraitement des données 30 consistant notamment : - à vérifier le volume, l'intégrité et la conformité des données, et adresser un message d'erreur en cas d'anomalie 3032538 -10- - à formater les données selon le format standardisé de la base de données (6) par application de traitements définis par le moteur de règles (3) - à déclencher le robot de recherche (4) pour vérifier et 5 le cas échéant compléter les données - à enregistrer les données ainsi traitées dans la base de données (6). On procède ensuite au traitement des données consistant à formater, enrichir, estimer la fiabilité, dédoublonner et 10 valider les données enregistrées dans la base de données (6). Ces traitements sont définis par le moteur de règles (3). Supervision et contrôle des données 15 La plate-forme déclenche périodiquement des traitements de contrôle d'anomalie et de vérification de la validité des données enregistrées dans la base de données (6). En cas de détection de données invalides, le moteur de règles commande le robot de recherche (4)afin de rechercher 20 des données additionnelles sur la toile. Automatisation de la prospection Le logiciel (2) donne accès aux outils d'automatisation de la prospection à savoir, rechercher les données d'intérêt pour le prospecteur, les qualifier, notifier, suivre et 25 synthétiser les actions menées pour la prospection commerciale sous forme de rapports. Gestionnaire d'événement Le logiciel (2) permet au prospecteur de configurer le gestionnaire d'événement (5) afin de répondre aux besoins du 30 prospecteur. Le gestionnaire d'événements pilote les accès à la base (6) et au robot (4) afin de collecter les informations nécessaires à l'identification des prospects qualifiés pour le prospecteur.Functional Architecture Figure 2 shows a schematic view of the functional architecture. The prospector has computer equipment (9), for example a microcomputer connected to a network, for example the Internet. Optionally, the prospector has survey data stored in a local memory (10). This data is for example constituted by a file of 3032538 -9 contacts, and / or information on the prospecting environment. For the implementation of the invention, the exemplary solution uses a "SaaS" mode to avoid the installation on the prospector's equipment of a specific application. The prospector accesses the platform from his browser, to log in after known identification by a combination of several factors, including an identifier, an imprint of the computer equipment used to access the platform. form and a password. Database Feed (6) 15 When first used by a new prospector, the new prospector creates a user account. This account provides access to the platform and software for transferring data, including local prospecting data, and access to tools for automating marketing and sales prospecting. For the purposes of this patent, "local data" means data belonging to a prospector. This data can be physically "local" because it is stored on the local computer equipment, or stored in a private or shared memory space in the cloud ("cloud") or stored on a remote server, for example a contact server. . The platform performs preprocessing of the data including: - checking the volume, integrity and compliance of the data, and addressing an error message in the event of an anomaly 3032538 -10- - formatting the data according to the standardized format of the database (6) by applying processes defined by the rules engine (3) - to trigger the search robot (4) to check and if necessary to complete the data - to record the data as well as processed in the database (6). Data processing is then carried out consisting of formatting, enriching, estimating the reliability, deduplicating and validating the data recorded in the database (6). These processes are defined by the rule engine (3). Supervision and control of data 15 The platform periodically triggers abnormality check processing and verification of the validity of the data recorded in the database (6). In case of invalid data detection, the rule engine controls the search robot (4) to search for additional data on the web. Automation of prospecting The software (2) gives access to the tools of automation of the prospecting namely, to search for the data of interest for the prospector, to qualify them, to notify, to follow and to synthesize the actions carried out for the commercial prospecting in the form of reports. Event Manager The software (2) allows the prospector to configure the event handler (5) to meet the needs of the prospector. The event manager controls access to the database (6) and the robot (4) to collect the information necessary to identify qualified prospects for the prospector.

Claims (5)

REVENDICATIONS1 - Système informatique pour la collecte automatique de 5 données de prospection et la mise à disposition des équipements informatiques distants de prospecteurs, comprenant : - Un robot de recherche sur la toile pour la capture d'informations non structurées 10 - Une base de données pour l'enregistrement des informations non structurées provenant dudit robot de recherche - Un moyen de traitement pour extraire desdites informations non structurées des données numériques 15 standardisées correspondant à chaque prospect - Une interface pour l'extraction d'une partie desdites données standardisées par l'équipement informatique de prospecteurs Caractérisé en ce que ledit système informatique comporte 20 en outre : - Un moyen d'importation des données enregistrées dans les bases de données des prospecteurs et de traitement desdites données préalablement à l'enregistrement de données standardisées dans ladite 25 base de données partagée entre une pluralité de prospecteurs - Un moteur de règles commandant le robot de recherche d'enrichissement ladite base de données par une recherche automatique sur une pluralité de sources 30 d'informations, en fonction de données relatives à au moins un descripteur numérique d'événements provenant de l'équipement informatique des prospecteurs, ou d'un 3032538 -12- traitement de données enregistrées dans ladite base de données - ledit moteur de règles réalisant un calcul de pertinence des données provenant du robot de recherche en fonction des informations d'un traitement réalisé sur les données importées.CLAIMS 1 - Computer system for the automatic collection of prospecting data and the provision of remote computer equipment of prospectors, comprising: - A web search robot for capturing unstructured information 10 - A database for recording unstructured information from said search robot - processing means for extracting said unstructured information from the standardized digital data corresponding to each prospect - an interface for extracting a portion of said data standardized by the equipment Prospectus computer system characterized in that said computer system further comprises: - means for importing the data stored in the prospector databases and for processing said data prior to storing standardized data in said database shared between a plu A search engine enriches said database by automatically searching for a plurality of information sources based on data relating to at least one digital descriptor of events from a search engine. the computer equipment of the prospectors, or a processing of data recorded in said database - said rule engine performing a calculation of relevance of the data coming from the search robot according to the information of a processing carried out on the imported data. 2 - Système informatique pour la collecte automatique selon la revendication 1 caractérisé en ce que ledit moyen d'importation des données enregistrées dans les bases de données des prospecteurs comprend une interface permettant l'ouverture par un prospecteur d'une session pour la transmission des informations stockées localement sur l'équipement dudit prospecteur.2 - computer system for automatic collection according to claim 1 characterized in that said means for importing the data recorded in the databases of the prospectors comprises an interface allowing the opening by a prospector of a session for the transmission of information stored locally on the equipment of said prospector. 3 - Système informatique pour la collecte automatique selon la revendication 1 ou 2 caractérisé en ce que lesdits moyens de traitement des données des prospecteurs comprennent le formatage selon le format des données standardisées et d'enrichissement par la recherche automatique de données complémentaires sur des sources d'informations externes.3 - computer system for automatic collection according to claim 1 or 2 characterized in that said data processing means prospectors include formatting according to the format of standardized data and enrichment by the automatic search for additional data on sources of data. external information. 4 - Système informatique pour la collecte automatique selon la revendication 1 ou 2 caractérisé en ce que lesdits moyens de traitement des données des prospecteurs comprennent au moins un moteur de dédoublonnage, un moteur d'annotation avec une information numérique de fiabilité, et/ou un moteur de fusion de données.4 - computer system for automatic collection according to claim 1 or 2 characterized in that said prospector data processing means comprise at least a duplication engine, an annotation engine with a digital information reliability, and / or a data fusion engine. 5 - Système informatique pour la collecte automatique selon la revendication 1 caractérisé en ce que ledit moteur de règles comprend des moyens de communication avec les équipements informatiques des prospecteurs, pour la transmission de données numériques calculées sur l'équipement du prospecteur, et des moyens de déclenchement automatique 3032538 -13- d'une nouvelle recherche automatique pour compléter et/ou valider les données enregistrées dans ladite base de données.5 - Computer system for automatic collection according to claim 1 characterized in that said rule engine comprises means of communication with the computer equipment of the prospectors, for the transmission of digital data calculated on the equipment of the prospector, and means of automatic triggering 3032538 -13- of a new automatic search to complete and / or validate the data recorded in said database.
FR1550992A 2015-02-09 2015-02-09 COMPUTER SYSTEM FOR AUTOMATIC DATA COLLECTION Active FR3032538B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
FR1550992A FR3032538B1 (en) 2015-02-09 2015-02-09 COMPUTER SYSTEM FOR AUTOMATIC DATA COLLECTION

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR1550992A FR3032538B1 (en) 2015-02-09 2015-02-09 COMPUTER SYSTEM FOR AUTOMATIC DATA COLLECTION

Publications (2)

Publication Number Publication Date
FR3032538A1 true FR3032538A1 (en) 2016-08-12
FR3032538B1 FR3032538B1 (en) 2021-07-30

Family

ID=53404660

Family Applications (1)

Application Number Title Priority Date Filing Date
FR1550992A Active FR3032538B1 (en) 2015-02-09 2015-02-09 COMPUTER SYSTEM FOR AUTOMATIC DATA COLLECTION

Country Status (1)

Country Link
FR (1) FR3032538B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114386509A (en) * 2022-01-12 2022-04-22 平安普惠企业管理有限公司 Data fusion method and device, electronic equipment and storage medium

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040215656A1 (en) * 2003-04-25 2004-10-28 Marcus Dill Automated data mining runs
US20050060340A1 (en) * 2003-07-25 2005-03-17 Enkata Technologies System and method for efficient enrichment of business data
US7096220B1 (en) * 2000-05-24 2006-08-22 Reachforce, Inc. Web-based customer prospects harvester system
US20080235288A1 (en) * 2007-03-23 2008-09-25 Ben Harush Yossi Data quality enrichment integration and evaluation system
US20140067803A1 (en) * 2012-09-06 2014-03-06 Sap Ag Data Enrichment Using Business Compendium

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7096220B1 (en) * 2000-05-24 2006-08-22 Reachforce, Inc. Web-based customer prospects harvester system
US20040215656A1 (en) * 2003-04-25 2004-10-28 Marcus Dill Automated data mining runs
US20050060340A1 (en) * 2003-07-25 2005-03-17 Enkata Technologies System and method for efficient enrichment of business data
US20080235288A1 (en) * 2007-03-23 2008-09-25 Ben Harush Yossi Data quality enrichment integration and evaluation system
US20140067803A1 (en) * 2012-09-06 2014-03-06 Sap Ag Data Enrichment Using Business Compendium

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114386509A (en) * 2022-01-12 2022-04-22 平安普惠企业管理有限公司 Data fusion method and device, electronic equipment and storage medium

Also Published As

Publication number Publication date
FR3032538B1 (en) 2021-07-30

Similar Documents

Publication Publication Date Title
TWI718941B (en) System and method for generating alerts and non-transitory computer-readable medium
Amalina et al. Blending big data analytics: Review on challenges and a recent study
AU2019204285B2 (en) Artificial intelligence (ai) based chatbot creation and communication system
van Baar et al. Digital forensics as a service: A game changer
US9990431B2 (en) Rich web page generation
US10218599B2 (en) Identifying referral pages based on recorded URL requests
US20090204617A1 (en) Content acquisition system and method of implementation
CN104572976B (en) Website data update method and system
CN112506743A (en) Log monitoring method and device and server
CN112948397A (en) Data processing system, method, device and storage medium
WO2017173063A1 (en) Updating messaging data structures to include predicted attribute values associated with recipient entities
US20160188676A1 (en) Collaboration system for network management
FR3032538A1 (en) COMPUTER SYSTEM FOR AUTOMATIC DATA COLLECTION
CN111611483B (en) Object portrait construction method, device and equipment and storage medium
Gayakwad et al. Analysis of Methodologies to Model the Content for Conveying the Correct Information
CN205754379U (en) Log processing system
Mysiuk Designing a Data Warehouse for Collected Data About User Activity in Social Networks Using Elasticsearch
Tangsatjatham et al. Hybrid big data architecture for high-speed log anomaly detection
US20230169345A1 (en) Multiscale dimensional reduction of data
US12050507B1 (en) System and method for data ingestion, anomaly detection and notification
Kumar SensAnalysis: A Big Data Platform for Vibration-Sensor Data Analysis
FR2960371A1 (en) METHOD AND DEVICE FOR ANALYZING DATA INTERCEPTED ON AN IP NETWORK FOR MONITORING THE ACTIVITY OF USERS OF A WEB SITE
FR3104781A1 (en) Device for detecting fake accounts on social networks
Takagiwa et al. Local Trend Detection from Network Traffic Using a Topic Model and Network Router
Yadranjiaghdam Developing A Real-time Data Analytics Framework For Twitter Streaming Data

Legal Events

Date Code Title Description
PLFP Fee payment

Year of fee payment: 2

PLSC Publication of the preliminary search report

Effective date: 20160812

PLFP Fee payment

Year of fee payment: 3

PLFP Fee payment

Year of fee payment: 4

PLFP Fee payment

Year of fee payment: 5

PLFP Fee payment

Year of fee payment: 6

PLFP Fee payment

Year of fee payment: 7

PLFP Fee payment

Year of fee payment: 8

PLFP Fee payment

Year of fee payment: 9

TP Transmission of property

Owner name: MANAGEO, FR

Effective date: 20230330