FR3099615A1 - INTERPRETABLE PREDICTION PROCESS BY LEARNING USING TIME SERIES - Google Patents

INTERPRETABLE PREDICTION PROCESS BY LEARNING USING TIME SERIES Download PDF

Info

Publication number
FR3099615A1
FR3099615A1 FR1908656A FR1908656A FR3099615A1 FR 3099615 A1 FR3099615 A1 FR 3099615A1 FR 1908656 A FR1908656 A FR 1908656A FR 1908656 A FR1908656 A FR 1908656A FR 3099615 A1 FR3099615 A1 FR 3099615A1
Authority
FR
France
Prior art keywords
rule
prediction
rules
time series
complexity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
FR1908656A
Other languages
French (fr)
Inventor
Geissler Chistophe
Chistophe GEISSLER
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Advestis
Original Assignee
Advestis
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Advestis filed Critical Advestis
Priority to FR1908656A priority Critical patent/FR3099615A1/en
Publication of FR3099615A1 publication Critical patent/FR3099615A1/en
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

Procédé d’apprentissage par ordinateur d’une commande d’un système technique, basé sur des séries temporelles sous la forme d’un échantillon de données Dn = (Xi, Yi)1 <=i<=n où pour tout i, Xi est un ensemble de variables explicatives et Yi une variable d’intérêt, caractérisé en ce qu’il comprend les étapes suivantes : - définition d’une règle testant si une réalisation de X est dans un hyperrectangle de l’espace des variables explicatives ; - définition de la complexité de la règle ; - discrétisation de l’espace des variables explicatives en M modalités ; - recherche récursive sur la complexité des règles jusqu’à une complexité maximale fixée ; - sélection d’un sous ensemble de règles avec prédiction supérieure à zéro et d’un sous ensemble de règles avec prédiction inférieure à zéro, en contrôlant leur chevauchement.Method of computer learning of a control of a technical system, based on time series in the form of a data sample Dn = (Xi, Yi) 1 <= i <= n where for all i, Xi is a set of explanatory variables and Yi a variable of interest, characterized in that it comprises the following steps: definition of a rule testing whether a realization of X is in a hyperrectangle of the space of the explanatory variables; - definition of the complexity of the rule; - discretization of the space of explanatory variables in M modalities; - recursive search on the complexity of the rules up to a fixed maximum complexity; - selection of a subset of rules with prediction greater than zero and of a subset of rules with prediction less than zero, by controlling their overlap.

Description

PROCEDE DE PREDICTION INTERPRETABLE PAR APPRENTISSAGE EXPLOITANT DES SERIES TEMPORELLESPREDICTION METHOD INTERPRETABLE BY LEARNING USING TIME SERIES

L’invention a trait aux algorithmes de prédiction, et plus particulièrement les algorithmes de prédiction exploitant des séries temporelles.The invention relates to prediction algorithms, and more particularly prediction algorithms using time series.

Par « séries temporelles » on désigne ici des données numériques évoluant dans le temps. L’indice temps peut être, selon les cas, par exemple la minute, l’heure, le jour, l’année.By “time series” is meant here digital data evolving over time. The time index can be, depending on the case, for example the minute, the hour, the day, the year.

Les séries temporelles sont des variables dont on dispose d’un échantillon de donnéesD n = (Xi,Yi)1<=i<=noù pour tout i désignant le temps,X i est un ensemble de variables explicatives ou covariables, etY i une variable d’intérêt.Time series are variables for which we have a data sample D n = ( Xi , Yi ) 1<=i<=n where for any i denoting time, X i is a set of explanatory variables or covariates, and Y i a variable of interest.

Par exemple, dans une utilisation pour la gestion d’actifs,Yest le rendement ou l’excès de rendement à un horizon H d’un groupe d’actifs S1, …SN, faisant partie d’un univers investissable U, l’ensemble des données étant indexé par TxU, où T est un intervalle temporel. Les covariables sont des attributs primaires des actifs (par exemple prix, capitalisation, rendement, prime de risque, volatilité), et des variables d’état dépendant seulement du temps (par exemple croissance et inflation d’un pays, taux d’intérêt sans risque).For example, in a use for asset management, Y is the return or excess return at a horizon H of a group of assets S 1 , …S N , forming part of an investable universe U, the data set being indexed by TxU, where T is a time interval. The covariates are primary attributes of assets (e.g. price, capitalization, return, risk premium, volatility), and time-dependent state variables (e.g. growth and inflation of a country, interest rate without risk).

Idéalement, la prédiction des séries temporelles consiste à modéliser le système qui a généré les données de la série, par exemple par un système d’équations mathématiques déterministes. En connaissant les conditions initiales, il serait alors possible de prévoir l’évolution du système.Ideally, time series prediction consists of modeling the system that generated the series data, for example by a system of deterministic mathematical equations. By knowing the initial conditions, it would then be possible to predict the evolution of the system.

Le plus souvent toutefois, les mécanismes ayant généré la série temporelle ne sont pas connus, et les seules informations disponibles sont les données passées. La modélisation se résume alors à imiter les facteurs générateurs de données, à partir des données passées, sans expliciter les mécanismes en action. Cette approche est à l’origine de la théorie statistique de l’apprentissage.Most often, however, the mechanisms that generated the time series are not known, and the only information available is past data. Modeling then boils down to imitating the data-generating factors, based on past data, without explaining the mechanisms in action. This approach is at the origin of the statistical theory of learning.

Un exemple d’application concerne les variables prédictives de séries temporelles boursières. Ces variables ne sont pas connues avec précision et le choix de ces variables peut résulter de plusieurs approches différentes, utilisant chacune une catégorie d’information spécifique. Nous en citerons quatre. Dans une première approche, la variation du prix est la conséquence de l’arrivée de nouvelles informations économiques affectant le mécanisme de formation du prix (par exemple les taux d’intérêt, l’inflation). Dans une deuxième approche, c’est l’information technique qui permet de prédire le mouvement du prix, et il convient d’analyser l’historique de l’indice boursier. Dans une troisième approche, les rendements boursiers ont une mémoire longue et il convient d’effectuer une analyse statistique de l’historique des rendements pour prédire les rendements futurs. Dans une quatrième approche, les principes psychologiques sont appliqués pour prédire le marché boursier, en prenant en compte par exemple l’excès de confiance, et plus largement les biais psychologiques dans les prises de décision.An example of application concerns the predictive variables of stock market time series. These variables are not known with precision and the choice of these variables may result from several different approaches, each using a specific category of information. We will cite four of them. In a first approach, the price variation is the consequence of the arrival of new economic information affecting the price formation mechanism (for example interest rates, inflation). In a second approach, it is the technical information that makes it possible to predict the movement of the price, and it is necessary to analyze the history of the stock market index. In a third approach, stock returns have a long memory and statistical analysis of historical returns should be performed to predict future returns. In a fourth approach, psychological principles are applied to predict the stock market, taking into account, for example, overconfidence, and more broadly psychological biases in decision-making.

Les séries temporelles sont omniprésentes et apparaissent par exemples en météorologie, en biologie ou en économie.Time series are ubiquitous and appear for example in meteorology, biology or economics.

La prédiction effectuée à partir des séries temporelles peut être utile, par exemples, pour la surveillance des patients dans les services médicaux, la détermination d’une charge de consommation d’énergie sur un réseau, l’optimisation de la valeur d’un portefeuille d’actifs, la surveillance de l’état des forêts, la communication d’un taux de pollution de l’air, la maintenance prédictive, la prédiction du trafic automobile.The prediction made from the time series can be useful, for example, for monitoring patients in medical services, determining an energy consumption load on a network, optimizing the value of a portfolio of assets, monitoring of the state of forests, communication of an air pollution rate, predictive maintenance, prediction of automobile traffic.

La prédiction la plus simple à partir de séries temporelles passe par des approches linéaires et le calcul d’indices, tels que par exemple des indices de tendance centrale (moyenne, médiane), des indices de dispersion (variance), des indices de dépendance (auto-covariance, auto-corrélation).The simplest prediction from time series involves linear approaches and the calculation of indices, such as, for example, central tendency indices (mean, median), dispersion indices (variance), dependence indices ( auto-covariance, auto-correlation).

L’on connait ainsi des modèles statistiques anciens de prédiction de séries temporelles univariées, ces modèles étant de type auto-régressifs (AR Auto-Regressive), moyenne mobile (MA Moving Average), ainsi que leurs combinaisons et variantes (AR I MA Au toregressive Integrated Moving Average,NARMA) et extension à la prédiction de séries temporelles multivariées, c’est-à-dire celles où plusieurs valeurs évoluent simultanément (VAR).We thus know old statistical models for predicting univariate time series, these models being of the auto-regressive type ( AR Auto-Regressive ), moving average ( MA Moving Average ), as well as their combinations and variants ( AR I MA Au toregressive Integrated Moving Average , NARMA ) and extension to the prediction of multivariate time series, i.e. those where several values move simultaneously ( VAR ).

Les approches linéaires classiques supposent que les séries temporelles sont stationnaires et qu’elles présentent des dépendances linéaires dans le temps.Classical linear approaches assume that time series are stationary and have linear dependencies over time.

Les régressions linéaires postulent une relation de dépendance globale entre la variable à expliquer Y et les variables liéesLinear regressions postulate a global dependency relationship between the variable to be explained Y and the related variables

où N est la dimension temporelle de l’échantillon d’observation, V est le nombre de covariables, Z est l’erreur d’estimation, A réalisewhere N is the time dimension of the observation sample, V is the number of covariates, Z is the estimation error, A realizes

Les régressions linéaires présentent plusieurs inconvénients, en particulier une fragilité aux valeurs manquantes. Par ailleurs, lorsque V est très supérieur à 1, les coefficients de régression sont incontrôlables. Cet inconvénient a conduit à pénaliser les coefficients en norme L1 (Lasso), ou L2 (Ridge), dans lesquels A réaliseLinear regressions have several drawbacks, in particular a fragility to missing values. Moreover, when V is much greater than 1, the regression coefficients are uncontrollable. This drawback led to penalizing the coefficients in norm L1 (Lasso), or L2 (Ridge), in which A realizes

αétant un paramètre de contrôle. α being a control parameter.

Le document Nazemi et al (Macroeconomic variable selection for creditor recovery rates, Journal of Banking & Finance, avril 2018, pp. 14-25) décrit l’utilisation de régressions linéaires pénalisées Lasso et Ridge.Nazemi et al ( Macroeconomic variable selection for creditor recovery rates, Journal of Banking & Finance, April 2018, pp. 14-25 ) describes the use of Lasso and Ridge penalized linear regressions.

L’on connait également des modèles non linéaires de prédiction de séries temporelles univariées (ARCH,GARCH).One also knows nonlinear models of prediction of univariate temporal series ( ARCH , GARCH ).

Les séries temporelles peuvent également être projetées dans des espaces définis par des descripteurs statiques, par exemple transformation de Fourier, par ondelettes, ou décompositions polynomiales.The time series can also be projected in spaces defined by static descriptors, for example Fourier transformation, by wavelets, or polynomial decompositions.

Les algorithmes d’intelligence artificielle pour la prédiction se sont largement développés ces dernières années, notamment pour la prédiction de l’état de santé de patients, même s’il existe des résistances à leur adoption.Artificial intelligence algorithms for prediction have been widely developed in recent years, particularly for the prediction of the state of health of patients, even if there is resistance to their adoption.

De tels algorithmes peuvent apparaître comme concurrents du personnel professionnel tel qu’un médecin ou un gérant d’actif, dans la mesure où ces algorithmes sont construits en vue d’éliminer des biais de jugement et de synthétiser des signaux contradictoires. De tels algorithmes peuvent en outre apparaître comme opaques dans leurs fonctionnements.Such algorithms may appear to be competitors of professional staff such as a doctor or an asset manager, insofar as these algorithms are built with a view to eliminating judgment biases and synthesizing contradictory signals. Such algorithms may also appear opaque in their operation.

L’invention concerne plus particulièrement les algorithmes de prédiction exploitant des séries temporelles issues de systèmes dynamiques qui présentent des irrégularités, par exemple des systèmes déterministes non-linéaires ou chaotiques.The invention relates more particularly to prediction algorithms exploiting time series from dynamic systems which present irregularities, for example non-linear or chaotic deterministic systems.

L’invention concerne également les algorithmes de prédiction exploitant des échantillons de donnéesD n = (X i ,Y i )1<=i<=noù pour tout i désignant le temps,X j est un ensemble de variables explicatives etY i une variable d’intérêt, les donnéesDétant modélisées par des variables aléatoires indépendantes, les suites de variables (X 1 ,Y 1 ), (X 2 ,Y 2 )…(X n ,Y n ) ne suivant une même loi inconnue.The invention also relates to prediction algorithms exploiting data samples D n = ( X i , Y i ) 1<=i<=n where for any i designating time, X j is a set of explanatory variables and Y i a variable of interest, the data D being modeled by independent random variables, the sequences of variables ( X 1 , Y 1 ), ( X 2 , Y 2 )…( X n , Y n ) do not follow the same unknown law .

L’invention trouve en outre des applications avantageuses lorsque l’indépendance des observations n’est pas réaliste ou peu probable, par exemple lorsque la variable d’intérêt est le taux de pollution de l’air, ou le rythme cardiaque d’un patient, ou encore la valeur d’un actif dans un portefeuille.The invention also finds advantageous applications when the independence of the observations is not realistic or unlikely, for example when the variable of interest is the level of air pollution, or the heart rate of a patient. , or the value of an asset in a portfolio.

L’invention concerne plus particulièrement les algorithmes de prédiction exploitant des séries temporelles et mettant en œuvre un apprentissage, c’est-à-dire la construction de règles pour le traitement automatique des données.The invention relates more particularly to prediction algorithms exploiting time series and implementing learning, that is to say the construction of rules for the automatic processing of data.

De tels algorithmes de prédiction ont été proposés dans l’état de la technique, en particulier machines à vecteur support, forêts aléatoires, réseaux de neurones.Such prediction algorithms have been proposed in the state of the art, in particular support vector machines, random forests, neural networks.

Les machines à vecteur support (SVM Support Vector Machine) travaillent à partir de classes de fonctions hypothèses, consistant en hyperplans d’un espace de caractéristiques, implicitement défini à partir de l’espace original, par une transformation non linéaire, construite via un noyau. L’algorithme SVM comprend une première phase d’apprentissage, consistant à déterminer un modèle de classification à partir des échantillons du jeu d’entraînement. Une deuxième phase consiste ensuite à appliquer le modèle à la totalité de la population à classer.Support vector machines ( SVM Support Vector Machine ) work from classes of hypothesis functions, consisting of hyperplanes of a feature space, implicitly defined from the original space, by a nonlinear transformation, built via a kernel . The SVM algorithm includes a first learning phase, consisting in determining a classification model from the samples of the training set. A second phase then consists of applying the model to the entire population to be classified.

Le document CN 105354644 (Univ Beijing) décrit l’utilisation d’une machine à vecteur support pour l’évaluation du risque financier.CN 105354644 (Univ Beijing) describes the use of a support vector machine for financial risk assessment.

Le document CN 106419936 (Shenzhen Oudmon Tech) décrit l’utilisation d’une machine à vecteur support pour l’évaluation de l’état émotionnel d’une personne, par analyse de séries temporelles de photopléthysmographie.Document CN 106419936 (Shenzhen Oudmon Tech) describes the use of a support vector machine for the evaluation of the emotional state of a person, by analysis of time series of photoplethysmography.

L’on peut également se référer au documentLee, Application of support vector machines to corporate credit rating prediction, Expert Systems with Applications 33, 67–74, 2013 . You can also refer to the document Lee, Application of support vector machines to corporate credit rating prediction, Expert Systems with Applications 33, 67–74, 2013 .

Les forêts aléatoires (RF Random Forest) mettent en œuvre une séparation des classes par un ensemble d’arbres de décision générés aléatoirement. Ces arbres de décision sont appliqués à des sous-ensembles du jeu d’entraînement en phase d’apprentissage. Le modèle final est ensuite appliqué à l’ensemble de la population à classer.Random forests ( RF Random Forest ) implement a separation of classes by a set of randomly generated decision trees. These decision trees are applied to subsets of the training game in the learning phase. The final model is then applied to the entire population to be classified.

Les réseaux de neurones (ANN Artificial Neural Networks) consistent en l’association en un graphe de neurones formels, modèles caractérisés par un état interne, des signaux d’entrée et une fonction d’activation effectuant une transformation d’une combinaison affine des signaux d’entrée. Cette combinaison est déterminée par un vecteur de poids associé à chaque neurone et dont les valeurs sont estimées durant la phase d’apprentissage. Pour obtenir un système totalement non linéaire, le réseau de neurones doit comporter au moins une couche intermédiaire, appelée généralement couche cachée.Neural networks ( ANN Artificial Neural Networks ) consist of the association of a graph of formal neurons, models characterized by an internal state, input signals and an activation function performing a transformation of an affine combination of signals of entry. This combination is determined by a weight vector associated with each neuron and whose values are estimated during the learning phase. To obtain a completely nonlinear system, the neural network must include at least one intermediate layer, generally called the hidden layer.

Le document WO 0115079 (Westport Financial LLC) décrit un système de prédiction de valeur de titres financiers (Tradetrek Neuro Predictor) utilisant un réseau de neurones.Document WO 0115079 (Westport Financial LLC) describes a system for predicting the value of financial securities (Tradetrek Neuro Predictor) using a neural network.

Le document US2018336452 (Sap) décrit un système de prédiction des incendies de forêt utilisant un réseau de neurones.Document US2018336452 (Sap) describes a forest fire prediction system using a neural network.

Le machine-learning et en particulier les réseaux de neurones a été proposé pour mieux comprendre et anticiper l’évolution des spreads de crédits (Ganguli et al, Better models for prediction of bond prices;Kishore, Machine Learning and Algorithmic Trading: In Fixed Income Markets, 2013).Machine-learning and in particular neural networks have been proposed to better understand and anticipate the evolution of credit spreads ( Ganguli et al, Better models for prediction of bond prices ; Kishore, Machine Learning and Algorithmic Trading: In Fixed Income Markets, 2013 ).

Les réseaux de neurones présentent plusieurs inconvénients. En particulier, il est a priori impossible de connaître l’influence effective d’une variable d’entrée sur le système, notamment dès qu’une couche cachée intervient. Ce fonctionnement en boite noire contraint fortement l’interprétation des résultats obtenus. Il semble par ailleurs que les performances des réseaux de neurones chutent lorsque l’on augmente l’horizon de prédiction ou lorsque l’on augmente la dimension des données.Neural networks have several drawbacks. In particular, it is a priori impossible to know the effective influence of an input variable on the system, in particular as soon as a hidden layer intervenes. This black box operation strongly constrains the interpretation of the results obtained. It also seems that the performance of neural networks drops when the prediction horizon is increased or when the dimension of the data is increased.

Les méthodes algorithmiques de l’état de la technique présentent plusieurs inconvénients.State-of-the-art algorithmic methods have several drawbacks.

En premier lieu, les algorithmes existants ne sont que peu voire pas interprétables ou transparents. En d’autres termes, ils ne permettent pas de connaître les variables d’entrée qui ont une influence sur la prédiction. Cet inconvénient est particulièrement présent pour les algorithmes mettant en œuvre des réseaux de neurones avec ou sans apprentissage profond.First, the existing algorithms are only slightly or not at all interpretable or transparent. In other words, they do not allow to know the input variables that have an influence on the prediction. This drawback is particularly present for algorithms implementing neural networks with or without deep learning.

En deuxième lieu, lorsque les algorithmes de l’état de la technique sont relativement interprétables ou transparents, leur capacité de prédiction est faible lorsque les relations entre variables d’entrée et variables de sortie sont complexes. Cet inconvénient est particulièrement présent pour les algorithmes mettant en œuvre des arbres de décision, ou des machines à vecteur support.Second, when state-of-the-art algorithms are relatively interpretable or transparent, their predictive ability is weak when the relationships between input variables and output variables are complex. This drawback is particularly present for algorithms implementing decision trees, or support vector machines.

En troisième lieu, les algorithmes existants ont une faible tolérance par rapport aux données manquantes. Or, les données réelles dans les différentes applications scientifiques, industrielles, médicales ou financières de prédiction présentent souvent des plages manquantes ou incomplètes. Un pré-traitement des données peut certes être effectué, en inférant les données manquantes à base d’heuristiques. Par exemple, la donnée manquante peut être remplacée par la moyenne des valeurs observées sur une séquence, ou par la dernière valeur observée sur la séquence. Ce pré-traitement est toutefois long et couteux.Third, existing algorithms have a low tolerance for missing data. However, the real data in the various scientific, industrial, medical or financial prediction applications often have missing or incomplete ranges. A pre-processing of the data can certainly be carried out, by inferring the missing data based on heuristics. For example, the missing data can be replaced by the average of the values observed on a sequence, or by the last value observed on the sequence. This pre-processing is however long and expensive.

L’invention concerne plus particulièrement les algorithmes d’intelligence artificielle, de prédiction, mettant en œuvre une construction de règles par agrégation supervisée.The invention relates more particularly to artificial intelligence algorithms, prediction, implementing a construction of rules by supervised aggregation.

De tels algorithmes sont connus dans l’art antérieur, sous différentes formes.Such algorithms are known in the prior art, in different forms.

Le document Patra (Apprentissage à grande échelle, contribution à l’étude d’algorithmes de clustering répartis asynchrones, 2012) propose de mesurer les performances d’une stratégie de prévision quantile à l’aide d’une fonction de perteThe Patra document ( Large-scale learning, contribution to the study of asynchronous distributed clustering algorithms, 2012 ) proposes to measure the performance of a quantile forecasting strategy using a loss function

une stratégie étant d’autant plus précise que la fonction de perte est petite. La stratégie de prévision repose sur une agrégation d’experts, chacun des prédicteurs fondamentaux étant fondé sur la technique des plus proches voisins, les prédictions étant agrégées avec des poids dépendant directement de leurs performances passées. Le poids d’un expert dans l’agrégat évolue ainsi au fur et à mesure du temps et est d’autant plus important que les prévisions passées de l’expert considéré ont été satisfaisantes. Selon Patra, cette stratégie de prévisiongest universellement convergente. En d’autres termes, pour tout processus stationnaire et ergodique on a la convergence suivantea strategy being all the more precise as the loss function is small. The forecasting strategy is based on an aggregation of experts, each of the fundamental predictors being based on the technique of the nearest neighbors, the predictions being aggregated with weights depending directly on their past performance. The weight of an expert in the aggregate thus evolves over time and is all the more important when the past forecasts of the expert considered have been satisfactory. According to Patra, this forecasting strategy g is universally convergent. In other words, for any stationary and ergodic process we have the following convergence

L*est la plus petite perte asymptotique moyenne possible pour une stratégie de prévision. Pour assurer la manipulation de grosses quantités de données, Patra propose un clustering, les séries temporelles étant séparées en sous-groupes présentant des similarités.where L* is the smallest possible average asymptotic loss for a forecasting strategy. To ensure the manipulation of large amounts of data, Patra offers clustering, the time series being separated into subgroups presenting similarities.

Le document Guedj (Agrégation d’estimateurs et de classificateurs : théorie et méthodes, 2013), rappelle que, selon le formalisme issu de la théorie de l’information, le risque associé à un estimateur, dans sa version empirique construite sur l’échantillonDnest notéThe Guedj document ( Aggregation of estimators and classifiers: theory and methods, 2013 ), recalls that, according to the formalism derived from information theory, the risk associated with an estimator, in its empirical version built on the sample Dn is noted

oulest la fonction de perte, par exemple quadratique. Guedj présente l’implémentation de méthodes d’agrégation à poids exponentiels.where l is the loss function, for example quadratic. Guedj presents the implementation of aggregation methods with exponential weights.

Une présentation des différentes stratégies d’agrégation d’experts peut être trouvée dans le documentSoltz Aggrégation séquentielle de prédicteurs : méthodologie générale et applications à la prévision de la qualité de l’air et à celle de la consommation électrique, Journal de la société française de statistique, vol 151, n°2, 2010.A presentation of the different expert aggregation strategies can be found in the Soltz document Sequential Aggregation of Predictors: General Methodology and Applications to Air Quality and Electricity Consumption Forecasting, Journal de la société française statistics, vol 151, n°2, 2010 .

Le document Margot et al (Rule Induction Partitioning Estimator, ISSN 0302-9743, pp 288-301) décrit un algorithme (RIPE) sélectionnant, à partir d’un échantillon (Xi, Yi)1<=i<=n, un ensemble de règles de type « Si A alors B », les conditions A étant des évènements du type {X ∈ r}, r étant un hyperrectangle. L’ensemble des hyperrectangles est ensuite transformé en une partition de l’espace permettant de construire un estimateur universellement consistant. L’algorithme sélectionne un sous ensemble de règles Sn dans un ensemble de règles générées sur la base d’une condition de minium de l’erreur moyenne de prédictionThe document Margot et al ( Rule Induction Partitioning Estimator, ISSN 0302-9743, pp 288-301 ) describes an algorithm ( RIPE ) selecting, from a sample (Xi, Yi) 1<=i<=n , a set rules of the type “If A then B”, the conditions A being events of the type {X ∈ r}, r being a hyperrectangle. The set of hyperrectangles is then transformed into a partition of the space allowing to build a universally consistent estimator. The algorithm selects a subset of rules Sn from a set of rules generated on the basis of a minimum condition of the mean prediction error

La demanderesse a constaté que l’algorithme RIPE n’exploite pas de manière satisfaisante la structure temporelle des données et n’est pas adapté à la recherche d’évènements rares à forte intensité ou à la recherche d’évènements récurrents mais à signaux faibles.The applicant has found that the RIPE algorithm does not satisfactorily exploit the temporal structure of the data and is not suitable for the search for rare high-intensity events or for the search for recurring events but with weak signals.

L’invention vise à pallier les inconvénients des algorithmes connus dans l’état de la technique, pour la prédiction à partir de séries temporelles.The invention aims to overcome the drawbacks of algorithms known in the state of the art, for prediction from time series.

Un premier objet de l’invention est une méthode algorithmique d’exploitation de séries temporelles ne présentant pas les inconvénients des méthodes antérieures et permettant en particulier une prévision interprétable.A first object of the invention is an algorithmic method for the exploitation of time series that does not have the drawbacks of previous methods and in particular allows an interpretable forecast.

Un deuxième objet de l’invention est une méthode algorithmique d’exploitation de séries temporelles permettant le traitement de données structurées massives.A second object of the invention is an algorithmic method for the exploitation of time series allowing the processing of massive structured data.

Un troisième objet de l’invention est une méthode algorithmique d’exploitation de séries temporelles par apprentissage.A third object of the invention is an algorithmic method for exploiting time series by learning.

Un autre objet de l’invention est de fournir un tel algorithme permettant de révéler les variables influentes dans la prévision, et donc dans les décisions prises sur la base de ces prévisions.Another object of the invention is to provide such an algorithm making it possible to reveal the influential variables in the forecast, and therefore in the decisions taken on the basis of these forecasts.

A ces fins, il est proposé, selon un premier aspect, un procédé d’apprentissage par ordinateur d’une commande d’un système technique, basé sur des séries temporelles sous la forme d’un échantillon de donnéesD n = (Xi, Yi)1 <=i<=noù pour tout i,X i est un ensemble de variables explicatives etY i une variable d’intérêt, le procédé comprenant les étapes suivantes :For these purposes, it is proposed, according to a first aspect, a computer learning method of a control of a technical system, based on time series in the form of a data sample D n = (Xi, Yi) 1 <=i<=n where for all i, X i is a set of explanatory variables and Y i a variable of interest, the method comprising the following steps:

- définition d’une règle testant si une réalisation de X est dans un hyperrectangle de l’espace des variables explicatives ;- definition of a rule testing whether a realization of X is in a hyperrectangle of the space of explanatory variables;

- définition de la complexité de la règle ;- definition of the complexity of the rule;

- discrétisation de l’espace des variables explicatives en M modalités ;- discretization of the space of explanatory variables in M modalities;

- recherche récursive sur la complexité des règles jusqu’à une complexité maximale fixée ;- recursive search on the complexity of the rules up to a fixed maximum complexity;

- sélection d’un sous ensemble de règles avec prédiction supérieure à zéro et d’un sous ensemble de règles avec prédiction inférieure à zéro, en contrôlant leur chevauchement.- selection of a subset of rules with prediction greater than zero and a subset of rules with prediction less than zero, by controlling their overlap.

Une règle est ainsi un objet de typeA rule is thus an object of type

tel quesuch as

  • la conditionSiteste si une réalisation de X est dans un hyperrectangle de l’espace des variables explicativesthe condition If tests whether a realization of X is in a hyperrectangle of the space of explanatory variables

  • l’implication est la valeur prédite par la règle sur la condition est vérifiée, avecimplication is the value predicted by the rule on the condition is verified, with

  • la complexité d’une règle étant définie parthe complexity of a rule being defined by

Le procédé comprend avantageusement une détermination de l’acceptabilité d’une règle, cette détermination comprenant les étapes suivantes :The method advantageously comprises a determination of the acceptability of a rule, this determination comprising the following steps:

- calcul de la couverture de la règle ;- calculation of the coverage of the rule;

- calcul de la significativité de la règle ;- calculation of the significance of the rule;

- vérification de ce que la couverture de la règle est comprise entre deux valeurs prédéterminées ;- verification that the coverage of the rule is between two predetermined values;

- vérification de ce que la significativité de la règle est supérieure à une valeur prédéterminée ;- verification that the significance of the rule is greater than a predetermined value;

- calcul d’un gain pénalisé.- calculation of a penalized gain.

Une règle est acceptable uniquement si la condition de couverture, la condition de significativité, et la condition sur les gains sont vérifiées.A rule is acceptable only if the coverage condition, the materiality condition, and the earnings condition are met.

La condition de significativité peut ainsi être avantageusement exprimée comme suit :The significance condition can thus advantageously be expressed as follows:

La condition de couverture peut avantageusement être exprimée comme suit :The coverage condition can advantageously be expressed as follows:

La condition sur les gains peut être exprimée comme suit :The earnings condition can be expressed as follows:

où Δ est une période fixée etγ rune pénalisation dépendante de la règle.where Δ is a fixed period and γ r a rule-dependent penalty.

D’autres objets et avantages de l’invention apparaîtront à la lumière de la description de modes de réalisation, faite ci-après.Other objects and advantages of the invention will become apparent in the light of the description of embodiments given below.

L’invention propose un algorithme de prédiction exploitant des données de séries temporelles, l’algorithme mettant en œuvre un apprentissage, c’est-à-dire la construction de règles de décision et d’inférence pour le traitement automatique des données.The invention proposes a prediction algorithm exploiting time series data, the algorithm implementing learning, that is to say the construction of decision and inference rules for the automatic processing of data.

Les séries temporelles sont des variables dont on dispose d’un échantillon de donnéesD n = (Xi, Yi)1 <=i<=noù pour tout i,X i est un ensemble de variables explicatives etY i une variable d’intérêt.Time series are variables for which we have a sample of data D n = (Xi, Yi) 1 <=i<=n where for all i, X i is a set of explanatory variables and Y i a variable of interest.

L’on souhaite prédireYconditionnellement àX.We want to predict Y conditionally on X .

Les observations (Xi, Yi)1<=i<=nsont modélisées par des variables aléatoires.The observations (Xi, Yi) 1<=i<=n are modeled by random variables.

On suppose que les variables explicatives et les variables d’intérêts appartiennent à des ensembles mesurables.It is assumed that the explanatory variables and the variables of interest belong to measurable sets.

Les observations sont modélisées par des variables aléatoires suivant une même loi ou non, indépendantes ou non.The observations are modeled by random variables following the same law or not, independent or not.

L’hypothèse d’indépendance des observations n’est pas retenue lorsque le phénomène observé la rend peu réaliste, comme par exemple dans le cas de la surveillance de la pollution de l’air.The assumption of independence of observations is not retained when the observed phenomenon makes it unrealistic, as for example in the case of monitoring air pollution.

Pour une application mesurable appelée prédicteur est défini un risque et la prévision consiste à trouver, à l’aide des donnéesD n uniquement, un prédicteur tel que son risque est minimal.For a measurable application called a predictor, a risk is defined and the prediction consists in finding, using the data D n only, a predictor such that its risk is minimal.

La loi suivie par les variables étant inconnue, le risque est celui d’une règle d’apprentissage (ou estimateur) lié à l’échantillonD n défini parThe law followed by the variables being unknown, the risk is that of a learning rule (or estimator) linked to the sample D n defined by

Dans l’algorithme, la fonction de contrastecest avantageusement la fonction de contraste quadratique.In the algorithm, the contrast function c is advantageously the quadratic contrast function.

Un expert fide poids Πiest une fonction constante en son premier argument et qui vaut l’espérance empirique deYsachantX:An expert f i of weight Π i is a constant function in its first argument and which equals the empirical expectation of Y given X :

Au moins un sous ensemble d’expert est identifié par minimum de contraste, soitAt least one expert subset is identified by minimum contrast, i.e.

en prenant le contraste quadratique.taking the quadratic contrast.

Le prédicteur est construit sous la forme d’une agrégation d’experts, via une stratégie SThe predictor is constructed as an aggregation of experts, via a strategy S

avecwith

Le prédicteur peut ainsi s’écrire aussi sous la forme d’un estimateur linéaire de la fonction de régression :The predictor can thus also be written in the form of a linear estimator of the regression function:

avecwith

L’on dispose ainsi d’un estimateur de la fonction de régression et d’un prédicteur ayant des performances comparables à celles de la meilleure combinaison convexe du sous ensemble d’experts identifié.We thus have an estimator of the regression function and a predictor with performances comparable to those of the best convex combination of the identified subset of experts.

Le procédé selon l’invention d’apprentissage par ordinateur permet une commande d’un système technique.The method according to the invention of computer learning enables control of a technical system.

Le système technique est par exemple un système d’alerte à usage médical, signalant un risque pour un patient, au vu de l’analyse de séries temporelles de rythmes cardiaque.The technical system is for example an alert system for medical use, signaling a risk for a patient, in view of the analysis of time series of heart rhythms.

Le système technique est, dans un autre exemple, un système de trading.The technical system is, in another example, a trading system.

Le procédé selon l’invention est basé sur l’analyse de séries temporelles sous la forme d’un échantillon de donnéesD n = (Xi, Yi)1 <=i<=noù pour tout i,X i est un ensemble de variables explicatives etY i une variable d’intérêt.The method according to the invention is based on the analysis of time series in the form of a sample of data D n = (Xi, Yi) 1 <=i<=n where for all i, X i is a set of explanatory variables and Y i a variable of interest.

Le procédé comprend les étapes suivantes :The process includes the following steps:

- définition d’une règle testant si une réalisation de X est dans un hyperrectangle de l’espace des variables explicatives ;- definition of a rule testing whether a realization of X is in a hyperrectangle of the space of explanatory variables;

- définition de la complexité de la règle ;- definition of the complexity of the rule;

- discrétisation de l’espace des variables explicatives en M modalités ;- discretization of the space of explanatory variables in M modalities;

- recherche récursive sur la complexité des règles jusqu’à une complexité maximale fixée ;- recursive search on the complexity of the rules up to a fixed maximum complexity;

- sélection d’un sous ensemble de règles avec prédiction supérieure à zéro et d’un sous ensemble de règles avec prédiction inférieure à zéro, en contrôlant leur chevauchement.- selection of a subset of rules with prediction greater than zero and a subset of rules with prediction less than zero, by controlling their overlap.

Une règle est ainsi un objet de typeA rule is thus an object of type

tel quesuch as

  • la conditionSiteste si une réalisation de X est dans un hyperrectangle de l’espace des variables explicativesthe condition If tests whether a realization of X is in a hyperrectangle of the space of explanatory variables

  • l’implication est la valeur prédite par la règle sur la condition est vérifiée, avecimplication is the value predicted by the rule on the condition is verified, with

  • la complexité d’une règle étant définie parthe complexity of a rule being defined by

Le procédé comprend avantageusement une détermination de l’acceptabilité d’une règle, cette détermination comprenant les étapes suivantes :The method advantageously comprises a determination of the acceptability of a rule, this determination comprising the following steps:

- calcul de la couverture de la règle ;- calculation of the coverage of the rule;

- calcul de la significativité de la règle ;- calculation of the significance of the rule;

- vérification de ce que la couverture de la règle est comprise entre deux valeurs prédéterminées ;- verification that the coverage of the rule is between two predetermined values;

- vérification de ce que la significativité de la règle est supérieure à une valeur prédéterminée ;- verification that the significance of the rule is greater than a predetermined value;

- calcul d’un gain pénalisé.- calculation of a penalized gain.

Une règle est acceptable uniquement si la condition de couverture, la condition de significativité, et la condition sur les gains sont vérifiées.A rule is acceptable only if the coverage condition, the materiality condition, and the earnings condition are met.

La condition de significativité peut ainsi être avantageusement exprimée comme suitThe significance condition can thus advantageously be expressed as follows

La condition de couverture peut avantageusement être exprimée comme suit :The coverage condition can advantageously be expressed as follows:

La condition sur les gains peut être exprimée comme suit :The earnings condition can be expressed as follows:

où Δ est une période fixée etγ rune pénalisation dépendante de la règle.where Δ is a fixed period and γ r a rule-dependent penalty.

Les algorithmes selon l’invention exploitent ainsi la structure temporelle des données, au moyen d’une fonction de gain pénalisée.The algorithms according to the invention thus exploit the temporal structure of the data, by means of a penalized gain function.

La fonction de gain pénalisée combine avantageusement l’espérance conditionnelle des règles, leur fréquence d’occurrence et une mesure de la régularité spectrale des activations des règles.The penalized gain function advantageously combines the conditional expectation of the rules, their frequency of occurrence and a measure of the spectral regularity of the rule activations.

L’invention permet ainsi de prendre en compte l’intensité et la fréquence des signaux, pour la recherche d’évènements rares à forte intensité et la recherche de signaux faibles et récurrents.The invention thus makes it possible to take into account the intensity and the frequency of the signals, for the search for rare high-intensity events and the search for weak and recurrent signals.

Application à l’extraction de signaux prédictifs : exemple des notations ESGApplication to the extraction of predictive signals: example of ESG ratings

Une application de l’invention est l’extraction de signaux prédictifs à partir de données extra financières portant sur des entreprises, par exemple les notations au regard de la politique RSE des organisations.One application of the invention is the extraction of predictive signals from extra-financial data relating to companies, for example ratings with regard to the CSR policy of organizations.

Une première difficulté dans cette application est que les paramètres à prendre en compte pour estimer les actions RSE des entreprises sont nombreux et de natures très variées.A first difficulty in this application is that the parameters to be taken into account to estimate the CSR actions of companies are numerous and very varied in nature.

Cet état de fait résulte de la définition donnée à cette notion de RSE.This state of affairs results from the definition given to this notion of CSR.

La Commission européenne a défini en 2011 la notion de responsabilité sociale et environnementale (RSE) comme la responsabilité des entreprises vis-à-vis des effets qu’elles exercent sur la société.In 2011, the European Commission defined the concept of social and environmental responsibility (CSR) as the responsibility of companies for the effects they have on society.

La Commission européenne estime que pour s’acquitter pleinement de leur responsabilité sociale, il convient que les entreprises aient engagé, en collaboration étroite avec leurs parties prenantes, un processus destiné à intégrer les préoccupations en matière sociale, environnementale, éthique, de droits de l’Homme et de consommateurs dans leurs activités commerciales et leur stratégie de base.The European Commission considers that in order to fully discharge their social responsibility, companies should have initiated, in close cooperation with their stakeholders, a process intended to integrate social, environmental, ethical and human rights concerns. 'Man and consumers in their business activities and their basic strategy.

L’ISO définit la RSE comme la responsabilité d’une organisation vis-à-vis des impacts de ses décisions et activités sur la société et sur l’environnement, se traduisant par un comportement éthique et transparent qui contribue au développement durable, y compris à la santé et au bien-être de la société, prend en compte les attentes des parties prenantes, respecte les lois en vigueur et qui est en accord avec les normes internationales de comportement, et qui est intégré dans l’ensemble de l’organisation et mis en œuvre dans ses relations.ISO defines CSR as the responsibility of an organization for the impacts of its decisions and activities on society and the environment, resulting in ethical and transparent behavior that contributes to sustainable development, including to the health and well-being of society, takes into account the expectations of stakeholders, respects the laws in force and which is in accordance with international standards of behavior, and which is integrated throughout the organization and implemented in its relationships.

Ces définitions regroupent un large éventail de pratiques RSE que sont les facteurs environnementaux, sociaux et de gouvernance (facteurs dits ESG).These definitions bring together a wide range of CSR practices that are environmental, social and governance factors (so-called ESG factors).

La dimension environnementale renvoie à l’incorporation dans la conception, la production et la distribution des produits de pratiques relatives à la prévention et au contrôle de la pollution ; la protection des ressources en eau ; la conservation de la biodiversité ; la gestion des déchets ; la gestion de la pollution locale ou encore la gestion des impacts environnementaux du transport.The environmental dimension refers to the incorporation into the design, production and distribution of products of practices relating to the prevention and control of pollution; protection of water resources; biodiversity conservation; Waste Management ; the management of local pollution or the management of the environmental impacts of transport.

La dimension sociale renvoie aux pratiques innovantes de gestion des ressources humaines (formation et gestion des carrières, participation des salariés, qualité des conditions de travail) et peut inclure également les contributions aux causes d’intérêt général et local ; le respect des droits de l’homme ou encore l’élimination du travail des enfants.The social dimension refers to innovative human resources management practices (training and career management, employee participation, quality of working conditions) and may also include contributions to causes of general and local interest; respect for human rights or the elimination of child labour.

Enfin, la dimension gouvernance renvoie aux pratiques des entreprises vis-à-vis de leurs actionnaires (respect du droit des actionnaires, promotion de l’indépendance et la compétence des administrateurs, transparence de la rémunération des cadres dirigeants) et peut être étendue aux comportements sur les marchés et vis-à-vis des clients et des fournisseurs (prévention des conflits d’intérêt et des pratiques de corruption ou anticoncurrentielles ; sécurité des produits ; information donnée aux consommateurs sur les produits ; diffusion des bonnes pratiques dans l’ensemble de la chaîne de valeur en amont et en aval de la production).Finally, the governance dimension refers to the practices of companies vis-à-vis their shareholders (respect for shareholders' rights, promotion of the independence and competence of directors, transparency of the remuneration of senior executives) and can be extended to behavior on the markets and vis-à-vis customers and suppliers (prevention of conflicts of interest and corrupt or anti-competitive practices; product safety; information given to consumers on products; dissemination of best practices throughout the value chain upstream and downstream of production).

Une deuxième difficulté est que la collecte des données ESG et leur analyse pour aboutir à une notation finale ne sont pas des processus normalisés.A second difficulty is that the collection of ESG data and its analysis to arrive at a final rating are not standardized processes.

Chaque agence de notation (Sustainanalytics, Msci, Iss-Oekom, Core rating, Vigeo-Eiris, Trucost, Ethi Finance, Innovest, Rep Risk) dispose de sa propre méthodologie d’analyse.Each rating agency (Sustainanalytics, Msci, Iss-Oekom, Core rating, Vigeo-Eiris, Trucost, Ethi Finance, Innovest, Rep Risk ) has its own analysis methodology.

Une troisième difficulté est que le lien entre performance financière et critères extra financiers a été étudié depuis plus de trente ans et fait l’objet de débats. Les résultats ne sont pas unanimes, les récentes méta-analyses s’accordant uniquement à dire que l’intégration de critères ESG dans les choix d’investissement ne réduit pas nécessairement la performance financière.A third difficulty is that the link between financial performance and extra-financial criteria has been studied for more than thirty years and is the subject of debate. The results are not unanimous, with recent meta-analyses only agreeing that the integration of ESG criteria into investment choices does not necessarily reduce financial performance.

Margolis et al. ont réalisé une méta-analyse de 167 études portant sur 192 relations entre politique ESG et rentabilité financière. Globalement, leur conclusion est que l'effet de la performance sociale sur la performance financière est petit, positif et significatif. La performance RSE ne détruit pas la valeur actionnariale, même si ses effets sur la valeur de l'entreprise ne sont pas élevés (Margolis et al, Does it Pay to Be Good...And Does it Matter? A Meta-Analysis of the Relationship between Corporate Social and Financial Performance, SSRN Electronic Journal, 2009).Margolis et al. carried out a meta-analysis of 167 studies on 192 relationships between ESG policy and financial profitability. Overall, their conclusion is that the effect of social performance on financial performance is small, positive and significant. CSR performance does not destroy shareholder value, even if its effects on firm value are not high ( Margolis et al, Does it Pay to Be Good...And Does it Matter? A Meta-Analysis of the Relationship between Corporate Social and Financial Performance, SSRN Electronic Journal, 2009 ).

Orlitzky et al. ont réalisé une méta-analyse de 52 études montrant qu’un niveau d’engagement RSE plus élevé à tendance à être associé à une diminution du risque financier (Orlitzky et al. Corparate social and financial performance : a meta-analysis, 2003).Orlitzky et al. carried out a meta-analysis of 52 studies showing that a higher level of CSR commitment tends to be associated with a reduction in financial risk ( Orlitzky et al. Corparate social and financial performance: a meta-analysis, 2003 ).

Une autre méta-analyse, réalisée en 2014 par l’université d’Oxford à partir de 190 publications montre que 90 % des études concluent que l’intégration de critères ESG permet de diminuer le coût du capital, 80% montrent une relation positive entre les rentabilités des cours et les pratiques.Another meta-analysis, carried out in 2014 by the University of Oxford from 190 publications shows that 90% of studies conclude that the integration of ESG criteria makes it possible to reduce the cost of capital, 80% show a positive relationship between profitability of courses and practices.

Ces études montrent que les investisseurs demandent une prime de risque lors d'investissements dans des entreprises n’ayant pas une politique ESG active, ce qui est cohérent avec d’autres travaux de recherche (Girerd-Potin et al, Which dimensions of social responsibility concern financial investors?, Journal of Business Ethics 121, 559–576, 2014).These studies show that investors demand a risk premium when investing in companies that do not have an active ESG policy, which is consistent with other research ( Girerd-Potin et al, Which dimensions of social responsibility concern financial investors?, Journal of Business Ethics 121, 559–576, 2014 ).

Dans une étude des relations entre la performance économique et financière des entreprises et l’investissement socialement responsable ISR, Lapointe examine l’impact des stratégies d’ISR sur des portefeuilles sous contraintes (minimisation de la variance, rentabilité minimum exigée) et montre que le niveau d’engagement dans une politique de RSE d’une entreprise peut influer sur la liquidité de ses titres et sur la taille de sa base d’investisseur(Lapointe, Essays on corporate Social Responsibility and socially responsible Investment, thèse 2013). In a study of the relationship between the economic and financial performance of companies and socially responsible SRI investment, Lapointe examines the impact of SRI strategies on constrained portfolios (minimization of variance, minimum return required) and shows that the level of commitment to a company's CSR policy can influence the liquidity of its securities and the size of its investor base (Lapointe, Essays on corporate Social Responsibility and socially responsible Investment, thesis 2013).

Le lien entre performance financière et critères extra financiers, bien qu’étudié depuis plusieurs décennies, n’est pas démontré sur le plan théorique.The link between financial performance and extra-financial criteria, although studied for several decades, has not been demonstrated on a theoretical level.

Une quatrième difficulté est l’absence de démonstration empirique d’un lien entre performance extra-financière et performance financière.A fourth difficulty is the lack of empirical demonstration of a link between extra-financial performance and financial performance.

Pour une telle approche empirique, différentes méthodologies ont été utilisées, par exemple :For such an empirical approach, different methodologies have been used, for example:

  • impact sur la performance financière d’une entreprise, sur le cout du capital (El Ghoul et al, Does corporate social responsibility affect the cost of capital?, Journal of Banking & Finance 35, 2388–2406, 2011) ;impact on the financial performance of a company, on the cost of capital ( El Ghoul et al, Does corporate social responsibility affect the cost of capital?, Journal of Banking & Finance 35, 2388–2406, 2011 );
  • comparaison de performances des fonds ISR par rapport aux fonds classiques (Climent et al, Green and good? The investment performance of US environmental mutual funds, Journal of Business Ethics 103, 275–287, 2011),comparison of the performance of SRI funds compared to traditional funds ( Climent et al, Green and good? The investment performance of US environmental mutual funds, Journal of Business Ethics 103, 275–287, 2011 ),

Cependant toutes ces études se heurtent à de nombreuses limites.However, all of these studies face numerous limitations.

La première concerne la quantité et la qualité des données relatives aux performances extra-financières.The first concerns the quantity and quality of data relating to extra-financial performance.

En effet, il s’agit de données très récentes, peu structurées, parfois difficilement quantifiables.Indeed, this is very recent data, unstructured, sometimes difficult to quantify.

Il n’y a pas non plus de consensus sur la manière d’agréger ces données, par exemple pour créer des indices propres à chaque dimension ESG.There is also no consensus on how to aggregate this data, for example to create indices specific to each ESG dimension.

Deuxièmement, l’aspect multi dimensionnel de l’ISR est difficile à appréhender : certaines variables peuvent être corrélées ou omises (risque d’endogénéité) (Crifo et al, ESG, stratégies d’entreprise et performance financière, ISR & Finance Responsable, 2014).Secondly, the multidimensional aspect of SRI is difficult to grasp: certain variables may be correlated or omitted (risk of endogeneity) ( Crifo et al, ESG, corporate strategies and financial performance, ISR & Finance Responsable, 2014 ).

Il est donc difficile de déduire des liens de causalité.It is therefore difficult to infer causal links.

Une autre critique concerne l’hypothèse de relation linéaire entre les variables, hypothèse propre aux modèles de régression multifactorielles qui sont les plus utilisés en économétrie.Another criticism concerns the hypothesis of a linear relationship between the variables, a hypothesis specific to the multifactorial regression models which are the most used in econometrics.

Le procédé selon l’invention permet de montrer l’existence d’un lien entre performance financière et critères extra financiers de type ESG.The method according to the invention makes it possible to show the existence of a link between financial performance and extra-financial criteria of the ESG type.

Le procédé selon l’invention est ainsi avantageusement utilisé dans l’extraction de signaux prédictifs pour la gestion d’actifs.The method according to the invention is thus advantageously used in the extraction of predictive signals for asset management.

Avantageusement, la mise en œuvre du procédé est effectuée en plusieurs étapes.Advantageously, the implementation of the method is carried out in several stages.

Dans une première étape, une première preuve de concept est effectuée sur la base d’une simulation de portefeuilles.In a first step, a first proof of concept is carried out on the basis of a portfolio simulation.

Dans une deuxième étape, une extension de la preuve de concept est effectuée, à des données de notes d’analystes sur les sociétés, ces données présentant une qualité très supérieure aux données brutes issues du web ou des réseaux sociaux.In a second step, an extension of the proof of concept is carried out, to data from analysts' notes on companies, this data having a much higher quality than raw data from the web or social networks.

Dans une troisième étape, un module de visualisation est créé, présentant les indications données par l’algorithme d’apprentissage et s’appuyant sur un algorithme de recherche de configurations proches d’une configuration donnée, dans une base historique.In a third step, a visualization module is created, presenting the indications given by the learning algorithm and based on a search algorithm for configurations close to a given configuration, in a historical database.

ApplicationApplication àTo l’extractionextraction de signaux prédictifs : exemple duof predictive signals: example of suivi de patientspatient follow-up

Une autre application de l’invention est l’extraction de signaux prédictifs à partir de données portant sur des patients, par exemple en service de réanimation. Les données sont par exemple le rythme cardiaque.Another application of the invention is the extraction of predictive signals from data relating to patients, for example in intensive care units. The data is for example the heart rate.

Lorsque des décisions médicales sont prises sur la base de prévisions fournies par des algorithmes, les exigences des assureurs et les attentes des familles ne sont pas compatibles avec un fonctionnement de type boite noire, dans lequel aucune indication ne peut être trouvée sur les variables ayant participé à une prédiction.When medical decisions are made on the basis of forecasts provided by algorithms, the requirements of insurers and the expectations of families are not compatible with a black box type operation, in which no indication can be found on the variables having participated. to a prediction.

Avantages deBenefits of ss algorithmealgorithm s selon l’inventions according to the invention

Les algorithmes d’apprentissage supervisé qui viennent d’être décrits permettent d’expliquer une performance, par exemple d’actifs, à partir d’un échantillon de covariables.The supervised learning algorithms that have just been described make it possible to explain a performance, for example of assets, from a sample of covariates.

Les algorithmes selon l’invention présentent de nombreux avantages :The algorithms according to the invention have many advantages:

  • capacité à traiter un grand nombre de covariables ;ability to process a large number of covariates;
  • tolérance vis-à-vis de données manquantes, contrairement aux machines à vecteur support (SVM), et aux régressions linéaires ;tolerance towards missing data, unlike support vector machines (SVM), and linear regressions;
  • rendre compte d’effets de seuils sur des variables, contrairement aux machines à vecteur support (SVM), aux régressions linéaires, et aux approches topologiques de type plus proche voisin ;take into account the effects of thresholds on variables, unlike support vector machines (SVM), linear regressions, and nearest-neighbor topological approaches;
  • rendre compte de dépendances non linéaires ;account for non-linear dependencies;
  • traçabilité et parcimonie du modèle prédictif ;traceability and parsimony of the predictive model;
  • pas d’hypothèse sur la distribution statistique des variables ;no assumption on the statistical distribution of the variables;
  • pas d’a priori sur une hiérarchie inter variables, contrairement aux arbres de décision ;no a priori on an inter-variable hierarchy, unlike decision trees;
  • évolutivité en fonction de nouvelles données ;scalability based on new data;
  • fournir des prédicteurs concurrents et partiellement corrélés.provide concurrent and partially correlated predictors.

Les algorithmes d’apprentissage selon l’invention sont déterministes et interprétables par tous, contrairement aux machines à vecteur support, aux forêts aléatoires et aux réseaux de neurones.The learning algorithms according to the invention are deterministic and interpretable by all, unlike support vector machines, random forests and neural networks.

Par interprétable, on souligne ici qu’une personne peut comprendre la logique ayant conduit à la prédiction fournie par l’algorithme.By interpretable, we emphasize here that a person can understand the logic that led to the prediction provided by the algorithm.

Les algorithmes selon l’invention sont adaptés à des données qualitatives et quantitatives.The algorithms according to the invention are adapted to qualitative and quantitative data.

L’agrégation d’experts fournit un prédicteur dont les performances sont comparables à celle de la meilleure combinaison convexe.Expert aggregation provides a predictor whose performance is comparable to that of the best convex combination.

La construction du prédicteur permet de l’exprimer comme un estimateur de la fonction de régression.The construction of the predictor allows it to be expressed as an estimator of the regression function.

Les algorithmes selon l’invention permettent d’éviter les biais de jugement, et permettent une synthèse de signaux contradictoires.The algorithms according to the invention make it possible to avoid judgment biases, and allow a synthesis of contradictory signals.

Les algorithmes selon l’invention permettent d’extraire les bons signaux d’une masse de données pour enrichir la variété des données, incorporer des indicateurs propriétaires.The algorithms according to the invention make it possible to extract the right signals from a mass of data to enrich the variety of data, to incorporate proprietary indicators.

Les algorithmes selon l’invention ne fonctionnent pas en boite noire, et leur fonctionnement peut être expliqué par les utilisateurs. Ils permettent une représentation des tendances et de leurs intermittences.The algorithms according to the invention do not operate in a black box, and their operation can be explained by users. They allow a representation of trends and their intermittences.

L’utilisation des algorithmes selon l’invention permet de fournir des prévisions interprétables.The use of the algorithms according to the invention makes it possible to provide interpretable forecasts.

Cette performance est avantageuse dans de nombreux secteurs.This performance is advantageous in many sectors.

En effet, par exemple, lorsque des décisions d’investissement sont prises sur la base de prévisions fournies par des algorithmes, les exigences réglementaires de traçabilité des décisions et de suivi des risques ne sont pas compatibles avec un fonctionnement de type boite noire, dans lequel aucune indication ne peut être trouvée sur les variables ayant participé à une prédiction.Indeed, for example, when investment decisions are taken on the basis of forecasts provided by algorithms, the regulatory requirements for the traceability of decisions and the monitoring of risks are not compatible with a black box type operation, in which no indication can be found on the variables that participated in a prediction.

Claims (5)

Procédé d’apprentissage par ordinateur d’une commande d’un système technique, basé sur des séries temporelles sous la forme d’un échantillon de donnéesD n = (Xi, Yi)1<=i<=noù pour tout i,X i est un ensemble de variables explicatives etY i une variable d’intérêt, caractérisé en ce qu’il comprend les étapes suivantes :
  • définition d’une règle testant si une réalisation de X est dans un hyperrectangle de l’espace des variables explicatives ;
  • définition de la complexité de la règle ;
  • discrétisation de l’espace des variables explicatives en M modalités ;
  • recherche récursive sur la complexité des règles jusqu’à une complexité maximale fixée ;
  • sélection d’un sous ensemble de règles avec prédiction supérieure à zéro et d’un sous ensemble de règles avec prédiction inférieure à zéro, en contrôlant leur chevauchement.
Method for learning by computer a control of a technical system, based on time series in the form of a data sampleD not = (Xi, Yi)1<=i<=nwhere for all i,X I is a set of explanatory variables andY I a variable of interest, characterized in that it comprises the following steps:
  • definition of a rule testing whether a realization of X is in a hyperrectangle of the space of explanatory variables;
  • definition of rule complexity;
  • discretization of the space of explanatory variables in M modalities;
  • recursive search on the complexity of the rules up to a fixed maximum complexity;
  • selection of a subset of rules with prediction greater than zero and of a subset of rules with prediction less than zero, by controlling their overlap.
Procédé selon la revendication 1, caractérisé en ce qu’il comprend une détermination de l’acceptabilité d’une règle, cette détermination comprenant les étapes suivantes :
- calcul de la couverture de la règle ;
- calcul de la significativité de la règle ;
- vérification de ce que la couverture de la règle est comprise entre deux valeurs prédéterminées ;
- vérification de ce que la significativité de la règle est supérieure à une valeur prédéterminée ;
- calcul d’un gain pénalisé.
Method according to claim 1, characterized in that it comprises a determination of the acceptability of a rule, this determination comprising the following steps:
- calculation of the coverage of the rule;
- calculation of the significance of the rule;
- verification that the coverage of the rule is between two predetermined values;
- verification that the significance of the rule is greater than a predetermined value;
- calculation of a penalized gain.
Procédé selon la revendication 2, caractérisé en ce qu’il comprend une étape de vérification de ce qu’une condition sur le gain pénalisé est vérifiée.Method according to claim 2, characterized in that it comprises a step of verifying that a condition on the penalized gain is verified. Procédé selon la revendication 3, caractérisé en ce que la condition sur les gains est exprimée comme suit :

où Δ est une période fixée etγ rune pénalisation dépendante de la règle.
Method according to Claim 3, characterized in that the condition on the gains is expressed as follows:

where Δ is a fixed period and γ r a rule-dependent penalty.
Support lisible par ordinateur sur lequel sont stockées des instructions lisibles par machine pour exécuter le procédé selon l’une quelconque des revendications précédentes.A computer-readable medium on which are stored machine-readable instructions for carrying out the method according to any preceding claim.
FR1908656A 2019-07-30 2019-07-30 INTERPRETABLE PREDICTION PROCESS BY LEARNING USING TIME SERIES Pending FR3099615A1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
FR1908656A FR3099615A1 (en) 2019-07-30 2019-07-30 INTERPRETABLE PREDICTION PROCESS BY LEARNING USING TIME SERIES

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR1908656 2019-07-30
FR1908656A FR3099615A1 (en) 2019-07-30 2019-07-30 INTERPRETABLE PREDICTION PROCESS BY LEARNING USING TIME SERIES

Publications (1)

Publication Number Publication Date
FR3099615A1 true FR3099615A1 (en) 2021-02-05

Family

ID=73642916

Family Applications (1)

Application Number Title Priority Date Filing Date
FR1908656A Pending FR3099615A1 (en) 2019-07-30 2019-07-30 INTERPRETABLE PREDICTION PROCESS BY LEARNING USING TIME SERIES

Country Status (1)

Country Link
FR (1) FR3099615A1 (en)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001015079A1 (en) 1999-08-26 2001-03-01 Westport Financial Llc An artificial neural network based universal time series
CN105354644A (en) 2015-11-29 2016-02-24 北京化工大学 Financial time series prediction method based on integrated empirical mode decomposition and 1-norm support vector machine quantile regression
CN106419936A (en) 2016-09-06 2017-02-22 深圳欧德蒙科技有限公司 Emotion classifying method and device based on pulse wave time series analysis
US20180336452A1 (en) 2017-05-22 2018-11-22 Sap Se Predicting wildfires on the basis of biophysical indicators and spatiotemporal properties using a long short term memory network

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001015079A1 (en) 1999-08-26 2001-03-01 Westport Financial Llc An artificial neural network based universal time series
CN105354644A (en) 2015-11-29 2016-02-24 北京化工大学 Financial time series prediction method based on integrated empirical mode decomposition and 1-norm support vector machine quantile regression
CN106419936A (en) 2016-09-06 2017-02-22 深圳欧德蒙科技有限公司 Emotion classifying method and device based on pulse wave time series analysis
US20180336452A1 (en) 2017-05-22 2018-11-22 Sap Se Predicting wildfires on the basis of biophysical indicators and spatiotemporal properties using a long short term memory network

Non-Patent Citations (15)

* Cited by examiner, † Cited by third party
Title
CLIMENT ET AL.: "Green and good? The investment performance of US envi-ronmental mutualfunds", JOURNAL OF BUSINESS ETHICS, vol. 103, 2011, pages 275 - 287
CRIFO ET AL.: "ESG, stratégies d'entreprise et performance financière", ISR & FINANCE RESPONSABLE, 2014
EL GHOUL ET AL.: "Does corporate social responsibility affect the cost of capital?", JOURNAL OF BANKING & FINANCE, vol. 35, 2011, pages 2388 - 2406, XP028379022, DOI: 10.1016/j.jbankfin.2011.02.007
GANGULI ET AL.: "Better models for prédiction of bond prices", KISHORE, MACHINE LEARNING AND ALGORITHMIC TRADING: IN FIXED INCOME MARKETS, 2013
GIRERD-POTIN ET AL.: "Which dimensions of social responsibility concern financial investors?", JOURNAL OF BUSINESS ETHICS, vol. 121, 2014, pages 559 - 576
GUEDJ, AGRÉGATION D'ESTIMATEURS ET DE CLASSIFICATEURS : THÉORIE ET MÉTHODES, 2013
LAPOINTE: "Essays on corporate Social Responsibility and socially responsible", INVESTMENT, THÈSE, 2013
LEE ET AL: "Application of support vector machines to corporate credit rating prediction", EXPERT SYSTEMS WITH APPLICATIONS, OXFORD, GB, vol. 33, no. 1, 22 December 2006 (2006-12-22), pages 67 - 74, XP005812254, ISSN: 0957-4174, DOI: 10.1016/J.ESWA.2006.04.018 *
LEE: "Application of support vector machines to corporate crédit rating prediction", EXPERT SYSTEMS WITH APPLICATIONS, vol. 33, 2013, pages 67 - 74, XP005812254, DOI: 10.1016/j.eswa.2006.04.018
MARGOLIS ET AL.: "Does it Pay to Be Good...And Does it Matter? A Meta-Analysis of the Relationship between Corporate Social and Financial Performance", SSRN ELECTRONIC JOURNAL, 2009
MARGOT ET AL., RULE INDUCTION PARTITIONING ESTIMATOR, pages 288 - 301, ISSN: 0302-9743
NAZEMI ET AL.: "Macroeconomic variable selection for creditor recovery rates", JOURNAL OF BANKING & FINANCE, April 2018 (2018-04-01), pages 14 - 25
ORLITZKY ET AL., CORPARATE SOCIAL AND FINANCIAL PERFORMANCE : A META-ANALYSIS, 2003
PATRA, APPRENTISSAGE À GRANDE ÉCHELLE, CONTRIBUTION À L'ÉTUDE D'ALGORITHMES DE CLUSTERING RÉPARTIS ASYNCHRONES, 2012
SOLTZ: "Aggrégation séquentielle de prédicteurs : méthodologie générale et applications à la prévision de la qualité de l'air et à celle de la consommation électrique", JOURNAL DE LA SOCIÉTÉ FRANÇAISE DE STATISTIQUE, vol. 151, no. 2, 2010

Similar Documents

Publication Publication Date Title
Ogwueleka et al. Neural network and classification approach in identifying customer behavior in the banking sector: A case study of an international bank
US10552735B1 (en) Applied artificial intelligence technology for processing trade data to detect patterns indicative of potential trade spoofing
Chang et al. Pairs trading on different portfolios based on machine learning
CN112700324A (en) User loan default prediction method based on combination of Catboost and restricted Boltzmann machine
Chowdhury et al. Applicability of Prediction Techniques in the Stock Market-A Chittagong Stock Exchange Perspective
Sarma et al. Stock market analysis with the usage of machine learning and deep learning algorithms
Zou et al. A novel deep reinforcement learning based automated stock trading system using cascaded lstm networks
Rafi et al. Enhancing cryptocurrency price forecasting accuracy: A feature selection and weighting approach with bi-directional LSTM and trend-preserving model bias correction
Padhi et al. Prognosticate of the financial market utilizing ensemble-based conglomerate model with technical indicators
Jhanwar et al. Telecommunication stocks prediction using long short-term memory model neural network
FR3099615A1 (en) INTERPRETABLE PREDICTION PROCESS BY LEARNING USING TIME SERIES
Kong et al. Changes in the market structure and risk management of Bitcoin and its forked coins
Chataigner Some contributions of machine learning to quantitative finance: volatility, nowcasting, CVA compression
Aksoy et al. Comparison of machine learning methods in prediction of financial failure of businesses in the manufacturing industry: Evidence from borsa İstanbul
Liu et al. Multi-Factor Inception: What to Do with All of These Features?
Rathi et al. Customer lifetime value measurement using machine learning techniques
Pedram et al. Exchange rate model approximation, forecast and sensitivity analysis by neural networks, case of iran
Nirob et al. Predicting Stock Price from Historical Data using LSTM Technique
Briola et al. HLOB--Information Persistence and Structure in Limit Order Books
Allais et al. Capturing structural changes in French meat and fish demand over the period 1991–2002
FR3109232A1 (en) INTERPRETABLE PREDICTION PROCESS BY LEARNING OPERATING WITH LIMITED MEMORY RESOURCES
El Youssefi et al. Utilizing Machine Learning and Deep Learning for Predicting Crypto-currency Trends
Kavitha et al. Bankruptcy Prediction Models for NSE-Listed Firms: A Comparative Analysis.
Abidin et al. Prediction of Telecommunication Company Stock Price using Multiple Linear Regression
Venkatesan et al. Cryptocurrency Dynamics: An Analytical Exploration

Legal Events

Date Code Title Description
PLFP Fee payment

Year of fee payment: 2

PLSC Publication of the preliminary search report

Effective date: 20210402

PLFP Fee payment

Year of fee payment: 3

PLFP Fee payment

Year of fee payment: 4

PLFP Fee payment

Year of fee payment: 5