WO2010026228A1

WO2010026228A1 - Procédé de mesures de concentrations d'espèces moléculaires au moyen d'un chromatogramme

Info

Publication number: WO2010026228A1
Application number: PCT/EP2009/061484
Authority: WO
Inventors: Caroline Paulus; Laurent Gerfault; Pierre Grangeat
Original assignee: Commissariat A L'energie Atomique
Priority date: 2008-09-05
Filing date: 2009-09-04
Publication date: 2010-03-11
Also published as: EP2321639A1; JP2012502263A; US20110161062A1

Abstract

Un modèle espace-état d'évolution de signal d'une colonne chromatographique est formé, puis inversé en fonction de signaux mesurés, pour calculer les concentrations des solutés en exploitant tout le signal. Le modèle s'appuie sur des équations gouvernant le transport des solutés dans la colonne en fonction de divers paramètres physiques, qui peuvent être réévalués. Application à la recherche et à la mesure de composants rares, tels que des protéines dans les échantillons de liquides biologiques.

Description

PROCEDE DE MESURES DE CONCENTRATIONS D'ESPECES MOLECULAIRES

AU MOYEN D'UN CHROMATOGRAMME

DESCRIPTION

DOMAINE TECHNIQUE

On traite ici d'un procédé de détermination

5 de concentrations d'espèces moléculaires sur un chromatogramme .

On recourt souvent à des techniques de séparation pour l'analyse de mélanges. Les appareils différents peuvent comprendre une colonne0 chromatographique pouvant être couplée à un spectromètre de masse. Dans le cas particulier des fluides biologiques où on cherche à mesurer la concentration de différentes protéines, un module de digestion peut être ajouté en amont pour décomposer les5 protéines en peptides dont l'étude est plus facile. Les colonnes chromatographiques sont fondées sur les vitesses différentes prises par les espèces chimiques d'un mélange pour la parcourir et leur séparation consécutive. Un spectrogramme mesuré est un signal à0 deux dimensions correspondant à la sortie du spectromètre de masse. L'une des dimensions est sensible au temps de rétention des différentes espèces dans la colonne chromatographique, l'autre dimension correspond au rapport masse sur charge associé à5 chacune des espèces. Ces données consistent en un spectre composé d'une succession de pics. En faisant la projection du spectrogramme sur la dimension temps de rétention ou en faisant une coupe à une masse donnée, on obtient un chromatogramme mesuré, à savoir une image du signal de sortie de la colonne chromatographique . L'étude du spectrogramme ou du chromatogramme permet de déterminer les espèces chimiques du mélange et leurs concentrations . II faut toutefois admettre que des résultats précis sont difficiles à obtenir, notamment pour deux raisons. La superficie des pics, qui exprime la concentration de l'espèce chimique concernée, peut être difficile à évaluer en raison du bruit de l'appareil ou de la fluctuation des paramètres physiques de la colonne de chromatographie ; aussi, la forme et la position du pic peuvent varier d'une expérience à l'autre en raison de caractéristiques différentes des colonnes chromatographiques, de conditions de mesures différentes ou d'une simple dispersion statistique. Ces inconvénients sont d'autant plus marqués que les espèces chimiques sont nombreuses et leurs concentrations très faibles, ce qui est le cas des protéines dans les liquides biologiques, où on cherche souvent certaines protéines rares. C'est par exemple le cas des marqueurs sanguins du cancer, qu'on trouve dans le plasma à des concentrations de l'ordre de 1 à 1000 picomoles/litre, ou de 1 à 1000 femtomoles par millilitre de plasma. Parmi les méthodes connues, la plus simple d'entre elles consiste à isoler chaque pic, à évaluer la concentration par des mesures de leur hauteur sur la durée d'élution correspondante (selon l'axe du chromatogramme) ou même par une seule mesure de hauteur, et à déterminer de quelle espèce chimique il s'agit d'après la position du pic sur le spectrogramme. Les inconvénients mentionnés ci-dessus d' imprécision du résultat obtenu et même de difficulté à identifier correctement les espèces chimiques en présence de mélanges complexes sont particulièrement marqués dans ce procédé rudimentaire .

Une autre méthode consiste à utiliser une décomposition numérique du spectrogramme par une analyse factorielle pour isoler les pics. Les pics des peptides d' intérêt sont obtenus à partir de calibrations d'échantillons de compositions connues. Mais les inconvénients classiques ne sont pas suffisamment éliminés, par exemple à cause des disparités entre les conditions de mesure à la calibration et à l'étude de l'échantillon, qui sont difficiles à évaluer et à corriger. L'article de Forssén et autres « An improved algorithm for solving inverse problems in liquid chromatography » paru dans Computer & Chemical Engineering (Elsevier) , vol.30, n°9, est une variante de cette méthode dans laquelle les pics d'élution sont obtenus par simulation à partir d'équations isothermes (mettant en relation la phase mobile et la phase stationnaire d'un soluté dans une colonne chromatographique) ; ces équations sont aussi exploitées dans les réalisations envisagées de l'invention pour construire le modèle, mais l'antériorité préconise de faire coïncider les pics simulés et les pics expérimentaux par un ajustement des paramètres de modélisation de ceux-là, ce qui peut donner des difficultés de convergence dans le cas d'un grand nombre de solutés, dont les paramètres doivent ajustés plus ou moins indépendamment alors qu'il est difficile de tenir bon compte des imprécisions dans la mesure ou l'estimation des paramètres. L'article « An improved algorithm for solving inverse chromatography » par Jakobsson et autres, Journal of chromatography A (Elsevier) , vol.1063, décrit un procédé similaire d'analyse factorielle avec l'emploi d'un modèle pour simuler les pics d'élutions indépendamment.

L' invention est relative à un procédé amélioré de détermination de concentrations des espèces moléculaires dans une solution passée dans une colonne chromatographique et un spectromètre de masse. On entend par solution un mélange homogène, présentant une seule phase, de deux ou plusieurs corps. Elle est fondée sur l'utilisation d'un modèle spatio-temporel local théorique de transport des molécules à travers la colonne chromatographique pour exprimer des chromatogrammes modélisés associés chacun à une des espèces, plus précis qu'avec une calibration empirique. De plus, le modèle est exprimé sous forme d'une représentation à espace-état, dont la forme générale sera rappelée dans la description détaillée. Les représentations à espace-état sont employées notamment en automatique pour prédire l'évolution de systèmes physiques d'après des commandes qui y sont introduites ; elles sont adoptées ici puisqu'elles autorisent une inversion du système d'équations comprennent les résultats et les paramètres du modèle de façon assez simple et directe pour distinguer sur le chromatogramme les contributions des différentes espèces chimiques qui composent l'échantillon, et enfin de déduire leurs concentrations respectives. Un modèle rigoureux étant utilisé pour exprimer les chromatogrammes modélisés, on peut s'attendre à une meilleure identification des pics du chromatogramme d'étude, donc à une meilleure évaluation de la composition de l'échantillon, et à une meilleure évaluation des concentrations, d'autant plus que l'inversion du système est faite de façon simple. Une autre considération importante est que les paramètres physiques de l'appareil de mesure étant tous conjoints aux résultats expérimentaux dans les équations découlant du modèle, celles-ci sont résolues numériquement avec la faculté de faire varier ces paramètres physiques en plus des inconnues (les concentrations à déterminer des solutés) afin d'obtenir une meilleure résolution, en corrigeant ainsi probablement des imprécisions faites auparavant en les estimant ou les mesurant.

Le modèle de transport des molécules exprimant les chromatogrammes modélisés peut comprendre, pour chacune des espèces, une équation d'évolution de concentrations des molécules de ladite espèce, le long de la colonne chromatographique, avec le temps. Cette équation découle directement des réactions chimiques d' adsorption et de désorption des molécules sur le matériau solide de la colonne, qui obéit à des lois simples et connues.

Cette équation d'évolution peut favorablement exprimer la concentration à chaque point de la colonne chromatographique en fonction de concentrations antérieures à ce point et à des points voisins, par une simple combinaison pondérée par des coefficients .

Ces coefficients peuvent être déterminés analytiquement ou empiriquement. Ils sont des fonctions de paramètres comprenant notamment des paramètres de la colonne chromatographique, des paramètres des pics chromatographiques d'étalonnage et des paramètres d' ajustement .

Les paramètres de la colonne chromatographique comprennent éventuellement une longueur et un paramètre fonction de sa porosité. Les paramètres des pics chromatographiques d'étalonnage comprennent éventuellement un ou plusieurs paramètres de position des pics et de forme des pics, déterminés empiriquement par une calibration.

Les paramètres d'ajustement peuvent comprendre des pas d'échantillonnage spatiaux, le long de la colonne chromatographique, et temporels.

D'autres paramètres peuvent être ajoutés au modèle, comme une vitesse d'un solvant dans la colonne chromatographique ou des paramètres décrivant une modification de composition d'un solvant avec le temps, quand la chromatographie est faite par exemple en mode de gradient, avec une introduction progressive d'un solvant plus fort que le solvant utilisé à l'origine.

L' invention sera maintenant décrite par deux modes de réalisations principaux : un mode dit isocratique où la composition du solvant responsable du mouvement de l'échantillon à travers une colonne de chromatographie reste constante, et un mode dit de gradient où la composition du solvant change, un solvant plus fort remplaçant progressivement un solvant d' origine .

L' invention sera maintenant décrite en liaison aux figures: -la figure 1 représente un appareillage,

-la figure 2 un signal de chromatogramme mesuré et un signal de chromatogramme modélisé,

-et la figure 3 est un logigramme du procédé . Le dispositif d'exploitation peut être celui de la figure 1, où un échantillon sanguin à étudier, par exemple, passe par un module de digestion 1 qui décompose les protéines en peptides dont la mesure et l'étude sont plus faciles, puis par la colonne de chromatographie 2 et par un spectromètre de masse 3. Le signal alors émis est un spectrogramme bidimensionnel ; il est fourni à un module de traitement 4 qui met en œuvre le procédé d'exploitation du spectre, constitutif de l'invention, pour en déduire les concentrations des peptides de l'échantillon. Comme précédemment écrit, il est alors possible d'établir un chromatogramme de l'échantillon en faisant la projection du spectrogramme sur la dimension de temps de rétention ou en faisant une coupe à une masse donnée. Mais l'invention s'applique naturellement à un chromatogramme directement mesuré en sortie de la colonne de chromatographie.

L' invention peut être appliquée avec d'autres dispositifs. C'est ainsi qu'un module d'enrichissement, pouvant comprendre des étages de déplétion ou de capture par affinité, en amont du module de digestion peut être ajouté pour faire une première sélection des protéines d'intérêt. Aussi, le module de digestion 1 est facultatif : le signal arrivant au module de traitement 4 serait analogue mais représentatif de protéines plutôt que peptides, de sorte que l'invention serait appliquée sans changement pour donner les concentrations de ces protéines. Le spectromètre de masse 3 peut avoir différents modes de fonctionnement, ceci n'influençant pas les traitements du module 4. Le mode classique appelé mode MS (Mass Spectrometry) où l'on étudie une plage de masses peut être remplacé par le mode MS-MS où l'on procède à un refractionnement des peptides de certaines masses ou encore le mode MRM (Multiple Reaction Monitoring) où l'analyse est faite pour seulement quelques masses prédéfinies. Enfin, le spectromètre de masse 3 est lui aussi facultatif, et le signal issu du chromatographe 2 et traité par le module de traitement 4 serait un spectre monodimensionnel qui serait traité de la même façon.

L' invention pourrait aussi être appliquée à d'autres genres d'échantillons ou de produits à mesurer .

Le module de traitement 4 travaille en accomplissant une inversion numérique du signal qu'il reçoit pour donner les concentrations des peptides, ou en général des produits mesurés par le dispositif. Il s'appuie sur une modélisation du signal en fonction des différents paramètres, dont lesdites concentrations et d'autres paramètres, connus par une calibration ou une autre mesure, ou inconnus. La figure 3 donne une représentation générale du procédé. Des modèles de la colonne chromatographique 2 (El), du solvant (E2) et du soluté (E3) sont élaborés pour décrire l'écoulement dans la colonne chromatographique 2, l'adsorption du soluté par ladite colonne et la loi d'alimentation en le solvant. La synthèse de ces modèles particuliers donne un modèle général d'espace-état (E4) qui décrit complètement le signal issu de la colonne chromatographique 2 en fonction de divers paramètres, qui peuvent être évalués (E5) par des calibrations particulières, des mesures, des hypothèses, ou qui dépendent de choix arbitraires. Quand une mesure a été faite sur un fluide inconnu, donnant un chromatogramme expérimental, elle peut entrer dans l'écriture d'un système où elle correspond au modèle pondéré par les paramètres. La résolution de ce système (E6) par inversion numérique donne les concentrations des solutés (E7) du fluide inconnu. Les paramètres peuvent toutefois être réajustés (E8), la résolution étant généralement itérative.

Les étapes du procédé seront détaillées à peu près dans l'ordre de leur présentation. Des compléments et des généralisations seront donnés à 1' occasion . Voici maintenant comment le modèle numérique du signal est créé. PARAMETRES DU MODELE

1) Un élément du modèle découle du transport progressif des solutés tels que les protéines dans la colonne chromatographique. Le transport peut être représenté par l'équation (1) ci-dessous, qui donne la concentration du soluté adsorbé q sur la phase stationnaire (résine échangeuse d'ions) de la colonne par rapport à la concentration du soluté dans la phase mobile c au même endroit (abscisse z) et au même instant (t) : dc(z,t) _{| F}dq(z,t) _{| u} dc(z,t) _{= D}.d²c(z,t) dt dz ^Us dz ^l dz² où F est le rapport des volumes occupés par la phase mobile et la phase stationnaire (facteur de porosité) , u_s la vitesse de propagation du solvant, et D₁ un facteur représentant la dispersion qui contribue à l'étalement des pics de chromatographie (appelé facteur de diffusion) .

2) Une autre caractéristique de l'état de la colonne chromatographique concerne l'adsorption du soluté sur la phase stationnaire de la colonne, c'est- à-dire l'interaction des molécules de la phase mobile avec la phase stationnaire. Une modélisation peut être faite, par exemple pour un régime stationnaire, ce qu'on appelle isotherme, à l'équilibre. Un exemple d'isotherme simple est q*=k.c*, les astérisques indiquant que l'on considère les concentrations à l'équilibre, et k étant un facteur constant, dit de rendement de réaction. Un exemple d'isotherme linéaire peut être noté q (z, t) =k. c (z, t) (2) . 3) Dans le cas d'un mode de gradient, il convient encore de modéliser l'évolution de la concentration des solvants. Dans les expériences typiques, le solvant faible est l'eau, et initialement prépondérant voire unique (100% de la concentration totale dans la solution) ; et le solvant fort φ est le méthanol ou l' acétonitrile, qui est introduit progressivement. Dans le cas le plus simple, il n'y a pas d' interaction entre le solvant et la phase stationnaire, et le front d'injection du solvant est identique (en débit et en composition) du début à la fin de la colonne à un retard de propagation près. On peut considérer une variation linéaire de la concentration φ du solvant fort φ, entre 0 à un instant ti et une valeur maximale à un instant ultérieur t₂, soit (φ (t, z=0) =φo+βt) , et en tout point du réacteur on obtient alors: φ(t,z) = φ₀ pour 0<t<z/u_s

_Z pour z/u_s<t. j(t,z) = jθ + b(t-—)

4) On considère maintenant le comportement du soluté. En mode isocratique (composition du solvant constante), le facteur de rétention k introduit en 2) est défini comme k= (t_R-to) /Fto, où to est le temps mort ou temps de rétention de la colonne pour sortir les composés non retenus, t_R est le temps de rétention du soluté considéré, et F est le paramètre de porosité, vu en 1, de la phase stationnaire et indépendant du solvant. En mode de gradient, k est une fonction de φ et une relation telle que In k (φ) =ln k_w-S.φ , k_w étant le facteur de rétention dans l'eau et S la pente du gradient, est communément utilisée. 5) Des modèles plus complexes pourraient être pris en compte ainsi que certaines colonnes chromatographiques comprenant des phases stationnaires en piliers poreux. Du liquide se trouve alors presque immobile et forme une phase stagnante. Les transferts de soluté peuvent se réaliser entre la phase mobile et la phase stationnaire, la phase stagnante et la phase stationnaire, et la phase mobile et la phase stagnante. La diffusion moléculaire comprendrait être une diffusion axiale dans la phase mobile. Des isothermes non linéaires peuvent encore être introduits pour tenir compte de la variation souvent constatée du rendement de l'échange selon les concentrations de soluté dans la phase mobile et la phase stationnaire. Enfin, par rapport à l'équation (2), un isotherme non linéaire ou encore un isotherme liant le soluté et le solvant en cas d' interaction entre le solvant et la phase stationnaire pourrait être proposé. On trouvera une description d'un isotherme non linéaire dans l'ouvrage « Fundamentals of preparative and nonlinear chromatography » chapitres 3 et 4 (auteurs: Guiochon et al, Elsevier Académie Press - second édition) , et une autre description dans l'article « Maas loadability of chromatographic columns », par Poppe et Kraak, paru dans le « Journal of chromatography », 255 (1983), p.395 à 414, Elsevier Scientific Publishing Company. Enfin, les isothermes non linéaires tels que déterminés dans le document "An improved algorithm for solving inverse problems in liquid chromatography" par P. Forssén, paru dabs Computers and Chemical Engineering, 2006, pages 1381 - 1391, peuvent être utilisées.

INFLUENCE DE LA CALIBRATION INTERNE Dans la suite du procédé, on considère des protéines alourdies dans l'échantillon. Il s'agit de protéines d'étalonnage couramment utilisées dans l'art pour tenir compte de variations de résultats de la colonne chromatographique, notamment du temps de rétention des composés des échantillons. Ces protéines alourdies sont presque identiques aux protéines recherchées mais enrichies en isotopes lourds et donc bien identifiables au spectromètre de masse 3. Introduites en concentrations connues, elles permettent de calibrer la colonne chromatographique en mesurant les hauteurs et les temps de rétention de leurs pics, au bénéfice des mesures des protéines d'étude de même espèce. Il faut toutefois souligner que l'emploi de protéines alourdies n'est pas obligatoire en pratique.

On appelle m_1/D/k ⁽ⁿ⁾ le chromatogramme du peptide i appartenant à une protéine d'étude k dans l'échantillon j au temps n, m^*!,-,,^'¹¹' le même chromatogramme mais pour le peptide appartenant à la protéine alourdie k, m_Dk (n) la somme des chromatogrammes des N_pep peptides appartenant à la protéine k d'étude, m^* _D,_k(n) la même somme pour la

Npep protéine k alourdie, soit m_]k(ή)=^'∑m_{ι ]k}(ή) et

I=I

Npep m JΛ (n) = ∑m_ι ^* _{j k} (n) , et Hi₁, -, , _k ^<n) et m^* _{1/ ] i lc} ⁽ⁿ⁾ peuvent être

I=I exprimées par : m,,_},k (O = «.,* A,,,* y>,k (ⁿ' P)^cj,_k +^£ _ι,_J,_k (O

^ml,k (") = β>,j,k y,* ("> p)^c],k + s^* '.J* (.*) où c_D,_k est la concentration de la protéine k d'étude dans l'échantillon j, c^* _D,_k la concentration de la protéine k alourdie, βi,_D,_k le gain de calibration de la chaîne de mesure pour le peptide i de la protéine k (obtenu grâce à la concentration c^* _D,_k, connue de l'opérateur et à la mesure correspondante sur le signal) , α_x,_k est un gain de calibration (obtenu en utilisant une calibration externe pour un échantillon de protéines à la concentration c_D,_k connue), yi,_k(n,p) est la réponse du chromatographe 2 pour le peptide i appartenant à la protéine k, d'après le modèle d'état indiqué ci-dessous et ε_1/](k et ε*_1/D,_k sont des bruits, qu'il est possible de modéliser indépendamment, par exemple par des réalisations de processus aléatoires gaussiens de moyenne nulle (correspondant à un bruit blanc) et de variance déterminée. Ces bruits sont par exemple des bruits dus à la nature aléatoire des interactions dans les réactions chimiques. Il peut s'agir également de bruits électroniques, p correspond à l'ensemble des paramètres du modèle : il peut s'agir de paramètres physiques propres à la colonne ou propres aux couples (colonne - peptide) , connus ou déterminés expérimentalement, p comprend également des paramètres numériques choisis pour assurer la stabilité du modèle. Ces paramètres seront définis dans la suite du texte.

Nous supposons avoir Nc expériences de calibration pour lesquelles c_D,_k et c^* _D,_k sont connues et Np expériences d'étude pour lesquelles c^* _D,_k sont connues et c_D,_k (les concentrations à obtenir) sont inconnues. EXPRESSION DU MODELE DE LA COLONNE

Les dérivées de premier ordre et de second ordre de l'équation (1) rencontrée plus haut peuvent être données par les équations (3) et (4) :

en termes de différences finies où Δz est le pas d'échantillonnage en distance et o (Δz²) désigne des termes insignifiants, représentant les résidus apparaissant lors de l'approximation d'une dérivée par une différence finie.

De plus, la dérivée temporelle du premier ordre peut être approchée par l'équation (5) dc(z,t) = —[c(i,n +l)-c(i,n)]+ o (At) dt At en termes de différences finies où Δt est le pas d'échantillonnage en temps et o (Δt) désigne des termes insignifiants .

Il est alors possible de remplacer l'équation (1) par l'équation (6) : c(i,n + 1) = I(p)c(i + !,«) + J(p)c(i,n) + K(p)c(i -1,n) ( 6 ) , ou

At(ID₁ - U₅Az) Az² (1 + Fk) - 2D₁At

I(p) = , J(P) = 2Az² (1 + Fk) Az² (1 + Fk)

ECRITURE DEVELOPPEE DU MODELE

1) Considérons d'abord le mode isocratique.

Le modèle peut être représenté par le système à espace état:

y(t) = h(x(t),p,u,t)

X(O) = X₀(P)

où x(t) est un vecteur d'état, p représente les paramètres physiques du système, u représente le signal d'entrée dans le système (la fonction d'injection), y(t) la sortie du système (modèle de la colonne chromatographique pour un peptide donné à estimer) et X₀ des conditions initiales du vecteur d'état. Le fait de représenter le modèle selon un système à espace-état permet d'aboutir à une forme standard de modèle dynamique, que l'on peut résoudre à l'aide d'outils existants. La fonction f est appelée fonction d'évolution de l'état, tandis que la fonction h est appelée fonction d'observation. Dans le cas d'un système discret, stationnaire et linéaire, ce système devient :

\x(n + 1) = A(p)x(ή) + B(p)u(n) y(n) = C(p)x(n) + D(p)u(n)

X(O) = X₀(P) où n correspond à un échantillonnage du temps de 1 à nt, A est une matrice d'état, B une matrice d'entrée, C une matrice de sortie et D une matrice de commande directe .

Le système peut être développé comme suit:

est un vecteur-colonne de

L_ dimension nz= AZ

est une matrice carrée de dimensions nz ; I (p) , J(p) et K(p) doivent être positifs pour que le système soit stable, ce qui implique des contraintes sur les pas d'échantillonnage en temps et en espace.

est un vecteur-colonne de dimension nz ; C(p) = (0 ••• 0 l) est un vecteur-ligne de dimension nz,

avec y(n) = c(—,ri) ; D(p) est ici une matrice qui peut Az être choisie à volonté, ou être nulle, ce qu'on suppose ici .

2) Voici maintenant comment le système espace-état est formé en mode de gradient. Il devient : x(n + 1) = A(n,p)x(n) + B(n, p)u(n) y(n) = C(n, p)x(n) + D(n,p)u(n)

X(O) = X₀(P) qui diffère du précédent en ce que les matrices A, B, C et D dépendent du temps n. L'isotherme peut alors être défini par la relation (7), et le gradient par les relations (8) et (9) ci-dessous pour les hypothèses données d'un gradient linéaire, q(z,t) = k(z,t)c(z,t) (7)

In k(z,t) = In k_w - Sφ(z,t) => k(z,t) = k^-⁵^⁰ (8)

La dérivée de l'équation (7) donne l'équation (10) :

fo(Z'') _ = k U(z-j Λ)^^dc(^z,t) ₊ , ≡ dk(^z,t) c „,(z_j _A) _ = k _hwe _^-_S ^s _φ^_(zX) ^ dc^(z,t) _Çh dφ(z,t) _^SφUf ddtt dt dt dt dt

( 10 ) ,

et l'équation dc(z,t) dφ{: >0 Sφ(:

(l + Fk_we-^Sφ<z'^t))^^--SFk J) dc(z,t)_=∑> d²c(z,t) c(z,t) + u, dt dt dz dz

(ii:

est obtenue des équations (1) , (8) et (10) . Exprimée sous forme de différences finies, elle devient l'équation (12) :

(C(I +l,n)-2c(i,n)+ c(i-l,n))

c(i, n + 1) =

D,

At(l + Fk_we-^Sφ(ι'^n>Y :(i + l,n)

2Az

D,

+ At(l + Fk_we-^Sφ(ι'^n>Y :{i-U)

Az² 2Az (12;

qu'il est possible d'exprimer de façon simplifiée par l'équation (13) : c(i,n + ï) = I(i,n,p)c(i + l,n) + J(i,n,p)c(i,n) + K(i,n,p)c(i —l,n) (13)

où les coefficients I, J et K ont une forme plus compliquée que précédemment :

I(i,n,p) = At(l + Fk_we ^s^^n>y

Az² 2Az _

D₁ K(i,n,p) = At(l + Fk_we-^SφMY i ^Us 1

Az² 2Az

Le problème a alors la forme du système suivant x(n +1) = A(n, p)x(n) + B(p)u(n) y(n) = C(p)x(n) x(O) = x_o(p)

où x, B, C et D sont identiques à ceux du mode isocratique et où A est exprimé de la façon suivante :

J(l,n,p) I(l,n,p) 0 K(2,n,p) J(2,n,p) I(2,n,p) 0 0

A(n,p) = K(i,n,p) J(i,n,p) I(i,n,p)

0

0 K(n_z-\,n,p) J(n_z-\,n,p) I(n_z-\,n,p)

0 0 K(n_z,n,p) J(n_z,n,p)

Dans tous les cas, on en déduit y(n) pour n=l à n=nt, nt étant l'abscisse maximum du chromatogramme (nombre de points en temps de rétention) c'est-à-dire un modèle d'état du signal de sortie de la colonne chromatographique pour un peptide donné pour le mode considéré (isocratique ou gradient) . Ce modèle est typiquement celui d'un pic d'élution. Il est une fonction du temps et dépend aussi des facteurs physiques de l'appareillage. Il est supposé reproduire le signal qui serait effectivement mesuré à la sortie de la colonne de chromatographie 2 pour ce peptide dans les mêmes conditions de mesure. Il porte la référence 5 à la figure 2. PREMIERE EVALUATION DES PARAMETRES

Voici maintenant comment les paramètres physiques p sont déterminés. On peut distinguer trois catégories : certains sont des paramètres fixes qu' il est possible de déterminer par des mesures comme L, longueur de la colonne, et F, coefficient de rapport de phase, corrélé à la porosité e de la colonne chromatographique par la relation F=- -. Une deuxième e catégorie de paramètres est déterminée expérimentalement sur un chromatogramme expérimental : il s'agit de la vitesse du solvant u_s, en mesurant le temps de rétention to d'un marqueur sans interaction avec la phase stationnaire et en appliquant simplement la relation : u = — ;

de même k représentent

respectivement le temps de rétention et la variance statistique (représentant l'étalement) du pic du peptide dans un chromatogramme. On s'est ici placé dans le cas d'une isotherme linéaire. Dans le cas d'une isotherme non linéaire, d'autres paramètres définissant cette isotherme peuvent être pris en compte : il peut s'agir de concentrations de peptides, mais aussi de constituants du solvant. Enfin, les paramètres Δt et Δz de la troisième catégorie sont des pas d'échantillonnage en temps et en longueur, choisis arbitrairement pour respecter les contraintes de stabilité de résolution du système numérique.

En mode de gradient, d'autres catégories de paramètres doivent être considérées. Certains paramètres servent d'abord à modéliser la concentration du solvant fort en fonction du temps mais ils sont connus puisque cette concentration dépend de l'opérateur. Les coefficients k_w et S sont déterminés par des calibrations supplémentaires mettant en jeu un peptide déterminé.

RESOLUTION DU SYSTEME ET OBTENTION DES RESULTATS

On procède maintenant à des recherches successives de minimums de fonctions d'erreurs pour inverser le système complexe exprimant le signal en fonction des paramètres de la modélisation et des inconnues. De plus, dans le cas où le système est faiblement reproductible d'une expérience à l'autre, il est possible de réajuster les paramètres trouvés auparavant pour donner de meilleurs résultats. Il est à noter que plutôt qu'un algorithme de minimisation déterministe, tel une minimisation quadratique, il est possible d'utiliser d'autres critères d'adéquation entre les mesures et le modèle tels que des algorithmes de minimisation stochastique de type bayésien.

1) Les facteurs de calibration αi,k et βi,j,k, exprimant le gain de l'appareillage doivent maintenant être déterminés. On commence par estimer les facteurs (βi,j,k) pour chaque expérience (expérience d'étude ou expérience de calibration) par un calcul dans lequel on ajuste à la fois les paramètres physiques p et ces facteurs de calibration βi,_D,_k pour rechercher un minimum, soit min \\m^* , -β, , _ky_ιk(p)c^* A + λ\\p- pΛ où m^* _x -, _k sont les valeurs β_ιjk,p" '^J' '^J' ' ^J' " " " mesurées des spectrogrammes des échantillons de calibration comprenant des peptides alourdis, C^* _D,_k les concentrations connues de ces peptides, et Yi,k(p) correspond à l'écriture développée du modèle en fonction de x, A, B, C, et D ; λ est un coefficient de minimisation arbitraire et po est une valeur initiale, obtenue précédemment des paramètres physiques p du modèle. Ce coefficient de minimisation peut être déterminé selon la confiance que l'on peut accorder aux paramètres physiques initiaux p₀ : plus on a confiance en la détermination des paramètres initiaux p₀, plus ce coefficient λ sera fort, de façon à minimiser les variations des paramètres physiques p lors de l'étape de minimisation. Ainsi, cette étape de minimisation agira principalement sur l'ajustement des facteurs de calibration βij,k. Seuls les paramètres physiques p qui souffrent d'imprécision d'évaluation sont réévalués, les paramètres physiques précisément déterminés étant alors fixés. Ce calcul ne peut toutefois pas être entrepris s'il n'y a pas de peptide d'étalonnage ; alors les coefficients βi,_D,k sont supposés tous égaux à 1.

Lors des expériences dites d'étude, c'est- à-dire permettant les expériences mettant en œuvre un échantillon à étudier, comprenant alors des espèces moléculaires dont on cherche à déterminer les concentrations, on utilise un étalon dit interne, c'est-à-dire présent dans l'échantillon étudié. Il s'agit généralement de protéines alourdies ou de peptides alourdis.

Lors des expériences dites de calibration, on utilise un ou de préférence plusieurs étalons dits externes, c'est-à-dire des échantillons d'étalonnage différents de l'échantillon étudié afin de permettre l'identification de paramètres de modèles. Ces échantillons d'étalonnage comprennent des espèces moléculaires, par exemple des protéines ou des peptides dont on connaît la concentration.

Le fait d'utiliser un étalon interne permet l'ajustement de tout ou partie des coefficients βi,_D,k ou des paramètres de la colonne p, simultanément à l'étude de l'échantillon. Cela convient particulièrement lorsqu'on utilise dispositif dit instable, c'est-à-dire pour lequel les coefficients βi,_D,k ou les paramètres p peuvent varier d'une expérience à une autre. L'invention permet donc d'estimer des paramètres propres à la colonne de chromatographie (paramètres p) ainsi que le gain de calibration pour un peptide i (coefficient βi,_D,k) simultanément à la réalisation d'expériences de mesure, ce qui est un des avantages de l'invention. Cela est notamment rendu possible par une représentation du modèle par un système à espace-état, dont la résolution permet l'estimation de la fonction de sortie du système (fonction y) en fonction des paramètres p de la colonne de chromatographie.

2) Une seconde étape consiste à calculer les autres coefficients de calibration α_x,_k sur les Nc expériences de calibration.

pour i=l à N_pep (tous les peptides) , les paramètres physiques p pouvant encore être réévalués.

Ce calcul ne peut toutefois pas être entrepris s'il n'y a pas d'expérience de calibration ; alors les coefficients α_x,_k sont supposés tous égaux à 1. Le coefficient 1 est à nouveau un coefficient de minimisation, que l'on ajustera en fonction de la confiance que l'on accorde à la détermination des paramètres initiaux p₀.

3) La résolution finale, permettant de déterminer les concentrations C_D,_k des protéines d'étude k dans les Np expériences d'études, consiste en une nouvelle recherche de minimum selon

à chaque expérience j, m_D,_k représentant les sommes des m_lι3ι]ç comme on l'a vu.

Ces calculs sont de réalisation facile sur un ordinateur. Un exemple de résultat obtenu est à la figure 2, où un signal modélisé 5 (y(t)) est superposé au signal effectivement mesuré 6 après avoir été pondéré par la concentration c et les gains de calibration trouvés par le calcul, et aussi après la réévaluation des paramètres physiques p à partir de po, qui a pu corriger des défauts d'évaluation de la forme

(étalement) ou de la position du pic dans le modèle 5: la concordance est excellente.

Le procédé décrit dans cette demande trouvera son application dans l'analyse de fluides biologiques et en particulier le sang. Mais il pourra également être mis en œuvre dans la caractérisation de bactéries par leur protéome. AUTRE MODE DE REALISATION DE L' INVENTION EXPRESSION DU MODELE DE LA COLONNE

Les dérivées de premier ordre et de second ordre de l'équation (1) rencontrée plus haut peuvent être désormais données par les équations (3') et (4'), au lieu de (3) et (4) : [c(i,n)- c(i -1,n)]+ o(λz) (3'

d²c(z,t) = —-[c(i +Xn)- 2c(i,n)+ c(i -1,n)]+ o(Az²) ( 4 ' )

F)₇ ² Δz

On propose d'utiliser un schéma explicite décentré en amont en approchant la dérivée d'ordre 1 en z par une différence finie amont. Ceci est motivé par le fait que l'utilisation d'un tel schéma permet de relâcher les contraintes de stabilité par rapport à un schéma explicite centré. Les contraintes de stabilité étant moindres, les pas d'échantillonnage en temps Δt et en espace Δz pourront être choisis plus grands et ainsi le temps de calcul global de l'algorithme sera fortement réduit .

Le schéma décentré amont est choisi car la vitesse du solvant us est positive. Si ce n'était pas le cas, on choisirait un schéma décentré aval, le but étant toujours d'aller chercher l'information en «remontant le courant». On retrouve l'équation (6) c(i,n + 1) = I(p)c(i + !,«) + J(p)c(i,n) + K(p)c(i -1,n) (6:

où toutefois les coefficients deviennent :

DAt u_s AzAt + 2D₁At u_sAzAt + D_tAt

I(P) = , J(P) = 1- , K(p) =

Az (I + Fk) Az² (1 + Fk) Az² (I + Fk)

Au lieu de l'équation (12) , on trouve une équation (12^') légèrement modifiée :

(l ₊ Fk_we-^S^^> )j_t-(c(i,n + l)-c(i,n))- FSk_w -Sφ(ι,n) c(i,n) =

D

- ^- (c(i, n) - c(i - 1, n)) + -\ (c(i + l,n)- 2c(i, n) + c(i -l,n))

A

c(i, n + 1) =

D,

At(l + Fk_we-^Sφ('-ⁿ⁾) :(i+l,n)

Az²

D₁

- At(l + Fk_we-^Sφ(ι'^n>Y :(i-l,n)

Az (12' )

et, dans l'équation (13) identique à celle qui a déjà été rencontrée, : c(i,n + ï) = I(i,n, p)c(i + \,n) + J(i,n,p)c(i,n) + K(i,n,p)c(i -\,n) (13)

les coefficients I, J et K s'écrivent : D₁

I(i,n,p) = At(l + Fk_we-^SφMY V¹ r

Az² _

K(i,n,p) = At(l + Fk_we-^SφMY r

Le reste du procédé, et notamment l'inversion du modèle du système, est inchangé.

Claims

REVENDICATIONS

1. Procédé de détermination de concentrations de molécules dans un soluté d'une solution, consistant à faire traverser par la solution un appareillage comprenant une colonne chromatographique (2) et à obtenir un chromatogramme de la solution, caractérisé en ce qu' il comprend l'utilisation d'un modèle spatio-temporel local de transport des molécules à travers la colonne chromatographique, pour exprimer des chromatogrammes modélisés associés chacun à une des espèces moléculaires , ce modèle étant représenté sous la forme d'un système à espace-état, puis une opération numérique d'inversion faisant intervenir des valeurs (m) du chromatogramme de la solution et des valeurs (y) des chromatogrammes modélisés pour déterminer lesdites concentrations (c) .

2. Procédé de détermination de concentrations de molécules selon la revendication 1, caractérisé en ce que le modèle spatio-temporel de transport des molécules comprend, pour chacune des espèces, une équation d'évolution de concentration des molécules de ladite espèce et une équation d' interaction des molécules de la phase mobile avec la phase stationnaire .

3. Procédé de détermination de concentrations de molécules selon la revendication 2, caractérisé en ce que l'équation d'évolution exprime la concentration pour chaque point de la colonne chromatographique en fonction de concentrations antérieures audit point et à des points voisins, lesdites concentrations antérieures étant pondérées par des coefficients.

4. Procédé de détermination de concentrations de molécules selon la revendication 3, caractérisé en ce que les coefficients sont des expressions de paramètres comprenant des paramètres de la colonne chromatographique, des paramètres de pics chromatographiques d'étalonnage des espèces, et des paramètres d'ajustement.

5. Procédé de détermination de concentrations de molécules selon la revendication 4, caractérisé en ce que les paramètres de la colonne chromatographique comprennent une longueur (L) et un paramètre (F) fonction de la porosité de ladite colonne .

6. Procédé de détermination de concentrations de molécules selon la revendication 4, caractérisé en ce que les paramètres de pics chromatographiques d'étalonnage comprennent un paramètre (D₁) de diffusion des molécules du soluté.

7. Procédé de détermination de concentrations de molécules selon la revendication 4, caractérisé en ce que les paramètres comprennent encore un paramètre lié à une vitesse d'un solvant (u_s) dans la colonne chromatographique.

8. Procédé de détermination de concentrations de molécules selon la revendication 4, caractérisé en ce que les paramètres d'ajustement comprennent des pas d'échantillonnage spatiaux (Δz) , le long de la colonne chromatographique, et temporels (Δt) .

9. Procédé de détermination de concentration de molécules selon la revendication 4, caractérisé en ce que les paramètres comprennent encore des paramètres décrivant une modification de composition d'un solvant avec le temps.

10. Procédé de détermination de concentrations de molécules selon la revendication 2ou

3, caractérisé en ce que l'équation d'évolution est : dc(z,t) , dq(z,t) , dc(z,t) d²c (z,t) h r h U. = Ul dt dt dz dz²

11. Procédé de détermination de concentrations de molécules selon la revendication 4, caractérisé en ce que le modèle de transport est

exprimé par

où n correspond à un échantillonnage du temps de 1 à nt, A est une matrice d'état, B une matrice d'entrée, C une matrice de sortie et D une matrice de commande directe, A, B, C et D dépendant du temps,

et est un vecteur-colonne de dimension

L_ nz=- AZ

est une matrice carrée de dimension nz ;

est un vecteur-colonne de dimension nz ;C(p) = (Q ••• 0 l) est un vecteur-ligne de dimension nz, avec y(ri) = c(—,ri) ; D(p) est choisie è volonté, et Az

I(i),J(n)et K(p) sont des coefficients.

12. Procédé de détermination de concentrations de molécules selon la revendication 11, caractérisé en ce que :

At(ID₁-U₅Az) Az² (1 + Fk)-ID₁At

KP) = , J(P) =

2Az² (1 + Fk) Az² (1 + Fk)

Δf(2D,+M.Δz)

K(p) =

2Az^z(l + Fk) où F est un facteur de porosité de la colonne chromatographique, D₁ un facteur de diffusion chromatographique, et Δ_t et Δ_z des pas d'échantillonnage temporel et spatial du modèle.

13. Procédé de détermination de concentrations de molécules selon la revendication 9, caractérisé en ce que le modèle de transports est

^'x{μ +1) = A(n,p)x(ή) + B(n,p)u(n) exprime par y(n) = C(n,p)x(n) + D(n,p)u(n)

X(O) = X₀(P) où n correspond à un échantillonnage du temps de 1 à nt, A est une matrice d'état, B une matrice d'entrée, C une matrice de sortie et D une matrice de commande directe, A, B, C et D dépendant du temps,

X(Il) est un vecteur-colonne de

L_ dimension nz= AZ

A(P)

est une matrice carrée de dimension nz ;

est un vecteur-colonne de dimension nz ; C(p) = (0 ••• 0 l) est un vecteur-ligne de dimension nz, avec y(ri) = c(— ,ri) ; D(p) est choisie à volonté, et Az

I (i, n, p) , J (i, n, p) et K(i,n,p) sont des coefficients.

14. Procédé de détermination de concentrations de molécules selon la revendication 13, caractérisé en ce que :

où F est un paramètre de porosité de la colonne chromatographique, k_w un facteur de rétention, S une pente de gradient, φ une concentration, D₁ un facteur de diffusion chromatographique et Δ_z et Δ_t des pas d'échantillonnage spatial et temporel du modèle.

15. Procédé de détermination de concentrations de molécules selon l'une quelconque des revendications précédentes, caractérisé en ce que des paramètres de gain de l'appareillage (α,β) sont déduits par une recherche de minimum d'une fonction qui est une différence entre des signaux mesurés pour des molécules de concentration connue et des expressions où interviennent lesdits paramètres de gain, le modèle de transport des molécules et lesdites concentrations connues.

16. Procédé de détermination de concentrations de molécules selon l'une quelconque des revendications précédentes, caractérisé en ce que la concentration sont obtenues par une recherche d'un minimum d'une fonction qui est une différence entre des signaux mesurés pour lesdites molécules et des expressions où interviennent lesdits paramètres de gain, le modèle de transport des molécules et lesdites concentrations .

17. Procédé de détermination de concentrations de molécules selon les revendications 4 et 15, caractérisé en ce que certains des paramètres sont réévalués pendant la recherche de minimum.

18. Procédé de détermination de concentration de molécules selon l'une quelconque des revendications 1 à 16, caractérisé en ce qu'il comprend l'utilisation d'au moins un algorithme de minimisation stochastique de type bayésien pour obtenir une adéquation entre les mesures et le modèle.

19. Procédé de détermination de concentrations de molécules selon la revendication 11, caractérisé en ce que :

D At u_s AzAt + 2D₁At u AzAt + D, At

HP) = r J(P) = 1 - _r K(_P) =

Az (1 + Fk) Az (1 + Fk) Az (1 + Fk) où F est un facteur de porosité de la colonne chromatographique, D₁ un facteur de diffusion chromatographique, et Δ_t et Δ_z des pas d'échantillonnage temporel et spatial du modèle.

20. Procédé de détermination de concentrations de molécules selon la revendication 13, caractérisé en ce que :

21. Procédé de détermination de concentrations de molécules selon l'une des revendications précédentes, caractérisé en ce que le chromatogramme est obtenu à partir d'un spectrogramme .