PROCEDE DE MESURES DE CONCENTRATIONS D'ESPECES MOLECULAIRES
AU MOYEN D'UN CHROMATOGRAMME
DESCRIPTION
DOMAINE TECHNIQUE
On traite ici d'un procédé de détermination
5 de concentrations d'espèces moléculaires sur un chromatogramme .
On recourt souvent à des techniques de séparation pour l'analyse de mélanges. Les appareils différents peuvent comprendre une colonne0 chromatographique pouvant être couplée à un spectromètre de masse. Dans le cas particulier des fluides biologiques où on cherche à mesurer la concentration de différentes protéines, un module de digestion peut être ajouté en amont pour décomposer les5 protéines en peptides dont l'étude est plus facile. Les colonnes chromatographiques sont fondées sur les vitesses différentes prises par les espèces chimiques d'un mélange pour la parcourir et leur séparation consécutive. Un spectrogramme mesuré est un signal à0 deux dimensions correspondant à la sortie du spectromètre de masse. L'une des dimensions est sensible au temps de rétention des différentes espèces dans la colonne chromatographique, l'autre dimension correspond au rapport masse sur charge associé à5 chacune des espèces. Ces données consistent en un spectre composé d'une succession de pics. En faisant la projection du spectrogramme sur la dimension temps de rétention ou en faisant une coupe à une masse donnée, on obtient un chromatogramme mesuré, à savoir une image
du signal de sortie de la colonne chromatographique . L'étude du spectrogramme ou du chromatogramme permet de déterminer les espèces chimiques du mélange et leurs concentrations . II faut toutefois admettre que des résultats précis sont difficiles à obtenir, notamment pour deux raisons. La superficie des pics, qui exprime la concentration de l'espèce chimique concernée, peut être difficile à évaluer en raison du bruit de l'appareil ou de la fluctuation des paramètres physiques de la colonne de chromatographie ; aussi, la forme et la position du pic peuvent varier d'une expérience à l'autre en raison de caractéristiques différentes des colonnes chromatographiques, de conditions de mesures différentes ou d'une simple dispersion statistique. Ces inconvénients sont d'autant plus marqués que les espèces chimiques sont nombreuses et leurs concentrations très faibles, ce qui est le cas des protéines dans les liquides biologiques, où on cherche souvent certaines protéines rares. C'est par exemple le cas des marqueurs sanguins du cancer, qu'on trouve dans le plasma à des concentrations de l'ordre de 1 à 1000 picomoles/litre, ou de 1 à 1000 femtomoles par millilitre de plasma. Parmi les méthodes connues, la plus simple d'entre elles consiste à isoler chaque pic, à évaluer la concentration par des mesures de leur hauteur sur la durée d'élution correspondante (selon l'axe du chromatogramme) ou même par une seule mesure de hauteur, et à déterminer de quelle espèce chimique il s'agit d'après la position du pic sur le spectrogramme.
Les inconvénients mentionnés ci-dessus d' imprécision du résultat obtenu et même de difficulté à identifier correctement les espèces chimiques en présence de mélanges complexes sont particulièrement marqués dans ce procédé rudimentaire .
Une autre méthode consiste à utiliser une décomposition numérique du spectrogramme par une analyse factorielle pour isoler les pics. Les pics des peptides d' intérêt sont obtenus à partir de calibrations d'échantillons de compositions connues. Mais les inconvénients classiques ne sont pas suffisamment éliminés, par exemple à cause des disparités entre les conditions de mesure à la calibration et à l'étude de l'échantillon, qui sont difficiles à évaluer et à corriger. L'article de Forssén et autres « An improved algorithm for solving inverse problems in liquid chromatography » paru dans Computer & Chemical Engineering (Elsevier) , vol.30, n°9, est une variante de cette méthode dans laquelle les pics d'élution sont obtenus par simulation à partir d'équations isothermes (mettant en relation la phase mobile et la phase stationnaire d'un soluté dans une colonne chromatographique) ; ces équations sont aussi exploitées dans les réalisations envisagées de l'invention pour construire le modèle, mais l'antériorité préconise de faire coïncider les pics simulés et les pics expérimentaux par un ajustement des paramètres de modélisation de ceux-là, ce qui peut donner des difficultés de convergence dans le cas d'un grand nombre de solutés, dont les paramètres doivent ajustés plus ou moins indépendamment alors qu'il est
difficile de tenir bon compte des imprécisions dans la mesure ou l'estimation des paramètres. L'article « An improved algorithm for solving inverse chromatography » par Jakobsson et autres, Journal of chromatography A (Elsevier) , vol.1063, décrit un procédé similaire d'analyse factorielle avec l'emploi d'un modèle pour simuler les pics d'élutions indépendamment.
L' invention est relative à un procédé amélioré de détermination de concentrations des espèces moléculaires dans une solution passée dans une colonne chromatographique et un spectromètre de masse. On entend par solution un mélange homogène, présentant une seule phase, de deux ou plusieurs corps. Elle est fondée sur l'utilisation d'un modèle spatio-temporel local théorique de transport des molécules à travers la colonne chromatographique pour exprimer des chromatogrammes modélisés associés chacun à une des espèces, plus précis qu'avec une calibration empirique. De plus, le modèle est exprimé sous forme d'une représentation à espace-état, dont la forme générale sera rappelée dans la description détaillée. Les représentations à espace-état sont employées notamment en automatique pour prédire l'évolution de systèmes physiques d'après des commandes qui y sont introduites ; elles sont adoptées ici puisqu'elles autorisent une inversion du système d'équations comprennent les résultats et les paramètres du modèle de façon assez simple et directe pour distinguer sur le chromatogramme les contributions des différentes espèces chimiques qui composent l'échantillon, et enfin de déduire leurs concentrations respectives.
Un modèle rigoureux étant utilisé pour exprimer les chromatogrammes modélisés, on peut s'attendre à une meilleure identification des pics du chromatogramme d'étude, donc à une meilleure évaluation de la composition de l'échantillon, et à une meilleure évaluation des concentrations, d'autant plus que l'inversion du système est faite de façon simple. Une autre considération importante est que les paramètres physiques de l'appareil de mesure étant tous conjoints aux résultats expérimentaux dans les équations découlant du modèle, celles-ci sont résolues numériquement avec la faculté de faire varier ces paramètres physiques en plus des inconnues (les concentrations à déterminer des solutés) afin d'obtenir une meilleure résolution, en corrigeant ainsi probablement des imprécisions faites auparavant en les estimant ou les mesurant.
Le modèle de transport des molécules exprimant les chromatogrammes modélisés peut comprendre, pour chacune des espèces, une équation d'évolution de concentrations des molécules de ladite espèce, le long de la colonne chromatographique, avec le temps. Cette équation découle directement des réactions chimiques d' adsorption et de désorption des molécules sur le matériau solide de la colonne, qui obéit à des lois simples et connues.
Cette équation d'évolution peut favorablement exprimer la concentration à chaque point de la colonne chromatographique en fonction de concentrations antérieures à ce point et à des points
voisins, par une simple combinaison pondérée par des coefficients .
Ces coefficients peuvent être déterminés analytiquement ou empiriquement. Ils sont des fonctions de paramètres comprenant notamment des paramètres de la colonne chromatographique, des paramètres des pics chromatographiques d'étalonnage et des paramètres d' ajustement .
Les paramètres de la colonne chromatographique comprennent éventuellement une longueur et un paramètre fonction de sa porosité. Les paramètres des pics chromatographiques d'étalonnage comprennent éventuellement un ou plusieurs paramètres de position des pics et de forme des pics, déterminés empiriquement par une calibration.
Les paramètres d'ajustement peuvent comprendre des pas d'échantillonnage spatiaux, le long de la colonne chromatographique, et temporels.
D'autres paramètres peuvent être ajoutés au modèle, comme une vitesse d'un solvant dans la colonne chromatographique ou des paramètres décrivant une modification de composition d'un solvant avec le temps, quand la chromatographie est faite par exemple en mode de gradient, avec une introduction progressive d'un solvant plus fort que le solvant utilisé à l'origine.
L' invention sera maintenant décrite par deux modes de réalisations principaux : un mode dit isocratique où la composition du solvant responsable du mouvement de l'échantillon à travers une colonne de chromatographie reste constante, et un mode dit de gradient où la composition du solvant change, un
solvant plus fort remplaçant progressivement un solvant d' origine .
L' invention sera maintenant décrite en liaison aux figures: -la figure 1 représente un appareillage,
-la figure 2 un signal de chromatogramme mesuré et un signal de chromatogramme modélisé,
-et la figure 3 est un logigramme du procédé . Le dispositif d'exploitation peut être celui de la figure 1, où un échantillon sanguin à étudier, par exemple, passe par un module de digestion 1 qui décompose les protéines en peptides dont la mesure et l'étude sont plus faciles, puis par la colonne de chromatographie 2 et par un spectromètre de masse 3. Le signal alors émis est un spectrogramme bidimensionnel ; il est fourni à un module de traitement 4 qui met en œuvre le procédé d'exploitation du spectre, constitutif de l'invention, pour en déduire les concentrations des peptides de l'échantillon. Comme précédemment écrit, il est alors possible d'établir un chromatogramme de l'échantillon en faisant la projection du spectrogramme sur la dimension de temps de rétention ou en faisant une coupe à une masse donnée. Mais l'invention s'applique naturellement à un chromatogramme directement mesuré en sortie de la colonne de chromatographie.
L' invention peut être appliquée avec d'autres dispositifs. C'est ainsi qu'un module d'enrichissement, pouvant comprendre des étages de déplétion ou de capture par affinité, en amont du
module de digestion peut être ajouté pour faire une première sélection des protéines d'intérêt. Aussi, le module de digestion 1 est facultatif : le signal arrivant au module de traitement 4 serait analogue mais représentatif de protéines plutôt que peptides, de sorte que l'invention serait appliquée sans changement pour donner les concentrations de ces protéines. Le spectromètre de masse 3 peut avoir différents modes de fonctionnement, ceci n'influençant pas les traitements du module 4. Le mode classique appelé mode MS (Mass Spectrometry) où l'on étudie une plage de masses peut être remplacé par le mode MS-MS où l'on procède à un refractionnement des peptides de certaines masses ou encore le mode MRM (Multiple Reaction Monitoring) où l'analyse est faite pour seulement quelques masses prédéfinies. Enfin, le spectromètre de masse 3 est lui aussi facultatif, et le signal issu du chromatographe 2 et traité par le module de traitement 4 serait un spectre monodimensionnel qui serait traité de la même façon.
L' invention pourrait aussi être appliquée à d'autres genres d'échantillons ou de produits à mesurer .
Le module de traitement 4 travaille en accomplissant une inversion numérique du signal qu'il reçoit pour donner les concentrations des peptides, ou en général des produits mesurés par le dispositif. Il s'appuie sur une modélisation du signal en fonction des différents paramètres, dont lesdites concentrations et d'autres paramètres, connus par une calibration ou une autre mesure, ou inconnus.
La figure 3 donne une représentation générale du procédé. Des modèles de la colonne chromatographique 2 (El), du solvant (E2) et du soluté (E3) sont élaborés pour décrire l'écoulement dans la colonne chromatographique 2, l'adsorption du soluté par ladite colonne et la loi d'alimentation en le solvant. La synthèse de ces modèles particuliers donne un modèle général d'espace-état (E4) qui décrit complètement le signal issu de la colonne chromatographique 2 en fonction de divers paramètres, qui peuvent être évalués (E5) par des calibrations particulières, des mesures, des hypothèses, ou qui dépendent de choix arbitraires. Quand une mesure a été faite sur un fluide inconnu, donnant un chromatogramme expérimental, elle peut entrer dans l'écriture d'un système où elle correspond au modèle pondéré par les paramètres. La résolution de ce système (E6) par inversion numérique donne les concentrations des solutés (E7) du fluide inconnu. Les paramètres peuvent toutefois être réajustés (E8), la résolution étant généralement itérative.
Les étapes du procédé seront détaillées à peu près dans l'ordre de leur présentation. Des compléments et des généralisations seront donnés à 1' occasion . Voici maintenant comment le modèle numérique du signal est créé. PARAMETRES DU MODELE
1) Un élément du modèle découle du transport progressif des solutés tels que les protéines dans la colonne chromatographique. Le transport peut être représenté par l'équation (1) ci-dessous, qui
donne la concentration du soluté adsorbé q sur la phase stationnaire (résine échangeuse d'ions) de la colonne par rapport à la concentration du soluté dans la phase mobile c au même endroit (abscisse z) et au même instant (t) : dc(z,t) | Fdq(z,t) | u dc(z,t) = D.d2c(z,t) dt dz Us dz l dz2 où F est le rapport des volumes occupés par la phase mobile et la phase stationnaire (facteur de porosité) , us la vitesse de propagation du solvant, et D1 un facteur représentant la dispersion qui contribue à l'étalement des pics de chromatographie (appelé facteur de diffusion) .
2) Une autre caractéristique de l'état de la colonne chromatographique concerne l'adsorption du soluté sur la phase stationnaire de la colonne, c'est- à-dire l'interaction des molécules de la phase mobile avec la phase stationnaire. Une modélisation peut être faite, par exemple pour un régime stationnaire, ce qu'on appelle isotherme, à l'équilibre. Un exemple d'isotherme simple est q*=k.c*, les astérisques indiquant que l'on considère les concentrations à l'équilibre, et k étant un facteur constant, dit de rendement de réaction. Un exemple d'isotherme linéaire peut être noté q (z, t) =k. c (z, t) (2) . 3) Dans le cas d'un mode de gradient, il convient encore de modéliser l'évolution de la concentration des solvants. Dans les expériences typiques, le solvant faible est l'eau, et initialement prépondérant voire unique (100% de la concentration totale dans la solution) ; et le solvant fort φ est le
méthanol ou l' acétonitrile, qui est introduit progressivement. Dans le cas le plus simple, il n'y a pas d' interaction entre le solvant et la phase stationnaire, et le front d'injection du solvant est identique (en débit et en composition) du début à la fin de la colonne à un retard de propagation près. On peut considérer une variation linéaire de la concentration φ du solvant fort φ, entre 0 à un instant ti et une valeur maximale à un instant ultérieur t2, soit (φ (t, z=0) =φo+βt) , et en tout point du réacteur on obtient alors: φ(t,z) = φ0 pour 0<t<z/us
Z pour z/us<t. j(t,z) = jθ + b(t-—)
4) On considère maintenant le comportement du soluté. En mode isocratique (composition du solvant constante), le facteur de rétention k introduit en 2) est défini comme k= (tR-to) /Fto, où to est le temps mort ou temps de rétention de la colonne pour sortir les composés non retenus, tR est le temps de rétention du soluté considéré, et F est le paramètre de porosité, vu en 1, de la phase stationnaire et indépendant du solvant. En mode de gradient, k est une fonction de φ et une relation telle que In k (φ) =ln kw-S.φ , kw étant le facteur de rétention dans l'eau et S la pente du gradient, est communément utilisée. 5) Des modèles plus complexes pourraient être pris en compte ainsi que certaines colonnes chromatographiques comprenant des phases stationnaires
en piliers poreux. Du liquide se trouve alors presque immobile et forme une phase stagnante. Les transferts de soluté peuvent se réaliser entre la phase mobile et la phase stationnaire, la phase stagnante et la phase stationnaire, et la phase mobile et la phase stagnante. La diffusion moléculaire comprendrait être une diffusion axiale dans la phase mobile. Des isothermes non linéaires peuvent encore être introduits pour tenir compte de la variation souvent constatée du rendement de l'échange selon les concentrations de soluté dans la phase mobile et la phase stationnaire. Enfin, par rapport à l'équation (2), un isotherme non linéaire ou encore un isotherme liant le soluté et le solvant en cas d' interaction entre le solvant et la phase stationnaire pourrait être proposé. On trouvera une description d'un isotherme non linéaire dans l'ouvrage « Fundamentals of preparative and nonlinear chromatography » chapitres 3 et 4 (auteurs: Guiochon et al, Elsevier Académie Press - second édition) , et une autre description dans l'article « Maas loadability of chromatographic columns », par Poppe et Kraak, paru dans le « Journal of chromatography », 255 (1983), p.395 à 414, Elsevier Scientific Publishing Company. Enfin, les isothermes non linéaires tels que déterminés dans le document "An improved algorithm for solving inverse problems in liquid chromatography" par P. Forssén, paru dabs Computers and Chemical Engineering, 2006, pages 1381 - 1391, peuvent être utilisées.
INFLUENCE DE LA CALIBRATION INTERNE
Dans la suite du procédé, on considère des protéines alourdies dans l'échantillon. Il s'agit de protéines d'étalonnage couramment utilisées dans l'art pour tenir compte de variations de résultats de la colonne chromatographique, notamment du temps de rétention des composés des échantillons. Ces protéines alourdies sont presque identiques aux protéines recherchées mais enrichies en isotopes lourds et donc bien identifiables au spectromètre de masse 3. Introduites en concentrations connues, elles permettent de calibrer la colonne chromatographique en mesurant les hauteurs et les temps de rétention de leurs pics, au bénéfice des mesures des protéines d'étude de même espèce. Il faut toutefois souligner que l'emploi de protéines alourdies n'est pas obligatoire en pratique.
On appelle m1/D/k (n) le chromatogramme du peptide i appartenant à une protéine d'étude k dans l'échantillon j au temps n, m*!,-,,^'11' le même chromatogramme mais pour le peptide appartenant à la protéine alourdie k, mDk (n) la somme des chromatogrammes des Npep peptides appartenant à la protéine k d'étude, m* D,k(n) la même somme pour la
Npep protéine k alourdie, soit m]k(ή)='∑mι ]k(ή) et
I=I
Npep m JΛ (n) = ∑mι * j k (n) , et Hi1, -, , k <n) et m* 1/ ] i lc (n) peuvent être
I=I exprimées par : m,,},k (O = «.,* A,,,* y>,k (n' P)cj,k +£ ι,J,k (O
ml,k (") = β>,j,k y,* ("> p)c],k + s* '.J* (.*)
où cD,k est la concentration de la protéine k d'étude dans l'échantillon j, c* D,k la concentration de la protéine k alourdie, βi,D,k le gain de calibration de la chaîne de mesure pour le peptide i de la protéine k (obtenu grâce à la concentration c* D,k, connue de l'opérateur et à la mesure correspondante sur le signal) , αx,k est un gain de calibration (obtenu en utilisant une calibration externe pour un échantillon de protéines à la concentration cD,k connue), yi,k(n,p) est la réponse du chromatographe 2 pour le peptide i appartenant à la protéine k, d'après le modèle d'état indiqué ci-dessous et ε1/](k et ε*1/D,k sont des bruits, qu'il est possible de modéliser indépendamment, par exemple par des réalisations de processus aléatoires gaussiens de moyenne nulle (correspondant à un bruit blanc) et de variance déterminée. Ces bruits sont par exemple des bruits dus à la nature aléatoire des interactions dans les réactions chimiques. Il peut s'agir également de bruits électroniques, p correspond à l'ensemble des paramètres du modèle : il peut s'agir de paramètres physiques propres à la colonne ou propres aux couples (colonne - peptide) , connus ou déterminés expérimentalement, p comprend également des paramètres numériques choisis pour assurer la stabilité du modèle. Ces paramètres seront définis dans la suite du texte.
Nous supposons avoir Nc expériences de calibration pour lesquelles cD,k et c* D,k sont connues et Np expériences d'étude pour lesquelles c* D,k sont connues et cD,k (les concentrations à obtenir) sont inconnues.
EXPRESSION DU MODELE DE LA COLONNE
Les dérivées de premier ordre et de second ordre de l'équation (1) rencontrée plus haut peuvent être données par les équations (3) et (4) :
en termes de différences finies où Δz est le pas d'échantillonnage en distance et o (Δz2) désigne des termes insignifiants, représentant les résidus apparaissant lors de l'approximation d'une dérivée par une différence finie.
De plus, la dérivée temporelle du premier ordre peut être approchée par l'équation (5) dc(z,t) = —[c(i,n +l)-c(i,n)]+ o (At) dt At en termes de différences finies où Δt est le pas d'échantillonnage en temps et o (Δt) désigne des termes insignifiants .
Il est alors possible de remplacer l'équation (1) par l'équation (6) : c(i,n + 1) = I(p)c(i + !,«) + J(p)c(i,n) + K(p)c(i -1,n) ( 6 ) ,
ou
At(ID1 - U5Az) Az2 (1 + Fk) - 2D1At
I(p) = , J(P) = 2Az
2 (1 + Fk) Az
2 (1 + Fk)
ECRITURE DEVELOPPEE DU MODELE
1) Considérons d'abord le mode isocratique.
Le modèle peut être représenté par le système à espace état:
y(t) = h(x(t),p,u,t)
X(O) = X0(P)
où x(t) est un vecteur d'état, p représente les paramètres physiques du système, u représente le signal d'entrée dans le système (la fonction d'injection), y(t) la sortie du système (modèle de la colonne chromatographique pour un peptide donné à estimer) et X0 des conditions initiales du vecteur d'état. Le fait de représenter le modèle selon un système à espace-état permet d'aboutir à une forme standard de modèle dynamique, que l'on peut résoudre à l'aide d'outils existants. La fonction f est appelée fonction d'évolution de l'état, tandis que la fonction h est appelée fonction d'observation. Dans le cas d'un système discret, stationnaire et linéaire, ce système devient :
\x(n + 1) = A(p)x(ή) + B(p)u(n) y(n) = C(p)x(n) + D(p)u(n)
X(O) = X0(P)
où n correspond à un échantillonnage du temps de 1 à nt, A est une matrice d'état, B une matrice d'entrée, C une matrice de sortie et D une matrice de commande directe .
Le système peut être développé comme suit:
est un vecteur-colonne de
L_ dimension nz= AZ
est une matrice carrée de dimensions nz ; I (p) , J(p) et K(p) doivent être positifs pour que le système soit stable, ce qui implique des contraintes sur les pas d'échantillonnage en temps et en espace.
est un vecteur-colonne de dimension nz ; C(p) = (0 ••• 0 l) est un vecteur-ligne de dimension nz,
avec y(n) = c(—,ri) ; D(p) est ici une matrice qui peut Az être choisie à volonté, ou être nulle, ce qu'on suppose ici .
2) Voici maintenant comment le système espace-état est formé en mode de gradient. Il devient : x(n + 1) = A(n,p)x(n) + B(n, p)u(n) y(n) = C(n, p)x(n) + D(n,p)u(n)
X(O) = X0(P) qui diffère du précédent en ce que les matrices A, B, C et D dépendent du temps n. L'isotherme peut alors être défini par la relation (7), et le gradient par les relations (8) et (9) ci-dessous pour les hypothèses données d'un gradient linéaire, q(z,t) = k(z,t)c(z,t) (7)
In k(z,t) = In kw - Sφ(z,t) => k(z,t) = k^-5^0 (8)
La dérivée de l'équation (7) donne l'équation (10) :
fo(Z'') _ = k U(z-j Λ)^dc(^z,t) + , ≡ dk(^z,t) c „,(z_j A) _ = k hwe ^-S s φ^(zX) ^ dc^(z,t) Çh dφ(z,t) ^SφUf ddtt dt dt dt dt
( 10 ) ,
et l'équation
dc(z,t) dφ{: >0 Sφ(:
(l + Fkwe-Sφ<z't))^^--SFk J) dc(z,t)=∑> d2c(z,t) c(z,t) + u, dt dt dz dz
(ii:
est obtenue des équations (1) , (8) et (10) . Exprimée sous forme de différences finies, elle devient l'équation (12) :
(C(I +l,n)-2c(i,n)+ c(i-l,n))
c(i, n + 1) =
D,
At(l + Fkwe-Sφ(ι'n>Y :(i + l,n)
D,
+ At(l + Fkwe-Sφ(ι'n>Y :{i-U)
Az2 2Az (12;
qu'il est possible d'exprimer de façon simplifiée par l'équation (13) : c(i,n + ï) = I(i,n,p)c(i + l,n) + J(i,n,p)c(i,n) + K(i,n,p)c(i —l,n) (13)
où les coefficients I, J et K ont une forme plus compliquée que précédemment :
I(i,n,p) = At(l + Fkwe s^n>y
Az2 2Az _
D1 K(i,n,p) = At(l + Fkwe-SφMY i Us 1
Le problème a alors la forme du système suivant x(n +1) = A(n, p)x(n) + B(p)u(n) y(n) = C(p)x(n) x(O) = xo(p)
où x, B, C et D sont identiques à ceux du mode isocratique et où A est exprimé de la façon suivante :
J(l,n,p) I(l,n,p) 0 K(2,n,p) J(2,n,p) I(2,n,p) 0 0
A(n,p) = K(i,n,p) J(i,n,p) I(i,n,p)
0
0 K(nz-\,n,p) J(nz-\,n,p) I(nz-\,n,p)
0 0 K(nz,n,p) J(nz,n,p)
Dans tous les cas, on en déduit y(n) pour n=l à n=nt, nt étant l'abscisse maximum du chromatogramme (nombre de points en temps de rétention) c'est-à-dire un modèle d'état du signal de sortie de la colonne chromatographique pour un peptide donné pour le mode considéré (isocratique ou gradient) . Ce modèle est typiquement celui d'un pic d'élution. Il est une fonction du temps et dépend aussi des facteurs physiques de l'appareillage. Il est supposé reproduire le signal qui serait effectivement mesuré à la sortie de la colonne de chromatographie 2 pour ce peptide dans les mêmes conditions de mesure. Il porte la référence 5 à la figure 2.
PREMIERE EVALUATION DES PARAMETRES
Voici maintenant comment les paramètres physiques p sont déterminés. On peut distinguer trois catégories : certains sont des paramètres fixes qu' il est possible de déterminer par des mesures comme L, longueur de la colonne, et F, coefficient de rapport de phase, corrélé à la porosité e de la colonne chromatographique par la relation F=- -. Une deuxième e catégorie de paramètres est déterminée expérimentalement sur un chromatogramme expérimental : il s'agit de la vitesse du solvant us, en mesurant le temps de rétention to d'un marqueur sans interaction avec la phase stationnaire et en appliquant simplement la relation : u = — ;
de même k représentent
respectivement le temps de rétention et la variance statistique (représentant l'étalement) du pic du peptide dans un chromatogramme. On s'est ici placé dans le cas d'une isotherme linéaire. Dans le cas d'une isotherme non linéaire, d'autres paramètres définissant cette isotherme peuvent être pris en compte : il peut s'agir de concentrations de peptides, mais aussi de constituants du solvant. Enfin, les paramètres Δt et Δz de la troisième catégorie sont des pas d'échantillonnage en temps et en longueur, choisis arbitrairement pour
respecter les contraintes de stabilité de résolution du système numérique.
En mode de gradient, d'autres catégories de paramètres doivent être considérées. Certains paramètres servent d'abord à modéliser la concentration du solvant fort en fonction du temps mais ils sont connus puisque cette concentration dépend de l'opérateur. Les coefficients kw et S sont déterminés par des calibrations supplémentaires mettant en jeu un peptide déterminé.
RESOLUTION DU SYSTEME ET OBTENTION DES RESULTATS
On procède maintenant à des recherches successives de minimums de fonctions d'erreurs pour inverser le système complexe exprimant le signal en fonction des paramètres de la modélisation et des inconnues. De plus, dans le cas où le système est faiblement reproductible d'une expérience à l'autre, il est possible de réajuster les paramètres trouvés auparavant pour donner de meilleurs résultats. Il est à noter que plutôt qu'un algorithme de minimisation déterministe, tel une minimisation quadratique, il est possible d'utiliser d'autres critères d'adéquation entre les mesures et le modèle tels que des algorithmes de minimisation stochastique de type bayésien.
1) Les facteurs de calibration αi,k et βi,j,k, exprimant le gain de l'appareillage doivent maintenant être déterminés. On commence par estimer les facteurs (βi,j,k) pour chaque expérience (expérience d'étude ou expérience de calibration) par un calcul dans lequel on ajuste à la fois les paramètres
physiques p et ces facteurs de calibration βi,D,k pour rechercher un minimum, soit min \\m* , -β, , kyιk(p)c* A + λ\\p- pΛ où m* x -, k sont les valeurs βιjk,p" 'J' 'J' ' J' " " " mesurées des spectrogrammes des échantillons de calibration comprenant des peptides alourdis, C* D,k les concentrations connues de ces peptides, et Yi,k(p) correspond à l'écriture développée du modèle en fonction de x, A, B, C, et D ; λ est un coefficient de minimisation arbitraire et po est une valeur initiale, obtenue précédemment des paramètres physiques p du modèle. Ce coefficient de minimisation peut être déterminé selon la confiance que l'on peut accorder aux paramètres physiques initiaux p0 : plus on a confiance en la détermination des paramètres initiaux p0, plus ce coefficient λ sera fort, de façon à minimiser les variations des paramètres physiques p lors de l'étape de minimisation. Ainsi, cette étape de minimisation agira principalement sur l'ajustement des facteurs de calibration βij,k. Seuls les paramètres physiques p qui souffrent d'imprécision d'évaluation sont réévalués, les paramètres physiques précisément déterminés étant alors fixés. Ce calcul ne peut toutefois pas être entrepris s'il n'y a pas de peptide d'étalonnage ; alors les coefficients βi,D,k sont supposés tous égaux à 1.
Lors des expériences dites d'étude, c'est- à-dire permettant les expériences mettant en œuvre un échantillon à étudier, comprenant alors des espèces moléculaires dont on cherche à déterminer les concentrations, on utilise un étalon dit interne,
c'est-à-dire présent dans l'échantillon étudié. Il s'agit généralement de protéines alourdies ou de peptides alourdis.
Lors des expériences dites de calibration, on utilise un ou de préférence plusieurs étalons dits externes, c'est-à-dire des échantillons d'étalonnage différents de l'échantillon étudié afin de permettre l'identification de paramètres de modèles. Ces échantillons d'étalonnage comprennent des espèces moléculaires, par exemple des protéines ou des peptides dont on connaît la concentration.
Le fait d'utiliser un étalon interne permet l'ajustement de tout ou partie des coefficients βi,D,k ou des paramètres de la colonne p, simultanément à l'étude de l'échantillon. Cela convient particulièrement lorsqu'on utilise dispositif dit instable, c'est-à-dire pour lequel les coefficients βi,D,k ou les paramètres p peuvent varier d'une expérience à une autre. L'invention permet donc d'estimer des paramètres propres à la colonne de chromatographie (paramètres p) ainsi que le gain de calibration pour un peptide i (coefficient βi,D,k) simultanément à la réalisation d'expériences de mesure, ce qui est un des avantages de l'invention. Cela est notamment rendu possible par une représentation du modèle par un système à espace-état, dont la résolution permet l'estimation de la fonction de sortie du système (fonction y) en fonction des paramètres p de la colonne de chromatographie.
2) Une seconde étape consiste à calculer les autres coefficients de calibration α
x,
k sur les Nc expériences de calibration.
pour i=l à N
pep (tous les peptides) , les paramètres physiques p pouvant encore être réévalués.
Ce calcul ne peut toutefois pas être entrepris s'il n'y a pas d'expérience de calibration ; alors les coefficients αx,k sont supposés tous égaux à 1. Le coefficient 1 est à nouveau un coefficient de minimisation, que l'on ajustera en fonction de la confiance que l'on accorde à la détermination des paramètres initiaux p0.
3) La résolution finale, permettant de déterminer les concentrations C
D,
k des protéines d'étude k dans les Np expériences d'études, consiste en une nouvelle recherche de minimum selon
à chaque expérience j, m
D,
k représentant les sommes des m
lι3ι]ç comme on l'a vu.
Ces calculs sont de réalisation facile sur un ordinateur. Un exemple de résultat obtenu est à la figure 2, où un signal modélisé 5 (y(t)) est superposé au signal effectivement mesuré 6 après avoir été pondéré par la concentration c et les gains de calibration trouvés par le calcul, et aussi après la réévaluation des paramètres physiques p à partir de po, qui a pu corriger des défauts d'évaluation de la forme
(étalement) ou de la position du pic dans le modèle 5: la concordance est excellente.
Le procédé décrit dans cette demande trouvera son application dans l'analyse de fluides
biologiques et en particulier le sang. Mais il pourra également être mis en œuvre dans la caractérisation de bactéries par leur protéome. AUTRE MODE DE REALISATION DE L' INVENTION EXPRESSION DU MODELE DE LA COLONNE
Les dérivées de premier ordre et de second ordre de l'équation (1) rencontrée plus haut peuvent être désormais données par les équations (3') et (4'), au lieu de (3) et (4) : [c(i,n)- c(i -1,n)]+ o(λz) (3'
d2c(z,t) = —-[c(i +Xn)- 2c(i,n)+ c(i -1,n)]+ o(Az2) ( 4 ' )
F)7 2 Δz
On propose d'utiliser un schéma explicite décentré en amont en approchant la dérivée d'ordre 1 en z par une différence finie amont. Ceci est motivé par le fait que l'utilisation d'un tel schéma permet de relâcher les contraintes de stabilité par rapport à un schéma explicite centré. Les contraintes de stabilité étant moindres, les pas d'échantillonnage en temps Δt et en espace Δz pourront être choisis plus grands et ainsi le temps de calcul global de l'algorithme sera fortement réduit .
Le schéma décentré amont est choisi car la vitesse du solvant us est positive. Si ce n'était pas le cas, on choisirait un schéma décentré aval, le but étant toujours d'aller chercher l'information en «remontant le courant». On retrouve l'équation (6)
c(i,n + 1) = I(p)c(i + !,«) + J(p)c(i,n) + K(p)c(i -1,n) (6:
où toutefois les coefficients deviennent :
DAt us AzAt + 2D1At usAzAt + DtAt
I(P) = , J(P) = 1- , K(p) =
Az (I + Fk) Az2 (1 + Fk) Az2 (I + Fk)
Au lieu de l'équation (12) , on trouve une équation (12') légèrement modifiée :
(l + Fkwe-S^> )jt-(c(i,n + l)-c(i,n))- FSkw -Sφ(ι,n) c(i,n) =
D
- ^- (c(i, n) - c(i - 1, n)) + -\ (c(i + l,n)- 2c(i, n) + c(i -l,n))
A
c(i, n + 1) =
D,
At(l + Fkwe-Sφ('-n)) :(i+l,n)
- At(l + Fkwe-Sφ(ι'n>Y :(i-l,n)
Az (12' )
et, dans l'équation (13) identique à celle qui a déjà été rencontrée, : c(i,n + ï) = I(i,n, p)c(i + \,n) + J(i,n,p)c(i,n) + K(i,n,p)c(i -\,n) (13)
les coefficients I, J et K s'écrivent :
D1
I(i,n,p) = At(l + Fkwe-SφMY V1 r
Az2 _
K(i,n,p) = At(l + Fk
we-
SφMY r
Le reste du procédé, et notamment l'inversion du modèle du système, est inchangé.