-
Technisches Gebiet
-
Die Erfindung betrifft die Auswertung von medizinischen Laborgrößen, insbesondere der Hämatologie, der Urindiagnostik, der klinischen Chemie und dergleichen. Insbesondere betrifft die vorliegende Erfindung Maßnahmen zur patientenindividuellen Angabe von Referenzbereichen für die Erkennung pathologischer Abweichungen.
-
Technischer Hintergrund
-
Laborwerte der medizinischen Diagnostik, insbesondere der Hämatologie, der klinischen Chemie oder der Urindiagnostik, werden in der Regel durch medizinisches Personal ausgewertet. Diese Laborwerte werden üblicherweise durch ein medizinisches Labor oder ähnliche Einrichtungen erhoben und gemeinsam mit für diese Werte spezifischen Referenzbereichen einem Arzt zur Verfügung gestellt. Diese Referenzwerte sind meist durch Studien belegte „Normalbereiche“, wie beispielsweise der 2.5% - 97.5% Interquantilabstand einer gesunden Population, also der Bereich, innerhalb dessen bei 95 von 100 gesunden Menschen der jeweilige Wert zu beobachten ist. In einigen Fällen werden Referenzwerte auch abhängig von Geschlecht, Alter, Gewicht oder anderen Patientenmerkmalen angepasst. Laborergebnisse, deren Werte außerhalb dieses Referenzbereichs liegen, werden gesondert markiert, um deren Abweichung/Pathologie hervorzuheben.
-
Darüber hinaus sind bei besonders kritischen Werten, d.h. Ergebnissen, die eine direkte Gefahr für den Patienten bedeuten, in vielen Laboren gesonderte Prozesse zur schnellen Bereitstellung dieser Information an den Arzt implementiert.
-
Eine automatische, strukturierte und standardisierte Berücksichtigung eines zeitlichen Verlaufs von Laborgrößen ist bei der Auswertung nicht vorgesehen. Falls überhaupt durchgeführt, erfolgt eine solche Verlaufsanalyse durch den Arzt auf manuelle und oftmals subjektive und intuitive Weise.
-
Die in der modernen Medizin sehr große Anzahl an unterschiedlichen Laborgrößen, deren oftmals unklare und vielfach unbekannte Wechselwirkungen, fehlendes Fachwissen, zensierte Datengrundlagen und mangelnde statistische Kenntnisse machen es einem Arzt faktisch unmöglich, eine pathologische Abweichung zu erkennen, die nicht durch die oben erwähnte Standardmethode erfasst wurde. Gleichzeitig geht hierdurch die Chance verloren, frühzeitig problematische Veränderungen im Gesundheitszustand eines Patienten, welche sich innerhalb des Standard-Referenzbereichs eines entsprechenden Laborwerts bemerkbar machen, zu erkennen und entsprechende medizinische Maßnahmen einzuleiten.
-
Offenbarung der Erfindung
-
Erfindungsgemäß sind ein Verfahren zum Bereitstellen einer medizinischen Laborwertanalyse gemäß Anspruch 1 sowie eine Vorrichtung gemäß dem nebengeordneten Anspruch vorgesehen.
-
Weitere Ausgestaltungen sind in den abhängigen Ansprüchen angegeben.
-
Gemäß einem ersten Aspekt ist ein computerimplementiertes Verfahren zum Bereitstellen von mindestens einem Prognosewert für mindestens eine medizinische Laborgröße, insbesondere zur Anwendung in einer medizinischen Laborwertanalyse, vorgesehen, mit folgenden Schritten:
- - Bereitstellen von mindestens einem Laborwertverlauf, der einen Verlauf von historischen Laborwerten der mindestens einen Laborgröße zu mindestens zwei historischen Zeitpunkten angibt;
- - Ermitteln mindestens eines Laborgrößenmerkmals für jede der mindestens einen Laborgröße aus dem entsprechenden Laborwertverlauf;
- - Bestimmen des mindestens einen Prognosewerts zu einem vorgegebenen Prognosezeitpunkt abhängig von einem trainierten, datenbasierten Prognosemodell und abhängig von dem mindestens einen Laborgrößenmerkmal für jeden des mindestens einen Laborwertverlaufs.
-
Es kann weiterhin vorgesehen sein, dass das Prognosemodell zusätzlich ausgebildet ist, um neben dem mindestens einem Laborgrößenmerkmal Patientendaten, wie Alter, Geschlecht, BMI sowie sonstige biometrische Daten wie Größe, Gewicht und/oder eine Diagnose, ein Befund, eine Therapie und/oder eine Medikation zu berücksichtigen.
-
Üblicherweise erfolgt eine Bewertung von Laborgrößen, wie beispielsweise Größen der Hämatologie oder Urindiagnostik, durch einen Arzt meist statisch anhand der durch das Labor markierten pathologischen Werte der Laborgrößen. Die Klassifizierung als pathologisch erfolgt in der Regel nach festgelegten Referenzgrenzwerten bzw. Referenzbereichen. Eine Bewertung im zeitlichen Verlauf von Laborwerten erfolgt nicht automatisiert. Somit können problematische Trends insbesondere bei bislang unauffälligen Werten, d.h. Werten von Laborgrößen, die sich innerhalb des medizinischen Referenzbereichs bewegen, aber dennoch auf eine Pathologie hinweisen, leicht übersehen werden.
-
Das obige computerimplementierte Verfahren soll eine automatisierte Auswertung von medizinischen Laborgrößenverläufen bereitstellen und für jede Größe einen entsprechend angepassten Referenzbereich angeben, der einen Hinweis auf pathologische Abweichungen des betreffenden Laborwerts angibt. Dazu wird mindestens ein Laborgrößenmerkmal aus den jeweiligen Laborwertverläufen extrahiert, das den Verlauf der entsprechenden Laborgröße charakterisiert.
-
Eine computergestützte Bewertung von Laborwertverläufen ist in der Lage, alle zur Verfügung stehenden Laborwerte und deren Korrelationen sowie ggfs. weitere Patientendaten wie beispielsweise Alter, Geschlecht, Gewicht, Größe, Anamnese, vorhandene Vorerkrankungen und dergleichen mithilfe eines Auswertungsmodells zu berücksichtigen und dem Arzt eine Hilfestellung zur Interpretation eines Laborwerts zu geben, indem der Referenzbereich für jeden Laborwert modellbasiert ermittelt und zusätzlich zu dem Laborwert bereitgestellt wird. Dies ermöglicht es dem medizinischen Fachpersonal jeden Laborwert, nicht nur bezüglich eines „Normalbereichs“, wie beispielsweise des 2.5 %-97.5 % Interquantilabstands einer gesunden Population, sondern zusätzlich anhand eines individuellen Referenzbereiches und unter Berücksichtigung der historischen Verläufe von Laborgrößen, zu bewerten.
-
Weiterhin kann das Prognosemodell trainiert sein, um abhängig von den Laborgrößenmerkmalen mindestens einen prognostizierten Laborwert bereitzustellen, der dem mindestens einen Prognosewert zu dem vorgegebenen Prognosezeitpunkt entspricht.
-
Insbesondere kann ein Verlauf von Prognosewerten zu mehreren Prognosezeitpunkten ermittelt werden, um einen Zeitpunkt zu bestimmen, zu dem der Prognosewert einen vorgegebenen Grenzwert überschreitet, wobei insbesondere der Zeitpunkt wiederum einen Zeitpunkt einer medizinischen Intervention, wie eine Medikamentengabe, bestimmen kann.
-
Alternativ kann das Prognosemodell trainiert sein, um abhängig von den Laborgrößenmerkmalen mindestens einen prognostizierten Quantilwert als dem mindestens einen Prognosewert zu dem vorgegebenen Prognosezeitpunkt bereitzustellen. Der Quantilwert kann einen oberen oder unteren Grenzwert eines Referenzbereichs für die mindestens eine Laborgröße zu dem Prognosezeitpunkt angeben, wobei das Ergebnis eines Vergleichens eines aktuellen Laborwerts der mindestens einen Laborgröße mit dem entsprechenden Quantilwert zu dem aktuellen Zeitpunkt als Prognosezeitpunkt signalisiert wird.
-
Die Laborgrößenmerkmale für jede der Laborgrößen können eines oder mehrere der folgenden Merkmale umfassen:
- - einen minimalen Wert der historischen Laborwerte,
- - unterschiedliche Quantilwerte, wie beispielsweise das erste und das dritte Quartil und den Median;
- - den Mittelwert der historischen Laborwerte
- - einen maximalen Wert der historischen Laborwerte,
- - eine Standardabweichung der historischen Laborwerte,
- - eine Zeitdauer, um die der zuletzt erfasste historische Laborwert bezüglich des aktuellen Zeitpunkts zurückliegt,
- - eine Zeitdauer, um die der vorletzte historische Laborwert bezüglich des aktuellen Zeitpunkts zurückliegt,
- - eine Zeitdauer, um die der älteste Laborwert bezüglich des aktuellen Zeitpunkts zurückliegt,
- - einen Mittelwert der zeitlichen Abstände zwischen den Erfassungszeitpunkten der historischen Laborwerte,
- - einen jüngsten historischen Laborwert,
- - einen zweitjüngsten historischen Laborwert,
- - einen Wert des letzten Gradienten zwischen dem zweitjüngsten und jüngsten historischen Laborwert,
- - eine Zeitdauer zu einem ersten Ausreißer unter den historischen Laborwerten,
- - einen Zeitpunkt zu dem jüngsten Ausreißer unter den historischen Laborwerten,
- - eine Anzahl der historischen Laborwerte, die als Ausreißer klassifiziert werden,
- - einen maximalen Anstieg zwischen zwei aufeinanderfolgend erfassten historischen Laborwerten,
- - einen minimalen Abfall zwischen zwei aufeinanderfolgenden historischen Laborwerten,
- - einen geschätzten linearen Offset der historischen Laborwerte,
- - eine geschätzte lineare Steigung der historischen Laborwerte,
- - eine geschätzte lineare Prädiktion der historischen Laborwerte und
- - die Anzahl der historischen Laborwerte.
-
Es kann vorgesehen sein, dass mindestens eines des mindestens einen Laborgrößenmerkmals von dem vorgegebenen Prognosezeitpunkt abhängt.
-
Gemäß weiteren Ausführungsformen kann das Prognosemodell ein tiefes neuronales Netz, ein konvolutionelles neuronales Netz, ein rekurrentes neuronales Netz, eine Support Vector Machine, ein Random-Forest-Modell, ein Hidden-Markov-Chain-Modell oder ein Generalized-Linear-Modell umfassen.
-
Gemäß einem weiteren Aspekt ist ein Verfahren zum Trainieren eines datenbasierten Prognosemodells, insbesondere zur Verwendung mit dem obigen Verfahren, vorgesehen, mit folgenden Schritten:
- - Bereitstellen von mindestens einem Laborwertverlauf von mindestens einer Laborgröße, wobei jeder des mindestens einen Laborwertverlaufs einen Verlauf von historischen Laborwerten der mindestens einen Laborgröße zu mindestens drei historischen Zeitpunkten angibt;
- - Ermitteln von mindestens einem Laborgrößenmerkmal für jede der mindestens einen Laborgröße aus dem entsprechenden mindestens einen Laborwertverlauf vor einem Label-Zeitpunkt;
- - Erstellen von Trainingsdatensätzen, indem jeder Trainingsdatensatz aus dem mindestens einen Laborgrößenmerkmal für die mindestens eine Laborgröße und dem Laborwert der mindestens einen Laborgröße zu dem Label-Zeitpunkt als Label gebildet wird;
- - Trainieren des datenbasierten Prognosemodells abhängig von den Trainingsdatensätzen.
-
Figurenliste
-
Ausführungsformen werden nachfolgend anhand der beigefügten Zeichnungen näher erläutert. Es zeigen:
- 1 ein System zur Durchführung einer Laborwertanalyse;
- 2 ein Flussdiagramm zur Veranschaulichung eines Verfahrens zum Durchführen einer Laborwertanalyse; und
- 3a bis 3c entsprechende grafische Darstellung von Verläufen und Trends einer Laborgrößen eines beispielhaften Patienten und den durch das Verfahren bestimmten Prognosewerte.
-
Beschreibung von Ausführungsformen
-
1 zeigt ein herkömmliches Computersystem 1 mit einer Computereinheit 2, einer Eingabeeinrichtung 3 und einer Ausgabeeinrichtung 4 in Form eines Monitors oder dergleichen. Die Computereinheit 2 dient dazu, mithilfe einer Prozessoreinheit 21 basierend auf einer Software historische Laborwerte eines Patienten zu verarbeiten und eine Hilfestellung bei der Auswertung von aktuellen Laborwerten zu geben. Die Software und die Laborwerte von Patienten sind auf einem Datenspeicher 22 in der Computereinheit 2 gespeichert. Weiterhin speichert der Datenspeicher 22 Parameter eines nachfolgend beschriebenen Prognosemodells. Die Software wird durch die Prozessoreinheit 21 ausgeführt und greift auf die in dem Datenspeicher 22 gespeicherten Laborwerte zu. Ferner kann die Computereinheit 2 automatisch oder manuell eingegebene Laborwerte von Laborgrößen erhalten und diese verarbeiten.
-
2 zeigt ein Flussdiagramm zur Veranschaulichung eines Verfahrens zur Laborwertanalyse, das es medizinischem Personal, wie beispielsweise einem Arzt, erleichtern soll, potenziell einen Hinweis auf eine mögliche Pathologie in aktuellen und zukünftigen Laborwerten zu identifizieren und gegebenenfalls basierend auf den Ergebnissen der Laborwertanalyse Behandlungsmaßnahmen zu ergreifen.
-
Das Verfahren sieht zunächst vor, in Schritt S1 historische Laborwerte aus dem Datenspeicher der Computereinheit bereitzustellen. Die historischen Laborwerte können Laborwerte der Hämatologie, der Urindiagnostik, der klinischen Chemie, der Abstrichdiagnostik oder dergleichen sein. Insbesondere kann je nach Art der erfassten Laborgrößen eine Vielzahl von Laborwerten für die Laborgrößen erfasst werden. Beispielsweise können bei einer hämatologischen Blutuntersuchung folgende Laborgrößen bestimmt werden: AST/GOT, Leukozyten, Erythrozyten, Hämoglobin, Hämatokrit, MCV, MCH, MCHC, Thrombozyten, pH (SB-Status), pCO2 (SB-Status), Standard-Bicarbonat, O2-Sättigung, Laktat, Ca ionisiert, C-reaktives Protein, Glukose, Natrium, Kalium, Kalium aus BGA, Calcium, Kreatinin, GFR-MDRD, Harnstoff, INR (therap. Bereich), PTT und dergleichen.
-
In Schritt S2 werden aktuelle Laborwerte der Laborgrößen für den aktuellen Zeitpunkt bereitgestellt. Diese sind das Ergebnis einer kürzlich erfolgten Untersuchung und stellen die Grundlagen für die Bestimmung des aktuellen Gesundheitszustands des Patienten dar. Die aktuellen Laborwerte können manuell in das Computersystem 1 eingegeben oder automatisch über eine Kommunikationsverbindung empfangen werden. Die aktuellen Laborwerte dienen dem Arzt zur Ermittlung der Therapie. Nachfolgende Schritte sollen den Arzt unterstützen, die aktuellen Laborwerte der Laborgrößen unter Berücksichtigung der historischen Laborwerte und darin sich abzeichnender Trends auszuwerten.
-
In Schritt S3 werden zunächst aus den historischen Laborwerten Laborgrößenmerkmale extrahiert. Für jede der erfassten Laborgrößen wird eine Anzahl von Laborgrößenmerkmalen extrahiert, die zumindest teilweise verlaufsabhängig sind. Die Extraktion erfolgt ausdrücklich ohne Einbeziehung der aktuellen Laborwerte zum aktuellen Zeitpunkt. Für die oben beispielhaft genannten 26 Laborgrößen wird jeweils eine Anzahl von Laborgrößenmerkmalen extrahiert, wie beispielsweise 23 Laborgrößenmerkmale. Die Laborgrößenmerkmale für jede der Laborgrößen können folgende Merkmale enthalten:
- - einen minimalen Wert der historischen Laborwerte,
- - einen ersten Quartilwert der historischen Laborwerte,
- - einen Medianwert der historischen Laborwerte,
- - einen Mittelwert der historischen Laborwerte,
- - einen dritten Quartilwert der historischen Laborwerte,
- - einen maximalen Wert der historischen Laborwerte,
- - eine Standardabweichung der historischen Laborwerte,
- - eine Zeitdauer, um die der zuletzt erfasste historische Laborwert bezüglich des aktuellen Zeitpunkts zurückliegt,
- - eine Zeitdauer, um die der vorletzte historische Laborwert bezüglich des aktuellen Zeitpunkts zurückliegt,
- - eine Zeitdauer, um die der älteste Laborwert bezüglich des aktuellen Zeitpunkts zurückliegt,
- - einen Mittelwert der zeitlichen Abstände zwischen den Erfassungszeitpunkten der historischen Laborwerte,
- - einen jüngsten historischen Laborwert,
- - einen zweitjüngsten historischen Laborwert,
- - einen Wert des letzten Gradienten zwischen dem zweitjüngsten und jüngsten historischen Laborwert,
- - eine Zeitdauer zu einem ersten Ausreißer unter den historischen Laborwerten,
- - einen Zeitpunkt zu dem jüngsten Ausreißer unter den historischen Laborwerten,
- - eine Anzahl der historischen Laborwerte, die als Ausreißer klassifiziert werden,
- - einen maximalen Anstieg zwischen zwei aufeinanderfolgend erfassten historischen Laborwerten,
- - einen minimalen Abfall zwischen zwei aufeinanderfolgenden historischen Laborwerten,
- - einen geschätzten linearen Offset der historischen Laborwerte,
- - eine geschätzte lineare Steigung der historischen Laborwerte,
- - eine geschätzte lineare Prädiktion der historischen Laborwerte und
- - die Anzahl der historischen Laborwerte.
-
Es können auch andere Merkmale definiert werden. Ein Teil der Merkmale hängt von dem Prognosezeitpunkt ab, für den ein Prognosewert bestimmt werden soll.
-
Durch die Merkmalsextraktion entsteht eine sogenannte Merkmalsmatrix, in der jede Spalte ein Laborgrößenmerkmal repräsentiert. Beispiele für Laborgrößenmerkmale sind: mittlerer zeitlicher Abstand zwischen Messungen von Kreatinin, Gesamtanzahl der im Hämoglobinverlauf beobachteten extremen Schwankungen, maximaler Wert an Natrium usw. Die Zeilen der Merkmalsmatrix repräsentieren den Zustand eines Patienten zu einem gegebenen Zeitpunkt (als Summe seiner Merkmale).
-
Manche Machine-Learning-Modelle (bspw. Neuronale Netze) erlauben die Verwendung von Rohdaten. In diesem Fall kann auf eine Merkmalsextraktion verzichtet werden. Für eine Merkmalsextraktion spricht allerdings die Möglichkeit einer direkten Einbringung von medizinischem Fachwissen. So sind die oben beschriebenen 23 Merkmale gemeinsam ausgewählt, da diese als relevante Merkmale in Laborwertverläufen anzusehen sind. Des Weiteren bieten auf diese Weise generierte Laborgrößenmerkmale die Möglichkeit, spätere Ergebnisse leichter zu interpretieren bzw. direkt neue Fragestellungen zu generieren (siehe Feature Selection).
-
In Schritt S4 werden die einzelnen Merkmale, die sowohl in ihrer Größenordnung als auch in ihrer Steuerung stark variieren können, durch eine Normierung skaliert.
-
Beispielsweise kann eine Skalierung auf das Einheitsintervall durchgeführt werden. Alternativ kann eine Skalierung auch auf eine Standard-Normalverteilung durchgeführt werden. Grundsätzlich ist auch eine Normierung vor dem Schritt der Merkmalsextraktion möglich. Dies könnte zusätzlich zu diesem Normierungsschritt oder stattdessen sein.
-
In einem nachfolgenden Schritt S5 werden die normierten Merkmale einem Prognosemodell zugeführt. Das Prognosemodell ermittelt einen Prognosewert, der sich aus den Zeitreihen der Laborgrößen ergibt. Dazu ist das Prognosemodell trainiert, abhängig von den Laborgrößenmerkmalen einen Prognosewert zu erstellen.
-
Da der aktuelle Zeitpunkt in einigen der zuvor beschriebenen Laborgrößenmerkmalen als Prognosezeitpunkt berücksichtigt wird, ist eine Prognose auf den aktuellen Zeitpunkt möglich. Beispielsweise kann der Prognosewert einen Schätzwert der jeweiligen Laborgröße zu dem aktuellen Zeitpunkt angeben. Dies ermöglicht einem Arzt beispielsweise das Feststellen einer Abweichung von einem in den historischen Laborwerten manifestierten Trend, was beispielsweise auf eine akute Erkrankung hinweisen kann.
-
Alternativ können zwei separat trainierte Prognosemodelle bereitgestellt werden, die aus den zuvor bestimmten Laborgrößenmerkmalen einen oberen und unteren Quantilwert, beispielsweise ein 97.5 %-Quantil und ein 2.5 %-Quantil, für den Prognosezeitpunkt ermitteln. Diese können einen Referenzbereich zur Auswertung bzw. Interpretation für die jeweilige Laborgröße angeben. Der Referenzbereich gibt den Bereich an, in dem der patientenindividuelle aktuelle Laborwert der betreffenden Laborgröße zum aktuellen Zeitpunkt liegen sollte bzw. zu erwarten wäre.
-
Tritt eine Abweichung von dem aktuellen für den Patienten individualisiert bestimmten Referenzbereich bei einer oder mehreren Laborgrößen auf, so kann dies entsprechend in Schritt S6 für jede der betrachteten Laborgrößen signalisiert werden, beispielsweise durch ein farbiges Markieren, sodass der Arzt auf die entsprechende Anomalie hingewiesen wird.
-
Alternativ oder zusätzlich kann das auf die Ausgabe des aktuellen Laborwerts trainierte Prognosemodell mehrfach abgefragt werden, um für zukünftige Zeitpunkte einen Verlauf, einen Verlauf-Korridor aus Referenzbereichen bzw. einen Trend einer oder mehrerer Laborgrößen auszugeben. Dabei ist zu beachten, dass die Laborgrößenmerkmale teilweise von dem Prognosezeitpunkt abhängen und daher bei jeder Abfrage berücksichtigt werden müssen.
-
3a zeigt eine entsprechende grafische Darstellung eines Trends einer beispielhaften Laborgröße eines beispielhaften Patienten. Gezeigt ist eine personalisierte Prognose für einen Laborgrößenverlauf K der Laborgröße Kalium. Für den individuellen Patienten wurden die Verläufe OG, UG des 2,5 %- und des 97,5 %-Quantils vorhergesagt, die als gepunktete Linien dargestellt sind. Das Modell sagt somit einen Verlauf innerhalb dieses Bereichs in 95 von 100 Fällen voraus. Weiterhin sind gestrichelt die konstanten Ober- und Untergrenzen des Kaliumwerts gemäß der herkömmlichen Analysemethode dargestellt.
-
3b zeigt als alternative Ausführungsform eine Prognose des Mittelwerts in die Zukunft und der vorausichtlichen Zeit, bis dieser den Standard-Normalbereich (als gestrichelte konstante Ober- und Untergrenzen dargestellt) zum Zeitpunkt T in der Zukunft verlässt.
-
3c zeigt individualisierte Verläufe von Ober- und Untergrenzen OG, UG als gepunktete Kurven für den gesamten zeitlichen Verlauf der Laborgröße. Die Zeitpunkte T1, T2, zu denen ein Verlassen des durch die Ober- und Untergrenzen OG, UG definierten Bereichs erkannt wird, können als pathologisch erkannt werden. Dargestellt ist ein Szenario, in dem durch das Standard-Verfahren nur ein Laborwert einer Laborgröße zum Zeitpunkt T2 als pathologisch identifiziert wird. Das hier vorgestellte individualisierte Verfahren ermöglicht in diesem Szenario zusätzlich zu T2 eine frühere Identifikation eines pathologischen Laborwerts zum Zeitpunkt T1.
-
Das Prognosemodell kann zusätzlich ausgebildet sein, um Patientendaten wie Alter, Geschlecht sowie sonstige biometrische Daten wie Größe, Gewicht und dergleichen und/oder Diagnosen, Befunde, Therapien (bspw. durch ICD-10 Codes) einer Medikation zu berücksichtigen. Insbesondere das Alter kann ebenfalls entsprechend dem Prognosezeitpunkt berücksichtigt werden.
-
Das Prognosemodell kann basierend auf einer Vielzahl von Patientendaten trainiert werden. Dazu können Zeitreihen von Laborwerten von Laborgrößen zu Trainingsdatensätzen verarbeitet werden, sobald die Zeitreihe der Laborgrößen drei oder mehr Zeitpunkte umfasst. Bei den Zeitreihen kann eine Anzahl von Zeitpunkten berücksichtigt werden, um die Laborgrößenmerkmale zu ermitteln, und Label-Daten eines auf die berücksichtigten Zeitpunkte folgenden Label-Zeitpunkts, zu dem Laborwerte erfasst worden sind. Dabei sind die Laborgrößenmerkmale aus den von den Zeitpunkten der als Label-Daten verwendeten Laborwerten zu dem Label-Zeitpunkt zu ermitteln. Es ergeben sich so Trainingsdatensätze aus jeweils den Laborgrößenmerkmalen für jede der betrachteten Laborgrößen und den Label-Daten für jede der Laborgrößen als der zu trainierende Prognosewert, wie z. B. dem entsprechenden Laborwert zu dem Label-Zeitpunkt, einem entsprechenden unteren oder oberen Quantilwert zu dem Label-Zeitpunkt sowie ggfs. Patientendaten.
-
Da eine hohe Anzahl von Laborgrößenmerkmalen ermittelt wird, kann vor dem eigentlichen Trainingsverfahren des Prognosemodells ein Merkmalsauswahlschritt vorgenommen werden. Dazu kann ein sogenanntes Wrapper-Verfahren verwendet werden. Dies bedeutet, dass das Prognosemodell auf verschiedene Teilmengen der gesamten Laborgrößenmerkmale aller Laborgrößen angewendet wird, also nur auf bestimmte Kombinationen von Laborgrößenmerkmalen. Da aufgrund der hohen Anzahl nicht jede Kombination getestet werden kann, folgt das Verfahren einer vorgegebenen Heuristik. Es kann beispielsweise eine Variante der Forward Selection verwendet werden, bei der sukzessive die am besten bewerteten Laborgrößenmerkmale zu der aktuell verwendeten Teilmenge von zu berücksichtigenden Laborgrößenmerkmalen hinzugefügt werden. Als Resultat ergibt sich eine optimierte Teilmenge an Laborgrößenmerkmalen für eine bestimmte Art des Prognosewerts, wie z.B. für einen Prognosewert, der ein 2,5% Quantil einer Laborgröße angibt. Für die Wahl der vorgegebenen Heuristik zur Teilmengenauswahl können beispielsweise Backward Selection, Random Search oder andere sogenannte Monte-Carlo-Verfahren, Gradientenverfahren oder dergleichen verwendet werden. Neben Wrapper-Methoden können auch andere Verfahren zur Dimensionsreduktion, wie beispielsweise Principal Component Analysis (PCA), verwendet werden.
-
Zum Training des Prognosemodells werden die Label-Daten entsprechend dem gewünschten Ausgabewert ausgewertet. So sind die Label-Daten entsprechend dem Prognosewert vorgegeben, der beispielsweise dem unteren Quantilwert, dem oberen Quantilwert oder einem Schätzwert der entsprechenden Laborgröße entsprechen kann.
-
Nachdem die Teilmenge der Laborgrößenmerkmale bestimmt worden ist, werden die daraus bestimmten Trainingsdatensätze mit den zugehörigen Prognosewerten angegeben. Als mögliches Prognosemodell können neuronale Netze, konvolutionelle neuronale Netze, Support Vector Machines, Random-Forest-Modelle, Hidden-Markov-Chain-Modelle, Generalized-Linear-Modelle und dergleichen verwendet werden. Vorzugsweise wird eine SVM-(Support Vector Machine-)Implementierung verwendet, beispielsweise mit den Trainingsparametern Kern RGF, Gamma-Grid 0,001 bis 10, Lambda-Grid 0,001 bis 10, Hyperparameter Selection, fünffache Cross-Validierung, Verlustfunktion Pinball mit Gewichten und 0,025 und 0,0975 für den unteren und oberen Quantilwert. Die Verlustfunktion für das Training des Prognosemodells kann die an das Verfahren gestellte Fragestellung wiedergeben.
-
Im obigen Fall werden zwei Optimierungsverfahren entsprechend für jede Gewichtung der Loss-Funktion von 0,025 und 0,975 durchgeführt. Als Ergebnis erhält man zwei Prognosemodelle, die jeweils das 2.5 %- bzw. das 97.5 %-Quantil vorhersagen.
-
Zum Testen des Prognosemodells kann das Training auf 80 % der zur Verfügung stehenden Datensätze angewendet werden. Zur finalen Bewertung der Modellvorhersagequalität werden die verbleibenden 20 % als Testdaten genutzt. Die Bewertungskriterien hängen von der genutzten Modellvariante hinsichtlich Laborwertmodellziele und dergleichen ab. Da das Modelltraining unabhängig von den Testdaten erfolgt, ist das durch dieses Verfahren erhaltene Qualitätsmaß robuster hinsichtlich Problemen der Überanpassung (Overfitting), wie beispielsweise die Bewertung durch eine sogenannte Cross-Validierung, und dieser vorzuziehen.