DE10159262A1 - Identifizieren pharmazeutischer Targets - Google Patents
Identifizieren pharmazeutischer TargetsInfo
- Publication number
- DE10159262A1 DE10159262A1 DE10159262A DE10159262A DE10159262A1 DE 10159262 A1 DE10159262 A1 DE 10159262A1 DE 10159262 A DE10159262 A DE 10159262A DE 10159262 A DE10159262 A DE 10159262A DE 10159262 A1 DE10159262 A1 DE 10159262A1
- Authority
- DE
- Germany
- Prior art keywords
- cell
- determined
- genes
- expression
- gene expression
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/68—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
- G01N33/6803—General methods of protein analysis not limited to specific proteins or families of proteins
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/5005—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
- G16B25/10—Gene or protein expression profiling; Expression-ratio estimation or normalisation
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B5/00—ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B5/00—ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
- G16B5/20—Probabilistic models
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Immunology (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Chemical & Material Sciences (AREA)
- Urology & Nephrology (AREA)
- Hematology (AREA)
- Evolutionary Biology (AREA)
- Medical Informatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Physiology (AREA)
- Medicinal Chemistry (AREA)
- Pathology (AREA)
- Microbiology (AREA)
- Genetics & Genomics (AREA)
- General Physics & Mathematics (AREA)
- Food Science & Technology (AREA)
- Cell Biology (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- Probability & Statistics with Applications (AREA)
- Tropical Medicine & Parasitology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Zum Identifizieren pharmazeutischer Targets wird mindestens eine Korrelation zwischen den Expressionsraten verschiedener Gene einer Zelle durch Auswertung einer Mehrzahl von Gen-Expressionsmustern ermittelt. Dabei werden Korrelationen zweiter oder höherer Ordnung betrachtet. Die Korrelationen lassen auf kausale Beziehungen zwischen verschiedenen Genen und den zugehörigen Proteinen schließen. Daher kann aus den Korrelationen das regulatorische Netzwerk der untersuchten Zelle erschlossen werden. Aus dem solcherart erschlossenen regulatorischen Netzwerk können geeignete Targets identifiziert werden.
Description
- Die menschliche Erbsubstanz (Genom) umfasst schätzungsweise 20 000 bis 80 000 Gene, die den genetischen Code für etwa eine Million Eiweißstoffe (Proteine) beinhalten. In den spezialisierten Körperzellen werden jeweils nur Untermengen aller Gene tatsächlich abgelesen (exprimiert). Die Gesamtheit der dadurch erzeugten Proteine wird als Proteom dieser Zelle bezeichnet. Das Wechselspiel der Proteine untereinander sowie mit der DNA stellt den wichtigsten Teil der Maschinerie dar, die der Entwicklung des menschlichen Körpers aus der befruchteten Eizelle sowie allen Körperfunktionen zugrunde liegt. Aus der Sicht der Informatik stellt die Erbsubstanz damit einen prozeduralen Code für die Struktur und Funktion des menschlichen Körpers dar.
- Viele Krankheiten und Fehlfunktionen des Körpers gehen auf Störungen des funktionellen Netzwerks aus Genom und Proteom zurück. So wirken einige Medikamente als Agonisten bzw. Antagonisten spezifischer Zielproteine, d. h. sie verstärken oder schwächen die Funktion eines Proteins mit dem Ziel, das aus Proteom und Genom gebildete regulatorische Netzwerk zurück in einen normalen Funktionsmodus zu bringen. Diese Zielproteine (Targets) werden bislang nach heuristischen Prinzipien aus biochemischen Überlegungen abgeleitet. Oft ist dabei unklar, ob die Fehlfunktion eines Proteins tatsächlich die Krankheitsursache oder nur eines der Symptome einer versteckten Fehlregulation an anderer Stelle des Netzwerks darstellt.
- Für die Entwicklung verbesserter Therapien ist daher ein quantitatives Verständnis des Wechselspiels zwischen Genom und Proteom erforderlich.
- Aufgabe der Erfindung ist es, das Identifizieren von Proteinen, die sich als Target medikamentöser Behandlung genetisch bedingter Krankheiten oder Störungen eignen, zu verbessern.
- Diese Aufgabe wird durch die Erfindungen gemäß den unabhängigen Ansprüchen gelöst. Vorteilhafte Weiterbildungen der Erfindungen sind in den Unteransprüchen gekennzeichnet.
- Zum Identifizieren pharmazeutischer Targets wird mindestens eine Abhängigkeit oder statistische Korrelation zwischen den Expressionsraten verschiedener Gene einer Zelle durch Auswertung einer Mehrzahl von Gen-Expressionsmustern ermittelt. Dabei werden u. a. Korrelationen zweiter oder höherer Ordnung betrachtet. Die Abhängigkeiten lassen auf kausale Beziehungen zwischen verschiedenen Genen und den zugehörigen Proteinen schließen. Daher kann aus den Abhängigkeiten das regulatorische Netzwerk der untersuchten Zelle erschlossen werden.
- So lassen sich Gene identifizieren, die am wahrscheinlichsten regulatorische Kaskaden initiieren, oder die für komplexe Änderungen in den Expressionsmustern, beispielsweise bei Vorliegen einer genetisch bedingten Erkrankung, verantwortlich sind.
- Das erfindungsgemäße Verfahren erlaubt dadurch die Identifizierung von Targets auf systematischer Basis. Dies geschieht durch statistische Modellierung des regulatorischen genetischen Netzwerks mit einem strukturlernenden kausalen Netz auf der Basis von Gen-Expressionsmustern.
- Das beschriebene Verfahren ist nicht auf zeitliche Informationen angewiesen und damit auf eine breite Basis von Gen- Expressionsmessungen anwendbar.
- Das beschriebene Verfahren wird üblicherweise mit Hilfe eines Computers durchgeführt.
- Die Erfindung ist besonders geeignet, High Throughput Drug Discovery Verfahren in der Biotechnologie zu ergänzen. Eine weitere Anwendung der Erfindung findet sich im Bereich der Unterstützung von Tumordiagnostik und Tumorbehandlung. Untersucht werden können sowohl regulatorische Zusammenhänge im menschlichen Körper als auch in jedem anderen Lebewesen, sei es Tier oder Pflanze, Bakterium oder eine sonstige Zelle.
- Die einzelnen Messungen der Gen-Expressionsmuster werden dabei als unabhängig voneinander angesehen. Sie stellen Zufallswerte dar, die von einer unbekannten hochdimensionalen Wahrscheinlichkeitsverteilung erzeugt wurden. Die vollständige Charakterisierung der statistischen Struktur bzw. der Korrelationen der Gen-Expressionsraten anhand der gemessenen Expressionsmuster ist gleichbedeutend mit der Schätzung der zusammengesetzten, hochdimensionalen Wahrscheinlichkeitsverteilung für diese Muster. Beinhaltet eine Messung die Bestimmung der Expression von 5000 Genen, so ist eine 5000- dimensionale Wahrscheinlichkeitsdichte zu schätzen, was in voller Allgemeinheit große Schwierigkeiten bereitet.
- Kausale Netze nehmen an, dass in den Daten bedingte Unabhängigkeiten existieren. Eine bedingte Unabhängigkeit liegt dann vor, wenn zwei Zufallsvariablen unter der Bedingung voneinander unabhängig sind, dass alle anderen Zufallsvariablen konstant gehalten werden, dass also Korrelationen höherer Ordnung über eine mehrstufige Rückkopplungsschleife zwischen den beiden Zufallsvariablen vernachlässigt werden. Die volle Wahrscheinlichkeitsdichte kann dann durch ein Produkt von niedriger dimensionierten Wahrscheinlichkeitsdichten ersetzt werden.
- Eine besonders effiziente Möglichkeit, die Korrelationen bzw. Abhängigkeiten zwischen den einzelnen Zufallsvariablen, also den Expressionsraten, der hochdimensionalen Wahrscheinlichkeitsverteilung zu erschließen, besteht darin, dass zunächst eine Menge von unabhängigen Zufallsvariablen angenommen wird.
- Sukzessiv wird jeweils diejenige Korrelation dem Netzwerk hinzugefügt, die den Fehler des Netzes für die Erklärung neuer Daten (Generalisierungsfehler) am meisten herabsetzt. Das heißt, es werden diejenigen Korrelationen angenommen, bei denen die tatsächlich gemessenen Gen-Expressionsmuster die höchste Wahrscheinlichkeit unter allen denkbaren Wahrscheinlichkeitsverteilungen aufweisen. Dies wird fortgesetzt, bis sich der Generalisierungsfehler nur noch innerhalb einer vorgegebenen Schwelle verringern lässt.
- Die bevorzugte, einfachste Ausführungsform der Suchstrategien für die Korrelationen erfolgt mit Hilfe der folgenden Schritte:
- - zunächst wird diejenige alleinige Kante gesucht, die den Generalisierungsfehler minimiert, sozusagen die beste erste Kante.
- - anschließend wird die beste zweite Kante gesucht.
- - usw., bis sich der Generalisierungsfehler nicht mehr sinnvoll verbessern lässt.
- Auf diese Weise können sowohl die Korrelationen zwischen den Zufallsvariablen (Expressionsraten) erschlossen werden als auch die Form der hochdimensionalen Wahrscheinlichkeitsverteilung, letztere zumindest qualitativ. Das Erschließen der Korrelationen zwischen den Zufallsvariablen mit der Möglichkeit, diese Korrelationen mit Hilfe von mindestens teilweise gerichteten Graphen darzustellen, wird als Strukturlernen bezeichnet, da hierbei die Struktur des regulatorischen Netzwerks gelernt wird.
- Beim sukzessiven Ergänzen von Korrelationen kann auf vorhandenes Wissen über regulatorische Zusammenhänge zurückgegriffen werden. Auf diese Weise kann das Erschließen der regulatorischen Zusammenhänge weiter beschleunigt und präzisiert werden.
- Dieser insbesondere für hochdimensionale Daten sehr zeitaufwändige Algorithmus lässt sich durch schnelle, fast-optimale Suchstrategien für wichtige Abhängigkeiten entscheidend beschleunigen. Ein bekannter Algorithmus hierfür ist der Greedy-Algorithmus (T. H. Cormen, C. E. Leiserson, R. L. Rivest, C. Stein: "Introduction to Algorithms", 2nd edition McGraw- Hill Columbus, OH (2001)).
- Durch eine künstliche Veränderung einzelner Gen- Expressionsraten kann mit Hilfe der aus den bisher vorliegenden Daten berechneten Struktur des regulatorischen Netzwerks, bzw. der hochdimensionalen Wahrscheinlichkeitsverteilung, das am wahrscheinlichsten resultierende Gen-Expressionsmuster vorhergesagt werden. Dieses kann mit Messungen an erkranktem Gewebe (beispielsweise Tumorgewebe) verglichen werden. Dadurch ist es möglich, die einer krankhaft veränderten zellulären Funktion ursächlich zu Grunde liegende Gen-Gruppe bzw. gegebenenfalls das zu Grunde liegende einzelne Gen zu erkennen und das zugehörige Protein als Target einer medikamentösen Behandlung zu identifizieren.
- Im Folgenden wird die Erfindung anhand von Ausführungsbeispielen näher erläutert, die in den Figuren schematisch dargestellt sind. Gleiche Bezugsziffern in den einzelnen Figuren bezeichnen dabei gleiche Elemente. Im Einzelnen zeigt:
- Fig. 1 schematisch die regulatorischen Vorgänge, die das Expressionsmuster einer Zelle bestimmen;
- Fig. 2 einen gerichteten azyklischen Graphen; und
- Fig. 3 illustriert Möglichkeiten, die Richtung von Kanten in einem gerichteten azyklischen Graphen zu bestimmen.
- Fig. 1 zeigt die wichtigsten Wechselwirkungen zwischen Genen und Proteinen eines DNA-Abschnitts auf. Die Wechselwirkungen werden als Basis für die Beschreibung des genomischen regulatorischen Netzwerks herangezogen.
- Im oberen Teil der Fig. 1 ist schematisch angedeutet, wie ein von außen auf die Zelle einwirkendes externes Signal - etwa im Rahmen der interzellulären Kommunikation -, das beispielsweise von einem Transmembran-Rezeptorprotein (z. B. von einem Kalziumkanal) aufgenommen und in geeigneter Weise in das Innere der Zelle übertragen wird, die Produktion der Gene A, B, C und D des DNA-Abschnitts auslöst.
- Es besteht daher prinzipiell auch die Möglichkeit, die Expressionsrate einzelner Gene einer Zelle über die erwähnten Wege von außerhalb der Zellen zu beeinflussen.
- Als ein Gen wird ein nicht notwendigerweise zusammenhängender Abschnitt der DNA bezeichnet, der den genetischen Code für ein Protein oder auch für eine Gruppe von Proteinen enthält.
- Der Produktionsvorgang eines Proteins aus einem Gen, zum Beispiel Protein A ausgehend von Gen A in Fig. 1, wird als Expression dieses Gens bezeichnet. Die Übersetzung des DNA- Codes des Gens in die Kette der Aminosäuren des Proteins wird als Translation bezeichnet. Die Rate, mit der Protein A in einem gegebenen Kontext produziert wird, wird seine Expressionsrate genannt.
- Nicht alle Gene werden in einer Zelle exprimiert. Vielmehr unterscheiden sich verschiedene Zelltypen durch ihr Gen- Expressionsmuster. Dies gilt oftmals auch für den Unterschied zwischen kranken und gesunden Zellen.
- Das Expressionsmuster einer Zelle wird durch die in Fig. 1 schematisch dargestellten regulatorischen Vorgänge bestimmt. Die regulatorischen Vorgänge werden im Wesentlichen von einigen wichtigen Wechselwirkungen zwischen Proteinen und Genen sowie zwischen den Proteinen untereinander bestimmt.
- So kann die Expressionsrate eines Gens A durch das Vorhandensein eines anderen Proteins B reguliert, d. h. erhöht, erniedrigt oder zum Erliegen gebracht werden. In diesem Beispiel wirkt das Protein B regulatorisch auf das Gen A bzw. das Protein A. Zu regulatorischen Proteinen können beispielsweise die Proteinbausteine von Aktivatorkomplexen gerechnet werden. Regulatorische Proteine können sich gleichzeitig auf viele Zielgene auswirken.
- Eine zweite Art der Wechselwirkung besteht in der posttranslationalen Modifikation von Proteinen, d. h. der Modifikation von Proteinen nach der Translation. In der Regel erfolgt die posttranslationale Modifikation eines Proteins im unmittelbaren Anschluss an die Translation, d. h. bevor das Protein in der Zelle wirkt. So werden zum Beispiel viele Proteine von speziellen Enzymen phosphoryliert oder glykolysiert, d. h. das Zielprotein wird durch Anhängen bzw. Abspalten chemischer Gruppen in seinen funktionellen Zustand gebracht oder in einen Zustand versetzt, in dem es nicht mehr wirksam ist. Posttranslationale Modifikation kann also ein Protein gegebenenfalls temporär funktionell einschalten oder ausschalten.
- In Fig. 1 ist das Protein A ein so genanntes Effektorprotein, d. h. es wirkt innerhalb der Zelle auf andere Substanzen und nicht unmittelbar auf das Genom oder Proteom. In Fig. 1 modifiziert somit das Protein C im Wege der posttranslationalen Modifikation die Funktion des Effektorproteins A.
- Protein B ist ein regulatorisches Protein, da es die Expressionsrate des Proteins A bestimmt, indem es mit demjenigen DNA-Abschnitt wechselwirkt, der das Gen A enthält. Das Protein D modifiziert somit die Funktion eines regulatorischen Proteins (Protein B) im Wege der posttranslationalen Modifikation.
- Die Nukleinsäuresequenz der menschlichen DNA ist weitestgehend bekannt. Auch die durch die DNA kodierten Gene sind in zunehmendem Maße identifiziert. Nicht ganz so vollständig ist das Wissen über das Proteom, einschließlich der eventuell durch Wechselwirkung zwischen den Proteinen posttranslational modifizierten Proteine. Allerdings erlauben neuere Sequenzierungs- und Hochdurchsatz-Screeningverfahren eine rasche Identifizierung weiterer Gene und Proteine.
- Ein weiterer wichtiger Schritt zur Aufklärung der Expressionsmuster einer Zelle hat sich mit der Entwicklung von Hochdurchsatz-Hybridisierungstechniken vollzogen. Bei diesen Verfahren wird auf einem so genannten Microarray die Expressionsrate vieler 100 verschiedener Gene gleichzeitig getestet. Mit Hilfe dieser Verfahren ist es möglich, das Gen- Expressionsmuster einer Zelle zu bestimmen.
- Dazu werden in der Regel die in der Zelle synthetisierten mRNA (messenger RNA) bestimmt. Die mRNA ist ein Zwischenprodukt bei der Translation des Gens zum Protein. Die mRNA ist somit eine Vorstufe bei der Bildung des Proteins. Die zu untersuchende Zelle wird zunächst isoliert. Anschließend wird sie aufgeschlossen. Durch geeignete Aufreinigungsschritte wird die mRNA aus der Zelle isoliert. Danach wird die mRNA mittels der reversen Transkriptase in cDNA (complementary DNA) übersetzt. Diese wird mit i. d. R. linearer PCR (polymerase chain reaction) amplifiziert. Die so gewonnene cDNA wird mit Hilfe von geeigneten Microarrays, z. B. DNA-Chips, qualitativ bzw. quantitativ analysiert. Mit modernen Microarrays können die Expressionsraten von 5000 und mehr Genen gleichzeitig vermessen werden.
- Aufgrund dieser verbesserten Techniken steht mittlerweile ein umfangreiches Wissen über das menschliche Genom und Proteom sowie über die Wechselwirkungen zwischen Proteinen und Genen bzw. Proteinen untereinander zur Verfügung.
- Im Folgenden werden zunächst einige für die Aufklärung des regulatorischen Netzwerks benötigte mathematische Begriffe eingeführt.
- Die aus den gemessenen Gen-Expressionsmustern bestimmten Expressionsraten der einzelnen Gene sind die im Folgenden zu betrachtenden Zufallsvariablen. Für Gen i wird die die Expressionsrate repräsentierende Zufallsvariable mit Xi bezeichnet. Werte, die sie annehmen kann, werden mit xi bezeichnet. Mit
wird der Zufallsvektor bezeichnet, der aus den Expressionsraten aller k Gene besteht. ()T bezeichnet die Transposition. - Um die Korrelationen zwischen den Expressionsraten bzw. Zufallsvariablen zu ermitteln, werden verschiedene Momente der Zufallsvariablen betrachtet.
- Das erste Moment des Zufallsvektors X, das auch als Erwartungswert E bezeichnet wird, ist definiert durch
EX := (α1, . . ., αk)T := (EX1, . . ., EXk)T.
- Aufgrund bekannter statistischer Überlegungen wird der Erwartungswert EXi der Expressionsraten Xi mit Hilfe des arithmetischen Mittels der beobachteten Expressionsraten xi über n Messungen von Gen-Expressionsmustern geschätzt:
wobei xim die für das Gen i in der Messung m ermittelte Expressionsrate angibt und der hochgestellte Index (s) anzeigt, dass es sich um einen geschätzten Wert handelt. - Die zweiten Momente sind definiert durch
αij := E(Xi.Xj).
- Wiederum aufgrund bekannter statistischer Überlegungen wird der für das zweite Moment zu berechnende Erwartungswert E(Xi.Xj) mit Hilfe der folgenden Gleichung geschätzt:
- Das zweite zentrale Moment wird auch als Kovarianz bezeichnet. Es ist definiert durch
cov(Xi, Xj) := µij := E([Xi - EXi].[Xj - EXj]).
- Es gilt aufgrund der Linearität des Erwartungswerts
cov(Xi, Xj) = µij = E(Xi.Xj) - EXi.EXj = αij - αi.αj.
- Die Schätzung der Kovarianz erfolgt in bekannter Weise mittels
- Die µii sind gerade die Varianzen der einzelnen Expressionsraten Xi:
- Ihre Schätzung erfolgt in bekannter Weise über
- Die k × k-Matrix
cov(X, X) : = E([X - EX].[X - EX]T) = E(X.XT) - EX.EXT
wird als Kovarianzmatrix von X bezeichnet. - Die Korrelation der Zufallsvariablen Xi und Xj wird häufig mit Hilfe des Korrelationskoeffizienten (zweiter Ordnung) bestimmt. Dieser ist definiert durch
- Er liegt zwischen -1 und +1. Er lässt sich unter Verwendung der angegebenen Schätzungen der Kovarianz und der Varianz ebenfalls schätzen. Ein verschwindender Korrelationskoeffizient deutet auf die Abwesenheit regulatorischer Zusammenhänge hin. Ein signifikant von Null verschiedener Korrelationskoeffizient deutet auf eine statistische und damit regulatorische Abhängigkeiten hin.
- Die obigen Definitionen lassen sich auf dritte, vierte und beliebig höhere Momente verallgemeinern. Insbesondere ist das dritte Moment definiert durch
αijk := E(Xi.Xj.Xk).
- Das dritte zentrale Moment ist definiert durch
µijk := E([Xi - EXi].[Xj - EXj].[Xk - EXk]).
- Es wird in bekannter Weise geschätzt durch
- Die Korrelation der Zufallsvariablen Xi, Xj und Xk kann ebenfalls mit Hilfe des Korrelationskoeffizienten dritter Ordnung bestimmt werden. Dieser ist definiert durch
- Er liegt ebenfalls zwischen -1 und +1 und kann in gleicher Weise wie der Korrelationskoeffizient zweiter Ordnung geschätzt werden.
- In einem bevorzugten Ausführungsbeispiel der Erfindung wird das Vorliegen regulatorischer Abhängigkeiten dadurch ermittelt, dass die Korrelationskoeffizienten daraufhin getestet werden, ob sie signifikant von Null abweichen. Statistisch gesprochen wird die Hypothese getestet, ob der Korrelationskoeffizient verschwindet. Dies kann mit Hilfe verschiedener bekannter statistischer Testverfahren durchgeführt werden. Das bevorzugte Verfahren ist beispielsweise in Bronstein- Semendjajew: "Taschenbuch der Mathematik", Verlag Harm Deutsch, 22. Aufl., 1985, S. 693, beschrieben.
- Die geschilderten Verfahren haben allgemein das Ziel, statistische Abhängigkeiten bzw. Unabhängigkeiten aufzuklären und dadurch das Netzwerk der Beeinflussungen aus den Daten zu extrahieren.
- Reguliert das Protein B das Gen A und sind keine anderen regulatorischen Phänomene vorhanden, so äußert sich diese Eigenschaft in einer statistischen Korrelation oder Antikorrelation beider Expressionsraten über verschiedene Messungen hinweg (statistische Abhängigkeit bzw. Korrelation zweiter Ordnung).
- Die Gegenwart eines Metaregulators wie Protein D in Fig. 1 drückt sich hingegen in einer statistischen Abhängigkeit dritter Ordnung aus, d. h. in einem nicht verschwindenden Korrelationskoeffizienten dritter Ordnung.
- In einer Zelle existieren viele, teilweise noch unbekannte regulatorische Rückkopplungsschleifen, deren Existenz sich in komplexen statistischen Beziehungen zwischen Expressionsraten ausdrückt.
- Korrelationen werden oft durch gerichtete Graphen zwischen Zufallsvariablen dargestellt (siehe z. B. David Edwards: "Introduction to Graphical Modelling", Springer Texts in Statistics, Springer Verlag, 1995). Derartige Modelle werden daher auch als graphische Modelle bezeichnet.
- Die hochdimensionale Wahrscheinlichkeitsverteilung für die Zufallsvariable
kann mit Hilfe eines Netzwerks oder Graphen G dargestellt werden, wie er in Fig. 2 für ein einfaches Beispiel gezeigt ist. Die Knoten 1, 2 und 3 entsprechen dabei Zufallsvariablen X1, X2 und X3. Im Rahmen der statistischen Modellierung regulatorischer Zusammenhänge im Genom werden die Zufallsvariablen mit den Expressionsraten identifiziert. - Im Graphen G gem. Fig. 2 werden Abhängigkeiten durch gerichtete Kanten dargestellt. Dabei wird die Abhängigkeit der Zufallsvariable X2 von der Zufallsvariable X1 durch eine gerichtete Kante 12 vom Knoten 1 zum Knoten 2 dargestellt. Die Abhängigkeit der Zufallsvariable X3 von der Zufallsvariable X2 wird durch eine gerichtete Kante 14 von Knoten 2 zum Knoten 3 dargestellt.
- Wird eine Korrelation zweiter Ordnung festgestellt, so wird dies durch eine Kante zwischen zwei Knoten, d. h. zwischen zwei Zufallsvariablen, im Graphen angezeigt. Im Allgemeinen ist es nicht möglich, die Richtung dieser Kante zu ermitteln, d. h. welche der beiden Zufallsvariablen ursächlich für die andere ist. Beobachtet wird lediglich das gleichzeitige Auftreten. Damit kann im allgemeinen auch nicht ermittelt werden, welches von den beiden beteiligten Genen bzw. Proteinen das andere reguliert.
- In bestimmten Fällen kann jedoch die Richtung einer Kante ermittelt werden. Fig. 3A zeigt einen solchen Fall. Gezeigt sind drei Knoten 1, 2 und 3. Zwischen diesen drei Knoten sind zwei Kanten eingezeichnet, und zwar die Kante 20 zwischen den Knoten 1 und 3 sowie die Kante 22 zwischen den Knoten 2 und 3. Beide Kanten sind in Richtung auf den Knoten 3 gerichtet. In der Graphentheorie wird ein solcher Fall allgemein als "collider" bezeichnet. Statistisch wird man in einer solchen Konstellation eine Korrelation zweiter Ordnung zwischen den Knoten 1 und 3, also den zugehörigen Zufallsvariablen, ermitteln, sowie eine weitere Korrelation zweiter Ordnung zwischen den Knoten 2 und 3. Man wird jedoch keine Korrelationen dritter Ordnung feststellen, da beispielsweise die Zufallsvariablen 1 und 3 sich gegenseitig beeinflussen, ohne jedoch einen Einfluss auf die Zufallsvariable 2 zu haben.
- Übersetzt in die Sprache der regulatorischen Wechselwirkungen zwischen Genen bzw. Proteinen zeigt der Graph gem. Fig. 3A, dass das Gen 3 durch Gen bzw. Protein 1 und 2 reguliert wird, jedoch nicht umgekehrt. Wird beispielsweise Gen 1 exprimiert, so wird nach dem Modell gem. Fig. 3A auch Gen 3 exprimiert. Dies impliziert jedoch nicht, dass auch Gen 2 exprimiert wird. Werden zwei Korrelationen zweiter Ordnung gefunden, eine zwischen Knoten 1 und Knoten 3 und die andere zwischen Knoten 2 und Knoten 3, so können die Kanten nicht anders gerichtet sein, da sich sonst eine Korrelation dritter Ordnung zeigen würde (vergleiche Fig. 3B).
- Anders verhält es sich im Falle von Fig. 3B. Fig. 3B zeigt Graphen, die im wesentlichen dem Graph gem. Fig. 3A entsprechen und auch in gleicher Weise zu lesen sind. Lediglich die Kanten und ihre Richtungen sind variiert. Alle in Fig. 3B gezeigten Graphen weisen ausschließlich eine Korrelation dritter Ordnung zwischen den Knoten 1, 2 und 3 auf und sind auf der Basis der Korrelationsanalyse nicht unterscheidbar.
- Im Allgemeinen ist es sehr schwierig, auf der Basis von Gen- Expressionsmustern posttranslationale Modifikationen zu erschließen. Allerdings geben Korrelationen dritter Ordnung zumindest einen Hinweis auf solche posttranslationalen Modifikationen.
- Im Folgenden wird das Erkennen des zu einem regulatorischen Netzwerk gehörenden Graphen näher erläutert.
- Die gemeinsame Wahrscheinlichkeitsverteilung der Zufallsvariablen X1, X2 und X3 aus Fig. 2 kann stets durch ein Produkt bedingter Wahrscheinlichkeiten ausgedrückt werden:
P(X1, X2, X3) = P(X3|X2, X1).P(X2|X1).P(X1).
- Im Graphen G gem. Fig. 2 werden die bedingten Wahrscheinlichkeiten der rechten Seite durch gerichtete Kanten dargestellt. Dabei wird die bedingte Wahrscheinlichkeit P(X2|X1) durch eine gerichtete Kante 12 vom Knoten 1 zum Knoten 2 dargestellt. Die bedingte Wahrscheinlichkeit P(X3|X2, X1) wird durch eine gerichtete Kante 14 von Knoten 2 zum Knoten 3 dargestellt. Derartige Graphen G werden als gerichtete azyklische Graphen (DAG, directed acyclic graph) bezeichnet. Die Graphen G heißen azyklisch, da es in dem betrachteten mathematischen Modell niemals eine zyklische Graphenkonfiguration geben wird, bei der beispielsweise in Fig. 2 auch noch eine gerichtete Kante vom Knoten 3 zum Knoten 1 verläuft, die einen Kreis schließen würde.
- Bei der bedingten Wahrscheinlichkeit P(X3|X2, X1) stellen die Zufallsvariablen X1 und X2 die so genannten Eltern (Pa, parents) der Zufallsvariablen X3 dar, d. h.
Pa(X3) = {X1, X2}.
- Allgemeinen kann daher eine hochdimensionale Wahrscheinlichkeitsverteilung der Variablen Xi geschrieben werden als
- Dabei ist mit Pa(Xi) die Menge der Eltern der Variablen Xi bezeichnet.
- Statistische Unabhängigkeiten können in einem solchen Graphen G durch betrachten der Eltern einer Zufallsvariablen bestimmt werden.
- Die Struktur eines solchen Graphen G wird durch Vergleich mit gewonnenen Daten, im vorliegenden Fall den gemessenen Gen- Expressionsmustern, bestimmt. Das statistische Problem kann daher in der folgenden Weise formuliert werden: ausgehend von einem Datensatz
von n Realisierungen der Zufallsvariablen (X1, . . ., Xk) wird derjenige Graph G gesucht, der den Datensatz D am besten wiedergibt. - Es gibt im wesentlichen zwei Wege, die Struktur eines Graphen G aus den Daten D zu erschließen: Die so genannte "constrained based method" (R. Hofmann: "Lernen der Struktur nichtlinearer Abhängigkeiten mit graphischen Modellen", dissertation.de Berlin, 2000) und die so genannte "score based method" (R. Hofmann: "Lernen der Struktur nichtlinearer Abhängigkeiten mit graphischen Modellen", dissertation.de Berlin, 2000), die zur Ausführung der Erfindung bevorzugt wird.
- Die "constrained based method" versucht, statistische Abhängigkeiten bzw. Unabhängigkeiten aus den Daten zu erschließen, ähnlich wie es weiter oben im Zusammenhang mit der Schätzung von Korrelationskoeffizienten geschildert wurde.
- Die "score based method" sucht den Raum der möglichen Graphen ab und bewertet die Übereinstimmung zwischen den Graphen und den Daten mit Hilfe einer Bewertungsfunktion. Das Modell mit dem besten Wert der Bewertungsfunktion wird ausgewählt. Mögliche Bewertungsfunktionen sind das Bayes-Maß (D. Heckerman: "A Bayesian Approach to learning causal networks", Tech Report MSR-TR-95-04, Microsoft Research 1995), die MDL-Metrik (s. u.) oder die BIC-Bewertungsfunktion (G. Schwarz: "Estimating the dimension of a model", The Annals of Statistics 6(2): 461-464 (1978)).
- Die bevorzugte Bewertungsfunktion ist die MDL-Metrik. MDL steht für "minimum description length". Diese Bewertungsfunktion hat zum Ziel, die Daten durch ein Netzwerk bzw. einen Graphen G möglichst genau mit möglichst wenig Kanten zu beschreiben. Die verwendete Bewertungsfunktion lautet:
- Dabei ist logP(G) die a-priori-Wahrscheinlichkeit (im Sinne einer Bayes-Bewertung), den Grafen G vorzufinden. logP(G) wird für alle Graphen G gleich angenommen. Es kann daher bei der Maximierung von L außer Betracht bleiben.
- n ist die Anzahl der zur Verfügung stehenden, gemessenen Datensätze.
gibt die bedingte Entropie des Graphen G in Anbetracht der Daten D wieder. - Dabei ist k, wie oben erwähnt, die Anzahl der Zufallsvariablen Xi bzw. die Anzahl der Knoten i. D. h. es wird über alle Knoten summiert.
- Ei ist die Anzahl der unmittelbaren Eltern des Knotens i, d. h. die Anzahl der zum Knoten i hin gerichteten Kanten. D. h. es wird zusätzlich über alle zum Knoten i hin gerichteten Kanten summiert.
- ri ist die Anzahl der möglichen (diskreten bzw. diskretisierten) Werte xi, die die Zufallsvariable Xi annehmen kann, die also der Knoten i annehmen kann. D. h. es wird über alle möglichen Werte der Zufallsvariablen Xi bzw. des Knotens i summiert.
- qei ist die Anzahl der möglichen (diskreten bzw. diskretisierten) Werte Xei, die der unmittelbare Elternknoten e des Knotens i, d. h. die Zufallsvariable Xei annehmen kann. D. h. es wird zusätzlich über alle möglichen Werte der Zufallsvariablen Xei bzw. des Knotens e summiert.
- Nilej ist die Anzahl der Datensätze in denen der Knoten i den Wert xl hat und der unmittelbare Elternknoten e den Wert xj hat, gezählt über alle n Datensätze. D. h. es wird die Kante zwischen den Knoten i und e betrachtet und gezählt, wie oft bei den gemessenen Datensätzen die zugehörigen Werte xl und xj auftraten. Hier fließen die gemessenen Daten ein.
- Schließlich ist die Normierung
d. h. es wird über alle Werte summiert, die der Knoten i annehmen kann. - Die Entropie ist ein nicht-negatives Maß der Unsicherheit, das maximal ist, wenn die Unsicherheit maximal ist, und das verschwindet, wenn vollständiges Wissen vorliegt.
- K ist gegeben durch:
- Vernachlässigt man den Term "-1" in der Klammer, so erkennt man in K die Anzahl aller Kombinationen von Werten, summiert über alle Kanten. Ist die Anzahl der Kanten in einem Graphen G klein, so ist in der Regel auch K klein, weshalb L entsprechend größer ist. Dieser letzte Term der rechten Seite erhöht somit den Wert von L für Graphen mit wenigen Kanten, er bevorzugt somit einfache Graphen. Er wird auch Evidenz genannt.
- Die Bewertungsfunktion L entspricht in etwa dem Logarithmus der Bayes-Wahrscheinlichkeit für den Graphen G, wenn die Daten D beobachtet wurden. Sie entspricht damit in etwa der Likelihood des Graphen G. L wird maximiert, d. h. es wird derjenige Graph G gesucht, der für die gegebenen Daten D die Funktion L maximiert.
- Eine besonders effiziente Möglichkeit, die Kanten des Graphen G zu finden, besteht darin, dass zunächst eine Menge von unabhängigen Zufallsvariablen angenommen wird. Sukzessiv wird jeweils diejenige Kante dem Netzwerk hinzugefügt, die die Funktion L am meisten herabsetzt. Dies wird fortgesetzt, bis Minimum von L erreicht ist.
- Wie bereits erwähnt, lässt sich dies in einer bevorzugten, einfachen Ausführungsart mit Hilfe der folgenden Schritte durchführen:
- - zunächst wird diejenige alleinige Kante gesucht, die L minimiert, sozusagen die beste erste Kante.
- - anschließend wird die beste zweite Kante gesucht, d. h. diejenige zweite Kante, die zusätzlich zur bereits vorhandenen ersten Kante L am weitestgehenden minimiert.
- - usw., bis sich L nicht mehr weiter minimieren lässt.
- Dieser insbesondere für hochdimensionale Daten sehr zeitaufwändige Algorithmus lässt sich durch schnelle, fast-optimale Suchstrategien für wichtige Abhängigkeiten entscheidend beschleunigen. Ein bekannter Algorithmus hierfür ist der bereits erwähnte Greedy-Algorithmus.
- Um nicht nur lokale Maxima der Graphenstruktur zu finden, können bekannte Algorithmen wie simulated annealing oder genetische Algorithmen mit den bereits geschilderten Algorithmen kombiniert zur Suche des optimalen Graphen eingesetzt werden.
- Aus dem solcherart erschlossenen regulatorischen Netzwerk können geeignete Targets identifiziert werden. So erkennt man in Fig. 1 beispielsweise, dass zur Beeinflussung der Konzentration oder Wirksamkeit des Effektorproteins A sowohl das Gen A selbst als auch die Gene B, C und D als Target dienen können.
Claims (6)
1. Verfahren zum Identifizieren pharmazeutischer Targets mit
folgenden Schritten:
a) Eine Mehrzahl von Gen-Expressionsmustern einer Zelle wird
bestimmt, wobei jeweils die Expressionsrate der Gene der
Zelle bestimmt wird.
b) Mindestens eine Abhängigkeit zwischen den Expressionsraten
der Gene der Zelle wird bestimmt.
c) Aus mindestens einen Abhängigkeit wird das regulatorische
Netzwerk der untersuchten Zelle erschlossen.
2. Verfahren nach dem vorhergehenden Anspruch,
dadurch gekennzeichnet,
dass angenommen wird, dass nicht alle Expressionsraten der
Gene der Zelle voneinander abhängig sind.
3. Verfahren nach dem vorhergehenden Anspruch,
dadurch gekennzeichnet,
dass zunächst eine Menge von unabhängigen Gen-Expressionsraten angenommen wird;
dass sukzessiv jeweils diejenige Abhängigkeit hinzugefügt wird, die den Fehler für die Erklärung der Gen- Expressionsmuster am meisten herabsetzt.
dass zunächst eine Menge von unabhängigen Gen-Expressionsraten angenommen wird;
dass sukzessiv jeweils diejenige Abhängigkeit hinzugefügt wird, die den Fehler für die Erklärung der Gen- Expressionsmuster am meisten herabsetzt.
4. Verfahren nach einem der vorhergehenden Ansprüche,
dadurch gekennzeichnet,
dass die Abhängigkeiten mit Hilfe von Methoden der Graphen-
Theorie ermittelt werden.
5. Verfahren nach einem der vorhergehenden Ansprüche,
dadurch gekennzeichnet,
dass die Expressionsrate mindestens eines Gens der Zelle künstlich verändert wird;
dass mindestens ein Gen-Expressionsmuster der solcherart veränderten Zelle bestimmt wird; und
dass das bestimmte Gen-Expressionsmuster mit mindestens einem berechneten Gen-Expressionsmuster verglichen wird, das auf der Basis der mindestens einen künstlich veränderten Gen- Expressionsrate berechnet wurde.
dass die Expressionsrate mindestens eines Gens der Zelle künstlich verändert wird;
dass mindestens ein Gen-Expressionsmuster der solcherart veränderten Zelle bestimmt wird; und
dass das bestimmte Gen-Expressionsmuster mit mindestens einem berechneten Gen-Expressionsmuster verglichen wird, das auf der Basis der mindestens einen künstlich veränderten Gen- Expressionsrate berechnet wurde.
6. Anordnung zum Identifizieren pharmazeutischer Targets
a) mit Mitteln zum Bestimmen einer Mehrzahl von Gen-
Expressionsmustern einer Zelle, wobei jeweils die
Expressionsrate der Gene der Zelle bestimmt wird;
b) mit Mitteln zum Bestimmen mindestens einer Korrelation
zwischen den Expressionsraten der Gene der Zelle;
c) mit Mitteln zum Erschließen des regulatorischen Netzwerks
der untersuchten Zelle aus den bestimmten Korrelationen.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE10159262A DE10159262B4 (de) | 2001-12-03 | 2001-12-03 | Identifizieren pharmazeutischer Targets |
US10/307,997 US20030104463A1 (en) | 2001-12-03 | 2002-12-03 | Identification of pharmaceutical targets |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE10159262A DE10159262B4 (de) | 2001-12-03 | 2001-12-03 | Identifizieren pharmazeutischer Targets |
Publications (2)
Publication Number | Publication Date |
---|---|
DE10159262A1 true DE10159262A1 (de) | 2003-06-18 |
DE10159262B4 DE10159262B4 (de) | 2007-12-13 |
Family
ID=7707835
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE10159262A Expired - Fee Related DE10159262B4 (de) | 2001-12-03 | 2001-12-03 | Identifizieren pharmazeutischer Targets |
Country Status (2)
Country | Link |
---|---|
US (1) | US20030104463A1 (de) |
DE (1) | DE10159262B4 (de) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE10342274A1 (de) * | 2003-09-12 | 2005-04-28 | Siemens Ag | Identifizieren pharmazeutischer Targets |
DE10358332A1 (de) * | 2003-12-12 | 2005-07-21 | Siemens Ag | Verfahren, Computerprogramm mit Progammcode-Mitteln und Computerprogramm-Produkt zur Analyse eines regulatorischen genetischen Netzwerks einer Zelle |
DE102004007215A1 (de) * | 2004-02-13 | 2005-09-15 | Siemens Ag | Verfahren und Computerprogramm mit Programmcode-Mitteln und Computerprogramm-Produkt zur Ermittlung einer in Daten enthaltenen Struktur unter Verwendung zerlegbarer graphischer Modelle |
DE102004030296A1 (de) * | 2004-06-23 | 2006-01-12 | Siemens Ag | Verfahren, Computerprogramm mit Programmcode-Mitteln und Computerprogramm-Produkt zur Analyse eines regulatorischen genetischen Netzwerks einer Zelle |
DE102005030136A1 (de) * | 2005-06-28 | 2007-01-11 | Siemens Ag | Verfahren zur rechnergestützten Simulation von biologischen RNA-Interferenz-Experimenten |
US7945523B2 (en) | 2003-09-30 | 2011-05-17 | Siemens Aktiengesellschaft | Method and computer program for analyzing variables using pruning, influencing a combustion process in a combustion chamber, using a trainable statistical model |
US8260307B2 (en) | 2003-09-24 | 2012-09-04 | Siemens Aktiengesellschaft | Method for communicating in an ad-hoc radio communication system |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005003368A2 (de) * | 2003-07-04 | 2005-01-13 | Siemens Aktiengesellschaft | Verfahren, computerprogramm mit programmcode-mitteln und computerprogramm-produkt zur analyse eines regulatorischen genetischen netzwerks einer zelle |
WO2007067956A2 (en) * | 2005-12-07 | 2007-06-14 | The Trustees Of Columbia University In The City Of New York | System and method for multiple-factor selection |
US8234077B2 (en) * | 2006-05-10 | 2012-07-31 | The Trustees Of Columbia University In The City Of New York | Method of selecting genes from gene expression data based on synergistic interactions among the genes |
US8086409B2 (en) * | 2007-01-30 | 2011-12-27 | The Trustees Of Columbia University In The City Of New York | Method of selecting genes from continuous gene expression data based on synergistic interactions among genes |
CN106874704B (zh) * | 2017-01-04 | 2019-02-19 | 湖南大学 | 一种基于线性模型的基因共调控网络中关键调控子识别方法 |
CN113539366A (zh) * | 2020-04-17 | 2021-10-22 | 中国科学院上海药物研究所 | 一种用于预测药物靶标的信息处理方法及装置 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6240374B1 (en) * | 1996-01-26 | 2001-05-29 | Tripos, Inc. | Further method of creating and rapidly searching a virtual library of potential molecules using validated molecular structural descriptors |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6303301B1 (en) * | 1997-01-13 | 2001-10-16 | Affymetrix, Inc. | Expression monitoring for gene function identification |
US7127379B2 (en) * | 2001-01-31 | 2006-10-24 | The Regents Of The University Of California | Method for the evolutionary design of biochemical reaction networks |
-
2001
- 2001-12-03 DE DE10159262A patent/DE10159262B4/de not_active Expired - Fee Related
-
2002
- 2002-12-03 US US10/307,997 patent/US20030104463A1/en not_active Abandoned
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6240374B1 (en) * | 1996-01-26 | 2001-05-29 | Tripos, Inc. | Further method of creating and rapidly searching a virtual library of potential molecules using validated molecular structural descriptors |
Non-Patent Citations (3)
Title |
---|
Instrinsic noise in gene regulatory networks, TATTAI, M. & VAN OUDENAARDEN, A., Proc. Natl. Acad. Sci. USA (17.07.2001) 98 (15) 8614-8619 * |
Internetdokument, Adresse www.biosource.com/ content/techCornerContent/theSource/SourceIssue6- BSI1.pdf (Frühjahr 2001), Band 6, S. 1 u. 7 (recherchiert am 26.07.2002 * |
Internetdokument, Adresse www.genomatica.com/ science tech future.htm (gutachtlich) (recherchiert am 25.07.2002) * |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE10342274A1 (de) * | 2003-09-12 | 2005-04-28 | Siemens Ag | Identifizieren pharmazeutischer Targets |
DE10342274B4 (de) * | 2003-09-12 | 2007-11-15 | Siemens Ag | Identifizieren pharmazeutischer Targets |
US8260307B2 (en) | 2003-09-24 | 2012-09-04 | Siemens Aktiengesellschaft | Method for communicating in an ad-hoc radio communication system |
US7945523B2 (en) | 2003-09-30 | 2011-05-17 | Siemens Aktiengesellschaft | Method and computer program for analyzing variables using pruning, influencing a combustion process in a combustion chamber, using a trainable statistical model |
DE10358332A1 (de) * | 2003-12-12 | 2005-07-21 | Siemens Ag | Verfahren, Computerprogramm mit Progammcode-Mitteln und Computerprogramm-Produkt zur Analyse eines regulatorischen genetischen Netzwerks einer Zelle |
DE102004007215A1 (de) * | 2004-02-13 | 2005-09-15 | Siemens Ag | Verfahren und Computerprogramm mit Programmcode-Mitteln und Computerprogramm-Produkt zur Ermittlung einer in Daten enthaltenen Struktur unter Verwendung zerlegbarer graphischer Modelle |
DE102004030296A1 (de) * | 2004-06-23 | 2006-01-12 | Siemens Ag | Verfahren, Computerprogramm mit Programmcode-Mitteln und Computerprogramm-Produkt zur Analyse eines regulatorischen genetischen Netzwerks einer Zelle |
DE102004030296B4 (de) * | 2004-06-23 | 2008-03-06 | Siemens Ag | Verfahren zur Analyse eines regulatorischen genetischen Netzwerks einer Zelle |
DE102005030136A1 (de) * | 2005-06-28 | 2007-01-11 | Siemens Ag | Verfahren zur rechnergestützten Simulation von biologischen RNA-Interferenz-Experimenten |
DE102005030136B4 (de) * | 2005-06-28 | 2010-09-23 | Siemens Ag | Verfahren zur rechnergestützten Simulation von biologischen RNA-Interferenz-Experimenten |
Also Published As
Publication number | Publication date |
---|---|
DE10159262B4 (de) | 2007-12-13 |
US20030104463A1 (en) | 2003-06-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE60015074T2 (de) | Verfahren und vorrichtung zur beobachtung der therapieeffektivität | |
DE69535428T2 (de) | Verfahren zum Auffinden von differentiel exprimierte Gene | |
DE10159262B4 (de) | Identifizieren pharmazeutischer Targets | |
DE112005002331T5 (de) | Verfahren, System und Vorrichtung zur Zusammenstellung und Nutzung von biologischem Wissen | |
DE60015726T2 (de) | Verfahren und vorrichtung zum vorhersagen von haemostatischer funktionsstörung in patientenproben | |
DE69719734T2 (de) | System zur Prüfung und Auswertung von Testergebnissen in der Antibiotikaempfindlichkeitstestung von Mikroorganismen | |
WO2022096297A1 (de) | Computerimplementiertes verfahren und vorrichtung zum durchführen einer medizinischen laborwertanalyse | |
DE102012205686B3 (de) | Verfahren zur Substanzidentifizierung und zugehöriges Computerprogrammprodukt | |
WO2010083811A1 (de) | Verfahren zur identifizierung insbesondere unbekannter substanzen durch massenspektrometrie | |
WO2017202713A1 (de) | Verfahren und system zur dokumentation eines diagnostischen tests | |
DE60023496T2 (de) | Mathematische analyse für die schätzung von veränderungen des niveaus der gen-expression | |
EP1280090A1 (de) | Verfahren zur Konfiguration paralleler Nukleinsäureanalyseverfahren | |
DE10342274B4 (de) | Identifizieren pharmazeutischer Targets | |
DE4331018A1 (de) | Verfahren zur automatischen Bewertung von Fraktionsmustertypen, die Krankheiten betreffen | |
DE102006031979A1 (de) | Verfahren zur Bestimmung des Verhaltens eines biologischen Systems nach einer reversiblen Störung | |
EP2743852A1 (de) | Verwendung künstlicher neuronaler netze zum nachweis der bildung von nierensteinen und zur bestimmung der zusammensetzung dieser steine | |
DE102005028975B4 (de) | Verfahren zur Ermittlung eines Biomarkers zur Kennzeichnung eines spezifischen biologischen Zustands eines Organismus aus mindestens einem Datensatz | |
DE102005030136B4 (de) | Verfahren zur rechnergestützten Simulation von biologischen RNA-Interferenz-Experimenten | |
DE102005062163A1 (de) | Verfahren zur Identifizierung von prediktiven Biomarken aus Patientendaten | |
DE102004030296B4 (de) | Verfahren zur Analyse eines regulatorischen genetischen Netzwerks einer Zelle | |
DE102017125013B4 (de) | MCC als epigenetischer Marker zur Identifizierung von Immunzellen, insbesondere basophiler Granulozyten | |
WO2022069162A1 (de) | Bestimmen von vergleichspatienten basierend auf ontologien | |
DE102015206444B3 (de) | Verfahren zum Erkennen von Mikroorganismen | |
WO2010060746A2 (de) | Verfahren und vorrichtung zur automatischen analyse von modellen | |
DE10358332A1 (de) | Verfahren, Computerprogramm mit Progammcode-Mitteln und Computerprogramm-Produkt zur Analyse eines regulatorischen genetischen Netzwerks einer Zelle |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
OP8 | Request for examination as to paragraph 44 patent law | ||
8364 | No opposition during term of opposition | ||
R081 | Change of applicant/patentee |
Owner name: SIEMENS HEALTHCARE GMBH, DE Free format text: FORMER OWNER: SIEMENS AKTIENGESELLSCHAFT, 80333 MUENCHEN, DE |
|
R119 | Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee | ||
R079 | Amendment of ipc main class |
Free format text: PREVIOUS MAIN CLASS: C12Q0001680000 Ipc: G16B0025100000 |