DE60213803T2

DE60213803T2 - Happier mapping

Info

Publication number: DE60213803T2
Application number: DE60213803T
Authority: DE
Inventors: H. Medical Research Council Laborato Paul DEAR; Hutchinson Madan MRC Cancer Cell Unit THANGAVELU; Alan Medical Research Council Labora BANKIER
Original assignee: Medical Research Council
Current assignee: Medical Research Council
Priority date: 2001-06-18
Filing date: 2002-06-18
Publication date: 2006-12-07
Anticipated expiration: 2022-06-19
Also published as: WO2002103046A3; JP2004532047A; GB0114853D0; PT1399590E; DE60213803D1; WO2002103046A2; EP1399590B1; EP1399590A2; ES2265507T3; US20040248153A1; DK1399590T3; CA2449366A1; ATE335852T1

Description

Die vorliegende Erfindung betrifft ein verbessertes Verfahren zum Kartieren von Nukleinsäuremolekülen auf Basis von HAPPY-Mapping, welches die rasche Kartierung großer Anzahlen von beliebig definierten Genommarkern erlaubt. Die Erfindung ist beispielsweise auf Nukleinsäuremoleküle anwendbar, bei denen keine herkömmlichen Marker zur Verfügung stehen.
HAPPY-Mapping ist ein Verfahren, welches für die Kopplungskartierung des Genoms eines beliebi gen Organismus entwickelt wurde. Es wurde zuerst unter Verwendung einer einzigen haploiden Spermie als DNA-Quelle von Dear et al. im Jahre 1989 (siehe Dear und Cook, (1989) NAR 17:6795) beschrieben und später angepaßt auf die Verwendung mehrerer diploider Zellen als DNA-Quelle, gefolgt von DNA-Verdünnung und Aufteilen in aliquote Teile von Kartierungselementen, die im Idealfall jeweils 0,69 haploide Äquivalente enthalten, unter deren Verwendung die Markerkopplung bestimmt werden kann. Diese Technik wurde in verschiedenen Publikationen besprochen und eingesetzt (beispielsweise Dear und Cook, (1993) NAR 21:13–20, Piper et al., (1998) Genome Res. 8:1299–1307 und verschiedenen darin zitierten Literaturstellen).
Im Grunde umfaßt das HAPPY-Mapping das Aufbrechen genomischer DNA in Fragmente, die physisch voneinander getrennt werden, um ein Element von Proben bereitzustellen, die jeweils eine Menge an DNA enthalten, welche vorzugsweise weniger als einem haploiden Äquivalent des betreffenden Genoms entspricht (und im Idealfall 0,69 Äquivalenten, wenn die Probe aus einer Menge genomischer DNA genommen wurde). Die Proben werden dann auf das Vorliegen einer Reihe von Markern untersucht. Marker, die in dem Genom nahe beieinander liegen, segregieren gemeinsam in höherem Maße als Marker, die in dem Genom weiter voneinander entfernt liegen. Durch Analyse einer Cosegregationstabelle, die mit einem Markerelement erhalten wurde, können die Reihenfolge und die Anordnung der Marker in dem Genom hergeleitet werden.
Die Hauptanwendungsgebiete des HAPPY-Mapping umfassen die Genom- und Genkartierung, die Detektion der Stammvielfalt, die Populationsanalyse, die Epidemiologie, die Genexpression und die Demonstration von phylogenetischen und taxonomischen Beziehungen.
Eine der Hauptschwierigkeiten bei der Erzeugung einer HAPPY-Kartierung ist die Identifizierung geeigneter Marker in dem Genom. Die Anwendungsformen von HAPPY-Mapping umfaßten zunächst die "Vorvervielfältigung" aller Marker in dem Kartierungselement unter gleichzeitiger Verwendung verschiedener Techniken, und anschließendes Untersuchen der vorvervielfältigten Proben mittels PCR hinsichtlich vordefinierter Marker unter Verwendung spezifischer Primer. In einer frühen theoretischen Arbeit, die HAPPY-Mapping beschrieb (Dear und Cook, (1989) NAR 17:6795) wurde vorgeschlagen, daß eine Mehrzahl von Produkten, die aus der PCR-Vervielfältigung mit niedriger Stringenz mit kurzen, beliebigen Primern resultierten, als Marker dienen könnte, was die Notwendigkeit kostenintensiver markerspezifischer Primer ausräumen würde.
Auf Vervielfältigung basierende Nukleinsäure-Abtasttechniken unter Verwendung synthetischer Oligodesoxynukleotidprimer mit beliebiger Sequenz erzeugen charakteristische Fingerabdrücke, die in der Lage sind, Sequenzpolymorphismen in anonymen Nukleinsäurematrizen zu detektieren (besprochen in Caetano-Anollés G (1996) Nature Biotechnology 14:1668–1674, Caetano-Anollés G (1998) Arbitrary oligonucleotides: primers for amplification and direct identification of nucleic acids, genes and organisms. In: Molecular Approaches to Ecology and Evolution, DeSalle, R., Schierwater, B. (Hrsg.) S. 107–123. Birkhauser Verlag, Basel). Die Vervielfältigung genomischer DNA unter Verwendung wenigstens eines kurzen Primers führt üblicherweise zu einer Mehrzahl von Vervielfältigungsprodukten, die Amplicons repräsentieren, welche mehr oder weniger zufällig in einem Genom verteilt sind (Livak, K.J. et al., (1992) US-Patent 5,126,239, Bassam, B.J. et al. (1995) US-Patent 5,413,909). Diese Beobachtung führte zur Einführung dreier Haupttechniken, nämlich derjenigen von zufällig vervielfältigter polymorpher DNA (RAPD) (Williams et al., (1990) Nucleic Acids 18:6531–6535), derjenigen von zufällig geprimter PCR (AP-PCR) (Welsh, J. McClelland, M. (1990) Nucleic Acids Res. 18:7213–7218), und DNA-Vervielfältigungs-Fingerprinting (DAF) (Caetano-Anollés, G. et al., (1991) Bio/Technology 9:553–557). Diese Verfahren wurden aufgrund ihrer Einfachheit und ihrer breiten Anwendbarkeit sehr populär. Es wurde eine große Anzahl von Organismen untersucht, und über die Forschungsergebnisse wurde in Tausenden von Publikationen berichtet. Unter diesen Techniken ist RAPD die am weitesten verbreitet eingesetzte Technik, obwohl die meisten Produkte von RAPD und ähnlichen Techniken nicht polymorph sind; die polymorphen Produkte, die bei der genetischen Kopplungskartierung von Interesse sind, sind in der Minderzahl.
Darüber hinaus wird die Verwendung zufälliger Amplimere als Marker durch die extreme Empfindlichkeit der nicht-stringenten Vervielfältigungsreaktionen gegenüber Variationen bei den Bedingungen eingeschränkt.
Eine alternative Form eines beliebigen Amplimers wurde auch als Marker in der genetischen Kopplungskartierung verwendet: die zu testende DNA wird zuerst mit einem Restriktionsenzym verdaut, dann werden Linker an die Fragmente ligiert, und die Produkte werden unter Verwendung von Primern, die zu der Linkersequenz komplementär sind, vervielfältigt. Wenn die Primer zusätzliche Basen an ihren 3'-Enden enthaften ("selektive Linker-Primer"), wird nur ein Teilsatz der ligierten Fragmente vervielfältigt. Wenn eine ausreichende Anzahl an zusätzlichen Basen verwendet wird, ist die Anzahl der vervielfältigten Produkte ausreichend klein, um sie anhand von Gelelektroforese auflösen zu können. Daher können verschiedene selektive Linker-Primer einzeln oder in Kombination verwendet werden, um verschiedene Teilsätze genomischer Fragmente zu vervielfältigen, von denen jedes als Marker dienen kann. Dieser Ansatz ist eher reproduzierbar als das RAPD-Verfahren, da die selektiven Primer bei hoher Stringenz verwendet werden.
Bis heute wurde dieser Ansatz nur auf die Analyse der genetischen Kopplung angewandt, wobei Polymorphismen in dem Genom sich in Unterschieden in einer Minderzahl der vervielfältigten Produkte widerspiegeln ("beliebige Fragmentlängen-Polymorphismen", AFLPs). Das AFLP-Verfahren kann nicht auf die Strahlungshybrid- (RH-) oder die klonbasierte Kartierung angewandt werden, da es keine Möglichkeit gibt, aus dem "Donor"-Genom entstehende Amplimere von aus dem "Wirt" entstehenden Amplimeren zu unterscheiden. Daher können monomorphe Marker nicht kartiert werden.
Zusammenfassung der Erfindung
Wir haben nun ein HAPPY-Mapping-Verfahren entwickelt, welches zufällige Amplimermarker verwendet und viele der solchen Markern innewohnenden Nachteile umgeht. Der neue Ansatz kombiniert die Vorteile des HAPPY-Mapping mit der Vervielfältigung unter Verwendung von auf ligierten Linkern basierenden spezifischen Primern und selektiven internen Primern unter Erzeugung von Teilsätzen von vervielfältigten Fragmenten, die mittels Gelelektroforese oder anderen herkömmlichen Techniken kartiert werden können. Da dieses Verfahren auf haploiden Genom-Äquivalenten basiert, die durch Polymerase unter Anwendung von auf Linkern basierendem Initiieren vervielfältigt wurden, haben wir dieses Verfahren als HAPPIER-Mapping bezeichnet.
In einem ersten Aspekt liefert die vorliegende Erfindung daher ein Verfahren für die Nukleinsäureanalyse, welches folgendes umfaßt:

a) Bereitstellen eines HAPPY-Kartierungselements, das eine Vielzahl von Nukleinsäureproben umfaßt, die von einer zu kartierenden Nukleinsäure abgeleitet sind, wobei jedes Teil des Elements eine Probe von DNA-Fragmenten enthält, die eine Menge repräsentieren, die hinsichtlich der Masse 0,05- bis 2 Kopien der zu kartierenden Nukleinsäure entspricht,
b) Spalten der Nukleinsäure in den Proben bis zur Vollständigkeit an einer definierten Sequenz darin unter Erzeugung von Nukleinsäurefragmenten,
c) Ligieren eines Linkers an jedes Ende der Nukleinsäurefragmente,
d) umfassendes Vervielfältigen der Nukleinsäure unter Verwendung von linkerspezifischen Primern,
e) Bereitstellen eines Repertoires von Sonden, in denen jede Sonde eine erste Sequenz, die zu der Sequenz des Linkers und dem Teil der Restriktionsstelle, der, falls vorhanden, an den Enden der durch Restriktionsverdau erzeugten Termini liegt, komplementär oder identisch ist, und eine benachbarte zweite Sequenz, die in jeder Sonde des Repertoires verschieden ist, umfaßt, und
f) Hybridisieren einer oder mehrerer Sonden aus dem Repertoire an die Proben und Registrieren des Vorhandenseins oder der Abwesenheit von Sequenzen, die zu der einen oder den mehreren Sonden in der Probe komplementär sind.

Die Erfindung kann als ein Verfahren mit einem Durchlauf ausgeführt werden, oder sie kann iterative Stufen von aufeinanderfolgender Auswahl von Zielfragmenten, die die gewünschten Marker umfassen, beinhalten. In einer bevorzugten Ausführungsform umfaßt Stufe f) daher die Stufen, in denen man:

i) eine Vielzahl von spezifischen Nukleinsäurefragmenten aus jeder Probe vervielfältigt,
ii) die in i) vervielfältigten Fragmente in Unterproben aufteilt,
iii) eine oder mehrere Sonden mit einer höheren Spezifität als die in i) verwendeten Sonden an die Unterprobe hybridisiert,
iv) wahlweise die Stufen i) und ii) schrittweise wiederholt und
v) das Vorhandensein oder die Abwesenheit von Sequenzen, die zu der einen oder den mehreren Sonden in der Probe komplementär sind, registriert.

Vorzugsweise wird die eine oder werden die mehreren Sonden in Stufe g) verwendet, um spezifische Nukleinsäurefragmente aus den Proben zu vervielfältigen, was eine Detektion der vervielfältigten Nukleinsäuren anhand konventioneller Mittel erlaubt, wie es beispielsweise unten beschrieben ist.
Jede Probe des Kartierungselements umfaßt ein haploides Genom-Äquivalent, welches aus einzelnen haploiden Zellen oder durch Verdünnung einer Menge von Nukleinsäure, die von somatischen (diploiden) Zellen abgeleitet ist, abgeleitet werden kann, wie es zuvor beschrieben wurde. Wie es hierin verwendet wird, versteht sich ein "haploides Genom-Äquivalent" als 0,05 bis 2 Massen-Äquivalente der zu kartierenden Nukleinsäure; im Idealfall beträgt es etwa 0,69 Genom-Äquivalente. Die Nukleinsäuren werden in große Fragmente gebrochen, in denen die Kopplung zum großen Teil aufrechterhalten wird, um die Unterteilung in aliquote Teile in Proben unter Bildung eines Kartierungselements zu gestatten. Das erste Aufbrechen erfolgt normalerweise mittels Bestrahlung oder Scheren, um die Zufälligkeit sicherzustellen, und die Fragmente sind relativ groß (mehrere kb bis Mb). Es ist daher der Vorgang des Aufbrechens, der die Feinheit der Kartierung bestimmt (obgleich es nicht die Komplexität des Signals ist, da der "haploide" aliquote Teil ungefähr die gleiche Menge an DNA enthält, ganz gleich wie groß das Fragment ist).
Die Proben des Kartierungselements werden dann unter Verwendung einer Restriktionsendonuklease gespalten. Die Größe der erzeugten Fragmente wird anhand der Häufigkeit der Schnitte der Endonuklease bestimmt; je häufiger geschnitten wird, umso größer ist die Komplexität des Signals, das aufgelöst werden muß. In vorteilhafter Weise wird eine Restriktionsendonuklease verwendet, die an der Spaltungsstelle kohäsiv Enden erzeugt, um die Ligation von Linkern zu vereinfachen.
Dieser zweite Vorgang des Aufbrechens erfolgt in kleine Fragmente (typischerweise kleiner als 2 kb) für die Ligation und die Vervielfältigung. Er stellt ein Werkzeug bereit, welches eine umfassende und selektive Vervielfältigung der DNA in der Probe ermöglicht. Da die Marker bereits vor der zweiten Spaltung in Teile des Kartierungselements segregiert wurden, beeinflußt dies typischerweise nicht die Genauigkeit der resultierenden Karte.
Die Nukleinsäure ist in vorteilhafter Weise DNA.
In vorteilhafter Weise ist der Linker zwischen 7 und 40 Nukleotide lang, vorzugsweise ist er 15 bis 25 Nukleotide lang. Der Linker selbst sowie eine oder mehrere benachbarte Basen in der Fragmentsequenz selbst bilden die eindeutige Stelle, an die eine Sonde aus dem Repertoire von Sonden in Abhängigkeit von der ausgewählten Sondenlänge hybridisieren kann. Die Sequenz des Linkers kann irgendeine gewünschte Sequenz sein. Um das Risiko, daß die Sequenz in dem gerade kartierten Genom natürlich vorkommt, zu minimieren, wird eine solche Sequenz in vorteilhafter Weise aus alternativen Quellen ausgewählt, wie z.B. unter Linkern, die von einer anderen Gattung abgeleitet wurden, oder sie wird untersucht, um zu bestimmen, daß eine Hybridisierung nicht auftritt.
Zusätzlich zu der konstanten Sequenz, die dem Linker entspricht, umfaßt jede Sonde eine oder mehrere Basen, die 3' dazu liegen. Es kann auf eine beliebige Anzahl benachbarter Basen zurückgegriffen werden. Für den Fachmann versteht es sich, daß es notwendig ist, die Erfordernisse an die Spezifität der Hybridisierung gegen die Kostennachteile und die Nachteile bei der Bearbeitung sehr langer Sonden auszugleichen. In vorteilhafter Weise besteht die benachbarte zweite Sequenz in der Sonde aus zwischen 2 und 20 Basen, vorzugsweise besteht sie aus 2, 3, 4, 5, 6, 7, 8, 9 oder 10 Basen.
Die Erfindung erlaubt die rasche Kartierung von monomorphen Markern, die durch die Unterteilung des haploiden Genom-Äquivalents in Proben und durch die Verwendung einer oder mehrerer spezifischer Sonden aus dem Repertoire von Sonden zufällig erzeugt werden. In jeder Probe werden nur spezifische Nukleinsäurefragmente vervielfältigt, welche Termini aufweisen, die komplementär oder identisch zu der verwendeten spezifischen Sonde sind. Die Analyse der Cosegregation vervielfältigter Fragmente in der Probenpopulation bestimmt die Markerkopplung und somit die Karte des haploiden Genoms.
In einer vorteilhaften Ausführungsform wird die Verwendung einer oder mehrerer Sonden aus einem Repertoire von Sonden durch die Verwendung einer für eine vollständige Sequenz spezifischen Sonde ersetzt, um ein einziges Fragment aus jeder Probe zu vervielfältigen. Dies erlaubt die Registrierung von konventionellern STS- (sequenzmarkierte Stelle) Markern.
In einem weiteren Aspekt betrifft die Erfindung ein Verfahren zum Codieren der Inhalte einer Mikrotiterplatte, so daß diese durch weitere Verfahren und Manipulationen aufgespürt werden können. Das Verfahren der Erfindung erlaubt das Aufspüren der Inhalte von Mikrotiterplatten selbst dann, wenn sie zu Proben in einer weiteren Platte übertragen oder mit diesen kombiniert werden oder auf ein Gel geladen werden.
In einer ersten Ausführungsform dieses Aspekts der Erfindung wird ein Festphasenmarker, wie inerte fluoreszente Mikrokügelchen (z.B. Molecular Probes A3703), zu einigen Wells in der Platte zugegeben; das Muster der so markierten Wells repräsentiert eine eindeutige "Signatur" der Platteninhalte. Beispielsweise kann die Position der Marker eine Binärzahl codieren.
In einer bevorzugten Ausführungsform werden Mikrokügelchen zu einer für PCR bestimmten Mikrotiterplatte zugegeben; die Teilchen stören die Reaktion nicht, und sie werden auf das Gel geladen, wenn die Proben nachfolgend analysiert werden. Der "Code" der Mikrotiterplatte wird auf das Gel übertragen – die Wells, die die fluoreszenten Teilchen enthalten, leuchten auf, wenn das Gel unter UV-Licht fotografiert wird. Die Teilchen wandern während der Elektroforese nicht in das Gel. Dies überwindet ein allgemeines Problem beim Aufspüren von Proben bei der Elektroforese – nämlich daß es einfach ist, einen Strichcode oder ähnliches auf eine Mikrotiterplatte zu drucken, daß es jedoch schwierig ist, die Codierung auf ein Gel zu übertragen. In einer alternativen Ausführungsform wird DNA in einige der unbenutzten Wells auf dem Gel geladen, um eine Binärzahl zu codieren. Dies erfordert jedoch, daß der Benutzer die Zahl auf der Mikrotiterplatte liest und dann dafür sorgt, daß die gleiche Zahl auf dem Gel codiert wird. Mit dem System gemäß der Erfindung kann der Roboter, der die PCR vorbereitet, auch die fluoreszenten Teilchen zugeben, und der "Code" wird beim Laden auf das Gel übertragen, ohne daß ein weiteres Eingreifen erforderlich ist oder die Möglichkeit von Fehlern besteht.
Die Erfindung ist darüber hinaus auf weitere Ausführungsformen anwendbar. Wenn beispielsweise Reaktionen vorbereitet werden, indem ein Satz von Reagenzien von einer Platte (z.B. ein Satz von PCR-Matrizen) und ein weiterer Satz von einer anderen Platte (z.B. ein Satz von PCR-Primern) entnommen werden, kann jede Quellplatte codiert werden, indem bestimmte Wells mit den Teilchen versehen werden. In geeigneter Weise kann die Codierung die erste Reihe von Wells in einer Platte und die letzte Reihe in der anderen Platte besetzen. Die Reaktionsplatte (die die Inhalte der beiden Quellplatten enthält) trägt dann beide Sätze von codierenden Markern; durch Abbilden der Platte unter UV-Bestrahlung können die Codes sichtbar gemacht und verifiziert werden. Alternativ sind die Codes sichtbar, wenn die Proben mittels Gelelektroforese analysiert werden.
Es können mehrere Farben verwendet werden, um komplexere Codes bereitzustellen oder um zu erlauben, daß zwei oder mehrere Codes in demselben Satz von Wells überlagert werden.
Ausführliche Beschreibung der Erfindung
Obwohl die hierin genannten allgemeinen Techniken im Stand der Technik gut bekannt sind, kann insbesondere auf Sambrook of al., Molecular Cloning, A Laboratory Manual (1989) und Ausubel et al., Short Protocols in Molecular Biology (1999) 4. Aufl., John Wiley & Sons, Inc. (sowie die komplette Version von Current Protocols in Molecular Biology) verwiesen werden.
1. Definitionen
Ein "Kartierungselement", wie es hierin verwendet wird, ist ein Element aus Nukleinsäurefragmenten, die in einzelne Proben oder Teile unterteilt wurden. Jedes Teil des Elements kann aus einem Bruchteil (typischerweise 1/2 oder 1/3) der fragmentierten, aus einer einzelnen haploiden Zelle isolierten DNA bestehen, wie es in Dear & Cook (1989) beschrieben ist. Allgemeiner gesprochen kann jedes Teil aus einer Probe fragmentierter DNA, die aus zwei oder mehreren haploiden Zellen oder aus einer oder mehreren diploiden Zellen hergestellt wurde, bestehen und enthält im Idealfall eine Menge an DNA, die von der Masse her 0,69 Genomen entspricht (d.h. 0,69 Genom-Äquivalente). Diese Menge stellt sicher, daß unter der Annahme einer Poisson-Verteilung von aus einer Menge von DNA entnommenen Sequenzen in jeder Probe ungefähr die Hälfte aller Marker vorliegt; Mengen von DNA zwischen etwa 0,05 und 2 fallen jedoch in den akzeptablen Bereich.
Das in der Erfindung verwendete Kartierungselement kann irgendein Kartierungselement sein, welches DNA-Fragmente enthält, die aus genomischer DNA oder irgendeiner anderen Quelle, die kartiert werden soll, abgeleitet wurden. In vorteilhafter Weise umfaßt es wenigstens zwei Teile und vorteilhafter etwa 4, 8, 16, 32, 64, 96, 100, 110, 128, 256 oder mehr Teile. Die Verwendung von 96 Teilen ist geeignet. Weitere Teile können als Kontrollproben vorliegen.
"Spalten bei einer definierten Sequenz" soll anzeigen, daß das Genom-Äquivalent unter Erzeugung von Nukleinsäurefragmenten einer sequenzspezifischen Spaltung, beispielsweise mittels Spaltungsenzymen, wie Restriktionsendonukleasen, unterzogen wird. Die Spaltung führt dazu, daß die gespaltenen "Enden" der Nukleinsäure eine definierte Sequenz haben. Die Verwendung von Typ III-Restriktionsenzymen, die von der Erkennungsstelle entfernt spalten, oder von Typ I-Enzymen, die zufällig spalten, ist nicht vorgesehen. Die Spaltungsenzyme können jedoch natürlich oder künstlich sein. Künstliche Spaltungsenzyme können beispielsweise geeignet modifizierte Ribozyme oder Zinkfinger-Polypeptide sein (siehe beispielsweise die internationale Patentanmeldung WO 00/20622).
Spaltung "bis zur Vollständigkeit" gibt an, daß im wesentlichen alle Stellen, die die spaltbare Sequenz aufweisen, gespalten werden. Dies stellt sicher, daß Fragmente mit der gleichen Sequenz über mehrere Proben hinweg einheitlich dargestellt werden.
"Vervielfältigung" bezieht sich auf irgendein Verfahren zum Vervielfachen von Nukleinsäuresträngen in vitro. Vorzugsweise ist der Vorgang enzymatisch und kann linearen oder exponentiellen Charakter haben. Eine beispielhafte Technik ist PCR, die Nukleinsäuremoleküle exponentiell vervielfältigt. Alternative Vervielfältigungstechniken umfassen Reverse Transkriptase-PCR, die verwendet wird, um RNA-Ziele zu vervielfältigen (Wang et al., (1989). Proc. Natl. Acad. Sci. USA 86(24), 9717–21). Bei diesem Verfahren wird das Enzym Reverse Transkriptase verwendet, um RNA in komplementäre DNA (cDNA) umzuwandeln, welche dann unter Verwendung von PCR vervielfältigt werden kann. Dieses Verfahren ist insbesondere nützlich, wenn Ribonukleinsäureproben, wie die Genome von RNA-Viren, kartiert werden sollen.
Die selbstunterhaltende Sequenzreplikation (3SR oder NASBA) umfaßt die isotherme Vervielfältigung einer Nukleinsäurematrize über aufeinanderfolgender Durchläufe der Aktivitäten von Reverser Transkriptase (RT), Polymerase und Nuklease, die durch einen Enzymcocktail und geeignete Oligonukleotidprimer vermittelt werden (Guatelli et al., (1990), Proc. Natl. Acad. Sci. USA 87(5), 1874–8). Enzymatischer Abbau der RNA aus dem RNA/DNA-Heteroduplex wird anstelle von Hitzedenaturierung eingesetzt. RNase H und alle anderen Enzyme werden zu der Reaktion zugegeben, und alle Stufen laufen bei derselben Temperatur und ohne Zugabe weiterer Reagenzien ab. Nach diesem Verfahren wurden in einer Stunde bei 42°C Vervielfältigungen von 10⁶ bis 10⁹ erzielt.
Die Ligasekettenreaktion oder das Ligations-Vervielfältigungssystem verwendet DNA-Ligase und vier Oligonukleotide, zwei pro Zielstrang (Wu, D.Y. & Wallace, R.B. (1989) Genomics 4(4), 560–9). Die Oligonukleotide hybridisieren an benachbarte Sequenzen der Ziel-DNA und werden durch die Ligase verbunden. Die Reaktion wird hitzedenaturiert, und der Zyklus wird wiederholt.
Die Erfindung umfaßt darüber hinaus die Verwendung irgendeiner Vervielfältigungstechnik, die Fachleuten auf dem Gebiet zur Verfügung steht. Solche Techniken umfassen die Rolling-Circle-Vervielfältigung (Lizardi et al., (1998) Nat. Genet. 19(3), 225–32) und die Strangverdrängungs-Vervielfältigung (SDA; Walker et al., (1992). Proc. Natl. Acad. Sci. USA 89(1), 392–6).
Ein "Marker" ist eine Nukleinsäuresequenz, die in Kopplungsstudien, und zwar beispielsweise anhand von PCR oder Hybridisierungsanalyse, identifiziert werden kann. In vorteilhafter Weise ist er in dem analysierten Genom im wesentlichen einzigartig, so daß seine Identifizierung eindeutig ist.
"Umfassende" Vervielfältigung bezieht sich auf die Vervielfältigung von Nukleinsäuren unabhängig von der Sequenz. Das Verfahren ist im Stand der Technik in anderen Zusammenhängen bekannt und kann als "Gesamt-Genom"-Vervielfältigung oder "Gesamt-Genom-PCR" bezeichnet werden. In vorteilhafter Weise wird in einer Population, die umfassend vervielfältigt wird, unter Erzeugung einer vervielfältigten Population, in der jeder Teil genau repräsentiert ist, jede Nukleinsäure in demselben Maße vervielfältigt. In einigen Fällen kann die Gesamt-Genom-PCR jedoch nicht zu einer Vervielfältigung aller Sequenzen, sondern zu einer Vervielfältigung eines definierten Teilsatzes davon führen.
Ein "Repertoire" von Sonden ist ein Satz von Nukleinsäuremolekülen, die sich hinsichtlich der Sequenz voneinander unterscheiden. Im Kontext der vorliegenden Erfindung umfassen die Sonden eine konstante Nukleinsäuresequenz, die komplementär oder identisch zu dem Linker ist, und einen dazu benachbarten (3') variablen Bereich. Der variable Bereich kann vollständig oder teilweise randomisiert sein, oder er kann so ausgestaltet sein, daß er eine oder mehrere spezifische Sequenzen aufweist.
In Abhängigkeit davon, wo das Restriktionsenzym innerhalb seiner Erkennungsstelle spaltet, bleiben eine oder mehrere Basen von der Stelle an allen Fragmentenden zurück. In diesem Fall beinhaltet der "konstante" Teil der Sonde im allgemeinen nicht nur die Linkersequenz (oder deren Komplement), sondern auch den Teil der Erkennungsstelle, der an dem relevanten Strang der Fragmentenden zurückbleibt.
Das "Auflösen" der vervielfältigten Fragmente bezieht sich auf deren Auflösung, beispielsweise auf Basis der Länge, so daß jedes Fragment in jeder Probe individuell identifizierbar ist.
2. HAPPY-Mapping
Allgemeine Techniken für das HAPPY-Mapping sind im Stand der Technik gut bekannt und wurden in der Literatur umfassend beschrieben. Die nachstehenden Offenbarungen, die ausführliche Beschreibungen des HAPPY-Mapping umfassen, sind durch Bezugnahme vollständig hierin aufgenommen: Konfortov et al., Genome Res. Nov. 2000, 10(11):1737–42), Williams und Firtel, Genome Res. Nov. 2000, 10(11):1658–9, Piper et al., Genome Res. Dez. 1998, 8(12):1299–307, Lynch et al., Genomics. 15. Aug. 1998, 52(1):17–26, Dear et al., Genomics, 1. März 1998, 48(2):232–41, Walter et al. Nucleic Acids Res. 25. Sep. 1993, 21(19):4524–9, Dear und Cook, Nucleic Acids Res. 11. Jan. 1993, 21(1):13–20, Dear und Cook, Nucleic Acids Res. 12. Sep. 1989, 17(17):6795–807. Die vorliegende Erfindung basiert auf HAPPY-Mapping mit einigen grundlegenden Unterschieden.
Ein erster Unterschied besteht darin, daß die Nukleinsäure im Anschluß an ein Aufbrechen mittels Bestrahlung oder anderen physikalischen Mitteln und eine Auftrennung in separate aliquote Teile durch sequenzspezifische Spaltung fragmentiert wird. Techniken zur Auswahl und Verwendung von Restriktionsendonukleasen, die bevorzugte Enzyme für die Verwendung in der vorliegenden Erfindung sind, sind im Stand der Technik, beispielsweise von Sambrook et al. (s.o.), bekannt.
Es können auch alternative Techniken für die Nukleinsäurespaltung verwendet werden, solange sequenzspezifische 5'- und 3'-Enden erzeugt werden. Diese Techniken umfassen PCR mit Primern einer definierten Sequenz, wobei die zu analysierende Nukleinsäure unter Verwendung eines Primers oder mehrerer Primer in einer Vervielfältigungsreaktion vervielfältigt wird. Der oder die Primer ist bzw. sind in der Lage, in im wesentlichen sequenzspezifischer Weise an die zu analysierende Nukleinsäure zu hybridisieren und ein Hybrid zu bilden, in welchem die Primerkette zu einer enzymatischen Kettenreaktion in der Lage ist. In Abhängigkeit von der Anzahl von Stellen, an die der Primer hybridisiert, wird eine Anzahl von Fragmenten erzeugt, welche der genomischen Sequenz entsprechen. Da die Nukleinsäure normalerweise doppelstrangig ist, sollte sie denaturiert werden, ehe Primer an sie hybridisieren können.
Die Erfindung umfaßt vorzugsweise das Spalten an einer einzigen Sequenz. Die Spaltung an mehreren Stellen, beispielsweise unter Verwendung mehr als eines Restriktionsenzyms, ist jedoch möglich. Wenn die Spaltung an mehreren Sequenzen erfolgt, können Linker an einem oder beiden Sätzen von nach der Spaltung verbleibenden "Enden" angefügt werden; wenn nur eine Linkerspezifität verwendet wird, werden nur Fragmente mit zwei Enden vervielfältigt, die an derselben Sequenz, die zu dieser Linkersequenz komplementär ist, gespalten wurden.
Darüber hinaus verwendet die vorliegende Erfindung die Ligation von Linkern als ein Mittel, um eine Vervielfältigung spezifischer Fragmente zu ermöglichen. Solche Verfahren sind Fachleuten auf dem Gebiet wiederum bekannt. Der Linker (oder die Primer, wie sie hierin an anderer Stelle definiert sind) besteht aus Einheiten, die entweder Nukleotide oder Nukleotidanaloge sind. Allgemein ausgedrückt ist ein Nukleotidanaloges eine Verbindung, die in eine Kette von Nukleotidresten aufgenommen werden kann und die basenspezifisch mit einer Base einer komplementären Nukleinsäurekette hybridisieren kann. In der vorliegenden Erfindung geeignete Analoge sind darüber hinaus Substrate für Kettenverlängerungsenzyme.
Ein Nukleotidanaloges kann ein modifiziertes Nukleotid sein, wobei die Base beispielsweise so modifiziert ist, daß sie die Basenpaarungseigenschaften beeinflußt, und/oder bei dem der Zucker- oder der Rückgratrest modifiziert ist, wie beispielsweise in den Amid-verknüpften Rückgraten von PNA, und/oder bei dem der Phosphatrest modifiziert ist.
Nukleinsäuren mit modifiziertem Rückgrat beinhalten Methylphosphonate, Phosphorthioate und Phosphordithioate, bei denen beide nicht verbrückenden Sauerstoffe durch Schwefel ersetzt sind, Phosphoramidite, Alkylphosphotriester und Boranophosphate. Achirale Phosphatderivate umfassen 3'-O'-5-S-Phosphorthioat, 3'-S-5'-O-Phosphorthioat, 3'-CH₂-5'-O-Phosphonat und 3'-NH-5'-O-Phosphoramidat. Peptidnukleinsäuren ersetzen das gesamte Phosphodiester-Rückgrat durch eine Peptidbindung.
Zuckermodifikationen werden ebenfalls verwendet, um die Stabilität und die Affinität zu verbessern. Das α-Anomer von Desoxyribose kann verwendet werden, wobei die Base in Bezug auf das natürli che β-Anomer invertiert ist. Das 2'-OH des Ribosezuckers kann unter Bildung von 2'-O-Methyl- oder 2'-O-Allylzuckern verändert werden, was eine Beständigkeit gegen einen Abbau bereitstellt, ohne die Affinität zu beeinträchtigen.
Die Modifikation der heterozyklischen Basen erhält vorzugsweise eine geeignete Basenpaarung aufrecht. Einige geeignete Substitutionen umfassen Desoxyuridin anstelle von Desoxythymidin, 5-Methyl-2'-desoxycytidin und 5-Brom-2'-desoxycytidin anstelle von Desoxycytidin. Von 5-Propinyl-2'-desoxyuridin und 5-Propinyl-2'-desoxycytidin wurde gezeigt, daß sie die Affinität und die biologische Wirksamkeit verbessern, wenn sie gegen Desoxythymidin bzw. Desoxycytidin ausgetauscht werden.
Die Länge des Linkers beträgt vorzugsweise insgesamt 7–40 Reste. Für gewöhnlich wird ein kurzer Linker mit 15–25 Resten verwendet, doch sind auch Primer mit bis zu 30 oder bis zu 40 Resten oder mit 10 oder weniger Resten geeignet. Nach der Vervielfältigung haben alle Amplimere an beiden Enden dieselbe Sequenz, wobei die Länge dieser Sequenz von dem Primer abhängig ist. Nach dem Aufbrechen der genomischen DNA werden die Nukleinsäuren in aliquoten Teilen in Proben aufgeteilt, mittels Restriktionsendonuklease-Verdau gespalten, an die Linker ligiert und unter Verwendung eines linkerspezifischen Primers vervielfältigt. Da alle Nukleinsäurefragmente den Linker an jedem Ende aufweisen, werden alle Fragmente vervielfältigt.
Das Hybridisierungsverfahren gemäß der Erfindung bringt in vorteilhafter Weise die Ligation nur an das 5'-Ende jedes Strangs in den doppelstrangigen Restriktionsfragmenten mit sich. Innerhalb des Schutzumfangs der Ansprüche können unter Verwendung von alternativen Ligationsmustern jedoch auch Varianten der vorliegenden Erfindung ausgeführt werden, wobei Linker an die 3'-Enden der Nukleinsäurestränge oder an eine Mischung aus sowohl 5'- als auch 3'-Enden angehängt werden.
Nach der Stufe der umfassenden Vervielfältigung wird ein Teilsatz der Nukleinsäurefragmente in jeder Probe unter Verwendung spezifischer Primer oder Sonden vervielfältigt. Unter diesen Bedingungen findet eine Kettenverlängerung nur dann statt, wenn die Nukleotidreste am 3'-Ende des Primers exakt zu denjenigen an der Nukleinsäureprobe passen. Die 5'-Enden müssen nicht vollkommen hybridisiert sein, solange der Rest des Primers ausreichend stark hybridisiert ist, um eine Dissoziation zu verhindern. In vorteilhafter Weise sind die Primer zu 100% komplementär zu dem Linker/Probe-Nukleinsäureziel.
Die Primer können ein Basenanaloges aufweisen, welches die degenerierte Bindung fördert, indem es die Fähigkeit besitzt, Basenpaare mit zwei oder drei der natürlichen Basen oder allgemein ohne Unterscheidung Basenpaare mit jeder der natürlichen Basen zu bilden. Solche Analoge können zusammen mit konventionellen Randomisierungstechniken bei der Herstellung der Sonden verwendet werden. Es ist jedoch bevorzugt, daß die Sonden sich bei ihrer Bindung hochgradig sequenzspezifisch verhalten und nicht an degenerierte Sequenzen hybridisieren.
Nukleotide oder Nukleotidanaloge, die während der Stufe der Kettenverlängerung hinzugefügt werden sollen, können zur Vereinfachung der Detektion markiert werden. Beispiele geeigneter Markierungen umfassen Radioisotope, fluoreszierende Reste, Haptene und Komponenten von chromogenen oder chemilumineszenten Enzymsystemen.
Zusätzlich oder alternativ können Primer mit definierter Sequenz unter Verwendung spezifischer Markierungen markiert werden, was ihre einfache Identifizierung erlaubt. Beispiele umfassen Markierungen unterschiedlicher Masse, die mittels Massenspektrometrie getrennt werden können, mo lekulare Strichcodes, die unter Verwendung geeigneter Detektionsinstrumente "ausgelesen" werden können, Kombinationen von fluroeszenten Markierungen, die eine spezifische Signaturemission erzeugen, und dergleichen.
Die Art der Markierung bestimmt das beste Verfahren für die Detektion der in jeder Probe vorliegenden Marker. Wenn die Fragmente nicht markiert sind, oder wenn alle ähnlich markiert sind, werden die vervielfältigten Fragmente in vorteilhafter Weise mittels Gelelektroforese detektiert, wie es beim herkömmlichen HAPPY-Mapping der Fall ist.
Die Verwendung spezifischer Markierungen erlaubt jedoch auch eine andere Auslese der Fragmente, wie z.B. mittels FACS oder Massenspektrometrie. Siehe beispielsweise Griffin et al., (1997) Nature Biotechnology 15:1368. Wenn die Markierungen für jeden Primer spezifisch gemacht werden, können einzelne aliquote Teile der Probe hinsichtlich des Vorliegens spezifischer Fragmente ausgelesen werden, ohne daß eine Vervielfältigung notwendig ist.
3. Nukleinsäurespaltung
Die sequenzspezifische Spaltung von Nukleinsäuren kann anhand irgendeines geeigneten Verfahrens, einschließlich Restriktionsendonuklease-Verdau, wie oben beschrieben, durchgeführt werden. Alternative Verfahren umfassen die sequenzspezifische Spaltung von doppelt helikaler DNA mittels Dreifachhelixbildung (siehe H.E. Moser und P.B. Dervan (1985) Science 238, 645–650), die Verwendung radioaktiver Nukleotide (z.B. Karamychev et al., J. Nucl. Med. 2000, 41:1093–1101), synthetische Restriktionsenzyme, wie sie in dem US-Patent Nr. 6,018,058 beschrieben sind, CAP- und Fosbasierende Moleküle (http://www.cryst.bbk.ac.uk/PPS2/projects/hastie/dsc.htm) und die Verwendung von Zinkfinger-Polypeptiden, wie sie in der WO 00/20622 beschrieben sind.
4. Verwendungen
Die verbesserten HAPPY-Mapping-Techniken der Erfindung können auf ein beliebiges Kartierungsprojekt angewandt werden. Die Kartierung von Genomen oder genomischer DNA, wie z.B. Chromo somen, hat sich bereits als empfänglich bzw. geeignet für die Anwendung von HAPPY-Mapping-Techniken erwiesen und ist geeignet für die Anwendung der hierin beschriebenen verbesserten Verfahren. Weitere Verwendungen der Erfindung werden für einen Fachmann auf dem Gebiet auf Basis dieser Beschreibung offensichtlich.
Bevorzugte Anwendungen für die vorliegende oder auch irgendeine HAPPY-Mapping-Technik werden unten ausgeführt.
A. Haplotypisierung
Wie es oben beschrieben wurde, basiert das Verfahren des HAPPY-Mapping auf dem zufälligen Aufbrechen und der zufälligen Probenentnahme von genomischer DNA unter Erzeugung eines Satzes (Elements) von Proben, die (typischerweise) sub-genomische Mengen von DNA enthalten. Es kann gefolgert werden, daß Sequenzen (Marker), die oft zusammen in denselben Teilen des Elements gefunden werden (d.h. die cosegregieren), im Vergleich zur mittleren Größe der Fragmente in dem Genom nahe beieinander liegen können. Die Strahlungshybrid-Kartierung hat einige Merkmale mit dem HAPPY-Mapping gemeinsam, jedoch wird das Aufbrechen durch Bestrahlung lebender "Donor"-Zellen, gefolgt von einer Fusion mit unbestrahlten "Wirts"-Zellen einer anderen Spezies bewirkt; einige Donor-Chromosomenfragmente verbleiben in den resultierenden Hybriden, welche dann auf ihren Gehalt an Donormarkern analysiert werden.
Im normalen Gebrauch sind die durch irgendeines der Verfahren analysierten Marker monomorph, oder, falls sie polymorph sind, der Polymorphismus bleibt unberücksichtigt (wobei beide Allele eines Markers als eines registriert werden). Wenn die Allele eines polymorphen Markes jedoch unterschieden und unabhängig voneinander in dem Kartierungselement registriert werden, können Haplotypinformationen (d.h. die Kopplungsphase zwischen den Allelen zweier oder mehrerer Marker in dem diploiden Genom) bestimmt werden.
Die Haplotypinformationen sind von beträchtlichem Interesse, insbesondere im menschlichen Genom, wo die SNP-Haplotyp-Informationen für eine Anzahl von Anwendungen, einschließlich der, jedoch nicht beschränkt auf die Verknüpfung zwischen Polymorphismen (insbesondere Einzelnukleotid-Polymorphismen, SNPs) und die Empfindlichkeit gegenüber Krankheiten oder Nebenwirkungen von Arzneimitteln, die derzeit umfassend untersucht wird, die Verknüpfung von SNP-Haplotypen mit "normalen" variablen Eigenschaften innerhalb einer Population und die Verwendung von SNP-Haplotypen zum Aufspüren der Bewegung von humanen Populationen, von Wert sind.
HAPPY-Mapping kann wie folgt auf die Bestimmung von Haplotypen angewandt werden. Ein Kartierungselement wird in üblicher Weise hergestellt, jedoch wird die Markerdetektion und -registrierung so durchgeführt, daß zwischen den Allelen polymorpher Marker unterschieden werden kann (die beiden Allele eines Markers werden hier durch Groß- und Kleinbuchstaben bezeichnet, beispielsweise A, a), und die Ergebnisse für jedes Allel werden unabhängig voneinander aufgezeichnet. Wenn zwei oder mehr polymorphe Marker so registriert werden, kann jeweils die Nähe zwischen den Allelen bestimmt werden. Wenn beispielsweise das elterliche Genom die Haplotypen AB und ab aufweist und wenn der Marker A/a ausreichend nahe bei dem Marker B/b liegt, ist eine Cosegregation (und damit Kopplung) zwischen A & B und zwischen a & b zu beobachten, nicht aber zwischen A & b oder a & B. Somit können die elterlichen Haplotypen bestimmt werden. Die Entfernung, über die Haplotypinformationen erhalten werden können, wird anhand der Größe der Fragmente bestimmt, die bei der Herstellung des Kartierungselements verwendet werden.
Es existieren viele Verfahren für die notwendige Registrierung und Unterscheidung zwischen Allelen in Abhängigkeit von der Art des Polymorphismus. Irgendeines dieser Verfahren kann in diesem Kontext verwendet werden.
In vielen Fällen ist der Ort der Marker in dem Genom bereits bestimmt worden, und es wird nur die Kopplungsphase benötigt. In diesen Fällen müssen weniger Teile des Elements analysiert werden, als es erforderlich wäre, um die Reihenfolge und die Anordnung der Marker im Vorfeld zu bestimmen. Auch wenn es bereits Kartierungsinformationen gibt, wird die Auflösung des Kartierungselements nahezu irrelevant. Somit kann das Element aus DNA-Fragmenten hergestellt werden, die so groß wie möglich sind, um den Bereich, über den hinweg Haplotypen bestimmt werden können, zu maximieren. In einem extremen Fall kann die genomische DNA ungebrochen bleiben, wobei vollständige chromosomale DNA-Moleküle (oder Chromosome) von den Teilen des Elements segregiert werden. In diesem Fall können die Ergebnisse nicht die Reihenfolge oder die Anordnung der Marker entlang eines Chromosoms bestimmen, sondern sie liefern Haplotypdaten über chromosomale Entfernungen. Im Idealfall sollten HAPPY-Elemente, die für die Verwendung bei der Bestimmung von Haplotypen hergestellt wurden, ungefähr doppelt so viel DNA enthalten wie diejenigen, die für die routinemäßige Kartierung verwendet werden, da jedes Allel als ein unabhängiger Marker betrachtet wird. Der akzeptable Bereich von DNA-Konzentrationen für standardmäßige HAPPY-Elemente ist jedoch breit genug, um die Bestimmung der Haplotypen zu unterstützen.
Im Prinzip kann dasselbe Verfahren verwendet werden, um Haplotypdaten aus Strahlungshybridelementen zu erhalten, obwohl die relative Schwierigkeit der Herstellung von RH-Elementen dies weniger attraktiv machen könnte, wenn Haplotypen aus einer großen Anzahl von Individuen notwendig sind.
B. Kartierung mit Chromosomen
Wie es oben erwähnt wurde, kann es vorteilhaft sein, Haplotypinformationen unter Verwendung von ganzen Chromosomen anstelle einer gebrochenen Nukleinsäure zu kartieren oder abzuleiten. Dar über hinaus erlaubt die Verwendung größerer DNA-Fragmente, daß das HAPPY-Mapping, welches normalerweise bei mittlerer bis hoher Auflösung nützlich ist, ausgeweitet werden kann, um Karten mit niedriger Auflösung bereitzustellen.
Beim HAPPY-Mapping wird DNA herkömmlicherweise zuerst in relativ reiner Form isoliert (in Lösung oder in einer schützenden Gelmatrix), ehe sie durch mechanische oder andere Mittel aufgebrochen wird. Die Zerbrechlichkeit langer DNA-Moleküle macht es jedoch schwierig, Fragmente zu manipulieren, die mehr als einige Millionen Basenpaare (Mb) lang sind. Daher kann die Kopplung zwischen Markern nur über Entfernungen von bis zu einigen Mb leicht bestimmt werden.
Die vorliegende Erfindung beschreibt mehrere Anwendungen, die auf der Probennahme und Analyse (bei beschränkender Verdünnung) nicht von "nackten" DNA-Fragmenten, sondern von kompletten Chromosomen, Fragmenten von Chromsomen oder Chromatin basieren. Die natürliche Verpakkung von DNA in diesen Formen ermöglicht es, größere Fragmente zu isolieren und zu manipulieren als bei der Handhabung nackter DNA, einschließlich kompletter Chromosomen.
DNA wird in der Form entweder von Chromatin oder von Metaphasenchromosomen aus Zellen freigesetzt. In diesen beiden Formen wird die DNA durch Verknüpfung mit Histonen und anderen Proteinen stabilisiert und kompaktiert bzw. verdichtet (und kann optional durch weitere Behandlungen weiter stabilisiert werden, wie die Techniken der teilweisen Fixierung, die verwendet werden, wenn Metaphasenchromosomen für die in situ-Hybridisierung oder die Durchflußsortierung (Flow Sorting) hergestellt werden). Dann wird das mechanische Aufbrechen verwendet, um das Chromatin/die Chromosomen in Fragmente aufzubrechen, wobei eine Lösung davon verdünnt und in ein Element mit Proben gegeben wird, die jeweils ungefähr 0,05–2 Genom-Äquivalente DNA enthalten (jedoch vorzugsweise ähnliche Mengen von DNA in jedem Teil des Elements); Bereiche zwischen etwa 0,2 und etwa 1,5 werden im allgemeinen als nützlich angesehen. Die Verwendung von mehr als 2 Kopien ist nachteilig, doch gibt es keine starre untere Grenze für die Anzahl an Kopien, die verwendet werden können. Das Prinzip der Erfindung kann mit beliebigen geringen Mengen an DNA pro aliquotem Teil verwendet werden, vorausgesetzt, daß ausreichend Teile in dem Element analysiert werden, um sicherzustellen, daß jede Markersequenz in wenigstens einem (und vorzugsweise mehr als einem) Teil vorliegt. Die Proben werden dann in der Weise analysiert, wie es bereits zur Analyse von HAPPY-Mapping-Elementen beschrieben wurde; eine Vorbehandlung mit Proteinase-K oder andere Verfahren können in einigen Fällen erforderlich sein, um sicherzustellen, daß die DNA für eine PCR-Vervielfältigung zugänglich wird.
Da intakte Metaphasenchromosome routinemäßig in Lösung hergestellt und bearbeitet werden, ist es klar, daß die Fragmente, die in die Teile des Elements segregiert werden, irgendeine Größe, bis zu und einschließlich kompletter Chromosomen, haben können. (Es sei angemerkt, daß, sobald die Segregierung in Proben abgeschlossen ist, eine weitere Fragmentierung der DNA keine Konse quenzen hat, solange ihr Markergehalt erhalten bleibt.) Die Abstände, über die eine Kopplung mittels HAPPY-Mapping am besten detektiert werden kann, betragen typischerweise das bis zu 0,5- bis 0,7-fache der mittleren Länge der verwendeten DNA-Fragmente. Somit kann ein aus grob aufgebrochenen Chromosomenfragmenten hergestelltes Element verwendet werden, um Karten mit spärlicher Population herzustellen, in denen der mittlere Abstand zwischen den Markern mehrere Mb oder mehr beträgt. Dies ist in denjenigen Genomen nützlich, deren Größe es impraktikabel oder unwirtschaftlich macht, die Karten mit sehr dichten Populationen herzustellen, die durch konventionelles HAPPY-Mapping erzeugt werden.
Fragmente von Metaphasenchromosomen können auch mittels Durchflußzytometrie ausgelesen werden (tatsächlich werden fragmentierte Chromosomen bei der Durchflußsortierung von Chromosomen normalerweise als "Hintergrund" gesehen und entstehen durch den ungewollten Abbau oder das Scheren der gewünschten intakten Chromosome). Daher kann die Durchflußsortierung (anstelle von Verdünnung und zufälliger Probenentnahme) als Verfahren verwendet werden, um die erforderliche Anzahl und die Größe von Fragmenten in die Teile des Kartierungselements zu segregieren. Ein solcher Ansatz hat die Vorteile, daß (a) die Gesamtmenge an DNA in jedem Teil des Elements genau kontrolliert werden kann und (b) der Größenbereich der Fragmente eng ausgewählt werden kann; eine solche knappe Auswahl erlaubt die Feineinstellung des Bereichs und der Auflösung des Elements, um das vorliegende Kartierungsproblem anzugehen, und verbessert die Qualität der Kartierungsdaten durch das Ausschließen von Fragmenten, die entweder zu klein sind, um eine Kopplung zwischen irgendwelchen Markern widerzuspiegeln, oder die so groß sind, daß sie keine nützlichen Kartierungsinformationen enthalten.
Intakte Metaphasenchromosome können in die Teile des Kartierungselements segregiert werden, und zwar entweder durch Beschränken der Verdünnung einer Lösung solcher Chromosomen oder durch Durchflußsortieren. In diesem Fall liefert das Element keine Informationen über die Reihenfolge und die Anordnung von Markern innerhalb eines Chromosoms, sondern erlaubt eine Colokalisierung von Markern in Gruppen mit ihren jeweiligen Chromosomen. Dies ist insbesondere für die chromosomale Zuweisung von Markern in denjenigen Spezies, in denen die Chromosome nicht anhand von Durchflußzytometrie unterschieden werden können, von Bedeutung. Beispielsweise können die Chromosome 9, 10, 11 und 12 des Menschen nicht mittels Durchflußzytometrie unterschieden werden. Würde mittels Durchflußsortierung eines oder zweier Chromosome (zufällige Probenentnahme aus dem Chr9-12-Cluster) in jedes Teil des Elements ein Kartierungselement hergestellt, so würde die Typisierung von Markern auf dem Element eine rasche Zuweisung der Marker zu chromosomalen Kopplungsgruppen erlauben.
Alle obigen Verfahren können auch zur Bestimmung von Haplotypen eingesetzt werden (die Kopplungsphasen zwischen polymorphen Loki). In solchen Fällen ist es notwendig, nur die beiden Allele jedes Markers unabhängig voneinander zu registrieren (unter Verwendung bekannter Techniken zur Unterscheidung zwischen Allelen); danach kann jedes Allel als unabhängiger Marker behandelt werden, und es ist (beispielsweise) eine Kopplung zwischen A & B und zwischen a & b zu beobachten, was die Haplotypen AB und ab erkennen läßt. Die Verwendung von Chromatin/Chromosom-Fragmenten oder intakten Chromosomen bei der Herstellung der Kartierungselemente erlaubt die Bestimmung von Haplotypen über beträchtliche (oder chromosomale) Abstände.
Die Erfindung wird unten lediglich zu Zwecken der Veranschaulichung in dem nachfolgenden Beispiel weiter beschrieben.
Beispiel
Erzeugung und Vorvervielfältigung des Kartierungselements
Zellkerne werden aus Blattzellen von Gerste (Hordeum vulgare, Art "Optic") isoliert und in Agarosestränge eingebettet (0,5% w/v Agarose mit niedrigem Schmelzpunkt, ~ 4000 Zellkerne pro Mikroliter). Die Stränge werden in Lyselösung (0,5 M EDTA, pH 9,0, 1% Laurylsarcosinnatriumsalz, 0,1 mg ml^–1 Proteinase-K) eingetaucht und bei 45°C für 48 h unter leichtem Rühren, dann in 0,5 M EDTA, pH 9,0 für 1 h bei 45°C, dann in 0,05 M EDTA, pH 8,0 für 1 h auf Eis inkubiert und bis zum Gebrauch in 0,05 M EDTA, pH 8,0 bei 4°C gelagert. Bei dieser Manipulation diffundiert die Lyselösung in die Agarose, lysiert die Zellkerne und entfernt/zersetzt Proteine und andere Kernmaterialien, die während der Waschstufen hinausdiffundieren, was in der Agarose eingefangene, im wesentlichen reine DNA liefert. Die Agarose dient dazu, die DNA vor unerwünschtem mechanischem Aufbrechen zu schützen, da es sehr wichtig ist, daß die Häufigkeit der Brüche in der DNA kontrolliert wird.
Bruchstellen werden durch Schmelzen eines kurzen Strangabschnitts in 5 ml magnesiumfreiem PCR-Puffer [dieser wird gegenüber Wasser bevorzugt verwendet, um das Risiko einer Denaturierung der DNA zu reduzieren] bei 68°C und mehrmaliges Umdrehen des Röhrchens, um die DNA sowohl zu verteilen als auch in Fragmente von etwa 50–100 kb zu scheren, eingefügt. Die Lösung wird abkühlen gelassen und unter Verwendung von Pipettenspitzen mit großer Öffnung, um ein weiteres mechanisches Scheren der DNA zu vermeiden, mit Wasser auf eine Konzentration von ungefähr 0,1 haploiden Genom-Äquivalenten pro Mikroliter verdünnt. 5 μl-Proben dieser Lösung werden in 88 Wells einer 96-Well-Mikrotiterplatte gegeben, und 5 μl Wasser werden in jeden der verbleibenden 8 Wells gegeben. Die Proben werden jeweils mit einem Tropfen (~ 30 μl) leichtes Mineralöl abgedeckt bzw. überlagert, um ein Verdampfen zu verhindern.
Eine Verdau-Grundmischung wird hergestellt und umfaßt pro 2 μl Volumen folgendes: 0,7 μl One-Phor-All-Puffer (Pharmacia; ein Vielzweckpuffer, der für eine Anzahl von Reaktionen geeignet ist), 4,2 Einheiten des Restriktionsenzyms DpnII (New England Biolabs) und Wasser. 2 μl dieses Gemischs werden in jeden Well der Mikrotiterplatte gegeben. Die Platte wird kurz zentrifugiert (~ 500 g für 5 Sekunden), um sicherzustellen, daß alle wäßrigen Komponenten sich unterhalb der Ölschicht in jedem Well vereinigen. Die Mikrotiterplatte wird bei 37°C für zehn Minuten inkubiert. Das Restriktionsenzym wird dann durch Erhitzen auf 65°C für 30 Minuten inaktiviert. DpnII spaltet an der Erkennungssequenz GATC, und die Bedingungen werden so ausgewählt, daß die Spaltung bis zur Vollendung fortgesetzt wird.
Eine Ligations-Grundmischung wird hergestellt und umfaßt pro 6 μl Volumen folgendes: 1,5 μl einer 100 μM Lösung des Oligonukleotids LIB1, 1,5 μl einer 100 μM Lösung des Oligonukleotids dd-Sau3A, 0,8 μl One-Phor-All-Puffer, 0,26 μl 1 M NaCl und Wasser. 6 μl dieses Gemischs werden zu jedem Well der Mikrotiterplatte zugegeben, die dann wie zuvor kurz zentrifugiert wird. Die Platte wird bei 85°C für 20 Minuten inkubiert und dann um 1 °C pro Minute auf eine Temperatur von 15°C abgekühlt. Die Oligonukleotide sind die folgenden:
LIB1 5'-AGT GGT ATT CCT GCT GTC AGG-3'
ddSau3A 5'-GAT CCC TGA CAG C*-3'
wobei C* ein Didesoxynukleotid anzeigt.
Eine Ligase-Grundmischung wird hergestellt und umfaßt pro 2 μl Volumen folgendes: 1 μl T4-DNA-Ligase (5 Einheiten, Boehringer Mannheim) und 1 μl 15 mM rATP (gepuffert in Tris-HCl bei einem pH-Wert von 7,4). 2 μl dieser Lösung werden zu jedem Well zugegeben, und die Platte wird erneut kurz zentrifugiert, um die wäßrigen Komponenten unterhalb der Öldeckschicht zu vereinigen. Die Platte wird dann bei 16°C über Nacht (~ 16 Stunden) inkubiert.
Die Oligonukleotide sind wie folgt angeordnet:
5' AGTGGTATTCCTGCTGTCAGGGATCXXXXXXXXXXXXXXXXGATCCCTGACAGC* 3'
3' *CGAGAGTCCCTAGYYYYYYYYYYYYYYYYCTAGGGACTGTCGTCCTTATGGTGA 5'
Kursiv = LIB1, unterstrichen = ddSau3A, Normalschrift = Restriktionsfragment (X, Y = irgendwelche Basen, Länge typischerweise 100–500 bp). ANMERKUNG – Eine Ligation tritt nur zwischen LIB1 und dem Restriktionsfragment auf (angezeigt durch doppelte Unterstreichung) und NICHT zwischen ddSau3A und dem Fragment (da die notwendigen Phosphatgruppen nicht vorhanden sind). Aus demselben Grund kann es keine Ligation zwischen den Oligonukleotiden ddSau3A und LIB1 alleine geben, was nachfolgende Vervielfältigungen beeinträchtigen würde ("Linker-Dimer").
Eine Gesamt-Genom-Vervielfältigungsmischung wird hergestellt und umfaßt pro 37 μl Volumen folgendes: 5 μl 10 PCR-Puffer Nr. 1 (Boehringer Mannheim), 0,8 μl 25 mM dNTP-Lösung (d.h. jeweils 25 mM dATP, dCTP, dGTP, dTTP), 1,4 μl Expand-Long-Polymerase (Boehringer Mannheim) und Wasser. 37 μl dieser Lösung werden in jeden Well der Mikrotiterplatte gegeben. Dann wird eine Vervielfältigung aller Restriktionsfragmente [im Idealfall – bestimmte Fragmente können sich auch nicht vervielfältigen, weil sie beispielsweise zu groß sind und in einem Sequenzbereich mit weit voneinander entfernt liegenden Erkennungsstellen für DpnII liegen] durch Thermozyklen wie folgt erhalten:

1) 68°C × 4 Min. (Während dieser Stufe wird das Oligonukleotid ddSau3A denaturiert, und die Verlängerung des 3'-Endes jedes Strangs jedes Restriktionsfragments findet statt, wobei ein Bereich synthetisiert wird, der komplementär zu dem ligierten LIB1-Oligonukleotid ist. Nach dieser Stufe tragen daher alle Restriktionsfragmente die LIB1-Sequenz und ihr Komplement an jedem Ende.)
2) 14 Zyklen von: 94°C × 40 Sek., 57°C × 30 Sek., 68°C × 75 Sek.
3) 34 Zyklen wie oben, jedoch bei 68°C für 105 Sek. statt 75 Sek.
4) 1 Zyklus wie oben, jedoch bei 68°C für 300 Sek. statt 75 Sek.

(Während der Stufen 2, 3 und 4 findet eine exponentielle Vervielfältigung der gekoppelten Restriktionsfragmente statt, initiiert durch den Überschuß des Oligonukleotids LIB1.)
Die Reaktionen werden dann der Reihe nach in Wasser auf 1:8000 verdünnt und bei –20°C gelagert, bis sie entweder für die beliebige oder die spezifische Detektion von Markern (unten) benötigt werden.
Detektion spezifischer Marker
Für die Detektion spezifischer Marker (d.h. mit vorbestimmten Sequenzen unter Verwendung spezifischer Primer) werden jeweils 5 μl der verdünnten Produkte von oben in einer Reaktion vervielfältigt, die folgendes (zusätzlich) umfaßt:
1× "Gold" PCR-Puffer (Perkin Elmer)
0,25 Einheiten "Gold" DNA-Polymerase
1,5 mM MgCl₂
jeweils 1 μM spezifischer Vorwärts- und Rückwärts-Oligonukleotide (für Beispiele siehe unten)
jeweils 200 μM dATP, dCTP, dGTP, dTTP
Gesamtvolumen 10 μl
Die Reaktionen werden in 96-Well-Mikrotiterplatten vorbereitet und entweder mit Mineralöl abgedeckt (± 30 μl pro Well) oder unter Verwendung eines geeigneten Versiegelungsfilms versiegelt. Thermozyklen werden wie folgt durchgeführt:
93°C × 5 Min.
38 Zyklen von: 94°C × 20 Sek., 55°C × 30 Sek., 72°C × 60 Sek.
(Die Annealingtemperatur, im obigen Beispiel 55°C, kann gemäß den Schmelztemperaturen der Oligonukleotidprimer angepaßt werden.)
Die Produkte werden mit einem geeigneten Ladepuffer ergänzt (8 μl 15% w/v Ficoll 400, 0,15 mg/ml Bromphenol-Blau, 4 × SyBr-Grün in 1 × TBE-Puffer), und 10 μl-Proben des Gemischs werden mittels Elektroforese analysiert (6% Polyacrylamidgel in 0,5 × TBE-Puffer).
Beispielsweise wurde das obige Verfahren sukzessive für drei spezifische Sequenzen ("Marker") durchgeführt, deren Position innerhalb des Gerste-Genoms bereits bekannt ist (und die daher als ein Test für das System dienen könnten). Die spezifischen Primersequenzen sind die folgenden:
14-4:
Vorwärts = GTCACTTGTCATCATTTGTCC
Rückwärts = GCACCATGAATACAATCATCC
14-5:
Vorwärts = CAACGATGAGATGGTAACCG
Rückwärts = CTCGCAGTCTGTTCGTTGG
1-16B:
Vorwärts = CTGTGCAAACAACATGACC
Rückwärts = CTGTTTGACCAGTTGTTTGC
Jedes Primerpaar vervielfältigt ein kurzes (einige Hundert Basenpaare langes) Segment einer bekannten DNA-Sequenz; von den Segmenten ist in jedem Fall bekannt, daß sie keine Restriktionsstelle für DpnII aufweisen. Es ist bekannt, daß die Marker 14-4 und 14-5 sehr nahe beieinander liegen (< 2 kb), wohingegen von 1-16B bekannt ist, daß es um einen großen Abstand (> 100 kb) von diesen beiden entfernt liegt.
Die Analyse der Ergebnisse zeigt, daß es zwischen 14-4 und 14-5 zu einer starken Cosegregation kam, wobei die beiden Marker jeweils in ± 60% der 88 Teile des Kartierungselements vorliegen (mit Ausnahme der 8 Negativkontrollen, die keine Marker enthielten), und mit einer großen Ähnlichkeit bei der Verteilung der beiden Marker in dem Element. Eine Lod-Registrierung von 14,2 zwischen diesen beiden Markern wird berechnet, was deutliche Hinweise auf eine Kopplung liefert. Der Marker 1-16B liegt auch in ± 60% der Teile des Kartierungselements vor, die nicht zur Negativkontrolle gehören, doch zeigt seine Verteilung keine offensichtliche Korrelation zu derjenigen der anderen beiden Marker; die Lod-Registrierungen zwischen 1-16B und 14-4 und zwischen 1-16B und 14-5 betragen 0,4 bzw. 0,7, welches Werte ohne Signifikanz sind.
Es liegt auf der Hand, daß das verdünnte Produkt der durch Ligation vermittelten PCR ausreichend ist, um ungefähr 80.000 spezifische Marker auf diese Weise zu typisieren. Es ist jedoch auch offensichtlich, daß dieses Produkt für eine weitere, nicht-selektive Vervielfältigung unter Verwendung des LIB1-Primers empfänglich ist, was im wesentlichen unbegrenzte Materialmengen liefert.
Detektion willkürlicher Marker
Eine Fraktion von 5 μl wird aus jedem der verdünnten Produkte der Vorvervielfältigung entnommen und mit Reagenzien ergänzt, was ein Gesamtreaktionsvolumen von 10 μl liefert, welches (zusätzlich zu den verdünnten Produkten) 0,25 Einheiten thermostabile DNA-Polymerase (Taq Gold, Perkin Elmer), 1× PCR "Gold" Puffer (empfohlen vom Lieferanten der Polymerase), 1,5 mM Magnesiumchlorid, 200 μM von jedem dNTP und 1 μm des Primers LIBSEL-A (5'-CCT GCT GTC AGG GAT CGT CC-3') enthält.
(Die ersten 12 Basen sind identisch zu den zwölf 3'-Basen von LIB1; die nächsten vier sind identisch zu der Erkennungssequenz von DpnII, welche alle Fragmente gemeinsam haben; die letzten vier Basen sind selektiv und haben Gegenstücke nur in ~1/256 aller Fragment-Termini.) Das Gemisch wird mit Mineralöl abgedeckt, um die Verdampfung zu beschränken, und einem Thermozyklus unterzogen (93°C × 9 Min., dann 33 Zyklen bei 94°C × 20 Sek., 64°C × 30 Sek. und 72°C × 60 Sek.). Die Produkte jeder Reaktion werden mittels Gelelektroforese unter Verwendung von Standardprotokollen analysiert, welche in der Lage sind, Fragmente mit Größen von zwischen 100 und 500 Basen aufzulösen.
Jede solche Reaktion (entsprechend jedem Teil des Kartierungselements) liefert eine Anzahl von Produkten, wobei die Produkte in jedem Fall ein Teilsatz derjenigen einigen zehn DpnII-Fragmente des Genoms sind, die die geeigneten vier selektiven Nukleotide intern zur Restriktionsstelle an jedem Ende tragen. Jede Reaktion wird nach dem Vorhandensein oder der Abwesenheit jedes der auflösbaren Fragmente registriert, und die Fragmente werden relativ zueinander kartiert, indem beobachtet wird, wie oft sie in den 96 aliquoten Teilen cosegregieren. Jedes Fragment kann daher als Marker betrachtet werden, definiert durch eine Kombination aus seiner Größe (bestimmt durch Elektroforese), dem Restriktionsenzym, das zu seiner Erzeugung verwendet wird (DpnII) und dem selektiven Primer (LIBSEL-A), der zu seiner Vervielfältigung verwendet wird. Einige Marker können nicht kartiert werden, weil entweder die Vervielfältigungen (umfassend oder selektiv) aus irgendeinem von verschiedenen Gründen fehlschlagen oder weil der Marker keine einzelne Kopiesequenz ist (was leicht zu erkennen ist, wenn man die Anzahl an Positiven in den 96 aliquoten Teilen betrachtet) oder weil er eine Größe hat, die der eines anderen Markers zu ähnlich ist, und er daher bei der Elektroforese nicht aufgelöst werden kann. Die Mehrzahl der Marker kann jedoch im Verhältnis zu den Proben detektiert und mittels einer tabellarischen Aufstellung und Berechnung der Kopplungshäufigkeit kartiert werden.

Claims

Verfahren für die Nukleinsäureanalyse, welches folgendes umfaßt: a) Bereitstellen eines HAPPY-Kartierungselements, das eine Vielzahl von Nukleinsäureproben umfaßt, wobei jede Probe zufällig ausgewählte Fragmente gebrochener DNA von der zu kartierenden Nukleinsäure enthält und eine Masse zwischen dem 0,05- und 2-fachen der Masse einer einzelnen Kopie der zu kartierenden Nukleinsäure aufweist, b) Spalten der Nukleinsäure in den Proben bis zur Vollständigkeit an einer definierten Sequenz darin unter Erzeugung von Nukleinsäurefragmenten, c) Ligieren eines Linkers an die 5'- und 3'-Enden der Nukleinsäurefragmente, d) umfassendes Vervielfältigen der Nukleinsäure unter Verwendung von linkerspezifischen Primern, e) Bereitstellen eines Repertoires von Sonden, in denen jede Sonde eine erste Sequenz, die zu der Sequenz des Linkers komplementär oder identisch ist, und eine benachbarte zweite Sequenz, die in jeder Sonde des Repertoires verschieden ist, umfaßt, und f) Hybridisieren einer oder mehrerer Sonden aus dem Repertoire an die Proben und Registrieren des Vorhandenseins oder der Abwesenheit von Sequenzen, die zu der einen oder den mehreren Sonden in der Probe komplementär sind.
Verfahren nach Anspruch 1, wobei Stufe d) die Stufen umfaßt, in denen man i) eine Vielzahl von spezifischen Nukleinsäurefragmenten aus jeder Probe vervielfältigt, ii) die in i) vervielfältigten Fragmente in Unterproben aufteilt, iii) eine oder mehrere Sonden mit einer höheren Spezifität als die in i) verwendeten Sonden an die Unterprobe hybridisiert, iv) wahlweise die Stufen i) und ii) schrittweise wiederholt und v) das Vorhandensein oder die Abwesenheit von Sequenzen, die zu der einen oder den mehreren Sonden in der Probe komplementär sind, registriert.
Verfahren nach Anspruch 1 oder Anspruch 2, wobei die eine Sonde oder die mehreren Sonden in Stufe e) zur Vervielfältigung von spezifischen Nukleinsäurefragmenten aus den Proben verwendet wird/werden.
Verfahren nach einem der vorangegangenen Ansprüche, wobei zwei oder mehr Proben des Kartierungselements von einer einzelnen haploiden Zelle abgeleitet sind.
Verfahren nach einem der Ansprüche 1 bis 3, wobei die Proben des Kartierungselements von einer oder mehreren diploiden Zellen oder von zwei oder mehreren haploiden Zellen durch Verdünnung erhalten wurden.
Verfahren nach einem der vorangegangenen Ansprüche, wobei die Kartierungselementproben unter Verwendung eines oder mehrerer Restriktionsendonukleaseenzyme gespalten werden.
Verfahren nach einem der vorangegangenen Ansprüche, wobei der Linker zwischen 7 und 40 Nukleotide lang ist.
Verfahren nach einem der vorangegangenen Ansprüche, wobei jede Sonde in dem Sondenrepertoire die Linkersequenz oder eine dazu komplementäre Sequenz und eine weitere Sequenz mit zwischen 2 und 20 Nukleotiden umfaßt.
Verfahren nach Anspruch 8, wobei die weitere Sequenz eine wenigstens teilweise zufällig erzeugte Sequenz ist.
Verfahren nach Anspruch 8, wobei jede Sonde eine bekannte Sequenz hat.
Verfahren nach einem der vorangegangenen Ansprüche, wobei das Vorhandensein oder die Abwesenheit irgendeines Nukleinsäurefragments in jeder Probe durch Gelelektroforese registriert wird.