-
Die
vorliegende Erfindung betrifft ein verbessertes Verfahren zum Kartieren
von Nukleinsäuremolekülen auf
Basis von HAPPY-Mapping, welches die rasche Kartierung großer Anzahlen
von beliebig definierten Genommarkern erlaubt. Die Erfindung ist
beispielsweise auf Nukleinsäuremoleküle anwendbar, bei
denen keine herkömmlichen
Marker zur Verfügung
stehen.
-
HAPPY-Mapping
ist ein Verfahren, welches für
die Kopplungskartierung des Genoms eines beliebi gen Organismus
entwickelt wurde. Es wurde zuerst unter Verwendung einer einzigen
haploiden Spermie als DNA-Quelle von Dear et al. im Jahre 1989 (siehe
Dear und Cook, (1989) NAR 17:6795) beschrieben und später angepaßt auf die
Verwendung mehrerer diploider Zellen als DNA-Quelle, gefolgt von
DNA-Verdünnung
und Aufteilen in aliquote Teile von Kartierungselementen, die im
Idealfall jeweils 0,69 haploide Äquivalente
enthalten, unter deren Verwendung die Markerkopplung bestimmt werden
kann. Diese Technik wurde in verschiedenen Publikationen besprochen
und eingesetzt (beispielsweise Dear und Cook, (1993) NAR 21:13–20, Piper
et al., (1998) Genome Res. 8:1299–1307 und verschiedenen darin
zitierten Literaturstellen).
-
Im
Grunde umfaßt
das HAPPY-Mapping das Aufbrechen genomischer DNA in Fragmente, die physisch
voneinander getrennt werden, um ein Element von Proben bereitzustellen,
die jeweils eine Menge an DNA enthalten, welche vorzugsweise weniger
als einem haploiden Äquivalent
des betreffenden Genoms entspricht (und im Idealfall 0,69 Äquivalenten,
wenn die Probe aus einer Menge genomischer DNA genommen wurde).
Die Proben werden dann auf das Vorliegen einer Reihe von Markern
untersucht. Marker, die in dem Genom nahe beieinander liegen, segregieren
gemeinsam in höherem Maße als Marker,
die in dem Genom weiter voneinander entfernt liegen. Durch Analyse
einer Cosegregationstabelle, die mit einem Markerelement erhalten wurde,
können
die Reihenfolge und die Anordnung der Marker in dem Genom hergeleitet
werden.
-
Die
Hauptanwendungsgebiete des HAPPY-Mapping umfassen die Genom- und
Genkartierung, die Detektion der Stammvielfalt, die Populationsanalyse,
die Epidemiologie, die Genexpression und die Demonstration von phylogenetischen
und taxonomischen Beziehungen.
-
Eine
der Hauptschwierigkeiten bei der Erzeugung einer HAPPY-Kartierung
ist die Identifizierung geeigneter Marker in dem Genom. Die Anwendungsformen
von HAPPY-Mapping umfaßten
zunächst
die "Vorvervielfältigung" aller Marker in
dem Kartierungselement unter gleichzeitiger Verwendung verschiedener
Techniken, und anschließendes
Untersuchen der vorvervielfältigten
Proben mittels PCR hinsichtlich vordefinierter Marker unter Verwendung spezifischer
Primer. In einer frühen
theoretischen Arbeit, die HAPPY-Mapping beschrieb (Dear und Cook, (1989)
NAR 17:6795) wurde vorgeschlagen, daß eine Mehrzahl von Produkten,
die aus der PCR-Vervielfältigung
mit niedriger Stringenz mit kurzen, beliebigen Primern resultierten,
als Marker dienen könnte, was
die Notwendigkeit kostenintensiver markerspezifischer Primer ausräumen würde.
-
Auf
Vervielfältigung
basierende Nukleinsäure-Abtasttechniken
unter Verwendung synthetischer Oligodesoxynukleotidprimer mit beliebiger
Sequenz erzeugen charakteristische Fingerabdrücke, die in der Lage sind,
Sequenzpolymorphismen in anonymen Nukleinsäurematrizen zu detektieren
(besprochen in Caetano-Anollés
G (1996) Nature Biotechnology 14:1668–1674, Caetano-Anollés G (1998)
Arbitrary oligonucleotides: primers for amplification and direct
identification of nucleic acids, genes and organisms. In: Molecular
Approaches to Ecology and Evolution, DeSalle, R., Schierwater, B.
(Hrsg.) S. 107–123.
Birkhauser Verlag, Basel). Die Vervielfältigung genomischer DNA unter
Verwendung wenigstens eines kurzen Primers führt üblicherweise zu einer Mehrzahl
von Vervielfältigungsprodukten,
die Amplicons repräsentieren,
welche mehr oder weniger zufällig
in einem Genom verteilt sind (Livak, K.J. et al., (1992) US-Patent
5,126,239, Bassam, B.J. et al. (1995) US-Patent 5,413,909). Diese
Beobachtung führte
zur Einführung
dreier Haupttechniken, nämlich derjenigen
von zufällig
vervielfältigter
polymorpher DNA (RAPD) (Williams et al., (1990) Nucleic Acids 18:6531–6535),
derjenigen von zufällig
geprimter PCR (AP-PCR) (Welsh, J. McClelland, M. (1990) Nucleic
Acids Res. 18:7213–7218),
und DNA-Vervielfältigungs-Fingerprinting
(DAF) (Caetano-Anollés,
G. et al., (1991) Bio/Technology 9:553–557). Diese Verfahren wurden
aufgrund ihrer Einfachheit und ihrer breiten Anwendbarkeit sehr
populär.
Es wurde eine große
Anzahl von Organismen untersucht, und über die Forschungsergebnisse
wurde in Tausenden von Publikationen berichtet. Unter diesen Techniken
ist RAPD die am weitesten verbreitet eingesetzte Technik, obwohl
die meisten Produkte von RAPD und ähnlichen Techniken nicht polymorph
sind; die polymorphen Produkte, die bei der genetischen Kopplungskartierung
von Interesse sind, sind in der Minderzahl.
-
Darüber hinaus
wird die Verwendung zufälliger
Amplimere als Marker durch die extreme Empfindlichkeit der nicht-stringenten
Vervielfältigungsreaktionen
gegenüber
Variationen bei den Bedingungen eingeschränkt.
-
Eine
alternative Form eines beliebigen Amplimers wurde auch als Marker
in der genetischen Kopplungskartierung verwendet: die zu testende DNA
wird zuerst mit einem Restriktionsenzym verdaut, dann werden Linker
an die Fragmente ligiert, und die Produkte werden unter Verwendung
von Primern, die zu der Linkersequenz komplementär sind, vervielfältigt. Wenn
die Primer zusätzliche
Basen an ihren 3'-Enden
enthaften ("selektive
Linker-Primer"), wird
nur ein Teilsatz der ligierten Fragmente vervielfältigt. Wenn
eine ausreichende Anzahl an zusätzlichen
Basen verwendet wird, ist die Anzahl der vervielfältigten
Produkte ausreichend klein, um sie anhand von Gelelektroforese auflösen zu können. Daher
können
verschiedene selektive Linker-Primer einzeln oder in Kombination
verwendet werden, um verschiedene Teilsätze genomischer Fragmente zu vervielfältigen,
von denen jedes als Marker dienen kann. Dieser Ansatz ist eher reproduzierbar
als das RAPD-Verfahren, da die selektiven Primer bei hoher Stringenz
verwendet werden.
-
Bis
heute wurde dieser Ansatz nur auf die Analyse der genetischen Kopplung
angewandt, wobei Polymorphismen in dem Genom sich in Unterschieden
in einer Minderzahl der vervielfältigten
Produkte widerspiegeln ("beliebige
Fragmentlängen-Polymorphismen", AFLPs). Das AFLP-Verfahren
kann nicht auf die Strahlungshybrid- (RH-) oder die klonbasierte
Kartierung angewandt werden, da es keine Möglichkeit gibt, aus dem "Donor"-Genom entstehende
Amplimere von aus dem "Wirt" entstehenden Amplimeren
zu unterscheiden. Daher können
monomorphe Marker nicht kartiert werden.
-
Zusammenfassung
der Erfindung
-
Wir
haben nun ein HAPPY-Mapping-Verfahren entwickelt, welches zufällige Amplimermarker verwendet
und viele der solchen Markern innewohnenden Nachteile umgeht. Der
neue Ansatz kombiniert die Vorteile des HAPPY-Mapping mit der Vervielfältigung
unter Verwendung von auf ligierten Linkern basierenden spezifischen
Primern und selektiven internen Primern unter Erzeugung von Teilsätzen von
vervielfältigten
Fragmenten, die mittels Gelelektroforese oder anderen herkömmlichen
Techniken kartiert werden können.
Da dieses Verfahren auf haploiden Genom-Äquivalenten basiert, die durch
Polymerase unter Anwendung von auf Linkern basierendem Initiieren
vervielfältigt
wurden, haben wir dieses Verfahren als HAPPIER-Mapping bezeichnet.
-
In
einem ersten Aspekt liefert die vorliegende Erfindung daher ein
Verfahren für
die Nukleinsäureanalyse,
welches folgendes umfaßt:
- a) Bereitstellen eines HAPPY-Kartierungselements,
das eine Vielzahl von Nukleinsäureproben umfaßt, die
von einer zu kartierenden Nukleinsäure abgeleitet sind, wobei
jedes Teil des Elements eine Probe von DNA-Fragmenten enthält, die
eine Menge repräsentieren,
die hinsichtlich der Masse 0,05- bis 2 Kopien der zu kartierenden
Nukleinsäure
entspricht,
- b) Spalten der Nukleinsäure
in den Proben bis zur Vollständigkeit
an einer definierten Sequenz darin unter Erzeugung von Nukleinsäurefragmenten,
- c) Ligieren eines Linkers an jedes Ende der Nukleinsäurefragmente,
- d) umfassendes Vervielfältigen
der Nukleinsäure unter
Verwendung von linkerspezifischen Primern,
- e) Bereitstellen eines Repertoires von Sonden, in denen jede
Sonde eine erste Sequenz, die zu der Sequenz des Linkers und dem
Teil der Restriktionsstelle, der, falls vorhanden, an den Enden
der durch Restriktionsverdau erzeugten Termini liegt, komplementär oder identisch
ist, und eine benachbarte zweite Sequenz, die in jeder Sonde des Repertoires
verschieden ist, umfaßt,
und
- f) Hybridisieren einer oder mehrerer Sonden aus dem Repertoire
an die Proben und Registrieren des Vorhandenseins oder der Abwesenheit
von Sequenzen, die zu der einen oder den mehreren Sonden in der
Probe komplementär
sind.
-
Die
Erfindung kann als ein Verfahren mit einem Durchlauf ausgeführt werden,
oder sie kann iterative Stufen von aufeinanderfolgender Auswahl
von Zielfragmenten, die die gewünschten
Marker umfassen, beinhalten. In einer bevorzugten Ausführungsform
umfaßt
Stufe f) daher die Stufen, in denen man:
- i)
eine Vielzahl von spezifischen Nukleinsäurefragmenten aus jeder Probe
vervielfältigt,
- ii) die in i) vervielfältigten
Fragmente in Unterproben aufteilt,
- iii) eine oder mehrere Sonden mit einer höheren Spezifität als die
in i) verwendeten Sonden an die Unterprobe hybridisiert,
- iv) wahlweise die Stufen i) und ii) schrittweise wiederholt
und
- v) das Vorhandensein oder die Abwesenheit von Sequenzen, die
zu der einen oder den mehreren Sonden in der Probe komplementär sind,
registriert.
-
Vorzugsweise
wird die eine oder werden die mehreren Sonden in Stufe g) verwendet,
um spezifische Nukleinsäurefragmente
aus den Proben zu vervielfältigen,
was eine Detektion der vervielfältigten Nukleinsäuren anhand
konventioneller Mittel erlaubt, wie es beispielsweise unten beschrieben
ist.
-
Jede
Probe des Kartierungselements umfaßt ein haploides Genom-Äquivalent,
welches aus einzelnen haploiden Zellen oder durch Verdünnung einer
Menge von Nukleinsäure,
die von somatischen (diploiden) Zellen abgeleitet ist, abgeleitet
werden kann, wie es zuvor beschrieben wurde. Wie es hierin verwendet
wird, versteht sich ein "haploides
Genom-Äquivalent" als 0,05 bis 2 Massen-Äquivalente der zu kartierenden
Nukleinsäure;
im Idealfall beträgt es
etwa 0,69 Genom-Äquivalente.
Die Nukleinsäuren werden
in große
Fragmente gebrochen, in denen die Kopplung zum großen Teil
aufrechterhalten wird, um die Unterteilung in aliquote Teile in
Proben unter Bildung eines Kartierungselements zu gestatten. Das erste
Aufbrechen erfolgt normalerweise mittels Bestrahlung oder Scheren,
um die Zufälligkeit
sicherzustellen, und die Fragmente sind relativ groß (mehrere kb
bis Mb). Es ist daher der Vorgang des Aufbrechens, der die Feinheit
der Kartierung bestimmt (obgleich es nicht die Komplexität des Signals
ist, da der "haploide" aliquote Teil ungefähr die gleiche
Menge an DNA enthält,
ganz gleich wie groß das
Fragment ist).
-
Die
Proben des Kartierungselements werden dann unter Verwendung einer
Restriktionsendonuklease gespalten. Die Größe der erzeugten Fragmente
wird anhand der Häufigkeit
der Schnitte der Endonuklease bestimmt; je häufiger geschnitten wird, umso
größer ist
die Komplexität
des Signals, das aufgelöst
werden muß.
In vorteilhafter Weise wird eine Restriktionsendonuklease verwendet,
die an der Spaltungsstelle kohäsiv
Enden erzeugt, um die Ligation von Linkern zu vereinfachen.
-
Dieser
zweite Vorgang des Aufbrechens erfolgt in kleine Fragmente (typischerweise
kleiner als 2 kb) für
die Ligation und die Vervielfältigung.
Er stellt ein Werkzeug bereit, welches eine umfassende und selektive
Vervielfältigung
der DNA in der Probe ermöglicht.
Da die Marker bereits vor der zweiten Spaltung in Teile des Kartierungselements
segregiert wurden, beeinflußt
dies typischerweise nicht die Genauigkeit der resultierenden Karte.
-
Die
Nukleinsäure
ist in vorteilhafter Weise DNA.
-
In
vorteilhafter Weise ist der Linker zwischen 7 und 40 Nukleotide
lang, vorzugsweise ist er 15 bis 25 Nukleotide lang. Der Linker
selbst sowie eine oder mehrere benachbarte Basen in der Fragmentsequenz
selbst bilden die eindeutige Stelle, an die eine Sonde aus dem Repertoire
von Sonden in Abhängigkeit
von der ausgewählten
Sondenlänge
hybridisieren kann. Die Sequenz des Linkers kann irgendeine gewünschte Sequenz
sein. Um das Risiko, daß die Sequenz
in dem gerade kartierten Genom natürlich vorkommt, zu minimieren,
wird eine solche Sequenz in vorteilhafter Weise aus alternativen
Quellen ausgewählt,
wie z.B. unter Linkern, die von einer anderen Gattung abgeleitet
wurden, oder sie wird untersucht, um zu bestimmen, daß eine Hybridisierung nicht
auftritt.
-
Zusätzlich zu
der konstanten Sequenz, die dem Linker entspricht, umfaßt jede
Sonde eine oder mehrere Basen, die 3' dazu liegen. Es kann auf eine beliebige
Anzahl benachbarter Basen zurückgegriffen
werden. Für
den Fachmann versteht es sich, daß es notwendig ist, die Erfordernisse
an die Spezifität der
Hybridisierung gegen die Kostennachteile und die Nachteile bei der
Bearbeitung sehr langer Sonden auszugleichen. In vorteilhafter Weise
besteht die benachbarte zweite Sequenz in der Sonde aus zwischen
2 und 20 Basen, vorzugsweise besteht sie aus 2, 3, 4, 5, 6, 7, 8,
9 oder 10 Basen.
-
Die
Erfindung erlaubt die rasche Kartierung von monomorphen Markern,
die durch die Unterteilung des haploiden Genom-Äquivalents in Proben und durch
die Verwendung einer oder mehrerer spezifischer Sonden aus dem Repertoire
von Sonden zufällig
erzeugt werden. In jeder Probe werden nur spezifische Nukleinsäurefragmente
vervielfältigt,
welche Termini aufweisen, die komplementär oder identisch zu der verwendeten
spezifischen Sonde sind. Die Analyse der Cosegregation vervielfältigter
Fragmente in der Probenpopulation bestimmt die Markerkopplung und
somit die Karte des haploiden Genoms.
-
In
einer vorteilhaften Ausführungsform
wird die Verwendung einer oder mehrerer Sonden aus einem Repertoire
von Sonden durch die Verwendung einer für eine vollständige Sequenz
spezifischen Sonde ersetzt, um ein einziges Fragment aus jeder Probe
zu vervielfältigen.
Dies erlaubt die Registrierung von konventionellern STS- (sequenzmarkierte Stelle)
Markern.
-
In
einem weiteren Aspekt betrifft die Erfindung ein Verfahren zum Codieren
der Inhalte einer Mikrotiterplatte, so daß diese durch weitere Verfahren
und Manipulationen aufgespürt
werden können. Das
Verfahren der Erfindung erlaubt das Aufspüren der Inhalte von Mikrotiterplatten
selbst dann, wenn sie zu Proben in einer weiteren Platte übertragen oder
mit diesen kombiniert werden oder auf ein Gel geladen werden.
-
In
einer ersten Ausführungsform
dieses Aspekts der Erfindung wird ein Festphasenmarker, wie inerte
fluoreszente Mikrokügelchen
(z.B. Molecular Probes A3703), zu einigen Wells in der Platte zugegeben;
das Muster der so markierten Wells repräsentiert eine eindeutige "Signatur" der Platteninhalte. Beispielsweise
kann die Position der Marker eine Binärzahl codieren.
-
In
einer bevorzugten Ausführungsform
werden Mikrokügelchen
zu einer für
PCR bestimmten Mikrotiterplatte zugegeben; die Teilchen stören die
Reaktion nicht, und sie werden auf das Gel geladen, wenn die Proben
nachfolgend analysiert werden. Der "Code" der
Mikrotiterplatte wird auf das Gel übertragen – die Wells, die die fluoreszenten
Teilchen enthalten, leuchten auf, wenn das Gel unter UV-Licht fotografiert
wird. Die Teilchen wandern während
der Elektroforese nicht in das Gel. Dies überwindet ein allgemeines Problem
beim Aufspüren
von Proben bei der Elektroforese – nämlich daß es einfach ist, einen Strichcode
oder ähnliches
auf eine Mikrotiterplatte zu drucken, daß es jedoch schwierig ist,
die Codierung auf ein Gel zu übertragen.
In einer alternativen Ausführungsform
wird DNA in einige der unbenutzten Wells auf dem Gel geladen, um
eine Binärzahl
zu codieren. Dies erfordert jedoch, daß der Benutzer die Zahl auf
der Mikrotiterplatte liest und dann dafür sorgt, daß die gleiche Zahl auf dem
Gel codiert wird. Mit dem System gemäß der Erfindung kann der Roboter,
der die PCR vorbereitet, auch die fluoreszenten Teilchen zugeben,
und der "Code" wird beim Laden
auf das Gel übertragen,
ohne daß ein
weiteres Eingreifen erforderlich ist oder die Möglichkeit von Fehlern besteht.
-
Die
Erfindung ist darüber
hinaus auf weitere Ausführungsformen
anwendbar. Wenn beispielsweise Reaktionen vorbereitet werden, indem
ein Satz von Reagenzien von einer Platte (z.B. ein Satz von PCR-Matrizen)
und ein weiterer Satz von einer anderen Platte (z.B. ein Satz von
PCR-Primern) entnommen werden, kann jede Quellplatte codiert werden, indem
bestimmte Wells mit den Teilchen versehen werden. In geeigneter
Weise kann die Codierung die erste Reihe von Wells in einer Platte
und die letzte Reihe in der anderen Platte besetzen. Die Reaktionsplatte
(die die Inhalte der beiden Quellplatten enthält) trägt dann beide Sätze von
codierenden Markern; durch Abbilden der Platte unter UV-Bestrahlung
können
die Codes sichtbar gemacht und verifiziert werden. Alternativ sind
die Codes sichtbar, wenn die Proben mittels Gelelektroforese analysiert
werden.
-
Es
können
mehrere Farben verwendet werden, um komplexere Codes bereitzustellen
oder um zu erlauben, daß zwei
oder mehrere Codes in demselben Satz von Wells überlagert werden.
-
Ausführliche
Beschreibung der Erfindung
-
Obwohl
die hierin genannten allgemeinen Techniken im Stand der Technik
gut bekannt sind, kann insbesondere auf Sambrook of al., Molecular Cloning,
A Laboratory Manual (1989) und Ausubel et al., Short Protocols in
Molecular Biology (1999) 4. Aufl., John Wiley & Sons, Inc. (sowie die komplette Version
von Current Protocols in Molecular Biology) verwiesen werden.
-
1. Definitionen
-
Ein "Kartierungselement", wie es hierin verwendet
wird, ist ein Element aus Nukleinsäurefragmenten, die in einzelne
Proben oder Teile unterteilt wurden. Jedes Teil des Elements kann
aus einem Bruchteil (typischerweise 1/2 oder 1/3) der fragmentierten,
aus einer einzelnen haploiden Zelle isolierten DNA bestehen, wie
es in Dear & Cook
(1989) beschrieben ist. Allgemeiner gesprochen kann jedes Teil aus
einer Probe fragmentierter DNA, die aus zwei oder mehreren haploiden
Zellen oder aus einer oder mehreren diploiden Zellen hergestellt
wurde, bestehen und enthält
im Idealfall eine Menge an DNA, die von der Masse her 0,69 Genomen
entspricht (d.h. 0,69 Genom-Äquivalente).
Diese Menge stellt sicher, daß unter
der Annahme einer Poisson-Verteilung von aus einer Menge von DNA
entnommenen Sequenzen in jeder Probe ungefähr die Hälfte aller Marker vorliegt;
Mengen von DNA zwischen etwa 0,05 und 2 fallen jedoch in den akzeptablen
Bereich.
-
Das
in der Erfindung verwendete Kartierungselement kann irgendein Kartierungselement sein,
welches DNA-Fragmente enthält,
die aus genomischer DNA oder irgendeiner anderen Quelle, die kartiert
werden soll, abgeleitet wurden. In vorteilhafter Weise umfaßt es wenigstens
zwei Teile und vorteilhafter etwa 4, 8, 16, 32, 64, 96, 100, 110,
128, 256 oder mehr Teile. Die Verwendung von 96 Teilen ist geeignet.
Weitere Teile können
als Kontrollproben vorliegen.
-
"Spalten bei einer
definierten Sequenz" soll anzeigen,
daß das
Genom-Äquivalent
unter Erzeugung von Nukleinsäurefragmenten
einer sequenzspezifischen Spaltung, beispielsweise mittels Spaltungsenzymen,
wie Restriktionsendonukleasen, unterzogen wird. Die Spaltung führt dazu,
daß die
gespaltenen "Enden" der Nukleinsäure eine
definierte Sequenz haben. Die Verwendung von Typ III-Restriktionsenzymen,
die von der Erkennungsstelle entfernt spalten, oder von Typ I-Enzymen,
die zufällig
spalten, ist nicht vorgesehen. Die Spaltungsenzyme können jedoch
natürlich
oder künstlich
sein. Künstliche
Spaltungsenzyme können
beispielsweise geeignet modifizierte Ribozyme oder Zinkfinger-Polypeptide
sein (siehe beispielsweise die internationale Patentanmeldung WO
00/20622).
-
Spaltung "bis zur Vollständigkeit" gibt an, daß im wesentlichen
alle Stellen, die die spaltbare Sequenz aufweisen, gespalten werden.
Dies stellt sicher, daß Fragmente
mit der gleichen Sequenz über mehrere
Proben hinweg einheitlich dargestellt werden.
-
"Vervielfältigung" bezieht sich auf
irgendein Verfahren zum Vervielfachen von Nukleinsäuresträngen in
vitro. Vorzugsweise ist der Vorgang enzymatisch und kann linearen
oder exponentiellen Charakter haben. Eine beispielhafte Technik
ist PCR, die Nukleinsäuremoleküle exponentiell
vervielfältigt.
Alternative Vervielfältigungstechniken
umfassen Reverse Transkriptase-PCR, die verwendet wird, um RNA-Ziele
zu vervielfältigen
(Wang et al., (1989). Proc. Natl. Acad. Sci. USA 86(24), 9717–21). Bei
diesem Verfahren wird das Enzym Reverse Transkriptase verwendet,
um RNA in komplementäre
DNA (cDNA) umzuwandeln, welche dann unter Verwendung von PCR vervielfältigt werden
kann. Dieses Verfahren ist insbesondere nützlich, wenn Ribonukleinsäureproben,
wie die Genome von RNA-Viren, kartiert werden sollen.
-
Die
selbstunterhaltende Sequenzreplikation (3SR oder NASBA) umfaßt die isotherme
Vervielfältigung
einer Nukleinsäurematrize über aufeinanderfolgender
Durchläufe
der Aktivitäten
von Reverser Transkriptase (RT), Polymerase und Nuklease, die durch
einen Enzymcocktail und geeignete Oligonukleotidprimer vermittelt
werden (Guatelli et al., (1990), Proc. Natl. Acad. Sci. USA 87(5),
1874–8).
Enzymatischer Abbau der RNA aus dem RNA/DNA-Heteroduplex wird anstelle
von Hitzedenaturierung eingesetzt. RNase H und alle anderen Enzyme
werden zu der Reaktion zugegeben, und alle Stufen laufen bei derselben
Temperatur und ohne Zugabe weiterer Reagenzien ab. Nach diesem Verfahren
wurden in einer Stunde bei 42°C
Vervielfältigungen
von 106 bis 109 erzielt.
-
Die
Ligasekettenreaktion oder das Ligations-Vervielfältigungssystem verwendet DNA-Ligase und
vier Oligonukleotide, zwei pro Zielstrang (Wu, D.Y. & Wallace, R.B.
(1989) Genomics 4(4), 560–9). Die
Oligonukleotide hybridisieren an benachbarte Sequenzen der Ziel-DNA
und werden durch die Ligase verbunden. Die Reaktion wird hitzedenaturiert, und
der Zyklus wird wiederholt.
-
Die
Erfindung umfaßt
darüber
hinaus die Verwendung irgendeiner Vervielfältigungstechnik, die Fachleuten
auf dem Gebiet zur Verfügung
steht. Solche Techniken umfassen die Rolling-Circle-Vervielfältigung
(Lizardi et al., (1998) Nat. Genet. 19(3), 225–32) und die Strangverdrängungs-Vervielfältigung
(SDA; Walker et al., (1992). Proc. Natl. Acad. Sci. USA 89(1), 392–6).
-
Ein "Marker" ist eine Nukleinsäuresequenz, die
in Kopplungsstudien, und zwar beispielsweise anhand von PCR oder
Hybridisierungsanalyse, identifiziert werden kann. In vorteilhafter
Weise ist er in dem analysierten Genom im wesentlichen einzigartig,
so daß seine
Identifizierung eindeutig ist.
-
"Umfassende" Vervielfältigung
bezieht sich auf die Vervielfältigung
von Nukleinsäuren
unabhängig
von der Sequenz. Das Verfahren ist im Stand der Technik in anderen
Zusammenhängen
bekannt und kann als "Gesamt-Genom"-Vervielfältigung
oder "Gesamt-Genom-PCR" bezeichnet werden.
In vorteilhafter Weise wird in einer Population, die umfassend vervielfältigt wird,
unter Erzeugung einer vervielfältigten
Population, in der jeder Teil genau repräsentiert ist, jede Nukleinsäure in demselben Maße vervielfältigt. In
einigen Fällen
kann die Gesamt-Genom-PCR jedoch nicht zu einer Vervielfältigung
aller Sequenzen, sondern zu einer Vervielfältigung eines definierten Teilsatzes
davon führen.
-
Ein "Repertoire" von Sonden ist ein
Satz von Nukleinsäuremolekülen, die
sich hinsichtlich der Sequenz voneinander unterscheiden. Im Kontext
der vorliegenden Erfindung umfassen die Sonden eine konstante Nukleinsäuresequenz,
die komplementär oder
identisch zu dem Linker ist, und einen dazu benachbarten (3') variablen Bereich.
Der variable Bereich kann vollständig
oder teilweise randomisiert sein, oder er kann so ausgestaltet sein,
daß er
eine oder mehrere spezifische Sequenzen aufweist.
-
In
Abhängigkeit
davon, wo das Restriktionsenzym innerhalb seiner Erkennungsstelle
spaltet, bleiben eine oder mehrere Basen von der Stelle an allen
Fragmentenden zurück.
In diesem Fall beinhaltet der "konstante" Teil der Sonde im
allgemeinen nicht nur die Linkersequenz (oder deren Komplement),
sondern auch den Teil der Erkennungsstelle, der an dem relevanten
Strang der Fragmentenden zurückbleibt.
-
Das "Auflösen" der vervielfältigten
Fragmente bezieht sich auf deren Auflösung, beispielsweise auf Basis
der Länge,
so daß jedes
Fragment in jeder Probe individuell identifizierbar ist.
-
2. HAPPY-Mapping
-
Allgemeine
Techniken für
das HAPPY-Mapping sind im Stand der Technik gut bekannt und wurden
in der Literatur umfassend beschrieben. Die nachstehenden Offenbarungen,
die ausführliche
Beschreibungen des HAPPY-Mapping umfassen, sind durch Bezugnahme
vollständig
hierin aufgenommen: Konfortov et al., Genome Res. Nov. 2000, 10(11):1737–42), Williams
und Firtel, Genome Res. Nov. 2000, 10(11):1658–9, Piper et al., Genome Res. Dez.
1998, 8(12):1299–307,
Lynch et al., Genomics. 15. Aug. 1998, 52(1):17–26, Dear et al., Genomics,
1. März
1998, 48(2):232–41,
Walter et al. Nucleic Acids Res. 25. Sep. 1993, 21(19):4524–9, Dear
und Cook, Nucleic Acids Res. 11. Jan. 1993, 21(1):13–20, Dear und
Cook, Nucleic Acids Res. 12. Sep. 1989, 17(17):6795–807. Die
vorliegende Erfindung basiert auf HAPPY-Mapping mit einigen grundlegenden
Unterschieden.
-
Ein
erster Unterschied besteht darin, daß die Nukleinsäure im Anschluß an ein
Aufbrechen mittels Bestrahlung oder anderen physikalischen Mitteln
und eine Auftrennung in separate aliquote Teile durch sequenzspezifische
Spaltung fragmentiert wird. Techniken zur Auswahl und Verwendung
von Restriktionsendonukleasen, die bevorzugte Enzyme für die Verwendung
in der vorliegenden Erfindung sind, sind im Stand der Technik, beispielsweise
von Sambrook et al. (s.o.), bekannt.
-
Es
können
auch alternative Techniken für
die Nukleinsäurespaltung
verwendet werden, solange sequenzspezifische 5'- und 3'-Enden erzeugt werden. Diese Techniken
umfassen PCR mit Primern einer definierten Sequenz, wobei die zu
analysierende Nukleinsäure
unter Verwendung eines Primers oder mehrerer Primer in einer Vervielfältigungsreaktion vervielfältigt wird.
Der oder die Primer ist bzw. sind in der Lage, in im wesentlichen
sequenzspezifischer Weise an die zu analysierende Nukleinsäure zu hybridisieren
und ein Hybrid zu bilden, in welchem die Primerkette zu einer enzymatischen
Kettenreaktion in der Lage ist. In Abhängigkeit von der Anzahl von Stellen,
an die der Primer hybridisiert, wird eine Anzahl von Fragmenten
erzeugt, welche der genomischen Sequenz entsprechen. Da die Nukleinsäure normalerweise
doppelstrangig ist, sollte sie denaturiert werden, ehe Primer an
sie hybridisieren können.
-
Die
Erfindung umfaßt
vorzugsweise das Spalten an einer einzigen Sequenz. Die Spaltung
an mehreren Stellen, beispielsweise unter Verwendung mehr als eines
Restriktionsenzyms, ist jedoch möglich.
Wenn die Spaltung an mehreren Sequenzen erfolgt, können Linker
an einem oder beiden Sätzen von
nach der Spaltung verbleibenden "Enden" angefügt werden;
wenn nur eine Linkerspezifität
verwendet wird, werden nur Fragmente mit zwei Enden vervielfältigt, die
an derselben Sequenz, die zu dieser Linkersequenz komplementär ist, gespalten
wurden.
-
Darüber hinaus
verwendet die vorliegende Erfindung die Ligation von Linkern als
ein Mittel, um eine Vervielfältigung
spezifischer Fragmente zu ermöglichen.
Solche Verfahren sind Fachleuten auf dem Gebiet wiederum bekannt.
Der Linker (oder die Primer, wie sie hierin an anderer Stelle definiert
sind) besteht aus Einheiten, die entweder Nukleotide oder Nukleotidanaloge
sind. Allgemein ausgedrückt
ist ein Nukleotidanaloges eine Verbindung, die in eine Kette von
Nukleotidresten aufgenommen werden kann und die basenspezifisch
mit einer Base einer komplementären
Nukleinsäurekette
hybridisieren kann. In der vorliegenden Erfindung geeignete Analoge
sind darüber
hinaus Substrate für
Kettenverlängerungsenzyme.
-
Ein
Nukleotidanaloges kann ein modifiziertes Nukleotid sein, wobei die
Base beispielsweise so modifiziert ist, daß sie die Basenpaarungseigenschaften beeinflußt, und/oder
bei dem der Zucker- oder der Rückgratrest
modifiziert ist, wie beispielsweise in den Amid-verknüpften Rückgraten
von PNA, und/oder bei dem der Phosphatrest modifiziert ist.
-
Nukleinsäuren mit
modifiziertem Rückgrat beinhalten
Methylphosphonate, Phosphorthioate und Phosphordithioate, bei denen
beide nicht verbrückenden
Sauerstoffe durch Schwefel ersetzt sind, Phosphoramidite, Alkylphosphotriester
und Boranophosphate. Achirale Phosphatderivate umfassen 3'-O'-5-S-Phosphorthioat,
3'-S-5'-O-Phosphorthioat, 3'-CH2-5'-O-Phosphonat und
3'-NH-5'-O-Phosphoramidat. Peptidnukleinsäuren ersetzen
das gesamte Phosphodiester-Rückgrat
durch eine Peptidbindung.
-
Zuckermodifikationen
werden ebenfalls verwendet, um die Stabilität und die Affinität zu verbessern.
Das α-Anomer
von Desoxyribose kann verwendet werden, wobei die Base in Bezug
auf das natürli che β-Anomer invertiert
ist. Das 2'-OH des
Ribosezuckers kann unter Bildung von 2'-O-Methyl- oder 2'-O-Allylzuckern verändert werden, was eine Beständigkeit
gegen einen Abbau bereitstellt, ohne die Affinität zu beeinträchtigen.
-
Die
Modifikation der heterozyklischen Basen erhält vorzugsweise eine geeignete
Basenpaarung aufrecht. Einige geeignete Substitutionen umfassen Desoxyuridin
anstelle von Desoxythymidin, 5-Methyl-2'-desoxycytidin und
5-Brom-2'-desoxycytidin anstelle
von Desoxycytidin. Von 5-Propinyl-2'-desoxyuridin
und 5-Propinyl-2'-desoxycytidin
wurde gezeigt, daß sie
die Affinität
und die biologische Wirksamkeit verbessern, wenn sie gegen Desoxythymidin bzw.
Desoxycytidin ausgetauscht werden.
-
Die
Länge des
Linkers beträgt
vorzugsweise insgesamt 7–40
Reste. Für
gewöhnlich
wird ein kurzer Linker mit 15–25
Resten verwendet, doch sind auch Primer mit bis zu 30 oder bis zu
40 Resten oder mit 10 oder weniger Resten geeignet. Nach der Vervielfältigung
haben alle Amplimere an beiden Enden dieselbe Sequenz, wobei die
Länge dieser
Sequenz von dem Primer abhängig
ist. Nach dem Aufbrechen der genomischen DNA werden die Nukleinsäuren in aliquoten
Teilen in Proben aufgeteilt, mittels Restriktionsendonuklease-Verdau
gespalten, an die Linker ligiert und unter Verwendung eines linkerspezifischen Primers
vervielfältigt.
Da alle Nukleinsäurefragmente den
Linker an jedem Ende aufweisen, werden alle Fragmente vervielfältigt.
-
Das
Hybridisierungsverfahren gemäß der Erfindung
bringt in vorteilhafter Weise die Ligation nur an das 5'-Ende jedes Strangs
in den doppelstrangigen Restriktionsfragmenten mit sich. Innerhalb
des Schutzumfangs der Ansprüche
können
unter Verwendung von alternativen Ligationsmustern jedoch auch Varianten
der vorliegenden Erfindung ausgeführt werden, wobei Linker an
die 3'-Enden der
Nukleinsäurestränge oder
an eine Mischung aus sowohl 5'-
als auch 3'-Enden
angehängt
werden.
-
Nach
der Stufe der umfassenden Vervielfältigung wird ein Teilsatz der
Nukleinsäurefragmente
in jeder Probe unter Verwendung spezifischer Primer oder Sonden
vervielfältigt.
Unter diesen Bedingungen findet eine Kettenverlängerung nur dann statt, wenn
die Nukleotidreste am 3'-Ende
des Primers exakt zu denjenigen an der Nukleinsäureprobe passen. Die 5'-Enden müssen nicht
vollkommen hybridisiert sein, solange der Rest des Primers ausreichend
stark hybridisiert ist, um eine Dissoziation zu verhindern. In vorteilhafter
Weise sind die Primer zu 100% komplementär zu dem Linker/Probe-Nukleinsäureziel.
-
Die
Primer können
ein Basenanaloges aufweisen, welches die degenerierte Bindung fördert, indem
es die Fähigkeit
besitzt, Basenpaare mit zwei oder drei der natürlichen Basen oder allgemein
ohne Unterscheidung Basenpaare mit jeder der natürlichen Basen zu bilden. Solche
Analoge können
zusammen mit konventionellen Randomisierungstechniken bei der Herstellung
der Sonden verwendet werden. Es ist jedoch bevorzugt, daß die Sonden
sich bei ihrer Bindung hochgradig sequenzspezifisch verhalten und
nicht an degenerierte Sequenzen hybridisieren.
-
Nukleotide
oder Nukleotidanaloge, die während
der Stufe der Kettenverlängerung
hinzugefügt werden
sollen, können
zur Vereinfachung der Detektion markiert werden. Beispiele geeigneter
Markierungen umfassen Radioisotope, fluoreszierende Reste, Haptene
und Komponenten von chromogenen oder chemilumineszenten Enzymsystemen.
-
Zusätzlich oder
alternativ können
Primer mit definierter Sequenz unter Verwendung spezifischer Markierungen
markiert werden, was ihre einfache Identifizierung erlaubt. Beispiele
umfassen Markierungen unterschiedlicher Masse, die mittels Massenspektrometrie
getrennt werden können,
mo lekulare Strichcodes, die unter Verwendung geeigneter Detektionsinstrumente "ausgelesen" werden können, Kombinationen
von fluroeszenten Markierungen, die eine spezifische Signaturemission
erzeugen, und dergleichen.
-
Die
Art der Markierung bestimmt das beste Verfahren für die Detektion
der in jeder Probe vorliegenden Marker. Wenn die Fragmente nicht
markiert sind, oder wenn alle ähnlich
markiert sind, werden die vervielfältigten Fragmente in vorteilhafter
Weise mittels Gelelektroforese detektiert, wie es beim herkömmlichen
HAPPY-Mapping der Fall ist.
-
Die
Verwendung spezifischer Markierungen erlaubt jedoch auch eine andere
Auslese der Fragmente, wie z.B. mittels FACS oder Massenspektrometrie.
Siehe beispielsweise Griffin et al., (1997) Nature Biotechnology
15:1368. Wenn die Markierungen für
jeden Primer spezifisch gemacht werden, können einzelne aliquote Teile
der Probe hinsichtlich des Vorliegens spezifischer Fragmente ausgelesen
werden, ohne daß eine
Vervielfältigung
notwendig ist.
-
3. Nukleinsäurespaltung
-
Die
sequenzspezifische Spaltung von Nukleinsäuren kann anhand irgendeines
geeigneten Verfahrens, einschließlich Restriktionsendonuklease-Verdau,
wie oben beschrieben, durchgeführt werden.
Alternative Verfahren umfassen die sequenzspezifische Spaltung von
doppelt helikaler DNA mittels Dreifachhelixbildung (siehe H.E. Moser und
P.B. Dervan (1985) Science 238, 645–650), die Verwendung radioaktiver
Nukleotide (z.B. Karamychev et al., J. Nucl. Med. 2000, 41:1093–1101),
synthetische Restriktionsenzyme, wie sie in dem US-Patent Nr. 6,018,058
beschrieben sind, CAP- und Fosbasierende Moleküle (http://www.cryst.bbk.ac.uk/PPS2/projects/hastie/dsc.htm)
und die Verwendung von Zinkfinger-Polypeptiden, wie sie in der WO
00/20622 beschrieben sind.
-
4. Verwendungen
-
Die
verbesserten HAPPY-Mapping-Techniken der Erfindung können auf
ein beliebiges Kartierungsprojekt angewandt werden. Die Kartierung
von Genomen oder genomischer DNA, wie z.B. Chromo somen, hat sich
bereits als empfänglich
bzw. geeignet für
die Anwendung von HAPPY-Mapping-Techniken
erwiesen und ist geeignet für
die Anwendung der hierin beschriebenen verbesserten Verfahren. Weitere
Verwendungen der Erfindung werden für einen Fachmann auf dem Gebiet
auf Basis dieser Beschreibung offensichtlich.
-
Bevorzugte
Anwendungen für
die vorliegende oder auch irgendeine HAPPY-Mapping-Technik werden
unten ausgeführt.
-
A. Haplotypisierung
-
Wie
es oben beschrieben wurde, basiert das Verfahren des HAPPY-Mapping
auf dem zufälligen Aufbrechen
und der zufälligen
Probenentnahme von genomischer DNA unter Erzeugung eines Satzes (Elements)
von Proben, die (typischerweise) sub-genomische Mengen von DNA enthalten.
Es kann gefolgert werden, daß Sequenzen
(Marker), die oft zusammen in denselben Teilen des Elements gefunden werden
(d.h. die cosegregieren), im Vergleich zur mittleren Größe der Fragmente
in dem Genom nahe beieinander liegen können. Die Strahlungshybrid-Kartierung
hat einige Merkmale mit dem HAPPY-Mapping gemeinsam, jedoch wird
das Aufbrechen durch Bestrahlung lebender "Donor"-Zellen, gefolgt von einer Fusion mit
unbestrahlten "Wirts"-Zellen einer anderen
Spezies bewirkt; einige Donor-Chromosomenfragmente verbleiben in
den resultierenden Hybriden, welche dann auf ihren Gehalt an Donormarkern
analysiert werden.
-
Im
normalen Gebrauch sind die durch irgendeines der Verfahren analysierten
Marker monomorph, oder, falls sie polymorph sind, der Polymorphismus
bleibt unberücksichtigt
(wobei beide Allele eines Markers als eines registriert werden).
Wenn die Allele eines polymorphen Markes jedoch unterschieden und
unabhängig
voneinander in dem Kartierungselement registriert werden, können Haplotypinformationen
(d.h. die Kopplungsphase zwischen den Allelen zweier oder mehrerer
Marker in dem diploiden Genom) bestimmt werden.
-
Die
Haplotypinformationen sind von beträchtlichem Interesse, insbesondere
im menschlichen Genom, wo die SNP-Haplotyp-Informationen für eine Anzahl
von Anwendungen, einschließlich der,
jedoch nicht beschränkt
auf die Verknüpfung
zwischen Polymorphismen (insbesondere Einzelnukleotid-Polymorphismen,
SNPs) und die Empfindlichkeit gegenüber Krankheiten oder Nebenwirkungen
von Arzneimitteln, die derzeit umfassend untersucht wird, die Verknüpfung von
SNP-Haplotypen mit "normalen" variablen Eigenschaften
innerhalb einer Population und die Verwendung von SNP-Haplotypen
zum Aufspüren
der Bewegung von humanen Populationen, von Wert sind.
-
HAPPY-Mapping
kann wie folgt auf die Bestimmung von Haplotypen angewandt werden.
Ein Kartierungselement wird in üblicher
Weise hergestellt, jedoch wird die Markerdetektion und -registrierung
so durchgeführt,
daß zwischen
den Allelen polymorpher Marker unterschieden werden kann (die beiden
Allele eines Markers werden hier durch Groß- und Kleinbuchstaben bezeichnet,
beispielsweise A, a), und die Ergebnisse für jedes Allel werden unabhängig voneinander
aufgezeichnet. Wenn zwei oder mehr polymorphe Marker so registriert
werden, kann jeweils die Nähe
zwischen den Allelen bestimmt werden. Wenn beispielsweise das elterliche
Genom die Haplotypen AB und ab aufweist und wenn der Marker A/a
ausreichend nahe bei dem Marker B/b liegt, ist eine Cosegregation
(und damit Kopplung) zwischen A & B
und zwischen a & b
zu beobachten, nicht aber zwischen A & b oder a & B. Somit können die elterlichen Haplotypen
bestimmt werden. Die Entfernung, über die Haplotypinformationen
erhalten werden können,
wird anhand der Größe der Fragmente
bestimmt, die bei der Herstellung des Kartierungselements verwendet
werden.
-
Es
existieren viele Verfahren für
die notwendige Registrierung und Unterscheidung zwischen Allelen
in Abhängigkeit
von der Art des Polymorphismus. Irgendeines dieser Verfahren kann
in diesem Kontext verwendet werden.
-
In
vielen Fällen
ist der Ort der Marker in dem Genom bereits bestimmt worden, und
es wird nur die Kopplungsphase benötigt. In diesen Fällen müssen weniger
Teile des Elements analysiert werden, als es erforderlich wäre, um die
Reihenfolge und die Anordnung der Marker im Vorfeld zu bestimmen.
Auch wenn es bereits Kartierungsinformationen gibt, wird die Auflösung des
Kartierungselements nahezu irrelevant. Somit kann das Element aus
DNA-Fragmenten hergestellt werden, die so groß wie möglich sind, um den Bereich, über den
hinweg Haplotypen bestimmt werden können, zu maximieren. In einem
extremen Fall kann die genomische DNA ungebrochen bleiben, wobei
vollständige
chromosomale DNA-Moleküle
(oder Chromosome) von den Teilen des Elements segregiert werden.
In diesem Fall können
die Ergebnisse nicht die Reihenfolge oder die Anordnung der Marker
entlang eines Chromosoms bestimmen, sondern sie liefern Haplotypdaten über chromosomale
Entfernungen. Im Idealfall sollten HAPPY-Elemente, die für die Verwendung
bei der Bestimmung von Haplotypen hergestellt wurden, ungefähr doppelt
so viel DNA enthalten wie diejenigen, die für die routinemäßige Kartierung
verwendet werden, da jedes Allel als ein unabhängiger Marker betrachtet wird.
Der akzeptable Bereich von DNA-Konzentrationen für standardmäßige HAPPY-Elemente ist jedoch breit genug, um
die Bestimmung der Haplotypen zu unterstützen.
-
Im
Prinzip kann dasselbe Verfahren verwendet werden, um Haplotypdaten
aus Strahlungshybridelementen zu erhalten, obwohl die relative Schwierigkeit
der Herstellung von RH-Elementen dies weniger attraktiv machen könnte, wenn
Haplotypen aus einer großen
Anzahl von Individuen notwendig sind.
-
B. Kartierung mit Chromosomen
-
Wie
es oben erwähnt
wurde, kann es vorteilhaft sein, Haplotypinformationen unter Verwendung von
ganzen Chromosomen anstelle einer gebrochenen Nukleinsäure zu kartieren
oder abzuleiten. Dar über
hinaus erlaubt die Verwendung größerer DNA-Fragmente,
daß das
HAPPY-Mapping, welches normalerweise bei mittlerer bis hoher Auflösung nützlich ist,
ausgeweitet werden kann, um Karten mit niedriger Auflösung bereitzustellen.
-
Beim
HAPPY-Mapping wird DNA herkömmlicherweise
zuerst in relativ reiner Form isoliert (in Lösung oder in einer schützenden
Gelmatrix), ehe sie durch mechanische oder andere Mittel aufgebrochen wird.
Die Zerbrechlichkeit langer DNA-Moleküle macht es jedoch schwierig,
Fragmente zu manipulieren, die mehr als einige Millionen Basenpaare
(Mb) lang sind. Daher kann die Kopplung zwischen Markern nur über Entfernungen
von bis zu einigen Mb leicht bestimmt werden.
-
Die
vorliegende Erfindung beschreibt mehrere Anwendungen, die auf der
Probennahme und Analyse (bei beschränkender Verdünnung) nicht
von "nackten" DNA-Fragmenten,
sondern von kompletten Chromosomen, Fragmenten von Chromsomen oder
Chromatin basieren. Die natürliche
Verpakkung von DNA in diesen Formen ermöglicht es, größere Fragmente
zu isolieren und zu manipulieren als bei der Handhabung nackter
DNA, einschließlich
kompletter Chromosomen.
-
DNA
wird in der Form entweder von Chromatin oder von Metaphasenchromosomen
aus Zellen freigesetzt. In diesen beiden Formen wird die DNA durch
Verknüpfung
mit Histonen und anderen Proteinen stabilisiert und kompaktiert
bzw. verdichtet (und kann optional durch weitere Behandlungen weiter stabilisiert
werden, wie die Techniken der teilweisen Fixierung, die verwendet
werden, wenn Metaphasenchromosomen für die in situ-Hybridisierung
oder die Durchflußsortierung
(Flow Sorting) hergestellt werden). Dann wird das mechanische Aufbrechen
verwendet, um das Chromatin/die Chromosomen in Fragmente aufzubrechen,
wobei eine Lösung
davon verdünnt
und in ein Element mit Proben gegeben wird, die jeweils ungefähr 0,05–2 Genom-Äquivalente
DNA enthalten (jedoch vorzugsweise ähnliche Mengen von DNA in jedem
Teil des Elements); Bereiche zwischen etwa 0,2 und etwa 1,5 werden
im allgemeinen als nützlich
angesehen. Die Verwendung von mehr als 2 Kopien ist nachteilig,
doch gibt es keine starre untere Grenze für die Anzahl an Kopien, die verwendet
werden können.
Das Prinzip der Erfindung kann mit beliebigen geringen Mengen an
DNA pro aliquotem Teil verwendet werden, vorausgesetzt, daß ausreichend
Teile in dem Element analysiert werden, um sicherzustellen, daß jede Markersequenz
in wenigstens einem (und vorzugsweise mehr als einem) Teil vorliegt.
Die Proben werden dann in der Weise analysiert, wie es bereits zur
Analyse von HAPPY-Mapping-Elementen beschrieben wurde; eine Vorbehandlung
mit Proteinase-K oder andere Verfahren können in einigen Fällen erforderlich
sein, um sicherzustellen, daß die
DNA für
eine PCR-Vervielfältigung
zugänglich
wird.
-
Da
intakte Metaphasenchromosome routinemäßig in Lösung hergestellt und bearbeitet
werden, ist es klar, daß die
Fragmente, die in die Teile des Elements segregiert werden, irgendeine
Größe, bis
zu und einschließlich
kompletter Chromosomen, haben können.
(Es sei angemerkt, daß,
sobald die Segregierung in Proben abgeschlossen ist, eine weitere Fragmentierung
der DNA keine Konse quenzen hat, solange ihr Markergehalt erhalten
bleibt.) Die Abstände, über die
eine Kopplung mittels HAPPY-Mapping am besten detektiert werden
kann, betragen typischerweise das bis zu 0,5- bis 0,7-fache der
mittleren Länge
der verwendeten DNA-Fragmente. Somit kann ein aus grob aufgebrochenen
Chromosomenfragmenten hergestelltes Element verwendet werden, um
Karten mit spärlicher
Population herzustellen, in denen der mittlere Abstand zwischen
den Markern mehrere Mb oder mehr beträgt. Dies ist in denjenigen
Genomen nützlich,
deren Größe es impraktikabel
oder unwirtschaftlich macht, die Karten mit sehr dichten Populationen
herzustellen, die durch konventionelles HAPPY-Mapping erzeugt werden.
-
Fragmente
von Metaphasenchromosomen können
auch mittels Durchflußzytometrie
ausgelesen werden (tatsächlich
werden fragmentierte Chromosomen bei der Durchflußsortierung
von Chromosomen normalerweise als "Hintergrund" gesehen und entstehen durch den ungewollten
Abbau oder das Scheren der gewünschten
intakten Chromosome). Daher kann die Durchflußsortierung (anstelle von Verdünnung und
zufälliger
Probenentnahme) als Verfahren verwendet werden, um die erforderliche
Anzahl und die Größe von Fragmenten
in die Teile des Kartierungselements zu segregieren. Ein solcher
Ansatz hat die Vorteile, daß (a)
die Gesamtmenge an DNA in jedem Teil des Elements genau kontrolliert werden
kann und (b) der Größenbereich
der Fragmente eng ausgewählt
werden kann; eine solche knappe Auswahl erlaubt die Feineinstellung
des Bereichs und der Auflösung
des Elements, um das vorliegende Kartierungsproblem anzugehen, und
verbessert die Qualität
der Kartierungsdaten durch das Ausschließen von Fragmenten, die entweder
zu klein sind, um eine Kopplung zwischen irgendwelchen Markern widerzuspiegeln,
oder die so groß sind,
daß sie
keine nützlichen
Kartierungsinformationen enthalten.
-
Intakte
Metaphasenchromosome können
in die Teile des Kartierungselements segregiert werden, und zwar
entweder durch Beschränken
der Verdünnung
einer Lösung
solcher Chromosomen oder durch Durchflußsortieren. In diesem Fall
liefert das Element keine Informationen über die Reihenfolge und die
Anordnung von Markern innerhalb eines Chromosoms, sondern erlaubt
eine Colokalisierung von Markern in Gruppen mit ihren jeweiligen
Chromosomen. Dies ist insbesondere für die chromosomale Zuweisung
von Markern in denjenigen Spezies, in denen die Chromosome nicht
anhand von Durchflußzytometrie
unterschieden werden können,
von Bedeutung. Beispielsweise können
die Chromosome 9, 10, 11 und 12 des Menschen nicht mittels Durchflußzytometrie
unterschieden werden. Würde
mittels Durchflußsortierung
eines oder zweier Chromosome (zufällige Probenentnahme aus dem
Chr9-12-Cluster) in jedes Teil des Elements ein Kartierungselement
hergestellt, so würde
die Typisierung von Markern auf dem Element eine rasche Zuweisung
der Marker zu chromosomalen Kopplungsgruppen erlauben.
-
Alle
obigen Verfahren können
auch zur Bestimmung von Haplotypen eingesetzt werden (die Kopplungsphasen
zwischen polymorphen Loki). In solchen Fällen ist es notwendig, nur
die beiden Allele jedes Markers unabhängig voneinander zu registrieren
(unter Verwendung bekannter Techniken zur Unterscheidung zwischen
Allelen); danach kann jedes Allel als unabhängiger Marker behandelt werden, und
es ist (beispielsweise) eine Kopplung zwischen A & B und zwischen
a & b zu beobachten,
was die Haplotypen AB und ab erkennen läßt. Die Verwendung von Chromatin/Chromosom-Fragmenten oder intakten
Chromosomen bei der Herstellung der Kartierungselemente erlaubt
die Bestimmung von Haplotypen über
beträchtliche
(oder chromosomale) Abstände.
-
Die
Erfindung wird unten lediglich zu Zwecken der Veranschaulichung
in dem nachfolgenden Beispiel weiter beschrieben.
-
Beispiel
-
Erzeugung und Vorvervielfältigung
des Kartierungselements
-
Zellkerne
werden aus Blattzellen von Gerste (Hordeum vulgare, Art "Optic") isoliert und in
Agarosestränge
eingebettet (0,5% w/v Agarose mit niedrigem Schmelzpunkt, ~ 4000
Zellkerne pro Mikroliter). Die Stränge werden in Lyselösung (0,5
M EDTA, pH 9,0, 1% Laurylsarcosinnatriumsalz, 0,1 mg ml–1 Proteinase-K)
eingetaucht und bei 45°C
für 48
h unter leichtem Rühren,
dann in 0,5 M EDTA, pH 9,0 für
1 h bei 45°C,
dann in 0,05 M EDTA, pH 8,0 für
1 h auf Eis inkubiert und bis zum Gebrauch in 0,05 M EDTA, pH 8,0
bei 4°C
gelagert. Bei dieser Manipulation diffundiert die Lyselösung in
die Agarose, lysiert die Zellkerne und entfernt/zersetzt Proteine
und andere Kernmaterialien, die während der Waschstufen hinausdiffundieren,
was in der Agarose eingefangene, im wesentlichen reine DNA liefert.
Die Agarose dient dazu, die DNA vor unerwünschtem mechanischem Aufbrechen
zu schützen,
da es sehr wichtig ist, daß die
Häufigkeit
der Brüche
in der DNA kontrolliert wird.
-
Bruchstellen
werden durch Schmelzen eines kurzen Strangabschnitts in 5 ml magnesiumfreiem PCR-Puffer
[dieser wird gegenüber
Wasser bevorzugt verwendet, um das Risiko einer Denaturierung der
DNA zu reduzieren] bei 68°C
und mehrmaliges Umdrehen des Röhrchens,
um die DNA sowohl zu verteilen als auch in Fragmente von etwa 50–100 kb zu
scheren, eingefügt.
Die Lösung
wird abkühlen
gelassen und unter Verwendung von Pipettenspitzen mit großer Öffnung,
um ein weiteres mechanisches Scheren der DNA zu vermeiden, mit Wasser
auf eine Konzentration von ungefähr
0,1 haploiden Genom-Äquivalenten
pro Mikroliter verdünnt.
5 μl-Proben
dieser Lösung
werden in 88 Wells einer 96-Well-Mikrotiterplatte gegeben, und 5 μl Wasser werden
in jeden der verbleibenden 8 Wells gegeben. Die Proben werden jeweils
mit einem Tropfen (~ 30 μl)
leichtes Mineralöl
abgedeckt bzw. überlagert,
um ein Verdampfen zu verhindern.
-
Eine
Verdau-Grundmischung wird hergestellt und umfaßt pro 2 μl Volumen folgendes: 0,7 μl One-Phor-All-Puffer (Pharmacia;
ein Vielzweckpuffer, der für
eine Anzahl von Reaktionen geeignet ist), 4,2 Einheiten des Restriktionsenzyms
DpnII (New England Biolabs) und Wasser. 2 μl dieses Gemischs werden in
jeden Well der Mikrotiterplatte gegeben. Die Platte wird kurz zentrifugiert
(~ 500 g für
5 Sekunden), um sicherzustellen, daß alle wäßrigen Komponenten sich unterhalb
der Ölschicht in
jedem Well vereinigen. Die Mikrotiterplatte wird bei 37°C für zehn Minuten
inkubiert. Das Restriktionsenzym wird dann durch Erhitzen auf 65°C für 30 Minuten
inaktiviert. DpnII spaltet an der Erkennungssequenz GATC, und die
Bedingungen werden so ausgewählt,
daß die Spaltung
bis zur Vollendung fortgesetzt wird.
-
Eine
Ligations-Grundmischung wird hergestellt und umfaßt pro 6 μl Volumen
folgendes: 1,5 μl einer
100 μM Lösung des
Oligonukleotids LIB1, 1,5 μl einer
100 μM Lösung des
Oligonukleotids dd-Sau3A, 0,8 μl One-Phor-All-Puffer,
0,26 μl
1 M NaCl und Wasser. 6 μl
dieses Gemischs werden zu jedem Well der Mikrotiterplatte zugegeben,
die dann wie zuvor kurz zentrifugiert wird. Die Platte wird bei
85°C für 20 Minuten
inkubiert und dann um 1 °C
pro Minute auf eine Temperatur von 15°C abgekühlt. Die Oligonukleotide sind
die folgenden:
LIB1 5'-AGT
GGT ATT CCT GCT GTC AGG-3'
ddSau3A
5'-GAT CCC TGA CAG
C*-3'
wobei
C* ein Didesoxynukleotid anzeigt.
-
Eine
Ligase-Grundmischung wird hergestellt und umfaßt pro 2 μl Volumen folgendes: 1 μl T4-DNA-Ligase (5 Einheiten,
Boehringer Mannheim) und 1 μl
15 mM rATP (gepuffert in Tris-HCl bei einem pH-Wert von 7,4). 2 μl dieser
Lösung
werden zu jedem Well zugegeben, und die Platte wird erneut kurz zentrifugiert,
um die wäßrigen Komponenten
unterhalb der Öldeckschicht
zu vereinigen. Die Platte wird dann bei 16°C über Nacht (~ 16 Stunden) inkubiert.
-
Die
Oligonukleotide sind wie folgt angeordnet:
5' AGTGGTATTCCTGCTGTCAGGGATCXXXXXXXXXXXXXXXXGATCCCTGACAGC* 3'
3' *CGAGAGTCCCTAGYYYYYYYYYYYYYYYYCTAGGGACTGTCGTCCTTATGGTGA 5'
-
Kursiv
= LIB1, unterstrichen = ddSau3A, Normalschrift = Restriktionsfragment
(X, Y = irgendwelche Basen, Länge
typischerweise 100–500
bp). ANMERKUNG – Eine
Ligation tritt nur zwischen LIB1 und dem Restriktionsfragment auf
(angezeigt durch doppelte Unterstreichung) und NICHT zwischen ddSau3A
und dem Fragment (da die notwendigen Phosphatgruppen nicht vorhanden
sind). Aus demselben Grund kann es keine Ligation zwischen den Oligonukleotiden
ddSau3A und LIB1 alleine geben, was nachfolgende Vervielfältigungen
beeinträchtigen würde ("Linker-Dimer").
-
Eine
Gesamt-Genom-Vervielfältigungsmischung
wird hergestellt und umfaßt
pro 37 μl
Volumen folgendes: 5 μl
10 PCR-Puffer Nr. 1 (Boehringer Mannheim), 0,8 μl 25 mM dNTP-Lösung (d.h.
jeweils 25 mM dATP, dCTP, dGTP, dTTP), 1,4 μl Expand-Long-Polymerase (Boehringer
Mannheim) und Wasser. 37 μl
dieser Lösung
werden in jeden Well der Mikrotiterplatte gegeben. Dann wird eine
Vervielfältigung
aller Restriktionsfragmente [im Idealfall – bestimmte Fragmente können sich
auch nicht vervielfältigen,
weil sie beispielsweise zu groß sind
und in einem Sequenzbereich mit weit voneinander entfernt liegenden
Erkennungsstellen für
DpnII liegen] durch Thermozyklen wie folgt erhalten:
- 1) 68°C × 4 Min.
(Während
dieser Stufe wird das Oligonukleotid ddSau3A denaturiert, und die
Verlängerung
des 3'-Endes jedes
Strangs jedes Restriktionsfragments findet statt, wobei ein Bereich synthetisiert
wird, der komplementär
zu dem ligierten LIB1-Oligonukleotid ist. Nach dieser Stufe tragen
daher alle Restriktionsfragmente die LIB1-Sequenz und ihr Komplement
an jedem Ende.)
- 2) 14 Zyklen von: 94°C × 40 Sek.,
57°C × 30 Sek., 68°C × 75 Sek.
- 3) 34 Zyklen wie oben, jedoch bei 68°C für 105 Sek. statt 75 Sek.
- 4) 1 Zyklus wie oben, jedoch bei 68°C für 300 Sek. statt 75 Sek.
-
(Während der
Stufen 2, 3 und 4 findet eine exponentielle Vervielfältigung
der gekoppelten Restriktionsfragmente statt, initiiert durch den Überschuß des Oligonukleotids
LIB1.)
-
Die
Reaktionen werden dann der Reihe nach in Wasser auf 1:8000 verdünnt und
bei –20°C gelagert,
bis sie entweder für
die beliebige oder die spezifische Detektion von Markern (unten)
benötigt
werden.
-
Detektion spezifischer
Marker
-
Für die Detektion
spezifischer Marker (d.h. mit vorbestimmten Sequenzen unter Verwendung spezifischer
Primer) werden jeweils 5 μl
der verdünnten
Produkte von oben in einer Reaktion vervielfältigt, die folgendes (zusätzlich)
umfaßt:
1× "Gold" PCR-Puffer (Perkin
Elmer)
0,25 Einheiten "Gold" DNA-Polymerase
1,5
mM MgCl2
jeweils 1 μM spezifischer Vorwärts- und
Rückwärts-Oligonukleotide
(für Beispiele
siehe unten)
jeweils 200 μM
dATP, dCTP, dGTP, dTTP
Gesamtvolumen 10 μl
-
Die
Reaktionen werden in 96-Well-Mikrotiterplatten vorbereitet und entweder
mit Mineralöl
abgedeckt (± 30 μl pro Well)
oder unter Verwendung eines geeigneten Versiegelungsfilms versiegelt.
Thermozyklen werden wie folgt durchgeführt:
93°C × 5 Min.
38
Zyklen von: 94°C × 20 Sek.,
55°C × 30 Sek.,
72°C × 60 Sek.
-
(Die
Annealingtemperatur, im obigen Beispiel 55°C, kann gemäß den Schmelztemperaturen der
Oligonukleotidprimer angepaßt
werden.)
-
Die
Produkte werden mit einem geeigneten Ladepuffer ergänzt (8 μl 15% w/v
Ficoll 400, 0,15 mg/ml Bromphenol-Blau, 4 × SyBr-Grün in 1 × TBE-Puffer), und 10 μl-Proben
des Gemischs werden mittels Elektroforese analysiert (6% Polyacrylamidgel in
0,5 × TBE-Puffer).
-
Beispielsweise
wurde das obige Verfahren sukzessive für drei spezifische Sequenzen
("Marker") durchgeführt, deren
Position innerhalb des Gerste-Genoms bereits bekannt ist (und die
daher als ein Test für
das System dienen könnten).
Die spezifischen Primersequenzen sind die folgenden:
14-4:
Vorwärts = GTCACTTGTCATCATTTGTCC
Rückwärts = GCACCATGAATACAATCATCC
14-5:
Vorwärts = CAACGATGAGATGGTAACCG
Rückwärts = CTCGCAGTCTGTTCGTTGG
1-16B:
Vorwärts = CTGTGCAAACAACATGACC
Rückwärts = CTGTTTGACCAGTTGTTTGC
-
Jedes
Primerpaar vervielfältigt
ein kurzes (einige Hundert Basenpaare langes) Segment einer bekannten
DNA-Sequenz; von den Segmenten ist in jedem Fall bekannt, daß sie keine
Restriktionsstelle für
DpnII aufweisen. Es ist bekannt, daß die Marker 14-4 und 14-5
sehr nahe beieinander liegen (< 2
kb), wohingegen von 1-16B bekannt ist, daß es um einen großen Abstand
(> 100 kb) von diesen
beiden entfernt liegt.
-
Die
Analyse der Ergebnisse zeigt, daß es zwischen 14-4 und 14-5
zu einer starken Cosegregation kam, wobei die beiden Marker jeweils
in ± 60% der
88 Teile des Kartierungselements vorliegen (mit Ausnahme der 8 Negativkontrollen,
die keine Marker enthielten), und mit einer großen Ähnlichkeit bei der Verteilung
der beiden Marker in dem Element. Eine Lod-Registrierung von 14,2
zwischen diesen beiden Markern wird berechnet, was deutliche Hinweise
auf eine Kopplung liefert. Der Marker 1-16B liegt auch in ± 60% der
Teile des Kartierungselements vor, die nicht zur Negativkontrolle
gehören,
doch zeigt seine Verteilung keine offensichtliche Korrelation zu
derjenigen der anderen beiden Marker; die Lod-Registrierungen zwischen
1-16B und 14-4 und zwischen 1-16B und 14-5 betragen 0,4 bzw. 0,7,
welches Werte ohne Signifikanz sind.
-
Es
liegt auf der Hand, daß das
verdünnte Produkt
der durch Ligation vermittelten PCR ausreichend ist, um ungefähr 80.000
spezifische Marker auf diese Weise zu typisieren. Es ist jedoch
auch offensichtlich, daß dieses
Produkt für
eine weitere, nicht-selektive Vervielfältigung unter Verwendung des
LIB1-Primers empfänglich
ist, was im wesentlichen unbegrenzte Materialmengen liefert.
-
Detektion willkürlicher
Marker
-
Eine
Fraktion von 5 μl
wird aus jedem der verdünnten
Produkte der Vorvervielfältigung
entnommen und mit Reagenzien ergänzt,
was ein Gesamtreaktionsvolumen von 10 μl liefert, welches (zusätzlich zu
den verdünnten
Produkten) 0,25 Einheiten thermostabile DNA-Polymerase (Taq Gold,
Perkin Elmer), 1× PCR "Gold" Puffer (empfohlen
vom Lieferanten der Polymerase), 1,5 mM Magnesiumchlorid, 200 μM von jedem
dNTP und 1 μm
des Primers LIBSEL-A (5'-CCT
GCT GTC AGG GAT CGT CC-3')
enthält.
-
(Die
ersten 12 Basen sind identisch zu den zwölf 3'-Basen von LIB1; die nächsten vier
sind identisch zu der Erkennungssequenz von DpnII, welche alle Fragmente
gemeinsam haben; die letzten vier Basen sind selektiv und haben
Gegenstücke
nur in ~1/256 aller Fragment-Termini.) Das Gemisch wird mit Mineralöl abgedeckt,
um die Verdampfung zu beschränken,
und einem Thermozyklus unterzogen (93°C × 9 Min., dann 33 Zyklen bei
94°C × 20 Sek., 64°C × 30 Sek.
und 72°C × 60 Sek.).
Die Produkte jeder Reaktion werden mittels Gelelektroforese unter Verwendung
von Standardprotokollen analysiert, welche in der Lage sind, Fragmente
mit Größen von zwischen
100 und 500 Basen aufzulösen.
-
Jede
solche Reaktion (entsprechend jedem Teil des Kartierungselements)
liefert eine Anzahl von Produkten, wobei die Produkte in jedem Fall
ein Teilsatz derjenigen einigen zehn DpnII-Fragmente des Genoms
sind, die die geeigneten vier selektiven Nukleotide intern zur Restriktionsstelle
an jedem Ende tragen. Jede Reaktion wird nach dem Vorhandensein oder
der Abwesenheit jedes der auflösbaren
Fragmente registriert, und die Fragmente werden relativ zueinander
kartiert, indem beobachtet wird, wie oft sie in den 96 aliquoten
Teilen cosegregieren. Jedes Fragment kann daher als Marker betrachtet
werden, definiert durch eine Kombination aus seiner Größe (bestimmt
durch Elektroforese), dem Restriktionsenzym, das zu seiner Erzeugung
verwendet wird (DpnII) und dem selektiven Primer (LIBSEL-A), der
zu seiner Vervielfältigung
verwendet wird. Einige Marker können
nicht kartiert werden, weil entweder die Vervielfältigungen
(umfassend oder selektiv) aus irgendeinem von verschiedenen Gründen fehlschlagen
oder weil der Marker keine einzelne Kopiesequenz ist (was leicht
zu erkennen ist, wenn man die Anzahl an Positiven in den 96 aliquoten
Teilen betrachtet) oder weil er eine Größe hat, die der eines anderen
Markers zu ähnlich
ist, und er daher bei der Elektroforese nicht aufgelöst werden
kann. Die Mehrzahl der Marker kann jedoch im Verhältnis zu
den Proben detektiert und mittels einer tabellarischen Aufstellung
und Berechnung der Kopplungshäufigkeit
kartiert werden.