-
TECHNISCHES
GEBIET
-
Die
vorliegende Erfindung betrifft ein Verfahren zur Analyse von Expressionshäufigkeiten
von Genen. Insbesondere betrifft die vorliegende Erfindung ein Verfahren,
das die Analyse von Arten und Mengen von mRNA ermöglicht,
exprimiert von allen Genen, kodierend für Proteine in einer Zelle,
selbst mit einer geringen Menge einer Bioprobe, um die dynamische
Veränderung
der Genexpression zu beleuchten.
-
STAND DER
TECHNIK
-
Die
Gesamtzahl von Genen des Genoms, die für Proteine kodieren, soll für den Menschen
bei ungefähr
100.000 liegen. Bei der Hefe, von der die Gesamtgenomstruktur bereits
erhellt wurde, wird die Zahl von Genen, die Proteine kodieren, als
bei ungefähr
5.000 liegend geschätzt.
-
In
den letzten Jahren haben sich öffentliche
Gendatenbanken im wesentlichen in Europa, den Vereinigten Staaten
und Japan etabliert. Eine enorme Menge von Geninformationen wurde
in solchen Datenbanken überall
in der Welt registriert und weitere Information kommt ständig neu
in die Datenbanken hinein. Das human genome project wird z.Zt. in
einem weltweiten Umfang durchgeführt
und zielt auf die Erhellung der gesamten Gene des menschlichen Genoms
bis zum Jahr 2005 ab und die durch dieses Projekt erhaltene Geninformation
wird ebenfalls in den Datenbanken registriert. Durch Nachfragen bei
solchen Datenbanken über bestimmte
Gensequenzen kann man erfahren, ob irgendein Gen dieselbe Sequenz,
oder auch eine analoge Sequenz zu der Gensequenz hat, die bereits
registriert wurde oder nicht und falls diese registriert wurde,
Informationen erhalten, die die Sequenz betreffen, einschließlich Bezeichnung
und Funktion des Gens, verwandte Referenzen, usw. Eine solche Suche
wird als Homologiesuche bezeichnet. Es gibt mehrere Arten von Software
für die
Durchführung
einer Homologiesuche. Wenn jedoch eine große Anzahl von Proben durchsucht werden
muss wird jedoch in der Regel BLAST verwendet, bei dem die Suchzeit
kurz ist.
-
In
der Regel werden nicht alle Gene, die in einer Zelle enthalten sind,
notwendigerweise in mRNA transkribiert, um Proteine aus der mRNA
zu erzeugen und es wird geschätzt,
dass beim Menschen ungefähr 15.000
Gene in einer Zelle exprimiert werden. D.h., dass in einer Zelle
viele Arten genomischer Gene exprimiert werden und eine korrespondierende
Anzahl von Arten von Boten RNA (hiernach bezeichnet als "mRNA") wird erzeugt. Typ
und Menge der exprimierten Gene (hiernach auch als "genetische Expressionsfrequenzinformation" bezeichnet) kann
jedoch abhängig
von der Art und den Bedienungen der Zellen variieren. Wenn z.B.
eine Blutstammzelle zu einer Lymphocytenvorläuferzelle, zu einer Prä-B-Zelle,
B-Zelle und dann einer aktivierten B-Zelle differenziert, zeigt
jede Zelle vollständig
unterschiedliche Genexpressionen, obwohl es ebenfalls Gene gibt,
die unter ihnen gleichartig exprimiert werden.
-
Die
Messung einer solchen, wie oben beschriebenen, genetischen Expressionsfrequenzinformation wird
als genetische Expressionsprofilanalyse bezeichnet. Substanzen,
die für
zelluläre
Lebensaktivitäten
verantwortlich sind, sind im wesentlichen Proteine und es ist wichtig
als genetische Expressionsanalyse Arten und Mengen von Proteinen
zu analysieren, die aus mRNAs translatiert werden. In der gegenwärtigen Situation
ist es jedoch technisch schwierig Profile für die Gesamtproteine zu erhalten.
Andererseits ist die Messung von Gesamttypen von mRNA bereits möglich.
-
Das
zum ersten Mal als genetisches Expressionsprofil-Analyseverfahren berichtete Verfahren
ist das Body-Map-Verfahren
(Gene, 174, 151–158
(1996)). Die Grundzüge
des Body-Map-Verfahrens sind die folgenden. Eine Poly(T)-Sequenz
auf einem Vektor wird mit einem Poly(A)-Schwanz am 3'-Ende jeder mRNA
verklebt und eine cDNA wird durch Verwendung der Vektor-Poly(T)-Sequenz
als Primer synthetisiert. Weiterhin wird die cDNA mit einem Restriktionsenzym
MboI verdaut. Da eine MboI-Stelle ungefähr im Durchschnitt alle 300
Basenpaare einer cDNA existiert, wird die cDNA auf dem Vektor in
eine Länge
von 300 Basenpaaren im Durchschnitt geschnitten. Zu diesem Zeitpunkt
verbleibt ein cDNA-Fragment, das am nächsten zum Poly(A)-Schwanz
liegt, ligiert an den Vektor. Der Vektor mit diesem cDNA-Fragment
wird jeweils zyklisiert und in E. coli eingeführt, um eine cDNA-Bibliothek
herzustellen. Ungefähr
1.000 Klone werden willkürlich
von dieser Bibliothek gewählt
und die Nukleotidsequenz für
300 Basenpaare wird im Durchschnitt für jeden Klon bestimmt. Die
Klone werden in Gruppen von Klonen unterteilt, die jeweils dieselbe
Sequenz aufweisen und Typ und Auftretenshäufigkeit von jeder Sequenz
werden kalkuliert, um ein genetisches Expressionsprofil zu erhalten.
Eine Homologiesuche (BLAST-Suche) wird in einer Datenbank für jede cDNA-Sequenz
durchgeführt
und Klone, die Gene enthalten, die dieselbe Sequenz aufweisen wie
bekannte Gene, werden mit dem Namen der Gene gezeichnet. Wenn die
Sequenz nicht in der Datenbank registriert ist wird angenommen,
dass kein zu der Sequenz korrespondierendes Gen existiert.
-
Um
eine Homologiesuche durch die BLAST-Suche durchzuführen, werden
Informationen von mindestens 11 Basenpaaren benötigt. Die Arten von Sequenzen,
die aus 10 Nukleotiden bestehen, betragen ungefähr 1.000.000 und diese Zahl
liegt deutlich außerhalb
der Zahl von Genarten, deren Existenz beim Menschen vermutet wird,
d.h. 100.000. D.h., wenn es eine Information für 11 Basenpaare gibt, kann
ein Gen mit der Sequenz identifiziert werden und auf diese Weise
ist die genetische Expressionsprofilanalyse möglich. Wenn man also auf eine
Erhöhung
der Effizienz der genetischen Expressionsprofilanalyse durch das
Body-Map-Verfahren abzielt, die viel Sequenzieren erfordert, werden
cDNA-Fragmente von
ungefähr
300 Basenpaaren, wie verwendet im Body-Map, weiter in kurze Fragmente
von 11 Basenpaaren oder mehr (bezeichnet als "Tag")
hergestellt, wobei viele dieser Fragmente in einen Vektor ligiert
und inseriert werden, um eine Bibliothek von ligierten Tags zu erzeugen,
ungefähr
1.000 Klone werden willkürlich
wie beim Body-Map selektiert und DNA-Sequenzen der ligierten Tags
werden bestimmt und es wird angenommen, dass mehr genetische Expressionsinformation
mit derselben Arbeit erhalten werden kann, wie verglichen mit Body-Map.
Jedes Tag repräsentierte
eine Gensequenz und die Auftretungshäufigkeit des Tags zeigt die
Expressionsfrequenz des Gens. Da die Länge der DNA-Sequenz, die durch
einmaliges Sequenzieren bestimmt werden kann, in der Regel ungefähr 600 Basenpaare
beträgt,
können
DNA-Sequenzen von ungefähr
50 Tags höchstens
durch einmaliges Sequenzieren bestimmt werden. D.h., es wird möglich, die
genetische Expressionsprofilanalyse mit einer Effizienz durchzuführen, die
ungefähr
50mal höher
ist als die des Body-Map-Verfahrens.
-
Als
Verfahren für
eine genetische Expressionsprofilanalyse, basierend auf dem vorstehenden
Konzept, gibt es das Verfahren der seriellen Analyse der Genexpression
(SAGE, US-Patent Nr. 5,695,937 und 5,866,330, europäische Patentveröffentlichung Nr.
0761822 A). Bei SAGE wird cDNA unter Verwendung von Poly(T), dessen
3'-Ende mit Biotin
gebunden ist als Primer erzeugt, die cDNA wird mit einem Restriktionsenzym,
wie z.B. MboI (als "Ankerenzym" bezeichnet) wie
bei Body-Map verdaut, cDNA-Fragmente, die das 3'-Ende enthalten, an das Biotin gebunden
ist, werden auf Avidin-Kügelchen
adsorbiert, die Kügelchen
werden in zwei Anteile geteilt und zwei Arten von Linkern (A oder
B) werden jeweils an die cDNA-Fragmente (ungefähr 13 bp) ligiert, adsorbiert
an einer von zwei Anteilen der Kügelchen.
Jeder Linker enthält
eine Stelle für
ein Klasse-II-Restriktionsenzym, wie z.B. BsmFI (bezeichnet als "Tagging-Enzym"). Jedes cDNA-Fragment
wird von den Kügelchen
mit dem Tagging-Enzym exzisiert, das exzisierte Ende wird mit stumpfen
Enden versehen und die Tags, ligiert an den Linker A und den Linker
B, werden verbunden. Das Produkt der Bindung wird als "Ditag" bezeichnet. Der
Ditag wird durch PCR unter Verwendung von Primern amplifiziert,
die Linker A und Linker B erkennen. Eine große Anzahl amplifizierter Ditags
werden ligiert, in einen Vektor inseriert und sequenziert. Ungefähr 50 Tag-Sequenzen
können
durch einmaliges Sequenzieren erhalten werden. Durch Kalkulation,
basierend auf dieser Tag-Sequenzinformation, werden genetische Expressionsfrequenzen
bereitgestellt.
-
Weiterhin
gibt es als andere Verfahren zur Analyse von Expressionsfrequenzen
von Genen das Gen-Chip-Verfahren und das Gen-Microarray-Verfahren.
In beiden Verfahren werden Gen-Fragmente
verwendet, die in einer Reihe an eine geeignete Platte adheriert
sind (in der Regel Objektträgerglas)
und zwar mit extrem hoher Dichte (ca. 10 Fragmente/mm2 oder
mehr). Die Gen-Fragmente auf diesem Chip werden mit Fluoreszenz-markierten
mRNAs hybridisiert, um Art und Menge der mRNAs zu bestimmen.
-
Wie
oben beschrieben, wurden verschiedene Verfahren für die Analyse
von Expressionsfrequenzen von Genen entwickelt und gute Ergebnisse
können
erhalten werden. Z.Zt. ist das SAGE-Verfahren das effektivste für die Messung
der Expressionsfrequenzen der Gesamtgene aller eukaryontischen Organismen.
Wenn dieses Verfahren jedoch tatsächlich durchgeführt wird,
werden viele Probleme angetroffen und das SAGE-Verfahren kann in
den meisten Forschungseinrichtungen nicht reproduziert werden. D.h.,
dass die für
das SAGE-Verfahren
benötigten
Techniken kompliziert sind und nur durch spezielle ausgebildete
Personen durchgeführt
werden können.
Weiterhin wird ungefähr
1 μg mRNA
für die
Messung benötigt
und daher ist es im wesentlichen unmöglich die Messung mit einer
Probe durchzuführen,
die nur in geringer Menge erhalten werden kann, z.B. einem klinischen
Biopsiematerial oder Unterschiede in der genetischen Expression
in Mikrogewebereichen zu messen. Weiterhin führt das Verfahren theoretisch
zu deutlichen Messfehlern.
-
Bei
dem SAGE-Verfahren ist es besonders wichtig eine Sequenz des Tags
akkurat zu bestimmen. Das liegt daran, dass der Tag kurz ist (ungefähr 13 bp)
und wenn daher nur eins der Nukleotide falsch bestimmt wird, kann
eine unterschiedliche Sequenz bestimmt werden, obwohl es sich um
dieselbe Sequenz handelt oder eine unterschiedliche Sequenz kann
als dieselbe Sequenz bestimmt werden. Eine solche fehlerhafte Bestimmung
tritt bei dem SAGE-Verfahren jedoch mit einer gewissen Wahrscheinlichkeit
auf. Dies liegt daran, dass bei dem SAGE-Verfahren zwei Tags miteinander zur
Bildung eines Ditags verbunden werden und die Grenzlinie zwischen
den Tags nicht mehr bestimmbar ist. Das Tag ist ein kurzes Gen-Fragment,
exzisiert durch ein Restriktionsenzym, wie z.B. BsmFI und FokI.
Die Spaltungsstellen dieser Enzyme sind jedoch nicht immer stabil
und die Längen
der exzisierten Tags unterscheiden sich daher. Wenn daher die Tags
zur Bildung eines Ditags in dem Zustand verbunden werden, dass Tags
unterschiedlicher Längen
miteinander vermischt sind, führt
dies zu einer Nicht-Bestimmbarkeit, von welchem der Tag Nukleotide
an der Ligationsstelle der Tags tatsächlich abstammen. Im Ergebnis
wird es unmöglich
eine korrekte Sequenz des Tags zu erhalten. So leidet das SAGE-Verfahren
an einem theoretisch nicht vermeidbaren Nachteil. Weiterhin involviert
das SAGE-Verfahren einen Arbeitsschritt eines Sammelns von DNA unter
Verwendung von Avidin- und Biotin-Kügelchen.
Es ist jedoch tatsächlich
sehr schwierig, DNA unter Verwendung von Avidin- und Biotin-Kügelchen,
ohne Kontamination zu verursachen, durchzuführen und es ist extrem schwierig
korrekte Daten durch Durchführung
gemäß diesem
Protokoll zu erhalten. Weiterhin macht das SAGE-Verfahren eine große Menge
von mRNA nötig, um
diese Daten zu erhalten. Daher kann in einem Fall einer Probe, deren
Menge begrenzt ist, z.B. bei klinischen Proben, keine ausreichende
mRNA-Menge erhalten
und so das SAGE-Verfahren nicht durchgeführt werden.
-
Weiterhin
kann bei dem Gen-Chip-Verfahren und dem Gen-Microarray-Verfahren die Messung nur
für ein
Gen durchgeführt
werden, dessen Struktur bekannt ist, anders bei dem Body-Map-Verfahren oder dem
SAGE-Verfahren. Daher können
in der gegenwärtigen
Situation Expressionsfrequenzen von Gesamtgenen aller Organismen
nicht gemessen werden.
-
Z.Zt.
ist das SAGE-Verfahren das effektivste Mittel für die Messung der Expressionsfrequenzen
der Gesamtgene aller eukaryontischen Organismen. Wenn dieses Verfahren
jedoch tatsächlich
durchgeführt
wird, trifft es auf viele Probleme und das SAGE-Verfahren könnte in
den meisten Forschungseinrichtungen nicht reproduziert werden. Die
Nachteile des SAGE-Verfahrens sind die folgenden: (1) die für das Verfahren
benötigten
Techniken sind kompliziert und sie können nur durch speziell ausgebildete
Personen durchgeführt
werden; (2) es wird ungefähr
1 μg mRNA
für die
Messung benötigt
und daher ist es im wesentlichen unmöglich die Messung mit einer
Probe durchzuführen,
die nur in geringer Menge erhalten werden kann, z.B. einem klinischen Biopsiematerial
und es ist ähnlich
unmöglich
den Unterschied der genetischen Expression in Mikrogewebebereichen
zu messen; und (3) das Verfahren führt theoretisch zu deutlichen
Messfehlern, da ein Ditag gemessen wird.
-
OFFENBARUNG
DER ERFINDUNG
-
Die
vorliegende Erfindung wurde im Hinblick auf die vorstehende gegenwärtige Situation
bewirkt und es ist eine Aufgabe ein Verfahren bereitzustellen, das
durch gewöhnliche
Forscher einfach durchgeführt
werden kann und dass eine akkurate genetische Expressionsfrequenzanalyse
mit einer Mikromenge einer Probe ermöglicht.
-
Die
Erfinder der vorliegenden Erfindung haben genaue Forschungen durchgeführt, um
das vorstehende Objekt zu erreichen. Im Ergebnis haben sie festgestellt,
dass die Expressionsfrequenzen von Genen effizient mit hoher Präzision analysiert
werden können,
indem jede cDNA von jeder mRNA unter Verwendung eines Vektorprimers
mit einer Poly(T)-Sequenz
synthetisiert wird, Umwandlung jeder cDNA zu einem Tag auf dem Vektor,
Bildung eines Konkatemers durch Ligieren der erhaltenen Tags über eine
Sequenz, die eine Erkennung der Enden der Tags ermöglicht und
Analyse einer Nukleotidsequenz des Konkatemers und haben so das
Verfahren der vorliegenden Erfindung erreicht, bezeichnet als "MAGE" (Mikro-Analyse der
Genexpression)".
-
D.h.,
dass die vorliegende Erfindung das folgende bereitstellt.
- (1) Verfahren zum Analysieren der Expressionshäufigkeiten
von Genen, welches die folgenden Schritte umfasst:
(a) einen
Schritt zum Bilden eines Vektorprimers, an den jede cDNA ligiert
ist, durch das Anlagern des Vektorprimers an jede mRNA, die von
einer Zelle stammt, deren Expressionshäufigkeiten der Gene analysiert werden
sollen, und Synthetisieren der cDNA, wobei der Vektorprimer einen
linearen Plasmidvektor mit einer einzelsträngigen Poly(T)Sequenz an einem
3'-Ende, einer Erkennungssequenz
für ein
erstes Restriktionsenzym in einer inneren Position von der Poly(T)Sequenz
aus, einer Erkennungssequenz für
ein zweites Restriktionsenzym in der Nähe des anderen Endes, und einer
Erkennungssequenz für
ein Restriktionsenzym vom Typ IIS in einer inneren Position von
der Erkennungssequenz des zweiten Restriktionsenzyms umfasst,
(b)
einen Schritt des Verdaus des Vektorprimers, an den die cDNA ligiert
ist, mit dem zweiten Restriktionsenzym und einem dritten Restriktionsenzym,
das den Vektorprimer nicht verdaut, und ein verdautes Ende der gleichen
Form bildet, wie das verdaute Ende, das mit dem zweiten Restriktionsenzym
erhalten wurde, um eine stromaufwärts gelegene Region der cDNA
auszuschneiden und den Vektorprimer zu zyklisieren,
(c) einen
Schritt des Verdaus des zyklisierten Vektorprimers mit dem ersten
Restriktionsenzym und dem Typ IIS Restriktionsenzym, um die stromabwärts liegende
Region der cDNA auszuschneiden, so dass ein Tag, welcher aus einem
Teil der cDNA besteht, übrigbleibt,
und dem erneuten Zyklisieren des Vektorprimers,
(d) einen Schritt
zum Durchführen
der Polymerasekettenreaktion (PCT) unter Verwendung des Vektorprimers
als Schablone und von Oligonukleotiden mit Nukleotidsequenzen, die
den jeweiligen flankierenden Regionen beider Stellen des Tags entsprechen,
das in dem Vektorprimer enthalten ist, als Primer, um das Tag zu
amplifizieren,
(e) einen Schritt des Ligierens der Amplifikationsprodukte,
um ein Konkatemer der Tags zu bilden, und
(f) einen Schritt
des Bestimmens der Nukleotidsequenz des Konkatemers und des Untersuchens
der Arten und Häufigkeiten
der Tags, die in der Nukleotidsequenz auftreten.
- (2) Gemäß Verfahren
(1), wobei die Ligationsreaktion in Schritt (e) in Gegenwart eines
Adaptors mit einem Ende der gleichen Form wie ein Ende des Tags
durchgeführt
wird, um den Adaptor an jedem Ende des Konkatemers anzuordnen, und
das Konkatemer durch das Durchführen
einer PCR unter Verwendung von Oligonukleotiden amplifiziert wird,
die eine Sequenz haben, die der Sequenz des Adaptors entspricht,
als Primer.
- (3) Gemäß Verfahren
(1) oder (2), wobei nach Schritt (e) das Konkatemer in einen Klonierungsvektor
für die
Nukleotidsequenzierung kloniert wird und die Nukleotidsequenz des
Konkatemers bestimmt wird.
- (4) Gemäß einem
der Verfahren (1) bis (3), wobei die Erkennungssequenz des dritten
Restriktionsenzyms aus vier Nukleotiden bestehen.
- (5) Gemäß jedem
der Verfahren (1) bis (4), wobei der Vektorprimer eine Erkennungsstelle
für ein
viertes Restriktionsenzym hat, von dem der Verdauungspunkt in der
gleichen Position oder an einer inneren Position des Verdauungspunktes
der Erkennungssequenz des zweiten Restriktionsenzyms ist, welches
aus dem Vektorprimer durch den Verdau mit Typ IIS Restriktionsenzym
nicht ausgeschnitten wird;
der Primer für die stromabwärts gelegene
Seite des Tags aus den Primern, die in Schritt (d) verwendet werden,
eine Erkennungssequenz für
ein fünftes
Restriktionsenzym hat, das ein Ende der gleichen Form bildet wie
das Ende, das mit dem vierten Restriktionsenzym verdaut wurde; und
das
Konkatemer gebildet wird, nachdem die amplifizierten Primer mit
dem vierten Restriktionsenzym und dem fünften Restriktionsenzym verdaut
wurden.
- (6) Gemäß Verfahren
(5), wobei der Vektorprimer eine Nukleotidsequenz hat, die von der
Erkennungssequenz des fünften
Restriktionsenzyms durch ein Nukleotid in einer inneren Position
von der Erkennungsstelle des ersten Restriktionsenzyms verschieden
ist, und die Nukleotidsequenz, die durch ein Nukleotid verschieden
ist, in die Erkennungssequenz für
das fünfte
Restriktionsenzym mit Hilfe der PCR umgewandelt wird, indem die
Primer für
die stromabwärts
liegende Seite des Tags verwendet werden.
- (7) Gemäß Verfahren
(6), wobei die dritten, vierten und fünften Restriktionsenzyme miteinander
identisch sind.
- (8) Gemäß einer
der Verfahren (1) bis (7), wobei der Vektorprimer durch das Ligieren
eines linearen Plasmids gebildet wird, das durch das Verdauen eines
Plasmids mit einer Multiklonierungsstelle an zwei Stellen der Multiklonierungsstelle
erhalten wird sowie einer teilweise doppelsträngigen DNA mit einem Ende der gleichen
Form wie ein Ende des linearen Plasmids und einer einzelsträngigen Poly(T)Sequenz.
-
KURZE ERKLÄRUNG DER
ZEICHNUNGEN
-
1 zeigt
eine beispielhafte Struktur einer Plasmid-DNA für die Erzeugung eines Vektorprimers (MAGE/pUC19).
-
2 zeigt
eine beispielhafte Struktur eines Vektorprimers und ein Konstruktionsverfahren
hierfür.
-
3 zeigt
schematisch die Schritte (a) und (b) des Verfahrens der vorliegenden
Erfindung
-
4 zeigt
schematisch die Schritte (c) und (d) des Verfahrens der vorliegenden
Erfindung.
-
5 zeigt
schematisch den Schritt (e) des Verfahrens der vorliegenden Erfindung
und einen Insertionsschritt eines Amplifikationsprodukts, erhalten
in Schritt (e), in einen Klonierungsvektor zum Sequenzieren.
-
BESTE AUSFÜHRUNGSFORM
DER ERFINDUNG
-
Das
erfindungsgemäße Verfahren
umfasst die vorstehenden Schritte (a) bis (f). Hiernach wird jeder Schritt
erklärt
werden.
-
(1) SCHRITT (a)
-
Ein
dem ersten Schritt wurde ein Vektorprimer, umfassend einen linearen
Plasmidvektor mit einer einzelsträngigen Poly(T)-Sequenz an einem
3'-Ende, einer Erkennungssequenz
für ein
erstes Restriktionsenzym in einer inneren Position von der Poly(T)-Sequenz,
einer Erkennungssequenz für
ein zweites Restriktionsenzym nahe dem anderen Ende und einer Erkennungssequenz
für eine
Typ IIS-Restriktionsenzym in einer inneren Position von der Erkennungssequenz
für das
zweite Restriktionsenzym verwendet (ebenfalls bezeichnet als "der Vektorprimer
für reverse
Transkripition").
Das Typ IIS-Restriktionsenzym
bedeutet ein Restriktionsenzym, das eine spezielle Position spaltet,
entfernt von einer Sequenz, erkannt durch das Restriktionsenzym.
-
Eine
beispielhafte Struktur des Vektorprimers ist in 2D dargestellt.
Dieser Vektorprimer kann z.B. durch Ligation eines linearen Plasmids
hergestellt werden, erhalten durch Verdau eines Plasmids mit einer Multiklonierungsstelle
an zwei Stellen in der Multiklonierungsstelle und einer teilweise
doppelsträngigen
DNA mit einem Ende derselben Form wie ein Ende des linearen Plasmids
und einer einzelsträngigen
Poly(T)-Sequenz. Die Struktur von MAGE/pUCl9 ist in 1 als
Beispiel des Plasmid mit einer Multiklonierungsstelle dargestellt.
Dieser Primer umfasst pUC19, wobei es sich um einen bekannten Klonierungsvektor
handelt, als zugrundliegende Struktur und eine Sequenz, die verschiedene
Restriktionsenzym-Erkennungsstellen enthält (bezeichnet als "Z-Fragment", die Sequenz ist
in SEQ ID NO: 1 dargestellt) wird zwischen die EcoRI- und HindIII-Restriktionsenzymstellen
der Klonierungsstelle inseriert.
-
In
dem folgenden spezifischen Beispiel wird ein Beispiel erklärt, das
MAGE/pUC19 verwendet, hergestellt unter Verwendung eines Escherichia
coli Wirts, mit einem Dam-Methylierungssystem,
z.B. einem JM109-Stamm, usw. Dies ist jedoch für die vorliegende Erfindung
nicht essentiell. Weiterhin ist der als zugrundeliegende Struktur
verwendete Vektor nicht auf pUC19 begrenzt und verschiedene andere
Vektoren, wie z.B. pUC18, pBR322, pHSG299, pHSG298, pHSG399, pHSG398,
RSF1010, pMW119, pMW118, pMW219 und pMW218, können verwendet werden. Zusätzlich ist
der Wirt des Vektors nicht besonders begrenzt, so lange es sich
um einen handelt, für
den gewöhnliche
genetische Rekombinationsverfahren, wie z.B. Transformation und
Wiedergewinnung von Vektoren aus dem Wirt, verwendet werden können. In
der Regel wird jedoch Escherichia coli verwendet.
-
Ein
Beispiel unter Verwendung von MAGE/pUCl9 als Plasmid mit einer Multiklonierungsstelle
wird hiernach erklärt.
Die vorliegende Erfindung ist jedoch nicht auf dieses Beispiel begrenzt.
-
Zunächst wird
der MAGE/pUC19-Vektor (2A) mit den Restriktionsenzymen
BstXI und PstI verdaut und das exzisierte kleine Fragment wird entfernt
(2B). Dann wurde eine teilweise doppelsträngige DNA mit
einer einzelsträngigen
Poly(T)-Sequenz (Poly(T)-Adaptor, dargestellt in 2C)
an das BstXI-verdaute Ende ligiert. Dies stellt einen Vektorprimer
(oder einen Vektorprimer für
eine reverse Transkription) bereit, worin das einzelsträngige Poly(T)
von einem Ende des MAGE/pUC19-Vektors vorsteht (2D).
Bei diesem Vektorprimer ist das erste Restriktionsenzym PmeI, das zweite
Restriktionsenzym ist BglII und das Typ IIS-Restriktionsenzym ist BsgI.
-
Die
Erkennungssequenz für
das zweite Restriktionsenzym BglII enthält eine überlappende MboI-Erkennungssequenz
und, wenn daher das das BglII-Ende an das MboI-Ende ligiert wird,
kann mit MboI verdaut werden. Weiterhin ist der Vektorprimer in
diesem Beispiel so entworfen, dass er eine Nukleotidsequenz (ΔMboI gemäß 3E)
enthält,
die sich von der vierten Restriktionsenzym(MboI)-Erkennungssequenz
um ein Nukleotid in einer weiteren inneren Position von der ersten
Restriktionsenzym(PmeI)-Erkennungssequenz unterscheidet. Diese ΔMboI und
die erste Restriktionsenzym-Erkennungssequenz des Vektorprimers
sind von dem Poly(T)-Adaptor angeleitet.
-
Das
erste Restriktionsenzym und das zweite Restriktionsenzym sind nicht
besonders begrenzt, so lange sie den Vektorprimer an einer Position
verdauen. Weiterhin sind das Typ IIS-Restriktionsenzym und seine Erkennungssequenz
existierende Stellung nicht besonders begrenzt, so lange sie nicht
die vierte Restriktionsenzymstelle von dem Vektorprimer ausschneiden
und es verdaut den stromabwärts
gelegenen Bereich der cDNA, so dass ein Teil der cDNA auf dem Vektorprimer
verbleibt. Es kann sich insbesondere z.B. um BsmFI, usw. handeln,
zusätzlich
zu dem vorher erwähnten
BsgI.
-
Weiterhin
kann die Länge
der Poly(T)-Sequenz eine Länge
sein, die ein Verkleben mit der Poly(A)-Sequenz von mRNA ermöglich und
sie beträgt
in der Regel ungefähr
10 bis 50 Nukleotide.
-
Ein
solcher wie oben erwähnter
Vektorprimer und mRNA, abgeleitet von einer Zelle, für die Expressionsfrequenzen
von Genen analysiert werden sollen, werden verklebt. Wenn eine reverse
Transkriptionsreaktion in diesem Zustand durchgeführt wird,
dient Poly(T) als Primer und die cDNA-Synthese wird initiiert (3E).
Dann kann ein zweiter Strang unter Verwendung des synthetisierten
ersten Strangs der cDNA als Matrize synthetisiert werden, um eine
doppelsträngige
cDNA zu synthetisieren (3F). Während eine
große Anzahl
von Vektor cDNA-ligierten Primermolekülen (cDNA-MAGE/pUC19) aus einer
großen
Anzahl von mRNA-Molekülen
erzeugt werden können,
repräsentiert 3F ein
typisches Bespiel hierfür.
-
Die
mRNA wird aus einer Zelle extrahiert, für die Expressionsfrequenzen
von Genen analysiert werden sollen. Jede Zelle kann als Zelle verwendet
werden, für
die die Expressionsfrequenzen analysiert werden sollen, ohne besondere
Begrenzung, so lange es sich um eine Zelle handelt, worin das 3'-Ende der mRNA die Poly(A)-Struktur
aufweist und es kann sich um eine Gewebszelle eines Tiers oder einer
Pflanze, eine Mikroorganismuszelle, wie z.B. eine Hefezelle, handeln.
Weiterhin weist die mRNA eines Prokaryonten nicht die Poly(A)-Struktur
am 3'-Ende auf und
kann daher nicht wie sie ist mit dem Poly(T) des Vektorprimers verklebt
werden. Durch enzymatische Zugabe einer Poly(A)-Struktur zu der
mRNA kann das Verfahren der vorliegenden Erfindung jedoch in einer ähnlichen
Weise wie das für
die mRNA eines eukaryontischen Organismuses durchgeführt werden.
-
Arbeitsschritte,
wie die Herstellung von mRNA, cDNA-Synthese, Synthese von Oligonukleotid,
Reaktion mit einem Restriktionsenzym, Ligationsreaktion, Polymerasekettenreaktion
(PCR) und Transformation können
auf dieselbe Weise durchgeführt
werden, wie Verfahren zur Herstellung von mRNA, die für das gewöhnliche
cDNA-Klonieren verwendet werden (siehe z.B. Sambrook J., Fritsch,
E.F. und Maniatis, T., "Molecular
Cloning; A Laboratory Manual, Second Edition", Cold Spring Harbor Laboratory Press
(1989) etc.).
-
(2) SCHRITT (b)
-
Als
nächstes
wird der Vektorprimer, an den die cDNA ligiert ist, erhalten wie
oben beschrieben, mit dem zweiten Restriktionsenzym und einem dritten
Restriktionsenzym, das den Vektorprimer nicht verdaut und ein verdautes
Ende in derselben Form bildet, wie ein verdautes Ende, erhalten
mit dem zweiten Restriktionsenzym zum Ausschneiden eines stromaufwärts gelegenen
Bereiches der cDNA verdaut und der Vektorprimer wird zyklisiert.
Der zyklisierte Vektorprimer kann durch Einführung in einen geeigneten Wirt
vervielfältigt
werden, durch Kultivierung des erhalten Transformanten und Sammeln
eines Plasmids. Wie ähnlich
durchgeführt für zyklisierte
Vektorprimer, die in den folgenden Schritten verwendet werden, wird
ein Wirt verwendet, der nicht das Modifikationssystem enthält, wenn
die Restriktionsenzymstelle zur Spaltung des erhaltenen Vektorprimers
aufgrund einer Dam-Methylierung
nicht verdaut werden kann.
-
Als
drittes Restriktionsenzym wird ein Enzym, das vier Nukleotide erkennt,
bevorzugt. Wenn ein Enzym, das sechs Nukleotide erkennt, verwendet
wird, könnte
eine solche Restriktionsenzymstelle in der cDNA-Sequenz nicht existieren.
Weiterhin, wenn die auf dem Vektorprimer verbliebene cDNA-Sequenz lang ist, wird
das Tag, das durch die folgenden Verfahren erhalten wird, weiter
von der Poly(A)-Sequenz der mRNA entfernt sein. In einem solchen
Fall könnte
die Zielsequenz, da die Expressionsinformation von Genen in einer Datenbank
(EST: exprimiertes Sequenz-Tag) in der Regel für Teile des 3'-Endes von mRNA existiert,
nicht mehr gewonnen werden, wenn Tag-Sequenzen gesucht werden. Beispiele
für Restriktionsenzyme,
die für
die vorliegende Erfindung geeignet sind und die vier Nukleotide
erkennen, beinhalten MboI, TaiI, usw.
-
Hiernach
wird ein Beispiel unter Verwendung von MboI als drittes Restriktionsenzym
erklärt.
Zunächst wird
der cDNA-ligierte
Vektorprimer (cDNA-MAGE/pUC19) mit den Restriktionsenzymen BglII
und MboI (3G) verdaut. Da MAGE/pUC19 zu
diesem Zeitpunkt Dam-Methyliert ist, wird er nicht mit MboI verdaut und
nur die in der cDNA durch die reverse Transkription neu synthetisierte
MboI-Stelle wird verdaut. 3G zeigt
eine temporäres
Beispiel, worin die cDNA drei MboI-Stellen enthält. Im Hinblick auf die cDNA
verbleibt ein stromabwärts
gelegener Bereich von dem Poly(A)-Schwanz zu der ersten MboI-Stelle zum
stromaufwärts gelegenen
Bereich an den MAGE-pUC19-Vektorprimer ligiert und der andere Bereich,
d.h. der stromaufwärts gelegene
Bereich der cDNA wird exzisiert und durch den MboI-Verdau entfernt.
Im Hinblick auf MAGE/pUCl9 wird dies mit BglII an nur einer Stellung
verdaut. Die Endbereiche, verdaut mit MboI und BglII, sind in derselben Form
und sie können
durch eine Ligationsreaktion ligiert werden. Daher wird die cDNA-MAGE/pUC19 durch eine
Selbstligierungsreaktion über
diese Enden zyklisiert (3H).
-
(3) SCHRITT (c)
-
Der
in Schritt (b) zyklisierte Vektorprimer wird mit dem ersten Restriktionsenzym
und mit dem Typ IIS-Restriktionsenzym
verdaut, um den stromabwärts
gelegenen Bereich der cDNA auszuschneiden, so das ein Tag, bestehend
aus einem Teil der cDNA verbleibt und der Vektorprimer wird wieder
zyklisiert.
-
Spezifisch
wird zyklisierter cDNA-MAGE/pUC19 mit den Restriktionsenzymen BsgI
und PmeI verdaut (4I). Nach Verdau mit diesen
Restriktionsenzymen verbleiben nur ungefähr 13 Nukleotide, die von dem Poly(A)-Schwanz
des 3'-Endbereiches der
cDNA am weitesten entfernt gelegen sind, auf dem Vektorprimer. Diese
cDNA-Sequenz, bestehend aus ungefähr 13 Nukleotiden wird als
Tag bezeichnet (in 4J als "tag" dargestellt).
-
Da
der Strang des 5'-Endes
um 2 bp an dem mit BsgI verdauten Ende vorsteht, wird er durch T4 DNA-Polymerasebehandlung
als Beispiel mit stumpfen Enden versehen. Weiterhin wird ein anderes
Ende, verdaut mit PmeI mit stumpfen Enden versehen. Daher können diese
Enden ligiert werden (4J). Auf diese Weise wird, wenn
der Vektorprimer durch eine Selbstligierungsreaktion zyklisiert
ist, ein Vektorprimer mit einer Struktur erhalten, umfassend MAGE/pUC19,
woran ein kurzes Tag ligiert ist, worin der Teil der cDNA, wobei es
sich nicht um den Tag handelt, exzisiert ist (4J und K).
-
(4) SCHRITT (d)
-
Darauf
folgend wird eine PCR unter Verwendung des Vektorprimers, zyklisiert
in Schritt (c) als Matrize durchgeführt und von Oligonukleotiden
mit Nukleotidsequenzen, korrespondierend zu den jeweiligen flankierenden
Bereichen von beiden Seiten des Tags in dem Vektorprimer als Primer
zur Vervielfältigung
des Tags.
-
Spezifisch
wird die PCR unter Verwendung des Vektorprimers durchgeführt, enthaltend
den Tag als Matrize, und Primer, korrespondierend zu den Sequenzen
der Vektorsegmente auf beiden Seiten des Tags (z.B. diejenigen der
SEQ ID NOS: 2 und 3) (4K). Im Ergebnis wird ein DNA-Fragment,
enthaltend den Tag im Zentrum, vervielfältigt (in diesem Fall 110 bp,
einschließlich
der Sequenzen von Primern und Tag) (4L).
-
(5) SCHRITT (e)
-
Die
vorstehenden PCR-Amplifikationsprodukte werden ligiert um ein Konkatemer
der Tags zu bilden. Zu diesem Zeitpunkt, wenn eine Erkennungssequenz
für ein
fünftes
Restriktionsenzym, das ein Ende in derselben Form erzeugt, wie das
Ende, erhalten durch Verdau mit dem vierten Restriktionsenzym, in
den Primer für
den stromabwärts
gelegenen Bereich des Tags unter den Primern eingeführt wird,
die in dem Schritt (d) verwendet werden und der amplifizierte Primer
mit dem vierten Restriktionsenzym und dem fünften Restriktionsenzym verdaut
wird, kann ein Konkatemer effizient gebildet werden. Die Art des
fünften
Restriktionsenzyms ist nicht besonders begrenzt. Wenn jedoch dasselbe
Restriktionsenzym wie das vierte Restriktionsenzym verwendet wird,
wird das Verfahren vereinfacht. Weiterhin kann dasselbe Restriktionsenzym
wie das dritte Restriktionsenzym, als viertes Restriktionsenzym
verwendet werden. Weiterhin können
dritte, vierte und fünfte
Restriktionsenzyme jeweils dasselbe Enzym sein. Wenn jedoch dasselbe
Restriktionsenzym als fünftes
und viertes Restriktionsenzym verwendet wird, wird die Gesamtsequenz
der cDNA aus dem Vektorprimer im Schritt (b) ausgeschnitten. Um
dies daher zu verhindern ist es notwendig, eine Nukleotidsequenz
einzuführen,
die sich von der Erkennungssequenz für das fünfte Restriktionsenzym um ein
Nukleotid an einer Position in einer weiter innen gelegenen Position
von der ersten Restriktionsenzyms-Erkennungssequenz des Vektorprimers
unterscheidet und die PCR unter Verwendung eines Primers mit einer
Erkennungssequenz für
das fünfte
Restriktionsenzym für
die stromabwärts
gelegene Seite des Tags durchzuführen,
so dass die Nukleotidsequenz, die sich um ein Nukleotid unterscheidet,
durch die Erkennungssequenz für
das fünfte
Restriktionsenzym ersetzt wird. Wenn weiterhin dasselbe Enzym als
drittes Restriktionsenzym und viertes Restriktionsenzym verwendet wird,
muss die Erkennungsstelle des Vektorprimers für das vierte Restriktionsenzym
so durch Methylierung hergestellt werden, dass sie nicht verdaut
wird. In diesem Fall wird vor dem Verdau mit dem vierten Restriktionsenzym
der in Schritt (c) zyklisierte Vektorprimer, in den Wirt eingeführt, der
nicht ein Modifikationssystem für
eine Demodifikation enthält.
-
Wenn
die Ligationsreaktion der Tags in Gegenwart eines Adaptors durchgeführt wird,
der ein Ende derselben Form aufweist, wie ein Ende des Tags um den
Adaptor an jedem Ende des Konkatemers anzuordnen und PCR unter Verwendung
eines Oligonukleotids durchgeführt
wird mit einer Sequenz, korrespondierend zu einer Sequenz des Adaptors
als Primer, kann das Konkatemer vervielfältigt werden. Wenn der Adaptor
im Vergleich mit dem Tag in einer geringeren Menge verwendet wird
oder wenn ein Adaptor mit einem Ende verwendet wird, das sich in
der Form von der des Tags unterscheidet, kann der Adaptor an jedem
Ende eines Konkatemers angeordnet werden, bestehend aus einer großen Anzahl
von Tags. Auf diese Weise kann sogar eine geringe Menge eines Konkatemers
kloniert werden und im Ergebnis wird eine Analyse mit einer geringen Menge
einer Proben-mRNA möglich.
-
Das
molare Verhältnis
der Tags und des Adaptors beträgt
in der Regel Tag:Adaptor = 1:1 bis 1:0,01, vorzugsweise 1:0,2 bis
1:0,05. Wenn der Adaptor in diesem Bereich verwendet wird, kann
ein Konkatemer, bestehend aus ungefähr 2 bis 50 ligierten Tags,
erhalten werden.
-
Die
Insertion des erhaltenen Konkatemers in einen Klonierungsvektor
für eine
Nukleotidsequenzierung vereinfacht die Sequenzierungsarbeit.
-
Wenn
MAGE/pUC19 verwendet wird, wird ein kleines Fragment, enthaltend
ein Tag, durch Verdau des Amplifikationsprodukts des Schritts (d)
mit einem Restriktionsenzym MboI (5M) erhalten.
Das hier erhaltene Tag-Fragment liegt zwischen bekannten DNA-Sequenzen
vor, d.h. GATC und AAACG und kann daher definitiv erkannt werden,
welcher Bereich das Tag ist. Da MboI-Stellen an beiden Enden dieser
Tag-Sequenz exponiert sind, können
die Tags aneinander durch ein Ligationsreaktion zur Bildung eines
Konkatemers ligiert werden (5M).
-
(6) SCHRITT (f)
-
Wenn
die Nukleotidsequenz des wie oben beschrieben erhaltenen Konkatemers
bestimmt wird, da Tags von mehreren cDNA-Molekülen abstammend darin enthalten
sind, können
die Expressionsfrequenzen der Gene, von denen die cDNAs abstammen,
durch Untersuchung von Art und Frequenz der Tags, die in der Nukleotidsequenz
auftreten, analysiert werden. Die Art des Tags kann durch Suche
in einer Datenbank, enthaltend Informationen für Teilsequenzen von bekannten
mRNAs (EST) bestimmt werden.
-
Wenn
das Konkatemer der Tags amplifiziert wird, werden zwei oder mehr
Fragmente mit derselben Sequenz gebildet. Wenn jedoch eine Sequenz,
von der angenommen wird, dass sie dieselbe wie eine vorher Sequenzierte
ist, in der Sequenzanalyse nach dem Klonieren auftritt, kann sie
von der Analyse aufgeschlossen werden, um einen schlechten Einfluss
der PCR auf die genetische Expressionsfrequenzanalyse zu eliminieren.
-
Wenn
weiterhin dasselbe Enzym als viertes und fünftes Restriktionsenzym verwendet
wird, da die Richtung der Tags in den Konkatemer nicht fixiert ist,
werden nicht nur Sequenzen von einem Strang sondern auch von dem
Umkehrstrang in die Betrachtung der Sequenzanalyse mit einbezogen.
-
Wie
oben erklärt,
wird bei dem Verfahren der vorliegenden Erfindung nicht wie bei
dem SAGE-Verfahren ein Ditag produziert, sondern das Tag kann daran
gehindert werden, sich direkt mit anderen Tags zu verbinden, indem
jedes Tag zwischen bekannte DNA-Fragmente gesetzt wird. Im Ergebnis
wird das Problem, dass die Grenzlinie zwischen den Tags nicht mehr
definiert werden kann, gelöst.
Da weiterhin eine Probe durch Durchführung von mehreren PCRs hintereinander
vervielfältigt
werden kann, wird die Analyse selbst mit einer geringen Menge mRNA
möglich.
Weiterhin ermöglicht
die Verwendung eines Vektorprimers eine cDNA-Synthese in dem Zustand,
dass die cDNA an den Vektor fusioniert ist. Daher kann die Analyse
ohne die Verwendung von Avidin- und Biotin-Kügelchen
durchgeführt
werden.
-
BEISPIEL
-
Fünfunddreißig Mikrogramm
(35 μg)
mRNA wurden aus 1 g C57BL/6-Mäuselebern
unter Verwendung eines Fast-Track-2,0-Kits, erzeugt von Invitrogen, extrahiert.
-
Nachdem
die cDNA durch reverse Transkription unter Verwendung von 0,97 μg der erhaltenen
mRNA und MAGE/pUCl9 synthetisiert worden war, wurde die genetische
Expressionsfrequenzanalyse wie folgt durchgeführt.
-
Der
MAGE/pUCl9-Vektor (2A) wurde mit den Restriktionsenzymen
BstXI und PstI verdaut und das ausgeschnittene kleine Fragment wurde
entfernt (2B). Dann wurde eine teilverdaute
doppelsträngige DNA
mit einer einzelsträngigen
Poly(T)-Sequenz (Poly(T)-Adaptor wie dargestellt in 2C)
an das BstXI-verdaute Ende (2D) ligiert.
Bei diesem Vektorprimer war das erste Restriktionsenzym PmeI, das
zweite Restriktionsenzym war BglII und das Typ IIS-Restriktionsenzym
war BsgI (3E).
-
Nullkommazwei
Mikrogramm (0,2 μg)
des Vektorprimers und 0,97 μg
der mRNA, abgeleitet von Mäuseleber,
wurden verklebt und eine cDNA-Synthese wurde durchgeführt. Dann
wurde ein zweiter Strang unter Verwendung der synthetisierten ersten
cDNA als Matrize synthetisiert (3F). Eine
genetische Expressionsfrequenzanalyse wurde unter Verwendung der
erhaltenen cDNA in einer Menge von 1/40 der erhaltenen cDNA-Menge (korrespondierend
zu 0,025 μg
mRNA) als Material durchgeführt.
-
In
einem anderen Experiment konnte die genetische Expressionsfrequenzanalyse
erfolgreich unter Verwendung von 0,05 μg einer Mikromenge mRNA durchgeführt werden,
extrahiert aus 4,5 mg einer geringen Menge einer klinischen Probe
als experimentelles Material zur Synthese von cDNA durch reverse
Transkription und unter Befolgung derselben Verfahren wie unten
beschrieben.
-
Dann
wurde der Vektorprimer, an den die wie oben beschrieben erhaltene
cDNA ligiert war, mit BglII und MboI verdaut, wobei es sich um die
zweiten bzw. dritten Restriktionsenzyme handelte (3G).
Darauf folgend wurde das MboI-Ende und BglII-Ende von cDNA-MAGE/pUC19
durch eine Selbstligierungsreaktion zum Zyklisieren des Vektorprimers
(3H) ligiert.
-
Der
obige zyklisierte Vektorprimer wurde mit BsgI und PmeI verdaut und
die verdauten Enden wurden durch eine T4 DNA-Polymerasebehandlung mit stumpfen Enden
versehen. Dann wurde der Vektorprimer wieder zyklisiert (4I bis K).
Eine PCR wurde unter Verwendung dieses zyklisierten Vektorprimers
als Matrize und Oligonukleotiden mit Nukleotidsequenzen, korrespondierend
zu den respektiven flankierenden Bereichen beider Seiten des Tags
in dem Vektorprimer (SEQ ID NOS: 2 und 3) als Primer sowie einem
Enzym AmpliTaq-Gold (PE Biosystems) zur Vervielfältigung des Tags durchgeführt (4L).
Die obige PCR wurde durch Wiederholung eines Reaktionszyklus einer
Denaturierung (95°C,
0,3 Minuten), Verkleben und Verlängerungsreaktion
mit der Polymerase (72°C,
1,5 Minuten) über
65 Zyklen durchgeführt.
Im Ergebnis wurde ein DNA-Fragment
mit 110 bp, enthaltend den Tag im Zentrum, amplifiziert.
-
Das
obige PCR-Amplifikationsprodukt wurde mit MboI zum Ausschneiden
des Tags verdaut und eine Ligationsreaktion wurde durch Zugabe eines
Adaptors durchgeführt,
erhalten durch Verkleben von Oligonukleotiden mit den in SEQ ID
NOS: 4 und 5 dargestellten Nukleotidsequenzen, wobei das Verhältnis von
Tag:Adaptor 8:1 annehmen sollte, um ein Konkatemer der Tags (5M)
zu bilden. Dieses Konkatemer wurde durch PCR unter Verwendung eines
Primers amplifiziert, der die Nukleotidsequenz, wie dargestellt
in SEQ ID NOS: 6 aufwies. Für
die PCR wurde ein Reaktionszyklus der Denaturierung (95°C, 0,3 Minuten),
das Verkleben (40°C,
3 Minuten) und eine Verlängerungsreaktion
mit Polymerase (72°C,
1 Minute) über
5 Zyklen wiederholt und dann wurde ein Reaktionszyklus einer Denaturierung
(95°C, 0,3
Minuten), Verkleben und eine Verlängerungsreaktion (72°C, 1 Minute)
60 Zyklen wiederholt. Das Amplifikationsprodukt wurde mit dem Restriktionsenzym
NotI verdaut und in die NotI-Stelle des Klonierungsvektors pKF3
zum Sequenzieren inseriert und die Nukleotidsequenz wurde bestimmt.
-
Basierend
auf den erhaltenen Sequenzdaten (für 11.000 Tags) wurden die Tags
in Gruppen von Tags mit derselben Sequenz unterteilt und die Ordnung
der Gruppen gemäß der auftretenden
Frequenz wurde bestimmt. Die Tags lagen im Bereich von erster bis
zehnter im Hinblick auf die Frequenz von der höchsten an, wie dargestellt
in Tabelle 1. Diese Ergebnis zeigt, dass das Gen, das die höchste Expressionsfrequenz
im Mäuselebergewebe
zeigte, das urinäre
Protein I/II-Gen war. Folgend auf dieses Gen wurden das Albumingen,
das urinäre
Protein III-Gen und das Argininosuccinat-Synthasegen in der Reihenfolge
der Expressionsfrequenz von hoch zu niedrig eingeordnet. So zeigt
selbst mit einer geringen Menge an mRNA-Probe das Verfahren der vorliegenden
Erfindung eine hohe Wiedergewinnungseffizienz von cDNA durch Verwendung
eines Vektorprimers und ermöglicht
eine genetische Expressionsfrequenzanalyse mit hoher Präzision,
da die Zweideutigkeit von Tag-Sequenzen eliminiert werden kann.
-
-
GEWERBLICHE ANWENDBARKEIT
-
Gemäß der vorliegenden
Erfindung können
Expressionsfrequenzen von Genen in sicherer Weise mit guter Präzision und
einfach analysiert werden kann.
-
Das
Verfahren zur Analyse genetischer Expression der vorliegenden Erfindung
ist für
Forschungen im Hinblick auf die Wissenschaften des Lebens nützlich und
ist insbesondere für
die Entwicklung von Behandlungsverfahren oder die Diagnose von Krankheiten
durch Analyse des Unterschieds in der genetischen Expression zwischen
spezifischen Organen oder Zellen bei gesunden Subjekten und erkrankten
Subjekten nützlich.
Durch Analyse des Unterschieds der Expression von Genen, z.B. bei
der Leber von gesunden Subjekten und Subjekten mit Hepatitis durch
das Verfahren der vorliegenden Erfindung kann ein Gen entdeckt werden, dessen
Expression insbesondere bei Hepatitis erhöht oder erniedrigt ist. Durch
Untersuchung der Rolle eines solchen Gens in der Leber, können Arzneimittel
zur Inhibition oder Beschleunigung der Funktion des Gens zum Zweck
der Behandlung von Hepatitis entwickelt werden. Weiterhin können das
Gen selbst, ein Anti-Sinn-Oligonukleotid,
entworfen basierend auf der Genstruktur, ein Protein, erzeugt durch
Expression des Gens, usw. ebenfalls für die Behandlung von Hepatitis
verwendet werden.
-
Selbst
bei einer Erkrankung, deren Ausbruchmechanismus noch nicht erhellt
ist, kann weiterhin ein Behandlungsverfahren entwickelt werden,
indem das Verfahren der vorliegenden Erfindung verwendet wird. Selbst
bei einem Gen, dessen Expression in Krankheits-abhängiger Weise
verändert
wird, kann weiterhin durch das Verfahren der vorliegenden Erfindung
dies festgestellt werden und es wird möglich, nicht nur ein Behandlungsverfahren,
sondern auch ein Diagnoseverfahren einer Erkrankung zu entwickeln.
-
Weiterhin
ist nicht nur die Verwendung auf dem medizinischen Gebiet möglich, sondern
das Verfahren kann auch als Mittel zu Identifizierung nützlicher
Gene von allen eukaryontischen Organismen verwendet werden. Da z.B.
Hefestämme,
die für
das Brauen von Bier geeignet sind, durch Mutation gezüchtet werden,
kann eine Veränderung
der genetischen Expression zwischen einem Elternstamm und einem
mutierten Stamm durch das Verfahren der vorliegenden Erfindung analysiert
werden, so dass ein Gen, dessen Expression durch die Mutation verändert wurde,
identifiziert werden kann. Durch umfassende Manipulation von Genen,
die für das
Brauen von Bier vorteilhaft sind, und die wie oben beschrieben erhalten
werden, kann ein besserer Hefestamm für das Brauverfahren erzeugt
werden.
-
Weiterhin
können
durch Analyse von Aminosäure-produzierenden
Bakterien, wie z.B. Escherichia coli und Corynebacterium-Bakterien z.B. bessere
Aminosäure-produzierende
Bakterien erzeugt werden.
-
-
-
-
-