DE60013410T2

DE60013410T2 - Verfahren zur analyse der genexpressions-frequenz

Info

Publication number: DE60013410T2
Application number: DE60013410T
Authority: DE
Inventors: Takami Kawasaki-shi MAEKAWA; Akira Kawasaki-shi MITSUI; Masayo Kawasaki-shi DATE; Hisao Kawasaki-shi FUKUDA; Yoshiyuki Kawasaki-shi TAKAHARA
Original assignee: Ajinomoto Co Inc
Current assignee: Ajinomoto Co Inc
Priority date: 1999-02-17
Filing date: 2000-02-17
Publication date: 2005-09-15
Anticipated expiration: 2020-02-18
Also published as: DK1156107T3; EP1156107A4; US6806049B1; JP2000232888A; ATE275196T1; EP1156107A1; JP3924976B2; WO2000049143A1; DE60013410D1; EP1156107B1

Description

TECHNISCHES GEBIET
Die vorliegende Erfindung betrifft ein Verfahren zur Analyse von Expressionshäufigkeiten von Genen. Insbesondere betrifft die vorliegende Erfindung ein Verfahren, das die Analyse von Arten und Mengen von mRNA ermöglicht, exprimiert von allen Genen, kodierend für Proteine in einer Zelle, selbst mit einer geringen Menge einer Bioprobe, um die dynamische Veränderung der Genexpression zu beleuchten.
STAND DER TECHNIK
Die Gesamtzahl von Genen des Genoms, die für Proteine kodieren, soll für den Menschen bei ungefähr 100.000 liegen. Bei der Hefe, von der die Gesamtgenomstruktur bereits erhellt wurde, wird die Zahl von Genen, die Proteine kodieren, als bei ungefähr 5.000 liegend geschätzt.
In den letzten Jahren haben sich öffentliche Gendatenbanken im wesentlichen in Europa, den Vereinigten Staaten und Japan etabliert. Eine enorme Menge von Geninformationen wurde in solchen Datenbanken überall in der Welt registriert und weitere Information kommt ständig neu in die Datenbanken hinein. Das human genome project wird z.Zt. in einem weltweiten Umfang durchgeführt und zielt auf die Erhellung der gesamten Gene des menschlichen Genoms bis zum Jahr 2005 ab und die durch dieses Projekt erhaltene Geninformation wird ebenfalls in den Datenbanken registriert. Durch Nachfragen bei solchen Datenbanken über bestimmte Gensequenzen kann man erfahren, ob irgendein Gen dieselbe Sequenz, oder auch eine analoge Sequenz zu der Gensequenz hat, die bereits registriert wurde oder nicht und falls diese registriert wurde, Informationen erhalten, die die Sequenz betreffen, einschließlich Bezeichnung und Funktion des Gens, verwandte Referenzen, usw. Eine solche Suche wird als Homologiesuche bezeichnet. Es gibt mehrere Arten von Software für die Durchführung einer Homologiesuche. Wenn jedoch eine große Anzahl von Proben durchsucht werden muss wird jedoch in der Regel BLAST verwendet, bei dem die Suchzeit kurz ist.
In der Regel werden nicht alle Gene, die in einer Zelle enthalten sind, notwendigerweise in mRNA transkribiert, um Proteine aus der mRNA zu erzeugen und es wird geschätzt, dass beim Menschen ungefähr 15.000 Gene in einer Zelle exprimiert werden. D.h., dass in einer Zelle viele Arten genomischer Gene exprimiert werden und eine korrespondierende Anzahl von Arten von Boten RNA (hiernach bezeichnet als "mRNA") wird erzeugt. Typ und Menge der exprimierten Gene (hiernach auch als "genetische Expressionsfrequenzinformation" bezeichnet) kann jedoch abhängig von der Art und den Bedienungen der Zellen variieren. Wenn z.B. eine Blutstammzelle zu einer Lymphocytenvorläuferzelle, zu einer Prä-B-Zelle, B-Zelle und dann einer aktivierten B-Zelle differenziert, zeigt jede Zelle vollständig unterschiedliche Genexpressionen, obwohl es ebenfalls Gene gibt, die unter ihnen gleichartig exprimiert werden.
Die Messung einer solchen, wie oben beschriebenen, genetischen Expressionsfrequenzinformation wird als genetische Expressionsprofilanalyse bezeichnet. Substanzen, die für zelluläre Lebensaktivitäten verantwortlich sind, sind im wesentlichen Proteine und es ist wichtig als genetische Expressionsanalyse Arten und Mengen von Proteinen zu analysieren, die aus mRNAs translatiert werden. In der gegenwärtigen Situation ist es jedoch technisch schwierig Profile für die Gesamtproteine zu erhalten. Andererseits ist die Messung von Gesamttypen von mRNA bereits möglich.
Das zum ersten Mal als genetisches Expressionsprofil-Analyseverfahren berichtete Verfahren ist das Body-Map-Verfahren (Gene, 174, 151–158 (1996)). Die Grundzüge des Body-Map-Verfahrens sind die folgenden. Eine Poly(T)-Sequenz auf einem Vektor wird mit einem Poly(A)-Schwanz am 3'-Ende jeder mRNA verklebt und eine cDNA wird durch Verwendung der Vektor-Poly(T)-Sequenz als Primer synthetisiert. Weiterhin wird die cDNA mit einem Restriktionsenzym MboI verdaut. Da eine MboI-Stelle ungefähr im Durchschnitt alle 300 Basenpaare einer cDNA existiert, wird die cDNA auf dem Vektor in eine Länge von 300 Basenpaaren im Durchschnitt geschnitten. Zu diesem Zeitpunkt verbleibt ein cDNA-Fragment, das am nächsten zum Poly(A)-Schwanz liegt, ligiert an den Vektor. Der Vektor mit diesem cDNA-Fragment wird jeweils zyklisiert und in E. coli eingeführt, um eine cDNA-Bibliothek herzustellen. Ungefähr 1.000 Klone werden willkürlich von dieser Bibliothek gewählt und die Nukleotidsequenz für 300 Basenpaare wird im Durchschnitt für jeden Klon bestimmt. Die Klone werden in Gruppen von Klonen unterteilt, die jeweils dieselbe Sequenz aufweisen und Typ und Auftretenshäufigkeit von jeder Sequenz werden kalkuliert, um ein genetisches Expressionsprofil zu erhalten. Eine Homologiesuche (BLAST-Suche) wird in einer Datenbank für jede cDNA-Sequenz durchgeführt und Klone, die Gene enthalten, die dieselbe Sequenz aufweisen wie bekannte Gene, werden mit dem Namen der Gene gezeichnet. Wenn die Sequenz nicht in der Datenbank registriert ist wird angenommen, dass kein zu der Sequenz korrespondierendes Gen existiert.
Um eine Homologiesuche durch die BLAST-Suche durchzuführen, werden Informationen von mindestens 11 Basenpaaren benötigt. Die Arten von Sequenzen, die aus 10 Nukleotiden bestehen, betragen ungefähr 1.000.000 und diese Zahl liegt deutlich außerhalb der Zahl von Genarten, deren Existenz beim Menschen vermutet wird, d.h. 100.000. D.h., wenn es eine Information für 11 Basenpaare gibt, kann ein Gen mit der Sequenz identifiziert werden und auf diese Weise ist die genetische Expressionsprofilanalyse möglich. Wenn man also auf eine Erhöhung der Effizienz der genetischen Expressionsprofilanalyse durch das Body-Map-Verfahren abzielt, die viel Sequenzieren erfordert, werden cDNA-Fragmente von ungefähr 300 Basenpaaren, wie verwendet im Body-Map, weiter in kurze Fragmente von 11 Basenpaaren oder mehr (bezeichnet als "Tag") hergestellt, wobei viele dieser Fragmente in einen Vektor ligiert und inseriert werden, um eine Bibliothek von ligierten Tags zu erzeugen, ungefähr 1.000 Klone werden willkürlich wie beim Body-Map selektiert und DNA-Sequenzen der ligierten Tags werden bestimmt und es wird angenommen, dass mehr genetische Expressionsinformation mit derselben Arbeit erhalten werden kann, wie verglichen mit Body-Map. Jedes Tag repräsentierte eine Gensequenz und die Auftretungshäufigkeit des Tags zeigt die Expressionsfrequenz des Gens. Da die Länge der DNA-Sequenz, die durch einmaliges Sequenzieren bestimmt werden kann, in der Regel ungefähr 600 Basenpaare beträgt, können DNA-Sequenzen von ungefähr 50 Tags höchstens durch einmaliges Sequenzieren bestimmt werden. D.h., es wird möglich, die genetische Expressionsprofilanalyse mit einer Effizienz durchzuführen, die ungefähr 50mal höher ist als die des Body-Map-Verfahrens.
Als Verfahren für eine genetische Expressionsprofilanalyse, basierend auf dem vorstehenden Konzept, gibt es das Verfahren der seriellen Analyse der Genexpression (SAGE, US-Patent Nr. 5,695,937 und 5,866,330, europäische Patentveröffentlichung Nr. 0761822 A). Bei SAGE wird cDNA unter Verwendung von Poly(T), dessen 3'-Ende mit Biotin gebunden ist als Primer erzeugt, die cDNA wird mit einem Restriktionsenzym, wie z.B. MboI (als "Ankerenzym" bezeichnet) wie bei Body-Map verdaut, cDNA-Fragmente, die das 3'-Ende enthalten, an das Biotin gebunden ist, werden auf Avidin-Kügelchen adsorbiert, die Kügelchen werden in zwei Anteile geteilt und zwei Arten von Linkern (A oder B) werden jeweils an die cDNA-Fragmente (ungefähr 13 bp) ligiert, adsorbiert an einer von zwei Anteilen der Kügelchen. Jeder Linker enthält eine Stelle für ein Klasse-II-Restriktionsenzym, wie z.B. BsmFI (bezeichnet als "Tagging-Enzym"). Jedes cDNA-Fragment wird von den Kügelchen mit dem Tagging-Enzym exzisiert, das exzisierte Ende wird mit stumpfen Enden versehen und die Tags, ligiert an den Linker A und den Linker B, werden verbunden. Das Produkt der Bindung wird als "Ditag" bezeichnet. Der Ditag wird durch PCR unter Verwendung von Primern amplifiziert, die Linker A und Linker B erkennen. Eine große Anzahl amplifizierter Ditags werden ligiert, in einen Vektor inseriert und sequenziert. Ungefähr 50 Tag-Sequenzen können durch einmaliges Sequenzieren erhalten werden. Durch Kalkulation, basierend auf dieser Tag-Sequenzinformation, werden genetische Expressionsfrequenzen bereitgestellt.
Weiterhin gibt es als andere Verfahren zur Analyse von Expressionsfrequenzen von Genen das Gen-Chip-Verfahren und das Gen-Microarray-Verfahren. In beiden Verfahren werden Gen-Fragmente verwendet, die in einer Reihe an eine geeignete Platte adheriert sind (in der Regel Objektträgerglas) und zwar mit extrem hoher Dichte (ca. 10 Fragmente/mm² oder mehr). Die Gen-Fragmente auf diesem Chip werden mit Fluoreszenz-markierten mRNAs hybridisiert, um Art und Menge der mRNAs zu bestimmen.
Wie oben beschrieben, wurden verschiedene Verfahren für die Analyse von Expressionsfrequenzen von Genen entwickelt und gute Ergebnisse können erhalten werden. Z.Zt. ist das SAGE-Verfahren das effektivste für die Messung der Expressionsfrequenzen der Gesamtgene aller eukaryontischen Organismen. Wenn dieses Verfahren jedoch tatsächlich durchgeführt wird, werden viele Probleme angetroffen und das SAGE-Verfahren kann in den meisten Forschungseinrichtungen nicht reproduziert werden. D.h., dass die für das SAGE-Verfahren benötigten Techniken kompliziert sind und nur durch spezielle ausgebildete Personen durchgeführt werden können. Weiterhin wird ungefähr 1 μg mRNA für die Messung benötigt und daher ist es im wesentlichen unmöglich die Messung mit einer Probe durchzuführen, die nur in geringer Menge erhalten werden kann, z.B. einem klinischen Biopsiematerial oder Unterschiede in der genetischen Expression in Mikrogewebereichen zu messen. Weiterhin führt das Verfahren theoretisch zu deutlichen Messfehlern.
Bei dem SAGE-Verfahren ist es besonders wichtig eine Sequenz des Tags akkurat zu bestimmen. Das liegt daran, dass der Tag kurz ist (ungefähr 13 bp) und wenn daher nur eins der Nukleotide falsch bestimmt wird, kann eine unterschiedliche Sequenz bestimmt werden, obwohl es sich um dieselbe Sequenz handelt oder eine unterschiedliche Sequenz kann als dieselbe Sequenz bestimmt werden. Eine solche fehlerhafte Bestimmung tritt bei dem SAGE-Verfahren jedoch mit einer gewissen Wahrscheinlichkeit auf. Dies liegt daran, dass bei dem SAGE-Verfahren zwei Tags miteinander zur Bildung eines Ditags verbunden werden und die Grenzlinie zwischen den Tags nicht mehr bestimmbar ist. Das Tag ist ein kurzes Gen-Fragment, exzisiert durch ein Restriktionsenzym, wie z.B. BsmFI und FokI. Die Spaltungsstellen dieser Enzyme sind jedoch nicht immer stabil und die Längen der exzisierten Tags unterscheiden sich daher. Wenn daher die Tags zur Bildung eines Ditags in dem Zustand verbunden werden, dass Tags unterschiedlicher Längen miteinander vermischt sind, führt dies zu einer Nicht-Bestimmbarkeit, von welchem der Tag Nukleotide an der Ligationsstelle der Tags tatsächlich abstammen. Im Ergebnis wird es unmöglich eine korrekte Sequenz des Tags zu erhalten. So leidet das SAGE-Verfahren an einem theoretisch nicht vermeidbaren Nachteil. Weiterhin involviert das SAGE-Verfahren einen Arbeitsschritt eines Sammelns von DNA unter Verwendung von Avidin- und Biotin-Kügelchen. Es ist jedoch tatsächlich sehr schwierig, DNA unter Verwendung von Avidin- und Biotin-Kügelchen, ohne Kontamination zu verursachen, durchzuführen und es ist extrem schwierig korrekte Daten durch Durchführung gemäß diesem Protokoll zu erhalten. Weiterhin macht das SAGE-Verfahren eine große Menge von mRNA nötig, um diese Daten zu erhalten. Daher kann in einem Fall einer Probe, deren Menge begrenzt ist, z.B. bei klinischen Proben, keine ausreichende mRNA-Menge erhalten und so das SAGE-Verfahren nicht durchgeführt werden.
Weiterhin kann bei dem Gen-Chip-Verfahren und dem Gen-Microarray-Verfahren die Messung nur für ein Gen durchgeführt werden, dessen Struktur bekannt ist, anders bei dem Body-Map-Verfahren oder dem SAGE-Verfahren. Daher können in der gegenwärtigen Situation Expressionsfrequenzen von Gesamtgenen aller Organismen nicht gemessen werden.
Z.Zt. ist das SAGE-Verfahren das effektivste Mittel für die Messung der Expressionsfrequenzen der Gesamtgene aller eukaryontischen Organismen. Wenn dieses Verfahren jedoch tatsächlich durchgeführt wird, trifft es auf viele Probleme und das SAGE-Verfahren könnte in den meisten Forschungseinrichtungen nicht reproduziert werden. Die Nachteile des SAGE-Verfahrens sind die folgenden: (1) die für das Verfahren benötigten Techniken sind kompliziert und sie können nur durch speziell ausgebildete Personen durchgeführt werden; (2) es wird ungefähr 1 μg mRNA für die Messung benötigt und daher ist es im wesentlichen unmöglich die Messung mit einer Probe durchzuführen, die nur in geringer Menge erhalten werden kann, z.B. einem klinischen Biopsiematerial und es ist ähnlich unmöglich den Unterschied der genetischen Expression in Mikrogewebebereichen zu messen; und (3) das Verfahren führt theoretisch zu deutlichen Messfehlern, da ein Ditag gemessen wird.
OFFENBARUNG DER ERFINDUNG
Die vorliegende Erfindung wurde im Hinblick auf die vorstehende gegenwärtige Situation bewirkt und es ist eine Aufgabe ein Verfahren bereitzustellen, das durch gewöhnliche Forscher einfach durchgeführt werden kann und dass eine akkurate genetische Expressionsfrequenzanalyse mit einer Mikromenge einer Probe ermöglicht.
Die Erfinder der vorliegenden Erfindung haben genaue Forschungen durchgeführt, um das vorstehende Objekt zu erreichen. Im Ergebnis haben sie festgestellt, dass die Expressionsfrequenzen von Genen effizient mit hoher Präzision analysiert werden können, indem jede cDNA von jeder mRNA unter Verwendung eines Vektorprimers mit einer Poly(T)-Sequenz synthetisiert wird, Umwandlung jeder cDNA zu einem Tag auf dem Vektor, Bildung eines Konkatemers durch Ligieren der erhaltenen Tags über eine Sequenz, die eine Erkennung der Enden der Tags ermöglicht und Analyse einer Nukleotidsequenz des Konkatemers und haben so das Verfahren der vorliegenden Erfindung erreicht, bezeichnet als "MAGE" (Mikro-Analyse der Genexpression)".
D.h., dass die vorliegende Erfindung das folgende bereitstellt.

(1) Verfahren zum Analysieren der Expressionshäufigkeiten von Genen, welches die folgenden Schritte umfasst: (a) einen Schritt zum Bilden eines Vektorprimers, an den jede cDNA ligiert ist, durch das Anlagern des Vektorprimers an jede mRNA, die von einer Zelle stammt, deren Expressionshäufigkeiten der Gene analysiert werden sollen, und Synthetisieren der cDNA, wobei der Vektorprimer einen linearen Plasmidvektor mit einer einzelsträngigen Poly(T)Sequenz an einem 3'-Ende, einer Erkennungssequenz für ein erstes Restriktionsenzym in einer inneren Position von der Poly(T)Sequenz aus, einer Erkennungssequenz für ein zweites Restriktionsenzym in der Nähe des anderen Endes, und einer Erkennungssequenz für ein Restriktionsenzym vom Typ IIS in einer inneren Position von der Erkennungssequenz des zweiten Restriktionsenzyms umfasst, (b) einen Schritt des Verdaus des Vektorprimers, an den die cDNA ligiert ist, mit dem zweiten Restriktionsenzym und einem dritten Restriktionsenzym, das den Vektorprimer nicht verdaut, und ein verdautes Ende der gleichen Form bildet, wie das verdaute Ende, das mit dem zweiten Restriktionsenzym erhalten wurde, um eine stromaufwärts gelegene Region der cDNA auszuschneiden und den Vektorprimer zu zyklisieren, (c) einen Schritt des Verdaus des zyklisierten Vektorprimers mit dem ersten Restriktionsenzym und dem Typ IIS Restriktionsenzym, um die stromabwärts liegende Region der cDNA auszuschneiden, so dass ein Tag, welcher aus einem Teil der cDNA besteht, übrigbleibt, und dem erneuten Zyklisieren des Vektorprimers, (d) einen Schritt zum Durchführen der Polymerasekettenreaktion (PCT) unter Verwendung des Vektorprimers als Schablone und von Oligonukleotiden mit Nukleotidsequenzen, die den jeweiligen flankierenden Regionen beider Stellen des Tags entsprechen, das in dem Vektorprimer enthalten ist, als Primer, um das Tag zu amplifizieren, (e) einen Schritt des Ligierens der Amplifikationsprodukte, um ein Konkatemer der Tags zu bilden, und (f) einen Schritt des Bestimmens der Nukleotidsequenz des Konkatemers und des Untersuchens der Arten und Häufigkeiten der Tags, die in der Nukleotidsequenz auftreten.
(2) Gemäß Verfahren (1), wobei die Ligationsreaktion in Schritt (e) in Gegenwart eines Adaptors mit einem Ende der gleichen Form wie ein Ende des Tags durchgeführt wird, um den Adaptor an jedem Ende des Konkatemers anzuordnen, und das Konkatemer durch das Durchführen einer PCR unter Verwendung von Oligonukleotiden amplifiziert wird, die eine Sequenz haben, die der Sequenz des Adaptors entspricht, als Primer.
(3) Gemäß Verfahren (1) oder (2), wobei nach Schritt (e) das Konkatemer in einen Klonierungsvektor für die Nukleotidsequenzierung kloniert wird und die Nukleotidsequenz des Konkatemers bestimmt wird.
(4) Gemäß einem der Verfahren (1) bis (3), wobei die Erkennungssequenz des dritten Restriktionsenzyms aus vier Nukleotiden bestehen.
(5) Gemäß jedem der Verfahren (1) bis (4), wobei der Vektorprimer eine Erkennungsstelle für ein viertes Restriktionsenzym hat, von dem der Verdauungspunkt in der gleichen Position oder an einer inneren Position des Verdauungspunktes der Erkennungssequenz des zweiten Restriktionsenzyms ist, welches aus dem Vektorprimer durch den Verdau mit Typ IIS Restriktionsenzym nicht ausgeschnitten wird; der Primer für die stromabwärts gelegene Seite des Tags aus den Primern, die in Schritt (d) verwendet werden, eine Erkennungssequenz für ein fünftes Restriktionsenzym hat, das ein Ende der gleichen Form bildet wie das Ende, das mit dem vierten Restriktionsenzym verdaut wurde; und das Konkatemer gebildet wird, nachdem die amplifizierten Primer mit dem vierten Restriktionsenzym und dem fünften Restriktionsenzym verdaut wurden.
(6) Gemäß Verfahren (5), wobei der Vektorprimer eine Nukleotidsequenz hat, die von der Erkennungssequenz des fünften Restriktionsenzyms durch ein Nukleotid in einer inneren Position von der Erkennungsstelle des ersten Restriktionsenzyms verschieden ist, und die Nukleotidsequenz, die durch ein Nukleotid verschieden ist, in die Erkennungssequenz für das fünfte Restriktionsenzym mit Hilfe der PCR umgewandelt wird, indem die Primer für die stromabwärts liegende Seite des Tags verwendet werden.
(7) Gemäß Verfahren (6), wobei die dritten, vierten und fünften Restriktionsenzyme miteinander identisch sind.
(8) Gemäß einer der Verfahren (1) bis (7), wobei der Vektorprimer durch das Ligieren eines linearen Plasmids gebildet wird, das durch das Verdauen eines Plasmids mit einer Multiklonierungsstelle an zwei Stellen der Multiklonierungsstelle erhalten wird sowie einer teilweise doppelsträngigen DNA mit einem Ende der gleichen Form wie ein Ende des linearen Plasmids und einer einzelsträngigen Poly(T)Sequenz.

KURZE ERKLÄRUNG DER ZEICHNUNGEN
1 zeigt eine beispielhafte Struktur einer Plasmid-DNA für die Erzeugung eines Vektorprimers (MAGE/pUC19).
2 zeigt eine beispielhafte Struktur eines Vektorprimers und ein Konstruktionsverfahren hierfür.
3 zeigt schematisch die Schritte (a) und (b) des Verfahrens der vorliegenden Erfindung
4 zeigt schematisch die Schritte (c) und (d) des Verfahrens der vorliegenden Erfindung.
5 zeigt schematisch den Schritt (e) des Verfahrens der vorliegenden Erfindung und einen Insertionsschritt eines Amplifikationsprodukts, erhalten in Schritt (e), in einen Klonierungsvektor zum Sequenzieren.
BESTE AUSFÜHRUNGSFORM DER ERFINDUNG
Das erfindungsgemäße Verfahren umfasst die vorstehenden Schritte (a) bis (f). Hiernach wird jeder Schritt erklärt werden.
(1) SCHRITT (a)
Ein dem ersten Schritt wurde ein Vektorprimer, umfassend einen linearen Plasmidvektor mit einer einzelsträngigen Poly(T)-Sequenz an einem 3'-Ende, einer Erkennungssequenz für ein erstes Restriktionsenzym in einer inneren Position von der Poly(T)-Sequenz, einer Erkennungssequenz für ein zweites Restriktionsenzym nahe dem anderen Ende und einer Erkennungssequenz für eine Typ IIS-Restriktionsenzym in einer inneren Position von der Erkennungssequenz für das zweite Restriktionsenzym verwendet (ebenfalls bezeichnet als "der Vektorprimer für reverse Transkripition"). Das Typ IIS-Restriktionsenzym bedeutet ein Restriktionsenzym, das eine spezielle Position spaltet, entfernt von einer Sequenz, erkannt durch das Restriktionsenzym.
Eine beispielhafte Struktur des Vektorprimers ist in 2D dargestellt. Dieser Vektorprimer kann z.B. durch Ligation eines linearen Plasmids hergestellt werden, erhalten durch Verdau eines Plasmids mit einer Multiklonierungsstelle an zwei Stellen in der Multiklonierungsstelle und einer teilweise doppelsträngigen DNA mit einem Ende derselben Form wie ein Ende des linearen Plasmids und einer einzelsträngigen Poly(T)-Sequenz. Die Struktur von MAGE/pUCl9 ist in 1 als Beispiel des Plasmid mit einer Multiklonierungsstelle dargestellt. Dieser Primer umfasst pUC19, wobei es sich um einen bekannten Klonierungsvektor handelt, als zugrundliegende Struktur und eine Sequenz, die verschiedene Restriktionsenzym-Erkennungsstellen enthält (bezeichnet als "Z-Fragment", die Sequenz ist in SEQ ID NO: 1 dargestellt) wird zwischen die EcoRI- und HindIII-Restriktionsenzymstellen der Klonierungsstelle inseriert.
In dem folgenden spezifischen Beispiel wird ein Beispiel erklärt, das MAGE/pUC19 verwendet, hergestellt unter Verwendung eines Escherichia coli Wirts, mit einem Dam-Methylierungssystem, z.B. einem JM109-Stamm, usw. Dies ist jedoch für die vorliegende Erfindung nicht essentiell. Weiterhin ist der als zugrundeliegende Struktur verwendete Vektor nicht auf pUC19 begrenzt und verschiedene andere Vektoren, wie z.B. pUC18, pBR322, pHSG299, pHSG298, pHSG399, pHSG398, RSF1010, pMW119, pMW118, pMW219 und pMW218, können verwendet werden. Zusätzlich ist der Wirt des Vektors nicht besonders begrenzt, so lange es sich um einen handelt, für den gewöhnliche genetische Rekombinationsverfahren, wie z.B. Transformation und Wiedergewinnung von Vektoren aus dem Wirt, verwendet werden können. In der Regel wird jedoch Escherichia coli verwendet.
Ein Beispiel unter Verwendung von MAGE/pUCl9 als Plasmid mit einer Multiklonierungsstelle wird hiernach erklärt. Die vorliegende Erfindung ist jedoch nicht auf dieses Beispiel begrenzt.
Zunächst wird der MAGE/pUC19-Vektor (2A) mit den Restriktionsenzymen BstXI und PstI verdaut und das exzisierte kleine Fragment wird entfernt (2B). Dann wurde eine teilweise doppelsträngige DNA mit einer einzelsträngigen Poly(T)-Sequenz (Poly(T)-Adaptor, dargestellt in 2C) an das BstXI-verdaute Ende ligiert. Dies stellt einen Vektorprimer (oder einen Vektorprimer für eine reverse Transkription) bereit, worin das einzelsträngige Poly(T) von einem Ende des MAGE/pUC19-Vektors vorsteht (2D). Bei diesem Vektorprimer ist das erste Restriktionsenzym PmeI, das zweite Restriktionsenzym ist BglII und das Typ IIS-Restriktionsenzym ist BsgI.
Die Erkennungssequenz für das zweite Restriktionsenzym BglII enthält eine überlappende MboI-Erkennungssequenz und, wenn daher das das BglII-Ende an das MboI-Ende ligiert wird, kann mit MboI verdaut werden. Weiterhin ist der Vektorprimer in diesem Beispiel so entworfen, dass er eine Nukleotidsequenz (ΔMboI gemäß 3E) enthält, die sich von der vierten Restriktionsenzym(MboI)-Erkennungssequenz um ein Nukleotid in einer weiteren inneren Position von der ersten Restriktionsenzym(PmeI)-Erkennungssequenz unterscheidet. Diese ΔMboI und die erste Restriktionsenzym-Erkennungssequenz des Vektorprimers sind von dem Poly(T)-Adaptor angeleitet.
Das erste Restriktionsenzym und das zweite Restriktionsenzym sind nicht besonders begrenzt, so lange sie den Vektorprimer an einer Position verdauen. Weiterhin sind das Typ IIS-Restriktionsenzym und seine Erkennungssequenz existierende Stellung nicht besonders begrenzt, so lange sie nicht die vierte Restriktionsenzymstelle von dem Vektorprimer ausschneiden und es verdaut den stromabwärts gelegenen Bereich der cDNA, so dass ein Teil der cDNA auf dem Vektorprimer verbleibt. Es kann sich insbesondere z.B. um BsmFI, usw. handeln, zusätzlich zu dem vorher erwähnten BsgI.
Weiterhin kann die Länge der Poly(T)-Sequenz eine Länge sein, die ein Verkleben mit der Poly(A)-Sequenz von mRNA ermöglich und sie beträgt in der Regel ungefähr 10 bis 50 Nukleotide.
Ein solcher wie oben erwähnter Vektorprimer und mRNA, abgeleitet von einer Zelle, für die Expressionsfrequenzen von Genen analysiert werden sollen, werden verklebt. Wenn eine reverse Transkriptionsreaktion in diesem Zustand durchgeführt wird, dient Poly(T) als Primer und die cDNA-Synthese wird initiiert (3E). Dann kann ein zweiter Strang unter Verwendung des synthetisierten ersten Strangs der cDNA als Matrize synthetisiert werden, um eine doppelsträngige cDNA zu synthetisieren (3F). Während eine große Anzahl von Vektor cDNA-ligierten Primermolekülen (cDNA-MAGE/pUC19) aus einer großen Anzahl von mRNA-Molekülen erzeugt werden können, repräsentiert 3F ein typisches Bespiel hierfür.
Die mRNA wird aus einer Zelle extrahiert, für die Expressionsfrequenzen von Genen analysiert werden sollen. Jede Zelle kann als Zelle verwendet werden, für die die Expressionsfrequenzen analysiert werden sollen, ohne besondere Begrenzung, so lange es sich um eine Zelle handelt, worin das 3'-Ende der mRNA die Poly(A)-Struktur aufweist und es kann sich um eine Gewebszelle eines Tiers oder einer Pflanze, eine Mikroorganismuszelle, wie z.B. eine Hefezelle, handeln. Weiterhin weist die mRNA eines Prokaryonten nicht die Poly(A)-Struktur am 3'-Ende auf und kann daher nicht wie sie ist mit dem Poly(T) des Vektorprimers verklebt werden. Durch enzymatische Zugabe einer Poly(A)-Struktur zu der mRNA kann das Verfahren der vorliegenden Erfindung jedoch in einer ähnlichen Weise wie das für die mRNA eines eukaryontischen Organismuses durchgeführt werden.
Arbeitsschritte, wie die Herstellung von mRNA, cDNA-Synthese, Synthese von Oligonukleotid, Reaktion mit einem Restriktionsenzym, Ligationsreaktion, Polymerasekettenreaktion (PCR) und Transformation können auf dieselbe Weise durchgeführt werden, wie Verfahren zur Herstellung von mRNA, die für das gewöhnliche cDNA-Klonieren verwendet werden (siehe z.B. Sambrook J., Fritsch, E.F. und Maniatis, T., "Molecular Cloning; A Laboratory Manual, Second Edition", Cold Spring Harbor Laboratory Press (1989) etc.).
(2) SCHRITT (b)
Als nächstes wird der Vektorprimer, an den die cDNA ligiert ist, erhalten wie oben beschrieben, mit dem zweiten Restriktionsenzym und einem dritten Restriktionsenzym, das den Vektorprimer nicht verdaut und ein verdautes Ende in derselben Form bildet, wie ein verdautes Ende, erhalten mit dem zweiten Restriktionsenzym zum Ausschneiden eines stromaufwärts gelegenen Bereiches der cDNA verdaut und der Vektorprimer wird zyklisiert. Der zyklisierte Vektorprimer kann durch Einführung in einen geeigneten Wirt vervielfältigt werden, durch Kultivierung des erhalten Transformanten und Sammeln eines Plasmids. Wie ähnlich durchgeführt für zyklisierte Vektorprimer, die in den folgenden Schritten verwendet werden, wird ein Wirt verwendet, der nicht das Modifikationssystem enthält, wenn die Restriktionsenzymstelle zur Spaltung des erhaltenen Vektorprimers aufgrund einer Dam-Methylierung nicht verdaut werden kann.
Als drittes Restriktionsenzym wird ein Enzym, das vier Nukleotide erkennt, bevorzugt. Wenn ein Enzym, das sechs Nukleotide erkennt, verwendet wird, könnte eine solche Restriktionsenzymstelle in der cDNA-Sequenz nicht existieren. Weiterhin, wenn die auf dem Vektorprimer verbliebene cDNA-Sequenz lang ist, wird das Tag, das durch die folgenden Verfahren erhalten wird, weiter von der Poly(A)-Sequenz der mRNA entfernt sein. In einem solchen Fall könnte die Zielsequenz, da die Expressionsinformation von Genen in einer Datenbank (EST: exprimiertes Sequenz-Tag) in der Regel für Teile des 3'-Endes von mRNA existiert, nicht mehr gewonnen werden, wenn Tag-Sequenzen gesucht werden. Beispiele für Restriktionsenzyme, die für die vorliegende Erfindung geeignet sind und die vier Nukleotide erkennen, beinhalten MboI, TaiI, usw.
Hiernach wird ein Beispiel unter Verwendung von MboI als drittes Restriktionsenzym erklärt. Zunächst wird der cDNA-ligierte Vektorprimer (cDNA-MAGE/pUC19) mit den Restriktionsenzymen BglII und MboI (3G) verdaut. Da MAGE/pUC19 zu diesem Zeitpunkt Dam-Methyliert ist, wird er nicht mit MboI verdaut und nur die in der cDNA durch die reverse Transkription neu synthetisierte MboI-Stelle wird verdaut. 3G zeigt eine temporäres Beispiel, worin die cDNA drei MboI-Stellen enthält. Im Hinblick auf die cDNA verbleibt ein stromabwärts gelegener Bereich von dem Poly(A)-Schwanz zu der ersten MboI-Stelle zum stromaufwärts gelegenen Bereich an den MAGE-pUC19-Vektorprimer ligiert und der andere Bereich, d.h. der stromaufwärts gelegene Bereich der cDNA wird exzisiert und durch den MboI-Verdau entfernt. Im Hinblick auf MAGE/pUCl9 wird dies mit BglII an nur einer Stellung verdaut. Die Endbereiche, verdaut mit MboI und BglII, sind in derselben Form und sie können durch eine Ligationsreaktion ligiert werden. Daher wird die cDNA-MAGE/pUC19 durch eine Selbstligierungsreaktion über diese Enden zyklisiert (3H).
(3) SCHRITT (c)
Der in Schritt (b) zyklisierte Vektorprimer wird mit dem ersten Restriktionsenzym und mit dem Typ IIS-Restriktionsenzym verdaut, um den stromabwärts gelegenen Bereich der cDNA auszuschneiden, so das ein Tag, bestehend aus einem Teil der cDNA verbleibt und der Vektorprimer wird wieder zyklisiert.
Spezifisch wird zyklisierter cDNA-MAGE/pUC19 mit den Restriktionsenzymen BsgI und PmeI verdaut (4I). Nach Verdau mit diesen Restriktionsenzymen verbleiben nur ungefähr 13 Nukleotide, die von dem Poly(A)-Schwanz des 3'-Endbereiches der cDNA am weitesten entfernt gelegen sind, auf dem Vektorprimer. Diese cDNA-Sequenz, bestehend aus ungefähr 13 Nukleotiden wird als Tag bezeichnet (in 4J als "tag" dargestellt).
Da der Strang des 5'-Endes um 2 bp an dem mit BsgI verdauten Ende vorsteht, wird er durch T4 DNA-Polymerasebehandlung als Beispiel mit stumpfen Enden versehen. Weiterhin wird ein anderes Ende, verdaut mit PmeI mit stumpfen Enden versehen. Daher können diese Enden ligiert werden (4J). Auf diese Weise wird, wenn der Vektorprimer durch eine Selbstligierungsreaktion zyklisiert ist, ein Vektorprimer mit einer Struktur erhalten, umfassend MAGE/pUC19, woran ein kurzes Tag ligiert ist, worin der Teil der cDNA, wobei es sich nicht um den Tag handelt, exzisiert ist (4J und K).
(4) SCHRITT (d)
Darauf folgend wird eine PCR unter Verwendung des Vektorprimers, zyklisiert in Schritt (c) als Matrize durchgeführt und von Oligonukleotiden mit Nukleotidsequenzen, korrespondierend zu den jeweiligen flankierenden Bereichen von beiden Seiten des Tags in dem Vektorprimer als Primer zur Vervielfältigung des Tags.
Spezifisch wird die PCR unter Verwendung des Vektorprimers durchgeführt, enthaltend den Tag als Matrize, und Primer, korrespondierend zu den Sequenzen der Vektorsegmente auf beiden Seiten des Tags (z.B. diejenigen der SEQ ID NOS: 2 und 3) (4K). Im Ergebnis wird ein DNA-Fragment, enthaltend den Tag im Zentrum, vervielfältigt (in diesem Fall 110 bp, einschließlich der Sequenzen von Primern und Tag) (4L).
(5) SCHRITT (e)
Die vorstehenden PCR-Amplifikationsprodukte werden ligiert um ein Konkatemer der Tags zu bilden. Zu diesem Zeitpunkt, wenn eine Erkennungssequenz für ein fünftes Restriktionsenzym, das ein Ende in derselben Form erzeugt, wie das Ende, erhalten durch Verdau mit dem vierten Restriktionsenzym, in den Primer für den stromabwärts gelegenen Bereich des Tags unter den Primern eingeführt wird, die in dem Schritt (d) verwendet werden und der amplifizierte Primer mit dem vierten Restriktionsenzym und dem fünften Restriktionsenzym verdaut wird, kann ein Konkatemer effizient gebildet werden. Die Art des fünften Restriktionsenzyms ist nicht besonders begrenzt. Wenn jedoch dasselbe Restriktionsenzym wie das vierte Restriktionsenzym verwendet wird, wird das Verfahren vereinfacht. Weiterhin kann dasselbe Restriktionsenzym wie das dritte Restriktionsenzym, als viertes Restriktionsenzym verwendet werden. Weiterhin können dritte, vierte und fünfte Restriktionsenzyme jeweils dasselbe Enzym sein. Wenn jedoch dasselbe Restriktionsenzym als fünftes und viertes Restriktionsenzym verwendet wird, wird die Gesamtsequenz der cDNA aus dem Vektorprimer im Schritt (b) ausgeschnitten. Um dies daher zu verhindern ist es notwendig, eine Nukleotidsequenz einzuführen, die sich von der Erkennungssequenz für das fünfte Restriktionsenzym um ein Nukleotid an einer Position in einer weiter innen gelegenen Position von der ersten Restriktionsenzyms-Erkennungssequenz des Vektorprimers unterscheidet und die PCR unter Verwendung eines Primers mit einer Erkennungssequenz für das fünfte Restriktionsenzym für die stromabwärts gelegene Seite des Tags durchzuführen, so dass die Nukleotidsequenz, die sich um ein Nukleotid unterscheidet, durch die Erkennungssequenz für das fünfte Restriktionsenzym ersetzt wird. Wenn weiterhin dasselbe Enzym als drittes Restriktionsenzym und viertes Restriktionsenzym verwendet wird, muss die Erkennungsstelle des Vektorprimers für das vierte Restriktionsenzym so durch Methylierung hergestellt werden, dass sie nicht verdaut wird. In diesem Fall wird vor dem Verdau mit dem vierten Restriktionsenzym der in Schritt (c) zyklisierte Vektorprimer, in den Wirt eingeführt, der nicht ein Modifikationssystem für eine Demodifikation enthält.
Wenn die Ligationsreaktion der Tags in Gegenwart eines Adaptors durchgeführt wird, der ein Ende derselben Form aufweist, wie ein Ende des Tags um den Adaptor an jedem Ende des Konkatemers anzuordnen und PCR unter Verwendung eines Oligonukleotids durchgeführt wird mit einer Sequenz, korrespondierend zu einer Sequenz des Adaptors als Primer, kann das Konkatemer vervielfältigt werden. Wenn der Adaptor im Vergleich mit dem Tag in einer geringeren Menge verwendet wird oder wenn ein Adaptor mit einem Ende verwendet wird, das sich in der Form von der des Tags unterscheidet, kann der Adaptor an jedem Ende eines Konkatemers angeordnet werden, bestehend aus einer großen Anzahl von Tags. Auf diese Weise kann sogar eine geringe Menge eines Konkatemers kloniert werden und im Ergebnis wird eine Analyse mit einer geringen Menge einer Proben-mRNA möglich.
Das molare Verhältnis der Tags und des Adaptors beträgt in der Regel Tag:Adaptor = 1:1 bis 1:0,01, vorzugsweise 1:0,2 bis 1:0,05. Wenn der Adaptor in diesem Bereich verwendet wird, kann ein Konkatemer, bestehend aus ungefähr 2 bis 50 ligierten Tags, erhalten werden.
Die Insertion des erhaltenen Konkatemers in einen Klonierungsvektor für eine Nukleotidsequenzierung vereinfacht die Sequenzierungsarbeit.
Wenn MAGE/pUC19 verwendet wird, wird ein kleines Fragment, enthaltend ein Tag, durch Verdau des Amplifikationsprodukts des Schritts (d) mit einem Restriktionsenzym MboI (5M) erhalten. Das hier erhaltene Tag-Fragment liegt zwischen bekannten DNA-Sequenzen vor, d.h. GATC und AAACG und kann daher definitiv erkannt werden, welcher Bereich das Tag ist. Da MboI-Stellen an beiden Enden dieser Tag-Sequenz exponiert sind, können die Tags aneinander durch ein Ligationsreaktion zur Bildung eines Konkatemers ligiert werden (5M).
(6) SCHRITT (f)
Wenn die Nukleotidsequenz des wie oben beschrieben erhaltenen Konkatemers bestimmt wird, da Tags von mehreren cDNA-Molekülen abstammend darin enthalten sind, können die Expressionsfrequenzen der Gene, von denen die cDNAs abstammen, durch Untersuchung von Art und Frequenz der Tags, die in der Nukleotidsequenz auftreten, analysiert werden. Die Art des Tags kann durch Suche in einer Datenbank, enthaltend Informationen für Teilsequenzen von bekannten mRNAs (EST) bestimmt werden.
Wenn das Konkatemer der Tags amplifiziert wird, werden zwei oder mehr Fragmente mit derselben Sequenz gebildet. Wenn jedoch eine Sequenz, von der angenommen wird, dass sie dieselbe wie eine vorher Sequenzierte ist, in der Sequenzanalyse nach dem Klonieren auftritt, kann sie von der Analyse aufgeschlossen werden, um einen schlechten Einfluss der PCR auf die genetische Expressionsfrequenzanalyse zu eliminieren.
Wenn weiterhin dasselbe Enzym als viertes und fünftes Restriktionsenzym verwendet wird, da die Richtung der Tags in den Konkatemer nicht fixiert ist, werden nicht nur Sequenzen von einem Strang sondern auch von dem Umkehrstrang in die Betrachtung der Sequenzanalyse mit einbezogen.
Wie oben erklärt, wird bei dem Verfahren der vorliegenden Erfindung nicht wie bei dem SAGE-Verfahren ein Ditag produziert, sondern das Tag kann daran gehindert werden, sich direkt mit anderen Tags zu verbinden, indem jedes Tag zwischen bekannte DNA-Fragmente gesetzt wird. Im Ergebnis wird das Problem, dass die Grenzlinie zwischen den Tags nicht mehr definiert werden kann, gelöst. Da weiterhin eine Probe durch Durchführung von mehreren PCRs hintereinander vervielfältigt werden kann, wird die Analyse selbst mit einer geringen Menge mRNA möglich. Weiterhin ermöglicht die Verwendung eines Vektorprimers eine cDNA-Synthese in dem Zustand, dass die cDNA an den Vektor fusioniert ist. Daher kann die Analyse ohne die Verwendung von Avidin- und Biotin-Kügelchen durchgeführt werden.
BEISPIEL
Fünfunddreißig Mikrogramm (35 μg) mRNA wurden aus 1 g C57BL/6-Mäuselebern unter Verwendung eines Fast-Track-2,0-Kits, erzeugt von Invitrogen, extrahiert.
Nachdem die cDNA durch reverse Transkription unter Verwendung von 0,97 μg der erhaltenen mRNA und MAGE/pUCl9 synthetisiert worden war, wurde die genetische Expressionsfrequenzanalyse wie folgt durchgeführt.
Der MAGE/pUCl9-Vektor (2A) wurde mit den Restriktionsenzymen BstXI und PstI verdaut und das ausgeschnittene kleine Fragment wurde entfernt (2B). Dann wurde eine teilverdaute doppelsträngige DNA mit einer einzelsträngigen Poly(T)-Sequenz (Poly(T)-Adaptor wie dargestellt in 2C) an das BstXI-verdaute Ende (2D) ligiert. Bei diesem Vektorprimer war das erste Restriktionsenzym PmeI, das zweite Restriktionsenzym war BglII und das Typ IIS-Restriktionsenzym war BsgI (3E).
Nullkommazwei Mikrogramm (0,2 μg) des Vektorprimers und 0,97 μg der mRNA, abgeleitet von Mäuseleber, wurden verklebt und eine cDNA-Synthese wurde durchgeführt. Dann wurde ein zweiter Strang unter Verwendung der synthetisierten ersten cDNA als Matrize synthetisiert (3F). Eine genetische Expressionsfrequenzanalyse wurde unter Verwendung der erhaltenen cDNA in einer Menge von 1/40 der erhaltenen cDNA-Menge (korrespondierend zu 0,025 μg mRNA) als Material durchgeführt.
In einem anderen Experiment konnte die genetische Expressionsfrequenzanalyse erfolgreich unter Verwendung von 0,05 μg einer Mikromenge mRNA durchgeführt werden, extrahiert aus 4,5 mg einer geringen Menge einer klinischen Probe als experimentelles Material zur Synthese von cDNA durch reverse Transkription und unter Befolgung derselben Verfahren wie unten beschrieben.
Dann wurde der Vektorprimer, an den die wie oben beschrieben erhaltene cDNA ligiert war, mit BglII und MboI verdaut, wobei es sich um die zweiten bzw. dritten Restriktionsenzyme handelte (3G). Darauf folgend wurde das MboI-Ende und BglII-Ende von cDNA-MAGE/pUC19 durch eine Selbstligierungsreaktion zum Zyklisieren des Vektorprimers (3H) ligiert.
Der obige zyklisierte Vektorprimer wurde mit BsgI und PmeI verdaut und die verdauten Enden wurden durch eine T4 DNA-Polymerasebehandlung mit stumpfen Enden versehen. Dann wurde der Vektorprimer wieder zyklisiert (4I bis K). Eine PCR wurde unter Verwendung dieses zyklisierten Vektorprimers als Matrize und Oligonukleotiden mit Nukleotidsequenzen, korrespondierend zu den respektiven flankierenden Bereichen beider Seiten des Tags in dem Vektorprimer (SEQ ID NOS: 2 und 3) als Primer sowie einem Enzym AmpliTaq-Gold (PE Biosystems) zur Vervielfältigung des Tags durchgeführt (4L). Die obige PCR wurde durch Wiederholung eines Reaktionszyklus einer Denaturierung (95°C, 0,3 Minuten), Verkleben und Verlängerungsreaktion mit der Polymerase (72°C, 1,5 Minuten) über 65 Zyklen durchgeführt. Im Ergebnis wurde ein DNA-Fragment mit 110 bp, enthaltend den Tag im Zentrum, amplifiziert.
Das obige PCR-Amplifikationsprodukt wurde mit MboI zum Ausschneiden des Tags verdaut und eine Ligationsreaktion wurde durch Zugabe eines Adaptors durchgeführt, erhalten durch Verkleben von Oligonukleotiden mit den in SEQ ID NOS: 4 und 5 dargestellten Nukleotidsequenzen, wobei das Verhältnis von Tag:Adaptor 8:1 annehmen sollte, um ein Konkatemer der Tags (5M) zu bilden. Dieses Konkatemer wurde durch PCR unter Verwendung eines Primers amplifiziert, der die Nukleotidsequenz, wie dargestellt in SEQ ID NOS: 6 aufwies. Für die PCR wurde ein Reaktionszyklus der Denaturierung (95°C, 0,3 Minuten), das Verkleben (40°C, 3 Minuten) und eine Verlängerungsreaktion mit Polymerase (72°C, 1 Minute) über 5 Zyklen wiederholt und dann wurde ein Reaktionszyklus einer Denaturierung (95°C, 0,3 Minuten), Verkleben und eine Verlängerungsreaktion (72°C, 1 Minute) 60 Zyklen wiederholt. Das Amplifikationsprodukt wurde mit dem Restriktionsenzym NotI verdaut und in die NotI-Stelle des Klonierungsvektors pKF3 zum Sequenzieren inseriert und die Nukleotidsequenz wurde bestimmt.
Basierend auf den erhaltenen Sequenzdaten (für 11.000 Tags) wurden die Tags in Gruppen von Tags mit derselben Sequenz unterteilt und die Ordnung der Gruppen gemäß der auftretenden Frequenz wurde bestimmt. Die Tags lagen im Bereich von erster bis zehnter im Hinblick auf die Frequenz von der höchsten an, wie dargestellt in Tabelle 1. Diese Ergebnis zeigt, dass das Gen, das die höchste Expressionsfrequenz im Mäuselebergewebe zeigte, das urinäre Protein I/II-Gen war. Folgend auf dieses Gen wurden das Albumingen, das urinäre Protein III-Gen und das Argininosuccinat-Synthasegen in der Reihenfolge der Expressionsfrequenz von hoch zu niedrig eingeordnet. So zeigt selbst mit einer geringen Menge an mRNA-Probe das Verfahren der vorliegenden Erfindung eine hohe Wiedergewinnungseffizienz von cDNA durch Verwendung eines Vektorprimers und ermöglicht eine genetische Expressionsfrequenzanalyse mit hoher Präzision, da die Zweideutigkeit von Tag-Sequenzen eliminiert werden kann.
TABELLE 1
GEWERBLICHE ANWENDBARKEIT
Gemäß der vorliegenden Erfindung können Expressionsfrequenzen von Genen in sicherer Weise mit guter Präzision und einfach analysiert werden kann.
Das Verfahren zur Analyse genetischer Expression der vorliegenden Erfindung ist für Forschungen im Hinblick auf die Wissenschaften des Lebens nützlich und ist insbesondere für die Entwicklung von Behandlungsverfahren oder die Diagnose von Krankheiten durch Analyse des Unterschieds in der genetischen Expression zwischen spezifischen Organen oder Zellen bei gesunden Subjekten und erkrankten Subjekten nützlich. Durch Analyse des Unterschieds der Expression von Genen, z.B. bei der Leber von gesunden Subjekten und Subjekten mit Hepatitis durch das Verfahren der vorliegenden Erfindung kann ein Gen entdeckt werden, dessen Expression insbesondere bei Hepatitis erhöht oder erniedrigt ist. Durch Untersuchung der Rolle eines solchen Gens in der Leber, können Arzneimittel zur Inhibition oder Beschleunigung der Funktion des Gens zum Zweck der Behandlung von Hepatitis entwickelt werden. Weiterhin können das Gen selbst, ein Anti-Sinn-Oligonukleotid, entworfen basierend auf der Genstruktur, ein Protein, erzeugt durch Expression des Gens, usw. ebenfalls für die Behandlung von Hepatitis verwendet werden.
Selbst bei einer Erkrankung, deren Ausbruchmechanismus noch nicht erhellt ist, kann weiterhin ein Behandlungsverfahren entwickelt werden, indem das Verfahren der vorliegenden Erfindung verwendet wird. Selbst bei einem Gen, dessen Expression in Krankheits-abhängiger Weise verändert wird, kann weiterhin durch das Verfahren der vorliegenden Erfindung dies festgestellt werden und es wird möglich, nicht nur ein Behandlungsverfahren, sondern auch ein Diagnoseverfahren einer Erkrankung zu entwickeln.
Weiterhin ist nicht nur die Verwendung auf dem medizinischen Gebiet möglich, sondern das Verfahren kann auch als Mittel zu Identifizierung nützlicher Gene von allen eukaryontischen Organismen verwendet werden. Da z.B. Hefestämme, die für das Brauen von Bier geeignet sind, durch Mutation gezüchtet werden, kann eine Veränderung der genetischen Expression zwischen einem Elternstamm und einem mutierten Stamm durch das Verfahren der vorliegenden Erfindung analysiert werden, so dass ein Gen, dessen Expression durch die Mutation verändert wurde, identifiziert werden kann. Durch umfassende Manipulation von Genen, die für das Brauen von Bier vorteilhaft sind, und die wie oben beschrieben erhalten werden, kann ein besserer Hefestamm für das Brauverfahren erzeugt werden.
Weiterhin können durch Analyse von Aminosäure-produzierenden Bakterien, wie z.B. Escherichia coli und Corynebacterium-Bakterien z.B. bessere Aminosäure-produzierende Bakterien erzeugt werden.

Claims

Verfahren zum Analysieren der Expressionshäufigkeiten von Genen, welches die folgenden Schritte umfaßt: (a) einen Schritt zum Bilden eines Vektorprimers, an den jede cDNA ligiert ist, durch das Anlagern des Vektorprimers an jede mRNA, die von einer Zelle stammt, deren Expressionshäufigkeiten der Gene analysiert werden sollen, und Synthetisieren der cDNA, wobei der Vektorprimer einen linearen Plasmidvektor mit einer einzelsträngigen Poly(T)Sequenz an einem 3'-Ende, eine Erkennungssequenz für ein erstes Restriktionsenzym in einer inneren Position von der Poly(T)Sequenz aus, eine Erkennungssequenz für ein zweites Restriktionsenzym in der Nähe des anderen Endes, und einer Erkennungssequenz für ein Restriktionsenzym vom Typ IIS in einer inneren Position von der Erkennungssequenz des zweiten Restriktionsenzyms umfaßt, (b) einen Schritt des Verdauens des Vektorprimers, an den die cDNA ligiert ist, mit dem zweiten Restriktionsenzym und einem dritten Restriktionsenzym, das den Vektorprimer nicht verdaut, und ein verdautes Ende der gleichen Form bildet, wie das verdaute Ende, das mit dem zweiten Restriktionsenzym erhalten wurde, um eine stromaufwärts gelegene Region der cDNA auszuschneiden und den Vektorprimer zu zyklisieren, (c) einen Schritt des Verdauens des zyklisierten Vektorprimers mit dem ersten Restriktionsenzym und dem Typ IIS Restriktionsenzym, um die stromabwärts liegende Region der cDNA auszuschneiden, so daß ein Tag, welcher aus einem Teil der cDNA besteht, übrigbleibt, und dem erneuten Zyklisieren des Vektorprimers, (d) einen Schritt zum Durchführen der Polymerasekettenreaktion (PCT) unter Verwendung des Vektorprimers als Schablone und von Oligonukleotiden mit Nukleotidsequenzen, die den jeweiligen flankierenden Regionen beider Stellen des Tags entsprechen, das in dem Vektorprimer enthalten ist, als Primer, um das Tag zu amplifizieren, (e) einen Schritt des Ligierens der Amplifikationsprodukte, um ein Konkatemer der Tags zu bilden, und (f) einen Schritt des Bestimmens der Nukleotidsequenz des Konkatemers und des Untersuchens der Arten und Häufigkeiten der Tags, die in der Nukleotidsequenz auftreten.
Verfahren gemäß Anspruch 1, wobei die Ligationsreaktion in Schritt (e) in Gegenwart eines Adaptors mit einem Ende der gleichen Form wie ein Ende des Tags durchgeführt wird, um den Adaptor an jedem Ende des Konkatemers anzuordnen, und das Konkatemer durch das Durchführen einer PCR unter Verwendung von Oligonukleotiden amplifiziert wird, die eine Sequenz haben, die der Sequenz des Adaptors entspricht, als Primer.
Verfahren gemäß Anspruch 1 oder 2, wobei nach Schritt (e) das Konkatemer in einen Klonierungsvektor für die Nukleotidsequenzierung kloniert wird und die Nukleotidsequenz des Konkatemers bestimmt wird.
Verfahren gemäß jedem der Ansprüche 1 bis 3, wobei die Erkennungssequenzen des dritten Restriktionsenzyms aus vier Nukleotiden bestehen.
Verfahren gemäß jedem der Ansprüche 1 bis 4, wobei der Vektorprimer eine Erkennungsstelle für ein viertes Restriktionsenzym hat, von dem der Verdauungspunkt in der gleichen Position oder an einer inneren Position des Verdauungspunktes der Erkennungssequenz des zweiten Restriktionsenzyms ist, welches aus dem Vektorprimer durch den Verdau mit Typ IIS Restriktionsenzym nicht ausgeschnitten wird; der Primer für die stromabwärts gelegene Seite des Tags aus den Primern, die in Schritt (d) verwendet werden, eine Erkennungssequenz für ein fünftes Restriktionsenzym hat, das ein Ende der gleichen Form bildet wie das Ende, das mit dem vierten Restriktionsenzym verdaut wurde; und das Konkatemer gebildet wird, nachdem die amplifizierten Primer mit dem vierten Restriktionsenzym und dem fünften Restriktionsenzym verdaut wurden.
Verfahren gemäß Anspruch 5, wobei der Vektorprimer eine Nukleotidsequenz hat, die von der Erkennungssequenz des fünften Restriktionsenzyms durch ein Nukleotid in einer inneren Position von der Erkennungsstelle des ersten Restriktionsenzyms verschieden ist, und die Nukleotidsequenz, die durch ein Nukleotid verschieden ist, in die Erkennungssequenz für das fünfte Restriktionsenzym mit Hilfe der PCR umgewandelt wird, indem die Primer für die stromabwärts liegende Seite des Tags verwendet werden.
Verfahren gemäß Anspruch 6, wobei die dritten, vierten und fünften Restriktionsenzyme miteinander identisch sind.
Verfahren gemäß einem der Ansprüche 1 bis 7, wobei der Vektorprimer durch das Ligieren eines linearen Plasmids gebildet wird, das durch das Verdauen eines Plasmids mit einer Multiklonierungsstelle an zwei Stellen der Multiklonierungsstelle erhalten wird sowie eine teilweise doppelsträngige DNA mit einem Ende der gleichen Form wie ein Ende des linearen Plasmids und eine einzelsträngige Poly(T)Sequenz.