TW200948969A - Expression-linked gene discovery - Google Patents

Expression-linked gene discovery Download PDF

Info

Publication number
TW200948969A
TW200948969A TW098108563A TW98108563A TW200948969A TW 200948969 A TW200948969 A TW 200948969A TW 098108563 A TW098108563 A TW 098108563A TW 98108563 A TW98108563 A TW 98108563A TW 200948969 A TW200948969 A TW 200948969A
Authority
TW
Taiwan
Prior art keywords
fragment
sequence
cdna
linker
dna
Prior art date
Application number
TW098108563A
Other languages
English (en)
Inventor
Boer Anne Douwe De
Michael Johannes Marcus Ebskamp
Simon Albertus Langeveld
Ivo Laros
De Rhee Miranda Debora Van
Original Assignee
Expressive Res Bv
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Expressive Res Bv filed Critical Expressive Res Bv
Publication of TW200948969A publication Critical patent/TW200948969A/zh

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6816Hybridisation assays characterised by the detection means
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1093General methods of preparing gene libraries, not provided for in other subgroups
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Genetics & Genomics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Immunology (AREA)
  • Analytical Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Plant Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Description

200948969 六、發明說明: 【發明所屬之技術領域】 本發明係關於分子生 地說,係關;^序^ 技叙領域,更明確 列。更特定@ ^ ^ ,和銓〜在基因組DNA中的核酸序
yj 文将疋而言,本發明尨Sfl从W Μ Έι, 4t it ^ '、關於將一方法應用在鑑認及/或 偵測核苷酸序列,1处主丄4 # ^ 八代表在基因組中大部分的經轉錄區及 其周圍且其係關於各式 锝錄&及 太路明m Λ各樣㈣傳特性、基因及其組合。 工的式h、 來源(可以是植物、動物、人類、人 " 之分子標記的高通量偵測和鑑認的領域中。 【先前技術】 育種技術已經從可异拉M雜βο 攸』見特性的簡早篩選發展成使用 標記偵測多基因特性的务隹 的先進方法。原則上,在雜交族群之 不同品系之間的每個遺傳差異均可代表經改變的特性。然 而歸因於大多數基因組的複雜性,不可能鑑認出現在 因組之間的每一個差異並將其與特殊特性連結。理論上, 定序完整的基因組會揭露在基因組之間的所有差異。然 =,以目前的U技術,這在實際上、時間和成本效益上' 是不可能實行的。因此’傾測遺傳差異的方法主要是基於 複雜度簡化之原則,其涉及定序得自不同個體之基因組 DNA之有限但經完全界定的部分。隨著定序技術的進步, 對某些應用而言(像是轉錄譜(transcript〇me,其代表所有 經表現之基因序列)的分析),複雜度簡化變得較不重要。 儘管如此,範圍從數千萬到數億個鹼基的真核生物基因組 200948969 之尺寸仍超出規私* ^ 見仃之尚通量定序技術的能力。 核生物中絕大多數的基因组膽 . 尺寸者)對於★接 、疋"有較大基因組 夫矣規计㈤、目的並未提供有價值的資訊,因為其從 -“現並因此似乎對特性的表現沒有貢 = 分子標記,聚隹/A m 此爲鑑遇 …、土因組中3玄等較傾向會顯露盘特性穷+77 .相關之分子標記的部分的方法,相較於僅分析;;= 电尺…ί 機選擇的方法具有優點。當基因 、、且尺寸增加時,兮卩 π ❹在心 所描述之方法使測定 土 Α之所選擇部分(其代表大多數經表現Α 編碼區及其黧衣兄丞因之 ——圍)中的序列成為可能。比較在不同個體之 選擇部分允許鑑認多形位置,其在經表現基因 、“或與其緊鄰。因為多形性的頻率在非編碼區中是較
Hi利用現行的技術可指出更多的多形性與經表現基因 、11、。@且可針對圍繞在較保守之基因周®的大型非編 ^刀2多形性的存在。這最後可能導致每個特性發現至 ❸少一個標記。本發明之方法藉著在不同個體和生物間(甚 至:在具有複雜和大量基因組之生物中)指點基因組之徹 -疋義的。p刀’使&焦在基因編碼區和基因調節區的 偵測成為可能。 核芽酸序列多形性(像是SNp)被廣泛地應用在建構 基因組輿圖上。在多形性於稱為基因作圖的過程中與表現 垔聯、之後,可在標記協助性育種技術中使用這類多形性 作為標記,以偵測在發育任何階段的特殊表現型。核苷酸 序列夕形性通常是在基因組DNA中鑑認。因為所有真核 200948969 物的基因組尺寸都遠遠超過 J矛J用現行之南通量定岸括名奸 :析㈣酸數目,故需要複雜度簡化的可再現程序: 刀析元整基因組的所逆禮却八 々 所~擇°卩分,以發現在個體之間可用於 基因組作圖的遺傳差異。鈇 ^ 吳J而,目前應用之複雜度簡化方 法的統計學性質,# 一^ 、3不&些方法無法當場揭露那些可與單
"一表現型聯結或與斜特姓矣Ϊ目丨一 Λ A h 、料殊表現財貢獻之基因很接近的遺 傳差異。 為了數個理由,現行技術極力地聚焦在發現單一核普 酸多形 J± (single nucleotide polymorphism,SNP广 SNp 比任 何其他類里的多形性更常出現在基因組中、sNp允許同形 ^子和異形合子對偶基因的精確偵測、·可應用在高通 量應用且許多卫業平台是可得的,其使得在任何想要的應 用規模下的SNP偵測都能符合成本效益。雖然SNp發現在 :中出現低水平多形性之狀況下(像是密切相關個體之保 守基因編碼區和基因組)會是精選的方法,但因為多形性 固有的低水平,在密切相關之個體中使用EST銀行於SNp 發現卻可能是較無效的。 總之,SNP發現方法理想上應該揭露在物理上與所關 注的特性有關聯的所有出現的SNP ,但不應該因為其等出 現在基因組的基因編碼區而受到較低水平之多形性妨礙, 或受到任何對於基因組序列知識之需求妨礙。因此需要在 沒有基因組或轉錄譜序列的先前知識下,可再現地測定在 代表大多數的基因編碼區及其等周圍區的基因組DNa之區 域中的伴隨序列的方法。 200948969 【發明内容】 . 現在,本發明之發明人已發現分析生物之基因組區域 . 的方法,其包括四大部分。 第一部分涉及從所選擇之生物分離mRNA,其係用於製 備小型單股的DNA片段,而該DNA片段帶有含親和力標 • 記的連接物(adaPtor)。這些DNA片段係在第三部分中^ 用。在第二部分中,基因組^^係從相同或有關的生物分 離。將該基因組DNA片段化並與連接物分子連接。在第三 部分中,使這些基因組片段與得自第一部分的單股dna 7 - 段雜交,並使用在該過程中形成的雜交產物合成DNA片 -段。這些片段會在第四部分中使用,而該部分涉及使用可 得的高通量定序方法之一,定序這些片段。 因此該鑑認樣本中之基因組DNA的方法,包括 驟: 灭
a) 從生物之組織樣本分離並純化mRNA ; b) 使用該mRNA作為模板,合成cDNa ; c) 可視需要簡化該cdna的複雜度; d) 片段化該cDNA ; e) °』視需要以尺寸挑選 f) 可視需要藉著與經鏈黴菌抗生物素蛋白塗 力珠子結合,移除含有聚A的片段; "σ g) 挞光該cDNA片段; h) 使該片段與一個包括罕見限 J坪京之辨識位置的連 7 200948969 接物和另一個含有生物素標記的連接物連接; l) 可視需要以尺寸挑選該片段; j) 修補該片段的缺口; k) 選擇含有兩種連接物序列的該片段; i 用與在步驟描述之連接物序列煉合的引子擴增 -亥片奴’其中一個引子與具有罕見限制位置之連接物互 補,而另一個引子則含有生物素標記; m) 使该片段與經鏈黴菌抗生物素蛋白塗佈的 子結合; )使用相對應限制酵素,自該片段移除含有罕見限制位 置之連接物; 〇)從與親和力珠子附接的雙股舰片段移除未藉著生 物素-鏈黴g抗生物素蛋白交互作用與親和力珠子附接的單 股; P)分離並純化基因組DNA,例如從步驟a的生物; q) 片段化該基因組DNA ; r) 可視需要拋光該基因組DNA ; 0使該基因組DNA與—個單__類型的連㈣或與兩個 不同類型的連接物連接; t) 將該基因組DNA解鏈成單股DNA ; u) 使得自步驟t)之基因組DNA與得自步驟〇)在珠子上 的cDNA雜交; v) 藉著洗務移除未結合的基因組Dna ; w) 藉著聚合酶延伸cDNA_基因組DNA雜交產物以創造 200948969 雙股模板; X)對該基因組DNA_cDNA雜交產物進行pcR; y) 從該pcr中挑選超過大約1〇〇個驗基對的片段; z) 可視需要純化該片段,以及 aa)高通量定序該片段。 法 在另-具體態樣中’該方法係延伸至鐘認多形性的方 其包括根據申請專利範圍之方法的所有步驟,並額外 ❹ 地比較得自二或多個樣本的序列數據,以鑑認多形性。 定義 在下列的說明和實施例中使用了許多名詞。為了提供 說明書和巾請專利錢(包括料類名㈣供之範圍)清 :且-致的了冑,提供下列的定義。除非在本文中另行定 義’所有的技術和科學名詞均具有與本發明所屬之技術領 =中具有通常知識者所一般了解者相同意義。所有出版 、專利申清案、專利案和其他參考文獻的揭示内容全部 以引用方式納入本文中。
核酸.根據本發明之核酸可包括哺咬和嗓吟驗基(較 的刀别疋胞嘯η疋、胸腺嘴。定和尿喷〇定,以及腺。票吟和鳥 嗓吟)的任何聚合物或募聚物(參I Αΐ_ L
Principles of Biochemistry, ^ 793.800(W〇rth Pub. 1982)) = 發月考慮到任何去氧核醣核#酸、核耱核#酸或狀核酸 、且伤及其任何化學變體,如這些鹼基的經甲基化、經羥 或、星糖基化形式、以及類似者。聚合物或募聚物可 以在組合物中是異質的或同質的,並可從天然存在的來源 9 200948969 中分離,4可以是以人工或經合成方式產生的。此外,核 酸可以疋DNA或RNA、或其混合物,並可永久地或過渡性 地以单股或雙股形式(包括同源雙鏈(hGm〇dupiex)、異源雙 鏈(heteroduplex)和雜交產物狀態)存在。 SNP:單一核苷酸多形性是在特定位點’在物種成員之 間(或在個體的成對染色體之間),在基因組中單一核皆酸 •A、T、C或G-相異時發生的DNA序列變異。sNp是最常 見的遺傳變異類型。SNP可落在基因的編碼序列、基因的 非編碼區或在基因之間的基因間區。因為遺傳密碼的簡 併,在編碼序列内的SNP不一定會改變所產生之蛋白質的 胺基酸序列。其中兩種形式皆導致相同多肽序列的SNp稱 為同義的’且若產生不同的多肽序列則稱之為非同義的。 因為SNP在演化上是保守’可使用其等作為定量特性位點 (q_itative trait loci ’ QTL)分析以及在相關研究中的標 記。 内含子:内含子是基因的非編碼部分,其在叫做剪接 的過程中從前mRNA移出以產生功能性mRNA。 外顯子:外顯子是任何在基因内被轉錄成最後的信使 RNA(mRNA)分子(而不是像内含子從經轉錄之rna分子被 剪掉)的DNA的區域。 a cDNA:CDNA*使用RNA分子作為模板,藉著逆轉錄 酶酵素合成的人工形式之DNA。 、 自然」狀態衍 其荨就像會在自 基因組DNA :基因組DNA —詞代表從 生的DNA。這意指基因組DNA帶有序列, 200948969 然界中被發現的一樣,例如包含内含子和調節序列。基因 組DNA可衍生自不同的來源,像染色體,但亦可來自染色 體外的來源’如粒線體、葉綠體和質體。
Cot-1 DNA :用以測定任何基因組之序列複雜性的技術 涉及DNA的變性和復性。DNA係藉著加熱而變性,且這解 開了 Η鍵並使DNA成為單股。若將DNA迅速地冷卻,則 .DNA會保持單股。但若允許DNA慢慢地冷卻,互補的序列 會發現彼此且最後再度鹼基配對。DNA再煉合的速率(復性 © 的另外一種稱呼)是從其中DNA被分離之物種的函數,亦確 認為「Cot」曲線❶具有高c〇t值的DNA是高度重複的DNA, 而具有低Cot值的DNA僅能獲得低副本數或為唯一的。在 該方法中,吾人使用具有1之Cot值的DNA,其為富含高 度重複的DNA序列的總基因組DNA的部分。 標註:cDNA序列的標註包括兩個步驟。將所得的序列 與可在(公開)資料庫中獲得的核苷酸及/或胺基酸序列相比 較。用於比較目的的序列排比之方法為在技術領域中已熟 © 知的。典型地借助程式(像是由Altschul等人,1990描述的 NCBI Basic Local Alignment Search Tool,BLAST)進行此比 較。可從數個來源(包括國家生物學資訊中心(Nati〇nai
Center for Biological Information, NCBI,Bethesa Md.))以 及在網際網路(HTTP://www.ncbi.nlm.nih.gov/BLAST/)上獲 得該程式。該程式比較經鑑認的cDNA/EST(經表現序列標 籤(Expressed Sequence Tags))序列與出現在資料庫中的序 列,並基於某些分數和或然率參數提交結果。此程式可選 11 200948969 出該等具有該或然率參數之某個預定下限的cdna/est序 列曰然後在第二個步驟中,經選出之cDna/est序列隨標 註提供(即連結到出現在資料庫中的序列)。這類標註稱為 「電子標註,。 眾類 ❹ ‘詞意指透過二或多個核苷酸序列的 =對比較並根據短段或長段相同或類似核苷酸的存在挑 l建立群具有類似性之序列的聚集。數個用於排比核 苷酸序列的方法為在技術領域中已,且在下文中會進 一步解釋。有時術語「裝配」或「排比」制作為同義字。 鑑認子(identifier):可加在連接物或引子上或納入其序 列中或否則用作為標記以提供獨特的鐘認子的短序列。這 類序列鑑認子可為獨特的驗基序列,其具有多變但經界定 的獨特地用來鐘認特定的核酸樣本的長度。例如,卿標藏 允許4(指數4)=256個不同的標藏。典型的實例為ζιρ序列, =在技術領域中已知為經常用於藉著雜交而獨特谓測的標 籤⑽n_ 專人 Cyt〇metry 39:131_14〇, 2〇〇〇)。使用如此鑑 〇 ^子,可在進-步加工後敎PCR樣本㈣源。在結合起 源自^同核酸樣本之經加工產物的情況下,通常使用不同 的鐘涊子鑑認不同的核酸樣本。 定序··定序-詞意指測定在核酸樣本(例如觀 T酸的順序(驗基序列)β高通量筛選(經 成) 為特別與生物學和化學領域有關之科學實驗的方法。透過) 現代自動技#和其他專門實驗室硬體的組合, 有效地同時辉選大*的樣本,更明確地說,此為定·序研:街者 12 200948969 如在本文中其他地方揭示的(來自454 Life Sciences, www.454.com 和 Illumina,www.illumina.cQmV ^ iuumina ' S〇lexa定序法依賴將隨機片段化的基因組DNA附接到平 - 面、光學透明的表面以及固相擴增以創造具有>1千萬叢簇 的超高密度定序流槽孔,其各含有每平方公分大約1〇〇〇個 模板副本。此等模板係使用強健的四色DNA藉合成定序技 術(robust four-color DNA sequencmg-by-synthesis technology) 定序,此技術使用帶有可移除螢光的可逆性終止子。該方 法確保高精確性,並避免具有同元聚合性重複的人工製 品。高敏感性螢光偵測係使用雷射激發和總内部反射光學 . 達成。 • 限制核酸内切酶:限制核酸内切酶或限制酵素是辨識 在雙股DNA分子中特定核苦酸序列(目標位置)的酵素,並 會在每個目標位置處或在其附近剪切dna分子的兩股。 限制片段.藉著以限制核酸内切酶消化而產生的DNa ❿刀子稱為限制片奴。任何給定的基因組(或核酸,無論其來 源)均會被特殊的限制核酸内切酶消化成一系列不連續的限 制片段。由F艮制核酸内切酶剪切產生的DNA片段可進一步 用在各種技術中,並可藉著例如凝膠電泳侦測。 連接:藉著連接酶酵素催化的酵素反應(其令兩個雙股 職分子被共價連接在-起)稱為連接。通常,兩DNA股 被共價連接在-起,但亦可能透過兩股之一股之一端的化 學或酵素修改防止該股& $ 丄 _ 版的連接。在那個情況下,共價連接 會只發生在兩DNA股之一中。 、 13 200948969 合成的寡核苷酸:的單股DNA分子(較佳是從大約j〇 到大約5 0個鹼基其可化學地合成)稱為合成的寡核苷酸。通 常,將些合成的DNA分子設計成具有獨特或想要的核苷 · 酸序列,雖然也可能合成具有相關序列的分子的家族且其 在核苷酸序列内的特定位置處具有不同的核苷酸組份◦術 語合成的寡核苷酸會用以稱呼具有經設計或想要之核苷酸 序列的DNA分子。 連接物:具有有限數目的鹼基對(例如長度大約丨〇到大 約30個鹼基對)的短的雙股DNA分子,其等經過設計而得 0 以將其等連接到限制片段的末端。連接物通常由兩個合成 的募核苷酸構成,其等具有彼此部分互補的核苷酸序列。 田在/合液中在適當條件下混合兩個合成的寡核苷酸時,其 等會彼此煉合形成雙股的結構。在煉合之後,設計連接物 -分子的一端,使該端得以與限制片段的末端相容,並可與 其連接;可設計連接物的另一端,使該端不能連接,但此 為非必須(經雙重連接的連接物)。 經連接連接物之限制片段:已經藉著連接物加帽的限 〇 制片段。 弓I子.通常’引子一詞意指DNA股,其可引發DNA 的合成。DNA聚合酶沒有引子就不能重新合成Dna :其只 能在其中使用互補股作為模板以指揮欲裝配之核苷酸順序 的反應中’延伸已存在的DNA股。吾人會把用在聚合酶連 鎖反應(p〇lymerase chain reacti〇n,PCR)中的合成寡核苷酸 14 200948969 DNA擴增:d>ja媳描 PCR ^ ^ μ 擴、一詞會被典型地用以表示使用 P C R次相虽的擴增系站*山 ㈢系統在喊管内合成雙股DNA分子。注意 到存有其他的擴增方法, 、 並可將此等擴增方法用在本發明 I。本發明之方法原則上可藉著使則壬何核酸擴增方法進 仃士聚口酶連鎖反應(PCR ; MulHs 1987,美國專利第 別3,202號和4,8G(),159號)或藉著使用諸如 連接酶連鎖反應(Ligase Chain Reaeti〇n,LCR;如辦 1991, ❹ ❹
Proc_ Natl. Acad. Sci. USA 88:1 89_193 ;歐洲申請案第 320,308號)、自我維持性序列複製(Self_Sustained
Replication, 3SR; Guatelli f A, 1990, Proc. Natl. Acad. Sci. USA 87:1874-1878)、股置換擴增(Strand Displacement Amplification,SDA;美國專利第 5,27〇,184 號和 5,455,166 號)、轉錄擴增系統(Transcriptional Amplification System, TAS ,Kwoh 等人,proc Natl. Acad. Sci· USA 86:1 1 73-1 177) 、Q-冷複製酶(Lizardi 等人,1988, Bio/Technology 6:1197)、滾環擴增(R〇iung Circle Amplification,RCA ;美國專利第5,871,921)、基於核酸序 列的擴增(Nucleic Acid Sequence Based Amplification, NAS BA)、裂解酶(cl eavase)片段長度多形性(美國專利第 5,719,028號)、等溫和嵌合型引子起始性核酸擴増 (Isothermal and Chimeric Primer-initiated Amplification of Nucleic Acid , ICAN)、 分歧-延伸擴增方法 (Ramification-extension Amplification Method, RAM ;美國 專利第5,719,028號和5,942,391)的擴增反應進行,或其他 15 200948969 適合的DNA擴增方法進行。為了擴增對一或多個擴增弓I子, 有小數目配錯的舰,可在降低嚴格度的條件下進行擴辦 反應,使用38t之煉合溫度,或在35mMMgcl2存在4 的PCR擴增)。熟習此項技術者能夠選擇具有適當嚴格 條件。 . 抛光(亦稱為末端修補)意指將具有非純端之dna轉變 為具有鈍端之DNA 〇 在的存在下利用DNA酶】拋光消化基因組, DNA(gDNA)模板會產生具有純端或具有突出末端(長度為❹ -或兩個核普酸)的DNA片段。同樣地,藉著機械方法片段 化DNA會提供具有鈍端或突出端之片段的組合。無論是以 酵素或機械方式產生,這些DNA片段,均可使用下述的程. 序「拋光j 。 - 在方法中,拋光可藉著以單股專一性外切核酸酶(如 BAL32核酸酶或綠豆核酸酶)處理3,_突出片段進行。通 常,核酸酶應該在使用之前先校準。 在另一方法中,鈍端係利用pfu DNA聚合酶或利用其 ❹ 他的DNA聚合酶(如T4 DNA聚合酶或Klen〇w dna聚合酶) 創造。可使用「拋光」或鈍化末端的pfu以增加在利用dna 酶I消化基因組模板之後所產生之具有鈍端物種的量。pfu DNA聚合酶填滿5’突出。此外,pfu DNA聚合酶展現3, 至5外切核酸酶活性。因此,該酵素可用以移除單和雙核 苷酸延伸以進一步增加可用於連接物連接的具有鈍端dna 片段的量(參見,例如Costa,G丄和Μ ρ· Weiner,1994,選 16 200948969 殖和分析具有鈍端之經PCR產生之DNA片段的方案 (Protocols for cloning and analysis of blund-ended PCR-generated DNA fragments) ° PCR Methods Appl 3(5): S95 ; Costa, G.L.、A. Grafsky ❹ ❹ 和分析經PCR產生之DNA片段(Cloning and analysis of PCR-generated DNA fragments)。 PCR Methods Appl 3(6): 338 ; Costa,G.L.和 M_P. Weiner, 1994,以 T4 或 Pfu 聚合酶 拋光,增加了選殖PCR產物的效率(p〇iishing with T4 or Pfu polymerase increases the efficiency of cloning of PCRproducts)。Nucleic Acid Res. 22(12):2423)。 本發明之發明人已經發現藉著提供基因組D N a並藉著 使用經連接連接物之CDNA衍生的片段以作為擴增基心:美片因段Λ引子,似乎有可能偵測到在實際上經轉錄區域 卜的基因組序列,即啟動子、内含子和終止子序列 此結合迅速鑑認在基因 ,、口 的可能性中多個^ ㈣心⑽a片段 υ、τ多個樣本可在單一反庫中 區域周圍之基因組膽A片段的可能2 ^研究這些段、内含子片段和涵p 及在基因編碼片 變異的可能性。 周即基因組序列之片段中 更進一步的優點是本發明 適用於所有生物。事前 去疋H遍可應用的,即 資訊。另-優點”士而要任何基因組或基因❸且”的 使定序“發明的方法中不需要、壁 使疋序編竭毒性物質或 不$要選殖步驟。這 則是不可能的,因基“.蛋質的序列成為可能,此否 偵測遺傳 因為其φ上 传°'^能,此否、如此序列會被選殖#罝並表現的宿主 17 200948969 生物會不能或不易存活 選殖時會產生問題的序 可能在選殖排程中產生 同樣的道理,現在亦可處理會在 列且不梵限於序列的長度,其亦 問題。 更進一步的優點是本發明的方法不需要全長的 cD=,但可使用較短的序列。這在分析大型 自球莖植物)時是特別有料,因為接著可保持聚隹在^ 組之最受關注或相關的區域 …、土 的方法可產生用於所有經表現之 1负、生表現之DNA序列的引子,這竟味
可能從經表現之序列獲得基因組數據。 〜、 【實施方式】 在一方面,本發明係關於鑑認在樣本中之基因組DNA ' 的方法’其包括4個不同的部分。 - 第1部分: 在此部分中,從cDNA產製小型序列,該序列在第3 部分中會用來作為引發序列。本部分由下列步驟組成:
a) 從生物之組織樣本分離並純化mRNA ; Q b) 使用該mRNA作為模板,合成cDNA ; c) 可視需要簡化該cDNA的複雜度; d) 片段化該cDNA ; e) 可視需要以尺寸挑選該片段; f) 可視需要藉著與(經鏈黴菌抗生物素蛋白塗佈之)親和 力珠子結合,移除含有聚A的片段; g) 拋光該cDNA的片段; 18 200948969 限制酵素之辨識位置的 連接物連接; h)將該片段與第一個包括罕見 連接物和帛ϋ固含有生物素標記的 0可視需要以尺寸挑選該片段 j)修補該片段的缺口; k) 選擇含有兩種連接物序列的該片段; l) 使用與在步驟h中描述之連接 該片段;固引子盘且古 序列煉合的引子擴增 ❹ 另-個引子則含有生物素標記;*之連接物互補,而 m) 使該片段與經鏈黴菌抗生 子結合; 机主物素蛋白塗佈的親和力珠 二使用相對應限制酵素,自該片段移除含有罕見限制位 置之連接物; 從與親和力珠子附接的雙股DNA片段移除未藉著生 物素铺菌抗生物素蛋白交互作用與親和力珠子附接的單 股。 響 A步驟產生了與鏈黴菌抗生物素蛋白親和力珠子結合 的單股DNA ; 第2部分: P)分離並純化基因組DNA,例如從步驟a)之生物; q) 片段化該基因組DNA ; r) 可視需要拋光該基因組dnA ; s) 使該基因組DNA與一個單一類型的連接物或與兩個 不同類型的連接物(較佳)連接; t) 將該基因組DNA解鏈成單股DNa 19 200948969 第3部分: u)使得自步D之基因,组驗與得自 的cDNA雜交; V)藉著洗滌移除未結合的基因組DNA ; 雙股=著聚合酶延伸eDNA·基因組爾雜交產物以創造 X)對該基因組DNA_cDNA雜交產物進行pcR; ❹ y)藉者尺寸分級分離,從該PCR中挑選超過大約剛 個驗基對的片段; Z)可視需要純化該片段 第4部分: ㈣使用在步驟Z)中獲得的,根據製造商高通量定 序。 此外,當業已測定基因組DNA之序列時,可跟著進行 一步驟以鑑認在二或多個樣本之序列中的改變:ab)比較二 或多個樣本的數據,以鑑認多形性。 藉著以此方式處理樣本核酸,有可能在沒有任何關於 〇 生物基因組之結構或内容物的資訊下,可再現地分析該生 物的基因組區(涵蓋基因編碼和關連區)。當定序方案允許連 接物帶有鍟認子時,可在單一的定序反應中混合多個樣本。 該方法始於從生物分離並純化mRNA之樣本。以此方 式獲得mRNA的樣本是現今的例行程序。 同樣地,對下一個步驟,其中_藉著酵素逆轉錄酶的幫 助-DNA副本(即cDNA)係從在樣本中的RNA來製造。該 20 200948969 CDNA包括爾從其中衍生之細胞的轉錄譜,代表在取得 樣本時已經轉錄的全部遺傳資訊。因此,依據該細胞的類 型、從其中該細胞被衍生的組織、該細胞的年齡、該細胞 之發育階段和環境條件,相同生物每個細胞的轉錄譜都會 疋不冋的,且甚至來自相同的細胞’當在不同時間及/或不 同條件下採樣時,會獲得不同的轉錄譜。在原始樣本中的
核酸通常會是mRNA之形m,衍生自其他來源的RNA ❹ ❹ 或DNA亦可能是有用的,如衍生自基因庫的舰或職。 在樣本中的核酸可為雙股、單股的,並將雙股DNA變性成 為單股魏。樣本可來自任何生物’無論是植物、動物、 合成的或人類。應了解若獲得DNA樣本,便不需要逆轉錄 酶反應。 由於樣本(若其衍生自完整細胞mRNA)含有全部的轉 錄譜,有時會想要僅取用它的亞組。這可以數個方式達成·· 一種可能的方式是以eDNA的尺寸區別,例如藉著超高速 離心。該方法的基本原理稱為複雜度簡化。複雜度簡化的 其他選擇為例如選擇豐富或不豐富的轉錄本的雜交方法, 或例如捕捉特定轉錄本以從CDNA分子池移除其等或選擇 其等以用於進一步分析的方法,或例如藉著限制消化創造 cDNA分子池的亞組的像cDNA AFLp的方法。 一旦獲得想要的cDNA樣本,便將cDNA片段化,其可 以酵素或機械方式進行。以至少一個限制核酸内切酶消化 核酸樣本提供-組限制片段。在某些具體態樣中,可使用 二或多個核酸内切酶以獲得限制片段。核酸内切酶可以是 21 200948969 頻繁切割者(3·5個鹼基對的辨識序列,如Msel)或稀疏切割 者(>5個鹼基對的辨識序列,如Ec〇RI) ^在某些較佳的具體 態樣中,稀疏和頻繁切割者之組合是較佳的。在某些具體 態樣中,特別是在樣本含有或衍生自相對上較大的基因組 時,使用第二個酵素(稀疏或頻繁切割者)以獲得較大組的具 有較短尺寸之限制片段可能是較佳的。 作為限制核酸内切酶,任何核酸内切酶會足夠。典型 地,第ϋ型核酸内切酶是較佳的,如Ec〇RI、Msd、psu等 ❹ 等。在某些具體態樣中,可使用第Π型核酸内切酶,即其 辨識序列遠離限制位置的核酸内切酶,即像是Aceni 了 Bbv卜 BbvII、Bbsi、㈣、細如、以⑷、_、Bim、㈣、
Bsg 卜 BsmAI、Bsmn、BspMI、Esp3I、—卜 F〇k卜 、
Hga卜 Mb〇II、Mmel' MnII、Sap卜奶犯、Taqji 與 z⑽出。 可藉著剪切cDNA進行機械片段化,纟中剪切的強度 和期間決定了片段化的量。一種這類剪切方法是霧化。霧
’疋j 塑料裝置’其使用壓縮空氣以霧化液體。很 容易其等改裝以用於剪士刀DNA,極為有效並用法簡便 (Surzycki, S. 2000, Basic Methods in Molecular Biology, ΝΥγ SPnnger Verlag)。其等可從不同來源購買(例如
Invitrogen Corporation)。
可視需要藉著尺寸挑選,再廑料斗 、 丹度間化该經片段化之DNA 的複雜度。可藉著以尺寸挑選Η p , ^ 、 丁挑選片奴(例如藉著電泳)獲得視需 要的複雜度簡化。此外,或另外 ^ t 飞乃外可藉著與經鏈黴菌抗生 物素蛋白塗佈的親和力管柱結合而移除聚A片段。 22 200948969 在該方法的下一個步驟中,使cDNA片段具有純端, 亦稱為「拋光」的過程。插人抛光係、用以從限制酵素產生 #>PC:R'產生之DNA片段或經剪切的DNA片段移除3’突 出核芽酸或填滿5, φ φ妨 it J6A -Γ m , 5犬出核苷酸。可貝到拋光用的套組(例 如 QU1Ck 鈍化套組,New England Biolabs Inc.)。
、在本發明方法的下-個步射,透過連接反應提供具 有連接物# cDNA片段。在此反應中將兩個不同類型的連 接物連㈣eDNA片段的混合物。—個連接物帶有生物素 標記。另-個連接物含有第立型限制酵素的限制位置,該 限制酵素t切其辨識序列外面的位置。該酵素之實例是 SaPI,㈣識GCTCTTC麗應相。輯素$切序 列’在5’端留下NNN突出物。以此方式可自該片段移除 含有限制辨識序列的完整連接物序列。报重要,應使用為 稀疏切割者的酵素以避免因為在片段_中較頻繁地出現 辨識序列而縮短該片段。 再次,在此階段,可視需要依據片段的尺寸藉著例如 電泳選擇其等。 在連接連接物和片段之後,修補該片段之缺口,以填 滿在DNA主鍵中任何可能因連接物之連接而產生的間隙。、 可如在由M· Margulies等人在Nature 437,第376_3的 頁,2005發表之附圖!中(圖3)所描述者,選擇僅含有兩種 連接物的片段。然後可擴增含有兩種連接物的片段。在該 步驟中U用與互補連接物序列之一煉合的引子組合攜帶 生物素分子(其與另一個互補連接物序列煉合)的引子D,進行 23 200948969 PCR擴增反應。在使用這組引子進行擴增步驟之後,可在 - 鍵徽涵抗生物素蛋白親和力珠子上捕捉經擴增之雙股Dna 片段,同時從該反應混合物移除其他的反應產物。 在下一個步驟中,以不對稱的核酸内切酶處理在其等 5 ’和3 ’端具有不同連接物序列的經結合dnA月段,該酵 素以從片段一端移除完整連接物序列的方式剪切該片段, 如同猶早所描述的,因此提供了與基因組DNA完美互補的 一偭片段末端。在該限制步驟之後,藉著在鹼性條件下從 珠子中沖提而移除自由單股形式的片段,產生了一組與鏈 ❹ 黴菌抗生物素蛋白珠子結合的單股核酸片段。另一種從雙 股片段中產生單股片段的方法是利用λ外切核酸酶酵素處 理。λ外切核酸酶從雙股DNA分子中降解具有經磷酸化5, 末端者,留下完整的具有5’ 〇Η末端的單股。因為片段的 · 5 ’端之一是藉著與鏈黴菌抗生物素蛋白結合的生物素標 記保護’故以λ外切核酸酶處理亦產生與鏈黴菌抗生物素 蛋白珠子結合的單股DNA片段。這些單股DNA片段會在 之後的步驟中使用。 〇 在上述步驟之後,在第二部分中從生物分離基因組 DNA。β亥生物可以是與從其中被分離者相同的(在相 同或不同的條件下培養),或其可以是不同的生物(不同品 系 '不同物種)’且其甚至可以是基因組DNA的聚集(例如 BAC殖系庫)。分離基因組DNA的程序在該領域中是標準 的,並在例如以下者中描述:Ausubel等人(從植物組織中 製備基因組 DNA(Preparation of genomic DNA from plant 24 200948969 ⑴獄).第2.3.】.2.3.7頁,在細⑽等人,編輯分子生 物干的最新方案(curreiu Proi〇c〇Js in M〇lecular 肠⑽乂) J〇hn Wl〗ey & Sons,he. BudeHer. 1993)。在分離之後,按 照上述,藉著酵素或機械片段化程序片段化該基因組 DNA。若使用限制酵素消化,所得之片段係以具有與在該 月段末端之不同限制位置突出物相配的連接物而提供。與 基因組DNA片段附接的連接物分子具有與第^部分之經 cDNA衍生片段附接的連接物分子不同的序列。 若使用機械片段化,將不同的連接物連接到基因組 DNA片段’並根據先前對於cDNA片段描述的程序⑽如可 應用搬光步驟)選擇在5’和3’末端具有不同連接物的片 段。 或者,也可將一個單一的連接物連接至該基因組片 段。在那個情況下’帶有銷柄的連接物序列可用以防止在 之後步驟中的非專一性擴增(D H J〇nes和s c如, PCR Methods Appl. 1993 2:197-203)。 可視需要按照上述以尺寸挑選經片段化之基因組dna 片段。 為獲得單股基因組DNA片段,提供解鏈步驟。 在如此提供經片段化基因組單股DNA的適當樣本之 後’將得自第i部分的單股cDNA片段(其攜帶具有生物素 標記之單一連接物分子,該生物素標記可視需要與鏈黴菌 抗生物素蛋白親和力珠子結合)混合,較佳以莫耳過量,以 與帶有不同連接物分子之經片段化基因組dna(第3部分) 25 200948969
雜交。在變性步驟之後, 物雙股基因組DNA-eDNA 應用煉合條件以允許形成雜交產 分子。 细箱2程序可包㈣用未Μ段化GDNA(無連接物)的短 '口^藉著降低衍生自豐富轉錄本之較高濃度CD· 又的景少響,仏準化雜交反應。作為可視需要之修改, Cot 1 DNA可用在預煉合步驟中,以降低因在基因組ο· 中之序列重覆所引起的可能異常。
在該步驟中,CDNA片段會在與所採樣之mRNA同源或 相同的地方,煉合基因組dna。 在藉著聚合酶延伸eDNA_基因組舰雜交產物之後 製造出雙股模板。 現在可藉著PCR反應,使用一個與cDNA連接物互補 的引子和另一個與基因组dna連接物之一互補的引子,而 擴增經煉合之雙股片段。可視f要將經煉合之材料分成不 同的兩份,以亦使用cDNA連接物和另一個與基因组DNA 連接物互補的引子。該擴增提供了 PCR片段,其不僅含有 原始採樣核酸之基因組DNA相對應部分的副本,還含有未 經轉錄之序列,如調節序列和内含子。 在PCR擴增之後,透過尺寸分級分離選出具有超過_ 個鹼基對的片段,較佳的是超過大約2〇〇個鹼基對,甚至 佳的是超過大約300個鹼基對,且最佳的是大約4〇〇個鹼 基對或更多的片段。可視需要,根據符合本發明方法下一 個步驟的需求’純化這些片段。 在下一個部分中(第4部分)定序該片段。經擴增之經連 26 200948969 接連接物片段的定序,至少對經連接連接物之片段和位在 3側之基因組序列的部分提供了序列資訊。在經連接物衍 生之部分中所含有的資訊,包含有關從其中獲得該片段之 樣本的資訊(若連接物帶有樣本專一性標籤),而得自該片段 本身(鑑認子序列)的序列資訊則提供了有關該片段的資
訊,並允許鑑認該片段。此在片段上之序列資訊可用以鑑 涊片段,而其準確性視經測定之核苷酸的數目和在經擴增 之經連接連接物片段組中的片段數目而定。 為對在樣本之間在轉錄本頻率上的採樣變異的問題 (其影響藉著定序一組多個片段所含者而鑑認分子標記的 準確性)提供解決,本發明之發明人已經發現經由定序來 偵測標記,較佳的是充分過剩地(深度)採樣所有的片段至少 一次,並伴隨著解決有關所唤起之基因型準確性的採樣變 異的問題的統計方法來進行。為了增加準確性,較佳的是 擴增步驟進行定序步驟。在㈣的擴增循環之後,㈣增 經連接連接物之限制片段的過剩至少$ 6,較佳的是至少 7’更佳岐至少8,且最佳的是至少9。因此,在較佳的 具體態樣中,測定每個經連接連接物之限制片段的序列至 少6倍,較佳的是至少7倍,更佳的是至少8倍,且最佳 的是至少9倍。在某些具體態樣中,選擇過剩(假定整體 有50/50機會正確地鏗認位點為同形合子的)以使正確鐘認 位點的機會超過95%、96%、97%、98%、99%、%作。 經連接連接物之限制片段的擴增導致一組。 連接連接物的限制片段,有時稱之為擴增區(ampn叫、。 27 200948969 使擴增區(或其至少一部分)接受至少包括測定樣本專一鑑 - 認子之序列的步驟,以測定該片段和該限制片段之序列之 部分的起源。實際上此亦等於測定位在像是限制核酸内切 酶之辨識序列的殘餘部分之間的部分。藉著定序樣本專一 性鑑認子以及位置與經連接物衍生之序列相鄰的部分片 - 段,有可能獨特地鑑認出限制片段及其等3,侧基因組序 列。從該資訊中有可能恢復完整基因的基因組遺傳資訊。 在本發明中使用的高通量定序是一種用於科學實驗 (尤其是有關於生物學和化學領域)的方法。 ❹ 較佳的是’使用高通量定序法進行定序,如在以下者 中所揭示:WO 03/004690、W0 03/054142、w〇 2004/069849、W0 2004/070005 ' WO 2004/070007、與 WO ' 2005/003375 (全部以 454 Life Sciences 之名義)、以〇 等人-(2004) Proc. Natl. Acad. Sci USA 1〇1:5488 93,以及
Helios、Solexa、US Genomics、等等的技術,其等係以引 用方式納入本文中。 所描述之技術允許在單一行程中定序4千萬個鹼基, 〇 並比競爭性技術快且便宜100倍。定序技術大略由5個步 驟,.且成.1)片/又化DNA並連接專一連接物,以創造單股 DNA(ssDNA)庫,2)煉合ssDNA與珠子,在油包水微型反應 器中乳化珠子,並進行乳劑PCR以擴增在珠子上個別的 ssDNA刀子,3)挑選或富集在其表面上含有經擴增ssDNA 分子的珠子,4)使攜帶DNA的珠子沉降在pic〇Titer™盤 中,並5)藉著產生焦磷酸根光信號,在1〇〇,〇〇〇個槽孔中同 28 200948969 時定序。在下文中會更詳細地解釋該方法。 在此一方面,下列的計算可作為例證:如同在本文其 .他地方描述的Hina Solexa之定序技術,對大約每25bp 提供4〇.000.000次判讀,在單一行程中總計交錯10億bp。 假定知樣過剩1〇倍,可在—個行程中評估4.麵謂個獨 特的片&。結合100個樣本,允許對每個樣本定彳4〇 〇⑽ 個片段。 I較佳的具體態樣中,定序包括下列步驟:⑷將經修 改之片U合至珠子’每個珠子煉合_個經修改之片段;⑻ 在油包水微型反應器中乳化珠子,每個油包水微型反應器 包括—個珠子;⑷將珠子裝㈣槽孔中,每個槽孔包括-• 個珠子;並產生焦磷酸根信號。 在第一個步驟⑷中,將定序連接物連接到組合庫内的 片段。該定序連接物包括至少—個用以煉合珠子的「關鍵」 區、定序引子區和PCR引子區。如此,獲得經修改之片段。 〇在第-個步財,冑經修改之片段煉合到珠子,每個珠子 與-個經修改片段煉合。在經修改之片段池中加入過量的 珠子,以確保對於大多數的珠子而言,每個珠子煉合一個 經修改片段(帕松(Poisson)分布)。在下一個步驟中,在油包 水微型反應器中乳化珠子,每個油包水微型反應器包括一 個料。存在油包水微型反應器中的pcR試劑允許在微型 反應器中發生PCR反應。隨後,打破微型反應器,並富集 包含DNA的珠子(DNA陽性珠子)。 在接下來的步驟中,將珠子裝栽到槽孔中,每槽孔包 29 200948969 括一個珠子。較佳的是該槽孔為允許同時定序大量片段之 PicoTiter™盤的一部分。在加入攜帶酵素的珠子之後,使用 焦定序(pyrosequencing)測定片段的序列。在後續的步驟 中,使PicoTiter™盤以及在其中的珠子和酵素珠子,在習 知定序試劑的存在下接受不同的去氧核醣核苷酸,並記錄 在併入去氧核醣核苷酸後產生的光信號。併入正確的核苷 酸會產生可偵測的焦定序信號。 焦定序本身為在技術領域中已知的,並特別被描述在 www.biotagebio.com ; www.pyrosequencing.com/切片技術 上。該技術被進一步應用在例如以下者:W0 03/004690、 W0 03/054142、W0 2004/069849、WO 2004/070005 ' W0 2004/070007、與 W0 2005/003 3 75 (全部以 454 Life Sciences 之名義)。在本發明中,珠子較佳裝有能夠結合擴增區的引 子(結合)序列或其一部分,視情況而定。在其他的具體態樣 中,擴增時使用的引子(例如在其5’ -端)裝有允許擴增區與 珠子結合的序列,以在定序之後允許後續的乳劑聚合化。 或者,可在連接至珠子或表面之前先將擴增區與定序連接 物連接。經定序之擴增區會揭露鑑認子的身分,並因此揭 露在樣本中有或沒有限制片段。
Illumina-Solexa 技術 一種高通量定序方法可從 Illumina, 英國 (www.illumina.co.uk)獲得,並特別在以下中描述: W00006770、W00027521 ' W00058507、W00123610、 WO0157248 ' WO0157249、W002061127、W003016565、 200948969 WO03048387 、 W02004018497 > W02004018493 、 W02004050915 、W02004076692 、W02005021786 、 . W02005047301 、 W02005065814 、 W02005068656 、 W02005068089與W02005078130。基本上,該方法以基因 組DNA的經連接連接物之片段開始。將經連接連接物之 DN A隨機附接至引子的密坪(dense lawn )上,其附接在固 體表面,典型地在流動槽孔中。經連接連接物之片段的另 一端與在表面上互補的引子雜交。在所謂的固相橋擴增 〇 中,在核苷酸和聚合酶的存在下延伸該引子以提供雙股片 段。該固相橋擴增可以是選擇性擴增。 - 固相橋擴增的變性和重複產生分布在整個表面上的經 擴增片段之緊密叢簇。藉著將四個以不同方式標示之可逆 終止子核苷酸、引子和聚合酶加至流動槽孔中開始定序。 在第一回合的引子延伸之後,偵測該標記,記錄第一次所 併入之鹼基的身分’並阻斷3’末端,然後從經併入之鹼基 移除螢光團。然後以相同之方式測定第二個鹼基的身分, 胃並以相同方式繼續定序。 在本發明中’使經連接連接物之限制片段或擴增區經 由引子結合序列或引子序列與表面結合。根據概述測定該 序列’包括鑑認子序列和限制片段。目前可得的Solexa技 術允許定序大約3 0個鹼基對的片段。藉著連接物和表面結 合引子的聰明設計’定序步驟讀透樣本鑑認子與限制核酸 内切酶所使用之辨識序列的剩餘部分。例如,當使用3bp 的樣本鑑認子並存在稀疏切割者EcoRI的剩餘部分 31 200948969 AACCT)時’可使用7bp之限制片段的内部序列以獨特地 鑑過在樣本中之限制片段。在基於以上nlumina_solex 序技術的較佳具體態樣中,利用在其3,端含有最多一 擇性核《,較佳的是在其3,毅有選擇性核㈣的引 子’即該引子僅與連接物互補㈣引子),進行經連接 物之限制片段的擴增。
在針對本文㈣之定序方法之可供選擇的具體態樣 中,在擴增時使用的引子可含有用在後續之定序步驟中以 使經連接物加帽之限制片段或擴增區與表面結合的特殊部 分(作為本文描述之引子或引子結合序列的另一選擇)。通常 將此部分描述為關鍵區或5’ ·引子可相容的序列。
在本發明之一具體態樣中,核酸樣本係以至少一個限 制酵素消化並連接至少-個連接物(其包括第Η限制核酸 内切酶之辨識序列w遺後利用第π龍制核酸内切酶消化 經連接連接物之限制m以因為在第n型料之辨識和 限制位置之間的距離是相對上較短的(最多大約3〇個核苷 酸)’產生較短和較長的限制片段,而第n型限制位置之可 相容連接物可與其連接。典型地,第π型限制位置的突出 物是未知的,以致於可使用一組連接物,其在突出物中被 簡併。在(選擇性)擴增之後,可定序擴增區。通常可將在此 具體態樣令的連接物序列敘述成:5,_引子結合位置-樣本 鐘認子序列-簡併第Π型黏性末端序列_3’ 。經相關pcR引 子通常如下:引子序列-樣本鑑認子序列_簡併第n型黏性末 端·選擇性核苷酸-3,。然後用以發動藉合成定序的引子 32 200948969 通常具有結構:5,_引;社人〜w 与丨子、、、。π位置_3,。尺寸挑選步驟在以 Π酵素消化之後可能县缸^土 & 此疋較佳的,以移除較小的片段。因為 •在此具體態樣中對於此類型酵素之限制位置的剩餘部分典 ^也疋2 4t>P的等級,此組合6bp樣本鑑認子造成15_17bp 之限制片段的定序中。 ,因此,本發明之方法完全適合在沒有關於該細胞及/或 從其中該細胞破衍生之生物的任何最初之序列資訊或先前 的遺傳知識下,鑑認屬於細胞或生物的轉錄譜之基因的調 節基因組序列。因此,可根據本方法鑑認經表現基因的啟 動子區、前導序列和其他5,UTR區、内含子和外顯子、3, • TR彳列和終止序列。因為不涉及選殖步驟,亦可能測定 在選殖步驟中引起問題的基因之基因組序列,例如對宿主 生物有毒的基因、編碼調節蛋白質的基因及/或否則在選殖 時引起問題的基因。 而且,有可能基於該資訊直接分析與經表現基因之對 ❹偶基因有關的所有多形性(包括SNp),無論這些多形性出現 在基因的編碼序列或在非編碼序列中。因此,可能偵測出 在引起基因表現調節之啟動子序列中的異常,也有可能偵 測出在内含子中有可引起不同的剪接變體的多形性的突變 種,等等。 為了增加對經定序核酸序列和在其中發現之差異的正 確解釋,可對經定序片段或片段重疊群(contig)進行自動 標註。 Π樣地了使用所獲付的序列資訊比較序列與得自e s τ 33 200948969 庫的序列。以此方式可鑑認内含子序列或基因内部的非編 — 碼序列,以及啟動子序列和3,與5,UTR°EST庫可取自 相同生物或取自相關之物種。 在另外的方面中,本發明係關於可進行本發明之方法 的套組。除了擴增套組本身的習知組份(像是dNTP、聚合酶 等等)之外’這類套組可包括一或多種連接物與可視需要的 一或多種與該連接物互補的引子、連接酶、及/或專一剪切 該連接物的限制酵素。而且,套組應該提供使用說明書, 其中有實行本發明之方法的操作指南》 ❹ 此外’本發明發現該方法可應用於鑑認分子標記、定 出基因型、大量隔離分析、基因作圖、標記輔助性回交 (marker-assisted back-crossing)、定量性特性位點的作圖、 連鎖不平衡作圖(linkage disequilibrium mapping)、和測定 甲基化圖形等等上。 實施例 cDNA程序 分離RNA並合成cdna ❹ 依據Chang等人(1993)的方法,從蘋果果實(建志蘋 果 Malus X domestica,cultivar Kanzi))的表皮分離總 RNA。蘋果衍生自4個不同的果園,並在$個不同的時間 點(從2007年8月初到9月底)摘採。將等量的得自此20 個樣本之總RNA集合成一個樣本,並根據製造者的說明 書’以 RNeasy Plus Micro 套組(qIAGEN,Hilden,Ge_ny, 74034)純化,以移除基因組DNA污染。 34 200948969 利用2微克總RNA作為輸入物,根據製造者的說明書 使用 Mint cDNA 合成套組(Evrogen,Moscow, Russia, SK001) . 進行第一股cDNA合成。使用Mint cDNA合成套組最適宜 的1 8次循環,進行藉由PCR擴增的雙股(ds)cDNA合成。 使用(^1人91141^?€1^純化管柱((^1人〇£1^,28104)純化所得的 ds cDNA,並以分光光度計測量濃度。在1 %瓊脂糖凝膠上 分析 cDNA。ds cDNA 範圍從 200 到 2000bp。 cDNA純化、0酸化、序連(concatenation)和霧化 ❿ 使用 Quick BluntingTM 套組(New England Biolabs,
Ipswich, MA, USA, E1201S)鈍化並磷酸化 ds cDNA。將 38 . 微升cDNA(8微克)與5微升lOx鈍化緩衝溶液、5微升ImM 去氧核醋核苦酸溶液混合物(Deoxynucleotide Solution Mix) 和2微升純化酵素混合物(Blunting Enzyme Mix)混合,並在 室溫培養30分鐘,接著在70°C培養1 〇分鐘。 隨後,藉著將48微升此cDNA鈍化混合物與10微升 10xT4 DNA連接酶反應緩衝溶液、5微升T4 DNA連接酶(兩 者均得自 New England Biolabs, M0202S, 400,000 單位 / 毫 升)、25微升40%(重量/體積)聚乙二醇8000和12微升水混 合而將其序連。在室溫培養該連接混合物2小時,並藉著 瓊脂糖凝膠分析證實序連。藉著在65°C培養10分鐘使T4 連接酶失活。 藉著霧化剪切經序連之cDNA。將100微升cDNA連接 混合物與650微升霧化緩衝溶液(10mM Tris-HCl、ImM EDTA、50%甘油,pH8.0)混合,並吸移至霧化器(Invitrogen, 35 200948969
Paisley,UK, K7025-5)内。根據製造者的說明書,以48 psi 使用氮氣 5.0(Praxair,Danbury,CT,USA)進行霧化 15 分
鐘。在短暫離心霧化器之後’將所收集之經霧化cDNA移 至微量離心管,並藉著加入2微升肝糖(sigma_Aldrich,st. Louis,MO, USA,20毫克/毫升,G1767)、〇」份體積的— 乙酸鈉pH5.2和1份體積的異丙醇,並在_8〇〇c培養ι〇分鐘 使其沉澱。藉著以20,800g離心15分鐘,使cDNA形成小 球’以70%乙醇洗滌,乾燥並溶解於5〇微升i〇mM
Tris-HCl、IMm EDTA, ρΗ8·0 中。 測定cDNA尺寸和鈍化 在65°C培養經剪切之cDNA 10分鐘,加入凝膠裝載緩 衝溶液,並將cDNA分配到2%瓊脂糖凝膠(在Tris-醋酸鹽 (TAE)緩衝溶液中)的5個溝槽上(Sambrook等人,1989)。在 電泳之後,使用GenElute凝膠萃取套組(sigma_Aldrich, NA1111) ’從凝膠分離1〇〇_4〇〇bp的cDNA片段。在凝膠上 檢查經純化cDNA的少量樣本’並發現為低濃度。因此, 重複數次上述的cDNA鈍化、磷酸化、序連、霧化和凝膠 純化程序,利用Mint cDNA合成套組,總共獲得24微克 ds cDNA。藉著乙醇沉澱,並溶解於19微升分子生物學-等 級的水中,濃縮100-400bp的cDNA片段。 藉著與得自 Quick Blunting™ 套組(New England
Biolabs,E1201S)的2.5微升l〇x鈍化缓衝溶液、2 5微升 ImM去氧核醣核苷酸溶液混合物和1微升鈍化酵素混合物 混合,並在室溫培養3〇分鐘,接著在7(rc培養i〇分鐘, 200948969 鈍化並磷酸化經剪切 cDNA的磨損端。隨後,使用 MinElute®PCR 純化套組(QIAGEN,28004)純化 cDNA。 連接連接物和修補缺口 藉著煉合部分互補之募核苷酸ELTD-引子-C(5 ’ -AGTCCGTCGCATCGCTCTTC-3 ’ )和 ELTD-AdC2 (5 ’ -GAAGAGCGATGCGACG-3’ ),製備連接物 ELTD-AdC。 該連接物一邊是鈍端,並在另一邊具有4nt(AGTC)的5’ -突起物,以獲得與cDNA連接的方向性,並防止多個連接 ® 物與cDNA連接。ELTD-AdC連接物亦含有稀疏切割者SapI 限制位置:
GCTCTTCN/NNN CGAGAAGNNNN/ 該限制位置能夠在該方案之較晚步驟的期間,從cDNA 移除ELTD-AdC。藉著煉合部分互補之寡核苷酸ELTD-引子 -D(5’ -生物素-TEG-AGTGGGTGTCCTGGGTCAA C-3,)和 ELTD-AdD2(5’ -GTTGACCC AGGAC ACC-3 ’ ),製備連接 物ELTD-AdD。該連接物亦在一邊具有4nt(AGTG)的5’ -突起物,其經由四-乙二醇(TEG)間隔臂以生物素標示。該生 物素標記能夠在該方案之較晚步驟的期間,將cDNA固定 在經鏈黴菌抗生物素蛋白塗佈的珠子上。所有的寡核苷酸 均是從Sigma-Aldrich訂購,為經HPLC純化的,並溶解於 ImM Tris-HCn、O.lmM EDTA,pH8.0 中。藉著混合每個適 當的寡核苷酸(400uM)各50微升與1〇〇微升2x煉合緩衝溶 液(20mM Tris-HCl、l〇〇mM NaCl、2mM EDTA,ρΗ7·6), 37 200948969 在 95 °C 在加熱塊(thermoblock) (Thermomixer Compact, Eppendrof,Hamburg,Germany)中培養該混合物5分鐘,然 後關掉加熱塊,允許樣本内部慢慢地冷卻至30°C以下(花費 3小時),製備連接物。這產生1 OOuM濃度的雙股連接物 ELTD-AdC 和 ELTD-AdD。 在下列的反應中將兩個連接物連接到cDNA : 9.2微升 得自MinElute純化管柱的cDNA、1.25微升水、0.4微升連 揍物 ELTD-AdC(lOOuM)、0.4 微升連接物 ELTD-AdD (100uM)、12.5微升2xQuick連接反應缓衝溶液和1.25微升 Quick T4 DNA 連接酶(Quick Ligation™ 套組,New England Biolabs, M2200S)。在25°C培養該連接混合物20分鐘,並 使用 GenElute P'CR Clean-Up 套組(Sigma-Aldrich,NA1020) 純化。 在下列的反應中修補經連接連接物之cDNA的缺口 : 47微升得自 GenElute純化管柱的 cDNA、8微升 1 OxThermo Pol 反應缓衝溶液(New England Biolabs)、8 微升 1毫克/毫升BSA、2微升10mM dNTP、1微升8單位/微升 Bst DNA 聚合酶、大片段(New England Biolabs,M0275)和 14微升水。在65°C培養該修補缺口反應30分鐘,並使用 QIAquick PCR純化管柱純化,產生50微升100-400bp的經 連接連接物之cDNA。
擴增經連接連接物之cDNA 在含有下列者的PCR反應中利用高忠實性DNA聚合酶 擴增cDNA : 10微升得自QIAquick PCR純化管柱之cDNA、 200948969 10 微升 5 X Phusion™ HF 緩衝溶液、i 微升 1〇niM dNTP、 2.5 微升 10uM ELTD-引子-C、2·5 微升 lOuM ELTD-引子 -〇、0·5微升2單位/微升Phusion熱啟動DNA聚合酶 (Finnzymes,Espoo, Finland,F-540)和 23.5 微升水。首先, 進行測試以測定最適合CDNA擴增的pcr循環次數。將反 應混合物放在熱循環器中,在98。〇變性3〇秒,隨後接受5 次變性-煉合-延伸循環:在981 5秒,在6(TC 10秒,在 Ο Ο 72°C 15秒。然後從該反應混合物中移出5微升,並保持在 冰上(在5次循環之後的樣本)。使剩下的反應混合物接受再 三次如上的PCR循環,並移出5微升及保持在冰上(在8次 循環之後的樣本)。重複以上循環再5次,直到已經達成總 計23次循環為止。在i 5%瓊脂糖凝膠上分析$、8、1丄、 14、1 7、20和23次循環的5微升樣本。測定出最適宜的循 環次數為17次循環,之後達到高原期,因為更多的循環會 導致在預期尺寸的cDNA上出現拭跡(smear)。為製造更 多cDNA ’如上述製備兩個pcR反應混合物,其分別帶有 1〇微升_Α °將反應混合物放在熱循環H中,在變 性30秒’隨後接受17次變性_煉合_延伸循環··在9代$ 秒,在60。(: 10秒,在饥15秒。接著是在饥$分鐘 的最終延伸步驟。使用QIAquiek pCR純化管柱純化經擴増 之 CDNA,接著使用 GenElute PCR Clean_Up 管柱 (Sigma-Aldrich)以移除引子和可能的引子二聚體。
分離經單股CD-修改之cdnA 接下來’藉著與經鏈黴菌抗生物素蛋白重佈之珠子結 39 200948969 合、洗滌和鹼性沖提,針對在一端攜帶ELTD-Ad-C並在另 一端攜帶ELTD-Ad-D的分子,富集在先前步驟中獲得的 cDNA。在兩端都攜帶ELTD-Ad-C的cDNA分子(從現在起 稱為CC分子)不能與鏈黴菌抗生物素蛋白結合,並從珠子 中被洗掉。在兩端都攜帶ELTD-Ad-D的cDNA分子(從現在 起稱為DD分子)在鹼性沖提期間會繼續與珠子結合,因為 兩股都經生物素基化了。在一端攜帶ELTD-Ad-C且在另一 端攜帶ELTD-Ad-D的cDNA分子(從現在起稱為CD分子) 的經生物素基化的股會繼續與珠子結合,而未經生物素基 化的另一股會藉著以NaOH處理而沖提。 徹底再懸浮經鏈黴菌抗生物素蛋白塗佈的順磁性 Dynabeads® M-270(Invitrogen, 653.05),並將 50 微升(相當 於0.5毫克)珠子移至石夕化之微量離心管(Sigma-Aldrich, T4816)。以 100 微升 lxB&W 緩衝溶液(5mM Tris_HCh0.5mM EDTA、1M NaCl,pH7.5)洗滌珠子三次,依據製造者的說 明書使用 Dynal磁性台架(MPC®-E-1, Invitrogen)分離珠 子。將珠子再懸浮於100微升含有0.02%吐溫(Tween)-20的 2xB&W缓衝溶液中,以降低非專一性結合。接下來,將與 55微升水混合45微升經PCR擴增和純化之cDNA,加至該 珠子懸浮液中。允許cDNA在室溫結合1 5分鐘,並溫和地 旋轉該試管。將該試管放在磁性台架上以分離珠子和上清 液,將後者移到新的試管中。將該溶離份稱為AB(在結合 後),並含有未與珠子結合的cDNA。隨後,如下洗務珠子 小球:以200微升含有0.02%吐溫-20的2xB&W缓衝溶液 40 200948969 洗條一次’以500微升含有0.02。/。吐溫_2〇的2xB&w緩衝 溶液洗滌一次,並以500微升水洗滌兩次。在將珠子再懸 ' 浮於水中第二次之後,將珠子移到新的矽化試管,然後移 到磁鐵上。最後,將珠子再懸浮於250微升新近製備的〇1M NaOH中,並溫和地旋轉試管2_3分鐘。此上清液代表第一 個沖提物。再度將珠子再懸浮於250微升〇.1M Na〇H中, 並溫和地旋轉2-3分鐘,此上清液代表第二個沖提物。將沖 提物分別與1250微升PBI緩衝溶液(QlAquick pcR純化套 © 組)和7·2微升20%醋酸混合,並在QIAquickpci^4化管柱
上純化。再者,在QIAquick PCR純化管柱上純化AB溶離 份。以200微升水洗務剩下的珠子一次,以200微升1 〇mM
Tris-HCl、ImM EDTA ’ pH8.0 洗滌一次,再度以 2〇〇 微升 水洗滌一次,最後再懸浮於5 0微升水中並儲存在4。〇。 在1.5%瓊脂糖凝膝上檢查5微升AB溶離份和兩種鹼 性沖提物。在AB溶離份和第一個鹼性沖提物中找到 cDNA,但在第二個鹼性沖提物中則無,將其拋棄。對1微 升AB溶離份、第一個驗性沖提物和珠子(總體積各5 〇微升) 進行對照組PCR反應。分別與12_5微升REDTaq®ReadyMix TM (Sigma-Aldnch,R2523)、1 微升 1〇uM ELTD_ 引子 _c 或 1微升1 OuM ELTD-引子-D或[1微升丨〇uM ELTD_引子_c和 1微升10uM ELTD-引子-D]和水混合至25微升之總體積。 PCR條件為:在94C 1分鐘,(在94»c 3〇秒,在5〇t 3〇 秒,在72它3〇秒)持續6、9、12和15次循環,在72。(:5 分鐘。將每個反應各5微升裝載到15%瓊脂糖凝膠上。結 41 200948969 果顯示如同預期,在AB溶離份中有比DD和CD-分子更多 的CC分子,因為CC分子不能與珠子結合。在鹼性沖提物 和珠子溶離份中出現:CC<DD<CD。結論如同預期,在鹼 性沖提物中富含CD分子,但仍出現CC且尤其是DD分子, 或許是因為CC的非專一性結合和DD分子對珠子的不完全 結合。將鹼性沖提物(經QIAquick-純化的)稱為富含單股CD 之 cDNA。
擴增富含CD之cDNA 在測試最適宜的PCR條件之後,如下擴增富含單股CD 之cDNA。建立十六個PCR反應,分別含有:0.5微升經 QIAquick管柱純化之上述Dynabeads的第一個驗性沖提 物、10微升5xPhusion™ HF缓衝溶液、1微升1 OmM dNTP、 2.5 微升 10uM ELTD-引子-C、2.5 微升 10uM ELTD-引子 -D、0.5微升2單位/微升Phusion熱啟動DNA聚合酶 (Finnzymes,F-540)和3 3微升水。將該反應混合物放在熱循 環器中,在98°C變性30秒,隨後接受11次變性-煉合-延 伸的循環:在98°C 5秒,在60°C 10秒,在72°C 15秒。 接著是在72°C 5分鐘的最後延伸步驟。使用三個平行的 QIAquick PCR純化管柱純化經擴增之cDNA。在1.2%瓊月旨 糖凝膠上分析經純化的cDNA,並以分光光度計測量濃度。 總共獲得27.5微克富含雙股CD之cDNA。 富含CD之cDNA對Dynabeads的結合 使用5微克得自先前步驟的富含雙股CD之cDNA,與 Dynabeads M-270結合。上文在「分離經單股CD-修改之 200948969 cDNA」之下描述了該程序,並有以下的修改。將27.32微 升的量(相當於5微克)的富含CD之cDNA與水混合,至 . 體積總共1 〇〇微升,並將該混合物加至在100微升含有 0.02%吐溫-20之2xB&W缓衝溶液中的珠子中。在cDNA結 合並以含有0.02%吐溫-20之2xB&W緩衝溶液洗滌和以水 洗蘇之後,以200微升 ΙχΝΕ緩衝溶液4(New England Biolabs)洗滌珠子2次。最後,將與cDNA結合的珠子再懸 浮於100微升1χΝΕ4緩衝溶液中,並移至新的矽化微量離 心試管。
以SapI消化富含CD之cDNA-珠子製劑 . 以SapI消化在珠子上、富含CD之cDNA,以從cDNA 分子移除連接物ELTD-AdC,同時cDNA仍經由經生物素基 化之連接物ELTD-AdD與珠子附接。將五微升Sapl(2單位/ 微升,New England Biolabsm, R0569)加至 cDNA-珠子懸浮 液中,並在37°C培養1.5小時。每10分鐘以1400rpm旋轉 該珠子,以保持其等在該步驟期間為懸浮液。接下來,將 V 珠子放在磁性台架上1分鐘以分離珠子,拋棄上清液並以 500微升含有0.02%吐溫-20之2xB&W緩衝溶液洗滌珠子兩 次,然後以500微升水洗滌兩次。 驗性沖提以製備富含單股CD之cDNA-珠子庫 將珠子小球再懸浮於250微升0.1 M NaOH(新近製備的) 中,並溫和地旋轉試管2-3分鐘。將試管放在磁性台架上1 分鐘,並將上清液(=鹼性沖提物)移至新的試管。將鹼性沖 提物與1250微升PBI缓衝溶液(QIAquick PCR純化套組)和 43 200948969 7.2微升20%醋酸混合,並在QIAquick PCR純化管柱上純 化。以200微升水洗滌剩下的珠子一次,以200微升10mM Tris-HCl、ImM EDTA,ρΗ8·0 洗滌一次,再度以 200 微升 水洗滌一次,最後再懸浮於50微升水中並儲存在4°C。這 是富含單股CD之cDNA-珠子庫,準備好用於與基因組DNA 雜交。 在1.2%瓊脂糖凝膠上分析該經純化之鹼性沖提物,以 及之後來自「富含CD之cDNA對Dynabeads的結合」的結 合溶離份,以及具有已知濃度、得自「擴增經連接連接物 之cDNA」之連續稀釋的雙股cDNA。在AB溶離份中發現 大約2微克的cDNA,並沒有與Dynabeads結合。該驗性沖 提物顯示預期尺寸的拭跡。以分光光度計測量鹼性溶離份 的濃度,並發現已經從珠子中沖提出41 0毫微克的單股 cDNA。在理論上,在富含單股CD之cDNA-珠子庫中應該 有等量的互補cDNA股,假定平均尺寸為300nt,相當於大 約4微微莫耳。
基因組DNA
分離基因組DNA 依據Kobayashi等人(1998)的方案,從建志蘋果葉分離 基因組DNA(gDNA)。在根據Kobayashi等人(199 8)的RNA 酶處理之後,藉著加入三分之二份體積的5M NaCl和兩份 體積之乙醇(p.a.)以高-鹽使gDNA沉澱以移除雜質,接著以 20.000g離心15分鐘,以70%乙醇洗滌小球,乾燥並將小 球溶解於 10mM Tris-HCl、ImM EDTA,pH8_0 中。 200948969
限制酵素消化gDNA 藉著限制酵素消化片段化gDNA,以創造未部分重疊的 - 片段。部分重疊的片段可能干擾在方案中較晚的雜交步 驟,導致雜交片段網狀物。選擇限制消化,使其主要產生 l-3kb 的片段。以 Hindlll/BstYl 並以 EcoRI/BstYI 消化 gDNA,產生兩組不同的片段。藉著加入1 〇微升NE緩衝溶 液 2、3 微升 EcoRI(New England Biolabs,20 單位 /微升, R0101)或 1 微升 HindIII(New England Biolabs,100 單位 / 微 © 升’ 104)和水,直到總體積1〇〇微升,接著在37°C培養 1小時,消化二十微克gDNA。隨後,在每個試管中加入6 . 微升 BstYI(New England Biolabs,10 單位 /微升,R0523), 接著在60°C培養1小時。將經消化之DNA裝入1 %瓊脂糖 凝膠的4條跑道中並分離。從凝膠中切下1到3kb之間的 片段,並使用 GenElute凝膠萃取套組(Sigma-Aldrich, ΝΑΙ 11 1)純化。重複以上的程序一次,以產生足夠的DNA 片段。將 EcoRI/EstYI(EB)和 HindIII/EstYI(HB)基因組片段 w 連接到連接物 ELTD-AdE-Eco、ELTD-AdE-Hind 和 ELTD-AdF-Bst。 gDNA與連接物連接 藉著煉合部分互補之寡核苷酸ELTD-AdE-Ecol (5’ -CTTGTAGGGCACGGGTCGAGAG-3’ )和 ELTD-AdE-Eco2 (5’ -AATTCTCTCGACCCGTGCCCTA-3 ’ ),製備連接物 ELTD-AdE-Eco。該連接物在一邊具有5’ -AATT突出物, 其可與gDNA片段之EcoRI-突出物相容,並在另一邊具有 45 200948969
5’ -CTTG突出物。這些突出物獲得與gDNA連接的方向 性,並防止多個連接物與gDNA連接。藉著煉合部分互補 之寡核苷酸 ELTD-AdE-Hindl (5’ -CTTGTAGGGCACGGGT CGGAGA-3’ )和 ELTD-AdE-Hind2 (5’ -AGCTTCTCCGAC CCGTGCCCTA-3’),製備連接物 ELTD-AdE-Hind。類似 ELTD-AdE-Eco,ELTD-AdE-Hind 連接物在一邊具有 Hindlll-可相容之5’ -AGCT突出物,並在另一邊具有5 ’ -CTTG 突出物。藉著煉合部分互補之寡核苷酸 ELTD-AdF-Bstl (5 ’ -GAATGGCTGGGAGAGTGCTGAG-3’ )和 ELTD-AdF-Bst2 (5’ -GATCCTCAGCACTCTCCC AGCC-3’ ,製備連接物 ELTD-AdF-Bst。類似 ELTD-AdE -Eco, ELTD-AdF-Bst連接物在一邊具有BstYI-可相容之5’ -GATC突出物,並在另一邊具有5’ -GAAT突出物。所有 的寡核苷酸均是從Sigma-Aldrich訂購,為經HPLC純化 的,並溶解於 ImM Tris-HCl ' O.lmM EDTA,ρΗ8·0 中。 藉著將每種適當的寡核苷酸(800uM)各15微升與60微 升 2x 煉合緩衝溶液(20mM Tris-HCl、100mM NaCl、2mM EDTA,pH7.6)和3 0微升水混合,並在95°C在加熱塊中培 養該混合物5分鐘,然後關掉加熱塊允許樣本内部慢慢地 冷卻至30°C以下(花費3小時),以製備連接物。這產生 100uM 濃度的雙股連接物 ELTD-AdE-Eco、ELTD-AdE-Hind 和 ELTD-AdF-Bst 〇 在下列的反應中將連接物 ELTD-AdE-Eco 和 ELTD-AdF-Bst 連接到 EcoRI/BstYI(EB)l-3kb 之 gDNA 片 200948969 段:1.3微克EB片段、0.4微升連接物ELTD-AdE-Eco (lOOuM)、0.4 微升連接物 ELTD-AdF-Est (100uM)、40 微升 • 2xQuick連接反應緩衝溶液、4微升Quick T4 DNA連接酶 (Quick Ligation™ 套組,New England Biolabs,M2200S)和 水,至總體積 80微升。在下列的反應中將連接物 ELTD-AdE-Hind 和 ELTD-AdF-Bst 連接到 Hindlll/BstYI (HB)l-3kb之gDNA片段:1_0微克HB片段、0.4微升連接 物 ELTD-AdE-Hind(lOOuM) 、 0.4 微升連接物 © ELTD-AdF-Est(lOOuM)、40 微升 2xQuick 連接反應緩衝溶 液、4 微升 Quick T4 DNA 連接酶(Quick Ligation™ 套組, . New England Biolabs,M2200S)和水,至總體積 80 微升。在 25°C培養該連接混合物20分鐘,並使用 GenElute PCR Clean-Up 套組(Sigma-Aldrich,NA1020)純化。 修補EB和HB gDNA之缺口和純化之 在下列的反應中修補經連接連接物之gDNA’ s的缺 口 : 40微升得自 GenElute純化管柱的 gDNA、8微升 w lOxThermoPol反應緩衝溶液、8微升1毫克/毫升BSA、2 微升10mM dNTP、3微升8單位/微升Bst DNA聚合酶、大 片段(New England Biolabs, M0275)和 19 微升水。在 65°C 培 養該修補缺口反應30分鐘,並使用GenElute PCR Clean-Up 套組(Sigma-Aldrich, ΝΑ 1020)純化。這產生50微升0.02微 克/微升(ΕΒ)和0.014微克/微升(ΗΒ)的經連接連接物之 gDNA,其準備好用於與富含單股CD之cDNA-珠子庫雜交。 藉著PCR檢查連接物-連接步驟。在PCR反應中,使 47 200948969 用一毫微克經連接連接物並經修補缺口之EB製劑作為模 板,使用引子ELTD-AdE-Ecol或ELTD-AdF-Bstl或兩者之 組合(分別為E、F、EF)。類似地,在PCR反應中,使用經 連接連接物之 HB 製劑作為模板,使用引子 ELTD-AdE-Hindl或ELTD-AdF-Bstl或兩者之組合(分別為 E、F、EF)。關於EB和HB,PCR反應如預期得到在l-3kb 區域中的拭跡。 雜交並擴增所選擇之基因組DNA片段 cDNA-珠子庫與gDNA片段的雜交 首先對螢火蟲蟲螢光素酶(Luc)基因片段測試雜交條 件。簡言之,帶有ELTD-AdC和ELTD-AdD的單股200nt Luc 片段(Luc200),經由ELTD-AdD的生物素標記與Dynabeads M-270結合。使該 Luc-珠子製劑與連接 ELTD-AdE和 -AdF(與非專一性之1400nt對照組DNA月段混合)的1600nt Luc片段雜交。在雜交和洗條之後,藉著驗性處理沖提出與 Luc200探針結合的片段,並藉著PCR擴增該片段。發現在 比非專一性、未雜交之對照組片段高很多的濃度下,沖提 出1600nt的Luc片段。在PCR期間,在這些片段的顯露 之間有24次循環差異(假定100%PCR效力,224= 1·7χ107 倍的富含Lucl600)。對cDNA-珠子庫和gDNA使用相同的 雜交和洗務條件。 上述的EB和HB gDNA製劑係藉著加熱而變性。首先, 在離心真空濃縮器中將13微升EB和12微升HB減少至5 微升。EB的量相當於0.26微克或大約0.2微微莫耳的平均 200948969 2kb片段。HB的量相當於〇17微克或大約〇13微微莫耳的 平均2kb片段。然後在加熱塊中,在95t:使樣本變性5分 - 鐘’並直接放在冰上。 將上述的富含單股CD之cDNA-珠子庫分配到兩個矽 化試管内(各25微升珠子)。以2〇〇微升6xSSC/〇1%sds (預 先加溫至6(TC )洗滌珠子三次,然後再懸浮於1〇〇微升 6XSSC/O.1〇/〇SDS中並保持6(rc。在一個試管中加入卽 gDNA,並在另一個試管中加入HB gDNA。在6CTC培養該 試管4小時並溫和地旋轉。以5〇〇微升預先加溫的 6XSSC/0. P/oSDsaot )快速洗滌珠子兩次,以5〇〇微升在6〇 -°0的6xSSC/0_1%SDS隨旋轉洗滌三次15分鐘,以5〇〇微升 - 在室溫的6xSSC隨旋轉洗滌兩次5分鐘,並以500微升水 快速洗滌一次。 延伸雜交產物並以PCR擴增所選擇之gDNA片段 使用經雜交之gDNA作為模板,使用在珠子上形成之 ❹ cDNA/gDNA雜交產物進行3’ cDNA端的延伸。在最後的 水洗滌步驟之後,將珠子直接再懸浮於77微升水和2〇微 升5xPhusi〇n™ HF緩衝溶液的混合物中’並移至新的矽化 試管。接下來加入:2微升10mM dNTp和i微升2單位/ 微升 Phusion 熱啟動 DNA 聚合酶(Finnzymes,F_54〇)。在 72 °C延伸2分鐘。將珠子保持在〇〇c隔夜。 用於PCR擴增的珠子具有不同的引子組合。利用下列 的引子組擴增與EB gDNA雜交的珠子: l)ELTD-AdE-Ecol 和 ELTD-AdF-Bstl 49 200948969 2)ELTD-AdE-Ecol 3ELTD-AdF-Bstl。 利用下列的引子組擴增與HB gDNA雜交的珠子: 4) ELTD-AdE-Hind3 和 ELTD-AdF-Bstl 5) ELTD-AdE-Hind3 6) ELTD-AdF-Bstl。 ELTD-引子 E-Hind3 具有卞^列的序列:5 ’ -GTAGGGCACGGGTCGGAGAAGC-3’ 。其與 ELTD-AdE-Hindl的大部分相同,並在3’端多3個nt(AGC)以吻合在 經連接連接物和gDNA之間的Hindlll位置,並以在煉合期 間對目標賦予較強的3’端結合。 PCR反應包括1微升EB或HB珠子、10微升5xPhusion ™ HF緩衝溶液、1微升10mM dNTP、2_5微升(10uM)的每 種引子、0.5微升2單位/微升的Phusion熱啟動DNA聚合 酶(Finnzymes, F-540)和水,至終體積50微升。為測定最適 宜的循環次數,將反應混合物分配到五個0.2毫升PCR試 管中(各」0微升),以礦物油覆蓋,放在熱循環器中,在98 °C變性30秒,隨後接受11、14、17、20和23次變性-煉合 -延伸循環:在98°C 5秒,在60°C 10秒,在72°C 2分鐘。 接著是在72°C 5分鐘的最後延伸步驟。在1.2%瓊脂糖凝膠 上分析每個反應各2.5微升。
在利用ELTD-AdE及/或ELTD-AdF引子的PCR反應 中,具有範圍從l-3kb之片段(如對gDNA片段所預期的) 發現拭跡。兩種引子之組合在1 7次循環時便已經得到EB 200948969 和HB樣本的PCR產物。僅利用ELTD-AdE,在23次循環 之後發現產物,而利用ELTD-AdF引子在20次循環之後發 • 現相同強度的產物。這歸因於在基因組中出現比EcoRI-或
Hindlll-位置(GAATTC或AAGCTT)多的BstYI-限制位置(辨 識位置:RGATCY)。 擴增經雜交產物選擇之gDNA以用於高通量定序 利用 HB gDNA 連同弓丨子 ELTD-AdE-Hind3 寺口 ELTD-AdF-Bstl以及20次循環的PCR反應,得到最佳的結果: © 範圍從l-3kb的均一拭跡。製備下列的PCR反應混合物20 倍,以增加足夠供高通量定序之DNA : 1微升HB珠子、10 . 微升 5xPhusion™ HF 緩衝溶液、1 微升 1 OmM dNTP、2,5 微升 ELTD-AdE-Hind3(10uM)、2.5 微升 ELTD-AdF-Bstl (10uM)、0.5微升2單位/微升Phusion熱啟動DNA聚合酶 和水,至終體積50微升。將該反應混合物放在熱循環器中, 在98°C變性30秒,隨後接受變性-煉合-延伸的20次循環: 在98°C 5秒,在60°C 10秒,在72°C 2分鐘。接著是在
® 72°C 5分鐘的最終延伸步驟。使用兩個平行QIAquick PCR 純化管柱,純化該所謂的經雜交產物選擇和經擴增HB gDNA。以分光光度計測量到產量為14·8微克。高通量定序 一部分經雜交產物選擇之HB gDNA。使用另一部分進行選 殖和Sanger定序。 擴增cDNA以用於高通量定序 為增加足夠的富含CD之cDNA以用於高通量定序,製 備20倍下列的PCR反應混合物:0.5微升經QIAquick管柱 51 200948969 純化的在「分離經單股CD-修改之cDNA」之下描述的 Dynabeads之第一個鹼性沖提物、10微升5xPhusionTM HF 緩衝溶液、1微升10mM dNTP、2.5微升10uM ELTD-引子 -C、2.5微升10uM ELTD-引子-D-NB、0.5微升2單位/微升 Phusion 熱啟動 DNA 聚合酶(Finnzymes,F-540)和 33 微升 水。ELTD-引子D-NB具有與ELTD-引子D相同的序列,但 在5 ’端不含生物素標記。將該反應混合物放在熱循環器 中,在98°C變性30秒,隨後接受變性-煉合-延伸的11次 循環:在98°C 5秒,在60°C 10秒,在72°C 15秒。接著 是在72°C 5分鐘的最終延伸步驟。使用四個平行QIAquick PCR純化管柱純化經擴增之cDNA。在1.2%瓊脂糖凝膠上 分析經純化之cDNA,並以分光光度計測量濃度。獲得總共 29微克富含雙股CD之cDNA。高通量定序該cDNA。 經捕捉之基因組DNA分子的序列分析 在以cDNA珠子捕捉基因組DNA之後,使用帶有 cDNA-gDNA雜交產物的珠子進行PCR擴增,其使用基因組 DNA 專一性引子組 ELTD-AdE-Hind3 和 ELTD-AdF-Bstl。 選殖一部分基因組DNA,並交付800個殖系進行Sanger定 序(平均讀值長度781bp)。使另一部分的基因組DNA接受 高通量定序技術,產生具有平均長度337bp的序列讀值。 詳細地分析由Έ00個個別Sanger序列和1 370個高通量 序列讀值組成的兩個序列數據組,並與在公開的數據庫中 所有可得之蘋果EST (NCBI,在2009年3月 9日登記 262.41 1)相比較。使用程式 BLASTN(S.F. Altschul 等人 52 200948969
NAR 25:3389-3402, 1997)進行基因組DNA序列與蘋果EST 序列的全面排比。 • 從8〇〇個Sanger序列,488個顯示與得自在公開資料 庫中之蘋果EST收集的序列和得自1 37〇個基因組dna序 列之隨機組的序列有顯著的類似性(e值i 〇-ιο),765個展現 出明顯的類似性(e值1〇 10),顯示與cDNA相關性基因組 DNA的專一性捕捉是成功的。此外,這些基因組序列 的局部排比顯示這些序列經常從5’或3’ CDNA邊界或内 ❹含子區延伸,顯示該技術能夠鑑認非編碼區域。若考慮已 經僅從一邊定序片段,片段的尺寸在1Kb到3Kb之間變化, -且超過5〇%的序列與EST序列有可鑑認的類似性,似乎很 明顯如果在與公開EST序列數據排比之前已經完全定序片 段並建造入片段重疊群,會發現高很多百分比的序列吻合。 因為蘋果基因組之尺寸大約為75〇Mb且在植物基因組 中的基因數目為大約3G_而平均長度15曝p在基因組上 藝產生4 5 M b的編碼序列,這意味著藉著隨機定序僅能夠標註 6%的基因組片段’而利用所描述之方法吾人發現超過別% 的標註。 從以上的實施例描述跨越EST邊界之基因組DNA片段 的三個案例。 實施例的三個案例之說明 在圖4以及下文的序列排比中,出示利用本發明之 法發現的三個顏果基因組序列之案例。 案例1. 53 200948969 蘋果基因組序列FRA8S6E02IN5QW與從7個EST序列 (GenBank 登錄編號:C0899363 ' C0419003、CO052855、 C0752637、CO901846、CN927506 和 CO066317)建造之蘋 果片段重疊群〇§89845〖_846_7的一部分顯示98.9%同一性。 命中擬南芥(Arabidopsis thaliana )的片段重疊群 cg8984st_846_7 的最佳 BLASTX (S.F. Altschul 等人 NAR 25:3389-3402, 1997)為基因AT 1G70160(基因組位點標籤, 擬南芥資訊來源(The Arabidopsis Information Resource), http://www.arabidopsis.org),具有 e-值 2e·104。三個序列排 比顯示FRA8S6E02IN5QW含有具有未知功能之蛋白質的一 部分蛋白質編碼序列(CDS),其與片段重疊群 cg8984st_846_7部份重疊。在圖4,圖A中圖解出示該序列, 並在下面出示此序列之相關部分的序列排比。 FRA8S6E02IN5QW的蛋白質編碼序列亦與AT1G70160有 77.8%相同,但在序列之5’ ·端與在AT 1G70160中之内含 子相同位置的被内含子打斷(圊4,圖A和序列排比)。在該 區域中在FRA8S6E02IN5QW和AT1G70160之間的同一性 很低,為37.5%。在AT 1G70160中,内含子比在蘋果中者 更小(在序列排比中以粗體字指出此一内含子的5 ’ -邊 界)。在FRA8S6E02IN5QW中,在内含子序列的所有三個讀 框中都有終止密碼子,且 BLAST 搜尋指出 FRA8S6E02IN5QW的CDS是與其他植物物種之類似蛋白質 同源的,但在内含子區中卻喪失了該同源性。這表示 FRA8S6E02IN5QW確實是基因組序列,含有打斷性内含子 54 200948969 序列。此外,此處保守性低很多的内含子序列表示内含子 序列含有比外顯子多的SNP。 案例2 蘋果基因組殖系FRA8SE02HOH39對從21個EST序列 (GenBank 登錄編號:CN930585、CV525017、CN873920、 EB149394、EB121634、EB116211、CN909797、EB1 15871、 EB154300、 CN877800、 EB121026、 CN932122、 CN860924 、 EB1 10988、C0865849、CN488473、CN497072、CN90391 8、 〇 CN903 403、DR996731與CN8943 3 0)建造之蘋果片段重疊群 cgl2357st_1428_21 顯示同源性。片段重疊群 . cgl2357st_1428_21含有對ATP-依賴性Clp蛋白酶蛋白水解 次單元(最佳的BLASTX命中 EEF49880,蓖麻(Ricinus communis),分數3e·128)具有類似性的蛋白質的完整編碼序 列。 FRA8SE02HOH39 與 cgl2357st_1428_21 的 3’ -未經轉 譯區部份重疊,並延伸越過聚A尾進入未經轉錄之基因組 DNA内,如同在圖4,圖B和下文的序排比列中所示。 因此,FRA8SE02HOH39是含有經轉錄區3’ -側序列之 基因組序列的實例。 案例3 蘋果基因組序列02-H03與40個蘋果EST之5’ -部分 部份重疊,對乙烯反應因子具有類似性(最佳的BLASTX命 中 AAV66332,胡瓜(Cucumis sativus),分數 6e-34)。在圖 4, 圖C中對EST91044950圖解顯示此(GenBank登錄編號: 55 200948969 EB 155368)。其他的EST具有類似的5’端。在下文中出示 序列之相關部分的排比。基因組序列自基因之轉譯起始密 碼子(ATG)上游744bp延伸。對在02-H03中編碼區外面的 任何基因,沒有發現序列類似性,證實這是基因組序列。 在轉錄起始上游的保守性序列,為TATA匣。在EST之起 始上游39bp處發現推定的TATA-匣(TATAAA)。 參考文獻
Chang,S.,Puryear,J.與 Cairney J. 1993. A simple and efficient method for isolating RNA from pine trees. Plant Mol. Biol. Rep. 11: 113-116。
Kobayashi, N., Horikoshi, T., Katsuyama, H., Handa, T. 與 Takayanagi,K. 1998. A simple and efficient DNA extraction method for plants, especially woody plants. Plant Tissue Culture and Biotechnology 4: 76-80 o
Sambrook,J.,Fritsch, E.F.與 Maniatis T. 1989.
Molecular cloning. A laboratory manual. Second edition. Cold Spring Harbor Laboratory Press. USA。
FRA8S6E02IN5QW
TATGTTGTGATAACCATATGGCTTCCCTGACATGCTC
TGAACATACTCCCATGCTGCAGTAGAGTTGAATTTTGCA
CGCACCTCTGGATGCAAGGGAAGCAAGGCTATTTGTGGA
TTAGAACTATCCTTGAGTGTCAACTCCCACCACTCATCCC
ATGGAATCACCGCTATAATTTCTTCACCCTGCAATATTAA 56 200948969
ATTATTAATAAATGTAAAAATCAACCAAAAAGAAAAGA ACTAACCACAATAAACTCTACAAAAAAGAAAAGAACTA . AAGCAAAGTTTAAAATAATTAAGAAATCTGTGCAAGATT
GTCATATATTTAATTTTGTCCCTAAACAAACGCTCATCAT ATGTTCATCACTACAATCCTGATTCAACTATTATTCCACT AAAGGCAAAGAACCAAAACATTTAGCTTAATTTCTATTC CTAATAAATCCCAAANACATGAAATGAGTTGCTTGCATA AGCATATACTCAATTGAAAAT ❹ FRA8S6E02HOH39
. CAGCGACCTGTTTACGTGCAAGGTTTGGATGGAAGA
GATTGAACAGTGATGCCAAATTGAATTGCCTCCAGAACA AATCTGAAGGGTGCAAAAAACATGTACTTTTTGAGAGTT GAAGAATGACGACACTTTCTTATGTTCTATATTATCTTGG TTAAGTTTTTTGCAGGACGGAATGAATCCTCGTCTTTTTT TTCCCTATCAAAAAGAAGAAAGCTGAGTTTTTATGTTTG w ATGTCTTGATGATGGATGACCTAGTGTTCAAGTGAAAAA TTCGACGGACAAAACGCTTGGCAATCCAATTTGTGCCGT GTATAATGTGTCACGTCCAAACGAGTTTCACATCGAAGA AA 02_H03
TGTTATTGTTTCATTGAAACATAACGTTACATAACA
ATATAGGNNNCATTTGGAACAACTTTTAAAATGGCTGAA 57 200948969
AACGCATTTTGTGAAAATGATTTTTAAACAGTTTTGAGTA
AAAATACAATGAATCATAGAAAAGTACTTGAAATGCTTT
CTACAAATAGCATATAACTAGTGCTTATTTCAAAAAATA
TTNNNAAAACATAAACAAAATTCTCTAAAAATATTTACG
GTCATTGTAAAATCATTTTCAAACGTGATTATAATCAGG
CTATGTAAAATATTCTTTAATATTGACTCAACAATAAAC
GGCGAATCGAAACGATACACGGAGTGGAGCGTGGGAGA
TGGGAGGAAAGGATCACCGCACGCAATCAAAGAGTGCA
TTCGCAGCCGTCAGATGATGATAAAAATGATGGGTGTGC
TCTCTCGACAACGCACACATGCCACGTAATACGGAAACG
AACATTGCACAATTACTAAATTGCCACCGATGGAGAGCC
GCCCCTCCCTAATCCCATCTCAGTCAAATCCCTTGTTGAC
TGTGCGCCTCTCTCTCTCTCTCTCTCTCTCTCCTCTCTCTT
TCTCTCTCTTCAATTCCTCGCTCATCATTTCTATATAAAA
CCCACAGCCTGCCTCCTAGTCCTCCATCGCCATCTCCACA
CCCGTTTCTCTCACATATTTTCTGCAGCCAAACACTCTTT
CCACCCAAACACTACATACACAAAACGCCACCGTTTAGT
TATGGCGCCGAGAGAGAAGACGGCCACCGCCGCCGTTAG
GATGAACGGTAACGGAAACGTGAAGGAGGTGCATTTTAG
AGGTGTGAGGAAGAGGCCGTGGGGGAGGTACGCCGCCG
AGATCAGA 200948969 【圖式簡單說明】 圖1 ·從mRNA創造小型單股DNA分子的圖解說明。C 為連接物,D為不同的連接物’B為生物素,p為磷酸鹽基 團’ bp為鹼基對,ds為雙股,ss為單股,re為限制酵素, SA為鏈黴菌抗生物素蛋白,LD-PCR為長距離PCR,NAB(30) 和 NVTpo)為根據國際生物化學聯盟命名委員會 (Nomenclature Committee of the International Union of Biochemistry,NC-IUB)對於核苷酸之句法規則的核苦酸之 單字母碼’ Apo)和τ(3())分別代表具有30個A和30個T的 Ο 延伸。 圖2.創造基因組DNA片段以及後續與來自mRNA之小 型單股DN A分子(圖1)雜交的圖解說明。在數個步驟之後, 獲得可使用高通量定序方法定序的DNA片段。C和D為連 接物,亦在圖1中敘述。E和F為不同的連接物,b為生物 素,bp為驗基對,ds為雙股,ss為單股,且SA為鏈黴菌 抗生物素蛋白。 圖3 ·將未經鱗酸化之a和B連接物連接到經構酸化、 〇 經拋光之雙股基因組DNA片段的末端。A和B連接物核苷 酸序列和在B連接物上出現5’生物素標籤兩者方面有差 異。缺口出現在每個連接物的3’ -接合處且將片段藉著Bst DNA聚合酶的股_置換活性填滿。使用鏈黴菌抗生物素蛋白 -生物素交互作用以移除被同形合子連接物組(A/A和B/b) 包圍的片段,並以產生單股的庫模板。使片段與鏈黴菌抗 生物素蛋白珠子結合;洗掉未結合的材料(由同形合子a/a 62 200948969 J 連接物組構成,其缺乏生物素)。然後將經固定之片段變性; 透過經生物素基化之B連接物使B/B片段的兩股仍保持固 定’同時洗出A/B片段,並用在後續的步驟中。 圖4.ELGD計晝案例 1和2和3(powerpoint檔案)。圖 A.案例1.蘋果基因組序列FRA8S6E02IN5QW、蘋果EST片 段重疊群(contig) Cg8984st—846—7和***芥基因 AT1G70160(沒有畫刻度)排比的圖解說明。僅顯示 AT1G70160 的相關 3’ -部分。在 FRA8S6E02IN5QW 和 ❿ AT1G70160中,以白框代表内含子。在cg8984st一846一7中, 以細線顯示經剪接的内含子。以黑色顯示蛋白質編碼序列 (CDS)。以灰色顯示3,_未經轉譯區。以…#表示在 序列中的聚A尾。圖B.案例2·蘋果基因組序列 FRA8SE〇2HOH39和蘋果膽片段重養群 cgl2357st一 1428_21(沒有晝刻度)排比的圖解說明。以黑色顯 示蛋白質編碼序列(CDS)。以灰色顯示5, ·和3, ·未經轉譯 區。以⑷η表示在cDNA序列中的聚A尾。囷c.案例3.頻 果基因組序列02_H〇3和頻果EST 91〇4459〇(沒有畫刻度)排 ,的圖解說明。以黑色顯示蛋白f編碼序列仰〜以灰色 ^ 3 _未經轉譯區。以白色顯示在基因組序列中 之未經轉錄的啟動子區。 【主要元件符號說明】 無 63

Claims (1)

  1. 200948969 , 七、申請專利範圍·· 1.一種鑑認在樣本中之基因組DNA的方法,其包括 -從所選擇之生物分離mRNA’並從該mRNA製備小型 . 單股cDNA片段,其帶有一個含有親和力標記之連接物; ' -從相同或相關之生物分離基因、组DNA,隸該基因组 DNA製備與連接物分子連接的單股基因組dna片段; -使該單股基因組DNA片段與該單股cDNA片段雜交, 並擴增該雜交產物;以及 φ -高通量定序該雜交產物。 2.如申請專利範圍第!項之方法,其包括下列步驟: a) 從生物之組織樣本分離並純化; b) 使用該mRNA作為模板,合成cDNA ; c) 可視需要簡化該cDNA的複雜度; d) 片段化該cDNA ; e) 可視需要以尺寸挑選該片段; 〇可視需要藉著與經鏈黴菌抗生物素蛋白塗佈之親和 〇 力珠子結合’移除含有聚A的片段; g)拋光該cDNA片段; )使該片&與一個包括罕見限制酵素之辨識位置的連 接物和另一個含有生物素標記的連接物連接; 〇可視需要以尺寸挑選該月段; j) 修補該片段之缺口; k) 選擇含有兩種連接物序列的該片段; D使用與在步驟h中描述之連接物序列煉合的引子擴增 200948969 該片段,其中一個引子與具有罕見限制位置之連接物互 補’而另一個引子則含有生物素標記; m)使該片段與經鏈黴菌抗生物素蛋白塗佈的親和力珠 子結合; η)使用相對應限制酵素,從該片段移除含有罕見限制位 置之連接物; 〇)從經由生物素-鏈黴菌抗生物素蛋白交互作用而與親 和力珠子附接的雙股DNA片段移除並未藉著生物素_鏈黴 菌抗生物素蛋白交互作用與親和力珠子附接的單股產生 與鏈黴菌抗生物素蛋白親和力珠子結合的單股Dna ; P)分離並純化基因組DNA,例如從步驟&的生物; q) 片段化該基因組DNA ; r) 可視需要拋光該基因組dna ; s) 使該基因組DNA與—個單—類型的連接物或與兩個 不同類型的連接物(較佳)連接; t) 將該基因組DNA解鏈成單股DNA ; u) 使得自步驟t)之基因組DNA與得自步驟〇)在珠子上 的cDNA雜交; v) 藉著洗滌移除未結合的基因組dna ; w) 藉著聚合酶延伸cDNA_基因組職雜交產物以創造 雙股模板; X)對該基因組DNA_cDNA雜交產物進行pcR ; y)藉著尺寸分級分離,從該PCR中挑選超過大約⑽ 個鹼基對的片段;
    ❹ 其中序列係得 以揭露多形位 200948969 * Z)可視需要純化該片段, aa)尚通置定序該片段。 3. —種鑑認多形性的方法,其包括如申請專利範圍之方 法的所有步驟且另外還有以下步驟: ab)比較得自二或多個樣本的序列數據,以鑑認多形性。 4. 如申請專利範圍帛2或3項之方法,其中得自步驟 aa)之序列被合入部分重叠之個別序列的片段重疊群 (contig )申。 5_如申請專利範圍第2_4項中任一項之方法其中得自 步驟ab)之序列或得自申請專利範圍第3項之片段重疊群係 藉由自動標註而標註。 ' 6. 如前述申請專利範圍中任一項之方法,其中序列係得 自屬於-物種之個體,並與可獲得的EST數據比較,以揭 露非編碼^ ’如内含子插人和基因内部的非編碼序列。 7. 如刖述申請專利範圍中任一項之方法,其中序列係得 自屬於相關物種之—或多個個體,並與可獲得的贿數 比較’揭露非編碼序列,如内含子序列和基因内部的非編 8.如則述申睛專利範圍中任一項之方法 自屬於相同物種夕-_V、夕 稷之一或多個個體並被比較 置0 9.如前述申过奎』丨_ m 叫專利範圍中任一項之方法,其中 自來自不同物種夕.^ , 丁斤夕U 禮之—或多個個體並被比較,揭 3 200948969 I 〇.如前述申請專利範圍中任一項之方法,其中序列係 得自來自不同物種之一或多個個體並被比較,以揭露在基 因組DNA中的保守區域。 II ·如前述申請專利範圍中任一項之方法,其中得自步 驟h)之包括罕見限制酵素之辨識位置的連接物包括酵素 SapI的辨識位置。 12.如前述申請專利範圍中任一項之方法,其中核酸的 片段化係藉著霧化。 1 3 . —種進行如申請專利範圍第1或2項之方法的套 組,其包括一或多個連接物和使用說明書、以及可視需要 的一或多個與該連接物互補的引子、連接酶、及/或專一剪 切該連接物的限制酵素、擴增套組本身的習知組份,像 dNTP、和聚合酶。 14.如申請專利範圍第13項之套組,其中該連接物係選 自由以下者所組成之群組: 5’ -AGTCCGTCGCATCGCTCTTC-3’ 5’ -GAAGAGCGATGCGACG-3’ -生物素-TEG-AGTGGGTGTCCTGGGTCAAC-3’ 5’ -GTTGACCCAGGACACC-3’ 5, -CTTGTAGGGCACGGGTCGAGAG-3, -AATTCTCTCGACCCGTGCCCTA-3’ -CTTGTAGGGCACGGGTCGGAGA-3, -AGCTTCTCCGACCCGTGCCCTA-3’ 5’ -GAATGGCTGGGAGAGTGCTGAG-3’ 200948969 5’ -GATCCTCAGCACTCTCCCAGCC-3’ 與 5’ -GTAGGGCACGGGTCGGAGAAGC-3’ 八、圖式: (如次頁)
    5
TW098108563A 2008-03-17 2009-03-17 Expression-linked gene discovery TW200948969A (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
EP08152859 2008-03-17

Publications (1)

Publication Number Publication Date
TW200948969A true TW200948969A (en) 2009-12-01

Family

ID=39472820

Family Applications (1)

Application Number Title Priority Date Filing Date
TW098108563A TW200948969A (en) 2008-03-17 2009-03-17 Expression-linked gene discovery

Country Status (15)

Country Link
US (1) US9695469B2 (zh)
EP (1) EP2268834B1 (zh)
CN (1) CN102027136A (zh)
AR (1) AR070929A1 (zh)
AU (1) AU2009226248B8 (zh)
BR (1) BRPI0908734A2 (zh)
CA (1) CA2718905A1 (zh)
DK (1) DK2268834T3 (zh)
ES (1) ES2528971T3 (zh)
IL (1) IL208237A0 (zh)
NZ (1) NZ588112A (zh)
RU (1) RU2010142289A (zh)
TW (1) TW200948969A (zh)
WO (1) WO2009116863A2 (zh)
ZA (1) ZA201006797B (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2354243A1 (en) * 2010-02-03 2011-08-10 Lexogen GmbH Complexity reduction method
IL302248A (en) * 2011-08-26 2023-06-01 Gen9 Inc Preparations and methods for high-fidelity assembly of nucleic acids
DK2756098T3 (en) 2011-09-16 2018-09-03 Lexogen Gmbh Process for Preparing a Library of Nucleic Acid Molecules
EP3561072A1 (en) * 2012-12-10 2019-10-30 Resolution Bioscience, Inc. Methods for targeted genomic analysis
CN105400864B (zh) * 2014-09-12 2020-04-14 深圳华大基因股份有限公司 用于基于血液样品构建测序文库的方法及其在确定胎儿遗传异常中的用途
US9890375B2 (en) * 2014-09-12 2018-02-13 Bgi Shenzhen Co., Limited Isolated oligonucleotide and use thereof in nucleic acid sequencing
CN106319639B (zh) * 2015-06-17 2018-09-04 深圳华大智造科技有限公司 构建测序文库的方法及设备
ITUA20162640A1 (it) * 2016-04-15 2017-10-15 Menarini Silicon Biosystems Spa Metodo e kit per la generazione di librerie di dna per sequenziamento massivo parallelo
US10487358B2 (en) 2016-09-23 2019-11-26 Grail, Inc. Methods of preparing and analyzing cell-free nucleic acid sequencing libraries
CN112243462A (zh) 2018-06-06 2021-01-19 加利福尼亚大学董事会 产生核酸文库的方法以及用于实践所述方法的组合物和试剂盒
CN110093406A (zh) * 2019-05-27 2019-08-06 新疆农业大学 一种盘羊及其杂交后代遗传基因研究方法
CA3194398A1 (en) * 2020-10-05 2022-04-14 Twist Bioscience Corporation Hybridization methods and reagents
EP4279590A1 (en) * 2022-05-19 2023-11-22 Miltenyi Biotec B.V. & Co. KG Method for generation of a nucleic acid library

Family Cites Families (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
US4800159A (en) 1986-02-07 1989-01-24 Cetus Corporation Process for amplifying, detecting, and/or cloning nucleic acid sequences
AU622426B2 (en) 1987-12-11 1992-04-09 Abbott Laboratories Assay using template-dependent nucleic acid probe reorganization
US5455166A (en) 1991-01-31 1995-10-03 Becton, Dickinson And Company Strand displacement amplification
US5270184A (en) 1991-11-19 1993-12-14 Becton, Dickinson And Company Nucleic acid target generation
US5719028A (en) 1992-12-07 1998-02-17 Third Wave Technologies Inc. Cleavase fragment length polymorphism
SE9400522D0 (sv) 1994-02-16 1994-02-16 Ulf Landegren Method and reagent for detecting specific nucleotide sequences
US5942391A (en) 1994-06-22 1999-08-24 Mount Sinai School Of Medicine Nucleic acid amplification method: ramification-extension amplification method (RAM)
GB0002310D0 (en) 2000-02-01 2000-03-22 Solexa Ltd Polynucleotide sequencing
JP2002521064A (ja) 1998-07-30 2002-07-16 ソレックサ リミテッド アレイ生体分子およびシークエンシングにおけるその使用
JP2002529715A (ja) 1998-11-06 2002-09-10 ソレックサ リミテッド 分子アレイを複製する方法
WO2000058507A1 (en) 1999-03-30 2000-10-05 Solexa Ltd. Polynucleotide sequencing
EP1218543A2 (en) 1999-09-29 2002-07-03 Solexa Ltd. Polynucleotide sequencing
US7166429B2 (en) * 1999-12-29 2007-01-23 Keygene N.V. Method for generating oligonucleotides, in particular for the detection of amplified restriction fragments obtained using AFLP®
GB0002389D0 (en) 2000-02-02 2000-03-22 Solexa Ltd Molecular arrays
AU2001279704B2 (en) 2000-06-30 2005-12-15 Syngenta Participations Ag Method for identification, separation and quantitative measurement of nucleic acid fragments
WO2002034949A2 (en) 2000-10-27 2002-05-02 Molecular Staging Inc. Methods for identifying genes associated with diseases or specific phenotypes
EP1808496B2 (en) 2001-01-30 2021-12-22 Illumina Cambridge Limited Methods of sequencing polynucleotide arrays, and preparation methods therefor
CA2375276A1 (en) * 2001-03-09 2002-09-09 Her Majesty The Queen In Right Of Canada As Represented By The Minister Of Agriculture And Agri-Food Canada Methods to isolate gene coding and flanking dna
US20050009022A1 (en) 2001-07-06 2005-01-13 Weiner Michael P. Method for isolation of independent, parallel chemical micro-reactions using a porous filter
US7297778B2 (en) * 2001-07-25 2007-11-20 Affymetrix, Inc. Complexity management of genomic DNA
GB0119719D0 (en) 2001-08-13 2001-10-03 Solexa Ltd DNA sequence analysis
US6902914B2 (en) 2001-09-28 2005-06-07 Sigma-Aldrich, Co. Recombinant DNA processes using a dNTP mixture containing modified nucleotides
US6902921B2 (en) 2001-10-30 2005-06-07 454 Corporation Sulfurylase-luciferase fusion proteins and thermostable sulfurylase
US7655791B2 (en) 2001-11-13 2010-02-02 Rubicon Genomics, Inc. DNA amplification and sequencing using DNA molecules generated by random fragmentation
US7057026B2 (en) 2001-12-04 2006-06-06 Solexa Limited Labelled nucleotides
EP1530578B1 (en) 2002-08-23 2013-03-13 Illumina Cambridge Limited Modified nucleotides for polynucleotide sequencing
WO2004018493A1 (en) 2002-08-23 2004-03-04 Solexa Limited Labelled nucleotides
ATE462017T1 (de) 2002-12-02 2010-04-15 Illumina Cambridge Ltd Bestimmung der methylierung von nukleinsäuresequenzen
GB0228289D0 (en) * 2002-12-04 2003-01-08 Genome Inst Of Singapore Nat U Method
JP4473878B2 (ja) 2003-01-29 2010-06-02 454 コーポレーション 核酸を増幅および配列決定する方法
GB0304371D0 (en) 2003-02-26 2003-04-02 Solexa Ltd DNA Sequence analysis
US20050042654A1 (en) * 2003-06-27 2005-02-24 Affymetrix, Inc. Genotyping methods
GB0320059D0 (en) 2003-08-27 2003-10-01 Solexa Ltd A method of sequencing
GB0326073D0 (en) 2003-11-07 2003-12-10 Solexa Ltd Improvements in or relating to polynucleotide arrays
JP2007525571A (ja) 2004-01-07 2007-09-06 ソレクサ リミテッド 修飾分子アレイ
GB0400584D0 (en) 2004-01-12 2004-02-11 Solexa Ltd Nucleic acid chacterisation
GB0400974D0 (en) 2004-01-16 2004-02-18 Solexa Ltd Multiple inexact matching
GB0402895D0 (en) 2004-02-10 2004-03-17 Solexa Ltd Arrayed polynucleotides
WO2009099602A1 (en) * 2008-02-04 2009-08-13 Massachusetts Institute Of Technology Selection of nucleic acids by solution hybridization to oligonucleotide baits

Also Published As

Publication number Publication date
US9695469B2 (en) 2017-07-04
ES2528971T3 (es) 2015-02-13
CA2718905A1 (en) 2009-09-24
AU2009226248B2 (en) 2014-09-18
RU2010142289A (ru) 2012-04-27
US20110105338A1 (en) 2011-05-05
AU2009226248A2 (en) 2013-02-14
BRPI0908734A2 (pt) 2015-07-28
IL208237A0 (en) 2010-12-30
CN102027136A (zh) 2011-04-20
EP2268834A2 (en) 2011-01-05
AU2009226248A1 (en) 2009-09-24
NZ588112A (en) 2013-04-26
ZA201006797B (en) 2011-10-26
AU2009226248A8 (en) 2014-10-02
WO2009116863A2 (en) 2009-09-24
EP2268834B1 (en) 2015-01-07
WO2009116863A3 (en) 2009-11-12
DK2268834T3 (en) 2015-02-02
AR070929A1 (es) 2010-05-12
AU2009226248B8 (en) 2014-10-02

Similar Documents

Publication Publication Date Title
TW200948969A (en) Expression-linked gene discovery
US10570448B2 (en) Compositions and methods for identification of a duplicate sequencing read
KR102458022B1 (ko) 혼합물 중 핵산의 서열분석 방법 및 그와 관련된 조성물
KR102310441B1 (ko) Rna-염색질 상호작용 분석용 조성물 및 이의 용도
CA2951495C (en) Sample preparation for nucleic acid amplification
TW201321518A (zh) 微量核酸樣本的庫製備方法及其應用
US20100035249A1 (en) Rna sequencing and analysis using solid support
JP2009520500A (ja) 高処理量配列決定技術を使用する転写産物の特徴づけのための改良された戦略
CN108611398A (zh) 通过新一代测序进行基因分型
JP2009072062A (ja) 核酸の5’末端を単離するための方法およびその適用
EP1105527A1 (en) Method of identifying gene transcription patterns
US11174511B2 (en) Methods and compositions for selecting and amplifying DNA targets in a single reaction mixture
US20230095295A1 (en) Phi29 mutants and use thereof
WO2024119461A1 (en) Compositions and methods for detecting target cleavage sites of crispr/cas nucleases and dna translocation
JP2024512463A (ja) 増幅されたライブラリからの望ましくない断片の選択的枯渇のためのブロッキングオリゴヌクレオチド