TW200948969A

TW200948969A - Expression-linked gene discovery

Info

Publication number: TW200948969A
Application number: TW098108563A
Authority: TW
Inventors: Boer Anne Douwe De; Michael Johannes Marcus Ebskamp; Simon Albertus Langeveld; Ivo Laros; De Rhee Miranda Debora Van
Original assignee: Expressive Res Bv
Priority date: 2008-03-17
Filing date: 2009-03-17
Publication date: 2009-12-01
Also published as: US9695469B2; ES2528971T3; CA2718905A1; AU2009226248B2; RU2010142289A; US20110105338A1; AU2009226248A2; BRPI0908734A2; IL208237A0; CN102027136A; EP2268834A2; AU2009226248A1; NZ588112A; ZA201006797B; AU2009226248A8; WO2009116863A2; EP2268834B1; WO2009116863A3; DK2268834T3; AR070929A1

Description

200948969 六、發明說明：【發明所屬之技術領域】本發明係關於分子生地說，係關；^序^ 技叙領域，更明確列。更特定@ ^ ^ ,和銓〜在基因組DNA中的核酸序

yj 文将疋而言，本發明尨Sfl从W Μ Έι, 4t it ^ '、關於將一方法應用在鑑認及/或偵測核苷酸序列，1处主丄4 # ^ 八代表在基因組中大部分的經轉錄區及其周圍且其係關於各式锝錄&及太路明m Λ各樣㈣傳特性、基因及其組合。工的式h、來源(可以是植物、動物、人類、人 " 之分子標記的高通量偵測和鑑認的領域中。【先前技術】育種技術已經從可异拉M雜βο 攸』見特性的簡早篩選發展成使用標記偵測多基因特性的务隹的先進方法。原則上，在雜交族群之不同品系之間的每個遺傳差異均可代表經改變的特性。然而歸因於大多數基因組的複雜性，不可能鑑認出現在因組之間的每一個差異並將其與特殊特性連結。理論上，定序完整的基因組會揭露在基因組之間的所有差異。然 =，以目前的U技術，這在實際上、時間和成本效益上' 是不可能實行的。因此’傾測遺傳差異的方法主要是基於複雜度簡化之原則，其涉及定序得自不同個體之基因組 DNA之有限但經完全界定的部分。隨著定序技術的進步，對某些應用而言（像是轉錄譜（transcript〇me，其代表所有經表現之基因序列）的分析），複雜度簡化變得較不重要。儘管如此，範圍從數千萬到數億個鹼基的真核生物基因組 200948969 之尺寸仍超出規私* ^ 見仃之尚通量定序技術的能力。核生物中絕大多數的基因组膽 . 尺寸者）對於★接、疋"有較大基因組夫矣規计㈤、目的並未提供有價值的資訊，因為其從 -“現並因此似乎對特性的表現沒有貢 = 分子標記，聚隹/A m 此爲鑑遇 …、土因組中3玄等較傾向會顯露盘特性穷+77 .相關之分子標記的部分的方法，相較於僅分析；；= 电尺…ί 機選擇的方法具有優點。當基因、、且尺寸增加時，兮卩 π ❹在心所描述之方法使測定土 Α之所選擇部分（其代表大多數經表現Α 編碼區及其黧衣兄丞因之 ——圍)中的序列成為可能。比較在不同個體之選擇部分允許鑑認多形位置，其在經表現基因、“或與其緊鄰。因為多形性的頻率在非編碼區中是較

Hi利用現行的技術可指出更多的多形性與經表現基因、11、。@且可針對圍繞在較保守之基因周®的大型非編 ^刀2多形性的存在。這最後可能導致每個特性發現至 ❸少一個標記。本發明之方法藉著在不同個體和生物間（甚至：在具有複雜和大量基因組之生物中）指點基因組之徹 -疋義的。p刀’使&焦在基因編碼區和基因調節區的偵測成為可能。核芽酸序列多形性（像是SNp)被廣泛地應用在建構基因組輿圖上。在多形性於稱為基因作圖的過程中與表現垔聯、之後，可在標記協助性育種技術中使用這類多形性作為標記，以偵測在發育任何階段的特殊表現型。核苷酸序列夕形性通常是在基因組DNA中鑑認。因為所有真核 200948969 物的基因組尺寸都遠遠超過 J矛J用現行之南通量定岸括名奸 :析㈣酸數目，故需要複雜度簡化的可再現程序: 刀析元整基因組的所逆禮却八々所~擇°卩分，以發現在個體之間可用於基因組作圖的遺傳差異。鈇 ^ 吳J而，目前應用之複雜度簡化方法的統計學性質，# 一^ 、3不&些方法無法當場揭露那些可與單

"一表現型聯結或與斜特姓矣Ϊ目丨一 Λ A h 、料殊表現財貢獻之基因很接近的遺傳差異。為了數個理由，現行技術極力地聚焦在發現單一核普酸多形 J± (single nucleotide polymorphism，SNP广 SNp 比任何其他類里的多形性更常出現在基因組中、sNp允許同形 ^子和異形合子對偶基因的精確偵測、·可應用在高通量應用且許多卫業平台是可得的，其使得在任何想要的應用規模下的SNP偵測都能符合成本效益。雖然SNp發現在 :中出現低水平多形性之狀況下（像是密切相關個體之保守基因編碼區和基因組）會是精選的方法，但因為多形性固有的低水平，在密切相關之個體中使用EST銀行於SNp 發現卻可能是較無效的。總之，SNP發現方法理想上應該揭露在物理上與所關注的特性有關聯的所有出現的SNP ,但不應該因為其等出現在基因組的基因編碼區而受到較低水平之多形性妨礙，或受到任何對於基因組序列知識之需求妨礙。因此需要在沒有基因組或轉錄譜序列的先前知識下，可再現地測定在代表大多數的基因編碼區及其等周圍區的基因組DNa之區域中的伴隨序列的方法。 200948969 【發明内容】 . 現在，本發明之發明人已發現分析生物之基因組區域 . 的方法，其包括四大部分。第一部分涉及從所選擇之生物分離mRNA，其係用於製備小型單股的DNA片段，而該DNA片段帶有含親和力標 • 記的連接物（adaPtor)。這些DNA片段係在第三部分中^ 用。在第二部分中，基因組^^係從相同或有關的生物分離。將該基因組DNA片段化並與連接物分子連接。在第三部分中，使這些基因組片段與得自第一部分的單股dna 7 - 段雜交，並使用在該過程中形成的雜交產物合成DNA片 -段。這些片段會在第四部分中使用，而該部分涉及使用可得的高通量定序方法之一，定序這些片段。因此該鑑認樣本中之基因組DNA的方法，包括驟：灭

a) 從生物之組織樣本分離並純化mRNA ; b) 使用該mRNA作為模板，合成cDNa ; c) 可視需要簡化該cdna的複雜度； d) 片段化該cDNA ; e) °』視需要以尺寸挑選 f) 可視需要藉著與經鏈黴菌抗生物素蛋白塗力珠子結合，移除含有聚A的片段； "σ g) 挞光該cDNA片段； h) 使該片段與一個包括罕見限 J坪京之辨識位置的連 7 200948969 接物和另一個含有生物素標記的連接物連接； l) 可視需要以尺寸挑選該片段； j) 修補該片段的缺口； k) 選擇含有兩種連接物序列的該片段； i 用與在步驟描述之連接物序列煉合的引子擴增 -亥片奴’其中一個引子與具有罕見限制位置之連接物互補，而另一個引子則含有生物素標記； m) 使该片段與經鏈黴菌抗生物素蛋白塗佈的子結合； )使用相對應限制酵素，自該片段移除含有罕見限制位置之連接物；〇)從與親和力珠子附接的雙股舰片段移除未藉著生物素-鏈黴g抗生物素蛋白交互作用與親和力珠子附接的單股； P)分離並純化基因組DNA，例如從步驟a的生物； q) 片段化該基因組DNA ; r) 可視需要拋光該基因組DNA ; 0使該基因組DNA與—個單__類型的連㈣或與兩個不同類型的連接物連接； t) 將該基因組DNA解鏈成單股DNA ; u) 使得自步驟t)之基因組DNA與得自步驟〇)在珠子上的cDNA雜交； v) 藉著洗務移除未結合的基因組Dna ; w) 藉著聚合酶延伸cDNA_基因組DNA雜交產物以創造 200948969 雙股模板； X)對該基因組DNA_cDNA雜交產物進行pcR; y) 從該pcr中挑選超過大約1〇〇個驗基對的片段； z) 可視需要純化該片段，以及 aa)高通量定序該片段。法在另-具體態樣中’該方法係延伸至鐘認多形性的方其包括根據申請專利範圍之方法的所有步驟，並額外 ❹ 地比較得自二或多個樣本的序列數據，以鑑認多形性。定義在下列的說明和實施例中使用了許多名詞。為了提供說明書和巾請專利錢（包括料類名㈣供之範圍）清 :且-致的了冑，提供下列的定義。除非在本文中另行定義’所有的技術和科學名詞均具有與本發明所屬之技術領 =中具有通常知識者所一般了解者相同意義。所有出版、專利申清案、專利案和其他參考文獻的揭示内容全部以引用方式納入本文中。

核酸.根據本發明之核酸可包括哺咬和嗓吟驗基（較的刀别疋胞嘯η疋、胸腺嘴。定和尿喷〇定，以及腺。票吟和鳥嗓吟）的任何聚合物或募聚物（參I Αΐ_ L

Principles of Biochemistry, ^ 793.800(W〇rth Pub. 1982)) = 發月考慮到任何去氧核醣核#酸、核耱核#酸或狀核酸、且伤及其任何化學變體，如這些鹼基的經甲基化、經羥或、星糖基化形式、以及類似者。聚合物或募聚物可以在組合物中是異質的或同質的，並可從天然存在的來源 9 200948969 中分離，4可以是以人工或經合成方式產生的。此外，核酸可以疋DNA或RNA、或其混合物，並可永久地或過渡性地以单股或雙股形式（包括同源雙鏈（hGm〇dupiex)、異源雙鏈（heteroduplex)和雜交產物狀態）存在。 SNP:單一核苷酸多形性是在特定位點’在物種成員之間（或在個體的成對染色體之間），在基因組中單一核皆酸 •A、T、C或G-相異時發生的DNA序列變異。sNp是最常見的遺傳變異類型。SNP可落在基因的編碼序列、基因的非編碼區或在基因之間的基因間區。因為遺傳密碼的簡併，在編碼序列内的SNP不一定會改變所產生之蛋白質的胺基酸序列。其中兩種形式皆導致相同多肽序列的SNp稱為同義的’且若產生不同的多肽序列則稱之為非同義的。因為SNP在演化上是保守’可使用其等作為定量特性位點 (q_itative trait loci ’ QTL)分析以及在相關研究中的標記。内含子：内含子是基因的非編碼部分，其在叫做剪接的過程中從前mRNA移出以產生功能性mRNA。外顯子：外顯子是任何在基因内被轉錄成最後的信使 RNA(mRNA)分子（而不是像内含子從經轉錄之rna分子被剪掉）的DNA的區域。 a cDNA:CDNA*使用RNA分子作為模板，藉著逆轉錄酶酵素合成的人工形式之DNA。、自然」狀態衍其荨就像會在自基因組DNA :基因組DNA —詞代表從生的DNA。這意指基因組DNA帶有序列， 200948969 然界中被發現的一樣，例如包含内含子和調節序列。基因組DNA可衍生自不同的來源，像染色體，但亦可來自染色體外的來源’如粒線體、葉綠體和質體。

Cot-1 DNA :用以測定任何基因組之序列複雜性的技術涉及DNA的變性和復性。DNA係藉著加熱而變性，且這解開了 Η鍵並使DNA成為單股。若將DNA迅速地冷卻，則 .DNA會保持單股。但若允許DNA慢慢地冷卻，互補的序列會發現彼此且最後再度鹼基配對。DNA再煉合的速率（復性 © 的另外一種稱呼）是從其中DNA被分離之物種的函數，亦確認為「Cot」曲線❶具有高c〇t值的DNA是高度重複的DNA，而具有低Cot值的DNA僅能獲得低副本數或為唯一的。在該方法中，吾人使用具有1之Cot值的DNA，其為富含高度重複的DNA序列的總基因組DNA的部分。標註：cDNA序列的標註包括兩個步驟。將所得的序列與可在（公開）資料庫中獲得的核苷酸及/或胺基酸序列相比較。用於比較目的的序列排比之方法為在技術領域中已熟 © 知的。典型地借助程式（像是由Altschul等人，1990描述的 NCBI Basic Local Alignment Search Tool，BLAST)進行此比較。可從數個來源（包括國家生物學資訊中心（Nati〇nai

Center for Biological Information, NCBI，Bethesa Md.))以及在網際網路（HTTP://www.ncbi.nlm.nih.gov/BLAST/)上獲得該程式。該程式比較經鑑認的cDNA/EST(經表現序列標籤（Expressed Sequence Tags))序列與出現在資料庫中的序列，並基於某些分數和或然率參數提交結果。此程式可選 11 200948969 出該等具有該或然率參數之某個預定下限的cdna/est序列曰然後在第二個步驟中，經選出之cDna/est序列隨標註提供（即連結到出現在資料庫中的序列）。這類標註稱為「電子標註，。眾類 ❹ ‘詞意指透過二或多個核苷酸序列的 =對比較並根據短段或長段相同或類似核苷酸的存在挑 l建立群具有類似性之序列的聚集。數個用於排比核苷酸序列的方法為在技術領域中已，且在下文中會進一步解釋。有時術語「裝配」或「排比」制作為同義字。鑑認子（identifier):可加在連接物或引子上或納入其序列中或否則用作為標記以提供獨特的鐘認子的短序列。這類序列鑑認子可為獨特的驗基序列，其具有多變但經界定的獨特地用來鐘認特定的核酸樣本的長度。例如，卿標藏允許4(指數4)=256個不同的標藏。典型的實例為ζιρ序列， =在技術領域中已知為經常用於藉著雜交而獨特谓測的標籤⑽n_ 專人 Cyt〇metry 39:131_14〇, 2〇〇〇)。使用如此鑑〇 ^子，可在進-步加工後敎PCR樣本㈣源。在結合起源自^同核酸樣本之經加工產物的情況下，通常使用不同的鐘涊子鑑認不同的核酸樣本。定序··定序-詞意指測定在核酸樣本（例如觀 T酸的順序(驗基序列)β高通量筛選(經成）為特別與生物學和化學領域有關之科學實驗的方法。透過）現代自動技#和其他專門實驗室硬體的組合，有效地同時辉選大*的樣本，更明確地說，此為定·序研:街者 12 200948969 如在本文中其他地方揭示的（來自454 Life Sciences， www.454.com 和 Illumina，www.illumina.cQmV ^ iuumina ' S〇lexa定序法依賴將隨機片段化的基因組DNA附接到平 - 面、光學透明的表面以及固相擴增以創造具有>1千萬叢簇的超高密度定序流槽孔，其各含有每平方公分大約1〇〇〇個模板副本。此等模板係使用強健的四色DNA藉合成定序技術（robust four-color DNA sequencmg-by-synthesis technology) 定序，此技術使用帶有可移除螢光的可逆性終止子。該方法確保高精確性，並避免具有同元聚合性重複的人工製品。高敏感性螢光偵測係使用雷射激發和總内部反射光學 . 達成。 • 限制核酸内切酶：限制核酸内切酶或限制酵素是辨識在雙股DNA分子中特定核苦酸序列（目標位置）的酵素，並會在每個目標位置處或在其附近剪切dna分子的兩股。限制片段.藉著以限制核酸内切酶消化而產生的DNa ❿刀子稱為限制片奴。任何給定的基因組(或核酸，無論其來源)均會被特殊的限制核酸内切酶消化成一系列不連續的限制片段。由F艮制核酸内切酶剪切產生的DNA片段可進一步用在各種技術中，並可藉著例如凝膠電泳侦測。連接：藉著連接酶酵素催化的酵素反應（其令兩個雙股職分子被共價連接在-起）稱為連接。通常，兩DNA股被共價連接在-起，但亦可能透過兩股之一股之一端的化學或酵素修改防止該股& $ 丄 _ 版的連接。在那個情況下，共價連接會只發生在兩DNA股之一中。、 13 200948969 合成的寡核苷酸：的單股DNA分子（較佳是從大約j〇到大約5 0個鹼基其可化學地合成）稱為合成的寡核苷酸。通常，將些合成的DNA分子設計成具有獨特或想要的核苷 · 酸序列，雖然也可能合成具有相關序列的分子的家族且其在核苷酸序列内的特定位置處具有不同的核苷酸組份◦術語合成的寡核苷酸會用以稱呼具有經設計或想要之核苷酸序列的DNA分子。連接物：具有有限數目的鹼基對（例如長度大約丨〇到大約30個鹼基對）的短的雙股DNA分子，其等經過設計而得 0 以將其等連接到限制片段的末端。連接物通常由兩個合成的募核苷酸構成，其等具有彼此部分互補的核苷酸序列。田在/合液中在適當條件下混合兩個合成的寡核苷酸時，其等會彼此煉合形成雙股的結構。在煉合之後，設計連接物 -分子的一端，使該端得以與限制片段的末端相容，並可與其連接；可設計連接物的另一端，使該端不能連接，但此為非必須（經雙重連接的連接物）。經連接連接物之限制片段：已經藉著連接物加帽的限〇制片段。弓I子.通常’引子一詞意指DNA股，其可引發DNA 的合成。DNA聚合酶沒有引子就不能重新合成Dna :其只能在其中使用互補股作為模板以指揮欲裝配之核苷酸順序的反應中’延伸已存在的DNA股。吾人會把用在聚合酶連鎖反應（p〇lymerase chain reacti〇n，PCR)中的合成寡核苷酸 14 200948969 DNA擴增：d>ja媳描 PCR ^ ^ μ 擴、一詞會被典型地用以表示使用 P C R次相虽的擴增系站*山㈢系統在喊管内合成雙股DNA分子。注意到存有其他的擴增方法，、並可將此等擴增方法用在本發明 I。本發明之方法原則上可藉著使則壬何核酸擴增方法進仃士聚口酶連鎖反應（PCR ; MulHs 1987，美國專利第別3,202號和4,8G()，159號）或藉著使用諸如連接酶連鎖反應（Ligase Chain Reaeti〇n，LCR;如辦 1991， ❹ ❹

Proc_ Natl. Acad. Sci. USA 88:1 89_193 ;歐洲申請案第 320,308號）、自我維持性序列複製（Self_Sustained

Replication, 3SR； Guatelli f A, 1990, Proc. Natl. Acad. Sci. USA 87:1874-1878)、股置換擴增（Strand Displacement Amplification，SDA;美國專利第 5,27〇，184 號和 5,455，166 號）、轉錄擴增系統（Transcriptional Amplification System， TAS ，Kwoh 等人，proc Natl. Acad. Sci· USA 86:1 1 73-1 177) 、Q-冷複製酶（Lizardi 等人，1988， Bio/Technology 6:1197)、滾環擴增（R〇iung Circle Amplification，RCA ;美國專利第5,871,921)、基於核酸序列的擴增（Nucleic Acid Sequence Based Amplification, NAS BA)、裂解酶（cl eavase)片段長度多形性（美國專利第 5，719,028號）、等溫和嵌合型引子起始性核酸擴増 (Isothermal and Chimeric Primer-initiated Amplification of Nucleic Acid ， ICAN)、分歧-延伸擴增方法 (Ramification-extension Amplification Method, RAM ;美國專利第5,719,028號和5,942,391)的擴增反應進行，或其他 15 200948969 適合的DNA擴增方法進行。為了擴增對一或多個擴增弓I子，有小數目配錯的舰，可在降低嚴格度的條件下進行擴辦反應，使用38t之煉合溫度，或在35mMMgcl2存在4 的PCR擴增）。熟習此項技術者能夠選擇具有適當嚴格條件。 . 抛光（亦稱為末端修補）意指將具有非純端之dna轉變為具有鈍端之DNA 〇在的存在下利用DNA酶】拋光消化基因組， DNA(gDNA)模板會產生具有純端或具有突出末端（長度為❹ -或兩個核普酸)的DNA片段。同樣地，藉著機械方法片段化DNA會提供具有鈍端或突出端之片段的組合。無論是以酵素或機械方式產生，這些DNA片段，均可使用下述的程. 序「拋光j 。 - 在方法中，拋光可藉著以單股專一性外切核酸酶（如 BAL32核酸酶或綠豆核酸酶）處理3，_突出片段進行。通常，核酸酶應該在使用之前先校準。在另一方法中，鈍端係利用pfu DNA聚合酶或利用其 ❹ 他的DNA聚合酶（如T4 DNA聚合酶或Klen〇w dna聚合酶）創造。可使用「拋光」或鈍化末端的pfu以增加在利用dna 酶I消化基因組模板之後所產生之具有鈍端物種的量。pfu DNA聚合酶填滿5’突出。此外，pfu DNA聚合酶展現3，至5外切核酸酶活性。因此，該酵素可用以移除單和雙核苷酸延伸以進一步增加可用於連接物連接的具有鈍端dna 片段的量（參見，例如Costa，G丄和Μ ρ· Weiner，1994，選 16 200948969 殖和分析具有鈍端之經PCR產生之DNA片段的方案 (Protocols for cloning and analysis of blund-ended PCR-generated DNA fragments) ° PCR Methods Appl 3(5): S95 ; Costa, G.L.、A. Grafsky ❹ ❹ 和分析經PCR產生之DNA片段（Cloning and analysis of PCR-generated DNA fragments)。 PCR Methods Appl 3(6): 338 ; Costa，G.L.和 M_P. Weiner, 1994，以 T4 或 Pfu 聚合酶拋光，增加了選殖PCR產物的效率（p〇iishing with T4 or Pfu polymerase increases the efficiency of cloning of PCRproducts)。Nucleic Acid Res. 22(12):2423)。本發明之發明人已經發現藉著提供基因組D N a並藉著使用經連接連接物之CDNA衍生的片段以作為擴增基心:美片因段Λ引子，似乎有可能偵測到在實際上經轉錄區域卜的基因組序列，即啟動子、内含子和終止子序列此結合迅速鑑認在基因，、口的可能性中多個^ ㈣心⑽a片段 υ、τ多個樣本可在單一反庫中區域周圍之基因組膽A片段的可能2 ^研究這些段、内含子片段和涵p 及在基因編碼片變異的可能性。周即基因組序列之片段中更進一步的優點是本發明適用於所有生物。事前去疋H遍可應用的，即資訊。另-優點”士而要任何基因組或基因❸且”的使定序“發明的方法中不需要、壁使疋序編竭毒性物質或不$要選殖步驟。這則是不可能的，因基“.蛋質的序列成為可能，此否偵測遺傳因為其φ上传°'^能，此否、如此序列會被選殖#罝並表現的宿主 17 200948969 生物會不能或不易存活選殖時會產生問題的序可能在選殖排程中產生同樣的道理，現在亦可處理會在列且不梵限於序列的長度，其亦問題。更進一步的優點是本發明的方法不需要全長的 cD=，但可使用較短的序列。這在分析大型自球莖植物）時是特別有料，因為接著可保持聚隹在^ 組之最受關注或相關的區域 …、土的方法可產生用於所有經表現之 1负、生表現之DNA序列的引子，這竟味

可能從經表現之序列獲得基因組數據。〜、【實施方式】在一方面，本發明係關於鑑認在樣本中之基因組DNA ' 的方法’其包括4個不同的部分。 - 第1部分：在此部分中，從cDNA產製小型序列，該序列在第3 部分中會用來作為引發序列。本部分由下列步驟組成：

a) 從生物之組織樣本分離並純化mRNA ; Q b) 使用該mRNA作為模板，合成cDNA ; c) 可視需要簡化該cDNA的複雜度； d) 片段化該cDNA ; e) 可視需要以尺寸挑選該片段； f) 可視需要藉著與（經鏈黴菌抗生物素蛋白塗佈之）親和力珠子結合，移除含有聚A的片段； g) 拋光該cDNA的片段； 18 200948969 限制酵素之辨識位置的連接物連接； h)將該片段與第一個包括罕見連接物和帛ϋ固含有生物素標記的 0可視需要以尺寸挑選該片段 j)修補該片段的缺口； k) 選擇含有兩種連接物序列的該片段； l) 使用與在步驟h中描述之連接該片段；固引子盘且古序列煉合的引子擴增 ❹ 另-個引子則含有生物素標記；*之連接物互補，而 m) 使該片段與經鏈黴菌抗生子結合；机主物素蛋白塗佈的親和力珠二使用相對應限制酵素，自該片段移除含有罕見限制位置之連接物；從與親和力珠子附接的雙股DNA片段移除未藉著生物素铺菌抗生物素蛋白交互作用與親和力珠子附接的單股。響 A步驟產生了與鏈黴菌抗生物素蛋白親和力珠子結合的單股DNA ; 第2部分： P)分離並純化基因組DNA，例如從步驟a)之生物； q) 片段化該基因組DNA ; r) 可視需要拋光該基因組dnA ; s) 使該基因組DNA與一個單一類型的連接物或與兩個不同類型的連接物（較佳）連接； t) 將該基因組DNA解鏈成單股DNa 19 200948969 第3部分： u)使得自步D之基因，组驗與得自的cDNA雜交； V)藉著洗滌移除未結合的基因組DNA ; 雙股=著聚合酶延伸eDNA·基因組爾雜交產物以創造 X)對該基因組DNA_cDNA雜交產物進行pcR; ❹ y)藉者尺寸分級分離，從該PCR中挑選超過大約剛個驗基對的片段； Z)可視需要純化該片段第4部分：㈣使用在步驟Z)中獲得的，根據製造商高通量定序。此外，當業已測定基因組DNA之序列時，可跟著進行一步驟以鑑認在二或多個樣本之序列中的改變：ab)比較二或多個樣本的數據，以鑑認多形性。藉著以此方式處理樣本核酸，有可能在沒有任何關於〇生物基因組之結構或内容物的資訊下，可再現地分析該生物的基因組區（涵蓋基因編碼和關連區）。當定序方案允許連接物帶有鍟認子時，可在單一的定序反應中混合多個樣本。該方法始於從生物分離並純化mRNA之樣本。以此方式獲得mRNA的樣本是現今的例行程序。同樣地，對下一個步驟，其中_藉著酵素逆轉錄酶的幫助-DNA副本（即cDNA)係從在樣本中的RNA來製造。該 20 200948969 CDNA包括爾從其中衍生之細胞的轉錄譜，代表在取得樣本時已經轉錄的全部遺傳資訊。因此，依據該細胞的類型、從其中該細胞被衍生的組織、該細胞的年齡、該細胞之發育階段和環境條件，相同生物每個細胞的轉錄譜都會疋不冋的，且甚至來自相同的細胞’當在不同時間及/或不同條件下採樣時，會獲得不同的轉錄譜。在原始樣本中的

核酸通常會是mRNA之形m，衍生自其他來源的RNA ❹ ❹ 或DNA亦可能是有用的，如衍生自基因庫的舰或職。在樣本中的核酸可為雙股、單股的，並將雙股DNA變性成為單股魏。樣本可來自任何生物’無論是植物、動物、合成的或人類。應了解若獲得DNA樣本，便不需要逆轉錄酶反應。由於樣本（若其衍生自完整細胞mRNA)含有全部的轉錄譜，有時會想要僅取用它的亞組。這可以數個方式達成·· 一種可能的方式是以eDNA的尺寸區別，例如藉著超高速離心。該方法的基本原理稱為複雜度簡化。複雜度簡化的其他選擇為例如選擇豐富或不豐富的轉錄本的雜交方法，或例如捕捉特定轉錄本以從CDNA分子池移除其等或選擇其等以用於進一步分析的方法，或例如藉著限制消化創造 cDNA分子池的亞組的像cDNA AFLp的方法。一旦獲得想要的cDNA樣本，便將cDNA片段化，其可以酵素或機械方式進行。以至少一個限制核酸内切酶消化核酸樣本提供-組限制片段。在某些具體態樣中，可使用二或多個核酸内切酶以獲得限制片段。核酸内切酶可以是 21 200948969 頻繁切割者（3·5個鹼基對的辨識序列，如Msel)或稀疏切割者（>5個鹼基對的辨識序列，如Ec〇RI) ^在某些較佳的具體態樣中，稀疏和頻繁切割者之組合是較佳的。在某些具體態樣中，特別是在樣本含有或衍生自相對上較大的基因組時，使用第二個酵素（稀疏或頻繁切割者）以獲得較大組的具有較短尺寸之限制片段可能是較佳的。作為限制核酸内切酶，任何核酸内切酶會足夠。典型地，第ϋ型核酸内切酶是較佳的，如Ec〇RI、Msd、psu等 ❹ 等。在某些具體態樣中，可使用第Π型核酸内切酶，即其辨識序列遠離限制位置的核酸内切酶，即像是Aceni 了 Bbv卜 BbvII、Bbsi、㈣、細如、以⑷、_、Bim、㈣、

Bsg 卜 BsmAI、Bsmn、BspMI、Esp3I、—卜 F〇k卜、

Hga卜 Mb〇II、Mmel' MnII、Sap卜奶犯、Taqji 與 z⑽出。可藉著剪切cDNA進行機械片段化，纟中剪切的強度和期間決定了片段化的量。一種這類剪切方法是霧化。霧

’疋j 塑料裝置’其使用壓縮空氣以霧化液體。很容易其等改裝以用於剪士刀DNA，極為有效並用法簡便 (Surzycki, S. 2000, Basic Methods in Molecular Biology, ΝΥγ SPnnger Verlag)。其等可從不同來源購買（例如

Invitrogen Corporation)。

可視需要藉著尺寸挑選，再廑料斗、丹度間化该經片段化之DNA 的複雜度。可藉著以尺寸挑選Η p , ^ 、丁挑選片奴（例如藉著電泳）獲得視需要的複雜度簡化。此外，或另外 ^ t 飞乃外可藉著與經鏈黴菌抗生物素蛋白塗佈的親和力管柱結合而移除聚A片段。 22 200948969 在該方法的下一個步驟中，使cDNA片段具有純端，亦稱為「拋光」的過程。插人抛光係、用以從限制酵素產生 #>PC：R'產生之DNA片段或經剪切的DNA片段移除3’突出核芽酸或填滿5， φ φ妨 it J6A -Γ m , 5犬出核苷酸。可貝到拋光用的套組（例如 QU1Ck 鈍化套組，New England Biolabs Inc.)。

、在本發明方法的下-個步射，透過連接反應提供具有連接物# cDNA片段。在此反應中將兩個不同類型的連接物連㈣eDNA片段的混合物。—個連接物帶有生物素標記。另-個連接物含有第立型限制酵素的限制位置，該限制酵素t切其辨識序列外面的位置。該酵素之實例是 SaPI，㈣識GCTCTTC麗應相。輯素$切序列’在5’端留下NNN突出物。以此方式可自該片段移除含有限制辨識序列的完整連接物序列。报重要，應使用為稀疏切割者的酵素以避免因為在片段_中較頻繁地出現辨識序列而縮短該片段。再次，在此階段，可視需要依據片段的尺寸藉著例如電泳選擇其等。在連接連接物和片段之後，修補該片段之缺口，以填滿在DNA主鍵中任何可能因連接物之連接而產生的間隙。、可如在由M· Margulies等人在Nature 437，第376_3的頁，2005發表之附圖！中（圖3)所描述者，選擇僅含有兩種連接物的片段。然後可擴增含有兩種連接物的片段。在該步驟中U用與互補連接物序列之一煉合的引子組合攜帶生物素分子（其與另一個互補連接物序列煉合）的引子D，進行 23 200948969 PCR擴增反應。在使用這組引子進行擴增步驟之後，可在 - 鍵徽涵抗生物素蛋白親和力珠子上捕捉經擴增之雙股Dna 片段，同時從該反應混合物移除其他的反應產物。在下一個步驟中，以不對稱的核酸内切酶處理在其等 5 ’和3 ’端具有不同連接物序列的經結合dnA月段，該酵素以從片段一端移除完整連接物序列的方式剪切該片段，如同猶早所描述的，因此提供了與基因組DNA完美互補的一偭片段末端。在該限制步驟之後，藉著在鹼性條件下從珠子中沖提而移除自由單股形式的片段，產生了一組與鏈 ❹ 黴菌抗生物素蛋白珠子結合的單股核酸片段。另一種從雙股片段中產生單股片段的方法是利用λ外切核酸酶酵素處理。λ外切核酸酶從雙股DNA分子中降解具有經磷酸化5，末端者，留下完整的具有5’ 〇Η末端的單股。因為片段的 · 5 ’端之一是藉著與鏈黴菌抗生物素蛋白結合的生物素標記保護’故以λ外切核酸酶處理亦產生與鏈黴菌抗生物素蛋白珠子結合的單股DNA片段。這些單股DNA片段會在之後的步驟中使用。〇在上述步驟之後，在第二部分中從生物分離基因組 DNA。β亥生物可以是與從其中被分離者相同的（在相同或不同的條件下培養），或其可以是不同的生物（不同品系 '不同物種）’且其甚至可以是基因組DNA的聚集（例如 BAC殖系庫）。分離基因組DNA的程序在該領域中是標準的，並在例如以下者中描述：Ausubel等人（從植物組織中製備基因組 DNA(Preparation of genomic DNA from plant 24 200948969 ⑴獄）.第2.3.】.2.3.7頁，在細⑽等人，編輯分子生物干的最新方案（curreiu Proi〇c〇Js in M〇lecular 肠⑽乂） J〇hn Wl〗ey & Sons，he. BudeHer. 1993)。在分離之後，按照上述，藉著酵素或機械片段化程序片段化該基因組 DNA。若使用限制酵素消化，所得之片段係以具有與在該月段末端之不同限制位置突出物相配的連接物而提供。與基因組DNA片段附接的連接物分子具有與第^部分之經 cDNA衍生片段附接的連接物分子不同的序列。若使用機械片段化，將不同的連接物連接到基因組 DNA片段’並根據先前對於cDNA片段描述的程序⑽如可應用搬光步驟）選擇在5’和3’末端具有不同連接物的片段。或者，也可將一個單一的連接物連接至該基因組片段。在那個情況下’帶有銷柄的連接物序列可用以防止在之後步驟中的非專一性擴增(D H J〇nes和s c如， PCR Methods Appl. 1993 2:197-203)。可視需要按照上述以尺寸挑選經片段化之基因組dna 片段。為獲得單股基因組DNA片段，提供解鏈步驟。在如此提供經片段化基因組單股DNA的適當樣本之後’將得自第i部分的單股cDNA片段（其攜帶具有生物素標記之單一連接物分子，該生物素標記可視需要與鏈黴菌抗生物素蛋白親和力珠子結合）混合，較佳以莫耳過量，以與帶有不同連接物分子之經片段化基因組dna(第3部分） 25 200948969

雜交。在變性步驟之後，物雙股基因組DNA-eDNA 應用煉合條件以允許形成雜交產分子。细箱2程序可包㈣用未Μ段化GDNA(無連接物）的短 '口^藉著降低衍生自豐富轉錄本之較高濃度CD· 又的景少響，仏準化雜交反應。作為可視需要之修改， Cot 1 DNA可用在預煉合步驟中，以降低因在基因組ο· 中之序列重覆所引起的可能異常。

在該步驟中，CDNA片段會在與所採樣之mRNA同源或相同的地方，煉合基因組dna。在藉著聚合酶延伸eDNA_基因組舰雜交產物之後製造出雙股模板。現在可藉著PCR反應，使用一個與cDNA連接物互補的引子和另一個與基因组dna連接物之一互補的引子，而擴增經煉合之雙股片段。可視f要將經煉合之材料分成不同的兩份，以亦使用cDNA連接物和另一個與基因组DNA 連接物互補的引子。該擴增提供了 PCR片段，其不僅含有原始採樣核酸之基因組DNA相對應部分的副本，還含有未經轉錄之序列，如調節序列和内含子。在PCR擴增之後，透過尺寸分級分離選出具有超過_ 個鹼基對的片段，較佳的是超過大約2〇〇個鹼基對，甚至佳的是超過大約300個鹼基對，且最佳的是大約4〇〇個鹼基對或更多的片段。可視需要，根據符合本發明方法下一個步驟的需求’純化這些片段。在下一個部分中（第4部分）定序該片段。經擴增之經連 26 200948969 接連接物片段的定序，至少對經連接連接物之片段和位在 3側之基因組序列的部分提供了序列資訊。在經連接物衍生之部分中所含有的資訊，包含有關從其中獲得該片段之樣本的資訊（若連接物帶有樣本專一性標籤），而得自該片段本身（鑑認子序列）的序列資訊則提供了有關該片段的資

訊，並允許鑑認該片段。此在片段上之序列資訊可用以鑑涊片段，而其準確性視經測定之核苷酸的數目和在經擴增之經連接連接物片段組中的片段數目而定。為對在樣本之間在轉錄本頻率上的採樣變異的問題 (其影響藉著定序一組多個片段所含者而鑑認分子標記的準確性）提供解決，本發明之發明人已經發現經由定序來偵測標記，較佳的是充分過剩地（深度）採樣所有的片段至少一次，並伴隨著解決有關所唤起之基因型準確性的採樣變異的問題的統計方法來進行。為了增加準確性，較佳的是擴增步驟進行定序步驟。在㈣的擴增循環之後，㈣增經連接連接物之限制片段的過剩至少$ 6,較佳的是至少 7’更佳岐至少8,且最佳的是至少9。因此，在較佳的具體態樣中，測定每個經連接連接物之限制片段的序列至少6倍，較佳的是至少7倍，更佳的是至少8倍，且最佳的是至少9倍。在某些具體態樣中，選擇過剩（假定整體有50/50機會正確地鏗認位點為同形合子的）以使正確鐘認位點的機會超過95%、96%、97%、98%、99%、％作。經連接連接物之限制片段的擴增導致一組。連接連接物的限制片段，有時稱之為擴增區（ampn叫、。 27 200948969 使擴增區（或其至少一部分）接受至少包括測定樣本專一鑑 - 認子之序列的步驟，以測定該片段和該限制片段之序列之部分的起源。實際上此亦等於測定位在像是限制核酸内切酶之辨識序列的殘餘部分之間的部分。藉著定序樣本專一性鑑認子以及位置與經連接物衍生之序列相鄰的部分片 - 段，有可能獨特地鑑認出限制片段及其等3，侧基因組序列。從該資訊中有可能恢復完整基因的基因組遺傳資訊。在本發明中使用的高通量定序是一種用於科學實驗 (尤其是有關於生物學和化學領域）的方法。 ❹ 較佳的是’使用高通量定序法進行定序，如在以下者中所揭示：WO 03/004690、W0 03/054142、w〇 2004/069849、W0 2004/070005 ' WO 2004/070007、與 WO ' 2005/003375 (全部以 454 Life Sciences 之名義）、以〇等人-(2004) Proc. Natl. Acad. Sci USA 1〇1:5488 93，以及

Helios、Solexa、US Genomics、等等的技術，其等係以引用方式納入本文中。所描述之技術允許在單一行程中定序4千萬個鹼基，〇並比競爭性技術快且便宜100倍。定序技術大略由5個步驟，.且成.1)片/又化DNA並連接專一連接物，以創造單股 DNA(ssDNA)庫，2)煉合ssDNA與珠子，在油包水微型反應器中乳化珠子，並進行乳劑PCR以擴增在珠子上個別的 ssDNA刀子，3)挑選或富集在其表面上含有經擴增ssDNA 分子的珠子，4)使攜帶DNA的珠子沉降在pic〇Titer™盤中，並5)藉著產生焦磷酸根光信號，在1〇〇,〇〇〇個槽孔中同 28 200948969 時定序。在下文中會更詳細地解釋該方法。在此一方面，下列的計算可作為例證：如同在本文其 .他地方描述的Hina Solexa之定序技術，對大約每25bp 提供4〇.000.000次判讀，在單一行程中總計交錯10億bp。假定知樣過剩1〇倍，可在—個行程中評估4.麵謂個獨特的片&。結合100個樣本，允許對每個樣本定彳4〇〇⑽ 個片段。 I較佳的具體態樣中，定序包括下列步驟：⑷將經修改之片U合至珠子’每個珠子煉合_個經修改之片段；⑻ 在油包水微型反應器中乳化珠子，每個油包水微型反應器包括—個珠子；⑷將珠子裝㈣槽孔中，每個槽孔包括-• 個珠子；並產生焦磷酸根信號。在第一個步驟⑷中，將定序連接物連接到組合庫内的片段。該定序連接物包括至少—個用以煉合珠子的「關鍵」區、定序引子區和PCR引子區。如此，獲得經修改之片段。〇在第-個步財，冑經修改之片段煉合到珠子，每個珠子與-個經修改片段煉合。在經修改之片段池中加入過量的珠子，以確保對於大多數的珠子而言，每個珠子煉合一個經修改片段（帕松（Poisson)分布）。在下一個步驟中，在油包水微型反應器中乳化珠子，每個油包水微型反應器包括一個料。存在油包水微型反應器中的pcR試劑允許在微型反應器中發生PCR反應。隨後，打破微型反應器，並富集包含DNA的珠子（DNA陽性珠子）。在接下來的步驟中，將珠子裝栽到槽孔中，每槽孔包 29 200948969 括一個珠子。較佳的是該槽孔為允許同時定序大量片段之 PicoTiter™盤的一部分。在加入攜帶酵素的珠子之後，使用焦定序（pyrosequencing)測定片段的序列。在後續的步驟中，使PicoTiter™盤以及在其中的珠子和酵素珠子，在習知定序試劑的存在下接受不同的去氧核醣核苷酸，並記錄在併入去氧核醣核苷酸後產生的光信號。併入正確的核苷酸會產生可偵測的焦定序信號。焦定序本身為在技術領域中已知的，並特別被描述在 www.biotagebio.com ; www.pyrosequencing.com/切片技術上。該技術被進一步應用在例如以下者：W0 03/004690、 W0 03/054142、W0 2004/069849、WO 2004/070005 ' W0 2004/070007、與 W0 2005/003 3 75 (全部以 454 Life Sciences 之名義）。在本發明中，珠子較佳裝有能夠結合擴增區的引子（結合）序列或其一部分，視情況而定。在其他的具體態樣中，擴增時使用的引子（例如在其5’ -端）裝有允許擴增區與珠子結合的序列，以在定序之後允許後續的乳劑聚合化。或者，可在連接至珠子或表面之前先將擴增區與定序連接物連接。經定序之擴增區會揭露鑑認子的身分，並因此揭露在樣本中有或沒有限制片段。

Illumina-Solexa 技術一種高通量定序方法可從 Illumina，英國 (www.illumina.co.uk)獲得，並特別在以下中描述： W00006770、W00027521 ' W00058507、W00123610、 WO0157248 ' WO0157249、W002061127、W003016565、 200948969 WO03048387 、 W02004018497 > W02004018493 、 W02004050915 、W02004076692 、W02005021786 、 . W02005047301 、 W02005065814 、 W02005068656 、 W02005068089與W02005078130。基本上，該方法以基因組DNA的經連接連接物之片段開始。將經連接連接物之 DN A隨機附接至引子的密坪（dense lawn )上，其附接在固體表面，典型地在流動槽孔中。經連接連接物之片段的另一端與在表面上互補的引子雜交。在所謂的固相橋擴增〇中，在核苷酸和聚合酶的存在下延伸該引子以提供雙股片段。該固相橋擴增可以是選擇性擴增。 - 固相橋擴增的變性和重複產生分布在整個表面上的經擴增片段之緊密叢簇。藉著將四個以不同方式標示之可逆終止子核苷酸、引子和聚合酶加至流動槽孔中開始定序。在第一回合的引子延伸之後，偵測該標記，記錄第一次所併入之鹼基的身分’並阻斷3’末端，然後從經併入之鹼基移除螢光團。然後以相同之方式測定第二個鹼基的身分，胃並以相同方式繼續定序。在本發明中’使經連接連接物之限制片段或擴增區經由引子結合序列或引子序列與表面結合。根據概述測定該序列’包括鑑認子序列和限制片段。目前可得的Solexa技術允許定序大約3 0個鹼基對的片段。藉著連接物和表面結合引子的聰明設計’定序步驟讀透樣本鑑認子與限制核酸内切酶所使用之辨識序列的剩餘部分。例如，當使用3bp 的樣本鑑認子並存在稀疏切割者EcoRI的剩餘部分 31 200948969 AACCT)時’可使用7bp之限制片段的内部序列以獨特地鑑過在樣本中之限制片段。在基於以上nlumina_solex 序技術的較佳具體態樣中，利用在其3，端含有最多一擇性核《，較佳的是在其3,毅有選擇性核㈣的引子’即該引子僅與連接物互補㈣引子），進行經連接物之限制片段的擴增。

在針對本文㈣之定序方法之可供選擇的具體態樣中，在擴增時使用的引子可含有用在後續之定序步驟中以使經連接物加帽之限制片段或擴增區與表面結合的特殊部分（作為本文描述之引子或引子結合序列的另一選擇）。通常將此部分描述為關鍵區或5’ ·引子可相容的序列。

在本發明之一具體態樣中，核酸樣本係以至少一個限制酵素消化並連接至少-個連接物（其包括第Η限制核酸内切酶之辨識序列w遺後利用第π龍制核酸内切酶消化經連接連接物之限制m以因為在第n型料之辨識和限制位置之間的距離是相對上較短的（最多大約3〇個核苷酸）’產生較短和較長的限制片段，而第n型限制位置之可相容連接物可與其連接。典型地，第π型限制位置的突出物是未知的，以致於可使用一組連接物，其在突出物中被簡併。在（選擇性）擴增之後，可定序擴增區。通常可將在此具體態樣令的連接物序列敘述成：5，_引子結合位置-樣本鐘認子序列-簡併第Π型黏性末端序列_3’ 。經相關pcR引子通常如下：引子序列-樣本鑑認子序列_簡併第n型黏性末端·選擇性核苷酸-3，。然後用以發動藉合成定序的引子 32 200948969 通常具有結構：5，_引；社人〜w 与丨子、、、。π位置_3，。尺寸挑選步驟在以 Π酵素消化之後可能县缸^土 & 此疋較佳的，以移除較小的片段。因為 •在此具體態樣中對於此類型酵素之限制位置的剩餘部分典 ^也疋2 4t>P的等級，此組合6bp樣本鑑認子造成15_17bp 之限制片段的定序中。 ,因此，本發明之方法完全適合在沒有關於該細胞及/或從其中該細胞破衍生之生物的任何最初之序列資訊或先前的遺傳知識下，鑑認屬於細胞或生物的轉錄譜之基因的調節基因組序列。因此，可根據本方法鑑認經表現基因的啟動子區、前導序列和其他5，UTR區、内含子和外顯子、3， • TR彳列和終止序列。因為不涉及選殖步驟，亦可能測定在選殖步驟中引起問題的基因之基因組序列，例如對宿主生物有毒的基因、編碼調節蛋白質的基因及/或否則在選殖時引起問題的基因。而且，有可能基於該資訊直接分析與經表現基因之對 ❹偶基因有關的所有多形性（包括SNp)，無論這些多形性出現在基因的編碼序列或在非編碼序列中。因此，可能偵測出在引起基因表現調節之啟動子序列中的異常，也有可能偵測出在内含子中有可引起不同的剪接變體的多形性的突變種，等等。為了增加對經定序核酸序列和在其中發現之差異的正確解釋，可對經定序片段或片段重疊群（contig)進行自動標註。 Π樣地了使用所獲付的序列資訊比較序列與得自e s τ 33 200948969 庫的序列。以此方式可鑑認内含子序列或基因内部的非編 — 碼序列，以及啟動子序列和3，與5，UTR°EST庫可取自相同生物或取自相關之物種。在另外的方面中，本發明係關於可進行本發明之方法的套組。除了擴增套組本身的習知組份（像是dNTP、聚合酶等等）之外’這類套組可包括一或多種連接物與可視需要的一或多種與該連接物互補的引子、連接酶、及/或專一剪切該連接物的限制酵素。而且，套組應該提供使用說明書，其中有實行本發明之方法的操作指南》 ❹ 此外’本發明發現該方法可應用於鑑認分子標記、定出基因型、大量隔離分析、基因作圖、標記輔助性回交 (marker-assisted back-crossing)、定量性特性位點的作圖、連鎖不平衡作圖（linkage disequilibrium mapping)、和測定甲基化圖形等等上。實施例 cDNA程序分離RNA並合成cdna ❹ 依據Chang等人（1993)的方法，從蘋果果實（建志蘋果 Malus X domestica，cultivar Kanzi))的表皮分離總 RNA。蘋果衍生自4個不同的果園，並在$個不同的時間點（從2007年8月初到9月底）摘採。將等量的得自此20 個樣本之總RNA集合成一個樣本，並根據製造者的說明書’以 RNeasy Plus Micro 套組（qIAGEN，Hilden，Ge_ny， 74034)純化，以移除基因組DNA污染。 34 200948969 利用2微克總RNA作為輸入物，根據製造者的說明書使用 Mint cDNA 合成套組（Evrogen，Moscow, Russia, SK001) . 進行第一股cDNA合成。使用Mint cDNA合成套組最適宜的1 8次循環，進行藉由PCR擴增的雙股（ds)cDNA合成。使用（^1人91141^?€1^純化管柱（(^1人〇£1^,28104)純化所得的 ds cDNA，並以分光光度計測量濃度。在1 %瓊脂糖凝膠上分析 cDNA。ds cDNA 範圍從 200 到 2000bp。 cDNA純化、0酸化、序連（concatenation)和霧化 ❿ 使用 Quick BluntingTM 套組（New England Biolabs，

Ipswich, MA, USA, E1201S)鈍化並磷酸化 ds cDNA。將 38 . 微升cDNA(8微克）與5微升lOx鈍化緩衝溶液、5微升ImM 去氧核醋核苦酸溶液混合物（Deoxynucleotide Solution Mix) 和2微升純化酵素混合物（Blunting Enzyme Mix)混合，並在室溫培養30分鐘，接著在70°C培養1 〇分鐘。隨後，藉著將48微升此cDNA鈍化混合物與10微升 10xT4 DNA連接酶反應緩衝溶液、5微升T4 DNA連接酶（兩者均得自 New England Biolabs, M0202S, 400,000 單位 / 毫升）、25微升40%(重量/體積）聚乙二醇8000和12微升水混合而將其序連。在室溫培養該連接混合物2小時，並藉著瓊脂糖凝膠分析證實序連。藉著在65°C培養10分鐘使T4 連接酶失活。藉著霧化剪切經序連之cDNA。將100微升cDNA連接混合物與650微升霧化緩衝溶液（10mM Tris-HCl、ImM EDTA、50%甘油，pH8.0)混合，並吸移至霧化器（Invitrogen， 35 200948969

Paisley，UK, K7025-5)内。根據製造者的說明書，以48 psi 使用氮氣 5.0(Praxair，Danbury，CT，USA)進行霧化 15 分

鐘。在短暫離心霧化器之後’將所收集之經霧化cDNA移至微量離心管，並藉著加入2微升肝糖（sigma_Aldrich，st. Louis，MO, USA，20毫克/毫升，G1767)、〇」份體積的— 乙酸鈉pH5.2和1份體積的異丙醇，並在_8〇〇c培養ι〇分鐘使其沉澱。藉著以20,800g離心15分鐘，使cDNA形成小球’以70%乙醇洗滌，乾燥並溶解於5〇微升i〇mM

Tris-HCl、IMm EDTA, ρΗ8·0 中。測定cDNA尺寸和鈍化在65°C培養經剪切之cDNA 10分鐘，加入凝膠裝載緩衝溶液，並將cDNA分配到2%瓊脂糖凝膠（在Tris-醋酸鹽 (TAE)緩衝溶液中）的5個溝槽上（Sambrook等人，1989)。在電泳之後，使用GenElute凝膠萃取套組（sigma_Aldrich， NA1111) ’從凝膠分離1〇〇_4〇〇bp的cDNA片段。在凝膠上檢查經純化cDNA的少量樣本’並發現為低濃度。因此，重複數次上述的cDNA鈍化、磷酸化、序連、霧化和凝膠純化程序，利用Mint cDNA合成套組，總共獲得24微克 ds cDNA。藉著乙醇沉澱，並溶解於19微升分子生物學-等級的水中，濃縮100-400bp的cDNA片段。藉著與得自 Quick Blunting™ 套組（New England

Biolabs，E1201S)的2.5微升l〇x鈍化缓衝溶液、2 5微升 ImM去氧核醣核苷酸溶液混合物和1微升鈍化酵素混合物混合，並在室溫培養3〇分鐘，接著在7(rc培養i〇分鐘， 200948969 鈍化並磷酸化經剪切 cDNA的磨損端。隨後，使用 MinElute®PCR 純化套組（QIAGEN，28004)純化 cDNA。連接連接物和修補缺口藉著煉合部分互補之募核苷酸ELTD-引子-C(5 ’ -AGTCCGTCGCATCGCTCTTC-3 ’ ）和 ELTD-AdC2 (5 ’ -GAAGAGCGATGCGACG-3’ ），製備連接物 ELTD-AdC。該連接物一邊是鈍端，並在另一邊具有4nt(AGTC)的5’ -突起物，以獲得與cDNA連接的方向性，並防止多個連接 ® 物與cDNA連接。ELTD-AdC連接物亦含有稀疏切割者SapI 限制位置：

GCTCTTCN/NNN CGAGAAGNNNN/ 該限制位置能夠在該方案之較晚步驟的期間，從cDNA 移除ELTD-AdC。藉著煉合部分互補之寡核苷酸ELTD-引子 -D(5’ -生物素-TEG-AGTGGGTGTCCTGGGTCAA C-3，）和 ELTD-AdD2(5’ -GTTGACCC AGGAC ACC-3 ’ ），製備連接物ELTD-AdD。該連接物亦在一邊具有4nt(AGTG)的5’ -突起物，其經由四-乙二醇（TEG)間隔臂以生物素標示。該生物素標記能夠在該方案之較晚步驟的期間，將cDNA固定在經鏈黴菌抗生物素蛋白塗佈的珠子上。所有的寡核苷酸均是從Sigma-Aldrich訂購，為經HPLC純化的，並溶解於 ImM Tris-HCn、O.lmM EDTA，pH8.0 中。藉著混合每個適當的寡核苷酸（400uM)各50微升與1〇〇微升2x煉合緩衝溶液（20mM Tris-HCl、l〇〇mM NaCl、2mM EDTA，ρΗ7·6)， 37 200948969 在 95 °C 在加熱塊（thermoblock) (Thermomixer Compact, Eppendrof，Hamburg，Germany)中培養該混合物5分鐘，然後關掉加熱塊，允許樣本内部慢慢地冷卻至30°C以下（花費 3小時），製備連接物。這產生1 OOuM濃度的雙股連接物 ELTD-AdC 和 ELTD-AdD。在下列的反應中將兩個連接物連接到cDNA : 9.2微升得自MinElute純化管柱的cDNA、1.25微升水、0.4微升連揍物 ELTD-AdC(lOOuM)、0.4 微升連接物 ELTD-AdD (100uM)、12.5微升2xQuick連接反應缓衝溶液和1.25微升 Quick T4 DNA 連接酶（Quick Ligation™ 套組，New England Biolabs, M2200S)。在25°C培養該連接混合物20分鐘，並使用 GenElute P'CR Clean-Up 套組（Sigma-Aldrich，NA1020) 純化。在下列的反應中修補經連接連接物之cDNA的缺口： 47微升得自 GenElute純化管柱的 cDNA、8微升 1 OxThermo Pol 反應缓衝溶液（New England Biolabs)、8 微升 1毫克/毫升BSA、2微升10mM dNTP、1微升8單位/微升 Bst DNA 聚合酶、大片段（New England Biolabs，M0275)和 14微升水。在65°C培養該修補缺口反應30分鐘，並使用 QIAquick PCR純化管柱純化，產生50微升100-400bp的經連接連接物之cDNA。

擴增經連接連接物之cDNA 在含有下列者的PCR反應中利用高忠實性DNA聚合酶擴增cDNA : 10微升得自QIAquick PCR純化管柱之cDNA、 200948969 10 微升 5 X Phusion™ HF 緩衝溶液、i 微升 1〇niM dNTP、 2.5 微升 10uM ELTD-引子-C、2·5 微升 lOuM ELTD-引子 -〇、0·5微升2單位/微升Phusion熱啟動DNA聚合酶 (Finnzymes，Espoo, Finland，F-540)和 23.5 微升水。首先，進行測試以測定最適合CDNA擴增的pcr循環次數。將反應混合物放在熱循環器中，在98。〇變性3〇秒，隨後接受5 次變性-煉合-延伸循環：在981 5秒，在6(TC 10秒，在 Ο Ο 72°C 15秒。然後從該反應混合物中移出5微升，並保持在冰上（在5次循環之後的樣本）。使剩下的反應混合物接受再三次如上的PCR循環，並移出5微升及保持在冰上（在8次循環之後的樣本）。重複以上循環再5次，直到已經達成總計23次循環為止。在i 5%瓊脂糖凝膠上分析$、8、1丄、 14、1 7、20和23次循環的5微升樣本。測定出最適宜的循環次數為17次循環，之後達到高原期，因為更多的循環會導致在預期尺寸的cDNA上出現拭跡（smear)。為製造更多cDNA ’如上述製備兩個pcR反應混合物，其分別帶有 1〇微升_Α °將反應混合物放在熱循環H中，在變性30秒’隨後接受17次變性_煉合_延伸循環··在9代$ 秒，在60。(： 10秒，在饥15秒。接著是在饥$分鐘的最終延伸步驟。使用QIAquiek pCR純化管柱純化經擴増之 CDNA，接著使用 GenElute PCR Clean_Up 管柱 (Sigma-Aldrich)以移除引子和可能的引子二聚體。

分離經單股CD-修改之cdnA 接下來’藉著與經鏈黴菌抗生物素蛋白重佈之珠子結 39 200948969 合、洗滌和鹼性沖提，針對在一端攜帶ELTD-Ad-C並在另一端攜帶ELTD-Ad-D的分子，富集在先前步驟中獲得的 cDNA。在兩端都攜帶ELTD-Ad-C的cDNA分子（從現在起稱為CC分子）不能與鏈黴菌抗生物素蛋白結合，並從珠子中被洗掉。在兩端都攜帶ELTD-Ad-D的cDNA分子（從現在起稱為DD分子）在鹼性沖提期間會繼續與珠子結合，因為兩股都經生物素基化了。在一端攜帶ELTD-Ad-C且在另一端攜帶ELTD-Ad-D的cDNA分子（從現在起稱為CD分子）的經生物素基化的股會繼續與珠子結合，而未經生物素基化的另一股會藉著以NaOH處理而沖提。徹底再懸浮經鏈黴菌抗生物素蛋白塗佈的順磁性 Dynabeads® M-270(Invitrogen, 653.05)，並將 50 微升（相當於0.5毫克）珠子移至石夕化之微量離心管（Sigma-Aldrich, T4816)。以 100 微升 lxB&W 緩衝溶液（5mM Tris_HCh0.5mM EDTA、1M NaCl，pH7.5)洗滌珠子三次，依據製造者的說明書使用 Dynal磁性台架（MPC®-E-1, Invitrogen)分離珠子。將珠子再懸浮於100微升含有0.02%吐溫（Tween)-20的 2xB&W缓衝溶液中，以降低非專一性結合。接下來，將與 55微升水混合45微升經PCR擴增和純化之cDNA，加至該珠子懸浮液中。允許cDNA在室溫結合1 5分鐘，並溫和地旋轉該試管。將該試管放在磁性台架上以分離珠子和上清液，將後者移到新的試管中。將該溶離份稱為AB(在結合後），並含有未與珠子結合的cDNA。隨後，如下洗務珠子小球：以200微升含有0.02%吐溫-20的2xB&W缓衝溶液 40 200948969 洗條一次’以500微升含有0.02。/。吐溫_2〇的2xB&w緩衝溶液洗滌一次，並以500微升水洗滌兩次。在將珠子再懸 ' 浮於水中第二次之後，將珠子移到新的矽化試管，然後移到磁鐵上。最後，將珠子再懸浮於250微升新近製備的〇1M NaOH中，並溫和地旋轉試管2_3分鐘。此上清液代表第一個沖提物。再度將珠子再懸浮於250微升〇.1M Na〇H中，並溫和地旋轉2-3分鐘，此上清液代表第二個沖提物。將沖提物分別與1250微升PBI緩衝溶液（QlAquick pcR純化套 © 組）和7·2微升20%醋酸混合，並在QIAquickpci^4化管柱

上純化。再者，在QIAquick PCR純化管柱上純化AB溶離份。以200微升水洗務剩下的珠子一次，以200微升1 〇mM

Tris-HCl、ImM EDTA ’ pH8.0 洗滌一次，再度以 2〇〇微升水洗滌一次，最後再懸浮於5 0微升水中並儲存在4。〇。在1.5%瓊脂糖凝膝上檢查5微升AB溶離份和兩種鹼性沖提物。在AB溶離份和第一個鹼性沖提物中找到 cDNA，但在第二個鹼性沖提物中則無，將其拋棄。對1微升AB溶離份、第一個驗性沖提物和珠子（總體積各5 〇微升）進行對照組PCR反應。分別與12_5微升REDTaq®ReadyMix TM (Sigma-Aldnch，R2523)、1 微升 1〇uM ELTD_ 引子 _c 或 1微升1 OuM ELTD-引子-D或[1微升丨〇uM ELTD_引子_c和 1微升10uM ELTD-引子-D]和水混合至25微升之總體積。 PCR條件為：在94C 1分鐘，（在94»c 3〇秒，在5〇t 3〇秒，在72它3〇秒）持續6、9、12和15次循環，在72。(：5 分鐘。將每個反應各5微升裝載到15%瓊脂糖凝膠上。結 41 200948969 果顯示如同預期，在AB溶離份中有比DD和CD-分子更多的CC分子，因為CC分子不能與珠子結合。在鹼性沖提物和珠子溶離份中出現：CC<DD<CD。結論如同預期，在鹼性沖提物中富含CD分子，但仍出現CC且尤其是DD分子，或許是因為CC的非專一性結合和DD分子對珠子的不完全結合。將鹼性沖提物（經QIAquick-純化的）稱為富含單股CD 之 cDNA。

擴增富含CD之cDNA 在測試最適宜的PCR條件之後，如下擴增富含單股CD 之cDNA。建立十六個PCR反應，分別含有：0.5微升經 QIAquick管柱純化之上述Dynabeads的第一個驗性沖提物、10微升5xPhusion™ HF缓衝溶液、1微升1 OmM dNTP、 2.5 微升 10uM ELTD-引子-C、2.5 微升 10uM ELTD-引子 -D、0.5微升2單位/微升Phusion熱啟動DNA聚合酶 (Finnzymes，F-540)和3 3微升水。將該反應混合物放在熱循環器中，在98°C變性30秒，隨後接受11次變性-煉合-延伸的循環：在98°C 5秒，在60°C 10秒，在72°C 15秒。接著是在72°C 5分鐘的最後延伸步驟。使用三個平行的 QIAquick PCR純化管柱純化經擴增之cDNA。在1.2%瓊月旨糖凝膠上分析經純化的cDNA，並以分光光度計測量濃度。總共獲得27.5微克富含雙股CD之cDNA。富含CD之cDNA對Dynabeads的結合使用5微克得自先前步驟的富含雙股CD之cDNA，與 Dynabeads M-270結合。上文在「分離經單股CD-修改之 200948969 cDNA」之下描述了該程序，並有以下的修改。將27.32微升的量（相當於5微克）的富含CD之cDNA與水混合，至 . 體積總共1 〇〇微升，並將該混合物加至在100微升含有 0.02%吐溫-20之2xB&W缓衝溶液中的珠子中。在cDNA結合並以含有0.02%吐溫-20之2xB&W緩衝溶液洗滌和以水洗蘇之後，以200微升 ΙχΝΕ緩衝溶液4(New England Biolabs)洗滌珠子2次。最後，將與cDNA結合的珠子再懸浮於100微升1χΝΕ4緩衝溶液中，並移至新的矽化微量離心試管。

以SapI消化富含CD之cDNA-珠子製劑 . 以SapI消化在珠子上、富含CD之cDNA，以從cDNA 分子移除連接物ELTD-AdC，同時cDNA仍經由經生物素基化之連接物ELTD-AdD與珠子附接。將五微升Sapl(2單位/ 微升，New England Biolabsm, R0569)加至 cDNA-珠子懸浮液中，並在37°C培養1.5小時。每10分鐘以1400rpm旋轉該珠子，以保持其等在該步驟期間為懸浮液。接下來，將 V 珠子放在磁性台架上1分鐘以分離珠子，拋棄上清液並以 500微升含有0.02%吐溫-20之2xB&W緩衝溶液洗滌珠子兩次，然後以500微升水洗滌兩次。驗性沖提以製備富含單股CD之cDNA-珠子庫將珠子小球再懸浮於250微升0.1 M NaOH(新近製備的）中，並溫和地旋轉試管2-3分鐘。將試管放在磁性台架上1 分鐘，並將上清液（=鹼性沖提物）移至新的試管。將鹼性沖提物與1250微升PBI缓衝溶液（QIAquick PCR純化套組）和 43 200948969 7.2微升20%醋酸混合，並在QIAquick PCR純化管柱上純化。以200微升水洗滌剩下的珠子一次，以200微升10mM Tris-HCl、ImM EDTA，ρΗ8·0 洗滌一次，再度以 200 微升水洗滌一次，最後再懸浮於50微升水中並儲存在4°C。這是富含單股CD之cDNA-珠子庫，準備好用於與基因組DNA 雜交。在1.2%瓊脂糖凝膠上分析該經純化之鹼性沖提物，以及之後來自「富含CD之cDNA對Dynabeads的結合」的結合溶離份，以及具有已知濃度、得自「擴增經連接連接物之cDNA」之連續稀釋的雙股cDNA。在AB溶離份中發現大約2微克的cDNA，並沒有與Dynabeads結合。該驗性沖提物顯示預期尺寸的拭跡。以分光光度計測量鹼性溶離份的濃度，並發現已經從珠子中沖提出41 0毫微克的單股 cDNA。在理論上，在富含單股CD之cDNA-珠子庫中應該有等量的互補cDNA股，假定平均尺寸為300nt，相當於大約4微微莫耳。

基因組DNA

分離基因組DNA 依據Kobayashi等人（1998)的方案，從建志蘋果葉分離基因組DNA(gDNA)。在根據Kobayashi等人（199 8)的RNA 酶處理之後，藉著加入三分之二份體積的5M NaCl和兩份體積之乙醇（p.a.)以高-鹽使gDNA沉澱以移除雜質，接著以 20.000g離心15分鐘，以70%乙醇洗滌小球，乾燥並將小球溶解於 10mM Tris-HCl、ImM EDTA，pH8_0 中。 200948969

限制酵素消化gDNA 藉著限制酵素消化片段化gDNA，以創造未部分重疊的 - 片段。部分重疊的片段可能干擾在方案中較晚的雜交步驟，導致雜交片段網狀物。選擇限制消化，使其主要產生 l-3kb 的片段。以 Hindlll/BstYl 並以 EcoRI/BstYI 消化 gDNA，產生兩組不同的片段。藉著加入1 〇微升NE緩衝溶液 2、3 微升 EcoRI(New England Biolabs，20 單位 /微升， R0101)或 1 微升 HindIII(New England Biolabs，100 單位 / 微 © 升’ 104)和水，直到總體積1〇〇微升，接著在37°C培養 1小時，消化二十微克gDNA。隨後，在每個試管中加入6 . 微升 BstYI(New England Biolabs，10 單位 /微升，R0523)，接著在60°C培養1小時。將經消化之DNA裝入1 %瓊脂糖凝膠的4條跑道中並分離。從凝膠中切下1到3kb之間的片段，並使用 GenElute凝膠萃取套組（Sigma-Aldrich, ΝΑΙ 11 1)純化。重複以上的程序一次，以產生足夠的DNA 片段。將 EcoRI/EstYI(EB)和 HindIII/EstYI(HB)基因組片段 w 連接到連接物 ELTD-AdE-Eco、ELTD-AdE-Hind 和 ELTD-AdF-Bst。 gDNA與連接物連接藉著煉合部分互補之寡核苷酸ELTD-AdE-Ecol (5’ -CTTGTAGGGCACGGGTCGAGAG-3’ ）和 ELTD-AdE-Eco2 (5’ -AATTCTCTCGACCCGTGCCCTA-3 ’ ），製備連接物 ELTD-AdE-Eco。該連接物在一邊具有5’ -AATT突出物，其可與gDNA片段之EcoRI-突出物相容，並在另一邊具有 45 200948969

5’ -CTTG突出物。這些突出物獲得與gDNA連接的方向性，並防止多個連接物與gDNA連接。藉著煉合部分互補之寡核苷酸 ELTD-AdE-Hindl (5’ -CTTGTAGGGCACGGGT CGGAGA-3’ ）和 ELTD-AdE-Hind2 (5’ -AGCTTCTCCGAC CCGTGCCCTA-3’），製備連接物 ELTD-AdE-Hind。類似 ELTD-AdE-Eco，ELTD-AdE-Hind 連接物在一邊具有 Hindlll-可相容之5’ -AGCT突出物，並在另一邊具有5 ’ -CTTG 突出物。藉著煉合部分互補之寡核苷酸 ELTD-AdF-Bstl (5 ’ -GAATGGCTGGGAGAGTGCTGAG-3’ ）和 ELTD-AdF-Bst2 (5’ -GATCCTCAGCACTCTCCC AGCC-3’ ，製備連接物 ELTD-AdF-Bst。類似 ELTD-AdE -Eco, ELTD-AdF-Bst連接物在一邊具有BstYI-可相容之5’ -GATC突出物，並在另一邊具有5’ -GAAT突出物。所有的寡核苷酸均是從Sigma-Aldrich訂購，為經HPLC純化的，並溶解於 ImM Tris-HCl ' O.lmM EDTA，ρΗ8·0 中。藉著將每種適當的寡核苷酸（800uM)各15微升與60微升 2x 煉合緩衝溶液（20mM Tris-HCl、100mM NaCl、2mM EDTA，pH7.6)和3 0微升水混合，並在95°C在加熱塊中培養該混合物5分鐘，然後關掉加熱塊允許樣本内部慢慢地冷卻至30°C以下（花費3小時），以製備連接物。這產生 100uM 濃度的雙股連接物 ELTD-AdE-Eco、ELTD-AdE-Hind 和 ELTD-AdF-Bst 〇在下列的反應中將連接物 ELTD-AdE-Eco 和 ELTD-AdF-Bst 連接到 EcoRI/BstYI(EB)l-3kb 之 gDNA 片 200948969 段：1.3微克EB片段、0.4微升連接物ELTD-AdE-Eco (lOOuM)、0.4 微升連接物 ELTD-AdF-Est (100uM)、40 微升 • 2xQuick連接反應緩衝溶液、4微升Quick T4 DNA連接酶 (Quick Ligation™ 套組，New England Biolabs，M2200S)和水，至總體積 80微升。在下列的反應中將連接物 ELTD-AdE-Hind 和 ELTD-AdF-Bst 連接到 Hindlll/BstYI (HB)l-3kb之gDNA片段：1_0微克HB片段、0.4微升連接物 ELTD-AdE-Hind(lOOuM) 、 0.4 微升連接物 © ELTD-AdF-Est(lOOuM)、40 微升 2xQuick 連接反應緩衝溶液、4 微升 Quick T4 DNA 連接酶（Quick Ligation™ 套組， . New England Biolabs，M2200S)和水，至總體積 80 微升。在 25°C培養該連接混合物20分鐘，並使用 GenElute PCR Clean-Up 套組（Sigma-Aldrich，NA1020)純化。修補EB和HB gDNA之缺口和純化之在下列的反應中修補經連接連接物之gDNA’ s的缺口： 40微升得自 GenElute純化管柱的 gDNA、8微升 w lOxThermoPol反應緩衝溶液、8微升1毫克/毫升BSA、2 微升10mM dNTP、3微升8單位/微升Bst DNA聚合酶、大片段（New England Biolabs, M0275)和 19 微升水。在 65°C 培養該修補缺口反應30分鐘，並使用GenElute PCR Clean-Up 套組（Sigma-Aldrich, ΝΑ 1020)純化。這產生50微升0.02微克/微升（ΕΒ)和0.014微克/微升（ΗΒ)的經連接連接物之 gDNA，其準備好用於與富含單股CD之cDNA-珠子庫雜交。藉著PCR檢查連接物-連接步驟。在PCR反應中，使 47 200948969 用一毫微克經連接連接物並經修補缺口之EB製劑作為模板，使用引子ELTD-AdE-Ecol或ELTD-AdF-Bstl或兩者之組合（分別為E、F、EF)。類似地，在PCR反應中，使用經連接連接物之 HB 製劑作為模板，使用引子 ELTD-AdE-Hindl或ELTD-AdF-Bstl或兩者之組合（分別為 E、F、EF)。關於EB和HB，PCR反應如預期得到在l-3kb 區域中的拭跡。雜交並擴增所選擇之基因組DNA片段 cDNA-珠子庫與gDNA片段的雜交首先對螢火蟲蟲螢光素酶（Luc)基因片段測試雜交條件。簡言之，帶有ELTD-AdC和ELTD-AdD的單股200nt Luc 片段（Luc200)，經由ELTD-AdD的生物素標記與Dynabeads M-270結合。使該 Luc-珠子製劑與連接 ELTD-AdE和 -AdF(與非專一性之1400nt對照組DNA月段混合）的1600nt Luc片段雜交。在雜交和洗條之後，藉著驗性處理沖提出與 Luc200探針結合的片段，並藉著PCR擴增該片段。發現在比非專一性、未雜交之對照組片段高很多的濃度下，沖提出1600nt的Luc片段。在PCR期間，在這些片段的顯露之間有24次循環差異（假定100%PCR效力，224= 1·7χ107 倍的富含Lucl600)。對cDNA-珠子庫和gDNA使用相同的雜交和洗務條件。上述的EB和HB gDNA製劑係藉著加熱而變性。首先，在離心真空濃縮器中將13微升EB和12微升HB減少至5 微升。EB的量相當於0.26微克或大約0.2微微莫耳的平均 200948969 2kb片段。HB的量相當於〇17微克或大約〇13微微莫耳的平均2kb片段。然後在加熱塊中，在95t：使樣本變性5分 - 鐘’並直接放在冰上。將上述的富含單股CD之cDNA-珠子庫分配到兩個矽化試管内（各25微升珠子）。以2〇〇微升6xSSC/〇1%sds (預先加溫至6(TC )洗滌珠子三次，然後再懸浮於1〇〇微升 6XSSC/O.1〇/〇SDS中並保持6(rc。在一個試管中加入卽 gDNA，並在另一個試管中加入HB gDNA。在6CTC培養該試管4小時並溫和地旋轉。以5〇〇微升預先加溫的 6XSSC/0. P/oSDsaot )快速洗滌珠子兩次，以5〇〇微升在6〇 -°0的6xSSC/0_1%SDS隨旋轉洗滌三次15分鐘，以5〇〇微升 - 在室溫的6xSSC隨旋轉洗滌兩次5分鐘，並以500微升水快速洗滌一次。延伸雜交產物並以PCR擴增所選擇之gDNA片段使用經雜交之gDNA作為模板，使用在珠子上形成之 ❹ cDNA/gDNA雜交產物進行3’ cDNA端的延伸。在最後的水洗滌步驟之後，將珠子直接再懸浮於77微升水和2〇微升5xPhusi〇n™ HF緩衝溶液的混合物中’並移至新的矽化試管。接下來加入：2微升10mM dNTp和i微升2單位/ 微升 Phusion 熱啟動 DNA 聚合酶（Finnzymes，F_54〇)。在 72 °C延伸2分鐘。將珠子保持在〇〇c隔夜。用於PCR擴增的珠子具有不同的引子組合。利用下列的引子組擴增與EB gDNA雜交的珠子： l)ELTD-AdE-Ecol 和 ELTD-AdF-Bstl 49 200948969 2)ELTD-AdE-Ecol 3ELTD-AdF-Bstl。利用下列的引子組擴增與HB gDNA雜交的珠子： 4) ELTD-AdE-Hind3 和 ELTD-AdF-Bstl 5) ELTD-AdE-Hind3 6) ELTD-AdF-Bstl。 ELTD-引子 E-Hind3 具有卞^列的序列：5 ’ -GTAGGGCACGGGTCGGAGAAGC-3’ 。其與 ELTD-AdE-Hindl的大部分相同，並在3’端多3個nt(AGC)以吻合在經連接連接物和gDNA之間的Hindlll位置，並以在煉合期間對目標賦予較強的3’端結合。 PCR反應包括1微升EB或HB珠子、10微升5xPhusion ™ HF緩衝溶液、1微升10mM dNTP、2_5微升（10uM)的每種引子、0.5微升2單位/微升的Phusion熱啟動DNA聚合酶（Finnzymes, F-540)和水，至終體積50微升。為測定最適宜的循環次數，將反應混合物分配到五個0.2毫升PCR試管中（各」0微升），以礦物油覆蓋，放在熱循環器中，在98 °C變性30秒，隨後接受11、14、17、20和23次變性-煉合 -延伸循環：在98°C 5秒，在60°C 10秒，在72°C 2分鐘。接著是在72°C 5分鐘的最後延伸步驟。在1.2%瓊脂糖凝膠上分析每個反應各2.5微升。

在利用ELTD-AdE及/或ELTD-AdF引子的PCR反應中，具有範圍從l-3kb之片段（如對gDNA片段所預期的）發現拭跡。兩種引子之組合在1 7次循環時便已經得到EB 200948969 和HB樣本的PCR產物。僅利用ELTD-AdE，在23次循環之後發現產物，而利用ELTD-AdF引子在20次循環之後發 • 現相同強度的產物。這歸因於在基因組中出現比EcoRI-或

Hindlll-位置（GAATTC或AAGCTT)多的BstYI-限制位置（辨識位置：RGATCY)。擴增經雜交產物選擇之gDNA以用於高通量定序利用 HB gDNA 連同弓丨子 ELTD-AdE-Hind3 寺口 ELTD-AdF-Bstl以及20次循環的PCR反應，得到最佳的結果： © 範圍從l-3kb的均一拭跡。製備下列的PCR反應混合物20 倍，以增加足夠供高通量定序之DNA : 1微升HB珠子、10 . 微升 5xPhusion™ HF 緩衝溶液、1 微升 1 OmM dNTP、2,5 微升 ELTD-AdE-Hind3(10uM)、2.5 微升 ELTD-AdF-Bstl (10uM)、0.5微升2單位/微升Phusion熱啟動DNA聚合酶和水，至終體積50微升。將該反應混合物放在熱循環器中，在98°C變性30秒，隨後接受變性-煉合-延伸的20次循環：在98°C 5秒，在60°C 10秒，在72°C 2分鐘。接著是在

® 72°C 5分鐘的最終延伸步驟。使用兩個平行QIAquick PCR 純化管柱，純化該所謂的經雜交產物選擇和經擴增HB gDNA。以分光光度計測量到產量為14·8微克。高通量定序一部分經雜交產物選擇之HB gDNA。使用另一部分進行選殖和Sanger定序。擴增cDNA以用於高通量定序為增加足夠的富含CD之cDNA以用於高通量定序，製備20倍下列的PCR反應混合物：0.5微升經QIAquick管柱 51 200948969 純化的在「分離經單股CD-修改之cDNA」之下描述的 Dynabeads之第一個鹼性沖提物、10微升5xPhusionTM HF 緩衝溶液、1微升10mM dNTP、2.5微升10uM ELTD-引子 -C、2.5微升10uM ELTD-引子-D-NB、0.5微升2單位/微升 Phusion 熱啟動 DNA 聚合酶（Finnzymes，F-540)和 33 微升水。ELTD-引子D-NB具有與ELTD-引子D相同的序列，但在5 ’端不含生物素標記。將該反應混合物放在熱循環器中，在98°C變性30秒，隨後接受變性-煉合-延伸的11次循環：在98°C 5秒，在60°C 10秒，在72°C 15秒。接著是在72°C 5分鐘的最終延伸步驟。使用四個平行QIAquick PCR純化管柱純化經擴增之cDNA。在1.2%瓊脂糖凝膠上分析經純化之cDNA，並以分光光度計測量濃度。獲得總共 29微克富含雙股CD之cDNA。高通量定序該cDNA。經捕捉之基因組DNA分子的序列分析在以cDNA珠子捕捉基因組DNA之後，使用帶有 cDNA-gDNA雜交產物的珠子進行PCR擴增，其使用基因組 DNA 專一性引子組 ELTD-AdE-Hind3 和 ELTD-AdF-Bstl。選殖一部分基因組DNA，並交付800個殖系進行Sanger定序（平均讀值長度781bp)。使另一部分的基因組DNA接受高通量定序技術，產生具有平均長度337bp的序列讀值。詳細地分析由Έ00個個別Sanger序列和1 370個高通量序列讀值組成的兩個序列數據組，並與在公開的數據庫中所有可得之蘋果EST (NCBI，在2009年3月 9日登記 262.41 1)相比較。使用程式 BLASTN(S.F. Altschul 等人 52 200948969

NAR 25:3389-3402, 1997)進行基因組DNA序列與蘋果EST 序列的全面排比。 • 從8〇〇個Sanger序列，488個顯示與得自在公開資料庫中之蘋果EST收集的序列和得自1 37〇個基因組dna序列之隨機組的序列有顯著的類似性（e值i 〇-ιο)，765個展現出明顯的類似性（e值1〇 10)，顯示與cDNA相關性基因組 DNA的專一性捕捉是成功的。此外，這些基因組序列的局部排比顯示這些序列經常從5’或3’ CDNA邊界或内 ❹含子區延伸，顯示該技術能夠鑑認非編碼區域。若考慮已經僅從一邊定序片段，片段的尺寸在1Kb到3Kb之間變化， -且超過5〇%的序列與EST序列有可鑑認的類似性，似乎很明顯如果在與公開EST序列數據排比之前已經完全定序片段並建造入片段重疊群，會發現高很多百分比的序列吻合。因為蘋果基因組之尺寸大約為75〇Mb且在植物基因組中的基因數目為大約3G_而平均長度15曝p在基因組上藝產生4 5 M b的編碼序列，這意味著藉著隨機定序僅能夠標註 6%的基因組片段’而利用所描述之方法吾人發現超過別％的標註。從以上的實施例描述跨越EST邊界之基因組DNA片段的三個案例。實施例的三個案例之說明在圖4以及下文的序列排比中，出示利用本發明之法發現的三個顏果基因組序列之案例。案例1. 53 200948969 蘋果基因組序列FRA8S6E02IN5QW與從7個EST序列 (GenBank 登錄編號：C0899363 ' C0419003、CO052855、 C0752637、CO901846、CN927506 和 CO066317)建造之蘋果片段重疊群〇§89845〖_846_7的一部分顯示98.9%同一性。命中擬南芥（Arabidopsis thaliana )的片段重疊群 cg8984st_846_7 的最佳 BLASTX (S.F. Altschul 等人 NAR 25:3389-3402, 1997)為基因AT 1G70160(基因組位點標籤，擬南芥資訊來源（The Arabidopsis Information Resource)， http://www.arabidopsis.org)，具有 e-值 2e·104。三個序列排比顯示FRA8S6E02IN5QW含有具有未知功能之蛋白質的一部分蛋白質編碼序列（CDS)，其與片段重疊群 cg8984st_846_7部份重疊。在圖4,圖A中圖解出示該序列，並在下面出示此序列之相關部分的序列排比。 FRA8S6E02IN5QW的蛋白質編碼序列亦與AT1G70160有 77.8%相同，但在序列之5’ ·端與在AT 1G70160中之内含子相同位置的被内含子打斷（圊4，圖A和序列排比）。在該區域中在FRA8S6E02IN5QW和AT1G70160之間的同一性很低，為37.5%。在AT 1G70160中，内含子比在蘋果中者更小（在序列排比中以粗體字指出此一内含子的5 ’ -邊界）。在FRA8S6E02IN5QW中，在内含子序列的所有三個讀框中都有終止密碼子，且 BLAST 搜尋指出 FRA8S6E02IN5QW的CDS是與其他植物物種之類似蛋白質同源的，但在内含子區中卻喪失了該同源性。這表示 FRA8S6E02IN5QW確實是基因組序列，含有打斷性内含子 54 200948969 序列。此外，此處保守性低很多的内含子序列表示内含子序列含有比外顯子多的SNP。案例2 蘋果基因組殖系FRA8SE02HOH39對從21個EST序列 (GenBank 登錄編號：CN930585、CV525017、CN873920、 EB149394、EB121634、EB116211、CN909797、EB1 15871、 EB154300、 CN877800、 EB121026、 CN932122、 CN860924 、 EB1 10988、C0865849、CN488473、CN497072、CN90391 8、〇 CN903 403、DR996731與CN8943 3 0)建造之蘋果片段重疊群 cgl2357st_1428_21 顯示同源性。片段重疊群 . cgl2357st_1428_21含有對ATP-依賴性Clp蛋白酶蛋白水解次單元（最佳的BLASTX命中 EEF49880，蓖麻（Ricinus communis)，分數3e·128)具有類似性的蛋白質的完整編碼序列。 FRA8SE02HOH39 與 cgl2357st_1428_21 的 3’ -未經轉譯區部份重疊，並延伸越過聚A尾進入未經轉錄之基因組 DNA内，如同在圖4，圖B和下文的序排比列中所示。因此，FRA8SE02HOH39是含有經轉錄區3’ -側序列之基因組序列的實例。案例3 蘋果基因組序列02-H03與40個蘋果EST之5’ -部分部份重疊，對乙烯反應因子具有類似性（最佳的BLASTX命中 AAV66332，胡瓜（Cucumis sativus)，分數 6e-34)。在圖 4，圖C中對EST91044950圖解顯示此（GenBank登錄編號： 55 200948969 EB 155368)。其他的EST具有類似的5’端。在下文中出示序列之相關部分的排比。基因組序列自基因之轉譯起始密碼子（ATG)上游744bp延伸。對在02-H03中編碼區外面的任何基因，沒有發現序列類似性，證實這是基因組序列。在轉錄起始上游的保守性序列，為TATA匣。在EST之起始上游39bp處發現推定的TATA-匣（TATAAA)。參考文獻

Chang，S.，Puryear，J.與 Cairney J. 1993. A simple and efficient method for isolating RNA from pine trees. Plant Mol. Biol. Rep. 11: 113-116。

Kobayashi, N., Horikoshi, T., Katsuyama, H., Handa, T. 與 Takayanagi，K. 1998. A simple and efficient DNA extraction method for plants, especially woody plants. Plant Tissue Culture and Biotechnology 4: 76-80 o

Sambrook，J.，Fritsch, E.F.與 Maniatis T. 1989.

Molecular cloning. A laboratory manual. Second edition. Cold Spring Harbor Laboratory Press. USA。

FRA8S6E02IN5QW

TATGTTGTGATAACCATATGGCTTCCCTGACATGCTC

TGAACATACTCCCATGCTGCAGTAGAGTTGAATTTTGCA

CGCACCTCTGGATGCAAGGGAAGCAAGGCTATTTGTGGA

TTAGAACTATCCTTGAGTGTCAACTCCCACCACTCATCCC

ATGGAATCACCGCTATAATTTCTTCACCCTGCAATATTAA 56 200948969

ATTATTAATAAATGTAAAAATCAACCAAAAAGAAAAGA ACTAACCACAATAAACTCTACAAAAAAGAAAAGAACTA . AAGCAAAGTTTAAAATAATTAAGAAATCTGTGCAAGATT

GTCATATATTTAATTTTGTCCCTAAACAAACGCTCATCAT ATGTTCATCACTACAATCCTGATTCAACTATTATTCCACT AAAGGCAAAGAACCAAAACATTTAGCTTAATTTCTATTC CTAATAAATCCCAAANACATGAAATGAGTTGCTTGCATA AGCATATACTCAATTGAAAAT ❹ FRA8S6E02HOH39

. CAGCGACCTGTTTACGTGCAAGGTTTGGATGGAAGA

GATTGAACAGTGATGCCAAATTGAATTGCCTCCAGAACA AATCTGAAGGGTGCAAAAAACATGTACTTTTTGAGAGTT GAAGAATGACGACACTTTCTTATGTTCTATATTATCTTGG TTAAGTTTTTTGCAGGACGGAATGAATCCTCGTCTTTTTT TTCCCTATCAAAAAGAAGAAAGCTGAGTTTTTATGTTTG w ATGTCTTGATGATGGATGACCTAGTGTTCAAGTGAAAAA TTCGACGGACAAAACGCTTGGCAATCCAATTTGTGCCGT GTATAATGTGTCACGTCCAAACGAGTTTCACATCGAAGA AA 02_H03

TGTTATTGTTTCATTGAAACATAACGTTACATAACA

ATATAGGNNNCATTTGGAACAACTTTTAAAATGGCTGAA 57 200948969

AACGCATTTTGTGAAAATGATTTTTAAACAGTTTTGAGTA

AAAATACAATGAATCATAGAAAAGTACTTGAAATGCTTT

CTACAAATAGCATATAACTAGTGCTTATTTCAAAAAATA

TTNNNAAAACATAAACAAAATTCTCTAAAAATATTTACG

GTCATTGTAAAATCATTTTCAAACGTGATTATAATCAGG

CTATGTAAAATATTCTTTAATATTGACTCAACAATAAAC

GGCGAATCGAAACGATACACGGAGTGGAGCGTGGGAGA

TGGGAGGAAAGGATCACCGCACGCAATCAAAGAGTGCA

TTCGCAGCCGTCAGATGATGATAAAAATGATGGGTGTGC

TCTCTCGACAACGCACACATGCCACGTAATACGGAAACG

AACATTGCACAATTACTAAATTGCCACCGATGGAGAGCC

GCCCCTCCCTAATCCCATCTCAGTCAAATCCCTTGTTGAC

TGTGCGCCTCTCTCTCTCTCTCTCTCTCTCTCCTCTCTCTT

TCTCTCTCTTCAATTCCTCGCTCATCATTTCTATATAAAA

CCCACAGCCTGCCTCCTAGTCCTCCATCGCCATCTCCACA

CCCGTTTCTCTCACATATTTTCTGCAGCCAAACACTCTTT

CCACCCAAACACTACATACACAAAACGCCACCGTTTAGT

TATGGCGCCGAGAGAGAAGACGGCCACCGCCGCCGTTAG

GATGAACGGTAACGGAAACGTGAAGGAGGTGCATTTTAG

AGGTGTGAGGAAGAGGCCGTGGGGGAGGTACGCCGCCG

AGATCAGA 200948969 【圖式簡單說明】圖1 ·從mRNA創造小型單股DNA分子的圖解說明。C 為連接物，D為不同的連接物’B為生物素，p為磷酸鹽基團’ bp為鹼基對，ds為雙股，ss為單股，re為限制酵素， SA為鏈黴菌抗生物素蛋白，LD-PCR為長距離PCR，NAB(30) 和 NVTpo)為根據國際生物化學聯盟命名委員會 (Nomenclature Committee of the International Union of Biochemistry，NC-IUB)對於核苷酸之句法規則的核苦酸之單字母碼’ Apo)和τ(3())分別代表具有30個A和30個T的 Ο 延伸。圖2.創造基因組DNA片段以及後續與來自mRNA之小型單股DN A分子（圖1)雜交的圖解說明。在數個步驟之後，獲得可使用高通量定序方法定序的DNA片段。C和D為連接物，亦在圖1中敘述。E和F為不同的連接物，b為生物素，bp為驗基對，ds為雙股，ss為單股，且SA為鏈黴菌抗生物素蛋白。圖3 ·將未經鱗酸化之a和B連接物連接到經構酸化、〇經拋光之雙股基因組DNA片段的末端。A和B連接物核苷酸序列和在B連接物上出現5’生物素標籤兩者方面有差異。缺口出現在每個連接物的3’ -接合處且將片段藉著Bst DNA聚合酶的股_置換活性填滿。使用鏈黴菌抗生物素蛋白 -生物素交互作用以移除被同形合子連接物組（A/A和B/b) 包圍的片段，並以產生單股的庫模板。使片段與鏈黴菌抗生物素蛋白珠子結合；洗掉未結合的材料（由同形合子a/a 62 200948969 J 連接物組構成，其缺乏生物素）。然後將經固定之片段變性；透過經生物素基化之B連接物使B/B片段的兩股仍保持固定’同時洗出A/B片段，並用在後續的步驟中。圖4.ELGD計晝案例 1和2和3(powerpoint檔案）。圖 A.案例1.蘋果基因組序列FRA8S6E02IN5QW、蘋果EST片段重疊群（contig) Cg8984st—846—7和***芥基因 AT1G70160(沒有畫刻度）排比的圖解說明。僅顯示 AT1G70160 的相關 3’ -部分。在 FRA8S6E02IN5QW 和 ❿ AT1G70160中，以白框代表内含子。在cg8984st一846一7中，以細線顯示經剪接的内含子。以黑色顯示蛋白質編碼序列 (CDS)。以灰色顯示3，_未經轉譯區。以…#表示在序列中的聚A尾。圖B.案例2·蘋果基因組序列 FRA8SE〇2HOH39和蘋果膽片段重養群 cgl2357st一 1428_21(沒有晝刻度）排比的圖解說明。以黑色顯示蛋白質編碼序列（CDS)。以灰色顯示5, ·和3, ·未經轉譯區。以⑷η表示在cDNA序列中的聚A尾。囷c.案例3.頻果基因組序列02_H〇3和頻果EST 91〇4459〇(沒有畫刻度）排，的圖解說明。以黑色顯示蛋白f編碼序列仰〜以灰色 ^ 3 _未經轉譯區。以白色顯示在基因組序列中之未經轉錄的啟動子區。【主要元件符號說明】無 63

Claims

200948969 ，七、申請專利範圍·· 1.一種鑑認在樣本中之基因組DNA的方法，其包括 -從所選擇之生物分離mRNA’並從該mRNA製備小型 . 單股cDNA片段，其帶有一個含有親和力標記之連接物； ' -從相同或相關之生物分離基因、组DNA，隸該基因组 DNA製備與連接物分子連接的單股基因組dna片段； -使該單股基因組DNA片段與該單股cDNA片段雜交，並擴增該雜交產物；以及 φ -高通量定序該雜交產物。 2.如申請專利範圍第！項之方法，其包括下列步驟： a) 從生物之組織樣本分離並純化; b) 使用該mRNA作為模板，合成cDNA ; c) 可視需要簡化該cDNA的複雜度； d) 片段化該cDNA ; e) 可視需要以尺寸挑選該片段；〇可視需要藉著與經鏈黴菌抗生物素蛋白塗佈之親和〇力珠子結合’移除含有聚A的片段； g)拋光該cDNA片段； )使該片&與一個包括罕見限制酵素之辨識位置的連接物和另一個含有生物素標記的連接物連接；〇可視需要以尺寸挑選該月段； j) 修補該片段之缺口； k) 選擇含有兩種連接物序列的該片段； D使用與在步驟h中描述之連接物序列煉合的引子擴增 200948969 該片段，其中一個引子與具有罕見限制位置之連接物互補’而另一個引子則含有生物素標記； m)使該片段與經鏈黴菌抗生物素蛋白塗佈的親和力珠子結合； η)使用相對應限制酵素，從該片段移除含有罕見限制位置之連接物；〇)從經由生物素-鏈黴菌抗生物素蛋白交互作用而與親和力珠子附接的雙股DNA片段移除並未藉著生物素_鏈黴菌抗生物素蛋白交互作用與親和力珠子附接的單股產生與鏈黴菌抗生物素蛋白親和力珠子結合的單股Dna ; P)分離並純化基因組DNA，例如從步驟&的生物； q) 片段化該基因組DNA ; r) 可視需要拋光該基因組dna ; s) 使該基因組DNA與—個單—類型的連接物或與兩個不同類型的連接物（較佳）連接； t) 將該基因組DNA解鏈成單股DNA ; u) 使得自步驟t)之基因組DNA與得自步驟〇)在珠子上的cDNA雜交； v) 藉著洗滌移除未結合的基因組dna ; w) 藉著聚合酶延伸cDNA_基因組職雜交產物以創造雙股模板； X)對該基因組DNA_cDNA雜交產物進行pcR ; y)藉著尺寸分級分離，從該PCR中挑選超過大約⑽ 個鹼基對的片段；

❹ 其中序列係得以揭露多形位 200948969 * Z)可視需要純化該片段， aa)尚通置定序該片段。 3. —種鑑認多形性的方法，其包括如申請專利範圍之方法的所有步驟且另外還有以下步驟： ab)比較得自二或多個樣本的序列數據，以鑑認多形性。 4. 如申請專利範圍帛2或3項之方法，其中得自步驟 aa)之序列被合入部分重叠之個別序列的片段重疊群 (contig )申。 5_如申請專利範圍第2_4項中任一項之方法其中得自步驟ab)之序列或得自申請專利範圍第3項之片段重疊群係藉由自動標註而標註。 ' 6. 如前述申請專利範圍中任一項之方法，其中序列係得自屬於-物種之個體，並與可獲得的EST數據比較，以揭露非編碼^ ’如内含子插人和基因内部的非編碼序列。 7. 如刖述申請專利範圍中任一項之方法，其中序列係得自屬於相關物種之—或多個個體，並與可獲得的贿數比較’揭露非編碼序列，如内含子序列和基因内部的非編 8.如則述申睛專利範圍中任一項之方法自屬於相同物種夕-_V、夕稷之一或多個個體並被比較置0 9.如前述申过奎』丨_ m 叫專利範圍中任一項之方法，其中自來自不同物種夕.^ , 丁斤夕U 禮之—或多個個體並被比較，揭 3 200948969 I 〇.如前述申請專利範圍中任一項之方法，其中序列係得自來自不同物種之一或多個個體並被比較，以揭露在基因組DNA中的保守區域。 II ·如前述申請專利範圍中任一項之方法，其中得自步驟h)之包括罕見限制酵素之辨識位置的連接物包括酵素 SapI的辨識位置。 12.如前述申請專利範圍中任一項之方法，其中核酸的片段化係藉著霧化。 1 3 . —種進行如申請專利範圍第1或2項之方法的套組，其包括一或多個連接物和使用說明書、以及可視需要的一或多個與該連接物互補的引子、連接酶、及/或專一剪切該連接物的限制酵素、擴增套組本身的習知組份，像 dNTP、和聚合酶。 14.如申請專利範圍第13項之套組，其中該連接物係選自由以下者所組成之群組： 5’ -AGTCCGTCGCATCGCTCTTC-3’ 5’ -GAAGAGCGATGCGACG-3’ -生物素-TEG-AGTGGGTGTCCTGGGTCAAC-3’ 5’ -GTTGACCCAGGACACC-3’ 5， -CTTGTAGGGCACGGGTCGAGAG-3, -AATTCTCTCGACCCGTGCCCTA-3’ -CTTGTAGGGCACGGGTCGGAGA-3, -AGCTTCTCCGACCCGTGCCCTA-3’ 5’ -GAATGGCTGGGAGAGTGCTGAG-3’ 200948969 5’ -GATCCTCAGCACTCTCCCAGCC-3’ 與 5’ -GTAGGGCACGGGTCGGAGAAGC-3’ 八、圖式： (如次頁）

5