TWI445854B

TWI445854B - 基於大小之基因體分析

Info

Publication number: TWI445854B
Application number: TW099138272A
Authority: TW
Inventors: Yuk Ming Dennis Lo; Kwan Chee Chan; Wai Kwun Rossa Chiu; Wenli Zheng
Original assignee: Univ Hong Kong Chinese
Priority date: 2009-11-06
Filing date: 2010-11-05
Publication date: 2014-07-21
Also published as: US20220282332A1; CN107312844A; US8620593B2; CN107312844B; US9982300B2; US20110276277A1; US11365448B2; MX357692B; EA034241B1; IL219545A; EP3406737A1; BR112012010708A2; EP4212630A1; EA201200701A1; CA2780016C; CN102791881A; AU2010317019B2; JP2015165805A; US20140080720A1; EP3406737B1

Description

基於大小之基因體分析

本申請案主張2009年11月6日申請之題為「Detection of Chromosomal Imbalance」之美國臨時申請案第61/259076號及2010年6月30日申請之題為「Size-Based Genomic Analysis」之美國臨時申請案第61/360399號的優先權，且本申請案為非臨時申請案，該等臨時申請案以全文引用的方式併入本文中以達成所有目的。

本申請案亦與以下有關：2008年7月23日申請之題為「Diagnosing Fetal Chromosomal Aneuploidy Using Massively Parallel Genomic Sequencing」之美國申請案第12/178,181號(代理人案號016285-005220US)；題為「Diagnosing Fetal Chromosomal Aneuploidy Using Genomic Sequencing With Enrichment」之美國申請案第12/614350號(代理人案號016285-005221US)；及同時申請之題為「Fetal Genomic Analysis From A Maternal Biological Sample」之美國申請案(代理人案號016285-006710US)，該等申請案以全文引用的方式併入本文中以達成所有目的。

1997年，在母體血漿中發現胎兒DNA，此為非侵入性產前診斷帶來新的希望(Lo等人，Lancet 1997;350: 485-487)。此技術已快速轉變為臨床應用，藉由偵測來源於胎兒之父本遺傳基因或序列來例如確定胎兒性別及確定胎兒RhD狀態。然而，涉及母體與胎兒基因體中均存在之基因體標靶(例如染色體21)的產前診斷應用存在更大挑戰性。

最近顯示單分子計數技術因其優良的定量精確性而有望解決此問題(Lo等人，Proc Natl Acad Sci USA 2007;104: 13116-13121；Fan等人，Anal Chem 2007;79: 7576-7579；美國專利申請案11/701,686；Chiu等人，Trends Genet 2009;25: 324-331；Chiu等人，Proc Natl Acad Sci USA 2008;105: 20458-20463；Fan等人，Proc Natl Acad Sci USA 2008;105: 16266-16271)。該等方法藉由觀察患病者與健康者之間所選基因體位置之分子數目的數量差異來實現診斷目標。舉例而言，對於胎兒唐氏症候群(Down syndrome)之診斷，當胎兒罹患第21對染色體三體症時，染色體21之分子數目將增加(Chiu等人，Proc Natl Acad Sci USA 2008;105: 20458-20463；Fan等人，Proc Natl Acad Sci USA 2008;105: 16266-16271)。

然而，該等計數技術可能因數據點數目有限或其他缺點而受限制。因此，需要提供用於執行產前診斷之新方法、系統及設備，該等新方法、系統及設備與現有技術相比具有一定優勢。

本發明之某些實施例可提供可使用基於大小之分析在獲自懷孕女性個體之生物樣本中執行序列失衡(例如胎兒染色體非整倍性)之產前診斷的系統、方法及設備。舉例而言，可使用風險染色體之核酸分子片段的大小分佈來確定胎兒染色體非整倍性。一些實施例亦可偵測其他序列失衡，諸如生物樣本(含有母親及胎兒DNA)中之序列失衡，其中失衡係相對於母親之基因型、突變狀態或單倍型。若樣本單純地來自母親而非來自胎兒及母親，則可經由對應於特定序列之片段(核酸分子)的大小分佈相對於預期大小分佈來確定此種失衡。在某些情況下，移變(例如至較小之大小分佈)可表示不平衡。

在一實施例中，使用各別染色體之片段相對於彼此之大小分佈之分級(例如表示大小分佈之統計值)來確定失衡。舉例而言，可將測試樣本中風險染色體之片段的大小分級與獲自參考生物樣本之風險染色體的分級相比較。基於該比較，可執行診斷。舉例而言，若分級變化(例如指示核酸片段之大小減小)規定量，則可診斷，風險染色體中存在胎兒染色體非整倍性。在使用該分級分析之各個實施例中，可使用所有22個體染色體及性染色體，或可使用該等染色體之子集。

在另一實施例中，使用風險染色體片段之大小(例如表示大小分佈之統計值)與參考染色體片段之大小之間的差異。舉例而言，若大小之差異大於或小於截止值(亦稱為臨限值)，則可診斷，風險染色體中存在胎兒染色體非整倍性。

根據一實例實施例，提供一種在獲自懷孕女性個體之生物樣本中執行序列失衡之產前診斷的方法。生物樣本包括作為核酸序列之一部分的核酸分子。對於生物樣本中複數個核酸分子每一者，量測核酸分子大小並鑑別核酸分子所源自之核酸序列。電腦系統測定對應於第一序列之核酸分子之大小分佈。基於測定之大小分佈，確定第一序列是否存在序列失衡之分類。

根據另一實例實施例，提供一種在獲自懷孕女性個體之生物樣本中執行胎兒染色體非整倍性之產前診斷的方法。對於生物樣本中複數個核酸分子每一者，量測核酸分子大小並鑑別核酸分子所源自之染色體。電腦系統由對應於染色體之核酸分子之大小計算統計值。計算複數個染色體每一者之統計值。基於該統計值來確定染色體之分級。將所確定之第一染色體之分級與獲自參考生物樣本之第一染色體之另一分級相比較。基於該比較，確定第一染色體是否存在胎兒染色體非整倍性之分類。

根據另一實例實施例，提供一種在獲自懷孕女性個體之生物樣本中執行胎兒染色體非整倍性之產前診斷的方法。對於生物樣本中複數個核酸分子每一者，量測核酸分子大小並鑑別核酸分子所來源之染色體。電腦系統由對應於第一染色體之核酸分子之大小計算第一統計值。電腦系統由對應於一或多個第二染色體之核酸分子之大小計算第二統計值。確定第一統計值與第二統計值之間的分離值。將該分離值與一或多個截止值相比較。基於該比較，確定第一染色體是否存在胎兒染色體非整倍性之分類。

本發明之其他實施例係關於與本文所述之方法相關的系統及電腦可讀媒體。在一實施例中，電腦可讀媒體含有用於接收數據及分析數據之指令，但不含指導機器建立數據(例如對核酸分子進行定序)之指令。在另一實施例中，電腦可讀媒體含有指導機器建立數據之指令。在一實施例中，電腦程式產品包含儲存複數個指令之電腦可讀媒體，該複數個指令用於控制處理器執行本文所述之方法的操作。實施例亦係關於經組態以執行本文所述之任何方法之步驟的電腦系統，其可能具有執行各別步驟或各別步驟組之不同組件。

參考本說明書之其餘部分，包括圖式及申請專利範圍，將認識到本發明實施例之其他特徵及優勢。下文中將關於附圖詳細地描述本發明各實施例之其他特徵及優勢以及結構及操作。在該等圖式中，類似參考數字可指示相同或功能上相似之元件。

定義

如本文所使用之術語「生物樣本」係指任何取自個體(例如人類，諸如懷孕女性)且含有一或多個相關核酸分子之樣本。

術語「核酸」或「聚核苷酸」係指呈單股或雙股形式之去氧核糖核酸(DNA)或核糖核酸(RNA)及其聚合物。除非特定限制，否則該術語涵蓋含有天然核苷酸之已知類似物的核酸，該等類似物具有與參考核酸類似之結合性質且以與天然存在之核苷酸類似的方式代謝。除非另外指出，否則特定核酸序列亦暗中涵蓋其保守修飾變異體(例如簡併密碼子取代)、對偶基因、直系同源物、SNP、複本數變異體及互補序列以及明確指出之序列。特定言之，可藉由產生一或多個所選(或所有)密碼子之第三位經混合鹼基及/或去氧肌苷殘基取代之序列來達成簡併密碼子取代(Batzer等人，Nucleic Acid Res .19 :5081(1991)；Ohtsuka等人，J. Biol. Chem. 260 :2605-2608(1985)；及Rossolini等人，Mol. Cell. Probes 8 :91-98(1994))。術語核酸可與基因、cDNA、mRNA、非編碼小RNA、微型RNA(miRNA)、Piwi相互作用RNA及由基因或基因座編碼之短髮夾RNA(shRNA)互換使用。

術語「基因」意謂與產生多肽鏈或轉錄RNA產物相關之DNA區段。其可包括編碼區之前及之後的區域(前導區及尾隨區)，以及介於個別編碼區段(外顯子)之間的***序列(內含子)。

如本文所使用之術語「臨床相關核酸序列」(亦稱為標靶序列或染色體)可指對應於正測試潛在失衡之較大基因體序列之區段的聚核苷酸序列，或指較大基因體序列本身。一個實例為染色體21之序列。其他實例包括染色體18、13、X及Y。其他實例包括胎兒可自其父母中之一或兩者繼承或作為胎兒體內新生突變的突變基因序列或遺傳多形現象或複本數變異。在一些實施例中，多個臨床相關核酸序列或臨床相關核酸序列同等多個標記物可用以提供供偵測失衡之數據。舉例而言，可以添加方式使用來自染色體21上之5個不連續序列的數據，用於確定可能之染色體21失衡，從而將所需樣本量有效地降至1/5。

如本文所使用之術語「參考核酸序列」係指大小分佈可用於針對標靶序列進行比較的核酸序列。參考核酸序列之實例包括染色體、染色體之一部分、特定對偶基因(例如母親之對偶基因)、特定單倍型、基因體或人工合成之核酸序列。該等參考核酸序列可存在於樣本內部，或在樣本處理或分析期間由外部添加。在一些實施例中，參考核酸序列顯示代表無疾病健康狀態之大小概況。

如本文所使用之術語「基於」意謂「至少部分基於」且係指一值(或結果)用於確定另一值，諸如在一方法之輸入與該方法之輸出的關係中所出現。如本文所使用之術語「推導」亦指一方法之輸入與該方法之輸出的關係，諸如當推導為公式之計算時所出現。

如本文所使用之術語「參數」意謂表徵定量數據集及/或定量數據集之間的數值關係之數值。舉例而言，第一核酸序列之第一量與第二核酸序列之第二量之間的比率(或比率之函數)為參數。

如本文所使用，術語「基因座」為任何長度之核苷酸(或鹼基對)的位置或位址，其隨各基因體而變化。

如本文所使用之術語「序列失衡」意謂臨床相關核酸序列之量與參考量之間存在如由至少一個截止值所界定之任何顯著偏差。序列失衡可包括染色體劑量失衡、對偶基因失衡、突變劑量失衡、複本數失衡、單倍型劑量失衡及其他類似失衡。舉例而言，當胎兒具有不同於母親之基因型，從而產生樣本中特定基因座處之失衡時，可發生對偶基因或突變劑量失衡。

如本文所使用之術語「染色體非整倍性」意謂染色體數量與二倍體基因體之數量不同。該不同可能為增加或喪失。其可能涉及整個染色體或染色體區域。

如本文所使用之術語「單倍型」係指同一染色體或染色體區域上共同遺傳之多個基因座上對偶基因的組合。單倍型可指至少一對基因座或指染色體區域，或指整個染色體。術語「對偶基因」係指同一物理基因體基因座之替代性DNA序列，其可能導致或不導致不同表型特質。各染色體(除男性人類個體中之性染色體以外)具有兩個複本之任何特定二倍體生物體中，各基因之基因型包含一對對偶基因存在於基因座處，該對對偶基因之同型接合子相同且異型接合子不同。生物體之群體或物種通常包括各種個體中各基因座之多種對偶基因。在群體中發現一種以上對偶基因之基因體基因座稱為多形位點。基因座之對偶基因變化可量測為所存在之對偶基因數目(亦即多形現象程度)或群體中異型接合子之比例(亦即異型接合速率)。如本文所使用之術語「多形現象」係指人類基因體之任何個體間差異，與其出現頻率無關。該等差異之實例包括(但不限於)單一核苷酸多形現象、簡單串聯重複多形現象、***-缺失多形現象、突變(可能導致疾病)及複本數變異。

已發現，懷孕女性血漿中存在之胎兒DNA分子一般比源於母體之分子短(Chan等人，Clin Chem 2004;50: 88-92；Li等人，Clin Chem 2004;50: 1002-1011；美國專利申請案20050164241)。本發明之某些實施例可藉由源於基因體之特定部分之DNA分子大小自母體血漿DNA的變化，來確定胎兒是過度表現基因體之該部分還是表現不足。因為胎兒DNA佔母體血漿中之極小部分，所以母體血漿之總體大小變化程度可能較小，因而難以偵測。在一些實施例中，量測大量分子之大小以達到患病者與健康者之間統計上顯著之差異。

I.　測定片段大小

一種可用於量測大量DNA分子大小之方法為大規模平行基因體定序。此方法可例如藉由以下來執行：Illumina基因體分析儀平台(使用藉由合成之定序)(Bentley DR等人，Nature 2008;456: 53-59)；ABI SOLiD(使用藉由連接之定序)(McKernan等人，Genome Res 2009;19:1527-1541)；Roche 454平台(Marguelis等人，Nature 2005;437:376-380)；及Helicos單分子定序平台(Harris等人，Science 2008;320:106-109)。亦預期亦可使用其他大規模平行定序平台，例如Pacific Biosciences單分子實時(SMRT^TM )技術(Eid等人，Science 2009;323: 133-138)、奈米孔定序(Clarke J等人，Nat Nanotechnol 2009;4: 465-470)、半導體定序(例如Ion Torrent(www.iontorrent.com))等。

一種由該定序獲得DNA大小資訊之方式為執行末端配對(paired-end)(PE)定序，其中對DNA分子之兩個末端進行定序。接著對應於該分子之兩個末端的序列可反向定位至參考基因體(例如參考人類基因體，或參考馬類基因體，或任何相關動物之基因體)。在一實施例中，兩個末端各自定序足以使各末端個別地反向定位至參考人類基因體之長度(例如約10-24個鹼基或25-36個鹼基)。在另一實施例中，僅一定比例之序列可反向定位而不會與人類基因體之非重複區域錯配。在一態樣中，若兩個序列一起用於定位，則定位可為明確的。在此情形下，即使各末端可能因過短而無法明確地反向定位，使用兩個序列亦可明確地定位。兩個序列末端之基因體座標相減即可算出分子之大小。

在另一實施例中，可藉由對整個DNA分子而非僅僅兩個末端進行完整或接近完整之定序來獲得該分子之大小。此舉可藉由具有相對長之讀數長度的定序平台有效地進行，諸如Roche 454平台、Pacific Biosciences單分子實時(SMRT^TM )技術及Ion Torrent技術(www.iontorrent.com)。

藉由使用索引或條形碼，可增加上述基於定序之方法之產量(Cronn等人，Nucleic Acids Res 2008;36: e122)。因此，可向特定核酸定序庫中之核酸片段中添加樣本或患者特異性索引或條形碼。接著將大量各自具有樣本或患者特異性索引或條形碼之該等庫混合在一起並一起定序。定序反應後，可基於條形碼或索引，自各樣本或患者中收穫定序數據。此策略可增加產量，因而增加本發明之成本效益。

在另一實施例中，可在大小分析之前選擇或分級分離生物樣本中之核酸分子。在一變體中，用優先結合基因體(例如染色體21、18、13或X中之一者)中所選基因座之核酸分子的裝置(例如含有探針之微陣列或溶液)處理核酸分子，接著可對核酸分子之結合子集執行大小分析。在此類實施例中，可使用Nimblegen序列捕捉系統(www.nimblegen.com/products/seqcap/index.html)或Agilent SureSelect靶向序列富集系統(www.opengenomics.com/SureSelect_Target_Enrichment_System)或類似平台。在另一實施例中，可有區別地移除或降解或消化未結合之核酸子集。

至少一些實施例可用可分析染色體起源及分子長度之任何單分子分析平台進行，例如電泳、光學法(例如光學定位及其變體，en.wikipedia.org/wiki/Optical_mapping#cite_note-Nanocoding-3，及Jo等人，Proc Natl Acad Sci USA 2007;104: 2673-2678)、基於螢光之方法、基於探針之方法、數位PCR(基於微流體或基於乳液，例如BEAMing(Dressman等人，Proc Natl Acad Sci USA 2003;100: 8817-8822)、RainDance(www.raindancetech.com/technology/pcr-genomics-research.asp)、滾環擴增、質譜分析、熔融分析(或熔融曲線分析)、分子篩等。舉例而言，對於質譜分析，較長分子將具有較大質量(大小值之一實例)。

在一實例中，藉由Illumina基因體分析儀系統使用末端配對定序方案對血漿DNA分子隨機定序。在此實驗中，使用1型Illumina末端配對(PE)簇產生試劑套組。對各末端36個bp定序。使用Illumina提供之GAPipeline-1.0套裝軟體中的eland_pair程式將各序列之兩個末端與重複遮蔽之人類基因體(NCBI Build 36，48型)比對。各末端之36個bp中僅32個bp用於達成比對目的。

在一些實施例中，符合以下標準之PE讀數可用於隨後分析：(1)所建議之各對之個別成員均在定序流動槽上與對人類參考基因體所預期相同之簇位置上定序且可與對人類參考基因體所預期相同之具有正確定向的染色體比對；(2)該對之兩個成員之定序讀數可與重複遮蔽之人類參考基因體比對而不存在任何核苷酸錯配；(3)該對之各成員之定序讀數具有>4之獨特得分；且(4)該等對顯示***物大小小於600 bp。接著根據兩個末端每一者之位置計算各比對序列之大小。

II.　使用大小分佈確定非整倍性狀態

圖1為說明根據本發明之實施例在獲自懷孕女性個體之生物樣本中執行序列失衡之產前診斷之方法100的流程圖。雖然方法100主要描述分析胎兒染色體非整倍性方面，但方法100之其他實施例及本文中之其他方法可應用於其他序列失衡(例如鑑別基因型或突變)。方法100及本文所提及之其他方法可完全或部分地由包括一或多個處理器之電腦系統來執行。

方法100及本文所述之任何方法均可完全或部分地用包括處理器之電腦系統執行，該電腦系統可經組態以執行該等步驟。因而，實施例係關於經組態以執行本文所述之任何方法之步驟的電腦系統，其可能具有執行各別步驟或各別步驟組之不同組件。雖然以編號步驟呈現，但本文中之方法的步驟可同時或以不同順序執行。另外，部分此等步驟可與其他方法之部分其他步驟一起使用。亦可視情況選用所有或部分步驟。另外，任何方法之任何步驟均可用模組、迴路或其他用於執行此等步驟之方式執行。

在步驟110中，量測生物樣本中至少一些核酸分子(例如DNA或RNA)之大小。核酸分子亦稱為片段，因為其為整個基因體之片段。可經由任何適合方法量測大小，例如上述方法。

步驟120鑑別基因體中各核酸分子所源自之位置。該位置可為基因體之任何部分，對於所提供之實例，該基因體為人類基因體，但可能為其他基因體。舉例而言，該位置可為片段所源自之染色體編號，染色體之該部分可由基因體座標(例如特定座標或座標範圍)所界定，且甚至可能為片段所源自(源於)之兩個染色體(假設整倍體)之一。

在一實施例中，此鑑別可藉由定序及比較序列資訊與參考人類基因體序列來執行。在另一實施例中，此鑑別可藉由與具有已知染色體起源之探針組雜交來執行。可用一或多個螢光標記，以微陣列格式或於溶液中標記探針。在另一實施例中，核酸分子可由探針組捕捉於溶液中或固體表面上，接著對所捕捉(或仍未捕捉)之核酸分子進行定序。在一些實施例中，若欲鑑別除染色體非整倍性以外之序列失衡，則可視情況選用鑑別片段所源於之染色體的步驟。

在步驟130中，測定對應於第一位置(例如第一染色體)之核酸分子之大小分佈。各實施例可使用各種大小分佈。在一些實施例中，大小分佈涉及一個染色體之片段相對於其他染色體之片段的大小(例如平均值、平均數、中值)分級。在其他實施例中，大小分佈可涉及染色體片段之實際大小之統計值。在一實施例中，統計值可包括染色體片段之任何平均值、平均數或中值大小。在另一實施例中，統計值可包括低於截止值之片段的總長度(其可除以所有片段之總長度)，或至少低於較大截止值之片段的總長度。

在步驟140中，基於所測定之大小分佈，確定第一位置是否存在序列失衡之分類。在一實施例中，將染色體之分級與參考分級(例如一個整倍體樣本)相比較。若變化顯著(例如超過臨限值)，則樣本可分類為非整倍體。在另一實施例中，在兩個染色體之間或染色體組之間比較實際大小之統計值。舉例而言，可在各別統計值之間獲取差異，並將該差異與截止值相比較。

II.　大小分佈(等級)

實施例可使用樣本之核酸片段之大小值來確定是否存在染色體失衡。在執行定序後，片段亦稱為序列。在一實施例中，測定複數個染色體之片段的大小分佈，且基於該分佈之統計值(例如平均值、平均數或中值)對染色體進行分級。為方便起見，術語「大小」在本文中可與大小之統計值同義使用。應清楚術語「大小」在何時指特定片段之大小及在何時指一組片段之大小之統計值。

A .　等級

圖2為說明源自母體血漿中之不同染色體的DNA片段經量測之大小分佈的圖200。因為所量測之大小不僅可反映活體內DNA片段大小，而且亦可反映分析步驟之影響，所以預期大小分佈可隨各平台而變化(例如Illumina基因體分析儀及ABI SOLiD平台)，且甚至可在不同試劑型式用於特定平台時不同。然而，只要參考樣本與測試樣本均使用相同平台或試劑類型分析，即可以與平台/試劑無關之方式使用實施例。一些實施例亦可與不同平台及/或試劑類型一起使用，舉例而言，在可確定並修正任何誤差，或者平台及/或試劑類型可顯示其具有精密匹配之分析效能的情況下。

圖2中，在與染色體比對之片段序列之大小方面比較22個體染色體及染色體X。在Y軸上，等級呈序列大小下降順序，亦即具有最長序列之染色體的等級為1，且具有最短序列之染色體的等級為23。在一實施例中，使用SigmaStat(SPSS)軟體進行無參數比較(對等級進行葛斯卡爾-華里斯單因子變異數分析(Kruskal-Wallis One Way Analysis of Variance)，接著進行邦費羅尼校正逐對比較(Bonferroni-corrected pairwise comparison))。該比較可針對任何表示大小之統計值，包括各染色體序列之各個別大小之分級及個別分級之統計分析。在一實施例中，在等級編號時允許並列及跳躍。

在一些實施例中，各序列定位至特定染色體。接著，對於各染色體，確定定位至該染色體之序列的一或多個統計值。亦即可針對各染色體之大小計算不同類型之統計值(例如平均數及中值)。接著可對相應統計值分級。舉例而言，各染色體之平均大小可相互比較。若使用一個以上統計值，則可組合該等統計值(例如根據一些公式，諸如加權平均值)，且可對此組合統計值進行分級。在一實施例中，可組合特定染色體之統計值之分級(例如如上文關於統計值所提及)，接著所組合之分級可相互比較。

在其他實施例中，所有序列均根據大小個別地分級。亦即若存在1,000,000個序列，則分級自1至100萬進行，在分級編號中可能存在並列及跳躍。接著定位至同一染色體之所有序列之分級可加在一起。分級之總和可除以與特定染色體比對之序列的數目以獲得該染色體之平均序列分級。具有最高平均序列分級之染色體可標記為最長(等級1，為Y軸上最高)且具有最低平均序列分級之染色體將為最短的(等級23，為Y軸上最低)。在另一實施例中，可確定中值分級。圖2中顯示整倍體男性胎兒、整倍體女性胎兒及第21對染色體三體之男性胎兒案例之中值分級。

在X軸上，染色體按來源於各染色體(除X染色體外(參看下文))之DNA片段之大小分佈呈下降順序來排列。在一實施例中，對於該分級，僅使用整倍體案例。具有最長所測大小(例如長度)之染色體排列於左側。X染色體置於圖右側，因為其分級由胎兒性別控制。

如上文所提及，所測大小可隨各平台而變化(例如當Illumina系統變成另一系統時)。因而在一態樣中，大小可能指『所測』大小，與實際大小相反。甚至當Illumina套組之一種型式轉變為另一型式時，例如當1型末端配對簇產生套組變成2型時，大小亦可能變化。在一實施例中，使用者可用其特定系統執行分級。

由圖2可見，與懷有男性胎兒之懷孕女性相比，懷有女性胎兒之懷孕女性之血漿中X染色體之平均等級較低。此觀察結果之解釋為，胎兒所釋放之DNA片段比母親之DNA片段短。因此，女性胎兒藉由釋放雙倍劑量之X染色體，將使源自母體血漿中之X染色體之片段的總體量測大小降低。反之，男性胎兒僅能夠釋放單一劑量之X染色體。

由圖2亦可見，與懷有整倍體胎兒之懷孕女性相比，懷有第21對染色體三體胎兒之懷孕女性的血漿中染色體21之等級降低(亦即變短)。此觀察結果之解釋可再次追溯至源自母體血漿中之染色體21之片段的所量測大小。反之，對於整倍體胎兒，每個胎兒細胞僅能夠釋放兩倍劑量染色體21。

圖3為顯示根據本發明之實施例源自母體血漿中不同染色體之序列之大小分析的圖300，其可用於胎兒染色體21非整倍性之非侵入性產前偵測。在此實例中，染色體大小由與其他染色體相比較時之大小等級表示。因此，較大大小等級編號表明染色體具有母體血漿中之較短DNA片段大小。

圖300顯示，與胎兒為整倍體時(在等級9至等級18範圍內)相比，懷有第21對染色體三體胎兒之孕婦的母體血漿中之染色體21之大小等級編號較大(因此表明DNA片段較短)(在等級18至等級21範圍內)。此觀察結果之解釋為，胎兒DNA比母體DNA短且第21對染色體三體胎兒之額外染色體21劑量將導致母體血漿中染色體21序列之統計值總體上縮短。

B .　使用等級之方法

圖4為說明根據本發明之實施例使用大小統計值之分級在獲自懷孕女性個體之生物樣本中執行胎兒染色體非整倍性之產前診斷之方法的流程圖。

在步驟410中，量測複數個獲自生物樣本之核酸分子(片段)每一者的大小。注意，此複數個核酸分子可為所獲得之所有核酸分子之子集。當定序作為大小量測之一部分進行時，複數個核酸分子甚至可為經定序之所有核酸分子之子集。

在步驟420中，鑑別複數個核酸分子每一者所源自之染色體。在各實施例中，步驟410與420之順序可顛倒或同時進行。舉例而言，在末端配對定序情況下，序列之基因體比對可提供其染色體位置加其長度(藉由將基因體起始座標與末端座標相減)。在一實施例中，可如步驟120中鑑別染色體。

在步驟430中，對於複數個染色體每一者，由對應於該染色體之核酸分子的大小計算統計值。統計值可以本文所述之任何方式計算。舉例而言，統計值可包括如上所述之初步分級階段之結果。在一實施例中，僅使用一部分對應於任何特定染色體之核酸分子。

在步驟440中，基於統計值，確定染色體之分級。在一實施例中，可使用基礎排序算法確定分級。在另一實施例中，可執行更複雜之比較，諸如對等級進行葛斯卡爾-華里斯單因子變異數分析，接著進行邦費羅尼校正逐對比較或其他適合方法。在各實施例中，分級可能為整數、分數、實數(例如在一定範圍內)或基於成規之字母數字分級(例如A-X)。

在步驟450中，將所確定之第一染色體之分級與獲自參考生物樣本之第一染色體之另一分級相比較。在一實施例中，該比較為所確定之分級相對於截止臨限值(例如單一值或範圍)之比較，該截止臨限值係由一或多個參考生物樣本之分級確定。此種截止值可為等級是否為18(或19)或更高，如自圖3可確定。在另一實施例中，可確定兩個樣本之間第一染色體之分級差異，且可將該差異與截止值相比較。在一實施例中，分析參考生物樣本以確定其不含相關疾病，且甚至可確定該樣本不含任何可能引起分級問題之相關疾病。

在步驟460中，基於該比較，確定第一染色體是否存在胎兒染色體非整倍性之分類。在一實施例中，該分類可為疾病或非疾病之二元分類。在另一實施例中，該分類可為三元分類，因為可使用不確定分類。在另一實施例中，該分類可包括特定分類之機率，因而實際上不止三種分類。

III.　大小分佈(大小統計值)

在其他實施例中，與分級相反，大小分佈可包括片段大小之統計值(例如特定基因體位置之實際值或絕對值的統計值)。在一實施例中，可將第一染色體之實際大小與同一測試樣本之一或多個參考染色體之實際大小相比較。舉例而言，可將第一染色體與一或多個參考染色體之此等實際大小之間的分離值(例如差異或比率)與截止值相比較。在一實施例中，可確定參考樣本之截止值。在另一實施例中，可使用測試樣本與參考生物樣本之染色體片段之實際大小之間的分離值以及截止值。在另一實施例中，染色體片段之實際大小可相對於截止值比較以獲得可靠分類。

A.　絕對大小

一些實例顯示，藉由將源自染色體21之片段的絕對大小與源自一或多個參考染色體之片段的絕對大小相比較，可實現第21對染色體三體症之非侵入性產前偵測。在一實施例中，可選擇染色體7及染色體14作為參考染色體，因為在母體血漿中其大小值(例如絕對大小或大小分級)相對接近染色體21。實際上，對於整倍體樣本，參考染色體可為片段大小在例如特定分析平台及/或試劑類型上相對於染色體21(或其他相關染色體)一致之任何染色體。

圖5為說明根據本發明之實施例依據與各別染色體比對之序列大小來比較染色體21與染色體7及染色體14的表500。表500之數據獲自16份測試樣本。對於各樣本，展示染色體7、14及21各自片段之平均大小。亦提供平均值之間的差異。p值說明健康樣本中將出現各差異之可能性。

如自圖5之表500可見，對於所有懷有第21對染色體三體之胎兒之情況，與染色體21比對之序列均比與染色體7及染色體14比對之序列顯著短(例如平均大小)(曼-懷特尼等級總和測試(Mann-Whitney rank-sum test)，p值<0.001)。未在懷有整倍體胎兒之情況中觀察到此種統計顯著性程度之縮短。因此，表500指示對於所有懷有第21對染色體三體之胎兒之情況，染色體21與染色體7之間的平均片段大小差異大於1 bp，而整倍體案例中無一者顯示超過1 bp之差異。因此，1 bp可提供確定分類之精確截止值。類似地，對於所有懷有第21對染色體三體之胎兒之情況，染色體14之平均片段大小一致大於染色體21之片段大小。實際上，若在與染色體21相比時，0.5 bp之截止值用於所觀察到之染色體14片段「變長」，則所有第21對染色體三體案例均可與非第21對染色體三體案例區別開。因此，在一實施例中，可由一或多個參考樣本確定截止值。

B.　使用絕對大小之方法

圖6為說明根據本發明之實施例使用對某一基因體位置之片段大小統計值之比較在獲自懷孕女性個體之生物樣本中執行序列失衡之產前診斷之方法的流程圖。在一態樣中，方法600可關於基於第一染色體之片段大小與一或多個參考染色體之片段大小的分離值(例如差異或比率)確定序列失衡之分類。

在步驟610中，量測複數個獲自生物樣本之核酸分子的大小。請注意，可如關於步驟410所述來獲得複數個核酸分子且包括類似片段。

在步驟620中，鑑別各核酸分子所源自之基因體位置。該位置可為基因體之任何部分，如步驟120及別處所述。舉例而言，鑑別複數個核酸分子之每一者所源自之染色體。此測定可藉由定位至參考基因體來進行，如本文所述。

在步驟630中，由對應於第一基因體位置(例如第一染色體)之核酸分子之大小計算第一統計值。在一實施例中，第一統計值可為對應於第一染色體之片段的平均或中值大小。在另一實施例中，第一統計值可包括低於第一大小之片段的長度總和，該第一大小可為一種類型截止值。舉例而言，可計算小於200 bp之各片段的長度總和。該總和可除以另一數值，諸如對應於第一染色體之所有片段的長度總和或大於第二大小截止值(其可與第一大小相同)之片段的長度總和。舉例而言，第一統計值可為低於第一大小截止值之片段的總長度相對於片段總長度之比率，或小片段之總長度相對於大片段之總長度的比率。

在步驟640中，由對應於第二基因體位置(例如第二染色體)之核酸分子之大小計算第二統計值。第二染色體可視為參考染色體。在一實施例中，可計算出複數個參考染色體之統計值。在一實施例中，可組合該等統計值以使統計值可與一或多個第二染色體相關。在另一實施例中，可個別地比較複數個參考染色體之統計值，如下文所提及。

在步驟650中，將第一統計值與第二統計值相比較以獲得分離值。在一實施例中，分離值可為所確定之第一統計值與第二統計值之間的差異。在另一實施例中，分離值可為兩個統計值之比率。在另一實施例中，可確定複數個分離值，例如每個第二統計值一個分離值，其可針對各參考染色體來計算。

在步驟660中，將分離值與一或多個截止值比較。在一實施例中，可對複數個分離值每一者執行該比較。舉例而言，如上文所提及，可確定第一統計值與每個第二分離值之間的不同分離值。在各實施例中，各分離值可與相同或不同截止值比較。在另一實施例中，將分離值與兩個截止值相比較以確定分離值是否處於特定範圍內。該範圍可包括一個截止值用於確定是否存在不正常數據點(例如非整倍性)，且第二截止值可用於確定該數據點是否可能由量測或分析誤差所致(例如是否分離值比以前甚至對患病樣本所預期大)。

在步驟670中，基於該比較，確定第一基因體位置是否存在序列失衡(例如胎兒染色體非整倍性)之分類。在一實施例中，對於單一分離值，可使用複數個截止值(例如N個截止值)。在此種實施例中，可確定N+1個分類。舉例而言，可使用兩個截止值來確定整倍體分類(正常或健康)、不確定分類及非整倍體分類(患病或不健康)。在另一實施例中，若執行複數次比較(例如每個分離值進行一次)，則分類可基於各次比較。舉例而言，基於規則之方法可檢查由各次比較所產生之分類。在一實施例中，僅當所有分類一致時才可提供明確分類。在另一實施例中，使用大部分分類。在另一實施例中，可使用基於各分離值相對於各別截止值之接近程度的更複雜公式，且可分析此等接近程度值以確定分類。舉例而言，可計算接近程度值之總和(以及其他因數，諸如正規化)，且可將該結果與另一截止值相比較。

在其他實施例中，亦可應用方法600之變體將第一染色體之統計值與截止值直接比較，該截止值可源自參考樣本。一些實施例亦可用於分析來自未懷孕個體之生物樣本。此類分析可僅考慮樣本所有片段之大小的統計值，並將該統計值或分離值與截止值相比較以確定是否可能存在序列失衡。若失衡分類為存在，則可例如藉由分析特定基因體位置(例如染色體)之統計大小值及/或分離值來進一步分析失衡之位置。

C.　使用短片段之總長度

如上文所提及，在一些實施例中，血漿DNA之大小分佈亦可由短DNA片段佔總DNA長度之分數來反映。舉例而言，大小分佈可包括低於截止值之片段的總長度(其可除以所有片段之總長度)或至少低於較大截止值之片段的總長度。反之，血漿DNA之大小分佈亦可由長DNA片段佔總DNA長度之分數來反映。舉例而言，大小分佈可包括高於截止值之片段的總長度(其可除以所有片段之總長度)或至少低於較小截止值之片段的總長度。舉例而言，亦可使用小與大之比率。一實施例使用150 bp作為截止值來界定短血漿DNA片段。然而，亦可使用任何截止值，例如130 bp、140 bp、160 bp及170 bp作為截止值來界定短DNA片段。請注意，如本文所使用，在提及單股片段之長度時，鹼基對亦可與許多核苷酸(nt)同義提及。

在一實施例中，可如下計算短DNA片段佔DNA長度之分數：F=短DNA片段佔DNA長度之分數；S=所有短DNA片段(長度相等或低於截止值)之長度總和；且T=樣本中所有DNA片段(不管其長度如何)之總長度。因此，可由F=S/T提供該分數，其為大小統計值之一個實例。可計算樣本之所有片段或基因體之特定位置(例如特定染色體)的F。

在一實施例中，可確定樣本中所有DNA片段之總長度。接著，可選擇截止值大小(w)，低於該截止值大小之DNA片段定義為「短片段」。截止值大小可變化及經選擇以滿足不同診斷目的。可藉由計算等於或短於截止值大小的所有DNA片段之長度的總和來計算短DNA片段之總長度。短DNA片段佔總長度之分數可計算如下：F=Σ^w 長度/Σ⁶⁰⁰ 長度，其中Σ^w 長度表示長度等於或小於截止值w(bp)之DNA片段之長度的總和；及Σ⁶⁰⁰ 長度表示等於或小於600 bp之DNA片段之長度的總和。統計值F亦可用於使用分級之實施例中。舉例而言，可計算一組各別基因體位置(例如染色體)每一者之片段的F。

出於說明性目的，在以下實例中藉由計算短於600 bp之片段的總和來計算總長度。然而，例如400 bp、500 bp及700 bp之其他大小限制可用於計算「總長度」。在此實例中，基於600 bp或600 bp以下之DNA片段計算總長度，此係因為Illumina基因體分析儀(Solexa)系統對長於600 bp之DNA片段進行擴增及定序無效。另外，將該分析限於短於600 bp之DNA片段亦可避免因基因體結構變化而產生之偏差。在例如重排之結構變化(Kidd JM等人，Nature 2008;453:56-64)存在下，當藉由將DNA片段之末端定位至參考基因體以生物資訊學方式估計大小時，可能過高估計DNA片段之大小。另外，成功定序並定位至參考基因體之所有DNA片段中99.9%以上少於600 bp，因而包括等於及短於600 bp之所有片段將提供對樣本中DNA片段之大小分佈的代表性估計。

如上文所論述，對於胎兒具有額外副本之染色體，可觀察到DNA片段移變至較短大小分佈。在一態樣中，量測處於非整倍性風險中之染色體(標靶染色體)與未處於非整倍性風險中之染色體(參考染色體)之間短DNA片段佔總長度之分數的差異可為確定源自此等染色體之DNA片段之大小分佈是否不同的定量量測方法。

在一實施例中，將F_(Tar) 及F_(Ref) 分別定義為處於非整倍性風險中之染色體及參考染色體之短DNA片段佔總長度之分數。標靶染色體與參考染色體之間短DNA片段佔總長度之分數的差異(ΔF_(Tar-Ref) )可如下計算：ΔF_(Tar-Ref) =F_(Tar) -F_(Ref) 。舉例而言，ΔF_(21-1) 為染色體21與染色體1之間短DNA片段佔總長度之分數的差異。將在以下部分中論述ΔF_(Tar-Ref) 在胎兒染色體非整倍性之產前診斷中之應用。在另一實施例中，比率F_(Tar) /F_(Ref) 亦可以類似於使用Δ F_(Tar-Ref) 之方式用作分離值。

標靶染色體與參考染色體之F值之間的差異可用作確定胎兒之標靶染色體是否為染色體三體之統計值。當胎兒之標靶染色體為染色體三體時，胎兒之染色體三體將向母體血漿貢獻額外劑量之短胎兒DNA，因此會造成標靶染色體序列之大小分佈明顯縮短。此標靶染色體序列之大小分佈縮短將導致標靶序列之短DNA片段佔序列長度之分數(F_target )增加。因此，F_target 與F_ref 之間的差異ΔF將增加。

圖7展示懷有男性胎兒之母體血漿樣本的短片段佔總長度之分數(F)相對於截止值大小(w)的圖700。與體染色體及染色體Y比對之DNA片段的F值相對於用於界定「短DNA片段」之截止值大小繪於縱軸上。在懷男性胎兒之情況下，與染色體Y比對之DNA分子表示自男性胎兒釋放之DNA。因為母體血漿中大部分循環DNA分子源自母親，所以與體染色體比對之DNA片段應主要表示母體DNA片段。F值隨截止值大小而增加，且當樣本中所有DNA片段均短於或等於截止值大小時接近值1.0。兩個物種DNA分子之間的大小分佈差異可由其F值差異反映。F值愈高，短片段佔總長度之分數愈高，因而DNA片段之大小分佈愈短。

如圖700中所示，染色體Y之DNA分子之大小分佈比體染色體之DNA之大小分佈短。特定言之，染色體Y之F值比體染色體之F值上升早，導致F_Y 比F_體染色體高80 bp至350 bp。將染色體Y與體染色體之F值差異(ΔF_{(Y-體染色體)} )進一步相對於截止值大小繪圖，且由虛線(dashed line)表示，其在80 bp至350 bp之間為正數。ΔF_{(Y-體染色體)} 之最大值為0.23，出現在約150 bp處。如以下實例中所說明，風險染色體與參考染色體之間短片段佔總片段長度之分數差異(ΔF)為定量其大小分佈差異之適用分離值。進一步舉例而言，可藉由任何大小截止值確定ΔF值，例如130 bp與170 bp之間的截止值。

圖8展示對於懷有整倍體胎兒，染色體21(實線)及參考染色體(除染色體13、18及21以外之所有體染色體)(點線)(dotted line)之短片段佔總長度之分數(F)相對於截止值大小的圖800。兩個F值之差(ΔF_(21-Ref) = F_(chr21) -F_(Ref) )由虛線(dashed line)表示。由於在懷有整倍體胎兒中染色體21與參考染色體之DNA片段之大小分佈相似，所以對於任何截止值大小ΔF_(21-Ref) 值接近零。

圖9展示對於懷有第21對染色體三體胎兒，染色體21(實線)及參考染色體(除染色體13、18及21以外之所有體染色體)(點線)之F值相對於截止值大小的圖900。ΔF_(21-Ref) 由虛線表示。由於來自胎兒之額外劑量之染色體21，所以母體血漿中染色體21短於參考染色體之DNA片段之大小分佈。DNA片段之大小分佈差異係由ΔF_(21-Ref )之正值反映，在約150 bp達到最大值0.016。

圖10展示對於懷有整倍體胎兒及懷有第21對染色體三體胎兒，染色體21與參考染色體(除染色體13、18及21以外之所有體染色體)之ΔF_(21-Ref) 相對於大小截止值的圖1000。在第21對染色體三體案例中觀察到ΔF_(21-Ref) 增加，但在整倍體案例中在各大小截止值ΔF_(21-Ref) 約為零。由於在約150 bp觀察到最大ΔF_(21-Ref) ，所以在150 bp之差可用作分離值，用於確定染色體21序列之大小分佈是否有任何顯著縮短。然而，可使用在懷有整倍體與染色體三體胎兒案例之間出現顯著差異之任何大小，例如(但不限於)140 bp、145 bp、155 bp及160 bp。在此實例中，對於懷有第21對染色體三體胎兒及整倍體胎兒，在150 bp所觀察之染色體21及參考染色體之總長度之分數差異分別為0.016及-0.002。

短DNA片段佔總DNA長度之分數形式的差異可用於區分整倍體胎兒與非整倍體胎兒。可以多種方式測試差異。在一個實施例中，可將一個特定大小截止值之ΔF值(分離值之一個實例)與一個截止值比較以確定樣本之歸類(分類)。在另一實施例中，可獲得ΔF之峰值，且可將該值與一或多個歸類截止值比較。在各實施例中，峰值可為最大值或最小值、接近最大值/最小值之平均值、或者最大值/最小值相關或衍生之其他值。亦可使用分離值(例如ΔF)之其他統計值，諸如峰值寬度，或對應於峰值之特定大小截止值之位置。

在一實施例中，獲自特定基因體位置或整個基因體之複數個片段之F值(或本文所述之其他統計值，諸如小片段之長度除以大片段之長度)可用於確定是否存在病變。舉例而言，若該統計值超過截止值，則可鑑別為存在病變，因為小片段之量在正常範圍以外。此可對除懷孕女性以外之患者進行以鑑別除胎兒疾病以外的疾病。

在一些實施例中，在進行片段大小分析之前，可執行物理大小分級分離。在一實施例中，核酸分子可分成兩個大小部分(例如一個大於200 bp，且一個小於或等於200 bp)，接著可比較所選染色體(例如染色體21)在此等大小部分每一者上之大小分佈。在胎兒染色體三體(例如第21對染色體三體)存在下，與具有較大分子大小之大小部分相比，具有較小分子大小之大小部分的相對豐度增加。

在其他實施例中，可使用許多低於長度截止值之片段來代替大小分佈。舉例而言，可比較標靶染色體(例如染色體21)相對於一或多個參考染色體之低於長度截止值之片段的數目(例如差異或比率)。在一實施例中，低於長度截止值之片段數目除以片段總數目以獲得百分比，且可比較標靶染色體與一或多個參考染色體之此百分比以提供一參數。可將所得參數(例如差異或比率)與截止值(例如1%)相比較。在一態樣中，長度截止值可選為上述百分比最高之長度。

V.　使用等級之實例

除第21對染色體三體以外，母體血漿中之片段大小分析亦可用於其他胎兒染色體非整倍性之非侵入性產前偵測，諸如第13對染色體三體、第18對染色體三體及性染色體非整倍性(諸如特納氏症候群(Turner syndrome)、克林費特氏症候群(Klinefelter syndrome)及XYY等)。當染色體異常僅涉及一部分特定染色體(例如由染色體位移所致之第21對染色體三體)時亦可使用實施例。在此種情形下，將觀察受影響染色體區域之DNA片段的片段大小異常。

圖11展示使用多工樣本製備套組(Illumina)，根據製造商之說明書所構築之母體血漿DNA庫的表1100。每兩個具有可區分條形碼之樣本引入一個通道中，接著在Illumina基因體分析儀II上進行標準多工末端配對定序。可基於條形碼區分該等樣本。分析120位懷孕女性之血漿樣本。胎兒之性別及染色體非整倍性狀態展示於表1100中。

圖12說明根據本發明之實施例4個處於患病或未患病不同狀態之樣本之不同染色體的分級。如先前所述，根據片段大小對22個體染色體以及染色體X進行分級。如可見，基於2型Illumina簇產生試劑套組之染色體相對分級與使用1型套組時有所不同。如下文所示，實施例(例如方法400)可區別非整倍體案例與整倍體案例。

A.　第13對染色體三體

在此實例中，將證明實施例用於對第13對染色體三體進行產前診斷。圖13展示例如可由方法400獲得，120例懷孕之第13對染色體三體之等級的圖。圖中，T13、T18、T21及Eu分別指懷有第13對染色體三體、第18對染色體三體、第21對染色體三體及整倍體胎兒之情況。在23例懷有第13對染色體三體胎兒之情況中18例(78.3%)染色體13等級為22或22以下，而在97例懷有非第13對染色體三體胎兒之情況中僅有2例(2.1%)染色體13等級為22或22以下。因此，藉由使用截止值分級22，染色體片段大小之等級分析用於胎兒第13對染色體三體之產前診斷的靈敏度及特異性分別為78.3%及97.9%。

在圖13中可見，懷有整倍體及第18對染色體三體及第21對染色體三體胎兒之情況的染色體13等級比懷有第13對染色體三體胎兒之情況高(亦即表示等級之數字小)。換言之，與其他染色體上之序列相比，懷有第13對染色體三體胎兒之情況的染色體13序列似乎比懷有非第13對染色體三體之情況短。懷有第13對染色體三體胎兒之情況下染色體13序列明顯縮短的原因在於胎兒之額外染色體13導致胎兒DNA相對於染色體13之比重增加。

B.　第18對染色體三體

圖14展示120例案例之染色體18之分級。在30例懷有第18對染色體三體胎兒之案例中有26例(86.7%)之染色體18等級低於13(亦即表示等級之數字大)，而在90例懷有非第18對染色體三體胎兒之案例中無一例之等級低於13。因此，藉由使用等級13作為截止值，染色體片段大小之等級分析用於胎兒第18對染色體三體之產前診斷的靈敏性及特異性分別為86.7%及100%。

在此分析中，比較懷有第18對染色體三體、第13對染色體三體、第21對染色體三體及整倍體胎兒之情況的大小分級。在染色體18之情況下，後三組均可視作『正常』對照，因為其不存在染色體18之劑量異常。如自圖14可見，懷有整倍體及第13對染色體三體胎兒之案例的染色體18等級叢集於1至3附近。另一方面，懷有第18對染色體三體胎兒之案例的染色體18等級為13至22，表明其染色體18片段大小比懷有整倍體、第21對染色體三體及第13對染色體三體胎兒之案例短。再次，額外染色體18解釋此等觀察結果。

C.　第21對染色體三體

圖15展示120例案例之染色體21之分級。在9例懷有第21對染色體三體胎兒之案例中有8例(88.9%)之染色體21等級為22或低於22，而在111例懷有非第21對染色體三體胎兒之案例中無一例之染色體21等級為22或低於22。因此，藉由使用等級22作為截止值，染色體片段大小之等級分析用於胎兒第21對染色體三體之產前診斷的靈敏性及特異性分別為88.9%及100%。

V.　使用大小差異之實例

A.　第13對染色體三體

在此等以下實例中，將證明藉由將源自染色體13之片段的絕對大小與源自一或多個參考染色體之片段的絕對大小相比較，可實現第13對染色體三體之非侵入產前偵測，例如關於方法600所述。此實例利用與先前實例中相同之數據集。舉例而言，對於第13對染色體三體偵測，已選擇染色體5及染色體6作為參考染色體。

如自圖16之表1600可見，對於所有懷有第13對染色體三體胎兒之情況，在同一樣本內，與染色體13比對之序列比與染色體5及染色體6比對之序列顯著短(曼-懷特尼等級總和測試，p值0.001)。作為對照，包括懷有整倍體及第18對染色體三體胎兒之情況。在懷有整倍體與第18對染色體三體胎兒之情況中，染色體13之劑量正常。如自表1600可見，在懷有整倍體及第18對染色體三體胎兒之情況中未見到源自染色體13之序列的具有此統計顯著性之大小異常。

此外，對於所有懷有第13對染色體三體胎兒之情況，在同一樣本內，染色體13與染色體5之間的平均片段大小差異大於0.4 bp，而懷有非第13對染色體三體胎兒之案例中無一者顯示超過0.4 bp之差異。類似地，對於所有懷有第13對染色體三體胎兒之情況，染色體13與染色體6之間的平均片段大小差異大於0.5 bp，而懷有非第13對染色體三體胎兒之案例中無一者顯示超過0.5 bp之差異。

B.　第18對染色體三體

舉例而言，對於第18對染色體三體偵測，選擇染色體14作為參考染色體。在圖17之表1700中可見，對於懷有非第18對染色體三體胎兒之情況，源自染色體18之序列比源自染色體14之序列統計上顯著長(曼-懷特尼等級總和測試，p值0.005)。然而，對於懷有第18對染色體三體胎兒之案例，染色體18序列並不比與染色體14比對之序列顯著長。可基於染色體18與染色體14之DNA片段平均大小之間的差異，使用0 bp之截止值來區分懷有整倍體及第18對染色體三體胎兒之案例。此等觀察結果可由以下事實來解釋：源自胎兒之染色體18序列比母體染色體18序列短，因而當胎兒具有第18對染色體三體時，其染色體18序列之額外劑量將降低該等序列之總體大小。接著，此將使染色體18之總體大小分佈更接近染色體14之分佈。

V.　使用總長度比重之實例

在以下實例中，參考染色體由除染色體13、18及21以外之所有染色體組成。

圖18展示在150 bp處染色體18與參考染色體之短片段佔總長度之分數差異(ΔF_(18-Ref) )。藉由對ΔF_(18-Ref) 使用診斷截止值0.0003，可偵測懷有第18對染色體三體胎兒之情況，靈敏性為93.3%且特異性為100%。

圖19展示在150 bp處染色體21與參考染色體之短片段佔總長度之分數差異(ΔF_(21-Ref) )。藉由對ΔF_(21-Ref) 使用診斷截止值0.007，可偵測懷有第21對染色體三體胎兒之情況，靈敏性為100%且特異性為100%。

VII.　選擇參考染色體

可以多種方式選擇一或多個參考染色體，用於藉由例如使用方法600對母體血漿DNA進行大小分析，達成胎兒染色體非整倍性之非侵入性產前偵測。在各實施例中，可選擇不同參考染色體。

第一類型參考染色體為如下染色體，其中源自該等染色體之DNA片段在特定分析平台(或具有精密匹配之分析效能的分析平台)上展現與源自可能與母體血漿中之非整倍性相關之染色體(例如染色體21、18或13)的DNA片段相似之大小分佈。在一實施例中，在此類型分析中，若風險染色體之大小分級或絕對大小顯示相對於參考染色體統計顯著性降低，則偵測胎兒染色體非整倍性。在其他實施例中，可量測源自風險染色體之片段與源自參考染色體之片段之間的平均或中值大小差異。

第二類型參考染色體為如下染色體，其中當胎兒為整倍體時源自該等染色體之DNA片段比源自可能與母體血漿中之非整倍性相關之染色體(例如染色體21、18或13)的DNA片段統計上短。當使用特定平台量測時，在風險染色體為最長染色體之一的情況下，可能遇到此種情形。例如圖12中，當量測母體血漿時，源自染色體18之DNA片段在體染色體中為最長。因而，可選擇片段比染色體18統計上顯著短之參考染色體。在一實施例中，在此類型分析中，若未見風險染色體之大小分級或絕對大小統計上顯著不同於參考染色體，則偵測胎兒染色體非整倍性。舉例而言，此策略已用於如上文所述之圖17之分析。

第三類型參考染色體為如下染色體，其中當胎兒為整倍體時源自該等染色體之DNA片段比源自可能與母體血漿中之非整倍性相關之染色體(例如染色體21、18或13)的DNA片段統計上長。當使用特定平台量測時，在風險染色體為最短染色體之一的情況下，可能遇到此種情形。因而，可選擇片段比風險染色體統計上顯著長的參考染色體。在一實施例中，在此類型分析中，若參考染色體與風險染色體之間的分級或絕對大小之差異增加，則偵測胎兒染色體非整倍性。

第四類型參考染色體為具有類似GC含量之染色體。染色體之GC含量可影響定序反應中之定量讀數。一種使由染色體間GC含量差異引起之偏差減至最小的方式為選擇具有類似GC含量之適當參考染色體。圖20展示不同染色體之GC含量列表(NCBI build 36，48型)。該等染色體以GC含量上升順序列出。現提供使用具有類似GC含量之參考染色體之一實例。

圖21展示在150 bp處染色體13與參考染色體之間短片段佔總長度之分數差異(ΔF_(13-Ref) )。在此，舉例而言，使用染色體3、4、5及6作為ΔF_(13-Ref) 分析之參考染色體。如圖20中所示，染色體3至6之GC含量為36.53%-38.79%，類似於染色體13之GC含量39.07%。使用0.0038之診斷截止值，ΔF分析偵測懷有第13對染色體三體胎兒之案例，靈敏性為95.7%且特異性為99.0%。

預計GC偏差問題可能在不同程度上影響不同定序平台。舉例而言，使用不需要預先擴增之平台，諸如Helicos平台(Harris TD，等人，Single-molecule DNA sequencing of a viral genome. Science 2008;320:106-9)、奈米孔(Lund J,Parviz BA. Scanning probe and nanopore DNA sequencing: core techniques and possibilities. Methods Mol Biol 2009;578:113-22)或得自Pacific Biosciences之單分子實時系統(Eid J，等人，Real-time DNA sequencing from single polymerase molecules. Science 2009;323:133-8)，可允許更廣泛地選擇參考染色體組。

IV.　使用胎兒DNA濃度

在懷有第21對染色體三體(或其他染色體三體)胎兒之情況中，胎兒將向母體血漿中釋放額外劑量之染色體21片段，該等染色體21片段將比來自母細胞之染色體21片段短。預計此等較短片段之濃度將與母體血漿中之胎兒DNA濃度相關聯。換言之，源自Y染色體之序列的分數濃度愈高，懷有第21對染色體三體胎兒之情況中源自染色體21之序列之所量測大小愈短。

圖22說明許多懷有男性第21對染色體三體胎兒之情況的結果。如圖22中可見，在染色體21序列之中值大小與相對於Y染色體比對之序列百分比之間實際上存在負關聯(r=-0.942，皮爾遜相關性(Pearson correlation))。若使用染色體21之大小分級，則亦預計類似趨勢，亦即染色體21之等級數目增加，表明當胎兒DNA分數濃度增加時片段變短。由於存在相關性，所以在本文所述之任何方法中，實施例可使用胎兒DNA濃度之量測值作為參數。

在此類型分析中，可藉由熟習此項技術者已知之任何方法量測母體血漿中之胎兒DNA之分數濃度及絕對濃度。若胎兒為男性，則可藉由母體血漿中源自Y染色體之序列的分數濃度來量測胎兒DNA濃度。另一實例為使用父本遺傳之遺傳標記物，諸如單核苷酸多形現象或簡單串聯重複多形現象或***-缺失多形現象。另一實例為使用外遺傳標記物，諸如在胎兒DNA與母體DNA之間發生差異性甲基化之區域(Poon等人，Clin Chem 2002;48: 35-41；Chiu等人，Am J Pathol 2007;170: 941-950；Chan等人，Clin Chem 2006: 52: 2211-2218；美國專利6,927,028)。可使用熟習此項技術者已知之方法分析上述標記物，包括聚合酶鏈反應(PCR)、數位PCR、定序、大規模平行定序及靶向大規模平行定序。

在一實施例中，可改變用於偵測染色體非整倍性與所量測之母體血漿中之胎兒DNA濃度的關係之診斷臨限值(例如用於本文所述之任何方法之截止值)。因此，對於具有相對較高胎兒DNA之母體血漿樣本，預計源自可能與非整倍性相關之染色體之血漿DNA分子的縮短程度將比具有相對較低胎兒DNA濃度之母體血漿樣本顯著。

由於ΔF與大小分佈有關，所以ΔF亦展示與胎兒DNA濃度之相關性。圖23A展示ΔF_(18-Ref) (染色體18相對於參考染色體)與胎兒DNA濃度之間的相關性。30例T18案例中有10例懷有男性胎兒，因此可藉由此等樣本中之染色體Y序列之分數濃度來估計胎兒DNA之分數濃度。在ΔF_(18-Ref) 與染色體Y序列之分數濃度之間存在顯著相關性(r=0.879，斯皮爾曼相關性(Spearman correlation))。此等結果表明，在懷有第18對染色體三體胎兒之情況中，母體血漿中染色體18序列之大小分佈的縮短程度與母體血漿中之胎兒DNA之分數濃度相關。

低於診斷截止值之案例由空心圓表示，而差異高於截止值之案例由實心圓表示。與ΔF值大於診斷截止值(0.0003)之案例(由實心圓表示)相比，ΔF值小於0.0003之兩個案例(由空心圓表示)具有相對較低之胎兒DNA分數濃度。胎兒DNA分數濃度低可能為圖18中所執行之分析中忽略此兩個案例的原因。因此，在一實施例中，若樣本中之胎兒濃度較低，則該分類可被棄用或重做。

圖23B展示ΔF_(21-Ref) (染色體21相對於參考染色體)與胎兒DNA濃度之間的相關性。9例T21案例中有5例懷有男性胎兒。在ΔF_(21-Ref) 與染色體Y序列之分數濃度之間存在顯著相關性(r=0.9，斯皮爾曼相關性)。

圖23C展示ΔF_(13-Ref) (染色體13相對於染色體3、4、5及6)與胎兒DNA濃度之間的相關性。23例懷有第13對染色體三體胎兒之案例中有14例懷有男性胎兒。可藉由樣本中染色體Y序列之分數濃度估計胎兒DNA分數濃度。在ΔF_(13-Ref) 與染色體Y序列之分數濃度之間存在正相關(r=0.644，斯皮爾曼相關性)。ΔF_(13-Ref) 低於診斷截止值(0.0038)之案例由空心圓表示。胎兒DNA分數濃度低可能為圖21中所執行之分析中忽略此案例之原因。

IX　比較大小分析與分子計數法

圖24展示使用母體血漿DNA分析來比較本發明之一實施例與用於胎兒非整倍性(第13對染色體三體及第18對染色體三體)之非侵襲性偵測之另一方法的精確度。此實例說明使用大小之實施例相對於基於分子計數之方法的比較(美國專利申請案11/701,686；Chiu等人，Trends Genet 2009;25: 324-331；Chiu等人，Proc Natl Acad Sci USA 2008;105: 20458-20463；Fan等人，Proc Natl Acad Sci USA 2008;105: 16266-16271；美國專利公開案2009/0029377)。使用Chiu等人所描述之方法(Proc Natl Acad Sci USA 2008;105: 20458-20463)分析8個母體血漿樣本(2個整倍體、2個第18對染色體三體及4個第13對染色體三體)。對於各案例，將Chiu等人先前關於分子計數所報導之使用z得分的分子計數法與基於大小分析之實施例的結果相比較。

為計算z得分，首先計算各案例之相關染色體之百分比呈現。接著，計算參考案例之染色體呈現的平均數及標準偏差。在此數據集中，案例1、2、5、6、7及8用作計算染色體18呈現之平均數及標準偏差的參考組。案例1、2、3及4用作計算染色體13呈現之平均數及標準偏差的參考組。z得分定義為參考組之標準偏差與平均值相差之數目。染色體之顯著過度呈現定義為z得分>3。案例3及4懷有第18對染色體三體胎兒，且染色體18片段過度呈現於其血漿中。案例5、6、7及8為懷有第13對染色體三體胎兒之案例，但僅案例5及7顯示血漿中染色體13過度呈現。案例6及8儘管懷有第13對染色體三體胎兒，但未顯示母體血漿中染色體13顯著過度呈現。

藉由將與特定染色體比對之所有片段的大小與相對於參考染色體比對之片段的大小相比較，偵測染色體之DNA片段大小之顯著縮短。使用曼-懷特尼測試進行比較，且P值<0.0001定義為存在顯著差異。為分析染色體13片段之大小，參考染色體為染色體5。對於所有懷有整倍體或第18對染色體三體胎兒之案例，染色體13之片段大小並不顯著不同於染色體5之片段大小。對於4個懷有第13對染色體三體胎兒之案例，染色體13片段比染色體5片段顯著短，暗示其染色體13之片段大小比懷有非第13對染色體三體胎兒之案例縮短。因此，藉由本發明正確地鑑別所有4個懷有第13對染色體三體胎兒之案例，相比之下，z得分法鑑別出4個案例中之2個。

為分析染色體18片段之大小，參考染色體為染色體12。對於所有懷有整倍體或第13對染色體三體胎兒之案例，染色體18之片段比染色體12之片段顯著長。對於兩個懷有第18對染色體三體胎兒之案例，染色體18片段之大小並不顯著不同於染色體12片段之大小，暗示與懷有非第18對染色體三體胎兒之案例相比，染色體18之片段大小縮短。換言之，兩個懷有第18對染色體三體胎兒之案例均正確分類。

X.　偵測多形現象及診斷遺傳性病症

母體血漿DNA之大小分析亦可用於胎兒基因型之非侵入性偵測。胎兒基因型可用於確定胎兒是否遺傳突變基因、具有特定對偶基因失衡或其他序列失衡或目的。在該等實施例中，一對偶基因可為參考基因體位置(序列)且不同對偶基因可為所測試之基因體位置。因此，使用參考序列之任何方法亦可用於確定基因型及其他序列失衡。

在一實施例中，可藉由母體樣本中對偶基因之間是否存在大小差異(失衡)來確定序列失衡(因而可能確定基因型)(例如當母親在該對偶基因處為異型接合時)。舉例而言，若樣本中對偶基因之間的大小概況不存在差異，則可確定胎兒具有與母親相同之基因型。作為另一實例，若樣本中對偶基因之間的大小概況存在差異，則可確定胎兒具有不同於母親之基因型。

在以下實例中，母親之特定基因座上為異型接合(亦即具有一個N對偶基因複本及一個M對偶基因複本，表示為NM)。字母N及M名稱上分別表示野生型(N表示正常)及突變型(M表示突變)對偶基因。然而，N及M對偶基因可對應於任兩個不同對偶基因，且未必為野生型及/或突變型。在一實施例中，M可視為風險基因體序列且N視為參考序列。在此情況下，可理解使用參考序列之任何上述方法可用於測定基因型。

在未懷孕女性中，帶有兩個對偶基因二者之分子的平均大小為相同的。然而，在懷孕女性血漿中，存在來自母親與胎兒之DNA分子的混合物。源自母體之DNA分子比源自胎兒之DNA分子長。若母親與胎兒均具有兩個對偶基因(亦即N與M對偶基因)，則此兩個對偶基因將具有相等比重之長DNA分子及短DNA分子。因此，N及M對偶基因之所得大小分佈將為相同的。反之，若母親與胎兒之基因型不同，例如若母親為NM而胎兒為MM，則N與M對偶基因之大小分佈將為不同的。換言之，血漿中兩個對偶基因之大小分佈將受胎兒基因型影響。圖25A至25C展示根據本發明實施例懷孕女性及胎兒之基因型之不同情形的圖。

圖25A中，胎兒具有基因型NN，且母親之基因型為NM。條2510之長度分別指示來自母親及胎兒之兩個對偶基因之一的片段之平均大小。如上所述，胎兒之平均大小比母親小。因此，長條表示母體DNA，而短條表示胎兒DNA。

由於母親與胎兒均貢獻對偶基因N，而僅母親貢獻對偶基因M，所以具有對偶基因N之分子的大小分佈將比具有對偶基因M之分子短。換言之，在具有基因型NM之懷孕女性中，對偶基因N之大小分佈比對偶基因M短將暗示胎兒基因型為NN。因此，當截至某一截止值(例如百分比或絕對值)，N之大小分佈(例如平均大小)比M小時，可鑑別出胎兒具有兩個野生型(N)對偶基因。

圖25B中，胎兒具有基因型NM。母親與胎兒均貢獻對偶基因N及M。因此，具有對偶基因M及N之分子的大小分佈相同。在具有基因型NM之懷孕女性中，對偶基因M與N之大小分佈相同將表明胎兒基因型為NM。因此，當在某一截止值(例如百分比或值)內，N之大小分佈(例如平均大小)近乎與M相等時，可鑑別出胎兒具有一個野生型(N)對偶基因及一個突變型(M)對偶基因。

圖25C中，胎兒具有基因型MM。由於母親與胎兒均貢獻對偶基因M，而僅母親貢獻對偶基因N，所以具有對偶基因M之分子的大小分佈將比具有對偶基因N之分子短。在具有基因型NM之懷孕女性中，對偶基因M之大小分佈比對偶基因N短表明胎兒基因型為MM。因此，當截至某一截止值(例如百分比或絕對值)，M之大小分佈(例如平均大小)比N小時，可鑑別出胎兒具有兩個突變型(M)對偶基因。

該方法亦可用於分析母親為同型接合(例如NN或MM)之情形。若胎兒具有不同基因型，則母體樣本之大小分佈亦將變化，因此可確定胎兒之基因型。同樣，若大小分佈未變化，則可確定該基因型與母親之基因型相同，如上文關於母親為異型接合案例之案例所述。

在一些實施例中，可藉由截止值來確定是否存在相對於母親基因型之失衡(例如一個N對一個M暗示不存在失衡)。舉例而言，若與母親基因型之偏差足夠大(例如以%表示)，則可確定胎兒遺傳具有較小大小分佈之對偶基因。在一實施例中，截止值可視母體樣本中胎兒核酸之百分比而定。若胎兒核酸之百分比較高，則預期偏差將較大，因而可使用較大截止值(例如關於一個對偶基因相對於另一對偶基因之大小分佈差異)。若胎兒核酸之百分比較低，則預期偏差將較小，因而可使用較小截止值。

在一實施例中，父親之基因型可用於確定母親哪個對偶基因之大小分佈可能因胎兒核酸而變化。在父親之基因型為同型接合的情況下，可將可能之胎兒基因型的範圍縮小至僅自母親遺傳之對偶基因，因為來自父親之對偶基因為已知的。在範圍縮小後，確定胎兒基因體可更為精確，因為將僅需要測試兩種可能性。在一實施例中，使用相同截止值，不管哪個基因型遺傳自父親。在另一實施例中，可使用不同截止值。

在各實施例中，本文中提及之任何大小分佈均可用於該等序列失衡確定。在一些實施例中，亦可提供精確水準。舉例而言，除失衡及平衡分類以外，亦可使用「不確定」之分類。以此方式，可以高置信度確定一些確定，而中間區域中之值可能需要其他數據點。

XI.　胎兒單倍型遺傳之大小分析

大小分析之應用可進一步擴展至確定哪個母本單倍型傳給胎兒。單倍型可指多個基因座處之對偶基因。術語「單倍型」之定義可見於本申請案之定義部分中。胎兒單倍型可用於確定胎兒是否遺傳突變基因、具有特定對偶基因失衡或其他目的。因此，單倍型可以與基因型類似之方式使用，但由於存在更多基因座，所以可使用較少量之血液樣本來達成相同或甚至更佳之確定胎兒單倍型之統計置信度。在一態樣中，可確定相對於母親單倍型之序列失衡。在本文中，單倍型可表示為一系列多形現象，例如各自在基因體中已知有序列變異之特定位置處的SNP。

在一實施例中，提供一種藉由分析母體血漿中之序列失衡來確定胎兒之單倍型的方法。在一態樣中，使用單倍型之間的大小概況之分離值(例如差異)來確定序列失衡。在一實施例中，藉由對母體樣本(例如不含胎兒核酸之樣本)進行分析，例如定序(He D等人，Bioinformatics 2010;26: i183-i190)或單分子單倍型分析(Ding C等人，Proc Natl Acad Sci USA 2003;100: 7449-7453及Xiao M等人，Nat Methods 2009;6: 199-201)，來確定母親之單倍型(例如Hap I及Hap II)。在另一實施例中，可對母親之父母、兄弟姐妹、先前所生子女或其他親屬進行分析來確定母親之單倍型。在另一實施例中，對處於強連鎖不平衡下之多形現象，已知一個基因座之母親基因型可暗示其他基因座之基因型，例如當對偶基因通常以相同序列出現時，亦即單倍型。因此，母親之單倍型可自基因型之一次量測暗中確定。亦可確定一個以上基因座之基因型，其中確定之基因型各自可暗示其他基因座之基因型，因此可推斷出單倍型。

在一實施例中，亦確定父親之基因型。此資訊可用於確定父親在特定SNP下是同型接合還是異型接合。可直接測定各基因座之父親對偶基因。因此，可確定各父本對偶基因是與母親之Hap I上之對偶基因相同還是與Hap II上之對偶基因，稱為α型SNP或β型SNP。

在另一實施例中，亦確定父親之單倍型。可藉由對父本樣本進行分析，例如定序(He D，等人Bioinformatics 2010;26: 1183-1190)或單分子單倍型分析(Ding C等人，Proc Natl Acad Sci USA 2003;100: 7449-7453及Xiao M等人，Nat Methods 2009;6: 199-201)，或藉由分析父親之父母、兄弟姐妹、先前所生子女或其他親屬，來確定父親之單倍型。或者，對處於強連鎖不平衡下之多形現象，已知一個基因座之父親基因型可暗示其他基因座之基因型，例如當對偶基因通常以相同序列出現時，亦即單倍型。因此，父親之單倍型可自基因型之一次量測暗中確定。亦可確定一個以上基因座之基因型，其中確定之基因型各自可暗示其他基因座處之基因型，因此可推斷出單倍型。

該等實施例之一個應用可為，在父親與母親均為異型接合之情況下，藉由分析SNP來確定含有胎兒核酸之母體樣本中是否存在序列失衡(例如藉由偵測大小概況差異)。因此，由是否存在序列失衡推斷出胎兒之基因型或單倍型。

圖26展示在待分析之SNP基因座母親為異型接合且父親為同型接合之一實例。為進行大小分析，可聚焦於母親為異型接合且父親為同型接合之SNP子集。母親之兩個同源染色體分別稱為Hap I及Hap II。對於此等SNP每一者，可確定兩個母本對偶基因中哪一者位於Hap I上且哪一者位於Hap II上。若父本對偶基因與Hap I上之母本對偶基因一致，則SNP定義為α型；且若父本對偶基因與Hap II上之母本對偶基因一致，則SNP定義為β型。關於測定胎兒基因體之進一步描述可見於上文提及之申請案「Fetal Genomic Analysis From A Maternal Biological Sample」中。

一旦已知母親之單倍型及父親之基因型或單倍型，即可分析與各SNP相關之片段的大小分佈，以藉由鑑別SNP子集中是否存在序列失衡來確定胎兒之單倍型。在替代性實施例中，儘管父本基因型或單倍型不一定已知，但可使用例如統計程序，基於例如已知基因型或單倍型在測試群體中之出現頻率來推斷可能之父本基因型或單倍型。接著例如如部分X中所論述，針對各SNP確定序列失衡(如經由大小失衡來確定)。

舉例而言，若父親對於Hap I上之對偶基因為同型接合(α型)，則將不存在大小失衡(胎兒自母親遺傳Hap II，因而如母親一般，對於Hap I及Hap II為異型接合)，或將存在大小失衡，其中Hap I具有較小大小分佈(胎兒自母親遺傳Hap I，因而對於Hap I為同型接合)。若父親對於Hap II為同型接合(如下文所述之β型)，則將不存在失衡(胎兒自母親遺傳Hap I，因而為Hap I與Hap II異型接合)，或將存在失衡，其中Hap II具有較小大小分佈(胎兒自母親遺傳Hap II，因而對於Hap I為同型接合)。亦可使用不確定分類，或平衡與失衡之間的不同確定水準。通常，類似截止值用於任一類型。在各實施例中，可使用本文中所提及之任何大小分佈。

在一實施例中，可分析複數個SNP位置每一者之片段的大小分佈以確定胎兒之兩種單倍型。舉例而言，可比較一個單倍型上SNP對偶基因之片段之大小分佈與另一單倍型上之SNP對偶基因之大小分佈的差異。可以多種方式分析統計值，例如藉由測定各SNP，接著取主要者(平衡、失衡且可能包括不確定)作為單倍型。作為另一實例，可合計SNP之大小(例如以獲得與截止值相比較之平均或中值大小分佈)。或可使用二者之組合。另一實施例可為使用數據點之極值，例如特定SNP之最小差異。

圖27展示當父本單倍型如圖26中所示時胎兒自母親遺傳Hap I的一實例。對於α型SNP(由無陰影框圍住)，胎兒將自父親遺傳與位於母本Hap I上之對偶基因一致的對偶基因。因此，胎兒對於Hap I上之對偶基因為同型接合。因此，在母體血漿中，Hap I上之對偶基因的大小分佈將比Hap II上之對偶基因短。對於β型SNP(由陰影框圍住)，胎兒將自父親遺傳與位於母本Hap II上之對偶基因一致的對偶基因。因此，胎兒將為異型接合。因此，在母體血漿中，Hap I及Hap II上之對偶基因的大小分佈將具有相同大小分佈。

在一實施例中，可一起分析相同類型(α型或β型)之SNP。對於α型SNP，帶有Hap I上之對偶基因之分子的大小分佈將比帶有Hap II上之對偶基因之分子的大小分佈短。對於β型SNP，帶有Hap I及Hap II上之對偶基因之分子的大小分佈將相同。換言之，若帶有Hap I之分子的大小分佈比帶有Hap II之分子的大小分佈短，則胎兒對於Hap I為同型接合。若帶有Hap I及II之分子的大小分佈相同，則胎兒為異型接合。

實例

以下實驗用於測試胎兒單倍型遺傳分析之精確性。募集一對夫婦至產科診所進行β-地中海貧血之產前診斷。自父親及母親獲取血液樣本。對於母親，在12週妊娠時於絨膜絨毛取樣(CVS)之前獲取血液樣本。CVS之後，一部分儲存用於實驗。

自父親及母親之白血球層以及CVS樣本萃取DNA。藉由Affymetrix Genome-Wide Human SNP陣列6.0系統分析此等DNA樣本以確定父親、母親及胎兒之基因型。在此實驗中，使用CVS數據推斷母本單倍型。然而，在該測試之臨床實施中，可藉由如上所述之其他方式推斷母本單倍型。CVS數據亦用於證實使用不需要CVS之本文方法確定的精確性。

在當前說明中，聚焦於母親為異型接合且父親為同型接合之SNP之資訊子集。在此SNP子集中，該夫妻及胎兒之基因型用於構築母親之單倍型。定義單倍型I(Hap I)為母親傳至胎兒之對偶基因系列，而單倍型II(Hap II)為胎兒未自母親接收之對偶基因系列。

接著將資訊SNP分成兩種亞型，即α型及β型。對於α型SNP，父本對偶基因與Hap I上之母本對偶基因一致。對於此等SNP，胎兒將自父母遺傳相同對偶基因(Hap I上之對偶基因)，因此胎兒對於Hap I上之SNP為同型接合。對於β型SNP，父本對偶基因與Hap II上之母本對偶基因一致。對於此等SNP，胎兒將自母親遺傳Hap I上之對偶基因且自父親遺傳不同之對偶基因(與Hap II上之對偶基因一致)，因此胎兒將為異型接合。

使用Illumina基因體分析儀平台對自母親血漿萃取之DNA進行大規模平行定序。對血漿DNA分子執行末端配對定序。對各分子之每個末端的50 bp進行定序，因而每個分子總計100 bp。使用得自Beijing Genomics Institute(Shenzhen)之SOAP2程式，將各序列之兩個末端與未重複遮蔽之人類基因體(自UCSC genome.ucsc.edu下載之Hg18 NCBI.36)(soap.genomics.org.cn/)(Li R等人，Bioinformatics 2009,25(15):1966-7)比對。

在一實施例中，使用單倍型之短片段佔總長度之分數的統計值來確定哪個母本單倍型傳至胎兒。舉例而言，使用染色體22來說明大小分析如何用於推斷哪個母本單倍型傳至胎兒。首先，將染色體22分成若干區段，各區段含有50個母親為異型接合且父親為同型接合之資訊SNP(染色體22與區段均為序列之實例)。對於各區段，根據涵蓋此等資訊SNP之DNA片段(作為序列之一部分的分子之實例)對應於兩個母本單倍型中之哪一者，將此等片段分成兩組，稱為Hap I及Hap II。對於各區段，確定定位至母本Hap I及母本Hap II之所有片段之總長度的總和。接著類似地，確定各區段中定位至母本Hap I及母本Hap II之短片段之總長度的總和。出於說明之目的，在此實例中150 bp或更短之片段定義為短片段用於計算短片段之總長度。由此等長度，可計算出各區段內定位至Hap I及Hap II之DNA片段的短片段佔總長度之分數。

圖28展示說明根據本發明之實施例染色體22上之α型SNP之大小分析的表。ΔF_{(Hap I-Hap II)} 表示Hap I與Hap II之間短片段佔總長度之分數的差異。當排除掉僅由28個SNP組成之最後一個區段時，ΔF_{(Hap I-Hap II} )在0.0288至0.0701範圍內。ΔF_{(Hap I-Hap II)} 為正值表示Hap I之F值始終大於Hap II之F值。由於F值定義為短片段佔總長度之分數，所以F值愈高表明短片段佔總長度之分數愈高。換言之，此等結果表明，對於所分析之由50個SNP組成之各區域，帶有Hap I上之對偶基因的DNA片段比帶有Hap II上之對偶基因的DNA片段短。此表明Hap I之大小分佈比Hap II之大小分佈短。因此，可推斷胎兒對於Hap I上之對偶基因為同型接合。如上所提及，在一實施例中，可基於Hap I及Hap II中之兩個基因體位置之間的分離值(例如ΔF)對各區段進行分類，接著可基於各別區段分類進行總分類。在另一實施例中，可由該等分離值確定各區段之總分離值(例如平均分離值)，且此總統計值可用於確定分類。

在一實施例中，可使用約0.02之截止值來確定是否存在失衡。若使用ΔF之中值或平均值，則可使用較大截止值且仍為準確的。截止值亦可用於不確定結果，例如0.015至0.025之區域可為不確定的且需要進一步分析。

圖29展示說明根據本發明實施例染色體22上之β型SNP之大小分析的表。ΔF(Hap I-Hap II)表示Hap I與Hap II之間短片段佔總長度之分數的差異。ΔF(Hap I-Hap II)值在-0.0203至0.0207範圍內，中值為0.0003。ΔF(Hap I-Hap II)值小表明定位至Hap I及Hap II之片段之大小分佈相同。因而，可推斷胎兒對於Hap I及Hap II為異型接合。由於β型SNP定義為父本對偶基因與Hap II上之母本對偶基因一致的SNP，所以此結果暗示胎兒自母親遺傳Hap I。

圖30展示根據本發明實施例染色體22上之α型SNP與β型SNP之ΔF(Hap I-Hap II)的圖。對於α型SNP，Hap I片段之大小分佈比Hap II片段之大小分佈短，導致ΔF(Hap I-Hap II)值大於零。對於β型SNP，在Hap I與Hap II片段之大小分佈之間不存在差異；因此ΔF(Hap I-Hap II)值簇在0附近。使用截止值0.025，ΔF(Hap I-Hap II)分析可正確地推斷所有13個α型區段及21個β型區段之胎兒遺傳Hap I之情況。

XII.　使用靶向定序之實例

以下實例顯示，本發明實施例之基於大小之診斷方法可以靶向定序格式使用。在此類格式中，特異性靶向診斷相關之基因體區域進行定序。此格式之優勢在於，其定序聚焦於相關區域，與一部分定序精力用於不與診斷應用直接相關之區域的隨機定序情形大不相同。因而，預計靶向定序格式可增加系統產量且降低系統成本。可使用熟習此項技術者已知之任何格式執行靶向定序，包括溶液相捕捉系統(例如Agilent SureSelect系統)、固相捕捉系統(例如Roche NimbleGen系統)或標靶特異性擴增(例如RainDance系統)。

在妊娠頭三個月期間自8個懷孕女性收集血液樣本。對於各案例，藉由DSP DNA Blood Mini套組(Qiagen)自3.2 mL血漿萃取DNA。對絨膜絨毛樣本(在已獲取母體血液樣本後收集)執行核型分析，表明4個胎兒具有T21(UK229、UK510、UK807、PW421)，而其他4個為整倍體男性(PW226、PW263、PW316、PW370)。

對於各案例，使用5至30 ng血漿DNA構築DNA庫，藉由末端配對樣本製備套組(Illumina)根據製造商之染色質免疫沈澱定序樣本製備方案進行。適配子(adapter)連接之DNA直接使用QIAquick PCR純化套組(Qiagen)中所提供之旋轉管柱純化，不再進行大小選擇。接著，適配子連接之DNA用標準引子使用15個循環PCR擴增。引子為Illumina之PCR引子PE 1.0及2.0。該等DNA庫藉由使用NanoDrop ND-1000分光光度計(NanoDrop Technologies)定量，並在2100 Bioanalyzer上使用DNA 1000套組(Agilent)操作以檢查大小分佈。各樣本產生0.6至1 μg經擴增之血漿DNA庫，平均大小為約290 bp。

SureSelect人類所有外顯子捕捉庫係獲自Agilent，且涵蓋37.8 Mb人類外顯子(目錄號：5190-2310)。對於此研究中之所有8個案例，根據製造商之說明書，500 ng各案例之經擴增之血漿DNA庫與捕捉探針在65℃一起培育24小時。雜交後，藉由使用抗生蛋白鏈菌素塗佈之磁性珠粒(Dynal DynaMag-2 Invitrogen)下拉(pulling down)生物素化探針/標靶雜交物來選擇所捕捉之標靶，並用MinElute PCR純化套組(Qiagen)純化。最後，藉由用Agilent之SureSelect GA PE引子之12個循環PCR擴增來增濃所標靶之DNA庫。藉由QIAquick PCR純化套組(Qiagen)純化PCR產物。

將8對經標靶增濃及未經標靶增濃之庫裝載於兩個流動槽之16個通道上，接著由基因體分析儀IIx(Illumina)使用36 bp×2末端配對格式定序。使用短寡核苷酸比對程式(Short Oligonucleotide Alignment Program)2(http://soap.genomics.org.cn/)，將所有36 bp定序讀數與未遮蔽之人類參考基因體(Hg18)(http://genome.ucsc.edu)比對。末端配對讀數之片段大小界定在40 bp至600 bp範圍內。各定序DNA片段之大小係由兩端最外面核苷酸之座標推斷。

用於產前偵測胎兒第21對染色體三體之大小分析

在此實例中，計算染色體21及參考染色體之短片段佔總長度之分數，分別表示為F₂₁ 及F_ref 。參考染色體係由染色體13、18及21以外之所有體染色體組成。總長度係由600 bp或600 bp以下之所有DNA片段之長度總和計算。染色體21與參考染色體之間短片段佔長度之分數差異(ΔF)以F₂₁ -F_ref 計算。

圖31A為提供根據本發明之實施例在未進行標靶增濃之情況下血漿DNA之大小分析的表。各列提供染色體21之片段150 bp的總長度、染色體21之片段600 bp的總長度、及兩個總長度之比率F₂₁ 。其他列提供參考染色體之片段150 bp的總長度、參考染色體之片段600 bp的總長度、及兩個總長度之比率F_ref 。最後一列為兩個分數之差ΔF。

圖31B為提供根據本發明之實施例在進行標靶增濃之情況下血漿DNA之大小分析的表。圖31B各列之數據格式與圖31B之表相同。

圖32為在進行標靶增濃及未進行標靶增濃之情況下T21及整倍體樣本之ΔF的圖。對於未進行標靶增濃之樣本，對ΔF使用0.005之截止值，可以100%精確度區分來自懷有T21與整倍體胎兒之情況之血漿樣本。對於進行標靶增濃之樣本，對ΔF使用0.004之截止值，可以100%精確度區分來自懷有T21與整倍體胎兒之情況之血漿樣本。此實例顯示可使用靶向定序來執行基於大小之分析。為偵測T21，亦對染色體21及參考染色體使用靶向定序，以使得50%定序針對前者而其餘針對後者。此類設計可減少浪費定序精力對與T21之偵測直接相關之區域進行定序。此類設計可允許使用多工定序(例如藉由使用索引或條形碼定序)對來自多個患者之樣本進行定序。

本申請案中所述之任何軟體組件或功能可藉由使用任何適合電腦語言，諸如Java、C++或Perl，使用例如習知或面向對象之技術，以由處理器執行之軟體碼形式實施。軟體碼可以一系列指令或命令形式儲存在電腦可讀媒體上供儲存及/或傳輸，適合媒體包括隨機存取記憶體(RAM)、唯讀記憶體(ROM)、諸如硬碟機或軟碟之磁性媒體或諸如緊密光碟(CD)或DVD(數位多功能光碟)之光學媒體、快閃記憶體及其類似物。電腦可讀媒體可為該等儲存或傳輸裝置之任何組合。

該等程式亦可經編碼，且使用適合經由符合各種協定之有線、光學及/或無線網路，包括網際網路傳輸之載波信號來傳輸。因而，可使用利用該等程式編碼之資料信號來產生本發明實施例之電腦可讀媒體。用程式碼編碼之電腦可讀媒體可用相容裝置封裝或由其他裝置(例如經由網際網路下載)各別提供。任何該電腦可讀媒體均可存在於單一電腦程式產品上或該產品內(例如硬碟機或整個電腦系統)，且可存在於系統或網路內之不同電腦程式產品上或該等產品內。電腦系統可包括監視器、印表機或適於向使用者提供本文中所提及之任何結果的其他顯示器。

電腦系統之一實例展示於圖33中。圖33中所示之子系統係經由系統匯流排3375互連。展示其他子系統，諸如印表機3374、鍵盤3378、固接磁碟3379、耦接至顯示配接器3382之監視器3376及其他子系統。耦接至輸入/輸出(I/O)控制器3371之周邊裝置及I/O裝置可經由許多此項技術中已知之構件連接至電腦系統，諸如串聯埠3377。舉例而言，可使用串聯埠3377或外部介面3381將電腦設備連接至諸如網際網路之廣域網路、滑鼠輸入裝置或掃描器。經由系統匯流排之互連允許中央處理器3373與各子系統通信，並控制來自系統記憶體3372或固接磁碟3379之指令的執行以及子系統之間的資訊交換。電腦可讀媒體可具體化為系統記憶體3372及/或固接磁碟3379。本文中所提及之任何值均可自一個組件輸出至另一組件，且可輸出至使用者。

電腦系統可包括複數個相同組件或子系統例如藉由外部介面3381或內部介面連接在一起。在一些實施例中，電腦系統、子系統或設備可經網路通信。在該等情況下，一個電腦可視為用戶端，且另一電腦視為伺服器，其中各電腦可為同一電腦系統之一部分。用戶端及伺服器可各自包括多個系統、子系統或組件。

再不背離本發明實施例之精神及範疇下，特定實施例之特定細節可以任何適合方式組合。然而，本發明之其他實施例可針對與各個別態樣或此等個別態樣之特定組合相關的特定實施例。

出於說明及描述之目的，上文已描述本發明之例示性實施例。其不意欲為詳盡的或將本發明限制於所描述之精確形式，且根據以上教示可進行許多修改及變化。選擇並描述該等實施例以便充分地解釋本發明之原理及其實際應用，從而使其他熟習此項技術者能夠在各種實施例中充分利用本發明，並如為特定預期用途所適合，進行各種修改。

本文中所引用之所有公開案、專利及專利申請案以全文引用的方式併入本文中，以達成所有目的。

3371．．．I/O控制器

3372．．．系統記憶體

3373．．．中央處理器

3374．．．印表機

3375．．．系統匯流排

3376．．．監視器

3377．．．串聯埠

3378．．．鍵盤

3379．．．固接磁碟

3381．．．外部介面

3382．．．顯示配接器

圖1為說明根據本發明之實施例在獲自懷孕女性個體之生物樣本中執行序列失衡之產前診斷之方法100的流程圖；

圖2為展示根據本發明之實施例在與染色體比對之序列之大小方面染色體中值分級(當使用1型Illumina簇產生試劑套組時)之圖；

圖3為顯示根據本發明之實施例源自母體血漿中不同染色體之序列之大小分析的圖，其可用於胎兒染色體21非整倍性之非侵入性產前偵測；

圖4為說明根據本發明之實施例使用大小統計值之分級在獲自懷孕女性個體之生物樣本中執行胎兒染色體非整倍性之產前診斷之方法的流程圖；

圖5為說明根據本發明之實施例染色體21與染色體7及染色體14在與各自比對之序列之大小方面比較的表；

圖6為說明根據本發明之實施例使用對某一基因體位置之片段大小統計值之比較在獲自懷孕女性個體之生物樣本中執行序列失衡之產前診斷之方法的流程圖；

圖7展示根據本發明之實施例短片段佔總長度之分數(F)相對於截止值大小(w)的圖700；

圖8展示根據本發明之實施例關於懷有整倍體胎兒之情況，染色體21(實線)及參考染色體(除染色體13、18及21以外之所有體染色體)(點線)之短片段佔總長度之分數(F)相對於截止值大小的圖800；

圖9展示根據本發明之實施例關於懷有第21對染色體三體胎兒之情況，染色體21(實線)及參考染色體(除染色體13、18及21以外之所有體染色體)(點線)之F值相對於截止值大小的圖900；

圖10展示根據本發明之實施例關於懷有整倍體及第21對染色體三體胎兒之情況，染色體21與參考染色體(除染色體13、18及21以外之所有體染色體)之ΔF_(21-Ref) 相對於大小截止值的圖1000；

圖11展示根據本發明之實施例關於120例懷孕之性別及分類的表1100；

圖12說明根據本發明之實施例4個處於患病或未患病不同狀態之樣本之不同染色體的分級；

圖13展示根據本發明之實施例120例整倍體、第13對染色體三體、第18對染色體三體及第21對染色體三體之染色體13之分級；

圖14展示根據本發明之實施例120例整倍體、第13對染色體三體、第18對染色體三體及第21對染色體三體之染色體18之分級；

圖15展示根據本發明之實施例120例整倍體、第13對染色體三體、第18對染色體三體及第21對染色體三體之染色體21之分級；

圖16為說明根據本發明之實施例染色體13與染色體5及染色體6在與各自比對之序列之大小方面比較的表。染色體5及6與染色體13之比較可用於偵測懷有第13對染色體三體胎兒之情況中染色體21序列大小之變化。包括懷有整倍體及第18對染色體三體胎兒之結果以供比較；

圖17為說明根據本發明之實施例染色體18與染色體12及染色體14在與各自比對之序列之大小方面比較的表。根據本發明之實施例包括懷有整倍體及第13對染色體三體胎兒之結果以供比較；

圖18展示根據本發明之實施例在150 bp處染色體18與參考染色體之間短片段佔總長度之分數差異(ΔF_(18-Ref) )；

圖19展示根據本發明之實施例在150 bp處染色體21與參考染色體之間短片段佔總長度之分數差異(ΔF_(21-Ref) )；

圖20展示根據本發明之實施例不同染色體之GC含量列表(NCBI build 36，48型)；

圖21展示根據本發明之實施例在150 bp處染色體13與參考染色體之間短片段佔總長度之分數差異(ΔF_(18-Ref) )；

圖22為展示根據本發明之實施例與染色體21比對之序列的中值大小與相對於Y染色體比對之序列的百分比間之相關性的圖；

圖23A至23C為展示根據本發明之實施例分別與染色體18、13及21比對之序列的中值大小與相對於Y染色體比對之序列的百分比間之相關性的圖；

圖24展示使用母體血漿DNA分析來比較本發明實施例與用於胎兒非整倍性(第13對染色體三體及第18對染色體三體)之非侵入性偵測之另一方法的精確度；

圖25A至25C展示根據本發明之實施例懷孕女性及胎兒之基因型之不同情形的圖；

圖26展示根據本發明之實施例母親為異型接合且父親為同型接合之一實例；

圖27展示根據本發明之實施例當親本單倍型如圖26中所示時胎兒自母親遺傳Hap I之一實例；

圖28展示說明根據本發明之實施例染色體22上之α型單核苷酸多形現象(SNP)之大小分析的表；

圖29展示說明根據本發明之實施例染色體22上之β型SNP之大小分析的表；

圖30展示根據本發明之實施例染色體22上之α型SNP與β型SNP之ΔF_{(Hap I-Hap II)} 的圖；

圖31A為提供根據本發明之實施例在未進行標靶增濃之情況下血漿DNA之大小分析的表；

圖31B為提供根據本發明之實施例在進行標靶增濃之情況下血漿DNA之大小分析的表；

圖32為根據本發明之實施例在進行標靶增濃及未進行標靶增濃之情況下T21及整倍體樣本之ΔF的圖；及

圖33展示可用於本發明實施例之系統及方法之例示性電腦設備的方塊圖。

(無元件符號說明)

Claims

一種執行產前診斷獲自懷有胎兒之女性個體之生物樣本中序列失衡之方法，其中該生物樣本包括核酸序列之一部分的核酸分子，該生物樣本包含來自該胎兒及該女性個體之核酸分子，該方法包含：對於該生物樣本中多個核酸分子之每一者：測量該核酸分子之大小；鑑別該核酸分子來源之核酸序列；使用電腦系統測定對應於第一序列之該等核酸分子之大小分佈；及基於該測定之大小分佈，測定該第一序列是否存在序列失衡之分類。
如請求項1之方法，其另外包含：測定該懷孕女性個體之母本基因型，其中該第一序列含有該母本基因型之至少一部分；及基於該懷孕女性個體之該母本基因型及該測定之大小分佈，測定該生物樣本中該第一序列相對於該母本基因型是否存在序列失衡之分類。
如請求項2之方法，其另外包含：使用該分類來測定胎兒之基因型。
如請求項1之方法，其另外包含：測定該懷孕女性個體之母本單倍型，其中該第一序列含有該母本單倍型之至少一部分；及基於該懷孕女性個體之該母本單倍型及該測定之大小分佈，測定該生物樣本中該第一序列相對於該母本單倍型是否存在序列失衡之分類。
如請求項4之方法，其另外包含：測定該胎兒父親之父本基因型；及使用該父本基因型來測定該測試之序列失衡相對於該母本單倍型為過度呈現還是呈現不足。
如請求項4之方法，其另外包含：使用該分類來測定該胎兒之單倍型。
如請求項1之方法，其中該第一序列為染色體且該序列失衡為胎兒染色體非整倍性。
如請求項7之方法，其中該多個核酸分子已基於大小預先選擇。
如請求項8之方法，其中該多個核酸分子經預先選擇為少於200鹼基或經預先選擇為少於150鹼基。
如請求項8之方法，其中該多個核酸分子經預先選擇成至少兩組，各組具有不同之大小範圍，該方法另外包含：測定對應於第一染色體之各組核酸分子之大小分佈；比較該等大小分佈；及基於該等比較，測定該第一染色體是否存在胎兒染色體非整倍性之分類。
如請求項7之方法，其中測定對應於第一染色體之該等核酸分子之大小分佈包括：對於多個染色體之每一者，由對應於該染色體之該等核酸分子之大小計算統計值；且其中基於該測定之大小分佈，測定該第一染色體是否存在胎兒染色體非整倍性之分類，包括：基於該統計值，測定該等染色體之分級；比較該測定之第一染色體之分級與獲自參考生物樣本之第一染色體之另一分級；及基於該比較，測定該第一染色體是否存在胎兒染色體非整倍性之分類。
如請求項7之方法，其中測定對應於第一染色體之該等核酸分子之大小分佈包括：由對應於該第一染色體之核酸分子之大小計算第一統計值；由對應於一或多個第二染色體之核酸分子之大小計算第二統計值；且其中基於該測定之大小分佈，測定該第一染色體是否存在胎兒染色體非整倍性之分類，包括：測定該第一統計值與該第二統計值之間的分離值；比較該分離值與一或多個截止值(cutoff values)；及基於該比較，測定該第一染色體是否存在胎兒染色體非整倍性之分類。
如請求項12之方法，其中該分離值為該第一統計值與該第二統計值之間的差異或由該差異獲得之結果。
如請求項12之方法，其中該第一統計值及該第二統計值包括對應於各別染色體之該等核酸分子所測量大小的平均大小。
如請求項12之方法，其中該第一統計值及該第二統計值分別包括具有一個大小小於第一大小截止值之該等對應核酸分子之大小的第一總和。
如請求項15之方法，其中該第一統計值包括該第一總和除以第二總和，且其中該第二總和為所有該等對應核酸分子之大小的總和，或為具有一個大小小於第二大小截止值之該等對應核酸分子之大小的總和，該第二大小截止值大於該第一大小截止值。
如請求項15之方法，其中該第一統計值包括該第一總和除以第二總和，且其中該第二總和為大於第二大小截止值之該等對應核酸分子之大小的總和。
如請求項17之方法，其中該第二大小截止值為該第一大小截止值，且其中該第二總和為小於第三大小截止值之大小的總和，該第三大小截止值大於該第二大小截止值。
如請求項15之方法，其另外包含：針對多個第一大小截止值，重複計算該第一統計值及該第二統計值，且測定各第一大小截止值之該第一統計值與該第二統計值之間的分離值；及鑑別該等分離值之極值。
如請求項19之方法，其另外包含：比較該極值與該一或多個截止值。
如請求項19之方法，其另外包含：鑑別對應於該極值之第一大小截止值；及比較對應於該極值之第一大小截止值與該一或多個截止值。
如請求項7之方法，其中該生物樣本包括血液，血漿，血清，含有胎兒細胞之母體血液，獲自母體血液、尿液、唾液及子宮灌洗液之胎兒細胞。
一種電腦程式產品，其包含儲存多個指令之非暫時電腦可讀媒體，該多個指令係用於控制處理器以執行用於執行產前診斷獲自懷有胎兒之女性個體之生物樣本中序列不平衡之操作，其中該生物樣本包括核酸序列之一部分的核酸分子，該生物樣本包含來自該胎兒及該女性個體之核酸分子，該等指令包含：對於該生物樣本中多個核酸分子之每一者：測量該核酸分子之大小；鑑別該核酸分子來源之核酸序列；測定對應於第一序列之該等核酸分子之大小分佈；及基於該測定之大小分佈，測定該第一序列是否存在序列失衡之分類。
一種用於執行產前診斷獲自懷有胎兒之女性個體之生物樣本中胎兒染色體非整倍性之方法，其中該生物樣本包括來自該胎兒及該女性個體之核酸分子，該方法包含：對於該生物樣本中多個核酸分子之每一者：測量該核酸分子之大小；鑑別該核酸分子來源之染色體；對於多個染色體之每一者，電腦系統由對應於該染色體之核酸分子的大小計算統計值；基於該統計值，測定該等染色體之分級；比較該測定之第一染色體之分級與獲自參考生物樣本之第一染色體之另一分級；及基於該比較，測定該第一染色體是否存在胎兒染色體非整倍性之分類。
如請求項24之方法，其中比較該測定之第一染色體之分級與獲自參考生物樣本之第一染色體之另一分級包括：測定該測定之染色體分級與該生物樣本之參考染色體分級之間的第一差異；測定該染色體之另一分級與該參考生物樣本之參考染色體分級之間的第二差異；及比較該等差異。
如請求項24之方法，其中測量該多個核酸分子之每一者之大小包括：接收該生物樣本；及對該生物樣本中所含多個核酸分子之至少一部分定序。
如請求項26之方法，其中各核酸分子之定序部分包括該各別核酸分子之兩端。
如請求項24之方法，其中該統計值包括對應於各別染色體之該等核酸分子所測量大小的中值大小。
如請求項24之方法，其中該統計值包括對應於各別染色體之該等核酸分子所測量大小的平均大小。
如請求項24之方法，其中該所測量大小為長度或分子質量或與該長度相關之測量參數。
如請求項30之方法，其中該所測量大小為對應於該長度之螢光強度。
如請求項24之方法，其中該分級為該等統計值中最低至最高。
如請求項24之方法，其中該分級為該等統計值中最高至最低。
一種電腦程式產品，其包含儲存多個指令之非暫時電腦可讀媒體，該多個指令係用於控制處理器以執行用於執行產前診斷獲自懷有胎兒之女性個體之生物樣本中胎兒染色體非整倍性之操作，其中該生物樣本包括來自該胎兒及該女性個體之核酸分子，該等指令包含：對於該生物樣本中多個核酸分子之每一者：測量該核酸分子之大小；鑑別該核酸分子來源之染色體；對於多個染色體之每一者，由對應於該染色體之核酸分子的大小計算統計值；基於該統計值，測定該等染色體之分級；比較該測定之第一染色體之分級與獲自參考生物樣本之第一染色體之另一分級；及基於該比較，測定該第一染色體是否存在胎兒染色體非整倍性之分類。
一種用於執行產前診斷獲自懷有胎兒之女性個體之生物樣本中胎兒染色體非整倍性之方法，其中該生物樣本包括來自該胎兒及該女性個體之核酸分子，該方法包含：對於該生物樣本中多個核酸分子之每一者：測量該核酸分子之大小；鑑別該核酸分子來源之染色體；使用電腦系統由對應於第一染色體之核酸分子之大小計算第一統計值；該電腦系統由對應於一或多個第二染色體之核酸分子之大小計算第二統計值；測定該第一統計值與該第二統計值之間的分離值；比較該分離值與一或多個截止值；及基於該比較，測定該第一染色體是否存在胎兒染色體非整倍性之分類。
如請求項35之方法，其中該分離值為該第一統計值與該第二統計值之間的差異或由該差異獲得之結果。
如請求項35之方法，其中該分離值為該第一統計值與該第二統計值之比率或由該比率獲得之結果。
如請求項35之方法，其中該第一統計值及該第二統計值包括對應於各別染色體之該等核酸分子所測量大小的平均大小。
如請求項35之方法，其中該第一統計值及該第二統計值分別包括具有一個大小小於第一大小截止值之該等對應核酸分子之大小的第一總和。
如請求項39之方法，其中該第一統計值包括該第一總和除以第二總和，且其中該第二總和為所有該等對應核酸分子之大小的總和，或為具有一個大小小於第二大小截止值之該等對應核酸分子之大小的總和，該第二大小截止值大於該第一大小截止值。
如請求項39之方法，其中該第一統計值包括該第一總和除以第二總和，且其中該第二總和為大於第二大小截止值之該等對應核酸分子之大小的總和。
如請求項39之方法，其另外包含：針對多個第一大小截止值，重複計算該第一統計值及該第二統計值，且測定各該第一大小截止值之該第一統計值與該第二統計值之間的分離值；及鑑別該等分離值之極值。
如請求項42之方法，其另外包含：比較該極值與該一或多個截止值。
如請求項42之方法，其另外包含：鑑別對應於該極值之第一大小截止值；及比較對應於該極值之第一大小截止值與該一或多個截止值。
如請求項35之方法，其中該一或多個截止值係基於該生物樣本中胎兒DNA百分比之測量。
一種電腦程式產品，其包含儲存多個指令之非暫時電腦可讀媒體，該多個指令係用於控制處理器以執行用於執行產前診斷獲自懷有胎兒之女性個體之生物樣本中胎兒染色體非整倍性之操作，其中該生物樣本包括來自該胎兒及該女性個體之核酸分子，該等指令包含：對於該生物樣本中多個核酸分子之每一者：測量該核酸分子之大小；鑑別該核酸分子來源之染色體；由對應於第一染色體之核酸分子之大小計算第一統計值；由對應於一或多個第二染色體之核酸分子之大小計算第二統計值；測定該第一統計值與該第二統計值之間的分離值；比較該分離值與一或多個截止值；及基於該比較，測定該第一染色體是否存在胎兒染色體非整倍性之分類。