JP2017528140A - 核酸シーケンシングデータを解析するための方法およびシステム - Google Patents
核酸シーケンシングデータを解析するための方法およびシステム Download PDFInfo
- Publication number
- JP2017528140A JP2017528140A JP2017514334A JP2017514334A JP2017528140A JP 2017528140 A JP2017528140 A JP 2017528140A JP 2017514334 A JP2017514334 A JP 2017514334A JP 2017514334 A JP2017514334 A JP 2017514334A JP 2017528140 A JP2017528140 A JP 2017528140A
- Authority
- JP
- Japan
- Prior art keywords
- locus
- allele
- lead
- potential
- sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 374
- 238000012163 sequencing technique Methods 0.000 title claims abstract description 116
- 150000007523 nucleic acids Chemical class 0.000 title description 40
- 108020004707 nucleic acids Proteins 0.000 title description 35
- 102000039446 nucleic acids Human genes 0.000 title description 35
- 108700028369 Alleles Proteins 0.000 claims abstract description 743
- 208000003028 Stuttering Diseases 0.000 claims abstract description 118
- 108091028043 Nucleic acid sequence Proteins 0.000 claims abstract description 9
- 230000000875 corresponding effect Effects 0.000 claims description 162
- 108091092878 Microsatellite Proteins 0.000 claims description 142
- 238000004458 analytical method Methods 0.000 claims description 138
- 125000003729 nucleotide group Chemical group 0.000 claims description 125
- 239000002773 nucleotide Substances 0.000 claims description 122
- 230000003252 repetitive effect Effects 0.000 claims description 83
- 238000009826 distribution Methods 0.000 claims description 48
- 239000000203 mixture Substances 0.000 claims description 48
- 108091093088 Amplicon Proteins 0.000 claims description 38
- 238000003556 assay Methods 0.000 claims description 31
- 238000010899 nucleation Methods 0.000 claims description 28
- 230000002068 genetic effect Effects 0.000 claims description 27
- 108090000623 proteins and genes Proteins 0.000 claims description 17
- 238000003860 storage Methods 0.000 claims description 8
- 230000002441 reversible effect Effects 0.000 claims description 7
- 239000000539 dimer Substances 0.000 claims description 5
- 230000036541 health Effects 0.000 claims description 4
- 230000002596 correlated effect Effects 0.000 claims description 3
- 239000000523 sample Substances 0.000 description 343
- 239000013615 primer Substances 0.000 description 59
- 230000006870 function Effects 0.000 description 38
- 238000003199 nucleic acid amplification method Methods 0.000 description 35
- 230000003321 amplification Effects 0.000 description 34
- 238000005251 capillar electrophoresis Methods 0.000 description 26
- 239000003153 chemical reaction reagent Substances 0.000 description 15
- 108020004414 DNA Proteins 0.000 description 14
- 210000004027 cell Anatomy 0.000 description 14
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 12
- 239000012472 biological sample Substances 0.000 description 12
- 238000006243 chemical reaction Methods 0.000 description 8
- 238000003776 cleavage reaction Methods 0.000 description 7
- 238000003908 quality control method Methods 0.000 description 7
- 230000007017 scission Effects 0.000 description 7
- 230000009471 action Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 239000000758 substrate Substances 0.000 description 6
- PHIYHIOQVWTXII-UHFFFAOYSA-N 3-amino-1-phenylpropan-1-ol Chemical compound NCCC(O)C1=CC=CC=C1 PHIYHIOQVWTXII-UHFFFAOYSA-N 0.000 description 5
- 238000013459 approach Methods 0.000 description 5
- 239000002585 base Substances 0.000 description 5
- 238000002360 preparation method Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000011160 research Methods 0.000 description 5
- 108091034117 Oligonucleotide Proteins 0.000 description 4
- 239000012530 fluid Substances 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 238000012544 monitoring process Methods 0.000 description 4
- 102000007325 Amelogenin Human genes 0.000 description 3
- 108010007570 Amelogenin Proteins 0.000 description 3
- 210000001766 X chromosome Anatomy 0.000 description 3
- 239000011324 bead Substances 0.000 description 3
- 239000003086 colorant Substances 0.000 description 3
- 238000012790 confirmation Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 210000002593 Y chromosome Anatomy 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000000903 blocking effect Effects 0.000 description 2
- 210000004369 blood Anatomy 0.000 description 2
- 239000008280 blood Substances 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 239000000839 emulsion Substances 0.000 description 2
- 238000010348 incorporation Methods 0.000 description 2
- 238000011835 investigation Methods 0.000 description 2
- 230000033001 locomotion Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 102000054765 polymorphisms of proteins Human genes 0.000 description 2
- 238000012175 pyrosequencing Methods 0.000 description 2
- 108091035233 repetitive DNA sequence Proteins 0.000 description 2
- 102000053632 repetitive DNA sequence Human genes 0.000 description 2
- 238000005096 rolling process Methods 0.000 description 2
- 210000003296 saliva Anatomy 0.000 description 2
- 230000001960 triggered effect Effects 0.000 description 2
- 108020005065 3' Flanking Region Proteins 0.000 description 1
- 108020005029 5' Flanking Region Proteins 0.000 description 1
- 208000035657 Abasia Diseases 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 108091035707 Consensus sequence Proteins 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 239000003155 DNA primer Substances 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 108010042407 Endonucleases Proteins 0.000 description 1
- 102000004533 Endonucleases Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 239000000232 Lipid Bilayer Substances 0.000 description 1
- 108091092919 Minisatellite Proteins 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- 239000003513 alkali Substances 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000010504 bond cleavage reaction Methods 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 239000000428 dust Substances 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 239000007850 fluorescent dye Substances 0.000 description 1
- 238000004374 forensic analysis Methods 0.000 description 1
- 238000007672 fourth generation sequencing Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000012252 genetic analysis Methods 0.000 description 1
- 210000004209 hair Anatomy 0.000 description 1
- 229920001519 homopolymer Polymers 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000007403 mPCR Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- KHIWWQKSHDUIBK-UHFFFAOYSA-N periodic acid Chemical compound OI(=O)(=O)=O KHIWWQKSHDUIBK-UHFFFAOYSA-N 0.000 description 1
- 108091033319 polynucleotide Proteins 0.000 description 1
- 102000040430 polynucleotide Human genes 0.000 description 1
- 239000002157 polynucleotide Substances 0.000 description 1
- 108090000765 processed proteins & peptides Proteins 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 210000000582 semen Anatomy 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/10—Ploidy or copy number detection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/20—Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B45/00—ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks
Landscapes
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Biology (AREA)
- Biophysics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Analytical Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Chemical & Material Sciences (AREA)
- Molecular Biology (AREA)
- Genetics & Genomics (AREA)
- Data Mining & Analysis (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
Abstract
Description
本出願は、全体が参照により本明細書に組み込まれる、2014年9月18日に出願された「METHODS AND SYSTEMS FOR ANALYZING NUCLEIC ACID SEQUENCING DATA」と題する米国仮特許出願第62/052189号の優先権を主張する。
座D18S51のアライメント
この例は、一実施形態に従った、座D18S51のアライメントについて記載する。一部の座は、複雑度が低く、STR反復配列に似たフランキング配列を有する。これは、フランキング配列を(時にSTR配列自体に)誤って整列させ、そのためアレルが誤ってコールされる可能性がある。問題となる座の例はD18S51である。反復モチーフは[AGAA]n AAAG AGAGAGである。隣接配列を下記に示し、複雑度の低い「問題のある」配列に下線を引く。
短いSTR配列を加えることによる、座Penta-Dのアライメント
予想より1nt短い、STRを有する傾向のあるPenta-D配列の組。さらなる検査で、両フランクがpoly-A伸長を含み、シーケンシング/増幅エラーがしばしばその伸長のAの1つを取り除くことが発見された。下記の配列に示すように、ホモポリマーAの伸長が両フランクに見られる。
DNAサンプルの混合物の解析
サンプル混合物を、本明細書で提供する方法を用いて、法医学STRのパネルにおいて各座のコールを行った。各座では、各アレルおよび該アレルの異なる配列それぞれに対応するリード数をカウントした。
法医学STRパネルの解析
15個の異なる座のパネルを5つの異なるサンプルにおいて解析した。サンプルはPromega Corpから入手し、サンプル9947A、K562、2800M、NIST:AおよびB(SRM 2391c)が含まれた。座をCODIS STR法医学的マーカーから選択し、本明細書で提示するアライメント法を用いて、座にはCSF1PO、D3S1358、D7S820、D16S539、D18S51、FGA、PentaE、TH01、vWA、D5S818、D8S1179、D13S317、D21S11、PentaD、およびTPOXが含まれた。簡潔に言うと、Krenke, et al. (2002) J. Forensic Sci. 47(4): 773-785(これは参照によりその全体が組み込まれる)に記載されているように、マーカーを標準プライマーを用いて増幅した。アンプリコンをプールし、MiSeq sequencing instrument(カリフォルニア州サンディエゴ、Illumina)を1×460サイクル用いてシーケンシングデータを得た。
Claims (85)
- 対応するヌクレオチド配列を有する複数のサンプルリードを含むシーケンシングデータを受信するステップと、
前記サンプルリードを、前記ヌクレオチド配列に基づき指定座に割り当てるステップであって、対応する指定座に割り当てられる前記サンプルリードは、対応する前記指定座の割り当てリードである、ステップと、
各指定座の前記割り当てリードを解析して、前記割り当てリード内の対応する関心領域(ROI)を同定するステップであって、前記ROIはそれぞれ1つまたは複数の反復モチーフ連続を有し、対応する連続の各反復モチーフは同一のヌクレオチドの組を含む、ステップと、
多数の割り当てリードを有する指定座について、前記ROIの配列に基づき前記割り当てリードを分類し、その結果、異なる配列を有する前記ROIが異なる潜在的アレルとして割り当てられるようにするステップであって、各潜在的アレルは、前記指定座内の他の潜在的アレルの配列とは異なる配列を有する、ステップと、
多数の潜在的アレルを有する指定座について、前記潜在的アレルの配列を解析して、前記潜在的アレルの第1アレルが前記潜在的アレルの第2アレルのスタッター産物であると疑われるか否かを判断するステップであって、対応する前記配列内のk(kは整数)個の反復モチーフが前記第1アレルと前記第2アレルの間で付加された、または欠失した場合に、前記第1アレルは前記第2アレルのスタッター産物であると疑われる、ステップを含む、方法。 - 多数の潜在的アレルを有する前記指定座について、前記潜在的アレルの配列を解析して、前記第1アレルが前記第2アレルのスタッター産物であると疑われるか否かを判断するステップには、前記第1アレルと前記第2アレルのROIの長さを比較して、前記第1アレルと前記第2アレルのROIの長さが、1反復モチーフまたは多数の反復モチーフにより異なるか否かを判断するステップが含まれる、請求項1に記載の方法。
- 多数の潜在的アレルを有する前記指定座について、前記潜在的アレルの配列を解析して、前記第1アレルが前記第2アレルのスタッター産物であると疑われるか否かを判断するステップには、付加された、または欠失した前記反復モチーフを同定し、前記付加された、または欠失した反復モチーフが、対応する前記配列において隣接反復モチーフと同一であるか否かを判断するステップが含まれる、請求項1または2に記載の方法。
- kは1または2と等しい、請求項1〜3の何れか一項に記載の方法。
- 前記第1アレルと前記第2アレルのROIの配列間に他のミスマッチがない場合、前記第1アレルは前記第2アレルのスタッター産物である、請求項1〜4の何れか一項に記載の方法。
- 前記方法はさらに、少なくとも複数の前記指定座の遺伝子型をコールする遺伝子型プロファイルを生成するステップを含み、疑わしいスタッター産物を有する前記指定座は、前記疑わしいスタッター産物を有することが示される、請求項1〜5の何れか一項に記載の方法。
- 前記方法はさらに、少なくとも複数の前記指定座に遺伝子型コールを提供するステップを含み、前記遺伝子型コールの少なくとも1つは、前記少なくとも1つの遺伝子型コールの指定座に疑わしいスタッター産物が存在することを示す、請求項1〜6の何れか一項に記載の方法。
- 多数の潜在的アレルを有する各指定座について、前記潜在的アレルに対しコールされた前記サンプルリードの総数をカウントするステップをさらに含む、請求項1〜7の何れか一項に記載の方法であって、前記第1アレルのサンプルリードが、前記第2アレルのサンプルリードの指定の閾値未満である場合、前記第1アレルは前記第2アレルのスタッター産物である、方法。
- 前記指定閾値は、前記第2アレルのサンプルリードの約40%である、請求項8に記載の方法。
- 前記第1アレルのサンプルリードが前記第2アレルのサンプルリードの所定の割合を超える場合、前記疑わしいスタッター産物は別のコントリビュータに由来すると指定される、請求項8に記載の方法。
- 前記第1アレルのサンプルリードが前記第2アレルのサンプルリードの所定の割合未満である場合、前記疑わしいスタッター産物はノイズとして指定される、請求項8に記載の方法。
- 請求項1〜11の何れか一項に記載の方法であって、前記割り当てリードは第1保存フランキング領域と第2保存フランキング領域を含み、その間に対応する反復セグメントが位置し、各割り当てリードについて、
(a)前記第1保存フランキング領域と前記第2保存フランキング領域を含む基準配列を提供するステップと、
(b)前記基準配列の第1フランキング領域の一部を対応する前記割り当てリードに整列させるステップと、
(c)前記基準配列の第2フランキング領域の一部を対応する前記割り当てリードに整列させるステップと、
(d)前記反復セグメントの長さおよび/または配列を求めるステップをさらに含む、方法。 - ステップ(b)またはステップ(c)の一方または両方で前記フランキング領域の一部を整列させるステップには、
(i)前記反復セグメントに重なる、または隣接するシーディング領域の正確なk-merマッチングを用いることにより、対応する前記保存フランキング領域の前記割り当てリード上での位置を決定するステップと、
(ii)前記フランキング領域を前記割り当てリードに整列させるステップが含まれる、請求項12に記載の方法。 - 前記シーディング領域には、前記保存されたフランキング領域の複雑度の高い領域が含まれる、請求項13に記載の方法。
- 前記複雑度の高い領域には、ミスアライメント防ぐために前記反復セグメントとは十分に異なる配列が含まれる、請求項14に記載の方法。
- 前記複雑度の高い領域にはヌクレオチドの多様な混合物を有する配列が含まれる、請求項14に記載の方法。
- 前記シーディング領域は、対応する前記保存されたフランキング領域の複雑度の低い領域を避ける、請求項13に記載の方法。
- 前記複雑度の低い領域は、複数の前記反復モチーフと実質的に似た配列を有する、請求項17に記載の方法。
- 前記シーディング領域は前記反復セグメントに直接隣接する、請求項13に記載の方法。
- 前記シーディング領域には前記反復セグメントの一部が含まれる、請求項13に記載の方法。
- 前記シーディング領域は前記反復セグメントからオフセットしている、請求項13に記載の方法。
- 前記サンプルリードは、フォワードプライマー配列およびリバースプライマー配列を有するPCRアンプリコンである、請求項1〜12の何れか一項に記載の方法。
- 前記サンプルリードを前記指定座に割り当てるステップには、PCRアンプリコンのプライマー配列に対応する前記サンプルリードの配列を同定するステップが含まれる、請求項1〜12、または22の何れか一項に記載の方法。
- 前記シーケンシングデータは、合成によるシーケンシング(SBS)アッセイに由来する、請求項1〜12、22、または、23の何れか一項に記載する方法。
- 前記ROIにはショートタンデムリピート(STR)が含まれる、請求項1〜12、または、22〜24の何れか一項に記載の方法。
- 前記STRは、CODIS常染色体STR座、CODIS Y-STR座、EU常染色体STR座、またはEU Y-STR座の少なくとも1つから選択される、請求項25に記載の方法。
- 遺伝子座の組に対応するアンプリコンの複数のサンプルリードを含むシーケンシングデータを受信するステップであって、前記サンプルリードはリード対を含み、対応するアンプリコンの各リード対は対応する前記アンプリコンの第1リードおよび第2リードを含み、前記第1リードおよび前記第2リードはそれぞれ、各々のリード配列を有する、ステップと、
前記第1リードの潜在的遺伝子座を、前記第1リードのリード配列の解析に基づき同定するステップであって、前記潜在的遺伝子座は前記遺伝子座の組に由来する、ステップと、
少なくとも1つの潜在的座を有する前記第1リードそれぞれについて、前記第1リードが前記潜在的遺伝子座それぞれの基準配列と整列するか否かを判断するステップであって、
前記第1リードが1つの遺伝子座のみの基準配列と整列する場合、前記第1リードは前記1つの遺伝子座の潜在的アレルを含むと判断し、
前記第1リードが2つ以上の基準配列と整列する場合、前記第1リードは、前記第1リードと最もよく整列する基準配列を有する遺伝子座の潜在的アレルを含むと判断し、
前記第1リードが基準配列と整列しない場合、前記第1リードを非整列リードとして指定し、前記非整列リードを解析して該非整列リードと最も合う遺伝子座を前記潜在的遺伝子座から同定する、ステップと、
少なくとも複数の前記遺伝子座について、コールされた遺伝子型を含む遺伝子プロファイルを生成するステップであって、前記コールされた遺伝子型は、対応する前記遺伝子座の潜在的アレルに基づき、前記遺伝子プロファイルはまた、非整列リードを有する遺伝子座についての1つまたは複数の通知を含む、ステップを含む、方法。 - 前記通知の少なくとも1つは、対応する前記遺伝子座と関連する信頼度スコアを含み、前記信頼度スコアは、対応する前記遺伝子座と最も合う非整列リードの数に基づき、より大きい数の非整列リードは前記コールされた遺伝子型の信頼度がより低いことを示す、請求項27に記載の方法。
- 前記非整列リードを解析して該非整列リードと最も合う遺伝子座を前記潜在的遺伝子座から同定するステップには、前記非整列リードの同定サブ配列を解析して、前記同定サブ配列と最も合う遺伝子座を同定するステップが含まれる、請求項27または28に記載の方法。
- 前記同定サブ配列にはプライマー配列の少なくとも一部が含まれる、請求項28に記載の方法。
- 前記第1リードの潜在的遺伝子座を同定するステップには、前記第1リードのプライマー配列が、前記潜在的遺伝子座に関連する配列に有効にマッチすると判断するステップが含まれる、請求項27〜30の何れか一項に記載の方法。
- 前記シーケンシングデータは、非対称ペアエンドシーケンシングを介して生成される、請求項31に記載の方法。
- 前記非整列リードを解析して、潜在的アレルのドロップアウトが存在するか否かを判断するステップをさらに含む、請求項27〜32の何れか一項に記載の方法。
- 前記非整列リードを解析して前記アッセイの調子を判断するステップをさらに含む、請求項27〜33の何れか一項に記載の方法。
- 前記非整列リードを解析して、前記非整列リードがキメラを示すか否かを判断するステップをさらに含む、請求項27〜34の何れか一項に記載の方法。
- 前記非整列リードを解析してプライマーダイマーの数を決定するステップをさらに含む、請求項27〜35の何れか一項に記載の方法。
- 前記第1リードに前記遺伝子座の潜在的アレルが含まれると判断するステップには、前記第1リードに対応する前記第2リードも前記遺伝子座と相互に関連することを確かめるステップが含まれる、請求項27〜36の何れか一項に記載の方法。
- 前記非整列リードを解析して、該非整列リードがone-on-targetリードであるかpair-on-targetリードであるかを判断するステップをさらに含み、前記pair-on-targetリードは、データベースの第1選択配列および第2選択配列と有効にマッチする第1同定サブ配列および第2同定サブ配列を有し、前記one-on-targetリードは、データベースの前記第1選択配列と有効にマッチする前記第1同定サブ配列のみを有する、請求項27〜37の何れか一項に記載の方法。
- 遺伝子座の組に対応するアンプリコンの複数のサンプルリードを含むシーケンシングデータを受信するステップであって、前記サンプルリードはリード対を含み、対応するアンプリコンの各リード対は対応する前記アンプリコンの第1リードおよび第2リードを含み、前記第1リードおよび前記第2リードはそれぞれ、各々のリード配列を有する、ステップと、
前記第1リードの潜在的遺伝子座を、前記第1リードのリード配列の解析に基づき同定するステップであって、前記潜在的遺伝子座は前記遺伝子座の組に由来する、ステップと、
少なくとも1つの潜在的座を有する前記第1リードそれぞれについて、前記第1リードが前記潜在的遺伝子座それぞれの基準配列と整列するか否かを判断するステップと、
基準配列と整列しない前記第1リードを非整列リードとして指定するステップと、
前記非整列リードを解析して、前記非整列リードと最も合う遺伝子座を、前記潜在的遺伝子座から同定するステップと、
前記非整列リードを解析して、前記最も合う遺伝子座について潜在的アレルのドロップアウトが存在するか否かを判断するステップを含む、方法。 - 前記非整列リードを解析して、該非整列リードがone-on-targetリードであるかpair-on-targetリードであるかを判断するステップをさらに含み、前記pair-on-targetリードは、データベースの第1選択配列および第2選択配列と有効にマッチする第1同定サブ配列および第2同定サブ配列を有し、前記one-on-targetリードは、データベースの前記第1選択配列と有効にマッチする前記第1同定サブ配列のみを有し、前記非整列リードを解析して、前記最も合う遺伝子座について前記潜在的アレルのドロップアウトが存在するか否かを判断するステップは、pair-on-targetリードの数に基づく、請求項39に記載の方法。
- 複数の遺伝子座の各遺伝子座についてのリード分布を受信するステップであって、前記リード分布は複数の潜在的アレルを含み、各潜在的アレルは、アレル配列とリードカウントを有し、前記リードカウントは、前記潜在的アレルを含むと判断された、シーケンシングデータのサンプルリードの数を表す、ステップと、
前記複数の遺伝子座の各遺伝子座について、前記リード分布のうち、最大リードカウントを有する前記潜在的アレルの1つを同定するステップと、
前記複数の遺伝子座の各遺伝子座について、前記最大リードカウントが解釈閾値を超えるか否かを判断するステップであって、
前記最大リードが前記解釈閾値を超える場合、対応する前記遺伝子座の潜在的アレルを解析して、前記遺伝子座の遺伝子型をコールし、
前記最大リードが前記解釈閾値未満である場合、前記遺伝子座のカバレッジが低いという警告を生成する、ステップと、
遺伝子型がコールされた前記遺伝子座それぞれの遺伝子型と、カバレッジの低い遺伝子座についての警告とを含む、遺伝子プロファイルを生成するステップを含む、方法。 - 対応する前記遺伝子座の潜在的アレルを解析して、前記遺伝子座の遺伝子型をコールするステップには、さらに、
各遺伝子座の潜在的アレルの数を、前記遺伝子座の所定の最大許容可能アレル数と比較するステップと、
前記潜在的アレルの数が前記所定の最大許容可能アレル数を超える場合、前記遺伝子座は過剰な数のアレルを有するという警告を生成するステップが含まれる、請求項35に記載の方法。 - 対応する前記遺伝子座の潜在的アレルを解析して、前記遺伝子座の遺伝子型をコールするステップには、前記遺伝子座の複数の潜在的アレルの比率が互いに不十分である場合、前記遺伝子座は不均衡であるという警告を生成するステップがさらに含まれる、請求項35または36に記載の方法。
- 前記複数の遺伝子座の各遺伝子座について、前記潜在的アレルのリードカウントが解析閾値を上回るか否かを判断するステップをさらに含み、前記解析閾値は前記解釈閾値より上回ることが易しい、請求項35〜37の何れか一項に記載の方法。
- 前記解釈閾値を上回らないリードカウントを有する前記潜在的アレルはノイズアレルとして指定される、請求項38に記載の方法であって、前記ノイズアレルのリードカウントの合計をノイズ閾値と比較し、前記合計が前記ノイズ閾値を超える場合、前記遺伝子座は過剰なノイズを含むという警告を生成するステップをさらに含む、方法。
- 前記遺伝子座にはタンデムショートリピート(STR)座と一塩基多型(SNP)座が含まれる、請求項35〜39の何れか一項に記載の方法。
- (a)遺伝子座のリード分布を受信するステップであって、前記リード分布は複数の潜在的アレルを含み、各潜在的アレルは、アレル配列とカウントスコアを有し、前記カウントスコアは、前記潜在的アレルを含むことが明らかにされた、シーケンシングデータのサンプルリードの数に基づく、ステップと、
(b)もう1つの前記潜在的アレルのカウントスコアに基づき、前記遺伝子座のカバレッジが低いが否かを判断するステップであって、
前記遺伝子座のカバレッジが低い場合、前記遺伝子座のカバレッジが低いという通知を生成し、
前記遺伝子座のカバレッジが低くない場合、前記潜在的アレルのカウントスコアを解析して前記遺伝子座の遺伝子型を決定する、ステップと、
(d)前記遺伝子座の遺伝子型または前記遺伝子座のカバレッジが低いという警告を含む、遺伝子プロファイルを生成するステップを含む、方法。 - 前記遺伝子座のカバレッジが低いか否かを判断するステップには、前記潜在的アレルの1つまたは複数のカウントスコアが、解釈閾値を上回るか否かを判断するステップが含まれ、
前記カウントスコアの少なくとも1つが前記解釈閾値を上回る場合、対応する前記遺伝子座の潜在的アレルを解析して、前記遺伝子座の遺伝子型をコールし、
前記カウントスコアがいずれも前記解釈閾値を上回らない場合、前記遺伝子座のカバレッジが低いという通知を生成する、請求項47に記載の方法。 - 前記遺伝子座のカバレッジが低いか否かを判断するステップには、前記潜在的アレルの1つまたは複数のカウントスコアが解析閾値を上回るか否かを判断するステップが含まれ、
前記カウントスコアの少なくとも1つが前記解析閾値を上回る場合、対応する前記遺伝子座の潜在的アレルを解析して、前記遺伝子座の遺伝子型をコールし、
前記カウントスコアがいずれも前記解析閾値を上回らない場合、前記遺伝子座のカバレッジが低いという通知を生成する、請求項47に記載の方法。 - 前記遺伝子座のカバレッジが低いか否かを判断するステップには、前記遺伝子座の整列リード総数をリード閾値と比較するステップが含まれ、
前記整列リード総数が前記リード閾値を上回る場合、対応する前記遺伝子座の潜在的アレルを解析して前記遺伝子座の遺伝子型をコールし、
前記整列リード総数が前記リード閾値を上回らない場合、前記遺伝子座のカバレッジが低いという通知を生成する、請求項47に記載の方法。 - 前記カウントスコアはそれぞれ、対応する前記潜在的アレルのリードカウントに等しい値である、請求項47に記載の方法。
- 前記カウントスコアはそれぞれ、前記遺伝子座のリードカウントおよびリード総数に基づく関数である、請求項47に記載の方法。
- 前記カウントスコアはそれぞれ、前記遺伝子座のリードカウントおよび該遺伝子座について事前に得られたデータに基づく関数である、請求項47に記載の方法。
- 前記カウントスコアはそれぞれ、前記サンプルの他の遺伝子座のリードカウントに基づく関数である、請求項47に記載の方法。
- 前記カウントスコアはそれぞれ、他のサンプルの前記遺伝子座のリードカウントに基づく関数である、請求項47に記載の方法。
- 前記遺伝子座の潜在的アレルを解析して前記遺伝子座の遺伝子型をコールするステップには、さらに、
前記遺伝子座の潜在的アレルの数を、前記遺伝子座の所定の最大許容可能アレル数と比較するステップと、
前記潜在的アレルの数が前記所定の最大許容可能アレル数を超える場合、前記遺伝子座は過剰な数のアレルを有するという警告を生成するステップが含まれる、請求項47〜55の何れか一項に記載の方法。 - 前記遺伝子座の潜在的アレルを解析して前記遺伝子座の遺伝子型をコールするステップには、前記遺伝子座の複数の潜在的アレルの比率が互いに不十分である場合、前記遺伝子座は不均衡であるという通知を生成するステップがさらに含まれる、請求項47〜56の何れか一項に記載の方法。
- 前記潜在的アレルのカウントスコアが解析閾値を上回るか否かを判断するステップをさらに含み、前記解析閾値は前記解釈閾値よりも上回ることが易しい、請求項48に記載の方法。
- 前記解析閾値を上回らないカウントスコアを有する前記潜在的アレルはノイズアレルとして指定される、請求項58に記載の方法であって、ノイズスコアをノイズ閾値と比較するステップと、前記ノイズスコアが前記ノイズ閾値を上回る場合、前記遺伝子座は過剰なノイズを含むという警告を生成するステップをさらに含み、前記ノイズスコアは前記ノイズアレルのカウントスコアに基づく、方法。
- 前記遺伝子座は、ショートタンデムリピート(STR)座または一塩基多型(SNP)座の一方である、請求項47〜59の何れか一項に記載の方法。
- 複数の遺伝子座について、(a)〜(c)を反復するステップをさらに含み、前記遺伝子プロファイルを生成するステップには、前記遺伝子座それぞれの遺伝子型をコールするステップ、または、カバレッジの低い前記遺伝子座それぞれについての通知を提供するステップが含まれる、請求項47〜60の何れか一項に記載の方法。
- 遺伝子座のリード分布を受信するステップであって、前記リード分布は複数の潜在的アレルを含み、各潜在的アレルは、アレル配列とリードカウントを有し、前記リードカウントは、前記遺伝子座に割り当てられた、シーケンシングデータのサンプルリードの数を表す、ステップと、
前記潜在的アレルそれぞれのカウントスコアを求めるステップであって、前記カウントスコアは前記潜在的アレルのリードカウントに基づく、ステップと、
前記潜在的アレルのカウントスコアが解析閾値を上回るか否かを判断するステップであって、
対応する前記潜在的アレルのカウントスコアが前記解析閾値を上回らない場合、対応する前記潜在的アレルを破棄し
対応する前記潜在的アレルのカウントスコアが前記解析閾値を上回る場合、前記潜在的アレルを、前記遺伝子座の指定アレルとして指定するステップを含む、方法。 - 対応する前記潜在的アレルを破棄するステップには、前記潜在的アレルをノイズアレルとして指定するステップが含まれる、請求項62に記載の方法であって、前記ノイズアレルのカウントスコアが一括してノイズ閾値を上回るか否かを判断するステップをさらに含み、前記カウントスコアが一括して前記ノイズ閾値を上回る場合、前記遺伝子座は過剰なノイズを有するという警告を生成するステップを含む、方法。
- 前記カウントスコアはそれぞれ、対応する前記潜在的アレルのリードカウントと等しい値である、請求項62または63に記載の方法。
- 前記カウントスコアはそれぞれ、前記遺伝子座のリードカウントおよびリード総数に基づく関数である、請求項62または63に記載の方法。
- 前記カウントスコアはそれぞれ、前記遺伝子座のリードカウントおよび該遺伝子座について事前に得たデータに基づく関数である、請求項62または63に記載の方法。
- 指定アレルの数を、前記遺伝子座の所定の最大許容可能アレル数と比較するステップと、
前記指定アレルの数が、前記所定の最大許容可能アレル数を超える場合、前記遺伝子座は過剰な数のアレルを有するという警告を生成するステップをさらに含む、請求項62〜66の何れか一項に記載の方法。 - 前記遺伝子座の複数の指定アレルの比率が互いに不十分である場合、前記遺伝子座は不均衡であるという警告を生成するステップをさらに含む、請求項62〜67の何れか一項に記載の方法。
- 前記遺伝子座にはショートタンデムリピート(STR)座と一塩基多型(SNP)座が含まれる、請求項62〜67の何れか一項に記載の方法。
- 遺伝子座のリード分布を受信するステップであって、前記リード分布は複数の潜在的アレルを含み、各潜在的アレルはアレル配列とリードカウントを有し、前記リードカウントは、前記遺伝子座に割り当てられた、シーケンシングデータのサンプルリードの数を表す、ステップと、
前記リードカウントが解析閾値を超えるか否かを判断するステップであって、
対応する潜在的アレルのリードカウントが前記解析閾値未満である場合、対応する前記潜在的アレルをノイズアレルとして指定し、
対応する潜在的アレルのリードカウントが前記解析閾値を上回る場合、前記潜在的アレルを前記遺伝子座のアレルとして指定する、ステップと、
前記ノイズアレルのリードカウントの合計がノイズ閾値を超えるか否かを判断するステップであって、前記合計が前記ノイズ閾値を超える場合、前記遺伝子座が過剰なノイズを有するという警告を生成するステップを含む、方法。 - 指定アレルの数を、前記遺伝子座の所定の最大許容可能アレル数と比較するステップと、
前記指定アレルの数が、前記所定の最大許容可能アレル数を超える場合、前記遺伝子座は過剰な数のアレルを有するという警告を生成するステップをさらに含む、請求項70に記載の方法。 - 前記遺伝子座の複数の指定アレルの比率が互いに不十分である場合、前記遺伝子座は不均衡であるという警告を生成するステップをさらに含む、請求項70または71に記載の方法。
- 前記遺伝子座にはショートタンデムリピート(STR)座と一塩基多型(SNP)座が含まれる、請求項70〜72の何れか一項に記載の方法。
- 複数の遺伝子座の各遺伝子座の座データを受信するステップであって、前記座データは対応する前記遺伝子座について1つまたは複数の指定アレルを含み、各指定アレルは、シーケンシングデータから得られたリードカウントに基づく、ステップと、
前記複数の遺伝子座の各遺伝子座について、
対応する前記遺伝子座の指定アレルの数が、対応する前記遺伝子座の所定の最大許容可能アレル数より大きいか否かを判断するステップであって、前記指定アレルの数が前記所定の最大許容可能アレル数を超える場合、アレル数警告をさらに生成し、
前記指定アレルのアレル比率が不十分であるか否かを判断するステップであって、前記アレル比率は前記指定アレルのリードカウントに基づき、前記アレル比率が不均衡である場合、アレル比率警告をさらに生成する、ステップと、
前記遺伝子座の組のアレル数警告とアレル比率警告の数に基づき、前記サンプルが複数のソースの混合物を含むと判断するステップを含む、方法。 - 前記サンプルが複数のソースの混合物を含むと判断するステップには、前記警告の総数が混合物閾値を上回ると判断するステップが含まれる、請求項74に記載の方法。
- 前記混合物閾値は、前記遺伝子座の組における遺伝子座の数に基づく、請求項75に記載の方法。
- 前記混合物閾値は、前記組内の遺伝子座の所定の割合に等しい所定値である、請求項75に記載の方法。
- アレル数警告を生成するステップには、前記指定アレルの数に基づくアレル数スコアを提供するステップが含まれ、前記サンプルが複数のソースの混合物を含むと判断するステップには、前記アレル数スコアを解析するステップが含まれる、請求項74〜77の何れか一項に記載の方法。
- サンプルが混合物を含む可能性は、前記最大許容可能アレル数を超える前記指定アレルの数が増えるほど高まる、請求項78に記載の方法。
- アレル比率警告を生成するステップには、前記アレル比率に基づくアレル比率スコアを提供するステップが含まれ、前記サンプルが複数のソースの混合物を含むと判断するステップには、前記アレル比率スコアを解析するステップが含まれる、請求項74〜79の何れか一項に記載の方法。
- 前記サンプルが混合物を含む可能性は、前記アレル間の不均衡が増すほど高まる、請求項80に記載の方法。
- 前記遺伝子座にはショートタンデムリピート(STR)座と一塩基多型(SNP)座が含まれる、請求項74〜81の何れか一項に記載の方法。
- 複数のY座の座データを受信するステップであって、前記座データには前記Y座の指定アレルが含まれ、各指定アレルはシーケンシングデータから得られるリードカウントに基づく、ステップと、
各Y座の指定アレルの数を、前記Y座の予想アレル数と比較するステップと、
前記比較動作の結果に基づき、前記サンプルが男性または女性であるという予測を生成するステップを含む、方法。 - 前記遺伝子座にはショートタンデムリピート(STR)座と一塩基多型(SNP)座が含まれる、請求項83に記載の方法。
- 請求項1〜84の何れか一項を実行するように構成されたサンプルアナライザを含むシステム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201462052189P | 2014-09-18 | 2014-09-18 | |
US62/052,189 | 2014-09-18 | ||
PCT/US2015/050129 WO2016044233A1 (en) | 2014-09-18 | 2015-09-15 | Methods and systems for analyzing nucleic acid sequencing data |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2017528140A true JP2017528140A (ja) | 2017-09-28 |
JP2017528140A5 JP2017528140A5 (ja) | 2018-11-22 |
JP6802154B2 JP6802154B2 (ja) | 2020-12-16 |
Family
ID=55525984
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017514334A Active JP6802154B2 (ja) | 2014-09-18 | 2015-09-15 | 核酸シーケンシングデータを解析するための方法およびシステム |
Country Status (9)
Country | Link |
---|---|
US (2) | US20160085910A1 (ja) |
EP (1) | EP3194627B1 (ja) |
JP (1) | JP6802154B2 (ja) |
KR (1) | KR102538753B1 (ja) |
CN (1) | CN107002121B (ja) |
AU (1) | AU2015318017B2 (ja) |
CA (1) | CA2960840A1 (ja) |
SA (1) | SA517381091B1 (ja) |
WO (1) | WO2016044233A1 (ja) |
Families Citing this family (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RS60736B1 (sr) | 2013-12-03 | 2020-09-30 | Illumina Inc | Postupci i sistemi za analizu podataka sa slika |
US10600499B2 (en) | 2016-07-13 | 2020-03-24 | Seven Bridges Genomics Inc. | Systems and methods for reconciling variants in sequence data relative to reference sequence data |
US11001880B2 (en) | 2016-09-30 | 2021-05-11 | The Mitre Corporation | Development of SNP islands and application of SNP islands in genomic analysis |
CN110168648A (zh) | 2016-11-16 | 2019-08-23 | 伊路米纳有限公司 | 序列变异识别的验证方法和*** |
US20200202982A1 (en) * | 2017-05-17 | 2020-06-25 | Syracuse University | Methods and systems for assessing the presence of allelic dropout using machine learning algorithms |
CN111344794B (zh) * | 2017-07-20 | 2024-04-23 | 华为技术有限公司 | 用于鉴定单体型的装置和方法 |
WO2019079198A1 (en) | 2017-10-16 | 2019-04-25 | Illumina, Inc. | CLASSIFICATION OF A CONNECTION SITE BASED ON DEEP LEARNING |
CN113627458A (zh) | 2017-10-16 | 2021-11-09 | 因美纳有限公司 | 基于循环神经网络的变体致病性分类器 |
WO2020081122A1 (en) | 2018-10-15 | 2020-04-23 | Illumina, Inc. | Deep learning-based techniques for pre-training deep convolutional neural networks |
US11861491B2 (en) | 2017-10-16 | 2024-01-02 | Illumina, Inc. | Deep learning-based pathogenicity classifier for promoter single nucleotide variants (pSNVs) |
WO2019140402A1 (en) | 2018-01-15 | 2019-07-18 | Illumina, Inc. | Deep learning-based variant classifier |
WO2019200338A1 (en) | 2018-04-12 | 2019-10-17 | Illumina, Inc. | Variant classifier based on deep neural networks |
CN108647492B (zh) * | 2018-05-02 | 2019-04-16 | 中国人民解放军军事科学院军事医学研究院 | 一种染色质拓扑相关结构域的表征方法及装置 |
WO2020028862A1 (en) * | 2018-08-03 | 2020-02-06 | Nantomics, Llc | Panbam: bambam across multiple organisms in parallel |
US11521710B2 (en) | 2018-10-31 | 2022-12-06 | Tempus Labs, Inc. | User interface, system, and method for cohort analysis |
CN109920484A (zh) * | 2019-02-14 | 2019-06-21 | 北京安智因生物技术有限公司 | 一种测序仪用的基因检测数据的分析方法及*** |
NL2023316B1 (en) | 2019-03-21 | 2020-09-28 | Illumina Inc | Artificial intelligence-based sequencing |
WO2020191387A1 (en) | 2019-03-21 | 2020-09-24 | Illumina, Inc. | Artificial intelligence-based base calling |
US11705226B2 (en) | 2019-09-19 | 2023-07-18 | Tempus Labs, Inc. | Data based cancer research and treatment systems and methods |
CN110910960B (zh) * | 2019-11-30 | 2022-07-08 | 浙江天科高新技术发展有限公司 | 一种鲍曼不动杆菌分子血清型快速分析方法 |
CN111292809B (zh) * | 2020-01-20 | 2021-03-16 | 至本医疗科技(上海)有限公司 | 用于检测rna水平基因融合的方法、电子设备和计算机存储介质 |
CN111326213B (zh) * | 2020-02-20 | 2023-10-03 | 苏州金唯智生物科技有限公司 | 一种数据分析方法、装置、设备及存储介质 |
EP4291680A1 (en) * | 2021-02-12 | 2023-12-20 | Verogen, Inc. | Methods and compositions for dna based kinship analysis |
CN118103914A (zh) * | 2021-10-13 | 2024-05-28 | 诺杰有限公司 | 提高基于dna的亲缘关系分析的准确性的方法和组合物 |
CN114420208B (zh) * | 2022-02-28 | 2023-04-18 | 上海亿康医学检验所有限公司 | 一种用于鉴定核酸样本中cnv的方法和装置 |
Family Cites Families (58)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA1323293C (en) | 1987-12-11 | 1993-10-19 | Keith C. Backman | Assay using template-dependent nucleic acid probe reorganization |
CA1341584C (en) | 1988-04-06 | 2008-11-18 | Bruce Wallace | Method of amplifying and detecting nucleic acid sequences |
WO1989009835A1 (en) | 1988-04-08 | 1989-10-19 | The Salk Institute For Biological Studies | Ligase-based amplification method |
JP2801051B2 (ja) | 1988-06-24 | 1998-09-21 | アムジエン・インコーポレーテツド | 核酸塩基配列を検出するための方法及び試薬 |
WO1990001069A1 (en) | 1988-07-20 | 1990-02-08 | Segev Diagnostics, Inc. | Process for amplifying and detecting nucleic acid sequences |
US5185243A (en) | 1988-08-25 | 1993-02-09 | Syntex (U.S.A.) Inc. | Method for detection of specific nucleic acid sequences |
CA2044616A1 (en) | 1989-10-26 | 1991-04-27 | Roger Y. Tsien | Dna sequencing |
AU635105B2 (en) | 1990-01-26 | 1993-03-11 | Abbott Laboratories | Improved method of amplifying target nucleic acids applicable to both polymerase and ligase chain reactions |
US5573907A (en) | 1990-01-26 | 1996-11-12 | Abbott Laboratories | Detecting and amplifying target nucleic acids using exonucleolytic activity |
JP3175110B2 (ja) | 1994-02-07 | 2001-06-11 | オーキッド・バイオサイエンシーズ・インコーポレイテッド | リガーゼ/ポリメラーゼ媒体された単一ヌクレオチド多型のジェネティックビットアナリシスおよび遺伝子解析におけるその使用 |
US5641658A (en) | 1994-08-03 | 1997-06-24 | Mosaic Technologies, Inc. | Method for performing amplification of nucleic acid with two primers bound to a single solid support |
GB9620209D0 (en) | 1996-09-27 | 1996-11-13 | Cemu Bioteknik Ab | Method of sequencing DNA |
GB9626815D0 (en) | 1996-12-23 | 1997-02-12 | Cemu Bioteknik Ab | Method of sequencing DNA |
EP1498494A3 (en) | 1997-04-01 | 2007-06-20 | Solexa Ltd. | Method of nucleic acid sequencing |
DK1801214T3 (da) | 1997-07-07 | 2011-01-24 | Medical Res Council | In vitro sorteringsfremgangsmåde |
US6238863B1 (en) * | 1998-02-04 | 2001-05-29 | Promega Corporation | Materials and methods for indentifying and analyzing intermediate tandem repeat DNA markers |
AR021833A1 (es) | 1998-09-30 | 2002-08-07 | Applied Research Systems | Metodos de amplificacion y secuenciacion de acido nucleico |
US6274317B1 (en) * | 1998-11-02 | 2001-08-14 | Millennium Pharmaceuticals, Inc. | Automated allele caller |
US6274320B1 (en) | 1999-09-16 | 2001-08-14 | Curagen Corporation | Method of sequencing a nucleic acid |
US7955794B2 (en) | 2000-09-21 | 2011-06-07 | Illumina, Inc. | Multiplex nucleic acid reactions |
US7582420B2 (en) | 2001-07-12 | 2009-09-01 | Illumina, Inc. | Multiplex nucleic acid reactions |
US6807490B1 (en) * | 2000-02-15 | 2004-10-19 | Mark W. Perlin | Method for DNA mixture analysis |
US7001792B2 (en) | 2000-04-24 | 2006-02-21 | Eagle Research & Development, Llc | Ultra-fast nucleic acid sequencing device and a method for making and using the same |
CA2415897A1 (en) | 2000-07-07 | 2002-01-17 | Susan H. Hardin | Real-time sequence determination |
EP1354064A2 (en) | 2000-12-01 | 2003-10-22 | Visigen Biotechnologies, Inc. | Enzymatic nucleic acid synthesis: compositions and methods for altering monomer incorporation fidelity |
AR031640A1 (es) | 2000-12-08 | 2003-09-24 | Applied Research Systems | Amplificacion isotermica de acidos nucleicos en un soporte solido |
GB0127564D0 (en) | 2001-11-16 | 2002-01-09 | Medical Res Council | Emulsion compositions |
US7057026B2 (en) | 2001-12-04 | 2006-06-06 | Solexa Limited | Labelled nucleotides |
US7272506B2 (en) * | 2002-03-01 | 2007-09-18 | Applera Corporation | Computer algorithm for automatic allele determination from fluorometer genotyping device |
US20040002090A1 (en) | 2002-03-05 | 2004-01-01 | Pascal Mayer | Methods for detecting genome-wide sequence variations associated with a phenotype |
DK3363809T3 (da) | 2002-08-23 | 2020-05-04 | Illumina Cambridge Ltd | Modificerede nukleotider til polynukleotidsekvensering |
EP1590477B1 (en) | 2003-01-29 | 2009-07-29 | 454 Corporation | Methods of amplifying and sequencing nucleic acids |
US20040215401A1 (en) * | 2003-04-25 | 2004-10-28 | Krane Dan Edward | Computerized analysis of forensic DNA evidence |
US8048627B2 (en) | 2003-07-05 | 2011-11-01 | The Johns Hopkins University | Method and compositions for detection and enumeration of genetic variations |
US7127355B2 (en) * | 2004-03-05 | 2006-10-24 | Perlegen Sciences, Inc. | Methods for genetic analysis |
CN101914620B (zh) | 2004-09-17 | 2014-02-12 | 加利福尼亚太平洋生命科学公司 | 核酸测序的方法 |
GB0427236D0 (en) | 2004-12-13 | 2005-01-12 | Solexa Ltd | Improved method of nucleotide detection |
EP1907571B1 (en) | 2005-06-15 | 2017-04-26 | Complete Genomics Inc. | Nucleic acid analysis by random mixtures of non-overlapping fragments |
GB0514910D0 (en) | 2005-07-20 | 2005-08-24 | Solexa Ltd | Method for sequencing a polynucleotide template |
US7405281B2 (en) | 2005-09-29 | 2008-07-29 | Pacific Biosciences Of California, Inc. | Fluorescent nucleotide analogs and uses therefor |
GB0522310D0 (en) | 2005-11-01 | 2005-12-07 | Solexa Ltd | Methods of preparing libraries of template polynucleotides |
EP2021503A1 (en) | 2006-03-17 | 2009-02-11 | Solexa Ltd. | Isothermal methods for creating clonal single molecule arrays |
US8241573B2 (en) | 2006-03-31 | 2012-08-14 | Illumina, Inc. | Systems and devices for sequence by synthesis analysis |
US7754429B2 (en) | 2006-10-06 | 2010-07-13 | Illumina Cambridge Limited | Method for pair-wise sequencing a plurity of target polynucleotides |
WO2008051530A2 (en) | 2006-10-23 | 2008-05-02 | Pacific Biosciences Of California, Inc. | Polymerase enzymes and reagents for enhanced nucleic acid sequencing |
WO2011139797A2 (en) * | 2010-04-27 | 2011-11-10 | Spiral Genetics Inc. | Method and system for analysis and error correction of biological sequences and inference of relationship for multiple samples |
WO2013052557A2 (en) * | 2011-10-03 | 2013-04-11 | Natera, Inc. | Methods for preimplantation genetic diagnosis by sequencing |
EP2854057B1 (en) * | 2010-05-18 | 2018-03-07 | Natera, Inc. | Methods for non-invasive pre-natal ploidy calling |
US10241075B2 (en) * | 2010-12-30 | 2019-03-26 | Life Technologies Corporation | Methods, systems, and computer readable media for nucleic acid sequencing |
WO2012108920A1 (en) * | 2011-02-09 | 2012-08-16 | Natera, Inc | Methods for non-invasive prenatal ploidy calling |
EP2766496B1 (en) * | 2011-10-11 | 2017-03-08 | Sequenom, Inc. | Methods and processes for non-invasive assessment of genetic variations |
WO2013076586A2 (en) * | 2011-11-21 | 2013-05-30 | Advanced Biological Laboratories Sa | Systems, methods, and computer program products for guiding the selection of therapeutic treatment regiments |
US20130261984A1 (en) * | 2012-03-30 | 2013-10-03 | Illumina, Inc. | Methods and systems for determining fetal chromosomal abnormalities |
US20140163900A1 (en) * | 2012-06-02 | 2014-06-12 | Whitehead Institute For Biomedical Research | Analyzing short tandem repeats from high throughput sequencing data for genetic applications |
CN104755632B (zh) * | 2012-09-06 | 2017-10-03 | 生命技术公司 | 多重y‑str分析 |
CA2890441A1 (en) * | 2012-11-07 | 2014-05-15 | Good Start Genetics, Inc. | Methods and systems for identifying contamination in samples |
WO2014116729A2 (en) * | 2013-01-22 | 2014-07-31 | The Board Of Trustees Of The Leland Stanford Junior University | Haplotying of hla loci with ultra-deep shotgun sequencing |
EP2971069B1 (en) | 2013-03-13 | 2018-10-17 | Illumina, Inc. | Methods and systems for aligning repetitive dna elements |
-
2015
- 2015-09-15 AU AU2015318017A patent/AU2015318017B2/en active Active
- 2015-09-15 WO PCT/US2015/050129 patent/WO2016044233A1/en active Application Filing
- 2015-09-15 CN CN201580050718.4A patent/CN107002121B/zh active Active
- 2015-09-15 EP EP15842246.9A patent/EP3194627B1/en active Active
- 2015-09-15 CA CA2960840A patent/CA2960840A1/en active Pending
- 2015-09-15 US US14/854,441 patent/US20160085910A1/en not_active Abandoned
- 2015-09-15 KR KR1020177010442A patent/KR102538753B1/ko active IP Right Grant
- 2015-09-15 JP JP2017514334A patent/JP6802154B2/ja active Active
-
2017
- 2017-03-14 SA SA517381091A patent/SA517381091B1/ar unknown
-
2021
- 2021-08-12 US US17/400,165 patent/US20210375396A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
JP6802154B2 (ja) | 2020-12-16 |
CA2960840A1 (en) | 2016-03-24 |
EP3194627B1 (en) | 2023-08-16 |
AU2015318017B2 (en) | 2022-02-03 |
SA517381091B1 (ar) | 2021-03-31 |
CN107002121B (zh) | 2020-11-13 |
WO2016044233A1 (en) | 2016-03-24 |
KR20170056682A (ko) | 2017-05-23 |
US20160085910A1 (en) | 2016-03-24 |
CN107002121A (zh) | 2017-08-01 |
KR102538753B1 (ko) | 2023-05-31 |
EP3194627C0 (en) | 2023-08-16 |
EP3194627A4 (en) | 2018-05-30 |
US20210375396A1 (en) | 2021-12-02 |
AU2015318017A1 (en) | 2017-03-30 |
EP3194627A1 (en) | 2017-07-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6802154B2 (ja) | 核酸シーケンシングデータを解析するための方法およびシステム | |
JP6328934B2 (ja) | 非侵襲性出生前親子鑑定法 | |
KR102638152B1 (ko) | 서열 변이체 호출을 위한 검증 방법 및 시스템 | |
US20240035094A1 (en) | Methods and systems to detect large rearrangements in brca1/2 | |
US20140127688A1 (en) | Methods and systems for identifying contamination in samples | |
US20210102250A1 (en) | Methods for haplotyping single cells | |
CA2928013A1 (en) | Genetic analysis method | |
WO2016011378A1 (en) | Systems and methods for detecting structural variants | |
JP2020534011A (ja) | 圧縮分子タグ付き核酸配列データを用いた融合の検出のための方法 | |
US9938575B2 (en) | Compositions and methods for high-throughput nucleic acid analysis and quality control | |
CN109923215B (zh) | 序列变体的检测 | |
JP7333838B2 (ja) | 胚における遺伝パターンを決定するためのシステム、コンピュータプログラム及び方法 | |
US20160171151A1 (en) | Method for determining read error in nucleotide sequence | |
EP4073264B1 (en) | Method for whole genome sequencing of picogram quantities of dna | |
US20200318175A1 (en) | Methods for partner agnostic gene fusion detection | |
JP2021534803A (ja) | 無細胞核酸試料におけるアレル不均衡を検出するための方法およびシステム | |
JP2021502072A (ja) | 脱アミノ化に誘導される配列エラーの補正 | |
WO2024059487A1 (en) | Methods for detecting allele dosages in polyploid organisms |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180913 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180913 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181005 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20191029 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200124 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200512 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200807 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201110 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201126 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6802154 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |