CN117437978A - 一种二代测序数据的低频基因突变分析方法、装置及其应用 - Google Patents
一种二代测序数据的低频基因突变分析方法、装置及其应用 Download PDFInfo
- Publication number
- CN117437978A CN117437978A CN202311696182.6A CN202311696182A CN117437978A CN 117437978 A CN117437978 A CN 117437978A CN 202311696182 A CN202311696182 A CN 202311696182A CN 117437978 A CN117437978 A CN 117437978A
- Authority
- CN
- China
- Prior art keywords
- sequencing
- sequence
- base
- sequences
- family
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012163 sequencing technique Methods 0.000 title claims abstract description 138
- 238000004458 analytical method Methods 0.000 title claims abstract description 41
- 206010064571 Gene mutation Diseases 0.000 title claims abstract description 25
- 238000000034 method Methods 0.000 claims abstract description 50
- 230000035772 mutation Effects 0.000 claims abstract description 30
- 238000003780 insertion Methods 0.000 claims abstract description 11
- 230000037431 insertion Effects 0.000 claims abstract description 11
- 238000001514 detection method Methods 0.000 claims description 22
- 108090000623 proteins and genes Proteins 0.000 claims description 11
- 108091093088 Amplicon Proteins 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 6
- 238000001914 filtration Methods 0.000 claims description 5
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 238000012937 correction Methods 0.000 claims description 4
- 230000007614 genetic variation Effects 0.000 claims description 4
- 239000002585 base Substances 0.000 claims 19
- 239000003513 alkali Substances 0.000 claims 1
- 239000011159 matrix material Substances 0.000 claims 1
- 238000012217 deletion Methods 0.000 abstract description 6
- 230000037430 deletion Effects 0.000 abstract description 6
- 238000007405 data analysis Methods 0.000 abstract description 5
- 230000037429 base substitution Effects 0.000 abstract description 4
- 239000000523 sample Substances 0.000 description 4
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000013610 patient sample Substances 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- BAAVRTJSLCSMNM-CMOCDZPBSA-N (2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-amino-3-(4-hydroxyphenyl)propanoyl]amino]-4-carboxybutanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]pentanedioic acid Chemical group C([C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCC(O)=O)C(O)=O)C1=CC=C(O)C=C1 BAAVRTJSLCSMNM-CMOCDZPBSA-N 0.000 description 1
- 206010069754 Acquired gene mutation Diseases 0.000 description 1
- 108091035707 Consensus sequence Proteins 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000002773 nucleotide Substances 0.000 description 1
- 125000003729 nucleotide group Chemical group 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 230000037439 somatic mutation Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 108010032276 tyrosyl-glutamyl-tyrosyl-glutamic acid Proteins 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/50—Mutagenesis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Medical Informatics (AREA)
- Biophysics (AREA)
- Theoretical Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Bioinformatics & Computational Biology (AREA)
- Chemical & Material Sciences (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Analytical Chemistry (AREA)
- Molecular Biology (AREA)
- Genetics & Genomics (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一种二代测序数据的低频基因突变分析方法、装置及其应用,尤其涉及针对IonTorrent测序平台的分子标签测序数据的分析方法、装置及其应用。本发明设计一种全新的适用多种测序平台尤其是IonTorrent的分子标签测序数据分析方法,通过blast寻找定位reads中barcode序列而非通过寻找固定序列确定barcode位置信息,进行一致性分析时将family中的reads多序列比对并修正碱基测序质量值,除了消除测序过程中引入的错误的碱基替换还能消除错误的***和缺失,可用于同时准确检测出低频SNV和INDEL突变。
Description
技术领域
本发明属于生物信息学技术领域,涉及一种二代测序数据的低频基因突变分析方法、装置及其应用,尤其涉及针对IonTorrent测序平台的分子标签测序数据的分析方法、装置及其应用。
背景技术
在临床精准医疗的研究和应用中,低频率(<1%)的体细胞突变包括基因的点突变、***和缺失一直是被关注的热点。
NGS技术被广泛引用于检测基因变异。但NGS在测序过程中会因为技术本身的问题而引入错误的碱基序列信息,导致要检测的目标突变位点信息会被噪音覆盖而无法被正确检测出来。
Ion Torrent 测序仪是第一个不需要光学***的商业测序仪,所采用的技术为半导体测序,通过半导体芯片直接将化学信号转换为数字信号,是一种经济、快速、简单、规模可扩展的测序技术,非常适合扩增子测序。因为测序时间短,仪器设备便宜等特点而被广泛采用。但是传感器对pH的变化对于连续碱基的检测还不够完善,因此在测量同一碱基连续出现时的数量可能会有所误差,要检测的目标突变位点信息会被噪音覆盖而无法被正确检测出来。
Illumina测序平台技术较为成熟,但是依然存在0.1%~1%的测序错误率,主要表现为碱基替换和AT碱基偏好性。
为了提高低频突变的检测精确度,可以使用分子标签的技术提高检测灵敏度。在建立测序文库时,在扩增分子的两端分别连接上6bp的随机序列称为barcode。Barcode会在下游的测序过程中随着连接的分子一起被扩增并测序。具有相同barcode的reads属于同一个family,可以被认为是由同一条原始分子扩增而来。同一个family中的reads理论上应完全一致,通过一致性分析将所有reads合并为一条consensus reads,可以消除测序过程的碱基测序错误和duplication。
针对分子标签测序数据的生物信息分析软件有UMItools、fgbio、samtools,smCounter和Conner等。UMItools,fgbio,smCounter和Conner更适用于Illumina平台生成的数据,而不适用Ion torrent平台。Samtools的Consensus模块可以处理Illumina和Iontorrent多个平台的测序数据,在检测SNV(single nucleotide variants)时有较好的表现,但Samtools在合并reads时会以参考基因组为基准,会消除reads中的原有的***和缺失,导致无法检测INDEL。
综上所述,开发适用于多测序平台数据分析方法,对于基因变异检测领域具有重要意义。
发明内容
针对现有技术的不足和实际需求,本发明提供一种二代测序数据的低频基因突变分析方法、装置及其应用,尤其涉及针对IonTorrent测序平台的分子标签测序数据的分析方法、装置及其应用,且能够同时准确检测出低频SNV和INDEL突变。
为达上述目的,本发明采用以下技术方案:
第一方面,本发明提供一种二代测序数据的低频基因突变分析方法,所述方法包括以下步骤:
(1)以检测目标基因的序列为输入,建立blastn的数据库;
(2)将测序fastq文件转为fasta格式文件;
(3)使用blastn将测序fasta序列(即reads)比对到目标基因,得到扩增子在测序序列上的位置坐标,提取分子标签序列信息;
(4)将具有相同分子标签的测序序列归为同一个家族序列(即family),过滤掉家族序列中测序序列数小于3的家族序列;
(5)对各个家族序列中所有测序序列进行多序列比对,并引入空值(即gap),统计家族序列中所有测序序列在相同位置上的A、T、C、G和空值的计数,并按公式(1)计算碱基测序质量Q,Q加上33再转化为ASCII表对应的字符即为fastq文件中每个碱基对应的修正测序质量Phred33值;
Q = -10 log10(P) 公式(1)
其中,Q表示碱基测序质量,P表示为碱基测序错误概率;
(6)基于家族序列中所有测序序列合并得到一条测序序列,计数最多的碱基作为一致序列(consensus序列)的碱基,如果对应位置空值的计数最多,则判定该位置存在测序***错误,在一致序列中去除该位置信息,如果有多个碱基的计数相同,则取修正后碱基测序质量最高的碱基,得到一致(consensus)后的fastq文件。
本发明中,设计一种全新的适用多种测序平台尤其是IonTorrent的分子标签测序数据分析方法,通过blast寻找定位reads中barcode序列而非通过寻找固定序列确定barcode位置信息,进行一致性分析时将family中的reads多序列比对并修正碱基测序质量值,除了消除测序过程中引入的错误的碱基替换还能消除错误的***和缺失,兼容主流的二代测序平台illumina和iontorrent数据,尤其针对iontorrent数据分析有较好的效果,可用于同时准确检测出低频SNV和INDEL突变。
本发明使用blastn将每条reads比对到基因组来确定每条reads上barcode的位置信息,而不是只通过寻找reads两端的固定序列来提取reads上的barcode,可以避免由于碱基合成错误或测序错误导致的固定序列错误而无法定位barcode的位置信息。
本发明中,在检测突变时碱基测序质量是一个重要的指标,通过筛选质量值较低的碱基,可以去除假阳性突变位点。
第二方面,本发发明提供一种二代测序数据的分析装置,所述装置用于执行第一方面所述的二代测序数据的低频基因突变分析方法中的步骤,包括:
构建数据库单元:用于执行以检测目标基因的序列为输入,建立blastn的数据库;
转换单元:用于执行将测序fastq文件转为fasta格式文件;
数据获取单元:用于执行使用blastn将测序fasta序列比对到目标基因,得到扩增子在测序序列上的位置坐标,提取分子标签序列信息;
分类单元:用于执行将具有相同分子标签的测序序列归为同一个家族序列,过滤掉家族序列中测序序列数小于3的家族序列;
计算修正测序质量单元:用于执行对各个家族序列中所有测序序列进行多序列比对,并引入空值,统计家族序列中所有测序序列在相同位置上的A、T、C、G和空值的计数,并按公式(1)计算碱基测序质量Q,Q加上33再转化为ASCII表对应的字符即为fastq文件中每个碱基对应的修正测序质量Phred33值;
Q = -10 log10(P) 公式(1)
其中,Q表示碱基测序质量,P表示为碱基测序错误概率;
分析单元:用于执行基于家族序列中所有测序序列合并得到一条测序序列,同一位置上计数最多的碱基作为一致序列碱基,如果对应位置空值的计数最多,则判定该位置存在测序***错误,在一致序列中去除该位置信息,如果有多个碱基的计数相同,则取修正后碱基测序质量最高的碱基,得到一致后的fastq文件。
第三方面,本发明提供第一方面所述的二代测序数据的低频基因突变分析方法或第二方面所述的二代测序数据的分析装置在基因变异检测中的应用。
第四方面,本发明提供一种检测低频基因变异的方法,所述方法包括:
对待测样本进行二代测序,利用第一方面所述的二代测序数据的低频基因突变分析方法或第二方面所述的二代测序数据的低频基因突变分析方法装置对二代测序数据进行分析,基于分析结果使用比对软件进行基因组比对,使用变异检测分析软件检测变异,输出变异结果。
本发明开发适用多种测序平台的分子标签测序数据分析方法,对测序数据进行快速分析处理,进一步进行变异检测分析,能够同时准确检测出低频SNV和INDEL突变具有广阔的应用前景,如临床精准医疗领域,以及非疾病诊断目的的基因变异基础行为的研究中等等。
优选地,所述比对软件包括bwa软件、bowtie2软件或blast软件等中任意一种;
优选地,所述变异检测分析软件包括Varscan2软件、Mutect2软件、GATK软件或Freebayes软件等中任意一种。
优选地,所述变异检测分析软件检测SNV时最低碱基质量设为20~25,具体可选范围内数值,例如可以是20、21、22、23、24或25等,检测INDEL时最低碱基质量值设为20~25,具体可选范围内数值,例如可以是20、21、22、23、24或25等。
第五方面,本发明提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序/指令,所述计算机程序/指令被处理器执行时实现第一方面所述二代测序数据的低频基因突变分析方法的步骤或第四方面所述检测低频基因变异的方法的步骤。
第六方面,本发明提供一种存储有计算机程序的计算机可读存储介质,所述计算机程序使计算机建立和/或运行如第一方面所述二代测序数据的低频基因突变分析方法的步骤或第四方面所述检测低频基因变异的方法的步骤。
与现有技术相比,本发明具有以下有益效果:
本发明提供一种适用多种测序平台尤其是IonTorrent的分子标签测序数据检测方法,通过blast寻找定位reads中barcode序列而非通过寻找固定序列确定barcode位置信息,进行一致性分析时将family中的reads多序列比对并修正碱基测序质量值,除了消除测序过程中引入的错误的碱基替换还能消除错误的***和缺失,能够同时准确检测出低频SNV和INDEL突变。
附图说明
图1为分析流程示意图;
图2为扩增子结构示意图;
图3为consensus示意图。
具体实施方式
为进一步阐述本发明所采取的技术手段及其效果,以下结合实施例和附图对本发明作进一步地说明。可以理解的是,此处所描述的具体实施方式仅仅用于解释本发明,而非对本发明的限定。
实施例中未注明具体技术或条件者,按照本领域内的文献所描述的技术或条件,或者按照产品说明书进行。所用试剂或仪器未注明生产厂商者,均为可通过正规渠道购买获得的常规产品。
实施例1
样本制备:首先使用一代测序检测癌症患者样本,确定患者样本的特定突变位点比例。再将该患者的细胞系与野生型细胞系按照一定比例混合,制备成各种已知突变比例的参考样本。样本测序:使用Ion Torrent对已制备样本建库测序得到fastq文件。分析过程如图1所示,数据分析:将fastq文件转成fasta格式后用blastn与扩增模板序列比对,得到得到扩增子在reads上的位置坐标,如图2所示,在构建测序文库时,在扩增子的两端分别添加分析标签和固定序列,在后续的分析中可以用前后分子标签去除PCR和测序过程中的碱基错误,还原原始的序列信息,而固定序列可以定位分子标签在测序序列中的位置,提取分子标签序列信息,得到包含分子标签信息的fastq文件。过去掉reads长度短于扩增模板长度的reads后,过滤family reads少于3条的family;对各个家族序列中所有测序序列进行多序列比对,并引入空值(即gap),统计家族序列中所有测序序列在相同位置上的A、T、C、G和空值的计数,并按公式(1)计算碱基测序质量Q,Q加上33再转化为ASCII表对应的字符即为fastq文件中每个碱基对应的修正测序质量Phred33值;使用consensus算法将family中的reads合并成一条,得到consensus.fastq文件,如图3所示,图中为包含有6条测序序列的一个family,将6条序列进行多序列比对后还原为1条consensus reads,认为该序列即原始的碱基序列;在相同的位置6条序列的碱基完全一致,则我们认为原始序列在该位置实际就是该碱基;6条序列在连续的T的末端位置有2条为T,其余4条在相应位置为缺失(“--”),我们就认为原始序列在该位置实际不存在;6条序列有5条存在GTGT序列,而有1条在对应位置为TGTG,我们就认为原始序列在该位置实际为GTGT;6条序列有5条存在一个位置碱基为A,而有1条在对应位置为缺失,我们就认为原始序列在该位置实际为A。使用bwa将consensus.fastq比对到参考基因组得到sam文件,使用samtools和Varscan2检测变异位点。
本实施例制备了以下已知变异位点和突变比例的样本,使用IonTorrent测序。目标变异类型涉及snp和indel,目标变异比例在1%~30%不等。
检测结果如表1所示。
表1
结论:检测结果与预测结果在误差范围内基本一致,表明本发明对IonTorrent测序数据检测点突变和***变异时有优秀表现。
实施例2
同时制备了以下已知变异位点和突变比例的样本,使用Illumina 测序,检测过程参照实施例1。目标变异类型为indel,目标变异比例在10%左右。
检测结果如表2所示,表明本发明方法同样适用Illumina 测序数据。
表2
对比例1
以samtools的consensus模块作为对比技术,对实施例1和实施例2中的样本一、样本二、样本三和样本四进行分析,结果如表3所示,使用samtools的consensus模块可以检测到snp,但没有分析INDEL的能力。而本发明可以精确检测INDEL。
表3
综上所述,本发明开发一种适用多种测序平台尤其是IonTorrent的分子标签测序数据检测方法,通过blast寻找定位reads中barcode序列而非通过寻找固定序列确定barcode位置信息,进行一致性分析时将family中的reads多序列比对并修正碱基测序质量值,除了消除测序过程中引入的错误的碱基替换还能消除错误的***和缺失,能够同时准确检测出低频SNV和INDEL突变。
申请人声明,本发明通过上述实施例来说明本发明的详细方法,但本发明并不局限于上述详细方法,即不意味着本发明必须依赖上述详细方法才能实施。所属技术领域的技术人员应该明了,对本发明的任何改进,对本发明产品各原料的等效替换及辅助成分的添加、具体方式的选择等,均落在本发明的保护范围和公开范围之内。
Claims (10)
1.一种二代测序数据的低频基因突变分析方法,其特征在于,所述方法包括以下步骤:
(1)以检测目标基因的序列为输入,建立blastn的数据库;
(2)将测序fastq文件转为fasta格式文件;
(3)使用blastn将测序fasta序列比对到目标基因,得到扩增子在测序序列上的位置坐标,提取分子标签序列信息;
(4)将具有相同分子标签的测序序列归为同一个家族序列,过滤掉家族序列中测序序列数小于3的家族序列;
(5)对各个家族序列中所有测序序列进行多序列比对,并引入空值,统计家族序列中所有测序序列在相同位置上的A、T、C、G和空值的计数,并按公式(1)计算碱基测序质量Q,Q加上33再转化为ASCII表对应的字符即为fastq文件中每个碱基对应的修正测序质量Phred33值;
Q = -10 log10(P) 公式(1)
其中,Q表示碱基测序质量,P表示为碱基测序错误概率;
(6)基于家族序列中所有测序序列合并得到一条序列,同一位置上计数最多的碱基作为一致序列碱基,如果对应位置空值的计数最多,则判定该位置存在测序***错误,在一致序列中去除该位置信息,如果有多个碱基的计数相同,则取修正后碱基测序质量最高的碱基,得到一致后的fastq文件。
2.一种二代测序数据的分析装置,其特征在于,所述装置用于执行权利要求1所述的二代测序数据的低频基因突变分析方法中的步骤,包括:
构建数据库单元:用于执行以检测目标基因的序列为输入,建立blastn的数据库;
转换单元:用于执行将测序fastq文件转为fasta格式文件;
数据获取单元:用于执行使用blastn将测序序列比对到目标基因,得到扩增子在测序序列上的位置坐标,提取分子标签序列信息;
分类单元:用于执行将具有相同分子标签的测序fasta序列归为同一个家族序列,过滤掉家族序列中测序序列数小于3的家族序列;
计算修正测序质量单元:用于执行对各个家族序列中所有测序序列进行多序列比对,并引入空值,统计家族序列中所有测序序列在相同位置上的A、T、C、G和空值的计数,并按公式(1)计算碱基测序质量Q,Q加上33再转化为ASCII表对应的字符即为fastq文件中每个碱基对应的修正测序质量Phred33值;
Q = -10 log10(P) 公式(1)
其中,Q表示碱基测序质量,P表示为碱基测序错误概率;
分析单元:用于执行基于家族序列中所有测序序列合并得到一条测序序列,同一位置上计数最多的碱基作为一致序列的碱基,如果对应位置空值的计数最多,则判定该位置存在测序***错误,在一致序列中去除该位置信息,如果有多个碱基的计数相同,则取修正后碱基测序质量最高的碱基,得到一致后的fastq文件。
3.权利要求1所述的二代测序数据的低频基因突变分析方法或权利要求2所述的二代测序数据的分析装置在基因变异检测中的应用。
4.一种检测低频基因变异的方法,其特征在于,所述方法包括:
对待测样本进行二代测序,利用权利要求1所述的二代测序数据的低频基因突变分析方法或权利要求2所述的二代测序数据的分析装置对二代测序数据进行分析,基于分析结果使用比对软件进行基因组比对,使用变异检测分析软件检测变异,输出变异结果。
5.根据权利要求4所述的检测低频基因变异的方法,其特征在于,所述比对软件包括bwa软件、bowtie2软件或blast软件中任意一种。
6.根据权利要求4所述的检测低频基因变异的方法,其特征在于,所述变异检测分析软件包括Varscan2软件、Mutect2软件、GATK软件或Freebayes软件中任意一种。
7.根据权利要求6所述的检测低频基因变异的方法,其特征在于,所述变异检测分析软件检测SNV时最低碱基质量设为20~25。
8.根据权利要求6所述的检测低频基因变异的方法,其特征在于,所述变异检测分析软件检测INDEL时最低碱基质量值设为20~25。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序/指令,其特征在于,所述计算机程序/指令被处理器执行时实现权利要求1所述二代测序数据的低频基因突变分析方法的步骤或权利要求4-8任一项所述检测低频基因变异的方法的步骤。
10.一种存储有计算机程序的计算机可读存储介质,其特征在于,所述计算机程序使计算机建立和/或运行如权利要求1所述二代测序数据的低频基因突变分析方法的步骤或权利要求4-8任一项所述检测低频基因变异的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311696182.6A CN117437978A (zh) | 2023-12-12 | 2023-12-12 | 一种二代测序数据的低频基因突变分析方法、装置及其应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311696182.6A CN117437978A (zh) | 2023-12-12 | 2023-12-12 | 一种二代测序数据的低频基因突变分析方法、装置及其应用 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117437978A true CN117437978A (zh) | 2024-01-23 |
Family
ID=89553645
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311696182.6A Pending CN117437978A (zh) | 2023-12-12 | 2023-12-12 | 一种二代测序数据的低频基因突变分析方法、装置及其应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117437978A (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101921840A (zh) * | 2010-06-30 | 2010-12-22 | 深圳华大基因科技有限公司 | 一种基于dna分子标签技术和dna不完全打断策略的pcr测序方法 |
CN106701897A (zh) * | 2015-11-12 | 2017-05-24 | 深圳华大基因研究院 | 同时检测基因点突变、***/缺失和cnv的方法及设备 |
CN108154010A (zh) * | 2017-12-26 | 2018-06-12 | 东莞博奥木华基因科技有限公司 | 一种ctDNA低频突变测序数据分析方法和装置 |
CN110734908A (zh) * | 2019-11-15 | 2020-01-31 | 福州福瑞医学检验实验室有限公司 | 高通量测序文库的构建方法以及用于文库构建的试剂盒 |
US20210225456A1 (en) * | 2018-07-27 | 2021-07-22 | Myriad Women's Health, Inc. | Method for detecting genetic variation in highly homologous sequences by independent alignment and pairing of sequence reads |
KR20210112350A (ko) * | 2019-01-04 | 2021-09-14 | 윌리엄 마쉬 라이스 유니버시티 | 다중 복제수 변이 검출 및 대립 유전자 비율 정량화를 위한 정량적 앰플리콘 서열분석 |
CN114530199A (zh) * | 2022-01-19 | 2022-05-24 | 重庆邮电大学 | 基于双重测序数据检测低频突变的方法、装置及存储介质 |
US20220364080A1 (en) * | 2019-09-20 | 2022-11-17 | Sophia Genetics S.A. | Methods for dna library generation to facilitate the detection and reporting of low frequency variants |
CN115369159A (zh) * | 2022-08-30 | 2022-11-22 | 上海交通大学医学院 | 一种基于双端测序重叠片段和dna双链互补片段的超低频突变检测方法 |
CN116469462A (zh) * | 2023-03-20 | 2023-07-21 | 重庆邮电大学 | 一种基于双重测序的超低频dna突变识别方法和装置 |
-
2023
- 2023-12-12 CN CN202311696182.6A patent/CN117437978A/zh active Pending
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101921840A (zh) * | 2010-06-30 | 2010-12-22 | 深圳华大基因科技有限公司 | 一种基于dna分子标签技术和dna不完全打断策略的pcr测序方法 |
CN106701897A (zh) * | 2015-11-12 | 2017-05-24 | 深圳华大基因研究院 | 同时检测基因点突变、***/缺失和cnv的方法及设备 |
CN108154010A (zh) * | 2017-12-26 | 2018-06-12 | 东莞博奥木华基因科技有限公司 | 一种ctDNA低频突变测序数据分析方法和装置 |
US20210225456A1 (en) * | 2018-07-27 | 2021-07-22 | Myriad Women's Health, Inc. | Method for detecting genetic variation in highly homologous sequences by independent alignment and pairing of sequence reads |
KR20210112350A (ko) * | 2019-01-04 | 2021-09-14 | 윌리엄 마쉬 라이스 유니버시티 | 다중 복제수 변이 검출 및 대립 유전자 비율 정량화를 위한 정량적 앰플리콘 서열분석 |
US20220364080A1 (en) * | 2019-09-20 | 2022-11-17 | Sophia Genetics S.A. | Methods for dna library generation to facilitate the detection and reporting of low frequency variants |
CN110734908A (zh) * | 2019-11-15 | 2020-01-31 | 福州福瑞医学检验实验室有限公司 | 高通量测序文库的构建方法以及用于文库构建的试剂盒 |
CN114530199A (zh) * | 2022-01-19 | 2022-05-24 | 重庆邮电大学 | 基于双重测序数据检测低频突变的方法、装置及存储介质 |
CN115369159A (zh) * | 2022-08-30 | 2022-11-22 | 上海交通大学医学院 | 一种基于双端测序重叠片段和dna双链互补片段的超低频突变检测方法 |
CN116469462A (zh) * | 2023-03-20 | 2023-07-21 | 重庆邮电大学 | 一种基于双重测序的超低频dna突变识别方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10991453B2 (en) | Alignment of nucleic acid sequences containing homopolymers based on signal values measured for nucleotide incorporations | |
Larsson et al. | Comparative microarray analysis | |
Kearse et al. | The Geneious 6.0. 3 read mapper | |
CN115083521B (zh) | 一种单细胞转录组测序数据中肿瘤细胞类群的鉴定方法及*** | |
CN113249453B (zh) | 一种检测拷贝数变化的方法 | |
CN115691672B (zh) | 针对测序平台特征的碱基质量值矫正方法、装置、电子设备和存储介质 | |
KR101795662B1 (ko) | 대사 이상 질환 진단 장치 및 그 방법 | |
CN106591451B (zh) | 测定胎儿游离dna含量的方法及其用于实施该方法的装置 | |
CN109461473B (zh) | 胎儿游离dna浓度获取方法和装置 | |
CN108728515A (zh) | 一种使用duplex方法检测ctDNA低频突变的文库构建和测序数据的分析方法 | |
CN117437978A (zh) | 一种二代测序数据的低频基因突变分析方法、装置及其应用 | |
CN113327646B (zh) | 测序序列的处理方法及装置、存储介质、电子设备 | |
WO2019213810A1 (zh) | 检测染色体非整倍性的方法、装置及*** | |
US20240221954A1 (en) | Disease prediction methods and devices, electronic devices, and computer readable storage media | |
CN113409886A (zh) | 一种hiv亚型分类***及分类方法 | |
CN112885407B (zh) | 一种基于二代测序的微单倍型检测分型***和方法 | |
CN112908413A (zh) | 一种基于abo基因的血型分型方法 | |
KR101907650B1 (ko) | 비침습적 태아 염색체 이수성 판별 방법 | |
Veeramachaneni | Data Analysis in Rare Disease Diagnostics | |
Copeland | Computational Analysis of High-replicate RNA-seq Data in Saccharomyces Cerevisiae: Searching for New Genomic Features | |
CN117577182B (zh) | 一种快速识别药物标识位点的***及其应用 | |
CN116072222B (zh) | 病毒基因组鉴定和拼接的方法及应用 | |
Gupta et al. | A bioinformatics pipeline for processing and analysis of whole transcriptome sequence data | |
JP7122006B2 (ja) | 挿入・欠失・逆位・転座・置換検出法 | |
WO2016143062A1 (ja) | 配列データ解析装置、dna解析システムおよび配列データ解析方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |