CN114566285A - 一种膀胱癌早期筛查模型及其构建方法、试剂盒及其使用方法 - Google Patents

一种膀胱癌早期筛查模型及其构建方法、试剂盒及其使用方法 Download PDF

Info

Publication number
CN114566285A
CN114566285A CN202210447648.8A CN202210447648A CN114566285A CN 114566285 A CN114566285 A CN 114566285A CN 202210447648 A CN202210447648 A CN 202210447648A CN 114566285 A CN114566285 A CN 114566285A
Authority
CN
China
Prior art keywords
chr
gene
bladder cancer
sample
chrx
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210447648.8A
Other languages
English (en)
Other versions
CN114566285B (zh
Inventor
楼峰
王云凯
周涛
刘磊
朱帅鹏
孙宏
曹善柏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin Xiangxin Biotechnology Co ltd
Tianjin Xiangxin Medical Instrument Co ltd
Beijing Xiangxin Biotechnology Co ltd
Original Assignee
Tianjin Xiangxin Biotechnology Co ltd
Tianjin Xiangxin Medical Instrument Co ltd
Beijing Xiangxin Biotechnology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin Xiangxin Biotechnology Co ltd, Tianjin Xiangxin Medical Instrument Co ltd, Beijing Xiangxin Biotechnology Co ltd filed Critical Tianjin Xiangxin Biotechnology Co ltd
Priority to CN202210447648.8A priority Critical patent/CN114566285B/zh
Publication of CN114566285A publication Critical patent/CN114566285A/zh
Application granted granted Critical
Publication of CN114566285B publication Critical patent/CN114566285B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/50Mutagenesis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Theoretical Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Pathology (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Public Health (AREA)
  • Immunology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Oncology (AREA)
  • Hospice & Palliative Care (AREA)
  • Evolutionary Computation (AREA)
  • Microbiology (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Biomedical Technology (AREA)
  • Databases & Information Systems (AREA)
  • Biochemistry (AREA)
  • Epidemiology (AREA)

Abstract

本申请涉及膀胱癌筛查的技术领域,具体公开了一种膀胱癌早期筛查模型及其构建方法、试剂盒及其使用方法。构建方法包括以下步骤:S1、分别获得健康样本和癌症样本的gDNA测序结果、cfDNA测序结果;S2、根据cfDNA测序结果处理获得SNP/INDEL特征;以gDNA测序结果处理得到CNV特征;根据SNP/INDEL特征和CNV特征进行分类,绘制ROC曲线;S3、建立膀胱癌早期筛查模型;试剂盒基于该模型进行膀胱癌筛查。本申请的试剂盒具有准确筛查膀胱癌的优点。

Description

一种膀胱癌早期筛查模型及其构建方法、试剂盒及其使用 方法
技术领域
本申请涉及膀胱癌筛查的技术领域,更具体地说,它涉及一种膀胱癌早期筛查模型及其构建方法和试剂盒。
背景技术
膀胱癌是常见的恶性肿瘤之一,也是泌尿***最常见的一种恶性肿瘤。目前膀胱癌监控方法依赖反复的膀胱镜检查、穿刺活检、影像学检查。膀胱镜检查被视为目前膀胱癌诊断的金标准,但这些过程耗时、费用较高,对原位癌敏感性较差,并且可能导致***、尿道损伤、膀胱损伤等并发症。穿刺活检方法由于是高侵入性的,会对组织有创伤。影像学检查则带有辐射伤害,以上这些常规检查方法都会给患者带来痛苦。
膀胱癌是泌尿***常见的恶性肿瘤,膀胱癌发病具有多中心、易复发、易侵袭、易耐药等生物学特性。非肌层浸润性膀胱癌复发率高,需要定期膀胱灌注、复查膀胱镜;而肌层浸润性膀胱癌转移率高,在完成根治切除后,五年生存率仅在50%-60%;基于如此差的愈后表现,使得膀胱癌早筛早诊亟待实现和普及。
膀胱癌由于其发病灶的特殊性,因此在尿液中往往存在着大量来自膀胱癌组织脱落的肿瘤细胞及癌细胞凋亡破裂释放的小片段游离DNA;因此尿液是诊断膀胱癌的理想标本,而尿液无创诊断也将是研究开发的主流趋势。基于尿液无创诊断技术如脱落细胞学、荧光原位杂交(FISH)和***抗原(BTA)等存在敏感性和/或特异性不高、容易出现漏诊和误诊的问题;因此,开发高灵敏度的膀胱癌无创诊断技术可在降低患者痛苦的同时改善其诊疗现状。
当前临床对膀胱癌筛查的“金标准”为膀胱镜联合病理活检,采样痛苦且对泌尿***形成创伤。目前也有一系列无创筛查的方法用于膀胱癌的筛查,其主要通过检测尿液沉淀细胞和尿液上清中的标志物实现。其中基于尿液沉淀细胞的筛查技术包括:通过低深度全基因测序检测基因拷贝数变异、靶向捕获测序检测基因突变、荧光原位杂交法(FISH)检测染色体拷贝数变异、DNA甲基化水平检测以及过表达标志基因mRNA表达量检测。基于尿液上清的筛查技术则主要为cfDNA点突变检测。
但是目前现有筛查膀胱癌的模型,其筛查准确性不高;而筛查模型相对应的检测分析方法,也多采用的是单一维度的线性分类方法,该类方法依旧存在灵敏度和特异性不高的问题。
发明内容
为了提高膀胱癌早期筛查的准确性,提高筛查的灵敏度和特异性,本申请提供一种膀胱癌早期筛查模型及其构建方法、试剂盒及其使用方法。
第一方面,本申请提供一种膀胱癌早期筛查模型的构建方法,采用如下的技术方案:
一种膀胱癌早期筛查模型的构建方法,包括以下步骤:
S1、自健康样本和癌症样本的尿液沉淀样本中分别获得健康样本和癌症样本的gDNA测序结果;自健康样本和癌症样本的尿液上清样本中分别获得健康样本和癌症样本的cfDNA测序结果;
S2、根据cfDNA测序结果,获得所有健康样本和癌症样本的膀胱癌相关突变marker的覆盖情况,最终获得SNP/INDEL特征;以部分健康样本的gDNA测序结果用于构建CVN事件的baseline,通过对baseline中的信息处理得到CNV特征;根据SNP/INDEL特征和CNV特征进行分类,绘制ROC曲线;
S3、将SNP/INDEL特征和CNV特征进行整合,并通过支持向量机机器学习的算法建立膀胱癌早期筛查模型。
通过采用上述技术方案,由于NGS在癌症早筛领域的广泛应用,越来越多新的生物标记物被发现。目前本领域的研究主要集中在DNA甲基化、突变和拷贝数变异上,也有少数研究蛋白和RNA标志物。本模型构建方法是采用多态性位点突变联合拷贝数变异的多个基因组特征,建立训练集与测试集,通过机器学习的方法,建立癌症筛查模型,以提高癌症(早期)筛查的准确性。
可选的,步骤S2中,构建CVN事件的baseline的步骤包括:随机选择部分健康样本的尿液沉淀样本,处理没有信号以及存在大量噪音的区域,所述没有信号以及存在大量噪音的区域包括着丝粒、端粒和repeat区域;然后计算出每个bin的期望覆盖度和中值分段方差,以将这些信息用于后续检测样本的标准化。
可选的,步骤S2中,对baseline中的信息处理得到CNV特征的步骤包括:
对baseline中的信息进行归一化,计算出每个bin区间的log2ratio和Z-Score,其计算公式分别为:
ratio = RCgc-bin/mean(RCgc-all-bin),
RCgc-bin代表, 每个bin区间GC校正后的read数,
mean(RCgc-all-bin), 统计所有bin区间GC校正后的read数的均数,
log2ratio, ratio取以2为底log的对数;
Z-Score = (ratio–E(ref-ratio))/std(ref-ratio)
其中E(ref-ratio) 为 cnv baseline每个bin的期望覆盖度,
std(ref-ratio)为cnv baseline每个bin的覆盖度标准差;
将得到的每个bin的log2ratio和Z-Score使用Circular binary segmentation(CBS)方法进行call segment,得到segment的最终log2ratio和Z-Score结果;其中以cutoff_1为0.08用于segment过滤。
可选的,步骤S2中,以cutoff_2值为8700000用于CNV特征的分类。
可选的,膀胱癌相关突变marker的分布基因包括基因TERT、基因TP53、基因ERBB2、基因ERCC2、基因FGFR3、基因KDM6A、基因PIK3CA、基因ARID1A、基因ERBB3、基因GATA3、基因BRCA2、基因CREBBP、基因CTNNB1、基因ELF3和基因FH中的任意一种或多种。
可选的,分布在基因TP53上的膀胱癌相关突变marker包括chr17:7577127-7577127,chr17:7577505-7577505,chr17:7577527-7577527,chr17:7577535-7577535,chr17:7577538-7577538,chr17:7577539-7577539,chr17:7577545-7577545,chr17:7577548-7577548,chr17:7577559-7577559,chr17:7577568-7577568,chr17:7579313-7579313,chr17:7579328-7579328,chr17:7579365-7579365,chr17:7579391-7579391,chr17:7579406-7579406,chr17:7579415-7579415,chr17:7579431-7579431,chr17:7573982-7573982,chr17:7573983-7573983chr17:7577574-7577574,chr17:7577596-7577596,chr17:7577599-7577599,chr17:7578382-7578382,chr17:7578419-7578419,chr17:7578437-7578437,chr17:7578442-7578442,chr17:7578513-7578513,chr17:7578524-7578524,chr17:7579340-7579340和chr17:7577571-7577584中的任意一种或多种;
分布在基因ERBB2上的膀胱癌相关突变marker包括chr17:37873691-37873691,chr17:37879658-37879658,chr17:37880220-37880220,chr17:37880257-37880257,chr17:37880261-37880261,chr17:37880265-37880265,chr17:37880981-37880981,chr17:37881329-37881329,chr17:37883131-37883131,chr17:37883158-37883158,chr17:37883660-37883660,chr17:37884073-37884073,chr17:37863323-37863323,chr17:37864656-37864656和chr17:37864665-37864665中的任意一种或多种;
分布在基因ERCC2上的膀胱癌相关突变marker包括chr19:45855817-45855817,chr19:45855824-45855824,chr19:45855835-45855835,chr19:45858086-45858086,chr19:45860556-45860556,chr19:45860733-45860733,chr19:45864859-45864881,chr19:45867571-45867571,chr19:45867584-45867584,chr19:45867687-45867687,chr19:45872189-45872189,chr19:45872213-45872213,chr19:45872219-45872219,chr19:45872362-45872362,chr19:45872380-45872380,chr19:45873425-45873425,chr19:45873455-45873455和chr19:45873456-45873456中的任意一种或多种;
分布在基因FGFR3上的膀胱癌相关突变marker包括chr4:1803564-1803564,chr4:1803568-1803568,chr4:1806089-1806089,chr4:1806092-1806092,chr4:1806099-1806099,chr4:1806119-1806119,chr4:1806153-1806153,chr4:1807859-1807859,chr4:1807889-1807889,chr4:1807890-1807890,chr4:1808916-1808916和chr4:1808937-1808937中的任意一种或多种;
分布在基因KDM6A上的膀胱癌相关突变marker包括chrX:44732952-44732952,chrX:44732955-44732955,chrX:44733198-44733198,chrX:44733200-44733200,chrX:44833924-44833924,chrX:44870233-44870240,chrX:44913136-44913136,chrX:44918316-44918316,chrX:44918532-44918532,chrX:44918582-44918583,chrX:44918668-44918669,chrX:44920630-44920633,chrX:44949991-44949991,chrX:44950033-44950034,chrX:44950066-44950066,chrX:44969323-44969323和chrX:44969369-44969369中的任意一种或多种;
分布在基因PIK3CA上的膀胱癌相关突变marker包括chr3:178916929-178916929,chr3:178916936-178916936,chr3:178936091-178936091,chr3:178936094-178936094,chr3:178936095-178936095,chr3:178936103-178936103,chr3:178938886-178938886,chr3:178951994-178951994,chr3:178952039-178952039,chr3:178952085-178952085,chr3:178952090-178952090,chr3:178919256-178919256和chr3:178921553-178921553中的任意一种或多种;
分布在基因ARID1A上的膀胱癌相关突变marker包括chr1:27099915-27099915,chr1:27101380-27101398,chr1:27101427-27101449,chr1:27101551-27101551,chr1:27101586-27101586,chr1:27101645-27101645,chr1:27102132-27102132,chr1:27102137-27102137,chr1:27105648-27105649,chr1:27106081-27106087,chr1:27106240-27106240,chr1:27106279-27106279,chr1:27106354-27106354,chr1:27106539-27106539,chr1:27107081-27107082和chr1:27107134-27107135中的任意一种或多种;
分布在基因ERBB3上的膀胱癌相关突变marker包括chr12:56478817-56478817,chr12:56478851-56478851,chr12:56478854-56478854,chr12:56481649-56481649,chr12:56481660-56481660,chr12:56482341-56482341,chr12:56482537-56482537,chr12:56489571-56489571,chr12:56489582-56489582,chr12:56490408-56490408,chr12:56492623-56492623,chr12:56495696-56495696和chr12:56495711-56495711中的任意一种或多种;
分布在基因GATA3上的膀胱癌相关突变marker包括chr10:8100619-8100619;
分布在基因BRCA2上的膀胱癌相关突变marker包括chr13:32900694-32900694,chr13:32910686-32910686,chr13:32910940-32910940,chr13:32912514-32912514和chr13:32972638-32972638中的任意一种或多种;
分布在基因CREBBP上的膀胱癌相关突变marker包括chr16:3786710-3786710,chr16:3786726-3786730,chr16:3786740-3786740和chr16:3786775-3786775中的任意一种或多种;
分布在基因CTNNB1上的膀胱癌相关突变marker包括chr3:41266113-41266113;
分布在基因ELF3上的膀胱癌相关突变marker包括chr1:201981484-201981494,chr1:201981500-201981500,chr1:201981537-201981537,chr1:201983034-201983034,chr1:201983035-201983035和chr1:201984418-201984418中的任意一种或多种;
分布在基因FH上的膀胱癌相关突变marker包括chr1:241663871-241663871。
通过采用上述技术方案,选择适当的marker用于模型构建,在本申请中选用的marker中,其中包括部分来自TCGA膀胱癌SNP/INDEL公共数据的marker数据,涉及的突变包括多态性位点的突变和染色体突变;因此其本身的数据来源更加全面,因此能够获得更加准确的、具有代表性的、全面的marker群组。而本模型构建方法是基于多态性位点突变联合拷贝数变异的多个基因组特征,建立训练集与测试集,并通过机器学习的方法,建立癌症筛查模型,因此能够显著提高癌症(早期)筛查的准确性。
第二方面,本申请提供一种膀胱癌早期筛查模型,采用如下的技术方案:
一种膀胱癌早期筛查模型,所述模型采用上述构建方法得到。
可选的,所获得数据的70%被纳为训练集,30%被纳为测试集;得到模型的为径向基核函数rbf;核函数的参数gamma为0.001,目标函数的惩罚系数C为1000。
通过采用上述技术方案,以该模型结合一定的试剂盒的使用来进行膀胱癌的筛查,尤其是膀胱癌的早期筛查,其筛查结果准确性更佳,其特异性和灵敏度表现优异。
第三方面,本申请提供一种基于上述模型进行膀胱癌早期筛查的试剂盒,采用如下的技术方案:
一种基于上述模型进行膀胱癌早期筛查的试剂盒,所述试剂盒包括用于提取cfDNA的试剂组合物,用于基因文库构建的试剂组合物,用于提取gDNA的试剂组合物;
采用提取cfDNA的试剂组合物提取得到待筛查样本的cfDNA,并采用基因文库构建的试剂组合物构建得到待筛查样本的cfDNA文库,上机检测后得到待筛查样本的cfDNA测序结果;
采用提取gDNA的试剂组合物提取得到待筛查样本的gDNA,并采用基因文库构建的试剂组合物构建得到待筛查样本的gDNA文库,上机检测后得到待筛查样本的gDNA测序结果;
将得到的cfDNA测序结果和gDNA测序结果输入所述模型后得到膀胱癌早期筛查结果。
第四方面,本申请提供一种上述试剂盒的使用方法,采用如下的技术方案:
一种上述试剂盒的使用方法,包括以下步骤:
采用提取cfDNA的试剂组合物提取得到待筛查样本的cfDNA,并采用基因文库构建的试剂组合物构建得到待筛查样本的cfDNA文库,上机检测后得到待筛查样本的cfDNA测序结果;
采用提取gDNA的试剂组合物提取得到待筛查样本的gDNA,并采用基因文库构建的试剂组合物构建得到待筛查样本的gDNA文库,上机检测后得到待筛查样本的gDNA测序结果;
将得到的cfDNA测序结果和gDNA测序结果输入所述模型后得到膀胱癌早期筛查结果。
综上所述,本申请具有以下有益效果:
1、由于本申请以尿液沉淀样本中的gDNA测序结果获得CNV特征,以尿液上清样本中的cfDNA测序结果获得SNP/INDEL特征,随后将SNP/INDEL特征和CNV特征整合后通过支持向量机机器学习的算法建立膀胱癌早期筛查模型;该模型中将SNP/INDEL特征和CNV特征整合在一起,其最终得到的筛查模型用于膀胱癌的早期筛查时其筛查方法的灵敏度和特异性均表现优异,最终的筛查结果准确性更佳。
2、本申请中优选采用特定的marker用以获得SNP/INDEL特征,进一步提高评价模型的准确性。
附图说明
图1是SNP/INDEL特征的ROC曲线;
图2是 CNV特征的ROC曲线;
图3是支持向量机模型的训练集ROC曲线;
图4是支持向量机模型的测试集ROC曲线。
具体实施方式
以下结合附图和实施例对本申请作进一步详细说明。
实施例
一种基于尿液cfDNA的膀胱癌早期筛查模型及其构建方法,构建方法包括以下步骤:
S1、自健康样本和癌症样本的尿液沉淀样本中分别获得健康样本和癌症样本的gDNA测序结果;自健康样本和癌症样本的尿液上清样本中分别获得健康样本和癌症样本的cfDNA测序结果。
按照实验流程对83例膀胱癌样本和67例健康样本分别进行cfDNA采集、提取、建库、测序;以及分别进行gDNA采集、提取、建库、测序。
具体步骤如下:
尿液沉淀细胞中gDNA采集、提取、建库、测序
1尿液的采集于运输
1.1 使用预装Urine Condition Buffer(Zymo Research)尿液保存液的50mL离心管收集50mL空腹中段晨尿1管,用于尿液沉淀细胞gDNA提取。
1.2 使用康为世纪Urine DNA Storage Tube(货号:CW2657)采集日空腹中段晨尿20mL(10mL×2管)用于尿液上清cfDNA提取。
2、尿液沉淀细胞gDNA提取
2.1尿液预处理
2.1.1将自步骤1.1中收集到实验室的尿液,首先至于常温离心机中,室温1600rpm离心10min,保留离心沉淀;
2.1.2向管内沉淀加1000μL PBS,移液器吹打悬浮后,转移至预先准备好的1.5mL离心管中,室温1600rpm离心5min;
2.1.3离心结束,使用移液器吸弃上清。而后向细胞沉淀加1000μL PBS,吹打悬浮细胞,立即用于后续实验或至于4℃保存备用;
2.2尿液沉淀细胞gDNA提取
尿液沉淀细胞gDNA提取使用血液/细胞/组织基因组DNA提取试剂盒(货号:DP304)试剂盒完成,以下试剂来自该试剂盒。具体操作流程如下:
2.2.1将2.1.3细胞悬浮液室温1600rpm离心5min,吸弃上清;
2.2.2向细胞沉淀加200μL Buffer GA和20μL蛋白酶K,震荡混匀并瞬时离心。而后至于预先平衡至56℃的恒温金属浴中,56℃温育至少30min至样本充分消化,每隔15min涡旋震荡2-3s;
2.2.3向孵育结束的2.2.2体系加200μL Buffer GB(裂解使核酸和蛋白分离),颠倒混匀并瞬时离心。而后至于预先平衡至70℃的恒温金属浴中,温浴至少10min并每隔3min涡旋震荡10s至溶液澄清透明;
2.2.4向2.2.3体系加4μL RNase A,涡旋震荡15s,室温静置2min;
2.2.5向2.2.4体系中加200μL无水乙醇,涡旋振荡15s,室温静置2-3min;
2.2.6将全部样品转移至CB3/CR2柱中,12000rpm离心1min,弃废液;
2.2.7向CB3/CR2柱加500μL Buffer GD,12000rpm离心1min,弃废液;
2.2.8向CB3/CR2柱加600μL 漂洗液PW,12000rpm离心1min,弃废液;
2.2.9重复步骤2.2.8一次;
2.2.10将CB3/CR2柱至于离心机,12000rpm离心1min,空甩,弃废液,CB3/CR2转干净1.5mL管内,室温晾干2min;
2.2.11向晾干的CB3/CR2柱中心加65μL已经预热至56℃的洗脱缓冲液,室温静置2min。而后室温12000rpm离心1min,收集提取的DNA,用于DNA质检和文库制备。
3、WGS文库构建
以下WGS文库构建采用KAPA DNA HyperPrep文库构建试剂盒 (Illumina,PCR-free,96反应;货号:KK8505)完成,以下试剂来自该试剂盒。具体操作流程如下:
3.1 gDNA片段化
3.1.1根据Qubit荧光计定量结果,取200ng 自2.2.11提取得到的DNA于预先准备的1.5mL离心管中,并使用IDTE buffer(IDT)补充终体积至50μL,震荡混匀并短暂离心备用;
3.1.2将3.1.1准备的DNA转移至50μL Covaris打断管(M220 Holder XTU microTUBE 50μl,货号:500488)中并置于Covaris M220打断仪中片段化至主片段300-350bp;
3.1.3将片段化完成的DNA转移至预先准备的200μL PCR管中,用于末端修复和加A尾实验;
3.2末端修复及加“A”尾实验
按照“末端修复&加A尾缓冲液(End Repair & A-Tailing Buffer)为7μL/反应,末端修复酶和加A尾酶混合物(End Repair & A-Tailing Enzyme Mix)为3μL/反应”的量添加末端修复及加“A”尾试剂。震荡混匀并瞬时离心之后,至于PCR仪中运行PCR反应程序:20℃30min ,65℃30min,4℃保存,热盖70℃;最终得到末修加A产物。
3.3接头连接
反应结束后,按照“末修加A产物60μL/反应,DNA 连接接头2.5μL/反应,PCR级水(PCR-grade water)7.5μL/反应,连接缓冲液(Ligation Buffer)30μL/反应,DNA连接酶(DNA Ligase Enzyme)10μL/反应”的量向反应体系中加入接头连接反应组分,震荡混匀并瞬时离心之后,至于PCR仪中运行PCR反应程序:20℃ 15min,热盖OFF;以得到连接产物。
3.4接头连接后纯化
3.4.1将贝克曼AmpureXP磁珠从2-8℃冰箱取出,震荡混匀后室温平衡30min;
3.4.2将3.3的反应体系转移至新的1.5mL离心管,加88μL AmpureXP磁珠,震荡混匀并瞬时离心后,室温孵育10min;
3.4.3孵育结束后,将离心管摆在磁力架上吸附磁珠;待管内溶液澄清透明后,吸弃上清;
3.4.4向磁珠管加400μL 80%乙醇,转管一周后,吸弃上清;
3.4.5重复3.4.4步骤一次,而后瞬时离心并将离心管摆在磁力架上吸附磁珠;用20μL吸头吸弃剩余乙醇;
3.4.6磁珠保持在磁力架上,室温晾干5min至磁珠表面无镜面反光;
3.4.7向磁珠管加21μL无核酸酶水(Nucleasefree water),震荡混匀,室温孵育5min;
3.4.8将磁珠管瞬时离心并摆放在磁力架上吸附磁珠,待管内溶液澄清透明后,将上清转移至预先准备的0.2 mL PCR管中;
3.5文库扩增
按照“纯化后接头连接产物为20μL/反应,KAPA HiFi ReadyMix为25μL/反应,P5+P7引物混合物((P5+P7) Primer Mix)为5μL/反应”的量向3.4.8步骤装有纯化后接头连接产物的PCR管中加入各PCR组分。涡旋震荡混匀并瞬时离心后,置于PCR仪中运行PCR程序:98℃ 45s;( 98℃ 15S ; 60℃ 30S ; 72℃ 30S ) 6个循环;72℃ 1min;4℃保持。最终得到扩增文库。
3.6扩增后文库纯化
3.6.1将贝克曼AmpureXP磁珠从2-8℃冰箱取出,震荡混匀后室温平衡30min;
3.6.2将3.5扩增后体系转移至新的1.5mL离心管,加80μL AmpureXP磁珠,震荡混匀并瞬时离心后,室温孵育10min;
3.6.3孵育结束后,将离心管摆在磁力架上吸附磁珠;待管内溶液澄清透明后,吸弃上清;
3.6.4向磁珠管加400μL 80%乙醇,转管一周后,吸弃上清;
3.6.5重复3.6.4步骤一次,而后瞬时离心并将离心管摆在磁力架上吸附磁珠;随后用20μL吸头吸弃剩余乙醇;
3.6.6磁珠保持在磁力架上,室温晾干5min至磁珠表面无镜面反光;
3.6.7向磁珠管加21μL 无核酸酶水(Nuclease Free water),震荡混匀,室温孵育5min;
3.6.8将磁珠管瞬时离心并摆放在磁力架上吸附磁珠,待管内溶液澄清透明后,将上清转移至预先准备的新的1.5mL离心管中,用于质控、sWGS上机测序。
3.6.9文库质控和测序:纯化后文库使用Qubit 4 荧光计搭配Qubit dsDNA HSAssay Kit(Thermofisher)进行定量。使用Agilent 2100 Bioanalyzer搭配Agilent 2100DNA 1000 Kit进行文库片段质控。上机测序前使用ABI StepOne Plus进行文库摩尔数定量并依据上述定量结果,预排21Gb数据量测序。
尿液上清中cfDNA采集、提取、建库、测序
4.1尿液预处理
4.1.1将自步骤1.2中收集到实验室的尿液首先至于常温离心机中,1600rpm离心10min,使用移液器转移上清至5mL离心管中;
4.1.2将盛有尿液上清的5mL离心管至于离心机中,16000rpm离心10min,使用移液器转移上清至新的5mL离心管中,用于后续提取实验。
4.2尿液上清cfDNA提取
尿液上清cfDNA使用优化后的南科征途Apostle MiniMaxTM High EfficiencycfDNA Isolation Kit试剂盒完成,以下尿液上清cfDNA提取过程中用到的试剂来自于该试剂盒。具体操作流程如下:
4.2.1向4.1.2中尿液上清中加320μL蛋白酶K(20mg/mL),颠倒混匀后再加入400μL样本细胞裂解缓冲液(Sample Lysis Buffer),颠倒混匀后,至于金属浴中60℃孵育30min;
4.2.2孵育中,取1根15mL离心管,向管内依次加入5mL cfDNA 裂解/结合溶液(cfDNA Lysis/Binding Solution)和60 μL 磁性纳米微珠(Magnetic Nanoparticles);
4.2.3将孵育结束的4.2.1体系转移至4.2.2的15mL离心管中,至于四维混匀仪中,室温颠倒孵育10min;
4.2.4颠倒孵育结束,将15mL离心管至于离心机中,室温1600rpm离心2min,而后至于磁力架上吸附磁珠;待溶液澄清透明后,吸弃上清;
4.2.5向4.2.4管中加1mL Apostle MiniMax cfDNA 清洗溶液(Apostle MiniMaxcfDNA Wash Solution),震荡混匀后,转移至预先摆放在磁力架上的1.5mL离心管中。待1.5mL离心管内溶液无色澄清后,转移上清至15mL离心管中重新漂洗一次磁珠并将二次漂洗的磁珠悬浊液转移至上述1.5mL离心管中吸附磁珠;
4.2.6待1.5mL离心管内溶液澄清透明,吸弃上清。而后再向1.5mL离心管加1mLApostle MiniMax cfDNA 清洗溶液,震荡漂洗30s并瞬时离心后,将1.5mL离心管摆放在磁力架上吸附磁珠。待管内液体澄清透明后,吸弃上清;
4.2.7 Apostle MiniMax cfDNA 第二洗涤液(Apostle MiniMax cfDNA 2nd WashSolution)工作液制备:取1个全新5mL离心管,加入1600μL Apostle MiniMax cfDNA 第二洗涤液和400μL无水乙醇,随后颠倒混匀后短暂离心备用;
4.2.8向4.2.6离心管加1mL Apostle MiniMax cfDNA 第二洗涤液工作液,振荡漂洗30s并短暂离心后,摆放在磁力架上进行磁珠吸附;待管内液体澄清透明后,吸弃上清;
4.2.9重复4.2.8操作一次。而后将1.5mL离心管短暂离心、摆放在磁力架上吸附磁珠并使用20μL吸头吸弃残余Apostle MiniMax cfDNA 第二洗涤液工作液;
4.2.10将1.5mL离心管开盖至于磁力架上室温晾干5min至磁珠表面无镜面反光;向磁珠加50μL Apostle MiniMax cfDNA 稀释溶液(Apostle MiniMax cfDNA ElutionSolution),室温震荡回溶5min;
4.2.11短暂离心收集磁珠至管底后,将1.5mL离心管摆放在磁力架上吸附磁珠;待管内液体澄清透明后,将上清转移至预先准备的新的1.5mL离心管中;用于后续建库实验。
5 SNV panel捕获测序建库
用于SNV panel捕获测序建库的建库试剂盒为:KAPA DNA HyperPrep文库构建试剂盒 (Illumina,PCR-free,96反应);该试剂盒购自Roche公司,货号为KK8505。
5.1末端修复及加“A”尾
根据DNA定量结果,转移≥10ng 步骤4.2提取的cfDNA于PCR管中并用无核酸酶水(Nuclease Free Water)补充体积至50μL。按照“末端修复&A尾缓冲液(End Repair & A-Tailing Buffer)为7μL/反应,末端修复&A尾酶混合物(End Repair & A-Tailing EnzymeMix)为3μL/反应”的量加入末端修复及加“A”尾试剂。震荡混匀并瞬时离心之后,至于PCR仪中运行PCR反应程序:20℃ 30min ,65℃30min,4℃保存,热盖70℃;得到末修加A产物。
5.2接头连接
5.1反应结束后,按照“末修加A产物为60μL/反应,DNA 连接接头为2.5μL/反应,PCR级水7.5μL/反应,连接缓冲液30μL/反应,DNA连接酶10μL/反应”的量向反应体系中加入接头连接反应组分,震荡混匀并瞬时离心之后,至于PCR仪中运行PCR反应程序:20℃15min,热盖OFF。
5.3接头连接后纯化
5.3.1将贝克曼AmpureXP磁珠从2-8℃冰箱取出,震荡混匀后室温平衡30min;
5.3.2将5.2反应体系转移至新的1.5mL离心管,加88μL 贝克曼AmpureXP磁珠,震荡混匀并瞬时离心后,室温孵育10min;
5.3.3孵育结束后,将离心管摆在磁力架上吸附磁珠,待管内溶液澄清透明后,吸弃上清;
5.3.4向磁珠管加400μL 80%乙醇,转管一周后,吸弃上清;
5.3.5重复5.3.4步骤一次,而后瞬时离心并将离心管摆在磁力架上吸附磁珠,用20μL吸头吸弃剩余乙醇;
5.3.6磁珠保持在磁力架上,室温晾干5min至磁珠表面无镜面反光;
5.3.7向磁珠管加21μL 无核酸酶水(Nucleasefree water),震荡混匀,室温孵育5min;
5.3.8将磁珠管瞬时离心并摆放在磁力架上吸附磁珠,待管内溶液澄清透明后,将上清转移至预先准备的0.2 mL PCR管中;
5.4文库扩增
按照“纯化后接头连接产物20μL/反应,KAPA HiFi ReadyMix 20μL/反应,(P5+P7)引物混合物((P5+P7) Primer Mix)5μL/反应”,向5.3.8步骤装有纯化后接头连接产物的PCR管中加入各PCR组分;涡旋震荡混匀并瞬时离心后,置于PCR仪中运行PCR程序:98℃45s;( 98℃ 15S ; 60℃ 30S ; 72℃ 30S ) 6个循环;72℃ 1min;4℃保持。
5.5扩增后文库纯化
5.5.1将贝克曼AmpureXP磁珠从2-8℃冰箱取出,震荡混匀后室温平衡30min;
5.5.2将5.4扩增后体系转移至新的1.5mL离心管,加80μL 贝克曼AmpureXP磁珠,震荡混匀并瞬时离心后,室温孵育10min;
5.5.3孵育结束后,将离心管摆在磁力架上吸附磁珠;待管内溶液澄清透明后,吸弃上清;
5.5.4向磁珠管加400μL 80%乙醇,转管一周后,吸弃上清;
5.5.5重复5.5.4步骤一次,而后瞬时离心并将离心管摆在磁力架上吸附磁珠;用20μL吸头吸弃剩余乙醇;
5.5.6磁珠保持在磁力架上,室温晾干5min至磁珠表面无镜面反光;
5.5.7向磁珠管加21μL 无核酸酶水(Nucleasefree water),震荡混匀,室温孵育5min;
5.5.8将磁珠管瞬时离心并摆放在磁力架上吸附磁珠,待管内溶液澄清透明后,将上清转移至预先准备的新的1.5mL离心管中,用于质控和上机测序。
5.5.9文库质控纯化后文库使用Qubit 4 荧光计搭配Qubit dsDNA HS Assay Kit(Thermo fisher)进行定量;使用Agilent 2100 bioanalyzer搭配Agilent 2100 DNA 1000Kit进行文库片段质控。
6 SNV panel捕获测序杂交洗脱
进行SNV panel捕获测序杂交洗脱时选用的试剂盒为:SNV panel(Twist CustomPanel);Twist Fast Hybridizaton and wash kit,96 反应(货号:101175);TwistBinding and Purrification Deads,96 反应(货号:100984);Twist UniversalBlockers,TruSeq Compatible,High Concentration,4×96 R反应(货号:101786)。上述试剂盒购自Twist Bioscience。
6.1.1提前打开2台金属浴加热器,分别将加热块平衡至60℃和65℃备用;
6.1.2分别取适量待杂交中间文库混合到低吸附0.2mL PCR管内,杂交投入量总量应介于500ng-3μg之间;
6.1.3向混合后的文库mix中加入2μL 万能阻滞剂(Universal Blockers);
6.1.4向混合后的文库mix中加入5μL 阻滞剂溶液(Blockers solution);
6.1.5向混合后的文库mix中加入4μL SNV panel探针工作液;
6.1.6盖紧管盖,振荡混匀并瞬时离心后,置于浓缩干燥仪中,60℃离心抽干;
6.1.7抽干过程中,将快速杂交组合物(Fast Hybridization Mix)置于65℃金属浴内预热;
6.1.8向干燥后文库加入20μL预热的快速杂交组合物,吹打10-15下,充分溶解后,瞬离转至低吸附0.2mL离心管;
6.1.9向6.1.8体系中加30μl杂交增强子(Hybridization Enhancer),瞬时离心后,将上述混合物放到提前准备好的PCR仪上,95℃变性5min后,60℃进行杂交过夜。
6.1.10第二天,提前准备两台金属浴加热器,温度分别设置为68℃和48℃;链霉亲和素磁珠、快速洗涤缓冲液1(Fast Wash Buffer 1)、 洗涤缓冲液2(Wash Buffer 2)、快速绑定缓冲液(Fast Binding Buffer)在室温下平衡30min;
6.1.11链霉亲和素磁珠涡旋震荡混匀15s,按照单个捕获反应50μL磁珠规格,分装置低吸附1.5mL离心管中;
6.1.12加200μL快速绑定缓冲液(Fast Binding Buffer),涡旋10s,离心管放回磁力架,吸附到溶液澄清后弃上清;
6.1.13重复步骤6.1.12两次,最终使用200μL快速绑定缓冲液(Fast BindingBuffer)重悬磁珠;
6.1.14立即将杂交文库转入洗涤后的磁珠内,吹打3-5次,保证枪头无残余。将装有杂交文库-磁珠的1.5mL低吸附离心管固定在垂直混匀仪上,室温颠倒混匀30min;
6.1.15孵育期间,根据杂交反应数量,按照“快速洗涤缓冲液1(Fast Wash Buffer1)420µL/反应,洗涤缓冲液2(Wash Buffer 2)650µL/反应,快速绑定缓冲液(Fast BindingBuffer)850µL/反应”准备适量的洗脱试剂。分装完毕后,Fast Wash Buffer 1放到68℃金属浴内预热,Wash Buffer 2和低吸附离心管放到 48℃金属浴内预热。
6.1.16孵育结束,将1.5mL离心管瞬时离心后置于磁力架上,吸附到溶液澄清透明后吸弃上清;
6.1.17向1.5mL离心管中的磁珠加入200μL预热的快速洗涤缓冲液1(Fast WashBuffer 1),迅速震荡混匀并瞬时离心后,置于金属浴68℃恒温金属浴中孵育5min;
6.1.18孵育结束,将1.5mL离心管摆放到磁力架上,吸附磁珠,待溶液无色澄清后,吸弃上清;
6.1.19向1.5mL离心管中的磁珠再加入200μL预热的快速洗涤缓冲液1(Fast WashBuffer 1),迅速震荡混匀并瞬时离心后,置于金属浴68℃孵育5min;
6.1.20孵育结束,将孵育体系全部转移至预先准备的48℃预热的1.5mL低吸附离心管中并摆放至磁力架上吸附磁珠,待溶液无色澄清后,吸弃上清;
6.1.21向1.5mL离心管中的磁珠加入200μL预热的洗涤缓冲液2(Wash Buffer 2),迅速震荡混匀并瞬时离心后,置于金属浴48℃恒温金属浴中孵育5min;
6.1.22重复6.1.21步骤两次,共漂洗三次。最后一次吸弃上清后,向磁珠加20μL无核酸酶水(Nuclease Free Water),重悬磁珠,用于PostPCR或-20℃保存;
6.1.23PostPCR
按照“磁珠-文库混合物为20µL/反应,2X KAPA HiFi Hotstart ReadyMix(高保真热启动聚合酶预混液)为25µL/反应,Amplifcation Primers (10μM)(扩增引物)为2.5µL/反应,Nuclease Free Water(无核酸酶水)为2.5µL/反应”的量配置PostPCR反应体系。
配置好的反应体系置于PCR仪中,运行程序:98℃ 45s;( 98℃ 15S ; 60℃ 30S ;72℃ 30S ) 8-10个循环;72℃ 1min;4℃保持1min。
6.1.24 PostPCR纯化
(1)贝克曼AmpureXP磁珠从2-8℃冰箱取出,震荡混匀后室温平衡30min;
(2)将(1)扩增后体系转移至新的1.5mL离心管,加90μL AmpureXP磁珠,震荡混匀并瞬时离心后,室温孵育10min;
(3)孵育结束后,将离心管摆在磁力架上吸附磁珠;待管内溶液澄清透明后,吸弃上清;
(4)向磁珠管加400μL 80%乙醇,转管一周后,吸弃上清;
(5)重复步骤(4)一次,而后瞬时离心并将离心管摆在磁力架上吸附磁珠,用20μL吸头吸弃剩余乙醇;
(6)磁珠保持在磁力架上,室温晾干5分钟至磁珠表面无镜面反光;
(7)向磁珠管加21μL 无核酸酶水(Nuclease Free Water),震荡混匀,室温孵育5min;
(8)将磁珠管瞬时离心并摆放在磁力架上吸附磁珠,待管内溶液澄清透明后,将上清转移至预先准备的新的1.5mL离心管中,用于质控及SNV panel捕获测序。
文库质控和测序,纯化后文库使用Qubit 4 荧光计搭配Qubit dsDNA HS AssayKit(Thermofisher)进行定量。使用Agilent 2100 Bioanalyzer搭配Agilent 2100 DNA1000 Kit进行文库片段质控。上机测序前使用ABI StepOne Plus进行文库摩尔数定量并依据上述定量结果,预排15Gb数据量上机测序。
S2、根据cfDNA测序结果,获得所有健康样本和癌症样本的突变marker覆盖情况,最终获得SNP/INDEL特征;以部分健康样本的gDNA测序结果用于构建CVN事件的baseline,通过对baseline中的信息处理得到CNV特征。
具体步骤如下:
SNP/INDEL特征的获取:
(1)点突变marker的筛选
应用412例TCGA膀胱癌SNP/INDEL公共数据,对人群频率、位点覆盖深度、功能区域进行过滤,提取hot基因的变异信息。按变异位点整合所有样本的结果,按照最少的变异位点最大化样本的思想筛选到位于TERT、TP53、ERBB2、ERCC2、FGFR3、KDM6A、PIK3CA、ARID1A、ERBB3、GATA3、BRCA2、CREBBP、CTNNB1、ELF3、FH 15个基因上的155个变异marker。
筛选得到的具体的155个变异marker分别是:
基因ARID1A上的相关marker,分别是,chr1:27099915-27099915,chr1:27101380-27101398,chr1:27101427-27101449,chr1:27101551-27101551,chr1:27101586-27101586,chr1:27101645-27101645,chr1:27102132-27102132,chr1:27102137-27102137,chr1:27105648-27105649,chr1:27106081-27106087,chr1:27106240-27106240,chr1:27106279-27106279,chr1:27106354-27106354,chr1:27106539-27106539,chr1:27107081-27107082和chr1:27107134-27107135。
基因ELF3上的相关marker,分别是,chr1:201981484-201981494,chr1:201981500-201981500,chr1:201981537-201981537,chr1:201983034-201983034,chr1:201983035-201983035和chr1:201984418-201984418。
基因FH上的相关marker,chr1:241663871-241663871;基因CTNNB1上的相关marker,chr3:41266113-41266113。
基因PIK3CA上的相关marker,分别是,chr3:178916929-178916929,chr3:178916936-178916936,chr3:178936091-178936091,chr3:178936094-178936094,chr3:178936095-178936095,chr3:178936103-178936103,chr3:178938886-178938886,chr3:178951994-178951994,chr3:178952039-178952039,chr3:178952085-178952085,chr3:178952090-178952090,chr3:178919256-178919256和chr3:178921553-178921553。
基因FGFR3上的相关marker,分别是,chr4:1803564-1803564,chr4:1803568-1803568,chr4:1806089-1806089,chr4:1806092-1806092,chr4:1806099-1806099,chr4:1806119-1806119,chr4:1806153-1806153,chr4:1807859-1807859,chr4:1807889-1807889,chr4:1807890-1807890,chr4:1808916-1808916和chr4:1808937-1808937。
基因TERT上的相关marker,分别是,chr5:1295228-1295228,chr5:1295250-1295250和chr5:1295250-1295254。基因GATA3上的marker,chr10:8100619-8100619。
基因ERBB3上的相关marker,分别是,chr12:56478817-56478817,chr12:56478851-56478851,chr12:56478854-56478854,chr12:56481649-56481649,chr12:56481660-56481660,chr12:56482341-56482341,chr12:56482537-56482537,chr12:56489571-56489571,chr12:56489582-56489582,chr12:56490408-56490408,chr12:56492623-56492623,chr12:56495696-56495696和chr12:56495711-56495711。
基因BRCA2上的相关marker,分别是,chr13:32900694-32900694,chr13:32910686-32910686,chr13:32910940-32910940,chr13:32912514-32912514和chr13:32972638-32972638。
基因CREBBP上的相关marker,分别是,chr16:3786710-3786710,chr16:3786726-3786730,chr16:3786740-3786740和chr16:3786775-3786775。
基因TP53上的相关marker,分别是,chr17:7577127-7577127,chr17:7577505-7577505,chr17:7577527-7577527,chr17:7577535-7577535,chr17:7577538-7577538,chr17:7577539-7577539,chr17:7577545-7577545,chr17:7577548-7577548,chr17:7577559-7577559,chr17:7577568-7577568,chr17:7579313-7579313,chr17:7579328-7579328,chr17:7579365-7579365,chr17:7579391-7579391,chr17:7579406-7579406,chr17:7579415-7579415和chr17:7579431-7579431,chr17:7573982-7573982和chr17:7573983-7573983。
基因ERBB2上的相关marker,分别是,chr17:37873691-37873691,chr17:37879658-37879658,chr17:37880220-37880220,chr17:37880257-37880257,chr17:37880261-37880261,chr17:37880265-37880265,chr17:37880981-37880981,chr17:37881329-37881329,chr17:37883131-37883131,chr17:37883158-37883158,chr17:37883660-37883660和chr17:37884073-37884073,chr17:37863323-37863323,chr17:37864656-37864656和chr17:37864665-37864665。
基因ERCC2上的相关marker,分别是,chr19:45855817-45855817,chr19:45855824-45855824,chr19:45855835-45855835,chr19:45858086-45858086,chr19:45860556-45860556,chr19:45860733-45860733,chr19:45864859-45864881,chr19:45867571-45867571,chr19:45867584-45867584,chr19:45867687-45867687,chr19:45872189-45872189,chr19:45872213-45872213,chr19:45872219-45872219,chr19:45872362-45872362,chr19:45872380-45872380,chr19:45873425-45873425,chr19:45873455-45873455和chr19:45873456-45873456。
基因KDM6A上的相关marker,分别是,chrX:44732952-44732952,chrX:44732955-44732955,chrX:44733198-44733198,chrX:44733200-44733200,chrX:44833924-44833924,chrX:44870233-44870240,chrX:44913136-44913136,chrX:44918316-44918316,chrX:44918532-44918532,chrX:44918582-44918583,chrX:44918668-44918669,chrX:44920630-44920633,chrX:44949991-44949991,chrX:44950033-44950034,chrX:44950066-44950066,chrX:44969323-44969323和chrX:44969369-44969369。
基因TP53上的相关marker,分别是,chr17:7577574-7577574,chr17:7577596-7577596,chr17:7577599-7577599,chr17:7578382-7578382,chr17:7578419-7578419,chr17:7578437-7578437,chr17:7578442-7578442,chr17:7578513-7578513,chr17:7578524-7578524,chr17:7579340-7579340和chr17:7577571-7577584。
(2)cfDNA样本变异marker检测
应用(1)中的过滤条件(对人群频率、位点覆盖深度、功能区域进行过滤),统计83例膀胱癌样本和67例健康样本中155个变异marker覆盖情况;最终得到SNP/INDEL特征。
CNV特征的获取:
(1)CNV滑窗覆盖度计算
将83例膀胱癌样本和67例健康样本按照200Kbp长度的bin统计每个bin的read数,对统计得到的read数首先进行GC校正,最终得到CNV滑窗read数的统计结果。
其中,read数的统计方法为:统计read的起始位置位于bin区间的read数之和,记为RC。
进行GC校正的方法为:通过loess回归计算校正系数correction coefficient,然后通过公式RCgc = RC * correction coefficient。
(2)CNV baseline的构建
随机选择16健康人的尿液沉淀样本,处理一些没有信号以及存在大量噪音的区域,例如着丝粒、端粒、repeat区域等。然后计算出每个bin的期望覆盖度和中值分段方差,以将这些信息用于后续检测样本的标准化。
期望覆盖度和中值分段方差的计算公式分别为:ratio = RCgc-bin/mean(RCgc-all-bin), 获得每个样本每个bin的覆盖度,然后计算所有样本在每个bin的覆盖度均值和标准差。
(3)CNV特征获取
对baseline中的信息进行归一化,计算出每个bin区间的log2ratio和Z-Score,其计算公式分别为:
ratio = RCgc-bin/mean(RCgc-all-bin);
RCgc-bin代表, 每个bin区间GC校正后的read数,
mean(RCgc-all-bin), 统计所有bin区间GC校正后的read数的均数。
log2ratio, ratio取以2为底log的对数。
Z-Score = (ratio–E(ref-ratio))/std(ref-ratio)
其中E(ref-ratio) 为 cnv baseline每个bin的期望覆盖度,
std(ref-ratio)为cnv baseline每个bin的覆盖度标准差。
最终将得到的每个bin的log2ratio和Z-Score使用Circular binarysegmentation(CBS)方法进行call segment,得到segment的最终log2ratio和Z-Score结果。统计每个样本Segment文件中的有CNV事件的基因组总长度来分类健康样本和肿瘤样本。获取最优的cutoff_1, 设置迭代梯度,区间从0.05到0.1,步长为0.01,通过绘制ROC曲线来选取最优的cutoff值,最终确定最优的cutoff_1为0.08用于segment过滤。
对CNV特征进行分类,统计segment的基因组总长度,记为N;设置cutoff_2用来区分肿瘤样本和健康样本,cutoff_2的值通过绘制ROC曲线来选取最优的cutoff值,最终确定最优的cutoff_2值为8700000用于分类。
根据S2的结果,分别绘制ROC曲线;具体结果见图1和图2。
S3、将SNP/INDEL特征和CNV特征进行整合,并通过支持向量机机器学习的算法建立膀胱癌早期筛查模型。
在模型训练期间,使用7:3 (训练集:测试集)拆分数据,并使用 10 倍交叉验证对超参数进行网格搜索;并使用AUC对模型进行评估。
膀胱癌预测模型是基于***的机器学习框架构建的。框架的工作流程包括1、数据预处理,2、将数据拆分为训练和测试数据集,3、使用每个算法的训练数据集开发模型,4、以及使用测试数据集对每个算法的准确性进行最终评估。
其中,数据预处理步骤包括CNV特征和点突变被缩放为具有零均值和单位方差。在预处理之后,数据被分成用于开发预测模型的训练数据集和用于准确性验证的测试数据集。
在构建机器学习模型时,我们将数据集随机分为训练集和测试集,其中最大百分比的 70%(55/50) 的数据被纳入训练集并用于开发预测模型,而 30%( 28/17)样本小测试数据集用于验证算法的准确性。
定义了训练集,使用支持向量机(SVM)为膀胱癌预测模型算法开发了一个最佳模型。
对超参数进行网格搜索以搜索最佳超参数集,以确保训练数据的准确性。每个网格搜索都使用10折交叉验证进行,其中训练数据集被分成 10 个相同大小的折叠。然后使用 90%(9/10 折叠)的数据创建模型,剩余的折叠数据用于测试模型。该过程重复 10 次,每次折叠用于 10 个训练步骤之一,并用于评估训练数据的模型准确性。在网格搜索过程中,精度被用作模型性能评价的初级指标。
最终,构建得到的模型为:基于训练数据获得最优超参数集为核函数为径向基核函数(rbf),核函数参数gamma为0.001,目标函数的惩罚系数C为1000,使用AUC作为主要准确度指标在测试数据集上评估SVM机器学习算法的最优模型的性能。尽管有许多指标可以评估机器学习算法的性能,但AUC是临床环境中最常用的方法,并且可以与其他研究进行比较,因此我们将其用作衡量准确性的主要指标。然而,为了完整起见,本申请还报告了准确性、敏感性和特异性。SVM机器学习算法使用 Python 的 scikit-learn 库(版本 1.0)实现的,并使用 matplotlib(版本 3.4.2)和 seaborn(版本 0.11.1)库绘制图。
对支持向量机模型训练集和测试集结果绘制ROC曲线,结果分别见图3,图4,分类的性能指标见表1,分类统计结果见表2。
表1 分类的性能指标
Figure 924359DEST_PATH_IMAGE001
表2 分类统计结果
Figure 372657DEST_PATH_IMAGE002
Figure 480291DEST_PATH_IMAGE003
表2中,tumor指的是膀胱癌样本,normal指的是健康样本。
通过将图1和图3、图4的数据进行比较发现,仅仅将本申请的SNP/INDEL特征进行后续的ROC曲线绘制,其AUC值为0.819;该数据和图3的支持向量机训练集ROC曲线绘制后得到的AUC值(分别是0.952和0.941)相比,本申请构建模型后进行膀胱癌预测的准确性显著提高。
通过将图2和图3、图4的数据进行比较发现,仅仅将本申请的CNV特征进行后续的ROC曲线绘制,其AUC值为0.920;该数据和图3的支持向量机训练集ROC曲线绘制后得到的AUC值(分别是0.952和0.941)相比,本申请构建模型后进行膀胱癌预测的准确性显著提高。
因此,上述数据结果充分说明了采用本申请的方法构建得到的模型,其将SNP/INDEL特征和CNV特征的信息整合在同一个模型中,其能够达到更加准确预测膀胱癌的效果。
一种基于上述模型进行膀胱癌早期筛查的试剂盒,试剂盒包括用于提取cfDNA的试剂组合物,用于基因文库构建的试剂组合物,用于提取gDNA的试剂组合物。
其中,用于提取cfDNA的试剂组合物是能够实现尿液上清cfDNA提取的试剂组合物,本实施例选用的是尿液上清cfDNA提取试剂盒,具体可以是南科征途Apostle MiniMaxHigh Efficiency cfDNA Isolation Kit试剂盒。对提取得到的cfDNA进行基因文库构建时进行的是SNV panel捕获测序建库,本实施例选用的是KAPA DNA HyperPrep文库构建试剂盒 (Illumina,PCR-free,96反应)试剂盒(货号:KK8505)完成预文库构建,选用SNV panel(Twist Custom Panel)搭配Twist Fast Hybridizaton and wash kit,96 Reactions(货号:101175)、Twist Binding and Purrification Deads,96 Reactions(货号:100984)和Twist Universal Blockers,TruSeq Compatible, High Concentration, 4×96Reactions(货号:101786)完成SNV panel捕获。
其中,用于提取gDNA的试剂组合物是能够实现尿液沉淀细胞中gDNA提取的试剂组合物,本实施例选用的是尿液沉淀细胞中gDNA的提取试剂盒,具体可以是康为世纪UrineDNA Storage Tube试剂盒(货号:CW2657)。对提取得到的gDNA进行基因文库构建时进行的是WGS文库构建,构建文库时,本实施例选用的是KAPA DNA HyperPrep文库构建试剂盒(Illumina,PCR-free,96反应,货号:KK8505)。
上述膀胱癌早期筛查试剂盒的使用方法,包括以下步骤:
采用提取cfDNA的试剂组合物提取得到待筛查样本的cfDNA,并采用基因文库构建的试剂组合物构建得到待筛查样本的cfDNA文库,上机检测后得到待筛查样本的cfDNA测序结果;
采用提取gDNA的试剂组合物提取得到待筛查样本的gDNA,并采用基因文库构建的试剂组合物构建得到待筛查样本的gDNA文库,上机检测后得到待筛查样本的gDNA测序结果;
将得到的cfDNA测序结果和gDNA测序结果输入所述模型后得到膀胱癌早期筛查结果。
采用上述试剂盒对50个随机样本进行膀胱癌预测,50个样本组成的验证集的统计结果见表3,验证集的性能指标见表4。
表3 验证集统计结果
Figure 141079DEST_PATH_IMAGE004
表3中,tumor指的是膀胱癌样本,normal指的是健康样本。
表4 验证集的性能指标
Figure 486610DEST_PATH_IMAGE005
本具体实施例仅仅是对本申请的解释,其并不是对本申请的限制,本领域技术人员在阅读完本说明书后可以根据需要对本实施例做出没有创造性贡献的修改,但只要在本申请的权利要求范围内都受到专利法的保护。

Claims (8)

1.一种膀胱癌早期筛查模型的构建方法,其特征在于,包括以下步骤:
S1、自健康样本和癌症样本的尿液沉淀样本中分别获得健康样本和癌症样本的gDNA测序结果;自健康样本和癌症样本的尿液上清样本中分别获得健康样本和癌症样本的cfDNA测序结果;
S2、根据cfDNA测序结果,获得所有健康样本和癌症样本的膀胱癌相关突变marker的覆盖情况,最终获得SNP/INDEL特征;以部分健康样本的gDNA测序结果用于构建CVN事件的baseline,通过对baseline中的信息处理得到CNV特征;根据SNP/INDEL特征和CNV特征进行分类,绘制ROC曲线;
S3、将SNP/INDEL特征和CNV特征进行整合,并通过支持向量机机器学习的算法建立膀胱癌早期筛查模型。
2.根据权利要求1所述的构建方法,其特征在于,步骤S2中,对baseline中的信息处理得到CNV特征的步骤包括:
对baseline中的信息进行归一化,计算出每个bin区间的log2ratio和Z-Score,其计算公式分别为:
ratio = RCgc-bin/mean(RCgc-all-bin),
RCgc-bin代表, 每个bin区间GC校正后的read数,
mean(RCgc-all-bin), 统计所有bin区间GC校正后的read数的均数,
log2ratio, ratio取以2为底log的对数;
Z-Score = (ratio–E(ref-ratio))/std(ref-ratio)
其中E(ref-ratio) 为 cnv baseline每个bin的期望覆盖度,
std(ref-ratio)为cnv baseline每个bin的覆盖度标准差;
将得到的每个bin的log2ratio和Z-Score使用Circular binary segmentation(CBS)方法进行call segment,得到segment的最终log2ratio和Z-Score结果;其中以cutoff_1为0.08用于segment过滤。
3.根据权利要求1所述的构建方法,其特征在于,步骤S2中,以cutoff_2值为8700000用于CNV特征的分类。
4.根据权利要求1所述的构建方法,其特征在于,膀胱癌相关突变marker的分布基因包括基因TERT、基因TP53、基因ERBB2、基因ERCC2、基因FGFR3、基因KDM6A、基因PIK3CA、基因ARID1A、基因ERBB3、基因GATA3、基因BRCA2、基因CREBBP、基因CTNNB1、基因ELF3和基因FH中的任意一种或多种。
5.根据权利要求4所述的构建方法,其特征在于,分布在基因TERT上的膀胱癌相关突变marker包括chr5:1295228-1295228,chr5:1295250-1295250和chr5:1295250-1295254中的任意一种或多种;
分布在基因TP53上的膀胱癌相关突变marker包括chr17:7577127-7577127,chr17:7577505-7577505,chr17:7577527-7577527,chr17:7577535-7577535,chr17:7577538-7577538,chr17:7577539-7577539,chr17:7577545-7577545,chr17:7577548-7577548,chr17:7577559-7577559,chr17:7577568-7577568,chr17:7579313-7579313,chr17:7579328-7579328,chr17:7579365-7579365,chr17:7579391-7579391,chr17:7579406-7579406,chr17:7579415-7579415,chr17:7579431-7579431,chr17:7573982-7573982,chr17:7573983-7573983chr17:7577574-7577574,chr17:7577596-7577596,chr17:7577599-7577599,chr17:7578382-7578382,chr17:7578419-7578419,chr17:7578437-7578437,chr17:7578442-7578442,chr17:7578513-7578513,chr17:7578524-7578524,chr17:7579340-7579340和chr17:7577571-7577584中的任意一种或多种;
分布在基因ERBB2上的膀胱癌相关突变marker包括chr17:37873691-37873691,chr17:37879658-37879658,chr17:37880220-37880220,chr17:37880257-37880257,chr17:37880261-37880261,chr17:37880265-37880265,chr17:37880981-37880981,chr17:37881329-37881329,chr17:37883131-37883131,chr17:37883158-37883158,chr17:37883660-37883660,chr17:37884073-37884073,chr17:37863323-37863323,chr17:37864656-37864656和chr17:37864665-37864665中的任意一种或多种;
分布在基因ERCC2上的膀胱癌相关突变marker包括chr19:45855817-45855817,chr19:45855824-45855824,chr19:45855835-45855835,chr19:45858086-45858086,chr19:45860556-45860556,chr19:45860733-45860733,chr19:45864859-45864881,chr19:45867571-45867571,chr19:45867584-45867584,chr19:45867687-45867687,chr19:45872189-45872189,chr19:45872213-45872213,chr19:45872219-45872219,chr19:45872362-45872362,chr19:45872380-45872380,chr19:45873425-45873425,chr19:45873455-45873455和chr19:45873456-45873456中的任意一种或多种;
分布在基因FGFR3上的膀胱癌相关突变marker包括chr4:1803564-1803564,chr4:1803568-1803568,chr4:1806089-1806089,chr4:1806092-1806092,chr4:1806099-1806099,chr4:1806119-1806119,chr4:1806153-1806153,chr4:1807859-1807859,chr4:1807889-1807889,chr4:1807890-1807890,chr4:1808916-1808916和chr4:1808937-1808937中的任意一种或多种;
分布在基因KDM6A上的膀胱癌相关突变marker包括chrX:44732952-44732952,chrX:44732955-44732955,chrX:44733198-44733198,chrX:44733200-44733200,chrX:44833924-44833924,chrX:44870233-44870240,chrX:44913136-44913136,chrX:44918316-44918316,chrX:44918532-44918532,chrX:44918582-44918583,chrX:44918668-44918669,chrX:44920630-44920633,chrX:44949991-44949991,chrX:44950033-44950034,chrX:44950066-44950066,chrX:44969323-44969323和chrX:44969369-44969369中的任意一种或多种;
分布在基因PIK3CA上的膀胱癌相关突变marker包括chr3:178916929-178916929,chr3:178916936-178916936,chr3:178936091-178936091,chr3:178936094-178936094,chr3:178936095-178936095,chr3:178936103-178936103,chr3:178938886-178938886,chr3:178951994-178951994,chr3:178952039-178952039,chr3:178952085-178952085,chr3:178952090-178952090,chr3:178919256-178919256和chr3:178921553-178921553中的任意一种或多种;
分布在基因ARID1A上的膀胱癌相关突变marker包括chr1:27099915-27099915,chr1:27101380-27101398,chr1:27101427-27101449,chr1:27101551-27101551,chr1:27101586-27101586,chr1:27101645-27101645,chr1:27102132-27102132,chr1:27102137-27102137,chr1:27105648-27105649,chr1:27106081-27106087,chr1:27106240-27106240,chr1:27106279-27106279,chr1:27106354-27106354,chr1:27106539-27106539,chr1:27107081-27107082和chr1:27107134-27107135中的任意一种或多种;
分布在基因ERBB3上的膀胱癌相关突变marker包括chr12:56478817-56478817,chr12:56478851-56478851,chr12:56478854-56478854,chr12:56481649-56481649,chr12:56481660-56481660,chr12:56482341-56482341,chr12:56482537-56482537,chr12:56489571-56489571,chr12:56489582-56489582,chr12:56490408-56490408,chr12:56492623-56492623,chr12:56495696-56495696和chr12:56495711-56495711中的任意一种或多种;
分布在基因GATA3上的膀胱癌相关突变marker包括chr10:8100619-8100619;
分布在基因BRCA2上的膀胱癌相关突变marker包括chr13:32900694-32900694,chr13:32910686-32910686,chr13:32910940-32910940,chr13:32912514-32912514和chr13:32972638-32972638中的任意一种或多种;
分布在基因CREBBP上的膀胱癌相关突变marker包括chr16:3786710-3786710,chr16:3786726-3786730,chr16:3786740-3786740和chr16:3786775-3786775中的任意一种或多种;
分布在基因CTNNB1上的膀胱癌相关突变marker包括chr3:41266113-41266113;
分布在基因ELF3上的膀胱癌相关突变marker包括chr1:201981484-201981494,chr1:201981500-201981500,chr1:201981537-201981537,chr1:201983034-201983034,chr1:201983035-201983035和chr1:201984418-201984418中的任意一种或多种;
分布在基因FH上的膀胱癌相关突变marker包括chr1:241663871-241663871。
6.一种膀胱癌早期筛查模型,其特征在于,所述模型采用权利要求1-5任意一项所述构建方法得到。
7.根据权利要求6所述的模型,其特征在于,所获得数据的70%被纳为训练集,30%被纳为测试集;得到模型的为径向基核函数rbf;核函数的参数gamma为0.001,目标函数的惩罚系数C为1000。
8.一种基于权利要求6-7任意一项所述模型进行膀胱癌早期筛查的试剂盒,其特征在于,所述试剂盒包括用于提取cfDNA的试剂组合物,用于基因文库构建的试剂组合物,用于提取gDNA的试剂组合物;
采用提取cfDNA的试剂组合物提取得到待筛查样本的cfDNA,并采用基因文库构建的试剂组合物构建得到待筛查样本的cfDNA文库,上机检测后得到待筛查样本的cfDNA测序结果;
采用提取gDNA的试剂组合物提取得到待筛查样本的gDNA,并采用基因文库构建的试剂组合物构建得到待筛查样本的gDNA文库,上机检测后得到待筛查样本的gDNA测序结果;
将得到的cfDNA测序结果和gDNA测序结果输入所述模型后得到膀胱癌早期筛查结果。
CN202210447648.8A 2022-04-26 2022-04-26 一种膀胱癌早期筛查模型及其构建方法、试剂盒及其使用方法 Active CN114566285B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210447648.8A CN114566285B (zh) 2022-04-26 2022-04-26 一种膀胱癌早期筛查模型及其构建方法、试剂盒及其使用方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210447648.8A CN114566285B (zh) 2022-04-26 2022-04-26 一种膀胱癌早期筛查模型及其构建方法、试剂盒及其使用方法

Publications (2)

Publication Number Publication Date
CN114566285A true CN114566285A (zh) 2022-05-31
CN114566285B CN114566285B (zh) 2022-07-19

Family

ID=81720766

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210447648.8A Active CN114566285B (zh) 2022-04-26 2022-04-26 一种膀胱癌早期筛查模型及其构建方法、试剂盒及其使用方法

Country Status (1)

Country Link
CN (1) CN114566285B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114743593A (zh) * 2022-06-13 2022-07-12 北京橡鑫生物科技有限公司 一种基于尿液进行***癌早期筛查模型的构建方法、筛查模型及试剂盒
CN115691667A (zh) * 2022-12-30 2023-02-03 北京橡鑫生物科技有限公司 尿路上皮癌早筛方法、模型构建方法、装置和设备
CN115831355A (zh) * 2023-01-09 2023-03-21 北京求臻医学检验实验室有限公司 多癌种wgs的肿瘤早期筛查方法
CN116564508A (zh) * 2023-07-07 2023-08-08 北京橡鑫生物科技有限公司 一种***癌早期筛查模型及其构建方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170101674A1 (en) * 2015-08-21 2017-04-13 Toma Biosciences, Inc. Methods, compositions, and kits for nucleic acid analysis
CN106755547A (zh) * 2017-03-15 2017-05-31 上海亿康医学检验所有限公司 一种膀胱癌的无创检测及其复发监测方法
CN109906276A (zh) * 2016-11-07 2019-06-18 格里尔公司 用于检测早期癌症中体细胞突变特征的识别方法
CN110055331A (zh) * 2019-05-10 2019-07-26 人和未来生物科技(长沙)有限公司 一种用于膀胱癌辅助诊断或筛查的试剂盒及其应用
CN111154880A (zh) * 2020-03-06 2020-05-15 牡丹江医学院 一种膀胱癌新型体液活检生物标志物及其应用
CN111662981A (zh) * 2020-06-09 2020-09-15 俊兮生物科技(上海)有限公司 一种基于二代测序探针捕获方法的癌症的基因检测试剂盒
CN112877441A (zh) * 2021-04-27 2021-06-01 苏州仁端生物医药科技有限公司 一种膀胱尿路上皮癌检测联合标志物的应用
CN113257360A (zh) * 2021-06-24 2021-08-13 北京橡鑫生物科技有限公司 癌症筛查模型、癌症筛查模型的构建方法及构建装置
CN114107513A (zh) * 2022-01-27 2022-03-01 北京优乐复生科技有限责任公司 一种用于膀胱尿路上皮癌诊断的检测方法和试剂盒

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170101674A1 (en) * 2015-08-21 2017-04-13 Toma Biosciences, Inc. Methods, compositions, and kits for nucleic acid analysis
CN109906276A (zh) * 2016-11-07 2019-06-18 格里尔公司 用于检测早期癌症中体细胞突变特征的识别方法
CN106755547A (zh) * 2017-03-15 2017-05-31 上海亿康医学检验所有限公司 一种膀胱癌的无创检测及其复发监测方法
CN110055331A (zh) * 2019-05-10 2019-07-26 人和未来生物科技(长沙)有限公司 一种用于膀胱癌辅助诊断或筛查的试剂盒及其应用
CN111154880A (zh) * 2020-03-06 2020-05-15 牡丹江医学院 一种膀胱癌新型体液活检生物标志物及其应用
CN111662981A (zh) * 2020-06-09 2020-09-15 俊兮生物科技(上海)有限公司 一种基于二代测序探针捕获方法的癌症的基因检测试剂盒
CN112877441A (zh) * 2021-04-27 2021-06-01 苏州仁端生物医药科技有限公司 一种膀胱尿路上皮癌检测联合标志物的应用
CN113257360A (zh) * 2021-06-24 2021-08-13 北京橡鑫生物科技有限公司 癌症筛查模型、癌症筛查模型的构建方法及构建装置
CN114107513A (zh) * 2022-01-27 2022-03-01 北京优乐复生科技有限责任公司 一种用于膀胱尿路上皮癌诊断的检测方法和试剂盒

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ADAM J. WIDMAN 等: "Machine learning guided signal enrichment for ultrasensitive plasma tumor burden monitoring", 《HTTPS://WWW.BIORXIV.ORG/CONTENT/10.1101/2022.01.17.476508V1.ABSTRACT》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114743593A (zh) * 2022-06-13 2022-07-12 北京橡鑫生物科技有限公司 一种基于尿液进行***癌早期筛查模型的构建方法、筛查模型及试剂盒
CN115691667A (zh) * 2022-12-30 2023-02-03 北京橡鑫生物科技有限公司 尿路上皮癌早筛方法、模型构建方法、装置和设备
CN115691667B (zh) * 2022-12-30 2023-04-18 北京橡鑫生物科技有限公司 尿路上皮癌早筛装置、模型构建方法和设备
CN115831355A (zh) * 2023-01-09 2023-03-21 北京求臻医学检验实验室有限公司 多癌种wgs的肿瘤早期筛查方法
CN116564508A (zh) * 2023-07-07 2023-08-08 北京橡鑫生物科技有限公司 一种***癌早期筛查模型及其构建方法
CN116564508B (zh) * 2023-07-07 2023-09-29 北京橡鑫生物科技有限公司 一种***癌早期筛查模型及其构建方法

Also Published As

Publication number Publication date
CN114566285B (zh) 2022-07-19

Similar Documents

Publication Publication Date Title
CN114566285B (zh) 一种膀胱癌早期筛查模型及其构建方法、试剂盒及其使用方法
EP2572000B1 (en) Methods for diagnosing colorectal cancer
CN113462781A (zh) 使用血浆dna的尺寸和数目畸变检测癌症
CN112322736B (zh) 一种用于检测肝癌的试剂组合,试剂盒及其用途
CN112501293B (zh) 一种用于检测肝癌的试剂组合,试剂盒及其用途
JP6606554B2 (ja) Y染色体のメチル化部位を前立腺ガンの診断用マーカとする使用
Liu et al. Fragment enrichment of circulating tumor DNA with low-frequency mutations
CN109637587B (zh) 检测基因融合突变的方法、装置、存储介质、处理器及转录组数据表达量标准化的方法
CN115418401A (zh) 用于膀胱癌的尿监测的诊断测定
CN112280865B (zh) 一种用于检测肝癌的试剂组合,试剂盒及其用途
CN114743593B (zh) 一种基于尿液进行***癌早期筛查模型的构建方法、筛查模型及试剂盒
CN114717311A (zh) 用于检测尿路上皮癌的标志物、试剂盒和装置
WO2014159425A1 (en) Bladder cancer detection and monitoring
CN104845970A (zh) 与***状甲状腺瘤相关的基因
CN113481299A (zh) 用于肺癌检测的靶向测序panel、试剂盒及获得靶向测序panel的方法
CN113817822B (zh) 一种基于甲基化检测的肿瘤诊断试剂盒及其应用
CN111349700B (zh) 用于尿路上皮癌检测的基因标志物组合、试剂盒和方法
CN114592066A (zh) 一种新型多靶点肝癌早期检测的组合标志物及其应用
CN112430658A (zh) 结内外周t细胞淋巴瘤相关基因的检测试剂盒及建库方法
JP2007006792A (ja) 肺腺癌の胸膜浸潤を判別するための遺伝子セット
CN116987788B (zh) 一种利用冲洗液检测早期肺癌的方法与试剂盒
CN114350813B (zh) Tmem236基因在制备用于诊断直肠癌新辅助放疗抵抗标记物中的用途
CN114657248B (zh) 用于检测早期结直肠癌的血浆游离dna甲基化生物标记物或其组合物、应用及试剂盒
JP2007006791A (ja) 肺腺癌を判別するための遺伝子セット
JP2007135466A (ja) 肺腺癌の再発を予測するための遺伝子セット

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant