CN114613423A - 用于弥漫大b细胞淋巴瘤化疗疗效预测的生物标志物 - Google Patents

用于弥漫大b细胞淋巴瘤化疗疗效预测的生物标志物 Download PDF

Info

Publication number
CN114613423A
CN114613423A CN202011448752.6A CN202011448752A CN114613423A CN 114613423 A CN114613423 A CN 114613423A CN 202011448752 A CN202011448752 A CN 202011448752A CN 114613423 A CN114613423 A CN 114613423A
Authority
CN
China
Prior art keywords
chemotherapy
cell lymphoma
diffuse large
biomarker
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011448752.6A
Other languages
English (en)
Inventor
林坚
陈航宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Xuanniao Feixun Technology Co.,Ltd.
Original Assignee
Shanghai Epican Biotechnology Co ltd
Shanghai Epican Genetech Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Epican Biotechnology Co ltd, Shanghai Epican Genetech Co ltd filed Critical Shanghai Epican Biotechnology Co ltd
Priority to CN202011448752.6A priority Critical patent/CN114613423A/zh
Publication of CN114613423A publication Critical patent/CN114613423A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B35/00ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
    • G16B35/20Screening of libraries
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Molecular Biology (AREA)
  • Organic Chemistry (AREA)
  • Medical Informatics (AREA)
  • Wood Science & Technology (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Library & Information Science (AREA)
  • Pathology (AREA)
  • Microbiology (AREA)
  • Physiology (AREA)
  • General Engineering & Computer Science (AREA)
  • Oncology (AREA)
  • Hospice & Palliative Care (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及一种用于预测弥漫大B细胞淋巴瘤化疗疗效的生物标志物,包括ARHGEF12、THAP3、SMYD3、OR2G2、ALKBH3、RNASEH2C、ZNF280D、SLC5A11、CTDP1、GPR15、GOLGB1、FBXL4和LMBR1的组合。通过本发明提供的生物标志物可以有效预测弥漫大B细胞淋巴瘤化疗的治疗效果,灵敏度和特异性分别达到0.82、0.75,AUC值为0.78。根据该生物标志物进行疗效预测,具有安全无创、样本易于获得、准确性高、操作方便等优点,为弥漫大B细胞淋巴瘤化疗治疗效果评价提供准确的判断。

Description

用于弥漫大B细胞淋巴瘤化疗疗效预测的生物标志物
技术领域
本发明涉及生物技术领域,具体涉及一种用于弥漫大B细胞淋巴瘤化疗疗效预测的生物标志物。
背景技术
弥漫性大B细胞淋巴瘤(DLBCL)是侵袭性淋巴组织肿瘤的主要类型,约占非霍奇金淋巴瘤的30%。虽然DLBCL患者多为老年人,但本病在各年龄段均有发现。自10年前利妥昔单抗(R)联合环磷酰胺、阿霉素、长春新碱和强的松(CHOP)化疗方案(R-CHOP)以来,DLBCL患者的总生存率明显提高。
然而,30%-50%的患者对这种标准治疗不敏感,现有的方法不能准确或有效地在治疗前预测R-CHOP的治疗效果。目前,正电子发射断层扫描(PET)-CT是评价不同治疗方案对DLBCL疗效的金标准。然而,它通常在治疗后使用,因此不能***治疗效果。国际预后指数(IPI)是当前采用的对DLBCL尤其是高危患者的主要预后风险的评估方法,可用于R-CHOP化疗。然而,通过IPI预测R-CHOP对DLBCL患者的治疗效果的准确性较低。因此,发现一种准确的方法来***DLBCL的R-CHOP方案的治疗效果是非常必要的。
发明内容
本发明的目的在于提供一种用于弥漫大B细胞淋巴瘤化疗疗效预测的生物标志物,本发明提供的生物标志物可以有效预测弥漫大B细胞淋巴瘤化疗疗效,灵敏度和特异性分别达到0.82、0.75,AUC值为0.78。根据该生物标志物进行疗效预测,具有安全无创、样本易于获得、准确性高、操作方便等优点,为弥漫大B细胞淋巴瘤化疗治疗效果评价提供准确的判断。
为此,本发明采用以下技术方案。
本发明的第一方面提供一种生物标志物,所述生物标志物包括ARHGEF12、THAP3、SMYD3、OR2G2、ALKBH3、RNASEH2C、ZNF280D、SLC5A11、CTDP1、GPR15、GOLGB1、FBXL4和LMBR1的组合。
第二方面,本发明提供所述生物标志物在制备用于预测弥漫大B细胞淋巴瘤化疗疗效的产品中的用途,所述用途包括用于构建预测弥漫大B细胞淋巴瘤化疗疗效的模型。
进一步,所述化疗的方案为:利妥昔单抗(R)联合环磷酰胺、阿霉素、长春新碱和强的松(CHOP)的化疗方案。本领域通常将该化疗方案简称为R-CHOP。
第三方面,本发明提供一种预测弥漫大B细胞淋巴瘤化疗疗效的模型,所述模型的输入变量为本发明所述的生物标志物的含量。
进一步,所述生物标志物的含量的测定方法为5hmC高通量检测;在具体的实施方式中,所述测定方法为5hmC-Seal。
第四方面,本发明提供一种预测弥漫大B细胞淋巴瘤化疗疗效的模型的构建方法,包括如下步骤:
(1)分别检测来自多例经化疗的弥漫大B细胞淋巴瘤患者的样本,获得DNA的5hmC测序数据;
(2)将步骤(1)得到的测序数据依次进行第一过滤、筛选、第二过滤,获得用于预测弥漫大B细胞淋巴瘤化疗疗效的生物标志物;
所述第一过滤包括:去除仅在小于等于10个样本中出现的锋信息;
所述筛选包括:用DEseq2软件比对来自不同样本的测序数据,保留reads数大于50的5hmC峰区域,按照FoldChage>=0.5,pvalue<0.01,找出5hmC上下调的差异生物标志物;
所述第二过滤包括:对于经所述筛选得到的差异生物标志物,使用Scikit-Learn中的递归特征消除算法(RFECV)进行过滤,获得用于预测弥漫大B细胞淋巴瘤化疗疗效的生物标志物:ARHGEF12、THAP3、SMYD3、OR2G2、ALKBH3、RNASEH2C、ZNF280D、SLC5A11、CTDP1、GPR15、GOLGB1、FBXL4和LMBR1;
(3)将步骤(2)获得的生物标志物的数据输入机器学习模型,训练模型,存储训练后的模型,获得预测弥漫大B细胞淋巴瘤化疗疗效的模型。
进一步,所述样本为血浆;在具体的实施方式中,所述样本为外周血。
进一步,所述经化疗的弥漫大B细胞淋巴瘤患者包括经治疗效果评价为完全缓解(CR)的患者、部分缓解(PR)的患者、疾病稳定(SD)的患者和疾病进展(PD)的患者。
进一步,在所述第二过滤中,使用的参数为:estimator=LogisticRegressionCV(class_weight='balanced',cv=2,max_iter=1000),scoring='accuracy')
进一步,步骤(3)中,所述机器学习模型包括:通过训练logistic回归CV模型(LR)。
进一步,所述化疗的方案为:利妥昔单抗(R)联合环磷酰胺、阿霉素、长春新碱和强的松(CHOP)的化疗方案。
logistic回归又称logistic回归分析,是一种广义的线性回归分析模型,本发明利用logistic回归分析进行数据挖掘,探讨与弥漫大B细胞淋巴瘤化疗疗效相关的因素,并根据该因素预测弥漫大B细胞淋巴瘤化疗疗效。通过logistic回归分析,可以得到自变量的权重,从而可以了解到底哪些因素是与弥漫大B细胞淋巴瘤化疗疗效密切相关的因素。同时根据该权值可以根据该因素预测一个人的弥漫大B细胞淋巴瘤化疗疗效。对于本发明提供的模型,经采用受试者工作特征(ROC)分析评价模型的性能,利用sklearn计算曲线下面积(AUC),模型的灵敏度和特异性分别达到0.82、0.75,ROC值为0.78。
第五方面,本发明提供一种用于预测弥漫大B细胞淋巴瘤化疗疗效的产品,所述产品基于所述预测弥漫大B细胞淋巴瘤化疗疗效的模型对弥漫大B细胞淋巴瘤化疗疗效进行预测。
DNA的5-甲基胞嘧啶(5mCs)是一种重要的表观遗传学特征,在基因表达和肿瘤发生发展中发挥着重要作用。本发明通过高通量测序技术,发现预测弥漫大B细胞淋巴瘤化疗疗效的5-羟甲基胞嘧啶生物标志物,对弥漫大B细胞淋巴瘤患者R-CHOP治疗效果提前做出有效预测。
与现有技术相比,本发明具有如下有益效果:
(1)本发明提供一种用于预测弥漫大B细胞淋巴瘤化疗疗效的生物标志物,可对弥漫大B细胞淋巴瘤患者化疗疗效提前做出有效预测。
(2)本发明还提供了一种用于预测弥漫大B细胞淋巴瘤化疗疗效的模型,模型的灵敏度和特异性分别达到0.82、0.75,AUC值为0.78,具有特异性强、灵敏度高的优点。通过应用本发明所述的生物标志物和/或模型,可对患者的弥漫大B细胞淋巴瘤化疗疗效实现安全无创、准确性高的预测。
(3)根据本发明提供的生物标志物和模型,进行化疗疗效预测的样品为外周血,易于获得;预测方法依托于高通量测序,检测效率高;预测模型可靠,预测结果的准确性高。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。在附图中:
图1:训练组中13个特征5hmC markers中单个marker的预测准确性;
图2:验证组中13个特征5hmC markers中单个marker的预测准确性。其中,ARHGEF12(AUC=0.76)和ZNF280D(AUC=0.76)表现出最高的预测准确性。
图3:5hmC差异性markers的特征选择。递归特征选择算法选择13个特征作为获得最佳交叉验证分数的最小特征数。x轴是所选特征的数量,y轴是模型性能的交叉验证得分。
图4:在训练和验证队列中使用13个5hmC特征Markers构建的预测模型的受试者工作特性(ROC)曲线。绘制成真实阳性率(灵敏度)和假阳性率(1-特异性)的函数。在训练组中,这13个5hmC特征Markers构建的预测模型可以有效预测对R-CHOP治疗有反应者和无反应者(AUC=1.00),在验证组中,基于13个5hmC特征Markers的预测模型同样可以有效预测对R-CHOP治疗有效者和无效者(AUC=0.78)。
图5:验证组中预测模型性能的混淆矩阵(治疗有效者:22人,治疗无效者:8人)。结果显示:22例治疗有效者中,基于13个5hmC特征Markers的预测模型预测了18人治疗有效,灵敏度达到0.82;在8例治疗无效者中,基于13个5hmC特征Markers的预测模型预测了6人治疗无效,特异性为0.75。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施方式。虽然附图中显示了本公开的示例性实施方式,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
本发明提供一种预测弥漫大B细胞淋巴瘤化疗疗效的模型,模型中13个5hmC特征生物标志物的相关参数见表1所示:
表1
Markers GeneID Coefficients SE z.value p.value
Intercept -5.5704 0.867 2.652 <0.01
chr1_6721489_6721898 THAP3 0.7712 0.145 1.865 <0.05
chr1_246290825_246291238 SMYD3 0.39 0.149 1.955 <0.05
chr1_247755954_247756505 OR2G2 3.1779 0.108 1.344 <0.05
chr11_43905400_43905804 ALKBH3 3.3423 0.128 1.306 <0.05
chr11_65511519_65512429 RNASEH2C 1.5211 0.072 2.061 <0.05
chr11_120211662_120212234 ARHGEF12 -3.8797 0.115 -3.225 <0.001
chr15_56982146_56982638 ZNF280D -1.2266 0.177 -3.250 <0.001
chr16_24916341_24916920 SLC5A11 0.6683 0.076 0.149 <0.05
chr18_77500908_77501376 CTDP1 -2.573 0.103 -3.182 <0.001
chr3_98270705_98271079 GPR15 0.1052 0.167 2.348 <0.05
chr3_121430838_121431239 GOLGB1 0.8526 0.178 2.982 <0.01
chr6_99461404_99461922 FBXL4 1.7188 0.101 2.165 <0.05
chr7_156700537_156701031 LMBR1 1.0942 0.078 0.579 <0.05
在本发明的实施例中,采用5hmC-Seal高通量测序法对样本进行测序,对以下实施例所采用的5hmC-Seal高通量测序法解释如下:
5hmC-Seal是一种基于5hmC的高通量测序方法。这种方法以改进后的化学糖基化标记为基础,结合二代高通量测序技术,得到5hmC在基因组DNA上的分布信息。
由于化学标记法的高度灵敏特性,输入的DNA可以低至1-10ng,所述的DNA可以是打碎后的基因组DNA,也可以是cfDNA等小片段,按照二代测序的要求,在DNA片段两端进行补平,之后在3’端连接上一个A tail,借由AT特异性连接在每个DNA片段两端连上测序Y形接头,其中包含了区分样品的index信息和扩增引物等序列。之后,进入5hmC的标记步骤,先加入UDP-6-N3-Glc,在特定条件下,使DNA上的5hmC都反应变为N3-5ghmC,再加入DBCO-PEG4-Biotin,使N3-5ghmC都连上生物素,最后通过生物素-磁珠高效的特异性结合,筛选得到所有的包含5hmC位点的DNA片段,经过PCR扩增、纯化之后完成基于5hmC的DNA文库构建;通过Fragment Analyzer质控分析每个样品的DNA条带大小和分布,通过qPCR对文库进行精确定量后,用Illumina公司的Nextseq 500测序仪进行高通量测序,得到文库中所有DNA片段的碱基序列。
实施例1
86名经R-CHOP化疗的弥漫大B细胞淋巴瘤患者,包括经治疗效果评价为完全缓解(CR)的患者、部分缓解(PR)的患者、疾病稳定(SD)的患者和疾病进展(PD)的患者。取上述86名患者的外周血样品(3-4mL),从血浆中提取cfDNA进行5hmC-Seal高通量测序,每个样品的测序通量为1.5Gb,测序条带大小为38bp。具体步骤如下:
(1)样本收集:
在患者入院确诊时(未进行R-CHOP标准化疗前),共收集86例弥漫大B细胞淋巴瘤患者血液各8mL,并于24小时之内进行血浆分离操作,收集患者血浆样品。首先进行第一次离心,1350g、4℃低温离心12min,小心取出淡黄色上清,转移至2mLDNase free无菌EP管中,避免污染白细胞层。其次,进行第二次离心,1350g、4℃低温离心5min;小心取出上清,转移至2mL DNase free无菌EP管中,再次除去残留红细胞。第三步,离心,13500g、4℃低温离心5min;小心取出上清,转移至2mL DNase free无菌离心管中,可以获得约4mL左右的血浆,将获得的血浆贴好标签后冻存于-80度冰箱待用。
(2)抽提血浆DNA:
利用Quick-cfDNA Serum&Plasma Kit(ZYMO)试剂盒,从来自86位弥漫大B细胞淋巴瘤患者的血浆样品中分别抽提8-10ng血浆cfDNA。
(3)将cfDNA进行末端补齐并与测序接头连接:
根据KAPA HyperPlus Library Preparation Kit(96)说明书制备含有20uLcfDNA、2.8uL End Repair&A-Tailing Buffer和1.2uL End Repair&A-Tailing Enzymemix的反应混合液(总体积为24uL),在20温浴30分钟,然后在65温浴30分钟。接下来,在1.5mL低吸附EP管中配置以下连接反应混合物:2uL Nuclease free water,12uL LigationBuffer以及4uL DNA Ligase。向18uL连接反应混合物中加入2uL的测序接头,混合,加入至24uL反应样本中,于20摄氏度加热4小时。使用DNA Clean&Concentrator 5(ZYMO)纯化试剂盒对反应产物进行纯化,用20uL洗脱缓冲液进行洗脱获得最终的DNA连接样品。
(4)5hmC标记:
制备总体积为4uL的标记反应混合液:1uL 50uM UDP-N3-Glu、1uLβGT酶(NEB)和2uL HEPES缓冲液(pH 8.0,终浓度为50mM),将4uL标记混合液加入至20uL DNA连接样本中。将混合液在37摄氏度水浴2小时。取出混合液,用DNA Clean&Concentrator 5(ZYMO)纯化试剂盒对反应产物进行纯化,获得纯化的30uL DNA。然后在上述纯化的30uL DNA中加入1uLDBCO-PEG4-Biotin(Click Chemistry Tools),于37摄氏度水浴1小时,接着用DNA Clean&Concentrator 5(ZYMO)纯化试剂盒对反应产物进行纯化,获得30uL纯化的标记产物。
(5)5hmC富集:
首先,按以下步骤准备结合磁珠:取出2.5uL Dynabeads(Invitrogen)并加入100uL洗涤缓冲液(5mM Tris(pH 7.5)、lM NaCl和0.02%Tween20),吹打混匀,放置于1.5mL磁力架上,重复用100uL洗涤缓冲液洗涤结合磁珠3次,最后加入32uL结合缓冲液(10mMTris(pH 7.5)、2M NaCl和0.04%Tween20),并混合均匀。然后,在磁珠混合液中加入上述步骤获得的纯化的标记产物,并在旋转混合器中混合30min使其充分结合。最后,用100uL洗涤液(5mM Tris(pH 7.5)、lM NaCl和0.02%Tween20)洗涤磁珠5次,离心去掉上清液,加入23.8uL RNase-Free water。
(6)PCR扩增:
向上述步骤的最终体系中加入25uL 2X PCR master mix和1.25uL PCR引物(总体积为50u L),按照下述PCR反应循环的温度和条件进行扩增:
Figure BDA0002825887630000071
Figure BDA0002825887630000081
将扩增产物用AmpureXP beads纯化,得到最终5hmC文库,并用Qubit 3.0进行文库浓度测定。
(6)对5hmC文库质控后进行高通量测序:
将获得的5hmC文库进行Fragment AnalyzerTM全自动毛细管电泳***质控,确定文库中DNA片段大小以及是否含有杂质;通过qPCR进行浓度测定。将通过质检的测序文库以相同浓度混合,用11lumina NextSeq500进行测序,使用的测序试剂盒是High Output Kitv2(75cycles),每个样品的测序通量为1.5Gb,测序条带大小为75bp。
(7)原始测序数据比对:
每个原始测序FASTQ数据先用Trimmomatic软件进行低质量数据修剪,再用Bowtie2软件比对到人基因组hg19上,使用MACS软件进行包含5hmC的reads数峰识别,参数为:effective genome size=2.72e+09;tag size=38;band width=100;model fold=10;P value cutoff=1.00e-05。
按照2:1的比例将86例样本随机拆分为训练组(training cohort)和验证组(validation cohort)。对比训练组(56例)不同患者血浆cfDNA的峰信息,进行过滤,条件为每个峰至少在10个样品中出现;用DEseq2软件比来自不同样本的DNA测序数据,找到的reads数大于50的5hmC峰区域,按|log2FoldChange|>=0.5,pvalue<0.01,分别找出5hmC上下调的差异生物标志物。然后,使用Scikit-Learn中的递归特征消除算法(RFECV)对所述差异生物标志物进行进一步过滤,筛选特征生物标志物(使用参数:estimator=LogisticRegressionCV(class_weight='balanced',cv=2,max_iter=1000),scoring='accuracy')。进一步的,利用筛选到的特征biomarkers进行模型构建,训练logistic回归CV模型(LR),并采用受试者工作特征(ROC)分析评价模型的性能,利用sklearn计算曲线下面积(AUC)、灵敏度和特异性,其中训练组中13个特征5hmC markers中单个marker的预测准确性可见图1,验证组中13个特征5hmC markers中单个marker的预测准确性可见图2。最后,经过100次的训练,发现13个特征5hmC markers构建的预测模型可以达到最佳的交叉验证分数,结果见图3。将构建好的LR预测模型用于预测验证组中患者的治疗结果,可见图4。将构建好的LR预测模型用于实施例2预测验证组中患者的治疗结果。
实施例2
取实施例1中的验证组(30例,其中CR 14例、PR 8例、SD 3例、PD 5例)的患者的外周血按照实施例1中的实验方法进行样本收集/cfDNA提取/构建文库/文库测序,对测序数据进行处理分析,筛选出5hmC富集位点。然后根据筛选出的5hmC富集位点通过实施例1获得的预测模型进行疗效预测。预测结果如图5所示,结果显示,22例PRCR患者中有18例预测为PRCR,灵敏度为0.82;8例PDSD患者中有6例预测为PDSD,特异性为0.75。
由此可得出结论,本发明提供的基于上述13个5hmC特征生物标志物构建的预测模型可以有效***弥漫大B细胞淋巴瘤患者R-CHOP化疗的治疗效果。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (10)

1.一种用于预测弥漫大B细胞淋巴瘤化疗疗效的生物标志物,其特征在于,所述生物标志物包括ARHGEF12、THAP3、SMYD3、OR2G2、ALKBH3、RNASEH2C、ZNF280D、SLC5A11、CTDP1、GPR15、GOLGB1、FBXL4和LMBR1的组合。
2.如权利要求1所述的生物标志物在制备用于预测弥漫大B细胞淋巴瘤化疗疗效的产品中的用途,其特征在于,所述用途包括用于构建预测弥漫大B细胞淋巴瘤化疗疗效的模型。
3.如权利要求2所述的生物标志物的用途,其特征在于,所述化疗的方案为:利妥昔单抗联合环磷酰胺、阿霉素、长春新碱和强的松的化疗方案。
4.一种基于预测弥漫大B细胞淋巴瘤化疗疗效的模型的产品,其特征在于,所述模型的输入变量为权利要求1所述的生物标志物的含量。
5.如权利要求4所述的产品,其特征在于,所述生物标志物的含量的测定方法为5hmC高通量检测;优选为5hmC-Seal。
6.如权利要求4所述的产品,其特征在于,所述模型的构建方法包括如下步骤:
(1)分别检测来自多例经化疗的弥漫大B细胞淋巴瘤患者的样本,获得DNA的5hmC测序数据;
(2)将步骤(1)得到的测序数据依次进行第一过滤、筛选、第二过滤,获得用于预测弥漫大B细胞淋巴瘤化疗疗效的生物标志物;
所述第一过滤包括:去除仅在小于等于10个样本中出现的峰信息;
所述筛选包括:用DEseq2软件比对来自不同样本的测序数据,保留reads数大于50的5hmC峰区域,按照|log2FoldChange|>=0.5,pvalue<0.01,获得5hmC上下调的差异生物标志物;
所述第二过滤包括:对于经所述筛选得到的差异生物标志物,使用Scikit-Learn中的递归特征消除算法进行过滤,获得用于预测弥漫大B细胞淋巴瘤化疗疗效的生物标志物:ARHGEF12、THAP3、SMYD3、OR2G2、ALKBH3、RNASEH2C、ZNF280D、SLC5A11、CTDP1、GPR15、GOLGB1、FBXL4和LMBR1;
(3)将步骤(2)获得的生物标志物的数据输入机器学习模型,训练模型,存储训练后的模型,获得预测弥漫大B细胞淋巴瘤化疗疗效的模型。
7.如权利要求6所述的产品,其特征在于,所述样本为血浆;优选为外周血。
8.如权利要求6所述的产品,其特征在于,所述经化疗的弥漫大B细胞淋巴瘤患者包括经治疗效果评价为完全缓解的患者、部分缓解的患者、疾病稳定的患者和疾病进展的患者。
9.如权利要求6所述的产品,其特征在于,所述第二过滤中,使用的参数为:estimator=LogisticRegressionCV(class_weight='balanced',cv=2,max_iter=1000),scoring='accuracy') 。
10.如权利要求6所述的产品,其特征在于,所述步骤(3)中,所述机器学习模型包括:通过训练logistic回归CV模型。
CN202011448752.6A 2020-12-09 2020-12-09 用于弥漫大b细胞淋巴瘤化疗疗效预测的生物标志物 Pending CN114613423A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011448752.6A CN114613423A (zh) 2020-12-09 2020-12-09 用于弥漫大b细胞淋巴瘤化疗疗效预测的生物标志物

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011448752.6A CN114613423A (zh) 2020-12-09 2020-12-09 用于弥漫大b细胞淋巴瘤化疗疗效预测的生物标志物

Publications (1)

Publication Number Publication Date
CN114613423A true CN114613423A (zh) 2022-06-10

Family

ID=81856780

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011448752.6A Pending CN114613423A (zh) 2020-12-09 2020-12-09 用于弥漫大b细胞淋巴瘤化疗疗效预测的生物标志物

Country Status (1)

Country Link
CN (1) CN114613423A (zh)

Similar Documents

Publication Publication Date Title
CN108753967B (zh) 一种用于肝癌检测的基因集及其panel检测设计方法
CN111041089B (zh) Covid-19感染的宿主标志物的应用
CN110760580B (zh) 一种肝癌的早期诊断设备
AU2010311535A1 (en) Means and methods for non-invasive diagnosis of chromosomal aneuploidy
CN109637587B (zh) 检测基因融合突变的方法、装置、存储介质、处理器及转录组数据表达量标准化的方法
WO2020048518A1 (zh) 一组用于髓母细胞瘤分子分型的基因及其应用
Roth et al. Differentially regulated miRNAs as prognostic biomarkers in the blood of primary CNS lymphoma patients
CN107142320B (zh) 用于检测肝癌的基因标志物及其用途
CN106399304B (zh) 一种与乳腺癌相关的snp标记
CN106191311B (zh) 一种快速检测豚鼠LCMV、SV、PVM、Reo-3病毒的多重液相基因芯片方法及试剂
CN110229897A (zh) Med12基因突变检测试剂盒及其应用
CN115786459B (zh) 一种应用于高通量测序检测实体瘤微小残留病的方法
CN110904231A (zh) 一种用于辅助诊断肝癌的试剂及其在制备试剂盒中的用途
CN108060227A (zh) 一种检测pah基因突变的扩增引物、试剂盒及其检测方法
CN113637744A (zh) 微生物标志物在判断急性胰腺炎病程进展中的应用
JPWO2019117257A1 (ja) 乳がんの検出を補助する方法
CN109295219B (zh) 一组检测先天性纤维蛋白原缺陷的生物标记及其检测试剂盒
CN114613423A (zh) 用于弥漫大b细胞淋巴瘤化疗疗效预测的生物标志物
CN108342488B (zh) 一种用于检测胃癌的试剂盒
CN103509801B (zh) 骨骼肌氯离子通道基因突变体及其应用
CN106868128B (zh) 一组辅助诊断乳腺癌的生物标记物及其应用
CN106636351B (zh) 一种与乳腺癌相关的snp标记及其应用
CN110218795B (zh) miR-766-3p和miR-766-5p在制备高级别胶质瘤和颅内淋巴瘤诊断和鉴别诊断制剂中的应用
KR102695246B1 (ko) 유전체와 후성 유전체 동시 분석 방법 및 분석 시스템
CN115747217B (zh) 长链非编码rna pdxdc1-as1及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20230629

Address after: 2104, 21st Floor, No. 9 North Fourth Ring West Road, Haidian District, Beijing, 100000

Applicant after: Beijing Xuanniao Feixun Technology Co.,Ltd.

Address before: Room 201-2, 2nd Floor, 328 Edison Road, Pudong New Area, Shanghai, March 2012

Applicant before: SHANGHAI EPICAN GENETECH Co.,Ltd.

Applicant before: SHANGHAI EPICAN BIOTECHNOLOGY Co.,Ltd.

TA01 Transfer of patent application right