CN115873947A - 一种鼻咽癌遗传风险评估*** - Google Patents
一种鼻咽癌遗传风险评估*** Download PDFInfo
- Publication number
- CN115873947A CN115873947A CN202210989283.1A CN202210989283A CN115873947A CN 115873947 A CN115873947 A CN 115873947A CN 202210989283 A CN202210989283 A CN 202210989283A CN 115873947 A CN115873947 A CN 115873947A
- Authority
- CN
- China
- Prior art keywords
- mutation
- nasopharyngeal carcinoma
- mutations
- rare
- score
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一组鼻咽癌的易感基因,并构建了一套包含样品制备、多靶点基因检测、多基因模型预测及结果判定的鼻咽癌遗传风险评估***,其基于常见及罕见遗传位点构建的鼻咽癌多基因遗传风险评分,区别于传统来源于血浆的游离核酸如cfDNA,miRNA等分子生物标志物,多基因遗传风险评分是基于个体天生的遗传信息,终生只需检测一次,可在任意年龄进行检测,具有终生稳定、易于检测等优点。利用该遗传风险评估***进行高危个体识别,评分最高个体,其鼻咽癌发病风险是评分最低组的21~27倍。该评估***可以为个体化的鼻咽癌发病风险评估、高危人群识别、鼻咽癌高癌家系遗传筛查、相应的遗传咨询和临床干预提供参考。
Description
技术领域
本发明涉及基因检测技术领域,具体地,涉及一种鼻咽癌遗传风险评估***。
背景技术
鼻咽癌(Nasopharyngeal Carcinoma)是一种起源于鼻咽粘膜上皮的恶性肿瘤。在全世界范围内,鼻咽癌的发病率极不均衡,在大部分地区,年龄标化发病率低于1/10万,而在我国华南地区却异常高发。对于早期鼻咽癌患者,其预后较好,5年生存率超过90%,而晚期鼻咽癌患者缺乏理想的治疗手段,其5年生存率不足50%。鼻咽癌因其疾病早期症状无特异性,且原发病灶较为隐匿等特点,约80%的患者发现时即为中晚期,治疗效果不佳,病死率较高。因此,开展鼻咽癌早诊早治对鼻咽癌防控具有重要意义。
流行病学调查发现,鼻咽癌的发病存在明显的家族聚集现象,约10%的鼻咽癌患者有鼻咽癌家族史,患者一级亲属的鼻咽癌风险是无鼻咽癌家族史人群的4~10倍,因此,寻找、确定鼻咽癌患者的易感基因对于家庭中其他成员的发病风险评估及遗传咨询至关重要。遗传因素是鼻咽癌发病的重要病因,根据个体携带易感基因的情况,可进行个体遗传风险预测,并为个体提供精准的筛查和预防建议。
目前,已有技术根据鼻咽癌相关基因来判定个体对鼻咽癌的遗传易感性(专利:“用于鼻咽癌发病风险预测的试剂盒及基因芯片”,“一种用于鼻咽癌高危人群识别的SNP标志物及其试剂盒和应用”等),但是所用的位点为人群中常见的低致病性的多态性变异,变异位点在正常人中存在的频率也较高,对疾病的效应较低,利用这些常见低致病性变异进行风险评分,评分最高10%组的鼻咽癌发病风险是评分最低组的5~7倍。这些方法由于研究阶段主要纳入的是散发病例,即一个家庭中只有一个鼻咽癌病人,无遗传倾向,因此无法筛选和鉴定到有鼻咽癌家族史患者的遗传易感基因,进而无法对高癌家族成员遗传风险进行评估。而高癌家族病人由于携带低频甚至罕见的有害突变,这些突变几乎只在家庭的血缘亲属中遗传,在散发病例中难以检测到,必须依赖于获得具有家族遗传史的病人才能够获得。此外对高癌家族成员进行遗传风险评估远比散发患者家庭成员遗传风险评估更为迫切,但目前没有相应的方法和检测技术。除了利用遗传易感基因,另外有专利采用EB病毒的分型来进行个体风险评估(专利:“检测疾病相关的EB病毒变异位点的试剂盒”,“用于鼻咽癌发病风险预测的试剂盒及基因芯片”),然而EB病毒在人群中虽然感染普遍,但部分个体病毒载量低,有相当比例人群因病毒潜伏而无法检测到病毒阳性信号,进而病毒分型的成功率较低(48.79%~54.75%,PMID:31209392),有接近一半的个体无法成功获得EB病毒分型,因此,并非所有个体都可以成功计算出风险评分。
具有鼻咽癌家族史的高危人群是鼻咽癌高发区重点防控的关键人群,对于该部分高危人群,亟需发现高致病性遗传突变(如危险效应>2的风险等位基因),开发更加高效的基因筛查及风险预测应用工具,进而更有针对性地开展鼻咽癌高发家系的筛查及遗传咨询。
发明内容
本发明的目的是为了克服现有技术的上述不足,开展大规模的全外显子组测序研究,通过富集具有鼻咽癌家族史背景的病例,通过大规模的基因组学分型实验、基因功能实验、数据分析得到影响鼻咽癌发病的高致病性易感基因,并通过大数据建模及试剂盒构建提供一种鼻咽癌遗传风险评估***。本发明利用遗传易感基因进行风险评估,建立了一种鼻咽癌风险评估的重要方法,它具有检出率高(近乎100%的分型成功率),分型简单,结果稳定的优势。
本发明的第一个目的是提供检测鼻咽癌相关基因中一个或几个的基因突变的试剂的应用。
本发明的第二个目的是提供一种鼻咽癌遗传风险评估的产品。
本发明的第三个目的是提供一种鼻咽癌遗传风险评估***。
本发明中提到的所有物理位置采用hg19版本参考基因组,所标示位点目前还没有RS号的,采用物理位置加上突变前后的等位基因来命名该位点,命名规则为:
“染色体号:hg19版本参考基因组物理位置:参考等位基因:有害等位基因”。
为了实现上述目的,本发明是通过以下方案予以实现的:
一组鼻咽癌发病相关的易感基因,所述易感基因包括POLN,RAD54L,LRRC19,CAPN3,CEP152,EML2,ZNF135,ERCC2,TP63,MUTYH,BRCA1,GBA,ERBB4,FANCA,TP53,CHEK2,MPL,CDC73,MSH6,ABCB11,COL7A1,LZTR1,MST1R,MLH1,BCL2L12,BRD2,CLPTM1L,DLL3,HNRNPU,ITGB6、NIPAL1,NOTCH1,PRKDC,HLA-A,HLA-C,CDKN2B-AS1,ZFP57中的一个或几个的组合。
检测鼻咽癌相关基因中一个或几个的基因突变的试剂的应用,所述应用为在制备诊断/预防鼻咽癌的产品,或在解释鼻咽癌病因、个体鼻咽癌患病风险度评估,鼻咽癌高癌家系遗传咨询,提供临床治疗决策支持的产品的应用中的一种或几种,所述鼻咽癌相关基因为POLN,RAD54L,LRRC19,CAPN3,CEP152,EML2,ZNF135,ERCC2,TP63,MUTYH,BRCA1,GBA,ERBB4,FANCA,TP53,CHEK2,MPL,CDC73,MSH6,ABCB11,COL7A1,LZTR1,MST1R,MLH1,BCL2L12,BRD2,CLPTM1L,DLL3,HNRNPU,ITGB6、NIPAL1,NOTCH1,PRKDC,HLA-A,HLA-C,CDKN2B-AS1,ZFP57中的一个或几个的组合。
所述试剂用于检测基因突变的情况,包括各种能达到这一目的试剂。
优选地,所述相关基因为POLN,RAD54L,LRRC19,CAPN3,CEP152,EML2,ZNF135,ERCC2,TP63,MUTYH,BRCA1,GBA,ERBB4,FANCA,TP53,CHEK2,MPL,CDC73,MSH6,ABCB11,COL7A1,LZTR1,MST1R,MLH1,BCL2L12,BRD2,CLPTM1L,DLL3,HNRNPU,ITGB6、NIPAL1,NOTCH1,PRKDC,HLA-A,HLA-C,CDKN2B-AS1和ZFP57的组合。
更优选地,所述突变包括:与鼻咽癌发病相关的常见突变和罕见有害突变,
其中,所述常见突变为:rs402710、rs2747421、rs564398、A*11:01、A*02:07、C*01:02、C*03:02;
所述罕见有害突变为:在东亚人中,MAF<0.5%的罕见的突变,并且满足以下至少一种的突变:
在ClinVar数据库中对突变的致病性的注释为致病或可能致病的突变;
在InterVar数据库中对突变的致病性的注释为致病或可能致病的突变;
移码突变;
起始密码子丢失/获得突变;
终止密码子丢失/获得突变;
影响基因剪切的突变;
SIFT数据库预测为“damaging”的突变;
MutationTaster数据库预测为“damaging”的突变。
罕见有害突变对蛋白的功能可能具有重要影响。
所述常见突变的信息如下表所示:
优选地,所述罕见有害突变包括以下位点:
rs377642893,rs1206463301,rs146182235,rs371935755,rs28363218,9:26997984:C:T,rs1401668672,rs768472959,rs747062991,rs181427104,rs1557706222,rs34761954,rs752087698,9:26997927:T:A,9:26999686:CT:C,rs80338803,rs200379491,rs587780290,rs137967275,rs182018947,15:49081061:G:C,15:49089736:CA:C,19:46136147:GCT:G,rs1412934450,rs1276533174,rs770181520,19:58579293:C:CT,rs762687232,rs758882072,rs777483913,rs537376932,15:49060526:G:A,15:49076307:T:-,
rs763144679,rs753018650,rs776487884,rs762307622,rs587780088,rs773409311,rs364897,1:193218892:C:T,rs63750617,rs752043324,rs144311212,rs267599192,rs535202189,rs374718902,rs751535193,rs146407483,3:189456562:G:A,rs576449010,rs565094952,rs767906723,rs182657062,16:89816189:G:A,rs138729528,17:7579494:A:G,rs80357590,rs80358181,rs80357966,rs879254224,rs201392911,rs537616689,rs557601608,19:45856397:G:T,rs751318902,rs200895828,rs771182769,rs139884931,rs150000483,rs781431741,rs148677674,rs587780192,rs7648846411,
rs760669739,rs188076755,rs764843609,rs4986984,rs63751657,rs773053723,rs201024956,rs34350470,rs200626206,rs35924402,rs200046052,rs572130928,rs556842110,19:39989887:-:C,rs771347725,rs1199048959,rs201397773,19:50176987:G:C,rs763246446,rs200757776,rs778675391,5:1338049:-:A,rs530094595,9:139390923:C:A;
各位点的信息如下表所示:
本发明还要求保护一种鼻咽癌遗传风险评估的产品,含有所述的试剂。
优选地,所述产品为液相捕获芯片试剂盒,其含有所述的试剂为捕获探针,所述捕获探针为DNA探针,所述DNA探针具体信息如下表所示:
更优选地,所述DNA探针具体信息如下表所示:
本发明还要求保护一种鼻咽癌遗传风险评估***,含有样本DNA制备模块、突变位点检测模块、遗传风险评分计算模块和结果判定模块,
其中,(1)所述样本DNA制备模块用于样本DNA的提取,以获得样本DNA,样本包括但不限于全血、血凝块、血清、血浆、唾液、口咽拭子、鼻咽拭子、鼻咽镜取材样本、尿液、粪便等含有人体DNA的样本;
(2)所述突变位点检测模块用于确定样本DNA制备模块得到的样本DNA中所述基因的突变情况,并将得到的所述基因的突变情况的数据传输给遗传风险评分计算模块,
所述突变包含与鼻咽癌发病相关的常见突变和罕见有害突变:
其中,所述常见突变为:rs402710、rs2747421、rs564398、A*11:01、A*02:07、C*01:02、C*03:02;
所述罕见有害突变为东亚人中,MAF<0.5%的罕见的突变,并且满足以下至少一种的突变:
在ClinVar数据库中对突变的致病性的注释为致病或可能致病的突变;
在InterVar数据库中对突变的致病性的注释为致病或可能致病的突变;
移码突变;
起始密码子丢失/获得突变;
终止密码子丢失/获得突变;
影响基因剪切的突变;
SIFT数据库预测为“damaging”的突变;
MutationTaster数据库预测为“damaging”的突变;
所述常见突变的信息如下表所示:
(3)遗传风险评分计算模块,利用所述突变位点检测模块得到的基因的突变情况进行遗传风险评分的计算,并将得到的遗传风险评分的数据传输给结果判定模块,
遗传风险评分的计算公式为:PRSCR=1.0856×PRSC+2.5053×Gene_score1+0.6319×Gene_score2+0.7766×Gene_score3;
其中,
PRSC=(4.343E-05×rs402710基因型的评分)+(0.2901×rs2747421基因型的评分)+(0.8246×rs564398基因型的评分)+(0.6154×A*11:01基因型的评分)+
(1.4355×A*02:07基因型的评分)+(0.0233×C*01:02基因型的评分)+(1.1258×C*03:02基因型的评分),
其中,PRSC的评分赋值:不携带危险等位基因=“0”,携带一个危险等位基因=“1”,携带两个危险等位基因=“2”;
Gene_score1为个体携带POLN、RAD54L、LRRC19、CAPN3、CEP152、EML2和ZNF135,这7个基因中的任意一个存在有罕见有害突变,则赋分为1,7个基因中不存在任何罕见有害突变,则赋分为0;
Gene_score2为个体携带MST1R、MLH1、BCL2L12、BRD2、CLPTM1L、DLL3、HNRNPU、ITGB6、NIPAL1、NOTCH1换为PRKDC,这11个基因中的任意一个存在有罕见有害突变,则赋分为1,11个基因中不存在任何罕见有害突变,则赋分为0;
Gene_score3为个体携带ERCC2、TP63、MUTYH、BRCA1、GBA、ERBB4、FANCA、TP53、CHEK2、MPL、CDC73、MSH6、ABCB11、COL7A1和LZTR1,这15个基因中的任意一个存在有罕见有害突变,则赋分为1,15个基因中不存在任何罕见有害突变,则赋分为0。
(4)结果判定模块,用于根据PRSCR的结果进行判定,当PRSCR评分高于5.03时,个体的鼻咽癌终生累积发病风险平均为26.87%,判定该个体为鼻咽癌高遗传风险个体,当评分介于4.10和5.03之间时,个体的鼻咽癌终生累积发病风险平均为5.79%-9.10%,判定该个体为鼻咽癌中高遗传风险个体。
优选地,所述POLN、RAD54L、LRRC19、CAPN3、CEP152、EML2和ZNF135,这7个基因的罕见有害突变为rs377642893,rs1206463301,rs146182235,rs371935755,rs28363218,9:26997984:C:T,rs1401668672,rs768472959,rs747062991,rs181427104,rs1557706222,rs34761954,rs752087698,9:26997927:T:A,9:26999686:CT:C,rs80338803,rs200379491,rs587780290,rs137967275,rs182018947,15:49081061:G:C,15:49089736:CA:C,19:46136147:GCT:G,rs1412934450,rs1276533174,rs770181520,19:58579293:C:CT,rs762687232,rs758882072,rs777483913,rs537376932,15:49060526:G:A,15:49076307:T:-。
优选地,所述MST1R、MLH1、BCL2L12、BRD2、CLPTM1L、DLL3、HNRNPU、ITGB6、NIPAL1、NOTCH1、PRKDC,这11个基因的罕见有害突变为rs760669739,rs188076755,rs764843609,rs4986984,rs63751657,rs773053723,rs201024956,rs34350470,rs200626206,rs35924402,rs200046052,rs572130928,rs556842110,19:39989887:-:C,rs771347725,rs1199048959,rs201397773,19:50176987:G:C,rs763246446,rs200757776,rs778675391,5:1338049:-:A,rs530094595,9:139390923:C:A。
优选地,所述ERCC2、TP63、MUTYH、BRCA1、GBA、ERBB4、FANCA、TP53、CHEK2、MPL、CDC73、MSH6、ABCB11、COL7A1和LZTR1,这15个基因的罕见有害突变为rs763144679,rs753018650,rs776487884,rs762307622,rs587780088,rs773409311,rs364897,1:193218892:C:T,rs63750617,rs752043324,rs144311212,rs267599192,rs535202189,rs374718902,rs751535193,rs146407483,3:189456562:G:A,rs576449010,rs565094952,rs767906723,rs182657062,16:89816189:G:A,rs138729528,17:7579494:A:G,rs80357590,rs80358181,rs80357966,rs879254224,rs201392911,rs537616689,rs557601608,19:45856397:G:T,rs751318902,rs200895828,rs771182769,rs139884931,rs150000483,rs781431741,rs148677674,rs587780192,rs764884641。
优选地,所述突变位点检测模块包括建库测序子模块和测序数据处理子模块,
其中,建库测序子模块用于对样本DNA制备模块得到的DNA进行建库测序,并将数据传输给测序数据处理子模块;
所述测序数据处理子模块,用于测序数据的处理,并确定中所述的常见突变及罕见有害突变的位点变异情况,并将数据传输给遗传风险评分计算模块。
更优选地,建库测序子模块利用液相捕获进行建库测序。
作为一个具体的实施方式,本发明给出具体的鼻咽癌遗传风险评估方法:
(1)对采集的样本提取基因组DNA,其中,样本包括但不限于全血、血凝块、血清、血浆、唾液、口咽拭子、鼻咽拭子、鼻咽镜取材样本、尿液、粪便等含有人体DNA的样本;
(2)对提取的基因组DNA进行文库构建,具体步骤如下:
①将基因组DNA进行片段化;
②对片段化DNA进行末端修复和添加碱基A;
③连接测序接头,进行产物纯化和PCR扩增;
④扩增后进行产物纯化富集;
⑤对富集后的产物进行目标区域杂交捕获;
⑥进行捕获文库洗脱,对产物进行PCR扩增,对扩增文库进行纯化;
⑦进行文库质检;
其中,37个基因772个捕获区域,具体DNA探针信息如下:
其中,捕获区域包括37个基因:POLN,RAD54L,LRRC19,CAPN3,CEP152,EML2,ZNF135,ERCC2,TP63,MUTYH,BRCA1,GBA,ERBB4,FANCA,TP53,CHEK2,MPL,CDC73,MSH6,ABCB11,COL7A1,LZTR1,MST1R,MLH1,BCL2L12,BRD2,CLPTM1L,DLL3,HNRNPU,ITGB6、NIPAL1,NOTCH1,PRKDC,HLA-A,HLA-C,CDKN2B-AS1,ZFP57。
(3)对构建好的文库进行二代测序;
(4)对测序数据进行分析,对捕获检测得到的测序数据与hg19参考基因组进行比对,利用GATK进行突变检测,得到突变,进一步得到鼻咽癌相关基因的突变,包括:与鼻咽癌发病相关的常见突变和罕见有害突变,
其中,所述常见突变为:rs402710、rs2747421、rs564398、A*11:01、A*02:07、C*01:02、C*03:02,具体信息如下:
罕见有害突变为:在东亚人中,MAF<0.5%的罕见的突变,并且满足以下至少一种的突变:
在ClinVar数据库中对突变的致病性的注释为致病或可能致病的突变;
在InterVar数据库中对突变的致病性的注释为致病或可能致病的突变;
移码突变;
起始密码子丢失/获得突变;
终止密码子丢失/获得突变;
影响基因剪切的突变;
SIFT数据库预测为“damaging”的突变;
MutationTaster数据库预测为“damaging”的突变;
(4)遗传风险评分PRSCR
统计以上罕见有害突变和常见突变的情况,并通过以下风险评分公式计算家族性鼻咽癌的遗传风险评分(PRSCR):
PRSCR=1.0856×PRSC+2.5053×Gene_score1+0.6319×Gene_score2+0.7766×Gene_score3;
其中,
PRSC=(4.343E-05×rs402710基因型的评分)+(0.2901×rs2747421基因型的评分)+(0.8246×rs564398基因型的评分)+(0.6154×A*11:01基因型的评分)+
(1.4355×A*02:07基因型的评分)+(0.0233×C*01:02基因型的评分)+(1.1258×C*03:02基因型的评分);
对于PRSC,7个常见突变的基因型评分赋值:不携带危险等位基因=“0”,携带一个危险等位基因=“1”,携带两个危险等位基因=“2”;
Gene_score1为个体携带7个新发现的鼻咽癌易感基因(POLN、RAD54L、LRRC19、CAPN3、CEP152、EML2和ZNF135)的罕见有害突变评分,7个基因中任意一个存在有罕见有害突变,则赋分为1,7个基因中不存在任何罕见有害突变,则赋分为0;
Gene_score2为个体携带11鼻咽癌易感基因(MST1R、MLH1、BCL2L12、BRD2、CLPTM1L、DLL3、HNRNPU、ITGB6、NIPAL1、NOTCH1、PRKDC)的罕见有害突变评分,11个基因中任意一个存在罕见有害突变,则赋分为1,11个基因中不存在任何罕见有害突变,则赋分为0;
Gene_score3为个体是否携带15个肿瘤易感基因(ERCC2、TP63、MUTYH、BRCA1、GBA、ERBB4、FANCA、TP53、CHEK2、MPL、CDC73、MSH6、ABCB11、COL7A1和LZTR1)的罕见有害突变评分,15个基因中任意一个存在罕见有害突变,则赋分为1,15个基因中不存在任何罕见有害突变,则赋分为0,
(5)高危个体判定:根据计算出的鼻咽癌的遗传风险评分,当评分高于5.03时,个体的鼻咽癌终生累积发病风险平均为26.87%,判定该个体为鼻咽癌高遗传风险个体,当评分介于4.10和5.03之间时,个体的鼻咽癌终生累积发病风险平均为5.79%-9.10%,判定该个体为鼻咽癌中高遗传风险个体。
作为另一个具体的实施方式,本发明给出具体的鼻咽癌遗传风险评估方法:
(1)对采集的样本提取基因组DNA,其中,样本包括但不限于全血、血凝块、血清、血浆、唾液、口咽拭子、鼻咽拭子、鼻咽镜取材样本、尿液、粪便等含有人体DNA的样本;
(2)对提取的基因组DNA进行文库构建,具体步骤如下:
①将基因组DNA进行片段化;
②对片段化DNA进行末端修复和添加碱基A;
③连接测序接头,进行产物纯化和PCR扩增;
④扩增后进行产物纯化富集;
⑤对富集后的产物进行目标区域杂交捕获;
⑥进行捕获文库洗脱,对产物进行PCR扩增,对扩增文库进行纯化;
⑦进行文库质检;
其中,103个捕获区域,具体DNA探针信息如下:
(3)对构建好的文库进行二代测序;
(4)对测序数据进行分析,与hg19参考基因组进行比对,利用GATK进行突变检测,得到以下位点的基因型检测结果:
组(1):rs377642893,rs1206463301,rs146182235,rs371935755,rs28363218,9:26997984:C:T,rs1401668672,rs768472959,rs747062991,rs181427104,rs1557706222,rs34761954,rs752087698,9:26997927:T:A,9:26999686:CT:C,rs80338803,rs200379491,rs587780290,rs137967275,rs182018947,15:49081061:G:C,15:49089736:CA:C,19:46136147:GCT:G,rs1412934450,rs1276533174,rs770181520,19:58579293:C:CT,rs762687232,rs758882072,rs777483913,rs537376932,15:49060526:G:A,15:49076307:T:-;
组(2):rs763144679,rs753018650,rs776487884,rs762307622,rs587780088,rs773409311,rs364897,1:193218892:C:T,rs63750617,rs752043324,rs144311212,rs267599192,rs535202189,rs374718902,rs751535193,rs146407483,3:189456562:G:A,rs576449010,rs565094952,rs767906723,rs182657062,16:89816189:G:A,rs138729528,17:7579494:A:G,rs80357590,rs80358181,rs80357966,rs879254224,rs201392911,rs537616689,rs557601608,19:45856397:G:T,rs751318902,rs200895828,rs771182769,rs139884931,rs150000483,rs781431741,rs148677674,rs587780192,rs764884641;
组(3):rs760669739,rs188076755,rs764843609,rs4986984,rs63751657,rs773053723,rs201024956,rs34350470,rs200626206,rs35924402,rs200046052,rs572130928,rs556842110,19:39989887:-:C,rs771347725,rs1199048959,rs201397773,19:50176987:G:C,rs763246446,rs200757776,rs778675391,5:1338049:-:A,rs530094595,9:139390923:C:A;
组(4):rs402710、rs2747421、rs564398、A*11:01、A*02:07、C*01:02、C*03:02。
(5)进行遗传风险评分:
通过以下风险评分公式计算家族性鼻咽癌的遗传风险评分(PRSCR):PRSCR=1.0856×PRSC+2.5053×Gene_score1+0.6319×Gene_score 2+0.7766×Gene_score3;
其中,PRSC=(4.343E-05×rs402710基因型的评分)+(0.2901×rs2747421基因型的评分)+(0.8246×rs564398基因型的评分)+(0.6154×A*11:01基因型的评分)+(1.4355×A*02:07基因型的评分)+(0.0233×C*01:02基因型的评分)+(1.1258×C*03:02基因型的评分);这七个的基因型评分赋值:不携带危险等位基因=“0”,携带一个危险等位基因=“1”,携带两个危险等位基因=“2”;
Gene_score1为个体携带7个新发现的鼻咽癌易感基因(POLN、RAD54L、LRRC19、CAPN3、CEP152、EML2和ZNF135)的罕见有害突变(组1)评分,7个基因中任意一个存在有罕见有害突变,则赋分为1,7个基因中不存在任何罕见有害突变,则赋分为0;
Gene_score2为个体携带11个鼻咽癌易感基因(MST1R、MLH1、BCL2L12、BRD2、CLPTM1L、DLL3、HNRNPU、ITGB6、NIPAL1、NOTCH1、PRKDC)的罕见有害突变(组3)评分,11个基因中任意一个存在罕见有害突变,则赋分为1,11个基因中不存在任何罕见有害突变,则赋分为0;
Gene_score3为个体是否携带15个肿瘤易感基因(ERCC2、TP63、MUTYH、BRCA1、GBA、ERBB4、FANCA、TP53、CHEK2、MPL、CDC73、MSH6、ABCB11、COL7A1和LZTR1)的罕见有害突变(组2)评分,15个基因中任意一个存在有罕见有害突变,则赋分为1,15个基因中不存在任何罕见有害突变,则赋分为0;
各位点汇总信息如下:
(6)高危个体判定:根据计算出的鼻咽癌的遗传风险评分,当评分高于5.03时,个体的鼻咽癌终生累积发病风险平均为26.87%,判定该个体为鼻咽癌高遗传风险个体,当评分介于4.10和5.03之间时,个体的鼻咽癌终生累积发病风险平均为5.79%-9.10%,判定该个体为鼻咽癌中高遗传风险个体。
本发明基于鼻咽癌高发家系研究队列开展的全外显子组关联研究,通过原创性的、全面、***的研究识别家族性鼻咽癌相关易感基因及其罕见有害突变,发现新的易感基因。另一方面,通过联合肿瘤相关及鼻咽癌相关易感基因的罕见有害突变,以及鼻咽癌相关常见突变,构建了更加综合、全面的遗传模型,有效提升了遗传风险评估模型的高危个体识别能力。本发明可提供更好的鼻咽癌发病风险分层,为鼻咽癌个性化预防、化学干预及药物筛选等开辟了新的途径。
与现有技术相比,本发明具有以下有益效果:
(1)鼻咽癌家族史是鼻咽癌重要的危险因素,具有鼻咽癌家族史的人群是鼻咽癌高发区亟需防控的关键人群,但是目前尚无针对该人群的有效风险评估工具。仅根据家族史进行遗传风险评估极为不准确,本发明可以弥补该领域的空白,根据个体携带易感基因的情况,对有鼻咽癌家族史的人群进行个体遗传风险预测,并为个体提供精准地筛查和预防建议。
(2)本发明是基于目前国际上最大规模的家族性鼻咽癌研究队列开展的全外显子组组关联研究结果,纳入了多个基于该研究新发现的重要鼻咽癌易感基因上的罕见有害突变,相比于既往基于常见突变构建的鼻咽癌多基因遗传风险模型,具有更好的高危人群识别能力。
(3)本发明基于遗传位点的鼻咽癌多基因遗传风险得分模型,是一种新型的分子生物标志物,区别于传统来源于血浆的游离核酸如cfDNA,miRNA等分子生物标志物,多基因遗传风险得分是基于个体天生的遗传信息,终生只需检测一次,可在任意年龄进行检测,具有终生稳定、易于检测等优点。
附图说明
图1POLN突变位点在家系中的携带情况及Sanger测序结果;(A)携带POLN p.P577L突变的家系系谱图。(B)携带p.P577L野生型的健康亲属sanger测序结果;(C)携带p.P577L杂合突变型的患者sanger测序结果;(D)三个有害突变的sanger验证结果
图2POLN罕见有害突变对POLN蛋白表达及其在鼻咽癌抑癌基因功能的影响;(A)POLN的三维结构及三个罕见有害突变所在的位置;(B)POLN三个氨基酸突变前后与其他氨基酸或者DNA结合距离的变化;(C)HK1 EBV+和CNE2 EBV+细胞系中野生型及突变型POLN蛋白降解速率检测结果;(D)HK1 EBV+和CNE2 EBV+细胞系中野生型及突变型POLN蛋白表达量检测结果;(E)正常鼻咽组织和鼻咽癌组织中POLN的mRNA表达情况;(F)正常鼻咽组织和鼻咽癌组织中POLN的蛋白表达情况;(G)野生型及突变型POLN对细胞增殖能力的影响。
图3六个新的鼻咽癌易感基因在病例和健康对照人群中的携带情况(A)六个新的鼻咽癌易感基因在家族性鼻咽癌患者中以及在健康对照中的总体携带频率;(B)-(G)六个新的易感基因上突变位点的携带情况。
图4为实施例2位点验证的Sanger测序结果。
图5肿瘤相关基因在家族性鼻咽癌病例和健康对照人群中的携带情况;(A)15个肿瘤相关基因在家族性鼻咽癌患者中以及在健康对照中的总体携带频率;(B)-(E)四个频率最高的肿瘤相关基因上突变位点的携带情况。
图6遗传评分PRSCR各个分位数的个体鼻咽癌的发病风险估计;(A)遗传评分PRSCR位于各个分位数的个体鼻咽癌相对发病风险(B)男性个体遗传评分PRSCR位于各个分位数的个体鼻咽癌终生累积发病风险(C)女性个体遗传评分PRSCR位于各个分位数的个体鼻咽癌终生累积发病风险。
具体实施方式
下面结合说明书附图及具体实施例对本发明作出进一步地详细阐述,所述实施例只用于解释本发明,并非用于限定本发明的范围。下述实施例中所使用的试验方法如无特殊说明,均为常规方法;所使用的材料、试剂等,如无特殊说明,为可从商业途径得到的试剂和材料。
以下实施例中的样本,包括但不限于全血、血凝块、血清、血浆、唾液、口咽拭子、鼻咽拭子、鼻咽镜取材样本、尿液、粪便等含有人体DNA的样本,DNA提取均按常规方法操作,使用Qiagen DNA midi kit(100)试剂盒或类似产品,提取样中的DNA。用分光光度计定量,琼脂糖凝胶电泳质检,基因组DNA电泳条带通常不小于20kb。质检合格的DNA将浓度调整到50ng/μl,转移至384孔板,-80℃储存备用。
实施例1全外显子组建库测序共分离分析挖掘鼻咽癌高发家系中POLN基因的罕见有害突变
一、全外显子组建库测序挖掘鼻咽癌高发家系中POLN基因的突变的挖掘
(一)、实验样本
为鉴定鼻咽癌遗传易感基因,收集了来自13个鼻咽癌高发家系的35例鼻咽癌患者和34例健康一级亲属的外周血或唾液标本。
(二)、实验方法
1、建立统一标准的鼻咽癌高发家系、家族性鼻咽癌先证者及健康对照标本库及数据库
***收集完整的人口学资料、鼻咽癌家族史信息及临床资料,以标准操作程序采集符合标准的外周血或唾液,建立统一标准的标本库及数据库。
2、DNA提取及全外显子组建库测序
(1)外周血、唾液或口咽拭子来源的DNA提取
对35例鼻咽癌患者和34例健康一级亲属的标本进行DNA提取。
(2)全外显子组建库测序
①DNA片段化:将基因组DNA超声打断至150~300bp的DNA片段;
②末端修复及接头链接:对DNA片段进行末端修复及测序接头链接;对产物进行纯化并定量;
③产物富集与捕获:将纯化产物进行PCR扩增,富集纯化得到的DNA利用Agilent全外显子组捕获探针进行杂交捕获;
④目标区域富集:将捕获产物进行洗脱,再进行PCR扩增,添加标签并质控;
⑤上机测序:将通过质控的待测产物进行二代测序。
3、罕见突变位点的检测、注释及筛选
(1)突变位点检测
将下机序列文件进行过滤质控,质控后的序列利用bwa比对到参考基因组(hg19),利用picard标记重复序列,利用GATK进行比对校正及碱基得分校正,利用GATKHaplotypeCaller进行SNP和indel检测,保留高质量的突变位点。
(2)罕见有害突变的注释及筛选
采用基于显性遗传模式的“突变-表型”共分离分析策略,即只关注在同一家庭中所有患者均携带但是其健康亲属不携带的突变,筛选和疾病共分离的罕见突变;采用ClinVar,InterVar,SIFT,MutationTaster数据库注释这些突变对基因功能的潜在影响。
(三)、实验结果
发现POLN基因(Gene ID:353497,Ensembl:ENSG00000130997,DNA PolymeraseNu,编码DNA聚合酶,参与DNA的复制和损伤修复)上的罕见有害突变rs146182235(c.C1730T,p.P577L,简写为p.P577L)在鼻咽癌家系中与家族性鼻咽癌表型共分离,初步筛选POLN作为新的鼻咽癌易感基因(图1A-C)。
二、sanger测序挖掘鼻咽癌高发家系中POLN基因的突变
(一)、实验样本
对另外的351例家族性鼻咽癌患者的外周血、唾液或口咽拭子样本,进行POLN基因突变的检测。
(二)、实验方法
(1)外周血、唾液或口咽拭子等来源的DNA提取
对另外的351例家族性鼻咽癌患者的样本提取DNA。
(2)引物设计参考人类基因组序列数据库hg19,覆盖POLN所有外显子及外显子-内含子交界区域的sanger测序引物如下:
针对POLN exon1和exon 2:
5’-CTCAGCTCCACCCCATAGTC-3’和5’-AGGCTAGGCAGCCTCTCTTC-3’;
针对POLN exon3:
5’-TGGATGATTGATGCCTATTTTC-3’和5’-GAGCTGGGCTTCATCTGTCT-3’;
针对POLN exon4:
5’-TTCAGTGTTTAGTTAACTGTGTGACTT-3’和5’-AGAGCAAGAACGCCTCTTTT-3’;
针对POLN exon5:
5’-TGAAGATTGTGTCTCCATATTACC-3’和5’-GCTCTCCTATCAAAATCTGACAC-3’;
针对POLN exon6:
5’-GCCTTTTCTCTTTCTCTCTGC-3’和5’-GACCTTGAGCAAGTTTCCATT-3’;
针对POLN exon7:
5’-TTTAGTGAATGTGTGTATGTGCTATC-3’和5’-CCCATTCATAGGAGGAGTCA-3’;
针对POLN exon8:
5’-CGTTTGAACTTAAGAACTTTGTCA-3’和5’-GAAATGCCAAGGTCACAACTA-3’;
针对POLN exon9:
5’-TCAGTTACAGACTGTGGTGAGC-3’和5’-GGTGCCAATGAAAAGACATC-3’;
针对POLN exon10和11:
5’-GGCTTTTCAACAAAATGCAG-3’和5’-TGCCACTGGGAACAACTATC-3’;
针对POLN exon12和13:
5’-CCCATCTCGCTGTTGAGAAT-3’和5’-GGTCTGAAGGTCAGCACACA-3’;
针对POLN exon14:
5’-CTTTCTCCAGATGAAAATACGTG-3’和5’-AGAACACTGGGAGGGCTACT-3’;
针对POLN exon15:
5’-AGTATTCACTGAGCCTGTGGC-3’和5’-CACGTGATCAGGGAAGGCTG-3’;
针对POLN exon16:
5’-TGGAAGTTTAGGGCCAGCAG-3’,5’-AAAGTGCACAGGCAAACACA-3’;
针对POLN exon17:
5’-CACACAGGCTAGAGTCAAAAGG-3’和5’-GTGATCGCACAAATGCACTC-3’;
针对POLN exon18:
5’-AACAAAGTGAGACCCCCATC-3’,5’-GCCACAAAAGCGAGACTCTT-3’;
针对POLN exon19:
5’-TCCCCATTTCATTTCTCACC-3’和5’-GCCTTATGAAAGTAGCCTTGGA-3’;
针对POLN exon20:
5’-GGTGTGTGGTTGGACTGTCT-3’和5’-TTTAAACACAGGCACACAGC-3’;
针对POLN exon21:
5’-CACAGTCACGGCTGGTGT-3’和5’-ATCCTCCCACAGAGGGTTG-3’;
针对POLN exon22和23:
5’-CACTTGCCCCCATGATAGAC-3’和5’-CCCGATAAGCAGAGATGGTG-3’;
针对POLN exon24:
5’-CTCTGCATGCACCCCTGA-3’和5’-GAAGACAGCTGAGGGGCTTT-3’;
针对POLN exon25和26:
5’-AGTGGACACAGGAAACAAGG-3’和5’-GTCAGAGCTGGTGGCTTCT-3’。
(3)PCR扩增
PCR扩增产物进行1%琼脂糖凝胶电泳,对目的片段切胶回收纯化后进行sanger测序。PCR反应体系见表1,PCR反应条件见表2。
表1PCR反应体系
组分 | 用量 |
模板DNA | 20~500ng |
上游引物 | 0.5μl |
下游引物 | 0.5μl |
2×高保真DNA聚合酶MIX | 10μl |
水 | 补齐至20μl |
表2PCR反应条件
(三)、实验结果
在351例家族性鼻咽癌患者中,发现POLN基因还存在另外两个罕见有害突变:rs377642893(c.G908A,p.R303Q,简写为p.R303Q)和rs1206463301(c.T1634G,p.F545C,简写为p.F545C)。
因此,在以上家族性鼻咽癌中,一共发现了3例鼻咽癌患者携带了POLN的罕见有害突变,sanger测序验证情况典型示例如图1D,这三名家族性鼻咽癌患者分别携带了POLN-p.P577L,-p.R303Q和-p.F545C罕见有害突变的杂合子。
三、Taqman探针分型技术鉴定POLN基因的罕见有害突变
(一)、实验样本
进一步,在另外的212例家族性鼻咽癌病例和3175例健康对照中对发现的POLN的3个罕见有害突变位点(POLN-p.P577L,-p.R303Q和-p.F545C)进行扩大样本验证。
(二)、实验方法
1、外周血、唾液或口咽拭子来源的DNA提取
对另外的212例家族性鼻咽癌病例和3175例健康对照的外周血或唾液标本进行DNA提取。
2、TaqMan探针法对单核苷酸多态位点进行基因分型
通过NCBI数据库检索突变位点上下游100bp的序列,英潍捷基公司根据提供的序列设计相应的扩增引物和荧光探针,突变所在序列详见下表3。每次实验均设置空白对照和阳性对照。
表3设计Tagman探针的序列
物理位置采用hg19参考基因组;“位点注释”采用ENSEMBL数据库进行,“致病性预测”采用ClinVar及InterVar数据库进行。
实验的反应体系和反应条件如下表4和表5所示:
表4反应体系:
成分 | 用量 |
模板DNA | 1~20ng(2μl) |
40×TaqMan SNP Genotyping Assays | 0.125μl |
2×TAQMAN UNIVERSAL MMIX II WITH UNG分型试剂 | 2.5μl |
水 | 补齐至5μl |
表5反应条件:
整体基因分型成功率超过99%,为了质量控制,部分样品被随机选择并重复进行基因分型,结果证实100%一致。
(三)实验结果:
在212例家族性鼻咽癌中检出一例p.P577L突变携带者(男性,发病年龄43岁,其父亲患鼻咽癌),另有1例健康对照者(男性,检查年龄59岁)携带p.R303Q突变。p.F545C突变在这些群体中未检测到。
综合前述三阶段共576例来自不同家庭的家族性鼻咽癌样本(包含来自13个家系的鼻咽癌先证者,351例进行sanger测序的家族性鼻咽癌,212例进行Taqman检测的家族性鼻咽癌),以及3175例健康对照进行分析,发现POLN的罕见有害突变在家族性鼻咽癌中突变频率为0.87%,而健康对照中仅为0.031%,校正后的OR=27.75(P=4.41×10-4),表明携带POLN的罕见有害突变者鼻咽癌发病风险显著升高。
四、蛋白结构预测及生物学实验验证POLN的罕见有害突变对鼻咽癌的影响
绝大多数的鼻咽癌细胞中携带EB病毒,为了研究POLN罕见有害突变对鼻咽癌易感性的影响,利用EB病毒阳性的鼻咽癌细胞系HK1(HK1-EBV+)和CNE2(CNE2EBV+)进行研究。
(一)罕见有害突变对POLN蛋白结构影响的预测
(1)实验方法
利用PyMOL软件对POLN三个位点(rs146182235、rs1206463301和rs377642893)突变前后POLN蛋白结构进行预测。
(2)实验结果
预测的结果如图2A和图2B所示,POLN蛋白577号氨基酸从P突变成L后(rs146182235位点,p.P577L),POLN蛋白与DNA的结合距离从变为/>结合能力减弱;同样的,POLN蛋白545号氨基酸从F突变成C后(rs1206463301,p.F545C),POLN蛋白与DNA的结合距离从/>变为/>结合能力减弱;POLN蛋白303号氨基酸R原本可与335号氨基酸结合,但是303号氨基酸从R突变成Q后(rs377642893,p.R303Q),无法与335号氨基酸结合,POLN蛋白的结构发生改变。
(二)罕见有害突变对POLN蛋白的影响
(1)实验方法
分别构建POLN野生型和上文得到的三种突变型(rs146182235、rs1206463301和rs377642893)的蛋白表达载体,通过瞬时转染分别导入HK1 EBV+和CNE2 EBV+细胞系。使用蛋白合成抑制剂放线菌酮(CHX)抑制新的POLN蛋白合成,已合成的蛋白含量则仅受到降解速率的影响,放线菌酮分别处理细胞0小时、2小时、4小时和8小时后收取蛋白,使用蛋白免疫印迹实验检测POLN蛋白的降解速率,根据POLN蛋白和内参蛋白α-Tubin的灰度比值计算不同时间点蛋白的相对表达量。
(2)实验结果
结果显示(图2C):POLN的罕见有害突变(rs146182235、rs1206463301和rs377642893)加快了POLN的降解,表明POLN的罕见有害突变(rs146182235、rs1206463301和rs377642893)损害了POLN蛋白稳定性。
(三)蛋白免疫印迹(Western Blot)法检测各组POLN蛋白表达水平
(1)实验方法
利用蛋白免疫印迹(Western Blot)法,使用POLN抗体检测野生型和三种突变型POLN(rs146182235、rs1206463301和rs377642893)总蛋白表达水平,使用HA标签抗体检测外源表达的POLN水平。
(2)实验结果
结果显示(图2D),POLN的罕见有害突变rs146182235、rs1206463301和rs377642893导致POLN蛋白表达下调。
上述结果表明POLN的罕见有害突变通过影响蛋白稳定性抑制了POLN蛋白表达。
(四)POLN在正常鼻咽组织和鼻咽癌组织中的表达情况
(1)实验方法
提取正常鼻咽组织和鼻咽癌组织的RNA,逆转录后使用POLN特异性引物:5’-AGTGGATTCTAAGACTTGGGGA-3和5’-GGACTGAGGAGACAGCTTGG-3’,利用qPCR检测POLN mRNA在正常鼻咽组织和鼻咽癌组织中的表达情况。
(2)实验结果
结果显示(图2E和图2F),POLN是鼻咽癌的抑癌基因,相比于正常鼻咽组织,它在鼻咽癌组织中低表达。
(五)CCK8细胞增殖实验
(1)实验方法
将分别过表达野生型和突变型POLN的CNE2 EBV+和HK1 EBV+细胞接种到96孔板中,每组1000个细胞/孔。每天在同一时间使用CCK8试剂检测细胞增殖情况,每孔细胞中加入100μl完全培养基和10μl CCK8试剂混匀,细胞培养箱中孵育2h后检测450nm处吸光度。
(2)实验结果
结果显示(图2G),野生型POLN能抑制鼻咽癌细胞增殖,而三个携带罕见有害突变(rs146182235、rs1206463301和rs377642893)的突变型POLN增殖抑制能力减弱,说明三个罕见有害突变影响了POLN发挥抑癌基因的功能。
实施例2全外显子组测序及基因关联分析发现6个新的家族性鼻咽癌遗传易感基因及其罕见有害突变
本实施例对鼻咽癌高发家系人群(包括家族性鼻咽癌先证者及未患病亲属)、普通健康人群进行全外显子组测序及关联分析。
一、与家族性鼻咽癌发病相关的基因挖掘
(一)、实验方法
1、建立统一标准的鼻咽癌高发家系、家族性鼻咽癌先证者及健康对照标本库及数据库
对502例家族性鼻咽癌患者、76例高发家系未患病亲属及328例健康对照,共906人,***收集完整的人口学资料、鼻咽癌家族史信息及临床资料,以标准操作程序采集符合标准的血液、唾液或口咽拭子样本,建立统一标准的标本库及数据库。
2、DNA提取及全外显子组建库测序
(1)外周血、唾液或口咽拭子来源的DNA提取
对502例家族性鼻咽癌患者、76例高发家系未患病亲属及328例健康对照的标本进行DNA提取。
(2)全外显子组建库测序
①DNA片段化:将基因组DNA超声打断至150-300bp的DNA片段;
②末端修复及接头链接:对DNA片段进行末端修复及测序接头链接;对产物进行纯化并定量;
③产物富集与捕获:将纯化产物进行PCR扩增,富集纯化得到的DNA利用Agilent全外显子组捕获探针进行杂交捕获;
④目标区域富集:将捕获产物进行洗脱,再进行PCR扩增,添加标签并质控;
⑤上机测序:将通过质控的待测产物进行二代测序。
3.突变位点的检测、注释及筛选
(1)突变位点检测
将下机序列文件进行过滤质控,质控后的序列利用bwa比对到参考基因组(hg19),利用picard标记重复序列,利用GATK进行比对校正及碱基得分校正,利用GATKHaplotypeCaller进行SNP和indel检测,保留高质量的突变位点。
(2)突变位点注释及筛选
利用Annovar和VEP软件对突变位点进行注释。首先,对突变的人群频率进行注释,过滤保留东亚人MAF<0.5%的罕见的突变;其次,利用ClinVar及InterVar数据库对突变的致病性进行注释,利用refGene数据库对突变对基因功能的影响进行注释,利用SIFT和MutationTaster数据库进行有害性预测;最终,保留在东亚人群罕见(MAF<0.5%)并且满足以下任意一个条件的有害突变:
①在ClinVar数据库中对突变的致病性的注释为致病或可能致病的突变;
②在InterVar数据库中对突变的致病性的注释为致病或可能致病的突变;
③移码突变;
④起始密码子丢失/获得突变;
⑤终止密码子丢失/获得突变;
⑥影响基因剪切的突变;
⑦SIFT数据库预测为“damaging”的突变;
⑧MutationTaster数据库预测为“damaging”的突变;
通过这些注释及筛选,最终得到了基因上的罕见有害突变。
进一步对上述得到的具有罕见有害突变,以基因为单位进行分组,再利用STAAR软件,以基因为单位进行疾病表型(即是否患病)与基因突变的关联分析,寻找于家族性鼻咽癌发病相关的易感基因,校正个体的性别、年龄,以及前三个主成分的信息。
(二)、实验结果
关联分析后得到了6个PSTAAR-O小于0.05的基因,该P值是通过综合六个不同参数的STAAR-S,STAAR-B,STAAR-A检验得到的,具体结果如下表6所示:
表6:以基因为单位的关联分析结果
这些基因上包含的所有罕见有害突变如表7和图3所示:
表7:6个新发现易感基因的罕见有害突变位点
物理位置采用hg19参考基因组;“位点注释”采用ENSEMBL数据库进行,“致病性预测”采用ClinVar及InterVar数据库进行。
二、利用Sanger测序对发现的位点进行验证
(一)、实验方法
1、引物设计
参考人类基因组序列数据库hg19,覆盖待测位点的sanger测序引物如表8所示,
表8各位点sanger测序引物:
(2)PCR扩增
随机从上述进行全外显子组测序的样本中抽取20例样本,利用以上(表8)引物进行PCR扩增(PCR反应体系见表9,PCR反应条件见表10),PCR扩增产物进行1%琼脂糖凝胶电泳,对目的片段切胶回收纯化后进行sanger测序。
表9:PCR反应体系
组分 | 用量 |
模板DNA | 20~500ng |
上游引物 | 0.5μl |
下游引物 | 0.5μl |
2×高保真DNA聚合酶MIX | 10μl |
水 | 补齐至20μl |
表10:PCR反应条件
(二)、实验结果
验证情况结果如图4所示(部分),通过Sanger测序发现,鼻咽癌高发家系患者确实携带了易感基因上的罕见有害突变。
实施例3新发现的6个易感基因的罕见有害突变在其他鼻咽癌病例中的验证
一、实验方法
利用数据库中已发表的鼻咽癌全外显子组测序数据(Accession ID:SRA291701、SRP035573、SRA288429、PRJEB12830、HRA000052和HRA000053,共涉及到269个样本)进一步对实施例2发现的6个基因(RAD54L[Gene ID:8438,Ensembl:ENSG00000085999]、LRRC19[Gene ID:64922,Ensembl:ENSG00000184434]、CAPN3[Gene ID:825,Ensembl:ENSG00000092529]、CEP152[Gene ID:22995,Ensembl:ENSG00000103995]、EML2[Gene ID:24139,Ensembl:ENSG00000125746]和ZNF135[Gene ID:7694,Ensembl:ENSG00000176293])进行验证,具体实验方法如下:
1、6个新的易感基因的突变检测
将序列文件进行过滤质控,质控后的序列利用bwa比对到参考基因组(hg19),利用picard标记重复序列,利用GATK进行比对校正及碱基得分校正,利用GATKHaplotypeCaller进行SNP和indel检测,保留高质量的样本(269例)及突变位点。对突变所在的基因区域进行注释,筛选位于6个新的易感基因的突变进行下一步分析。
2、突变位点的注释及筛选
采用与实施例2的方法进行突变位点注释及筛选,利用Annovar和VEP软件对突变位点进行注释突变。通过一系列的注释及过滤,得到了具有重要影响的罕见有害突变。
二、实验结果
经过注释及过滤,在269例鼻咽癌患者中发现了8个位于6个易感基因的具有重要影响的罕见突变,如表11所示:
表11在269例鼻咽癌患者中发现的8个罕见有害突变
物理位置采用hg19参考基因组;“位点注释”采用ENSEMBL数据库进行,“致病性预测”采用ClinVar及InterVar数据库进行。
这些发现说明,实施例2发现的6个新的鼻咽癌易感基因在本实施例的鼻咽癌样本中也存在罕见有害突变。
实施例4鼻咽癌发病相关及其他肿瘤发病相关易感基因及其罕见有害突变与家族性鼻咽癌的关系
一、实验方法
另外关注了11个与鼻咽癌发病相关的基因和15个遗传性肿瘤发病相关的易感基因(涉及15种肿瘤),基因的列表如表12所示。对实施例2所述样本(包括502例家族性鼻咽癌患者,76例高发家系未患病亲属及328例健康对照)在这26个基因中携带的突变进行筛选,筛选的方法同实施例2中“突变位点注释及筛选”。
表12 11个与鼻咽癌发病相关基因及15个遗传性肿瘤发病相关的易感基因列表
(二)、实验结果
在实施例2所述样本(包括502例家族性鼻咽癌患者,76例高发家系未患病亲属及328例健康对照)中,这15个肿瘤易感基因上的突变如表13和图5所示。在502例家族性鼻咽癌患者中,这15个基因突变的携带率为7.17%,而在未患病的对照中,这15个基因突变的携带率为2.78%。
结果表明,携带15个遗传性肿瘤发病相关易感基因的个体,其鼻咽癌遗传风险是不携带者的2.18倍(95%CI:1.11~4.25,p=0.02)。
表13 15个肿瘤易感基因上的突变信息
物理位置采用hg19参考基因组;“位点注释”采用ENSEMBL数据库进行,“致病性预测”采用ClinVar及InterVar数据库进行。
同样的,在实施例2所述样本(包括502例家族性鼻咽癌患者,76例高发家系未患病亲属及328例健康对照)中,检测到11个与鼻咽癌发病相关的基因上的突变如下表14所示。在502例家族性鼻咽癌患者中,这11个基因突变的携带率为7.17%,而在未患病的对照中,这11个基因突变的携带率为4.21%,结果表明,携带11个鼻咽癌易感基因的个体,其患病风险是不携带者的1.76倍(95%CI:0.94~3.29,P=0.08)。
表14:11个鼻咽癌易感基因上的突变信息
物理位置采用hg19参考基因组;“位点注释”采用ENSEMBL数据库进行,“致病性预测”采用ClinVar及InterVar数据库进行。
实施例5常见突变与家族性鼻咽癌发病风险的相关性
(一)、实验方法
对实施例2中的502例家族性鼻咽癌,76例高发家系未患病亲属及328例健康对照中,采用广义线性混合模型进行关联分析:
从GWAS catalog数据库中获取与鼻咽癌发病高度相关的常见突变位点(SNP),这些突变位点人群频率较高。从1000genome数据库中获取与这些位点高度连锁,并且在全外显子组测序集中检测到的位点(SNP)。另外,在全外显子组测序集中提取与家族性鼻咽癌发病相关的HLA等位基因,联合上述提取的SNP位点,进行关联分析。
(二)、实验结果
校正性别年龄及主成分进行关联分析,得到的结果如表15所示:
表15:七个常见突变的关联分析结果
实施例6常见突变及罕见突变联合的家族性鼻咽癌发病风险评分模型
一、实验方法
对实施例2中的502例家族性鼻咽癌,76例高发家系未患病亲属及328例健康对照中,根据亲缘关系系数提取无亲缘关系的独立样本,共计787例,将这些样本随机分为训练集(N=394)和验证集(N=393)。
联合实施例1~3中的7个新发现的鼻咽癌易感基因中的罕见有害突变,实施例4中的与鼻咽癌发病相关的11个基因和15个肿瘤发病相关的易感基因的罕见有害突变,以及实施例5得到的与家族性鼻咽癌发病相关的常见突变,构建综合的遗传风险评分(PRSCR)。
得到优化的常见突变及罕见突变联合的家族性鼻咽癌遗传风险评分(PRSCR)如下:
PRSCR=1.0856×PRSC+2.5053×Gene_score1+0.6319×Gene_score2+0.7766×Gene_score3,
其中,PRSC为采用多元回归方法,利用实施例5中所得的常见突变构建的评分:
PRSC=(4.343E-05×rs402710基因型的评分)+(0.2901×rs2747421基因型的评分)+(0.8246×rs564398基因型的评分)+(0.6154×A*11:01基因型的评分)+(1.4355×A*02:07基因型的评分)+(0.0233×C*01:02基因型的评分)+(1.1258×C*03:02基因型的评分),
其中,PRSC的评分赋值:不携带危险等位基因=“0”,携带一个危险等位基因=“1”,携带两个危险等位基因=“2”;
Gene_score1为个体是否携带7个新发现的易感基因(POLN,RAD54L,LRRC19,CAPN3,CEP152,EML2,ZNF135)中的任一罕见有害突变,携带任意一个则该变量为1,非携带者该变量为0;Gene_score2为个体是否携带鼻咽癌发病相关的11个基因(MST1R、MLH1、BCL2L12、BRD2、CLPTM1L、DLL3、HNRNPU、ITGB6、NIPAL1、NOTCH1、PRKDC)中任一罕见有害突变,携带者该变量为1,非携带者该变量为0;Gene_score3为个体是否携带其他15个肿瘤发病相关的易感基因(ERCC2、TP63、MUTYH、BRCA1、GBA、ERBB4、FANCA、TP53、CHEK2、MPL、CDC73、MSH6、ABCB11、COL7A1和LZTR1)中任一罕见有害突变,携带者该变量为1,非携带者该变量为0。
进一步,利用PRSCR对训练集样本(N=394)和验证集样本(N=393)进行鼻咽癌风险评估。
对验证集样本估算出来的各个分组的鼻咽癌相对风险,利用“iCARE”方法进行人群累积发病风险的映射,估计出个体鼻咽癌终生累积发病率。其中,男性和女性的年龄别鼻咽癌发病率来源于IARC《五大洲癌症发病率研究》第十一卷(http://ci5.iarc.fr/CI5.×I/Pages/age.specific.curves_sel.asp)。
二、实验结果
利用logistic回归分析,得到家族性鼻咽癌遗传风险联合评分(PRSCR)在训练集样本(N=394)中分位数效应如表16所示,结果显示,在训练集中,联合评分PRSCR在75%分位数到90%分位数的个体,其患病风险显著高于评分位于最低25%分位数个体,相对风险为8.94倍,联合评分PRSCR在90%分位数到95%分位数的个体,其患病风险显著高于评分位于最低25%分位数个体,相对风险为15.6倍,联合评分PRSCR在最高5%分位数的个体,其患病风险显著高于评分位于最低25%分位数个体,相对风险为27.3倍,提示联合评分PRSCR在训练集中可以较好识别鼻咽癌高风险人群。
表16:PRSCR在训练集中的百分位数效应
PRSCR百分位数 | 对照例数 | 病例例数 | OR(95%CI) | p |
P0-P25 | 39(9.65%) | 10(1.99%) | ref | - |
P25-P50 | 45(11.14%) | 19(3.78%) | 1.65(0.68-3.96) | 2.65E-01 |
P50-P75 | 42(10.4%) | 50(9.96%) | 4.64(2.07-10.4) | 1.92E-04 |
P75-P90 | 24(5.94%) | 55(10.96%) | 8.94(3.84-20.79) | 3.67E-07 |
P90-P95 | 6(1.49%) | 24(4.78%) | 15.6(5.03-48.42) | 2.00E-06 |
P95-P100 | 10(2.48%) | 70(13.94%) | 27.3(10.45-71.3) | 1.47E-11 |
接下来,在验证集样本(N=393)中对联合评分模型进行验证,利用logistic回归分析,得到家族性鼻咽癌遗传风险联合评分(PRSCR)在验证集样本中分位数效应如表17和图6所示。结果显示,在验证集中,联合评分PRSCR在75%分位数到90%分位数的个体,其患病风险显著高于评分位于最低25%分位数个体,相对风险为6.19倍,联合评分PRSCR在90%分位数到95%分位数的个体,其患病风险显著高于评分位于最低25%分位数个体,相对风险为6.97倍,联合评分PRSCR在最高5%分位数的个体,其患病风险显著高于评分位于最低25%分位数个体,相对风险为21.3倍,提示联合评分的鼻咽癌高危个体识别能力在验证集中得到了很好的验证。
表17:常见突变及罕见突变联合评分PRSCR在验证集中的百分位数效应
PRSCR百分位数 | 对照例数 | 病例例数 | OR(95%CI) | p |
P0-P25 | 38(9.41%) | 12(2.39%) | ref | - |
P25-P50 | 44(10.89%) | 29(5.78%) | 2.09(0.94-4.65) | 7.17E-02 |
P50-P75 | 41(10.15%) | 47(9.36%) | 3.63(1.68-7.86) | 1.07E-03 |
P75-P90 | 22(5.45%) | 43(8.57%) | 6.19(2.7-14.16) | 1.59E-05 |
P90-P95 | 10(2.48%) | 22(4.38%) | 6.97(2.59-18.75) | 1.21E-04 |
P95-P100 | 11(2.72%) | 74(14.74%) | 21.3(8.6-52.76) | 3.81E-11 |
根据上述联合评分在验证集中的百分比效应,估计出个体鼻咽癌终生累积发病率,结果如图6和表18所示,结果显示,联合评分处于最低25%分位数的男性,其终生累积鼻咽癌发病风险只有0.81%,而对于联合评分处于75%-90%,以及90%-95%的男性,其终生累积鼻咽癌发病风险分别为5.79%和9.10%,而对于联合评分处于最高5%的男性,其终生累积鼻咽癌发病风险达到26.87%。基于上述估计,将评分处于4.10-5.03的个体(终生累积发病率平均为5.79%-9.10%),定义为鼻咽癌发病风险中高危个体,将评分大于5.03的个体(终生累积发病率平均为26.87%),定义为鼻咽癌发病风险高危个体。在女性中,我们也观察到相似的趋势(图6)。
表18:不同评分的个体鼻咽癌终生累积发病率
综上结果,联合常见突变及罕见突变构建的家族性鼻咽癌遗传风险评分,具备家族性鼻咽癌发病高危个体识别的效能。
实施例7一种鼻咽癌易感基因检测及遗传风险评估的方法
S1.样本DNA提取;
采集测试者全血、血凝块、血清、血浆、唾液、口咽拭子、鼻咽拭子、鼻咽镜取材样本、尿液或粪便等含有人体DNA的样本,按常规方法操作。
具体地,使用Qiagen DNA midi kit(100)试剂盒,提取样中的DNA。用分光光度计定量,琼脂糖凝胶电泳质检,基因组DNA电泳条带通常不小于20kb。质检合格的DNA将浓度调整到50ng/μl,转移至384孔板,-80℃储存备用。
S2.液相捕获及建库测序:
具体地,使用超声法将样本DNA片段化,片段化的DNA使用End Repair&A-TailingEnzyme进行末端修复和加A,随后连接测序接头。对连接产物进行纯化和PCR扩增。对扩增产物进行纯化和质检。使用纳昂达试剂盒Hybrid Capture Reagents和通用封阻序列/>NanoBlockers(for />),按照说明书要求进行文库和目标区域探针的杂交捕获,捕获后进行文库洗脱,对捕获产物进行PCR扩增,利用NadPrep SP Beads试剂盒提供的磁珠进行文库纯化,利用Qubit进行文库定量质检。对质量合格的文库产物,利用Illumina Novaseq平台进行二代测序,捕获的DNA探针如下表19,
表19:37个基因103个捕获区域(即DNA探针信息)
S3.测序数据的处理:
将S2得到的测序数据与hg19参考基因组进行比对,利用GATK进行突变检测,得到表20所列位点的基因分型。
表20:37个基因检测的突变位点信息
S4.遗传风险评分PRSCR
统计相关基因存在的罕见有害突变和常见突变的情况,并通过以下风险评分公式计算家族性鼻咽癌的遗传风险评分(PRSCR):
PRSCR=1.0856×PRSC+2.5053×Gene_score1+0.6319×Gene_score2+0.7766×Gene_score3;
其中,
PRSC=(4.343E-05×rs402710基因型的评分)+(0.2901×rs2747421基因型的评分)+(0.8246×rs564398基因型的评分)+(0.6154×A*11:01基因型的评分)+(1.4355×A*02:07基因型的评分)+(0.0233×C*01:02基因型的评分)+(1.1258×C*03:02基因型的评分);
对于PRSC,7个常见突变的基因型评分赋值:不携带危险等位基因=“0”,携带一个危险等位基因=“1”,携带两个风险等位基因=“2”;
Gene_score1为个体携带7个新发现的鼻咽癌易感基因(POLN、RAD54L、LRRC19、CAPN3、CEP152、EML2和ZNF135)的罕见有害突变评分,7个基因中任意一个存在有罕见有害突变,则赋分为1,7个基因中不存在任何罕见有害突变,则赋分为0;
Gene_score2为个体携带11鼻咽癌易感基因(MST1R、MLH1、BCL2L12、BRD2、CLPTM1L、DLL3、HNRNPU、ITGB6、NIPAL1、NOTCH1、PRKDC)的罕见有害突变评分,11个基因中任意一个存在罕见有害突变,则赋分为1,11个基因中不存在任何罕见有害突变,则赋分为0;
Gene_score3为个体是否携带15个肿瘤易感基因(ERCC2、TP63、MUTYH、BRCA1、GBA、ERBB4、FANCA、TP53、CHEK2、MPL、CDC73、MSH6、ABCB11、COL7A1和LZTR1)的罕见有害突变评分,15个基因中任意一个存在罕见有害突变,则赋分为1,15个基因中不存在任何罕见有害突变,则赋分为0,
以上所有突变的详细信息见表20。
S5.结果判定
根据计算出的家族性鼻咽癌的遗传风险评分,当PRSCR评分高于5.03时,个体的鼻咽癌终生累积发病风险平均为26.87%,判定该个体为鼻咽癌高遗传风险个体,当评分介于4.10和5.03之间时,个体的鼻咽癌终生累积发病风险平均为5.79%-9.10%,判定该个体为鼻咽癌中高遗传风险个体。
实施例8一种鼻咽癌易感基因检测及遗传风险评估的方法
S1.样本DNA提取;
同实施例7;
S2.液相捕获及建库测序:
同实施例7,仅捕获区域不同,捕获的DNA探针如下表21。
表21:37个基因772个捕获区域的DNA探针
其中,捕获区域包括37个基因:POLN,RAD54L,LRRC19,CAPN3,CEP152,EML2,ZNF135,ERCC2,TP63,MUTYH,BRCA1,GBA,ERBB4,FANCA,TP53,CHEK2,MPL,CDC73,MSH6,ABCB11,COL7A1,LZTR1,MST1R,MLH1,BCL2L12,BRD2,CLPTM1L,DLL3,HNRNPU,ITGB6、NIPAL1,NOTCH1,PRKDC,HLA-A,HLA-C,CDKN2B-AS1,ZFP57。
S3.测序数据的处理:
将S2得到的测序数据与hg19参考基因组进行比对,利用GATK进行突变检测,得到突变,进一步得到鼻咽癌相关基因的突变,包括:与鼻咽癌发病相关的常见突变和罕见有害突变,
其中,所述常见突变为:rs402710、rs2747421、rs564398、A*11:01、A*02:07、C*01:02、C*03:02,具体信息见表22;
表22:常见突变的信息
罕见有害突变为:在东亚人中,MAF<0.5%的罕见的突变,并且满足以下至少一种的突变:
在ClinVar数据库中对突变的致病性的注释为致病或可能致病的突变;
在InterVar数据库中对突变的致病性的注释为致病或可能致病的突变;
移码突变;
起始密码子丢失/获得突变;
终止密码子丢失/获得突变;
影响基因剪切的突变;
SIFT数据库预测为“damaging”的突变;
MutationTaster数据库预测为“damaging”的突变;
S4.遗传风险评分PRSCR
统计相关基因存在的罕见有害突变和常见突变的情况,并通过以下风险评分公式计算家族性鼻咽癌的遗传风险评分(PRSCR):
PRSCR=1.0856×PRSC+2.5053×Gene_score1+0.6319×Gene_score2+0.7766×Gene_score3;
其中,
PRSC=(4.343E-05×rs402710基因型的评分)+(0.2901×rs2747421基因型的评分)+(0.8246×rs564398基因型的评分)+(0.6154×A*11:01基因型的评分)+(1.4355×A*02:07基因型的评分)+(0.0233×C*01:02基因型的评分)+(1.1258×C*03:02基因型的评分);
对于PRSC,7个常见突变的基因型评分赋值:不携带危险等位基因=“0”,携带一个危险等位基因=“1”,携带两个危险等位基因=“2”;
Gene_score1为个体携带7个新发现的鼻咽癌易感基因(POLN、RAD54L、LRRC19、CAPN3、CEP152、EML2和ZNF135)的罕见有害突变评分,7个基因中任意一个存在有罕见有害突变,则赋分为1,7个基因中不存在任何罕见有害突变,则赋分为0;
Gene_score2为个体携带11鼻咽癌易感基因(MST1R、MLH1、BCL2L12、BRD2、CLPTM1L、DLL3、HNRNPU、ITGB6、NIPAL1、NOTCH1、PRKDC)的罕见有害突变评分,11个基因中任意一个存在罕见有害突变,则赋分为1,11个基因中不存在任何罕见有害突变,则赋分为0;
Gene_score3为个体是否携带15个肿瘤易感基因(ERCC2、TP63、MUTYH、BRCA1、GBA、ERBB4、FANCA、TP53、CHEK2、MPL、CDC73、MSH6、ABCB11、COL7A1和LZTR1)的罕见有害突变评分,15个基因中任意一个存在罕见有害突变,则赋分为1,15个基因中不存在任何罕见有害突变,则赋分为0,
S5.结果判定
根据计算出的家族性鼻咽癌的遗传风险评分,当PRSCR评分高于5.03时,个体的鼻咽癌终生累积发病风险平均为26.87%,判定该个体为鼻咽癌高遗传风险个体,当评分介于4.10和5.03之间时,个体的鼻咽癌终生累积发病风险平均为5.79%-9.10%,判定该个体为鼻咽癌中高遗传风险个体。
实施例9一种评估鼻咽癌遗传风险的液相捕获芯片试剂盒
本发明所述的试剂盒包括:检测人基因组37个基因外显子及其外显子-内含子交界区的液相捕获芯片其用于捕获的DNA探针,所述的37个基因为:POLN,RAD54L,LRRC19,CAPN3,CEP152,EML2,ZNF135,ERCC2,TP63,MUTYH,BRCA1,GBA,ERBB4,FANCA,TP53,CHEK2,MPL,CDC73,MSH6,ABCB11,COL7A1,LZTR1,MST1R,MLH1,BCL2L12,BRD2,CLPTM1L,DLL3,HNRNPU,ITGB6、NIPAL1,NOTCH1,PRKDC,HLA-A,HLA-C,CDKN2B-AS1,ZFP57,其捕获区域(即DNA探针)信息如21所示。
(一)试剂盒的制备
1.捕获探针的设计和合成
使用纳昂达XCapert在线探针设计云平台进行液相杂交捕获探针设计,对候选区域采用1×探针覆盖,对于存在长度大于6bp的indel,进行探针加密。使用化学合成法合成表21中的DNA探针并进行质检。
2.试剂盒的构建
试剂盒的其他成分还包括:片段化DNA末端修复&加A试剂,接头连接试剂和适用于Illumina平台的双端唯一样本标签(Unique Dual Indexe,UDI)接头,连接产物纯化试剂,PCR扩增试剂,文库纯化试剂,文库杂交试剂捕获试剂。
(二)检测方法
1.DNA提取
使用Qiagen DNA midi kit(100)试剂盒,提取样中的DNA。用分光光度计定量,琼脂糖凝胶电泳质检,基因组DNA电泳条带通常不小于20kb。质检合格的DNA将浓度调整到50ng/μl,转移至384孔板,-80℃储存备用。
2.文库构建及二代测序
使用DNA通用型文库构建试剂盒(for/>)根据说明书进行文库构建。具体地,使用超声法将样本DNA片段化,片段化的DNA使用End Repair&A-TailingEnzyme进行末端修复和加A,随后连接测序接头。对连接产物进行纯化和PCR扩增,并对扩增产物进行纯化和质检。
使用纳昂达试剂盒Hybrid Capture Reagents和通用封阻序列/>NanoBlockers(for/>),按照说明书要求进行文库和表21中的DNA探针的杂交捕获,捕获后进行文库洗脱,对捕获产物进行PCR扩增,利用NadPrep SP Beads试剂盒提供的磁珠进行文库纯化,利用Qubit进行文库定量质检。
对质量合格的文库产物,利用Illumina Novaseq平台进行二代测序。
3.位点检测
得到的测序数据与hg19参考基因组进行比对,利用GATK进行突变检测,对表20所列位点进行基因分型。
4.鼻咽癌遗传风险评估
同实施例8。
实施例10评估鼻咽癌遗传风险的液相捕获芯片试剂盒的应用
使用实施例9的预测家族性鼻咽癌发病风险的液相捕获芯片试剂盒,对在5名家族性鼻咽癌患者样本提取的DNA进行捕获及建库测序,得到的每个样本平均数据量为0.5G,可以看到,样本的Q30平均为:93.88%,比对率=97.37%,中靶率=84.32%,候选区域覆盖度100%,数据质量良好。数据质量具体结果如下表23所示:
表23:试剂盒在5个测试样本的数据质量
利用实施例8所述的鼻咽癌易感基因检测及遗传风险评估方法,首先对测序数据进行处理,包括将测序下机数据与hg19参考基因组进行比对,利用GATK进行对表21所列覆盖区域进行突变检测,对得到所有位点进行注释。筛选常见突变:rs402710、rs2747421、rs564398、A*11:01、A*02:07、C*01:02、C*03:02的基因分型结果;根据实施例8所述的规则筛选罕见有害变异。统计相关基因存在的罕见有害突变和常见突变的情况,并通过实施例8的风险评分公式计算家族性鼻咽癌的遗传风险评分(PRSCR),根据计算出的家族性鼻咽癌的遗传风险评分进行风险判定。评分结果显示,这5名家族性鼻咽癌患者的评分高于人群95%分位数5.03,判定这五个个体为鼻咽癌高危个体。
实施例11一种评估鼻咽癌遗传风险的液相捕获芯片试剂盒
本发明所述的试剂盒包括液相捕获芯片其用于捕获的DNA探针如表19:
(一)试剂盒的制备
1.捕获探针的设计和合成
同实施例10
2.试剂盒的构建
同实施例10。
(二)检测方法
同实施例10,将DNA探针换为表19中的DNA探针。
实施例12一种鼻咽癌遗传风险评估***
含有依次连接的样本DNA制备模块、液相捕获及建库测序模块、测序数据的处理模块、家族性鼻咽癌的遗传风险评分计算模块和结果判定模块;
其中,
(1)样本DNA制备模块:对采集的全血、血凝块、血清、血浆、唾液、口咽拭子、鼻咽拭子、鼻咽镜取材样本、尿液或粪便等含有人体DNA的样本提取DNA;
(2)液相捕获及建库测序模块:用于样本DNA制备模块得到的DNA,进行液相捕获及建库测序(捕获区域即DNA探针,信息如表21所示),并将测序数据传输给测序数据的处理模块,其中测序的目标区域包括37个基因:POLN,RAD54L,LRRC19,CAPN3,CEP152,EML2,ZNF135,ERCC2,TP63,MUTYH,BRCA1,GBA,ERBB4,FANCA,TP53,CHEK2,MPL,CDC73,MSH6,ABCB11,COL7A1,LZTR1,MST1R,MLH1,BCL2L12,BRD2,CLPTM1L,DLL3,HNRNPU,ITGB6、NIPAL1,NOTCH1,PRKDC,HLA-A,HLA-C,CDKN2B-AS1,ZFP57;
(3)测序数据的处理模块:对液相捕获及建库测序模块获得数据的数据进行处理,
对获得的数据与参考基因组hg19进行比对,利用GATK进行突变检测,进一步得到鼻咽癌相关基因的突变,包括:与鼻咽癌发病相关的常见突变和罕见有害突变,其中,所述常见突变为:rs402710、rs2747421、rs564398、A*11:01、A*02:07、C*01:02、C*03:02,具体信息见表22;
罕见有害突变为:在东亚人中,MAF<0.5%的罕见的突变,并且满足以下至少一种的突变:
在ClinVar数据库中对突变的致病性的注释为致病或可能致病的突变,
在InterVar数据库中对突变的致病性的注释为致病或可能致病的突变,
移码突变,
起始密码子丢失/获得突变,
终止密码子丢失/获得突变,
影响基因剪切的突变,
SIFT数据库预测为“damaging”的突变,
MutationTaster数据库预测为“damaging”的突变,
将基因分型结果输送至家族性鼻咽癌的遗传风险评分计算模块;
(4)家族性鼻咽癌的遗传风险评分计算模块:根据37个基因存在的常见突变及罕见有害突变的情况,通过以下风险评分公式计算家族性鼻咽癌的遗传风险评分:
PRSCR=1.0856×PRSC+2.5053×Gene_score1+0.6319×Gene_score2+0.7766×Gene_score3;
其中,
PRSC=(4.343E-05×rs402710基因型的评分)+(0.2901×rs2747421基因型的评分)+(0.8246×rs564398基因型的评分)+(0.6154×A*11:01基因型的评分)+(1.4355×A*02:07基因型的评分)+(0.0233×C*01:02基因型的评分)+(1.1258×C*03:02基因型的评分)
其中,7个常见突变的基因型评分赋值:不携带危险等位基因=“0”,携带一个危险等位基因=“1”,携带两个危险等位基因=“2”。
进一步,对于PRSCR,Gene_score1为个体携带7个新发现的鼻咽癌易感基因(POLN、RAD54L、LRRC19、CAPN3、CEP152、EML2和ZNF135)的罕见有害突变评分,7个基因中任意一个存在罕见有害突变,则赋分为1,7个基因中不存在任何罕见有害突变,则赋分为0;
Gene_score2为个体携带11个鼻咽癌易感基因(MST1R、MLH1、BCL2L12、BRD2、CLPTM1L、DLL3、HNRNPU、ITGB6、NIPAL1、NOTCH1、PRKDC)的罕见有害突变评分,11个基因中任意一个存在有罕见有害突变,则赋分为1,11个基因中不存在任何罕见有害突变,则赋分为0;
Gene_score3为个体是否携带15个肿瘤易感基因(ERCC2、TP63、MUTYH、BRCA1、GBA、ERBB4、FANCA、TP53、CHEK2、MPL、CDC73、MSH6、ABCB11、COL7A1和LZTR1)的罕见有害突变评分,15个基因中任意一个存在有罕见有害突变,则赋分为1,15个基因中不存在任何罕见有害突变,则赋分为0。
将得到的遗传风险评分(PRSCR)结果输出到结果输出显示模块。
(5)结果输出显示模块:根据计算出的家族性鼻咽癌的遗传风险评分,当评分高于5.03时,个体的鼻咽癌终生累积发病风险平均为26.87%,判定该个体为鼻咽癌高遗传风险个体,当评分介于4.10和5.03之间时,个体的鼻咽癌终生累积发病风险平均为5.79%-9.10%,判定该个体为鼻咽癌中高遗传风险个体。
实施例13一种鼻咽癌遗传风险评估***
含有依次连接的样本DNA制备模块、液相捕获及建库测序模块、测序数据的处理模块、家族性鼻咽癌的遗传风险评分计算模块和结果判定模块;
其中,
(1)样本DNA制备模块:对采集的全血、血凝块、血清、血浆、唾液、口咽拭子、鼻咽拭子、鼻咽镜取材样本、尿液、粪便等含有人体DNA的样本提取DNA;
(2)液相捕获及建库测序模块:同实施例12,仅仅捕获区域即DNA探针不同,信息如表19。
(3)测序数据的处理模块:对液相捕获及建库测序模块获得数据的数据进行处理,对获得的数据与参考基因组hg19进行比对,利用GATK进行突变检测,得到表20中突变位点的基因分型,将基因分型结果输送至家族性鼻咽癌的遗传风险评分计算模块;
(4)家族性鼻咽癌的遗传风险评分计算模块:根据各相关基因存在常见突变及罕见有害突变的情况,通过以下风险评分公式计算家族性鼻咽癌的遗传风险评分:
PRSCR=1.0856×PRSC+2.5053×Gene_score1+0.6319×Gene_score2+0.7766×Gene_score3;
其中,
PRSC=(4.343E-05×rs402710基因型的评分)+(0.2901×rs2747421基因型的评分)+(0.8246×rs564398基因型的评分)+(0.6154×A*11:01基因型的评分)+(1.4355×A*02:07基因型的评分)+(0.0233×C*01:02基因型的评分)+(1.1258×C*03:02基因型的评分)
其中,7个常见突变的基因型评分赋值:不携带危险等位基因=“0”,携带一个危险等位基因=“1”,携带两个危险等位基因=“2”。
Gene_score1为个体携带7个新发现的鼻咽癌易感基因(POLN、RAD54L、LRRC19、CAPN3、CEP152、EML2和ZNF135)的罕见有害突变评分,7个基因中任意一个存在罕见有害突变,则赋分为1,7个基因中不存在任何罕见有害突变,则赋分为0;
Gene_score2为个体携带11个鼻咽癌易感基因(MST1R、MLH1、BCL2L12、BRD2、CLPTM1L、DLL3、HNRNPU、ITGB6、NIPAL1、NOTCH1、PRKDC)的罕见有害突变评分,11个基因中任意一个存在有罕见有害突变,则赋分为1,11个基因中不存在任何罕见有害突变,则赋分为0;
Gene_score3为个体是否携带15个肿瘤易感基因(ERCC2、TP63、MUTYH、BRCA1、GBA、ERBB4、FANCA、TP53、CHEK2、MPL、CDC73、MSH6、ABCB11、COL7A1和LZTR1)的罕见有害突变评分,15个基因中任意一个存在有罕见有害突变,则赋分为1,15个基因中不存在任何罕见有害突变,则赋分为0,
将得到的遗传风险评分(PRSCR)结果输出到结果输出显示模块。
(5)结果输出显示模块:根据计算出的家族性鼻咽癌的遗传风险评分,当评分高于5.03时,个体的鼻咽癌终生累积发病风险平均为26.87%,判定该个体为鼻咽癌高遗传风险个体,当评分介于4.10和5.03之间时,个体的鼻咽癌终生累积发病风险平均为5.79%-9.10%,判定该个体为鼻咽癌中高遗传风险个体。
最后所应当说明的是,以上实施例仅用以说明本发明的技术方案而非对本发明保护范围的限制,对于本领域的普通技术人员来说,在上述说明及思路的基础上还可以做出其它不同形式的变化或变动,这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。
Claims (10)
1.检测鼻咽癌相关基因中一个或几个的基因突变的试剂的应用,其特征在于,所述应用为在制备诊断/预防鼻咽癌的产品,或在解释鼻咽癌病因、个体鼻咽癌患病风险度评估,鼻咽癌高癌家系遗传咨询,提供临床治疗决策支持的产品的应用中的一种或几种,所述鼻咽癌相关基因为POLN,RAD54L,LRRC19,CAPN3,CEP152,EML2,ZNF135,ERCC2,TP63,MUTYH,BRCA1,GBA,ERBB4,FANCA,TP53,CHEK2,MPL,CDC73,MSH6,ABCB11,COL7A1,LZTR1,MST1R,MLH1,BCL2L12,BRD2,CLPTM1L,DLL3,HNRNPU,ITGB6、NIPAL1,NOTCH1,PRKDC,HLA-A,HLA-C,CDKN2B-AS1,ZFP57中的一个或几个的组合。
2.根据权利要求1所述的应用,其特征在于,所述相关基因为POLN,RAD54L,LRRC19,CAPN3,CEP152,EML2,ZNF135,ERCC2,TP63,MUTYH,BRCA1,GBA,ERBB4,FANCA,TP53,CHEK2,MPL,CDC73,MSH6,ABCB11,COL7A1,LZTR1,MST1R,MLH1,BCL2L12,BRD2,CLPTM1L,DLL3,HNRNPU,ITGB6、NIPAL1,NOTCH1,PRKDC,HLA-A,HLA-C,CDKN2B-AS1和ZFP57的组合。
3.根据权利要求1所述的应用,其特征在于,所述突变包括:与鼻咽癌发病相关的常见突变和罕见有害突变,
其中,所述常见突变为:rs402710、rs2747421、rs564398、A*11:01、A*02:07、C*01:02、C*03:02;
所述罕见有害突变为:在东亚人中,MAF<0.5%的罕见的突变,并且满足以下至少一种的突变:
在ClinVar数据库中对突变的致病性的注释为致病或可能致病的突变;
在InterVar数据库中对突变的致病性的注释为致病或可能致病的突变;
移码突变;
起始密码子丢失/获得突变;
终止密码子丢失/获得突变;
影响基因剪切的突变;
SIFT数据库预测为“damaging”的突变;
MutationTaster数据库预测为“damaging”的突变;
所述常见突变的信息如下表所示:
4.根据权利要求1所述的应用,其特征在于,所述罕见有害突变包括以下位点:
rs377642893,rs1206463301,rs146182235,rs371935755,rs28363218,9:26997984:C:T,rs1401668672,rs768472959,rs747062991,rs181427104,rs1557706222,rs34761954,rs752087698,9:26997927:T:A,9:26999686:CT:C,rs80338803,rs200379491,rs587780290,rs137967275,rs182018947,15:49081061:G:C,15:49089736:CA:C,19:46136147:GCT:G,rs1412934450,rs1276533174,rs770181520,19:58579293:C:CT,rs762687232,rs758882072,rs777483913,rs537376932,15:49060526:G:A,15:49076307:T:-,rs763144679,rs753018650,rs776487884,rs762307622,rs587780088,rs773409311,rs364897,1:193218892:C:T,rs63750617,rs752043324,rs144311212,rs267599192,rs535202189,rs374718902,rs751535193,rs146407483,3:189456562:G:A,rs576449010,rs565094952,rs767906723,rs182657062,16:89816189:G:A,rs138729528,17:7579494:A:G,rs80357590,rs80358181,rs80357966,rs879254224,rs201392911,rs537616689,rs557601608,19:45856397:G:T,rs751318902,rs200895828,rs771182769,rs139884931,rs150000483,rs781431741,rs148677674,rs587780192,rs764884641,rs760669739,rs188076755,rs764843609,rs4986984,rs63751657,rs773053723,rs201024956,rs34350470,rs200626206,rs35924402,rs200046052,rs572130928,rs556842110,19:39989887:-:C,rs771347725,rs1199048959,rs201397773,19:50176987:G:C,rs763246446,rs200757776,rs778675391,5:1338049:-:A,rs530094595,9:139390923:C:A;
各位点的信息如下表所示:
5.一种鼻咽癌遗传风险评估的产品,其特征在于,含有权利要求1所述的试剂。
6.一种鼻咽癌遗传风险评估***,其特征在于,含有样本DNA制备模块、突变位点检测模块、遗传风险评分计算模块和结果判定模块,
其中,(1)所述样本DNA制备模块用于样本DNA的提取,以获得样本DNA;
(2)所述突变位点检测模块用于确定样本DNA制备模块得到的样本DNA中,权利要求1中所述基因的突变情况,并将得到的所述基因的突变情况的数据传输给遗传风险评分计算模块,
所述突变包含与鼻咽癌发病相关的常见突变和罕见有害突变:
其中,所述常见突变为:rs402710、rs2747421、rs564398、A*11:01、A*02:07、C*01:02、C*03:02;
所述罕见有害突变为东亚人中,MAF<0.5%的罕见的突变,并且满足以下至少一种的突变:
在ClinVar数据库中对突变的致病性的注释为致病或可能致病的突变;
在InterVar数据库中对突变的致病性的注释为致病或可能致病的突变;
移码突变;
起始密码子丢失/获得突变;
终止密码子丢失/获得突变;
影响基因剪切的突变;
SIFT数据库预测为“damaging”的突变;
MutationTaster数据库预测为“damaging”的突变;
所述常见突变的信息如下表所示:
(3)遗传风险评分计算模块,利用所述突变位点检测模块得到的基因的突变情况进行遗传风险评分的计算,并将得到的遗传风险评分的数据传输给结果判定模块,
遗传风险评分的计算公式为:PRSCR=1.0856×PRSC+2.5053×Gene_score1+0.6319×Gene_score2+0.7766×Gene_score3;
其中,
PRSC=(4.343E-05×rs402710基因型的评分)+(0.2901×rs2747421基因型的评分)+(0.8246×rs564398基因型的评分)+(0.6154×A*11:01基因型的评分)+(1.4355×A*02:07基因型的评分)+(0.0233×C*01:02基因型的评分)+(1.1258×C*03:02基因型的评分),
其中,PRSC的评分赋值:不携带危险等位基因=“0”,携带一个危险等位基因=“1”,携带两个危险等位基因=“2”;
Gene_score1为个体在POLN、RAD54L、LRRC19、CAPN3、CEP152、EML2和ZNF135,这7个基因中的任意一个存在有罕见有害突变,则赋分为1,这7个基因中不存在任何罕见有害突变,则赋分为0;
Gene_score2为个体在MST1R、MLH1、BCL2L12、BRD2、CLPTM1L、DLL3、HNRNPU、ITGB6、NIPAL1、NOTCH1、PRKDC,这11个基因中的任意一个存在有罕见有害突变,则赋分为1,这11个基因中不存在任何罕见有害突变,则赋分为0;
Gene_score3为个体携带ERCC2、TP63、MUTYH、BRCA1、GBA、ERBB4、FANCA、TP53、CHEK2、MPL、CDC73、MSH6、ABCB11、COL7A1和LZTR1,这15个基因中的任意一个存在有罕见有害突变,则赋分为1,这15个基因中不存在任何罕见有害突变,则赋分为0。
(4)结果判定模块,用于根据PRSCR的结果进行判定,当PRSCR评分高于5.03时,个体的鼻咽癌终生累积发病风险平均为26.87%,判定该个体为鼻咽癌高遗传风险个体,当评分介于4.10和5.03之间时,个体的鼻咽癌终生累积发病风险平均为5.79%-9.10%,判定该个体为鼻咽癌中高遗传风险个体。
7.根据权利要求6所述的鼻咽癌遗传风险评估***,其特征在于,所述POLN、RAD54L、LRRC19、CAPN3、CEP152、EML2和ZNF135,这7个基因罕见有害突变为rs377642893,rs1206463301,rs146182235,rs371935755,rs28363218,9:26997984:C:T,rs1401668672,rs768472959,rs747062991,rs181427104,rs1557706222,rs34761954,rs752087698,9:26997927:T:A,9:26999686:CT:C,rs80338803,rs200379491,rs587780290,rs137967275,rs182018947,15:49081061:G:C,15:49089736:CA:C,19:46136147:GCT:G,rs1412934450,rs1276533174,rs770181520,19:58579293:C:CT,rs762687232,rs758882072,rs777483913,rs537376932,15:49060526:G:A和15:49076307:T:-。
8.根据权利要求6所述的鼻咽癌遗传风险评估***,其特征在于,所述MST1R、MLH1、BCL2L12、BRD2、CLPTM1L、DLL3、HNRNPU、ITGB6、NIPAL1、NOTCH1、PRKDC,这11个基因的罕见有害突变为rs760669739,rs188076755,rs764843609,rs4986984,rs63751657,rs773053723,rs201024956,rs34350470,rs200626206,rs35924402,rs200046052,rs572130928,rs556842110,19:39989887:-:C,rs771347725,rs1199048959,rs201397773,19:50176987:G:C,rs763246446,rs200757776,rs778675391,5:1338049:-:A,rs530094595和9:139390923:C:A。
9.根据权利要求6所述的鼻咽癌遗传风险评估***,其特征在于,所述ERCC2、TP63、MUTYH、BRCA1、GBA、ERBB4、FANCA、TP53、CHEK2、MPL、CDC73、MSH6、ABCB11、COL7A1和LZTR1,这15个基因的罕见有害突变为rs763144679,rs753018650,rs776487884,rs762307622,rs587780088,rs773409311,rs364897,1:193218892:C:T,rs63750617,rs752043324,rs144311212,rs267599192,rs535202189,rs374718902,rs751535193,rs146407483,3:189456562:G:A,rs576449010,rs565094952,rs767906723,rs182657062,16:89816189:G:A,rs138729528,17:7579494:A:G,rs80357590,rs80358181,rs80357966,rs879254224,rs201392911,rs537616689,rs557601608,19:45856397:G:T,rs751318902,rs200895828,rs771182769,rs139884931,rs150000483,rs781431741,rs148677674,rs587780192和rs764884641。
10.根据权利要求6所述的鼻咽癌遗传风险评估***,其特征在于,所述变异位点检测模块包括建库测序子模块和测序数据处理子模块,
其中,建库测序子模块用于对样本DNA制备模块得到的DNA进行建库测序,并将数据传输给测序数据处理子模块;
所述测序数据处理子模块,用于测序数据的处理,并确定权利要求6中所述的常见突变及罕见有害突变的位点变异情况。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210989283.1A CN115873947A (zh) | 2022-08-17 | 2022-08-17 | 一种鼻咽癌遗传风险评估*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210989283.1A CN115873947A (zh) | 2022-08-17 | 2022-08-17 | 一种鼻咽癌遗传风险评估*** |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115873947A true CN115873947A (zh) | 2023-03-31 |
Family
ID=85769626
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210989283.1A Pending CN115873947A (zh) | 2022-08-17 | 2022-08-17 | 一种鼻咽癌遗传风险评估*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115873947A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117649948A (zh) * | 2024-01-29 | 2024-03-05 | 深圳市早知道科技有限公司 | 一种基于基因检测的微生物感染风险预测方法及*** |
-
2022
- 2022-08-17 CN CN202210989283.1A patent/CN115873947A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117649948A (zh) * | 2024-01-29 | 2024-03-05 | 深圳市早知道科技有限公司 | 一种基于基因检测的微生物感染风险预测方法及*** |
CN117649948B (zh) * | 2024-01-29 | 2024-05-10 | 深圳市早知道科技有限公司 | 一种基于基因检测的微生物感染风险预测方法及*** |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210222245A1 (en) | Autism associated genetic markers | |
US11549148B2 (en) | Neuroendocrine tumors | |
US9702011B2 (en) | Markers for breast cancer | |
US20150159220A1 (en) | Methods for predicting and detecting cancer risk | |
WO2016097120A1 (en) | Method for the prognosis of hepatocellular carcinoma | |
JPWO2008130008A1 (ja) | 緑内障発症リスクの判定方法 | |
WO2016109449A1 (en) | Methods of diagnosing autism spectrum disorders | |
US8712696B2 (en) | Methods of prognosing a rheumatoid arthritis remission phenotype | |
US9109257B2 (en) | Prognostic method | |
JP6181638B2 (ja) | 前立腺癌における転移のゲノム・シグネチャー | |
US9534256B2 (en) | Methods and compositions for correlating genetic markers with risk of aggressive prostate cancer | |
CN115873947A (zh) | 一种鼻咽癌遗传风险评估*** | |
US20220162710A1 (en) | Composition for diagnosis or prognosis prediction of glioma, and method for providing information related thereto | |
WO2017046714A1 (en) | Methylation signature in squamous cell carcinoma of head and neck (hnscc) and applications thereof | |
CN111593108B (zh) | 与噪声性听力下降发生相关的7q36.3区域的多态性的检测方法、试剂盒及其应用 | |
US20090092987A1 (en) | Polymorphic Nucleic Acids Associated With Colorectal Cancer And Uses Thereof | |
KR20230037111A (ko) | 대사증후군 특이적 후성유전 메틸화 마커 및 이의 용도 | |
Stenzel | Genome-wide Approaches to Identifying the Etiologies of Complex Diseases: Applications in Colorectal Cancer and Congenital Heart Disease. | |
JP2008141961A (ja) | 第10番染色体長腕領域における2型糖尿病感受性遺伝子 | |
WO2006048275A2 (en) | Chronic lymphocytic leukemia expression profiling |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |