基因突变体及其应用
优先权信息
本申请请求2013年6月10日向中国国家知识产权局提交的、专利申请号为201310270648.6的专利申请的优先权和权益,并且通过参照将其全文并入此处。
技术领域
本发明涉及基因突变体及其应用。具体地,本发明涉及分离的核酸、分离的多肽、筛选易感锥杆营养不良症的生物样品的方法、筛选易感锥杆营养不良症的生物样品的***、用于筛选易感锥杆营养不良症的生物样品的试剂盒、构建体以及重组细胞。
背景技术
锥杆营养不良(CORD)是指一系列主要是锥细胞参与的遗传性视网膜疾病。视杆细胞减少的情况可能同时发生,或后期发生。CORD患者通常会有视觉灵敏度降低,畏光,色觉异常的症状。
CORD可以以常染色体显性(adCORD),常染色体隐性(arCORD),或者X连锁(xlCORD)方式遗传。目前为止至少有25个基因被报道与不同遗传方式的CORD相关,涉及较多致病突变,但仍存在着相当一部分未知致病基因位点。
因而,目前对锥杆营养不良症的研究仍有待深入。
发明内容
本发明旨在至少解决现有技术中存在的技术问题之一。为此,本发明的一个目的在于提出一种能够有效筛选易感锥杆营养不良症的生物样品的方法。
本发明是基于发明人的下列工作而完成的:发明人通过高通量外显子组测序联合候选基因突变验证的方法确定了锥杆营养不良症的致病基因上的新突变。
根据本发明的第一方面,本发明提出了一种分离的核酸。根据本发明的实施例,与野生型ABCA4基因相比,所述核酸具有c.4604dup突变;或者与野生型CNGB3基因相比,所述核酸具有选自下列的至少一种突变:c.1774dup、c.129+1G>A和c.1957G>A;或者与野生型PDE6C基因相比,所述核酸具有选自下列的至少一种突变:c.1935+1del、c.2518+5G>C和c.1004+1G>A;或者与野生型RPGRIP1基因相比,所述核酸具有c.2592T>G突变;或者与野生型CACNA1F基因相比,所述核酸具有c.2542G>A突变。根据本发明的实施例,发明人确定了ABCA4、CNGB3、PDE6C、RPGRIP1和CACNA1F基因突变体,这些新突变体与锥杆营养不良症的发病密切相关,从而通过检测这些新突变体在生物样品中是否存在,可以有效地检测生物样品是否易感锥杆营养不良症。
根据本发明的第二方面,本发明提出了一种筛选易感锥杆营养不良症的生物样品的方法。根据本发明的实施例,该方法包括以下步骤:从生物样品提取核酸样本;确定所述核酸样本的核酸序列;所述核酸样本的核酸序列或其互补序列,与野生型ABCA4基因相比具有c.4604dup突变,或者与野生型CNGB3基因相比具有选自下列的至少一种突变:c.1774dup、c.129+1G>A和c.1957G>A,或者与野生型PDE6C基因相比具有选自下列的至少一种突变:c.1935+1del、c.2518+5G>C和c.1004+1G>A,或者与野生型RPGRIP1基因相比具有c.2592T>G突变,或者与野生型CACNA1F基因相比具有c.2542G>A突变,是所述生物样品易感锥杆营养不良症的指示。通过根据本发明实施例的筛选易感锥杆营养不良症的生物样品的方法,可以有效地筛选易感锥杆营养不良症的生物样品。
根据本发明的第三方面,本发明提出了一种筛选易感锥杆营养不良症的生物样品的***。根据本发明的实施例,该***包括:核酸提取装置,所述核酸提取装置用于从所述生物样品提取核酸样本;核酸序列确定装置,所述核酸序列确定装置与所述核酸提取装置相连,用于对所述核酸样本进行分析,以便确定所述核酸样本的核酸序列;判断装置,所述判断装置与所述核酸序列确定装置相连,以便基于所述核酸样本的核酸序列或其互补序列,与野生型ABCA4基因相比具有c.4604dup突变,或者与野生型CNGB3基因相比具有选自下列的至少一种突变:c.1774dup、c.129+1G>A和c.1957G>A,或者与野生型PDE6C基因相比具有选自下列的至少一种突变:c.1935+1del、c.2518+5G>C和c.1004+1G>A,或者与野生型RPGRIP1基因相比具有c.2592T>G突变,或者与野生型CACNA1F基因相比具有c.2542G>A突变,判断所述生物样品是否易感锥杆营养不良症。利用该***,能够有效地实施前述筛选易感锥杆营养不良症的生物样品的方法,从而可以有效地筛选易感锥杆营养不良症的生物样品。
根据本发明的第四方面,本发明提出了一种用于筛选易感锥杆营养不良症的生物样品的试剂盒。根据本发明的实施例,该试剂盒含有:适于检测ABCA4、CNGB3、PDE6C、RPGRIP1和CACNA1F基因突变体的至少一种的试剂,其中与野生型ABCA4基因相比,所述ABCA4基因突变体具有c.4604dup突变;与野生型CNGB3基因相比,所述CNGB3基因突变体具有选自下列的至少一种突变:c.1774dup、c.129+1G>A和c.1957G>A;与野生型PDE6C基因相比,所述PDE6C基因突变体具有选自下列的至少一种突变:c.1935+1del、c.2518+5G>C和c.1004+1G>A;与野生型RPGRIP1基因相比,所述RPGRIP1基因突变体具有c.2592T>G突变;与野生型CACNA1F基因相比,所述CACNA1F基因突变体具有c.2542G>A突变。利用根据本发明的实施例的试剂盒,能够有效地筛选易感锥杆营养不良症的生物样品。
根据本发明的第五方面,本发明还提出了一种构建体。根据本发明的实施例,该构建体包含前面所述的分离的核酸。需要说明的是,“构建体包含前面所述的分离的核酸”表示,本发明的构建体包含与野生型ABCA4基因相比具有c.4604dup突变的ABCA4基因突变体的核酸序列,或者与野生型CNGB3基因相比具有选自下列的至少一种突变:c.1774dup、c.129+1G>A和c.1957G>A的CNGB3基因突变体的核酸序列,或者与野生型PDE6C基因相比具有选自下列的至少一种突变:c.1935+1del、c.2518+5G>C和c.1004+1G>A的PDE6C基因突变体的核酸序列,或者与野生型RPGRIP1基因相比具有c.2592T>G突变的RPGRIP1基因突变体的核酸序列,或者与野生型CACNA1F基因相比具有c.2542G>A突变的CACNA1F基因突变体的核酸序列,或者同时包含上述各种基因突变体的核酸序列。由此,本发明的构建体转化受体细胞获得的重组细胞,能够有效地用作锥杆营养不良症相关研究的模型。
根据本发明的第六方面,本发明还提出了一种重组细胞。根据本发明的实施例,该重组细胞是通过前面所述的构建体转化受体细胞而获得的。根据本发明的一些实施例,本发明的重组细胞,能够有效地用作锥杆营养不良症相关研究的模型。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1:显示了根据本发明一个实施例的筛选易感锥杆营养不良症的生物样品的***及其组成部分的示意图,其中,
A为根据本发明实施例的筛选易感锥杆营养不良症的生物样品的***的示意图,
B为根据本发明实施例的核酸提取装置的示意图,
C为根据本发明实施例的核酸序列确定装置的示意图;
图2:显示了根据本发明一个实施例,检出新突变的8个CORD患者家系Family1-8的家系图谱;
图3:显示了根据本发明一个实施例,检出新突变的8个CORD患者家系Family1-8内的患者及其家系外正常人对照的相应CORD致病基因突变位点的Sanger测序验证峰图。
具体实施方式
下面详细描述本发明的实施例。下面描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
基因突变体
根据本发明的第一方面,本发明提出了一种分离的核酸。根据本发明的实施例,与野生型ABCA4基因相比,所述核酸具有c.4604dup突变;或者与野生型CNGB3基因相比,所述核酸具有选自下列的至少一种突变:c.1774dup、c.129+1G>A和c.1957G>A;或者与野生型PDE6C基因相比,所述核酸具有选自下列的至少一种突变:c.1935+1del、c.2518+5G>C和c.1004+1G>A;或者与野生型RPGRIP1基因相比,所述核酸具有c.2592T>G突变;或者与野生型CACNA1F基因相比,所述核酸具有c.2542G>A突变。需要说明的是,本发明的分离的核酸编码ABCA4、CNGB3、PDE6C、RPGRIP1和CACNA1F突变体,也可以称为“编码ABCA4、CNGB3、PDE6C、RPGRIP1和CACNA1F突变体的核酸”,即该核酸可以理解为与编码ABCA4、CNGB3、PDE6C、RPGRIP1和CACNA1F突变体的基因相对应的核酸物质,即核酸的类型不受特别限制,可以是任何包含与ABCA4、CNGB3、PDE6C、RPGRIP1和CACNA1F的编码基因相对应的脱氧核糖核苷酸和/或核糖核苷酸的聚合物,包括但不限于DNA、RNA或cDNA。根据本发明的一个具体示例,前面所述的编码ABCA4、CNGB3、PDE6C、RPGRIP1和CACNA1F突变体的核酸为DNA。根据本发明的实施例,发明人确定了ABCA4、CNGB3、PDE6C、RPGRIP1和CACNA1F基因的新突变体,这些突变体与锥杆营养不良症的发病密切相关,从而通过检测该突变体在生物样品中是否存在,可以有效地检测生物样品是否易感锥杆营养不良症,也可以通过检测这些突变体在生物体中是否存在,可以有效地预测生物体是否易感锥杆营养不良症。
对于本发明说明书和权利要求书中,提及核酸,本领域技术人员应当理解,实际包括互补双链的任意一条,或者两条。为了方便,在本说明书和权利要求书中,虽然多数情况下只给出了一条链,但实际上也公开了与之互补的另一条链。例如,提及SEQ ID NO:1,实际包括其互补序列。本领域技术人员还可以理解,利用一条链可以检测另一条链,反之亦然。
这些编码ABCA4、CNGB3、PDE6C、RPGRIP1和CACNA1F基因突变体的核酸,是本申请的发明人通过高通量外显子组测序联合候选基因突变验证的方法,确定的锥杆营养不良症的致病基因上的新突变,并且在现有技术中并未见到上述致病突变与锥杆营养不良症相关的报道。
需要说明的是,上述各野生型基因的cDNA和/或基因组DNA序列可以从如下网址获得:
ABCA4基因组DNA序列获取网址::http://asia.ensembl.org/Homo_sapiens/Gene/Sequence?g=ENSG00000198691;r=1:94458393-94586688;
ABCA4基因cDNA序列获取网址:http://asia.ensembl.org/Homo_sapiens/Transcript/Sequence_cDNA?db=core;g=ENSG00000198691;r=1:94458393-94586688;t=ENST00000370225;
CNGB3基因组DNA序列获取网址:http://asia.ensembl.org/Homo_sapiens/Gene/Sequence?g=ENSG00000170289;r=8:87566205-87755903;
CNGB3基因cDNA序列获取网址:http://asia.ensembl.org/Homo_sapiens/Transcript/Sequence_cDNA?db=core;g=ENSG00000170289;r=8:87566205-87755903;t=ENST00000320005;
PDE6C基因组DNA序列获取网址:http://asia.ensembl.org/Homo_sapiens/Gene/Sequence?g=ENSG00000095464;r=10:95372345-95425767;
PDE6C基因cDNA序列获取网址:http://asia.ensembl.org/Homo_sapiens/Transcript/Sequence_cDNA?db=core;g=ENSG00000095464;r=10:95372345-95425767;t=ENST00000371447;
RPGRIP1基因组DNA序列获取网址:http://asia.ensembl.org/Homo_sapiens/Gene/Sequence?g=ENSG00000092200;r=14:21756098-21819460;
RPGRIP1基因cDNA序列获取网址:http://asia.ensembl.org/Homo_sapiens/Transcript/Sequence_cDNA?db=core;g=ENSG00000092200;r=14:21756098-21819460;t=ENST00000400017;
CACNA1F基因组DNA序列获取网址:http://asia.ensembl.org/Homo_sapiens/Gene/Sequence?g=ENSG00000102001;r=X:49061523-49089833;
CACNA1F基因cDNA序列获取网址:http://asia.ensembl.org/Homo_sapiens/Transcript/Sequence_cDNA?db=core;g=ENSG00000102001;r=X:49061523-49089833;t=ENST00000376265。
发明人发现的ABCA4基因突变体,与野生型ABCA4基因相比具有c.4604dup突变,即相对于野生型ABCA4基因,本发明的ABCA4基因突变体的cDNA第4604位碱基发生了***突变,***了一个T碱基(c.4604dup,在本文中有时也表示为“c.4605insT”)。CNGB3基因突变体,与野生型CNGB3基因相比具有选自下列的至少一种突变:c.1774dup、c.129+1G>A和c.1957G>A,即相对于野生型CNGB3基因,本发明的CNGB3基因突变体的cDNA具有选自下列的至少一种突变:其cDNA第1774位碱基发生了***突变,***了一个G碱基(c.1774dup,在本文中有时也表示为“c.1775insG”);第129位碱基后一位的位于非编码区碱基发生了突变,由G突变为A(c.129+1G>A);第1957位碱基G突变为A(c.1957G>A)。PDE6C基因突变体,与野生型PDE6C基因相比具有选自下列的至少一种突变:c.1935+1del、c.2518+5G>C和c.1004+1G>A,即相对于野生型PDE6C基因,本发明的PDE6C基因突变体的cDNA具有选自下列的至少一种突变:其cDNA第1935位碱基后一位的位于非编码区碱基发生了一个缺失突变,缺失碱基G(c.1935+1del,在本文中有时也表示为“c.1935+1delG”);第2518位碱基后第五位的位于非编码区的碱基发生了突变,由G突变为C(c.2518+5G>C);第1004位碱基后一位的位于非编码区碱基发生了突变,由G突变为A(c.1004+1G>A))。RPGRIP1基因突变体,与野生型RPGRIP1基因相比具有c.2592T>G突变,即相对于野生型RPGRIP1基因,本发明的RPGRIP1基因突变体的cDNA第2592位的T突变为G。CACNA1F基因突变体,与野生型CACNA1F基因相比具有c.2542G>A突变,即相对于野生型CACNA1F基因,本发明的CACNA1F基因突变体的cDNA第2542位的G突变为A。
发明人发现,ABCA4基因的c.4604dup突变与已知突变c.1957C>T同时发生能够导致患者出现锥杆营养不良症状,其中c.4604dup致病位点由本发明人首次提出的;CNGB3基因的c.1774dup和c.129+1G>A,任何一种纯合突变发生均能够导致患者出现锥杆营养不良症状,这两个致病位点均由发明人首次提出;CNGB3基因的c.1957G>A突变与已知突变c.2415A>C同时发生能够导致患者出现锥杆营养不良症状,其中c.1957G>A致病位点由发明人首次提出;PDE6C基因的c.1935+1del、c.2518+5G>C和c.1004+1G>A,任何一种纯合突变发生均能够导致患者出现锥杆营养不良症状;RPGRIP1基因的c.2592T>G突变与已知突变c.799C>T同时发生能够导致患者出现锥杆营养不良症状,其中c.2592T>G致病位点由发明人首次提出;CACNA1F基因的c.2542G>A突变,也是发明人首次提出的易感锥杆营养不良症的致病突变,也能够导致患者出现锥杆营养不良症状。
筛选易感锥杆营养不良症的生物样品的方法
根据本发明的第二方面,本发明提出了一种筛选易感锥杆营养不良症的生物样品的方法。根据本发明的实施例,该筛选易感锥杆营养不良症的生物样品的方法可以包括以下步骤:
首先,从生物样品提取核酸样本。根据本发明的实施例,生物样品的类型并不受特别限制,只要从该生物样品中能够提取到反映生物样品ABCA4、CNGB3、PDE6C、RPGRIP1和CACNA1F基因是否存在突变的核酸样本即可。根据本发明的实施例,生物样品可以为选自人体血液、皮肤、皮下组织的至少一种。由此,可以方便地进行取样和检测,从而能够进一步提高筛选易感锥杆营养不良症的生物样品的效率。根据本发明的实施例,这里所使用的术语“核酸样本”应做广义理解,其可以是任何能够反映生物样品中ABCA4、CNGB3、PDE6C、RPGRIP1和CACNA1F基因是否存在突变的样本,例如可以是从生物样品中直接提取的全基因组DNA,也可以是该全基因组中包含ABCA4、CNGB3、PDE6C、RPGRIP1和CACNA1F基因编码序列的一部分,可以是从生物样品中提取的总RNA,也可以是从生物样品中提取的mRNA。根据本发明的一个实施例,所述核酸样本为全基因组DNA。由此,可以扩大生物样品的来源范围,并且可以同时对生物样品的多种信息进行确定,从而能够提高筛选易感锥杆营养不良症的生物样品的效率。另外,根据本发明的实施例,针对采用RNA作为核酸样本,从生物样品提取核酸样本可以进一步包括:从生物样品提取RNA样本,优选RNA样本为mRNA;以及基于所得到的RNA样本,通过反转录反应,获得cDNA样本,所得到的cDNA样本构成核酸样本。由此,可以进一步提高利用RNA作为核酸样本筛选易感锥杆营养不良症的生物样品的效率。
接下来,在得到核酸样本之后,可以对核酸样本进行分析,从而能够确定所得到核酸样本的核酸序列。根据本发明的实施例,确定所得到核酸样本的核酸序列的方法和设备并不受特别限制。根据本发明的具体实施例,可以通过测序方法,确定核酸样本的核酸序列。根据本发明的实施例,可以用于进行测序的方法和设备并不受特别限制。根据本发明的实施例,可以采用第二代测序技术,也可以采用第三代以及***或者更先进的测序技术。根据本发明的具体示例,可以利用选自Hiseq2000、SOLiD、454和单分子测序装置的至少一种对核酸序列进行测序。由此,结合最新的测序技术,针对单个位点可以达到较高的测序深度,检测灵敏度和准确性大大提高,因而能够利用这些测序装置的高通量、深度测序的特点,进一步提高对核酸样本进行检测分析的效率。从而,能够提高后续对测序数据进行分析时的精确性和准确度。由此,根据本发明的实施例,确定核酸样本的核酸序列可以进一步包括:首先,针对所得到的核酸样本,构建核酸测序文库;以及对所得到的核酸测序文库进行测序,以便获得由多个测序数据构成的测序结果。根据本发明的一些实施例,可以采用选自Hiseq2000、SOLiD、454和单分子测序装置的至少一种对所得到的核酸测序文库进行测序。另外,根据本发明的实施例,可以对核酸样本进行筛选,富集ABCA4、CNGB3、PDE6C、RPGRIP1和CACNA1F基因外显子,该筛选富集可以在构建测序文库之前,构建测序文库过程中,或者构建测序文库之后进行。根据本发明的一个实施例,针对核酸样本,构建核酸测序文库进一步包括:利用选自ABCA4、CNGB3、PDE6C、RPGRIP1和CACNA1F基因外显子特异性引物的至少一种,对核酸样本进行PCR扩增;以及针对所得到的扩增产物,构建核酸测序文库。由此,可以通过PCR扩增,富集ABCA4、CNGB3、PDE6C、RPGRIP1和CACNA1F基因外显子,从而能够进一步提高筛选易感锥杆营养不良症的生物样品的效率。根据本发明的实施例,ABCA4、CNGB3、PDE6C、RPGRIP1和CACNA1F基因外显子特异性引物的序列不受特别限制,例如可以参考人类基因组序列数据库GRCh37.1/hg19,采用Primer3.0在线设计获得。根据本发明的优选实施例,所述ABCA4基因外显子特异性引物具有如SEQ IDNO:1-2所示的核苷酸序列;所述CNGB3基因外显子特异性引物具有如SEQ ID NO:3-8所示的核苷酸序列;所述PDE6C基因外显子特异性引物具有如SEQ ID NO:9-14所示的核苷酸序列;所述RPGRIP1基因外显子特异性引物具有如SEQ ID NO:15-16所示的核苷酸序列;所述CACNA1F基因外显子特异性引物具有如SEQ ID NO:17-18所示的核苷酸序列。根据本发明的一些具体示例,针对c.1774dup突变,所述CNGB3基因外显子特异性引物具有如SEQ ID NO:3-4所示的核苷酸序列;针对c.129+1G>A突变,所述CNGB3基因外显子特异性引物具有如SEQ ID NO:5-6所示的核苷酸序列;针对c.1957G>A突变,所述CNGB3基因外显子特异性引物具有如SEQ ID NO:7-8所示的核苷酸序列。根据本发明的另一些实施例,针对c.1935+1del突变,所述PDE6C基因外显子特异性引物具有如SEQ ID NO:9-10所示的核苷酸序列;针对c.2518+5G>C突变,所述PDE6C基因外显子特异性引物具有如SEQID NO:11-12所示的核苷酸序列;针对c.1004+1G>A突变,所述PDE6C基因外显子特异性引物具有如SEQ ID NO:13-14所示的核苷酸序列。发明人惊奇地发现,通过采用SEQ ID NO:1-18所示的引物,可以在PCR反应体系中显著有效地完成对相应基因突变所在外显子序列的扩增。需要说明的是,下表中的这些SEQ ID NO:1-18所示的核苷酸序列是本发明的发明人在付出了艰苦的劳动后,意外获得的。
关于针对核酸样本,构建测序文库的方法和流程,本领域技术人员可以根据不同的测序技术进行适当选择,关于流程的细节,可以参见测序仪器的厂商例如Illumina公司所提供的规程,例如参见Illumina公司Multiplexing Sample Preparation Guide(Part#1005361;Feb2010)或Paired-End SamplePrep Guide(Part#1005063;Feb2010),通过参照将其并入本文。根据本发明的实施例,从生物样品提取核酸样本的方法和设备,也不受特别限制,可以采用商品化的核酸提取试剂盒进行。
需要说明的是,在这里所使用的术语“核酸序列”应作广义理解,其可以是在对核酸样本进行测序得到的测序数据进行组装后,得到的完整的核酸序列信息,也可以是直接采用通过对核酸样本进行测序所得到的测序数据(reads)作为核酸序列,只要这些核酸序列中含有对应ABCA4、CNGB3、PDE6C、RPGRIP1和CACNA1F基因的编码序列即可。
最后,在确定核酸样本的核酸序列之后,将所得到的核酸样本的核酸序列相应的参考序列进行比对,当所得到的核酸序列中具有前述各突变的至少之一时,即指示生物样品易感锥杆营养不良症。由此,通过根据本发明实施例的筛选易感锥杆营养不良症的生物样品的方法,可以有效地筛选易感锥杆营养不良症的生物样品。根据本发明的实施例,对核酸序列与相应野生型基因序列进行比对的方法和设备并不受特别限制,可以采用任意常规的软件进行操作,根据本发明的具体实例,可以采用SOAPALIGNER/SOAP2进行比对。
需要说明的是,根据本发明实施例的“筛选易感锥杆营养不良症的生物样品的方法”的用途不受特别限制,例如可以用作非诊断目的的筛选方法。
筛选易感锥杆营养不良症的生物样品的***和试剂盒
根据本发明的第三方面,本发明提出了一种能够有效实施上述筛选易感锥杆营养不良症的生物样品的方法的***。
参考图1,根据本发明的实施例,该筛选易感锥杆营养不良症的生物样品的***1000包括:核酸提取装置100、核酸序列确定装置200以及判断装置300。
根据本发明的实施例,核酸提取装置100用于从生物样品提取核酸样本。如前所述,根据本发明的实施例,核酸样本的类型并不受特别限制,对于采用RNA作为核酸样本,则核酸提取装置进一步包括RNA提取单元101和反转录单元102,其中,提取单元101用于从生物样品提取RNA样本,反转录单元102与RNA提取单元101相连,用于对RNA样本进行反转录反应,以便获得cDNA样本,所得到的cDNA样本构成核酸样本。
根据本发明的实施例,核酸序列确定装置200与核酸提取装置100相连,用于对核酸样本进行分析,以便确定核酸样本的核酸序列。如前所示,可以采用测序的方法确定核酸样本的核酸序列。由此,根据本发明的一个实施例,所述核酸序列确定装置200可以进一步包括:文库构建单元201以及测序单元202。文库构建单元201用于针对核酸样本,构建核酸测序文库;测序单元202与文库构建单元201相连,用于对核酸测序文库进行测序,以便获得由多个测序数据构成的测序结果。如前所述,可以通过PCR扩增,富集ABCA4、CNGB3、PDE6C、RPGRIP1和CACNA1F基因外显子,进一步提高筛选易感锥杆营养不良症的生物样品的效率。由此,文库构建单元201可以进一步包括PCR扩增模块(图中未示出),在该PCR扩增模块中设置有选自ABCA4、CNGB3、PDE6C、RPGRIP1和CACNA1F基因外显子特异性引物的至少一种,以便利用ABCA4、CNGB3、PDE6C、RPGRIP1和CACNA1F基因外显子特异性引物的至少一种,对所述核酸样本进行PCR扩增。根据本发明的实施例,ABCA4、CNGB3、PDE6C、RPGRIP1和CACNA1F基因外显子特异性引物的序列不受特别限制,例如可以参考人类基因组序列数据库GRCh37.1/hg19,采用Primer3.0在线设计获得。根据本发明的优选实施例,所述ABCA4基因外显子特异性引物具有如SEQ ID NO:1-2所示的核苷酸序列;所述CNGB3基因外显子特异性引物具有如SEQ ID NO:3-8所示的核苷酸序列;所述PDE6C基因外显子特异性引物具有如SEQ ID NO:9-14所示的核苷酸序列;所述RPGRIP1基因外显子特异性引物具有如SEQ ID NO:15-16所示的核苷酸序列;所述CACNA1F基因外显子特异性引物具有如SEQ ID NO:17-18所示的核苷酸序列。根据本发明的一些具体示例,针对c.1774dup突变,所述CNGB3基因外显子特异性引物具有如SEQ IDNO:3-4所示的核苷酸序列;针对c.129+1G>A突变,所述CNGB3基因外显子特异性引物具有如SEQ ID NO:5-6所示的核苷酸序列;针对c.1957G>A突变,所述CNGB3基因外显子特异性引物具有如SEQ ID NO:7-8所示的核苷酸序列。根据本发明的另一些实施例,针对c.1935+1del突变,所述PDE6C基因外显子特异性引物具有如SEQ ID NO:9-10所示的核苷酸序列;针对c.2518+5G>C突变,所述PDE6C基因外显子特异性引物具有如SEQ IDNO:11-12所示的核苷酸序列;针对c.1004+1G>A突变,所述PDE6C基因外显子特异性引物具有如SEQ ID NO:13-14所示的核苷酸序列。根据本发明的实施例,测序单元202可以包括选自HISEQ2000、SOLiD、454和单分子测序装置的至少一种。由此,结合最新的测序技术,针对单个位点可以达到较高的测序深度,检测灵敏度和准确性大大提高,因而能够利用这些测序装置的高通量、深度测序的特点,进一步提高对核酸样本进行检测分析的效率。从而,提高后续对测序数据进行分析时的精确性和准确度。
根据本发明的实施例,判断装置300与核酸序列确定装置200相连,适于将核酸样本的核酸序列进行比对,以便基于核酸样本的核酸序列与相应的野生型基因序列的区别判断生物样品是否易感锥杆营养不良症。具体地,基于所述核酸样本的核酸序列或其互补序列,与野生型ABCA4基因相比具有c.4604dup突变,或者与野生型CNGB3基因相比具有选自下列的至少一种突变:c.1774dup、c.129+1G>A和c.1957G>A,或者与野生型PDE6C基因相比具有选自下列的至少一种突变:c.1935+1del、c.2518+5G>C和c.1004+1G>A,或者与野生型RPGRIP1基因相比具有c.2592T>G突变,或者与野生型CACNA1F基因相比具有c.2542G>A突变,判断所述生物样品是否易感锥杆营养不良症。如前所述,根据本发明的实施例,对核酸序列与相应的野生型基因序列进行比对的设备并不受特别限制,可以采用任意常规的软件进行操作,例如根据本发明的具体实例,可以采用SOAPALIGNER/SOAP2进行比对。
由此,利用该***,能够有效地实施前述筛选易感锥杆营养不良症的生物样品的方法,从而可以有效地筛选易感锥杆营养不良症的生物样品。
根据本发明的第四方面,本发明提出了一种用于筛选易感锥杆营养不良症的生物样品的试剂盒。根据本发明的实施例,该用于筛选易感锥杆营养不良症的生物样品的试剂盒包括:适于检测ABCA4、CNGB3、PDE6C、RPGRIP1和CACNA1F基因突变体的至少一种的试剂,其中与野生型ABCA4基因相比,所述ABCA4基因突变体具有c.4604dup突变;与野生型CNGB3基因相比,所述CNGB3基因突变体具有选自下列的至少一种突变:c.1774dup、c.129+1G>A和c.1957G>A;与野生型PDE6C基因相比,所述PDE6C基因突变体具有选自下列的至少一种突变:c.1935+1del、c.2518+5G>C和c.1004+1G>A;与野生型RPGRIP1基因相比,所述RPGRIP1基因突变体具有c.2592T>G突变;与野生型CACNA1F基因相比,所述CACNA1F基因突变体具有c.2542G>A突变。利用根据本发明的实施例的试剂盒,能够有效地筛选易感锥杆营养不良症的生物样品。在本文中,所使用的术语“适于检测ABCA4、CNGB3、PDE6C、RPGRIP1和CACNA1F基因突变体的至少一种的试剂”应做广义理解,即可以是检测ABCA4、CNGB3、PDE6C、RPGRIP1和CACNA1F突变体编码基因的至少一种的试剂,也可以是检测ABCA4、CNGB3、PDE6C、RPGRIP1和CACNA1F蛋白突变体的至少一种的试剂,例如可以采用识别特异性位点的抗体。根据本发明的一个实施例,该试剂为核酸探针。由此,可以高效地筛选易感锥杆营养不良症的生物样品。
构建体及重组细胞
根据本发明的第五方面,本发明还提出了一种构建体。根据本发明的实施例,该构建体包含前面所述的分离的核酸。需要说明的是,“构建体包含前面所述的分离的核酸”表示,本发明的构建体包含与野生型ABCA4基因相比具有c.4604dup突变的ABCA4基因突变体的核酸序列,或者与野生型CNGB3基因相比具有选自下列的至少一种突变:c.1774dup、c.129+1G>A和c.1957G>A的CNGB3基因突变体的核酸序列,或者与野生型PDE6C基因相比具有选自下列的至少一种突变:c.1935+1del、c.2518+5G>C和c.1004+1G>A的PDE6C基因突变体的核酸序列,或者与野生型RPGRIP1基因相比具有c.2592T>G突变的RPGRIP1基因突变体的核酸序列,或者与野生型CACNA1F基因相比具有c.2542G>A突变的CACNA1F基因突变体的核酸序列,或者同时包含上述各种基因突变体的核酸序列。由此,本发明的构建体转化受体细胞获得的重组细胞,能够有效地用作锥杆营养不良症相关研究的模型。其中,所述受体细胞的种类不受特别限制,例如可以为大肠杆菌细胞、哺乳动物细胞,优选该受体细胞来源于哺乳动物。
在本发明中所使用的术语“构建体”是指这样的一种遗传载体,其包含特定核酸序列,并且能够将目的核酸序列转入宿主细胞中,以获得重组细胞。根据本发明的实施例,构建体的形式不受特别限制。根据本发明的实施例,其可以为质粒、噬菌体、人工染色体、粘粒(Cosmid)、病毒的至少一种,优选质粒。质粒作为遗传载体,具有操作简单,可以携带较大片段的性质,便于操作和处理。质粒的形式也不受特别限制,既可以是环形质粒,也可以是线性质粒,即可以是单链的,也可以是双链的。本领域技术人员可以根据需要进行选择。在本发明中所使用的术语“核酸”可以是任何包含脱氧核糖核苷酸或者核糖核苷酸的聚合物,包括但不限于经过修饰的或者未经修饰的DNA、RNA,其长度不受任何特别限制。对于用于构建重组细胞的构建体,优选所述核酸为DNA,因为DNA相对于RNA而言,其更稳定,并且易于操作。
根据本发明的第六方面,本发明还提出了一种重组细胞。根据本发明的实施例,该重组细胞是通过前面所述的构建体转化受体细胞而获得的。从而,本发明的重组细胞能够有效表达构建体所携带的ABCA4、CNGB3、PDE6C、RPGRIP1和CACNA1F基因突变体的至少一种。根据本发明的一些实施例,本发明的重组细胞,能够有效地用作锥杆营养不良症相关研究的模型。根据本发明的实施例,受体细胞的种类不受特别限制,例如可以为大肠杆菌细胞、哺乳动物细胞,优选所述受体细胞来源于非人哺乳动物。
需要说明的是,在本文前面筛选易感锥杆营养不良症的生物样品的方法部分中所描述的特征和优点,同样适用于筛选易感锥杆营养不良症的生物样品的***或者试剂盒,在此不再赘述。
此外,还需要说明的是,根据本发明实施例的筛选易感锥杆营养不良症的生物样品的方法、***以及试剂盒,是本申请的发明人经过艰苦的创造性劳动和优化工作才完成的。
下面参考具体实施例,对本发明进行说明,需要说明的是,这些实施例仅仅是说明性的,而不能理解为对本发明的限制。若未特别指明,实施例中所采用的技术手段为本领域技术人员所熟知的常规手段,可以参照《分子克隆实验指南》第三版或者相关产品进行,所采用的试剂和产品也均为可商业获得的。未详细描述的各种过程和方法是本领域中公知的常规方法,所用试剂的来源、商品名以及有必要列出其组成成分者,均在首次出现时标明,其后所用相同试剂如无特殊说明,均以首次标明的内容相同。
实施例1 全外显子组测序确定致病基因及突变位点
1、样本收集:
发明人收集到47个CORD患者家系(各家系之间无血缘关系),各患者家系的先证者的病理诊断均为:锥杆营养不良症。
发明人收集获得上述47个CORD患者家系中先证者及其家系内正常人的外周血样本。
2、全外显子组测序确定致病基因及突变位点
发明人利用NimbleGen SeqCap EZ Human Exome Library v2.0全外显子捕获平台,结合Illumina Hiseq2000高通量测序技术,对上述47个CORD患者家系中先证者均进行了全外显子组捕获测序,具体步骤如下:
2.1样品制备
分别取上述47个CORD患者家系的先证者的外周血,利用常规盐析法抽提基因组DNA,并利用分光光度计及凝胶电泳法测量DNA的浓度及纯度,所得的每个标本基因组DNA的OD260/OD280均位于1.7-2.0之间,浓度不少于200ng/μl,总量不少于30μg,备用。
2.2文库构建及测序
利用自适应高聚焦超声技术(Covaris)将各基因组DNA样本随机打断成150-200bp左右的片段,随后按照制造商提供的操作说明书,在片段两端分别连接上接头制备文库(可参见:http://www.illumina.com/提供的Illumina/Solexa标准建库说明书,通过参照将其全文并入本文)。文库经纯化后经过Ligation-mediated PCR(LM-PCR)的线性扩增与捕获试剂NimbleGen SeqCap EZ Exome(44M)array进行杂交富集,再经过LM-PCR的线性扩增,文库检测合格后即可上机测序,以便获得原始测序数据。其中,参照Illumina标准的成簇和测序的protocol进行测序,测序平台为Illumina Genome Analyzer II,读取长度为90bp,样本的平均测序深度为60×。
2.3变异检测及注释
将上述测序产出数据依次进行初步统计分析、SNP检测和注释及氨基酸替换的预测,主要步骤如下:
2.3.1基本数据分析统计:
将测序产出数据进行基本数据分析统计:测得的序列reads长度分析、统计reads数量和数据的产量、reads序列与参考基因组序列的比对、统计目标区域比对到所要参考的基因组reads的覆盖度(Coverage)与测序深度(Depth)等。然后,根据以上基本数据的统计结果,得到通过外显子捕获的样本基本信息,并判断捕获的数据是否符合要求。
2.3.2SNP检测:
将各样本的高质量的原始reads通过SOAPaligner比对软件比对到参考基因组(hg19)上。然后,将比对到参考基因组上的reads用于后续的SNP标注等的分析。然后,利用SOAPsnp软件将SOAP aligner(Version:2.21)比对软件比对之后的reads结果进行一致序列组装,以得到每个位点的基因分型情况,进而进行SNP的检测。通过SOAPsnp(Version:v1.05)软件组装可得到组装后的一致性序列CNS文件(*.cns)文件,其中包含位点的基因分型等详细信息的*.snp文件与按一定过滤标准(如深度、质量值等)进行过滤后所得到的具有高可信度的SNP结果*.snp.filter文件。其中,前述过滤的标准为:1)质量值≥20(Q20);2)总测序深度4≤depth≤500;3)位点附近区域平均拷贝数约<2;4)相邻两个SNPs的距离≥5b。
对于最终所检测出的*.snp.fllter结果,进行注释分类,包括SNP类型、质量值、碱基位置、可信度等,最后得到包含SNP详细信息的*.gff文件。
2.3.3Indel检测:
将各样本的高质量的原始reads通过bwa比对软件比对到参考基因组(hg19)上。在允许存在gap的情况下比对到参考基因组上的reads用于后续的Indel的分析。然后,将Bwa(Version:0.5.9-r16)比对软件比对之后的reads结果进行过滤,之后利用GATK(Version:v1.0.4705)软件对过滤后的结果进行Indel检测。其中,过滤的标准为:1)支持数≥4;2)支持indel的reads比例≥70%定义为纯合突变,否则为杂合突变。
2.3.4Sanger测序:
Sanger测序被用于验证25个已知CORD致病基因(AIPL1、CRX、GUCA1A、GUCY2D、PITPNM3、PROM1、PRPH、RIMS1、SEMA4A、UNC119、ABCA4、ADAM9、C8ORF37、CACNA2D4、CDHR1、CERKL、CNGB3、CNNM4、KCNV2、PDE6C、RAX2、RDH5、RPGRIP1、CACNA1F、RPGR基因)内全外显子测序检出的突变,包括adCORD的杂合突变和arCORD的纯合突变或复合杂合突变以及xlCORD的半合子突变,扩增突变所在区域的PCR引物采用Primer3(http://frodo.wi.mit.edu/primer3/)设计。扩增的片段使用ABI3100(AppliedBiosystems,Foster City,CA)遗传分析仪,采用ABI BigDye Terminator cycle sequencing kitv3.1(Applied Biosystems,Foster City,CA)进行测序。
然后,将测序结果采用Lasergene程序包的SeqManII程序实现患者和正常人的比较。并将发现的突变在尽可能多的先证者的家庭成员中进行测序,其中的罕见突变还要在家系外正常人(192个)中进一步评估。突变采用序列变异的方式描述(HGVS:http://www.hgvs.org/mutnomen/).突变的保守性采用Phastcons_score(http://varianttools.sourceforge.net/Annotation/PhastCons)评估,错义突变的功能采用SIFT(http://sift.jcvi.org/)和Polyphen-2(http://genetics.bwh.harvard.edu/pph2/)进行分析。剪切位点变化采用Berkeley Drosophila Genome Project(BDGP)(http://www.fruitfly.org/)进行预测。
此外,考虑到CORD的致病突变应该是罕见的,arCORD的基因突变应该存在于正常表型的携带者,在患病者内表现为纯合或复合杂合。所以不存在于db134,千人基因组或存在频率小于等于0.006(杂合携带者的频率计算基于疾病的发病率—1:40,000)被认为是潜在致病的。
结果,全外显子组捕获在47个CORD患者家系中的10个找到了14个潜在致病的突变,包括在13个arCORD基因中的4个(ABCA4、CNGB3、PDE6C和RPGRIP1)找到7个纯合或复合杂合突变,在xlCORD患者家系内发现3个半合子致病突变位于2个基因(RPGR和CACNA1F)。在这14个突变中,9个是未被记录过的,即:ABCA4(c.4604dup),CNGB3(c.1774dup,c.129+1G>A,c.1957G>A),PDE6C(c.1935+1del,c.2518+5G>C,c.1004+1G>A),RPGRIP1(c.2592T>G),CACNA1F(c.2542G>A)。这10个家系内的14个致病突变分布在25个CORD致病基因的6个,包括CNGB3(3个家系)、PDE6C(2个家系)、RPGR(2个家系)、ABCA4(1个家系)、PITPNM3(1个家系)和CACNA1F(1个家系)。这14个突变在各自的家系内都被sanger测序确认为阳性,其中能够做分离分析的4个家系内致病突变与疾病均共分离。47个家系在其他18个疾病相关基因没有检测到潜在的致病突变。
其中,图2示出了检出新突变的8个CORD患者家系(Family1-8)的家系图谱。如图2所示,其中○表示正常女性,□表示正常男性,●表示女性患者,■表示男性患者,箭头所指为先证者。
临床数据显示,前述10个检出致病突变的先证者都有早发型重度形式的主要是锥细胞参与的视网膜萎缩。眼底变化主要在黄斑区,表现出轻度的色素变化,中心凹反射消失,在部分患者中存在视网膜动脉减少的症状。
其中9个新突变分别位于ABCA4,CNGB3,PDE6C,RPGRIP1,CACNA1F。从而,本发明发现了ABCA4(c.4604dup),CNGB3(c.1774dup,c.129+1G>A,c.1957G>A),PDE6C(c.1935+1del,c.2518+5G>C,c.1004+1G>A),RPGRIP1(c.2592T>G),CACNA1F(c.2542G>A)中的突变,上述突变为CORD的致病新突变,可用于CORD的检测。
实施例2 Sanger法测序验证锥杆营养不良症的致病突变
分别对实施例1检测获得的9个新的CORD致病突变所在的8个CORD患者家系Family1-8的患者及其家系内正常人,以及192个家系外正常人的ABCA4、CNGB3、PDE6C、RPGRIP1和CACNA1F基因(即9个新突变所涉及的基因)进行检测,针对上述基因涉及的9个新的突变位点所在序列设计引物,然后通过PCR扩增、产物纯化和测序的方法获得上述突变的有关序列,根据确定序列测定结果属于突变型还是野生型,是杂合突变还是纯合突变,以及序列与表型在家系内是否呈共分离来验证上述基因与锥杆营养不良症之间的相关性。
具体方法步骤如下:
1、DNA提取
按照实施例1中所述的提取DNA的方法,分别提取制备受试者外周静脉血中的基因组DNA,备用。
2、引物设计及PCR反应
首先,参考人类基因组序列数据库GRCh37.1/hg19,采用Primer3.0分别设计得到ABCA4、CNGB3、PDE6C、RPGRIP1、PITPNM3和CACNA1F基因外显子特异性引物,具体见下表:
接着,于96孔反应板中,分别按照以下配比配制各基因组DNA样本的PCR反应体系以及进行PCR反应。
反应体系:15μl
然后,于PerkinElmer9700热循环仪上,采用Touchdown方法将配制获得各PCR反应体系按照以下反应条件分别进行PCR反应(不同的突变位点采用相同的反应条件):
反应条件:
预变性:94℃5分钟;
前12个循环:变性94℃,30秒,
退火63℃,30秒(退火温度每个循环降0.5℃),
延伸72℃,50秒;
后26个循环:变性94℃,30秒,
退火57℃,30秒,
延伸72℃,50秒;
最后延伸:72℃,10分钟;
4℃保存。
由此,获得上述各受试者的PCR扩增产物。
3、测序
将步骤2中获得各受试者的PCR扩增产物,进行DNA测序。其中,测序采用ABI3730型测序仪进行。
基于测序结果,对上述各样本进行ABCA4、CNGB3、PDE6C、RPGRIP1和CACNA1F基因编码序列比对。发明人发现,实施例1中检测获得的9个新突变位点在各自家系内的患者和家系内正常人中表现为基因型与疾病表型的共分离,也不存在于192个正常对照中。其中,图3显示了检出新突变的8个CORD患者家系1-8(即Family1-8)内的先证者及其家系外正常人对照的相应CORD致病基因突变位点的Sanger测序验证峰图。如图3所示,其中ABCA4:c.4605insT即为前述的ABCA4基因的c.4604dup突变,CNGB3:c.1775insG即为前述的CNGB3基因的c.1774dup突变、PDE6C:c.1935+1delG即为前述的PDE6C基因的c.1935+1del突变。由此,证明上述各变异是致病性突变而不是一个多态性。
此外,需要说明的是,ABCA4,CNGB3,PDE6C,RPGRIP1,CACNA1F和RPGR基因为已知的锥杆营养不良症的致病基因,目前这些基因的致病性已较明确。
综上,发明人进一步证明了ABCA4,CNGB3,PDE6C,RPGRIP1和RPGR基因为锥杆营养不良症的致病基因,本发明发现的新突变:ABCA4(c.4604dup),CNGB3(c.1774dup,c.129+1G>A,c.1957G>A),PDE6C(c.1935+1del,c.2518+5G>C,c.1004+1G>A),RPGRIP1(c.2592T>G),CACNA1F(c.2542G>A)是锥杆营养不良症的致病突变。
实施例3 检测试剂盒
制备一检测试剂盒,其包含适于检测ABCA4,CNGB3,PDE6C,RPGRIP1和CACNA1F基因突变体的至少一种的引物(其中与野生型ABCA4基因相比,ABCA4基因突变体具有c.4604dup突变;与野生型CNGB3基因相比,CNGB3基因突变体具有选自下列的至少一种突变:c.1774dup、c.129+1G>A和c.1957G>A;与野生型PDE6C基因相比,PDE6C基因突变体具有选自下列的至少一种突变:c.1935+1del、c.2518+5G>C和c.1004+1G>A;与野生型RPGRIP1基因相比,RPGRIP1基因突变体具有c.2592T>G突变;与野生型CACNA1F基因相比,CACNA1F基因突变体具有c.2542G>A突变),以便用于筛选易患锥杆营养不良症的生物样品,其中这些引物的具体序列见实施例1。
利用上述试剂盒筛选易患锥杆营养不良症的生物样品的具体步骤为:按照实施例2的步骤1所述的方法提取待测者DNA,以所提取的DNA为模板与上述外显子特异性引物进行PCR反应,并按照本领域常规方法对PCR产物纯化,将纯化的产物进行测序,然后通过观察测序所得到的序列是否具有选自上述基因的至少一种突变,从而有效地检测待测者是否易患锥杆营养不良症,进一步,能够从待测者中筛选出易患锥杆营养不良症的生物样品。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。