CN101641451A - chr8q24.21上的癌症易感性变体 - Google Patents

chr8q24.21上的癌症易感性变体 Download PDF

Info

Publication number
CN101641451A
CN101641451A CN200780046943A CN200780046943A CN101641451A CN 101641451 A CN101641451 A CN 101641451A CN 200780046943 A CN200780046943 A CN 200780046943A CN 200780046943 A CN200780046943 A CN 200780046943A CN 101641451 A CN101641451 A CN 101641451A
Authority
CN
China
Prior art keywords
cancer
marker
prostate cancer
haplotype
allelotrope
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN200780046943A
Other languages
English (en)
Inventor
尤利乌斯·格维兹门松
帕特里克·舒莱姆
奥古斯丁·孔
安德烈·马诺列斯库
劳非·阿孟达多蒂尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Decode Genetics ehf
Original Assignee
Decode Genetics ehf
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Decode Genetics ehf filed Critical Decode Genetics ehf
Publication of CN101641451A publication Critical patent/CN101641451A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/172Haplotypes
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Abstract

本申请证实了染色体8q24.21上的区域在特定形式的癌症中扮演了重要角色。已经发现某些标记物和单倍型是对特定癌症,包括***癌的易感性的指示。描述了使用这些标记物和单倍型鉴定对癌症易感性的诊断学应用。

Description

chr8q24.21上的癌症易感性变体
发明背景
癌症——恶性细胞的不受控制的生长,是现代医学时代主要的健康难题,并且在发达国家,是死亡的主导因素之一。在美国,每四例死亡中就有一例由癌症引起(Jemal,A.等,CA Cancer J.Clin.52:23-47(2002))。
在过去的几十年中,***癌的发病率急剧上升,目前,在美国和西欧,***癌成为死亡的主导因素(Peschel,R.E.和J.W.Colberg,Lancet 4:233-41(2003);Nelson,W.G.等,N.Engl.J.Med.349(4):366-81(2003))。在工业化国家中,***癌是男性中诊断频率最高的非皮肤性恶性肿瘤,在美国,8个男性中就有1个在其生命期中将发展出***癌(Simard,J.等,Endocrinology 143(6):2029-40(2002))。尽管环境因素例如饮食因素和与生活方式有关的因素对***癌的风险有贡献,但遗传因素也已显示出扮演了重要角色。事实上,阳性家族史是***癌最强的流行病学风险因素之一,在同卵双生子中比较***癌的一致发生的双生子研究,也一致地显示出***癌的风险中存在着比任何其它类型癌症中更强的遗传成份(Nelson,W.G.等,N.Engl.J.Med.349(4):366-81(2003);Lichtenstein P.等,N.Engl.J.Med.343(2):78-85(2000))。此外,在一项全国范围内对冰岛从1955年到2003年诊断的所有癌症病例的家族性研究中,在***癌病例的第一级到第五级亲属中观察到了增加的***癌风险(Amundadottir等,PLoS Medicine 1(3):e65(2004))。由亲属中增加的风险所强调的这种疾病的遗传基础,得到了在特殊人群中进行的***癌研究的进一步支持:例如,非洲裔美国人具有最高的***癌发病率以及由该疾病造成的死亡率;与欧洲裔美国人相比,他们发生***癌的可能性是1.6倍,死于该疾病的可能性是2.4倍(Ries,L.A.G.等,NIH Pub.No.99-4649(1999))。
患有***癌的男性的寿命预期值平均减少40%。如果在转移和扩散到囊胞外之前较早地检测到,***癌是可以治愈的(例如使用外科手术)。但是,如果在从***扩散和转移后诊断到,***癌一般是致命的疾病,治愈率低。尽管基于***特异性抗原(PSA)的筛查对于***癌的早期诊断有所帮助,但它的灵敏度和特异性不高(Punglia等,N Engl J Med.349(4):335-42(2003))。这意味着测试将伴有高百分率的假阴性和假阳性诊断。结果是在许多情况下漏诊癌症,以及对于没有癌症的对象进行了不必需的后续活组织检查。多达65%到85%患有***癌的个体(依赖于年龄)的PSA水平小于或等于4.0ng/mL,该值在传统上被用作正常PSA水平的上限(Punglia等,N EnglJ Med.349(4):335-42(2003);Cookston,M.S.,Cancer Control8(2):133-40(2001);Thompson,I.M.等,N Engl J Med.350:2239-46(2004))。有很大部分具有低PSA水平的癌症的Gleason评分为7级或以上,这是侵略性***癌的衡量标准。同上。
除了上面提到的灵敏性问题之外,PSA测试还有特异性和预后的问题。在没患有***癌的对象中PSA水平可能是异常的。例如,良性***增生症(BPH)是假阳性PSA测试的一种常见原因。此外,各种不同的非癌症病症可能升高血清的PSA水平,包括尿潴留,***炎,剧烈的***按摩和***。同上。
在具有阳性PSA水平的患者中,如果肿瘤太小,不能通过超声看见的话,使用穿刺活检对***癌进行随后的证实是困难的。一般情况下,获取多个随机样品,但是由于仅仅取样少量的组织,***癌的诊断可能被错过。直肠指检(DRE)也会错过许多癌症,因为只有***后叶被检查到。因为早期癌症是不可触知的,通过DRE检测到的癌症可能已经扩散到***外(Mistry K.J.,Am.Board Fam.Pract.16(2):95-101(2003))。
因此,对于能够促进早期***癌的检测和预后,并有助于疾病的预防性和治愈性治疗的改进的诊断方法,显然存在着极大的需求。此外,对于能够更好地分辨更可能患有侵略性形式的***癌的患者与更可能患有局部保留在***中,对发病率和死亡率没有显著贡献的更良性形式的***癌的患者的工具的开发,存在着需求。这有助于避免对没有显著风险的患者进行侵入性的和昂贵的操作。
与各种形式的***癌有关的位点
在过去的几十年中,***癌的发病率急剧上升。***癌是一种多因素的疾病,其病因学中包含了遗传和环境的成份。其特征为不均匀的生长形式,从从缓慢生长的肿瘤到非常快速的高转移性病变。
尽管遗传因素是***癌最强的流行病学风险因素之一,但搜索参与该疾病的遗传决定因子是一种挑战。研究显示,将候选遗传标记与***癌相关联,比鉴定其它癌症例如乳腺癌,卵巢癌和结肠癌的易感性基因更困难。对于这种增加的困难性已经提出了几种理由:***癌通常在晚期被诊断出来的事实,使得难以从超过一代的活的患病个体获得DNA样品;在高风险谱系中与遗传和偶发形式之间缺少分辨性特征有关的拟表型的存在;以及***癌的遗传不均一性,和随之而来的为该复杂疾病开发适合的统计传播模型的困难(Simard,J.等,Endocrinology 143(6):2029-40(2002))。
对于***癌易感性基因已经进行了多种基因组扫描,已经报道了几个***癌易感性位点。例如,已经提出HPC1(1q24-q25),PCAP(1q42-q43),HCPX(Xq27-q28),CAPB(1p36),HPC20(20q13),HPC2/ELAC2(17p11)和16q23作为***癌易感性位点(Simard,J.等,Endocrinology 143(6):2029-40(2002);Nwosu,V.等,Hum.Mol.Genet.10(20):2313-18(2001))。在Smith等进行的基因组扫描中,连锁的最强迹象在HPC1位点处,尽管两点分析(two-point analysis)也揭示D4S430位点的LOD分值≥1.5,几个位点包括Xq27-28位点的标记物的LOD分值≥1.0(Ostrander E.A.和J.L.Stanford,Am.J.Hum.Genet.67:1367-75(2000))。另一项基因组扫描报道了使用常染色体遗传显性模型时染色体10q,12q和14q,使用遗传隐形模型时染色体1q,8q,10q和16p的两点LOD分值≥1.5。同上。另一项基因组扫描在2q,12p,15q,16q和16p上鉴定到了具有轻微连锁迹象的区域。使用一小组犹他州高风险***癌谱系和一组300个多态性标记物进行的***癌倾向性位点的基因组扫描,提供了与染色体17p上的位点连锁的证据(Simard,J.等,Endocrinology 143(6):2029-40(2002))。在2003年下半年,公开了8个新的连锁分析,描绘出了显著的不均一性。报道了11个LOD分值高于2.0的峰,它们之中没有重叠的(参见Actane协会,Schleutker等,Wiklund等,Witte等,Janer等,Xu等,Lange等,Cunningham等的文章;都公开在Prostate,vol.57(2003)中)。
如上所述,参与***癌的具体基因的鉴定具有挑战性。其中涉及到的一个基因是RNASEL,它编码广泛表达的潜伏的内切核酸酶,该酶参与干扰素诱导的RNA衰变途径,据信降解病毒和细胞的RNA,该基因已经与HPC位点关联(Carpten,J.等,Nat.Genet.30:181-84(2002);Casey,G.等,Nat.Genet.32(4):581-83(2002))。RNASEL的突变与对***癌的增加的易感性有关。例如,在一个家族中,四个患有***癌的兄弟在RNASEL中带有失活突变,而在另一个家族中,六个患有***癌的兄弟中的四人带有影响了RNASEL的起始甲硫氨酸密码子的碱基取代。同上。其它研究显示,在患有家族性***癌的芬兰男性和德系犹太人群体中,突变的RNASEL等位基因与***癌的增加的风险相关(Rokman,A.等,Am J.Hum.Genet.70:1299-1304(2002);Rennert,H.等,Am J.Hum.Genet.71:981-84(2002))。此外,已经提出Ser217Leu基因型在年龄小于65岁的美国白人的所有散发病例中占大约9%(Stanford,J.L.,Cancer Epidemiol.Biomarkers Prev.12(9):876-81(2003))。但是,与这些阳性报告相反,一些研究不能检测到带有失活突变的RNASEL等位基因与***癌之间的任何相关性(Wang,L.等,Am.J.Hum.Genet.71:116-23(2002);Wiklund,F.等,Clin.Cancer Res.10(21):7150-56(2004);Maier,C.等,Br.J.Cancer92(6):1159-64(2005))。
位于8p22的巨噬细胞清除受体1(MSR1)已经被鉴定为候选的***癌易感性基因(Xu,J.等,Nat.Genet.32:321-25(2002))。在大约3%患有非遗传性***癌的男性中检测到了突变的MSR1等位基因,但是在未患病的男性中只有0.4%被检测到。同上。但是,不是所有后续的报道都证实了这些起初的发现(参见例如Lindmark,F.等,Prostate 59(2):132-40(2004);Seppala,E.H.等,Clin.Cancer Res.9(14):5252-56(2003);Wang,L.等,Nat Genet.35(2):128-29(2003);Miller,D.C.等,Cancer Res.63(13):3486-89(2003))。MSR1编码了巨噬细胞清除受体的亚基,该受体能够结合多种不同的配体,包括细菌脂多糖和脂胞壁酸,并氧化血清中的高密度脂蛋白和低密度脂蛋白(Nelson,W.G.等,N.Engl.J.Med.349(4):366-81(2003))。
17号染色体上的ELAC2基因是从犹他州高风险***癌家族克隆到的第一个***癌易感性基因(Tavtigian,S.V.,等,Nat.Genet.27(2):172-80(2001))。在一个谱系中发现了移码突变(1641InsG)。还发现了其它三个错义变化与***癌的增加的风险相关:Ser217Leu,Ala541Thr和Arg781His。已经发现,在带有Ser217Leu和Ala541Thr的男性中***癌的相对风险,将是没有在***癌家族史的基础上选择的群体中的2.37倍(Rebbeck,T.R.,等,Am.J.Hum.Genet.67(4):1014-19(2000))。另一项研究描述了一个高***癌发病率家族中的新的终止突变(Glu216X)(Wang,L.,等,Cancer Res.61(17):6494-99(2001))。其它的报告没有证实与三个错义突变的强烈相关性,并且最近的元分析表明,与这些突变相关的家族风险比在最初报告中指出的要温和一些(Vesprini,D.,等,Am.J.Hum.Genet.68(4):912-17(2001);Shea,P.R.,等,Hum.Genet.111(4-5):398-400(2002);Suarez,B.K.,等,Cancer Res.61(13):4982-84(2001);Severi,G.,等,J.Natl.Cancer Inst.95(11):818-24(2003);Fujiwara,H.,等,J.Hum.Genet.47(12):641-48(2002);Camp,N.J.,等,Am.J.Hum.Genet.71(6):1475-78(2002))。
参与雄激素作用的基因的多态性变异(例如雄激素受体(AR)基因,细胞色素P-450c17(CYP17)基因和II型甾体-5-α-还原酶
(SRD5A2)基因)也已经被暗示与***癌的增加的风险有关(Nelson,W.G.等,N.Engl.J.Med.349(4):366-81(2003))。对于编码雄激素受体的AR来说,几项遗传流行病学研究已经显示了***癌的增加的风险与短的雄激素受体多聚谷氨酰胺重复的存在之间的相关性,然而其它的研究不能检测到这样的相关性。同上。连锁数据也暗示,催化性类固醇生物合成中的关键反应的CYP17的等位基因形式与***癌相关(Chang,B.等,Int.J.Cancer 95:354-59(2001))。编码***中5-α-还原酶的优势同工酶,其功能是将睾酮转化成更有效的二氢睾酮的SRD5A2的等位基因变异,已经与***癌的增加的风险和患有***癌的男性的不良的预后相关联(Makridakis,N.M.等,Lancet354:975-78(1999);Nam,R.K.等,Urology 57:199-204(2001))。
简而言之,尽管经过了全世界许多研究组的努力,为绝大部分***癌风险负责的基因还没有被鉴定。尽管双生子研究表明遗传因素在***癌中可能是主要的,但仅仅鉴定到几个基因与***癌的增加的风险相关,并且这些基因仅占病例中的很低的比例。因此,显然***癌的大部分风险因子仍有待发现。有可能这些风险因子将包含相当大量的低到中度风险的遗传变异。但是,这些低到中度风险的遗传变异可能对绝大部分的***癌负责,因此,它们的鉴定对公共卫生有极大的益处。此外,还没有报道任何已公开的***癌基因能够预测出侵略性***癌超出较低侵略性***癌的更高的风险。
在最近的研究中,将含有***癌患者的群体的扩展家谱信息与强有力的基因共享方法相结合,对已经被证实在癌症(例如乳腺癌,***癌,肺癌,黑色素瘤)中扮演了重要角色的染色体8q24.21上位点进行了作图。使用包含了1100个微卫星标记物,平均标记物密度为3-4cM的基因组范围内的标记物组,对各种不同癌症患者以及他们的亲属进行了基因分型(Amundadottir L.T..,Nature Genet.38(6):652-658(2006))。在犹他州CEPH HapMap样品中,检测到了与128.414和128.506Mb(NCBI build 34)位置之间的位点中的单个LD区块的相关性。
乳腺癌在美国和全世界是女性的重要健康问题。尽管在该疾病的检测和治疗方面已经作出了进展,但乳腺癌仍然是女性中与癌症相关的死亡的第二主导原因,在美国每年侵染180,000以上的女性。对于北美女性来说,在一生中患上乳腺癌的几率现在是八分之一。
目前尚没有通用的治疗或预防乳腺癌的成功方法。乳腺癌的控制目前依赖于早期诊断(例如通过例行的乳腺筛查方法)和侵袭性治疗的结合,侵袭性治疗可能包括多种治疗中的一种或多种,例如外科手术,放疗,化疗和激素疗法。对于具体的乳腺癌来说,治疗过程通常根据各种预后参数来进行选择,包括特异性肿瘤标记物的分析。参见例如Porter-Jordan和Lippman,Breast Cancer 8:73-100(1994)。
尽管BRCA1和BRCA2的发现是鉴定参与乳腺癌的关键遗传因子中的重要步骤,但现在已经清楚,BRCA1和BRCA2中的突变仅能解释对乳腺癌的一部分易感性(Nathanson,K.L.等,Human Mol.Gen.10(7):715-720(2001);Anglican Breast Cancer Study Group.Br.J.Cancer83(10):1301-08(2000);以及Syrjakoski K.等,J.Natl.Cancer Inst.92:1529-31(2000))。尽管对乳腺癌的疗法进行了相当多的研究,但乳腺癌仍然难以有效诊断和治疗,在乳腺癌患者中观察到的高死亡率表明,在疾病的诊断,治疗和预防方面还需要改进。
在一项全国范围内对冰岛从1955年到2003年诊断的所有癌症病例的家族性研究中,deCODE已经证实了在乳腺癌病例的第一级到第五级亲属中增加的乳腺癌风险(Amundadottir等,PLoS Med.1(3):e65(2004);Lichtenstein P.等,N.Engl.J.Med.343(2):78-85(2000)),作者在其中显示出,在接近45,000对双生子的群体中,乳腺癌是所有测试的癌症中具有最高遗传性的癌症之一。
据估计,在女性中所有的乳腺癌中,只有5-10%与常染色体显性基因例如BRCA1,BRCA2,p53,pTEN和STK11/LKB1中的突变导致的遗传易感性有关(Mincey,B.A.Oncologist 8:466-73(2003))。已经提出染色体8p上的一个遗传位点是乳腺癌易感性基因的位点,其基于是有研究证实了在散发乳腺癌中该区域中存在等位基因缺失(Seitz,S.等,Br.J.Cancer 76:983-91(1997);Kerangueven,F.等,Oncogene10:1023(1995))。研究也表明乳腺癌易感性基因可能位于13q21上(Kainu,T.等,Proc.Natl.Acad.Sci.USA 97:9603-08(2000))。但是,与***癌相同,其它乳腺癌易感性基因的鉴定是困难的。
在世界范围内,肺癌导致的死亡比任何其它形式的癌症都要多(Goodman,G.E.,Thorax 57:994-999(2002))。在美国,无论在男性还是女性中,肺癌都是癌症死亡的首要原因。在2002年,肺癌导致的死亡率据估计为134,900例死亡,超过乳腺癌,***癌和结肠癌的总和。肺癌在所有欧洲国家也是癌症死亡的主导原因,在发展中国家也快速增长。尽管环境因素例如生活方式因素(例如吸烟)和饮食因素在肺癌中扮演了重要角色,但遗传因素也对疾病有所贡献。例如,负责致癌物活化,降解和随后的DNA修复的一类酶被暗示与肺癌的易感性有关。研究显示,p53和RB/p16途径中的缺陷对于肺上皮细胞的恶性转化是必要的(Yokota,J.和T.Kohno,Cancer Sci.95(3):197-204(2004))。其它基因例如K-ras,PTEN和MYO18B在肺癌细胞中遗传变化的频率低于p53和RB/p16,表明这些基因中的变化与进一步的恶性发展或一部分肺癌细胞中的独特表型有关。在p53突变和RB/p16缺失的位点进行的分子足迹研究,进一步证实了在肺癌细胞中DNA修复活性和DNA双链断裂的非同源末端连接对于遗传变化的积累来说是重要的。此外,研究鉴定到了候选的肺腺癌易感性基因,例如药物致癌物代谢基因例如NQ01(NAD(P)H:醌氧化还原酶)和GSTT1(谷胱甘肽S-转移酶T1),以及DNA修复基因例如XRCC1(X-射线交叉互补性组1)(Yanagitani,N.等,Cancer Epidemiol.Biomarkers Prev.12:366-71(2003);Lin,P.等,J.Toxicol.Environ.Health A.58:187-97(1999);Divine,K.K.等,Mutat.Res.461:273-78(2001);Sunaga,N.等,Cancer Epidemiol.Biomarkers Prev.11:730-38(2002))。染色体19q13.3包含位点D19S246的区域,已经被建议含有与肺腺癌相关的基因(Yanagitani,N.等,Cancer Epidemiol.Biomarkers Prev.12:366-71(2003))。此外,通过分析在过去48年中在冰岛诊断的所有肺癌病例,deCODE的遗传学家们显示了核心家庭之外的家族成员的增加的风险。这种增加的风险不能完全用吸烟来解释,表明遗传变异可能使某些个体易患肺癌(Jonson等,JAMA 292(24):2977-83(2004);Amundadottir等,PLoS Med.1(3):e65(2004))。
无论诊断时的疾病阶段如何,所有肺癌患者的5年存活率仅仅为13%。这与疾病被检测到时仍在原位的病例中46%的5年存活率形成了对比。但是,只有16%的肺癌在疾病扩散前被发现。早期诊断是困难的,因为临床症状通常在疾病达到晚期后才能观察到。目前,通过使用胸部X-射线,分析痰液中含有的细胞类型以及支气管光学纤维检查来帮助诊断。治疗方式由癌症的类型和阶段所决定,包括外科手术,放疗和/或化疗。尽管对这种以及其它的癌症的疗法进行了相当多的研究,肺癌仍然难以有效诊断和治疗。因此,在本技术领域中存在着对检测和治疗这些癌症的改进的方法的极大需求。
在北美,恶性黑色素瘤的发病率比任何其它类型的人类癌症增加的更快(Armstrong等,Cancer Surv.19-20:219-240(1994))。尽管当在早期阶段鉴定时,黑色素瘤是可治愈的,但需要在它扩散到远处位点之前检测并移除原发肿瘤。恶性黑色素瘤具有极高的转移倾向,并对常规的癌症疗法例如化疗和放射有显著的抗性。一旦转移发生,预后非常不良。因此,在黑色素瘤治疗和控制中,黑色素瘤的早期诊断是至关重要的。
研究证实,遗传因素在正常色素细胞逐步发展到非典型的痣,再到侵染性原发黑色素瘤,以及最后到具有侵略性转移能力的细胞的过程中,扮演了重要角色(Kim,C.J.,等,Cancer Control 9(1):49-53(2002))。例如,遗传畸变,诸如带有肿瘤抑制基因的1号染色体的重排,可能与恶性黑色素瘤有关。但是,成年人皮肤的正常黑素细胞如何转化成黑色素瘤细胞的分子和生物学机制仍不清楚。
各种研究显示遗传因素与黑色素瘤相关。例如,通过检查犹他州人群数据库,注意到了早期发作的黑色素瘤的升高的家族性风险(Cannon-Albright,L.A.,等,Cancer Res.,54(9):2378-85(1994))。此外,瑞典家庭癌症数据库报道了,在具有患病的父母或近亲的个体中,皮肤恶性黑色素瘤(CMM)的家族标准化发病率(SIR)分别为2.54和2.98。对于其父母患有多发性原初黑色素瘤的后代来说,SIR升高到61.78(Hemminki,K.,等,J.Invest.Dermatol.120(2):217-23(2003))。在Amundadottir等的基于冰岛人群的研究中(PLoS Med.1(3):e65(2004)),发现了相当的SIR值。尽管数字有所不同,但已报道大约10%的CMM病例是家族性的(Hansen,C.B.,等,Lancet Oncol.5(5):314-19(2004))。由于黑色素瘤有已知的环境风险因素,除了遗传学之外共享的环境可能影响了这些估算值。但是,家族性病例倾向于具有较早的发作年龄和较高的多发性原发肿瘤的风险,表明了其中具有遗传成份(参见例如Tucker M.,Oncogene 22(20):3042-52(2003))。但是,正常黑素细胞如何转化成黑色素瘤细胞的分子和生物学机制,仍不清楚。
一系列基于连锁的研究暗示Chr9p21上的CDKN2a是主要的CMM易感性基因(Bataille,V.,Eur.J.Cancer 39(10):1341-47(2003))。此后不久,CDK4被鉴定为途径候选物,但是,在全世界,CDK4的突变仅仅在几个家族中被观察到(Zuo,L.,等,Nat.Genet.12(1):97-99(1996))。CDKN2a编码周期蛋白依赖性激酶抑制剂p16,它抑制CDK4和CDK6,从而阻止了从G1期到S期的细胞周期转变。CKDN2a的另一个转录本产生p14ARF,它编码通过MDM2-p53途径起作用的细胞周期抑制剂。可能CDKN2a突变型黑素细胞由于发育状态或对DNA损伤作出相应,而缺少了细胞周期的控制或建立衰老(Ohtani,N.,等,J.Med.Invest.51(3-4):146-53(2004))。到80岁时,家族性CMM病例中CDKN2a突变的总外显率为67%。但是,在黑色素瘤高度流行的地区,外显率增加(Bishop,D.T.,等,J.Natl.Cancer Inst.94(12):894-903(2002))。
黑色素瘤遗传学协会最近使用一组主要是澳大利亚人的与9p21或CDK4不连锁的高风险家族,完成了对CMM的基因组范围的扫描(Gillanders,E.,等,Am.J.Hum.Genet.73(2):301-13(2003))。该10cM分辨率的扫描得出了在1p22区域中非参数性的多点LOD分值为2.06。染色体4,7,14和18上的其它位置给出了超过1.0的LOD。使用针对1p22的其它标记物并使用发病年龄的限制,观察到了超过5.0的非参数性LOD分值。证据表明,在该位置中存在高外显率的肿瘤抑制基因的突变,但是,LOH的图谱是复杂的(Walker,G.J.,等,GenesChromosomes Cancer,41(1):56-64(2004))。
另一个与CMM有关的遗传位点是编码黑素细胞皮质激素1受体(MC1R)的位点。MC1R是G-蛋白偶联受体,参与促进从假黑色素(pheomelanin)向真黑色素(eumelanin)合成的转变。已经发现大量MC1R基因的已研究过性质的突变体与红发,白肤和雀斑倾向表型有关。超过一半的红发个体带有至少一种这些MC1R变体(Valverde,P.等,Nat.Genet.11(3):328-30(1995);Palmer,J.S.等,Am.J.Hum.Genet.66(1):176-86(2000))。后来,显示出同样的变体在单一变体时产生大约2.0的CMM比值比,而在组合的杂合子时产生大约4.0的比值比。最近的研究显示,较强的MC1R变体增加了CDKN2a突变的外显率,并降低了发病年龄(Box,N.F.等,Am.J.Hum.Genet.69(4):765-73(2001);van der Velden,P.A.等,Am.J.Hum.Genet.,69(4):774-79(2001))。
许多其它的候选基因被暗示与CMM有关。例如,癌症基因组学中的一项划时代的研究在60%的黑色素瘤中鉴定出了BRAF(v-raf鼠肉瘤病毒致癌基因的人类B1同源物)的体细胞突变(Davies,H.等,Nature 417(6892):949-54(2002))。突变在典型的和非典型的痣中也是常见的,表明突变是早期事件。同上。生殖系突变还没有被报道,但是,BRAF的生殖系SNP变体已经被暗示与CMM风险有关(Meyer,P.等,J.Carcinog.2(1):7(2003))。其它通过相关研究鉴定的并被暗示与CMM风险有关的候选基因包括例如XRCC3,XPD,EGF,VDR,NBS1,CYP2D6和GSTM1(Hayward,N.K.,Oncogene,22(20):3053-62(2003))。但是,这些相关研究通常具有样品数少,依赖单一SNPs和潜在的群体分层的问题。
显然,负责对具体形式的癌症(例如***癌,乳腺癌,肺癌,黑色素瘤,结肠癌,睾丸癌)的易感性的标记物和基因的鉴定,是目前肿瘤学面对的主要挑战之一。某些在癌症下潜伏的途径在不同形式的癌症中是共有的。因此,针对一种特定形式的癌症鉴定到的遗传风险因子可能也代表了其它癌症类型的风险因子。因此,使用这些风险因子的诊断和治疗方法可能具有通用性。因此,被开发的靶向这些风险因子的治疗措施可能对癌症总体来说有意义,而不一定仅仅针对风险因子最初从其中鉴定的癌症。对于用于对癌症具有遗传易感性的个体进行早期检测,以便设立更具攻击性的筛查和干预方案进行癌症早期诊断和治疗的鉴定手段,存在着需求。癌症基因也可以揭示出可以***纵的(例如使用小或大分子量药物)关键分子途径,可以导致产生更有效的治疗,而不论具体的癌症首先被诊断出来时的癌症阶段。
发明简述
正如本文所述,已经发现在染色体8q24.21的特定DNA片段中的特定标记物单倍型对特定癌症易感性有指示作用。
第一方面,本发明涉及了用于在人类个体中诊断对癌症易感性的方法,包括在从个体获得的核酸样品中测定至少一个多态性标记物的至少一个等位基因的存在或不存在,其中至少一个多态性标记物与SEQ ID NO:2有关,其中至少一个等位基因的存在是癌症易感性的指示。在一个实施方案中,至少一个标记物与SEQ ID NO:1有关。在另一个实施方案中,至少一个标记物位于其核苷酸序列显示在SEQ IDNO:2中的基因组区域内。在可选实施方案中,至少一个标记物位于其核苷酸序列显示在SEQ ID NO:1中的基因组区域内。在一个优选实施方案中,至少一个多态性标记物包括选自表5A,5B和5C中显示的标记物组中的至少一个标记物。
由于连锁不平衡的性质,本发明可以使用各种不同的处于连锁不平衡中的多态性标记物来实施。因此,在另一个实施方案中,至少一个标记物包括Chr8q24.21中与一个或多个选自表4A和4B中显示的标记物的标记物强烈连锁不平衡的至少一个标记物,强烈连锁不平衡由|D’|>0.8和/或r2>0.2定义。在另一个实施方案中,至少一个多态性标记物与HapC连锁不平衡。在一个优选实施方案中,至少一个标记物是标记物rs16901979(SEQ ID NO:73)以及与其连锁不平衡的标记物。在另一个优选实施方案中,至少一个标记物选自表4A和4B中显示的标记物。
在本发明的某些实施方案中,诊断癌症易感性的方法还包括评估该个体中至少一个单倍型的频率。在一个这样的实施方案中,单倍型包含标记物rs1456314等位基因G,rs17831626等位基因T,rs7825414等位基因G,rs6993569等位基因G,rs6994316等位基因A,rs6470494等位基因T,rs1016342等位基因C,rs1031588等位基因G,rs1016343等位基因T,rs1551510等位基因G,rs1456306等位基因C,rs1378897等位基因G,rs1456305等位基因T,rs7816535等位基因G。
在本发明的某些实施方案中,易感性用相对风险(RR)的值表示。在其它实施方案中,易感性用比值比(OR)表示。在诊断癌症易感性方法的某些实施方案中,易感性是增加的易感性,其特征为RR或OR值大于1。在其它实施方案中,易感性是减小的易感性,其特征为RR或OR值小于1。在本发明的具体实施方案中,增加的易感性的特征为相对风险为至少1.5,包括相对风险至少1.7,相对风险至少2.0,相对风险至少2.5,相对风险至少3.0,相对风险至少3.5,和相对风险至少4.0。其它实施方案的特征为相对风险为至少1.75,2.25,2.75,3.25,3.75等。但是,其它相对风险值也在本发明的范围内。
在本发明的某些其它实施方案中,发现某些等位基因或单倍型在患者中的频率低于在人群中的频率。因此,发现某些等位基因或单倍型在被诊断患有具体癌症(例如***癌)或具有患具体癌症风险的个体中的频率低于在总人群中的频率。这种标记物是针对癌症的保护,或对发生这些疾病的降低的易感性的指示。在具体的实施方案中,降低的易感性的特征为相对风险小于0.7,包括相对风险小于0.6,相对风险小于0.5,相对风险小于0.4,相对风险小于0.35,相对风险小于0.3和相对风险小于0.25。但是,其它表征降低的易感性或减小的风险的相对风险值也是可能的,并在本发明的范围内,包括但不限于小于0.8,小于0.75,小于0.65,小于0.55,小于0.45,小于0.20,等等。
在本发明方法的具体实施方案中,至少一个标记物或单倍型包括rs16901979等位基因1,该至少一个标记物或单倍型赋予了对癌症的增加的易感性。在另一个这样的实施方案中,至少一个标记物或单倍型是标记物rs16901979等位基因1。在本发明方法的另一个具体实施方案中,至少一个标记物或单倍型包括rs16901979等位基因2,该至少一个标记物或单倍型赋予了对癌症的增加的易感性。在另一个这样的实施方案中,至少一个标记物或单倍型是标记物rs16901979等位基因2。
在本发明方法的某些实施方案中,癌症选自***癌,结肠癌,乳腺癌,睾丸癌,肺癌和黑色素瘤癌症。在优选实施方案中,癌症是***癌。
在一个实施方案中,***癌是由组合Gleason分值7(4+3)-10定义的侵略性***癌。在另一个实施方案中,***癌是由组合Gleason分值2-7(3+4)定义的侵略性较低的***癌。在一个实施方案中,至少一个标记物或单倍型是更具侵略性的***癌和/或更糟的预后的指示。
本发明的另一个实施方案涉及作为对象对具体治疗模式的不同反应率的指示的标记物或单倍型的存在。在另一个实施方案中,至少一个标记物或单倍型的存在表明了在肿瘤或其前体中Chr8q24.21的体细胞重排的倾向性。在一个这样的实施方案中,体细胞重排选自扩增,易位,***和缺失。
在某些实施方案中,本发明的方法,应用和试剂盒可以涉及具有特定血统的个体。因此。在本发明的一个实施方案中,个体具有特定的血统。在另一个实施方案中,血统是非洲黑人血统。正如在本文中进一步详细描述的那样,通过本发明的方法评估其它个体的血统也是可能的,并且也在本发明的范围内。在一个实施方案中,血统是自己报告的。在另一个实施方案中,血统是通过在个体的样品中检测至少一个多态性标记物的至少一个等位基因来确定的,其中等位基因的存在或不存在是个体血统的指示。
另一方面,本发明涉及用于评估癌症易感性的标记物的鉴定方法,该方法包括
a.鉴定SEQ ID NO:2中的至少一个多态性标记物,或与其连锁不平衡的至少一个多态性标记物;
b.确定被诊断患有***癌或具有***癌易感性的个体的样品的基因型状态;以及
c.确定对照个体样品的基因型状态;
其中在被诊断患有***癌或具有***癌易感性的个体中至少一个等位基因在至少一种多态性上的频率,与对照样品中至少一个等位基因的频率相比的显著差异,表明至少一种多态性可用于评估对癌症的易感性。
在一个具体的实施方案中,连锁不平衡的特征为r2的数值大于0.2和/或|D’|大于0.8。在另一个实施方案中,至少一个多态性标记物与HapC和/或标记物rs16901979连锁不平衡,其特征为r2的数值大于0.2和/或|D’|大于0.8。在另一个实施方案中,在被诊断患有癌症或具有癌症易感性的个体中至少一个等位基因在至少一种多态性上的频率,与对照样品中至少一个等位基因的频率相比的增加,表明至少一种多态性可用于评估对癌症的增加的易感性。在另一个实施方案中,在被诊断患有剥脱性综合症或具有剥脱性综合症易感性的个体中至少一个等位基因在至少一种多态性上的频率,与对照样品中至少一个等位基因的频率相比的降低,表明至少一种多态性可用于评估对癌症的减小的易感性或针对癌症的保护。
另一方面,本发明涉及了对从具有癌症风险或被诊断患有癌症的人类个体获得的核酸样品进行基因分型的方法,包括确定样品中至少一个多态性标记物的至少一个等位基因的存在或不存在,其中至少一个标记物选自表4A和4B中显示的标记物以及与其连锁不平衡的标记物,其中至少一个多态性标记物的至少一个等位基因的存在或不存在是癌症易感性的指示。在一个实施方案中,至少一个标记物是rs16901979(SEQ ID NO:73)以及与其连锁不平衡的标记物。在另一个实施方案中,连锁不平衡由r2的数值至少0.2和/或|D’|的数值至少0.8来确定。在另一个实施方案中,基因分型包括使用位于至少一个多态性标记物侧翼的核苷酸引物对,通过聚合酶链反应(PCR)来扩增含有至少一个多态性标记物的核酸片段。在另一个实施方案中,基因分型使用选自等位基因特异性探针杂交,等位基因特异性引物延伸,等位基因特异性扩增,核酸测序,5’-外切核酸酶消化,分子信标分析,寡核苷酸连接分析,大小分析以及单链构象分析的方法来进行。在一个这样的实施方案中,方法包括等位基因特异性探针杂交。在另一个实施方案中,方法包括核酸测序。在另一个实施方案中,核酸测序是DNA测序。
本发明的基因分型方法的一个实施方案包括下列步骤:
1)将核酸的拷贝与检测寡核苷酸探针和增强子寡核苷酸探针在允许寡核苷酸探针与核酸特异性杂交的条件下相接触;其中
a)检测寡核苷酸探针长度为5-100个核苷酸,并与含有至少一个多态性位点,其核苷酸序列在SEQ ID NO:2中给出的核酸的第一个片段特异性杂交;
b)检测寡核苷酸探针在其3’末端含有可检测标记,在其5’末端含有淬灭基团;
c)增强子寡核苷酸长度为5-100个核苷酸,并与相对于寡核苷酸探针5’方向的核苷酸序列的第二个片段互补,以便当这两个寡核苷酸都与核酸杂交时,增强子寡核苷酸位于检测寡核苷酸的3’方向;以及
d)在第一个片段和第二个片段之间存在单个碱基缺口,使得当寡核苷酸探针和增强子寡核苷酸探针都与核酸杂交时,在寡核苷酸之间存在单个碱基缺口;
2)使用当检测探针与核酸杂交时将从检测探针的3’末端裂解可检测标记以释放游离的可检测标记的核酸内切酶处理核酸;以及
3)测量游离的可检测标记,其中游离的可检测标记的存在表明检测探针与核酸的第一个片段特异性杂交,并表明多态性位点的序列与检测探针互补。
在具体的实施方案中,核酸的拷贝通过聚合酶链反应(PCR)扩增来提供。在某些实施方案中,被检测的易感性是增加的易感性。在其它实施方案中,易感性是降低的易感性。在具体的实施方案中,癌症选自***癌,结肠癌,乳腺癌,肺癌,睾丸癌和黑色素瘤。在优选实施方案中,癌症是***癌。在一个这样的实施方案中,***癌是由组合Gleason分值7(4+3)-10定义的侵略性***癌。在另一个这样的实施方案中,***癌是由组合Gleason分值2-7(3+4)定义的侵略性较低的***癌。
在某些实施方案中,用于评估癌症易感性的标记物的鉴定方法和基因分型的方法,施用在具有特定血统的个体上。一个这样的实施方案中,血统是非洲黑人血统。正如在本文中详细描述的那样,其它血统也在本发明的范围内。在一个实施方案中,血统是自己报告的。在另一个实施方案中,血统是通过在个体的样品中检测至少一个多态性标记物的至少一个等位基因来确定的,其中等位基因的存在或不存在是个体血统的指示。
本发明的另一方面涉及用于评估个体对预防和/或缓解与癌症相关的症状的治疗剂的反应的可能性的方法,包括:在从个体获得的核酸样品中确定至少一个多态性标记物的至少一个等位基因的存在或不存在,其中至少一个多态性标记物选自表5A,5B和5C中列出的多态性标记物,以及与其连锁不平衡的标记物,其中至少一个标记物的至少一个等位基因的存在,表明对与剥脱性综合症和/或青光眼有关的症状的治疗药剂作出阳性反应的可能性。本发明的另一方面涉及预测被诊断患有癌症的个体的预后的方法,该方法包括确定从个体获得的核酸样品中至少一个多态性标记物的至少一个等位基因的存在或不存在,其中至少一个多态性标记物选自表5A,5B和5C中列出的多态性标记物,以及与其连锁不平衡的标记物,其中至少一个等位基因的存在表明了个体中癌症的更糟的预后。本发明的另一方面涉及监测经历癌症治疗的个体的治疗进展的方法,该方法包括确定从个体获得的核酸样品中至少一个多态性标记物的至少一个等位基因的存在或不存在,其中至少一个多态性标记物选自表5A,5B和5C中列出的多态性标记物,以及与其连锁不平衡的标记物,其中至少一个等位基因的存在表明了个体的治疗结果。在这些方面的任何一种情况下,在一个实施例中,至少一个多态性标记物是rs16901979(SEQ ID NO:73)以及与其连锁不平衡的标记物。在另一个实施方案中,连锁不平衡由r2的数值为至少0.2和/或|D’|的值为至少0.8来定义。在一个优选实施方案中,癌症是***癌。在一个这样的实施方案中,***癌是由组合Gleason分值7(4+3)-10定义的侵略性***癌。在另一个实施方案中,***癌是由组合Gleason分值2-7(3+4)定义的侵略性较低的***癌。
本发明的方法可以照原样使用。在某些实施方案中,方法还可以与在本文描述的方法中其他有用的方法组合使用。在一个这样的实施方案中,方法还包括评估个体的样品中的至少一种生物标记物。生物标记物可以是在本文描述的方法的基础上可用于帮助作出任何决定的任何生物标记物。在一个实施方案中,生物标记物是PSA。在另一个实施方案中,样品是血液样品或癌症活检样品。但是,其它可用于实施本发明的样品类型也被考虑到了,并包含在本发明的范围内,例如其它体液或来自任何人类组织类型的组织样品。
本发明的方法的其它实施方案还包括分析个体的非遗传信息以进行风险评估,诊断或预后。在一个实施方案中,非遗传信息选自年龄,性别,种族,社会经济状况,以前的疾病诊断,对象的医学史,癌症的家族史,生物化学测量和临床测量。在优选实施方案中,该方法还包括根据遗传和非遗传信息计算总风险。
本发明的另一方面涉及用于在人类个体中评估癌症易感性的试剂盒,试剂盒含有选择性检测个体的基因组中至少一个多态性标记物的至少一个等位基因的试剂,其中多态性标记物选自其序列显示在SEQIN NO:2中的片段中的多态性标记物,以及与其连锁不平衡的标记物,其中至少一个等位基因的存在表明了对癌症的易感性。在一个实施方案中,试剂盒含有至少一种选自表5A,5B和5C中显示的标记物的多态性标记物,以及与其连锁不平衡的标记物。在另一个实施方案中,至少一个多态性标记物选自表4A和4B中显示的标记物。在一个优选实施方案中,至少一个多态性标记物选自rs16901979(SEQ ID NO:73)以及与其连锁不平衡的标记物。在另一个实施方案中,至少一个多态性标记物是rs16901979。在一个实施方案中,连锁不平衡由r2的数值为至少0.2和/或|D’|的值为至少0.8来定义。在另一个实施方案中,癌症选自***癌,结肠癌,乳腺癌,睾丸癌,肺癌和黑色素瘤癌症。在优选实施方案中,癌症是***癌。在一个这样的实施方案中,***癌是由组合Gleason分值7(4+3)-10定义的侵略性***癌。在另一个实施方案中,***癌是由组合Gleason分值2-7(3+4)定义的侵略性较低的***癌。
本发明的试剂盒可用于本文描述的本发明的任何方法。因此,含有本文描述的用于特异性检测至少一个多态性标记物的至少一个等位基因的试剂的试剂盒,可用于实施本文描述的任何方法,这对于专业技术人员来说将是显然的。
在本发明的试剂盒的一个实施方案中,试剂含有至少一个与个体的基因组的含有至少一个多态性标记物的片段杂交的邻接的寡核苷酸,缓冲液和可检测标记。在一个实施方案中,试剂含有至少一对与从对象获得的基因组核酸片段的反向链杂交的寡核苷酸,其中每个寡核苷酸引物对被设计成能选择性扩增个体的基因组中包含一个多态性标记物的片段,其中片段的大小为至少30个碱基对。在优选实施方案中,至少一个寡核苷酸与个体的基因组完全互补。在另一个实施方案中,寡核苷酸的长度为大约18到大约50个核苷酸。在另一个实施方案中,寡核苷酸的长度为20-30个核苷酸。
在本发明的试剂盒的一个优选实施方案中,试剂盒含有:
a.长度为5-100个核苷酸的检测寡核苷酸探针;
b.长度为5-100个核苷酸的增强子寡核苷酸探针;以及
c.内切核酸酶;
其中检测寡核苷酸探针与其核苷酸序列在SEQ ID NO:2中给出的核酸的含有至少一个多态性位点的第一个片段特异性杂交;并且
其中检测寡核苷酸探针在其3’末端含有可检测标记,在其5’末端含有淬灭基团;
其中增强子寡核苷酸长度为5-100个核苷酸,并与相对于寡核苷酸探针5’方向的核苷酸序列的第二个片段互补,以便当两个寡核苷酸都与核酸杂交时,增强子寡核苷酸位于检测寡核苷酸探针的3’方向;
其中在第一个片段和第二个片段之间存在单个碱基缺口,使得当寡核苷酸探针和增强子寡核苷酸探针都与核酸杂交时,在寡核苷酸之间存在单个碱基缺口;以及
其中当检测探针与核酸杂交时,使用内切核酸酶处理核酸将从检测探针的3’末端裂解可检测标记以释放游离的可检测标记。
本发明的另一方面涉及寡核苷酸探针在制造用于在人类个体中诊断和/或评估癌症易感性的诊断试剂中的应用,其中探针与其核苷酸序列在SEQ ID NO:2中给出的核酸的含有至少一个多态性位点的片段杂交,其中片段的长度为15-500个核苷酸。在一个实施方案中,多态性位点选自表5A,5B和5C中显示的多态性标记物,以及与其连锁不平衡的多态性。在另一个实施方案中,多态性位点是rs16901979(SEQ IDNO:73)。在一个实施方案中,癌症选自***癌,结肠癌,乳腺癌,睾丸癌,肺癌和黑色素瘤癌症。在优选实施方案中,癌症是***癌。在一个这样的实施方案中,***癌是由组合Gleason分值7(4+3)-10定义的侵略性***癌。在另一个实施方案中,***癌是由组合Gleason分值2-7(3+4)定义的侵略性较低的***癌。
另一方面,本发明涉及了计算机可读介质,其中储存有:
a.至少一个多态性标记物的识别符;
b.该至少一个多态性标记物的至少一个等位基因在多个被诊断患有癌症的个体中的频率的指示符;以及
c.该至少一个多态性标记物的至少一个等位基因在多个参比个体中的频率的指示符;
其中至少一个多态性标记物选自表5A,5B和5C中显示的多态性标记物,以及与其连锁不平衡的多态性。
在一个实施方案中,多态性位点是标记物rs16901979(SEQ IDNO:73),以及与其连锁不平衡的标记物,它们由r2的数值为至少0.2和/或|D’|的值为至少0.8所定义。在另一个实施方案中,癌症选自***癌,结肠癌,乳腺癌,睾丸癌,肺癌和黑色素瘤癌症。在优选实施方案中,癌症是***癌。在一个这样的实施方案中,***癌是由组合Gleason分值7(4+3)-10定义的侵略性***癌。在另一个实施方案中,***癌是由组合Gleason分值2-7(3+4)定义的侵略性较低的***癌。
在某些实施方案中,本发明的计算机可读的介质可含有与多个个体的血统有关的信息。在另一个实施方案中,被诊断患有癌症的多个个体和多个参比个体具有特定的血统。在一个实施方案中,血统是非洲黑人血统。在另一个实施方案中,血统是自己报告的。在另一个实施方案中,血统是通过对多个多态性标记物进行基因分型以评估血统而在遗传上确定的,正如在本文中进一步描述的那样。
本发明还涉及了用于在人类个体中测定遗传指示符的装置,包含:
计算机可读内存:以及
储存在计算机可读内存中的例行程序;
其中例行程序适用于在处理器上执行,以分析至少一个人类个体的至少一个多态性标记物的标记物和/或单倍型信息,其中该至少一个多态性标记物选自表5A,5B和5C中显示的标记物以及与其连锁不平衡的标记物,并根据标记物或单倍型信息产生输出,其中输出包括作为人类个体的癌症遗传指示符的至少一个标记物或单倍型的风险测量。在一个实施方案中,例行程序还包含多个被诊断患有癌症的个体中至少一个多态性标记物或至少一个单倍型的至少一个等位基因的频率的指示符,以及多个参比个体中至少一个多态性标记物或至少一个单倍型的至少一个等位基因的频率的指示符,其中风险测量是基于人类个体的至少一个标记物和/或单倍型状态与多个被诊断患有癌症的个体的至少一个标记物和/或单倍型信息的频率指示符的比较。
在一个实施方案中,至少一个多态性标记物是rs16901979(SEQ IDNO:73)以及与其连锁不平衡的标记物,它们由r2的数值为至少0.2和/或|D’|的值为至少0.8所定义。在另一个实施方案中,风险测量用比值比(OR)和相对风险(RR)来表征。
附图简述
从下面对本发明的优选实施方案的更具体的描述并参考随附的图的说明,本发明的上述以及其它的目标,特点和优点将变得明显。
图1描绘了Chr8q24.21LD区块C区域中的LD结构(HAPMAP)。高加索人(CEU)的LD结构显示在(A)中,来自约鲁巴人(YRI)的非洲人的LD结构显示在(B)中。粗的对角线表示LD区块C(SEQID NO:1)的位置。每个标记物以连续的顺序显示,两个相邻标记物之间的距离相等。
图2描绘了Chr8q24.21区域中LD区块C’(SEQ ID NO:2)的LD结构。确定的LD区块与LD区块C重叠,表示对本文描述的与***癌相关的变体所位于的区域进行的精确的分析。高加索人(CEU)的LD结构显示在(A)中,而来自约鲁巴人(YRI)的非洲人的LD结构显示在(B)中。粗的对角线表示LD区块C的位置。每个标记物以连续的顺序显示,两个相邻标记物之间的距离相等。
发明详述
定义
在本发明的文本中,下面的术语将具有所指的意义:
本文描述的“多态性标记物”,有时被称为“标记物”,是指基因组多态性位点。每种多态性标记物具有至少两个序列变体,代表了具体的等位基因在多态性位点处的特征。因此,与多态性标记物的关联表明存在与该具体多态性标记物的至少一个特定等位基因的关联。标记物可以含有在基因组中发现的任何变体类型的任何等位基因,包括单核苷酸多态性(SNPs),微卫星,***,缺失,重复和易位。
“等位基因”是指染色体上给定位点(位置)的核苷酸序列。因此,多态性标记物等位基因是指染色体上标记物的组成(即序列)。来自个体的基因组DNA对于任何给定的多态性标记物来说含有两个等位基因,代表了每条染色体上标记物的每个拷贝。
在本文中,在群体中(自然群体或合成的群体,例如合成分子的文库)其上可能存在一种以上序列的核苷酸位置被称为“多态性位点”。
“单核苷酸多态性”或“SNP”是当基因组中特定位置上的单个核苷酸在物种的成员之间或一个个体中成对的染色体之间不同时所发生的DNA序列变异。大多数SNP多态性具有两个等位基因。在这种情况下,每个个体或者是多态性的一个等位基因的纯合子(即个体的两个染色体拷贝在SNP位置处具有同样的核苷酸),或者个体是杂合子(即个体的两条姊妹染色体含有不同的核苷酸)。在本文中报告的SNP的命名是指官方的参考SNP(rs)ID身份标签,是由国家生物技术信息中心(NCBI)指定给每个独特的SNP的。
本文描述的“变体”是指与参比DNA不同的DNA区段。“标记物”或“多态性标记物”按照本文的定义,是变体。与参比不同的等位基因被称为“变体”等位基因。
本文描述的核苷酸或蛋白“片段”,包括核苷酸或蛋白的全部或一部分。
本文描述的“动物”是指任何家畜(例如猫,狗等),农用动物(例如牛,马,绵羊,鸡等)或实验动物(例如兔,小鼠,大鼠等),也包括人类。
本文描述的“微卫星”是在特定位点具有多个小的长度为2-8个核苷酸的碱基重复(例如CA重复)的多态性标记物,其中重复长度的数量在总群体中是变化的。
本文描述的“***缺失(indel)”是常见的多态性形式,含有一般只有几个核苷酸长的小的***或缺失。
本文描述的“单倍型”是指一条DNA链中的一段基因组DNA,其特征为沿着区段排列有等位基因的特定组合。对于二倍体生物例如人类来说,单倍型含有每个多态性标记物或位点的等位基因对的一个成员。在某些实施方案中,单倍型可以含有两个或两个以上等位基因,三个或三个以上等位基因,四个或四个以上等位基因,或五个或五个以上等位基因。
本文描述的术语“易感性”包含了增加的易感性和降低的易感性。因此,本发明的具体的多态性标记物和/或单倍型的特征可以是青光眼的增加的易感性(即增加的风险),被表征为相对风险(RR)大于1。或者,本发明的标记物和/或单倍型的特征在于是青光眼的降低的易感性(即降低的风险),被表征为相对风险小于1。
本文描述的“核酸样品”是从个体获得的含有核酸(DNA或RNA)的样品。在某些实施方案,即在特定多态性标记物和/或单倍型的检测中,核酸样品包含基因组DNA。这样的核酸样品可以从任何含有基因组DNA的来源获得,包括例如血液样品,羊水样品,脑脊液样品,或来自皮肤,肌肉,口腔或结膜粘膜(口腔拭子),胎盘,胃肠道或其它器官的组织样品。
本文使用的“Chr8q24.21”和“8q24.21”是指染色体条带8q24.21,粗略对应于UCSC Build 34(来自于www.genome.ucsc.edu的UCSC基因组浏览器Build 34)中的127,200,001-131,400,000bp位置。
本文使用的“LD区块C”是指Chr8q24.21上的LD区块,在其中观察到了变体与癌症,即***癌,乳腺癌,肺癌和黑色素瘤的相关性。该LD区块的NCBI Build 34位置是从128,032,278到128,094,256bp(SEQ ID NO:1)。
本文使用的“LD区块C’”是指Chr8q24.21上的LD区块,在其中可以优选检测到变体与癌症的相关性。该LD区块的NCBI Build 34位置是从128,029,113到128,126,447,其序列显示在SEQ ID NO:2Bp中。在NCBI Builds 35和36中,该区域的位置是从128,141,706位到128,239,040位。LD区块C’区域在Builds 34,35和36中是相同的,总跨度为97,335bp。
在本文描述的术语“非洲血统”是指个体自己报告的非洲血统。
术语“癌症治疗药剂”是指可用于缓解或预防与癌症(即***癌,乳腺癌,肺癌和/或黑色素瘤)相关的症状的药剂。
术语“与SEQ ID NO:2相关”,“与SEQ ID NO:1相关”,“与LD区块C相关”和“与LD区块C’相关”,是指那些与SEQ ID NO:2,SEQ ID NO:1,LD区块C和LD区块C’代表的基因组区段连锁不平衡(LD)的DNA区段(例如多态性标记物)。在某些实施方案中,这些DNA区段与SEQ ID NO:2,SEQ ID NO:1,LD区块或LD区块C’中的一个或多个标记物连锁不平衡,测量到的|D’|值大于0.8和/或r2值大于0.2。
与Chr8q24.21的关联
正如上面讨论的,最近已经报道了与染色体8q24.21的连锁以及与连锁区域中连锁不平衡(LD)区块的关联。正如本文描述的,现在令人吃惊地发现,在染色体8q24.21区域中外延的LD(即另一个LD区块)的另一个DNA区段中也存在有与癌症相关的变体(标记物和/或单倍型)。检测到的关联性不依赖于以前在该区域中检测到的关联性,这是令本发明人吃惊的结果。在本发明的一个实施方案中,关联性通过单倍型HapC检测,它含有标记物rs1456314等位基因G,rs17831626等位基因T,rs7825414等位基因G,rs6993569等位基因G,rs6994316等位基因A,rs6470494等位基因T,rs1016342等位基因C,rs1031588等位基因G,rs1016343等位基因T,rs1551510等位基因G,rs1456306等位基因C,rs1378897等位基因G,rs1456305等位基因T和rs7816535等位基因G。当与其它与人类性状有关的变体一起时,可以描述到大量的替代变体(标记物和/或单倍型)。对于HapC来说一个这样的替代标记物是标记物rs16901979。最可能带有替代变体的区域通常被定义为外延连锁不平衡区域,即本文中进一步描述的所谓连锁不平衡区块(LD区块)。在一个实施方案中,含有与癌症相关的变体的LD区块是序列显示在SEQ ID NO:1中的LD区块C。对本发明人最初检测到的信号进行进一步精炼后,将染色体8q24.21上两个重组热点之间的区域定义为LD区块C’。热点位于染色体8上大约128,029,113和128,126,447的位置,由此确定的区域显示在SEQ ID NO:2中。HapC的替代标记物和/或单倍型rs16901979可以在所定义的任一个LD区块(即SEQ ID NO:1和SEQ ID NO:2)中发现,并将在本文中进一步详细描述。
在本发明的各种不同实施方案中,使用本文描述的方法鉴定的某些标记物和/或单倍型,可用于诊断对癌症(例如***癌)的增加的易感性,也可用于诊断对癌症(例如***癌)的降低的易感性,即用于鉴定对癌症(例如***癌)具有保护性的变体。下面描述的诊断分析方法可用于鉴定这些具体变体的存在或不存在。
Gleason评分时最经常使用的***癌分级***(DeMarzo,A.M.等,Lancet 361:955-64(2003))。该***是基于发现了***癌的预后介于癌症的最优势型和第二优势型的预后之间。从***肿瘤的组织学样品中鉴定这些优势的和第二普遍的型,对每种进行评分,从1(分化最高的)到5(分化最低的),并将两个分值相加。因此,组合的Gleason级别,也被称为Gleason总和或分值,范围从2(1型的一致肿瘤)到10(未分化的肿瘤)。许多具有不同型的病例,特别是在穿刺活检的样品上,型的差异不会超过一个型。
Gleason分值是预后指示符,其中主要的预后转变在6和7之间,因为Gleason分值7的肿瘤表现得更糟,与分值5或6的肿瘤相比导致更高的发病率和更高的死亡率。分值7的肿瘤还可以被细分为3+4或4+3(第一个数字是活检肿瘤样品中的优势组织学亚型,第二个数字是次优势组织学亚型),其中分值4+3与更糟的预后相关。患者的Gleason分值也可以影响到治疗选择。例如,在穿刺活检样品上具有有限量的Gleason分值5-6并具有低PSA浓度的较年轻男性可以仅仅进行监测,而Gleason分值为7或以上的男性通常需要接受主动管理。在表1中,显示了侵略性***癌(即组合Gleason分值为7(只包括4+3)到10所表明的)和较低侵略性***癌(即组合Gleason分值为2到7(只包括3+4)所表明的)的单倍型频率和相关的风险。但是,Gleason分值不是预后的完善的预测指示符。因此,具有低Gleason分值肿瘤的患者仍然可能患有高侵略性***癌(由肿瘤超出了***局部或通过远处转移来定义)。
在本文描述的某些方法中,具有癌症(例如***癌(侵略性或高Gleason等级***癌,低侵略性或低Gleason等级***癌))风险(增加的易感性)的个体,是被鉴定到风险标记物或单倍型的个体。在一个实施方案中,标记物或单倍型关联的强度由相对风险(RR)来度量。RR是带有一个拷贝的标记物或单倍型的对象中病症的发生率与不带有标记物或单倍型的对象中病症的发生率之间的比率。该比率等价于带有两个拷贝的标记物或单倍型的对象中病症的发生率与带有一个拷贝的标记物或单倍型的对象中病症的发生率之间的比率。
在一个实施方案中,本发明是诊断对***癌(例如侵略性或高Gleason等级***癌,低侵略性或低Gleason等级***癌)易感性的方法,包括检测与LD区块C相关的标记物或单倍型(例如表5中显示的标记物或单倍型,具有大于1的相对风险(RR)值表明标记物与疾病的增加的易感性/疾病的增加的风险有关,因此是“有风险”变体;具有小于1的RR值的标记物或单倍型表明标记物与疾病的降低的易感性/疾病的降低的风险有关,因此是“保护性”变体),其中标记物或单倍型的存在是对***癌易感性的指示。
在另一个实施方案中,本发明是诊断对***癌(例如侵略性或高Gleason等级***癌,低侵略性或低Gleason等级***癌)易感性的方法,包括检测标记物rs16901979。在一个实施方案中,易感性是增加的易感性,其中标记物rs16901979处1等位基因的存在是对***癌的增加的易感性的指示。在另一个实施方案中,本发明是在其血统包括非洲血统的个体中诊断对***癌增加的易感性的方法,包括检测标记物rs16901979,其中标记物rs16901979处1等位基因的存在是对***癌的增加的易感性或***癌增加的风险的指示。在具体的实施方案中,与***癌易感性有关的标记物或单倍型具有至少1.3的相对风险,例如至少1.5或至少1.7或至少2.0。在另一个实施方案中,***癌是侵略性***癌,由组合Gleason分值为7(4+3)到10所定义,和/或***癌的晚期阶段(例如2到4期)。在另一个实施方案中,***癌是较低侵略性***癌,由组合Gleason分值为2到7(3+4)所定义,和/或***癌的早期阶段(例如1期)。在另一个实施方案中,与LD区块C有关的标记物或单倍型的存在,以及对象具有大于4ng/ml的PSA水平,表明了更具侵略性的***癌和/或更糟的预后。在另一个实施方案中,在具有正常PSA水平(例如小于4ng/ml)的患者中,标记物或单倍型的存在表明了更具侵略性的***癌和/或更糟的预后。
在另一个实施方案中,本发明是诊断对***癌降低的易感性的方法,包括检测与LD区块C有关的标记物或单倍型,其中该标记物或单倍型的存在是对***癌降低的易感性或针对***癌的保护性标记物或单倍型的指示。因此,在一个实施方案中,易感性是降低的易感性,其中标记物rs16901979处等位基因2的存在表明了对***癌的降低的易感性。在另一个实施方案中,本发明是在其血统包含非洲人血统的个体中诊断对***癌降低的易感性的方法,包括检测标记物rs16901979,其中标记物rs16901979处s等位基因的存在是对***癌降低的易感性或***癌降低的风险的指示。
本发明的染色体8q24.21上的区段已经被发现在其他形式的癌症中扮演重要角色,例如乳腺癌,结肠癌,肺癌和黑色素瘤。已经发现,在乳腺癌对象中,区域中特定DNA区段中特定的标记物和/或单倍型存在的频率高于预期频率。因此,在一个实施方案中,本发明是诊断对选自乳腺癌,结肠癌,肺癌和黑色素瘤的癌症的增加的易感性的方法,包括检测与序列显示在SEQ ID NO:1或SEQ ID NO:2中的基因组区段有关的标记物或单倍型,其中标记物或单倍型的存在是对癌症(例如乳腺癌,结肠癌,肺癌和黑色素瘤)增加的易感性的指示。在具体的实施方案中,与癌症(即乳腺癌,结肠癌,肺癌和黑色素瘤)的易感性有关的标记物或单倍型具有至少1.3的相对风险,例如至少1.5,至少1.7或至少2.0。在其它实施方案中,本发明涉及诊断对癌症(即乳腺癌,肺癌和黑色素瘤)降低的易感性的方法,包括检测与序列显示在SEQ ID NO:1或SEQ ID NO:2中的基因组区段有关的标记物或单倍型,其中标记物或单倍型的存在是对癌症降低的易感性或针对乳腺癌的保护性标记物或单倍型(针对癌症(即乳腺癌,肺癌和黑色素瘤)具有保护性)的指示。在具体的实施方案中,与癌症(即乳腺癌,肺癌和黑色素瘤)的降低的易感性有关的标记物或单倍型具有小于0.9的相对风险,例如小于0.8,小于0.7,小于0.6和小于0.5。在另一个实施方案中,黑色素瘤是恶性皮肤性黑色素瘤。
对标记物和单倍型的评估
当在个体间进行比较时,种群中的基因组序列是不相同的。相反,个体间在基因组中的许多位置上表现出了序列变化性。这种序列的变化通常被称为多态性,在每个基因组中有许多这样的位点。例如,人类基因组表现出在平均每500个碱基对就发生序列变异。最常见的序列变异包括基因组中单一碱基位置的碱基变化,这种序列变异或多态性,通常被称为单核苷酸多态性(“SNPs”)。这些SNPs据信是在单个突变事件中发生的,因此通常可能在每个SNP位点存在两个可能的等位基因;原始的等位基因和突变的等位基因。由于自然遗传漂移并可能也由于选择压力,最初的突变产生了多态性,其特征为在任何给定的群体中其等位基因的特定频率。在人类基因组中发现了许多其它类型的序列变异体,包括微卫星,***,缺失,倒置和拷贝数变化。多态性微卫星在特定位点含有多个小的碱基重复(例如CA重复,互补链上的TG重复),重复的长度的数量在总群体中是变化的。概括地说,多态性位点的每个版本的序列都代表了多态性位点的特定等位基因。这些序列变体都可以被称为多态性,它们发生在特定多态性位点,表明了所述序列变体的特征。概括地说,多态性可以包含任何数量的特定等位基因。因此,在本发明的一个实施方案中,多态性的特征为在任何给定群体中存在两种或两种以上等位基因。在另一个实施方案中,多态性的特征为存在三种或三种以上等位基因。在其它实施方案中,多态性的特征为四种或四种以上等位基因,五种或五种以上等位基因,六种或六种以上等位基因,七种或七种以上等位基因,九种或九种以上等位基因或十种或十种以上等位基因。所有这样的多态性都可用于本发明的方法和试剂盒中,因此在本发明的范围内。
在某些情况下,对多态性位点处不同等位基因进行参比而不选择参比等位基因。或者,对于特定多态性位点可以指定参比序列。参比等位基因有时被称为“野生型”等位基因,它通常被选为第一个被测序的等位基因或来自“未染病的”个体(例如没有显示出性状或疾病表型的个体)的等位基因。
本文指称的SNP标记物的等位基因,根据在使用的SNP分析中出现在多态性位点上的碱基A,C,G或T进行指称。本文使用的SNPs的等位基因编码如下:1=A,2=C,3=G,4=T。但是,本技术领域的专业人员将会认识到,在每种情况下,通过分析或读取相反的DNA链,可以测量到互补的等位基因。因此,对于其特征为A/G多态性的多态性位点(多态性标记物)来说,使用的分析方法可以被设计成特异性检测两种可能的碱基即A和G中的一种或两种的存在。或者,通过设计分析方法,使得它被设计成检测DNA模板上的相反链,可以测量互补碱基T和C的存在。从定量来说(例如根据相对风险),从任一条DNA链(+链或-链)测量得到的结果是相同的。
典型情况下,对特定序列指定参比序列。与参比不同的等位基因有时被称为“变体”等位基因。本文使用的变体序列是指与参比序列不同但是基本上相似的序列。本文描述的多态性遗传标记物处的等位基因是变体。其它的变体可以包含影响多肽的变化。当与参比核苷酸序列进行比较时,序列差异可以包括单个核苷酸或一个以上核苷酸的***或缺失,从而导致阅读框移码;至少一个核苷酸的变化,导致了所编码的氨基酸的变化;至少一个核苷酸的变化,导致产生了未成熟的终止密码子;几个核苷酸的缺失,导致了核苷酸编码的一个或多个氨基酸的缺失;一个或几个核苷酸的***,例如通过不对称重组或基因转换,导致了阅读框编码序列的中断;序列的全部或一部分的复制;易位;或核苷酸序列的重排。这样的序列变化可以改变核酸编码的多肽。例如,如果核酸序列中的变化导致了阅读框移码,阅读框移码可以导致编码的氨基酸的变化,和/或可以导致产生了未成熟的终止密码子,导致产生了截短的多肽。或者,与疾病或性状有关的多态性可以是一个或多个核苷酸的同义变化(即变化不导致氨基酸序列的变化)。这样的多态性可以例如改变剪接位点,影响mRNA的稳定性或运输,或影响转录和编码的多肽的翻译。也可以改变DNA,以增加在体细胞水平上发生结构变化,例如扩增或缺失的可能性。参比核苷酸序列编码的多肽是具有特定的参比氨基酸序列的“参比”多肽,由变体等位基因编码的多肽被称为具有变异的氨基酸序列的“变体”多肽。
单倍型是指DNA的区段,其特征为沿着区段排列有特定组合的等位基因。对于二倍体生物例如人类来说,单倍型含有每个多态性标记物或位点的一对等位基因中的一个成员。在某些实施方案中,单倍型可以含有两个或两个以上等位基因,三个或三个以上等位基因,四个或四个以上等位基因,或五个或五个以上等位基因,每个等位基因对应于区段上的特定多态性标记物。单倍型可以含有在多态性位点具有特定等位基因的各种多态性标记物的组合,例如SNPs和微卫星。因此,单倍型含有各种不同遗传标记物等位基因的组合。
特定多态性标记物和/或单倍型的检测可以通过本技术领域已知的检测多态性位点的序列的方法来完成。例如,可以使用用于基因分型的标准技术检测SNPs和/或微卫星标记物的存在,例如基于荧光的技术(Chen,X.等,Genome Res.9(5):492-98(1999)),利用PCR,LCR,巢式PCR以及其它用于核酸扩增的技术。可用于SNP基因分型的具体的方法包括但不限于TaqMan基因分型分析方法和SNPlex平台(Applied Biosystems),质谱(例如来自Sequenom的MassARRAY***),微型测序方法,实时PCR,Bio-Plex***(BioRad),CEQ和SNPstream***(Beckman),分子倒置探针阵列技术(例如AffymetrixGeneChip)和BeadArray技术(例如Illumina GoldenGate和Infinium分析方法)。通过这些以及其它本技术领域的专业人员可用的方法,可以鉴定出多态性标记物包括微卫星,SNPs或其它类型的多态性标记物的一个或多个等位基因。
在本文描述的某些方法中,对任何特定疾病或正在研究的性状具有增加的易感性(即增加的风险)的个体,是在其中鉴定到了赋予对疾病或性状的增加的易感性的一个或多个多态性标记物的至少一个特定等位基因或单倍型(即风险标记物等位基因或单倍型)的个体。在一个方面,风险标记物或单倍型是赋予了对疾病或性状的显著增加的风险(或易感性)的标记物或单倍型。在一个实施方案中,与标记物或单倍型相关的显著性通过相对风险(RR)来测量。在另一个实施方案中,与标记物或单倍型相关的显著性通过比值比(OR)来测量。在另一个实施方案中,显著性通过百分比来度量。在一个实施方案中,显著增加的风险被测量为风险(相对风险和/或比值比)为至少1.2,包括但不限于:至少1.2,至少1.3,至少1.4,至少1.5,至少1.6,至少1.7,至少1.8,至少1.9,至少2.0,至少2.5,至少3.0,至少4.0和至少5.0。在具体的实施方案中,至少1.2的风险(相对风险和/或比值比)是显著的。在另一个特定实施方案中,至少1.3的风险是显著的。在另一个实施方案中,至少1.4的风险是显著的。在另一个实施方案中,至少大约1.5的相对风险是显著的。在另一个实施方案中,至少大约1.7的风险的显著增加是显著的。但是,也考虑到了其它的截止值,例如至少1.15,1.25,1.35等,这些截止值在在本发明的范围内。在另一个实施方案中,风险的显著增加是至少大约20%,包括但不限于大约25%,30%,35%,40%,45%,50%,55%,60%,65%,70%,75%,80%,85%,90%,95%,100%,150%,200%,300%和500%。在一个具体的实施方案中,风险的显著增加是至少20%。在其它实施方案中,风险的显著增加是至少30%,至少40%,至少50%,至少60%,至少70%,至少80%,至少90%和至少100%。但是,也考虑到了本技术领域的专业技术人员认为适合于表明本发明的特征的其它截止值或范围,它们也在本发明的范围内。
本发明的风险多态性标记物或单倍型,是在具有疾病或性状(染病的)风险的个体中至少一个标记物的至少一个等位基因或单倍型的出现频率,与它在对比组(对照)中的出现频率相比更高的标记物或单倍型,其中标记物或单倍型的存在表明了对疾病或性状的易感性。在一个实施方案中,对照组可以是群体样品,即来自总群体的随机样品。在另一个实施方案中,对照组由一组没有患病的个体代表。在一个实施方案中,这些没有患病的对照的特征是不存在一种或多种与特定疾病相关的症状。在另一个实施方案中,没有患病的对照组的特征为没有一种或多种疾病特异性风险因子。在一个实施方案中,这样的风险因子是至少一种环境风险因子。代表性的环境因子是已知影响或被考虑到影响发生特定疾病或性状的风险的天然产物,矿物或其它化学物质。其它环境风险因子是与生活方式有关的风险因子,包括但不限于饮食习惯,主要居住地的地理位置和职业性风险因子。在另一个实施方案中,风险因子是至少一种遗传风险因子。
简单的相关性检验的例子是在2×2表上进行的Fisher-精确检验。给定一组染色体,使用含有两种标记物或单倍型,含有一种标记物或单倍型而不含另一种,以及不含有标记物或单倍型的染色体的数量,构建出2×2表。
在本发明的另一个实施方案中,对疾病或性状具有降低的易感性(即降低的风险)的个体,是在其中鉴定到了赋予对疾病或性状的降低的易感性的一个或多个多态性标记物的至少一个特定等位基因或单倍型的个体。赋予降低的风险的标记物等位基因和/或单倍型也被说成是保护性的。在一个方面,保护性标记物或单倍型是赋予了对疾病或性状的明显降低的风险(或易感性)的标记物或单倍型。在一个实施方案中,显著降低的风险被测量为相对风险小于0.9,包括但不限于小于0.9,小于0.8,小于0.7,小于0.6,小于0.5,小于0.4,小于0.3,小于0.2和小于0.1。在一个具体的实施方案中,显著降低的风险是小于0.7。在另一个实施方案中,显著降低的风险是小于0.5。在另一个实施方案中,显著降低的风险是小于0.3。在另一个实施方案中,风险(或易感性)的降低是至少20%,包括但不限于至少25%,至少30%,至少35%,至少40%,至少45%,至少50%,至少55%,至少60%,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%和至少98%。在一个具体实施方案中,风险的显著降低是至少大约30%。在另一个实施方案中,风险的显著降低是至少大约50%。在另一个实施方案中,风险的显著降低时至少大约70%。但是,也考虑到了本技术领域的专业技术人员认为适合于表明本发明的特征的其它截止值或范围,它们也在本发明的范围内。
本技术领域的专业人员将会认识到,在被研究的群体中存在标记物的两个等位基因(例如SNPs),其中一个等位基因被发现在群体中具有性状或疾病的个体组中的频率高于对照组,而标记物的另一个等位基因被发现在具有性状或疾病的个体组中的频率低于对照组。在这种情况下,标记物的一个等位基因(被发现在具有性状或疾病的个体中频率增加的等位基因)将是有风险等位基因,而另一个等位基因将是保护性等位基因。
连锁不平衡
重组这种自然现象,对于每对染色体来说在每次减数***事件过程中平均发生一次,代表了自然界为序列(因此也为生物学功能)提供变异的一种方式。已经发现,基因组中的重组不是随机发生的;相反,在重组率的频率上存在很大的变化,产生了具有高重组频率的小区域(也被称为重组热点)和具有低重组频率的较大的区域,通常被称为连锁不平衡(LD)区块(Myers,S.等,Biochem Soc Trans 34:526-530(2006);Jeffreys,A.J.,等,Nature Genet 29:217-222(2001);May,C.A.等,Nature Genet 31:272-275(2002))。
连锁不平衡(LD)是指两个遗传元件的非随机的搭配。例如,如果特定遗传元件(例如多态性标记物的等位基因,或单倍型)在群体中出现的频率为0.50(50%),另一个元件出现的频率为0.50(50%),假设元件随机分配,那么一个个体具有两个元件的预计的发生率为0.25(25%)。但是,如果发现两个元件一起出现的频率高于0.25,那么元件被说成是连锁不平衡的,因为它们倾向于以比根据它们独立的出现频率(例如等位基因或单倍型频率)预测的比例更高的比例一起遗传。粗略地说,LD一般与两个元件之间的重组事件的频率相关。群体中等位基因或单倍型的频率可以通过对群体中的个体进行基因分型并确定群体中每个等位基因或单倍型出现的频率来测定。对于二倍体群体例如人类群体来说,个体一般对每个遗传元件(例如标记物,单倍型或基因)具有两个等位基因。
为了评估连锁不平衡(LD)的强度已经提出了许多不同的测量方法。大多数捕获成对的双等位基因位点之间关联的强度。LD的两个重要的成对度量是r2(有时称为Δ2)和|D’|。两种度量的范围都是从0(没有不平衡)到1(“完全不平衡”),但是它们的解释稍微有些不同。|D’|被定义为如果仅存在两个或三个可能的单倍型则等于1,如果所有四个可能的单倍型都存在则小于1。因此,小于1的|D’|值表明在两个位点之间可能在历史上已经发生过重组(回复突变也能导致|D’|小于1,但是对于单核苷酸多态性(SNPs)来说,通常认为这种情况发生的可能性比重组低)。度量r2表示两个位点之间的统计学相关性,如果只出现两个单倍型则取值为1。
r2度量大概是相关性作图的最具相关性的度量,因为在r2和检测易感性位点与SNPs的相关性所需的样品大小之间存在简单的反比关系。这些度量是针对成对位点定义的,但是对某些应用来说,可能需要确定在含有许多多态性位点的整个区域上LD有多强(例如,测试在位点之间或整个群体范围内LD的强度是否有显著的差别,或者区域中的LD比在特定模型下预测的更高还是更低)。对整个区域的LD的测量不是直接进行的,而是使用一种方法测量r,这种方法是在群体遗传学中开发的。简单来说,r测量了在特定的群体模型下为了产生在数据中观察到的LD将需要多少重组。这种类型的方法也可能可以为确定LD数据是否为重组热点的存在提供了证据的难题提供统计学上严格的方法。对于本文描述的方法来说,显著的r2值可以是至少0.1,例如至少0.1,0.15,0.2,0.25,0.3,0.35,0.4,0.45,0.5,0.55,0.6,0.65,0.7,0.75,0.8,0.85,0.9,0.91,0.92,0.93,0.94,0.95,0.96,0.97,0.98,0.99或1.0。在一个优选实施方案中,显著的r2值可以是至少0.2。或者,本文描述的连锁不平衡是指其特征为|D’|的值为至少0.2,例如0.3,0.4,0.5,0.6,0.7,0.8,0.85,0.9,0.95,0.96,0.97,0.98,0.99的连锁不平衡。因此,连锁不平衡表示了不同标记物的等位基因之间的相关性。它由相关性系数或|D’|来度量(r2最高为1.0,|D’|最高为1.0)。在某些实施方案中,连锁不平衡根据r2和|D’|二者的测量值来定义。在一个这样的实施方案中,显著的连锁不平衡被定义为r2>0.1和|D’|>0.8。在另一个实施方案中,显著的连锁不平衡被定义为r2>0.2和|D’|>0.9。用于确定连锁不平衡的r2和|D’|值的其它组合和排列也是可能的,并在本发明的范围内。连锁不平衡可以如本文描述在单一人类群体中测定,或者可以在含有来自一个以上人类群体的个体的样品集合中测定。在本发明的一个实施方案中,LD在来自一个或多个HapMap群体(高加索人(CEU),非洲人(YRI),日本人(JPT),中国人(CHB))的样品中,按照(http://www.hapmap.org)的定义来测定。在一个这样的实施方案中,LD在HapMap样品的高加索人群体中测定。在另一个实施方案中,LD在YRI群体中测定。在另一个实施方案中,LD在来自冰岛人群体的样品中测定。
如果在群体水平上基因组中的所有多态性是一致的,那么它们中每个单独的多态性将需要在关联性研究中进行调查。但是,由于多态性之间的连锁不平衡,紧密连锁的多态性是强烈相关的,这减少了在关联性研究中为了观察到显著相关性所需调查的多态性的数量。LD的另一个结果是,许多多态性由于它们是强烈相关的事实,可能给出关联性信号。
已经在基因组范围内产生了基因组LD谱图,这样的LD谱图已经被建议用作框架对疾病基因进行作图(Risch,N.& Merkiangas,K,Science 273:1516-1517(1996);Maniatis,N.等,Proc Natl Acad Sci USA99:2228-2233(2002);Reich,DE等,Nature 411:199-204(2001))。
现在已经确定,人类基因组的许多部分可以被分成一系列不连续的含有几个共同的单倍型的单倍型区块;对于这些区块来说,连锁不平衡数据几乎没有提供表明重组的证据(参见例如Wall.,J.D.和Pritchard,J.K.,Nature Reviews Genetics 4:587-597(2003);Daly,M.等,Nature Genet.29:229-232(2001);Gabriel,S.B.等,Science 296:2225-2229(2002);Patil,N.等,Science 294:1719-1723(2001);Dawson,E.等,Nature418:544-548(2002);Phillips,M.S.等,Nature Genet.33:382-387(2003))。
有两种主要的方法用于定义这些单倍型区块:区块可以被定义为具有有限的单倍型多样性的DNA区域(参见例如Daly,M.等,NatureGenet.29:229-232(2001);Patil,N.等,Science 294:1719-1723(2001);Dawson,E.等,Nature 418:544-548(2002);Zhang,K.等,Proc.Natl.Acad.Sci.USA 99:7335-7339(2002)),或者被定义为使用连锁不平衡鉴定的具有外延的历史的重组的过渡区之间的区域(参见例如Gabriel,S.B.等,Science 296:2225-2229(2002);Phillips,M.S.等,Nature Genet.33:382-387(2003);Wang,N.等,Am.J.Hum.Genet.71:1227-1234(2002);Stumpf,M.P.,和Goldstein,D.B.,Curr.Biol.13:1-8(2003))。更近些时候,在人类基因组范围上精细规模的重组率和相应的热点的图谱已经被产生(Myers,S.等,Science 310:321-32324(2005);Myers,S.等,Biochem Soc Trans 34:526530(2006))。图谱显示出在基因组范围内的重组中存在大量变化,在热点处重组率高达10-60cM/Mb,而在过渡区中接近于0,因此代表了有限单倍型多样性和高ID的区域。因此,谱图可用于将单倍型区块/LD区块定义为重组热点侧接的区域。在本文中使用的术语“单倍型区块”或“LD区块”包含了由任何上述的特征,或本技术领域的专业人员用于定义这种区域所用的其它可选方法定义的区块。
用于鉴定单倍型区块的一些代表性方法显示在例如美国公开的专利申请Nos.20030099964,20030170665,20040023237和20040146870中。使用单个标记物或含有多个标记物的单倍型,单倍型区块可用于对表型和单倍型状态之间的相关性进行作图。可以在每个单倍型区块中鉴定主要的单倍型,然后可以鉴定一组“标签”SNPs或标记物(在单倍型中进行辨别所需的最小组的SNPs或标记物)。这些标签SNPs或标记物然后可用于评估来自个体组的样品,以便鉴定表型和单倍型之间的相关性。如果需要,可以对邻近的单倍型区块同时进行评估,因为在单倍型区块之间也可能存在连锁不平衡。
因此,显然,对于任何给定的观察到的与基因组中的多态性标记物的关联性来说,可能基因组中的其它标记物也显示出关联性。这是基因组范围内LD的不均衡分布的自然结果,正如通过重组率的大的变化所观察到的。因此,在某种意义上,用于检测关联性的标记物代表了与给定疾病或性状有关的基因组区域(即单倍型区块或LD区块)的“标签”,并因此可用于本发明的方法和试剂盒中。在被发现与疾病或性状有关的区域中可以存在有一个或多个引起结果的(功能性)变体或突变。这样的变体可能赋予比用于检测关联性的标签标记物观察到的更高的相对风险(RR)或比值比(OR)。因此,如本文所述,本发明涉及了用于检测与疾病的关联性的标记物,以及与标记物连锁不平衡的标记物。因此,在本发明的某些实施方案中,与本文所述的标记物和/或单倍型连锁不平衡的标记物可以被用作替代标记物。在一个实施方案中,替代标记物具有比最初被发现与本文所述的疾病相关的标记物或单倍型更小的相对风险(RR)和/或比值比(OR)值。在另一个实施方案中,替代标记物具有比最初被发现与本文所述的疾病相关的标记物所最初测定的更大的RR或OR值。这样的实施方案的一个例子是与最初被发现与疾病相关的更常见的变体(>10%群体频率)连锁不平衡的稀有的或相对稀有的(<10%等位基因群体频率)变体,例如本文描述的变体。鉴定和使用这些标记物用于检测本文描述的本发明人发现的关联性,可以通过本技术领域的专业人员熟知的常规方法来进行,因此也在本发明的范围内。
测定单倍型频率
患者和对照组中单倍型的频率可以使用期望最大化算法来估算(Dempster A.等,J.R.Stat.Soc.B,39:1-38(1977))。可以使用这种算法的推广形式来操作丢失的基因型和阶段的不确定性。在虚假设下,患者和对照被假定具有同样的频率。使用或然性方法,测试可选的假说,其中候选的有风险单倍型,其中可以包含本文描述的标记物,被允许在患者中比对照中具有更高的频率,而两个组中其它单倍型的频率的比率被假设是相同的。在两种假说下分别将或然性最大化,并使用相应的1-df或然性比率统计数值来评估统计学显著性。
为了在连锁区域中寻找有风险和保护性标记物,研究了例如被基因分型的标记物的所有可能组合的关联性,只要那些标记物分布在可实践的区域中。可以将组合的患者和对照组随机分成两组,其大小与原始的患者和对照组相等。然后重复标记物和单倍型分析,确定记录的最显著的p-值。这种随机化的方案可以被重复例如超过100次,以构建p-值的经验性分布。在优选实施方案中,p-值<0.05是显著的标记物和/或单倍型关联性的指示。
单倍型分析
进行单倍型分析的一种通用方法包括将基于或然性的推论用于NEsted Models(Gretarsdottir S.等,Nat.Genet.35:131-38(2003))。该方法在NEMO程序中执行,允许使用许多多态性标记物,SNPs和微卫星。方法和软件被特别设计用于病例-对照研究,其目的是鉴定赋予了不同风险的单倍型组。它也是用于研究LD结构的工具。在NEMO中,在EM算法的帮助下,直接计算了最大或然性估算值,或然性比率和p-值,对于观察到的数据,将其作为缺失数据问题进行处理。
尽管基于从观察到的数据直接计算的或然率的或然率比率检验捕捉到了由于阶段的不确定性和缺失的基因型而丢失的信息,可用于给出有效的p-值,但了解由于信息的不完整而丢失了多少信息,仍然是有趣的。用于单倍型分析的信息计算描述在Nicolae和Kong(技术报告537号,芝加哥大学统计学院统计学系;Biometrics,60(2):368-75(2004))中,作为为连锁分析定义的信息计算的自然延伸,并在NEMO中执行。
对于与疾病相关的单个标记物来说,可以使用Fisher精确检验来计算每个单独等位基因的双边p-值。通常来说,除非特别指明,所有显示的p-值没有对多重比较进行调整。显示的频率(对于微卫星,SNPs和单倍型来说)是与载体频率相反的等位基因频率。为了最小化由于作为连锁分析的家庭召集的患者的亲缘性造成的任何偏差,一级和二级亲属可以从患者名单中消除。此外,通过扩展在Risch,N.& Teng,J.(Genome Res.,8:1273-1288(1998))中描述的偏差调整步骤,合并具有亲缘关系的DNA(同上)以便它可以适用于普通家族关系,并呈递调整过的和未调整的p-值进行比较,可以重复检验,对患者间任何残留的亲缘性进行关联性校正。差异一般来说正如预期一样非常小。为了评估通过多次检验校正的单个标记物关联性的显著性,我们可以使用同样的基因型数据执行随机测试。可以将患者和对照组随机化,将关联性分析重做多次(例如多达500,000次),在某些重复中对某些标记物等位基因产生的p-值小于或等于我们使用最初的患者和对照组时观察到的p-值,这样的重复的分数即是p-值。
对于单个标记物和单倍型分析来说,通过假设的乘法模型(单倍型相对风险模型)可以计算相对风险(RR)和群体归因风险度(PAR)(Terwilliger,J.D.& Ott,J.,Hum.Hered.42:337-46(1992)和Falk,C.T.& Rubinstein,P,Ann.Hum.Genet.51(Pt 3):227-33(1987)),即一个人携带的两个等位基因/单倍型的风险的乘积。例如,如果RR是A相对于a的风险,那么纯合子AA的人的风险将是杂合子Aa的人的风险的RR倍,以及纯合子aa的人的风险的RR2倍。乘法模型具有简化分析和计算的良好性质——单倍型在染病的群体中以及对照群体中是独立的,即处于Hardy-Weinberg平衡。因此,染病的和对照单倍型的数量每个都具有多项式分布,但是在可选假设下具有不同的单倍型频率。具体来说,对于两个单倍型hi和hj来说,风险(hi)/风险(hj)=(fi/pi)/(fi/pi),其中f和p分别是指染病的群体和对照群体中的频率。尽管如果真正的模型不是乘法的将会损失一些效能,但除了极端情况下之外,损失趋于轻微。最重要的是,p-值总是有效的,因为它们是针对虚假设计算的。
使用NEMO的连锁不平衡
成对标记物之间的LD可以使用标准定义的D’和r2来计算(Lewontin,R.,Genetics 49:49-67(1964);Hill,W.G.& Robertson,A.Theor.Appl.Genet.22:226-231(1968))。使用NEMO,通过最大或然率来估算两个标记物等位基因组合的频率,通过或然性比率检验来评估连锁不平衡的偏差。通过平均由边缘等位基因概率权重的两个标记物的所有可能的等位基因组合的值,D’和r2的定义被扩展到包含微卫星。当对所有标记物组合进行作图以阐明特定区域中的LD结构时,我们将D’作图于左上角,将p-值作图于右下角。在LD图中,如果需要的话,标记物可以等间距作图而不按照它们的物理位置作图。
风险评估和诊断学
正如本文所述,某些多态性标记物以及含有这些标记物的单倍型被发现可用于癌症(例如***癌(例如侵略性***癌),肺癌,结肠癌,乳腺癌,黑色素瘤)的风险评估。风险评估可以包括使用用于诊断对癌症易感性的标记物。多态性标记物的特定等位基因在患有癌症的个体中比没有诊断出癌症的个体出现得更频繁。因此,这些标记物等位基因对于在个体中检测癌症或对癌症的易感性,具有预测价值。含有风险标记物,例如本发明的标记物的单倍型区块或LD区块中的标签标记物,可用作单倍型区块或LD区块中其它标记物和/或单倍型的替代物。具有等于1的r2值的标记物是风险变体的完美的替代物,即一个标记物的基因型完美地预测了另一个标记物的基因型。具有小于1的r2值的标记物也可以是风险变体的替代物,或者可选地代表具有与风险变体一样高或可能甚至更高的相对风险值的变体。被鉴定到的风险变体本身可以不是功能性变体,但在这种情况下与真正的功能性变体连锁不平衡。本发明包括了为本文公开的标记物评估这样的替代标记物。这样的标记物被标注,作图并列出在专业技术人员熟知的公共数据库中,或者可选地可以通过对在个体组中通过本发明的标记物鉴定到的区域或区域的一部分进行测序,并在获得的序列组中鉴定多态性,来容易地鉴定。因此,本技术领域的专业人员可以容易地并且不经过繁琐的实验,对与本文描述的标记物和/或单倍型连锁不平衡的替代标记物进行基因分型。与检测到的风险变体连锁不平衡的标签或替代标记物,对于在个体中检测与癌症或对癌症易感性的相关性,也具有预测价值。这些与本发明的标记物连锁不平衡的标签或替代标记物也可以含有在单倍型之间不同的其它标记物,这些对于检测对癌症的易感性同样具有预测价值。
本发明的标记物和单倍型,例如在表4A,4B,5A,5B,5C中显示的标记物,可单独或组合地用于风险评估和诊断目的。因此,即使是在个体的标记物造成的风险增加相对温和,即在10-30%的级别的情况下,关联性也可以具有显著的暗示。因此,相对普通的变体可能对总的风险有显著的贡献(群体归因风险度高),或者标记物的组合可用于定义基于标记物的组合风险,对发生疾病有显著的组合风险的个体组。
因此,在本发明的一个实施方案中,多个变体(遗传标记物,生物标记物和/或单倍型)被用于总体风险评估。在一个实施方案中,这些变体选自本文公开的变体。其它实施方案包括了使用本发明的变体与其它已知可用于诊断对癌症的易感性的变体的组合。在这样的实施方案中,在个体中确定了多个标记物和/或单倍型的基因型状态,并将个体的状态与相关变体的群体频率,或在临床健康的对象例如年龄匹配和性别匹配的对象中变体的频率进行比较。然后可以使用本技术领域已知的方法,例如多变量分析或联合风险分析,来确定根据多个位点处的基因型状态所赋予的总的风险。然后可以将基于这样的分析进行的风险评估用于本文描述的本发明的方法和试剂盒中。
如上所述,人类基因组的单倍型区块结构具有这样的作用,即与最初与疾病或性状相关的变体连锁不平衡的大量变体(标记物和/或单倍型)可以用作替代标记物,用于评估与疾病和性状的关联性。这样的替代标记物的数量依赖于几种因素,例如区域中的历史重组率,区域中的突变频率(即区域中多态性位点或标记物的数量),以及区域中连锁不平衡的程度(LD区块的大小)。这些标记物通常位于使用本文描述的方法或通过本技术领域的专业人员已知的其它方法确定的所述LD区块或单倍型区块的物理边界内。但是,有时会发现标记物和单倍型关联性延伸到定义的单倍型区块的物理边界之外。在这样的情况下,这些标记物和/或单倍型也可用作物理上位于定义的单倍型区块内的标记物和/或单倍型的替代标记物和/或单倍型。因此,与本文描述的标记物和单倍型连锁不平衡(典型的特征为r2大于0.1,例如r2大于0.2,包括r2大于0.3,也包括r2大于0.4)的标记物和单倍型也在本发明的范围之内,即使它们在物理上位于所定义的单倍型区块的边界之外。因此,本发明涉及了本文描述的标记物(例如表4A,4B,5A,5B,5C),但是也可以包括与本文列出的一种或多种标记物强烈连锁不平衡(例如特征为r2大于0.1或0.2,和/或|D’|>0.8)的其它标记物。
对于本文描述的SNP标记物来说,与在患有特定癌症(例如***癌)的患者中被发现是过量的等位基因(风险等位基因)相对的等位基因,在患有癌症的患者中被发现具有降低的频率。这些标记物和单倍型与这样的标记物连锁不平衡和/或含有它们,因此对癌症具有保护性,即它们赋予了携带有这些标记物和/或单倍型的个体以降低的发生癌症的风险或易感性。在另一个实施方案中,含有至少两个多态性标记物的单倍型在患有特定癌症的个体中出现频率降低,因此对癌症具有保护性。这样的标记物和单倍型可用于在个体中诊断对癌症的降低的易感性。
本发明的某些变体,包括某些单倍型,在某些情况下含有各种不同标记物的组合,例如SNPs和微卫星。单倍型的检测可以通过本技术领域已知的方法和/或本文描述的用于检测多态性位点的序列的方法来进行。此外,某些单倍型或标记物组与疾病表型之间的关联性可以使用标准的技术来证实。用于关联性的简单检验的一个代表性例子是在2×2表上进行的Fisher精确检验。
在特定实施方案中,被发现与癌症有关的标记物等位基因或单倍型(例如表1,2,3,4A和4B中列出的标记物等位基因),是其中标记物等位基因或单倍型在具有癌症风险(染病的)的个体中出现的频率比它在健康个体(对照)中出现的频率高的标记物等位基因或单倍型,其中标记物等位基因或单倍型的存在是癌症或对癌症易感性的指示。在另一个实施方案中,与一个或多个被发现与癌症有关的标记物连锁不平衡的风险标记物,是在具有癌症风险(染病的)的个体中出现的频率比它在健康个体(对照)中出现的频率高的标签标记物,其中标签标记物的存在是对癌症增加的易感性的指示。在另一个实施方案中,与一个或多个被发现与癌症有关的标记物连锁不平衡的风险标记物等位基因(即赋予增加的易感性)(例如在表4A,4B,5A,5B和5C中列出的标记物等位基因),是含有一个或多个在具有癌症风险的个体中出现的频率比它们在健康个体(对照)中出现的频率高的等位基因的标记物,其中标记物的存在是对癌症增加的易感性的指示。
研究群体
从普遍意义上讲,本发明的方法和试剂盒可以使用含有来自任何来源,即任何个体的基因组DNA的样品。在优选实施方案中,个体是人类个体。个体可以是成年人,儿童或胎儿。本发明还提供了对属于靶群体的成员的个体中标记物和/或单倍型的评估。在一个实施方案中,这样的靶群体是根据其它遗传因子,生物标记物,生物物理参数(例如体重,BMD,血压),或总体健康和/或生活方式参数(例如疾病或相关疾病史,以前对疾病的诊断,疾病的家族史)具有发生疾病的风险的个体的群体或组。
本发明提供了包含特定年龄亚组的个体的实施方案,例如超过40岁,超过45岁,或超过50,55,60,65,70,75,80或85岁的年龄亚组。本发明的其它实施方案对应于其它的年龄组,例如年龄小于85岁的个体,例如小于80岁,小于75岁,或小于70,65,60,55,50,45,40,35或30岁。其它实施方案涉及发病时的年龄在任何上述年龄范围内的个体。在某些实施方案中,还考虑到了年龄的范围可以是相关的,例如发病时的年龄大于45岁但小于60岁。但是,其它的年龄范围也被考虑到了,包括所有由上面列出的年龄值界定的所有范围。本发明还涉及了任何性别,男性或女性的个体。
冰岛人群体是具有北欧血统的高加索人群体。在过去几年中,已经公开了大量的研究,报道了冰岛人群体中遗传连锁和关联性的结果。许多这些研究显示,最初在冰岛人群体中鉴定到的变体的复制,与其它群体中特定的疾病有关联(Stacey,S.N.等,Nat Genet.May 272007(出版前的电子版);Helgadottir,A.等,Science 316:1491-93(2007);Steinthorsdottir,V.等,Nat Genet.39:770-75(2007);Gudmundsson,J.等,Nat Genet.39:631-37(2007);Amundadottir,L.T.等,Nat Genet.38:652-58(2006);Grant,S.F.等,Nat Genet.38:320-23(2006))。因此,在冰岛人群体中的遗传发现已经被普遍复制到其它群体中,包括来自非洲和亚洲的群体。
本发明的被发现与癌症(例如***癌)相关的标记物据信在其它人类群体中也显示了相似的关联性。因此,也考虑到了包含了个体人类群体的具体实施方案,并包含在本发明的范围内。这样的实施方案涉及来自一个或多个人类群体的人类对象,包括但不限于高加索人群体,欧洲人群体,美洲人群体,欧亚人群体,亚洲人群体,中/南亚人群体,东亚人群体,中东人群体,非洲人群体,西班牙人群体和大洋洲人群体。欧洲人群体包括但不限于瑞典人,挪威人,芬兰人,俄罗斯人,丹麦人,冰岛人,爱尔兰人,凯尔特人,英国人,苏格兰人,荷兰人,比利时人,法国人,德国人,西班牙人,葡萄牙人,意大利人,波兰人,保加利亚人,斯拉夫人,塞尔维亚人,波斯尼亚人,Chech,希腊人和土耳其人群体。在其它实施方案中,本发明还可以在特定的人类群体中使用,包括班图人,Mandenka,约鲁巴人,San,木布提矮人,奥克尼群岛人,Adygel,俄罗斯人,萨丁尼亚人,托斯卡尼人,莫扎比特人,贝多因人,Druze,巴勒斯坦人,俾路支人,布拉灰人,莫克兰人,信德人,帕坦人,布鲁肖人,哈扎拉人,维吾尔族人,卡拉什人,汉族人,傣族人,达斡尔人,赫哲族人,拉祜族人,苗族人,鄂伦春族人,畲族人,土家族人,土族人,锡伯族人,彝族人,蒙古族人,纳西族人,柬埔寨人,日本人,雅库特人,美拉尼西亚人,巴布亚人,加里提亚拿人,Surui,哥伦比亚人,玛雅人和皮玛族人。
在一个优选实施方案中,本发明涉及了含有非洲黑人血统的群体,例如含有非洲人血统或谱系的人的群体。非洲黑人血统可以通过自己报告确定为非洲裔美国人(African-Americans),非裔美国人(Afro-Americans),美国黑人(Black Americans),是黑色人种的一个成员,或尼格罗人种的一个成员。例如,非洲裔美国人或美国黑人是居住在北美并且起源于任何非洲黑色人种组的人。在另一个例子中,自己报告的非洲黑人血统的人可以具有至少一个非洲黑人血统的父母,或至少一个非洲黑人血统的祖父母。
个体对象中的种族组成也可以通过遗传分析来确定。血统的遗传分析可以使用不连锁的微卫星标记物来进行,例如在Smith等(Am JHum Genet 74,1001-13(2004))中提出的那些。在一个实施方案中,遗传血统使用从大约2000个在以前描述的研究中(Pritchard,J.K.等,Genetics 115:945-59(2000))使用多种族群体进行基因分型的微卫星中选择的一组微卫星标记物来估计。在一个这样的实施方案中,按照本文的描述,使用了35个欧洲裔美国人,88个非洲裔美国人,34个中国人和29个墨西哥裔美国人的群体。可用于从该组中估算遗传血统的一个具体的实施方案包含了30个不连锁的微卫星标记物。选择的组是Prichard等描述的2000个标记物中在欧洲裔美国人,非洲裔美国人和亚洲人之间差异最显著的标记物,同时也具有良好的质量和产率。因此,在一个实施方案中,遗传血统通过对一组微卫星标记物进行基因分型来确定,这组微卫星标记物由D1S2630,D1S2847,D1S466,D1S493,D2S166,D3S1583,D3S4011,D3S4559,D4S2460,D4S3014,D5S1967,DG5S802,D6S1037,D8S1719,D8S1746,D9S1777,D9S1839,D9S2168,D10S1698,D11S1321,D11S4206,D12S1723,D13S152,D14S588,D17S1799,D17S745,D18S464,D19S113,D20S878和D22S1172。适合用于扩增含有标记物DG5S802的片段的引物对显示在SEQ ID NO:4和SEQ ID NO:5中。专业技术人员将会认识到,微卫星标记物的其它组合,或其它类型的多态性标记物(例如SNPs),也可以用于估计遗传血统。
在某些实施方案中,本发明涉及如上所述在特定群体中鉴定的标记物和/或单倍型。本技术领域的专业人员将会认识到,在对不同的群体施用时,连锁不平衡(LD)测量将给出不同的结果。这是由于不同人类群体的不同群体史,以及在特定基因组区域中导致LD差异的不同选择压力。对于本技术领域的专业人员来说,某些标记物例如SNP标记物在不同群体中具有不同的群体频率,或者在一个群体中是多态性的但在另一个群体中不是,这种情况是熟知的。但是,本技术领域的专业人员将使用方法,并如本文设想的在任何给定的人类群体中实施本发明。这可以包括评估本发明的LD区域中的多态性标记物,以便鉴定出那些与特定群体表现出最强关联性的标记物。因此,本发明的有风险变体可以在不同的单倍型背景上,并以不同的频率存在于各种不同人类群体中。但是,使用本技术领域已知的方法和本发明的标记物,可以在任何给定人类群体中实施本发明。
遗传测试的用途
本技术领域的专业人员将会认识和了解到,本文描述的变体总的来说本身不提供将发生特定癌症例如***癌的个体的绝对鉴定。但是,本文描述的变体表明了带有本发明的风险性或保护性变体的个体将发生特定形式的癌症,以及与癌症有关的症状的增加的和/降低的可能性。但是,正如在下面更详细指出的,该信息本身是极具价值的,因为它可以用于例如在早期阶段启动保护性措施,进行经常性的身体和/或心理检查,以监测症状的进展和/或出现,或以固定的间期安排检查以识别癌症的早期信号,以便能够在早期阶段实施治疗。
关于赋予了发生癌症的风险的遗传变体的知识,为使用遗传测试辨别具有发生癌症的增加的风险的个体(即风险变体的携带者)和具有发生癌症的降低的风险的个体(即保护性变体的携带者)提供了机会。对于属于上述两个组的个体来说,遗传测试的核心值是能够在早期阶段诊断癌症的可能性,以及为临床医师提供关于癌症的预后/侵略性的信息,以便能够实施最合适的治疗。例如,对癌症(例如***癌(侵略性或高Gleason级别***癌,低侵略性或低Gleason级别***癌)实施遗传测试,可以为在早期阶段检测疾病,从而导致在较早阶段实施治疗性措施提供机会,因此可以最小化症状的有害效应和癌症造成的严重健康后果。用于癌症的遗传测试的一些优点包括:
1.辅助早期检测
对***癌施用遗传测试,可以为在较早期阶段检测疾病提供机会,如果发现是局部的,可以导致较高的治愈率,并通过最小化肿瘤的区域性和远距离扩散而提高存活率。对于***癌来说,遗传测试最有可能增加已经广泛使用的***特异性抗原(PSA)化验和直肠指检(DRE)的灵敏性和特异性。这可以导致较低比例的假阳性(因此最小化了不必要的过程例如穿刺活检)和假阴性(因此增加了潜伏疾病的检测并最小化了由PCA引起的发病率和死亡率)。
2.确定侵略性
遗传测试可以提供与诊断前预后指示符有关的信息,能够鉴定个体具有侵略性肿瘤类型的高的或低的风险,可以导致对筛查策略的修改。例如,被确定是发生侵略性***癌的高风险等位基因的携带者的个体,将可能经历更频繁的PSA化验,检查,并在存在异常PSA值的情况下具有较低的穿刺活检的阈值。
此外,鉴定个体是侵略性肿瘤类型的高或低风险等位基因的携带者,将导致对治疗策略进行修改。例如,如果在作为赋予发生侵略性形式的***癌的增加的风险的等位基因的携带者的个体中诊断出了***癌,那么临床医师将可能建议更具侵略性的治疗策略例如***切除术来代替侵略性较低的治疗策略。
正如在本技术领域中已知的,***特异性抗原(PSA)是由***的上皮细胞包括癌症细胞分泌的蛋白。在血液中升高的水平表明了***的异常状况,可能是良性的或恶性的。PSA被用于检测***腺体中可能的问题,以及跟踪***癌治疗的进展。PSA水平高于4ng/ml表明存在***癌(尽管正如本技术领域已知的,该化验既不非常特异,也不灵敏)。
在一个实施方案中,本发明的方法与PSA分析组合(之前,同时或之后)进行。在具体的实施方案中,标记物或单倍型的存在,与对象具有高于4ng/ml的PSA水平一起,表明了更具侵略性的***癌和/或更糟的预后。正如本文所述,特定的标记物和单倍型与高Gleason(即更具侵略性的)***癌相关。在另一个实施方案中,在具有正常PSA水平(例如小于4ng/ml)的患者中标记物或单倍型的存在,表明了高Gleason(即更具侵略性的)***癌和/或更糟的预后。当癌症更可能生长到超出***腺体的边界之外,转移,逃脱治疗和/或杀死宿主时,发生“更糟的预后”或“不良的预后”。
在一个实施方案中,标记物或单倍型的存在表明了在肿瘤或其前体中倾向于发生Chr8q24.21的体细胞重排(例如扩增,易位,***和/或缺失中的一种或多种)。体细胞重排本身在随后可能导致更具侵略性形式的***癌(例如由较高的Gleason分值或诊断时的较高阶段所反映的较高的组织学级别,***癌的增加的进展(例如到较高的阶段),更糟的结果(例如根据发病率,并发症或死亡))。正如在本技术领域已知的,Gleason级别是广泛使用的用于对***癌组织失去正常腺体结构(腺体的大小,性状和分化)的程度进行分级的方法。从1到5的级别被分别顺序地指派给检测的组织样品中存在的两种最优势的组织形式,并加在一起产生了总的或组合Gleason级别(分值从2-到10)。高的数字表示不良的分化,因此是更具侵略性的癌症。
侵略性***癌是生长超出了***,转移并且最终杀死患者的癌症。正如本文所述,侵略性的一个替代的度量是高的组合Gleason级别。级别在2-10的标度上越高,患者患有侵略性疾病的可能性越高。
在本文中使用的术语“阶段”,除非另外指明,被用于定义癌症(例如***癌)的大小和物理程度。对各种不同癌症进行分段的一种方法是TNM方法,其中在TNM首字母缩写词中,T代表肿瘤大小和侵染力(例如***中的原发肿瘤);N代表***转移(例如已经扩散到***的***癌);M表示转移(扩散到远处位点)的存在或不存在。
本发明还涉及了癌症(例如***癌)的风险评估,包括诊断个体是否处于发生癌症的风险中。本发明的多态性标记物可以单独或组合使用,以及与其它因子包括其它遗传或非遗传风险因子或生物标记物(例如PSA)组合使用,用于个体对特定癌症(例如***癌)的风险评估。许多可以影响个体发生癌症的风险的倾向性的因素在本技术领域中是已知的,并可以用于这样的评估中。这些因素包括但不限于年龄,性别,吸烟史和吸烟状态,身体活性,腰围臀围比,癌症家族史,以前诊断的癌症,肥胖症,高甘油三酯血症,低HDL胆固醇,高血压,升高的血压,胆固醇水平,HDL胆固醇,LDL胆固醇,甘油三酯,载脂蛋白AI和B水平,纤维蛋白原,铁蛋白,C-反应性蛋白和白三烯水平。可以使用本技术领域已知的方法进行这种全面风险评估,包括多变量分析或逻辑回归。
发明方法
在本文中描述了用于诊断对癌症(例如***癌(例如侵略性***癌),乳腺癌,肺癌,黑色素瘤)易感性的方法,并包含在本发明中。用于分析来自对象的样品以检测对癌症(例如***癌(例如侵略性***癌),乳腺癌,肺癌,黑色素瘤)易感性的试剂盒也包含在本发明中。
诊断和筛选分析方法
在某些实施方案中,本发明涉及通过检测在癌症对象或对癌症易感的对象中出现得更频繁的遗传标记物的特定等位基因,来诊断或帮助诊断癌症或对癌症易感性的方法。在特定实施方案中,本发明是通过检测一个或多个特定多态性标记物(例如本文描述的标记物或单倍型),来诊断对***癌(例如侵略性***癌),乳腺癌,结肠癌,肺癌和/或黑色素瘤的易感性的方法。通过本发明描述的方法,特定标记物或单倍型的检测是对癌症(例如***癌(例如侵略性***癌),乳腺癌,肺癌,黑色素瘤)易感性的指示。这样的预后或预测分析也可用于在与这些癌症有关的症状发作之前,确定对象的预防性治疗。
此外,在某些其它实施方案中,本发明涉及通过检测在癌症中出现频率低的特定遗传标记物等位基因或单倍型,来诊断或帮助诊断对癌症的降低的易感性的方法。在特定实施方案中,本发明是通过检测一个或多个特定遗传标记物(例如本文描述的标记物或单倍型),来诊断对***癌(例如侵略性***癌),乳腺癌,结肠癌,肺癌和/或黑色素瘤的降低的易感性的方法。通过本发明描述的方法,特定标记物或单倍型的检测是对癌症(例如***癌(例如侵略性***癌),乳腺癌,肺癌,黑色素瘤)降低的易感性,或针对癌症的保护性标记物或单倍型的指示。
正如本文描述和例举的,与Chr8q24.21LD区块C(SEQ ID NO:1)和LD区块C’(SEQ ID NO:2)相关的特定标记物或单倍型与癌症(例如***癌(例如侵略性***癌),乳腺癌,肺癌,结肠癌,黑色素瘤)有关。在一个实施方案中,标记物或单倍型是赋予了对***癌,乳腺癌,肺癌,结肠癌和/或黑色素瘤的显著风险或易感性的标记物或单倍型。在另一个实施方案中,本发明涉及通过筛选与SEQ IDNO:2有关的标记物或单倍型(例如在图5A,5B和5C中显示的标记物,以及与其连锁不平衡的标记物),在对象中诊断对癌症(例如***癌(例如侵略性***癌),乳腺癌,肺癌,黑色素瘤)的易感性的方法,其中与SEQ ID NO:2有关的标记物或单倍型在患有癌症或对癌症易感的(染病的)对象中出现的频率比它在健康对象(对照)中出现的频率高。在某些实施方案中,关联性的显著性的特征为较小的p-值,例如<0.01,<0.001,<0.0001,<0.00001,<0.000001,<0.0000001,<0.00000001或<0.000000001。
在这些实施方案中,标记物或单倍型的存在是对癌症(例如***癌(例如侵略性***癌),乳腺癌,结肠癌,肺癌,黑色素瘤)的易感性的指示。这些诊断方法包括检测本文描述的与癌症有关的标记物或单倍型的存在或不存在。本文描述的单倍型包括各种不同遗传标记物(例如SNPs,微卫星)的组合。构成特定单倍型的特定遗传标记物的检测,可以通过本文描述的和/或本技术领域已知的各种不同方法来进行。例如,遗传标记物可以在核酸水平上(例如通过直接的核苷酸测序)检测,也可以在氨基酸水平上检测,如果遗传标记物影响了与癌症相关的核酸,例如其序列显示在SEQ ID NO:1或SEQ ID NO:2中的核酸编码的蛋白的编码序列的话(例如,通过蛋白测序或通过使用识别这样的蛋白的抗体的免疫分析)。本发明的标记物等位基因或单倍型对应于与癌症(例如***癌)有关的基因组DNA序列片段。这样的片段含有所述多态性标记物或单倍型的DNA序列,但是也可以含有与标记物或单倍型强烈LD(连锁不平衡)的DNA区段。在一个实施方案中,这样的区段包括由r2值大于0.2和/或|D’|>0.8所确定的与标记物或单倍型连锁不平衡的基因组区段。这种与本发明的变体连锁不平衡的区段的例子显示在SEQ ID NO:1和SEQ IN NO:2中。
在一个实施方案中,对癌症(例如***癌(例如侵略性***癌),乳腺癌,肺癌,黑色素瘤)的易感性的诊断可以使用杂交方法来实现,例如Southern分析,Northern分析,和/或原位杂交(参见《分子生物学现代方法》,Current Protocols in Molecular Biology,Ausubel,F.等主编,John Wiley & Sons,包括所有附录)。来自测试对象或个体的基因组DNA,RNA或cDNA样品(“测试样品”)是从怀疑患有癌症,对癌症易感或对癌症有倾向性的对象(“测试对象”)获得的。对象可以是成年人,儿童或胎儿。测试样品可以来自于任何含有基因组DNA的来源,例如血液样品,羊水样品,脑脊液样品,或来自皮肤,肌肉,口腔或结膜粘膜,胎盘,胃肠道或其它器官的组织样品。来自胚胎细胞或组织的DNA测试样品可以通过适当的方法获得,例如通过羊膜穿刺术或绒毛膜绒毛取样。然后检测DNA,RNA或cDNA样品。特定标记物等位基因的存在可以通过特异性针对特定等位基因的核酸探针的序列特异性杂交来指示。一种以上特定标记物等位基因或特定单倍型的存在可以通过使用几种序列特异性核酸探针来指示,每种探针特异性针对特定等位基因。在一个实施方案中,单倍型可以通过特异性针对特定单倍型(即与含有单倍型特征性的特定标记物等位基因的DNA链特异性杂交)的单一核酸探针来指示。序列特异性探针可以被导向以与基因组DNA,RNA或cDNA杂交。本文使用的“核酸探针”可以是与互补序列杂交的DNA探针或RNA探针。本技术领域的专业人员将了解如何设计这样的探针,使得只有在测试样品的基因组序列中存在特定等位基因时,才发生序列特异性杂交。
为了诊断对癌症(例如***癌(例如侵略性***癌),乳腺癌,肺癌,黑色素瘤)的易感性,通过将含有癌症相关核酸的测试样品与至少一种核酸探针相接触来形成杂交样品。用于检测mRNA或基因组DNA的探针的非限制性例子是能够与本文描述的mRNA或基因组DNA杂交的标记的核酸探针。核酸探针可以是例如全长的核酸分子或其一部分,例如长度为至少15,30,50,100,250或500个核苷酸,在严紧条件下足以与适当的mRNA或基因组DNA特异性杂交的寡核苷酸。例如,核酸探针可以是SEQ ID NO:1的全部或一部分,或SEQ IDNO:2的全部或一部分,任选含有本文描述的单倍型中包含的至少一个等位基因,或者探针可以是这样序列的互补序列。在特定的实施方案中,核酸探针是SEQ ID NO:1的一部分或SEQ ID NO:2的一部分,任选地含有本文描述的单倍型中包含的至少一个等位基因,或者探针可以是这样序列的互补序列。其它适合用于本发明的诊断分析的探针在本文中进行了描述。
杂交可以通过本技术领域的专业人员熟知的方法来进行(参见例如《分子生物学现代方法》Current Protocols in Molecular Biology,Ausubel,F.等主编,John Wiley & Sons,包括所有附录)。在一个实施方案中,杂交是指特异性杂交,即没有错配的杂交(精确杂交)。在一个实施方案中,特异性杂交的杂交条件是高度严紧的。
特异性杂交,如果存在的话,使用标准方法来检测。如果在核酸探针与测试样品的核酸之间发生了特异性杂交,那么样品含有与核酸探针中存在的核苷酸互补的等位基因。对于本发明的任何标记物,或构成本发明的单倍型的标记物可以重复这个过程,或者可以同时使用多个探针在同一时间检测一个以上的标记物等位基因。设计含有一个以上特定单倍型的标记物等位基因的单个探针(例如探针含有与构成特定单倍型的2,3,4,5个或所有标记物互补的等位基因),也是可能的。样品中单倍型的特定标记物的检测表明样品源具有特定单倍型(例如单倍型),因此对癌症(例如***癌)易感。
在一个优选实施方案中,使用的方法利用了在其3’末端含有荧光基团或荧光团,在5’末端含有淬灭剂的检测寡核苷酸探针和增强子寡核苷酸,如同Kutyavin等(Nucleic Acid Res.34:e128(2006))描述的。荧光基团可以是Gig Harbor Green或Yakima Yellow,或其它适合的荧光基团。检测探针被设计成与含有被检测的SNP多态性的短核苷酸序列杂交。优选情况下,SNP位于从末端残基到距离检测探针的3’末端-6个残基之间的任何地方。增强子是在检测探针3’方向上与DNA模板杂交的短寡核苷酸探针。探针被设计成当两个探针都与模板结合时,在检测探针和增强子核苷酸探针之间存在单个核苷酸缺口。缺口产生了合成的脱碱基位点,可以被内切核酸酶例如内切核酸酶IV识别。酶将染料从完全互补的检测探针上切下,但是不能切开含有错配的检测探针。因此,通过测量释放出的荧光基团的荧光,可以对由检测探针的核苷酸序列定义的特定等位基因的存在进行评估。
检测探针可以具有任何适合的大小,尽管优选情况下探针相对较短。在一个实施方案中,探针的长度为5-100个核苷酸。在另一个实施方案中,探针长度为10-50个核苷酸,在另一个实施方案中,探针长度为12-30个核苷酸。其它长度的探针也是可能的,并在本技术领域的专业人员的普通技能的范围内。
在优选实施方案中,含有SNP多态性的DNA模板在检测前通过聚合酶链反应(PCR)进行扩增。在这样的实施方案中,被扩增的DNA被用作检测探针和增强子探针的模板。
在某些实施方案中,检测探针,增强子探针和/或用于通过PCR扩增模板的引物,包括使用修饰的碱基,包括修饰的A和修饰的G。使用修饰的碱基可用于调整核苷酸分子(探针和/或引物)与模板DNA的熔解温度,例如在含有低百分率G或C碱基的区域中增加熔解温度,其中可以使用具有与其互补的T形成三个氢键的能力的修饰的A,或者用于在含有高百分率G或C碱基的区域中降低熔解温度,例如使用在双链DNA分子中与其互补的C碱基只能形成两个氢键的修饰的G碱基。在优选实施方案中,修饰的碱基被用于设计检测核苷酸探针。在这些方法中可以选择任何专业技术人员已知的修饰碱基,根据本文的教导对适合的碱基进行选择也在专业人员的能力范围内,已知的碱基可以从专业人员已知的商业来源获得。
在另一种杂交方法中,Northern分析(参见《分子生物学现代方法》,Current Protocols in Molecular Biology,Ausubel,F.等主编,JohnWiley & Sons,同上)被用于鉴定与癌症(例如***癌(例如侵略性***癌),乳腺癌,肺癌,黑色素瘤)或癌症的易感性有关的多态性的存在。对于Northern分析来说,RNA测试样品通过适合的方法从对象获得。如本文所示,核酸探针与来自对象的RNA的特异性杂交表明了特定等位基因与探针互补。关于核酸探针的使用的代表性的例子,参见例如美国专利Nos.5,288,611和4,851,330。
此外,或者,在本文描述的杂交方法中可以在核酸探针以外或代替核酸探针而使用肽核酸(PNA)探针。PNA是DNA模拟物,具有类似肽的无机骨架例如N-(2-氨基乙基)甘氨酸单元,以及通过亚甲基羰基连键连接到甘氨酸的氮上的有机碱基(A,G,C,T或U)(参见例如Nielsen,P.等,Bioconjug.Chem.5:3-7(1994))。PNA探针可以被设计成与怀疑含有一个或多个与癌症(例如***癌(例如侵略性***癌),乳腺癌,肺癌,黑色素瘤)有关的单倍型的遗传标记物的样品中的分子特异性杂交。PNA探针的杂交可用于诊断癌症或对癌症的易感性。
在本发明的一个实施方案中,收集含有从对象获得的基因组DNA的测试样品,并使用聚合酶链反应(PCR)扩增含有一个或多个本发明的标记物或单倍型的片段。如本文所述,与癌症有关的特定标记物等位基因或单倍型的鉴定可以使用各种不同的方法来进行(例如序列分析,限制性消化分析,特异性杂交,单链构象多态性分析(SSCP),电泳分析等)。在另一个实施方案中,诊断通过使用定量PCR(动力学热循环)的表达分析来实现。该技术可以使用例如商业化的技术,例如
Figure A20078004694300741
(Applied Biosystems,Foster City,CA)。该技术可以评估由与癌症相关的核酸(例如其序列中包含SEQ ID NO:1或SEQ IDNO:2中显示的序列的全部或片段的核酸)编码的多肽或剪接变体的表达或组成中存在的变化。此外,变体的表达可以作为物理上或功能上的差异进行定量。
在本发明的另一个方法中,通过限制性消化进行的分析可用于检测特定的等位基因,如果等位基因导致相对于参比序列来说产生或消除了限制性位点的话。从对象获得含有基因组DNA的测试样品。可以使用PCR从测试对象的测试样品中扩增SEQ ID NO:1或SEQ ID NO:2的特定区域。可以进行限制性片段长度多态性(RFLP)分析,例如按照《分子生物学现代方法》(同上)中的描述来进行。相关DNA片段的消化图谱表明了样品中特定等位基因的存在或不存在。
序列分析也可用于检测与SEQ ID NO:1或SEQ ID NO:2相关的多态性位点的特定等位基因。因此,在一个实施方案中,确定特定标记物等位基因或单倍型的存在或不存在,包括了对从对象或个体获得的DNA或RNA测试样品进行序列分析。可以使用PCR或其它适合的方法扩增SEQ ID NO:1或SEQ ID NO:2的一部分,然后可以通过对样品中基因组DNA的多态性位点(或者,单倍型中的多个多态性位点)进行测序来直接检测特定等位基因的存在。
通过使用扩增的寡核苷酸与等位基因特异性寡核苷酸(ASO)探针的斑点印迹杂交(参见例如Saiki,R.等,Nature,324:163-166(1986)),等位基因特异性寡核苷酸也可用于检测与癌症相关的多态性位点上特定等位基因的存在。“等位基因特异性寡核苷酸”(在本文中也称为“等位基因特异性寡核苷酸探针”)是大约10-50个碱基对或大约15-30个碱基对的寡核苷酸,与SEQ ID NO:1或SEQ ID NO:2的区域特异性杂交,并在多态性位点(例如本文描述的多态性)上含有特定等位基因。特异性针对一个或多个与SEQ ID NO:1或SEQ ID NO:2有关的特定多态性的等位基因特异性寡核苷酸探针,可以使用标准的方法来制备(参见例如《分子生物学现代方法》,同上)。可以使用PCR来扩增SEQ ID NO:1或SEQ ID NO:2中的所需区域。含有扩增的LD区块C区域的DNA可以使用标准方法进行斑点印迹(参见例如《分子生物学现代方法》,同上),并将印迹与寡核苷酸探针相接触。然后可以检测探针与扩增区域的特异性杂交的存在。等位基因特异性寡核苷酸探针与来自对象的DNA的特异性杂交,是与癌症(例如***癌)相关的多态性位点上特定等位基因的指示(参见例如Gibbs,R.等,NucleicAcids Res.,17:2437-2448(1989)和WO 93/22456)。
通过加入类似物例如锁核酸(LNAs),引物和探针的大小可以被减小到8个碱基。LNA是一类新的双环状DNA类似物,其中呋喃糖环中的2′和4′位置通过O-亚甲基(氧-LNA),S-亚甲基(硫-LNA)或氨基亚甲基(氨基-LNA)基团相连接。所有这些LNA变体的共同之处是与互补核酸的亲和性,到目前为止在DNA类似物中是被报道的最多的。例如特别是所有的氧-LNA九聚体当与互补的DNA或RNA复合时,熔解温度(Tm)分别为64℃和74℃,相反,对应的DNA九聚体与DNA和RNA的熔解温度均为28℃。当LNA单体与标准的DNA或RNA的单体组合使用时,也可以获得Tm的显著增加。对于引物和探针来说,依赖于含有LNA单体的位置(例如在3′末端,5′末端,或在中间),Tm可以得到相当大的提高。
在另一个实施方案中,与来自对象的靶核酸序列互补的寡核苷酸探针的阵列,可用于在癌症相关核酸中鉴定多态性。例如,可以使用寡核苷酸阵列。寡核苷酸阵列典型地包含多个连接到基质表面上不同已知位置上的不同的寡核苷酸探针。这些寡核苷酸探针,也被称为“基因芯片”(GenechipsTM),在本技术领域中已经广泛描述过了(参见例如美国专利No.5,143,854,PCT专利申请Nos.WO 90/15070和92/10092)。一般来说,这些阵列可以使用机械合成方法或组合了光蚀刻方法和固相寡核苷酸合成方法的光指导的合成方法来生产(Fodor,S.等,Science,251:767-773(1991);Pirrung等,美国专利No.5,143,854(也参见已出版的PCT申请No.WO 90/15070);和Fodor.S.等,已出版的PCT申请No.WO 92/10092和美国专利No.5,424,186,每个文件的全部内容在此引为参考)。使用机械合成方法合成这些阵列的技术描述在例如美国专利No.5,384,261中,其全部内容在此引为参考。在另一个实施方案中,可以使用线性阵列。
在制备了寡核苷酸阵列后,允许目标核酸与阵列杂交。杂交的检测室对目标核酸中特定等位基因的检测。杂交和扫描一般通过本文描述的方法来进行,也可以使用在例如公开的PCT申请Nos.WO92/10092和WO 95/11995以及美国专利No.5,424,186中描述的方法来进行,每个专利申请在此以其全部教导引为参考。简单来说,通过众所周知的扩增技术(例如PCR),对含有一个或多个以前鉴定的多态性标记物的靶核酸序列进行扩增。典型情况下,这包括使用与靶序列的两条链互补的,位于多态性位点的上游和下游的引物序列。也可以使用不对称PCR技术。然后允许被扩增的靶,通常含有标记,与阵列,在允许发生序列特异性杂交的适合条件下进行杂交。在杂交完成和清洗了阵列后,对阵列进行扫描以确定阵列上杂交了靶序列的位置。从扫描获得的杂交数据一般采用荧光强度作为阵列上位置的函数的形式。
尽管主要根据单一检测区块进行描述,例如单一多态性位点的检测,但阵列可以含有多个检测区块,因此能够分析多个特定的多态性(例如特定单倍型(例如单倍型)的多个多态性)。在可选的安排中,通常可以理解,检测区块可以在单一阵列中分组,或分成多个分开的阵列,以便在靶与阵列的杂交过程中可以使用不同的最适条件。例如,通常希望将位于基因组序列中富含G-C区段的那些多态性的检测与位于富含A-T区段中的检测分开提供。这允许对每种情况下的杂交条件进行分别的最适化。
关于检测多态性的寡核苷酸阵列的使用的其它描述可以在例如美国专利Nos.5,858,659和5,837,832中发现,这两个专利在此以其全部教导引为参考。
可以使用其它的核酸分析方法来检测与癌症相关的多态性位点处的特定等位基因(例如与Chr8q24.21上其核苷酸序列由SEQ ID NO:1和SEQ ID NO:2中显示的序列代表的基因组区段有关的多态性位点)。代表性的方法包括例如直接手动测序(Church和Gilbert,Proc.Natl.Acad.Sci.USA,81:1991-1995(1988);Sanger,F.等,Proc.Natl.Acad.Sci.USA,74:5463-5467(1977);Beavis等,美国专利No.5,288,644);自动化荧光测序;单链构象多态性分析(SSCP);clamped变性凝胶电泳(CDGE);变性梯度凝胶电泳(DGGE)(Sheffield,V.等,Proc.Natl.Acad.Sci.USA,86:232-236(1989));迁移率变动分析(Orita,M.等,Proc.Natl.Acad.Sci.USA,86:2766-2770(1989));限制性酶分析(Flavell,R.等,Cell,15:25-41(1978);Geever,R.等;Proc.Natl.Acad.Sci.USA,78:5081-5085(1981));异源双链分析;化学错配裂解(CMC)(Cotton,R.等,Proc.Natl.Acad.Sci.USA,85:4397-4401(1985));RNase保护分析(Myers,R.等,Science,230:1242-1246(1985));使用识别核苷酸错配的多肽例如大肠杆菌mutS蛋白;以及等位基因特异性PCR。
在本发明的另一个实施方案中,对癌症或对癌症(例如***癌(例如侵略性***癌),乳腺癌,肺癌,黑色素瘤)易感性的诊断,在本文描述的遗传标记物或单倍型导致了多肽的组成或表达发生改变的情况下,可以通过检查癌症相关的核酸编码的多肽的表达和/或组成来进行。因此,对癌症(例如***癌(例如侵略性***癌),乳腺癌,肺癌,黑色素瘤)易感性的诊断,在本文描述的遗传标记物或单倍型导致了多肽的组成或表达发生改变的情况下,可以通过检测这些多肽中的一个,或与癌症相关的核酸编码的另一个多肽的表达和/或组成来进行。本文描述的显示出与癌症的关联性的单倍型和标记物,可能通过它们对这些邻近基因中的一个或多个的影响来发挥作用。影响这些基因的可能机制包括例如影响转录,影响RNA剪接,改变mRNA可选剪接形式的相对量,影响RNA稳定性,影响从细胞核向细胞质的运输,以及影响翻译的效率和精确性。
Chr8q24.21上的c-myc基因编码c-MYC蛋白,它是在20多年前作为禽骨髓细胞瘤反转录病毒的病毒致癌基因v-myc的细胞对应物被鉴定的(Vennstrom等,J.Virology 42:773-79(1982))。c-MYC蛋白是一种转录因子,在用促有丝***刺激物处理细胞后被快速诱导。通过在与名为MAX的蛋白的异源二体复合物中结合E-盒(CACGTG),c-MYC调控许多基因的表达。许多受c-MYC调控的基因参与了细胞周期控制。c-MYC促进细胞周期的进展,抑制细胞分化,并诱导凋亡。c-MYC也对双链DNA修复具有负效应(Karlsson,A等,Proc.Natl.Acad.Sci.USA100(17):9974-79(2003))。c-MYC还促进血管形成(Ngo,C.V.等,Cell Growth Differ.11(4):201-10(2000);Baudino T.A.等,Genes Dev.16(19):2530-43(2002))。
c-myc基因在体外和体内高度致瘤。c-MYC与抑制凋亡的蛋白例如BCL,BCL-XL协同作用,或在转基因小鼠的淋巴瘤生成中与p53或ARF的丧失协同作用(Strasser等,Nature 348:331-333(1990);Blyth,K.等,Oncogene 10:1717-23(1990);Elson,A.等,Oncogene 11:181-90(1995);Eischen,C.M.等,Genes Dev.13:2658-69(1999))。
在***癌中观察到了c-myc基因的扩增和过表达,并通常与侵略性肿瘤,激素不依赖性和不良预后相关(Jenkins,R.B.等,Cancer Res.57(3):524-31(1997);El Gedaily,A.等,Prostate 46(3):184-90(2001);Saramaki,O.等,Am.J.Pathol.159(6):2089-94(2001);Bubendorf,L.等,Cancer Res.59(4):803-06(1999))。在***,乳腺和肺部肿瘤及黑色素瘤中,c-myc和Chr8q24.21区域被进一步放大(Blancato J.等,Br.J.Cancer 90(8):1612-9(2004);Kubokura,H.等,Ann.Thorac.Cardiovasc.Surg.7(4):197-203(2001);Treszl,A.等,Cytometry 60B(1):37-46(2004);Kraehn,G.M.等,Br.J.Cancer 84(1):72-79(2001))。此外,许多其它类型的肿瘤也显示出该区域的放大,包括结肠,肝脏,卵巢,胃,肠和膀胱癌。综合所有的肿瘤类型,显示出Chr8q24.21是最频繁放大的染色体区域,在大约17%的所有肿瘤类型中放大(www.progenetix.com)。
作为将c-myc与免疫球蛋白增强子并置,从而激活了基因的表达的易位的结果,致癌基因参与了Burkitt′s淋巴瘤(Dalla-Favera,R.等,Proc.Natl.Acad.Sci.USA 79(24):7824-27(1982);Taub,R.等,Proc.Natl.Acad.Sci.USA 79(24):7837-41(1982))。它也通过人类***瘤病毒(HPV)整合到基因附近而参与了***。在大多数情况下,HPV整合发生在c-myc基因的跨度为着丝粒方向500kb和端粒方向200kb的区域内(Ferber,J.M.等,Cancer Genetics Cytogenetics 154:1-9(2004);Ferber,M.J.等,Oncogene 22:7233-7242(2003))。
两个脆弱的位点FRA8C和FRA8D分别位于Chr8q24.21上c-myc的着丝粒方向和端粒方向上。脆弱位点在存在制止DNA合成的试剂的情况下倾向于断裂。脆弱位点的复制据信发生在S-期的较晚阶段并且在诱导后甚至更晚。脆弱位点参与染色体扩增,易位和/或病毒***,可能与这些位点较晚复制有关,断裂起始于或接近于停滞的复制叉(Hellman,A.等,Cancer Cell 1:89-97(2002))。
本文描述的位于LD区块C(SEQ ID NO:1)或LD区块C’(SEQID NO:2)中的或与LD区块C(SEQ ID NO:1)或LD区块C’(SEQ IDNO:2)强烈连锁不平衡的(例如由r2大于0.2和/或|D’|>0.8测量到的)标记物或单倍型,能够影响区域的稳定性,导致c-myc基因或其它邻近基因的基因扩增,这是可能的。也就是说,一个人可以从双亲中的一个或两个遗传到SEQ ID NO:1或SEQ ID NO:2中显示的区域的特定变体形式,从而随后在一个或多个细胞中更可能发生体细胞突变事件,导致癌症发展成更具侵略性的形式。因此,在一个实施方案中,本发明的标记物或单倍型(例如与SEQ ID NO:2或SEQ ID NO:1有关的标记物或单倍型)的鉴定,可用于诊断对体细胞突变事件的易感性,体细胞突变事件可以导致癌症发展成更具侵略性的形式。
在一个实施方案中,标记物或单倍型不含有位于c-myc开放阅读框架(即NCBI Build 34中的chr8:128,705,092-128,710,260bp)中的标记物。在另一个实施方案中,标记物或单倍型不含有位于c-myc启动子或开放阅读框架中的标记物。在另一个实施方案中,标记物或单倍型不含有位于c-myc启动子,增强子或开放阅读框架中的标记物。在其它实施方案中,标记物或单倍型不含有位于c-myc开放阅读框架1kb,2kb,5kb,10kb,15kb,20kb或25kb内的标记物。
各种不同的方法可用于进行这样的检测,包括酶联免疫吸附分析(ELISA),Western印迹,免疫沉淀和免疫荧光。评估来自对象的测试样品中由Chr8q24.21相关的核酸和/或与LD区块C(SEQ ID NO:1)或LD区块C’(SEQ ID NO:2)相关的核酸编码的多肽在表达中的变化和/或组成中的变化的存在。由这样的核酸编码的多肽在表达中的变化可以是例如定量的多肽表达(即产生的多肽的量)的变化。由核酸编码的多肽的组成的变化是定性的多肽表达(例如突变体多肽的表达或不同剪接变体的表达)的变化。在一个实施方案中,对癌症(例如***癌(例如侵略性***癌),乳腺癌,结肠癌,肺癌,黑色素瘤)易感性的诊断,通过检测由本文描述的癌症相关核酸(例如与Chr8q24.21相关的核酸,与LD区块C(SEQ ID NO:1)相关的核酸,和/或与LD区块C’(SEQ ID NO:2)相关的核酸)编码的特定剪接变体或剪接变体的特定形式来进行。
也可以同时存在这两种变化(定量的和定性的)。本文中使用的多肽表达或组成中的“变化”,是指测试样品中多肽的表达或组成,与对照样品中多肽的表达或组成相比的变化。对照样品是与测试样品相应的样品(例如,来自于同样类型的细胞),来自于没有感染癌症,和/或不具有对癌症易感性的对象(例如不具有本文描述的标记物或单倍型的对象)。类似地,与对照样品相比,测试样品中一个或多个不同剪接变体的存在,或测试样品中明显不同量的不同剪接变体的存在,可以表明对癌症(例如***癌(例如侵略性***癌),乳腺癌,结肠癌,肺癌,黑色素瘤)的易感性。在变体相对于对照样品中的参比改变了剪接位点的情况下,与对照样品相比,测试样品中多肽的表达或组成的变化可以指示特定的变体(例如标记物等位基因或单倍型)。用于检测核酸编码的多肽的表达和组成的各种不同的方法对本技术领域的专业人员来说是已知的,并可以使用,包括光谱法,比色法,电泳,等电聚焦和免疫分析(例如David等,美国专利No.4,376,110)例如免疫印迹(参见例如《分子生物学现代方法》,特别是第10章,同上)。
例如,在一个实施方案中,可以使用能够与由本文描述的与癌症有关的核酸编码的多肽结合的抗体(例如具有可检测标记的抗体)。抗体可以是多克隆的,也可以是单克隆的。可以使用完整的抗体,也可以使用其片段(例如Fv,Fab,Fab’,F(ab’)2)。对于探针或抗体来说,术语“标记的”意指包含了通过将可检测物质连接(即物理连接)到探针或抗体上以对探针或抗体直接标记,以及通过与被直接标记的另一种试剂具有反应性而对探针或抗体的间接标记。间接标记的例子包括使用标记的第二抗体(例如荧光标记的第二抗体)检测第一抗体,以及用生物素对DNA探针进行末端标记,以便可以使用荧光标记的链亲和素来检测它。
在这种方法的一个实施方案中,将测试样品中与癌症(例如***癌)相关的核酸编码的多肽的水平或量,与对照样品中多肽的水平或量进行比较。测试样品中多肽的水平或量高于或低于对照样品中多肽的水平或量,使得差异在统计学上显著,表明了核酸编码的多肽的表达发生了变化,并且诊断了负责引起表达差异的特定等位基因。或者,将测试样品中多肽的组成与对照样品中多肽的组成进行比较。在另一个实施方案中,可以对测试样品和对照样品中的多肽的水平或量以及组成二者都进行评估。
在另一个实施方案中,对癌症(例如***癌(例如侵略性***癌),乳腺癌,结肠癌,肺癌,黑色素瘤)易感性的诊断,通过检测本发明的至少一个标记物或单倍型(例如在表5A,5B和5C中显示的标记物,以及与其连锁不平衡的标记物或单倍型),以及与其它基于蛋白的,基于RNA的或基于DNA的分析方法(例如其它癌症诊断分析,包括但不限于:PSA分析,癌胚抗原(CEA)分析,BRCA1分析和BRCA2分析)相结合来进行。这样的癌症诊断分析方法在本技术领域中是已知的,并且还包含了专业技术人员已知的癌症的其它遗传风险因子。本发明的方法也可以与对象的家族史和风险因子(例如环境风险因子,生活方式风险因子)的分析组合使用。
正如本技术领域已知的以及在本文中描述的,PSA检验有助于***癌的早期诊断,但是它既不是高灵敏性的,也不是特异性的(Punglia等,N.Engl.J.Med.349(4):335-42(2003))。因此,单独的PSA检验产生了高百分率的假阴性和假阳性诊断,导致在许多情况下漏诊了癌症,以及对未患有癌症的人进行不必要的跟踪组织活检。在一个实施方案中,***癌或对***癌易感性的诊断,通过检测至少一个与Chr8q24.21相关的等位基因和/或与LD区块C相关的等位基因,并与PSA分析相结合来进行。
试剂盒
用于本发明方法的试剂盒包含可用于本文描述的任何方法的组分,包括例如杂交探针,限制性酶(例如用于RFLP分析),等位基因特异性寡核苷酸,与本文描述的本发明的核酸(例如含有至少一个本发明的多态性标记物和/或单倍型的基因组区段)编码的改变的多肽,或本文描述的本发明的核酸编码的未改变的(天然)多肽结合的抗体,用于扩增与癌症有关的核酸的方法,用于分析与癌症有关的核酸的核酸序列的方法,用于分析与癌症有关的核酸编码的多肽的氨基酸序列的方法,等。试剂盒可以包含例如必需的缓冲液,用于扩增本发明的核酸(例如一个或多个与癌症有关的多态性标记物,例如在表5A,5B和5C中显示的标记物)的核酸引物,以及用于使用这些引物扩增的片段的等位基因特异性检测的试剂和必需的酶(例如DNA聚合酶)。此外,试剂盒可以提供与本发明的方法组合使用的分析方法用的试剂,例如用于其它癌症诊断分析方法的试剂。
在一个实施方案中,本发明是用于分析从对象获得的样品,以帮助在对象中检测特定癌症(例如***癌(例如侵略性***癌),肺癌,结肠癌,乳腺癌,黑色素瘤)或对癌症(例如***癌,肺癌,结肠癌,乳腺癌,黑色素瘤)的易感性,其中试剂盒含有在个体的基因组中选择性检测本发明的至少一种多态性的至少一个等位基因所需的试剂。在特定的实施方案中,试剂含有能够与个体的基因组中含有至少一个本发明的多态性的片段杂交的至少一个连续的寡核苷酸。在另一个实施方案中,试剂含有至少一对与从对象获得的基因组区段的相反链杂交的寡核苷酸,其中每个寡核苷酸引物对被设计成选择性扩增个体的基因组中含有至少一个多态性的片段,其中多态性选自表5A,5B和5C中显示的多态性,以及与其连锁不平衡的多态性标记物。在另一个实施方案中,片段的大小为至少20个碱基对。这样的寡核苷酸或核酸(例如寡核苷酸引物)可以使用表明了癌症的多态性(例如SNPs或微卫星)侧接的核酸序列部分来设计。在另一个实施方案中,试剂盒含有一个或多个标记的核酸,能够对与癌症有关的一个或多个特定多态性标记物或单倍型进行等位基因特异性检测,以及用于检测标记的试剂。适合的标记包括例如放射性同位素,荧光标记,酶标记,酶辅助因子标记,磁标记,自旋标记,表位标记。
在特定实施方案中,通过试剂盒的试剂检测的多态性标记物或单倍型包含一种或一种以上标记物,两种或两种以上标记物,三种或三种以上标记物,四种或四种以上标记物或五种或五种以上标记物,标记物选自表5A,表5B和表5C中显示的标记物。在另一个实施方案中,被检测的标记物或单倍型包含表4A和表4B中列出的标记物。在另一个实施方案中,被检测的标记物或单倍型包含与表4A和表4B中列出的标记物中的至少一组标记物强烈连锁不平衡的标记物组中的至少一个标记物,其中强烈连锁不平衡由r2值大于0.2所定义。在优选实施方案中,被检测的标记物或单倍型包含rs16901979以及与其连锁不平衡的标记物。在另一个优选实施方案中,被检测的标记物或单倍型包含HapC(rs1456314等位基因G,rs17831626等位基因T,rs7825414等位基因G,rs6993569等位基因G,rs6994316等位基因A,rs6470494等位基因T,rs1016342等位基因C,rs1031588等位基因G,rs1016343等位基因T,rs1551510等位基因G,rs1456306等位基因C,rs1378897等位基因G,rs1456305等位基因T和rs7816535等位基因G)。
在一个优选实施方案中,用于检测本发明的标记物的试剂盒含有与含有被检测的SNP多态性的模板DNA区段杂交的检测寡核苷酸探针,增强子寡核苷酸探针和内切核酸酶。正如前面解释的,检测寡核苷酸探针在其3’末端含有荧光基团或荧光团,在其5’末端含有淬灭剂,增强子寡核苷酸按照Kutyavin等(Nucleic Acid Res.34:e128(2006))的描述使用。荧光基团可以是Gig Harbor Green或Yakima Yellow,或其它适合的荧光基团。检测探针被设计成与含有被检测的SNP多态性的短核苷酸序列杂交。优选情况下,SNP位于从末端残基到离检测探针的3’末端-6个残基之间的任何位置。增强子是在检测探针3’方向上与DNA模板杂交的短寡核苷酸探针。探针被设计成当两个探针都与模板结合时,在检测探针和增强子核苷酸探针之间存在单个核苷酸缺口。缺口产生了合成的脱碱基位点,可以被内切核酸酶例如内切核酸酶IV识别。酶将染料从完全互补的检测探针上切下,但是不能切开含有错配的检测探针。因此,通过测量释放出的荧光基团的荧光,可以对由检测探针的核苷酸序列限定的特定等位基因的存在进行评估。
检测探针可以具有任何适合的大小,尽管优选情况下探针相对较短。在一个实施方案中,探针的长度为5-100个核苷酸。在另一个实施方案中,探针长度为10-50个核苷酸,在另一个实施方案中,探针长度为12-30个核苷酸。其它长度的探针也是可能的,并在本技术领域的专业人员的普通技能的范围内。
在优选实施方案中,含有SNP多态性的DNA模板在检测前通过聚合酶链反应(PCR)进行扩增,并且用于这样的扩增的引物包含在试剂盒中。在这样的实施方案中,被扩增的DNA被用作检测探针和增强子探针的模板。
在某些实施方案中,检测探针,增强子探针和/或用于通过PCR扩增模板的引物,包括使用修饰的碱基,包括修饰的A和修饰的G。使用修饰的碱基可用于调整核苷酸分子(探针和/或引物)与模板DNA的熔解温度,例如在含有低百分率G或C碱基的区域中增加熔解温度,其中可以使用具有与其互补的T形成三个氢键的能力的修饰的A,或者用于在含有高百分率G或C碱基的区域中降低熔解温度,例如使用在双链DNA分子中与其互补的C碱基只能形成两个氢键的修饰的G碱基。在优选实施方案中,修饰的碱基被用于设计检测核苷酸探针。在这些方法中可以选择任何专业技术人员已知的修饰碱基,根据本文的教导对适合的碱基进行选择也在专业人员的能力范围内,已知的碱基可以从专业人员已知的商业来源获得。
在一个这样的实施方案中,标记物或单倍型的存在是对癌症(例如***癌(例如侵略性***癌),肺癌,结肠癌,乳腺癌,黑色素瘤)易感性(增加的易感性或降低的易感性)的指示。在另一个实施方案中,标记物或单倍型的存在是对癌症治疗试剂的反应的指示。在另一个实施方案中,标记物或单倍型的存在是在个体中癌症预后的指示。在另一个实施方案中,标记物或单倍型的存在是癌症治疗的进展的指示。这样的治疗可以包括外科干预,药物治疗或通过其它方法(例如生活方式改变)。
与本发明的变体有关的疾病的诊断
尽管本发明的方法主要在诊断对癌症(例如***癌)的易感性的背景下进行了描述,但方法也可用于诊断与本发明的多态性标记物有关的癌症。例如,可以对患有癌症或有发生癌症的风险的个体进行评估,以确定个体中本发明的多态性或单倍型的存在是否可能成为在个体中诊断癌症的有贡献的因素。在一个实施方案中,鉴定与本发明的标记物和/或单倍型有关的癌症促进了治疗计划。例如,可以进行保护性治疗以最小化个体发生癌症的发生率。这样的保护性治疗也可以包括评估(i)个体对风险变体是杂合的还是纯合的;(ii)个体的年龄,以及(iii)个体的性别,因为本发明的变体已经被显示出与冠状动脉病和心肌梗塞的低龄发病有关。在本发明的其他实施方案中,可以设计疗法并选择治疗手段,以靶向适合的与本发明的多态性和/或单倍型有关的基因或蛋白。
在本发明的一个实施方案中,与本发明的标记物和/或单倍型有关的癌症的诊断,通过检测本发明的多态性或单倍型来进行。具体的多态性描述在本文中。在特定实施方案中,被检测的多态性标记物或单倍型包含一个或一个以上标记物,两个或两个以上标记物,三个或三个以上标记物,四个或四个以上标记物或五个或五个以上标记物,标记物选自表5A,表5B和表5C中显示的标记物。在另一个实施方案中,被检测的标记物或单倍型包含表4A和表4B中显示的标记物。在另一个实施方案中,被检测的标记物或单倍型含有与表4A和表4B中列出的标记物组中的至少一个强烈连锁不平衡的标记物组中的至少一个标记物,其中强烈连锁不平衡由r2值大于0.2所定义。在优选实施方案中,被检测的标记物或单倍型包含rs16901979以及与其连锁不平衡的标记物。在另一个优选实施方案中,被检测的标记物或单倍型包含HapC(rs1456314等位基因G,rs17831626等位基因T,rs7825414等位基因G,rs6993569等位基因G,rs6994316等位基因A,rs6470494等位基因T,rs1016342等位基因C,rs1031588等位基因G,rs1016343等位基因T,rs1551510等位基因G,rs1456306等位基因C,rs1378897等位基因G,rs1456305等位基因T和rs7816535等位基因G)。
从患有癌症的对象获得基因组DNA,RNA或cDNA测试样品,以确定疾病是否与本发明的一个或多个多态性有关。然后检查DNA,RNA或cDNA样品,以确定在样品中是否发现了本发明的多态性的特定等位基因或特定单倍型的存在。如果发现核酸样品含有多态性的特定等位基因或特定单倍型,那么等位基因或单倍型的存在表明了癌症与多态性和/或单倍型有关。
本技术领域的专业人员已知的方法,以及在本发明的方法和试剂盒中进一步详细描述的方法,可用于检测多态性。
治疗剂
本发明的变体(例如本发明的标记物和/或单倍型,例如在表5A,5B和5C中列出的标记物以及与其连锁不平衡的标记物,例如在表4A和4B中列出的标记物)可用于鉴定新的癌症(例如***癌)的治疗性靶。例如,含有与癌症相关的变体(标记物和/或单倍型)的基因或与其连锁不平衡的基因或它们的产物,以及被这些变体基因或它们的产物直接或间接调控或与它们相互作用的基因或它们的产物,可以成为开发治疗剂的靶,以治疗癌症,或预防或延迟与癌症有关的症状的出现。在一个实施方案中,基因是c-myc。治疗剂可以含有一种或多种例如小的非蛋白和非核酸分子,蛋白,肽,蛋白片段,核酸(DNA,RNA),PNA(肽核酸)或它们的可以调节靶基因或它们的基因产物的功能和/或水平的衍生物或模拟物。
本发明的核酸和/或变体,或含有它们的互补序列的核酸,可用作反义构建物以控制细胞,组织或器官中的基因表达。与反义技术有关的方法对于专业技术人员来说是众所周知的,被描述和综述在《反义药物技术:原理,策略与应用》中(AntisenseDrug Technology:Principles,Strategies,and Applications,Crooke主编,Marcel Dekker Inc.,New York(2001))。一般来说,反义核酸分子被设计成与基因表达的mRNA的区域互补,使得反义分子与mRNA杂交,从而阻断mRNA翻译成蛋白。对于本技术领域的专业人员来说,已知有几类反义寡核苷酸,包括裂解物和阻断物。前者与靶RNA位点结合,活化细胞内核酸酶(例如RnaseH或Rnase L),并裂解靶RNA。阻断物与靶RNA结合,通过对核糖体进行空间位阻来抑制蛋白的翻译。阻断物的例子包括核酸,吗啉代化合物,锁核酸和甲基膦酸酯(Thompson,Drug Discovery Today,7:912-917(2002))。反义寡核苷酸可直接用作治疗剂,也可用于确定和证实基因的功能,例如通过基因敲除或基因击落(gene knock-down)实验。反义技术被进一步描述在Lavery等,Curr.Opin.Drug Discov.Devel.6:561-569(2003),Stephens等,Curr.Opin.Mol.Ther.5:118-122(2003),Kurreck,Eur.J.Biochem.270:1628-44(2003),Dias等,Mol.Cancer Ter.1:347-55(2002),Chen,Methods Mol.Med.75:621-636(2003),Wang等,Curr.Cancer Drug Targets 1:177-96(2001)和Bennett,Antisense Nucleic Acid Drug.Dev.12:215-24(2002)中。
本文描述的变体可用于选择和设计特异性针对特定变体的反义试剂。使用关于本文描述的变体的信息,可以设计出特异性靶向含有本发明的一个或多个变体的mRNA分子的反义寡核苷酸或其它反义分子。通过这种方式,含有一个或多个本发明的变体(标记物和/或单倍型)的mRNA分子的表达可以被抑制或阻断。在一个实施方案中,反义分子被设计成与靶核酸的特定等位基因形式(即一个或几个变体(等位基因和/或单倍型))特异性结合,从而抑制源自于该特定等位基因或单倍型的产物的翻译,但是不与靶核酸分子在特定多态性位点上的其它或可选的变体结合。
由于反义分子可用于失活mRNA以便抑制基因表达,从而抑制蛋白表达,因此该分子可用于治疗疾病例如癌症,包括***癌(例如侵略性***癌),肺癌,结肠癌,乳腺癌,黑色素瘤。方法可以包括用含有与mRNA中的一个或多个区域互补的核苷酸序列的核酶进行裂解,以减弱mRNA被翻译的能力。这样的mRNA区域包括例如蛋白编码区,特别是对应于蛋白的催化活性,底物和/或配体结合位点或其它功能性结构域的蛋白编码区。
自从最初在线虫(C.elegans)中发现以来(Fire等,Nature391:806-11(1998)),在最近的十年中,对RNA干扰(RNAi)现象的研究非常活跃,在近年中,也在积极推行它在治疗人类疾病中的潜在应用(综述在Kim & Rossi,Nature Rev.Genet.8:173-204(2007)中)。RNA干扰(RNAi),也被称为基因沉默,其基础是使用双链RNA分子(dsRNA)关闭特定的基因。在细胞中,细胞质双链RNA分子(dsRNA)被细胞复合物加工成小干扰RNA(siRNA)。siRNA指导蛋白-RNA复合物靶向靶mRNA上的特定位点,导致mRNA的裂解(Thompson,DrugDiscovery Today,7:912-917(2002))。典型情况下,siRNA分子长度为大约20,21,22或23个核苷酸。因此,本发明的一个方面涉及了分离的核酸分子,以及将那些分子用于RNA干扰,即作为小干扰RNA分子(siRNA)。在一个实施方案中,分离的核酸分子的长度为18-26个核苷酸,优选长度为19-25个核苷酸,更优选长度为20-24个核苷酸,更优选长度为21,22或23个核苷酸。
RNAi介导的基因沉默的另一个途径源自于内源性编码的原始微型RNA(pri-miRNA)转录本,它在细胞中被加工以产生前体miRNA(pre-miRNA)。这些miRNA分子从细胞核输出到细胞质中,在这里经历加工以产生成熟的miRNA分子(miRNA),它们通过识别mRNAs的3’非翻译区中的靶位点,然后通过加工性P-体降解mRNA,来直接抑制翻译(综述在Kim & Rossi,Nature Rev.Genet.8:173-204(2007)中)。
RNAi的临床应用包括掺入合成的siRNA双链体,它们优选大小为20-23个核苷酸,并优选具有2个核苷酸的3’重叠。基因表达的降低是通过靶mRNA的序列特异性设计建立起来的。几个用于最适设计的商业化位点和这种分子的合成对于本技术领域的专业人员来说是已知的。
其它的应用提供了较长的siRNA分子(典型长度为25-30个核苷酸,优选为大约27个核苷酸),以及小的发夹RNAs(shRNAs;典型长度为大约29个核苷酸)。后者是天然表达的,描述在Amarzguioui等(FEBS Lett.579:5974-81(2005))中。化学合成的siRNAs和shRNAs是体内加工的底物,在某些情况下提供了比较短的设计更强有力的基因沉默(Kim等,Nature Biotechnol.23:222-226(2005);Siolas等,NatureBiotechnol.23:227-231(2005))。一般来说,siRNAs提供暂时的基因表达沉默,因为它们的细胞内浓度被随后的细胞***稀释了。相反,表达的shRNAs介导长期的,稳定的靶转录本的降低,只要shRNA的转录发生就行(Marques等,Nature Biotechnol.23:559-565(2006);Brummelkamp等,Science 296:550-553(2002))。
因为RNAi分子,包括siRNA,miRNA和shRNA,以序列依赖性的方式起作用,因此本发明的变体(例如表5A,5B和5C中显示的标记物以及与其连锁不平衡的标记物,例如表4A和4B中显示的标记物的核苷酸序列)可用于设计RNAi试剂,它们识别含有特定等位基因和/或单倍型(例如本发明的等位基因和/或单倍型)的特定核酸分子,同时不识别含有其它等位基因或单倍型的核酸分子。因此,这些RNAi试剂可以识别并破坏靶核酸分子。与反义试剂相同,RNAi试剂可用作治疗剂(即用于关闭与疾病相关的基因或与疾病相关的基因的变体),但是也可以用于对基因功能进行表征和证实(例如通过基因敲除或基因击落实验)。
RNAi的递送可以通过本技术领域的专业人员已知的各种方法来进行。使用非病毒递送的方法包括胆固醇,稳定的核酸-脂类颗粒(SNALP),重链抗体片段(Fab),适体和纳米颗粒。病毒递送的方法包括使用慢病毒,腺病毒和腺相关病毒。在某些实施方案中,siRNA分子被化学修饰以增加它们的稳定性。这可以包括在核糖的2’位置的修饰,包括2’-O-甲基嘌呤和2’-氟代嘧啶,它们提供了对Rnase活性的抗性。其它的化学修饰也是可能的,并为本技术领域的专业人员所知。
下面的参考文献为RNAi以及使用RNAi靶向特定基因的可能性提供了进一步的概述:Kim & Rossi,Nat.Rev.Genet.8:173-184(2007),Chen & Rajewsky,Nat.Rev.Genet.8:93-103(2007),Reynolds等,Nat.Biotechnol.22:326-330(2004),Chi等,Proc.Natl.Acad.Sci.USA100:6343-6346(2003),Vickers等,J.Biol.Chem.278:7108-7118(2003),Agami,Curr.Opin.Chem.Biol.6:829-834(2002),Lavery等,Curr.Opin.Drug Discov.Devel.6:561-569(2003),Shi,Trends Genet.19:9-12(2003),Shuey等,Drug Discov.Today 7:1040-46(2002),McManus等,Nat.Rev.Genet.3:737-747(2002),Xia等,Nat.Biotechnol.20:1006-10(2002),Plasterk等,Curr.Opin.Genet.Dev.10:562-7(2000),Bosher等,Nat.Cell Biol.2:E31-6(2000)和Hunter,Curr.Biol.9:R440-442(1999)。
导致发展疾病包括癌症的增加的倾向性或风险的遗传缺陷,或引起疾病的缺陷,可以通过给带有缺陷的对象施用整合有修复序列的核酸片段,在遗传缺陷的位点处提供正常的/野生型核苷酸,来永久地校正。这样的位点特异性修复序列可以包含促进个体的基因组DNA的内源修复的RNA/DNA寡核苷酸。修复序列的施用可以通过适当的载体来进行,例如与聚乙烯亚胺(polyethelenimine)复合,囊封在阴离子脂质体中,病毒载体例如腺病毒载体,或其它适合于促进施用的核酸的细胞内摄入的药物组合物。然后可以克服遗传缺陷,因为嵌合的寡核苷酸诱导正常的序列整合到对象的基因组中,导致正常的/野生型基因产物的表达。替换是可遗传的,因此提供了永久性的修复和与疾病或病症有关的症状的缓解。
本发明提供了鉴定可用于治疗癌症的化合物或药剂的方法。因此,本发明的变体可用作鉴定和/或开发治疗剂的靶。这样的方法可以包括分析药剂或化合物调节含有至少一个本发明的变体(标记物和/或单倍型)的核酸或核酸编码的产物的活性和/或表达的能力。这反过来可用于鉴定抑制或改变编码的核酸产物的不需要的活性或表达的药剂或化合物。用于执行这样的实验的分析方法可以在专业技术人员已知的基于细胞的***或无细胞***中进行。基于细胞的***包括天然表达目标核酸分子的细胞,或已经被遗传修饰以表达某些所需核酸分子的重组细胞。
在患者中变体的基因表达可以通过含有变体的核酸序列的表达(例如含有本发明的至少一个变体的基因,它可以被转录成含有至少一个变体的RNA,并进一步翻译成蛋白),或通过由于变体影响了正常转录本的表达水平或形式,例如在基因的调节或控制区域中的变体而导致的正常/野生型核酸序列的改变的表达,来进行评估。用于基因表达的分析方法包括直接的核酸分析(mRNA),表达的蛋白水平的分析,或参与途径例如信号途径的并行化合物的分析。此外,对于信号途径作出响应而被上调或下调的基因的表达,也可以被分析。一个实施方案包括了将报告基因例如荧光素酶与目标基因的调控区可操作连接。
在一个实施方案中,将细胞与候选化合物或药剂相接触,并测定mRNA的表达,可以鉴定基因表达的调节剂。将存在候选化合物或药剂的情况下mRNA的表达水平与不存在化合物或药剂的情况下的表达水平进行比较。根据这种比较,用于治疗癌症的候选化合物或药剂可以被鉴定为调节变体基因的基因表达的化合物或药剂。当在存在候选化合物或药剂的情况下与不存在它的情况下相比,mRNA的表达或编码的蛋白统计学显著地增加时,候选化合物或药剂被鉴定为核酸表达的刺激剂或上调物。当在存在候选化合物或药剂的情况下与不存在它的情况下相比,核酸的表达或蛋白水平统计学显著地降低时,候选化合物被鉴定为核酸表达的抑制剂或下调物。
本发明还提供了使用通过药物(化合物和/或药剂)筛选被鉴定为基因调节剂(即基因表达的刺激剂和/或抑制剂)的化合物进行治疗的方法。
本发明的另一方面,提供了药物包(试剂盒),药物包包含治疗剂,以及一套本文公开的给人类施用治疗剂以诊断性测试本发明的一种或多种变体的说明书。治疗剂可以是小分子药物,抗体,肽,反义或RNAi分子,或其它治疗性分子。在一个实施方案中,被鉴定为本发明的至少一种变体的携带者的个体被指导服用处方剂量的治疗剂。在一个这样的实施方案中,被鉴定为本发明的至少一个变体的纯合携带者的个体被指导服用处方剂量的治疗剂。在另一个实施方案中,被鉴定为本发明的至少一个变体的非携带着的个体被指导服用处方剂量的治疗剂。
评估对治疗剂响应的可能性的方法,监控治疗的进展的方法以及治疗的方法
正如本技术领域已知的,个体对具体的疗法(例如治疗剂或治疗方法)可能有不同的响应。药物基因组学致力于由于药物特性的改变和/或药物作用的异常或变化,遗传变异(例如本发明的变体(标记物和/或单倍型))是如何影响药物响应的问题。因此,响应差异的基础可能部分是由遗传决定的。由于遗传变异影响药物响应而产生的临床结果,在某些个体中(例如本发明的遗传变体的携带者或非携带者)可能导致药物的毒性或药物的治疗失败。因此,本发明的变体可以确定治疗剂和/或方法作用于身体的方式,或者身体代谢治疗剂的方式。
因此,在一个实施方案中,多态性位点上特定等位基因或单倍型的存在是对特定治疗方式的不同,例如不同响应率的指示。这意味着被诊断有癌症(例如***癌(例如侵略性***癌),乳腺癌,肺癌,结肠癌,黑色素瘤),或携带有本发明的多态性位点处的某些等位基因或单倍型(例如本发明的有风险和保护性等位基因和/或单倍型)的患者,将对特定的治疗,药物和/或用于治疗癌症的其它疗法具有较好的,或较糟的响应。因此,标记物等位基因或单倍型的存在或不存在,可以帮助确定对患者应该使用什么疗法。例如,对于新诊断的患者来说,可以评估本发明的标记物或单倍型的存在(例如如本文描述的通过测试源自于血液样品的DNA)。如果患者对标记物等位基因或单倍型阳性(也就是说存在标记物的至少一个特定等位基因或单倍型),那么医生可以推荐一种特定的疗法,而如果患者对标记物的至少一个等位基因或单倍型阴性,那么可以推荐不同的疗法过程(可以包括推荐进行除了连续监测疾病的进展之外不进行即时的疗法)。因此,患者的携带者状态可用于帮助确定是否应该实施特定的治疗方式。值位于能够在早期阶段诊断疾病的可能性的范围内,以选择最适合的疗法,并给临床医生提供关于疾病的预后/侵略性的信息,以便能够施用最适合的疗法。
本发明还涉及监测对特定癌症(例如***癌(例如侵略性***癌),乳腺癌,肺癌,结肠癌,黑色素瘤)的治疗的进展或有效性的方法。这可以根据本发明的标记物和单倍型的基因型和/或单倍型状态来进行,即通过本文公开的评估至少一个多态性标记物的至少一个等位基因的不存在或存在,或通过监测本发明的与变体(标记物和单倍型)相关的基因的表达来进行。可以测量组织样品(例如外周血样品或活检样品)中风险基因的mRNA或编码的多肽。因此,在治疗之前或期间可以确定表达水平和/或mRNA水平,以监测其有效性。可选地或同时地,在治疗之前或期间可以如本文给出的,测定至少一个癌症风险变体的基因型和/或单倍型状态,以监测其有效性。
或者,可以通过测定mRNA和/或多肽水平来监测与本发明的标记物和单倍型有关的生物网络或代谢途径。这可以通过例如在治疗之前和期间在所取的样品中监测属于网络和/或途径的几个基因的表达水平或多肽来进行。或者,在治疗之前和期间可以测定属于生物网络或代谢途径的代谢物。通过将治疗过程中观察到的表达水平/代谢物水平的变化与正常对象的相应数据进行比较,可以确定治疗的有效性。
另一方面,本发明的标记物可用于增加临床试验的能力和有效性。因此,是本发明的至少一个风险变体的携带者的个体,即是赋予发生癌症的增加的风险的至少一个多态性标记物的至少一个等位基因或单倍型的携带者的个体,可能更可能对特定的治疗方式做出响应。在一个实施方案中,携带有特定的治疗(例如小分子药物)所靶向的途径和/或代谢网络中的基因的风险变体的个体,更可能是所述治疗的响应者。在另一个实施方案中,携带有其表达和/或功能被风险变体改变的基因的风险变体的个体,更可能是靶向该基因,其表达或其基因产物的治疗方式的响应者。本应用可以提高临床试验的安全性,但是也可以增加临床试验证明出统计学显著的效能的机会,否则这种效能被限于在群体的某些亚组。因此,这种试验的一个可能的结果是,某些遗传变体例如本发明的标记物和单倍型的携带者,统计学显著地可能显示出对治疗剂的阳性响应,即当按照处方服用治疗剂或药物时,经历了与癌症有关的症状的缓解。
另一方面,本发明的标记物和单倍型可用于靶向对特定个体的药物试剂的选择。利用本发明的风险变体,可以实现治疗方式的个性化选择,生活方式的改变或二者的组合。因此,关于本发明的特定标记物的个体状态的信息,在靶基因或基因产物受到本发明的风险变体影响的情况下,可用于选择治疗选项。变体的某些组合可能适合于治疗选项的一种选择,而其它基因变体组合可以靶向其它治疗选项。根据需要,这样的变体组合可以包括一种变体,两种变体,三种变体或四种或四种以上的变体,以临床可靠的精确性确定治疗模式的选择。
除了本发明的变体的诊断和治疗应用之外,变体(标记物和单倍型)也可以是用于人类身份鉴定的有用标记物,可用于法医学,亲子鉴定和生物计量学。SNPs在法医学领域的具体应用由Gill(Int.J.LegalMed.114:204-10(2001))进行了综述。个体之间基因组DNA的遗传差异可用作遗传标记物以鉴定个体,并将生物样品与个体相关联。遗传标记物,包括SNPs和微卫星,可用于区分个体。分析的标记物越多,在任何给定的个体中标记物的等位基因组合与无关个体(假设标记物是无关的,即标记物是完美的连锁平衡的)中相同的可能性越低。因此,用于这些目的的变体优选是无关的,即它们是独立遗传的。因此,优选的标记物可以选自可用的标记物,例如本发明的标记物,选择的标记物可以含有来自人类基因组不同区域的标记物,包括不同染色体上的标记物。
在某些应用中,用于法医检验的SNPs来自简并密码子位置(即某些密码子的第三个位置,以便SNP的变异不影响密码子编码的氨基酸)。在其它应用中,例如预测基因型特征包括种族,血统或身体特征的应用中,利用影响编码的蛋白的氨基酸序列的SNPs可能是有用的或需要的。在其它这样的实施方案中,变体(SNP或其它多态性标记物)影响了邻近基因的表达水平,从而导致了改变的蛋白表达。
核酸和多肽
如上所述,本文描述的核酸和多肽可用于本发明的方法和试剂盒。
本文使用的“分离”的核酸分子,是与正常情况下位于基因或核苷酸序列侧翼(例如在基因组序列中)的核酸分开的,和/或已经从其它转录的序列中(例如在RNA文库中)完全或部分纯化出的核酸分子。例如,本发明的分离的核酸,相对于它自然发生的复杂的细胞环境,或通过重组技术生产时的培养基,或化学合成时的化学前体或其它化学物质来说,是基本上分离的。在某些情况下,分离的物质形成的组合物(例如含有其它物质的粗提液),缓冲***或试剂混合物的一部分。在其它情况下,物质可以被纯化到例如通过聚丙烯酰胺凝胶电泳(PAGE)或柱层析(例如HPLC)测定时基本上均一。本发明的分离的核酸分子可以含有所有存在的大分子物质的至少大约50%,至少大约80%或至少大约90%(摩尔数的基础上)。对于基因组DNA来说,术语“分离的”也可以指从与基因组DNA天然关联的染色体分离出的核酸分子。例如,分离的核酸分子可以含有少于大约250kb,200kb,150kb,100kb,75kb,50kb,25kb,10kb,5kb,4kb,3kb,2kb,1kb,0.5kb或0.1kb的在核酸分子所源自的细胞的基因组DNA中位于核酸分子侧翼的核苷酸。
核酸分子可以与其它编码或调节序列融合,并仍被当作是分离的。因此,载体中包含的重组DNA包含在本文使用的“分离的”的定义内。分离的核酸分子也包含异源宿主细胞或异源生物体中的重组DNA分子,以及溶液中的部分纯化的或基本上纯化的DNA分子。“分离的”核酸分子也包括本发明的DNA分子的体外和体内RNA转录本。分离的核酸分子或核苷酸序列可以包括化学合成的或通过重组方法产生的核酸分子或核苷酸序列。这样的分离的核苷酸序列用于例如编码的多肽的制造,用于分离同源序列(例如从其它哺乳动物物种)的探针,用于基因作图(例如通过与染色体原位杂交),或用于检测组织(例如人类组织)中基因的表达,例如通过Northern印迹分析或其它杂交技术。
本发明还涉及在高度严紧条件下与本文描述的核苷酸序列杂交,例如选择性杂交的核酸分子(例如与含有本文描述的标记物或单倍型相关的多态性位点的核苷酸序列特异性杂交的核酸分子)。这样的核酸分子可以通过等位基因特异性或序列特异性杂交(例如在高度严紧条件下)来检测和/或分离。用于核酸杂交的严紧条件和方法对于专业技术人员来说是众所周知的(参见例如《分子生物学现代方法》,Current Protocols in Molecular Biology,Ausubel,F.等,John Wiley &Sons,(1998),以及Kraus,M.和Aaronson,S.,Methods Enzymol.,200:546-556(1991),在此以其全部教导引为参考)。
两个核苷酸或氨基酸序列的百分同一性可以通过出于最适比较的目的将序列进行比对(例如可以在第一个序列的序列中引入缺口)来确定。然后比较相应位置上的核苷酸或氨基酸,两个序列之间的百分同一性是序列共有的同样的位置的数量的函数(即%同一性=同一的位置的数量/总的位置的数量×100)。在某些实施方案中,出于比较目的进行比对的序列的长度是参比序列的长度的至少30%,至少40%,至少50%,至少60%,至少70%,至少80%,至少90%或至少95%。两个序列的实际比较可以通过众所周知的方法来进行,例如使用数学算法。这样的数学算法的非限制性的例子描述在Karlin,S.和Altschul,S.,Proc.Natl.Acad.Sci.USA,90:5873-5877(1993)中。这样的算法被整合在NBLAST和XBLAST程序(2.0版)中,描述在Altschul,S.等,Nucleic Acids Res.,25:3389-3402(1997)中。在使用BLAST和带缺口BLAST程序时,可以使用相应程序(例如NBLAST)的缺省参数。参见万维网ncbi.nlm.nih.gov网点。在一个实施方案中,用于序列比较的参数可以被设置为分值=100,字长=12,或可以改变(例如W=5或W=20)。
其它的例子包括了Myers和Miller,CABIOS(1989)的算法,在Torellis,A.和Robotti,C.,Comput.Appl.Biosci.10:3-5(1994)中描述的ADVANCE和ADAM算法;以及在Pearson,W.和Lipman,D.,Proc.Natl.Acad.Sci.USA,85:2444-48(1988)中描述的FASTA算法。
在另一个实施方案中,两个氨基酸序列之间的百分同一性可以使用GCG软件包(Accelrys,Cambridge,UK)中的GAP程序来完成。
本发明还提供了分离的核酸分子,它们含有的片段或一部分在高度严紧条件下,与含有或由SEQ ID NO:1或SEQ ID NO:2中显示的核苷酸序列组成的核酸,或含有或由SEQ ID NO:1或SEQ ID NO:2中的核苷酸序列的互补序列组成的核苷酸序列杂交,其中核酸序列含有本文描述的标记物和单倍型中包含的至少一个多态性等位基因。本发明的核酸片段的长度为至少大约15,至少大约18,20,23或25个核苷酸,可以是30,40,50,100,200,500,1000,10,000个或以上的核苷酸长。
本发明的核酸片段在例如本文描述的分析方法中被用作探针或引物。“探针”或“引物”是以碱基特异性的方式与核酸分子的互补链杂交的寡核苷酸。除了DNA和RNA之外,这样的探针和引物包括多肽核酸(PNA),它描述在Nielsen,P.等,Science 254:1497-1500(1991)中。探针或引物含有与核酸分子的至少大约15个,典型为大约20-25个,在某些实施方案中大约40,50或75个连续的核苷酸杂交的核苷酸序列区域。在一个实施方案中,探针或引物含有本文描述的至少一个多态性标记物的至少一个等位基因或至少一个单倍型,或其互补序列。在特定实施方案中,探针或引物可以含有100个或以下的核苷酸;例如,在某些实施方案中从6到50个核苷酸,或例如从12到30个核苷酸。在其它实施方案中,探针或引物与连续的核苷酸序列或连续的核苷酸序列的互补序列至少70%同一,至少80%同一,至少85%同一,至少90%同一或至少95%同一。在另一个实施方案中,探针或引物能够与连续的核苷酸序列或连续的核苷酸序列的互补序列选择性杂交。通常情况下,探针或引物还含有标记,例如放射性同位素,荧光标记,酶标记,酶辅助因子标记,磁标记,自选标记和表位标记。
本发明的核酸分子,例如本文描述的那些,可以使用专业技术人员熟知的标准分子生物学技术来鉴定和分离。可以将扩增的DNA标记(例如放射性标记)并用作探针,筛选来自人类细胞的cDNA文库。cDNA可以源自于mRNA并包含在适合的载体中。可以分离到相应的克隆,在体内切除后可以获得DNA,然后可以通过本技术领域现有的方法在任一或两个方向上对克隆的***片段进行测序,以鉴定编码具有适合分子量的多肽的正确的阅读框架。使用这些以及类似的方法,可以对多肽和编码多肽的DNA进行分离,测序和进一步表征。
一般来说,本发明的分离的核酸序列在Southern凝胶中可以用作分子量标准品,并作为被标记的染色体标记物以对相关基因位置进行作图。核酸序列也可用于与患者中的内源DNA序列进行比较,以鉴定癌症(例如***癌)或对癌症(例如***癌)的易感性,以及作为探针用于杂交和发现相关的DNA序列或从样品中扣除已知的序列(例如扣除杂交)。核酸序列还可以用于产生引物,用于遗传指纹法,使用免疫技术产生抗多肽抗体,和/或作为抗原产生抗DNA抗体或引发免疫应答。
抗体
还提供了特异性结合一种形式的基因产物但是不结合另一种形式的基因产物的多克隆抗体和/或单克隆抗体。还提供了与含有多态性位点或多个位点的变体或参比基因产物的一部分结合的抗体。本文使用的术语“抗体”是指免疫球蛋白分子和免疫球蛋白分子的免疫活性部分,即含有与抗原特异性结合的抗原结合位点的分子。与本发明的多肽特异性结合的分子,是与该多肽或其片段结合,但是与样品,例如天然含有多肽的生物学样品中的其它分子基本上不结合的分子。免疫球蛋白分子的免疫活性部分的例子包括F(ab)和F(ab’)2片段,可以通过用酶例如胃蛋白酶处理抗体来产生。本发明提供了与本发明的多肽结合的多克隆和单克隆抗体。本文使用的术语“单克隆抗体”或“单克隆抗体组合物”是指一群抗体分子,只含有一种能够与本发明的多肽的特定表位发生免疫反应的抗原结合位点。因此,单克隆抗体组合物典型地表现出对与其发生免疫反应的本发明的特定多肽的单一结合亲和性。
多克隆抗体可以按照以前的描述通过用所需的免疫原例如本发明的多肽或其片段免疫适当的对象来制备。可以通过标准的技术随时间监测被免疫的对象中的抗体滴度,例如使用固定化的多肽的酶联免疫吸附分析(ELISA)。如果需要,可以从哺乳动物(例如从血液)中分离针对多肽的抗体分子,并通过众所周知的技术例如蛋白A层析进一步纯化以获得IgG级份。在免疫后适当的时间,例如当抗体滴度最高时,可以从对象获得抗体生产细胞,用于通过标准技术制备单克隆抗体,例如最初由Kohler和Milstein,Nature 256:495-497(1975)描述的杂交瘤技术,人类B细胞杂交瘤技术(Kozbor等,Immunol.Today 4:72(1983)),EBV杂交瘤技术(Cole等,《单克隆抗体与癌症疗法》Monoclonal Antibodies and Cancer Therapy,Alan R.Liss,1985,Inc.,pp.77-96)或trioma技术。用于生产杂交瘤的技术是众所周知的(一般来说,参见《免疫学现代方法》Current Protocols in Immunology(1994)Coligan等主编,John Wiley & Sons,Inc.,New York,NY)。简单来说,将永生的细胞株(典型为骨髓瘤)与用来自上述的免疫原免疫的哺乳动物的淋巴细胞(典型为脾细胞)融合,并筛选获得的杂交瘤细胞的培养上清液,以鉴定产生与本发明的多肽结合的单克隆抗体的杂交瘤。
多种众所周知的用于融合淋巴细胞和永生细胞株的方案中的任一种都可用于产生针对本发明的多肽的单克隆抗体的目的(参见例如《免疫学现代方法》Current Protocols in Immunology,同上;Galfre等,Nature266:55052(1977);R.H.Kenneth,《单克隆抗体:生物学分析中的新次元》Monoclonal Antibodies:A New Dimension In Biological Analyses,Plenum Publishing Corp.,New York,New York(1980);以及Lerner,YaleJ.Biol.Med.54:387-402(1981))。此外,普通技术人员将会认识到,这种方法的许多变化形式也将可以使用。
或者,为了制备分泌单克隆抗体的杂交瘤,可以通过用多肽筛选重组组合免疫球蛋白文库(例如抗体噬菌体显示文库),从而分离与多肽结合的免疫球蛋白文库成员,来鉴定和分离针对本发明的多肽的单克隆抗体。用于产生和筛选噬菌体显示文库的试剂盒是可商购的(例如Pharmacia的重组噬菌体抗体***,目录号No.27-9400-01;以及Stratagene SurfZAPTM噬菌体展示试剂盒,目录号No.240612)。此外,特别适合用于产生和筛选抗体显示文库的方法和试剂的例子可以在下列文献中发现,例如美国专利No.5,223,409,PCT公开号No.WO92/18619,PCT公开号No.WO 91/17271,PCT出版号No.WO92/20791,PCT公开号No.WO 92/15679,PCT公开号No.WO 93/01288,PCT出版号No.WO 92/01047,PCT公开号No.WO 92/09690,PCT公开号No.WO 90/02809,Fuchs等,Bio/Technology 9:1370-1372(1991),Hay等,Hum.Antibod.Hybridomas 3:81-85(1992),Huse等,Science 246:1275-1281(1989),和Griffiths等,EMBO J.12:725-734(1993)。
此外,可以使用标准的重组DNA技术制造的,含有人类和非人类部分的重组抗体,例如嵌合和人源化单克隆抗体,在本发明的范围内。这样的嵌合和人源化单克隆抗体可以通过本技术领域已知的重组DNA技术来生产。
总的来说,本发明的抗体(例如单克隆抗体)可用于通过标准技术分离本发明的多肽,例如亲和层析或免疫沉淀。多肽特异性抗体可以便于从细胞纯化天然的多肽以及在宿主细胞中表达的重组生产的多肽。此外,特异性针对本发明的多肽的抗体,可用于检测多肽(例如细胞裂解物,细胞上清液或组织样品中的),以评估多肽表达的丰度和图谱。作为临床测试的一部分,抗体在诊断上可用于监测组织中的蛋白水平,以例如确定给定治疗方案的效能。抗体可以与可检测物质结合,以便于其检测。可检测的物质的例子包括各种不同的酶,辅基,荧光物质,发光物质,生物发光物质和放射活性物质。适合的酶的例子包括辣根过氧化物酶,碱性磷酸酶,β-半乳糖苷酶或乙酰胆碱酯酶;适合的辅基复合物的例子包括链亲和素/生物素和亲和素/生物素;适合的荧光物质的例子包括伞形花内酯(umbelliferon),荧光素,荧光素异硫氰酸酯,罗丹明,dichlorotriazinylamine荧光素,丹磺酰氯或藻红蛋白;发光材料的例子包括鲁米诺(luminol);生物发光材料的例子包括荧光素酶,萤光素和水母发光蛋白,适合的放射活性材料的例子包括125I,131I,35S或3H。
抗体也可用于药物基因组学分析。在这样的实施方案中,针对本发明的核酸编码的变体蛋白,例如由含有本发明的至少一个多态性标记物的核酸编码的变体蛋白的抗体,可用于鉴定需要修改治疗模式的个体。
此外,抗体可用于评估在疾病状态中,例如癌症(例如***癌)的活动阶段中,或者在具有与蛋白的功能相关的癌症,特别是***癌的倾向性的个体中,变体蛋白的表达。特异性针对由含有本文描述的至少一个多态性标记物或单倍型的核酸编码的本发明的变体蛋白的抗体,可用于筛选变体蛋白的存在,例如用于筛选由变体蛋白的存在所指示的对癌症(例如***癌)的倾向性。
抗体可以用于其它方法。因此,抗体可以用作诊断工具,用于评估蛋白,例如本发明的变体蛋白,以及通过电泳迁移率,等电点,胰蛋白酶或其它蛋白酶消化进行的分析,或用于本技术领域的专业人员已知的其它物理分析中。抗体也可用于组织分型。在一个这样的实施方案中,将特定的变体蛋白与在特定组织类型中的表达相关联,然后可以使用特异性针对变体蛋白的抗体来鉴定特定的组织类型。
蛋白,包括变体蛋白的亚细胞定位,也可以使用抗体来确定,并且可用于评估各种不同组织的细胞中蛋白的异常亚细胞定位。这样的用途可以用于遗传测试中,但是也可以用于监测特定的治疗模式。在治疗的目的是校正变体蛋白的表达水平或存在,或变体蛋白的异常组织分布或发育表达的情况下,可以使用特异性针对变体蛋白或其片段的抗体来监测治疗的效能。
抗体还可用于抑制变体蛋白的功能,例如通过阻断变体蛋白与结合分子或配偶体的结合。这样的用途也可用于涉及抑制变体蛋白的功能的治疗的情况中。例如,抗体可用于阻断或竞争性抑制结合,从而调节(即激活或拮抗)蛋白的活性。可以制备针对含有特定功能所需的位点的特定蛋白片段的抗体,或针对与细胞或细胞膜有关的完整蛋白的抗体。为了在体内施用,可以将抗体与其它的治疗有效装载物连接,例如放射性核素,酶,免疫原性表位或细胞毒性药剂,包括细菌毒素(白喉毒素或植物毒素,例如篦麻毒素)。抗体或其片段的体内半衰期可以通过与聚乙二醇连接进行PEG化而增加。
本发明还涉及在本文描述的方法中使用抗体的试剂盒。这包括但不限于用于检测测试样品中变体蛋白的存在的试剂盒。一个优选的实施方案包含抗体例如标记的或可标记的抗体,以及用于在生物学样品中检测变体蛋白的化合物或试剂,用于确定样品中变体蛋白的量或存在和/或不存在的方法,以及用于将样品中变体蛋白的量与标准进行比较的方法,以及使用试剂盒的说明书。
现在,将通过下面的实施例对本发明进行说明,它们不打算以任何方式构成限制。
实施例1,与***癌相关的LD区块C区域的鉴定
遗传研究中包含的患者
基于从1955年到2005年在冰岛诊断的患有***癌的所有***癌患者的名单的群体形成了本发明的基础。从2001年正在发病的患者被邀请加入研究。到2006年10月,已经从1564位***癌患者收集了血液样品。对该群体中的1455位***癌患者以及4182位对照个体使用Illumina 317K Bead芯片进行了基因分型。
用于关联性和单倍型分析的统计方法
对于单个标记物与疾病的关联性来说,使用Fisher精确检验计算每个单个等位基因的双面P-值。在显示结果时,我们使用了等位基因频率而不是SNPs和单倍型的携带者频率。单倍型分析使用我们在deCODE开发的被称为NEMO(NEsted MOdels)的计算机程序来进行(Gretarsdóttir等,Nat Genet.2003 Oct;35(2):131-8)。NEMO被用于研究标记物-标记物关联性以及计算标记物之间的连锁不平衡(LD),以及用于病例-对照单倍型分析。使用NEMO,通过最大或然性估算了单倍型频率,患者与对照之间的差异使用通用的或然性比率测试来进行测试。最大或然性估算值,或然性比率和P-值,在EM算法的帮助下直接从观察到的数据计算,因此阶段的不确定性和丢失的基因型导致的信息的损失被或然性比率自动捕获,并且在大多数情况下,大样品理论可用于可靠地确定统计学显著性。等位基因或单倍型的相对风险(RR),即等位基因与同样标记物的所有其它等位基因相比的风险,以及群体归因风险(PAR),根据乘法模型假设来计算(Terwilliger,J.D.& Ott,J.用于检测等位基因关联性的基于单倍型的“单倍型相对风险”方法,A haplotype-based′haplotype relative risk′approach to detectingallelic associations.Hum.Hered.42,337-46(1992)和Falk,C.T.&Rubinstein,P.单倍型相对风险:为风险计算构建适合的对照样品的一种容易可靠的方法,Haplotype relative risks:an easy reliable way toconstruct a proper control sample for risk calculations.Ann.Hum.Genet.51(Pt 3),227-33(1987))。
在单倍型分析中,将单倍型分组到一起并将组作为整体测试与疾病的关联性,可能是有用的。使用NEMO这样做是可能的。通过对所有可能的单倍型组进行分区,其中假定同样组中的单倍型赋予了同样的风险,而不同组中的单倍型可以赋予不同的风险,定义了一个模型。当与虚假设相比,可选的假设对应于更精细的分区时,虚假设和可选的假设据说是嵌套的。NEMO在对单倍型空间进行分区时提供了完全的灵活性。通过这种方式,有可能同时进行多个单倍型的关联性测试和测试不同的单倍型是否赋予了不同的风险。作为LD的度量,我们使用了两个标准的LD的定义,D′和R2(Lewontin,R.,Genetics,49:49-67(1964),以及Hill,W.G.和A.Robertson,Theor.Appl.Genet.,22:226-231(1968)),因为它们提供了关于LD的量的互补的信息。为了估算D′和R2,使用最大或然性方法估算了所有双标记物等位基因组合的频率,并使用或然性比率测试估算了连锁不平衡的偏差。通过对由边缘等位基因概率权重的两个标记物的所有可能的等位基因组合的值进行平均,D′和R2的标准定义被扩展到包含了微卫星。
可以从整个基因组范围内被基因分型的浓密的标记物组中构建出来的可能的单倍型的数量非常大,尽管在患者和对照组中实际观察到的单倍型的数量要小得多,测试所有那些单倍型与疾病的关联性是艰难的任务。应该注意到,我们没有将我们的分析限制于从一组连续的标记物构建出的单倍型,因为某些标记物可能是非常异变的,可能使原本由周围的标记物构建出的非常保守的单倍型***开。
结果
如本文所述,染色体8q24.21上的区域(LD区块C)被鉴定出赋予了对特定癌症(例如***癌(例如侵略性***癌))的增加的风险。与***癌的增加的风险有关的特定单倍型和标记物描述在表1中。如表1所示,单倍型(HapC)包含了下面的标记物(例如SNPs)和等位基因:rs14563143等位基因,rs178316264等位基因,rs78254143等位基因,rs69935693等位基因,rs69943161等位基因,rs64704944等位基因,rs10163422等位基因,rs10315883等位基因,rs10163434等位基因,rs15515103等位基因,rs14563062等位基因,rs13788973等位基因,rs14563054等位基因,rs78165353等位基因。通过检查HapMap项目中高加索人(CEU)样品的结果,显示出SNP标记物rs16901979的等位基因1与HapC强烈相关(D’=1,r2=1)。在冰岛人样品中对rs16901979的基因分型证实了它与HapC的相关性(对照中D’=0.98,r2=0.70)。标记物和单倍型位于128,032,278和128,094,256bp位置(NCBI Build 34)之间的我们称为LD区块C的区域中,每个标记物的位置显示在表2中。SNPs的等位基因编码如下:1=A,2=C,3=G,4=T。注意到在侵略性***癌中,与所有***癌相比,观察到了增加的风险。侵略性表型由***癌具有组合Gleason级别为7或以上,和/或T3阶段或以上,和/或***阳性,和/或转移阳性的疾病,和/或由***癌引起的死亡来确定。注意,具有这些标准中的一个就足以确定侵略性***癌。这些临床参数是疾病的增加的侵略性的众所周知的替代物。
表1,在冰岛,Chr8q24上的SNP标记物与***癌(PrCa)的关联性
Figure A20078004694301071
显示了在8q24.21的同样的LD区块中标记物rs16901979和SNPs的等位基因,相应的病例和对照数(N),在染病的和对照个体中的等位基因频率,比值比(OR)和双面P值。染病的个体是被诊断患有***癌的个体(ICD10=C61);或被诊断患有***癌(ICD10:C61)并患有侵略性***癌的个体,侵略性***癌通过组合的表型确定,包括组合Gleason级别为7或以上,或癌症为T3阶段或以上,或***阳性的疾病,或转移阳性的疾病,或男性由于***癌死亡。对照是基于未染病的群体的对照。SNPs的等位基因编码如下:1=A,2=C,3=G,4=T。PAR是可以由这些变体解释的群体归因风险。
通过使用rs16901979的基因型以及HapC中的其它相关SNPs以增加基因型产率,产生了rs16901979的等位基因1的结果。
HapC:3rs1456314 4 rs17831626 3 rs7825414 3 rs6993569 1 rs6994316 4 rs6470494 2rs1016342 3 rs1031588 4 rs101634 3 3rs1551510 2 rs1456306 3 rs1378897 4 rs1456305 3rs7816535.
如表1所示,标记物rs16901979等位基因1和14标记物HapC单倍型都给出了与***癌显著的关联性。单倍型的群体频率略低于rs16901979等位基因1的群体频率,相应的相对风险略高。在冰岛,这些变体的群体归因风险在所有***癌中为5.9-6.4%,略高或者在侵略性***癌患者中为6.7-7.6%。
SNP标记物rs16901979的相对的等位基因或等位基因2在携带者中显示出了对***癌的显著的保护性。这些结果显示在表2中。
表2,在冰岛,Chr8q24上赋予对***癌的保护性的变体
显示了在8q24.21上标记物rs16901979的等位基因,相应的病例和对照数(N),在染病的和对照个体中的变体等位基因频率,比值比(OR)和双面P值。染病的个体是被诊断患有***癌的个体(ICD10=C61);或被诊断患有***癌(ICD10:C61)并患有侵略性***癌的个体,侵略性***癌通过组合的表型确定,包括组合Gleason级别为7或以上,或癌症为T3阶段或以上,或***阳性的疾病,或转移阳性的疾病,或由于***癌死亡。对照是基于未染病的群体的对照。SNPs的等位基因编码如下:1=A,2=C,3=G,4=T。
表3列出了LD区块C区域中HapC中的SNP标记物。给出的SNPs的位置相对于人类基因组组装体的NCBI Build34。用碱基对位置指示了标记物的相对位置。
表3:HapC中的SNPs和标记物rs16901979的基因组位置
Figure A20078004694301091
带有在NCBI Build 34中的基因组位置(碱基对)的HapC中的SNP标记物和rs16901979
为了发现表1中测试和显示的标记物和单倍型所表明的这种LD区块C的关联性,我们使用了来自Illumina的Infinium HumanHap300SNP芯片进行了基因组范围的扫描,在单一芯片上分析了大约317,000个单核苷酸多态性(SNPs)。通过这种方式,我们对1455个患者和4182个对照进行了基因分型。对照代表了未染病的冰岛人群体样品。使用单个标记物,两个标记物以及代表了人类基因组中每个和所有LD区块中的所有连续的标记物的单倍型,进行了关联性分析。SNP标记物rs 16901979等位基因1被发现给出了与***癌的高度显著的关联性。标记物rs16901979没有位于Illumina Hap300芯片上,并被单独进行基因分型。LD区块C中的标记物的两个标记物的单倍型也给出了与***癌的高度显著的关联性。当由整个基因组的每个LD区块中所有连续的SNP标记物组成的单倍型被测试(LD区块单倍型)它们与***癌的关联性时,最显著的单倍型是Chr8q24上的位置128.414-128.506Mb(NCBI Build34)。该发现已经被我们描述过(Amundadottir等,Nat Genet.2006 Jun;38(6):652-8.)。非常令我们吃惊的是,第二个最好的LD区块单倍型位于Chr8q24上仅仅几十万个碱基对之外,或位于128.032-128.095Mb(NCBI Build34)。我们可以将该单倍型称为LD区块单倍型C(HapC)和LD区块C。由于人类基因组的LD区块(单倍型区块)结构,我们进一步研究了LD区块C,rs16901979位于其中。
有30个SNPs与rs16901979强烈连锁不平衡,因此在检测本文描述的与***癌的关联性中都同样好。这些SNPs和rs16901979之间的连锁不平衡由r2大于0.5来度量。这些标记物列于表4A中。表4B列出了在不同的HapMap群体中与rs16901979连锁不平衡的标记物,在该群体中对rs16901979的r2值为至少0.2。
表4A:与rs16901979相关的SNPs
Figure A20078004694301101
所有列出的SNPs与rs16901979的r2>0.5。列出了SNP的名称以及在NCBI Build 34中的基因组位置(碱基对)。
Figure A20078004694301112
Figure A20078004694301121
Figure A20078004694301131
Figure A20078004694301141
Figure A20078004694301151
Figure A20078004694301161
Figure A20078004694301171
Figure A20078004694301181
图1中显示了与***癌相关的标记物和单倍型在LD区块C区中的LD结构。结构衍生自HAPMAP数据19版。该LD区块(LD区块C)位于128,032,278bp位置的标记物rs1456314和128,094,256bp位置的标记物rs7816535(NCBI build 34)之间,长度几乎为65kb。LD结构被看作在图中显示的标记物之间具有高的r2和|D’|的DNA区块。标记物被表示成等间距的,即任何两个标记物之间具有相同的距离。
有可能其它位于LD区块C区域中的标记物也与***癌相关,因为这样的标记物与rs16901979连锁不平衡。表5A提供了通过对LD区块C(NCBI Build 34中的128032278-128094256bp的位置)进行扫描,在LD区块C中公开了解的SNP标记物的列表。表5B提供了在LD区块C’中(对应于SEQ ID NO:2中显示的序列)所有公开的SNP标记物的列表,表5C提供了该区域中所有微卫星标记物的列表。
表5A:LD区块C(SEQ ID NO:1)中所有已知的SNPs
Figure A20078004694301191
Figure A20078004694301201
Figure A20078004694301211
Figure A20078004694301221
Figure A20078004694301231
Figure A20078004694301251
Figure A20078004694301261
LD区块C中的SNP名称以及在NCBI Build 34中的基因组位置(开始的碱基对)。基于db SNP 125。
Figure A20078004694301271
Figure A20078004694301281
Figure A20078004694301291
Figure A20078004694301301
Figure A20078004694301311
Figure A20078004694301321
Figure A20078004694301331
Figure A20078004694301341
Figure A20078004694301351
Figure A20078004694301361
Figure A20078004694301371
Figure A20078004694301381
Figure A20078004694301391
Figure A20078004694301401
*(-/TATT多态性)
**(A/AGAA多态性)
***(-/GTTT多态性)
Figure A20078004694301411
对人类基因组的染色体8q24.21上的LD区块C作图的基因和预测的基因,包括一个倒置的基因,它是Chr1p36上的SRRM1基因的无内含子的拷贝(Genbank登记号No.BC017315),以及预测的基因(例如NT_008046.701,chr8_1173.1,chr8.129.001.a,vugee.bDec03,kloger,keebly)。与LD区块C区域和癌症相关的标记物或单倍型中潜伏的变异可能影响LD区块C中的基因的表达,但是也可能影响邻近基因的表达,例如NSE2,POU5FLC20,c-MYC,PVT1和/或区域中其它已知的,未知的或预测的基因。此外,这样的变异可能影响RNA或蛋白的稳定性,或可能具有结构上的后果,使得在单倍型携带者中该区域更倾向于体细胞重排。这与LD区块C在很大比例的癌症,包括但不限于***癌中被扩增(www.progenetix.com)是相一致的。事实上,Chr8q21-24是在所有癌症的总和中(大约17%)和***癌中(大约20%)最经常增加的染色体区域(www.progenetix.com)。因此,潜伏的变异可能影响了与本文描述的单倍型直接连锁的未表征的基因,或可能影响了不与本文描述的单倍型直接连锁的邻近基因。
表6,本文提供的序列ID的要点
  SEQ ID NO   标记物/序列
  1   LD区块C
  2   LD区块C’
  3   DG5S802
  4   DG5S803-F
  5   DG5S803-R
  6   rs10453084
  7   rs10505483
  8   rs1551512
  9   rs16901948
  10   rs16901949
  11   rs16901950
  12   rs16901952
  13   rs16901953
  14   rs16901959
  15   rs16901966
  16   rs16901967
  17   rs16901969
  18   rs16901970
  19   rs16901984
  20   rs6470498
  21   rs6983561
  22   rs6987640
    SEQ ID NO     标记物/序列
    23     rs6987723
    24     rs6988257
    25     rs6989838
    26     rs6990420
    27     rs7001069
    28     rs7010450
    29     rs7013255
    30     rs7817677
    31     rs7824451
    32     rs7824785
    33     rs7826388
    34     rs7830341
    35     rs7844219
    36     rs1016342
    37     rs1016343
    38     rs10216560
    39     rs1031587
    40     rs1031589
    41     rs1073997
    42     rs12544977
    43     rs12682344
    44     rs13252298
    45     rs13254738
46 rs1456315
47 rs1551510
    48     rs16901932
    49     rs16901935
    50     rs16901997
  SEQ ID NO   标记物/序列
  51   rs1995613
  52   rs283710
  53   rs283719
  54   rs4871008
  55   rs6470494
  56   rs6470499
  57   rs6981122
  58   rs6984136
  59   rs6990483
  60   rs6997559
  61   rs7000307
  62   rs7000910
  63   rs7006390
  64   rs7006409
  65   rs7012442
  66   rs7017081
  67   rs7816535
  68   rs7824364
  69   rs7826337
  70   rs7827234
  71   rs7840773
  72   rs7841060
  73   rs16901979
讨论
如本文所述,染色体8q24.21上的位点已经被证实在癌症(例如***癌(例如侵略性***癌))中发挥了重要作用。特定的标记物和单倍型(例如HapC,含有表3中描述的一个或多个标记物的单倍型)在患有***癌的对象中以比预期更高的频率出现。基于本文描述的与特定形式的癌症的倾向有关的单倍型,可以使用遗传易感性分析(例如诊断筛选测试)来鉴定具有癌症风险的个体。
本文描述的标记物和单倍型在侵略性***癌中与全部***癌组相比具有较高的相对风险(表1),由此表明了侵略性的,快速生长的***癌的增加的风险。鉴于显著比例的***癌是非侵略性形式的,不会扩散到***之外并引起发病和死亡,而***癌的治疗包括***切除术,放疗和化疗都具有副作用和显著的成本,因此能够显示出与低侵略性形式的***癌相比侵略性***癌的较高风险的诊断性标记物,例如本文描述的标记物,将是有价值的。
实施例2:在几个组中与***癌关联性的证实
其它的分析进一步支持了在染色体8q24上存在与***癌相关的变体。如表7所述,在两个高加索人血统的组和一个非洲人血统的组中发现了rs16901979等位基因1和HapC都与***癌相关。
LD区块C中单个标记物和单倍型与***癌的关联性的重复研究。组中含有源自美国芝加哥(西北大学)和西班牙(Zaragoz大学医院)的高加索人的样品,以及来自美国密歇根(密歇根大学)的非洲裔美国人的组。SNPs的等位基因编码如下:1=A,2=C,3=G,4=T,X=任何等位基因。
表7,在西班牙和美国,Chr8q24上的SNP标记物与***癌(PrCa)的关联性
Figure A20078004694301451
显示了在8q24.21的同样的LD区块中标记物rs16901979和SNPs的等位基因,相应的***癌病例和对照数(N),在染病的和对照个体中的等位基因频率,比值比(OR)和双面P值。染病的个体是被诊断患有***癌的个体(ICD10=C61)。对照是基于未染病的群体的对照。SNPs的等位基因编码如下:1=A,2=C,3=G,4=T。PAR是群体归因风险。来自西班牙和芝加哥的***癌患者和对照是高加索人种族,来自约翰霍普金斯大学(JHU)的组是非洲裔美国人种族。1rs16901979:使用来自其它SNPs的信息以增加基因型产率。
在高加索人样品中风险变体的群体频率(由对照中的频率估计)与冰岛人群体的相当。但是,值得注意的是,非洲裔美国人中的群体频率高得多。因此,在非洲裔美国人组中,群体归因风险比两个高加索人起源的组中的大约5-6%高得多,或为大约24%。这表明与高加索人中相比,非洲裔美国人中***癌的较高的百分比可以用本发明的风险变体来解释。
材料和方法
美国高加索人研究群体由419个***癌患者(ICD10 C61)组成,他们在芝加哥的西北纪念医院(Northwestern Memorial Hospital)的泌尿科经历了外科手术,以及在芝加哥大学人类遗传学系招募的基于237个人的对照。检查了医学报告以检索临床信息,包括阶段和活检Gleason分值。患者诊断时的平均年龄是59岁。患者和对照都是自己报告的欧洲裔美国人种族。这通过使用随机分布于整个基因组的30个微卫星标记物估算遗传血统(见下文)得到了证实。在该组中欧洲人血统的平均和中值份额都大于0.99(详见下面描述的方法)。研究方案得到了西北大学和芝加哥大学学术检查委员会的批准。所有对象给出了书面通知的同意书。
西班牙人研究群体由390个***癌患者组成,从2005年6月到2006年6月从Zaragoza医院肿瘤科招募。患者由西班牙Zaragoza大学医院医学肿瘤学分部的Jose I.Mayordomo博士及合作的肿瘤学家招募。在收集研究样品的12个月期间,有700个患者合格。接触了其中大约600个(~85%)患者,其中440人进行了登记(参加率73%)。所有的患者都是高加索人种族。从***癌诊断到收集血液样品之间的中值时间间隔是5个月(平均7个月,范围从1-67个月)。从医学记录收集了临床信息,包括发病年龄,级别和阶段)。患者的平均发病年龄是69岁(中值为71岁),范围从45-83岁。892个西班牙人对照因为癌症之外的其它疾病在西班牙的Zaragoza大学医院接触到,在抽取血样之前通过提问排除了以前的癌症。研究方案得到了Zaragoza大学医院学术检查委员会的批准。所有对象给出了书面通知的同意书。
遗传血统的评估
Structure程序(Pritchard,J.K.等,Genetics 115:945-59(2000))被用于评估个体的遗传血统。Structure在一组个体的多位点基因型和用户指定的K值的基础上推算出K血统群体的等位基因频率,并从每个推算的K群体为每个个体指定血统的比例。数据组的分析用K=3来运行,帮助鉴定每个个体中非洲人和欧洲人血统的比例。参考从10000个随机的数据组产生的虚假分布,估算了非洲裔美国人患者和对照之间平均欧洲人血统的差异的统计学显著性。
为了评估来自美国的研究组的遗传估计的血统,从以前描述的(Pritchard,J.K.等,Genetics 115:945-59(2000))含有35个欧洲裔美国人,88个非洲裔美国人,34个中国人和29个墨西哥人的多种族组中被基因分型的大约2000个微卫星中,选择出30个不连锁的微卫星标记物。在2000个微卫星标记物中,选出的组在欧洲裔美国人,非洲裔美国人和亚洲人之间显示出最显著的差异,并且也具有好的质量和产率:D1S2630,D1S2847,D1S466,D1S493,D2S166,D3S1583,D3S4011,D3S4559,D4S2460,D4S3014,D5S1967,DG5S802,D6S1037,D8S1719,D8S1746,D9S1777,D9S1839,D9S2168,D10S1698,D11S1321,D11S4206,D12S1723,D13S152,D14S588,D17S1799,D17S745,D18S464,D19S113,D20S878和D22S1172。下面的引物对被用于DG5S802:DG5S802-F:CAAGTTTAGCTGTGATGTACAGGTTT(SEQ ID NO:46)和DG5S802-R:TTCCAGAACCAAAGCCAAAT(SEQ ID NO:47)。
讨论
概括来说,在来自冰岛,西班牙和芝加哥的三个欧洲人血统的组中,已经证实了rs16901979的等位基因1与***癌风险的显著关联性。当在这些群体中考虑所有***癌时,相应的群体归因风险(PAR)在大约5-6%的范围内,在侵略性***癌中略微增加,或为大约7-8%。在非洲裔美国人组中,***癌与rs16901979等位基因1之间的关联性被重复,相对风险为1.35(P=0.005)。由于这些变体在非洲裔美国人样品中增加的频率,在该群体中的PAR与高加索人样品相比高得多,或者为大约24%。
通过基因组范围内的关联性分析鉴定了本文描述的变体。在1455个***癌患者和4182个对照中,对超过300,000个SNPs进行了分型。我们的注意力集中在该区域,因为它是在整个基因组的单个LD区块中包含的第二个最显著的单倍型(LD区块单倍型)。
重要的是该单倍型在非洲裔美国人中与高加索人相比极大增加的频率,这解释了在该组中***癌的高发病率。
序列表
<110>解码遗传学私营有限责任公司(deCODE Genetics)
<120>chr8q24.21上的癌症易感性变体(CANCER SUSCEPTIBILITY VARIANTS ON CHR8Q24.21)
<130>SCT091440-20
<160>73
<170>PatentIn version 3.4
<210>1
<211>63001
<212>DNA
<213>Homo sapiens
<400>1
gataacatgc agtactttta agtaatactg tatatagaga agtagatcga aataggtaaa     60
ctattaacat aaattttcct gtagtggaat cccaattaaa gcaataatgt agagcaataa    120
gaagcaaaat ctgcttggat ccaaatcatt tctgaacttt gtaactttgg tcgtgttgct    180
ttctgtgaat cagtttcttc atttaaaaaa gttgttatga ggatagaaca tgctagtatt    240
tataaaatgc tcataaattc ttggcacaaa gtaagctata gactcaaaaa tggtgattcc    300
agacctcaag aaataagaac ttgaatttca gagaaatctt cccttattat ccctgaggtc    360
cactccatag cttgatcaaa gaagtgggat actatgtagt agactagtgt ggcagcacct    420
taaacccaca aataagtttg gctgttgtaa agagaaggga aaccaaaatt atttcaggac    480
ctactatgtg cagagttttt atctgctata tacataggca tatgctattc catcagtggt    540
tcagagggca taaacagtta ataaagctat ctcagggatg attaaattga gagttgctca    600
gggtcataca atttttgagt caggaattaa acccagggct atttcattcc aaggcccatg    660
ttactttctg gtaaaacaaa taaccatgaa atataatata ttttctttga atccctaata    720
gtgggtgcta ttataccccc aattacttaa attgatcctg tacattgcca agagattaaa    780
ttataaatta ttgagttcaa aaagttaatt tcttcctcca aagagatggc atcttacagt     840
ttaattactc tgacagcttt ttttttttat tttttctcct agtgaattat caacagaaac     900
tacctagaga aacctgtaac ttcagatctt ctgattaatt gattttcttt gggtgctgct     960
tgacagtaac agaatggtcc atggggacag tttttcagtg aatgttttca acaatgatag    1020
gaacacagag ctaagcagag tgtcaagaga catttagtgc agtagagaca tctcatctgt    1080
ttttctgcag aacttgcata aaattagcat ctgattatta tcacctcaga atgaaccgga    1140
acccgtaaag atgtctttga tcgtaaaagt ggggaggaga ccctgatgga agaagagaag    1200
acttcagcct cacaatagaa aagactgtgt ttatgcacct aaatctaact tagacaccat    1260
ctaattcaag aaacaggcac atttagggaa ataaagaaaa gaggcagaaa gagatgaagc    1320
accttggctg aatcagagaa attaggggtt aatgttccag actgatgact tgaaggaggg    1380
tgtgcatttt catgcaaggg accattctgt agaagaagca gcacattcac ccttaaatga    1440
gcaaagagaa tcccaatcac tctccctctc accctcccct tttccttcat ttctctagct    1500
ctttatttcc aagaaggcca gcccttctct tcagccacat ggtatttgga cagcctaggc    1560
tcaatccctg cagggaaagc tcaatcagcc agctgagcca gtcactgaac aaccaagtct    1620
ggtaagaaca ggggtgaagt atttaagaag cctatcgtgg ctggagggct aaagccttgt    1680
tctcaaatca gctttatagg taataaaact gacattaaag caaaaacaaa taagagtaat    1740
aaggcttctt ctgtgtgttt cttgggtttt gtttctcatt tgattccaaa tggggagaca    1800
agggtatatt tatcctaccc ttcccccagc ctcaacaggt taaatgggtt aatacatgaa    1860
aagcatcaat cacagtgtct ggagcattat cagtatcagt aaatgttaac tattactttg    1920
aggctggccc atgtggctcc tggcattaca ggcaccagag gaattccagg gagaccagga    1980
ggattatagt ctgggggagt atggaggatg tgctactgtg tggcaggtgc tttgcaaact    2040
gcattaaaat agtcttgata ttttcagaat ctaacgggat cccatatact atgattctga    2100
aattcacttg cgcttcttta gattttgcat ctacatgatg catagtaaca gttcttaatt    2160
tggtttattc ctagcttatc tatggttgtc attatttcaa gagcctagta aagttgaaat    2220
caattttaga actacaaaaa aaaaaaaaaa ggaagagatg tgagtagggt ctcactgtgt    2280
tgcacgtaaa tgcattgaca tggaagattt aaaacacctg atgagtttta ttctgtttct    2340
ttattctcta ttaaaggtag tactgtgcaa cattccctac cctctatttt tgacactgac    2400
gttgggctta ttttgattgt ctaagaggtc ctgtgctaca agctggcagg gcttgctggg    2460
atgaagtgac aagcaaagat ttgctatatg gtatagccag gggcagagac aggttttctg    2520
ggggcatgag acttctacag tggggagaca ctattaagaa atagaataca aaattatgac    2580
tacaaaatga gaggccccaa agcttatgtt tcattagctt cacagggagc tcacttctgc    2640
ccagagccaa ggactgtgga catgacctgg taatggcatc aaatgattcc ctttattgcc    2700
tcccctgggg cagaaatggt ggcagcaaag caacttccaa tcacaactat cttctttcat    2760
ttgacacagg aaggggaagc tccctcttta atctctaata gaaacattaa acagcaggcc    2820
atcacaattt ctagctaaag agttttcata ggacctttgc aaaggttgca ttcctccctt    2880
cccttgtggc agtatgcata atgtaccttt taggaatata aattcagtgt cttggaacac    2940
atgatttaga atcagtgttc agttaccaac tatcaaataa aaaaataaat ccagcatatg    3000
actaacggaa agaagtcaat ctgaaatggt tacatattat atgattccaa ctatatgaca    3060
ttttgggaaa ggcaagacta tggagacagt gaaaaggtca gtggttgcca ggggttagaa    3120
ggaagggaga gatgaatcgg ggaagcacag aggattttta gggcagcaaa actgttctgt    3180
atgatactat aatggttgat acatgtcatt gtacatttgt caaaacacat atgtcttggt    3240
ccatttaggc tgctctaaga aaatatctta gactgggtgg cttataaaca acagcaattg    3300
gtttcttaca gttctgaagt ccacgatgaa ggcactggca gattcagtgt ctggtgcagg    3360
cgatcctctt gctttaactt cactggtgga aggggcaaag cagctgtcta gggcttctta    3420
cataaaggta ttaatctcat tcatgagggc tctgccctca tgacctagtc acctctaaaa    3480
ggtcccacct cttaaaacca tcacactggg ctttaggttt agtggggatg aattttgtgg    3540
ggaacccaaa taacagacca aaattcactg ggaattgttt tggggagaca taaacattca    3600
gaccacagaa gcacagcaca tacaacacca agagtaaatg tttatgtaaa ctgcagattt    3660
ttagtgatgt cacggagaaa aacttctcct cgactctctt aggtttagtg cttgggaacc    3720
agtaaattaa actaactaaa gacaagttaa caagagaaaa agcacaagtt tttattgata    3780
tttacatgca taggagttca tggaaaagaa atgaaattca aagatgcaat tagactcaca    3840
ggggttatat accattttaa caaaggaaag gtttggggct tcaaatgatg ctaaattgtg    3900
gggaagtgac taggaaagat acagggaaac aaaggaaaga taagggttat tttactaagg    3960
tctgtttatg taaacttgtc tgactctcaa tctccagtgg taagagtggc tctcctcttc    4020
ccagttcagg agagggagac accttcacaa gaggaaatgt atgccctgat tttaatctga    4080
taagaagagg gcagagaacc cttcctacat ttggttgttt tcaattgcct tcagctcaaa    4140
atggtcctta cgtggaagtg acatattttt atggtggtgg tatattctga tctctttcaa    4200
taataattgt gtgtcaatga gtctcattga ttataataga tataccgctc tggtgcagga    4260
tttgatagta agagaggttg tacttgcgtg gaggcaggat gagtaggtga atgaactttc    4320
tatattctcc actcaatttt tgtttgaatt taatattgct ctaaacataa aatctgttca    4380
ataaataaag taaaaaacaa aacaataaaa taaagtaaaa aaaacaaatc tagactgagg    4440
taagtagaag ctttattgga aaagattatt acagaggggg aagggactcc aactataaaa    4500
cagcaagctt ctcagagctc aggcagaaaa aggcttttct tttatacgaa ggagagaaca    4560
aggctagaaa gaaccagatg taagtaagtg aggtggcctg attggatagt agatcagaga    4620
acgttttacc ctcaggccag ccgcttcctg gaaggagcca ttgagaagga gctaaattct    4680
ggctcgactt agaatgcatc agagttcaag agtctgggga aaagaaagaa ccgtaaccaa    4740
aattttttca ggtcaggtta ataggcattc tgttctaata gatcactggg gacaataaat    4800
ttagctaatc atttatgaag ccaagaacag gagtttggag cgtctgtatc tggctttgtc    4860
ataggtaaac aatgccggca atccttgagc ctcatctaac tcatatcggg aagggtggtc    4920
ctttggaata agctattctc tgaaacagtt tagtctaagt acaatgtatt tcaccagcaa    4980
ataccttgat tgtgccttgg aaggaagggg ttggtgatgg taagtctgga aaaggccaga    5040
caaagagagg gagaattctg gtccctgaag agacatccca tatgctctcg ggtgagattg    5100
tgagaaatgc tggaagaatg aagtggatga ctaccaagcc catcttattt caatgtacat    5160
agataatact tcattttgca aaaatgaaaa gtatgggaca aatactaaat cagacagggc    5220
actgggataa gaggcgcgaa ttaggatatg tagtcattta ctgtactaat ttgcatgaat    5280
agaaatgcag agagagctct ataaaagaaa aatattttgt gtaatctatt agtatagaaa    5340
ctcgtaatta atttactaag atataacgat ttattcgtca tgttaggcaa cgtattttca    5400
atgtcatctt atggagaatt gtaaagattt tcttgtatgt taaaggtctt tggtcaccat    5460
cattattcac acgattgtta ttcacctggt tatcattatt cctcatcatt aaggacacta    5520
gtaatctttt aaacctttct ggctctttct ggggaaaagg gcaggcttaa tacaggcatt    5580
cctcatttta gttagcttca ctagcttcac tttattgtgc ctcacagata ctatgttttt    5640
cacaaattga aggtttgtgg caaccctgcc tcaagcaaac ctatcagcac cattcttcca    5700
acaacatggg ctcatttcct gtttccacgt cacatttggg taattctgac aatatttcaa    5760
aatgtattat tattatagct gttatgatag tcagtgagca gtgatctttg atgttactct    5820
tgtacttgat tggggaacca tgaaccacaa ccatattagg cagcaagctt aattgataaa    5880
tgttatgtgt agtctaaccg ctcctccaaa tggccattcc cccatctctt tctctctgct    5940
caggcctccc tattccctga gacacaaaaa tatttaaatt atgctaatta ataacccaac    6000
aatagcctct aagtgttcaa ataacaagaa gagtcccacg tctctcactt taaatcaaaa    6060
ccttggcata attaaggtta ctgaggaggg catatagaaa gctgagacag accaaaagct    6120
agacttctta tgcagaacag ttaaccatgt tgtgaatgca aaagaaacgt tcttgaaaga    6180
aataaaaaat agaagatgct accctctata attctatgaa ggttcagaga ggtgaggaag    6240
ctgcaaagga gaagttggaa gctagcagaa gttggttcat gagatttaag gaaataagcc    6300
acctctataa tataaaagta caaggagaag cagcaagtgc tgatgtagaa ggtgcagcaa    6360
gttatccaga agatgtagct aagatcattg atgaaggtgg ctacagtaag taacagattt    6420
ttaatgtaga ccaaacaacc ttatgttgaa agaagacacc atctaggact ttcataccta    6480
tagaggagaa gtcaatgcct ggcttcaaag cttcaaaaga taagctgact ctcttgttag    6540
gggctattgt atctggtggc tttaagtcaa agccaatgtt catttaccat tctgaaaatc    6600
aaagagtcct tcagaattat gctaaatcta ctctgcctgt gctctgtaag cagaacaaac    6660
tggatagcag cacgtctgtt tatagcatgg cttactcaat cttttaagcc cactgttgaa    6720
aattaatgct cagaaaaata agatttattt caaaatatta ctgcttattg acaatgcacc    6780
tagttgccca agagctctga tggagttgta caaggagatt aatgttgttt tcatgcctgc    6840
taatacaaca ttcattccaa agcctatgga ccaatgagca atttggaatt tcaaatctta    6900
ttatttaaaa aatacatttt gtaaggctat agtttctata gatagtgatt cctctgacgg    6960
atctcagcaa agtacagaac aacatggctt tgaactgtgc tggtccacct atacatagat    7020
ttttatctgc ctctgccacc cctgagacag caaggcccac acctcctcct cctcagtcta    7080
ctcaacgtga agatgatgag gatgaagacc tttatgatga tccaccccac ttaataaata    7140
gtaaatatat gttttcttcc ttatgatttt cttaatacat tttcttttct ctagcttact    7200
ttattctaaa aatccattat ataatacata tgacataaaa aatatgttaa ttgacggttt    7260
atgttatcca taaggcttct gttctacatt aggccattag tttagttttt gggaagtcaa    7320
agttatatac aaattttcaa ctgtgcaggt ggcccaaatc cctaactccc acattactca    7380
agggtccact gtaagttgaa aactcctgga aaggattcat cactgtagat attagggctt    7440
tcatgattca tggggggaag tcaaaatttc aatattaaca ggggtatggg agaagttgat    7500
tccaaccctt atcgatgact ttgaagggtt caaagattta gtggtggaag gagctgcaga    7560
tgtggtagaa atagcaagag aggcctggcg tggtagctca cgcctgtaat cccagcactt    7620
tgggaggcca acgtggtgga tcacaaggtc aggaaatcga gaccatcttg gtcaacatgg    7680
tgaaacctca tctttactaa aatacaaaaa attagccggg tatggtgacg catgcctata    7740
atcccagcta cttgggaggc tgaggcaggg gaatcgcttg aaaccaggag gtggaggttg    7800
cagtgagctg agatcacgcc actgttctcc agcctggcca cagagcaaga ctccatccaa    7860
aaaaaaaaaa aaaaagaaga aagtaagaaa gaaagagcaa gagaactaga agtgggtcct    7920
gaagatgtga ctgaattgct acaatctcat ggtaaaactt gaatgaataa ggagttgctt    7980
tgtctgaatc agcaaagaaa gtggttgcct gagatggaat ctacttctgg tgcacaggct    8040
ttgaacattg ttgaaataaa gacaaaggat ttagaatatt gtacataaac ttaattgata    8100
aagtggtagc agagttcaag aggattgact ccaaatttga aagaagtttt attgtagata    8160
aaacgttaaa tagcagcaca ttctacagag aaacctttca ggaaaggaag agtcaattta    8220
tgtggcaaac ttcattgttg tcatattttc agaaattgcc acagacacac cagctattag    8280
caactaccac cctgttcagt cagcagccat caacactgag gcaaaatctt ccaccagcaa    8340
aatgaatatg agttgctgaa gactcagaca tctttagcat tttttagcaa taaagtttta    8400
actaagatag tacattttta agacatatgc tattgcacat tttatacact acagtatagg    8460
gtaaacataa cttttatatg tattggaaac aaaaaaaatt tatatgactc actttattgt    8520
aatattggct ttaccgtggt gatctggaca cagaatccac agtatctctg aggaatgcct    8580
gtagtttgaa tatgagtgat gcaaagaagg atttttagct attgtagtat ctctggatgt    8640
atttcccaca atctttttgg gttatagttg ctcttgtatc tgttttgcct ttcccaatag    8700
tgattgcact tagcagaatt tgtgctagga aacattgtta ttgttattga tacaaaagta    8760
attttctgta aagaatagat cattttgtct gattcattat tttagtggct ctctgaaaag    8820
tatttttctt catttcactt ctgaaacaga atctagaaaa aaaaaatacc atcagctgag    8880
acatttagaa acatctgtac tttcacacaa tgcatagaca acaaaccctt acagaattat    8940
ttttaggaac tctattgaaa ttagatattt tctaaaagta tttgctaaaa gagaaatgca    9000
ttttagctta catcatattg tttaatttta aatctatcat attgtgacaa taacaagaat    9060
aaaaacaatt tcaccctcag tgtaaaactt acagattttg ttgccgagaa acttcaaaac    9120
atacctctga atagtaagaa gtgtagtaaa atttaaatga aatgttgggc caaatataga    9180
atgattgaaa aatcaccctt gaattataaa aatttgtgct catcttgtga atactttaaa    9240
tgtcttgctc atggtaagga cttcgtgcta tctttgtaca attaacatat agggcaaatt    9300
tcaataccaa tgacagtaga tgtaatttca catatcaagt agtttcccta ataatttagg    9360
acttttttca ctgacttctt gtcatatatg attctgtcat tactttttta tatagctcaa    9420
aatatggctg atggagtgct tgtgcccttc catggttttt tcatttggta tcactagtat    9480
tatatttatt tattcttttt ttccaggaca tttgcaagac attcgtcaag ttttgaggtt    9540
tatttaaggt ataactagat aatgtattat gtaaatcagc ctaaccagca cgcataaact    9600
aaaccatgtc acaggatgcc aatagtgaca gacggagtgc tgatgcctct ggaaatctct    9660
tcacattgtg gagtttctcc tcttctcttg ggatatcttc tctattttct gtgacagatg    9720
cctatttgct agatcaactg agagcatcag tgcctatagg taatgaaata caaataaaac    9780
tcaatttgtg ttatggtctg aatgtttata ttcctccaaa attcatatgt cgaaatccgg    9840
tccccagtgt gttggtatta agagtcgagg cttttgggaa gtgacagggt catgagagtg    9900
gagcacttgt gaacaggatt agtggtctta tgaaagatgg agcgtctgtt tttcccttcc    9960
cccatgggag tgggaaaata cggatagaag ccactatcca tggggaacaa gcctccacca   10020
aaaactgaat ctgctggcac cttgatcttg gacttcccag cctccagaac gctgaacaac    10080
acatttctgt tgtttgtaaa ttacctaatc taagacagca gcctgagtgg actaggacaa    10140
ttggtttctt ttttgtttag gtagcaataa ctagaaacag aatttctaca gaggcaacac    10200
acacaaaaat aggtgtgatt ttatcaaatt aaaatacttc tgcacagtaa aagaaacaat    10260
taccaaagtg gaaaaaaaat aacctatggg gtgggagaaa atatttgtaa accatgtata    10320
tgataaagcg ttaatatcca aaatgtatga gaaattcctc caagtcaata gcaaacaaac    10380
caatagaaaa ccagaagcaa aagaaaaaag aaaataagtt aaccaatttg aaaaatagac    10440
aaagaaactg aatagacatc tctcgaaaga agacatacaa atggtcaaca gatatctgaa    10500
aaagtgtgga tatcactaat caggaaaatg caagttaata tcacaagata ccacctcaca    10560
gctgttagga taactattag caaaaaaaac aaaagcggcc ccttgctttg tgtctgccag    10620
aatccattat ggctgccact atagttctcc aggagtctgg atagcagtcc cggctgggaa    10680
tgtctggagt ctgcaggccc cagtcactat ggacagtttt tccttcagta ttggggttct    10740
aagaggcaga aattagaaat aggaatgcag atggttgcag agtgtggttg ggggttagag    10800
cggcgccctg gaaaaaaaaa aaaaaaaaag atgagtgttg gaaatgatgt gcagaaaagg    10860
gaaccccagt atattattag tggaaatgta aattggtgca gcctctatga aataatgtat    10920
atttcaatac ataataatgt atattccaaa attgttttta tagagtagat tttagatgtt    10980
ctcaccacaa ataaatgata agtatgtgaa atgatgcatg tgttagcctg ttttaatcat    11040
tccacaatgt acacaagtat aacatttaca ttataccaca taaatatata ctctatatat    11100
atactatata tatatatact actgtttgtc catttaagta attttttaca aataattgtt    11160
ctaaataata agattatctt ataaaggaga cagtaggttt gttttgctcc agatggtaga    11220
gttaatccct gaagctagaa gatgcttagg gtgaagtttg tgctcaaaat atttttctaa    11280
aaatagagca gactgcctca aaggtgaggt atgttgcaga aaaaagtcac tgtaaggtat    11340
gtgtgggatg ctgtttgggg ataatcaggg actcaggata gggaactaag gagtttaggt    11400
tgtctgctgt atagaggaaa ctagaggaga tagtttattc agccatcatt aattcattca    11460
ttcagtaaac attactgaac acctgtgtgc caggtgctgt gattgacact ggagatttaa    11520
agttgaataa tatctagtca ctggggccct gatgtcaagg cacatgctct agtggaagag    11580
aggcacacgt agctaagagt gtgtggaaag tgttatgagg aaagtatgtt caggatagtg    11640
tagaggctga ggaagaggat tcccatctca cctgctgcgg gcaaagaaag gtggatggta    11700
ttcattaggg attatcacag gagggatcaa ctgaactaat ccttaaaata taatacagta    11760
ggagccagcc cacaaaatgc taatagaggc agtggggagg gtggtggaaa aaaaaaatag    11820
gtatgagtca aaggagagaa ttccagacag atgaaagctg taaaaatagt ttagttttac    11880
tgtaaaaagg tcaaagccag aagtaagggg ctgcaaagtc catttaagct gagaacttta    11940
ttacagctcc tgttccaagc ccatgctctg tgcgactgca gatgggatat tctaatacca    12000
cttgtggaaa tcaatctttt tggacaaaga ccaagagaga cccatgttgt gattcactct    12060
ctatggcaac ccaaaaggaa gggtgaatgc ctgcagatga gagttgcctc ttcatgccag    12120
ccacttaata ggctatggaa aagggaagag cagtccccat ggtgggccta ataggaatca    12180
taatctaact gattatcaca gcagtgactc tttcaaatct ggcctaactg aagctagcac    12240
cacaccagga tctctgctgg gcacacacca atcacccagg aggtcagtat catccccatt    12300
ttacagattt gaaagctgag gcacaaggta aataacagtt atgcagaagt cttgcttcag    12360
tgtctaactt cctcatctca ctttattctg tttttcaata ggagaagaga tataatctca    12420
tgatgaaaag tgccatctaa agtggcacct tagacacagt aagcaaactg gattggaagt    12480
gaagaagtca gtctcaagat acttgacaat gtctcctatt tgtagattgt ttagcaaaat    12540
gctttcacct gagttatttc atttgttgct cacaaccaat ctgtctggta ggaaaggcag    12600
atgatatgtt cacctccaga taagaaaaat gaaattcaga gaggccaagg ggcttgctca    12660
agattccaca gtgaagaatc tacttgcagg aattttaaca aaggttttca aattcagaag    12720
tccacaggat gactgccctt gaaatccagt ggtaacatat aataaggtgt ctttgagcag    12780
gtaagagagg accaaccttt tctaaagcct ttctcctctt gctctctgtg cgccaacctg    12840
agcagcctcc tgagagattc tggaacatgc tagaattttt cttgctttag ggccacagtt    12900
catgtcactc cttcttcctg gaatgttctt cacaagcact gtgtggctcc ttcttatcct    12960
tcaaatatct gctgaaatgt tcccttctta gaaaggactt gctgaccacc ctgatggaag    13020
tgccctctcc agctcacctc tttactgact ctgtttttat tccttttgca agcacatttt    13080
ataatctata tgtagtgttt aatgcaacag tttgctaagg actgaaattt gcattcctcc    13140
agcaatcaaa acccactgcg atggtttgtg gaggtgggac ttttaggggg taattaggtt    13200
tagatgaggt tgtgagggtg gggcccctca taatggaatt agtgttctta taagaagaga    13260
cagagagaac gaagctctct ctctttgtgt gtgtgtgtct ctctctctct aagacatggg    13320
aggacacaat gagaagacaa ctgtctacaa gccaggaaaa gggacgtcac caggaaccga    13380
gcctgctgac atcttgatct tagactttcc aacctcccaa actgttagaa atcattatct    13440
gttgtttaag ccacccagac tgtgatattt tgccatgatg cctgaactga ctaatataca    13500
gtttacctgt acattgtttg ttcctctaga ttataagctc tccaaggcag ggaccatata    13560
gttctttaaa agataatgtc atggctataa gtttactgct atttccccat cacatgggaa    13620
aaagaattgt cagagttgtc agccattaga gtttatttac cttaagggtg tctgacgaaa    13680
tgatctgatt atctccttaa cttcctaaat agctcaaact tcataatgtt tgaatttgga    13740
aatatctgtt gattcaagag agacagatta catggtctct cttgaacttt ggacatctct    13800
tccacaaact tccaaatatt aggccatcta ttaccagacc ttctgaactt aaacaaatct    13860
tactttcaac cccactttag ccaccttcac catggcctaa cttttgccct tgttatttgt    13920
tatccatagt tttctaaact tagaatcctt aatcactggc attatagttg tttacttcaa    13980
cctccaacac ttacaggtcc ctcaaatcct catttattca acccttgttt tttgtcatct    14040
tataaactgc aaattcttga aaatcacatg tcctctctat aaatcagatc ccttcatatc    14100
atgttttcaa tctgagtttg gctccatgat taatcttcca aatcaaaggt ttacaaactg    14160
tggcctgtgg aataaatctg gtctgcacct gttttagtaa ataaagtttt actggaacac    14220
agtcatactc atccatttac atatttttta tatccatttt catgttacaa tggcacaggt    14280
gactagtggc aacagaatct gtgtggctca caaagcctag aacattttct atctgtcctt    14340
tatagaaaga agttaccaac ccctaatcaa aatcaataat ctatgaagta gaaagtaaaa    14400
gatgatcttt tggtgctgac atgaacatat tatgattaaa aaaacacttt attgaggttt    14460
gattagcata cagaagctgt acataacaca tacaacttga agggtttggt gatcagtatg    14520
caatcatgaa accatcacta tgatgaatgt cataaacata tccatcaccc ccaaaggttt    14580
cctctgcctt atttatttat ctatttataa gaatacttaa cataagattt gctaccctct    14640
tagcaaattt agcaactctt tgagtatgca atataatata gttaactata gacactatgc    14700
tgcacataga tttctaggac ttatttaact tgcgtagcaa aaactttgtt ctctttgccc    14760
aatacctccc tgtttccccc tccttcatcc cctggtaacc atcattctac tgtctgcttc    14820
tatgagtttg actgttttag atttctcata tgagtgggat catttagtat ttgtccttcg    14880
atgtctggct tatttcactt agcataatgt tcaccaggtt tatcaatgtt gttgcaaatg    14940
acaagattcc tttttttatt attaaggcta gataatattc cattgcaaat atataccaca    15000
ttttctttgt ctattcatct gtagatgaac attcaggttg ctttcatgtc ttgggtattg    15060
cgagtaatgt tgcaatggac atagaagaac aggtatctct ttgacatact aatttcatgc    15120
ctttgggtaa atacccagaa gtgaaattac taaatcacat ggtagttcta ttttttggtt    15180
tttgaggagc ctccatacag ttttccataa tggctgtact aatttacatt ctcaccaaca    15240
gtgtaaaaag gttccttttt ctccacttct tcaccaacat ttaaatttca tctttttgat    15300
aatagccatt ctgacagatc tgaggtgata tttaattgtg gtttcaattt gcatttcccc    15360
aatgattagt gatagggata ttgggctttg ttattaataa cccactggcc atttatgtgt    15420
cttcttttga gaaatatctg ttcaagtcat ttgactattt ttaatgtaat cacttgtttt    15480
cttattattg agttgtttaa tttctctctg tattttggat attagagccc cttaacagat    15540
gtattatttg cacatatttt tctcttaacc tatgggttgt ctctttattt tgtaaattgt    15600
ttcctttgct gtgcgtaagc tttttagttt gatgcaatac aataactaat agattaatgg    15660
tctctttttg tttttgttgc ctgtgctttt agggtcatgg tcaaaaaaat ctttgtccag    15720
atcagtgtgt ggagctttcc tcttacgttt tttatttcta atagttttat agtttcagat    15780
cttatattta agtcttcaac ccactttgag ttgattcttg tatatgggat gtgatgtgtt    15840
caatttcatt cttcttcatg aggacatcca gttttttcaa caccatttgt tgagaattca    15900
ataaagttgc agtatataaa atcaacgtaa aaaatcagta ggtttttcat acactgacaa    15960
tgaactatct ggaaaagaaa ttaagaaaat aatcccattt taataccata gcaaaatact    16020
tagtggtaaa tttaaccaag caagaatatg gaaatatcta tattctaaaa actataaaac    16080
attgatcaaa gaaattgaag attacacaaa taaatggaaa tatgtctcat atccataagt    16140
tgaaaaccga tattgttgaa atgtccatac taaatgtgat ctaaagagtc catgtgattt    16200
ctataaaaaa tccaacgtca tcttttatcg aaattgaaaa aaaaatgcta aaatttatat    16260
ggaaccagag aagacctgaa taaacaaagc aatcttgagc cataagaaca aagttggagg    16320
catcacacta cctgatttca aaatatattg caaaactata gtaatcaaaa tggcatagta    16380
ctggtgaaca aacagataca aaaaccaatg gaataggata gagagcccag gaataaatcc    16440
acaaattaaa aaccaactga tttttgacaa agatgccaag aatggggaag ggagagtttc    16500
tttcattatt tattctctgt attcttttca tctcaggaaa aatatccagt ttcctcaatt    16560
gtatatccat tcactcaccc gataatttct tcattcactt atttgtttat tcatttaatc    16620
tcaattgttt gttcattctg taaatattca gatttctttt tatgcatttt ctcagaattg  16680
gaagcataat actgaacaaa ataactataa atctcagcct cccactccca tatttacagt  16740
ttgattaggg aggcacattt agatatgcag tgataattgc tttgcttaga gaaattcaag  16800
gtgatagaat gcatggtgac acctaaccca gactggtaga gaaagggaat tcttccactg  16860
ggaatgacat gattatctaa ataagtaggc tcaatcaggt caggaaaggg cctgaaagac  16920
tatttcaagc agagggaagg tatttgccaa ggccagggtg tgtagtggag agaatgggca  16980
gtggcagaga attatgaagt gttccaatga ctaaaagtaa agtaacaagt tccttgtcca  17040
agagcttgga ttgtatccta actgaaatga gtatacacta agtgtttgaa gaagagggat  17100
gaaatggtca agttttcatt acacaaaaat aacctgttcc tttcatttta tgtttattta  17160
tttttttaat tttctgactg ctcctttctg gaaatctcaa atttatattt gccaaatatt  17220
gtcacatttt cgatggagaa tacaaactaa gaatgggtta gggaactgag tcagaaagtc  17280
cctgttgtac aattcaatca tgtttttcta aggatgtgct tttggacatt atggaaacta  17340
tcttaggctc tcacttggat cctagaaaag aaggcacctg ttaaaaggaa tgtccagccc  17400
cacctaattt ggcagctgcc cctccaagct aatgacatta gggatgtagt ggattcaaga  17460
ggctgatgat gccatctggt caactcatgt gactatttct atcagcttta tttctgcaac  17520
atcctgtgcc cacagagggg acacaaaatc gctttataat tccttcacca tgtgaagata  17580
cagatacacc cagaacctta aaggcaagaa tatgattgaa atgtcaaatg gggacttggt  17640
gatctaaatt atgtccccca aaagccaatg tcttgccacc accagtgccc tatgggtgga  17700
gtttctaaac agattactca aaacacaaac tttcaaaaag ggaaagtcat aaccctctag  17760
tcatcagggc aattacggaa taacattgct ggagtaaggt tttctcaatg cccaagagat  17820
gagctggcaa tgccacaaca atgtccaatt cttagtgggt ccaagaccat gtgttacatt  17880
tccctcccat gattactcac agcttcacag ttctgctgtc ctcttcgcct ctctgccacc  17940
tcttaactgc acctttgacc tcctacccct aagattcaac cctgtgagat tacttgtctt    18000
ttcatctaca ctctggtcac tctgaccccc attctttaga ttcaggattt tctcttttcc    18060
tggcttactc tccagcacaa gtagaaaaat attgtgcttc attggaaaat gcatgttgtt    18120
tgaatcacac tctttcagat tatacaattg tagtctttca ttatctttga gccattttat    18180
aatgctgtaa actaatatta atgcatataa ttcttgtcta tagacatgta aattgtgtcc    18240
aggggtgatt taattgactt ttcttcccca ttgtggaaaa ggctagtagt tttgcctcca    18300
tttgcccatt tatttctata ttcctgatct gtaaatgcat ttctgggttt tcccttggac    18360
tcattctaac atctcttctt tttcctcatt aattaattaa attaaatctt taacacctct    18420
tcatattttt gtcagtatga gagtataaaa aaaaatcttt ttttgaaaat tatcttttaa    18480
taggtgacaa aaagaataaa cactgaacaa gaagtcctga gctcctacta caatccaaag    18540
tgaactagtt gcagtgccat aggatgatgt ttctcctgag acttctttac taggatcatt    18600
tagactgtta taaatgcaga ttcctgggcc tctccttaga cccactgaat cagacactct    18660
aagaggaggg tcagaaatct ccatcttagc aagttaatgt ccaggagagt tagagactca    18720
ctatgacgta tgataaaaag tagaaggaag gactttccag caccttaaac tacttggaaa    18780
gatagattaa tgtctagatg aaacttgatg agactttaga ctaatatgtt acatatacat    18840
caggagatgc atgtataaac caaatccaaa taacccaaag caaaatttct tttagaaata    18900
gtgataaata aatgagtgag gagtttgtca ctcacatccc ccaggtaaaa catacctttt    18960
tagcctaaat aaatgctata gtttgaatgt gttccctcca aaattcaggt actgatagtt    19020
aacagcagcc gatatgatgg tattacacaa aatagtaggt tctttaggag gttgttaggc    19080
catgagtgcc tcccccaaga atgggatgaa ggacctcata aaagaggctt ctcacagcat    19140
tgtgacctct agccctccca ccttccataa gtgaggacac agtgttcctc ccctctggag    19200
gatgcagcaa caaagtgtca tcttggaagc agaggagcca tcaccagaca acagaaccag    19260
ccaacagctt gatcctggac atctcatttt ctccagaact gggataaaat aaattcctgt    19320
tttttaataa atttcccaat ttcaggtatt ttgtgatagc agcaaaaaca gactaagaca    19380
actagtatga aaatatacat taacaaataa aattaatcat aatatatgtt tgcttttaaa    19440
agaaaataaa taagccaata tgctttctgt tgattgattg atttactaaa cattgattgg    19500
ccatctccac tggggatatg gcatttaaga gatctctttg atcttagtac ttttactgct    19560
ttttaaatag gatcaaatac acccaaggta aaaaatagaa cacactatac gttacatttt    19620
ggaactgtta gaaattcctt tgaagctaaa attactgcta tcatttgaca acttttaccc    19680
ctaaaataat gtggtgctca ccagcttgct taagttacag cacttgctgt cttctcagat    19740
acaatatcag aaacttataa tccaagaaaa atctaaatgg caagtgtgag ttaatggaag    19800
cctcataaag caagaggtgt tttggaagtg tatggaagac atcaataaat gatatgtata    19860
acatcaagtg caaaagtgtg tgctaggaaa gttcaaaaaa gaaaaaaaat atggtaaggt    19920
aagaccagag attggggagt atatagcttt tgggaattca ggaaatgcta acgtctatgg    19980
agaatttgca taggtgaaag atcagattgg aagcctttct ctgtggaagc attgtggatc    20040
taagtccaga agtgatcctg agccacctac tatggaaagg tgtcagtgag caagagactg    20100
tctgacaaag gtggaagctg agcagacttc tactgcgcat cgcctatgta caggccagat    20160
tccaagggct gatattacac tgctagtttg atctttctca gatagctggg tagagaggga    20220
aaagtttcac cccaaatacc agatgcctcc aaacatctag atgcttggtg ttatgtattt    20280
caaacagcag gtttgataaa gctgttttta ctctccagtt ggatgttggt tgtcaaggct    20340
gtcattaact tctgggagtt cccaaatcct cagagagaga gaaataagca gttctgcctg    20400
caatcagaag ctggctttga gccccacatg gcaacatgcc tgtatttaat tagaagtggc    20460
ttagttcttg ggatttactg tggattgagt ctacgaagct ggaaggtttt atcctgagta    20520
ttccactgtc tcctcatgtg gattttatca aatttctcct ttaaccatat aagcgctttc    20580
aaagttgaca tatcacactt agttatgagg ggaacctaga agtatgattg tgacgtgcat  20640
tgttgagaga ccatgctttg taagtgttaa taattaaaat tattttgaac actaattatg  20700
ctgaagactg gattttctac tccttcagat gttttccagt ggacatattt tgccctttta  20760
ataaattgat tgcgaactta tcttcatttc acctttatga tgttatacct tttcattttt  20820
gtcttctcat agctagggtc tcctggtccc caaatgtaga cacacatctt acaccaatcc  20880
cagagccatt ttgtataaga gccaccatgg atttaaccag ctttagctcc agtatttgaa  20940
cataatgttc agcatcatca cctggccacc aaatcaaaac tgagcaccct ttaatccatc  21000
aacaagttct ctgcagccat gcaaggttat gaaatgggca cagacatcaa tatacagtct  21060
ttgtgtttaa gaggttcatg gtctacctga gaaatgcatc tttaaaccta aagtagacgc  21120
tctgtttatt ccataaatga tttttaagca tcaatggtat atcaagcact gtactggctt  21180
ctgggctata ataaatatat aaagaccaca agtttgaatt tcatgacatt gaactataat  21240
gtttaaatgt tataataatc atagtaaatg tccttgagga gctacggaag attcctgcat  21300
gaagcagaaa caagaagctg aagaaaaaac aactggcttt gggggctata taaatataac  21360
cctcaaatta aaaactcaat agtttgattg attaccaaat caatacagcc agaaaataaa  21420
tgtattaccc caaaagcttg agtgaagaaa gacttctgta agttactaga aagcgctaag  21480
gaagaaataa aagaatgata ttcctgagag ccaggtgctt tctgtaggac acacagatac  21540
agaatgaggg aaaacagaaa attctatggt tgtggattca aaatagaggc atcaccatgt  21600
ctatctcatc agggtttaac cagaggaaac caaaccagta agatatctg tattaagagat  21660
ttcttgcaaa gaattgacct atgtgattgt gggcactggc taggtaaatc ctaagtccac  21720
agagcaggca ggaagaaaac aggctgggac ttgtaggcac aggatgaagc tgcaatactc  21780
atgtggatgc tgctcttctt cagggaagac ttggctctgc tctcaaggac tttcaggtga  21840
ttaaatcagg cccactcaca ttatctaaaa taatctccct tactcaaaac caagtgatta  21900
tggactttaa tcacatctat aaaatatcat tatagtaaca cctaaattag tgtttgaata  21960
actgagagtt gtaactgata tggtttggct atgtccccac ccaaatctca tcttgaatta  22020
tagttcttat aatccccatg tgttgtggga ggaaccaggt ggagataatt gaatcatagg  22080
ggcagtttct cccattctgt tctcatgata gtgagttagt tctcaggaga tctcatggtt  22140
ttataaaggg cttccctctt tgctccactt tcattctcct tcttcctgct gccatgtgaa  22200
gaaggacatg tttgcttccc cttctgccat gattgtaagt ttcctgcggc ctccccagcc  22260
acgctgaact gtgagtcaat taaatctctt ttctgtataa attacccagt cttgggcagt  22320
tctttatagc agcatgagaa tggactaata cagtaacttt accaagtgga cacataaaac  22380
tgatcattac aatgtacagt gaatatttgg tgagttaata gatatattca taactgaatg  22440
aaagaggatg gtgattccta cttcagggtg gtattatgag agttaaaagg gttagcatag  22500
atagaacact tttctatgat tgatctaagg ttggctttta gggactacat tatacatatg  22560
ggttttgtct tcatgttttt gcttgcattt ctctctctgc ccactcttgg ggctatttgg  22620
atgtcacctc ttcttcttct gagctccagt ctatgtattc cctgttccat catcacaacc  22680
actgaagtct acactcctca ttagattcag ggaacccaga tgccagccaa agacatccct  22740
ttccctcatg acccagttga aaaaattctc cacccttctg ttaattctag aatatttagg  22800
agtaaagatc ttttccctca gatatctgtc aattcccggc cttatatctc aaagcccctt  22860
ttcatccagg tttcctagat catttcttgt cgtccctgtg ctataactca ttaacccagg  22920
cataaaactc atcagctact aatgtcctct tccatcccag actcccctca caccaataat  22980
tcttgaatag agcaacccaa attgagaatt ttaagtaaaa ttgaaggtaa atttaattgc  23040
aggaggacat acaacattaa cctttaaata gagatcctaa ttcttaaaaa aaaaagtcct  23100
cattgatctc ggggccgttt cacgcaggtg cttttctaaa tcatcaaggt tatcttcagc  23160
ttcactttca gtctccttct tcggctctgg cgctgccact ggctcttcct gtgctaatgt  23220
ggttgtggca gctgcaatgg ctgcaggggt cacagcagct gcagcagctg cagccacagc  23280
cttttccttc ttgtgttttt tgtgcttctt gtgcttctta tcctttttgt gtttcctgtc  23340
cttctttttc ttctttttct ttccatctcc ttcttgatct gaatttcttg gcagtgatgg  23400
gctcggtgtt gggcttttgg cctttttgac cggtacagct ggtgaccagt ttgtagacgg  23460
tgactgagac tggatggggg atggagatgc tgggggcttt ttagctgctg gctcaggaga  23520
cccagagaca gatcgggagg atgagaccct ccttacagac tgtgggcttg gggaagcagc  23580
ctttttttat ctttttaggt tccggagtcc tggagactct cctaatgggc ctagtacttg  23640
gagacgggga ctgccttctt tggggtgatg acgacgctcc tcttcgaacg ggtggaggac  23700
ttgaggtctg aggagctcga ggccgtgatg agggcgaatg ccatttgttt ggatgcggtg  23760
atcgggcctc ccgggtagag cggcttgggg aagacccttt cctatgcttg gatgatagtg  23820
aaggtgaacg tctcttggtg actggggagc ttctttggaa ggtggagaat gggagacccg  23880
ccgctttggt ggtggaaatg gtgatgctct tcgtttagga gggggaggag gtgaagccgt  23940
tcttctcttt ggaggtggag aaggagagta tctcctctgt attggaggag agtatcttct  24000
aggagaaggt gagcgccgac gtaggggagg agaaggagtc cttcgtcgtg gtggtggtgg  24060
tgtgggagtc ctgagccgtc gaggatgagg ggcgggagaa ggagaccgtc gccttctggt  24120
gggtggtggg gatggacttc tcctccgtct accatgaggg gaagtctctt tttggtgctt  24180
tcgtggtgat ggagaagcac tccgggaagg ggaatgtctc cgccgcttgc caacctcacc  24240
attcttcaca tgggatctct tgggtcgttc atcttctgag gagaaggagg aaccagagtc  24300
agatgaagac tgctggtttt gtcgtctgta ttggcgtctc tgctgagatc aatgaggaag  24360
gcccaagtgt ccccacagtc ttagggggaa atgtttgtta tgatgtaaat tttatttggt  24420
ttgtacgcag ttcaatttca aaattgctaa aatgtgtttg agctttagac tataacattt  24480
gttgtaataa ttgctaggtt gaagttcaac atgtaaaaaa agggggcatg gatttacatt  24540
gcaaaaggtg tccacagtgt attagtgaca ttctttcatt gacagctgac ataattcatt  24600
gagtgaaata ttttaagcca aaaaaaattc cctttttaaa aaagggggtt taaatactgt  24660
tgacactttt atggttcctt taaatgctct ggctattccc agaggggttt ttttgtttgt  24720
ttttttggtt ttgatttgct ttttgttttt ctttcttctt cttacatttt tttccatttg  24780
agtcttagct cccatttaag ttatgcttct gaccttgtat ggtctgtaag cttgcccaga  24840
aataagacca ctgttttgaa ctaccacaaa agtataaatg aatattttaa tgccacagtc  24900
tttcctgttg cctgtggagt ctctgctgaa atgaatcagg attcgagctc taggataaga  24960
cagaaaatga aagcatgttg tttgccagga cactgtgggt ttatattgat gtgtaacaac  25020
ttgatttgga acactggact ctcattctgt tcttctggtt ttgttttttt gttttgtttt  25080
tttcttttgt aaaggccatg aactagtccc agaaaggatt ccttcagtta catacaattt  25140
gtttaatgaa atgtcatggc tctgttcata tttttgtctt gttcttccaa ttggtgtata  25200
caactttcag agcctcttgt atttggaagg ctggaagggc ccagactttg gaatagtgtc  25260
tcggtttcac tgtttttgtt ttgatttttt ttttttattt tttttaaact aaagctatat  25320
aaagcttgtg gattaaacag aataaatttc taaatttaaa aatttaaaaa aaaaaaagtc  25380
tattgtcttc cctcccctac cctaagcaat atgcaatagt ggctcttcaa tagtcccaga  25440
ctcttcttct cttcctggac tgcccatctc ctgatcaacc cttaatttct cttccttctc  25500
tcacccttct tttcaggatt gaattaatga atcctttctt ctcactcatg cagagtaagt  25560
ttctgcctcc ctgggtcttt ctgtttactg accgcaacaa cttcagatta tacctcttct  25620
actccaagtg ctttcaaaga aagtcctctg ccaagacaaa ttcattacgt tttttccctc  25680
tacctgtttg cctttattct cttttgtatt tcatcttctc atctagattg aataatcttt  25740
gagagcacag atgtttattt atatttttcc tttccatttc tactcagcat gaggtgtcca  25800
ttgaacaaac ttgatgaatt tttattgctt aatatcttgc tagaggtggg gagagaggtt  25860
gggggcggtt aaggaactat cagctagcct aggagatatt agagctgcag agatttggct  25920
atcttgttca acgttatatc cctagggatt agtacatagg cttgcaaata gcaggtatga  25980
ataaaaaatt attgaatgag taaatgaatt taaaatataa gttacttagg cggtatcttc  26040
aggcatatct gtgtttatgt ggtattcaat ggcccacaaa tgtctacatc ctaattccta  26100
agatctgtaa acattaattt gcatgacaaa agagacttta cagatgtgat taaatgaaag  26160
gattttgaca tgcagataat atcctgtatt cttcatgtgg aaccaatgta tttacaaggg  26220
tccttataag taaaacagag aagcaggaaa atgagggtcg caaaaaaaaa aaaaaaaaca  26280
aacatgaaga cagagaagag gttagagtga tgttggcttt agagatggaa ggagtcacaa  26340
gctgtcttaa aggaataaga caagctgtct taaaggaatt gttataaagg aatagctgaa  26400
gctgggtaat ttattttaaa aaggtttatt ttgctcacta ttctcatgtc tggaaaagtt  26460
taatattggg tagctgcatc tggcaagggc ctcaggctgt ttccactcat gtcagaacgt  26520
aaaggggagc tggtgtgttt agagatcacg tggggagaga ggaagcaaga gagagggagg  26580
aggggccagg ctttttttaa acaaccagct ctttttttaa aaaaaaatta tactttaagt  26640
tctggtatac atgtgcagaa tgtgcaggtt tgctacatag gaatacacat gccatagtgg  26700
tttgctgcac ccattaacct gtcttctaca ttaggtattt ctcctaatgc tatcccttcc  26760
ttaaccccca aaccctgaca ggccctggtg tgtgatgttc ccctccctgt gtccatgtgt  26820
tgtcattgtt catctcccac ttatgaatga taacatgcag tgttgggttt tctgtccttg  26880
tgatagtttg ctgagaatga tgatttccag cttcatccat gtccctgcaa aggacatgaa  26940
cttatccttt ttatggttgc atagtattcc atggtgtata tgtgccacat tttctttatc  27000
cactctatca ttgatgggca tttgggttgg ttccaagtct ttgctattat gaacagtgct  27060
gcagtaaaca tacgtgtgca tgtgtctttg tagtacagtg atttataatc ctttgggtat  27120
atacacagta atggaattgc tgagtcaaat ggtatttctg gttctagatc cttgaggaat  27180
tgcaacattg tcttccacaa tggaacaacc agttctctta agaataaaag tgagaactca  27240
cttccctggc cccagagaga gcaaaagcaa ttcatcccca tcacccaaac acctcccatt  27300
aggccctacc tccaacattg ggatcaaatt tcaacatgag gtttttaggg gacaaacatc  27360
caaactatgt cacaagacaa ttcatgtaag cagcctctaa aagatggaag aggcaaggaa  27420
acagattctc ccctaaagcc cacagaagga aagcagccct gccaacttct tgattttaac  27480
ccagtaagac ccgttttgga ctttggacac caagagctat aagatgatta tgttgtttta  27540
agccattaag cttgaggcaa tttgttacag cagcaattgg aaactaatac agatcacatt  27600
ctaattcaat tagtattgtt cccagttctc tggacctcag atttctttcc tgaaaaacat  27660
taaaaataat acctgaaagt tttgcacacg agtgcagagt gcctatttac tagagagatc  27720
agcatttgtt taggctctga atagatttga ggatgaaatt aaatagcata aataaagttc  27780
ctagtgatgc ttctgataaa aaaatatctc cttcaaaatg ccagaggcag gtcctaaaaa  27840
cccacaaagc aggtgaactg gcaaaagact gtaaaaagca aagtagaggt tcctcttcaa  27900
agactttcct ctccatctaa ttaggaataa atagtaactt atcttagaaa caaaatttat  27960
tcaaagacct gtgctaacat tctgaaatat ctgctagccg taataaataa atcgatgtac  28020
tttatgttct tagctcccac aatttaacct aaatatttgc cctggcatgc ttatactggt  28080
ccaagcaagc attaggtcat agcctgttcc tcttctttat tttaaggtgt ttttaccttt  28140
gtcagcatgc cacaagttac ttcctccttc ctttgttctc ctctgccttt gactctttta  28200
aagagtccta agttgctagc caatcaggac aaatacagaa tgtgaggtcc cgtttcagcc  28260
aatggaaagt ggacacagca ggaaggtgga tgggtcaggt tataaatgac cctgtctcct  28320
ttgttcggtg tactcttgtg gcaaaactgc tggcaagtgt accctttctg caataggtaa  28380
aaactgcctt gctgaggaaa ttaaatttat gttcaagtgc tatttcttta tggcaccggg  28440
gaacaagcat ttctaacaag actatgtaat ttaatttcag gaacctaaaa aagtgggatg  28500
aagaactgag gttgctaata aatctataca acttataagt aaatatttaa tttactaaca  28560
tataataata aagacatcat tgtaagacaa tgttaaaaca ttttacacat tttaaatgtg  28620
caatagtaaa tccttcacta ttcagggatt atttggaatc ccttgtcacc agaagctctt  28680
aaggaaataa cttctacttc gttgcaaata tgttcttggc ttagttgagg taatgcaaat  28740
actagaatac ttgtttgttt aacagcttat tcttccctga agctgttcct ccagtccctg  28800
ccagtgggat cttatgtctc caggagtact taacacccct aatagcccca tcttttaagc  28860
ctccctggga cctgccctcg cagtacctct tatacctact ccacttcctc ctcatggcct  28920
cctgcagaat gccattctaa aattaggttc tattttcctc gcccgcattc tcttttgcaa  28980
agcctccaaa aaatttactt tgcttctctg cgcctgcttt atctctattt tctacactcg  29040
ctccttcttt ttctaattat ctataatagg cgtcacaaaa tttgcatttg ttggaaccaa  29100
aatttccatg gttgcctcaa aatatacaga tgtaaatttg catataatta aattttgcat  29160
aagggaaact ctcatttggg gagatatgca atgcccaata aatggcagtt tccttcaatg  29220
tccccaggcc agcctcccag tctgtgtgtt tccccctggc tgcagctacc aggactctgc  29280
tctggggatt tacggacaag ggtatcaagt tttaattaaa ctaaccctct caaactgaat  29340
gagtggctta aaatcttcct gtaaagaaac cgcaaaataa taatgctggc attgagaagt  29400
aagaaaagag cgagccagca cccccacccc ccaaatcctg tgacaaggtg tatttttgtg  29460
ttttgttttt tttctttggc agcattatgg gggaaaagca atgatgatct aatgagatct  29520
gataagaagt tagcccaaaa caaggaaatt gttgagggtt ctctttgaag tatggattta  29580
tacccaccaa ccttagctgc gaaccttacc tcaagtgtta cctgtgcctt gagatgtttc  29640
ctggtcatag tactaagcta tcataatgag caagacattc aataagcaag tgtgatggct  29700
atgaggacag atcttaacag gttttttttt ctggaaggct taaaatcatg cattactcaa  29760
tctaatactt cacgaaattt cagtaaaacc taatgataat atagaagctt gtgttgtagt  29820
tttgtaatca acagcaaaac ataaaattta aaaaaaacat acattactgg ggctgtatcc  29880
tgctacaata ataaggctga cataatagat ggagaacaat atggtaacaa gccaaaatgt  29940
attacttcat ccacaaatag tatcgtgcta tatatagaca gacttgttaa aaatttaaag  30000
aaatacacaa tcaattacac aatagaaaat ttgctatatg gtgcatggtg gcatgcaact  30060
acaaatgttt ctaacatgtt tctcttcata ggattttctg aattttcatt taatattcaa  30120
gcacatcaaa aacacctttt caggtgtgat cctatacagc aaagctgtcc tcacaaacaa  30180
tagttgacta aataaacaca tggctttatg gaagaaatgt gtaagtatag ccattgttgg  30240
agcagatgct ctgcttaaaa agaaaaaaaa taagttaaag ttatagatct caccatgctt  30300
atttactgct taagtcatag ccaatttatt gcaccaaagt tgaagttcaa agcataaaga  30360
atactatata taatgcaatt aatgaggttg atgtccctaa aacaagagag aattagtaaa  30420
tgttttacaa tagttttcat gagatgggaa atgacaatag aaatctttgt tacaatgcag  30480
attttattgt ggaaatgatc tcatggcaaa gtttttaaag aggctgcaga acaataaaga  30540
gagataacac attttgcttt tatgaaaaag ccgatgttcc aaatttgctg accttctctg  30600
taaataagaa gtgactgtca gtagccagca gatgtgttta taaaaataac ccacttgatc  30660
tgtccctgca aggtaagagt ggcattttca aagtgcatga gagaactgct ctcaagagaa  30720
aatcatactg taaagacagc atttcaaaaa catttatttg gaaatattta aatgatgtga  30780
tctatttatt tatttggtca aaaatgccca acttgcctaa cattatttta ttccttaaaa  30840
cacagatcaa gcaacagatc ctacagttag actcttctga tcaccctgag agttagttac  30900
ccctttcttt ggtttcttct ctttaacgtc ctgcatatat gctgccattg tgtttatagc  30960
acaatatcag agtgtgttat ttatacgtgc atctccctca ttagattggg agtttcttga  31020
tgtcagaaca cagcaattgt cccaccagaa taaaaagaat attgccaaaa gatgctctat  31080
aaatgtttgg ccattggttt aaaaaacaaa taatggacca atgggctcaa aagcaaactg  31140
gctaatataa aaataataat aacaaccaca ataataaaat aagggctaac acttaaacgg  31200
ttgtgtactc actatgtact aggcactgat caaagtactt tgtacatatt ttcttattta  31260
atattcgcta ccatcatatt acaatatact gttattaacc ccaatgtata gatgtaggtg  31320
aagaaacttg tcacaaatca tacagctagt tgtctgagat gcaatccatg tgatttgttc  31380
acagagctca ggttctgtga agcgggtaaa aacaaaattt ggcatccagt ttcaaaagga  31440
gaattgcaaa ctaatagaac atatagcaca aaatgattat atcaatagaa tgctaattgc  31500
atatcaagga tatttggtat aatacaaatt attctacctt aaacatatgg aaatttgtgg  31560
tccatgatgt tgtagattct atcttcccac tctgcatttt caaaggcata tggtattgac  31620
tcattcgatt aattgttgga tagtctttat tatagactaa atcatagaat aaatacatgg  31680
atacatgcac gaatattata tctcaagggc tttacatagt tcattatctc acttcatagt  31740
caaaacaaac ctactgatag ttccaatgca aagcctagaa cgctttggct tagagaggcc  31800
caagtctttt ctcagtgctg cactgctggt acgtggcgtg gtcccctctc ttctctcagt  31860
acacactacc catgcagact atcactctca gtcttgttta tctcaaatac agagggtata  31920
actaactgga atgtatccag aacagtgagg ccaaagtgtg gggaagctcc ttaaccatgc  31980
tgctgcatga ggaacagctg gagagactga gaacatgagg cctaaagagg agactcaggg  32040
agatgggatc acaatcttca aatatttaaa agacatcaag gggaaaagag attaaacaag  32100
gtaatgtagc tctagagagc aaatccaaga gtgttgagtg gaagtgaaag ggaggctggt  32160
ttcagtcaga tagtaggaag aactttctag tatttggtac tacaatggga aagactattt  32220
tgtgagattt ttttaaattt ttttttaatt atactttaag ttctagggta catgtgcaca  32280
acgtgcaggt ttgttacata cgtatacatg tgccatgttg gtgtgctgta cccattaact  32340
catcatttaa cattaggtat atctcctaat gctatccctc cccgctcccc ccaccccaca  32400
acaggccccg gtgtgtgatg ttccccttcc tgtgtccaag tgttctcact gttcaattcc  32460
cacctatgag tgagaacatg cggtgtttgg ttttttgtcc ttgcaatagt ttgctgagaa  32520
tgatggtttc cagcttcatc catgttccta caaaggacat gaactcatca ttttttatgg  32580
ctgcatagta ttccatggtg tatatgtgcc acattttctt aatccagtct atcattgttg  32640
gacatttggg ttggttccaa gtctttgcta ttgtgaatag tgcctcaata aacatacatg  32700
tgcatgtgtc tttatagcag catgacttaa aatcctttgg gtatataccc agtaatggga  32760
tggctgggtc aaatggtatt tctagttcta gatccctgag gaataaatga ccaactattg  32820
agaaattgca gggtagtccc tacatgaggg ttaggtagaa ttgacctgct ttctgcctca  32880
taaattttag aaaattaata agataattta ttacggggtg gtgtttgttc cctcagtact  32940
ttatcatcta tgttgataat gttaataatt aattgcataa ttaacaaata gcaaattatt  33000
gtgggggtgt gtgtgtgtgt gtgtgtgtgt gtttagacag ggtcttgctg tgtcacccag  33060
gctggagtgc agtggcgtga tctcggctca ctgcaacctg tgccttccag gttcaagcca  33120
tcatcctgcc tcagcctccc tagtagctgg gattacaggc gcctgccacc atgcccagct  33180
aatttttgta tttttaatag aaatgggatt tcaccatgtt ggctaggcta gtcttgaact  33240
cctgacatca ggtgatccat ccgactcatt tcccaaagtg ctgggattac aggcatgggc  33300
catcatgcct ggcccgcaaa ttgttgttat ttataactct tcaatccaaa tcatcagtgt  33360
ctatgttgtt tccttaacta tcaaatgatg ataataatag taccttcttc ataagatagt  33420
tgaaaggttt ttaatatcca tatggtactg agaatgatgc ctgaaacata gtaactaccc  33480
catttttatt atatttctgt taataataat acataccatt attgctcttg cataccatat  33540
tgctcttgca taccatatat gctcttgcta tatgctacac acagtatttc atttaggcct  33600
cactatgtcc ctgatgtagg cattaatatc tttattttgc aaatgagaaa acagtctgta  33660
ccttgtatgc catgctgcta ttgtttatct gtttgaatct caagcaaatc tgcttgataa  33720
ttggtaccaa aataagcctt tttctgggta aggaatctga tattgtgttt taaaaaacac  33780
acatttaatc ctggggctgc tgcattactc ctgctgcccc atcctactgt gatcaaaggc  33840
acatacatga gatggtgagt tgtccccttg ccaatgaggg tttggtaaga aaggaaagtg  33900
cagtacttct ttgtttctga attgcaagta tgtgtgggtt agagggggag gctgaatatg  33960
aaggtcctgg gacagcccac caggtatccc atgagacttt gcaaaggaaa aggaggtgag  34020
tgacagccca gggtccaata ggatagaagg aaaagccagg ccatggagtt cctcagacct  34080
gctttctaag ggcaactcta ccacctcagc aagccattga acttctctga gctcagtcct  34140
ttcatttata aaatggggtg acagtgctca catgccagga atacaaaggg attgaaagat  34200
aaaacacgta attaagcacc tgttgttaca catctgtcag ggaccccaat aaggtcagct  34260
gtcttcctgt tgacttctgt tcttggtggt tctccaagat cataccttcc atcaacattt  34320
accgtcactc ccccacccca tgcccaatac tgaacagtgg agggacgctt cacctacagt  34380
tataatgttg aaacttcaac ccaaagcaag tactgttagg atctctggaa actttccctc  34440
aaataaggga tttgaatggg acaagaagaa gttttacaga tagccaatgg agatgattta  34500
atggggttat gatagaaacg agaaagtaaa acaaacccat gctttaaagt ctaccatttc  34560
aggtccatat tttcgcttga aaattgagat tcctattaaa caatgacatt tacaccaaaa  34620
agtagaggag ttggttgaag gacagggtaa tgccaggagg aattgggaat ttgagagtca  34680
agtcaaagga ctgaaatact cagaatacta agggcacctc agggctctac caaggacacg  34740
tagaagcttt gaatttgcag caccacccta atttaacgag ctacctcagc acgtagtgga  34800
gccttggaaa acagatgtca caaactctca ttagattgtc aaacattttc cagcatttcc  34860
tctcccatca tagctggtta tcaagatata tagacacaca cgtgcataca cataaatacc  34920
ttgataagtt actagagaaa gcagaaaaat gtctgacagt ttaatgagat ttgggtgaaa  34980
gaaaattcta tatttcattg ttttccaggc actagaaata attcatcaat gtttctaaga  35040
ctcattcagc gtggctgcat tttttaaaat attttcataa attttgagga gcaaatacca  35100
ttattaggca ctaaaaaggt tgaagtctaa tagattagcc gcttcatcct ccttcactca  35160
gctcagcatt cgttcaactg gctcttactg gttaacatcc acacgcctcc tgactggcta  35220
ctcagtgccg atgacatttc cttcacacac agggctggtt ttaagataca ttgaggtgac  35280
atcaggtggc ctgtaaagtg gtcattttag gatatcctat tcaaagacat ctgtggaagt  35340
gtggaccaat ttattgatga ataacagtga aggggtttcc accagcaagt aacataattt  35400
tttacaatga tgatgctgaa gtagaaagag tttctagtca gggactggac aaatcaattt  35460
gcagacgatt tttaggaaga aaaacattgc aacagtaaat tgtaattgat aacttctaga  35520
gccactttaa gtactgctat tttaggattc tgaggggaag aaagtgttct gcaaagcaat  35580
aagcaaagtg atttgttcca agccccaaat ttaagcagtt tgagaggtaa aaagagtcat  35640
taccaatgtg ggtatagaac atgtgctagg caaatctctt tcacatacat gtggggaggt  35700
aataaaatta taatttgagg ccgggcacgg tggctcatgc ctgtaatccc agcactttgg  35760
gaggctgagg tgggtggatc acgagatcaa gagattgaga ccatcctggc caacatggta  35820
aaacctcgtc tctactaaaa atacaaaaaa ttagctgggc atggtggcac acacctgtag  35880
tcccagctgc tcgggaggct gaggtgggag aatcacttga acctgggagg cagaggttgc  35940
attgagttga aatcacgcca ctgcactcca gcctggtgac agagcaagac tccatctcaa  36000
aaacaaacaa aaattatagt atgaaatagg cattaaaata ttgtgtattt tagaggagac  36060
tgaggattgg aggctgaaga attactctaa attaatcagc ttgtgtactt cagagctaag  36120
atagctcttt gggttctaaa ttctgtgatc ttctttttga tttctcttgg agcaataatg  36180
aaggcaaaac atcaataaac ataacaaact gggtaaggga gaccattgag aaggactaag  36240
gacaccttca aagttctgag tgagtttaaa aagaagaatg atgaaaactt tgatagaaat  36300
aggaaaaaaa gtagaggaac ttgtttggct tgaaacttct taatgtttag gctaattata  36360
ttgaagatga cagtggtcat tgagaaaaca aaatccccaa agcaattttg gaataagagc  36420
caacatttaa tacttaccag acaactattc taagtatttt actatattca ctcatagcaa  36480
ctctaaaaag caggtagtat taacagagaa aatgaggcac agtgaggtta aatagctggt  36540
ccgaggctac acagctaatc agtgggagag ttgggactta gacccagagg tccagttttg  36600
aagtccacac ttttagccat tacactacaa tggaaagaaa tttagaagat atacacagaa  36660
aactataggc acatagatta ggggttagta gaatgctctg ggcagttaaa ggaactcttc  36720
ttaaaggagg taaagcttga atgagactgt tagtaagcta tttttcactc attggtgaat  36780
gatgttttgt gcagtgtgtt tttttcccca tagaaaaata agaaagaaaa gaaaattgag  36840
aactctctct ataaaaatgt gtaacatatc tcatattcca agagatcctt ttggtagtat  36900
taatttttat ctgctcacag tactggcttc attatttgga gttaaaaatt aactcaacca  36960
gataaaaaaa tcagtgctgt gtatttgttt atctttcaaa tctgtgttct aattttaaaa  37020
agttatttaa cagaacgaag ctatcagcta agacaatggc aaagccgtaa acaaacatag  37080
gttgcgttta tgcgaatggt caggtccaaa gtagatgcag aatatgccag gttcactaat  37140
tttaatccct attcagccca ggactatgta ccataagatt actgctagtg ttttctgaaa  37200
atgatgtatc aaggcatttt ctgtagaaat acgaaacagt gacatacagt agggagagct  37260
ggattgaggc agagtagtat agatggaagt ttcctgaaag cattttgggg aaacatcttt  37320
tgggtatggt tcttggatga agagttgatt tattagtact ggaagggtgt atgggagaga  37380
ggaagtgaga ggttatgaga gaatgaccct cccgtgatgg tgagtgggag aattattgca  37440
gtatgtacgt tagcattgct atgtggtgaa gttcttggga tttcctgggg tccgtgctgg  37500
acagcatgct tagccaccag tcacatgtgg gcactgagca ctgacaatgt gggtagtctg  37560
aactgggata tgctgtaagt gtaaaataca aactggactc caaagattta gtatgaaaaa  37620
aagaatttga aatatctcat taatgatgtg tatttggttt catattgaaa acaactttgg  37680
tattatatat tgagttaaat aaaatgtcat taaaattaaa ttttacttaa actaaaattt  37740
aaaattctat ctttaccttt tttttttttt tttttttttt ttgaggtgcc gtttcactct  37800
tgttgtccag gcttgagtgc aatggtgcga tcttggctca ccacaacctc cgtctcctgg  37860
gttcaagcga ttctcctgcc tcagcctccc tggtagctgg gattgcaggc acgcaccacc  37920
acgcctggct aattttttat ttttagtaga gacagggttt ctccatgttg gtcaggctgg  37980
tctcaaactc ccaacctcag gtgatccgtc cacctcggcc tcccaaaggg ctgggattac  38040
aggtgtgagc caccgtgcct ggcctatctt taccttttta aggtagtgac tagcaacttt  38100
aagattcata tgtggctcat gctgtatttc tattatggaa ctgccttatg actttcaatg  38160
ggtaggatgg acacatcctt ggtgggatgg agaaatctat catagcagct ggtcttgaag  38220
gtgggtgggg atatgataat aacttaggtg gggaggctca ggaggactca cagaataact  38280
ggcaaccctg cccctgtctg taaaaacccc atcctggagg aaataagtta ggaaaaggtt  38340
ttgcattttg tggaatgaaa agtctgttgc atctagcttg agacagagca aaaagagttg  38400
attgtcagct tcatgaagac cagggggtct aaaagaccca gggatcaaca accaatgaga  38460
gcagcatgga ggccaagaac caggcaaaat gctgattcca ggactgggat tcaggatgat  38520
ttccttctat gcaataatct gctccttgaa agggtatcta attgggcatt gcttttactt  38580
gctgctttca attcttttat gttctttcct agtaaatatt ttttcttaat ttcattgcag  38640
ctcgtattta tcctgggaac agagagaaat gtttcacaag cttaagccag tcttttaaaa  38700
ggagaatggc aggactccaa aaacagacat gctgatatgt actggggaat ttttaagtgc  38760
tgaaacctcc aagacaaaag agactgtgtc tttattgttc tctgaattac tcgtacccag  38820
ctcggtacct ggaacatgat agggatccca tagtggtttg atgaataaat tagtgactcc  38880
aagagtaaag taatcctcag gaggacaaag gcagatagct tcccttccct atcagaatgt  38940
acttctctta aagcttttct tggtataatt cttggagaat tttgccttac agaagtcaaa  39000
tcacatacca aagtgaaaac tggatcttct acaaataatg gaagaatcaa ctctatcaaa  39060
acaacaatta tacatatgat caatggaggg gttgtcacga gccaggctaa gagctttaca  39120
tatattatct cattctgtct atgccagaga atcaactatg acatatgtaa cattaaatct  39180
cattttatag atgcaaaaac tggggtgtaa agaagtcaaa gaatcagcca gaatgtacag  39240
aattagcaaa ggtggaactg ggatttgaat tcagacagtc tgactccaga cgccatctcc  39300
gaattatgca taattatatt tcaattatta acattcataa attgaaatat gagggataat  39360
gtaccttttc atgaaagctt tgctcgttgt gtggatgagt gtgtgtacat gtaactgctt  39420
atgtgtgcta tcactgaggt agaagacatc tctctctctc tctctctctc tctctctctg  39480
ttttggtcta cttttagtaa gacttgtatt tgattgagtt cagaagtttg attatctttt  39540
taactaacct gtttgtttta attatattaa aaattagtca ctttcaacat atttgcatag  39600
gtaattgtta gggtgatctt ttggatgatc agatgtaata tactactact acacacagac  39660
acccagacac acacacacac acacacacac acacgcatgc agacacatcc ttgagctcaa  39720
agagctttct caggactaca tactttacat ttacaacaag tcatttagaa aactatcaat  39780
cctattcaaa tctcagcaaa acagagatac caggctctgc ctttctcttt aactgctctt  39840
tttttgctgt agacaaagct gtttcttgca ctgctacata tataaaaaag tgacaaatcc  39900
ttaactgtca aacaagagaa atagtttgat aaatataata attccataag atggcacatt  39960
atacactact aaattgtaag gacagtaaag ttactgttaa gtaccaaaaa gtcatgatta  40020
aatgttaagt gaaaaaatag aatatagcta gatttgaatt tgaatattca atctgtatac  40080
cagtatgtat agaaggaaga gtatatacca aatagtaaga gtatctatct gttttataat  40140
ttgatataat acaaattatt ctaccttaaa catatgagaa tttgtggtcc atgatgttgt  40200
agattctatc ttctcaccct gcatttccga agacatatgg tattggctca ttagactatt  40260
tgttgaatag tctttattct attatcatag aaaaaataaa tgagtgcata tatccatata  40320
caaaatagag gtctgttctt cctgtatata tttatactaa aaaaactgag actttttttt  40380
acagttgtat atatacaaac atatttgttt atttatatac acatatataa atcaatttta  40440
tgtacatgtg ggtatacata catccatgca tataactctg aagtgctgac tctctaaaga  40500
aagcccaggt attggtcaga attcatgctc ggctcaggag tatagaatta agagatacaa  40560
acctcaaaaa agagggaacc gaatcttcaa atctgagcca ccttacaaga atttttaagg  40620
taactgtttt aagtgtaaac attatggcaa tgtaatagta taatttgtat ggcacaagat  40680
ggagtcctgg tggccagaac tgagtatggg aatagtcagt gctaatcttt gtgcaaagca  40740
caaaggaaaa ttggtataca aggcctgaga gagaggtcaa ggaagcaaat actataaagt  40800
cccagaaggc agttggatag gacaagggga tcggaagagc aggatcaaga tcagagagca  40860
gggaagatgg ggctagctaa tctagggaat ggagggagaa gggataccca gaagcaggat  40920
tcagggggtt agagcactta caccatgctc atggccatgc ccatggacag gagaagcata  40980
tgatgggtgc acatggtgga gctggtctaa agaagagggg gattcatatc acagtaaaat  41040
taagtgcaat ttatccacag agcagaggag gttgtgaaga gcaggcatag gctatttttc  41100
atgtctgaat gctctcaaga cctcttagtg ttgtaggtag atgacgcaca ataaatattc  41160
cttgatttga attggcataa aaggtcaaat cagaaagcca gaagttcttt aaggtttcaa  41220
actagattct aagaagtcca aaggcatctc agaggtcatc tcagggagaa aaggggaagc  41280
aatgaggtag aactctgaac ctccactcta cctaaacaag gcagccctgc tgtgctccga  41340
gtcatgtatg gcgacatcag ggaagatgta aaataggatt gtgataggaa acagcatttg  41400
aaagccattg ctttacgaag ggaagcgtag aacccttttc cccttgttag ccaattcaaa  41460
tgaagacttt tgggagctag tgaagagaaa gacaggattt ctagggagat gtttcagaag  41520
cagcctaact atacccgtgt cttcagaaag agcagtgtcg tctcagaagt aatcaccttc  41580
atcaaccagc aggtcagtgt gggtctcctg aagagcccga acaaccacgg gaagcgacat  41640
ccactgttgt gcagtcaaaa gaatctttgc tctcattttc tccactctct ttccttccca  41700
aatagggtat cataggaaga tcctgccttt cttccagttc caacatttat gaagtgaaat  41760
ttccatcaga cagttgcttt tgacaaacaa agattgacta gaagcttctg tgagagagcc  41820
ttaggaagtt ctctggggaa gccctgcctt tgtttggttt tctttgcctt tggctctgtg  41880
atgtttgctg taaaaaatga ttactttcag gtgattaaaa gtggggaaga atggtttcaa  41940
gcttttcatg tagcaaataa tatccctgtc tgtaggatta ctttagttga aaaaaaaaca  42000
tggcttcagt gatgccttct caatgtacaa gattcagagg aatggaaaga aaatgaaata  42060
aggccggcct cggtggctca cacctgtaat cccgggaagc cgaggcgggt ggatcacgag  42120
gtcaggagtt caagaccagc ctggccaaga tggtgaaacc ccatctctac taaaaataca  42180
aaaattagcc aggcatggtg gcaggcgcct atactcccag ctactcagga ggctaaggca  42240
gagaattgct tgaaccccgg aggcggaggt tgcagtgagc caagatcatg ccactgcagt  42300
ccagcctggg cgacagagca agactccatc tcaaaaacaa aacaaaacaa aacaaaggaa  42360
aagaaatctg cagttaatat tttggcaagc tttcttcact tgtatgcatt tttaaaatgc  42420
taatgttaat aacagttcgg gacttctaac ttctatattt aagcaacaaa taaataaatt  42480
gtcagatggt acttcatcat ccttctctcc catcttctta gaaatataaa ttgctttagg  42540
tgggaatgct ataattttag accagaaaat acatgccaga tgtctcttat atgaagccgt  42600
cccgcccaag gatatatata tgccttagtc attaggatgt gttctaaata atactgcaaa  42660
gcccttggaa ggatgggtct gaacactcac ttatatttaa ctgctggcat gttgctttgt  42720
ccctgtgtct tgtgctacta tttccattga tgtaaaggaa gcaccaatta aataacactc  42780
cattattaga gaaccaggca caagtcagct gaggcaggag acccgccttc ttttccagaa  42840
acaatgtaaa gcctgggtgg gtgagggtct ctgggcttcc gccgtgcctt gcttttgaca  42900
ttctccagca caccctataa acatgtctaa ggctgtcctg tttagtctga ttattcaaac  42960
tatattgtcc agggtagagc aaagggaaac ctagctgaac cctggagatg acagcaggga  43020
gagagagagg ggcaaagaag ggcaaaacgg gaaaaacagg aaacaggcta gtgagaagag  43080
taaaaacgct cagggtgagg aagcagggtt tctaagctct ctaatctccc ctgtgcagct  43140
ggcttgctgt atggtttata caaatccagt ggtgatctct gtgcaacgtg gtatcacctg  43200
tttaaagagg tctcatcttc attttcaaag aggaatacat gtttttttac ttactcttct  43260
gcatggctga ctccttttca tgctttaagt ctcaatctta atgccacctc ctccttccag  43320
acgttcccag ctaaagtggc acttcccagc cccattactc tctatgttta ttgcctgcat  43380
agctcttatt tgtaatgatt tcgtaatagt ttgatgatga tcatgatgaa tattacttta  43440
cctatttatg gcctctcttt tagtattaaa ttctgtaagc cacatgagca tggggacaca  43500
tctcctttgt cactgcccca ttgctggcat ttagcacaag catggtctat aatagatacc  43560
aaacaaatat gtattaatca tgtaaatgac taaatccatg aatgaatcta tcagacagtg  43620
tagatagcag cacataaagg aaagggaatg tagtaaattt ttcattttcc ttgaagatgt  43680
agctatgtat taggaatttg aaaaatacat tatcaaacac aaagctaaat tatgccagct  43740
aatgactact aaatataata aaatcggctg ggcacggtgg ctcgcacctg taatcccagc  43800
actttgggag gccgaggtgg gtggatcacg aggtcaggag attgagacca tcctggcaaa  43860
catggtgaaa cgctgtctct actaaaaata caaaaaatta gctgggcatg gtagcaggca  43920
cctgtaatcc cagctactcg ggaggctgag gcaggagaat cgcttgaacc caggaggcag  43980
agcttgcagt gagcagagat cacaccactg cactccagcc tgggcgacag agtgaacctc  44040
tgtctcaaaa ataaataaat aaatataata aagtatgtag aaagtcagaa atcttgggga  44100
ttatattgca aagaatttcc actatattga taatggagaa aggcttttaa tattatattt  44160
tttgaatatt aagaaattgg catctactca ccagtttgga catcgctttt aaaatacaca  44220
ctaaacgaaa gccattttgt acttataagt gctagattaa attcctgcat aggctgaaaa  44280
aggtctcttt ccatgccttt ccaaatttac aattaacaaa gagttaatta ttctcagagt  44340
catttcttcc aattcaccaa ttaggatgag ggctatttgt tacaatcata aaagaggaaa  44400
tggtgcatgg gcaagaagaa atttggaaag gaaatgtgat tggaggaatt atattgaaag  44460
gtgaaacaag ggagaaaaga taaagagaag aaaaattaga aattggaaac aaagttattc  44520
cagcccctct ctaataacta ctactctttg gaacaaggga agcagtacct gacaagaaat  44580
tttttttctt ttatttttta tttttattat tatactttaa gttttagggt acatgtgcac  44640
aatgtgcagg tttgttacat atgtatacat gtgccgtgct ggtgtgctac acccattaac  44700
tcgtcattta gcattagtta tatctcccaa tgctatccct cccccctccc cccaccccac  44760
agcagtcccc agagtgtgat gttccccttc ctgtgtccat gtgttctcat tgttcaattc  44820
ccatctatga gtaagaacat gcagtgtttg gttttttgtc cttgggatag tttactgaga  44880
atgatgattt ccaatttcat ccatgtccct acaaaggaca tgaactcatc attttttatg  44940
gctgcatagt attccatggt gtatatgtgc cacattttct taatccagtc tatcattgtt  45000
ggacatttgg gttggttcca agtctttgct attgtgaata gtgccacaat aaatatacgt  45060
gtgcatgtgt ctttatagca gcatgattta tagtcctttg ggtatatacc cagtaatggg  45120
atgtctgggt caaatgatat ttctagttct agatccctga ggaatcacca cactgacttc  45180
cacaatggtt gaactagttt acagtcccac caacagtgta aaagtgtccc tatttctcca  45240
cagcctctcc agcacctgtt gtttcctgac tttttaatga ttgccattct aactggtgtg  45300
agatggtatc tcattgtggt tttgatttgc atttctctga tggccagtga tggtgagcat  45360
tttttcatgt gtcttttggc tgcaaaaatg tcttcttttg agaagtgtct gttcatatcc  45420
tccgcccact ttttgatggg gttgtttgtt tttttcttgt aaatttgttt gagttcattg  45480
tagattctgg atattagccc tttgtcagat gagtaggttg cgaaaatttt ctcccatttt  45540
gtaggttgcc tgttcactct gatggtagtt tcttttgctg tgcagaagct ctttagttta  45600
attagatccc atttgtcaat tttgtctttt gttgccattg cttttggtgt tttagacatg  45660
aagtccttgc ccatgcctat gtcctgaatg gtaatgccta ggttttcttc tagggttctt  45720
atggttttag gtctaacatt taagtcttta atccatcttg aattaatttt tgtataaggt  45780
gtaaggaagg gatccagttt cagctttctc catatggcta gccagttttc ccagcaccat  45840
ttattaaata gggaatcctt tccccattgc ttgtttttct caggtttgtc aaagatcaga  45900
tagttgtaga tatggggcgt tatttctgag ggctctgttc tgttccattg atctatatct  45960
ctgttttggt accagtacca tgctgtttgg gttactgtag ccttgtagta tagtttgaag  46020
tcaggtaatg tgatgcctcc agttttgttc ttttggctta ggattgactt ggcgatgcgg  46080
gctctttttt ggtgccatat gaactttaaa gtagtttttt ccaattctgt gaagaaagtc  46140
attggtagct tgatggggat ggcattgaat ctataaatta ccttgggcag tatggccatt  46200
ttcacgatat tgattcttcc tacccatgag catggaatgt tcttccattt gtttgtatcc  46260
tcttttattt tattgagcag tggtttgtag ttctccttga agaggtcctt cacgtccctt  46320
gtaagttgga ttcctaagta ttttattctc tttgaagcaa ttgtgaatgg gagttcactc  46380
atgatttggc tctctgtctg ttattggtgt ataagaatgc ttgtgatttt tgtacattga  46440
ttttgtatcc tgagactttg ctgaagttgc ttatcagctt aaggagatac tggcaaaaac  46500
cacatgatta tctcaataga tgcagaaaag gccttgacaa aattcaacaa cccttcatgc  46560
caaaaactct caataaatta ggtattgatg ggacatatct caaaataata agagctatct  46620
atgacaaacc cacagccaat atcatactga atgggcaaaa actggaagca ttccctttga  46680
aaactggcac aagacaggga tgccctctct taccactcct attcaacatc gtgttggaag  46740
ttctggccag ggcaattagg caggagaagg aaataaaggg tattcagtta ggaaaagagg  46800
aagtcaaatt gtccctgttt gcagacgaca tgattgtata tctagaaaac ctcattgtct  46860
gacaagaaat tttatagtct gatgaaaggg attctaaaga gtcaggggcc acaggtctca  46920
ggcttcgact ggatgtgatc atgtctgagg cctttcgatc ctcactttcc ttatctggaa  46980
aacaagaata gctgaatctc cttctaaggg cgtttgtgat atgaactgag atcttgcata  47040
tgactgcacc aagtctagct caattcgcat tagttccctc cattataccc ctccctcgag  47100
ctttacccag actcagaaga aagccaggca acatttctac ttctctatat gcaaaaacaa  47160
aagcaaacaa gtggaaaacc tcacaaaaac agttaacttc aacatttggg cttacacaaa  47220
caattcaaaa atctcttttt atttcatccg ccatgattat agttattttt ctaaagtgaa  47280
tgattctact tcccaaatgc agtaaaccca ctgttaaaga tagttaattt tcctctagat  47340
gattgtggcc cttgaaagtc atcaaggtca tatttttaat tatttcccca gaatttttcc  47400
tgaaacagtg tccttttgtc taaatcaatc caagtaggtt ttagcattag tcataaagag  47460
ggtgctgtca acaaagaaat caactgagtg gaagtgatat tataatgtaa ataacttgac  47520
ataggaatac ataacactca taaatattta ttgatttatt taataaatta aaaattaatg  47580
cttatgatat gtaaacaaga tataacaagg cagtcaagaa taactctctt tagttcatat  47640
gattttttcc catacgtaac tgaatagcaa gaaaacaagt aacccagttt gaaaatggac  47700
aaaaaactga aatagatatt tctcaaaaga agacatacaa atggccaata ggatattttt  47760
taaatgttac tagtcatcaa ggaaatgcaa atcaaaatga caatgaacta tcaccttaca  47820
cttgttagaa tggttactag caaaaaaaga caagggataa caaggttggc aatgatgtag  47880
agaaaaggga atccttgtac attgttggag ggaatgtaaa ttagtatagt cactatggaa  47940
aactgcatgg aggagcttca aaaaactgaa aataagccta ccatgtgatc ctaatactgg  48000
gtatatatcc aaaggattgg aaatcaatat gttgaagaga tatctgcatt cccatgttcg  48060
ctgcagcctt attcacaatt gccaagtatg aaattggctt gagtgtccat caacagatga  48120
atggctatag aaaacatata cacagtggaa tactattcag ccttaaaaaa gaaggcaatc  48180
ctgtcatttg caacaacatg atgaacctgt aggacattgt gctgagtaaa ataagcctgt  48240
cacagaaaga caaatactgt ataatctcat atgcagaatc ttcaaaaagt tgaacttata  48300
aaggtagaga gtagagtgat gtttaccaga gggtggggtg gagaggggtg gggtacaggg  48360
aatgggagaa tgttggtcaa agagtacaaa gttttagtta gacatgacaa ataagttttc  48420
aatgctattg cacagtgtgg tgaccataat taacaataat gtcttttata tctcaaaatt  48480
gctgaaagaa taggccttaa atgttttcag tatagaaaag tatatgagat gatgcctaat  48540
ttaattagct tgatataatc attccacaat gtatacatat atgaaaacat cacattgtat  48600
cccataaata tatacaatta ttatttgtta attacaagta aaagtttaaa aaatggcaag  48660
taaatcatgt agcccctgag atagatggat atgtgagcct agcttgaaac aaatgtcatc  48720
atatatccac cattacacaa gactttgagc agactgaatg ctcacagaac atattgggag  48780
gagatatttg gcagctgaag tggcaaatag tcattttcca agggaacaac aacagtagag  48840
aggtttccag ttaaagttgc agagtttctg cagagtctct agcagtgctg gatccaaggg  48900
tatgcggtgt atccaagtag ctcttgagga aaccacaggc acatcctggc atggggagca  48960
cctcaggagc acatcctgag tttcagggca tttgaaatgg atgtgcagtc acatcccacc  49020
caactgcaag ggatacccag cctacatgca gaggtcagga aagctgccca cattaagaca  49080
ttgcatgcaa taggcccctc cccactagga gtctatggag acagaaatgc attttgagga  49140
gcaatttcat gcagtcatgg gttaagtgaa ccaagtgagc tatgaagcca gattttccct  49200
cctgggccac atatttcaga ggcacataac tcaagcttgc aacacgtatt caaaagagac  49260
cagctacact tggtagagac agccatagga aagtgaaatg accctagggt ttagtaaagc  49320
cagctgtttc cacttctgaa aataataaaa tgaaataata aaataaattt aaaatgatac  49380
aaagttcaaa gtttaacaaa tacatttgaa gccatttgca acaaatacat ctgaagctaa  49440
ttgctggctc tagaaagtgt ggggtctttg ttgtggagca gtgttaatga tttagcatta  49500
cttatctctg gcaaatggta tttttgagat aacatgttat ggaagaaagt gaactgaact  49560
tggaagtttg aagatctcga ttgaagtatc atttctgcct caactacttg cattaacttg  49620
tacaagtcat tcaaccgctc tgaacataat ggaaaaatgg gatgagaata catgttgtat  49680
actctccaaa gacagggaga ctgctgatat aagagggcac ttttagtaac tgatggagca  49740
aaatgttgtt atatgagtgt cagcataggg ccctgggctt acaacggtgc catgagcctt  49800
agaacagagg aaggacagct atagcaatga aaggactagt gcagattcag aaaaataaga  49860
agacagaaac caaggtgtag taacatgttt tagtatggag gggaaggcag ttatagaaac  49920
ttgaattaca taatttgtac atttctggga gatagaaggt aaagatagca gctaatggag  49980
acaggacagg actggtactt gattatggaa gaaaggaggt aaatagaaga gacaaaaagg  50040
gagagaagag atgtcaactg cctactctgg tagcctctgt atccaaaagg ttgactcaaa  50100
cattcgctca taactttgtc tggcttaatc ctgctcatcc cagcagactt atttcaagtg  50160
tctccacgtt ttgggaagtc atcactcact tctctgggct ttcatatggg agagcattta  50220
attctgttga aaaactattt aatactacat ctacctttct ctatggactc tgagcttctt  50280
gagggcatgt atcatgtatg ttctattctg aagcacccat acctagaaca aagcttagca  50340
catagtagga acttaataaa tatttcggag ttgaataact agccttatgt aatcctcaca  50400
acaaccctaa gctggagact caaacaaggc tggaaataag taggtgccaa gaagaactga  50460
gattcagaca catatttgca ggtaaaacat aggaacactg aacattcact gagaactgac  50520
aacttgtggg gttgttgtag gatatgtgac cagagactct tgaatgccag tctctgtacc  50580
tgtaccatgt tggctaacaa gaatcgcatg gaatccttgc tgaaaataca gaccctagaa  50640
gttttctcaa atctggagag actgtactat ggtttgaata tggtttgtcg ccaccagaac  50700
tcatgttgag gcttggtcct caatgcagct gtgttgggag gtgggaccta gagggaagtg  50760
tttgggtcca gtgggcagat ccctcatgaa cagataaata ttgtcttgtg ggagtggatg  50820
acttctgtct tgcaggactg gatgaattac cacaagaatg agttgttgtg aagcttctcc  50880
tcatgttttg ctgtgtttgc acgctgtctc ttgacatttt tcttctttgc tatgttgtaa  50940
ggcagcacat aaccctctgc aagctgagca gatgccagtg ccatgctctt ggattttcta  51000
gccactagag ttgtgagcca aataacattt tttttcttta taaattaccc agatcaggta  51060
ttctgttaga gcaacactaa agggactaag acactcttat tctcaccaaa tctttatttt  51120
ggtaatgatt tctcacacct attcatttgc tccagaaaag gtagttattc tccatagtct  51180
atcttcatct tccacttcat gcttattcaa tccattacca attcctgtca atatatcttc  51240
ctaaatatct ctttcaacca ccaacttttc tatcctcact attactatcc ttttacaagc  51300
acatagacca ctgccaggaa cccttgactt gccgacctga ctctatacta gttcttcttc  51360
ctactgcagc cggagcaatc tttttaatca aagctatgac tcaacattta ctctcttgat  51420
gaaatctcct agaagacctt ttgtagctct tagaacaaag actgaaataa aaactctata  51480
ctatagtcta aaagttcctt gttggtctca cctctccagc ttcctccctc tgtgctccaa  51540
ccacatgggc ttgccttcaa tgcttcacat atcacccagc ttcaaattcc cttctggctg  51600
cagggccttg gcacaaactg ttttctctgc ctgatgtttt ccacccttcc acctacattc  51660
atcagtttga cttctactta tcttttggag ctcagctcag acaaggttag atcctgccat  51720
tgacatactc attagcaccc tgaaatattt cttaatcaca gcgtatgatt atatatttat  51780
ttgtgtgatt aactgataaa tgactgtctg acccctcctc cctgctttaa gactataagt  51840
tgtattaatt cagggcctat gttagcttta ctcagtactc tgtacccaat gcccacccca  51900
gcatcctcac aagtaagggt gttcagtaca tgggtgttga atagatgcat gaataataca  51960
ataagtcaac aattggtctc aggaatctca ataattttaa tgctatcaaa gtgatttgat  52020
gcagatttgg gaaaaattat ctaaaaaatt catcccaagc taagatccta tgattcttag  52080
ctatcacaga atctgtgatt ctgtgctact cctctgcgct tctcatgtac acttacatgg  52140
gtatacccat gaaaaatgtt tgttggtttg tttgtttgtt ttgagacaga gtttaactct  52200
tgttgtccag gctggagtgc aatggtgcaa tctcggctca ctgcaaactc cacctcctgg  52260
cctcaaggga ctctcctgcc ccagcctcca gagtagctga gattacaggc gcatgtcact  52320
acactcagct aatttttata tttttagtag agacagagtt tcaccatgtt ggccaggttg  52380
gtgtcaaact cctgatctca ggtgatctac tgcctgagcc tcccaaagtg ctgggattac  52440
aggcgtgagc caccgtgccc agccgaaaaa tgttttaaag catctaggat ccttggcagg  52500
cctttagcac actgcacaga agggacattc tgtgcctgtc actggaatga ccagcaactc  52560
tggttccctg ctttgcccag actgtttcta tgtccccttc agtttagttc agttcaacaa  52620
ttatctagtg agcactttct ctgagcgggg catctgcttt gtgctaagtg taagccctgc  52680
ctccaagaac tcattgcata aggagagaca cacacatgaa aaccaactaa ttgtgattca  52740
gtgtaaaata cgtagtaatt gacaaatgca tatagtttca tgacagccct gtagaaggag  52800
taggcaagtg ttctagtatg gcttcaagga ggaaatgtag cttaaaacag gttcggaggg  52860
atgagtaaga gtttaccata cttttaaggg ggttgggagg aatatattga aatgaaaatt  52920
acattttgca aatgcagtat gaggagccgt ggtacagttt aatgtgttta gagaacaacg  52980
agtaactgta tggcagaagc agtaaatatg acgaaggagg aagctggtgt gtttggagaa  53040
ggctgaggga tcatgaggca tattaccttc ctttaaaagc catgccctat tctccctctc  53100
ctgccacttc aaattcaggt tcaccattta tatgtctatt agtcctggtg tctttctcat  53160
gctctttgat tagtccttaa tccacaagcg caacattgca atacttgcct agcatatttc  53220
acaggcaggg gacctaatgt ccctgtgaga acccatcttg ctgagattgt cgctggcaga  53280
tttacttcca gtgtgattgt tgcaagaatt tgtctaacag aatgaatgat caaccttgag  53340
cagaagagat tatgaaaaac ttaatagcat tgtagcaatg tggctgttaa tgaaatacag  53400
ttggctgctc ccgctgtttg gcaccaacca acctgacact gtcaacatca caatacgata  53460
tttattccca attattttac ggcaacaact gaaatacaat gtgttattaa tcatatttat  53520
tataagtatc aatttgagaa atttctgaca tgccagaaga taaataggtt tattatgaaa  53580
agcagttctg cttggtgcat gctggctgct gctgtgtaat aaatagcctc tgtggggaaa  53640
gttttttaaa agaaataaag caaaaaaata gcactgaaaa cagaaaggaa gcatcaaaac  53700
tcttcaaata cctgctgtgt ccattggtca agcacattca ggacatcgca tgcctttaga  53760
actccagcag gttccaacag ctagtaggac attctagact ctgagagaga gcaagggagg  53820
ttttatgact ggggacaaag aaaagagaca ctgaaggcga aggacaatct ctgaaaatgc  53880
agtaccctcc agactgctcc tcctctcaca aaaacacctt cccagcatgc actgctttag  53940
ggactatgat tataccattg attctgtcca gaaaacctgt gtcctgaata tattacaggg  54000
ctcattcctt cacttctttc aggtgcctac tcaggtattt ccttatcaga acagtctttc  54060
gaacgacccc attaaaaaaa tagtcctgtc aaccctatgt taacaatttt atttattttt  54120
attatttgtt aacaatacat aataggtgca tatattttgg gggtacatat aataatttga  54180
tacattcata ttgtgcataa agattgaatc ggagtaattg ggatatccat tgccttaagt  54240
gttttacctt ttctttatgc tgtggacatt caaattactt tctaactttt tgaaatatac  54300
aatagaagaa tgttaactat aatcacccta ttgatctatc aaatgctaga tcttatttct  54360
tctaactata tattgtacct attaatctgt aattccacaa ctatatttac ttcttatact  54420
tttccccttc taggctataa accaaatgag agctgagcat ctgtttggtt cactgcccaa  54480
cacatgcatg cctactacat ggcagtcaaa atatttgtgg aataaatgaa tgaatgaaaa  54540
aaaaaagaaa tagatgaatg aatcatggat gaatgaatca aatcagtcag caatgtcttt  54600
ctaaacaaaa tttggatgat tttggatgat tacgcctctt aaaaatattt cttcatttcc  54660
taccccaatt tagtttctac tcaggacttt ttcaatatct tccaaaccta ttgttctttt  54720
ttatttgttt gctttttgag gcaaggtctt gctctgttgc cagggctaga gtgcagtggt  54780
gtgatcacag ctcactaaag cctccaactc ttgggttcaa gtgattctcc acctcagcct  54840
cccaaatagc tgggatgaaa gtgtacacca caatgcccgg agaattattt catttcttct  54900
ttgtagagat tgagtcttac tctgttgacc aggttgcttt cgaactcctg gcctcaagcc  54960
atccttccac ctcagccttc ccaagtgcta ggattacagg cgcgagccaa cttgcccagc  55020
cctggaattt ttgagcctgt tcaattctaa ctattgtcac caaaagtaac cttaagaaaa  55080
aaaatgcatt atctccttgc ttcattgcac cattaaaatc tttcctaaat tttccatgtt  55140
aaagatgaag ctcaaaatcc tcagcatagc atacaaaaca cttcataatc agatgcctct  55200
tcaaatacct cctatcagaa tggtctcttt gactacccct ttaaaaaaat tccccccaac  55260
cctattttta aattatttac ttatttttat tatatttttg atacataata gatggacaca  55320
ttcaaacagt gcccccaaaa ctggggcagc agaaacaggt ccttgcttat tttctcagct  55380
tcacctcctg cctccacccc atctgtactg ctggtccaga cattcctaca gaggtgtcct  55440
cctaagttgg tctcttcctc tcctgcttca gaggctttgc cctgctcttc tctgcctctt  55500
gaggctctgt cctgctcttc tctgcgtctt gtggttggaa tgcctgtctt tttcctactg  55560
aagatctgga tgcctaaacc ataatgtaaa attgctgctt tttacttcca tttacagcag  55620
agaaattcct cctctggcct ctcctcttct ctgtgtttct ttcttcataa tttttattta  55680
tttatatatt tatttattta tttatttatt tatttatttt cattgagatg gagtctcgtt  55740
ctgtcgccca ggctagagtg cagtggtgtg atctcagctc actgcaatct ccaccttcca  55800
ggttcaagcg aacctcttgc ttcagcctcc ctcctgtagc tgggactaca ggtgcccgcc  55860
accacccctg gctagttttc atatttttag tagagacagg gtttcaccat gttggccagg  55920
ctattctcaa actcctgatc tcaagtgatc tgcccacctt ggcctcccaa agtgctggga  55980
ttacaggcgt gagtcaccgc acccagcctc tctctttata attttcctac tgttcacctg  56040
catcaaactc ctgaattctg tcatgcaact ggaacagtaa gagggaaaaa catggagctc  56100
aaagaaagat gttgagaaac gtagagttgc atagaattta ctgtataaga atggaatctg  56160
tcaagtcaga caagcgacag agacctattt acaaagagac ccagtgaaaa ttactggaga  56220
aataataaag agaaatgctg tgactttgaa ataaataatg ttcaaaagtc acctgcaata  56280
tttaggatag tgtctgaaac agatacaaat atttctcagc agtaaaagaa ttttgtattt  56340
agtctagtca tggaatagta gtcagttgtc actgaggaag cactttgggg tagaagaagc  56400
atttgaatgt gtttgaagtc tgaggcagca ggtgaggttt gattttatat ttttgaaaat  56460
ggatctatca gatggtggag ctaccctcat aaaagatttg taatacgcct gtttacctac  56520
aagattaaat caagtgtcat ttcttcaggg aagattgccc ttcaccatgt gaaatataca  56580
taaagtatat gtcacaatgt gtgacagttc tttgctcaca tatatatttc tccacttaaa  56640
ggagaatttt ttttgagata tgatcttgtt ctgttatcca ggatggggtg caatggggca  56700
atcacggctc attgcagcct tcacctcctg ggttcaagtg gtcctcccac atcagcctcc  56760
tgagtagctg agactacaag tgtgcactat caagcctggc taatgtttaa tttttagtag  56820
agacaaggtc ttgctacatt tcccaggctg gtcttgaatt cctggcctca agtgatcctc  56880
ccaccttagc ccagaaggag tcttatttca ttcatcgtat attcttagta tctacctgtc  56940
atcaggccta tagtagatac tcagtagatg tagattgagg tttgaagaat aagagatagc  57000
tcaccaagta gaacactgga tggtattgga actaatgtat tcctttattg tcagcagaat  57060
ggaccatgca catagaaata ataaaatggg agaattgatt gccatggtct aaattttgtg  57120
ccccctacaa ttcatatgtt gagaccctga cccccaaggt gccggtacta agaagtgggg  57180
cctttgggca gtgataaggt tgtgagggtg gagccctcac aaatgggatt tatgccctca  57240
taaaagaaac tgcagagaac tagttaaacc cttctactat ctgaggacat ggcaagaagc  57300
tgctgttctc tgaacctgga tagaggacct cactagacgc tgaccagcgc tttcatcttg  57360
gatttcccag gctccaaaac tgtgagaaat aagtttctgt tgtttataag ctaccaggtt  57420
taaggtattt tgtacagcaa cccaaagagt ctgagaccat aatgaagcca ttggaatggt  57480
gggaaggcaa cttcatgtga gtaactacag taaagccagg tgctggtaac agtcatgttg  57540
cccatagagc agatcctact attacagtgc ctagcacatt acctgcatat gatgatatgt  57600
gatcaattag ttaactgatt agtttatgaa tcagtctgcc aaaaactagg gcagaaattg  57660
atagcacatt aaaataaata tgccttaaag tttgcaagga gaccctatta actgcgcact  57720
gttttctttt tattttcttt ttttttcttt tgagacaggg tctcactctg tcacccaggc  57780
tggagtgcaa tggcacagtc ttggctcatt gcaacctcca cttcccgggt tcaagcgatt  57840
cttgtgcctc agcctcccaa gtagttggga atacaggtgt gcaccaccac acctggctaa  57900
tttttatatt tttagtagat agggggtttc ccatattagc cagcctggtc ctgaactcct  57960
ggcctcaagt gatctacctg ccttggcctc tcaaagtgct gggattacag gcgtgagcca  58020
ctgcacctgg ctagccactc actgttttca tgttaggcta agtaagcttt tttgaagacc  58080
attaacataa atatacaacc taaatgtatt ttacctgaat aattttactc atgtccacag  58140
cttgttcttt cataggctgc catgatgagg aagaacagag attagtagta gcactattca  58200
tttctgatat ttttgcagta gtggttctaa ttctcactcc agtttagaaa agatctgtag  58260
gaaatcacag gtctacattt cgtcctctaa actactctgt tgggtagaat ttattttgca  58320
aagacttatg taggatcact tttttactac aggttttgtc atatgggatt tttacaacct  58380
ttttttctgc tgaaacaaat ggcttttaat ccttaaaagg gcagggctat attttccttc  58440
aaacattttt aaaataactt aagagaatta atttttagta atagcaagtg aagaacattt  58500
taatcctaga gcttaagaaa ggggaggccc aataaccaga tgctggaaat ctattgaggt  58560
tttttttaaa ttccagtatc cagacaattg gcatgaaaat aaaggagcct agaaaaaatg  58620
ttgaaaatga aaacaataaa agtgacaact aaacatatta ttttgtattt gcaaagcact  58680
tccacaaatg gccacaaatg tcatctcttt aaattttatt cctgagttga gtaggaaata  58740
aaccatttgg agattcaagg tttagcttaa gatatgggtg tttcttgaac ctgggaggtg  58800
gaggtttcag tgagctgaga tcatgccact gcactccagc ctagatgaca gagcgagagt  58860
ttgtctcaaa aaaaaaaaaa aaaaaaaaaa aagatatgga tgttgtcaat acaatcgggg  58920
gaaaggaata ctttgaacta ctttgttgga aggagtttga aatcgttgag gactcagcag  58980
catgaagtag agaaattcac aattggtaga aaggactatt gtccttcaac cttcattaag  59040
gttaactatt caaccttcat taaaaacaga aagtgacaat ttcacagcaa attctagaac  59100
tttagatcaa aagtcaactc aatatggggg atttatataa gaaagagtta aaaaaaagac  59160
gaaatgtaat atctatgtta ttgcaagtga aaggaaaaca ggaagataaa tatcacaaga  59220
agacaaaaat gtatctaaca ttttgggaca agattgtggg atccacagaa aattggaact  59280
tggaacttcc tgttccacag agataagaaa tacacttgct tttatctcac ttctcaaaaa  59340
aagtaagatg aatggggttt taggccccag agagaaattg tagctgcaat caattgtact  59400
atctgagtaa aaattgtcct cagaggaaag tgagtaggga gctgtctgaa gggacaggtt  59460
attaacaaaa gagagggata atggattgcg tttgcaagtg cagttggggc taacatcaat  59520
gccatcttca tagctggttc aaaaaaatat tctggattct tttagtgtct tggttcttac  59580
ctgttgtggt tgcagaaggt ataaatgtac ccttaaaaga gattagggag agaagtgcct  59640
cccacagcac cacgaccaga aagggaagag gaaggacagg caatagccaa ggactcctgg  59700
cagtgaactc atgtccacat caagatctaa tgagcttgca ctcaactcat ttctagctct  59760
gccttggaag ctggagctcc tgcactgact atcaatgtga gcccctgagt aggagcagct  59820
tggtagagtt gaaagaccat tgatctgggt caacagactc tggttcctgt ctcagcagtg  59880
ctgtaatcaa tccaagtcaa atatcatctc tgggacttaa tttgctaaat ttaaaatgaa  59940
aagaaaaaca aaaatagaac aattagacta gatcaggatt cggcaaacca aagcctgctt  60000
atcaaatctg gcataccacc tgtttctgtc tatacaattg tattgaaact cagccacact  60060
cattcatttg catattgtcc atgaaagaag cttttgcgct gcctcaggag atctgagtag  60120
tggccacaga gatgttgcag tggaccatgt tgcaacattg tccaaaatac ctaaaatatt  60180
tacttcttgt tttggagagt ttgctgactg gcaccagaga aatctatggt ctaaaatcat  60240
ctaaaaattt aagcacatat gtgtgaccac acatttcgaa atgccgtctt cccaatctag  60300
aacacagcac atgaatcagt aggtaaacct atccatgtca attctcaaat ttgaaattca  60360
ttcacttgaa aatccagcaa tttttcatgc ttcatatcat atctgggttt ggaataaaga  60420
agtgtgaggg gagaaaaatt ccctgagcat tttaaatcta atttcacctt tattatgaga  60480
ctactgagtc ttttcttgag caaaggagag agtgtgaaat agaataaggt gctcaaaaca  60540
atagattaaa tttattgaaa ggatgagtaa ttggagtaat gttacagaat attaagcaga  60600
ttatttagat agcatataca tttccagttt gattaagtca attcacaggc catcaaaaag  60660
tacacagaaa aatagagggt ttgatccgat agccttctgc gttagaatgt agtcatttgc  60720
tctctttagc tatttaatct cttctgcatg ttcagaggga gaaaatgagt gatgagagag  60780
agaagtaata agatcatact gcaaatcctt acatcgataa gataacagaa ggcttttcac  60840
actggctaat atttcatgtt gtatttacag ctcttgtcca tgtacagatt tggggtcatt  60900
aacagaggtg ttgatcagca aagtcttaga gtgagtctag ggaaatggtt gccaaatata  60960
tctgggtatt ggaaccatca acagagcctg tgccccagac ttactgaatc atggtctctg  61020
gtggtggatc ccaggtagtc acagctttaa ctgagtgatt aggagattca ctgtgcagcc  61080
agttcgggaa ccaccagtga aatccaaccc cttcatttat tagtgttgga accgtaactt  61140
tctgaagatg taccactgtc ccagccactt cacctgtatt cccagctcat ttctctcaga  61200
gaaaactgcc aagtccccac agtggccttg catgggccat ttgtgatgtc acctctctga  61260
cctcatctcc tactttcctt cacccggttg tgtctagcta ttgccatgct ctttctccaa  61320
cacaccaagc acactcctgc atcagaggct gtgaattttc catttcctgc tttgttcctc  61380
cccaatattt gcatgaacca ctttcccact taatctaatt ttctgttcag aagtcacttt  61440
cacagaaaag tcttcctcag ccacatgtat tttcttcttg gtgcttatta tcacctgaca  61500
ttttatatat ctatgtttgt ttcttgtttg tttcctactc cattcggtaa gctctaattg  61560
agaacagaaa agctctgttt attcactgtt gtatccccaa catctatatc tagcacatca  61620
ttgattctca acaactattt gtaaatgaat gaataaatgg ctctgctaga tttttgtcac  61680
ctggattgcc agaccagtgc aataatggaa agctaagtaa tgtaaagagc tttgcaatca  61740
gacagctctg gcttgcattc ttcatgtgtg attttgagca agttactgat tcttgctgag  61800
catcagtttt ctatgtgtaa agtggaggca tggacactgg aggatcatgg tgagaatttc  61860
atagagcagg ccaataagac ctccttgggg aaagaaggct aaagtgggcc tcgggtttag  61920
gtttccccca ctgggagttc caaggggcta tggagttgat aggattcccc atttgggctg  61980
cagaggagcc agaaacatgc tttagtttct taatcctgaa ggagtggggg attgtgtaag  62040
cctcattggt gcccttttga accacatttc atcaagatat tgtgaaatgg ggagcagcag  62100
gcagccttct ctggccaaca tgtatcaggg cctcgtgctt agtgggatgt gcccagagta  62160
gacagggaat ccctggcagc cttgcatagt ccctctcatg cctttgcttt catggggctg  62220
gctggaaaca ggccggtaag ccccatggaa ctaccgggac aaattaccaa gcaatctccc  62280
atggccatgt agaacagcca tgtagaacag gatgtctccc aaggtaagat ttaaggtttg  62340
tggtttgcag aaaagagaag ggaggaaata aaaaagcact gacaatcatt gaaagcccac  62400
gttctaggta actggctact cactttcaca gcccagtaac aattttgctt aatcctatac  62460
atctataaat aggattattg tcttcatttt ccagataagg aaacaagact tggcaaatgt  62520
gtagtgtagt gtttgacagt attatgtagt tgtttagcat gcacatgaac ttgcaagacc  62580
ttgctcttcc ctaataattc tgtcctttac taattctgtg atcttacaag ctgtgcctta  62640
tgtattttgt gttctatttt gtaaaaccta atgacaacaa cataataata ccttctcata  62700
gaacaattat tgtgataaat taagctgttg agagtcaggc actcaaccca acaacatgcc  62760
cataatgtgt actcaataaa tgcttgctag tatttttaat aatattgtta ataaaataac  62820
ccagccagag gtagaaccca agattccgac tctagttgac ctgattctaa gccaactctt  62880
ctacagcaac acatcggccc attgatttag acagcatgga actcatagcc cagggaattc  62940
acactcttaa agaacttaaa cagcacagct taatatggtc ccttccaaac atacgactca  63000
g                                                                  63001
<210>2
<211>97335
<212>DNA
<213>Homo sapiens
<400>2
aaatgaatta attttacaga cattacactg agttaaagaa gacagacaca atgaggacct     60
attatatgaa gttctacaac aagcaaagtg aatctgtggt ctatggtgat agaaggaaaa    120
aagggattac ttttttgtgg ttgcagaaaa acttactgga tagggccatg agagaactat    180
ctggagtgat ggacgtattc tatatcttga tccatatgtg gttacatgat tatatatatt    240
tgccaaaatg tattgaacta aattattagg ggaaaaattc agggtacata aatgctttct    300
taaatatata gggtcaagat aagaaactct ggataagaat ccaagttttc taatatcagg    360
tcatatactc ttgtcttgaa gccataggtc ttcggcctaa agctactaga gaatccgggt    420
tgctgacccc tagacaaatg ccatgactct agtagccagt gtaacccttt tccctttgaa    480
gttgtagcta ataaagtcta gagttcaaag tcatgtcctg catgggcaaa gtgaatgttc    540
tagaataaga gaaactatgc tgagaatgaa agagtttttt tgagacaata gaataatttt    600
aggtcctgaa ccatgtgaga aaagtgttct aagaaaagct ctcaagatct agaatgaggc    660
agataaccaa gacagcttga aataaaccct gtaaatggac tggggtagct tatcaggatt    720
tagagtcatt ctaatgacac ttttgacaac agtgtccaca tgattgatgc tataaaactg    780
ataacggaag gcgatgccct tacaggaatg gcattttggc aaaactcaat atcttctcac    840
agttcatttt ttataagatt ctattcatgg actgcatact tatacaatct cattagtctg     900
ccattaatca tttctatgtc tgtattctgt agttttcaag acttgagttt gcatacatga     960
aaacaatatg ctccattcat ataacatttt ggtttacaag gcatttggga tctgaatcat    1020
gagacattca ggagaggaga ggtgatgact tctgtaccta tctgtaggtc gttgggtgag    1080
ctaaagccat gatggagagt caggtcccat gaggtccatg ctcaaatgaa acctgaacaa    1140
ctaaaggaat gggaaaaaca gagatgctgg ctttgagggt gatgaatttg tgagcactca    1200
ggctctctga tgctgtgatt ttgttactcc tcgtgaatca gcttatgcat aataatgtca    1260
cacctctctt tagaatacat tagataatac atttagaata cattatacct ccacacaggt    1320
ataacgtatc ctggaagaca taaagtgtcc tcttaccttg tcctgaagta tttgccttat    1380
gcacagcatt ccaagccagg aagctcttgc taagtttaaa aatggatgga tatgggccgg    1440
gcgtggtggc taacgcctgt aatcccagca ctttgggagg ccgaagaggg cggatcatga    1500
ggtcaggaga ttgagaccat cctggctaac actgtgaaac cccgtctcta ctaaaaatac    1560
aaaacattag ccaggcgggc acctgtagtc ccagctactt gggaggctga ggcaggagaa    1620
caggagaatg gtgtgaactc gggaggcgga gcttgcagtg agccgagatc atgccactgc    1680
actccagcct gggcgacaga gcaagactcc gtctcaggaa aaaaaaaaaa aaaaaaaaat    1740
ggatggatat gaaggtggag gcagagttgg gttaaggaat cattacacat gaagtatcct    1800
agttaccaga aaaaggtcac tggactgaag caggaaactt cttgttttgg ttctttaagg    1860
tattctactc agcataacag ctcattctaa tactctgtat tagtttgcta agggtgtcat    1920
aacaacattc cacaaaccta gtggcttaaa caacagaaat gtattgtctt gtagttctgg    1980
aggccagaag tcacgatgtc gctggtgttg gctcctcctg agggctgtga gggaagggtc    2040
tattcctgat ctttctttct ggtttgtgga tgcccttttt cctgtgtctc ctcacaccat    2100
cttccctctg tacatgtctt atccaaattt cccctttgta taagaacact aatcatgttg    2160
gattaaggtc caccctaata atttcatttt aacttgacta ccactgtaca gactctatct    2220
ccaaatacgg tcacactctg gggcagtgaa ggttaggact acaacgtatt tgttttgggt    2280
gacacaattc aaccggtaac atatcctgat ccttggctcc ctcatctgca aaacaagtat    2340
atttacctta cactgttatt taaaaattga aaagcagcca atgtatttag aagaacttag    2400
taaactgaag attctacata agaacaaggc agtaaaaaca gtgagcgata acagcataga    2460
tatacataat aataagagct ctctcttact gagaacagcc atgtgcctgg cagttctaaa    2520
tgtattcact tatgaatcta tgagatctcc tatgaagatt gatggtagca ttatctctac    2580
tttccagatg aggaaactga aggacagcaa gtttgggcaa tttgctaacg acacagcttg    2640
taagtggtat ggccacttgt aagccactcc attagaagcc agagcctgta agcttaatca    2700
cgtcccctcc ccacatacag atactagtga gagaaccaac tttaaatttc cagaataaag    2760
attgtttcaa aaatagaaat agatattaag aaataaaaat agaaattatt tctatagaca    2820
gctaggtaaa tggaaaagca atagttaaaa tgtgaacata ttttaagtat gatatactgt    2880
agctaaagat aacatgcagt acttttaagt aatactgtat atagagaagt agatcgaaat    2940
aggtaaacta ttaacataaa ttttcctgta gtggaatccc aattaaagca ataatgtaga    3000
gcaataagaa gcaaaatctg cttggatcca aatcatttct gaactttgta actttggtcg    3060
tgttgctttc tgtgaatcag tttcttcatt taaaaaagtt gttatgagga tagaacatgc    3120
tagtatttat aaaatgctca taaattcttg gcacaaagta agctatagac tcaaaaatgg    3180
tgattccaga cctcaagaaa taagaacttg aatttcagag aaatcttccc ttattatccc    3240
tgaggtccac tccatagctt gatcaaagaa gtgggatact atgtagtaga ctagtgtggc    3300
agcaccttaa acccacaaat aagtttggct gttgtaaaga gaagggaaac caaaattatt    3360
tcaggaccta ctatgtgcag agtttttatc tgctatatac ataggcatat gctattccat    3420
cagtggttca gagggcataa acagttaata aagctatctc agggatgatt aaattgagag    3480
ttgctcaggg tcatacaatt tttgagtcag gaattaaacc cagggctatt tcattccaag    3540
gcccatgtta ctttctggta aaacaaataa ccatgaaata taatatattt tctttgaatc    3600
cctaatagtg ggtgctatta tacccccaat tacttaaatt gatcctgtac attgccaaga    3660
gattaaatta taaattattg agttcaaaaa gttaatttct tcctccaaag agatggcatc    3720
ttacagttta attactctga cagctttttt tttttatttt ttctcctagt gaattatcaa    3780
cagaaactac ctagagaaac ctgtaacttc agatcttctg attaattgat tttctttggg    3840
tgctgcttga cagtaacaga atggtccatg gggacagttt ttcagtgaat gttttcaaca    3900
atgataggaa cacagagcta agcagagtgt caagagacat ttagtgcagt agagacatct    3960
catctgtttt tctgcagaac ttgcataaaa ttagcatctg attattatca cctcagaatg    4020
aaccggaacc cgtaaagatg tctttgatcg taaaagtggg gaggagaccc tgatggaaga    4080
agagaagact tcagcctcac aatagaaaag actgtgttta tgcacctaaa tctaacttag    4140
acaccatcta attcaagaaa caggcacatt tagggaaata aagaaaagag gcagaaagag    4200
atgaagcacc ttggctgaat cagagaaatt aggggttaat gttccagact gatgacttga    4260
aggagggtgt gcattttcat gcaagggacc attctgtaga agaagcagca cattcaccct    4320
taaatgagca aagagaatcc caatcactct ccctctcacc ctcccctttt ccttcatttc    4380
tctagctctt tatttccaag aaggccagcc cttctcttca gccacatggt atttggacag    4440
cctaggctca atccctgcag ggaaagctca atcagccagc tgagccagtc actgaacaac    4500
caagtctggt aagaacaggg gtgaagtatt taagaagcct atcgtggctg gagggctaaa    4560
gccttgttct caaatcagct ttataggtaa taaaactgac attaaagcaa aaacaaataa    4620
gagtaataag gcttcttctg tgtgtttctt gggttttgtt tctcatttga ttccaaatgg    4680
ggagacaagg gtatatttat cctacccttc ccccagcctc aacaggttaa atgggttaat    4740
acatgaaaag catcaatcac agtgtctgga gcattatcag tatcagtaaa tgttaactat    4800
tactttgagg ctggcccatg tggctcctgg cattacaggc accagaggaa ttccagggag    4860
accaggagga ttatagtctg ggggagtatg gaggatgtgc tactgtgtgg caggtgcttt    4920
gcaaactgca ttaaaatagt cttgatattt tcagaatcta acgggatccc atatactatg    4980
attctgaaat tcacttgcgc ttctttagat tttgcatcta catgatgcat agtaacagtt    5040
cttaatttgg tttattccta gcttatctat ggttgtcatt atttcaagag cctagtaaag    5100
ttgaaatcaa ttttagaact acaaaaaaaa aaaaaaagga agagatgtga gtagggtctc    5160
actgtgttgc acgtaaatgc attgacatgg aagatttaaa acacctgatg agttttattc    5220
tgtttcttta ttctctatta aaggtagtac tgtgcaacat tccctaccct ctatttttga    5280
cactgacgtt gggcttattt tgattgtcta agaggtcctg tgctacaagc tggcagggct    5340
tgctgggatg aagtgacaag caaagatttg ctatatggta tagccagggg cagagacagg    5400
ttttctgggg gcatgagact tctacagtgg ggagacacta ttaagaaata gaatacaaaa    5460
ttatgactac aaaatgagag gccccaaagc ttatgtttca ttagcttcac agggagctca    5520
cttctgccca gagccaagga ctgtggacat gacctggtaa tggcatcaaa tgattccctt    5580
tattgcctcc cctggggcag aaatggtggc agcaaagcaa cttccaatca caactatctt    5640
ctttcatttg acacaggaag gggaagctcc ctctttaatc tctaatagaa acattaaaca    5700
gcaggccatc acaatttcta gctaaagagt tttcatagga cctttgcaaa ggttgcattc    5760
ctcccttccc ttgtggcagt atgcataatg taccttttag gaatataaat tcagtgtctt    5820
ggaacacatg atttagaatc agtgttcagt taccaactat caaataaaaa aataaatcca    5880
gcatatgact aacggaaaga agtcaatctg aaatggttac atattatatg attccaacta    5940
tatgacattt tgggaaaggc aagactatgg agacagtgaa aaggtcagtg gttgccaggg    6000
gttagaagga agggagagat gaatcgggga agcacagagg atttttaggg cagcaaaact    6060
gttctgtatg atactataat ggttgataca tgtcattgta catttgtcaa aacacatatg    6120
tcttggtcca tttaggctgc tctaagaaaa tatcttagac tgggtggctt ataaacaaca    6180
gcaattggtt tcttacagtt ctgaagtcca cgatgaaggc actggcagat tcagtgtctg    6240
gtgcaggcga tcctcttgct ttaacttcac tggtggaagg ggcaaagcag ctgtctaggg    6300
cttcttacat aaaggtatta atctcattca tgagggctct gccctcatga cctagtcacc    6360
tctaaaaggt cccacctctt aaaaccatca cactgggctt taggtttagt ggggatgaat    6420
tttgtgggga acccaaataa cagaccaaaa ttcactggga attgttttgg ggagacataa    6480
acattcagac cacagaagca cagcacatac aacaccaaga gtaaatgttt atgtaaactg    6540
cagattttta gtgatgtcac ggagaaaaac ttctcctcga ctctcttagg tttagtgctt    6600
gggaaccagt aaattaaact aactaaagac aagttaacaa gagaaaaagc acaagttttt    6660
attgatattt acatgcatag gagttcatgg aaaagaaatg aaattcaaag atgcaattag    6720
actcacaggg gttatatacc attttaacaa aggaaaggtt tggggcttca aatgatgcta    6780
aattgtgggg aagtgactag gaaagataca gggaaacaaa ggaaagataa gggttatttt    6840
actaaggtct gtttatgtaa acttgtctga ctctcaatct ccagtggtaa gagtggctct    6900
cctcttccca gttcaggaga gggagacacc ttcacaagag gaaatgtatg ccctgatttt    6960
aatctgataa gaagagggca gagaaccctt cctacatttg gttgttttca attgccttca    7020
gctcaaaatg gtccttacgt ggaagtgaca tatttttatg gtggtggtat attctgatct    7080
ctttcaataa taattgtgtg tcaatgagtc tcattgatta taatagatat accgctctgg    7140
tgcaggattt gatagtaaga gaggttgtac ttgcgtggag gcaggatgag taggtgaatg    7200
aactttctat attctccact caatttttgt ttgaatttaa tattgctcta aacataaaat    7260
ctgttcaata aataaagtaa aaaacaaaac aataaaataa agtaaaaaaa acaaatctag    7320
actgaggtaa gtagaagctt tattggaaaa gattattaca gagggggaag ggactccaac    7380
tataaaacag caagcttctc agagctcagg cagaaaaagg cttttctttt atacgaagga    7440
gagaacaagg ctagaaagaa ccagatgtaa gtaagtgagg tggcctgatt ggatagtaga    7500
tcagagaacg ttttaccctc aggccagccg cttcctggaa ggagccattg agaaggagct    7560
aaattctggc tcgacttaga atgcatcaga gttcaagagt ctggggaaaa gaaagaaccg    7620
taaccaaaat tttttcaggt caggttaata ggcattctgt tctaatagat cactggggac    7680
aataaattta gctaatcatt tatgaagcca agaacaggag tttggagcgt ctgtatctgg    7740
ctttgtcata ggtaaacaat gccggcaatc cttgagcctc atctaactca tatcgggaag    7800
ggtggtcctt tggaataagc tattctctga aacagtttag tctaagtaca atgtatttca    7860
ccagcaaata ccttgattgt gccttggaag gaaggggttg gtgatggtaa gtctggaaaa    7920
ggccagacaa agagagggag aattctggtc cctgaagaga catcccatat gctctcgggt    7980
gagattgtga gaaatgctgg aagaatgaag tggatgacta ccaagcccat cttatttcaa    8040
tgtacataga taatacttca ttttgcaaaa atgaaaagta tgggacaaat actaaatcag    8100
acagggcact gggataagag gcgcgaatta ggatatgtag tcatttactg tactaatttg    8160
catgaataga aatgcagaga gagctctata aaagaaaaat attttgtgta atctattagt    8220
atagaaactc gtaattaatt tactaagata taacgattta ttcgtcatgt taggcaacgt    8280
attttcaatg tcatcttatg gagaattgta aagattttct tgtatgttaa aggtctttgg    8340
tcaccatcat tattcacacg attgttattc acctggttat cattattcct catcattaag    8400
gacactagta atcttttaaa cctttctggc tctttctggg gaaaagggca ggcttaatac    8460
aggcattcct cattttagtt agcttcacta gcttcacttt attgtgcctc acagatacta    8520
tgtttttcac aaattgaagg tttgtggcaa ccctgcctca agcaaaccta tcagcaccat    8580
tcttccaaca acatgggctc atttcctgtt tccacgtcac atttgggtaa ttctgacaat    8640
atttcaaaat gtattattat tatagctgtt atgatagtca gtgagcagtg atctttgatg    8700
ttactcttgt acttgattgg ggaaccatga accacaacca tattaggcag caagcttaat    8760
tgataaatgt tatgtgtagt ctaaccgctc ctccaaatgg ccattccccc atctctttct    8820
ctctgctcag gcctccctat tccctgagac acaaaaatat ttaaattatg ctaattaata    8880
acccaacaat agcctctaag tgttcaaata acaagaagag tcccacgtct ctcactttaa    8940
atcaaaacct tggcataatt aaggttactg aggagggcat atagaaagct gagacagacc    9000
aaaagctaga cttcttatgc agaacagtta accatgttgt gaatgcaaaa gaaacgttct    9060
tgaaagaaat aaaaaataga agatgctacc ctctataatt ctatgaaggt tcagagaggt    9120
gaggaagctg caaaggagaa gttggaagct agcagaagtt ggttcatgag atttaaggaa    9180
ataagccacc tctataatat aaaagtacaa ggagaagcag caagtgctga tgtagaaggt    9240
gcagcaagtt atccagaaga tgtagctaag atcattgatg aaggtggcta cagtaagtaa    9300
cagattttta atgtagacca aacaacctta tgttgaaaga agacaccatc taggactttc    9360
atacctatag aggagaagtc aatgcctggc ttcaaagctt caaaagataa gctgactctc    9420
ttgttagggg ctattgtatc tggtggcttt aagtcaaagc caatgttcat ttaccattct    9480
gaaaatcaaa gagtccttca gaattatgct aaatctactc tgcctgtgct ctgtaagcag    9540
aacaaactgg atagcagcac gtctgtttat agcatggctt actcaatctt ttaagcccac    9600
tgttgaaaat taatgctcag aaaaataaga tttatttcaa aatattactg cttattgaca    9660
atgcacctag ttgcccaaga gctctgatgg agttgtacaa ggagattaat gttgttttca    9720
tgcctgctaa tacaacattc attccaaagc ctatggacca atgagcaatt tggaatttca    9780
aatcttatta tttaaaaaat acattttgta aggctatagt ttctatagat agtgattcct    9840
ctgacggatc tcagcaaagt acagaacaac atggctttga actgtgctgg tccacctata    9900
catagatttt tatctgcctc tgccacccct gagacagcaa ggcccacacc tcctcctcct    9960
cagtctactc aacgtgaaga tgatgaggat gaagaccttt atgatgatcc accccactta   10020
ataaatagta aatatatgtt ttcttcctta tgattttctt aatacatttt cttttctcta   10080
gcttacttta ttctaaaaat ccattatata atacatatga cataaaaaat atgttaattg    10140
acggtttatg ttatccataa ggcttctgtt ctacattagg ccattagttt agtttttggg    10200
aagtcaaagt tatatacaaa ttttcaactg tgcaggtggc ccaaatccct aactcccaca    10260
ttactcaagg gtccactgta agttgaaaac tcctggaaag gattcatcac tgtagatatt    10320
agggctttca tgattcatgg ggggaagtca aaatttcaat attaacaggg gtatgggaga    10380
agttgattcc aacccttatc gatgactttg aagggttcaa agatttagtg gtggaaggag    10440
ctgcagatgt ggtagaaata gcaagagagg cctggcgtgg tagctcacgc ctgtaatccc    10500
agcactttgg gaggccaacg tggtggatca caaggtcagg aaatcgagac catcttggtc    10560
aacatggtga aacctcatct ttactaaaat acaaaaaatt agccgggtat ggtgacgcat    10620
gcctataatc ccagctactt gggaggctga ggcaggggaa tcgcttgaaa ccaggaggtg    10680
gaggttgcag tgagctgaga tcacgccact gttctccagc ctggccacag agcaagactc    10740
catccaaaaa aaaaaaaaaa aagaagaaag taagaaagaa agagcaagag aactagaagt    10800
gggtcctgaa gatgtgactg aattgctaca atctcatggt aaaacttgaa tgaataagga    10860
gttgctttgt ctgaatcagc aaagaaagtg gttgcctgag atggaatcta cttctggtgc    10920
acaggctttg aacattgttg aaataaagac aaaggattta gaatattgta cataaactta    10980
attgataaag tggtagcaga gttcaagagg attgactcca aatttgaaag aagttttatt    11040
gtagataaaa cgttaaatag cagcacattc tacagagaaa cctttcagga aaggaagagt    11100
caatttatgt ggcaaacttc attgttgtca tattttcaga aattgccaca gacacaccag    11160
ctattagcaa ctaccaccct gttcagtcag cagccatcaa cactgaggca aaatcttcca    11220
ccagcaaaat gaatatgagt tgctgaagac tcagacatct ttagcatttt ttagcaataa    11280
agttttaact aagatagtac atttttaaga catatgctat tgcacatttt atacactaca    11340
gtatagggta aacataactt ttatatgtat tggaaacaaa aaaaatttat atgactcact    11400
ttattgtaat attggcttta ccgtggtgat ctggacacag aatccacagt atctctgagg    11460
aatgcctgta gtttgaatat gagtgatgca aagaaggatt tttagctatt gtagtatctc    11520
tggatgtatt tcccacaatc tttttgggtt atagttgctc ttgtatctgt tttgcctttc    11580
ccaatagtga ttgcacttag cagaatttgt gctaggaaac attgttattg ttattgatac    11640
aaaagtaatt ttctgtaaag aatagatcat tttgtctgat tcattatttt agtggctctc    11700
tgaaaagtat ttttcttcat ttcacttctg aaacagaatc tagaaaaaaa aaataccatc    11760
agctgagaca tttagaaaca tctgtacttt cacacaatgc atagacaaca aacccttaca    11820
gaattatttt taggaactct attgaaatta gatattttct aaaagtattt gctaaaagag    11880
aaatgcattt tagcttacat catattgttt aattttaaat ctatcatatt gtgacaataa    11940
caagaataaa aacaatttca ccctcagtgt aaaacttaca gattttgttg ccgagaaact    12000
tcaaaacata cctctgaata gtaagaagtg tagtaaaatt taaatgaaat gttgggccaa    12060
atatagaatg attgaaaaat cacccttgaa ttataaaaat ttgtgctcat cttgtgaata    12120
ctttaaatgt cttgctcatg gtaaggactt cgtgctatct ttgtacaatt aacatatagg    12180
gcaaatttca ataccaatga cagtagatgt aatttcacat atcaagtagt ttccctaata    12240
atttaggact tttttcactg acttcttgtc atatatgatt ctgtcattac ttttttatat    12300
agctcaaaat atggctgatg gagtgcttgt gcccttccat ggttttttca tttggtatca    12360
ctagtattat atttatttat tctttttttc caggacattt gcaagacatt cgtcaagttt    12420
tgaggtttat ttaaggtata actagataat gtattatgta aatcagccta accagcacgc    12480
ataaactaaa ccatgtcaca ggatgccaat agtgacagac ggagtgctga tgcctctgga    12540
aatctcttca cattgtggag tttctcctct tctcttggga tatcttctct attttctgtg    12600
acagatgcct atttgctaga tcaactgaga gcatcagtgc ctataggtaa tgaaatacaa    12660
ataaaactca atttgtgtta tggtctgaat gtttatattc ctccaaaatt catatgtcga    12720
aatccggtcc ccagtgtgtt ggtattaaga gtcgaggctt ttgggaagtg acagggtcat    12780
gagagtggag cacttgtgaa caggattagt ggtcttatga aagatggagc gtctgttttt    12840
cccttccccc atgggagtgg gaaaatacgg atagaagcca ctatccatgg ggaacaagcc    12900
tccaccaaaa actgaatctg ctggcacctt gatcttggac ttcccagcct ccagaacgct    12960
gaacaacaca tttctgttgt ttgtaaatta cctaatctaa gacagcagcc tgagtggact    13020
aggacaattg gtttcttttt tgtttaggta gcaataacta gaaacagaat ttctacagag    13080
gcaacacaca caaaaatagg tgtgatttta tcaaattaaa atacttctgc acagtaaaag    13140
aaacaattac caaagtggaa aaaaaataac ctatggggtg ggagaaaata tttgtaaacc    13200
atgtatatga taaagcgtta atatccaaaa tgtatgagaa attcctccaa gtcaatagca    13260
aacaaaccaa tagaaaacca gaagcaaaag aaaaaagaaa ataagttaac caatttgaaa    13320
aatagacaaa gaaactgaat agacatctct cgaaagaaga catacaaatg gtcaacagat    13380
atctgaaaaa gtgtggatat cactaatcag gaaaatgcaa gttaatatca caagatacca    13440
cctcacagct gttaggataa ctattagcaa aaaaaacaaa agcggcccct tgctttgtgt    13500
ctgccagaat ccattatggc tgccactata gttctccagg agtctggata gcagtcccgg    13560
ctgggaatgt ctggagtctg caggccccag tcactatgga cagtttttcc ttcagtattg    13620
gggttctaag aggcagaaat tagaaatagg aatgcagatg gttgcagagt gtggttgggg    13680
gttagagcgg cgccctggaa aaaaaaaaaa aaaaaagatg agtgttggaa atgatgtgca    13740
gaaaagggaa ccccagtata ttattagtgg aaatgtaaat tggtgcagcc tctatgaaat    13800
aatgtatatt tcaatacata ataatgtata ttccaaaatt gtttttatag agtagatttt    13860
agatgttctc accacaaata aatgataagt atgtgaaatg atgcatgtgt tagcctgttt    13920
taatcattcc acaatgtaca caagtataac atttacatta taccacataa atatatactc    13980
tatatatata ctatatatat atatactact gtttgtccat ttaagtaatt ttttacaaat    14040
aattgttcta aataataaga ttatcttata aaggagacag taggtttgtt ttgctccaga    14100
tggtagagtt aatccctgaa gctagaagat gcttagggtg aagtttgtgc tcaaaatatt    14160
tttctaaaaa tagagcagac tgcctcaaag gtgaggtatg ttgcagaaaa aagtcactgt    14220
aaggtatgtg tgggatgctg tttggggata atcagggact caggataggg aactaaggag    14280
tttaggttgt ctgctgtata gaggaaacta gaggagatag tttattcagc catcattaat    14340
tcattcattc agtaaacatt actgaacacc tgtgtgccag gtgctgtgat tgacactgga    14400
gatttaaagt tgaataatat ctagtcactg gggccctgat gtcaaggcac atgctctagt    14460
ggaagagagg cacacgtagc taagagtgtg tggaaagtgt tatgaggaaa gtatgttcag    14520
gatagtgtag aggctgagga agaggattcc catctcacct gctgcgggca aagaaaggtg    14580
gatggtattc attagggatt atcacaggag ggatcaactg aactaatcct taaaatataa    14640
tacagtagga gccagcccac aaaatgctaa tagaggcagt ggggagggtg gtggaaaaaa    14700
aaaataggta tgagtcaaag gagagaattc cagacagatg aaagctgtaa aaatagttta    14760
gttttactgt aaaaaggtca aagccagaag taaggggctg caaagtccat ttaagctgag    14820
aactttatta cagctcctgt tccaagccca tgctctgtgc gactgcagat gggatattct    14880
aataccactt gtggaaatca atctttttgg acaaagacca agagagaccc atgttgtgat    14940
tcactctcta tggcaaccca aaaggaaggg tgaatgcctg cagatgagag ttgcctcttc    15000
atgccagcca cttaataggc tatggaaaag ggaagagcag tccccatggt gggcctaata    15060
ggaatcataa tctaactgat tatcacagca gtgactcttt caaatctggc ctaactgaag    15120
ctagcaccac accaggatct ctgctgggca cacaccaatc acccaggagg tcagtatcat    15180
ccccatttta cagatttgaa agctgaggca caaggtaaat aacagttatg cagaagtctt    15240
gcttcagtgt ctaacttcct catctcactt tattctgttt ttcaatagga gaagagatat    15300
aatctcatga tgaaaagtgc catctaaagt ggcaccttag acacagtaag caaactggat    15360
tggaagtgaa gaagtcagtc tcaagatact tgacaatgtc tcctatttgt agattgttta    15420
gcaaaatgct ttcacctgag ttatttcatt tgttgctcac aaccaatctg tctggtagga    15480
aaggcagatg atatgttcac ctccagataa gaaaaatgaa attcagagag gccaaggggc    15540
ttgctcaaga ttccacagtg aagaatctac ttgcaggaat tttaacaaag gttttcaaat    15600
tcagaagtcc acaggatgac tgcccttgaa atccagtggt aacatataat aaggtgtctt    15660
tgagcaggta agagaggacc aaccttttct aaagcctttc tcctcttgct ctctgtgcgc    15720
caacctgagc agcctcctga gagattctgg aacatgctag aatttttctt gctttagggc    15780
cacagttcat gtcactcctt cttcctggaa tgttcttcac aagcactgtg tggctccttc    15840
ttatccttca aatatctgct gaaatgttcc cttcttagaa aggacttgct gaccaccctg    15900
atggaagtgc cctctccagc tcacctcttt actgactctg tttttattcc ttttgcaagc    15960
acattttata atctatatgt agtgtttaat gcaacagttt gctaaggact gaaatttgca    16020
ttcctccagc aatcaaaacc cactgcgatg gtttgtggag gtgggacttt tagggggtaa    16080
ttaggtttag atgaggttgt gagggtgggg cccctcataa tggaattagt gttcttataa    16140
gaagagacag agagaacgaa gctctctctc tttgtgtgtg tgtgtctctc tctctctaag    16200
acatgggagg acacaatgag aagacaactg tctacaagcc aggaaaaggg acgtcaccag    16260
gaaccgagcc tgctgacatc ttgatcttag actttccaac ctcccaaact gttagaaatc    16320
attatctgtt gtttaagcca cccagactgt gatattttgc catgatgcct gaactgacta    16380
atatacagtt tacctgtaca ttgtttgttc ctctagatta taagctctcc aaggcaggga    16440
ccatatagtt ctttaaaaga taatgtcatg gctataagtt tactgctatt tccccatcac    16500
atgggaaaaa gaattgtcag agttgtcagc cattagagtt tatttacctt aagggtgtct    16560
gacgaaatga tctgattatc tccttaactt cctaaatagc tcaaacttca taatgtttga    16620
atttggaaat atctgttgat tcaagagaga cagattacat ggtctctctt gaactttgga    16680
catctcttcc acaaacttcc aaatattagg ccatctatta ccagaccttc tgaacttaaa    16740
caaatcttac tttcaacccc actttagcca ccttcaccat ggcctaactt ttgcccttgt    16800
tatttgttat ccatagtttt ctaaacttag aatccttaat cactggcatt atagttgttt    16860
acttcaacct ccaacactta caggtccctc aaatcctcat ttattcaacc cttgtttttt    16920
gtcatcttat aaactgcaaa ttcttgaaaa tcacatgtcc tctctataaa tcagatccct    16980
tcatatcatg ttttcaatct gagtttggct ccatgattaa tcttccaaat caaaggttta    17040
caaactgtgg cctgtggaat aaatctggtc tgcacctgtt ttagtaaata aagttttact    17100
ggaacacagt catactcatc catttacata ttttttatat ccattttcat gttacaatgg    17160
cacaggtgac tagtggcaac agaatctgtg tggctcacaa agcctagaac attttctatc    17220
tgtcctttat agaaagaagt taccaacccc taatcaaaat caataatcta tgaagtagaa    17280
agtaaaagat gatcttttgg tgctgacatg aacatattat gattaaaaaa acactttatt    17340
gaggtttgat tagcatacag aagctgtaca taacacatac aacttgaagg gtttggtgat    17400
cagtatgcaa tcatgaaacc atcactatga tgaatgtcat aaacatatcc atcaccccca    17460
aaggtttcct ctgccttatt tatttatcta tttataagaa tacttaacat aagatttgct    17520
accctcttag caaatttagc aactctttga gtatgcaata taatatagtt aactatagac    17580
actatgctgc acatagattt ctaggactta tttaacttgc gtagcaaaaa ctttgttctc    17640
tttgcccaat acctccctgt ttccccctcc ttcatcccct ggtaaccatc attctactgt    17700
ctgcttctat gagtttgact gttttagatt tctcatatga gtgggatcat ttagtatttg    17760
tccttcgatg tctggcttat ttcacttagc ataatgttca ccaggtttat caatgttgtt    17820
gcaaatgaca agattccttt ttttattatt aaggctagat aatattccat tgcaaatata    17880
taccacattt tctttgtcta ttcatctgta gatgaacatt caggttgctt tcatgtcttg    17940
ggtattgcga gtaatgttgc aatggacata gaagaacagg tatctctttg acatactaat    18000
ttcatgcctt tgggtaaata cccagaagtg aaattactaa atcacatggt agttctattt    18060
tttggttttt gaggagcctc catacagttt tccataatgg ctgtactaat ttacattctc    18120
accaacagtg taaaaaggtt cctttttctc cacttcttca ccaacattta aatttcatct    18180
ttttgataat agccattctg acagatctga ggtgatattt aattgtggtt tcaatttgca    18240
tttccccaat gattagtgat agggatattg ggctttgtta ttaataaccc actggccatt    18300
tatgtgtctt cttttgagaa atatctgttc aagtcatttg actattttta atgtaatcac    18360
ttgttttctt attattgagt tgtttaattt ctctctgtat tttggatatt agagcccctt    18420
aacagatgta ttatttgcac atatttttct cttaacctat gggttgtctc tttattttgt    18480
aaattgtttc ctttgctgtg cgtaagcttt ttagtttgat gcaatacaat aactaataga    18540
ttaatggtct ctttttgttt ttgttgcctg tgcttttagg gtcatggtca aaaaaatctt    18600
tgtccagatc agtgtgtgga gctttcctct tacgtttttt atttctaata gttttatagt    18660
ttcagatctt atatttaagt cttcaaccca ctttgagttg attcttgtat atgggatgtg    18720
atgtgttcaa tttcattctt cttcatgagg acatccagtt ttttcaacac catttgttga    18780
gaattcaata aagttgcagt atataaaatc aacgtaaaaa atcagtaggt ttttcataca    18840
ctgacaatga actatctgga aaagaaatta agaaaataat cccattttaa taccatagca    18900
aaatacttag tggtaaattt aaccaagcaa gaatatggaa atatctatat tctaaaaact    18960
ataaaacatt gatcaaagaa attgaagatt acacaaataa atggaaatat gtctcatatc    19020
cataagttga aaaccgatat tgttgaaatg tccatactaa atgtgatcta aagagtccat    19080
gtgatttcta taaaaaatcc aacgtcatct tttatcgaaa ttgaaaaaaa aatgctaaaa    19140
tttatatgga accagagaag acctgaataa acaaagcaat cttgagccat aagaacaaag    19200
ttggaggcat cacactacct gatttcaaaa tatattgcaa aactatagta atcaaaatgg    19260
catagtactg gtgaacaaac agatacaaaa accaatggaa taggatagag agcccaggaa    19320
taaatccaca aattaaaaac caactgattt ttgacaaaga tgccaagaat ggggaaggga    19380
gagtttcttt cattatttat tctctgtatt cttttcatct caggaaaaat atccagtttc    19440
ctcaattgta tatccattca ctcacccgat aatttcttca ttcacttatt tgtttattca    19500
tttaatctca attgtttgtt cattctgtaa atattcagat ttctttttat gcattttctc    19560
agaattggaa gcataatact gaacaaaata actataaatc tcagcctccc actcccatat    19620
ttacagtttg attagggagg cacatttaga tatgcagtga taattgcttt gcttagagaa    19680
attcaaggtg atagaatgca tggtgacacc taacccagac tggtagagaa agggaattct    19740
tccactggga atgacatgat tatctaaata agtaggctca atcaggtcag gaaagggcct    19800
gaaagactat ttcaagcaga gggaaggtat ttgccaaggc cagggtgtgt agtggagaga    19860
atgggcagtg gcagagaatt atgaagtgtt ccaatgacta aaagtaaagt aacaagttcc    19920
ttgtccaaga gcttggattg tatcctaact gaaatgagta tacactaagt gtttgaagaa    19980
gagggatgaa atggtcaagt tttcattaca caaaaataac ctgttccttt cattttatgt    20040
ttatttattt ttttaatttt ctgactgctc ctttctggaa atctcaaatt tatatttgcc    20100
aaatattgtc acattttcga tggagaatac aaactaagaa tgggttaggg aactgagtca    20160
gaaagtccct gttgtacaat tcaatcatgt ttttctaagg atgtgctttt ggacattatg    20220
gaaactatct taggctctca cttggatcct agaaaagaag gcacctgtta aaaggaatgt    20280
ccagccccac ctaatttggc agctgcccct ccaagctaat gacattaggg atgtagtgga    20340
ttcaagaggc tgatgatgcc atctggtcaa ctcatgtgac tatttctatc agctttattt    20400
ctgcaacatc ctgtgcccac agaggggaca caaaatcgct ttataattcc ttcaccatgt    20460
gaagatacag atacacccag aaccttaaag gcaagaatat gattgaaatg tcaaatgggg    20520
acttggtgat ctaaattatg tcccccaaaa gccaatgtct tgccaccacc agtgccctat    20580
gggtggagtt tctaaacaga ttactcaaaa cacaaacttt caaaaaggga aagtcataac    20640
cctctagtca tcagggcaat tacggaataa cattgctgga gtaaggtttt ctcaatgccc  20700
aagagatgag ctggcaatgc cacaacaatg tccaattctt agtgggtcca agaccatgtg  20760
ttacatttcc ctcccatgat tactcacagc ttcacagttc tgctgtcctc ttcgcctctc  20820
tgccacctct taactgcacc tttgacctcc tacccctaag attcaaccct gtgagattac  20880
ttgtcttttc atctacactc tggtcactct gacccccatt ctttagattc aggattttct  20940
cttttcctgg cttactctcc agcacaagta gaaaaatatt gtgcttcatt ggaaaatgca  21000
tgttgtttga atcacactct ttcagattat acaattgtag tctttcatta tctttgagcc  21060
attttataat gctgtaaact aatattaatg catataattc ttgtctatag acatgtaaat  21120
tgtgtccagg ggtgatttaa ttgacttttc ttccccattg tggaaaaggc tagtagtttt  21180
gcctccattt gcccatttat ttctatattc ctgatctgta aatgcatttc tgggttttcc  21240
cttggactca ttctaacatc tcttcttttt cctcattaat taattaaatt aaatctttaa  21300
cacctcttca tatttttgtc agtatgagag tataaaaaaa aatctttttt tgaaaattat  21360
cttttaatag gtgacaaaaa gaataaacac tgaacaagaa gtcctgagct cctactacaa  21420
tccaaagtga actagttgca gtgccatagg atgatgtttc tcctgagact tctttactag  21480
gatcatttag actgttataa atgcagattc ctgggcctct ccttagaccc actgaatcag  21540
acactctaag aggagggtca gaaatctcca tcttagcaag ttaatgtcca ggagagttag  21600
agactcacta tgacgtatga taaaaagtag aaggaaggac tttccagcac cttaaactac  21660
ttggaaagat agattaatgt ctagatgaaa cttgatgaga ctttagacta atatgttaca  21720
tatacatcag gagatgcatg tataaaccaa atccaaataa cccaaagcaa aatttctttt  21780
agaaatagtg ataaataaat gagtgaggag tttgtcactc acatccccca ggtaaaacat  21840
acctttttag cctaaataaa tgctatagtt tgaatgtgtt ccctccaaaa ttcaggtact  21900
gatagttaac agcagccgat atgatggtat tacacaaaat agtaggttct ttaggaggtt  21960
gttaggccat gagtgcctcc cccaagaatg ggatgaagga cctcataaaa gaggcttctc  22020
acagcattgt gacctctagc cctcccacct tccataagtg aggacacagt gttcctcccc  22080
tctggaggat gcagcaacaa agtgtcatct tggaagcaga ggagccatca ccagacaaca  22140
gaaccagcca acagcttgat cctggacatc tcattttctc cagaactggg ataaaataaa  22200
ttcctgtttt ttaataaatt tcccaatttc aggtattttg tgatagcagc aaaaacagac  22260
taagacaact agtatgaaaa tatacattaa caaataaaat taatcataat atatgtttgc  22320
ttttaaaaga aaataaataa gccaatatgc tttctgttga ttgattgatt tactaaacat  22380
tgattggcca tctccactgg ggatatggca tttaagagat ctctttgatc ttagtacttt  22440
tactgctttt taaataggat caaatacacc caaggtaaaa aatagaacac actatacgtt  22500
acattttgga actgttagaa attcctttga agctaaaatt actgctatca tttgacaact  22560
tttaccccta aaataatgtg gtgctcacca gcttgcttaa gttacagcac ttgctgtctt  22620
ctcagataca atatcagaaa cttataatcc aagaaaaatc taaatggcaa gtgtgagtta  22680
atggaagcct cataaagcaa gaggtgtttt ggaagtgtat ggaagacatc aataaatgat  22740
atgtataaca tcaagtgcaa aagtgtgtgc taggaaagtt caaaaaagaa aaaaaatatg  22800
gtaaggtaag accagagatt ggggagtata tagcttttgg gaattcagga aatgctaacg  22860
tctatggaga atttgcatag gtgaaagatc agattggaag cctttctctg tggaagcatt  22920
gtggatctaa gtccagaagt gatcctgagc cacctactat ggaaaggtgt cagtgagcaa  22980
gagactgtct gacaaaggtg gaagctgagc agacttctac tgcgcatcgc ctatgtacag  23040
gccagattcc aagggctgat attacactgc tagtttgatc tttctcagat agctgggtag  23100
agagggaaaa gtttcacccc aaataccaga tgcctccaaa catctagatg cttggtgtta  23160
tgtatttcaa acagcaggtt tgataaagct gtttttactc tccagttgga tgttggttgt  23220
caaggctgtc attaacttct gggagttccc aaatcctcag agagagagaa ataagcagtt  23280
ctgcctgcaa tcagaagctg gctttgagcc ccacatggca acatgcctgt atttaattag  23340
aagtggctta gttcttggga tttactgtgg attgagtcta cgaagctgga aggttttatc  23400
ctgagtattc cactgtctcc tcatgtggat tttatcaaat ttctccttta accatataag  23460
cgctttcaaa gttgacatat cacacttagt tatgagggga acctagaagt atgattgtga  23520
cgtgcattgt tgagagacca tgctttgtaa gtgttaataa ttaaaattat tttgaacact  23580
aattatgctg aagactggat tttctactcc ttcagatgtt ttccagtgga catattttgc  23640
ccttttaata aattgattgc gaacttatct tcatttcacc tttatgatgt tatacctttt  23700
catttttgtc ttctcatagc tagggtctcc tggtccccaa atgtagacac acatcttaca  23760
ccaatcccag agccattttg tataagagcc accatggatt taaccagctt tagctccagt  23820
atttgaacat aatgttcagc atcatcacct ggccaccaaa tcaaaactga gcacccttta  23880
atccatcaac aagttctctg cagccatgca aggttatgaa atgggcacag acatcaatat  23940
acagtctttg tgtttaagag gttcatggtc tacctgagaa atgcatcttt aaacctaaag  24000
tagacgctct gtttattcca taaatgattt ttaagcatca atggtatatc aagcactgta  24060
ctggcttctg ggctataata aatatataaa gaccacaagt ttgaatttca tgacattgaa  24120
ctataatgtt taaatgttat aataatcata gtaaatgtcc ttgaggagct acggaagatt  24180
cctgcatgaa gcagaaacaa gaagctgaag aaaaaacaac tggctttggg ggctatataa  24240
atataaccct caaattaaaa actcaatagt ttgattgatt accaaatcaa tacagccaga  24300
aaataaatgt attaccccaa aagcttgagt gaagaaagac ttctgtaagt tactagaaag  24360
cgctaaggaa gaaataaaag aatgatattc ctgagagcca ggtgctttct gtaggacaca  24420
cagatacaga atgagggaaa acagaaaatt ctatggttgt ggattcaaaa tagaggcatc  24480
accatgtcta tctcatcagg gtttaaccag aggaaaccaa accagtaaga tatctgtatt  24540
aagagatttc ttgcaaagaa ttgacctatg tgattgtggg cactggctag gtaaatccta  24600
agtccacaga gcaggcagga agaaaacagg ctgggacttg taggcacagg atgaagctgc  24660
aatactcatg tggatgctgc tcttcttcag ggaagacttg gctctgctct caaggacttt  24720
caggtgatta aatcaggccc actcacatta tctaaaataa tctcccttac tcaaaaccaa  24780
gtgattatgg actttaatca catctataaa atatcattat agtaacacct aaattagtgt  24840
ttgaataact gagagttgta actgatatgg tttggctatg tccccaccca aatctcatct  24900
tgaattatag ttcttataat ccccatgtgt tgtgggagga accaggtgga gataattgaa  24960
tcataggggc agtttctccc attctgttct catgatagtg agttagttct caggagatct  25020
catggtttta taaagggctt ccctctttgc tccactttca ttctccttct tcctgctgcc  25080
atgtgaagaa ggacatgttt gcttcccctt ctgccatgat tgtaagtttc ctgcggcctc  25140
cccagccacg ctgaactgtg agtcaattaa atctcttttc tgtataaatt acccagtctt  25200
gggcagttct ttatagcagc atgagaatgg actaatacag taactttacc aagtggacac  25260
ataaaactga tcattacaat gtacagtgaa tatttggtga gttaatagat atattcataa  25320
ctgaatgaaa gaggatggtg attcctactt cagggtggta ttatgagagt taaaagggtt  25380
agcatagata gaacactttt ctatgattga tctaaggttg gcttttaggg actacattat  25440
acatatgggt tttgtcttca tgtttttgct tgcatttctc tctctgccca ctcttggggc  25500
tatttggatg tcacctcttc ttcttctgag ctccagtcta tgtattccct gttccatcat  25560
cacaaccact gaagtctaca ctcctcatta gattcaggga acccagatgc cagccaaaga  25620
catccctttc cctcatgacc cagttgaaaa aattctccac ccttctgtta attctagaat  25680
atttaggagt aaagatcttt tccctcagat atctgtcaat tcccggcctt atatctcaaa  25740
gccccttttc atccaggttt cctagatcat ttcttgtcgt ccctgtgcta taactcatta  25800
acccaggcat aaaactcatc agctactaat gtcctcttcc atcccagact cccctcacac  25860
caataattct tgaatagagc aacccaaatt gagaatttta agtaaaattg aaggtaaatt  25920
taattgcagg aggacataca acattaacct ttaaatagag atcctaattc ttaaaaaaaa  25980
aagtcctcat tgatctcggg gccgtttcac gcaggtgctt ttctaaatca tcaaggttat  26040
cttcagcttc actttcagtc tccttcttcg gctctggcgc tgccactggc tcttcctgtg  26100
ctaatgtggt tgtggcagct gcaatggctg caggggtcac agcagctgca gcagctgcag  26160
ccacagcctt ttccttcttg tgttttttgt gcttcttgtg cttcttatcc tttttgtgtt  26220
tcctgtcctt ctttttcttc tttttctttc catctccttc ttgatctgaa tttcttggca  26280
gtgatgggct cggtgttggg cttttggcct ttttgaccgg tacagctggt gaccagtttg  26340
tagacggtga ctgagactgg atgggggatg gagatgctgg gggcttttta gctgctggct  26400
caggagaccc agagacagat cgggaggatg agaccctcct tacagactgt gggcttgggg  26460
aagcagcctt tttttatctt tttaggttcc ggagtcctgg agactctcct aatgggccta  26520
gtacttggag acggggactg ccttctttgg ggtgatgacg acgctcctct tcgaacgggt  26580
ggaggacttg aggtctgagg agctcgaggc cgtgatgagg gcgaatgcca tttgtttgga  26640
tgcggtgatc gggcctcccg ggtagagcgg cttggggaag accctttcct atgcttggat  26700
gatagtgaag gtgaacgtct cttggtgact ggggagcttc tttggaaggt ggagaatggg  26760
agacccgccg ctttggtggt ggaaatggtg atgctcttcg tttaggaggg ggaggaggtg  26820
aagccgttct tctctttgga ggtggagaag gagagtatct cctctgtatt ggaggagagt  26880
atcttctagg agaaggtgag cgccgacgta ggggaggaga aggagtcctt cgtcgtggtg  26940
gtggtggtgt gggagtcctg agccgtcgag gatgaggggc gggagaagga gaccgtcgcc  27000
ttctggtggg tggtggggat ggacttctcc tccgtctacc atgaggggaa gtctcttttt  27060
ggtgctttcg tggtgatgga gaagcactcc gggaagggga atgtctccgc cgcttgccaa  27120
cctcaccatt cttcacatgg gatctcttgg gtcgttcatc ttctgaggag aaggaggaac  27180
cagagtcaga tgaagactgc tggttttgtc gtctgtattg gcgtctctgc tgagatcaat  27240
gaggaaggcc caagtgtccc cacagtctta gggggaaatg tttgttatga tgtaaatttt  27300
atttggtttg tacgcagttc aatttcaaaa ttgctaaaat gtgtttgagc tttagactat  27360
aacatttgtt gtaataattg ctaggttgaa gttcaacatg taaaaaaagg gggcatggat  27420
ttacattgca aaaggtgtcc acagtgtatt agtgacattc tttcattgac agctgacata  27480
attcattgag tgaaatattt taagccaaaa aaaattccct ttttaaaaaa gggggtttaa  27540
atactgttga cacttttatg gttcctttaa atgctctggc tattcccaga ggggtttttt  27600
tgtttgtttt tttggttttg atttgctttt tgtttttctt tcttcttctt acattttttt  27660
ccatttgagt cttagctccc atttaagtta tgcttctgac cttgtatggt ctgtaagctt  27720
gcccagaaat aagaccactg ttttgaacta ccacaaaagt ataaatgaat attttaatgc  27780
cacagtcttt cctgttgcct gtggagtctc tgctgaaatg aatcaggatt cgagctctag  27840
gataagacag aaaatgaaag catgttgttt gccaggacac tgtgggttta tattgatgtg  27900
taacaacttg atttggaaca ctggactctc attctgttct tctggttttg tttttttgtt  27960
ttgttttttt cttttgtaaa ggccatgaac tagtcccaga aaggattcct tcagttacat  28020
acaatttgtt taatgaaatg tcatggctct gttcatattt ttgtcttgtt cttccaattg  28080
gtgtatacaa ctttcagagc ctcttgtatt tggaaggctg gaagggccca gactttggaa  28140
tagtgtctcg gtttcactgt ttttgttttg attttttttt tttatttttt ttaaactaaa  28200
gctatataaa gcttgtggat taaacagaat aaatttctaa atttaaaaat ttaaaaaaaa  28260
aaaagtctat tgtcttccct cccctaccct aagcaatatg caatagtggc tcttcaatag  28320
tcccagactc ttcttctctt cctggactgc ccatctcctg atcaaccctt aatttctctt  28380
ccttctctca cccttctttt caggattgaa ttaatgaatc ctttcttctc actcatgcag  28440
agtaagtttc tgcctccctg ggtctttctg tttactgacc gcaacaactt cagattatac  28500
ctcttctact ccaagtgctt tcaaagaaag tcctctgcca agacaaattc attacgtttt  28560
ttccctctac ctgtttgcct ttattctctt ttgtatttca tcttctcatc tagattgaat  28620
aatctttgag agcacagatg tttatttata tttttccttt ccatttctac tcagcatgag  28680
gtgtccattg aacaaacttg atgaattttt attgcttaat atcttgctag aggtggggag  28740
agaggttggg ggcggttaag gaactatcag ctagcctagg agatattaga gctgcagaga  28800
tttggctatc ttgttcaacg ttatatccct agggattagt acataggctt gcaaatagca  28860
ggtatgaata aaaaattatt gaatgagtaa atgaatttaa aatataagtt acttaggcgg  28920
tatcttcagg catatctgtg tttatgtggt attcaatggc ccacaaatgt ctacatccta  28980
attcctaaga tctgtaaaca ttaatttgca tgacaaaaga gactttacag atgtgattaa  29040
atgaaaggat tttgacatgc agataatatc ctgtattctt catgtggaac caatgtattt  29100
acaagggtcc ttataagtaa aacagagaag caggaaaatg agggtcgcaa aaaaaaaaaa  29160
aaaaacaaac atgaagacag agaagaggtt agagtgatgt tggctttaga gatggaagga  29220
gtcacaagct gtcttaaagg aataagacaa gctgtcttaa aggaattgtt ataaaggaat  29280
agctgaagct gggtaattta ttttaaaaag gtttattttg ctcactattc tcatgtctgg  29340
aaaagtttaa tattgggtag ctgcatctgg caagggcctc aggctgtttc cactcatgtc  29400
agaacgtaaa ggggagctgg tgtgtttaga gatcacgtgg ggagagagga agcaagagag  29460
agggaggagg ggccaggctt tttttaaaca accagctctt tttttaaaaa aaaattatac  29520
tttaagttct ggtatacatg tgcagaatgt gcaggtttgc tacataggaa tacacatgcc  29580
atagtggttt gctgcaccca ttaacctgtc ttctacatta ggtatttctc ctaatgctat  29640
cccttcctta acccccaaac cctgacaggc cctggtgtgt gatgttcccc tccctgtgtc  29700
catgtgttgt cattgttcat ctcccactta tgaatgataa catgcagtgt tgggttttct  29760
gtccttgtga tagtttgctg agaatgatga tttccagctt catccatgtc cctgcaaagg  29820
acatgaactt atccttttta tggttgcata gtattccatg gtgtatatgt gccacatttt  29880
ctttatccac tctatcattg atgggcattt gggttggttc caagtctttg ctattatgaa  29940
cagtgctgca gtaaacatac gtgtgcatgt gtctttgtag tacagtgatt tataatcctt  30000
tgggtatata cacagtaatg gaattgctga gtcaaatggt atttctggtt ctagatcctt  30060
gaggaattgc aacattgtct tccacaatgg aacaaccagt tctcttaaga ataaaagtga  30120
gaactcactt ccctggcccc agagagagca aaagcaattc atccccatca cccaaacacc  30180
tcccattagg ccctacctcc aacattggga tcaaatttca acatgaggtt tttaggggac  30240
aaacatccaa actatgtcac aagacaattc atgtaagcag cctctaaaag atggaagagg  30300
caaggaaaca gattctcccc taaagcccac agaaggaaag cagccctgcc aacttcttga  30360
ttttaaccca gtaagacccg ttttggactt tggacaccaa gagctataag atgattatgt  30420
tgttttaagc cattaagctt gaggcaattt gttacagcag caattggaaa ctaatacaga  30480
tcacattcta attcaattag tattgttccc agttctctgg acctcagatt tctttcctga  30540
aaaacattaa aaataatacc tgaaagtttt gcacacgagt gcagagtgcc tatttactag  30600
agagatcagc atttgtttag gctctgaata gatttgagga tgaaattaaa tagcataaat  30660
aaagttccta gtgatgcttc tgataaaaaa atatctcctt caaaatgcca gaggcaggtc  30720
ctaaaaaccc acaaagcagg tgaactggca aaagactgta aaaagcaaag tagaggttcc  30780
tcttcaaaga ctttcctctc catctaatta ggaataaata gtaacttatc ttagaaacaa  30840
aatttattca aagacctgtg ctaacattct gaaatatctg ctagccgtaa taaataaatc  30900
gatgtacttt atgttcttag ctcccacaat ttaacctaaa tatttgccct ggcatgctta  30960
tactggtcca agcaagcatt aggtcatagc ctgttcctct tctttatttt aaggtgtttt  31020
tacctttgtc agcatgccac aagttacttc ctccttcctt tgttctcctc tgcctttgac  31080
tcttttaaag agtcctaagt tgctagccaa tcaggacaaa tacagaatgt gaggtcccgt  31140
ttcagccaat ggaaagtgga cacagcagga aggtggatgg gtcaggttat aaatgaccct  31200
gtctcctttg ttcggtgtac tcttgtggca aaactgctgg caagtgtacc ctttctgcaa  31260
taggtaaaaa ctgccttgct gaggaaatta aatttatgtt caagtgctat ttctttatgg  31320
caccggggaa caagcatttc taacaagact atgtaattta atttcaggaa cctaaaaaag  31380
tgggatgaag aactgaggtt gctaataaat ctatacaact tataagtaaa tatttaattt  31440
actaacatat aataataaag acatcattgt aagacaatgt taaaacattt tacacatttt  31500
aaatgtgcaa tagtaaatcc ttcactattc agggattatt tggaatccct tgtcaccaga  31560
agctcttaag gaaataactt ctacttcgtt gcaaatatgt tcttggctta gttgaggtaa  31620
tgcaaatact agaatacttg tttgtttaac agcttattct tccctgaagc tgttcctcca  31680
gtccctgcca gtgggatctt atgtctccag gagtacttaa cacccctaat agccccatct  31740
tttaagcctc cctgggacct gccctcgcag tacctcttat acctactcca cttcctcctc  31800
atggcctcct gcagaatgcc attctaaaat taggttctat tttcctcgcc cgcattctct  31860
tttgcaaagc ctccaaaaaa tttactttgc ttctctgcgc ctgctttatc tctattttct  31920
acactcgctc cttctttttc taattatcta taataggcgt cacaaaattt gcatttgttg  31980
gaaccaaaat ttccatggtt gcctcaaaat atacagatgt aaatttgcat ataattaaat  32040
tttgcataag ggaaactctc atttggggag atatgcaatg cccaataaat ggcagtttcc  32100
ttcaatgtcc ccaggccagc ctcccagtct gtgtgtttcc ccctggctgc agctaccagg  32160
actctgctct ggggatttac ggacaagggt atcaagtttt aattaaacta accctctcaa  32220
actgaatgag tggcttaaaa tcttcctgta aagaaaccgc aaaataataa tgctggcatt  32280
gagaagtaag aaaagagcga gccagcaccc ccacccccca aatcctgtga caaggtgtat  32340
ttttgtgttt tgtttttttt ctttggcagc attatggggg aaaagcaatg atgatctaat  32400
gagatctgat aagaagttag cccaaaacaa ggaaattgtt gagggttctc tttgaagtat  32460
ggatttatac ccaccaacct tagctgcgaa ccttacctca agtgttacct gtgccttgag  32520
atgtttcctg gtcatagtac taagctatca taatgagcaa gacattcaat aagcaagtgt  32580
gatggctatg aggacagatc ttaacaggtt tttttttctg gaaggcttaa aatcatgcat  32640
tactcaatct aatacttcac gaaatttcag taaaacctaa tgataatata gaagcttgtg  32700
ttgtagtttt gtaatcaaca gcaaaacata aaatttaaaa aaaacataca ttactggggc  32760
tgtatcctgc tacaataata aggctgacat aatagatgga gaacaatatg gtaacaagcc  32820
aaaatgtatt acttcatcca caaatagtat cgtgctatat atagacagac ttgttaaaaa  32880
tttaaagaaa tacacaatca attacacaat agaaaatttg ctatatggtg catggtggca  32940
tgcaactaca aatgtttcta acatgtttct cttcatagga ttttctgaat tttcatttaa  33000
tattcaagca catcaaaaac accttttcag gtgtgatcct atacagcaaa gctgtcctca  33060
caaacaatag ttgactaaat aaacacatgg ctttatggaa gaaatgtgta agtatagcca  33120
ttgttggagc agatgctctg cttaaaaaga aaaaaaataa gttaaagtta tagatctcac  33180
catgcttatt tactgcttaa gtcatagcca atttattgca ccaaagttga agttcaaagc  33240
ataaagaata ctatatataa tgcaattaat gaggttgatg tccctaaaac aagagagaat  33300
tagtaaatgt tttacaatag ttttcatgag atgggaaatg acaatagaaa tctttgttac  33360
aatgcagatt ttattgtgga aatgatctca tggcaaagtt tttaaagagg ctgcagaaca  33420
ataaagagag ataacacatt ttgcttttat gaaaaagccg atgttccaaa tttgctgacc  33480
ttctctgtaa ataagaagtg actgtcagta gccagcagat gtgtttataa aaataaccca  33540
cttgatctgt ccctgcaagg taagagtggc attttcaaag tgcatgagag aactgctctc  33600
aagagaaaat catactgtaa agacagcatt tcaaaaacat ttatttggaa atatttaaat  33660
gatgtgatct atttatttat ttggtcaaaa atgcccaact tgcctaacat tattttattc  33720
cttaaaacac agatcaagca acagatccta cagttagact cttctgatca ccctgagagt  33780
tagttacccc tttctttggt ttcttctctt taacgtcctg catatatgct gccattgtgt  33840
ttatagcaca atatcagagt gtgttattta tacgtgcatc tccctcatta gattgggagt  33900
ttcttgatgt cagaacacag caattgtccc accagaataa aaagaatatt gccaaaagat  33960
gctctataaa tgtttggcca ttggtttaaa aaacaaataa tggaccaatg ggctcaaaag  34020
caaactggct aatataaaaa taataataac aaccacaata ataaaataag ggctaacact  34080
taaacggttg tgtactcact atgtactagg cactgatcaa agtactttgt acatattttc  34140
ttatttaata ttcgctacca tcatattaca atatactgtt attaacccca atgtatagat  34200
gtaggtgaag aaacttgtca caaatcatac agctagttgt ctgagatgca atccatgtga  34260
tttgttcaca gagctcaggt tctgtgaagc gggtaaaaac aaaatttggc atccagtttc  34320
aaaaggagaa ttgcaaacta atagaacata tagcacaaaa tgattatatc aatagaatgc  34380
taattgcata tcaaggatat ttggtataat acaaattatt ctaccttaaa catatggaaa  34440
tttgtggtcc atgatgttgt agattctatc ttcccactct gcattttcaa aggcatatgg  34500
tattgactca ttcgattaat tgttggatag tctttattat agactaaatc atagaataaa  34560
tacatggata catgcacgaa tattatatct caagggcttt acatagttca ttatctcact  34620
tcatagtcaa aacaaaccta ctgatagttc caatgcaaag cctagaacgc tttggcttag  34680
agaggcccaa gtcttttctc agtgctgcac tgctggtacg tggcgtggtc ccctctcttc  34740
tctcagtaca cactacccat gcagactatc actctcagtc ttgtttatct caaatacaga  34800
gggtataact aactggaatg tatccagaac agtgaggcca aagtgtgggg aagctcctta  34860
accatgctgc tgcatgagga acagctggag agactgagaa catgaggcct aaagaggaga  34920
ctcagggaga tgggatcaca atcttcaaat atttaaaaga catcaagggg aaaagagatt  34980
aaacaaggta atgtagctct agagagcaaa tccaagagtg ttgagtggaa gtgaaaggga  35040
ggctggtttc agtcagatag taggaagaac tttctagtat ttggtactac aatgggaaag  35100
actattttgt gagatttttt taaatttttt tttaattata ctttaagttc tagggtacat  35160
gtgcacaacg tgcaggtttg ttacatacgt atacatgtgc catgttggtg tgctgtaccc  35220
attaactcat catttaacat taggtatatc tcctaatgct atccctcccc gctcccccca  35280
ccccacaaca ggccccggtg tgtgatgttc cccttcctgt gtccaagtgt tctcactgtt  35340
caattcccac ctatgagtga gaacatgcgg tgtttggttt tttgtccttg caatagtttg  35400
ctgagaatga tggtttccag cttcatccat gttcctacaa aggacatgaa ctcatcattt  35460
tttatggctg catagtattc catggtgtat atgtgccaca ttttcttaat ccagtctatc  35520
attgttggac atttgggttg gttccaagtc tttgctattg tgaatagtgc ctcaataaac  35580
atacatgtgc atgtgtcttt atagcagcat gacttaaaat cctttgggta tatacccagt  35640
aatgggatgg ctgggtcaaa tggtatttct agttctagat ccctgaggaa taaatgacca  35700
actattgaga aattgcaggg tagtccctac atgagggtta ggtagaattg acctgctttc  35760
tgcctcataa attttagaaa attaataaga taatttatta cggggtggtg tttgttccct  35820
cagtacttta tcatctatgt tgataatgtt aataattaat tgcataatta acaaatagca  35880
aattattgtg ggggtgtgtg tgtgtgtgtg tgtgtgtgtt tagacagggt cttgctgtgt  35940
cacccaggct ggagtgcagt ggcgtgatct cggctcactg caacctgtgc cttccaggtt  36000
caagccatca tcctgcctca gcctccctag tagctgggat tacaggcgcc tgccaccatg  36060
cccagctaat ttttgtattt ttaatagaaa tgggatttca ccatgttggc taggctagtc  36120
ttgaactcct gacatcaggt gatccatccg actcatttcc caaagtgctg ggattacagg  36180
catgggccat catgcctggc ccgcaaattg ttgttattta taactcttca atccaaatca  36240
tcagtgtcta tgttgtttcc ttaactatca aatgatgata ataatagtac cttcttcata  36300
agatagttga aaggttttta atatccatat ggtactgaga atgatgcctg aaacatagta  36360
actaccccat ttttattata tttctgttaa taataataca taccattatt gctcttgcat  36420
accatattgc tcttgcatac catatatgct cttgctatat gctacacaca gtatttcatt  36480
taggcctcac tatgtccctg atgtaggcat taatatcttt attttgcaaa tgagaaaaca  36540
gtctgtacct tgtatgccat gctgctattg tttatctgtt tgaatctcaa gcaaatctgc  36600
ttgataattg gtaccaaaat aagccttttt ctgggtaagg aatctgatat tgtgttttaa  36660
aaaacacaca tttaatcctg gggctgctgc attactcctg ctgccccatc ctactgtgat  36720
caaaggcaca tacatgagat ggtgagttgt ccccttgcca atgagggttt ggtaagaaag  36780
gaaagtgcag tacttctttg tttctgaatt gcaagtatgt gtgggttaga gggggaggct  36840
gaatatgaag gtcctgggac agcccaccag gtatcccatg agactttgca aaggaaaagg  36900
aggtgagtga cagcccaggg tccaatagga tagaaggaaa agccaggcca tggagttcct  36960
cagacctgct ttctaagggc aactctacca cctcagcaag ccattgaact tctctgagct  37020
cagtcctttc atttataaaa tggggtgaca gtgctcacat gccaggaata caaagggatt  37080
gaaagataaa acacgtaatt aagcacctgt tgttacacat ctgtcaggga ccccaataag  37140
gtcagctgtc ttcctgttga cttctgttct tggtggttct ccaagatcat accttccatc  37200
aacatttacc gtcactcccc caccccatgc ccaatactga acagtggagg gacgcttcac  37260
ctacagttat aatgttgaaa cttcaaccca aagcaagtac tgttaggatc tctggaaact  37320
ttccctcaaa taagggattt gaatgggaca agaagaagtt ttacagatag ccaatggaga  37380
tgatttaatg gggttatgat agaaacgaga aagtaaaaca aacccatgct ttaaagtcta  37440
ccatttcagg tccatatttt cgcttgaaaa ttgagattcc tattaaacaa tgacatttac  37500
accaaaaagt agaggagttg gttgaaggac agggtaatgc caggaggaat tgggaatttg  37560
agagtcaagt caaaggactg aaatactcag aatactaagg gcacctcagg gctctaccaa  37620
ggacacgtag aagctttgaa tttgcagcac caccctaatt taacgagcta cctcagcacg  37680
tagtggagcc ttggaaaaca gatgtcacaa actctcatta gattgtcaaa cattttccag  37740
catttcctct cccatcatag ctggttatca agatatatag acacacacgt gcatacacat  37800
aaataccttg ataagttact agagaaagca gaaaaatgtc tgacagttta atgagatttg  37860
ggtgaaagaa aattctatat ttcattgttt tccaggcact agaaataatt catcaatgtt  37920
tctaagactc attcagcgtg gctgcatttt ttaaaatatt ttcataaatt ttgaggagca  37980
aataccatta ttaggcacta aaaaggttga agtctaatag attagccgct tcatcctcct  38040
tcactcagct cagcattcgt tcaactggct cttactggtt aacatccaca cgcctcctga  38100
ctggctactc agtgccgatg acatttcctt cacacacagg gctggtttta agatacattg  38160
aggtgacatc aggtggcctg taaagtggtc attttaggat atcctattca aagacatctg  38220
tggaagtgtg gaccaattta ttgatgaata acagtgaagg ggtttccacc agcaagtaac  38280
ataatttttt acaatgatga tgctgaagta gaaagagttt ctagtcaggg actggacaaa  38340
tcaatttgca gacgattttt aggaagaaaa acattgcaac agtaaattgt aattgataac  38400
ttctagagcc actttaagta ctgctatttt aggattctga ggggaagaaa gtgttctgca  38460
aagcaataag caaagtgatt tgttccaagc cccaaattta agcagtttga gaggtaaaaa  38520
gagtcattac caatgtgggt atagaacatg tgctaggcaa atctctttca catacatgtg  38580
gggaggtaat aaaattataa tttgaggccg ggcacggtgg ctcatgcctg taatcccagc  38640
actttgggag gctgaggtgg gtggatcacg agatcaagag attgagacca tcctggccaa  38700
catggtaaaa cctcgtctct actaaaaata caaaaaatta gctgggcatg gtggcacaca  38760
cctgtagtcc cagctgctcg ggaggctgag gtgggagaat cacttgaacc tgggaggcag  38820
aggttgcatt gagttgaaat cacgccactg cactccagcc tggtgacaga gcaagactcc  38880
atctcaaaaa caaacaaaaa ttatagtatg aaataggcat taaaatattg tgtattttag  38940
aggagactga ggattggagg ctgaagaatt actctaaatt aatcagcttg tgtacttcag  39000
agctaagata gctctttggg ttctaaattc tgtgatcttc tttttgattt ctcttggagc  39060
aataatgaag gcaaaacatc aataaacata acaaactggg taagggagac cattgagaag  39120
gactaaggac accttcaaag ttctgagtga gtttaaaaag aagaatgatg aaaactttga  39180
tagaaatagg aaaaaaagta gaggaacttg tttggcttga aacttcttaa tgtttaggct  39240
aattatattg aagatgacag tggtcattga gaaaacaaaa tccccaaagc aattttggaa  39300
taagagccaa catttaatac ttaccagaca actattctaa gtattttact atattcactc  39360
atagcaactc taaaaagcag gtagtattaa cagagaaaat gaggcacagt gaggttaaat  39420
agctggtccg aggctacaca gctaatcagt gggagagttg ggacttagac ccagaggtcc  39480
agttttgaag tccacacttt tagccattac actacaatgg aaagaaattt agaagatata  39540
cacagaaaac tataggcaca tagattaggg gttagtagaa tgctctgggc agttaaagga  39600
actcttctta aaggaggtaa agcttgaatg agactgttag taagctattt ttcactcatt  39660
ggtgaatgat gttttgtgca gtgtgttttt ttccccatag aaaaataaga aagaaaagaa  39720
aattgagaac tctctctata aaaatgtgta acatatctca tattccaaga gatccttttg  39780
gtagtattaa tttttatctg ctcacagtac tggcttcatt atttggagtt aaaaattaac  39840
tcaaccagat aaaaaaatca gtgctgtgta tttgtttatc tttcaaatct gtgttctaat  39900
tttaaaaagt tatttaacag aacgaagcta tcagctaaga caatggcaaa gccgtaaaca  39960
aacataggtt gcgtttatgc gaatggtcag gtccaaagta gatgcagaat atgccaggtt  40020
cactaatttt aatccctatt cagcccagga ctatgtacca taagattact gctagtgttt  40080
tctgaaaatg atgtatcaag gcattttctg tagaaatacg aaacagtgac atacagtagg  40140
gagagctgga ttgaggcaga gtagtataga tggaagtttc ctgaaagcat tttggggaaa  40200
catcttttgg gtatggttct tggatgaaga gttgatttat tagtactgga agggtgtatg  40260
ggagagagga agtgagaggt tatgagagaa tgaccctccc gtgatggtga gtgggagaat  40320
tattgcagta tgtacgttag cattgctatg tggtgaagtt cttgggattt cctggggtcc  40380
gtgctggaca gcatgcttag ccaccagtca catgtgggca ctgagcactg acaatgtggg  40440
tagtctgaac tgggatatgc tgtaagtgta aaatacaaac tggactccaa agatttagta  40500
tgaaaaaaag aatttgaaat atctcattaa tgatgtgtat ttggtttcat attgaaaaca  40560
actttggtat tatatattga gttaaataaa atgtcattaa aattaaattt tacttaaact  40620
aaaatttaaa attctatctt tacctttttt tttttttttt tttttttttg aggtgccgtt  40680
tcactcttgt tgtccaggct tgagtgcaat ggtgcgatct tggctcacca caacctccgt  40740
ctcctgggtt caagcgattc tcctgcctca gcctccctgg tagctgggat tgcaggcacg  40800
caccaccacg cctggctaat tttttatttt tagtagagac agggtttctc catgttggtc  40860
aggctggtct caaactccca acctcaggtg atccgtccac ctcggcctcc caaagggctg  40920
ggattacagg tgtgagccac cgtgcctggc ctatctttac ctttttaagg tagtgactag  40980
caactttaag attcatatgt ggctcatgct gtatttctat tatggaactg ccttatgact  41040
ttcaatgggt aggatggaca catccttggt gggatggaga aatctatcat agcagctggt  41100
cttgaaggtg ggtggggata tgataataac ttaggtgggg aggctcagga ggactcacag  41160
aataactggc aaccctgccc ctgtctgtaa aaaccccatc ctggaggaaa taagttagga  41220
aaaggttttg cattttgtgg aatgaaaagt ctgttgcatc tagcttgaga cagagcaaaa  41280
agagttgatt gtcagcttca tgaagaccag ggggtctaaa agacccaggg atcaacaacc  41340
aatgagagca gcatggaggc caagaaccag gcaaaatgct gattccagga ctgggattca  41400
ggatgatttc cttctatgca ataatctgct ccttgaaagg gtatctaatt gggcattgct  41460
tttacttgct gctttcaatt cttttatgtt ctttcctagt aaatattttt tcttaatttc  41520
attgcagctc gtatttatcc tgggaacaga gagaaatgtt tcacaagctt aagccagtct  41580
tttaaaagga gaatggcagg actccaaaaa cagacatgct gatatgtact ggggaatttt  41640
taagtgctga aacctccaag acaaaagaga ctgtgtcttt attgttctct gaattactcg  41700
tacccagctc ggtacctgga acatgatagg gatcccatag tggtttgatg aataaattag  41760
tgactccaag agtaaagtaa tcctcaggag gacaaaggca gatagcttcc cttccctatc  41820
agaatgtact tctcttaaag cttttcttgg tataattctt ggagaatttt gccttacaga  41880
agtcaaatca cataccaaag tgaaaactgg atcttctaca aataatggaa gaatcaactc  41940
tatcaaaaca acaattatac atatgatcaa tggaggggtt gtcacgagcc aggctaagag  42000
ctttacatat attatctcat tctgtctatg ccagagaatc aactatgaca tatgtaacat  42060
taaatctcat tttatagatg caaaaactgg ggtgtaaaga agtcaaagaa tcagccagaa  42120
tgtacagaat tagcaaaggt ggaactggga tttgaattca gacagtctga ctccagacgc  42180
catctccgaa ttatgcataa ttatatttca attattaaca ttcataaatt gaaatatgag  42240
ggataatgta ccttttcatg aaagctttgc tcgttgtgtg gatgagtgtg tgtacatgta  42300
actgcttatg tgtgctatca ctgaggtaga agacatctct ctctctctct ctctctctct  42360
ctctctgttt tggtctactt ttagtaagac ttgtatttga ttgagttcag aagtttgatt  42420
atctttttaa ctaacctgtt tgttttaatt atattaaaaa ttagtcactt tcaacatatt  42480
tgcataggta attgttaggg tgatcttttg gatgatcaga tgtaatatac tactactaca  42540
cacagacacc cagacacaca cacacacaca cacacacaca cgcatgcaga cacatccttg  42600
agctcaaaga gctttctcag gactacatac tttacattta caacaagtca tttagaaaac  42660
tatcaatcct attcaaatct cagcaaaaca gagataccag gctctgcctt tctctttaac  42720
tgctcttttt ttgctgtaga caaagctgtt tcttgcactg ctacatatat aaaaaagtga  42780
caaatcctta actgtcaaac aagagaaata gtttgataaa tataataatt ccataagatg  42840
gcacattata cactactaaa ttgtaaggac agtaaagtta ctgttaagta ccaaaaagtc  42900
atgattaaat gttaagtgaa aaaatagaat atagctagat ttgaatttga atattcaatc  42960
tgtataccag tatgtataga aggaagagta tataccaaat agtaagagta tctatctgtt  43020
ttataatttg atataataca aattattcta ccttaaacat atgagaattt gtggtccatg  43080
atgttgtaga ttctatcttc tcaccctgca tttccgaaga catatggtat tggctcatta  43140
gactatttgt tgaatagtct ttattctatt atcatagaaa aaataaatga gtgcatatat  43200
ccatatacaa aatagaggtc tgttcttcct gtatatattt atactaaaaa aactgagact  43260
tttttttaca gttgtatata tacaaacata tttgtttatt tatatacaca tatataaatc  43320
aattttatgt acatgtgggt atacatacat ccatgcatat aactctgaag tgctgactct  43380
ctaaagaaag cccaggtatt ggtcagaatt catgctcggc tcaggagtat agaattaaga  43440
gatacaaacc tcaaaaaaga gggaaccgaa tcttcaaatc tgagccacct tacaagaatt  43500
tttaaggtaa ctgttttaag tgtaaacatt atggcaatgt aatagtataa tttgtatggc  43560
acaagatgga gtcctggtgg ccagaactga gtatgggaat agtcagtgct aatctttgtg  43620
caaagcacaa aggaaaattg gtatacaagg cctgagagag aggtcaagga agcaaatact  43680
ataaagtccc agaaggcagt tggataggac aaggggatcg gaagagcagg atcaagatca  43740
gagagcaggg aagatggggc tagctaatct agggaatgga gggagaaggg atacccagaa  43800
gcaggattca gggggttaga gcacttacac catgctcatg gccatgccca tggacaggag  43860
aagcatatga tgggtgcaca tggtggagct ggtctaaaga agagggggat tcatatcaca  43920
gtaaaattaa gtgcaattta tccacagagc agaggaggtt gtgaagagca ggcataggct  43980
atttttcatg tctgaatgct ctcaagacct cttagtgttg taggtagatg acgcacaata  44040
aatattcctt gatttgaatt ggcataaaag gtcaaatcag aaagccagaa gttctttaag  44100
gtttcaaact agattctaag aagtccaaag gcatctcaga ggtcatctca gggagaaaag  44160
gggaagcaat gaggtagaac tctgaacctc cactctacct aaacaaggca gccctgctgt  44220
gctccgagtc atgtatggcg acatcaggga agatgtaaaa taggattgtg ataggaaaca  44280
gcatttgaaa gccattgctt tacgaaggga agcgtagaac ccttttcccc ttgttagcca  44340
attcaaatga agacttttgg gagctagtga agagaaagac aggatttcta gggagatgtt  44400
tcagaagcag cctaactata cccgtgtctt cagaaagagc agtgtcgtct cagaagtaat  44460
caccttcatc aaccagcagg tcagtgtggg tctcctgaag agcccgaaca accacgggaa  44520
gcgacatcca ctgttgtgca gtcaaaagaa tctttgctct cattttctcc actctctttc  44580
cttcccaaat agggtatcat aggaagatcc tgcctttctt ccagttccaa catttatgaa  44640
gtgaaatttc catcagacag ttgcttttga caaacaaaga ttgactagaa gcttctgtga  44700
gagagcctta ggaagttctc tggggaagcc ctgcctttgt ttggttttct ttgcctttgg  44760
ctctgtgatg tttgctgtaa aaaatgatta ctttcaggtg attaaaagtg gggaagaatg  44820
gtttcaagct tttcatgtag caaataatat ccctgtctgt aggattactt tagttgaaaa  44880
aaaaacatgg cttcagtgat gccttctcaa tgtacaagat tcagaggaat ggaaagaaaa  44940
tgaaataagg ccggcctcgg tggctcacac ctgtaatccc gggaagccga ggcgggtgga  45000
tcacgaggtc aggagttcaa gaccagcctg gccaagatgg tgaaacccca tctctactaa  45060
aaatacaaaa attagccagg catggtggca ggcgcctata ctcccagcta ctcaggaggc  45120
taaggcagag aattgcttga accccggagg cggaggttgc agtgagccaa gatcatgcca  45180
ctgcagtcca gcctgggcga cagagcaaga ctccatctca aaaacaaaac aaaacaaaac  45240
aaaggaaaag aaatctgcag ttaatatttt ggcaagcttt cttcacttgt atgcattttt  45300
aaaatgctaa tgttaataac agttcgggac ttctaacttc tatatttaag caacaaataa  45360
ataaattgtc agatggtact tcatcatcct tctctcccat cttcttagaa atataaattg  45420
ctttaggtgg gaatgctata attttagacc agaaaataca tgccagatgt ctcttatatg  45480
aagccgtccc gcccaaggat atatatatgc cttagtcatt aggatgtgtt ctaaataata  45540
ctgcaaagcc cttggaagga tgggtctgaa cactcactta tatttaactg ctggcatgtt  45600
gctttgtccc tgtgtcttgt gctactattt ccattgatgt aaaggaagca ccaattaaat  45660
aacactccat tattagagaa ccaggcacaa gtcagctgag gcaggagacc cgccttcttt  45720
tccagaaaca atgtaaagcc tgggtgggtg agggtctctg ggcttccgcc gtgccttgct  45780
tttgacattc tccagcacac cctataaaca tgtctaaggc tgtcctgttt agtctgatta  45840
ttcaaactat attgtccagg gtagagcaaa gggaaaccta gctgaaccct ggagatgaca  45900
gcagggagag agagaggggc aaagaagggc aaaacgggaa aaacaggaaa caggctagtg  45960
agaagagtaa aaacgctcag ggtgaggaag cagggtttct aagctctcta atctcccctg  46020
tgcagctggc ttgctgtatg gtttatacaa atccagtggt gatctctgtg caacgtggta  46080
tcacctgttt aaagaggtct catcttcatt ttcaaagagg aatacatgtt tttttactta  46140
ctcttctgca tggctgactc cttttcatgc tttaagtctc aatcttaatg ccacctcctc  46200
cttccagacg ttcccagcta aagtggcact tcccagcccc attactctct atgtttattg  46260
cctgcatagc tcttatttgt aatgatttcg taatagtttg atgatgatca tgatgaatat  46320
tactttacct atttatggcc tctcttttag tattaaattc tgtaagccac atgagcatgg  46380
ggacacatct cctttgtcac tgccccattg ctggcattta gcacaagcat ggtctataat  46440
agataccaaa caaatatgta ttaatcatgt aaatgactaa atccatgaat gaatctatca  46500
gacagtgtag atagcagcac ataaaggaaa gggaatgtag taaatttttc attttccttg  46560
aagatgtagc tatgtattag gaatttgaaa aatacattat caaacacaaa gctaaattat  46620
gccagctaat gactactaaa tataataaaa tcggctgggc acggtggctc gcacctgtaa  46680
tcccagcact ttgggaggcc gaggtgggtg gatcacgagg tcaggagatt gagaccatcc  46740
tggcaaacat ggtgaaacgc tgtctctact aaaaatacaa aaaattagct gggcatggta  46800
gcaggcacct gtaatcccag ctactcggga ggctgaggca ggagaatcgc ttgaacccag  46860
gaggcagagc ttgcagtgag cagagatcac accactgcac tccagcctgg gcgacagagt  46920
gaacctctgt ctcaaaaata aataaataaa tataataaag tatgtagaaa gtcagaaatc  46980
ttggggatta tattgcaaag aatttccact atattgataa tggagaaagg cttttaatat  47040
tatatttttt gaatattaag aaattggcat ctactcacca gtttggacat cgcttttaaa  47100
atacacacta aacgaaagcc attttgtact tataagtgct agattaaatt cctgcatagg  47160
ctgaaaaagg tctctttcca tgcctttcca aatttacaat taacaaagag ttaattattc  47220
tcagagtcat ttcttccaat tcaccaatta ggatgagggc tatttgttac aatcataaaa  47280
gaggaaatgg tgcatgggca agaagaaatt tggaaaggaa atgtgattgg aggaattata  47340
ttgaaaggtg aaacaaggga gaaaagataa agagaagaaa aattagaaat tggaaacaaa  47400
gttattccag cccctctcta ataactacta ctctttggaa caagggaagc agtacctgac  47460
aagaaatttt ttttctttta ttttttattt ttattattat actttaagtt ttagggtaca  47520
tgtgcacaat gtgcaggttt gttacatatg tatacatgtg ccgtgctggt gtgctacacc  47580
cattaactcg tcatttagca ttagttatat ctcccaatgc tatccctccc ccctcccccc  47640
accccacagc agtccccaga gtgtgatgtt ccccttcctg tgtccatgtg ttctcattgt  47700
tcaattccca tctatgagta agaacatgca gtgtttggtt ttttgtcctt gggatagttt  47760
actgagaatg atgatttcca atttcatcca tgtccctaca aaggacatga actcatcatt  47820
ttttatggct gcatagtatt ccatggtgta tatgtgccac attttcttaa tccagtctat  47880
cattgttgga catttgggtt ggttccaagt ctttgctatt gtgaatagtg ccacaataaa  47940
tatacgtgtg catgtgtctt tatagcagca tgatttatag tcctttgggt atatacccag  48000
taatgggatg tctgggtcaa atgatatttc tagttctaga tccctgagga atcaccacac  48060
tgacttccac aatggttgaa ctagtttaca gtcccaccaa cagtgtaaaa gtgtccctat  48120
ttctccacag cctctccagc acctgttgtt tcctgacttt ttaatgattg ccattctaac  48180
tggtgtgaga tggtatctca ttgtggtttt gatttgcatt tctctgatgg ccagtgatgg  48240
tgagcatttt ttcatgtgtc ttttggctgc aaaaatgtct tcttttgaga agtgtctgtt  48300
catatcctcc gcccactttt tgatggggtt gtttgttttt ttcttgtaaa tttgtttgag  48360
ttcattgtag attctggata ttagcccttt gtcagatgag taggttgcga aaattttctc  48420
ccattttgta ggttgcctgt tcactctgat ggtagtttct tttgctgtgc agaagctctt  48480
tagtttaatt agatcccatt tgtcaatttt gtcttttgtt gccattgctt ttggtgtttt  48540
agacatgaag tccttgccca tgcctatgtc ctgaatggta atgcctaggt tttcttctag  48600
ggttcttatg gttttaggtc taacatttaa gtctttaatc catcttgaat taatttttgt  48660
ataaggtgta aggaagggat ccagtttcag ctttctccat atggctagcc agttttccca  48720
gcaccattta ttaaataggg aatcctttcc ccattgcttg tttttctcag gtttgtcaaa  48780
gatcagatag ttgtagatat ggggcgttat ttctgagggc tctgttctgt tccattgatc  48840
tatatctctg ttttggtacc agtaccatgc tgtttgggtt actgtagcct tgtagtatag  48900
tttgaagtca ggtaatgtga tgcctccagt tttgttcttt tggcttagga ttgacttggc  48960
gatgcgggct cttttttggt gccatatgaa ctttaaagta gttttttcca attctgtgaa  49020
gaaagtcatt ggtagcttga tggggatggc attgaatcta taaattacct tgggcagtat  49080
ggccattttc acgatattga ttcttcctac ccatgagcat ggaatgttct tccatttgtt  49140
tgtatcctct tttattttat tgagcagtgg tttgtagttc tccttgaaga ggtccttcac  49200
gtcccttgta agttggattc ctaagtattt tattctcttt gaagcaattg tgaatgggag  49260
ttcactcatg atttggctct ctgtctgtta ttggtgtata agaatgcttg tgatttttgt  49320
acattgattt tgtatcctga gactttgctg aagttgctta tcagcttaag gagatactgg  49380
caaaaaccac atgattatct caatagatgc agaaaaggcc ttgacaaaat tcaacaaccc  49440
ttcatgccaa aaactctcaa taaattaggt attgatggga catatctcaa aataataaga  49500
gctatctatg acaaacccac agccaatatc atactgaatg ggcaaaaact ggaagcattc  49560
cctttgaaaa ctggcacaag acagggatgc cctctcttac cactcctatt caacatcgtg  49620
ttggaagttc tggccagggc aattaggcag gagaaggaaa taaagggtat tcagttagga  49680
aaagaggaag tcaaattgtc cctgtttgca gacgacatga ttgtatatct agaaaacctc  49740
attgtctgac aagaaatttt atagtctgat gaaagggatt ctaaagagtc aggggccaca  49800
ggtctcaggc ttcgactgga tgtgatcatg tctgaggcct ttcgatcctc actttcctta  49860
tctggaaaac aagaatagct gaatctcctt ctaagggcgt ttgtgatatg aactgagatc  49920
ttgcatatga ctgcaccaag tctagctcaa ttcgcattag ttccctccat tatacccctc  49980
cctcgagctt tacccagact cagaagaaag ccaggcaaca tttctacttc tctatatgca  50040
aaaacaaaag caaacaagtg gaaaacctca caaaaacagt taacttcaac atttgggctt  50100
acacaaacaa ttcaaaaatc tctttttatt tcatccgcca tgattatagt tatttttcta  50160
aagtgaatga ttctacttcc caaatgcagt aaacccactg ttaaagatag ttaattttcc  50220
tctagatgat tgtggccctt gaaagtcatc aaggtcatat ttttaattat ttccccagaa  50280
tttttcctga aacagtgtcc ttttgtctaa atcaatccaa gtaggtttta gcattagtca  50340
taaagagggt gctgtcaaca aagaaatcaa ctgagtggaa gtgatattat aatgtaaata  50400
acttgacata ggaatacata acactcataa atatttattg atttatttaa taaattaaaa  50460
attaatgctt atgatatgta aacaagatat aacaaggcag tcaagaataa ctctctttag  50520
ttcatatgat tttttcccat acgtaactga atagcaagaa aacaagtaac ccagtttgaa  50580
aatggacaaa aaactgaaat agatatttct caaaagaaga catacaaatg gccaatagga  50640
tattttttaa atgttactag tcatcaagga aatgcaaatc aaaatgacaa tgaactatca  50700
ccttacactt gttagaatgg ttactagcaa aaaaagacaa gggataacaa ggttggcaat  50760
gatgtagaga aaagggaatc cttgtacatt gttggaggga atgtaaatta gtatagtcac  50820
tatggaaaac tgcatggagg agcttcaaaa aactgaaaat aagcctacca tgtgatccta  50880
atactgggta tatatccaaa ggattggaaa tcaatatgtt gaagagatat ctgcattccc  50940
atgttcgctg cagccttatt cacaattgcc aagtatgaaa ttggcttgag tgtccatcaa  51000
cagatgaatg gctatagaaa acatatacac agtggaatac tattcagcct taaaaaagaa  51060
ggcaatcctg tcatttgcaa caacatgatg aacctgtagg acattgtgct gagtaaaata  51120
agcctgtcac agaaagacaa atactgtata atctcatatg cagaatcttc aaaaagttga  51180
acttataaag gtagagagta gagtgatgtt taccagaggg tggggtggag aggggtgggg  51240
tacagggaat gggagaatgt tggtcaaaga gtacaaagtt ttagttagac atgacaaata  51300
agttttcaat gctattgcac agtgtggtga ccataattaa caataatgtc ttttatatct  51360
caaaattgct gaaagaatag gccttaaatg ttttcagtat agaaaagtat atgagatgat  51420
gcctaattta attagcttga tataatcatt ccacaatgta tacatatatg aaaacatcac  51480
attgtatccc ataaatatat acaattatta tttgttaatt acaagtaaaa gtttaaaaaa  51540
tggcaagtaa atcatgtagc ccctgagata gatggatatg tgagcctagc ttgaaacaaa  51600
tgtcatcata tatccaccat tacacaagac tttgagcaga ctgaatgctc acagaacata  51660
ttgggaggag atatttggca gctgaagtgg caaatagtca ttttccaagg gaacaacaac  51720
agtagagagg tttccagtta aagttgcaga gtttctgcag agtctctagc agtgctggat  51780
ccaagggtat gcggtgtatc caagtagctc ttgaggaaac cacaggcaca tcctggcatg  51840
gggagcacct caggagcaca tcctgagttt cagggcattt gaaatggatg tgcagtcaca  51900
tcccacccaa ctgcaaggga tacccagcct acatgcagag gtcaggaaag ctgcccacat  51960
taagacattg catgcaatag gcccctcccc actaggagtc tatggagaca gaaatgcatt  52020
ttgaggagca atttcatgca gtcatgggtt aagtgaacca agtgagctat gaagccagat  52080
tttccctcct gggccacata tttcagaggc acataactca agcttgcaac acgtattcaa  52140
aagagaccag ctacacttgg tagagacagc cataggaaag tgaaatgacc ctagggttta  52200
gtaaagccag ctgtttccac ttctgaaaat aataaaatga aataataaaa taaatttaaa  52260
atgatacaaa gttcaaagtt taacaaatac atttgaagcc atttgcaaca aatacatctg  52320
aagctaattg ctggctctag aaagtgtggg gtctttgttg tggagcagtg ttaatgattt  52380
agcattactt atctctggca aatggtattt ttgagataac atgttatgga agaaagtgaa  52440
ctgaacttgg aagtttgaag atctcgattg aagtatcatt tctgcctcaa ctacttgcat  52500
taacttgtac aagtcattca accgctctga acataatgga aaaatgggat gagaatacat  52560
gttgtatact ctccaaagac agggagactg ctgatataag agggcacttt tagtaactga  52620
tggagcaaaa tgttgttata tgagtgtcag catagggccc tgggcttaca acggtgccat  52680
gagccttaga acagaggaag gacagctata gcaatgaaag gactagtgca gattcagaaa  52740
aataagaaga cagaaaccaa ggtgtagtaa catgttttag tatggagggg aaggcagtta  52800
tagaaacttg aattacataa tttgtacatt tctgggagat agaaggtaaa gatagcagct  52860
aatggagaca ggacaggact ggtacttgat tatggaagaa aggaggtaaa tagaagagac  52920
aaaaagggag agaagagatg tcaactgcct actctggtag cctctgtatc caaaaggttg  52980
actcaaacat tcgctcataa ctttgtctgg cttaatcctg ctcatcccag cagacttatt  53040
tcaagtgtct ccacgttttg ggaagtcatc actcacttct ctgggctttc atatgggaga  53100
gcatttaatt ctgttgaaaa actatttaat actacatcta cctttctcta tggactctga  53160
gcttcttgag ggcatgtatc atgtatgttc tattctgaag cacccatacc tagaacaaag  53220
cttagcacat agtaggaact taataaatat ttcggagttg aataactagc cttatgtaat  53280
cctcacaaca accctaagct ggagactcaa acaaggctgg aaataagtag gtgccaagaa  53340
gaactgagat tcagacacat atttgcaggt aaaacatagg aacactgaac attcactgag  53400
aactgacaac ttgtggggtt gttgtaggat atgtgaccag agactcttga atgccagtct  53460
ctgtacctgt accatgttgg ctaacaagaa tcgcatggaa tccttgctga aaatacagac  53520
cctagaagtt ttctcaaatc tggagagact gtactatggt ttgaatatgg tttgtcgcca  53580
ccagaactca tgttgaggct tggtcctcaa tgcagctgtg ttgggaggtg ggacctagag  53640
ggaagtgttt gggtccagtg ggcagatccc tcatgaacag ataaatattg tcttgtggga  53700
gtggatgact tctgtcttgc aggactggat gaattaccac aagaatgagt tgttgtgaag  53760
cttctcctca tgttttgctg tgtttgcacg ctgtctcttg acatttttct tctttgctat  53820
gttgtaaggc agcacataac cctctgcaag ctgagcagat gccagtgcca tgctcttgga  53880
ttttctagcc actagagttg tgagccaaat aacatttttt ttctttataa attacccaga  53940
tcaggtattc tgttagagca acactaaagg gactaagaca ctcttattct caccaaatct  54000
ttattttggt aatgatttct cacacctatt catttgctcc agaaaaggta gttattctcc  54060
atagtctatc ttcatcttcc acttcatgct tattcaatcc attaccaatt cctgtcaata  54120
tatcttccta aatatctctt tcaaccacca acttttctat cctcactatt actatccttt  54180
tacaagcaca tagaccactg ccaggaaccc ttgacttgcc gacctgactc tatactagtt  54240
cttcttccta ctgcagccgg agcaatcttt ttaatcaaag ctatgactca acatttactc  54300
tcttgatgaa atctcctaga agaccttttg tagctcttag aacaaagact gaaataaaaa  54360
ctctatacta tagtctaaaa gttccttgtt ggtctcacct ctccagcttc ctccctctgt  54420
gctccaacca catgggcttg ccttcaatgc ttcacatatc acccagcttc aaattccctt  54480
ctggctgcag ggccttggca caaactgttt tctctgcctg atgttttcca cccttccacc  54540
tacattcatc agtttgactt ctacttatct tttggagctc agctcagaca aggttagatc  54600
ctgccattga catactcatt agcaccctga aatatttctt aatcacagcg tatgattata  54660
tatttatttg tgtgattaac tgataaatga ctgtctgacc cctcctccct gctttaagac  54720
tataagttgt attaattcag ggcctatgtt agctttactc agtactctgt acccaatgcc  54780
caccccagca tcctcacaag taagggtgtt cagtacatgg gtgttgaata gatgcatgaa  54840
taatacaata agtcaacaat tggtctcagg aatctcaata attttaatgc tatcaaagtg  54900
atttgatgca gatttgggaa aaattatcta aaaaattcat cccaagctaa gatcctatga  54960
ttcttagcta tcacagaatc tgtgattctg tgctactcct ctgcgcttct catgtacact  55020
tacatgggta tacccatgaa aaatgtttgt tggtttgttt gtttgttttg agacagagtt  55080
taactcttgt tgtccaggct ggagtgcaat ggtgcaatct cggctcactg caaactccac  55140
ctcctggcct caagggactc tcctgcccca gcctccagag tagctgagat tacaggcgca  55200
tgtcactaca ctcagctaat ttttatattt ttagtagaga cagagtttca ccatgttggc  55260
caggttggtg tcaaactcct gatctcaggt gatctactgc ctgagcctcc caaagtgctg  55320
ggattacagg cgtgagccac cgtgcccagc cgaaaaatgt tttaaagcat ctaggatcct  55380
tggcaggcct ttagcacact gcacagaagg gacattctgt gcctgtcact ggaatgacca  55440
gcaactctgg ttccctgctt tgcccagact gtttctatgt ccccttcagt ttagttcagt  55500
tcaacaatta tctagtgagc actttctctg agcggggcat ctgctttgtg ctaagtgtaa  55560
gccctgcctc caagaactca ttgcataagg agagacacac acatgaaaac caactaattg  55620
tgattcagtg taaaatacgt agtaattgac aaatgcatat agtttcatga cagccctgta  55680
gaaggagtag gcaagtgttc tagtatggct tcaaggagga aatgtagctt aaaacaggtt  55740
cggagggatg agtaagagtt taccatactt ttaagggggt tgggaggaat atattgaaat  55800
gaaaattaca ttttgcaaat gcagtatgag gagccgtggt acagtttaat gtgtttagag  55860
aacaacgagt aactgtatgg cagaagcagt aaatatgacg aaggaggaag ctggtgtgtt  55920
tggagaaggc tgagggatca tgaggcatat taccttcctt taaaagccat gccctattct  55980
ccctctcctg ccacttcaaa ttcaggttca ccatttatat gtctattagt cctggtgtct  56040
ttctcatgct ctttgattag tccttaatcc acaagcgcaa cattgcaata cttgcctagc  56100
atatttcaca ggcaggggac ctaatgtccc tgtgagaacc catcttgctg agattgtcgc  56160
tggcagattt acttccagtg tgattgttgc aagaatttgt ctaacagaat gaatgatcaa  56220
ccttgagcag aagagattat gaaaaactta atagcattgt agcaatgtgg ctgttaatga  56280
aatacagttg gctgctcccg ctgtttggca ccaaccaacc tgacactgtc aacatcacaa  56340
tacgatattt attcccaatt attttacggc aacaactgaa atacaatgtg ttattaatca  56400
tatttattat aagtatcaat ttgagaaatt tctgacatgc cagaagataa ataggtttat  56460
tatgaaaagc agttctgctt ggtgcatgct ggctgctgct gtgtaataaa tagcctctgt  56520
ggggaaagtt ttttaaaaga aataaagcaa aaaaatagca ctgaaaacag aaaggaagca  56580
tcaaaactct tcaaatacct gctgtgtcca ttggtcaagc acattcagga catcgcatgc  56640
ctttagaact ccagcaggtt ccaacagcta gtaggacatt ctagactctg agagagagca  56700
agggaggttt tatgactggg gacaaagaaa agagacactg aaggcgaagg acaatctctg  56760
aaaatgcagt accctccaga ctgctcctcc tctcacaaaa acaccttccc agcatgcact  56820
gctttaggga ctatgattat accattgatt ctgtccagaa aacctgtgtc ctgaatatat  56880
tacagggctc attccttcac ttctttcagg tgcctactca ggtatttcct tatcagaaca  56940
gtctttcgaa cgaccccatt aaaaaaatag tcctgtcaac cctatgttaa caattttatt  57000
tatttttatt atttgttaac aatacataat aggtgcatat attttggggg tacatataat  57060
aatttgatac attcatattg tgcataaaga ttgaatcgga gtaattggga tatccattgc  57120
cttaagtgtt ttaccttttc tttatgctgt ggacattcaa attactttct aactttttga  57180
aatatacaat agaagaatgt taactataat caccctattg atctatcaaa tgctagatct  57240
tatttcttct aactatatat tgtacctatt aatctgtaat tccacaacta tatttacttc  57300
ttatactttt ccccttctag gctataaacc aaatgagagc tgagcatctg tttggttcac  57360
tgcccaacac atgcatgcct actacatggc agtcaaaata tttgtggaat aaatgaatga  57420
atgaaaaaaa aaagaaatag atgaatgaat catggatgaa tgaatcaaat cagtcagcaa  57480
tgtctttcta aacaaaattt ggatgatttt ggatgattac gcctcttaaa aatatttctt  57540
catttcctac cccaatttag tttctactca ggactttttc aatatcttcc aaacctattg  57600
ttctttttta tttgtttgct ttttgaggca aggtcttgct ctgttgccag ggctagagtg  57660
cagtggtgtg atcacagctc actaaagcct ccaactcttg ggttcaagtg attctccacc  57720
tcagcctccc aaatagctgg gatgaaagtg tacaccacaa tgcccggaga attatttcat  57780
ttcttctttg tagagattga gtcttactct gttgaccagg ttgctttcga actcctggcc  57840
tcaagccatc cttccacctc agccttccca agtgctagga ttacaggcgc gagccaactt  57900
gcccagccct ggaatttttg agcctgttca attctaacta ttgtcaccaa aagtaacctt  57960
aagaaaaaaa atgcattatc tccttgcttc attgcaccat taaaatcttt cctaaatttt  58020
ccatgttaaa gatgaagctc aaaatcctca gcatagcata caaaacactt cataatcaga  58080
tgcctcttca aatacctcct atcagaatgg tctctttgac taccccttta aaaaaattcc  58140
ccccaaccct atttttaaat tatttactta tttttattat atttttgata cataatagat  58200
ggacacattc aaacagtgcc cccaaaactg gggcagcaga aacaggtcct tgcttatttt  58260
ctcagcttca cctcctgcct ccaccccatc tgtactgctg gtccagacat tcctacagag  58320
gtgtcctcct aagttggtct cttcctctcc tgcttcagag gctttgccct gctcttctct  58380
gcctcttgag gctctgtcct gctcttctct gcgtcttgtg gttggaatgc ctgtcttttt  58440
cctactgaag atctggatgc ctaaaccata atgtaaaatt gctgcttttt acttccattt  58500
acagcagaga aattcctcct ctggcctctc ctcttctctg tgtttctttc ttcataattt  58560
ttatttattt atatatttat ttatttattt atttatttat ttattttcat tgagatggag  58620
tctcgttctg tcgcccaggc tagagtgcag tggtgtgatc tcagctcact gcaatctcca  58680
ccttccaggt tcaagcgaac ctcttgcttc agcctccctc ctgtagctgg gactacaggt  58740
gcccgccacc acccctggct agttttcata tttttagtag agacagggtt tcaccatgtt  58800
ggccaggcta ttctcaaact cctgatctca agtgatctgc ccaccttggc ctcccaaagt  58860
gctgggatta caggcgtgag tcaccgcacc cagcctctct ctttataatt ttcctactgt  58920
tcacctgcat caaactcctg aattctgtca tgcaactgga acagtaagag ggaaaaacat  58980
ggagctcaaa gaaagatgtt gagaaacgta gagttgcata gaatttactg tataagaatg  59040
gaatctgtca agtcagacaa gcgacagaga cctatttaca aagagaccca gtgaaaatta  59100
ctggagaaat aataaagaga aatgctgtga ctttgaaata aataatgttc aaaagtcacc  59160
tgcaatattt aggatagtgt ctgaaacaga tacaaatatt tctcagcagt aaaagaattt  59220
tgtatttagt ctagtcatgg aatagtagtc agttgtcact gaggaagcac tttggggtag  59280
aagaagcatt tgaatgtgtt tgaagtctga ggcagcaggt gaggtttgat tttatatttt  59340
tgaaaatgga tctatcagat ggtggagcta ccctcataaa agatttgtaa tacgcctgtt  59400
tacctacaag attaaatcaa gtgtcatttc ttcagggaag attgcccttc accatgtgaa  59460
atatacataa agtatatgtc acaatgtgtg acagttcttt gctcacatat atatttctcc  59520
acttaaagga gaattttttt tgagatatga tcttgttctg ttatccagga tggggtgcaa  59580
tggggcaatc acggctcatt gcagccttca cctcctgggt tcaagtggtc ctcccacatc  59640
agcctcctga gtagctgaga ctacaagtgt gcactatcaa gcctggctaa tgtttaattt  59700
ttagtagaga caaggtcttg ctacatttcc caggctggtc ttgaattcct ggcctcaagt  59760
gatcctccca ccttagccca gaaggagtct tatttcattc atcgtatatt cttagtatct  59820
acctgtcatc aggcctatag tagatactca gtagatgtag attgaggttt gaagaataag  59880
agatagctca ccaagtagaa cactggatgg tattggaact aatgtattcc tttattgtca  59940
gcagaatgga ccatgcacat agaaataata aaatgggaga attgattgcc atggtctaaa  60000
ttttgtgccc cctacaattc atatgttgag accctgaccc ccaaggtgcc ggtactaaga  60060
agtggggcct ttgggcagtg ataaggttgt gagggtggag ccctcacaaa tgggatttat  60120
gccctcataa aagaaactgc agagaactag ttaaaccctt ctactatctg aggacatggc  60180
aagaagctgc tgttctctga acctggatag aggacctcac tagacgctga ccagcgcttt  60240
catcttggat ttcccaggct ccaaaactgt gagaaataag tttctgttgt ttataagcta  60300
ccaggtttaa ggtattttgt acagcaaccc aaagagtctg agaccataat gaagccattg  60360
gaatggtggg aaggcaactt catgtgagta actacagtaa agccaggtgc tggtaacagt  60420
catgttgccc atagagcaga tcctactatt acagtgccta gcacattacc tgcatatgat  60480
gatatgtgat caattagtta actgattagt ttatgaatca gtctgccaaa aactagggca  60540
gaaattgata gcacattaaa ataaatatgc cttaaagttt gcaaggagac cctattaact  60600
gcgcactgtt ttctttttat tttctttttt tttcttttga gacagggtct cactctgtca  60660
cccaggctgg agtgcaatgg cacagtcttg gctcattgca acctccactt cccgggttca  60720
agcgattctt gtgcctcagc ctcccaagta gttgggaata caggtgtgca ccaccacacc  60780
tggctaattt ttatattttt agtagatagg gggtttccca tattagccag cctggtcctg  60840
aactcctggc ctcaagtgat ctacctgcct tggcctctca aagtgctggg attacaggcg  60900
tgagccactg cacctggcta gccactcact gttttcatgt taggctaagt aagctttttt  60960
gaagaccatt aacataaata tacaacctaa atgtatttta cctgaataat tttactcatg  61020
tccacagctt gttctttcat aggctgccat gatgaggaag aacagagatt agtagtagca  61080
ctattcattt ctgatatttt tgcagtagtg gttctaattc tcactccagt ttagaaaaga  61140
tctgtaggaa atcacaggtc tacatttcgt cctctaaact actctgttgg gtagaattta  61200
ttttgcaaag acttatgtag gatcactttt ttactacagg ttttgtcata tgggattttt  61260
acaacctttt tttctgctga aacaaatggc ttttaatcct taaaagggca gggctatatt  61320
ttccttcaaa catttttaaa ataacttaag agaattaatt tttagtaata gcaagtgaag  61380
aacattttaa tcctagagct taagaaaggg gaggcccaat aaccagatgc tggaaatcta  61440
ttgaggtttt ttttaaattc cagtatccag acaattggca tgaaaataaa ggagcctaga  61500
aaaaatgttg aaaatgaaaa caataaaagt gacaactaaa catattattt tgtatttgca  61560
aagcacttcc acaaatggcc acaaatgtca tctctttaaa ttttattcct gagttgagta  61620
ggaaataaac catttggaga ttcaaggttt agcttaagat atgggtgttt cttgaacctg  61680
ggaggtggag gtttcagtga gctgagatca tgccactgca ctccagccta gatgacagag  61740
cgagagtttg tctcaaaaaa aaaaaaaaaa aaaaaaaaag atatggatgt tgtcaataca  61800
atcgggggaa aggaatactt tgaactactt tgttggaagg agtttgaaat cgttgaggac  61860
tcagcagcat gaagtagaga aattcacaat tggtagaaag gactattgtc cttcaacctt  61920
cattaaggtt aactattcaa ccttcattaa aaacagaaag tgacaatttc acagcaaatt  61980
ctagaacttt agatcaaaag tcaactcaat atgggggatt tatataagaa agagttaaaa  62040
aaaagacgaa atgtaatatc tatgttattg caagtgaaag gaaaacagga agataaatat  62100
cacaagaaga caaaaatgta tctaacattt tgggacaaga ttgtgggatc cacagaaaat  62160
tggaacttgg aacttcctgt tccacagaga taagaaatac acttgctttt atctcacttc  62220
tcaaaaaaag taagatgaat ggggttttag gccccagaga gaaattgtag ctgcaatcaa  62280
ttgtactatc tgagtaaaaa ttgtcctcag aggaaagtga gtagggagct gtctgaaggg  62340
acaggttatt aacaaaagag agggataatg gattgcgttt gcaagtgcag ttggggctaa  62400
catcaatgcc atcttcatag ctggttcaaa aaaatattct ggattctttt agtgtcttgg  62460
ttcttacctg ttgtggttgc agaaggtata aatgtaccct taaaagagat tagggagaga  62520
agtgcctccc acagcaccac gaccagaaag ggaagaggaa ggacaggcaa tagccaagga  62580
ctcctggcag tgaactcatg tccacatcaa gatctaatga gcttgcactc aactcatttc  62640
tagctctgcc ttggaagctg gagctcctgc actgactatc aatgtgagcc cctgagtagg  62700
agcagcttgg tagagttgaa agaccattga tctgggtcaa cagactctgg ttcctgtctc  62760
agcagtgctg taatcaatcc aagtcaaata tcatctctgg gacttaattt gctaaattta  62820
aaatgaaaag aaaaacaaaa atagaacaat tagactagat caggattcgg caaaccaaag  62880
cctgcttatc aaatctggca taccacctgt ttctgtctat acaattgtat tgaaactcag  62940
ccacactcat tcatttgcat attgtccatg aaagaagctt ttgcgctgcc tcaggagatc  63000
tgagtagtgg ccacagagat gttgcagtgg accatgttgc aacattgtcc aaaataccta  63060
aaatatttac ttcttgtttt ggagagtttg ctgactggca ccagagaaat ctatggtcta  63120
aaatcatcta aaaatttaag cacatatgtg tgaccacaca tttcgaaatg ccgtcttccc  63180
aatctagaac acagcacatg aatcagtagg taaacctatc catgtcaatt ctcaaatttg  63240
aaattcattc acttgaaaat ccagcaattt ttcatgcttc atatcatatc tgggtttgga  63300
ataaagaagt gtgaggggag aaaaattccc tgagcatttt aaatctaatt tcacctttat  63360
tatgagacta ctgagtcttt tcttgagcaa aggagagagt gtgaaataga ataaggtgct  63420
caaaacaata gattaaattt attgaaagga tgagtaattg gagtaatgtt acagaatatt  63480
aagcagatta tttagatagc atatacattt ccagtttgat taagtcaatt cacaggccat  63540
caaaaagtac acagaaaaat agagggtttg atccgatagc cttctgcgtt agaatgtagt  63600
catttgctct ctttagctat ttaatctctt ctgcatgttc agagggagaa aatgagtgat  63660
gagagagaga agtaataaga tcatactgca aatccttaca tcgataagat aacagaaggc  63720
ttttcacact ggctaatatt tcatgttgta tttacagctc ttgtccatgt acagatttgg  63780
ggtcattaac agaggtgttg atcagcaaag tcttagagtg agtctaggga aatggttgcc  63840
aaatatatct gggtattgga accatcaaca gagcctgtgc cccagactta ctgaatcatg  63900
gtctctggtg gtggatccca ggtagtcaca gctttaactg agtgattagg agattcactg  63960
tgcagccagt tcgggaacca ccagtgaaat ccaacccctt catttattag tgttggaacc  64020
gtaactttct gaagatgtac cactgtccca gccacttcac ctgtattccc agctcatttc  64080
tctcagagaa aactgccaag tccccacagt ggccttgcat gggccatttg tgatgtcacc  64140
tctctgacct catctcctac tttccttcac ccggttgtgt ctagctattg ccatgctctt  64200
tctccaacac accaagcaca ctcctgcatc agaggctgtg aattttccat ttcctgcttt  64260
gttcctcccc aatatttgca tgaaccactt tcccacttaa tctaattttc tgttcagaag  64320
tcactttcac agaaaagtct tcctcagcca catgtatttt cttcttggtg cttattatca  64380
cctgacattt tatatatcta tgtttgtttc ttgtttgttt cctactccat tcggtaagct  64440
ctaattgaga acagaaaagc tctgtttatt cactgttgta tccccaacat ctatatctag  64500
cacatcattg attctcaaca actatttgta aatgaatgaa taaatggctc tgctagattt  64560
ttgtcacctg gattgccaga ccagtgcaat aatggaaagc taagtaatgt aaagagcttt  64620
gcaatcagac agctctggct tgcattcttc atgtgtgatt ttgagcaagt tactgattct  64680
tgctgagcat cagttttcta tgtgtaaagt ggaggcatgg acactggagg atcatggtga  64740
gaatttcata gagcaggcca ataagacctc cttggggaaa gaaggctaaa gtgggcctcg  64800
ggtttaggtt tcccccactg ggagttccaa ggggctatgg agttgatagg attccccatt  64860
tgggctgcag aggagccaga aacatgcttt agtttcttaa tcctgaagga gtgggggatt  64920
gtgtaagcct cattggtgcc cttttgaacc acatttcatc aagatattgt gaaatgggga  64980
gcagcaggca gccttctctg gccaacatgt atcagggcct cgtgcttagt gggatgtgcc  65040
cagagtagac agggaatccc tggcagcctt gcatagtccc tctcatgcct ttgctttcat  65100
ggggctggct ggaaacaggc cggtaagccc catggaacta ccgggacaaa ttaccaagca  65160
atctcccatg gccatgtaga acagccatgt agaacaggat gtctcccaag gtaagattta  65220
aggtttgtgg tttgcagaaa agagaaggga ggaaataaaa aagcactgac aatcattgaa  65280
agcccacgtt ctaggtaact ggctactcac tttcacagcc cagtaacaat tttgcttaat  65340
cctatacatc tataaatagg attattgtct tcattttcca gataaggaaa caagacttgg  65400
caaatgtgta gtgtagtgtt tgacagtatt atgtagttgt ttagcatgca catgaacttg  65460
caagaccttg ctcttcccta ataattctgt cctttactaa ttctgtgatc ttacaagctg  65520
tgccttatgt attttgtgtt ctattttgta aaacctaatg acaacaacat aataatacct  65580
tctcatagaa caattattgt gataaattaa gctgttgaga gtcaggcact caacccaaca  65640
acatgcccat aatgtgtact caataaatgc ttgctagtat ttttaataat attgttaata  65700
aaataaccca gccagaggta gaacccaaga ttccgactct agttgacctg attctaagcc  65760
aactcttcta cagcaacaca tcggcccatt gatttagaca gcatggaact catagcccag  65820
ggaattcaca ctcttaaaga acttaaacag cacagcttaa tatggtccct tccaaacata  65880
cgactcagta attccagtag gagggctaaa caacctattc tgagaggtct ccaggaaagg  65940
aagcctggag tcttccctgg aaacatgttc ccttatcgca cctcccttct cttcaggatg  66000
ctgaggacct ctggctccat ggacttcatc ctcccataca attggttccc ctcacaatta  66060
gtttctggca ctgtcatcaa agtgatccct ctccaaggac atggaacagg atgaaaaaca  66120
aattgtaatt gtaaactcga agtacgatca gggcaggcac agcaaaggag gaaggttacg  66180
ttgtgggaat caggggtcaa caataaaagc cagcctgctg cctgtcccca ccaggcaatt  66240
ttctgggctg ttcatgtccc cagttatgcc cccaaacatt cccatgacag caatgcctaa  66300
ggaaaataac ctctgaagat tgagcctaaa actagaatca tttttctctc tcattctaat  66360
tcatagcagg gaagtggact ggctccttaa atccagaaag tatcagactt atctgatcaa  66420
atcattaggg caactgtgtt ttccctcatc tccagacagc atggatgagg agaaggagcc  66480
aaaagacaca gcatctctct tcaaatgaat actcaacttc aaagaagaaa gtgaccactg  66540
ttaaggaggt gaagtcatag cctcggcaaa cctttgaagc tgggggagaa gatgtaaatt  66600
aagcaccgac aagcagggta taaaaataaa atccttgaag gaaaagcaaa actgctttgc  66660
aatgggtgtg aaagtaaagg aagctggcca aggccagagg aggtaaacag ggttgcatga  66720
tgtaaccaca ctaggaaaag gcaaactagt tgagaaatat agagaaaata catggaagtt  66780
gtaaattgtc tattttatct gagaacttat aagaatcaaa gtggaaacaa ggtcaatttt  66840
cttaatattc aggccattat aaacccttgt ggggaacagg aaacttgctt ttatttgctg  66900
tttctgcaat agtgttgttt gggtacacga caggaccatg gaactctata atcttgtata  66960
gggatacatg ccaagtgcca ttcctgattc ctttgtagtt tttttttttt cttatgtctc  67020
ctattagttg aataattcat tttttgttta tttattcatt cattcaataa actgcttttg  67080
tgcttacagt ataccagaca ctctactaga tgctaaataa gcaaagatga acatggcctt  67140
gtccttaccc ttaaagaacc ataactctat ataaaaacac atttaatttg taaattagag  67200
gacaggatag ttagtttgtg atagagaaaa ccaaatggtc ccaaaggaag acaaagtata  67260
aagttttgaa aactatcacc ccaaaattca catctacctt gaagtgcaaa atggcaactt  67320
gtttggaaat acggtctttg cagatgtaat tagttaaggt catagcagat taggatgtgt  67380
tctaaatgca atgactgata ttcttaaaaa ggagagagca tgcactcaga cacacacagg  67440
gaaaaaatcc atgtgatgat ggaagcagag actgaagcca agaaaagaca aggattgaca  67500
ggagccacca gaaactaaaa agaggcaagg aagcattttc cctagaaagg agcatggctc  67560
cactggcact gtaatttcag gttgctagcc tctagaacta taaaacaata aatttattgg  67620
ttttcttaaa ctacccaatt ggtgttactt tgtcatagca gccctaggaa gctaacatac  67680
aggtgaagga catttaaagc tatagtagta agagaagaga tgtcctaaga tgtttctttg  67740
gtgacatcat gtgattttta atatggattt tgctctaggg aattatctct gtcactgcca  67800
atcaaggtac cttgctccac tcatcaaggg gtggcccata tccaagctgg agctttttga  67860
ttctctcttt ctgcagtttg gatatttatg ctgatcatag ctcccagaaa aaaaaaaata  67920
aattggccgt tttgcttcct tgattccagg agctgtccca gctcttgtgc atcctacaac  67980
tcagttcttt ggcttttcct tctttgtttg cttaagtgaa ccaaagatgg catttattgc  68040
ttgcagcaaa gaagtctaac tgatatagga cccatgatta atgttctggt tcttctttta  68100
cagagaacat gatagtgttc tctaatttca tctttttttc tatttttttt gttctgttgc  68160
aagaacaaat ctgctatatt tatggcaact tgtggcaata atggaagatt ctaagataca  68220
tttttataaa catgttttag ccctggataa aataacacct taattcatca tggtctcttc  68280
atctggaatc ccctttcttt taaccaattt cacataccaa aaattatttt ttgaccacag  68340
aaatgcctta agggataaat aaataataca gtcatcagag tttaactaaa ctgggcttta  68400
actgaggtgc ctgcaatcaa ttgtatatgg tctaaatttg gacttagcct tcctgagcca  68460
tgggcttccc aggtcatatc caccaatggg tcattcttga aatcagaaaa gtattatatg  68520
gcaggtactc agcccagtac ccgacatata gagatgctaa aaatattgtt tttctctctt  68580
tctttcttct tccaatcctg accctccaaa ggtcatcctg actcttctca aagcctgtcc  68640
ttttttctca agtggacctg tagctacaga aagttgagaa tgataattgg ataaatgagg  68700
acagatgtct ctttagcccc cttcctcttt agcttgctgg ggtctcctga ctggattact  68760
ctcagctcaa ggaacccctc cctcaacctc aaaaagagaa gacaagattc atttttatac  68820
aatgttgttt gtcaattcaa tccaatctca aagtacgttt tgccttctga aatctaaatg  68880
ttcacgtttc tttttccaag gtatctatat tcatttaatg gggaaaaaac aatacctgga  68940
gtcattatat gtgcatctat gtctttctaa atatgcacaa gcattttact tgaatatttc  69000
caggtcctgc aagaaattct gaaattgatt ttcatttgtg tggcttcagg attcatttca  69060
atggcagccc aaacattctt ccagcagaat ggccattcag acctgcttaa tgttgtgaat  69120
ccattgatat ttttaccctt ccaaaagcat acactattga ttctgcctct ctcttaattg  69180
cacagaagaa aaactgactt ctcatgaaca caacttgata tctcatttga tatcttcatt  69240
ttcataccag tgtaactgag ttatcaatgt ttgcttggac cagactatta aaacagccac  69300
ttggatagtt tgggttttta aaaagtctgg caaggtattt gcctcattgt tattatttgg  69360
aaatttctag aaatatgtca tctgtaatat cagtgtactg gcccaccaac tgggttagaa  69420
gtttctgttt gatgttcttc ccccaggact cccatcctat tctatcttac ctctagggtg  69480
gcaatgatca cattgtccca gaaaaatgac catataactt tatttttcaa actggaactt  69540
tcaagagtga aagggaggat ggttattaat taagctagga aaagggaata aactcagaat  69600
gtcctaagta aaaataggtc actctgattt tcaccattag ttcagtgctg tgtctcttcc  69660
tctagacatt aagcccctgg ccatatttag cttgttctct gctctctctc tagcatctga  69720
catagtacac agggaaggat ctgcacttca gtcatggtcc tgtgtcatgg caagaacaga  69780
taaaacaatc tccctcaaac ttacaactct tttgttgtaa tcactagaat atattatatg  69840
ttggtatcac tcaaagtagc aattggccaa tcatctcttc ttttctggct aattgcttat  69900
ccttcaagac acctgatgtc aactgcattg aggtacattc ttatatttgt gtagcattct  69960
gtcttgatat ctttgtgctt gatcatgttc tattataatt gtttctttaa tagacagctg  70020
agaactgctg tgaactccat ttcttctcta taccagtatt tagctcggag cctgtcacag  70080
aataaggaaa tagtacataa caactgaatg aatgtatgtg cagattcgtg aatgaaaaaa  70140
tgaaatatcc agattggaca ttagaatatt ctatctgtca actgctgttt ggtttgcctg  70200
atactgatta tttgcctact tggtaatatt tatatagcta gaatcatgga cccacagact  70260
actataaact aagagacaat tccagacatt agtaagacag aaaagttttc tagtatatca  70320
taaaatatta aatctgatag tagcactacc aatggcatga tatatttaaa ggtgaacata  70380
gagctaatgt tcatataaaa atcatcctgt gatatttgtt gctgcttaac atttttaatt  70440
caatttcatg ggagaacaaa agagtgatta agagctagaa aatagaattc atgagaaaag  70500
gttagaggaa ttgaaattat ttagcccaga ggaaaaaagt atatgtagcc attcagtgat  70560
tcagtgaaac ctcattatcc aatatcagtt tattcaaacg atggcataag ttaaactgac  70620
agctatgttt ccaatgaaca aatgacctac catttcttaa aaaataaaaa aaaaagataa  70680
tcagaaacca tttaacttaa atatcttttt tttttctgtc tgatctcgtc tattttggat  70740
tataaaggat ttattttaca tgaaatcttc tgggtcacac tttgcatggc agtagaggta  70800
gtagatcagg tcaaagtggg ttgtgcccca attttttttt ttctcttaag tttctatttt  70860
ctaaaatgct gttgtgtttt cattcattca acaagtattt attgaggaac tatgcatgtc  70920
agcgtccatg ctaagcacga gggacataga agctatgaca cacaagctat ttgcattatt  70980
ataagatgtt tcagttaagt tcctccctta ccgaacttaa gtgtgttggg aaacattaaa  71040
aagtcatacc cctgacacag tgagatggta tctcactgtg attttgattt tcatttctct  71100
aatgaccaga gatgatgagc tttttttcat atgtttgttg gctgcataaa tatcttcttt  71160
tgagaagtgt ctgttcatat catttgccca ctttttgatg gggttgtttg ttttttttct  71220
tgtaaatttg tttaagttct ttgtagattc tggatagtag ccctttgtca gatggataga  71280
ttgcaagaat tttctcccat tatgtaggtt gcctgtatac tctgatgata gtttcttttg  71340
ctgtgcagaa gctctttagt ttaattaggt cattaaaacg tcaggaaaaa accgatgttg  71400
gaaaggatgt ggagaaatag gaatgctttt acactgttgg taggagtgta aattagttca  71460
gccattgtgg aagacagtgt ggcaattcct caaggatcta gaaccagaaa taccatttga  71520
cccagcaatt ccattactgg gtatataccg aaaggattat aaatcattct actataaaga  71580
cacatgcaca ggtatgtttc ttgcagcact gttcacaata gcaaagactt tgaaccagcc  71640
caaatgccca tcagtgatag atgggataaa gaaaatgtgg caaatataca ccatggaata  71700
ctatgcagcc ataaaaaagg atatgttcat gtcattcaca gggacatgga tgaagctgga  71760
aaccatcatc ttcagcaaac ttacacagga acagaaaaca aaacaccaca tgttctcact  71820
cataagtggg agctgaagaa tgagaacaca tggatacagg gaggagaaca tcacacactg  71880
gggcctgtcg gagggtgggg ggttagggaa gggatagcat taggagaaat acctgatgta  71940
gatgacaggt tgatgggtgc agcaaacgac catggcatat gtataactat gtaacctgca  72000
cgttctgcgc atgtatccca gaacttaaag tataataata ataatagtaa agatatcacc  72060
ccccaaaaaa gtcatacccg taggttaagg catctctaaa gtacacgtat tcttatgttg  72120
ggggcaagga agtagcaaat taagctatta tctgtattgt ttatggaatt atttttcaga  72180
tgggttccca ttgaagagaa aatgggatat agatcaaatg agctttgaag gataagaaaa  72240
aagaaatgag ctttgaagga tgaaaaaagg aatttttttt aaaaagacaa tcatgttggg  72300
aaaactggat atccatgtac agaagaataa taatagactc ttatctaacc acttttacaa  72360
aaatcgactc aaaatggatt aacagcttaa atgtaacacc tgaatctata aagctactag  72420
aagaaaatgt agggggaaag cttcattata ttggttttag gtatgacttc aaaagcacag  72480
gcagcaaaag caaaaataaa gaaatggaat tgcatcaaac taaaaagctt ttgcatagca  72540
caagaaacaa ttacagagtg aagagatcac ccacagatta ggagaaaata tttgcaaatc  72600
atattgcaag tcataactgt taaagagcta atatcccaat tagacaggga actcaaaact  72660
attcaattac aaggaaacag agaacccaat tttaaaaacg ggcaaagaac cggaatagac  72720
atctctcaaa agatgaaata caaatggcca acagctatat gaaaaaaatc cttaaaattt  72780
ttaatcatag aaatgcaaac taaaaccata ctaagatatc aactattata ttggctatta  72840
tcaaactgat gaaagataag tgttggcgag gatgtggaga aaagtgaatc catacacact  72900
gttggtggca ttgtaaatta gtacaggcat tttggaaaat agtatggagg ttcctcaaaa  72960
aactaaaaac agaattatcc atatgatcca gcaatcccac aactggatat gtacccaagt  73020
aaatagaagt cagtatacca aaggagatac ctgcactccc atgttcattg cagcattatt  73080
cacaatagcc aagatatgaa aaaaatctgt gtccaaaaat gaatgaatgg atttttaaaa  73140
tgcagtacat ctacacaatg gaatactatt ctgcctgaaa aaataaaaca ggaaattcta  73200
tcatttacaa cagtcacact tgaaggatat tacgttaagt gaaataagcc aggcacactt  73260
acatgtggaa gctaaaaaaa cgggactcat agaagtagag agtagaactg tggttatcag  73320
aggcaggtgg gggctaggag ggtagtgtat ggggagatga tggtcagcag gagatgttgg  73380
tcaacaggtc caaagttaca atgttaggtt tgtgcaacag taattgcatt tttgccatta  73440
aaagtaatga caaaacgcat ttatccactt gcttcaaatc ataattgcta ggaggaataa  73500
gttctagagt tctattgcaa tgcgagatga ctataattaa taataatgta tatttcaaaa  73560
tagctaagag atatgacttt cgatgttctc accctaaaga aatgattaat ctttgagatg  73620
gtgaatatgc taattacctt gatttatctt gctatcttgc agtgcttaca tgcgtcaaaa  73680
atcacattgt actttataaa tatatagttg tcaactaaaa attaattttt aaaaatatta  73740
ttaaaaataa aggttattaa aaataaatat tttattatat aaaatgttat tttaagaatt  73800
tagtattaaa ttcttaaaat ttaaatttct aatttaggat taaaaaagtt agagctataa  73860
agttcataat attaagctga gaaatataaa attcacagaa gtcagttgac aagttaacac  73920
aataagttag taattactgt gactatactt ccggtctcag atatcttact atctagtact  73980
cttttcttct tccaaattag tatttgcatt tatttactaa tagtaactat ttgtatatgg  74040
ttgtgaataa cagaacccaa ctatgatggc ttaagcacat aatatttatc cacctacatc  74100
aaatccacag ctaagcagtc catagctgct ataacagtgc cacaaagtca tcagagacct  74160
agactcctgt cattatgctt tacccttttt gttatgtagc tgtaatcttt tttttttttt  74220
tttttttgag acggagtttc gctctgtcgc ccaggctgga gtgcagtggc gtgatctcgg  74280
ctcattgcaa gctccgcctc ccgggttcac gctattctcc tgcctcagcc tcctgagtag  74340
ctgggactac aggcgcctgc caacacgccc ggctaatttt ttgtattttt agtagagacg  74400
gggtttcacc gcattagcca gaatggtctc gatctcctga cctcgtgatc tgcccgcctc  74460
ggcctcacaa agtgctggga ttacaggcgt gagccaccgc gcctggccta tgtagctata  74520
ctgtttaagg ctacaagaag gctgcttgac atatatttag ttttgttgct aagtgaaaaa  74580
aaaaatattg ggtaggcaac ttgttatctt taccacatcg ttgttaagag acaattttct  74640
atgggtctcc agaatttctg cacatcttgt agacagaggc actgcctctc tttgttccga  74700
agtgattttc caaggttgtg tataagcctt ggaagctaga gatcatgtgt cccttcaaag  74760
cagagagaag tttctttact gtccaatata ataaaggtaa tgtctgtctc tctggggcga  74820
agattaggca tgagcactgc cagttataaa agattcaaat ttgctaaact cagtatttct  74880
ttcctgtaac acgatgcatc atgtgtgcag gcatcacatg gccctattca tgtcacccta  74940
tgggaattga ggcccaggga ctggcttgag aaaatgaagt tactggttac tgttattgtt  75000
gtaagtaacc agatgtcttt tgtctctgac tctgaaatat catgccatgt gccgatacct  75060
atgacactgc agcaggctac cttgttagct tgcaagtaag tttcagaccc ttcacagttc  75120
ttgacagtca tccataactc gctttgtatg ctataatatc taaggtgtct aactccaagg  75180
tgtctagaac agagtaggtg actaatacat acttaaataa atagagagtc ccaaaaggca  75240
ttttaatgag tcagaccagt tgacataaag tcccagatga taccactgag gagccttatt  75300
accttccaca aaatcactta ccctctctaa cctcagcttc ttaaattagt agtctgcatt  75360
ttctccttcc ccttgctcaa ctgttgttta tttcctaact tactgctaat tggctatggg  75420
cctcatccct tcagagaaac tgttcttcca gggtctctag tgacccacta actggcacag  75480
cctgctgacc ctttccactc tgtatctcac tccctgctgt tctgttaaca tttaactcct  75540
taaaactctt tcttttcttg ccttccatga aacttttctc tcctggtttc tcttatatct  75600
ccaggaaact atttatccgt ctcttcttcc attatttact cttaaacatt gatatgccat  75660
aaatgcccac cctccctcca gccctcttct cactctgtag aataaagttt ataccttttt  75720
tttaaaagaa aaaattggtt ttgcttacca tgtttgtgct tataactttt gaatttctat  75780
ctccagtcca gatttttctc ctaagcttca aatctatatt tttaaccccc aattcgttac  75840
ctctacctgg atgtgttatt ggaatttcaa atgaaaacat gtttgaagtt acacttatta  75900
tttattttcg cacctcccaa actggtagag ctggcatccc tttctcagtg aatggtatca  75960
ccattcatga tttttttttt ttattttata aacctatcga ctctaaggcc aataacattc  76020
ccatccagta ctatggctgt ctcatcaata cttctcaaaa cccttgtctt tcttcccact  76080
gcctccccat taatttaggc cctcactatc tattacgctg gccccatgtt caaaccgtgt  76140
ctccagaatc tgtcttactg gatcataaaa gcccccagaa taaactttca gaaccaaact  76200
cacataatgc tgctgccctg attaaaatct ttctttggct tttctcggtc agaagaatgg  76260
gagaaagttc aaactcttta gtatgataca cacaaccctc cttaatctga cagttcctgc  76320
ctcttcagct tcacttccta tttctctcca tctcacagcc tgtgccccag ccataataaa  76380
ccactcacat tttccagcac gtgccctgtt aatatagacc ttgcaccgct aaatagactg  76440
attcttctac ctgctatttg acatcacccc caaatccagt ctagggaatc tttcatcctt  76500
caaaagctat agcttaactt tttctagccc tgggaagttt acccttaact atcaaacccc  76560
tcactcttaa gactggtgga ttactgccta cctggtgctt ctctctacct tgaaggattt  76620
ttttttttat cacatttatc attgctgtac catactaact cgttaacata cctgaaacca  76680
ctaataaaag ttgtcttatt tatcgttata tgtccaacac agagcacaaa tccagacgca  76740
gagtggaggc tcggtaaaat tatttaaaga gtaagaaagc tggagaattt gagtaatacc  76800
agtaaaaagg cagttactga agtggaatga aaggaagaaa gcacagaatt tacctttttc  76860
atagtttgcc ttaagtaaac tctggaatgt tcttaggcaa tgatcaccct cctgggcccc  76920
aaaatgagaa atcaagttca ccaggaagta gccaattggg aatggcacat acaaggacag  76980
tgtccttcac ctcccagtcg gtccaaagat aagccagtgg ggaaaagggc agctacaggg  77040
caatggtttg tcttgaacta caaacctaaa gaacaaacta tgaccattgg gaaactttct  77100
agttaaggag cacacagtct ggcccagact gagtttgcca gattaggaga gagagagcac  77160
tgggcaggag taaaggtcag aaggcttggg tgcaggtgcc tctgctaacc tcaccactcc  77220
tgggtccttg gacagtttct ttcacttctc taaacctctg tgtccccata tgcaaaatgg  77280
aaatgcaaaa tacacatttt accgaattca tgagtttgtt aagagaatta aaaaagagaa  77340
tgtgtatgga atgttttcac agtgcccaga acagggtaag tgctcagtaa atgttaatta  77400
ttgtttgtaa tgaaatacag aaaacactca agtaggactc agctctgttc cagctattct  77460
tcaagaggtg tgacgaccaa aatgtgtgta aaattattaa ttatttggct caaacacctt  77520
tcctcttcaa tgtgtagtgg agttccttta tagatttatt acaaaaaaaa taagtttaaa  77580
caactaaata caccctgtgg aatgaaaatc aaaaatagtt actctggtat taaatagcta  77640
ctgtagcatt aattgctaaa gaaattacat agagaacaac acacaggcat aatgtaccat  77700
agcaataccg ttaaattcca ggccctcctt catgaaatgt ctcttttctg gcctcccttt  77760
taatcttcct actttcttca tgcacatcct aaaagtccac tcctgtcttc tataccccca  77820
acactttcat ctcagattgt ttatactcat gtagttgctt cttttattac tagttttttt  77880
ctaactgcaa tgaactctcg gttttttttt tttttttttt gtaatcattt tcttagagtt  77940
tgcactttag gtgcagtttt tattaatttt attataaata ttcacttgcc taattgctat  78000
tcccactggg gtattccaca gagaacttaa atttcacaag tctcaatttc aactcatttt  78060
cttcttctta atgcaaattc ttctcctatg acttctaatg gcaaacacaa acctcatacc  78120
caggatagta cacaccaaag ccagattatt tgaatttaac tcccagatct aatagtcagt  78180
tgctgtgtga cctggaataa attattaacc ctctgtgcct ccttcttctc atctgatatt  78240
gatattactt aactcatagg gtctttatga gggttaaatg aattatcacg tgtaaacact  78300
cagaatagct ccaaaaacat ggcaattgtt acatatgcaa gtagcaactc accaagaaaa  78360
actaatctga aagccatctc tgaactccta cttccattta gtcacttttt tttttttttt  78420
ggagagagtc ttgctctgtc gcccgcactg gagtgcagtg gtgtgatctt ggctcactgc  78480
aacctccatc tcccaggttc aagtgattct cctgcctcag cctcccgagt aactggggtt  78540
acaggtgtgc accaccacgc ctggctaatt tttgtatttt tagtagagac agggcttcac  78600
catattggcc aggctggtct tgaactcctg acctcaagtg atctgcctgc ttcagccttc  78660
caaagtgctg ggattacagg catgagccac catgcctagc cacttctttt ctaaatattt  78720
taaatagatc catatcagga tatctctact ttcattacca ttgtttaaac ccaatcttct  78780
ttaacctaaa tagtgtaaca ggctctgaaa tggttcactc atttgttcat ccatcatgta  78840
acaggtaaat attcacttct tacttttaac ctgacggtgg gaagtattaa tgtatgggat  78900
agtcatgctc tcctccttct ggtcttgctt cccctaatcc agaataatca gacagtgcca  78960
ttgccccatg atccccaatg ccttcatgtc aaagtcaaaa catttactgt gccatgatct  79020
gacccttatt taccactcca tcctctctgc tttccattcc ttgtttgaat ctcagctgta  79080
agcactcgtc tccttgcttt gtagagaagg agccatgttg ctactttcct ctgggacttt  79140
gcacctgtca tttactctga tttcctccca agtccaccct atccacacac ttttgaggag  79200
ctagttccta ttggcggttt cagcaagacg tcttccctgg ttcccagacc tatgttctga  79260
taacatgtag aactcagtcc tatcatgaca caaaattgca ttgagttgag ttttctggtt  79320
tattcatctg cccggcatac tgtaaggggt atttgttaag gaaattctaa ccaaaggaac  79380
aaataaactc tgaaacttca gtggcttaat ataggtttta tatatatgta tatacaaaat  79440
gtatagatta tatattttat atatgtacag tatgtaatat tttagaaata atacactata  79500
caaaaatagg ttatatacat attctatagt aatatattaa catatttata tattatatat  79560
gagatataca tctagaatat atgttatata tttatagatt gtatattata cataaaatgg  79620
tagaatattt ttataaaata gaaaatatat aatcatatat aatatatatt tatatattat  79680
atattatatt tacacataat atataaatac atttataaat aatatattta tatattatta  79740
tatttatata ttatatataa atattatata tttcctcgat tcatttatta taatatgtac  79800
atgtgcatgt ccctttaaga gaagagaggt atttctggaa aggagttgtc caagcagaga  79860
tgacttttcc tagcctccct gataatcata tggagtcagg gactgtgtct tgcttattgt  79920
ttgttttctc tgcctaacat agtacacagc tcagaggatg ttctcaataa ataagtatga  79980
gataaattga tactttacct ctctggttgc agcttgtctt tttgctaatt acacagatat  80040
gggaaggttg taggattcaa ataaatttta caataagctg tttccttttt aaacttagag  80100
agcatctctc aagtctaggg gcatgtcact tttccatcag cttccctgct atgaacactt  80160
tgtgaatcat cctaaattac atcaaaagaa aagacatcat gttctcttct gcttggtgat  80220
acaagagggc ttttccactg gaaaaaatac taaattttct atttcctgtg tgttaccagc  80280
aaaaactttt ttcacaagct gctgctttct gggttagagt gaataagtaa ctaaccaatt  80340
agctcgttca tttccaattc aaggacatca acaatcctct catctattgg tggcaaattc  80400
ttgtcctatg tgatgtcaac actttaatct gtctatggca agcattacta attattcata  80460
cttacctttt agccctgtct gtggcttcag aataatttcc aacgcaacca tccaaatttt  80520
gacccacagc gtgttacatt tggcattgcg gtgactcagt tcctcatctt tagtgtactc  80580
cttcatcgtt tttgcagata taaagaagtt aaaggaaagg aaggtaaagt aactacaaag  80640
aacatgcaag atgttggtag caaagcaaaa cgcaaaattt tgggattctg atcctcagcc  80700
actatttttt ttttaaccac ttggaaatag acatctaaag cagaaagaaa tgttccagaa  80760
gccttggtgt gtggggggtg agtggatgtg gctgtatgcc ctaaagacaa attttaagtc  80820
tcacaacttg gctgcgggca agctctggtg tttagcaagg tcttgtattt tgggtttaca  80880
agatgctcat ttgtttctca atggttccag cttgtccttt cacctggaat gttgtcagga  80940
acctggggcc tagaaacagc tgataaagat aagctttgag ccactgagtg tccttgggca  81000
agttggcatg ctgctccggg cctcagttgc ctgctcgaca aaatatggta ttgggttttt  81060
gaggtaaatt tagattaact tgtgtgaagc actgaatcca atatatggtg tctttaggtc  81120
caacctcagg tctccctaca tgttgtcaga aaaagacatt tgagcatttt aagagtgaaa  81180
tcaaaagtgc actaccaagg tttctaacag cccagttctg tcctggcttt tcttcctgca  81240
actgttttca gcttgggtga gtcacttttc tctctggacc tccattttct cacctgtaaa  81300
gtaaggagat tggaaaatga tcttaaggcc ctttcatctt tgaatatcta tgattctgtg  81360
cctctctgta tctgagtccc cagaattctt tttcttggaa tatctccctc agttgagaga  81420
aaattataag aagggctgct tcccaggttt attttgggtg cagtggccag tctcccttga  81480
acttggcatt tgtaactaat ctctataagc aaagtgtgct ccaattatga cttcacccta  81540
ctggcccagc agagctattg ggtgctgcca gtagggataa aggagtgttc cagccatgag  81600
gcaactattt tgttacaatt aatggacatg gggttgagag acatgtccct caggcattct  81660
cttgtgccac cttgaagagg tcatcctagg taaaagttct ctgaagagaa atattggcag  81720
atacatatgg caaaacacag cctccaactc cagtcaaacc accaccacaa gcacagtgaa  81780
aagcagaaaa gaactgttgg gtgtagtagg gtggaggtga agaccttggt cctgccttta  81840
tgaagcatac atcacttcgc accaagcatc acgcttggtg ctggacacaa agagatgatg  81900
aagatgcaaa atgtggtccc tgtttttaag gagatcacag ttttctcagg cagtcttaca  81960
gtaactatgg cagtcaagat attaataata atatatatct tggacattca cctagagatt  82020
aaaatgatga ttctagcaag ataagtcatc aggtaattta gattataggt gggaataatg  82080
aatctttcag aattactaag tggggccttc catagaagag tataattcaa gacacattgg  82140
tttcaccagt ggtgacctcc cctcaaagtc agatacaggg gagcagactt aatattgttg  82200
gaggaaaaga gagtcaaaac ctaccagaag gagcatcaca agggagacaa agaattgaat  82260
tgtttctgag ttggtaatgt gaaagttgct agaaataatc cttgctcagg tgctctggga  82320
ctagtttatg tgccagctgt gtgcacaaag tgaaaggctt aattgctaga actgtattac  82380
ttttggctct agtctgctgg accttccatc tcccaaactg tagctccctg gagctttctg  82440
gaagtgcttt tgtattcctg gacttaccta tagcatactt ttaaaggcaa gggaagcttc  82500
ttaactcctc ttaaatcagc taagctatgc tggggtagta ataaacacct atatctcagg  82560
gacttaacac agatttctca cccacatcac agtccagtga gggcttctct ccatcctaaa  82620
actttccccc tggaactcaa gtctctctat gttgccttga aagggaaaag agagccgcag  82680
ggtcaggatt taaggaccat gcctagaatg gcttacataa tttccaccca cattgcattg  82740
tcccaaattc agtcatatga tcccaactta ttgtcaccaa aatgctaggg atttggtcta  82800
ggccctgctg ctcacagcac agaatgccaa tcaaagagac aatgagtatt gccatggaag  82860
aaggctttaa ttggatgctg cagctgagga gttaggagat cagtctcaaa tttgtctttc  82920
aaattagcta aaattagggg tttacatagc agggaagaaa tgtaaccatg tataagaaaa  82980
caggaattag ggaggggtaa ggaagagaag ttggttgaca ggaagtaggt ggaaagttag  83040
gcaatcctca tgggtgaggg gtctggcatc tctttgtcca gatgcagtga tctggtaagt  83100
ttcacctcct tgatactgtc tgggaggtgt gatggttggt ttcctgagaa agaaactgag  83160
ataagacaaa tgtaactttc ttgagtttca agactggggg gatcaatttg tatgtttatt  83220
caatagaaat aatagacatt agttctgtag aaaacttgga ccagtttcag tctccccttt  83280
ctattttcag ttcctcgatc atgggaaatt tggtcattga tctttctggc tgcttcatgc  83340
tgaggagggg cattacaagc agctccatac taagggtgat gaatcaaatg ttaatctaat  83400
actgcagtct ccttctatga cacaatcttt ctctctctag tctcccactt ccaccaaaga  83460
caaatcatag caggaccaac ctacctgcaa aattagcttc agtcccatat acttggcccg  83520
attacccaca gaaagtacag caagcatcat catccacata gggtctccaa aattggcttt  83580
cctggaacca ttcacaaggc catttcagtc aaagccctgg gaaaataacc agttcctcca  83640
actgtgtctc attgtaaaag aaaacagatt attattgaac ttatgtaagc aaccatattg  83700
ccataaatta agaatattca caaatagttt acaaattcta cagaaatcag gcagagagag  83760
aaatgtgctt caaattctat tgacaagagt acactctact caattgctaa aggttgtaaa  83820
cagctcaaaa gaaaaagtgt tctccagact ctgaaaaaca aaacaaaaag aatcagcaat  83880
gtttcaaaga accaaaaaaa aaaaaaaaaa aaaaccataa aaattatttc tgtcctccat  83940
tagctcagtc catgcaatca actcccactc tgcttcatat tgggttagta atctttaaga  84000
acacatcagc ttttcaatta atatcctgga agttttctct ctagcccaat ggcaaaatct  84060
ccaaagttat cagaaacctg cattcaagga ttcttttaat gaattcccca aaagaagcaa  84120
gttccagact gtagctgatg ataagcctgt ttttaaaaac aattgaagca aaataattat  84180
ggatgagaaa agtctcaaca gacacaattg acaagaaaat ttggttattt ctgtgacata  84240
caaaaattta acataatcgt aattattact gataacgtat attaagacat cagaatttta  84300
ggaatctcat gcattaatgt taaagctaat tttaacaaaa ccttataaac aaatctaatt  84360
tgaatcagtt tgatcataag gtaagaagtc ttttataacc ttttacaatg ttttttatta  84420
aagataaaat cattgctcta agaaaactgt gttattccat cacaatggcc cagatactgg  84480
tattgcatca gtgtgctttt gatattaaca tttaatttat agaaaacctt gaactaattt  84540
gtcccttaaa attagccctt aaaatctcac atgcgcccac atcttccaca atagttcctg  84600
ggcctacagg gattgaatag tttcaatttc tagccctgtg tctcgggcaa gttgttcatt  84660
ttgattgtca ccttctcctg ggtctgaaaa caaggctttg actactgtca atgttcaaga  84720
tttggcatga gtctgtgcct tttttagacc caagagtcaa agtcctaact taacagtaca  84780
aggactagtt aataggacat ttatattata gaaagtcctg tcattctccc tcacatgtca  84840
caaattaaag cactgtgaat tggtgtctag tagttaatgc ctgcagcact ttaaatcact  84900
gtattaaagt ggctagatta ttccttgcat atatctaatt tctaacattg tagtgacaga  84960
actgtgaccc aaagcatcaa aaatgtgata ggtccaatgc caaacttatc caagtaagac  85020
aattaacttt attctccatc atttaagaaa atggtaaatg caaatatcgg ttttggaaat  85080
tcaatatgaa gataaataat ctctttttgc ttaaatacta tacagtgaaa cagggacaaa  85140
gtaaaaacaa gcacagaata tttttttctg ctattttaaa agagcatcat catacatttc  85200
caagactggt ttctagatac ggtactgaca actattaggt agatttcaac tccagaatct  85260
tcaaaacaga ataatactag aatatatttt gttttcaagt acacacatta aggcctaata  85320
gtgataacag atttggaata aaaaagaatc actagaaagc ctgacatttt tactactact  85380
taatccaagt gaatgtcact tagttttgat agtggtaaat acaactaaca tagtctgaga  85440
gaaatcccag tcaatataat ttcttttaag gacaaagcta gtctttcctg aacattaaaa  85500
ctttgtaccc ctatcacaat ttttcctcat tacctaaaga aaaagatctg aaaccgattc  85560
aaattattga ttgaattgaa tttccttagg gaaaaaaact gtctaaacat ttcttctctt  85620
acctgctttt ccagataaat aagtaatcta ctatttctgc tcagaactta tttaaagaaa  85680
caaggttttt tgttttttag gggttctttt ttgacccata gcttaaagct cttgtagctc  85740
tctagatcat cagagtcagc aaaaccaatc aaatttttaa tggctggtgt cccctatcca  85800
tttttgcagg cctgacaaag atagcttaag aactttagat aaatagagca aataatgaat  85860
tgttggaaat gcataggaaa caaaatgact attcatagaa gaaaatacaa gccttccatt  85920
aaaaactaaa actatcaatg gttttttata tgtgtatata ccagtaaaac ccaaaggaga  85980
acaaatagca aataattaaa aattaaaagc aaaaacaaac tggaaaccaa cccccaattt  86040
ttcacctact cagtttactt tgaaggttac agtataatcc agagcctaaa acaaacatat  86100
gttggatatt ttgttcctat tatacaaatt aatgtctcta agtccagcaa catcactata  86160
ccttctgtgc aattaagaaa tttacttcaa gcacgtgacc agtaagtact ttagtgctag  86220
tactgtctat gcagaatagc aaatacagtg tgaaacaaag caatgcaagc ctgtatgtaa  86280
aatttggctc catgctaaat ctggattcat gcttaagtat gttaaaaaaa aaaaaagaaa  86340
agaattgcca agctgccaat atatttcttt acagtatttc ttaatttacc ttcatcaata  86400
ctaagatctt tagctatgag caatgttaat tagccaaatg tctccaattt tctatcagat  86460
tttaaagagt attttactac ttatttacac aaaccattca acatgcttgg acttcgtttt  86520
tgtcctagat tttctttctt tctttgtttt tttttttttt aaaatgacca attattttat  86580
tttaggacaa aagtttacca tggtccataa tttgtatcaa cctttacata acttatgaat  86640
tagacaaaat aatttgtttt tctctgtaaa aacacatctt ctctcacaca ttttatatac  86700
agaataatat attaattgcc attctgattc ttagtaactt taaattttag tgaaaaccta  86760
ggaagtaaga cattctgaac tagctgtcag atattaacat ttcagagatg agaacattcc  86820
acaattttaa aaaacatgct tcccaacgtc ataacccttt ctttctctcc tttctctttc  86880
tttcttttcc ttccttcctt ccttcctttc tttctttctt tctttctttc tttctttctt  86940
tctttgtccc tccctccctc cccccccttc tttctttctt ttcttttttt cttttctttt  87000
tttttgacgg agttttgctc ttgtcactca ggctggaatg caatggcatg gtcttggctc  87060
actgcaacct ccgcctcctg ggttcaagtg attttcctgc ctcagccttc caagaaactg  87120
ggattacagg tgcctgccac cgtgcccagc taatttttgt atttttagca gagatggggt  87180
ttcaccatgt tggccaggct ggtcttgaac tccggatctc aggtgatctg cctgccttgg  87240
cctcccaaag tgctgagatt acaggcctga gccaccacat ccggccccat aatcctttct  87300
taattggaag tgacccagat ggccaaaaag catctattat tcaatcctaa ataacttcaa  87360
gatttcaaat tacattaaaa agtgcagcta caagcattta tcccatttac atgtacatga  87420
ttctttcatt ttttcaaacg atttatctag attacttctg aaaactgaaa tattagacaa  87480
agctaatcat catttcaagt tatttccttg ttaacctttt ttatagcctg cgaagatcag  87540
atgttcacct aagtaagaac acttttaaag ttaaatacat gggtattgtg tcaataattc  87600
agaaaattca gctattttca ttaaactaac attgaattag tcttacttat tgaaaaaagt  87660
cacacaaaca aagactattt agttttggct gggtatattg ttttataacc ttttatgcta  87720
aaccccgaca ccccaaaata tctagcagag acaaatataa aacccagaca aaaaggtatg  87780
ctggcaattc caaagacatt tctattttta ccttaccaat aattttaaag ctagttttta  87840
aaattaacaa tttacttaat caagtgaatt taaaaaattc ttgaacttat ttacttaatt  87900
tacaagcatt cttttgctta taagcaaagt tggtagacac aacatataat aaatgtacat  87960
acacataaac acatctaaat atgtatacac acacagacac aaagatccaa tagcatttac  88020
ctcaaaactt tagctatgaa atagcaatag aaactcacca gtttacaaac aggttcacat  88080
ggctaaacta tttttgcccc aatacataat caaatgaagg ctgtgaacca aaatttgggg  88140
tagagcagtt ctcatggcag tttgcttttt aaaggccata ccttcccaga tgccaaagag  88200
cactaggtcc agatagcacc acagaaaaac atcatctata acctactaat caggcccaac  88260
cctgcttaga acagcagcgt aggagtctga ctacatggaa tttcatcttg ccttctcatt  88320
caacagcaaa ctccagatcc caaagaatac tggggccagg ccaagtgcag tggctaacac  88380
ctgcaatctc agcactttga gaggctgatg tgggaggacc acttgagtcc aagagttaga  88440
gaccagcctg ggcaacatga tgggaactta tctctccaaa aattaaaaaa aaaaaaagct  88500
aggcatgatg gcatgtacct ttactcctag ctacttggga ggctgagctg ggaggatccc  88560
ttgagcccag cagttccagg ctacagtgag ccatgatgac actattgcac tccagcctgg  88620
gcaacagcgt aagatcctgt cttaaaaaaa aaatggaata ttgaagtcaa acagcattac  88680
agaagaatat cagttatatc agtttatcaa actctaattt cccatgacta tatcaacaca  88740
cacaaccaca aaaatataaa ccaactgctg taacaacaag ctctaagagt atccaaactg  88800
aggcagtcag ggtgcttccc tctctcagtt gggcttgttc aacctataaa tggaaattct  88860
ttaaaaaatt tcccagccag gtgtggtagc tcatgcctgt aatgccagca ctttgggagg  88920
ccgaggcagg gggatcacga ggtcaggaga tcgagaccat cctggctaac acggtgaaac  88980
cccgtttcta ctaaaaatac aaaaaaatta gccgggcatg gtggcaggct cctgtagtcc  89040
cagctactca ggaggctgag gcaggagaat ggagtgaacc cgggaggcgg agcttgcagt  89100
gagccgagat cacgccattg cactgtagcc tgggcaacag agccagactc tgtctcaaaa  89160
aaaaaaaaaa aaaaattccc aaattgagag aagcagatac cgtctaggcc cacaaaggac  89220
acttttacct atccagatgc agatgtctaa tttctaaggc tgtttttcct aggtaatcag  89280
gaacatggtt ggggccagca gtggtggggc tggacagaga gagaaactga gactcacctc  89340
tggccaaaaa agggtctggc acctgcttag gagggcttcc aaaacttttt cagcctgtgg  89400
aaacaaaccc acaagcaatg tgttactggt cagggaacta aaatctgtta cctaaatgcc  89460
aggggtttat tctaggttct gctgcttgca gcgcagaaag ccggtcactg agacagtgaa  89520
gatagccaga gaaggcttta atcaggtgct acagccaagg agatgacaga taagtttcaa  89580
atccatctcc ccaagcaacc aaaattaggg gtttatatag taggaaagaa atgtacccat  89640
gtataggaaa atagaaacta gggaggggca agaaagagaa gttggtcaac aggaagcagg  89700
tggttggtta cgcaatcatg atgggtgagg gggtcttatg tttcattgtc aagatgcagt  89760
gatctgctaa gtttcagctc cttgatacta tctggaaggc ctgatggttg ttttcctgag  89820
aaaggaactc agataagaca aacataactt tcttgagttt taagactgga gcatcaattt  89880
ctatgtttat cccaaagaaa ccatacacgt tagttctatg agacaactgg gacaatttca  89940
taacctgcat tagaggttgg gaaatgtctt cccatatttc caagataaga aaatggtgcg  90000
ggtgccaaaa ggcatttgtc ccagccatac tcccctgtaa tgtacacttt tctcaaacat  90060
tttccaaatt cactgctaca atgctctgaa ccctattttc tgcagatgca actttaacac  90120
tgtatattcc cgatctgata tgaaacaaac aacagcacca cattttccct ggatattgtt  90180
ttgccaaggc tttgatcgcc actgcaatgt gccagtaagg caagaggaaa atgagagatc  90240
tttgagttca atgatcttgt ctaattaagc tggagctctt ccttggaacc ccaagccatc  90300
atgtttgtgg tcagcattgg agctgtgaac atccttgcaa ctggtgtttg gcacaaccta  90360
ctttgatcag cttctgttca tccaccagca ttcctatgcc atagagagtc aatgaggtaa  90420
gactaagcca gatggaccac ctacaaatca cctggagacc tctgaatcca tagcaaagaa  90480
attaagacaa agttgaggaa atctgaactg ctggttctcc agctactgta gtcaaatgaa  90540
gaggacacag aagccctgaa tttttgaatt cttaggatga aaagggacac attggttgta  90600
tgactaactt tatagggaaa gaccttcaat acttataatg tgaactcaat aaatagtaat  90660
gtagcaaaga gaagtttcca tggggaaaat aacatgtaaa gtcaaaactt aaaaaaaaaa  90720
aaaagtaaga tttttccaag ttgcatttca gaagagggag gagaaaaagc aaaggaacat  90780
gaaacgatga aaaacaaact ataacatatt cctcaccctt caacaataat ctggaggtca  90840
aaagctaaat tctttatcac caaagaatct tttgaccttc acattggctt attgggtgta  90900
attgtatttc cagagtcact ctctgattcc tgatactccc ttataaagtg gccatcaatg  90960
agctgaagaa agaaagagtg gagcatctgg atcactgaac aacgggctgg tttgacctca  91020
gaaagattgt aaaggtggcc ttgtgttaaa tgagtcacta agacaagccc acacttagtt  91080
gcaaagagcc agaaggaaag cttgtctctg ttggtgtgaa atggtgcagt cttctcatcc  91140
attcatgaaa ggaggaaaag actttgacca ttggtgcaga gcaaagctaa agaggaagac  91200
caagataatg acatattttc tccacatgcc tttcaaaatg gtattttatt tactcttctt  91260
tcaagtaacg tgaaataagg gcaccacttt tcacaaaatg caaaatactt tatggtttaa  91320
tcctctcagc cattctcaaa atgggtacca atctctatct tacctataag gaaaccaggg  91380
ctcagaacaa gtgaagggtt tgttcaaaat ctcccagtta gtctgaagca gagcaaaaat  91440
cacacacaag atgatctgag ttcaaaacac aagctgtggt cactaaatgg tcagaatgag  91500
ctcctctgtg ctctgagagc ctggcaaaga ctgggaatga aatggacttc cttgccttaa  91560
atggaaggtg ttgaggaaga aagagttaag gtctcacaga gtttaactaa aggcaagttt  91620
tctcttccct caggaaggaa tcgtggatca ttctccagct ttttctctag accatgttct  91680
aataaccttt ctctccactt ggctcctgat cttatttcaa tttctgagtg taggggcttt  91740
tcattctgag cacattatag tattccagct tgcccatcac ccatctgtcc caggagtgta  91800
tcttgagggc ttaaatgctc agtgtggtgg aggaaagttt agcactagtt tcctttggta  91860
agggaataat ttgcttatca aatattaaac agaaatgttt tagcaggtta ctagttcctc  91920
tgcagaatgg aacactgcat agtacttcat taccagctaa tttcttctgc aaatgaatga  91980
ctactttctg aatttaatta aactatgtaa acattattgt gaggggtcca ctccgcaaca  92040
gagctgtgct ctgctaggag atacaaaaat gagtaactca tagtctctgc ctttgagacc  92100
tctcaattca tttgagtaaa gtcagtaagt gagtagcatt ccatggatgg gggttctcat  92160
aaaggtgttt tcgttcacct tagatgtcat tgaggaatat cagcaagtcc taaattatct  92220
gatttttaaa taatagagtc ttttacacat gtagctattt ttcatgcatt gcatgtaatt  92280
ttctttggta tctatatgga tatgctttgt gttagctttg atactggtca cagttctttc  92340
ctgaggacag aatagcatat aactattaat aataatgcca gcatttgttg ggtatttatt  92400
atgcatcaga tgttagagct cttctagtag agaatctgtg gccagtgaat gtcatgtact  92460
actgtggagc tttattctcc aagcaacaca gatgataaat atagctatta ctccaatttt  92520
gcagataaag aaactgagac tcagaaagct tattaacatg cccaaagtca cacaagaaga  92580
actgtggatc cgtttgactt tttctaagct tatttttaaa ctttattaag actaatccag  92640
agatgttagt tttgcatccc tttaagtgtc atcttgcatc tgtaacaaaa tccttgaaca  92700
ttcagcaagt tctctatcct gtaggtggca taaactcaac caattcccca ggtctgtgtg  92760
agccctggca atttttcagc ttagagttcc ctgataattc ttctttccac aaagtttttc  92820
tttgcccagc ctcttggaat ttggagcagt ttatcttctc cggtactttg ctccacaaat  92880
ttgagctatc gctgcttctg ccccaatggt gtcttcatcc tcaactcaga ttgccaagct  92940
gttttgatct ctgttgtttg ccccacagtt catagattgt ctctaggcaa aaagccagaa  93000
taattgtggg gcttgtctca tttgcttccc ttctttgggg gtctcattca tgctctgtct  93060
gctgtcctgt attggaaaac tgttgtcaaa tatttaattc cattttctag tcatttgtga  93120
taagaaagta tgctgctagc agcagacatt ctcccaagat gtaaaaatgt tcgtggtgtt  93180
ttaagtgaaa aaaaaaatca cactttaatg cgacatatac agtttatgct tattatggaa  93240
aaatatgtta atattctatt gaatggatct aaaaatacag acataaaatg tttgagatgc  93300
ttgatatccc aattatcatg atttgatcac tacacattat atacacgtat caaaatatca  93360
catgtactcc ataatatgta caactattat ttatcgatta aaaaatgtca atagtagttt  93420
ctaggtgggt aagattgttg ccattttttt cttttttttt ttttttctga gaggaaacct  93480
acattgctta gataacatga aaaggaaagc ttcaggaaaa attaaatgac aaaatataca  93540
gtccttaaaa gcagaattac aactaaaata tggcatctat tttcatcatt agagctgagt  93600
gatgtcaatc agaatcagag ctatcctact agaaaactta atggtactat ttaagcattc  93660
aaagatcaat cactgctatt ttacttaacc ccaatttctc tctatctcag actaaaaaaa  93720
aaaatgtatc caaggtgttt ctttattgtt cccaataatt tccccaaatg gtagcaatgc  93780
ctccacttta caaagggttt ctgcctaaag tttttcttaa cacctttgtc cctctgagct  93840
gtgttggtaa tttgtttaaa aattgctatt ttatttttct ctttctctgg tctgttttat  93900
cctgagagga agaaggaagt tgacgtttac cactatggat ccagcactgt gttctcattc  93960
atatacttga ttttatttga ttttcaaaat aatcctgcaa agtattttga attcacttta  94020
ggttgaaagt ggggagacag tctcaaaaga caaagcactt gcccaagatt ataaaactag  94080
taagcaacaa atctagaatt gagctctggt atctagatgt attttccaat ttcttgaaag  94140
actattattt aggaattagg tagaatttcc cctcccttta tgtcctctcc tcaatttcca  94200
tcaaagtttt ataatatgca agttagttca caaaaaacat gtggctctct cctcttccaa  94260
ccatgtgcct gggcacaact ctgcatagta tatataccaa aatagtctct gagcatatat  94320
atgcagattt gtgaggtcat tttcatttca gttatcatct tctctctact tccatagcac  94380
tcagttaatt catttatata ttctttcctt taactgatat gcctgggacc caggttatgt  94440
agtaataagt aagactcgat ttctcctttc agggtgctca gagtctaatg tgaacacaca  94500
tccactcagt gtagtaagta tagtgttaga agtggccatg gagtcctaca gatgcataaa  94560
gaaagggctc tttatttaat ttgcagagga gaggagatca gaaatggctt cttggagaat  94620
atcataactg agtcaaatat caaaagctat gtaaaagtga ggcaggtggg taacatagga  94680
aagaggattc aggtgctggg aatattacac aaaaaatact tgtaagcatg gaagaacaca  94740
gtgtaagtga aaactcatga acatttaaag ctagttgaag aacaagtaag atggcggaat  94800
ggtgagaagg aagatggaaa cttagacaca attcagatct taagatggaa agtttacatc  94860
ttaaaccaaa gattgaatag tcattgaaga ttttcaggaa acaaatgatg taatcagatc  94920
tcctcttagt gaaatcatgt aggataccaa tataaagaat gctcacatat tttactaaaa  94980
gtattccaaa agataaagag ggaatactcc ttaaattatt ctataaggcc agtatcatcc  95040
taataccaaa accaggaaag gatataacaa aaatagaaaa atacagacca atatctctga  95100
tgaacataga tgcaaaaatc ctcaacaaaa tgctagctaa ctgagtccaa cagcatatca  95160
aaaagctaac acaccatgat cgagtgggtt tcataccagg aatgcaggga tggttgaaca  95220
tttgcaagtc aataaatgtg atacatcata aacagaatta aaaacaaaat tcatcttaat  95280
agatgcataa aaaggcattt gacaaaattt aacatccctt tataattaaa agcctcagca  95340
aaatcagctt agaagggaca tgccttaagg taataaaagc catctatgac aaacccacag  95400
ccaacattat accgaacagg aaaaaggtga aaacattccc ctgagaactg gaacaaaaca  95460
aggataccca ctttcaccac ttctttttaa catagtacta gaagtcctag ctagagcaat  95520
cagacaagag aaagaaataa agggcatcca aatcagtaaa gaggaagtca aactgctgct  95580
attcactgat gatatgatca tatacatagc aaaccctaaa gactcatcca caaagctcct  95640
agatttgtta aatgaattca gcaaatttcc gggatacaaa atcagtgtac acatatcagt  95700
agcactgcta tatgccaaca accaagctga gaataaaatc gagtactcaa cgcatttcat  95760
aacagctgca aaaaaataaa ataaaatact taggaatata ctttaccaag gaggcaaaag  95820
agttctgcaa ggaaaactac aaaacgttgc tgaaagaaat catccatgac acaaacagat  95880
ggaaacacat cccatgttca tggatgggta gaatcaaaat tgtgaaaatg accatgctgc  95940
caaaaacagt ctataaattc agtacaattc ccatcaaaat accatcatca ttcttcacag  96000
aactataaca aaaaatacta aaattcatat ggaatcaaca cagagcccat gtagccaaag  96060
cctgactaag cgaaaagaac aaatctgatg gcatcacatt acccgacttc aaactatact  96120
acaaggctat cattaccaga acagcatggt actggtataa aaataagcag gtagaccaat  96180
ggaacagaat agagaaccct gaaataaagc caaatactta cagccaactg atctttgaca  96240
aagcaaacaa aaacataaag tgaggaaagg acaccctatt caacaaatgg tgctgggata  96300
attggcaagc cacatgtaga agaatgaagc tggatcctca tctctcacct tatacacaaa  96360
tcaactaaag atgaatcaaa tacttaaatc taagacctga aactataaaa attctagaaa  96420
ataacattgg aaaaactctt ctagacattg gcttaggcaa agagtacatg accaagaacc  96480
caaaagcaaa tgcaacaaaa acaaaaaata aatagagggg acctgattaa actgaaaacc  96540
ttctgcacag cagaataaat aaacagcaga gtaaaaagac aacccgcaga gtaaaaagac  96600
aacccacgga gtgggagaaa atattcacaa actatgcatc cgacaaggga ctaacatcca  96660
gaatctacaa ggaactcata ggaatcagca agaaaaaaaa acaaataatc ccatcaagaa  96720
gtgggcaaag gacgtgaata gacaattttc aaaagcagat atacaaatgg ccaatgagca  96780
tatgaaaaaa atacttaaca tccctaatta tcagggaaat acaaattaaa accacgatga  96840
gataccacct tcctcctgca agaataacca taattaaaaa attgaaaaat aacagatgat  96900
ggcatggatg tgaggcaaaa ggaacacttt tacatggctg aagggaattt gaactagtac  96960
aaccactatg ggaaacagta tggagattcc aaatagaact actatttgat ccagcaatcc  97020
catatatatg gcattcctat atataccatg gaatactaca cagccataaa aaggaatgaa  97080
ataacggcat tcacagcaac ctgaatggag ttggagacca ttattctaag tgaaataact  97140
caagaatgga aaaccaagca tcgtatattc tcacttataa gtgggagcta agctgtgagg  97200
atgcaaaggc gtaagaatga tataatggac tttgaagact tagggggaag ggtggaagtg  97260
aggtgaggga taaaagacta cacattgggt acagtgtaca ctgctcaggt gatgggtgca  97320
ccaaaatctc agaat                                                   97335
<210>3
<211>163
<212>DNA
<213>Homo sapiens
<400>3
caagtttagc tgtgatgtac aggtttctta actattagat ttctcagatt ctaatatgaa     60
acaatgccaa ttttcctgtg tgtgtgtgtg tgtgtgtgtg tgtgtgtgat tggaggtttg    120
ttggcaaatt gatgctaaag catatttggc tttggttctg gaa                      163
<210>4
<211>26
<212>DNA
<213>Homo sapiens
<400>4
caagtttagc tgtgatgtac aggttt                                        26
<210>5
<211>20
<212>DNA
<213>Homo sapiens
<400>5
ttccagaacc aaagccaaat                                               20
<210>6
<211>599
<212>DNA
<213>Homo sapiens
<400>6
aacaaacata ggttgcgttt atgcgaatgg tcaggtccaa agtagatgca gaatatgcca     60
ggttcactaa ttttaatccc tattcagccc aggactatgt accataagat tactgctagt    120
gttttctgaa aatgatgtat caaggcattt tctgtagaaa tacgaaacag tgacatacag    180
tagggagagc tggattgagg cagagtagta tagatggaag tttcctgaaa gcattttggg    240
gaaacatctt ttgggtatgg ttcttggatg aagagttgat ttattagtac tggaagggtr    300
tatgggagag aggaagtgag aggttatgag agaatgaccc tcccgtgatg gtgagtggga    360
gaattattgc agtatgtacg ttagcattgc tatgtggtga agttcttggg atttcctggg    420
gtccgtgctg gacagcatgc ttagccacca gtcacatgtg ggcactgagc actgacaatg    480
tgggtagtct gaactgggat atgctgtaag tgtaaaatac aaactggact ccaaagattt    540
agtatgaaaa aaagaatttg aaatatctca ttaatgatgt gtatttggtt tcatattga     599
<210>7
<211>599
<212>DNA
<213>Homo sapiens
<400>7
ggatacagag gctaccagag taggcagttg acatctcttc tctccctttt tgtctcttct     60
atttacctcc tttcttccat aatcaagtac cagtcctgtc ctgtctccat tagctgctat    120
ctttaccttc tatctcccag aaatgtacaa attatgtaat tcaagtttct ataactgcct    180
tcccctccat actaaaacat gttactacac cttggtttct gtcttcttat ttttctgaat    240
ctgcactagt cctttcattg ctatagctgt ccttcctctg ttctaaggct catggcaccr    300
ttgtaagccc agggccctat gctgacactc atataacaac attttgctcc atcagttact    360
aaaagtgccc tcttatatca gcagtctccc tgtctttgga gagtatacaa catgtattct    420
catcccattt ttccattatg ttcagagcgg ttgaatgact tgtacaagtt aatgcaagta    480
gttgaggcag aaatgatact tcaatcgaga tcttcaaact tccaagttca gttcactttc    540
ttccataaca tgttatctca aaaataccat ttgccagaga taagtaatgc taaatcatt     599
<210>8
<211>599
<212>DNA
<213>Homo sapiens
<400>8
gatgtgactg cacatccatt tcaaatgccc tgaaactcag gatgtgctcc tgaggtgctc     60
cccatgccag gatgtgcctg tggtttcctc aagagctact tggatacacc gcataccctt    120
ggatccagca ctgctagaga ctctgcagaa actctgcaac tttaactgga aacctctcta    180
ctgttgttgt tcccttggaa aatgactatt tgccacttca gctgccaaat atctcctccc    240
aatatgttct gtgagcattc agtctgctca aagtcttgtg taatggtgga tatatgatgm    300
catttgtttc aagctaggct cacatatcca tctatctcag gggctacatg atttacttgc    360
cattttttaa acttttactt gtaattaaca aataataatt gtatatattt atgggataca    420
atgtgatgtt ttcatatatg tatacattgt ggaatgatta tatcaagcta attaaattag    480
gcatcatctc atatactttt ctatactgaa aacatttaag gcctattctt tcagcaattt    540
tgagatataa aagacattat tgttaattat ggtcaccaca ctgtgcaata gcattgaaa     599
<210>9
<211>599
<212>DNA
<213>Homo sapiens
<400>9
gttctgtgaa gcgggtaaaa acaaaatttg gcatccagtt tcaaaaggag aattgcaaac     60
taatagaaca tatagcacaa aatgattata tcaatagaat gctaattgca tatcaaggat    120
atttggtata atacaaatta ttctacctta aacatatgga aatttgtggt ccatgatgtt    180
gtagattcta tcttcccact ctgcattttc aaaggcatat ggtattgact cattcgatta    240
attgttggat agtctttatt atagactaaa tcatagaata aatacatgga tacatgcacr    300
aatattatat ctcaagggct ttacatagtt cattatctca cttcatagtc aaaacaaacc    360
tactgatagt tccaatgcaa agcctagaac gctttggctt agagaggccc aagtcttttc    420
tcagtgctgc actgctggta cgtggcgtgg tcccctctct tctctcagta cacactaccc    480
atgcagacta tcactctcag tcttgtttat ctcaaataca gagggtataa ctaactggaa    540
tgtatccaga acagtgaggc caaagtgtgg ggaagctcct taaccatgct gctgcatga     599
<210>10
<211>599
<212>DNA
<213>Homo sapiens
<400>10
ttgcaaacta atagaacata tagcacaaaa tgattatatc aatagaatgc taattgcata     60
tcaaggatat ttggtataat acaaattatt ctaccttaaa catatggaaa tttgtggtcc    120
atgatgttgt agattctatc ttcccactct gcattttcaa aggcatatgg tattgactca    180
ttcgattaat tgttggatag tctttattat agactaaatc atagaataaa tacatggata    240
catgcacgaa tattatatct caagggcttt acatagttca ttatctcact tcatagtcam    300
aacaaaccta ctgatagttc caatgcaaag cctagaacgc tttggcttag agaggcccaa    360
gtcttttctc agtgctgcac tgctggtacg tggcgtggtc ccctctcttc tctcagtaca    420
cactacccat gcagactatc actctcagtc ttgtttatct caaatacaga gggtataact    480
aactggaatg tatccagaac agtgaggcca aagtgtgggg aagctcctta accatgctgc    540
tgcatgagga acagctggag agactgagaa catgaggcct aaagaggaga ctcagggag     599
<210>11
<211>599
<212>DNA
<213>Homo sapiens
<400>11
ctaccttaaa catatggaaa tttgtggtcc atgatgttgt agattctatc ttcccactct     60
gcattttcaa aggcatatgg tattgactca ttcgattaat tgttggatag tctttattat    120
agactaaatc atagaataaa tacatggata catgcacgaa tattatatct caagggcttt    180
acatagttca ttatctcact tcatagtcaa aacaaaccta ctgatagttc caatgcaaag    240
cctagaacgc tttggcttag agaggcccaa gtcttttctc agtgctgcac tgctggtacr    300
tggcgtggtc ccctctcttc tctcagtaca cactacccat gcagactatc actctcagtc    360
ttgtttatct caaatacaga gggtataact aactggaatg tatccagaac agtgaggcca    420
aagtgtgggg aagctcctta accatgctgc tgcatgagga acagctggag agactgagaa    480
catgaggcct aaagaggaga ctcagggaga tgggatcaca atcttcaaat atttaaaaga    540
catcaagggg aaaagagatt aaacaaggta atgtagctct agagagcaaa tccaagagt     599
<210>12
<211>599
<212>DNA
<213>Homo sapiens
<400>12
tccatgatgt tgtagattct atcttcccac tctgcatttt caaaggcata tggtattgac     60
tcattcgatt aattgttgga tagtctttat tatagactaa atcatagaat aaatacatgg    120
atacatgcac gaatattata tctcaagggc tttacatagt tcattatctc acttcatagt    180
caaaacaaac ctactgatag ttccaatgca aagcctagaa cgctttggct tagagaggcc    240
caagtctttt ctcagtgctg cactgctggt acgtggcgtg gtcccctctc ttctctcagy    300
acacactacc catgcagact atcactctca gtcttgttta tctcaaatac agagggtata    360
actaactgga atgtatccag aacagtgagg ccaaagtgtg gggaagctcc ttaaccatgc    420
tgctgcatga ggaacagctg gagagactga gaacatgagg cctaaagagg agactcaggg    480
agatgggatc acaatcttca aatatttaaa agacatcaag gggaaaagag attaaacaag    540
gtaatgtagc tctagagagc aaatccaaga gtgttgagtg gaagtgaaag ggaggctgg     599
<210>13
<211>599
<212>DNA
<213>Homo sapiens
<400>13
atgatggttt ccagcttcat ccatgttcct acaaaggaca tgaactcatc attttttatg     60
gctgcatagt attccatggt gtatatgtgc cacattttct taatccagtc tatcattgtt    120
ggacatttgg gttggttcca agtctttgct attgtgaata gtgcctcaat aaacatacat    180
gtgcatgtgt ctttatagca gcatgactta aaatcctttg ggtatatacc cagtaatggg    240
atggctgggt caaatggtat ttctagttct agatccctga ggaataaatg accaactaty    300
gagaaattgc agggtagtcc ctacatgagg gttaggtaga attgacctgc tttctgcctc    360
ataaatttta gaaaattaat aagataattt attacggggt ggtgtttgtt ccctcagtac    420
tttatcatct atgttgataa tgttaataat taattgcata attaacaaat agcaaattat    480
tgtgggggtg tgtgtgtgtg tgtgtgtgtg tgtttagaca gggtcttgct gtgtcaccca    540
ggctggagtg cagtggcgtg atctcggctc actgcaacct gtgccttcca ggttcaagc     599
<210>14
<211>599
<212>DNA
<213>Homo sapiens
<400>14
atcctactgt gatcaaaggc acatacatga gatggtgagt tgtccccttg ccaatgaggg     60
tttggtaaga aaggaaagtg cagtacttct ttgtttctga attgcaagta tgtgtgggtt    120
agagggggag gctgaatatg aaggtcctgg gacagcccac caggtatccc atgagacttt    180
gcaaaggaaa aggaggtgag tgacagccca gggtccaata ggatagaagg aaaagccagg    240
ccatggagtt cctcagacct gctttctaag ggcaactcta ccacctcagc aagccattgr    300
acttctctga gctcagtcct ttcatttata aaatggggtg acagtgctca catgccagga    360
atacaaaggg attgaaagat aaaacacgta attaagcacc tgttgttaca catctgtcag    420
ggaccccaat aaggtcagct gtcttcctgt tgacttctgt tcttggtggt tctccaagat    480
cataccttcc atcaacattt accgtcactc ccccacccca tgcccaatac tgaacagtgg    540
agggacgctt cacctacagt tataatgttg aaacttcaac ccaaagcaag tactgttag     599
<210>15
<211>599
<212>DNA
<213>Homo sapiens
<400>15
tttaaagtct accatttcag gtccatattt tcgcttgaaa attgagattc ctattaaaca     60
atgacattta caccaaaaag tagaggagtt ggttgaagga cagggtaatg ccaggaggaa    120
ttgggaattt gagagtcaag tcaaaggact gaaatactca gaatactaag ggcacctcag    180
ggctctacca aggacacgta gaagctttga atttgcagca ccaccctaat ttaacgagct    240
acctcagcac gtagtggagc cttggaaaac agatgtcaca aactctcatt agattgtcar    300
acattttcca gcatttcctc tcccatcata gctggttatc aagatatata gacacacacg    360
tgcatacaca taaatacctt gataagttac tagagaaagc agaaaaatgt ctgacagttt    420
aatgagattt gggtgaaaga aaattctata tttcattgtt ttccaggcac tagaaataat    480
tcatcaatgt ttctaagact cattcagcgt ggctgcattt tttaaaatat tttcataaat    540
tttgaggagc aaataccatt attaggcact aaaaaggttg aagtctaata gattagccg     599
<210>16
<211>549
<212>DNA
<213>Homo sapiens
<400>16
tattttcgct tgaaaattga gattcctatt aaacaatgac atttacacca aaaagtagag     60
gagttggttg aaggacaggg taatgccagg aggaattggg aatttgagag tcaagtcaaa    120
ggactgaaat actcagaata ctaagggcac ctcagggctc taccaaggac acgtagaagc    180
tttgaatttg cagcaccacc ctaatttaac gagctacctc agcacgtagt ggagccttgg    240
aaaacagatg tcacaaactc tcattagatt gtcaaacatt ttccagcatt tcctctcccr    300
tcatagctgg ttatcaagat atatagacac acacgtgcat acacataaat accttgataa    360
gttactagag aaagcagaaa aatgtctgac agtttaatga gatttgggtg aaagaaaatt    420
ctatatttca ttgttttcca ggcactagaa ataattcatc aatgtttcta agactcattc    480
agcgtggctg cattttttaa aatattttca taaattttga ggagcaaata ccattattag    540
gcac taaaa                                                           549
<210>17
<211>599
<212>DNA
<213>Homo sapiens
<400>17
acaaaatccc caaagcaatt ttggaataag agccaacatt taatacttac cagacaacta     60
ttctaagtat tttactatat tcactcatag caactctaaa aagcaggtag tattaacaga    120
gaaaatgagg cacagtgagg ttaaatagct ggtccgaggc tacacagcta atcagtggga    180
gagttgggac ttagacccag aggtccagtt ttgaagtcca cacttttagc cattacacta    240
caatggaaag aaatttagaa gatatacaca gaaaactata ggcacataga ttaggggttm    300
gtagaatgct ctgggcagtt aaaggaactc ttcttaaagg aggtaaagct tgaatgagac    360
tgttagtaag ctatttttca ctcattggtg aatgatgttt tgtgcagtgt gtttttttcc    420
ccatagaaaa ataagaaaga aaagaaaatt gagaactctc tctataaaaa tgtgtaacat    480
atctcatatt ccaagagatc cttttggtag tattaatttt tatctgctca cagtactggc    540
ttcattattt ggagttaaaa attaactcaa ccagataaaa aaatcagtgc tgtgtattt     599
<210>18
<211>599
<212>DNA
<213>Homo sapiens
<400>18
gttctaattt taaaaagtta tttaacagaa cgaagctatc agctaagaca atggcaaagc     60
cgtaaacaaa cataggttgc gtttatgcga atggtcaggt ccaaagtaga tgcagaatat    120
gccaggttca ctaattttaa tccctattca gcccaggact atgtaccata agattactgc    180
tagtgttttc tgaaaatgat gtatcaaggc attttctgta gaaatacgaa acagtgacat    240
acagtaggga gagctggatt gaggcagagt agtatagatg gaagtttcct gaaagcattk    300
tggggaaaca tcttttgggt atggttcttg gatgaagagt tgatttatta gtactggaag    360
ggtgtatggg agagaggaag tgagaggtta tgagagaatg accctcccgt gatggtgagt    420
gggagaatta ttgcagtatg tacgttagca ttgctatgtg gtgaagttct tgggatttcc    480
tggggtccgt gctggacagc atgcttagcc accagtcaca tgtgggcact gagcactgac    540
aatgtgggta gtctgaactg ggatatgctg taagtgtaaa atacaaactg gactccaaa     599
<210>19
<211>599
<212>DNA
<213>Homo sapiens
<400>19
ccccccaacc ctatttttaa attatttact tatttttatt atatttttga tacataatag    60
atggacacat tcaaacagtg cccccaaaac tggggcagca gaaacaggtc cttgcttatt    120
ttctcagctt cacctcctgc ctccacccca tctgtactgc tggtccagac attcctacag    180
aggtgtcctc ctaagttggt ctcttcctct cctgcttcag aggctttgcc ctgctcttct    240
ctgcctcttg aggctctgtc ctgctcttct ctgcgtcttg tggttggaat gcctgtctty    300
ttcctactga agatctggat gcctaaacca taatgtaaaa ttgctgcttt ttacttccat    360
ttacagcaga gaaattcctc ctctggcctc tcctcttctc tgtgtttctt tcttcataat    420
ttttatttat ttatatattt atttatttat ttatttattt atttattttc attgagatgg    480
agtctcgttc tgtcgcccag gctagagtgc agtggtgtga tctcagctca ctgcaatctc    540
caccttccag gttcaagcga acctcttgct tcagcctccc tcctgtagct gggactaca     599
<210>20
<211>599
<212>DNA
<213>Homo sapiens
<400>20
gtcatgatta aatgttaagt gaaaaaatag aatatagcta gatttgaatt tgaatattca     60
atctgtatac cagtatgtat agaaggaaga gtatatacca aatagtaaga gtatctatct    120
gttttataat ttgatataat acaaattatt ctaccttaaa catatgagaa tttgtggtcc    180
atgatgttgt agattctatc ttctcaccct gcatttccga agacatatgg tattggctca    240
ttagactatt tgttgaatag tctttattct attatcatag aaaaaataaa tgagtgcatr    300
tatccatata caaaatagag gtctgttctt cctgtatata tttatactaa aaaaactgag    360
actttttttt acagttgtat atatacaaac atatttgttt atttatatac acatatataa    420
atcaatttta tgtacatgtg ggtatacata catccatgca tataactctg aagtgctgac    480
tctctaaaga aagcccaggt attggtcaga attcatgctc ggctcaggag tatagaatta    540
agagatacaa acctcaaaaa agagggaacc gaatcttcaa atctgagcca ccttacaag    599
<210>21
<211>599
<212>DNA
<213>Homo sapiens
<400>21
ataataaaat aagggctaac acttaaacgg ttgtgtactc actatgtact aggcactgat     60
caaagtactt tgtacatatt ttcttattta atattcgcta ccatcatatt acaatatact    120
gttattaacc ccaatgtata gatgtaggtg aagaaacttg tcacaaatca tacagctagt    180
tgtctgagat gcaatccatg tgatttgttc acagagctca ggttctgtga agcgggtaaa    240
aacaaaattt ggcatccagt ttcaaaagga gaattgcaaa ctaatagaac atatagcacm    300
aaatgattat atcaatagaa tgctaattgc atatcaagga tatttggtat aatacaaatt    360
attctacctt aaacatatgg aaatttgtgg tccatgatgt tgtagattct atcttcccac    420
tctgcatttt caaaggcata tggtattgac tcattcgatt aattgttgga tagtctttat    480
tatagactaa atcatagaat aaatacatgg atacatgcac gaatattata tctcaagggc    540
tttacatagt tcattatctc acttcatagt caaaacaaac ctactgatag ttccaatgc     599
<210>22
<211>599
<212>DNA
<213>Homo sapiens
<400>22
tttgggtatg gttcttggat gaagagttga tttattagta ctggaagggt gtatgggaga     60
gaggaagtga gaggttatga gagaatgacc ctcccgtgat ggtgagtggg agaattattg    120
cagtatgtac gttagcattg ctatgtggtg aagttcttgg gatttcctgg ggtccgtgct    180
ggacagcatg cttagccacc agtcacatgt gggcactgag cactgacaat gtgggtagtc    240
tgaactggga tatgctgtaa gtgtaaaata caaactggac tccaaagatt tagtatgaaw    300
aaaagaattt gaaatatctc attaatgatg tgtatttggt ttcatattga aaacaacttt    360
ggtattatat attgagttaa ataaaatgtc attaaaatta aattttactt aaactaaaat    420
ttaaaattct atctttacct tttttttttt tttttttttt ttttgaggtg ccgtttcact    480
cttgttgtcc aggcttgagt gcaatggtgc gatcttggct caccacaacc tccgtctcct    540
gggttcaagc gattctcctg cctcagcctc cctggtagct gggattgcag gcacgcacc     599
<210>23
<211>599
<212>DNA
<213>Homo sapiens
<400>23
tattcagccc aggactatgt accataagat tactgctagt gttttctgaa aatgatgtat     60
caaggcattt tctgtagaaa tacgaaacag tgacatacag tagggagagc tggattgagg    120
cagagtagta tagatggaag tttcctgaaa gcattttggg gaaacatctt ttgggtatgg    180
ttcttggatg aagagttgat ttattagtac tggaagggtg tatgggagag aggaagtgag    240
aggttatgag agaatgaccc tcccgtgatg gtgagtggga gaattattgc agtatgtacr    300
ttagcattgc tatgtggtga agttcttggg atttcctggg gtccgtgctg gacagcatgc    360
ttagccacca gtcacatgtg ggcactgagc actgacaatg tgggtagtct gaactgggat    420
atgctgtaag tgtaaaatac aaactggact ccaaagattt agtatgaaaa aaagaatttg    480
aaatatctca ttaatgatgt gtatttggtt tcatattgaa aacaactttg gtattatata    540
ttgagttaaa taaaatgtca ttaaaattaa attttactta aactaaaatt taaaattct     599
<210>24
<211>599
<212>DNA
<213>Homo sapiens
<400>24
tcccagcact ttgggaggct gaggtgggtg gatcacgaga tcaagagatt gagaccatcc     60
tggccaacat ggtaaaacct cgtctctact aaaaatacaa aaaattagct gggcatggtg    120
gcacacacct gtagtcccag ctgctcggga ggctgaggtg ggagaatcac ttgaacctgg    180
gaggcagagg ttgcattgag ttgaaatcac gccactgcac tccagcctgg tgacagagca    240
agactccatc tcaaaaacaa acaaaaatta tagtatgaaa taggcattaa aatattgtgy    300
attttagagg agactgagga ttggaggctg aagaattact ctaaattaat cagcttgtgt    360
acttcagagc taagatagct ctttgggttc taaattctgt gatcttcttt ttgatttctc    420
ttggagcaat aatgaaggca aaacatcaat aaacataaca aactgggtaa gggagaccat    480
tgagaaggac taaggacacc ttcaaagttc tgagtgagtt taaaaagaag aatgatgaaa    540
actttgatag aaataggaaa aaaagtagag gaacttgttt ggcttgaaac ttcttaatg     599
<210>25
<211>599
<212>DNA
<213>Homo sapiens
<400>25
aaaaaatagc actgaaaaca gaaaggaagc atcaaaactc ttcaaatacc tgctgtgtcc     60
attggtcaag cacattcagg acatcgcatg cctttagaac tccagcaggt tccaacagct    120
agtaggacat tctagactct gagagagagc aagggaggtt ttatgactgg ggacaaagaa    180
aagagacact gaaggcgaag gacaatctct gaaaatgcag taccctccag actgctcctc    240
ctctcacaaa aacaccttcc cagcatgcac tgctttaggg actatgatta taccattgay    300
tctgtccaga aaacctgtgt cctgaatata ttacagggct cattccttca cttctttcag    360
gtgcctactc aggtatttcc ttatcagaac agtctttcga acgaccccat taaaaaaata    420
gtcctgtcaa ccctatgtta acaattttat ttatttttat tatttgttaa caatacataa    480
taggtgcata tattttgggg gtacatataa taatttgata cattcatatt gtgcataaag    540
attgaatcgg agtaattggg atatccattg ccttaagtgt tttacctttt ctttatgct     599
<210>26
<211>599
<212>DNA
<213>Homo sapiens
<400>26
tgtgtgtgtg tgtgtgttta gacagggtct tgctgtgtca cccaggctgg agtgcagtgg     60
cgtgatctcg gctcactgca acctgtgcct tccaggttca agccatcatc ctgcctcagc    120
ctccctagta gctgggatta caggcgcctg ccaccatgcc cagctaattt ttgtattttt    180
aatagaaatg ggatttcacc atgttggcta ggctagtctt gaactcctga catcaggtga    240
tccatccgac tcatttccca aagtgctggg attacaggca tgggccatca tgcctggccy    300
gcaaattgtt gttatttata actcttcaat ccaaatcatc agtgtctatg ttgtttcctt    360
aactatcaaa tgatgataat aatagtacct tcttcataag atagttgaaa ggtttttaat    420
atccatatgg tactgagaat gatgcctgaa acatagtaac taccccattt ttattatatt    480
tctgttaata ataatacata ccattattgc tcttgcatac catattgctc ttgcatacca    540
tatatgctct tgctatatgc tacacacagt atttcattta ggcctcacta tgtccctga     599
<210>27
<211>599
<212>DNA
<213>Homo sapiens
<400>27
gaaagcagaa aaatgtctga cagtttaatg agatttgggt gaaagaaaat tctatatttc     60
attgttttcc aggcactaga aataattcat caatgtttct aagactcatt cagcgtggct    120
gcatttttta aaatattttc ataaattttg aggagcaaat accattatta ggcactaaaa    180
aggttgaagt ctaatagatt agccgcttca tcctccttca ctcagctcag cattcgttca    240
actggctctt actggttaac atccacacgc ctcctgactg gctactcagt gccgatgacr    300
tttccttcac acacagggct ggttttaaga tacattgagg tgacatcagg tggcctgtaa    360
agtggtcatt ttaggatatc ctattcaaag acatctgtgg aagtgtggac caatttattg    420
atgaataaca gtgaaggggt ttccaccagc aagtaacata attttttaca atgatgatgc    480
tgaagtagaa agagtttcta gtcagggact ggacaaatca atttgcagac gatttttagg    540
aagaaaaaca ttgcaacagt aaattgtaat  tgataacttc tagagccact ttaagtact    599
<210>28
<211>599
<212>DNA
<213>Homo sapiens
<400>28
taattgcata attaacaaat agcaaattat tgtgggggtg tgtgtgtgtg tgtgtgtgtg     60
tgtttagaca gggtcttgct gtgtcaccca ggctggagtg cagtggcgtg atctcggctc    120
actgcaacct gtgccttcca ggttcaagcc atcatcctgc ctcagcctcc ctagtagctg    180
ggattacagg cgcctgccac catgcccagc taatttttgt atttttaata gaaatgggat    240
ttcaccatgt tggctaggct agtcttgaac tcctgacatc aggtgatcca tccgactcak    300
ttcccaaagt gctgggatta caggcatggg ccatcatgcc tggcccgcaa attgttgtta    360
tttataactc ttcaatccaa atcatcagtg tctatgttgt ttccttaact atcaaatgat    420
gataataata gtaccttctt cataagatag ttgaaaggtt tttaatatcc atatggtact    480
gagaatgatg cctgaaacat agtaactacc ccatttttat tatatttctg ttaataataa    540
tacataccat tattgctctt gcataccata ttgctcttgc ataccatata tgctcttgc     599
<210>29
<211>599
<212>DNA
<213>Homo sapiens
<400>29
ggtgtgatca cagctcacta aagcctccaa ctcttgggtt caagtgattc tccacctcag     60
cctcccaaat agctgggatg aaagtgtaca ccacaatgcc cggagaatta tttcatttct    120
tctttgtaga gattgagtct tactctgttg accaggttgc tttcgaactc ctggcctcaa    180
gccatccttc cacctcagcc ttcccaagtg ctaggattac aggcgcgagc caacttgccc    240
agccctggaa tttttgagcc tgttcaattc taactattgt caccaaaagt aaccttaagr    300
aaaaaaatgc attatctcct tgcttcattg caccattaaa atctttccta aattttccat    360
gttaaagatg aagctcaaaa tcctcagcat agcatacaaa acacttcata atcagatgcc    420
tcttcaaata cctcctatca gaatggtctc tttgactacc cctttaaaaa aattcccccc    480
aaccctattt ttaaattatt tacttatttt tattatattt ttgatacata atagatggac    540
acattcaaac agtgccccca aaactggggc agcagaaaca ggtccttgct tattttctc     599
<210>30
<211>599
<212>DNA
<213>Homo sapiens
<400>30
agccttagaa cagaggaagg acagctatag caatgaaagg actagtgcag attcagaaaa     60
ataagaagac agaaaccaag gtgtagtaac atgttttagt atggagggga aggcagttat    120
agaaacttga attacataat ttgtacattt ctgggagata gaaggtaaag atagcagcta    180
atggagacag gacaggactg gtacttgatt atggaagaaa ggaggtaaat agaagagaca    240
aaaagggaga gaagagatgt caactgccta ctctggtagc ctctgtatcc aaaaggttgr    300
ctcaaacatt cgctcataac tttgtctggc ttaatcctgc tcatcccagc agacttattt    360
caagtgtctc cacgttttgg gaagtcatca ctcacttctc tgggctttca tatgggagag    420
catttaattc tgttgaaaaa ctatttaata ctacatctac ctttctctat ggactctgag    480
cttcttgagg gcatgtatca tgtatgttct attctgaagc acccatacct agaacaaagc    540
ttagcacata gtaggaactt aataaatatt tcggagttga ataactagcc ttatgtaat     599
<210>31
<211>599
<212>DNA
<213>Homo sapiens
<400>31
tttaagtgct gaaacctcca agacaaaaga gactgtgtct ttattgttct ctgaattact     60
cgtacccagc tcggtacctg gaacatgata gggatcccat agtggtttga tgaataaatt    120
agtgactcca agagtaaagt aatcctcagg aggacaaagg cagatagctt cccttcccta    180
tcagaatgta cttctcttaa agcttttctt ggtataattc ttggagaatt ttgccttaca    240
gaagtcaaat cacataccaa agtgaaaact ggatcttcta caaataatgg aagaatcaas    300
tctatcaaaa caacaattat acatatgatc aatggagggg ttgtcacgag ccaggctaag    360
agctttacat atattatctc attctgtcta tgccagagaa tcaactatga catatgtaac    420
attaaatctc attttataga tgcaaaaact ggggtgtaaa gaagtcaaag aatcagccag    480
aatgtacaga attagcaaag gtggaactgg gatttgaatt cagacagtct gactccagac    540
gccatctccg aattatgcat aattatattt caattattaa cattcataaa ttgaaatat     599
<210>32
<211>599
<212>DNA
<213>Homo sapiens
<400>32
tcacatacca aagtgaaaac tggatcttct acaaataatg gaagaatcaa ctctatcaaa    60
acaacaatta tacatatgat caatggaggg gttgtcacga gccaggctaa gagctttaca    120
tatattatct cattctgtct atgccagaga atcaactatg acatatgtaa cattaaatct    180
cattttatag atgcaaaaac tggggtgtaa agaagtcaaa gaatcagcca gaatgtacag    240
aattagcaaa ggtggaactg ggatttgaat tcagacagtc tgactccaga cgccatctcy    300
gaattatgca taattatatt tcaattatta acattcataa attgaaatat gagggataat    360
gtaccttttc atgaaagctt tgctcgttgt gtggatgagt gtgtgtacat gtaactgctt    420
atgtgtgcta tcactgaggt agaagacatc tctctctctc tctctctctc tctctctctg    480
ttttggtcta cttttagtaa gacttgtatt tgattgagtt cagaagtttg attatctttt    540
taactaacct gtttgtttta attatattaa aaattagtca ctttcaacat atttgcata     599
<210>33
<211>599
<212>DNA
<213>Homo sapiens
<400>33
agttcctcag acctgctttc taagggcaac tctaccacct cagcaagcca ttgaacttct     60
ctgagctcag tcctttcatt tataaaatgg ggtgacagtg ctcacatgcc aggaatacaa    120
agggattgaa agataaaaca cgtaattaag cacctgttgt tacacatctg tcagggaccc    180
caataaggtc agctgtcttc ctgttgactt ctgttcttgg tggttctcca agatcatacc    240
ttccatcaac atttaccgtc actcccccac cccatgccca atactgaaca gtggagggay    300
gcttcaccta cagttataat gttgaaactt caacccaaag caagtactgt taggatctct    360
ggaaactttc cctcaaataa gggatttgaa tgggacaaga agaagtttta cagatagcca    420
atggagatga tttaatgggg ttatgataga aacgagaaag taaaacaaac ccatgcttta    480
aagtctacca tttcaggtcc atattttcgc ttgaaaattg agattcctat taaacaatga    540
catttacacc aaaaagtaga ggagttggtt gaaggacagg gtaatgccag gaggaattg     599
<210>34
<211>599
<212>DNA
<213>Homo sapiens
<400>34
tgttgttaca catctgtcag ggaccccaat aaggtcagct gtcttcctgt tgacttctgt     60
tcttggtggt tctccaagat cataccttcc atcaacattt accgtcactc ccccacccca    120
tgcccaatac tgaacagtgg agggacgctt cacctacagt tataatgttg aaacttcaac    180
ccaaagcaag tactgttagg atctctggaa actttccctc aaataaggga tttgaatggg    240
acaagaagaa gttttacaga tagccaatgg agatgattta atggggttat gatagaaacr    300
agaaagtaaa acaaacccat gctttaaagt ctaccatttc aggtccatat tttcgcttga    360
aaattgagat tcctattaaa caatgacatt tacaccaaaa agtagaggag ttggttgaag    420
gacagggtaa tgccaggagg aattgggaat ttgagagtca agtcaaagga ctgaaatact    480
cagaatacta agggcacctc agggctctac caaggacacg tagaagcttt gaatttgcag    540
caccacccta atttaacgag ctacctcagc acgtagtgga gccttggaaa acagatgtc     599
<210>35
<211>599
<212>DNA
<213>Homo sapiens
<400>35
gggtttctaa gctctctaat ctcccctgtg cagctggctt gctgtatggt ttatacaaat     60
ccagtggtga tctctgtgca acgtggtatc acctgtttaa agaggtctca tcttcatttt    120
caaagaggaa tacatgtttt tttacttact cttctgcatg gctgactcct tttcatgctt    180
taagtctcaa tcttaatgcc acctcctcct tccagacgtt cccagctaaa gtggcacttc    240
ccagccccat tactctctat gtttattgcc tgcatagctc ttatttgtaa tgatttcgtr    300
atagtttgat gatgatcatg atgaatatta ctttacctat ttatggcctc tcttttagta    360
ttaaattctg taagccacat gagcatgggg acacatctcc tttgtcactg ccccattgct    420
ggcatttagc acaagcatgg tctataatag ataccaaaca aatatgtatt aatcatgtaa    480
atgactaaat ccatgaatga atctatcaga cagtgtagat agcagcacat aaaggaaagg    540
gaatgtagta aatttttcat tttccttgaa gatgtagcta tgtattagga atttgaaaa     599
<210>36
<211>599
<212>DNA
<213>Homo sapiens
<400>36
tagggaggca catttagata tgcagtgata attgctttgc ttagagaaat tcaaggtgat    60
agaatgcatg gtgacaccta acccagactg gtagagaaag ggaattcttc cactgggaat    120
gacatgatta tctaaataag taggctcaat caggtcagga aagggcctga aagactattt    180
caagcagagg gaaggtattt gccaaggcca gggtgtgtag tggagagaat gggcagtggc    240
agagaattat gaagtgttcc aatgactaaa agtaaagtaa caagttcctt gtccaagagy    300
ttggattgta tcctaactga aatgagtata cactaagtgt ttgaagaaga gggatgaaat    360
ggtcaagttt tcattacaca aaaataacct gttcctttca ttttatgttt atttattttt    420
ttaattttct gactgctcct ttctggaaat ctcaaattta tatttgccaa atattgtcac    480
attttcgatg gagaatacaa actaagaatg ggttagggaa ctgagtcaga aagtccctgt    540
tgtacaattc aatcatgttt ttctaaggat gtgcttttgg acattatgga aactatctt     599
<210>37
<211>599
<212>DNA
<213>Homo sapiens
<400>37
acccagaacc ttaaaggcaa gaatatgatt gaaatgtcaa atggggactt ggtgatctaa     60
attatgtccc ccaaaagcca atgtcttgcc accaccagtg ccctatgggt ggagtttcta    120
aacagattac tcaaaacaca aactttcaaa aagggaaagt cataaccctc tagtcatcag    180
ggcaattacg gaataacatt gctggagtaa ggttttctca atgcccaaga gatgagctgg    240
caatgccaca acaatgtcca attcttagtg ggtccaagac catgtgttac atttccctcy    300
catgattact cacagcttca cagttctgct gtcctcttcg cctctctgcc acctcttaac    360
tgcacctttg acctcctacc cctaagattc aaccctgtga gattacttgt cttttcatct    420
acactctggt cactctgacc cccattcttt agattcagga ttttctcttt tcctggctta    480
ctctccagca caagtagaaa aatattgtgc ttcattggaa aatgcatgtt gtttgaatca    540
cactctttca gattatacaa ttgtagtctt tcattatctt tgagccattt tataatgct     599
<210>38
<211>599
<212>DNA
<213>Homo sapiens
<400>38
aatagactgt tgcattttga attttatatt tgccataatt ttgatttttt ttcttctctg     60
actactttct tttgtagtct catcagctca gaaggtcaaa gttgagatac ttgtcaagac    120
agtcaaagtg tagaacaatg agcctatgac agaagtgagg catgatatta attgtacatt    180
aagctttata ggtttttgga tcatccatcc ctctgacagt ggtaatagga atcctgagtg    240
ctattatatt tccttcacag caaagattat aaaaagcaag aggaattaca tgtgcttctr    300
ccgcatctta tcagcactca ggcaaggttt actaatatgt ataatcacaa tgacttccaa    360
aggttccacc ttggtacttc tgttaattta attcaatgta acagacactt agtgagcatc    420
taataagtgt caggcattag gcctagtgct agggatagag aaatgaatac acagatgtgg    480
actttgccag taaaaataag aagtagagtt gtgtgcagtg gatttatatg ttttaggcta    540
aatatggact tttcctagaa gagggattca gatggcattt cagttcacat ttagtacta     599
<210>39
<211>599
<212>DNA
<213>Homo sapiens
<400>39
agtccaaggg aaaacccaga aatgcattta cagatcagga atatagaaat aaatgggcaa     60
atggaggcaa aactactagc cttttccaca atggggaaga aaagtcaatt aaatcacccc    120
tggacacaat ttacatgtct atagacaaga attatatgca ttaatattag tttacagcat    180
tataaaatgg ctcaaagata atgaaagact acaattgtat aatctgaaag agtgtgattc    240
aaacaacatg cattttccaa tgaagcacaa tatttttcta cttgtgctgg agagtaagcy    300
aggaaaagag aaaatcctga atctaaagaa tgggggtcag agtgaccaga gtgtagatga    360
aaagacaagt aatctcacag ggttgaatct taggggtagg aggtcaaagg tgcagttaag    420
aggtggcaga gaggcgaaga ggacagcaga actgtgaagc tgtgagtaat catgggaggg    480
aaatgtaaca catggtcttg gacccactaa gaattggaca ttgttgtggc attgccagct    540
catctcttgg gcattgagaa aaccttactc cagcaatgtt attccgtaat tgccctgat     599
<210>40
<211>599
<212>DNA
<213>Homo sapiens
<400>40
catggtcttg gacccactaa gaattggaca ttgttgtggc attgccagct catctcttgg     60
gcattgagaa aaccttactc cagcaatgtt attccgtaat tgccctgatg actagagggt    120
tatgactttc cctttttgaa agtttgtgtt ttgagtaatc tgtttagaaa ctccacccat    180
agggcactgg tggtggcaag acattggctt ttgggggaca taatttagat caccaagtcc    240
ccatttgaca tttcaatcat attcttgcct ttaaggttct gggtgtatct gtatcttcay    300
atggtgaagg aattataaag cgattttgtg tcccctctgt gggcacagga tgttgcagaa    360
ataaagctga tagaaatagt cacatgagtt gaccagatgg catcatcagc ctcttgaatc    420
cactacatcc ctaatgtcat tagcttggag gggcagctgc caaattaggt ggggctggac    480
attcctttta acaggtgcct tcttttctag gatccaagtg agagcctaag atagtttcca    540
taatgtccaa aagcacatcc ttagaaaaac atgattgaat tgtacaacag ggactttct     599
<210>41
<211>599
<212>DNA
<213>Homo sapiens
<400>41
ggcagcatta tgggggaaaa gcaatgatga tctaatgaga tctgataaga agttagccca     60
aaacaaggaa attgttgagg gttctctttg aagtatggat ttatacccac caaccttagc    120
tgcgaacctt acctcaagtg ttacctgtgc cttgagatgt ttcctggtca tagtactaag    180
ctatcataat gagcaagaca ttcaataagc aagtgtgatg gctatgagga cagatcttaa    240
caggtttttt tttctggaag gcttaaaatc atgcattact caatctaata cttcacgaam    300
tttcagtaaa acctaatgat aatatagaag cttgtgttgt agttttgtaa tcaacagcaa    360
aacataaaat ttaaaaaaaa catacattac tggggctgta tcctgctaca ataataaggc    420
tgacataata gatggagaac aatatggtaa caagccaaaa tgtattactt catccacaaa    480
tagtatcgtg ctatatatag acagacttgt taaaaattta aagaaataca caatcaatta    540
cacaatagaa aatttgctat atggtgcatg gtggcatgca actacaaatg tttctaaca     599
<210>42
<211>599
<212>DNA
<213>Homo sapiens
<400>42
cacacagtat ttcatttagg cctcactatg tccctgatgt aggcattaat atctttattt     60
tgcaaatgag aaaacagtct gtaccttgta tgccatgctg ctattgttta tctgtttgaa    120
tctcaagcaa atctgcttga taattggtac caaaataagc ctttttctgg gtaaggaatc    180
tgatattgtg ttttaaaaaa cacacattta atcctggggc tgctgcatta ctcctgctgc    240
cccatcctac tgtgatcaaa ggcacataca tgagatggtg agttgtcccc ttgccaatgr    300
gggtttggta agaaaggaaa gtgcagtact tctttgtttc tgaattgcaa gtatgtgtgg    360
gttagagggg gaggctgaat atgaaggtcc tgggacagcc caccaggtat cccatgagac    420
tttgcaaagg aaaaggaggt gagtgacagc ccagggtcca ataggataga aggaaaagcc    480
aggccatgga gttcctcaga cctgctttct aagggcaact ctaccacctc agcaagccat    540
tgaacttctc tgagctcagt cctttcattt ataaaatggg gtgacagtgc tcacatgcc     599
<210>43
<211>599
<212>DNA
<213>Homo sapiens
<400>43
ctctataaat gtttggccat tggtttaaaa aacaaataat ggaccaatgg gctcaaaagc     60
aaactggcta atataaaaat aataataaca accacaataa taaaataagg gctaacactt    120
aaacggttgt gtactcacta tgtactaggc actgatcaaa gtactttgta catattttct    180
tatttaatat tcgctaccat catattacaa tatactgtta ttaaccccaa tgtatagatg    240
taggtgaaga aacttgtcac aaatcataca gctagttgtc tgagatgcaa tccatgtgak    300
ttgttcacag agctcaggtt ctgtgaagcg ggtaaaaaca aaatttggca tccagtttca    360
aaaggagaat tgcaaactaa tagaacatat agcacaaaat gattatatca atagaatgct    420
aattgcatat caaggatatt tggtataata caaattattc taccttaaac atatggaaat    480
ttgtggtcca tgatgttgta gattctatct tcccactctg cattttcaaa ggcatatggt    540
attgactcat tcgattaatt gttggatagt ctttattata gactaaatca tagaataaa     599
<210>44
<211>599
<212>DNA
<213>Homo sapiens
<400>44
taaataagcc aatatgcttt ctgttgattg attgatttac taaacattga ttggccatct     60
ccactgggga tatggcattt aagagatctc tttgatctta gtacttttac tgctttttaa    120
ataggatcaa atacacccaa ggtaaaaaat agaacacact atacgttaca ttttggaact    180
gttagaaatt cctttgaagc taaaattact gctatcattt gacaactttt acccctaaaa    240
taatgtggtg ctcaccagct tgcttaagtt acagcacttg ctgtcttctc agatacaatr    300
tcagaaactt ataatccaag aaaaatctaa atggcaagtg tgagttaatg gaagcctcat    360
aaagcaagag gtgttttgga agtgtatgga agacatcaat aaatgatatg tataacatca    420
agtgcaaaag tgtgtgctag gaaagttcaa aaaagaaaaa aaatatggta aggtaagacc    480
agagattggg gagtatatag cttttgggaa ttcaggaaat gctaacgtct atggagaatt    540
tgcataggtg aaagatcaga ttggaagcct ttctctgtgg aagcattgtg gatctaagt     599
<210>45
<211>599
<212>DNA
<213>Homo sapiens
<400>45
ttcactattc agggattatt tggaatccct tgtcaccaga agctcttaag gaaataactt     60
ctacttcgtt gcaaatatgt tcttggctta gttgaggtaa tgcaaatact agaatacttg    120
tttgtttaac agcttattct tccctgaagc tgttcctcca gtccctgcca gtgggatctt    180
atgtctccag gagtacttaa cacccctaat agccccatct tttaagcctc cctgggacct    240
gccctcgcag tacctcttat acctactcca cttcctcctc atggcctcct gcagaatgcm    300
attctaaaat taggttctat tttcctcgcc cgcattctct tttgcaaagc ctccaaaaaa    360
tttactttgc ttctctgcgc ctgctttatc tctattttct acactcgctc cttctttttc    420
taattatcta taataggcgt cacaaaattt gcatttgttg gaaccaaaat ttccatggtt    480
gcctcaaaat atacagatgt aaatttgcat ataattaaat tttgcataag ggaaactctc    540
atttggggag atatgcaatg cccaataaat ggcagtttcc ttcaatgtcc ccaggccag     599
<210>46
<211>599
<212>DNA
<213>Homo sapiens
<400>46
ctcctggaga cataagatcc cactggcagg gactggagga acagcttcag ggaagaataa     60
gctgttaaac aaacaagtat tctagtattt gcattacctc aactaagcca agaacatatt    120
tgcaacgaag tagaagttat ttccttaaga gcttctggtg acaagggatt ccaaataatc    180
cctgaatagt gaaggattta ctattgcaca tttaaaatgt gtaaaatgtt ttaacattgt    240
cttacaatga tgtctttatt attatatgtt agtaaattaa atatttactt ataagttgtr    300
tagatttatt agcaacctca gttcttcatc ccactttttt aggttcctga aattaaatta    360
catagtcttg ttagaaatgc ttgttccccg gtgccataaa gaaatagcac ttgaacataa    420
atttaatttc ctcagcaagg cagtttttac ctattgcaga aagggtacac ttgccagcag    480
ttttgccaca agagtacacc gaacaaagga gacagggtca tttataacct gacccatcca    540
ccttcctgct gtgtccactt tccattggct gaaacgggac ctcacattct gtatttgtc     599
<210>47
<211>599
<212>DNA
<213>Homo sapiens
<400>47
agaatgagtc caagggaaaa cccagaaatg catttacaga tcaggaatat agaaataaat     60
gggcaaatgg aggcaaaact actagccttt tccacaatgg ggaagaaaag tcaattaaat    120
cacccctgga cacaatttac atgtctatag acaagaatta tatgcattaa tattagttta    180
cagcattata aaatggctca aagataatga aagactacaa ttgtataatc tgaaagagtg    240
tgattcaaac aacatgcatt ttccaatgaa gcacaatatt tttctacttg tgctggagar    300
taagccagga aaagagaaaa tcctgaatct aaagaatggg ggtcagagtg accagagtgt    360
agatgaaaag acaagtaatc tcacagggtt gaatcttagg ggtaggaggt caaaggtgca    420
gttaagaggt ggcagagagg cgaagaggac agcagaactg tgaagctgtg agtaatcatg    480
ggagggaaat gtaacacatg gtcttggacc cactaagaat tggacattgt tgtggcattg    540
ccagctcatc tcttgggcat tgagaaaacc ttactccagc aatgttattc cgtaattgc     599
<210>48
<211>599
<212>DNA
<213>Homo sapiens
<400>48
tgctgacatc ccaatttata aaaataaaaa ggaaacaata tcagcaacat taacttgtca     60
ctgccctccc attacctcat gaaagccaaa cccacttttc taacaaaccc caaaacttcg    120
caccacttcc ttccctacag ggacctccca tctgccagtc acccaccctc tgtacagctg    180
gctaacatac ttttcagtta tcatttctgg attgttattt aatagataat ttccagtctt    240
ctctccctta tttgagatct taaataagct tctggaatgc aaagtgcagg tctcttttty    300
catagtgacc acaaatacac cgttttattt ttgagcatat aattcttata tatttttgtt    360
ataaaacagt cacaaatgtc cacaatgcat cgtagtatat gaaatgttcc ctgtccatat    420
tcattaatcc aactaataat tttagaacaa tttctgggtg ccaagcatga ttctctacct    480
agttgaaggg gtcaacgagg gcctctatga gaagggaaca tttaagctga gacataaatg    540
gaagaacaag cagacctgca gtaaagaggg gaacttgtca ggccccatca caggaataa     599
<210>49
<211>599
<212>DNA
<213>Homo sapiens
<400>49
acagtttaat tactctgaca gctttttttt tttatttttt ctcctagtga attatcaaca     60
gaaactacct agagaaacct gtaacttcag atcttctgat taattgattt tctttgggtg    120
ctgcttgaca gtaacagaat ggtccatggg gacagttttt cagtgaatgt tttcaacaat    180
gataggaaca cagagctaag cagagtgtca agagacattt agtgcagtag agacatctca    240
tctgtttttc tgcagaactt gcataaaatt agcatctgat tattatcacc tcagaatgar    300
ccggaacccg taaagatgtc tttgatcgta aaagtgggga ggagaccctg atggaagaag    360
agaagacttc agcctcacaa tagaaaagac tgtgtttatg cacctaaatc taacttagac    420
accatctaat tcaagaaaca ggcacattta gggaaataaa gaaaagaggc agaaagagat    480
gaagcacctt ggctgaatca gagaaattag gggttaatgt tccagactga tgacttgaag    540
gagggtgtgc attttcatgc aagggaccat tctgtagaag aagcagcaca ttcaccctt     599
<210>50
<211>599
<212>DNA
<213>Homo sapiens
<400>50
tggcccaatt tagaaaacca ttttgtgggg gtcccattag gttcagcttt cagttgctgg     60
aagagcatgg actgacatat gccacaaagc aggtcagaaa atgactttct gtcaacattc    120
atccctactc cacgctcccc acctctacaa cattaacaag aaaatgagaa cgcctgccca    180
gatgtcctgt tggatgtcac tgggtaaatt atcttttatt aagaatctgt aattgttctt    240
cactgagccg tgacctaaat ttagcggtgc tgaagagtga gccccagcca acaggattty    300
cctgagaaca cgatgaagtt cctgtatcaa ttcgattcat taactagaaa gagggaacaa    360
gcagccagct ttttttttct gcccccattc ttcagtgaat catttgttag tttgaccaga    420
atttttgtga gatccagtct acaattctgt aagaaaaaaa gacagcaaac ctcattcaaa    480
tacttcttgc gacattaatt ccgaggcaga aaccaaatta cattaagcag atctgattgt    540
cttgctatta aagaccttgg gtttactcac tgagtatttt cagcctgagg agaagaaat     599
<210>51
<211>599
<212>DNA
<213>Homo sapiens
<400>51
tctgactgct caaaaatgcc tttggagctc taaaaattta tacattcttg ggcccgacct     60
gattcagtag ttctagtgca aagctcagga atctgcataa aactttcaga gaattctgat    120
atgttagctc agttgaggaa cctctactct tgtctcccat agtccagtta ccctgttttg    180
ttgtcatatt tagccttgta gggtgtgcgc ttcacctgac agtaagctgg tgaaggctgt    240
gttgcagagg atgagcctgg agaacactgg cttttcagtt ggctgatgtt taaattccam    300
ctttggtgct tgctaggagg tgggactagg gcatcttggc tgtttcattt tcctcatctt    360
taaatgggga gaataatatt ttctataatt accactttac tactaaatca aggctaccag    420
ttactaaatt tttgtaatgg ttctaggata agatagtaag ggtctgaaag agaaggaaag    480
aacagagcca ttagatgaaa gaatggaaag gttatgctgt cctctcctca cttttattga    540
atgctgactg tcgtaggtct tatgagtagc ggtaacacta tattatctca tttattctt    599
<210>52
<211>599
<212>DNA
<213>Homo sapiens
<400>52
tgtcttctgg ggaaggctta acacaagaga gcaggtggct tcacgggcct ttcatttggg     60
taatgagttg gaacacttac ccaaagccaa gcccaaggaa ctcccagctg ctccacactg    120
gaagttgaca cacagtaaca tatatgcata tgtgtgtgtg ttgagatggt ggggggatca    180
tttttttgta acaatcaaca atcttgtaac tgtttcctgc ctatgttata agccaggata    240
agagcttcct ggatcacttg atctcttttt gtgttggtaa aaataatcaa gcctgtctty    300
aggcaattag ccacctcttc aagccatcaa ccttatgcac aatatccaag gaactcctcc    360
ttgccttttc tgaactactg tgggaagtga ttggaaggag acagccaaag gccaacaata    420
tagggcgagg cccctgggca tccttctcag ctctggggaa ggttaatgaa ttgtacttgg    480
ggaacaaaga gaactttgac aacagagatt ctgacagttt cataaggcag gaaatgtggc    540
cactatcaac ccagagctgg gtgtgcaaac acaatctatg tgtttatata ccttctcct     599
<210>53
<211>599
<212>DNA
<213>Homo sapiens
<400>53
tcatcttgct gttacataat aaggcactga ttagatgctt taggttttga attttttcct     60
tacccgattg accaactctc taagtctcag tttctccatc cataaaatag aagtaataat    120
gcctgcatgt agagttgtaa aaatatataa tgagaaaaat attgtgaggt acccagcata    180
gtagccacca cacagtagac aataacctat tttacttatc taccttccaa tccttaagct    240
aactatctct tagtcccaag aataaaatct caggattggg aaaaggcttc ttcatttcts    300
tttaggggcc ccagatcatt gagattcttc tttcctatta actaccaggt tatggatttg    360
aaagaatctc agttagaaat ataatagcat cattctagac agaagaatgg aaaactagtg    420
ttctaaactg gatcaaaggg tgtcttgtga aataatgcag tcattgttct ctatagtttt    480
gctccaatag gtcaaggata tactagtata tcaggggtag ctatggatcc tgggatttcc    540
cctttaccac aaaggagatg atgtaggtgt gaaattccag gcaccttgcc catcttttg     599
<210>54
<211>599
<212>DNA
<213>Homo sapiens
<400>54
gccacaacaa tgtccaattc ttagtgggtc caagaccatg tgttacattt ccctcccatg     60
attactcaca gcttcacagt tctgctgtcc tcttcgcctc tctgccacct cttaactgca    120
cctttgacct cctaccccta agattcaacc ctgtgagatt acttgtcttt tcatctacac    180
tctggtcact ctgaccccca ttctttagat tcaggatttt ctcttttcct ggcttactct    240
ccagcacaag tagaaaaata ttgtgcttca ttggaaaatg catgttgttt gaatcacacy    300
ctttcagatt atacaattgt agtctttcat tatctttgag ccattttata atgctgtaaa    360
ctaatattaa tgcatataat tcttgtctat agacatgtaa attgtgtcca ggggtgattt    420
aattgacttt tcttccccat tgtggaaaag gctagtagtt ttgcctccat ttgcccattt    480
atttctatat tcctgatctg taaatgcatt tctgggtttt cccttggact cattctaaca    540
tctcttcttt ttcctcatta attaattaaa ttaaatcttt aacacctctt catattttt     599
<210>55
<211>599
<212>DNA
<213>Homo sapiens
<400>55
atcacagcag tgactctttc aaatctggcc taactgaagc tagcaccaca ccaggatctc     60
tgctgggcac acaccaatca cccaggaggt cagtatcatc cccattttac agatttgaaa    120
gctgaggcac aaggtaaata acagttatgc agaagtcttg cttcagtgtc taacttcctc    180
atctcacttt attctgtttt tcaataggag aagagatata atctcatgat gaaaagtgcc    240
atctaaagtg gcaccttaga cacagtaagc aaactggatt ggaagtgaag aagtcagtcy    300
caagatactt gacaatgtct cctatttgta gattgtttag caaaatgctt tcacctgagt    360
tatttcattt gttgctcaca accaatctgt ctggtaggaa aggcagatga tatgttcacc    420
tccagataag aaaaatgaaa ttcagagagg ccaaggggct tgctcaagat tccacagtga    480
agaatctact tgcaggaatt ttaacaaagg ttttcaaatt cagaagtcca caggatgact    540
gcccttgaaa tccagtggta acatataata aggtgtcttt gagcaggtaa gagaggacc     599
<210>56
<211>599
<212>DNA
<213>Homo sapiens
<400>56
cagtttgaaa atggacaaaa aactgaaata gatatttctc aaaagaagac atacaaatgg     60
ccaataggat attttttaaa tgttactagt catcaaggaa atgcaaatca aaatgacaat    120
gaactatcac cttacacttg ttagaatggt tactagcaaa aaaagacaag ggataacaag    180
gttggcaatg atgtagagaa aagggaatcc ttgtacattg ttggagggaa tgtaaattag    240
tatagtcact atggaaaact gcatggagga gcttcaaaaa actgaaaata agcctaccay    300
gtgatcctaa tactgggtat atatccaaag gattggaaat caatatgttg aagagatatc    360
tgcattccca tgttcgctgc agccttattc acaattgcca agtatgaaat tggcttgagt    420
gtccatcaac agatgaatgg ctatagaaaa catatacaca gtggaatact attcagcctt    480
aaaaaagaag gcaatcctgt catttgcaac aacatgatga acctgtagga cattgtgctg    540
agtaaaataa gcctgtcaca gaaagacaaa tactgtataa tctcatatgc agaatcttc     599
<210>57
<211>599
<212>DNA
<213>Homo sapiens
<400>57
gactttccag caccttaaac tacttggaaa gatagattaa tgtctagatg aaacttgatg     60
agactttaga ctaatatgtt acatatacat caggagatgc atgtataaac caaatccaaa    120
taacccaaag caaaatttct tttagaaata gtgataaata aatgagtgag gagtttgtca    180
ctcacatccc ccaggtaaaa catacctttt tagcctaaat aaatgctata gtttgaatgt    240
gttccctcca aaattcaggt actgatagtt aacagcagcc gatatgatgg tattacacam    300
aatagtaggt tctttaggag gttgttaggc catgagtgcc tcccccaaga atgggatgaa    360
ggacctcata aaagaggctt ctcacagcat tgtgacctct agccctccca ccttccataa    420
gtgaggacac agtgttcctc ccctctggag gatgcagcaa caaagtgtca tcttggaagc    480
agaggagcca tcaccagaca acagaaccag ccaacagctt gatcctggac atctcatttt    540
ctccagaact gggataaaat aaattcctgt tttttaataa atttcccaat ttcaggtat     599
<210>58
<211>599
<212>DNA
<213>Homo sapiens
<400>58
gatgtggaaa gcatagacag aaggcactgc agaagaggag agtaaatgac tttaggtcat     60
tgaactggtt tttgatagaa atcaagttaa gaaaaataga agtcaatagt actaagtttg    120
aactttatct ttctaaaaac tgcttctgtg ggcagagttc atatgctgga ggaatgaatc    180
ataatgacac cctttggtat gaccctgggg agaataaatg tgacttagtt gaggtttctg    240
aggatgacat tcagaaagaa aacaagagag ggaaataccc tttctctctg tcacactcty    300
aggttagaaa ctcactttag gggccacagc ctatgacaaa tacactcatg caaattctgt    360
gcttgcttcc atgctccatt tctttgccaa ctatgtagct aagcaaaatg gaacaagaaa    420
tagtgtcttg ggagaaataa aattgctgga ttagatacag gccaccttta tataagaaaa    480
aacgttaaat tatgctactg gtgaaataag tccatttggg ttattgtgga attttatgtg    540
agactgagat agctgattaa gatggtgatg cttgagtatt atcattttag taataaata     599
<210>59
<211>599
<212>DNA
<213>Homo sapiens
<400>59
ccctgggaaa atcaccgctc tttgtgccta aatgtcttca tctacaaaag gtggataaat     60
aatatttatc tcatgaggtg tttggagatt taattaacac ttgcaaagca ctttgaatag    120
gagatgaaag gccctgttaa aggaactatt agtgtcagca cctagcgctc tttggccact    180
gaggaaattt aatcaggatg gggaagtcgg tgcaggcccc tcctaggcca tcctctcctc    240
caccagaagc catattggcc tttcattatc ctctaagcct ggaattctct ccaccaagcy    300
gctggttatg tcatttccct gcctacaatt ccctctcttc aattttctcc ctcctctttt    360
ccacgtatta aatcctccag gaccgcttca agccccatct gctctgcaaa gtcttcccta    420
accattcatt gactgattca ttcatttact tattcatttg acaaggcttt ggtgagagcc    480
tcctctgtcc caggctccac gaagagccct gaggttgctg taaattgcat attcttgacc    540
tcgtgtgccg gaaggggaga ctggagctca gacaggctac aacgcgtcca aggtcacac     599
<210>60
<211>599
<212>DNA
<213>Homo sapiens
<400>60
aataatctcc cttactcaaa accaagtgat tatggacttt aatcacatct ataaaatatc     60
attatagtaa cacctaaatt agtgtttgaa taactgagag ttgtaactga tatggtttgg    120
ctatgtcccc acccaaatct catcttgaat tatagttctt ataatcccca tgtgttgtgg    180
gaggaaccag gtggagataa ttgaatcata ggggcagttt ctcccattct gttctcatga    240
tagtgagtta gttctcagga gatctcatgg ttttataaag ggcttccctc tttgctccay    300
tttcattctc cttcttcctg ctgccatgtg aagaaggaca tgtttgcttc cccttctgcc    360
atgattgtaa gtttcctgcg gcctccccag ccacgctgaa ctgtgagtca attaaatctc    420
ttttctgtat aaattaccca gtcttgggca gttctttata gcagcatgag aatggactaa    480
tacagtaact ttaccaagtg gacacataaa actgatcatt acaatgtaca gtgaatattt    540
ggtgagttaa tagatatatt cataactgaa tgaaagagga tggtgattcc tacttcagg     599
<210>61
<211>599
<212>DNA
<213>Homo sapiens
<400>61
ccaggctcca aaactgtgag aaataagttt ctgttgttta taagctacca ggtttaaggt     60
attttgtaca gcaacccaaa gagtctgaga ccataatgaa gccattggaa tggtgggaag    120
gcaacttcat gtgagtaact acagtaaagc caggtgctgg taacagtcat gttgcccata    180
gagcagatcc tactattaca gtgcctagca cattacctgc atatgatgat atgtgatcaa    240
ttagttaact gattagttta tgaatcagtc tgccaaaaac tagggcagaa attgatagcr    300
cattaaaata aatatgcctt aaagtttgca aggagaccct attaactgcg cactgttttc    360
tttttatttt cttttttttt cttttgagac agggtctcac tctgtcaccc aggctggagt    420
gcaatggcac agtcttggct cattgcaacc tccacttccc gggttcaagc gattcttgtg    480
cctcagcctc ccaagtagtt gggaatacag gtgtgcacca ccacacctgg ctaattttta    540
tatttttagt agataggggg tttcccatat tagccagcct ggtcctgaac tcctggcct     599
<210>62
<211>599
<212>DNA
<213>Homo sapiens
<400>62
acacacgtgc atacacataa ataccttgat aagttactag agaaagcaga aaaatgtctg     60
acagtttaat gagatttggg tgaaagaaaa ttctatattt cattgttttc caggcactag    120
aaataattca tcaatgtttc taagactcat tcagcgtggc tgcatttttt aaaatatttt    180
cataaatttt gaggagcaaa taccattatt aggcactaaa aaggttgaag tctaatagat    240
tagccgcttc atcctccttc actcagctca gcattcgttc aactggctct tactggttaw    300
catccacacg cctcctgact ggctactcag tgccgatgac atttccttca cacacagggc    360
tggttttaag atacattgag gtgacatcag gtggcctgta aagtggtcat tttaggatat    420
cctattcaaa gacatctgtg gaagtgtgga ccaatttatt gatgaataac agtgaagggg    480
tttccaccag caagtaacat aattttttac aatgatgatg ctgaagtaga aagagtttct    540
agtcagggac tggacaaatc aatttgcaga cgatttttag gaagaaaaac attgcaaca     599
<210>63
<211>599
<212>DNA
<213>Homo sapiens
<400>63
atcccttgtc accagaagct cttaaggaaa taacttctac ttcgttgcaa atatgttctt    60
ggcttagttg aggtaatgca aatactagaa tacttgtttg tttaacagct tattcttccc    120
tgaagctgtt cctccagtcc ctgccagtgg gatcttatgt ctccaggagt acttaacacc    180
cctaatagcc ccatctttta agcctccctg ggacctgccc tcgcagtacc tcttatacct    240
actccacttc ctcctcatgg cctcctgcag aatgccattc taaaattagg ttctatttty    300
ctcgcccgca ttctcttttg caaagcctcc aaaaaattta ctttgcttct ctgcgcctgc    360
tttatctcta ttttctacac tcgctccttc tttttctaat tatctataat aggcgtcaca    420
aaatttgcat ttgttggaac caaaatttcc atggttgcct caaaatatac agatgtaaat    480
ttgcatataa ttaaattttg cataagggaa actctcattt ggggagatat gcaatgccca    540
ataaatggca gtttccttca atgtccccag gccagcctcc cagtctgtgt gtttccccc     599
<210>64
<211>599
<212>DNA
<213>Homo sapiens
<400>64
gccgggcacg gtggctcatg cctgtaatcc cagcactttg ggaggctgag gtgggtggat     60
cacgagatca agagattgag accatcctgg ccaacatggt aaaacctcgt ctctactaaa    120
aatacaaaaa attagctggg catggtggca cacacctgta gtcccagctg ctcgggaggc    180
tgaggtggga gaatcacttg aacctgggag gcagaggttg cattgagttg aaatcacgcc    240
actgcactcc agcctggtga cagagcaaga ctccatctca aaaacaaaca aaaattatar    300
tatgaaatag gcattaaaat attgtgtatt ttagaggaga ctgaggattg gaggctgaag    360
aattactcta aattaatcag cttgtgtact tcagagctaa gatagctctt tgggttctaa    420
attctgtgat cttctttttg atttctcttg gagcaataat gaaggcaaaa catcaataaa    480
cataacaaac tgggtaaggg agaccattga gaaggactaa ggacaccttc aaagttctga    540
gtgagtttaa aaagaagaat gatgaaaact ttgatagaaa taggaaaaaa agtagagga    599
<210>65
<211>599
<212>DNA
<213>Homo sapiens
<400>65
atagaaaatt tgctatatgg tgcatggtgg catgcaacta caaatgtttc taacatgttt     60
ctcttcatag gattttctga attttcattt aatattcaag cacatcaaaa acaccttttc    120
aggtgtgatc ctatacagca aagctgtcct cacaaacaat agttgactaa ataaacacat    180
ggctttatgg aagaaatgtg taagtatagc cattgttgga gcagatgctc tgcttaaaaa    240
gaaaaaaaat aagttaaagt tatagatctc accatgctta tttactgctt aagtcatags    300
caatttattg caccaaagtt gaagttcaaa gcataaagaa tactatatat aatgcaatta    360
atgaggttga tgtccctaaa acaagagaga attagtaaat gttttacaat agttttcatg    420
agatgggaaa tgacaataga aatctttgtt acaatgcaga ttttattgtg gaaatgatct    480
catggcaaag tttttaaaga ggctgcagaa caataaagag agataacaca ttttgctttt    540
atgaaaaagc cgatgttcca aatttgctga ccttctctgt aaataagaag tgactgtca     599
<210>66
<211>599
<212>DNA
<213>Homo sapiens
<400>66
tcaaatctgc caatcagata ccagtaataa gccatctcct tagcataatg taagacacat     60
tcactgatta tctaacttgt ggcaggcatt gtcctgggtc ctgaggaaga aaaattacaa    120
atttacaaat ctcatagttt acaaagcatt ttactgaagc cagatagacc tcaggataaa    180
tagcaaactt catctgagtt ggccataggg agtctgggca aaagaaacac tcttgataca    240
gaaagaaaga aaagatgggt tttctgaaag aaagaagaag cttgtgcagt atttggcagm    300
cccagccaac agcacaagag ggaagggaga aagagcacct cattcccaat tgtagggcaa    360
gaacagattc aatacagcta cataaggagc caagactgaa ttagatgtgt agggaggatg    420
tcctgttacc tgagcccaaa gtttaacacc ctttgatcac tttccgtcta gagagatcgc    480
tcagcaaagg tcattggtta tgataattaa agtgtttttc taaatagaag caatttcaag    540
aaggcaggtt gacctttggg agaatttcta gcagcaatca cttcatgatt gattggaaa     599
<210>67
<211>599
<212>DNA
<213>Homo sapiens
<400>67
ataggattcc ccatttgggc tgcagaggag ccagaaacat gctttagttt cttaatcctg     60
aaggagtggg ggattgtgta agcctcattg gtgccctttt gaaccacatt tcatcaagat    120
attgtgaaat ggggagcagc aggcagcctt ctctggccaa catgtatcag ggcctcgtgc    180
ttagtgggat gtgcccagag tagacaggga atccctggca gccttgcata gtccctctca    240
tgcctttgct ttcatggggc tggctggaaa caggccggta agccccatgg aactaccggr    300
acaaattacc aagcaatctc ccatggccat gtagaacagc catgtagaac aggatgtctc    360
ccaaggtaag atttaaggtt tgtggtttgc agaaaagaga agggaggaaa taaaaaagca    420
ctgacaatca ttgaaagccc acgttctagg taactggcta ctcactttca cagcccagta    480
acaattttgc ttaatcctat acatctataa ataggattat tgtcttcatt ttccagataa    540
ggaaacaaga cttggcaaat gtgtagtgta gtgtttgaca gtattatgta gttgtttag     599
<210>68
<211>599
<212>DNA
<213>Homo sapiens
<400>68
ccagaaaggg aagaggaagg acaggcaata gccaaggact cctggcagtg aactcatgtc     60
cacatcaaga tctaatgagc ttgcactcaa ctcatttcta gctctgcctt ggaagctgga    120
gctcctgcac tgactatcaa tgtgagcccc tgagtaggag cagcttggta gagttgaaag    180
accattgatc tgggtcaaca gactctggtt cctgtctcag cagtgctgta atcaatccaa    240
gtcaaatatc atctctggga cttaatttgc taaatttaaa atgaaaagaa aaacaaaaay    300
agaacaatta gactagatca ggattcggca aaccaaagcc tgcttatcaa atctggcata    360
ccacctgttt ctgtctatac aattgtattg aaactcagcc acactcattc atttgcatat    420
tgtccatgaa agaagctttt gcgctgcctc aggagatctg agtagtggcc acagagatgt    480
tgcagtggac catgttgcaa cattgtccaa aatacctaaa atatttactt cttgttttgg    540
agagtttgct gactggcacc agagaaatct atggtctaaa atcatctaaa aatttaagc     599
<210>69
<211>599
<212>DNA
<213>Homo sapiens
<400>69
cccttgccaa tgagggtttg gtaagaaagg aaagtgcagt acttctttgt ttctgaattg     60
caagtatgtg tgggttagag ggggaggctg aatatgaagg tcctgggaca gcccaccagg    120
tatcccatga gactttgcaa aggaaaagga ggtgagtgac agcccagggt ccaataggat    180
agaaggaaaa gccaggccat ggagttcctc agacctgctt tctaagggca actctaccac    240
ctcagcaagc cattgaactt ctctgagctc agtcctttca tttataaaat ggggtgacar    300
tgctcacatg ccaggaatac aaagggattg aaagataaaa cacgtaatta agcacctgtt    360
gttacacatc tgtcagggac cccaataagg tcagctgtct tcctgttgac ttctgttctt    420
ggtggttctc caagatcata ccttccatca acatttaccg tcactccccc accccatgcc    480
caatactgaa cagtggaggg acgcttcacc tacagttata atgttgaaac ttcaacccaa    540
agcaagtact gttaggatct ctggaaactt tccctcaaat aagggatttg aatgggaca     599
<210>70
<211>599
<212>DNA
<213>Homo sapiens
<400>70
cacttgtatg catttttaaa atgctaatgt taataacagt tcgggacttc taacttctat     60
atttaagcaa caaataaata aattgtcaga tggtacttca tcatccttct ctcccatctt    120
cttagaaata taaattgctt taggtgggaa tgctataatt ttagaccaga aaatacatgc    180
cagatgtctc ttatatgaag ccgtcccgcc caaggatata tatatgcctt agtcattagg    240
atgtgttcta aataatactg caaagccctt ggaaggatgg gtctgaacac tcacttatay    300
ttaactgctg gcatgttgct ttgtccctgt gtcttgtgct actatttcca ttgatgtaaa    360
ggaagcacca attaaataac actccattat tagagaacca ggcacaagtc agctgaggca    420
ggagacccgc cttcttttcc agaaacaatg taaagcctgg gtgggtgagg gtctctgggc    480
ttccgccgtg ccttgctttt gacattctcc agcacaccct ataaacatgt ctaaggctgt    540
cctgtttagt ctgattattc aaactatatt gtccagggta gagcaaaggg aaacctagc     599
<210>71
<211>599
<212>DNA
<213>Homo sapiens
<400>71
agggagagaa gtgcctccca cagcaccacg accagaaagg gaagaggaag gacaggcaat     60
agccaaggac tcctggcagt gaactcatgt ccacatcaag atctaatgag cttgcactca    120
actcatttct agctctgcct tggaagctgg agctcctgca ctgactatca atgtgagccc    180
ctgagtagga gcagcttggt agagttgaaa gaccattgat ctgggtcaac agactctggt    240
tcctgtctca gcagtgctgt aatcaatcca agtcaaatat catctctggg acttaattty    300
ctaaatttaa aatgaaaaga aaaacaaaaa tagaacaatt agactagatc aggattcggc    360
aaaccaaagc ctgcttatca aatctggcat accacctgtt tctgtctata caattgtatt    420
gaaactcagc cacactcatt catttgcata ttgtccatga aagaagcttt tgcgctgcct    480
caggagatct gagtagtggc cacagagatg ttgcagtgga ccatgttgca acattgtcca    540
aaatacctaa aatatttact tcttgttttg gagagtttgc tgactggcac cagagaaat     599
<210>72
<211>599
<212>DNA
<213>Homo sapiens
<400>72
gattgcgaac ttatcttcat ttcaccttta tgatgttata ccttttcatt tttgtcttct     60
catagctagg gtctcctggt ccccaaatgt agacacacat cttacaccaa tcccagagcc    120
attttgtata agagccacca tggatttaac cagctttagc tccagtattt gaacataatg    180
ttcagcatca tcacctggcc accaaatcaa aactgagcac cctttaatcc atcaacaagt    240
tctctgcagc catgcaaggt tatgaaatgg gcacagacat caatatacag tctttgtgtk    300
taagaggttc atggtctacc tgagaaatgc atctttaaac ctaaagtaga cgctctgttt    360
attccataaa tgatttttaa gcatcaatgg tatatcaagc actgtactgg cttctgggct    420
ataataaata tataaagacc acaagtttga atttcatgac attgaactat aatgtttaaa    480
tgttataata atcatagtaa atgtccttga ggagctacgg aagattcctg catgaagcag    540
aaacaagaag ctgaagaaaa aacaactggc tttgggggct atataaatat aaccctcaa     599
<210>73
<211>599
<212>DNA
<213>Homo sapiens
<400>73
ccacatattt cagaggcaca taactcaagc ttgcaacacg tattcaaaag agaccagcta     60
cacttggtag agacagccat aggaaagtga aatgacccta gggtttagta aagccagctg    120
tttccacttc tgaaaataat aaaatgaaat aataaaataa atttaaaatg atacaaagtt    180
caaagtttaa caaatacatt tgaagccatt tgcaacaaat acatctgaag ctaattgctg    240
gctctagaaa gtgtggggtc tttgttgtgg agcagtgtta atgatttagc attacttatm    300
tctggcaaat ggtatttttg agataacatg ttatggaaga aagtgaactg aacttggaag    360
tttgaagatc tcgattgaag tatcatttct gcctcaacta cttgcattaa cttgtacaag    420
tcattcaacc gctctgaaca taatggaaaa atgggatgag aatacatgtt gtatactctc    480
caaagacagg gagactgctg atataagagg gcacttttag taactgatgg agcaaaatgt    540
tgttatatga gtgtcagcat agggccctgg gcttacaacg gtgccatgag ccttagaac     599

Claims (104)

1.用于在人类个体中诊断对癌症易感性的方法,包括在从所述个体获得的核酸样品中测定至少一个多态性标记物的至少一个等位基因的存在或不存在,其中至少一个多态性标记物与SEQ ID NO:2有关,其中至少一个等位基因的存在是对癌症易感性的指示。
2.权利要求1的方法,其中至少一个多态性标记物包括选自表5A,5B和5C中显示的标记物中的至少一个标记物。
3.权利要求2的方法,其中至少一个标记物包括Chr8q24.21中与一个或多个选自表4A和4B中的标记物的标记物强烈连锁不平衡的至少一个标记物,所述强烈连锁不平衡由|D’|>0.8和/或r2>0.2定义。
4.权利要求1的方法,其中至少一个多态性标记物与HapC连锁不平衡。
5.前述权利要求任一项的方法,其中至少一个标记物是标记物rs16901979(SEQ ID NO:73)以及与其连锁不平衡的标记物。
6.权利要求5的方法,其中至少一个标记物选自表4A和4B中显示的标记物。
7.前述权利要求任一项的方法,还包括评估个体中至少一个单倍型的频率。
8.权利要求7的方法,其中至少一个单倍型包含rs 1456314等位基因G,rs17831626等位基因T,rs7825414等位基因G,rs6993569等位基因G,rs6994316等位基因A,rs6470494等位基因T,rs1016342等位基因C,rs1031588等位基因G,rs1016343等位基因T,rs1551510等位基因G,rs1456306等位基因C,rs1378897等位基因G,rs1456305等位基因T,rs7816535等位基因G。
9.前述权利要求任一项的方法,其中易感性是增加的易感性。
10.权利要求9的方法,其中至少一个等位基因或单倍型的存在是相对风险为至少1.7的增加的易感性的指示。
11.权利要求10的方法,其中至少一个等位基因或单倍型的存在是相对风险为至少2.0的增加的易感性的指示。
12.权利要求9-11任一项的方法,其中至少一个标记物或单倍型包含rs16901979等位基因1。
13.权利要求9-12任一项的方法,其中至少一个标记物或单倍型是标记物rs16901979等位基因1。
14.权利要求1-8任一项的方法,其中易感性是降低的易感性。
15.权利要求14的方法,其中至少一个标记物或单倍型具有小于0.8的相对风险。
16.权利要求14或15的方法,其中至少一个标记物或单倍型具有小于0.6的相对风险。
17.权利要求14-16任一项的方法,其中至少一个标记物或单倍型包含rs16901979等位基因2。
18.权利要求14-17任一项的方法,其中至少一个标记物或单倍型是标记物rs16901979等位基因2。
19.前述权利要求任一项的方法,其中癌症选自***癌,结肠癌,乳腺癌,睾丸癌,肺癌和黑色素瘤癌症。
20.权利要求19的方法,其中癌症是***癌。
21.权利要求19或20的方法,其中***癌是由组合Gleason分值7(4+3)-10定义的侵略性***癌。
22.权利要求19或20的方法,其中***癌是由组合Gleason分值2-7(3+4)定义的低侵略性***癌。
23.权利要求20或21的方法,其中至少一个标记物或单倍型的存在是更具侵略性的***癌和/或更糟的预后的指示。
24.前述权利要求任一项的方法,其中标记物或单倍型的存在是对象对特定治疗模式的不同反应率的指示。
25.前述权利要求任一项的方法,其中至少一个标记物或单倍型的存在是在肿瘤或其前体中Chr8q24.21的体细胞重排的倾向性的指示。
26.权利要求25的方法,其中体细胞重排选自扩增,易位,***和缺失。
27.前述权利要求任一项的方法,其中个体为特定的血统。
28.权利要求27的方法,其中血统是非洲黑人血统。
29.权利要求27或28的方法,其中血统是自己报告的。
30.权利要求27或28的方法,其中血统是通过在个体的样品中检测至少一个多态性标记物的至少一个等位基因来确定的,其中等位基因的存在或不存在是个体血统的指示。
31.鉴定用于评估对癌症的易感性的标记物的方法,该方法包括
a.鉴定SEQ ID NO:2中的至少一个多态性标记物,或与其连锁不平衡的至少一个多态性标记物;
b.确定被诊断患有***癌或具有***癌易感性的个体的样品的基因型状态;以及
c.确定对照个体样品的基因型状态;
其中在被诊断患有***癌或具有***癌易感性的个体中至少一个等位基因在至少一种多态性中的频率,与对照样品中至少一个等位基因的频率相比的显著性差异,是至少一种多态性用于评估对癌症的易感性的指示。
32.权利要求31的方法,其中连锁不平衡的特征为r2的数值大于0.2和/或|D’|大于0.8。
33.权利要求31的方法,其中至少一个多态性标记物与HapC和/或标记物rs16901979连锁不平衡,其特征为r2的数值大于0.2和/或|D’|大于0.8。
34.权利要求31-33任一项的方法,其中在被诊断患有癌症或具有癌症易感性的个体中至少一个等位基因在至少一种多态性中的频率,与对照样品中至少一个等位基因的频率相比的增加,是至少一种多态性用于评估对癌症的增加的易感性的指示。
35.权利要求31-33任一项的方法,其中在被诊断患有剥脱性综合症或具有剥脱性综合症易感性的个体中至少一个等位基因在至少一种多态性中的频率,与对照样品中至少一个等位基因的频率相比的降低,是至少一种多态性用于评估对癌症的降低的易感性或针对癌症的保护的指示。
36.对从具有癌症风险或被诊断患有癌症的人类个体获得的核酸样品进行基因分型的方法,包括确定样品中至少一个多态性标记物的至少一个等位基因的存在或不存在,其中至少一个标记物选自表4A和4B中显示的标记物以及与其连锁不平衡的标记物,其中至少一个多态性标记物的至少一个等位基因的存在或不存在是癌症易感性的指示。
37.权利要求36的方法,其中至少一个标记物是rs16901979(SEQID NO:73)以及与其连锁不平衡的标记物。
38.权利要求36或37的方法,其中连锁不平衡由r2的数值至少0.2和/或|D’|的数值至少0.8来确定。
39.权利要求36-38任一项的方法,其中基因分型包括使用位于至少一个多态性标记物侧翼的核苷酸引物对,通过聚合酶链反应(PCR)来扩增含有至少一个多态性标记物的核酸区段。
40.权利要求36-39任一项的方法,其中基因分型使用选自等位基因特异性探针杂交,等位基因特异性引物延伸,等位基因特异性扩增,核酸测序,5’-外切核酸酶消化,分子信标分析,寡核苷酸连接分析,大小分析以及单链构象分析的方法来进行。
41.权利要求40的方法,其中方法包括等位基因特异性探针杂交。
42.权利要求40的方法,其中方法包括核酸测序。
43.权利要求42的方法,其中核酸测序是DNA测序。
44.权利要求36-39任一项的方法,包括:
1)将核酸的拷贝与检测寡核苷酸探针和增强子寡核苷酸探针在用于寡核苷酸探针与核酸特异性杂交的条件下相接触;
其中
a)检测寡核苷酸探针长度为5-100个核苷酸,并与含有至少一个多态性位点,其核苷酸序列在SEQ ID NO:2中给出的核酸的第一区段特异性杂交;
b)检测寡核苷酸探针在其3’末端含有可检测标记,在其5’末端含有淬灭基团;
c)增强子寡核苷酸长度为5-100个核苷酸,并与相对于寡核苷酸探针5’方向的核苷酸序列的第二区段互补,以便当两个寡核苷酸都与核酸杂交时,增强子寡核苷酸位于检测寡核苷酸的3’方向;以及
d)在第一个区段和第二个区段之间存在单个碱基缺口,使得当寡核苷酸探针和增强子寡核苷酸探针都与核酸杂交时,在寡核苷酸之间存在单个碱基缺口;
2)使用当检测探针与核酸杂交时将从检测探针的3’末端裂解可检测标记以释放游离的可检测标记的内切核酸酶处理核酸;以及
3)测量游离的可检测标记,其中游离的可检测标记的存在指示检测探针与核酸的第一区段特异性杂交,并指示多态性位点的序列与检测探针互补。
45.权利要求44的方法,其中核酸的拷贝通过聚合酶链反应(PCR)扩增来提供。
46.权利要求36-45任一项的方法,其中易感性是增加的易感性。
47.权利要求36-45任一项的方法,其中易感性是降低的易感性。
48.权利要求31-47任一项的方法,其中癌症选自***癌,结肠癌,乳腺癌,肺癌,睾丸癌和黑色素瘤。
49.权利要求31-47任一项的方法,其中癌症是***癌。
50.权利要求49的方法,其中***癌是由组合Gleason分值7(4+3)-10定义的侵略性***癌。
51.权利要求49的方法,其中***癌是由组合Gleason分值2-7(3+4)定义的低侵略性***癌。
52.权利要求31-51任一项的方法,其中个体为特定的血统。
53.权利要求52的方法,其中血统是非洲黑人血统。
54.权利要求52或53的方法,其中血统是自己报告的。
55.权利要求52或53的方法,其中血统是通过在个体的样品中检测至少一个多态性标记物的至少一个等位基因来确定的,其中等位基因的存在或不存在是个体血统的指示。
56.用于评估个体对预防和/或缓解与癌症相关的症状的治疗剂的应答的可能性的方法,包括:在从个体获得的核酸样品中确定至少一个多态性标记物的至少一个等位基因的存在或不存在,其中至少一个多态性标记物选自表5A,5B和5C中列出的多态性标记物,以及与其连锁不平衡的标记物,其中至少一个标记物的至少一个等位基因的存在,是对与剥脱性综合症和/或青光眼有关的症状的治疗剂作出阳性应答的可能性的指示。
57.预测被诊断患有癌症的个体的预后的方法,该方法包括确定从所述个体获得的核酸样品中至少一个多态性标记物的至少一个等位基因的存在或不存在,其中至少一个多态性标记物选自表5A,5B和5C中列出的多态性标记物,以及与其连锁不平衡的标记物,其中至少一个等位基因的存在是个体中癌症更糟的预后的指示。
58.监测经历癌症治疗的个体的治疗进展的方法,该方法包括确定从所述个体获得的核酸样品中至少一个多态性标记物的至少一个等位基因的存在或不存在,其中至少一个多态性标记物选自表5A,5B和5C中列出的多态性标记物,以及与其连锁不平衡的标记物,其中至少一个等位基因的存在是个体的治疗结果的指示。
59.权利要求56-58任一项的方法,其中至少一个多态性标记物是rs16901979(SEQ ID NO:73)以及与其连锁不平衡的标记物。
60.权利要求56-59任一项的方法,其中连锁不平衡由r2的数值为至少0.2和/或|D’|的值为至少0.8来定义。
61.权利要求56-60任一项的方法,其中癌症是***癌。
62.权利要求61的方法,其中***癌是由组合Gleason分值7(4+3)-10定义的侵略性***癌。
63.权利要求61的方法,其中***癌是由组合Gleason分值2-7(3+4)定义的低侵略性***癌。
64.前述权利要求任一项的方法,还包括评估个体样品中的至少一个生物标记物。
65.权利要求64的方法,其中样品是血液样品或癌症活检样品。
66.前述权利要求任一项的方法,还包括分析个体的非遗传信息以进行风险评估,诊断或预后。
67.权利要求66的方法,其中非遗传信息选自对象的年龄,性别,种族,社会经济状态,以前的疾病诊断,医学史,癌症的家族史,生物化学测量和临床测量。
68.权利要求64-67任一项的方法,还包括计算总风险。
69.用于在人类个体中评估癌症易感性的试剂盒,该试剂盒含有用于选择性检测个体的基因组中至少一个多态性标记物的至少一个等位基因的试剂,其中多态性标记物选自其序列显示在SEQ IN NO:2中的区段中的多态性标记物,以及与其连锁不平衡的标记物,其中至少一个等位基因的存在是对癌症的易感性的指示。
70.权利要求69的试剂盒,其中至少一个多态性标记物选自表5A,5B和5C中显示的标记物,以及与其连锁不平衡的标记物。
71.权利要求69的试剂盒,其中至少一个多态性标记物选自表4A和4B中显示的标记物。
72.权利要求69-71任一项的试剂盒,其中至少一个多态性标记物是rs 16901979(SEQ ID NO:73)。
73.权利要求69-72任一项的试剂盒,其中连锁不平衡由r2的数值为至少0.2和/或|D’|的值为至少0.8来定义。
74.权利要求69-73任一项的试剂盒,其中癌症选自***癌,结肠癌,乳腺癌,睾丸癌,肺癌和黑色素瘤癌症。
75.权利要求74的试剂盒,其中癌症是***癌。
76.权利要求75的试剂盒,其中***癌是由组合Gleason分值7(4+3)-10定义的侵略性***癌。
77.权利要求75的试剂盒,其中***癌是由组合Gleason分值2-7(3+4)定义的低侵略性***癌。
78.权利要求69-77任一项的试剂盒,其中试剂含有至少一个与个体的基因组的含有至少一个多态性标记物的片段杂交的连续的寡核苷酸,缓冲剂和可检测标记。
79.权利要求69-78任一项的试剂盒,其中试剂含有至少一对与从对象获得的基因组核酸区段的相对链杂交的寡核苷酸,其中每个寡核苷酸引物对被设计为选择性扩增个体的基因组中包含一个多态性标记物的片段,其中片段的大小为至少30个碱基对。
80.权利要求78或79的试剂盒,其中至少一个寡核苷酸与个体的基因组完全互补。
81.权利要求78-80任一项的试剂盒,其中寡核苷酸的长度为大约18到大约50个核苷酸。
82.权利要求78-81任一项的试剂盒,其中寡核苷酸的长度为20-30个核苷酸。
83.权利要求69-82任一项的试剂盒,其中试剂盒含有:
a.长度为5-100个核苷酸的检测寡核苷酸探针;
b.长度为5-100个核苷酸的增强子寡核苷酸探针;以及
c.内切核酸酶;
其中检测寡核苷酸探针与其核苷酸序列在SEQ ID NO:2中给出的核酸的含有至少一个多态性位点的第一区段特异性杂交;并且
其中检测寡核苷酸探针在其3’末端含有可检测标记,在其5’末端含有淬灭基团;
其中增强子寡核苷酸长度为5-100个核苷酸,并与相对于寡核苷酸探针5’方向的核苷酸序列的第二区段互补,以便当两个寡核苷酸都与核酸杂交时,增强子寡核苷酸位于检测寡核苷酸探针的3’方向;
其中在第一区段和第二区段之间存在单个碱基缺口,使得当寡核苷酸探针和增强子寡核苷酸探针都与核酸杂交时,在寡核苷酸之间存在单个碱基缺口;以及
其中当检测探针与核酸杂交时,使用内切核酸酶处理核酸将从检测探针的3’末端裂解可检测标记以释放游离的可检测标记。
84.寡核苷酸探针在制造用于在人类个体中诊断和/或评估癌症易感性的诊断试剂中的应用,其中探针与其核苷酸序列在SEQ ID NO:2中给出的核酸的含有至少一个多态性位点的区段杂交,其中片段的长度为15-500个核苷酸。
85.权利要求84的应用,其中多态性位点选自表5A,5B和5C中显示的多态性标记物,以及与其连锁不平衡的多态性。
86.权利要求84或85的应用,其中多态性位点是rs16901979(SEQ ID NO:73)。
87.权利要求84-87任一项的应用,其中癌症选自***癌,结肠癌,乳腺癌,睾丸癌,肺癌和黑色素瘤癌症。
88.权利要求87的应用,其中癌症是***癌。
89.权利要求88的应用,其中***癌是由组合Gleason分值7(4+3)-10定义的侵略性***癌。
90.权利要求88的应用,其中***癌是由组合Gleason分值2-7(3+4)定义的低侵略性***癌。
91.计算机可读介质,其中储存有:
d.至少一个多态性标记物的识别符;
e.该至少一个多态性标记物的至少一个等位基因在多个被诊断患有癌症的个体中的频率的指示符;以及
f.该至少一个多态性标记物的至少一个等位基因在多个参比个体中的频率的指示符;
其中至少一个多态性标记物选自表5A,5B和5C中显示的多态性标记物,以及与其连锁不平衡的多态性。
92.权利要求91的介质,其中多态性位点是rs16901979(SEQ IDNO:73),以及与其连锁不平衡的标记物,它们由r2的数值为至少0.2和/或|D’|的值为至少0.8所定义。
93.权利要求91或92的介质,其中癌症选自***癌,结肠癌,乳腺癌,睾丸癌,肺癌和黑色素瘤癌症。
94.权利要求93的介质,其中癌症是***癌。
95.权利要求93或94的介质,其中***癌是由组合Gleason分值7(4+3)-10定义的侵略性***癌。
96.权利要求93或94的介质,其中***癌是由组合Gleason分值2-7(3+4)定义的低侵略性***癌。
97.权利要求91-96任一项的介质,还包含与多个个体的血统有关的信息。
98.权利要求91-97任一项的介质,其中被诊断患有癌症的多个个体和多个参比个体为特定的血统。
99.权利要求98的介质,其中血统是非洲黑人血统。
100.权利要求99的介质,其中血统是自己报告的。
101.用于在人类个体中测定癌症遗传指示符的装置,包含:
计算机可读存储器:以及
储存在计算机可读存储器中的例行程序;
其中例行程序适用于在处理器上执行,以分析至少一个人类个体的至少一个多态性标记物的标记物和/或单倍型信息,其中该至少一个多态性标记物选自表5A,5B和5C中显示的标记物以及与其连锁不平衡的标记物,并基于标记物或单倍型信息产生输出,其中输出包括作为人类个体的癌症遗传指示符的至少一个标记物或单倍型的风险测量。
102.权利要求101的装置,其中例行程序还包含多个被诊断患有癌症的个体中至少一个多态性标记物的至少一个等位基因或至少一个单倍型的频率的指示符,以及多个参比个体中至少一个多态性标记物的至少一个等位基因或至少一个单倍型的频率的指示符,其中风险测量是基于人类个体的至少一个标记物和/或单倍型状态与多个被诊断患有癌症的个体的至少一个标记物和/或单倍型信息的频率的指示符的比较。
103.权利要求101或102的装置,其中至少一个多态性标记物是rs16901979(SEQ ID NO:73)以及与其连锁不平衡的标记物,它们由r2的数值为至少0.2和/或|D’|的值为至少0.8所定义。
104.权利要求101-103任一项的装置,其中风险测量用比值比(OR)和相对风险(RR)来表征。
CN200780046943A 2006-10-27 2007-10-26 chr8q24.21上的癌症易感性变体 Pending CN101641451A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
IS8560 2006-10-27
IS8560 2006-10-27

Publications (1)

Publication Number Publication Date
CN101641451A true CN101641451A (zh) 2010-02-03

Family

ID=39060300

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200780046943A Pending CN101641451A (zh) 2006-10-27 2007-10-26 chr8q24.21上的癌症易感性变体

Country Status (13)

Country Link
US (1) US20100129799A1 (zh)
EP (1) EP2089548A1 (zh)
JP (1) JP5631000B2 (zh)
CN (1) CN101641451A (zh)
AU (1) AU2007310412B2 (zh)
BR (1) BRPI0718322A2 (zh)
CA (1) CA2667737A1 (zh)
IL (1) IL198305A0 (zh)
MX (1) MX2009004522A (zh)
NZ (1) NZ576591A (zh)
SG (1) SG175680A1 (zh)
WO (1) WO2008050356A1 (zh)
ZA (1) ZA200903173B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102304567A (zh) * 2011-04-29 2012-01-04 广州益善生物技术有限公司 一种染色体8q24区段多态性检测特异性引物和液相芯片
CN106480211A (zh) * 2016-11-24 2017-03-08 深圳市核子基因科技有限公司 一种用于检测睾丸癌易感性的试剂盒及其snp标志物

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8865400B2 (en) * 2007-02-07 2014-10-21 Decode Genetics Ehf. Genetic variants contributing to risk of prostate cancer
BRPI0810425A2 (pt) 2007-04-17 2014-10-07 Santen Pharmaceutical Co Ltd Método para determinação do risco de progressão de glaucoma
US8697360B2 (en) 2007-11-30 2014-04-15 Decode Genetics Ehf. Genetic variants on CHR 11Q and 6Q as markers for prostate and colorectal cancer predisposition
US20090226912A1 (en) * 2007-12-21 2009-09-10 Wake Forest University Health Sciences Methods and compositions for correlating genetic markers with prostate cancer risk
AU2009269542A1 (en) * 2008-07-07 2010-01-14 Decode Genetics Ehf Genetic variants for breast cancer risk assessment
US8583380B2 (en) 2008-09-05 2013-11-12 Aueon, Inc. Methods for stratifying and annotating cancer drug treatment options
WO2010045318A2 (en) * 2008-10-14 2010-04-22 Caris Mpi, Inc. Gene and gene expressed protein targets depicting biomarker patterns and signature sets by tumor type
NZ596070A (en) * 2009-05-08 2013-10-25 Decode Genetics Ehf Genetic variants contributing to risk of prostate cancer
WO2011004404A1 (en) * 2009-07-10 2011-01-13 Decode Genetics Ehf Genetic variants for predicting risk of glaucoma
US20120316218A1 (en) * 2009-07-17 2012-12-13 Glinsky Gennadi V SMALL NON-CODING REGULARTORY RNA's and METHODS FOR THEIR USE
WO2011009089A1 (en) * 2009-07-17 2011-01-20 Ordway Research Institute, Inc. SMALL NON-CODING REGULATORY RNAs AND METHODS FOR THEIR USE
US9291625B2 (en) 2009-10-26 2016-03-22 Abbott Laboratories Diagnostic methods for determining prognosis of non-small cell lung cancer
CN105586433A (zh) 2009-10-26 2016-05-18 雅培制药有限公司 用于测定非小细胞肺癌预后的诊断方法
WO2012029080A1 (en) * 2010-08-30 2012-03-08 Decode Genetics Ehf Sequence variants associated with prostate specific antigen levels
WO2012031207A2 (en) 2010-09-03 2012-03-08 Wake Forest University Health Sciences Methods and compositions for correlating genetic markers with prostate cancer risk
US9309556B2 (en) 2010-09-24 2016-04-12 The Board Of Trustees Of The Leland Stanford Junior University Direct capture, amplification and sequencing of target DNA using immobilized primers
US9534256B2 (en) 2011-01-06 2017-01-03 Wake Forest University Health Sciences Methods and compositions for correlating genetic markers with risk of aggressive prostate cancer
WO2012109500A2 (en) 2011-02-09 2012-08-16 Bio-Rad Laboratories, Inc. Analysis of nucleic acids
US10233502B2 (en) 2011-06-22 2019-03-19 Indiana University Research And Technology Corporation Compositions for and methods of detecting, diagnosing, and prognosing thymic cancer
WO2013065072A1 (en) * 2011-10-30 2013-05-10 Decode Genetics Ehf Risk variants of prostate cancer
CN105555972B (zh) 2013-07-25 2020-07-31 伯乐生命医学产品有限公司 遗传测定
JP6883584B2 (ja) * 2015-08-27 2021-06-09 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. マルチオミック癌プロファイルを用いて機能的な患者固有の体細胞異常を識別するための統合された方法及びシステム
WO2017164699A1 (ko) * 2016-03-24 2017-09-28 서울대학교병원 (분사무소) 전립선암과 관련된 단일염기다형성 및 이를 이용한 유전 위험도 점수의 개발
KR101944927B1 (ko) 2016-03-24 2019-02-07 서울대학교산학협력단 전립선암과 관련된 단일염기다형성 및 이를 이용한 유전 위험도 점수의 개발
JP7138112B2 (ja) * 2017-02-01 2022-09-15 ファディア・アクチボラゲット 特定の特徴を有する個体において前立腺癌の存在または不存在を示すための方法
JPWO2020111169A1 (ja) * 2018-11-28 2021-11-04 国立大学法人千葉大学 多因子遺伝疾患の遺伝子検査法、及び検査キット
EP3963092A1 (en) * 2019-05-02 2022-03-09 Predictive Technology Group, Inc. Somatic cancer driver mutations in endometriosis lesions contribute to secondary cancer risk
US20230119558A1 (en) * 2020-03-06 2023-04-20 The Henry M. Jackson Foundation For The Advancement Of Military Medicine, Inc. Dna damage repair genes in cancer
KR102177222B1 (ko) * 2020-04-24 2020-11-10 유니젠바이오 주식회사 머신러닝 기반 암진단 예측 시스템
KR102177218B1 (ko) * 2020-04-24 2020-11-10 유니젠바이오 주식회사 머신러닝 기반 암진단 예측 장치

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5384261A (en) * 1991-11-22 1995-01-24 Affymax Technologies N.V. Very large scale immobilized polymer synthesis using mechanically directed flow paths
AU785425B2 (en) * 2001-03-30 2007-05-17 Genetic Technologies Limited Methods of genomic analysis
AU2002324649A1 (en) * 2001-08-04 2003-02-24 General Hospital Corporation Haplotype map of the human genome and uses therefor
US20040023237A1 (en) * 2001-11-26 2004-02-05 Perelegen Sciences Inc. Methods for genomic analysis
US20040146870A1 (en) * 2003-01-27 2004-07-29 Guochun Liao Systems and methods for predicting specific genetic loci that affect phenotypic traits

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
HAPMAP PROJECT: "Pr003657859.1 Sequence-specific sapiens variation rs16901979", 《PROBE DATABASE IN NCBI》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102304567A (zh) * 2011-04-29 2012-01-04 广州益善生物技术有限公司 一种染色体8q24区段多态性检测特异性引物和液相芯片
CN102304567B (zh) * 2011-04-29 2013-03-27 广州益善生物技术有限公司 一种染色体8q24区段多态性检测特异性引物和液相芯片
CN106480211A (zh) * 2016-11-24 2017-03-08 深圳市核子基因科技有限公司 一种用于检测睾丸癌易感性的试剂盒及其snp标志物

Also Published As

Publication number Publication date
AU2007310412A1 (en) 2008-05-02
JP5631000B2 (ja) 2014-11-26
CA2667737A1 (en) 2008-05-02
ZA200903173B (en) 2010-02-24
WO2008050356A1 (en) 2008-05-02
IL198305A0 (en) 2010-02-17
EP2089548A1 (en) 2009-08-19
AU2007310412B2 (en) 2013-02-14
MX2009004522A (es) 2009-07-02
US20100129799A1 (en) 2010-05-27
SG175680A1 (en) 2011-11-28
JP2010507388A (ja) 2010-03-11
BRPI0718322A2 (pt) 2013-11-26
NZ576591A (en) 2012-04-27

Similar Documents

Publication Publication Date Title
CN101641451A (zh) chr8q24.21上的癌症易感性变体
DK2471954T3 (en) Susceptibility genetic variants associated with cardiovascular diseases
KR101374304B1 (ko) 타입 2 당뇨병의 위험에 대한 진단 마커인 tcf7l2유전자의 유전적 변이체
CN101874120B (zh) 作为用于乳腺癌风险评估、诊断、预后和治疗的标记的chr2和chr16的遗传性变型
CA2566256C (en) Genetic polymorphisms associated with liver fibrosis methods of detection and uses thereof
KR20110036608A (ko) 유방암 위험도 평가를 위한 유전적 변이
CN107223159A (zh) 源自特定细胞类型的dna的检测及相关方法
CN101772578A (zh) 作为标记物用在乳腺癌风险评估、诊断、预后和治疗中的在CHR 5p12和10q26上的遗传变异体
KR20150092739A (ko) 예측변수 인자들을 이용하여 동정된 환자 부분모집단에서 암 치료를 위한 마시티닙의 용도
CN109476698B (zh) 基于基因的炎性肠病诊断
KR20180049093A (ko) 신규한 바이오마커 및 암의 치료 방법
KR20130123357A (ko) 저산소증과 관련된 질환의 진단방법 및 키트
CN101631876A (zh) 2型糖尿病的遗传易感性变体
KR20090087486A (ko) 타입 2 당뇨병의 유전적 감수성 변이
WO2006022629A1 (en) Methods of identifying risk of type ii diabetes and treatments thereof
AU2023203393A1 (en) Compositions and methods for screening and identifying clinically aggressive prostate cancer
AU2018360287B2 (en) Method for determining the response of a malignant disease to an immunotherapy
CA2497597A1 (en) Methods for identifying subjects at risk of melanoma and treatments
IL179831A (en) In vitro method for detecting the presence or possibility of autism or autism disorder, and in vitro method for selecting compounds with biological activity on autism or autism disorders
US20160250182A1 (en) Rab7l1 interacts with lrrk2 to modify intraneuronal protein sorting and parkinson&#39;s disease risk
CN107223162A (zh) 用于诊断***癌的新型rna‑生物标志物标签
WO2006022636A1 (en) Methods for identifying risk of type ii diabetes and treatments thereof
WO2018209358A2 (en) Systemic delivery of polypeptides
KR20190126812A (ko) 질환 진단용 바이오마커
TW202227102A (zh) 治療脂肪肝病之方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
AD01 Patent right deemed abandoned

Effective date of abandoning: 20151125

C20 Patent right or utility model deemed to be abandoned or is abandoned