KR20170041955A - 근위축성측삭경화증에 대한 진단 마커로서의 돌연변이 유전자 및 이를 이용한 진단방법 - Google Patents
근위축성측삭경화증에 대한 진단 마커로서의 돌연변이 유전자 및 이를 이용한 진단방법 Download PDFInfo
- Publication number
- KR20170041955A KR20170041955A KR1020150141113A KR20150141113A KR20170041955A KR 20170041955 A KR20170041955 A KR 20170041955A KR 1020150141113 A KR1020150141113 A KR 1020150141113A KR 20150141113 A KR20150141113 A KR 20150141113A KR 20170041955 A KR20170041955 A KR 20170041955A
- Authority
- KR
- South Korea
- Prior art keywords
- mutant
- gene
- substituted
- nucleotide sequence
- sequence
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6813—Hybridisation assays
- C12Q1/6834—Enzymatic or biochemical coupling of nucleic acids to a solid phase
- C12Q1/6837—Enzymatic or biochemical coupling of nucleic acids to a solid phase using probe arrays or probe chips
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/53—Immunoassay; Biospecific binding assay; Materials therefor
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/68—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/68—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
- G01N33/6887—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids from muscle, cartilage or connective tissue
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/158—Expression markers
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2800/00—Detection or diagnosis of diseases
- G01N2800/28—Neurological disorders
- G01N2800/2878—Muscular dystrophy
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Immunology (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Organic Chemistry (AREA)
- Hematology (AREA)
- Urology & Nephrology (AREA)
- Analytical Chemistry (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Pathology (AREA)
- Medicinal Chemistry (AREA)
- General Physics & Mathematics (AREA)
- Food Science & Technology (AREA)
- Cell Biology (AREA)
- Genetics & Genomics (AREA)
- Biophysics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Peptides Or Proteins (AREA)
Abstract
본 발명은 근위축성측삭경화증에 대한 마커로서 RAPGEF2, IFT80, SSH2, XRCC3, SPAG17, PLEKHM2, CLEC4C, FRAS1, ADGRL3, PSEN1 돌연변이 유전자 및 돌연변이 단백질과 이를 이용한 근위축성측삭경화증의 진단 방법을 제공한다. 본 발명의 근위축성측삭경화증 마커는 한국인 ALS 환자로부터 발견한 새로운 변이로서 종전에 보고된 데이터베이스에서 0.1% 미만의 빈도로 나타난 매우 드문 변이이거나 보고된 바 없는 변이이며, 정상 대조군에서는 발견되지 않는 변이이다. 본 발명에서 발견한 돌연변이 유전자 및/또는 이로부터 코딩되는 돌연변이 단백질은 ALS의 유전학적 원인을 밝히고 ALS를 진단하는데 매우 유용하게 사용될 수 있다. 본 발명에서 발견한 돌연변이 유전자 및/또는 이로부터 코딩되는 돌연변이 단백질에 대하여 유전자 또는 단백질 검사를 실시함으로써 근위축성측삭경화증을 조기 진단할 수 있으며, 적절한 치료방법을 조기에 적용하여 치료효과를 극대화할 수 있고, 나아가 정확한 병인에 따른 맞춤치료를 가능하게 할 수 있다.
Description
본 발명은 근위축성측삭경화증에 대한 진단 마커로서의 돌연변이 유전자 및 이를 이용한 진단방법에 관한 것이다.
근위축성측삭경화증(Amyotrophic lateral sclerosis; ALS)은 성인에서 발병하는 신경 퇴행성 질환으로 점진적인 대뇌 겉질, 숨뇌, 및 척수의 운동 신경 소실로 인해 발생한다. 약 10%의 환자에서는 가족력이 있는 가족성 ALS이며, 90% 가량의 환자는 가족력 없이 산발적으로 발생한다. 현재까지 SOD1, TARDBP, FUS, C9orf72 등을 비롯하여 여러 유전자들의 돌연변이가 ALS의 원인으로 보고되었으나, 가족성 ALS 환자 중 1/3과 산발성 ALS 환자의 약 90%에서는 유전적 원인이 밝혀지지 않았다. 최근 신경계 질환에서 산발성 환자 및 건강한 부모를 대상으로 환자에서만 발견되는 신규 변이(de novo variant)를 확인함으로써 질환의 원인이 되는 새로운 유전자를 발굴하는 연구가 대두되고 있다.
본 명세서 전체에 걸쳐 다수의 논문 및 특허문헌이 참조되고 그 인용이 표시되어 있다. 인용된 논문 및 특허문헌의 개시 내용은 그 전체로서 본 명세서에 참조로 삽입되어 본 발명이 속하는 기술 분야의 수준 및 본 발명의 내용이 보다 명확하게 설명된다.
Charcot J, Joffroy A. Arch Physiol Norm Pathol 1869;2:744-760
Cleveland DW, Rothstein JD. Nat Rev Neurosci 2001;2:806-819
Brain L, Walton JN. Oxford university press, London, 1969
Wijesekera LC, Leigh PN. Orphanet J Rare Dis 2009;4:3
Rowland LP, Shneider NA. N Engl J Med 2001;344:1688-1700
Kinsley L, Siddique T. Amyotrophic Lateral Sclerosis Overview. GeneReviews®http://www.ncbi.nlm.nih.gov/books/NBK1450/, Seattle, University of Washington, 2001
Traynor BJ, Codd MB, Corr B, Forde C, Frost E, Hardiman O. Neurology 1999;52:504-509
Abhinav K et al., Neuroepidemiology 2007;29:44-48
Manjaly ZR et al., Amyotroph Lateral Scler 2010;11:439-442
Forbes RB, Colville S, Swingler RJ. Age Ageing 2004;33:131-134
Gouveia LO, de Carvalho M. Amyotroph Lateral Scler 2007;8:323-327
Haverkamp LJ, Appel V, Appel SH. Brain 1995;118 ( Pt 3):707-719
Swinnen B, Robberecht W. Nat Rev Neurol 2014;10:661-670
Chio A, Calvo A, Moglia C, Mazzini L, Mora G. J Neurol Neurosurg Psychiatry 2011;82:740-746
Pinto S, Pinto A, De Carvalho M. Eura Medicophys 2007;43:505-509
Turner MR et al., J Neurol Sci 2010;294:81-85
Shoesmith CL, Findlater K, Rowe A, Strong MJ. J Neurol Neurosurg Psychiatry 2007;78:629-631
Gordon PH et al., Neurology 2006;66:647-653
Phukan J, Pender NP, Hardiman O. Lancet Neurol 2007;6:994-1003
A VB. Allg Z Psychiat Psychischgerichtliche Med 1932;96:364-366
Bak TH, Hodges JR. J Neurol 2001;248:260-270
Jeong Y et al., Neurology 2005;64:734-736
Talbot PR et al., J Neurol Neurosurg Psychiatry 1995;58:541-547
Mioshi E et al., Neurology 2014;82:149-155
Gilbert RM et al., Mov Disord 2010;25:1868-1875
Annesi G et al., Ann Neurol 2005;58:803-807
DeJesus-Hernandez M et al., Neuron 2011;72:245-256
Lindquist SG et al., Clin Genet 2013;83:279-283
Hensman Moss DJ et al., Neurology 2014;82:292-299
Isaacs JD et al., J Neurol Neurosurg Psychiatry 2007;78:750-753
Baltadzhieva R, Gurevich T, Korczyn AD. Curr Opin Neurol 2005;18:487-493
Brooks BR, Miller RG, Swash M, Munsat TL. Amyotroph Lateral Scler Other Motor Neuron Disord 2000;1:293-299
de Carvalho M et al., Clin Neurophysiol 2008;119:497-503
Cedarbaum JM et al., J Neurol Sci 1997;152 Suppl 1:S1-9
Cedarbaum JM et al., J Neurol Sci 1999;169:13-21
A controlled trial of recombinant methionyl human BDNF in ALS: The BDNF Study Group (Phase III). Neurology 1999;52:1427-1433
Cudkowicz ME et al., Neurology 2003;61:456-464
Groeneveld GJ et al., Ann Neurol 2003;53:437-445
Franchignoni F, Mandrioli J, Giordano A, Ferro S. Amyotroph Lateral Scler Frontotemporal Degener 2015:1-7
Franchignoni F et al., J Neurol Neurosurg Psychiatry 2013;84:1340-1345
Harwood CA, McDermott CJ, Shaw PJ. Amyotroph Lateral Scler 2009;10:191-204
Gallo V et al., Ann Neurol 2009;65:378-385
Roelofs-Iverson RA et al., Neurology 1984;34:393-395
Armon C. Neuroepidemiology 2003;22:217-228
Chio A et al., Brain 2005;128:472-476
Kasarskis EJ et al., Amyotroph Lateral Scler 2009;10:35-41
Pasinelli P, Brown RH. Nat Rev Neurosci 2006;7:710-723
Kiernan MC et al., The Lancet 2011;377:942-955
Watkins JC, Evans RH. Annu Rev Pharmacol Toxicol 1981;21:165-204
Heath PR, Shaw PJ. Muscle Nerve 2002;26:438-458
Maher P, Davis JB. J Neurosci 1996;16:6394-6401
Meldrum B, Garthwaite J. Trends Pharmacol Sci 1990;11:379-387
Liu R et al., Ann Neurol 1998;44:763-770
Menzies FM et al., Brain 2002;125:1522-1533
Damiano M et al., J Neurochem 2006;96:1349-1361
Rizzardini M et al., Brain Res Bull 2006;69:465-474
Bruijn LI et al., Science 1998;281:1851-1854
Sreedharan J et al., Science 2008;319:1668-1672
Kwiatkowski TJ et al., Science 2009;323:1205-1208
Renton AE, Chio A, Traynor BJ. Nat Neurosci 2014;17:17-23
Sreedharan J, Brown RH, Jr. Ann Neurol 2013;74:309-316
Andersen PM, Al-Chalabi A. Nat Rev Neurol 2011;7:603-615
Al-Chalabi A, Lewis CM. Hum Hered 2011;71:281-288
Rosen DR et al., Nature 1993;362:59-62
Neumann M et al., Science 2006;314:130-133
Maruyama H et al., Nature 2010;465:223-226
Johnson JO et al., Neuron 2010;68:857-864
Fecto F et al., Arch Neurol 2011;68:1440-1446
Wu CH et al., Nature 2012;488:499-503
Deng HX et al., Nature 2011;477:211-215
Luty AA et al., Ann Neurol 2010;68:639-649
Kim HJ et al., Nature 2013;495:467-473
Chio A et al., Neurology 2008;70:533-537
Andersen PM. Curr Neurol Neurosci Rep 2006;6:37-46
Wang J, Xu G, Borchelt DR. Neurobiol Dis 2002;9:139-148
Gurney ME et al., Science 1994;264:1772-1775
Boillee S et al., Science 2006;312:1389-1392
Cudkowicz ME et al., Ann Neurol 1997;41:210-221
Andersen PM et al., Brain 1996;119 ( Pt 4):1153-1172
Chio A et al., Neurology 2012;79:1983-1989
Buratti E, Baralle FE. Front Biosci 2008;13:867-878
Winton MJ et al., J Biol Chem 2008;283:13302-13309
Vance C et al., Science 2009;323:1208-1211
Renton AE et al., Neuron 2011;72:257-268
Majounie E et al., Lancet Neurol 2012;11:323-330
Wojciechowska M, Krzyzosiak WJ. Hum Mol Genet 2011;20:3811-3821
Chew J et al., Science 2015
Johnson JO et al., Nat Neurosci 2014;17:664-666
Buratti E et al., J Biol Chem 2005;280:37572-37584
Rademakers R, van Blitterswijk M. Neuron 2014;84:241-243
Smith BN et al., Neuron 2014;84:324-331
Cirulli ET et al., Science 2015;347:1436-1441
Freischmidt A et al., Nat Neurosci 2015
Kwon MJ et al., Neurobiol Aging 2012;33:1017 e1017-1023
Kim HJ et al., Neurobiol Aging 2014;35:1957.e1957-1958
Jang JH et al., Neurobiol Aging 2013;34:1311.e1317-1319
Crow JF. Nat Rev Genet 2000;1:40-47
Roach JC et al., Science 2010;328:636-639
Conrad DF et al., Nat Genet 2011;43:712-714
Kong A et al., Nature 2012;488:471-475
Littler M, Morton NE. J Med Genet 1990;27:307-310
Ivanchuk SM, Myers SM, Eng C, Mulligan LM. Hum Mol Genet 1996;5:2023-2026
O'Roak BJ et al., Nature 2012;485:246-250
Gratten J, Visscher PM, Mowry BJ, Wray NR. Nat Genet 2013;45:234-238
Veltman JA, Brunner HG. Nat Rev Genet 2012;13:565-575
Vissers LE et al., Nat Genet 2010;42:1109-1112
Alexander MD et al., Ann Neurol 2002;52:680-683
Chio A et al., Neurobiol Aging 2011;32:553 e523-556
DeJesus-Hernandez M et al., Hum Mutat 2010;31:E1377-1389
Chesi A et al., Nat Neurosci 2013;16:851-855
Calvo A et al., Neurobiol Aging 2014;35:1513 e1517-1513 e1511
Kim YE et al., Neurobiol Aging 2015;36:1604.e1617-1609
Mitchell JD. J Neurol 2000;247:7-12
Li H, Durbin R. Bioinformatics 2009;25:1754-1760
Olkowski ZL. Neuroreport 1998;9:239-242
Droppelmann CA et al., Amyotroph Lateral Scler Frontotemporal Degener 2013;14:444-451
Takahashi Y et al., Am J Hum Genet 2013;93:900-905
Couthouis J et al., Hum Mol Genet 2012;21:2899-2911
Al-Chalabi A et al., Hum Mol Genet 1999;8:157-164
Ticozzi N et al., Ann Neurol 2010;68:102-107
Leung CL et al., Brain Pathol 2004;14:290-296
Teyssou E et al., Neurobiol Aging 2014;35:1213.e1219-1213.e1212
Sabatelli M et al., Amyotroph Lateral Scler 2012;13:580-584
van Blitterswijk M et al., PLoS One 2012;7:e48983
Munch C et al., Neurology 2004;63:724-726
Ng PC et al., Nucleic Acids Res 2003;31:3812-3814
Ramensky V, Bork P, Sunyaev S. Nucleic Acids Res 2002;30:3894-3900
Adzhubei IA et al., Nat Methods 2010;7:248-249
Chen J et al., Nucleic Acids Res 2009;37:W305-311
Ezquerra M, Carnero C, Blesa R, Oliva R. Arch Neurol 2000;57:485-488
Pringle CE et al., Brain 1992;115 ( Pt 2):495-520
Dumanchin C et al., J Med Genet 1998;35:672-673
Portet F et al., Neurology 2003;61:1136-1137
Golan MP et al., Exp Neurol 2007;208:264-268
Ataka S et al., Arch Neurol 2004;61:1773-1776
Hattori S et al., Neurosci Lett 2004;368:319-322
Raman A et al., J Neurol Sci 2007;260:78-82
Brooks WS et al., Brain 2003;126:783-791
Verkkoniemi A et al., Neurology 2000;54:1103-1109
Crook R et al., Nat Med 1998;4:452-455
Sanders SJ et al., Nature 2012;485:237-241
Neale BM et al., Nature 2012;485:242-245
Iossifov I et al., Neuron 2012;74:285-299
Rebhun JF, Castro AF, Quilliam LA. J Biol Chem 2000;275:34901-34908
Ye T, Ip JP, Fu AK, Ip NY. Nat Commun 2014;5:4826
de Rooij J et al., J Biol Chem 1999;274:38125-38130
Pham N, Rotin D. J Biol Chem 2001;276:28478-28483
Ohtsuka T et al., Biochem Biophys Res Commun 1999;265:38-44
Hisata S et al., J Cell Biol 2007;178:843-860
Bilasy SE et al., Eur J Neurosci 2009;29:1994-2008
Lee KJ et al., Neuron 2011;69:957-973
Utreras E et al., Neurochem Int 2013;62:848-853
Beales PL et al., Nat Genet 2007;39:727-729
Wang C, Yuan X, Yang S. Exp Cell Res 2013;319:623-632
Niwa R et al., Cell 2002;108:233-246
Fromer M et al., Nature 2014;506:179-184
Riboldi E et al., J Biol Chem 2011;286:35329-35333
Chappell CP et al., J Immunol 2014;192:5789-5801
Boucrot E et al., Science 2005;308:1174-1178
Petrou P et al., J Biol Chem 2005;280:10350-10356
McGregor L et al., Nat Genet 2003;34:203-208
Sugita S et al., J Biol Chem 1998;273:32715-32724
Arcos-Burgos M et al., Mol Psychiatry 2010;15:1053-1066
Teves ME et al., Am J Respir Cell Mol Biol 2013;48:765-772
Teves ME et al., PLoS One 2015;10:e0125936
Zhang B et al., , Wang M, Tang D, Li Y, Xu M, Gu M, Cheng Z, Yu H. J Exp Bot 2015
Brenneman MA et al., Mol Cell 2002;10:387-395
van Blitterswijk M et al., Hum Mol Genet 2012;21:3776-3784
본 발명자들은 산발성 ALS 환자 및 그들의 부모를 대상으로 엑솜 서열 확인법을 이용하여 ALS에 대한 새로운 원인 유전자를 발굴하고자 연구 노력하였다. 그 결과, ALS 환자에서 10개 유전자에 대한 신규 변이를 발견하였으며, 특히 RAPGEF2 유전자가 ALS의 새로운 원인 유전자임을 규명하였고, 상기 신규 변이가 ALS 진단에 유용하게 이용될 수 있음을 확인함으로써 본 발명을 완성하였다.
따라서, 본 발명의 목적은 근위축성측삭경화증에 대한 진단 마커로서 RAPGEF2, IFT80, SSH2, XRCC3, SPAG17, PLEKHM2, CLEC4C, FRAS1, ADGRL3, PSEN1 돌연변이 유전자를 제공하는데 있다.
본 발명의 다른 목적은 근위축성측삭경화증에 대한 진단 마커로서 RapGEF2, IFT80, SSH2, XRCC3, SPAG17, CLEC4C, FRAS1, ADGRL3, PSEN1 돌연변이 단백질을 제공하는데 있다.
본 발명의 또 다른 목적은 근위축성측삭경화증의 진단에 필요한 정보를 제공하는 방법을 제공하는데 있다.
본 발명의 또 다른 목적은 근위축성측삭경화증 진단용 조성물을 제공하는데 있다.
본 발명의 또 다른 목적은 근위축성측삭경화증 진단용 키트를 제공하는데 있다.
본 발명의 다른 목적 및 이점은 하기의 발명의 상세한 설명 및 청구범위에 의해 보다 명확하게 된다.
본 발명의 일 양태에 따르면, 본 발명은 근위축성측삭경화증(Amyotrophic lateral sclerosis; ALS)에 대한 진단 마커로서 (ⅰ) 서열목록 제1서열의 염기서열에서 4069번째 염기인 구아닌이 아데닌으로 치환, 1883번째 염기인 시토신이 티민으로 치환 또는 3293번째 염기인 구아닌이 아데닌으로 치환된 RAPGEF2 돌연변이 유전자; (ⅱ) 서열목록 제2서열의 염기서열에서 595번째 염기인 구아닌이 아데닌으로 치환된 IFT80 돌연변이 유전자; (ⅲ) 서열목록 제3서열의 염기서열에서 1408번째 염기인 구아닌이 티민으로 치환된 SSH2 돌연변이 유전자; (ⅳ) 서열목록 제4서열의 염기서열에서 598번째 염기인 구아닌이 아데닌으로 치환된 XRCC3 돌연변이 유전자; (ⅴ) 서열목록 제5서열의 염기서열에서 2815번째 염기인 구아닌이 티민으로 치환된 SPAG17 돌연변이 유전자; (ⅵ) 서열목록 제6서열의 염기서열에서 1921+6번째 염기인 시토신이 티민으로 치환된 PLEKHM2 돌연변이 유전자; (ⅶ) 서열목록 제7서열의 염기서열에서 629번째에서 631번째 염기인 아데닌, 구아닌 및 아데닌이 결실된 CLEC4C 돌연변이 유전자; (ⅷ) 서열목록 제8서열의 염기서열에서 8393번째 염기인 시토신이 티민으로 치환된 FRAS1 돌연변이 유전자; (ⅸ) 서열목록 제9서열의 염기서열에서 715번째 염기인 아데닌이 구아닌으로 치환된 ADGRL3 돌연변이 유전자; 및 (ⅹ) 서열목록 제10서열의 염기서열에서 497번째 염기인 티민이 시토신으로 치환된 PSEN1 돌연변이 유전자로 구성된 군으로부터 선택되는 돌연변이 유전자를 제공한다.
본 발명의 다른 일 양태에 따르면, 본 발명은 근위축성측삭경화증에 대한 진단 마커로서 (ⅰ) 서열목록 제1서열의 염기서열에서 4069번째 염기인 구아닌이 아데닌으로 치환, 1883번째 염기인 시토신이 티민으로 치환 또는 3293번째 염기인 구아닌이 아데닌으로 치환된 RAPGEF2 돌연변이 유전자로부터 암호화되는 RapGEF2 돌연변이 단백질; (ⅱ) 서열목록 제2서열의 염기서열에서 595번째 염기인 구아닌이 아데닌으로 치환된 IFT80 돌연변이 유전자로부터 암호화되는 IFT80 돌연변이 단백질; (ⅲ) 서열목록 제3서열의 염기서열에서 1408번째 염기인 구아닌이 티민으로 치환된 SSH2 돌연변이 유전자로부터 암호화되는 SSH2 돌연변이 단백질; (ⅳ) 서열목록 제4서열의 염기서열에서 598번째 염기인 구아닌이 아데닌으로 치환된 XRCC3 돌연변이 유전자로부터 암호화되는 XRCC3 돌연변이 단백질; (ⅴ) 서열목록 제5서열의 염기서열에서 2815번째 염기인 구아닌이 티민으로 치환된 SPAG17 돌연변이 유전자로부터 암호화되는 SPAG17 돌연변이 단백질; (ⅵ) 서열목록 제7서열의 염기서열에서 629번째에서 631번째 염기인 아데닌, 구아닌 및 아데닌이 결실된 CLEC4C 돌연변이 유전자로부터 암호화되는 CLEC4C 돌연변이 단백질; (ⅶ) 서열목록 제8서열의 염기서열에서 8393번째 염기인 시토신이 티민으로 치환된 FRAS1 돌연변이 유전자로부터 암호화되는 FRAS1 돌연변이 단백질; (ⅷ) 서열목록 제9서열의 염기서열에서 715번째 염기인 아데닌이 구아닌으로 치환된 ADGRL3 돌연변이 유전자로부터 암호화되는 ADGRL3 돌연변이 단백질; 및 (ⅸ) 서열목록 제10서열의 염기서열에서 497번째 염기인 티민이 시토신으로 치환된 PSEN1 돌연변이 유전자로부터 암호화되는 PSEN1 돌연변이 단백질로 구성된 군으로부터 선택되는 돌연변이 단백질을 제공한다.
본 발명자들은 산발성 ALS 환자 및 그들의 부모를 대상으로 엑솜 서열 확인법을 이용하여 ALS에 대한 새로운 원인 유전자를 발굴하고자 연구 노력하였다. 그 결과, ALS 환자에서 10개 유전자에 대한 신규 변이를 발견하였으며, 특히 RAPGEF2 유전자가 ALS의 새로운 원인 유전자임을 규명하였고, 상기 신규 변이가 ALS 진단에 유용하게 이용될 수 있음을 확인하였다.
근위축성측삭경화증(Amyotrophic lateral sclerosis; ALS)은 운동신경세포만 선택적으로 사멸하는 질환으로 루게릭병으로도 불리우며, 대뇌 겉질의 상위운동신경세포(upper motor neuron)와 뇌간 및 척수의 아래운동신경세포(lower motor neuron) 모두가 점차적으로 파괴되는 특징을 보인다. 임상 증상은 서서히 진행되는 사지의 위약(weakness, 쇠약) 및 위축으로 시작하고, 병이 진행되면서 결국 호흡근 마비로 수년 내에 사망에 이르게 되는 치명적인 질환이다.
본 발명에서는 총 15명의 한국인 산발성 ALS 환자 및 부모를 대상으로 엑솜 서열 확인법을 시행하고, 엑손 및 스플라이스 위치에서 신규 변이를 발견하였으며, 이 변이가 이전에 보고된 인구 집단의 빈도가 1% 미만으로 매우 드물고 한국인 정상인 대조군에서 발견되지 않는 변이임을 규명하였다. 본 발명에서 ALS 환자로부터 발견한 신규 변이는 RAPGEF2 c.4069G>A (p.Glu1357Lys), RAPGEF2 c.1883C>T (p.Thr628Ile), RAPGEF2 c.3293G>A (p.Arg1098His), FRAS1 c.8393C>T (p.Ala2798Val), SPAG17 c.2815G>T (p.Ala939Ser), XRCC3 c.598G>A (p.Val200Ile), IFT80 c.595G>A (p.Val199Ile), ADGRL3 c.715A>G (p.Ser239Gly), SSH2 c.1408G>T (p.Glu470*), CLEC4C c.629_631delAGA (p.Lys210del), PLEKHM2 (c.1921+6C>T) 및 PSEN1 c.497T>C (p.Leu166Pro)였으며, 이 가운데 특히 RAPGEF2 유전자에서 발견된 세 개의 변이는 dbSNP141, 1000 지놈 프로젝트 및 EAC (Exome Aggregation Consortitum) 데이터베이스에서 0.1% 미만의 빈도로 매우 드문 변이이거나 보고된 바 없었고, 한국인 대조군에서도 발견되지 않았으며 통계학적 분석에서 RAPGEF2 유전자가 ALS와 관련이 있을 가능성이 확인되었다.
본 발명에서 ALS 환자로부터 발견한 변이 가운데 PSEN1 c.497T>C는 가족성 EOAD(early-onset Alzheimer’s dementia)에서 종전에 보고된 바 있는 변이이나, ALS 환자에서는 처음으로 발견된 변이이다.
그 외에 다른 변이들은 종전에 보고된 적 없는 새로운 변이(variants of unknown significance, VUS)이다. 본 발명에서 발견한 11개의 신규 VUS 가운데 10개 변이는 엑손 영역에 위치하는 아미노산에 영향을 주는 변이였다. FRAS1 c.8393C>T (p.Ala2798Val), RAPGEF2 c.4069G>A (p.Glu1357Lys), RAPGEF2 c.1883C>T (p.Thr628Ile), RAPGEF2 c.3293G>A (p.Arg1098His), SPAG17 c.2815G>T (p.Ala939Ser), XRCC3 c.598G>A (p.Val200Ile), IFT80 c.595G>A (p.Val199Ile), ADGRL3 c.715A>G (p.Ser239Gly) 및 XRCC3 c.598G>A (p.Val200Ile)는 missense 변이이고, CLEC4C c.629_631delAGA (p.Lys210del)는 inframe deletion, SSH2 c.1408G>T (p.Glu470*)는 nonsense 변이를 나타낸다. 나머지 하나는 엑손 경계 근처의 플랭킹 영역에 위치하는 인트론 변이였다(PLEKHM2 c.1921+6C>T).
본 발명의 일 구현예에 따르면, 본 발명의 (ⅰ) RapGEF2 돌연변이 단백질은 서열목록 제11서열의 아미노산 서열에서 1357번째 아미노산 잔기인 글루탐산이 라이신으로 치환, 628번째 아미노산 잔기인 트레오닌이 이소류신으로 치환 또는 1098번째 아미노산 잔기인 아르기닌이 히스티딘으로 치환된 RapGEF2 돌연변이 단백질이고; (ⅱ) IFT80 돌연변이 단백질은 서열목록 제12서열의 아미노산 서열에서 199번째 아미노산 잔기인 발린이 이소류신으로 치환된 IFT80 돌연변이 단백질이며; (ⅲ) SSH2 돌연변이 단백질은 서열목록 제13서열의 아미노산 서열에서 470번째 아미노산 잔기인 글루탐산이 종결코돈으로 치환된 SSH2 돌연변이 단백질이고; (ⅳ) XRCC3 돌연변이 단백질은 서열목록 제14서열의 아미노산 서열에서 200번째 아미노산 잔기인 발린이 이소류신으로 치환된 XRCC3 돌연변이 단백질이며; (ⅴ) SPAG17 돌연변이 단백질은 서열목록 제15서열의 아미노산 서열에서 939번째 아미노산 잔기인 알라닌이 세린으로 치환된 SPAG17 돌연변이 단백질이고; (ⅵ) CLCE4C 돌연변이 단백질은 서열목록 제16서열의 아미노산 서열에서 210번째 아미노산 잔기인 라이신이 결실된 CLEC4C 돌연변이 단백질이며; (ⅶ) FRAS1 돌연변이 단백질은 서열목록 제17서열의 아미노산 서열에서 2798번째 아미노산 잔기인 알라닌이 발린으로 치환된 FRAS1 돌연변이 단백질이고; (ⅷ) ADGRL3 돌연변이 단백질은 서열목록 제18서열의 아미노산 서열에서 239번째 아미노산 잔기인 세린이 글라이신으로 치환된 ADGRL3 돌연변이 단백질이며; (ⅸ) PSEN1 돌연변이 단백질은 서열목록 제19서열의 아미노산 서열에서 166번째 아미노산 잔기인 류신이 프롤린으로 치환된 PSEN1 돌연변이 단백질이다.
PLEKHM2 c.1921+6C>T는 인트론 영역에서 나타나는 변이로서 돌연변이 단백질을 생산하지 않는다.
본 발명에 따르면, 본 발명에서 발견한 돌연변이 유전자 및/또는 이로부터 코딩되는 돌연변이 단백질은 ALS의 유전학적 원인을 밝히고 ALS를 진단하는데 매우 유용하게 사용될 수 있다.
본 발명의 다른 일 양태에 따르면, 본 발명은 다음 단계를 포함하는 근위축성측삭경화증의 진단에 필요한 정보를 제공하는 방법을 제공한다:
(a) 개체(subject)로부터 분리된 생물학적 시료로부터 (ⅰ) 서열목록 제1서열의 염기서열에서 4069번째 염기인 구아닌이 아데닌으로 치환, 1883번째 염기인 시토신이 티민으로 치환 또는 3293번째 염기인 구아닌이 아데닌으로 치환된 RAPGEF2 돌연변이 유전자; (ⅱ) 서열목록 제2서열의 염기서열에서 595번째 염기인 구아닌이 아데닌으로 치환된 IFT80 돌연변이 유전자; (ⅲ) 서열목록 제3서열의 염기서열에서 1408번째 염기인 구아닌이 티민으로 치환된 SSH2 돌연변이 유전자; (ⅳ) 서열목록 제4서열의 염기서열에서 598번째 염기인 구아닌이 아데닌으로 치환된 XRCC3 돌연변이 유전자; (ⅴ) 서열목록 제5서열의 염기서열에서 2815번째 염기인 구아닌이 티민으로 치환된 SPAG17 돌연변이 유전자; (ⅵ) 서열목록 제6서열의 염기서열에서 1921+6번째 염기인 시토신이 티민으로 치환된 PLEKHM2 돌연변이 유전자로 구성된 군으로부터 선택되는 돌연변이 유전자; (ⅶ) 서열목록 제7서열의 염기서열에서 629번째에서 631번째 염기인 아데닌, 구아닌 및 아데닌이 결실된 CLEC4C 돌연변이 유전자; (ⅷ) 서열목록 제8서열의 염기서열에서 8393번째 염기인 시토신이 티민으로 치환된 FRAS1 돌연변이 유전자; (ⅸ) 서열목록 제9서열의 염기서열에서 715번째 염기인 아데닌이 구아닌으로 치환된 ADGRL3 돌연변이 유전자; 또는 (ⅹ) 서열목록 제10서열의 염기서열에서 497번째 염기인 티민이 시토신으로 치환된 PSEN1 돌연변이 유전자의 mRNA 또는 상기 유전자에 의해 코딩되는 돌연변이 단백질을 검출하는 단계; 및
(b) 상기 시료에서 상기 돌연변이 유전자의 mRNA 또는 돌연변이 단백질이 검출된 경우, 상기 개체는 근위축성측삭경화증인 것으로 판정하는 단계.
본 발명에서 용어 “생물학적 시료”란 근위축성측삭경화증 여부를 확인하고자 하는 개체로부터 분리된 조직, 세포, 전혈, 혈청, 혈장, 타액, 객담, 뇌척수액 또는 뇨와 같은 시료를 포함하나, 이들에 한정되는 것은 아니다.
본 발명에 따르면, 상기 단계 (a)에서 mRNA는 상기 돌연변이 유전자에 특이적으로 결합하는 프라이머, 프로브 및 공지된 다양한 시퀀싱 방법을 이용하여 검출할 수 있다.
mRNA를 검출하기 위한 방법으로는 역전사효소 중합효소반응, 경쟁적 역전사효소 중합효소반응, 실시간 역전사효소 중합효소반응, RNase 보호 분석법, 노던 블롯 (northern blot), DNA 마이크로어레이 칩 등이 있으나, 이들에 한정되는 것은 아니다.
상기 방법을 통하여 대상 질환의 발병이 의심되는 개체에서 돌연변이 유전자의 mRNA를 검출할 수 있고, mRNA 검출 여부를 판단하여 근위축성측삭경화증을 진단할 수 있다. mRNA는 바람직하게는 진단 마커로 사용되는 돌연변이 유전자에 특이적인 프라이머를 사용하는 역전사효소 중합반응 또는 상기 유전자에 특이적인 탐침을 사용하는 DNA 마이크로어레이 칩을 이용하여 검출할 수 있다.
본 발명의 일 구현예에 따르면, 진단 마커로 사용되는 돌연변이 유전자에 특이적인 프라이머를 사용하여 역전사효소 중합반응을 수행한 후 생성물을 전기영동하여 확인함으로써 상기 돌연변이 유전자의 존재 여부를 검출하고, 그로부터 근위축성측삭경화증을 간편하게 진단할 수 있다.
한편, DNA 마이크로어레이 칩은 상기 돌연변이 유전자 또는 그 단편에 해당하는 핵산이 유리 등의 기판에 고밀도로 부착되어 있는 DNA 칩을 이용하는 것으로서, 개체 시료로부터 mRNA를 분리하고, 그 말단 또는 내부에 형광물질이 표지된 cDNA 탐침을 만들어 DNA 칩에 혼성화시킴으로써 근위축성측삭경화증을 진단할 수 있다.
구체적으로, DNA 마이크로 어레이 칩을 이용한 분석방법은 하기의 단계를 포함할 수 있다:
(1) 개체 시료로부터 돌연변이 유전자의 mRNA를 분리하는 단계;
(2) 상기 mRNA를 cDNA로 합성하면서 형광물질로 표지하는 단계;
(3) 상기 형광물질로 표지된 cDNA를 돌연변이 유전자에 대한 탐침이 고정된 DNA 마이크로어레이 칩과 혼성화하는 단계; 및
(4) 상기 혼성화된 DNA 마이크로어레이 칩을 분석하여 개체 시료에서의 돌연변이 유전자의 발현을 검출하는 단계.
상기 분석방법에 적합한 형광물질로 Cy3, Cy5, FITC(poly L-lysine-fluorescein isothiocyanate), RITC(rhodamine-B-isothiocyanate), 로다민(rhodamine) 등을 사용할 수 있으나, 이들에 한정되는 것은 아니다.
본 발명에 따르면, 상기 단계 (a)에서 돌연변이 단백질은 상기 돌연변이 단백질에 특이적으로 결합하는 항체를 이용하여 측정할 수 있다.
돌연변이 단백질을 측정하기 위한 분석방법으로 웨스턴 블로팅, ELISA, 방사선 면역분석법, 방사선 면역확산법, 오우크테로니 면역확산법, 로켓 면역전기영동, 면역조직화학염색, 면역침전분석, 보체고정분석, FACS, 단백질 칩 등을 이용할 수 있으나, 이들에 한정되는 것은 아니다.
상기 방법을 통하여 대상 질환의 발병이 의심되는 개체에서 항원-항체 복합체의 형성량을 검출할 수 있고, 돌연변이 유전자로부터 코딩되는 단백질의 발현 여부를 판단하여 근위축성측삭경화증 여부를 진단할 수 있다.
본 발명에서 용어 “항원-항체 복합체”란 돌연변이 유전자로부터 코딩되는 단백질과 이에 특이적인 항체의 결합물을 의미하고, 항원-항체 복합체의 형성량은 검출 표지의 신호강도를 통해서 정량적으로 측정할 수 있다.
단백질 발현은 예를 들면 ELISA를 이용하여 측정할 수 있다. ELISA는 고체 지지체에 부착된 항원을 인지하는 표지된 항체를 이용하는 직접 ELISA, 고체 지지체에 부착된 항원을 인지하는 항체의 복합체에서 포획 항체를 인지하는 표지된 항체를 이용하는 간접 ELISA, 고체 지지체에 부착된 항체와 항원의 복합체에서 항원을 인지하는 표지된 또 다른 항체를 이용하는 직접 샌드위치 ELISA, 고체 지지체에 부착된 항체와 항원의 복합체에서 항원을 인지하는 또 다른 항체와 반응시킨 후 이 항체를 인지하는 표지된 2차 항체를 이용하는 간접 샌드위치 ELISA 등 다양한 ELISA 방법이 포함된다.
또한, 상기 돌연변이 유전자로부터 코딩되는 단백질에 대한 하나 이상의 항체를 이용한 웨스턴 블로팅을 이용할 수 있다. 시료에서 전체 단백질을 분리하고, 이를 전기영동하여 단백질을 크기에 따라 분리한 다음, 니트로셀룰로스 막으로 이동시켜 항체와 반응시킨다. 생성된 항원-항체 복합체의 양을 표지된 항체를 이용하여 확인하는 방법으로 유전자의 발현에 의해 생성된 단백질의 양을 확인함으로써 근위축성측삭경화증을 진단할 수 있다.
또한, 상기 돌연변이 유전자로부터 코딩되는 단백질에 대한 하나 이상의 항체를 이용한 면역조직화학염색을 실시할 수 있다. 개체로부터 채취한 조직을 고정시킨 후 당해 분야에 널리 공지된 방법으로 파라핀 포매 블록을 만든다. 이들을 수 ㎛ 두께의 절편으로 만들어 유리 슬라이드에 붙여 조직 절편 슬라이드를 만든 후, 여기에 본 발명에 따른 돌연변이 유전자로부터 코딩되는 단백질에 특이적인 항체를 공지의 방법에 따라 반응시킨다. 이후, 반응하지 못한 항체는 세척하여 제거하고, 면역반응을 관찰하기 위한 발색시약으로 반응시켜 상기 단백질의 발현을 현미경 하에서 관찰함으로써 근위축성측삭경화증을 진단할 수 있다.
또한, 상기 돌연변이 유전자로부터 코딩되는 단백질에 대한 하나 이상의 항체가 기판 위의 정해진 위치에 배열되어 고밀도로 고정화되어 있는 단백질 칩을 이용할 수 있다. 단백질 칩을 이용하여 시료를 분석하는 방법은 시료에서 단백질을 분리하고, 분리한 단백질을 단백질 칩과 혼성화시켜 항원-항체 복합체를 형성하고, 이를 판독하여 단백질의 존재를 확인함으로써 근위축성측삭경화증을 진단할 수 있다.
본 발명의 다른 일 양태에 따르면, 본 발명은 생물학적 시료로부터 본 발명의 돌연변이 유전자의 mRNA 또는 상기 유전자에 의해 코딩되는 돌연변이 단백질을 검출할 수 있는 검출제를 포함하는 근위축성측삭경화증 진단용 조성물을 제공한다.
본 발명에서 mRNA를 검출하는데 사용되는 검출제는 상기 돌연변이 유전자에 특이적으로 결합하는 프라이머 또는 프로브이다.
본 발명의 근위축성측삭경화증 진단용 조성물에서 이용되는 프로브 또는 프라이머는 상기 돌연변이 유전자 뉴클레오티드 서열에 대하여 상보적인 서열을 갖는다. 본 명세서에서 용어 “상보적(complementary)”은 어떤 특정한 혼성화(hybridization) 또는 어닐링 조건 하에서 상술한 뉴클레오티드 서열에 선택적으로 혼성화할 수 있을 정도의 상보성을 갖는 것을 의미한다. 따라서 용어 “상보적”은 용어 완전 상보적(perfectly complementary)과는 다른 의미를 가지며, 본 발명의 프라이머 또는 프로브는 상술한 뉴클레오티드 서열에 선택적으로 혼성화할 수 있을 정도이면, 하나 또는 그 이상의 미스매치(mismatch) 염기서열을 가질 수 있다.
본 명세서에서 사용되는 용어 “프라이머”는 적합한 온도에서 적합한 완충액 내에서 적합한 조건(즉, 4종의 다른 뉴클레오사이드 트리포스페이트 및 중합반응 효소) 하에서 주형-지시 DNA 합성의 개시점으로 작용할 수 있는 단일-가닥 올리고뉴클레오타이드를 의미한다. 프라이머의 적합한 길이는 다양한 요소, 예컨대, 온도와 프라이머의 용도에 따라 변화가 있지만 전형적으로 15-30 베이스 페어이다. 짧은 프라이머 분자는 주형과 충분히 안정된 혼성 복합체를 형성하기 위하여 일반적으로 보다 낮은 온도를 요구한다.
프라이머의 서열은 주형의 일부 서열과 완전하게 상보적인 서열을 가질 필요는 없으며, 주형과 혼성화되어 프라이머 고유의 작용을 할 수 있는 범위 내에서의 충분한 상보성을 가지면 충분하다. 따라서 본 발명에서의 프라이머는 주형인 상술한 뉴클레오티드 서열에 완벽하게 상보적인 서열을 가질 필요는 없으며, 이 유전자 서열에 혼성화되어 프라이머 작용을 할 수 있는 범위 내에서 충분한 상보성을 가지면 충분하다. 이러한 프라이머의 디자인은 상술한 뉴클레오티드 서열을 참조하여 당업자에 의해 용이하게 실시할 수 있으며, 예컨대, 프라이머 디자인용 프로그램(예: PRIMER 3 프로그램)을 이용하여 할 수 있다.
본 명세서에서 사용된 용어 “프로브”는 자연의 또는 변형된 모노머 또는 연쇄(linkages)의 선형 올리고머를 의미하며, 디옥시리보뉴클레오타이드 및 리보뉴클레오타이드를 포함하고 타깃 뉴클레오타이드 서열에 특이적으로 혼성화 할 수 있으며, 자연적으로 존재하거나 또는 인위적으로 합성된 것이다. 본 발명의 프로브는 바람직하게는 단일쇄이며, 올리고디옥시리보뉴클레오타이드이다.
프라이머 또는 프로브 제작 시 참조하여야 하는 본 발명 마커의 뉴클레오타이드 서열은 서열목록 제1서열 내지 제10서열에서 확인할 수 있으며, 이 서열을 참조하여 프라이머 또는 프로브를 디자인할 수 있다.
본 발명에서 단백질을 검출하는데 사용되는 검출제는 올리고펩타이드, 모노클로날 항체, 폴리클로날 항체, 키메릭(chimeric) 항체, 리간드, PNA(Peptide nucleic acid) 또는 앱타머(aptamer)이다. 본 발명에서 사용되는 단백질 검출제는 바람직하게는 본 발명의 돌연변이 유전자에 의해 코딩되는 단백질에 특이적인 항체이다.
본 발명에서 이용되는 항체는 폴리클로날 또는 모노클로날 항체이며, 바람직하게는 모노클로날 항체이다. 항체는 당업계에서 통상적으로 실시되는 방법들, 예를 들어, 융합 방법(Kohler and Milstein, European Journal of Immunology, 6:511-519(1976)), 재조합 DNA 방법(미국 특허 제4,816,56호) 또는 파아지 항체 라이브러리 방법(Clackson et al, Nature, 352:624-628(1991) 및 Marks et al, J. Mol . Biol ., 222:58, 1-597(1991))에 의해 제조될 수 있다. 항체 제조에 대한 일반적인 과정은 Harlow, E. and Lane, D., Using Antibodies: A Laboratory Manual, Cold Spring Harbor Press, New York, 1999; Zola, H., Monoclonal Antibodies: A Manual of Techniques, CRC Press, Inc., Boca Raton, Florida, 1984; 및 Coligan , CURRENT PROTOCOLS IN IMMUNOLOGY, Wiley/Greene, NY, 1991에 상세하게 기재되어 있으며, 상기 문헌들은 본 명세서에 참조로서 삽입된다. 예를 들어, 단일클론 항체를 생산하는 하이브리도마 세포의 제조는 불사멸화 세포주를 항체-생산 림프구와 융합시켜 이루어지며, 이 과정에 필요한 기술은 당업자에게 잘 알려져 있으며 용이하게 실시할 수 있다. 폴리클로날 항체는 단백질 항원을 적합한 동물에게 주사하고, 이 동물로부터 항혈청을 수집한 다음, 공지의 친화성(affinity) 기술을 이용하여 항혈청으로부터 항체를 분리하여 얻을 수 있다.
본 발명의 다른 일 양태에 따르면, 본 발명은 상기 근위축성측삭경화증 진단용 조성물을 포함하는 근위축성측삭경화증 진단용 키트를 제공한다.
본 발명의 키트는 마이크로어레이, 유전자 증폭 키트 또는 면역분석(immunoassay)용 키트이다.
본 발명의 키트가 마이크로어레이인 경우에는 마이크로어레이의 고상표면에 프로브가 고정화 되어 있다.
본 발명의 마이크로어레이에 있어서, 상기한 프로브는 혼성화 어레이 요소(hybridizable array element)로서 이용되며, 기체(substrate) 상에 고정화된다. 바람직한 기체는 적합한 견고성 또는 반-견고성 지지체로서, 예컨대, 막, 필터, 칩, 슬라이드, 웨이퍼, 파이버, 자기성 비드 또는 비자기성 비드, 겔, 튜빙, 플레이트, 고분자, 미소입자 및 모세관을 포함한다. 상기한 혼성화 어레이 요소는 상기의 기체상에 배열되고 고정화 된다. 이와 같은 고정화는 화학적 결합 방법 또는 UV와 같은 공유 결합적 방법에 의해 실시된다. 예를 들어, 상기 혼성화 어레이 요소는 에폭시 화합물 또는 알데히드기를 포함하도록 변형된 글래스 표면에 결합될 수 있고, 또한 폴리라이신 코팅 표면에서 UV에 의해 결합될 수 있다. 또한, 상기 혼성화 어레이 요소는 링커(예: 에틸렌 글리콜 올리고머 및 디아민)를 통해 기체에 결합될 수 있다.
한편, 본 발명의 마이크로어레이에 적용되는 시료 DNA는 표지(labeling)될 수 있고, 마이크로어레이상의 어레이 요소와 혼성화된다. 혼성화 조건은 다양하게 할 수 있다. 혼성화 정도의 검출 및 분석은 표지 물질에 따라 다양하게 실시될 수 있다.
프로브의 표지는 혼성화 여부를 검출케 하는 시그널을 제공할 수 있으며, 이는 올리고뉴클레오타이드에 연결될 수 있다. 적합한 표지는 형광단(예컨대, 플루오리신 (fluorescein), 피코에리트린 (phycoerythrin), 로다민, 리사민 (lissamine), 그리고 Cy3와 Cy5 (Pharmacia), 발색단, 화학발광단, 자기입자, 방사능동위원소(P32 및 S35), 매스 표지, 전자밀집입자, 효소(알칼린 포스파타아제 또는 호스래디쉬 퍼옥시다아제), 조인자, 효소에 대한 기질, 중금속(예컨대, 금) 그리고 항체, 스트렙타비딘, 바이오틴, 디곡시게닌과 킬레이팅기와 같은 특정 결합 파트너를 갖는 햅텐을 포함하나, 이에 한정되는 것은 아니다. 표지는 당업계에서 통상적으로 실시되는 다양한 방법, 예컨대, 닉 트랜스레이션 (nick translation) 방법, 무작위 프라이밍 방법 (Multiprime DNA labelling systems booklet, "Amersham"(1989)) 및 카이네이션 방법 (Maxam & Gilbert, Methods in Enzymology, 65:499(1986))을 통해 실시될 수 있다. 표지는 형광, 방사능, 발색 측정, 중량 측정, X-선 회절 또는 흡수, 자기, 효소적 활성, 매스 분석, 결합 친화도, 혼성화 고주파, 나노크리스탈에 의하여 검출할 수 있는 시그널을 제공한다.
프로브를 이용하는 경우, 프로브를 cDNA 분자와 혼성화시킨다. 본 발명에서, 적합한 혼성화 조건은 최적화 절차에 의하여 일련의 과정으로 결정될 수 있다. 이런 절차는 연구실에서 사용을 위한 프로토콜을 수립하기 위하여 당업자에 의하여 일련의 과정으로 실시된다. 예를 들어, 온도, 성분의 농도, 혼성화 및 세척 시간, 완충액 성분 및 이들의 pH 및 이온세기 등의 조건은 프로브의 길이 및 구아닌과 시토신의 양 및 타깃 뉴클레오타이드 서열 등의 다양한 인자에 의존한다. 혼성화를 위한 상세한 조건은 Joseph Sambrook, et al., Molecular Cloning, A Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.(2001); 및 M.L.M. Anderson, Nucleic Acid Hybridization, Springer-Verlag New York Inc. N.Y.(1999)에서 확인할 수 있다. 예를 들어, 상기 엄격조건 중에서 고 엄격조건은 0.5 M NaHPO4, 7% SDS(sodium dodecyl sulfate), 1 mM EDTA에서 65℃ 조건으로 혼성화하고, 0.1 x SSC(standard saline citrate)/0.1% SDS에서 68℃ 조건으로 세척하는 것을 의미한다. 또는, 고 엄격조건은 6 x SSC/0.05% 소듐 파이로포스페이트에서 48℃ 조건으로 세척하는 것을 의미한다. 저 엄격조건은 예를 들어, 0.2 x SSC/0.1% SDS에서 42℃ 조건으로 세척하는 것을 의미한다.
혼성화 반응 이후에, 혼성화 반응을 통하여 나오는 혼성화 시그널을 검출한다. 혼성화 시그널은 예컨대, 프로브에 결합된 표지의 종류에 따라 다양한 방법으로 실시할 수 있다. 예를 들어, 프로브가 효소에 의해 표지된 경우, 이 효소의 기질을 혼성화 반응 결과물과 반응시켜 혼성화 여부를 확인할 수 있다. 이용될 수 있는 효소/기질의 조합은, 퍼옥시다아제(예컨대, 호스래디쉬 퍼옥시다아제)와 클로로나프톨, 아미노에틸카바졸, 디아미노벤지딘, D-루시페린, 루시게닌(비스-N-메틸아크리디늄 니트레이트), 레소루핀 벤질 에테르, 루미놀, 암플렉스 레드 시약(10-아세틸-3,7-디하이드록시페녹사진), HYR(p-phenylenediamine-HCl and pyrocatechol), TMB(tetramethylbenzidine), ABTS(2,2‘-Azine-di[3-ethylbenzthiazoline sulfonate]), o-페닐렌디아민(OPD) 및 나프톨/파이로닌; 알칼린 포스파타아제와 브로모클로로인돌일 포스페이트(BCIP), 니트로 블루 테트라졸리움(NBT), 나프톨-AS-B1-포스페이트(naphthol-AS-B1-phosphate) 및 ECF 기질; 글루코스 옥시다아제와 t-NBT(nitroblue tetrazolium) 및 m-PMS(phenzaine methosulfate) 등이다. 프로브가 금 입자로 표지된 경우에는 실버 나이트레이트를 이용하여 실버 염색 방법으로 검출할 수 있다. 따라서 본 발명의 마커를 검출하는 방법을 혼성화에 기초하여 실시하는 경우에는, 구체적으로 (i) 본 발명의 마커의 뉴클레오티드 서열에 대하여 상보적인 서열을 가지는 프로브를 핵산 시료에 혼성화시키는 단계; (ii) 상기 혼성화 반응 발생 여부를 검출하는 단계를 포함한다.
본 발명의 일 구현예에 따르면, 본 발명의 진단용 키트는 유전자 증폭 키트일 수 있다.
본 명세서에 기재된 용어“증폭”은 핵산 분자를 증폭하는 반응을 의미한다. 다양한 증폭 반응들이 당업계에 보고되어 있으며, 이는 중합효소 연쇄반응(PCR)(미국 특허 제4,683,195, 4,683,202, 및 4,800,159호), 역전사-중합효소 연쇄반응(RT-PCR)(Sambrook 등, Molecular Cloning. A Laboratory Manual, 3rd ed. Cold Spring Harbor Press(2001)), Miller, H. I.(WO 89/06700) 및 Davey, C. 등(EP 329,822)의 방법, 리가아제 연쇄 반응(ligase chain reaction; LCR)(17, 18), Gap-LCR(WO 90/01069), 복구 연쇄 반응(repair chain reaction; EP 439,182), 전사-매개 증폭(transcription-mediated amplification; TMA, WO 88/10315), 자가 유지 염기서열 복제(self sustained sequence replication, WO 90/06995), 타깃 폴리뉴클레오티드 염기서열의 선택적 증폭(selective amplification of target polynucleotide sequences, 미국 특허 제6,410,276호), 컨센서스 서열 프라이밍 중합효소 연쇄 반응(consensus sequence primed polymerase chain reaction(CP-PCR), 미국 특허 제4,437,975호), 임의적 프라이밍 중합효소 연쇄 반응(arbitrarily primed polymerase chain reaction(AP-PCR), 미국 특허 제5,413,909호 및 제5,861,245호), 핵산 염기서열 기반 증폭(nucleic acid sequence based amplification(NASBA), 미국 특허 제5,130,238호, 제5,409,818호, 제5,554,517호, 및 제6,063,603호), 가닥 치환 증폭(strand displacement amplification)(21, 22) 및 고리-중재 항온성 증폭(loop-mediated isothermal amplification; LAMP)(23)를 포함하나, 이에 한정되지는 않는다. 사용 가능한 다른 증폭 방법들은 미국특허 제5,242,794, 5,494,810, 4,988,617호 및 미국 특허 제09/854,317호에 기술되어 있다.
PCR은 가장 잘 알려진 핵산 증폭 방법으로, 그의 많은 변형과 응용들이 개발되어 있다. 예를 들어, PCR의 특이성 또는 민감성을 증진시키기 위해 전통적인 PCR 절차를 변형시켜 터치다운(touchdown) PCR, 핫 스타트(hot start) PCR, 네스티드(nested) PCR 및 부스터(booster) PCR이 개발되었다. 또한, 실시간(real-time) PCR, 분별 디스플레이 PCR(differential display PCR: DD-PCR), cDNA 말단의 신속 증폭(rapid amplification of cDNA ends: RACE), 멀티플렉스 PCR, 인버스 중합효소 연쇄반응(inverse polymerase chain reaction: IPCR), 벡토레트(vectorette) PCR 및 TAIL-PCR(thermal asymmetric interlaced PCR)이 특정한 응용을 위해 개발되었다. PCR에 대한 자세한 내용은 McPherson, M.J., 및 Moller, S.G. PCR. BIOS Scientific Publishers, Springer-Verlag New York Berlin Heidelberg, N.Y. (2000)에 기재되어 있으며, 그의 교시사항은 본 명세서에 참조로 삽입된다.
본 발명의 진단용 키트를 프라이머를 이용하여 실시하는 경우에는 유전자 증폭 반응을 실시하여 본 발명의 마커의 뉴클레오티드 서열의 존재 여부를 조사한다. 따라서 본 발명은 원칙적으로 시료 내의 mRNA를 주형으로 하고 mRNA 또는 cDNA에 결합하는 프라이머를 이용하여 유전자 증폭 반응을 실시한다.
mRNA를 얻기 위하여, 시료에서 총 RNA를 분리한다. 총 RNA를 분리하는 것은 당업계에 공지된 통상의 방법에 따라 실시될 수 있다(참조: Sambrook, J. et al., Molecular Cloning. A Laboratory Manual, 3rd ed. Cold Spring Harbor Press(2001); Tesniere, C. et al., Plant Mol . Biol . Rep., 9:242(1991); Ausubel, F.M. et al., Current Protocols in Molecular Biology, John Willey & Sons(1987); 및 Chomczynski, P. et al., Anal. Biochem. 162:156(1987)). 예컨대, TRIzol을 이용하여 용이하게 세포내의 총 RNA를 분리할 수 있다. 이어, 분리된 mRNA로부터 cDNA를 합성하고, 이 cDNA를 증폭한다. 본 발명의 총 RNA는 인간의 시료로부터 분리되는 것이기 때문에, mRNA의 말단에는 폴리-A 테일을 갖고 있으며, 이러한 서열 특성을 이용한 올리고 dT 프라이머 및 역전사 효소를 이용하여 cDNA을 용이하게 합성할 수 있다(참조: PNAS USA, 85:8998(1988); Libert F, et al., Science, 244:569(1989); 및 Sambrook, J. et al., Molecular Cloning. A Laboratory Manual, 3rd ed. Cold Spring Harbor Press(2001)). 이어, 유전자 증폭 반응을 통하여 합성된 cDNA를 증폭한다.
본 발명에 이용되는 프라이머는 주형의 한 부위에 혼성화 또는 어닐링되어, 이중쇄 구조를 형성한다. 이러한 이중쇄 구조를 형성하는 데 적합한 핵산 혼성화의 조건은 Joseph Sambrook, 등, Molecular Cloning, A Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.(2001) 및 Haymes, B. D., 등, Nucleic Acid Hybridization, A Practical Approach, IRL Press, Washington, D.C. (1985)에 개시되어 있다.
다양한 DNA 중합효소가 본 발명의 증폭에 이용될 수 있으며, E. coli DNA 중합효소 I의 “클레나우” 단편, 열안정성 DNA 중합효소 및 박테리오파아지 T7 DNA 중합효소를 포함한다. 바람직하게는, 중합효소는 다양한 박테리아 종으로부터 얻을 수 있는 열안정성 DNA 중합효소이고, 이는 Thermus aquaticus(Taq), Thermus thermophilus(Tth), Thermus filiformis, Thermis flavus, Thermococcus literalis, 및 Pyrococcus furiosus(Pfu)를 포함한다.
중합 반응을 실시할 때, 반응 용기에 반응에 필요한 성분들을 과량으로 제공하는 것이 바람직하다. 증폭 반응에 필요한 성분들의 과량은, 증폭반응이 성분의 농도에 실질적으로 제한되지 않는 정도의 양을 의미한다. Mg2 +와 같은 조인자, dATP, dCTP, dGTP 및 dTTP를 원하는 증폭 정도가 달성될 수 있을 정도로 반응 혼합물에 제공하는 것이 요구된다. 증폭 반응에 이용되는 모든 효소들은 동일한 반응 조건에서 활성 상태일 수 있다. 사실, 완충액은 모든 효소들이 최적의 반응 조건에 근접하도록 한다. 따라서 본 발명의 증폭 과정은 반응물의 첨가와 같은 조건의 변화 없이 단일 반응물에서 실시될 수 있다.
본 발명에 있어서 어닐링은 타깃 뉴클레오타이드 서열과 프라이머 사이에 특이적 결합을 가능하게 하는 엄격조건 하에서 실시된다. 어닐링을 위한 엄격조건은 서열-의존적이며 주위 환경적 변수에 따라 다양하다.
이렇게 증폭된 본 발명의 마커의 뉴클레오티드 서열의 cDNA를 적합한 방법으로 분석하여 본 발명의 마커의 뉴클레오티드 서열의 존재 여부를 조사한다. 예를 들어, 상술한 증폭 반응 결과물을 젤 전기영동을 하고, 그 결과 형성되는 밴드를 관찰 및 분석함으로써 본 발명의 마커의 뉴클레오티드 서열의 존재 여부를 조사한다. 이러한 증폭 반응을 통하여, 생시료에서 본 발명의 마커의 뉴클레오티드 서열이 발견되는 경우, 근위축성측삭경화증의 가능성이 높은 것으로 판정한다.
본 발명의 일 구현예에 따르면, 본 발명의 키트는 면역분석(immunoassay) 방식, 즉 항원-항체 반응 방식으로 실시될 수 있다. 이 경우, 상술한 본 발명의 마커에 특이적으로 결합하는 항체 또는 앱타머를 이용하여 실시된다.
본 발명에서 이용되는 항체는 폴리클로날 또는 모노클로날 항체이며, 바람직하게는 모노클로날 항체이다.
이러한 면역분석은 종래에 개발된 다양한 정량적 또는 정성적 면역분석 프로토콜에 따라 실시될 수 있다. 상기 면역분석 포맷은 방사능면역분석, 방사능면역침전, 면역침전, 면역조직화학염색, ELISA(enzyme-linked immunosorbent assay), 캡처-ELISA, 억제 또는 경재 분석, 샌드위치 분석, 유세포 분석(flow cytometry), 면역형광염색 및 면역친화성 정제를 포함하지만, 이에 한정되는 것은 아니다. 상기 면역분석 또는 면역염색의 방법은 Enzyme Immunoassay, E. T. Maggio, ed., CRC Press, Boca Raton, Florida, 1980; Gaastra, W., Enzyme-linked immunosorbent assay(ELISA), in Methods in Molecular Biology, Vol. 1, Walker, J.M. ed., Humana Press, NJ, 1984; 및 Ed Harlow and David Lane, Using Antibodies:A Laboratory Manual, Cold Spring Harbor Laboratory Press, 1999에 기재되어 있으며, 상기 문헌은 본 명세서에 참조로서 삽입된다.
예를 들어, 본 발명의 방법이 방사능면역분석 방법에 따라 실시되는 경우, 방사능동위원소(예컨대, C14, I125, P32 및 S35)로 레이블링된 항체가 본 발명의 마커 분자를 검출하는 데 이용될 수 있다.
본 발명의 방법이 ELISA 방식으로 실시되는 경우, 본 발명의 특정 실시예는 (i) 분석하고자 하는 미지의 세포 시료 분해물을 고체 기질의 표면에 코팅하는 단계; (ⅱ) 일차항체로서의 마커에 대한 항체와 상기 세포 분해물을 반응시키는 단계; (ⅲ) 상기 단계 (ⅱ)의 결과물을 효소가 결합된 이차항체와 반응시키는 단계; 및 (ⅳ) 상기 효소의 활성을 측정하는 단계를 포함한다.
상기 고체 기질로 적합한 것은 탄화수소 폴리머(예컨대, 폴리스틸렌 및 폴리프로필렌), 유리, 금속 또는 젤이며, 가장 바람직하게는 마이크로타이터 플레이트이다.
상기 이차항체에 결합된 효소는 발색반응, 형광반응, 발광반응 또는 적외선 반응을 촉매하는 효소를 포함하나, 이에 한정되지 않으며, 예를 들어, 알칼린 포스파타아제, β-갈락토시다아제, 호스 래디쉬 퍼옥시다아제, 루시퍼라아제 및 사이토크롬 P450을 포함한다. 상기 이차항체에 결합하는 효소로서 알칼린 포스파타아제가 이용되는 경우에는, 기질로서 브로모클로로인돌일 포스페이트(BCIP), 니트로 블루 테트라졸리움(NBT), 나프톨-AS-B1-포스페이트(naphthol-AS-B1-phosphate) 및 ECF(enhanced chemifluorescence)와 같은 발색반응 기질이 이용되고, 호스 래디쉬 퍼옥시다아제가 이용되는 경우에는 클로로나프톨, 아미노에틸카바졸, 디아미노벤지딘, D-루시페린, 루시게닌(비스-N-메틸아크리디늄 니트레이트), 레소루핀 벤질 에테르, 루미놀, 암플렉스 레드 시약(10-아세틸-3,7-디하이드록시페녹사진), HYR(p-phenylenediamine-HCl and pyrocatechol), TMB(tetramethylbenzidine), ABTS(2,2‘-Azine-di[3-ethylbenzthiazoline sulfonate]), o-페닐렌디아민(OPD) 및 나프톨/파이로닌, 글루코스 옥시다아제와 t-NBT(nitroblue tetrazolium) 및 m-PMS(phenzaine methosulfate)과 같은 기질이 이용될 수 있다.
본 발명의 방법이 캡처-ELISA 방식으로 실시되는 경우, 본 발명의 특정 실시예는 (i) 포획항체(capturing antibody)로서 본 발명의 마커에 대한 항체를 고체 기질의 표면에 코팅하는 단계; (ⅱ) 포획항체와 시료를 반응시키는 단계; (ⅲ) 상기 단계 (ⅱ)의 결과물을 시그널을 발생시키는 레이블이 결합되어 있고, 본 발명의 돌연변이 단백질에 특이적으로 반응하는 검출항체(detecting antibody)와 반응시키는 단계; 및 (ⅳ) 상기 레이블로부터 발생하는 시그널을 측정하는 단계를 포함한다.
상기 검출 항체는 검출 가능한 시그널을 발생시키는 레이블을 가지고 있다. 상기 레이블은 화학물질(예컨대, 바이오틴), 효소(알칼린 포스파타아제, β-갈락토시다아제, 호스 래디쉬 퍼옥시다아제 및 사이토크롬 P450), 방사능물질((예컨대, C14, I125, P32 및 S35), 형광물질(예컨대, 플루오레신), 발광물질, 화학발광물질( chemiluminescent) 및 FRET(fluorescence resonance energy transfer)을 포함하나, 이에 한정되는 것은 아니다. 다양한 레이블 및 레이블링 방법은 Ed Harlow and David Lane, Using Antibodies:A Laboratory Manual, Cold Spring Harbor Laboratory Press, 1999에 기재되어 있다.
상기 ELISA 방법 및 캡처-ELISA 방법에서 최종적인 효소의 활성 측정 또는 시그널의 측정은 당업계에 공지된 다양한 방법에 따라 실시될 수 있다. 이러한 시그널이 검출은 본 발명의 마커의 정성적 또는 정량적 분석을 가능하게 한다. 만일, 레이블로서 바이오틴이 이용된 경우에는 스트렙타비딘으로, 루시퍼라아제가 이용된 경우에는 루시페린으로 시그널을 용이하게 검출할 수 있다.
본 발명의 다른 구현 예에 따르면, 항체 대신에 본 발명의 마커에 특이적으로 결합하는 앱타머를 이용할 수 있다. 앱타머는 올리고핵산 또는 펩타이드 분자이며, 앱타머의 일반적인 내용은 Bock LC et al., Nature 355(6360):5646(1992); Hoppe-Seyler F, Butz K "Peptide aptamers: powerful new tools for molecular medicine". J Mol Med . 78(8):42630(2000); Cohen BA, Colas P, Brent R . "An artificial cell-cycle inhibitor isolated from a combinatorial library". Proc Natl Acad Sci USA. 95(24):142727(1998)에 상세하게 개시되어 있다.
상술한 면역분석 과정에 의한 최종적인 시그널의 세기를 분석함으로써, 근위축성측삭경화증을 진단할 수 있다.
본 발명의 특징 및 이점을 요약하면 다음과 같다:
(a) 본 발명은 근위축성측삭경화증에 대한 마커로서 RAPGEF2, IFT80, SSH2, XRCC3, SPAG17, PLEKHM2, CLEC4C, FRAS1, ADGRL3, PSEN1 돌연변이 유전자 및 상기 유전자에 의해 코딩되는 돌연변이 단백질과 이를 이용한 근위축성측삭경화증의 진단 방법을 제공한다.
(b) 본 발명의 근위축성측삭경화증 마커는 한국인 ALS 환자로부터 발견한 새로운 변이로서 종전에 보고된 데이터베이스에서 0.1 % 미만의 빈도로 나타난 매우 드문 변이이거나 보고된 바 없는 변이이며, 정상 대조군에서는 발견되지 않는 변이이다.
(c) 본 발명에서 발견한 돌연변이 유전자 및/또는 이로부터 코딩되는 돌연변이 단백질은 ALS의 유전학적 원인을 밝히고 ALS를 진단하는데 매우 유용하게 사용될 수 있다.
(d) 본 발명에서 발견한 돌연변이 유전자 및/또는 이로부터 코딩되는 돌연변이 단백질에 대하여 유전자 또는 단백질 검사를 실시함으로써 근위축성측삭경화증을 조기 진단할 수 있으며, 그에 따라 최근 개발되고 있는 치료방법을 조기에 적용하여 치료효과를 극대화할 수 있고, 나아가 정확한 병인에 따른 맞춤치료를 가능하게 할 수 있다.
도 1은 sALS 트리오-7에서 PSEN1 유전자의 신규 변이(de novo variant)(c.497T>C; p.Leu166Pro)를 분석한 결과이다.
a. c.497T>C (p.Leu166Pro)를 나타내는 발단자(proband) 및 부모의 엑솜 시퀀싱 결과. PSEN1 c.497T>C 변이는 발단자의 전체 판독 결과 중 46%(37/81)였으며, 이는 대립형질의 이형접합을 의미함. b. 발단자에서 PSEN1 유전자 시퀀싱 결과, 뉴클레오타이드 위치 497에서 T-에서-C로 이형접합 치환이 나타남.
도 2는 sALS 트리오-2에서 FRAS1 유전자의 신규 변이(c.8393C>T; p.Ala2798Val)를 분석한 결과이다.
a. c.8393C<T (p.Ala2798Val)를 나타내는 발단자 및 부모의 엑솜 시퀀싱 결과. FRAS1 c.8393C>T 변이는 발단자의 전체 판독 결과 중 49%(26/53)였으며, 이는 대립형질의 이형접합을 의미함. b. 발단자에서 FRAS1 유전자 시퀀싱 결과, 뉴클레오타이드 위치 8393에서 C-에서-T로 이형접합 치환이 나타남.
도 3은 sALS 트리오-3에서 RAPGEF2 유전자의 신규 변이(c.4069G>A; p.Glu1357Lys)를 분석한 결과이다.
a. c.4069G>A (p.Glu1357Lys)를 나타내는 발단자 및 부모의 엑솜 시퀀싱 결과. RAPGEF2 c.4069G>A 변이는 발단자의 전체 판독 결과 중 52%(25/48)였으며, 이는 대립형질의 이형접합을 의미함. b. 발단자에서 RAPGEF2 유전자 시퀀싱 결과, 뉴클레오타이드 위치 4069에서 G-에서-A로 이형접합 치환이 나타남.
도 4는 sALS 트리오-4에서 CLEC4C 유전자의 신규 변이(c.629_631delAGA; p.Lys210del)를 분석한 결과이다.
a. c.629_631delAGA (p.Lys210del)를 나타내는 발단자 및 부모의 엑솜 시퀀싱 결과. CLEC4C c.629_631delAGA 변이는 발단자의 전체 판독 결과 중 53%(64/122)였으며, 이는 대립형질의 이형접합을 의미함. b. 발단자에서 CLEC4C 유전자 시퀀싱 결과, 뉴클레오타이드 위치 629-631에서 이형접합 AGA 결손이 나타남.
도 5는 sALS 트리오-8에서 PLEKHM2 유전자의 신규 변이(c.1921+6C>T)를 분석한 결과이다.
a. c.1921+6C>T를 나타내는 발단자 및 부모의 엑솜 시퀀싱 결과. PLEKHM2 c.1921+6C>T 변이는 발단자의 전체 판독 결과 중 54%(13/24)였으며, 이는 대립형질의 이형접합을 의미함. b. 발단자에서 PLEKHM2 유전자 시퀀싱 결과, 뉴클레오타이드 위치 1921+6에서 C-에서-T로 이형접합 치환이 나타남.
도 6은 sALS 트리오-11에서 SSH2 유전자의 신규 변이(c.1408G>T; p.Glu470*)를 분석한 결과이다.
a. c.1408G>T (p.Glu470*)를 나타내는 발단자 및 부모의 엑솜 시퀀싱 결과. SSH2 c.1408G>T 변이는 발단자의 전체 판독 결과 중 35%(42/120)였으며, 이는 대립형질의 이형접합을 의미함. b. 발단자에서 SSH2 유전자 시퀀싱 결과, 뉴클레오타이드 위치 1408에서 G-에서-T로 이형접합 치환이 나타남.
도 7은 sALS 트리오-12에서 SPAG17 유전자의 신규변이(c.2815G>T; p.Ala939Ser) 및 XRCC3 유전자의 신규변이(c.598G>A; p.Val200Ile)를 분석한 결과이다.
a. SPAG17 유전자에서 c.2815G>T (p.Ala939Ser)를 나타내는 발단자 및 부모의 엑솜 시퀀싱 결과. SPAG17 c.2815G>T 변이는 발단자의 전체 판독 결과 중 49%(60/122)였으며, 이는 대립형질의 이형접합을 의미함. b. 발단자에서 SPAG17 유전자 시퀀싱 결과, 뉴클레오타이드 위치 2815에서 G-에서-T로 이형접합 치환이 나타남. c. XRCC3 유전자에서 c.598G>A (p.Val200Ile)를 나타내는 발단자 및 부모의 엑솜 시퀀싱 결과. XRCC3 c.598G>A 변이는 발단자의 전체 판독 결과 중 50%(17/34)였으며, 이는 대립형질의 이형접합을 의미함. d. 발단자에서 XRCC3 유전자 시퀀싱 결과, 뉴클레오타이드 위치 598에서 G-에서-A로 이형접합 치환이 나타남.
도 8은 sALS 트리오-13에서 IFT80 유전자의 신규 변이(c.595G>A; p.Val199Ile)를 분석한 결과이다.
a. c.595G>A (p.Val199Ile)를 나타내는 발단자 및 부모의 엑솜 시퀀싱 결과. IFT80 c.595G>A 변이는 발단자의 전체 판독 결과 중 48%(62/130)였으며, 이는 대립형질의 이형접합을 의미함. b. 발단자에서 IFT80 유전자 시퀀싱 결과, 뉴클레오타이드 위치 595에서 G-에서-A로 이형접합 치환이 나타남.
도 9는 sALS 트리오-15에서 ADGRL3 유전자의 신규 변이(c.715A>G; p.Ser239Gly)를 분석한 결과이다.
a. c.715A>G (p.Ser239Gly)를 나타내는 발단자 및 부모의 엑솜 시퀀싱 결과. ADGRL3 c.715A>G 변이는 발단자의 전체 판독 결과 중 48%(69/145)였으며, 이는 대립형질의 이형접합을 의미함. b. 발단자에서 ADGRL3 유전자 시퀀싱 결과, 뉴클레오타이드 위치 715에서 A-에서-G로 이형접합 치환이 나타남.
도 10은 184명의 sALS 환자에서 RAPGEF2 유전자의 두 개 변이를 나타낸 결과이다.
a. 코돈 628(c.1883C>T, p.Thr628Ile)에서 C에서 T로의 치환을 나타내는 변이 부위에 대한 엑솜 시퀀싱 결과. 변이는 발단자 HS-374의 전체 판독 결과 중 49%(5919/12010)였으며, 이는 대립형질의 이형접합을 의미함. b. RAPGEF2 유전자에서 c.1883C>T의 시퀀싱 크로마토그램. c. 코돈 1098(c.3293G>A, p.Arg1098His)에서 G에서 A로의 치환을 나타내는 변이 부위에 대한 엑솜 시퀀싱 결과. 변이는 발단자 HS-477의 전체 판독 결과 중 48%(1379/2855)였으며, 이는 대립형질의 이형접합을 의미함. d. RAPGEF2 유전자에서 c.3293G>A의 시퀀싱 크로마토그램.
도 11은 RAPGEF2 유전자에서 분석된 변이에 대한 모식도이다.
CAP_ED, 전사인자 CAP 패밀리의 이펙터 도메인; REM, Ras 익스체인저 모티프; PDZ_시그널링, PDZ 도메인; RasGEF, Ras-유사 스몰 GTPase에 대한 구아닌 뉴클레오타이드 교환 인자.
도 12는 TiGER(Tissue-specific Gene Expression and Regulation, http://bioinfo.wilmer.jhu.edu/tiger/)로부터 채택된 RAPGEF2 유전자의 조직 발현 레벨을 측정한 결과이다.
도 13은 TiGER(Tissue-specific Gene Expression and Regulation, http://bioinfo.wilmer.jhu.edu/tiger/)로부터 채택된 IFT80 유전자의 조직 발현 레벨을 측정한 결과이다.
도 14는 TiGER(Tissue-specific Gene Expression and Regulation, http://bioinfo.wilmer.jhu.edu/tiger/)로부터 채택된 SSH2 유전자의 조직 발현 레벨을 측정한 결과이다.
도 15는 TiGER(Tissue-specific Gene Expression and Regulation, http://bioinfo.wilmer.jhu.edu/tiger/)로부터 채택된 SPAG17 유전자의 조직 발현 레벨을 측정한 결과이다.
도 16은 TiGER(Tissue-specific Gene Expression and Regulation, http://bioinfo.wilmer.jhu.edu/tiger/)로부터 채택된 XRCC3 유전자의 조직 발현 레벨을 측정한 결과이다.
도 17은 TiGER(Tissue-specific Gene Expression and Regulation, http://bioinfo.wilmer.jhu.edu/tiger/)로부터 채택된 PLEKHM2 유전자의 조직 발현 레벨을 측정한 결과이다.
도 18은 TiGER(Tissue-specific Gene Expression and Regulation, http://bioinfo.wilmer.jhu.edu/tiger/)로부터 채택된 FRAS1 유전자의 조직 발현 레벨을 측정한 결과이다.
도 19는 TiGER(Tissue-specific Gene Expression and Regulation, http://bioinfo.wilmer.jhu.edu/tiger/)로부터 채택된 ADGRL3 유전자의 조직 발현 레벨을 측정한 결과이다.
a. c.497T>C (p.Leu166Pro)를 나타내는 발단자(proband) 및 부모의 엑솜 시퀀싱 결과. PSEN1 c.497T>C 변이는 발단자의 전체 판독 결과 중 46%(37/81)였으며, 이는 대립형질의 이형접합을 의미함. b. 발단자에서 PSEN1 유전자 시퀀싱 결과, 뉴클레오타이드 위치 497에서 T-에서-C로 이형접합 치환이 나타남.
도 2는 sALS 트리오-2에서 FRAS1 유전자의 신규 변이(c.8393C>T; p.Ala2798Val)를 분석한 결과이다.
a. c.8393C<T (p.Ala2798Val)를 나타내는 발단자 및 부모의 엑솜 시퀀싱 결과. FRAS1 c.8393C>T 변이는 발단자의 전체 판독 결과 중 49%(26/53)였으며, 이는 대립형질의 이형접합을 의미함. b. 발단자에서 FRAS1 유전자 시퀀싱 결과, 뉴클레오타이드 위치 8393에서 C-에서-T로 이형접합 치환이 나타남.
도 3은 sALS 트리오-3에서 RAPGEF2 유전자의 신규 변이(c.4069G>A; p.Glu1357Lys)를 분석한 결과이다.
a. c.4069G>A (p.Glu1357Lys)를 나타내는 발단자 및 부모의 엑솜 시퀀싱 결과. RAPGEF2 c.4069G>A 변이는 발단자의 전체 판독 결과 중 52%(25/48)였으며, 이는 대립형질의 이형접합을 의미함. b. 발단자에서 RAPGEF2 유전자 시퀀싱 결과, 뉴클레오타이드 위치 4069에서 G-에서-A로 이형접합 치환이 나타남.
도 4는 sALS 트리오-4에서 CLEC4C 유전자의 신규 변이(c.629_631delAGA; p.Lys210del)를 분석한 결과이다.
a. c.629_631delAGA (p.Lys210del)를 나타내는 발단자 및 부모의 엑솜 시퀀싱 결과. CLEC4C c.629_631delAGA 변이는 발단자의 전체 판독 결과 중 53%(64/122)였으며, 이는 대립형질의 이형접합을 의미함. b. 발단자에서 CLEC4C 유전자 시퀀싱 결과, 뉴클레오타이드 위치 629-631에서 이형접합 AGA 결손이 나타남.
도 5는 sALS 트리오-8에서 PLEKHM2 유전자의 신규 변이(c.1921+6C>T)를 분석한 결과이다.
a. c.1921+6C>T를 나타내는 발단자 및 부모의 엑솜 시퀀싱 결과. PLEKHM2 c.1921+6C>T 변이는 발단자의 전체 판독 결과 중 54%(13/24)였으며, 이는 대립형질의 이형접합을 의미함. b. 발단자에서 PLEKHM2 유전자 시퀀싱 결과, 뉴클레오타이드 위치 1921+6에서 C-에서-T로 이형접합 치환이 나타남.
도 6은 sALS 트리오-11에서 SSH2 유전자의 신규 변이(c.1408G>T; p.Glu470*)를 분석한 결과이다.
a. c.1408G>T (p.Glu470*)를 나타내는 발단자 및 부모의 엑솜 시퀀싱 결과. SSH2 c.1408G>T 변이는 발단자의 전체 판독 결과 중 35%(42/120)였으며, 이는 대립형질의 이형접합을 의미함. b. 발단자에서 SSH2 유전자 시퀀싱 결과, 뉴클레오타이드 위치 1408에서 G-에서-T로 이형접합 치환이 나타남.
도 7은 sALS 트리오-12에서 SPAG17 유전자의 신규변이(c.2815G>T; p.Ala939Ser) 및 XRCC3 유전자의 신규변이(c.598G>A; p.Val200Ile)를 분석한 결과이다.
a. SPAG17 유전자에서 c.2815G>T (p.Ala939Ser)를 나타내는 발단자 및 부모의 엑솜 시퀀싱 결과. SPAG17 c.2815G>T 변이는 발단자의 전체 판독 결과 중 49%(60/122)였으며, 이는 대립형질의 이형접합을 의미함. b. 발단자에서 SPAG17 유전자 시퀀싱 결과, 뉴클레오타이드 위치 2815에서 G-에서-T로 이형접합 치환이 나타남. c. XRCC3 유전자에서 c.598G>A (p.Val200Ile)를 나타내는 발단자 및 부모의 엑솜 시퀀싱 결과. XRCC3 c.598G>A 변이는 발단자의 전체 판독 결과 중 50%(17/34)였으며, 이는 대립형질의 이형접합을 의미함. d. 발단자에서 XRCC3 유전자 시퀀싱 결과, 뉴클레오타이드 위치 598에서 G-에서-A로 이형접합 치환이 나타남.
도 8은 sALS 트리오-13에서 IFT80 유전자의 신규 변이(c.595G>A; p.Val199Ile)를 분석한 결과이다.
a. c.595G>A (p.Val199Ile)를 나타내는 발단자 및 부모의 엑솜 시퀀싱 결과. IFT80 c.595G>A 변이는 발단자의 전체 판독 결과 중 48%(62/130)였으며, 이는 대립형질의 이형접합을 의미함. b. 발단자에서 IFT80 유전자 시퀀싱 결과, 뉴클레오타이드 위치 595에서 G-에서-A로 이형접합 치환이 나타남.
도 9는 sALS 트리오-15에서 ADGRL3 유전자의 신규 변이(c.715A>G; p.Ser239Gly)를 분석한 결과이다.
a. c.715A>G (p.Ser239Gly)를 나타내는 발단자 및 부모의 엑솜 시퀀싱 결과. ADGRL3 c.715A>G 변이는 발단자의 전체 판독 결과 중 48%(69/145)였으며, 이는 대립형질의 이형접합을 의미함. b. 발단자에서 ADGRL3 유전자 시퀀싱 결과, 뉴클레오타이드 위치 715에서 A-에서-G로 이형접합 치환이 나타남.
도 10은 184명의 sALS 환자에서 RAPGEF2 유전자의 두 개 변이를 나타낸 결과이다.
a. 코돈 628(c.1883C>T, p.Thr628Ile)에서 C에서 T로의 치환을 나타내는 변이 부위에 대한 엑솜 시퀀싱 결과. 변이는 발단자 HS-374의 전체 판독 결과 중 49%(5919/12010)였으며, 이는 대립형질의 이형접합을 의미함. b. RAPGEF2 유전자에서 c.1883C>T의 시퀀싱 크로마토그램. c. 코돈 1098(c.3293G>A, p.Arg1098His)에서 G에서 A로의 치환을 나타내는 변이 부위에 대한 엑솜 시퀀싱 결과. 변이는 발단자 HS-477의 전체 판독 결과 중 48%(1379/2855)였으며, 이는 대립형질의 이형접합을 의미함. d. RAPGEF2 유전자에서 c.3293G>A의 시퀀싱 크로마토그램.
도 11은 RAPGEF2 유전자에서 분석된 변이에 대한 모식도이다.
CAP_ED, 전사인자 CAP 패밀리의 이펙터 도메인; REM, Ras 익스체인저 모티프; PDZ_시그널링, PDZ 도메인; RasGEF, Ras-유사 스몰 GTPase에 대한 구아닌 뉴클레오타이드 교환 인자.
도 12는 TiGER(Tissue-specific Gene Expression and Regulation, http://bioinfo.wilmer.jhu.edu/tiger/)로부터 채택된 RAPGEF2 유전자의 조직 발현 레벨을 측정한 결과이다.
도 13은 TiGER(Tissue-specific Gene Expression and Regulation, http://bioinfo.wilmer.jhu.edu/tiger/)로부터 채택된 IFT80 유전자의 조직 발현 레벨을 측정한 결과이다.
도 14는 TiGER(Tissue-specific Gene Expression and Regulation, http://bioinfo.wilmer.jhu.edu/tiger/)로부터 채택된 SSH2 유전자의 조직 발현 레벨을 측정한 결과이다.
도 15는 TiGER(Tissue-specific Gene Expression and Regulation, http://bioinfo.wilmer.jhu.edu/tiger/)로부터 채택된 SPAG17 유전자의 조직 발현 레벨을 측정한 결과이다.
도 16은 TiGER(Tissue-specific Gene Expression and Regulation, http://bioinfo.wilmer.jhu.edu/tiger/)로부터 채택된 XRCC3 유전자의 조직 발현 레벨을 측정한 결과이다.
도 17은 TiGER(Tissue-specific Gene Expression and Regulation, http://bioinfo.wilmer.jhu.edu/tiger/)로부터 채택된 PLEKHM2 유전자의 조직 발현 레벨을 측정한 결과이다.
도 18은 TiGER(Tissue-specific Gene Expression and Regulation, http://bioinfo.wilmer.jhu.edu/tiger/)로부터 채택된 FRAS1 유전자의 조직 발현 레벨을 측정한 결과이다.
도 19는 TiGER(Tissue-specific Gene Expression and Regulation, http://bioinfo.wilmer.jhu.edu/tiger/)로부터 채택된 ADGRL3 유전자의 조직 발현 레벨을 측정한 결과이다.
이하, 실시예를 통하여 본 발명을 더욱 상세히 설명하고자 한다. 이들 실시예는 오로지 본 발명을 보다 구체적으로 설명하기 위한 것으로, 본 발명의 요지에 따라 본 발명의 범위가 이들 실시예에 의해 제한되지 않는다는 것은 당업계에서 통상의 지식을 가진 자에 있어서 자명할 것이다.
실시예
재료 및 방법
1. 대상
1) sALS 트리오
한양대학교 신경과 ALS 클리닉을 방문한 15명의 ALS 환자 및 그들의 부모가 2013년 1월부터 ALS 트리오 연구에 포함되었다. 모든 환자는 한국 태생이었다. 임상 진단을 위해 각 환자에 대하여 근전도검사, 임상검사 및 적합한 이미징 방법을 포함하는 신경학적 평가를 실시하였다. 모든 ALS 환자는 신경근 질환을 전공한 신경과 전문의에 의해 진단되었으며, 개정된 El Escorial 진단기준에 부합하는 것을 확인하였다(32, 113). ALS 트리오 연구에는 ALS가 확실한 환자 5명, ALS 일 것으로 예측되는 환자 8명, PLS 플러스 1명 및 퓨어(pure) LMND(lower motor neuron disease) 1명이 포함되었다. ALS 스펙트럼으로 여겨지지 않는 척수성근위축(spinal muscular atrophy), 케네디 증후군(Kennedy syndrome), 일지성 근위축(monomelic atrophy), 히라야마 증후군(Hirayama syndrome) 및 다초점운동신경병증(multifocal motor neuropathy)과 같은 상태로 진단된 환자들은 본 연구에서 제외되었다. 후속조치(follow-up) 동안 치료 또는 질병 진행에 대한 반응을 객관적으로 평가하기 위해 ALSFRS-R을 이용하여 의사가 진단을 위한 기능손상 정도를 판단하였다. ALSFRS-R에는 언어능력, 타액분비, 삼킴, 필체, 음식 자르기 및 기구이용(위루형성술 시행 또는 미시행), 드레싱 및 위생, 침대에서 회전 및 이부자리 조정, 걷기, 계단 오르기, 호흡곤란, 좌위호흡(orthepnea) 및 호흡부전을 평가하는 12개 질문이 포함된다. 각 항목에 대한 점수는 0에서 48 사이의 점수를 내기 위해 총합을 구했다. 진행율은 ΔFS(진단시기에서의 48-ALSFRS-R/발병에서 진단까지의 시간)으로 계산하였으며, 환자를 세 그룹[느림(컷-오프 값 < 0.66), 중간(0.66-1.00), 및 빠름(>1.00)]으로 나누는데 사용하였다. 임상 보고서에는 척추 및 연수 수준에서 상위 및 하위운동뉴런 손상에 대한 징후가 포함되었다. 산발성 ALS는 발단자가 진행형 상위 또는 하위운동뉴런 손상과 같은 징후를 나타내는 경우 및 같은 혈통에서 임상적으로 영향을 받는 가족력을 갖지 않는 경우로 정의되었다. 본 연구는 한양대학교 병원(#HYI-10-01-3) 및 삼성서울병원(#2013-04-131-002)의 기관윤리심의위원회로부터 승인을 받아 진행하였으며, 참가자들은 승인된 연구 프로토콜에 대하여 동의서를 작성하였다. 본 발명자들은 SOD1 유전자에 대하여 사전 스크리닝을 실시하였으며, 모든 발단자에게서 병리학적 변이가 발견되지 않았다.
2) 유효성 확인 세트(validation set)
서울 한양대학교 병원의 신경과 ALS 클리닉을 방문한 184명의 ALS 환자는 유효성 확인 세트로 ALS 트리오 연구에 포함되었다. 모든 ALS 환자는 가능성 또는 명확한 ALS 기준을 충족하는 개정된 El Escorial 진단기준에 따라 신경근 질환을 전공한 신경과 전문의에 의해 진단되었다. 환자들에 대하여 SOD1 유전자에 대한 사전 스크리닝을 실시하였으며, 병리학적 변이는 발견되지 않았다. 부모에 대한 정보는 본 연구의 시작 전에 입수하였다.
2. 분자유전학 테스트
1) 전체 엑솜 시퀀싱
지노믹 DNA(gDNA)는 Wizard 지노믹 DNA 정제 키트(Promega, Madison, WI)를 이용하여 제조사의 지시에 따라 말초 혈액 백혈구로부터 분리하였다. 1% 아가로오스 젤 전기영동 및 PicoGreen®dsDNA Assay(Invitrogen, Life Technologies, Waltham, MA)를 통해 DNA를 확인하였다. 가능한 한 DNA는 OD 260/280 비율이 1.8-2.0으로 온전한 상태여야 한다. SureSelect 시퀀싱 라이브러리는 The Bravo automated liquid handler를 포함하는 Agilent SureSelect all Exon kit 50Mb (Agilent, Santa Clara, CA)를 이용하여 제조사 지시에 따라 준비하였다. 사용률 10%, 강도 5, 버스트 200 당 사이클, 및 4℃에서 360초 동안 모드 주파수 회전(mode frequency sweeping)으로 세팅된 Covaris-S2 instrument (Covaris, Woburn, MA)를 이용하여 120 ㎕ EB 버퍼에 녹인 3 ㎍의 지노믹 DNA를 150 bp의 사이즈로 절단하였다. 절단 효율은 DNA1000 칩(Bioanalyzer, Agilent)의 모세관 전기영동을 통해 평가하였다. 제조사의 프로토콜(Agilent)에 따라 시퀀싱 어댑터를 DNA 단편에 결합시켰다. DNA에 결합시킨 어댑터는 PCR을 이용하여 증폭하였다. PCR 산물의 질(quality)은 모세관 전기영동(Bioanalyzer, Agilent)을 통해 평가하였다. 혼성화 버퍼를 만들기 위해 SureSelect hyb #1, #2, #3, 및 #4 시약(Agilent)을 혼합하였다. 증폭된 DNA 단편은 3.4 ㎕에 750 ng가 되도록 농축하였다. SureSelect block #1, #2, 및 #3 시약(Agilent)을 750 ng의 DNA에 첨가하였다. 혼성화 버퍼 및 DNA 블로커 믹스는 유전자 증폭기를 이용하여 95℃에서 5분, 그 다음 65℃에서 10분간 배양하였다. RNase 블록(Agilent)을 SureSelect 올리고 캡처 라이브러리(Agilent)에 첨가하였다. 캡처 라이브러리는 65℃에서 2분간 배양하였다. 먼저 혼성화 버퍼, 그 다음 DNA 블로커 믹스를 캡처 라이브러리에 첨가하고, 유전자 증폭기를 이용하여 혼합물을 65℃에서 24시간 배양하였다. 50 ㎖ 스트렙타비딘이 코팅된 Dynal MyOne Streptavidin T1 (Invitrogen)을 200 ㎖ SureSelect 바인딩 버퍼(Agilent)로 3회 세척한 다음, 200 ㎕ 바인딩 버퍼에 재부유시켰다. 혼성화 혼합물을 비드 부유물에 첨가하고 상온에서 믹싱하면서 30분간 배양하였다. 상온에서 15분간 500 ㎕ SureSelect 세척 버퍼 #1 (Agilent)로 비드를 세척한 다음, 65℃에서 10분간 500 ㎕ SureSelect 세척 버퍼 #2 (Agilent)로 3회 세척하였다. 30 ㎕ 물로 상온에서 5분간 DNA를 용출하였다. 반응물은 AMPure XP 비드(Beckman Coulter, Brea, CA)로 정제하였다. Herculase II Fusion DNA Polymerase(Finnzymes, Life Technologies)를 이용하여 인덱스 태그를 첨가하기 위해 캡처한 라이브러리를 증폭하였다. 증폭한 라이브러리의 질(quality)는 모세관 전기영동(Bioanalyzer, Agilent)을 통해 평가하였다. SYBR Green PCR 마스터 믹스(Applied Biosystems, Life Technologies)를 이용하여 QPCR를 실시한 다음, 풀(pool)에서 등몰 농도(equimolar amounts)로 태깅된 6 라이브러리들을 결합하였다. 클러스터 형성은 cBot automated cluster generation system (illumine, San Diego, CA)을 이용하였으며 HiSeq 2500 시퀀싱 시스템(illumina)을 이용하여 단위 길이 2x100 bp로 시퀀싱을 실시하였다.
2) 생물정보학 분석
판독 결과는 Burrows-Wheeler Aligner(BWA) 0.7.10을 이용하여 GRCh37/hg19 빌드에 맵핑하였다(114). Picard-tools 1.114는 중복 판독(duplicate reads)을 표시하기 위해 사용하였다(http://picard.sourceforge.net/). GATK(v3.2-2) IndelRealigner는 삽입/결실(indel) 위치 주변의 판독 결과를 조정하기 위해 사용하였다. 판독 결과의 질은 GATK BaseRecalibrator를 이용하여 측정하였다. 유전자형은 GATK HaplotypeCaller에 의해 모든 샘플에 대하여 동시에 생성되었다. 변이 퀄리티 스코어 조정은 GATK VariantRecalibrator를 이용하여 실시하였으며, 99.7 truth sensitivity level로 필터링하였다. 희귀 변이를 확인하기 위해 dbSNP141트, NHLBI 엑솜 시퀀싱 프로젝트(http://evs.gs.washington.edu/EVS/) 및 1000 지놈 프로젝트(http://www.1000genomes.org/)를 확인하였다. 변이의 명명(annotation)은 인-하우스 커스텀-메이드 스크립트를 이용하여 실시하였다(표 1).
분석 | 툴 |
Fastq quality control | NGSQCToolkit_v2.3.3 |
Alignment | BWA-0.7.10 mem, Picard-tools-1.114/AddOrReplaceReadGroups.jar |
Remove duplicate | Picard-tools-1.114/MarkDuplicates.jar Picard-tools-1.114/FixMateInformation.jar |
Realignment | GenomeAnalysisTK-3.2-2/GenomeAnalysisTK.jar -T RealignerTargetCreator GenomeAnalysisTK-3.2-2/GenomeAnalysisTK.jar -T IndelRealigner |
Recalibration | GenomeAnalysisTK-3.2-2/GenomeAnalysisTK.jar -T BaseRecalibrator GenomeAnalysisTK-3.2-2/GenomeAnalysisTK.jar -T PrintReads |
Variant/Genotype calling (gVCF method) |
GenomeAnalysisTK-3.2-2/GenomeAnalysisTK.jar -T HaplotypeCaller |
Filtering | GenomeAnalysisTK-3.2-2/GenomeAnalysisTK.jar -T VariantRecalibrator GenomeAnalysisTK-3.2-2/GenomeAnalysisTK.jar -T ApplyRecalibration sensitivity 99.7 cutoff |
Annotation | In-house perl script annotation |
3) 필터링 기준
모든 발단자에 대하여 ALS 감별진단을 위해 기존에 알려진 ALS 및 FTD 원인 유전자 또는 관련 유전자, HSP 및 감별을 요하는 다른 질병 유전자의 돌연변이를 먼저 스크리닝하였다(표 2-5). 기존에 알려진 병원성 변이를 확인하기 위해 인간 유전자 돌연변이 데이터베이스(HGMD®2014.1Proversion)에 대한 변이 리스트를 비교하였다.
신규 변이는 부모가 참조서열(reference sequence)에 대하여 동형접합(homozygous)이고, 발단자는 이형접합(heterozygous)인 것으로 확인하였다. 본 발명자들은 dbSNP141 데이터베이스, 1000 지놈 프로젝트 및 엑솜 변이 서버에서 확인된 0.01 미만의 대립 유전자 빈도를 갖는 변이들을 희귀 변이로 선택하였다.
또한, 본 연구에서 발견된 변이들을 인종이 일치하는 100명의 정상 대조군과 비교하였다. 정상 대조군 데이터는 한국 질병관리본부로부터 지원받은 한국인 지놈 분석 프로젝트(4845-301), 한국인 지놈 및 역학 연구(4851-302) 및 한국인 바이오뱅크 프로젝트(4851-307, KBP-2014-031)에서 제공받았다. 이에 더해 본 연구에서 발견된 변이를 자체 질병 대조군인 75명의 ALS가 아닌 환자의 엑솜 데이터와 비교하였다.
표현형 | 유전자 | RefSeq | 유전자 설명 | 염색체 위치 | 유전형식 |
ALS | SPG11 | NM_025137.3 | Spastic paraplegia 11 | 15q14 | AR |
ALS | VAPB | NM_004738.4 | VAMP (vesicle-associated membrane protein)-associated protein B and C | 20q13.3 | AD |
ALS | ALS2 | NM_020919.3 | Amyotrophic lateral sclerosis 2 | 2q33.1 | AD |
ALS | ANG | NM_001145.4 | Angiogenin, ribonuclease, RNase A family, 5 | 14q11.1 | AD |
ALS | DAO | NM_001917.4 | D-amino-acid oxidase | 12q24 | AD |
ALS | FIG4 | NM_014845.5 | FIG4 phosphoinositide 5-phosphatase | 6q21 | AD |
ALS | OPTN | NM_021980.4 | Optineurin | 10p13 | AD |
ALS | SETX | NM_015046.5 | Senataxin | 9q34.13 | AD |
FTD | MAPT | NM_005910.5 | Microtubule-associated protein tau | 17q21.1 | AD |
FTD | PSEN1 | NM_000021.3 | Presenilin-1 | 14q24.3 | AD |
FTD | PSEN2 | NM_000447.2 | Presenilin-2 | 1q42.13 | AD |
FTD | TARDBP | NM_007375.3 | TAR DNA binding protein | 1p36.22 | AD |
FTD | TREM2 | NM_018965.2 | Triggering receptor expressed on myeloid cells 2 | 6p21.1 | AR |
ALS/FTD | FUS | NM_004960.3 | FUS RNA binding protein | 16p11.2 | AD |
ALS/FTD | GRN | NM_002087.2 | Granulin | 17q21.32 | AD |
ALS/FTD | SIGMAR1 | NM_005866.2 | Sigma non-opioid intracellular receptor 1 | 9p13.3 | AD/AR |
ALS/FTD | SOD1 | NM_000454.4 | Superoxide dismutase 1 | 21q22.11 | AD |
ALS/FTD | SQSTM1 | NM_003900.4 | Sequestosome 1 | 5q35 | AD |
ALS/FTD | TAF15 | NM_139215.2 | TAF15 RNA polymerase II, TATA box binding protein (TBP)-associated factor | 17q11.1-q11.2 | AD |
ALS/FTD | TARDBP | NM_007375.3 | TAR DNA binding protein | 1p36.22 | AD |
ALS/FTD | UBQLN2 | NM_013444.3 | Ubiquilin 2 | Xp11.21 | X-linked |
ALS/FTD | VCP | NM_007126.3 | Valosin-containing protein | 9p13.3 | AD |
표현형 | 유전자 | RefSeq | 유전자 설명 | 염색체 위치 | 참고문헌 |
ALS | APEX1 | NM_001641.3 | APEX nuclease (multifunctional DNA repair enzyme) 1 | 14q11.2-q12 | (115) |
ALS | ARHGEF28 | NM_001080479.2 | Rho guanine nucleotide exchange factor (GEF) 28 | 5q13.2 | (116) |
ALS | ERBB4 | NM_005235.2 | Erb-b2 receptor tyrosine kinase 4 | 2q33.3-q34 | (117) |
ALS | EWSR1 | NM_001163285.1 | Ewing sarcoma breakpoint region 1 | 22q12.2 | (118) |
ALS | NEFH | NM_021076.3 | Neurofilament, heavy polypeptide (200 kDa) | 22q12.2 | (119) |
ALS | PFN1 | NM_005022.3 | Profilin 1 | 17p13.3 | (69) |
ALS | PON1 | NM_000446.5 | Paraoxonase 1 | 7q21.3 | (120) |
ALS | PON2 | NM_000305.2 | Paraoxonase 2 | 7q21.3 | (120) |
ALS | PON3 | NM_000940.2 | Paraoxonase 3 | 7q21.3 | (120) |
ALS | PRPH | NM_006262.3 | Peripherin | 12q12-q13 | (121) |
ALS | SRCAP | NM_006662.2 | Snf2-related CREBBP activator protein | 16p11.2 | (110) |
ALS | SS18L1 | NM_198935.1 | Synovial sarcoma translocation gene on chromosome 18-like 1 |
20q13.3 | (122) |
ALS | CHRNA4 | NM_000744.6 | Acetylcholine receptor, neuronal nicotinic, alpha-4 subunit | 20q13.2-q13.3 | (123) |
ALS/FTD | CHMP2B | NM_014043.3 | Chromatin modifying protein 2B | 3p11.2 | (124) |
ALS/FTD | DCTN1 | NM_004082.4 | Dynactin 1 | 2p13 | (125) |
ALS/FTD | HNRNPA1 | NM_031157.2 | Heterogeneous nuclear ribonucleoprotein A1 | 12q13.1 | (72) |
ALS/FTD | HNRNPA2B1 | NM_031243.2 | Heterogeneous nuclear ribonucleoprotein A2/B1 | 7p15 | (72) |
표현형 | 유전자 | Locus name | 유전자 설명 | 염색체 위치 | 유전형식 |
Uncomplicated HSP | ATL1 | SPG3A | Atlastin GTPase 1 | 14q22.1 | AD |
Uncomplicated HSP | SPAST | SPG4 | Spastin | 2p24-p21 | AD |
Uncomplicated HSP | NIPA1 | SPG6 | Non-imprinted in Prader-Willi / Angelman syndrome 1 | 15q11.2 | AD |
Uncomplicated HSP | KIAA0196 | SPG8 | KIAA0196 | 8q24.13 | AD |
Uncomplicated HSP | KIF5A | SPG10 | Kinesin family member 5A | 12q13.13 | AD |
Uncomplicated HSP | RTN2 | SPG12 | Reticulon 2 | 19q13.32 | AD |
Uncomplicated HSP | HSPD1 | SPG13 | Heat shock protein 60kDa protein1 (chaperonin) | 2q33.1 | AD |
Complicated HSP | BSCL2 | SPG17 | Berardinelli-Seip congenital lipodystrophy 2 (seipin) | 11q13 | AD |
Uncomplicated HSP | REEP1 | SPG31 | Receptor accessory protein 1 | 2p11.2 | AD |
Uncomplicated HSP | ZFYVE27 | SPG33 | Zinc finger, FYVE domain containing 27 | 10q24.2 | AD |
Uncomplicated HSP | SLC33A1 | SPG42 | Solute carrier family 33 (acetyl-CoA transporter), member 1 | 3q25.31 | AD |
Uncomplicated HSP | CYP7B1 | SPG5A | Cytochrome P450, family 7, subfamily B, polypeptide 1 | 8q21.3 | AR |
Uncomplicated HSP | SPG7 | SPG7 | Spastic paraplegia 7 | 16q24.3 | AR |
Uncomplicated HSP | SPG11 | SPG11 | Spastic paraplegia 11 | 15q14 | AR |
Complicated HSP | ZFYVE26 | SPG15 | Zinc finger, FYVE domain containing 26 | 14q24.1 | AR |
Complicated HSP | ERLIN2 | SPG18 | ER lipid raft associated 2 | 8p11.2 | AR |
Complicated HSP | SPG20 | SPG20 | Spastic paraplegia 20 | 13q13.3 | AR |
Complicated HSP | SPG21 | SPG21 | Spastic paraplegia 21 | 15q22.31 | AR |
Complicated or uncomplicated HSP | DDHD1 | SPG28 | DDHD domain containing 1 | 14q21 | AR |
Complicated HSP | KIF1A | SPG30 | Kinesin family member 1A | 2q37.3 | AR |
Complicated HSP | FA2H | SPG35 | Fatty acid 2-hydroxylase | 16q23 | AR |
Complicated HSP | PNPLA6 | SPG39 | Patatin-like phospholipase domain containing 6 | 19p13.2 | AR |
Complicated HSP | GJC2 | SPG44 | Gap junction protein, gamma 2 | 1q42.13 | AR |
Complicated HSP | GBA2 | SPG46 | Glucosidase, beta (bile acid) 2 | 9p13.3 | AR |
Complicated HSP | AP4B1 | SPG47 | Adaptor-related protein complex 4, beta 1 subunit | 1p13.2 | AR |
Uncomplicated HSP | AP5Z1 | SPG48 | Adaptor-related protein complex 5, zeta 1 subunit | 7p22.2 | AR |
Complicated HSP | TECPR2 | SPG49 | Tectonin beta-propeller repeat-containing 2 | 14q32.31 | AR |
Complicated HSP | AP4M1 | SPG50 | Adaptor-related protein complex 4, mu 1 subunit | 7q22.1 | AR |
Complicated HSP | AP4E1 | SPG51 | Adaptor-related protein complex 4, epsilon 1 subunit | 15q21.2 | AR |
Complicated HSP | AP4S1 | SPG52 | Adaptor-related protein complex 4, sigma 1 subunit | 14q12 | AR |
Complicated HSP | VPS37A | SPG53 | Vacuolar protein sorting 37 homolog A | 8p22 | AR |
Complicated HSP | DDHD2 | SPG54 | DDHD domain containing 2 | 8p11.23 | AR |
Complicated HSP | CYP2U1 | SPG56 | Cytochrome P450, family 2, subfamily U, polypeptide 1 | 4q25 | AR |
Complicated HSP | GAD1 | N/A | Glutamate decarboxylase 1 | 2q31 | AR |
Complicated HSP | L1CAM | SPG1 | L1 cell adhesion molecule | Xq28 | X-linked |
Complicated HSP | PLP1 | SPG2 | Proteolipid protein 1 | Xq22 | X-linked |
Complicated HSP | SLC16A2 | SPG22 | Solute carrier family 16, member 2 | Xq13.2 | X-linked |
* 약자: AD, 상염색체 우성(autosomal dominant); AR, 상염색체 열성(autosomal recessive); N/A, 해당없음.
표현형 | 유전자 | 유전자 설명 | 염색체 위치 | 유전 형식 |
Hexosaminadase A deficiency | HEXA | Hexosaminidase A | 15q24.1 | AR |
Adult polyglucosan body disease | GBE1 | Glucan (1,4-alpha-), branching enzyme 1 | 3p12.3 | AR |
4) 변이 유효성 평가를 위한 생어(Sanger) 시퀀싱
필터링 기준을 따른 모든 아미노산의 치환을 유발하는 신규 변이는 아버지, 어머니 및 발단자 DNA 샘플에 대한 생어 시퀀싱을 통해 평가하였다. 타겟 유전자의 모든 엑손 및 엑손-인트론 경계는 프라이머를 이용하여 PCR을 통해 증폭하였다(표 6). PCR은 유전자 증폭기 모델 GeneAmp PCR system 9700 (Applied Biosytems, Foster City, CA)을 이용하여 다음의 조건으로 실시하였다: 32사이클로 94℃에서 30초간 변성, 60℃에서 30초간 어닐링 및 72℃에서 30초간 연장. 앰플리콘(5 ㎕)에 2U 쉬림프 알칼라인 포스파타아제 및 10U 엑소누클레아제 I(USB Corp., Cleveland, OH)을 37℃에서 15분간 처리한 다음, 80℃에서 15분간 배양하여 효소를 불활성화시켰다. 사이클 시퀀싱은 ABI 3130xl Genetic Analyzer(Applied Biosystems, Foster City, CA, USA)에서 Big Dye Terminator Cycle Sequencing Ready Reaction kit(Applied Biosystems, Foster City, CA, USA)를 이용하여 실시하였다. 변이의 명명은 GenBank의 참조서열에 따라 명기하였다. 본 발명에서 돌연변이에 대한 표기법은 ATG 개시 코돈의 A에 대응하는 뉴클레오타이드를 +1로 표기하는 인간 게놈 변이 협회(http://www.hgvs.org/mutnomen/)의 권고를 따랐다.
유전자 | 뉴클레오타이드 변이 | RefSeq | 정방향 | 역방향 |
FRAS1 | c.8393C>T | NM_025074.6 | TCCCTAAGTCAGCTATGGGAAG | AATTCCATGCTTGGTCTTGG |
RAPGEF2 | c.4069G>A | NM_014247.2 | CACCAGAGAAGCTGGGAGAC | GCAATGGAGAAAATGAGGAAA |
CLEC4C | c.629_631delAGA | NM_130441.2 | TGACCTTGACTTTCGCACTG | CCAGCAGTCTCTGGCACATA |
PSEN1 | c.497T>C | NM_000021.3 | GGCTTAAGCACGAGAATTGC | GCAAGGAGCAACAGAAGAATG |
PLEKHM2 | c.1921+6C>T | NM_015164.2 | CTGCTCATGATCCACGTGTT | CTTCCTTGGGGTGCCTTT |
SSH2 | c.1408G>T | NM_033389.3 | CCATCATCAACACTGGCTGT | CACAGGCCTTTCTGATTTGC |
SPAG17 | c.2815G>T | NM_206996.2 | AAGGATGACGTCAAGGCTTC | GGGGACTCTTCTGTTACTTCTTGG |
XRCC3 | c.598G>A | NM_001100119.1 | CAAGGGAACCAGTTGTGTGA | TGGTGCTCACCTGGTTGAT |
IFT80 | c.595G>A | NM_020800.2 | TGGATGTCTTAGGTGCTAGGTG | CTCACTGTGTTGTCCAGGCTAA |
ADGRL3 | c.715A>G | NM_015236.4 | TATGCCCTGGACTCCCTACA | ATCCCATGTTCCTTCGATCC |
5) 인-실리코 분석 및 유전자 우선순위 결정(prioritization)
SIFT(Sorting Intolerant From Tolerant)(126) 및 Polymorphism Phenotyping 2 (PolyPhen-2 v2.2.2)(127, 128) 서버는 단백질 구조, 기능 및 표현형과 서열 보존에 대한 비동일 단일염기 다형성(non-synonymous single nucleotide polymorphism) 치환의 효과를 예측하는데 사용되었다. PolyPhen-2에서 확률적 스코어가 0.85 이상인 경우, 돌연변이는 “손상 예상(probably damaging)”, 0.15 이상인 경우 “손상 가능(possibly damaging)”으로 구분되었다. 남은 돌연변이는 양성(benign)으로 분류하였다. SIFT에서는 특정 아미노산 치환이 미치는 영향을 정규화 확률로 나타내며 스코어가 0.05 이하인 경우 해당 아미노산의 치환이 단백질의 구조에 영향을 미칠 것임을 뜻한다.
신규 변이를 갖는 특정 유전자에 대한 우선순위를 결정하기 위해 ToppGene Prioritization software(129)를 사용하였다. 유전자 리스트는 전사체(유전자 발현), 단백질체(단백질 도메인 및 상호작용), 조절체(regulome)(TFBS 및 miRNA), 온톨로지, 표현형, 및 비블리옴(bibliome)(PubMed literature co-citation)을 기반으로 ALS 기전과 관련하여 기존에 발표된 문헌들과 비교하였다. 결합된 유사지수(similarity scores) 및 p-값은 본 발명에서 후보 유전자들의 우선순위를 결정하는데 사용되었다.
6) RAPGEF2 유전자의 검증
타겟 차세대 시퀀싱(targeted next generation sequencing)을 이용하여 184명의 ALS 환자의 엑손 및 플랭킹 영역에 대한 RAPGEF2 유전자 분석을 실시하였다(표 7). 라이브러리는 illumina Miseq sequencing system (amplicon size 425bp, paired-ends, read length 250 bp, coverage > 5000x)에서 색인, 풀링 및 시퀀싱되었다. 판독 결과는 BWA 0.7.5를 이용하여 GR37/hg19 빌드에 맵핑하였다(114). Picard-tools 1.84는 중복 판독(duplicate reads)을 표시하기 위해 사용하였다(http://picard.sourceforge.net/). 재정렬(realignment) 및 재보정(recalibration)은 GATK RealignerTargetCreator, IndelRealigner, 및BaseRecalibrator을 이용하여 실시하였다. GATK UnifiedGenotyper를 이용하여 모든 샘플에 대한 유전자형을 분석하였다.
염색체 | 시작 좌표 | 종료 좌표 | 길이(bp) | 앰플리콘 | 커버리지 |
4 | 160188998 | 160189367 | 370 | 2 | 100 |
4 | 160225494 | 160225625 | 132 | 1 | 100 |
4 | 160235743 | 160235920 | 178 | 1 | 100 |
4 | 160243499 | 160243635 | 137 | 1 | 100 |
4 | 160244611 | 160244769 | 159 | 1 | 100 |
4 | 160250986 | 160251674 | 689 | 3 | 100 |
4 | 160252559 | 160253873 | 1315 | 5 | 100 |
4 | 160259463 | 160259620 | 158 | 1 | 100 |
4 | 160260266 | 160260506 | 241 | 1 | 100 |
4 | 160262716 | 160263099 | 384 | 2 | 100 |
4 | 160264107 | 160264580 | 474 | 2 | 100 |
4 | 160265188 | 160265211 | 24 | 1 | 100 |
4 | 160266258 | 160266481 | 224 | 1 | 100 |
4 | 160267941 | 160268150 | 210 | 1 | 100 |
4 | 160271289 | 160271441 | 153 | 1 | 100 |
4 | 160273837 | 160274062 | 226 | 1 | 100 |
4 | 160274639 | 160275198 | 560 | 3 | 100 |
4 | 160277005 | 160277310 | 306 | 1 | 100 |
4 | 160279266 | 160281301 | 2036 | 7 | 100 |
7) MALDI-TOF를 이용한 대조군 연구
나이 및 성별이 일치하는 364명의 건강한 한국인 대조군에 대하여 MALDI-TOF MS(matrix assisted laser desorption/ionization time-of-flight mass spectrometry) 및 본 발명에서 디자인한 프라이머를 이용하여 RAPGEF2 유전자에서 발견된 신규 변이 유무를 스크리닝하였다(표 8). 약 30분 내에 각 38-웰 칩에 처리된 샘플은 MassARRAY Analyzer Compact (Sequenom, San Diego, CA)를 이용하여 분석하였다. 데이터는 SpectroACQUIRE software (Sequenom)를 통해 자동으로 수집되었으며, MassARRAY Typer software의 TrafficLights module에 의해 검토되었다. 각 실험에서 피크 높이에 대한 상세한 정보 및 신호 대 잡음비(signal-to-noise)에 기초한 각 세포에 대한 확률치(probability value) 및 피크 확률 통계는 필요에 따라 각 샘플에 대하여 검토하였다. 이 시스템에서 확률은 자동으로 계산되었으며, 엄격 정도(stringency level)는 conservative, moderate 및 aggressive calls의 3가지 레벨로 분석되었다. Aggressive call은 높은 오차율(<1%)을 보이는 반면, conservative call은 uncalled 유전자형에서 가장 낮은 비율을 나타낸다. 저 확률 콜(calls)은 제외되었다. 필요 시 개별 샘플에 대하여 스펙트럼 데이터를 검토하였다. Cluster Plot software module은 이형(atypical) 이형접합체 및 동형접합체 상태를 가시화하는데 사용되었다.
유전자 | 뉴클레오타이드 변이 | RefSeq | 정방향 | 역방향 |
RAPGEF2 | c.4069G>A | NM_014247.2 | ACGTTGGATGGACACAGGCACAATAAAGCG | ACGTTGGATGAGTCACAGACGTTAGGCTAC |
실험결과
1. 분자유전학 분석
1) Q.C 분석 및 엑솜 시퀀싱에 대한 기술통계
Agilent SureSelect all Exon kit 50 Mb(Agilent)를 이용하여 15명의 ALS 발단자 및 그들의 건강한 부모(n=45)에 대한 전체 엑솜 시퀀싱을 실시하였다. 각 개체당 최소 50,000,000 bp의 전체 판독 결과를 얻었다. 염기의 평균 92%가 Phred 스코어 30이상의 높은 품질을 나타냈다. 전체 판독 결과의 99.95%를 참조서열에 맵핑하였다. 15명의 발단자와 그들의 부모로부터 얻은 모든 샘플은 평균 74x 였다. 각 개인에 있어서 타겟 염기의 평균 99%는 적어도 하나의 독립적인 서열 판독에 의해 처리되었고, 91%는 적어도 10개의 독립적인 서열 판독에 처리되었으며, 82.4%는 적어도 20개의 독립적인 서열 판독에 의해 처리되었다(표 9).
기존에 보고된 ALS-FTD 원인 또는 관련 유전자, ALS의 감별진단을 위한 HSP 및 다른 질병 유전자에서 돌연변이는 발견되지 않았다(표 2-5).
Trio No. | Total reads | % more than Q30 bases | Mapped reads | % mapped reads | Non-duplicate reads | Mean coverage depth | % target at 1X | % target at 10X | % target at 20X |
1-P | 51,480,912 | 86.6 | 51,462,399 | 99.96 | 43,389,970 | 55.3 | 98.5 | 88.5 | 77.7 |
1-F | 65,167,802 | 86.0 | 65,139,804 | 99.95 | 53,577,017 | 67.1 | 98.9 | 90.7 | 82.4 |
1-M | 92,465,892 | 86.5 | 92,432,848 | 99.96 | 64,418,232 | 82.8 | 99.0 | 92.2 | 85.8 |
2-P | 63,791,280 | 86.4 | 63,765,712 | 99.95 | 51,913,342 | 66.4 | 98.7 | 90.1 | 81.6 |
2-F | 53,939,296 | 89.0 | 53,917,610 | 99.95 | 46,457,814 | 57.7 | 98.8 | 89.6 | 79.6 |
2-M | 50,089,792 | 88.6 | 50,068,431 | 99.95 | 44,276,977 | 56.8 | 98.6 | 88.8 | 78.4 |
3-P | 60,588,212 | 88.2 | 60,563,239 | 99.95 | 50,151,748 | 64.1 | 98.7 | 90.1 | 81.3 |
3-F | 53,293,388 | 88.1 | 53,270,250 | 99.95 | 44,153,932 | 55.3 | 98.7 | 89.2 | 78.7 |
3-M | 47,072,096 | 87.9 | 47,050,572 | 99.95 | 41,578,973 | 52.0 | 98.7 | 88.9 | 77.5 |
4-P | 131,434,474 | 93.3 | 131,374,780 | 99.95 | 99,643,297 | 126.4 | 99.7 | 95.6 | 91.5 |
4-F | 94,184,158 | 93.2 | 94,147,248 | 99.96 | 69,072,547 | 87.9 | 99.4 | 93.6 | 87.5 |
4-M | 127,543,470 | 93.4 | 127,488,235 | 99.95 | 97,221,570 | 122.1 | 99.7 | 95.6 | 91.4 |
5-P | 57,160,108 | 94.5 | 57,138,906 | 99.96 | 55,255,727 | 73.0 | 99.0 | 91.2 | 83.3 |
5-F | 80,431,798 | 94.6 | 80,401,581 | 99.96 | 76,811,873 | 101.5 | 99.4 | 93.5 | 87.9 |
5-M | 60,087,382 | 94.2 | 60,061,780 | 99.95 | 57,809,232 | 73.8 | 98.8 | 90 | 81.8 |
6-P | 49,678,674 | 93.7 | 49,659,982 | 99.96 | 43,296,585 | 55.3 | 98.7 | 88.6 | 77.1 |
6-F | 56,020,666 | 93.7 | 56,000,999 | 99.96 | 51,481,301 | 66.4 | 99.0 | 90.5 | 81.4 |
6-M | 47,568,954 | 93.7 | 47,549,366 | 99.95 | 42,956,118 | 54.6 | 98.8 | 89.0 | 77.5 |
7-P | 50,459,952 | 93.4 | 50,436,949 | 99.95 | 45,070,379 | 57.2 | 98.9 | 89.5 | 78.6 |
7-F | 58,692,976 | 93.4 | 58,666,334 | 99.95 | 54,227,119 | 69.2 | 99.2 | 91.4 | 83.0 |
7-M | 92,118,690 | 93.6 | 92,084,906 | 99.96 | 72,622,171 | 94.9 | 99.2 | 92.9 | 86.6 |
8-P | 53,590,510 | 92.4 | 53,571,980 | 99.96 | 47,992,562 | 62.1 | 98.7 | 89.2 | 79.1 |
8-F | 56,093,884 | 92.5 | 56,073,138 | 99.96 | 50,218,779 | 65.6 | 98.8 | 90.0 | 80.6 |
8-M | 58,010,996 | 92.6 | 57,990,089 | 99.96 | 51,785,665 | 67.1 | 98.9 | 90.6 | 81.7 |
9-P | 50,157,706 | 89.9 | 50,107,633 | 99.90 | 48,327,117 | 62.3 | 98.6 | 88.9 | 78.8 |
9-F | 64,748,536 | 92.5 | 64,725,656 | 99.96 | 57,619,562 | 73.5 | 99.0 | 91.0 | 82.6 |
9-M | 68,247,826 | 92.4 | 68,220,992 | 99.96 | 61,297,253 | 79.5 | 99.1 | 91.7 | 84.3 |
10-P | 66,576,932 | 93.6 | 66,544,375 | 99.95 | 65,055,775 | 81.2 | 99.2 | 92.2 | 85.3 |
10-F | 57,288,346 | 93.5 | 57,265,630 | 99.96 | 55,776,398 | 70.4 | 99.0 | 90.7 | 82.3 |
10-M | 63,224,312 | 93.3 | 63,187,574 | 99.94 | 62,259,646 | 73.6 | 99.3 | 91.8 | 84.3 |
11-P | 54,139,302 | 90.1 | 54,086,046 | 99.90 | 52,123,490 | 67.9 | 98.6 | 89.5 | 80.4 |
11-F | 55,080,696 | 89.9 | 55,018,427 | 99.89 | 52,618,323 | 67.7 | 98.7 | 89.8 | 80.8 |
11-M | 58,156,702 | 89.8 | 58,094,439 | 99.88 | 55,931,004 | 72.3 | 98.7 | 90.1 | 81.7 |
12-P | 70,645,628 | 91.9 | 70,619,926 | 99.96 | 64,640,898 | 84.1 | 99.3 | 92.0 | 84.7 |
12-F | 80,572,600 | 91.1 | 80,542,081 | 99.96 | 69,890,686 | 90.4 | 99.4 | 92.6 | 85.7 |
12-M | 67,083,856 | 91.4 | 67,057,069 | 99.96 | 60,763,860 | 79.6 | 99.2 | 91.7 | 83.9 |
13-P | 59,815,598 | 93.6 | 59,792,743 | 99.96 | 55,052,338 | 73.6 | 98.9 | 90.2 | 81.4 |
13-F | 65,585,926 | 93.0 | 65,553,902 | 99.95 | 60,095,261 | 75.4 | 99.2 | 91.4 | 83.2 |
13-M | 79,320,916 | 92.9 | 79,280,711 | 99.94 | 72,390,269 | 91.7 | 99.4 | 92.8 | 86.2 |
14-P | 60,891,562 | 93.3 | 60,863,344 | 99.95 | 57,820,449 | 72.9 | 99.2 | 91.2 | 82.8 |
14-F | 61,485,616 | 92.9 | 61,463,752 | 99.96 | 55,608,163 | 73.5 | 99.0 | 90.5 | 81.8 |
14-M | 57,261,444 | 93.8 | 57,243,205 | 99.96 | 53,229,496 | 71.0 | 98.8 | 89.9 | 80.8 |
15-P | 66,782,838 | 92.9 | 66,761,203 | 99.96 | 60,425,805 | 80.4 | 99.0 | 91.1 | 83.1 |
15-F | 56,780,312 | 93.2 | 56,761,259 | 99.96 | 52,059,338 | 70.1 | 98.9 | 90.0 | 80.9 |
15-M | 64,590,202 | 93.5 | 64,571,321 | 99.97 | 58,806,125 | 78.9 | 99.0 | 91.0 | 83.0 |
2) 신규 변이 발생을 포함하는 공지된 병리학적 변이의 발견
본 발명자들은 PSEN1 유전자에서 sALS 트리오-7로부터 기존에 보고된 바 있는 돌연변이 하나를 발견하였다. 이것은 497번째 뉴클레오타이드 위치에서 티민이 시토신으로 치환된 것으로 코돈 166번 위치에서 류신을 아르기닌으로 치환된다; c.497T>C (p.Leu166Pro)(도 1). 발단자에서 PSEN1 c.497T>C의 변이 판독은 전체 판독 결과의 46%(37/81)이며, 이는 대립유전자의 이형접합성을 의미한다. 돌연변이는 생어 시퀀싱을 통한 신규 변이 발생으로 확인되었으며, 발단자에서는 이형접합체가 발견되었고 부모에서는 발견되지 않았다. PSEN1 c.497T>C는 가족성 EOAD(early-onset Alzheimer’s dementia)에서 종전에 보고된 바 있다(130).
3) 신규로 발생한 VUS(variants of unknown significance)의 발견
생어 시퀀싱을 이용하여 변이를 확인 후, 본 발명자들은 8명의 sALS 트리오로부터 9개의 신규 VUS(variants of unknown significance)를 발견하였다(도 2-9). 9개의 신규 VUS 가운데 8개 변이는 엑손 영역에 위치하며 아미노산 서열에 영향을 주는 변이였다. 5명 sALS 트리오로부터 6개의 미스센스 VUS가 발견되었다; FRAS1 c.8393C>T (p.Ala2798Val), RAPGEF2 c.4069G>A (p.Glu1357Lys), SPAG17 c.2815G>T (p.Ala939Ser), XRCC3 c.598G>A (p.Val200Ile), IFT80 c.595G>A (p.Val199Ile), 및 ADGRL3 c.715A>G (p.Ser239Gly). sALS 트리오-12의 발단자는 PAG17 c.2815G>T (p.Ala939Ser) 및 XRCC3 c.598G>A (p.Val200Ile) 두 개의 신규 VUS를 갖는 것으로 나타났다. Inframe deletion인 CLEC4C c.629_631delAGA (p.Lys210del)가 sALS 트리오-4에서 확인되었으며, 넌센스 변이인 SSH2 c.1408G>T (p.Glu470*)가 sALS 트리오-11에서 확인되었다. 넌센스 변이는 mRNA 레벨에서 조기 종결코돈(premature stop codon)을 만들 것으로 예측된다. 나머지는 엑손 경계 근처의 플랭킹 영역에 위치하는 인트론 변이였다(PLEKHM2 c.1921+6C>T).
SIFT 및 PolyPhen-2를 이용한 인-실리코 분석 결과, 4개의 신규 변이는 2개의 테스트 중 적어도 하나에서 유해한 것으로 나타났고, 3개 미스센스 변이는 SIFT 및 PolyPhen-2 모두에서 양성(benign)인 것으로 예측되었다(표 10). 모든 변이의 GEFR++ 스코어는 XRCC3 유전자의 c.598G>A를 제외하고 4 이상이었으며, 이는 해당 변이의 위치가 진화적으로 보존되어 온 것임을 의미한다. 6개 신규 VUS는 dbSNP141, 1000 지놈 프로젝트(전체 및 동아시아인 대립유전자 빈도) 및 ExAC(Exome Aggregation Consortium)에서 발견되지 않았다. 또한, 3개의 신규 VUS인 RAPGEF2 c.4069G>A (p.Glu1357Lys), CLEC4C c.629_631delAGA (p.Lys210del) 및 XRCC3 c.598G>A (p.Val200Ile)는 dbSNP141 데이터베이스에서 rs 번호가 있으면서, 기존의 인구집단을 대상으로 한 데이터베이스 중 하나 이상에서 0.1% 이하의 대립유전자 빈도를 나타내는 것으로 보고된 바 있다. 모든 변이는 인종이 일치하는 100명의 정상 대조군 개체의 외부 한국인 엑솜 데이터 및 자체 질병 대조군에서 발견되지 않았다(표 11).
신규 변이 발생률의 총 빈도는 기존에 보고된 돌연변이 및 VUS를 포함하여 0.6(9/15)이었다.
Trio No. | Gene | Genomic coordinates (hg38) | RefSeq | Nucleotide change |
Amino acid change | PolyPhen-2 (HumDiv, Probabilistic score) |
SIFT (Tolerance index) |
GERP++ score |
2 | FRAS1 | Chr4:78,479,668 | NM_025074.6 | c.8393C>T | p.Ala2798Val | Benign (0.347) |
Tolerated (0.23) |
5.59 |
3 | RAPGEF2 | Chr4:159,353,947 | NM_014247.2 | c.4069G>A | p.Glu1357Lys | Benign (0.092) |
Tolerated (0.07) |
6.17 |
4 | CLEC4C | Chr12:7,729,607 | NM_130441.2 | c.629_631delAGA | p.Lys210del | N/A | N/A | N/A |
7 | PSEN1 * | Chr14:73,186,869 | NM_000021.3 | c.497T>C | p.Leu166Pro | Possibly damaging (0.469) |
Deleterious (0.01) |
5.46 |
8 | PLEKHM2 | Chr1: 15,728,363 | NM_015164.2 | c.1921+6C>T | N/A | N/A | N/A | N/A |
11 | SSH2 | Chr17:29,636,741 | NM_033389.3 | c.1408G>T | p.Glu470* | N/A | N/A | 6.16 |
12 | SPAG17 | Chr1:118,042,042 | NM_206996.2 | c.2815G>T | p.Ala939Ser | Probably damaging (0.999) |
Deleterious (0.01) |
5.23 |
12 | XRCC3 | Chr14:103,699,540 | NM_001100119.1 | c.598G>A | p.Val200Ile | Benign (0.021) |
Tolerated (0.66) |
-7.12 |
13 | IFT80 | Chr3:160,357,533 | NM_020800.2 | c.595G>A | p.Val199Ile | Benign (0.016) |
Deleterious (0.00) |
5.37 |
15 | ADGRL3 | Chr4:61,733,074 | NM_015236.4 | c.715A>G | p.Ser239Gly | Probably dagaming (0.991) |
Deleterious (0.00) |
4.04 |
* 공지된 병리학적 변이
** 약자: N/A, 해당없음.
Trio No. |
Gene | RefSeq | Nucleotide change |
Amino acid change | rs number | Allele frequency | External Korean exome data | |||
dbSNP 141 |
1000 Genome |
1000 Genome (EA) |
ExAC | |||||||
2 | FRAS1 | NM_025074.6 | c.8393C>T | p.Ala2798Val | N/A | N/A | N/A | N/A | N/A | N/A |
3 | RAPGEF2 | NM_014247.2 | c.4069G>A | p.Glu1357Lys | rs200644232 | 0.0002 | 0.000 | 0.000 | 0.0001 | N/A |
4 | CLEC4C | NM_130441.2 | c.639_631delAGA | p.Lys210del | N/A | N/A | N/A | N/A | 0.00002 | N/A |
7 | PSEN1 * | NM_000021.3 | c.497T>C | p.Leu166Pro | rs63750265 | N/A | N/A | N/A | N/A | N/A |
8 | PLEKHM2 | NM_015164.2 | c.1921+6C>T | N/A | N/A | N/A | N/A | N/A | N/A | N/A |
11 | SSH2 | NM_033389.3 | c.1408G>T | p.Glu470* | N/A | N/A | N/A | N/A | N/A | N/A |
12 | SPAG17 | NM_206996.2 | c.2815G>T | p.Ala939Ser | N/A | N/A | N/A | N/A | N/A | N/A |
12 | XRCC3 | NM_001100119.1 | c.598G>A | p.Val200Ile | rs531332562 | 0.0004 | N/A | N/A | 0.00005 | N/A |
13 | IFT80 | NM_020800.2 | c.595G>A | p.Val199Ile | N/A | N/A | N/A | N/A | N/A | N/A |
15 | ADGRL3 | NM_015236.4 | c.715A>G | p.Ser239Gly | N/A | N/A | N/A | N/A | N/A | N/A |
* 기존에 보고된 돌연변이
** 약자: N/A, 해당없음. EA, 동아시아인; ExAC, Exome Aggregation Consortium.
3) 유전자 우선순위 결정
인간 유전자 주석 및 문헌과 마우스 표현형 데이터를 결합한 ToppGene 소프트웨어를 이용하여 후보 유전자를 평가하였다(129). 트레이닝 유전자 세트로서 표 2에 기재된 22개의 ALS-FTD 원인 유전자와 테스트 유전자 세트로서 신규 VUS가 발견된 9개 유전자를 이용하여 분석을 실시하였다. 분석 결과에 따르면, RAPGEF2 유전자는 p-값 0.05 이하로 기존에 알려진 ALS-FTD 유전자와 높은 관련성을 보였다. 특히, 기존에 알려진 ALS-FTD 유전자와 RAPGEF2 유전자는 생물학적 기전 및 발현 부위가 통계적으로 유의한 연관성을 보였다 (p-값은 모두 < 0.05)(표 12). 따라서, 본 발명자들은 RAPGEF2 유전자에 초점을 맞추기로 하였다.
순위 | 유전자 | Molecular Function (p-value) |
Biological Process (p-value) |
Cellular Component (p-value) |
Pathway (p-value) |
Pubmed (p-value) | Gene Family (p-value) |
Coexpre -ssion (p-value) |
Disease (p-value) | Average Score | Overall (p-value) |
1 | RAPGEF2 | 0.017005 | 0.007194 | 0.011118 | 0.501635 | 0.139961 | 0.146501 | 0.007848 | 0.18705 | 0.304168 | 0.003722 |
2 | IFT80 | 0.576194 | 0.142577 | 0.094833 | 0.23414 | 0.192283 | 0.499673 | 0.51537 | 0.00327 | 0.201703 | 0.076533 |
3 | SSH2 | 0.104644 | 0.104644 | 0.18378 | 0.501635 | 0.132112 | 0.146501 | 0.51537 | 0.18705 | 0.167025 | 0.146642 |
4 | XRCC3 | 0.576194 | 0.158273 | 0.140615 | 0.501635 | 0.06998 | 0.146501 | 0.51537 | 0.503597 | 0.160944 | 0.222278 |
5 | SPAG17 | 0.576194 | 0.670373 | 0.080445 | 0.23414 | 0.621321 | 0.146501 | 0.51537 | 0.503597 | 0.071555 | 0.316402 |
6 | PLEKHM2 | 0.104644 | 0.282538 | 0.338784 | 0.501635 | 0.219751 | 0.146501 | 0.51537 | 0.18705 | 0.062085 | 0.334397 |
7 | CLEC4C | 0.576194 | 0.223022 | 0.262263 | 0.23414 | 0.621321 | 0.499673 | 0.51537 | 0.18705 | 0.07439 | 0.378598 |
8 | FRAS1 | 0.576194 | 0.321779 | 0.197515 | 0.23414 | 0.621321 | 0.146501 | 0.51537 | 0.503597 | 0.106461 | 0.397609 |
9 | ADGRL3 | 0.576194 | 0.324395 | 0.23087 | 0.501635 | 0.621321 | 0.146501 | 0.51537 | 0.503597 | 0.047731 | 0.43641 |
4) ALS 및 대조군에서 RAPGEF2 유전자의 검증
ALS와 RAPGEF2 유전자의 관련성을 검증하기 위해 MALDI-TOF를 이용하여 385명의 건강한 개체를 대상으로 RAPGEF2 유전자에서 발견된 변이인 c.4069G>A에 대한 대조군 연구(control study)를 실시하였으며, 변이가 발견된 사람은 없었다. 또한, 본 연구에서 ALS 트리오와 무관한 184명의 ALS 환자의 RAPGEF2 유전자에 대하여 타겟 차세대 시퀀싱을 실시하였다. 그 결과, 2명으로부터 2개의 미스센스 VUS를 발견하였다: HS-374로부터 c.1883C>T (p.Thr628Ile), HS-477로부터 c.3293G>A (p.Arg1098His)(도 10). 본 연구에서 1명의 트리오 케이스 및 2명의 산발성 ALS 환자의 RAPGEF2 유전자에서 총 3개의 변이가 발견되었다(3/199, 1.5%). c.1883C>T (p.Thr628Ile) 변이는 UBQ 수퍼패밀리 도메인에 위치하며, c.3293G>A (p.Arg1098His) 및 c.4069G>A (p.Glu1357Lys) 변이는 RasGEF 도메인 바깥쪽 3’-말단 영역에 위치한다(도 11).
2. 환자 특성
ALS 트리오의 15명 발단자에 대한 임상 정보는 표 13에 요약하였다. 15명의 환자 가운데 9명은 남성, 6명은 여성이었다(남성:여성 비율은 1:0.6). 평균 발병 연령은 34.2세였다(범위, 19-49세). ALS에 대하여 가족력을 가진 사람은 없었다. sALS 트리오-7의 발단자를 제외하고 인지 장애를 보인 사람은 없었다. 14명의 환자(93.3%)은 사지에서 증상이 시작되었고 한 환자는 숨뇌 영역에서 증상이 시작되었다. 진단 당시 평균 ALSFRS-R은 40.5이고, 평균 델타-FS는 0.57이다. 추적 관찰기간동안 사망한 환자는 없었다. 두 명의 환자는 증상 발병 후 21개월 및 49개월 후 비-침습적 인공 호흡기 치료를 받았다. 숨뇌에서 발병한 ALS 트리오-12 발단자는 발병 후 빠르게 증상이 진행되어 10개월 후 비-침습적 인공 호흡기 치료 및 위루형성술(gastrostomy)을 받았다.
PSEN1 유전자의 c.497T>C (p.Leu166Pro) 변이를 갖는 sALS 트리오-7의 발단자는 28세 남자로 24개월간의 보행장애 및 하지 경련 기왕력이 있었다. 정신운동 장애, 공간지각력 저하를 포함한 인지장애가 경직성 보행장애에 선행되었다. 신경학적 검사에서 하지의 심한 경직과 좌우 과활동성 심부힘줄반사(Bilateral hyperactive deep tendon reflexes), 호프만 징후 및 바빈스키 징후가 나타났다. MMSE(Mini Mental State Examination)는 26/30을 기록했다. 정밀 신경심리 검사에서는 주의집중, 언어능력, 기억력, 전두엽 기능을 비롯한 모든 영역에서 인지 저하가 확인되었다. 근전도에서는 활성 탈신경(active denervation) 및 만성 탈신경 소견은 보이지 않았다. 뇌 및 척추 MRI 결과, 미만성 대뇌피질 위축이 관찰되었다. 치매나 인지 장애를 유발할 수 있는 이차적인 원인을 시사하는 검사 소견은 없었다. 고든 및 프링글 기준에 따라 하지의 근육 신경을 침범하며 치매를 동반하는 원발성 측삭경화증으로 진단되었다(18, 131).
RAPGEF2 유전자에서 c.4069G>A (p.Glu1357Lys) 변이를 갖는 sALS 트리오-3의 발단자는 36세 여성으로 오른손 및 하지에서 7개월간 점진적인 운동장애를 나타냈다. 1년 후, 구음 장애가 발생하였다. 신경근육질환에 대한 가족력은 없었다. 신경학적 검사 결과, 혀, 두 팔 및 두 다리에서 근위축 및 쇠약(weakness)이 나타났다. 속상위축(fasciculation)이 사지에서 분명하게 관찰되었으며, 좌우 과활동성 심부힘줄반사, 호프만 및 바빈스키 징후, 및 발목의 간헐성 경련이 나타났다. 기본적인 혈액 검사에서는 유의한 이상 소견을 보이지 않았다. 근전도 검사 결과, 활동성 및 만성 탈신경이 사지에서 나타났다. 뇌 MRI 결과, 이상 소견은 없었다. 개정된 E1-Escorial 기준에 따라, 3개 영역에서 상위운동신경 징후가 있는 경우로 임상적으로 명확한 ALS로 진단하였다.
FRAS1 유전자에서 c.8393C>T (p.Ala2798Val) 변이를 갖는 sALS 트리오-2의 발단자는 36세에 상지(upper extremity)에서 발병되었다. 진단 시 환자의 ALSFRS-R은 45/48이었고, 델타-FS는 1.43으로 상대적으로 증상이 빨리 진행되었다. 상기 환자는 ALS 발병 후 34개월 시점에 생존해 있었다.
CLEC4C 유전자에서 c.629_631delAGA (p.Lys210del) 변이를 갖는 sALS 트리오-4의 발단자는 21세 여성으로 19세에 상지에서 발병되었고, 느리게 진행 중인 운동장애를 갖고 있다. 진단 시 환자의 ALSFRS-R은 46/48이었고, 델타-FS는 0.1이었다. 상기 환자는 증상 발병 후 23개월 시점에 생존해 있었다.
PLEKHM2 유전자에서 c.1921+6C>T 변이를 갖는 sALS 트리오-8의 발단자는 39세 남성으로 38세에 증상이 시작되었으며, 상지에서 운동장애가 서서히 진행되었다. 진단 시 환자의 ALSFRS-R은 39/48이었고, 델타-FS는 0.89이었다. 상기 환자는 증상 발병 후 15개월 시점에 생존해 있었다.
SSH2 유전자에서 c.1408G>T (p.Glu470*) 변이를 갖는 sALS 트리오-11의 발단자는 39세에 상지에서 증상이 시작되었다. 진단 시 환자의 ALSFRS-R은 33/48이었고, 델타-FS는 0.75였다. 상기 환자는 증상 발병 후 8개월 시점에 생존해 있었다.
sALS 트리오-12의 발단자에서는 2개의 신규 VUS, 즉, SPAG17 유전자의 c.2815G>T (p.Ala939Ser) 변이 및 XRCC3 유전자의 c.598G>A (p.Val200Ile) 변이가 발견되었다. 상기 환자는 40세에 숨뇌 영역에서 증상이 발병하였다. 진단 시 환자의 ALSFRS-R은 42/48이었고, 델타-FS는 1.5였다. 상기 환자는 증상 발병 후 6개월시점에 생존해 있었으며, 발병 후 10개월에 기관절개술(tracheostomy) 및 위루형성술을 받았다.
IFT80 유전자에서 c.595G>A (p.Val199Ile) 변이를 갖는 sALS 트리오-13의 발단자는 41세에 하지(lower extremity)에서 발병되었다. 진단 시 환자의 ALSFRS-R은 37/48이었고, 델타-FS는 0.73이었다. 상기 환자는 ALS 발병 후 10개월 시점에 생존해 있었다.
ADGRL3 유전자에서 c.715A>G (p.Ser239Gly) 변이를 갖는 sALS 트리오-15의 발단자는 43세에 하지에서 발병되었다. 진단 시 환자의 ALSFRS-R은 43/48이었고, 델타-FS는 0.25였다. 상기 환자는 증상 발병 후 6개월 시점에 생존해 있었다.
Trio No. | Sex | Age onset | Family history | Diagnosis | rEEC | Site of onset | ALSFRS-R | delta-FS | FVC (%) | Onset to initial (Mo) | Duration of f/u (mo) | NIV from onset (mo) | Gastrostomy from onset (mo) | Death from onset (mo) |
1 | M | 30 | No | ALS | probable | LE | 45 | 0.1 | 71 | 29 | 40 | 49 | - | - |
2 | F | 36 | No | ALS | definite | UE | 38 | 1.43 | 71 | 7 | 34 | - | - | - |
3 | F | 27 | No | ALS | probable | LE | 44 | 0.36 | 67 | 11 | 69 | - | - | - |
4 | F | 19 | No | ALS | probable | UE | 46 | 0.1 | 68 | 20 | 23 | - | - | - |
5 | F | 28 | No | ALS | definite | UE | 35 | 0.43 | 73 | 30 | 17 | - | - | - |
6 | M | 23 | No | ALS | definite | UE | 36 | 0.52 | 58 | 23 | 23 | - | - | - |
7 | M | 26 | No | PLS plus | - | LE | 37 | 0.32 | 56 | 24 | 10 | - | - | - |
8 | M | 38 | No | ALS | definite | UE | 39 | 0.89 | 90 | 9 | 15 | - | - | - |
9 | M | 26 | No | ALS | probable | LE | 41 | 0.37 | 63 | 19 | 38 | - | - | - |
10 | F | 49 | No | ALS | probable | LE | 45 | 0.5 | 71 | 6 | 14 | 21 | - | - |
11 | F | 39 | No | ALS | definite | UE | 33 | 0.75 | 83 | 20 | 8 | - | - | - |
12 | M | 40 | No | ALS | probable | bulbar | 42 | 1.5 | 56.4 | 4 | 6 | 10 | 10 | - |
13 | M | 41 | No | ALS | probable | LE | 37 | 0.73 | 84 | 15 | 10 | - | - | - |
14 | M | 49 | No | ALS | probable | UE | 46 | 0.25 | 101.6 | 8 | 7 | - | - | - |
15 | M | 43 | No | pure LMND | - | LE | 43 | 0.25 | not done | 20 | 6 | - | - | - |
* 약어: PLS, primary lateral sclerosis; LMND, lower motor neuron disease; rEEC, revised El Escorial criteria; UE, upper extremity; LE, lower extremity; ALSFRS-R, the ALS functional rating scale-revised; delta-FS, delta-functional rating; FVC, forced vital capacity; NIV, non-invasive ventilation.
논의
1. 신규 변이의 발견
본 발명에서 15명의 sALS 트리오에 대한 전체 엑솜 시퀀싱을 실시하였고, 8 트리오로부터 PSEN1 유전자에서 1개의 기존에 보고된 돌연변이 및 9개의 VUS를 포함하는 10개의 신규 변이를 발견하였다. 먼저 본 발명자들은 전체 엑솜 시퀀싱을 통해 가족력이 없는 EOAD 환자에서 원인이 되는 변이를 발견하였다. 두 번째로 본 발명자들은 한국인 sALS 환자에서 신규 변이의 빈도를 평가하였다. 마지막으로 이러한 결과들은 ALS에서 신규 변이에 대한 체계적인 분석을 제공하며, 본 발명자들은 ALS 유전적 배경에 기여하는 새로운 후보로서 RAPGEF2 유전자를 확인하였다.
본 발명자들은 26세에 발병한 sALS 트리오-7로부터 신규 PSEN1 병리학적 변이인 c.497T>C (p.Leu166Pro)를 발견하였다. 이 변이는 가족성 이른발병 알츠하이머 치매(early onset Alzheimer's dementia; EOAD)의 원인이 되는 변이로 보고된 바 있다(130). 산발성 EOAD 환자에서 신규 변이에 대한 보고는 수 례만 보고되었는데(132-134) 이는 PSEN1 유전자 검사가 가족력이 있는 EOAD 환자에서 주로 시행되므로 선택편견(selection bias)이 작용했을 가능성이 있다(134). 본 발명의 결과더불어, 신규 변이가 발생하는 환자의 발병 연령은 26세에서 37세로 매우 어렸다. 본 연구에서 발단자와 마찬가지로 선천성강직성대마비(spastic paraplegia)를 보이는 몇몇 가족성 EOAD 증례가 보고된 바 있다(135-137). 특히, PSEN1 유전자 엑손 9의 결손이 조기 선천성강직성대마비이 관련이 있다고 알려져 있다 (138-140). 생어 시퀀싱을 통한 타겟 유전자 시퀀싱은 일반적으로 돌연변이를 찾기 위한 유용한 방법으로 알려져 있지만 질병의 다양한 표현형(phenotypic variability), 유전적 복합성(genetic heterogeneity) 및 다발성 분자 메커니즘으로 인해 다수의 신경 퇴행성 질환에서 원인이 되는 유전자 및 변이를 결정하는데 어려움이 있다. 따라서, 명확한 타겟 유전자가 없는 상황에서 일반적인 원인 유전자에 대한 검사 후 전체 엑솜 시퀀싱을 시행하는 것은 진단적 유용성을 지닌다.
본 발명에서 신규 변이 발생율은 0.6 (9/15)였고, 이는 ASD (autism spectrum disorders) 및 ALS의 최근 연구 결과와 유사하다(표 14). 최근 한 연구에서는 전체 엑솜 시퀀싱을 통한 47 sALS 트리오의 신규 변이 빈도를 0.64 (30/47)로 보고하였다(110). O’Roak 등은 189명의 자폐증 환자 및 부모에 대해 전체 엑솜 시퀀싱을 시행하였고, 그 결과 181개의 non-synonymous 변이(0.96, 181/189)를 발견했으며, 그 중 120개는 생화학적 특성 및 종간 보존 정도에 의거하여 질환에 영향을 미칠 가능성이 큰 변이로 분류되었다(103). ASD에 대한 다른 연구에서 신규 변이의 비율은 0.63 - 0.68로 나타났으며, 이는 본 발명의 결과와도 일치하였다(141-143).
질병 표현형(참고) | NS 변이 수 | 발단자 수 | 발단자 당 NA 변이 수 |
ASD (141) | 125 | 200 | 0.63 |
ASD (103) | 181 | 189 | 0.96 |
ASD (142) | 119 | 175 | 0.68 |
ASD (143) | 232 | 343 | 0.68 |
ALS (110) | 30 | 47 | 0.64 |
ALS (본 발명) | 9 | 15 | 0.6 |
* 약어: ASD, autism spectrum disorders; ALS, amyotrophic lateral sclerosis.
2. RAPGEF2 유전자
본 발명에서 RAPGEF2(Ras guanine nucleotide exchange factor 2) 유전자가 ALS의 원인 유전자 후보로 확인되었다. 본 발명자들은 sALS 트리오-3에서 RAPGEF2 유전자의 신규 미스센스 변이 c.4069G>A (p.Glu1357Lys)를 발견하였다. 또한, 독립된 184명의 sALS 환자군에서 RAPGEF2 유전자의 미스센스 변이 두 개를 추가로 발견하였다; c.1883C>T (p.Thr628Ile) 및 c.3293G>A (p.Arg1098His). 본 발명의 실험 분석결과들은 RAPGEF2 유전자가 sALS에 대한 원인 유전자일 가능성을 시사한다. 첫째로, 100명의 동일 인종의 정상 대조군 및 75명의 자체 질병 대조군에서는 RAPGEF2 유전자의 상기 3가지 변이가 존재하지 않았다. 그리고 dbSNP141, 1000 지놈 프로젝트(전체 및 동아시아인) 및 ExAC(Exome Aggregation Consortium)에서 변이의 대립유전자 빈도는 극히 드물었다(0.1% 이하). 둘째, 출판된 문헌, 전사체, 단백체, 조절체, 온톨로지 및 표현형 데이터베이스에 대한 비교를 기반으로 한 분석에서 기존에 알려진 ALS의 발병 기전과 RAPGEF2 유전자를 비교한 결과 RAPGEF2 유전자가 ALS와 통계적으로 유의한 관계가 있음이 확인되었다.
RAPGEF2 유전자는 염색체 4q32.1에 위치하고 35개의 엑손으로 구성되며, 1,499개의 아미노산을 코딩한다. RapGEF2 단백질은 비활성 GDP- 및 활성 GTP-결합 상태를 결정하는 GTP/GDP-조절 스위치로서 신호전달에서 GTPase 기능을 가진 RAS 패밀리 멤버의 하나이다(144). RapGEF2는 CNBD(cyclic nucleotide-binding domain), Ras 익스체인지 도메인, PDZ 도메인, Ras 연관 도메인 및 Rap GEF 도메인을 포함하는 여러 도메인을 포함한다(145). RapGEF2의 GEF 도메인은 Rap1 및 Rap1과 가까운 패밀리 멤버인 Rap2에서 GTP 교환을 조절하는 역할을 한다(146). 다른 도메인들은 그것의 활성, 안정성 및 위치를 조절하는 것으로 보인다(147, 148).
쥐를 대상으로 한 실험에서 RapGEF2가 쥐의 뇌에서 풍부하게 발현되고, 시냅스 원형질막 소포에 많이 존재한다는 사실이 관찰되었는데 이로부터 RapGEF2가 시냅스에서 역할을 수행할 것이라는 가설이 제기된 바 있다(도 12)(149). 또한, 초기 뇌 발달 및 뉴런의 형태발생 과정이 RapGEF2의 기능과 연관되어 있다는 보고도 있었다(150-152). RapGEF2는 MAPK 및 Rap1 신호전달 경로에 관여한다. Rag1 신호전달체계는 뉴런 이동에 관여하며, Cdk5에 의해 조절된다(153). 최근 연구에서 RapGEF2의 Cdk5-의존적 조절이 뉴런 이동 및 대뇌피질의 신경회로구성에 중요한 역할을 한다는 것이 보고되었다(145).
3. 다른 유전자들
본 발명자들은 sALS-13의 IFT80 유전자로부터 신규 변이 c.595G>A를 발견하였다. IFT80(Intraflagellar transport 80) 유전자는 염색체 3q25.33에 위치하며, 21개의 엑손으로 구성된다. 이 유전자는 IFT(intraflagellar transport) 콤플렉스 B 단백질을 코딩하며, 운동 및 감각 섬모에서 필수적인 역할을 한다. IFT80 유전자의 돌연변이는 ATD2(asphyxiating thoracic dystrophy 2) 및 SRP(short-rib polydactyly syndrome) 타입 Ⅲ를 유발한다(154). IFT80은 연조직 및 신장에서 풍부하게 발현된다(도 13). 최근 왕 등은 입천장 및 해면질골(trabecular bone)에서 IFT80 발현이 증가되며, 마우스 경골에 대한 면역화학 분석을 통해 Hh 및 Wnt 신호전달 경로를 조절함으로써 연골세포 분화에 IFT80이 필수적으로 작용한다는 것을 밝혔다(155).
sALS 트리오-11의 SSH2 유전자에서 넌센스 신규 변이 c.1408G>T (p.Glu470*)가 발견되었다. SSH2(Slingshot protein phosphatase 2) 유전자는 염색체 17q11.2에 위치하며, 24개의 엑손으로 구성된다. 이 유전자는 단백질 티로신 포스파타아제를 코딩하며, 액틴 필라멘트를 조절하는데 중요한 역할을 한다(156). SSH2는 혀 및 혈액에서 풍부하게 발현된다(도 14). 최근 정신분열증 환자를 대상으로 한 연구에서 ARC(activity-regulated cytoskeleton-associated protein) 및 NMDAR(N-methyl-D-aspartate receptor) 복합체를 포함하는 글루탐산성 시냅스후 단백질(glutamatergic postsynaptic protein)에서 신규 변이가 많이 발견된다는 사실을 확인하였다. 또한, 시냅스 강도(synaptic strength), 즉 액틴 필라멘트 다이나믹스 조절 단백질을 조절하는 복합체들과 상호작용하는 단백질에서 돌연변이가 많이 나타나며, 이들의 mRNA는 FMRP(fragile X mental retardation protein)를 타겟으로 한다. 이 연구에서 SSH2 유전자의 미스센스 신규 변이 c.1477G>A (p.Glu493Lys)가 정신분열증 환자 한 명에서 발견되었으며, 이는 SSH2 유전자가 정신분열증 및 다른 신경발달장애의 메커니즘에 관여할 수 있다는 것을 암시한다(157).
sALS-트리오 4의 CLEC4C 유전자에서 인프레임 결실인 c.629_631delAGA가 발견되었다. CLEC4C(C-type lectin domain family 4, member C) 유전자는 염색체 12p13.2-p12.3에 위치하며, 7개의 엑손으로 구성된다. 이 유전자의 단백질 패밀리 멤버는 공통의 단백질 접힘(fold) 구조를 공유하며, 세포 부착, 세포 신호전달, 당단백질 순환(turnover) 및 염증과 면역 반응에서의 역할과 같은 다양한 기능을 갖는다. 타입 2 트랜스멤브레인 단백질은 수지상세포 기능에 있어서 중요한 역할을 한다(158). 최근, 형질전환 마우스를 이용한 한 연구에서 CLEC4C를 통한 플라스마사이토이드 수지상세포로의 항원 전달이 자가면역질환의 치료 또는 원치 않는 항체 반응을 억제하는데 유용한 면역학적 내성 유도에 효과적인 방법이라는 것이 보고되었다(159).
sALS-트리오 8의 PLEKHM2 유전자에서 인트론 변이인 c.1921+6C>T가 발견되었다. PLEKHM2[Pleckstrin homology domain containing, family (with RUN domain) member 2] 유전자는 염색체 1q36.21에 위치하며, 21개 엑손으로 구성된다. PLEKHM2는 흉선에서 풍부하게 발현된다(도 17). 이 유전자는 살모넬라 감염 시 키네신(kinesin) 동원(recruitment)을 억제하며, PLEKHM2 활성은 살모넬라-포함 액포의 위치 결정 및 유지에 필수적이다(160).
본 발명자들은 FRAS1 유전자에서 미스센스 변이인 c.8393C>T를 발견하였다. FRAS1(Fraser extracellular matrix complex subunit 1) 유전자는 염색체 4q21.21에 위치하며, 74개의 엑손으로 구성된다. FRAS1은 소장 및 피부에서 풍부하게 발현된다(도 18). 이 유전자는 세포외 기질 단백질을 코딩하며, 표피 기저막 부착 및 발달시기 동안 기관형성을 조절하는 기능을 가진다(161). FRAS1 유전자에서의 돌연변이는 잠복안구(cryptophthalmos), 합지증(syndactyly) 및 신장결함을 포함하는 다발계통 기형(multisystem malformation)을 나타내는 프레이저 신드롬의 원인이다(162).
sALS-트리오 15의 ADGR3 유전자에서 미스센스 변이인 c.715A>G가 발견되었다. ADGRL3(Adhesion G protein-coupled receptor L3) 유전자는 LPHN3(latrophilin 3)로도 알려져 있다. 이 유전자는 염색체 4q13.1에 위치하며, 27개 엑손으로 구성되고, 뇌, 태반 및 눈에서 발현된다(도 19). 이 유전자는 GPCR(G-protein coupled receptors)의 라트로필린(latrophilin) 서브 패밀리 멤버를 코딩한다. 라트로필린은 7개의 트랜스멤브레인 영역과 더불어 19개의 아미노산 신호전달 펩타이드 및 세린/트레오닌-리치 글리코실화 영역을 포함하는 긴 N-말단 세포외 서열을 갖는다(163). ADGRL3은 뇌에 가장 특이적인 라트로필린이다(163). 최근 연구에 따르면, ADGRL3 유전자가 ADHD(attention-deficit/hyperactivity disorder)와 연관이 있다는 사실이 보고되었다(164). 연구진은 ADGRL3 유전자 변이가 집중력 및 활동성과 관련된 주요 뇌 영역에서 발현되고, ADHD와 연관된 신경회로의 대사에 영향을 미치며, 자극제에 대한 반응과 연관되어 있다는 것을 발견하였다(164).
4. ALS에서 다수의 원인유전자(Oligogenic) 모델
sALS 트리오-12로부터 두 개의 미스센스 신규 변이를 발견하였다: SPAG17 유전자에서 c.2815G>T (p.Ala939Ser) 및 XRCC3 유전자에서 c.598G>A (p.Val200Ile). SPAG17(Sperm associated antigen 17) 유전자는 염색체 1p12에 위치하며 56개 엑손으로 구성된다. SPAG17은 폐에서 풍부하게 발현된다(도 15). SPAG17-결핍 마우스는 비강섬모 및 기관섬모의 운동성을 소실하며, 비강 점액의 정정작용(nasal mucus clearance)의 감소, 폐에 물이 축적되어 나타나는 호흡 장애 및 폐포상피의 파괴, 뇌수종의 발생과 뇌실 팽창, 젖 빨기 실패 및 신생아 사망을 나타낸다. 이러한 결과는 Spag17이 운동섬모의 기능 및 구조에 중요한 역할을 한다는 것을 의미한다(165). 또한, SPAG17 유전자의 변이는 인간의 신장과 관련있다. 최근 골격성장 및 무기질침착(mineralization)은 SPAG17 유전자 기능을 통한 연골세포 및 골아세포의 일차 섬모에 의해 조절된다는 보고가 있었다(166).
XRCC3(X-ray repair complementing defective repair in Chinese hamster cells 3) 유전자는 염색체 14q32.3에 위치하며, 10개의 엑손으로 구성된다. XRCC3은 소장 및 후두에서 많이 발현되며, HR(homologous recombination) 경로와 연관되어 있다(도 16)(167). XRCC3 유전자 돌연변이는 손상 후 회복 매커니즘을 저해하여 염색체의 불안정성 및 다수의 다른 DNA 손상제에 대하여 민감한 양성을 나타낸다(168).
다수의 원인유전자(oligogenic) 모델은 가족성 ALS에서 제안되었으며, 이는 다수의 유전자에서 발생하는 변이가 다양한 양상으로 유전되어 ALS를 유발할 수 있다는 가설이다(60). Blitterswijk 등은 97명의 가족성 ALS 환자들을 대상으로 ANG 유전자와 FUS 및 TARDBP 유전자의 변이를 동시에 가지고 있거나 혹은 C9orf72 반복서열 증가와 함께 TARDBP , SOD1 혹은 FUS 유전자의 변이를 가진 경우를 보고하였다. 그러나 한 환자에서 두 개의 변이가 발견된 경우 하나는 실제 질환을 유발하는 변이가 아닐 가능성을 고려해야 하며, 이러한 관점에서 이 연구 집단에서 발견된 ANG 유전자의 변이는 다형성일 것으로 생각된다(60, 173). 그럼에도 불구하고, ALS 환자가 질병의 발생과 관련있는 유전적 변이에 더해 이차적으로 질환의 진행 혹은 발병 나이 및 증상 발현 여부에 관련이 있는 추가 변이를 가질 가능성을 배제할 수는 없다.
5. 요약 및 결론
본 발명자들은 신규 돌연변이 측정을 통해 신규 ALS 원인 유전자를 찾기 위해 발단자-부모 sALS 트리오에 대하여 전체 엑솜 시퀀싱을 실시하였다. ToppGene 소프트웨어를 이용하여 본 발명에서 발견한 신규 변이에 대한 유전자 및 기존에 알려진 ALS 유전자들과 다층적인 비교 분석을 시행하여 우선순위를 결정하였다. 이러한 분석을 통해 RAPGEF2 유전자를 신규 원인 유전자의 후보로 선정하였다. MALDI-TOF MS를 이용하여 364명의 나이 및 성별이 일치하는 건강한 한국인 대조군에 대하여 RAPGEF2 유전자의 신규 변이 c.4069G>A를 스크리닝하였고, 그 결과 신규 변이는 발견되지 않았다. 또한, 독립된 184명의 ALS 환자에 대한 RAPGEF2 유전자 분석을 실시한 결과, 2명의 환자로부터 2개의 미스센스 변이를 발견하였다; c.1883C>T 및 c.3293G>A. 또한, 100명의 한국인 정상 대조군과 75명의 비-ALS 환자로부터 얻은 자체 질병 대조군 엑솜 데이터에서 3개의 RAPGEF2 변이는 발견되지 않았다.
본 발명은 전체 엑솜 시퀀싱을 통해 한국인 sALS 트리오에서 신규 돌연변이를 발견한 최초의 연구이다. 본 발명의 결과는 ALS의 원인에 대해 더 넓은 지식을 제공한다.
이상으로 본 발명의 특정한 부분을 상세히 기술하였는바, 당업계의 통상의 지식을 가진 자에게 있어서 이러한 구체적인 기술은 단지 바람직한 구현예일 뿐이며, 이에 본 발명의 범위가 제한되는 것이 아닌 점은 명백하다. 따라서, 본 발명의 실질적인 범위는 첨부된 청구항과 그의 등가물에 의하여 정의된다고 할 것이다.
<110> SAMSUNG LIFE PUBLIC WELFARE FOUNDATION
<120> Mutant Genes as Diagnosis Marker for Amyotrophic Lateral
Sclerosis and Diagnosis Method Using the Same
<130> PN150129
<160> 41
<170> KopatentIn 2.0
<210> 1
<211> 6824
<212> RNA
<213> RAPGEF2 mRNA
<400> 1
aaatgatctt gttctcttgg aagactgaga gctgtgtgag gttttctcag tcttgtcata 60
gcctaggatg gttagagttt caatgttata aaaatggaga cgaacactgt tgttcggatt 120
ccttttctgg tctacaagtg tgaagggttt ttaagcttac cagtagtgac actttaagct 180
gcagcttggt tttccctcct cccttttttt ttttcctttt tcttttaatt taatgctgta 240
gagggtgact tgccatcgtg agagattggt acatgatgtg taaattcagt tcagcatatg 300
tttcttcatt atgaaaccac tagcaatccc agctaaccat ggagttatgg gccagcagga 360
gaaacactca cttcctgcag atttcacaaa actgcatctt actgacagtc tccacccaca 420
ggtgacccac gtttcttcta gccattcagg atgtagtatc actagtgatt ctgggagcag 480
cagtctttct gatatctacc aggccacaga aagcgaggct ggtgatatgg acctgagtgg 540
gttgccagaa acagcagtgg attccgaaga cgacgacgat gaagaagaca ttgagagagc 600
atcagatcct ctgatgagca gggacattgt gagagactgc ctagagaagg acccaattga 660
ccggacagat gatgacattg aacaactctt ggaatttatg caccagttgc ctgcttttgc 720
caatatgaca atgtcagtga ggcgagaact ctgtgctgtg atggtgttcg cagtggtgga 780
aagagcaggg accatagtgt taaatgatgg tgaagagctg gactcctggt cagtgattct 840
caatggatct gtggaagtga cttatccaga tggaaaagca gaaatactgt gcatgggaaa 900
tagttttggt gtctctccta ccatggacaa agaatacatg aaaggagtga tgagaacaaa 960
ggtggatgac tgccagtttg tctgcatagc ccagcaagat tactgccgta ttctcaatca 1020
agtagaaaag aacatgcaaa aagttgaaga ggaaggagag attgttatgg tgaaagaaca 1080
ccgagaactt gatcgaactg gaacaagaaa gggacacatt gtcatcaagg gtacctcaga 1140
aaggttaaca atgcatttgg tggaagagca ttcagtagta gatccaacat tcatagaaga 1200
ctttctgttg acctatagga cttttctttc tagcccaatg gaagtgggca aaaagttatt 1260
ggagtggttt aatgacccga gcctcaggga taaggttaca cgggtagtat tattgtgggt 1320
aaataatcac ttcaatgact ttgaaggaga tcctgcaatg actcgatttt tagaagaatt 1380
tgaaaacaat ctggaaagag agaaaatggg tggacaccta aggctgttga atatcgcgtg 1440
tgctgctaaa gcaaaaagaa gattgatgac gttaacaaaa ccatcccgag aagctccttt 1500
gccttttatc ttacttggag gctctgagaa gggatttgga atctttgttg acagtgtaga 1560
ttcaggtagc aaagcaactg aagcaggctt gaaacggggg gatcagatat tagaagtaaa 1620
tggccaaaac tttgaaaaca ttcagctgtc aaaagctatg gaaattctta gaaataacac 1680
acatttatct atcactgtga aaaccaattt atttgtattt aaagaacttc taacaagatt 1740
gtcagaagag aaaagaaatg gtgcccccca ccttcctaaa attggtgaca ttaaaaaggc 1800
cagtcgctac tccattccag atcttgctgt agatgtagaa caggtgatag gacttgaaaa 1860
agtgaacaaa aaaagtaaag ccaacactgt gggaggaagg aacaagctga aaaagatact 1920
cgacaagact cggatcagta tcttgccaca gaaaccatac aatgatattg ggattggtca 1980
gtctcaagat gacagcatag taggattaag gcagacaaag cacatcccaa ctgcattgcc 2040
tgtcagtgga accttatcat ccagtaatcc tgatttattg cagtcacatc atcgcatttt 2100
agacttcagt gctactcctg acttgccaga tcaagtgcta agggttttta aggctgatca 2160
gcaaagccgc tacatcatga tcagtaagga cactacagca aaggaagtgg tcattcaggc 2220
tatcagggag tttgctgtta ctgccacccc ggatcaatat tcactatgtg aggtctctgt 2280
cacacctgag ggagtaatca aacaaagaag acttccagat cagctttcca aacttgcaga 2340
cagaatacaa ctgagtggaa ggtattatct gaaaaacaac atggaaacag aaactctttg 2400
ttcagatgaa gatgctcagg agttgttgag agagagtcaa atttccctcc ttcagctcag 2460
cactgtggaa gttgcaacac agctctctat gcgaaatttt gaactctttc gcaacattga 2520
acctactgaa tatatagatg atttatttaa actcagatca aaaaccagct gtgccaacct 2580
gaagagattt gaagaagtca ttaaccagga aacattttgg gtagcatctg aaattctcag 2640
agaaacaaac cagctgaaga ggatgaagat cattaagcat ttcatcaaga tagcactgca 2700
ctgtagggaa tgcaagaatt ttaactcaat gtttgcaatc atcagtggcc taaacctggc 2760
accagtggca agactgcgaa cgacctggga gaaacttccc aataaatacg aaaaactatt 2820
tcaagatctc caagacctgt ttgatccttc cagaaacatg gcaaaatatc gtaatgttct 2880
caatagtcaa aatctacaac ctcccataat ccctctattc ccagttatca aaaaggatct 2940
caccttcctt cacgaaggaa atgactcaaa agtagacggg ctggtcaatt ttgagaagct 3000
aaggatgatt gcaaaagaaa ttcgtcacgt tggccgaatg gcttcagtga acatggaccc 3060
tgccctcatg ttcaggactc ggaagaagaa atggcggagt ttggggtctc tcagccaggg 3120
tagtacaaat gcaacagtgc tagatgttgc tcagacaggt ggtcataaaa agcgggtacg 3180
tcgtagttcc tttctcaatg ccaaaaagct ttatgaagat gcccaaatgg ctcgaaaagt 3240
gaagcagtac ctttccaatt tggagctaga aatggacgag gagagtcttc agacattatc 3300
tctgcagtgt gagccagcaa ccaacacatt gcctaagaat cctggtgaca aaaagcctgt 3360
caaatccgag acctctccag tagctccaag ggcagggtca caacagaaag ctcagtccct 3420
gccacagccc cagcagcagc caccaccagc acataaaatc aaccagggac tacaggttcc 3480
cgccgtgtcc ctttatcctt cacggaagaa agtgcccgta aaggatctcc caccttttgg 3540
cataaactct ccacaagctt taaaaaaaat tctttctttg tctgaagaag gaagtttgga 3600
acgtcacaag aaacaggctg aagatacaat atcaaatgca tcttcgcagc tttcttctcc 3660
tcctacttct ccacagagtt ctccaaggaa aggctatact ttggctccca gtggtactgt 3720
ggataatttt tcagattctg gtcacagtga aatttcttca cgatccagta ttgttagcaa 3780
ttcgtctttt gactcagtgc cagtctcact gcacgatgag aggcgccaga ggcattctgt 3840
cagcatcgtg gaaacaaacc tagggatggg caggatggag aggcggacca tgattgaacc 3900
tgatcagtat agcttggggt cctatgcacc aatgtccgag ggccgaggct tatatgctac 3960
agctacagta atttcttctc caagcacaga ggaactttcc caggatcagg gggatcgcgc 4020
gtcacttgat gctgctgaca gtggccgtgg gagctggacg tcatgctcaa gtggctccca 4080
tgataatata cagacgatcc agcaccagag aagctgggag actcttccat tcgggcatac 4140
tcactttgat tattcagggg atcctgcagg tttatgggca tcaagcagcc atatggacca 4200
aattatgttt tctgatcata gcacaaagta taacaggcaa aatcaaagta gagagagcct 4260
tgaacaagcc cagtcccgag caagctgggc gtcttccaca ggttactggg gagaagactc 4320
agaaggtgac acaggcacaa taaagcggag gggtggaaag gatgtttcca ttgaagccga 4380
aagcagtagc ctaacgtctg tgactacgga agaaaccaag cctgtcccca tgcctgccca 4440
catagctgtg gcatcaagta ctacaaaggg gctcattgca cgaaaggagg gcaggtatcg 4500
agagcccccg cccacccctc ccggctacat tggaattccc attactgact ttccagaagg 4560
gcactcccat ccagccagga aaccgccgga ctacaacgtg gcccttcaga gatcgcggat 4620
ggtcgcacga tcctccgaca cagctgggcc ttcatccgta cagcagccac atgggcatcc 4680
caccagcagc aggcctgtga acaaacctca gtggcataaa ccgaacgagt ctgacccgcg 4740
cctcgccccc tatcagtccc aagggttttc caccgaggag gatgaagatg aacaagtttc 4800
tgctgtttga ggcacagact tttctggaag cagagcgagc cacctgaaag gagagcacaa 4860
gaagacgtcc tgagcattgg agccttggaa ctcacattct gaggacggtg gaccagtttg 4920
cctccttccc tgccttaaaa gcagcatggg gcttcttctc cccttcttcc tttccccttt 4980
gcatgtgaaa tactgtgaag aaattgccct ggcacttttc agactttgtt gcttgaaatg 5040
cacagtgcag caatcttcga gctcccactg ttgctgcctg ccacatcaca cagtatcatt 5100
ccaaattcca agatcatcac aacaagatga ttcactctgg ctgcacttct caatgcctgg 5160
aaggattttt tttaatcttc cttttagatt tcaatccagt cctagcactt gatctcattg 5220
ggataatgag aaaagctagc cattgaacta cttggggcct ttaacccacc aaggaagaca 5280
aagaaaaaca atgaaatcct ttgagtacag tgcttgtcca cttgtttaca atgtcctcct 5340
tttaaaaaaa aaaaatgagt ttaaagattt tgttcagaga gtaaatatat atccatttaa 5400
tgattacagt attattttaa accttaagta gggttgccag cctggtttct gaaaaaccaa 5460
atatgccgga cagggtgtgg ccacaccaag aagacgggaa gacctggctt gtgaccctgg 5520
cttcccatgt ccttctggtc tcacccgcga agtgccctat cctggaagta tgaaatgtta 5580
gccaattaat accaagacac ctcatctgct ccttccccag tggatggggt tcttctgtaa 5640
aactgtttgc acatggccag gggagggaac taggaccctt gtgtcctgtc tgagccttat 5700
ggaggcagga cggtgtcatt ggcggatgtg tcctgctcca ttgagatgga tggcaaaccc 5760
catttttaag ttatatttct ttgatttttg ttaatttaga ggtgtaggtt ttgttttttg 5820
tttttttgtt tttttttaag agaaacattt ataactggat agcattgcag tgaaagcagc 5880
ttgggatgtt ggagctaatg ccagctgttt atactgctct ttcaagacag cctcccttta 5940
ttgaattggc attagggaat aaacaagcct ttaaacgtga taaaagatca aaaacctggt 6000
tagacatgcc agcctttgca aggcaggtta gtcaccaaag actaacctcc aagtggcttt 6060
atggacgctg catatagaga aggcctaagt gtagcaacca tctgctcaca gctgctatta 6120
accctataat gactgaaatg acccctccac tctatttttg tgttgttttg cacagactcc 6180
ggaaaagtga aggctgccaa tctgagtagt actcaaatgt gaggaactgc tggtcttgga 6240
ttttttttcc attaaattca gctgatcata ttgatcagta gataaacgta aatagcttca 6300
aattttaaaa gtggaattgc agtgtttttt cactgtatca aacaatgtca gtgctttatt 6360
taataattct cttctgtatc atggcatttg tctacttgct tattacattg tcaattatgc 6420
atttgtaatt ttacatgtaa tatgcattat ttgccagttt tattatatag gctatggacc 6480
tcatgtgcat atagaaagac agaaatctag ctctaccaca agttgcacaa atgttatcta 6540
agcattaagt aattgtagaa cataggactg ctaatctcag ttcgctctgt gatgtcaagt 6600
gcagaatgta caattaactg gtgatttcct catacttttg atactacttg tacctgtatg 6660
tcttttagaa agacattggt ggagtctgta tcccttttgt atttttaata caataattgt 6720
acatattggt tatatttttg ttgaagatgg tagaaatgta ctatgtttat gcttctacat 6780
ccagtttgta caagctggaa aataaataaa tataacataa aaaa 6824
<210> 2
<211> 4322
<212> RNA
<213> IFT80 mRNA
<400> 2
gcgcatgcgc gaactcctgg cgggacctac gcggtagaag tttctactaa gtgaaaagga 60
agagcgaggg attcttttct ctgtggtcta cagcagcagc actattatta aaaatatttg 120
gaaagacaac ctggcaagtt ttgaaaaaga tttttttaaa aacggtaggg ttccgctcac 180
agtgggaggc ggggctcagt ggtccagaaa cgcctcttca gaagagggcg ggctcgccga 240
gaggcggggt ctcgggccca ctcggatgac gtgccgcgta gaagtatcgc gggaagagga 300
agggagcgta actcttagaa gtcactatgg tgacggggag gtaccaggta tttgagagca 360
atcgccaccg ctttcctgga acttgagtaa atacaatcaa gtggcatctt aaatttttgc 420
tggaagtgga gtcatgagac taaagatatc tcttttaaaa gaaccaaagc atcaagaatt 480
agtaagctgt gtgggctgga ctactgctga agagctgtat tcatgtagtg atgatcacca 540
gatagtgaag tggaacttgt taaccagtga aacaactcaa atagtaaagc ttcctgatga 600
tatttaccct attgattttc actggtttcc aaaaagtttg ggtgtaaaga aacaaaccca 660
ggcagaaagc tttgtcctca caagttctga tggtaaattt catctgattt ccaagttagg 720
aagagtggaa aaaagtgtag aagctcactg tggagcagta cttgcaggaa gatggaatta 780
tgaaggaaca gcattagtta cagttggaga agatggacaa ataaaaattt ggtcaaagac 840
tgggatgctt agatcaactt tagctcagca aggaacacca gtgtattcag tagcgtgggg 900
ccctgattca gaaaaggttc tttatacagc aggcaagcag ctaatcatta aacctcttca 960
accaaatgct aaagttttgc agtggaaagc tcatgatggc attattttaa aagtagattg 1020
gaactcggtc aatgatctta ttttatctgc tggtgaagac tgtaaatata aggtatggga 1080
tagttacggc cgcccactgt acaattcaca acctcatgag catcccatta cttcagttgc 1140
ctgggctcca gatggagaat tatttgctgt tggatcgttt catactttac gcttgtgtga 1200
taaaactggg tggtcatatg cattagaaaa acccaacact ggcagcatat ttaatattgc 1260
atggtctatc gatggcactc agattgctgg agcctgtgga aatggacatg tcgtttttgc 1320
acatgtggtg gaacaacatt gggagtggaa aaattttcaa gtaacattaa cgaaaagaag 1380
agccatgcag gttcgtaatg ttcttaatga tgcagtggat ttactggaat tccgtgatag 1440
agtcattaaa gcatctttga actatgcaca cttagttgtt tcaacgtctc ttcaatgtta 1500
cgtgttctcc acgaagaact ggaacacacc aattatattt gatctcaaag aaggaactgt 1560
tagtttgatt ctgcaggcag aaagacattt tcttcttgta gatggtagta gtatctattt 1620
atattcatat gaagggcgct ttatttcatc tccaaaattt cctggaatga gaacagatat 1680
tctgaatgca cagactgtgt ctttgagtaa tgataccata gcaataagag acaaagctga 1740
tgaaaaaata atcttcctct ttgaggcatc aaccggaaag ccgttaggtg atggaaagtt 1800
tctttctcat aagaatgaaa tcttggaaat tgctctggat caaaaaggac ttaccaatga 1860
tagaaaaatt gctttcattg ataaaaatag agatctctgt atcacttctg tgaaacgatt 1920
tgggaaggaa gaacaaatta tcaagcttgg aacaatggtg catactttgg catggaacga 1980
tacatgcaat atcctttgtg gacttcaaga tactcgattt atagtgtggt attaccccaa 2040
tacagtttat gtggacagag acattttgcc taaaacatta tatgaaaggg atgcaagtga 2100
atttagtaaa aatccccata ttgtgagttt tgttggaaat caagtaacta ttagaagagc 2160
tgatggctcc ctggttcaca tcagcataac accatatcct gctattctcc atgaatatgt 2220
aagcagttca aaatgggaag atgctgtgag actttgtcgc tttgttaagg agcaaaccat 2280
gtgggcttgt ctagctgcta tggcagttgc taatcgagat atgactactg cagaaatagc 2340
ctatgcagca attggtgaaa ttgataaggt tcagtacatc aattctataa aaaatcttcc 2400
atctaaagaa tcaaaaatgg cccacatact actgtttagt gggaacatac aggaggctga 2460
aatagtactt cttcaggctg gccttgttta tcaagcaatc cagatcaata ttaatctcta 2520
caactgggaa agggcactgg aattggctgt aaaatacaaa acacatgttg atacagttct 2580
tgcttaccgt caaaagtttt tggagacatt tggtaaacag gaaactaata aacgatactt 2640
gcattatgca gaaggtctcc aaatagattg ggagaaaatc aaagccaaaa ttgagatgga 2700
aattacaaaa gaaagagagc aatcatcaag cagccaatcc agcaagagta taggtttaaa 2760
gccctaaatg ccatgcgtat ctttaagaaa ttttatcttt tgaaacacgt tctgattaac 2820
caagggtaag catgttttgg ttgctaaaga aaaaagcata atctttaacc gagtataagt 2880
acttgctgtg tatttagtgt aaaagtacat gcagaaagat gaaacacaaa gtaattgatg 2940
tatttctatc ttttatattt tttagtccaa taattagcaa aatattacta tgtacttaag 3000
agatacctgt gtagtgtcga ttatatgtca gttttttgcc cattacttca tccctaaatc 3060
ttcagcatga acaaatatta atgtcgataa taaaacattg gactctttga aatgtatgtt 3120
accattaatt tctatttgac ctctaaattg taaaatgcct ccaaaagttt atttatagaa 3180
caaaaataca tgaggatgga tttgtacaaa tgtataaaat gccactattt atacaccaag 3240
ttcatagcag cattactgga atagcaaaag atggaaacag ctcaagtgtc tatcatgaat 3300
ggataaacaa atgtgctata atacatacaa tggaatatta tttagcttta aaaaggaatg 3360
aaattctgat aaatactacc tcaggataaa ccttgaaaac actatgctaa gtgaaataag 3420
ccagacacaa aaggccaaat atgatgccac ttttatgagg taccagcata ggcaagttca 3480
cagaaacaga aaggagaata gtggttgcca gggactgcag ggaggaggaa atggggggtg 3540
gggttattgt ttaacgagta catagtttct gtttgggatg aacaaattct ggaaatggat 3600
agcgatgatg gttgctcaac attttgaatg ttaatgccac taaattgtac ccataaaaat 3660
ggttaaaatg gtaaattttg ttatgtatat tttatcataa tttaaaaaat atatctagaa 3720
tgggcaagaa ggattctcct cattcctctc ttgacttgag aatgatcagt caataggccc 3780
tgaagtctga atttgtgaaa atttccttgg gtgacaaact tgtttgatta ctctatttag 3840
tgtatcccaa agttattacc acataatctt ttaaacaata aaacaaatac cccttagaaa 3900
gtcttctgca aacccatttc tgaaaatggt acattatagg gtgggtatag atgcatagat 3960
atgggattat gtatgatata tatatatata cacacacaca caaagggata gagagattac 4020
ctctcttaac ccccatttta attactatgt ctaggttttt taaataaaaa tcttttcttt 4080
ttaacatgtt tcttttcttt tccggaatat tggaatattc tgttcttgat ccagatgaaa 4140
tctgattgag cagtgtactt acaagttgta ctgtgtatgt gtttcctata ttgttatatt 4200
tcaataagaa gcttaaaatg tttaaaaata aatggttaaa aggttttatg ttatgtatat 4260
tttaccacaa taaatgcaaa aaataaaaag tctgtgttct aaacaaaaaa aaaaaaaaaa 4320
aa 4322
<210> 3
<211> 9224
<212> RNA
<213> SSH2 mRNA
<400> 3
gacaagaatg ccctgcccgg aacaacccag cagcgcctag atggctttgg tcacggtcca 60
gcggtcacct acccccagca ccacctccag cccctgcgcc tcggaggcag acagtgggga 120
ggaagaatgc cggtcacagc ccaggagcat cagcgagagc tttctaactg tcaaaggtgc 180
tgcccttttt ctaccacggg gaaatggctc atccacacca agaatcagcc acagacggaa 240
caagcatgca ggcgatctcc aacagcatct ccaagcaatg ttcattttac tccgcccaga 300
agacaacatc aggctggctg taagactgga aagtacttac cagaatcgaa cacgctatat 360
ggtagtggtt tcaactaatg gtagacaaga cactgaagaa agcatcgtcc taggaatgga 420
tttctcctct aatgacagta gcacttgtac catgggctta gttttgcctc tctggagcga 480
cacgctaatt catttggatg gtgatggtgg gttcagtgta tcgacggata acagagttca 540
catattcaaa cctgtatctg tgcaggcaat gtggtctgca ctacagagct tacacaaggc 600
ttgtgaagtc gccagagcgc ataactacta cccaggcagc ctatttctca cttgggtgag 660
ttattatgag agccatatca actcagatca atcctcagtc aatgaatgga atgcaatgca 720
agatgtacag tcccaccggc ccgactctcc agctctcttc accgacatac ctactgaacg 780
tgaacgaaca gaaaggctaa ttaaaaccaa attaagggag atcatgatgc agaaggattt 840
ggagaatatt acatccaaag agataagaac agagttggaa atgcaaatgg tgtgcaactt 900
gcgggaattc aaggaattta tagacaatga aatgatagtg atccttggtc aaatggatag 960
ccctacacag atatttgagc atgtgttcct gggctcagaa tggaatgcct ccaacttaga 1020
ggacttacag aaccgagggg tacggtatat cttgaatgtc actcgagaga tagataactt 1080
cttcccagga gtctttgagt atcataacat tcgggtatat gatgaagagg caacggatct 1140
cctggcgtac tggaatgaca cttacaaatt catctctaaa gcaaagaaac atggatctaa 1200
atgccttgtg cactgcaaaa tgggggtgag tcgctcagcc tccaccgtga ttgcctatgc 1260
aatgaaggaa tatggctgga atctggaccg agcctatgac tatgtgaaag aaagacgaac 1320
ggtaaccaag cccaacccaa gcttcatgag acaactggaa gagtatcagg ggatcttgct 1380
ggcaagcaaa cagcggcata acaaactatg gagatctcat tcagatagtg acctctcaga 1440
ccaccacgaa cccatctgca aacctgggct agaactcaac aagaaggata tcaccacctc 1500
agcagaccag attgctgagg tgaagaccat ggagagtcac ccacccatac ctcctgtctt 1560
tgtggaacat atggtcccac aagatgcaaa tcagaaaggc ctgtgtacca aagaaagaat 1620
gatctgcttg gagtttactt ctagggaatt tcatgctgga cagattgagg atgaattaaa 1680
cttaaatgac atcaatggat gctcatcagg gtgttgtctg aatgaatcaa aatttcctct 1740
tgacaattgc catgcatcca aagccttaat tcagcctgga catgtcccag aaatggccaa 1800
caagtttcca gacttaacag tggaagattt ggagacagat gcactgaaag cagacatgaa 1860
tgtccaccta ctgcctatgg aagaattgac atctccactg aaagaccccc ccatgtcccc 1920
tgatcctgag tcaccaagcc cccaacccag ttgccagact gaaatctcag atttcagtac 1980
agatcgcatt gactttttta gtgccctaga gaagtttgtg gagctctccc aagaaacccg 2040
gtcacgatct ttttcccatt caaggatgga ggaactgggt ggaggaagga atgagagctg 2100
tcgactgtca gtggtagaag tagccccttc caaagtgaca gctgatgacc agagaagcag 2160
ctctttgagt aatactcccc atgcatcaga agaatcttca atggatgagg aacagtcaaa 2220
ggcaatttca gaactggtca gcccagacat cttcatgcag tctcactcgg aaaatgcaat 2280
ttcagtcaaa gaaattgtca ctgaaattga gtccatcagt caaggagttg ggcagattca 2340
actgaaagga gacatcttac ccaacccatg ccatacacca aagaagaaca gcatccatga 2400
gctgctcctt gagagggccc agactccaga gaacaaacct ggacatatgg agcaagatga 2460
ggactcctgc acagcccagc ctgaactagc caaagactca gggatgtgca acccagaagg 2520
ctgcctaacc acacactcat ctatagcaga cttggaagaa ggggaaccag ctgaggggga 2580
acaagagctc cagggctcag ggatgcaccc aggtgccaag tggtaccctg ggtctgtgag 2640
gcgagccacc ttggagttcg aagagcgctt acggcaggag caagagcatc atggtgctgc 2700
cccaacatgt acctcattgt ccactcgtaa gaattcaaag aatgattctt ctgtggcaga 2760
cctagcacca aaagggaaaa gtgatgaagc ccccccagaa cattcatttg tcctcaagga 2820
accagaaatg agcaaaggca aagggaaata cagtgggtct gaggctggct cactgtccca 2880
ttctgagcag aatgccactg ttccagctcc cagggtgctg gagtttgacc acttgccaga 2940
tcctcaggag ggcccagggt cagatactgg aacacagcag gaaggagtcc tgaaggatct 3000
gaggactgtg attccatacc aggagtctga aacacaagca gtccctcttc cccttcccaa 3060
gagggtagaa atcattgaat atacccacat agttacatca cccaatcaca ctgggccagg 3120
gagtgaaata gccaccagtg agaagagcgg agagcaaggg ctgaggaaag tgaacatgga 3180
aaaatctgtc actgtgctct gcacactgga tgaaaatcta aacaggactc tggaccccaa 3240
ccaggtttct ctgcaccccc aagtgctacc tctgcctcat tcttcctccc ctgagcacaa 3300
cagacccact gaccatccaa cctccatcct gagtagccct gaagacagag gcagcagcct 3360
gtccacagcc ctggagacag cagcaccttt tgtcagtcat acaacccatt tactgtctgc 3420
cagtttggat tacctgcatc cccagactat ggttcacctg gagggcttca cagagcagag 3480
cagcactaca gatgagccct ctgcagaaca ggttagctgg gaagaaagtc aggagagccc 3540
tctctccagt ggcagtgagg tgccatataa ggactcccag ctaagtagcg cagacctaag 3600
tttaattagc aaacttggtg acaacactgg ggagttacag gagaaaatgg acccattgcc 3660
tgtagcctgt cgactcccac atagctctag tagtgaaaac ataaagagtc tcagccacag 3720
ccccggtgtg gtgaaggagc gtgctaaaga aatcgagtct cgagtggttt tccaggcagg 3780
gctcaccaaa ccatcccaaa tgaggcgctc agcttctctc gccaaattag gttacttgga 3840
cctctgtaaa gactgcttac cagagaggga gcctgcctcc tgtgaatccc ctcatctcaa 3900
actgcttcag cctttcctca gaacagactc aggcatgcac gcgatggagg accaagagtc 3960
cctagaaaac ccaggtgccc cccacaaccc agagcccacc aagtcttttg tagaacaact 4020
cacaacaaca gagtgtattg tgcagagcaa gccagtggag aggccccttg tgcagtatgc 4080
caaagaattt ggttctagtc agcagtattt gctccccagg gcaggacttg aattgactag 4140
ttctgaagga ggccttcccg tgctacagac ccagggactg cagtgtgcat gcccagctcc 4200
agggctggcc gtggcacccc gtcagcaaca cggcagaact caccccctta ggagactgaa 4260
aaaggcaaat gacaaaaaac ggacaaccaa ccccttctat aataccatgt gattctgagc 4320
ctacacatgt gactttctag aagaaatgtt tgtaaaaggg gcaggtgtaa tatgtaagga 4380
acatgcactt tattggttaa ttttataata ttttggtcat tttactgttt ctggtgcatg 4440
cagggtttgg gtgtttttca gtgtgtatgt gtgtgtatat gtaaggggaa agagagattg 4500
atctggatgg caagaccgtt tatcattttt tatttaaaaa aatcaaacct caaaaaagtc 4560
attttcagag aacaccttta tcaaaggcaa attgctgttt ttcagtcagc tgccacctgc 4620
ttctcatttt gccctctgag aaaaggcatg gtttcttaat tgagggaagg aagcagattc 4680
ggaggggtgg agataaagct ggggattgga gatgttcccc tgcctttgtg atgatggttt 4740
ggtttccaga cctgaggcat cgaatgggct aaaggtcagc cagaagtcag agggctctca 4800
gccttcatcc agccgcagcc ctttagagtt cctgaaggag gcaggttccg ctttgcttta 4860
aaagagggtc ttccggtgtt ccagagtgta tcgttacagt aagacatgat aatggccggc 4920
tctgcaaatt tatcatatag tttttttccc aagaaaatta tttttgaaat taaaacagga 4980
ccccaaatga aatccaagtg gtcttctgta gaggaaagca tgataagagg aggaagacat 5040
aaagttgggg gtggagaggc tgctgcccag aaactgctgg gttggtggga tccacacaga 5100
tgggcatctt ggctctccct gccagaaaaa tgtgctctgc agtgtcctcc caactgaaaa 5160
caacagtgac atgtttgaaa agcagcaatc gaaagtcagt gtgttcttgt aaaatgaata 5220
tgtatgtagg gttttaaccc ttccattact tgaataattc tttgggcctt ctgagtttaa 5280
tggccatatt ttcttccagt ttattttcct tccccatgct gttgtcccca tgctgcctat 5340
ttttttaaat ttcatagatt atatttgaat tgttacatat gtttaacatc cattgaatgc 5400
aacgttttat ttttggtatt atcactgtta acactttttt ttccttttcc tggaaggttt 5460
gtcatttctc taaagtttgt acacagtatt tatgtacata atattgtcac tgtcttagtg 5520
tcttgttcat gttgtagggt aattttgatt tattcttttt aagaaggagt agagttgcaa 5580
ctggaaaaca cagacaccag aaatgaaagt gttgggtgtt gataggaatc tgtacaatat 5640
gttgatggtg gctgtagttg tttaaatgga gacttccaat caccagctcc tgccaaatta 5700
tgcattagta actttttcct cagagacacc cctaaaggct cccattaggt cacagcgtga 5760
ctgaaagctg atttctctgt gagactgaaa tcccagaaca ttgtttgcca gtatctcaac 5820
cacagccagg aagtatatgt gagttgccca gagtggaagc tcctagtaga ggctgaaggc 5880
cacaggggag gcctcagcca ggggcaagtg cccacagtga ctccatttag gatgctgtcg 5940
ttttgctact gttgtggaga tccttaacgc agcagcgcct gtcataaaca agcctcttgt 6000
agcttcttac agaaaacaga tttagtctag catgaaacac ctctgcatct cattgaaact 6060
gaagaggctt gcagatttgc tttcgttgat gtccacgtta ctgaggattg actgagtata 6120
gactggagac aggtttttgg cttatcacag cactgaggaa aatacaaatg cacagactgt 6180
cagcatgatg tcagaggcca gagtttggtg ggggcagatg gcagggcgac ccaaaagatg 6240
cagaaaaggt agactggggc cactgggtct taagaggagc tgtgaagttg tgtggaagcc 6300
aaggctgggt ctgacatccc tgccaggaag caggttggac agaaaccact tgctaaaagc 6360
gtctctatgg tgcagtgatt atgtgtaccc tgtgctgttg ctcagtagtc tccttgaatg 6420
ttcaagtatc tcatccactc agttttgtga ttcctggata tttgtgtgtt gtaaagtgtt 6480
ttgttaggtg gtatgaacca atgtgaggag gcttgagaca gggttatgga tttccagagc 6540
tcttccatgt agaataccct gccttcttga agcagttcca ccaccaatat gatggggaag 6600
ggcaggaact tatggcaggg tggggagagg gtttgcctgg aagttaagag agtggcatcc 6660
acttgtggta accccttacg atgatgacat cccacacact aagaggtaca agcaggacca 6720
aagttttgga ctgttccctc ttctcccctc cactgtgttt aatgttcact cactgcatta 6780
aataacaaca aagatgggac aaaacccact aatactgtgg ggaaaaaaaa ttttcaagag 6840
cagaggaaag tctttctgcc tttttataat tacttttttt atcatttaat ttacctgcct 6900
aaataaacat cttctacaga atatctgtca ttcaaccatg ccaaggagtt tgtgccagcc 6960
ttttcagact cccagaattg ggtgttcctg ggttatttac atagctgagc agtgtccagg 7020
ggaggtgcgc agtgaactgt caaggacttt ccagactgtc ttctcttcag acttttataa 7080
tctccagtgg catctttccc ttttcttttg ttcatgacct gacctgaagc agcagatttg 7140
atagactggc aaagatgaat aggaaaaact ttgactcttg cccagtgcct gcctgcctct 7200
ctctctctcc tctctctctc tctcttttta aaccaccata gactctcact tattttggag 7260
gagtgtatgt gcatgtgtac acatatgtac atatataaaa acagttgatg ttttggtgta 7320
tggggtaaaa gccccaggag catacagaac ttgagctgaa cctggtcagt agaaagggaa 7380
accccaaccc tttcttgatt tttggagaca cccaggacta atggatactg tagtagacat 7440
gtagtactat agtaccgtaa tattcatctc tcctcatttt agttgccttt cagattctaa 7500
atgtttggga tcattcctat catcttagtc tcttcaggat ctttagtatt ttcctggttc 7560
tgaggaggct tgagacaggg ttatggattt ccttgttctg tgtctttatc cctactgata 7620
gttcctcttt ctcattttgc aaactaccca gagctccaag gacagcctga agatctcagt 7680
gcctcaggct ctgaggtact ctgctcacag gccccagaca gatgctgttg ggtaaactca 7740
aagcttccta tgagaagctt ctgagatgta gcaggtcaca gaagtgttca cctgtttcat 7800
ctgaggattt cagttctgaa gtgatctagg catgtttggt aaaaatgttt ttgtgagagt 7860
tcttttttta agaaagcatt atgcaaaaag tcacttttaa gggcatttaa aaatttttaa 7920
gtaaagccat tctttggctt ttttggacta tttgtggata ctttgtttac attttgaata 7980
ttaaaatgtg catcatcttg tcggccatgc agtcctgcag gcatcagtgc cctggctgtc 8040
ctgtgagtcc tcatgcagag cagggccatc atggtcagcc cttgtgagta agtgggtata 8100
cgctgaagct gacttccgtc tgtgtcctgc cctcccatcc agcactctct atggaaatag 8160
ttgtcatttc ctcagtgatg gtgtgtctta tagtgatggt tgtaatggtg aatggctagt 8220
gtcattttgt ttaattttgt tttgcttttt gatggtggat aagatgaaat tttagctgtt 8280
tcagcatcaa tccaacttaa aagcatcttg gactttgttt tcccttccaa actaaaagat 8340
caaggcatgt attagacaca agcatatttg ctgcctcaac tcctctgaca cccatattag 8400
gaaaaggcct gccaccaaag caggaagctg cacactccta acccttctcc cagggtgtgg 8460
ggtcccttga cgtcatgaag agctattgca aggtgcttct gtacttttcc agcctggaaa 8520
tggagggtga ctggccctgg ctcctgctat gagaagataa ccagcctcat tttctcagtg 8580
ccccagaggt ctaggatagg atttctaaac tggaatcatc cttaatcacc ttgaagatcc 8640
cttaagaggc atttgactgg tgctgccgtc tgtgtcctca aagcaatgct ggtggcagcg 8700
tcctgtgtac acatgcagag ctaataccca aactaaaaac tgggtaactg gccctgaagt 8760
gcttcccaat cagtaagccc acagggaaat gtttgatttt tatgttctgt tggattttgg 8820
tttgcttggc atatctaaag gtgcctttac ttttcttttt tttttttttt ctttctgctt 8880
tgttttgtag gacttgttct aacatggaaa acaagtccag aagactctcc tctgactgtt 8940
acctttgccc caagccaccc caaactttta tgctcatgtt ttattaaagc aggtgctccc 9000
tggaatctct gggacatttt tgaggcattt gaagcagaat atagagtggt ctcatctcct 9060
tccttaatct tcctggtggt tgggatgttc cacttgtatc atagattttt ttattacaga 9120
tatgctccac tgtttttaaa tgtgaacttg tgcgcaaatg tgcagattca atgttcttgt 9180
tacagattga ataaattttt attttgaaga tgaaaaaaaa aaaa 9224
<210> 4
<211> 2620
<212> RNA
<213> XRCC3 mRNA
<400> 4
ctattggagg agaaggccga gaggagcagg acggcgggaa gaggagtgcg gaacccgcgg 60
gaggatgtgc acagagggcc caggaggagc ctcaggagcc ggactgccgt tggccaaccg 120
agtccccagg gagacactta agggaaatta aactgcagag tgcaagagat gcctcagtca 180
agtcagccaa aaacacgcgg gtcatcccca agccccagag agtgacagag ccccgatgac 240
acggacacct cggctgctgt cacttccctg gttcgggcct cccacaggct ttgaattgaa 300
ggcgagtgcc tcagaatttg catccattgt tctgtctttc ctgggaagtt attcatcctg 360
gtggccagcc caccgacaaa atggatttgg atctactgga cctgaatccc agaattattg 420
ctgcaattaa gaaagccaaa ctgaaatcgg taaaggaggt tttacacttt tctggaccag 480
acttgaagag actgaccaac ctctccagcc ccgaggtctg gcacttgctg agaacggcct 540
ccttacactt gcggggaagc agcatcctta cagcactgca gctgcaccag cagaaggagc 600
ggttccccac gcagcaccag cgcctgagcc tgggctgccc ggtgctggac gcgctgctcc 660
gcggtggcct gcccctggac ggcatcactg agctggccgg acgcagctcg gcagggaaga 720
cccagctggc gctgcagctc tgcctggctg tgcagttccc gcggcagcac ggaggcctgg 780
aggctggagc cgtctacatc tgcacggaag acgccttccc gcacaagcgc ctgcagcagc 840
tcatggccca gcagccgcgg ctgcgcactg acgttccagg agagctgctt cagaagctcc 900
gatttggcag ccagatcttc atcgagcacg tggccgatgt ggacaccttg ttggagtgtg 960
tgaataagaa ggtccccgta ctgctgtctc ggggcatggc tcgcctggtg gtcatcgact 1020
cggtggcagc cccattccgc tgtgaatttg acagccaggc ctccgccccc agggccaggc 1080
atctgcagtc cctgggggcc acgctgcgtg agctgagcag tgccttccag agccctgtgc 1140
tgtgcatcaa ccaggtgaca gaggccatgg aggagcaggg cgcagcacac gggccgctgg 1200
ggttctggga cgaacgtgtt tccccagccc ttggcataac ctgggctaac cagctcctgg 1260
tgagactgct ggctgaccgg ctccgcgagg aagaggctgc cctcggctgc ccagcccgga 1320
ccctgcgggt gctctctgcc ccccacctgc ccccctcctc ctgttcctac acgatcagtg 1380
ccgaaggggt gcgagggaca cctgggaccc agtcccactg acacggtggc ggctgcacaa 1440
cagccctgcc tgagaagccc cgacacacgg ggctcgggcc tttaaaacgc gtctgcctgg 1500
gccgtggcac agctgggagc ctggttcaga cacagctctt ccagggcagc ggctccactt 1560
tctcatccga agatggtggc cacagactga cccccatctg agctgggggg atgttctgcc 1620
tctccctggg tctggggaca ggcccgcttg ctgggtacct ggtccccact gctgagctgg 1680
cccttgggga gaggtgattc tcagggctgg agcctggggt gtcctacagt gactccctgg 1740
gagccgcctg cttcttctct ccacatggaa gcccaactgg ggttgcgtct gaggcctgcc 1800
ccctgggctg gggcctcaga ccccctcagc cttgggaccg tgcccacgag ggtctcccct 1860
cctgcacaca gggcagtcct tactccccca ccactcaggc cacagtgggg ctgcaggcag 1920
gcggctcctc ctcacccacc tctgggtcct tggctcccgg gggccccacc tcggcacaca 1980
ctgtgcccca caaaacttca gtgtggtaca aggtggagaa agcatatccc accaacctcc 2040
agtgtcaggg tccaggagag cctgggggtg gggggactgc cttgtctcta gtagtgtggc 2100
ctgtgccagc accacagccg gtcagaggag cgcaggcagc gcagggctgg cacgtgacag 2160
gctcgtcagc cacctgggaa cacagttctg ggcaaagagg atccgaggtt gagaggaagg 2220
agggtcccgg tgtatcctgg ccctgggggt ctgggcgtcc agctcagccc tggcctggct 2280
gggtggtatt ctggtaggga tatggcagga ctcctggcag ggccacctgc aggaccctgt 2340
cctgcagtcc cacactgtgc agacccagtc ccacactgtg gccaggcctt acatctggct 2400
ggaaagcaga gcctcctggg aacacatctg gctgcacagg ctgaaatatc cacccagcag 2460
gcagagtggc gtggcctccc catgggcaca gtggtgaccc ccttgattcc caccgtacaa 2520
ccccctccac cccccactca gtgcctccac atgctgcctg gcacagacca ggcctttgac 2580
aaataaatgt tcaatggatg caaaaaaaaa aaaaaaaaaa 2620
<210> 5
<211> 7125
<212> RNA
<213> SPAG17 mRNA
<400> 5
gtggtagcgg ggacgcttag gcagggcctg cgcccagttt agaggccaat gcttctcccg 60
tcctttgcat ggcacccaag aaggagaaag gaggaactgt gaacaccagt tctaagatat 120
gggaaccctc gctcatagct gcacagttca atcagaacga ttggcaggcc tccattgctt 180
ttgtggttgg gaaccagatt gaagatgatc ttctcatcca agcccttacc gtggctgtcc 240
aggtccctca gcgtaaactc ttcagtatgg tgtcgtggca agacattctc cagcagatta 300
atgaaataaa tacacttgtt ggatctgctt catctaaaaa ggcaaaaaaa cctgtaggtg 360
gtaatgctcc tttatattat gaggtgttaa cggcagcaaa agcaattatg gatagtggag 420
agaaattaac cttaccactg atagggaaac tcttgaaatt tcaacttctc cagattaaat 480
ttaaggacca acagcgacgg gaaaatgaaa agaaggtaat agaagacaaa cctaagttag 540
aaaaggataa agggaaagca aaatctccca aggagaaaaa ggctccaagt gccaagcctg 600
ccaaaggaaa gggaaaggat cagcctgagg caaatgcacc agtgaaaaag accacccagt 660
taaagcggag aggagaagac gaccacacca atcgttacat tgacgatgag ccagatgatg 720
gtgcccaaca ttacattata gttgtgggct ttaacaatcc tcagctatta gcaattatgg 780
ctgagcttgg cattcctata accagcgtga ttaaaatatc ttcagagaat tatgaacctc 840
tgcagacaca cctggcagca gttaaccagc agcaggaagt tcttcttcag tcagaagatc 900
tagaagcaga aaaattgaag aaagaaaatg ccataaaaga gcttaaaact ttctggaagt 960
acttggaacc agtcctgaat aatgagaaac ctgaaacaaa tctctttgat gttgctcgac 1020
ttgagtacat ggtcaaagca gctgattttc cttctgactg gtcagatggt gagatgatgc 1080
tgaaattggg cactgatatt tttgaaaata ttgcctgctt gatgtatgac atcctggatt 1140
ggaaaaggca gcaccagcac tatttggaaa gcatgcagct tattaatgtt ccacaagtgg 1200
ttaatgagaa acctgtatta gaagccatgc caacttcaga ggctccacaa cctgctgtac 1260
cagctcctgg aaagaagaaa gcacagtatg aagaaccgca agctccacca ccagtgactt 1320
cagtcatcac aactgaagta gacatgagat attacaatta tttgctgaat ccaattcgag 1380
aggaattcat ttctgtgccc ctgatactgc attgtatgct ggaacaggtt gttgcaactg 1440
aagaagatct cgtcccaccc agtctgcggg agccatcccc cagagcagac gggctagacc 1500
acagaatcgc agctcacatt gtgtcccttc tgccctcact ctgtctctca gagagggaga 1560
aaaagaatct tcatgacata tttttatctg aagaagaaaa tgaaagcaaa gcagtgccca 1620
aaggccccct cctactgaac tatcatgatg cacacgccca caagaagtac gcactacagg 1680
accaaaagaa ttttgatcca gttcaaattg agcaggagat gcagtccaag ttgccactgt 1740
gggaatttct tcaattccct ctacccccac catggaacaa cactaaacgt ctagctacaa 1800
ttcatgagct tatgcacttt tgtacgagtg atgtcttgag ctggaatgaa gtagaacgag 1860
ccttcaaggt gtttactttt gagagcctga agctctctga ggttgatgaa aaagggaaac 1920
tgaaaccttc tgggatgatg tgtgggtcag attctgaaat gttcaacata ccgtgggaca 1980
accctgccag atttgctaaa cagataaggc agcaatatgt catgaaaatg aatactcaag 2040
aggccaagca gaaagcagat attaaaatca aagacagaac actatttgtg gatcagaatt 2100
tgtcaatgtc tgtgcaagat aatgaaagca accgagaacc ttcagatcct agtcagtgtg 2160
atgctaacaa tatgaagcat tctgacttga ataatctcaa actctcagtc cctgataata 2220
gacagctgtt agagcaggag agcatcatga aggctcagcc ccaacatgag tctctggagc 2280
agaccacaaa caatgagatc aaagatgatg cagtcacaaa ggctgattct catgaaaaga 2340
aacccaagaa gatgatggtg gaagcagatt tagaggacat aaagaaaaca cagcagcgca 2400
gtctaatgga ctggagtttt actgaacatt ttaaaccgaa agtactgctt caggtccttc 2460
aagaagccca taagcaatat aggtgtgttg attcttacta ccacacccaa gacaactctt 2520
tacttttagt ctttcacaat ccaatgaata gacaacgttt gcattgtgaa tattggaaca 2580
ttgctctcca ctccaatgtt ggattcagga attatttgga acttgttgca aaatctattc 2640
aagattggat tacaaaagaa gaagctatat atcaggaatc taaaatgaat gagaaaatca 2700
tcaggaccag agctgagctg gaattgaaat cttctgctaa tgccaaactt acttctgcta 2760
gcaaaatttt ttccattaaa gaatctaaaa gtaacaaagg aatcagcaaa acagagatat 2820
cagatcaaga aaaagaaaaa gagaaggaaa agattccttt cattttagaa ggctctctca 2880
aggcatggaa agaagagcaa catcgattag cagaagagga gcgcttaagg gaagaaaaga 2940
aagcagagaa gaagggtaaa gaagctggta aaaagaaagg caaggataac gcagagaaag 3000
aggatagtag gtctttgaag aaaaaatcac cttacaagga gaaatctaaa gaagaacaag 3060
tcaagatcca agaagtaaca gaagagtccc cccaccaacc agaacctaag ataacttacc 3120
cgtttcacgg atacaatatg ggaaatatac ccactcaaat ctcagggtca aattactacc 3180
tgtatccttc tgatgggggg cagattgaag tggaaaagac aatgtttgaa aaaggcccaa 3240
cttttatcaa agtgagagtg gtaaaggaca accacaattt tatgattcat ttaaatgacc 3300
ctaaggaaat tgtgaaaaag gaagagaaag gggattatta tttagaagag gaagaagaag 3360
gagatgagga acaaagtctt gaaacggaag tatcagatgc aaagaataaa gctttcagca 3420
agtttggatc tttttctgcc accttagaaa atggaatctg cctctcgata agttactatg 3480
gatcaaatgg aatggcacca gaagataagg atcctgattt agaaacaata ttgaatatcc 3540
cttcagcact cactccaaca gtggttcctg ttatagtgac cgttcctcaa agcaaagcta 3600
aagggaaaat aaaaggcaaa gaaaaaccca aagaatccct taaagaagaa gaacacccaa 3660
aagaagaaga gaaaaaggaa gaagaagtag aaccagaacc tgttttacaa gagactttgg 3720
atgttcccac cttccagagc ctaaatgtgt cttgccccag tgggctcctg ttgactttca 3780
ttggacaaga atctacaggt caatatgtta tagatgagga acccacctgg gacatcatgg 3840
tccgtcagag ctacccccag agggtgaagc actatgagtt ctataaaacg gtgatgccac 3900
ccgcagagca ggaggcttca agggttatca ccagtcaagg cactgttgtc aaatatatgt 3960
tggatggatc cacacagatt ctctttgcag atggtgctgt gagcaggagt cccaattcag 4020
gtcttatttg tcctccttct gaaatgccag caacgcctca cagtggagat ttgatggact 4080
ctatttctca gcagaaatca gaaacgatac catctgagat taccaacaca aagaaaggaa 4140
aaagtcacaa aagtcagtca tcaatggccc ataagggtga aatccatgac cctcctccag 4200
aggcagttca aactgtaact cctgtggagg ttcacatagg cacctggttt acaaccacac 4260
ctgaaggaaa tcggatcggc accaaaggat tagaaagaat agcagacttg accccattgt 4320
tatcctttca ggccacagat cctgtcaatg gaacggttat gacaactcga gaagacaaag 4380
ttgtcatagt tgaaaggaaa gatggtactc ggatagtgga tcatgctgat ggtaccagaa 4440
tcacaacctt ttatcaagtt tatgaagatc aaattattct gccagatgat caagaaacaa 4500
ccgagggtcc tcggactgtc accaggcagg tgaagtgtat gcgggtagaa agctcacgct 4560
atgccactgt tatcgccaac tgtgaggaca gtagctgctg tgccaccttt ggagatggaa 4620
caactattat tgcaaagcca cagggaacat accaggtgtt acctccaaac acaggctctc 4680
tttatattga caaggattgt tcagctgtgt actgccatga gtcaagcagt aatatatact 4740
atccttttca aaagcgtgag cagctgcgag ctggcaggta catcatgagg catacttcag 4800
aggttatctg tgaggttctg gatcctgagg gaaacacttt tcaggtcatg gctgatggta 4860
gcatatcaac tatattacct gaaaaaaaat tggaagatga tttaaatgag aaaactgagg 4920
gctatgatag tctgtcctct atgcaccttg aaaagaatca tcagcaaatc tatggtgaac 4980
atgtccccag gttttttgtt atgtatgctg atggatcagg aatggaactt cttcgagaca 5040
gtgacataga agaatatcta tctttggcat ataaagaatc aaatactgtt gttctccaag 5100
agccagtgca ggaacagcca ggcaccctaa ccatcacagt ccttcgccct ttccatgaag 5160
catcaccatg gcaagtaaaa aaggaagata caattgtccc tcctaatctc cggtcaaggt 5220
catgggaaac atttccctca gttgagaaaa aaactccagg acctccgttt ggtactcaga 5280
tttggaaagg cctttgcatt gagtccaaac agctagtgag tgccccgggt gccatactca 5340
agagccccag tgtgctacag atgcgccaat tcattcagca tgaggtcata aagaatgagg 5400
tgaaactgag gctgcaggtt tcccttaagg attacataaa ctatattcta aagaaagaag 5460
atgagctgca ggaaatgatg gttaaagatt ccagaactga ggaggagaga ggcaatgctg 5520
ctgatctcct caagctggtt atgtctttcc ctaaaatgga ggaaactaca aaaagtcatg 5580
ttactgaagt tgcagctcac ctaactgatt tattcaagca gtctttggct acgcctccaa 5640
aatgcccacc agacacattt ggtaaagatt tctttgaaaa gacatggaga cacacagcat 5700
cctcaaaacg ctggaaagaa aagatagaca aaacgaggaa ggaaattgag acaacacaga 5760
attacctaat ggatattaag aaccgcataa taccaccctt ttttaaatct gaattgaacc 5820
agttatatca gtctcagtat aatcacctgg acagtctttc caaaaaactg ccttctttta 5880
caaagaaaaa tgaagatgca aacgaaacag ctgttcaaga tacatctgat cttaatctag 5940
atttcaagcc acataaggtt tcagaacaga aatcctcaag tgtgcctagt cttccaaaac 6000
cagagatttc tgcagataag aaggatttca ctgctcagaa ccaaactgaa aatttaacaa 6060
aatctcctga agaagcagaa tcttatgagc ccgtgaaaat tccaacccag tccttgctgc 6120
aggatgttgc gggacaaaca agaaaagaaa aagtgaagtt gcctcattat ttgctgagtt 6180
ccaagcctaa gtctcaacct cttgcaaagg tgcaagattc tgttggagga aaagtgaaca 6240
catcctctgt tgcatctgct gccattaata atgcaaagtc atcccttttt gggttccatc 6300
ttctcccatc atcagtcaag tttggagtgc ttaaggaagg acatacctat gccacagttg 6360
taaagctcaa gaatgttgga gtggacttct gcaggtttaa agtaaagcag cccccaccca 6420
gcacaggact gaaagtgact tacaaacctg gacctgtggc agctggtatg cagacagaac 6480
tgaatataga gttatttgcc acagctgttg gagaggatgg ggccaaggga tcagcacaca 6540
tctctcacaa tatcgagatt atgacagagc atgaggttct gttcctacct gtggaagcaa 6600
ctgttttaac aagcagcaat tatgataaac gaccaaaaga ctttccccag ggaaaagaaa 6660
atccaatggt ccagagaact tctacaattt attcctccac acttggagtc ttcatgtctc 6720
gtaaagtttc tccacattag tttcttctcg gtacaactca atagcctcca taatcctctc 6780
agcctacaga ggatgagaaa ggaaagaagt catcacaaca tactccatca tcccaggaca 6840
ctgaaactgg aagaactgac cagaaatttg ccaaatgaaa tagcttcaat ctgtttaata 6900
aagacgtgcg aatagagtgc caaaaagcat ttaaagacat ttttggtttt cttatttttt 6960
aatgtacagg gaagagactg agtgtcatgg actcaggtgg gatgatatct agacactctg 7020
aatagggcag gtcccaggaa cacctgaaag gagcacatat tgatcaaaga gattcaggac 7080
tactcccatc tttggttaca agagaaggaa acaggttata atccc 7125
<210> 6
<211> 4138
<212> RNA
<213> PLEKHM2 mRNA
<400> 6
gcctccttcc ccgccggccg cgctccggag cctccgggcc gcggtggagc gagggcccag 60
gcgaggcgag ggccgggcgg cgggcgccgg gccccgcggc cggcacgacg gagcccccgt 120
acggccggcg gcagcggttg gcggcggccc ccggcccccg gcgcgggaag cggcggcggg 180
gcggcggcgg cggtggcggt ggcggtggcg gcgacggtgg cagcgccatg gagccggggg 240
aggtgaagga ccggatcctg gagaacatct cgctgtcggt gaagaagttg cagagctatt 300
ttgctgcatg tgaggatgag atccctgcca tccggaacca tgacaaggtc ctacagcgtc 360
tgtgtgagca cctggaccac gccctgctgt acggactgca agacctctcc tctggctact 420
gggtgctcgt ggtgcatttt actcggagag aggccatcaa gcagatcgag gtgctgcagc 480
acgtggccac caacctgggg cgcagccgtg cctggctgta cctggccctc aacgagaact 540
ccttggagag ctacctgcgg ttgttccagg agaacctggg cctgctgcat aagtactacg 600
tcaagaatgc cctggtctgc agccacgatc acctgacgct cttcctgacc ttggtgtccg 660
ggctagagtt cattcgtttc gagctggatc tggatgcccc ttacctagac ctggccccct 720
acatgcccga ctactacaaa cctcagtacc tgctggactt tgaagaccgc cttcccagct 780
cggtccacgg ctcagacagt ctgtccctca actctttcaa ctccgtcacc tccaccaacc 840
tggagtggga tgacagtgcg attgccccat ctagtgagga ttatgatttt ggagatgtgt 900
ttccagcagt gccgtctgta cccagcacag actgggaaga tggagacctc acagacacgg 960
tcagtggtcc ccgctccaca gcctccgacc tgaccagcag caaggcctcc accaggagcc 1020
ccacccagcg ccagaacccc ttcaacgagg agccggcaga gactgtgtcc tcctctgaca 1080
ccacccccgt gcacaccacc tctcaggaga aggaggaggc ccaggccctg gacccgccgg 1140
atgcctgcac ggagctcgag gtcatcaggg tcaccaagaa gaagaaaatt ggcaagaaga 1200
aaaagagcag atcagatgag gaggcaagtc cactccaccc cgcctgcagc cagaagaaat 1260
gtgccaagca gggggacggt gacagccgca acggcagccc aagccttggg cgggactcgc 1320
cagacactat gcttgcctcc ccccaggagg agggagaggg gccgagcagc accacggaga 1380
gcagcgagcg ctccgagccg ggcctgctga tccctgagat gaaggacacc tccatggagc 1440
gcttggggca gcccctgagc aaggttatcg accagctcaa cgggcagctg gaccccagca 1500
cctggtgctc ccgtgctgag cccccagacc agtcctttcg gaccggctct cccggggatg 1560
ccccggagag gccgccgctt tgcgacttta gtgaggggct ttcagcccca atggacttct 1620
accgctttac cgtcgagagt ccaagcactg ttacatcagg tggcggccac catgaccctg 1680
cagggcttgg ccaaccgctg catgttccta gtagccctga ggctgctggc caagaagaag 1740
agggaggagg aggagaggga cagacgcctc ggcccctaga ggataccacg agggaggctc 1800
aggagctgga ggcccagctg tccctggtca gggaggggcc tgtgtctgag ccagagcctg 1860
ggacccagga ggttctctgc cagctcaagc gagaccagcc cagcccgtgt ctgagtagcg 1920
ctgaggattc tggggtggat gagggacagg ggagcccttc ggagatggtc cattcctcgg 1980
agttcagagt agacaacaat cacctgctcc tgctcatgat ccacgtgttc cgagaaaacg 2040
aagagcagct gttcaaaatg atccggatga gcaccgggca catggagggc aacctgcagc 2100
tgctgtacgt gctgctcaca gactgctatg tctacctgct ccggaaaggg gccacagaga 2160
agccatacct ggtggaagag gccgtttctt acaatgaact tgactatgtg tcggttggcc 2220
ttgaccagca gacggtgaag ctggtgtgca ccaaccgcag gaagcagttt ctgctggaca 2280
cggctgatgt ggcgctggct gagttctttt tggcttcttt gaagtcagcc atgatcaaag 2340
gctgtcgaga acctccctac cccagcatcc tgacggatgc caccatggag aagctggcac 2400
tggccaaatt tgtggcccaa gaatcgaagt gtgaggcatc tgctgtcacc gtgcgcttct 2460
acggccttgt gcactgggag gaccccacag acgagtccct gggccccacg ccctgccact 2520
gctcaccccc cgagggcacc atcaccaaag aaggcatgct gcactacaag gcgggcacct 2580
cctacctggg caaggaacac tggaagacgt gcttcgtggt gctcagcaac gggatcctct 2640
accagtaccc ggaccgcacc gacgtcatcc ctctgctctc ggtgaacatg gggggggagc 2700
agtgcggtgg ctgccggaga gccaacacca cggatcggcc ccacgccttc caggtcattc 2760
tctccgaccg gccctgcctg gagctaagtg ccgagagcga ggccgagatg gccgagtgga 2820
tgcagcatct ctgccaggct gtgtccaaag gggtcatccc ccagggcgta gctcccagcc 2880
cctgcatacc ctgctgcctg gtcctcacgg atgaccgcct ctttacgtgc catgaggatt 2940
gccagaccag cttcttccgc tctttgggca cagccaagct gggcgacatc agcgccgtct 3000
ccaccgagcc gggcaaggag tactgcgtct tggagttctc ccaggacagc cagcagctcc 3060
tcccgccctg ggtcatctac ctgagctgca cttctgaact ggaccgattg ctgtctgcac 3120
tgaactctgg gtggaaaacc atctatcagg tggacctccc ccacacggcg atccaggaag 3180
cctccaacaa gaagaaattc gaggatgcct tgagcctcat ccacagcgcc tggcagcgga 3240
gcgacagtct ctgccgcggc cgagcctccc gagacccctg gtgctgaggc agagctggtt 3300
ggcgtccctg gtgggcagga aaggaaggca cgccagccgg caggcacact gtcacggctg 3360
ttgtcatgct gtcgggagcc tacagtccac ccctgccctg ggcggcagaa ccaccgagtg 3420
tggcttaaga cagggtccct ccactccagg gatccagatc aggtgcccgg cacccctggg 3480
catcctgccc gacaggtagc gaatggaggt cgctgggggc agagggtccg agccctgtgg 3540
gctctgcgga tgcacgccct cctcccgggc ctccgcctca gtctgcagaa tttctgccga 3600
gtggcaccga gaacaccatc catctaagga cgaacaaaag aaccaggagg gcgggacccc 3660
cctcttcctc tcctgggttg ggggctgggg ccctgagtgc ccagccatcc ttgttcgtgt 3720
ttgaacactc tcctggccac gtggggaagc gggaacacgg ggtgtctgcg catgtttcct 3780
cctcctagct ccatcactgc gcacacagct gcctgcctcg ccagatgcag gggggcgggc 3840
agccctccct ggctgccagg aggctctgca tgcccacagt cctgccctgc ctgtcccctc 3900
aacccggcag tgcctgtagc accgaggagc aaagggggtg gatggggggc ttggagaagg 3960
gcggagccca ccagcctggc atccatgttg acatcttctg actgtcccct gcttggctgg 4020
agccaggccc ttccctagag tttcgtcaag agcctcctgg ggaaggggtc aggtggtttg 4080
ggttttgttt tttaaaataa aatagacatg ttatattgcc aaaaaaaaaa aaaaaaaa 4138
<210> 7
<211> 1314
<212> RNA
<213> CLEC4C mRNA
<400> 7
cagtgattct cgtgcctcag cctcctgagt agccgaaatt acagacgtgt gccaccatgc 60
ttggctaatt ttttggattt ttagtagaga tggggtttca ctatgttggc caggctagtc 120
ttgaactcct ggcctgaagc aatccgccca cctcagcctc ccaaagtgct gagattatag 180
gcacgagcca ctacacctgg ccacaaaatt ctttaaagaa gccaatccca tcctccctca 240
agagccaagg ggccacctca ccctcttgtt acagcagatc ctgcctccca cagtcaccct 300
gctcccaagt gcaacctctg tctgaccctg catggtgtgc ggtgccctcc tgcctcaggc 360
cgcgaagaag gatctaaggg cttggcttgt ttgaaagaac cacaccccga aagtaacatc 420
tttggagaaa gtgatacaag agcttctgca cccacctgat agaggaagtc caaagggtgt 480
gcgcacacac aatggtgcct gaagaagagc ctcaagaccg agagaaagga ctctggtggt 540
tccagttgaa ggtctggtcc atggcagtcg tatccatctt gctcctcagt gtctgtttca 600
ctgtgagttc tgtggtgcct cacaatttta tgtatagcaa aactgtcaag aggctgtcca 660
agttacgaga gtatcaacag tatcatccaa gcctgacctg cgtcatggaa ggaaaggaca 720
tagaagattg gagctgctgc ccaacccctt ggacttcatt tcagtctagt tgctacttta 780
tttctactgg gatgcaatct tggactaaga gtcaaaagaa ctgttctgtg atgggggctg 840
atctggtggt gatcaacacc agggaagaac aggatttcat cattcagaat ctgaaaagaa 900
attcttctta ttttctgggg ctgtcagatc cagggggtcg gcgacattgg caatgggttg 960
accagacacc atacaatgaa aatgtcacat tctggcactc aggtgaaccc aataaccttg 1020
atgagcgttg tgcgataata aatttccgtt cttcagaaga atggggctgg aatgacattc 1080
actgtcatgt acctcagaag tcaatttgca agatgaagaa gatctacata taaatgaaat 1140
attctccctg gaaatgtgtt tgggttggca tccaccgttg tagaaagcta aattgatttt 1200
ttaatttatg tgtaagtttt gtacaaggaa tgcccctaaa atgtttcagc aggctgtcac 1260
ctattacact tatgatataa tccattcaca cattcattta ttcatttatt catt 1314
<210> 8
<211> 15643
<212> RNA
<213> FRAS1 mRNA
<400> 8
aactttaaaa agctgcttcg gacaaaccag agccaggatt tccactgtcg gggacccggg 60
atcggaaggg tctagcccga gggaaatgct ggaagatccc atcggccagt gaccagcaac 120
tttccggcga gattttgacg cggagaactg tgctctgcct cctcttattc tcccaaagct 180
cacgttggcg tcctgccttg cgggggaact cggcgcgctc tctgcctgag cagcgagtga 240
attgaacccc agcccgctcc ggcgcctccg ggctgatgag tgtcgctctc cgcccgtcca 300
tctctttttc ccggaggtaa aggcccgcgg tcccccacct tcagtgcgcc cgggttccaa 360
gcgccggagc cagcgttttg gcggagccgc ttcttggatg ctgaaggctg ggctcctcca 420
tcgtgggtgc cgaggcggcg atgggtgtcc tcaaagtgtg gctcgggctg gccctagcgt 480
tggcggaatt tgcagtattg cctcatcatt ccgaaggtgc ttgtgtctat caggattcct 540
tgttggcgga tgccacaatt tggaagcccg attcatgcca gagctgccgt tgccatggtg 600
atattgttat ctgcaaacct gctgtttgca gaaaccctca atgtgccttt gagaagggag 660
aagtgcttca aatagctgcc aaccaatgct gtcctgagtg tgttttgagg actccaggat 720
cttgccatca tgaaaagaaa atccatgagc atgggacaga atgggcctct tctccatgta 780
gtgtgtgctc ttgcaatcat ggggaagtcc gatgtacccc ccaaccatgc ccaccgctgt 840
catgtggaca ccaggagctg gcattcatcc ctgaaggaag ctgctgccca gtttgtgtgg 900
gccttgggaa accctgttcc tatgaaggcc atgtgtttca ggatggggag gactggcggc 960
tgagccggtg tgccaaatgt ctgtgtagaa atggggttgc ccagtgcttc acagctcagt 1020
gtcagcctct attttgtaac caggatgaga ctgtagtccg agtccctgga aaatgttgcc 1080
cgcagtgctc tgcaagatcc tgctctgcag ctggccaagt atacgagcat ggtgagcagt 1140
ggagcgaaaa tgcctgcacc acgtgtatat gtgaccgggg tgaggtcagg tgtcacaagc 1200
aggcctgcct gcccctgaga tgcggaaagg gtcagagcag ggctcggcgt catgggcaat 1260
gctgtgagga atgtgtgtct cctgccggga gctgctccta tgatggagtt gtgcggtacc 1320
aggacgaaat gtggaagggc tcggcctgtg agttctgcat gtgtgatcat ggccaagtga 1380
cctgccagac tggagagtgt gccaaagtgg agtgtgcccg ggatgaagaa ttaattcact 1440
tagatggaaa gtgttgtcct gaatgcattt caaggaatgg ttattgtgtt tatgaagaaa 1500
ctggagaatt tatgtcatca aatgctagtg aagttaaacg tattccagag ggagagaagt 1560
gggaagatgg cccttgcaag gtgtgtgagt gccgaggggc tcaggtaact tgctacgagc 1620
cctcttgccc accatgtcca gtgggcacac tggccttaga ggtgaaggga cagtgctgtc 1680
cagactgcac atcagttcat tgccatccag attgtttgac atgctctcag tctccagacc 1740
actgtgacct ctgccaagat cctaccaagt tactgcagaa tggatggtgt gtgcacagct 1800
gtggactggg tttttaccaa gctggcagtc tctgtttagc ctgccagccc cagtgctcca 1860
cgtgtaccag tgggctggag tgctcatcct gccagcctcc cctgctgatg cggcacgggc 1920
agtgtgtgcc tacctgtggg gacggcttct accaagatcg ccattcctgt gcagtctgcc 1980
atgagtcctg tgcaggttgc tggggcccaa cggagaagca ctgcttggcc tgcagagatc 2040
ccctccacgt gctgagagat ggcggctgtg agagcagctg tggaaaaggc ttctacaaca 2100
ggcagggcac ctgtagcgct tgtgaccaat cctgtgacag ttgtggcccc agtagcccca 2160
ggtgtcttac ctgtactgag aagacagtgc tgcatgatgg gaaatgcatg tctgaatgcc 2220
ctggcgggta ctatgctgat gccactggca ggtgcaaagt ttgtcataac tcatgtgcca 2280
gctgctctgg gcccacaccc tctcactgta cagcctgcag cccccccaag gctctgcgtc 2340
aaggccactg tctgccccgc tgtggagagg gtttctactc tgaccatgga gtctgcaaag 2400
cctgtcactc ctcctgcctg gcttgtatgg gtcccgcacc ctctcactgt actgggtgta 2460
agaagccaga ggaaggactg caagtggagc agctgtctga cgtgggcatc ccctctggcg 2520
agtgtctagc ccagtgtaga gcccattttt acttggagag cactggcata tgtgaagctt 2580
gccaccagtc ctgtttcaga tgtgcaggga aaagcccaca taactgcaca gactgtgggc 2640
cttcccatgt gctgttggat gggcagtgcc tctcccagtg cccagatggc tactttcacc 2700
aggaaggtag ttgcacagag tgtcacccaa cctgcaggca gtgtcatggg ccgttggagt 2760
ctgactgcat ctcctgttac cctcacatct ctcttaccaa tggtaactgc aggaccagct 2820
gcagggaaga gcagttcctc aacctcgtgg gatactgtgc tgactgccat cacctgtgcc 2880
agcactgtgc agctgatctc cacaacactg ggagcatctg cctcaggtgc cagaatgccc 2940
actacctgct gctcggggac cactgtgttc ctgactgccc ttcaggatac tatgcagaga 3000
gaggagcttg taaaaaatgc cactcctcct gcagaacctg ccagggcaga ggacctttct 3060
cctgctcctc atgtgacacc aacctcgtgc tgtcccacac tggcacctgc agcaccacct 3120
gcttccctgg gcactatctt gatgacaatc atgtttgcca gccatgcaac acacactgtg 3180
gaagctgtga ttcacaggcc agctgtacct cctgccgaga tccaaacaag gttctgctct 3240
ttggggaatg tcaatacgag agctgcgccc cacagtacta tcttgacttc tccaccaaca 3300
cgtgcaaaga gtgtgattgg agctgcagtg catgcagtgg gcccctgaaa acagactgcc 3360
tgcagtgcat ggatggctat gttctccagg atggggcctg cgtggagcag tgcttgtcat 3420
cattttacca ggactcgggc ctctgcaaga actgtgacag ctactgtctc cagtgccaag 3480
gtccccatga gtgtacccgc tgcaaagggc catttctcct cttggaagcc cagtgtgtcc 3540
aggaatgtgg gaaggggtac tttgcagatc atgcaaagca caaatgcaca gcctgccctc 3600
aggggtgctt gcagtgcagc cacagggacc gttgtcacct ctgtgaccat gggttctttc 3660
tgaagagtgg cctctgtgtt tacaactgtg ttcctggctt ttctgtccac acctctaatg 3720
aaacatgttc tggcaaaata cacaccccta gtcttcatgt gaatggttcc ctgatcctcc 3780
caattggttc aataaagcca ctggattttt ccctcctgaa tgtccaagac caggagggta 3840
gggtcgaaga tctcctattt catgttgtga gcactcccac caatggtcag ctagtgctct 3900
caagaaatgg aaaagaggtt cagctggaca aggctggccg ttttagctgg aaagatgtga 3960
acgagaagaa agtgcgtttt gtgcacagca aagaaaaact caggaaaggt taccttttcc 4020
tgaaaattag tgaccagcag ttcttctctg agccacagct gatcaacata caagcatttt 4080
caacacaggc cccctatgtg ctgagaaatg aagttctcca cattagcaga ggagagaggg 4140
caaccatcac cacccagatg cttgacatcc gagatgatga caacccacag gatgtggtca 4200
ttgaaataat cgatcctcca cttcatggcc aattgcttca gacacttcag tccccggcaa 4260
cccctatcta tcaattccag ctggatgaac tctctagagg ccttctccac tatgctcatg 4320
atggttcaga cagcacatcc gatgttgcag tcttgcaggc caatgatgga cactccttcc 4380
ataatatact gttccaagtg aagaccgtgc ctcagaatga caggggtctt cagcttgtgg 4440
ctaattcgat ggtgtgggtt ccagaagggg ggatgctgca gatcaccaac agaatcttac 4500
aggccgaggc tcctggtgcc agtgctgaag aaatcatcta caagattaca caagactacc 4560
cccagtttgg ggaggtggtc cttctagtga atatgcctgc agacagccct gcagatgaag 4620
ggcagcacct gcctgatggg aggacagcta cccccaccag caccttcacc cagcaggaca 4680
tcaatgaagg catcgtatgg tacaggcact caggagcccc agcccagagc gactccttcc 4740
gcttcgaggt gtccagtgcc tccaatgccc agacccgcct ggagagccac atgttcaaca 4800
tcgcgatctt accacagaca cctgaagcac ctaaagtgtc tctggaagca tctctccata 4860
tgactgctag agaagatggc ctgactgtta ttcagcctca ttccctctcc ttcataaact 4920
ctgagaagcc aagtggaaag attgtctaca acatcactct acctctgcat ccaaatcaag 4980
gtatcatcga gcaccgggac caccctcact ctcctatccg gtatttcacg caagaggata 5040
ttaaccaggg caaagtcatg taccgccctc ccccggcagc accccacctc caggagctca 5100
tggccttctc gttcgctggt ctcccagaat cagtgaaatt ccacttcaca gtttcagatg 5160
gagaacacac aagtccggag atggtcctca ccattcactt acttcccagt gatcagcaac 5220
tgccagtgtt ccaggtcaca gctccacggc tggcggtcag cccaggaggc agcacttctg 5280
taggacttca ggtggtagta agagatgctg agacagcgcc caaagaactc ttctttgagc 5340
ttcggagacc tccacagcat ggtgtgcttc ttaagcatac agctgagttc cgaaggccga 5400
tggccacagg tgacactttc acctatgagg atgttgagaa aaatgctcta cagtatatac 5460
atgatggttc ctctacccgg gaagacagca tggagatctc agtcacagat ggcctcacag 5520
tgacaatgct ggaggtgaga gtagaggtgt ccctgtcaga agaccgaggg cctcgactgg 5580
ctgctggctc ctctctgagc attactgttg ccagtaaaag cacagccata atcactaggt 5640
cacaccttgc ttacgtggat gattcttccc ccgacccaga gatctggatt cagttaaatt 5700
atctgccctc atatggtact ctcttaagaa tctcaggatc tgaggtggaa gagctctcag 5760
aagtttccaa tttcacaatg gaagacatca ataacaagaa aatcagatac tcagctgtgt 5820
ttgaaactga tggtcatctg gttactgata gcttctattt ctctgtctct gacatggacc 5880
acaaccatct ggataatcag atatttacca tcatgatcac tcctgctgaa aatccacctc 5940
cagtcattgc ttttgctgac cttatcacgg ttgatgaggg agggagagca ccactctcat 6000
ttcaccattt ttttgctact gatgatgatg acaacctcca gagagatgcc atcattaaac 6060
taagtgctct gcccaaatat ggctgcattg agaacacagg aacaggtgat cgttttggcc 6120
ctgaaactgc cagtgaccta gaggcatcat ttcctattca agacgtcctg gaaaactaca 6180
tttactactt tcagagtgtt catgaaagca ttgagccaac ccatgatatt tttagttttt 6240
atgtgagtga tggaaccagt cgttcagaaa ttcacagcat caatatcacc attgagagga 6300
agaacgatga gcctcccagg atgaccttgc agcccctcag agtgcagctg agctcgggag 6360
tggtgataag caattcttct ttgagcctgc aagacctgga caccccagat aatgagctca 6420
tttttgtatt gacaaaaaag cctgaccacg gtcatgtact ctggaggcaa actgcttctg 6480
agcctctgga gaatgggaga gttttagtcc agggctcaac cttcacctac caggatatcc 6540
tagctgggct ggttgggtat gtgcctagtg tccctggcat ggtcgtggat gagttccagt 6600
tctccctcac tgatggcctc cacgtggaca cagggaggat gaagatctac acagaactgc 6660
ctgcaagtga cacacctcac ttggctataa accaaggcct acagctctca gcagggtctg 6720
tagcacgcat cacagaacag cacttgaaag tgacagatat tgactcagat gaccatcagg 6780
ttatgtacat catgaaggaa gatcctggtg cagggcgcct gcagatgatg aagcatggca 6840
acctggagca aatttctatt aaaggcccca tccgaagttt cacccaggca gacattagcc 6900
aaggccacgt agaatatagt catggaacag gagaacctgg agggagcttt gcttttaaat 6960
ttgatgtggt tgatggagaa ggcaacagat tgattgacaa gtcattttcc atcagcattc 7020
tagaagacaa atccccacca gtcatcacca ccaataaagg actggtcttg gatgaaaact 7080
cagtgaagaa aatcaccacc ctgcagctgt ctgccactga ccaggacagt gggcctacag 7140
aattgatcta cagaatcacc agacagcccc agctgggcca cttggaacat gcagcatcac 7200
caggtatcca gattagttcc tttactcaag ctgatctgac ttcacgaaat gttcagtatg 7260
tccattctag tgaggctgag aaacattcag atgccttcag ctttacactg tctgatggag 7320
tcagtgaggt gactcagact ttccatatca ctcttcaccc tgtcgatgat tcgctgcccg 7380
tcgtacagaa cttaggaatg cgggtgcagg agggcatgag gaagaccatc acagagtttg 7440
agcttaaggc ggtggatgct gacacagagg ccgagtctgt cacattcacc atcgtgcagc 7500
ctccacgcca tggcaccatc gagcgaacca gcaatgggca gcatttccac ctcacctcca 7560
ccttcaccat gaaagatatc taccagaacc gggtcagcta cagccatgac ggcagtaact 7620
ccctcaagga ccggttcacc ttcactgttt ctgatgggac aaaccccttc tttatcattg 7680
aggaaggggg aaaagagatt atgacagcag cacctcagcc gttccgagta gacatcctcc 7740
cggtagatga tggcacgcct agaattgtca ccaacctggg actccagtgg ctggaataca 7800
tggatggcaa ggcaaccaac ctgatcacca agaaggaact gctgaccatg gacccagaca 7860
ccgaggacgc gcagcttgtc tatgagataa cgacgggccc taagcatggc tttgtggaga 7920
acaagctgca gcctggcaga gctgctgcca ctttcaccca ggaggatgtg aacttggggt 7980
tgattcgtta tgtgttgcac aaggagaaga tccgtgagat gatggatagt tttcagtttc 8040
tggtgaaaga cagtaaaccc aatgtggtca gcgacaatgt cttccatatc cagtggtcac 8100
tcatcagctt taaatatacc agctacaatg tcagtgagaa ggcagggtct gtcagtgtca 8160
cggtgcagag gactgggaac ctgaaccaat atgccatcgt cctgtgtcgc accgagcaag 8220
gcaccgccag ctccagctcc agggtcagct cccaacctgg gcaacaggac tatgtagagt 8280
atgctggcca ggtccagttt gatgagcgag aggacaccaa gtcctgcacc attgtcatca 8340
acgatgatga cgtgtttgaa aatgttgaga gtttcactgt ggagctcagc atgccagctt 8400
atgccctgtt aggggaattc acccaggcga aggtcattat caacgatacc gaggatgaac 8460
ccacattaga gtttgacaag aagatctact gggttaacga gagcgctggt tttctgtttg 8520
cacctattga aagaaaagga gatgcaagca gcattgtatc tgcaatttgc tacacagtcc 8580
ctaagtcagc tatgggaagt agcctctatg ctctagaatc aggctctgat tttaaatcta 8640
gagggatgtc tgccgcgagt cgtgtgatat tcgggcctgg tgtgaccatg tccacctgtg 8700
atgtcatgct tattgatgac agcgagtatg aagaggaaga agagtttgag attgccttgg 8760
cagatgcctc tgacaatgcc cgcattggaa gggtggcgac agccaaggtg ctcattagtg 8820
gtcccaacga tgcctcgact gtgtccctgg gcaacacggc tttcactgtc agtgaggacg 8880
caggcacagt aaagattcca gttatccgcc atggtactga cctctctact ttcgcatctg 8940
tctggtgtgc aacgcggccc tcagacccag cttctgccac accaggagtt gactacgttc 9000
ccagctctcg gaaggtggaa tttgggcctg gtgtcattga acagtattgc accttgacta 9060
tcttggatga cactcagtat ccggtaattg aaggactgga gacatttgtg gttttcctca 9120
gctcagcaca aggagccgaa ctgaccaaac ccttccaggc agtcattgca attaatgaca 9180
cattccaaga tgtgcccagc atgcagtttg ccaaggattt gctcctagtg aaggagaagg 9240
agggtgtcct gcatgtccct atcactcgga gcggagacct gagctatgag tcatcagtga 9300
ggtgctatac tcagagccat tccgctcagg tcatggagga ctttgaggag agacaaaatg 9360
cagactcttc acggattaca tttctcaaag gggacaaagt gaagaactgt acggtctata 9420
tccacgatga ctccatgttt gagccagagg aacagttcag ggtctacctc ggccttcctc 9480
ttggaaacca ctggagtgga gctagaattg gaaagaataa catggccacc atcaccatat 9540
ccaatgatga agatgccccc accattgagt ttgaagaagc tgcataccaa gtccgggaac 9600
ccgcaggccc agatgccatt gcgattctga acatcaaggt gatccgcaga ggggatcaga 9660
acaggacctc caaggttcgc tgcagcacgc gggatggctc tgcccagtct ggtgtggatt 9720
attacccaaa gagccgagtc ttgaagttca gtcccggtgt ggatcatatc ttttttaaag 9780
ttgagatcct gtccaatgaa gaccgggaat ggcatgaatc tttctcacta gtccttggcc 9840
cagatgaccc agtggaagca gttcttgggg atgtgactac tgccacggtg acaattctag 9900
accaggaggc agcagggagc ctcatattgc cagcaccacc cattgtggtc acacttgctg 9960
actatgacca tgtggaagaa gttaccaagg aaggagtcaa gaaatccccc tccccaggct 10020
acccactggt ctgtgtcacc ccctgcgacc ctcatttccc cagatacgct gtcatgaagg 10080
agcgctgcag tgaggccggc atcaaccaga catctgtgca gttcagctgg gaagtggctg 10140
cccccactga tggcaatggg gcccggtctc cctttgaaac catcactgac aacacaccat 10200
tcaccagtgt caaccacatg gtcctggaca gcatttactt cagccggagg ttccatgtgc 10260
gttgtgtggc caaggctgtg gacaaggtgg gccatgtggg gaccccctta aggagcaaca 10320
ttgttaccat tggaacagac agtgctatct gccacacacc agtggtggct gggacatcca 10380
gaggcttcca ggctcagtcc ttcatcgcaa ccttgaaata cctggatgtc aaacataagg 10440
agcatccgaa cagaatccac atttcggtgc agatcccaca ccaggatgga atgctgcccc 10500
ttatctccac catgccgttg cacaacttac attttctact gtctgagtcc atctacagac 10560
accagcacgt ctgctccaat ttagttacca cctatgacct gagaggcatc tcagaggcag 10620
ggttcctgga tgatgtggtc tatgatagca ctgccctggg gcctggctac gatcgcccct 10680
tccagtttga ccccagcgtg cgagagccga agaccatcca gctctacaaa cacctgaacc 10740
tgaagagctg cgtgtggacc tttgatgctt attatgacat gactgagctg attgacgtct 10800
gtgggggctc tgtaaccgct gacttccagg tgagggactc tgcccagtcc ttcttgacag 10860
tgcacgtgcc tctatatgtg tcctacatct atgtgacagc ccccaggggc tgggcctcct 10920
tggagcacca caccgagatg gagttttctt tcttctatga cactgttctc tggagaacag 10980
gaatccagac agacagcgtg ctctctgcaa ggcttcagat aataagaatc tacattcgag 11040
aggatggccg tcttgtcatt gaattcaaga cccatgccaa attcagagga cagtttgtga 11100
tggagcatca cactctccca gaagtgaaat ctttcgtatt gactccagac cacctaggag 11160
gaattgaatt tgacttgcag ctattatgga gcgctcagac ttttgattct ccacatcaac 11220
tctggagagc cacaagctct tataacagga aggactactc aggagagtac accatctacc 11280
tgatcccttg cacagtgcag cccacacagc catgggttga cccaggagag aagcctttgg 11340
cctgcactgc acatgcccca gaaagattcc tgatacccat tgcattccag cagaccaacc 11400
gccctgtgcc agttgtgtat tcacttaaca ctgaatttca gctctgcaat aatgagaagg 11460
tgttcctaat ggatcccaat acatctgata tgtcactagc agaaatggat tacaaaggag 11520
ccttttcaaa aggtcaaatc ctttatggcc gagtactttg gaatccagaa caaaatctta 11580
attctgctta caaactccag ctggagaaag tctatctttg tacgggcaag gatggttatg 11640
tgcctttctt tgatcccacg gggacaatct acaatgaagg gccccagtat ggatgcattc 11700
agccaaacaa acacctaaaa cacagattcc tgctgttgga ccgcaatcag ccagaggtaa 11760
ctgataagta cttccatgat gtgccttttg aggctcactt tgcctctgag ttgcctgatt 11820
tccatgtggt cagtaacatg ccaggtgtgg atggatttac tctaaaagta gatgcactct 11880
ataaggtgga agcaggacac cagtggtatc tccaggtcat ctacatcatt ggccctgaca 11940
ccatctcagg gccccgggtc cagcgctctc tcacagctcc actcagacgc aaccgaaggg 12000
acctggtaga gcccgatggc cagctgatcc ttgatgattc cctcatctat gacaatgaag 12060
gagaccaagt caagaatggc accaatatga agtccctgaa tctggagatg caagagttgg 12120
cggtagctgc gtccctgtca cagactgggg cgtccattgg cagtgccctg gctgcaatca 12180
tgcttctact tctggtgttt ttggtggctt gttttatcaa caggaaatgc cagaaacaga 12240
ggaagaagaa gcccgcagag gacattttgg aagaatatcc tctgaatacc aaggtagaag 12300
tgcccaagag gcacccggac cgggtggaga agaacgtgaa tagacactac tgcactgtgc 12360
ggaacgtcaa catcctgagt gagcctgagg cggcttacac gttcaaaggt gctaaagtca 12420
aaagactgaa tctagaagtc agagttcaca acaatttaca agatggaaca gaagtttaat 12480
ggaggagacc tatgtgtatt tttttctaaa atcattttta taaaatgggg ggaaatactg 12540
gtatttttat aatctcgcag ataaaaaagg gaaaactata gctttgagtg gcagacagca 12600
cacatcacat gcatcaactc acaactgagc tacctcattc agcaaagaac cactgagaac 12660
cccagagtat tacagttatt tccgtagatc cctttaatag tgtcaacaac tgtacacagc 12720
tccttctgta aggctggtct tagaaaacaa gtactttagt atcaggacag gagttgaaca 12780
attaggttag cagatggaga tgagaggact gggtagagta ccatggcaga tctcagagag 12840
aagaagtagg tacgggcctt tggttccctc ccccagcccc agctttctcc tacagggctt 12900
ttcctgagtc cccagacagc agagtatgaa ctgctgacac ccagattcca ttaaaaattc 12960
tgctaatcga cacaacacat atatttgctc atgatttcac ttgacagcgt atgctccttg 13020
gcctctaatt gtactttgct tttccagagc cctttttacc tggggatttc agtgtgctta 13080
agtaaaatcc tctgaaaacc acgggagcct ctgcctcctc agccacagag aactccctcc 13140
tacaaagggg gagactgaaa cccgagttaa ggaggggcct ggcaggcgta tcagagcaca 13200
ttagtgatgc ccttcacccc agggaggtgt ctgttcccaa ctagtttatg tggcactgag 13260
acatccatcc ctgaccaagg atgctgcgaa acaggatcaa tgtactacgg ccttttaatt 13320
caacattgcc ataaatgctt taaagaaaac ccaccacact ttcctcctac tccggtcttt 13380
gcccgttcct gtaacagaca atcccatgtc ctaggtatgg ttttttattc tgttagtgct 13440
tcgggaaagt aagtgattca tttgaataag gcaaattagg agaaagccca ggttggggtg 13500
aaatcagact taacagatac atgctggttc tccttgctgt gtgtgacaca gcagacagag 13560
gcactattcc tggtgcagta tttcagggat ttctctttga ggggttcttt tctggtagct 13620
caggcaatta tttttaccat atcagcacat gacaaggcca tgaacacatg gctctaaaat 13680
aatttagtgt tcaagtatca gcttaactat tttgtgtagg ctacacacag cttgcttttg 13740
tttctcttct gtttctgcct tattggcgga aacataagcg tgcatgccat gttgttttga 13800
attggaggca caatttcatt attcgagagt aaaagacatg tcctcttctg atgcatggca 13860
caccatagtc accaagcaaa taacagagcc ttcacattgt gtaatatttg tatgagaatg 13920
actcaagctc tttgagaaca ttccaaacta gtaacatttc gctactaaaa gctagaaagg 13980
atgaactgtg aaaggttcta ggcagctctg tgagactcca agctccttga aagtaggacc 14040
tttgtgagcc acgcctttca ttcttcaaca gtgccttgca tgtaacaagc actccagaaa 14100
tgtttgttga atgaatgaat ggtgtcatgg gtgaatgatg gggagtaaat ttaggaaggg 14160
gaagtgagag agtatggtgg caatatcaca agggaggaga gaggaaaaca attatcttct 14220
ctacttggat tatgagataa ccttttcttg gaggaaagaa acaccgcttt acaaaggcat 14280
gactctggcg gtggtcctaa ggaagcatga gcagaaaatt cataaaaatg tatcatcagc 14340
aggagatgag actatgaatt ggcatccaga acaggagatt tagagcaaaa tctaatttag 14400
cattctgaga tgagtgtcag gttttcagga gagaatgagt tggggtgagc ccagagtctg 14460
aaactcctga ctggtcaggt gctacttaag accagcttgg gcaattcagg gcagaactcc 14520
tgtatcagcc tcatggacac ccagaattgg tatctcatgg ctggagagct gatcagccag 14580
gcacagaatc tccagaacaa cctagagagt gaatgctaat ttgtagagcg aacttccatt 14640
tggcccatta tttgtaactg tgtaactgct ccaagtgcca gaatgcttac acgttaaagc 14700
agcacctttc catttgccca catattcttc ttgcacaccc cttccattac tgctgaatag 14760
gacattgcat gggaagagta cagaggtggc agaatgaagc tagagtggga aggactaaag 14820
actgagcccc agagtgctcc cagcaaccgc cacgtacaag gtctgaaatg acaagggcaa 14880
gagtgagata ggaaactgtg tgtgaaagga aagcccttgc agtatttctg cctccctttc 14940
tttctgcctt tcaccccact aaatgtatgt tattgaatgc cagtacttct ctagtggatg 15000
cacacttgtt aaatagtgtt aagagatgtg gagatgagat ataccccttt gatgtagaat 15060
tattcatttg gtttgtttca tacttcatta taggaatcaa gtaatttgat gactaatgtg 15120
gattatattt cagtcaaagc tctgctttca atttctctga tttgctcact aatgccttgt 15180
gtgtgtttta ctaacctttt atatcttgcc ttcaagtgag aaggaacaaa caactctcag 15240
tggttactac ttgcttttat atgctggctg tgaaggttaa aagaaagaat ggtctgtacc 15300
attctgcttt gctgcccttt tattgtaccc caggcctcct agaggactcc tgcagattct 15360
attgttgggt gggaaatagt gttggaatgt gtttgcacag tcttatgata ttcagtctca 15420
gtctgctata ggtatttgtt attcttggat actacacacc tgctcagact gagtaaacat 15480
ttgtggtgct gtcaacctga tttcttgact ctcaaatgat ttttgtattt ccaatatgaa 15540
tttgtgtgtt atgaatttct gatttctcca atagtatatg ccactatata aatttgtatt 15600
aataaatgac agtcttgttg gtttaaaaaa aaaaaaaaaa aaa 15643
<210> 9
<211> 6141
<212> RNA
<213> ADGRL3 mRNA
<400> 9
gtttcagatt tgggatattg gtgtttctgt tttggagaaa ttattctttt tctttttaat 60
ttgaagaaaa atcatcagtc ttggaataca gaagagaaac tagaaatata cgtattttgt 120
ttcacatttg aacagtcatt cttgaggaat actccatacc tgagtagaca gccatgtggc 180
catcgcagct actaattttc atgatgctct tagctccaat aattcatgct ttcagccgtg 240
ccccaattcc aatggctgtg gtccgcagag agctatcctg tgagagctat cctatagagc 300
ttcgctgtcc aggaacagac gtcatcatga tagaaagtgc caactatggc aggactgatg 360
acaaaatttg tgactctgac cctgctcaga tggagaatat ccgatgttat ctgccagatg 420
cctataagat tatgtctcaa agatgcaata acagaaccca gtgtgcagtg gtggcaggtc 480
ctgatgtttt tccagacccg tgtccaggaa cctataaata ccttgaagtg cagtatgaat 540
gtgtccctta caaagtggaa caaaaagttt ttctttgtcc tggactacta aaaggagtat 600
accagagtga acatttgttt gagtccgacc accaatctgg ggcgtggtgc aaagaccctc 660
tgcaggcatc tgacaagatt tattatatgc cctggactcc ctacagaact gataccctga 720
ctgagtattc atccaaggat gacttcattg ctggaagacc aactacaacc tacaagctcc 780
ctcacagggt ggatggcaca ggatttgtag tgtatgatgg agctttgttc ttcaacaaag 840
agcgcaccag gaacatagta aagtttgatt tgcggactag gataaagagt ggagaggcta 900
tcatagcaaa tgccaattac catgatacct ccccttaccg atggggaggc aaatctgaca 960
tagacctggc agtagatgag aatgggctat gggtaatcta tgcaacagaa caaaacaatg 1020
gtaaaattgt cattagtcaa ttgaaccctt acaccctacg gatcgaagga acatgggata 1080
ctgcatatga taaaaggtca gcttccaatg cctttatgat ttgtggaatt ctgtatgtgg 1140
tcaaatctgt atatgaggat gatgacaatg aggctactgg aaataagatt gactacattt 1200
acaacactga ccaaagcaag gatagtttgg tggatgtacc ctttcctaat tcataccagt 1260
acattgcagc tgtggattac aaccccaggg acaacctact ttatgtatgg aataactatc 1320
acgtcgtgaa atattctttg gattttggac ctctggatag tagatcaggg caggcacatc 1380
atggacaagt ttcatacatt tctccgccaa ttcaccttga ctctgagcta gaaagaccct 1440
ctgttaaaga tatctctacc acaggacctc ttggcatggg aagcactacc accagtacca 1500
cccttcggac cacaactttg agcccaggaa ggagtaccac cccgtcagtg tcaggaagaa 1560
gaaaccggag tactagtacc ccatctccag ctgtcgaggt acttgatgac atgaccacac 1620
accttccatc agcatcgtcc caaatcccag ctctcgaaga gagctgtgag gctgtggaag 1680
cccgagaaat catgtggttt aagactcgtc aaggacagat agcaaagcag ccatgccctg 1740
caggaactat aggtgtatca acttatctat gccttgctcc tgatggaatt tgggatcccc 1800
aaggtccaga tctcagcaac tgttcttctc cttgggtcaa tcatataaca cagaagttga 1860
aatctggtga aacagctgcc aacattgcta gagagctggc tgaacagaca agaaatcact 1920
tgaatgctgg ggacatcacc tactctgtcc gggccatgga ccagctggta ggcctcctag 1980
atgtacagct tcggaacttg accccaggtg gaaaagatag tgctgcccgg agtttgaaca 2040
agcttcagaa aagagagcgc tcttgcagag cctatgtcca ggcaatggtc gagacagtta 2100
acaacctcct tcagccacaa gctttgaatg catggagaga cctgactacg agtgatcagc 2160
tgcgtgcggc caccatgttg cttcatactg tggaggaaag tgcttttgtg ctggctgata 2220
accttttgaa gactgacatt gtcagggaga atacagacaa tattaaattg gaagttgcaa 2280
gactgagcac agaaggaaac ttagaagacc taaaatttcc agaaaacatg ggccatggaa 2340
gcactatcca gctgtctgca aataccttaa agcaaaatgg ccgaaatgga gagatcagag 2400
tggcctttgt cctgtataac aacttgggtc cttatttatc cacggagaat gccagtatga 2460
agttgggaac ggaagctttg tccacaaatc attctgttat tgtcaattcc cctgttatta 2520
cggcagcaat aaacaaagag ttcagtaaca aggtttattt ggctgatcct gtggtattta 2580
ctgttaaaca tatcaagcag tcagaggaaa atttcaaccc taactgttca ttttggagct 2640
actccaagcg tacaatgaca ggttattggt caacacaagg ctgtcggctc ctgacaacaa 2700
ataagacaca tactacatgc tcttgtaacc acctaacaaa ttttgcagta ctgatggcac 2760
atgtggaagt taagcacagt gatgcggtcc atgacctcct tctggatgtg atcacgtggg 2820
ttggaatttt gctgtccctt gtttgtctcc tgatttgcat cttcacattt tgctttttcc 2880
gggggctcca gagtgaccgt aacaccatcc acaagaacct ctgcatcagt ctctttgtag 2940
cagagctgct cttcctgatt gggatcaacc gaactgacca accaattgcc tgtgctgttt 3000
tcgctgccct gttacatttc ttcttcttgg ctgccttcac ctggatgttc ctggaggggg 3060
tgcagcttta tatcatgctg gtggaggttt ttgagagtga acattcacgt aggaaatact 3120
tttatctggt cggctatggg atgcctgcac tcattgtggc tgtgtcagct gcagtagact 3180
acaggagtta tggaacagat aaagtatgtt ggctccgact tgacacctac ttcatttgga 3240
gttttatagg accagcaact ttgataatta tgcttaatgt aatcttcctt gggattgctt 3300
tatataaaat gtttcatcat actgctatac tgaaacctga atcaggctgt cttgataaca 3360
tcaactatga ggataacaga cccttcatca agtcatgggt tataggtgca atagctcttc 3420
tctgcctatt aggattgacc tgggcctttg gactcatgta tattaatgaa agcacagtca 3480
tcatggccta tctcttcacc attttcaatt ctctacaggg aatgtttata tttattttcc 3540
attgtgtcct acagaagaag gtacgaaaag agtatgggaa atgcctgcga acacattgct 3600
gtagtggcaa aagtacagag agttccattg gttcagggaa aacatctggt tctcgaactc 3660
ctggacgcta ctccacaggc tcacagagcc gaatccgtag aatgtggaat gacacggttc 3720
gaaagcagtc agagtcttcc tttattactg gagacataaa cagttcagcg tcactcaaca 3780
gagaggggct tctgaacaat gccagggata caagtgtcat ggatactcta ccactgaatg 3840
gtaaccatgg caatagttac agcattgcca gcggcgaata cctgagcaac tgtgtgcaaa 3900
tcatagaccg tggctataac cataacgaga ccgccctaga gaaaaagatt ctgaaggaac 3960
tcacttccaa ctatatccct tcttacctga acaaccatga gcgctccagt gaacagaaca 4020
ggaatctgat gaacaagctg gtgaataacc ttggcagtgg aagggaagat gatgccattg 4080
tcctggatga tgccacctcg tttaaccacg aggagagttt gggcctggaa ctcattcatg 4140
aggaatctga tgctcctttg ctgcccccaa gagtatactc caccgagaac caccagccac 4200
accattatac cagaaggcgg atcccccaag accacagtga gagctttttc cctttgctaa 4260
ccaacgagca cacagaagat ctccagtcac cccatagaga ctctctctat accagcatgc 4320
cgacactggc tggtgtggcc gccacagaga gtgttaccac cagcacccag accgaacccc 4380
caccggccaa atgtggtgat gccgaagatg tttactacaa aagcatgcca aacctaggct 4440
ccagaaacca cgtccatcag ctgcatactt actaccagct aggtcgcggc agcagtgatg 4500
gatttatagt tcctccaaac aaagatggga cccctcccga gggaagttca aaaggaccgg 4560
ctcatttggt cactagtcta tagaagatga cacagaaatt ggaaccaaca aaactgctaa 4620
caccttgttg actgttctga gttgatataa gcagtggtaa taatgtgtgt actcctaaat 4680
ctttatgctg tcctctaaag acaaacacaa actctcagac tttttttttt ttaatgggat 4740
ttttaggtca gcccagggga gaaagataac tgctaaaatt cccctgtacc ccatcctttc 4800
ttgtcctttc cccttcagat ggagacttca ttatgttaat gaacaagata tgaagaaaat 4860
ggcactcatt gtggccttgt tgaattatgt tgtgtatgtt ttaacatctc tgatgctgtg 4920
ttactaaaat tacaaggacc tgctttttaa aaggccagaa caattgtctg aaattagtaa 4980
caatgctgca tctagattgg agtgctgcac aaacaaacat aagagcaaag caaaactgta 5040
tcacataggg tttttggtca ctcacaacct gaattcacca cagctggaat agctgtggaa 5100
aacaaaataa aacaacaaaa ttaataatga aatggagggg aattctagaa ttatatgcta 5160
aatgcatatt ttatgatttg ctgtattaac tgatgataaa actaatggca gaaaaagaag 5220
ttgagcaatt tctatgtaat gtacagatac tagcattgca catatagtct gctttctgtt 5280
cctccagaat ttgagtcctg ttaatgtagt agaaaaaaaa aaaagaaatt ttctttttct 5340
tttgtgctgg tcttgcaagt ttgtctacca gtaagagagc aaagtttcct tcctttcttc 5400
tctttcttca ttttcttttt ttcttttttg ccttttattc ctttaaaatt tcgcctggca 5460
aaaaataaat aaatggaact atcactttat aagaatcatt ttctagtaat gcaaacaaat 5520
tattttttac aaaaaaacaa aataaataaa attagacttc cttccctcac tatatatctt 5580
tatgcagtca gaatatttcc aacagtgttt tttgcaaatt agagcaggac aaacttttat 5640
gtttacaggg cacgtctgtt gtaatgcaaa gcatatttgg caagcagttc atcaccagga 5700
cactagctat gattctagaa gtcaaaaggt gtctatagaa ctagtggggc ttctgcatgt 5760
gaaaaacggt tttccatagg cattaaagtg ctgaatgctc agtctgatca acaagtgggc 5820
acctgcacta ccacttttta gaggaaattc actccctcgt aagcattgga aggtcaaatt 5880
attttgaagt gattttttta aaaaaaagtc ttctgtttat taacaggaaa atttatttat 5940
ttgacaggat tttgagtaat gtaggaatac aaaaggtaaa ttagcagcac atataatttt 6000
tttttaattt atgatccatt ttgtatggtc tcaaagttgg atgacctcat tactaatatt 6060
tgttgtaaaa gtgaaacttg tttgccaacc aataaacaac tgattgagat ttagaagata 6120
ttgtaaaaaa aaaaaaaaaa a 6141
<210> 10
<211> 6107
<212> RNA
<213> PSEN1 mRNA
<400> 10
aaatgacgac aacggtgagg gttctcgggc ggggcctggg acaggcagct ccggggtccg 60
cggtttcaca tcggaaacaa aacagcggct ggtctggaag gaacctgagc tacgagccgc 120
ggcggcagcg gggcggcggg gaagcgtata cctaatctgg gagcctgcaa gtgacaacag 180
cctttgcggt ccttagacag cttggcctgg aggagaacac atgaaagaaa gaacctcaag 240
aggctttgtt ttctgtgaaa cagtatttct atacagttgc tccaatgaca gagttacctg 300
caccgttgtc ctacttccag aatgcacaga tgtctgagga caaccacctg agcaatactg 360
tacgtagcca gaatgacaat agagaacggc aggagcacaa cgacagacgg agccttggcc 420
accctgagcc attatctaat ggacgacccc agggtaactc ccggcaggtg gtggagcaag 480
atgaggaaga agatgaggag ctgacattga aatatggcgc caagcatgtg atcatgctct 540
ttgtccctgt gactctctgc atggtggtgg tcgtggctac cattaagtca gtcagctttt 600
atacccggaa ggatgggcag ctaatctata ccccattcac agaagatacc gagactgtgg 660
gccagagagc cctgcactca attctgaatg ctgccatcat gatcagtgtc attgttgtca 720
tgactatcct cctggtggtt ctgtataaat acaggtgcta taaggtcatc catgcctggc 780
ttattatatc atctctattg ttgctgttct ttttttcatt catttacttg ggggaagtgt 840
ttaaaaccta taacgttgct gtggactaca ttactgttgc actcctgatc tggaattttg 900
gtgtggtggg aatgatttcc attcactgga aaggtccact tcgactccag caggcatatc 960
tcattatgat tagtgccctc atggccctgg tgtttatcaa gtacctccct gaatggactg 1020
cgtggctcat cttggctgtg atttcagtat atgatttagt ggctgttttg tgtccgaaag 1080
gtccacttcg tatgctggtt gaaacagctc aggagagaaa tgaaacgctt tttccagctc 1140
tcatttactc ctcaacaatg gtgtggttgg tgaatatggc agaaggagac ccggaagctc 1200
aaaggagagt atccaaaaat tccaagtata atgcagaaag cacagaaagg gagtcacaag 1260
acactgttgc agagaatgat gatggcgggt tcagtgagga atgggaagcc cagagggaca 1320
gtcatctagg gcctcatcgc tctacacctg agtcacgagc tgctgtccag gaactttcca 1380
gcagtatcct cgctggtgaa gacccagagg aaaggggagt aaaacttgga ttgggagatt 1440
tcattttcta cagtgttctg gttggtaaag cctcagcaac agccagtgga gactggaaca 1500
caaccatagc ctgtttcgta gccatattaa ttggtttgtg ccttacatta ttactccttg 1560
ccattttcaa gaaagcattg ccagctcttc caatctccat cacctttggg cttgttttct 1620
actttgccac agattatctt gtacagcctt ttatggacca attagcattc catcaatttt 1680
atatctagca tatttgcggt tagaatccca tggatgtttc ttctttgact ataacaaaat 1740
ctggggagga caaaggtgat tttcctgtgt ccacatctaa caaagtcaag attcccggct 1800
ggacttttgc agcttccttc caagtcttcc tgaccacctt gcactattgg actttggaag 1860
gaggtgccta tagaaaacga ttttgaacat acttcatcgc agtggactgt gtccctcggt 1920
gcagaaacta ccagatttga gggacgaggt caaggagata tgataggccc ggaagttgct 1980
gtgccccatc agcagcttga cgcgtggtca caggacgatt tcactgacac tgcgaactct 2040
caggactacc gttaccaaga ggttaggtga agtggtttaa accaaacgga actcttcatc 2100
ttaaactaca cgttgaaaat caacccaata attctgtatt aactgaattc tgaacttttc 2160
aggaggtact gtgaggaaga gcaggcacca gcagcagaat ggggaatgga gaggtgggca 2220
ggggttccag cttccctttg attttttgct gcagactcat cctttttaaa tgagacttgt 2280
tttcccctct ctttgagtca agtcaaatat gtagattgcc tttggcaatt cttcttctca 2340
agcactgaca ctcattaccg tctgtgattg ccatttcttc ccaaggccag tctgaacctg 2400
aggttgcttt atcctaaaag ttttaacctc aggttccaaa ttcagtaaat tttggaaaca 2460
gtacagctat ttctcatcaa ttctctatca tgttgaagtc aaatttggat tttccaccaa 2520
attctgaatt tgtagacata cttgtacgct cacttgcccc agatgcctcc tctgtcctca 2580
ttcttctctc ccacacaagc agtctttttc tacagccagt aaggcagctc tgtcgtggta 2640
gcagatggtc ccattattct agggtcttac tctttgtatg atgaaaagaa tgtgttatga 2700
atcggtgctg tcagccctgc tgtcagacct tcttccacag caaatgagat gtatgcccaa 2760
agacggtaga attaaagaag agtaaaatgg ctgttgaagc actttctgtc ctggtatttt 2820
gtttttgctt ttgccacaca gtagctcaga atttgaacaa atagccaaaa gctggtggtt 2880
gatgaattat gaactagttg tatcaacaca aagcaagagt tggggaaagc catatttaac 2940
ttggtgagct gtgggagaac ctggtggcag aaggagaacc aactgccaag gggaaagaga 3000
aggggcctcc agcagcgaag gggatacagt gagctaatga tgtcaaggag gagtttcagg 3060
ttattctcgt cagctccaca aatgggtgct ttgtggtctc tgcccgcgtt acctttcctc 3120
tcaatgtacc tttgtgtgaa ctgggcagtg gaggtgcctg ctgcagttac catggagttc 3180
aggctctggg cagctcagtc aggcaaaaca cacaaacagc catcagcctg tgtgggctca 3240
gggcacctct ggacaaaggc ttgtggggca taaccttctt taccacagag agcccttagc 3300
tatgctgatc agaccgtaag cgtttatgag aaacttagtt tcctcctgtg gctgaggagg 3360
ggccagcttt ttcttctttt gcctgctgtt ttctctccca atctatgata tgatatgacc 3420
tggtttgggg ctgtctttgg tgtttagaat atttgttttc tgtcccagga tatttcttat 3480
aagaacctaa cttcaagagt agtgtgcgag tactgatctg aatttaaatt aaaattggct 3540
tatattaggc agtcacagac aggaaaaata agagctatgc aaagaaaggg ggatttaaag 3600
tagtaggttc tatcatctca attcattttt ttccatgaaa tcccttcttc caagattcat 3660
tccctctctc agacatgtgc tagcatgggt attatcattg agaaagcaca gctacagcaa 3720
agccacctga atagcaattt gtgattggaa gcattcttga gggatcccta atctagagta 3780
atttatttgt gtaaggatcc caaatgtgtt gcacctttca tgatacattt cttctctgaa 3840
gagggtacgt ggggtgtgtg tatttaaatc catcctatgt attactgatt gtcctgtgta 3900
gaaagatggc aattattctg tctctttctc caagtttgag ccacatctca gccacattgt 3960
tagacagtgt acagagaacc tatctttcct tttttttttt ttaaaggaca ggattttgct 4020
gtgttgccca ggctagactt gaactcctgg gctcaagtaa tccacctcag cctgagtagc 4080
tgagactaca gcccatctta tttctttaaa tcattcatct caggcagaga acttttccct 4140
caaacattct ttttagaatt agttcagtca ttcctaaaac atccaaatgc tagtcttcca 4200
ccatgaaaaa tagattgtca ctggaaagaa cagtagcaat ttccataagg atgtgccttc 4260
actcacacgg gacaggcggt ggttatagag tcgggcaaaa ccagcagtag agtatgacca 4320
gccaagccaa tctgcttaat aaaaagatgg aagacagtaa ggaaggaaag tagccactaa 4380
gagtctgagt ctgactgggc tacagaataa agggtattta tggacagaat gtcattacat 4440
gcctatggga ataccaatca tatttggaag atttgcagat tttttttcag agaggaaaga 4500
ctcaccttcc tgtttttggt tctcagtagg ttcgtgtgtg ttcctagaat cacagctctg 4560
actccaaatg actcaatttc tcaattagaa aaagtagaag ctttctaagc aacttggaag 4620
aaaacagtca taagtaagca atttgttgat tttactacag aagcaacaac tgaagaggca 4680
gtgtttttac tttcagactc cgggattccc attctgtagt ctctctgctt ttaaaaaccc 4740
tccttttgca atagatgccc aaacagatga tgtttattac ttgttattta cgtggcctca 4800
gacagtgtat gtattctcga tataacttgt agagtgtgaa atataagttt aactaccaaa 4860
taaggtctcc cagggttaga tgactgcggg aagcctttga tcccaacccc caaggctttg 4920
tatatttgat catttgtgat ctaaccctgg aagaaaaaga gctcagaaac cactatgaaa 4980
aaatttgttc agtgttttct gtgttcccgt aggttctgga gtctgaggat gcaaagatga 5040
ataagataaa ttctcagaat gtagttataa tctcttgttt tctggtatat gccatctttc 5100
tttaacttct ctaaaatatt gggtatttgt caaataacca cttttaacag ttaccattac 5160
tgagggctta tacattggtg ttataaaagt gacttgattc agaaatcaat ccattcagta 5220
aagtactcct tctctaaatt tgctgttatg tctataagga acagtttgac ctgcccttct 5280
cctcacctcc tcacctgcct tccaacattg aatttggaag gagacgtgaa aattggacat 5340
ttggttttgc ccttgggctg gaaactatca tataatcata agtttgagcc tagaagtgat 5400
ccttgtgatc ttctcacctc tttaaattcc cacaacacaa gagattaaaa acagaggttt 5460
cagctcttca tagtgcgttg tgaaatggct ggccagagtg taccaacaaa gctgtcatcg 5520
ggctcacagc tcagagacat ctgcatgtga tcatctgcat agtcctctcc tctaacggga 5580
aacacctcag atttgcatat aaaaaagcac cctggtgctg aaatgaaccc ctttcttgaa 5640
catcaaagct gtctcccaca gccttgggca gcagggtgcc tcttagtgga tgtgctgggt 5700
ccaccctgag ccctgacatg tggtggcagc attgccagtt ggtctgtgtg tctgtgtagc 5760
agggacgatt tcccagaaag caattttcct tttgaaatac gtaattgttg agactaggca 5820
gtttcaaagt cagctgcata tagtagcaag tacaggactg tcttgttttt ggtgtccttg 5880
gaggtgctgg ggtgagggtt tcagtgggat catttactct cacatgttgt ctgccttctg 5940
cttctgtgga cactgctttg tacttaattc agacagactg tgaatacacc ttttttataa 6000
atacctttca aattcttggt aagatataat tttgatagct gattgcagat tttctgtatt 6060
tgtcagatta ataaagactg catgaatcca aaaaaaaaaa aaaaaaa 6107
<210> 11
<211> 1499
<212> PRT
<213> RAPGEF2 protein
<400> 11
Met Lys Pro Leu Ala Ile Pro Ala Asn His Gly Val Met Gly Gln Gln
1 5 10 15
Glu Lys His Ser Leu Pro Ala Asp Phe Thr Lys Leu His Leu Thr Asp
20 25 30
Ser Leu His Pro Gln Val Thr His Val Ser Ser Ser His Ser Gly Cys
35 40 45
Ser Ile Thr Ser Asp Ser Gly Ser Ser Ser Leu Ser Asp Ile Tyr Gln
50 55 60
Ala Thr Glu Ser Glu Ala Gly Asp Met Asp Leu Ser Gly Leu Pro Glu
65 70 75 80
Thr Ala Val Asp Ser Glu Asp Asp Asp Asp Glu Glu Asp Ile Glu Arg
85 90 95
Ala Ser Asp Pro Leu Met Ser Arg Asp Ile Val Arg Asp Cys Leu Glu
100 105 110
Lys Asp Pro Ile Asp Arg Thr Asp Asp Asp Ile Glu Gln Leu Leu Glu
115 120 125
Phe Met His Gln Leu Pro Ala Phe Ala Asn Met Thr Met Ser Val Arg
130 135 140
Arg Glu Leu Cys Ala Val Met Val Phe Ala Val Val Glu Arg Ala Gly
145 150 155 160
Thr Ile Val Leu Asn Asp Gly Glu Glu Leu Asp Ser Trp Ser Val Ile
165 170 175
Leu Asn Gly Ser Val Glu Val Thr Tyr Pro Asp Gly Lys Ala Glu Ile
180 185 190
Leu Cys Met Gly Asn Ser Phe Gly Val Ser Pro Thr Met Asp Lys Glu
195 200 205
Tyr Met Lys Gly Val Met Arg Thr Lys Val Asp Asp Cys Gln Phe Val
210 215 220
Cys Ile Ala Gln Gln Asp Tyr Cys Arg Ile Leu Asn Gln Val Glu Lys
225 230 235 240
Asn Met Gln Lys Val Glu Glu Glu Gly Glu Ile Val Met Val Lys Glu
245 250 255
His Arg Glu Leu Asp Arg Thr Gly Thr Arg Lys Gly His Ile Val Ile
260 265 270
Lys Gly Thr Ser Glu Arg Leu Thr Met His Leu Val Glu Glu His Ser
275 280 285
Val Val Asp Pro Thr Phe Ile Glu Asp Phe Leu Leu Thr Tyr Arg Thr
290 295 300
Phe Leu Ser Ser Pro Met Glu Val Gly Lys Lys Leu Leu Glu Trp Phe
305 310 315 320
Asn Asp Pro Ser Leu Arg Asp Lys Val Thr Arg Val Val Leu Leu Trp
325 330 335
Val Asn Asn His Phe Asn Asp Phe Glu Gly Asp Pro Ala Met Thr Arg
340 345 350
Phe Leu Glu Glu Phe Glu Asn Asn Leu Glu Arg Glu Lys Met Gly Gly
355 360 365
His Leu Arg Leu Leu Asn Ile Ala Cys Ala Ala Lys Ala Lys Arg Arg
370 375 380
Leu Met Thr Leu Thr Lys Pro Ser Arg Glu Ala Pro Leu Pro Phe Ile
385 390 395 400
Leu Leu Gly Gly Ser Glu Lys Gly Phe Gly Ile Phe Val Asp Ser Val
405 410 415
Asp Ser Gly Ser Lys Ala Thr Glu Ala Gly Leu Lys Arg Gly Asp Gln
420 425 430
Ile Leu Glu Val Asn Gly Gln Asn Phe Glu Asn Ile Gln Leu Ser Lys
435 440 445
Ala Met Glu Ile Leu Arg Asn Asn Thr His Leu Ser Ile Thr Val Lys
450 455 460
Thr Asn Leu Phe Val Phe Lys Glu Leu Leu Thr Arg Leu Ser Glu Glu
465 470 475 480
Lys Arg Asn Gly Ala Pro His Leu Pro Lys Ile Gly Asp Ile Lys Lys
485 490 495
Ala Ser Arg Tyr Ser Ile Pro Asp Leu Ala Val Asp Val Glu Gln Val
500 505 510
Ile Gly Leu Glu Lys Val Asn Lys Lys Ser Lys Ala Asn Thr Val Gly
515 520 525
Gly Arg Asn Lys Leu Lys Lys Ile Leu Asp Lys Thr Arg Ile Ser Ile
530 535 540
Leu Pro Gln Lys Pro Tyr Asn Asp Ile Gly Ile Gly Gln Ser Gln Asp
545 550 555 560
Asp Ser Ile Val Gly Leu Arg Gln Thr Lys His Ile Pro Thr Ala Leu
565 570 575
Pro Val Ser Gly Thr Leu Ser Ser Ser Asn Pro Asp Leu Leu Gln Ser
580 585 590
His His Arg Ile Leu Asp Phe Ser Ala Thr Pro Asp Leu Pro Asp Gln
595 600 605
Val Leu Arg Val Phe Lys Ala Asp Gln Gln Ser Arg Tyr Ile Met Ile
610 615 620
Ser Lys Asp Thr Thr Ala Lys Glu Val Val Ile Gln Ala Ile Arg Glu
625 630 635 640
Phe Ala Val Thr Ala Thr Pro Asp Gln Tyr Ser Leu Cys Glu Val Ser
645 650 655
Val Thr Pro Glu Gly Val Ile Lys Gln Arg Arg Leu Pro Asp Gln Leu
660 665 670
Ser Lys Leu Ala Asp Arg Ile Gln Leu Ser Gly Arg Tyr Tyr Leu Lys
675 680 685
Asn Asn Met Glu Thr Glu Thr Leu Cys Ser Asp Glu Asp Ala Gln Glu
690 695 700
Leu Leu Arg Glu Ser Gln Ile Ser Leu Leu Gln Leu Ser Thr Val Glu
705 710 715 720
Val Ala Thr Gln Leu Ser Met Arg Asn Phe Glu Leu Phe Arg Asn Ile
725 730 735
Glu Pro Thr Glu Tyr Ile Asp Asp Leu Phe Lys Leu Arg Ser Lys Thr
740 745 750
Ser Cys Ala Asn Leu Lys Arg Phe Glu Glu Val Ile Asn Gln Glu Thr
755 760 765
Phe Trp Val Ala Ser Glu Ile Leu Arg Glu Thr Asn Gln Leu Lys Arg
770 775 780
Met Lys Ile Ile Lys His Phe Ile Lys Ile Ala Leu His Cys Arg Glu
785 790 795 800
Cys Lys Asn Phe Asn Ser Met Phe Ala Ile Ile Ser Gly Leu Asn Leu
805 810 815
Ala Pro Val Ala Arg Leu Arg Thr Thr Trp Glu Lys Leu Pro Asn Lys
820 825 830
Tyr Glu Lys Leu Phe Gln Asp Leu Gln Asp Leu Phe Asp Pro Ser Arg
835 840 845
Asn Met Ala Lys Tyr Arg Asn Val Leu Asn Ser Gln Asn Leu Gln Pro
850 855 860
Pro Ile Ile Pro Leu Phe Pro Val Ile Lys Lys Asp Leu Thr Phe Leu
865 870 875 880
His Glu Gly Asn Asp Ser Lys Val Asp Gly Leu Val Asn Phe Glu Lys
885 890 895
Leu Arg Met Ile Ala Lys Glu Ile Arg His Val Gly Arg Met Ala Ser
900 905 910
Val Asn Met Asp Pro Ala Leu Met Phe Arg Thr Arg Lys Lys Lys Trp
915 920 925
Arg Ser Leu Gly Ser Leu Ser Gln Gly Ser Thr Asn Ala Thr Val Leu
930 935 940
Asp Val Ala Gln Thr Gly Gly His Lys Lys Arg Val Arg Arg Ser Ser
945 950 955 960
Phe Leu Asn Ala Lys Lys Leu Tyr Glu Asp Ala Gln Met Ala Arg Lys
965 970 975
Val Lys Gln Tyr Leu Ser Asn Leu Glu Leu Glu Met Asp Glu Glu Ser
980 985 990
Leu Gln Thr Leu Ser Leu Gln Cys Glu Pro Ala Thr Asn Thr Leu Pro
995 1000 1005
Lys Asn Pro Gly Asp Lys Lys Pro Val Lys Ser Glu Thr Ser Pro Val
1010 1015 1020
Ala Pro Arg Ala Gly Ser Gln Gln Lys Ala Gln Ser Leu Pro Gln Pro
1025 1030 1035 1040
Gln Gln Gln Pro Pro Pro Ala His Lys Ile Asn Gln Gly Leu Gln Val
1045 1050 1055
Pro Ala Val Ser Leu Tyr Pro Ser Arg Lys Lys Val Pro Val Lys Asp
1060 1065 1070
Leu Pro Pro Phe Gly Ile Asn Ser Pro Gln Ala Leu Lys Lys Ile Leu
1075 1080 1085
Ser Leu Ser Glu Glu Gly Ser Leu Glu Arg His Lys Lys Gln Ala Glu
1090 1095 1100
Asp Thr Ile Ser Asn Ala Ser Ser Gln Leu Ser Ser Pro Pro Thr Ser
1105 1110 1115 1120
Pro Gln Ser Ser Pro Arg Lys Gly Tyr Thr Leu Ala Pro Ser Gly Thr
1125 1130 1135
Val Asp Asn Phe Ser Asp Ser Gly His Ser Glu Ile Ser Ser Arg Ser
1140 1145 1150
Ser Ile Val Ser Asn Ser Ser Phe Asp Ser Val Pro Val Ser Leu His
1155 1160 1165
Asp Glu Arg Arg Gln Arg His Ser Val Ser Ile Val Glu Thr Asn Leu
1170 1175 1180
Gly Met Gly Arg Met Glu Arg Arg Thr Met Ile Glu Pro Asp Gln Tyr
1185 1190 1195 1200
Ser Leu Gly Ser Tyr Ala Pro Met Ser Glu Gly Arg Gly Leu Tyr Ala
1205 1210 1215
Thr Ala Thr Val Ile Ser Ser Pro Ser Thr Glu Glu Leu Ser Gln Asp
1220 1225 1230
Gln Gly Asp Arg Ala Ser Leu Asp Ala Ala Asp Ser Gly Arg Gly Ser
1235 1240 1245
Trp Thr Ser Cys Ser Ser Gly Ser His Asp Asn Ile Gln Thr Ile Gln
1250 1255 1260
His Gln Arg Ser Trp Glu Thr Leu Pro Phe Gly His Thr His Phe Asp
1265 1270 1275 1280
Tyr Ser Gly Asp Pro Ala Gly Leu Trp Ala Ser Ser Ser His Met Asp
1285 1290 1295
Gln Ile Met Phe Ser Asp His Ser Thr Lys Tyr Asn Arg Gln Asn Gln
1300 1305 1310
Ser Arg Glu Ser Leu Glu Gln Ala Gln Ser Arg Ala Ser Trp Ala Ser
1315 1320 1325
Ser Thr Gly Tyr Trp Gly Glu Asp Ser Glu Gly Asp Thr Gly Thr Ile
1330 1335 1340
Lys Arg Arg Gly Gly Lys Asp Val Ser Ile Glu Ala Glu Ser Ser Ser
1345 1350 1355 1360
Leu Thr Ser Val Thr Thr Glu Glu Thr Lys Pro Val Pro Met Pro Ala
1365 1370 1375
His Ile Ala Val Ala Ser Ser Thr Thr Lys Gly Leu Ile Ala Arg Lys
1380 1385 1390
Glu Gly Arg Tyr Arg Glu Pro Pro Pro Thr Pro Pro Gly Tyr Ile Gly
1395 1400 1405
Ile Pro Ile Thr Asp Phe Pro Glu Gly His Ser His Pro Ala Arg Lys
1410 1415 1420
Pro Pro Asp Tyr Asn Val Ala Leu Gln Arg Ser Arg Met Val Ala Arg
1425 1430 1435 1440
Ser Ser Asp Thr Ala Gly Pro Ser Ser Val Gln Gln Pro His Gly His
1445 1450 1455
Pro Thr Ser Ser Arg Pro Val Asn Lys Pro Gln Trp His Lys Pro Asn
1460 1465 1470
Glu Ser Asp Pro Arg Leu Ala Pro Tyr Gln Ser Gln Gly Phe Ser Thr
1475 1480 1485
Glu Glu Asp Glu Asp Glu Gln Val Ser Ala Val
1490 1495
<210> 12
<211> 777
<212> PRT
<213> IFT80 protein
<400> 12
Met Arg Leu Lys Ile Ser Leu Leu Lys Glu Pro Lys His Gln Glu Leu
1 5 10 15
Val Ser Cys Val Gly Trp Thr Thr Ala Glu Glu Leu Tyr Ser Cys Ser
20 25 30
Asp Asp His Gln Ile Val Lys Trp Asn Leu Leu Thr Ser Glu Thr Thr
35 40 45
Gln Ile Val Lys Leu Pro Asp Asp Ile Tyr Pro Ile Asp Phe His Trp
50 55 60
Phe Pro Lys Ser Leu Gly Val Lys Lys Gln Thr Gln Ala Glu Ser Phe
65 70 75 80
Val Leu Thr Ser Ser Asp Gly Lys Phe His Leu Ile Ser Lys Leu Gly
85 90 95
Arg Val Glu Lys Ser Val Glu Ala His Cys Gly Ala Val Leu Ala Gly
100 105 110
Arg Trp Asn Tyr Glu Gly Thr Ala Leu Val Thr Val Gly Glu Asp Gly
115 120 125
Gln Ile Lys Ile Trp Ser Lys Thr Gly Met Leu Arg Ser Thr Leu Ala
130 135 140
Gln Gln Gly Thr Pro Val Tyr Ser Val Ala Trp Gly Pro Asp Ser Glu
145 150 155 160
Lys Val Leu Tyr Thr Ala Gly Lys Gln Leu Ile Ile Lys Pro Leu Gln
165 170 175
Pro Asn Ala Lys Val Leu Gln Trp Lys Ala His Asp Gly Ile Ile Leu
180 185 190
Lys Val Asp Trp Asn Ser Val Asn Asp Leu Ile Leu Ser Ala Gly Glu
195 200 205
Asp Cys Lys Tyr Lys Val Trp Asp Ser Tyr Gly Arg Pro Leu Tyr Asn
210 215 220
Ser Gln Pro His Glu His Pro Ile Thr Ser Val Ala Trp Ala Pro Asp
225 230 235 240
Gly Glu Leu Phe Ala Val Gly Ser Phe His Thr Leu Arg Leu Cys Asp
245 250 255
Lys Thr Gly Trp Ser Tyr Ala Leu Glu Lys Pro Asn Thr Gly Ser Ile
260 265 270
Phe Asn Ile Ala Trp Ser Ile Asp Gly Thr Gln Ile Ala Gly Ala Cys
275 280 285
Gly Asn Gly His Val Val Phe Ala His Val Val Glu Gln His Trp Glu
290 295 300
Trp Lys Asn Phe Gln Val Thr Leu Thr Lys Arg Arg Ala Met Gln Val
305 310 315 320
Arg Asn Val Leu Asn Asp Ala Val Asp Leu Leu Glu Phe Arg Asp Arg
325 330 335
Val Ile Lys Ala Ser Leu Asn Tyr Ala His Leu Val Val Ser Thr Ser
340 345 350
Leu Gln Cys Tyr Val Phe Ser Thr Lys Asn Trp Asn Thr Pro Ile Ile
355 360 365
Phe Asp Leu Lys Glu Gly Thr Val Ser Leu Ile Leu Gln Ala Glu Arg
370 375 380
His Phe Leu Leu Val Asp Gly Ser Ser Ile Tyr Leu Tyr Ser Tyr Glu
385 390 395 400
Gly Arg Phe Ile Ser Ser Pro Lys Phe Pro Gly Met Arg Thr Asp Ile
405 410 415
Leu Asn Ala Gln Thr Val Ser Leu Ser Asn Asp Thr Ile Ala Ile Arg
420 425 430
Asp Lys Ala Asp Glu Lys Ile Ile Phe Leu Phe Glu Ala Ser Thr Gly
435 440 445
Lys Pro Leu Gly Asp Gly Lys Phe Leu Ser His Lys Asn Glu Ile Leu
450 455 460
Glu Ile Ala Leu Asp Gln Lys Gly Leu Thr Asn Asp Arg Lys Ile Ala
465 470 475 480
Phe Ile Asp Lys Asn Arg Asp Leu Cys Ile Thr Ser Val Lys Arg Phe
485 490 495
Gly Lys Glu Glu Gln Ile Ile Lys Leu Gly Thr Met Val His Thr Leu
500 505 510
Ala Trp Asn Asp Thr Cys Asn Ile Leu Cys Gly Leu Gln Asp Thr Arg
515 520 525
Phe Ile Val Trp Tyr Tyr Pro Asn Thr Val Tyr Val Asp Arg Asp Ile
530 535 540
Leu Pro Lys Thr Leu Tyr Glu Arg Asp Ala Ser Glu Phe Ser Lys Asn
545 550 555 560
Pro His Ile Val Ser Phe Val Gly Asn Gln Val Thr Ile Arg Arg Ala
565 570 575
Asp Gly Ser Leu Val His Ile Ser Ile Thr Pro Tyr Pro Ala Ile Leu
580 585 590
His Glu Tyr Val Ser Ser Ser Lys Trp Glu Asp Ala Val Arg Leu Cys
595 600 605
Arg Phe Val Lys Glu Gln Thr Met Trp Ala Cys Leu Ala Ala Met Ala
610 615 620
Val Ala Asn Arg Asp Met Thr Thr Ala Glu Ile Ala Tyr Ala Ala Ile
625 630 635 640
Gly Glu Ile Asp Lys Val Gln Tyr Ile Asn Ser Ile Lys Asn Leu Pro
645 650 655
Ser Lys Glu Ser Lys Met Ala His Ile Leu Leu Phe Ser Gly Asn Ile
660 665 670
Gln Glu Ala Glu Ile Val Leu Leu Gln Ala Gly Leu Val Tyr Gln Ala
675 680 685
Ile Gln Ile Asn Ile Asn Leu Tyr Asn Trp Glu Arg Ala Leu Glu Leu
690 695 700
Ala Val Lys Tyr Lys Thr His Val Asp Thr Val Leu Ala Tyr Arg Gln
705 710 715 720
Lys Phe Leu Glu Thr Phe Gly Lys Gln Glu Thr Asn Lys Arg Tyr Leu
725 730 735
His Tyr Ala Glu Gly Leu Gln Ile Asp Trp Glu Lys Ile Lys Ala Lys
740 745 750
Ile Glu Met Glu Ile Thr Lys Glu Arg Glu Gln Ser Ser Ser Ser Gln
755 760 765
Ser Ser Lys Ser Ile Gly Leu Lys Pro
770 775
<210> 13
<211> 1423
<212> PRT
<213> SSH2 protein
<400> 13
Met Ala Leu Val Thr Val Gln Arg Ser Pro Thr Pro Ser Thr Thr Ser
1 5 10 15
Ser Pro Cys Ala Ser Glu Ala Asp Ser Gly Glu Glu Glu Cys Arg Ser
20 25 30
Gln Pro Arg Ser Ile Ser Glu Ser Phe Leu Thr Val Lys Gly Ala Ala
35 40 45
Leu Phe Leu Pro Arg Gly Asn Gly Ser Ser Thr Pro Arg Ile Ser His
50 55 60
Arg Arg Asn Lys His Ala Gly Asp Leu Gln Gln His Leu Gln Ala Met
65 70 75 80
Phe Ile Leu Leu Arg Pro Glu Asp Asn Ile Arg Leu Ala Val Arg Leu
85 90 95
Glu Ser Thr Tyr Gln Asn Arg Thr Arg Tyr Met Val Val Val Ser Thr
100 105 110
Asn Gly Arg Gln Asp Thr Glu Glu Ser Ile Val Leu Gly Met Asp Phe
115 120 125
Ser Ser Asn Asp Ser Ser Thr Cys Thr Met Gly Leu Val Leu Pro Leu
130 135 140
Trp Ser Asp Thr Leu Ile His Leu Asp Gly Asp Gly Gly Phe Ser Val
145 150 155 160
Ser Thr Asp Asn Arg Val His Ile Phe Lys Pro Val Ser Val Gln Ala
165 170 175
Met Trp Ser Ala Leu Gln Ser Leu His Lys Ala Cys Glu Val Ala Arg
180 185 190
Ala His Asn Tyr Tyr Pro Gly Ser Leu Phe Leu Thr Trp Val Ser Tyr
195 200 205
Tyr Glu Ser His Ile Asn Ser Asp Gln Ser Ser Val Asn Glu Trp Asn
210 215 220
Ala Met Gln Asp Val Gln Ser His Arg Pro Asp Ser Pro Ala Leu Phe
225 230 235 240
Thr Asp Ile Pro Thr Glu Arg Glu Arg Thr Glu Arg Leu Ile Lys Thr
245 250 255
Lys Leu Arg Glu Ile Met Met Gln Lys Asp Leu Glu Asn Ile Thr Ser
260 265 270
Lys Glu Ile Arg Thr Glu Leu Glu Met Gln Met Val Cys Asn Leu Arg
275 280 285
Glu Phe Lys Glu Phe Ile Asp Asn Glu Met Ile Val Ile Leu Gly Gln
290 295 300
Met Asp Ser Pro Thr Gln Ile Phe Glu His Val Phe Leu Gly Ser Glu
305 310 315 320
Trp Asn Ala Ser Asn Leu Glu Asp Leu Gln Asn Arg Gly Val Arg Tyr
325 330 335
Ile Leu Asn Val Thr Arg Glu Ile Asp Asn Phe Phe Pro Gly Val Phe
340 345 350
Glu Tyr His Asn Ile Arg Val Tyr Asp Glu Glu Ala Thr Asp Leu Leu
355 360 365
Ala Tyr Trp Asn Asp Thr Tyr Lys Phe Ile Ser Lys Ala Lys Lys His
370 375 380
Gly Ser Lys Cys Leu Val His Cys Lys Met Gly Val Ser Arg Ser Ala
385 390 395 400
Ser Thr Val Ile Ala Tyr Ala Met Lys Glu Tyr Gly Trp Asn Leu Asp
405 410 415
Arg Ala Tyr Asp Tyr Val Lys Glu Arg Arg Thr Val Thr Lys Pro Asn
420 425 430
Pro Ser Phe Met Arg Gln Leu Glu Glu Tyr Gln Gly Ile Leu Leu Ala
435 440 445
Ser Lys Gln Arg His Asn Lys Leu Trp Arg Ser His Ser Asp Ser Asp
450 455 460
Leu Ser Asp His His Glu Pro Ile Cys Lys Pro Gly Leu Glu Leu Asn
465 470 475 480
Lys Lys Asp Ile Thr Thr Ser Ala Asp Gln Ile Ala Glu Val Lys Thr
485 490 495
Met Glu Ser His Pro Pro Ile Pro Pro Val Phe Val Glu His Met Val
500 505 510
Pro Gln Asp Ala Asn Gln Lys Gly Leu Cys Thr Lys Glu Arg Met Ile
515 520 525
Cys Leu Glu Phe Thr Ser Arg Glu Phe His Ala Gly Gln Ile Glu Asp
530 535 540
Glu Leu Asn Leu Asn Asp Ile Asn Gly Cys Ser Ser Gly Cys Cys Leu
545 550 555 560
Asn Glu Ser Lys Phe Pro Leu Asp Asn Cys His Ala Ser Lys Ala Leu
565 570 575
Ile Gln Pro Gly His Val Pro Glu Met Ala Asn Lys Phe Pro Asp Leu
580 585 590
Thr Val Glu Asp Leu Glu Thr Asp Ala Leu Lys Ala Asp Met Asn Val
595 600 605
His Leu Leu Pro Met Glu Glu Leu Thr Ser Pro Leu Lys Asp Pro Pro
610 615 620
Met Ser Pro Asp Pro Glu Ser Pro Ser Pro Gln Pro Ser Cys Gln Thr
625 630 635 640
Glu Ile Ser Asp Phe Ser Thr Asp Arg Ile Asp Phe Phe Ser Ala Leu
645 650 655
Glu Lys Phe Val Glu Leu Ser Gln Glu Thr Arg Ser Arg Ser Phe Ser
660 665 670
His Ser Arg Met Glu Glu Leu Gly Gly Gly Arg Asn Glu Ser Cys Arg
675 680 685
Leu Ser Val Val Glu Val Ala Pro Ser Lys Val Thr Ala Asp Asp Gln
690 695 700
Arg Ser Ser Ser Leu Ser Asn Thr Pro His Ala Ser Glu Glu Ser Ser
705 710 715 720
Met Asp Glu Glu Gln Ser Lys Ala Ile Ser Glu Leu Val Ser Pro Asp
725 730 735
Ile Phe Met Gln Ser His Ser Glu Asn Ala Ile Ser Val Lys Glu Ile
740 745 750
Val Thr Glu Ile Glu Ser Ile Ser Gln Gly Val Gly Gln Ile Gln Leu
755 760 765
Lys Gly Asp Ile Leu Pro Asn Pro Cys His Thr Pro Lys Lys Asn Ser
770 775 780
Ile His Glu Leu Leu Leu Glu Arg Ala Gln Thr Pro Glu Asn Lys Pro
785 790 795 800
Gly His Met Glu Gln Asp Glu Asp Ser Cys Thr Ala Gln Pro Glu Leu
805 810 815
Ala Lys Asp Ser Gly Met Cys Asn Pro Glu Gly Cys Leu Thr Thr His
820 825 830
Ser Ser Ile Ala Asp Leu Glu Glu Gly Glu Pro Ala Glu Gly Glu Gln
835 840 845
Glu Leu Gln Gly Ser Gly Met His Pro Gly Ala Lys Trp Tyr Pro Gly
850 855 860
Ser Val Arg Arg Ala Thr Leu Glu Phe Glu Glu Arg Leu Arg Gln Glu
865 870 875 880
Gln Glu His His Gly Ala Ala Pro Thr Cys Thr Ser Leu Ser Thr Arg
885 890 895
Lys Asn Ser Lys Asn Asp Ser Ser Val Ala Asp Leu Ala Pro Lys Gly
900 905 910
Lys Ser Asp Glu Ala Pro Pro Glu His Ser Phe Val Leu Lys Glu Pro
915 920 925
Glu Met Ser Lys Gly Lys Gly Lys Tyr Ser Gly Ser Glu Ala Gly Ser
930 935 940
Leu Ser His Ser Glu Gln Asn Ala Thr Val Pro Ala Pro Arg Val Leu
945 950 955 960
Glu Phe Asp His Leu Pro Asp Pro Gln Glu Gly Pro Gly Ser Asp Thr
965 970 975
Gly Thr Gln Gln Glu Gly Val Leu Lys Asp Leu Arg Thr Val Ile Pro
980 985 990
Tyr Gln Glu Ser Glu Thr Gln Ala Val Pro Leu Pro Leu Pro Lys Arg
995 1000 1005
Val Glu Ile Ile Glu Tyr Thr His Ile Val Thr Ser Pro Asn His Thr
1010 1015 1020
Gly Pro Gly Ser Glu Ile Ala Thr Ser Glu Lys Ser Gly Glu Gln Gly
1025 1030 1035 1040
Leu Arg Lys Val Asn Met Glu Lys Ser Val Thr Val Leu Cys Thr Leu
1045 1050 1055
Asp Glu Asn Leu Asn Arg Thr Leu Asp Pro Asn Gln Val Ser Leu His
1060 1065 1070
Pro Gln Val Leu Pro Leu Pro His Ser Ser Ser Pro Glu His Asn Arg
1075 1080 1085
Pro Thr Asp His Pro Thr Ser Ile Leu Ser Ser Pro Glu Asp Arg Gly
1090 1095 1100
Ser Ser Leu Ser Thr Ala Leu Glu Thr Ala Ala Pro Phe Val Ser His
1105 1110 1115 1120
Thr Thr His Leu Leu Ser Ala Ser Leu Asp Tyr Leu His Pro Gln Thr
1125 1130 1135
Met Val His Leu Glu Gly Phe Thr Glu Gln Ser Ser Thr Thr Asp Glu
1140 1145 1150
Pro Ser Ala Glu Gln Val Ser Trp Glu Glu Ser Gln Glu Ser Pro Leu
1155 1160 1165
Ser Ser Gly Ser Glu Val Pro Tyr Lys Asp Ser Gln Leu Ser Ser Ala
1170 1175 1180
Asp Leu Ser Leu Ile Ser Lys Leu Gly Asp Asn Thr Gly Glu Leu Gln
1185 1190 1195 1200
Glu Lys Met Asp Pro Leu Pro Val Ala Cys Arg Leu Pro His Ser Ser
1205 1210 1215
Ser Ser Glu Asn Ile Lys Ser Leu Ser His Ser Pro Gly Val Val Lys
1220 1225 1230
Glu Arg Ala Lys Glu Ile Glu Ser Arg Val Val Phe Gln Ala Gly Leu
1235 1240 1245
Thr Lys Pro Ser Gln Met Arg Arg Ser Ala Ser Leu Ala Lys Leu Gly
1250 1255 1260
Tyr Leu Asp Leu Cys Lys Asp Cys Leu Pro Glu Arg Glu Pro Ala Ser
1265 1270 1275 1280
Cys Glu Ser Pro His Leu Lys Leu Leu Gln Pro Phe Leu Arg Thr Asp
1285 1290 1295
Ser Gly Met His Ala Met Glu Asp Gln Glu Ser Leu Glu Asn Pro Gly
1300 1305 1310
Ala Pro His Asn Pro Glu Pro Thr Lys Ser Phe Val Glu Gln Leu Thr
1315 1320 1325
Thr Thr Glu Cys Ile Val Gln Ser Lys Pro Val Glu Arg Pro Leu Val
1330 1335 1340
Gln Tyr Ala Lys Glu Phe Gly Ser Ser Gln Gln Tyr Leu Leu Pro Arg
1345 1350 1355 1360
Ala Gly Leu Glu Leu Thr Ser Ser Glu Gly Gly Leu Pro Val Leu Gln
1365 1370 1375
Thr Gln Gly Leu Gln Cys Ala Cys Pro Ala Pro Gly Leu Ala Val Ala
1380 1385 1390
Pro Arg Gln Gln His Gly Arg Thr His Pro Leu Arg Arg Leu Lys Lys
1395 1400 1405
Ala Asn Asp Lys Lys Arg Thr Thr Asn Pro Phe Tyr Asn Thr Met
1410 1415 1420
<210> 14
<211> 346
<212> PRT
<213> XRCC3 protein
<400> 14
Met Asp Leu Asp Leu Leu Asp Leu Asn Pro Arg Ile Ile Ala Ala Ile
1 5 10 15
Lys Lys Ala Lys Leu Lys Ser Val Lys Glu Val Leu His Phe Ser Gly
20 25 30
Pro Asp Leu Lys Arg Leu Thr Asn Leu Ser Ser Pro Glu Val Trp His
35 40 45
Leu Leu Arg Thr Ala Ser Leu His Leu Arg Gly Ser Ser Ile Leu Thr
50 55 60
Ala Leu Gln Leu His Gln Gln Lys Glu Arg Phe Pro Thr Gln His Gln
65 70 75 80
Arg Leu Ser Leu Gly Cys Pro Val Leu Asp Ala Leu Leu Arg Gly Gly
85 90 95
Leu Pro Leu Asp Gly Ile Thr Glu Leu Ala Gly Arg Ser Ser Ala Gly
100 105 110
Lys Thr Gln Leu Ala Leu Gln Leu Cys Leu Ala Val Gln Phe Pro Arg
115 120 125
Gln His Gly Gly Leu Glu Ala Gly Ala Val Tyr Ile Cys Thr Glu Asp
130 135 140
Ala Phe Pro His Lys Arg Leu Gln Gln Leu Met Ala Gln Gln Pro Arg
145 150 155 160
Leu Arg Thr Asp Val Pro Gly Glu Leu Leu Gln Lys Leu Arg Phe Gly
165 170 175
Ser Gln Ile Phe Ile Glu His Val Ala Asp Val Asp Thr Leu Leu Glu
180 185 190
Cys Val Asn Lys Lys Val Pro Val Leu Leu Ser Arg Gly Met Ala Arg
195 200 205
Leu Val Val Ile Asp Ser Val Ala Ala Pro Phe Arg Cys Glu Phe Asp
210 215 220
Ser Gln Ala Ser Ala Pro Arg Ala Arg His Leu Gln Ser Leu Gly Ala
225 230 235 240
Thr Leu Arg Glu Leu Ser Ser Ala Phe Gln Ser Pro Val Leu Cys Ile
245 250 255
Asn Gln Val Thr Glu Ala Met Glu Glu Gln Gly Ala Ala His Gly Pro
260 265 270
Leu Gly Phe Trp Asp Glu Arg Val Ser Pro Ala Leu Gly Ile Thr Trp
275 280 285
Ala Asn Gln Leu Leu Val Arg Leu Leu Ala Asp Arg Leu Arg Glu Glu
290 295 300
Glu Ala Ala Leu Gly Cys Pro Ala Arg Thr Leu Arg Val Leu Ser Ala
305 310 315 320
Pro His Leu Pro Pro Ser Ser Cys Ser Tyr Thr Ile Ser Ala Glu Gly
325 330 335
Val Arg Gly Thr Pro Gly Thr Gln Ser His
340 345
<210> 15
<211> 2223
<212> PRT
<213> SPAG17 protein
<400> 15
Met Ala Pro Lys Lys Glu Lys Gly Gly Thr Val Asn Thr Ser Ser Lys
1 5 10 15
Ile Trp Glu Pro Ser Leu Ile Ala Ala Gln Phe Asn Gln Asn Asp Trp
20 25 30
Gln Ala Ser Ile Ala Phe Val Val Gly Asn Gln Ile Glu Asp Asp Leu
35 40 45
Leu Ile Gln Ala Leu Thr Val Ala Val Gln Val Pro Gln Arg Lys Leu
50 55 60
Phe Ser Met Val Ser Trp Gln Asp Ile Leu Gln Gln Ile Asn Glu Ile
65 70 75 80
Asn Thr Leu Val Gly Ser Ala Ser Ser Lys Lys Ala Lys Lys Pro Val
85 90 95
Gly Gly Asn Ala Pro Leu Tyr Tyr Glu Val Leu Thr Ala Ala Lys Ala
100 105 110
Ile Met Asp Ser Gly Glu Lys Leu Thr Leu Pro Leu Ile Gly Lys Leu
115 120 125
Leu Lys Phe Gln Leu Leu Gln Ile Lys Phe Lys Asp Gln Gln Arg Arg
130 135 140
Glu Asn Glu Lys Lys Val Ile Glu Asp Lys Pro Lys Leu Glu Lys Asp
145 150 155 160
Lys Gly Lys Ala Lys Ser Pro Lys Glu Lys Lys Ala Pro Ser Ala Lys
165 170 175
Pro Ala Lys Gly Lys Gly Lys Asp Gln Pro Glu Ala Asn Ala Pro Val
180 185 190
Lys Lys Thr Thr Gln Leu Lys Arg Arg Gly Glu Asp Asp His Thr Asn
195 200 205
Arg Tyr Ile Asp Asp Glu Pro Asp Asp Gly Ala Gln His Tyr Ile Ile
210 215 220
Val Val Gly Phe Asn Asn Pro Gln Leu Leu Ala Ile Met Ala Glu Leu
225 230 235 240
Gly Ile Pro Ile Thr Ser Val Ile Lys Ile Ser Ser Glu Asn Tyr Glu
245 250 255
Pro Leu Gln Thr His Leu Ala Ala Val Asn Gln Gln Gln Glu Val Leu
260 265 270
Leu Gln Ser Glu Asp Leu Glu Ala Glu Lys Leu Lys Lys Glu Asn Ala
275 280 285
Ile Lys Glu Leu Lys Thr Phe Trp Lys Tyr Leu Glu Pro Val Leu Asn
290 295 300
Asn Glu Lys Pro Glu Thr Asn Leu Phe Asp Val Ala Arg Leu Glu Tyr
305 310 315 320
Met Val Lys Ala Ala Asp Phe Pro Ser Asp Trp Ser Asp Gly Glu Met
325 330 335
Met Leu Lys Leu Gly Thr Asp Ile Phe Glu Asn Ile Ala Cys Leu Met
340 345 350
Tyr Asp Ile Leu Asp Trp Lys Arg Gln His Gln His Tyr Leu Glu Ser
355 360 365
Met Gln Leu Ile Asn Val Pro Gln Val Val Asn Glu Lys Pro Val Leu
370 375 380
Glu Ala Met Pro Thr Ser Glu Ala Pro Gln Pro Ala Val Pro Ala Pro
385 390 395 400
Gly Lys Lys Lys Ala Gln Tyr Glu Glu Pro Gln Ala Pro Pro Pro Val
405 410 415
Thr Ser Val Ile Thr Thr Glu Val Asp Met Arg Tyr Tyr Asn Tyr Leu
420 425 430
Leu Asn Pro Ile Arg Glu Glu Phe Ile Ser Val Pro Leu Ile Leu His
435 440 445
Cys Met Leu Glu Gln Val Val Ala Thr Glu Glu Asp Leu Val Pro Pro
450 455 460
Ser Leu Arg Glu Pro Ser Pro Arg Ala Asp Gly Leu Asp His Arg Ile
465 470 475 480
Ala Ala His Ile Val Ser Leu Leu Pro Ser Leu Cys Leu Ser Glu Arg
485 490 495
Glu Lys Lys Asn Leu His Asp Ile Phe Leu Ser Glu Glu Glu Asn Glu
500 505 510
Ser Lys Ala Val Pro Lys Gly Pro Leu Leu Leu Asn Tyr His Asp Ala
515 520 525
His Ala His Lys Lys Tyr Ala Leu Gln Asp Gln Lys Asn Phe Asp Pro
530 535 540
Val Gln Ile Glu Gln Glu Met Gln Ser Lys Leu Pro Leu Trp Glu Phe
545 550 555 560
Leu Gln Phe Pro Leu Pro Pro Pro Trp Asn Asn Thr Lys Arg Leu Ala
565 570 575
Thr Ile His Glu Leu Met His Phe Cys Thr Ser Asp Val Leu Ser Trp
580 585 590
Asn Glu Val Glu Arg Ala Phe Lys Val Phe Thr Phe Glu Ser Leu Lys
595 600 605
Leu Ser Glu Val Asp Glu Lys Gly Lys Leu Lys Pro Ser Gly Met Met
610 615 620
Cys Gly Ser Asp Ser Glu Met Phe Asn Ile Pro Trp Asp Asn Pro Ala
625 630 635 640
Arg Phe Ala Lys Gln Ile Arg Gln Gln Tyr Val Met Lys Met Asn Thr
645 650 655
Gln Glu Ala Lys Gln Lys Ala Asp Ile Lys Ile Lys Asp Arg Thr Leu
660 665 670
Phe Val Asp Gln Asn Leu Ser Met Ser Val Gln Asp Asn Glu Ser Asn
675 680 685
Arg Glu Pro Ser Asp Pro Ser Gln Cys Asp Ala Asn Asn Met Lys His
690 695 700
Ser Asp Leu Asn Asn Leu Lys Leu Ser Val Pro Asp Asn Arg Gln Leu
705 710 715 720
Leu Glu Gln Glu Ser Ile Met Lys Ala Gln Pro Gln His Glu Ser Leu
725 730 735
Glu Gln Thr Thr Asn Asn Glu Ile Lys Asp Asp Ala Val Thr Lys Ala
740 745 750
Asp Ser His Glu Lys Lys Pro Lys Lys Met Met Val Glu Ala Asp Leu
755 760 765
Glu Asp Ile Lys Lys Thr Gln Gln Arg Ser Leu Met Asp Trp Ser Phe
770 775 780
Thr Glu His Phe Lys Pro Lys Val Leu Leu Gln Val Leu Gln Glu Ala
785 790 795 800
His Lys Gln Tyr Arg Cys Val Asp Ser Tyr Tyr His Thr Gln Asp Asn
805 810 815
Ser Leu Leu Leu Val Phe His Asn Pro Met Asn Arg Gln Arg Leu His
820 825 830
Cys Glu Tyr Trp Asn Ile Ala Leu His Ser Asn Val Gly Phe Arg Asn
835 840 845
Tyr Leu Glu Leu Val Ala Lys Ser Ile Gln Asp Trp Ile Thr Lys Glu
850 855 860
Glu Ala Ile Tyr Gln Glu Ser Lys Met Asn Glu Lys Ile Ile Arg Thr
865 870 875 880
Arg Ala Glu Leu Glu Leu Lys Ser Ser Ala Asn Ala Lys Leu Thr Ser
885 890 895
Ala Ser Lys Ile Phe Ser Ile Lys Glu Ser Lys Ser Asn Lys Gly Ile
900 905 910
Ser Lys Thr Glu Ile Ser Asp Gln Glu Lys Glu Lys Glu Lys Glu Lys
915 920 925
Ile Pro Phe Ile Leu Glu Gly Ser Leu Lys Ala Trp Lys Glu Glu Gln
930 935 940
His Arg Leu Ala Glu Glu Glu Arg Leu Arg Glu Glu Lys Lys Ala Glu
945 950 955 960
Lys Lys Gly Lys Glu Ala Gly Lys Lys Lys Gly Lys Asp Asn Ala Glu
965 970 975
Lys Glu Asp Ser Arg Ser Leu Lys Lys Lys Ser Pro Tyr Lys Glu Lys
980 985 990
Ser Lys Glu Glu Gln Val Lys Ile Gln Glu Val Thr Glu Glu Ser Pro
995 1000 1005
His Gln Pro Glu Pro Lys Ile Thr Tyr Pro Phe His Gly Tyr Asn Met
1010 1015 1020
Gly Asn Ile Pro Thr Gln Ile Ser Gly Ser Asn Tyr Tyr Leu Tyr Pro
1025 1030 1035 1040
Ser Asp Gly Gly Gln Ile Glu Val Glu Lys Thr Met Phe Glu Lys Gly
1045 1050 1055
Pro Thr Phe Ile Lys Val Arg Val Val Lys Asp Asn His Asn Phe Met
1060 1065 1070
Ile His Leu Asn Asp Pro Lys Glu Ile Val Lys Lys Glu Glu Lys Gly
1075 1080 1085
Asp Tyr Tyr Leu Glu Glu Glu Glu Glu Gly Asp Glu Glu Gln Ser Leu
1090 1095 1100
Glu Thr Glu Val Ser Asp Ala Lys Asn Lys Ala Phe Ser Lys Phe Gly
1105 1110 1115 1120
Ser Phe Ser Ala Thr Leu Glu Asn Gly Ile Cys Leu Ser Ile Ser Tyr
1125 1130 1135
Tyr Gly Ser Asn Gly Met Ala Pro Glu Asp Lys Asp Pro Asp Leu Glu
1140 1145 1150
Thr Ile Leu Asn Ile Pro Ser Ala Leu Thr Pro Thr Val Val Pro Val
1155 1160 1165
Ile Val Thr Val Pro Gln Ser Lys Ala Lys Gly Lys Ile Lys Gly Lys
1170 1175 1180
Glu Lys Pro Lys Glu Ser Leu Lys Glu Glu Glu His Pro Lys Glu Glu
1185 1190 1195 1200
Glu Lys Lys Glu Glu Glu Val Glu Pro Glu Pro Val Leu Gln Glu Thr
1205 1210 1215
Leu Asp Val Pro Thr Phe Gln Ser Leu Asn Val Ser Cys Pro Ser Gly
1220 1225 1230
Leu Leu Leu Thr Phe Ile Gly Gln Glu Ser Thr Gly Gln Tyr Val Ile
1235 1240 1245
Asp Glu Glu Pro Thr Trp Asp Ile Met Val Arg Gln Ser Tyr Pro Gln
1250 1255 1260
Arg Val Lys His Tyr Glu Phe Tyr Lys Thr Val Met Pro Pro Ala Glu
1265 1270 1275 1280
Gln Glu Ala Ser Arg Val Ile Thr Ser Gln Gly Thr Val Val Lys Tyr
1285 1290 1295
Met Leu Asp Gly Ser Thr Gln Ile Leu Phe Ala Asp Gly Ala Val Ser
1300 1305 1310
Arg Ser Pro Asn Ser Gly Leu Ile Cys Pro Pro Ser Glu Met Pro Ala
1315 1320 1325
Thr Pro His Ser Gly Asp Leu Met Asp Ser Ile Ser Gln Gln Lys Ser
1330 1335 1340
Glu Thr Ile Pro Ser Glu Ile Thr Asn Thr Lys Lys Gly Lys Ser His
1345 1350 1355 1360
Lys Ser Gln Ser Ser Met Ala His Lys Gly Glu Ile His Asp Pro Pro
1365 1370 1375
Pro Glu Ala Val Gln Thr Val Thr Pro Val Glu Val His Ile Gly Thr
1380 1385 1390
Trp Phe Thr Thr Thr Pro Glu Gly Asn Arg Ile Gly Thr Lys Gly Leu
1395 1400 1405
Glu Arg Ile Ala Asp Leu Thr Pro Leu Leu Ser Phe Gln Ala Thr Asp
1410 1415 1420
Pro Val Asn Gly Thr Val Met Thr Thr Arg Glu Asp Lys Val Val Ile
1425 1430 1435 1440
Val Glu Arg Lys Asp Gly Thr Arg Ile Val Asp His Ala Asp Gly Thr
1445 1450 1455
Arg Ile Thr Thr Phe Tyr Gln Val Tyr Glu Asp Gln Ile Ile Leu Pro
1460 1465 1470
Asp Asp Gln Glu Thr Thr Glu Gly Pro Arg Thr Val Thr Arg Gln Val
1475 1480 1485
Lys Cys Met Arg Val Glu Ser Ser Arg Tyr Ala Thr Val Ile Ala Asn
1490 1495 1500
Cys Glu Asp Ser Ser Cys Cys Ala Thr Phe Gly Asp Gly Thr Thr Ile
1505 1510 1515 1520
Ile Ala Lys Pro Gln Gly Thr Tyr Gln Val Leu Pro Pro Asn Thr Gly
1525 1530 1535
Ser Leu Tyr Ile Asp Lys Asp Cys Ser Ala Val Tyr Cys His Glu Ser
1540 1545 1550
Ser Ser Asn Ile Tyr Tyr Pro Phe Gln Lys Arg Glu Gln Leu Arg Ala
1555 1560 1565
Gly Arg Tyr Ile Met Arg His Thr Ser Glu Val Ile Cys Glu Val Leu
1570 1575 1580
Asp Pro Glu Gly Asn Thr Phe Gln Val Met Ala Asp Gly Ser Ile Ser
1585 1590 1595 1600
Thr Ile Leu Pro Glu Lys Lys Leu Glu Asp Asp Leu Asn Glu Lys Thr
1605 1610 1615
Glu Gly Tyr Asp Ser Leu Ser Ser Met His Leu Glu Lys Asn His Gln
1620 1625 1630
Gln Ile Tyr Gly Glu His Val Pro Arg Phe Phe Val Met Tyr Ala Asp
1635 1640 1645
Gly Ser Gly Met Glu Leu Leu Arg Asp Ser Asp Ile Glu Glu Tyr Leu
1650 1655 1660
Ser Leu Ala Tyr Lys Glu Ser Asn Thr Val Val Leu Gln Glu Pro Val
1665 1670 1675 1680
Gln Glu Gln Pro Gly Thr Leu Thr Ile Thr Val Leu Arg Pro Phe His
1685 1690 1695
Glu Ala Ser Pro Trp Gln Val Lys Lys Glu Asp Thr Ile Val Pro Pro
1700 1705 1710
Asn Leu Arg Ser Arg Ser Trp Glu Thr Phe Pro Ser Val Glu Lys Lys
1715 1720 1725
Thr Pro Gly Pro Pro Phe Gly Thr Gln Ile Trp Lys Gly Leu Cys Ile
1730 1735 1740
Glu Ser Lys Gln Leu Val Ser Ala Pro Gly Ala Ile Leu Lys Ser Pro
1745 1750 1755 1760
Ser Val Leu Gln Met Arg Gln Phe Ile Gln His Glu Val Ile Lys Asn
1765 1770 1775
Glu Val Lys Leu Arg Leu Gln Val Ser Leu Lys Asp Tyr Ile Asn Tyr
1780 1785 1790
Ile Leu Lys Lys Glu Asp Glu Leu Gln Glu Met Met Val Lys Asp Ser
1795 1800 1805
Arg Thr Glu Glu Glu Arg Gly Asn Ala Ala Asp Leu Leu Lys Leu Val
1810 1815 1820
Met Ser Phe Pro Lys Met Glu Glu Thr Thr Lys Ser His Val Thr Glu
1825 1830 1835 1840
Val Ala Ala His Leu Thr Asp Leu Phe Lys Gln Ser Leu Ala Thr Pro
1845 1850 1855
Pro Lys Cys Pro Pro Asp Thr Phe Gly Lys Asp Phe Phe Glu Lys Thr
1860 1865 1870
Trp Arg His Thr Ala Ser Ser Lys Arg Trp Lys Glu Lys Ile Asp Lys
1875 1880 1885
Thr Arg Lys Glu Ile Glu Thr Thr Gln Asn Tyr Leu Met Asp Ile Lys
1890 1895 1900
Asn Arg Ile Ile Pro Pro Phe Phe Lys Ser Glu Leu Asn Gln Leu Tyr
1905 1910 1915 1920
Gln Ser Gln Tyr Asn His Leu Asp Ser Leu Ser Lys Lys Leu Pro Ser
1925 1930 1935
Phe Thr Lys Lys Asn Glu Asp Ala Asn Glu Thr Ala Val Gln Asp Thr
1940 1945 1950
Ser Asp Leu Asn Leu Asp Phe Lys Pro His Lys Val Ser Glu Gln Lys
1955 1960 1965
Ser Ser Ser Val Pro Ser Leu Pro Lys Pro Glu Ile Ser Ala Asp Lys
1970 1975 1980
Lys Asp Phe Thr Ala Gln Asn Gln Thr Glu Asn Leu Thr Lys Ser Pro
1985 1990 1995 2000
Glu Glu Ala Glu Ser Tyr Glu Pro Val Lys Ile Pro Thr Gln Ser Leu
2005 2010 2015
Leu Gln Asp Val Ala Gly Gln Thr Arg Lys Glu Lys Val Lys Leu Pro
2020 2025 2030
His Tyr Leu Leu Ser Ser Lys Pro Lys Ser Gln Pro Leu Ala Lys Val
2035 2040 2045
Gln Asp Ser Val Gly Gly Lys Val Asn Thr Ser Ser Val Ala Ser Ala
2050 2055 2060
Ala Ile Asn Asn Ala Lys Ser Ser Leu Phe Gly Phe His Leu Leu Pro
2065 2070 2075 2080
Ser Ser Val Lys Phe Gly Val Leu Lys Glu Gly His Thr Tyr Ala Thr
2085 2090 2095
Val Val Lys Leu Lys Asn Val Gly Val Asp Phe Cys Arg Phe Lys Val
2100 2105 2110
Lys Gln Pro Pro Pro Ser Thr Gly Leu Lys Val Thr Tyr Lys Pro Gly
2115 2120 2125
Pro Val Ala Ala Gly Met Gln Thr Glu Leu Asn Ile Glu Leu Phe Ala
2130 2135 2140
Thr Ala Val Gly Glu Asp Gly Ala Lys Gly Ser Ala His Ile Ser His
2145 2150 2155 2160
Asn Ile Glu Ile Met Thr Glu His Glu Val Leu Phe Leu Pro Val Glu
2165 2170 2175
Ala Thr Val Leu Thr Ser Ser Asn Tyr Asp Lys Arg Pro Lys Asp Phe
2180 2185 2190
Pro Gln Gly Lys Glu Asn Pro Met Val Gln Arg Thr Ser Thr Ile Tyr
2195 2200 2205
Ser Ser Thr Leu Gly Val Phe Met Ser Arg Lys Val Ser Pro His
2210 2215 2220
<210> 16
<211> 213
<212> PRT
<213> CLEC4C protein
<400> 16
Met Val Pro Glu Glu Glu Pro Gln Asp Arg Glu Lys Gly Leu Trp Trp
1 5 10 15
Phe Gln Leu Lys Val Trp Ser Met Ala Val Val Ser Ile Leu Leu Leu
20 25 30
Ser Val Cys Phe Thr Val Ser Ser Val Val Pro His Asn Phe Met Tyr
35 40 45
Ser Lys Thr Val Lys Arg Leu Ser Lys Leu Arg Glu Tyr Gln Gln Tyr
50 55 60
His Pro Ser Leu Thr Cys Val Met Glu Gly Lys Asp Ile Glu Asp Trp
65 70 75 80
Ser Cys Cys Pro Thr Pro Trp Thr Ser Phe Gln Ser Ser Cys Tyr Phe
85 90 95
Ile Ser Thr Gly Met Gln Ser Trp Thr Lys Ser Gln Lys Asn Cys Ser
100 105 110
Val Met Gly Ala Asp Leu Val Val Ile Asn Thr Arg Glu Glu Gln Asp
115 120 125
Phe Ile Ile Gln Asn Leu Lys Arg Asn Ser Ser Tyr Phe Leu Gly Leu
130 135 140
Ser Asp Pro Gly Gly Arg Arg His Trp Gln Trp Val Asp Gln Thr Pro
145 150 155 160
Tyr Asn Glu Asn Val Thr Phe Trp His Ser Gly Glu Pro Asn Asn Leu
165 170 175
Asp Glu Arg Cys Ala Ile Ile Asn Phe Arg Ser Ser Glu Glu Trp Gly
180 185 190
Trp Asn Asp Ile His Cys His Val Pro Gln Lys Ser Ile Cys Lys Met
195 200 205
Lys Lys Ile Tyr Ile
210
<210> 17
<211> 4012
<212> PRT
<213> FRAS1 protein
<400> 17
Met Gly Val Leu Lys Val Trp Leu Gly Leu Ala Leu Ala Leu Ala Glu
1 5 10 15
Phe Ala Val Leu Pro His His Ser Glu Gly Ala Cys Val Tyr Gln Asp
20 25 30
Ser Leu Leu Ala Asp Ala Thr Ile Trp Lys Pro Asp Ser Cys Gln Ser
35 40 45
Cys Arg Cys His Gly Asp Ile Val Ile Cys Lys Pro Ala Val Cys Arg
50 55 60
Asn Pro Gln Cys Ala Phe Glu Lys Gly Glu Val Leu Gln Ile Ala Ala
65 70 75 80
Asn Gln Cys Cys Pro Glu Cys Val Leu Arg Thr Pro Gly Ser Cys His
85 90 95
His Glu Lys Lys Ile His Glu His Gly Thr Glu Trp Ala Ser Ser Pro
100 105 110
Cys Ser Val Cys Ser Cys Asn His Gly Glu Val Arg Cys Thr Pro Gln
115 120 125
Pro Cys Pro Pro Leu Ser Cys Gly His Gln Glu Leu Ala Phe Ile Pro
130 135 140
Glu Gly Ser Cys Cys Pro Val Cys Val Gly Leu Gly Lys Pro Cys Ser
145 150 155 160
Tyr Glu Gly His Val Phe Gln Asp Gly Glu Asp Trp Arg Leu Ser Arg
165 170 175
Cys Ala Lys Cys Leu Cys Arg Asn Gly Val Ala Gln Cys Phe Thr Ala
180 185 190
Gln Cys Gln Pro Leu Phe Cys Asn Gln Asp Glu Thr Val Val Arg Val
195 200 205
Pro Gly Lys Cys Cys Pro Gln Cys Ser Ala Arg Ser Cys Ser Ala Ala
210 215 220
Gly Gln Val Tyr Glu His Gly Glu Gln Trp Ser Glu Asn Ala Cys Thr
225 230 235 240
Thr Cys Ile Cys Asp Arg Gly Glu Val Arg Cys His Lys Gln Ala Cys
245 250 255
Leu Pro Leu Arg Cys Gly Lys Gly Gln Ser Arg Ala Arg Arg His Gly
260 265 270
Gln Cys Cys Glu Glu Cys Val Ser Pro Ala Gly Ser Cys Ser Tyr Asp
275 280 285
Gly Val Val Arg Tyr Gln Asp Glu Met Trp Lys Gly Ser Ala Cys Glu
290 295 300
Phe Cys Met Cys Asp His Gly Gln Val Thr Cys Gln Thr Gly Glu Cys
305 310 315 320
Ala Lys Val Glu Cys Ala Arg Asp Glu Glu Leu Ile His Leu Asp Gly
325 330 335
Lys Cys Cys Pro Glu Cys Ile Ser Arg Asn Gly Tyr Cys Val Tyr Glu
340 345 350
Glu Thr Gly Glu Phe Met Ser Ser Asn Ala Ser Glu Val Lys Arg Ile
355 360 365
Pro Glu Gly Glu Lys Trp Glu Asp Gly Pro Cys Lys Val Cys Glu Cys
370 375 380
Arg Gly Ala Gln Val Thr Cys Tyr Glu Pro Ser Cys Pro Pro Cys Pro
385 390 395 400
Val Gly Thr Leu Ala Leu Glu Val Lys Gly Gln Cys Cys Pro Asp Cys
405 410 415
Thr Ser Val His Cys His Pro Asp Cys Leu Thr Cys Ser Gln Ser Pro
420 425 430
Asp His Cys Asp Leu Cys Gln Asp Pro Thr Lys Leu Leu Gln Asn Gly
435 440 445
Trp Cys Val His Ser Cys Gly Leu Gly Phe Tyr Gln Ala Gly Ser Leu
450 455 460
Cys Leu Ala Cys Gln Pro Gln Cys Ser Thr Cys Thr Ser Gly Leu Glu
465 470 475 480
Cys Ser Ser Cys Gln Pro Pro Leu Leu Met Arg His Gly Gln Cys Val
485 490 495
Pro Thr Cys Gly Asp Gly Phe Tyr Gln Asp Arg His Ser Cys Ala Val
500 505 510
Cys His Glu Ser Cys Ala Gly Cys Trp Gly Pro Thr Glu Lys His Cys
515 520 525
Leu Ala Cys Arg Asp Pro Leu His Val Leu Arg Asp Gly Gly Cys Glu
530 535 540
Ser Ser Cys Gly Lys Gly Phe Tyr Asn Arg Gln Gly Thr Cys Ser Ala
545 550 555 560
Cys Asp Gln Ser Cys Asp Ser Cys Gly Pro Ser Ser Pro Arg Cys Leu
565 570 575
Thr Cys Thr Glu Lys Thr Val Leu His Asp Gly Lys Cys Met Ser Glu
580 585 590
Cys Pro Gly Gly Tyr Tyr Ala Asp Ala Thr Gly Arg Cys Lys Val Cys
595 600 605
His Asn Ser Cys Ala Ser Cys Ser Gly Pro Thr Pro Ser His Cys Thr
610 615 620
Ala Cys Ser Pro Pro Lys Ala Leu Arg Gln Gly His Cys Leu Pro Arg
625 630 635 640
Cys Gly Glu Gly Phe Tyr Ser Asp His Gly Val Cys Lys Ala Cys His
645 650 655
Ser Ser Cys Leu Ala Cys Met Gly Pro Ala Pro Ser His Cys Thr Gly
660 665 670
Cys Lys Lys Pro Glu Glu Gly Leu Gln Val Glu Gln Leu Ser Asp Val
675 680 685
Gly Ile Pro Ser Gly Glu Cys Leu Ala Gln Cys Arg Ala His Phe Tyr
690 695 700
Leu Glu Ser Thr Gly Ile Cys Glu Ala Cys His Gln Ser Cys Phe Arg
705 710 715 720
Cys Ala Gly Lys Ser Pro His Asn Cys Thr Asp Cys Gly Pro Ser His
725 730 735
Val Leu Leu Asp Gly Gln Cys Leu Ser Gln Cys Pro Asp Gly Tyr Phe
740 745 750
His Gln Glu Gly Ser Cys Thr Glu Cys His Pro Thr Cys Arg Gln Cys
755 760 765
His Gly Pro Leu Glu Ser Asp Cys Ile Ser Cys Tyr Pro His Ile Ser
770 775 780
Leu Thr Asn Gly Asn Cys Arg Thr Ser Cys Arg Glu Glu Gln Phe Leu
785 790 795 800
Asn Leu Val Gly Tyr Cys Ala Asp Cys His His Leu Cys Gln His Cys
805 810 815
Ala Ala Asp Leu His Asn Thr Gly Ser Ile Cys Leu Arg Cys Gln Asn
820 825 830
Ala His Tyr Leu Leu Leu Gly Asp His Cys Val Pro Asp Cys Pro Ser
835 840 845
Gly Tyr Tyr Ala Glu Arg Gly Ala Cys Lys Lys Cys His Ser Ser Cys
850 855 860
Arg Thr Cys Gln Gly Arg Gly Pro Phe Ser Cys Ser Ser Cys Asp Thr
865 870 875 880
Asn Leu Val Leu Ser His Thr Gly Thr Cys Ser Thr Thr Cys Phe Pro
885 890 895
Gly His Tyr Leu Asp Asp Asn His Val Cys Gln Pro Cys Asn Thr His
900 905 910
Cys Gly Ser Cys Asp Ser Gln Ala Ser Cys Thr Ser Cys Arg Asp Pro
915 920 925
Asn Lys Val Leu Leu Phe Gly Glu Cys Gln Tyr Glu Ser Cys Ala Pro
930 935 940
Gln Tyr Tyr Leu Asp Phe Ser Thr Asn Thr Cys Lys Glu Cys Asp Trp
945 950 955 960
Ser Cys Ser Ala Cys Ser Gly Pro Leu Lys Thr Asp Cys Leu Gln Cys
965 970 975
Met Asp Gly Tyr Val Leu Gln Asp Gly Ala Cys Val Glu Gln Cys Leu
980 985 990
Ser Ser Phe Tyr Gln Asp Ser Gly Leu Cys Lys Asn Cys Asp Ser Tyr
995 1000 1005
Cys Leu Gln Cys Gln Gly Pro His Glu Cys Thr Arg Cys Lys Gly Pro
1010 1015 1020
Phe Leu Leu Leu Glu Ala Gln Cys Val Gln Glu Cys Gly Lys Gly Tyr
1025 1030 1035 1040
Phe Ala Asp His Ala Lys His Lys Cys Thr Ala Cys Pro Gln Gly Cys
1045 1050 1055
Leu Gln Cys Ser His Arg Asp Arg Cys His Leu Cys Asp His Gly Phe
1060 1065 1070
Phe Leu Lys Ser Gly Leu Cys Val Tyr Asn Cys Val Pro Gly Phe Ser
1075 1080 1085
Val His Thr Ser Asn Glu Thr Cys Ser Gly Lys Ile His Thr Pro Ser
1090 1095 1100
Leu His Val Asn Gly Ser Leu Ile Leu Pro Ile Gly Ser Ile Lys Pro
1105 1110 1115 1120
Leu Asp Phe Ser Leu Leu Asn Val Gln Asp Gln Glu Gly Arg Val Glu
1125 1130 1135
Asp Leu Leu Phe His Val Val Ser Thr Pro Thr Asn Gly Gln Leu Val
1140 1145 1150
Leu Ser Arg Asn Gly Lys Glu Val Gln Leu Asp Lys Ala Gly Arg Phe
1155 1160 1165
Ser Trp Lys Asp Val Asn Glu Lys Lys Val Arg Phe Val His Ser Lys
1170 1175 1180
Glu Lys Leu Arg Lys Gly Tyr Leu Phe Leu Lys Ile Ser Asp Gln Gln
1185 1190 1195 1200
Phe Phe Ser Glu Pro Gln Leu Ile Asn Ile Gln Ala Phe Ser Thr Gln
1205 1210 1215
Ala Pro Tyr Val Leu Arg Asn Glu Val Leu His Ile Ser Arg Gly Glu
1220 1225 1230
Arg Ala Thr Ile Thr Thr Gln Met Leu Asp Ile Arg Asp Asp Asp Asn
1235 1240 1245
Pro Gln Asp Val Val Ile Glu Ile Ile Asp Pro Pro Leu His Gly Gln
1250 1255 1260
Leu Leu Gln Thr Leu Gln Ser Pro Ala Thr Pro Ile Tyr Gln Phe Gln
1265 1270 1275 1280
Leu Asp Glu Leu Ser Arg Gly Leu Leu His Tyr Ala His Asp Gly Ser
1285 1290 1295
Asp Ser Thr Ser Asp Val Ala Val Leu Gln Ala Asn Asp Gly His Ser
1300 1305 1310
Phe His Asn Ile Leu Phe Gln Val Lys Thr Val Pro Gln Asn Asp Arg
1315 1320 1325
Gly Leu Gln Leu Val Ala Asn Ser Met Val Trp Val Pro Glu Gly Gly
1330 1335 1340
Met Leu Gln Ile Thr Asn Arg Ile Leu Gln Ala Glu Ala Pro Gly Ala
1345 1350 1355 1360
Ser Ala Glu Glu Ile Ile Tyr Lys Ile Thr Gln Asp Tyr Pro Gln Phe
1365 1370 1375
Gly Glu Val Val Leu Leu Val Asn Met Pro Ala Asp Ser Pro Ala Asp
1380 1385 1390
Glu Gly Gln His Leu Pro Asp Gly Arg Thr Ala Thr Pro Thr Ser Thr
1395 1400 1405
Phe Thr Gln Gln Asp Ile Asn Glu Gly Ile Val Trp Tyr Arg His Ser
1410 1415 1420
Gly Ala Pro Ala Gln Ser Asp Ser Phe Arg Phe Glu Val Ser Ser Ala
1425 1430 1435 1440
Ser Asn Ala Gln Thr Arg Leu Glu Ser His Met Phe Asn Ile Ala Ile
1445 1450 1455
Leu Pro Gln Thr Pro Glu Ala Pro Lys Val Ser Leu Glu Ala Ser Leu
1460 1465 1470
His Met Thr Ala Arg Glu Asp Gly Leu Thr Val Ile Gln Pro His Ser
1475 1480 1485
Leu Ser Phe Ile Asn Ser Glu Lys Pro Ser Gly Lys Ile Val Tyr Asn
1490 1495 1500
Ile Thr Leu Pro Leu His Pro Asn Gln Gly Ile Ile Glu His Arg Asp
1505 1510 1515 1520
His Pro His Ser Pro Ile Arg Tyr Phe Thr Gln Glu Asp Ile Asn Gln
1525 1530 1535
Gly Lys Val Met Tyr Arg Pro Pro Pro Ala Ala Pro His Leu Gln Glu
1540 1545 1550
Leu Met Ala Phe Ser Phe Ala Gly Leu Pro Glu Ser Val Lys Phe His
1555 1560 1565
Phe Thr Val Ser Asp Gly Glu His Thr Ser Pro Glu Met Val Leu Thr
1570 1575 1580
Ile His Leu Leu Pro Ser Asp Gln Gln Leu Pro Val Phe Gln Val Thr
1585 1590 1595 1600
Ala Pro Arg Leu Ala Val Ser Pro Gly Gly Ser Thr Ser Val Gly Leu
1605 1610 1615
Gln Val Val Val Arg Asp Ala Glu Thr Ala Pro Lys Glu Leu Phe Phe
1620 1625 1630
Glu Leu Arg Arg Pro Pro Gln His Gly Val Leu Leu Lys His Thr Ala
1635 1640 1645
Glu Phe Arg Arg Pro Met Ala Thr Gly Asp Thr Phe Thr Tyr Glu Asp
1650 1655 1660
Val Glu Lys Asn Ala Leu Gln Tyr Ile His Asp Gly Ser Ser Thr Arg
1665 1670 1675 1680
Glu Asp Ser Met Glu Ile Ser Val Thr Asp Gly Leu Thr Val Thr Met
1685 1690 1695
Leu Glu Val Arg Val Glu Val Ser Leu Ser Glu Asp Arg Gly Pro Arg
1700 1705 1710
Leu Ala Ala Gly Ser Ser Leu Ser Ile Thr Val Ala Ser Lys Ser Thr
1715 1720 1725
Ala Ile Ile Thr Arg Ser His Leu Ala Tyr Val Asp Asp Ser Ser Pro
1730 1735 1740
Asp Pro Glu Ile Trp Ile Gln Leu Asn Tyr Leu Pro Ser Tyr Gly Thr
1745 1750 1755 1760
Leu Leu Arg Ile Ser Gly Ser Glu Val Glu Glu Leu Ser Glu Val Ser
1765 1770 1775
Asn Phe Thr Met Glu Asp Ile Asn Asn Lys Lys Ile Arg Tyr Ser Ala
1780 1785 1790
Val Phe Glu Thr Asp Gly His Leu Val Thr Asp Ser Phe Tyr Phe Ser
1795 1800 1805
Val Ser Asp Met Asp His Asn His Leu Asp Asn Gln Ile Phe Thr Ile
1810 1815 1820
Met Ile Thr Pro Ala Glu Asn Pro Pro Pro Val Ile Ala Phe Ala Asp
1825 1830 1835 1840
Leu Ile Thr Val Asp Glu Gly Gly Arg Ala Pro Leu Ser Phe His His
1845 1850 1855
Phe Phe Ala Thr Asp Asp Asp Asp Asn Leu Gln Arg Asp Ala Ile Ile
1860 1865 1870
Lys Leu Ser Ala Leu Pro Lys Tyr Gly Cys Ile Glu Asn Thr Gly Thr
1875 1880 1885
Gly Asp Arg Phe Gly Pro Glu Thr Ala Ser Asp Leu Glu Ala Ser Phe
1890 1895 1900
Pro Ile Gln Asp Val Leu Glu Asn Tyr Ile Tyr Tyr Phe Gln Ser Val
1905 1910 1915 1920
His Glu Ser Ile Glu Pro Thr His Asp Ile Phe Ser Phe Tyr Val Ser
1925 1930 1935
Asp Gly Thr Ser Arg Ser Glu Ile His Ser Ile Asn Ile Thr Ile Glu
1940 1945 1950
Arg Lys Asn Asp Glu Pro Pro Arg Met Thr Leu Gln Pro Leu Arg Val
1955 1960 1965
Gln Leu Ser Ser Gly Val Val Ile Ser Asn Ser Ser Leu Ser Leu Gln
1970 1975 1980
Asp Leu Asp Thr Pro Asp Asn Glu Leu Ile Phe Val Leu Thr Lys Lys
1985 1990 1995 2000
Pro Asp His Gly His Val Leu Trp Arg Gln Thr Ala Ser Glu Pro Leu
2005 2010 2015
Glu Asn Gly Arg Val Leu Val Gln Gly Ser Thr Phe Thr Tyr Gln Asp
2020 2025 2030
Ile Leu Ala Gly Leu Val Gly Tyr Val Pro Ser Val Pro Gly Met Val
2035 2040 2045
Val Asp Glu Phe Gln Phe Ser Leu Thr Asp Gly Leu His Val Asp Thr
2050 2055 2060
Gly Arg Met Lys Ile Tyr Thr Glu Leu Pro Ala Ser Asp Thr Pro His
2065 2070 2075 2080
Leu Ala Ile Asn Gln Gly Leu Gln Leu Ser Ala Gly Ser Val Ala Arg
2085 2090 2095
Ile Thr Glu Gln His Leu Lys Val Thr Asp Ile Asp Ser Asp Asp His
2100 2105 2110
Gln Val Met Tyr Ile Met Lys Glu Asp Pro Gly Ala Gly Arg Leu Gln
2115 2120 2125
Met Met Lys His Gly Asn Leu Glu Gln Ile Ser Ile Lys Gly Pro Ile
2130 2135 2140
Arg Ser Phe Thr Gln Ala Asp Ile Ser Gln Gly His Val Glu Tyr Ser
2145 2150 2155 2160
His Gly Thr Gly Glu Pro Gly Gly Ser Phe Ala Phe Lys Phe Asp Val
2165 2170 2175
Val Asp Gly Glu Gly Asn Arg Leu Ile Asp Lys Ser Phe Ser Ile Ser
2180 2185 2190
Ile Leu Glu Asp Lys Ser Pro Pro Val Ile Thr Thr Asn Lys Gly Leu
2195 2200 2205
Val Leu Asp Glu Asn Ser Val Lys Lys Ile Thr Thr Leu Gln Leu Ser
2210 2215 2220
Ala Thr Asp Gln Asp Ser Gly Pro Thr Glu Leu Ile Tyr Arg Ile Thr
2225 2230 2235 2240
Arg Gln Pro Gln Leu Gly His Leu Glu His Ala Ala Ser Pro Gly Ile
2245 2250 2255
Gln Ile Ser Ser Phe Thr Gln Ala Asp Leu Thr Ser Arg Asn Val Gln
2260 2265 2270
Tyr Val His Ser Ser Glu Ala Glu Lys His Ser Asp Ala Phe Ser Phe
2275 2280 2285
Thr Leu Ser Asp Gly Val Ser Glu Val Thr Gln Thr Phe His Ile Thr
2290 2295 2300
Leu His Pro Val Asp Asp Ser Leu Pro Val Val Gln Asn Leu Gly Met
2305 2310 2315 2320
Arg Val Gln Glu Gly Met Arg Lys Thr Ile Thr Glu Phe Glu Leu Lys
2325 2330 2335
Ala Val Asp Ala Asp Thr Glu Ala Glu Ser Val Thr Phe Thr Ile Val
2340 2345 2350
Gln Pro Pro Arg His Gly Thr Ile Glu Arg Thr Ser Asn Gly Gln His
2355 2360 2365
Phe His Leu Thr Ser Thr Phe Thr Met Lys Asp Ile Tyr Gln Asn Arg
2370 2375 2380
Val Ser Tyr Ser His Asp Gly Ser Asn Ser Leu Lys Asp Arg Phe Thr
2385 2390 2395 2400
Phe Thr Val Ser Asp Gly Thr Asn Pro Phe Phe Ile Ile Glu Glu Gly
2405 2410 2415
Gly Lys Glu Ile Met Thr Ala Ala Pro Gln Pro Phe Arg Val Asp Ile
2420 2425 2430
Leu Pro Val Asp Asp Gly Thr Pro Arg Ile Val Thr Asn Leu Gly Leu
2435 2440 2445
Gln Trp Leu Glu Tyr Met Asp Gly Lys Ala Thr Asn Leu Ile Thr Lys
2450 2455 2460
Lys Glu Leu Leu Thr Met Asp Pro Asp Thr Glu Asp Ala Gln Leu Val
2465 2470 2475 2480
Tyr Glu Ile Thr Thr Gly Pro Lys His Gly Phe Val Glu Asn Lys Leu
2485 2490 2495
Gln Pro Gly Arg Ala Ala Ala Thr Phe Thr Gln Glu Asp Val Asn Leu
2500 2505 2510
Gly Leu Ile Arg Tyr Val Leu His Lys Glu Lys Ile Arg Glu Met Met
2515 2520 2525
Asp Ser Phe Gln Phe Leu Val Lys Asp Ser Lys Pro Asn Val Val Ser
2530 2535 2540
Asp Asn Val Phe His Ile Gln Trp Ser Leu Ile Ser Phe Lys Tyr Thr
2545 2550 2555 2560
Ser Tyr Asn Val Ser Glu Lys Ala Gly Ser Val Ser Val Thr Val Gln
2565 2570 2575
Arg Thr Gly Asn Leu Asn Gln Tyr Ala Ile Val Leu Cys Arg Thr Glu
2580 2585 2590
Gln Gly Thr Ala Ser Ser Ser Ser Arg Val Ser Ser Gln Pro Gly Gln
2595 2600 2605
Gln Asp Tyr Val Glu Tyr Ala Gly Gln Val Gln Phe Asp Glu Arg Glu
2610 2615 2620
Asp Thr Lys Ser Cys Thr Ile Val Ile Asn Asp Asp Asp Val Phe Glu
2625 2630 2635 2640
Asn Val Glu Ser Phe Thr Val Glu Leu Ser Met Pro Ala Tyr Ala Leu
2645 2650 2655
Leu Gly Glu Phe Thr Gln Ala Lys Val Ile Ile Asn Asp Thr Glu Asp
2660 2665 2670
Glu Pro Thr Leu Glu Phe Asp Lys Lys Ile Tyr Trp Val Asn Glu Ser
2675 2680 2685
Ala Gly Phe Leu Phe Ala Pro Ile Glu Arg Lys Gly Asp Ala Ser Ser
2690 2695 2700
Ile Val Ser Ala Ile Cys Tyr Thr Val Pro Lys Ser Ala Met Gly Ser
2705 2710 2715 2720
Ser Leu Tyr Ala Leu Glu Ser Gly Ser Asp Phe Lys Ser Arg Gly Met
2725 2730 2735
Ser Ala Ala Ser Arg Val Ile Phe Gly Pro Gly Val Thr Met Ser Thr
2740 2745 2750
Cys Asp Val Met Leu Ile Asp Asp Ser Glu Tyr Glu Glu Glu Glu Glu
2755 2760 2765
Phe Glu Ile Ala Leu Ala Asp Ala Ser Asp Asn Ala Arg Ile Gly Arg
2770 2775 2780
Val Ala Thr Ala Lys Val Leu Ile Ser Gly Pro Asn Asp Ala Ser Thr
2785 2790 2795 2800
Val Ser Leu Gly Asn Thr Ala Phe Thr Val Ser Glu Asp Ala Gly Thr
2805 2810 2815
Val Lys Ile Pro Val Ile Arg His Gly Thr Asp Leu Ser Thr Phe Ala
2820 2825 2830
Ser Val Trp Cys Ala Thr Arg Pro Ser Asp Pro Ala Ser Ala Thr Pro
2835 2840 2845
Gly Val Asp Tyr Val Pro Ser Ser Arg Lys Val Glu Phe Gly Pro Gly
2850 2855 2860
Val Ile Glu Gln Tyr Cys Thr Leu Thr Ile Leu Asp Asp Thr Gln Tyr
2865 2870 2875 2880
Pro Val Ile Glu Gly Leu Glu Thr Phe Val Val Phe Leu Ser Ser Ala
2885 2890 2895
Gln Gly Ala Glu Leu Thr Lys Pro Phe Gln Ala Val Ile Ala Ile Asn
2900 2905 2910
Asp Thr Phe Gln Asp Val Pro Ser Met Gln Phe Ala Lys Asp Leu Leu
2915 2920 2925
Leu Val Lys Glu Lys Glu Gly Val Leu His Val Pro Ile Thr Arg Ser
2930 2935 2940
Gly Asp Leu Ser Tyr Glu Ser Ser Val Arg Cys Tyr Thr Gln Ser His
2945 2950 2955 2960
Ser Ala Gln Val Met Glu Asp Phe Glu Glu Arg Gln Asn Ala Asp Ser
2965 2970 2975
Ser Arg Ile Thr Phe Leu Lys Gly Asp Lys Val Lys Asn Cys Thr Val
2980 2985 2990
Tyr Ile His Asp Asp Ser Met Phe Glu Pro Glu Glu Gln Phe Arg Val
2995 3000 3005
Tyr Leu Gly Leu Pro Leu Gly Asn His Trp Ser Gly Ala Arg Ile Gly
3010 3015 3020
Lys Asn Asn Met Ala Thr Ile Thr Ile Ser Asn Asp Glu Asp Ala Pro
3025 3030 3035 3040
Thr Ile Glu Phe Glu Glu Ala Ala Tyr Gln Val Arg Glu Pro Ala Gly
3045 3050 3055
Pro Asp Ala Ile Ala Ile Leu Asn Ile Lys Val Ile Arg Arg Gly Asp
3060 3065 3070
Gln Asn Arg Thr Ser Lys Val Arg Cys Ser Thr Arg Asp Gly Ser Ala
3075 3080 3085
Gln Ser Gly Val Asp Tyr Tyr Pro Lys Ser Arg Val Leu Lys Phe Ser
3090 3095 3100
Pro Gly Val Asp His Ile Phe Phe Lys Val Glu Ile Leu Ser Asn Glu
3105 3110 3115 3120
Asp Arg Glu Trp His Glu Ser Phe Ser Leu Val Leu Gly Pro Asp Asp
3125 3130 3135
Pro Val Glu Ala Val Leu Gly Asp Val Thr Thr Ala Thr Val Thr Ile
3140 3145 3150
Leu Asp Gln Glu Ala Ala Gly Ser Leu Ile Leu Pro Ala Pro Pro Ile
3155 3160 3165
Val Val Thr Leu Ala Asp Tyr Asp His Val Glu Glu Val Thr Lys Glu
3170 3175 3180
Gly Val Lys Lys Ser Pro Ser Pro Gly Tyr Pro Leu Val Cys Val Thr
3185 3190 3195 3200
Pro Cys Asp Pro His Phe Pro Arg Tyr Ala Val Met Lys Glu Arg Cys
3205 3210 3215
Ser Glu Ala Gly Ile Asn Gln Thr Ser Val Gln Phe Ser Trp Glu Val
3220 3225 3230
Ala Ala Pro Thr Asp Gly Asn Gly Ala Arg Ser Pro Phe Glu Thr Ile
3235 3240 3245
Thr Asp Asn Thr Pro Phe Thr Ser Val Asn His Met Val Leu Asp Ser
3250 3255 3260
Ile Tyr Phe Ser Arg Arg Phe His Val Arg Cys Val Ala Lys Ala Val
3265 3270 3275 3280
Asp Lys Val Gly His Val Gly Thr Pro Leu Arg Ser Asn Ile Val Thr
3285 3290 3295
Ile Gly Thr Asp Ser Ala Ile Cys His Thr Pro Val Val Ala Gly Thr
3300 3305 3310
Ser Arg Gly Phe Gln Ala Gln Ser Phe Ile Ala Thr Leu Lys Tyr Leu
3315 3320 3325
Asp Val Lys His Lys Glu His Pro Asn Arg Ile His Ile Ser Val Gln
3330 3335 3340
Ile Pro His Gln Asp Gly Met Leu Pro Leu Ile Ser Thr Met Pro Leu
3345 3350 3355 3360
His Asn Leu His Phe Leu Leu Ser Glu Ser Ile Tyr Arg His Gln His
3365 3370 3375
Val Cys Ser Asn Leu Val Thr Thr Tyr Asp Leu Arg Gly Ile Ser Glu
3380 3385 3390
Ala Gly Phe Leu Asp Asp Val Val Tyr Asp Ser Thr Ala Leu Gly Pro
3395 3400 3405
Gly Tyr Asp Arg Pro Phe Gln Phe Asp Pro Ser Val Arg Glu Pro Lys
3410 3415 3420
Thr Ile Gln Leu Tyr Lys His Leu Asn Leu Lys Ser Cys Val Trp Thr
3425 3430 3435 3440
Phe Asp Ala Tyr Tyr Asp Met Thr Glu Leu Ile Asp Val Cys Gly Gly
3445 3450 3455
Ser Val Thr Ala Asp Phe Gln Val Arg Asp Ser Ala Gln Ser Phe Leu
3460 3465 3470
Thr Val His Val Pro Leu Tyr Val Ser Tyr Ile Tyr Val Thr Ala Pro
3475 3480 3485
Arg Gly Trp Ala Ser Leu Glu His His Thr Glu Met Glu Phe Ser Phe
3490 3495 3500
Phe Tyr Asp Thr Val Leu Trp Arg Thr Gly Ile Gln Thr Asp Ser Val
3505 3510 3515 3520
Leu Ser Ala Arg Leu Gln Ile Ile Arg Ile Tyr Ile Arg Glu Asp Gly
3525 3530 3535
Arg Leu Val Ile Glu Phe Lys Thr His Ala Lys Phe Arg Gly Gln Phe
3540 3545 3550
Val Met Glu His His Thr Leu Pro Glu Val Lys Ser Phe Val Leu Thr
3555 3560 3565
Pro Asp His Leu Gly Gly Ile Glu Phe Asp Leu Gln Leu Leu Trp Ser
3570 3575 3580
Ala Gln Thr Phe Asp Ser Pro His Gln Leu Trp Arg Ala Thr Ser Ser
3585 3590 3595 3600
Tyr Asn Arg Lys Asp Tyr Ser Gly Glu Tyr Thr Ile Tyr Leu Ile Pro
3605 3610 3615
Cys Thr Val Gln Pro Thr Gln Pro Trp Val Asp Pro Gly Glu Lys Pro
3620 3625 3630
Leu Ala Cys Thr Ala His Ala Pro Glu Arg Phe Leu Ile Pro Ile Ala
3635 3640 3645
Phe Gln Gln Thr Asn Arg Pro Val Pro Val Val Tyr Ser Leu Asn Thr
3650 3655 3660
Glu Phe Gln Leu Cys Asn Asn Glu Lys Val Phe Leu Met Asp Pro Asn
3665 3670 3675 3680
Thr Ser Asp Met Ser Leu Ala Glu Met Asp Tyr Lys Gly Ala Phe Ser
3685 3690 3695
Lys Gly Gln Ile Leu Tyr Gly Arg Val Leu Trp Asn Pro Glu Gln Asn
3700 3705 3710
Leu Asn Ser Ala Tyr Lys Leu Gln Leu Glu Lys Val Tyr Leu Cys Thr
3715 3720 3725
Gly Lys Asp Gly Tyr Val Pro Phe Phe Asp Pro Thr Gly Thr Ile Tyr
3730 3735 3740
Asn Glu Gly Pro Gln Tyr Gly Cys Ile Gln Pro Asn Lys His Leu Lys
3745 3750 3755 3760
His Arg Phe Leu Leu Leu Asp Arg Asn Gln Pro Glu Val Thr Asp Lys
3765 3770 3775
Tyr Phe His Asp Val Pro Phe Glu Ala His Phe Ala Ser Glu Leu Pro
3780 3785 3790
Asp Phe His Val Val Ser Asn Met Pro Gly Val Asp Gly Phe Thr Leu
3795 3800 3805
Lys Val Asp Ala Leu Tyr Lys Val Glu Ala Gly His Gln Trp Tyr Leu
3810 3815 3820
Gln Val Ile Tyr Ile Ile Gly Pro Asp Thr Ile Ser Gly Pro Arg Val
3825 3830 3835 3840
Gln Arg Ser Leu Thr Ala Pro Leu Arg Arg Asn Arg Arg Asp Leu Val
3845 3850 3855
Glu Pro Asp Gly Gln Leu Ile Leu Asp Asp Ser Leu Ile Tyr Asp Asn
3860 3865 3870
Glu Gly Asp Gln Val Lys Asn Gly Thr Asn Met Lys Ser Leu Asn Leu
3875 3880 3885
Glu Met Gln Glu Leu Ala Val Ala Ala Ser Leu Ser Gln Thr Gly Ala
3890 3895 3900
Ser Ile Gly Ser Ala Leu Ala Ala Ile Met Leu Leu Leu Leu Val Phe
3905 3910 3915 3920
Leu Val Ala Cys Phe Ile Asn Arg Lys Cys Gln Lys Gln Arg Lys Lys
3925 3930 3935
Lys Pro Ala Glu Asp Ile Leu Glu Glu Tyr Pro Leu Asn Thr Lys Val
3940 3945 3950
Glu Val Pro Lys Arg His Pro Asp Arg Val Glu Lys Asn Val Asn Arg
3955 3960 3965
His Tyr Cys Thr Val Arg Asn Val Asn Ile Leu Ser Glu Pro Glu Ala
3970 3975 3980
Ala Tyr Thr Phe Lys Gly Ala Lys Val Lys Arg Leu Asn Leu Glu Val
3985 3990 3995 4000
Arg Val His Asn Asn Leu Gln Asp Gly Thr Glu Val
4005 4010
<210> 18
<211> 1469
<212> PRT
<213> ADGRL3 protein
<400> 18
Met Trp Pro Ser Gln Leu Leu Ile Phe Met Met Leu Leu Ala Pro Ile
1 5 10 15
Ile His Ala Phe Ser Arg Ala Pro Ile Pro Met Ala Val Val Arg Arg
20 25 30
Glu Leu Ser Cys Glu Ser Tyr Pro Ile Glu Leu Arg Cys Pro Gly Thr
35 40 45
Asp Val Ile Met Ile Glu Ser Ala Asn Tyr Gly Arg Thr Asp Asp Lys
50 55 60
Ile Cys Asp Ser Asp Pro Ala Gln Met Glu Asn Ile Arg Cys Tyr Leu
65 70 75 80
Pro Asp Ala Tyr Lys Ile Met Ser Gln Arg Cys Asn Asn Arg Thr Gln
85 90 95
Cys Ala Val Val Ala Gly Pro Asp Val Phe Pro Asp Pro Cys Pro Gly
100 105 110
Thr Tyr Lys Tyr Leu Glu Val Gln Tyr Glu Cys Val Pro Tyr Lys Val
115 120 125
Glu Gln Lys Val Phe Leu Cys Pro Gly Leu Leu Lys Gly Val Tyr Gln
130 135 140
Ser Glu His Leu Phe Glu Ser Asp His Gln Ser Gly Ala Trp Cys Lys
145 150 155 160
Asp Pro Leu Gln Ala Ser Asp Lys Ile Tyr Tyr Met Pro Trp Thr Pro
165 170 175
Tyr Arg Thr Asp Thr Leu Thr Glu Tyr Ser Ser Lys Asp Asp Phe Ile
180 185 190
Ala Gly Arg Pro Thr Thr Thr Tyr Lys Leu Pro His Arg Val Asp Gly
195 200 205
Thr Gly Phe Val Val Tyr Asp Gly Ala Leu Phe Phe Asn Lys Glu Arg
210 215 220
Thr Arg Asn Ile Val Lys Phe Asp Leu Arg Thr Arg Ile Lys Ser Gly
225 230 235 240
Glu Ala Ile Ile Ala Asn Ala Asn Tyr His Asp Thr Ser Pro Tyr Arg
245 250 255
Trp Gly Gly Lys Ser Asp Ile Asp Leu Ala Val Asp Glu Asn Gly Leu
260 265 270
Trp Val Ile Tyr Ala Thr Glu Gln Asn Asn Gly Lys Ile Val Ile Ser
275 280 285
Gln Leu Asn Pro Tyr Thr Leu Arg Ile Glu Gly Thr Trp Asp Thr Ala
290 295 300
Tyr Asp Lys Arg Ser Ala Ser Asn Ala Phe Met Ile Cys Gly Ile Leu
305 310 315 320
Tyr Val Val Lys Ser Val Tyr Glu Asp Asp Asp Asn Glu Ala Thr Gly
325 330 335
Asn Lys Ile Asp Tyr Ile Tyr Asn Thr Asp Gln Ser Lys Asp Ser Leu
340 345 350
Val Asp Val Pro Phe Pro Asn Ser Tyr Gln Tyr Ile Ala Ala Val Asp
355 360 365
Tyr Asn Pro Arg Asp Asn Leu Leu Tyr Val Trp Asn Asn Tyr His Val
370 375 380
Val Lys Tyr Ser Leu Asp Phe Gly Pro Leu Asp Ser Arg Ser Gly Gln
385 390 395 400
Ala His His Gly Gln Val Ser Tyr Ile Ser Pro Pro Ile His Leu Asp
405 410 415
Ser Glu Leu Glu Arg Pro Ser Val Lys Asp Ile Ser Thr Thr Gly Pro
420 425 430
Leu Gly Met Gly Ser Thr Thr Thr Ser Thr Thr Leu Arg Thr Thr Thr
435 440 445
Leu Ser Pro Gly Arg Ser Thr Thr Pro Ser Val Ser Gly Arg Arg Asn
450 455 460
Arg Ser Thr Ser Thr Pro Ser Pro Ala Val Glu Val Leu Asp Asp Met
465 470 475 480
Thr Thr His Leu Pro Ser Ala Ser Ser Gln Ile Pro Ala Leu Glu Glu
485 490 495
Ser Cys Glu Ala Val Glu Ala Arg Glu Ile Met Trp Phe Lys Thr Arg
500 505 510
Gln Gly Gln Ile Ala Lys Gln Pro Cys Pro Ala Gly Thr Ile Gly Val
515 520 525
Ser Thr Tyr Leu Cys Leu Ala Pro Asp Gly Ile Trp Asp Pro Gln Gly
530 535 540
Pro Asp Leu Ser Asn Cys Ser Ser Pro Trp Val Asn His Ile Thr Gln
545 550 555 560
Lys Leu Lys Ser Gly Glu Thr Ala Ala Asn Ile Ala Arg Glu Leu Ala
565 570 575
Glu Gln Thr Arg Asn His Leu Asn Ala Gly Asp Ile Thr Tyr Ser Val
580 585 590
Arg Ala Met Asp Gln Leu Val Gly Leu Leu Asp Val Gln Leu Arg Asn
595 600 605
Leu Thr Pro Gly Gly Lys Asp Ser Ala Ala Arg Ser Leu Asn Lys Leu
610 615 620
Gln Lys Arg Glu Arg Ser Cys Arg Ala Tyr Val Gln Ala Met Val Glu
625 630 635 640
Thr Val Asn Asn Leu Leu Gln Pro Gln Ala Leu Asn Ala Trp Arg Asp
645 650 655
Leu Thr Thr Ser Asp Gln Leu Arg Ala Ala Thr Met Leu Leu His Thr
660 665 670
Val Glu Glu Ser Ala Phe Val Leu Ala Asp Asn Leu Leu Lys Thr Asp
675 680 685
Ile Val Arg Glu Asn Thr Asp Asn Ile Lys Leu Glu Val Ala Arg Leu
690 695 700
Ser Thr Glu Gly Asn Leu Glu Asp Leu Lys Phe Pro Glu Asn Met Gly
705 710 715 720
His Gly Ser Thr Ile Gln Leu Ser Ala Asn Thr Leu Lys Gln Asn Gly
725 730 735
Arg Asn Gly Glu Ile Arg Val Ala Phe Val Leu Tyr Asn Asn Leu Gly
740 745 750
Pro Tyr Leu Ser Thr Glu Asn Ala Ser Met Lys Leu Gly Thr Glu Ala
755 760 765
Leu Ser Thr Asn His Ser Val Ile Val Asn Ser Pro Val Ile Thr Ala
770 775 780
Ala Ile Asn Lys Glu Phe Ser Asn Lys Val Tyr Leu Ala Asp Pro Val
785 790 795 800
Val Phe Thr Val Lys His Ile Lys Gln Ser Glu Glu Asn Phe Asn Pro
805 810 815
Asn Cys Ser Phe Trp Ser Tyr Ser Lys Arg Thr Met Thr Gly Tyr Trp
820 825 830
Ser Thr Gln Gly Cys Arg Leu Leu Thr Thr Asn Lys Thr His Thr Thr
835 840 845
Cys Ser Cys Asn His Leu Thr Asn Phe Ala Val Leu Met Ala His Val
850 855 860
Glu Val Lys His Ser Asp Ala Val His Asp Leu Leu Leu Asp Val Ile
865 870 875 880
Thr Trp Val Gly Ile Leu Leu Ser Leu Val Cys Leu Leu Ile Cys Ile
885 890 895
Phe Thr Phe Cys Phe Phe Arg Gly Leu Gln Ser Asp Arg Asn Thr Ile
900 905 910
His Lys Asn Leu Cys Ile Ser Leu Phe Val Ala Glu Leu Leu Phe Leu
915 920 925
Ile Gly Ile Asn Arg Thr Asp Gln Pro Ile Ala Cys Ala Val Phe Ala
930 935 940
Ala Leu Leu His Phe Phe Phe Leu Ala Ala Phe Thr Trp Met Phe Leu
945 950 955 960
Glu Gly Val Gln Leu Tyr Ile Met Leu Val Glu Val Phe Glu Ser Glu
965 970 975
His Ser Arg Arg Lys Tyr Phe Tyr Leu Val Gly Tyr Gly Met Pro Ala
980 985 990
Leu Ile Val Ala Val Ser Ala Ala Val Asp Tyr Arg Ser Tyr Gly Thr
995 1000 1005
Asp Lys Val Cys Trp Leu Arg Leu Asp Thr Tyr Phe Ile Trp Ser Phe
1010 1015 1020
Ile Gly Pro Ala Thr Leu Ile Ile Met Leu Asn Val Ile Phe Leu Gly
1025 1030 1035 1040
Ile Ala Leu Tyr Lys Met Phe His His Thr Ala Ile Leu Lys Pro Glu
1045 1050 1055
Ser Gly Cys Leu Asp Asn Ile Asn Tyr Glu Asp Asn Arg Pro Phe Ile
1060 1065 1070
Lys Ser Trp Val Ile Gly Ala Ile Ala Leu Leu Cys Leu Leu Gly Leu
1075 1080 1085
Thr Trp Ala Phe Gly Leu Met Tyr Ile Asn Glu Ser Thr Val Ile Met
1090 1095 1100
Ala Tyr Leu Phe Thr Ile Phe Asn Ser Leu Gln Gly Met Phe Ile Phe
1105 1110 1115 1120
Ile Phe His Cys Val Leu Gln Lys Lys Val Arg Lys Glu Tyr Gly Lys
1125 1130 1135
Cys Leu Arg Thr His Cys Cys Ser Gly Lys Ser Thr Glu Ser Ser Ile
1140 1145 1150
Gly Ser Gly Lys Thr Ser Gly Ser Arg Thr Pro Gly Arg Tyr Ser Thr
1155 1160 1165
Gly Ser Gln Ser Arg Ile Arg Arg Met Trp Asn Asp Thr Val Arg Lys
1170 1175 1180
Gln Ser Glu Ser Ser Phe Ile Thr Gly Asp Ile Asn Ser Ser Ala Ser
1185 1190 1195 1200
Leu Asn Arg Glu Gly Leu Leu Asn Asn Ala Arg Asp Thr Ser Val Met
1205 1210 1215
Asp Thr Leu Pro Leu Asn Gly Asn His Gly Asn Ser Tyr Ser Ile Ala
1220 1225 1230
Ser Gly Glu Tyr Leu Ser Asn Cys Val Gln Ile Ile Asp Arg Gly Tyr
1235 1240 1245
Asn His Asn Glu Thr Ala Leu Glu Lys Lys Ile Leu Lys Glu Leu Thr
1250 1255 1260
Ser Asn Tyr Ile Pro Ser Tyr Leu Asn Asn His Glu Arg Ser Ser Glu
1265 1270 1275 1280
Gln Asn Arg Asn Leu Met Asn Lys Leu Val Asn Asn Leu Gly Ser Gly
1285 1290 1295
Arg Glu Asp Asp Ala Ile Val Leu Asp Asp Ala Thr Ser Phe Asn His
1300 1305 1310
Glu Glu Ser Leu Gly Leu Glu Leu Ile His Glu Glu Ser Asp Ala Pro
1315 1320 1325
Leu Leu Pro Pro Arg Val Tyr Ser Thr Glu Asn His Gln Pro His His
1330 1335 1340
Tyr Thr Arg Arg Arg Ile Pro Gln Asp His Ser Glu Ser Phe Phe Pro
1345 1350 1355 1360
Leu Leu Thr Asn Glu His Thr Glu Asp Leu Gln Ser Pro His Arg Asp
1365 1370 1375
Ser Leu Tyr Thr Ser Met Pro Thr Leu Ala Gly Val Ala Ala Thr Glu
1380 1385 1390
Ser Val Thr Thr Ser Thr Gln Thr Glu Pro Pro Pro Ala Lys Cys Gly
1395 1400 1405
Asp Ala Glu Asp Val Tyr Tyr Lys Ser Met Pro Asn Leu Gly Ser Arg
1410 1415 1420
Asn His Val His Gln Leu His Thr Tyr Tyr Gln Leu Gly Arg Gly Ser
1425 1430 1435 1440
Ser Asp Gly Phe Ile Val Pro Pro Asn Lys Asp Gly Thr Pro Pro Glu
1445 1450 1455
Gly Ser Ser Lys Gly Pro Ala His Leu Val Thr Ser Leu
1460 1465
<210> 19
<211> 467
<212> PRT
<213> PSEN1 protein
<400> 19
Met Thr Glu Leu Pro Ala Pro Leu Ser Tyr Phe Gln Asn Ala Gln Met
1 5 10 15
Ser Glu Asp Asn His Leu Ser Asn Thr Val Arg Ser Gln Asn Asp Asn
20 25 30
Arg Glu Arg Gln Glu His Asn Asp Arg Arg Ser Leu Gly His Pro Glu
35 40 45
Pro Leu Ser Asn Gly Arg Pro Gln Gly Asn Ser Arg Gln Val Val Glu
50 55 60
Gln Asp Glu Glu Glu Asp Glu Glu Leu Thr Leu Lys Tyr Gly Ala Lys
65 70 75 80
His Val Ile Met Leu Phe Val Pro Val Thr Leu Cys Met Val Val Val
85 90 95
Val Ala Thr Ile Lys Ser Val Ser Phe Tyr Thr Arg Lys Asp Gly Gln
100 105 110
Leu Ile Tyr Thr Pro Phe Thr Glu Asp Thr Glu Thr Val Gly Gln Arg
115 120 125
Ala Leu His Ser Ile Leu Asn Ala Ala Ile Met Ile Ser Val Ile Val
130 135 140
Val Met Thr Ile Leu Leu Val Val Leu Tyr Lys Tyr Arg Cys Tyr Lys
145 150 155 160
Val Ile His Ala Trp Leu Ile Ile Ser Ser Leu Leu Leu Leu Phe Phe
165 170 175
Phe Ser Phe Ile Tyr Leu Gly Glu Val Phe Lys Thr Tyr Asn Val Ala
180 185 190
Val Asp Tyr Ile Thr Val Ala Leu Leu Ile Trp Asn Phe Gly Val Val
195 200 205
Gly Met Ile Ser Ile His Trp Lys Gly Pro Leu Arg Leu Gln Gln Ala
210 215 220
Tyr Leu Ile Met Ile Ser Ala Leu Met Ala Leu Val Phe Ile Lys Tyr
225 230 235 240
Leu Pro Glu Trp Thr Ala Trp Leu Ile Leu Ala Val Ile Ser Val Tyr
245 250 255
Asp Leu Val Ala Val Leu Cys Pro Lys Gly Pro Leu Arg Met Leu Val
260 265 270
Glu Thr Ala Gln Glu Arg Asn Glu Thr Leu Phe Pro Ala Leu Ile Tyr
275 280 285
Ser Ser Thr Met Val Trp Leu Val Asn Met Ala Glu Gly Asp Pro Glu
290 295 300
Ala Gln Arg Arg Val Ser Lys Asn Ser Lys Tyr Asn Ala Glu Ser Thr
305 310 315 320
Glu Arg Glu Ser Gln Asp Thr Val Ala Glu Asn Asp Asp Gly Gly Phe
325 330 335
Ser Glu Glu Trp Glu Ala Gln Arg Asp Ser His Leu Gly Pro His Arg
340 345 350
Ser Thr Pro Glu Ser Arg Ala Ala Val Gln Glu Leu Ser Ser Ser Ile
355 360 365
Leu Ala Gly Glu Asp Pro Glu Glu Arg Gly Val Lys Leu Gly Leu Gly
370 375 380
Asp Phe Ile Phe Tyr Ser Val Leu Val Gly Lys Ala Ser Ala Thr Ala
385 390 395 400
Ser Gly Asp Trp Asn Thr Thr Ile Ala Cys Phe Val Ala Ile Leu Ile
405 410 415
Gly Leu Cys Leu Thr Leu Leu Leu Leu Ala Ile Phe Lys Lys Ala Leu
420 425 430
Pro Ala Leu Pro Ile Ser Ile Thr Phe Gly Leu Val Phe Tyr Phe Ala
435 440 445
Thr Asp Tyr Leu Val Gln Pro Phe Met Asp Gln Leu Ala Phe His Gln
450 455 460
Phe Tyr Ile
465
<210> 20
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> FRAS1 Forward Primer
<400> 20
tccctaagtc agctatggga ag 22
<210> 21
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> FRAS1 Reverse Primer
<400> 21
aattccatgc ttggtcttgg 20
<210> 22
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> RAPGEF2 Forward Primer
<400> 22
caccagagaa gctgggagac 20
<210> 23
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> RAPGEF2 Reverse Primer
<400> 23
gcaatggaga aaatgaggaa a 21
<210> 24
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> CLEC4C Forward Primer
<400> 24
tgaccttgac tttcgcactg 20
<210> 25
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> CLEC4C Reverse Primer
<400> 25
ccagcagtct ctggcacata 20
<210> 26
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> PSEN1 Forward Primer
<400> 26
ggcttaagca cgagaattgc 20
<210> 27
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> PSEN1 Reverse Primer
<400> 27
gcaaggagca acagaagaat g 21
<210> 28
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> PLEKHM2 Forward Primer
<400> 28
ctgctcatga tccacgtgtt 20
<210> 29
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> PLEKHM2 Reverse Primer
<400> 29
cttccttggg gtgccttt 18
<210> 30
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> SSH2 Forward Primer
<400> 30
ccatcatcaa cactggctgt 20
<210> 31
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> SSH2 Reverse Primer
<400> 31
cacaggcctt tctgatttgc 20
<210> 32
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> SPAG17 Forward Primer
<400> 32
aaggatgacg tcaaggcttc 20
<210> 33
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> SPAG17 Reverse Primer
<400> 33
ggggactctt ctgttacttc ttgg 24
<210> 34
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> XRCC3 Forward Primer
<400> 34
caagggaacc agttgtgtga 20
<210> 35
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> XRCC3 Reverse Primer
<400> 35
tggtgctcac ctggttgat 19
<210> 36
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> IFT80 Forward Primer
<400> 36
tggatgtctt aggtgctagg tg 22
<210> 37
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> IFT80 Reverse Primer
<400> 37
ctcactgtgt tgtccaggct aa 22
<210> 38
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> ADGRL3 Forward Primer
<400> 38
tatgccctgg actccctaca 20
<210> 39
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> ADGRL3 Reverse Primer
<400> 39
atcccatgtt ccttcgatcc 20
<210> 40
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> RAPGEF2 MALDI-TOF Forward Primer
<400> 40
acgttggatg gacacaggca caataaagcg 30
<210> 41
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> RAPGEF2 MALDI-TOF Reverse Primer
<400> 41
acgttggatg agtcacagac gttaggctac 30
Claims (11)
- 근위축성측삭경화증(Amyotrophic lateral sclerosis; ALS)에 대한 진단 마커로서
(ⅰ) 서열목록 제1서열의 염기서열에서 4069번째 염기인 구아닌이 아데닌으로 치환, 1883번째 염기인 시토신이 티민으로 치환 또는 3293번째 염기인 구아닌이 아데닌으로 치환된 RAPGEF2 돌연변이 유전자; (ⅱ) 서열목록 제2서열의 염기서열에서 595번째 염기인 구아닌이 아데닌으로 치환된 IFT80 돌연변이 유전자; (ⅲ) 서열목록 제3서열의 염기서열에서 1408번째 염기인 구아닌이 티민으로 치환된 SSH2 돌연변이 유전자; (ⅳ) 서열목록 제4서열의 염기서열에서 598번째 염기인 구아닌이 아데닌으로 치환된 XRCC3 돌연변이 유전자; (ⅴ) 서열목록 제5서열의 염기서열에서 2815번째 염기인 구아닌이 티민으로 치환된 SPAG17 돌연변이 유전자; (ⅵ) 서열목록 제6서열의 염기서열에서 1921+6 염기인 시토신이 티민으로 치환된 PLEKHM2 돌연변이 유전자; (ⅶ) 서열목록 제7서열의 염기서열에서 629번째에서 631번째 염기인 아데닌, 구아닌 및 아데닌이 결실된 CLEC4C 돌연변이 유전자; (ⅷ) 서열목록 제8서열의 염기서열에서 8393번째 염기인 시토신이 티민으로 치환된 FRAS1 돌연변이 유전자; (ⅸ) 서열목록 제9서열의 염기서열에서 715번째 염기인 아데닌이 구아닌으로 치환된 ADGRL3 돌연변이 유전자; 및 (ⅹ) 서열목록 제10서열의 염기서열에서 497번째 염기인 티민이 시토신으로 치환된 PSEN1 돌연변이 유전자로 구성된 군으로부터 선택되는 돌연변이 유전자.
- 근위축성측삭경화증에 대한 진단 마커로서
(ⅰ) 서열목록 제1서열의 염기서열에서 4069번째 염기인 구아닌이 아데닌으로 치환, 1883번째 염기인 시토신이 티민으로 치환 또는 3293번째 염기인 구아닌이 아데닌으로 치환된 RAPGEF2 돌연변이 유전자로부터 암호화되는 RapGEF2 돌연변이 단백질; (ⅱ) 서열목록 제2서열의 염기서열에서 595번째 염기인 구아닌이 아데닌으로 치환된 IFT80 돌연변이 유전자로부터 암호화되는 IFT80 돌연변이 단백질; (ⅲ) 서열목록 제3서열의 염기서열에서 1408번째 염기인 구아닌이 티민으로 치환된 SSH2 돌연변이 유전자로부터 암호화되는 SSH2 돌연변이 단백질; (ⅳ) 서열목록 제4서열의 염기서열에서 598번째 염기인 구아닌이 아데닌으로 치환된 XRCC3 돌연변이 유전자로부터 암호화되는 XRCC3 돌연변이 단백질; (ⅴ) 서열목록 제5서열의 염기서열에서 2815번째 염기인 구아닌이 티민으로 치환된 SPAG17 돌연변이 유전자로부터 암호화되는 SPAG17 돌연변이 단백질; (ⅵ) 서열목록 제7서열의 염기서열에서 629번째에서 631번째 염기인 아데닌, 구아닌 및 아데닌이 결실된 CLEC4C 돌연변이 유전자로부터 암호화되는 CLEC4C 돌연변이 단백질; (ⅶ) 서열목록 제8서열의 염기서열에서 8393번째 염기인 시토신이 티민으로 치환된 FRAS1 돌연변이 유전자로부터 암호화되는 FRAS1 돌연변이 단백질; (ⅷ) 서열목록 제9서열의 염기서열에서 715번째 염기인 아데닌이 구아닌으로 치환된 ADGRL3 돌연변이 유전자로부터 암호화되는 ADGRL3 돌연변이 단백질; 및 (ⅸ) 서열목록 제10서열의 염기서열에서 497번째 염기인 티민이 시토신으로 치환된 PSEN1 돌연변이 유전자로부터 암호화되는 PSEN1 돌연변이 단백질로 구성된 군으로부터 선택되는 돌연변이 단백질.
- 제 2 항에 있어서, 상기 (ⅰ) RapGEF2 돌연변이 단백질은 서열목록 제11서열의 아미노산 서열에서 1357번째 아미노산 잔기인 글루탐산이 라이신으로 치환, 628번째 아미노산 잔기인 티로신이 이소류신 치환 또는 1098번째 아미노산 잔기인 아르기닌이 히스티딘으로 치환된 RapGEF2 돌연변이 단백질이고; (ⅱ) IFT80 돌연변이 단백질은 서열목록 제12서열의 아미노산 서열에서 199번째 아미노산 잔기인 발린이 이소류신으로 치환된 IFT80 돌연변이 단백질이며; (ⅲ) SSH2 돌연변이 단백질은 서열목록 제13서열의 아미노산 서열에서 470번째 아미노산 잔기인 글루탐산이 종결코돈으로 치환된 SSH2 돌연변이 단백질이고; (ⅳ) XRCC3 돌연변이 단백질은 서열목록 제14서열의 아미노산 서열에서 200번째 아미노산 잔기인 발린이 이소류신으로 치환된 XRCC3 돌연변이 단백질이며; (ⅴ) SPAG17 돌연변이 단백질은 서열목록 제15서열의 아미노산 서열에서 939번째 아미노산 잔기인 알라닌이 세린으로 치환된 SPAG17 돌연변이 단백질이고; (ⅵ) CLEC4C 돌연변이 단백질은 서열목록 제16서열의 아미노산 서열에서 210번째 아미노산 잔기인 라이신이 결실된 CLEC4C 돌연변이 단백질이며; (ⅶ) FRAS1 돌연변이 단백질은 서열목록 제17서열의 아미노산 서열에서 2798번째 아미노산 잔기인 알라닌이 발린으로 치환된 FRAS1 돌연변이 단백질이고; (ⅷ) ADGRL3 돌연변이 단백질은 서열목록 제18서열의 아미노산 서열에서 239번째 아미노산 잔기인 세린이 글리신으로 치환된 ADGRL3 돌연변이 단백질이며; (ⅸ) PSEN1 돌연변이 단백질은 서열목록 제19서열의 아미노산 서열에서 166번째 아미노산 잔기인 류신이 프롤린으로 치환된 PSEN1 돌연변이 단백질인 것을 특징으로 하는 돌연변이 단백질.
- 다음 단계를 포함하는 근위축성측삭경화증의 진단에 필요한 정보를 제공하는 방법:
(a) 개체(subject)로부터 분리된 생물학적 시료로부터 (ⅰ) 서열목록 제1서열의 염기서열에서 4069번째 염기인 구아닌이 아데닌으로 치환, 1883번째 염기인 시토신이 티민으로 치환 또는 3293번째 염기인 구아닌이 아데닌으로 치환된 RAPGEF2 돌연변이 유전자; (ⅱ) 서열목록 제2서열의 염기서열에서 595번째 염기인 구아닌이 아데닌으로 치환된 IFT80 돌연변이 유전자; (ⅲ) 서열목록 제3서열의 염기서열에서 1408번째 염기인 구아닌이 티민으로 치환된 SSH2 돌연변이 유전자; (ⅳ) 서열목록 제4서열의 염기서열에서 598번째 염기인 구아닌이 아데닌으로 치환된 XRCC3 돌연변이 유전자; (ⅴ) 서열목록 제5서열의 염기서열에서 2815번째 염기인 구아닌이 티민으로 치환된 SPAG17 돌연변이 유전자; (ⅵ) 서열목록 제6서열의 염기서열에서 1921+6번째 염기인 시토신이 티민으로 치환된 PLEKHM2 돌연변이 유전자; (ⅶ) 서열목록 제7서열의 염기서열에서 629번째에서 631번째 염기인 아데닌, 구아닌 및 아데닌이 결실된 CLEC4C 돌연변이 유전자; (ⅷ) 서열목록 제8서열의 염기서열에서 8393번째 염기인 시토신이 티민으로 치환된 FRAS1 돌연변이 유전자; (ⅸ) 서열목록 제9서열의 염기서열에서 715번째 염기인 아데닌이 구아닌으로 치환된 ADGRL3 돌연변이 유전자; 또는 (ⅹ) 서열목록 제10서열의 염기서열에서 497번째 염기인 티민이 시토신으로 치환된 PSEN1 돌연변이 유전자의 mNRA 또는 상기 유전자에 의해 코딩되는 돌연변이 단백질을 검출하는 단계; 및
(b) 상기 시료에서 상기 돌연변이 유전자의 mRNA 또는 돌연변이 단백질이 검출된 경우, 상기 개체는 근위축성측삭경화증인 것으로 판정하는 단계.
- 제 4 항에 있어서, 상기 단계 (a)에서 mRNA는 상기 돌연변이 유전자에 특이적으로 결합하는 프라이머 또는 프로브를 이용하여 측정하는 것을 특징으로 하는 방법.
- 제 4 항에 있어서, 상기 단계 (a)에서 돌연변이 단백질은 상기 돌연변이 단백질에 특이적으로 결합하는 항체를 이용하여 측정하는 것을 특징으로 하는 방법.
- 생물학적 시료로부터 제 1 항의 돌연변이 유전자의 mRNA 또는 상기 유전자에 의해 코딩되는 돌연변이 단백질을 검출할 수 있는 검출제를 포함하는 근위축성측삭경화증 진단용 조성물.
- 제 7 항에 있어서, 상기 mRNA를 검출할 수 있는 검출제는 상기 돌연변이 유전자에 특이적으로 결합하는 프라이머 또는 프로브인 것을 특징으로 하는 근위축성측삭경화증 진단용 조성물.
- 제 7 항에 있어서, 상기 단백질을 검출할 수 있는 검출제는 상기 돌연변이 유전자에 의해 코딩되는 단백질에 특이적인 항체인 것을 특징으로 하는 근위축성측삭경화증 진단용 조성물.
- 제 7 항 내지 제 9 항 중 어느 한 항의 조성물을 포함하는 근위축성측삭경화증 진단용 키트.
- 제 10 항에 있어서, 상기 키트는 마이크로어레이, 유전자 증폭 키트 또는 면역분석(immunoassay)용 키트인 것을 특징으로 하는 근위축성측삭경화증 진단용 키트.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020150141113A KR102018369B1 (ko) | 2015-10-07 | 2015-10-07 | 근위축성측삭경화증에 대한 진단 마커로서의 돌연변이 유전자 및 이를 이용한 진단방법 |
PCT/KR2016/011254 WO2017061818A1 (ko) | 2015-10-07 | 2016-10-07 | 근위축성측삭경화증에 대한 진단 마커로서의 돌연변이 유전자 및 이를 이용한 진단방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020150141113A KR102018369B1 (ko) | 2015-10-07 | 2015-10-07 | 근위축성측삭경화증에 대한 진단 마커로서의 돌연변이 유전자 및 이를 이용한 진단방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20170041955A true KR20170041955A (ko) | 2017-04-18 |
KR102018369B1 KR102018369B1 (ko) | 2019-09-06 |
Family
ID=58488244
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020150141113A KR102018369B1 (ko) | 2015-10-07 | 2015-10-07 | 근위축성측삭경화증에 대한 진단 마커로서의 돌연변이 유전자 및 이를 이용한 진단방법 |
Country Status (2)
Country | Link |
---|---|
KR (1) | KR102018369B1 (ko) |
WO (1) | WO2017061818A1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021107713A1 (ko) * | 2019-11-29 | 2021-06-03 | 주식회사 녹십자지놈 | Lats1 유전자 변이 마커 기반의 근위축성 측삭경화증의 진단방법 |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107354139B (zh) * | 2017-09-18 | 2021-04-30 | 江苏省农业科学院 | 小麦als突变型蛋白、核酸及其应用 |
WO2024011093A1 (en) * | 2022-07-08 | 2024-01-11 | Woolsey Pharmaceuticals, Inc. | Treating amyotrophic lateral sclerosis having onset 24 months prior to treatment |
WO2024011094A1 (en) * | 2022-07-08 | 2024-01-11 | Woolsey Pharmaceuticals, Inc. | Regimen for treating amyotrophic lateral sclerosis having onset 24 months prior to treatment |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20140130846A (ko) * | 2013-05-02 | 2014-11-12 | 서울대학교산학협력단 | 퇴행성 신경질환 진단용 마커 및 그 용도 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130209999A1 (en) * | 2011-08-19 | 2013-08-15 | Northwestern University | Sqstm1 mutations in amyotrophic lateral sclerosis |
KR20150015226A (ko) * | 2013-07-31 | 2015-02-10 | 한남대학교 산학협력단 | 퇴행성 신경계 질환 진단용 마커 및 이를 이용한 진단방법 |
-
2015
- 2015-10-07 KR KR1020150141113A patent/KR102018369B1/ko active IP Right Grant
-
2016
- 2016-10-07 WO PCT/KR2016/011254 patent/WO2017061818A1/ko active Application Filing
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20140130846A (ko) * | 2013-05-02 | 2014-11-12 | 서울대학교산학협력단 | 퇴행성 신경질환 진단용 마커 및 그 용도 |
Non-Patent Citations (169)
Title |
---|
A controlled trial of recombinant methionyl human BDNF in ALS: The BDNF Study Group (Phase III). Neurology 1999;52:1427-1433 |
A VB. Allg Z Psychiat Psychischgerichtliche Med 1932;96:364-366 |
Abhinav K et al., Neuroepidemiology 2007;29:44-48 |
Adzhubei IA et al., Nat Methods 2010;7:248-249 |
Al-Chalabi A et al., Hum Mol Genet 1999;8:157-164 |
Al-Chalabi A, Lewis CM. Hum Hered 2011;71:281-288 |
Alexander MD et al., Ann Neurol 2002;52:680-683 |
Andersen PM et al., Brain 1996;119 ( Pt 4):1153-1172 |
Andersen PM, Al-Chalabi A. Nat Rev Neurol 2011;7:603-615 |
Andersen PM. Curr Neurol Neurosci Rep 2006;6:37-46 |
Annesi G et al., Ann Neurol 2005;58:803-807 |
Arcos-Burgos M et al., Mol Psychiatry 2010;15:1053-1066 |
Armon C. Neuroepidemiology 2003;22:217-228 |
Ataka S et al., Arch Neurol 2004;61:1773-1776 |
Bak TH, Hodges JR. J Neurol 2001;248:260-270 |
Baltadzhieva R, Gurevich T, Korczyn AD. Curr Opin Neurol 2005;18:487-493 |
Beales PL et al., Nat Genet 2007;39:727-729 |
Bilasy SE et al., Eur J Neurosci 2009;29:1994-2008 |
Boillee S et al., Science 2006;312:1389-1392 |
Boucrot E et al., Science 2005;308:1174-1178 |
Brain L, Walton JN. Oxford university press, London, 1969 |
Brenneman MA et al., Mol Cell 2002;10:387-395 |
Brooks BR, Miller RG, Swash M, Munsat TL. Amyotroph Lateral Scler Other Motor Neuron Disord 2000;1:293-299 |
Brooks WS et al., Brain 2003;126:783-791 |
Bruijn LI et al., Science 1998;281:1851-1854 |
Buratti E et al., J Biol Chem 2005;280:37572-37584 |
Buratti E, Baralle FE. Front Biosci 2008;13:867-878 |
Calvo A et al., Neurobiol Aging 2014;35:1513 e1517-1513 e1511 |
Cedarbaum JM et al., J Neurol Sci 1997;152 Suppl 1:S1-9 |
Cedarbaum JM et al., J Neurol Sci 1999;169:13-21 |
Chappell CP et al., J Immunol 2014;192:5789-5801 |
Charcot J, Joffroy A. Arch Physiol Norm Pathol 1869;2:744-760 |
Chen J et al., Nucleic Acids Res 2009;37:W305-311 |
Chesi A et al., Nat Neurosci 2013;16:851-855 |
Chew J et al., Science 2015 |
Chio A et al., Brain 2005;128:472-476 |
Chio A et al., Neurobiol Aging 2011;32:553 e523-556 |
Chio A et al., Neurology 2008;70:533-537 |
Chio A et al., Neurology 2012;79:1983-1989 |
Chio A, Calvo A, Moglia C, Mazzini L, Mora G. J Neurol Neurosurg Psychiatry 2011;82:740-746 |
Cirulli ET et al., Science 2015;347:1436-1441 |
Cleveland DW, Rothstein JD. Nat Rev Neurosci 2001;2:806-819 |
Conrad DF et al., Nat Genet 2011;43:712-714 |
Couthouis J et al., Hum Mol Genet 2012;21:2899-2911 |
Crook R et al., Nat Med 1998;4:452-455 |
Crow JF. Nat Rev Genet 2000;1:40-47 |
Cudkowicz ME et al., Ann Neurol 1997;41:210-221 |
Cudkowicz ME et al., Neurology 2003;61:456-464 |
Damiano M et al., J Neurochem 2006;96:1349-1361 |
de Carvalho M et al., Clin Neurophysiol 2008;119:497-503 |
de Rooij J et al., J Biol Chem 1999;274:38125-38130 |
DeJesus-Hernandez M et al., Hum Mutat 2010;31:E1377-1389 |
DeJesus-Hernandez M et al., Neuron 2011;72:245-256 |
Deng HX et al., Nature 2011;477:211-215 |
Droppelmann CA et al., Amyotroph Lateral Scler Frontotemporal Degener 2013;14:444-451 |
Dumanchin C et al., J Med Genet 1998;35:672-673 |
Ezquerra M, Carnero C, Blesa R, Oliva R. Arch Neurol 2000;57:485-488 |
Fecto F et al., Arch Neurol 2011;68:1440-1446 |
Forbes RB, Colville S, Swingler RJ. Age Ageing 2004;33:131-134 |
Franchignoni F et al., J Neurol Neurosurg Psychiatry 2013;84:1340-1345 |
Franchignoni F, Mandrioli J, Giordano A, Ferro S. Amyotroph Lateral Scler Frontotemporal Degener 2015:1-7 |
Freischmidt A et al., Nat Neurosci 2015 |
Fromer M et al., Nature 2014;506:179-184 |
Gallo V et al., Ann Neurol 2009;65:378-385 |
Gilbert RM et al., Mov Disord 2010;25:1868-1875 |
Golan MP et al., Exp Neurol 2007;208:264-268 |
Gordon PH et al., Neurology 2006;66:647-653 |
Gouveia LO, de Carvalho M. Amyotroph Lateral Scler 2007;8:323-327 |
Gratten J, Visscher PM, Mowry BJ, Wray NR. Nat Genet 2013;45:234-238 |
Groeneveld GJ et al., Ann Neurol 2003;53:437-445 |
Gurney ME et al., Science 1994;264:1772-1775 |
Harwood CA, McDermott CJ, Shaw PJ. Amyotroph Lateral Scler 2009;10:191-204 |
Hattori S et al., Neurosci Lett 2004;368:319-322 |
Haverkamp LJ, Appel V, Appel SH. Brain 1995;118 ( Pt 3):707-719 |
Heath PR, Shaw PJ. Muscle Nerve 2002;26:438-458 |
Hensman Moss DJ et al., Neurology 2014;82:292-299 |
Hisata S et al., J Cell Biol 2007;178:843-860 |
Iossifov I et al., Neuron 2012;74:285-299 |
Isaacs JD et al., J Neurol Neurosurg Psychiatry 2007;78:750-753 |
Ivanchuk SM, Myers SM, Eng C, Mulligan LM. Hum Mol Genet 1996;5:2023-2026 |
Jang JH et al., Neurobiol Aging 2013;34:1311.e1317-1319 |
Jeong Y et al., Neurology 2005;64:734-736 |
Johnson JO et al., Nat Neurosci 2014;17:664-666 |
Johnson JO et al., Neuron 2010;68:857-864 |
Kasarskis EJ et al., Amyotroph Lateral Scler 2009;10:35-41 |
Kiernan MC et al., The Lancet 2011;377:942-955 |
Kim HJ et al., Nature 2013;495:467-473 |
Kim HJ et al., Neurobiol Aging 2014;35:1957.e1957-1958 |
Kim YE et al., Neurobiol Aging 2015;36:1604.e1617-1609 |
Kinsley L, Siddique T. Amyotrophic Lateral Sclerosis Overview. GeneReviews?http://www.ncbi.nlm.nih.gov/books/NBK1450/, Seattle, University of Washington, 2001 |
Kong A et al., Nature 2012;488:471-475 |
Kwiatkowski TJ et al., Science 2009;323:1205-1208 |
Kwon MJ et al., Neurobiol Aging 2012;33:1017 e1017-1023 |
Lee KJ et al., Neuron 2011;69:957-973 |
Leung CL et al., Brain Pathol 2004;14:290-296 |
Li H, Durbin R. Bioinformatics 2009;25:1754-1760 |
Lindquist SG et al., Clin Genet 2013;83:279-283 |
Littler M, Morton NE. J Med Genet 1990;27:307-310 |
Liu R et al., Ann Neurol 1998;44:763-770 |
Luty AA et al., Ann Neurol 2010;68:639-649 |
Maher P, Davis JB. J Neurosci 1996;16:6394-6401 |
Majounie E et al., Lancet Neurol 2012;11:323-330 |
Manjaly ZR et al., Amyotroph Lateral Scler 2010;11:439-442 |
Maruyama H et al., Nature 2010;465:223-226 |
McGregor L et al., Nat Genet 2003;34:203-208 |
Meldrum B, Garthwaite J. Trends Pharmacol Sci 1990;11:379-387 |
Menzies FM et al., Brain 2002;125:1522-1533 |
Mioshi E et al., Neurology 2014;82:149-155 |
Mitchell JD. J Neurol 2000;247:7-12 |
Munch C et al., Neurology 2004;63:724-726 |
Neale BM et al., Nature 2012;485:242-245 |
Neumann M et al., Science 2006;314:130-133 |
Ng PC et al., Nucleic Acids Res 2003;31:3812-3814 |
Niwa R et al., Cell 2002;108:233-246 |
Ohtsuka T et al., Biochem Biophys Res Commun 1999;265:38-44 |
Olkowski ZL. Neuroreport 1998;9:239-242 |
O'Roak BJ et al., Nature 2012;485:246-250 |
Pasinelli P, Brown RH. Nat Rev Neurosci 2006;7:710-723 |
Petrou P et al., J Biol Chem 2005;280:10350-10356 |
Pham N, Rotin D. J Biol Chem 2001;276:28478-28483 |
Phukan J, Pender NP, Hardiman O. Lancet Neurol 2007;6:994-1003 |
Pinto S, Pinto A, De Carvalho M. Eura Medicophys 2007;43:505-509 |
PNAS, vol.99(12), pp.8025-8030(2002)* * |
Portet F et al., Neurology 2003;61:1136-1137 |
Pringle CE et al., Brain 1992;115 ( Pt 2):495-520 |
Rademakers R, van Blitterswijk M. Neuron 2014;84:241-243 |
Raman A et al., J Neurol Sci 2007;260:78-82 |
Ramensky V, Bork P, Sunyaev S. Nucleic Acids Res 2002;30:3894-3900 |
Rebhun JF, Castro AF, Quilliam LA. J Biol Chem 2000;275:34901-34908 |
Renton AE et al., Neuron 2011;72:257-268 |
Renton AE, Chio A, Traynor BJ. Nat Neurosci 2014;17:17-23 |
Riboldi E et al., J Biol Chem 2011;286:35329-35333 |
Rizzardini M et al., Brain Res Bull 2006;69:465-474 |
Roach JC et al., Science 2010;328:636-639 |
Roelofs-Iverson RA et al., Neurology 1984;34:393-395 |
Rosen DR et al., Nature 1993;362:59-62 |
Rowland LP, Shneider NA. N Engl J Med 2001;344:1688-1700 |
Sabatelli M et al., Amyotroph Lateral Scler 2012;13:580-584 |
Sanders SJ et al., Nature 2012;485:237-241 |
Shoesmith CL, Findlater K, Rowe A, Strong MJ. J Neurol Neurosurg Psychiatry 2007;78:629-631 |
Smith BN et al., Neuron 2014;84:324-331 |
Sreedharan J et al., Science 2008;319:1668-1672 |
Sreedharan J, Brown RH, Jr. Ann Neurol 2013;74:309-316 |
Sugita S et al., J Biol Chem 1998;273:32715-32724 |
Swinnen B, Robberecht W. Nat Rev Neurol 2014;10:661-670 |
Takahashi Y et al., Am J Hum Genet 2013;93:900-905 |
Talbot PR et al., J Neurol Neurosurg Psychiatry 1995;58:541-547 |
Teves ME et al., Am J Respir Cell Mol Biol 2013;48:765-772 |
Teves ME et al., PLoS One 2015;10:e0125936 |
Teyssou E et al., Neurobiol Aging 2014;35:1213.e1219-1213.e1212 |
Ticozzi N et al., Ann Neurol 2010;68:102-107 |
Traynor BJ, Codd MB, Corr B, Forde C, Frost E, Hardiman O. Neurology 1999;52:504-509 |
Turner MR et al., J Neurol Sci 2010;294:81-85 |
Utreras E et al., Neurochem Int 2013;62:848-853 |
van Blitterswijk M et al., Hum Mol Genet 2012;21:3776-3784 |
van Blitterswijk M et al., PLoS One 2012;7:e48983 |
Vance C et al., Science 2009;323:1208-1211 |
Veltman JA, Brunner HG. Nat Rev Genet 2012;13:565-575 |
Verkkoniemi A et al., Neurology 2000;54:1103-1109 |
Vissers LE et al., Nat Genet 2010;42:1109-1112 |
Wang C, Yuan X, Yang S. Exp Cell Res 2013;319:623-632 |
Wang J, Xu G, Borchelt DR. Neurobiol Dis 2002;9:139-148 |
Watkins JC, Evans RH. Annu Rev Pharmacol Toxicol 1981;21:165-204 |
Wijesekera LC, Leigh PN. Orphanet J Rare Dis 2009;4:3 |
Winton MJ et al., J Biol Chem 2008;283:13302-13309 |
Wojciechowska M, Krzyzosiak WJ. Hum Mol Genet 2011;20:3811-3821 |
Wu CH et al., Nature 2012;488:499-503 |
Ye T, Ip JP, Fu AK, Ip NY. Nat Commun 2014;5:4826 |
Zhang B et al., , Wang M, Tang D, Li Y, Xu M, Gu M, Cheng Z, Yu H. J Exp Bot 2015 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021107713A1 (ko) * | 2019-11-29 | 2021-06-03 | 주식회사 녹십자지놈 | Lats1 유전자 변이 마커 기반의 근위축성 측삭경화증의 진단방법 |
KR20210067530A (ko) * | 2019-11-29 | 2021-06-08 | 주식회사 녹십자지놈 | Lats1 유전자 변이 마커 기반의 근위축성 측삭경화증의 진단방법 |
Also Published As
Publication number | Publication date |
---|---|
WO2017061818A1 (ko) | 2017-04-13 |
KR102018369B1 (ko) | 2019-09-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CA2566256C (en) | Genetic polymorphisms associated with liver fibrosis methods of detection and uses thereof | |
KR101582321B1 (ko) | 심장성 부정맥의 위험 관리를 위한 유전적 마커 | |
DK2471954T3 (en) | Susceptibility genetic variants associated with cardiovascular diseases | |
US11674188B2 (en) | Biomarkers and combinations thereof for diagnosing tuberculosis | |
CN101874120B (zh) | 作为用于乳腺癌风险评估、诊断、预后和治疗的标记的chr2和chr16的遗传性变型 | |
KR20110015409A (ko) | 염증성 장 질환에 대한 유전자 발현 마커 | |
US20030129176A1 (en) | Atherosclerosis-associated genes | |
KR20110036608A (ko) | 유방암 위험도 평가를 위한 유전적 변이 | |
CN101641451A (zh) | chr8q24.21上的癌症易感性变体 | |
KR20160117606A (ko) | 항-혈관형성 약물에 대한 반응 및 암의 예후를 예측하기 위한 분자적 진단 시험 | |
CA2651376A1 (en) | Method for diagnosis and treatment of a mental disease | |
KR102018369B1 (ko) | 근위축성측삭경화증에 대한 진단 마커로서의 돌연변이 유전자 및 이를 이용한 진단방법 | |
JPWO2002052006A1 (ja) | アレルギー性疾患検査方法 | |
AU2002318972B2 (en) | Mutations in ion channels | |
JP2005518786A (ja) | ヒトにおける成長ホルモン変異とその用途 | |
US7172867B2 (en) | Methods of testing for allergic diseases, and therapeutic agents for treating same | |
CA2852631A1 (en) | A gene and mutations thereof associated with seizure and movement disorders | |
US7148011B2 (en) | Method of testing for allergic diseases | |
KR102480128B1 (ko) | 면역력 강화 소 African Humped Cattle (AFH) 품종 특이적 단일염기다형성 및 그의 용도 | |
CA2826522A1 (en) | Genetic polymorphism in pnlpa3 associated with liver fibrosis methods of detection and uses thereof | |
EP2501825B1 (en) | Methods for diagnosing skin diseases | |
US20040023263A1 (en) | Method of testing for allergic diseases | |
US20040058351A1 (en) | Method of examining for allergic disease | |
JP2006516387A (ja) | 副腎皮質刺激ホルモン放出ホルモンによる刺激に応答してその発現が増加される遺伝子 | |
US20030224423A1 (en) | Method of testing for allergic diseases |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |