KR20170041955A

KR20170041955A - 근위축성측삭경화증에 대한 진단 마커로서의 돌연변이 유전자 및 이를 이용한 진단방법

Info

Publication number: KR20170041955A
Application number: KR1020150141113A
Authority: KR
Inventors: 기창석; 김영은; 김승현; 이승복
Original assignee: 사회복지법인 삼성생명공익재단; 한양대학교 산학협력단; 서울대학교산학협력단
Priority date: 2015-10-07
Filing date: 2015-10-07
Publication date: 2017-04-18
Also published as: WO2017061818A1; KR102018369B1

Abstract

본 발명은 근위축성측삭경화증에 대한 마커로서 RAPGEF2, IFT80, SSH2, XRCC3, SPAG17, PLEKHM2, CLEC4C, FRAS1, ADGRL3, PSEN1 돌연변이 유전자 및 돌연변이 단백질과 이를 이용한 근위축성측삭경화증의 진단 방법을 제공한다. 본 발명의 근위축성측삭경화증 마커는 한국인 ALS 환자로부터 발견한 새로운 변이로서 종전에 보고된 데이터베이스에서 0.1% 미만의 빈도로 나타난 매우 드문 변이이거나 보고된 바 없는 변이이며, 정상 대조군에서는 발견되지 않는 변이이다. 본 발명에서 발견한 돌연변이 유전자 및/또는 이로부터 코딩되는 돌연변이 단백질은 ALS의 유전학적 원인을 밝히고 ALS를 진단하는데 매우 유용하게 사용될 수 있다. 본 발명에서 발견한 돌연변이 유전자 및/또는 이로부터 코딩되는 돌연변이 단백질에 대하여 유전자 또는 단백질 검사를 실시함으로써 근위축성측삭경화증을 조기 진단할 수 있으며, 적절한 치료방법을 조기에 적용하여 치료효과를 극대화할 수 있고, 나아가 정확한 병인에 따른 맞춤치료를 가능하게 할 수 있다.

Description

근위축성측삭경화증에 대한 진단 마커로서의 돌연변이 유전자 및 이를 이용한 진단방법{Mutant Genes as Diagnosis Marker for Amyotrophic Lateral Sclerosis and Diagnosis Method Using the Same}

본 발명은 근위축성측삭경화증에 대한 진단 마커로서의 돌연변이 유전자 및 이를 이용한 진단방법에 관한 것이다.

근위축성측삭경화증(Amyotrophic lateral sclerosis; ALS)은 성인에서 발병하는 신경 퇴행성 질환으로 점진적인 대뇌 겉질, 숨뇌, 및 척수의 운동 신경 소실로 인해 발생한다. 약 10%의 환자에서는 가족력이 있는 가족성 ALS이며, 90% 가량의 환자는 가족력 없이 산발적으로 발생한다. 현재까지 SOD1, TARDBP, FUS, C9orf72 등을 비롯하여 여러 유전자들의 돌연변이가 ALS의 원인으로 보고되었으나, 가족성 ALS 환자 중 1/3과 산발성 ALS 환자의 약 90%에서는 유전적 원인이 밝혀지지 않았다. 최근 신경계 질환에서 산발성 환자 및 건강한 부모를 대상으로 환자에서만 발견되는 신규 변이(de novo variant)를 확인함으로써 질환의 원인이 되는 새로운 유전자를 발굴하는 연구가 대두되고 있다.

본 명세서 전체에 걸쳐 다수의 논문 및 특허문헌이 참조되고 그 인용이 표시되어 있다. 인용된 논문 및 특허문헌의 개시 내용은 그 전체로서 본 명세서에 참조로 삽입되어 본 발명이 속하는 기술 분야의 수준 및 본 발명의 내용이 보다 명확하게 설명된다.

Charcot J, Joffroy A. Arch Physiol Norm Pathol 1869;2:744-760 Cleveland DW, Rothstein JD. Nat Rev Neurosci 2001;2:806-819 Brain L, Walton JN. Oxford university press, London, 1969 Wijesekera LC, Leigh PN. Orphanet J Rare Dis 2009;4:3 Rowland LP, Shneider NA. N Engl J Med 2001;344:1688-1700 Kinsley L, Siddique T. Amyotrophic Lateral Sclerosis Overview. GeneReviews®http://www.ncbi.nlm.nih.gov/books/NBK1450/, Seattle, University of Washington, 2001 Traynor BJ, Codd MB, Corr B, Forde C, Frost E, Hardiman O. Neurology 1999;52:504-509 Abhinav K et al., Neuroepidemiology 2007;29:44-48 Manjaly ZR et al., Amyotroph Lateral Scler 2010;11:439-442 Forbes RB, Colville S, Swingler RJ. Age Ageing 2004;33:131-134 Gouveia LO, de Carvalho M. Amyotroph Lateral Scler 2007;8:323-327 Haverkamp LJ, Appel V, Appel SH. Brain 1995;118 ( Pt 3):707-719 Swinnen B, Robberecht W. Nat Rev Neurol 2014;10:661-670 Chio A, Calvo A, Moglia C, Mazzini L, Mora G. J Neurol Neurosurg Psychiatry 2011;82:740-746 Pinto S, Pinto A, De Carvalho M. Eura Medicophys 2007;43:505-509 Turner MR et al., J Neurol Sci 2010;294:81-85 Shoesmith CL, Findlater K, Rowe A, Strong MJ. J Neurol Neurosurg Psychiatry 2007;78:629-631 Gordon PH et al., Neurology 2006;66:647-653 Phukan J, Pender NP, Hardiman O. Lancet Neurol 2007;6:994-1003 A VB. Allg Z Psychiat Psychischgerichtliche Med 1932;96:364-366 Bak TH, Hodges JR. J Neurol 2001;248:260-270 Jeong Y et al., Neurology 2005;64:734-736 Talbot PR et al., J Neurol Neurosurg Psychiatry 1995;58:541-547 Mioshi E et al., Neurology 2014;82:149-155 Gilbert RM et al., Mov Disord 2010;25:1868-1875 Annesi G et al., Ann Neurol 2005;58:803-807 DeJesus-Hernandez M et al., Neuron 2011;72:245-256 Lindquist SG et al., Clin Genet 2013;83:279-283 Hensman Moss DJ et al., Neurology 2014;82:292-299 Isaacs JD et al., J Neurol Neurosurg Psychiatry 2007;78:750-753 Baltadzhieva R, Gurevich T, Korczyn AD. Curr Opin Neurol 2005;18:487-493 Brooks BR, Miller RG, Swash M, Munsat TL. Amyotroph Lateral Scler Other Motor Neuron Disord 2000;1:293-299 de Carvalho M et al., Clin Neurophysiol 2008;119:497-503 Cedarbaum JM et al., J Neurol Sci 1997;152 Suppl 1:S1-9 Cedarbaum JM et al., J Neurol Sci 1999;169:13-21 A controlled trial of recombinant methionyl human BDNF in ALS: The BDNF Study Group (Phase III). Neurology 1999;52:1427-1433 Cudkowicz ME et al., Neurology 2003;61:456-464 Groeneveld GJ et al., Ann Neurol 2003;53:437-445 Franchignoni F, Mandrioli J, Giordano A, Ferro S. Amyotroph Lateral Scler Frontotemporal Degener 2015:1-7 Franchignoni F et al., J Neurol Neurosurg Psychiatry 2013;84:1340-1345 Harwood CA, McDermott CJ, Shaw PJ. Amyotroph Lateral Scler 2009;10:191-204 Gallo V et al., Ann Neurol 2009;65:378-385 Roelofs-Iverson RA et al., Neurology 1984;34:393-395 Armon C. Neuroepidemiology 2003;22:217-228 Chio A et al., Brain 2005;128:472-476 Kasarskis EJ et al., Amyotroph Lateral Scler 2009;10:35-41 Pasinelli P, Brown RH. Nat Rev Neurosci 2006;7:710-723 Kiernan MC et al., The Lancet 2011;377:942-955 Watkins JC, Evans RH. Annu Rev Pharmacol Toxicol 1981;21:165-204 Heath PR, Shaw PJ. Muscle Nerve 2002;26:438-458 Maher P, Davis JB. J Neurosci 1996;16:6394-6401 Meldrum B, Garthwaite J. Trends Pharmacol Sci 1990;11:379-387 Liu R et al., Ann Neurol 1998;44:763-770 Menzies FM et al., Brain 2002;125:1522-1533 Damiano M et al., J Neurochem 2006;96:1349-1361 Rizzardini M et al., Brain Res Bull 2006;69:465-474 Bruijn LI et al., Science 1998;281:1851-1854 Sreedharan J et al., Science 2008;319:1668-1672 Kwiatkowski TJ et al., Science 2009;323:1205-1208 Renton AE, Chio A, Traynor BJ. Nat Neurosci 2014;17:17-23 Sreedharan J, Brown RH, Jr. Ann Neurol 2013;74:309-316 Andersen PM, Al-Chalabi A. Nat Rev Neurol 2011;7:603-615 Al-Chalabi A, Lewis CM. Hum Hered 2011;71:281-288 Rosen DR et al., Nature 1993;362:59-62 Neumann M et al., Science 2006;314:130-133 Maruyama H et al., Nature 2010;465:223-226 Johnson JO et al., Neuron 2010;68:857-864 Fecto F et al., Arch Neurol 2011;68:1440-1446 Wu CH et al., Nature 2012;488:499-503 Deng HX et al., Nature 2011;477:211-215 Luty AA et al., Ann Neurol 2010;68:639-649 Kim HJ et al., Nature 2013;495:467-473 Chio A et al., Neurology 2008;70:533-537 Andersen PM. Curr Neurol Neurosci Rep 2006;6:37-46 Wang J, Xu G, Borchelt DR. Neurobiol Dis 2002;9:139-148 Gurney ME et al., Science 1994;264:1772-1775 Boillee S et al., Science 2006;312:1389-1392 Cudkowicz ME et al., Ann Neurol 1997;41:210-221 Andersen PM et al., Brain 1996;119 ( Pt 4):1153-1172 Chio A et al., Neurology 2012;79:1983-1989 Buratti E, Baralle FE. Front Biosci 2008;13:867-878 Winton MJ et al., J Biol Chem 2008;283:13302-13309 Vance C et al., Science 2009;323:1208-1211 Renton AE et al., Neuron 2011;72:257-268 Majounie E et al., Lancet Neurol 2012;11:323-330 Wojciechowska M, Krzyzosiak WJ. Hum Mol Genet 2011;20:3811-3821 Chew J et al., Science 2015 Johnson JO et al., Nat Neurosci 2014;17:664-666 Buratti E et al., J Biol Chem 2005;280:37572-37584 Rademakers R, van Blitterswijk M. Neuron 2014;84:241-243 Smith BN et al., Neuron 2014;84:324-331 Cirulli ET et al., Science 2015;347:1436-1441 Freischmidt A et al., Nat Neurosci 2015 Kwon MJ et al., Neurobiol Aging 2012;33:1017 e1017-1023 Kim HJ et al., Neurobiol Aging 2014;35:1957.e1957-1958 Jang JH et al., Neurobiol Aging 2013;34:1311.e1317-1319 Crow JF. Nat Rev Genet 2000;1:40-47 Roach JC et al., Science 2010;328:636-639 Conrad DF et al., Nat Genet 2011;43:712-714 Kong A et al., Nature 2012;488:471-475 Littler M, Morton NE. J Med Genet 1990;27:307-310 Ivanchuk SM, Myers SM, Eng C, Mulligan LM. Hum Mol Genet 1996;5:2023-2026 O'Roak BJ et al., Nature 2012;485:246-250 Gratten J, Visscher PM, Mowry BJ, Wray NR. Nat Genet 2013;45:234-238 Veltman JA, Brunner HG. Nat Rev Genet 2012;13:565-575 Vissers LE et al., Nat Genet 2010;42:1109-1112 Alexander MD et al., Ann Neurol 2002;52:680-683 Chio A et al., Neurobiol Aging 2011;32:553 e523-556 DeJesus-Hernandez M et al., Hum Mutat 2010;31:E1377-1389 Chesi A et al., Nat Neurosci 2013;16:851-855 Calvo A et al., Neurobiol Aging 2014;35:1513 e1517-1513 e1511 Kim YE et al., Neurobiol Aging 2015;36:1604.e1617-1609 Mitchell JD. J Neurol 2000;247:7-12 Li H, Durbin R. Bioinformatics 2009;25:1754-1760 Olkowski ZL. Neuroreport 1998;9:239-242 Droppelmann CA et al., Amyotroph Lateral Scler Frontotemporal Degener 2013;14:444-451 Takahashi Y et al., Am J Hum Genet 2013;93:900-905 Couthouis J et al., Hum Mol Genet 2012;21:2899-2911 Al-Chalabi A et al., Hum Mol Genet 1999;8:157-164 Ticozzi N et al., Ann Neurol 2010;68:102-107 Leung CL et al., Brain Pathol 2004;14:290-296 Teyssou E et al., Neurobiol Aging 2014;35:1213.e1219-1213.e1212 Sabatelli M et al., Amyotroph Lateral Scler 2012;13:580-584 van Blitterswijk M et al., PLoS One 2012;7:e48983 Munch C et al., Neurology 2004;63:724-726 Ng PC et al., Nucleic Acids Res 2003;31:3812-3814 Ramensky V, Bork P, Sunyaev S. Nucleic Acids Res 2002;30:3894-3900 Adzhubei IA et al., Nat Methods 2010;7:248-249 Chen J et al., Nucleic Acids Res 2009;37:W305-311 Ezquerra M, Carnero C, Blesa R, Oliva R. Arch Neurol 2000;57:485-488 Pringle CE et al., Brain 1992;115 ( Pt 2):495-520 Dumanchin C et al., J Med Genet 1998;35:672-673 Portet F et al., Neurology 2003;61:1136-1137 Golan MP et al., Exp Neurol 2007;208:264-268 Ataka S et al., Arch Neurol 2004;61:1773-1776 Hattori S et al., Neurosci Lett 2004;368:319-322 Raman A et al., J Neurol Sci 2007;260:78-82 Brooks WS et al., Brain 2003;126:783-791 Verkkoniemi A et al., Neurology 2000;54:1103-1109 Crook R et al., Nat Med 1998;4:452-455 Sanders SJ et al., Nature 2012;485:237-241 Neale BM et al., Nature 2012;485:242-245 Iossifov I et al., Neuron 2012;74:285-299 Rebhun JF, Castro AF, Quilliam LA. J Biol Chem 2000;275:34901-34908 Ye T, Ip JP, Fu AK, Ip NY. Nat Commun 2014;5:4826 de Rooij J et al., J Biol Chem 1999;274:38125-38130 Pham N, Rotin D. J Biol Chem 2001;276:28478-28483 Ohtsuka T et al., Biochem Biophys Res Commun 1999;265:38-44 Hisata S et al., J Cell Biol 2007;178:843-860 Bilasy SE et al., Eur J Neurosci 2009;29:1994-2008 Lee KJ et al., Neuron 2011;69:957-973 Utreras E et al., Neurochem Int 2013;62:848-853 Beales PL et al., Nat Genet 2007;39:727-729 Wang C, Yuan X, Yang S. Exp Cell Res 2013;319:623-632 Niwa R et al., Cell 2002;108:233-246 Fromer M et al., Nature 2014;506:179-184 Riboldi E et al., J Biol Chem 2011;286:35329-35333 Chappell CP et al., J Immunol 2014;192:5789-5801 Boucrot E et al., Science 2005;308:1174-1178 Petrou P et al., J Biol Chem 2005;280:10350-10356 McGregor L et al., Nat Genet 2003;34:203-208 Sugita S et al., J Biol Chem 1998;273:32715-32724 Arcos-Burgos M et al., Mol Psychiatry 2010;15:1053-1066 Teves ME et al., Am J Respir Cell Mol Biol 2013;48:765-772 Teves ME et al., PLoS One 2015;10:e0125936 Zhang B et al., , Wang M, Tang D, Li Y, Xu M, Gu M, Cheng Z, Yu H. J Exp Bot 2015 Brenneman MA et al., Mol Cell 2002;10:387-395 van Blitterswijk M et al., Hum Mol Genet 2012;21:3776-3784

본 발명자들은 산발성 ALS 환자 및 그들의 부모를 대상으로 엑솜 서열 확인법을 이용하여 ALS에 대한 새로운 원인 유전자를 발굴하고자 연구 노력하였다. 그 결과, ALS 환자에서 10개 유전자에 대한 신규 변이를 발견하였으며, 특히 RAPGEF2 유전자가 ALS의 새로운 원인 유전자임을 규명하였고, 상기 신규 변이가 ALS 진단에 유용하게 이용될 수 있음을 확인함으로써 본 발명을 완성하였다.

따라서, 본 발명의 목적은 근위축성측삭경화증에 대한 진단 마커로서 RAPGEF2, IFT80, SSH2, XRCC3, SPAG17, PLEKHM2, CLEC4C, FRAS1, ADGRL3, PSEN1 돌연변이 유전자를 제공하는데 있다.

본 발명의 다른 목적은 근위축성측삭경화증에 대한 진단 마커로서 RapGEF2, IFT80, SSH2, XRCC3, SPAG17, CLEC4C, FRAS1, ADGRL3, PSEN1 돌연변이 단백질을 제공하는데 있다.

본 발명의 또 다른 목적은 근위축성측삭경화증의 진단에 필요한 정보를 제공하는 방법을 제공하는데 있다.

본 발명의 또 다른 목적은 근위축성측삭경화증 진단용 조성물을 제공하는데 있다.

본 발명의 또 다른 목적은 근위축성측삭경화증 진단용 키트를 제공하는데 있다.

본 발명의 다른 목적 및 이점은 하기의 발명의 상세한 설명 및 청구범위에 의해 보다 명확하게 된다.

본 발명의 일 양태에 따르면, 본 발명은 근위축성측삭경화증(Amyotrophic lateral sclerosis; ALS)에 대한 진단 마커로서 (ⅰ) 서열목록 제1서열의 염기서열에서 4069번째 염기인 구아닌이 아데닌으로 치환, 1883번째 염기인 시토신이 티민으로 치환 또는 3293번째 염기인 구아닌이 아데닌으로 치환된 RAPGEF2 돌연변이 유전자; (ⅱ) 서열목록 제2서열의 염기서열에서 595번째 염기인 구아닌이 아데닌으로 치환된 IFT80 돌연변이 유전자; (ⅲ) 서열목록 제3서열의 염기서열에서 1408번째 염기인 구아닌이 티민으로 치환된 SSH2 돌연변이 유전자; (ⅳ) 서열목록 제4서열의 염기서열에서 598번째 염기인 구아닌이 아데닌으로 치환된 XRCC3 돌연변이 유전자; (ⅴ) 서열목록 제5서열의 염기서열에서 2815번째 염기인 구아닌이 티민으로 치환된 SPAG17 돌연변이 유전자; (ⅵ) 서열목록 제6서열의 염기서열에서 1921+6번째 염기인 시토신이 티민으로 치환된 PLEKHM2 돌연변이 유전자; (ⅶ) 서열목록 제7서열의 염기서열에서 629번째에서 631번째 염기인 아데닌, 구아닌 및 아데닌이 결실된 CLEC4C 돌연변이 유전자; (ⅷ) 서열목록 제8서열의 염기서열에서 8393번째 염기인 시토신이 티민으로 치환된 FRAS1 돌연변이 유전자; (ⅸ) 서열목록 제9서열의 염기서열에서 715번째 염기인 아데닌이 구아닌으로 치환된 ADGRL3 돌연변이 유전자; 및 (ⅹ) 서열목록 제10서열의 염기서열에서 497번째 염기인 티민이 시토신으로 치환된 PSEN1 돌연변이 유전자로 구성된 군으로부터 선택되는 돌연변이 유전자를 제공한다.

본 발명의 다른 일 양태에 따르면, 본 발명은 근위축성측삭경화증에 대한 진단 마커로서 (ⅰ) 서열목록 제1서열의 염기서열에서 4069번째 염기인 구아닌이 아데닌으로 치환, 1883번째 염기인 시토신이 티민으로 치환 또는 3293번째 염기인 구아닌이 아데닌으로 치환된 RAPGEF2 돌연변이 유전자로부터 암호화되는 RapGEF2 돌연변이 단백질; (ⅱ) 서열목록 제2서열의 염기서열에서 595번째 염기인 구아닌이 아데닌으로 치환된 IFT80 돌연변이 유전자로부터 암호화되는 IFT80 돌연변이 단백질; (ⅲ) 서열목록 제3서열의 염기서열에서 1408번째 염기인 구아닌이 티민으로 치환된 SSH2 돌연변이 유전자로부터 암호화되는 SSH2 돌연변이 단백질; (ⅳ) 서열목록 제4서열의 염기서열에서 598번째 염기인 구아닌이 아데닌으로 치환된 XRCC3 돌연변이 유전자로부터 암호화되는 XRCC3 돌연변이 단백질; (ⅴ) 서열목록 제5서열의 염기서열에서 2815번째 염기인 구아닌이 티민으로 치환된 SPAG17 돌연변이 유전자로부터 암호화되는 SPAG17 돌연변이 단백질; (ⅵ) 서열목록 제7서열의 염기서열에서 629번째에서 631번째 염기인 아데닌, 구아닌 및 아데닌이 결실된 CLEC4C 돌연변이 유전자로부터 암호화되는 CLEC4C 돌연변이 단백질; (ⅶ) 서열목록 제8서열의 염기서열에서 8393번째 염기인 시토신이 티민으로 치환된 FRAS1 돌연변이 유전자로부터 암호화되는 FRAS1 돌연변이 단백질; (ⅷ) 서열목록 제9서열의 염기서열에서 715번째 염기인 아데닌이 구아닌으로 치환된 ADGRL3 돌연변이 유전자로부터 암호화되는 ADGRL3 돌연변이 단백질; 및 (ⅸ) 서열목록 제10서열의 염기서열에서 497번째 염기인 티민이 시토신으로 치환된 PSEN1 돌연변이 유전자로부터 암호화되는 PSEN1 돌연변이 단백질로 구성된 군으로부터 선택되는 돌연변이 단백질을 제공한다.

본 발명자들은 산발성 ALS 환자 및 그들의 부모를 대상으로 엑솜 서열 확인법을 이용하여 ALS에 대한 새로운 원인 유전자를 발굴하고자 연구 노력하였다. 그 결과, ALS 환자에서 10개 유전자에 대한 신규 변이를 발견하였으며, 특히 RAPGEF2 유전자가 ALS의 새로운 원인 유전자임을 규명하였고, 상기 신규 변이가 ALS 진단에 유용하게 이용될 수 있음을 확인하였다.

근위축성측삭경화증(Amyotrophic lateral sclerosis; ALS)은 운동신경세포만 선택적으로 사멸하는 질환으로 루게릭병으로도 불리우며, 대뇌 겉질의 상위운동신경세포(upper motor neuron)와 뇌간 및 척수의 아래운동신경세포(lower motor neuron) 모두가 점차적으로 파괴되는 특징을 보인다. 임상 증상은 서서히 진행되는 사지의 위약(weakness, 쇠약) 및 위축으로 시작하고, 병이 진행되면서 결국 호흡근 마비로 수년 내에 사망에 이르게 되는 치명적인 질환이다.

본 발명에서는 총 15명의 한국인 산발성 ALS 환자 및 부모를 대상으로 엑솜 서열 확인법을 시행하고, 엑손 및 스플라이스 위치에서 신규 변이를 발견하였으며, 이 변이가 이전에 보고된 인구 집단의 빈도가 1% 미만으로 매우 드물고 한국인 정상인 대조군에서 발견되지 않는 변이임을 규명하였다. 본 발명에서 ALS 환자로부터 발견한 신규 변이는 RAPGEF2 c.4069G>A (p.Glu1357Lys), RAPGEF2 c.1883C>T (p.Thr628Ile), RAPGEF2 c.3293G>A (p.Arg1098His), FRAS1 c.8393C>T (p.Ala2798Val), SPAG17 c.2815G>T (p.Ala939Ser), XRCC3 c.598G>A (p.Val200Ile), IFT80 c.595G>A (p.Val199Ile), ADGRL3 c.715A>G (p.Ser239Gly), SSH2 c.1408G>T (p.Glu470*), CLEC4C c.629_631delAGA (p.Lys210del), PLEKHM2 (c.1921+6C>T) 및 PSEN1 c.497T>C (p.Leu166Pro)였으며, 이 가운데 특히 RAPGEF2 유전자에서 발견된 세 개의 변이는 dbSNP141, 1000 지놈 프로젝트 및 EAC (Exome Aggregation Consortitum) 데이터베이스에서 0.1% 미만의 빈도로 매우 드문 변이이거나 보고된 바 없었고, 한국인 대조군에서도 발견되지 않았으며 통계학적 분석에서 RAPGEF2 유전자가 ALS와 관련이 있을 가능성이 확인되었다.

본 발명에서 ALS 환자로부터 발견한 변이 가운데 PSEN1 c.497T>C는 가족성 EOAD(early-onset Alzheimer’s dementia)에서 종전에 보고된 바 있는 변이이나, ALS 환자에서는 처음으로 발견된 변이이다.

그 외에 다른 변이들은 종전에 보고된 적 없는 새로운 변이(variants of unknown significance, VUS)이다. 본 발명에서 발견한 11개의 신규 VUS 가운데 10개 변이는 엑손 영역에 위치하는 아미노산에 영향을 주는 변이였다. FRAS1 c.8393C>T (p.Ala2798Val), RAPGEF2 c.4069G>A (p.Glu1357Lys), RAPGEF2 c.1883C>T (p.Thr628Ile), RAPGEF2 c.3293G>A (p.Arg1098His), SPAG17 c.2815G>T (p.Ala939Ser), XRCC3 c.598G>A (p.Val200Ile), IFT80 c.595G>A (p.Val199Ile), ADGRL3 c.715A>G (p.Ser239Gly) 및 XRCC3 c.598G>A (p.Val200Ile)는 missense 변이이고, CLEC4C c.629_631delAGA (p.Lys210del)는 inframe deletion, SSH2 c.1408G>T (p.Glu470*)는 nonsense 변이를 나타낸다. 나머지 하나는 엑손 경계 근처의 플랭킹 영역에 위치하는 인트론 변이였다(PLEKHM2 c.1921+6C>T).

본 발명의 일 구현예에 따르면, 본 발명의 (ⅰ) RapGEF2 돌연변이 단백질은 서열목록 제11서열의 아미노산 서열에서 1357번째 아미노산 잔기인 글루탐산이 라이신으로 치환, 628번째 아미노산 잔기인 트레오닌이 이소류신으로 치환 또는 1098번째 아미노산 잔기인 아르기닌이 히스티딘으로 치환된 RapGEF2 돌연변이 단백질이고; (ⅱ) IFT80 돌연변이 단백질은 서열목록 제12서열의 아미노산 서열에서 199번째 아미노산 잔기인 발린이 이소류신으로 치환된 IFT80 돌연변이 단백질이며; (ⅲ) SSH2 돌연변이 단백질은 서열목록 제13서열의 아미노산 서열에서 470번째 아미노산 잔기인 글루탐산이 종결코돈으로 치환된 SSH2 돌연변이 단백질이고; (ⅳ) XRCC3 돌연변이 단백질은 서열목록 제14서열의 아미노산 서열에서 200번째 아미노산 잔기인 발린이 이소류신으로 치환된 XRCC3 돌연변이 단백질이며; (ⅴ) SPAG17 돌연변이 단백질은 서열목록 제15서열의 아미노산 서열에서 939번째 아미노산 잔기인 알라닌이 세린으로 치환된 SPAG17 돌연변이 단백질이고; (ⅵ) CLCE4C 돌연변이 단백질은 서열목록 제16서열의 아미노산 서열에서 210번째 아미노산 잔기인 라이신이 결실된 CLEC4C 돌연변이 단백질이며; (ⅶ) FRAS1 돌연변이 단백질은 서열목록 제17서열의 아미노산 서열에서 2798번째 아미노산 잔기인 알라닌이 발린으로 치환된 FRAS1 돌연변이 단백질이고; (ⅷ) ADGRL3 돌연변이 단백질은 서열목록 제18서열의 아미노산 서열에서 239번째 아미노산 잔기인 세린이 글라이신으로 치환된 ADGRL3 돌연변이 단백질이며; (ⅸ) PSEN1 돌연변이 단백질은 서열목록 제19서열의 아미노산 서열에서 166번째 아미노산 잔기인 류신이 프롤린으로 치환된 PSEN1 돌연변이 단백질이다.

PLEKHM2 c.1921+6C>T는 인트론 영역에서 나타나는 변이로서 돌연변이 단백질을 생산하지 않는다.

본 발명에 따르면, 본 발명에서 발견한 돌연변이 유전자 및/또는 이로부터 코딩되는 돌연변이 단백질은 ALS의 유전학적 원인을 밝히고 ALS를 진단하는데 매우 유용하게 사용될 수 있다.

본 발명의 다른 일 양태에 따르면, 본 발명은 다음 단계를 포함하는 근위축성측삭경화증의 진단에 필요한 정보를 제공하는 방법을 제공한다:

(a) 개체(subject)로부터 분리된 생물학적 시료로부터 (ⅰ) 서열목록 제1서열의 염기서열에서 4069번째 염기인 구아닌이 아데닌으로 치환, 1883번째 염기인 시토신이 티민으로 치환 또는 3293번째 염기인 구아닌이 아데닌으로 치환된 RAPGEF2 돌연변이 유전자; (ⅱ) 서열목록 제2서열의 염기서열에서 595번째 염기인 구아닌이 아데닌으로 치환된 IFT80 돌연변이 유전자; (ⅲ) 서열목록 제3서열의 염기서열에서 1408번째 염기인 구아닌이 티민으로 치환된 SSH2 돌연변이 유전자; (ⅳ) 서열목록 제4서열의 염기서열에서 598번째 염기인 구아닌이 아데닌으로 치환된 XRCC3 돌연변이 유전자; (ⅴ) 서열목록 제5서열의 염기서열에서 2815번째 염기인 구아닌이 티민으로 치환된 SPAG17 돌연변이 유전자; (ⅵ) 서열목록 제6서열의 염기서열에서 1921+6번째 염기인 시토신이 티민으로 치환된 PLEKHM2 돌연변이 유전자로 구성된 군으로부터 선택되는 돌연변이 유전자; (ⅶ) 서열목록 제7서열의 염기서열에서 629번째에서 631번째 염기인 아데닌, 구아닌 및 아데닌이 결실된 CLEC4C 돌연변이 유전자; (ⅷ) 서열목록 제8서열의 염기서열에서 8393번째 염기인 시토신이 티민으로 치환된 FRAS1 돌연변이 유전자; (ⅸ) 서열목록 제9서열의 염기서열에서 715번째 염기인 아데닌이 구아닌으로 치환된 ADGRL3 돌연변이 유전자; 또는 (ⅹ) 서열목록 제10서열의 염기서열에서 497번째 염기인 티민이 시토신으로 치환된 PSEN1 돌연변이 유전자의 mRNA 또는 상기 유전자에 의해 코딩되는 돌연변이 단백질을 검출하는 단계; 및

(b) 상기 시료에서 상기 돌연변이 유전자의 mRNA 또는 돌연변이 단백질이 검출된 경우, 상기 개체는 근위축성측삭경화증인 것으로 판정하는 단계.

본 발명에서 용어 “생물학적 시료”란 근위축성측삭경화증 여부를 확인하고자 하는 개체로부터 분리된 조직, 세포, 전혈, 혈청, 혈장, 타액, 객담, 뇌척수액 또는 뇨와 같은 시료를 포함하나, 이들에 한정되는 것은 아니다.

본 발명에 따르면, 상기 단계 (a)에서 mRNA는 상기 돌연변이 유전자에 특이적으로 결합하는 프라이머, 프로브 및 공지된 다양한 시퀀싱 방법을 이용하여 검출할 수 있다.

mRNA를 검출하기 위한 방법으로는 역전사효소 중합효소반응, 경쟁적 역전사효소 중합효소반응, 실시간 역전사효소 중합효소반응, RNase 보호 분석법, 노던 블롯 (northern blot), DNA 마이크로어레이 칩 등이 있으나, 이들에 한정되는 것은 아니다.

상기 방법을 통하여 대상 질환의 발병이 의심되는 개체에서 돌연변이 유전자의 mRNA를 검출할 수 있고, mRNA 검출 여부를 판단하여 근위축성측삭경화증을 진단할 수 있다. mRNA는 바람직하게는 진단 마커로 사용되는 돌연변이 유전자에 특이적인 프라이머를 사용하는 역전사효소 중합반응 또는 상기 유전자에 특이적인 탐침을 사용하는 DNA 마이크로어레이 칩을 이용하여 검출할 수 있다.

본 발명의 일 구현예에 따르면, 진단 마커로 사용되는 돌연변이 유전자에 특이적인 프라이머를 사용하여 역전사효소 중합반응을 수행한 후 생성물을 전기영동하여 확인함으로써 상기 돌연변이 유전자의 존재 여부를 검출하고, 그로부터 근위축성측삭경화증을 간편하게 진단할 수 있다.

한편, DNA 마이크로어레이 칩은 상기 돌연변이 유전자 또는 그 단편에 해당하는 핵산이 유리 등의 기판에 고밀도로 부착되어 있는 DNA 칩을 이용하는 것으로서, 개체 시료로부터 mRNA를 분리하고, 그 말단 또는 내부에 형광물질이 표지된 cDNA 탐침을 만들어 DNA 칩에 혼성화시킴으로써 근위축성측삭경화증을 진단할 수 있다.

구체적으로, DNA 마이크로 어레이 칩을 이용한 분석방법은 하기의 단계를 포함할 수 있다:

(1) 개체 시료로부터 돌연변이 유전자의 mRNA를 분리하는 단계;

(2) 상기 mRNA를 cDNA로 합성하면서 형광물질로 표지하는 단계;

(3) 상기 형광물질로 표지된 cDNA를 돌연변이 유전자에 대한 탐침이 고정된 DNA 마이크로어레이 칩과 혼성화하는 단계; 및

(4) 상기 혼성화된 DNA 마이크로어레이 칩을 분석하여 개체 시료에서의 돌연변이 유전자의 발현을 검출하는 단계.

상기 분석방법에 적합한 형광물질로 Cy3, Cy5, FITC(poly L-lysine-fluorescein isothiocyanate), RITC(rhodamine-B-isothiocyanate), 로다민(rhodamine) 등을 사용할 수 있으나, 이들에 한정되는 것은 아니다.

본 발명에 따르면, 상기 단계 (a)에서 돌연변이 단백질은 상기 돌연변이 단백질에 특이적으로 결합하는 항체를 이용하여 측정할 수 있다.

돌연변이 단백질을 측정하기 위한 분석방법으로 웨스턴 블로팅, ELISA, 방사선 면역분석법, 방사선 면역확산법, 오우크테로니 면역확산법, 로켓 면역전기영동, 면역조직화학염색, 면역침전분석, 보체고정분석, FACS, 단백질 칩 등을 이용할 수 있으나, 이들에 한정되는 것은 아니다.

상기 방법을 통하여 대상 질환의 발병이 의심되는 개체에서 항원-항체 복합체의 형성량을 검출할 수 있고, 돌연변이 유전자로부터 코딩되는 단백질의 발현 여부를 판단하여 근위축성측삭경화증 여부를 진단할 수 있다.

본 발명에서 용어 “항원-항체 복합체”란 돌연변이 유전자로부터 코딩되는 단백질과 이에 특이적인 항체의 결합물을 의미하고, 항원-항체 복합체의 형성량은 검출 표지의 신호강도를 통해서 정량적으로 측정할 수 있다.

단백질 발현은 예를 들면 ELISA를 이용하여 측정할 수 있다. ELISA는 고체 지지체에 부착된 항원을 인지하는 표지된 항체를 이용하는 직접 ELISA, 고체 지지체에 부착된 항원을 인지하는 항체의 복합체에서 포획 항체를 인지하는 표지된 항체를 이용하는 간접 ELISA, 고체 지지체에 부착된 항체와 항원의 복합체에서 항원을 인지하는 표지된 또 다른 항체를 이용하는 직접 샌드위치 ELISA, 고체 지지체에 부착된 항체와 항원의 복합체에서 항원을 인지하는 또 다른 항체와 반응시킨 후 이 항체를 인지하는 표지된 2차 항체를 이용하는 간접 샌드위치 ELISA 등 다양한 ELISA 방법이 포함된다.

또한, 상기 돌연변이 유전자로부터 코딩되는 단백질에 대한 하나 이상의 항체를 이용한 웨스턴 블로팅을 이용할 수 있다. 시료에서 전체 단백질을 분리하고, 이를 전기영동하여 단백질을 크기에 따라 분리한 다음, 니트로셀룰로스 막으로 이동시켜 항체와 반응시킨다. 생성된 항원-항체 복합체의 양을 표지된 항체를 이용하여 확인하는 방법으로 유전자의 발현에 의해 생성된 단백질의 양을 확인함으로써 근위축성측삭경화증을 진단할 수 있다.

또한, 상기 돌연변이 유전자로부터 코딩되는 단백질에 대한 하나 이상의 항체를 이용한 면역조직화학염색을 실시할 수 있다. 개체로부터 채취한 조직을 고정시킨 후 당해 분야에 널리 공지된 방법으로 파라핀 포매 블록을 만든다. 이들을 수 ㎛ 두께의 절편으로 만들어 유리 슬라이드에 붙여 조직 절편 슬라이드를 만든 후, 여기에 본 발명에 따른 돌연변이 유전자로부터 코딩되는 단백질에 특이적인 항체를 공지의 방법에 따라 반응시킨다. 이후, 반응하지 못한 항체는 세척하여 제거하고, 면역반응을 관찰하기 위한 발색시약으로 반응시켜 상기 단백질의 발현을 현미경 하에서 관찰함으로써 근위축성측삭경화증을 진단할 수 있다.

또한, 상기 돌연변이 유전자로부터 코딩되는 단백질에 대한 하나 이상의 항체가 기판 위의 정해진 위치에 배열되어 고밀도로 고정화되어 있는 단백질 칩을 이용할 수 있다. 단백질 칩을 이용하여 시료를 분석하는 방법은 시료에서 단백질을 분리하고, 분리한 단백질을 단백질 칩과 혼성화시켜 항원-항체 복합체를 형성하고, 이를 판독하여 단백질의 존재를 확인함으로써 근위축성측삭경화증을 진단할 수 있다.

본 발명의 다른 일 양태에 따르면, 본 발명은 생물학적 시료로부터 본 발명의 돌연변이 유전자의 mRNA 또는 상기 유전자에 의해 코딩되는 돌연변이 단백질을 검출할 수 있는 검출제를 포함하는 근위축성측삭경화증 진단용 조성물을 제공한다.

본 발명에서 mRNA를 검출하는데 사용되는 검출제는 상기 돌연변이 유전자에 특이적으로 결합하는 프라이머 또는 프로브이다.

본 발명의 근위축성측삭경화증 진단용 조성물에서 이용되는 프로브 또는 프라이머는 상기 돌연변이 유전자 뉴클레오티드 서열에 대하여 상보적인 서열을 갖는다. 본 명세서에서 용어 “상보적(complementary)”은 어떤 특정한 혼성화(hybridization) 또는 어닐링 조건 하에서 상술한 뉴클레오티드 서열에 선택적으로 혼성화할 수 있을 정도의 상보성을 갖는 것을 의미한다. 따라서 용어 “상보적”은 용어 완전 상보적(perfectly complementary)과는 다른 의미를 가지며, 본 발명의 프라이머 또는 프로브는 상술한 뉴클레오티드 서열에 선택적으로 혼성화할 수 있을 정도이면, 하나 또는 그 이상의 미스매치(mismatch) 염기서열을 가질 수 있다.

본 명세서에서 사용되는 용어 “프라이머”는 적합한 온도에서 적합한 완충액 내에서 적합한 조건(즉, 4종의 다른 뉴클레오사이드 트리포스페이트 및 중합반응 효소) 하에서 주형-지시 DNA 합성의 개시점으로 작용할 수 있는 단일-가닥 올리고뉴클레오타이드를 의미한다. 프라이머의 적합한 길이는 다양한 요소, 예컨대, 온도와 프라이머의 용도에 따라 변화가 있지만 전형적으로 15-30 베이스 페어이다. 짧은 프라이머 분자는 주형과 충분히 안정된 혼성 복합체를 형성하기 위하여 일반적으로 보다 낮은 온도를 요구한다.

프라이머의 서열은 주형의 일부 서열과 완전하게 상보적인 서열을 가질 필요는 없으며, 주형과 혼성화되어 프라이머 고유의 작용을 할 수 있는 범위 내에서의 충분한 상보성을 가지면 충분하다. 따라서 본 발명에서의 프라이머는 주형인 상술한 뉴클레오티드 서열에 완벽하게 상보적인 서열을 가질 필요는 없으며, 이 유전자 서열에 혼성화되어 프라이머 작용을 할 수 있는 범위 내에서 충분한 상보성을 가지면 충분하다. 이러한 프라이머의 디자인은 상술한 뉴클레오티드 서열을 참조하여 당업자에 의해 용이하게 실시할 수 있으며, 예컨대, 프라이머 디자인용 프로그램(예: PRIMER 3 프로그램)을 이용하여 할 수 있다.

본 명세서에서 사용된 용어 “프로브”는 자연의 또는 변형된 모노머 또는 연쇄(linkages)의 선형 올리고머를 의미하며, 디옥시리보뉴클레오타이드 및 리보뉴클레오타이드를 포함하고 타깃 뉴클레오타이드 서열에 특이적으로 혼성화 할 수 있으며, 자연적으로 존재하거나 또는 인위적으로 합성된 것이다. 본 발명의 프로브는 바람직하게는 단일쇄이며, 올리고디옥시리보뉴클레오타이드이다.

프라이머 또는 프로브 제작 시 참조하여야 하는 본 발명 마커의 뉴클레오타이드 서열은 서열목록 제1서열 내지 제10서열에서 확인할 수 있으며, 이 서열을 참조하여 프라이머 또는 프로브를 디자인할 수 있다.

본 발명에서 단백질을 검출하는데 사용되는 검출제는 올리고펩타이드, 모노클로날 항체, 폴리클로날 항체, 키메릭(chimeric) 항체, 리간드, PNA(Peptide nucleic acid) 또는 앱타머(aptamer)이다. 본 발명에서 사용되는 단백질 검출제는 바람직하게는 본 발명의 돌연변이 유전자에 의해 코딩되는 단백질에 특이적인 항체이다.

본 발명에서 이용되는 항체는 폴리클로날 또는 모노클로날 항체이며, 바람직하게는 모노클로날 항체이다. 항체는 당업계에서 통상적으로 실시되는 방법들, 예를 들어, 융합 방법(Kohler and Milstein, European Journal of Immunology, 6:511-519(1976)), 재조합 DNA 방법(미국 특허 제4,816,56호) 또는 파아지 항체 라이브러리 방법(Clackson et al, Nature, 352:624-628(1991) 및 Marks et al, J. Mol . Biol ., 222:58, 1-597(1991))에 의해 제조될 수 있다. 항체 제조에 대한 일반적인 과정은 Harlow, E. and Lane, D., Using Antibodies: A Laboratory Manual, Cold Spring Harbor Press, New York, 1999; Zola, H., Monoclonal Antibodies: A Manual of Techniques, CRC Press, Inc., Boca Raton, Florida, 1984; 및 Coligan , CURRENT PROTOCOLS IN IMMUNOLOGY, Wiley/Greene, NY, 1991에 상세하게 기재되어 있으며, 상기 문헌들은 본 명세서에 참조로서 삽입된다. 예를 들어, 단일클론 항체를 생산하는 하이브리도마 세포의 제조는 불사멸화 세포주를 항체-생산 림프구와 융합시켜 이루어지며, 이 과정에 필요한 기술은 당업자에게 잘 알려져 있으며 용이하게 실시할 수 있다. 폴리클로날 항체는 단백질 항원을 적합한 동물에게 주사하고, 이 동물로부터 항혈청을 수집한 다음, 공지의 친화성(affinity) 기술을 이용하여 항혈청으로부터 항체를 분리하여 얻을 수 있다.

본 발명의 다른 일 양태에 따르면, 본 발명은 상기 근위축성측삭경화증 진단용 조성물을 포함하는 근위축성측삭경화증 진단용 키트를 제공한다.

본 발명의 키트는 마이크로어레이, 유전자 증폭 키트 또는 면역분석(immunoassay)용 키트이다.

본 발명의 키트가 마이크로어레이인 경우에는 마이크로어레이의 고상표면에 프로브가 고정화 되어 있다.

본 발명의 마이크로어레이에 있어서, 상기한 프로브는 혼성화 어레이 요소(hybridizable array element)로서 이용되며, 기체(substrate) 상에 고정화된다. 바람직한 기체는 적합한 견고성 또는 반-견고성 지지체로서, 예컨대, 막, 필터, 칩, 슬라이드, 웨이퍼, 파이버, 자기성 비드 또는 비자기성 비드, 겔, 튜빙, 플레이트, 고분자, 미소입자 및 모세관을 포함한다. 상기한 혼성화 어레이 요소는 상기의 기체상에 배열되고 고정화 된다. 이와 같은 고정화는 화학적 결합 방법 또는 UV와 같은 공유 결합적 방법에 의해 실시된다. 예를 들어, 상기 혼성화 어레이 요소는 에폭시 화합물 또는 알데히드기를 포함하도록 변형된 글래스 표면에 결합될 수 있고, 또한 폴리라이신 코팅 표면에서 UV에 의해 결합될 수 있다. 또한, 상기 혼성화 어레이 요소는 링커(예: 에틸렌 글리콜 올리고머 및 디아민)를 통해 기체에 결합될 수 있다.

한편, 본 발명의 마이크로어레이에 적용되는 시료 DNA는 표지(labeling)될 수 있고, 마이크로어레이상의 어레이 요소와 혼성화된다. 혼성화 조건은 다양하게 할 수 있다. 혼성화 정도의 검출 및 분석은 표지 물질에 따라 다양하게 실시될 수 있다.

프로브의 표지는 혼성화 여부를 검출케 하는 시그널을 제공할 수 있으며, 이는 올리고뉴클레오타이드에 연결될 수 있다. 적합한 표지는 형광단(예컨대, 플루오리신 (fluorescein), 피코에리트린 (phycoerythrin), 로다민, 리사민 (lissamine), 그리고 Cy3와 Cy5 (Pharmacia), 발색단, 화학발광단, 자기입자, 방사능동위원소(P³² 및 S³⁵), 매스 표지, 전자밀집입자, 효소(알칼린 포스파타아제 또는 호스래디쉬 퍼옥시다아제), 조인자, 효소에 대한 기질, 중금속(예컨대, 금) 그리고 항체, 스트렙타비딘, 바이오틴, 디곡시게닌과 킬레이팅기와 같은 특정 결합 파트너를 갖는 햅텐을 포함하나, 이에 한정되는 것은 아니다. 표지는 당업계에서 통상적으로 실시되는 다양한 방법, 예컨대, 닉 트랜스레이션 (nick translation) 방법, 무작위 프라이밍 방법 (Multiprime DNA labelling systems booklet, "Amersham"(1989)) 및 카이네이션 방법 (Maxam & Gilbert, Methods in Enzymology, 65:499(1986))을 통해 실시될 수 있다. 표지는 형광, 방사능, 발색 측정, 중량 측정, X-선 회절 또는 흡수, 자기, 효소적 활성, 매스 분석, 결합 친화도, 혼성화 고주파, 나노크리스탈에 의하여 검출할 수 있는 시그널을 제공한다.

프로브를 이용하는 경우, 프로브를 cDNA 분자와 혼성화시킨다. 본 발명에서, 적합한 혼성화 조건은 최적화 절차에 의하여 일련의 과정으로 결정될 수 있다. 이런 절차는 연구실에서 사용을 위한 프로토콜을 수립하기 위하여 당업자에 의하여 일련의 과정으로 실시된다. 예를 들어, 온도, 성분의 농도, 혼성화 및 세척 시간, 완충액 성분 및 이들의 pH 및 이온세기 등의 조건은 프로브의 길이 및 구아닌과 시토신의 양 및 타깃 뉴클레오타이드 서열 등의 다양한 인자에 의존한다. 혼성화를 위한 상세한 조건은 Joseph Sambrook, et al., Molecular Cloning, A Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.(2001); 및 M.L.M. Anderson, Nucleic Acid Hybridization, Springer-Verlag New York Inc. N.Y.(1999)에서 확인할 수 있다. 예를 들어, 상기 엄격조건 중에서 고 엄격조건은 0.5 M NaHPO₄, 7% SDS(sodium dodecyl sulfate), 1 mM EDTA에서 65℃ 조건으로 혼성화하고, 0.1 x SSC(standard saline citrate)/0.1% SDS에서 68℃ 조건으로 세척하는 것을 의미한다. 또는, 고 엄격조건은 6 x SSC/0.05% 소듐 파이로포스페이트에서 48℃ 조건으로 세척하는 것을 의미한다. 저 엄격조건은 예를 들어, 0.2 x SSC/0.1% SDS에서 42℃ 조건으로 세척하는 것을 의미한다.

혼성화 반응 이후에, 혼성화 반응을 통하여 나오는 혼성화 시그널을 검출한다. 혼성화 시그널은 예컨대, 프로브에 결합된 표지의 종류에 따라 다양한 방법으로 실시할 수 있다. 예를 들어, 프로브가 효소에 의해 표지된 경우, 이 효소의 기질을 혼성화 반응 결과물과 반응시켜 혼성화 여부를 확인할 수 있다. 이용될 수 있는 효소/기질의 조합은, 퍼옥시다아제(예컨대, 호스래디쉬 퍼옥시다아제)와 클로로나프톨, 아미노에틸카바졸, 디아미노벤지딘, D-루시페린, 루시게닌(비스-N-메틸아크리디늄 니트레이트), 레소루핀 벤질 에테르, 루미놀, 암플렉스 레드 시약(10-아세틸-3,7-디하이드록시페녹사진), HYR(p-phenylenediamine-HCl and pyrocatechol), TMB(tetramethylbenzidine), ABTS(2,2‘-Azine-di[3-ethylbenzthiazoline sulfonate]), o-페닐렌디아민(OPD) 및 나프톨/파이로닌; 알칼린 포스파타아제와 브로모클로로인돌일 포스페이트(BCIP), 니트로 블루 테트라졸리움(NBT), 나프톨-AS-B1-포스페이트(naphthol-AS-B1-phosphate) 및 ECF 기질; 글루코스 옥시다아제와 t-NBT(nitroblue tetrazolium) 및 m-PMS(phenzaine methosulfate) 등이다. 프로브가 금 입자로 표지된 경우에는 실버 나이트레이트를 이용하여 실버 염색 방법으로 검출할 수 있다. 따라서 본 발명의 마커를 검출하는 방법을 혼성화에 기초하여 실시하는 경우에는, 구체적으로 (i) 본 발명의 마커의 뉴클레오티드 서열에 대하여 상보적인 서열을 가지는 프로브를 핵산 시료에 혼성화시키는 단계; (ii) 상기 혼성화 반응 발생 여부를 검출하는 단계를 포함한다.

본 발명의 일 구현예에 따르면, 본 발명의 진단용 키트는 유전자 증폭 키트일 수 있다.

본 명세서에 기재된 용어“증폭”은 핵산 분자를 증폭하는 반응을 의미한다. 다양한 증폭 반응들이 당업계에 보고되어 있으며, 이는 중합효소 연쇄반응(PCR)(미국 특허 제4,683,195, 4,683,202, 및 4,800,159호), 역전사-중합효소 연쇄반응(RT-PCR)(Sambrook 등, Molecular Cloning. A Laboratory Manual, 3rd ed. Cold Spring Harbor Press(2001)), Miller, H. I.(WO 89/06700) 및 Davey, C. 등(EP 329,822)의 방법, 리가아제 연쇄 반응(ligase chain reaction; LCR)(17, 18), Gap-LCR(WO 90/01069), 복구 연쇄 반응(repair chain reaction; EP 439,182), 전사-매개 증폭(transcription-mediated amplification; TMA, WO 88/10315), 자가 유지 염기서열 복제(self sustained sequence replication, WO 90/06995), 타깃 폴리뉴클레오티드 염기서열의 선택적 증폭(selective amplification of target polynucleotide sequences, 미국 특허 제6,410,276호), 컨센서스 서열 프라이밍 중합효소 연쇄 반응(consensus sequence primed polymerase chain reaction(CP-PCR), 미국 특허 제4,437,975호), 임의적 프라이밍 중합효소 연쇄 반응(arbitrarily primed polymerase chain reaction(AP-PCR), 미국 특허 제5,413,909호 및 제5,861,245호), 핵산 염기서열 기반 증폭(nucleic acid sequence based amplification(NASBA), 미국 특허 제5,130,238호, 제5,409,818호, 제5,554,517호, 및 제6,063,603호), 가닥 치환 증폭(strand displacement amplification)(21, 22) 및 고리-중재 항온성 증폭(loop-mediated isothermal amplification; LAMP)(23)를 포함하나, 이에 한정되지는 않는다. 사용 가능한 다른 증폭 방법들은 미국특허 제5,242,794, 5,494,810, 4,988,617호 및 미국 특허 제09/854,317호에 기술되어 있다.

PCR은 가장 잘 알려진 핵산 증폭 방법으로, 그의 많은 변형과 응용들이 개발되어 있다. 예를 들어, PCR의 특이성 또는 민감성을 증진시키기 위해 전통적인 PCR 절차를 변형시켜 터치다운(touchdown) PCR, 핫 스타트(hot start) PCR, 네스티드(nested) PCR 및 부스터(booster) PCR이 개발되었다. 또한, 실시간(real-time) PCR, 분별 디스플레이 PCR(differential display PCR: DD-PCR), cDNA 말단의 신속 증폭(rapid amplification of cDNA ends: RACE), 멀티플렉스 PCR, 인버스 중합효소 연쇄반응(inverse polymerase chain reaction: IPCR), 벡토레트(vectorette) PCR 및 TAIL-PCR(thermal asymmetric interlaced PCR)이 특정한 응용을 위해 개발되었다. PCR에 대한 자세한 내용은 McPherson, M.J., 및 Moller, S.G. PCR. BIOS Scientific Publishers, Springer-Verlag New York Berlin Heidelberg, N.Y. (2000)에 기재되어 있으며, 그의 교시사항은 본 명세서에 참조로 삽입된다.

본 발명의 진단용 키트를 프라이머를 이용하여 실시하는 경우에는 유전자 증폭 반응을 실시하여 본 발명의 마커의 뉴클레오티드 서열의 존재 여부를 조사한다. 따라서 본 발명은 원칙적으로 시료 내의 mRNA를 주형으로 하고 mRNA 또는 cDNA에 결합하는 프라이머를 이용하여 유전자 증폭 반응을 실시한다.

mRNA를 얻기 위하여, 시료에서 총 RNA를 분리한다. 총 RNA를 분리하는 것은 당업계에 공지된 통상의 방법에 따라 실시될 수 있다(참조: Sambrook, J. et al., Molecular Cloning. A Laboratory Manual, 3rd ed. Cold Spring Harbor Press(2001); Tesniere, C. et al., Plant Mol . Biol . Rep., 9:242(1991); Ausubel, F.M. et al., Current Protocols in Molecular Biology, John Willey & Sons(1987); 및 Chomczynski, P. et al., Anal. Biochem. 162:156(1987)). 예컨대, TRIzol을 이용하여 용이하게 세포내의 총 RNA를 분리할 수 있다. 이어, 분리된 mRNA로부터 cDNA를 합성하고, 이 cDNA를 증폭한다. 본 발명의 총 RNA는 인간의 시료로부터 분리되는 것이기 때문에, mRNA의 말단에는 폴리-A 테일을 갖고 있으며, 이러한 서열 특성을 이용한 올리고 dT 프라이머 및 역전사 효소를 이용하여 cDNA을 용이하게 합성할 수 있다(참조: PNAS USA, 85:8998(1988); Libert F, et al., Science, 244:569(1989); 및 Sambrook, J. et al., Molecular Cloning. A Laboratory Manual, 3rd ed. Cold Spring Harbor Press(2001)). 이어, 유전자 증폭 반응을 통하여 합성된 cDNA를 증폭한다.

본 발명에 이용되는 프라이머는 주형의 한 부위에 혼성화 또는 어닐링되어, 이중쇄 구조를 형성한다. 이러한 이중쇄 구조를 형성하는 데 적합한 핵산 혼성화의 조건은 Joseph Sambrook, 등, Molecular Cloning, A Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.(2001) 및 Haymes, B. D., 등, Nucleic Acid Hybridization, A Practical Approach, IRL Press, Washington, D.C. (1985)에 개시되어 있다.

다양한 DNA 중합효소가 본 발명의 증폭에 이용될 수 있으며, E. coli DNA 중합효소 I의 “클레나우” 단편, 열안정성 DNA 중합효소 및 박테리오파아지 T7 DNA 중합효소를 포함한다. 바람직하게는, 중합효소는 다양한 박테리아 종으로부터 얻을 수 있는 열안정성 DNA 중합효소이고, 이는 Thermus aquaticus(Taq), Thermus thermophilus(Tth), Thermus filiformis, Thermis flavus, Thermococcus literalis, 및 Pyrococcus furiosus(Pfu)를 포함한다.

중합 반응을 실시할 때, 반응 용기에 반응에 필요한 성분들을 과량으로 제공하는 것이 바람직하다. 증폭 반응에 필요한 성분들의 과량은, 증폭반응이 성분의 농도에 실질적으로 제한되지 않는 정도의 양을 의미한다. Mg² ⁺와 같은 조인자, dATP, dCTP, dGTP 및 dTTP를 원하는 증폭 정도가 달성될 수 있을 정도로 반응 혼합물에 제공하는 것이 요구된다. 증폭 반응에 이용되는 모든 효소들은 동일한 반응 조건에서 활성 상태일 수 있다. 사실, 완충액은 모든 효소들이 최적의 반응 조건에 근접하도록 한다. 따라서 본 발명의 증폭 과정은 반응물의 첨가와 같은 조건의 변화 없이 단일 반응물에서 실시될 수 있다.

본 발명에 있어서 어닐링은 타깃 뉴클레오타이드 서열과 프라이머 사이에 특이적 결합을 가능하게 하는 엄격조건 하에서 실시된다. 어닐링을 위한 엄격조건은 서열-의존적이며 주위 환경적 변수에 따라 다양하다.

이렇게 증폭된 본 발명의 마커의 뉴클레오티드 서열의 cDNA를 적합한 방법으로 분석하여 본 발명의 마커의 뉴클레오티드 서열의 존재 여부를 조사한다. 예를 들어, 상술한 증폭 반응 결과물을 젤 전기영동을 하고, 그 결과 형성되는 밴드를 관찰 및 분석함으로써 본 발명의 마커의 뉴클레오티드 서열의 존재 여부를 조사한다. 이러한 증폭 반응을 통하여, 생시료에서 본 발명의 마커의 뉴클레오티드 서열이 발견되는 경우, 근위축성측삭경화증의 가능성이 높은 것으로 판정한다.

본 발명의 일 구현예에 따르면, 본 발명의 키트는 면역분석(immunoassay) 방식, 즉 항원-항체 반응 방식으로 실시될 수 있다. 이 경우, 상술한 본 발명의 마커에 특이적으로 결합하는 항체 또는 앱타머를 이용하여 실시된다.

본 발명에서 이용되는 항체는 폴리클로날 또는 모노클로날 항체이며, 바람직하게는 모노클로날 항체이다.

이러한 면역분석은 종래에 개발된 다양한 정량적 또는 정성적 면역분석 프로토콜에 따라 실시될 수 있다. 상기 면역분석 포맷은 방사능면역분석, 방사능면역침전, 면역침전, 면역조직화학염색, ELISA(enzyme-linked immunosorbent assay), 캡처-ELISA, 억제 또는 경재 분석, 샌드위치 분석, 유세포 분석(flow cytometry), 면역형광염색 및 면역친화성 정제를 포함하지만, 이에 한정되는 것은 아니다. 상기 면역분석 또는 면역염색의 방법은 Enzyme Immunoassay, E. T. Maggio, ed., CRC Press, Boca Raton, Florida, 1980; Gaastra, W., Enzyme-linked immunosorbent assay(ELISA), in Methods in Molecular Biology, Vol. 1, Walker, J.M. ed., Humana Press, NJ, 1984; 및 Ed Harlow and David Lane, Using Antibodies:A Laboratory Manual, Cold Spring Harbor Laboratory Press, 1999에 기재되어 있으며, 상기 문헌은 본 명세서에 참조로서 삽입된다.

예를 들어, 본 발명의 방법이 방사능면역분석 방법에 따라 실시되는 경우, 방사능동위원소(예컨대, C₁₄, I₁₂₅, P₃₂ 및 S₃₅)로 레이블링된 항체가 본 발명의 마커 분자를 검출하는 데 이용될 수 있다.

본 발명의 방법이 ELISA 방식으로 실시되는 경우, 본 발명의 특정 실시예는 (i) 분석하고자 하는 미지의 세포 시료 분해물을 고체 기질의 표면에 코팅하는 단계; (ⅱ) 일차항체로서의 마커에 대한 항체와 상기 세포 분해물을 반응시키는 단계; (ⅲ) 상기 단계 (ⅱ)의 결과물을 효소가 결합된 이차항체와 반응시키는 단계; 및 (ⅳ) 상기 효소의 활성을 측정하는 단계를 포함한다.

상기 고체 기질로 적합한 것은 탄화수소 폴리머(예컨대, 폴리스틸렌 및 폴리프로필렌), 유리, 금속 또는 젤이며, 가장 바람직하게는 마이크로타이터 플레이트이다.

상기 이차항체에 결합된 효소는 발색반응, 형광반응, 발광반응 또는 적외선 반응을 촉매하는 효소를 포함하나, 이에 한정되지 않으며, 예를 들어, 알칼린 포스파타아제, β-갈락토시다아제, 호스 래디쉬 퍼옥시다아제, 루시퍼라아제 및 사이토크롬 P450을 포함한다. 상기 이차항체에 결합하는 효소로서 알칼린 포스파타아제가 이용되는 경우에는, 기질로서 브로모클로로인돌일 포스페이트(BCIP), 니트로 블루 테트라졸리움(NBT), 나프톨-AS-B1-포스페이트(naphthol-AS-B1-phosphate) 및 ECF(enhanced chemifluorescence)와 같은 발색반응 기질이 이용되고, 호스 래디쉬 퍼옥시다아제가 이용되는 경우에는 클로로나프톨, 아미노에틸카바졸, 디아미노벤지딘, D-루시페린, 루시게닌(비스-N-메틸아크리디늄 니트레이트), 레소루핀 벤질 에테르, 루미놀, 암플렉스 레드 시약(10-아세틸-3,7-디하이드록시페녹사진), HYR(p-phenylenediamine-HCl and pyrocatechol), TMB(tetramethylbenzidine), ABTS(2,2‘-Azine-di[3-ethylbenzthiazoline sulfonate]), o-페닐렌디아민(OPD) 및 나프톨/파이로닌, 글루코스 옥시다아제와 t-NBT(nitroblue tetrazolium) 및 m-PMS(phenzaine methosulfate)과 같은 기질이 이용될 수 있다.

본 발명의 방법이 캡처-ELISA 방식으로 실시되는 경우, 본 발명의 특정 실시예는 (i) 포획항체(capturing antibody)로서 본 발명의 마커에 대한 항체를 고체 기질의 표면에 코팅하는 단계; (ⅱ) 포획항체와 시료를 반응시키는 단계; (ⅲ) 상기 단계 (ⅱ)의 결과물을 시그널을 발생시키는 레이블이 결합되어 있고, 본 발명의 돌연변이 단백질에 특이적으로 반응하는 검출항체(detecting antibody)와 반응시키는 단계; 및 (ⅳ) 상기 레이블로부터 발생하는 시그널을 측정하는 단계를 포함한다.

상기 검출 항체는 검출 가능한 시그널을 발생시키는 레이블을 가지고 있다. 상기 레이블은 화학물질(예컨대, 바이오틴), 효소(알칼린 포스파타아제, β-갈락토시다아제, 호스 래디쉬 퍼옥시다아제 및 사이토크롬 P450), 방사능물질((예컨대, C¹⁴, I¹²⁵, P³² 및 S³⁵), 형광물질(예컨대, 플루오레신), 발광물질, 화학발광물질( chemiluminescent) 및 FRET(fluorescence resonance energy transfer)을 포함하나, 이에 한정되는 것은 아니다. 다양한 레이블 및 레이블링 방법은 Ed Harlow and David Lane, Using Antibodies:A Laboratory Manual, Cold Spring Harbor Laboratory Press, 1999에 기재되어 있다.

상기 ELISA 방법 및 캡처-ELISA 방법에서 최종적인 효소의 활성 측정 또는 시그널의 측정은 당업계에 공지된 다양한 방법에 따라 실시될 수 있다. 이러한 시그널이 검출은 본 발명의 마커의 정성적 또는 정량적 분석을 가능하게 한다. 만일, 레이블로서 바이오틴이 이용된 경우에는 스트렙타비딘으로, 루시퍼라아제가 이용된 경우에는 루시페린으로 시그널을 용이하게 검출할 수 있다.

본 발명의 다른 구현 예에 따르면, 항체 대신에 본 발명의 마커에 특이적으로 결합하는 앱타머를 이용할 수 있다. 앱타머는 올리고핵산 또는 펩타이드 분자이며, 앱타머의 일반적인 내용은 Bock LC et al., Nature 355(6360):5646(1992); Hoppe-Seyler F, Butz K "Peptide aptamers: powerful new tools for molecular medicine". J Mol Med . 78(8):42630(2000); Cohen BA, Colas P, Brent R . "An artificial cell-cycle inhibitor isolated from a combinatorial library". Proc Natl Acad Sci USA. 95(24):142727(1998)에 상세하게 개시되어 있다.

상술한 면역분석 과정에 의한 최종적인 시그널의 세기를 분석함으로써, 근위축성측삭경화증을 진단할 수 있다.

본 발명의 특징 및 이점을 요약하면 다음과 같다:

(a) 본 발명은 근위축성측삭경화증에 대한 마커로서 RAPGEF2, IFT80, SSH2, XRCC3, SPAG17, PLEKHM2, CLEC4C, FRAS1, ADGRL3, PSEN1 돌연변이 유전자 및 상기 유전자에 의해 코딩되는 돌연변이 단백질과 이를 이용한 근위축성측삭경화증의 진단 방법을 제공한다.

(b) 본 발명의 근위축성측삭경화증 마커는 한국인 ALS 환자로부터 발견한 새로운 변이로서 종전에 보고된 데이터베이스에서 0.1 % 미만의 빈도로 나타난 매우 드문 변이이거나 보고된 바 없는 변이이며, 정상 대조군에서는 발견되지 않는 변이이다.

(c) 본 발명에서 발견한 돌연변이 유전자 및/또는 이로부터 코딩되는 돌연변이 단백질은 ALS의 유전학적 원인을 밝히고 ALS를 진단하는데 매우 유용하게 사용될 수 있다.

(d) 본 발명에서 발견한 돌연변이 유전자 및/또는 이로부터 코딩되는 돌연변이 단백질에 대하여 유전자 또는 단백질 검사를 실시함으로써 근위축성측삭경화증을 조기 진단할 수 있으며, 그에 따라 최근 개발되고 있는 치료방법을 조기에 적용하여 치료효과를 극대화할 수 있고, 나아가 정확한 병인에 따른 맞춤치료를 가능하게 할 수 있다.

도 1은 sALS 트리오-7에서 PSEN1 유전자의 신규 변이(de novo variant)(c.497T>C; p.Leu166Pro)를 분석한 결과이다.
a. c.497T>C (p.Leu166Pro)를 나타내는 발단자(proband) 및 부모의 엑솜 시퀀싱 결과. PSEN1 c.497T>C 변이는 발단자의 전체 판독 결과 중 46%(37/81)였으며, 이는 대립형질의 이형접합을 의미함. b. 발단자에서 PSEN1 유전자 시퀀싱 결과, 뉴클레오타이드 위치 497에서 T-에서-C로 이형접합 치환이 나타남.
도 2는 sALS 트리오-2에서 FRAS1 유전자의 신규 변이(c.8393C>T; p.Ala2798Val)를 분석한 결과이다.
a. c.8393C<T (p.Ala2798Val)를 나타내는 발단자 및 부모의 엑솜 시퀀싱 결과. FRAS1 c.8393C>T 변이는 발단자의 전체 판독 결과 중 49%(26/53)였으며, 이는 대립형질의 이형접합을 의미함. b. 발단자에서 FRAS1 유전자 시퀀싱 결과, 뉴클레오타이드 위치 8393에서 C-에서-T로 이형접합 치환이 나타남.
도 3은 sALS 트리오-3에서 RAPGEF2 유전자의 신규 변이(c.4069G>A; p.Glu1357Lys)를 분석한 결과이다.
a. c.4069G>A (p.Glu1357Lys)를 나타내는 발단자 및 부모의 엑솜 시퀀싱 결과. RAPGEF2 c.4069G>A 변이는 발단자의 전체 판독 결과 중 52%(25/48)였으며, 이는 대립형질의 이형접합을 의미함. b. 발단자에서 RAPGEF2 유전자 시퀀싱 결과, 뉴클레오타이드 위치 4069에서 G-에서-A로 이형접합 치환이 나타남.
도 4는 sALS 트리오-4에서 CLEC4C 유전자의 신규 변이(c.629_631delAGA; p.Lys210del)를 분석한 결과이다.
a. c.629_631delAGA (p.Lys210del)를 나타내는 발단자 및 부모의 엑솜 시퀀싱 결과. CLEC4C c.629_631delAGA 변이는 발단자의 전체 판독 결과 중 53%(64/122)였으며, 이는 대립형질의 이형접합을 의미함. b. 발단자에서 CLEC4C 유전자 시퀀싱 결과, 뉴클레오타이드 위치 629-631에서 이형접합 AGA 결손이 나타남.
도 5는 sALS 트리오-8에서 PLEKHM2 유전자의 신규 변이(c.1921+6C>T)를 분석한 결과이다.
a. c.1921+6C>T를 나타내는 발단자 및 부모의 엑솜 시퀀싱 결과. PLEKHM2 c.1921+6C>T 변이는 발단자의 전체 판독 결과 중 54%(13/24)였으며, 이는 대립형질의 이형접합을 의미함. b. 발단자에서 PLEKHM2 유전자 시퀀싱 결과, 뉴클레오타이드 위치 1921+6에서 C-에서-T로 이형접합 치환이 나타남.
도 6은 sALS 트리오-11에서 SSH2 유전자의 신규 변이(c.1408G>T; p.Glu470*)를 분석한 결과이다.
a. c.1408G>T (p.Glu470*)를 나타내는 발단자 및 부모의 엑솜 시퀀싱 결과. SSH2 c.1408G>T 변이는 발단자의 전체 판독 결과 중 35%(42/120)였으며, 이는 대립형질의 이형접합을 의미함. b. 발단자에서 SSH2 유전자 시퀀싱 결과, 뉴클레오타이드 위치 1408에서 G-에서-T로 이형접합 치환이 나타남.
도 7은 sALS 트리오-12에서 SPAG17 유전자의 신규변이(c.2815G>T; p.Ala939Ser) 및 XRCC3 유전자의 신규변이(c.598G>A; p.Val200Ile)를 분석한 결과이다.
a. SPAG17 유전자에서 c.2815G>T (p.Ala939Ser)를 나타내는 발단자 및 부모의 엑솜 시퀀싱 결과. SPAG17 c.2815G>T 변이는 발단자의 전체 판독 결과 중 49%(60/122)였으며, 이는 대립형질의 이형접합을 의미함. b. 발단자에서 SPAG17 유전자 시퀀싱 결과, 뉴클레오타이드 위치 2815에서 G-에서-T로 이형접합 치환이 나타남. c. XRCC3 유전자에서 c.598G>A (p.Val200Ile)를 나타내는 발단자 및 부모의 엑솜 시퀀싱 결과. XRCC3 c.598G>A 변이는 발단자의 전체 판독 결과 중 50%(17/34)였으며, 이는 대립형질의 이형접합을 의미함. d. 발단자에서 XRCC3 유전자 시퀀싱 결과, 뉴클레오타이드 위치 598에서 G-에서-A로 이형접합 치환이 나타남.
도 8은 sALS 트리오-13에서 IFT80 유전자의 신규 변이(c.595G>A; p.Val199Ile)를 분석한 결과이다.
a. c.595G>A (p.Val199Ile)를 나타내는 발단자 및 부모의 엑솜 시퀀싱 결과. IFT80 c.595G>A 변이는 발단자의 전체 판독 결과 중 48%(62/130)였으며, 이는 대립형질의 이형접합을 의미함. b. 발단자에서 IFT80 유전자 시퀀싱 결과, 뉴클레오타이드 위치 595에서 G-에서-A로 이형접합 치환이 나타남.
도 9는 sALS 트리오-15에서 ADGRL3 유전자의 신규 변이(c.715A>G; p.Ser239Gly)를 분석한 결과이다.
a. c.715A>G (p.Ser239Gly)를 나타내는 발단자 및 부모의 엑솜 시퀀싱 결과. ADGRL3 c.715A>G 변이는 발단자의 전체 판독 결과 중 48%(69/145)였으며, 이는 대립형질의 이형접합을 의미함. b. 발단자에서 ADGRL3 유전자 시퀀싱 결과, 뉴클레오타이드 위치 715에서 A-에서-G로 이형접합 치환이 나타남.
도 10은 184명의 sALS 환자에서 RAPGEF2 유전자의 두 개 변이를 나타낸 결과이다.
a. 코돈 628(c.1883C>T, p.Thr628Ile)에서 C에서 T로의 치환을 나타내는 변이 부위에 대한 엑솜 시퀀싱 결과. 변이는 발단자 HS-374의 전체 판독 결과 중 49%(5919/12010)였으며, 이는 대립형질의 이형접합을 의미함. b. RAPGEF2 유전자에서 c.1883C>T의 시퀀싱 크로마토그램. c. 코돈 1098(c.3293G>A, p.Arg1098His)에서 G에서 A로의 치환을 나타내는 변이 부위에 대한 엑솜 시퀀싱 결과. 변이는 발단자 HS-477의 전체 판독 결과 중 48%(1379/2855)였으며, 이는 대립형질의 이형접합을 의미함. d. RAPGEF2 유전자에서 c.3293G>A의 시퀀싱 크로마토그램.
도 11은 RAPGEF2 유전자에서 분석된 변이에 대한 모식도이다.
CAP_ED, 전사인자 CAP 패밀리의 이펙터 도메인; REM, Ras 익스체인저 모티프; PDZ_시그널링, PDZ 도메인; RasGEF, Ras-유사 스몰 GTPase에 대한 구아닌 뉴클레오타이드 교환 인자.
도 12는 TiGER(Tissue-specific Gene Expression and Regulation, http://bioinfo.wilmer.jhu.edu/tiger/)로부터 채택된 RAPGEF2 유전자의 조직 발현 레벨을 측정한 결과이다.
도 13은 TiGER(Tissue-specific Gene Expression and Regulation, http://bioinfo.wilmer.jhu.edu/tiger/)로부터 채택된 IFT80 유전자의 조직 발현 레벨을 측정한 결과이다.
도 14는 TiGER(Tissue-specific Gene Expression and Regulation, http://bioinfo.wilmer.jhu.edu/tiger/)로부터 채택된 SSH2 유전자의 조직 발현 레벨을 측정한 결과이다.
도 15는 TiGER(Tissue-specific Gene Expression and Regulation, http://bioinfo.wilmer.jhu.edu/tiger/)로부터 채택된 SPAG17 유전자의 조직 발현 레벨을 측정한 결과이다.
도 16은 TiGER(Tissue-specific Gene Expression and Regulation, http://bioinfo.wilmer.jhu.edu/tiger/)로부터 채택된 XRCC3 유전자의 조직 발현 레벨을 측정한 결과이다.
도 17은 TiGER(Tissue-specific Gene Expression and Regulation, http://bioinfo.wilmer.jhu.edu/tiger/)로부터 채택된 PLEKHM2 유전자의 조직 발현 레벨을 측정한 결과이다.
도 18은 TiGER(Tissue-specific Gene Expression and Regulation, http://bioinfo.wilmer.jhu.edu/tiger/)로부터 채택된 FRAS1 유전자의 조직 발현 레벨을 측정한 결과이다.
도 19는 TiGER(Tissue-specific Gene Expression and Regulation, http://bioinfo.wilmer.jhu.edu/tiger/)로부터 채택된 ADGRL3 유전자의 조직 발현 레벨을 측정한 결과이다.

이하, 실시예를 통하여 본 발명을 더욱 상세히 설명하고자 한다. 이들 실시예는 오로지 본 발명을 보다 구체적으로 설명하기 위한 것으로, 본 발명의 요지에 따라 본 발명의 범위가 이들 실시예에 의해 제한되지 않는다는 것은 당업계에서 통상의 지식을 가진 자에 있어서 자명할 것이다.

실시예

재료 및 방법

1. 대상

1) sALS 트리오

한양대학교 신경과 ALS 클리닉을 방문한 15명의 ALS 환자 및 그들의 부모가 2013년 1월부터 ALS 트리오 연구에 포함되었다. 모든 환자는 한국 태생이었다. 임상 진단을 위해 각 환자에 대하여 근전도검사, 임상검사 및 적합한 이미징 방법을 포함하는 신경학적 평가를 실시하였다. 모든 ALS 환자는 신경근 질환을 전공한 신경과 전문의에 의해 진단되었으며, 개정된 El Escorial 진단기준에 부합하는 것을 확인하였다(32, 113). ALS 트리오 연구에는 ALS가 확실한 환자 5명, ALS 일 것으로 예측되는 환자 8명, PLS 플러스 1명 및 퓨어(pure) LMND(lower motor neuron disease) 1명이 포함되었다. ALS 스펙트럼으로 여겨지지 않는 척수성근위축(spinal muscular atrophy), 케네디 증후군(Kennedy syndrome), 일지성 근위축(monomelic atrophy), 히라야마 증후군(Hirayama syndrome) 및 다초점운동신경병증(multifocal motor neuropathy)과 같은 상태로 진단된 환자들은 본 연구에서 제외되었다. 후속조치(follow-up) 동안 치료 또는 질병 진행에 대한 반응을 객관적으로 평가하기 위해 ALSFRS-R을 이용하여 의사가 진단을 위한 기능손상 정도를 판단하였다. ALSFRS-R에는 언어능력, 타액분비, 삼킴, 필체, 음식 자르기 및 기구이용(위루형성술 시행 또는 미시행), 드레싱 및 위생, 침대에서 회전 및 이부자리 조정, 걷기, 계단 오르기, 호흡곤란, 좌위호흡(orthepnea) 및 호흡부전을 평가하는 12개 질문이 포함된다. 각 항목에 대한 점수는 0에서 48 사이의 점수를 내기 위해 총합을 구했다. 진행율은 ΔFS(진단시기에서의 48-ALSFRS-R/발병에서 진단까지의 시간)으로 계산하였으며, 환자를 세 그룹[느림(컷-오프 값 < 0.66), 중간(0.66-1.00), 및 빠름(>1.00)]으로 나누는데 사용하였다. 임상 보고서에는 척추 및 연수 수준에서 상위 및 하위운동뉴런 손상에 대한 징후가 포함되었다. 산발성 ALS는 발단자가 진행형 상위 또는 하위운동뉴런 손상과 같은 징후를 나타내는 경우 및 같은 혈통에서 임상적으로 영향을 받는 가족력을 갖지 않는 경우로 정의되었다. 본 연구는 한양대학교 병원(#HYI-10-01-3) 및 삼성서울병원(#2013-04-131-002)의 기관윤리심의위원회로부터 승인을 받아 진행하였으며, 참가자들은 승인된 연구 프로토콜에 대하여 동의서를 작성하였다. 본 발명자들은 SOD1 유전자에 대하여 사전 스크리닝을 실시하였으며, 모든 발단자에게서 병리학적 변이가 발견되지 않았다.

2) 유효성 확인 세트(validation set)

서울 한양대학교 병원의 신경과 ALS 클리닉을 방문한 184명의 ALS 환자는 유효성 확인 세트로 ALS 트리오 연구에 포함되었다. 모든 ALS 환자는 가능성 또는 명확한 ALS 기준을 충족하는 개정된 El Escorial 진단기준에 따라 신경근 질환을 전공한 신경과 전문의에 의해 진단되었다. 환자들에 대하여 SOD1 유전자에 대한 사전 스크리닝을 실시하였으며, 병리학적 변이는 발견되지 않았다. 부모에 대한 정보는 본 연구의 시작 전에 입수하였다.

2. 분자유전학 테스트

1) 전체 엑솜 시퀀싱

지노믹 DNA(gDNA)는 Wizard 지노믹 DNA 정제 키트(Promega, Madison, WI)를 이용하여 제조사의 지시에 따라 말초 혈액 백혈구로부터 분리하였다. 1% 아가로오스 젤 전기영동 및 PicoGreen®dsDNA Assay(Invitrogen, Life Technologies, Waltham, MA)를 통해 DNA를 확인하였다. 가능한 한 DNA는 OD 260/280 비율이 1.8-2.0으로 온전한 상태여야 한다. SureSelect 시퀀싱 라이브러리는 The Bravo automated liquid handler를 포함하는 Agilent SureSelect all Exon kit 50Mb (Agilent, Santa Clara, CA)를 이용하여 제조사 지시에 따라 준비하였다. 사용률 10%, 강도 5, 버스트 200 당 사이클, 및 4℃에서 360초 동안 모드 주파수 회전(mode frequency sweeping)으로 세팅된 Covaris-S2 instrument (Covaris, Woburn, MA)를 이용하여 120 ㎕ EB 버퍼에 녹인 3 ㎍의 지노믹 DNA를 150 bp의 사이즈로 절단하였다. 절단 효율은 DNA1000 칩(Bioanalyzer, Agilent)의 모세관 전기영동을 통해 평가하였다. 제조사의 프로토콜(Agilent)에 따라 시퀀싱 어댑터를 DNA 단편에 결합시켰다. DNA에 결합시킨 어댑터는 PCR을 이용하여 증폭하였다. PCR 산물의 질(quality)은 모세관 전기영동(Bioanalyzer, Agilent)을 통해 평가하였다. 혼성화 버퍼를 만들기 위해 SureSelect hyb #1, #2, #3, 및 #4 시약(Agilent)을 혼합하였다. 증폭된 DNA 단편은 3.4 ㎕에 750 ng가 되도록 농축하였다. SureSelect block #1, #2, 및 #3 시약(Agilent)을 750 ng의 DNA에 첨가하였다. 혼성화 버퍼 및 DNA 블로커 믹스는 유전자 증폭기를 이용하여 95℃에서 5분, 그 다음 65℃에서 10분간 배양하였다. RNase 블록(Agilent)을 SureSelect 올리고 캡처 라이브러리(Agilent)에 첨가하였다. 캡처 라이브러리는 65℃에서 2분간 배양하였다. 먼저 혼성화 버퍼, 그 다음 DNA 블로커 믹스를 캡처 라이브러리에 첨가하고, 유전자 증폭기를 이용하여 혼합물을 65℃에서 24시간 배양하였다. 50 ㎖ 스트렙타비딘이 코팅된 Dynal MyOne Streptavidin T1 (Invitrogen)을 200 ㎖ SureSelect 바인딩 버퍼(Agilent)로 3회 세척한 다음, 200 ㎕ 바인딩 버퍼에 재부유시켰다. 혼성화 혼합물을 비드 부유물에 첨가하고 상온에서 믹싱하면서 30분간 배양하였다. 상온에서 15분간 500 ㎕ SureSelect 세척 버퍼 #1 (Agilent)로 비드를 세척한 다음, 65℃에서 10분간 500 ㎕ SureSelect 세척 버퍼 #2 (Agilent)로 3회 세척하였다. 30 ㎕ 물로 상온에서 5분간 DNA를 용출하였다. 반응물은 AMPure XP 비드(Beckman Coulter, Brea, CA)로 정제하였다. Herculase II Fusion DNA Polymerase(Finnzymes, Life Technologies)를 이용하여 인덱스 태그를 첨가하기 위해 캡처한 라이브러리를 증폭하였다. 증폭한 라이브러리의 질(quality)는 모세관 전기영동(Bioanalyzer, Agilent)을 통해 평가하였다. SYBR Green PCR 마스터 믹스(Applied Biosystems, Life Technologies)를 이용하여 QPCR를 실시한 다음, 풀(pool)에서 등몰 농도(equimolar amounts)로 태깅된 6 라이브러리들을 결합하였다. 클러스터 형성은 cBot automated cluster generation system (illumine, San Diego, CA)을 이용하였으며 HiSeq 2500 시퀀싱 시스템(illumina)을 이용하여 단위 길이 2x100 bp로 시퀀싱을 실시하였다.

2) 생물정보학 분석

판독 결과는 Burrows-Wheeler Aligner(BWA) 0.7.10을 이용하여 GRCh37/hg19 빌드에 맵핑하였다(114). Picard-tools 1.114는 중복 판독(duplicate reads)을 표시하기 위해 사용하였다(http://picard.sourceforge.net/). GATK(v3.2-2) IndelRealigner는 삽입/결실(indel) 위치 주변의 판독 결과를 조정하기 위해 사용하였다. 판독 결과의 질은 GATK BaseRecalibrator를 이용하여 측정하였다. 유전자형은 GATK HaplotypeCaller에 의해 모든 샘플에 대하여 동시에 생성되었다. 변이 퀄리티 스코어 조정은 GATK VariantRecalibrator를 이용하여 실시하였으며, 99.7 truth sensitivity level로 필터링하였다. 희귀 변이를 확인하기 위해 dbSNP141트, NHLBI 엑솜 시퀀싱 프로젝트(http://evs.gs.washington.edu/EVS/) 및 1000 지놈 프로젝트(http://www.1000genomes.org/)를 확인하였다. 변이의 명명(annotation)은 인-하우스 커스텀-메이드 스크립트를 이용하여 실시하였다(표 1).

전체 엑솜 시퀀싱에 대한 생물정보학 분석 파이프라인

분석	툴
Fastq quality control	NGSQCToolkit_v2.3.3
Alignment	BWA-0.7.10 mem, Picard-tools-1.114/AddOrReplaceReadGroups.jar
Remove duplicate	Picard-tools-1.114/MarkDuplicates.jar Picard-tools-1.114/FixMateInformation.jar
Realignment	GenomeAnalysisTK-3.2-2/GenomeAnalysisTK.jar -T RealignerTargetCreator GenomeAnalysisTK-3.2-2/GenomeAnalysisTK.jar -T IndelRealigner
Recalibration	GenomeAnalysisTK-3.2-2/GenomeAnalysisTK.jar -T BaseRecalibrator GenomeAnalysisTK-3.2-2/GenomeAnalysisTK.jar -T PrintReads
Variant/Genotype calling (gVCF method)	GenomeAnalysisTK-3.2-2/GenomeAnalysisTK.jar -T HaplotypeCaller
Filtering	GenomeAnalysisTK-3.2-2/GenomeAnalysisTK.jar -T VariantRecalibrator GenomeAnalysisTK-3.2-2/GenomeAnalysisTK.jar -T ApplyRecalibration sensitivity 99.7 cutoff
Annotation	In-house perl script annotation

3) 필터링 기준

모든 발단자에 대하여 ALS 감별진단을 위해 기존에 알려진 ALS 및 FTD 원인 유전자 또는 관련 유전자, HSP 및 감별을 요하는 다른 질병 유전자의 돌연변이를 먼저 스크리닝하였다(표 2-5). 기존에 알려진 병원성 변이를 확인하기 위해 인간 유전자 돌연변이 데이터베이스(HGMD^®2014.1Proversion)에 대한 변이 리스트를 비교하였다.

신규 변이는 부모가 참조서열(reference sequence)에 대하여 동형접합(homozygous)이고, 발단자는 이형접합(heterozygous)인 것으로 확인하였다. 본 발명자들은 dbSNP141 데이터베이스, 1000 지놈 프로젝트 및 엑솜 변이 서버에서 확인된 0.01 미만의 대립 유전자 빈도를 갖는 변이들을 희귀 변이로 선택하였다.

또한, 본 연구에서 발견된 변이들을 인종이 일치하는 100명의 정상 대조군과 비교하였다. 정상 대조군 데이터는 한국 질병관리본부로부터 지원받은 한국인 지놈 분석 프로젝트(4845-301), 한국인 지놈 및 역학 연구(4851-302) 및 한국인 바이오뱅크 프로젝트(4851-307, KBP-2014-031)에서 제공받았다. 이에 더해 본 연구에서 발견된 변이를 자체 질병 대조군인 75명의 ALS가 아닌 환자의 엑솜 데이터와 비교하였다.

ALS 및 FTD 원인 유전자

표현형	유전자	RefSeq	유전자 설명	염색체 위치	유전형식
ALS	SPG11	NM_025137.3	Spastic paraplegia 11	15q14	AR
ALS	VAPB	NM_004738.4	VAMP (vesicle-associated membrane protein)-associated protein B and C	20q13.3	AD
ALS	ALS2	NM_020919.3	Amyotrophic lateral sclerosis 2	2q33.1	AD
ALS	ANG	NM_001145.4	Angiogenin, ribonuclease, RNase A family, 5	14q11.1	AD
ALS	DAO	NM_001917.4	D-amino-acid oxidase	12q24	AD
ALS	FIG4	NM_014845.5	FIG4 phosphoinositide 5-phosphatase	6q21	AD
ALS	OPTN	NM_021980.4	Optineurin	10p13	AD
ALS	SETX	NM_015046.5	Senataxin	9q34.13	AD
FTD	MAPT	NM_005910.5	Microtubule-associated protein tau	17q21.1	AD
FTD	PSEN1	NM_000021.3	Presenilin-1	14q24.3	AD
FTD	PSEN2	NM_000447.2	Presenilin-2	1q42.13	AD
FTD	TARDBP	NM_007375.3	TAR DNA binding protein	1p36.22	AD
FTD	TREM2	NM_018965.2	Triggering receptor expressed on myeloid cells 2	6p21.1	AR
ALS/FTD	FUS	NM_004960.3	FUS RNA binding protein	16p11.2	AD
ALS/FTD	GRN	NM_002087.2	Granulin	17q21.32	AD
ALS/FTD	SIGMAR1	NM_005866.2	Sigma non-opioid intracellular receptor 1	9p13.3	AD/AR
ALS/FTD	SOD1	NM_000454.4	Superoxide dismutase 1	21q22.11	AD
ALS/FTD	SQSTM1	NM_003900.4	Sequestosome 1	5q35	AD
ALS/FTD	TAF15	NM_139215.2	TAF15 RNA polymerase II, TATA box binding protein (TBP)-associated factor	17q11.1-q11.2	AD
ALS/FTD	TARDBP	NM_007375.3	TAR DNA binding protein	1p36.22	AD
ALS/FTD	UBQLN2	NM_013444.3	Ubiquilin 2	Xp11.21	X-linked
ALS/FTD	VCP	NM_007126.3	Valosin-containing protein	9p13.3	AD

ALS 및 FTD 관련 유전자

표현형	유전자	RefSeq	유전자 설명	염색체 위치	참고문헌
ALS	APEX1	NM_001641.3	APEX nuclease (multifunctional DNA repair enzyme) 1	14q11.2-q12	(115)
ALS	ARHGEF28	NM_001080479.2	Rho guanine nucleotide exchange factor (GEF) 28	5q13.2	(116)
ALS	ERBB4	NM_005235.2	Erb-b2 receptor tyrosine kinase 4	2q33.3-q34	(117)
ALS	EWSR1	NM_001163285.1	Ewing sarcoma breakpoint region 1	22q12.2	(118)
ALS	NEFH	NM_021076.3	Neurofilament, heavy polypeptide (200 kDa)	22q12.2	(119)
ALS	PFN1	NM_005022.3	Profilin 1	17p13.3	(69)
ALS	PON1	NM_000446.5	Paraoxonase 1	7q21.3	(120)
ALS	PON2	NM_000305.2	Paraoxonase 2	7q21.3	(120)
ALS	PON3	NM_000940.2	Paraoxonase 3	7q21.3	(120)
ALS	PRPH	NM_006262.3	Peripherin	12q12-q13	(121)
ALS	SRCAP	NM_006662.2	Snf2-related CREBBP activator protein	16p11.2	(110)
ALS	SS18L1	NM_198935.1	Synovial sarcoma translocation gene on chromosome 18-like 1	20q13.3	(122)
ALS	CHRNA4	NM_000744.6	Acetylcholine receptor, neuronal nicotinic, alpha-4 subunit	20q13.2-q13.3	(123)
ALS/FTD	CHMP2B	NM_014043.3	Chromatin modifying protein 2B	3p11.2	(124)
ALS/FTD	DCTN1	NM_004082.4	Dynactin 1	2p13	(125)
ALS/FTD	HNRNPA1	NM_031157.2	Heterogeneous nuclear ribonucleoprotein A1	12q13.1	(72)
ALS/FTD	HNRNPA2B1	NM_031243.2	Heterogeneous nuclear ribonucleoprotein A2/B1	7p15	(72)

ALS의 감별진단을 위한 HSP 원인 유전자

표현형	유전자	Locus name	유전자 설명	염색체 위치	유전형식
Uncomplicated HSP	ATL1	SPG3A	Atlastin GTPase 1	14q22.1	AD
Uncomplicated HSP	SPAST	SPG4	Spastin	2p24-p21	AD
Uncomplicated HSP	NIPA1	SPG6	Non-imprinted in Prader-Willi / Angelman syndrome 1	15q11.2	AD
Uncomplicated HSP	KIAA0196	SPG8	KIAA0196	8q24.13	AD
Uncomplicated HSP	KIF5A	SPG10	Kinesin family member 5A	12q13.13	AD
Uncomplicated HSP	RTN2	SPG12	Reticulon 2	19q13.32	AD
Uncomplicated HSP	HSPD1	SPG13	Heat shock protein 60kDa protein1 (chaperonin)	2q33.1	AD
Complicated HSP	BSCL2	SPG17	Berardinelli-Seip congenital lipodystrophy 2 (seipin)	11q13	AD
Uncomplicated HSP	REEP1	SPG31	Receptor accessory protein 1	2p11.2	AD
Uncomplicated HSP	ZFYVE27	SPG33	Zinc finger, FYVE domain containing 27	10q24.2	AD
Uncomplicated HSP	SLC33A1	SPG42	Solute carrier family 33 (acetyl-CoA transporter), member 1	3q25.31	AD
Uncomplicated HSP	CYP7B1	SPG5A	Cytochrome P450, family 7, subfamily B, polypeptide 1	8q21.3	AR
Uncomplicated HSP	SPG7	SPG7	Spastic paraplegia 7	16q24.3	AR
Uncomplicated HSP	SPG11	SPG11	Spastic paraplegia 11	15q14	AR
Complicated HSP	ZFYVE26	SPG15	Zinc finger, FYVE domain containing 26	14q24.1	AR
Complicated HSP	ERLIN2	SPG18	ER lipid raft associated 2	8p11.2	AR
Complicated HSP	SPG20	SPG20	Spastic paraplegia 20	13q13.3	AR
Complicated HSP	SPG21	SPG21	Spastic paraplegia 21	15q22.31	AR
Complicated or uncomplicated HSP	DDHD1	SPG28	DDHD domain containing 1	14q21	AR
Complicated HSP	KIF1A	SPG30	Kinesin family member 1A	2q37.3	AR
Complicated HSP	FA2H	SPG35	Fatty acid 2-hydroxylase	16q23	AR
Complicated HSP	PNPLA6	SPG39	Patatin-like phospholipase domain containing 6	19p13.2	AR
Complicated HSP	GJC2	SPG44	Gap junction protein, gamma 2	1q42.13	AR
Complicated HSP	GBA2	SPG46	Glucosidase, beta (bile acid) 2	9p13.3	AR
Complicated HSP	AP4B1	SPG47	Adaptor-related protein complex 4, beta 1 subunit	1p13.2	AR
Uncomplicated HSP	AP5Z1	SPG48	Adaptor-related protein complex 5, zeta 1 subunit	7p22.2	AR
Complicated HSP	TECPR2	SPG49	Tectonin beta-propeller repeat-containing 2	14q32.31	AR
Complicated HSP	AP4M1	SPG50	Adaptor-related protein complex 4, mu 1 subunit	7q22.1	AR
Complicated HSP	AP4E1	SPG51	Adaptor-related protein complex 4, epsilon 1 subunit	15q21.2	AR
Complicated HSP	AP4S1	SPG52	Adaptor-related protein complex 4, sigma 1 subunit	14q12	AR
Complicated HSP	VPS37A	SPG53	Vacuolar protein sorting 37 homolog A	8p22	AR
Complicated HSP	DDHD2	SPG54	DDHD domain containing 2	8p11.23	AR
Complicated HSP	CYP2U1	SPG56	Cytochrome P450, family 2, subfamily U, polypeptide 1	4q25	AR
Complicated HSP	GAD1	N/A	Glutamate decarboxylase 1	2q31	AR
Complicated HSP	L1CAM	SPG1	L1 cell adhesion molecule	Xq28	X-linked
Complicated HSP	PLP1	SPG2	Proteolipid protein 1	Xq22	X-linked
Complicated HSP	SLC16A2	SPG22	Solute carrier family 16, member 2	Xq13.2	X-linked

* 약자: AD, 상염색체 우성(autosomal dominant); AR, 상염색체 열성(autosomal recessive); N/A, 해당없음.

ALS의 감별진단을 위한 다른 질병 관련 유전자

표현형	유전자	유전자 설명	염색체 위치	유전 형식
Hexosaminadase A deficiency	HEXA	Hexosaminidase A	15q24.1	AR
Adult polyglucosan body disease	GBE1	Glucan (1,4-alpha-), branching enzyme 1	3p12.3	AR

4) 변이 유효성 평가를 위한 생어(Sanger) 시퀀싱

필터링 기준을 따른 모든 아미노산의 치환을 유발하는 신규 변이는 아버지, 어머니 및 발단자 DNA 샘플에 대한 생어 시퀀싱을 통해 평가하였다. 타겟 유전자의 모든 엑손 및 엑손-인트론 경계는 프라이머를 이용하여 PCR을 통해 증폭하였다(표 6). PCR은 유전자 증폭기 모델 GeneAmp PCR system 9700 (Applied Biosytems, Foster City, CA)을 이용하여 다음의 조건으로 실시하였다: 32사이클로 94℃에서 30초간 변성, 60℃에서 30초간 어닐링 및 72℃에서 30초간 연장. 앰플리콘(5 ㎕)에 2U 쉬림프 알칼라인 포스파타아제 및 10U 엑소누클레아제 I(USB Corp., Cleveland, OH)을 37℃에서 15분간 처리한 다음, 80℃에서 15분간 배양하여 효소를 불활성화시켰다. 사이클 시퀀싱은 ABI 3130xl Genetic Analyzer(Applied Biosystems, Foster City, CA, USA)에서 Big Dye Terminator Cycle Sequencing Ready Reaction kit(Applied Biosystems, Foster City, CA, USA)를 이용하여 실시하였다. 변이의 명명은 GenBank의 참조서열에 따라 명기하였다. 본 발명에서 돌연변이에 대한 표기법은 ATG 개시 코돈의 A에 대응하는 뉴클레오타이드를 +1로 표기하는 인간 게놈 변이 협회(http://www.hgvs.org/mutnomen/)의 권고를 따랐다.

전체 엑솜 시퀀싱에 의해 검출된 변이에 대한 생어 시퀀싱 검증용 프라이머 쌍

유전자	뉴클레오타이드 변이	RefSeq	정방향	역방향
FRAS1	c.8393C>T	NM_025074.6	TCCCTAAGTCAGCTATGGGAAG	AATTCCATGCTTGGTCTTGG
RAPGEF2	c.4069G>A	NM_014247.2	CACCAGAGAAGCTGGGAGAC	GCAATGGAGAAAATGAGGAAA
CLEC4C	c.629_631delAGA	NM_130441.2	TGACCTTGACTTTCGCACTG	CCAGCAGTCTCTGGCACATA
PSEN1	c.497T>C	NM_000021.3	GGCTTAAGCACGAGAATTGC	GCAAGGAGCAACAGAAGAATG
PLEKHM2	c.1921+6C>T	NM_015164.2	CTGCTCATGATCCACGTGTT	CTTCCTTGGGGTGCCTTT
SSH2	c.1408G>T	NM_033389.3	CCATCATCAACACTGGCTGT	CACAGGCCTTTCTGATTTGC
SPAG17	c.2815G>T	NM_206996.2	AAGGATGACGTCAAGGCTTC	GGGGACTCTTCTGTTACTTCTTGG
XRCC3	c.598G>A	NM_001100119.1	CAAGGGAACCAGTTGTGTGA	TGGTGCTCACCTGGTTGAT
IFT80	c.595G>A	NM_020800.2	TGGATGTCTTAGGTGCTAGGTG	CTCACTGTGTTGTCCAGGCTAA
ADGRL3	c.715A>G	NM_015236.4	TATGCCCTGGACTCCCTACA	ATCCCATGTTCCTTCGATCC

5) 인-실리코 분석 및 유전자 우선순위 결정(prioritization)

SIFT(Sorting Intolerant From Tolerant)(126) 및 Polymorphism Phenotyping 2 (PolyPhen-2 v2.2.2)(127, 128) 서버는 단백질 구조, 기능 및 표현형과 서열 보존에 대한 비동일 단일염기 다형성(non-synonymous single nucleotide polymorphism) 치환의 효과를 예측하는데 사용되었다. PolyPhen-2에서 확률적 스코어가 0.85 이상인 경우, 돌연변이는 “손상 예상(probably damaging)”, 0.15 이상인 경우 “손상 가능(possibly damaging)”으로 구분되었다. 남은 돌연변이는 양성(benign)으로 분류하였다. SIFT에서는 특정 아미노산 치환이 미치는 영향을 정규화 확률로 나타내며 스코어가 0.05 이하인 경우 해당 아미노산의 치환이 단백질의 구조에 영향을 미칠 것임을 뜻한다.

신규 변이를 갖는 특정 유전자에 대한 우선순위를 결정하기 위해 ToppGene Prioritization software(129)를 사용하였다. 유전자 리스트는 전사체(유전자 발현), 단백질체(단백질 도메인 및 상호작용), 조절체(regulome)(TFBS 및 miRNA), 온톨로지, 표현형, 및 비블리옴(bibliome)(PubMed literature co-citation)을 기반으로 ALS 기전과 관련하여 기존에 발표된 문헌들과 비교하였다. 결합된 유사지수(similarity scores) 및 p-값은 본 발명에서 후보 유전자들의 우선순위를 결정하는데 사용되었다.

6) RAPGEF2 유전자의 검증

타겟 차세대 시퀀싱(targeted next generation sequencing)을 이용하여 184명의 ALS 환자의 엑손 및 플랭킹 영역에 대한 RAPGEF2 유전자 분석을 실시하였다(표 7). 라이브러리는 illumina Miseq sequencing system (amplicon size 425bp, paired-ends, read length 250 bp, coverage > 5000x)에서 색인, 풀링 및 시퀀싱되었다. 판독 결과는 BWA 0.7.5를 이용하여 GR37/hg19 빌드에 맵핑하였다(114). Picard-tools 1.84는 중복 판독(duplicate reads)을 표시하기 위해 사용하였다(http://picard.sourceforge.net/). 재정렬(realignment) 및 재보정(recalibration)은 GATK RealignerTargetCreator, IndelRealigner, 및BaseRecalibrator을 이용하여 실시하였다. GATK UnifiedGenotyper를 이용하여 모든 샘플에 대한 유전자형을 분석하였다.

엑솜 캡처를 위한 RAPGEF2 유전자의 타겟 위치

염색체	시작 좌표	종료 좌표	길이(bp)	앰플리콘	커버리지
4	160188998	160189367	370	2	100
4	160225494	160225625	132	1	100
4	160235743	160235920	178	1	100
4	160243499	160243635	137	1	100
4	160244611	160244769	159	1	100
4	160250986	160251674	689	3	100
4	160252559	160253873	1315	5	100
4	160259463	160259620	158	1	100
4	160260266	160260506	241	1	100
4	160262716	160263099	384	2	100
4	160264107	160264580	474	2	100
4	160265188	160265211	24	1	100
4	160266258	160266481	224	1	100
4	160267941	160268150	210	1	100
4	160271289	160271441	153	1	100
4	160273837	160274062	226	1	100
4	160274639	160275198	560	3	100
4	160277005	160277310	306	1	100
4	160279266	160281301	2036	7	100

7) MALDI-TOF를 이용한 대조군 연구

나이 및 성별이 일치하는 364명의 건강한 한국인 대조군에 대하여 MALDI-TOF MS(matrix assisted laser desorption/ionization time-of-flight mass spectrometry) 및 본 발명에서 디자인한 프라이머를 이용하여 RAPGEF2 유전자에서 발견된 신규 변이 유무를 스크리닝하였다(표 8). 약 30분 내에 각 38-웰 칩에 처리된 샘플은 MassARRAY Analyzer Compact (Sequenom, San Diego, CA)를 이용하여 분석하였다. 데이터는 SpectroACQUIRE software (Sequenom)를 통해 자동으로 수집되었으며, MassARRAY Typer software의 TrafficLights module에 의해 검토되었다. 각 실험에서 피크 높이에 대한 상세한 정보 및 신호 대 잡음비(signal-to-noise)에 기초한 각 세포에 대한 확률치(probability value) 및 피크 확률 통계는 필요에 따라 각 샘플에 대하여 검토하였다. 이 시스템에서 확률은 자동으로 계산되었으며, 엄격 정도(stringency level)는 conservative, moderate 및 aggressive calls의 3가지 레벨로 분석되었다. Aggressive call은 높은 오차율(<1%)을 보이는 반면, conservative call은 uncalled 유전자형에서 가장 낮은 비율을 나타낸다. 저 확률 콜(calls)은 제외되었다. 필요 시 개별 샘플에 대하여 스펙트럼 데이터를 검토하였다. Cluster Plot software module은 이형(atypical) 이형접합체 및 동형접합체 상태를 가시화하는데 사용되었다.

MALDI-TOF를 이용한 RAPGEF2 변이의 대조군 연구에 사용되는 프라이머 쌍

유전자	뉴클레오타이드 변이	RefSeq	정방향	역방향
RAPGEF2	c.4069G>A	NM_014247.2	ACGTTGGATGGACACAGGCACAATAAAGCG	ACGTTGGATGAGTCACAGACGTTAGGCTAC

실험결과

1. 분자유전학 분석

1) Q.C 분석 및 엑솜 시퀀싱에 대한 기술통계

Agilent SureSelect all Exon kit 50 Mb(Agilent)를 이용하여 15명의 ALS 발단자 및 그들의 건강한 부모(n=45)에 대한 전체 엑솜 시퀀싱을 실시하였다. 각 개체당 최소 50,000,000 bp의 전체 판독 결과를 얻었다. 염기의 평균 92%가 Phred 스코어 30이상의 높은 품질을 나타냈다. 전체 판독 결과의 99.95%를 참조서열에 맵핑하였다. 15명의 발단자와 그들의 부모로부터 얻은 모든 샘플은 평균 74x 였다. 각 개인에 있어서 타겟 염기의 평균 99%는 적어도 하나의 독립적인 서열 판독에 의해 처리되었고, 91%는 적어도 10개의 독립적인 서열 판독에 처리되었으며, 82.4%는 적어도 20개의 독립적인 서열 판독에 의해 처리되었다(표 9).

기존에 보고된 ALS-FTD 원인 또는 관련 유전자, ALS의 감별진단을 위한 HSP 및 다른 질병 유전자에서 돌연변이는 발견되지 않았다(표 2-5).

엑솜 시퀀싱에 대한 통계 요약

Trio No.	Total reads	% more than Q30 bases	Mapped reads	% mapped reads	Non-duplicate reads	Mean coverage depth	% target at 1X	% target at 10X	% target at 20X
1-P	51,480,912	86.6	51,462,399	99.96	43,389,970	55.3	98.5	88.5	77.7
1-F	65,167,802	86.0	65,139,804	99.95	53,577,017	67.1	98.9	90.7	82.4
1-M	92,465,892	86.5	92,432,848	99.96	64,418,232	82.8	99.0	92.2	85.8
2-P	63,791,280	86.4	63,765,712	99.95	51,913,342	66.4	98.7	90.1	81.6
2-F	53,939,296	89.0	53,917,610	99.95	46,457,814	57.7	98.8	89.6	79.6
2-M	50,089,792	88.6	50,068,431	99.95	44,276,977	56.8	98.6	88.8	78.4
3-P	60,588,212	88.2	60,563,239	99.95	50,151,748	64.1	98.7	90.1	81.3
3-F	53,293,388	88.1	53,270,250	99.95	44,153,932	55.3	98.7	89.2	78.7
3-M	47,072,096	87.9	47,050,572	99.95	41,578,973	52.0	98.7	88.9	77.5
4-P	131,434,474	93.3	131,374,780	99.95	99,643,297	126.4	99.7	95.6	91.5
4-F	94,184,158	93.2	94,147,248	99.96	69,072,547	87.9	99.4	93.6	87.5
4-M	127,543,470	93.4	127,488,235	99.95	97,221,570	122.1	99.7	95.6	91.4
5-P	57,160,108	94.5	57,138,906	99.96	55,255,727	73.0	99.0	91.2	83.3
5-F	80,431,798	94.6	80,401,581	99.96	76,811,873	101.5	99.4	93.5	87.9
5-M	60,087,382	94.2	60,061,780	99.95	57,809,232	73.8	98.8	90	81.8
6-P	49,678,674	93.7	49,659,982	99.96	43,296,585	55.3	98.7	88.6	77.1
6-F	56,020,666	93.7	56,000,999	99.96	51,481,301	66.4	99.0	90.5	81.4
6-M	47,568,954	93.7	47,549,366	99.95	42,956,118	54.6	98.8	89.0	77.5
7-P	50,459,952	93.4	50,436,949	99.95	45,070,379	57.2	98.9	89.5	78.6
7-F	58,692,976	93.4	58,666,334	99.95	54,227,119	69.2	99.2	91.4	83.0
7-M	92,118,690	93.6	92,084,906	99.96	72,622,171	94.9	99.2	92.9	86.6
8-P	53,590,510	92.4	53,571,980	99.96	47,992,562	62.1	98.7	89.2	79.1
8-F	56,093,884	92.5	56,073,138	99.96	50,218,779	65.6	98.8	90.0	80.6
8-M	58,010,996	92.6	57,990,089	99.96	51,785,665	67.1	98.9	90.6	81.7
9-P	50,157,706	89.9	50,107,633	99.90	48,327,117	62.3	98.6	88.9	78.8
9-F	64,748,536	92.5	64,725,656	99.96	57,619,562	73.5	99.0	91.0	82.6
9-M	68,247,826	92.4	68,220,992	99.96	61,297,253	79.5	99.1	91.7	84.3
10-P	66,576,932	93.6	66,544,375	99.95	65,055,775	81.2	99.2	92.2	85.3
10-F	57,288,346	93.5	57,265,630	99.96	55,776,398	70.4	99.0	90.7	82.3
10-M	63,224,312	93.3	63,187,574	99.94	62,259,646	73.6	99.3	91.8	84.3
11-P	54,139,302	90.1	54,086,046	99.90	52,123,490	67.9	98.6	89.5	80.4
11-F	55,080,696	89.9	55,018,427	99.89	52,618,323	67.7	98.7	89.8	80.8
11-M	58,156,702	89.8	58,094,439	99.88	55,931,004	72.3	98.7	90.1	81.7
12-P	70,645,628	91.9	70,619,926	99.96	64,640,898	84.1	99.3	92.0	84.7
12-F	80,572,600	91.1	80,542,081	99.96	69,890,686	90.4	99.4	92.6	85.7
12-M	67,083,856	91.4	67,057,069	99.96	60,763,860	79.6	99.2	91.7	83.9
13-P	59,815,598	93.6	59,792,743	99.96	55,052,338	73.6	98.9	90.2	81.4
13-F	65,585,926	93.0	65,553,902	99.95	60,095,261	75.4	99.2	91.4	83.2
13-M	79,320,916	92.9	79,280,711	99.94	72,390,269	91.7	99.4	92.8	86.2
14-P	60,891,562	93.3	60,863,344	99.95	57,820,449	72.9	99.2	91.2	82.8
14-F	61,485,616	92.9	61,463,752	99.96	55,608,163	73.5	99.0	90.5	81.8
14-M	57,261,444	93.8	57,243,205	99.96	53,229,496	71.0	98.8	89.9	80.8
15-P	66,782,838	92.9	66,761,203	99.96	60,425,805	80.4	99.0	91.1	83.1
15-F	56,780,312	93.2	56,761,259	99.96	52,059,338	70.1	98.9	90.0	80.9
15-M	64,590,202	93.5	64,571,321	99.97	58,806,125	78.9	99.0	91.0	83.0

2) 신규 변이 발생을 포함하는 공지된 병리학적 변이의 발견

본 발명자들은 PSEN1 유전자에서 sALS 트리오-7로부터 기존에 보고된 바 있는 돌연변이 하나를 발견하였다. 이것은 497번째 뉴클레오타이드 위치에서 티민이 시토신으로 치환된 것으로 코돈 166번 위치에서 류신을 아르기닌으로 치환된다; c.497T>C (p.Leu166Pro)(도 1). 발단자에서 PSEN1 c.497T>C의 변이 판독은 전체 판독 결과의 46%(37/81)이며, 이는 대립유전자의 이형접합성을 의미한다. 돌연변이는 생어 시퀀싱을 통한 신규 변이 발생으로 확인되었으며, 발단자에서는 이형접합체가 발견되었고 부모에서는 발견되지 않았다. PSEN1 c.497T>C는 가족성 EOAD(early-onset Alzheimer’s dementia)에서 종전에 보고된 바 있다(130).

3) 신규로 발생한 VUS(variants of unknown significance)의 발견

생어 시퀀싱을 이용하여 변이를 확인 후, 본 발명자들은 8명의 sALS 트리오로부터 9개의 신규 VUS(variants of unknown significance)를 발견하였다(도 2-9). 9개의 신규 VUS 가운데 8개 변이는 엑손 영역에 위치하며 아미노산 서열에 영향을 주는 변이였다. 5명 sALS 트리오로부터 6개의 미스센스 VUS가 발견되었다; FRAS1 c.8393C>T (p.Ala2798Val), RAPGEF2 c.4069G>A (p.Glu1357Lys), SPAG17 c.2815G>T (p.Ala939Ser), XRCC3 c.598G>A (p.Val200Ile), IFT80 c.595G>A (p.Val199Ile), 및 ADGRL3 c.715A>G (p.Ser239Gly). sALS 트리오-12의 발단자는 PAG17 c.2815G>T (p.Ala939Ser) 및 XRCC3 c.598G>A (p.Val200Ile) 두 개의 신규 VUS를 갖는 것으로 나타났다. Inframe deletion인 CLEC4C c.629_631delAGA (p.Lys210del)가 sALS 트리오-4에서 확인되었으며, 넌센스 변이인 SSH2 c.1408G>T (p.Glu470*)가 sALS 트리오-11에서 확인되었다. 넌센스 변이는 mRNA 레벨에서 조기 종결코돈(premature stop codon)을 만들 것으로 예측된다. 나머지는 엑손 경계 근처의 플랭킹 영역에 위치하는 인트론 변이였다(PLEKHM2 c.1921+6C>T).

SIFT 및 PolyPhen-2를 이용한 인-실리코 분석 결과, 4개의 신규 변이는 2개의 테스트 중 적어도 하나에서 유해한 것으로 나타났고, 3개 미스센스 변이는 SIFT 및 PolyPhen-2 모두에서 양성(benign)인 것으로 예측되었다(표 10). 모든 변이의 GEFR++ 스코어는 XRCC3 유전자의 c.598G>A를 제외하고 4 이상이었으며, 이는 해당 변이의 위치가 진화적으로 보존되어 온 것임을 의미한다. 6개 신규 VUS는 dbSNP141, 1000 지놈 프로젝트(전체 및 동아시아인 대립유전자 빈도) 및 ExAC(Exome Aggregation Consortium)에서 발견되지 않았다. 또한, 3개의 신규 VUS인 RAPGEF2 c.4069G>A (p.Glu1357Lys), CLEC4C c.629_631delAGA (p.Lys210del) 및 XRCC3 c.598G>A (p.Val200Ile)는 dbSNP141 데이터베이스에서 rs 번호가 있으면서, 기존의 인구집단을 대상으로 한 데이터베이스 중 하나 이상에서 0.1% 이하의 대립유전자 빈도를 나타내는 것으로 보고된 바 있다. 모든 변이는 인종이 일치하는 100명의 정상 대조군 개체의 외부 한국인 엑솜 데이터 및 자체 질병 대조군에서 발견되지 않았다(표 11).

신규 변이 발생률의 총 빈도는 기존에 보고된 돌연변이 및 VUS를 포함하여 0.6(9/15)이었다.

인-실리코 분석 및 보존성 스코어를 통해 15 sALS 트리오로부터 확인한 신규 변이의 리스트

Trio No.	Gene	Genomic coordinates (hg38)	RefSeq	Nucleotide change	Amino acid change	PolyPhen-2 (HumDiv, Probabilistic score)	SIFT (Tolerance index)	GERP++ score
2	FRAS1	Chr4:78,479,668	NM_025074.6	c.8393C>T	p.Ala2798Val	Benign (0.347)	Tolerated (0.23)	5.59
3	RAPGEF2	Chr4:159,353,947	NM_014247.2	c.4069G>A	p.Glu1357Lys	Benign (0.092)	Tolerated (0.07)	6.17
4	CLEC4C	Chr12:7,729,607	NM_130441.2	c.629_631delAGA	p.Lys210del	N/A	N/A	N/A
7	PSEN1 ^*	Chr14:73,186,869	NM_000021.3	c.497T>C	p.Leu166Pro	Possibly damaging (0.469)	Deleterious (0.01)	5.46
8	PLEKHM2	Chr1: 15,728,363	NM_015164.2	c.1921+6C>T	N/A	N/A	N/A	N/A
11	SSH2	Chr17:29,636,741	NM_033389.3	c.1408G>T	p.Glu470*	N/A	N/A	6.16
12	SPAG17	Chr1:118,042,042	NM_206996.2	c.2815G>T	p.Ala939Ser	Probably damaging (0.999)	Deleterious (0.01)	5.23
12	XRCC3	Chr14:103,699,540	NM_001100119.1	c.598G>A	p.Val200Ile	Benign (0.021)	Tolerated (0.66)	-7.12
13	IFT80	Chr3:160,357,533	NM_020800.2	c.595G>A	p.Val199Ile	Benign (0.016)	Deleterious (0.00)	5.37
15	ADGRL3	Chr4:61,733,074	NM_015236.4	c.715A>G	p.Ser239Gly	Probably dagaming (0.991)	Deleterious (0.00)	4.04

* 공지된 병리학적 변이

** 약자: N/A, 해당없음.

15 sALS 트리오에서 확인된 신규 변이의 인구집단 내 빈도

Trio No.	Gene	RefSeq	Nucleotide change	Amino acid change	rs number	Allele frequency				External Korean exome data
Trio No.	Gene	RefSeq	Nucleotide change	Amino acid change	rs number	dbSNP 141	1000 Genome	1000 Genome (EA)	ExAC	External Korean exome data
2	FRAS1	NM_025074.6	c.8393C>T	p.Ala2798Val	N/A	N/A	N/A	N/A	N/A	N/A
3	RAPGEF2	NM_014247.2	c.4069G>A	p.Glu1357Lys	rs200644232	0.0002	0.000	0.000	0.0001	N/A
4	CLEC4C	NM_130441.2	c.639_631delAGA	p.Lys210del	N/A	N/A	N/A	N/A	0.00002	N/A
7	PSEN1 ^*	NM_000021.3	c.497T>C	p.Leu166Pro	rs63750265	N/A	N/A	N/A	N/A	N/A
8	PLEKHM2	NM_015164.2	c.1921+6C>T	N/A	N/A	N/A	N/A	N/A	N/A	N/A
11	SSH2	NM_033389.3	c.1408G>T	p.Glu470*	N/A	N/A	N/A	N/A	N/A	N/A
12	SPAG17	NM_206996.2	c.2815G>T	p.Ala939Ser	N/A	N/A	N/A	N/A	N/A	N/A
12	XRCC3	NM_001100119.1	c.598G>A	p.Val200Ile	rs531332562	0.0004	N/A	N/A	0.00005	N/A
13	IFT80	NM_020800.2	c.595G>A	p.Val199Ile	N/A	N/A	N/A	N/A	N/A	N/A
15	ADGRL3	NM_015236.4	c.715A>G	p.Ser239Gly	N/A	N/A	N/A	N/A	N/A	N/A

* 기존에 보고된 돌연변이

** 약자: N/A, 해당없음. EA, 동아시아인; ExAC, Exome Aggregation Consortium.

3) 유전자 우선순위 결정

인간 유전자 주석 및 문헌과 마우스 표현형 데이터를 결합한 ToppGene 소프트웨어를 이용하여 후보 유전자를 평가하였다(129). 트레이닝 유전자 세트로서 표 2에 기재된 22개의 ALS-FTD 원인 유전자와 테스트 유전자 세트로서 신규 VUS가 발견된 9개 유전자를 이용하여 분석을 실시하였다. 분석 결과에 따르면, RAPGEF2 유전자는 p-값 0.05 이하로 기존에 알려진 ALS-FTD 유전자와 높은 관련성을 보였다. 특히, 기존에 알려진 ALS-FTD 유전자와 RAPGEF2 유전자는 생물학적 기전 및 발현 부위가 통계적으로 유의한 연관성을 보였다 (p-값은 모두 < 0.05)(표 12). 따라서, 본 발명자들은 RAPGEF2 유전자에 초점을 맞추기로 하였다.

ToppGene을 이용한 신규 변이의 우선순위(129)

순위	유전자	Molecular Function (p-value)	Biological Process (p-value)	Cellular Component (p-value)	Pathway (p-value)	Pubmed (p-value)	Gene Family (p-value)	Coexpre -ssion (p-value)	Disease (p-value)	Average Score	Overall (p-value)
1	RAPGEF2	0.017005	0.007194	0.011118	0.501635	0.139961	0.146501	0.007848	0.18705	0.304168	0.003722
2	IFT80	0.576194	0.142577	0.094833	0.23414	0.192283	0.499673	0.51537	0.00327	0.201703	0.076533
3	SSH2	0.104644	0.104644	0.18378	0.501635	0.132112	0.146501	0.51537	0.18705	0.167025	0.146642
4	XRCC3	0.576194	0.158273	0.140615	0.501635	0.06998	0.146501	0.51537	0.503597	0.160944	0.222278
5	SPAG17	0.576194	0.670373	0.080445	0.23414	0.621321	0.146501	0.51537	0.503597	0.071555	0.316402
6	PLEKHM2	0.104644	0.282538	0.338784	0.501635	0.219751	0.146501	0.51537	0.18705	0.062085	0.334397
7	CLEC4C	0.576194	0.223022	0.262263	0.23414	0.621321	0.499673	0.51537	0.18705	0.07439	0.378598
8	FRAS1	0.576194	0.321779	0.197515	0.23414	0.621321	0.146501	0.51537	0.503597	0.106461	0.397609
9	ADGRL3	0.576194	0.324395	0.23087	0.501635	0.621321	0.146501	0.51537	0.503597	0.047731	0.43641

4) ALS 및 대조군에서 RAPGEF2 유전자의 검증

ALS와 RAPGEF2 유전자의 관련성을 검증하기 위해 MALDI-TOF를 이용하여 385명의 건강한 개체를 대상으로 RAPGEF2 유전자에서 발견된 변이인 c.4069G>A에 대한 대조군 연구(control study)를 실시하였으며, 변이가 발견된 사람은 없었다. 또한, 본 연구에서 ALS 트리오와 무관한 184명의 ALS 환자의 RAPGEF2 유전자에 대하여 타겟 차세대 시퀀싱을 실시하였다. 그 결과, 2명으로부터 2개의 미스센스 VUS를 발견하였다: HS-374로부터 c.1883C>T (p.Thr628Ile), HS-477로부터 c.3293G>A (p.Arg1098His)(도 10). 본 연구에서 1명의 트리오 케이스 및 2명의 산발성 ALS 환자의 RAPGEF2 유전자에서 총 3개의 변이가 발견되었다(3/199, 1.5%). c.1883C>T (p.Thr628Ile) 변이는 UBQ 수퍼패밀리 도메인에 위치하며, c.3293G>A (p.Arg1098His) 및 c.4069G>A (p.Glu1357Lys) 변이는 RasGEF 도메인 바깥쪽 3’-말단 영역에 위치한다(도 11).

2. 환자 특성

ALS 트리오의 15명 발단자에 대한 임상 정보는 표 13에 요약하였다. 15명의 환자 가운데 9명은 남성, 6명은 여성이었다(남성:여성 비율은 1:0.6). 평균 발병 연령은 34.2세였다(범위, 19-49세). ALS에 대하여 가족력을 가진 사람은 없었다. sALS 트리오-7의 발단자를 제외하고 인지 장애를 보인 사람은 없었다. 14명의 환자(93.3%)은 사지에서 증상이 시작되었고 한 환자는 숨뇌 영역에서 증상이 시작되었다. 진단 당시 평균 ALSFRS-R은 40.5이고, 평균 델타-FS는 0.57이다. 추적 관찰기간동안 사망한 환자는 없었다. 두 명의 환자는 증상 발병 후 21개월 및 49개월 후 비-침습적 인공 호흡기 치료를 받았다. 숨뇌에서 발병한 ALS 트리오-12 발단자는 발병 후 빠르게 증상이 진행되어 10개월 후 비-침습적 인공 호흡기 치료 및 위루형성술(gastrostomy)을 받았다.

PSEN1 유전자의 c.497T>C (p.Leu166Pro) 변이를 갖는 sALS 트리오-7의 발단자는 28세 남자로 24개월간의 보행장애 및 하지 경련 기왕력이 있었다. 정신운동 장애, 공간지각력 저하를 포함한 인지장애가 경직성 보행장애에 선행되었다. 신경학적 검사에서 하지의 심한 경직과 좌우 과활동성 심부힘줄반사(Bilateral hyperactive deep tendon reflexes), 호프만 징후 및 바빈스키 징후가 나타났다. MMSE(Mini Mental State Examination)는 26/30을 기록했다. 정밀 신경심리 검사에서는 주의집중, 언어능력, 기억력, 전두엽 기능을 비롯한 모든 영역에서 인지 저하가 확인되었다. 근전도에서는 활성 탈신경(active denervation) 및 만성 탈신경 소견은 보이지 않았다. 뇌 및 척추 MRI 결과, 미만성 대뇌피질 위축이 관찰되었다. 치매나 인지 장애를 유발할 수 있는 이차적인 원인을 시사하는 검사 소견은 없었다. 고든 및 프링글 기준에 따라 하지의 근육 신경을 침범하며 치매를 동반하는 원발성 측삭경화증으로 진단되었다(18, 131).

RAPGEF2 유전자에서 c.4069G>A (p.Glu1357Lys) 변이를 갖는 sALS 트리오-3의 발단자는 36세 여성으로 오른손 및 하지에서 7개월간 점진적인 운동장애를 나타냈다. 1년 후, 구음 장애가 발생하였다. 신경근육질환에 대한 가족력은 없었다. 신경학적 검사 결과, 혀, 두 팔 및 두 다리에서 근위축 및 쇠약(weakness)이 나타났다. 속상위축(fasciculation)이 사지에서 분명하게 관찰되었으며, 좌우 과활동성 심부힘줄반사, 호프만 및 바빈스키 징후, 및 발목의 간헐성 경련이 나타났다. 기본적인 혈액 검사에서는 유의한 이상 소견을 보이지 않았다. 근전도 검사 결과, 활동성 및 만성 탈신경이 사지에서 나타났다. 뇌 MRI 결과, 이상 소견은 없었다. 개정된 E1-Escorial 기준에 따라, 3개 영역에서 상위운동신경 징후가 있는 경우로 임상적으로 명확한 ALS로 진단하였다.

FRAS1 유전자에서 c.8393C>T (p.Ala2798Val) 변이를 갖는 sALS 트리오-2의 발단자는 36세에 상지(upper extremity)에서 발병되었다. 진단 시 환자의 ALSFRS-R은 45/48이었고, 델타-FS는 1.43으로 상대적으로 증상이 빨리 진행되었다. 상기 환자는 ALS 발병 후 34개월 시점에 생존해 있었다.

CLEC4C 유전자에서 c.629_631delAGA (p.Lys210del) 변이를 갖는 sALS 트리오-4의 발단자는 21세 여성으로 19세에 상지에서 발병되었고, 느리게 진행 중인 운동장애를 갖고 있다. 진단 시 환자의 ALSFRS-R은 46/48이었고, 델타-FS는 0.1이었다. 상기 환자는 증상 발병 후 23개월 시점에 생존해 있었다.

PLEKHM2 유전자에서 c.1921+6C>T 변이를 갖는 sALS 트리오-8의 발단자는 39세 남성으로 38세에 증상이 시작되었으며, 상지에서 운동장애가 서서히 진행되었다. 진단 시 환자의 ALSFRS-R은 39/48이었고, 델타-FS는 0.89이었다. 상기 환자는 증상 발병 후 15개월 시점에 생존해 있었다.

SSH2 유전자에서 c.1408G>T (p.Glu470*) 변이를 갖는 sALS 트리오-11의 발단자는 39세에 상지에서 증상이 시작되었다. 진단 시 환자의 ALSFRS-R은 33/48이었고, 델타-FS는 0.75였다. 상기 환자는 증상 발병 후 8개월 시점에 생존해 있었다.

sALS 트리오-12의 발단자에서는 2개의 신규 VUS, 즉, SPAG17 유전자의 c.2815G>T (p.Ala939Ser) 변이 및 XRCC3 유전자의 c.598G>A (p.Val200Ile) 변이가 발견되었다. 상기 환자는 40세에 숨뇌 영역에서 증상이 발병하였다. 진단 시 환자의 ALSFRS-R은 42/48이었고, 델타-FS는 1.5였다. 상기 환자는 증상 발병 후 6개월시점에 생존해 있었으며, 발병 후 10개월에 기관절개술(tracheostomy) 및 위루형성술을 받았다.

IFT80 유전자에서 c.595G>A (p.Val199Ile) 변이를 갖는 sALS 트리오-13의 발단자는 41세에 하지(lower extremity)에서 발병되었다. 진단 시 환자의 ALSFRS-R은 37/48이었고, 델타-FS는 0.73이었다. 상기 환자는 ALS 발병 후 10개월 시점에 생존해 있었다.

ADGRL3 유전자에서 c.715A>G (p.Ser239Gly) 변이를 갖는 sALS 트리오-15의 발단자는 43세에 하지에서 발병되었다. 진단 시 환자의 ALSFRS-R은 43/48이었고, 델타-FS는 0.25였다. 상기 환자는 증상 발병 후 6개월 시점에 생존해 있었다.

15명 sALS 환자의 임상적인 특징

Trio No.	Sex	Age onset	Family history	Diagnosis	rEEC	Site of onset	ALSFRS-R	delta-FS	FVC (%)	Onset to initial (Mo)	Duration of f/u (mo)	NIV from onset (mo)	Gastrostomy from onset (mo)	Death from onset (mo)
1	M	30	No	ALS	probable	LE	45	0.1	71	29	40	49	-	-
2	F	36	No	ALS	definite	UE	38	1.43	71	7	34	-	-	-
3	F	27	No	ALS	probable	LE	44	0.36	67	11	69	-	-	-
4	F	19	No	ALS	probable	UE	46	0.1	68	20	23	-	-	-
5	F	28	No	ALS	definite	UE	35	0.43	73	30	17	-	-	-
6	M	23	No	ALS	definite	UE	36	0.52	58	23	23	-	-	-
7	M	26	No	PLS plus	-	LE	37	0.32	56	24	10	-	-	-
8	M	38	No	ALS	definite	UE	39	0.89	90	9	15	-	-	-
9	M	26	No	ALS	probable	LE	41	0.37	63	19	38	-	-	-
10	F	49	No	ALS	probable	LE	45	0.5	71	6	14	21	-	-
11	F	39	No	ALS	definite	UE	33	0.75	83	20	8	-	-	-
12	M	40	No	ALS	probable	bulbar	42	1.5	56.4	4	6	10	10	-
13	M	41	No	ALS	probable	LE	37	0.73	84	15	10	-	-	-
14	M	49	No	ALS	probable	UE	46	0.25	101.6	8	7	-	-	-
15	M	43	No	pure LMND	-	LE	43	0.25	not done	20	6	-	-	-

* 약어: PLS, primary lateral sclerosis; LMND, lower motor neuron disease; rEEC, revised El Escorial criteria; UE, upper extremity; LE, lower extremity; ALSFRS-R, the ALS functional rating scale-revised; delta-FS, delta-functional rating; FVC, forced vital capacity; NIV, non-invasive ventilation.

논의

1. 신규 변이의 발견

본 발명에서 15명의 sALS 트리오에 대한 전체 엑솜 시퀀싱을 실시하였고, 8 트리오로부터 PSEN1 유전자에서 1개의 기존에 보고된 돌연변이 및 9개의 VUS를 포함하는 10개의 신규 변이를 발견하였다. 먼저 본 발명자들은 전체 엑솜 시퀀싱을 통해 가족력이 없는 EOAD 환자에서 원인이 되는 변이를 발견하였다. 두 번째로 본 발명자들은 한국인 sALS 환자에서 신규 변이의 빈도를 평가하였다. 마지막으로 이러한 결과들은 ALS에서 신규 변이에 대한 체계적인 분석을 제공하며, 본 발명자들은 ALS 유전적 배경에 기여하는 새로운 후보로서 RAPGEF2 유전자를 확인하였다.

본 발명자들은 26세에 발병한 sALS 트리오-7로부터 신규 PSEN1 병리학적 변이인 c.497T>C (p.Leu166Pro)를 발견하였다. 이 변이는 가족성 이른발병 알츠하이머 치매(early onset Alzheimer's dementia; EOAD)의 원인이 되는 변이로 보고된 바 있다(130). 산발성 EOAD 환자에서 신규 변이에 대한 보고는 수 례만 보고되었는데(132-134) 이는 PSEN1 유전자 검사가 가족력이 있는 EOAD 환자에서 주로 시행되므로 선택편견(selection bias)이 작용했을 가능성이 있다(134). 본 발명의 결과더불어, 신규 변이가 발생하는 환자의 발병 연령은 26세에서 37세로 매우 어렸다. 본 연구에서 발단자와 마찬가지로 선천성강직성대마비(spastic paraplegia)를 보이는 몇몇 가족성 EOAD 증례가 보고된 바 있다(135-137). 특히, PSEN1 유전자 엑손 9의 결손이 조기 선천성강직성대마비이 관련이 있다고 알려져 있다 (138-140). 생어 시퀀싱을 통한 타겟 유전자 시퀀싱은 일반적으로 돌연변이를 찾기 위한 유용한 방법으로 알려져 있지만 질병의 다양한 표현형(phenotypic variability), 유전적 복합성(genetic heterogeneity) 및 다발성 분자 메커니즘으로 인해 다수의 신경 퇴행성 질환에서 원인이 되는 유전자 및 변이를 결정하는데 어려움이 있다. 따라서, 명확한 타겟 유전자가 없는 상황에서 일반적인 원인 유전자에 대한 검사 후 전체 엑솜 시퀀싱을 시행하는 것은 진단적 유용성을 지닌다.

본 발명에서 신규 변이 발생율은 0.6 (9/15)였고, 이는 ASD (autism spectrum disorders) 및 ALS의 최근 연구 결과와 유사하다(표 14). 최근 한 연구에서는 전체 엑솜 시퀀싱을 통한 47 sALS 트리오의 신규 변이 빈도를 0.64 (30/47)로 보고하였다(110). O’Roak 등은 189명의 자폐증 환자 및 부모에 대해 전체 엑솜 시퀀싱을 시행하였고, 그 결과 181개의 non-synonymous 변이(0.96, 181/189)를 발견했으며, 그 중 120개는 생화학적 특성 및 종간 보존 정도에 의거하여 질환에 영향을 미칠 가능성이 큰 변이로 분류되었다(103). ASD에 대한 다른 연구에서 신규 변이의 비율은 0.63 - 0.68로 나타났으며, 이는 본 발명의 결과와도 일치하였다(141-143).

Non-synonymous (NS) 변이의 신규 발생률 비교

질병 표현형(참고)	NS 변이 수	발단자 수	발단자 당 NA 변이 수
ASD (141)	125	200	0.63
ASD (103)	181	189	0.96
ASD (142)	119	175	0.68
ASD (143)	232	343	0.68
ALS (110)	30	47	0.64
ALS (본 발명)	9	15	0.6

* 약어: ASD, autism spectrum disorders; ALS, amyotrophic lateral sclerosis.

2. RAPGEF2 유전자

본 발명에서 RAPGEF2(Ras guanine nucleotide exchange factor 2) 유전자가 ALS의 원인 유전자 후보로 확인되었다. 본 발명자들은 sALS 트리오-3에서 RAPGEF2 유전자의 신규 미스센스 변이 c.4069G>A (p.Glu1357Lys)를 발견하였다. 또한, 독립된 184명의 sALS 환자군에서 RAPGEF2 유전자의 미스센스 변이 두 개를 추가로 발견하였다; c.1883C>T (p.Thr628Ile) 및 c.3293G>A (p.Arg1098His). 본 발명의 실험 분석결과들은 RAPGEF2 유전자가 sALS에 대한 원인 유전자일 가능성을 시사한다. 첫째로, 100명의 동일 인종의 정상 대조군 및 75명의 자체 질병 대조군에서는 RAPGEF2 유전자의 상기 3가지 변이가 존재하지 않았다. 그리고 dbSNP141, 1000 지놈 프로젝트(전체 및 동아시아인) 및 ExAC(Exome Aggregation Consortium)에서 변이의 대립유전자 빈도는 극히 드물었다(0.1% 이하). 둘째, 출판된 문헌, 전사체, 단백체, 조절체, 온톨로지 및 표현형 데이터베이스에 대한 비교를 기반으로 한 분석에서 기존에 알려진 ALS의 발병 기전과 RAPGEF2 유전자를 비교한 결과 RAPGEF2 유전자가 ALS와 통계적으로 유의한 관계가 있음이 확인되었다.

RAPGEF2 유전자는 염색체 4q32.1에 위치하고 35개의 엑손으로 구성되며, 1,499개의 아미노산을 코딩한다. RapGEF2 단백질은 비활성 GDP- 및 활성 GTP-결합 상태를 결정하는 GTP/GDP-조절 스위치로서 신호전달에서 GTPase 기능을 가진 RAS 패밀리 멤버의 하나이다(144). RapGEF2는 CNBD(cyclic nucleotide-binding domain), Ras 익스체인지 도메인, PDZ 도메인, Ras 연관 도메인 및 Rap GEF 도메인을 포함하는 여러 도메인을 포함한다(145). RapGEF2의 GEF 도메인은 Rap1 및 Rap1과 가까운 패밀리 멤버인 Rap2에서 GTP 교환을 조절하는 역할을 한다(146). 다른 도메인들은 그것의 활성, 안정성 및 위치를 조절하는 것으로 보인다(147, 148).

쥐를 대상으로 한 실험에서 RapGEF2가 쥐의 뇌에서 풍부하게 발현되고, 시냅스 원형질막 소포에 많이 존재한다는 사실이 관찰되었는데 이로부터 RapGEF2가 시냅스에서 역할을 수행할 것이라는 가설이 제기된 바 있다(도 12)(149). 또한, 초기 뇌 발달 및 뉴런의 형태발생 과정이 RapGEF2의 기능과 연관되어 있다는 보고도 있었다(150-152). RapGEF2는 MAPK 및 Rap1 신호전달 경로에 관여한다. Rag1 신호전달체계는 뉴런 이동에 관여하며, Cdk5에 의해 조절된다(153). 최근 연구에서 RapGEF2의 Cdk5-의존적 조절이 뉴런 이동 및 대뇌피질의 신경회로구성에 중요한 역할을 한다는 것이 보고되었다(145).

3. 다른 유전자들

본 발명자들은 sALS-13의 IFT80 유전자로부터 신규 변이 c.595G>A를 발견하였다. IFT80(Intraflagellar transport 80) 유전자는 염색체 3q25.33에 위치하며, 21개의 엑손으로 구성된다. 이 유전자는 IFT(intraflagellar transport) 콤플렉스 B 단백질을 코딩하며, 운동 및 감각 섬모에서 필수적인 역할을 한다. IFT80 유전자의 돌연변이는 ATD2(asphyxiating thoracic dystrophy 2) 및 SRP(short-rib polydactyly syndrome) 타입 Ⅲ를 유발한다(154). IFT80은 연조직 및 신장에서 풍부하게 발현된다(도 13). 최근 왕 등은 입천장 및 해면질골(trabecular bone)에서 IFT80 발현이 증가되며, 마우스 경골에 대한 면역화학 분석을 통해 Hh 및 Wnt 신호전달 경로를 조절함으로써 연골세포 분화에 IFT80이 필수적으로 작용한다는 것을 밝혔다(155).

sALS 트리오-11의 SSH2 유전자에서 넌센스 신규 변이 c.1408G>T (p.Glu470*)가 발견되었다. SSH2(Slingshot protein phosphatase 2) 유전자는 염색체 17q11.2에 위치하며, 24개의 엑손으로 구성된다. 이 유전자는 단백질 티로신 포스파타아제를 코딩하며, 액틴 필라멘트를 조절하는데 중요한 역할을 한다(156). SSH2는 혀 및 혈액에서 풍부하게 발현된다(도 14). 최근 정신분열증 환자를 대상으로 한 연구에서 ARC(activity-regulated cytoskeleton-associated protein) 및 NMDAR(N-methyl-D-aspartate receptor) 복합체를 포함하는 글루탐산성 시냅스후 단백질(glutamatergic postsynaptic protein)에서 신규 변이가 많이 발견된다는 사실을 확인하였다. 또한, 시냅스 강도(synaptic strength), 즉 액틴 필라멘트 다이나믹스 조절 단백질을 조절하는 복합체들과 상호작용하는 단백질에서 돌연변이가 많이 나타나며, 이들의 mRNA는 FMRP(fragile X mental retardation protein)를 타겟으로 한다. 이 연구에서 SSH2 유전자의 미스센스 신규 변이 c.1477G>A (p.Glu493Lys)가 정신분열증 환자 한 명에서 발견되었으며, 이는 SSH2 유전자가 정신분열증 및 다른 신경발달장애의 메커니즘에 관여할 수 있다는 것을 암시한다(157).

sALS-트리오 4의 CLEC4C 유전자에서 인프레임 결실인 c.629_631delAGA가 발견되었다. CLEC4C(C-type lectin domain family 4, member C) 유전자는 염색체 12p13.2-p12.3에 위치하며, 7개의 엑손으로 구성된다. 이 유전자의 단백질 패밀리 멤버는 공통의 단백질 접힘(fold) 구조를 공유하며, 세포 부착, 세포 신호전달, 당단백질 순환(turnover) 및 염증과 면역 반응에서의 역할과 같은 다양한 기능을 갖는다. 타입 2 트랜스멤브레인 단백질은 수지상세포 기능에 있어서 중요한 역할을 한다(158). 최근, 형질전환 마우스를 이용한 한 연구에서 CLEC4C를 통한 플라스마사이토이드 수지상세포로의 항원 전달이 자가면역질환의 치료 또는 원치 않는 항체 반응을 억제하는데 유용한 면역학적 내성 유도에 효과적인 방법이라는 것이 보고되었다(159).

sALS-트리오 8의 PLEKHM2 유전자에서 인트론 변이인 c.1921+6C>T가 발견되었다. PLEKHM2[Pleckstrin homology domain containing, family (with RUN domain) member 2] 유전자는 염색체 1q36.21에 위치하며, 21개 엑손으로 구성된다. PLEKHM2는 흉선에서 풍부하게 발현된다(도 17). 이 유전자는 살모넬라 감염 시 키네신(kinesin) 동원(recruitment)을 억제하며, PLEKHM2 활성은 살모넬라-포함 액포의 위치 결정 및 유지에 필수적이다(160).

본 발명자들은 FRAS1 유전자에서 미스센스 변이인 c.8393C>T를 발견하였다. FRAS1(Fraser extracellular matrix complex subunit 1) 유전자는 염색체 4q21.21에 위치하며, 74개의 엑손으로 구성된다. FRAS1은 소장 및 피부에서 풍부하게 발현된다(도 18). 이 유전자는 세포외 기질 단백질을 코딩하며, 표피 기저막 부착 및 발달시기 동안 기관형성을 조절하는 기능을 가진다(161). FRAS1 유전자에서의 돌연변이는 잠복안구(cryptophthalmos), 합지증(syndactyly) 및 신장결함을 포함하는 다발계통 기형(multisystem malformation)을 나타내는 프레이저 신드롬의 원인이다(162).

sALS-트리오 15의 ADGR3 유전자에서 미스센스 변이인 c.715A>G가 발견되었다. ADGRL3(Adhesion G protein-coupled receptor L3) 유전자는 LPHN3(latrophilin 3)로도 알려져 있다. 이 유전자는 염색체 4q13.1에 위치하며, 27개 엑손으로 구성되고, 뇌, 태반 및 눈에서 발현된다(도 19). 이 유전자는 GPCR(G-protein coupled receptors)의 라트로필린(latrophilin) 서브 패밀리 멤버를 코딩한다. 라트로필린은 7개의 트랜스멤브레인 영역과 더불어 19개의 아미노산 신호전달 펩타이드 및 세린/트레오닌-리치 글리코실화 영역을 포함하는 긴 N-말단 세포외 서열을 갖는다(163). ADGRL3은 뇌에 가장 특이적인 라트로필린이다(163). 최근 연구에 따르면, ADGRL3 유전자가 ADHD(attention-deficit/hyperactivity disorder)와 연관이 있다는 사실이 보고되었다(164). 연구진은 ADGRL3 유전자 변이가 집중력 및 활동성과 관련된 주요 뇌 영역에서 발현되고, ADHD와 연관된 신경회로의 대사에 영향을 미치며, 자극제에 대한 반응과 연관되어 있다는 것을 발견하였다(164).

4. ALS에서 다수의 원인유전자(Oligogenic) 모델

sALS 트리오-12로부터 두 개의 미스센스 신규 변이를 발견하였다: SPAG17 유전자에서 c.2815G>T (p.Ala939Ser) 및 XRCC3 유전자에서 c.598G>A (p.Val200Ile). SPAG17(Sperm associated antigen 17) 유전자는 염색체 1p12에 위치하며 56개 엑손으로 구성된다. SPAG17은 폐에서 풍부하게 발현된다(도 15). SPAG17-결핍 마우스는 비강섬모 및 기관섬모의 운동성을 소실하며, 비강 점액의 정정작용(nasal mucus clearance)의 감소, 폐에 물이 축적되어 나타나는 호흡 장애 및 폐포상피의 파괴, 뇌수종의 발생과 뇌실 팽창, 젖 빨기 실패 및 신생아 사망을 나타낸다. 이러한 결과는 Spag17이 운동섬모의 기능 및 구조에 중요한 역할을 한다는 것을 의미한다(165). 또한, SPAG17 유전자의 변이는 인간의 신장과 관련있다. 최근 골격성장 및 무기질침착(mineralization)은 SPAG17 유전자 기능을 통한 연골세포 및 골아세포의 일차 섬모에 의해 조절된다는 보고가 있었다(166).

XRCC3(X-ray repair complementing defective repair in Chinese hamster cells 3) 유전자는 염색체 14q32.3에 위치하며, 10개의 엑손으로 구성된다. XRCC3은 소장 및 후두에서 많이 발현되며, HR(homologous recombination) 경로와 연관되어 있다(도 16)(167). XRCC3 유전자 돌연변이는 손상 후 회복 매커니즘을 저해하여 염색체의 불안정성 및 다수의 다른 DNA 손상제에 대하여 민감한 양성을 나타낸다(168).

다수의 원인유전자(oligogenic) 모델은 가족성 ALS에서 제안되었으며, 이는 다수의 유전자에서 발생하는 변이가 다양한 양상으로 유전되어 ALS를 유발할 수 있다는 가설이다(60). Blitterswijk 등은 97명의 가족성 ALS 환자들을 대상으로 ANG 유전자와 FUS 및 TARDBP 유전자의 변이를 동시에 가지고 있거나 혹은 C9orf72 반복서열 증가와 함께 TARDBP , SOD1 혹은 FUS 유전자의 변이를 가진 경우를 보고하였다. 그러나 한 환자에서 두 개의 변이가 발견된 경우 하나는 실제 질환을 유발하는 변이가 아닐 가능성을 고려해야 하며, 이러한 관점에서 이 연구 집단에서 발견된 ANG 유전자의 변이는 다형성일 것으로 생각된다(60, 173). 그럼에도 불구하고, ALS 환자가 질병의 발생과 관련있는 유전적 변이에 더해 이차적으로 질환의 진행 혹은 발병 나이 및 증상 발현 여부에 관련이 있는 추가 변이를 가질 가능성을 배제할 수는 없다.

5. 요약 및 결론

본 발명자들은 신규 돌연변이 측정을 통해 신규 ALS 원인 유전자를 찾기 위해 발단자-부모 sALS 트리오에 대하여 전체 엑솜 시퀀싱을 실시하였다. ToppGene 소프트웨어를 이용하여 본 발명에서 발견한 신규 변이에 대한 유전자 및 기존에 알려진 ALS 유전자들과 다층적인 비교 분석을 시행하여 우선순위를 결정하였다. 이러한 분석을 통해 RAPGEF2 유전자를 신규 원인 유전자의 후보로 선정하였다. MALDI-TOF MS를 이용하여 364명의 나이 및 성별이 일치하는 건강한 한국인 대조군에 대하여 RAPGEF2 유전자의 신규 변이 c.4069G>A를 스크리닝하였고, 그 결과 신규 변이는 발견되지 않았다. 또한, 독립된 184명의 ALS 환자에 대한 RAPGEF2 유전자 분석을 실시한 결과, 2명의 환자로부터 2개의 미스센스 변이를 발견하였다; c.1883C>T 및 c.3293G>A. 또한, 100명의 한국인 정상 대조군과 75명의 비-ALS 환자로부터 얻은 자체 질병 대조군 엑솜 데이터에서 3개의 RAPGEF2 변이는 발견되지 않았다.

본 발명은 전체 엑솜 시퀀싱을 통해 한국인 sALS 트리오에서 신규 돌연변이를 발견한 최초의 연구이다. 본 발명의 결과는 ALS의 원인에 대해 더 넓은 지식을 제공한다.

이상으로 본 발명의 특정한 부분을 상세히 기술하였는바, 당업계의 통상의 지식을 가진 자에게 있어서 이러한 구체적인 기술은 단지 바람직한 구현예일 뿐이며, 이에 본 발명의 범위가 제한되는 것이 아닌 점은 명백하다. 따라서, 본 발명의 실질적인 범위는 첨부된 청구항과 그의 등가물에 의하여 정의된다고 할 것이다.

<110> SAMSUNG LIFE PUBLIC WELFARE FOUNDATION <120> Mutant Genes as Diagnosis Marker for Amyotrophic Lateral Sclerosis and Diagnosis Method Using the Same <130> PN150129 <160> 41 <170> KopatentIn 2.0 <210> 1 <211> 6824 <212> RNA <213> RAPGEF2 mRNA <400> 1 aaatgatctt gttctcttgg aagactgaga gctgtgtgag gttttctcag tcttgtcata 60 gcctaggatg gttagagttt caatgttata aaaatggaga cgaacactgt tgttcggatt 120 ccttttctgg tctacaagtg tgaagggttt ttaagcttac cagtagtgac actttaagct 180 gcagcttggt tttccctcct cccttttttt ttttcctttt tcttttaatt taatgctgta 240 gagggtgact tgccatcgtg agagattggt acatgatgtg taaattcagt tcagcatatg 300 tttcttcatt atgaaaccac tagcaatccc agctaaccat ggagttatgg gccagcagga 360 gaaacactca cttcctgcag atttcacaaa actgcatctt actgacagtc tccacccaca 420 ggtgacccac gtttcttcta gccattcagg atgtagtatc actagtgatt ctgggagcag 480 cagtctttct gatatctacc aggccacaga aagcgaggct ggtgatatgg acctgagtgg 540 gttgccagaa acagcagtgg attccgaaga cgacgacgat gaagaagaca ttgagagagc 600 atcagatcct ctgatgagca gggacattgt gagagactgc ctagagaagg acccaattga 660 ccggacagat gatgacattg aacaactctt ggaatttatg caccagttgc ctgcttttgc 720 caatatgaca atgtcagtga ggcgagaact ctgtgctgtg atggtgttcg cagtggtgga 780 aagagcaggg accatagtgt taaatgatgg tgaagagctg gactcctggt cagtgattct 840 caatggatct gtggaagtga cttatccaga tggaaaagca gaaatactgt gcatgggaaa 900 tagttttggt gtctctccta ccatggacaa agaatacatg aaaggagtga tgagaacaaa 960 ggtggatgac tgccagtttg tctgcatagc ccagcaagat tactgccgta ttctcaatca 1020 agtagaaaag aacatgcaaa aagttgaaga ggaaggagag attgttatgg tgaaagaaca 1080 ccgagaactt gatcgaactg gaacaagaaa gggacacatt gtcatcaagg gtacctcaga 1140 aaggttaaca atgcatttgg tggaagagca ttcagtagta gatccaacat tcatagaaga 1200 ctttctgttg acctatagga cttttctttc tagcccaatg gaagtgggca aaaagttatt 1260 ggagtggttt aatgacccga gcctcaggga taaggttaca cgggtagtat tattgtgggt 1320 aaataatcac ttcaatgact ttgaaggaga tcctgcaatg actcgatttt tagaagaatt 1380 tgaaaacaat ctggaaagag agaaaatggg tggacaccta aggctgttga atatcgcgtg 1440 tgctgctaaa gcaaaaagaa gattgatgac gttaacaaaa ccatcccgag aagctccttt 1500 gccttttatc ttacttggag gctctgagaa gggatttgga atctttgttg acagtgtaga 1560 ttcaggtagc aaagcaactg aagcaggctt gaaacggggg gatcagatat tagaagtaaa 1620 tggccaaaac tttgaaaaca ttcagctgtc aaaagctatg gaaattctta gaaataacac 1680 acatttatct atcactgtga aaaccaattt atttgtattt aaagaacttc taacaagatt 1740 gtcagaagag aaaagaaatg gtgcccccca ccttcctaaa attggtgaca ttaaaaaggc 1800 cagtcgctac tccattccag atcttgctgt agatgtagaa caggtgatag gacttgaaaa 1860 agtgaacaaa aaaagtaaag ccaacactgt gggaggaagg aacaagctga aaaagatact 1920 cgacaagact cggatcagta tcttgccaca gaaaccatac aatgatattg ggattggtca 1980 gtctcaagat gacagcatag taggattaag gcagacaaag cacatcccaa ctgcattgcc 2040 tgtcagtgga accttatcat ccagtaatcc tgatttattg cagtcacatc atcgcatttt 2100 agacttcagt gctactcctg acttgccaga tcaagtgcta agggttttta aggctgatca 2160 gcaaagccgc tacatcatga tcagtaagga cactacagca aaggaagtgg tcattcaggc 2220 tatcagggag tttgctgtta ctgccacccc ggatcaatat tcactatgtg aggtctctgt 2280 cacacctgag ggagtaatca aacaaagaag acttccagat cagctttcca aacttgcaga 2340 cagaatacaa ctgagtggaa ggtattatct gaaaaacaac atggaaacag aaactctttg 2400 ttcagatgaa gatgctcagg agttgttgag agagagtcaa atttccctcc ttcagctcag 2460 cactgtggaa gttgcaacac agctctctat gcgaaatttt gaactctttc gcaacattga 2520 acctactgaa tatatagatg atttatttaa actcagatca aaaaccagct gtgccaacct 2580 gaagagattt gaagaagtca ttaaccagga aacattttgg gtagcatctg aaattctcag 2640 agaaacaaac cagctgaaga ggatgaagat cattaagcat ttcatcaaga tagcactgca 2700 ctgtagggaa tgcaagaatt ttaactcaat gtttgcaatc atcagtggcc taaacctggc 2760 accagtggca agactgcgaa cgacctggga gaaacttccc aataaatacg aaaaactatt 2820 tcaagatctc caagacctgt ttgatccttc cagaaacatg gcaaaatatc gtaatgttct 2880 caatagtcaa aatctacaac ctcccataat ccctctattc ccagttatca aaaaggatct 2940 caccttcctt cacgaaggaa atgactcaaa agtagacggg ctggtcaatt ttgagaagct 3000 aaggatgatt gcaaaagaaa ttcgtcacgt tggccgaatg gcttcagtga acatggaccc 3060 tgccctcatg ttcaggactc ggaagaagaa atggcggagt ttggggtctc tcagccaggg 3120 tagtacaaat gcaacagtgc tagatgttgc tcagacaggt ggtcataaaa agcgggtacg 3180 tcgtagttcc tttctcaatg ccaaaaagct ttatgaagat gcccaaatgg ctcgaaaagt 3240 gaagcagtac ctttccaatt tggagctaga aatggacgag gagagtcttc agacattatc 3300 tctgcagtgt gagccagcaa ccaacacatt gcctaagaat cctggtgaca aaaagcctgt 3360 caaatccgag acctctccag tagctccaag ggcagggtca caacagaaag ctcagtccct 3420 gccacagccc cagcagcagc caccaccagc acataaaatc aaccagggac tacaggttcc 3480 cgccgtgtcc ctttatcctt cacggaagaa agtgcccgta aaggatctcc caccttttgg 3540 cataaactct ccacaagctt taaaaaaaat tctttctttg tctgaagaag gaagtttgga 3600 acgtcacaag aaacaggctg aagatacaat atcaaatgca tcttcgcagc tttcttctcc 3660 tcctacttct ccacagagtt ctccaaggaa aggctatact ttggctccca gtggtactgt 3720 ggataatttt tcagattctg gtcacagtga aatttcttca cgatccagta ttgttagcaa 3780 ttcgtctttt gactcagtgc cagtctcact gcacgatgag aggcgccaga ggcattctgt 3840 cagcatcgtg gaaacaaacc tagggatggg caggatggag aggcggacca tgattgaacc 3900 tgatcagtat agcttggggt cctatgcacc aatgtccgag ggccgaggct tatatgctac 3960 agctacagta atttcttctc caagcacaga ggaactttcc caggatcagg gggatcgcgc 4020 gtcacttgat gctgctgaca gtggccgtgg gagctggacg tcatgctcaa gtggctccca 4080 tgataatata cagacgatcc agcaccagag aagctgggag actcttccat tcgggcatac 4140 tcactttgat tattcagggg atcctgcagg tttatgggca tcaagcagcc atatggacca 4200 aattatgttt tctgatcata gcacaaagta taacaggcaa aatcaaagta gagagagcct 4260 tgaacaagcc cagtcccgag caagctgggc gtcttccaca ggttactggg gagaagactc 4320 agaaggtgac acaggcacaa taaagcggag gggtggaaag gatgtttcca ttgaagccga 4380 aagcagtagc ctaacgtctg tgactacgga agaaaccaag cctgtcccca tgcctgccca 4440 catagctgtg gcatcaagta ctacaaaggg gctcattgca cgaaaggagg gcaggtatcg 4500 agagcccccg cccacccctc ccggctacat tggaattccc attactgact ttccagaagg 4560 gcactcccat ccagccagga aaccgccgga ctacaacgtg gcccttcaga gatcgcggat 4620 ggtcgcacga tcctccgaca cagctgggcc ttcatccgta cagcagccac atgggcatcc 4680 caccagcagc aggcctgtga acaaacctca gtggcataaa ccgaacgagt ctgacccgcg 4740 cctcgccccc tatcagtccc aagggttttc caccgaggag gatgaagatg aacaagtttc 4800 tgctgtttga ggcacagact tttctggaag cagagcgagc cacctgaaag gagagcacaa 4860 gaagacgtcc tgagcattgg agccttggaa ctcacattct gaggacggtg gaccagtttg 4920 cctccttccc tgccttaaaa gcagcatggg gcttcttctc cccttcttcc tttccccttt 4980 gcatgtgaaa tactgtgaag aaattgccct ggcacttttc agactttgtt gcttgaaatg 5040 cacagtgcag caatcttcga gctcccactg ttgctgcctg ccacatcaca cagtatcatt 5100 ccaaattcca agatcatcac aacaagatga ttcactctgg ctgcacttct caatgcctgg 5160 aaggattttt tttaatcttc cttttagatt tcaatccagt cctagcactt gatctcattg 5220 ggataatgag aaaagctagc cattgaacta cttggggcct ttaacccacc aaggaagaca 5280 aagaaaaaca atgaaatcct ttgagtacag tgcttgtcca cttgtttaca atgtcctcct 5340 tttaaaaaaa aaaaatgagt ttaaagattt tgttcagaga gtaaatatat atccatttaa 5400 tgattacagt attattttaa accttaagta gggttgccag cctggtttct gaaaaaccaa 5460 atatgccgga cagggtgtgg ccacaccaag aagacgggaa gacctggctt gtgaccctgg 5520 cttcccatgt ccttctggtc tcacccgcga agtgccctat cctggaagta tgaaatgtta 5580 gccaattaat accaagacac ctcatctgct ccttccccag tggatggggt tcttctgtaa 5640 aactgtttgc acatggccag gggagggaac taggaccctt gtgtcctgtc tgagccttat 5700 ggaggcagga cggtgtcatt ggcggatgtg tcctgctcca ttgagatgga tggcaaaccc 5760 catttttaag ttatatttct ttgatttttg ttaatttaga ggtgtaggtt ttgttttttg 5820 tttttttgtt tttttttaag agaaacattt ataactggat agcattgcag tgaaagcagc 5880 ttgggatgtt ggagctaatg ccagctgttt atactgctct ttcaagacag cctcccttta 5940 ttgaattggc attagggaat aaacaagcct ttaaacgtga taaaagatca aaaacctggt 6000 tagacatgcc agcctttgca aggcaggtta gtcaccaaag actaacctcc aagtggcttt 6060 atggacgctg catatagaga aggcctaagt gtagcaacca tctgctcaca gctgctatta 6120 accctataat gactgaaatg acccctccac tctatttttg tgttgttttg cacagactcc 6180 ggaaaagtga aggctgccaa tctgagtagt actcaaatgt gaggaactgc tggtcttgga 6240 ttttttttcc attaaattca gctgatcata ttgatcagta gataaacgta aatagcttca 6300 aattttaaaa gtggaattgc agtgtttttt cactgtatca aacaatgtca gtgctttatt 6360 taataattct cttctgtatc atggcatttg tctacttgct tattacattg tcaattatgc 6420 atttgtaatt ttacatgtaa tatgcattat ttgccagttt tattatatag gctatggacc 6480 tcatgtgcat atagaaagac agaaatctag ctctaccaca agttgcacaa atgttatcta 6540 agcattaagt aattgtagaa cataggactg ctaatctcag ttcgctctgt gatgtcaagt 6600 gcagaatgta caattaactg gtgatttcct catacttttg atactacttg tacctgtatg 6660 tcttttagaa agacattggt ggagtctgta tcccttttgt atttttaata caataattgt 6720 acatattggt tatatttttg ttgaagatgg tagaaatgta ctatgtttat gcttctacat 6780 ccagtttgta caagctggaa aataaataaa tataacataa aaaa 6824 <210> 2 <211> 4322 <212> RNA <213> IFT80 mRNA <400> 2 gcgcatgcgc gaactcctgg cgggacctac gcggtagaag tttctactaa gtgaaaagga 60 agagcgaggg attcttttct ctgtggtcta cagcagcagc actattatta aaaatatttg 120 gaaagacaac ctggcaagtt ttgaaaaaga tttttttaaa aacggtaggg ttccgctcac 180 agtgggaggc ggggctcagt ggtccagaaa cgcctcttca gaagagggcg ggctcgccga 240 gaggcggggt ctcgggccca ctcggatgac gtgccgcgta gaagtatcgc gggaagagga 300 agggagcgta actcttagaa gtcactatgg tgacggggag gtaccaggta tttgagagca 360 atcgccaccg ctttcctgga acttgagtaa atacaatcaa gtggcatctt aaatttttgc 420 tggaagtgga gtcatgagac taaagatatc tcttttaaaa gaaccaaagc atcaagaatt 480 agtaagctgt gtgggctgga ctactgctga agagctgtat tcatgtagtg atgatcacca 540 gatagtgaag tggaacttgt taaccagtga aacaactcaa atagtaaagc ttcctgatga 600 tatttaccct attgattttc actggtttcc aaaaagtttg ggtgtaaaga aacaaaccca 660 ggcagaaagc tttgtcctca caagttctga tggtaaattt catctgattt ccaagttagg 720 aagagtggaa aaaagtgtag aagctcactg tggagcagta cttgcaggaa gatggaatta 780 tgaaggaaca gcattagtta cagttggaga agatggacaa ataaaaattt ggtcaaagac 840 tgggatgctt agatcaactt tagctcagca aggaacacca gtgtattcag tagcgtgggg 900 ccctgattca gaaaaggttc tttatacagc aggcaagcag ctaatcatta aacctcttca 960 accaaatgct aaagttttgc agtggaaagc tcatgatggc attattttaa aagtagattg 1020 gaactcggtc aatgatctta ttttatctgc tggtgaagac tgtaaatata aggtatggga 1080 tagttacggc cgcccactgt acaattcaca acctcatgag catcccatta cttcagttgc 1140 ctgggctcca gatggagaat tatttgctgt tggatcgttt catactttac gcttgtgtga 1200 taaaactggg tggtcatatg cattagaaaa acccaacact ggcagcatat ttaatattgc 1260 atggtctatc gatggcactc agattgctgg agcctgtgga aatggacatg tcgtttttgc 1320 acatgtggtg gaacaacatt gggagtggaa aaattttcaa gtaacattaa cgaaaagaag 1380 agccatgcag gttcgtaatg ttcttaatga tgcagtggat ttactggaat tccgtgatag 1440 agtcattaaa gcatctttga actatgcaca cttagttgtt tcaacgtctc ttcaatgtta 1500 cgtgttctcc acgaagaact ggaacacacc aattatattt gatctcaaag aaggaactgt 1560 tagtttgatt ctgcaggcag aaagacattt tcttcttgta gatggtagta gtatctattt 1620 atattcatat gaagggcgct ttatttcatc tccaaaattt cctggaatga gaacagatat 1680 tctgaatgca cagactgtgt ctttgagtaa tgataccata gcaataagag acaaagctga 1740 tgaaaaaata atcttcctct ttgaggcatc aaccggaaag ccgttaggtg atggaaagtt 1800 tctttctcat aagaatgaaa tcttggaaat tgctctggat caaaaaggac ttaccaatga 1860 tagaaaaatt gctttcattg ataaaaatag agatctctgt atcacttctg tgaaacgatt 1920 tgggaaggaa gaacaaatta tcaagcttgg aacaatggtg catactttgg catggaacga 1980 tacatgcaat atcctttgtg gacttcaaga tactcgattt atagtgtggt attaccccaa 2040 tacagtttat gtggacagag acattttgcc taaaacatta tatgaaaggg atgcaagtga 2100 atttagtaaa aatccccata ttgtgagttt tgttggaaat caagtaacta ttagaagagc 2160 tgatggctcc ctggttcaca tcagcataac accatatcct gctattctcc atgaatatgt 2220 aagcagttca aaatgggaag atgctgtgag actttgtcgc tttgttaagg agcaaaccat 2280 gtgggcttgt ctagctgcta tggcagttgc taatcgagat atgactactg cagaaatagc 2340 ctatgcagca attggtgaaa ttgataaggt tcagtacatc aattctataa aaaatcttcc 2400 atctaaagaa tcaaaaatgg cccacatact actgtttagt gggaacatac aggaggctga 2460 aatagtactt cttcaggctg gccttgttta tcaagcaatc cagatcaata ttaatctcta 2520 caactgggaa agggcactgg aattggctgt aaaatacaaa acacatgttg atacagttct 2580 tgcttaccgt caaaagtttt tggagacatt tggtaaacag gaaactaata aacgatactt 2640 gcattatgca gaaggtctcc aaatagattg ggagaaaatc aaagccaaaa ttgagatgga 2700 aattacaaaa gaaagagagc aatcatcaag cagccaatcc agcaagagta taggtttaaa 2760 gccctaaatg ccatgcgtat ctttaagaaa ttttatcttt tgaaacacgt tctgattaac 2820 caagggtaag catgttttgg ttgctaaaga aaaaagcata atctttaacc gagtataagt 2880 acttgctgtg tatttagtgt aaaagtacat gcagaaagat gaaacacaaa gtaattgatg 2940 tatttctatc ttttatattt tttagtccaa taattagcaa aatattacta tgtacttaag 3000 agatacctgt gtagtgtcga ttatatgtca gttttttgcc cattacttca tccctaaatc 3060 ttcagcatga acaaatatta atgtcgataa taaaacattg gactctttga aatgtatgtt 3120 accattaatt tctatttgac ctctaaattg taaaatgcct ccaaaagttt atttatagaa 3180 caaaaataca tgaggatgga tttgtacaaa tgtataaaat gccactattt atacaccaag 3240 ttcatagcag cattactgga atagcaaaag atggaaacag ctcaagtgtc tatcatgaat 3300 ggataaacaa atgtgctata atacatacaa tggaatatta tttagcttta aaaaggaatg 3360 aaattctgat aaatactacc tcaggataaa ccttgaaaac actatgctaa gtgaaataag 3420 ccagacacaa aaggccaaat atgatgccac ttttatgagg taccagcata ggcaagttca 3480 cagaaacaga aaggagaata gtggttgcca gggactgcag ggaggaggaa atggggggtg 3540 gggttattgt ttaacgagta catagtttct gtttgggatg aacaaattct ggaaatggat 3600 agcgatgatg gttgctcaac attttgaatg ttaatgccac taaattgtac ccataaaaat 3660 ggttaaaatg gtaaattttg ttatgtatat tttatcataa tttaaaaaat atatctagaa 3720 tgggcaagaa ggattctcct cattcctctc ttgacttgag aatgatcagt caataggccc 3780 tgaagtctga atttgtgaaa atttccttgg gtgacaaact tgtttgatta ctctatttag 3840 tgtatcccaa agttattacc acataatctt ttaaacaata aaacaaatac cccttagaaa 3900 gtcttctgca aacccatttc tgaaaatggt acattatagg gtgggtatag atgcatagat 3960 atgggattat gtatgatata tatatatata cacacacaca caaagggata gagagattac 4020 ctctcttaac ccccatttta attactatgt ctaggttttt taaataaaaa tcttttcttt 4080 ttaacatgtt tcttttcttt tccggaatat tggaatattc tgttcttgat ccagatgaaa 4140 tctgattgag cagtgtactt acaagttgta ctgtgtatgt gtttcctata ttgttatatt 4200 tcaataagaa gcttaaaatg tttaaaaata aatggttaaa aggttttatg ttatgtatat 4260 tttaccacaa taaatgcaaa aaataaaaag tctgtgttct aaacaaaaaa aaaaaaaaaa 4320 aa 4322 <210> 3 <211> 9224 <212> RNA <213> SSH2 mRNA <400> 3 gacaagaatg ccctgcccgg aacaacccag cagcgcctag atggctttgg tcacggtcca 60 gcggtcacct acccccagca ccacctccag cccctgcgcc tcggaggcag acagtgggga 120 ggaagaatgc cggtcacagc ccaggagcat cagcgagagc tttctaactg tcaaaggtgc 180 tgcccttttt ctaccacggg gaaatggctc atccacacca agaatcagcc acagacggaa 240 caagcatgca ggcgatctcc aacagcatct ccaagcaatg ttcattttac tccgcccaga 300 agacaacatc aggctggctg taagactgga aagtacttac cagaatcgaa cacgctatat 360 ggtagtggtt tcaactaatg gtagacaaga cactgaagaa agcatcgtcc taggaatgga 420 tttctcctct aatgacagta gcacttgtac catgggctta gttttgcctc tctggagcga 480 cacgctaatt catttggatg gtgatggtgg gttcagtgta tcgacggata acagagttca 540 catattcaaa cctgtatctg tgcaggcaat gtggtctgca ctacagagct tacacaaggc 600 ttgtgaagtc gccagagcgc ataactacta cccaggcagc ctatttctca cttgggtgag 660 ttattatgag agccatatca actcagatca atcctcagtc aatgaatgga atgcaatgca 720 agatgtacag tcccaccggc ccgactctcc agctctcttc accgacatac ctactgaacg 780 tgaacgaaca gaaaggctaa ttaaaaccaa attaagggag atcatgatgc agaaggattt 840 ggagaatatt acatccaaag agataagaac agagttggaa atgcaaatgg tgtgcaactt 900 gcgggaattc aaggaattta tagacaatga aatgatagtg atccttggtc aaatggatag 960 ccctacacag atatttgagc atgtgttcct gggctcagaa tggaatgcct ccaacttaga 1020 ggacttacag aaccgagggg tacggtatat cttgaatgtc actcgagaga tagataactt 1080 cttcccagga gtctttgagt atcataacat tcgggtatat gatgaagagg caacggatct 1140 cctggcgtac tggaatgaca cttacaaatt catctctaaa gcaaagaaac atggatctaa 1200 atgccttgtg cactgcaaaa tgggggtgag tcgctcagcc tccaccgtga ttgcctatgc 1260 aatgaaggaa tatggctgga atctggaccg agcctatgac tatgtgaaag aaagacgaac 1320 ggtaaccaag cccaacccaa gcttcatgag acaactggaa gagtatcagg ggatcttgct 1380 ggcaagcaaa cagcggcata acaaactatg gagatctcat tcagatagtg acctctcaga 1440 ccaccacgaa cccatctgca aacctgggct agaactcaac aagaaggata tcaccacctc 1500 agcagaccag attgctgagg tgaagaccat ggagagtcac ccacccatac ctcctgtctt 1560 tgtggaacat atggtcccac aagatgcaaa tcagaaaggc ctgtgtacca aagaaagaat 1620 gatctgcttg gagtttactt ctagggaatt tcatgctgga cagattgagg atgaattaaa 1680 cttaaatgac atcaatggat gctcatcagg gtgttgtctg aatgaatcaa aatttcctct 1740 tgacaattgc catgcatcca aagccttaat tcagcctgga catgtcccag aaatggccaa 1800 caagtttcca gacttaacag tggaagattt ggagacagat gcactgaaag cagacatgaa 1860 tgtccaccta ctgcctatgg aagaattgac atctccactg aaagaccccc ccatgtcccc 1920 tgatcctgag tcaccaagcc cccaacccag ttgccagact gaaatctcag atttcagtac 1980 agatcgcatt gactttttta gtgccctaga gaagtttgtg gagctctccc aagaaacccg 2040 gtcacgatct ttttcccatt caaggatgga ggaactgggt ggaggaagga atgagagctg 2100 tcgactgtca gtggtagaag tagccccttc caaagtgaca gctgatgacc agagaagcag 2160 ctctttgagt aatactcccc atgcatcaga agaatcttca atggatgagg aacagtcaaa 2220 ggcaatttca gaactggtca gcccagacat cttcatgcag tctcactcgg aaaatgcaat 2280 ttcagtcaaa gaaattgtca ctgaaattga gtccatcagt caaggagttg ggcagattca 2340 actgaaagga gacatcttac ccaacccatg ccatacacca aagaagaaca gcatccatga 2400 gctgctcctt gagagggccc agactccaga gaacaaacct ggacatatgg agcaagatga 2460 ggactcctgc acagcccagc ctgaactagc caaagactca gggatgtgca acccagaagg 2520 ctgcctaacc acacactcat ctatagcaga cttggaagaa ggggaaccag ctgaggggga 2580 acaagagctc cagggctcag ggatgcaccc aggtgccaag tggtaccctg ggtctgtgag 2640 gcgagccacc ttggagttcg aagagcgctt acggcaggag caagagcatc atggtgctgc 2700 cccaacatgt acctcattgt ccactcgtaa gaattcaaag aatgattctt ctgtggcaga 2760 cctagcacca aaagggaaaa gtgatgaagc ccccccagaa cattcatttg tcctcaagga 2820 accagaaatg agcaaaggca aagggaaata cagtgggtct gaggctggct cactgtccca 2880 ttctgagcag aatgccactg ttccagctcc cagggtgctg gagtttgacc acttgccaga 2940 tcctcaggag ggcccagggt cagatactgg aacacagcag gaaggagtcc tgaaggatct 3000 gaggactgtg attccatacc aggagtctga aacacaagca gtccctcttc cccttcccaa 3060 gagggtagaa atcattgaat atacccacat agttacatca cccaatcaca ctgggccagg 3120 gagtgaaata gccaccagtg agaagagcgg agagcaaggg ctgaggaaag tgaacatgga 3180 aaaatctgtc actgtgctct gcacactgga tgaaaatcta aacaggactc tggaccccaa 3240 ccaggtttct ctgcaccccc aagtgctacc tctgcctcat tcttcctccc ctgagcacaa 3300 cagacccact gaccatccaa cctccatcct gagtagccct gaagacagag gcagcagcct 3360 gtccacagcc ctggagacag cagcaccttt tgtcagtcat acaacccatt tactgtctgc 3420 cagtttggat tacctgcatc cccagactat ggttcacctg gagggcttca cagagcagag 3480 cagcactaca gatgagccct ctgcagaaca ggttagctgg gaagaaagtc aggagagccc 3540 tctctccagt ggcagtgagg tgccatataa ggactcccag ctaagtagcg cagacctaag 3600 tttaattagc aaacttggtg acaacactgg ggagttacag gagaaaatgg acccattgcc 3660 tgtagcctgt cgactcccac atagctctag tagtgaaaac ataaagagtc tcagccacag 3720 ccccggtgtg gtgaaggagc gtgctaaaga aatcgagtct cgagtggttt tccaggcagg 3780 gctcaccaaa ccatcccaaa tgaggcgctc agcttctctc gccaaattag gttacttgga 3840 cctctgtaaa gactgcttac cagagaggga gcctgcctcc tgtgaatccc ctcatctcaa 3900 actgcttcag cctttcctca gaacagactc aggcatgcac gcgatggagg accaagagtc 3960 cctagaaaac ccaggtgccc cccacaaccc agagcccacc aagtcttttg tagaacaact 4020 cacaacaaca gagtgtattg tgcagagcaa gccagtggag aggccccttg tgcagtatgc 4080 caaagaattt ggttctagtc agcagtattt gctccccagg gcaggacttg aattgactag 4140 ttctgaagga ggccttcccg tgctacagac ccagggactg cagtgtgcat gcccagctcc 4200 agggctggcc gtggcacccc gtcagcaaca cggcagaact caccccctta ggagactgaa 4260 aaaggcaaat gacaaaaaac ggacaaccaa ccccttctat aataccatgt gattctgagc 4320 ctacacatgt gactttctag aagaaatgtt tgtaaaaggg gcaggtgtaa tatgtaagga 4380 acatgcactt tattggttaa ttttataata ttttggtcat tttactgttt ctggtgcatg 4440 cagggtttgg gtgtttttca gtgtgtatgt gtgtgtatat gtaaggggaa agagagattg 4500 atctggatgg caagaccgtt tatcattttt tatttaaaaa aatcaaacct caaaaaagtc 4560 attttcagag aacaccttta tcaaaggcaa attgctgttt ttcagtcagc tgccacctgc 4620 ttctcatttt gccctctgag aaaaggcatg gtttcttaat tgagggaagg aagcagattc 4680 ggaggggtgg agataaagct ggggattgga gatgttcccc tgcctttgtg atgatggttt 4740 ggtttccaga cctgaggcat cgaatgggct aaaggtcagc cagaagtcag agggctctca 4800 gccttcatcc agccgcagcc ctttagagtt cctgaaggag gcaggttccg ctttgcttta 4860 aaagagggtc ttccggtgtt ccagagtgta tcgttacagt aagacatgat aatggccggc 4920 tctgcaaatt tatcatatag tttttttccc aagaaaatta tttttgaaat taaaacagga 4980 ccccaaatga aatccaagtg gtcttctgta gaggaaagca tgataagagg aggaagacat 5040 aaagttgggg gtggagaggc tgctgcccag aaactgctgg gttggtggga tccacacaga 5100 tgggcatctt ggctctccct gccagaaaaa tgtgctctgc agtgtcctcc caactgaaaa 5160 caacagtgac atgtttgaaa agcagcaatc gaaagtcagt gtgttcttgt aaaatgaata 5220 tgtatgtagg gttttaaccc ttccattact tgaataattc tttgggcctt ctgagtttaa 5280 tggccatatt ttcttccagt ttattttcct tccccatgct gttgtcccca tgctgcctat 5340 ttttttaaat ttcatagatt atatttgaat tgttacatat gtttaacatc cattgaatgc 5400 aacgttttat ttttggtatt atcactgtta acactttttt ttccttttcc tggaaggttt 5460 gtcatttctc taaagtttgt acacagtatt tatgtacata atattgtcac tgtcttagtg 5520 tcttgttcat gttgtagggt aattttgatt tattcttttt aagaaggagt agagttgcaa 5580 ctggaaaaca cagacaccag aaatgaaagt gttgggtgtt gataggaatc tgtacaatat 5640 gttgatggtg gctgtagttg tttaaatgga gacttccaat caccagctcc tgccaaatta 5700 tgcattagta actttttcct cagagacacc cctaaaggct cccattaggt cacagcgtga 5760 ctgaaagctg atttctctgt gagactgaaa tcccagaaca ttgtttgcca gtatctcaac 5820 cacagccagg aagtatatgt gagttgccca gagtggaagc tcctagtaga ggctgaaggc 5880 cacaggggag gcctcagcca ggggcaagtg cccacagtga ctccatttag gatgctgtcg 5940 ttttgctact gttgtggaga tccttaacgc agcagcgcct gtcataaaca agcctcttgt 6000 agcttcttac agaaaacaga tttagtctag catgaaacac ctctgcatct cattgaaact 6060 gaagaggctt gcagatttgc tttcgttgat gtccacgtta ctgaggattg actgagtata 6120 gactggagac aggtttttgg cttatcacag cactgaggaa aatacaaatg cacagactgt 6180 cagcatgatg tcagaggcca gagtttggtg ggggcagatg gcagggcgac ccaaaagatg 6240 cagaaaaggt agactggggc cactgggtct taagaggagc tgtgaagttg tgtggaagcc 6300 aaggctgggt ctgacatccc tgccaggaag caggttggac agaaaccact tgctaaaagc 6360 gtctctatgg tgcagtgatt atgtgtaccc tgtgctgttg ctcagtagtc tccttgaatg 6420 ttcaagtatc tcatccactc agttttgtga ttcctggata tttgtgtgtt gtaaagtgtt 6480 ttgttaggtg gtatgaacca atgtgaggag gcttgagaca gggttatgga tttccagagc 6540 tcttccatgt agaataccct gccttcttga agcagttcca ccaccaatat gatggggaag 6600 ggcaggaact tatggcaggg tggggagagg gtttgcctgg aagttaagag agtggcatcc 6660 acttgtggta accccttacg atgatgacat cccacacact aagaggtaca agcaggacca 6720 aagttttgga ctgttccctc ttctcccctc cactgtgttt aatgttcact cactgcatta 6780 aataacaaca aagatgggac aaaacccact aatactgtgg ggaaaaaaaa ttttcaagag 6840 cagaggaaag tctttctgcc tttttataat tacttttttt atcatttaat ttacctgcct 6900 aaataaacat cttctacaga atatctgtca ttcaaccatg ccaaggagtt tgtgccagcc 6960 ttttcagact cccagaattg ggtgttcctg ggttatttac atagctgagc agtgtccagg 7020 ggaggtgcgc agtgaactgt caaggacttt ccagactgtc ttctcttcag acttttataa 7080 tctccagtgg catctttccc ttttcttttg ttcatgacct gacctgaagc agcagatttg 7140 atagactggc aaagatgaat aggaaaaact ttgactcttg cccagtgcct gcctgcctct 7200 ctctctctcc tctctctctc tctcttttta aaccaccata gactctcact tattttggag 7260 gagtgtatgt gcatgtgtac acatatgtac atatataaaa acagttgatg ttttggtgta 7320 tggggtaaaa gccccaggag catacagaac ttgagctgaa cctggtcagt agaaagggaa 7380 accccaaccc tttcttgatt tttggagaca cccaggacta atggatactg tagtagacat 7440 gtagtactat agtaccgtaa tattcatctc tcctcatttt agttgccttt cagattctaa 7500 atgtttggga tcattcctat catcttagtc tcttcaggat ctttagtatt ttcctggttc 7560 tgaggaggct tgagacaggg ttatggattt ccttgttctg tgtctttatc cctactgata 7620 gttcctcttt ctcattttgc aaactaccca gagctccaag gacagcctga agatctcagt 7680 gcctcaggct ctgaggtact ctgctcacag gccccagaca gatgctgttg ggtaaactca 7740 aagcttccta tgagaagctt ctgagatgta gcaggtcaca gaagtgttca cctgtttcat 7800 ctgaggattt cagttctgaa gtgatctagg catgtttggt aaaaatgttt ttgtgagagt 7860 tcttttttta agaaagcatt atgcaaaaag tcacttttaa gggcatttaa aaatttttaa 7920 gtaaagccat tctttggctt ttttggacta tttgtggata ctttgtttac attttgaata 7980 ttaaaatgtg catcatcttg tcggccatgc agtcctgcag gcatcagtgc cctggctgtc 8040 ctgtgagtcc tcatgcagag cagggccatc atggtcagcc cttgtgagta agtgggtata 8100 cgctgaagct gacttccgtc tgtgtcctgc cctcccatcc agcactctct atggaaatag 8160 ttgtcatttc ctcagtgatg gtgtgtctta tagtgatggt tgtaatggtg aatggctagt 8220 gtcattttgt ttaattttgt tttgcttttt gatggtggat aagatgaaat tttagctgtt 8280 tcagcatcaa tccaacttaa aagcatcttg gactttgttt tcccttccaa actaaaagat 8340 caaggcatgt attagacaca agcatatttg ctgcctcaac tcctctgaca cccatattag 8400 gaaaaggcct gccaccaaag caggaagctg cacactccta acccttctcc cagggtgtgg 8460 ggtcccttga cgtcatgaag agctattgca aggtgcttct gtacttttcc agcctggaaa 8520 tggagggtga ctggccctgg ctcctgctat gagaagataa ccagcctcat tttctcagtg 8580 ccccagaggt ctaggatagg atttctaaac tggaatcatc cttaatcacc ttgaagatcc 8640 cttaagaggc atttgactgg tgctgccgtc tgtgtcctca aagcaatgct ggtggcagcg 8700 tcctgtgtac acatgcagag ctaataccca aactaaaaac tgggtaactg gccctgaagt 8760 gcttcccaat cagtaagccc acagggaaat gtttgatttt tatgttctgt tggattttgg 8820 tttgcttggc atatctaaag gtgcctttac ttttcttttt tttttttttt ctttctgctt 8880 tgttttgtag gacttgttct aacatggaaa acaagtccag aagactctcc tctgactgtt 8940 acctttgccc caagccaccc caaactttta tgctcatgtt ttattaaagc aggtgctccc 9000 tggaatctct gggacatttt tgaggcattt gaagcagaat atagagtggt ctcatctcct 9060 tccttaatct tcctggtggt tgggatgttc cacttgtatc atagattttt ttattacaga 9120 tatgctccac tgtttttaaa tgtgaacttg tgcgcaaatg tgcagattca atgttcttgt 9180 tacagattga ataaattttt attttgaaga tgaaaaaaaa aaaa 9224 <210> 4 <211> 2620 <212> RNA <213> XRCC3 mRNA <400> 4 ctattggagg agaaggccga gaggagcagg acggcgggaa gaggagtgcg gaacccgcgg 60 gaggatgtgc acagagggcc caggaggagc ctcaggagcc ggactgccgt tggccaaccg 120 agtccccagg gagacactta agggaaatta aactgcagag tgcaagagat gcctcagtca 180 agtcagccaa aaacacgcgg gtcatcccca agccccagag agtgacagag ccccgatgac 240 acggacacct cggctgctgt cacttccctg gttcgggcct cccacaggct ttgaattgaa 300 ggcgagtgcc tcagaatttg catccattgt tctgtctttc ctgggaagtt attcatcctg 360 gtggccagcc caccgacaaa atggatttgg atctactgga cctgaatccc agaattattg 420 ctgcaattaa gaaagccaaa ctgaaatcgg taaaggaggt tttacacttt tctggaccag 480 acttgaagag actgaccaac ctctccagcc ccgaggtctg gcacttgctg agaacggcct 540 ccttacactt gcggggaagc agcatcctta cagcactgca gctgcaccag cagaaggagc 600 ggttccccac gcagcaccag cgcctgagcc tgggctgccc ggtgctggac gcgctgctcc 660 gcggtggcct gcccctggac ggcatcactg agctggccgg acgcagctcg gcagggaaga 720 cccagctggc gctgcagctc tgcctggctg tgcagttccc gcggcagcac ggaggcctgg 780 aggctggagc cgtctacatc tgcacggaag acgccttccc gcacaagcgc ctgcagcagc 840 tcatggccca gcagccgcgg ctgcgcactg acgttccagg agagctgctt cagaagctcc 900 gatttggcag ccagatcttc atcgagcacg tggccgatgt ggacaccttg ttggagtgtg 960 tgaataagaa ggtccccgta ctgctgtctc ggggcatggc tcgcctggtg gtcatcgact 1020 cggtggcagc cccattccgc tgtgaatttg acagccaggc ctccgccccc agggccaggc 1080 atctgcagtc cctgggggcc acgctgcgtg agctgagcag tgccttccag agccctgtgc 1140 tgtgcatcaa ccaggtgaca gaggccatgg aggagcaggg cgcagcacac gggccgctgg 1200 ggttctggga cgaacgtgtt tccccagccc ttggcataac ctgggctaac cagctcctgg 1260 tgagactgct ggctgaccgg ctccgcgagg aagaggctgc cctcggctgc ccagcccgga 1320 ccctgcgggt gctctctgcc ccccacctgc ccccctcctc ctgttcctac acgatcagtg 1380 ccgaaggggt gcgagggaca cctgggaccc agtcccactg acacggtggc ggctgcacaa 1440 cagccctgcc tgagaagccc cgacacacgg ggctcgggcc tttaaaacgc gtctgcctgg 1500 gccgtggcac agctgggagc ctggttcaga cacagctctt ccagggcagc ggctccactt 1560 tctcatccga agatggtggc cacagactga cccccatctg agctgggggg atgttctgcc 1620 tctccctggg tctggggaca ggcccgcttg ctgggtacct ggtccccact gctgagctgg 1680 cccttgggga gaggtgattc tcagggctgg agcctggggt gtcctacagt gactccctgg 1740 gagccgcctg cttcttctct ccacatggaa gcccaactgg ggttgcgtct gaggcctgcc 1800 ccctgggctg gggcctcaga ccccctcagc cttgggaccg tgcccacgag ggtctcccct 1860 cctgcacaca gggcagtcct tactccccca ccactcaggc cacagtgggg ctgcaggcag 1920 gcggctcctc ctcacccacc tctgggtcct tggctcccgg gggccccacc tcggcacaca 1980 ctgtgcccca caaaacttca gtgtggtaca aggtggagaa agcatatccc accaacctcc 2040 agtgtcaggg tccaggagag cctgggggtg gggggactgc cttgtctcta gtagtgtggc 2100 ctgtgccagc accacagccg gtcagaggag cgcaggcagc gcagggctgg cacgtgacag 2160 gctcgtcagc cacctgggaa cacagttctg ggcaaagagg atccgaggtt gagaggaagg 2220 agggtcccgg tgtatcctgg ccctgggggt ctgggcgtcc agctcagccc tggcctggct 2280 gggtggtatt ctggtaggga tatggcagga ctcctggcag ggccacctgc aggaccctgt 2340 cctgcagtcc cacactgtgc agacccagtc ccacactgtg gccaggcctt acatctggct 2400 ggaaagcaga gcctcctggg aacacatctg gctgcacagg ctgaaatatc cacccagcag 2460 gcagagtggc gtggcctccc catgggcaca gtggtgaccc ccttgattcc caccgtacaa 2520 ccccctccac cccccactca gtgcctccac atgctgcctg gcacagacca ggcctttgac 2580 aaataaatgt tcaatggatg caaaaaaaaa aaaaaaaaaa 2620 <210> 5 <211> 7125 <212> RNA <213> SPAG17 mRNA <400> 5 gtggtagcgg ggacgcttag gcagggcctg cgcccagttt agaggccaat gcttctcccg 60 tcctttgcat ggcacccaag aaggagaaag gaggaactgt gaacaccagt tctaagatat 120 gggaaccctc gctcatagct gcacagttca atcagaacga ttggcaggcc tccattgctt 180 ttgtggttgg gaaccagatt gaagatgatc ttctcatcca agcccttacc gtggctgtcc 240 aggtccctca gcgtaaactc ttcagtatgg tgtcgtggca agacattctc cagcagatta 300 atgaaataaa tacacttgtt ggatctgctt catctaaaaa ggcaaaaaaa cctgtaggtg 360 gtaatgctcc tttatattat gaggtgttaa cggcagcaaa agcaattatg gatagtggag 420 agaaattaac cttaccactg atagggaaac tcttgaaatt tcaacttctc cagattaaat 480 ttaaggacca acagcgacgg gaaaatgaaa agaaggtaat agaagacaaa cctaagttag 540 aaaaggataa agggaaagca aaatctccca aggagaaaaa ggctccaagt gccaagcctg 600 ccaaaggaaa gggaaaggat cagcctgagg caaatgcacc agtgaaaaag accacccagt 660 taaagcggag aggagaagac gaccacacca atcgttacat tgacgatgag ccagatgatg 720 gtgcccaaca ttacattata gttgtgggct ttaacaatcc tcagctatta gcaattatgg 780 ctgagcttgg cattcctata accagcgtga ttaaaatatc ttcagagaat tatgaacctc 840 tgcagacaca cctggcagca gttaaccagc agcaggaagt tcttcttcag tcagaagatc 900 tagaagcaga aaaattgaag aaagaaaatg ccataaaaga gcttaaaact ttctggaagt 960 acttggaacc agtcctgaat aatgagaaac ctgaaacaaa tctctttgat gttgctcgac 1020 ttgagtacat ggtcaaagca gctgattttc cttctgactg gtcagatggt gagatgatgc 1080 tgaaattggg cactgatatt tttgaaaata ttgcctgctt gatgtatgac atcctggatt 1140 ggaaaaggca gcaccagcac tatttggaaa gcatgcagct tattaatgtt ccacaagtgg 1200 ttaatgagaa acctgtatta gaagccatgc caacttcaga ggctccacaa cctgctgtac 1260 cagctcctgg aaagaagaaa gcacagtatg aagaaccgca agctccacca ccagtgactt 1320 cagtcatcac aactgaagta gacatgagat attacaatta tttgctgaat ccaattcgag 1380 aggaattcat ttctgtgccc ctgatactgc attgtatgct ggaacaggtt gttgcaactg 1440 aagaagatct cgtcccaccc agtctgcggg agccatcccc cagagcagac gggctagacc 1500 acagaatcgc agctcacatt gtgtcccttc tgccctcact ctgtctctca gagagggaga 1560 aaaagaatct tcatgacata tttttatctg aagaagaaaa tgaaagcaaa gcagtgccca 1620 aaggccccct cctactgaac tatcatgatg cacacgccca caagaagtac gcactacagg 1680 accaaaagaa ttttgatcca gttcaaattg agcaggagat gcagtccaag ttgccactgt 1740 gggaatttct tcaattccct ctacccccac catggaacaa cactaaacgt ctagctacaa 1800 ttcatgagct tatgcacttt tgtacgagtg atgtcttgag ctggaatgaa gtagaacgag 1860 ccttcaaggt gtttactttt gagagcctga agctctctga ggttgatgaa aaagggaaac 1920 tgaaaccttc tgggatgatg tgtgggtcag attctgaaat gttcaacata ccgtgggaca 1980 accctgccag atttgctaaa cagataaggc agcaatatgt catgaaaatg aatactcaag 2040 aggccaagca gaaagcagat attaaaatca aagacagaac actatttgtg gatcagaatt 2100 tgtcaatgtc tgtgcaagat aatgaaagca accgagaacc ttcagatcct agtcagtgtg 2160 atgctaacaa tatgaagcat tctgacttga ataatctcaa actctcagtc cctgataata 2220 gacagctgtt agagcaggag agcatcatga aggctcagcc ccaacatgag tctctggagc 2280 agaccacaaa caatgagatc aaagatgatg cagtcacaaa ggctgattct catgaaaaga 2340 aacccaagaa gatgatggtg gaagcagatt tagaggacat aaagaaaaca cagcagcgca 2400 gtctaatgga ctggagtttt actgaacatt ttaaaccgaa agtactgctt caggtccttc 2460 aagaagccca taagcaatat aggtgtgttg attcttacta ccacacccaa gacaactctt 2520 tacttttagt ctttcacaat ccaatgaata gacaacgttt gcattgtgaa tattggaaca 2580 ttgctctcca ctccaatgtt ggattcagga attatttgga acttgttgca aaatctattc 2640 aagattggat tacaaaagaa gaagctatat atcaggaatc taaaatgaat gagaaaatca 2700 tcaggaccag agctgagctg gaattgaaat cttctgctaa tgccaaactt acttctgcta 2760 gcaaaatttt ttccattaaa gaatctaaaa gtaacaaagg aatcagcaaa acagagatat 2820 cagatcaaga aaaagaaaaa gagaaggaaa agattccttt cattttagaa ggctctctca 2880 aggcatggaa agaagagcaa catcgattag cagaagagga gcgcttaagg gaagaaaaga 2940 aagcagagaa gaagggtaaa gaagctggta aaaagaaagg caaggataac gcagagaaag 3000 aggatagtag gtctttgaag aaaaaatcac cttacaagga gaaatctaaa gaagaacaag 3060 tcaagatcca agaagtaaca gaagagtccc cccaccaacc agaacctaag ataacttacc 3120 cgtttcacgg atacaatatg ggaaatatac ccactcaaat ctcagggtca aattactacc 3180 tgtatccttc tgatgggggg cagattgaag tggaaaagac aatgtttgaa aaaggcccaa 3240 cttttatcaa agtgagagtg gtaaaggaca accacaattt tatgattcat ttaaatgacc 3300 ctaaggaaat tgtgaaaaag gaagagaaag gggattatta tttagaagag gaagaagaag 3360 gagatgagga acaaagtctt gaaacggaag tatcagatgc aaagaataaa gctttcagca 3420 agtttggatc tttttctgcc accttagaaa atggaatctg cctctcgata agttactatg 3480 gatcaaatgg aatggcacca gaagataagg atcctgattt agaaacaata ttgaatatcc 3540 cttcagcact cactccaaca gtggttcctg ttatagtgac cgttcctcaa agcaaagcta 3600 aagggaaaat aaaaggcaaa gaaaaaccca aagaatccct taaagaagaa gaacacccaa 3660 aagaagaaga gaaaaaggaa gaagaagtag aaccagaacc tgttttacaa gagactttgg 3720 atgttcccac cttccagagc ctaaatgtgt cttgccccag tgggctcctg ttgactttca 3780 ttggacaaga atctacaggt caatatgtta tagatgagga acccacctgg gacatcatgg 3840 tccgtcagag ctacccccag agggtgaagc actatgagtt ctataaaacg gtgatgccac 3900 ccgcagagca ggaggcttca agggttatca ccagtcaagg cactgttgtc aaatatatgt 3960 tggatggatc cacacagatt ctctttgcag atggtgctgt gagcaggagt cccaattcag 4020 gtcttatttg tcctccttct gaaatgccag caacgcctca cagtggagat ttgatggact 4080 ctatttctca gcagaaatca gaaacgatac catctgagat taccaacaca aagaaaggaa 4140 aaagtcacaa aagtcagtca tcaatggccc ataagggtga aatccatgac cctcctccag 4200 aggcagttca aactgtaact cctgtggagg ttcacatagg cacctggttt acaaccacac 4260 ctgaaggaaa tcggatcggc accaaaggat tagaaagaat agcagacttg accccattgt 4320 tatcctttca ggccacagat cctgtcaatg gaacggttat gacaactcga gaagacaaag 4380 ttgtcatagt tgaaaggaaa gatggtactc ggatagtgga tcatgctgat ggtaccagaa 4440 tcacaacctt ttatcaagtt tatgaagatc aaattattct gccagatgat caagaaacaa 4500 ccgagggtcc tcggactgtc accaggcagg tgaagtgtat gcgggtagaa agctcacgct 4560 atgccactgt tatcgccaac tgtgaggaca gtagctgctg tgccaccttt ggagatggaa 4620 caactattat tgcaaagcca cagggaacat accaggtgtt acctccaaac acaggctctc 4680 tttatattga caaggattgt tcagctgtgt actgccatga gtcaagcagt aatatatact 4740 atccttttca aaagcgtgag cagctgcgag ctggcaggta catcatgagg catacttcag 4800 aggttatctg tgaggttctg gatcctgagg gaaacacttt tcaggtcatg gctgatggta 4860 gcatatcaac tatattacct gaaaaaaaat tggaagatga tttaaatgag aaaactgagg 4920 gctatgatag tctgtcctct atgcaccttg aaaagaatca tcagcaaatc tatggtgaac 4980 atgtccccag gttttttgtt atgtatgctg atggatcagg aatggaactt cttcgagaca 5040 gtgacataga agaatatcta tctttggcat ataaagaatc aaatactgtt gttctccaag 5100 agccagtgca ggaacagcca ggcaccctaa ccatcacagt ccttcgccct ttccatgaag 5160 catcaccatg gcaagtaaaa aaggaagata caattgtccc tcctaatctc cggtcaaggt 5220 catgggaaac atttccctca gttgagaaaa aaactccagg acctccgttt ggtactcaga 5280 tttggaaagg cctttgcatt gagtccaaac agctagtgag tgccccgggt gccatactca 5340 agagccccag tgtgctacag atgcgccaat tcattcagca tgaggtcata aagaatgagg 5400 tgaaactgag gctgcaggtt tcccttaagg attacataaa ctatattcta aagaaagaag 5460 atgagctgca ggaaatgatg gttaaagatt ccagaactga ggaggagaga ggcaatgctg 5520 ctgatctcct caagctggtt atgtctttcc ctaaaatgga ggaaactaca aaaagtcatg 5580 ttactgaagt tgcagctcac ctaactgatt tattcaagca gtctttggct acgcctccaa 5640 aatgcccacc agacacattt ggtaaagatt tctttgaaaa gacatggaga cacacagcat 5700 cctcaaaacg ctggaaagaa aagatagaca aaacgaggaa ggaaattgag acaacacaga 5760 attacctaat ggatattaag aaccgcataa taccaccctt ttttaaatct gaattgaacc 5820 agttatatca gtctcagtat aatcacctgg acagtctttc caaaaaactg ccttctttta 5880 caaagaaaaa tgaagatgca aacgaaacag ctgttcaaga tacatctgat cttaatctag 5940 atttcaagcc acataaggtt tcagaacaga aatcctcaag tgtgcctagt cttccaaaac 6000 cagagatttc tgcagataag aaggatttca ctgctcagaa ccaaactgaa aatttaacaa 6060 aatctcctga agaagcagaa tcttatgagc ccgtgaaaat tccaacccag tccttgctgc 6120 aggatgttgc gggacaaaca agaaaagaaa aagtgaagtt gcctcattat ttgctgagtt 6180 ccaagcctaa gtctcaacct cttgcaaagg tgcaagattc tgttggagga aaagtgaaca 6240 catcctctgt tgcatctgct gccattaata atgcaaagtc atcccttttt gggttccatc 6300 ttctcccatc atcagtcaag tttggagtgc ttaaggaagg acatacctat gccacagttg 6360 taaagctcaa gaatgttgga gtggacttct gcaggtttaa agtaaagcag cccccaccca 6420 gcacaggact gaaagtgact tacaaacctg gacctgtggc agctggtatg cagacagaac 6480 tgaatataga gttatttgcc acagctgttg gagaggatgg ggccaaggga tcagcacaca 6540 tctctcacaa tatcgagatt atgacagagc atgaggttct gttcctacct gtggaagcaa 6600 ctgttttaac aagcagcaat tatgataaac gaccaaaaga ctttccccag ggaaaagaaa 6660 atccaatggt ccagagaact tctacaattt attcctccac acttggagtc ttcatgtctc 6720 gtaaagtttc tccacattag tttcttctcg gtacaactca atagcctcca taatcctctc 6780 agcctacaga ggatgagaaa ggaaagaagt catcacaaca tactccatca tcccaggaca 6840 ctgaaactgg aagaactgac cagaaatttg ccaaatgaaa tagcttcaat ctgtttaata 6900 aagacgtgcg aatagagtgc caaaaagcat ttaaagacat ttttggtttt cttatttttt 6960 aatgtacagg gaagagactg agtgtcatgg actcaggtgg gatgatatct agacactctg 7020 aatagggcag gtcccaggaa cacctgaaag gagcacatat tgatcaaaga gattcaggac 7080 tactcccatc tttggttaca agagaaggaa acaggttata atccc 7125 <210> 6 <211> 4138 <212> RNA <213> PLEKHM2 mRNA <400> 6 gcctccttcc ccgccggccg cgctccggag cctccgggcc gcggtggagc gagggcccag 60 gcgaggcgag ggccgggcgg cgggcgccgg gccccgcggc cggcacgacg gagcccccgt 120 acggccggcg gcagcggttg gcggcggccc ccggcccccg gcgcgggaag cggcggcggg 180 gcggcggcgg cggtggcggt ggcggtggcg gcgacggtgg cagcgccatg gagccggggg 240 aggtgaagga ccggatcctg gagaacatct cgctgtcggt gaagaagttg cagagctatt 300 ttgctgcatg tgaggatgag atccctgcca tccggaacca tgacaaggtc ctacagcgtc 360 tgtgtgagca cctggaccac gccctgctgt acggactgca agacctctcc tctggctact 420 gggtgctcgt ggtgcatttt actcggagag aggccatcaa gcagatcgag gtgctgcagc 480 acgtggccac caacctgggg cgcagccgtg cctggctgta cctggccctc aacgagaact 540 ccttggagag ctacctgcgg ttgttccagg agaacctggg cctgctgcat aagtactacg 600 tcaagaatgc cctggtctgc agccacgatc acctgacgct cttcctgacc ttggtgtccg 660 ggctagagtt cattcgtttc gagctggatc tggatgcccc ttacctagac ctggccccct 720 acatgcccga ctactacaaa cctcagtacc tgctggactt tgaagaccgc cttcccagct 780 cggtccacgg ctcagacagt ctgtccctca actctttcaa ctccgtcacc tccaccaacc 840 tggagtggga tgacagtgcg attgccccat ctagtgagga ttatgatttt ggagatgtgt 900 ttccagcagt gccgtctgta cccagcacag actgggaaga tggagacctc acagacacgg 960 tcagtggtcc ccgctccaca gcctccgacc tgaccagcag caaggcctcc accaggagcc 1020 ccacccagcg ccagaacccc ttcaacgagg agccggcaga gactgtgtcc tcctctgaca 1080 ccacccccgt gcacaccacc tctcaggaga aggaggaggc ccaggccctg gacccgccgg 1140 atgcctgcac ggagctcgag gtcatcaggg tcaccaagaa gaagaaaatt ggcaagaaga 1200 aaaagagcag atcagatgag gaggcaagtc cactccaccc cgcctgcagc cagaagaaat 1260 gtgccaagca gggggacggt gacagccgca acggcagccc aagccttggg cgggactcgc 1320 cagacactat gcttgcctcc ccccaggagg agggagaggg gccgagcagc accacggaga 1380 gcagcgagcg ctccgagccg ggcctgctga tccctgagat gaaggacacc tccatggagc 1440 gcttggggca gcccctgagc aaggttatcg accagctcaa cgggcagctg gaccccagca 1500 cctggtgctc ccgtgctgag cccccagacc agtcctttcg gaccggctct cccggggatg 1560 ccccggagag gccgccgctt tgcgacttta gtgaggggct ttcagcccca atggacttct 1620 accgctttac cgtcgagagt ccaagcactg ttacatcagg tggcggccac catgaccctg 1680 cagggcttgg ccaaccgctg catgttccta gtagccctga ggctgctggc caagaagaag 1740 agggaggagg aggagaggga cagacgcctc ggcccctaga ggataccacg agggaggctc 1800 aggagctgga ggcccagctg tccctggtca gggaggggcc tgtgtctgag ccagagcctg 1860 ggacccagga ggttctctgc cagctcaagc gagaccagcc cagcccgtgt ctgagtagcg 1920 ctgaggattc tggggtggat gagggacagg ggagcccttc ggagatggtc cattcctcgg 1980 agttcagagt agacaacaat cacctgctcc tgctcatgat ccacgtgttc cgagaaaacg 2040 aagagcagct gttcaaaatg atccggatga gcaccgggca catggagggc aacctgcagc 2100 tgctgtacgt gctgctcaca gactgctatg tctacctgct ccggaaaggg gccacagaga 2160 agccatacct ggtggaagag gccgtttctt acaatgaact tgactatgtg tcggttggcc 2220 ttgaccagca gacggtgaag ctggtgtgca ccaaccgcag gaagcagttt ctgctggaca 2280 cggctgatgt ggcgctggct gagttctttt tggcttcttt gaagtcagcc atgatcaaag 2340 gctgtcgaga acctccctac cccagcatcc tgacggatgc caccatggag aagctggcac 2400 tggccaaatt tgtggcccaa gaatcgaagt gtgaggcatc tgctgtcacc gtgcgcttct 2460 acggccttgt gcactgggag gaccccacag acgagtccct gggccccacg ccctgccact 2520 gctcaccccc cgagggcacc atcaccaaag aaggcatgct gcactacaag gcgggcacct 2580 cctacctggg caaggaacac tggaagacgt gcttcgtggt gctcagcaac gggatcctct 2640 accagtaccc ggaccgcacc gacgtcatcc ctctgctctc ggtgaacatg gggggggagc 2700 agtgcggtgg ctgccggaga gccaacacca cggatcggcc ccacgccttc caggtcattc 2760 tctccgaccg gccctgcctg gagctaagtg ccgagagcga ggccgagatg gccgagtgga 2820 tgcagcatct ctgccaggct gtgtccaaag gggtcatccc ccagggcgta gctcccagcc 2880 cctgcatacc ctgctgcctg gtcctcacgg atgaccgcct ctttacgtgc catgaggatt 2940 gccagaccag cttcttccgc tctttgggca cagccaagct gggcgacatc agcgccgtct 3000 ccaccgagcc gggcaaggag tactgcgtct tggagttctc ccaggacagc cagcagctcc 3060 tcccgccctg ggtcatctac ctgagctgca cttctgaact ggaccgattg ctgtctgcac 3120 tgaactctgg gtggaaaacc atctatcagg tggacctccc ccacacggcg atccaggaag 3180 cctccaacaa gaagaaattc gaggatgcct tgagcctcat ccacagcgcc tggcagcgga 3240 gcgacagtct ctgccgcggc cgagcctccc gagacccctg gtgctgaggc agagctggtt 3300 ggcgtccctg gtgggcagga aaggaaggca cgccagccgg caggcacact gtcacggctg 3360 ttgtcatgct gtcgggagcc tacagtccac ccctgccctg ggcggcagaa ccaccgagtg 3420 tggcttaaga cagggtccct ccactccagg gatccagatc aggtgcccgg cacccctggg 3480 catcctgccc gacaggtagc gaatggaggt cgctgggggc agagggtccg agccctgtgg 3540 gctctgcgga tgcacgccct cctcccgggc ctccgcctca gtctgcagaa tttctgccga 3600 gtggcaccga gaacaccatc catctaagga cgaacaaaag aaccaggagg gcgggacccc 3660 cctcttcctc tcctgggttg ggggctgggg ccctgagtgc ccagccatcc ttgttcgtgt 3720 ttgaacactc tcctggccac gtggggaagc gggaacacgg ggtgtctgcg catgtttcct 3780 cctcctagct ccatcactgc gcacacagct gcctgcctcg ccagatgcag gggggcgggc 3840 agccctccct ggctgccagg aggctctgca tgcccacagt cctgccctgc ctgtcccctc 3900 aacccggcag tgcctgtagc accgaggagc aaagggggtg gatggggggc ttggagaagg 3960 gcggagccca ccagcctggc atccatgttg acatcttctg actgtcccct gcttggctgg 4020 agccaggccc ttccctagag tttcgtcaag agcctcctgg ggaaggggtc aggtggtttg 4080 ggttttgttt tttaaaataa aatagacatg ttatattgcc aaaaaaaaaa aaaaaaaa 4138 <210> 7 <211> 1314 <212> RNA <213> CLEC4C mRNA <400> 7 cagtgattct cgtgcctcag cctcctgagt agccgaaatt acagacgtgt gccaccatgc 60 ttggctaatt ttttggattt ttagtagaga tggggtttca ctatgttggc caggctagtc 120 ttgaactcct ggcctgaagc aatccgccca cctcagcctc ccaaagtgct gagattatag 180 gcacgagcca ctacacctgg ccacaaaatt ctttaaagaa gccaatccca tcctccctca 240 agagccaagg ggccacctca ccctcttgtt acagcagatc ctgcctccca cagtcaccct 300 gctcccaagt gcaacctctg tctgaccctg catggtgtgc ggtgccctcc tgcctcaggc 360 cgcgaagaag gatctaaggg cttggcttgt ttgaaagaac cacaccccga aagtaacatc 420 tttggagaaa gtgatacaag agcttctgca cccacctgat agaggaagtc caaagggtgt 480 gcgcacacac aatggtgcct gaagaagagc ctcaagaccg agagaaagga ctctggtggt 540 tccagttgaa ggtctggtcc atggcagtcg tatccatctt gctcctcagt gtctgtttca 600 ctgtgagttc tgtggtgcct cacaatttta tgtatagcaa aactgtcaag aggctgtcca 660 agttacgaga gtatcaacag tatcatccaa gcctgacctg cgtcatggaa ggaaaggaca 720 tagaagattg gagctgctgc ccaacccctt ggacttcatt tcagtctagt tgctacttta 780 tttctactgg gatgcaatct tggactaaga gtcaaaagaa ctgttctgtg atgggggctg 840 atctggtggt gatcaacacc agggaagaac aggatttcat cattcagaat ctgaaaagaa 900 attcttctta ttttctgggg ctgtcagatc cagggggtcg gcgacattgg caatgggttg 960 accagacacc atacaatgaa aatgtcacat tctggcactc aggtgaaccc aataaccttg 1020 atgagcgttg tgcgataata aatttccgtt cttcagaaga atggggctgg aatgacattc 1080 actgtcatgt acctcagaag tcaatttgca agatgaagaa gatctacata taaatgaaat 1140 attctccctg gaaatgtgtt tgggttggca tccaccgttg tagaaagcta aattgatttt 1200 ttaatttatg tgtaagtttt gtacaaggaa tgcccctaaa atgtttcagc aggctgtcac 1260 ctattacact tatgatataa tccattcaca cattcattta ttcatttatt catt 1314 <210> 8 <211> 15643 <212> RNA <213> FRAS1 mRNA <400> 8 aactttaaaa agctgcttcg gacaaaccag agccaggatt tccactgtcg gggacccggg 60 atcggaaggg tctagcccga gggaaatgct ggaagatccc atcggccagt gaccagcaac 120 tttccggcga gattttgacg cggagaactg tgctctgcct cctcttattc tcccaaagct 180 cacgttggcg tcctgccttg cgggggaact cggcgcgctc tctgcctgag cagcgagtga 240 attgaacccc agcccgctcc ggcgcctccg ggctgatgag tgtcgctctc cgcccgtcca 300 tctctttttc ccggaggtaa aggcccgcgg tcccccacct tcagtgcgcc cgggttccaa 360 gcgccggagc cagcgttttg gcggagccgc ttcttggatg ctgaaggctg ggctcctcca 420 tcgtgggtgc cgaggcggcg atgggtgtcc tcaaagtgtg gctcgggctg gccctagcgt 480 tggcggaatt tgcagtattg cctcatcatt ccgaaggtgc ttgtgtctat caggattcct 540 tgttggcgga tgccacaatt tggaagcccg attcatgcca gagctgccgt tgccatggtg 600 atattgttat ctgcaaacct gctgtttgca gaaaccctca atgtgccttt gagaagggag 660 aagtgcttca aatagctgcc aaccaatgct gtcctgagtg tgttttgagg actccaggat 720 cttgccatca tgaaaagaaa atccatgagc atgggacaga atgggcctct tctccatgta 780 gtgtgtgctc ttgcaatcat ggggaagtcc gatgtacccc ccaaccatgc ccaccgctgt 840 catgtggaca ccaggagctg gcattcatcc ctgaaggaag ctgctgccca gtttgtgtgg 900 gccttgggaa accctgttcc tatgaaggcc atgtgtttca ggatggggag gactggcggc 960 tgagccggtg tgccaaatgt ctgtgtagaa atggggttgc ccagtgcttc acagctcagt 1020 gtcagcctct attttgtaac caggatgaga ctgtagtccg agtccctgga aaatgttgcc 1080 cgcagtgctc tgcaagatcc tgctctgcag ctggccaagt atacgagcat ggtgagcagt 1140 ggagcgaaaa tgcctgcacc acgtgtatat gtgaccgggg tgaggtcagg tgtcacaagc 1200 aggcctgcct gcccctgaga tgcggaaagg gtcagagcag ggctcggcgt catgggcaat 1260 gctgtgagga atgtgtgtct cctgccggga gctgctccta tgatggagtt gtgcggtacc 1320 aggacgaaat gtggaagggc tcggcctgtg agttctgcat gtgtgatcat ggccaagtga 1380 cctgccagac tggagagtgt gccaaagtgg agtgtgcccg ggatgaagaa ttaattcact 1440 tagatggaaa gtgttgtcct gaatgcattt caaggaatgg ttattgtgtt tatgaagaaa 1500 ctggagaatt tatgtcatca aatgctagtg aagttaaacg tattccagag ggagagaagt 1560 gggaagatgg cccttgcaag gtgtgtgagt gccgaggggc tcaggtaact tgctacgagc 1620 cctcttgccc accatgtcca gtgggcacac tggccttaga ggtgaaggga cagtgctgtc 1680 cagactgcac atcagttcat tgccatccag attgtttgac atgctctcag tctccagacc 1740 actgtgacct ctgccaagat cctaccaagt tactgcagaa tggatggtgt gtgcacagct 1800 gtggactggg tttttaccaa gctggcagtc tctgtttagc ctgccagccc cagtgctcca 1860 cgtgtaccag tgggctggag tgctcatcct gccagcctcc cctgctgatg cggcacgggc 1920 agtgtgtgcc tacctgtggg gacggcttct accaagatcg ccattcctgt gcagtctgcc 1980 atgagtcctg tgcaggttgc tggggcccaa cggagaagca ctgcttggcc tgcagagatc 2040 ccctccacgt gctgagagat ggcggctgtg agagcagctg tggaaaaggc ttctacaaca 2100 ggcagggcac ctgtagcgct tgtgaccaat cctgtgacag ttgtggcccc agtagcccca 2160 ggtgtcttac ctgtactgag aagacagtgc tgcatgatgg gaaatgcatg tctgaatgcc 2220 ctggcgggta ctatgctgat gccactggca ggtgcaaagt ttgtcataac tcatgtgcca 2280 gctgctctgg gcccacaccc tctcactgta cagcctgcag cccccccaag gctctgcgtc 2340 aaggccactg tctgccccgc tgtggagagg gtttctactc tgaccatgga gtctgcaaag 2400 cctgtcactc ctcctgcctg gcttgtatgg gtcccgcacc ctctcactgt actgggtgta 2460 agaagccaga ggaaggactg caagtggagc agctgtctga cgtgggcatc ccctctggcg 2520 agtgtctagc ccagtgtaga gcccattttt acttggagag cactggcata tgtgaagctt 2580 gccaccagtc ctgtttcaga tgtgcaggga aaagcccaca taactgcaca gactgtgggc 2640 cttcccatgt gctgttggat gggcagtgcc tctcccagtg cccagatggc tactttcacc 2700 aggaaggtag ttgcacagag tgtcacccaa cctgcaggca gtgtcatggg ccgttggagt 2760 ctgactgcat ctcctgttac cctcacatct ctcttaccaa tggtaactgc aggaccagct 2820 gcagggaaga gcagttcctc aacctcgtgg gatactgtgc tgactgccat cacctgtgcc 2880 agcactgtgc agctgatctc cacaacactg ggagcatctg cctcaggtgc cagaatgccc 2940 actacctgct gctcggggac cactgtgttc ctgactgccc ttcaggatac tatgcagaga 3000 gaggagcttg taaaaaatgc cactcctcct gcagaacctg ccagggcaga ggacctttct 3060 cctgctcctc atgtgacacc aacctcgtgc tgtcccacac tggcacctgc agcaccacct 3120 gcttccctgg gcactatctt gatgacaatc atgtttgcca gccatgcaac acacactgtg 3180 gaagctgtga ttcacaggcc agctgtacct cctgccgaga tccaaacaag gttctgctct 3240 ttggggaatg tcaatacgag agctgcgccc cacagtacta tcttgacttc tccaccaaca 3300 cgtgcaaaga gtgtgattgg agctgcagtg catgcagtgg gcccctgaaa acagactgcc 3360 tgcagtgcat ggatggctat gttctccagg atggggcctg cgtggagcag tgcttgtcat 3420 cattttacca ggactcgggc ctctgcaaga actgtgacag ctactgtctc cagtgccaag 3480 gtccccatga gtgtacccgc tgcaaagggc catttctcct cttggaagcc cagtgtgtcc 3540 aggaatgtgg gaaggggtac tttgcagatc atgcaaagca caaatgcaca gcctgccctc 3600 aggggtgctt gcagtgcagc cacagggacc gttgtcacct ctgtgaccat gggttctttc 3660 tgaagagtgg cctctgtgtt tacaactgtg ttcctggctt ttctgtccac acctctaatg 3720 aaacatgttc tggcaaaata cacaccccta gtcttcatgt gaatggttcc ctgatcctcc 3780 caattggttc aataaagcca ctggattttt ccctcctgaa tgtccaagac caggagggta 3840 gggtcgaaga tctcctattt catgttgtga gcactcccac caatggtcag ctagtgctct 3900 caagaaatgg aaaagaggtt cagctggaca aggctggccg ttttagctgg aaagatgtga 3960 acgagaagaa agtgcgtttt gtgcacagca aagaaaaact caggaaaggt taccttttcc 4020 tgaaaattag tgaccagcag ttcttctctg agccacagct gatcaacata caagcatttt 4080 caacacaggc cccctatgtg ctgagaaatg aagttctcca cattagcaga ggagagaggg 4140 caaccatcac cacccagatg cttgacatcc gagatgatga caacccacag gatgtggtca 4200 ttgaaataat cgatcctcca cttcatggcc aattgcttca gacacttcag tccccggcaa 4260 cccctatcta tcaattccag ctggatgaac tctctagagg ccttctccac tatgctcatg 4320 atggttcaga cagcacatcc gatgttgcag tcttgcaggc caatgatgga cactccttcc 4380 ataatatact gttccaagtg aagaccgtgc ctcagaatga caggggtctt cagcttgtgg 4440 ctaattcgat ggtgtgggtt ccagaagggg ggatgctgca gatcaccaac agaatcttac 4500 aggccgaggc tcctggtgcc agtgctgaag aaatcatcta caagattaca caagactacc 4560 cccagtttgg ggaggtggtc cttctagtga atatgcctgc agacagccct gcagatgaag 4620 ggcagcacct gcctgatggg aggacagcta cccccaccag caccttcacc cagcaggaca 4680 tcaatgaagg catcgtatgg tacaggcact caggagcccc agcccagagc gactccttcc 4740 gcttcgaggt gtccagtgcc tccaatgccc agacccgcct ggagagccac atgttcaaca 4800 tcgcgatctt accacagaca cctgaagcac ctaaagtgtc tctggaagca tctctccata 4860 tgactgctag agaagatggc ctgactgtta ttcagcctca ttccctctcc ttcataaact 4920 ctgagaagcc aagtggaaag attgtctaca acatcactct acctctgcat ccaaatcaag 4980 gtatcatcga gcaccgggac caccctcact ctcctatccg gtatttcacg caagaggata 5040 ttaaccaggg caaagtcatg taccgccctc ccccggcagc accccacctc caggagctca 5100 tggccttctc gttcgctggt ctcccagaat cagtgaaatt ccacttcaca gtttcagatg 5160 gagaacacac aagtccggag atggtcctca ccattcactt acttcccagt gatcagcaac 5220 tgccagtgtt ccaggtcaca gctccacggc tggcggtcag cccaggaggc agcacttctg 5280 taggacttca ggtggtagta agagatgctg agacagcgcc caaagaactc ttctttgagc 5340 ttcggagacc tccacagcat ggtgtgcttc ttaagcatac agctgagttc cgaaggccga 5400 tggccacagg tgacactttc acctatgagg atgttgagaa aaatgctcta cagtatatac 5460 atgatggttc ctctacccgg gaagacagca tggagatctc agtcacagat ggcctcacag 5520 tgacaatgct ggaggtgaga gtagaggtgt ccctgtcaga agaccgaggg cctcgactgg 5580 ctgctggctc ctctctgagc attactgttg ccagtaaaag cacagccata atcactaggt 5640 cacaccttgc ttacgtggat gattcttccc ccgacccaga gatctggatt cagttaaatt 5700 atctgccctc atatggtact ctcttaagaa tctcaggatc tgaggtggaa gagctctcag 5760 aagtttccaa tttcacaatg gaagacatca ataacaagaa aatcagatac tcagctgtgt 5820 ttgaaactga tggtcatctg gttactgata gcttctattt ctctgtctct gacatggacc 5880 acaaccatct ggataatcag atatttacca tcatgatcac tcctgctgaa aatccacctc 5940 cagtcattgc ttttgctgac cttatcacgg ttgatgaggg agggagagca ccactctcat 6000 ttcaccattt ttttgctact gatgatgatg acaacctcca gagagatgcc atcattaaac 6060 taagtgctct gcccaaatat ggctgcattg agaacacagg aacaggtgat cgttttggcc 6120 ctgaaactgc cagtgaccta gaggcatcat ttcctattca agacgtcctg gaaaactaca 6180 tttactactt tcagagtgtt catgaaagca ttgagccaac ccatgatatt tttagttttt 6240 atgtgagtga tggaaccagt cgttcagaaa ttcacagcat caatatcacc attgagagga 6300 agaacgatga gcctcccagg atgaccttgc agcccctcag agtgcagctg agctcgggag 6360 tggtgataag caattcttct ttgagcctgc aagacctgga caccccagat aatgagctca 6420 tttttgtatt gacaaaaaag cctgaccacg gtcatgtact ctggaggcaa actgcttctg 6480 agcctctgga gaatgggaga gttttagtcc agggctcaac cttcacctac caggatatcc 6540 tagctgggct ggttgggtat gtgcctagtg tccctggcat ggtcgtggat gagttccagt 6600 tctccctcac tgatggcctc cacgtggaca cagggaggat gaagatctac acagaactgc 6660 ctgcaagtga cacacctcac ttggctataa accaaggcct acagctctca gcagggtctg 6720 tagcacgcat cacagaacag cacttgaaag tgacagatat tgactcagat gaccatcagg 6780 ttatgtacat catgaaggaa gatcctggtg cagggcgcct gcagatgatg aagcatggca 6840 acctggagca aatttctatt aaaggcccca tccgaagttt cacccaggca gacattagcc 6900 aaggccacgt agaatatagt catggaacag gagaacctgg agggagcttt gcttttaaat 6960 ttgatgtggt tgatggagaa ggcaacagat tgattgacaa gtcattttcc atcagcattc 7020 tagaagacaa atccccacca gtcatcacca ccaataaagg actggtcttg gatgaaaact 7080 cagtgaagaa aatcaccacc ctgcagctgt ctgccactga ccaggacagt gggcctacag 7140 aattgatcta cagaatcacc agacagcccc agctgggcca cttggaacat gcagcatcac 7200 caggtatcca gattagttcc tttactcaag ctgatctgac ttcacgaaat gttcagtatg 7260 tccattctag tgaggctgag aaacattcag atgccttcag ctttacactg tctgatggag 7320 tcagtgaggt gactcagact ttccatatca ctcttcaccc tgtcgatgat tcgctgcccg 7380 tcgtacagaa cttaggaatg cgggtgcagg agggcatgag gaagaccatc acagagtttg 7440 agcttaaggc ggtggatgct gacacagagg ccgagtctgt cacattcacc atcgtgcagc 7500 ctccacgcca tggcaccatc gagcgaacca gcaatgggca gcatttccac ctcacctcca 7560 ccttcaccat gaaagatatc taccagaacc gggtcagcta cagccatgac ggcagtaact 7620 ccctcaagga ccggttcacc ttcactgttt ctgatgggac aaaccccttc tttatcattg 7680 aggaaggggg aaaagagatt atgacagcag cacctcagcc gttccgagta gacatcctcc 7740 cggtagatga tggcacgcct agaattgtca ccaacctggg actccagtgg ctggaataca 7800 tggatggcaa ggcaaccaac ctgatcacca agaaggaact gctgaccatg gacccagaca 7860 ccgaggacgc gcagcttgtc tatgagataa cgacgggccc taagcatggc tttgtggaga 7920 acaagctgca gcctggcaga gctgctgcca ctttcaccca ggaggatgtg aacttggggt 7980 tgattcgtta tgtgttgcac aaggagaaga tccgtgagat gatggatagt tttcagtttc 8040 tggtgaaaga cagtaaaccc aatgtggtca gcgacaatgt cttccatatc cagtggtcac 8100 tcatcagctt taaatatacc agctacaatg tcagtgagaa ggcagggtct gtcagtgtca 8160 cggtgcagag gactgggaac ctgaaccaat atgccatcgt cctgtgtcgc accgagcaag 8220 gcaccgccag ctccagctcc agggtcagct cccaacctgg gcaacaggac tatgtagagt 8280 atgctggcca ggtccagttt gatgagcgag aggacaccaa gtcctgcacc attgtcatca 8340 acgatgatga cgtgtttgaa aatgttgaga gtttcactgt ggagctcagc atgccagctt 8400 atgccctgtt aggggaattc acccaggcga aggtcattat caacgatacc gaggatgaac 8460 ccacattaga gtttgacaag aagatctact gggttaacga gagcgctggt tttctgtttg 8520 cacctattga aagaaaagga gatgcaagca gcattgtatc tgcaatttgc tacacagtcc 8580 ctaagtcagc tatgggaagt agcctctatg ctctagaatc aggctctgat tttaaatcta 8640 gagggatgtc tgccgcgagt cgtgtgatat tcgggcctgg tgtgaccatg tccacctgtg 8700 atgtcatgct tattgatgac agcgagtatg aagaggaaga agagtttgag attgccttgg 8760 cagatgcctc tgacaatgcc cgcattggaa gggtggcgac agccaaggtg ctcattagtg 8820 gtcccaacga tgcctcgact gtgtccctgg gcaacacggc tttcactgtc agtgaggacg 8880 caggcacagt aaagattcca gttatccgcc atggtactga cctctctact ttcgcatctg 8940 tctggtgtgc aacgcggccc tcagacccag cttctgccac accaggagtt gactacgttc 9000 ccagctctcg gaaggtggaa tttgggcctg gtgtcattga acagtattgc accttgacta 9060 tcttggatga cactcagtat ccggtaattg aaggactgga gacatttgtg gttttcctca 9120 gctcagcaca aggagccgaa ctgaccaaac ccttccaggc agtcattgca attaatgaca 9180 cattccaaga tgtgcccagc atgcagtttg ccaaggattt gctcctagtg aaggagaagg 9240 agggtgtcct gcatgtccct atcactcgga gcggagacct gagctatgag tcatcagtga 9300 ggtgctatac tcagagccat tccgctcagg tcatggagga ctttgaggag agacaaaatg 9360 cagactcttc acggattaca tttctcaaag gggacaaagt gaagaactgt acggtctata 9420 tccacgatga ctccatgttt gagccagagg aacagttcag ggtctacctc ggccttcctc 9480 ttggaaacca ctggagtgga gctagaattg gaaagaataa catggccacc atcaccatat 9540 ccaatgatga agatgccccc accattgagt ttgaagaagc tgcataccaa gtccgggaac 9600 ccgcaggccc agatgccatt gcgattctga acatcaaggt gatccgcaga ggggatcaga 9660 acaggacctc caaggttcgc tgcagcacgc gggatggctc tgcccagtct ggtgtggatt 9720 attacccaaa gagccgagtc ttgaagttca gtcccggtgt ggatcatatc ttttttaaag 9780 ttgagatcct gtccaatgaa gaccgggaat ggcatgaatc tttctcacta gtccttggcc 9840 cagatgaccc agtggaagca gttcttgggg atgtgactac tgccacggtg acaattctag 9900 accaggaggc agcagggagc ctcatattgc cagcaccacc cattgtggtc acacttgctg 9960 actatgacca tgtggaagaa gttaccaagg aaggagtcaa gaaatccccc tccccaggct 10020 acccactggt ctgtgtcacc ccctgcgacc ctcatttccc cagatacgct gtcatgaagg 10080 agcgctgcag tgaggccggc atcaaccaga catctgtgca gttcagctgg gaagtggctg 10140 cccccactga tggcaatggg gcccggtctc cctttgaaac catcactgac aacacaccat 10200 tcaccagtgt caaccacatg gtcctggaca gcatttactt cagccggagg ttccatgtgc 10260 gttgtgtggc caaggctgtg gacaaggtgg gccatgtggg gaccccctta aggagcaaca 10320 ttgttaccat tggaacagac agtgctatct gccacacacc agtggtggct gggacatcca 10380 gaggcttcca ggctcagtcc ttcatcgcaa ccttgaaata cctggatgtc aaacataagg 10440 agcatccgaa cagaatccac atttcggtgc agatcccaca ccaggatgga atgctgcccc 10500 ttatctccac catgccgttg cacaacttac attttctact gtctgagtcc atctacagac 10560 accagcacgt ctgctccaat ttagttacca cctatgacct gagaggcatc tcagaggcag 10620 ggttcctgga tgatgtggtc tatgatagca ctgccctggg gcctggctac gatcgcccct 10680 tccagtttga ccccagcgtg cgagagccga agaccatcca gctctacaaa cacctgaacc 10740 tgaagagctg cgtgtggacc tttgatgctt attatgacat gactgagctg attgacgtct 10800 gtgggggctc tgtaaccgct gacttccagg tgagggactc tgcccagtcc ttcttgacag 10860 tgcacgtgcc tctatatgtg tcctacatct atgtgacagc ccccaggggc tgggcctcct 10920 tggagcacca caccgagatg gagttttctt tcttctatga cactgttctc tggagaacag 10980 gaatccagac agacagcgtg ctctctgcaa ggcttcagat aataagaatc tacattcgag 11040 aggatggccg tcttgtcatt gaattcaaga cccatgccaa attcagagga cagtttgtga 11100 tggagcatca cactctccca gaagtgaaat ctttcgtatt gactccagac cacctaggag 11160 gaattgaatt tgacttgcag ctattatgga gcgctcagac ttttgattct ccacatcaac 11220 tctggagagc cacaagctct tataacagga aggactactc aggagagtac accatctacc 11280 tgatcccttg cacagtgcag cccacacagc catgggttga cccaggagag aagcctttgg 11340 cctgcactgc acatgcccca gaaagattcc tgatacccat tgcattccag cagaccaacc 11400 gccctgtgcc agttgtgtat tcacttaaca ctgaatttca gctctgcaat aatgagaagg 11460 tgttcctaat ggatcccaat acatctgata tgtcactagc agaaatggat tacaaaggag 11520 ccttttcaaa aggtcaaatc ctttatggcc gagtactttg gaatccagaa caaaatctta 11580 attctgctta caaactccag ctggagaaag tctatctttg tacgggcaag gatggttatg 11640 tgcctttctt tgatcccacg gggacaatct acaatgaagg gccccagtat ggatgcattc 11700 agccaaacaa acacctaaaa cacagattcc tgctgttgga ccgcaatcag ccagaggtaa 11760 ctgataagta cttccatgat gtgccttttg aggctcactt tgcctctgag ttgcctgatt 11820 tccatgtggt cagtaacatg ccaggtgtgg atggatttac tctaaaagta gatgcactct 11880 ataaggtgga agcaggacac cagtggtatc tccaggtcat ctacatcatt ggccctgaca 11940 ccatctcagg gccccgggtc cagcgctctc tcacagctcc actcagacgc aaccgaaggg 12000 acctggtaga gcccgatggc cagctgatcc ttgatgattc cctcatctat gacaatgaag 12060 gagaccaagt caagaatggc accaatatga agtccctgaa tctggagatg caagagttgg 12120 cggtagctgc gtccctgtca cagactgggg cgtccattgg cagtgccctg gctgcaatca 12180 tgcttctact tctggtgttt ttggtggctt gttttatcaa caggaaatgc cagaaacaga 12240 ggaagaagaa gcccgcagag gacattttgg aagaatatcc tctgaatacc aaggtagaag 12300 tgcccaagag gcacccggac cgggtggaga agaacgtgaa tagacactac tgcactgtgc 12360 ggaacgtcaa catcctgagt gagcctgagg cggcttacac gttcaaaggt gctaaagtca 12420 aaagactgaa tctagaagtc agagttcaca acaatttaca agatggaaca gaagtttaat 12480 ggaggagacc tatgtgtatt tttttctaaa atcattttta taaaatgggg ggaaatactg 12540 gtatttttat aatctcgcag ataaaaaagg gaaaactata gctttgagtg gcagacagca 12600 cacatcacat gcatcaactc acaactgagc tacctcattc agcaaagaac cactgagaac 12660 cccagagtat tacagttatt tccgtagatc cctttaatag tgtcaacaac tgtacacagc 12720 tccttctgta aggctggtct tagaaaacaa gtactttagt atcaggacag gagttgaaca 12780 attaggttag cagatggaga tgagaggact gggtagagta ccatggcaga tctcagagag 12840 aagaagtagg tacgggcctt tggttccctc ccccagcccc agctttctcc tacagggctt 12900 ttcctgagtc cccagacagc agagtatgaa ctgctgacac ccagattcca ttaaaaattc 12960 tgctaatcga cacaacacat atatttgctc atgatttcac ttgacagcgt atgctccttg 13020 gcctctaatt gtactttgct tttccagagc cctttttacc tggggatttc agtgtgctta 13080 agtaaaatcc tctgaaaacc acgggagcct ctgcctcctc agccacagag aactccctcc 13140 tacaaagggg gagactgaaa cccgagttaa ggaggggcct ggcaggcgta tcagagcaca 13200 ttagtgatgc ccttcacccc agggaggtgt ctgttcccaa ctagtttatg tggcactgag 13260 acatccatcc ctgaccaagg atgctgcgaa acaggatcaa tgtactacgg ccttttaatt 13320 caacattgcc ataaatgctt taaagaaaac ccaccacact ttcctcctac tccggtcttt 13380 gcccgttcct gtaacagaca atcccatgtc ctaggtatgg ttttttattc tgttagtgct 13440 tcgggaaagt aagtgattca tttgaataag gcaaattagg agaaagccca ggttggggtg 13500 aaatcagact taacagatac atgctggttc tccttgctgt gtgtgacaca gcagacagag 13560 gcactattcc tggtgcagta tttcagggat ttctctttga ggggttcttt tctggtagct 13620 caggcaatta tttttaccat atcagcacat gacaaggcca tgaacacatg gctctaaaat 13680 aatttagtgt tcaagtatca gcttaactat tttgtgtagg ctacacacag cttgcttttg 13740 tttctcttct gtttctgcct tattggcgga aacataagcg tgcatgccat gttgttttga 13800 attggaggca caatttcatt attcgagagt aaaagacatg tcctcttctg atgcatggca 13860 caccatagtc accaagcaaa taacagagcc ttcacattgt gtaatatttg tatgagaatg 13920 actcaagctc tttgagaaca ttccaaacta gtaacatttc gctactaaaa gctagaaagg 13980 atgaactgtg aaaggttcta ggcagctctg tgagactcca agctccttga aagtaggacc 14040 tttgtgagcc acgcctttca ttcttcaaca gtgccttgca tgtaacaagc actccagaaa 14100 tgtttgttga atgaatgaat ggtgtcatgg gtgaatgatg gggagtaaat ttaggaaggg 14160 gaagtgagag agtatggtgg caatatcaca agggaggaga gaggaaaaca attatcttct 14220 ctacttggat tatgagataa ccttttcttg gaggaaagaa acaccgcttt acaaaggcat 14280 gactctggcg gtggtcctaa ggaagcatga gcagaaaatt cataaaaatg tatcatcagc 14340 aggagatgag actatgaatt ggcatccaga acaggagatt tagagcaaaa tctaatttag 14400 cattctgaga tgagtgtcag gttttcagga gagaatgagt tggggtgagc ccagagtctg 14460 aaactcctga ctggtcaggt gctacttaag accagcttgg gcaattcagg gcagaactcc 14520 tgtatcagcc tcatggacac ccagaattgg tatctcatgg ctggagagct gatcagccag 14580 gcacagaatc tccagaacaa cctagagagt gaatgctaat ttgtagagcg aacttccatt 14640 tggcccatta tttgtaactg tgtaactgct ccaagtgcca gaatgcttac acgttaaagc 14700 agcacctttc catttgccca catattcttc ttgcacaccc cttccattac tgctgaatag 14760 gacattgcat gggaagagta cagaggtggc agaatgaagc tagagtggga aggactaaag 14820 actgagcccc agagtgctcc cagcaaccgc cacgtacaag gtctgaaatg acaagggcaa 14880 gagtgagata ggaaactgtg tgtgaaagga aagcccttgc agtatttctg cctccctttc 14940 tttctgcctt tcaccccact aaatgtatgt tattgaatgc cagtacttct ctagtggatg 15000 cacacttgtt aaatagtgtt aagagatgtg gagatgagat ataccccttt gatgtagaat 15060 tattcatttg gtttgtttca tacttcatta taggaatcaa gtaatttgat gactaatgtg 15120 gattatattt cagtcaaagc tctgctttca atttctctga tttgctcact aatgccttgt 15180 gtgtgtttta ctaacctttt atatcttgcc ttcaagtgag aaggaacaaa caactctcag 15240 tggttactac ttgcttttat atgctggctg tgaaggttaa aagaaagaat ggtctgtacc 15300 attctgcttt gctgcccttt tattgtaccc caggcctcct agaggactcc tgcagattct 15360 attgttgggt gggaaatagt gttggaatgt gtttgcacag tcttatgata ttcagtctca 15420 gtctgctata ggtatttgtt attcttggat actacacacc tgctcagact gagtaaacat 15480 ttgtggtgct gtcaacctga tttcttgact ctcaaatgat ttttgtattt ccaatatgaa 15540 tttgtgtgtt atgaatttct gatttctcca atagtatatg ccactatata aatttgtatt 15600 aataaatgac agtcttgttg gtttaaaaaa aaaaaaaaaa aaa 15643 <210> 9 <211> 6141 <212> RNA <213> ADGRL3 mRNA <400> 9 gtttcagatt tgggatattg gtgtttctgt tttggagaaa ttattctttt tctttttaat 60 ttgaagaaaa atcatcagtc ttggaataca gaagagaaac tagaaatata cgtattttgt 120 ttcacatttg aacagtcatt cttgaggaat actccatacc tgagtagaca gccatgtggc 180 catcgcagct actaattttc atgatgctct tagctccaat aattcatgct ttcagccgtg 240 ccccaattcc aatggctgtg gtccgcagag agctatcctg tgagagctat cctatagagc 300 ttcgctgtcc aggaacagac gtcatcatga tagaaagtgc caactatggc aggactgatg 360 acaaaatttg tgactctgac cctgctcaga tggagaatat ccgatgttat ctgccagatg 420 cctataagat tatgtctcaa agatgcaata acagaaccca gtgtgcagtg gtggcaggtc 480 ctgatgtttt tccagacccg tgtccaggaa cctataaata ccttgaagtg cagtatgaat 540 gtgtccctta caaagtggaa caaaaagttt ttctttgtcc tggactacta aaaggagtat 600 accagagtga acatttgttt gagtccgacc accaatctgg ggcgtggtgc aaagaccctc 660 tgcaggcatc tgacaagatt tattatatgc cctggactcc ctacagaact gataccctga 720 ctgagtattc atccaaggat gacttcattg ctggaagacc aactacaacc tacaagctcc 780 ctcacagggt ggatggcaca ggatttgtag tgtatgatgg agctttgttc ttcaacaaag 840 agcgcaccag gaacatagta aagtttgatt tgcggactag gataaagagt ggagaggcta 900 tcatagcaaa tgccaattac catgatacct ccccttaccg atggggaggc aaatctgaca 960 tagacctggc agtagatgag aatgggctat gggtaatcta tgcaacagaa caaaacaatg 1020 gtaaaattgt cattagtcaa ttgaaccctt acaccctacg gatcgaagga acatgggata 1080 ctgcatatga taaaaggtca gcttccaatg cctttatgat ttgtggaatt ctgtatgtgg 1140 tcaaatctgt atatgaggat gatgacaatg aggctactgg aaataagatt gactacattt 1200 acaacactga ccaaagcaag gatagtttgg tggatgtacc ctttcctaat tcataccagt 1260 acattgcagc tgtggattac aaccccaggg acaacctact ttatgtatgg aataactatc 1320 acgtcgtgaa atattctttg gattttggac ctctggatag tagatcaggg caggcacatc 1380 atggacaagt ttcatacatt tctccgccaa ttcaccttga ctctgagcta gaaagaccct 1440 ctgttaaaga tatctctacc acaggacctc ttggcatggg aagcactacc accagtacca 1500 cccttcggac cacaactttg agcccaggaa ggagtaccac cccgtcagtg tcaggaagaa 1560 gaaaccggag tactagtacc ccatctccag ctgtcgaggt acttgatgac atgaccacac 1620 accttccatc agcatcgtcc caaatcccag ctctcgaaga gagctgtgag gctgtggaag 1680 cccgagaaat catgtggttt aagactcgtc aaggacagat agcaaagcag ccatgccctg 1740 caggaactat aggtgtatca acttatctat gccttgctcc tgatggaatt tgggatcccc 1800 aaggtccaga tctcagcaac tgttcttctc cttgggtcaa tcatataaca cagaagttga 1860 aatctggtga aacagctgcc aacattgcta gagagctggc tgaacagaca agaaatcact 1920 tgaatgctgg ggacatcacc tactctgtcc gggccatgga ccagctggta ggcctcctag 1980 atgtacagct tcggaacttg accccaggtg gaaaagatag tgctgcccgg agtttgaaca 2040 agcttcagaa aagagagcgc tcttgcagag cctatgtcca ggcaatggtc gagacagtta 2100 acaacctcct tcagccacaa gctttgaatg catggagaga cctgactacg agtgatcagc 2160 tgcgtgcggc caccatgttg cttcatactg tggaggaaag tgcttttgtg ctggctgata 2220 accttttgaa gactgacatt gtcagggaga atacagacaa tattaaattg gaagttgcaa 2280 gactgagcac agaaggaaac ttagaagacc taaaatttcc agaaaacatg ggccatggaa 2340 gcactatcca gctgtctgca aataccttaa agcaaaatgg ccgaaatgga gagatcagag 2400 tggcctttgt cctgtataac aacttgggtc cttatttatc cacggagaat gccagtatga 2460 agttgggaac ggaagctttg tccacaaatc attctgttat tgtcaattcc cctgttatta 2520 cggcagcaat aaacaaagag ttcagtaaca aggtttattt ggctgatcct gtggtattta 2580 ctgttaaaca tatcaagcag tcagaggaaa atttcaaccc taactgttca ttttggagct 2640 actccaagcg tacaatgaca ggttattggt caacacaagg ctgtcggctc ctgacaacaa 2700 ataagacaca tactacatgc tcttgtaacc acctaacaaa ttttgcagta ctgatggcac 2760 atgtggaagt taagcacagt gatgcggtcc atgacctcct tctggatgtg atcacgtggg 2820 ttggaatttt gctgtccctt gtttgtctcc tgatttgcat cttcacattt tgctttttcc 2880 gggggctcca gagtgaccgt aacaccatcc acaagaacct ctgcatcagt ctctttgtag 2940 cagagctgct cttcctgatt gggatcaacc gaactgacca accaattgcc tgtgctgttt 3000 tcgctgccct gttacatttc ttcttcttgg ctgccttcac ctggatgttc ctggaggggg 3060 tgcagcttta tatcatgctg gtggaggttt ttgagagtga acattcacgt aggaaatact 3120 tttatctggt cggctatggg atgcctgcac tcattgtggc tgtgtcagct gcagtagact 3180 acaggagtta tggaacagat aaagtatgtt ggctccgact tgacacctac ttcatttgga 3240 gttttatagg accagcaact ttgataatta tgcttaatgt aatcttcctt gggattgctt 3300 tatataaaat gtttcatcat actgctatac tgaaacctga atcaggctgt cttgataaca 3360 tcaactatga ggataacaga cccttcatca agtcatgggt tataggtgca atagctcttc 3420 tctgcctatt aggattgacc tgggcctttg gactcatgta tattaatgaa agcacagtca 3480 tcatggccta tctcttcacc attttcaatt ctctacaggg aatgtttata tttattttcc 3540 attgtgtcct acagaagaag gtacgaaaag agtatgggaa atgcctgcga acacattgct 3600 gtagtggcaa aagtacagag agttccattg gttcagggaa aacatctggt tctcgaactc 3660 ctggacgcta ctccacaggc tcacagagcc gaatccgtag aatgtggaat gacacggttc 3720 gaaagcagtc agagtcttcc tttattactg gagacataaa cagttcagcg tcactcaaca 3780 gagaggggct tctgaacaat gccagggata caagtgtcat ggatactcta ccactgaatg 3840 gtaaccatgg caatagttac agcattgcca gcggcgaata cctgagcaac tgtgtgcaaa 3900 tcatagaccg tggctataac cataacgaga ccgccctaga gaaaaagatt ctgaaggaac 3960 tcacttccaa ctatatccct tcttacctga acaaccatga gcgctccagt gaacagaaca 4020 ggaatctgat gaacaagctg gtgaataacc ttggcagtgg aagggaagat gatgccattg 4080 tcctggatga tgccacctcg tttaaccacg aggagagttt gggcctggaa ctcattcatg 4140 aggaatctga tgctcctttg ctgcccccaa gagtatactc caccgagaac caccagccac 4200 accattatac cagaaggcgg atcccccaag accacagtga gagctttttc cctttgctaa 4260 ccaacgagca cacagaagat ctccagtcac cccatagaga ctctctctat accagcatgc 4320 cgacactggc tggtgtggcc gccacagaga gtgttaccac cagcacccag accgaacccc 4380 caccggccaa atgtggtgat gccgaagatg tttactacaa aagcatgcca aacctaggct 4440 ccagaaacca cgtccatcag ctgcatactt actaccagct aggtcgcggc agcagtgatg 4500 gatttatagt tcctccaaac aaagatggga cccctcccga gggaagttca aaaggaccgg 4560 ctcatttggt cactagtcta tagaagatga cacagaaatt ggaaccaaca aaactgctaa 4620 caccttgttg actgttctga gttgatataa gcagtggtaa taatgtgtgt actcctaaat 4680 ctttatgctg tcctctaaag acaaacacaa actctcagac tttttttttt ttaatgggat 4740 ttttaggtca gcccagggga gaaagataac tgctaaaatt cccctgtacc ccatcctttc 4800 ttgtcctttc cccttcagat ggagacttca ttatgttaat gaacaagata tgaagaaaat 4860 ggcactcatt gtggccttgt tgaattatgt tgtgtatgtt ttaacatctc tgatgctgtg 4920 ttactaaaat tacaaggacc tgctttttaa aaggccagaa caattgtctg aaattagtaa 4980 caatgctgca tctagattgg agtgctgcac aaacaaacat aagagcaaag caaaactgta 5040 tcacataggg tttttggtca ctcacaacct gaattcacca cagctggaat agctgtggaa 5100 aacaaaataa aacaacaaaa ttaataatga aatggagggg aattctagaa ttatatgcta 5160 aatgcatatt ttatgatttg ctgtattaac tgatgataaa actaatggca gaaaaagaag 5220 ttgagcaatt tctatgtaat gtacagatac tagcattgca catatagtct gctttctgtt 5280 cctccagaat ttgagtcctg ttaatgtagt agaaaaaaaa aaaagaaatt ttctttttct 5340 tttgtgctgg tcttgcaagt ttgtctacca gtaagagagc aaagtttcct tcctttcttc 5400 tctttcttca ttttcttttt ttcttttttg ccttttattc ctttaaaatt tcgcctggca 5460 aaaaataaat aaatggaact atcactttat aagaatcatt ttctagtaat gcaaacaaat 5520 tattttttac aaaaaaacaa aataaataaa attagacttc cttccctcac tatatatctt 5580 tatgcagtca gaatatttcc aacagtgttt tttgcaaatt agagcaggac aaacttttat 5640 gtttacaggg cacgtctgtt gtaatgcaaa gcatatttgg caagcagttc atcaccagga 5700 cactagctat gattctagaa gtcaaaaggt gtctatagaa ctagtggggc ttctgcatgt 5760 gaaaaacggt tttccatagg cattaaagtg ctgaatgctc agtctgatca acaagtgggc 5820 acctgcacta ccacttttta gaggaaattc actccctcgt aagcattgga aggtcaaatt 5880 attttgaagt gattttttta aaaaaaagtc ttctgtttat taacaggaaa atttatttat 5940 ttgacaggat tttgagtaat gtaggaatac aaaaggtaaa ttagcagcac atataatttt 6000 tttttaattt atgatccatt ttgtatggtc tcaaagttgg atgacctcat tactaatatt 6060 tgttgtaaaa gtgaaacttg tttgccaacc aataaacaac tgattgagat ttagaagata 6120 ttgtaaaaaa aaaaaaaaaa a 6141 <210> 10 <211> 6107 <212> RNA <213> PSEN1 mRNA <400> 10 aaatgacgac aacggtgagg gttctcgggc ggggcctggg acaggcagct ccggggtccg 60 cggtttcaca tcggaaacaa aacagcggct ggtctggaag gaacctgagc tacgagccgc 120 ggcggcagcg gggcggcggg gaagcgtata cctaatctgg gagcctgcaa gtgacaacag 180 cctttgcggt ccttagacag cttggcctgg aggagaacac atgaaagaaa gaacctcaag 240 aggctttgtt ttctgtgaaa cagtatttct atacagttgc tccaatgaca gagttacctg 300 caccgttgtc ctacttccag aatgcacaga tgtctgagga caaccacctg agcaatactg 360 tacgtagcca gaatgacaat agagaacggc aggagcacaa cgacagacgg agccttggcc 420 accctgagcc attatctaat ggacgacccc agggtaactc ccggcaggtg gtggagcaag 480 atgaggaaga agatgaggag ctgacattga aatatggcgc caagcatgtg atcatgctct 540 ttgtccctgt gactctctgc atggtggtgg tcgtggctac cattaagtca gtcagctttt 600 atacccggaa ggatgggcag ctaatctata ccccattcac agaagatacc gagactgtgg 660 gccagagagc cctgcactca attctgaatg ctgccatcat gatcagtgtc attgttgtca 720 tgactatcct cctggtggtt ctgtataaat acaggtgcta taaggtcatc catgcctggc 780 ttattatatc atctctattg ttgctgttct ttttttcatt catttacttg ggggaagtgt 840 ttaaaaccta taacgttgct gtggactaca ttactgttgc actcctgatc tggaattttg 900 gtgtggtggg aatgatttcc attcactgga aaggtccact tcgactccag caggcatatc 960 tcattatgat tagtgccctc atggccctgg tgtttatcaa gtacctccct gaatggactg 1020 cgtggctcat cttggctgtg atttcagtat atgatttagt ggctgttttg tgtccgaaag 1080 gtccacttcg tatgctggtt gaaacagctc aggagagaaa tgaaacgctt tttccagctc 1140 tcatttactc ctcaacaatg gtgtggttgg tgaatatggc agaaggagac ccggaagctc 1200 aaaggagagt atccaaaaat tccaagtata atgcagaaag cacagaaagg gagtcacaag 1260 acactgttgc agagaatgat gatggcgggt tcagtgagga atgggaagcc cagagggaca 1320 gtcatctagg gcctcatcgc tctacacctg agtcacgagc tgctgtccag gaactttcca 1380 gcagtatcct cgctggtgaa gacccagagg aaaggggagt aaaacttgga ttgggagatt 1440 tcattttcta cagtgttctg gttggtaaag cctcagcaac agccagtgga gactggaaca 1500 caaccatagc ctgtttcgta gccatattaa ttggtttgtg ccttacatta ttactccttg 1560 ccattttcaa gaaagcattg ccagctcttc caatctccat cacctttggg cttgttttct 1620 actttgccac agattatctt gtacagcctt ttatggacca attagcattc catcaatttt 1680 atatctagca tatttgcggt tagaatccca tggatgtttc ttctttgact ataacaaaat 1740 ctggggagga caaaggtgat tttcctgtgt ccacatctaa caaagtcaag attcccggct 1800 ggacttttgc agcttccttc caagtcttcc tgaccacctt gcactattgg actttggaag 1860 gaggtgccta tagaaaacga ttttgaacat acttcatcgc agtggactgt gtccctcggt 1920 gcagaaacta ccagatttga gggacgaggt caaggagata tgataggccc ggaagttgct 1980 gtgccccatc agcagcttga cgcgtggtca caggacgatt tcactgacac tgcgaactct 2040 caggactacc gttaccaaga ggttaggtga agtggtttaa accaaacgga actcttcatc 2100 ttaaactaca cgttgaaaat caacccaata attctgtatt aactgaattc tgaacttttc 2160 aggaggtact gtgaggaaga gcaggcacca gcagcagaat ggggaatgga gaggtgggca 2220 ggggttccag cttccctttg attttttgct gcagactcat cctttttaaa tgagacttgt 2280 tttcccctct ctttgagtca agtcaaatat gtagattgcc tttggcaatt cttcttctca 2340 agcactgaca ctcattaccg tctgtgattg ccatttcttc ccaaggccag tctgaacctg 2400 aggttgcttt atcctaaaag ttttaacctc aggttccaaa ttcagtaaat tttggaaaca 2460 gtacagctat ttctcatcaa ttctctatca tgttgaagtc aaatttggat tttccaccaa 2520 attctgaatt tgtagacata cttgtacgct cacttgcccc agatgcctcc tctgtcctca 2580 ttcttctctc ccacacaagc agtctttttc tacagccagt aaggcagctc tgtcgtggta 2640 gcagatggtc ccattattct agggtcttac tctttgtatg atgaaaagaa tgtgttatga 2700 atcggtgctg tcagccctgc tgtcagacct tcttccacag caaatgagat gtatgcccaa 2760 agacggtaga attaaagaag agtaaaatgg ctgttgaagc actttctgtc ctggtatttt 2820 gtttttgctt ttgccacaca gtagctcaga atttgaacaa atagccaaaa gctggtggtt 2880 gatgaattat gaactagttg tatcaacaca aagcaagagt tggggaaagc catatttaac 2940 ttggtgagct gtgggagaac ctggtggcag aaggagaacc aactgccaag gggaaagaga 3000 aggggcctcc agcagcgaag gggatacagt gagctaatga tgtcaaggag gagtttcagg 3060 ttattctcgt cagctccaca aatgggtgct ttgtggtctc tgcccgcgtt acctttcctc 3120 tcaatgtacc tttgtgtgaa ctgggcagtg gaggtgcctg ctgcagttac catggagttc 3180 aggctctggg cagctcagtc aggcaaaaca cacaaacagc catcagcctg tgtgggctca 3240 gggcacctct ggacaaaggc ttgtggggca taaccttctt taccacagag agcccttagc 3300 tatgctgatc agaccgtaag cgtttatgag aaacttagtt tcctcctgtg gctgaggagg 3360 ggccagcttt ttcttctttt gcctgctgtt ttctctccca atctatgata tgatatgacc 3420 tggtttgggg ctgtctttgg tgtttagaat atttgttttc tgtcccagga tatttcttat 3480 aagaacctaa cttcaagagt agtgtgcgag tactgatctg aatttaaatt aaaattggct 3540 tatattaggc agtcacagac aggaaaaata agagctatgc aaagaaaggg ggatttaaag 3600 tagtaggttc tatcatctca attcattttt ttccatgaaa tcccttcttc caagattcat 3660 tccctctctc agacatgtgc tagcatgggt attatcattg agaaagcaca gctacagcaa 3720 agccacctga atagcaattt gtgattggaa gcattcttga gggatcccta atctagagta 3780 atttatttgt gtaaggatcc caaatgtgtt gcacctttca tgatacattt cttctctgaa 3840 gagggtacgt ggggtgtgtg tatttaaatc catcctatgt attactgatt gtcctgtgta 3900 gaaagatggc aattattctg tctctttctc caagtttgag ccacatctca gccacattgt 3960 tagacagtgt acagagaacc tatctttcct tttttttttt ttaaaggaca ggattttgct 4020 gtgttgccca ggctagactt gaactcctgg gctcaagtaa tccacctcag cctgagtagc 4080 tgagactaca gcccatctta tttctttaaa tcattcatct caggcagaga acttttccct 4140 caaacattct ttttagaatt agttcagtca ttcctaaaac atccaaatgc tagtcttcca 4200 ccatgaaaaa tagattgtca ctggaaagaa cagtagcaat ttccataagg atgtgccttc 4260 actcacacgg gacaggcggt ggttatagag tcgggcaaaa ccagcagtag agtatgacca 4320 gccaagccaa tctgcttaat aaaaagatgg aagacagtaa ggaaggaaag tagccactaa 4380 gagtctgagt ctgactgggc tacagaataa agggtattta tggacagaat gtcattacat 4440 gcctatggga ataccaatca tatttggaag atttgcagat tttttttcag agaggaaaga 4500 ctcaccttcc tgtttttggt tctcagtagg ttcgtgtgtg ttcctagaat cacagctctg 4560 actccaaatg actcaatttc tcaattagaa aaagtagaag ctttctaagc aacttggaag 4620 aaaacagtca taagtaagca atttgttgat tttactacag aagcaacaac tgaagaggca 4680 gtgtttttac tttcagactc cgggattccc attctgtagt ctctctgctt ttaaaaaccc 4740 tccttttgca atagatgccc aaacagatga tgtttattac ttgttattta cgtggcctca 4800 gacagtgtat gtattctcga tataacttgt agagtgtgaa atataagttt aactaccaaa 4860 taaggtctcc cagggttaga tgactgcggg aagcctttga tcccaacccc caaggctttg 4920 tatatttgat catttgtgat ctaaccctgg aagaaaaaga gctcagaaac cactatgaaa 4980 aaatttgttc agtgttttct gtgttcccgt aggttctgga gtctgaggat gcaaagatga 5040 ataagataaa ttctcagaat gtagttataa tctcttgttt tctggtatat gccatctttc 5100 tttaacttct ctaaaatatt gggtatttgt caaataacca cttttaacag ttaccattac 5160 tgagggctta tacattggtg ttataaaagt gacttgattc agaaatcaat ccattcagta 5220 aagtactcct tctctaaatt tgctgttatg tctataagga acagtttgac ctgcccttct 5280 cctcacctcc tcacctgcct tccaacattg aatttggaag gagacgtgaa aattggacat 5340 ttggttttgc ccttgggctg gaaactatca tataatcata agtttgagcc tagaagtgat 5400 ccttgtgatc ttctcacctc tttaaattcc cacaacacaa gagattaaaa acagaggttt 5460 cagctcttca tagtgcgttg tgaaatggct ggccagagtg taccaacaaa gctgtcatcg 5520 ggctcacagc tcagagacat ctgcatgtga tcatctgcat agtcctctcc tctaacggga 5580 aacacctcag atttgcatat aaaaaagcac cctggtgctg aaatgaaccc ctttcttgaa 5640 catcaaagct gtctcccaca gccttgggca gcagggtgcc tcttagtgga tgtgctgggt 5700 ccaccctgag ccctgacatg tggtggcagc attgccagtt ggtctgtgtg tctgtgtagc 5760 agggacgatt tcccagaaag caattttcct tttgaaatac gtaattgttg agactaggca 5820 gtttcaaagt cagctgcata tagtagcaag tacaggactg tcttgttttt ggtgtccttg 5880 gaggtgctgg ggtgagggtt tcagtgggat catttactct cacatgttgt ctgccttctg 5940 cttctgtgga cactgctttg tacttaattc agacagactg tgaatacacc ttttttataa 6000 atacctttca aattcttggt aagatataat tttgatagct gattgcagat tttctgtatt 6060 tgtcagatta ataaagactg catgaatcca aaaaaaaaaa aaaaaaa 6107 <210> 11 <211> 1499 <212> PRT <213> RAPGEF2 protein <400> 11 Met Lys Pro Leu Ala Ile Pro Ala Asn His Gly Val Met Gly Gln Gln 1 5 10 15 Glu Lys His Ser Leu Pro Ala Asp Phe Thr Lys Leu His Leu Thr Asp 20 25 30 Ser Leu His Pro Gln Val Thr His Val Ser Ser Ser His Ser Gly Cys 35 40 45 Ser Ile Thr Ser Asp Ser Gly Ser Ser Ser Leu Ser Asp Ile Tyr Gln 50 55 60 Ala Thr Glu Ser Glu Ala Gly Asp Met Asp Leu Ser Gly Leu Pro Glu 65 70 75 80 Thr Ala Val Asp Ser Glu Asp Asp Asp Asp Glu Glu Asp Ile Glu Arg 85 90 95 Ala Ser Asp Pro Leu Met Ser Arg Asp Ile Val Arg Asp Cys Leu Glu 100 105 110 Lys Asp Pro Ile Asp Arg Thr Asp Asp Asp Ile Glu Gln Leu Leu Glu 115 120 125 Phe Met His Gln Leu Pro Ala Phe Ala Asn Met Thr Met Ser Val Arg 130 135 140 Arg Glu Leu Cys Ala Val Met Val Phe Ala Val Val Glu Arg Ala Gly 145 150 155 160 Thr Ile Val Leu Asn Asp Gly Glu Glu Leu Asp Ser Trp Ser Val Ile 165 170 175 Leu Asn Gly Ser Val Glu Val Thr Tyr Pro Asp Gly Lys Ala Glu Ile 180 185 190 Leu Cys Met Gly Asn Ser Phe Gly Val Ser Pro Thr Met Asp Lys Glu 195 200 205 Tyr Met Lys Gly Val Met Arg Thr Lys Val Asp Asp Cys Gln Phe Val 210 215 220 Cys Ile Ala Gln Gln Asp Tyr Cys Arg Ile Leu Asn Gln Val Glu Lys 225 230 235 240 Asn Met Gln Lys Val Glu Glu Glu Gly Glu Ile Val Met Val Lys Glu 245 250 255 His Arg Glu Leu Asp Arg Thr Gly Thr Arg Lys Gly His Ile Val Ile 260 265 270 Lys Gly Thr Ser Glu Arg Leu Thr Met His Leu Val Glu Glu His Ser 275 280 285 Val Val Asp Pro Thr Phe Ile Glu Asp Phe Leu Leu Thr Tyr Arg Thr 290 295 300 Phe Leu Ser Ser Pro Met Glu Val Gly Lys Lys Leu Leu Glu Trp Phe 305 310 315 320 Asn Asp Pro Ser Leu Arg Asp Lys Val Thr Arg Val Val Leu Leu Trp 325 330 335 Val Asn Asn His Phe Asn Asp Phe Glu Gly Asp Pro Ala Met Thr Arg 340 345 350 Phe Leu Glu Glu Phe Glu Asn Asn Leu Glu Arg Glu Lys Met Gly Gly 355 360 365 His Leu Arg Leu Leu Asn Ile Ala Cys Ala Ala Lys Ala Lys Arg Arg 370 375 380 Leu Met Thr Leu Thr Lys Pro Ser Arg Glu Ala Pro Leu Pro Phe Ile 385 390 395 400 Leu Leu Gly Gly Ser Glu Lys Gly Phe Gly Ile Phe Val Asp Ser Val 405 410 415 Asp Ser Gly Ser Lys Ala Thr Glu Ala Gly Leu Lys Arg Gly Asp Gln 420 425 430 Ile Leu Glu Val Asn Gly Gln Asn Phe Glu Asn Ile Gln Leu Ser Lys 435 440 445 Ala Met Glu Ile Leu Arg Asn Asn Thr His Leu Ser Ile Thr Val Lys 450 455 460 Thr Asn Leu Phe Val Phe Lys Glu Leu Leu Thr Arg Leu Ser Glu Glu 465 470 475 480 Lys Arg Asn Gly Ala Pro His Leu Pro Lys Ile Gly Asp Ile Lys Lys 485 490 495 Ala Ser Arg Tyr Ser Ile Pro Asp Leu Ala Val Asp Val Glu Gln Val 500 505 510 Ile Gly Leu Glu Lys Val Asn Lys Lys Ser Lys Ala Asn Thr Val Gly 515 520 525 Gly Arg Asn Lys Leu Lys Lys Ile Leu Asp Lys Thr Arg Ile Ser Ile 530 535 540 Leu Pro Gln Lys Pro Tyr Asn Asp Ile Gly Ile Gly Gln Ser Gln Asp 545 550 555 560 Asp Ser Ile Val Gly Leu Arg Gln Thr Lys His Ile Pro Thr Ala Leu 565 570 575 Pro Val Ser Gly Thr Leu Ser Ser Ser Asn Pro Asp Leu Leu Gln Ser 580 585 590 His His Arg Ile Leu Asp Phe Ser Ala Thr Pro Asp Leu Pro Asp Gln 595 600 605 Val Leu Arg Val Phe Lys Ala Asp Gln Gln Ser Arg Tyr Ile Met Ile 610 615 620 Ser Lys Asp Thr Thr Ala Lys Glu Val Val Ile Gln Ala Ile Arg Glu 625 630 635 640 Phe Ala Val Thr Ala Thr Pro Asp Gln Tyr Ser Leu Cys Glu Val Ser 645 650 655 Val Thr Pro Glu Gly Val Ile Lys Gln Arg Arg Leu Pro Asp Gln Leu 660 665 670 Ser Lys Leu Ala Asp Arg Ile Gln Leu Ser Gly Arg Tyr Tyr Leu Lys 675 680 685 Asn Asn Met Glu Thr Glu Thr Leu Cys Ser Asp Glu Asp Ala Gln Glu 690 695 700 Leu Leu Arg Glu Ser Gln Ile Ser Leu Leu Gln Leu Ser Thr Val Glu 705 710 715 720 Val Ala Thr Gln Leu Ser Met Arg Asn Phe Glu Leu Phe Arg Asn Ile 725 730 735 Glu Pro Thr Glu Tyr Ile Asp Asp Leu Phe Lys Leu Arg Ser Lys Thr 740 745 750 Ser Cys Ala Asn Leu Lys Arg Phe Glu Glu Val Ile Asn Gln Glu Thr 755 760 765 Phe Trp Val Ala Ser Glu Ile Leu Arg Glu Thr Asn Gln Leu Lys Arg 770 775 780 Met Lys Ile Ile Lys His Phe Ile Lys Ile Ala Leu His Cys Arg Glu 785 790 795 800 Cys Lys Asn Phe Asn Ser Met Phe Ala Ile Ile Ser Gly Leu Asn Leu 805 810 815 Ala Pro Val Ala Arg Leu Arg Thr Thr Trp Glu Lys Leu Pro Asn Lys 820 825 830 Tyr Glu Lys Leu Phe Gln Asp Leu Gln Asp Leu Phe Asp Pro Ser Arg 835 840 845 Asn Met Ala Lys Tyr Arg Asn Val Leu Asn Ser Gln Asn Leu Gln Pro 850 855 860 Pro Ile Ile Pro Leu Phe Pro Val Ile Lys Lys Asp Leu Thr Phe Leu 865 870 875 880 His Glu Gly Asn Asp Ser Lys Val Asp Gly Leu Val Asn Phe Glu Lys 885 890 895 Leu Arg Met Ile Ala Lys Glu Ile Arg His Val Gly Arg Met Ala Ser 900 905 910 Val Asn Met Asp Pro Ala Leu Met Phe Arg Thr Arg Lys Lys Lys Trp 915 920 925 Arg Ser Leu Gly Ser Leu Ser Gln Gly Ser Thr Asn Ala Thr Val Leu 930 935 940 Asp Val Ala Gln Thr Gly Gly His Lys Lys Arg Val Arg Arg Ser Ser 945 950 955 960 Phe Leu Asn Ala Lys Lys Leu Tyr Glu Asp Ala Gln Met Ala Arg Lys 965 970 975 Val Lys Gln Tyr Leu Ser Asn Leu Glu Leu Glu Met Asp Glu Glu Ser 980 985 990 Leu Gln Thr Leu Ser Leu Gln Cys Glu Pro Ala Thr Asn Thr Leu Pro 995 1000 1005 Lys Asn Pro Gly Asp Lys Lys Pro Val Lys Ser Glu Thr Ser Pro Val 1010 1015 1020 Ala Pro Arg Ala Gly Ser Gln Gln Lys Ala Gln Ser Leu Pro Gln Pro 1025 1030 1035 1040 Gln Gln Gln Pro Pro Pro Ala His Lys Ile Asn Gln Gly Leu Gln Val 1045 1050 1055 Pro Ala Val Ser Leu Tyr Pro Ser Arg Lys Lys Val Pro Val Lys Asp 1060 1065 1070 Leu Pro Pro Phe Gly Ile Asn Ser Pro Gln Ala Leu Lys Lys Ile Leu 1075 1080 1085 Ser Leu Ser Glu Glu Gly Ser Leu Glu Arg His Lys Lys Gln Ala Glu 1090 1095 1100 Asp Thr Ile Ser Asn Ala Ser Ser Gln Leu Ser Ser Pro Pro Thr Ser 1105 1110 1115 1120 Pro Gln Ser Ser Pro Arg Lys Gly Tyr Thr Leu Ala Pro Ser Gly Thr 1125 1130 1135 Val Asp Asn Phe Ser Asp Ser Gly His Ser Glu Ile Ser Ser Arg Ser 1140 1145 1150 Ser Ile Val Ser Asn Ser Ser Phe Asp Ser Val Pro Val Ser Leu His 1155 1160 1165 Asp Glu Arg Arg Gln Arg His Ser Val Ser Ile Val Glu Thr Asn Leu 1170 1175 1180 Gly Met Gly Arg Met Glu Arg Arg Thr Met Ile Glu Pro Asp Gln Tyr 1185 1190 1195 1200 Ser Leu Gly Ser Tyr Ala Pro Met Ser Glu Gly Arg Gly Leu Tyr Ala 1205 1210 1215 Thr Ala Thr Val Ile Ser Ser Pro Ser Thr Glu Glu Leu Ser Gln Asp 1220 1225 1230 Gln Gly Asp Arg Ala Ser Leu Asp Ala Ala Asp Ser Gly Arg Gly Ser 1235 1240 1245 Trp Thr Ser Cys Ser Ser Gly Ser His Asp Asn Ile Gln Thr Ile Gln 1250 1255 1260 His Gln Arg Ser Trp Glu Thr Leu Pro Phe Gly His Thr His Phe Asp 1265 1270 1275 1280 Tyr Ser Gly Asp Pro Ala Gly Leu Trp Ala Ser Ser Ser His Met Asp 1285 1290 1295 Gln Ile Met Phe Ser Asp His Ser Thr Lys Tyr Asn Arg Gln Asn Gln 1300 1305 1310 Ser Arg Glu Ser Leu Glu Gln Ala Gln Ser Arg Ala Ser Trp Ala Ser 1315 1320 1325 Ser Thr Gly Tyr Trp Gly Glu Asp Ser Glu Gly Asp Thr Gly Thr Ile 1330 1335 1340 Lys Arg Arg Gly Gly Lys Asp Val Ser Ile Glu Ala Glu Ser Ser Ser 1345 1350 1355 1360 Leu Thr Ser Val Thr Thr Glu Glu Thr Lys Pro Val Pro Met Pro Ala 1365 1370 1375 His Ile Ala Val Ala Ser Ser Thr Thr Lys Gly Leu Ile Ala Arg Lys 1380 1385 1390 Glu Gly Arg Tyr Arg Glu Pro Pro Pro Thr Pro Pro Gly Tyr Ile Gly 1395 1400 1405 Ile Pro Ile Thr Asp Phe Pro Glu Gly His Ser His Pro Ala Arg Lys 1410 1415 1420 Pro Pro Asp Tyr Asn Val Ala Leu Gln Arg Ser Arg Met Val Ala Arg 1425 1430 1435 1440 Ser Ser Asp Thr Ala Gly Pro Ser Ser Val Gln Gln Pro His Gly His 1445 1450 1455 Pro Thr Ser Ser Arg Pro Val Asn Lys Pro Gln Trp His Lys Pro Asn 1460 1465 1470 Glu Ser Asp Pro Arg Leu Ala Pro Tyr Gln Ser Gln Gly Phe Ser Thr 1475 1480 1485 Glu Glu Asp Glu Asp Glu Gln Val Ser Ala Val 1490 1495 <210> 12 <211> 777 <212> PRT <213> IFT80 protein <400> 12 Met Arg Leu Lys Ile Ser Leu Leu Lys Glu Pro Lys His Gln Glu Leu 1 5 10 15 Val Ser Cys Val Gly Trp Thr Thr Ala Glu Glu Leu Tyr Ser Cys Ser 20 25 30 Asp Asp His Gln Ile Val Lys Trp Asn Leu Leu Thr Ser Glu Thr Thr 35 40 45 Gln Ile Val Lys Leu Pro Asp Asp Ile Tyr Pro Ile Asp Phe His Trp 50 55 60 Phe Pro Lys Ser Leu Gly Val Lys Lys Gln Thr Gln Ala Glu Ser Phe 65 70 75 80 Val Leu Thr Ser Ser Asp Gly Lys Phe His Leu Ile Ser Lys Leu Gly 85 90 95 Arg Val Glu Lys Ser Val Glu Ala His Cys Gly Ala Val Leu Ala Gly 100 105 110 Arg Trp Asn Tyr Glu Gly Thr Ala Leu Val Thr Val Gly Glu Asp Gly 115 120 125 Gln Ile Lys Ile Trp Ser Lys Thr Gly Met Leu Arg Ser Thr Leu Ala 130 135 140 Gln Gln Gly Thr Pro Val Tyr Ser Val Ala Trp Gly Pro Asp Ser Glu 145 150 155 160 Lys Val Leu Tyr Thr Ala Gly Lys Gln Leu Ile Ile Lys Pro Leu Gln 165 170 175 Pro Asn Ala Lys Val Leu Gln Trp Lys Ala His Asp Gly Ile Ile Leu 180 185 190 Lys Val Asp Trp Asn Ser Val Asn Asp Leu Ile Leu Ser Ala Gly Glu 195 200 205 Asp Cys Lys Tyr Lys Val Trp Asp Ser Tyr Gly Arg Pro Leu Tyr Asn 210 215 220 Ser Gln Pro His Glu His Pro Ile Thr Ser Val Ala Trp Ala Pro Asp 225 230 235 240 Gly Glu Leu Phe Ala Val Gly Ser Phe His Thr Leu Arg Leu Cys Asp 245 250 255 Lys Thr Gly Trp Ser Tyr Ala Leu Glu Lys Pro Asn Thr Gly Ser Ile 260 265 270 Phe Asn Ile Ala Trp Ser Ile Asp Gly Thr Gln Ile Ala Gly Ala Cys 275 280 285 Gly Asn Gly His Val Val Phe Ala His Val Val Glu Gln His Trp Glu 290 295 300 Trp Lys Asn Phe Gln Val Thr Leu Thr Lys Arg Arg Ala Met Gln Val 305 310 315 320 Arg Asn Val Leu Asn Asp Ala Val Asp Leu Leu Glu Phe Arg Asp Arg 325 330 335 Val Ile Lys Ala Ser Leu Asn Tyr Ala His Leu Val Val Ser Thr Ser 340 345 350 Leu Gln Cys Tyr Val Phe Ser Thr Lys Asn Trp Asn Thr Pro Ile Ile 355 360 365 Phe Asp Leu Lys Glu Gly Thr Val Ser Leu Ile Leu Gln Ala Glu Arg 370 375 380 His Phe Leu Leu Val Asp Gly Ser Ser Ile Tyr Leu Tyr Ser Tyr Glu 385 390 395 400 Gly Arg Phe Ile Ser Ser Pro Lys Phe Pro Gly Met Arg Thr Asp Ile 405 410 415 Leu Asn Ala Gln Thr Val Ser Leu Ser Asn Asp Thr Ile Ala Ile Arg 420 425 430 Asp Lys Ala Asp Glu Lys Ile Ile Phe Leu Phe Glu Ala Ser Thr Gly 435 440 445 Lys Pro Leu Gly Asp Gly Lys Phe Leu Ser His Lys Asn Glu Ile Leu 450 455 460 Glu Ile Ala Leu Asp Gln Lys Gly Leu Thr Asn Asp Arg Lys Ile Ala 465 470 475 480 Phe Ile Asp Lys Asn Arg Asp Leu Cys Ile Thr Ser Val Lys Arg Phe 485 490 495 Gly Lys Glu Glu Gln Ile Ile Lys Leu Gly Thr Met Val His Thr Leu 500 505 510 Ala Trp Asn Asp Thr Cys Asn Ile Leu Cys Gly Leu Gln Asp Thr Arg 515 520 525 Phe Ile Val Trp Tyr Tyr Pro Asn Thr Val Tyr Val Asp Arg Asp Ile 530 535 540 Leu Pro Lys Thr Leu Tyr Glu Arg Asp Ala Ser Glu Phe Ser Lys Asn 545 550 555 560 Pro His Ile Val Ser Phe Val Gly Asn Gln Val Thr Ile Arg Arg Ala 565 570 575 Asp Gly Ser Leu Val His Ile Ser Ile Thr Pro Tyr Pro Ala Ile Leu 580 585 590 His Glu Tyr Val Ser Ser Ser Lys Trp Glu Asp Ala Val Arg Leu Cys 595 600 605 Arg Phe Val Lys Glu Gln Thr Met Trp Ala Cys Leu Ala Ala Met Ala 610 615 620 Val Ala Asn Arg Asp Met Thr Thr Ala Glu Ile Ala Tyr Ala Ala Ile 625 630 635 640 Gly Glu Ile Asp Lys Val Gln Tyr Ile Asn Ser Ile Lys Asn Leu Pro 645 650 655 Ser Lys Glu Ser Lys Met Ala His Ile Leu Leu Phe Ser Gly Asn Ile 660 665 670 Gln Glu Ala Glu Ile Val Leu Leu Gln Ala Gly Leu Val Tyr Gln Ala 675 680 685 Ile Gln Ile Asn Ile Asn Leu Tyr Asn Trp Glu Arg Ala Leu Glu Leu 690 695 700 Ala Val Lys Tyr Lys Thr His Val Asp Thr Val Leu Ala Tyr Arg Gln 705 710 715 720 Lys Phe Leu Glu Thr Phe Gly Lys Gln Glu Thr Asn Lys Arg Tyr Leu 725 730 735 His Tyr Ala Glu Gly Leu Gln Ile Asp Trp Glu Lys Ile Lys Ala Lys 740 745 750 Ile Glu Met Glu Ile Thr Lys Glu Arg Glu Gln Ser Ser Ser Ser Gln 755 760 765 Ser Ser Lys Ser Ile Gly Leu Lys Pro 770 775 <210> 13 <211> 1423 <212> PRT <213> SSH2 protein <400> 13 Met Ala Leu Val Thr Val Gln Arg Ser Pro Thr Pro Ser Thr Thr Ser 1 5 10 15 Ser Pro Cys Ala Ser Glu Ala Asp Ser Gly Glu Glu Glu Cys Arg Ser 20 25 30 Gln Pro Arg Ser Ile Ser Glu Ser Phe Leu Thr Val Lys Gly Ala Ala 35 40 45 Leu Phe Leu Pro Arg Gly Asn Gly Ser Ser Thr Pro Arg Ile Ser His 50 55 60 Arg Arg Asn Lys His Ala Gly Asp Leu Gln Gln His Leu Gln Ala Met 65 70 75 80 Phe Ile Leu Leu Arg Pro Glu Asp Asn Ile Arg Leu Ala Val Arg Leu 85 90 95 Glu Ser Thr Tyr Gln Asn Arg Thr Arg Tyr Met Val Val Val Ser Thr 100 105 110 Asn Gly Arg Gln Asp Thr Glu Glu Ser Ile Val Leu Gly Met Asp Phe 115 120 125 Ser Ser Asn Asp Ser Ser Thr Cys Thr Met Gly Leu Val Leu Pro Leu 130 135 140 Trp Ser Asp Thr Leu Ile His Leu Asp Gly Asp Gly Gly Phe Ser Val 145 150 155 160 Ser Thr Asp Asn Arg Val His Ile Phe Lys Pro Val Ser Val Gln Ala 165 170 175 Met Trp Ser Ala Leu Gln Ser Leu His Lys Ala Cys Glu Val Ala Arg 180 185 190 Ala His Asn Tyr Tyr Pro Gly Ser Leu Phe Leu Thr Trp Val Ser Tyr 195 200 205 Tyr Glu Ser His Ile Asn Ser Asp Gln Ser Ser Val Asn Glu Trp Asn 210 215 220 Ala Met Gln Asp Val Gln Ser His Arg Pro Asp Ser Pro Ala Leu Phe 225 230 235 240 Thr Asp Ile Pro Thr Glu Arg Glu Arg Thr Glu Arg Leu Ile Lys Thr 245 250 255 Lys Leu Arg Glu Ile Met Met Gln Lys Asp Leu Glu Asn Ile Thr Ser 260 265 270 Lys Glu Ile Arg Thr Glu Leu Glu Met Gln Met Val Cys Asn Leu Arg 275 280 285 Glu Phe Lys Glu Phe Ile Asp Asn Glu Met Ile Val Ile Leu Gly Gln 290 295 300 Met Asp Ser Pro Thr Gln Ile Phe Glu His Val Phe Leu Gly Ser Glu 305 310 315 320 Trp Asn Ala Ser Asn Leu Glu Asp Leu Gln Asn Arg Gly Val Arg Tyr 325 330 335 Ile Leu Asn Val Thr Arg Glu Ile Asp Asn Phe Phe Pro Gly Val Phe 340 345 350 Glu Tyr His Asn Ile Arg Val Tyr Asp Glu Glu Ala Thr Asp Leu Leu 355 360 365 Ala Tyr Trp Asn Asp Thr Tyr Lys Phe Ile Ser Lys Ala Lys Lys His 370 375 380 Gly Ser Lys Cys Leu Val His Cys Lys Met Gly Val Ser Arg Ser Ala 385 390 395 400 Ser Thr Val Ile Ala Tyr Ala Met Lys Glu Tyr Gly Trp Asn Leu Asp 405 410 415 Arg Ala Tyr Asp Tyr Val Lys Glu Arg Arg Thr Val Thr Lys Pro Asn 420 425 430 Pro Ser Phe Met Arg Gln Leu Glu Glu Tyr Gln Gly Ile Leu Leu Ala 435 440 445 Ser Lys Gln Arg His Asn Lys Leu Trp Arg Ser His Ser Asp Ser Asp 450 455 460 Leu Ser Asp His His Glu Pro Ile Cys Lys Pro Gly Leu Glu Leu Asn 465 470 475 480 Lys Lys Asp Ile Thr Thr Ser Ala Asp Gln Ile Ala Glu Val Lys Thr 485 490 495 Met Glu Ser His Pro Pro Ile Pro Pro Val Phe Val Glu His Met Val 500 505 510 Pro Gln Asp Ala Asn Gln Lys Gly Leu Cys Thr Lys Glu Arg Met Ile 515 520 525 Cys Leu Glu Phe Thr Ser Arg Glu Phe His Ala Gly Gln Ile Glu Asp 530 535 540 Glu Leu Asn Leu Asn Asp Ile Asn Gly Cys Ser Ser Gly Cys Cys Leu 545 550 555 560 Asn Glu Ser Lys Phe Pro Leu Asp Asn Cys His Ala Ser Lys Ala Leu 565 570 575 Ile Gln Pro Gly His Val Pro Glu Met Ala Asn Lys Phe Pro Asp Leu 580 585 590 Thr Val Glu Asp Leu Glu Thr Asp Ala Leu Lys Ala Asp Met Asn Val 595 600 605 His Leu Leu Pro Met Glu Glu Leu Thr Ser Pro Leu Lys Asp Pro Pro 610 615 620 Met Ser Pro Asp Pro Glu Ser Pro Ser Pro Gln Pro Ser Cys Gln Thr 625 630 635 640 Glu Ile Ser Asp Phe Ser Thr Asp Arg Ile Asp Phe Phe Ser Ala Leu 645 650 655 Glu Lys Phe Val Glu Leu Ser Gln Glu Thr Arg Ser Arg Ser Phe Ser 660 665 670 His Ser Arg Met Glu Glu Leu Gly Gly Gly Arg Asn Glu Ser Cys Arg 675 680 685 Leu Ser Val Val Glu Val Ala Pro Ser Lys Val Thr Ala Asp Asp Gln 690 695 700 Arg Ser Ser Ser Leu Ser Asn Thr Pro His Ala Ser Glu Glu Ser Ser 705 710 715 720 Met Asp Glu Glu Gln Ser Lys Ala Ile Ser Glu Leu Val Ser Pro Asp 725 730 735 Ile Phe Met Gln Ser His Ser Glu Asn Ala Ile Ser Val Lys Glu Ile 740 745 750 Val Thr Glu Ile Glu Ser Ile Ser Gln Gly Val Gly Gln Ile Gln Leu 755 760 765 Lys Gly Asp Ile Leu Pro Asn Pro Cys His Thr Pro Lys Lys Asn Ser 770 775 780 Ile His Glu Leu Leu Leu Glu Arg Ala Gln Thr Pro Glu Asn Lys Pro 785 790 795 800 Gly His Met Glu Gln Asp Glu Asp Ser Cys Thr Ala Gln Pro Glu Leu 805 810 815 Ala Lys Asp Ser Gly Met Cys Asn Pro Glu Gly Cys Leu Thr Thr His 820 825 830 Ser Ser Ile Ala Asp Leu Glu Glu Gly Glu Pro Ala Glu Gly Glu Gln 835 840 845 Glu Leu Gln Gly Ser Gly Met His Pro Gly Ala Lys Trp Tyr Pro Gly 850 855 860 Ser Val Arg Arg Ala Thr Leu Glu Phe Glu Glu Arg Leu Arg Gln Glu 865 870 875 880 Gln Glu His His Gly Ala Ala Pro Thr Cys Thr Ser Leu Ser Thr Arg 885 890 895 Lys Asn Ser Lys Asn Asp Ser Ser Val Ala Asp Leu Ala Pro Lys Gly 900 905 910 Lys Ser Asp Glu Ala Pro Pro Glu His Ser Phe Val Leu Lys Glu Pro 915 920 925 Glu Met Ser Lys Gly Lys Gly Lys Tyr Ser Gly Ser Glu Ala Gly Ser 930 935 940 Leu Ser His Ser Glu Gln Asn Ala Thr Val Pro Ala Pro Arg Val Leu 945 950 955 960 Glu Phe Asp His Leu Pro Asp Pro Gln Glu Gly Pro Gly Ser Asp Thr 965 970 975 Gly Thr Gln Gln Glu Gly Val Leu Lys Asp Leu Arg Thr Val Ile Pro 980 985 990 Tyr Gln Glu Ser Glu Thr Gln Ala Val Pro Leu Pro Leu Pro Lys Arg 995 1000 1005 Val Glu Ile Ile Glu Tyr Thr His Ile Val Thr Ser Pro Asn His Thr 1010 1015 1020 Gly Pro Gly Ser Glu Ile Ala Thr Ser Glu Lys Ser Gly Glu Gln Gly 1025 1030 1035 1040 Leu Arg Lys Val Asn Met Glu Lys Ser Val Thr Val Leu Cys Thr Leu 1045 1050 1055 Asp Glu Asn Leu Asn Arg Thr Leu Asp Pro Asn Gln Val Ser Leu His 1060 1065 1070 Pro Gln Val Leu Pro Leu Pro His Ser Ser Ser Pro Glu His Asn Arg 1075 1080 1085 Pro Thr Asp His Pro Thr Ser Ile Leu Ser Ser Pro Glu Asp Arg Gly 1090 1095 1100 Ser Ser Leu Ser Thr Ala Leu Glu Thr Ala Ala Pro Phe Val Ser His 1105 1110 1115 1120 Thr Thr His Leu Leu Ser Ala Ser Leu Asp Tyr Leu His Pro Gln Thr 1125 1130 1135 Met Val His Leu Glu Gly Phe Thr Glu Gln Ser Ser Thr Thr Asp Glu 1140 1145 1150 Pro Ser Ala Glu Gln Val Ser Trp Glu Glu Ser Gln Glu Ser Pro Leu 1155 1160 1165 Ser Ser Gly Ser Glu Val Pro Tyr Lys Asp Ser Gln Leu Ser Ser Ala 1170 1175 1180 Asp Leu Ser Leu Ile Ser Lys Leu Gly Asp Asn Thr Gly Glu Leu Gln 1185 1190 1195 1200 Glu Lys Met Asp Pro Leu Pro Val Ala Cys Arg Leu Pro His Ser Ser 1205 1210 1215 Ser Ser Glu Asn Ile Lys Ser Leu Ser His Ser Pro Gly Val Val Lys 1220 1225 1230 Glu Arg Ala Lys Glu Ile Glu Ser Arg Val Val Phe Gln Ala Gly Leu 1235 1240 1245 Thr Lys Pro Ser Gln Met Arg Arg Ser Ala Ser Leu Ala Lys Leu Gly 1250 1255 1260 Tyr Leu Asp Leu Cys Lys Asp Cys Leu Pro Glu Arg Glu Pro Ala Ser 1265 1270 1275 1280 Cys Glu Ser Pro His Leu Lys Leu Leu Gln Pro Phe Leu Arg Thr Asp 1285 1290 1295 Ser Gly Met His Ala Met Glu Asp Gln Glu Ser Leu Glu Asn Pro Gly 1300 1305 1310 Ala Pro His Asn Pro Glu Pro Thr Lys Ser Phe Val Glu Gln Leu Thr 1315 1320 1325 Thr Thr Glu Cys Ile Val Gln Ser Lys Pro Val Glu Arg Pro Leu Val 1330 1335 1340 Gln Tyr Ala Lys Glu Phe Gly Ser Ser Gln Gln Tyr Leu Leu Pro Arg 1345 1350 1355 1360 Ala Gly Leu Glu Leu Thr Ser Ser Glu Gly Gly Leu Pro Val Leu Gln 1365 1370 1375 Thr Gln Gly Leu Gln Cys Ala Cys Pro Ala Pro Gly Leu Ala Val Ala 1380 1385 1390 Pro Arg Gln Gln His Gly Arg Thr His Pro Leu Arg Arg Leu Lys Lys 1395 1400 1405 Ala Asn Asp Lys Lys Arg Thr Thr Asn Pro Phe Tyr Asn Thr Met 1410 1415 1420 <210> 14 <211> 346 <212> PRT <213> XRCC3 protein <400> 14 Met Asp Leu Asp Leu Leu Asp Leu Asn Pro Arg Ile Ile Ala Ala Ile 1 5 10 15 Lys Lys Ala Lys Leu Lys Ser Val Lys Glu Val Leu His Phe Ser Gly 20 25 30 Pro Asp Leu Lys Arg Leu Thr Asn Leu Ser Ser Pro Glu Val Trp His 35 40 45 Leu Leu Arg Thr Ala Ser Leu His Leu Arg Gly Ser Ser Ile Leu Thr 50 55 60 Ala Leu Gln Leu His Gln Gln Lys Glu Arg Phe Pro Thr Gln His Gln 65 70 75 80 Arg Leu Ser Leu Gly Cys Pro Val Leu Asp Ala Leu Leu Arg Gly Gly 85 90 95 Leu Pro Leu Asp Gly Ile Thr Glu Leu Ala Gly Arg Ser Ser Ala Gly 100 105 110 Lys Thr Gln Leu Ala Leu Gln Leu Cys Leu Ala Val Gln Phe Pro Arg 115 120 125 Gln His Gly Gly Leu Glu Ala Gly Ala Val Tyr Ile Cys Thr Glu Asp 130 135 140 Ala Phe Pro His Lys Arg Leu Gln Gln Leu Met Ala Gln Gln Pro Arg 145 150 155 160 Leu Arg Thr Asp Val Pro Gly Glu Leu Leu Gln Lys Leu Arg Phe Gly 165 170 175 Ser Gln Ile Phe Ile Glu His Val Ala Asp Val Asp Thr Leu Leu Glu 180 185 190 Cys Val Asn Lys Lys Val Pro Val Leu Leu Ser Arg Gly Met Ala Arg 195 200 205 Leu Val Val Ile Asp Ser Val Ala Ala Pro Phe Arg Cys Glu Phe Asp 210 215 220 Ser Gln Ala Ser Ala Pro Arg Ala Arg His Leu Gln Ser Leu Gly Ala 225 230 235 240 Thr Leu Arg Glu Leu Ser Ser Ala Phe Gln Ser Pro Val Leu Cys Ile 245 250 255 Asn Gln Val Thr Glu Ala Met Glu Glu Gln Gly Ala Ala His Gly Pro 260 265 270 Leu Gly Phe Trp Asp Glu Arg Val Ser Pro Ala Leu Gly Ile Thr Trp 275 280 285 Ala Asn Gln Leu Leu Val Arg Leu Leu Ala Asp Arg Leu Arg Glu Glu 290 295 300 Glu Ala Ala Leu Gly Cys Pro Ala Arg Thr Leu Arg Val Leu Ser Ala 305 310 315 320 Pro His Leu Pro Pro Ser Ser Cys Ser Tyr Thr Ile Ser Ala Glu Gly 325 330 335 Val Arg Gly Thr Pro Gly Thr Gln Ser His 340 345 <210> 15 <211> 2223 <212> PRT <213> SPAG17 protein <400> 15 Met Ala Pro Lys Lys Glu Lys Gly Gly Thr Val Asn Thr Ser Ser Lys 1 5 10 15 Ile Trp Glu Pro Ser Leu Ile Ala Ala Gln Phe Asn Gln Asn Asp Trp 20 25 30 Gln Ala Ser Ile Ala Phe Val Val Gly Asn Gln Ile Glu Asp Asp Leu 35 40 45 Leu Ile Gln Ala Leu Thr Val Ala Val Gln Val Pro Gln Arg Lys Leu 50 55 60 Phe Ser Met Val Ser Trp Gln Asp Ile Leu Gln Gln Ile Asn Glu Ile 65 70 75 80 Asn Thr Leu Val Gly Ser Ala Ser Ser Lys Lys Ala Lys Lys Pro Val 85 90 95 Gly Gly Asn Ala Pro Leu Tyr Tyr Glu Val Leu Thr Ala Ala Lys Ala 100 105 110 Ile Met Asp Ser Gly Glu Lys Leu Thr Leu Pro Leu Ile Gly Lys Leu 115 120 125 Leu Lys Phe Gln Leu Leu Gln Ile Lys Phe Lys Asp Gln Gln Arg Arg 130 135 140 Glu Asn Glu Lys Lys Val Ile Glu Asp Lys Pro Lys Leu Glu Lys Asp 145 150 155 160 Lys Gly Lys Ala Lys Ser Pro Lys Glu Lys Lys Ala Pro Ser Ala Lys 165 170 175 Pro Ala Lys Gly Lys Gly Lys Asp Gln Pro Glu Ala Asn Ala Pro Val 180 185 190 Lys Lys Thr Thr Gln Leu Lys Arg Arg Gly Glu Asp Asp His Thr Asn 195 200 205 Arg Tyr Ile Asp Asp Glu Pro Asp Asp Gly Ala Gln His Tyr Ile Ile 210 215 220 Val Val Gly Phe Asn Asn Pro Gln Leu Leu Ala Ile Met Ala Glu Leu 225 230 235 240 Gly Ile Pro Ile Thr Ser Val Ile Lys Ile Ser Ser Glu Asn Tyr Glu 245 250 255 Pro Leu Gln Thr His Leu Ala Ala Val Asn Gln Gln Gln Glu Val Leu 260 265 270 Leu Gln Ser Glu Asp Leu Glu Ala Glu Lys Leu Lys Lys Glu Asn Ala 275 280 285 Ile Lys Glu Leu Lys Thr Phe Trp Lys Tyr Leu Glu Pro Val Leu Asn 290 295 300 Asn Glu Lys Pro Glu Thr Asn Leu Phe Asp Val Ala Arg Leu Glu Tyr 305 310 315 320 Met Val Lys Ala Ala Asp Phe Pro Ser Asp Trp Ser Asp Gly Glu Met 325 330 335 Met Leu Lys Leu Gly Thr Asp Ile Phe Glu Asn Ile Ala Cys Leu Met 340 345 350 Tyr Asp Ile Leu Asp Trp Lys Arg Gln His Gln His Tyr Leu Glu Ser 355 360 365 Met Gln Leu Ile Asn Val Pro Gln Val Val Asn Glu Lys Pro Val Leu 370 375 380 Glu Ala Met Pro Thr Ser Glu Ala Pro Gln Pro Ala Val Pro Ala Pro 385 390 395 400 Gly Lys Lys Lys Ala Gln Tyr Glu Glu Pro Gln Ala Pro Pro Pro Val 405 410 415 Thr Ser Val Ile Thr Thr Glu Val Asp Met Arg Tyr Tyr Asn Tyr Leu 420 425 430 Leu Asn Pro Ile Arg Glu Glu Phe Ile Ser Val Pro Leu Ile Leu His 435 440 445 Cys Met Leu Glu Gln Val Val Ala Thr Glu Glu Asp Leu Val Pro Pro 450 455 460 Ser Leu Arg Glu Pro Ser Pro Arg Ala Asp Gly Leu Asp His Arg Ile 465 470 475 480 Ala Ala His Ile Val Ser Leu Leu Pro Ser Leu Cys Leu Ser Glu Arg 485 490 495 Glu Lys Lys Asn Leu His Asp Ile Phe Leu Ser Glu Glu Glu Asn Glu 500 505 510 Ser Lys Ala Val Pro Lys Gly Pro Leu Leu Leu Asn Tyr His Asp Ala 515 520 525 His Ala His Lys Lys Tyr Ala Leu Gln Asp Gln Lys Asn Phe Asp Pro 530 535 540 Val Gln Ile Glu Gln Glu Met Gln Ser Lys Leu Pro Leu Trp Glu Phe 545 550 555 560 Leu Gln Phe Pro Leu Pro Pro Pro Trp Asn Asn Thr Lys Arg Leu Ala 565 570 575 Thr Ile His Glu Leu Met His Phe Cys Thr Ser Asp Val Leu Ser Trp 580 585 590 Asn Glu Val Glu Arg Ala Phe Lys Val Phe Thr Phe Glu Ser Leu Lys 595 600 605 Leu Ser Glu Val Asp Glu Lys Gly Lys Leu Lys Pro Ser Gly Met Met 610 615 620 Cys Gly Ser Asp Ser Glu Met Phe Asn Ile Pro Trp Asp Asn Pro Ala 625 630 635 640 Arg Phe Ala Lys Gln Ile Arg Gln Gln Tyr Val Met Lys Met Asn Thr 645 650 655 Gln Glu Ala Lys Gln Lys Ala Asp Ile Lys Ile Lys Asp Arg Thr Leu 660 665 670 Phe Val Asp Gln Asn Leu Ser Met Ser Val Gln Asp Asn Glu Ser Asn 675 680 685 Arg Glu Pro Ser Asp Pro Ser Gln Cys Asp Ala Asn Asn Met Lys His 690 695 700 Ser Asp Leu Asn Asn Leu Lys Leu Ser Val Pro Asp Asn Arg Gln Leu 705 710 715 720 Leu Glu Gln Glu Ser Ile Met Lys Ala Gln Pro Gln His Glu Ser Leu 725 730 735 Glu Gln Thr Thr Asn Asn Glu Ile Lys Asp Asp Ala Val Thr Lys Ala 740 745 750 Asp Ser His Glu Lys Lys Pro Lys Lys Met Met Val Glu Ala Asp Leu 755 760 765 Glu Asp Ile Lys Lys Thr Gln Gln Arg Ser Leu Met Asp Trp Ser Phe 770 775 780 Thr Glu His Phe Lys Pro Lys Val Leu Leu Gln Val Leu Gln Glu Ala 785 790 795 800 His Lys Gln Tyr Arg Cys Val Asp Ser Tyr Tyr His Thr Gln Asp Asn 805 810 815 Ser Leu Leu Leu Val Phe His Asn Pro Met Asn Arg Gln Arg Leu His 820 825 830 Cys Glu Tyr Trp Asn Ile Ala Leu His Ser Asn Val Gly Phe Arg Asn 835 840 845 Tyr Leu Glu Leu Val Ala Lys Ser Ile Gln Asp Trp Ile Thr Lys Glu 850 855 860 Glu Ala Ile Tyr Gln Glu Ser Lys Met Asn Glu Lys Ile Ile Arg Thr 865 870 875 880 Arg Ala Glu Leu Glu Leu Lys Ser Ser Ala Asn Ala Lys Leu Thr Ser 885 890 895 Ala Ser Lys Ile Phe Ser Ile Lys Glu Ser Lys Ser Asn Lys Gly Ile 900 905 910 Ser Lys Thr Glu Ile Ser Asp Gln Glu Lys Glu Lys Glu Lys Glu Lys 915 920 925 Ile Pro Phe Ile Leu Glu Gly Ser Leu Lys Ala Trp Lys Glu Glu Gln 930 935 940 His Arg Leu Ala Glu Glu Glu Arg Leu Arg Glu Glu Lys Lys Ala Glu 945 950 955 960 Lys Lys Gly Lys Glu Ala Gly Lys Lys Lys Gly Lys Asp Asn Ala Glu 965 970 975 Lys Glu Asp Ser Arg Ser Leu Lys Lys Lys Ser Pro Tyr Lys Glu Lys 980 985 990 Ser Lys Glu Glu Gln Val Lys Ile Gln Glu Val Thr Glu Glu Ser Pro 995 1000 1005 His Gln Pro Glu Pro Lys Ile Thr Tyr Pro Phe His Gly Tyr Asn Met 1010 1015 1020 Gly Asn Ile Pro Thr Gln Ile Ser Gly Ser Asn Tyr Tyr Leu Tyr Pro 1025 1030 1035 1040 Ser Asp Gly Gly Gln Ile Glu Val Glu Lys Thr Met Phe Glu Lys Gly 1045 1050 1055 Pro Thr Phe Ile Lys Val Arg Val Val Lys Asp Asn His Asn Phe Met 1060 1065 1070 Ile His Leu Asn Asp Pro Lys Glu Ile Val Lys Lys Glu Glu Lys Gly 1075 1080 1085 Asp Tyr Tyr Leu Glu Glu Glu Glu Glu Gly Asp Glu Glu Gln Ser Leu 1090 1095 1100 Glu Thr Glu Val Ser Asp Ala Lys Asn Lys Ala Phe Ser Lys Phe Gly 1105 1110 1115 1120 Ser Phe Ser Ala Thr Leu Glu Asn Gly Ile Cys Leu Ser Ile Ser Tyr 1125 1130 1135 Tyr Gly Ser Asn Gly Met Ala Pro Glu Asp Lys Asp Pro Asp Leu Glu 1140 1145 1150 Thr Ile Leu Asn Ile Pro Ser Ala Leu Thr Pro Thr Val Val Pro Val 1155 1160 1165 Ile Val Thr Val Pro Gln Ser Lys Ala Lys Gly Lys Ile Lys Gly Lys 1170 1175 1180 Glu Lys Pro Lys Glu Ser Leu Lys Glu Glu Glu His Pro Lys Glu Glu 1185 1190 1195 1200 Glu Lys Lys Glu Glu Glu Val Glu Pro Glu Pro Val Leu Gln Glu Thr 1205 1210 1215 Leu Asp Val Pro Thr Phe Gln Ser Leu Asn Val Ser Cys Pro Ser Gly 1220 1225 1230 Leu Leu Leu Thr Phe Ile Gly Gln Glu Ser Thr Gly Gln Tyr Val Ile 1235 1240 1245 Asp Glu Glu Pro Thr Trp Asp Ile Met Val Arg Gln Ser Tyr Pro Gln 1250 1255 1260 Arg Val Lys His Tyr Glu Phe Tyr Lys Thr Val Met Pro Pro Ala Glu 1265 1270 1275 1280 Gln Glu Ala Ser Arg Val Ile Thr Ser Gln Gly Thr Val Val Lys Tyr 1285 1290 1295 Met Leu Asp Gly Ser Thr Gln Ile Leu Phe Ala Asp Gly Ala Val Ser 1300 1305 1310 Arg Ser Pro Asn Ser Gly Leu Ile Cys Pro Pro Ser Glu Met Pro Ala 1315 1320 1325 Thr Pro His Ser Gly Asp Leu Met Asp Ser Ile Ser Gln Gln Lys Ser 1330 1335 1340 Glu Thr Ile Pro Ser Glu Ile Thr Asn Thr Lys Lys Gly Lys Ser His 1345 1350 1355 1360 Lys Ser Gln Ser Ser Met Ala His Lys Gly Glu Ile His Asp Pro Pro 1365 1370 1375 Pro Glu Ala Val Gln Thr Val Thr Pro Val Glu Val His Ile Gly Thr 1380 1385 1390 Trp Phe Thr Thr Thr Pro Glu Gly Asn Arg Ile Gly Thr Lys Gly Leu 1395 1400 1405 Glu Arg Ile Ala Asp Leu Thr Pro Leu Leu Ser Phe Gln Ala Thr Asp 1410 1415 1420 Pro Val Asn Gly Thr Val Met Thr Thr Arg Glu Asp Lys Val Val Ile 1425 1430 1435 1440 Val Glu Arg Lys Asp Gly Thr Arg Ile Val Asp His Ala Asp Gly Thr 1445 1450 1455 Arg Ile Thr Thr Phe Tyr Gln Val Tyr Glu Asp Gln Ile Ile Leu Pro 1460 1465 1470 Asp Asp Gln Glu Thr Thr Glu Gly Pro Arg Thr Val Thr Arg Gln Val 1475 1480 1485 Lys Cys Met Arg Val Glu Ser Ser Arg Tyr Ala Thr Val Ile Ala Asn 1490 1495 1500 Cys Glu Asp Ser Ser Cys Cys Ala Thr Phe Gly Asp Gly Thr Thr Ile 1505 1510 1515 1520 Ile Ala Lys Pro Gln Gly Thr Tyr Gln Val Leu Pro Pro Asn Thr Gly 1525 1530 1535 Ser Leu Tyr Ile Asp Lys Asp Cys Ser Ala Val Tyr Cys His Glu Ser 1540 1545 1550 Ser Ser Asn Ile Tyr Tyr Pro Phe Gln Lys Arg Glu Gln Leu Arg Ala 1555 1560 1565 Gly Arg Tyr Ile Met Arg His Thr Ser Glu Val Ile Cys Glu Val Leu 1570 1575 1580 Asp Pro Glu Gly Asn Thr Phe Gln Val Met Ala Asp Gly Ser Ile Ser 1585 1590 1595 1600 Thr Ile Leu Pro Glu Lys Lys Leu Glu Asp Asp Leu Asn Glu Lys Thr 1605 1610 1615 Glu Gly Tyr Asp Ser Leu Ser Ser Met His Leu Glu Lys Asn His Gln 1620 1625 1630 Gln Ile Tyr Gly Glu His Val Pro Arg Phe Phe Val Met Tyr Ala Asp 1635 1640 1645 Gly Ser Gly Met Glu Leu Leu Arg Asp Ser Asp Ile Glu Glu Tyr Leu 1650 1655 1660 Ser Leu Ala Tyr Lys Glu Ser Asn Thr Val Val Leu Gln Glu Pro Val 1665 1670 1675 1680 Gln Glu Gln Pro Gly Thr Leu Thr Ile Thr Val Leu Arg Pro Phe His 1685 1690 1695 Glu Ala Ser Pro Trp Gln Val Lys Lys Glu Asp Thr Ile Val Pro Pro 1700 1705 1710 Asn Leu Arg Ser Arg Ser Trp Glu Thr Phe Pro Ser Val Glu Lys Lys 1715 1720 1725 Thr Pro Gly Pro Pro Phe Gly Thr Gln Ile Trp Lys Gly Leu Cys Ile 1730 1735 1740 Glu Ser Lys Gln Leu Val Ser Ala Pro Gly Ala Ile Leu Lys Ser Pro 1745 1750 1755 1760 Ser Val Leu Gln Met Arg Gln Phe Ile Gln His Glu Val Ile Lys Asn 1765 1770 1775 Glu Val Lys Leu Arg Leu Gln Val Ser Leu Lys Asp Tyr Ile Asn Tyr 1780 1785 1790 Ile Leu Lys Lys Glu Asp Glu Leu Gln Glu Met Met Val Lys Asp Ser 1795 1800 1805 Arg Thr Glu Glu Glu Arg Gly Asn Ala Ala Asp Leu Leu Lys Leu Val 1810 1815 1820 Met Ser Phe Pro Lys Met Glu Glu Thr Thr Lys Ser His Val Thr Glu 1825 1830 1835 1840 Val Ala Ala His Leu Thr Asp Leu Phe Lys Gln Ser Leu Ala Thr Pro 1845 1850 1855 Pro Lys Cys Pro Pro Asp Thr Phe Gly Lys Asp Phe Phe Glu Lys Thr 1860 1865 1870 Trp Arg His Thr Ala Ser Ser Lys Arg Trp Lys Glu Lys Ile Asp Lys 1875 1880 1885 Thr Arg Lys Glu Ile Glu Thr Thr Gln Asn Tyr Leu Met Asp Ile Lys 1890 1895 1900 Asn Arg Ile Ile Pro Pro Phe Phe Lys Ser Glu Leu Asn Gln Leu Tyr 1905 1910 1915 1920 Gln Ser Gln Tyr Asn His Leu Asp Ser Leu Ser Lys Lys Leu Pro Ser 1925 1930 1935 Phe Thr Lys Lys Asn Glu Asp Ala Asn Glu Thr Ala Val Gln Asp Thr 1940 1945 1950 Ser Asp Leu Asn Leu Asp Phe Lys Pro His Lys Val Ser Glu Gln Lys 1955 1960 1965 Ser Ser Ser Val Pro Ser Leu Pro Lys Pro Glu Ile Ser Ala Asp Lys 1970 1975 1980 Lys Asp Phe Thr Ala Gln Asn Gln Thr Glu Asn Leu Thr Lys Ser Pro 1985 1990 1995 2000 Glu Glu Ala Glu Ser Tyr Glu Pro Val Lys Ile Pro Thr Gln Ser Leu 2005 2010 2015 Leu Gln Asp Val Ala Gly Gln Thr Arg Lys Glu Lys Val Lys Leu Pro 2020 2025 2030 His Tyr Leu Leu Ser Ser Lys Pro Lys Ser Gln Pro Leu Ala Lys Val 2035 2040 2045 Gln Asp Ser Val Gly Gly Lys Val Asn Thr Ser Ser Val Ala Ser Ala 2050 2055 2060 Ala Ile Asn Asn Ala Lys Ser Ser Leu Phe Gly Phe His Leu Leu Pro 2065 2070 2075 2080 Ser Ser Val Lys Phe Gly Val Leu Lys Glu Gly His Thr Tyr Ala Thr 2085 2090 2095 Val Val Lys Leu Lys Asn Val Gly Val Asp Phe Cys Arg Phe Lys Val 2100 2105 2110 Lys Gln Pro Pro Pro Ser Thr Gly Leu Lys Val Thr Tyr Lys Pro Gly 2115 2120 2125 Pro Val Ala Ala Gly Met Gln Thr Glu Leu Asn Ile Glu Leu Phe Ala 2130 2135 2140 Thr Ala Val Gly Glu Asp Gly Ala Lys Gly Ser Ala His Ile Ser His 2145 2150 2155 2160 Asn Ile Glu Ile Met Thr Glu His Glu Val Leu Phe Leu Pro Val Glu 2165 2170 2175 Ala Thr Val Leu Thr Ser Ser Asn Tyr Asp Lys Arg Pro Lys Asp Phe 2180 2185 2190 Pro Gln Gly Lys Glu Asn Pro Met Val Gln Arg Thr Ser Thr Ile Tyr 2195 2200 2205 Ser Ser Thr Leu Gly Val Phe Met Ser Arg Lys Val Ser Pro His 2210 2215 2220 <210> 16 <211> 213 <212> PRT <213> CLEC4C protein <400> 16 Met Val Pro Glu Glu Glu Pro Gln Asp Arg Glu Lys Gly Leu Trp Trp 1 5 10 15 Phe Gln Leu Lys Val Trp Ser Met Ala Val Val Ser Ile Leu Leu Leu 20 25 30 Ser Val Cys Phe Thr Val Ser Ser Val Val Pro His Asn Phe Met Tyr 35 40 45 Ser Lys Thr Val Lys Arg Leu Ser Lys Leu Arg Glu Tyr Gln Gln Tyr 50 55 60 His Pro Ser Leu Thr Cys Val Met Glu Gly Lys Asp Ile Glu Asp Trp 65 70 75 80 Ser Cys Cys Pro Thr Pro Trp Thr Ser Phe Gln Ser Ser Cys Tyr Phe 85 90 95 Ile Ser Thr Gly Met Gln Ser Trp Thr Lys Ser Gln Lys Asn Cys Ser 100 105 110 Val Met Gly Ala Asp Leu Val Val Ile Asn Thr Arg Glu Glu Gln Asp 115 120 125 Phe Ile Ile Gln Asn Leu Lys Arg Asn Ser Ser Tyr Phe Leu Gly Leu 130 135 140 Ser Asp Pro Gly Gly Arg Arg His Trp Gln Trp Val Asp Gln Thr Pro 145 150 155 160 Tyr Asn Glu Asn Val Thr Phe Trp His Ser Gly Glu Pro Asn Asn Leu 165 170 175 Asp Glu Arg Cys Ala Ile Ile Asn Phe Arg Ser Ser Glu Glu Trp Gly 180 185 190 Trp Asn Asp Ile His Cys His Val Pro Gln Lys Ser Ile Cys Lys Met 195 200 205 Lys Lys Ile Tyr Ile 210 <210> 17 <211> 4012 <212> PRT <213> FRAS1 protein <400> 17 Met Gly Val Leu Lys Val Trp Leu Gly Leu Ala Leu Ala Leu Ala Glu 1 5 10 15 Phe Ala Val Leu Pro His His Ser Glu Gly Ala Cys Val Tyr Gln Asp 20 25 30 Ser Leu Leu Ala Asp Ala Thr Ile Trp Lys Pro Asp Ser Cys Gln Ser 35 40 45 Cys Arg Cys His Gly Asp Ile Val Ile Cys Lys Pro Ala Val Cys Arg 50 55 60 Asn Pro Gln Cys Ala Phe Glu Lys Gly Glu Val Leu Gln Ile Ala Ala 65 70 75 80 Asn Gln Cys Cys Pro Glu Cys Val Leu Arg Thr Pro Gly Ser Cys His 85 90 95 His Glu Lys Lys Ile His Glu His Gly Thr Glu Trp Ala Ser Ser Pro 100 105 110 Cys Ser Val Cys Ser Cys Asn His Gly Glu Val Arg Cys Thr Pro Gln 115 120 125 Pro Cys Pro Pro Leu Ser Cys Gly His Gln Glu Leu Ala Phe Ile Pro 130 135 140 Glu Gly Ser Cys Cys Pro Val Cys Val Gly Leu Gly Lys Pro Cys Ser 145 150 155 160 Tyr Glu Gly His Val Phe Gln Asp Gly Glu Asp Trp Arg Leu Ser Arg 165 170 175 Cys Ala Lys Cys Leu Cys Arg Asn Gly Val Ala Gln Cys Phe Thr Ala 180 185 190 Gln Cys Gln Pro Leu Phe Cys Asn Gln Asp Glu Thr Val Val Arg Val 195 200 205 Pro Gly Lys Cys Cys Pro Gln Cys Ser Ala Arg Ser Cys Ser Ala Ala 210 215 220 Gly Gln Val Tyr Glu His Gly Glu Gln Trp Ser Glu Asn Ala Cys Thr 225 230 235 240 Thr Cys Ile Cys Asp Arg Gly Glu Val Arg Cys His Lys Gln Ala Cys 245 250 255 Leu Pro Leu Arg Cys Gly Lys Gly Gln Ser Arg Ala Arg Arg His Gly 260 265 270 Gln Cys Cys Glu Glu Cys Val Ser Pro Ala Gly Ser Cys Ser Tyr Asp 275 280 285 Gly Val Val Arg Tyr Gln Asp Glu Met Trp Lys Gly Ser Ala Cys Glu 290 295 300 Phe Cys Met Cys Asp His Gly Gln Val Thr Cys Gln Thr Gly Glu Cys 305 310 315 320 Ala Lys Val Glu Cys Ala Arg Asp Glu Glu Leu Ile His Leu Asp Gly 325 330 335 Lys Cys Cys Pro Glu Cys Ile Ser Arg Asn Gly Tyr Cys Val Tyr Glu 340 345 350 Glu Thr Gly Glu Phe Met Ser Ser Asn Ala Ser Glu Val Lys Arg Ile 355 360 365 Pro Glu Gly Glu Lys Trp Glu Asp Gly Pro Cys Lys Val Cys Glu Cys 370 375 380 Arg Gly Ala Gln Val Thr Cys Tyr Glu Pro Ser Cys Pro Pro Cys Pro 385 390 395 400 Val Gly Thr Leu Ala Leu Glu Val Lys Gly Gln Cys Cys Pro Asp Cys 405 410 415 Thr Ser Val His Cys His Pro Asp Cys Leu Thr Cys Ser Gln Ser Pro 420 425 430 Asp His Cys Asp Leu Cys Gln Asp Pro Thr Lys Leu Leu Gln Asn Gly 435 440 445 Trp Cys Val His Ser Cys Gly Leu Gly Phe Tyr Gln Ala Gly Ser Leu 450 455 460 Cys Leu Ala Cys Gln Pro Gln Cys Ser Thr Cys Thr Ser Gly Leu Glu 465 470 475 480 Cys Ser Ser Cys Gln Pro Pro Leu Leu Met Arg His Gly Gln Cys Val 485 490 495 Pro Thr Cys Gly Asp Gly Phe Tyr Gln Asp Arg His Ser Cys Ala Val 500 505 510 Cys His Glu Ser Cys Ala Gly Cys Trp Gly Pro Thr Glu Lys His Cys 515 520 525 Leu Ala Cys Arg Asp Pro Leu His Val Leu Arg Asp Gly Gly Cys Glu 530 535 540 Ser Ser Cys Gly Lys Gly Phe Tyr Asn Arg Gln Gly Thr Cys Ser Ala 545 550 555 560 Cys Asp Gln Ser Cys Asp Ser Cys Gly Pro Ser Ser Pro Arg Cys Leu 565 570 575 Thr Cys Thr Glu Lys Thr Val Leu His Asp Gly Lys Cys Met Ser Glu 580 585 590 Cys Pro Gly Gly Tyr Tyr Ala Asp Ala Thr Gly Arg Cys Lys Val Cys 595 600 605 His Asn Ser Cys Ala Ser Cys Ser Gly Pro Thr Pro Ser His Cys Thr 610 615 620 Ala Cys Ser Pro Pro Lys Ala Leu Arg Gln Gly His Cys Leu Pro Arg 625 630 635 640 Cys Gly Glu Gly Phe Tyr Ser Asp His Gly Val Cys Lys Ala Cys His 645 650 655 Ser Ser Cys Leu Ala Cys Met Gly Pro Ala Pro Ser His Cys Thr Gly 660 665 670 Cys Lys Lys Pro Glu Glu Gly Leu Gln Val Glu Gln Leu Ser Asp Val 675 680 685 Gly Ile Pro Ser Gly Glu Cys Leu Ala Gln Cys Arg Ala His Phe Tyr 690 695 700 Leu Glu Ser Thr Gly Ile Cys Glu Ala Cys His Gln Ser Cys Phe Arg 705 710 715 720 Cys Ala Gly Lys Ser Pro His Asn Cys Thr Asp Cys Gly Pro Ser His 725 730 735 Val Leu Leu Asp Gly Gln Cys Leu Ser Gln Cys Pro Asp Gly Tyr Phe 740 745 750 His Gln Glu Gly Ser Cys Thr Glu Cys His Pro Thr Cys Arg Gln Cys 755 760 765 His Gly Pro Leu Glu Ser Asp Cys Ile Ser Cys Tyr Pro His Ile Ser 770 775 780 Leu Thr Asn Gly Asn Cys Arg Thr Ser Cys Arg Glu Glu Gln Phe Leu 785 790 795 800 Asn Leu Val Gly Tyr Cys Ala Asp Cys His His Leu Cys Gln His Cys 805 810 815 Ala Ala Asp Leu His Asn Thr Gly Ser Ile Cys Leu Arg Cys Gln Asn 820 825 830 Ala His Tyr Leu Leu Leu Gly Asp His Cys Val Pro Asp Cys Pro Ser 835 840 845 Gly Tyr Tyr Ala Glu Arg Gly Ala Cys Lys Lys Cys His Ser Ser Cys 850 855 860 Arg Thr Cys Gln Gly Arg Gly Pro Phe Ser Cys Ser Ser Cys Asp Thr 865 870 875 880 Asn Leu Val Leu Ser His Thr Gly Thr Cys Ser Thr Thr Cys Phe Pro 885 890 895 Gly His Tyr Leu Asp Asp Asn His Val Cys Gln Pro Cys Asn Thr His 900 905 910 Cys Gly Ser Cys Asp Ser Gln Ala Ser Cys Thr Ser Cys Arg Asp Pro 915 920 925 Asn Lys Val Leu Leu Phe Gly Glu Cys Gln Tyr Glu Ser Cys Ala Pro 930 935 940 Gln Tyr Tyr Leu Asp Phe Ser Thr Asn Thr Cys Lys Glu Cys Asp Trp 945 950 955 960 Ser Cys Ser Ala Cys Ser Gly Pro Leu Lys Thr Asp Cys Leu Gln Cys 965 970 975 Met Asp Gly Tyr Val Leu Gln Asp Gly Ala Cys Val Glu Gln Cys Leu 980 985 990 Ser Ser Phe Tyr Gln Asp Ser Gly Leu Cys Lys Asn Cys Asp Ser Tyr 995 1000 1005 Cys Leu Gln Cys Gln Gly Pro His Glu Cys Thr Arg Cys Lys Gly Pro 1010 1015 1020 Phe Leu Leu Leu Glu Ala Gln Cys Val Gln Glu Cys Gly Lys Gly Tyr 1025 1030 1035 1040 Phe Ala Asp His Ala Lys His Lys Cys Thr Ala Cys Pro Gln Gly Cys 1045 1050 1055 Leu Gln Cys Ser His Arg Asp Arg Cys His Leu Cys Asp His Gly Phe 1060 1065 1070 Phe Leu Lys Ser Gly Leu Cys Val Tyr Asn Cys Val Pro Gly Phe Ser 1075 1080 1085 Val His Thr Ser Asn Glu Thr Cys Ser Gly Lys Ile His Thr Pro Ser 1090 1095 1100 Leu His Val Asn Gly Ser Leu Ile Leu Pro Ile Gly Ser Ile Lys Pro 1105 1110 1115 1120 Leu Asp Phe Ser Leu Leu Asn Val Gln Asp Gln Glu Gly Arg Val Glu 1125 1130 1135 Asp Leu Leu Phe His Val Val Ser Thr Pro Thr Asn Gly Gln Leu Val 1140 1145 1150 Leu Ser Arg Asn Gly Lys Glu Val Gln Leu Asp Lys Ala Gly Arg Phe 1155 1160 1165 Ser Trp Lys Asp Val Asn Glu Lys Lys Val Arg Phe Val His Ser Lys 1170 1175 1180 Glu Lys Leu Arg Lys Gly Tyr Leu Phe Leu Lys Ile Ser Asp Gln Gln 1185 1190 1195 1200 Phe Phe Ser Glu Pro Gln Leu Ile Asn Ile Gln Ala Phe Ser Thr Gln 1205 1210 1215 Ala Pro Tyr Val Leu Arg Asn Glu Val Leu His Ile Ser Arg Gly Glu 1220 1225 1230 Arg Ala Thr Ile Thr Thr Gln Met Leu Asp Ile Arg Asp Asp Asp Asn 1235 1240 1245 Pro Gln Asp Val Val Ile Glu Ile Ile Asp Pro Pro Leu His Gly Gln 1250 1255 1260 Leu Leu Gln Thr Leu Gln Ser Pro Ala Thr Pro Ile Tyr Gln Phe Gln 1265 1270 1275 1280 Leu Asp Glu Leu Ser Arg Gly Leu Leu His Tyr Ala His Asp Gly Ser 1285 1290 1295 Asp Ser Thr Ser Asp Val Ala Val Leu Gln Ala Asn Asp Gly His Ser 1300 1305 1310 Phe His Asn Ile Leu Phe Gln Val Lys Thr Val Pro Gln Asn Asp Arg 1315 1320 1325 Gly Leu Gln Leu Val Ala Asn Ser Met Val Trp Val Pro Glu Gly Gly 1330 1335 1340 Met Leu Gln Ile Thr Asn Arg Ile Leu Gln Ala Glu Ala Pro Gly Ala 1345 1350 1355 1360 Ser Ala Glu Glu Ile Ile Tyr Lys Ile Thr Gln Asp Tyr Pro Gln Phe 1365 1370 1375 Gly Glu Val Val Leu Leu Val Asn Met Pro Ala Asp Ser Pro Ala Asp 1380 1385 1390 Glu Gly Gln His Leu Pro Asp Gly Arg Thr Ala Thr Pro Thr Ser Thr 1395 1400 1405 Phe Thr Gln Gln Asp Ile Asn Glu Gly Ile Val Trp Tyr Arg His Ser 1410 1415 1420 Gly Ala Pro Ala Gln Ser Asp Ser Phe Arg Phe Glu Val Ser Ser Ala 1425 1430 1435 1440 Ser Asn Ala Gln Thr Arg Leu Glu Ser His Met Phe Asn Ile Ala Ile 1445 1450 1455 Leu Pro Gln Thr Pro Glu Ala Pro Lys Val Ser Leu Glu Ala Ser Leu 1460 1465 1470 His Met Thr Ala Arg Glu Asp Gly Leu Thr Val Ile Gln Pro His Ser 1475 1480 1485 Leu Ser Phe Ile Asn Ser Glu Lys Pro Ser Gly Lys Ile Val Tyr Asn 1490 1495 1500 Ile Thr Leu Pro Leu His Pro Asn Gln Gly Ile Ile Glu His Arg Asp 1505 1510 1515 1520 His Pro His Ser Pro Ile Arg Tyr Phe Thr Gln Glu Asp Ile Asn Gln 1525 1530 1535 Gly Lys Val Met Tyr Arg Pro Pro Pro Ala Ala Pro His Leu Gln Glu 1540 1545 1550 Leu Met Ala Phe Ser Phe Ala Gly Leu Pro Glu Ser Val Lys Phe His 1555 1560 1565 Phe Thr Val Ser Asp Gly Glu His Thr Ser Pro Glu Met Val Leu Thr 1570 1575 1580 Ile His Leu Leu Pro Ser Asp Gln Gln Leu Pro Val Phe Gln Val Thr 1585 1590 1595 1600 Ala Pro Arg Leu Ala Val Ser Pro Gly Gly Ser Thr Ser Val Gly Leu 1605 1610 1615 Gln Val Val Val Arg Asp Ala Glu Thr Ala Pro Lys Glu Leu Phe Phe 1620 1625 1630 Glu Leu Arg Arg Pro Pro Gln His Gly Val Leu Leu Lys His Thr Ala 1635 1640 1645 Glu Phe Arg Arg Pro Met Ala Thr Gly Asp Thr Phe Thr Tyr Glu Asp 1650 1655 1660 Val Glu Lys Asn Ala Leu Gln Tyr Ile His Asp Gly Ser Ser Thr Arg 1665 1670 1675 1680 Glu Asp Ser Met Glu Ile Ser Val Thr Asp Gly Leu Thr Val Thr Met 1685 1690 1695 Leu Glu Val Arg Val Glu Val Ser Leu Ser Glu Asp Arg Gly Pro Arg 1700 1705 1710 Leu Ala Ala Gly Ser Ser Leu Ser Ile Thr Val Ala Ser Lys Ser Thr 1715 1720 1725 Ala Ile Ile Thr Arg Ser His Leu Ala Tyr Val Asp Asp Ser Ser Pro 1730 1735 1740 Asp Pro Glu Ile Trp Ile Gln Leu Asn Tyr Leu Pro Ser Tyr Gly Thr 1745 1750 1755 1760 Leu Leu Arg Ile Ser Gly Ser Glu Val Glu Glu Leu Ser Glu Val Ser 1765 1770 1775 Asn Phe Thr Met Glu Asp Ile Asn Asn Lys Lys Ile Arg Tyr Ser Ala 1780 1785 1790 Val Phe Glu Thr Asp Gly His Leu Val Thr Asp Ser Phe Tyr Phe Ser 1795 1800 1805 Val Ser Asp Met Asp His Asn His Leu Asp Asn Gln Ile Phe Thr Ile 1810 1815 1820 Met Ile Thr Pro Ala Glu Asn Pro Pro Pro Val Ile Ala Phe Ala Asp 1825 1830 1835 1840 Leu Ile Thr Val Asp Glu Gly Gly Arg Ala Pro Leu Ser Phe His His 1845 1850 1855 Phe Phe Ala Thr Asp Asp Asp Asp Asn Leu Gln Arg Asp Ala Ile Ile 1860 1865 1870 Lys Leu Ser Ala Leu Pro Lys Tyr Gly Cys Ile Glu Asn Thr Gly Thr 1875 1880 1885 Gly Asp Arg Phe Gly Pro Glu Thr Ala Ser Asp Leu Glu Ala Ser Phe 1890 1895 1900 Pro Ile Gln Asp Val Leu Glu Asn Tyr Ile Tyr Tyr Phe Gln Ser Val 1905 1910 1915 1920 His Glu Ser Ile Glu Pro Thr His Asp Ile Phe Ser Phe Tyr Val Ser 1925 1930 1935 Asp Gly Thr Ser Arg Ser Glu Ile His Ser Ile Asn Ile Thr Ile Glu 1940 1945 1950 Arg Lys Asn Asp Glu Pro Pro Arg Met Thr Leu Gln Pro Leu Arg Val 1955 1960 1965 Gln Leu Ser Ser Gly Val Val Ile Ser Asn Ser Ser Leu Ser Leu Gln 1970 1975 1980 Asp Leu Asp Thr Pro Asp Asn Glu Leu Ile Phe Val Leu Thr Lys Lys 1985 1990 1995 2000 Pro Asp His Gly His Val Leu Trp Arg Gln Thr Ala Ser Glu Pro Leu 2005 2010 2015 Glu Asn Gly Arg Val Leu Val Gln Gly Ser Thr Phe Thr Tyr Gln Asp 2020 2025 2030 Ile Leu Ala Gly Leu Val Gly Tyr Val Pro Ser Val Pro Gly Met Val 2035 2040 2045 Val Asp Glu Phe Gln Phe Ser Leu Thr Asp Gly Leu His Val Asp Thr 2050 2055 2060 Gly Arg Met Lys Ile Tyr Thr Glu Leu Pro Ala Ser Asp Thr Pro His 2065 2070 2075 2080 Leu Ala Ile Asn Gln Gly Leu Gln Leu Ser Ala Gly Ser Val Ala Arg 2085 2090 2095 Ile Thr Glu Gln His Leu Lys Val Thr Asp Ile Asp Ser Asp Asp His 2100 2105 2110 Gln Val Met Tyr Ile Met Lys Glu Asp Pro Gly Ala Gly Arg Leu Gln 2115 2120 2125 Met Met Lys His Gly Asn Leu Glu Gln Ile Ser Ile Lys Gly Pro Ile 2130 2135 2140 Arg Ser Phe Thr Gln Ala Asp Ile Ser Gln Gly His Val Glu Tyr Ser 2145 2150 2155 2160 His Gly Thr Gly Glu Pro Gly Gly Ser Phe Ala Phe Lys Phe Asp Val 2165 2170 2175 Val Asp Gly Glu Gly Asn Arg Leu Ile Asp Lys Ser Phe Ser Ile Ser 2180 2185 2190 Ile Leu Glu Asp Lys Ser Pro Pro Val Ile Thr Thr Asn Lys Gly Leu 2195 2200 2205 Val Leu Asp Glu Asn Ser Val Lys Lys Ile Thr Thr Leu Gln Leu Ser 2210 2215 2220 Ala Thr Asp Gln Asp Ser Gly Pro Thr Glu Leu Ile Tyr Arg Ile Thr 2225 2230 2235 2240 Arg Gln Pro Gln Leu Gly His Leu Glu His Ala Ala Ser Pro Gly Ile 2245 2250 2255 Gln Ile Ser Ser Phe Thr Gln Ala Asp Leu Thr Ser Arg Asn Val Gln 2260 2265 2270 Tyr Val His Ser Ser Glu Ala Glu Lys His Ser Asp Ala Phe Ser Phe 2275 2280 2285 Thr Leu Ser Asp Gly Val Ser Glu Val Thr Gln Thr Phe His Ile Thr 2290 2295 2300 Leu His Pro Val Asp Asp Ser Leu Pro Val Val Gln Asn Leu Gly Met 2305 2310 2315 2320 Arg Val Gln Glu Gly Met Arg Lys Thr Ile Thr Glu Phe Glu Leu Lys 2325 2330 2335 Ala Val Asp Ala Asp Thr Glu Ala Glu Ser Val Thr Phe Thr Ile Val 2340 2345 2350 Gln Pro Pro Arg His Gly Thr Ile Glu Arg Thr Ser Asn Gly Gln His 2355 2360 2365 Phe His Leu Thr Ser Thr Phe Thr Met Lys Asp Ile Tyr Gln Asn Arg 2370 2375 2380 Val Ser Tyr Ser His Asp Gly Ser Asn Ser Leu Lys Asp Arg Phe Thr 2385 2390 2395 2400 Phe Thr Val Ser Asp Gly Thr Asn Pro Phe Phe Ile Ile Glu Glu Gly 2405 2410 2415 Gly Lys Glu Ile Met Thr Ala Ala Pro Gln Pro Phe Arg Val Asp Ile 2420 2425 2430 Leu Pro Val Asp Asp Gly Thr Pro Arg Ile Val Thr Asn Leu Gly Leu 2435 2440 2445 Gln Trp Leu Glu Tyr Met Asp Gly Lys Ala Thr Asn Leu Ile Thr Lys 2450 2455 2460 Lys Glu Leu Leu Thr Met Asp Pro Asp Thr Glu Asp Ala Gln Leu Val 2465 2470 2475 2480 Tyr Glu Ile Thr Thr Gly Pro Lys His Gly Phe Val Glu Asn Lys Leu 2485 2490 2495 Gln Pro Gly Arg Ala Ala Ala Thr Phe Thr Gln Glu Asp Val Asn Leu 2500 2505 2510 Gly Leu Ile Arg Tyr Val Leu His Lys Glu Lys Ile Arg Glu Met Met 2515 2520 2525 Asp Ser Phe Gln Phe Leu Val Lys Asp Ser Lys Pro Asn Val Val Ser 2530 2535 2540 Asp Asn Val Phe His Ile Gln Trp Ser Leu Ile Ser Phe Lys Tyr Thr 2545 2550 2555 2560 Ser Tyr Asn Val Ser Glu Lys Ala Gly Ser Val Ser Val Thr Val Gln 2565 2570 2575 Arg Thr Gly Asn Leu Asn Gln Tyr Ala Ile Val Leu Cys Arg Thr Glu 2580 2585 2590 Gln Gly Thr Ala Ser Ser Ser Ser Arg Val Ser Ser Gln Pro Gly Gln 2595 2600 2605 Gln Asp Tyr Val Glu Tyr Ala Gly Gln Val Gln Phe Asp Glu Arg Glu 2610 2615 2620 Asp Thr Lys Ser Cys Thr Ile Val Ile Asn Asp Asp Asp Val Phe Glu 2625 2630 2635 2640 Asn Val Glu Ser Phe Thr Val Glu Leu Ser Met Pro Ala Tyr Ala Leu 2645 2650 2655 Leu Gly Glu Phe Thr Gln Ala Lys Val Ile Ile Asn Asp Thr Glu Asp 2660 2665 2670 Glu Pro Thr Leu Glu Phe Asp Lys Lys Ile Tyr Trp Val Asn Glu Ser 2675 2680 2685 Ala Gly Phe Leu Phe Ala Pro Ile Glu Arg Lys Gly Asp Ala Ser Ser 2690 2695 2700 Ile Val Ser Ala Ile Cys Tyr Thr Val Pro Lys Ser Ala Met Gly Ser 2705 2710 2715 2720 Ser Leu Tyr Ala Leu Glu Ser Gly Ser Asp Phe Lys Ser Arg Gly Met 2725 2730 2735 Ser Ala Ala Ser Arg Val Ile Phe Gly Pro Gly Val Thr Met Ser Thr 2740 2745 2750 Cys Asp Val Met Leu Ile Asp Asp Ser Glu Tyr Glu Glu Glu Glu Glu 2755 2760 2765 Phe Glu Ile Ala Leu Ala Asp Ala Ser Asp Asn Ala Arg Ile Gly Arg 2770 2775 2780 Val Ala Thr Ala Lys Val Leu Ile Ser Gly Pro Asn Asp Ala Ser Thr 2785 2790 2795 2800 Val Ser Leu Gly Asn Thr Ala Phe Thr Val Ser Glu Asp Ala Gly Thr 2805 2810 2815 Val Lys Ile Pro Val Ile Arg His Gly Thr Asp Leu Ser Thr Phe Ala 2820 2825 2830 Ser Val Trp Cys Ala Thr Arg Pro Ser Asp Pro Ala Ser Ala Thr Pro 2835 2840 2845 Gly Val Asp Tyr Val Pro Ser Ser Arg Lys Val Glu Phe Gly Pro Gly 2850 2855 2860 Val Ile Glu Gln Tyr Cys Thr Leu Thr Ile Leu Asp Asp Thr Gln Tyr 2865 2870 2875 2880 Pro Val Ile Glu Gly Leu Glu Thr Phe Val Val Phe Leu Ser Ser Ala 2885 2890 2895 Gln Gly Ala Glu Leu Thr Lys Pro Phe Gln Ala Val Ile Ala Ile Asn 2900 2905 2910 Asp Thr Phe Gln Asp Val Pro Ser Met Gln Phe Ala Lys Asp Leu Leu 2915 2920 2925 Leu Val Lys Glu Lys Glu Gly Val Leu His Val Pro Ile Thr Arg Ser 2930 2935 2940 Gly Asp Leu Ser Tyr Glu Ser Ser Val Arg Cys Tyr Thr Gln Ser His 2945 2950 2955 2960 Ser Ala Gln Val Met Glu Asp Phe Glu Glu Arg Gln Asn Ala Asp Ser 2965 2970 2975 Ser Arg Ile Thr Phe Leu Lys Gly Asp Lys Val Lys Asn Cys Thr Val 2980 2985 2990 Tyr Ile His Asp Asp Ser Met Phe Glu Pro Glu Glu Gln Phe Arg Val 2995 3000 3005 Tyr Leu Gly Leu Pro Leu Gly Asn His Trp Ser Gly Ala Arg Ile Gly 3010 3015 3020 Lys Asn Asn Met Ala Thr Ile Thr Ile Ser Asn Asp Glu Asp Ala Pro 3025 3030 3035 3040 Thr Ile Glu Phe Glu Glu Ala Ala Tyr Gln Val Arg Glu Pro Ala Gly 3045 3050 3055 Pro Asp Ala Ile Ala Ile Leu Asn Ile Lys Val Ile Arg Arg Gly Asp 3060 3065 3070 Gln Asn Arg Thr Ser Lys Val Arg Cys Ser Thr Arg Asp Gly Ser Ala 3075 3080 3085 Gln Ser Gly Val Asp Tyr Tyr Pro Lys Ser Arg Val Leu Lys Phe Ser 3090 3095 3100 Pro Gly Val Asp His Ile Phe Phe Lys Val Glu Ile Leu Ser Asn Glu 3105 3110 3115 3120 Asp Arg Glu Trp His Glu Ser Phe Ser Leu Val Leu Gly Pro Asp Asp 3125 3130 3135 Pro Val Glu Ala Val Leu Gly Asp Val Thr Thr Ala Thr Val Thr Ile 3140 3145 3150 Leu Asp Gln Glu Ala Ala Gly Ser Leu Ile Leu Pro Ala Pro Pro Ile 3155 3160 3165 Val Val Thr Leu Ala Asp Tyr Asp His Val Glu Glu Val Thr Lys Glu 3170 3175 3180 Gly Val Lys Lys Ser Pro Ser Pro Gly Tyr Pro Leu Val Cys Val Thr 3185 3190 3195 3200 Pro Cys Asp Pro His Phe Pro Arg Tyr Ala Val Met Lys Glu Arg Cys 3205 3210 3215 Ser Glu Ala Gly Ile Asn Gln Thr Ser Val Gln Phe Ser Trp Glu Val 3220 3225 3230 Ala Ala Pro Thr Asp Gly Asn Gly Ala Arg Ser Pro Phe Glu Thr Ile 3235 3240 3245 Thr Asp Asn Thr Pro Phe Thr Ser Val Asn His Met Val Leu Asp Ser 3250 3255 3260 Ile Tyr Phe Ser Arg Arg Phe His Val Arg Cys Val Ala Lys Ala Val 3265 3270 3275 3280 Asp Lys Val Gly His Val Gly Thr Pro Leu Arg Ser Asn Ile Val Thr 3285 3290 3295 Ile Gly Thr Asp Ser Ala Ile Cys His Thr Pro Val Val Ala Gly Thr 3300 3305 3310 Ser Arg Gly Phe Gln Ala Gln Ser Phe Ile Ala Thr Leu Lys Tyr Leu 3315 3320 3325 Asp Val Lys His Lys Glu His Pro Asn Arg Ile His Ile Ser Val Gln 3330 3335 3340 Ile Pro His Gln Asp Gly Met Leu Pro Leu Ile Ser Thr Met Pro Leu 3345 3350 3355 3360 His Asn Leu His Phe Leu Leu Ser Glu Ser Ile Tyr Arg His Gln His 3365 3370 3375 Val Cys Ser Asn Leu Val Thr Thr Tyr Asp Leu Arg Gly Ile Ser Glu 3380 3385 3390 Ala Gly Phe Leu Asp Asp Val Val Tyr Asp Ser Thr Ala Leu Gly Pro 3395 3400 3405 Gly Tyr Asp Arg Pro Phe Gln Phe Asp Pro Ser Val Arg Glu Pro Lys 3410 3415 3420 Thr Ile Gln Leu Tyr Lys His Leu Asn Leu Lys Ser Cys Val Trp Thr 3425 3430 3435 3440 Phe Asp Ala Tyr Tyr Asp Met Thr Glu Leu Ile Asp Val Cys Gly Gly 3445 3450 3455 Ser Val Thr Ala Asp Phe Gln Val Arg Asp Ser Ala Gln Ser Phe Leu 3460 3465 3470 Thr Val His Val Pro Leu Tyr Val Ser Tyr Ile Tyr Val Thr Ala Pro 3475 3480 3485 Arg Gly Trp Ala Ser Leu Glu His His Thr Glu Met Glu Phe Ser Phe 3490 3495 3500 Phe Tyr Asp Thr Val Leu Trp Arg Thr Gly Ile Gln Thr Asp Ser Val 3505 3510 3515 3520 Leu Ser Ala Arg Leu Gln Ile Ile Arg Ile Tyr Ile Arg Glu Asp Gly 3525 3530 3535 Arg Leu Val Ile Glu Phe Lys Thr His Ala Lys Phe Arg Gly Gln Phe 3540 3545 3550 Val Met Glu His His Thr Leu Pro Glu Val Lys Ser Phe Val Leu Thr 3555 3560 3565 Pro Asp His Leu Gly Gly Ile Glu Phe Asp Leu Gln Leu Leu Trp Ser 3570 3575 3580 Ala Gln Thr Phe Asp Ser Pro His Gln Leu Trp Arg Ala Thr Ser Ser 3585 3590 3595 3600 Tyr Asn Arg Lys Asp Tyr Ser Gly Glu Tyr Thr Ile Tyr Leu Ile Pro 3605 3610 3615 Cys Thr Val Gln Pro Thr Gln Pro Trp Val Asp Pro Gly Glu Lys Pro 3620 3625 3630 Leu Ala Cys Thr Ala His Ala Pro Glu Arg Phe Leu Ile Pro Ile Ala 3635 3640 3645 Phe Gln Gln Thr Asn Arg Pro Val Pro Val Val Tyr Ser Leu Asn Thr 3650 3655 3660 Glu Phe Gln Leu Cys Asn Asn Glu Lys Val Phe Leu Met Asp Pro Asn 3665 3670 3675 3680 Thr Ser Asp Met Ser Leu Ala Glu Met Asp Tyr Lys Gly Ala Phe Ser 3685 3690 3695 Lys Gly Gln Ile Leu Tyr Gly Arg Val Leu Trp Asn Pro Glu Gln Asn 3700 3705 3710 Leu Asn Ser Ala Tyr Lys Leu Gln Leu Glu Lys Val Tyr Leu Cys Thr 3715 3720 3725 Gly Lys Asp Gly Tyr Val Pro Phe Phe Asp Pro Thr Gly Thr Ile Tyr 3730 3735 3740 Asn Glu Gly Pro Gln Tyr Gly Cys Ile Gln Pro Asn Lys His Leu Lys 3745 3750 3755 3760 His Arg Phe Leu Leu Leu Asp Arg Asn Gln Pro Glu Val Thr Asp Lys 3765 3770 3775 Tyr Phe His Asp Val Pro Phe Glu Ala His Phe Ala Ser Glu Leu Pro 3780 3785 3790 Asp Phe His Val Val Ser Asn Met Pro Gly Val Asp Gly Phe Thr Leu 3795 3800 3805 Lys Val Asp Ala Leu Tyr Lys Val Glu Ala Gly His Gln Trp Tyr Leu 3810 3815 3820 Gln Val Ile Tyr Ile Ile Gly Pro Asp Thr Ile Ser Gly Pro Arg Val 3825 3830 3835 3840 Gln Arg Ser Leu Thr Ala Pro Leu Arg Arg Asn Arg Arg Asp Leu Val 3845 3850 3855 Glu Pro Asp Gly Gln Leu Ile Leu Asp Asp Ser Leu Ile Tyr Asp Asn 3860 3865 3870 Glu Gly Asp Gln Val Lys Asn Gly Thr Asn Met Lys Ser Leu Asn Leu 3875 3880 3885 Glu Met Gln Glu Leu Ala Val Ala Ala Ser Leu Ser Gln Thr Gly Ala 3890 3895 3900 Ser Ile Gly Ser Ala Leu Ala Ala Ile Met Leu Leu Leu Leu Val Phe 3905 3910 3915 3920 Leu Val Ala Cys Phe Ile Asn Arg Lys Cys Gln Lys Gln Arg Lys Lys 3925 3930 3935 Lys Pro Ala Glu Asp Ile Leu Glu Glu Tyr Pro Leu Asn Thr Lys Val 3940 3945 3950 Glu Val Pro Lys Arg His Pro Asp Arg Val Glu Lys Asn Val Asn Arg 3955 3960 3965 His Tyr Cys Thr Val Arg Asn Val Asn Ile Leu Ser Glu Pro Glu Ala 3970 3975 3980 Ala Tyr Thr Phe Lys Gly Ala Lys Val Lys Arg Leu Asn Leu Glu Val 3985 3990 3995 4000 Arg Val His Asn Asn Leu Gln Asp Gly Thr Glu Val 4005 4010 <210> 18 <211> 1469 <212> PRT <213> ADGRL3 protein <400> 18 Met Trp Pro Ser Gln Leu Leu Ile Phe Met Met Leu Leu Ala Pro Ile 1 5 10 15 Ile His Ala Phe Ser Arg Ala Pro Ile Pro Met Ala Val Val Arg Arg 20 25 30 Glu Leu Ser Cys Glu Ser Tyr Pro Ile Glu Leu Arg Cys Pro Gly Thr 35 40 45 Asp Val Ile Met Ile Glu Ser Ala Asn Tyr Gly Arg Thr Asp Asp Lys 50 55 60 Ile Cys Asp Ser Asp Pro Ala Gln Met Glu Asn Ile Arg Cys Tyr Leu 65 70 75 80 Pro Asp Ala Tyr Lys Ile Met Ser Gln Arg Cys Asn Asn Arg Thr Gln 85 90 95 Cys Ala Val Val Ala Gly Pro Asp Val Phe Pro Asp Pro Cys Pro Gly 100 105 110 Thr Tyr Lys Tyr Leu Glu Val Gln Tyr Glu Cys Val Pro Tyr Lys Val 115 120 125 Glu Gln Lys Val Phe Leu Cys Pro Gly Leu Leu Lys Gly Val Tyr Gln 130 135 140 Ser Glu His Leu Phe Glu Ser Asp His Gln Ser Gly Ala Trp Cys Lys 145 150 155 160 Asp Pro Leu Gln Ala Ser Asp Lys Ile Tyr Tyr Met Pro Trp Thr Pro 165 170 175 Tyr Arg Thr Asp Thr Leu Thr Glu Tyr Ser Ser Lys Asp Asp Phe Ile 180 185 190 Ala Gly Arg Pro Thr Thr Thr Tyr Lys Leu Pro His Arg Val Asp Gly 195 200 205 Thr Gly Phe Val Val Tyr Asp Gly Ala Leu Phe Phe Asn Lys Glu Arg 210 215 220 Thr Arg Asn Ile Val Lys Phe Asp Leu Arg Thr Arg Ile Lys Ser Gly 225 230 235 240 Glu Ala Ile Ile Ala Asn Ala Asn Tyr His Asp Thr Ser Pro Tyr Arg 245 250 255 Trp Gly Gly Lys Ser Asp Ile Asp Leu Ala Val Asp Glu Asn Gly Leu 260 265 270 Trp Val Ile Tyr Ala Thr Glu Gln Asn Asn Gly Lys Ile Val Ile Ser 275 280 285 Gln Leu Asn Pro Tyr Thr Leu Arg Ile Glu Gly Thr Trp Asp Thr Ala 290 295 300 Tyr Asp Lys Arg Ser Ala Ser Asn Ala Phe Met Ile Cys Gly Ile Leu 305 310 315 320 Tyr Val Val Lys Ser Val Tyr Glu Asp Asp Asp Asn Glu Ala Thr Gly 325 330 335 Asn Lys Ile Asp Tyr Ile Tyr Asn Thr Asp Gln Ser Lys Asp Ser Leu 340 345 350 Val Asp Val Pro Phe Pro Asn Ser Tyr Gln Tyr Ile Ala Ala Val Asp 355 360 365 Tyr Asn Pro Arg Asp Asn Leu Leu Tyr Val Trp Asn Asn Tyr His Val 370 375 380 Val Lys Tyr Ser Leu Asp Phe Gly Pro Leu Asp Ser Arg Ser Gly Gln 385 390 395 400 Ala His His Gly Gln Val Ser Tyr Ile Ser Pro Pro Ile His Leu Asp 405 410 415 Ser Glu Leu Glu Arg Pro Ser Val Lys Asp Ile Ser Thr Thr Gly Pro 420 425 430 Leu Gly Met Gly Ser Thr Thr Thr Ser Thr Thr Leu Arg Thr Thr Thr 435 440 445 Leu Ser Pro Gly Arg Ser Thr Thr Pro Ser Val Ser Gly Arg Arg Asn 450 455 460 Arg Ser Thr Ser Thr Pro Ser Pro Ala Val Glu Val Leu Asp Asp Met 465 470 475 480 Thr Thr His Leu Pro Ser Ala Ser Ser Gln Ile Pro Ala Leu Glu Glu 485 490 495 Ser Cys Glu Ala Val Glu Ala Arg Glu Ile Met Trp Phe Lys Thr Arg 500 505 510 Gln Gly Gln Ile Ala Lys Gln Pro Cys Pro Ala Gly Thr Ile Gly Val 515 520 525 Ser Thr Tyr Leu Cys Leu Ala Pro Asp Gly Ile Trp Asp Pro Gln Gly 530 535 540 Pro Asp Leu Ser Asn Cys Ser Ser Pro Trp Val Asn His Ile Thr Gln 545 550 555 560 Lys Leu Lys Ser Gly Glu Thr Ala Ala Asn Ile Ala Arg Glu Leu Ala 565 570 575 Glu Gln Thr Arg Asn His Leu Asn Ala Gly Asp Ile Thr Tyr Ser Val 580 585 590 Arg Ala Met Asp Gln Leu Val Gly Leu Leu Asp Val Gln Leu Arg Asn 595 600 605 Leu Thr Pro Gly Gly Lys Asp Ser Ala Ala Arg Ser Leu Asn Lys Leu 610 615 620 Gln Lys Arg Glu Arg Ser Cys Arg Ala Tyr Val Gln Ala Met Val Glu 625 630 635 640 Thr Val Asn Asn Leu Leu Gln Pro Gln Ala Leu Asn Ala Trp Arg Asp 645 650 655 Leu Thr Thr Ser Asp Gln Leu Arg Ala Ala Thr Met Leu Leu His Thr 660 665 670 Val Glu Glu Ser Ala Phe Val Leu Ala Asp Asn Leu Leu Lys Thr Asp 675 680 685 Ile Val Arg Glu Asn Thr Asp Asn Ile Lys Leu Glu Val Ala Arg Leu 690 695 700 Ser Thr Glu Gly Asn Leu Glu Asp Leu Lys Phe Pro Glu Asn Met Gly 705 710 715 720 His Gly Ser Thr Ile Gln Leu Ser Ala Asn Thr Leu Lys Gln Asn Gly 725 730 735 Arg Asn Gly Glu Ile Arg Val Ala Phe Val Leu Tyr Asn Asn Leu Gly 740 745 750 Pro Tyr Leu Ser Thr Glu Asn Ala Ser Met Lys Leu Gly Thr Glu Ala 755 760 765 Leu Ser Thr Asn His Ser Val Ile Val Asn Ser Pro Val Ile Thr Ala 770 775 780 Ala Ile Asn Lys Glu Phe Ser Asn Lys Val Tyr Leu Ala Asp Pro Val 785 790 795 800 Val Phe Thr Val Lys His Ile Lys Gln Ser Glu Glu Asn Phe Asn Pro 805 810 815 Asn Cys Ser Phe Trp Ser Tyr Ser Lys Arg Thr Met Thr Gly Tyr Trp 820 825 830 Ser Thr Gln Gly Cys Arg Leu Leu Thr Thr Asn Lys Thr His Thr Thr 835 840 845 Cys Ser Cys Asn His Leu Thr Asn Phe Ala Val Leu Met Ala His Val 850 855 860 Glu Val Lys His Ser Asp Ala Val His Asp Leu Leu Leu Asp Val Ile 865 870 875 880 Thr Trp Val Gly Ile Leu Leu Ser Leu Val Cys Leu Leu Ile Cys Ile 885 890 895 Phe Thr Phe Cys Phe Phe Arg Gly Leu Gln Ser Asp Arg Asn Thr Ile 900 905 910 His Lys Asn Leu Cys Ile Ser Leu Phe Val Ala Glu Leu Leu Phe Leu 915 920 925 Ile Gly Ile Asn Arg Thr Asp Gln Pro Ile Ala Cys Ala Val Phe Ala 930 935 940 Ala Leu Leu His Phe Phe Phe Leu Ala Ala Phe Thr Trp Met Phe Leu 945 950 955 960 Glu Gly Val Gln Leu Tyr Ile Met Leu Val Glu Val Phe Glu Ser Glu 965 970 975 His Ser Arg Arg Lys Tyr Phe Tyr Leu Val Gly Tyr Gly Met Pro Ala 980 985 990 Leu Ile Val Ala Val Ser Ala Ala Val Asp Tyr Arg Ser Tyr Gly Thr 995 1000 1005 Asp Lys Val Cys Trp Leu Arg Leu Asp Thr Tyr Phe Ile Trp Ser Phe 1010 1015 1020 Ile Gly Pro Ala Thr Leu Ile Ile Met Leu Asn Val Ile Phe Leu Gly 1025 1030 1035 1040 Ile Ala Leu Tyr Lys Met Phe His His Thr Ala Ile Leu Lys Pro Glu 1045 1050 1055 Ser Gly Cys Leu Asp Asn Ile Asn Tyr Glu Asp Asn Arg Pro Phe Ile 1060 1065 1070 Lys Ser Trp Val Ile Gly Ala Ile Ala Leu Leu Cys Leu Leu Gly Leu 1075 1080 1085 Thr Trp Ala Phe Gly Leu Met Tyr Ile Asn Glu Ser Thr Val Ile Met 1090 1095 1100 Ala Tyr Leu Phe Thr Ile Phe Asn Ser Leu Gln Gly Met Phe Ile Phe 1105 1110 1115 1120 Ile Phe His Cys Val Leu Gln Lys Lys Val Arg Lys Glu Tyr Gly Lys 1125 1130 1135 Cys Leu Arg Thr His Cys Cys Ser Gly Lys Ser Thr Glu Ser Ser Ile 1140 1145 1150 Gly Ser Gly Lys Thr Ser Gly Ser Arg Thr Pro Gly Arg Tyr Ser Thr 1155 1160 1165 Gly Ser Gln Ser Arg Ile Arg Arg Met Trp Asn Asp Thr Val Arg Lys 1170 1175 1180 Gln Ser Glu Ser Ser Phe Ile Thr Gly Asp Ile Asn Ser Ser Ala Ser 1185 1190 1195 1200 Leu Asn Arg Glu Gly Leu Leu Asn Asn Ala Arg Asp Thr Ser Val Met 1205 1210 1215 Asp Thr Leu Pro Leu Asn Gly Asn His Gly Asn Ser Tyr Ser Ile Ala 1220 1225 1230 Ser Gly Glu Tyr Leu Ser Asn Cys Val Gln Ile Ile Asp Arg Gly Tyr 1235 1240 1245 Asn His Asn Glu Thr Ala Leu Glu Lys Lys Ile Leu Lys Glu Leu Thr 1250 1255 1260 Ser Asn Tyr Ile Pro Ser Tyr Leu Asn Asn His Glu Arg Ser Ser Glu 1265 1270 1275 1280 Gln Asn Arg Asn Leu Met Asn Lys Leu Val Asn Asn Leu Gly Ser Gly 1285 1290 1295 Arg Glu Asp Asp Ala Ile Val Leu Asp Asp Ala Thr Ser Phe Asn His 1300 1305 1310 Glu Glu Ser Leu Gly Leu Glu Leu Ile His Glu Glu Ser Asp Ala Pro 1315 1320 1325 Leu Leu Pro Pro Arg Val Tyr Ser Thr Glu Asn His Gln Pro His His 1330 1335 1340 Tyr Thr Arg Arg Arg Ile Pro Gln Asp His Ser Glu Ser Phe Phe Pro 1345 1350 1355 1360 Leu Leu Thr Asn Glu His Thr Glu Asp Leu Gln Ser Pro His Arg Asp 1365 1370 1375 Ser Leu Tyr Thr Ser Met Pro Thr Leu Ala Gly Val Ala Ala Thr Glu 1380 1385 1390 Ser Val Thr Thr Ser Thr Gln Thr Glu Pro Pro Pro Ala Lys Cys Gly 1395 1400 1405 Asp Ala Glu Asp Val Tyr Tyr Lys Ser Met Pro Asn Leu Gly Ser Arg 1410 1415 1420 Asn His Val His Gln Leu His Thr Tyr Tyr Gln Leu Gly Arg Gly Ser 1425 1430 1435 1440 Ser Asp Gly Phe Ile Val Pro Pro Asn Lys Asp Gly Thr Pro Pro Glu 1445 1450 1455 Gly Ser Ser Lys Gly Pro Ala His Leu Val Thr Ser Leu 1460 1465 <210> 19 <211> 467 <212> PRT <213> PSEN1 protein <400> 19 Met Thr Glu Leu Pro Ala Pro Leu Ser Tyr Phe Gln Asn Ala Gln Met 1 5 10 15 Ser Glu Asp Asn His Leu Ser Asn Thr Val Arg Ser Gln Asn Asp Asn 20 25 30 Arg Glu Arg Gln Glu His Asn Asp Arg Arg Ser Leu Gly His Pro Glu 35 40 45 Pro Leu Ser Asn Gly Arg Pro Gln Gly Asn Ser Arg Gln Val Val Glu 50 55 60 Gln Asp Glu Glu Glu Asp Glu Glu Leu Thr Leu Lys Tyr Gly Ala Lys 65 70 75 80 His Val Ile Met Leu Phe Val Pro Val Thr Leu Cys Met Val Val Val 85 90 95 Val Ala Thr Ile Lys Ser Val Ser Phe Tyr Thr Arg Lys Asp Gly Gln 100 105 110 Leu Ile Tyr Thr Pro Phe Thr Glu Asp Thr Glu Thr Val Gly Gln Arg 115 120 125 Ala Leu His Ser Ile Leu Asn Ala Ala Ile Met Ile Ser Val Ile Val 130 135 140 Val Met Thr Ile Leu Leu Val Val Leu Tyr Lys Tyr Arg Cys Tyr Lys 145 150 155 160 Val Ile His Ala Trp Leu Ile Ile Ser Ser Leu Leu Leu Leu Phe Phe 165 170 175 Phe Ser Phe Ile Tyr Leu Gly Glu Val Phe Lys Thr Tyr Asn Val Ala 180 185 190 Val Asp Tyr Ile Thr Val Ala Leu Leu Ile Trp Asn Phe Gly Val Val 195 200 205 Gly Met Ile Ser Ile His Trp Lys Gly Pro Leu Arg Leu Gln Gln Ala 210 215 220 Tyr Leu Ile Met Ile Ser Ala Leu Met Ala Leu Val Phe Ile Lys Tyr 225 230 235 240 Leu Pro Glu Trp Thr Ala Trp Leu Ile Leu Ala Val Ile Ser Val Tyr 245 250 255 Asp Leu Val Ala Val Leu Cys Pro Lys Gly Pro Leu Arg Met Leu Val 260 265 270 Glu Thr Ala Gln Glu Arg Asn Glu Thr Leu Phe Pro Ala Leu Ile Tyr 275 280 285 Ser Ser Thr Met Val Trp Leu Val Asn Met Ala Glu Gly Asp Pro Glu 290 295 300 Ala Gln Arg Arg Val Ser Lys Asn Ser Lys Tyr Asn Ala Glu Ser Thr 305 310 315 320 Glu Arg Glu Ser Gln Asp Thr Val Ala Glu Asn Asp Asp Gly Gly Phe 325 330 335 Ser Glu Glu Trp Glu Ala Gln Arg Asp Ser His Leu Gly Pro His Arg 340 345 350 Ser Thr Pro Glu Ser Arg Ala Ala Val Gln Glu Leu Ser Ser Ser Ile 355 360 365 Leu Ala Gly Glu Asp Pro Glu Glu Arg Gly Val Lys Leu Gly Leu Gly 370 375 380 Asp Phe Ile Phe Tyr Ser Val Leu Val Gly Lys Ala Ser Ala Thr Ala 385 390 395 400 Ser Gly Asp Trp Asn Thr Thr Ile Ala Cys Phe Val Ala Ile Leu Ile 405 410 415 Gly Leu Cys Leu Thr Leu Leu Leu Leu Ala Ile Phe Lys Lys Ala Leu 420 425 430 Pro Ala Leu Pro Ile Ser Ile Thr Phe Gly Leu Val Phe Tyr Phe Ala 435 440 445 Thr Asp Tyr Leu Val Gln Pro Phe Met Asp Gln Leu Ala Phe His Gln 450 455 460 Phe Tyr Ile 465 <210> 20 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> FRAS1 Forward Primer <400> 20 tccctaagtc agctatggga ag 22 <210> 21 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> FRAS1 Reverse Primer <400> 21 aattccatgc ttggtcttgg 20 <210> 22 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> RAPGEF2 Forward Primer <400> 22 caccagagaa gctgggagac 20 <210> 23 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> RAPGEF2 Reverse Primer <400> 23 gcaatggaga aaatgaggaa a 21 <210> 24 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> CLEC4C Forward Primer <400> 24 tgaccttgac tttcgcactg 20 <210> 25 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> CLEC4C Reverse Primer <400> 25 ccagcagtct ctggcacata 20 <210> 26 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> PSEN1 Forward Primer <400> 26 ggcttaagca cgagaattgc 20 <210> 27 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> PSEN1 Reverse Primer <400> 27 gcaaggagca acagaagaat g 21 <210> 28 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> PLEKHM2 Forward Primer <400> 28 ctgctcatga tccacgtgtt 20 <210> 29 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> PLEKHM2 Reverse Primer <400> 29 cttccttggg gtgccttt 18 <210> 30 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> SSH2 Forward Primer <400> 30 ccatcatcaa cactggctgt 20 <210> 31 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> SSH2 Reverse Primer <400> 31 cacaggcctt tctgatttgc 20 <210> 32 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> SPAG17 Forward Primer <400> 32 aaggatgacg tcaaggcttc 20 <210> 33 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> SPAG17 Reverse Primer <400> 33 ggggactctt ctgttacttc ttgg 24 <210> 34 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> XRCC3 Forward Primer <400> 34 caagggaacc agttgtgtga 20 <210> 35 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> XRCC3 Reverse Primer <400> 35 tggtgctcac ctggttgat 19 <210> 36 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> IFT80 Forward Primer <400> 36 tggatgtctt aggtgctagg tg 22 <210> 37 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> IFT80 Reverse Primer <400> 37 ctcactgtgt tgtccaggct aa 22 <210> 38 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> ADGRL3 Forward Primer <400> 38 tatgccctgg actccctaca 20 <210> 39 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> ADGRL3 Reverse Primer <400> 39 atcccatgtt ccttcgatcc 20 <210> 40 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> RAPGEF2 MALDI-TOF Forward Primer <400> 40 acgttggatg gacacaggca caataaagcg 30 <210> 41 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> RAPGEF2 MALDI-TOF Reverse Primer <400> 41 acgttggatg agtcacagac gttaggctac 30

Claims

근위축성측삭경화증(Amyotrophic lateral sclerosis; ALS)에 대한 진단 마커로서
(ⅰ) 서열목록 제1서열의 염기서열에서 4069번째 염기인 구아닌이 아데닌으로 치환, 1883번째 염기인 시토신이 티민으로 치환 또는 3293번째 염기인 구아닌이 아데닌으로 치환된 RAPGEF2 돌연변이 유전자; (ⅱ) 서열목록 제2서열의 염기서열에서 595번째 염기인 구아닌이 아데닌으로 치환된 IFT80 돌연변이 유전자; (ⅲ) 서열목록 제3서열의 염기서열에서 1408번째 염기인 구아닌이 티민으로 치환된 SSH2 돌연변이 유전자; (ⅳ) 서열목록 제4서열의 염기서열에서 598번째 염기인 구아닌이 아데닌으로 치환된 XRCC3 돌연변이 유전자; (ⅴ) 서열목록 제5서열의 염기서열에서 2815번째 염기인 구아닌이 티민으로 치환된 SPAG17 돌연변이 유전자; (ⅵ) 서열목록 제6서열의 염기서열에서 1921+6 염기인 시토신이 티민으로 치환된 PLEKHM2 돌연변이 유전자; (ⅶ) 서열목록 제7서열의 염기서열에서 629번째에서 631번째 염기인 아데닌, 구아닌 및 아데닌이 결실된 CLEC4C 돌연변이 유전자; (ⅷ) 서열목록 제8서열의 염기서열에서 8393번째 염기인 시토신이 티민으로 치환된 FRAS1 돌연변이 유전자; (ⅸ) 서열목록 제9서열의 염기서열에서 715번째 염기인 아데닌이 구아닌으로 치환된 ADGRL3 돌연변이 유전자; 및 (ⅹ) 서열목록 제10서열의 염기서열에서 497번째 염기인 티민이 시토신으로 치환된 PSEN1 돌연변이 유전자로 구성된 군으로부터 선택되는 돌연변이 유전자.
근위축성측삭경화증에 대한 진단 마커로서
(ⅰ) 서열목록 제1서열의 염기서열에서 4069번째 염기인 구아닌이 아데닌으로 치환, 1883번째 염기인 시토신이 티민으로 치환 또는 3293번째 염기인 구아닌이 아데닌으로 치환된 RAPGEF2 돌연변이 유전자로부터 암호화되는 RapGEF2 돌연변이 단백질; (ⅱ) 서열목록 제2서열의 염기서열에서 595번째 염기인 구아닌이 아데닌으로 치환된 IFT80 돌연변이 유전자로부터 암호화되는 IFT80 돌연변이 단백질; (ⅲ) 서열목록 제3서열의 염기서열에서 1408번째 염기인 구아닌이 티민으로 치환된 SSH2 돌연변이 유전자로부터 암호화되는 SSH2 돌연변이 단백질; (ⅳ) 서열목록 제4서열의 염기서열에서 598번째 염기인 구아닌이 아데닌으로 치환된 XRCC3 돌연변이 유전자로부터 암호화되는 XRCC3 돌연변이 단백질; (ⅴ) 서열목록 제5서열의 염기서열에서 2815번째 염기인 구아닌이 티민으로 치환된 SPAG17 돌연변이 유전자로부터 암호화되는 SPAG17 돌연변이 단백질; (ⅵ) 서열목록 제7서열의 염기서열에서 629번째에서 631번째 염기인 아데닌, 구아닌 및 아데닌이 결실된 CLEC4C 돌연변이 유전자로부터 암호화되는 CLEC4C 돌연변이 단백질; (ⅶ) 서열목록 제8서열의 염기서열에서 8393번째 염기인 시토신이 티민으로 치환된 FRAS1 돌연변이 유전자로부터 암호화되는 FRAS1 돌연변이 단백질; (ⅷ) 서열목록 제9서열의 염기서열에서 715번째 염기인 아데닌이 구아닌으로 치환된 ADGRL3 돌연변이 유전자로부터 암호화되는 ADGRL3 돌연변이 단백질; 및 (ⅸ) 서열목록 제10서열의 염기서열에서 497번째 염기인 티민이 시토신으로 치환된 PSEN1 돌연변이 유전자로부터 암호화되는 PSEN1 돌연변이 단백질로 구성된 군으로부터 선택되는 돌연변이 단백질.
제 2 항에 있어서, 상기 (ⅰ) RapGEF2 돌연변이 단백질은 서열목록 제11서열의 아미노산 서열에서 1357번째 아미노산 잔기인 글루탐산이 라이신으로 치환, 628번째 아미노산 잔기인 티로신이 이소류신 치환 또는 1098번째 아미노산 잔기인 아르기닌이 히스티딘으로 치환된 RapGEF2 돌연변이 단백질이고; (ⅱ) IFT80 돌연변이 단백질은 서열목록 제12서열의 아미노산 서열에서 199번째 아미노산 잔기인 발린이 이소류신으로 치환된 IFT80 돌연변이 단백질이며; (ⅲ) SSH2 돌연변이 단백질은 서열목록 제13서열의 아미노산 서열에서 470번째 아미노산 잔기인 글루탐산이 종결코돈으로 치환된 SSH2 돌연변이 단백질이고; (ⅳ) XRCC3 돌연변이 단백질은 서열목록 제14서열의 아미노산 서열에서 200번째 아미노산 잔기인 발린이 이소류신으로 치환된 XRCC3 돌연변이 단백질이며; (ⅴ) SPAG17 돌연변이 단백질은 서열목록 제15서열의 아미노산 서열에서 939번째 아미노산 잔기인 알라닌이 세린으로 치환된 SPAG17 돌연변이 단백질이고; (ⅵ) CLEC4C 돌연변이 단백질은 서열목록 제16서열의 아미노산 서열에서 210번째 아미노산 잔기인 라이신이 결실된 CLEC4C 돌연변이 단백질이며; (ⅶ) FRAS1 돌연변이 단백질은 서열목록 제17서열의 아미노산 서열에서 2798번째 아미노산 잔기인 알라닌이 발린으로 치환된 FRAS1 돌연변이 단백질이고; (ⅷ) ADGRL3 돌연변이 단백질은 서열목록 제18서열의 아미노산 서열에서 239번째 아미노산 잔기인 세린이 글리신으로 치환된 ADGRL3 돌연변이 단백질이며; (ⅸ) PSEN1 돌연변이 단백질은 서열목록 제19서열의 아미노산 서열에서 166번째 아미노산 잔기인 류신이 프롤린으로 치환된 PSEN1 돌연변이 단백질인 것을 특징으로 하는 돌연변이 단백질.
다음 단계를 포함하는 근위축성측삭경화증의 진단에 필요한 정보를 제공하는 방법:
(a) 개체(subject)로부터 분리된 생물학적 시료로부터 (ⅰ) 서열목록 제1서열의 염기서열에서 4069번째 염기인 구아닌이 아데닌으로 치환, 1883번째 염기인 시토신이 티민으로 치환 또는 3293번째 염기인 구아닌이 아데닌으로 치환된 RAPGEF2 돌연변이 유전자; (ⅱ) 서열목록 제2서열의 염기서열에서 595번째 염기인 구아닌이 아데닌으로 치환된 IFT80 돌연변이 유전자; (ⅲ) 서열목록 제3서열의 염기서열에서 1408번째 염기인 구아닌이 티민으로 치환된 SSH2 돌연변이 유전자; (ⅳ) 서열목록 제4서열의 염기서열에서 598번째 염기인 구아닌이 아데닌으로 치환된 XRCC3 돌연변이 유전자; (ⅴ) 서열목록 제5서열의 염기서열에서 2815번째 염기인 구아닌이 티민으로 치환된 SPAG17 돌연변이 유전자; (ⅵ) 서열목록 제6서열의 염기서열에서 1921+6번째 염기인 시토신이 티민으로 치환된 PLEKHM2 돌연변이 유전자; (ⅶ) 서열목록 제7서열의 염기서열에서 629번째에서 631번째 염기인 아데닌, 구아닌 및 아데닌이 결실된 CLEC4C 돌연변이 유전자; (ⅷ) 서열목록 제8서열의 염기서열에서 8393번째 염기인 시토신이 티민으로 치환된 FRAS1 돌연변이 유전자; (ⅸ) 서열목록 제9서열의 염기서열에서 715번째 염기인 아데닌이 구아닌으로 치환된 ADGRL3 돌연변이 유전자; 또는 (ⅹ) 서열목록 제10서열의 염기서열에서 497번째 염기인 티민이 시토신으로 치환된 PSEN1 돌연변이 유전자의 mNRA 또는 상기 유전자에 의해 코딩되는 돌연변이 단백질을 검출하는 단계; 및
(b) 상기 시료에서 상기 돌연변이 유전자의 mRNA 또는 돌연변이 단백질이 검출된 경우, 상기 개체는 근위축성측삭경화증인 것으로 판정하는 단계.
제 4 항에 있어서, 상기 단계 (a)에서 mRNA는 상기 돌연변이 유전자에 특이적으로 결합하는 프라이머 또는 프로브를 이용하여 측정하는 것을 특징으로 하는 방법.
제 4 항에 있어서, 상기 단계 (a)에서 돌연변이 단백질은 상기 돌연변이 단백질에 특이적으로 결합하는 항체를 이용하여 측정하는 것을 특징으로 하는 방법.
생물학적 시료로부터 제 1 항의 돌연변이 유전자의 mRNA 또는 상기 유전자에 의해 코딩되는 돌연변이 단백질을 검출할 수 있는 검출제를 포함하는 근위축성측삭경화증 진단용 조성물.
제 7 항에 있어서, 상기 mRNA를 검출할 수 있는 검출제는 상기 돌연변이 유전자에 특이적으로 결합하는 프라이머 또는 프로브인 것을 특징으로 하는 근위축성측삭경화증 진단용 조성물.
제 7 항에 있어서, 상기 단백질을 검출할 수 있는 검출제는 상기 돌연변이 유전자에 의해 코딩되는 단백질에 특이적인 항체인 것을 특징으로 하는 근위축성측삭경화증 진단용 조성물.
제 7 항 내지 제 9 항 중 어느 한 항의 조성물을 포함하는 근위축성측삭경화증 진단용 키트.
제 10 항에 있어서, 상기 키트는 마이크로어레이, 유전자 증폭 키트 또는 면역분석(immunoassay)용 키트인 것을 특징으로 하는 근위축성측삭경화증 진단용 키트.