KR20100017865A - 유방암의 위험도 평가, 진단, 예후 및 치료용 마커인 염색체 5p12 및 염색체 10q26 상의 유전적 변이 - Google Patents

유방암의 위험도 평가, 진단, 예후 및 치료용 마커인 염색체 5p12 및 염색체 10q26 상의 유전적 변이 Download PDF

Info

Publication number
KR20100017865A
KR20100017865A KR1020097026476A KR20097026476A KR20100017865A KR 20100017865 A KR20100017865 A KR 20100017865A KR 1020097026476 A KR1020097026476 A KR 1020097026476A KR 20097026476 A KR20097026476 A KR 20097026476A KR 20100017865 A KR20100017865 A KR 20100017865A
Authority
KR
South Korea
Prior art keywords
breast cancer
markers
individual
risk
alleles
Prior art date
Application number
KR1020097026476A
Other languages
English (en)
Inventor
사이먼 스테이시
패트릭 슐렘
안드래이 마놀래스쿠
Original Assignee
디코드 제네틱스 이에이치에프
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 디코드 제네틱스 이에이치에프 filed Critical 디코드 제네틱스 이에이치에프
Publication of KR20100017865A publication Critical patent/KR20100017865A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/10Ploidy or copy number detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/172Haplotypes
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Analytical Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Physics & Mathematics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Microbiology (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

본 발명은 유방암의 감수성 변이인 Chr5p12 및 Chr10q26 상의 특정한 유전적 변이에 관한 것이다. 그와 같은 변이를 이용하여, 유방암에 대한 증가된 및/또는 감소된 감수성을 진단하는 것을 포함한, 질병 관리 방법, 치료에 대한 반응을 예측하는 방법 및 예후를 예측하는 방법이 개시된다. 본 발명은 또한 본 발명의 방법에서 유용한 키트에 관한 것이다.
유방암, 감수성, 연관, 마커.

Description

유방암의 위험도 평가, 진단, 예후 및 치료용 마커인 염색체 5p12 및 염색체 10q26 상의 유전적 변이{Genetic variants on chr 5p12 and 10q26 as markers for use in breast cancer risk assessment, diagnosis, prognosis and treatment}
본 발명은 유방암의 감수성 변이인 Chr5p12 및 Chr10q26 상의 특정한 유전적 변이에 관한 것이다. 그와 같은 변이를 이용하여, 유방암에 대한 증가된 및/또는 감소된 감수성을 진단하는 것을 포함한, 질병 관리 방법, 치료에 대한 반응을 예측하는 방법 및 예후를 예측하는 방법이 개시된다. 본 발명은 또한 본 발명의 방법에서 유용한 키트에 관한 것이다.
유방암은 현재 전세계적으로 여성에서 가장 흔한 암이다. 현재 전세계적 발생율은 매년 1,151,000명 이상의 진단되는 신규 환자들이다 [Parkin, et al., (2005), CA Cancer J Clin, 55, 74-108]. 유방암 발생율은 선진국에서, 특히, 북유럽 민족 기원의 집단에서 가장 높고, 증가되고 있다. 미국에서, 연간 연령-표준화 발생율(annual age-standardized incidence rate)은 세계 평균을 3배 이상 초과하는, 100,000명 당 약 125명이다. 북유럽 국가들에서의 발생율은 유사하게 높다. 2008년에, 미국에서 184,450명의 침습성(invasive) 유방암 신규 환자들이 진단되 고, 40,930명이 상기 질환으로 사망할 것으로 추정된다[Jemal, et al., (2008), CA Cancer J Clin, 58, 71-96]. 이 수치에, 2008년에 예상되는 추가적인 67,770명의 유관상피내암 및 유소엽상피내암(ductal and lobular carcinoma in-situ) 진단이 추가되어야 한다. 개인적인 관점에서, 생애 중에 유방암을 발병할 확률은 미국 여성의 경우 12.3%(즉, 8명의 여성 중 1명이 그들의 생애 동안 유방암을 발병함)이다. 대부분의 암의 경우와 같이, 조기 검출 및 적합한 치료가 중요한 인자이다. 전반적으로, 유방암에 대한 5-년 생존률은 89%이다. 그러나, 국소적 침습성 질환(regionally invasive disease) 또는 전이성 질환을 갖는 개인에서, 그 비율은 각각 84% 및 27%로 감소된다[Jemal, et al., (2008), CA Cancer J Clin, 58, 71-96].
점차적으로, 원발성 유방암 또는 재발성 유방암에 대한 고 위험도를 갖는 개인의 식별이 강조되고 있다. 그와 같은 개인들은 보다 집중적인 스크리닝, 예방적 화학요법, 호르몬 요법에 의해 관리될 수 있고, 매우 높은 위험도를 갖는 개인들의 경우, 예방적 외과수술(prophylactic surgery)에 의해 관리될 수 있다. 집단 스크리닝(mass screening) 프로그램은 의료 서비스에 대해 엄청난 경제적 부담이 되나, 예방적 치료법은 연관된 위험 및 삶의 질의 중요성을 갖는다.
유방암에 대한 유전적 소인(genetic predisposition):
유방암에 대한 공지된 위험 인자들의 두개의 주요한 종류는 내분비계 인자 및 유전학이다. 후자와 관련하여, 유방암 환자의 약 12%가 유방암을 갖는 1명 이상의 1촌 친척(first degree relative)를 갖는다[(2001), Lancet, 358, 1389-99]. 잘 알려진, 우세한 유방암 소인 유전자 BRCA1 및 BRCA2는 보인자(carrier)에게 크게 증가된 유방암 위험도를 부여하고, 일생의 침투도(lifetime penetrance) 추정값은 40-80%의 범위이다. BRCA1 및 BRCA2 돌연변이의 존재가 6건 이상의 유방암 케이스를 갖는 가족의 대부분 및 유방암, 및 난소암 또는 남성 유방암을 포함하는 가족의 높은 비율에서 원인일 수 있다. 그러나, 실제로 그와 같은 가족은 매우 드물다. BRCA1 및 BRCA2 돌연변이는 보다 적은 수의 케이스를 갖는 가족, 또는 유방암 케이스만을 특징으로 하는 가족에서 훨씬 덜 빈번하게 발견된다. BRCA1 돌연변이와 BRCA2 돌연변이가 가족성 유방암(familiar breast cancer)에 대한 위험도의 15-20%를 차지한다. 비-시조 집단(non-founder population)에서, 모든 일반적인 BRCA 돌연변이가 검출될 수 있는 경우, 2-3%의 우발적(incident) 유방암 환자가 하나의 돌연변이를 가질 것으로 예상된다[Gorski, et al., (2005), Breast Cancer Res Treat, 92, 19-24; (2000), Br J Cancer, 83, 1301-8]. 이 낮은 "발견 가능성(chance to find)" 통계값은 명백한 유전적 소인을 갖는 패밀리 외에서 BRCA 돌연변이 테스트의 타당한 사용을 배제한다(Anon[(2003), J Clin Oncol, 21, 2397-406]). 드문, 고 침투성 돌연변이가 TP53 및 PTEN 유전자에서 일어나는 것으로 알려져있으나, 이들은 함께 유방암에 대한 전체 유전적 위험도의 5% 이하를 차지한다[Easton, (1999), Breast Cancer Res, 1, 14-7]. 유방암에 대한 고 위험도를 부여하는 보다 많은, 보다 일반적인 돌연변이를 확인하기 위한 연관 연구는 대부분 성공하지 못했다[Smith, et al., (2006), Genes Chromosomes Cancer, 45, 646-55].
최근의 역학적 연구는 유방암 케이스의 대다수가 집단의 소인을 갖는 민감한 소수(predisposed, susceptible minority)에서 일어난다는 것을 확인했다[Antoniou, et al., (2002), Br J Cancer, 86, 76-83; Pharoah, et al., (2002), Nat Genet, 31, 33-6]. 쌍생아 연구로부터의 데이터 및 원발성 유방암(primary breast cancer)을 견뎌낸 환자의 반대쪽 유방에서 암의 일정한 높은 발병율의 관찰은 유방암에 대한 규명되지 않은 위험도의 상당한 부분은 내생적 인자, 가장 가능성있게는 유전적 인자와 관련된다는 것을 나타낸다[Lichtenstein, et al., (2000), N Engl J Med, 343, 78-85; Peto and Mack, (2000), Nat Genet, 26, 411-4]. 이 일반적인(widespread) 위험도를 뒷받침하는 유전적 인자의 지식은 매우 한정되어 있다. 분리(segregation) 분석은 유방암에 대한 규명되지 않은 유전적 위험도는 속성상 다유전자성(polygenic)일 가능성이 매우 높고, 위험 대립인자는 저위험도 내지 중간 위험도를 부여하고 상호간 및 호르몬 위험 인자(hormonal risk factor)와 상호작용할 것이라는 것을 예측한다. 그럼에도 불구하고, 이 연구들은 이 저 위험도 내지 중간 위험도 위험 대립인자들을 포착하는 유전적 프로파일링에 의해 정의될 수 있는 분포의 최고 5분위수(quintile)와 최저 5분위수 간의 상대적 위험도의 40-배 차이를 예측한다[Antoniou, et al., (2002), Br J Cancer, 86, 76-83; Pharoah, et al., (2002), Nat Genet, 31, 33-6]. 모든 유방암 케이스의 88%는 집단의 소인을 갖는 50%에서 발생하며, 최고 위험도에 있는 집단의 12%가 모든 유방암 케이스의 50%를 차지할 것으로 예상된다[Pharoah, et al., (2002), Nat Genet, 31, 33-6; Pharoah, (2003), Recent Results Cancer Res, 163, 7-18; discussion 264-6]. 따라서, 그와 같이 유전적으로 소인을 갖는 개인의 확인 및 그들을 위한 맞춤화된 의 료적 관리 전략의 개발에 초점이 맞춰져 있다.
본 발명자들 및 다른 연구자들은 아이슬란드에서 5촌 이상 친척(5th degree relative)까지 확장되는 유방암의 유의성 있는 가족성 위험도(familiar risk)가 있다는 것을 입증했다[Amundadottir, et al., (2004), PLoS Med, 1, e65; Tulinius, et al., (2002), J Med Genet, 39, 457-62]. 아이슬란드에서 BRCA1 돌연변이의 가족성 위험도에 대한 기여는 최소인 것으로 사료된다[Arason, et al., (1998), J Med Genet, 35, 446-9; Bergthorsson, et al., (1998), Hum Mutat, Suppl 1, S195-7]. BRCA2 유전자의 하나의 시조 돌연변이(founder mutation)(999del5)는 일반적인 아이슬란드 집단에서 0.6-0.8%의 보인자 빈도(carrier frequency)로 존재하고, 여성 유방암 환자에서는 7.7-8.6%의 보인자 빈도로 존재한다[Thorlacius, et al., (1997), Am J Hum Genet, 60, 1079-84; Gudmundsson, et al., (1996), Am J Hum Genet, 58, 749-56]. 이 단일 돌연변이는 1촌 내지 3촌 친척에서 유전성 유방암 위험도의 약 40%를 차지하는 것으로 추정된다[Tulinius, et al., (2002), J Med Genet, 39, 457-62]. 이 추정값은 비-시조(non-founder) 집단에서 통합된 모든 BRCA1 및 BRCA2 돌연변이에서 기인되는 15-25%의 가족성 위험도보다 더 높으나, 약 60%의 아이슬란드 가족성 유방암 위험도가 여전히 설명되지 않는다. BRCA2 999del5에 대해 음성으로 테스트된 환자의 1촌 친척은 유방암에 대한 집단 위험도의 1.72배의 위험도를 갖는다(95% CI 1.49-1.96) [Tulinius, et al., (2002), J Med Genet, 39, 457-62].
유전적 위험도는 집단 내의 개체들 중에서 게놈 중 미묘한 차이에 의해 부여된다. 유전자는 가장 빈번하게는 단일 염기 다형성(single nucleotide polymorphisms, SNP) 때문에 개체들 간에 상이하나, 다른 변이도 중요하다. SNP는 인간 게놈에서 평균 1000개의 염기쌍마다 존재한다. 따라서, 250,000개의 염기쌍(bp)을 포함하는 통상적인 인간 유전자는 250개의 상이한 SNP를 포함할 수 있다. 소수의 SNP만이 엑손에 위치하고, 해당 유전자에 의해 코딩된 단백질의 아미노산 서열을 변화시킨다. 대부분의 SNP는 유전자 기능에 거의 또는 전혀 효과를 갖지 않을 수 있고, 다른 SNP는 해당 유전자에 의해 코딩된 mRNA의 전사, 스플라이싱(splicing), 번역, 또는 안정성을 변화시킬 수 있다. 인간에서 추가적인 유전적 다형성이 DNA의 짧거나 또는 긴 스트레치(stretch)의 삽입, 결실, 전위(translocation), 또는 역전에 의해 유발된다. 따라서, 질병 위험도를 부여하는 유전적 다형성은 단백질의 아미노산 서열을 직접적으로 변화시킬 수 있거나, 해당 유전자로부터 생성된 단백질의 양을 증가시킬 수 있거나, 또는 해당 유전자에 의해 생성된 단백질의 양을 감소시킬 수 있다.
일반적인 질환의 위험도를 부여하는 유전적 다형성이 밝혀져서, 그와 같은 위험 인자에 대한 유전적 테스트가 임상 의학에서 중요해지고 있다. 최근의 예는 알쯔하이머병의 차등적 진단(differential diagnosis)을 위해 치매 환자에서 apoE4 다형성의 유전적 보인자를 확인하기 위한 아포리포프로테인(apolipoprotein) E 테스트 및 심부 정맥 혈전증에 대한 소인을 테스트하기 위한 Factor V Leiden 테스트이다. 보다 중요하게는, 암의 치료에서, 종양 세포의 유전적 변이의 진단이 개별 환자를 위한 가장 적합한 치료 방법(treatment regime)의 선택을 위해 이용된다. 유방암 환자에서, 에스트로겐 수용체 발현 또는 Her2(heregulin type 2) 수용체 티로신 키나아제 발현의 유전적 변이가 항-에스트로겐 약물(타목시펜) 또는 항-Her2 항체(Herceptiin)이 치료 계획 내에 포함되어야 하는지 여부를 결정한다. 필라델피아 염색체의 만성 골수성 백혈병(chronic myeloid leukemia, CML) 진단에서, Bcr 및 Abl 수용체 티로신 키나아제를 코딩하는 유전자를 융합하는 유전적 전좌(genetic translocation)는 Bcr-Abl 키나아제의 특이적 저해제인 Gleevec(STI571)이 암의 치료를 위해 이용되어야 한다는 것을 나타낸다. 그와 같은 유전적 변화를 갖는 CML 환자의 경우, Bcr-Abl 키나아제의 저해는 종양 세포의 신속한 제거 및 백혈병의 완화를 가져온다.
유방암의 나머지 유전적 위험도에 기여하는 유전적 인자들에 대한 이해는 매우 제한적이다. 두 개의 유전자, CHEK2 및 ATM의 변이가 저 침투성(low penetrance) 유방암 위험도 유전자인 것으로 정밀하게 확인되었다[Renwick, et al., (2006), Nat Genet, 38, 873-5; (2004), Am J Hum Genet, 74, 1175-82]. 또한, 최근의 보고서는 염색체 2q35 및 16q12 상의 변이와 에스트로겐 수용체 양성 유방암의 증가된 위험도 간의 관련(link)을 수립한다 (Simon, SN. et al. Nat Genet 39:865-9 (2007)). 다수의 다른 유전자들이 관련되었으나, 유방암 위험도에 대한 그들의 기여는 매우 큰 표본 세트를 이용한 분석에서 확인되지 않았다[Breast Cancer Association, (2006), J Natl Cancer Inst, 98, 1382-96].
유방암의 예방 또는 치료를 위해 범용적으로 성공적인 방법은 현재 존재하지 않는다. 유방암의 관리는 현재 일차적 예방(primary prevention), 조기 진단, 적합한 치료 및 이차적 예방(secondary prevention)의 조합에 의존한다. 유전적 검사를 이 관리 영역의 모든 측면에 통합시켜야 하는 임상적 요구가 존재한다. 암 감수성 유전자의 확인은 또한 (예를 들면, 저분자량 또는 고분자량 약물을 이용하여) 처리될 수 있고 보다 효과적인 치료법을 유도할 수 있는 주요한 분자적 경로를 규명할 수 있다.
발명의 요약
본 발명은 유방암에 대한 감수성(susceptibility)를 평가하는 방법에 관한 것이다. 본 발명은 유방암에 대한 증가된 감수성 또는 감소된 감수성과 연관된 것으로 확인된 특정한 마커 또는 일배체형을 평가하는 것에 의해 유방암에 대한 증가된 감수성을 진단하는 방법, 및 유방암에 대한 감소된 감수성을 진단하거나 또는 유방암에 대한 보호를 진단하는 방법을 포함한다. 본 발명은 또한 유방암으로 진단된 개체의 예후를 평가하는 방법, 유방암 치료제 또는 유방암 치료법에 대한 반응의 확률을 평가하는 방법, 및 유방암으로 진단된 개체의 치료의 진행을 모니터링하는 방법에 관한 것이다.
일 양태에서, 본 발명은 개인에서 유방암에 대한 감수성을 진단하는 방법으로서, 상기 방법은 상기 개인으로부터 수득된 핵산 시료에서 염색체 5p12 또는 염색체 10q26 상의 하나 이상의 다형성 마커의 하나 이상의 대립인자의 존재 또는 부재를 결정하는 단계를 포함하고, 상기 하나 이상의 대립인자의 존재는 유방암에 대한 감수성을 나타내는 것인 방법에 관한 것이다. 본 발명은 또한 개인으로부터 유래된 핵산 시료에서 염색체 5p12 또는 염색체 10q26 상의 하나 이상의 다형성 마커의 하나 이상의 대립인자의 존재 또는 부재를 결정하는 것에 의해 유방암에 대한 감수성을 결정하는 방법으로서, 상기 하나 이상의 대립인자의 존재의 결정은 유방암에 대한 감수성을 나타내는 것인 방법에 관한 것이다.
또 다른 양태에서, 본 발명은 개인으로부터 유래된 유전형 데이터세트(genotype dataset)에서 하나 이상의 다형성 마커의 하나 이상의 위험 대립인자(at-risk allele)가 존재하는지 여부를 결정하는 단계를 포함하는, 개인에서 유방암에 대한 감수성을 결정하는 방법으로서, 상기 하나 이상의 다형성 마커는 염색체 5p12 내의 마커들로부터 선택되고, 상기 하나 이상의 위험 대립인자의 존재는 상기 개인에서 유방암에 대한 증가된 감수성을 나타내는 것인 방법에 관한 것이다.
본 발명은 또한, 개인으로부터 수득된 핵산 시료 또는 개인으로부터 유래된 유전형 데이터세트에서 하나 이상의 다형성 마커의 하나 이상의 대립인자의 존재 여부를 결정하는 단계를 포함하는, 개인에서 유방암에 대한 감수성을 결정하는 방법으로서, 상기 하나 이상의 다형성 마커는 rs10941679 (서열번호 236), rs4415084 (서열번호 235), 및 rs1219648 (서열번호 237), 및 이들과 연관 불균형(linkage disequilibrium)인 마커들로부터 선택되고, 상기 하나 이상의 대립인자의 존재는 상기 개인의 유방암에 대한 감수성을 나타내는 것인 방법에 관한 것이다.
일 구체예에서, 유전형 데이터세트는 마커 정체(marker identity), 및 개체의 대립인자 상태에 대한 정보, 즉, 해당 마커에 대해 상기 개체가 갖는 두 개의 대립인자의 정체에 대한 정보를 포함한다. 유전형 데이터세트는 두개 이상의 마커, 세개 이상의 마커, 다섯개 이상의 마커, 백개 이상의 마커 등을 포함한, 하나 이상의 마커에 대한 대립인자 정보를 포함할 수 있다. 일부 구체예에서, 유전형 데이터세트는 수십만개의 마커, 또는 심지어 백만개 이상의 마커를 포함할 수 있는, 개체의 전체 게놈 평가로부터의 유전형 정보를 포함한다.
일부 구체예에서, 상기 하나 이상의 다형성 마커는 FGF10 유전자, HCN1 유전자, MRPS30 유전자, 및/또는 FGFR2 유전자와 연관된다. 그와 같은 일부 구체예에서, 상기 하나 이상의 다형성 마커는 FGF10 유전자, HCN1 유전자, MRPS30 유전자, 및/또는 FGFR2 유전자와 연관 불균형이다. 일부 다른 구체예에서, 상기 하나 이상의 다형성 마커는 NCBI Build 34의 위치 44,666,047과 44,976,797에 걸친 염색체 세그먼트 내에 위치한 마커들, 및 이들과 연관 불균형인 마커들의 군으로부터 선택된다. 또 다른 구체예에서, 상기 하나 이상의 다형성 마커는 표 1 및 표 3에 열거된 다형성 마커들, 및 이들과 연관 불균형인 마커들로 구성된 군으로부터 선택된다.
일부 구체예에서, 상기 하나 이상의 다형성 마커는 표 12, 표 13 및 표 14에 표시된 마커들로부터 선택된다. 일 구체예에서, 상기 하나 이상의 다형성 마커는 서열번호 1 내지 237로 표시된 마커들로부터 선택된다. 일 구체예에서, 마커 rs4415084와 연관 불균형인 마커들은 표 12에 표시된 마커들로부터 선택된다. 또 다른 구체예에서, 마커 rs10941679와 연관 불균형인 마커들은 표 13에 표시된 마커들로부터 선택된다. 또 다른 구체예에서, 마커 rs1219648과 연관 불균형인 마커들은 표 14에 표시된 마커들로부터 선택된다.
일부 구체예에서, 개체에서 하나 이상의 일배체형의 빈도를 평가하는 추가적인 단계가 수행된다. 그와 같은 구체예에서, 3개, 4개, 5개, 6개, 7개, 8개, 9개 또는 10개 이상의 마커를 포함한, 두개 이상의 마커가 일배체형에 포함될 수 있다. 일 구체예에서, 일배체형은 염색체 5p12 영역 내의 마커들을 포함한다. 또 다른 구체예에서, 일배체형은 염색체 10q26 영역 내의 마커들을 포함한다. 일부 구체예에서, 일배체형은 rs4415084와 연관 불균형인 마커들을 포함한다. 일부 다른 구체예에서, 일배체형은 rs10941679와 연관 불균형인 마커들을 포함한다. 일부 다른 구체예에서, 일배체형은 rs1219648과 연관 불균형인 마커들을 포함한다.
본 명세서에 기재된 바와 같이, 유방암의 위험도를 부여하는 마커들이 유방암에 대한 다른 유전적 마커와 조합될 수 있다. 따라서, 일부 구체예에서, 표 12, 표 13 및 표 14에 표시된 마커들 중 하나와 연관 불균형이 아닌 유방암에 대한 하나 이상의 위험 변이(at-risk variant)의 하나 이상의 위험 대립인자가 개인으로부터의 게놈 DNA를 포함하는 시료 또는 개인으로부터 유래된 유전형 데이터세트에 존재하는지 여부를 결정하는 단계를 포함하는 추가적인 단계가 포함된다. 바꾸어 말하면, 게놈 내의 다른 위치에 있는 유전적 마커들이 본 발명의 마커들과 함께 복수 개의 유전적 인자에 기반하여 유방암의 전체 위험도(overall risk)를 결정하기 위해 유용할 수 있다. 연관 불균형이 아닌(LD가 아닌) 마커들의 선택은 본 명세서에서 더 설명되는 바와 같이, 연관 불균형에 대한 적합한 척도에 기반될 수 있다. 일부 구체예에서, 연관 불균형이 아닌 마커들은 마커들 간의 LD 척도 r2에 대해 0.2 미만의 값을 갖는다. 일부 다른 구체예에서, LD가 아닌 마커들은 마커들 간의 r2에 대해 0.10 미만, 0.05 미만, 0.02 미만 및 0.01 미만을 포함한 0.15 미만의 값을 갖는다. 상기 값들 사이의 값들을 포함한, 마커들이 LD가 아니라는 것을 확립하기 위해 적합한 다른 컷오프(cutoff) 값들도 고려된다.
일부 구체예에서, 본 명세서에 기재된 복수의 마커들이 유방암의 전체 위험도를 결정하기 위해 결정된다. 따라서, 일부 구체예에서, 추가적인 단계가 포함되고, 상기 단계는 두개 이상의 다형성 마커 각각의 하나 이상의 대립인자가 개인으로부터 유래된 게놈 DNA를 포함하는 시료 또는 개인으로부터 유래된 유전형 데이터세트에 존재하는지 여부를 결정하는 단계를 포함하고, 상기 두개 이상의 다형성 마커에서 상기 하나 이상의 대립인자의 존재는 유방암에 대한 증가된 감수성을 나타낸다. 일 구체예에서, 마커들은 rs4415084 (서열번호 235), rs10941679 (서열번호 236) 및 rs1219648 (서열번호 237), 및 이들과 연관 불균형인 마커들로부터 선택된다.
본 발명의 마커에 기반한 위험도 평가는 또한, 개인으로부터 수득된 핵산 시료 또는 개인으로부터 유래된 유전형 데이터세트에서 유방암에 대한 하나 이상의 고 침투성 유전적 인자(high penetrant genetic factor)의 존재 또는 부재의 평가와 조합될 수 있다. 유방암에 대한 고 침투성 유전적 인자는 예를 들면, BRCA1 돌연변이, BRCA2 돌연변이, TP53 돌연변이 또는 PTEN 돌연변이일 수 있다. BRCA1 돌연변이 및 BRCA2 돌연변이는 함께 가족성 유방암(familiar breast cancer)에 대한 위험도의 15-20%를 설명할 수 있고, 이들은 우발적(incident) 유방암 환자의 2-3%를 설명할 수 있다[Gorski, et al., (2005), Breast Cancer Res Treat, 92, 19-24; (2000), Br J Cancer, 83, 1301-8]. Known mutations in the TP53 및 PTEN 유전자의 공지된 돌연변이가 유방암의 전체 유전적 위험도의 약 5%를 차지한다[Easton, (1999), Breast Cancer Res, 1, 14-7]. 일 구체예에서, 고 침투성 유전적 인자는 BRCA2 999del5이다.
본 발명의 유전적 마커들은 또한 개체에 대한 전체 위험도를 확립하기 위해 비-유전적 정보와 조합될 수 있다. 따라서, 일부 구체예에서, 개인의 위험도 평가, 진단, 또는 예후의 판단을 수행하기 위해 비-유전적 정보를 분석하는 추가적인 단계가 포함된다. 비-유전적 정보는 개인의 질병 상태에 대한 정보 또는 개인에 대한 유방암의 전체 위험도의 추정에 영향을 미칠 수 있는 다른 정보일 수 있다. 일 구체예에서, 비-유전적 정보는 연령, 성별, 민족, 사회경제적 지위, 과거 질병 진단, 개인의 병력(medical history), 유방암의 가족력(family history), 생화학적 척도, 및 임상적 척도로부터 선택된다.
또 다른 양태에서, 본 발명은 이전에 유방암으로 진단받았던 개체에서 하나 이상의 이차 원발성 종양(second primary tumor)을 발병할 위험도를 결정하는 방법으로서, 상기 방법은 상기 개체로부터 수득된 핵산 시료에서 하나 이상의 다형성 마커의 하나 이상의 대립인자의 존재 또는 부재를 결정하는 단계를 포함하고, 상기 하나 이상의 다형성 마커는 표 12, 표 13 및 표 14에 열거된 다형성 마커들, 및 이들과 연관 불균형인 마커들의 군으로부터 선택되고, 상기 하나 이상의 대립인자의 존재는 하나 이상의 이차 원발성 종양을 발병할 위험도를 나타내는 것인 방법에 관한 것이다. 대안적으로, 본 발명은 이전에 유방암으로 진단되었던 개인에서 하나 이상의 이차 원발성 종양을 발병할 위험도를 결정하는 방법으로서, 상기 방법은 하나 이상의 다형성 마커의 하나 이상의 대립인자가 상기 개인으로부터 수득된 핵산 시료 또는 상기 개인으로부터 유래된 유전형 데이터세트에 존재하는지 여부를 결정하는 단계를 포함하고, 상기 하나 이상의 다형성 마커는 rs10941679 (서열번호 236), rs4415084 (서열번호 235), 및 rs1219648 (서열번호 237) 및 이들과 연관 불균형인 마커들로부터 선택되고, 상기 하나 이상의 대립인자의 존재는 하나 이상의 이차 원발성 종양을 발병할 위험도를 나타내는 것인 방법에 관한 것이다. 하나의 그와 같은 구체예에서, 상기 하나 이상의 다형성 마커는 표 12, 표 13, 및 표 14에 표시된 마커들로부터 선택된다.
본 발명은 또한 개인에서 유방암에 대한 유전적 지표(genetic indicator)를 결정하는 장치로서, 컴퓨터 판독가능한 메모리; 및 상기 컴퓨터 판독가능한 메모리 상에 저장된 루틴(routine)을 포함하고, 상기 루틴은 rs10941679 (서열번호 236), rs4415084 (서열번호 235), 및 rs1219648 (서열번호 237), 및 이들과 연관 불균형인 마커들로부터 선택되는 하나 이상의 다형성 마커에 대해 상기 개인의 마커 및/또는 일배체형 정보를 분석하고, 상기 마커 또는 일배체형 정보에 기반한 결과물(output)을 생성하기 위해 프로세서 상에서 실행되도록 개조되고, 상기 결과물은 상기 개인의 유방암의 유전적 지표로서 상기 하나 이상의 마커 또는 일배체형의 개별적인 위험도 척도(risk measure)를 포함하는 것인 장치에 관한 것이다. 일 구체예에서, 상기 하나 이상의 다형성 마커는 표 12, 표 13 및 표 14에 표시된 마커들로부터 선택된다. 일 구체예에서, 상기 루틴은 상기 루틴은 상기 하나 이상의 마커 대립인자 및/또는 일배체형과 연관된 유방암의 위험도 척도를 더 포함하고, 상기 위험도 척도는 유방암으로 진단된 복수의 개인에서 하나 이상의 다형성 마커의 하나 이상의 대립인자 및/또는 하나 이상의 일배체형의 빈도의 지표와 복수의 기준(reference) 개인에서 상기 하나 이상의 다형성 마커의 하나 이상의 대립인자 및/또는 일배체형의 빈도의 지표의 비교에 기반하며, 상기 개인의 개별적인 위험도는 상기 하나 이상의 마커 대립인자 및/또는 일배체형에 대한 상기 개인의 보인자 상태(carrier status)와 상기 하나 이상의 마커 대립인자 및/또는 일배체형에 대한 위험도 척도의 비교에 기반한다. 예를 들면, 일부 구체예에서, 상기 위험도 척도는 대조군 대비, 유방암을 갖는 개체의 집단에서 유방암에 대한 위험 변이 각 카피에 의해 부여되는 위험도의 척도일 수 있다. 그와 같은 기준 데이터에 기반하여, 특정 개인에 대한 위험도가 특정한 마커에서의 상기 개인의 유전형 상태를 결정하는 것에 의해 추정되고 그에 기반하여 상기 개인에 대한 위험도를 계산할 수 있다. 개인이 그의 게놈 내에 한 카피의 유전적 위험 변이를 갖는 경우, 계산된 위험도는 상기 위험 변이의 단일 카피에 의해 부여되는 위험도에 기반될 수 있다. 개인이 두 카피의 유전적 위험 변이를 갖는 경우, 즉, 상기 개인이 상기 위험 변이에 대해 동형접합형인 경우, 상기 개인에 대한 위험도 추정값은 대조군 대비, 일군의 개인들에 기반한 위험도에 기반될 수 있다. 일반적으로, 동형접합형 보인자(homozygous carrier)에 대한 위험도는 해당 변이의 단일 카피에 대한 위험도의 스퀘어값일 것이다. 특정 마커에 대한 유전형 상태에 근거하여 개인에 대한 위험도를 보고 또는 추정하는 다른 방법들도 가능하며, 본 발명의 범위 내에 속한다.
또 다른 양태에서, 본 발명은 유방암에 대한 감수성을 평가하기 위해 이용될 마커를 확인하는 방법으로서, 상기 방법은 rs10941679 (서열번호 236), rs4415084 (서열번호 235), 및 rs1219648 (서열번호 237) 중 하나 이상과 연관 불균형인 하나 이상의 다형성 마커를 확인하는 단계, 유방암으로 진단되거나 또는 유방암에 대한 감수성을 갖는 개인의 시료의 유전형 상태(genotype status)를 결정하는 단계, 및 대조군 개인의 시료의 유전형 상태를 결정하는 단계를 포함하고, 상기 대조군 시료에서의 하나 이상의 다형성의 하나 이상의 대립인자의 빈도 대비, 유방암으로 진단되거나, 또는 유방암에 대한 감수성을 갖는 개인에서 상기 하나 이상의 대립인자의 빈도의 유의성 있는 차이는 상기 하나 이상의 다형성이 유방암에 대한 감수성을 평가하기 위해 유용하다는 것을 나타내는 것인 방법에 관한 것이다. 유의성 있는 차이는 유방암 환자와 대조군에서 특정한 다형성 마커의 대립인자의 계수(allelic count)의 통계적 분석에 대해 추정될 수 있다. 일 구체예에서, 유의성 있는 차이는 유방암 환자와 대조군 간의 0.05 미만의 계산된 P-값에 근거한다. 일 구체예에서, 대조군 시료에서 하나 이상의 다형성의 하나 이상의 대립인자의 빈도 대비, 유방암으로 진단되거나, 또는 유방암에 대한 감수성을 갖는 개인에서 상기 하나 이상의 다형성의 하나 이상의 대립인자의 빈도의 증가는 상기 하나 이상의 다형성이 유방암에 대한 증가된 감수성을 평가하기에 유용하다는 것을 나타낸다. 또 다른 구체예에서, 대조군 시료에서 상기 하나 이상의 다형성의 하나 이상의 대립인자의 빈도 대비, 유방암으로 진단되거나, 또는 유방암에 대한 감수성을 갖는 개인에서 상기 하나 이상의 다형성의 하나 이상의 대립인자의 빈도의 감소는 상기 하나 이상의 다형성이 유방암에 대한 감소된 감수성 또는 유방암에 대한 보호를 평가하기에 유용하다는 것을 나타낸다.
본 발명은 또한 개인으로부터 수득된 핵산 시료에서 하나 이상의 다형성 마커의 하나 이상의 대립인자가 존재하는지 여부를 결정하는 단계를 포함하는, 개인으로부터 수득된 핵산 시료의 유전형을 분석하는 방법으로서, 상기 하나 이상의 마커는 rs10941679 (서열번호 236), rs4415084 (서열번호 235), 및 rs1219648 (서열번호 237), 및 이들과 연관 불균형인 마커들로 구성된 군으로부터 선택되고, 상기 시료에서 상기 하나 이상의 대립인자의 존재의 결정은 상기 개인에서 유방암에 대한 감수성을 나타내는 것인 방법에 관한 것이다. 일 구체예에서, rs4415084 (서열번호 235)의 대립인자 T, rs10941679 (서열번호 236)의 대립인자 G 및/또는 rs1219648 (서열번호 237)의 대립인자 G의 존재의 결정은 상기 개인에서 유방암의 증가된 감수성을 나타낸다. 일 구체예에서, 유전형 분석은 상기 하나 이상의 다형성 마커를 플랭킹(flanking)하는 뉴클레오티드 프라이머 쌍을 이용한 중합효소 연쇄 반응(PCR)에 의해, 상기 하나 이상의 다형성 마커를 포함하는 핵산의 세그먼트를 증폭하는 단계를 포함한다. 또 다른 구체예에서, 유전형 분석은 대립인자-특이적 프로브 혼성화, 대립인자-특이적 프라이머 연장(primer extension), 대립인자-특이적 증폭, 핵산 서열결정(nucleic acid sequencing), 5'-엑소뉴클레아제 처리(exonuclease digestion), 분자 표지 분석법(molecular beacon assay), 올리고뉴클레오티드 라이게이션 분석법(oligonucleotide ligation assay), 크기 분석, 및 단일 가닥 구조 분석(single-stranded conformation analysis) 및 마이크로어레이 기술로부터 선택된 방법을 이용하여 수행된다. 일 구체예에서, 상기 마이크로어레이 기술은 Molecular Inversion Probe 어레이 기술 또는 BeadArray Technologies이다. 일 구체예에서, 상기 방법은 대립인자-특이적 프로브 혼성화를 포함한다. 또 다른 구체예에서, 상기 방법은 마이크로어레이 기술을 포함한다. 하나의 바람직한 구체예는 (1) 상기 핵산의 카피를 검출 올리고뉴클레오티드 프로브 및 인핸서 올리고뉴클레오티드 프로브와, 상기 올리고뉴클레오티드 프로브와 상기 핵산 간의 특이적 혼성화 조건 하에 접촉시키는 단계로서,
(a) 상기 검출 올리고뉴클레오티드 프로브는 길이가 5 내지 100개의 뉴클레오티드로 구성되고 서열번호 1 내지 서열번호 237 중 하나에 의해 주어진 뉴클레오티드 서열을 갖는 핵산의 제1 세그먼트에 특이적으로 혼성화되고,
(b) 상기 검출 올리고뉴클레오티드 프로브는 3' 말단의 검출가능한 표지 및 5' 말단의 퀀칭 모이어티(quenching moiety)를 포함하며,
(c) 상기 인핸서 올리고뉴클레오티드는 길이가 5 내지 100개의 뉴클레오티드로 구성되고 상기 올리고뉴클레오티드 프로브의 5'에 배열된 상기 뉴클레오티드 서열의 제2 세그먼트에 상보적이어서, 상기 두개의 올리고뉴클레오티드가 모두 상기 핵산에 혼성화되는 경우 상기 인핸서 올리고뉴클레오티드는 상기 검출 올리고뉴클레오티드에 대해 3' 에 위치하며, 및
(d) 상기 제1 세그먼트와 상기 제2 세그먼트 간에 단일 염기 갭(single base gap)이 존재하여, 상기 올리고뉴클레오티드 프로브와 상기 인핸서 올리고뉴클레오티드 프로브가 모두 상기 핵산에 혼성화되는 경우, 상기 올리고뉴클레오티드 간에 단일 염기 갭이 존재하는 것인 단계,
(2) 상기 검출 프로브가 상기 핵산에 혼성화되는 경우, 상기 검출 프로브의 3' 말단으로부터 상기 검출가능한 표지를 절단하여 유리된 검출가능한 표지를 방출시키는 엔도뉴클레아제로 상기 핵산을 처리하는 단계, 및
(3) 유리된 검출가능한 표지를 측정하는 단계로서, 상기 유리된 검출가능한 표지의 존재는 상기 검출 프로브가 상기 핵산의 제1 세그먼트에 특이적으로 혼성화되고, 상기 다형성 부위의 서열이 상기 검출 프로브의 상보체(complement)라는 것을 나타내는 것인 단계를 포함한다.
본 발명의 또 다른 양태는 유방암 치료제에 대한 반응의 확률에 대해 개인을 평가하는 방법으로서, 상기 개인으로부터 수득된 핵산 시료, 또는 상기 개인으로부터 유래된 유전형 데이터 세트에서 하나 이상의 다형성 마커의 하나 이상의 대립인자가 존재하는지 여부를 결정하는 단계를 포함하고, 상기 하나 이상의 다형성 마커는 rs10941679 (서열번호 236), rs4415084 (서열번호 235), 및 rs1219648 (서열번호 237), 및 이들과 연관 불균형인 마커들로 구성된 군으로부터 선택되고, 상기 하나 이상의 마커의 상기 하나 이상의 대립인자의 존재는 상기 치료제에 대한 양성 반응의 확률을 나타내는 것인 방법에 관한 것이다.
또 다른 양태에서, 본 발명은 유방암으로 진단된 개인의 예후(prognosis)를 예측하는 방법으로서, 상기 방법은 상기 개인으로부터 수득된 핵산 시료에서 하나 이상의 다형성 마커의 하나 이상의 대립인자가 존재하는지 여부를 결정하는 단계를 포함하고, 상기 하나 이상의 다형성 마커는 rs10941679 (서열번호 236), rs4415084 (서열번호 235), 및 rs1219648 (서열번호 237) 및 이들과 연관 불균형인 마커들로부터 선택되고, 상기 하나 이상의 대립인자의 존재는 상기 개인에서 유방암의 악화된 예후를 나타내는 것인 방법에 관한 것이다.
본 발명의 또 다른 양태는 유방암의 치료를 받는 개인의 치료의 진행을 모니터링하는 방법으로서, 상기 방법은 상기 개인으로부터 수득된 핵산 시료 또는 상기 개인으로부터 유래된 유전형 데이터세트에서 하나 이상의 다형성 마커의 하나 이상의 대립인자가 존재하는지 여부를 결정하는 단계를 포함하고, 상기 하나 이상의 다형성 마커는 rs10941679 (서열번호 236), rs4415084 (서열번호 235), 및 rs1219648 (서열번호 237), 및 이들과 연관 불균형인 마커들로부터 선택되고, 상기 하나 이상의 대립인자의 존재가 상기 개인의 치료 결과를 나타내는 것인 방법에 관한 것이다. 일 구체예에서, 상기 치료는 수술에 의한 치료, 방사선 요법에 의한 치료, 또는 약물 투여에 의한 치료이다.
본 발명은 또한 개인에서 유방암에 대한 감수성을 진단 및/또는 평가하기 위한 시약의 제조에서 올리고뉴클레오티드 프로브의 용도로서, 상기 프로브는 서열번호 1 내지 서열번호 237 중 하나로로 표시된 뉴클레오티드 서열을 갖는 핵산의 세그먼트에 혼성화되고, 상기 프로브는 길이가 15 내지 500개의 뉴클레오티드로 구성되는 것인 용도에 관한 것이다. 일부 구체예에서, 상기 프로브는 길이가 약 16개 내지 약 100개의 뉴클레오티드로 구성된다. 일부 다른 구체예에서, 상기 프로브는 길이가 약 20개 내지 약 50개의 뉴클레오티드로 구성된다. 일부 다른 구체예에서, 상기 프로브는 길이가 약 20개 내지 약 30개의 뉴클레오티드로 구성된다.
본 발명은 또한 컴퓨터-판독가능한 매체(computer-readable media)에 관한 것이다. 일 양태에서, 본 발명은 하나 이상의 다형성 마커에 대한 식별자(identifier); 유방암으로 진단된 복수의 개인에서 상기 하나 이상의 다형성 마커의 하나 이상의 대립인자의 빈도의 지표(indicator); 및 복수의 기준 개인(reference individual)에서 상기 하나 이상의 다형성 마커의 상기 하나 이상의 대립인자의 빈도의 지표;가 저장되고, 상기 하나 이상의 다형성 마커는 rs10941679 (서열번호 236), rs4415084 (서열번호 235), and rs1219648 (서열번호 237) 및 이들과 연관 불균형인 다형성 마커들로부터 선택되는 것인 매체에 관한 것이다. 일 구체예에서, 상기 다형성 마커는 표 12, 표 13 및 표 14에 표시된 마커들로부터 선택된다. 또 다른 구체예에서, 상기 매체는 상기 복수의 개인들의 선조에 대한 정보를 더 포함한다.
유방암 표현형의 다양한 진단 및 카테고리가 본 발명의 범위 내에 속한다. 가장 광범위한 의미로, 본 발명은 유방암 표현형에 관한 것이다. 일부 구체예에서, 유방암은 침윤성 관암종(invasive ductal), 침윤성 소엽암종(invasive lobular), 관암종(tubular), 또는 침윤성이거나 혼합 침윤성(mixed invasive), 수질(medullary) 암종, DCIS (Ductal Carcinoma In-Situ), LCIS (Lobular Carcinoma In-Situ), 또는 비-침윤성; 단계 0, 단계 1, (단계 2a 및 단계 2b를 포함한) 단계 2, (단계 3a, 단계 3b 및 단계 3c를 포함한) 단계 3 및 단계 4 유방암을 포함한 침윤성 유방암을 포함하나, 이에 한정되지 않는 유방암의 임상적 진단을 포함한다. 일부 구체예에서, 유방암 표현형은 모든 유방암(All Breast Cancer), 다발성 원발성 유방암(Multiple Primary Breast Cancer), 및 조기 발병 유방암(early onset Breast Cancer)으로부터 선택된다. 일부 구체예에서, 본 발명의 마커는 유방암의 가족력을 갖는 개인에서 유방암의 위험도와 연관된다. 하나의 그와 같은 구체예에서, 총 가족력 점수(summed family history, FHS)가 유방암과 연관된 표현형이다. 또 다른 구체예에서, 본 발명의 변이와 연관된 유방암은 에스트로겐 수용체(estrogen receptor, ER) 양성 및/또는 프로게스테론 수용체(progesterone receptor, PR) 양성 유방암이다. 일 구체예에서, 본 발명의 변이와 연관된 유방암은 에스트로겐 수용체(ER) 양성이다. 또 다른 구체예에서, 본 발명의 변이와 연관된 유방암은 프로게스테론(PR) 양성이다. 하나의 그와 같은 구체예에서, 유방암의 증가된 위험도 또는 감수성과 연관된 것으로 본 명세서에 기재된 마커들은 ER-양성 및/또는 PR-양성 유방암의 증가된 위험도 또는 감수성을 부여한다. 따라서, 일부 구체예에서, 본 발명의 하나 이상의 위험 변이의 존재는 개체에서 ER 양성 또는 PR 양성 유방암을 예측한다.
본 발명의 방법의 일부 구체예에서, 상기 방법에서 결정된 감수성은 증가된 감수성이다. 하나의 그와 같은 구체예에서, 증가된 감수성은 1.10 이상의 상대적 위험도(relative risk, RR)를 특징으로 한다. 또 다른 구체예에서, 증가된 감수성은 1.20 이상의 상대적 위험도를 특징으로 한다. 또 다른 구체예에서, 증가된 감수성은 1.30 이상의 상대적 위험도를 특징으로 한다. 또 다른 구체예에서, 증가된 감수성은 1.40 이상의 상대적 위험도를 특징으로 한다. 또 다른 구체예에서, 증가된 감수성은 1.50 이상의 상대적 위험도를 특징으로 한다. 또 다른 구체예에서, 증가된 감수성은 1.70 이상의 상대적 위험도를 특징으로 한다. 또 다른 구체예에서, 증가된 감수성은 2.0 이상의 상대적 위험도를 특징으로 한다. 다른 구체예는 1.10 이상, 1.11 이상, 1.12 이상, 1.13 이상, 1.14 이상, 1.15 이상, 1.16 이상, 1.17 이상, 1.18 이상, 1.19 이상, 1.20 이상, 1.21 이상, 1.22 이상, 1.23 이상, 1.24 이상, 1.25 이상, 1.26 이상, 1.27 이상, 1.28 이상, 1.29 이상, 1.30 이상, 1.31 이상, 1.32 이상, 1.33 이상, 1.34 이상, 1.35 이상의 상대적 위험도를 특징으로 한다. 이와 같은 전술된 값들을 사이의 위험도에 대한 다른 수치값들도 가능하고, 이들도 본 발명의 범위 내에 속한다.
본 발명의 방법의 일부 구체예에서, 상기 방법에서 결정된 감수성은 감소된 감수성이다. 하나의 그와 같은 구체예에서, 감소된 감수성은 0.9 미만의 상대적 위험도(RR)를 특징으로 한다. 또 다른 구체예에서, 감소된 감수성은 0.8 미만의 상대적 위험도(RR)를 특징으로 한다. 또 다른 구체예에서, 감소된 감수성은 0.7 미만의 상대적 위험도(RR)를 특징으로 한다. 또 다른 구체예에서, 감소된 감수성은 0.5 미만의 상대적 위험도(RR)를 특징으로 한다. 0.89 미만, 0.88 미만, 0.87 미만, 0.86 미만, 0.85 미만, 0.84 미만, 0.83 미만, 0.82 미만, 0.81 미만, 0.80 미만, 0.79 미만, 0.78 미만, 0.77 미만, 0.76 미만, 0.75 미만, 0.74 미만, 0.73 미만, 0.72 미만, 0.71 미만, 0.70 미만, 등의 상대적 위험도와 같은 다른 컷오프가 본 발명의 범위 내에 속한다.
본 발명은 또한 키트에 관한 것이다. 하나의 그와 같은 구체예에서, 본 발명은 개인에서 유방암에 대한 감수성을 평가하기 위한 키트로서, 상기 키트는 상기 개인의 게놈에서 염색체 5p12 또는 10q26 상의 하나 이상의 다형성 마커의 하나 이상의 대립인자를 선택적으로 검출하는 시약을 포함하고, 상기 하나 이상의 대립인자의 존재는 유방암에 대한 증가된 감수성을 나타내는 것인 키트에 관한 것이다. 또 다른 양태에서, 본 발명은 개인에서 유방암에 대한 감수성을 평가하기 위한 키트로서, 상기 키트는 상기 개인의 게놈에서 하나 이상의 다형성 마커의 하나 이상의 대립인자를 선택적으로 검출하기 위해 필요한 시약을 포함하고, 상기 다형성 마커는 rs10941679 (서열번호 236), rs4415084 (서열번호 235), 및 rs1219648 (서열번호 237), 및 이들과 연관 불균형인 마커들로부터 선택되고, 상기 하나 이상의 대립인자의 존재는 유방암에 대한 감수성을 나타내는 것인 키트에 관한 것이다. 일 구체예에서, 상기 하나 이상의 다형성 마커는 표 12, 표 13 및 표 14에 표시된 마커들로부터 선택된다.
일 구체예에서, 키트 시약은 상기 하나 이상의 다형성 마커를 포함하는 상기 개인의 게놈의 단편에 혼성화하는 하나 이상의 연속된(contiguous) 올리고뉴클레오티드를 포함한다. 또 다른 구체예에서, 상기 키트는 상기 개인으로부터 수득된 게놈 세그먼트의 반대쪽 가닥에 혼성화하는 한 쌍 이상의 올리고뉴클레오티드를 포함하고, 상기 각 올리고뉴클레오티드 프라이머 쌍은 하나의 다형성을 포함하는 상기 개인의 게놈의 단편을 선택적으로 증폭시키도록 설계되고, 상기 다형성은 표 12, 표 13 및 표 14에 정의된 다형성으로 구성된 군으로부터 선택되며, 상기 단편은 크기가 20 bp 이상이다. 일 구체예에서, 상기 올리고뉴클레오티드는 상기 개인의 게놈에 완전히 상보적이다. 또 다른 구체예에서, 상기 키트는 완충액 및 상기 세그먼트를 증폭시키는 효소를 더 포함한다. 또 다른 구체예에서, 상기 시약은 상기 단편을 검출하기 위한 표지를 더 포함한다.
하나의 바람직한 구체예에서, 상기 키트는 길이가 5 내지 100개의 뉴클레오티드로 구성된 검출 올리고뉴클레오티드 프로브; 길이가 5 내지 100개의 뉴클레오티드로 구성된 인핸서 올리고뉴클레오티드 프로브; 및 엔도뉴클레아제 효소;를 포함하고,
상기 검출 올리고뉴클레오티드 프로브는 서열번호 1 내지 서열번호 237 중 하나로 표시된 뉴클레오티드 서열의 핵산의 제1 세그먼트에 특이적으로 혼성화되고; 및
상기 검출 올리고뉴클레오티드 프로브는 3' 말단에 검출가능한 표지를 포함하고 5' 말단에 퀀칭 모이어티(quenching moiety)를 포함하며;
상기 인핸서 올리고뉴클레오티드는 길이가 5개 내지 100개의 뉴클레오티드로 구성되고, 상기 올리고뉴클레오티드 프로브의 5'에 배열된 상기 뉴클레오티드 서열의 제2 세그먼트에 상보적이어서, 상기 인핸서 올리고뉴클레오티드는 상기 두개의 올리고뉴클레오티드가 모두 상기 핵산에 혼성화되는 경우 상기 검출 올리고뉴클레오티드에 대해 3'에 위치하며; 및
상기 제1 세그먼트와 상기 제2 세그먼트 간에 단일 염기 갭이 존재하여, 상기 올리고뉴클레오티드 프로브와 상기 인핸서 올리고뉴클레오티드 프로브가 모두 상기 핵산에 혼성화되는 경우, 상기 올리고뉴클레오티드 간에 단일 염기 갭이 존재하며; 및
상기 핵산을 상기 엔도뉴클레아제에 의해 처리하는 단계는 상기 검출 프로브가 상기 핵산에 혼성화된 경우, 상기 검출 프로브의 3'말단으로부터 상기 검출가능한 표지를 절단하여 유리 상태의 검출가능한 표지를 방출시킨다.
본 발명에 따른 키트는 또한 이전에 유방암으로 진단되었던 개인에서 하나 이상의 이차 원발성 종양을 발병할 위험도를 평가하는 방법, 유방암 치료제에 대해 반응할 확률에 대해 개인을 평가하는 방법, 및 유방암으로 진단되었고 상기 질병에 대한 치료를 받은 개인의 치료 진행을 모니터링하는 방법을 포함한, 본 발명의 다른 방법에서 이용될 수 있다.
본 명세서에서 유방암과 연관된 것으로 기재된 마커들은 모두 본 명세서에 기재된 방법, 키트, 용도, 장치, 절차를 포함한, 본 발명의 다양한 양태에서 이용될 수 있다. 일부 구체예에서, 본 발명은 염색체 5p12 내의 마커들의 용도에 관한 것이다. 일부 다른 구체예에서, 본 발명은 염색체 10q26 내의 마커들의 용도에 관한 것이다. 일부 구체예에서, 본 발명은 표 1 또는 표 3에 표시된 마커들, 및 이들과 연관 불균형인 마커들에 관한 것이다. 일부 다른 구체예에서, 본 발명은 표 3에 표시된 마커들에 대한 관한 것이다. 일부 다른 구체예에서, 본 발명은 마커 rs10941679, rs7703618, rs4415084, rs2067980, rs10035564, rs11743392, rs7716600, 및 rs1219648, 및 이들과 연관 불균형인 마커들에 관한 것이다. 일부 바람직한 구체예에서, 본 발명은 마커 rs4415084, rs10941679 및 rs1219648, 및 이들과 연관 불균형인 마커에 관한 것이다. 일부 다른 바람직한 구체예에서, 본 발명은 본 명세서에서 표 12, 표 13 및 표 14에 표시된 마커들에 관한 것이다. 다른 바람직한 구체예에서, 본 발명은 rs4415084 및 이와 연관 불균형인 마커들(예를 들면, 표 12에 표시된 마커들)에 관한 것이다. 다른 바람직한 구체예에서, 본 발명은 rs10941679 및 이와 연관 불균형인 마커들(예를 들면, 표 13에 표시된 마커들)에 관한 것이다. 다른 바람직한 구체예에서, 본 발명은 rs1219648 및 이와 연관 불균형인 마커들(예를 들면, 표 14에 표시된 마커들)에 관한 것이다. 일 구체예에서, 본 발명은 마커 rs4415084에 관한 것이다. 또 다른 구체예에서, 본 발명은 rs10941679에 관한 것이다. 또 다른 구체예에서, 본 발명은 rs1219648에 관한 것이다.
일부 구체예에서, 상기 유방암의 증가된 위험도를 부여하는 하나 이상의 마커는 rs10941679 대립인자 G, rs7703618 대립인자 T, rs4415084 대립인자 G, rs2067980 대립인자 G, rs10035564 대립인자 G, rs11743392 대립인자 T, rs7716600 대립인자 A, 및 rs1219648 대립인자 G로부터 선택된다. 이 구체예에서, 상기 대립인자(위험 대립인자)의 존재는 유방암의 증가된 위험도를 나타낸다.
본 발명의 일부 구체예에서, 연관 불균형(linkage disequilibrium, LD)은 두 개의 유전적 세그먼트(예를 들면, 마커) 간의 연관 불균형의 정도의 정량적 척도를 제공하는, 연관 불균형 척도 r2 및 |D'|을 이용하여 결정된다. 본 명세서에서 더 설명되는 바와 같이, 특정한 마커들에 대한 이 척도들의 특정한 수치값들은 상기 마커들이 연관 불균형에 있다는 것을 나타낸다. 본 발명의 일 구체예에서, 마커들 간의 연관 불균형(즉, LD 값이 마커들이 연관 불균형이라는 것을 나타냄)은 0.1보다 큰 r2으로 정의된다. 또 다른 구체예에서, 연관 불균형은 0.2보다 큰 r2으로 정의된다. 다른 구체예는 r2 > 0.25, r2 > 0.3, r2 > 0.35, r2 > 0.4, r2 > 0.45, r2 > 0.5, r2 > 0.55, r2 > 0.6, r2 > 0.65, r2 > 0.7, r2 > 0.75, r2 > 0.8, r2 > 0.85, r2 > 0.9, r2 > 0.95, r2 > 0.96, r2 > 0.97, r2 > 0.98, 또는 r2 > 0.99와 같은, 연관 불균형의 다른 정의를 포함할 수 있다. 일부 구체예에서, 연관 불균형은 또한 |D'| > 0.2, 또는 |D'| > 0.3, |D'| > 0.4, |D'| > 0.5, |D'| > 0.6, |D'| > 0.7, |D'| > 0.8, |D'| > 0.9, |D'| > 0.95, |D'| > 0.98 또는 |D'| > 0.99로 정의될 수 있다. 일부 구체예에서, 연관 불균형은 r2 > 0.2 및 |D'| > 0.8과 같은 두 개의 기준 r2 및 |D'|을 충족시키는 것으로 정의된다. 앞서 표시된 이 파라미터들에 대한 값들을 포함하나, 이에 한정되지 않는, r2 및 |D'|에 대한 값들의 다른 조합도 가능하고, 본 발명의 범위 내에 속한다.
발명의 상세한 설명
본 발명은 유방암과 연관된 것으로 확인된 다형성 변이 및 일배체형을 개시한다. 염색체 5p12 상의 다형성 마커의 특정한 대립인자가 유방암과 연관된 것으로 확인되었다. 그와 같은 마커 및 일배체형은 본 명세서에서 더 설명되는 바와 같이, 진단 목적, 약물 반응을 예측하는 방법, 및 치료 진행을 예측하는 방법을 위해 유용하다. 본 발명의 추가적인 응용은 본 발명의 다형성 마커를 이용한 수술 또는 방사선 조사에 의한 유방암 치료법에 대한 반응을 평가하는 방법, 및 본 발명의 방법에서 사용되는 키트를 포함한다.
정의
달리 표시되지 않으면, 핵산 서열은 5'에서 3' 방향으로 좌측에서 우측으로 기재된다. 명세서 내에 기재된 수치 범위는 그 범위를 한정하는 수치를 포함하며 정의된 범위 내의 각 정수 또는 비-정수 분수(non-integer fraction)를 포함한다. 달리 정의되지 않으면, 본 명세서에서 사용된 모든 기술 용어 및 과학 용어는 본 발명이 속하는 기술 분야의 통상적인 기술자에 의해 일반적으로 이해되는 것과 동일한 의미를 갖는다.
본 발명에서, 하기의 용어들은 표시된 바와 같은 의미를 갖는다:
본 명세서에 기재된 바와 같이, 종종 "마커(marker)"로 불리는, "다형성 마커(polymorphic marker)"는 게놈 다형성 부위(genomic polymorphic site)를 의미한다. 각 다형성 마커는 다형성 부위에서 특정한 대립인자에 특징적인 두 개 이상의 서열 변이를 갖는다. 따라서, 다형성 마커에 대한 유전적 연관(genetic association)은 특정한 다형성 마커의 하나 이상의 특정한 대립인자에 대해 연관이 있다는 것을 의미한다. 마커는 SNP(single nucleotide polymorphism), 미니새틀라이트(minisatellite) 또는 마이크로새틀라이트(microsatellite), 전위(translocation) 및 카피수 변이(copy number variation)(삽입, 결실, 중복)를 포함한, 게놈에서 발견되는 임의의 변이 형태의 대립인자를 포함할 수 있다. 다형성 마커는 집단에서 임의의 측정가능한 빈도로 존재할 수 있다. 질병 유전자의 맵핑을 위해, 5-10%보다 높은 집단 빈도(population frequency)를 갖는 다형성 마커가 일반적으로 가장 유용하다. 그러나, 다형성 마커는 또한 1-5%와 같은 더 낮은 집단 빈도, 또는 훨씬 더 낮은 빈도, 특히, 카피 수 변화(copy number variation, CNV)를 가질 수 있다. 본 발명에서, 상기 용어는 임의의 집단 빈도를 갖는 다형성 마커를 포함하는 것으로 이해될 것이다.
"대립인자(allele)"는 염색체 상에 있는 주어진 유전자 좌(위치)의 뉴클레오티드 서열을 의미한다. 다형성 마커 대립인자는 따라서, 염색체 상의 마커의 조성(즉, 서열)을 의미한다. 개인으로부터의 게놈 DNA는 각 염색체 상의 마커의 각 카피를 대표하는, 임의의 주어진 다형성 마커에 대해 두 개의 대립인자를 포함한다. 본 명세서에서 사용된 뉴클레오티드에 대한 서열 코드는 A = 1, C = 2, G = 3, T = 4이다. 마이크로새틀라이트 대립인자(microsatellite allele)의 경우, CEPH 표본(Centre d'Etudes du Polymorphisme Humain, genomics repository, CEPH sample) 1347-02이 기준으로 이용되고, 이 표본에서 각 마이크로새틀라이트의 보다 짧은 대립인자는 0으로 설정되고 다른 표본에서 모든 다른 대립인자는 이 기준에 대비하여 번호가 부여된다. 따라서, 예를 들면, 대립인자 1은 CEPH 표본에서의 보다 짧은 대립인자보다 1 bp 더 길고, 대립인자 2는 CEPH 표본에서의 보다 짧은 대립인자보다 2 bp 더 길며, 대립인자 3은 CEPH 표본에서의 보다 짧은 대립인자보다 3 bp 더 길며, 대립인자 -1은 CEPH 표본에서의 보다 짧은 대립인자보다 1 bp 더 짧고, 대립인자 -2는 CEPH 표본에서의 보다 짧은 대립인자보다 2 bp 더 짧다.
"단일 뉴클레오티드 다형성(Single Nucleotide Polymorphism)" 또는 "SNP"는 게놈의 특정한 위치에 있는 단일 뉴클레오티드가 종의 멤버 간에 또는 개체 내에서 쌍을 이루는 염색체 간에 상이할 때 나타나는 DNA 서열 변이이다. 대부분의 SNP 다형성은 두 개의 대립인자를 갖는다. 각 개체는 이 경우, 상기 다형성의 하나의 대립인자에 대해 동형접합(즉, 개체의 두 개의 염색체 카피 모두 SNP 위치에서 동일한 뉴클레오티드를 가짐)이거나, 또는 개체는 이형접합이다(즉, 상기 개체의 두 개의 자매 염색체(sister nucleotide)가 상이한 뉴클레오티드를 포함함). 본 명세서에서 보고된 바와 같이, SNP 명명은 NCBI(the National Center for Biotechnological Information)에 의해 각각의 독특한 SNP에 부여된 공식적인 기준 SNP(Reference SNP, rs) ID 식별 택(tag)을 의미한다.
본 명세서에 기재된 서열 코뉴클레오티드 중의성(sequence conucleotide ambiguity)은 IUPAC-IUB에 의해 제안된 바와 같다. 이 코드들은 EMBL, GenBank, 및 PIR 데이터베이스에 의해 사용된 코드들과 양립될 수 있다.
IUB 코드 의미
A 아데노신
C 시티딘
G 구아닌
T 티미딘
R G 또는 A
Y T 또는 C
K G 또는 T
M A 또는 C
S G 또는 C
W A 또는 T
B C G 또는 T
D A G 또는 T
H A C 또는 T
V A C 또는 G
N A C G 또는 T (임의의 염기)
집단(자연 집단 또는 인위적 집단, 예를 들면, 합성 분자들의 라이브러리) 내에서 하나 이상의 서열이 가능한 뉴클레오티드 위치가 본 명세서에서 "다형성 부위(polymorphic site)"로 지칭된다.
본 명세서에 기재된 "변이(variant)"는 기준(reference) DNA와 상이한 DNA의 세그먼트를 의미한다. 본 명세서에서 정의된 "마커(marker)" 또는 "다형성 마커(polymorphic marker)"는 변이이다. 기준과 상이한 대립인자(allele)는 "변이" 대립인자로 지칭된다.
"마이크로새틀라이트(microsatellite)"는 특정한 부위에 있는 길이가 2 내지 8개의 뉴클레오티드로 구성된 염기의 작은 반복체(repeat)(예를 들면, CA 반복체)를 복수 개 갖는 다형성 마커이며, 전체 집단에서 반복체 길이의 수는 변한다.
"indel"은 통상적으로 단지 수개의 뉴클레오티드로 구성된 길이의 작은 삽입 또는 결실을 포함하는 다형성의 일반적인 형태이다.
본 명세서에 기재된, "일배체형(haplotype)"은 세그먼트를 따라 배열된 대립인자의 특정한 조합을 특징으로 하는 DNA의 하나의 가닥 내에 있는 게놈 DNA의 세그먼트를 의미한다. 인간과 같은 이배체(diploid) 개체의 경우, 일배체형은 각 다형성 마커 또는 유전자 좌에 대해 대립인자의 쌍 중 하나의 대립인자(one member)를 포함한다. 특정한 구체예에서, 일배체형은 두개 이상의 대립인자, 세개 이상의 대립인자, 네개 이상의 대립인자, 또는 다섯개 이상의 대립인자를 포함할 수 있다.
본 명세서에 기재된 용어 "감수성(susceptibility)"은 증가된 감수성 및 감소된 감수성을 모두 포함한다. 따라서, 본 발명의 특정한 다형성 마커 및/또는 일배체형은 1보다 큰 상대적 위험도(RR) 또는 1보다 큰 오즈비(OR)를 특징으로 하는, 유방암의 증가된 감수성(즉, 증가된 위험도)을 특징으로 할 수 있다. 대안적으로, 본 발명의 마커 및/또는 일배체형은 1 미만의 상대적 위험도 또는 1 미만의 오즈비를 특징으로 하는, 유방암의 감소된 감수성(즉, 감소된 위험도)을 특징으로 한다. 본 명세서에서 일배체형은 마커 명칭 및 상기 마커의 대립인자로 기재되며, 예를 들면, 일배체형 "T rs4415084"는 마커 rs4415084의 대립인자 T가 일배체형에 있다는 것을 의미하고, "rs4415084 대립인자 T(rs4415084 allele T)" 또는 "T-rs4415084"와 동등하다. 또한, 일배체형에서 대립인자 코드는 개별적인 마커에 대한 것과 같고, 즉, 1 = A, 2 = C, 3 = G 및 4 = T이다.
본 명세서에 기재된 용어 "감수성(susceptibility)"은 개체가 평균 개체들보다 특정한 상태(예를 들면, 특정한 형질, 표현형, 또는 질병, 예를 들면, 유방암)을 발병하는 경향이 있거나, 또는 특정 상태에 저항할 수 있는 능력이 평균 개체보다 더 약한 것을 의미한다. 상기 용어는 증가된 감수성 및 감소된 감수성을 모두 포함한다. 따라서, 본 발명의 다형성 마커의 특정한 대립인자 및/또는 일배체형은 상기 특정한 대립인자 또는 일배체형에 대한 1보다 큰 상대적 위험도(RR) 또는 오즈비(OR)를 특징으로 하는, 유방암의 증가된 감수성(즉, 증가된 위험도)을 특징으로 할 수 있다. 대안적으로, 본 발명의 마커 및/또는 일배체형은 1 미만의 상대적 위험도 또는 오즈비를 특징으로 하는, 유방암의 감소된 감수성(즉, 감소된 위험도)을 특징으로 한다.
용어 "및/또는"은 본 명세서에서 상기 용어에 의해 연결된 항목들 중 하나 또는 양자 모두가 포함된다는 것을 나타내는 것으로 이해될 것이다. 바꾸어 말하면, 본 명세서에서 상기 용어는 "하나 또는 그 나머지 또는 양자 모두(one or the other or both)"를 의미하는 것으로 이해될 것이다.
본 명세서에 기재된 용어 "참조표(look-up table)"는 하나의 형태의 데이터를 또 다른 형태와 상관시키거나, 또는 하나 이상의 형태의 데이터를 상기 데이터가 관련된 예상되는 결과, 예를 들면, 표현형 또는 성향과 상관시키는 표이다. 예를 들면, 참조표는 하나 이상의 다형성 마커에 대한 대립인자 데이터와, 특정한 대립인자 데이터를 포함하는 개체가 표시할 것 같거나, 또는 그 특정한 대립인자 데이터를 갖지 않는 개인보다 표시할 가능성이 더 높은, 특정한 질병 진단과 같은 특정한 성향 또는 표현형 간의 상관관계를 포함할 수 있다. 참조표는 다면적(multidimensional)일 수 있고, 즉, 참조표는 단일 마커들에 대한 복수 개의 대립인자에 대한 정보를 동시에 포함할 수 있거나, 또는 그들은 복수 개의 마커들에 대한 정보를 포함할 수 있고, 그들은 또한 질병 진단에 대한 세부사항, 인종 정보, 바이오마커, 생화학적 측정값, 치료적 방법, 또는 약물 등과 같은 다른 인자들을 포함할 수 있다.
"컴퓨터-판독가능한 매체(computer-readable medium)"는 상업적으로 구매가능하거나 또는 맞춤-제작된(custom-made) 인터페이스를 이용하여 컴퓨터에 의해 접근될 수 있는 정보 저장 매체이다. 대표적인 컴퓨터-판독가능한 매체는 메모리(예를 들면, RAM, ROM, 플래쉬 메모리, 등), 광학적 저장 매체(예를 들면, CD-ROM), 자기 저장 매체(예를 들면, 컴퓨터 하드 드라이브, 플로피 디스크, 등), 천공 카드(punch card), 또는 기타 상업적으로 구입가능한 매체를 포함한다. 목적 시스템(system of interest)과 매체, 컴퓨터간, 또는 컴퓨터와 저장 또는 저장된 정보의 접근을 위한 컴퓨터-판독가능한 매체 간에 정보가 전달될 수 있다. 그와 같은 전송은 전기적이거나, 또는 IR 링크, 무선 연결 등과 같은 다른 이용가능한 방법에 의해 수행될 수 있다.
"핵산 시료(nucleic acid sample)"는 핵산(DNA 또는 RNA)를 포함하는 개체로부터 수득된 시료이다. 일부 구체예에서, 즉, 특정한 다형성 마커 및/또는 일배체형의 검출에서, 핵산 시료는 게놈 DNA를 포함한다. 그와 같은 핵산 시료는 혈액 시료, 양수액, 뇌척수액, 또는 피부, 근육, 구강 점막 또는 결막 점막, 태반, 위장관 또는 기타 기관으로부터의 조직 시료를 포함한, 게놈 DNA를 포함하는 임의의 공급원(source)으로부터 수득될 수 있다.
본 명세서에서 사용된 용어 "유방암 치료제(breast cancer therapeutic agent)"는 유방암과 연관된 증상을 개선시키거나 또는 예방하기 위해 이용될 수 있는 작용제를 의미한다.
본 명세서에 기재된 용어 "유방암-연관 핵산(breast cancer-associated nucleic acid)"은 유방암과 연관된 것으로 확인된 핵산을 의미한다. 이는 본 명세서에 기재된 마커 및 일배체형 및 이들과 강한 연관 불균형(LD)인 마커 및 일배체형을 포함하나, 이에 한정되지 않는다.
본 명세서에서 사용된 용어 "유방암(breast Cancer)"은 유방암의 임상적 진단을 의미하고, 유방암의 모든 특정한 서브표현형을 포함한다. 예를 들면, 유방암은 때때로 에스트로겐 수용체(ER) 양성 유방암 또는 에스트로겐 수용체 음성 유방암으로 분류되고, 유방암은 또한 때때로 프로게스테론 수용체(PR) 양성 또는 음성으로 분류된다. 유방암은 또한 때때로 침윤성 관암종, 침윤성 소엽종, 또는 관암종, 또는 침윤성 또는 혼합 침윤성으로 진단된다. 유방암은 또한, 수질성(medullary) DCIS (Ductal Carcinoma In-Situ) 또는 LCIS (Lobular Carcinoma In-Situ), 또는 비-침윤성으로 분류된다. 침윤성 유방암은 단계 0, 단계 1, (단계 2a 및 단계 2b를 포함한) 단계 2, (단계 3a, 단계 3b 및 단계 3c를 포함한) 단계 3 또는 단계 4 유방암으로 정의될 수 있다. 본 발명에서, 유방암은 이와 같은 유방암의 서브표현형을 포함할 수 있고, 또한, 유방암의 임상적으로 적용가능한 서브표현형을 포함한다.
용어 "모든 유방암(All Breast Cancer)" 또는 "All BC"는 유방암으로 진단된 모든 개체를 의미한다.
용어 "중간 소인(Medium Predisposition)" 유방암 또는 "MedPre" 유방암은 유방암의 서브-표현형을 의미한다. 이 표현형의 정의는 발단자(proband)가 하기 기준 중 하나 이상을 충족시킬 것을 요구한다:
발단자(proband)는 3M(meiotic event)의 유전적 거리 내에 3명 이상의 영향받은(affected) 친척을 포함하는 유방암 케이스의 클러스터(cluster)의 구성원이다.
발단자는 3M 내의 관계된 영향받은 쌍 중 일 구성원이고, 상기 쌍 중 1인은 50세 이전에 진단받았다.
발단자는 3M 내의 관계된 영향받은 쌍 중 일 구성원이고, 상기 쌍 중 1인은 임의의 종류의 이차 원발성 종양을 진단받았다.
발단자는 임의의 종류의 원발성 종양을 진단받았다.
본 명세서에 기재된 용어 "다발성 원발성 유방암(Multiple Primary Breast Tumor)" 또는 "MPBC"는 제1 유방암 진단 외에 하나 이상의 원발성 종양이 진단되고, 상기 두 종양은 상기 제1 유방암과 동시에 또는 상기 제1 유방암에 뒤이어 발생하고 반대쪽 유방 또는 같은쪽 유방에서 발생한, 임상적으로 및 조직학적으로 독립적인 원발성 종양으로 확인된 케이스를 의미한다.
본 명세서에서 사용된 용어 "가족력 점수(Family history score)" 또는 "FHS"는 상기 질환을 갖는 발단자에 대해 유방암에 걸린 친척의 수에 근거하여 정의된다. 각 발단자에 대해, 영향받은 1촌 친척 1인당 1점이 부여되고, 영향받은 2촌 친척 1인당 0.5점이 부여되며, 영향받은 3촌 친척 1인당 0.25점이 부여된다. 모든 영향받은 친척에 대해 수득된 총합이 총 가족력 점수(summed family history score) 또는 FHS이다.
본 명세서에서 정의된 용어 "에스트로겐 수용체 양성 유방암(estrogen receptor positive breast cancer)" 또는 "ER 양성 유방암"은 에스트로겐 수용체에 대해 양성으로 결정된 종양을 의미한다. 본 발명에서, 10 fmol/mg 이상의 ER 수준 또는 10% 이상의 양성 핵의 면역조직화학적(immunohistochemical) 평가가 양성으로 간주된다. ER 양성인 기준을 충족시키지 않는 유방암은 본 명세서에서 "ER 음성(ER negative)" 또는 "에스트로겐 수용체 음성(estrogen receptor negative)"으로 정의된다.
본 명세서에서 정의된 용어 "프로게스테론 수용체 양성 유방암(progesterone receptor positive breast cancer)" 또는 "PR 양성 유방암"은 프로게스테론 수용체에 대해 양성으로 결정된 종양을 의미한다. 본 발명에서, 10 fmol/mg 이상의 PR 수준 또는 10% 이상의 양성 핵의 면역조직화학적 평가가 양성으로 간주된다. PR 양성인 기준을 충족시키지 않는 유방암은 본 명세서에서 "PR 음성(PR negative)" 또는 "프로게스테론 수용체 음성(progesterone receptor negative)"으로 정의된다.
본 명세서에서 사용된 용어 "염색체 5p12"는 NCBI (National Center for Biotechnology Information) Build 34의 위치 44,094,392와 46,393,984 사이에 있는 염색체 5 상의 영역을 의미한다.
본 명세서에서 사용된 용어 "FGF10" 또는 "FGF10 유전자"는 인간 염색체 5p 상의 섬유모세포 성장 인자 10(Fibroblast Growth Factor 10) 유전자를 의미한다.
본 명세서에서 사용된 용어 "MRPS30" 또는 "MRPS30 유전자"는 인간 염색체 5p 상의 미토콘드리아 리보솜 단백질 S30(Mitochondrial Ribosomal Protein S30) 유전자를 의미한다. 이 유전자는 또한, PDCD9(programmed cell death protein 9)로도 지칭되고, 미토콘드리아 S28 서브유닛을 코딩한다.
본 명세서에서 사용된 용어 "FGFR2" 또는 "FGFR2 유전자"는 인간 염색체 10q26 상의 섬유모세포 성장 인자 수용체 2(Fibroblast Growth Factor Receptor 2) 유전자를 의미한다. 이 유전자는 또한, 단백질 티로신 키나아제 수용체 유사 14(Protein Tyrosine Kinase Receptor Like 14, TK14), 각질세포 성장 인자 수용체(Keratinocyte Growth Factor Receptor, KGFR), 및 섬유모세포 성장 인자 수용체(Fibroblast Growth Factor Receptor) BEK로 지칭된다.
본 발명에 따라 유방암으로 진단된 개체들의 집단의 연관 분석(association analysis)을 통해, 염색체 5p12 상의 특정한 다형성 마커의 특정한 대립인자가 유방암과 연관된다는 것이 발견되었다. 암과 연관된 변이에 대한 게놈-전체 분석은 본 명세서에서 염색체 5p12 영역이라 지칭되는, 염색체 5 상의 위치 44,094,392와 46,393,984 사이의 영역(NCBI Build 34의 좌표)과 유방암의의 연관을 밝혔다. 이 영역 내의 특정한 마커들이 유방암의 증가된 위험도와 연관되는 것으로 확인되었다.
Illumina HumanHap300 마이크로어레이 기술을 이용하여 약 1,600명의 아이슬란드 유방암 환자와 11,563명의 대조군의 유전형 분석을 통해, 염색체 5p 상의 다수의 마커들이 유방암에 대한 연관을 보이는 것으로 확인되었다(표 1). 특히, 마커 rs4415084의 대립인자 T 및 마커 rs7703618의 대립인자 G가 유방암의 증가된 위험도와 연관되는 것으로 확인되었다. 마커 rs7703618의 연관이 제2 아이슬란드 코호트에서 재현되어, 상기 연관 신호가 실제로 유의하다는 것을 보여주었다.
아이슬란드 발견 코호트(Iceland discovery cohort)와 공개 CGEMS 데이터 세트의 비교는 rs4415084와의 연관도 이 코호트에서 재현된다는 것을 밝혔다. 실제로, 이 마커에 대한 연관 신호(아이슬란드 발견 코호트에서 p-값 9.02E-06)가 게놈-전체 수준에서 (Bonferroni 보정 후) 유의성 있고, 상기 두 데이터 세트가 합쳐진 경우 명목적(nominal) p-값은 1.38E-07였다. 이 SNP는 CGEMS 데이터 세트 단독에서 2.21E-03의 현저하지 않은 P-값을 가지나, 아이슬란드 집단에서 최초의 발견을 재현했다.
마커 rs4415084 (D'= 0.99, r2 = 0.51)와 상관된, 마커 rs10941679는 유방암과 훨씬 더 강한 상관관계를 갖는다(OR = 1.19, p-값 2.2E-06). 후속 분석(follow-up analysis)은 스웨덴, 네덜란드, 스페인 및 미국으로부터 기원된 코호트에서 상기 신호가 rs4415084 및 rs10941679 때문이라는 것을 보여주었다(표 6 참조).
본 발명은 Chr5p12 영역의 대립인자 이질성(allelic heterogeneity)의 증거를 보여주며, 주요 마커 rs7703618, rs4415084, rs2067980, rs10035564, rs11743392 및 rs7716600에 의해 대표된 6개의 동등성 클래스(equivalence class)가 확인되었다. 추가적인 분석은 관찰된 연관 신호가 주로 마커 rs4415084 및 rs10941679에 의해 설명된다는 것을 확립하였다.
본 발명에 의해 유방암과 연관된 마커 및 일배체형을 갖는 것으로 확인된 영역에서 주목되는 3개의 공지된 유전자가 있다. 이 유전자들은 FGF10, MRPS30, 및 HCN1이고, 불충분하게 규명된(poorly characterized) 유전자 LOC441070이 있다. 이 유전자들 중 두 개, FGF10 및 MRPS30은 유방암 소인과의 관련에 대한 강력한 후보이다.
따라서, FGF10은 유방의 정상적인 배아 발생을 위해 필요하며[Howard and Ashworth, (2006), PLoS Genet, 2, e112], FGF10은 MMTV 삽입 돌연변이생성(insertional mutagenesis)에 의한 유방암의 마우스 모델에서 발암 유전자로 관여되었으며 FGF10은 인간 유방암의 약 10%에서 과발현된다[Theodorou, et al., (2004), Oncogene, 23, 6047-55]. FGF10 유전자는 연관 신호의 주요 클러스터(cluster)로부터 재조합 핫스팟에 의해 분리된다. 그러나, FGF10의 조절을 제어하는 주요 요소가 강한 연관 신호가 일어나는 영역에 존재할 수 있다. 대안적으로, 연관 신호는 FGF10 유전자 자체 내의 병원성 돌연변이와 연관 불균형일 수 있다.
PDCD9(programmed cell death protein 9)로도 알려진, MRPS30 유전자는 미토콘드리아 28S 리보솜 서브유닛을 코딩한다. 이 유전자는 오골계(Gallus gallus)의 아폽토시스 촉진 단백질(pro-apoptotic protein) p52의 포유동물 대응물(counterpart)이다. 상기 유전자는 포유동물 세포에서 아폽토시스를 유도하고 스트레스-반응성(stress-responsive) JNK1 경로를 활성화하는 것으로 확인되었다. 상기 단백질은 적어도 부분적으로 Bcl-2 경로를 통해 아폽토시스에서 기능하는 것으로 보인다[Sun, et al., (1998), Gene, 208, 157-66; Carim, et al., (1999), Cytogenet Cell Genet, 87, 85-8; Cavdar Koc, et al., (2001), FEBS Lett, 492, 166-70]. 상기 단백질은 이전에 유방암에 관련되지 않았었으나, 전술된 경로에의 관여는 MRPS30의 유전적 변이가 유방암 위험도를 변형시키는 것에 관여될 수 있다는 것을 시사한다.
염색체 10 상의 FGFR2 유전자 좌(locus)에 있는 마커 rs1219648가 유방암의 위험도를 부여하며(표 6), 특히 ER 양성 종양(표 10)과 연관된다는 것이 발견되었다. 또한, 결절 음성 종양(node negative tumour)보다 결절 양성 종양에서 rs1219648과의 연관이 더 유의하고, 상기 연관은 유방암의 가족력을 갖는 개체에서 더 강하다는 것이 발견되었다.
마커 및 일배체형의 평가
집단 내의 게놈 서열은 개체들이 비교될 때 동일하지 않다. 오히려, 게놈은 게놈 상의 다수의 위치에서 개체들 간에 서열 변이성(sequence variability)을 보인다. 그와 같은 서열 상의 변이는 일반적으로 다형성(polymorphism)으로 지칭되며, 각 게놈 내에 다수의 그와 같은 부위들이 있다. 예를 들면, 인간 게놈은 평균적으로 500 bp마다 나타나는 서열 변이를 보인다. 가장 일반적인 서열 변이는 게놈 내의 단일 염기 위치에서의 염기의 변화로 구성되고, 그와 같은 서열 변이, 또는 다형성은 일반적으로 단일 뉴클레오티드 다형성("SNP")로 지칭된다. 이 SNP들은 단일 돌연변이 사건에서 일어난 것으로 사료되며, 따라서, 통상적으로 각 SNP 부위에 두 개의 가능한 대립인자들이 있다; 본래의 대립인자와 돌연변이된(대안적인) 대립인자. 자연적인 유전적 부동(genetic drift) 및 또한 가능한 선택적 압력 때문에, 본래의 돌연변이가 주어진 집단에서 그의 대립인자의 특정한 빈도를 특징으로 하는 다형성을 초래했다. 미니새틀라이트, 마이크로새틀라이트, 및 삽입, 결실, 역전을 포함한, 다수의 다른 종류의 서열 변이(카피 수 변화(CNV)로도 지칭됨)가 인간 게놈 내에서 발견된다. 다형성 마이크로새틀라이트는 특정한 부위에 복수 개의 짧은 염기 반복체(small repeat of bases)(예를 들면, CA 반복체, 상보성 가닥 상의 TG)를 가지며, 전체 집단에서 반복체 길이의 수가 변화한다. 일반적인 용어로, 다형성 부위에 대한 서열의 각 버전은 상기 다형성 부위의 특정한 대립인자를 나타낸다. 모든 서열 변이들은 해당 서열 변이의 특징적인, 특정한 다형성 부위에서 일어나는, 다형성으로 지칭될 수 있다. 일반적인 용어로, 다형성은 임의의 수의 특정한 대립인자를 포함할 수 있다. 따라서, 본 발명의 일 구체예에서, 다형성은 임의의 주어진 집단에서 둘 이상의 대립인자의 존재를 특징으로 한다. 또 다른 구체예에서, 다형성은 세개 이상의 대립인자의 존재를 특징으로 한다. 다른 구체예에서, 다형성은 4개 이상의 대립인자, 5개 이상의 대립인자, 6개 이상의 대립인자, 7개 이상의 대립인자, 9개 이상의 대립인자 또는 10개 이상의 대립인자의 존재를 특징으로 한다. 모든 그와 같은 다형성은 본 발명의 방법 및 키트에서 이용될 수 있고, 따라서, 본 발명의 범위 내에 속한다.
그들의 존재도(abundance) 때문에, SNP는 인간 게놈 중의 대부분의 서열 변이를 설명한다. 6백만 개 이상의 SNP가 현재까지 검증되었다(http://www.ncbi.nlm.nih.gov/projects/SNP/snp_summary.cgi). 그러나, CNV에 대한 관심이 증가되고 있다. 이 대규모 다형성(통상적으로 1 kb 이상)은 집합된 인간 게놈의 상당한 부분에 영향을 미치는 다형성을 설명한다; 공지된 CNV가 인간 게놈 서열의 15% 이상을 차지한다(Estivill, X Armengol; L., PloS Genetics 3:1787-99 (2007). A http://projects.tcag.ca/variation/). 그러나, 이 다형성의 대부분은 매우 드물며, 평균적으로 각 개체의 게놈 서열의 일부에만 영향을 미친다. CNV는 유전자 량(gene dosage)을 붕괴시키는 것에 의해 유전자 발현, 표현형 변이 및 적응(adaptation)에 영향을 미치는 것으로 알려져 있고, 또한, 질병(미세결실(microdeletion) 증후군 및 미세중복(microduplication) 증후군)을 유발하고 HIV-1 감염 및 사구체신염을 포함한, 일반적인 복합 질환(common complex disease)의 위험도를 부여하는 것으로 알려져 있다(Redon, R., et al. Nature 23:444-454 (2006)). 따라서, 이전에 개시되거나 또는 알려지지 않았던 CNV가 본 명세서에서 유방암과 연관된 것으로 기재된 마커들과 연관 불균형인 원인적 변이(causative variant)를 나타내는 것이 가능하다. CNV를 검출하는 방법은 CGH(comparative genomic hybridization) 및 Carter (Nature Genetics 39:S16-S21 (2007))에 의해 기재된 바와 같은, 유전형분석 어레이의 이용을 포함한 유전형분석(genotyping)을 포함한다. 게놈 변이 데이터베이스(Database of Genomic Variants) (http://projects.tcag.ca/variation/)는 개시된 CNV의 위치, 종류 및 크기에 대한 업데이트된 정보를 포함한다. 상기 데이터베이스는 현재 15,000개 이상의 CNV에 대한 데이터를 포함한다.
일부 경우에, 기준 대립인자(reference allele)를 선택하지 않고, 다형성 부위에서 상이한 대립인자를 지칭할 수 있다. 대안적으로, 특정한 다형성 부위에 대해 기준 서열이 지칭될 수 있다. 기준 대립인자는 종종 "야생형(wild-type)" 대립인자로 지칭되고, 이는 통상적으로 최초의 서열결정된(first sequenced) 대립인자 또는 "영향받지 않은(non-affected)" 개체(예를 들면, 성향(trait)이나 질병 표현형을 보이지 않는 개체)로부터의 대립인자로 선택된다.
본 명세서에서 지칭되는 SNP 마커에 대한 대립인자는 이용된 SNP 분석법에서 다형성 부위에서 그들이 나타나는 경우, 염기 A, C, G 또는 T로 지칭된다. 본 명세서에서 이용된 SNP에 대한 대립인자 코드는 하기와 같다: 1 = A, 2 = C, 3 = G, 4 = T. 그러나, 본 발명이 속하는 기술 분야의 당업자는 반대쪽 DNA 가닥을 분석하거나 또는 판독하는 것에 의해, 각 경우에 상보적 대립인자가 측정될 수 있다는 것을 인식할 것이다. 따라서, A/G 다형성을 특징으로 하는 다형성 부위(다형성 마커)에 대해, 이용되는 분석법은 가능한 두 염기, 즉, A 및 G 중 하나 또는 양자 모두를 검출하도록 설계될 수 있다. 대안적으로, DNA 주형 상의 반대쪽 가닥을 검출하도록 분석법을 설계하는 것에 의해, 상보적 염기 T 및 C의 존재가 측정될 수 있다. 정량적으로(예를 들면, 상대적 위험도의 측면에서), 동일한 결과가 각 DNA 가닥(+ 가닥 또는 - 가닥)의 측정으로부터 수득될 것이다.
일반적으로, 특정한 서열에 대해 기준 서열이 지정된다. 기준과 상이한 대립인자는 종종 "변이(variant)" 대립인자로 지칭된다. 본 명세서에서 사용된, 변이 서열(variant sequence)은 기준 서열과 상이하나, 그 외에는 실질적으로 유사한 서열을 의미한다. 본 명세서에 기재된 다형성 유전적 마커의 대립인자는 변이(variant)이다. 추가적인 변이들은 폴리펩티드에 영향을 미치는 변화들을 포함할 수 있다. 기준 뉴클레오티드 서열과 비교한 경우, 서열 차이는 프레임 쉬프트(frame shift)를 초래하는, 단일 뉴클레오티드의 삽입 또는 결실, 하나보다 많은 수의 뉴클레오티드의 삽입 또는 결실; 코딩된 아미노산의 변화를 초래하는, 하나 이상의 뉴클레오티드의 변화; 조기 종료 코돈(premature stop codon)의 생성을 초래하는, 하나 이상의 뉴클레오티드의 변화; 뉴클레오티드에 의해 코딩된, 하나 이상의 아미노산의 결실을 초래하는, 수개의 뉴클레오티드의 결실; 해독 프레임(reading frame)의 코딩 서열의 중단(interruption)을 초래하는, 불균등 재조합(unequal recombination) 또는 유전자 전환(gene conversion)과 같은, 하나 또는 수개의 뉴클레오티드의 삽입; 전체 서열 또는 일부 서열의 중복; 전위; 또는 뉴클레오티드 서열의 재배열을 포함할 수 있다. 그와 같은 서열 변화는 핵산에 의해 코딩된 폴리펩티드를 변화시킬 수 있다. 예를 들면, 핵산 서열의 변화가 프레임 쉬프트를 유발하는 경우, 프레임 쉬프트는 코딩된 아미노산의 변화를 초래할 수 있고, 및/또는 조기 종료 코돈의 생성을 초래하여, 절단된(truncated) 폴리펩티드의 생성을 유발한다. 대안적으로, 질병 또는 성향과 연관된 다형성은 하나 또는 그 이상의 뉴클레오티드의 동의적 변화(synonymous change)(즉, 아미노산 서열의 변화를 초래하지 않는 변화)일 수 있다. 그와 같은 다형성은 예를 들면, 스플라이싱 부위(splice site)를 변화시키고, mRNA의 안정성 또는 수송에 영향을 미치거나 또는 코딩된 폴리펩티드의 전사 또는 번역에 영향을 미칠 수 있다. 다형성은 또한 증폭 또는 결실과 같은 구조적 변화가 체세포 수준(somatic level)에서 일어날 가능성을 증가시키도록 DNA를 변화시킬 수 있다. 기준 뉴클레오티드 서열에 의해 코딩된 폴리펩티드는 특정한 기준 아미노산 서열을 갖는 "기준(reference)" 폴리펩티드이고, 변이 대립인자에 의해 코딩된 폴리펩티드는 변이 아미노산 서열을 갖는 "변이(variant)" 폴리펩티드로 지칭된다.
일배체형은 세그먼트를 따라 배열된 대립인자의 특정한 조합을 특징으로 하는 DNA의 세그먼트를 의미한다. 인간과 같은 이배체 개체의 경우, 일배체형은 각 다형성 마커 또는 유전자 좌에 대한 1쌍의 대립인자 중 하나의 대립인자를 포함한다. 특정한 구체예에서, 일배체형은 두개 이상의 대립인자, 세개 이상의 대립인자,네개 이상의 대립인자, 또는 다섯개 이상의 대립인자를 포함할 수 있고, 각 대립인자는 세그먼트 상의 특정한 다형성 마커에 대응된다. 일배체형은 다양한 다형성 마커의 조합, 예를 들면, 다형성 부위에 특정한 대립인자를 갖는 SNP와 마이크로새틀라이트의 조합을 포함할 수 있다. 따라서, 일배체형은 다양한 유전적 마커에서 대립인자의 조합을 포함한다.
특정한 다형성 마커 및/또는 일배체형의 검출은 본 발명이 속하는 기술 분야에서 공지된, 다형성 부위에서 서열을 검출하는 방법에 의해 달성될 수 있다. 예를 들면, PCR, LCR, 이중 PCR(nested PCR) 및 핵산 증폭을 위한 기타 기법을 이용한, 형광-기반 기법(Chen, X. et al., Genome Res. 9(5): 492-98 (1999); Kutyavin et al., Nucleic Acid Res. 34: e128 (2006)))과 같은, SNP 및/또는 마이크로새틀라이트 마커의 존재에 대한 유전형분석을 위한 표준 기법이 이용될 수 있다. SNP 유전형분석을 위해 이용할 수 있는 특정한 방법들은 TaqMan 유전형 분석법(genotyping assay) 및 SNPlex 플랫폼(Applied Biosystems), 겔 전기영동(Applied Biosystems), 질량 분석법(예를 들면, Sequenom의 MassARRAY 시스템), 미니-시퀀싱(mini-sequencing) 방법, 실시간 PCR, Bio-Plex 시스템(BioRad), CEQ and SNPstream 시스템(Beckman), 어레이 혼성화 기술(예를 들면, Affymetrix GeneChip), BeadArray Technologies(예를 들면, Illumina GoldenGate 및 Infinium 분석법), 어레이 택(array tag) 기술(예를 들면, Parallele) 및 엔도뉴크레아제-기반 형광 혼성화 기술(Invader; Third Wave)를 포함하나, 이에 한정되지 않는다. Affymetrix SPN Array 6.0 및 Illumina CNV370-Duo 및 1M BeadChips를 포함한 이용가능한 어레이 플랫폼 중 일부는 특정 CNV를 태깅하는 SNP를 포함한다. 이는 이 플랫폼에 포함된 대리(surrogate) SNP를 통한 CNV의 검출을 가능하게 한다. 따라서, 상기 방법들 또는 본 발명이 속하는 기술분야의 당업자에게 이용가능한 다른 방법에 의해, 마이크로새틀라이트, SNP 또는 다른 종류의 다형성 마커를 포함한, 다형성 마커에서의 하나 이상의 대립인자가 확인될 수 있다.
본 명세서에 기재된 특정한 방법에서, 유방암에 대한 증가된 감수성(즉, 증가된 위험도)을 갖는 개체는 유방암에 대해 증가된 감수성을 부여하는 하나 이상의 다형성 마커의 하나 이상의 대립인자 또는 일배체형(즉, 위험 마커 대립인자 또는 일배체형)이 확인된 개체이다. 일 양태에서, 상기 위험 마커 또는 일배체형은 유방암의 유의성 있는 증가된 위험도(또는 감수성)를 부여하는 마커 또는 일배체형이다. 일 구체예에서, 마커 또는 일배체형과 연관된 유의성은 상대적 위험도(relative risk, RR)에 의해 측정된다. 또 다른 구체예에서, 마커 또는 일배체형과 연관된 유의성은 오즈비(odds ratio, OR)에 의해 측정된다. 또 다른 구체예에서, 유의성은 백분율로 측정된다. 일 구체예에서, 유의성 있는 증가된 위험도는 1.11 이상, 1.12 이상, 1.13 이상, 1.14 이상, 1.15 이상, 1.16 이상, 1.17 이상, 1.18 이상, 1.19 이상, 1.20 이상, 1.21 이상, 1.22 이상, 1.23 이상, 1.24 이상, 1.25 이상, 1.30 이상, 1.35 이상, 1.40 이상, 1.50 이상, 1.60 이상, 1.70 이상, 1.80 이상, 1.90 이상, 2.0 이상, 2.5 이상, 3.0 이상, 4.0 이상, 및 5.0 이상을 포함하나, 이에 한정되지 않는, 1.10 이상의 위험도(상대적 위험도 및/또는 오즈비)로 측정된다. 특정한 구체예에서, 1.15 이상의 위험도(상대적 위험도 및/또는 오즈비)는 유의성이 있다. 또 다른 특정한 구체예에서, 1.17 이상의 위험도는 유의성이 있다. 또 다른 구체예에서, 1.20 이상의 위험도는 유의성이 있다. 또 다른 구체예에서, 약 1.25 이상의 위험도는 유의성이 있다. 또 다른 추가적인 구체예에서, 약 1.30 이상의 위험도는 유의성이 있다. 그러나, 다른 컷오프, 예를 들면, 1.16, 1.18, 1.19, 1.21, 1.22 이상 등이 고려되며, 그와 같은 컷오프도 또한 본 발명의 범위 내에 속한다. 다른 구체예에서, 위험도의 유의성 있는 증가는 약 15%, 약 20%, 약 25%, 약 30%, 약 35%, 약 40%, 약 45%, 약 50%, 약 55%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 95%, 및 약 100%를 포함하나, 이에 한정되지 않는, 약 10% 이상이다. 하나의 특정한 구체예에서, 위험도의 유의성 있는 증가는 15% 이상 이다. 다른 구체예에서, 위험도의 유의성 있는 증가는 17% 이상, 20% 이상, 22% 이상, 24% 이상, 25% 이상, 30% 이상, 32% 이상 및 35% 이상이다. 그러나, 본 발명이 속하는 기술 분야의 당업자에 의해 본 발명의 특징으로 적합한 것으로 간주되는 다른 컷오프 또는 범위도 고려되고, 그들도 본 발명의 범위 내에 속한다. 특정한 구체예에서, 위험도의 유의성 있는 증가는 0.05 미만, 0.01 미만, 1 x 10-3 (0.001) 미만, 1 x 10-4 (0.0001) 미만, 1 x 10-4 (0.00001) 미만, 1 x 10-5 (0.000001) 미만, 1 x 10-6 (0.0000001) 미만, 1 x 10-7 (0.00000001) 미만, 또는 1 x 10-8 (0.000000001) 미만의 p-값과 같은 p-값을 특징으로 한다..
본 발명의 위험 다형성 마커 또는 일배체형은 하나 이상의 마커의 하나 이상의 대립인자 또는 일배체형이 비교군(대조군)에서의 존재의 빈도 대비 질병이나 성향에 대한 위험도를 갖는 개체(질병군(affected))에 보다 빈번하게 존재하고, 상기 마커 또는 일배체형의 존재가 상기 질병 또는 성향(예를 들면, 유방암)에 대한 감수성을 나타내는 것인 마커 또는 일배체형이다. 일 구체예에서, 대조군은 집단 표본(population sample), 즉, 일반적인 집단으로부터의 랜덤 표본일 수 있다. 또 다른 구체예에서, 대조군은 질병에 걸리지 않은 개인, 예를 들면, 유방암으로 진단되지 않은 개인의 군으로 대표된다. 일 구체예에서, 그와 같은, 질병-불포함(disease-free) 대조군은 하나 이상의 특정한 질병-연관 증상의 부재를 특징으로 할 수 있다. 또 다른 구체예에서, 상기 질병-불포함 대조군은 하나 이상의 질병-특이적 위험 인자의 부재를 특징으로 한다. 일 구체예에서, 그와 같은 위험 인자는 하나 이상의 환경적 위험 인자이다. 대표적인 환경적 인자들은 특정한 질병 또는 성향을 발현할 위험도에 영향을 미치는 것으로 알려지거나, 상기 위험도에 영향을 미치는 것으로 고려되는 천연 산물, 미네랄, 또는 기타 화학물질이다. 기타 환경적 위험 인자들은 식음습관(food and drink habit), 주요 거주지의 지리적 위치 및 직업적 위험 인자를 포함하나, 이에 한정되지 않는, 생활방식(lifestyle)과 관련된 위험 인자들이다. 또 다른 구체예에서, 위험 인자는 하나 이상의 유전적 위험 인자를 포함한다.
상관관계에 대한 간단한 검정의 예로서 2 x 2 표(two by two table) 상에서의 Fisher-exact 검정이 있다. 염색체의 코호트가 주어지면, 마커 및 일배체형을 모두 포함하는 염색체, 마커 또는 일배체형을 중 하나를 포함하고, 나머지 하나는 포함하지 않는 염색체 및 마커나 일배체형 중 어느 것도 포함하지 않는 염색체의 갯수로부터 2 x 2 표가 작성된다. 본 발명이 속하는 기술 분야의 당업자에게 공지된 연관의 다른 통계적 검정도 본 발명의 범위 내에 속한다.
본 발명의 다른 구체예에서, 질병 또는 성향에 대한 감소된 감수성(즉, 감소된 위험도)을 갖는 개체는 상기 질병 또는 성향에 대한 감소된 감수성을 부여하는 하나 이상의 다형성 마커의 하나 이상의 특정한 대립인자 또는 일배체형이 확인된 개체이다. 감소된 위험도를 부여하는 마커 대립인자 및/또는 일배체형은 또한 보호성(protective)인 것으로 표현된다. 일 양태에서, 보호성 마커 또는 일배체형은 질병 또는 성향의 유의성 있는 감소된 위험도(또는 감수성)를 부여하는 마커 또는 일배체형이다. 일 구체예에서, 유의성 있는 감소된 위험도는 0.85 미만, 0.80 미만, 0.75 미만, 0.7 미만, 0.6 미만, 0.5 미만, 0.4 미만, 0.3 미만, 0.2 미만 및 0.1 미만을 포함하나, 이에 한정되지 않는, 0.9 미만의 상대적 위험도로 측정된다. 하나의 특정한 구체예에서, 유의성 있는 감소된 위험도는 0.90 미만이다. 또 다른 구체예에서, 유의성 있는 감소된 위험도는 0.85 미만이다. 또 다른 구체예에서, 유의성 있는 감소된 위험도는 0.80 미만이다. 또 다른 구체예에서, 위험도(또는 감수성)의 감소는 15% 이상, 20% 이상, 25% 이상, 30% 이상, 35% 이상, 40% 이상, 45% 이상, 50% 이상, 55% 이상, 60% 이상, 65% 이상, 70% 이상, 80% 이상, 85% 이상, 90% 이상, 95% 이상 및 98% 이상을 포함하나, 이에 한정되지 않는, 10% 이상이다. 하나의 특정한 구체예에서, 위험도의 유의성 있는 감소는 약 15% 이상이다. 또 다른 구체예에서, 위험도의 유의성 있는 감소는 약 20% 이상이다. 또 다른 구체예에서, 위험도의 유의성 있는 감소는 약 25% 이상이다. 본 발명이 속하는 기술 분야의 당업자에 의해 본 발명의 특징으로 적합한 것으로 간주되는 다른 컷오프 또는 범위도 고려되고, 그들도 본 발명의 범위 내에 속한다.
본 발명이 속하는 기술 분야의 당업자는 연구된 집단에 존재하는 두개의 대립인자를 갖는 마커(예를 들면, SNP)에 대해, 하나의 대립인자가 상기 집단 내에서 성향 또는 질병을 갖는 개인의 그룹에서 대조군 대비 증가된 빈도로 발견되는 경우, 상기 마커의 나머지 다른 대립인자는 상기 성향 또는 질병을 갖는 개인의 그룹에서 대조군 대비 감소된 빈도로 발견될 것으로 이해할 것이다. 그와 같은 경우에, 상기 마커의 하나의 대립인자(상기 성향 또는 질병을 갖는 개인에서 증가된 빈도로 발견되는 대립인자)은 위험 대립인자(at-risk allele)이고, 나머지 다른 대립인자는 보호성 대립인자(protective allele)일 것이다.
질병 또는 성향(예를 들면, 유방암)과 연관된 유전적 변이가 단독으로 주어진 유전형에 대해 질병의 위험도를 예측하기 위해 이용될 수 있다. SNP와 같은 이대립인자 마커(biallelic marker)의 경우, 3개의 가능한 유전형이 있다: 위험 변이에 대한 동형접합체, 이형접합체(heterozygote), 및 상기 위험 변이의 비-보인자(non-carrier). 복수의 유전자 좌에서의 변이와 연관된 위험도가 전체 위험도를 추정하기 위해 이용될 수 있다. 복수 개의 SNP 변이에 대해, k( = 3 n x 2 p ) 개의 가능한 유전형이 있고; 상기에서 n은 상염색체 유전자좌(autosomal loci)의 갯수이고 p는 성염색체 유전자좌의 갯수이다. 전체 위험도 평가 계산은 통상적으로 상이한 유전적 변이의 상대적 위험도가 곱해진다는 것, 즉, 특정한 유전형 조합과 연관된 전체 위험도(예를 들면, RR 또는 OR)가 각 유전자좌의 유전자형에 대한 위험도 값의 곱이라는 것을 가정한다. 제시된 위험도가 일치된(matched) 성별 및 민족을 갖는 기준 집단 대비 개인, 또는 개인에 대한 특정한 유전형에 대한 상대적 위험도를 나타내는 경우, 통합 위험도(combined risk)는 유전자좌-특이적 위험도 값의 곱이고, 이는 또한 집단 대비 전체 위험도 추정치에 해당한다. 개인에 대한 위험도가 위험 대립인자의 비-보인자에 대한 비교에 근거하는 경우, 통합 위험도는 모든 유전자좌의 유전형의 주어진 조합을 갖는 인간을 상기 유전자좌들에서 위험 변이를 보유하지 않는 개인들의 군에 비교하는 추정치에 해당한다. 위험 변이의 비-보인자들의 그룹은 가장 낮은 추정된 위험도를 가지며 그 자체(즉, 비-보인자)와 비교하여 1.0의 통합 위험도를 가지나, 집단 대비, 1.0 미만의 전체 위험도를 갖는다. 비-보인자 그룹은 잠재적으로 매우 작을 수 있고, 특히, 다수의 유전자좌에 대해 매우 작을 수 있으며, 그 경우, 그의 관련성은 그만큼 작다는 것에 주목해야 한다.
승법 모델(multiplicative model)은 일반적으로 복합 성향(complex trait)의 데이터에 합리적으로 잘 맞는 간명(parsimonious) 모델이다. 승법성(multiplicity)으로부터의 편향은 일반적인 질환에 대한 일반적인 변이에서는 드물게 설명되었으며, 보고된 경우에도, 제안적인 것에 불과하며, 이는 유전자좌 간의 통계적 상호작용을 입증할 수 있기 위해서는 매우 큰 표본 크기가 통상적으로 요구되기 때문이다.
예로서, 전립선 암과 연관된 것으로 개시된 총 8개의 변이를 고려한다(Gudmundsson, J., et al., Nat Genet 39:631-7 (2007), Gudmundsson, J., et al., Nat Genet 39:977-83 (2007); Yeager, M., et al, Nat Genet 39:645-49 (2007), Amundadottir, L., el al., Nat Genet 38:652-8 (2006); Haiman, C.A., et al., Nat Genet 39:638-44 (2007)). 이 유전자좌들 중 7개는 상염색체 상에 있고, 나머지 유전자좌는 염색체 X 상에 있다. 이 때, 이론적인 유전형 조합의 총수는 37 x 21 = 4374이다. 그 유전형 분류(genotypic class) 중 일부는 매우 드무나, 여전히 가능하고, 전체 위험도 평가를 위해 고려되어야 한다. 복수 개의 유전적 변이의 경우에 적용된 승법 모델은 상기 유전적 변이가 "환경적(environmental)" 인자와 명확하게 상관되지 않는다는 것을 가정할 때 비-유전적 위험 변이와의 결합(conjugation)에서 유효할 것으로 보인다. 다시 말하면, 비-유전적 위험 인자와 유전적 위험 인자가 상호작용하지 않는다는 것을 가정할 때, 유전적 변이와 비-유전적 변이는 통합 위험도를 추정하기 위해 승법 모델 하에 평가될 수 있다.
동일한 정량적 접근방법을 이용하여, 유방암과 연관된 복수 개의 변이와 관련된 통합 위험도 또는 전체 위험도가 평가될 수 있다.
연관 불균형(Linkage Disequilibrium)
각 감수분열 사건 동안 각 염색체 쌍에 대해 평균 1회 일어나는, 재조합의 자연적인 현상은 자연이 서열(및 결과적으로 생물학적 기능)에 변화를 제공하는 한가지 방법이다. 재조합은 게놈에서 랜덤하게 일어나지 않는 것으로 발견되었다; 오히려, 재조합율의 빈도에 큰 변화가 있어서, 높은 재조합 빈도를 갖는 작은 영역(따라서, 재조합 핫스팟(recombination hotspot)으로 불림) 및 일반적으로 연관 불균형(LD) 블럭이라 불리는, 낮은 재조합 빈도의 보다 넓은 영역을 생성한다(Myers, S. et al., Biochem Soc Trans 34:526-530 (2006); Jeffreys, A.J., et al.,Nature Genet 29:217-222 (2001); May, C.A., et al., Nature Genet 31:272-275(2002)).
연관 불균형(Linkage Disequilibrium, LD)은 두 개의 유전적 요소의 비-랜덤 조합(non-random assortment)을 의미한다. 예를 들면, 특정한 유전적 요소(예를 들면, 다형성 마커의 대립인자(allele), 또는 일배체형)가 0.50(50%)의 빈도로 집단에서 일어나고, 또 다른 요소가 0.50(50%)의 빈도로 일어나는 경우, 두 요소를 모두 갖는 개인의 예상되는 발생율은 상기 요소들의 랜덤 분포를 가정하면, 0.25(25%)이다. 그러나, 상기 두 요소들이 0.125보다 더 높은 빈도로 함께 나타나는 것으로 발견되는 경우, 상기 요소들은 연관 불균형에 있다고 하며, 이는 그들이 그들의 독립적인 대립인자 빈도가 예측하는 비율보다 더 높은 비율로 함께 유전되는 경향이 있기 때문이다. 개략적으로, LD는 일반적으로 두 요소간의 재조합 사건의 빈도와 상관관계를 갖는다. 집단에서 대립인자 또는 일배체형 빈도는 집단 내의 개체의 유전형을 분석하고 상기 집단에서 각 대립인자 또는 일배체형의 발생 빈도를 결정하는 것에 의해 결정될 수 있다. 이배체(diploid)의 집단, 예를 들면, 인간 집단의 경우, 개인들은 일반적으로 각 유전적 요소(예를 들면, 마커, 일배체형 또는 유전자)에 대해 두 개의 대립인자 또는 대립인자 조합을 가질 것이다.
다수의 상이한 척도들이 연관 불균형(LD; Develin, B & Risch, N., Genomics 29:311-22(1995)))의 강도를 평가하기 위해 제안되었다. 대부분은 이대립인자(biallelic) 부위의 쌍 간의 연관의 강도를 획득한다. LD의 두 개의 중요한 쌍대 척도(pairwise measures)는 r2 (△2으로 표시되기도 함) 및 |D'|이다(Lewontin, R., Genetics 49: 49-67 (1964); Hill, W.G. & Robertson, A. Thor. Appl. Genet. 22:226-231(1968)). 두 척도는 모두 0(불균형 없음) 내지 1('완전한' 불균형)의 범위이나, 그들의 해석은 약간 다르다. |D'|는 가능한 일배체형 중 2개 또는 3개만 존재하는 경우, 그 값이 1이고, 모든 4개의 가능한 일배체형이 존재하는 경우는 그 값이 1보다 작은 것으로 정의된다. 따라서, 1보다 작은 |D'|의 값은 두 부위 간에 과거에 재조합이 일어났을 수도 있다는 것을 나타낸다(재발성 돌연변이(recurrent mutation)는 |D'|가 1보다 작게할 수 있으나, 단일 뉴클레오티드 다형성(SNP)의 경우, 이는 통상적으로 재조합보다 가능성이 낮은 것으로 간주됨). 척도 r2는 두 부위간의 통계적 상관성을 나타내고, 두 개의 일배체형만 존재하는 경우 1의 값을 취한다.
r2와, 감수성 유전자 좌와 SNP 간의 연관성을 검출하기 위해 요구되는 표본 크기 간에 단순한 반비례 관계(inverse relationship)가 있기 때문에, r2 측정값은 이론의 여지는 있지만 연관 맵핑(association mapping)에 대한 가장 적합한 척도이다. 이 척도는 부위의 쌍에 대해 정의되나, 일부 적용의 경우, 다수의 다형성 부위를 포함하는 전체 영역에서 LD가 얼마나 강한지를 결정하는 것이 바람직할 수 있다(예를 들면, LD의 강도가 유전자 좌들 간에 또는 집단 전체에 있어서 유의성 있게 상이한지 여부, 또는 하나의 영역에서 특정한 모델 하에서 예측된 것보다 더 크거나 또는 더 작은 LD가 존재하는지 여부). 한 영역에 대해 LD를 측정하는 것은 간단하지 않으나, 하나의 방법은 집단 유전학에서 개발된, 척도 r을 이용하는 것이다. 개략적으로 말하면, r은 데이터에서 확인되는 LD를 생성하기 위해, 특정한 집단 모델 하에서 어느 정도의 재조합이 요구되는지를 측정한다. 이 종류의 방법은 또한 잠재적으로 LD 데이터가 재조합 핫스팟의 존재에 대한 증거를 제공하는지 여부를 결정하는 문제에 대한 통계적으로 엄격한 방식을 제공할 수 있다. 본 명세서에 기재된 방법의 경우, 유전적 세그먼트(예를 들면, SNP) 간의 유의성 있는 r2 값은 0.1 이상, 예를 들면, 0.1 이상, 0.15 이상, 0.2 이상, 0.25 이상, 0.3 이상, 0.35 이상, 0.4 이상, 0.45 이상, 0.5 이상, 0.55 이상, 0.6 이상, 0.65 이상, 0.7 이상, 0.75 이상, 0.8 이상, 0.85 이상, 0.9 이상, 0.91 이상, 0.92 이상, 0.93 이상, 0.94 이상, 0.95 이상, 0.96 이상, 0.97 이상, 0.98 이상, 0.99 이상 또는 1.0 이상일 수 있다. 하나의 바람직한 구체예에서, 유의성 있는 r2 값은 0.2 이상일 수 있다. 대안적으로, 본 명세서에 기재된 연관 불균형은 0.3 이상, 0.4 이상, 0.5 이상, 0.6 이상, 0.7 이상, 0.8 이상, 0.85 이상, 0.9 이상, 0.95 이상, 0.96 이상, 0.97 이상, 0.98 이상, 0.99 이상과 같은, 0.2 이상의 |D'| 값을 특징으로 하는 연관 불균형을 의미한다. 따라서, 연관 불균형은 별개의 마커들의 대립인자 간의 상관관계를 나타낸다. 연관 불균형은 상관 계수(correlation coefficient) 또는 |D'| (1.0 이하의 r2 및 1.0 이하의 |D'|)에 의해 측정된다. 연관 불균형은 본 명세서에서 정의된 바와 같이, 하나의 인간 집단에서 결정될 수 있거나, 또는 하나보다 많은 인간 집단으로부터의 개인들을 포함하는 표본의 집합(colleciton)에서 결정될 수 있다. 본 발명의 일 구체예에서, LD는 정의된 바와 같은(http://www.hapmap.org), 하나 이상의 HapMap 집단(코카서스인, 아프리카인, 일본인, 중국인)으로부터의 표본에서 결정된다. 하나의 그와 같은 구체예에서, LD는 HapMap 표본의 CEU 집단에서 결정된다. 또 다른 구체예에서, LD는 YRI 집단에서 결정된다. 또 다른 구체예에서, LD는 유럽 집단에서 결정된다. 또 다른 구체예에서, LD는 아이슬란드 집단에서 결정된다.
게놈의 모든 다형성이 집단 수준에서 동일하다면, 모든 단일 다형성이 연관(association) 연구에서 조사되어야 할 것이다. 그러나, 다형성 간의 연관 불균형 때문에, 긴밀하게 연관된 다형성들이 강한 상관관계를 가지며, 이는 유의성 있는 연관을 관찰하기 위해 연관 연구에서 조사되어야 하는 다형성의 갯수를 감소시킨다. LD의 또 다른 결과는 이 다형성들이 강한 상관관계를 갖는다는 사실 때문에, 다수의 다형성들이 연관 신호(association signal)를 생성할 수 있다는 것이다.
게놈 LD 맵이 게놈 전체에 대해 생성되었고, 그와 같은 LD 맵이 질병-유전자를 맵핑하기 위한 프레임워크로 작용할 것으로 제안되었다(Risch, N. & Merkiangas, K, Science 273:1516-1517 (1996); Maniatis, N., et al., Proc Natl Acad Sci USA 99:2228-2233 (2002); Reich, DE et al, Nature 411:199-204 (2001)).
현재, 인간 게놈의 많은 부분들이 수개의 공통된 일배체형을 포함하는 일련의 별개의 일배체형 블럭들로 분류될 수 있다는 것이 확립되었다; 이 블럭들의 경우, 연관 불균형 데이터는 재조합을 나타내는 증거를 거의 제공하지 않는다(예를 들면, Wall., J.D. and Pritchard, J.K., Nature Reviews Genetics 4:587-597 (2003); Daly, M. et al., Nature Genet. 29:229-232 (2001); Gabriel, S.B. et al., Science 296:2225-2229 (2002); Patil, N. et al., Science 294:1719-1723 (2001); Dawson, E. et al., Nature 418:544-548 (2002); Phillips, M.S. et al., Nature Genet. 33:382-387 (2003) 참조).
이와 같은 일배체형 블럭을 정의하는 두 가지 주요한 방법들이 있다: 블럭은 한정된 일배체형 다양성을 갖는 DNA의 영역(예를 들면, Daly, M. et al., Nature Genet. 29:229-232 (2001); Patil, N. et al., Science 294:1719-1723 (2001); Dawson, E. et al., Nature 418:544-548 (2002); Zhang, K. et al., Proc. Natl. Acad. Sci. USA 99:7335-7339 (2002) 참조), 또는, 연관 불균형을 이용하여 확인된, 광범위한 과거의 재조합(extensive historical recombination)을 갖는 이행 구역(transition zone) 간의 영역(예를 들면, Gabriel, S.B. et al., Science 296:2225-2229 (2002); Phillips, M.S. et al., Nature Genet. 33:382-387 (2003); Wang, N. et al., Am. J. Hum. Genet. 71:1227-1234 (2002); Stumpf, M.P., and Goldstein, D.B., Curr. Biol. 13:1-8 (2003) 참조)으로 정의될 수 있다. 보다 최근에, 인간 게놈 전체에 대한 재조합률(recombination rate) 및 상응하는 핫스팟의 상세 맵(fine-scale map)이 작성되었다(Myers, S., et al., Science 310:321-32324 (2005); Myers, S. et al., Biochem Soc Trans 34:526530 (2006)). 상기 맵은 게놈 전체에서 재조합의 엄청난 변이를 보여주며, 재조합률은 핫스팟에서 10-60 cM/Mb로 높았고, 개재 영역(intervening region)에서는 재조합률이 0에 가까워서, 제한적인 일배체형 다양성 및 높은 LD의 영역을 나타낸다. 따라서, 상기 맵은 일배체형 블럭 및/또는 LD 블럭을 재조합 핫스팟에 의해 둘러싸인(flanked) 영역으로 정의하기 위해 이용될 수 있다. 본 명세서에서 사용된, 용어 "일배체형 블럭(haplotype block)" 또는 "LD 블럭"은 전술된 특징들에 의해 정의되는 블럭, 또는 그와 같은 영역을 정의하기 위해 본 발명이 속하는 기술 분야의 당업자에 의해 이용되는 다른 대안적인 방법에 의해 정의되는 블럭을 포함한다.
따라서, 게놈에서 다형성 마커에 대한 관찰된 연관에 대해, 게놈 내의 추가적인 마커들이 또한 연관을 보일 수 있다는 것이 명백하다. 이는 재조합률의 큰 변이에서 관찰된 바와 같이, 게놈 전체에서 LD의 불균등한 분포의 당연한 결과이다. 따라서, 연관을 검출하기 위해 이용되는 마커들은 주어진 질병 또는 성향과 연관된 게놈 영역(즉, 일배체형 블럭 또는 LD 블럭)에 대한 "택(tag)"을 나타낸다. 하나 이상의 원인이 되는(causative)(기능성) 변이 또는 돌연변이가 상기 질병 또는 성향과 연관된 것으로 확인되는 영역 내에 존재할 수 있다. 기능성 변이는 또 다른 SNP, 연쇄 반복체 다형성(tandem repeat polymorphism)(예를 들면, 미니새틀라이트 또는 마이크로새틀라이트), 전이성 요소(transposable element), 역전, 결실 또는 삽입과 같은 카피수 변화일 수 있다. 그와 같은 변이는 연관을 검출하기 위해 이용되는 태깅 마커에 대해 관찰되는 것보다 더 높은 상대적 위험도(RR) 또는 오즈비(OR)를 부여할 수 있다. 따라서, 본 발명은 본 명세서에 기재된 바와 같이, 질병과의 연관을 검출하기 위해 이용되는 마커, 및 상기 마커와 연관 불균형인 마커를 포함한다. 따라서, 본 발명의 특정한 구체예에서, 본 명세서에 기재된 바와 같은, 본 발명의 마커 및/또는 일배체형과 LD인 마커가 대리 마커(surrogate marker)로 이용될 수 있다. 일 구체예에서, 대리 마커는 본 명세서에 기재된 바와 같이, 초기에 상기 질병과 연관된 것으로 확인된 마커 또는 일배체형의 경우보다 더 작은 상대적 위험도(RR) 및/또는 오즈비(OR)을 갖는다. 다른 구체예에서, 대리 마커는 본 명세서에 기재된 바와 같이, 상기 질환과 연관된 것으로 초기에 확인된 마커에 대해 초기에 결정된 RR 또는 OR 값보다 큰 RR 또는 OR 값을 갖는다. 그와 같은 구체예의 예는 본 명세서에 기재된 변이와 같은, 상기 질병과 연관되는 것으로 초기에 확인된 보다 더 일반적인 변이(> 10% 집단 빈도)와 LD인 드물거나, 또는 비교적 드문(< 10% 대립인자의 집단 빈도) 변이일 것이다. 본 명세서에 기재된 바와 같이, 본 발명자들에 의해 발견된 연관을 검출하기 위해 그와 같은 마커들을 식별하고 이용하는 것은 본 발명이 속하는 기술 분야의 당업자에게 잘 알려진 통상적인 방법에 의해 수행될 수 있고, 따라서, 본 발명의 범위에 속한다.
일배체형 빈도의 결정
기대값-극대화 알고리즘(expectation-maximization algorithm)을 이용하여 환자군 및 대조군에서 일배체형의 빈도를 추정할 수 있다(Dempster A. et al., J. R. Stat. Soc. B, 39:1-38 (1977)). 결실된 유전형 및 그 상태(phase)에 따른 불확실성을 처리할 수 있는 이 알고리즘의 구현이 이용될 수 있다. 귀무 가설(null hypothesis) 하에서, 환자와 대조군은 동일한 빈도를 갖는 것으로 가정된다. 가능성 방식(likelihood approach)을 이용하여, 본 명세서에 기재된 마커들을 포함할 수 있는, 후보 위험-일배체형이 대조군에서보다 환자에서 보다 높은 빈도를 가지며, 다른 일배체형의 빈도는 양 군에서 동일한 것으로 가정되는 것인 대립 가설(alternate hypothesis)이 테스트된다. 양 가설 하에 가능성이 각각 극대화되고, 상응하는 1-df 가능성 비 통계값이 통계적 유의성을 평가하기 위해 이용된다.
감수성 영역, 예를 들면, LD 블럭 영역 내에서 위험 마커와 일배체형 및 보호성 마커와 일배체형을 찾기 위해, 유전형 분석된 마커들의 모든 가능한 조합의 연관이 연구된다. 통합된 환자군과 대조군이 원래의 환자군 및 대조군과 동일한 크기인 두개의 세트로 무작위로 분류될 수 있다. 그 후, 마커 및 일배체형 분석이 반복되고, 기록된 가장 유의성 있는 p-값이 결정된다. 이 랜덤화 체계(randomization scheme)는 p-값의 경험적 분포를 구성하기 위해 예를 들면, 100회 이상 반복될 수 있다. 바람직한 구체예에서, 0.05 미만의 p-값은 유의성 있는 마커 및/또는 일배체형 연관을 나타낸다.
일배체형 분석
일배체형 분석의 일반적인 방법은 NEsted MOdels에 적용된 가능성-기반 추론(likelihood-based inference)을 이용하는 단계를 포함한다(Gretarsdottir S., et al., Nat. Genet. 35:131-38 (2003)). 상기 방법은 다수의 다형성 마커, SNP 및 마이크로새틀라이트에 대해 이용될 수 있는 프로그램 NEMO에서 구현된다. 상기 방법 및 소프트웨어는 특별히, 상이한 위험도를 부여하는 일배체형 그룹을 식별하는 것을 목적으로 하는 케이스-대조군(case-control) 연구를 위해 설계된다. 상기 방법 및 소프트웨어는 또한 LD 구조를 연구하기 위한 도구이다. NEMO에서, 관찰된 데이터가 이를 결실-데이터(missing-data) 문제로 처리하기 때문에, EM 알고리즘을 이용하여, 최대 가능성 추정치, 가능성 비(likelihood ratio) 및 p-값이 직접 계산된다.
상태(phase)의 불확실성 및 결실된 유전형에 따른 정보 소실을 반영한, 관찰된 데이터에 대해 직접 계산된 가능성에 기반한 가능성 비 테스트가 유효한 p-값을 제공하기 위해 이용될 수 있으나, 정보의 불완전성 때문에 소실된 데이터의 양을 아는 것이 여전히 유용할 것이다. 일배체형 분석의 정보 척도(information measure)는 Nicolae and Kong (Technical Report 537, Department of Statistics, University of Statistics, University of Chicago; Biometrics, 60(2):368-75 (2004))에서 연관성 분석(linkage analysis)를 위해 정의된 정보 척도의 당연한 연장(natural extension)으로 설명되며, NEMO에서 구현된다.
질병에 대한 단일 마커 연관을 위해, 각각의 개별적인 대립인자에 대해 양측 p-값(two-sided p-value)을 계산하기 위해 Fisher exact 테스트가 이용될 수 있다. 통상적으로, 모든 p-값은 특별히 표시되지 않으면, 다중 비교(multiple comparison)에 대해 조정되지 않은 상태로 제시된다. (마이크로새틀라이트, SNP 및 일배체형에 대해) 제시된 빈도는 보인자 빈도(carrier frequency)와 대립되는, 대립인자 빈도(allelic frequency)이다. 가족으로 동원된 환자들의 혈연관계(relatedness)에 따른 편향을 최소화하기 위해, 환자 목록에서 1촌 및 2촌(first and second-degree) 친척들이 제외될 수 있다. 또한, 혈연관계(sibship)에 대해 이전에 개시된(Risch, N. & Teng, J. Genome Res., 8:1273-1288 (1998))에 기재된 분산 조정 절차(variance adjustment procedure)를 확대하여 일반적인 가족 관계(familial relationship)에 적용될 수 있도록, 상기 테스트가 환자들 간의 잔여 혈연관계(remaining relateteness)에 대해 보정하기 위해 연관에 대해 반복될 수 있고, 비교를 위해 조정된 p-값 및 조정되지 않은 p-값을 제시할 수 있다. 게놈 대조 방법(Devlin, B. & Roeder, K. Biometrics 55:997 (1999))이 또한 개체들의 혈연관계 및 가능한 계층화에 대해 조정하기 위해 이용될 수 있다. 차이는 예상되는 바와 같이 일반적으로 매우 작다. 복수 회의 테스트에 대해 보정된 단일-마커 연관성의 유의성을 평가하기 위해, 본 발명자들은 동일한 유전형 데이터를 이용하여 랜덤화 테스트를 수행할 수 있다. 환자와 대조구의 코호트가 랜덤화되고 연관 분석이 복수 회(예를 들면, 500,000회 이하) 재수행되며, 그 p-값은 본 발명자들이 본래의 환자 및 대조구 코호트를 이용하여 관찰한 p-값과 동일하거나 그보다 더 낮은, 일부 대립인자에 대한 p-값을 생성하는 재현의 일부(fraction of replications)이다.
단일 마커 분석 및 일배체형 분석에 대해, 승법 모델(multiplicative model)(일배체형 상대적 위험도 모델), 즉, 한 사람이 갖는 두 개의 대립인자/일배체형의 위험도들이 곱해진다는 승법 모델을 가정하여 상대적 위험도(RR) 및 집단 귀속 위험도(population attributable risk, PAR)가 계산될 수 있다(Terwilliger, J.D. & Ott, J., Hum. Hered. 42:337-46 (1992) and Falk, C.T. & Rubinstein, P, Ann. Hum. Genet. 51 (Pt 3):227-33 (1987)). 예를 들면, RR이 a 대비 A의 위험도라면, 동형접합체 AA를 갖는 사람의 위험도는 이형접합체 Aa의 위험도의 RR배이고, 동형접합체 aa를 갖는 사람의 RR2배일 것이다. 승법 모델은 분석 및 계산을 단순화하는 유용한 특성을 갖는다- 환자 집단(affected population) 및 대조구 집단 내에서 일배체형은 독립적이고, 즉, 하디-와인버그 평형(Hardy-Weinberg equilibrium)에 있다. 그 결과, 환자(affected)와 대조군 각각의 일배체형 계수(haplotype count)는 다항 분포를 가지나, 대립 가설 하에서 상이한 일배체형 빈도를 갖는 다항 분포를 갖는다. 구체적으로, 두개의 일배체형, h i h j 에 대해, risk(h i )/risk(h j ) = (f i /p i )/(f j /p j )이고, 상기에서 fp는 각각 환자 집단 및 대조구 집단에서의 빈도를 나타낸다. 실제 모델이 승법성이 아닌 경우, 일부 검정력 손실(power loss)이 있으나, 이 손실은 극단적인 경우를 제외하고는 작은(mild) 경향이 있다. 가장 중요한 것은, p-값은 귀무 가설 하에 계산되기 때문에, 항상 유효하다는 것이다.
하나의 연관 연구에서 검출된 연관 신호가 이상적으로는 동일하거나 또는 상이한 민족의 상이한 집단(예를 들면, 동일 국가의 다른 지역, 또는 다른 국가)으로부터 유래된 제2 코호트에서 재현될 수 있다. 재현 연구(replication study)의 장점은 재현 연구에서 수행되는 테스트의 횟수 및 이에 따라 적용되는 덜 엄격한 통계적 척도이다. 예를 들면, 300,000개의 SNP를 이용한, 특정 질병 또는 성향에 대한 감수성 변이의 게놈-전체 검색을 위해, 수행된 300,000회의 테스트(각 SNP당 1회)에 대한 보정(correction)이 수행될 수 있다. 통상적으로 이용되는 어레이 상의 다수의 SNP가 상관되기(즉, LD 관계) 때문에, 그들은 독립적이지 않다. 따라서, 보정은 보수적이다. 그럼에도 불구하고, 이 보정 인자를 적용하는 것은 신호가 단일 연구 코호트로부터의 결과에 대해 이 보수적 테스트를 적용하는 것이 유의성이 있는 것으로 간주되기 위해서는 0.05/300,000 = 1.7 x 10-7 미만의 관찰된 P-값을 요구한다. 분명히, 이 보수적 역치(threshold) 미만의 P-값을 갖는 게놈-전체 연구에서 확인된 신호는 진정한 유전적 효과의 척도이며, 추가적인 코호트에서의 재현이 통계학적 관점에서 반드시 요구되는 것은 아니다. 그러나, 보정 인자가 수행된 통계적 검정의 갯수에 의존적이기 때문에, 초기 연구로부터의 하나의 신호(하나의 SNP)가 제2 케이스-대조군 코호트에서 재현되는 경우, 유의성에 대한 적합한 통계적 검정은 단일 통계적 검정에 대해, 0.05 미만의 P-값을 갖는 것이다. 하나 또는 여러 개의 추가적인 케이스-대조군 코호트에서의 재현 연구는 추가적인 집단에서 연관 신호의 평가를 제공하여, 동시에 최초 발견을 확인하고 일반적인 인간 집단에서 테스트되고 있는 유전적 변이(들)의 전체 유의성의 평가를 제공하는 추가적인 장점을 갖는다.
여러 케이스-대조군 코호트로부터의 결과는 또한 기저 효과(underlying effect)의 전체 평가를 제공하기 위해 통합될 수 있다. 복수 개의 유전적 연관 연구로부터의 결과를 통합하기 위해 통상적으로 이용되는 방법은 Mantel-Haenszel 모델이다(Mantel and Haenszel, J Natl Cancer Inst 22:719-48 (1959)). 상기 모델은 각각 유전적 변이의 상이한 집단 빈도를 갖는, 상이한 집단으로부터의 연관 결과가 통합되는 상황을 다루기 위해 설계되었다. 상기 모델은 OR 또는 RR에 의해 측정된, 질병의 위험도에 대한 변이의 효과가 모든 집단에서 동일하고, 변이의 빈도는 집단간에 상이할 수 있다는 것을 가정하여 결과를 통합한다. 여러 개의 집단으로부터의 결과를 통합하는 것은 통합된 코호트에 의해 제공되는 증가된 통계적 검정력 때문에, 실제의 기저 연관 신호를 검출하기 위한 전체 검정력(power)이 증가된다는 추가적인 장점을 갖는다. 또한, 다수의 코호트로부터의 결과가 통합되는 경우, 예를 들면, 케이스와 대조군 간의 비균등한 조화(mataching) 또는 집단 계층화(population stratification)에 따른, 개별적인 연구의 결함이 균형잡히는 경향이 있어서, 진정한 기저 유전적 효과의 보다 우수한 추정을 제공할 것이다.
위험도 평가 및 진단
주어진 집단 내에서, 사람이 특정된 기간 동안 특정한 질병 또는 성향을 발생시킬 가능성으로 정의된, 질병 또는 성향을 발생시킬 절대 위험도(absolute risk)가 있다. 예를 들면, 여성의 유방암에 대한 평생 절대 위험도(lifetime absolute risk)는 1/9이다. 즉, 9명의 여성 당 1명은 그들의 일생 중 어느 시점에 유방암을 발병할 것이다. 위험도(risk)는 통상적으로 특정인이 아니라, 매우 많은 수의 사람들을 조사하는 것에 의해 측정된다. 위험도는 종종 절대적 위험도(Absolute Risk, AR) 및 상대적 위험도(Relative Risk, RR)로 제시된다. 상대적 위험도는 두개의 변이와 연관된 위험도, 또는 두개의 상이한 사람들의 그룹의 위험도를 비교하기 위해 이용된다. 예를 들면, 상대적 위험도는 특정한 유전형을 갖는 사람들의 그룹과 다른 유전형을 갖는 또 다른 그룹을 비교하기 위해 이용될 수 있다. 질병에 대해, 2의 상대적 위험도는 하나의 그룹이 나머지 그룹보다 질병을 발병할 가능성이 두배 높다는 것을 의미한다. 제시된 위험도는 일치된 성별 및 민족의 집단 대비, 1인, 또는 1인의 특정한 유전형에 대한 상대적 위험도이다. 동일한 성별 및 민족의 2인의 위험도는 단순한 방식으로 비교될 수 있다. 예를 들면, 집단 대비, 제1 개체는 1.5의 상대적 위험도를 가지며, 제2 개체는 0.5의 상대적 위험도를 갖는 경우, 제2 개체 대비 제1 개체의 위험도는 1.5/0.5 = 3이다.
본 명세서에 기재된 바와 같이, 특정한 다형성 마커 및 그와 같은 마커를 포함하는 일배체형이 유방암의 위험도 평가를 위해 유용한 것으로 확인되었다. 위험도 평가는 유방암에 대한 감수성을 진단하기 위한 마커의 이용을 포함할 수 있다. 다형성 마커의 특정한 대립인자는 유방암의 진단을 갖지 않는 개체들에서보다, 유방암의 진단을 갖는 개체들에서 보다 빈번하게 발견된다. 그러므로, 이 마커 대립인자들은 개체에서 유방암, 또는 유방암에 대한 감수성을 검출하기 위한 예측적 가치(predictive value)를 갖는다. 본 발명의 마커와 같은, 위험 마커들을 포함하는 일배체형 블럭 또는 LD 블럭 내의 태깅 마커들(tagging markers)이 일배체형 블럭 또는 LD 블럭 내의 다른 마커 및/또는 일배체형에 대한 대리물(surrogate)로 이용될 수 있다. 1의 r 2 값을 갖는 마커들이 위험 변이(at-risk variant)에 대한 완벽한 대리물이고, 즉, 하나의 마커에 대한 유전형이 나머지 마커에 대한 유전형을 완벽하게 예측한다. 1보다 작은 r 2 값을 갖는 마커들도 위험 변이의 대리물일 수 있거나, 또는 대안적으로 그 위험 변이만큼 높거나 또는 그 변이보다 훨씬 더 높은 상대적 위험도 값을 갖는 변이를 나타낸다. 확인된 위험 변이는 그 자체로 기능적 변이가 아닐 수 있으나, 이 경우, 진정한 기능적 변이와 연관 불균형 관계일 수 있다. 기능적 변이는 에를 들면, 미니새틀라이트(minisatellite), 또는 마이크로새틀라이트(microsatellite)와 같은 연쇄 반복(tandem repeat), 전위 요소(transposable element)(예를 들면, Alu 요소), 또는 결실, 삽입 또는 역전(때때로 카피수 변위(copy number variation), 또는 CNV로도 지칭됨)과 같은 구조적 변형일 수 있다. 본 발명은 본 명세서에 개시된 마커에 대한 그와 같은 대리 마커(surrogate marker)의 평가를 포함한다. 그와 같은 마커들이 본 발명이 속하는 기술 분야의 당업자에게 잘 알려진 바와 같이, 공개 데이터베이스에 설명(annotate)되고, 맵핑되고, 열거되어 있거나, 또는 대안적으로 개체들의 군에서 본 발명의 마커에 의해 확인된 영역 또는 그 영역의 일부를 서열결정하고, 결과적으로 수득된 서열의 군에서 다형성을 식별하는 것에 의해 용이하게 식별될 수 있다. 그 결과, 본 발명이 속하는 기술 분야의 당업자는 용이하게, 과도한 실험 없이 본 명세서에 기재된 마커 및/또는 일배체형과 연관 불균형인 대리 마커들의 유전형을 분석할 수 있다. 검출된 위험 변이와 LD인 태깅 마커 또는 대리 마커도 개인에서 유방암, 또는 유방암에 대한 감수성에 대한 연관을 검출하기 위한 예측적 가치를 갖는다. 본 발명의 마커들과 LD인 이 태깅 마커들 또는 대리 마커들은 또한 이들이 유사하게 유방암에 대한 감수성을 검출하기 위한 예측적 가치를 갖기 때문에, 일배체형들을 구별하는 다른 마커들을 포함할 수 있다.
특정 구체예에서, 본 발명은 유방암과 연관된 것으로 본 명세서에 기재된 변이의 존재에 대해 개인으로부터 유래된 게놈 DNA를 포함하는 시료를 평가하는 것에 의해 실시될 수 있다. 그와 같은 평가는 당업자에게 잘 알려지고 본 명세서에서 더 설명될 방법을 이용하여, 하나 이상의 다형성 마커의 하나 이상의 대립인자의 존재 또는 부재를 검출하는 단계를 포함하고, 그와 같은 평가의 결과에 근거하여 시료가 유래된 개인이 유방암의 증가된 위험도 또는 감소된 위험도(증가된 감수성 또는 감소된 감수성)를 갖는지 여부를 결정한다. 대안적으로, 본 발명은 유방암과 연관된 것으로 본 명세서에 기재된 하나 이상의 다형성 마커(또는 유방암과 연관된 것으로 본 명세서에서 입증된 하나 이상의 마커와 연관 불균형인 마커)의 유전형 상태에 대한 정보를 포함하는 데이터세트를 이용하여 실시될 수 있다. 다시 말하면, 그와 같은 유전적 상태에 대한 정보, 예를 들면, 특정한 다형성 마커, 또는 복수 개의 마커에서의 유전형 계수(genotype count)의 형태(예를 들면, 특정한 위험 대립인자의 존재 또는 부재의 표시), 또는 하나 이상의 마커에 대한 실제의 유전형의 형태로 유전적 상태에 대한 정보를 포함하는 데이터세트가 유방암과 연관된 것으로 본 발명자들에 의해 입증된 특정한 다형성 마커의 특정한 위험 대립인자의 존재 또는 부재를 위해 조사될 수 있다. 본 명세서에서 입증된, 유방암의 증가된 위험도와 연관된 연관된 변이(예를 들면, 마커 대립인자)에 대한 양성 결과는 상기 데이터세트가 유래된 개인이 유방암의 증가된 감수성(증가된 위험도)을 갖는다는 것을 나타낸다.
본 발명의 특정한 구체예에서, 다형성 마커는 다형성 마커에 대한 유전형 데이터를 다형성의 하나 이상의 대립인자와 유방암 간의 상관관계를 포함하는 참조표를 참조하는 것에 의해, 유방암과 상관된다. 일부 구체예에서, 상기 표는 하나의 다형성에 대한 상관관계를 포함한다. 다른 구체예에서, 상기 표는 복수 개의 다형성에 대한 상관관계를 포함한다. 두 시나리오 모두에서, 마커와 유방암 간의 상관관계의 표시를 제공하는 참조표를 참조하는 것에 의해, 유방암에 대한 위험도, 또는 유방암에 대한 감수성이 시료가 유래된 개인에서 확인될 수 있다. 일부 구체예에서, 상관관계가 통계적 척도로서 보고된다. 통계적 척도는 상대적 위험도(RR), 절대 위험도(AR), 또는 오즈비(OR)와 같은 위험도 척도로 보고될 수 있다.
본 발명의 마커, 예를 들면, 염색체 5p12, 및 염색체 10q26 상의 다형성 마커, 예를 들면, 표 12, 표 13, 및 표 14에 제시된 마커들, 예를 들면, 마커 rs7703618, rs4415084, rs2067980, rs10035564, rs11743392, rs7716600, rs10941679, rs1219648은 단독으로, 또는 조합되어 유방암의 위험도 평가 및 진단적 목적을 위해 유용할 수 있다. 따라서, 개별적인 마커에 의한 위험도의 증가가 비교적 크지 않은 경우, 즉, 10-30%의 수준인 경우에도, 연관은 유의성 있는 영향을 가질 수 있다. 따라서, 상대적으로 일반적인 변이가 전체 위험도에 대해 유의성 있는 기여도를 가질 수 있거나(집단 귀속 위험도(PAR)이 높음), 또는 마커들의 조합이 마커들의 통합된 위험도에 근거하여, 유방암을 발병할 유의성 있는 통합 위험도(combined risk)를 갖는 개체들의 그룹을 정의하기 위해 이용될 수 있다.
예를 들면, 통합 위험도(combined risk)는 마커 rs10941679 및 마커 rs1219648과 같은, 염색체 5p12 및 염색체 10q26 상의 마커들에 대한 유전형 결과에 근거하여 평가될 수 있다. 대안적으로, 이 마커들과 LD인 마커들이 평가될 수 있다. 염색체 2q14상의 마커들 (예를 들면, 마커 rs4848543 또는 이와 연관 불균형인 마커들), 2q35상의 마커들 (예를 들면, 마커 rs13387042, 또는 이와 연관 불균형인 마커들), 및 염색체 16 상의 마커들(예를 들면, 마커 rs3803662, 또는 이와 연관 불균형인 마커들) 과 같은 유방암의 위험도를 부여하는 것으로 알려진 다른 마커들도 본 명세서에 기재된 마커들과 함께 평가될 수 있다.
따라서, 본 발명의 일 구체예에서, 복수의 변이(마커 및/또는 일배체형)가 전체 위험도 평가를 위해 이용된다. 일 구체예에서, 이 변이들은 본 명세서에 개시된 변이들로부터 선택된다. 다른 구체예는 유방암에 대한 감수성의 진단을 위해 유용한 것으로 알려진 다른 변이와 조합된 본 발명의 변이의 용도를 포함한다. 3개 이상의 마커, 4개 이상의 마커, 5개 이상의 마커, 6개 이상의 마커, 7개 이상의 마커, 8개 이상의 마커, 9개 이상의 마커, 또는 10개 이상의 마커와 같은, 둘 이상의 마커에 대한 결과가 그와 같은 분석에서 통합될 수 있다. 그와 같은 구체예에서, 개인에서 복수의 마커 및/또는 일배체형의 유전형 상태(genotype status)가 결정되고, 상기 개인의 상태가 연관된 변이의 집단 빈도, 또는 연령-조화되고(age-matched) 성별-조화된 개체와 같은 임상적으로 건강한 개체에서의 상기 변이의 빈도와 비교된다. 다변량 분석(multivariate analysis) 또는 결합 위험도 분석과 같은, 본 발명이 속하는 기술분야에 공지된 방법들이 복수의 유전자 좌에서의 유전형 상태에 근거하여 부여된 전체 위험도를 결정하기 위해 뒤이어 이용될 수 있다. 그와 같은 분석에 근거한 위험도의 평가가 뒤이어 본 명세서에 개시된 본 발명의 방법 및 키트에서 이용될 수 있다.
전술된 바와 같이, 인간 게놈의 일배체형 블럭 구조는 질병 또는 성향(trait)과 원래 연관된 변이와 연관 불균형인 다수의 변이(마커 및/또는 일배체형)가 상기 질병 또는 성향에 대한 연관을 평가하기 위한 대리 마커(surrogate marker)로 이용될 수 있게 하는 효과를 갖는다. 그와 같은 대리 마커의 갯수는 해당 영역에서 과거의 재조합율(historical recombination rate), 해당 영역에서의 돌연변이 빈도(즉, 해당 영역에서 다형성 부위 또는 마커의 갯수), 및 해당 영역에서 LD의 정도(LD 블럭의 크기)와 같은 인자에 의존적일 것이다. 이 마커들은 통상적으로 본 명세서에 기재된 방법 또는 본 발명이 속하는 기술 분야의 당업자에게 알려진 다른 방법을 이용하여 정의된 LD 블럭 또는 일배체형 블럭의 물리적 경계 내에 위치한다. 그러나, 종종 마커 및 일배체형 연관이 정의된 일배체형 블럭의 물리적 경계를 넘어 연장되는 것으로 발견된다. 그와 같은 경우에, 마커 및/또는 일배체형은 또한 정의된 바와 같은 일배체형 블럭 내에 물리적으로 위치하는 마커 및/또는 일배체형을 위한 대리 마커 및/또는 일배체형으로 이용될 수 있다. 그 결과, 본 발명의 마커 및 일배체형과 LD(통상적으로, 0.4보다 큰 r2을 포함한, 0.3보다 큰 r2을 포함한, 0.2보다 큰 r2과 같은, 0.1보다 큰 r2을 특징으로 함)인 마커 및 일배체형도, 그들이 물리적으로 정의된 바와 같은 일배체형 블럭의 경계 외부에 존재하는 경우에도 본 발명의 범위 내에 속한다. 이는 본 명세서(예를 들면, 표 1 및 표 3, 예를 들면, rs4415084, rs10941679, rs1219648)에 기재된 마커들을 포함하나, 또한 표 1 및 표 3에 열거된 하나 이상의 마커와 강한 LD(예를 들면, 0.1 또는 0.2보다 큰 r2 및/또는 |D'| > 0.8을 특징으로 함)인 다른 마커들을 포함할 수 있다.
본 명세서에 기재된 SNP 마커의 경우, 환자에서 과량으로 존재하는 것으로 확인된 대립인자(위험-대립인자)에 대한 반대 대립인자(opposite allele)는 유방암에서 감소된 빈도로 발견된다. 따라서, 이 마커들 및 상기 마커들과 LD이고 및/또는 상기 마커들을 포함하는 일배체형은 유방암에 대해 보호성이고, 즉, 그들은 이 마커들 및/또는 일배체형을 갖는 개인들이 유방암을 발병할 감소된 위험도 또는 유방암에 대한 감소된 감수성을 부여한다.
특정한 일배체형을 포함한, 본 발명의 특정 변이들은 일부 경우에, 다양한 유전적 마커들의 조합, 예를 들면, SNP와 마이크로새틀라이트의 조합을 포함한다. 따라서, 일배체형을 검출하는 것은 본 발명이 속하는 기술 분야에서 알려지고 및/또는 본 명세서에 기재된, 다형성 부위에서의 서열을 검출하는 방법에 의해 달성될 수 있다. 또한, 특정한 일배체형 또는 일련의 마커들과 질병 표현형 간의 상관관계가 표준 기법을 이용하여 검증될 수 있다. 상관관계에 대한 간단한 검정의 예는 2 x 2 표(two by two table) 상에서의 Fisher-exact 검정이다.
특정한 구체예에서, 유방암과 연관된 것으로 확인된 마커 대립인자 또는 일배체형(예를 들면, 표 1 및 표3에 결거된 마커 대립인자들, 표 12, 표 13, 및 표 14에 열거된 마커들, 서열번호 1 내지 237)은 상기 마커 대립인자 또는 일배체형이 건강한 개체(대조군)에서의 존재 대비, 유방암에 대한 위험을 갖는 개체(질병군(affected))에 보다 빈번하게 존재하고, 상기 마커 대립인자 또는 일배체형의 존재는 유방암 또는 유방암에 대한 감수성을 나타내는 것인 마커 대립인자 또는 일배체형이다. 다른 구체에에서, 유방암과 연관된 것으로 확인된 하나 이상의 마커와 연관 불균형인 위험 마커(at-risk marker)는 건강한 개체(대조군)에서의 존재 대비, 유방암에 대한 위험을 갖는 개체(질병군)에 보다 빈번하게 존재하는 태깅(tagging) 마커이고, 상기 태깅 마커의 존재는 유방암에 대한 증가된 감수성을 나타낸다. 또 다른 구체예에서, 유방암과 연관된 것으로 확인된 하나 이상의 마커와 연관 불균형인 위험 마커 대립인자(즉, 증가된 감수성을 부여하는 대립인자)는 건강한 개체(대조군)에서의 존재의 빈도 대비, 유방암에 대한 위험을 갖는 개체(질병군)에 보다 빈번하게 존재하는 하나 이상의 대립인자를 포함하는 마커이고, 상기 마커의 존재는 유방암에 대한 증가된 감수성을 나타낸다.
연구 집단(study population)
일반적으로, 본 발명의 방법 및 키트는 임의의 원천(source), 즉 임의의 개체으로부터의 게놈 DNA를 포함하는 시료로부터 이용될 수 있다. 바람직한 구체예에서, 개체는 인간이다. 개인은 성인, 아동, 또는 태아일 수 있다. 본 발명은 또한, 표적 집단의 구성원인 개체에서 마커 및/또는 일배체형을 평가하는 방법을 제공한다. 일 구체예에서, 그와 같은 표적 집단은 다른 유전적 인자, 바이오마커, 생체물리적 인자(예를 들면, 체중, BMD, 혈압), 또는 전반적인 건강 및/또는 생활방식 파라미터(예를 들면, 질병 또는 관련 질병의 병력, 질병의 과거 진단, 질병의 가족력)에 기반하여, 상기 질병을 발병할 위험도를 갖는 개체들의 집단 또는 그룹이다.
본 발명은 40세 이상, 45세 이상, 또는 50세 이상, 55세 이상, 60세 이상, 65세 이상, 70세 이상, 75세 이상, 80세 이상, 또는 85세 이상의 개인과 같은, 특정한 연령 서브그룹으로부터의 개인을 포함하는 구체예를 제공한다. 본 발명의 다른 구체예는 80세 미만, 75세 미만, 또는 70세 미만, 65세 미만, 60세 미만, 55세 미만, 50세 미만, 45세 미만, 40세 미만, 35세 미만, 또는 30세 미만과 같은, 85세 미만의 개인과 같은, 다른 연령군에 관한 것이다. 다른 구체예는 전술된 임의의 연령 범위에 속하는 발병 연령을 갖는 개인에 관한 것이다. 또한, 특정한 구체예에서, 45세를 초과하나, 60세 미만인 발병 연령과 같은 일정 범위의 연령이 관련된 것일 수 있는 것으로 고려된다. 그러나, 앞서 열거된 연령값에 의해 일괄된 모든 연령 범위를 포함한, 다른 연령 범위도 고려된다. 본 발명은 또한 하나의 성별의 개인, 남성 또는 여성에 관한 것이다. 일부 구체예에서, 본 발명은 남성 개체의 평가에 관한 것이다. 또 다른 구체예에서, 본 발명은 여성 개체에 관한 것인다.
아이슬란드 집단은 북유럽 선조 기원의 코카서스인 집단이다. 아이슬란드 집단에서 유전적 연관(genetic linkage)과 관련성(association)의 결과를 보고하는 다수의 연구가 최근 수년간 발표되었다. 그와 같은 다수의 연구들은 다른 집단에서, 최초에 아이슬란드 집단에서 특정 질환과 연관된 것으로 확인된 변이의 재현을 보여준다(Styrkarsdottir, U., et al. N Engl J Med Apr 29 2008 (Epub ahead of print); Thorgeirsson, T., et al. Nature 452:638-42 (2008); Gudmundsson, J., et al. Nat Genet. 40:281-3 (2008); Stacey, S.N., et al., Nat Genet. 39:865-69 (2007); Helgadottir, A., et al., Science 316:1491-93 (2007); Steinthorsdottir, V., et al., Nat Genet. 39:770-75 (2007); Gudmundsson, J., et al., Nat Genet. 39:631-37 (2007); Frayling, TM, Nature Reviews Genet 8:657-662 (2007); Amundadottir, L.T., et al., Nat Genet. 38:652-58 (2006); Grant, S.F., et al., Nat Genet. 38:320-23 (2006)). 따라서, 아이슬란드 집단에서의 유전적 발견이 아프리카 및 아시아로부터의 집단을 포함한, 다른 집단에서 재현되었다.
유방암과 연관된 것으로 확인된 본 발명의 마커들은 다른 인간 집단에서 유사한 연관성을 보이는 것으로 사료된다. 따라서, 개별적인 인간 집단을 포함하는 특정한 구체예가 또한 고려되며 본 발명의 범위 내에 속한다. 그와 같은 구체예는 코카서스 집단, 유럽 집단, 미국 집단, 유라시아 집단, 아시아 집단, 중앙/남아시아 집단, 동아시아 집단, 중동 집단, 아프리카 집단, 라틴 아메리카 집단, 및 오세아니아 집단을 포함하나, 이에 한정되지 않는 하나 이상의 인간 집단으로부터의 인간 개체에 관한 것이다. 유럽 집단은 스웨덴 집단, 노르웨이 집단, 핀란드 집단, 러시아 집단, 덴마크 집단, 아이슬란드 집단, 아일랜드 집단, 켈트(Kelt) 집단, 영국 집단, 스코틀랜드 집단, 네덜란드 집단, 벨기에 집단, 프랑스 집단, 독일 집단, 스페인 집단, 포르투갈 집단, 이탈리아 집단, 폴란드 집단, 불가리아 집단, 슬라브 집단, 세르비아 집단, 보스니아 집단, 체코 집단, 그리스 집단, 및 터키 집단을 포함하나, 이에 한정되지 않는다. 다른 구체예에서, 본 발명은 또한 반투(Bantu), 만덴크(Mandenk), 요루바(Yoruba), 산(San), 음부티 피그미(Mbuti Pygmy), 오르카디안(Orcadian), 아디겔(Adygel), 러시안(Russian), 사르디니안(Sardinian), 투스칸(Tuscan), 모자비트(Mozabite), 베두인(Bedouin), 드루즈(Druze), 팔레스티니안(Palestinian), 발로치(Balochi), 브라휘(Brahui), 마크라니(Makrani), 신디(Sindhi), 파탄(Pathan), 부루쇼(Burusho), 하자라(Hazara), 위구르(Uygur), 칼라쉬(Kalash), 한(Han), 다이(Dai), 다우르(Daur), 헤젠(Hezhen), 라후(Lahu), 미아오(Miao), 오로켄(Oroqen), 쉬(She), 투지아(Tujia), 투(Tu), 시보(Xibo), 이(Yi), 몽골란(Mongolan), 낙시(Naxi), 캄보디안(Cambodian), 일본인( Japanese), 야쿠트(Yakut), 멜라네시안(Melanesian), 파푸안(Papuan), 카리티아난(Karitianan), 수루이(Surui), 콜럼비안(Columbian), 마야(Maya) 및 피마(Pima)를 포함하나, 이에 한정되지 않는 특정한 인간 집단에서 실시될 수 있다.
특정한 구체예에서, 본 발명은 아프리카 후손 또는 계통의 사람을 포함하는 집단과 같은 블랙 아프리카 선조(ancestry)를 포함하는 집단에 관한 것이다. 블랙 아프리가 선조는 흑인(black race)에 속하거나 또는 니그로 인종(negro race)에 속하는, 아프리카계 미국인(African-American), 아프로-아메리칸(Afro-American), 블랙 아메리칸(Black American)으로 자가-보고하는 것에 의해 결정될 수 있다. 예를 들면, 아프리카계 미국인 또는 블랙 아메리칸은 북미에 거주하고 아프리카의 흑인군에 속하는 기원을 갖는 사람들이다. 또 다른 예에서, 블랙 아프리카 선조의 자가-보고된 사람은 한 명 이상의 블랙 아프리카 선조의 부모 또는 한 명 이상의 블랙 아프리카 선조의 조부모를 가질 수 있다.
개체에서 인종적 기여는 또한 유전적 분석에 의해 결정될 수 있다. 선조의 유전적 분석은 Smith et al. (Am J Hum Genet 74, 1001-13 (2004))에 개시된 마커와 같은, 연관되지 않은(unlinked) 마이크로새틀라이트 마커를 이용하여 수행될 수 있다.
특정한 구체예에서, 본 발명은 앞서 기재된 바와 같이, 특정한 집단에서 확인된 마커 및/또는 일배체형에 관한 것이다. 본 발명이 속하는 기술 분야의 당업자는 상이한 집단에 적용되는 경우, 연관 불균형(LD)의 척도는 상이한 결과를 가져올 수 있다는 것을 이해할 것이다. 이는 특정한 게놈 영역에서 LD의 차이를 초래했을 수 있는 차등적 선택 압력(differential selective pressure) 및 상이한 인간 집단의 상이한 집단 역사 때문이다. 일부 마커들, 예를 들면, SNP 마커들이 하나의 집단에서는 다형성이나, 또 다른 집단에서는 다형성이 아니라는 것이 본 발명이 속하는 기술 분야의 당업자에게 잘 알려져 있다. 그러나, 본 발명이 속하는 기술 분야의 당업자는 입수가능한 방법을 적용하고, 본 명세서에서 고려되는 바와 같이, 임의의 인간 집단에서 본 발명을 실시할 것이다. 이는 특정한 집단 내에서 가장 강력한 연관을 제공하는 마커들을 확인하기 위해, 본 발명의 LD 영역에서 다형성 마커를 평가하는 것을 포함할 수 있다. 따라서, 본 발명의 위험 변이는 다양한 인간 집단에서 상이한 일배체형 배경에 상이한 빈도로 존재할 수 있다. 그러나, 당해 분야에서 알려진 방법 및 본 발명의 마커를 이용하여, 본 발명이 임의의 주어진 인간 집단에서 실시될 수 있다.
특정한 구체예에서, 본 발명은 앞서 기재된 바와 같이, 특정한 집단에서 확인된 마커 및/또는 일배체형에 관한 것이다. 본 발명이 속하는 기술 분야의 당업자는 상이한 집단에 적용되는 경우, 연관 불균형(LD)의 척도는 상이한 결과를 가져올 수 있다는 것을 이해할 것이다. 이는 특정한 게놈 영역에서 LD의 차이를 초래했을 수 있는 차등적 선택 압력(differential selective pressure) 및 상이한 인간 집단의 상이한 집단 역사 때문이다. 일부 마커들, 예를 들면, SNP 마커들이 상이한 집단에서 상이한 집단 빈도를 가지거나, 또는 하나의 집단에서는 다형성이나, 또 다른 집단에서는 다형성이 아니라는 것이 본 발명이 속하는 기술 분야의 당업자에게 잘 알려져 있다. 그러나, 본 발명이 속하는 기술 분야의 당업자는 입수가능한 방법을 적용하고, 본 명세서에서 고려되는 바와 같이, 임의의 인간 집단에서 본 발명을 실시할 것이다. 이는 특정한 집단 내에서 가장 강력한 연관을 제공하는 마커들을 확인하기 위해, 본 발명의 LD 영역에서 다형성 마커를 평가하는 것을 포함할 수 있다. 따라서, 본 발명의 위험 변이는 다양한 인간 집단에서 상이한 일배체형 배경에 상이한 빈도로 존재할 수 있다. 그러나, 당해 분야에서 알려진 방법 및 본 발명의 마커를 이용하여, 본 발명이 임의의 주어진 인간 집단에서 실시될 수 있다.
유방암에 대한 유전 위험도를 예측하는 모델
유방암 위험도 평가의 목표는 고-위험도 여성에서 생존율과 삶의 질을 증가시키면서 비용, 불필요한 개입 및 보다 낮은 위험도의 여성에서 우려를 최소화하기 위해 모든 여성에 대해 맞춤화된 의료 관리 전략의 수립을 위한 합립적인 프레임워크를 제공하는 것이다. 위험도 예측 모델은 주어진 세트의 선천척 위험 특성(예를 들면, 가족력, 과거의 양성 유방 병변(prior benign breast lesion), 과거의 유방 종양)을 갖는 개인에서 유방암에 대한 위험도를 추정한다. 임상에서 가장 일반적으로 이용되는 유방암 위험도 예측 모델은 가족력을 고려하는 것에 의해 유전된 위험 인자들을 추정한다. 위험도 추정치는 과거에 유방암으로 진단받은 1명 이상의 가까운 친척을 갖는 개인에 대한 증가된 위험도의 관찰에 근거한다. 위험 추정치는 복잡한 가계도 구조를 고려하지 않는다. 이 모델들은 유방암 소인 돌연변이(breast cancer predisposing mutation)를 갖는 유전자의 보인자와 비-보인자를 구별할 수 없는 추가적인 단점을 갖는다.
보다 정교한 위험도 모델은 특정한 가족력을 다루고 BRCA1 및 BRCA2 돌연변이에 대한 보인자 상태를 고려할 수 있는 능력을 갖는 보다 우수한 메카니즘을 갖는다. 예를 들면, BOADICEA(Breast and Ovarian Analysis of Disease Incidence and Carrier Estimation Algorithm) (Antoniou et al., 2004)는 가계도 분석 프로그램 MENDEL을 통해 개별적인 가계도 구조에 근거하여 가족력을 고려한다. 공지된 BRCA1 및 BRCA2 상태에 대한 정보도 고려된다. BOADICEA 및 현재 사용되는 모든 다른 유방암 위험도 모델의 주요한 한계는 그들이 다른 소인 유전자로부터의 유전형 정보를 고려하지 않는다는 것이다. 현재의 모델들은 위험도의 비-BRCA 유전적 결정인자(genetic determinant)의 지식 부족을 보충하는 대리물(surrogate)로 작용하기 위해 가족력에 크게 의존한다. 따라서, 이용가능한 모델들은 질병의 공지된 가족력이 있는 상황들에 한정된다. 보다 낮은 침투성 유방암 소인 유전자들은 집단에서 비교적 일반적일 수 있고 BRCA1 및 BRCA2 유전자처럼 가족성 클러스터링(familiar clustering)을 주도하는 강한 경향을 보이지 않을 수 있다. 소인성 대립인자(predisposition allele)의 비교적 높은 유전적 부하(genetic load)를 갖는 환자들은 질병의 가족력을 거의 또는 전혀 보이지 않을 수 있다. 따라서, 유전자-기반 테스트를 통해 직접적으로 수득된 유전된 감수성 데이터를 내포시키는 모델을 구축할 필요성이 존재한다. 모델들을 보다 정확하게 만드는 것 외에, 이는 가족력 파라미터에 대한 의존성을 감소시키고 위험도 프로파일링을 가족력이 그와 같은 주요 인자가 아닌 보다 넓은 위험 집단(at-risk populatoin)으로 확장하는 것을 지원할 것이다.
개선된 유전적 위험도 모델의 유방암 일차 예방(primary prevention)의 임상적 관리로의 통합
임상적 일차 예방 옵션은 현재 화학적 예방(chemopreventative)(또는 호르몬) 치료 및 예방적 수술(prophylactic surgery)이다. 고위험군으로 확인된 환자들에게 화학적 예방 요법의 장기 코스가 처방될 수 있다. 이 개념은 심혈관 의학 부분에서는 잘 수용되나, 임상적 종양학에서는 이제 영향을 미치기 시작하고 있다. 가장 널리 이용되는 종양의 화학적 예방제는 선택적 에스트로겐 수용제 조절제(SERM)인 타목시펜이다. 처음에 유방암 재발에 대한 아쥬반트 요법으로 이용되었던 타목시펜은 이제 유방암 예방제로서 입증된 효능을 갖는다[Cuzick et al., 2003][Martino et al., 2004]. FDA는 일부 고위험 여성에서 화학적 예방제로서 타목시펜의 이용을 허가했다.
안타깝게도, 장기적인 타목시펜 이용은 자궁내막암(endometrial cancer)에 대한 위험도를 약 2.5배 증가시키고 정맥 혈전증의 위험도를 약 2.0배 증가시킨다. 폐색전증, 뇌졸중, 및 백내장에 대한 위험도도 증가된다[Cuzick et al., 2003]. 따라서, 유방암 발생률을 낮추기 위한 타목시펜 이용의 장점은 전체 사망률의 상응하는 감소로 용이하게 실현되지 못할 수 있다. 랄록시펜이라 불리는 또 다른 SERM은 예방적 모드에서 보다 효과적이고, 자궁내막암에 대한 동일한 위험을 갖지 않는다. 그러나, 랄록시펜으로 장기 치료된 환자에서 혈전증에 대한 위험도는 여전히 증가된다(Cuzick et al., 2003; Martino et al., 2004). 또한, 타목시펜과 랄록시펜은 모두 그들과 연관된 삶의 질 문제를 갖는다. 화학적 예방 모드에서 SERM 요법의 합리적인 위험:이익 분석을 수행하기 위해, 유방암에 대한 가장 높은 위험도를 갖는 개체들을 확인해야 하는 임상적 요구가 있다. 유방암에 대한 위험도의 상당한 부분이 유전적이라는 점을 고려할 때, 유방암에 대해 개인의 위험도를 정량하기 위한 유전적 테스트에 대한 명백한 임상적 요구가 존재한다. 아로마타아제 저해제와 같은, 이용가능해질 수 있는 미래의 암 화학적 예방 치료제로부터 유사한 문제들이 발생할 것을 예상할 수 있다. 또한, 화학적 예방 요법이 보다 안전해지기 때문에, 유전적으로 소인을 가지나, BRCA1 및 BRCA2 보인자와 연관된 크게 증가된 위험도를 갖지 않는 환자들을 확인해야 할 증가된 요구가 존재한다.
유방암에 대한 고위험도를 갖는 것으로 확인된 환자들은 예방적 수술에 대해 고려될 수 있다; 양측 유방절제술 또는 난소절제술 또는 양자 모두. 명백하게, 그와 같은 근치적인 치료법(drastic treatment)은 매우 높은 위험도를 갖는 환자들에게만 권고된다. 실제로, 그와 같은 위험도는 현재 BRCA1, BRCA2, 또는 리-프라우메니 증후군(Li-Fraumeni Syndrome)의 p53, 코우덴 증후군(Cowden's syndrome)의 PTEN과 같은 희귀 유방암 소인성 증후군(rare breast cancer predisposition syndrome)에 관여하는 것으로 알려진 유전자들에 돌연변이를 갖는 개체들에서만 확인될 수 있다.
BRCA1 및 BRCA2 돌연변이의 침투율의 추정치는 그들이 집단-기반 추정치로부터 유래되는 경우보다 다중-케이스 가족(multiple-case family)들로부터 유래될 때 더 높은 경향이 있다. 이는 상이한 돌연변이-보인(mutaion-carrying) 가족들이 유방암에 대한 상이한 침투율을 보이기 때문이다(예를 들면, Thorlacius et al., 1997 참조). 이 변이에 기여하는 주요한 인자들 중 하나는 그 효과가 BRCA1 및 BRCA2 돌연변이의 침투율을 변형시키는 것인 미지의 소인성 유전자(unknown predisposition gene)의 작용이다. 따라서, BRCA1 또는 BRCA2 유전자에 돌연변이를 갖는 개체에 대한 절대적 위험도는 변형시키는 유전자(modifying gene)의 존재 및 작용에 대한 이해 없이 정확하게 정량될 수 없다. BRCA1 및 BRCA2 보인자에 대한 치료 옵션은 가혹할 수 있기 때문에, 가능한 한 가장 정확하게 개별적인 BRCA 보인자에 대한 위험도를 정량하는 것이 중요하다. 따라서, BRCA1 및 BRCA2 보인자에서 유방암의 침투를 변형시키는 효과를 갖는 소인성 유전자(predisposition gene)를 확인하고 이 유전자들에 기반한 개선된 위험도 평가 모델을 수립해야 하는 필요성이 존재한다.
또한, 유방암의 강한 가족력 때문에 유방암에 대한 매우 높은 위험도를 갖는 것으로 인식되나, 알려진 소인성 유전자에서 돌연변이를 확인할 수 없는 개체들이 있다. 그와 같은 경우에, 고 침투성 소인성 유전자를 유전받았는지 여부를 확인하기 위해 개체를 테스트할 수 없기 때문에, 예방적 수술의 고려가 어렵다. 따라서, 개체의 위험도가 정확하게 평가될 수 없다. 따라서, 밝혀지지 않은 고 침투성 소인성 유전자를 확인하고 일차적인 예방 전략에서 사용할 관련된 유전적 테스트를 개발해야 하는 명백한 임상적 요구가 존재한다. 그와 같은 유전자는 예를 들면, 본 명세서에서 유방암의 위험도와 연관된 것으로 개시된 유전자(예를 들면, FGF10, MRPS30 및/또는 FGFR2 유전자)일 수 있다. 본 명세서에서 유방암과 연관된 것으로 확인된 변이들은 상당히 공통적이고, 유방암의 비교적 낮은 위험도를 부여하나, 이 유전자들 중 하나 이상에 보다 높은 위험도 변이가 존재할 상당한 가능성이 있다. 따라서, FGF10, MRPS30 및/또는 FGFR2 유전자 중 하나 이상 내에 있거나 또는 이들과 연관된 고-위험도 유전적 변이가 개체가 유방암에 대한 고 위험도(및 고 침투성) 유전적 인자의 보인자인지 여부를 결정하기 위해 유용할 수 있다.
조기 진단
대부분의 서양 국가에서 유방암에 대한 임상적 스크리닝은 정기적인 임상적 유방 검사(clinical breast excamination, CBE) 및 X-선 유방촬영술이다. CBE는 우수한 유방촬영 스크리닝 프로그램에서 사용될 때 부가적인 이익을 거의 갖지 않는다는 것을 나타내는 우수한 증거가 있다. 영국에서, 50세 내지 70세의 여성들은 3년마다 스크리닝 유방촬영술을 받을 수 있다. 미국의 경우, 건강관리 제공자에 따라 다르나, 미국 암협회(the American Cancer Society)는 40세부터 매년 유방촬영 스크리닝을 권장한다. 유방촬영 스크리닝은 50세 이상의 스크리닝된 여성에서 사망율을 감소시키는 입증된 효과를 갖는다.
유전적 검사가 기존의 유방촬영 스크리닝 프로그램에 대한 접근을 감소시키는 수단으로 이용될 것 같지 않다. 그러나, 유방촬영 스크리닝도 단점을 가지며 유전적 검사가 강화된 스크리닝 프로그램을 위한 대상자들을 선별하기 위해 이용하는 것이 고려될 수 있다. 유방촬영 스크리닝의 단점 중 하나는 현재까지 50세 전에 스크리닝된 여성에 대해 개선된 생존율에 대한 유의성 있는 효과를 입증하는 것이 가능하지 않았다는 것이다.
유방촬영술이 50세 미만의 여성에서 덜 효과적인 한가지 이유는 유방 조직의 밀도(density)가 더 어린 여성에서 더 높아서, 종양의 유방촬영에 의한 검출을 더 어렵게한다는 것이다. 그러나, 소인을 갖는 개체에서 유방암은 어린 연령군에서 일어나는 경향이 있고 높은 유방 밀도와 유방암 위험도 간의 명확한 연관이 있다. 따라서, 높은 소인을 갖는 개체가 최고 위험도의 그룹에서 최적 미만으로(sub-optimally) 작동되는 기법에 의해 관리될 수 있기 때문에, 이들에서 유방촬영 스크리닝의 단순한 증가에 따른 문제가 있다. 최근의 연구는 CE-MRI(contrast-enhanced magnetic resonance)가 유방촬영 스크리닝보다 더 민감하고 이 고위험도 그룹에서 보다 조기에 종양을 검출한다는 것을 보여주었다(Warner et al., 2004; Leach et al., 2005). CE-MRI 전략은 통상적인 X-선 유방촬영술과 조합되어 이용될 때 특히 효과적이다 (Leach et al., 2005). CE-MRI는 고 비용을 초래하는 전문 센터(specialist center)를 필요로 하므로, 50세 미만의 스크리닝은 최고 위험도에 있는 개체들로 제한되어야 한다. 현재의 CE-MRI 시험은 BRCA1, BRCA2 또는 p53 돌연변이 또는 질병의 매우 강한 가족력을 갖는 개체들로의 적용에 한정된다. 이 스크리닝 방법(modality)을 보다 넓은 범위의 고-위험군 환자들로 확장하는 것은 유전자-기반 위험도 프로파일링 도구의 제공에 의해 크게 촉진될 것이다.
조기발병 유방암 및 유전적 소인을 갖는 여성에서 발생하는 암이 장년층의, 덜 강한 유전적 소인을 갖는 여성에서 발생한 암보다 더 빠르게 성장한다는 견해를 뒷받침하는 좋은 증거가 있다. 이 증거는 젊은 여성에서 중간암(interval cancer)의 보다 높은 비율의 관찰로부터 유래되며, 즉, 잘 스크리닝된 집단에서 스크리닝을 위한 방문간 간격에 발생하는 암이 젊은 여성들 사이에서 더 높다. 따라서, 방법에 관계 없이, 더 젊은 여성들에서는 스크리닝 간격이 단축되어야 한다는 제안이 있다. 보다 값비싼 방법을 이용한 보다 빈번한 스크리닝이 유방암의 전체 비율이 비교적 낮은 연령군에 대해 요구되는 것으로 보인다는 점에서 역설이 있다. 질병을 발병할 가장 높은 소인을 갖는 젊은 개체들을 조기에 확인하고, 그들을 보다 값비싸고 광범위한 스크리닝 체계로 전달하는 것에 대한 명백한 임상적 필요성이 존재한다. 본 명세서에서 유방암의 위험도를 부여하는 것으로 개시된 변이가 유방암을 발병할 특히 높은 위험도를 갖는 개인의 확인을 위해 유용할 수 있다. 그와 같은 개인들은 암의 조기 확인 가능성을 최대화하기 위해, 조기의 공격적인 스크리닝 프로그램으로부터 가장 크게 이익을 누릴 가능성이 있다.
치료
현재, 원발성 유방암은 외과적 수술, 아쥬반트 화학요법, 방사선요법, 뒤이은 장기적 호르몬 요법에 의해 치료된다. 종종 3개 또는 4개의 치료법의 조합이 이용된다.
동일한 질병 단계에 있는 유방암 환자들이 아쥬반트 화학요법에 대해 매우 상이한 반응을 가져서 전체적인 치료 결과에 광범위한 변이가 초래될 수 있다. 유방암 환자의 아쥬반트 화학요법 치료에 대한 적격(eligibility)을 결정하는 것에 대한 합의된 가이드라인(St Galen 및 NIH 기준)이 수립되었다. 그러나, 전이의 가장 강력한 임상적 및 조직학적 예측자도 유방 종양의 임상적 반응을 정확하게 예측하지 못했다 [Goldhirsch, et al., (1998), J Natl Cancer Inst, 90, 1601-8; Eifel, et al., (2001), J Natl Cancer Inst, 93, 979-89]. 화학요법 또는 호르몬 요법은 전이의 위험도를 약 1/3 감소시키나, 이 치료를 받는 환자의 70-80%는 상기 치료 없이도 생존했을 것이다. 따라서, 유방암 환자의 대다수는 현재 효과적이지 않거나 또는 불필요한 치료법을 제공받고 있다. 임상의들이 가장 높은 효과를 받을 수 있는 환자들에게 보다 적합하게 치료법을 맞춤화할 수 있게 할 예후적 척도(prognostic measure)의 개발에서의 개선에 대한 명백한 임상적 요구가 존재한다. 유전적 소인에 대해 개체들을 프로파일링하는 것이 그들의 치료 결과에 대한 정보를 밝히고 그에 의해 합리적인 치료 계획을 보조할 수 있을 것으로 기대하는 것은 타당하다. 유방암의 위험도를 부여하는, 본 발명의 마커들이 이 상황에서 유용한 것으로 고려된다.
여러 과거의 연구들이 이 개념을 예시한다: BRCA 돌연변이 보인자인 유방암 환자들은 아쥬반트 화학요법으로 치료되는 경우 보다 우수한 임상적 반응률 및 생존을 보이는 것으로 나타난다[Chappuis, et al., (2002), J Med Genet, 39, 608-10; Goffin, et al., (2003), Cancer, 97, 527-36]. BRCA 돌연변이 보인자들은 비-보인자(non-carrier) 대비 난소암에 대한 백금 화학요법에 대해 개선된 반응을 보인다[Cass, et al., (2003), Cancer, 97, 2187-95]. 관련된 유전자들이 알려지지 않은, 소인을 갖는 환자에 유사한 고려가 적용될 수 있다. 예를 들면, 침윤성 소엽성 유방암(infiltrating lobular breast carcinoma, ILBC)은 강한 가족성 요소(familiar component)를 갖는 것으로 알려져 있으나, 관련된 유전적 변이는 확인되지 않았다. ILBC를 갖는 환자들은 일반적인 화학요법 방식(common chemotherapy regime)에 대한 보다 열등한 반응을 보인다[Mathieu, et al., (2004), Eur J Cancer, 40, 342-51].
유전적 소인 모델(genetic predisposition model)은 치료 전략의 개별화(individualization)를 보조하며, 또한 이 전략들의 수립에서 필수적인 역할을 수행할 수 있다. 예를 들면, BRCA1 및 BRCA2 돌연변이 종양 세포는 그들의 결함있는 DNA 복구 경로의 결과로 폴리(ADP-리보오스) 폴리머라아제(PARP) 저해제에 매우 민감한 것으로 확인되었다[Farmer, et al., (2005), Nature, 434, 917-21]. 이는 BRCA 보인자 환자들에서의 그들의 이용을 목적으로 PARP를 표적으로 하는 소형 분자 약물의 개발을 촉진했다. 이 예로부터, 유전적 소인의 지식이 유전적 위험도 프로파일링과 조합하여 사용될 맞춤화된 화학요법 방식의 개발을 가져올 약물 표적을 확인할 수 있다는 것이 명백하다. 마찬가지로, 본 발명의 마커들은 예를 들면, FGF10, MRPS30 및/또는 FGFR2 유전자 중 하나 이상을 표적화하는 신규한 약물의 확인을 보조할 수 있다.
암 화학요법은 정상적인 조직, 특히, 높은 증식성의 조혈 및 장 상피 세포 구획에 대해 잘 알려진, 용량-제한적(dose-limiting) 부작용을 갖는다. 세포독성 약물에 대한 정상 조직의 민감성에 유전에 기반한 개별적인 차이가 존재한다는 것이 예상될 수 있다. 이 인자들을 이해하는 것이 합리적인 치료 계획 및 정상조직을 화학요법의 유해한 효과로부터 보호하도록 설계된 약물의 개발을 보조할 수 있다.
유전적 프로파일링은 또한 개선된 방사선요법 방식에 기여할 수 있다: 표준 방사선 요법 치료를 받은 유방암 환자의 그룹 내에서, 일부 환자들은 정상적으로 내인되는(tolerated) 방사선량에 대해 부작용을 경험할 것이다. 급성 반응은 홍반, 습성 박리(moist desquamation), 부종 및 방사선 폐렴을 포함한다. 모세혈관 확장, 부종, 폐섬유증 및 유방 섬유증을 포함한 장기 반응이 방사선요법 후 수년 뒤에 발생할 수 있다. 급성 반응 및 장기 반응은 모두 이환율의 상당한 원천이며 치명적일 수 있다. 한 연구에서, 87%의 환자들이 방사선요법에 대해 일부 유해한 부작용을 가지며, 11%는 심각한 부작용을 갖는 것으로 확인되었다(LENT/SOMA Grade 3-4); [Hoeller, et al., (2003), Int J Radiat Oncol Biol Phys, 55, 1013-8]. 방사선요법에 대한 부작용을 경험할 확률은 주로 정상 조직 반응에서 체질적인 개별적 차이(constitutive individual difference) 때문이며 이들은 강한 유전적 요소를 갖는다는 견해가 있다. 공지된 유방암 소인 유전자 중 여러개(예를 들면, BRCA1, BRCA2, ATM)가 DNA 이중가닥 절단(double strand break) 복구의 경로에 영향을 미친다. DNA 이중가닥 절단은 방사선요법에 의해 유도되는 주요한 세포독성 병변이다. 이는 이 경로에 속하는 유전자에 변이를 가져서 유방암에 대한 유전적 소인을 갖는 개체들이 방사선요법으로부터 과도한 정상조직 손상을 겪을 보다 높은 위험을 가질 수 있다는 우려를 가져왔다. 본 명세서에서 유방암의 위험도를 부여하는 것으로 기재된 유전적 변이, 예를 들면, FGF10, MRPS30 및/또는 FGFR2 유전자 중 하나 이상을 통해 유방암의 위험도를 부여하는 유전적 변이가 방사선요법에 대한 유해한 반응의 특정한 위험도를 갖는 개체를 식별하기 위해 유용할 수 있다는 것이 고려된다.
집단에서 체질적으로 방사선민감성인(constitutively radiosensitive) 개체들의 존재는 부작용의 빈도를 수용가능한 수준으로 유지시키기 위해, 환자 집단의 대다수에 대해 방사선요법 선량 비율(radiotherapy dose rate)이 제한되어야 한다는 것을 의미한다. 따라서, 방사선요법에 대한 부작용에 대해 증가된 위험을 갖는 개체들을 확인할 수 있는 신뢰할 수 있는 테스트에 대한 임상적 요구가 존재한다. 그와 같은 테스트는 방사선민감성인 개체에 대한 보수적인 치료 또는 대안적인 치료를 지시하며, 비교적 방사선내성(radioresistant)인 대다수의 환자들에 대한 방사선치료 선량의 증가를 가능하게 할 것이다. 유방암 환자들을 단순하게 방사선민감성(radiosensitive), 중간(intermediate) 및 방사선내성(radioresistant) 범주로 분류하기 위한 테스트에 의해 가능해진 선량 증가(dose escalation)는 국소 종양 통제(local tumor control)의 약 35% 증가 및 그에 따른 생존율의 개선을 가져올 것이다[Burnet, et al., (1996), Clin Oncol (R Coll Radiol), 8, 25-34].
이온화 방사선에 대한 노출은 유방에서 종양발생에 기여하는 입증된 인자이다 [Dumitrescu and Cotarla, (2005), J Cell Mol Med, 9, 208-21]. 공지된 유방암 소인 유전자들은 방사선-유도 DNA 손상에 대한 세포 반응의 경로 성분들을 코딩한다 [Narod and Foulkes, (2004), Nat Rev Cancer, 4, 665-76]. 따라서, 이차 원발성 유방 종양에 대한 위험도가 방사선요법 영역 내에 있는 정상 조직의 방사선조사에 의해 증가될 수 있다는 우려가 있다. 방사선 요법으로부터 BRCA 보인자에 대한 측정가능한 증가된 위험도는 없는 것으로 보이나, 그들의 이차 원발성 종양에 대한 위험도는 이미 매우 높다. 이차 원발성 종양에 대한 위험도가 방사선요법으로 치료된 ATM 및 CHEK2 유전자의 유방암 소인성 대립인자의 보인자에서 증가된다는 것을 시사하는 증거가 있다 [Bernstein, et al., (2004), Breast Cancer Res, 6, R199-214; Broeks, et al., (2004), Breast Cancer Res Treat, 83, 91-3]. 방사선요법(및, 가능하게는 집중적인 유방촬영 스크리닝)으로부터의 이차 원발성 종양의 위험도는 치료 계획 단계 동안 환자로부터 정확안 유전적 위험도 프로파일을 수득하는 것에 의해 더 잘 정의될 것으로 예상된다.
이차 예방(Secondary Prevention)
단계 1 또는 단계 2 유방암으로 진단된 환자의 약 30%는 그들의 최초 종양의 국소(loco-regional) 또는 원격 전이 재발(distant metastatic recurrence)을 경험할 것이다. 원발성 유방암을 앓았던 환자들은 또한 유방보존 수술(breast-conserving surgery)을 받은 경우, 반대쪽 유방 또는 같은쪽 유방에 이차 원발성 종양을 진단받을 위험도가 크게 증가된다. 이차 예방(secondary prevention)은 재발 또는 이차 원발성 종양의 발생을 예방하기 위해 이용되는 방법을 의미한다. 현재 사용되는 방법은 단독이거나 또는 아로마타아제 저해제와 조합된 타목시펜 또는 또 다른 SERM에 의한 장기 치료, 위험도 저하를 위한 반대쪽 유방의 절제술, 및 위험도-저하를 위한 난소절제술(가족성 유방-난소암의 위험도를 갖는 환자의 경우)을 포함한다. 타목시펜의 사용에 대한 고려사항은 앞서 검토되었다. 위험도 저하를 위한 수술적 옵션을 고려할 때, 고지된(informed) 비용:이익 분석을 수행하기 위해 위험도가 정량화될 수 있어야 한다는 것이 명백하다.
유방암에 대한 공지된 유전적 소인을 갖는 환자들이 대부분의 환자들보다 더 악화될 수 있다는 여러 징후가 있다. CHEK2 유전자 1100delC 변이를 갖는 환자들은 비-보인자 대비 원격 전이의 약 2.8배 증가된 위험도 및 질병 재발의 3.9배 증가된 위험도를 갖는다[de Bock, et al., (2004), J Med Genet, 41, 731-5]. BRCA1 림프절-음성(node-negative) 종양을 갖는 환자들은 BRCA1 돌연변이를 갖지 않는 유사한 환자들보다 전이의 더 높은 위험도를 갖는다[Goffin, et al., (2003), Cancer, 97, 527-36; Moller, et al., (2002), Int J Cancer, 101, 555-9; Eerola, et al., (2001), Int J Cancer, 93, 368-72]. 따라서, 국소 재발 및 전이의 위험도를 평가하고, 그에 의해 이차 예방적 치료의 선택을 안내하기 위해 유전적 프로파일링이 이용될 수 있다. 본 명세서에 기재된 변이에 근거한 유전적 프로파일링이 이 상황에서 유용할 수 있다. 특정한 구체예에서, 그와 같은 프로파일링은 본 명세서에 기재된 변이 중 하나 이상에 근거할 수 있다. 다른 구체예에서, 그와 같은 프로파일링은 하나 이상의 유방암에 대한 공지된 다른 유전적 위험 인자를 포함할 수 있다. 그와 같은 위험 인자는 고-침투성 위험 인자로 확립될 수 있거나, 또는 그들은 하나 이상의 통상적인 보다 낮은 투과성의 위험 인자일 수 있다(예를 들면, 염색체 2q14 상의 마커들(예를 들면, 마커 rs4848543 또는 이와 연관 불균형인 마커들), 2q35 상의 마커들(예를 들면, 마커 rs13387042, 또는 이와 연관 불균형인 마커들), 및 염색체 16 상의 마커들(예를 들면, 마커 rs3803662, 또는 이와 연관 불균형인 마커들) 상의 마커들).
일반적으로, 원발성 종양 진단을 받은 환자들은 0.7%의 일정한 연별 발생율로 이차 원발성 종양의 위험도를 갖는다[Peto and Mack, (2000), Nat Genet, 26, 411-4]. BRCA 돌연변이를 갖는 환자들은 이차 원발성 종양에 대해 유의성있게 더 높은 위험도를 가지며, 절대적 위험도는 40-60%의 범위이다[Easton, (1999), Breast Cancer Res, 1, 14-7]. BRCA 돌연변이를 갖는 환자들은 이차 원발성 종양에 대해 크게 증가된 위험도를 갖는다[Stacey, et al., (2006), PLoS Med, 3, e217; Metcalfe, et al., (2004), J Clin Oncol, 22, 2328-35]. CHEK2 유전자에 돌연변이를 갖는 환자들은 반대쪽 유방암의 약 5.7배 증가된 위험도를 갖는다[de Bock, et al., (2004), J Med Genet, 41, 731-5]. BARD1 Cys557Ser 변이의 보인자는 이차 원발성 종양을 진단받을 가능성이 2.7배 더 높다[Stacey, et al., (2006), PLoS Med, 3, e217]. 유전적 위험도 프로파일링은 환자에서 이차 원발성 종양의 위험도를 평가하기 위해 이용될 수 있고 예방적 수단이 얼마나 공격적이어야 하는지 여부에 대한 결정을 알려줄 것이다.
발명의 방법
진단 및 스크리닝 방법
특정한 구체예에서, 본 발명은 유방암을 갖는 개체 또는 유방암에 대한 감수성을 갖는 개체에서 보다 빈번하게 나타나는 유전적 마커의 특정한 대립인자를 검출하는 것에 의해, 유방암, 또는 유방암에 대한 감수성을 진단하거나 또는 상기 진단을 보조하는 방법에 관한 것이다. 특정한 구체예에서, 본 발명은 하나 이상의 다형성 마커(예를 들면, 본 명세서에 기재된 마커)의 하나 이상의 대립인자를 검출하는 것에 의해 유방암에 대한 감수성을 진단하는 방법이다. 다른 구체예에서, 본 발명은 하나 이상의 다형성 마커의 하나 이상의 대립인자를 검출하는 것에 의해 유방암에 대한 감수성을 진단하는 방법에 관한 것이다. 본 발명은 특정한 마커의 특정한 대립인자 또는 일배체형의 검출이 유방암에 대한 감수성을 나타내는 것인 방법을 기재한다. 그와 같은 예후적 또는 예측적 분석법은 또한 유방암의 증상의 발생 전에 개체의 예방적 치료를 결정하기 위해 이용될 수 있다. 일부 구체예에서, 본 발명은 의료 전문가에 의해 수행되는 진단과 같은 진단의 임상적 적용 방법에 관한 것이다. 다른 구체예에서, 본 발명은 일반인(layman)에 의해 수행되는 진단 방법 또는 감수성의 결정 방법에 관한 것이다. 상기 일반인은 유전형분석 서비스의 고객일 수 있다. 상기 일반인은 또한 개인(즉, 고객)의 유전형 상태에 근거하여, 특정한 성향 또는 질병에 대한 유전적 위험 인자와 관련된 서비스를 제공하기 위해, 개체로부터의 DNA 시료에 대해 유전형 분석을 수행하는, 유전형 서비스 제공자일 수 있다. Molecular Inversion Probe 어레이 기술 (예를 들면, Affymetrix GeneChip), 및 BeadArray Technologies (예를 들면, Illumina GoldenGate and Infinium assays)와 같은 SNP 마커의 고효율 유전형분석(high-throughput genotyping)을 포함한, 유전형분석 기술에서의 최근의 기술적 진전은 개인들이 비교적 낮은 비용으로 그들의 게놈을 백만개 까지의 SNP에 대해 동시에 평가받을 수 있게 한다. 결과적으로 수득된, 개인에게 이용가능하게 된 유전형 정보는 다양한 SNP와 연관된 질병 또는 성향 위험도에 대한 공개 문헌으로부터의 정보와 비교될 수 있다. 따라서, 본 명세서에 기재된 바와 같은, 질병-연관 대립인자의 진단적 응용은 임상적 테스트의 결과에 근거하여 의료전문가에 의해, 또는 자신의 유전형 데이터의 분석을 통해 개인에 의해 수행될 수 있다. 바꾸어 말하면, 유전적 위험도에 근거한 감수성의 진단 또는 평가가 대상자의 유전형에 대한 정보 및 특정한 유전적 위험 인자(예를 들면, 특정한 SNP)에 의해 부여되는 위험도에 대한 지식에 근거하여, 의료 전문가, 유전학 상담자(genetic counselor), 유전형분석 서비스를 제공하는 제3자, 위험 도 평가 서비스를 제공하는 제3자 또는 또는 일반인(예를 들면 개인)에 의해 이루어질 수 있다. 본 발명에서, 용어 "진단하는(diagnosing)" 및 "감수성을 진단하다(dignose a susceptibility)" 및 "감수성을 결정하다(determine a suceptiblity)"는 전술된 방법을 포함한, 모든 이용가능한 진단 방법을 의미하도록 의도된다.
일부 구체예에서, 개체로부터 게놈 DNA를 포함하는 시료가 수집된다. 그와 같은 시료는 예를 들면, 구강 도말(buccal swab), 타액 시료, 혈액 시료, 또는 본 명세서에서 더 설명되는 바와 같이, 게놈 DNA를 포함하는 기타 적합한 시료일 수 있다. 그 후, 게놈 DNA에 고-효율 어레이 기술(high-throughput array technology)와 같은, 당업자에게 이용가능한 통상적인 기법을 이용하여 분석된다. 그와 같은 유전형분석으로부터의 결과가 컴퓨터 데이터베이스를 포함한 데이터 캐리어, 데이터 저장 디스크와 같은 편리한 데이터 저장 유닛에, 또는 다른 편리한 데이터 저장 수단에 의해 저장된다. 일부 구체예에서, 상기 컴퓨터 데이터베이스는 객체형 데이터베이스(object database), 관계형 데이터베이스(relational database) 또는 후-관계형 데이터베이스(post-relational database)이다. 뒤이어, 유전형 데이터가 본 명세서에 기재된 유전적 변이와 같은, 특정한 인간 상태에 대한 감수성 변이인 것으로 알려진 일부 변이의 존재에 대해 분석된다. 유전형 데이터가 편리한 데이터 조회(query) 방법을 이용하여 데이터 저장 유닛으로부터 재생될 수 있다. 개체에 대한 특정한 유전형에 의해 부여된 위험도를 계산하는 것은 개체의 유전형을 유전형에 대한, 예를 들면, 특정한 질병 또는 성향(예를 들면, 유방암)에 대한 위험 변이의 이형접합형 보인자에 대한 이전에 결정된 위험도(예를 들면, 상대적 위험도(RR) 또는 오즈비(OR)로 표현됨)를 비교하는 것에 근거할 수 있다. 개체에 대한 계산된 위험도는 일치된(matched) 성별 및 민족기원을 갖는 평균 집단 대비, 사람, 또는 사람의 특정한 유전형에 대한 상대적 위험도일 수 있다. 평균 집단 위험도는 기준 집단으로부터의 결과를 이용하여, 상이한 유전형의 위험도의 가중평균(weighted average)으로 표현될 수 있고, 그 후, 집단 대비 유전형 그룹의 위험도를 계산하기 위한 적합한 계산법이 수행될 수 있다. 대안적으로, 개체에 대한 위험도는 특정한 유전형의 비교, 예를 들면, 마커의 위험 대립인자의 비-보인자(non-carrier) 대비, 마커의 위험 대립인자의 이형접합형 보인자의 비교에 근거한다. 일부 구체예에서, 집단 평균은 사용자가 해석하기 용이한 척도, 즉, 집단의 평균 대비, 자신의 유전형에 근거한, 개체의 위험도를 제공하는 척도를 제공하기 때문에, 집단 평균을 이용하는 것이 더 편리할 수 있다. 계산된 위험도 추정값은 웹사이트, 바람직하게는 안전한 웹사이트를 통해 고객에게 이용가능하게 될 수 있다.
일부 구체예에서, 서비스 제공자는 제공되는 서비스에 고객에 의해 제공된 시료로부터 게놈 DNA를 분리하는 단계, 상기 분리된 DNA의 유전형분석을 수행하는 단계, 상기 유전형 데이터에 기반하여 유전적 위험도를 계산하는 단계 및 상기 위험도를 상기 고객에게 보고하는 단계의 모든 단계들을 포함할 것이다. 일부 다른 구체예에서, 서비스 제공자는 상기 서비스에 개체에 대한 유전형 데이터의 해석, 즉, 상기 개체에 대한 유전형 데이터에 기반한 특정한 유전적 변이에 대한 위험도 추정값을 포함시킬 것이다. 일부 다른 구체예에서, 서비스 제공자는 개체(고객)로부터의 분리된 DNA의 시료로부터 출발하여, 유전형 분석 서비스 및 유전형 데이터의 해석을 포함한 서비스를 포함할 수 있다.
복수 개의 위험 변이에 대한 전체 위험도(overall risk)는 표준 방법을 이용하여 수행될 수 있다. 예를 들면, 승법 모델을 가정하는 것, 즉, 개별적인 위험 변이의 위험도가 전체 효과를 확립하기 위해 곱해진다는 것을 가정하는 것은 복수 개의 마커에 대한 전체 위험도의 계산을 간단하게 할 것이다.
또한, 특정한 다른 구체예에서, 본 발명은 유방암으로 진단되지 않은 개인 또는 일반적 집단에서보다 유방암으로 진단된 환자에서 덜 빈번하게 나타나는 특정한 유전적 마커 대립인자 또는 일배체형을 검출하는 것에 의해, 유방암에 대한 감소된 감수성을 진단하거나 또는 상기 진단을 보조하는 방법에 관한 것이다.
본 명세서에서 기재되고 예시된 바와 같이, 특정한 마커 대립인자 또는 일배체형 (예를 들면, 염색체 5p12 및 10q26 상의 마커들, 예를 들면, 표 12, 표 13 및 표 14에 열거된 마커들 및 일배체형, 예를 들면, 마커 rs4415084, rs10941679 및 rs1219648, 및 이들과 연관 불균형인 마커들)이 유방암과 연관된다. 일 구체예에서, 상기 마커 대립인자 또는 일배체형은 유방암의 유의성 있는 위험도 또는 그에 대한 감수성을 부여하는 마커 대립인자 또는 일배체형이다. 또 다른 구체예에서, 본 발명은 개인에서 유방암에 대한 감수성을 진단하는 방법으로서, 상기 방법은 상기 개인으로부터 수득된 핵산 시료에서 하나 이상의 다형성 마커의 하나 이상의 대립인자의 존재 또는 부재를 결정하는 단계를 포함하고, 상기 하나 이상의 다형성 마커는 표 12, 표 13 및 표 14에 열거된 다형성 마커들, 및 이들과 연관 불균형인 마커들로 구성된 군으로부터 선택된다. 또 다른 구체예에서, 본 발명은 표 12, 표 13 및 표 14에 열거된 하나 이상의 마커 대립인자 또는 일배체형, 또는 이들과 연관 불균형인 마커들에 대해 스크리닝하는 것에 의해, 개인에서 유방암에 대한 감수성을 진단하는 방법에 관한 것이다. 또 다른 구체예에서, 상기 마커 대립인자 또는 일배체형은 건강한 개체(대조군, 예를 들면, 집단 대조군)에서 그의 존재의 빈도 대비, 유방암을 갖거나, 또는 유방암에 대한 감수성을 갖는 개체(영향받은 개체)에 보다 빈번하게 존재한다. 일부 구체예에서, 상기 하나 이상의 마커 대립인자 또는 일배체형의 연관의 유의성은 0.05 미만의 p 값을 특징으로 한다. 다른 구체예에서, 연관의 유의성은 보다 작은 p-값, 예를 들면, 0.01 미만, 0.001 미만, 0.0001 미만, 0.00001 미만, 0.000001 미만, 0.0000001 미만, 0.00000001 미만 또는 0.000000001 미만의 p-값과 같은 보다 작은 p-값을 특징으로 한다.
이 구체예들에서, 상기 하나 이상의 마커 대립인자 또는 일배체형의 존재는 유방암의 감수성을 나타낸다. 이 진단 방법들은 유방암과 연관된 하나 이상의 마커 대립인자 또는 일배체형의 존재 또는 부재를 검출하는 단계를 포함한다. 본 명세서에 기재된 일배체형은 다양한 유전적 마커(예를 들면, SNP, 마이크로새틀라이트 또는 기타 유전적 변이)에서의 대립인자의 조합을 포함한다. 특정한 일배체형을 구성하는 특정한 유전적 마커 대립인자의 검출은 본 명세서에 기재되고 및/또는 본 발명이 속하는 기술 분야에서 알려진 다양한 방법에 의해 수행될 수 있다. 예를 들면, 유전적 마커는 핵산 수준에서(예를 들면, 직접적인 뉴클레오티드 서열결정에 의해 또는 본 발명이 속하는 기술 분야에서 당업자에게 공지된 다른 수단에 의해) 또는 상기 유전적 마커가 유방암과 연관된 핵산에 의해 코딩된 단백질의 코딩 서열에 영향을 미친다면, 아미노산 수준에서(예를 들면, 단백질 서열결정에 의해 또는 그와 같은 단백질을 인식하는 항체를 이용한 면역분석법에 의해) 검출될 수 있다. 본 발명의 마커 대립인자 또는 일배체형은 유방암과 연관된 게놈 DNA 서열의 단편에 대응된다. 그와 같은 단편은 대상이 되는 다형성 마커 또는 일배체형의 DNA 서열을 포함하나, 또한 상기 마커 또는 일배체형과 강한 LD(linkage disequilibrium)인(예를 들면, 0.1보다 큰 r2 및/또는 0.8보다 큰 |D'|의 값에 의해 결정됨) DNA 세그먼트를 포함할 수 있다.
일 구체예에서, 유방암에 대한 감수성의 진단이 혼성화 방법을 이용하여 달성될 수 있다(모든 보충물(supplement)을 포함한, Current Protocols in Molecular Biology, Ausubel, F. et al., eds., John Wiley & Sons 참조). 테스트 대상 또는 개체로부터의 게놈 DNA, RNA, 또는 cDNA의 생물학적 시료("테스트 시료(test sample)")는 유방암을 갖거나 유방암에 대한 감수성을 갖거나 또는 유방암에 대한 소인을 갖는 것으로 의심되는 개체("테스트 개체(test subject)")로부터 수득된다. 상기 개체는 성인, 아동, 또는 태아일 수 있다. 테스트 시료는 혈액 시료, 양수 시료, 뇌척수액 시료, 또는 피부, 근육, 구강점막, 또는 결막 점막, 태반, 위장관 또는 다른 기관으로부터의 조직 시료와 같은, 게놈 DNA를 포함하는 임의의 출처로부터 유래될 수 있다. 태아 세포 또는 조직으로부터의 DNA의 테스트 시료는 양수 천자 또는 융모막 융모 채취법(chorionic villus sampling)과 같은 적합한 방법에 의해 수득될 수 있다. 그 후, DNA, RNA, 또는 cDNA 시료가 검사된다. 특정한 마커 대립인자의 존재는 상기 특정한 대립인자에 대해 특이적인 핵산 프로브의 서열-특이적 혼성화에 의해 표시될 수 있다. 각각 특정한 대립인자에 대해 특이적인, 여러 개의 서열-특이적 핵산 프로브를 사용하는 것에 의해, 하나 이상의 특정한 마커 대립인자 또는 하나 이상의 특정한 일배체형의 존재가 표시될 수 있다. 일 구체예에서, 일배체형은 특정한 일배체형에 대해 특이적인(즉, 상기 일배체형의 특징적인 특정한 마커 대립인자를 포함하는 DNA 가닥에 특이적으로 혼성화하는) 단일 핵산 프로브에 의해 표시될 수 있다. 서열-특이적 프로브는 게놈 DNA, RNA, 또는 cDNA에 혼성화되도록 지시될 수 있다. 본 명세서에서 사용된, "핵산 프로브(nucleic acid probe)"는 상보적 서열에 혼성화되는 DNA 프로브 또는 RNA 프로브일 수 있다. 본 발명이 속하는 기술 분야의 당업자는 테스트 시료로부터의 게놈 서열에 특정한 대립인자가 존재하는 경우에만 서열 특이적 혼성화가 일어나도록 그와 같은 프로브를 설계하는 방법을 알 것이다. 본 발명은 또한 특정한 다형성 마커의 유전형 분석을 위한 상업적으로 입수가능한 기술 및 방법을 포함한 편리한 유전형분석 방법을 이용하여 실시될 수 있다.
유방암에 대한 감수성을 진단하기 위해, 유방암과 연관된 핵산을 포함하는 테스트 시료, 예를 들면, 게놈 DNA 시료를 하나 이상의 핵산 프로브와 접촉시키는 것에 의해 혼성화 시료가 형성된다. mRNA 또는 게놈 DNA를 검출하기 위한 프로브의 비-한정적인 예는 본 명세서에 기재된 mRNA 또는 게놈 DNA 서열에 혼성화될 수 있는 표지된 핵산 프로브이다. 상기 핵산 프로브는 예를 들면, 전장(full-length) 핵산 분자, 또는 그의 일부, 예를 들면, 적합한 mRNA 또는 게놈 DNA에 엄격한(stringent) 조건 하에 특이적으로 혼성화하기에 충분한 15개 이상, 30개 이상, 50개 이상, 100개 이상, 250개 이상, 또는 500개 이상의 뉴클레오티드로 구성된 길이의 올리고뉴클레오티드일 수 있다. 예를 들면, 핵산 프로브는 선택적으로 본 명세서에 기재된 마커의 하나 이상의 대립인자 또는 본 명세서에 기재된 하나 이상의 일배체형을 포함하는, 표 12, 표 13 및 표 14(서열번호 1 내지 237)에 표시된 마커들을 포함하는 뉴클레오티드 서열 전체 또는 그 일부, 또는 본 명세서에 기재된 FGF10, MRPS30, HCN1 또는 FGFR2 유전자 또는 그의 단편을 포함하는 뉴클레오티드 서열을 포함할 수 있거나, 또는 상기 프로브는 그와 같은 서열의 상보적 서열일 수 있다. 특정한 구체예에서, 상기 핵산 프로브는 선택적으로 본 명세서에 기재된 마커의 하나 이상의 대립인자 또는 본 명세서에 기재된 하나 이상의 다형성 마커, 또는 본 명세서에 기재된 하나 이상의 다형성 마커를 포함하는 일배체형을 포함하는, 표 12, 표 13 및 표 14에 열거된 뉴클레오티드 서열(서열번호 1 내지 237)의 일부, 또는 본 명세서에 기재된, FGF10, MRPS30, HCN1 및 FGFR2 유전자 또는 그의 단편을 포함하는 뉴클레오티드 서열을 포함할 수 있거나, 또는 상기 프로브는 그와 같은 서열의 상보적 서열일 수 있다. 상기 핵산 프로브는 본 발명의 진단 분석법에서 이용하기 위한 다른 적합한 프로브가 본 명세서에 기재된다. 혼성화는 당해 기술 분야의 당업자에게 잘 알려진 방법에 의해 수행될 수 있다(예를 들면, 모든 보충물을 포함한, Current Protocols in Molecular Biology, Ausubel, F. et al., eds., John Wiley & Sons 참조). 일 구체예에서, 혼성화는 특이적 혼성화, 즉, 불일치를 포함하지 않는 혼성화(정확한 혼성화)를 의미한다. 일 구체예에서, 상기 특이적 혼성화를 위한 혼성화 조건은 높은 엄격성이다.
존재하는 경우, 특이적 혼성화는 표준 방법을 이용하여 검출된다. 핵산 프로브와 테스트 시료 내의 핵산 간에 특이적 혼성화가 일어나면, 상기 시료는 상기 핵산 프로브에 존재하는 뉴클레오티드에 상보적인 대립인자를 포함한다. 본 발명의 다른 마커, 또는 본 발명의 일배체형을 구성하는 마커에 대해, 상기 방법이 반복될 수 있거나, 또는 한번에 하나 이상의 마커 대립인자를 검출하기 위해 복수 개의 프로브가 동시에 이용될 수 있다. 특정한 일배체형의 둘 이상의 마커 대립인자를 포함하는 단일 프로브를 설계할 수 있다(예를 들면, 2개, 3개, 4개, 5개, 또는 특정한 일배체형을 구성하는 모든 마커에 상보적인 대립인자를 포함하는 프로브). 시료에서 일배체형의 특정한 마커의 검출은 상기 시료의 원천이 특정한 일배체형(예를 들면, 일배체형)을 가지며 따라서, 유방암에 대해 감수성을 갖는다는 것을 나타낸다.
하나의 바람직한 구체예에서, Kutyavin et al. (Nucleic Acid Res. 34:e128 (2006))에 기재된 바와 같이, 그의 3' 말단에 있는 형광 모이어티(fluorescent moiety) 또는 그룹 및 그의 5' 말단에 있는 퀀처(quencher)를 포함하는 검출 올리고뉴클레오티드 및 인핸서 올리고뉴클레오티드를 이용하는 방법이 적용될 수 있다. 형광 모이어티는 Gig Harbor Green 또는 Yakima Yellow, 또는 다른 적합한 형광 모이어티일 수 있다. 검출 프로브는 검출대상 SNP 다형성을 포함하는 짧은 뉴클레오티드 서열에 혼성화되도록 설계된다. 바람직하게는, 상기 SNP는 검출 프로브의 말단 잔기부터 3' 말단으로부터의 -6 잔기까지 중에 존재한다. 인핸서는 검출 프로브에 대해 3'인 DNA 주형에 혼성화되는 짧은 올리고뉴클레오티드 프로브이다. 상기 프로브들은 검출 프로브와 인핸서 뉴클레오티드 프로브가 모두 주형에 결합된 경우, 상기 검출 프로브와 인핸서 뉴클레오티드 프로브 간에 단일 뉴클레오티드 갭이 존재하도록 설계된다. 상기 갭은 엔도뉴클레아제 IV와 같은, 엔도뉴클레아제에 의해 인식되는 합성 탈염기 부위(synthetic abasic site)를 생성한다. 상기 효소는 완전히 상보적인 검출 프로브로부터 염료를 절단하나, 불일치를 포함하는 검출 프로브는 절단할 수 없다. 따라서, 방출된 형광 모이어티의 형광을 측정하는 것에 의해, 검출 프로브의 뉴클레오티드 서열에 의해 정의된 특정한 대립인자의 존재의 평가가 수행될 수 있다.
검출 프로브는 임의의 적합한 크기일 수 있으나, 바람직하게는 프로브는 비교적 짧다. 일 구체예에서, 상기 프로브는 길이가 5개 내지 100개의 뉴클레오티드로 구성된다. 또 다른 구체예에서, 상기 프로브는 길이가 10개 내지 50개의 뉴클레오티드로 구성되고, 또 다른 구체예에서, 상기 프로브는 길이가 12개 내지 30개의 뉴클레오티드로 구성된다. 다른 길이의 프로브들도 가능하고 본 발명이 속하는 기술 분야의 평균적인 당업자의 기술의 범위 내에 속한다.
바람직한 구체예에서, SNP 다형성을 포함하는 DNA 주형은 검출 전에 중합효소 연쇄 반응(PCR)에 의해 증폭된다. 그와 같은 구체예에서, 증폭된 DNA가 검출 프로프 및 인핸서 프로브에 대한 주형으로 기능한다.
검출 프로브, 인핸서 프로브, 및/또는 PCR에 의한 주형의 증폭을 위해 이용되는 프라이머의 특정한 구체예는 변형된 A 및 변형된 G를 포함한, 변형된 염기의 이용을 포함한다. 변형된 염기의 이용은 주형 DNA에 대한 뉴클레오티드 분자(프로브 및/또는 프라이머)의 용융점을 조정하기 위해, 예를 들면, 상보적인 T와 세개의 수소 결합을 형성할 수 있는 능력을 갖는 변형된 A가 이용될 수 있는, 낮은 비율의 G 또는 C 염기를 포함하는 영역에서 용융점을 높이기 위해, 또는 예를 들면, 상보적인 C와 두 개의 수소 결합만을 형성하는 변형된 G 염기를 이용하는 것에 의해, 높은 비율의 G 또는 C 염기를 포함하는 영역에서 용융점을 낮추기 위해 유용할 수 있다. 바람직한 구체예에서, 검출 뉴클레오티드 프로브의 설계에서 변형된 염기들이 이용된다. 당업자에게 알려진 임의의 변형된 염기가 이 방법에서 선택될 수 있고, 적합한 염기의 선택은 본 명세서의 교시 및 당업자에게 알려진 상업적 출처로부터 이용가능한 공지된 염기에 근거하여 당업자의 범위 내에 속한다.
추가적으로, 또는 대안적으로, 펩티드 핵산(peptide nucleic acid, PNA)이 본 명세서에 기재된 혼성화 방법에서 핵산 프로브에 추가하여, 또는 핵산 프로브 대신에 이용될 수 있다. PNA는 유기 염기 (A, G, C, T 또는 U)가 메틸렌 카르보닐 링커를 통해 글리신 질소에 결합된, N-(2-아미노에틸)글리신 유닛과 같은, 펩티드-유사 무기 백본(peptide-like inorganic backbone)을 갖는 DNA 모방체(mimic)이다(예를 들면, Nielsen, P., et al., Bioconjug. Chem. 5:3-7 (1994) 참조). PNA 프로브는 유방암과 연관된 하나 이상의 마커 대립인자 또는 일배체형을 포함하는 것으로 사료되는 시료 내의 분자에 특이적으로 혼성화하도록 설계될 수 있다. 따라서, PNA 프로브의 혼성화는 유방암 또는 유방암에 대한 감수성을 진단할 수 있다.
본 발명의 일 구체예에서, 개체로부터 수득된 게놈 DNA를 포함하는 테스트 시료가 수집되고 본 발명의 하나 이상의 마커 또는 일배체형을 포함하는 단편을 증폭시키기 위해 중합효소 연쇄 반응(PCR)이 이용된다. 본 명세서에 기재된 바와 같이, 유방암과 연관된 특정한 마커 대립인자 또는 일배체형의 확인은 다양한 방법(예를 들면, 서열 분석, 제한효소 처리에 의한 분석, 특이적 혼성화, SSCP(single stranded conformation polymorphism), 전기영동 분석 등)을 이용하여 수행될 수 있다. 또 다른 구체예에서, 진단은 정량적 PCR(kinetic thermal cycling)을 이용한 발현 분석에 의해 수행된다. 이 기법은 예를 들면, TaqMan®(Applied Biosystems, Foster City, CA)과 같은 상업적으로 이용가능한 기술을 이용할 수 있다. 상기 기법은 유방암과 연관된 핵산에 의해 코딩된 폴리펩티드 또는 스플라이싱 변이(splicing variant)의 발현 또는 조성의 변화의 존재를 평가할 수 있다. 또한, 변이의 발현은 물리적으로 또는 기능적으로 상이한 것으로 정량될 수 있다.
본 발명의 또 다른 방법에서, 특정한 대립인자가 기준 서열 대비 제한효소 인식 부위의 생성 또는 제거를 초래하는 경우, 제한효소 처리(restriction digestion)에 의한 분석이 상기 특정한 대립인자를 검출하기 위해 이용될 수 있다. 게놈 DNA를 포함하는 테스트 시료가 개체로부터 수득된다. RFLP(Restriction fragment length polymorphism) 분석은 예를 들면, 전술된 Current Protocols in Molecular Biology에 기재된 바와 같이 수행될 수 있다. 관련된 DNA 단편의 제한효소 처리의 결과 패턴(digestion pattern)이 시료 중의 특정한 대립인자의 존재 또는 부재를 나타낸다.
유방암과 연관된 특정한 대립인자 또는 다형성(예를 들면, 표 12, 표 13 및 표 14(서열번호 1 내지 237)의 다형성 마커들 및 이들과 연관 불균형인 마커들)을 검출하기 위해, 서열 분석이 또한 이용될 수 있다. 따라서, 일 구체예에서, 특정한 마커 대립인자 또는 일배체형의 존재 또는 부재의 결정은 대상 또는 개체로부터 수득된 DNA 또는 RNA의 테스트 시료의 서열 분석을 포함한다. PCR 또는 다른 적합한 방법이 유방암과 연관된 핵산의 일부를 증폭시키기 위해 이용될 수 있고, 그 후, 특정한 대립인자의 존재가 직접 시료 중의 게놈 DNA의 다형성 부위(또는 일배체형 내의 복수 개의 다형성 부위들)의 서열을 결정하는 것에 의해 검출될 수 있다.
대립인자-특이적 올리고뉴클레오티드가 또한 대립인자-특이적 올리고뉴클레오티드(ASO) 프로브에 의한 증폭된 올리고뉴클레오티드의 도트-블롯 혼성화를 통해 유방암-연관 핵산(예를 들면, 표 12, 표 13 및 표 14(서열번호 1 내지 237)의 다형성 마커들 및 이들과 연관 불균형인 마커들)에서 특정한 대립인자의 존재를 검출하기 위해 이용될 수 있다(예를 들면, Saiki, R. et al., Nature, 324:163-166 (1986) 참조). "대립인자-특이적 올리고뉴클레오티드(allele-specific oligonucleotide)"(본 명세서에서 "대립인자-특이적 올리고뉴클레오티드 프로브"로도 지칭됨)는 유방암-연관 핵산에 특이적으로 혼성화하고, 다형성 부위(예를 들면, 본 명세서에 기재된 마커 또는 일배체형)에 특이적 대립인자를 포함하는, 약 10-50 bp(base pairs) 또는 약 15-30 bp의 올리고뉴클레오티드이다. 하나 이상의 특정한 유방암-연관 핵산에 대해 특이적인 대립인자-특이적 올리고뉴클레오티드는 표준 방법을 이용하여 제조될 수 있다(예를 들면, Current Protocols in Molecular Biology, supra 참조). 원하는 영역을 증폭시키기 위해 PCR이 이용될 수 있다. 증폭된 영역을 함유한 DNA가 표준 방법(예를 들면, Current Protocols in Molecular Biology, supra 참조)을 이용하여 도트-블롯팅될 수 있고, 상기 블롯이 올리고뉴클레오티드 프로브와 접촉될 수 있다. 그 후, 상기 프로브의 증폭된 영역에 대한 특이적 혼성화의 존재가 검출될 수 있다. 개체로부터의 DNA에 대한 대립인자-특이적 올리고뉴클레오티드 프로브의 특이적 혼성화는 유방암을 포함한 암과 연관된 다형성 분위에 특이적 대립인자를 나타낸다(예를 들면, Gibbs, R. et al., Nucleic Acids Res., 17:2437-2448 (1989) 및 WO 93/22456 참조).
LNA(locked nucleic acid)와 같은 유사체의 첨가로, 프라이머 및 프로브의 크기가 8개의 염기까지 감소될 수 있다. LNA는 푸라노오스 고리의 2' 및 4' 위치가 O-메틸렌(옥시-LNA), S-메틸렌(티오-LNA), 또는 아미노 메틸렌(아미노-LNA) 모이어티를 통해 연결되는 것인 이중고리형(bicyclic) DNA 유사체의 신규한 종류이다. 모든 이 LNA 변이에 공통된 것은 상보적 핵산에 대한 친화도이고, 이는 DNA 유사체에 대해 보고된 가장 높은 친화도이다. 예를 들면, 특정한 모든 옥시-LNA 노나머(nonamer)는 상응하는 DNA 노나머에 대한 DNA 및 RNA 모두에 대한 28℃ 대비, 상보적인 DNA 또는 RNA와 결합된 경우, 64℃ 및 74℃의 용융점(Tm)을 갖는 것으로 확인되었다. Tm의 실질적인 증가는 또한 LNA 단량체가 표준 DNA 또는 RNA 단량체와 조합되어 이용되는 경우 수득된다. 프라이머 및 프로브의 경우, LNA 단량체가 포함되는 위치(예를 들면, 3' 말단, 5' 말단, 또는 중간)에 따라, Tm은 상당히 증가될 수 있다.
또 다른 구체예에서, 개체로부터의 표적 핵산 서열 세그먼트에 상보적인 올리고뉴클레오티드 프로브의 어레이(array)가 유방암과 연관된 핵산에서 다형성을 식별하기 위해 이용될 수 있다(예를 들면, 표 12, 표 13 및 표 14의 다형성 마커들(서열번호 1 내지 237) 및 이들과 연관 불균형인 마커들). 예를 들면, 올리고뉴클레오티드 어레이가 이용될 수 있다. 올리고뉴클레오티드 어레이는 일반적으로 상이한 공지된 위치에 있는 기판(substrate)의 표면에 결합된 복수 개의 상이한 올리고뉴클레오티드 프로브를 포함한다. "Genechips™"에도 기재된, 이 올리고뉴클레오티드 어레이들은 본 발명이 속하는 기술 분야에서 일반적으로 설명된다(예를 들면, 미국특허 제5,143,854호, PCT 특허출원 공개 WO90/15070 및 92/10092 참조). 이 어레이들은 일반적으로 포토리소그래피 방법과 고상 올리고뉴클레오티드 합성 방법의 조합을 포함하는 기계적 합성 방법, 또는 본 발명이 속하는 기술 분야의 당업자에게 공지된 다른 방법을 이용하여 생산된다(각각의 전체 교시가 참조에 의해 본 명세서에 포함된, Bier, F. F., et al., Adv Biochem Eng Biotechnol, 109:433-54 (2008); Hoheisel, J.D., Nat Rev Genet 7:200-10(2006); Fan, J.B., et al., Methods Enzymol 410:57-73(2006); Raquossis, J & Elvidge, G., Expert Rev Mol Diagn 6:145-52(2006); Mockler, T.C., et al Genomics 85: 1-15(2005), 및 인용된 참조 문헌 참조). 다형성의 검출을 위한 올리고뉴클레오티드 어레이의 제조 및 이용의 추가적인 설명이 예를 들면, 전체 교시가 참조에 의해 본 명세서에 포함된 미국특허 제6,858,394호, 제6,429,027호, 제5,445,934호, 제5,700,637호, 제5,744,305호, 제5,945,334호, 제6,054,270호, 제6,300,063호, 제6,733,977호, 제7,364,858호, 유럽특허 제619 321호, 및 제373 203호에서 탁을 수 있다.
본 발명이 속하는 기술 분야의 당업자에게 이용가능한 핵산 분석의 다른 방법들이 유방암과 연관된 다형성 부위에서 특정한 대립인자를 검출하기 위해 이용될 수 있다. 대표적인 방법들은 예를 들면, 직접적인 수동 서열결정(direct manual sequencing) (Church and Gilbert, Proc. Natl. Acad. Sci. USA, 81: 1991-1995 (1988); Sanger, F., et al., Proc. Natl. Acad. Sci. USA, 74:5463-5467 (1977); Beavis, et al., U.S. Patent No. 5,288,644); 자동화된 형광 서열결정(automated fluorescent sequencing); 단일가닥 구조 다형성(SSCP) 분석; CDGE(clamped denaturing gel electrophoresis); DGGE(denaturing gradient gel electrophoresis) (Sheffield, V., et al., Proc. Natl. Acad. Sci. USA, 86:232-236 (1989)), 운동성 변화 분석(mobility shift analysis)(Orita, M., et al., Proc. Natl. Acad. Sci. USA, 86:2766-2770 (1989)), 제한효소 분석(Flavell, R., et al., Cell, 15:25-41 (1978); Geever, R., et al., Proc. Natl. Acad. Sci. USA, 78:5081-5085 (1981)); 헤테로듀플렉스(heteroduplex) 분석; 화학적 불일치 절단(chemical mismatch cleavage, CMC) (Cotton, R., et al., Proc. Natl. Acad. Sci. USA, 85:4397-4401 (1985)); RNase 보호 분석(Myers, R., et al., Science, 230:1242-1246 (1985); E. coli mutS 단백질과 같은, 뉴클레오티드 불일치를 인식하는 폴리펩티드의 이용; 및 대립인자-특이적 PCR을 포함한다.
본 발명의 또 다른 구체예에서, 유방암 또는 유방암에 대한 감수성의 진단은 본 발명의 유전적 마커(들) 또는 일배체형(들)이 폴리펩티드의 조성 또는 발현의 변화를 초래하는 경우들에서, 유방암과 연관된 핵산에 의해 코딩된 폴리펩티드의 발현 및/또는 조성을 조사하는 것에 의해 수행될 수 있다. 따라서, 유방암에 대한 감수성의 진단은 본 발명의 유전적 마커 또는 일배체형이 폴리펩티드(예를 들면, FGF10, MRPS30, HCN1 및 FGFR2 유전자 중 하나 이상) 조성 또는 발현의 변화를 초래하는 경우, 이들 중 하나의 폴리펩티드, 또는 유방암과 연관된 핵산에 의해 코딩되는 또 다른 폴리펩티드의 발현 및/또는 조성을 조사하는 것에 의해 수행될 수 있다. 유방암에 대해 연관을 보이는 본 발명의 일배체형 및 마커들은 하나 이상의 인접 유전자(nearby gene)에 대한 효과를 통해 역할을 수행한다. 이 유전자들에 영향을 미치는 가능한 메카니즘은 예를 들면, 전사에 대한 효과, RNA 스플라이싱에 대한 효과, mRNA의 대안적인 스플라이스(alternative splice) 형태의 상대적 양의 변화, RNA 안정성에 대한 효과, 핵으로부터 세포질로의 이동에 대한 효과, 및 번역의 효율성 및 정확성에 대한 효과를 포함한다.
따라서, 또 다른 구체예에서, 유방암에 대한 연관을 보이는 본 발명의 변이(마커 또는 일배체형)가 인접 유전자의 발현에 영향을 미친다. 유전자 발현에 영향을 미치는 조절성 요소(regulatory element)가 유전자의 프로모터 영역으로부터 멀리 떨어져서, 수십 킬로베이스 또는 심지어 수백 킬로베이스 떨어져서 위치할 수 있다는 것이 잘 알려져 있다. 본 발명의 하나 이상의 다형성 마커의 하나 이상의 대립인자의 존재 또는 부재를 분석하는 것에 의해, 따라서, 그와 같은 인접한 유전자의 발현 수준을 평가할 수 있다. 따라서, 본 발명의 마커 또는 일배체형의 검출이 하나 이상의 FGF10, MRPS30, HCN1 및 FGFR2 유전자의 발현을 평가하기 위해 이용될 수 있다.
ELISA(enzyme linked immunosorbent assay), 웨스턴 블롯(Western blot), 면역침전(immunoprecipitation) 및 면역형광(immunofluorescence)을 포함한 다양한 방법들이 단백질 발현 수준을 검출하기 위해 이용될 수 있다. 개체로부터의 테스트 시료가 유방암과 연관된 핵산에 의해 코딩되는 폴리펩티드의 발현의 변화 및/또는 그의 조성의 변화의 존재에 대해 평가된다. 유방암과 연관된 핵산에 의해 코딩되는 폴리펩티드의 발현의 변화가 예를 들면, 정량적인 폴리펩티드 발현(즉, 생성되는 폴리펩티드의 양)의 변화일 수 있다. 유방암과 연관된 핵산에 의해 코딩되는 폴리펩티드의 조성의 변화는 정성적 폴리펩티드 발현의 변화(예를 들면, 돌연변이 폴리펩티드의 발현 또는 상이한 스플라이싱 변이의 발현)이다. 일 구체예에서, 유방암에 대한 감수성의 진단은 유방암과 연관된 핵산(예를 들면, FGF10, MRPS30, 및 HCN1을 코딩하는 핵산)에 의해 코딩되는 특정한 스플라이싱 변이, 또는 스플라이싱 변이의 특정한 패턴을 검출하는 것에 의해 수행된다.
또한, 그와 같은 변화(정량적 및 정성적 변화)가 모두 존재할 수 있다. 본 명세서에서 사용된 폴리펩티드 발현 또는 조성의 "변화(alteration)"는 대조군 시료에서 상기 폴리펩티드의 발현 또는 조성 대비, 테스트 시료 중의 발현 또는 조성의 변화를 의미한다. 대조군 시료는 테스트 시료에 상응하는 시료(예를 들면, 동일한 종류의 세포로부터 유래된 시료)이고, 유방암에 의해 영향받지 않고 및/또는 유방암에 대한 감수성을 갖지 않는 개체로부터 유래된다. 일 구체예에서, 대조군 시료는 본 명세서에 기재된 유방암과 연관된 마커 대립인자 또는 일배체형을 갖지 않는 개체로부터 유래된다. 유사하게, 대조군 시료 대비, 테스트 시료 중에 하나 이상의 상이한 스플라이싱 변이의 존재, 또는 대조군 시료 대비, 테스트 시료 중의 상이한 스플라이싱 변이의 유의성 있게 상이한 양의 존재는 유방암에 대한 감수성을 나타낼 수 있다. 대조군 시료 대비, 테스트 시료 중의 폴리펩티드의 발현 또는 조성의 변화는 특정한 대립인자가 대조군 시료 중의 기준 대비 스플라이스 위치를 변화시키는 경우, 상기 특정한 대립인자를 나타낼 수 있다. 분광분석법, 비색법(colorimetry), 전기영동, 등전점 전기영동법(isoelectric focusing), 및 면역블롯팅(immunoblotting)(예를 들면, 전술된 바와 같은, Current Protocols in Molecular Biology, 특히, 챕터 10 참조)과 같은 면역분석법(immunoassays)(예를 들면, David et al., 미국특허 제4,376,110호)을 포함한, 핵산에 의해 코딩된 폴리펩티드의 발현 또는 조성을 조사하는 다양한 수단이 본 발명이 속하는 기술 분야의 당업자에게 알려져 있고, 이용될 수 있다.
예를 들면, 일 구체예에서, 유방암과 연관된 핵산에 의해 코딩되는 폴리펩티드에 결합할 수 있는 항체(예를 들면, 검출가능한 표지를 갖는 항체)가 이용될 수 있다. 항체는 다중클론 항체 또는 단일클론 항체일 수 있다. 완전한 항체, 또는 그의 단편(예를 들면, Fv, Fab, Fab', F(ab')2)이 이용될 수 있다. 프로브 또는 항체에 대해, 용어 "표지된(labeled)"은 검출가능한 물질을 프로브 또는 항체에 결합(즉, 물리적 연결)시키는 것에 의한 프로브 또는 항체의 직접적인 표지화, 및 직접적으로 표지된 또 다른 시약과의 반응성에 의한 프로브 또는 항체의 간접적 표지화를 포함하도록 의도된다. 간접적 표지화의 예는 표지된 이차 항체(예를 들면, 형광-표지된 이차 항체)를 이용한 일차 항체의 검출 및 형광-표지된 스트렙타비딘에 의해 검출될 수 있는, 비오틴에 의한 DNA 프로브의 말단-표지화(end-labeling)를 포함한다.
이 방법의 일 구체예에서, 테스트 시료 중의 유방암과 연관된 핵산(예를 들면, FGF10, MRPS30, 및 HCN1)에 의해 코딩된 폴리펩티드의 수준 또는 양이 대조군 시료 중의 유방암과 연관된 핵산에 의해 코딩된 폴리펩티드의 수준 또는 양과 비교된다. 대조군 시료 중의 폴리펩티드의 수준 또는 양보다 더 높거나 또는 더 낮고, 그 차이가 통계적으로 유의성이 있는, 테스트 시료 중의 폴리펩티드의 수준 또는 양은 상기 핵산에 의해 코딩되는 폴리펩티드의 발현의 변화를 나타내고 발현의 차이를 유발하는 특정한 대립인자 또는 일배체형의 존재를 나타낸다. 대안적으로, 테스트 시료 중의 폴리펩티드의 조성이 대조군 시료 중의 상기 폴리펩티드의 조성과 비교된다. 또 다른 구체예에서, 폴리펩티드의 수준 또는 양과 조성이 모두 테스트 시료 및 대조군 시료에서 평가될 수 있다.
또 다른 구체예에서, 유방암에 대한 감수성의 진단은 추가적인 단백질-기반 분석법, RNA-기반 분석법 또는 DNA-기반 분석법과 조합하여, 하나 이상의 본 발명의 마커 대립인자 또는 일배체형(예를 들면, 표 12, 표 13 및 표 14에 열거된 마커(서열번호 1 내지 237)의 마커 및 이들과 연관 불균형인 마커의 연관된 대립인자)을 검출하는 것에 의해 수행된다. 본 발명의 방법은 또한 대상 개체의 가족력 및 위험 인자(예를 들면, 환경적 위험 인자, 생활방식 위험 인자)의 분석과 조합되어 이용될 수 있다.
키트
본 발명의 방법에서 유용한 키트는 본 명세서에 기재된 방법에서 유용한 성분들, 예를 들면, 핵산 증폭용 프라이머, 혼성화 프로브, 제한효소(예를 들면, RFLP 분석용 제한효소), 대립인자-특이적 올리고뉴클레오티드, 본 명세서에 기재된 본 발명의 핵산(예를 들면, 본 발명의 하나 이상의 다형성 마커 및/또는 일배체형을 포함하는 게놈 단편)에 의해 코딩된 변화된 폴리펩티드에 결합하는 항체 또는 본 명세서에 기재된 본 발명의 핵산에 의해 코딩된 변화되지 않은(원형의) 폴리펩티드에 결합하는 항체, 유방암과 연관된 핵산의 증폭을 위한 수단, 유방암과 연관된 핵산의 핵산 서열을 분석하기 위한 수단, 유방암과 연관된 핵산에 코딩되는 폴리펩티드의 아미노산 서열을 분석하기 위한 수단, 등을 포함한다. 본 발명의 키트는 예를 들면, 필요한 완충액, 본 발명의 핵산(예를 들면, 본 명세서에 기재된 하나 이상의 다형성 마커를 포함하는 핵산 세그먼트)을 증폭하기 위한 핵산 프라이머, 및 그와 같은 프라이머 및 필요한 효소(예를 들면, DNA 중합효소)를 이용하여 증폭된 단편의 대립인자-특이적 검출을 위한 시약을 포함할 수 있다. 추가적으로, 키트는 본 발명의 방법과 조합되어 이용될 수 있는 분석법을 위한 시약들, 예를 들면, 본 명세서에 기재된 유방암 진단 분석법에서 이용되는 시약을 제공할 수 있다.
일 구체예에서, 본 발명은 유방암, 또는 유방암에 대한 감수성을 검출하기 위해, 개체로부터의 시료를 분석하는 키트로서, 상기 키트는 상기 개체의 게놈에서 본 발명의 하나 이상의 다형성의 하나 이상의 대립인자를 선택적으로 검출하기 위해 필요한 시약들을 포함하는 것인 키트에 관한 것이다. 특정한 구체예에서, 상기 시약은 본 발명의 하나 이상의 다형성을 포함하는 개체의 게놈의 단편에 혼성화하는 하나 이상의 연속적인 올리고뉴클레오티드(contiguous oligonucleotide)를 포함한다. 또 다른 구체예에서, 상기 시약은 개체로부터 수득된 게놈 세그먼트의 반대쪽 가닥에 혼성화하는 한 쌍 이상의 올리고뉴클레오티드를 포함하고, 상기 각 올리고뉴클레오티드 프라이머 쌍은 하나 이상의 다형성을 포함하는 개체의 게놈의 단편을 선택적으로 증폭시키도록 설계되며, 상기 다형성은 표 12, 표 13 및 표 14에 열거된 다형성(서열번호 1 내지 237) 및 이들과 연관 불균형인 다형성 마커로 구성된 군으로부터 선택된다. 또 다른 구체예에서, 상기 단편은 크기가 20 bp 이상이다. 그와 같은 올리고뉴클레오티드 또는 핵산(예를 들면, 올리고뉴클레오티드 프라이머)은 유방암을 나타내는 다형성(예를 들면, SNP 또는 마이크로새틀라이트)을 둘러싼(flanking) 핵산 서열의 부분을 이용하여 설계될 수 있다. 또 다른 구체예에서, 상기 키트는 유방암과 연관된 하나 이상의 특정한 다형성 마커 또는 일배체형을 대입인자-특이적으로 검출할 수 있는 하나 이상의 표지된 핵산, 및 상기 표지의 검출을 위한 시약을 포함한다. 적합한 표지는 예를 들면, 방사성동위원소, 형광 표지, 효소 표지, 효소 보조-인자(co-factor) 표지, 자성 표지(magnetic label), 스핀 표지(spin label), 에피토프 표지(epitope label)를 포함한다.
특정한 구체예에서, 본 발명의 키트의 시약에 의해 검출될 다형성 마커 또는 일배체형은 표 12, 표 13 및 표 14에 표시된 마커들로 구성된 군으로부터 선택된, 하나 이상의 마커, 두개 이상의 마커, 세개 이상의 마커, 네개 이상의 마커, 또는 다섯개 이상의 마커를 포함한다. 또 다른 구체예에서, 검출될 마커는 마커 rs10941679, rs7703618, rs4415084, rs2067980, rs10035564, rs11743392, rs7716600 및 rs1219648로부터 선택된다. 또 다른 구체예에서, 검출될 마커 또는 일배체형은 표 12, 표 13 및 표 14에 표시된 마커들로 구성된 마커들의 군으로부터의 하나 이상의 마커와 0.2보다 큰 r2 값에 의해 정의된 강한 연관 불균형인 마커들의 군으로부터 선택된 하나 이상의 마커를 포함한다. 또 다른 구체예에서, 검출될 마커 또는 일배체형은 마커 rs10941679, rs7703618, rs4415084, rs2067980, rs10035564, rs11743392, rs7716600 및 rs1219648 및 이들과 연관 불균형인 마커들로 구성된 마커들의 군으로부터 선택된 하나 이상의 마커를 포함한다.
하나의 바람직한 구체예에서, 본 발명의 마커를 검출하기 위한 키트는 검출될 SNP 다형성을 포함하는 주형 DNA의 세그먼트에 혼성화되는 검출 올리고뉴클레오티드 프로브, 인핸서 올리고뉴클레오티드 프로브 및 엔도뉴클레아제를 포함한다. 상기 검출 올리고뉴클레오티드 프로브는 그의 3' 말단에 있는 형광 모이어티(fluorescent moiety) 또는 그룹 및 그의 5' 말단에 있는 퀀처(quencher)를 포함하고, Kutyavin et al. (Nucleic Acid Res. 34:e128 (2006))에 기재된 바와 같은 인핸서 올리고뉴클레오티드가 이용된다. 형광 모이어티는 Gig Harbor Green 또는 Yakima Yellow, 또는 다른 적합한 형광 모이어티일 수 있다. 검출 프로브는 검출대상 SNP 다형성을 포함하는 짧은 뉴클레오티드 서열에 혼성화되도록 설계된다. 바람직하게는, 상기 SNP는 검출 프로브의 말단 잔기부터 3' 말단으로부터의 -6 잔기까지 중에 존재한다. 인핸서는 검출 프로브에 대해 3'인 DNA 주형에 혼성화되는 짧은 올리고뉴클레오티드 프로브이다. 상기 프로브들은 검출 프로브와 인핸서 뉴클레오티드 프로브가 모두 주형에 결합된 경우, 상기 검출 프로브와 인핸서 뉴클레오티드 프로브 간에 단일 뉴클레오티드 갭이 존재하도록 설계된다. 상기 갭은 엔도뉴클레아제 IV와 같은, 엔도뉴클레아제에 의해 인식되는 합성 탈염기 부위(synthetic abasic site)를 생성한다. 상기 효소는 완전히 상보적인 검출 프로브로부터 염료를 절단하나, 불일치를 포함하는 검출 프로브는 절단할 수 없다. 따라서, 방출된 형광 모이어티의 형광을 측정하는 것에 의해, 검출 프로브의 뉴클레오티드 서열에 의해 정의된 특정한 대립인자의 존재의 평가가 수행될 수 있다.
검출 프로브는 임의의 적합한 크기일 수 있으나, 바람직하게는 프로브는 비교적 짧다. 일 구체예에서, 상기 프로브는 길이가 5개 내지 100개의 뉴클레오티드로 구성된다. 또 다른 구체예에서, 상기 프로브는 길이가 10개 내지 50개의 뉴클레오티드로 구성되고, 또 다른 구체예에서, 상기 프로브는 길이가 12개 내지 30개의 뉴클레오티드로 구성된다. 다른 길이의 프로브들도 가능하고 본 발명이 속하는 기술 분야의 평균적인 당업자의 기술의 범위 내에 속한다.
바람직한 구체예에서, SNP 다형성을 포함하는 DNA 주형은 검출 전에 중합효소 연쇄 반응(PCR)에 의해 증폭되고, 그와 같은 증폭을 위한 프라이머가 상기 시약 키트에 포함된다. 그와 같은 구체예에서, 증폭된 DNA가 검출 프로프 및 인핸서 프로브에 대한 주형으로 기능한다.
검출 프로브, 인핸서 프로브, 및/또는 PCR에 의한 주형의 증폭을 위해 이용되는 프라이머의 특정한 구체예는 변형된 A 및 변형된 G를 포함한, 변형된 염기의 이용을 포함한다. 변형된 염기의 이용은 주형 DNA에 대한 뉴클레오티드 분자(프로브 및/또는 프라이머)의 용융점을 조정하기 위해, 예를 들면, 상보적인 T와 세개의 수소 결합을 형성할 수 있는 능력을 갖는 변형된 A가 이용될 수 있는, 낮은 비율의 G 또는 C 염기를 포함하는 영역에서 용융점을 높이기 위해, 또는 예를 들면, 상보적인 C와 두 개의 수소 결합만을 형성하는 변형된 G 염기를 이용하는 것에 의해, 높은 비율의 G 또는 C 염기를 포함하는 영역에서 용융점을 낮추기 위해 유용할 수 있다. 바람직한 구체예에서, 검출 뉴클레오티드 프로브의 설계에서 변형된 염기들이 이용된다. 당업자에게 알려진 임의의 변형된 염기가 이 방법에서 선택될 수 있고, 적합한 염기의 선택은 본 명세서의 교시 및 당업자에게 알려진 상업적 출처로부터 이용가능한 공지된 염기에 근거하여 당업자의 범위 내에 속한다.
그와 같은 구체예 중 하나에서, 상기 마커 또는 일배체형의 존재는 유방암에 대한 감수성(증가된 감수성 또는 감소된 감수성)을 나타낸다. 또 다른 구체예에서, 상기 마커 또는 일배체형의 존재는 유방암 치료제에 대한 반응을 나타낸다. 또 다른 구체예에서, 상기 마커 또는 일배체형의 존재는 유방암 예후를 나타낸다. 또 다른 구체예에서, 상기 마커 또는 일배체형의 존재는 유방암 치료의 진행을 나타낸다. 그와 같은 치료는 수술에 의한 개입, 투약, 방사선요법 또는 기타 수단(예를 들면, 생활방식 변화)을 포함할 수 있다.
치료제
본 발명의 변이(예를 들면, 본 발명의 마커 및/또는 일배체형, 예를 들면, 표 12, 표 13 및 표 14에 열거된 마커들, 예를 들면, rs4415084, rs10941679, rs1219648)는 유방암에 대한 신규한 치료제 표적을 확인하기 위해 이용될 수 있다. 예를 들면, 유방암과 연관된 변이(마커 및/또는 일배체형)를 포함하는 유전자 또는 상기 변이와 연관 불균형인 유전자(예를 들면, FGF10, MRPS30, HCN1 and FGFR2 genes), 또는 그들의 산물, 및 이 변이 유전자들 또는 그들의 산물에 의해 직접적으로 또는 간접적으로 조절되거나 또는 이들과 상호작용하는 유전자 또는 그들의 산물이 유방암을 치료하는 치료제의 개발을 위해 표적화될 수 있다. 치료제는 하나 이상의, 예를 들면, 표적 유전자 또는 그들의 유전자 산물의 기능 및/또는 수준을 조절할 수 있는, 작은 비-단백질(non-protein) 및 비-핵산 분자, 단백질, 펩티드, 단백질 단편, 핵산(DNA, RNA), PNA(peptide nucleic acid), 또는 그들의 유도체 또는 모방체(mimetics)를 포함할 수 있다.
본 발명의 핵산 및/또는 변이(예를 들면, 서열번호 1 내지 237 중 하나에 표시된 서열을 갖는 핵산, 또는 그의 단편), 또는 그들의 상보적 서열을 포함하는 핵산이 세포, 조직 또는 기관에서 유전자 발현을 조절하기 위한 안티센스 구조물(antisense construct)로서 이용될 수 있다. 안티센스 기법과 연관된 방법은 당업자에게 잘 알려져 있고, AntisenseDrug Technology: Principles, Strategies, and Applications, Crooke, ed., Marcel Dekker Inc., New York (2001)에서 설명되고 검토된다. 일반적으로, 안티센스 핵산 분자는 유전자에 의해 발현되는 mRNA의 영역에 상보적이도록 설계되어, 상기 안티센스 분자가 mRNA에 혼성화되고, 따라서, 상기 mRNA의 단백질로의 번역을 차단한다. 절단제(cleaver) 및 차단제(blocker)를 포함한, 여러 종류의 안티센스 올리고뉴클레오티드가 본 발명이 속하는 기술 분야의 당업자에게 알려져 있다. 전자, 즉, 절단제는 표적 RNA 부위에 결합하고, 상기 표적 RNA를 절단하는, 세포내 뉴클레아제(예를 들면, RnaseH 또는 Rnase L)를 활성화시킨다. 차단제는 표적 RNA에 결합하고, 리보좀의 입체 장애(steric hindrance)에 의해 단백질 번역을 저해한다. 차단제의 예는 핵산, 모르폴리노 화합물, LNA(locked nucleic acid) 및 메틸포스포네이트를 포함한다(Thompson, Drug Discovery Today, 7:912-917 (2002)). 안티센스 올리고뉴클레오티드는 직접적으로 치료제로서 유용하고, 또한 예를 들면, 유전자 넉-아웃(knock-out) 또는 유전자 넉-다운 실험에 의해, 유전자 기능을 결정하고 검증하기 위해 유용하다. 안티센스 기술은 Lavery et al., Curr. Opin. Drug Discov. Devel. 6:561-569 (2003), Stephens et al., Curr. Opin. Mol. Ther. 5:118-122 (2003), Kurreck, Eur. J. Biochem. 270:1628-44 (2003), Dias et al., Mol. Cancer Ter. 1:347-55 (2002), Chen, Methods Mol. Med. 75:621-636 (2003), Wang et al., Curr. Cancer Drug Targets 1:177-96 (2001), 및 Bennett, Antisense Nucleic Acid Drug.Dev. 12:215-24 (2002)에 더 설명된다.
본 명세서에 기재된 변이는 특정한 변이에 특이적인 안티센스 시약의 선택 및 설계를 위해 이용될 수 있다. 본 명세서에 기재된 변이에 대한 정보를 이용하여, 하나 이상의 본 발명의 변이를 포함하는 표적 mRNA를 특이적으로 표적화하는 안티센스 올리고뉴클레오티드 또는 다른 안티센스 분자들이 설계될 수 있다. 이 방식으로, 본 발명의 하나 이상의 변이(마커 및/또는 일배체형)를 포함하는 mRNA 분자의 발현이 저해되거나 또는 차단될 수 있다. 일 구체예에서, 안티센스 분자는 표적 핵산의 특정한 대립인자 형태(즉, 하나 또는 수개의 변이(대립인자 및/또는 일배체형))에 특이적으로 결합하여, 이 특정한 대립인자 또는 일배체형으로부터 기원된 산물의 번역을 저해하나, 상기 표적 핵산 분자의 특정한 다형성 부위에서 다른 변이 또는 대안적인 변이에는 결합하지 않도록 설계된다.
안티센스 분자는 유전자 발현을 저해하고, 따라서, 단백질 발현을 저해하기 위해 mRNA를 불활성화시키기 위해 이용될 수 있기 때문에, 안티센스 분자는 유방암과 같은 질환 또는 질병을 치료하기 위해 이용될 수 있다. 방법은 mRNA가 번역되는 능력을 약화시키는, mRNA의 하나 이상의 영역에 상보적인 뉴클레오티드 서열을 포함하는 리보자임(ribozyme)에 의한 절단을 포함할 수 있다. 그와 같은 mRNA 영역은 예를 들면, 단백질-코딩 영역, 특히, 촉매 활성, 기질 및/또는 리간드 결합 부위, 또는 단백질의 다른 기능성 도메인에 상응하는 단백질-코딩 영역을 포함한다.
C. elegans (Fire et al.,Nature 391:806-11 (1998))에서의 최초의 발견 이후, 지난 10년간 RNA 간섭(RNA interference, RNAi) 현상이 활발하게 연구되었고, 최근년에, 인간 질병의 치료에서 RNAi의 잠재적 용도가 활발히 탐구되고 있다(reviewed in Kim & Rossi, Nature Rev. Genet. 8:173-204 (2007)). 유전자 침묵(gene silencing)으로도 불리는, RNA 간섭(RNAi)은 특정한 유전자를 중지(turn off)시키기 위해 이중-가닥 RNA 분자(dsRNA)를 이용하는 것에 기반한다. 세포에서, 세포질 이중가닥-RNA 분자(dsRNA)는 세포성 복합체(cellular complex)에 의해 작은 간섭 RNA(siRNA)로 가공된다. siRNA는 단백질-RNA 복합체를 표적 mRNA 상의 특정한 부위로 표적화되게 하여, 상기 mRNA의 절단을 초래한다(Thompson, Drug Discovery Today, 7:912-917 (2002)). siRNA 분자들은 통상적으로 길이가 약 20개, 21개, 22개 또는 23개의 뉴클레오티드로 구성된다. 따라서, 본 발명의 일 양태는 분리된 핵산 분자, 및 상기 분자들의 RNA 간섭을 위한 용도, 즉, 작은 간섭 RNA 분자(siRNA)로서의 용도에 관한 것이다. 일 구체예에서, 상기 분리된 핵산 분자는 길이가 18개 내지 26개의 뉴클레오티드로 구성되고, 바람직하게는 19개 내지 25개의 뉴클레오티드로 구성되며, 보다 바람직하게는 20개 내지 24개의 뉴클레오티드로 구성되고, 보다 바람직하게는, 21개, 22개 또는 23개의 뉴클레오티드로 구성된다.
RNAi-매개 유전자 침묵을 위한 또 다른 경로는 세포에서 전구체 miRNA(precursor microRNA, pri-miRNA)를 생성하기 위해 가공되는, 내재적으로 코딩된 일차 마이크로RNA(endogenously encoded micorRNA)(pri-miRNA) 전사체에서 기인한다. 이 miRNA 분자들은 핵으로부터 세포질로 유출되고, 세포질에서 성숙 miRNA 분자(mature miRNA)를 생성하기 위해 가공을 거치고, 상기 miRNA는 mRNA의 3' 비번역 영역(untranslated region, UTR) 내의 표적 부위를 인식하는 것에 의해 번역 저해(translational inhibition)를 주도하고, 뒤이어 P-바디(P-body)를 가공하는 것에 의해 mRNA 분해를 주도한다(reviewed in Kim & Rossi, Nature Rev. Genet. 8:173-204 (2007)).
RNAi의 임상적 적용은 바람직하게는 크기가 약 20 내지 23개의 뉴클레오티드로 구성되고, 바람직하게는 2개의 뉴클레오티드로 구성된 3' 오버랩(overlap)을 갖는 것인 합성 siRNA 듀플렉스의 내포(incorporation)를 포함한다. 유전자 발현의 넉다운은 표적 mRNA에 대한 서열-특이적 설계에 의해 확립된다. 그와 같은 분자의 최적 설계 및 합성을 위한 여러 상업적 사이트들이 본 발명이 속하는 기술 분야의 당업자에게 알려져 있다.
다른 적용들은 보다 긴 siRNA 분자(통상적으로 25 내지 30개의 뉴클레오티드로 구성된 길이, 바람직하게는 약 27개의 뉴클레오티드로 구성된 길이), 및 작은 헤어핀 RNA(small hairpin, sh RAN; 통상적으로 약 29개의 뉴클레오티드로 구성된 길이)를 제공한다. 후자는 Amarzguioui et al. (FEBS Lett. 579:5974-81 (2005))에 기재된 바와 같이, 자연적으로 발현된다. 화학적으로 합성된 siRNA 및 shRNA는 인 비보 가공을 위한 기질이며, 일부 경우에, 보다 짧은 설계의 경우보다 더 강력한 유전자 침묵을 제공한다(Kim et al., Nature Biotechnol. 23:222-226 (2005); Siolas et al., Nature Biotechnol. 23:227-231 (2005)). 일반적으로, siRNA의 세포내 농도가 후속 세포 분열에 의해 희석되기 때문에, siRNA는 유전자 발현의 일시적 침묵을 제공한다. 대조적으로, 발현된 shRNA는 shRNA의 전사가 일어나는 동안은, 표적 전사체(target transcript)의 장기적이고 안정적인 넉다운을 매개한다(Marques et al., Nature Biotechnol. 23:559-565 (2006); Brummelkamp et al., Science 296: 550-553 (2002)).
siRNA, miRNA 및 shRNA를 포함하는 RNAi 분자들은 서열-의존적 방식으로 작용하기 때문에, 본 발명의 변이(예를 들면, 표 12, 표 13 및 표 14에 표시된 마커 및 일배체형)는 특정한 대립인자 및/또는 일배체형(예를 들면, 본 명세서에 기재된 마커 및 일배체형)을 포함하는 특이적 핵산 분자를 인식하나, 다른 대립인자 또는 일배체형을 포함하는 핵산 분자는 인식하지 않는 RNAi 시약을 설계하기 위해 이용될 수 있다. 따라서, 이 RNAi 시약은 표적 핵산 분자를 인식하고 파괴시킬 수 있다. 안티센스 시약의 경우와 같이, RNAi 시약은 치료제로서(즉, 질병-연관 유전자 또는 질병-연관 유전자 변이의 중지(turnoff)를 위해) 유용할 수 있으나, 또한 유전자 기능을 규명하고 검증하기 위해 유용할 수 있다(예를 들면, 유전자 넉-아웃 또는 유전자 넉-다운 실험에 의해).
RNAi의 전달은 본 발명이 속하는 기술 분야에서 당업자에게 알려진 다양한 방법에 의해 수행될 수 있다. 비-바이러스 전달(non-viral delivery)을 이용하는 방법은 콜레스테롤, 안정한 핵산-지질 입자(stable nucleic acid-lipid particle, SNALP), 중쇄 항체 단편(Fab), 앱타머(aptamer) 및 나노입자를 포함한다. 바이러스에 의한 전달 방법(viral delivery method)은 렌티바이러스, 아데노바이러스 및 아데노-연관 바이러스(adeno-associated virus)의 이용을 포함한다. 일부 구체예에서, siRNA 분자는 그들의 안정성을 증가시키기 위해 화학적으로 변형된다. 이는 2'-O-메틸푸린 및 2'-플루오로푸린을 포함한, 리보오스의 2' 위치에서의 변형을 포함하고, 이 변형들은 Rnase 활성에 대한 내성을 제공한다. 다른 화학적 변형이 가능하며 본 발명이 속하는 기술 분야의 당업자에게 알려져 있다.
하기의 참조문헌들이 RNAi, 및 RNAi를 이용한 특정한 유전자의 표적화 가능성의 추가적인 요약을 제공한다: Kim & Rossi, Nat. Rev. Genet. 8:173-184 (2007), Chen & Rajewsky, Nat. Rev. Genet. 8: 93-103 (2007), Reynolds, et al., Nat. Biotechnol. 22:326-330 (2004), Chi et al., Proc. Natl. Acad. Sci. USA 100:6343-6346 (2003), Vickers et al., J. Biol. Chem. 278:7108-7118 (2003), Agami, Curr. Opin. Chem. Biol. 6:829-834 (2002), Lavery, et al., Curr. Opin. Drug Discov. Devel. 6:561-569 (2003), Shi, Trends Genet. 19:9-12 (2003), Shuey et al., Drug Discov. Today 7:1040-46 (2002), McManus et al., Nat. Rev. Genet. 3:737-747 (2002), Xia et al., Nat. Biotechnol. 20:1006-10 (2002), Plasterk et al., curr. Opin. Genet. Dev. 10:562-7 (2000), Bosher et al., Nat. Cell Biol. 2:E31-6 (2000), 및 Hunter, Curr. Biol. 9:R440-442 (1999).
유방암의 발병에 대한 증가된 소인(predispotion) 또는 위험도를 초래하는 유전적 결함, 또는 유방암을 유발하는 결함이 유전적 결함을 갖는 개체에게 상기 유전적 결함의 부위에 정상/야생형 뉴클레오티드를 공급하는 복구 서열(repair sequence)을 내포하는 핵산 단편을 투여하는 것에 의해 영구적으로 정정될 수 있다. 그와 같은 부위-특이적 복구 서열은 개체의 게놈 DNA의 내재적 복구를 촉진하기 위해 작용하는 RNA/DNA 올리고뉴클레오티드를 포함(concompass)할 수 있다. 복구 서열의 투여는 음이온성 리포좀 내에 캡슐화된, 폴리에틸렌이민과의 복합체, 아데노바이러스 벡터와 같은 바이러스 벡터 또는 투여되는 핵산의 세포내 흡수를 촉진하기에 적합한 다른 약제학적 조성물과 같은, 적합한 비히클에 의해 수행될 수 있다. 그 후, 키메라 올리고뉴클레오티드가 개체의 게놈으로 정상적인 서열의 내포를 유도하여, 정상/야생형 유전자 산물의 발현을 유도하기 때문에, 유전적 결함이 극복될 수 있다. 상기 교체(replacement)가 유전되고, 따라서, 질환 또는 상태와 연관된 증상의 영구적인 치유 및 경감을 가능하게 한다.
본 발명은 유방암을 치료 및/또는 예방하기 위해 이용될 수 있는 화합물 또는 작용제를 확인(식별, identify)하는 방법을 제공한다. 따라서, 본 발명의 변이는 치료제의 확인 및/또는 개발을 위한 표적으로 유용하다. 본 발명은 유방암을 치료 및/또는 예방하기 위해 이용될 수 있는 화합물 또는 작용제를 확인(식별, identify)하는 방법을 제공한다. 따라서, 본 발명의 변이는 치료제의 확인 및/또는 개발을 위한 표적으로 유용하다. 특정한 구체예에서, 그와 같은 방법은 작용제 또는 화합물이 본 발명의 하나 이상의 변이(마커 및/또는 일배체형)를 포함하는 핵산, 또는 상기 핵산의 코딩된 산물의 활성 및/또는 발현을 조절하는 능력을 분석하는 단계를 포함할 수 있다. 이는 예를 들면, FGF10, MRPS30, HCN1 및 FGFR2 유전자 중 하나 이상, 및 그들의 유전자 산물을 포함한다. 이는 또한 코딩된 핵산 산물의 원치않는 활성 또는 발현을 저해 또는 변화시키는 작용제 또는 화합물을 확인하기 위해 이용될 수 있다. 그와 같은 실험을 수행하기 위한 분석법은 당업자에게 공지된 바와 같이, 세포-기반 시스템 또는 세포-불포함 시스템(cell-free system)에서 수행될 수 있다. 세포-기반 시스템은 본래 목적 핵산 분자를 발현하는 세포, 또는 특정한 원하는 핵산 분자를 발현하도록 유전적으로 변형된 재조합 세포를 포함한다.
환자에서 변이 유전자 발현이 변이-함유 핵산 서열의 발현(예를 들면, 하나 이상의 변이를 함유하는 RNA로 전사되고, 뒤이어 단백질로 번역될 수 있는, 본 발명의 하나 이상의 변이를 포함하는 유전자), 또는 정상적인 전사체의 발현 수준 또는 패턴에 영향을 미치는 변이, 예를 들면, 유전자의 조절 또는 제어 영역의 변이에 따른, 정상/야생형 핵산 서열의 변화된 발현에 의해 평가될 수 있다. 유전자 발현에 대한 분석법은 직접적인 핵산 분석법(mRNA), 발현된 단백질 수준에 대한 분석법, 또는 경로, 예를 들면, 신호 경로(signal pathway)에 관여된 부수적(collateral) 화합물의 분석을 포함한다. 또한, 신호 경로에 대응하여 상향-조절 또는 하향-조절되는 유전자의 발현이 분석될 수 있다. 일 구체예는 루시페라아제와 같은 리포터 유전자를 목적 유전자의 조절 영역에 작동가능하게 연결하는 단계를 포함한다.
일 구체예에서, 세포가 후보 화합물 또는 작용제와 접촉되고, mRAN의 발현이 결정되는 경우, 유전자 발현의 조절제(modulator)가 확인될 수 있다. 후보 화합물 또는 작용제의 존재 하의 mRNA의 발현 수준이 상기 화합물 또는 작용제의 부재 하의 발현 수준에 비교될 수 있다. 이 비교에 근거하여, 유방암을 치료 및/또는 예방하기 위한 후보 화합물 또는 작용제가 변이 유전자의 유전자 발현을 조절하는 화합물 또는 작용제로 확인될 수 있다. mRNA의 발현 또는 코딩된 단백질이 후보 화합물 또는 작용제의 부재시보다 존재 시에 통계적으로 유의성 있게 더 높은 경우, 상기 후보 화합물 또는 작용제는 상기 핵산의 발현의 촉진제 또는 상향-조절제(up-regulator)로 확인된다. 핵산 발현 또는 단백질 수준이 후보 화합물 또는 작용제의 부재시 보다 존재 시에 통계적으로 유의성 있게 더 낮은 경우, 상기 후보 화합물은 상기 핵산의 발현의 저해제 또는 하향-조절제(down-regulator)로 확인된다.
본 발명은 또한 약물(화합물 및/또는 작용제) 스크리닝을 통해 확인된 화합물을 유전자 조절제(즉, 유전자 발현의 촉진제 및/또는 저해제)로 이용한 치료 방법을 제공한다.
치료제에 대한 반응의 확률을 평가하는 방법, 치료의 진행을 모니터링하는 방법 및 유방암의 치료 방법
본 발명이 속하는 기술 분야에서 공지된 바와 같이, 개체들은 특정한 치료(예를 들면, 본 명세서에서 더 설명되는, 치료제 또는 치료 방법)에 대해 차등적 반응을 가질 수 있다. 차등적 반응의 근거는 부분적으로 유전학적으로 결정될 수 있다. 약물유전학(Pharmacogenomics)은 유전적 변이(예를 들면, 본 발명의 변이(마커 및/또는 일배체형))가 변화된 약물 소인(drug disposition) 및/또는 약물의 비정상적인 또는 변화된 작용 때문에, 약물 반응에 어떻게 영향을 미치는지의 문제를 다룬다. 따라서, 차등적 반응의 근거(basis)가 부분적으로 유전학적으로 결정될 수 있다. 약물 반응에 영향을 미치는 유전적 변이에 따른 임상적 결과는 일부 개체(본 발명의 유전적 변이의 보인자 또는 비-보인자)에서 약물의 독성, 또는 약물의 치료적 실패(therapeutic failure)를 초래할 수 있다. 따라서, 본 발명의 변이는 치료제 및/또는 방법이 신체에 대해 작용하는 방식, 또는 신체가 치료제를 대사하는 방식을 결정할 수 있다.
따라서, 일 구체예에서, 본 명세서에 기재된 다형성 부위에서 특정한 대립인자 또는 일배체형의 존재는 특정한 치료 방식(treatment modality)에 대한 상이한 반응,을 나타낸다. 이는 유방암으로 진단되고, 본 발명의 다형성 부위에 특정한 대립인자 또는 일배체형(예를 들면, 본 발명의 위험 대립인자 및/또는 일배체형)을 갖는 환자가 유방암을 치료하기 위해 이용된 특정한 치료제, 약물 및/또는 다른 치료법에 대해 보다 유리하게 또는 보다 불리하게 반응할 것이라는 것을 의미한다. 따라서, 상기 마커 대립인자 또는 일배체형의 존재 또는 부재는 환자에 대해 어떤 치료가 이용되어야 하는지를 결정하는데 도움이 될 수 있다. 예를 들면, 새로 진단된 환자의 경우, 본 발명의 마커 또는 일배체형의 존재가 (예를 들면, 본 명세서에 기재된 바와 같이, 게놈 DNA를 포함하는 혈액 시료 또는 기타 시료로부터 유래된 DNA의 테스트를 통해) 평가될 수 있다. 환자가 마커 대립인자 또는 일배체형에 대해 양성인 경우(즉, 마커의 하나 이상의 특정한 대립인자 또는 일배체형이 존재하는 경우), 의사는 하나의 특정한 치료(예를 들면, 하나의 특정한 치료제 또는 치료제의 조합)를 권고하고, 환자가 마커의 상기 하나 이상의 대립인자 또는 일배체형에 대해 음성인 경우, 다른 코스의 치료(즉각적인 치료가 아닌, 질병의 진행에 대한 지속적인 모니터링이 수행될 것을 권고하는 것을 포함할 수 있음)가 권고될 수 있다. 따라서, 환자의 보인자 상태가 특정한 치료 방식이 적용되어야 하는지 여부를 결정하는 것을 보조하기 위해 이용될 수 있다. 그 가치는 질병을 조기에 진단하고, 임상의에게 가장 적합한 치료를 적용할 수 있도록 질병의 예후/공격성에 대한 정보를 제공할 수 있다는 가능성에 있다.
본 명세서에서 더 설명되는 바와 같이, 현재의 임상적 예방 옵션은 화학적 예방(chemopreventative)(또는 호르몬) 치료 및 예방적 수술(prophylactic surgery)이다. 가장 널리 이용되는 종양의 화학적 예방제는 선택적 에스트로겐 수용제 조절제(Selective Estrogen Receptor Modulator, SERM)인 타목시펜이다; 다른 옵션은 아로마타아제 저해제를 포함한다. 치료 옵션은 또한 방사선 요법을 포함하고, 방사선 요법의 경우, 일부 환자들이 심각한 증상을 경험한다. 본 명세서에 기재된, 본 발명의 마커들은 이 치료 옵션에 대한 반응을 평가하기 위해 또는 이 치료 옵션들 중 하나를 이용한 치료법의 진행을 예측하기 위해 이용될 수 있다. 따라서, 개체의 유전적 상태(genetic status)에 기반하여 적합한 치료 전략을 선택하기 위해 유전적 프로파일링이 이용될 수 있거나, 또는 특정한 치료 옵션의 결과를 예측하기 위해 유전적 프로파일링이 이용될 수 있어서, 치료 옵션 또는 이용가능한 치료 옵션의 조합의 전략적 선택에서 유용할 수 있다.
본 발명은 또한 유방암에 대한 치료의 진행 또는 효과를 모니터링하는 방법에 관한 것이다. 이는 본 발명의 마커 및 일배체형의 유전형 및/또는 일배체형 상태에 근거하여 수행되며, 즉, 본 명세서에 개시된 하나 이상의 다형성 마커의 하나 이상의 대립인자의 부재 또는 존재를 평가하거나, 또는 본 발명의 변이(마커 및 일배체형)와 연관된 유전자의 발현을 모니터링하는 것에 의해 수행될 수 있다. 조직 시료(예를 들면, 말초 혈액 시료, 또는 생검 시료)에서 위험 유전자 mRNA 또는 코딩된 폴리펩티드가 측정될 수 있다. 따라서, 치료 효과를 모니터링하기 위해 발현 수준 및/또는 mRNA 수준이 치료 전 및 치료 동안 측정될 수 있다. 대안적으로 또는 동시에, 치료 효과를 모니터링하기 위해 본 명세서에 개시된 유방암에 대한 하나 이상의 위험 변이의 유전형 및/또는 일배체형 상태가 치료 전 및 치료 동안 측정될 수 있다.
대안적으로, 본 발명의 마커 및 일배체형과 관련된 생물학적 네트워크 또는 대사 경로는 mRNA 및/또는 폴리펩티드 수준을 결정하는 것에 의해 모니터링될 수 있다. 이는 예를 들면, 치료 전과 치료 동안 채취된 시료에서, 상기 네트워크 및/또는 경로에 속하는 여러 유전자들의 발현 수준 또는 폴리펩티드를 모니터링하는 것에 의해 수행될 수 있다. 대안적으로, 상기 생물학적 네트워크 또는 대사 경로에 속하는 대사산물은 치료 전 및 치료 동안 결정될 수 있다. 치료의 효과는 건강한 개체로부터의 상응하는 데이터 대비, 치료 동안 발현 수준/대사산물 수준의 관찰된 변화를 비교하는 것에 의해 결정된다.
또 다른 양태에서, 본 발명의 마커는 임상 시험의 검정력(power) 및 효과를 증가시키기 위해 이용될 수 있다. 따라서, 본 발명의 위험 변이의 보인자인 개체, 즉, 유방암을 발병할 증가된 위험도를 부여하는 하나 이상의 다형성 마커의 하나 이상의 대립인자의 보인자인 개체가 특정한 치료 방식(treatment modality)에 반응할 가능성이 더 높을 수 있다. 일 구체예에서, 특정한 치료(예를 들면, 소형 분자 약물)가 표적화하는 경로 및/또는 대사 네트워크 내의 유전자에 대한 위험 변이를 갖는 개체는 상기 치료에 대해 반응을 보일 가능성이 더 높다. 또 다른 구체예에서, 그 발현 및/또는 기능이 위험 변이에 의해 변화되는 것인 유전자에 대한 위험 변이를 갖는 개체는 상기 유전자, 그의 발현 또는 그의 유전자 산물을 표적화하는 치료 방식에 반응할 가능성이 더 높다.
또 다른 양태에서, 본 발명의 마커 및 일배체형은 특정한 개인을 위한 약제학적 작용제의 선택을 표적화하기 위해 이용될 수 있다. 치료 방식의 맞춤화된 선택(personalized seleciton), 생활방식 변화 또는 상기 두가지의 조합이 본 발명의 위험 변이의 이용에 의해 실현될 수 있다. 따라서, 본 발명의 특정한 마커에 대한 개체의 상태의 지식은 본 발명의 위험 변이에 의해 영향받은 유전자 또는 유전자 산물을 표적화하는 치료 옵션의 선택을 위해 유용할 수 있다. 변이의 특정한 조합이 하나의 치료 옵션의 선택을 위해 적합할 수 있고, 다른 유전자 변이 조합은 다른 치료 옵션을 표적화할 수 있다. 그와 같은 변이의 조합은 임상적으로 신뢰성있는 정확도로 치료 모듈의 선택을 결정하기 위해 필요한 경우, 하나의 변이, 두개의 변이, 세개의 변이, 또는 네개 또는 그 이상의 변이를 포함할 수 있다.
컴퓨터-구현 양태(Computer-implemented aspects)
본 발명은 또한 본 명세서에서 유방암과 연관된 것으로 기재된 다형성 마커 및 일배체형의 컴퓨터-구현 응용(computer-implemented applicatoin)에 관한 것이다. 그와 같은 응용은 본 명세서에 기재된 바와 같이, 본 발명의 방법에서 유용한 유전형 데이터를 저장, 처리(manipulate)하거나 또는 분석하기 위해 유용할 수 있다. 하나의 예는 제3자에게 유전형 정보를 제공할 수 있기 위해, 판독가능한 매체 사에 개인으로부터 유래된 유전형 정보를 저장하는 것에 관한 것이다. 제3자는 유전형 데이터가 유래된 개체일 수 있다. 제3자는 또한 유전형 정보를 분석하는 서비스 제공자, 예를 들면, 특정한 유전적 마커에서 개체의 유전형에 근거하여 유전적 위험도를 계산하는 서비스 제공자일 수 있다. 하나의 그와 같은 구체예에서, 상기 서비스 제공자는 유전형 서비스 제공자로부터 유전형 정보를 받고, 상기 유전형 정보를 이후의 분석을 위해 판독가능한 매체 상에 저장한다. 또 다른 구체예에서, 상기 유전형 제공자도 서비스 제공자일 수 있고, 즉, 동일한 자가 개체로부터의 DNA 시료로부터 유전형을 생성하고, 상기 유전형 데이터를 판독가능한 매체 상에 저장하고, 상기 유전형 데이터의 위험도 평가 또는 다른 해석과 관련된 서비스를 제공한다. 추가적인 해석은 예를 들면, 개체의 선조, 또는 상기 개체와 기준 개체(reference individual) 간의 계통학적 관계(genealogical relationship)의 평가 또는 예측을 포함할 수 있다. 기준 개체는 예를 들면, 해당 개체가 자신의 유전형을 비교하기를 원하는 대상이 되는 친구, 친척, 또는 다른 사람일 수 있다. 하나의 특정한 구체예에서, 유전형 데이터가 유방암에 대한 증가된 감수성에 기여하는 유전적 위험 인자들에 대한 정보를 도출하고, 그와 같은 비교에 근거하여 결과를 보고하기 위해 이용된다.
일 양태에서, 본 발명은 컴퓨터-판독가능한 매체에 관한 것이다. 일반적으로, 그와 같은 매체는 (i) 하나 이상의 다형성 마커 또는 일배체형에 대한 식별자(identifier) 정보; (ii) 유방암을 갖는 개체에서, 상기 하나 이상의 마커의 하나 이상의 대립인자의 빈도, 또는 일배체형의 빈도의 지표(indicator); 및 기준 집단(reference population)에서 상기 하나 이상의 마커의 하나 이상의 대립인자의 빈도, 또는 일배체형의 빈도의 지표를 저장하는 능력을 갖는다. 기준 집단은 질병-불포함(disease-free) 개인의 집단일 수 있다. 대안적으로, 기준 집단은 일반적인 집단으로부터의 랜덤 표본이고, 따라서, 전반적으로 상기 집단을 대표한다. 빈도 지표는 계산된 빈도, 대립인자 및/또는 일배체형 카피의 계수(count), 또는 특정한 매체를 위해 적합한 실제 빈도의 정규화된(normalized) 또는 달리 처리된(manipulated) 값일 수 있다.
선조 정보(ancestry informaton), 성별, 신체적 특성 또는 특징(신장 및 체중 포함)에 대한 정보, 생화학적 측정값(예를 들면, 혈압, 혈중 지질 수준 등), 또는 특정한 개인의 유전형 상태에 관하여 저장 또는 처리되는 것이 바람직한 다른 유용한 정보와 같은, 개인에 대한 추가적인 정보가 상기 매체에 저장될 수 있다.
본 발명은 또한 개인에서 유방암에 대한 감수성을 결정하기 위해 유용한 유전적 데이터의 결정 또는 처리를 위해 적합한 장치에 관한 것이다. 그와 같은 장치는 컴퓨터-판독가능한 메모리, 컴퓨터-판독가능한 메모리 상에 저장된 데이터를 처리하기 위한 루틴(routine), 및 유전적 데이터의 척도를 포함한 결과물(output)을 생성하기 위한 루틴을 포함할 수 있다. 그와 같은 척도는 대립인자 빈도 또는 일배체형 빈도, 유전형 계수(genotype count), 성별, 연령, 표현형 정보, 오즈비(OR) 값 또는 상대적 위험도(RR), 집단 귀속 위험도(PAR), 또는 본래의 유전형 데이터의 직접적인 통계값이거나 또는 유전적 데이터에 근거한 계산에 기반한 다른 유용한 정보를 포함할 수 있다.
특정한 구체예에서, 본 명세서에서 유방암의 증가된 감수성(예를 들면, 증가된 위험도)과 연관된 것으로 확인된 마커들 및 일배체형들은 유전형 데이터의 해석 및/또는 분석을 위해 유용하다. 따라서, 특정한 구체예에서, 본 명세서에서 입증된 바와 같은, 유방암에 대한 위험 대립인자, 또는 위험 일배체형, 또는 본 명세서에서 유방암과 연관된 것으로 입증된 마커들 및/또는 일배체형 중 하나와 LD인 다형성 마커의 대립인자 또는 일배체형의 확인은 해당 유전형 데이터가 기원한 개체가 유방암의 증가된 위험을 갖는다는 것을 나타낸다. 하나의 그와 같은 구체예에서, 유전형 데이터는 본 명세서에서 유방암과 연관된 것으로 확인된 하나 이상의 다형성 마커, 또는 이들과 연관 불균형인 마커에 대해 생성된다. 유전형 데이터는 뒤이어 질병(예를 들면, 유방암)에 대한 위험 척도의 형태(예를 들면, 절대 위험도(AR), 위험도 비(risk ratio, RR), 또는 오즈비(odds ratio, OR))인 유전형 데이터의 해석과 함께, 해당 데이터가 기원한 개체에게 예를 들면, 인터넷을 통해 접근가능한 사용자 인터페이스를 통해 이용가능하다. 또 다른 구체예에서, 개체로부터 유래된 유전형 데이터세트에서 확인된 위험 마커가 평가되고 상기 데이터세트에서 그와 같은 위험 변이의 존재에 의해 부여된 위험도의 평가로부터의 결과가, 예를 들면, 안전한 웹 인터페이스를 통해, 또는 다른 통신 수단에 의해 상기 개체에게 이용가능하다. 그와 같은 위험도 평가의 결과가 수치 형태(예를 들면, 절대 위험도, 상대적 위험도 및/또는 오즈비와 같은 위험도 값, 또는 기준 대비 위험도의 백분율 증가), 그래프 수단에 의해, 또는 해당 유전형 데이터가 유래된 개체에 대한 위험도를 보여주기에 적합한 다른 수단에 의해 보고될 수 있다. 특정한 구체예에서, 위험도 평가의 결과가 제3자, 예를 들면, 의사, 기타 의료인 또는 유전 상담가에게 이용가능하다.
본 발명의 다양한 양태에서 유용한 마커
전술된 방법 및 응용은 모두 본 명세서에서 유방암에 대한 감수성을 평가하기 위해 유용한 것으로 일반적인 용어로 보다 상세하게 설명된 본 발명의 마커 및 일배체형에 의해 실시될 수 있다. 따라서, 이 응용들은 일반적으로 표 12, 표 13 및 표 14에 열거된 마커들, 및 이들과 연관 불균형인 마커들을 포함한, 본 명세서에 기재된 Chr5p12 및 Chr10q26 게놈 영역 내의 마커들을 이용하여 실시될 수 있다. 일 구체예에서, 본 발명의 다양한 양태 및 구체예에서 유용한 마커는 표 12, 표 13 및 표 14에 표시된 마커들(서열번호 1 내지 237)로부터 선택된다. 일 구체에에서, 상기 마커는 마커 rs10941679, rs7703618, rs4415084, rs2067980, rs10035564, rs11743392, rs7716600, 및 rs1219648, 및 이들과 연관 불균형인 마커들로부터 선택된다. 또 다른 구체예에서, 상기 마커는 마커 rs10941679, rs7703618, rs4415084, rs2067980, rs10035564, rs11743392, rs7716600 및 rs1219648로부터 선택된다. 또 다른 구체예에서, 상기 마커는 rs10941679, 및 이와 연관 불균형인 마커들로부터 선택된다. 일 구체예에서, 상기 마커는 표 13에 표시된 마커들로부터 선택된다. 또 다른 구체예에서, 상기 마커는 마커 rs4415084, 및 이와 연관 불균형인 마커들로부터 선택된다. 또 다른 구체예에서, 상기 마커는 표 12에 표시된 마커들로부터 선택된다. 또 다른 구체예에서, 상기 마커는 마커 rs1219648, 및 이와 연관 불균형인 마커들로부터 선택된다. 또 다른 구체예에서, 상기 마커는 표 14에 표시된 마커들로부터 선택된다. 또 다른 구체예에서, 상기 마커는 rs4415084이다. 또 다른 구체예에서, 상기 마커는 rs10941679이다. 또 다른 구체예에서, 상기 마커는 rs1219648이다. 또 다른 구체예에서, 상기 마커는 rs4415084 또는 rs10941679이다. 또 다른 구체예에서, 유방암에 대한 증가된 위험도 또는 감수성을 부여하는 마커 대립인자는 rs10941679 대립인자 G, rs7703618 대립인자 T, rs4415084 대립인자 G, rs2067980 대립인자 G, rs10035564 대립인자 G, rs11743392 대립인자 T, rs7716600 대립인자 A, 및 rs1219648 대립인자 G로부터 선택된다.
핵산 및 폴리펩티드
본 명세서에 기재된 핵산 및 폴리펩티드는 본 발명의 방법 및 키트에서 이용될 수 있다. 본 명세서에서 사용된, "분리된(isolated)" 핵산 분자는 (게놈 서열에서와 같이) 정상적으로 유전자 또는 뉴클레오티드 서열을 둘러싸는(flank) 핵산으로부터 분리되고 및/또는 (예를 들면, RNA 라이브러리에서와 같이) 다른 전사된 서열들로부터 완전하게 또는 부분적으로 정제된 핵산이다. 예를 들면, 본 발명의 분리된 핵산은 핵산이 원래 존재하는 복잡한 세포 매질(cellular milieu), 또는 재조합 기법에 의해 생성되는 경우 배양 배지, 또는 화학적으로 합성되는 경우, 화학적 전구체 또는 다른 화학물질들에 대해 실질적으로 분리될 수 있다. 일부 경우에, 분리된 물질은 조성(예를 들면, 다른 물질을 포함하는 조 추출물), 완충 시스템 또는 시약 혼합물(reagent mix)의 부분을 형성할 것이다. 다른 상황들에서, 상기 물질은 예를 들면, 폴리아크릴아미드 겔 전기영동(PAGE) 또는 컬럼 크로마토그래피(예를 들면, HPLC)에 의해 결정되는 바와 같이, 필수적인 균질성(essential homogeneity)까지 정제될 수 있다. 본 발명의 분리된 핵산 분자는 존재하는 모든 거대분자 종의 약 50% 이상, 약 80% 이상, 또는 약 90% 이상(몰 기준)을 구성할 수 있다. 게놈 DNA에 대해, 용어 "분리된(isolated)"은 또한 본래 게놈 DNA가 결합되어 있는 염색체로부터 분리된 핵산 분자를 의미한다. 예를 들면, 분리된 핵산 분자는 핵산 분자가 유래된 세포의 게놈 DNA에서 상기 핵산 분자를 플랭킹(flank)하는 뉴클레오티드의 약 250 kb, 200 kb, 150 kb, 100 kb, 75 kb, 50 kb, 25 kb, 10 kb, 5 kb, 4 kb, 3 kb, 2 kb, 1 kb, 0.5 kb 또는 0.1 kb 미만을 포함할 수 있다.
핵산 분자는 다른 코딩 서열 또는 조절 서열에 융합될 수 있고, 여전히 분리된 것으로 고려될 수 있다. 따라서, 벡터 내에 포함된 재조합 DNA는 본 명세서에서 사용된 "분리된"의 정의에 포함된다. 또한, 분리된 핵산 분자는 이종(heterologous) 숙주 세포 또는 이종 개체 내의 재조합 DNA 분자, 및 용액 중의 부분적으로 또는 실질적으로 정제된 DNA 분자를 포함한다. "분리된" 핵산 분자는 또한 본 발명의 DNA 분자의 인 비보 및 인 비트로 RNA 전사체를 포함한다. 분리된 핵산 분자 또는 뉴클레오티드 서열은 화학적으로 합성되거나 또는 재조합 수단에 의해 생산된 핵산 분자 또는 뉴클레오티드 서열을 포함할 수 있다. 그와 같은 분리된 뉴클레오티드 서열이 예를 들면, 코딩된 폴리펩티드의 제조에서, 상동성 서열(예를 들면, 다른 포유동물 종으로부터)의 분리를 위해, 유전자 맵핑을 위해(예를 들면, 염색체와의 인 시투 혼성화에 의해), 또는 예를 들면, 노던 블롯 분석 또는 기타 혼성화 기법과 같은 조직 (예를 들면, 인간 조직) 중의 유전자의 발현을 검출하기 위해, 프로브로서 유용하다.
본 발명은 또한 높은 엄격성(stringency)의 혼성화 조건, 예를 들면, 선택적 혼성화를 위한 조건 하에, 본 명세서에 기재된 뉴클레오티드 서열에 혼성화되는 핵산 분자(예를 들면, 본 명세서에 기재된 일배체형과 연관된 다형성 부위를 포함하는 뉴클레오티드 서열에 특이적으로 혼성화하는 핵산 분자)에 관한 것이다. 그와 같은 핵산 분자는 대립인자-특이적 혼성화 또는 서열-특이적 혼성화(예를 들면, 높은 엄격성(stringency) 조건 하에)에 의해 검출 및/또는 분리될 수 있다. 핵산 혼성화를 위한 엄격성 조건 및 방법은 본 발명이 속하는 기술 분야의 당업자에게 잘 알려져 있다(예를 들면, 전체 교시에 참조에 의해 본 명세서에 포함된 Current Protocols in Molecular Biology, Ausubel, F. et al, John Wiley & Sons, (1998), 및 Kraus, M. and Aaronson, S., Methods Enzymol., 200:546-556 (1991) 참조).
두 개의 뉴클레오티드 서열 또는 아미노산 서열 간의 퍼센트 동일성(percent identity)은 최적의 비교 목적을 위해 서열들을 정렬시키는 것에 의해(예를 들면, 제1 서열의 서열에 갭이 도입될 수 있음) 결정될 수 있다. 상응하는 위치의 뉴클레오티드 또는 아미노산이 비교되고, 두 서열 간의 퍼센트 동일성은 상기 서열들 간에 공유된 동일한 위치의 갯수의 함수이다(즉, % 동일성 = 동일한 위치의 갯수(#)/위치의 총 갯수(#) x 100). 특정한 구체예에서, 비교 목적을 위해 정렬된 서열의 길이는 기준 서열의 길이의 30% 이상, 40% 이상, 50% 이상, 60% 이상, 70% 이상, 80% 이상, 90% 이상, 또는 95% 이상이다. 두 서열의 실제적인 비교는 잘 알려진 방법, 예를 들면, 수학적 알고리즘을 이용하여 달성될 수 있다. 그와 같은 수학적 알고리즘의 비-한정적인 예가 Karlin, S. and Altschul, S., Proc. Natl. Acad. Sci. USA, 90:5873-5877 (1993)에 기재된다. 그와 같은 알고리즘이 Altschul, S. et al., Nucleic Acids Res., 25:3389-3402 (1997)에 기재된 바와 같이, NBLAST 및 XBLAST 프로그램(버전 2.0)에 구현된다. BLAST 및 Gapped BLAST 프로그램을 이용하는 경우, 개별적인 프로그램(예를 들면, NBLAST)의 디폴트 파라미터가 이용될 수 있다. ncbi.nlm.nih.gov에서 월드 와이드 웹의 웹사이트를 참조한다. 일 구체예에서, 서열 비교를 위한 파라미터는 score=100, wordlength=12로 설정되거나, 또는 변할 수 있다(예를 들면, W=5 또는 W=20).
다른 예는 Myers and Miller, CABIOS (1989), Torellis, A. and Robotti, C., Comput. Appl. Biosci. 10:3-5 (1994)에 기재된 ADVANCE and ADAM; 및 Pearson, W. and Lipman, D., Proc. Natl. Acad. Sci. USA, 85:2444-48 (1988)에 기재된 FASTA 알고리즘을 포함한다.
또 다른 구체예에서, 두 개의 아미노산 서열간의 퍼센트 동일성(percent identity)은 GCG 소프트웨어 패키지 (Accelrys, Cambridge, UK) 중의 GAP 프로그램을 이용하여 수득될 수 있다.
본 발명은 또한 높은 엄격성 조건(highly stringent condition) 하에 표 12, 표 13 및 표 14에 표시된 다형성 마커들(서열번호 1 내지 237)를 포함하는 뉴클레오티드 서열, 및 FGF10, MRPS30, HCN1 및 FGFR2 유전자의 뉴클레오티드 서열을 포함하거나 상기 서열로 구성되거나; 또는 표 12, 표 13 및 표 14에 표시된 다형성 마커들(서열번호 1 내지 237)를 포함하는 뉴클레오티드 서열, 및 FGF10, MRPS30, HCN1 및 FGFR2 유전자의 뉴클레오티드 서열의 상보체를 포함하거나, 상기 상보체로 구성된 뉴클레오티드 서열의 핵산에 혼성화하고, 상기 뉴클레오티드 서열은 본 명세서에 기재된 마커 및 일배체형에 포함된 하나 이상의 다형성 대립인자를 포함하는 것인 단편 또는 부분을 포함하는 분리된 핵산 분자를 제공한다. 본 발명의 핵산 단편은 약 15개 이상, 약 18개 이상, 20개, 23개 또는 25개 이상의 뉴클레오티드로 구성된 길이이고, 30개, 40개, 50개, 100개, 200개, 500개, 1000개, 10,000개 또는 그 이상의 뉴클레오티드로 구성된 길이일 수 있다.
본 발명의 핵산 단편은 본 명세서에 기재된 바와 같은 분석법에서 프로브 또는 프라이머로서 이용된다. "프로브(probe)" 또는 "프라이머(primer)"는 핵산 분자의 상보적 가닥에 염기-특이적 방식으로 혼성화하는 올리고뉴클레오티드이다. DNA 및 RNA 외에, 그와 같은 프로브 및 프라이머는 Nielsen, P. et al., Science 254:1497-1500 (1991)에 기재된 바와 같은 PNA(polypeptide nucleic acid)를 포함한다. 프로브 또는 프라이머는 핵산 분자의 약 15개 이상, 일반적으로 약 20개 내지 25개, 및 일부 구체예에서, 약 40개, 50개 또는 75개의 연속된 뉴클레오티드로 구성된 부분에 혼성화하는 뉴클레오티드 서열의 영역을 포함한다. 일부 구체예에서, 프로브 또는 프라이머는 본 명세서에 기재된 하나 이상의 다형성 마커 또는 하나 이상의 일배체형의 하나 이상의 대립인자, 또는 그의 상보체(complement)를 포함한다. 특정한 구체예에서, 프로브 또는 프라이머는 100개 또는 그 미만의 뉴클레오티드를 포함할 수 있고, 예를 들면, 특정한 구체예에서, 6개 내지 50개의 뉴클레오티드, 또는 예를 들면, 12개 내지 30개의 뉴클레오티드를 포함할 수 있다. 다른 구체예에서, 프로브 또는 프라이머는 연속적인 뉴클레오티드 서열 또는 상기 연속적인 뉴클레오티드 서열의 상보체에 약 70% 이상, 약 80% 이상, 약 85% 이상, 약 90% 이상, 또는 약 95% 이상 동일하다. 또 다른 구체예에서, 프로브 또는 프라이머는 연속적인 뉴클레오티드 서열 또는 상기 연속적인 뉴클레오티드 서열의 상보체에 선택적으로 혼성화될 수 있다. 종종, 프로브 또는 프라이머는 표지, 예를 들면, 방사성동위원소, 형광 표지, 효소 표지, 효소 보조-인자 표지, 자성 표지(magnetic label), 스핀 표지, 에피토프 표지를 더 포함한다.
전술된 바와 같은 본 발명의 핵산 분자는 본 발명이 속하는 기술 분야의 당업자에게 잘 알려진 표준 분자생물학 기법을 이용하여 확인되고 분리될 수 있다. 증폭된 DNA는 표지되고(예를 들면, 방사성 표지되고), 인간 세포로부터 유래된 cDNA 라이브러리를 스크리닝하기 위한 프로브로서 이용될 수 있다. 상기 cDNA는 mRNA로부터 유래되고 적합한 벡터에 담길 수 있다. 상응하는 클론들이 분리되고, 인 비보 절제(in vivo excision)에 따라 DNA가 수득되고, 적합한 분자량의 폴리펩티드를 코딩하는 올바른 해독 프레임을 확인하기 위해 본 발명이 속하는 기술 분야에서 인정되는 방법에 의해 클로닝된 삽입물이 한 방향으로 또는 양 방향으로 서열분석될 수 있다. 이 방법들 또는 유사한 방법들을 이용하여, 폴리펩티드 및 상기 폴리펩티드를 코딩하는 DNA가 분리되고, 서열결정되고, 그 특성이 더 규명될 수 있다.
일반적으로, 본 발명의 분리된 핵산 서열은 서던 겔(Southern gel) 상에서 분자량 마커, 및 관련된 유전자 위치를 맵핑하기 위해 표지된 염색체 마커로 이용될 수 있다. 상기 핵산 서열은 또한 유방암 또는 유방암에 대한 감수성을 확인하기 위해 환자에서 내재적 DNA 서열과 비교하기 위해 이용될 수 있고 관련된 DNA 서열을 혼성화하고 발견하기 위해 또는 시료로부터 공지된 서열을 제거하기 위해(예를 들면, 공통 유전자 제거 혼성화법(subtractive hybridization)) 프로브로서 이용될 수 있다. 핵산 서열은 유전자 지문법(genetic fingerprinting)을 위한 프라이머를 수득하기 위해, 면역화 기법을 이용하여 항-폴리펩티드 항체를 생성하기 위해, 및/또는 항-DNA 항체를 생성시키기거나 또는 면역 반응을 유발하기 위해 항원으로서 이용될 수 있다.
항체
유전자 산물의 하나의 형태에 특이적으로 결합하나, 상기 유전자 산물의 다른 형태에는 결합하지 않는 다중클론 항체 및/또는 단일클론 항체가 또한 제공된다. 변이, 또는 다형성 부위 또는 부위들을 포함하는 기준 유전자 산물의 일부에 결합하는 항체도 제공된다. 본 명세서에서 사용된 용어 "항체(antibody)"는 면역글로불린 분자 및 면역글로불린 분자의 면역학적으로 활성인 부분, 즉, 항원에 특이적으로 결합하는 항원-결합 부위를 포함하는 분자를 의미한다. 본 발명의 폴리펩티드에 특이적으로 결합하는 분자는 폴리펩티드 또는 그의 단편에 결합하나, 자연적으로 상기 폴리펩티드를 포함하는 시료, 예를 들면, 생물학적 시료 중의 다른 분자에는 실질적으로 결합하지 않는 분자이다. 면역글로불린 분자의 면역학적 활성 부분의 예는 펩신과 같은 효소에 의해 항체를 처리하는 것에 의해 생성될 수 있는 F(ab) 및 F(ab')2 단편을 포함한다. 본 발명은 본 발명의 폴리펩티드에 결합하는 다중클론 항체 및 단일클론 항체를 제공한다. 본 명세서에서 사용된, 용어 "단일클론 항체(monoclonal antibody)" 또는 "단일클론 항체 조성물(monoclonal antibody composition)"은 본 발명의 폴리펩티드의 특정한 에피토프와 면역반응할 수 있는 항원 결합 부위의 단 하나의 종만을 포함하는 항체 분자의 집단을 의미한다. 따라서, 단일클론 항체 조성물은 일반적으로 그와 면역반응하는 본 발명의 특정한 폴리펩티드에 대한 단일 결합 친화도를 보인다.
다중클론 항체는 적합한 개체를 원하는 면역원(immunogen), 예를 들면, 본 발명의 폴리펩티드 또는 그의 단편으로 면역화시키는 것에 의해 전술된 바와 같이 제조될 수 있다. 면역화된 개체에서 항체 역가(antibody titer)는 시간의 경과에 대해, 표준 기법, 예를 들면, 고정화된 폴리펩티드를 이용한, ELISA(enzyme linked immunosorbent assay)에 의해 모니터링될 수 있다. 필요한 경우, 폴리펩티드에 대한 항체 분자가 포유동물(예를 들면, 혈액)로부터 분리되고, IgG 분획을 수득하기 위힌 단백질 A 크로마토그래피와 같은, 잘 알려진 기법에 의해 더 정제될 수 있다. 면역화 후 적절한 시점에, 예를 들면, 항체 역가가 최고인 시점에, 항체-생성 세포들이 개체로부터 수득되고, Kohler and Milstein, Nature 256:495-497 (1975)에 의해 최초로 개시된 하이브리도마 기법, 인간 B 세포 하이브리도마 기법(Kozbor et al., Immunol. Today 4: 72 (1983)), EBV-하이브리도마 기법(Cole et al., Monoclonal Antibodies and Cancer Therapy, Alan R. Liss,1985, Inc., pp. 77-96) 또는 트리오마(trioma) 기법과 같은 표준 기법에 의해 단일클론 항체를 제조하기 위해 이용될 수 있다. 하이브리도마를 생성하는 기술이 잘 알려져 있다(일반적으로, Current Protocols in Immunology (1994) Collgan et al., (eds.) John Wiley & Sons, Inc., New York, NY 참조). 요약하면, 불멸 세포주(immortal cell line)(일반적으로, 골수종(myeloma))가 전술된 바와 같이 면역원에 의해 면역화된 포유동물로부터의 림프구(일반적으로, 비장림프구(splenocyte))에 융합되고, 결과물인 하이브리도마 세포의 배양 상층액이 본 발명의 폴리펩티드에 결합하는 단일클론 항체를 생성하는 하이브리도마를 확인하기 위해 스크리닝된다.
림프구와 불멸화된 세포주를 융합시키기 위해 이용되는 다수의 잘 알려진 프로토콜이 본 발명의 폴리펩티드에 대한 단일클론 항체를 생성할 목적으로 적용될 수 있다(예를 들면, Current Protocols in Immunology, supra; Galfre et al., Nature 266:55052 (1977); R.H. Kenneth, in Monoclonal Antibodies: A New Dimension In Biological Analyses, Plenum Publishing Corp., New York, New York (1980); 및 Lerner, Yale J. Biol. Med. 54:387-402 (1981) 참조). 또한, 통상적인 당업자는 역시 유용할, 그와 같은 방법의 다양한 변형이 존재한다는 것을 이해할 것이다.
단일클론 항체-분비 하이브리도마 제조의 대안으로, 본 발명의 폴리펩티드에 대한 단일클론 항체가 상기 폴리펩티드로 재조합 조합적 면역글로불린 라이브러리(recombinant combinatorial immunoglobulin library)(예를 들면, 항체 파아지 표시(phage display) 라이브러리)를 스크리닝하고, 그에 의해 상기 폴리펩티드에 결합하는 면역글로불린 라이브러리 구성물을 분리하는 것에 의해 식별되고 분리될 수 있다. 파아지 표시 라이브러리를 생성하고 스크리닝하기 위한 키트가 상업적으로 이용가능하다(예를 들면, the Pharmacia Recombinant Phage Antibody System, Catalog No. 27-9400-01; 및 Stratagene Surf ZAP™ Phage Display Kit, Catalog No. 240612). 추가적으로, 항체 표시 라이브러리를 생성하고 스크리닝하기 위해 이용할 수 있는 특히 유용한 방법 및 시약의 예를, 예를 들면, 미국특허 제5,223,409호; PCT 공개 WO 92/18619; PCT 공개 WO 91/17271; PCT 공개 WO 92/20791; PCT 공개 WO 92/15679; PCT 공개 WO 93/01288; PCT 공개 WO 92/01047; PCT 공개 WO 92/09690; PCT 공개 WO 90/02809; Fuchs et al., Bio/Technology 9: 1370-1372 (1991); Hay et al., Hum. Antibod. Hybridomas 3:81-85 (1992); Huse et al., Science 246: 1275-1281 (1989); 및 Griffiths et al., EMBO J. 12:725-734 (1993)에서 찾을 수 있다.
추가적으로, 표준 재조합 DNA 기법을 이용하여 제조될 수 있는, 인간 부분 및 비-인간(non-human) 부분을 모두 포함하는, 키메라 단일클론 항체 및 인간화(humanized) 단일클론 항체와 같은 재조합 항체가 본 발명의 범위에 속한다. 그와 같은 키메라 항체 및 인간화 단일클론 항체는 본 발명이 속하는 기술 분야에서 알려진 재조합 DNA 기법에 의해 생산될 수 있다.
일반적으로, 본 발명의 항체(예를 들면, 단일크론 항체)는 친화도 크로마토그래피 또는 면역침전과 같은 표준 기법에 의해 본 발명의 폴리펩티드를 분리하기 위해 이용될 수 있다. 폴리펩티드-특이적 항체는 세포로부터 천연 폴리펩티드 및 숙주 세포에서 발현된 재조합기법에 의해 생산된 폴리펩티드의 정제를 촉진할 수 있다. 또한, 본 발명의 폴리펩티드에 대해 특이적인 항체는 폴리펩티드의 양(abundance) 및 발현 패턴을 평가하기 위해 (예를 들면, 세포 용해액, 세포 상층액, 또는 조직 시료에서) 폴리펩티드를 검출하기 위해 이용될 수 있다. 항체는 임상 테스트 절차의 일부로서, 예를 들면, 주어진 치료 계획(treatment regime)의 효능을 결정하기 위해, 조직에서 단백질 수준을 진단 목적으로 모니터링하기 위해 이용될 수 있다. 그의 검출을 촉진하기 위해 항체는 검출가능한 물질에 결합될 수 있다. 검출가능한 물질의 예는 다양한 효소, 보조 그룹(prosthetic group), 형광 물질, 발광 물질, 생물발광 물질, 및 방사성활성 물질을 포함한다. 적합한 효소의 예는 호스래디쉬 퍼옥시다아제(horseradish peroxidase), 알칼리 포스파타아제, 베타-갈락토시다아제, 또는 아세틸콜린에스테라아제를 포함하고; 적합한 보조 그룹 복합체(prothetic group complex)의 예는 스트렙타비딘/비오틴 및 아비딘/비오틴을 포함하며; 적합한 형광 물질의 예는 움벨리페론(umbelliferone), 플루오레세인(fluorescein), 플루오레세인 이소티오시아네이트, 로다민(rhodamine), 디클로로트리아지닐아민 플루오레세인, 단실 클로라이드(dansyl chloride) 또는 피코에리트린(phycoerythrin)을 포함하고; 발광 물질의 예는 루미놀을 포함하며; 생물발광 물질의 예는 루시페라아제, 루시페린, 및 에쿼린(aequorin)을 포함하고, 및 적합한 방사성활성 물질의 예는 125I, 131I, 35S 또는 3H를 포함한다.
항체는 또한 약물유전학 분석에서 유용할 수 있다. 그와 같은 구체에에서, 본 명세서에 따른 핵산에 의해 코딩되는 변이 단백질에 대한 항체, 예를 들면, 하나 이상의 본 발명의 다형성 마커를 포함하는 핵산에 의해 코딩된 변이 단백질에 대한 항체가 변형된 치료 방식을 필요로 하는 개체를 식별하기 위해 이용될 수 있다.
항체는 또한 질병의 활성 단계(active stage)와 같은 질병 상태에서, 또는 단백질의 기능과 관련된 질병, 특히, 유방암에 대한 소인을 갖는 개인에서 변이 단백질의 발현을 평가하기 위해 유용할 수 있다. 본 명세서에 기재된 하나 이상의 다형성 마커 또는 일배체형을 포함하는 핵산에 의해 코딩된 본 발명의 변이 단백질에 특이적인 항체가 상기 변이 단백질의 존재를 스크리닝하기 위해, 예를 들면, 상기 변이 단백질의 존재에 의해 표시된 바와 같이, 유방암에 대한 소인을 스크리닝하기 위해 이용될 수 있다.
항체는 다른 방법들에서 이용될 수 있다. 따라서, 항체는 전기영동 이동성(electrophoretic mobility), 등전점, 트립신 또는 기타 단백질분해효소에 의한 처리와 함께 본 발명의 변이 단백질과 같은 단백질을 평가하기 위한 진단 도구로서, 또는 본 발명이 속하는 기술 분야의 당업자에게 알려진 다른 물리적 분석법(physical assay)에서 이용하기에 유용하다. 항체는 또한 조직형 검사(tissue typing)에서 이용될 수 있다. 하나의 그와 같은 구체예에서, 특정한 변이 단백질이 특정한 조직형에서의 발현과 상관되며, 상기 변이 단백질에 대한 특이적 항체가 상기 특이적 조직형을 식별하기 위해 이용될 수 있다.
변이 단백질을 포함한, 단백질의 세포내 국재화(subcellular localization) 가 또한 항체를 이용하여 결정될 수 있고, 다양한 조직의 세포에서 단백질의 비정상적인 세포내 국재화를 평가하기 위해 적용될 수 있다. 그와 같은 용도는 유전적 테스트에 적용될 수 있으나, 또한, 특정한 치료 방식을 모니터링하기 위해 적용될 수 있다. 치료가 변이 단백질의 발현 수준 또는 존재, 또는 변이 단백질의 비정상적인 조직 분포 또는 발생에 따른 발현(developmental expression)을 정정하는 것을 목적으로 하는 경우, 상기 변이 단백질 또는 그의 단편에 대해 특이적인 항체가 치료 효능을 모니터링하기 위해 이용될 수 있다.
항체는 또한, 예를 들면, 변이 단백질이 결합 분자 또는 파트너에 결합하는 것을 차단하는 것에 의해 변이 단백질 기능의 저해를 위해 유용하다. 그와 같은 용도는 또한 치료가 변이 단백질의 기능을 저해하는 것을 포함하는 치료적 상황에 적용될 수 있다. 항체는 예를 들면, 결합을 차단하거나 또는 경쟁적으로 저해하여, 그에 의해, 단백질의 활성을 조절(즉, 촉진 또는 길항)하기 위해 이용될 수 있다. 특정한 기능을 위해 요구되는 부위를 포함하는 특정한 단백질 단편에 대한 항체, 또는 세포 또는 세포막과 결합된 완전한 단백질에 대한 항체가 제조될 수 있다. 인 비보 투여를 위해, 항체는 방사성 핵종(radionuclide), 효소, 면역원성 에피토프, 또는 세균성 독소를 포함한 세포독성제(디프테리아 또는 리신(ricin)과 같은 식물 독소)와 같은 추가적인 치료적 유효탑재물(therapeutic payload)과 결합될 수 있다. 항체 또는 그의 단편의 인 비보 반감기는 폴리에틸렌 글리콜로의 접합을 통한 페길화(pegylation)에 의해 증가될 수 있다.
본 발명은 또한 본 명세서에 기재된 방법에서 항체를 사용하기 위한 키트에 관한 것이다. 이는 테스트 시료에서 변이 단백질의 존재를 검출하기 위한 키트를 포함하나, 이에 한정되지 않는다. 하나의 바람직한 구체예는 표지된 또는 표지가능한 항체 및 생물학적 시료에서 변이 단백질을 검출하기 위한 화합물 또는 작용제, 상기 시료 중의 변이 단백질의 양 또는 존재 및/또는 부재를 결정하기 위한 수단, 및 상기 시료 중의 변이 단백질의 양과 표준을 비교하기 위한 수단, 및 키트의 사용 설명서를 포함한다.
이하, 본 발명은 하기의 비-한정적인 실시예에 의해 예시될 것이다.
본 발명의 전술된 것들 및 기타 목적, 특징 및 장점이 하기에 기재된 본 발명의 바람직한 구체예의 보다 구체적인 설명으로부터 명확할 것이다.
도 1은 아이슬란드 1 코호트로부터의 5p12에 대한 연관 데이터(association data)의 맵을 보여준다. 상부 패널은 물리적 위치(NCBI Build 34)에 따라 도시된, 1660명의 유방암 환자 및 11,563명의 대조군의 아이슬란드 1 코호트로부터의 Illumina Hap300 데이터로부터 유래된 연관 신호에 대한 P-값을 보여준다. 상기 영역 내의 6개의 동등 클래스(equivalence class)를 정의하는 주요 SNP로부터의 신호가 A 내지 F로 표시된다. 하부 패널에 재조합 핫스팟(hotspot), 염색체 밴드, 공지 된 유전자의 엑손 및 재조합률(recombination rate)의 위치가 도시된다. 하단에 HapMap Phase II 데이터(release 19)로부터 유래된 쌍대(pairwise) r2 값이 도시된다. 도트의 강도는 쌍대 r2 값의 크기에 비례한다. 재조합 핫스팟(recombination hotspot) 및 재조합률은 McVean et al. 2004 (본문 참조)에 의해 개시된 방법을 이용하여 유도된다.
실시예 1. 유방암의 위험도와 연관된 염색체 5p12 상의 변이의 확인
개요
유방암 감수성 유전자 BRCA1BRCA2 의 돌연변이가 유방암 위험도의 가족성 성분(familiar component)의 15 내지 25%를 차지한다[Easton, (1999), Breast Cancer Res, 1, 14-7; Balmain, et al., (2003), Nat Genet, 33 Suppl, 238-44]. 유방암의 위험도의 유전적 성분의 상당 부분이 규명되지 않았으며 개별적으로는 상당히 일반적일 수 있는, 보다 낮은 침투성의(less penetrant) 변이들의 조합으로부터 유래되는 것으로 사료된다[Pharoah, et al., (2002), Nat Genet, 31, 33-6]. 보다 낮은 침투성의 유방암 위험 변이에 대한 다수의 탐색이 후보 유전자, 케이스-대조군 연관 접근법을 이용하여 수행되었다. 이 연구들로부터의 발견은 종종 재현되기 어려운 것으로 판명되었다[Breast Cancer Association, (2006), J Natl Cancer Inst, 98, 1382-96]. 최근에, 두 유전자, CASP8TGFB1의 일반적인 미스센스 변이(common missense variant)가 양호한 검정력의 다중-중심 분석(well-powered, multi-center analysis)을 이용하여 유방암과 연관된 것으로 입증되었다[Cox, et al., (2007), Nat Genet, 39, 352-8]. 이들 보고는 목표가 유방암의 위험도의 크지 않은(modest) 증가를 부여하는 일반적인 변이를 확인하는 것인 경우, 적합한 재현성을 갖는 대규모 연구의 중요성을 강조한다.
결과
염색체 5p12 상의 영역 내의 다수의 Illumina SNP가 아이슬란드에서 유방암에 대한 증가된 위험도와 연관된다
유방암 감수성과 연관된 일반적인 SNP의 대립인자를 광범위하게 검색하기 위해, 본 발명자들은 Illumina HumanHap300 마이크로어레이 기술을 이용하여 게놈-전체 SNP 연관 연구를 수행하였다. 약 1,600명의 아이슬란드 유방암 환자들과 11,563명의 대조군에 대해 유전형 분석을 수행하였다. 이 발견 표본(discovery sample) 세트는 "아이슬란드 1"로 표시되었다. 품질관리 체크를 충족시키지 못한 SNP를 제거한 후, 311,524개의 SNP가 남았고 이들을 유방암과의 연관에 대해 테스트하였다. 게놈 대조(genomic control) 방법을 이용하여 결과를 개체들 간의 혈연관계(relatedness) 및 가능한 집단 계층화(population stratification)에 대해 보정하였다[Devlin and Roeder, (1999), Biometrics, 55, 997-1004](방법 참조). 신호에 대해 P-값에 의해 순위를 정하였다. 염색체 5p12 상의 동일한 영역으로부터의 일련의 SNP가 상위 50위 중 39개를 차지했다. 5p12에 위치한 SNP에 의해 차지된 최고 순위(rank)는 5위 내지 9위였다. 이 SNP들을 포함하는 목적 영역(region of interest)은 염색체 5의 좌표(co-ordinate) 44,094,392bp (마커 rs7704166의 위치; 본 명세서의 모든 좌표들은 NCBI Build 34를 기준으로 함)부터 동원체 전의 마지막 Illumina SNP의 위치, 즉, 46,393,984bp의 rs 10941803까지 전개되었다. 이 영역 내의 에서 Illumina SNP의 유전형분석으로부터의 결과가 표 1에 제시되며 도 1에 그래프로 도시된다.
높은 순위로 평가된 SNP 중 하나인 chr5p12 상의 마커 rs7703618과 관련된 신호들을 더 조사하기 위해, 본 발명자들은 이 SNP에 대한 Centaurus 분석법을 생성하고 검증하였다. 상기 Centaurus 분석법은 SG05S3065.c1로 표시하였다. 이 SNP 분석법을 이용하여 약 591명의 아이슬란드 유방암 환자 및 1314명의 대조군의 독립적인 표본을 대상으로 유전형분석을 수행하였다. 이 독립적인 표본은 아이슬란드 2로 표시하였다. 표 2에 표시된 바와 같이, 상기 SNP는 아이슬란드 2 표본에서 유방암과의 유의성 있는 연관을 보였고, 아이슬란드 1에서의 최초 발견을 확인했다. 따라서, 본 발명자들은 독립적인 아이슬란드 2 표본에서 아이슬란드 1 표본에서 관찰된 최초 발견을 재현하였다. 아이슬란드 1 및 아이슬란드 2에 대한 결합(joint) P-값은 테스트된 311,524개의 SNP에 대해 보수적인 Bonferroni 보정을 적용한 후 게놈-전체적으로 유의성있는 것으로 간주될 수준에 접근했다[Skol, et al., (2006), Nat Genet, 38, 209-13].
CGEMS 데이터에서 확인된, 염색체 5p12에 대한 연관은 CGEMS와의 결합 분석(joint analysis) 후 게놈-전체적으로 유의성이 있다
미국 국립 암 연구소(the U.S. National Cancer Institute)의 CGEMS(Cancer Genetics Markers of Susceptibility) 프로젝트가 Illumina 플랫폼을 이용하여 약 530,000개의 SNP에 대해 유전형분석된 1145명의 환자 및 1142명의 대조군에 기반한 게놈-전체 SNP 연관 연구에 대한 데이터를 공중에 공개했다. 이 데이터는 https://caintegrator.nci.nih.gov/cgems/에서 이용가능하다. CGEMS 프로젝트는 5p12 영역 내에서 게놈-전체적인 유의성있는 신호(genome-wide significant signal)를 발견하지 못했다. 그러나, 본 발명자들은 하나의 SNP, 즉, rs4415084가 아이슬란드(아이슬란드 1 코호트)로부터의 데이터와 CGEMS 데이터 세트가 함께 분석된 경우, Bonferroni 보정 후 게놈-전체적으로 유의성있는, 1.38E-07의 P-값을 가졌다는 것에 주목했다. 이 SNP는 CGEMS 데이터 세트에서 2.21E-03의 현저하지 않은 P-값을 가졌고, 주로 아이슬란드 1에 의해 보유된 결합 값(joint value)의 게놈 전체 유의성은 9.02E-06의 P-값이었다. 따라서, 그 자체로는 어디에서도 유의하지 않았으나, CGEMS 데이터는 염색체 5p12와의 연관에 대한 본 발명자들의 최초의 관찰에 대한 확인을 제공한다.
다수의 HapMap (비 Illumina) SNP 마커들이 5p12 영역에서 연관을 보였던 Illumina SNP와의 상관관계를 통해 BC 위험도 연관을 보일 수 있었다
본 발명자들은 이 유전자 좌에서 대립인자 이질성(allelic heterogeneity)이 있을 수 있다는 것, 즉, 테스트된 Illumina SNP 세트와 상이한 정도로 상관되고, 상이한 집단에서 상이한 빈도로 존재하는, 5p12 영역 내에 존재하는 둘 이상의 기 저 위험 변이(underlying 가 있을 수 있다는 것을 고려했다. 이는 대부분의 유의성 있는 마커들의 클러스터와 떨어진 유의성 있는 신호들이 있는 것으로 보인다는 관찰에 근거했다(도 1 참조). 또한, 본 발명자들은 일부 경우에, 아이슬란드 1 자료에서는 연관 신호들이 매우 강하나, CGEMS 데이터에서는 강하지 않다는 것에 주목했다: 예를 들면, 전술된 rs4415084 SNP는 아이슬란드 1에서는 매우 강한 신호를 가져왔으나, CGEMS 데이터에서는 강한 신호를 갖지 않았다. 마찬가지로, 아이슬란드에서 재현을 위해 성공적으로 테스트되었던 SNP, rs7703618은 6.93E-06의 P-값을 가졌으나, CGEMS 데이터 세트에서는 2.37E-02에 불과한 P-값을 가졌다. 5p12 영역에 대립인자 이질성이 있을 수 있다는 것을 고려하여, 본 발명자들은 본 발명자들이 아이슬란드 1 데이터 세트에서 발견했던 신호들과의 상관관계를 통해, 5p12 영역 내에서 모든 병원성 돌연변이를 검출하기 위해 이용될 수 있는 일련의 HapMap SNP를 정의했다. 그와 같은 일련의 HapMap SNP를 확인하기 위해, 본 발명자들은 먼저 아이슬란드 1 데이터 세트에서 10E-3 이하의 P-값을 가져오는 SNP들을 확인했다. 그 후, 본 발명자들은 이 세트를 동등성 클래스로 분류하고, 특정한 동등성 클래스의 구성물은 그들 간에 0.8보다 큰 r2 값을 갖는 두 개의 SNP로 정의했다. 이는 본 발명자들이 A 내지 F로 표시한 6개의 동등성 클래스의 세트를 가져왔다. 각 동등성 클래스에 대해, 본 발명자들은 해당 클래스에서 가장 유의성 있는 신호를 가져온 SNP(본 발명자들이 "주요(key)" SNP로 표시함)부터 시작하고, HapMap 데이터에 대한 참조에 의해, 본 발명자들은 상기 주요 SNP와 0.2 이상의 r2 값에 의해 상 관되고, Illumina Hap300 칩 상에 나타나지 않은 모든 HapMap SNP를 확인했다. 따라서, 아이슬란드 1 데이터를 이용하여, 본 발명자들은 여러 개의 상이한 동등성 클래스에서 신호를 관찰하였고, 이 사실은 그 자체로 대립인자 이질성에 대한 증거를 제공했다. 상기 HapMap SNP들은 또한, 본 발명자들이 확인한 하나 이상의 동등성 클래스 내의 SNP와의 상관관계를 통해, 본 발명자들이 최초에 발견했던 동일한 유방암 위험 연관을 검출하기 위해 이용될 수 있었다. 주요 SNP의 목록 및 그들의 HapMap SNP와의 상관관계가 표 4에 표시된다.
FGF10 및 MRPS30은 5p12 영역에서 가장 가능성있는 후보 유전자이다
도 1은 재조합 핫스팟, 염색체 밴드, 공지된 유전자, 및 재조합율의 맵 상에 중첩된(superimposed) 5p12 영역에서 수득된 연관 신호의 플롯을 보여준다. 재조합 핫스팟 및 재조합율은 McVean 등에 의해 기재된 바와 같이 결정하였다[McVean, et al., (2004), Science, 304, 581-4]. 상기 영역 내의 HapMap SNP 간의 r2 값의 표현도 도시된다. 상기 영역에 불충분하게 규명된(poorly characterized) 유전자 LOC441070과 함께, 주목되는 3개의 공지된 유전자가 있다는 것을 알 수 있다; FGF10, MRPS30, 및 HCN1. 이들 중 2개, FGF10 및 MRPS30은 유방암 소인과의 관여에 대해 강력한 후보이다.
Howard 및 Ashworth에 의해 검토된 바와 같이[Howard and Ashworth, (2006), PLoS Genet, 2, e112], FGF10은 유방의 정상적인 배아 발달을 위해 요구된다. FGF10은 MMTV 삽입 돌연변이생성(insertional mutagenesis)에 의한 유방암의 마우스 모델에서 발암 유전자로 관여되었으며 FGF10은 인간 유방암의 약 10%에서 과발현된다[Theodorou, et al., (2004), Oncogene, 23, 6047-55]. 도 1에 도시된 바와 같이, FGF10 유전자는 재조합 핫스팟에 의해 연관 신호들의 주요한 클러스터로부터 분리되어 있다. 그러나, FGF10의 조절을 제어하는 주요 요소가 강한 연관 신호가 일어나는 영역에 존재할 수 있다. 대안적으로, 연관 신호는 FGF10 유전자 자체 내의 병원성 돌연변이와 연관 불균형일 수 있다.
MRPS30 유전자는 미토콘드리아 28S 리보솜 서브유닛을 코딩한다. 상기 유전자는 또한 PDCD9(programmed cell death protein 9)로도 알려져 있다. 이 유전자는 오골계(Gallus gallus)의 아폽토시스 촉진 단백질(pro-apoptotic protein) p52의 포유동물 대응물이다. 상기 유전자는 포유동물 세포에서 아폽토시스를 유도하고 스트레스-반응성(stress-responsive) JNK1 경로를 활성화하는 것으로 확인되었다. 상기 단백질은 적어도 부분적으로 Bcl-2 경로를 통해 아폽토시스에서 기능하는 것으로 보인다[Sun, et al., (1998), Gene, 208, 157-66; Carim, et al., (1999), Cytogenet Cell Genet, 87, 85-8; Cavdar Koc, et al., (2001), FEBS Lett, 492, 166-70]. 상기 단백질은 이전에 유방암에 관여되지 않았었으나, 전술된 경로에의 관여는 MRPS30의 유전적 변이가 유방암 위험도를 변형시키는 것에 관여될 수 있다는 것을 시사한다.
방법
환자 및 대조군 선택
본 연구의 허가는 아이슬란드의 국가 생명윤리 위원회(the National Bioethics Committee) 및 아이슬란드 데이터 보호국(the Icelandic Data Protection Commission)에 의해 허여되었다. 유방암 진단의 기록은 아이슬란드 암 등록부(Icelandic Cancer Registry, ICR)로부터 수득하였다. 기록은 1955년 1월 1일부터 아이슬란드에서 침윤성 유방암 및 유관내암(ductal carcinoma in situ) 또는 소엽내암(lobular carcinoma in situ)으로 진단된 모든 케이스를 포함했다. 2005년 12월 말까지 ICR에 입력된 진단을 가진 아이슬란드에 살고 있는 모든 사람들이 본 연구에 참여할 수 있었다. ICR은 이 기간 동안 진단된 4603명의 개인의 기록을 포함했다. 모든 생존 환자(약 2840명)를 포함하는 유병 코호트(prevalence cohort)는 본 연구로의 동원에 적격이었다. 본 발명자들은 2210명의 환자로부터 고지된 동의, 혈액 시료, 및 임상 정보를 수득했고, 이는 약 78%의 참여율이었다. 유전형 분석은 rs7703618에 대해 총 2190명의 환자에서 성공적이었다. 이 환자군의 동원에 대한 보다 상세한 사항은 이전에 보고되었다[Stacey, et al., (2006), PLoS Med, 3, e217].
12,904명의 아이슬란드 대조군은 아이슬란드 가계 데이터베이스(Icelandic Genealogical Database)로부터 무작위로 선택된 846명과 deCODE에서 진행중인 다른 게놈-전체 연관 연구로부터의 12,058명으로 구성되었다. ICR에서 유방암 진단을 가진 개인들은 배제시켰다. 남성 및 여성 모두 포함시켰다.
Illumina 유전형분석
제조사의 설명서에 따라, DNA 시료에 대해 International HapMap 프로젝트의 Phase I으로부터 유래된 317,503개의 SNP를 포함하는 Illumina Infinium HumanHap300 SNP 비드 마이크로어레이(Illumina, San Diego, CA, USA) 상에서 유전형 분석을 수행하였다. 이 칩은 r2 >0.8의 일반적인 SNP에 대해 Utah CEPH (CEU) HapMap 표본에서 약 75% 게놈 범위(genomic coverage)를 제공한다[Barrett and Cardon, (2006), Nat Genet, 38, 659-62]. 상기 칩 상의 SNP의 총 갯수 중에서, 5979개는 단형성(monomorphic)이거나(즉, 통합된 환자 및 대조군 세트에서 소수 대립인자 빈도(minor allele frequency)가 0.001 미만임) 또는 낮은(<95%) 수율을 갖거나, 또는 대조군의 하디-와인버그 평형(Hardy-Weinberg equilibrium)으로부터 매우 유의성 높은 왜곡을 보였기 때문에(P< 1x10-10) 적합하지 않은 것으로 간주되었다. 이와 같은 문제있는 SNP들을 모두 분석으로부터 제거하였다. 따라서, 연관 분석에서 311,524개의 SNP를 이용하였다. 98% 미만의 SNP의 전체 콜 레이트(call rate)를 갖는 칩도 게놈-전체 연관 분석에서 배제하였다.
Centaurus SNP 유전형분석
rs7703618에 대해 Centaurus 분석법 [Kutyavin, et al., (2006), Nucleic Acids Res, 34, e128]을 설계하고 HapMap CEU 표본의 유전형을 분석하고 유전형을 발표된 데이터와 비교하는 것에 의해 검증하였다. 상기 분석법은 HapMap 데이터와 1.5% 미만의 불일치(mis-match)를 가져왔다. 표 5는 본 명세서에서 검토된 주요 SNP에 대한 서열 배경(sequence contxt)을 보여준다. 표 6은 본 연구에서 유전형분석을 위해 개발된 마커 rs7703618에 대한 Centaurus 분석법의 세부사항을 보여준다.
통계적 방법
본 발명자들은 승법 모델을 가정하여, 즉, 한 명이 보유한 두 개의 대립인자의 상대적 위험도가 곱해진다는 것을 가정하여 SNP 대립인자의 오즈비(OR)를 계산하였다. 마커에 대해, 보인자 빈도가 아닌, 대립인자 빈도가 제시된다. NEMO 소프트웨어 패키지 [Gretarsdottir, et al., (2003), Nat Genet, 35, 131-8]에서 구현된 바와 같은 표준 가능성 비 카이-스퀘어 통계값(standard likelihood ratio Chi-squared statistic)으로 연관된 P-값을 계산했다. OR의 추정값이 로그-노말 분포(log-normal distribution)을 갖는 것으로 가정하여, 신뢰 구간을 계산하였다. .
일부 아이슬란드 환자들과 대조군은 그룹 내 및 그룹들 간에 관계되어, 카이-스퀘어 검정 통계값이 1보다 큰 평균값 및 0.6752보다 큰 중앙값을 갖게 했다. 본 발명자들은 혈연관계 및 잠재적인 집단 계층화를 고려한, 게놈-전체 SNP 세트에 대한 관찰된 카이-스퀘어 통계값의 평균을 계산하는 것에 의해 게놈 대조(genomic control)의 방법을 이용하여 [Devlin and Roeder, (1999), Biometrics, 55, 997- 1004] 아이슬란드 1에 대한 팽창 인자(inflation factor)를 추정하였다. 마커의 게놈-전체 세트에 의해 분석되지 않았던, 아이슬란드 2에 대해, 팽창 인자는 아이슬란드 가계(genealogy)를 통해 유전형을 시뮬레이션하는 것에 의해 추정하였다[Grant, et al., (2006), Nat Genet, 38, 320-3]. 추정된 팽창 인자는 아이슬란드 1에 대해 1.105였고, 아이슬란드 2에 대해 1.11이었다. 아이슬란드 1 및 아이슬란드 2 표본 세트의 결합 분석에 대해 추정된 팽창 인자는 시뮬레이션에 의해 수득된, 1.08이었다.
모든 P-값은 양측(two-sided) P-값으로 보고된다.
Figure 112009078431185-PCT00001
Figure 112009078431185-PCT00002
Figure 112009078431185-PCT00003
Figure 112009078431185-PCT00004
Figure 112009078431185-PCT00005
Figure 112009078431185-PCT00006
Figure 112009078431185-PCT00007
Figure 112009078431185-PCT00008
Figure 112009078431185-PCT00009
Figure 112009078431185-PCT00010
Figure 112009078431185-PCT00011
Figure 112009078431185-PCT00012
Figure 112009078431185-PCT00013
Figure 112009078431185-PCT00014
Figure 112009078431185-PCT00015
Figure 112009078431185-PCT00016
Figure 112009078431185-PCT00017
Figure 112009078431185-PCT00018
Figure 112009078431185-PCT00019
Figure 112009078431185-PCT00020
Figure 112009078431185-PCT00021
Figure 112009078431185-PCT00022
Figure 112009078431185-PCT00023
Figure 112009078431185-PCT00024
실시예 2. 염색체 5p12 상의 연관 신호의 정립(refinement), 임상적 변수들 과의 상관 관계 및 염색체 10q26 상의 FGFR2 유전자 좌의 연구.
본 발명자들이 염색체 5p12 상에서 확인한 신호들은 낮은 재조합을 보이는 염색체 5p12-11의 긴 부위(stretch)에 존재한다. 이 영역에서, 본 발명자들은 Illumina Hap300 칩 세트로부터의 10개의 SNP를 선택하고, Centaurus SNP 분석법을 생성하고[Kutyavin, et al., (2006), Nucleic Acids Res, 34, e128] 아이슬란드로부터의 추가적인 표본 및 스웨덴, 네덜란드, 스페인 및 미국으로부터의 재현 표본에서 이들을 분석(type)했다. 전체적으로, 유럽 선조로부터의 5028명의 케이스와 32090명의 대조군을 연구했다. 상기 영역에서 가장 강하게 연관된 Illumina SNP는 rs4415084였고, T 대립인자는 1.16의 통합(combined) 오즈비(OR) 및 6.4x10-10의 P 값을 가져왔고, 이는 게놈-전체 유의성에 대한 Bonferroni 기준을 충족시킨다(표 6). 재현 표본만의 경우, rs4415084는 1.14 (P =7.5 x 10-5)의 OR을 가져왔다. 상기 신호를 정립하기 위해, 본 발명자들은 Illumina 칩 상에 존재하지 않으나, Hap300 SNP와 LD여서 상당한 신호를 생성하는, 추가적인 11개의 SNP를 분석하였다. 이 SNP들로부터의 데이터가 표 6 및 표 7에 제시된다. 가장 강한 전체 신호(OR 1.19, P = 2.9x10-11 )는 rs4415084 (아이슬란드 집단에서, D'=0.99, r2= 0.51, 표 8)에 상관된, 비-Illumina SNP인 rs10941679의 G 대립인자로부터 유래했다.
대립인자 G-rs10941679는 T-rs4415084보다 덜 빈번하고 T-rs4415084 배경 상에 거의 완전히 포함된다. 그러나, 다변량 분석(multivariate analysis)에서, T-rs4415084은 G-rs10941679 (P= 0.042)에 대한 보정 후에 명목적 유의성(nominal significance)을 유지했고, 그 반대의 경우도 마찬가지였다(vice versa)(P= 0.0017, 표 9). 따라서, 높은 상관관계에도 불구하고, 상기 SNP들 중 어느 것도 5p12에서 관찰된 신호를 완전히 설명하지 못한다. 본 발명자들은 T-rs4415084와 G-rs10941679가 모두 유방암의 위험도를 부여하는 것으로 결론지었다. 다변량 분석은 SNP rs7703618로부터의 신호가 T-rs4415084 또는 G-rs10941679에 의해 완전히 설명될 수 있다는 것을 밝혔다(표 9).
본 발명자들은 환자들의 의료 기록이 입수가능한 경우, 이를 검토하고, 5p12 상의 두 개의 위험 변이 및 염색체 10 상의 FGFR2 유전자 좌에 있는 마커 rs1219648에 대해 아이슬란드 및 재현 표본 세트로부터의 통합된 데이터를 분석했다. 세개의 변이 모두 에스트로겐 수용체(estrogen receptor, ER) 음성 종양보다 ER 양성 유방암의 유의성있게 더 높은 위험도를 부여했다(표 6 및 표 10). 유사한 차별적 위험도(preferential risk)가 5p12 변이에 대해 프로게스테론 수용체 양성 종양에서 발견되었다(표 10). 본 발명자들은 이전에 2q35 및 16q12 상의 감수성 변이가 특히 ER 양성 종양과 연관된 것으로 보고하였다 [Stacey, et al., (2007), Nat Genet]. 본 발견은 ER 양성 종양 및 ER 음성 종양이 그들의 위험도에 대해 상이한 유전적 성분을 갖는다는 견해에 추가적인 뒷받침을 더한다.
5p12 SNP는 또한 보다 낮은 조직학적 등급(histological grade)과의 연관성을 보였으며, 이는 다변량 분석에서 ER 상태와의 연관에 의해 설명되었다. FGFR2 SNP는 결절 음성 종양(node negative tumour)보다 결절 양성 종양에서 더 빈번했다. 종양 단계 또는 조직병리학과의 유의성 있는 연관은 없었다(표 10). 진단시 연 령(age at diagnosis)과 유의성 있는 연관을 보이는 변이는 없었다. FGFR2 SNP는 이전의 보고[Huijts, et al., (2007), Breast Cancer Res, 9, R78; Easton, et al., (2007), Nature 447:1087-93]와 일치되게, 유방암의 가족력과 연관되었다. 통계적 유의성은 없으나, 유사한 경향이 5p12 SNP에 대해서도 관찰되었다(표 11).
방법
환자 및 대조군 선택:
고지된 동의 및 헬싱키 선언(Declaration of Helsinki)에 따른 윤리 위험회 허가 하에 연구 대상으로부터 혈액 시료 및 의료 정보의 수집을 수행하였다.
아이슬란드 : 유방암 진단의 기록은 아이슬란드 암 등록부(Icelandic Cancer Registry, ICR)로부터 수득하였다. ICR은 1955년 1월 1일 이후 아이슬란드에서 진단된 침윤성 유방 종양 및 유관상피내암 및 유소엽상피내암(ductal and lobular carcinoma in-situ)의 모든 케이스를 포함했다. 2006년 12월 말까지 ICR에 입력된 진단을 가진 아이슬란드에 살고 있는 모든 유병 케이스가 본 연구의 참여 대상이 될 수 있었다. ICR은 이 기간 동안 진단된 4785명의 기록을 포함했다. 동의 하에, 약 2277명의 환자들로부터 시료 및 성공적인 유전형을 수득하였다. 이들 중에서, 유전형은 1791명의 환자에 대해서는 Illumina Hap300 칩으로부터 유래되었고, 486명의 환자에 대해서는 Centaurus 분석법으로부터 유래되었다. 26,199명의 아이슬란드 대조군은 deCODE에서 진행 중인 Illumina-기반 게놈-전체 연관 연구로부터 선택된 개인들로 구성되었다. ICR에 유방암의 진단을 갖는 개인들은 배제시켰다. 남성 및 여성이 모두 포함되었다. 아이슬란드 대조군(및 하기에 기재된 외국 재현 대조군)에서, 표 6에 열거된 SNP의 빈도에서 성별 간의 유의성 있는 차이는 없었다. 따라서, 본 발명자들은 이 대조군들이 조사대상인 SNP의 집단 빈도의 타당한 대표성을 제공하는 것으로 간주하였다.
스페인 : 스페인 연구 환자들은 2006년 3월부터 2007년 8월까지 사라고바(Zaragoza) 병원의 종양과로부터 모집되었다. 약 642명의 환자에 대해 유전형 분석이 만족스럽게 수행되었다. 1540명의 성공적으로 유전형이 분석된 대조군은 암이 아닌 다른 질환으로 사라고바의 대학병원에 다녔다. 혈액 시료를 채취하기 전에 과거 암 병력을 가진 자를 배제시키기 위해 대조군을 문진했다. 모든 환자와 대조군은 유럽 선조 기원이었다.
스웨덴 : 스웨덴 표본 세트는 가족성(Familiar) 및 순차적(Consecutive) 환자 계열로 구성되었다. 가족성 유방암 동원 그룹은 스톡홀름, 카롤린스카 대학 병원의 종양유전학 카운셀링 클리닉에 유방암의 가족력 조사를 위해 위임된 347명의 유방암 환자들로 구성되었다. 각 환자는 별개의 가족으로부터 유래되었다. BRCA 돌연변이 스크리닝을 위한 현재의 기준을 충족시킨 모든 케이스는 음성으로 테스트되었다. 순차적 유방암 동원 그룹(Consecutive breast cancer recruitment group)은 1998년 10월부터 2000년 5월까지 후딩게(Huddinge) 및 쇼데르(Soder) 병원(남부 스톡홀름의 인구 담당)의 종양과에서 원발성 침윤성 유방암에 대해 외과적 수술로 치료받은 환자들을 동원했다. 동원을 위한 환자의 선택에서 가족력은 고려되지 않았다. 대조군은 양 성별의 1302명의 헌혈자 및 448명의 암-불포함(cancer-free) 개인 들이었다. 모든 대조군은 스톡홀름, 카롤린스카 대학 병원에서 모집되었다. 테스트된 SNP에 대해 가족성 계열와 순차적 계열 간의 유의성있는 이질성의 증거는 없었다.
네덜란드 : 2005-2006의 기간에 유방암으로 진단받은 여성 환자들을 네덜란드, 네이메헨(Nijmegen)에 있는 종합 암 센터 동부(Comprehensive Cancer Centre East)에 의해 관리된 지역 암 등록부(regional cancer registry)로부터 선택하였다. 이 암센터는 집단-기반 암 등록부를 유지하고 130만명이 거주하는 네덜란드의 동부를 관장한다. 70세 전에 유방암으로 진단된 모든 환자들에게 본 연구에 참가할 것을 요청하였다. 상기 종합 암센터 동부는 암 등록부에 있는 모든 환자들에 대해 임상 및 병리 데이터를 수집하였다. 이 표준 암 등록부 데이터를 환자들이 치료받았던 병원에 있는 의료 파일로부터 추출된 보다 상세한 데이터로 보충하였다. 대조군은 라드바우드(Radboud) 대학교 네이메헨 의료 센터에 의해 2002-2003년에 조사(survey)에서 모집되었다. 이 조사, 네이메헨 생체의학 연구(Nijmegen Biomedical Study)는 네이메헨 인구의 연령-계층화 랜덤 표본에 기반하였다. 이 그룹으로부터, 환자 집단에 빈도별로 연령-일치시킨 2034명의 대조군을 선택하고 유전형 분석을 수행하였다.
미국 다민족(multiethnic) 코호트: 다민족 코호트 연구(Multiethnic Cohort study, MEC)는 하와이와 로스엔젤레스의 215,000명 이상의 남성 및 여성(캘리포니아의 다른 지역으로부터의 추가적인 아프리카계-미국인 포함)으로 구성되었다. 상기 코호트는 주로 식이 습관, 인구통계적 인자, 개인적 행동, 과거 병력(histroy of prior medical conditions), 일반적인 암의 가족력(family history of common cancers), 및 여성의 경우, 출산력 및 외래 호르몬의 이용에 관한 상세한 정보를 묻는 26-페이지 자체-작성된(self-administered) 설문지를 완성하는 것에 의해 1993년부터 1996년 사이에 본 연구에 참가한 아프리카계 미국인, 하와이 원주민, 일본계 미국인, 라틴 아메리카인 및 유럽계 미국인으로 구성되었다. 참가자들은 등록 당시 45세 내지 75세였다. MEC에서 우발적 암(incident cancer)은 하와이 및 로스앤젤레스 카운티를 포함하는 집단-기반 암 SEER(Surveillance, Epidemiology, and End Results) 등록부 및 캘리포니아 전 지역을 포함하는 캘리포니아 주 암 등록부(California State Cancer Registry)에 대한 코호트 연결(cohort linkage)에 의해 확인되었다. 1994년부터 시작하여, 상기 코호트에서 유전적 분석을 위한 대조군 풀로 작용할 수 있도록 우발적 유방암 케이스 및 MEC 참가자들의 랜덤 표본에서 혈액 시료를 채취하였다. 네스티드 유방암 케이스-대조군 연구(nested breast cancer case-control study)에서 적격(eligible) 케이스들은 MEC 등록 후부터 2002년 12월 31일까지 우발적 침윤성 암으로 진단받은 여성들로 구성되었다. 대조군은 상기 코호트로의 참가 전 및 2002년 12월 31일까지 유방암으로 진단되지 않은, 유방암을 갖지 않는 참가자들이었다. 대조군은 (5-년 간격으로) 인종/민족 및 연령에 기반하여 케이스에 빈도를 일치(frequency match)시켰다.
나이지리아 : 본 발명자들은 나이지리아, 이바단(Ibadan)으로부터 689명의 유방암 케이스 및 469명의 대조군의 유전형을 수득하였다. 케이스는 공개(presentation)시 모집하고 나이지리아, 이바단의 University College 병원의 외 과 및 방사선치료과에서 이후에 조직학적으로 확인하였다. 이 병원은 3백만명의 관할구역(catchment area)으로 기능하고 이 지역의 다른 병원에 대한 종양 이관 센터(oncology referral center)이다. 집단-기반 대조군은 병원 주위의 지역 사회로부터 무작위로 모집하였다. 지역사회 진단 과정(community consultation process) 후에, 대조군 대상자들을 본 연구를 위해 설치된 클리닉에 다니도록 요청했다. 대조군은 모집 시 암이 없었고 18세 이상이었다.
유전형분석(genotyping)
약 1791명의 아이슬란드 환자 및 26199명의 대조군에 대해, 이전에 개시된 바와 같이[Stacey, et al., (2007), Nat Genet 39:865-9] Illumina Hap300 SNP 어레이 상에서 유전형 분석을 수행하였다. 모든 다른 유전형분석은 표 7에 표시된 SNP에 대해 생성된 Nanongen Centaurus 분석법 [Kutyavin, et al., (2006), Nucleic Acids Res, 34, e128]을 이용하여 수행하였다. 프라이머 서열은 주문으로 입수가능하다. Centaurus SNP 분석법은 HapMap CEU 표본의 유전형을 분석하고 상기 유전형을 공개된 데이터와 비교하는 것에 의해 검증하였다. 분석법이 HapMap 데이터와 1.5% 이상의 불일치를 보이는 경우, 그 분석법은 탈락되었다. 아이슬란드 케이스 표본의 약 10%를 Illumina 및 Nanogen 플랫폼 모두에서 유전형을 분석하였고 관찰된 불일치율은 0.5% 미만이었다. 모든 유전형 분석은 deCODE Genetics 시설에서 수행하였다. 모든 물리적 좌표는 NCBI Build 35에 따라 표시된다.
임상적 파라미터
에스트로겐 및 프로게스테론 수용체 상태는 의료 기록에 보고된 면역조직화학적 분석 결과 또는 면역측정(immunometric) 분석 결과로부터 도출되었다. 10 fmol/mg 이상의 수용체 수준 또는 10% 이상의 양성 핵(positive nuclei)의 면역조직화학적 관찰을 양성으로 간주하였다. 단계는 AJCC(the American Joint Committee on Cancer), 6 판에 따라 결정하였다. 조직학적 서브타입은 하기와 같은 SNOMED-M (또는 동등한 ICDO) 코드로부터 결정하였다: "침윤성 관상암종(Invasive Ductal Carcinoma)" 8500/3, 8521/3; "DCIS"(Ductal Carcinoma In-Situ and related in-situ carcinomas): 8500/2, 8050/2, 8201/2, 8501/2, 8503/2, 8507/2, 8522/2; "침윤성 소엽암종(Invasive Lobular Carcinoma)" 8520/3; "LCIS" (Lobular Carcinoma In-Situ): 8520/2; "관상 또는 점액성(Tubular or Mucinous)":8211/3, 8480/3, 8481/3; "수질 암종(Medullary Carcinoma)" 8510/3, 8512/3; "혼합 침윤성(Mixed Invasive)" 8522/3, 8523/3, 8524/3, 8541/3, 8543/3; "기타 침윤성(Other Invasive)" 8050/3, 8141/3, 8200/3, 8260/3, 8323/3, 8401/3, 8490/3, 8501/3, 8503/3, 8504/3, 8530/3, 8540/3. 하기의 비-특이적 코드를 갖는 종양은 조직병리적 타입의 분석에서 배제시켰다: 8000/3, 8010/2, 8010/3, 8010/6, 8020/3, 8140/2, 8140/3, 8230/3. 조직학적 등급(Histological Grade)은 Nottingham (Elston-Ellis modification of the Scarff-Bloom-Richardson) 시스템에 따라 규정하였다. 결절 상태(node status)를 단계 I 내지 IIIB에 대해 분석하고 액와 림프절 절제(axillary lymph node dissection) 및/또는 전초 림프절 생검(sentinel node biopsy)에 의해 수득된 병기 결정(pathological staging)에 근거했다. 스웨덴 가족성(Sweden Familal) 표본 세트는 임상적 파라미터의 분석에서 이용되지 않았다.
통계적 분석
본 발명자들은 승법(multiplicative) 모델을 가정하여, 즉, 개인이 보유한 두 개의 대립인자의 상대적 위험도는 곱해진다는 것을 가정하여 각 SNP 대립인자에 대한 OR을 계산하였다. 마커에 대해, 대립인자 빈도 및 OR이 제시된다. 연관된 P-값은 NEMO 소프트웨어 패키지(Gretarsdottir S., et al., Nat. Genet. 35:131-38 (2003))에 구현된 바와 같이, 표준 가능성 비 카이-스퀘어 통계값(standard likelihood ratio Chi-squared statistic)에 근거하여 계산하였다. 신뢰 구간은 OR의 추정값이 로그-노말(log-normal) 분포를 갖는 것으로 가정하여 계산하였다. 하나의 SNP의 유전형이 개체에 대해 결실된 경우마다, 강한 LD인 SNP에 대해, 상관관계를 갖는 SNP의 유전형을 이용하여 이전에 개시된 바와 같이(Gretarsdottir S., et al., Nat. Genet. 35:131-38 (2003)) 가능성 접근방법(likelihood approach)를 통해 유전형을 부여하였다. 이는 상이한 SNP에 대해 제시된 결과가 동일한 수의 개체들에 기반되도록 하여, OR 및 P-값의 의미있는 비교를 가능하게 했다. 그룹들이 대립인자 또는 유전형에 대해 상이한 집단 빈도를 가질 수 있으나, 공통된 상대적 위험도를 갖는 것으로 가정하는 것인 Mantel-Haenszel 모델을 이용하여 복수 개의 케이스-대조군 재현 그룹의 결합 분석(joint anaylsis)을 수행하였다. 이질성의 테스트는 귀무 가설(null hypothesis) 하에 모든 그룹에서 대립인자 빈도가 동일하다 는 것을 가정하는 것에 의해 수행하였으나, 대립 가설(alternative hypothesis)에서 각 그룹은 상이한 대립인자 빈도를 가졌다. 그룹 식별자(group indicator)를 공변량(covariate)으로 이용한 다항 로지스틱 회귀(polytomous logistic regression)에 해당하는 확대 Mentel-Haenszel 모델을 이용하여 복수 개의 케이스-대조군 재현 그룹의 결합 분석을수행하였다. 테스트된 SNP에 대해 재현 표본 세트 간에 이질성의 증거는 없었다. 위험 변이와 진단시 연령 및 조직학적 등급과의 연관을 파라미터 값과 각 개체에 의해 보유된 위험 대립인자의 카피 수 간의 선형 회귀(linear regression)에 의해 테스트하였다.
가족력의 분석을 위해, 본 발명자들은 본 발명자들의 이전의 방법(Amundadottir L.T., et al., PLoS Med. 1:e65 (2004))을 유전형 특이적 가족성 상대적 위험도(genotype-specific familial relative risk)(gfRR gt )를 반영하도록 개조하는 것에 의해 각 유전형에 대해 1촌 친척(first degree relative)에 대한 가족성 상대적 위험도를 계산하였다. 각 SNP 유전형에 대해, 본 발명자들은 하기와 같이 gfRR gt 를 결정하였다:
Figure 112009078431185-PCT00025
식 중에서, r은 유전형 gt를 갖는 유방암의 1촌 친척의 수(유전형 gt를 갖는 1명 이상의 환자와 혈연관계를 갖는 개인의 경우 복수 계수함)이고 a는 유방암에 걸린 유전형 gt 를 갖는 유방암 환자의 1촌 친척의 수이다. 분모에서, n은 집단의 크기이고, x는 집단에서 (ICR 기록으로부터)상기 질병에 걸린 사람의 수(ICR 기록으로부터)이다. 하나의 유전형의 관찰된 gfRR gt 을 또 다른 유전형에서 관찰된 값과 비교하기 위해, 본 발명자들은 비 gfRR gt1 /gfRR gt2 를 계산하였다. 이 비의 유의성은 시뮬레이션에 의해 결정하였다: 각 gfRR gt 에 대한 대조군은 해당 SNP에 대해 유전형이 분석된 유방암 환자들의 세트로부터 무작위로 추출하였다. 대조군은 각각의 상응하는 gfRR gt 그룹과 동일한 크기였고 아이슬란드 가계 데이터베이스에 열거된 부모의 수(0, 1, 또는 2)에 조화시켰다. 대조군 gfRR gt1 /gfRR gt2 비의 일만회 반복(iteration)을 계산하고 대조군에 대한 상기 비가 관찰된 gfRR gt1 /gfRR gt2 와 일치되거나 또는 관찰된 값을 초과하는 빈도를 계수하는 것에 의해 P 값을 결정하였다.
본 발명자들은 하디-와인버그 평형을 가정하여 집단에서 유전형 빈도를 추정하는 것에 의해 유전형 특이적 OR을 계산하였다. 승법성으로부터의 유의성 있는 편차는 관찰되지 않았다. 대립인자 계수(allele count)의 상관관계 테스트를 이용하고 보인자와 비-보인자의 케이스-대조군 연관에 의해 유전자 좌 간의 잠재적인 상호작용을 조사하였다. 유의성 있는 상호작용은 관찰되지 않았다.
일부 아이슬란드 환자 및 대조군은 상호 간에 혈연관계를 가져서, 그룹 내에서 및 그룹 간에 χ2 통계값이 1보다 큰 평균을 갖게 하였다. 본 발명자들은 이전에 개시된 바와 같이(Grant S.F., et al., Nat Genet 38:320-3 (2006)), 아이슬란드 계통(Icelandic genealogy)를 통해 유전형을 시뮬레이션하는 것에 의해 팽창 인자 를 추정하고, 아이슬란드 OR에 대한 χ2 통계값을 보정하였다. 추정된 팽창 인자는 아이슬란드인(케이스 및 대조군)의 완전한 세트에 대해 1.08이었으나, 임상적 표현형의 분석에서 이용되었던 모든 나머지 서브세트에 대해서는 보다 작았으나, 1 이상이었다.
Figure 112009078431185-PCT00026
Figure 112009078431185-PCT00027
Figure 112009078431185-PCT00028
Figure 112009078431185-PCT00029
Figure 112009078431185-PCT00030
Figure 112009078431185-PCT00031
Figure 112009078431185-PCT00032
Figure 112009078431185-PCT00033
Figure 112009078431185-PCT00034
Figure 112009078431185-PCT00035
Figure 112009078431185-PCT00036
Figure 112009078431185-PCT00037
Figure 112009078431185-PCT00038
Figure 112009078431185-PCT00039
Figure 112009078431185-PCT00040
Figure 112009078431185-PCT00041
Figure 112009078431185-PCT00042
Figure 112009078431185-PCT00043
Figure 112009078431185-PCT00044
Figure 112009078431185-PCT00045
Figure 112009078431185-PCT00046
Figure 112009078431185-PCT00047
Figure 112009078431185-PCT00048
Figure 112009078431185-PCT00049
Figure 112009078431185-PCT00050
Figure 112009078431185-PCT00051
Figure 112009078431185-PCT00052
Figure 112009078431185-PCT00053
Figure 112009078431185-PCT00054
SEQUENCE LISTING <110> deCODE Genetics ehf <120> GENETIC VARIANTS ON CHR 5p12 AND 10q26 AS MARKERS FOR USE IN BREAST CANCER RISK ASSESSMENT, DIAGNOSIS, PROGNOSIS AND TREATMENT <130> 2513-PC00 <160> 237 <210> 1 <211> 599 <212> DNA <213> Homo sapiens <400> 1 tttgtagcct aggaggaata ggctaaacca tatagcctag gtatatagca ggtgattcca 60 tctaggtttt tgtaaatatt ctctgtgatg tttacataat gacaaaaatc acctagtgat 120 gtatttctca gaacaaagtc ttatcaagca gcatgactat atagttgatc cttgaacaac 180 actggagtta ggggtgtata catctcacat aggcaaaaat ccaagcataa ctttttaaaa 240 tccccaaaac ttaactacta atagcctact attgaaggga ggccttacta atagcataar 300 tagttgacta aaacatattt tttattttat atgcattata ttacaataaa gtaagataga 360 gaaaagcaaa tgtttttaag acaattataa ggaagagaaa atatatttat tattcattaa 420 gtgaaagtag atcatcataa aggtcttcat cctcatcaac ttcatgttgt ttaggctgat 480 gaggaagagg aggagttagt cttgttttct caggggtagt agaggcagaa taaaatctgt 540 gtataagtgg acccacatgg ttcaaacttg tgttgttcaa gggtcaattg tatatgtag 599 <210> 2 <211> 599 <212> DNA <213> Homo sapiens <400> 2 agctgggcca gagaggatgg ggttagaatg ggcttgactc tggcttgaag ctgatggccc 60 aggcaccatg tttccaggcc tcataatggc tacctgtcca gacaccagaa tccagaggca 120 caaatcaaag atgtaagcta acagacaaat caatcaagta tcaaaaatat cagagaagca 180 acaattttat gactttaaca tatctaacag agaaagcata atcctgtttc aacaaaccca 240 ggcaaaaatg tctaaattaa cttttgaaga aatttttatt ttattttacc aacagttttm 300 aaaccagctt tatttaccaa agaccactaa agttacatga acttgaaagc attttagcta 360 gccatttagt ttatgggcac tcatttattt ataagtcagt ttagtacctg tagacaatgt 420 agacatacat gcatagacac atacatactt agacataaca tacagcacac acatacacac 480 acacacacac acacacacac ttgtccaaag attattattt aatgttagac ctgagagaaa 540 cctgcccatg actcttgggg tctctgtgag aaagacagga agtcccaaaa gatggggtc 599 <210> 3 <211> 599 <212> DNA <213> Homo sapiens <400> 3 ttttattgta aacatattta cactagatca cctagtatct tatttttaaa tgtgctgaat 60 tttgcatatt catcttttta tgtgcttcat taaatcttta aattgtagac atatatctta 120 taggagttct tgtgaataat tagaaacaat gcagaaatct tgcttccttt gttctaattc 180 tcatatcttc ttttctgaat gactacttta atctcccaga tattctttga gcctgcagtc 240 tcataatact ctgtgttcca tgttcccaac agagttgtat ttctaaaata ataatatgaw 300 caagtcactt tcaggtgtaa attttaaaag aatctttcca atacctatgc aataaagtta 360 aaaatatttg actttgttaa caaaaaaaaa agatattata tattctatct aacgttccag 420 cctcatgttc tacctcttcc ttttcaataa agttttctaa tggcagttga aaatatttca 480 aagtgaaaca gtatagattt gagaacagta ggtgaatatc ttcttaaatc atatcattaa 540 ttaaatgatc tatatcagac tagaggaaaa tttctagtaa tatgctgcaa gacttcact 599 <210> 4 <211> 599 <212> DNA <213> Homo sapiens <400> 4 catcggcctt gataactttc atactaaaga acttaaattg accacagtct ttgctgagtc 60 acacacaatt atcttcaaga actcacagag gacttaaatg acataaacta gaatatatta 120 tgtctgttct ttcagaagaa gattatgggc catccaggac attactgact taccaaagtg 180 gagaaatagg tgaactcaaa tgttggcttt tcaatgccta gaaaataatg gggttggaat 240 tggctggact tgtatgaatg aaatcataaa atttggggct ggaagtgatc ttagggatcr 300 tgcaatatgt tgccttaatt tatacagaag taaactgagc ctttgaaaag tcaaatctta 360 aatccttagg agtttttttc ctaactgaag tacagtgtgg ctagtctgaa cagctgaggt 420 gatgaataaa ggcaattttt aatggctttc tttttgcctc ctctaaatga ttttcttctt 480 ttgggcagat gttccctatt cctggaacat ttgtatccat gaggaaagga ggctatccct 540 actatccatg tcatagctag gaattgtagc atcacactaa tatgagaaag aacctctta 599 <210> 5 <211> 599 <212> DNA <213> Homo sapiens <400> 5 ataaggaatt tctgccagat ttgaaacagt ccttgttgaa tgacagggat ttcaaatgat 60 taagagaatg gcactgaatt cccacctttg acttctactt gttttagttg aacttctatc 120 aagctttgga acccacttct cccaaatttt tctgaggttc ttgttgaaaa ttattgacag 180 ggccatgcct cagggagaaa aatacccaca aaaaaaacaa caaatcacag ataaggtctg 240 tagtttcaat aatctgttgc taccctgaag atagcactaa agtgattaac caagtcttty 300 ctctatgggc agcacttctt cacctttttg tctctccaaa ttttcttcct tcatcaaaac 360 tctattgttc tgaattttat ctctttagga ccctactatg gtttgaatat ttgtcacctt 420 cacaactcat gttgaaattt aatccccaat gtggcagtgt taaaatgtgg ggcctttaag 480 aggtgattgg tcatgtgggt tctgccttca tgagtggatt aaaggtttaa ttagttaatt 540 aataggttat catgggagtg ggactgctgg gtttacaaga agacaaagac atacctcag 599 <210> 6 <211> 599 <212> DNA <213> Homo sapiens <400> 6 ttaaccaagt cttttctcta tgggcagcac ttcttcacct ttttgtctct ccaaattttc 60 ttccttcatc aaaactctat tgttctgaat tttatctctt taggacccta ctatggtttg 120 aatatttgtc accttcacaa ctcatgttga aatttaatcc ccaatgtggc agtgttaaaa 180 tgtggggcct ttaagaggtg attggtcatg tgggttctgc cttcatgagt ggattaaagg 240 tttaattagt taattaatag gttatcatgg gagtgggact gctgggttta caagaagacr 300 aagacatacc tcagcttaca cactcagctc cttcaccctg tgatgctctg caccatctta 360 ggactttgca gagagtcctc accagcaaga aggccctcac caggtgcagc tccttgacct 420 aagatttttc agcttccata actataagaa gtaacttcct tttctttata aattacctag 480 ttttcaggta ttttattata agcaacagaa aacagactaa gacagacctt tcttagcaat 540 gttatataat aaatgaattc tggctaagta agttaattca tatttatact atattgtat 599 <210> 7 <211> 599 <212> DNA <213> Homo sapiens <400> 7 gtcttaaaaa ggcatgaata tcttctttta ggaaatacaa aagtaattgt ttaactctat 60 gtcagttgat ttcaacaggt atattcctgg aaattattaa ttttcctaat gctttctgaa 120 taatcctttg tttagtgata tagaatatta aaaagtggct taaataattt cttccctcaa 180 agaacatacc atataattgg ggaaagagag taaactctca aataactaca agcaattcaa 240 cattaggata cctgcatttt gaataataca aaatgcttaa gagtgtatag gattgtttcy 300 atatgagctt cccaaggagg tatttgtgga agaaggaaca tttgaaccag accatggctc 360 aagttagtaa tagaaaattg aagactaagg agggaattca aggcagaaat agcaaatgga 420 cacagacata gagatggcta atgatggcat atgtccaggg agtgtcctgt aatccagttg 480 agctgaagtg tgtgctttag gtagggaaac agtggtgaat cagactagac tacttgtctt 540 ggattaacat tgatcacagt cttaaatatt aaactcttca tacttaaaaa aaacaaaaa 599 <210> 8 <211> 599 <212> DNA <213> Homo sapiens <400> 8 tggtcagtgt gtgggcagaa ggctaaagat gaccccccaa gattcctgtc ctctggttat 60 ttaatcaaat gctaatctag acactgctgg gaaggttttt tgcagataac ttaagggtac 120 taattagttg acttttaggg gaatgctctt ggattatctg gttaggttca atgtctcatt 180 gagtctttaa aagcaggaga ggaagtcaga gagatttcaa acatgagaaa gattaaatgc 240 actgttgcag gctctgacat ggaggaaccc ccgtgaaata attggagaga agcctctags 300 agctgagggt tgcccccagc tgaaagccag caaagaaata agacctcagc cttacaattc 360 caagaaactg gattctgcca acaacctgat tgagcttgga agagggtcct tcttggggac 420 tctcaataag agaccagtga gctgataatt tgattatgtc cttgtggttt ctagagcagt 480 aaaactagtg gagtcaatct atatatctga cctacagaac catgggataa tggatgtttg 540 ttgttgttgt tgttgttgtt gttgttttat tttttttaat agttttgggt tcacagcaa 599 <210> 9 <211> 599 <212> DNA <213> Homo sapiens <400> 9 tcctaacaca ttacttagga aagtcattac ttagctaaaa ttatctgctt aaaggcatgg 60 agttgaggga gattttcaga agctacatta taaagcgatc aacatcaact agtcttttaa 120 tgttaataat agattctgtt ttcctctgtt tttcctcaaa gaaacttaac agctattacg 180 ggaagtatct tattaaaatg tccctataac agtcataaag gaagaggatt atttatttta 240 aagctagaga aactcagata ttaggaagta tatcttatat aaaatatata ttaaataacr 300 ttttttgctc acctgtagga gagaaactct ttgtccaata gtagatttta gcctgattct 360 ccatgagatg acctaatgaa acctgatcaa agattctcat ttgaccagtc accctgccct 420 tcctctacaa ctctctgttt atttccaatt taaactggtg tcaagctctc ctcagctgat 480 gacccagata tttctgcact taatcatctt gcctgaaatg agtaaggatg aagtttctat 540 tttgtccttc ttagcctatt tccttgatcc gccatggacc ctggttgtaa tgatcatgc 599 <210> 10 <211> 599 <212> DNA <213> Homo sapiens <400> 10 cagccatgca tcctcagaga tcatgcacat atttattgtg actgaaactc aggtaagata 60 gaattggcgt ggagcaggaa gaagtaggaa aggtgggaag aaaaaacttt gaagcatttt 120 aaaatagaaa tgaggttgat ttatagtgca gatagaaaac taaggcaaca atgaactata 180 gaacaggaca caggaagggg tcagtttcgg agatgccata gagcatttac tgtggataat 240 gttctctaaa gtagtgacac tgaatgatgt caaggatagt cacacatcag gcaggcgttm 300 acactttgca gggttttatt ttatttttct ttttattata ctttaagttt tagggtacat 360 gtgcacaacg tgcaggtttg ttacatatgt atacatgtgc catgttggtg tgctgcaccc 420 attaactcat catttaacgt taggtatatc tcctaatgct atccatcccc cctcccccca 480 ccccacaaca ggccccggtg ggtgtgtgat gttacccttc ctgtgtccat gtgttctcat 540 tgttcaattc ccacctatga gtgagaacat gcagtgtttg gttttttgtc cttgcgata 599 <210> 11 <211> 599 <212> DNA <213> Homo sapiens <400> 11 tggctaagag acaaaaaata atggaagatt taacactaag ccctggttta tctgatctaa 60 tttaaaatgc ccccttctca tccacatacc acacttactc agatccaaca gacacaacgg 120 cttacataga ttcccccttc tctccccctc atccatccct gcacacatat ctgagaaaca 180 ccttagcatt ggtttcagga tttcctaatg ggctgtggag cagctgtaaa taacacagtg 240 ctattcgagc caattgctct gaaccgggtg atatgatcat attcttttta acgactttcy 300 ctgaggtatg agttgagatt tttctccttc atcctcatgc tgtataatct ggatttatgt 360 tcaacgtgac cgttgagcct tcacaatgaa tttgtcctgt gaaaagatca gttgatacgg 420 agcctggatc ccagattctc accacagagt gggcgctcat tatttgcacg tcagcatcta 480 agtcatcaat ctctagcagc cacactcacc cagatgaagc tccaaaccca ggtcttgtgg 540 atcacatata acccatttct ttttttaatg agtcaataag cctcaattcc tggacatct 599 <210> 12 <211> 599 <212> DNA <213> Homo sapiens <400> 12 ttctctgaga aattcattga aaaggaacct ttcttttcca atatttatga gatttatctc 60 tagtaagaga caacatttaa cataaaatta tattaaggtg ttagattaac tccaaaggct 120 aaatataata tcaagccatt catgcatatc ttacatgaag actttaataa tttcagatca 180 cctttggtat acaaattatc tcctcttact tacaatcact ggcacatcat tccttttcca 240 gaatgtcatg tgaaatttag tcataaaata tgctgatttt tgtctattcc caaattcatr 300 cagaatgtgc cttcactggg ttaaaaagct tcaccaaggc tatctacttg cacactggat 360 acctaagaaa accctcctga tccactctta cttgaagatc tattagttct actatttagg 420 ctctgcttcc agttgggaga catgccacct gatatggttt ggatatttct ccactccaaa 480 tctcatgtta taatgtaatc cccagtgttg catgcaggtg gggcctggta ggaggtgttt 540 tggtcatggg ggcaaatccc tcatgaatga cttagcacca tccccggggt gatgagtga 599 <210> 13 <211> 599 <212> DNA <213> Homo sapiens <400> 13 tttatcaatt gagcaactct caaaatgcat ggcattcaaa aaaattttat acagtttatg 60 gctaaaatct ttcacatatt ttaattcaat ctcttccatt ttttttcagt gaggaaccac 120 agacatgaag aatgtagatg acacattcca agtcacagag taaattaatg acaggactag 180 aactgcaaaa cattttaacg tcctacaaaa ctaaaatttt gcgctctaca tacataagta 240 ggggagggtt ttaaagccat agtgctaata aaaaaaagtt gagaaacaga ttgatatgcr 300 taaccctatt tacataaact aaatttcagg catcaaagga atgttcacat taaataagtt 360 agggcatttt cttttagagt ggagggaaag gaataaaagt ggaacatagg ggaaaagtat 420 aataattaat taaaagcaca gtagagactt tgcatggatg aaatacaata atgtgccatg 480 aactgaaatg tgattctctt aacgatttct tccttgggtg gccttttatt gccaagacta 540 gaactagcta gctttctgtc acttgtaacc aaaacaatcc taccaaatgc aaattatac 599 <210> 14 <211> 599 <212> DNA <213> Homo sapiens <400> 14 tagtttttcc agttctctga agaatctcaa tggcagttta acaggaatag cattcaatat 60 atagattgct ttacgcagta tggccatttt aatgatactg attttttcta tccatgagta 120 tggaatgttt ttccatttgt ttgtgtcatt tctgatttct ttgaacagtg gtttgtagtc 180 ctccttgtag agctctttca cctccctagt tagttgtatt cttaggcatt ttattctttt 240 tgtggccatg tgaatgggag ttcattcctg atttggcttt cagcttgact gttgttgatk 300 cttaggaatg ctagcgattt ttgcatattg gttttatatc ttgagacttg catgatagtt 360 ttaattttac tttttcaaca aatatttatt aaacacttaa ctacaattaa tccagggatt 420 atgtgacatg gcaacctctt ttattctcac tcctctttgc ttttgttctt agtcaagcag 480 acatttttga gtcattttaa ctctgtatta tctcttactc caactgaaga ccaaatcagt 540 tttttctacc tttaaaattt cttaaactga ttttttcttt ttcattcctg gtatcaata 599 <210> 15 <211> 599 <212> DNA <213> Homo sapiens <400> 15 gcagccacag caagccttgc ccaaggagag tctgagctca gacatgccca accctgcccc 60 cacctgatgg tctttctcta cccaccctac ccaccctggt agccaaagac aaaggtcata 120 atctaccaca gctgatgtgc tcttgaaagc gccaccttct ggccagaggc caaccaacac 180 aaaaccagtg cacttaacaa aaatacaacc aaggacgctc accgactcta cttctctccc 240 ctgctacctc cactggagca ggtactggta tctacagcta agagacctga agaaggatcr 300 catcacagca ctctttgcag acactcccca gtactagccc agagccccgt acctctgctg 360 gctagctaga tccagaagat aaataacaat tgctgcagtt tgactctcag gaagccccat 420 ccctagggga agggagagag caccacatca agggagcacc ctgtgggaca aaagaatctg 480 aacaacagcc cttgagtccc agatcttccc tctgaaatag tcttcccaaa tgagaaggaa 540 ccagaaaatc aatttgggta atatgaaaaa acgaggttct ttaacacccc caaaagacc 599 <210> 16 <211> 599 <212> DNA <213> Homo sapiens <400> 16 tttggaaggc ttgtcaacaa ttaaaacaac tgggccctac tcccagaagt tcaatatcag 60 aaaactgctc ttgttaacaa attttcctag taatttggct acatgcagtc cttggaacac 120 acatctaaat gatgaatatt ttctatttct ctctgtcagc ttacccagaa gcaggctaaa 180 tatatttctt atagtaactg tacatctgta gtcaggtttt ctaaactagt tgaaagattt 240 gctcatggac tcctttgaga ttatcttctg tgaagaccta gcccatattc cagggctacr 300 ctgttttaca aaatcatgca ctctacactt atttgtgtta tttcatttat atacacatta 360 taatgcctta tgcatagcat ttgtacagtt gtctccaaat gattaaaaaa acactaaatt 420 caagttgatt gaaaatgtat taacacatcc ttaccctttt agacaaaata tactgaacat 480 aattttgaaa tgacttctct cgacatccat tgttacgctg ttagacaaca tactttttgt 540 ctttttttta catttttctg tgtcctccct taaagcaaaa ctggaagaag ttactgttt 599 <210> 17 <211> 599 <212> DNA <213> Homo sapiens <400> 17 ttatgcacct aaaatctgcc tctgcctgtc ctttgctatt accagaggga attaaggatg 60 ggtgaaccca gccatgtttt gggttcgtca aacatcttga actacttttc cactgttctg 120 ggttaggcaa aacccaaaat atgtttcacc aagcacattt tcccttaatt cttaaaccca 180 ggagtatttt aaggtaaatt taatccatat gcttctgatt catttacact aaactcatca 240 aaatgttctg tcttaagagc tatttgatgt gcaaggacct ttttgaatat tttataagcy 300 ttttaagtcc tatgcattgg gttttcacat tcaaccaaag atcaagtgaa ctcaaatctt 360 aaaatgatga ggtttggttg caaagtctaa aacatcaagg tttgtgaagg ttctaaactt 420 ggttacgtat agttcaatcc ttggtgagaa tatatattaa ttttttttgc agaatgtaga 480 ttgcataaca gaatgagtag tgaacaaaat gcaaaatagg gcatggaaat ataaagaagc 540 caagtgacaa ataattcaaa gcagattgaa tgtctgttct ttagcaagaa ccatgcatg 599 <210> 18 <211> 599 <212> DNA <213> Homo sapiens <400> 18 tgggaagtcc aatatcaggg tgctgtcatc tcacgaaggc tttcttatgg cgtgatcaca 60 tggtggtaag caagaggtca agagaagggt aagagggggc tgaacttact ctttcataat 120 ggtgctaatt ccacttgtga ggatggagtt ctacaggcct aataacctct taaaactccc 180 aacactgaat actgttacaa tggcaattac atttcaacat gagttttaga gaggacaaac 240 attcaagcca tagcaggctc caagtgttgt gtactctaca attccggaag cactatttak 300 atacactatg ccaccaggtg aaagaagtca ggatctaatt tagaatagaa acagtgagga 360 tggaaagaac tatctaggag gtaaattaaa tagaagttgg tgattggata gcggcgtgaa 420 agagaaaaag agatttttgc ttgaacaatt gcatgggtgg atagtgctaa acatagaagg 480 aggagtcagt ttcaggttga cttgaggtag tttgaacttg ttgaggtgtt cttgaaatag 540 tttgaacttg ttgactttga ggtatacatg ggaactctgg tggctggttc taagttata 599 <210> 19 <211> 599 <212> DNA <213> Homo sapiens <400> 19 gagcccctga gagtgcaggg atgcccagat ctagagctgc agctgggcag ctgcagctgt 60 gcttgggagt gcaggactcc tgccccttta acttgatagg ggacagggct cctgcctgtt 120 cctggtatct accagctcta ccacccctgg tggagctggt gtccctgcag tggctgctcc 180 agaaaggcta ccactattag taagagatag aacattttca atatggtatg ggagttttca 240 tttatattct tgttctaggt cctgcaaata tcaaaggttt ttctgcatga gataaaatty 300 atattatcct tacaataatc ctataggtgg acacgactgt tttccgtact ttagaagagg 360 gaaccaaggc acaagataac tgcatagcta tctgtggcca cacagcagtg agcaaggttt 420 tgaagaaggc tggtattgcc atcctaaggt atcttaacta ccgtactgtg ctgcttcaca 480 aaacactgca ccaaaacttc tcacagaaaa ttcctggaca acaagaaagc tgatgccagt 540 aatttattgg attcaccttt taaggtaata aaaattacct cagtccataa tatatttta 599 <210> 20 <211> 599 <212> DNA <213> Homo sapiens <400> 20 ctgtgacttc acagaatgtg aagttgaaca ttgaaatagt atcttgataa tattacttta 60 aaatctcact ttgcctgact gtatcaaata accattggtg gctgaagaga aatttgagca 120 agccgaataa ctaatgcttt caatctttac atagtctctg tgagatcaaa tataaattat 180 atgtactttt attcttataa ataggtttat tgaactcctt gctgagtgta tttttttctg 240 acctagtaag tgaggtatta tctgaggcaa aacagcatgg agagtgttta tttaccagay 300 ggggaggata aggaaaccag gatctcgtaa cggacttgac atgaatggtg tgtactgtgc 360 cctttccttt ggagcttcag cagctactaa atcctgctgg gcttcctatt gctggctgac 420 aagaaacaga agcctcttcc cacaagtgac tggtggcaga tggatcaagc cactgaaatg 480 ctatgcccca gactttaatc tgtccagctg aactgggtca ttacagagtg tgcttttgca 540 cactgctgct cttaggccgc aatttatgtg tagtgtgggc aatagttagt ttaatttag 599 <210> 21 <211> 599 <212> DNA <213> Homo sapiens <400> 21 agcctcttcc cacaagtgac tggtggcaga tggatcaagc cactgaaatg ctatgcccca 60 gactttaatc tgtccagctg aactgggtca ttacagagtg tgcttttgca cactgctgct 120 cttaggccgc aatttatgtg tagtgtgggc aatagttagt ttaatttagc acatttattt 180 taaacaccta ctatatgcct ggcaaggtgc tgtgtgcttt tcaaaggtta aaaaaaaaaa 240 agacatgaac acaatgtatt agcttgttgt gtttcatttt taaagggagt aatgaacgtr 300 aatctaagaa gacatgtaat tgaaataaat caacatacct tggtcctcaa ttttccttta 360 gattagcaaa ttcattcatg agtaattaat gaccagagta gttagggaaa tgaacaggat 420 aaatatgaat aggtatttag ggtaagagaa taatatattt taaaaatctc aaaaattgta 480 attgcacata tggaatttta agtaatggct attattattt actttttgga tttagattta 540 gaattacaga gaacaatata ataacaattt tatattgttc taatctccta tctacttat 599 <210> 22 <211> 599 <212> DNA <213> Homo sapiens <400> 22 gcttctcttt agttcccaat aatgccaaat tgcttgaatc ctgcaaattc cacattagtg 60 aaaggtctct cagctccctc aagatttatg tctccaactt tcattgaaca gaactattca 120 atcaaaagac ttacactatg tgaaaattgg tgacaacctg ttttggttgg gagggcaaag 180 ctaccagaga tggcaaagat ctattgactg aacaccagaa ctccttccaa attataccaa 240 gccccacttg gaggggaatt ctgtgtctgg aacttaggca gtgaaatgtg agcaccatay 300 ataaatttaa ttgtctccta tttagctcta ttggtatttt tttctcatgt gctaatccta 360 tattttctgg ccattagtaa gtagagaaac caaataaatc tgccatttta aaatgtgtta 420 ccgttataca gtaattacta gcaatagaaa caattccaga acttatatcc tagtacacaa 480 ataagtaggg taagaaaact gtacagaata aactattaaa atagttactg cacataattg 540 ctcagtaaaa taacgatttt agagtaaaaa tgataattgg ataaaactgt aacagtata 599 <210> 23 <211> 599 <212> DNA <213> Homo sapiens <400> 23 tataccaagc cccacttgga ggggaattct gtgtctggaa cttaggcagt gaaatgtgag 60 caccatacat aaatttaatt gtctcctatt tagctctatt ggtatttttt tctcatgtgc 120 taatcctata ttttctggcc attagtaagt agagaaacca aataaatctg ccattttaaa 180 atgtgttacc gttatacagt aattactagc aatagaaaca attccagaac ttatatccta 240 gtacacaaat aagtagggta agaaaactgt acagaataaa ctattaaaat agttactgcr 300 cataattgct cagtaaaata acgattttag agtaaaaatg ataattggat aaaactgtaa 360 cagtatattt tgatattcat ggtaggcatt tagataacaa ctgtgtaaaa caaaaggaat 420 ctggagatat attttaagaa attctctaaa tatatcaaaa tctttgttat taagactctt 480 cacctcttat ttatcatgtt cttacaaatg ttttaatttt aggtcagtac ttttatgtaa 540 tccatttgga gtttgaatcc atttgggatt tgaattctca gcacacttgt gttacagag 599 <210> 24 <211> 599 <212> DNA <213> Homo sapiens <400> 24 tttgacagaa gctgcttctc ctgttatctt gagttttttt ttaaaccaaa cctcttccta 60 aaattatcaa actatctttt actggcatta aattttctag ctttagatca ttcaccttct 120 ttttgcttta aagtgtcaga taatgatctt gtttttcctt gacctatatt agcatctatt 180 ctcatgcctt tcttagacca attctgcatc cacataaaag ttgcattttc aatacaagat 240 taaaagatat tttacaaaaa gtacaagggt tgtttacctg ctggcatagc tgcagcaats 300 gctacatgca tttccttttc ttttttaaca atggacctaa tgatggattt atttatctca 360 aaatggtggg taatcatagc tgcagatctc aacctgtggt acatatcaag caattcaact 420 gtttcttgta atgttatgac ttttctctgc ttcttgggag cacttccagc atcactagtc 480 atataggtcc catggtgtta gtcaaggttt acagtgttac acttaacatt ataaaaaata 540 tgtaagaatt gagagtcatc acttttattg caatatgcaa tttactggaa agacaaatt 599 <210> 25 <211> 599 <212> DNA <213> Homo sapiens <400> 25 tctcagactt gagtagctag gactaaaggc atgagccacc atattcagct aatttttttt 60 aaaaaaaatt tcagaggcag catcttacaa tgttccccag gctattctag aacttttggc 120 ctcaaacgaa tctcccacct tggcctccca aagcattggg attacaggca taaaccactg 180 cacctggccc ctgtaatata aaattgatgc acccaaagat cttaggatat atggaactgt 240 aagaagtaat aataaccagg tcctcatagc atcatagact accttttgtt gatttctcts 300 catttcctga gagtctacag gaactaatgc caccataagt cacattttta ttttccctgt 360 ggcagcacaa gaaattcaag ctttgcagtg tatggtttga tttgagatgt cttaatctaa 420 tcatcatcca tcatcctcta atctgacaca tcctatatgc cttccctctt cagacccttt 480 ttctttgctc cttgaaacac tcatatgtga tcaacacggt ctcatttatc cttgttatct 540 ttaccttgac taaaaccagg ttatgctact tccctggagg acctctcaaa aggaagctg 599 <210> 26 <211> 599 <212> DNA <213> Homo sapiens <400> 26 tctgacacat cctatatgcc ttccctcttc agaccctttt tctttgctcc ttgaaacact 60 catatgtgat caacacggtc tcatttatcc ttgttatctt taccttgact aaaaccaggt 120 tatgctactt ccctggagga cctctcaaaa ggaagctgtt tgttctattt ctttctcatc 180 tgtcccagga ctaggtattg cattaggaga tcccttgctt cccactgctg cttttaaatc 240 atttcatttc cttcttccct tcattcttcc caaatgcaag gtctttcaac tttcatttcr 300 tgctacactc tgccctttat tgctgctctc tggaatttgt ggtcactgtc cctcatacac 360 tgaaaactca catacctcta cctctagccc tgttgtattc ctgatgactt gagcacccaa 420 gggagtgata catacagcac tggtcaatca tttctttacc tgccacacat acagcaatct 480 ttaatttcaa tagccttagc cactcattcc caaataatgc ttggatcatg cacattatca 540 tgagtaaata cacccatgtc tgaaatcctg atttcaagta cttcccaatt tttctgtct 599 <210> 27 <211> 599 <212> DNA <213> Homo sapiens <400> 27 tgaaatcctg atttcaagta cttcccaatt tttctgtctt ttctttactt tcagctcaca 60 gaaacaattc ttccaccata ttaaaaactc taatccaatt cacttgttcc accacttttt 120 ttattcatta ttctctcctg tctttacttt cttcctccta tttcttgatg cactatttca 180 atcactcact tctaaacaca ctaggttact ttacctaata cactcaaacc ctcttgggat 240 ccagttttcc accttcttta tgcctatgaa ttttatggaa taaaatgata taaatgggts 300 gactggtttt attttaaatt accaattgta catttaaaaa catactttct gagaattata 360 gtttccagct tcatccatgt ccctacaaag gacatgaact catcattttt tatggctgca 420 tagtattcca tggtgtatat gtgccacatt ttcttaatcc aatctatcat tgttggacat 480 ttgggttggt tccaagtctt tgctattgtg aatagtgccc caatgaacat acgtgtgcat 540 gtgtctttat agcagcatga tttataatcc tttctcagca aactatcgca aggacaaaa 599 <210> 28 <211> 599 <212> DNA <213> Homo sapiens <400> 28 tgtattatcc tcactagcct ctaaagtgtg tttactatgc catattttta aaaagataaa 60 tctccatttc tcactagata gggctcatta ctctgcttag tgtcatagtg atggcagcag 120 aggcccatct ggagcagctg ctgtggagat gtcacctgca gtgggggagg tgtggctggg 180 gctggttgct ctgcggagcc catgggggct gggaatagga gagagccctg ctccctgttg 240 aggtggcagt gtgagagccc catgctccca ggtgcaactg cagctgcgca gccaccgcty 300 gggatccagg catccctgtg ctctagggag cacatgaagc ctcctgcccc tgcatgcttg 360 gaagtgcctg ctccccttcc ctgggcctct cctgttcccg gcacctgctc cagcacaaag 420 caaagttgta gctgagccca ggtgttgttg tgacctggcc aggtgtgccc gcactcaggg 480 cagtgctgac acaccagccc cctgctgcct cagtcccctc tgaagctttg ggtaccaaca 540 agcccaggga gggagcttgg gtggggcctg agggcggctt ggcgtggacc tgcaggcgc 599 <210> 29 <211> 599 <212> DNA <213> Homo sapiens <400> 29 tctttctttt cactatacgt gtatcagata gtgtaagacc tgacatatag taggcactta 60 aatctttgta aattaaatag aaaaaaataa aatttcaaaa catatctcat aataatttca 120 cataattata cattataatt aaccagatta atgggttaaa tttattatat gcaggtctag 180 caaggacatt acgatagaga acaaggtgta ttactagtcc catccccacc caatgaacac 240 atcatgcttg taatagaatt gttgaaatac cattaaaaat atccaaactc tatttctaaw 300 atgaattatg gctttctttc atttgtctct tccattactt cttattcctt ttctaaatct 360 ttagttatgt agacatagtt ttgctgtata atttaaattc tggtttcagt tacttgaatt 420 aatgctccag ttttacttct tggatttggc ttaggcattt ctatagaaca caatacacct 480 gggcatggtt tgccatagaa gttcactttt ggctttataa tcatgcactt gctatcattt 540 ctacatccca taaacataga taacagagtc acacaatctc tctagatctg ggaaattcc 599 <210> 30 <211> 599 <212> DNA <213> Homo sapiens <400> 30 gccaccatta aagccaaact acaaaattca gaagacagac aactttggaa agcaggcgta 60 agaacaaaca ggctgtctaa ttggatctcc tcatctttta caaataaaat tctagaaaac 120 agcaaaagaa ataagatcta acttcgttta aagttaatgt ttataacaat aatatcatct 180 cttaatttat aatttggggt aataataatt cagtctattt ttttgttggt ggtgatacgt 240 attttattgt gaaaatttgc aaaagtagac tgataggctc acctataaag aagcataaak 300 aatgtaattt tcactcattt taagaatatt atcaaaatca ctatagatat tagttcttaa 360 attatcatat acatatgtgt gtgcatatta tagttcttta gaaatcagct gtgagttata 420 gctgatagta atgtcttaaa atttcctgtt aatttttctc ttctggaggc ataaaccaaa 480 ttatattccc ccagggcact gattatataa attataaaac atgaaaatgt taatgcaaat 540 cgggcactac agtaatgcca ataacccaat ataaataaat actgtcagta ctagcaaat 599 <210> 31 <211> 599 <212> DNA <213> Homo sapiens <400> 31 cacttttcat gtttatggct aaacaaggct caagtcatcg ggccccactt ctgatatgag 60 cttattatca gtggaagaat gaaagcagat gatcccatca tcttttaaag tagtgacatg 120 aggtgatact gacatcatgt aagatctggg tttaaaccac cttaccctcc aacaattatt 180 tattgaaaaa aattaatgct cttagaaatt tacataagtt tttctgaagg agctaaaaaa 240 acaaatgtta tacccacgtg cttatcgtaa aacaagtctc aggtgaaaac agggactaam 300 ttatcttaac ccagagattc tcagcattgt atataaattg caatcagctg ggaggcttta 360 acgatcactg atgcctcttc caagtgtttt gggtgtggtc tgggcctggg gaatttcaaa 420 aactccccag gtgattctaa tgttcaatca cagtgtagac tgctgctttg aaatttaggg 480 gagagagtaa caagttgcac tattactcaa tattttgcat ttggcagaga gtttctgatt 540 tcccattaat ttaattaatt aacactatat ctatatgtac atcccacatg aaattatat 599 <210> 32 <211> 599 <212> DNA <213> Homo sapiens <400> 32 gaagataact cctgaagtct tatgccccta actcctatgt ctctttagat cacaattaaa 60 ttcccaaatc ttaagacagt ggatatactc aaaacatatt gttaaataaa ataaatgaag 120 tgaggtggac tatatttttg tttccatata cttaatcctc cttgctgtga gaaggttgca 180 catccctttg ttgccacttg acttcagtgc cttctgtgac agaattcatg cctgaccatt 240 gatgtagtgc atgtgccatg tctcagcaga gtttccagag gccttgcctg gttccatcak 300 ctctcttgct ctttctccca gccacatgtc tggcatatcc cagtagaggc tgctcttgtg 360 cttggatcct ggaatgaaaa agacctgcaa cctatcctag ccaggagctg caccagatcc 420 cagactgctg ttataatagt tgtaagattt tatatatatg tgtgtgtgtg tatatatata 480 tatatatata tatacacaca cacacacaca cagcacacct atatatacat acacacatat 540 atatgtaaat gtatgtgtat atatacagtg tataatgcag caaaactaac ttatgagtt 599 <210> 33 <211> 599 <212> DNA <213> Homo sapiens <400> 33 tccagtcagt gcatccatgg tgttttgccc ttggaggaag cctgctactg tcatggtaat 60 tgcttctgtg ggttgagggg gactctcact gaagctccca tctttcccag tcccttccca 120 cccacagtga accccctccc taacacctat ttgcatggtt agaaaacatg ccttttcagt 180 aaatgatatg tgacttccat gcacatgtct cataatgaat gtggataaga cctatgactg 240 taatcaattt tttgaaaaat cttatttatc tgttgtcttg cctggattgt atacttacty 300 atttgagtca gactcttgat atttaccgtg aagtcagctg ggaccttact gaaatcaaat 360 gagctcttgc ttctcattgc agtgtctaaa atcatcctgt cttcactcca actctgagct 420 gcatgtatga gactgaaaaa ccattcctag ctcagattct cctgaacaca tttcagagtg 480 aaaaaaagaa ttttgcttga atccggacta caggatatga aagaagtgtt ccggaaagaa 540 agttctcttc cttcttttct tggttcaatg aatcctgtgc tttaaatcat gcctctggt 599 <210> 34 <211> 599 <212> DNA <213> Homo sapiens <400> 34 gaaaggtatt aaccacatcc tccaagtaca gaaagtgatg ctcagtgagg ggctattttc 60 agactaaagt tctagaccag ggctctggag cttcaagagg gtgttccagg ccccagtgag 120 aaaaagtaca gtgggtaaag gaagggacat ggatagaaat gtaagagaaa gaagttgcct 180 ttgttgggga gaaaaatgta tagttttaat atgaggcaaa atattgagag agaattttca 240 atcacaataa cttgagggaa aataaacaac aaatactgtg tggacattaa attagactgk 300 aagagtgtag gctgccttat ctttgtttct aggctcataa tctaaaacct tgcatctctg 360 agccaaggtt tcttcatccg ttgttcaggt gacctcacgg ttggctgaat agtggttcac 420 actggcttct gttttatagc tggcagggta aacttaatgt cttaaataat taggcaagta 480 cttttattga gcatattctt atagccatac cgaaattcac taagccagac agctttaaat 540 tagaataagc cacaattgtt ccataatgta gttatacagc tggcattgag aagctttag 599 <210> 35 <211> 599 <212> DNA <213> Homo sapiens <400> 35 ccactctatc cccttttcag ctccccatcc atcccactaa aagccacctc caccactcaa 60 taaaacccct gcattcatcc ttcaaatctg tgtgtgacct gattcttctg ggacgctgga 120 caaaagctcg ggacacagaa agctgtcaca ctggcccccg cccttgccaa aaggcaaagg 180 ttccactggg ctggttaaca atgaagtcat ctgcagatgg caaggctaaa agagcacact 240 gtgacacatg cccatttggg tttgggagtt gcaggatccc acccctggat gccactgtar 300 ggttggagcc caggagtgct cactctgcct tctgcacctg tctgtctgca tgctccccct 360 cctgtaaggg atttgagcag cagtggcaac cgaacagaca agccacaccc ctgttgcaca 420 ttttgcaagg gggtcaggga gctctcccat ttcaggacac tgggagacaa gcagtgccaa 480 gatatgttat caaaagtaac agctacttaa aagcaatacc tgtagcactc aagatacaga 540 aaaagagaaa cttctgggga gcttagaaac caaatgatta tcataaaata cagtttttt 599 <210> 36 <211> 599 <212> DNA <213> Homo sapiens <400> 36 ggaaatgatt agaataactc ctggaatata cctgcatgat ataaatatgt aattttttta 60 catatgcgcc ttatgtaagt agaatcatat tctaaatact gttttataat ttgctttggt 120 agtgtgatag tatatgtcac agagtttctg tattagttta cataaatgta cattgctctt 180 ttaaagtttt taatataatt tgatattatg gatgtgtaat gtatacttag tttttgcata 240 atttaatttt tttacttgtt tttattttta caaggttgca ggccatatat ttaactgtgy 300 tatgtgctac tgtataacaa aagcagccat agaaaatata gaaacaaatg agagtaactg 360 tgttccaaca aaactttatc tacaaaaatg tgtggctggt ccctaggctg tcgtttgcga 420 acctctgtga tagacataaa agtgtatatg aacataatag cagtaacctg gagaatatct 480 tctgaaagat gataaataag aaaagccagg ataaaagtat gtctactctg tgattatact 540 tatgaacaaa ttgtagatgt aaagaatgaa taaagaactg taaaaaatat aaaactttt 599 <210> 37 <211> 599 <212> DNA <213> Homo sapiens <400> 37 tagtgtgata gtatatgtca cagagtttct gtattagttt acataaatgt acattgctct 60 tttaaagttt ttaatataat ttgatattat ggatgtgtaa tgtatactta gtttttgcat 120 aatttaattt ttttacttgt ttttattttt acaaggttgc aggccatata tttaactgtg 180 ctatgtgcta ctgtataaca aaagcagcca tagaaaatat agaaacaaat gagagtaact 240 gtgttccaac aaaactttat ctacaaaaat gtgtggctgg tccctaggct gtcgtttgcs 300 aacctctgtg atagacataa aagtgtatat gaacataata gcagtaacct ggagaatatc 360 ttctgaaaga tgataaataa gaaaagccag gataaaagta tgtctactct gtgattatac 420 ttatgaacaa attgtagatg taaagaatga ataaagaact gtaaaaaata taaaactttt 480 cagggataag gttgttgatt tatggattgt ttgattttaa ttttaagtat ttacttactc 540 tctgtgccga acaatgttgt tcaataaaag caaatatttg gttctgtaat atcttcctc 599 <210> 38 <211> 599 <212> DNA <213> Homo sapiens <400> 38 atcttttacc catttctgac ataaacagga cactcattga gaaaaggcac ttccagactt 60 caacctaaga aacataaatg gcagcaagtt acagagaagt cagaaaacat tactttgtta 120 ttgagaactg cttgatctaa aaccaaagca acagagatgt agagtcaaag agaaacaagc 180 aagcatgtgg gatgctcagt ggccacctca ggcacatttt cattgagtct ttcaaataat 240 ggtcatccca attggctaac ctagaacagt ttgcccagac tacaggtgct gcaaaaaatr 300 taattccact ggaaggcacc attgtagtat ttgaaataat ttttaaaagg ctatatggat 360 catgctctat catcttcctt caatctctca tcccacatga tcccctcaaa acacaatttt 420 aatgacaaaa atcagaagaa atggacacca tacacacacc taaatcccta atacattttt 480 tgcctctggt tctataaaaa tgtgtgttac caaacataaa taacaagaga aaatacattt 540 tataaatgct aatttatgag gggaatatga aaatgtgcat taacttgaaa aaaacatat 599 <210> 39 <211> 599 <212> DNA <213> Homo sapiens <400> 39 aggtagatat aatgaagagt tattaaaggt gtaataatga ttacagcaat catatcataa 60 ctatgatata aattataatt ataaattata aaatatcatt tggggtctag ctgatggaga 120 acttattctt aacccagaca tagtttgtga ttaaggtttt tgatcttgaa taaagcatag 180 tgttatttac aagatatttt agcaaaaata atttttaatt gaagatattt tatgcatcta 240 aaaacattca tttttatgtt aagctttgaa aaattagtca cccaatcaaa agccttaaak 300 atctttatta cataacaaaa ttatatttaa attgaacatc tttgaaactt ttataacaac 360 atagtctttt ttcaaagtat tctatcacaa tttaaattct tataatttag atttgttttc 420 ttaaagttat tatatgtttt tttcaagtta atgcacattt tcatattccc ctcataaatt 480 agcatttata aaatgtattt tctcttgtta tttatgtttg gtaacacaca tttttataga 540 accagaggca aaaaatgtat tagggattta ggtgtgtgta tggtgtccat ttcttctga 599 <210> 40 <211> 599 <212> DNA <213> Homo sapiens <400> 40 ggaaaaccaa acattttatg ttctcactcg taagtgggag ctaagctatg aagatacaaa 60 ggcataagaa tgacacaatt gactttggag actcaagggt aagggtggga agagggcaag 120 agataaaaga ctacaaattg ggtgccgtgt atattgcttg ggtgacaggt gcaccaaaat 180 cttacaaatc accactaaag aacttactca tgtaaccaaa caccacctgt tccccaataa 240 cctatggaaa tgataaaatt ttttaaaaaa gaaataccac agaaaagatg ctgctctttr 300 tgaagcatca tatctaagaa cattccaaca catcccccca gtagtggtgg taaccttgat 360 cacctaatca agttgatgcc tgacagatct ctgcaatgta aagtcataat tttctttccc 420 ctgtgttttg gattgctgtt ttgtgggaag atattcagac atttcactaa catcctgttc 480 ttcatcatac cttcagccta cagctttagc attcaatcta catccatagc atccattgac 540 tgtttgtcac tgcttgtatt aactgactct gtgatagttg cccaagagta aatatccat 599 <210> 41 <211> 599 <212> DNA <213> Homo sapiens <400> 41 gtcaaaaggt tagcatctca cggcactaaa agaactctga tatattcatt caattctcag 60 cactagtgca gctgctctct gtttttcaat gttttttgat ttattatttc cttaacaatc 120 ctaagtattt aggcatttca ctttttaggc taacactaac cagggtctct ctaatatttc 180 ctcatgacca aactcaggct ctacactttt gatataaatc ttcacaacct atgcatctga 240 caggactaat atccaaaatc tacaatgaac tcaaacaaac tagaaagaaa aaaacaatty 300 catcaaaagt gagctaagga tatgaataga caattctcaa aagaagatac acaaatggcc 360 aacaaacata tgaaaaaatg ctcgacatca ctaatgacca gggaaaatca aaaccacagt 420 gcagtaccac cttactcttg caagaatggc cataataaaa aaaaatttaa aaatcgtaga 480 tgttggcatg gatttggtga acagggaaca cttctacact gcagtgggaa tgtaaactag 540 tacaaccatt atggaaaaca gtgtggagat tacttgaaga actaaaagta gaactagca 599 <210> 42 <211> 599 <212> DNA <213> Homo sapiens <400> 42 ttgtactcct gtaaagggta ctgaattttc tttcacccgg ttgattttat catttgctct 60 attaggtctg tttcaatttt gtccactgtc aaagggttaa gttcttacat tagagtgtgg 120 tccttactcc tacagtatgc cctttctgag gtctaaactg aatgtccaat gagctctgtg 180 gaatatctct actctgccta ggtcaaaagg ttagcatctc acggcactaa aagaactctg 240 atatattcat tcaattctca gcactagtgc agctgctctc tgtttttcaa tgttttttgr 300 tttattattt ccttaacaat cctaagtatt taggcatttc actttttagg ctaacactaa 360 ccagggtctc tctaatattt cctcatgacc aaactcaggc tctacacttt tgatataaat 420 cttcacaacc tatgcatctg acaggactaa tatccaaaat ctacaatgaa ctcaaacaaa 480 ctagaaagaa aaaaacaatt ccatcaaaag tgagctaagg atatgaatag acaattctca 540 aaagaagata cacaaatggc caacaaacat atgaaaaaat gctcgacatc actaatgac 599 <210> 43 <211> 599 <212> DNA <213> Homo sapiens <400> 43 atattaaaat tcaagaaaca ctaacttttc gagtatgtgt cttataaacc tcctactttg 60 tttgcacgtg ttgcacctac taacacacac aacactgaac tgttcaccgc ttgctttcct 120 ggcatgcact atagtaatag atttaattat cccaaaatat tctcattgaa aattatgtgt 180 aggttgtaga aatcctggca atatcagtgg ttaactgttc atttgccaca tctcactgtg 240 taagatgtta gtgtcaccat ctgatactgc tctgtttgca cattcattgt tcagactttr 300 tagcctgttt gatttttgag ctatctaata atttcactaa tttcagactc ttcctagacc 360 aatgatgtgt atgtcttcat tagcacagat cttagtactt gtccttatag aaagtcatgc 420 gcttagttac tttgaggcaa cagcttggta caggcaaata cattttaaag gtaaaattat 480 tcttcatttt caacattgtt ttggtattta agtactatgc attctcatat acatttaagg 540 tcagttttta atttttttta aaagccagtt gggatattgg ttagaattgc agtagatct 599 <210> 44 <211> 599 <212> DNA <213> Homo sapiens <400> 44 cacatagaag gaggagaaag gattaaaaag gaaatatact gtaagcaagt atatcagttt 60 ggggatttat ttttagtgaa ggtatgaaag aagtgtgtga atgaaggcgg tttccattga 120 gggaaaaaaa tatttaggag cactcttatt gtgattttgt gaaccaatgg ggtaagagaa 180 gtaatagaat tagattcata tttgaatcag atgtgtagtg cttccatgat caaaattaga 240 ttattttaga catgttgaca tagaaatgcc agtaaaatgt gggatgcttt ttattgactr 300 tggaaagaac acagcataaa aaaagcaaat atttttatct tacagcccaa ccgatcattg 360 ctcaaagaag ttataagcta aaaatgctat tttgctgcat tcaggtttag caaaaaatag 420 atacatgtag attttttgtt tgttttctat ggaatttcta ttgccctttt taaaaaaaat 480 tatcttccag ggaataaaaa atgagatatt aaggtagagt taagattgaa gtaaatgcaa 540 aatcaataac ccaaatagac aaaaaagcta tattttatgg tattcatgaa ctcatcttt 599 <210> 45 <211> 599 <212> DNA <213> Homo sapiens <400> 45 attgtttttt cagttacagt tctaggaatt gaatttctgt gtgaaaggca tattcaatat 60 taaacatttt cacactatta ccaaaatgct tttctgaaga tttaaacatc tttccatgag 120 ctttcttcac agctttccca ttcagctact gttcataaag tttttgcagt tatggctaga 180 tgataaacta gaaatatttt cattgtatat gaacaagtct aataaagata aagaactact 240 tcatagaaaa ataattcatg aatacataca tcagtttaca aaaaagatga gttcatgaak 300 accataaaat atagcttttt tgtctatttg ggttattgat tttgcattta cttcaatctt 360 aactctacct taatatctca ttttttattc cctggaagat aatttttttt aaaaagggca 420 atagaaattc catagaaaac aaacaaaaaa tctacatgta tctatttttt gctaaacctg 480 aatgcagcaa aatagcattt ttagcttata acttctttga gcaatgatcg gttgggctgt 540 aagataaaaa tatttgcttt ttttatgctg tgttctttcc atagtcaata aaaagcatc 599 <210> 46 <211> 599 <212> DNA <213> Homo sapiens <400> 46 gaaatgtggg caaaggcata ttttttatat tcttaagagc catttggtat ttttagttaa 60 aaactgcaca tattacttca atacaaagtt ttaaaatcag gttattctat agtaaacttc 120 attgtagcta aatctgcata ttatgtctgt cattgttttt tcagttacag ttctaggaat 180 tgaatttctg tgtgaaaggc atattcaata ttaaacattt tcacactatt accaaaatgc 240 ttttctgaag atttaaacat ctttccatga gctttcttca cagctttccc attcagctay 300 tgttcataaa gtttttgcag ttatggctag atgataaact agaaatattt tcattgtata 360 tgaacaagtc taataaagat aaagaactac ttcatagaaa aataattcat gaatacatac 420 atcagtttac aaaaaagatg agttcatgaa taccataaaa tatagctttt ttgtctattt 480 gggttattga ttttgcattt acttcaatct taactctacc ttaatatctc attttttatt 540 ccctggaaga taattttttt taaaaagggc aatagaaatt ccatagaaaa caaacaaaa 599 <210> 47 <211> 599 <212> DNA <213> Homo sapiens <400> 47 tgtgtgcttc ttatgagaat ctaatgcctg atgatctgag gtggaacagt ttcaccccca 60 agccatcccc tgccctgcct ccctgtctat ggaaacattt tcttccacaa aacctctctg 120 gtgccaaaaa gtctggggac cactactata gaggaacaag catgagaatt ataatgagtt 180 tcccataaga aactatgcaa gcaaaaaaag aatggagtga aatatttaaa gtgttggaaa 240 gaagaaaaaa ataaatattt gactaaaatt ttatattcag tgaaattaac ctttagaaas 300 aaggaaataa ggactctacc aaacaaacaa aaactcatgg aatttattac cttaccaaca 360 ggtctgatct aaaagaaatt taaaaagaaa tttttcagag acaaaaaaga ttatataggt 420 tagaaattca gatctatgtt aaaaaaaggc agtgtcagaa aaagaatgaa tgaaggtaag 480 gtaaattgtt ttatttttaa ttaatctaaa aattatggat tatttttaaa ataacaatgt 540 atcgaatgat tataacatat aggtaagtaa aataaatgac aataagagat gggaaggag 599 <210> 48 <211> 599 <212> DNA <213> Homo sapiens <400> 48 tgcccgggtg actcagagtg actcctgcga gttggcactg agactttcaa tcagttgggc 60 tctctgcagc aggagatctg agtggtgtgt tcccatggct gccacataat gtgtatgtgt 120 ctgtgtgtgc atgcgcgcac gtttgcacat gggtgtgtgt ttatgcaata aatgttgctt 180 ttcaaattag tgaagaaagg aagacaagtt caataaatgg cactgaaaaa tattggctag 240 tataaatgct tcctgacagc agcaactgga tcatattttt acctgtattt ccaccacctr 300 gaactatggc tagtacatta cagtagaaag taatgggaac agggtaatgt cctaatatcg 360 gttgtggcga tagactcaca actccataaa tatactaaaa actattcaat tttacacttt 420 aaatgggtga attgtgtgat atgaattata ccctaataac gctattaaaa atataatcta 480 aaacaatgtt atgtattttc tgtaatggca tatagatgca cataaattaa ctgaaaaagc 540 ttacacatca agtttataat gatgtatctg aggaaaaaga ggggtcagaa ttaacaata 599 <210> 49 <211> 599 <212> DNA <213> Homo sapiens <400> 49 gtgttgtttt atggtaattt gttacagagt agcagaaaat gaatataagg gtatttaaat 60 taaaattata actaaacagc aattctgtgc tcagttctat ataagcgaat aaaagcttgt 120 ttccaaattt atttagatac cttactaatc aaaacctgat atagattata aacaataggc 180 taacagaaga ttcaatgatt gttaagtagt tatgtttgga attttaaaat aatattttct 240 tgaaatacat ctgtagattt aatgatatgt ggcaataata aaatacctta gatgcttccr 300 gattttgaaa attaaaacag aacagcagtg gatttgaggt ttctgcttag gtttttagca 360 attgctatct ctaataactg cttggaatgg atgaaacatt gattgaaaaa ggaatgagga 420 gttggtagag gtcaactaaa catttgaaaa aaagtttgac ctgatttagg gcataagtaa 480 agcataatat gttataaccc ataatattta aatgcatgca attaatatat atggtgataa 540 ctgcatgaac attttgaagg actcttgagg ggagaatacc caggaagaat gaaaataat 599 <210> 50 <211> 599 <212> DNA <213> Homo sapiens <400> 50 attcctctgt cagattggaa ataattttaa catgtgagaa ttatgtggca aggatataac 60 taaacatgca atcccctaca ctgttagttt aaatagttta aattgttata attgcttttg 120 ggttttgttt tgtttcgttt tgttttattt tgttttttga gacgaagttt tgctcttgtt 180 gcccaggctg gagtgcaata gcgaaatctc ggctcactgc aacttctgcc tcctggattc 240 aagcaattct cttgcctcac cctcccaagt agctgggatc acagacacac accacaacay 300 ccatttaatt ttgttttagt agagacgagg tttcaccata ttcatcaggc tggtctcgaa 360 ctcctgacct caagtgatca acccatctcg gcctcctaac atgctaggat tagaagcgtg 420 agccaccgtg cccagcctct tataattgct tttgaaggta actttttttt ccacttttat 480 tttaggttca aggtacacat gcaggtttgt tatataggta aacttgtgtc atggaggttt 540 gttgtacaga ttatttcatc actcagatac taagtctagt aacccagtag tcctttttt 599 <210> 51 <211> 599 <212> DNA <213> Homo sapiens <400> 51 aaaccatatc gccaagaatt ttccaaacat gtattcatct ttcatttgtc acctattaat 60 atcttacaaa tcatacttgt aaaatccatt tagaactgta ccagaggcaa tgaatgcaat 120 cattttagct atgtttaaga atggtgccaa aatactcatt tcagactagg ctgtcagaaa 180 ttctgggagt aaggcagctt ggccacatcc ctagatgcca tggtccttct ctgtctctct 240 gggaagtaat ctaatactga gaggggtgtg ctgacctcac ctggaggatg tgtataaggm 300 tagaattctg agatctgtgc ttgagagagc agtagctgct acaggacttt tctctctttg 360 gtaacaagca aaaaccaaga tacttttggt ggataaggat tacttttccc agaagctggg 420 caaaagtctt atttgaatac ttcaagttgc agaatccttt ggaaaggggc tgccctatgg 480 acttgctttt ggtggcattg tttgttcatg ccagtgctgt tagaactagt gggtcactgc 540 tccactgatc tgaattgttc ccagctcctg cagttggaag agatgcagtt ggcatgcag 599 <210> 52 <211> 599 <212> DNA <213> Homo sapiens <400> 52 aatcacttta aattgttttg cattatcttc tatatttgac tactatatat cgcataacat 60 aacaatttca cactcaagta attattcagc acaaattcat gaacatgtac ctaaagcata 120 gatataaaaa tgtttatact cccaaagcaa aagcaaccca aagtctgtca attatagaat 180 aaataagtag tgttttagtc acacaataaa tactgtaaaa caattaaaat gaacaatcta 240 caactgtgtt caaccacatg gatgaatttt ataaaccaaa attttagtga aaggagccar 300 atacaaaaca acacatactc tatgattcat ttttgtatag ttgaaaacag acaaaacaag 360 tctattgtgt tagaagtcag tgtagtgagt aacatttgct ttggagtact ggggtgctga 420 tttggacagt gcaggaggag gtggtggtga tgctcaattt cttgagcaga ttgattgtta 480 ccttggttag ttcaatttgt gctcatgatt tatatacttt tctcttactt ttcatctaaa 540 aaattaaaag tggattaaaa cctaaatgaa tataataaat ctttaaaata tttaaaaga 599 <210> 53 <211> 599 <212> DNA <213> Homo sapiens <400> 53 tgttcagaag taaatgttga gcctacgctg agatcctgca gatggaatac aatctgtgag 60 attattcctg ttgtttttct actactatgt caattatcat tctttgaagg gaaaaattaa 120 cagggcctct gttgggcatt gaggaaaaaa ctctggactc tgggtcagaa gaaaggaaac 180 aagccataac cacttggagc ctcacttctc atatgtataa aataatagca atagtggtta 240 gtatttattg agcagatgga acttctactt ctaatcctca caatagccca cttgagtttm 300 tggaataatt tatttagtca aatttatgtg aaaatgcctg ccatactata tactattgtt 360 ctgaaaatca aatggggcaa ttcatataaa actatctgaa aattaaagtt acaattttca 420 ataggaagga ctcttgtcta tctttcttga aatcattttt atagctgttt tgcataactc 480 agttgctgtc agagaaaaag aagttgtata caaattccaa ataataattt gacactaata 540 agcaatgtca aaataagaac atagagttaa acactttttc ccttgagtaa caaacaact 599 <210> 54 <211> 599 <212> DNA <213> Homo sapiens <400> 54 tgtataaaat aatagcaata gtggttagta tttattgagc agatggaact tctacttcta 60 atcctcacaa tagcccactt gagtttctgg aataatttat ttagtcaaat ttatgtgaaa 120 atgcctgcca tactatatac tattgttctg aaaatcaaat ggggcaattc atataaaact 180 atctgaaaat taaagttaca attttcaata ggaaggactc ttgtctatct ttcttgaaat 240 catttttata gctgttttgc ataactcagt tgctgtcaga gaaaaagaag ttgtatacar 300 attccaaata ataatttgac actaataagc aatgtcaaaa taagaacata gagttaaaca 360 ctttttccct tgagtaacaa acaactttga aaaagtcagt gtaatacttt tgacagatat 420 tattaacagg aaattgtgga attagtatac ttaaagtcta gggagaaaaa atttatattt 480 ttctcaggaa ctctaataaa tatatcatta taggaataaa tatgaatcta aaaaataacc 540 tagttaatat gaccaataaa gagtaataat gggtgggaga taagtgtttt tctaaaata 599 <210> 55 <211> 599 <212> DNA <213> Homo sapiens <400> 55 cattgagggg gttaacaaag acaaatcagt gactagctgc tggcattatc atatttcagg 60 gcttaagttt tgatgtagaa atagcaaact atgaaacacg ttcatcgtca atctcttctg 120 cttttttgaa gggacttcta agctctgtca gctaatagct ttagataaca gagttttaat 180 acaccgtatt gataacaact attattgtta tcaatcacga ggaccttcta ttcctttatc 240 aatatcaagg accttttatt ccttttacta aaaatgtcct aaacattcat cattgctgay 300 gttaagtatc ttctgagtga caaaaccggc agaggagggg tttacagtag tttctgttta 360 gtcctgtgaa ttagaaaaat taagaataac atgttctttt tataaagtca atatcactga 420 aattaaatta aattacagaa aacttaaaac ttaagaaaac ttaacaagta cttgctactt 480 acaaaagtaa tttaagtatt acttgtcaag ctttaataat gagcagattc cttttaaagg 540 gaaaaaatgc tctcacagac cagtgaataa gagattcatg aatccaaatt tgagagtcc 599 <210> 56 <211> 599 <212> DNA <213> Homo sapiens <400> 56 tatattttta atttttttag gtacatacta gatgtatatg tttatggggt acatgagata 60 ttttggtaaa agcatgcaat gcataataat cacattgtgg aaaattggtg gatagccatc 120 ccctgaagca tttatctttt gtgtacagac aatccaatta tattctttta gttgttttaa 180 aatgtacaat ttaattatta ctgaccatag tcctcctgtt gtgctatcaa atactaggtc 240 ttattcattg tttctatttt tttgtactca ttaaacatcc tcacctcctc ccattccccy 300 actatgcttc ctagcctctg gtaaccatcc ttccattctc tgtctctgtg agttcaattg 360 ttttgatttt taaatcctat gaatgagtga gaacacacaa tgtttgtctt tctgtgcctg 420 gtttatttca cttaaataat gacctccagt ttcatccatg ttattgcaaa taatcaaatc 480 tagttctttt tttatgactg tacatatgta ccacattttc tttatccatg tatctgttgg 540 tggacactta ggttgctcca aatcttggct attgtgaaca atactgcaac aaacatggg 599 <210> 57 <211> 599 <212> DNA <213> Homo sapiens <400> 57 ataatgtcga tttgtgaaat atttaaccag gtttttttaa atgagcaaaa cataaatatg 60 atcacattga agtttaagaa cttctcttta tcaaatgtaa tactgaagaa actgaaaagt 120 caagccacaa gctaggcaac atatttgcaa actattttaa aaaaagatga acaaatcctg 180 aacaggcatt tcacagcaga ggaaataaaa atgaccaata attgtactaa aacaagctca 240 aattcattag taggcatgga aatgcaaatt agaaccacaa aaagatgtca tgttacccar 300 tgaatgaaaa cttaaaagtc tgacaataac aagtgttgct gataataaat tgctagtaag 360 tgaaagagct gttcaaaatt gacatataat agttaaaata aaacactttt agaaaacagt 420 ttgacatctt actagagttg aagatgattc agccactttt attccagcca ctccatttct 480 agcatacact acagagaagt gtatatttaa agaggcctgt ttaaaatagg tcaaaatgag 540 aagcaacgca aatgttaaac aataggagga ttatctactg agaactatcc atggaatgt 599 <210> 58 <211> 599 <212> DNA <213> Homo sapiens <400> 58 gccatgtttg gtgagcttct agtccttgac ctgggcaaaa ttaaactttt tccagagagt 60 agaaaagcaa cccactgtca ccattaaaag ttgagtgtgt gtgtgtgtgt gtgtgtgtgt 120 gtgtgtgtgt acttaatatg ttaaattata ttgagtcact ctgattgact tacaaatttt 180 ttcctcaggg tcagaagtaa tggacatttt aacagactga actatatcac caaaatactc 240 cccagaaaag tggtaacaat ttactttcca attgtgaata tcatactttt gatgcctatw 300 cataaattct ttaagactat tttaactact tgtgttattt tagaaaaata ttaattttag 360 gccaacttag atcaacataa atttgaagga aatatattga agaatgagag gaaaattatt 420 gtttttctcc tatgtcatct tacagacaag ttttcattaa actgggatga cttcacttgc 480 caaagacatt tgatatatca aatgcagcca tatgttctaa atataacgga ttactgccat 540 gtgcatgagt taaggaacat tgtattgtgt attgaaagaa cattgtattg aaagaacat 599 <210> 59 <211> 599 <212> DNA <213> Homo sapiens <400> 59 aatccatgtt ttcacaggaa tcaaaattga ataagtcaga agttatagga atattaagct 60 caatttggtg taatgaaaaa cactggattc acacactgct ttttatgtat tcttaatgta 120 gtacctatta cattgtattc aaattatctt ttcatgaaat ggtatttaca gctatgcttt 180 gcggtcctca agaacaggga caagtcatat ttctatgcct aacacttaac atacattaaa 240 cattaaataa atcattgatg agaacataaa tgaattaaca gagtagtcca aaaaataaay 300 agggatactc tggcagtagg tgacttcatc attcacttga taagatacaa gaaagaagtc 360 aggtattaaa atgggtgctg atacaaaata acctttacat atgcttccaa tactagatat 420 tttaaaaatg aaattgctat atcatgagaa taaattggtt tctagtgcta ataatgtact 480 tcctcttctt gtattaccac ccccaaataa taatattaat aagaacataa tgcttaaaga 540 gcattttatt tagtgaccct gtgagaaatc aggacaggca ataataatcc tacatagat 599 <210> 60 <211> 599 <212> DNA <213> Homo sapiens <400> 60 agtatcccat ttttattaaa gacaaatcac gataagactg atttgcttta ttatacttgg 60 cctgattatt tgtgtaaaat gtagcaagaa taattatttt tcacttagac tttttagatt 120 ggctttgatg gaactctctt ccatagaagg aatctcagat aagacttttt taaagtcaag 180 ccctgatatg ggattgtatc ctcaaatacc tatgagttgg gtaaatgtct ctccttttga 240 ggtcccaaga taacttaggg ctaatcagcc tgtcagaaag tgatattctt tacttaatay 300 aggtcaggaa tcctgtgcag ggactgtgta gacaaagtat gaggccagat ttcctaaggg 360 gcttttgtcg cctctatatg tcaagtttaa ttccttaaag gaaaacacac cattccagtc 420 aagtccttgg taaaataacc agtttctcca actgtgtatt gttgcaaaag aaaattgatt 480 cttattgcac ttacacaaat aattatactg acataaatta agaatactca caactagttc 540 caaattctgg agaaatcagt tagagagaaa caaatatgtt ccaaattttg ttcacagga 599 <210> 61 <211> 599 <212> DNA <213> Homo sapiens <400> 61 gcacagctag gggactgcac ccctctgcac cactgacaag agtgcagtgc agccgctgag 60 agactgcagc cccaataagc tagccctgct cgcatttatt tagtacagat ttaatgacaa 120 aggcttggag caaaaacaat ttgtggataa taaccattgt caactccccc acccccccaa 180 gtagagagca gtcctgcatg caaatgatca aaggttggtt tctggagaca ggaggaaaca 240 aatttatcta gataagtccc tttacattcc cttattattt accctttgct ctcaggctcy 300 ggataagaga acttggctgt cttcaggcaa atttactttt gaagcttttg caaaacctcc 360 tggccttcca agaaggtttg tgtctttccc tgtaactttt ataccttttc ccaccacact 420 gactgatttc ctacagtttt gtaaatgtag ctctagtttt acattaagta aactaaaaat 480 ggaaatcata gatggtaaat tatgcgagtg gcttattaaa aaaaaaacat ggggatctta 540 attaggagac catatttgta gaggagggct tggtactaca tcaaaaactg gcagtagtt 599 <210> 62 <211> 599 <212> DNA <213> Homo sapiens <400> 62 cattccttgt gagtggccag ctctgtttat ctcacagagt cctggcaaat gcctgttttc 60 tctctgagag agtacagagt tgtgatcagt gcagtggatc ccagcaacca gaggtcgggc 120 cagatgtttg aaagacagct tattttatca aaaagacatg gtttctcttg atttccttct 180 ggattaagtc tacttaactg aatacaatac aagctagaaa tgtttcaaaa tgccaaattg 240 ctattaaaat gaattcaagt ggaatattca taagaatata tgctctttaa ttaatgtcaw 300 attggctgaa tatttcctat cccaaatttt tctacccctt tctagtatct ctaactgaat 360 tatgatatgc atgaataaat aaatggcaga gaaaaaaagg accaaacttt ttctaatctt 420 ttatttctca aagattcaat tctctgtatt tcccaccatt atctgcttca cagcagaata 480 tctaaatatc tatgcttctt gttaaaagta ataggaagat taatgtgcac tcgaagacaa 540 cacagcctac aaggctcttt caaatgttca gctcaattaa cacttgaaat tctactaga 599 <210> 63 <211> 599 <212> DNA <213> Homo sapiens <400> 63 cagggaggac agctagacat tgctttcatc cccatcttga ttctggctgg tttctgccag 60 tttctttacc acatcctgtt atatcagtgt cgtctttgtg acctcttctt gagaaacaag 120 tcctaacaaa ctcctatctc agtttgtatg tgactatgta tacatttgat gtttcaggca 180 ttaataactc taaaattaat gtataggctc agtatggcta tatatcattt tacttgattt 240 cgtatggttc aacatcaact gcatgctgat ttttagtaaa tattggtctc aaattttgcy 300 tcggtatatg ttttgggtat atagataaaa tgcttcttcc aactgtcctt ttagttctgg 360 ctaccacaag tacattgcct ctgaccagca gcacaatgat gttggaactt gtgtcagaag 420 aatcatatcc ttcttttagc ttccatctac tttttgcact tttataacct aaaccatgtc 480 ccactttgtc aatgtacaat tcaggataaa gtcattgatg tcacactgaa tattgtctaa 540 tggagagcat tcagattcac aactctcttc cactttaaag gcaatctgta ttaatgaca 599 <210> 64 <211> 599 <212> DNA <213> Homo sapiens <400> 64 tgggaattgc catagcatct gtaaactgtc atggcacttt tgggtgtttc tgttagcatg 60 ctaggcgtat aatgagcagg gaggacagct agacattgct ttcatcccca tcttgattct 120 ggctggtttc tgccagtttc tttaccacat cctgttatat cagtgtcgtc tttgtgacct 180 cttcttgaga aacaagtcct aacaaactcc tatctcagtt tgtatgtgac tatgtataca 240 tttgatgttt caggcattaa taactctaaa attaatgtat aggctcagta tggctatatw 300 tcattttact tgatttcgta tggttcaaca tcaactgcat gctgattttt agtaaatatt 360 ggtctcaaat tttgcctcgg tatatgtttt gggtatatag ataaaatgct tcttccaact 420 gtccttttag ttctggctac cacaagtaca ttgcctctga ccagcagcac aatgatgttg 480 gaacttgtgt cagaagaatc atatccttct tttagcttcc atctactttt tgcactttta 540 taacctaaac catgtcccac tttgtcaatg tacaattcag gataaagtca ttgatgtca 599 <210> 65 <211> 599 <212> DNA <213> Homo sapiens <400> 65 tgatgttgaa ccatacgaaa tcaagtaaaa tgatatatag ccatactgag cctatacatt 60 aattttagag ttattaatgc ctgaaacatc aaatgtatac atagtcacat acaaactgag 120 ataggagttt gttaggactt gtttctcaag aagaggtcac aaagacgaca ctgatataac 180 aggatgtggt aaagaaactg gcagaaacca gccagaatca agatggggat gaaagcaatg 240 tctagctgtc ctccctgctc attatacgcc tagcatgcta acagaaacac ccaaaagtgy 300 catgacagtt tacagatgct atggcaattc ccagaaatta cactagataa tctaaaaagg 360 gcaggaaccc ttggttctgg gaactcccta ctcctttcct gaaaaactcg taattgaccc 420 cttgtttagc atattatcaa aaataaccat aaaaatagcc aaccagcagt ccttagggtg 480 actctgctat ggggtagcca ccattttatt ccttcacatt ttaatagact tgctttcact 540 tcactcttga attctttcct gctctaaccc aagaacccac atggcctccc aagctgaat 599 <210> 66 <211> 599 <212> DNA <213> Homo sapiens <400> 66 tatagattac acaaaatatc tgcaaccttt gtgacatatg taaggttaac aaaactaata 60 ttaacaatag acaaagaact tcaaggaaaa aggccccaaa ataaaagcga atgccaacaa 120 atacattaaa ataagagtcc tcaaacccca ggccacagac tggtagcagt ctgtgacctg 180 ttaggaacca gtctgcacag caggaggtga ctggtgggta agcaagcatt attgcctgag 240 ctctgcctcc tgacccttgt cagttcagcc aaggcattag attctcatag gagtgtgaam 300 cttattgtga attgtgcatg tgagggatct aggttgcaca ctccttatga gaatctaatg 360 cctgatgatc tgagctggaa cagtttcaac acaaaaccat ccgcaacccc cacctcagtc 420 cgtggaaaaa ctgtcttcca taaaactggt ccctggtgcc aaaaaggttg aggactgctg 480 cattaaaaga tactcaatct cacttgtagt ctgataaata aaagttaaaa caattatcca 540 atatattaag ttaggctgaa attatataag atttttttta aaactgccaa tagtattgg 599 <210> 67 <211> 599 <212> DNA <213> Homo sapiens <400> 67 gaggggcaaa cagcctccac ttgtgaggtt tgtcatttta ttcagaacag agcgccctct 60 ccagggactc agtaagacaa aaggtgggga aacgggtgat ttgattgctc aactatttgt 120 attgttataa aatgacaata catgccagtg ggtaatcaat gcccatacta gaaataaaaa 180 aatatgactc aaaatttaca ataggaaggg tgcagtggct cttgactaac tccagggctt 240 tgagaggtcg aggtggaagg atcacttgag gccaggagtt caagaccagt ctgagcgatr 300 taatgagatc tacccatgca aaaaataaat aattagccag gcatgatggt ttgtgcctat 360 agttctagct acttaggaag ctgagctggg aggattgctt gagcccagga gttcaaggct 420 gcagtgagct atgattgcac cactgcactc cagcctgggc atataaaaat atttgattct 480 ttgatgattt atctaaaatg atttttataa agaatgcaga tgtatctctt tctctctctc 540 tttctctctc tatatatata cagatatata catatatcat atgtattgta tatattcct 599 <210> 68 <211> 599 <212> DNA <213> Homo sapiens <400> 68 tattggtgtt cagtaaatgt tattttgcat cattttacat atgcacctca ttaaatcccc 60 atagcaaact tgtaaagtgg gtactattag tctcctaatt aagaaaagcg aaagtggcag 120 agcctggctg gatctcagtt gagtttattg agctttcaaa ttagtacaga gactagttta 180 ggaaacacaa agagtatact tccgtggatg gatataagct gttacatgtt gaacctgtgg 240 gaaaataaca ttcatcttca ttttttcctc tctaactata aatgtaaact atattaaacr 300 ttcataatcc tatcagattc tatgccctct tttacaacag tagtttatag tttgcaacac 360 tccctctaat atcccagaaa taaaatcttc agataacaga ctgaaaccat aaattcaaaa 420 agtatatctt tatatgatac cccactgtaa tacaaaggat aaattttaaa atgtaattat 480 taaagtaatt tgtagttcaa gataaaatgc tcaggttccc ctatttgtac tatttgtaga 540 atcactgtga ttgtgacagc taccgatgca gacctactga agactactta acctgaagc 599 <210> 69 <211> 599 <212> DNA <213> Homo sapiens <400> 69 tacatatgca cctcattaaa tccccatagc aaacttgtaa agtgggtact attagtctcc 60 taattaagaa aagcgaaagt ggcagagcct ggctggatct cagttgagtt tattgagctt 120 tcaaattagt acagagacta gtttaggaaa cacaaagagt atacttccgt ggatggatat 180 aagctgttac atgttgaacc tgtgggaaaa taacattcat cttcattttt tcctctctaa 240 ctataaatgt aaactatatt aaacgttcat aatcctatca gattctatgc cctcttttay 300 aacagtagtt tatagtttgc aacactccct ctaatatccc agaaataaaa tcttcagata 360 acagactgaa accataaatt caaaaagtat atctttatat gataccccac tgtaatacaa 420 aggataaatt ttaaaatgta attattaaag taatttgtag ttcaagataa aatgctcagg 480 ttcccctatt tgtactattt gtagaatcac tgtgattgtg acagctaccg atgcagacct 540 actgaagact acttaacctg aagcatataa tggtttctcc ctatgtccaa gaactctac 599 <210> 70 <211> 599 <212> DNA <213> Homo sapiens <400> 70 acaccaggat tgacattgat acagttaaga tagagaacat ttccattacc acaagaatcc 60 cttatgttgc tcttttatag gaattttcac tgccttccca tctcactgac tccttaatct 120 ctaccaacta ttaatctgtg ttccatttcg ataattttgt tacctcaaga gtgttatata 180 aatgaaatct taccatatgt aaccttttgg tattggcttt ttgtaaatcc agtgtaattc 240 tctagagatt tatccagatc taccgtatta attgtaacca tgcacctgtt caagaacaty 300 tgcttgtttg tttccgatgc tgggctataa tgaataagac tgtatcatga agaggttttt 360 gcttgaaaat aaattttcat ttatctggga taaatgcccc aagagtgcaa ttgctggtca 420 aaacttacca agttttacgt ttatggatca tgcttttggt atcaactcta ggaactcttt 480 gcctagtcct atatcctgca gtttttttct cttatttttt ggtaataatt ttatgcttac 540 attgaaattt gtaatcattt taatttttcc aaaaggtgta agagatagat tgaagttta 599 <210> 71 <211> 599 <212> DNA <213> Homo sapiens <400> 71 gctgtactgg cttccttgtt aatcctttat ccccttcagg tgttattcaa atgtcatctt 60 ctcaagaagg ccttgtgtga ttagtttatt gaaattattc cactcaactc ctatgtctaa 120 cactattcag tctcctttcc tgcttcaatt ttcttcttgg ctcctagcac catctaactt 180 ggaacatgta tatgtgacat atttggctag attatttcac ccattagcat gtaaactcca 240 cgaaggcttt tattttactg cagtattttc tgcacctaga acagtattgg tatatagcar 300 tcacttaaat atttgttgaa tgagtgatgt agagaaggtt caaaaagcca ctggagaatg 360 tcatggcttg accggtttga attgtaatac tttaaatcaa agatcaatgg aaacattaat 420 aggaaagatc ttaacatcaa ttttcttcca ggagaattta aacataaaca catacaaata 480 gataagcaca tgctttagaa actctcccat tcccttctct aaacctcaac ccactctctc 540 taccaccctt ccctaaaaaa atgagagatt aaagaaaaag taaacacact gtgtccatg 599 <210> 72 <211> 599 <212> DNA <213> Homo sapiens <400> 72 ctaaaatcta tgctgtaata ctataagaat ttaaaaaata tcaacctagg atttctatga 60 tacattctca aacagcgtat ttattactta tttacacaaa aaactgtcac ttcaacttag 120 ataaaattga gcacctcact ttttaaatat tgaatatcgg tttaaagatc tcaagttttt 180 atatcctcct tttgttaaca atgtagaaag gatattttag attccactag caacttctca 240 cagaagatat tattaatgaa actgaagtat tgcattttat ttctaaaggt cagtttaatr 300 gacttgcaat ttcaaagttt aaccgtacca tctgttttaa cttaaaaata tagttataaa 360 ttctttttag caacatttgt gttttaatac cctgaagaat tattacaata aatccaaatt 420 aatattctgg tccctaatta cagaagagtg aatcaataaa ttagattacc cgaaatgaga 480 ctttggtgac ttcttagcag atatttagtg agcacccatt atgcacaagt attgatttgt 540 tgctgaagat taaaaattaa atcagtccct ttttaagagg ctcacagatt agtaagaac 599 <210> 73 <211> 599 <212> DNA <213> Homo sapiens <400> 73 tccttccatc tacaaacgca ggaaaccacg actggagaag ttatatgatt ggctaaacca 60 tgaatgacgc aacataaccc acgcccactg agaatcgtcc tttcccagac tggctcagat 120 tccgctttcc gattggtccc tacagcaaga gggcaaggac aattgcttaa gttgacctct 180 gggtccggaa tcgcgggcaa agatggcggc ggccaggtgt tggaggcctt tgctacgcgg 240 tccgaggctt tcattgcaca ccgcggctaa tgccgccgcc acggctacag aaacgacctb 300 ccaagacgtc gcggcgaccc ccgtcgcgcg gtacccgccg attgtggcct ccatgacagc 360 cgacagcaaa gctgcacggc tgcggcggat cgagcgctgg caggcgacgg tgcacgctgc 420 ggagtcggta gacgagaagc tgcgaatcct caccaagatg cagtttatga agtacatggt 480 ttacccgcag accttcgcgc tgaatgccga ccgctggtac cagtacttca ccaagaccgt 540 gttcctgtcg ggtctgccgc cgcccccagc ggagcccgag cccgagcccg aacccgaac 599 <210> 74 <211> 599 <212> DNA <213> Homo sapiens <400> 74 gaaccagggc ctagcacata aatactgagt aaacgttagg tatcttagtt aatacttcat 60 ttaatcttca caattctaca acaaagaact actaccgtaa aacgcgaaaa attaagcaaa 120 aaagttacta aagaaaaaga aaagacatac taaatttaaa attaaggtaa aaagaagtta 180 ctactcagcc atgtgacaca tggtcacaca gctttgtggt ggaacagcca acaggaaacc 240 tggcccgccc cactctctta agtggcgttt ctcttcatca ccactgctct tccatttggs 300 tgaacactca caaagtagaa tccaggactg gaatcctgga gagctcaggc tttcagagtt 360 gaagagctgg taggtgttag cgcagccaca cacacctagt ctctagattc ctaacgcagt 420 gactgttaca aaaccaggcc accccagata ggaacgaaag gactaggaaa acatgaacga 480 agcagagaga aagaaatgac gaggggtaaa tctgcggcag agtaacccag tacaatcccc 540 atctctccct tccgccctgg ggcggaatcc aaggctcacc gagggcggca gcggccagg 599 <210> 75 <211> 599 <212> DNA <213> Homo sapiens <400> 75 tcagcagctt ccgtgtaact gttcagggcg gacatgaaaa gtaattaacg tataaataat 60 tttaaaaatt attgtttttg acgcattcat tattttatat cttctaccaa gtgtatgtct 120 taatatttat tgaagtaatg ttaggactgt agatgtgtgc tcaacctagc cttgttgtgt 180 gcatgttttt tcccttcccc agttgagaaa gaagtggtct tgaggaaagc gtcatggact 240 tagactactc ctgatggatg gcctagaaaa cctgtttaac tttgtcaaga cccaggttcy 300 tctcctataa aatagagata atgaaaagta tacatacctt tgggagttat tgtgaaaatt 360 gaattggatg ttcataaaat agccctattt ttatttatgg tgaatgatat tcttgttaat 420 cttattttct tttattactc ctaatgagga atctctttgg ttactgttca ttgtaatgat 480 ggcacaagta gacaataaat gtttgaatgt tatatttaag tcataatagt taaattacca 540 cataacccag actcttacct caatcattcc taagttatca tttgctaagt tagtactct 599 <210> 76 <211> 599 <212> DNA <213> Homo sapiens <400> 76 ttattacaac atgcataaac actggaaaga aaatattaag ttcattattt gaaattttac 60 ttgtttctac caaaatagaa gtatttaact ttagaaaata ggctttgttg acttattaga 120 tagaaaaatt agtgtttttt taaaagtaaa aacttttaga actggacttg agatagcaat 180 tggctttttt aagtgtccta tttgtgccat gcatggtggt aagataagga attcacaaat 240 tcataatgtc tgatgtctgc cctccctcat gcagcttatt tttttgcaat tttttcttcy 300 tttgttaatt cctacccaat gtgaagaagt cttaagaagg ttttatacca gccctccaga 360 cctattttat cagccttttc tcagtcactg tggtcttagg gagtgacctg caaggaactt 420 tttgttgaaa agactaccac tagaatcaag aatgtcagca tttcatgaaa tgttgctact 480 tatttttttt ttttttactt agaaaagtag tgtaaaaatg atttttaaaa attaggagca 540 aagtgtgtaa ttatttcatt aaataagtta ttaaagtctt gaagtggctg tatcctctt 599 <210> 77 <211> 599 <212> DNA <213> Homo sapiens <400> 77 ttgtggatta aatatttata ttacatcaat ggctatccta tataatttct ttaaaggtta 60 tatccaggat ttggattagg ggattgttca ttcattcagt aaacagtaac tgctttttta 120 tatgctatac tctgttcaag atgcagtgtt gagtgaaaca gatcctgctt tcttagagct 180 tatattatag tgggggtgtg gggtggtaaa agataataag catgtaatgt ttataactag 240 tggtaatact atggggaaaa tactttagcc taaagagtag aatgatttat aggggggcar 300 gtataaatga ggtatggaga agaatctatt tttaaaaagt cattcaggag aggtccctaa 360 aaatgactta ctctaagacc tgaatggcga ggagctgcct atgcacaaat ctgggtaaag 420 acacttccag gcaaaaggat cagcaagtaa aagtccctga ggtgggaaca ggcctgaaat 480 atttaggaac aacatgaagg gtaatgaaga gtgggacaag gagaatgatg tagaaggaga 540 cagtggaagc cagaggctat atcttccagg actattagag ctcattgtgg ggcatttgg 599 <210> 78 <211> 599 <212> DNA <213> Homo sapiens <400> 78 atttggattt tattctaaaa cctgaagtaa tgtaatatga agtagattaa cactatgtga 60 atatccaaga ggaattttac tacatatttg attactaggc tcatcttttt ttaacatata 120 tatgtatttt aaccttatac tcaaaattga cttagattta tataatagaa ttgaatagag 180 gaagtgggag taggagtaga tggaattaga caaagtaaga agtaactttc ttgaagatgg 240 tagaatggca ctgtttactt ttgaaagata aagtacttct ttttacaata aaataaattm 300 catatgtcaa cagtattact catttgctat ctccattaaa gatgacataa aatacgtgtg 360 gagaaataaa gttactactt ggccttggta attgggtaat gacatagtac cagatgtaga 420 aagcatctgt gtagataaag cttgctgctc ttagatgaag taaataagac tgatgttgtt 480 gaaaaagatt aatcatgaga ttgaggatac tagaagggag gaaaatatta tttgtgcaga 540 aataaaatat agggttagaa tagagatgat aaggaaactt tgaggtcttc agggatttt 599 <210> 79 <211> 599 <212> DNA <213> Homo sapiens <400> 79 gtgtaattgg aaatggactt tttctttcca attatatact tctttatagt ttttaaaagt 60 ggctttatat aggtgatact gatagctata tatttatctt gtaaaagacc aatttaagtt 120 gttcattaga gccaataatt tgtcagctga ttctcatgag gtgtatataa ccaatctgat 180 ttgcgttctt ctgaaactgc ttatcaaata gatggccatt agcccctaaa tggcaaaatc 240 cactggacag ttttctgtat tgtactcagt aaggtctgac atattttgca tgtttgaccr 300 ctccttcatt tttaaaatag tttttttatt gccttcagtg aaacatgctc ttggttttcc 360 tcctatctca tttgctgttc tgtcatattt ctgtttgctg ttcttcctct cacttttctt 420 caaatattgg tgtacttttt tttcttttct agactccatt tttgtttaac cacactctcc 480 ctagatgatt ttatcaaatt ccatggattt aaatatattt gtaagcacat tcaaaattag 540 tttgatttca accttgtgtt ttgtatctga atgataagca tcagcattat aactaaaca 599 <210> 80 <211> 599 <212> DNA <213> Homo sapiens <400> 80 ttattgcctt cagtgaaaca tgctcttggt tttcctccta tctcatttgc tgttctgtca 60 tatttctgtt tgctgttctt cctctcactt ttcttcaaat attggtgtac ttttttttct 120 tttctagact ccatttttgt ttaaccacac tctccctaga tgattttatc aaattccatg 180 gatttaaata tatttgtaag cacattcaaa attagtttga tttcaacctt gtgttttgta 240 tctgaatgat aagcatcagc attataacta aacagactgt gtggttaaga ttatggacar 300 tttttccctc tagttatcta attttcataa ttacccccag aacgtgagaa cattattttt 360 atgatcagaa agtattttaa gaaactagtt gagtggactc taatatggaa ccatcaacat 420 gtatcaaatt ccacttaatt ataagcaaat tcattatgaa attatattta aaaaggcatt 480 tcatgattac atttgttatt taagaaaatg ttatttaaag aaatttacat aagtttcatt 540 atacatgtat tttagcttac tcattctgga aatggaaaac ttagatacta ggcaagaag 599 <210> 81 <211> 599 <212> DNA <213> Homo sapiens <400> 81 caggggctgg aattaacctg ctctgagtcc ctttagatgt gcatactctc tccgatttgc 60 cacagttccc accaattctt atttctcctc tctttacttg gcccacatca ttgggcctat 120 ctcattaatt tctattaaat attttattac tgaggccatt agtttatgac ccctgaggcc 180 aagacagctg ttaagaactt gcattactgg tggcaaaatt atacctttac gattacttac 240 taggttttag aaatctcact tttctaacaa gaggtattat ggtaatcata agttcaaaak 300 aattaaagtt catttgagat aattaaatca aaacctctag tctgggttgg agggtgataa 360 agttatctgg cgaaatatat gaacttctgt taccttcctc ttctgctaaa tgaatggtaa 420 aatgaatcct gatttgttta ggcagtttac ttatgaagtt gggagaattt ttttttttct 480 ttaaaggact gagtctggct ctgttgccta ggctcaagta ctgtggatct tggctcactg 540 cagcctccac ctcttggatt caagcagttc tcctgcctca gcctcccgag tagctggga 599 <210> 82 <211> 599 <212> DNA <213> Homo sapiens <400> 82 tgctctggag gggggatttg ttagccaaga agaggctgaa aacatgagta gtgtactttg 60 ggagactaga aggacgaacg ttaaaagtat acgacctcca aggttgtgac tctggtagaa 120 ttctttggtt agagatcctg aaggacagca tcctagggat aatggtgaaa cagaagtaga 180 ccattcacat agagtgtagt ttagcattaa atcatcaagg tggattagta aattgtgaga 240 ttttggaagt ggactaaggt gaccttaggt ttctaatgcc cctaggaacc tgaaagatas 300 aaacctggag gaagaatatt ttcctaggcc tcaaattatt tgggtacttt ttcaaataca 360 gtatctccac ataccctgga tacaggagga gaaaggcgga atgaaaactg gcagaaacag 420 tagacccaaa ggggcaccaa ataattgcat tgtgaggtag actttaagta tgtttactgt 480 attcaaggag ataaaagatg gaaaatttcc atatagaatt ggaaactata aaaaagtcac 540 tgcagatttg ttaaaaaaaa aaaaaagcca aatataaatt tgaaaacttg aaaaaccaa 599 <210> 83 <211> 599 <212> DNA <213> Homo sapiens <400> 83 agttccttgt cccatggacc tctcctttag gacagcttac aacctggcag cttgccagag 60 ggaacctata gagcccatag agtgagtctg ctaacaagac aactgaagag agaaataacc 120 aaactgaaaa tgagaaaaaa atatttagaa ttaatgtctt tgtaaacttt gactctatta 180 ctctgccatc accagtaagg gggaattgaa atatacccat gctgggaaac aatggaagta 240 gtgtggagaa aagtattaag gatatatttt aattgaatgt aggagcttag aaataaggay 300 agtattaggg aagaatggat tattaaacta gatatttagg aatcctcttc atacttattc 360 aggacaccag tgggtaccca atctgtactg gttttactga tctttgtgca atttgctgct 420 cagcagatat tttcaatgct gattggtaat atgtcagtgg ataaccagtg gaaatgcatg 480 tctattaatt actattgcac ataatattta tcttgttttt atattttgca caggattttc 540 aaggtgctgg tatatttctg agcactgtaa agttttcttt gagaaataag tgtttattt 599 <210> 84 <211> 599 <212> DNA <213> Homo sapiens <400> 84 tggtatattt ctgagcactg taaagttttc tttgagaaat aagtgtttat ttttaaattg 60 cgttgtctca tgggagggta acatttgtaa atatacttca aattagtgtt gttccctctg 120 ctttcttttt cctgactcag aaacagagtg ctttgactgc tctatgttgg ggccatgttt 180 tccgcagact tgaacccaag ccaggccctt gaatgttccc aggcacggat aaacttgttt 240 agactggctg aaacaccaaa acatcaaacg tgttgctaaa catgtaaata ctagccccaw 300 ccctgaaccc aattccttaa gcccccatat aaactccata tccgattccc catatctagg 360 ttagaacgtc tcttttctcc ctgtcaatca tgaggactaa tgcagcacac aatgtataca 420 gtactaataa aggctttgga cttaccactt ccttctttga aatcccaact ggtcgcatct 480 taggttggtt tggggcagtc ccttgtggga actctcctgc tattctgtct ggttttgggc 540 cttactgcag ttgtggtttt gggtggttgg aacaagcata tatttcaata aatacgttt 599 <210> 85 <211> 599 <212> DNA <213> Homo sapiens <400> 85 ccagttgaaa ctggactttc agatatagca atggtttttt tctaaagaaa tcctgtcaac 60 attaaagagg ttttctccat tgtaactaaa ctgaacaaag acagaaagct tatgggacaa 120 actaaaactg gctctcgacc cgcagttgtg tcatgttgtt ttttggacat ttaaaaaacg 180 tatttattga aatatatgct tgttccaacc acccaaaacc acaactgcag taaggcccaa 240 aaccagacag aatagcagga gagttcccac aagggactgc cccaaaccaa cctaagatgy 300 gaccagttgg gatttcaaag aaggaagtgg taagtccaaa gcctttatta gtactgtata 360 cattgtgtgc tgcattagtc ctcatgattg acagggagaa aagagacgtt ctaacctaga 420 tatggggaat cggatatgga gtttatatgg gggcttaagg aattgggttc agggttgggg 480 ctagtattta catgtttagc aacacgtttg atgttttggt gtttcagcca gtctaaacaa 540 gtttatccgt gcctgggaac attcaagggc ctggcttggg ttcaagtctg cggaaaaca 599 <210> 86 <211> 599 <212> DNA <213> Homo sapiens <400> 86 atgagaacgt tgagttactt atcactgact acttaagggg acatttgcct atttatttac 60 aatgctttgc agaagtatcc agtaacattt atgaatttat ttgtatatat caaatattat 120 cttatgttct aatgaatttt atccatttca ggtagagaat ggattattct gaaaactaga 180 ttttcatata attttgtttt tagtttcatt ttcattttta aaatataaga tttttgttat 240 tgctataaaa tacatgatca ttacaaaaaa tctgaaaaac agtagggaag ataatctcay 300 gctgttaacg ttttggtata tcttttatct atagattttt gttgatattt tgtttttcag 360 gtcatactat agataaaggt ttttacattt gtatttcata atcacttttc ctcattatac 420 atttcagtat tccataagta gtctttgggg gtattttgta gataattgaa tataaaatta 480 ttgtaaaatt aaacactaac aaatacataa acatgaaatt ttcatcagtt cacactcatt 540 acagggagaa aaggaatcac aacttttttc tattattaaa aaaacccaag catgataat 599 <210> 87 <211> 599 <212> DNA <213> Homo sapiens <400> 87 gtcatttaat tttcaaaaca actctccaaa ggaagtgtca ctctccttgt ttgatttctt 60 gcttcccaaa tggaaggtcc tttgtattaa tagtatctgt caaatttcat acaatactta 120 aatatgttct tgatacgtac ttcaatataa ccaacagaat gaggcagtat tcgataaagt 180 aaaaaataag atgaatattt ctagtgattt ataagttact tgaggaaatc atgctgttta 240 ttcttttcct ttttaggtat tctttgtgaa tttgctattt gtgtgtgaat atatctgttk 300 cgataatgaa taaccatatg aaatggataa ttgtatgaaa attcatttgt aattcaatag 360 attgccaggg attttaggtt ggttatgaag gtttgttttt tttttttttt tcttttggag 420 agtggggaga ttggcataca gtttcaaatt gtttatgtgg aagttggaag tgtgactaag 480 ctcgaagaaa ggaagagagg gacaaagaaa gggaggaggt acccctaagt gggaacctac 540 caggacattc aaagcaagag cagtaagttc tgaatgttct gggacaacct gggtgatat 599 <210> 88 <211> 599 <212> DNA <213> Homo sapiens <400> 88 aggtttgttt tttttttttt tttcttttgg agagtgggga gattggcata cagtttcaaa 60 ttgtttatgt ggaagttgga agtgtgacta agctcgaaga aaggaagaga gggacaaaga 120 aagggaggag gtacccctaa gtgggaacct accaggacat tcaaagcaag agcagtaagt 180 tctgaatgtt ctgggacaac ctgggtgata tgcatggata tgggctgtgg aggctgagca 240 ttttaatgat aacttaggga aacgaggcat ggccatggtg taaaactctc aaatcccaas 300 ccctaatcca accttaaaat ccgagtcttc taaagggctg ttttaaccat gaaaggacca 360 taagaaaggc aattcacaga aaatgaagcc atgtggccaa gaaatataag aaaaacagta 420 aaagccctta atctcaatag caatagagtg gatgcaaatg aatataatga gttgccatgt 480 cgttcttact ggattggaaa agaaattaga atgtctaaat aacatgtatc atccaggatg 540 tggggaaatg ggagctcttg taccctgcag gcaggcattt aaattggtgc aaccgcttt 599 <210> 89 <211> 599 <212> DNA <213> Homo sapiens <400> 89 atgtatcatc caggatgtgg ggaaatggga gctcttgtac cctgcaggca ggcatttaaa 60 ttggtgcaac cgctttggat tgctgctttg tagtatctgg tgcaactgaa gatgaacatg 120 ccctgtgaca cagcaaccgc acttctaggt caatacccta attatattct tactgtggtt 180 cacaagaagg tatgtaagag gtcattgcct gagcactgtt tagaataggg gcaaactgga 240 aatcctctaa atgtctgtca atgaaggaat agataaattg taatatgttc atataaaatr 300 ctgcataaat aagtgaaatt tataaatata ctaacgaatg aatcttgaaa acagagttgg 360 gagataaaag caagctgttg aagaacatgg tcagtatcct ctcacttatg taagttaaaa 420 actccaaaga acattatcta tattggtaat ggcatagaca tgtgtggtaa aatataaaaa 480 tattaactaa aagttctata cgcttcagga tattgttagt ataataaggc aggaagtgga 540 tagcattggg gtgagacagt ggtttggtgg ttatgtttgg ttactttagt tatgttagt 599 <210> 90 <211> 599 <212> DNA <213> Homo sapiens <400> 90 gagctcttgt accctgcagg caggcattta aattggtgca accgctttgg attgctgctt 60 tgtagtatct ggtgcaactg aagatgaaca tgccctgtga cacagcaacc gcacttctag 120 gtcaataccc taattatatt cttactgtgg ttcacaagaa ggtatgtaag aggtcattgc 180 ctgagcactg tttagaatag gggcaaactg gaaatcctct aaatgtctgt caatgaagga 240 atagataaat tgtaatatgt tcatataaaa tgctgcataa ataagtgaaa tttataaatr 300 tactaacgaa tgaatcttga aaacagagtt gggagataaa agcaagctgt tgaagaacat 360 ggtcagtatc ctctcactta tgtaagttaa aaactccaaa gaacattatc tatattggta 420 atggcataga catgtgtggt aaaatataaa aatattaact aaaagttcta tacgcttcag 480 gatattgtta gtataataag gcaggaagtg gatagcattg gggtgagaca gtggtttggt 540 ggttatgttt ggttacttta gttatgttag taacattttt tttttaaaga aggatctgg 599 <210> 91 <211> 599 <212> DNA <213> Homo sapiens <400> 91 cagtatcctc tcacttatgt aagttaaaaa ctccaaagaa cattatctat attggtaatg 60 gcatagacat gtgtggtaaa atataaaaat attaactaaa agttctatac gcttcaggat 120 attgttagta taataaggca ggaagtggat agcattgggg tgagacagtg gtttggtggt 180 tatgtttggt tactttagtt atgttagtaa catttttttt ttaaagaagg atctggaata 240 attatggtaa aataatagta tttgctaaga ctagatgatt ggtgtactgg atttcatccr 300 ctattttcta agtttgttat gaacgcttaa aatatatatg tatgtagtaa aattaatgta 360 aatttgtaca aataaaaata aatggcatgt gatatatggc agaagctgtg tgtgtgtatg 420 aaaagcaaag gcaggcaggg caagtttctg ggtagcataa acatggaaca atcctaggaa 480 tatgaaattg acctaaatat accagctttc tggagattcc acagtcccag atgattgatg 540 atctaataca attttctagt tttattgata ataggagcaa gaagggttaa gtgactttc 599 <210> 92 <211> 599 <212> DNA <213> Homo sapiens <400> 92 aatattaact aaaagttcta tacgcttcag gatattgtta gtataataag gcaggaagtg 60 gatagcattg gggtgagaca gtggtttggt ggttatgttt ggttacttta gttatgttag 120 taacattttt tttttaaaga aggatctgga ataattatgg taaaataata gtatttgcta 180 agactagatg attggtgtac tggatttcat ccgctatttt ctaagtttgt tatgaacgct 240 taaaatatat atgtatgtag taaaattaat gtaaatttgt acaaataaaa ataaatggcm 300 tgtgatatat ggcagaagct gtgtgtgtgt atgaaaagca aaggcaggca gggcaagttt 360 ctgggtagca taaacatgga acaatcctag gaatatgaaa ttgacctaaa tataccagct 420 ttctggagat tccacagtcc cagatgattg atgatctaat acaattttct agttttattg 480 ataataggag caagaagggt taagtgactt tctccaagtt gcacatacat aagtggtaga 540 gctcagtcta gaatccaagt gttctgagtc ctgtccagtg ttgttcttcc tacattgct 599 <210> 93 <211> 599 <212> DNA <213> Homo sapiens <400> 93 aataaaaata aatggcatgt gatatatggc agaagctgtg tgtgtgtatg aaaagcaaag 60 gcaggcaggg caagtttctg ggtagcataa acatggaaca atcctaggaa tatgaaattg 120 acctaaatat accagctttc tggagattcc acagtcccag atgattgatg atctaataca 180 attttctagt tttattgata ataggagcaa gaagggttaa gtgactttct ccaagttgca 240 catacataag tggtagagct cagtctagaa tccaagtgtt ctgagtcctg tccagtgtts 300 ttcttcctac attgctgcaa atgagtcctt catgtatagc tcatgacttg cataaggtag 360 ataattttgt gagctgttct ttacagattc ccttttattt tatattctac gaggtctatc 420 tatagcaaaa ggcatttaga agtggtgtta atattagcat gcccaaagta actctgagat 480 gatatcattt acttccatat gggaattttc cagttagtat caagcttgag attcaagtgg 540 aaattagctt tcaggaattt ttgcaatata aaatttatta tgtgttgacc tacttctgt 599 <210> 94 <211> 599 <212> DNA <213> Homo sapiens <400> 94 acatgtgtac ctgaacaata tttcagcctc tctcttcagc cagaatttgc tcctgagagg 60 caaattcata tctccagaca tctctacctg aacatcccaa atatgctcat aatcaacatg 120 ccccaaactg cattcatcag ctttttgtcc ttttcaatat tcccaaacca agggttggca 180 ctactacttg catagtcttt caatctagac acctgggagt cattttttac tttcattctt 240 cccttcccat actcagtcag tcaccaagtc ttgcagattc ccaaagatgt ttccaactcm 300 ccattcattt cttcccttat caatatttaa cttatttcag atccccatca tggctcccct 360 ggacaattcc aagggtcttc taaggttcct tactcacagt ctcattaccc tctagtcagc 420 cttcacaatg caatcagaaa gatccttgtg gcatacaaac cttttccccc tgaatgaaat 480 ccatgcttct aaccaagcca tgcaagactt cttgttttct ttctagccta aagtcttgtc 540 attctttacc tcctatgatt tagcaatcgt gatggagttg actttcacta aatgcacca 599 <210> 95 <211> 599 <212> DNA <213> Homo sapiens <400> 95 gtttactttg tgtcaattgg aaagtgttat atttactcat tgaatcccag ttttggaaag 60 aagatatgat gggctgccat aatttctcag taggattggg aaaaataaca atgcataaat 120 attcacattt tccttcactt ccctatcctt gcttggctct gagcaattca ttgcattggt 180 cattttacta gtcaggattt tgatataagt aggtatgaag tggcagagcc aacaaaaccc 240 ccacaaaact atattactta tatgaagacc ggcaaattct atgcttgggg ggaaaaagay 300 ttggaaaaaa atgaggaaaa ggagaaatag aaaagactaa gagtggtctg aattttcata 360 gaaagttttg cagagggaga gacaatgaat gagaaagggg gagggggcaa attaaccaat 420 aactaggtgc gagatcccag gcaggggccc ttactgtgat gattgactat gggaggtggg 480 tgtgcacagc agatttttag gatattttgc agtgcatcat gcactaatca ctgttggcat 540 ttttgaagaa aatacagaaa aataagttga ttttcacttt tggattgagt tcctcctgc 599 <210> 96 <211> 599 <212> DNA <213> Homo sapiens <400> 96 gtcttgtgcc tttgcacact tttttacatg cacgtaacca aggatggctt caagatcatg 60 gcccaattat taatcgagaa aaagggatac ataaagtaag agcatgatgg tgcttatcct 120 agtggagact tctcccttgg ttgccatagt cattgactaa gcacttcgtg ggaataaatg 180 ttccaatagc agagacttcc accattagca gaaccatcag ctcatattta tttcactgca 240 tatttcactc gattacttga aaagacatat ttttagagat aaactacact gggacagatm 300 tcataacacc gtagtttttt ttgctaattc acatatatta tttctggcct ttccagatat 360 aaaatagaat aattatggca aggataattg ccacaacttt aaagaaaagg aaacccgaat 420 ttaagaggga ttaaataatt tgcttgaggc tacataataa ggggaaccca aacccaaaag 480 ggacacaaac ccaaatgttt ccagttctga gcccatcatt ttttctaaaa cgttacaata 540 aatcctaaat atattttgat taaaaattat aaatgtatat tttgacaaaa tgtggtcca 599 <210> 97 <211> 599 <212> DNA <213> Homo sapiens <400> 97 tcactgcata tttcactcga ttacttgaaa agacatattt ttagagataa actacactgg 60 gacagatatc ataacaccgt agtttttttt gctaattcac atatattatt tctggccttt 120 ccagatataa aatagaataa ttatggcaag gataattgcc acaactttaa agaaaaggaa 180 acccgaattt aagagggatt aaataatttg cttgaggcta cataataagg ggaacccaaa 240 cccaaaaggg acacaaaccc aaatgtttcc agttctgagc ccatcatttt ttctaaaacr 300 ttacaataaa tcctaaatat attttgatta aaaattataa atgtatattt tgacaaaatg 360 tggtccatca gaacagtgaa agaatgctgt gcacagtagg caaatacgtt aattttttcc 420 aaatctgtat tgatacatca gtcaaatgca tgtaggagac aaagcagcct ataatgttta 480 acacagccag tgtggaaaga ctacctaaaa atgctgggaa aattattatt ttactaggaa 540 acatactctt cacctccatt tgtctttgga gacatagcac aagaaatttg cctgaggag 599 <210> 98 <211> 599 <212> DNA <213> Homo sapiens <400> 98 taataagggg aacccaaacc caaaagggac acaaacccaa atgtttccag ttctgagccc 60 atcatttttt ctaaaacgtt acaataaatc ctaaatatat tttgattaaa aattataaat 120 gtatattttg acaaaatgtg gtccatcaga acagtgaaag aatgctgtgc acagtaggca 180 aatacgttaa ttttttccaa atctgtattg atacatcagt caaatgcatg taggagacaa 240 agcagcctat aatgtttaac acagccagtg tggaaagact acctaaaaat gctgggaaaw 300 ttattatttt actaggaaac atactcttca cctccatttg tctttggaga catagcacaa 360 gaaatttgcc tgaggagcaa ttttgtgaag caaaagatgc agacaaattt taaggaagcc 420 acaagaggct agggaagaaa aatgcccaag gaaatgtcaa taaaacaaat gtatttaatc 480 tctgaatggt tatttaaatg gaacttttct tctactttga agcttaataa cagtttattg 540 ttttaaaaaa tctatcttga ttatgcataa tgacagggta tatatctttg ttcaatttc 599 <210> 99 <211> 599 <212> DNA <213> Homo sapiens <400> 99 tcttaacggt tctccatata ggaaaaatgt cttttgagga agtagcaatt tgagctggga 60 cctgaatgca aaaagtagat ggattcattt ccagctgaga aaagaacata aggaaaggca 120 tgaagtctta cctggcacag cagagaattt tgtggataat ttttaaacat tgtcaatatc 180 tgggtcccca aagggaaagg atacaataaa gatattaaaa atagaatggg aatgtggatt 240 ttaacaggat ttgtgacaat catagctaac aatggcttcc ttgaaaaaat tgagtaatay 300 tgcagtttac ttaataatac attacctcat ttaatccaca tagatgcaat gaagtgtgtg 360 ctataattag cacaatttta tagtgaagga aactaatatt tagagagttg gaaatttgaa 420 tactgatctt tcttcctcca gagcactagc ttttacatta aattgcttgg acaagccatg 480 acaccatctg gcatcctggg aatccaagtc ctatttctca cattgcttcc acaagaaaat 540 aggttataac ttccaaaaaa ttaactttca aataaacttc taaaacacaa cctatttaa 599 <210> 100 <211> 599 <212> DNA <213> Homo sapiens <400> 100 tgcgctgtaa ggaaatgaat attttggagg ttatggcagt aaagtaagca aaattctaca 60 aggttctgtt gtacgtttat gatataggga aagaaaaaga tcgcaaagat gttaaggagg 120 gtgaattaat tggctgtaag agacaaggaa gatggagcta tgctttcaga ttaattttag 180 gtactacata aataaaggtg acattcgctg agataaggat atagcaaaag agccatgtta 240 ttgtgaaaac aaaaggagag gggagatatt gtatgtgtgt aatatataaa attctaacay 300 gttgagtttg agctgtctga tggaagttaa gatattaagg gacatttgga tattaataca 360 tgtatctgag tattcaggac agagatatgg ttggcaattt gaattgggca cctttggttc 420 atacagagat agcactagaa atcataggaa gaaaggaaac aaaccaaaga tcatcaagcg 480 tgaaaagaca tgaaggacaa gaactacatc tgaagatgta cgatcaaatt gatgttcaca 540 gaaacatgtg cagccacatg tgtgaggggg tggctggctt agcaatcatg aaaggaaga 599 <210> 101 <211> 599 <212> DNA <213> Homo sapiens <400> 101 ccaattaatt caccctcctt aacatctttg cgatcttttt ctttccctat atcataaacg 60 tacaacagaa ccttgtagaa ttttgcttac tttactgcca taacctccaa aatattcatt 120 tccttacagc gcagctcttt tccaatttat tttcatactc tactcatcca cagtggtctt 180 tctaacacac aaaccttgga ttctaaattt agctaacatt cctctgattc agtaagttcc 240 ttgagtttac cacatttgat tcaactttgt atctctaatt tctagatgaa tacaggatam 300 gaggaagact tactaattca ttctcttatt cattcattct ctttctattg aacaccttct 360 gtgatccagg aaccatgacc tatacggggt atcagatgta aataacacag atgaagcccc 420 tgttttgtga aaagatcatg tgatatgaca gaaagtaaac agaagtggct attttacata 480 gttttatcag agaaggatcc tcttttgaca aaacattggg gttggactct taagggtggg 540 aaggattcag tcttgaaaaa caaaaaggag acagtgtatc tggagcatgg tgggctaga 599 <210> 102 <211> 599 <212> DNA <213> Homo sapiens <400> 102 aaaagtcaca tcttacatgg tggcaggaaa gagagcttgt gcagggaaac tcccatttat 60 aaaaccatca gatctcctga aacttattcg ctacatcaag aacactattg ggaaactgcc 120 caaatgattc cattgtctcc cactgggccc ctcccatgac atgtggggat tatgggaact 180 acaatttaag atgagatttg ggtggggaca cagccaaacc atatcaacat ctaaggcatg 240 tcctactggg caaaagactt ctgtcagcac tgggtctctg gtagtattag aattgctagr 300 cctggccagt ggatagaact actatgatag gtgagagatc caagactgat ttgagcagta 360 gccaaaaaga agagggatgg gcattgcagg ttgttgagga ggatcagcct gttttgtaaa 420 tgcagcaggt gattcaacca aaagtcactg aatacttgat accatctaaa gatttcacta 480 aatgatgggc catagttttt gacaagttag caaggcacag agaaaaggaa tttaagaaca 540 ggtattaata gagtaaaaat cacaaggact gacgttcagc cttaaggcgc ctgcataca 599 <210> 103 <211> 599 <212> DNA <213> Homo sapiens <400> 103 ctagctagat tgtgtttgct tattgtgttt actggtttat ctttttatta tgtatgtcat 60 tttgttttat gtttttactt tattctttct ttccaaggat tactgttaga cgtatgctag 120 aacttctcaa ggtattgttt ttgacttgtt ttttaagatt tctattttat ctttttggcc 180 tatattctag atgatttttt tctatatcat ctttgagttt actaattttt tcttcacaat 240 acttcagatt ggagtttgtc tcatacttat gttctcaatt tcagtgaatt aattttatcr 300 tttcttagga tttccagttt gttctttaaa tttatccatt cttgaatcat tacttaaagt 360 tgattttata atttattgtt ctgttttaat gaatgctttc tttcaatttt gctctgtaag 420 aatgttaaac atacttattt taaaaataaa aatgttttca cgttgcatat ttttatctta 480 tttgagataa attagtcagc tttttattta tttatttatt tttacaggga ggattgcact 540 ctgttgccca actggagcac agtggcacag tcatagctca ctacagcact gaactgctg 599 <210> 104 <211> 599 <212> DNA <213> Homo sapiens <400> 104 agttctgctg tgttactgtg ctagagatga tcatcttatt ctatttctca gttatttatt 60 ttttcatttt tttacacttg cattttccat ttactgtgag ttagaagaaa cagatctcaa 120 aacacagagg tatataatgc gatattgtct acagcagcac tgtccaatat gcaatccatt 180 agacacatgt ggcaatttaa attaaaatta ttcaaaatta aataatattg aaaatttagg 240 ttcttagtct tattagtcac atttaagttc tcaatagcca gttagggttg ttagctaccr 300 ttcagaataa tgcagatata taacactttt atcttcatag acagttctct tgggtagctc 360 tagttcatgg tatgaaacta aatactgaaa agataaaaaa agagtctgca ggtatttaac 420 cttttgtgag gctattagaa gccctgaagc tcactgaatt aatacatata gttcctattt 480 ctgtgggatc ggtggtgata tcgcctactc atctgacaaa gggctaatat ccagaatcta 540 caatgaactc aaacagattt acaagaaaaa aacaaacaac cccatcaaaa agcgggtga 599 <210> 105 <211> 599 <212> DNA <213> Homo sapiens <400> 105 acatatgttt atagtggcac tattcacgat agcaaagact tggaaccaag ccaaatgtcc 60 aacaatgata gactggatta agaaaatgtg gcacatatat accatggaat actatgcagc 120 cataaaaaat gatgagttcc tgtcctttgt agggacatgg atgaagctgg aaaccatcat 180 tctcagcaaa ctatcgcaag gacaaaaaac caaacactgc atgttctcac tcataggtgg 240 gaactgaaca atgagaacac acggacacag gaaggggaac atcacacacc gggtcctgty 300 gtagagtggg ggaagggggg agggatagca ttagggcata tacctaatgt taaatgatga 360 gttgatgggt gcagcacacc aacattgcat gtgtatacat atgtaacaaa cctgcatgtt 420 gtgcacatgc accctaaaac ttaaagtata taaaaaaaag aaagaaaaaa gaaaaagaaa 480 aaaattaata catataacaa gatatacaca gactatgtaa taattggatt gtgaatctat 540 acgttttctt ttcaacatgt ctgtagtagc gtactatgaa ttttcccctg aaatataat 599 <210> 106 <211> 599 <212> DNA <213> Homo sapiens <400> 106 aggggaacat cacacaccgg gtcctgtcgt agagtggggg aaggggggag ggatagcatt 60 agggcatata cctaatgtta aatgatgagt tgatgggtgc agcacaccaa cattgcatgt 120 gtatacatat gtaacaaacc tgcatgttgt gcacatgcac cctaaaactt aaagtatata 180 aaaaaaagaa agaaaaaaga aaaagaaaaa aattaataca tataacaaga tatacacaga 240 ctatgtaata attggattgt gaatctatac gttttctttt caacatgtct gtagtagcgk 300 actatgaatt ttcccctgaa atataatctt atagttttgc agccagaaca tctgggtgca 360 aattctatcc cttcccctca ctaacaattt catcactggc tagacaccta acttctctga 420 acttccactg tctcatttga aaattaggat aagagccgtt ttgccaactt tgtgtgatcc 480 ttgaaacgta gtatgttcta ttaaagtggt tttctcgatt aattaaaagt gttccttttt 540 gtatttaaaa cttttttttt tttgagacgg agtttcgctc tttgttgccc aggctagag 599 <210> 107 <211> 599 <212> DNA <213> Homo sapiens <400> 107 gaaaaaagaa aaagaaaaaa attaatacat ataacaagat atacacagac tatgtaataa 60 ttggattgtg aatctatacg ttttcttttc aacatgtctg tagtagcgta ctatgaattt 120 tcccctgaaa tataatctta tagttttgca gccagaacat ctgggtgcaa attctatccc 180 ttcccctcac taacaatttc atcactggct agacacctaa cttctctgaa cttccactgt 240 ctcatttgaa aattaggata agagccgttt tgccaacttt gtgtgatcct tgaaacgtar 300 tatgttctat taaagtggtt ttctcgatta attaaaagtg ttcctttttg tatttaaaac 360 tttttttttt ttgagacgga gtttcgctct ttgttgccca ggctagagtg caatggcgca 420 atcttggctc actgcaacct ccgcctctca ggttcaagtg attctcctgc cttagcctcc 480 tgagtagccg agattacaga catgtgccac cacgcccggc taattttgta tttttagtgg 540 agatggggtt tctctatgtt ggtcaggcta gtcttgaact cctgttctcc ggtgatcct 599 <210> 108 <211> 599 <212> DNA <213> Homo sapiens <400> 108 taattctatt tgaatattgg gaatattcat gtttagctat tttaatagag acttaatttt 60 gagtaaatga gaaaagtgta ataacttcat tccaaaacag gtatgcctat ggataacctg 120 gttctttgga ctagagggta ctaatgaagg taatggtggt gataatgatg gcattccact 180 gcagaatctc ccaattgtag gcttagtgga tgaggtatat gtatttccaa ccctcagcct 240 aatcaattta aacctatagt tttttttttt cacagtgttt agcacccatc acacaataas 300 taattcattt ttattagaca tagtaagcca aactatgaag ctgaaagctg aagccatcaa 360 aaggatttgg ctctaatagt tgtatttgtc tttataaatg tacagttttg tcagtctttt 420 tttttttttg gtaaaacagc ttaacataaa catttttatc aagacattta cattttaaaa 480 taataaattt gtttaacatt gtgctctatg tcaccataac aaaatatcta tattcattcc 540 tgaatcattt tatttactta ctagaaaaga gaatctctaa ttgtgtaata aaatgctaa 599 <210> 109 <211> 599 <212> DNA <213> Homo sapiens <400> 109 agatcggcag aggttacttt gtcaattgta aagatccctt ttagagcttg cttgataaat 60 ggttattcag ccggagctta aaagttcaat cttgtgaata ttcctttcca tatttgtcag 120 agagcacttt tatgttgaaa tagaaaactg tctctttttc tggtaaaact tctacactca 180 gaaacaatat agagtaaatt tgctttttta tatgccagat cttcaaattt tgaagaagtc 240 tcaattggta gagtatcatt attatgccta attgcttggg tgttgataat gctgtttttk 300 ttgttggtca gttaatagtc gaaaaggtta agactcaagt aattattaga acaaaagtac 360 atatcttggg aagctttatt ggtttgtcaa ctgtttctat gcaaaacgga aattaaaggt 420 aagaataaaa tgtgcaagaa aaatgtgaat tcataaattg tgaagcatga ggtgaacaat 480 gcttgctttt taccaccaga ggtcttcaaa agacctataa tagctgcatc tctgccagat 540 gaggaggaaa aaatctctag ctaagctgac agagattctt agcaagtaat ttgcttaag 599 <210> 110 <211> 599 <212> DNA <213> Homo sapiens <400> 110 gcaagaaaaa tgtgaattca taaattgtga agcatgaggt gaacaatgct tgctttttac 60 caccagaggt cttcaaaaga cctataatag ctgcatctct gccagatgag gaggaaaaaa 120 tctctagcta agctgacaga gattcttagc aagtaatttg cttaagagct taagtaactt 180 tagtatgaat gttctatagt cttaatacta aacatttctg ctagatagat ttcaggcaat 240 gaaaacaaac aaaaacccca aaacaatgca gaaccaacct tcaaaatgca gaacagttay 300 aatgtatcat tttacatttt attttaattt attacctaat tattttagtt tatattggga 360 agcttctgat gctaattata atgatttaaa aaacataaat attacataga agtggaaatc 420 cactatcatt tacataaatt taatgaatat actctgtatg tagattataa acatattgtg 480 tgtatgtatg aaatatccta attttgctgt taaatttaaa gcttaggaga caatgtgggc 540 taattccttt gacttatcct aaactatgat gaagcaaaga cagccaaaga ttttctatc 599 <210> 111 <211> 599 <212> DNA <213> Homo sapiens <400> 111 tggaaatcca ctatcattta cataaattta atgaatatac tctgtatgta gattataaac 60 atattgtgtg tatgtatgaa atatcctaat tttgctgtta aatttaaagc ttaggagaca 120 atgtgggcta attcctttga cttatcctaa actatgatga agcaaagaca gccaaagatt 180 ttctatcaac ttggatgaac agtttcccgt ttggacttaa aaaaacaata aaaggacttt 240 agatgaactg atactagaac ctataataat atgcataata atttgagtag taacaatctk 300 atttcattag tattttgtat ttttatgtta cttacttaat tcaatactta tggagggcct 360 actatgtgtc tgctatttta ccaagtgatg gaatacataa aaattgcaat cacacctgac 420 aaaattcagt ttactgcaag aaaaaagaca aaaaattgca attcaacttt ataaatacca 480 cattaggaaa atggcaatca tatgggctgt gggaacccag tgagtgagtc cctaacttag 540 ggagaatcag aagatttcac caaagaactg acctaagaat gagatgctga gagagacac 599 <210> 112 <211> 599 <212> DNA <213> Homo sapiens <400> 112 aaaggacttt agatgaactg atactagaac ctataataat atgcataata atttgagtag 60 taacaatctt atttcattag tattttgtat ttttatgtta cttacttaat tcaatactta 120 tggagggcct actatgtgtc tgctatttta ccaagtgatg gaatacataa aaattgcaat 180 cacacctgac aaaattcagt ttactgcaag aaaaaagaca aaaaattgca attcaacttt 240 ataaatacca cattaggaaa atggcaatca tatgggctgt gggaacccag tgagtgagty 300 cctaacttag ggagaatcag aagatttcac caaagaactg acctaagaat gagatgctga 360 gagagacaca aggcattcat gcagttgggc aggggaatgt tccacggagg ggagagaata 420 ctagaaaatg ctgggaagtg gatggataaa tgtgcctcct agacctctaa cacaagctgc 480 tttgcttgct ctgtgtaaaa tgagttcagg aagtacatcc ttggctgttt tatattaaga 540 gagaggaaag ggctaatgtt gaaatataga gtcagtatat cgtaattctt ttcttttct 599 <210> 113 <211> 599 <212> DNA <213> Homo sapiens <400> 113 aatagatctc tttcatttgt ctcatgagtc tttgaaatga actatattag tgactgttag 60 ctgagttact ccaaacagaa aaaacaattc agtaatctta tgcttttgat gtcaacttga 120 cataaagtta aaatgaaaga gattgttatt taagagaaga ctttaagcaa gtttctttga 180 agtgcatatt tatttgtaaa gaaaacttat tttaggtcaa ttggaagaaa ccacattcct 240 ctgaacattc tctaatgtta ctgcattgca tacctgcaaa tagtggtagt taggaaaaay 300 tgggggagaa aggagaaaag ataaaaatgt ttcagaacaa catgttcatt tgattttaag 360 catatgcaga atatgcagaa aaatcttagc aaatattgta catgtccctt agatgatgcc 420 aagtttctgc tcctttttca taaccagaaa aacatttttt tctaaaccag tgtataaata 480 tccagataag atatttcagt gcatgataga aaattatatt ttgtctgatt attcctaggt 540 ataaaatgtg taaactgttt atcaccatgt ttgagttctc acaaattctt ggcaatgtc 599 <210> 114 <211> 599 <212> DNA <213> Homo sapiens <400> 114 atgaaagaga ttgttattta agagaagact ttaagcaagt ttctttgaag tgcatattta 60 tttgtaaaga aaacttattt taggtcaatt ggaagaaacc acattcctct gaacattctc 120 taatgttact gcattgcata cctgcaaata gtggtagtta ggaaaaattg ggggagaaag 180 gagaaaagat aaaaatgttt cagaacaaca tgttcatttg attttaagca tatgcagaat 240 atgcagaaaa atcttagcaa atattgtaca tgtcccttag atgatgccaa gtttctgcty 300 ctttttcata accagaaaaa catttttttc taaaccagtg tataaatatc cagataagat 360 atttcagtgc atgatagaaa attatatttt gtctgattat tcctaggtat aaaatgtgta 420 aactgtttat caccatgttt gagttctcac aaattcttgg caatgtccca agttctattt 480 gacaagtttc tgtattgaga actccaaggc tgccttggag atagatgtaa atctctttga 540 taatttacag atttccacac aggttatgaa ataatttcta tggtcctgtt cacctatat 599 <210> 115 <211> 599 <212> DNA <213> Homo sapiens <400> 115 aaaggagaaa agataaaaat gtttcagaac aacatgttca tttgatttta agcatatgca 60 gaatatgcag aaaaatctta gcaaatattg tacatgtccc ttagatgatg ccaagtttct 120 gctccttttt cataaccaga aaaacatttt tttctaaacc agtgtataaa tatccagata 180 agatatttca gtgcatgata gaaaattata ttttgtctga ttattcctag gtataaaatg 240 tgtaaactgt ttatcaccat gtttgagttc tcacaaattc ttggcaatgt cccaagttcy 300 atttgacaag tttctgtatt gagaactcca aggctgcctt ggagatagat gtaaatctct 360 ttgataattt acagatttcc acacaggtta tgaaataatt tctatggtcc tgttcaccta 420 tattgcttac ctctttccct cctcaccatc tgtcaaaatc ctaccattca ttttgaactt 480 tgttcaagcc ctattatatt cgtgaagact gttttgatca tagagcctga caagatccct 540 ccttcctctg ctctcccata gcattgatta ccaagtccac tcatgtgctc tgtattttt 599 <210> 116 <211> 599 <212> DNA <213> Homo sapiens <400> 116 attcatggtg atagagagta gaatgatggt taccagaggc cagaaaggat agtgggaagg 60 cagcaataaa gaggggatgg ttagtgggta caaaaataga gttagagaga agaaataaaa 120 tctagtgttc agtagcacaa tagggcaact agacttaaca atttattgga tatttcaaaa 180 taactaaaag agtggaattg gaatattctt accacaaaga agtaataggg tgatatgtat 240 cccaattacc ctgatttgat ccttagcaat catatgcttg tgtcaaaata acacatgtas 300 tccataaaca tgtactatta tgtaaccata ataatcttaa aaaattaaag tcatggtgaa 360 atatattcct tctttggaac aaccacccaa atgtgagaaa aatcatgttt gcatctagaa 420 atgatggagg aatatccaga tcaatataca tatgtctcac aagcaaggaa ttaaaatcaa 480 tgtaagtata aatacctgta tgttctatga ttttatttta tttatttatt tttgagtaaa 540 aatggggaag gcagtaaaaa gaccttttta gtttatctct aaacttttca atactttta 599 <210> 117 <211> 599 <212> DNA <213> Homo sapiens <400> 117 ggattttctt ttagggttga aactcagttc aacaggaaac agactgactg attcagaact 60 gcaagaaacc ttgaggcaaa aaaattcaac tccatgccat cattttactg atgcataaaa 120 agctgacatt cagtatagtt acacggttta tctagtctat gggagagaca caggtctcct 180 aattctcagg gcggtggaat tctgtgaccc actgcatctt aatgagatgc tgaaatcaaa 240 cagttatgaa gttgattgac aatttttttt tgtaatttag tgaccaggtt gatttggaay 300 tgtctttact aattcatttt ttgaaatgct attattaata tggagaccat gaaaaattga 360 aaaatgccgt ttaatatagg agcacagata ctgttgtaca tcaatactgg cttcagtctc 420 ccttaccagc ttcacgctgg ttcattctga aacttgccat acacatcatg gctctacgac 480 ttagccccct gtactccttt atctggaatc tttccacatc ttgactgcct ggaaaaaatc 540 ttacttatcc tcccttttat gtgtcttagc cttacccaca ccttccctcg ctttggcag 599 <210> 118 <211> 599 <212> DNA <213> Homo sapiens <400> 118 tctaatttga gaacttctaa taagaaagcc agtgactagt ataaattata aatctttata 60 tcactataat tttggtagat ccaaggttta atatagtatt acatatatgg aacagatctg 120 tcataaataa aatgtaactg ctcctattta tagaatgaat tcacatgcaa acacttcata 180 aagctgtttt ctcttcacaa ctaagaaaga tggaaagcca aacgtcagct gtaggatatt 240 taattaaata gattatattt gttttcattg gtacgctccc aaaaattaag cataattcaw 300 aacacattgg gcttttagag atattgtctt ctggtcccta catagagtta tataataccc 360 agctgtttgt tattaatcac agtttgtaat ggctcaagag tttattctgt actgcttaaa 420 acagcaaaaa tgcaatgatt ttttgttagt ttgtttttta gagtgaacaa attttggata 480 tctgaaactg ataaatcagc attacaattc cttaatgggg agcttttgct ttcccaatgt 540 ctaaaatcag tgaaacatct gtaaatatgc ttatattgag cttgacagac cccctttat 599 <210> 119 <211> 599 <212> DNA <213> Homo sapiens <400> 119 acataatcta taactaaaat gatgattagg tggtatacat gagctccttc cttagagatt 60 tccaatggtg caggagacag gtgcagaagt atcccagaat ccaagattct ttatatggaa 120 tttctaaaag gtctgctatt tttctttttt cttttctttt tttttttttt ttttgccatt 180 tcagcattta caaaaatgat ctgtcatttc agtagcccta gtggagacca cattgccaag 240 gaatggacct caatattatt ctctttatct ttgcactgct ttactcccag aacccaagty 300 cttgtgtatt tgtgcatttg tgcatagcta agttaaggtt atcctatcct aaatgtgctg 360 attaatatat taaatatgat atttctttcc tcctttttta ttttttgaag gtgaagtatt 420 tctcaaacaa atcatcacct ttattcaggg gaaatgcata tactatagcc aattaaatgc 480 tactacagat gcaccatgaa attttcagtt catgtgaggc atagctacat tcctttagta 540 gacattctgc cccttcccaa gaaaacaagt ttctttgaat gcttctaaga cagaagagt 599 <210> 120 <211> 599 <212> DNA <213> Homo sapiens <400> 120 aggtggtata catgagctcc ttccttagag atttccaatg gtgcaggaga caggtgcaga 60 agtatcccag aatccaagat tctttatatg gaatttctaa aaggtctgct atttttcttt 120 tttcttttct tttttttttt tttttttgcc atttcagcat ttacaaaaat gatctgtcat 180 ttcagtagcc ctagtggaga ccacattgcc aaggaatgga cctcaatatt attctcttta 240 tctttgcact gctttactcc cagaacccaa gttcttgtgt atttgtgcat ttgtgcatar 300 ctaagttaag gttatcctat cctaaatgtg ctgattaata tattaaatat gatatttctt 360 tcctcctttt ttattttttg aaggtgaagt atttctcaaa caaatcatca cctttattca 420 ggggaaatgc atatactata gccaattaaa tgctactaca gatgcaccat gaaattttca 480 gttcatgtga ggcatagcta cattccttta gtagacattc tgccccttcc caagaaaaca 540 agtttctttg aatgcttcta agacagaaga gtaaaaacag atttgcacag ataactaaa 599 <210> 121 <211> 599 <212> DNA <213> Homo sapiens <400> 121 ttcctttagt agacattctg ccccttccca agaaaacaag tttctttgaa tgcttctaag 60 acagaagagt aaaaacagat ttgcacagat aactaaaagt gtgtttccaa atgtccacag 120 cttaccaggt tatagtacct aggtcattca attctttcct tgtagctact tcttgactgg 180 gaagtgggtt tttgtttttt gttttgtttt ttcatgtaga acataagatg ttacattgtt 240 ttactaaaac atcgcataag tcaatgaaaa ctaattccac gggacaagtt cccaaggaam 300 agatccggag actctgagat tttcatgtag gtttgttggg aatggctctt gggaacacct 360 aggaaaagtg atcgaggcaa tgttgagcag gagaagctga gctatgatgc agttgcagta 420 gtggtctcag acaatcctac aagaagtttt ccttctggga tggcccttca gagtttttat 480 gtcttgaggt aaggggccag gcttttacac tcctatatct accagtcatt tgatgcaagc 540 cacgcttggt ggggaccaga cagagtaact ttgagccact ctgctctctg gctgaggcc 599 <210> 122 <211> 599 <212> DNA <213> Homo sapiens <400> 122 gctgtcaaca ctcccaacaa tggaaaaaaa agtccttaac tcctgaggag ggaatctgag 60 cagggcacta cagtgttcac tacaaggagg tgcttaactt ttgctacagt agtcttgtaa 120 tgctaatagt gaacgataat taacttgggt gttacataga atactaaaac tttttaagta 180 aactatgtat tatcagtcat ggctaacatc tgaattattc tgtagcatgg ttgtctttat 240 ctttagaaat ctaaaatgcc agcctctaat ttccagctga gaccctaggg aggttagagy 300 tcagattatc attagcttta atgagaataa tttgtatgga atcccatatg ttagtgaaag 360 aatataaaca tctccacata ttgagctttg aatatccctt tgtttacttc agcctttaaa 420 tgaatacaaa attgttttgt ttacagagtt tttatcaaaa taacgttgaa gatttttcat 480 gttttgtttt attcctaata gactttcaaa tatattagta taagatcagt attttaaaat 540 gtttttatta atctaagtta aaaattatag gtaaggaaga gttacacttt ctattatgt 599 <210> 123 <211> 599 <212> DNA <213> Homo sapiens <400> 123 aaaacttttt aagtaaacta tgtattatca gtcatggcta acatctgaat tattctgtag 60 catggttgtc tttatcttta gaaatctaaa atgccagcct ctaatttcca gctgagaccc 120 tagggaggtt agagctcaga ttatcattag ctttaatgag aataatttgt atggaatccc 180 atatgttagt gaaagaatat aaacatctcc acatattgag ctttgaatat ccctttgttt 240 acttcagcct ttaaatgaat acaaaattgt tttgtttaca gagtttttat caaaataacr 300 ttgaagattt ttcatgtttt gttttattcc taatagactt tcaaatatat tagtataaga 360 tcagtatttt aaaatgtttt tattaatcta agttaaaaat tataggtaag gaagagttac 420 actttctatt atgtaataca gctaaaattc taaggtgaaa atggatgtat tttgaagata 480 tattcagagt gaaaaagaag acagtaattg agtgatatac atcttgatgt ttattgacaa 540 agtgactgcc atggcaaaaa taaatccaga tgtttgagta taaaagaatg gcaaagtgg 599 <210> 124 <211> 599 <212> DNA <213> Homo sapiens <400> 124 tatgttagtg aaagaatata aacatctcca catattgagc tttgaatatc cctttgttta 60 cttcagcctt taaatgaata caaaattgtt ttgtttacag agtttttatc aaaataacgt 120 tgaagatttt tcatgttttg ttttattcct aatagacttt caaatatatt agtataagat 180 cagtatttta aaatgttttt attaatctaa gttaaaaatt ataggtaagg aagagttaca 240 ctttctatta tgtaatacag ctaaaattct aaggtgaaaa tggatgtatt ttgaagataw 300 attcagagtg aaaaagaaga cagtaattga gtgatataca tcttgatgtt tattgacaaa 360 gtgactgcca tggcaaaaat aaatccagat gtttgagtat aaaagaatgg caaagtggta 420 taattaaatc aaacacatga aatttactag ttgaatgaac aggtcaattt gcatttaaca 480 ctaagggatc gattgatatt tggaatgagg gttggtgaca gatggcatag ttttgtagtc 540 ccatttcagt cagttaacaa gtaattgaca gatgtactca tggtgctgaa cattattta 599 <210> 125 <211> 599 <212> DNA <213> Homo sapiens <400> 125 atgataactt acatactaat caaaaaaagc aaataatact tttatcagaa atatatagaa 60 ttcagacaaa agaatattat aaatgaagac attaagtaag ctaaaaataa tgtatttccc 120 cagatgatat aatagctgtg aacttgtatg gcaaccaaaa tgatcaatat atgaagtgaa 180 gtaggcataa cactaagaag aaactaaaaa acttataatg atagttgagt gtgttaaccc 240 atctcttttg gaaacagagt agcagacaag aatattatag gaagatgtgc acatgtaccm 300 caaagcttaa agtacaatta aaaaaaaaga atattatagg aagatggtga aaaggaagag 360 gactaaaagt gagtggttgt tggtaatatc aattggtaag cacattttta agaacagtct 420 aggaacattc atttgaaagt gcacaagaag tatttcctaa taattctgct tctagatata 480 ccacttagaa aaatcactgc acgtctgtac aagaggatat gtccaaagat tcccacggaa 540 gcattgcttt tagtagcaaa aattggaaac aacctaagtg ctatatgata gaatgctat 599 <210> 126 <211> 599 <212> DNA <213> Homo sapiens <400> 126 gtgaagagga ctggtttgga aaatctgtgt tcttaatcct gtcttccatc ccagagaaag 60 ggagggggga tgattgaccc ttctttctca aatctaggga gaaagtttca tgagggctgc 120 ttgcagagct tgatatatgt ttcttgtagt cgtggggcat tgtgaattgg tttctgattc 180 atgcctgtga aatttgagac aaaaagatca tggctggaag tttcgtgtga ctaggtgact 240 aagttccttc caataagaaa taatgaatgc agatgtcttg ttctcctttt ctctccttcy 300 tcctgtttct agttggccct ggaacagtgg cctccaggcc tgagataatc gaagcaactg 360 gagaagcttg aaggagtctg ggtccctgat cctgacaaag ccgctattcc acccctaaac 420 tggctacatc tggatttttt ttctttggca tgagaaagga ataaacgatc ttactaattt 480 ttaaagttag tgttatttga ggtttagcag aagctaatcc tctcatttaa tcatttttct 540 tatccaatct tcacaatttg agaggtttga agatgaagaa tacgtttaca gctaattaa 599 <210> 127 <211> 599 <212> DNA <213> Homo sapiens <400> 127 tttcattttt tgcatcatcc cagattctgg tgatagctgg gcacaggaag actgtgattt 60 atttgtgcag gaggggtatg tgtttctaga tcatgagaaa ggcacacata gttctttttt 120 ctctttttgc tttccctcag tcccaccagc ccgactcctt tttcctaatt aggattccac 180 aagaaagctg tttctggatt atcagaaggt ggatcaccct aataaacaca ggatctgcta 240 ctggtatttg tttcctgtcc tgactgcatc gaactcatgt ccaaggtcag aggatatccr 300 gagaactgtg aaggacaact atgaacgtgg tttcattaaa acctcaataa gacttgaaac 360 acaagcaata atgcttgtaa tctcagttaa tgaaagaggg aaaaccttct tccccactta 420 aaagcaaagc atagggattt tccatactgt ccctgaacca gtgagtttat tcctaactac 480 ttataacaca tatcctgggg ctcatagcaa tatttgagga acagtttaca tgtggctata 540 gcctgcactg atagatgttg gaaatagcca atattattta aattatcttc ctaatgtgt 599 <210> 128 <211> 599 <212> DNA <213> Homo sapiens <400> 128 tgtttaatta atactcatta gctaatgaca aatagagatc ctaggttaaa aaatatttca 60 ctgtctttca tatccattga tgaagcttct aggatataaa aaatggtgag actaacaata 120 ctgacctcag gtaattgctt tcagtagaaa atgacttaat gcatgtgaac tctgcatccc 180 cagatattat tatttttcac ccacttaact tcctcaaacc tcaattgatg tccttctcta 240 gaagtaatta cagagctaaa gatgactgca gctaaatcac tgcccttggg acttggcatk 300 tatttataat aagagaatat tttttccctt agcagtggta ataagtatac actgaccagt 360 ctccattcta ttacttcatt taatagctaa gcaggacatt tttttaaaaa agttttaaag 420 ccactttaaa attagaaaag ctttcaaatg gtgtatgaca tacactatac tgacaggcta 480 actggtatgc tttggagcac cactcagaat agctgtagtt ttattcctac agaaaatgat 540 gtcaaagagg cccaaccttc gtgaatgtgg gctggtgtgg gaccttcttt taaaaatag 599 <210> 129 <211> 599 <212> DNA <213> Homo sapiens <400> 129 actgcttaat ttctttctta aggagcaatt tgagaatata gtgaaagctg tggaccttct 60 tagaaaaatt ctgatgaatt gtatttttcc acagaactct tgtgggccca tctagaattc 120 tatgaggttt ctgtagactc agtattaaga aactgtattc taaacatatt tgacgtcaaa 180 catttattga ataactaaat gccagagaat gtgctatttg tcactttttg gcatgcattc 240 actatgaggg ttatattgct cccaagggaa taacaaattt gtttttggaa ggtgaaaaaw 300 acttactatt ttaatgtata atgcacagaa atacacacgg tacattgact gataatatac 360 ctgtggtatt aaaatttata gataaagcaa tttttaaaat gtctaaaatg cctccttata 420 gggcaattag gaaaaattga gaagagctgc tcaacagcaa tttgcgtttg tgggacttta 480 acatcaatag atcagggaaa cttggagtgg aagaggatcc acatataaaa gagtttcctg 540 gatatattaa ttatatatcc agtacctagt atgatgtttg ccggcctaat acacagaac 599 <210> 130 <211> 599 <212> DNA <213> Homo sapiens <400> 130 tatcttgaaa acaacttctg ccttgagtga taccattaga tattctgagt aacaccatta 60 aacatcttgg cagcagctct ttacaggcat ttttaaatta atcagttcat gtccattatt 120 gtgtacattt ttctacttta tattcattga tttatttgag ggcatgtgtt tggatttatg 180 cctactcttt ttccacagac cttccatttt attttaaatt ttcttaaatt tttaattatt 240 aggagtatat aataggtata tatacatatt catggagtac atgtgatgtt ctaatacagr 300 catacaaagt gtgataatca catcagggta ctcagggtat ccatcacttc aagcatttat 360 cattttttgt gtgttaggaa cacgcaaatt ctactcttaa agttatttat aaatatataa 420 taattattca ctgtaatcat cctgtcatgc tatcaaatac tagaacttat tcattctgtc 480 tgtgtatttg cgcccattaa ctaattccac tccctgccca gttcctgacc tgctactttt 540 ctcaatcttt ggtaaccatc attctactct ctatctcaat gagttcaatt attttaatg 599 <210> 131 <211> 599 <212> DNA <213> Homo sapiens <400> 131 gatagatcac aaaattcaga aaatgtctaa gcttgaataa tatatttagc actgtgattt 60 gcagtggtct aataaaaatg ctgattatat acgtttcact gttcatggga aaatatagca 120 tgttctcaat gaatgtaatt tttttctaga catttaatta tgaacaaatt ttttacatga 180 agtgtttata gaagccctca ggtgatatta tagagacaat gtaggaacaa acatcatgac 240 agattttatt agagctaata attagtttta agaaaagtac ctactatgaa ttatttttgk 300 agagaaatag attttcatct tatattcaag tttcttcctt tttcctatat tgaaatacac 360 agaaattagt cccagggaag ttctaattat aaatgtcttt gttcattgat tttcgttttg 420 tacacttttt tttctctttt tttctgtaac aaggaagaca tcatctatgt ttttgaaatc 480 catggcccaa acacagagta ttgtgagggc cacattggca catgtatttc aatttctgca 540 aaaccaaagc ctaaaatcct cacttacaga gaatctttgt gatatccatt catgataac 599 <210> 132 <211> 599 <212> DNA <213> Homo sapiens <400> 132 tatctgtcca gttagaggga atcagttggt gatgtgcatg tcacacaatc acaaaagtgt 60 cataatggaa aattcagaag tgacacagaa acttcagcaa tctgctcatc ttctgaaagt 120 ctattgcaca ttagctgaac aactgacaca ttcttacctg gtcttactga cattttcgca 180 ccctgaaggg taaaggaaga gattacagaa gctaatattt tcaacctaat ttggaccaat 240 gaggataatt tggttcatga agtgcaattg acagtagcct ttggaaaaat tgaccatcty 300 attttagaat taggagcata atgggaagga ttttcattgg acggttactc tagattttaa 360 gaaggaagac ttcaaaaatt tcaggtataa aaaactcaga agaaagctca gaaaagtagc 420 aaactgctat tgatataact ctgacaatgt aaatctcaaa ttatattaat gaggaagaaa 480 agaaggatgg tagcagtaga aaatggcata actgtagaga gaactttatt gtgtgttcag 540 attataaaaa atgcatgcac ggaagataag aaggaagaca cataaccaga aggaagaca 599 <210> 133 <211> 599 <212> DNA <213> Homo sapiens <400> 133 agaagctaat attttcaacc taatttggac caatgaggat aatttggttc atgaagtgca 60 attgacagta gcctttggaa aaattgacca tctcatttta gaattaggag cataatggga 120 aggattttca ttggacggtt actctagatt ttaagaagga agacttcaaa aatttcaggt 180 ataaaaaact cagaagaaag ctcagaaaag tagcaaactg ctattgatat aactctgaca 240 atgtaaatct caaattatat taatgaggaa gaaaagaagg atggtagcag tagaaaatgr 300 cataactgta gagagaactt tattgtgtgt tcagattata aaaaatgcat gcacggaaga 360 taagaaggaa gacacataac cagaaggaag acaaattact ctaaatatag aaatgcagca 420 tagaccagca agaatattgc aggaaggtca acatacataa tgagctgagg tttgcaaaat 480 ttgctactga ctgttgagtt tggcttcaat tggaatgaac aaggctattt tggatgtaaa 540 gtcaaaactg ctctggttga tacatttcct tcactgctct cttgttctct ggtattcct 599 <210> 134 <211> 599 <212> DNA <213> Homo sapiens <400> 134 actcacaaga ggaatttttc tgccttctgg aaacttttct gtaactagct gtgatagaat 60 tattattaag atattccagg agaatgaaaa ctagcagcag aaatagaaga tgagctttgt 120 tatcattttg tgagagagct gcatagaaag aaactggaga tggcttccta gatctgaaag 180 tggctcccat tcaagagcct gtaagaaaca gagacttcac tcttaccact ataaggaagc 240 aaattctgtc attaactcaa gggtgcttgg aagtagatct ttccacagac cagcttccaw 300 atgagaatgt agccaggctg acaccttgat tgcagccttg tgtggcccag agtagaagat 360 aagctgtgtc cagacccaca aaaactgtga gataataaac atgcatagtt ttaagctacc 420 aagctggtag taatttgtta cataacaata gaagacaaat gcaggaggaa agtagatcaa 480 ggtagtaaca tggtatgatg agagtaggag ccagcttact gaagacaagt caaagtaagg 540 tcttcagctt ttactgtgag tgtggtggga aaccagtgca tggttccagt ggagaggtg 599 <210> 135 <211> 599 <212> DNA <213> Homo sapiens <400> 135 aagtggctcc cattcaagag cctgtaagaa acagagactt cactcttacc actataagga 60 agcaaattct gtcattaact caagggtgct tggaagtaga tctttccaca gaccagcttc 120 catatgagaa tgtagccagg ctgacacctt gattgcagcc ttgtgtggcc cagagtagaa 180 gataagctgt gtccagaccc acaaaaactg tgagataata aacatgcata gttttaagct 240 accaagctgg tagtaatttg ttacataaca atagaagaca aatgcaggag gaaagtagay 300 caaggtagta acatggtatg atgagagtag gagccagctt actgaagaca agtcaaagta 360 aggtcttcag cttttactgt gagtgtggtg ggaaaccagt gcatggttcc agtggagagg 420 tgatacaatc aaacttacat ttcaaaagga tcactctggc agttatatga agaaaggtag 480 aagcagacag cctacttaag aaactatttt actaatcaga gtgtactggc ttgaataagg 540 cagcagagta atgagaaaag tggttgggtt ttgaaagtta tttgaaaggt gagtctaca 599 <210> 136 <211> 599 <212> DNA <213> Homo sapiens <400> 136 tggtgtttct gaggtccctc aggatcctag tcaagactag gtctgactcc ctatatatta 60 aaagagtgtg ctccactcta ctaagaggaa gtcttgtttg atcgaatttc atcacgggcg 120 caaatcccat cacctttgca tctttgttac ataatgtaac ctagtcaagg gaatgtcatg 180 ccatgccata acctttgctc tattcttttg ttagaagcaa aaatcccacc catattcaag 240 ggaaggaacc atactgggtg taacaccagg ggctgagact atgaaagcta tcttagaaty 300 cttcccatca tacctcctaa tgtctccatc acttactctg ccccacctat ttaggcctcc 360 cttttgtcct ccaggcatgc ctctatgtta gggcctctac ctgttgtttc ctctggtttg 420 aatattctac ctctagatat tcacaaaaat ctgtctcata tttctttctg tcttttctca 480 agtgtaacta taacaaacag gccttccacc ctgatcatcc tatttaaagt agcatttcca 540 acaatattcc cctatactcc tgtcttcatt atgtttcttt atctagcacc atagcactt 599 <210> 137 <211> 599 <212> DNA <213> Homo sapiens <400> 137 gaacccggga ggcggagctt gcagtaagct gagatcagcc actgcactcc agcctgggag 60 acagagcgag actctgtctc aaaaaaaaaa aaaaaaaacc cagactatat catatgtttg 120 ttttacatca gaaaattgcc acaaatcaac tttaaaaaag gaaacttaga gtatcttctt 180 aacctaaaat aaaattaaat agtatcatta gttttgaaat gatttgtaat tagcttttct 240 ttctaataat aataaatgaa acttaccaag tacaaggttt gtcatttttt aaaagcttcy 300 ttcattaaat aaattaatat tgtcaataat aggaaataaa acaaatgtcc aaatcagcta 360 aaaataaatc tatttaaaag agaaaatgtc acaaaaagat aaaatgatca agatctaatt 420 tttagattgt gatggatatt ggaggactaa ttgcttatat gttgaatacc ctgtccaggc 480 aaaattaaaa tgaactgaaa ttagcatact tgaaaattgc ttatgtcata cattcagcca 540 ttcaaatttc agacattatg tcttcagcaa ttctcctgct aaatccattg ccctcacat 599 <210> 138 <211> 599 <212> DNA <213> Homo sapiens <400> 138 agtaggaaat taaagaaacc aacaaaaaat attaaatcta gaaaatattt tgtactttaa 60 tgacattagt actaatagga cttcttcagg cactgtttcc aaatttgttt gaatcttttt 120 tatgatacct catttcctga aagcacagcc cactttggag tagtgttctt aactggtctt 180 attctattta tgctgttact tcacaacagt gttagtctgg tagctgcata ttttcttaga 240 actattattg caggctttat ggattttaag gactatgctg ctttaaagac aataattgtr 300 taagttccaa acatgttggg tagcaccagc attcaaaaat ttctcaggcg tgtgaagttc 360 attttttaac gaagaataaa cccaggcaca gccaagtgta agatattgga aataaccatt 420 tccaaagtac atcagagaaa tttaaaaggt cacagaactc cttataacat taatatttga 480 catttgaatt attttccagt ttagcaagct ggataaagag cttcatcttc agatgaactg 540 aaacaactaa aaatacaaaa actttgtctt cagttcagtc aagataagtt actgagaat 599 <210> 139 <211> 599 <212> DNA <213> Homo sapiens <400> 139 atcgcaccac tgcactctag cctgggcaat acagtgaaac tctgtctcaa aaaaaaaaaa 60 attctcttcc tccccagttt atctgcatct tgttattggg ccacaagaaa tagcagcccg 120 gccctcagtt tggtccagga acactccttc tctttcctca ttcatatgga cataataggt 180 ggaggaacag cagccatttt ggatcaaacc ctagaaatgg attggttaga aagctgagaa 240 aacctgtgta tttttagtga cacatggctc aaacttaggt gtgttgtctg acccccacay 300 ctgagactgt taagttattt ggataaaatc ttatgcattt aagccactct tgatttcagt 360 tttctttccc aagtagcaaa attaaatcct aactaaaatc tgtcccaaat tatctttggg 420 aatacaagca gaatcaagat gttattcata tattcttcta gtttaaatat tttttgatag 480 cacttttgct agggtcactt tttacataaa ggtctcagaa atacttaaat tatatttatg 540 gtatacatac aaacaaattc tataagagcc agataaatag gcatgaagtt aaaaacaac 599 <210> 140 <211> 599 <212> DNA <213> Homo sapiens <400> 140 tgaggacaca gagccaaacc atttcaccag agggctgagt aactctaatc tggcaggatg 60 attatcctac acaggttgca atggcccctg aaatttggac gcactttgtg agagaccagt 120 gtctagataa ctaggaacta ggtaaatgtt ggagagctgc ttcccttcat ttctgtcatt 180 gtctgtttca tttcctttgc attgtttgtt gatctgtatt aaacaaaaat gaaagcaaac 240 cttgtatctg agtctccatt tttaccaatc ctcacattta tggttcagtg tcttagtctr 300 gtttcgaata acaagaacct tttgtacttg gaagtataaa acttgatagc agcaacatta 360 ttgatattta gagctcagta cctgtctaat tacaggcagg cagaaagaag tgtcaaggta 420 ttcttgctta tcaggtcaca ggtaatttct tcctctaaga attcataaac tgatagacta 480 atattggaga aagaaatgca atttaattgc tgaaagtctg tttcagttta ctggtcttgt 540 aatagaggta aaattctaaa caacttgggg agctttggtg agaattaaaa taggtgggt 599 <210> 141 <211> 599 <212> DNA <213> Homo sapiens <400> 141 gctaccgtgc ccagcccaaa agaacttttt tttctttata aattacctac tctctggtat 60 tcctttacag aaatgcaata aagactaaga gaaatgatat gcacaagtga tataaaacag 120 ttttttttca cattcttttt tattttaatt gaaattttaa taataataga ttacatgcag 180 ttttgagaaa taatactgag aggtactctt tacccagttt ccccaaatgt tactatcatg 240 caaaactata atgccatact gcaaactggt tattgatgat acaattcagc tatcttatty 300 agattttttc aattgtgctt gtagtcacat gtgtgtatat gtatttaatt acatacattt 360 ttatcatgtg taggtttgtg catcttcaat cacagtcaag atacagaata cagcactttg 420 ggaggctgag gtgggtggat catctgaggt taggagttcg agatcagcct gaccaagatg 480 gtgaaacctc gtctgtagta aaaatacaaa aattagctgg atgtggttgc gggtgcctgt 540 aatcccagct actcaggagg ctgaggcagg aaaattgctt gaacctggga ggtggaggt 599 <210> 142 <211> 599 <212> DNA <213> Homo sapiens <400> 142 gttaagtgaa agcagtcagt cacagaagac tatatactgt aggattctat ttatctgaga 60 tgtgaagaat aagcaaatga aaacactact ttaaaattat ggtcttgaaa caaagtgtgt 120 taaagccgaa tggacagccc aatatactac atgatacaac cagaatgcac cttcaaagta 180 aagcaacaaa tttacattaa caaagcagga tgtggtctct cttagtcatg aaaaagaaaa 240 gacagagatt ttttcctttt gtgaataaat tgatagcatg aactctgtat tagccttctr 300 ttgctgctga aacaaataac cacaaacttg atggcttaag acaatacagt ttttaaattt 360 cacagttctg gaggtcacac atgcaaaata ggtctcactg ggataaaatc aaggtgtctg 420 cagggctgca ttccttctgg atgcactaag agaaaatcca ttgccttagt ttctttgcct 480 tgtgcagatt ttatgggctg cctgaattcc ttggcctgtc gtccatttcc accttcaaaa 540 ccagcaatgg cttttctcac atcatatgac tctgatactg actcttctgc ctccgttat 599 <210> 143 <211> 599 <212> DNA <213> Homo sapiens <400> 143 cagaaagagg ttatgtaacc tgtcctgtcc aatgtcacag agatatgaag tgttggaatc 60 cagattttac ataggaattt tctttagagc tggcactata tacaactagg ctcatagcct 120 agcaaagcaa tgtagttatt cctaaggatt tgctgaattg aaatgattac tacagtttat 180 ctgtagtcat catcatcacc atctttgata cccaaactag ctctcagtat tttacaaaat 240 atggcaagat aaattattct tctccaggag tagtagttag tgaatcatac tgttaaatcr 300 cctgattttc cagatgtcaa ttgttaaatt gcctaataca ttctgtcagt ggtattttgt 360 ttcccttgaa gaagtaaaca aacaaaactt ttatctcagc aattataggc taaggcttct 420 ttccaagcaa agcttttgca tgggtgatgt taaaatattt ttaagcattt aaaaggcaaa 480 ttgctttata catgacaatt atattgtgtt agaaaaactt aactagagaa taaggtcctt 540 gccctctcac tttgatgtct gtggtaacat tgaagtcaat tatctgtgtt aaccagcat 599 <210> 144 <211> 599 <212> DNA <213> Homo sapiens <400> 144 tcatactgtt aaatcgcctg attttccaga tgtcaattgt taaattgcct aatacattct 60 gtcagtggta ttttgtttcc cttgaagaag taaacaaaca aaacttttat ctcagcaatt 120 ataggctaag gcttctttcc aagcaaagct tttgcatggg tgatgttaaa atatttttaa 180 gcatttaaaa ggcaaattgc tttatacatg acaattatat tgtgttagaa aaacttaact 240 agagaataag gtccttgccc tctcactttg atgtctgtgg taacattgaa gtcaattaty 300 tgtgttaacc agcatttaaa aattaaggtt catattttag cagaaattca gcttgcaaca 360 taataaaaaa tgagattgtt aatttttatt tgtggtttaa tatttactca gtgcaaaata 420 tctataagga ggtaaattgc acaggaaaaa aattatttga ggaaaaagaa attacacaca 480 cacacacgta catatttgta aataatatat tttccagtta gaaattagtt catgctggct 540 gggcacagtg gctcacactt gtaatcccag cactttggga agccgaggca ggtggatca 599 <210> 145 <211> 599 <212> DNA <213> Homo sapiens <400> 145 cattaaagtt cagaaaattt gcagcctgat gatgtgatag aaaagaaaaa ctcattttct 60 gaggcgaaat tcaagccacc tgtagaaatt tacataagta atgaggaact aaatgttaat 120 caccatgacg ataggtaaaa tgtctccaga gcatgtcaga gaactttgtg gcacccccct 180 cccatcacag gcccagaggc ctggaaggaa gaaacagttt cacgtgatgg gcccaaggct 240 ccctactctg tgcagccttg ggacatggtg ttctgcatcc aagttgctct agccgtggcy 300 aaaagggaac aagatgcagc ttgaccagtg gctacaaagg gtgcaagccc caggccttgg 360 cagcttccat atggtgttga gcctgcaggt gcacagaagt caagaattga ggtttggaaa 420 cctccaccta gatttcagag gaggtatgga aatgcctaca tgtctaggca gaagtttgct 480 gccagggctg gtccctcatg gagtatctct gccagggcag tgtggaaggg aaatgtgggg 540 ttgaaacccc cacacagagt ctccagtggg gcactaccta gtggagctgt gagaggagg 599 <210> 146 <211> 599 <212> DNA <213> Homo sapiens <400> 146 ctgatgatgt gatagaaaag aaaaactcat tttctgaggc gaaattcaag ccacctgtag 60 aaatttacat aagtaatgag gaactaaatg ttaatcacca tgacgatagg taaaatgtct 120 ccagagcatg tcagagaact ttgtggcacc cccctcccat cacaggccca gaggcctgga 180 aggaagaaac agtttcacgt gatgggccca aggctcccta ctctgtgcag ccttgggaca 240 tggtgttctg catccaagtt gctctagccg tggctaaaag ggaacaagat gcagcttgas 300 cagtggctac aaagggtgca agccccaggc cttggcagct tccatatggt gttgagcctg 360 caggtgcaca gaagtcaaga attgaggttt ggaaacctcc acctagattt cagaggaggt 420 atggaaatgc ctacatgtct aggcagaagt ttgctgccag ggctggtccc tcatggagta 480 tctctgccag ggcagtgtgg aagggaaatg tggggttgaa acccccacac agagtctcca 540 gtggggcact acctagtgga gctgtgagag gagggccaga gtcatccaga ccccagaaa 599 <210> 147 <211> 599 <212> DNA <213> Homo sapiens <400> 147 agttgactca ggttgtctag taacattctg aaacagaatt cagaatgata atctgctcac 60 ttaaaactga tgcaggtaaa aattctgtgt ccaaatctaa agagatcatg gacaatagta 120 atatgtgtta aggaaagaaa ttctcagaag tcattaaaaa catttatttt gaattgggta 180 aaagaatgtg aaagtggagc tatccctgaa gatctctaag aaaaagctca cacttttctt 240 atggattatt aattataaaa tcatatttta tttatgtatt aatgagtttt aaataaaacw 300 tcattggagg gcctcaagca aaaaagggac ttatagatac tttattagtg ctaatttcta 360 taaatatttt aaattagagt aaatgttaaa ttacatgata ttgaggaatg ggatgaatct 420 acatctacag agggtgaaga atgtgatcaa ggaggtaaat aacatgaaaa tttaaaaaga 480 gaaaactgac cacataacag atgatggaaa tatataatat gggagaatga gacatgcaac 540 aaatgtaggc cagtgactgg gtaagggagt ggttaccatt tacattagat tgttaggga 599 <210> 148 <211> 599 <212> DNA <213> Homo sapiens <400> 148 ctcctaaaga tccaacttct aaaacatcac attgctgatt aggtttcaac atatgaaatt 60 gggaaggtgg ggacacaaac tttcagacca tagcagctcc ctggcccttt ctgccatgtg 120 aggaaacaac tgtatgtcca tcaatgaacc aggaagcggt ctgtcattag acactgaatt 180 tgctggtgcc ttgagcttgg acttctcaac tccagaactg tgagaaataa atttctgttg 240 tttataagca aaccagtcta cagtattctg taatagcaac cccacagtac taagaaaaaw 300 ccagtctctc ttttatccat ctttttcaga aacaatgtaa tgaacagcaa ttcatagaat 360 caaagtaaaa tttgaaaata atgtagttgc cttgattcaa aataaagctt tgtcatatga 420 ggaacatgtg atattattgt aaatgttgtt ataattttag ttgaaatgtt caactggaca 480 actgttatgg gttgaattgt gttcttcccc aaattccaaa tgtgggagtc ctaactttag 540 gtaactgtga atatgacttt ttttggaatg gagtcttggt agatgtcatt gagttatga 599 <210> 149 <211> 599 <212> DNA <213> Homo sapiens <400> 149 tgagttatga tgagatcatt aagatggttc taataataat tcagtatgac tggtgttctt 60 gtaagaagaa gagagcagaa gcaaagcaaa aaacatcctg taaagatgga gacagaaaat 120 gatctgctgc cacaaacaaa ggtatttctg ggactcagga gggggaagag gcaagaaagg 180 aagacgtcag caggagcatg gtcctgccaa caccttaatt ttggacttct agcctctagg 240 gctgtgaaag aataaatttc tgttgtttta agtcactgac tttattacag taacctcagr 300 aaactaatat agcaaccttc cagcttggga gtgtgattct ttcctgtgtt gaataagagc 360 cacactccct cctttcctca gaccaataat gccctatgtc aaaggttttc ttcaatagtc 420 tttcgtattt atagactttt tctatatagc tgggaggcga gtgatgaagc ttgacagatt 480 ctagaataat ttctgctatc ttttttaagt cctataagga ggaccctaag ataatcctta 540 gcacataatt acctgctatt ctcagtatta tggttttagc caaagctatg agtcaggat 599 <210> 150 <211> 599 <212> DNA <213> Homo sapiens <400> 150 tctgttgttt taagtcactg actttattac agtaacctca ggaaactaat atagcaacct 60 tccagcttgg gagtgtgatt ctttcctgtg ttgaataaga gccacactcc ctcctttcct 120 cagaccaata atgccctatg tcaaaggttt tcttcaatag tctttcgtat ttatagactt 180 tttctatata gctgggaggc gagtgatgaa gcttgacaga ttctagaata atttctgcta 240 tcttttttaa gtcctataag gaggacccta agataatcct tagcacataa ttacctgctm 300 ttctcagtat tatggtttta gccaaagcta tgagtcagga tggaaattct cattcaacat 360 tctgttaaac atacatatat tcatgtaagt caaaatttat gctgagatag tcatacaaaa 420 tgtgagaagg ggttaggtaa aagataactt gtaattgttt gatttatgca aattaatggg 480 gaaaaaccct ccgtctttgt cattagagtg aaattctttt aaaatattgt aatgcaaagt 540 gctagggcca agaaaactgc catagtcatc attataacta gggcagcatt ttgtatcta 599 <210> 151 <211> 599 <212> DNA <213> Homo sapiens <400> 151 gaaactaata tagcaacctt ccagcttggg agtgtgattc tttcctgtgt tgaataagag 60 ccacactccc tcctttcctc agaccaataa tgccctatgt caaaggtttt cttcaatagt 120 ctttcgtatt tatagacttt ttctatatag ctgggaggcg agtgatgaag cttgacagat 180 tctagaataa tttctgctat cttttttaag tcctataagg aggaccctaa gataatcctt 240 agcacataat tacctgctat tctcagtatt atggttttag ccaaagctat gagtcaggay 300 ggaaattctc attcaacatt ctgttaaaca tacatatatt catgtaagtc aaaatttatg 360 ctgagatagt catacaaaat gtgagaaggg gttaggtaaa agataacttg taattgtttg 420 atttatgcaa attaatgggg aaaaaccctc cgtctttgtc attagagtga aattctttta 480 aaatattgta atgcaaagtg ctagggccaa gaaaactgcc atagtcatca ttataactag 540 ggcagcattt tgtatctagc ataaagaact gtagaccaaa taaataactg agaaatatg 599 <210> 152 <211> 599 <212> DNA <213> Homo sapiens <400> 152 acaattaatt caatttttct tttatattct gcattccaca taaagcgata acaggaaaac 60 ataaaattcc actaacttca ttattatttg tgtgtgtgta ggtgtgaggt tttcaatttt 120 aaaaattttt ctttttttct tgtcatgtta tttcatcttg gtttcatttt tattcttcag 180 gattataata atcccccttg tttgcagaag cagttataac tcactgcagt tcttttccat 240 gaaaagattt tcctatcttc agtcaggttt ctcatgatgt acaaagaaat atctgggctr 300 tctctgctct tgatgaattt cactcaatct ttgagagtta gaaagctctc ttccttaacc 360 gtgtgttaag tatttgctca catgcacagt cagtgacaca cttatacaaa acacatgtgc 420 acacacacac tgtatttaca ttcatctact ttgcaatgct tttaacgtgc ttcattggat 480 atttcataat acctaggtgt gatgactaat attaagtgtc aacttgattg aaggatgcct 540 agatagctgg taaagtattg tttctgggtg tgtctgtgag ggtgttgcca gagaagatt 599 <210> 153 <211> 599 <212> DNA <213> Homo sapiens <400> 153 tgtctgttga ggacccattt tctggttcac agatggtgcc ttctggctgt gtcctcacat 60 ggcctttctc aggcctcttt tgtcggagca cttagcccat tcacgaggct ccaccctcat 120 gacctaatca cctccaaaag acctcatctc ctaatattag ccccttagag gttagaattt 180 taacatgtaa attggcgggg cggggtgggg gagacataaa tattcagttt attgcaacat 240 gtgtttaaaa tgtgaaatta ttattgcatg ataggctata tatcatcttg gtattaatty 300 ggctaggctt aattatctag gattttaagt tgattttatg aaaattaact atgaagtgtt 360 gcatagtgag cctatcaggg taattagcat atacaccatc tcaaacacat attatttctt 420 tgaattggaa atgttcaata ttctccctct agctattaga agctatataa tatattattg 480 ctaactatag ttgtcctaac taagttttga atgtccttac tgtaaaaata ttaatcacaa 540 catctgacca gtcaacattg attaactgtg gttagtcctt gatccctgaa gatcatgaa 599 <210> 154 <211> 599 <212> DNA <213> Homo sapiens <400> 154 aaagtgcaaa gtaaataaga gattatacac agtatctgtt gcaaaccatg atagggtatc 60 agttctctct ctctcttttt tttttgcatc ttgtttcaat acacaagaaa aggataagca 120 ccacactggc cccagatggt tatataggaa ataggaacat acttctcaaa ggctcaccct 180 ttttccctaa gacttttaga gaaaaataaa taatattaac tcaattgctt cattatgctt 240 aaaaaaaacc cctaaaattt atctaacatt caaggattaa aattattttg tggccagats 300 tcgctaacac aaatttattt cttatctggg gcgcatttta aatcataact catttctcat 360 aggaacctgc atagtattac ttgatttttc tcatcatggt aaatgtaatc ataacaatac 420 tatttgaaaa gtcttccctg cacaaactga caccagttta ttttacttcc ctgtcatact 480 taaatatttg caaataggac tttaagaaat ttcccttaaa actatgaagt agttaaatga 540 tctgaggtga gttgtagaat ttgcttcgat gttttatggt tatactttat gaagtaaaa 599 <210> 155 <211> 599 <212> DNA <213> Homo sapiens <400> 155 aagatataaa tgaagcaact ggattaacat acatatcttg agcaaaagag tatatagctt 60 tcaggctctt ttaacctttt ttatcaaatt tatccagaaa actctcgcaa tattatagca 120 tctatgtatc acagctgaag aataaatatt ggctaatttg tctttgcagg gaagaacact 180 tacctaatca taatttatag ttttgtttac ctttccattg tgaaagctaa ttatttgtct 240 gaacaagagt ttctccccta ttaagccact ggtgagtaaa gacgcaattt aaattttacw 300 tgtgtattca gttcacaagc tttataactc ccattaggga atcaaatccc ttcaggattt 360 ttgtgaatgt ttacccctag cagaggtaaa tgaccagtct tcaattttaa atcatggcta 420 gcagaagcta tagtaaagca tcaaagaaga ccaaaaccca agtcacttgg ttttcaacac 480 tcagttgtgt gaccatgaca gcaaattatt agccttgtca tttaaatagc tttatttgaa 540 atgaatatag aaaaaaaacc tccttcttat tctattacca tattgctgtg gattatctc 599 <210> 156 <211> 599 <212> DNA <213> Homo sapiens <400> 156 gaagtttccc atgaaacaaa gagccagaga aaacagaatg aattttgtgg ttgaagtaag 60 aaagacttaa agtgaatttg catgggccaa agagaagaga ccagttggga atgtgaattt 120 agatgccagg atacatcaat gccaattagg catctttatc cttccctata cattgacatt 180 atttaaacat cttggaattt agaaaatatg ggaaattata aattgagtaa gatcagtctg 240 aattgatgaa gacttcccag aaatgactgg gattgcattt ttaccacaga gtagaattgr 300 gaactaagaa aaaaggtatg ttttaactta aaaaaaaaga aataacaaaa ttcttagaag 360 ttatacttct cacttatcca aatttgtaga atacgaaatt gtacccacgc acttatgttc 420 gaagaaaact cctgtttttg cagaaaaaaa aatgtaaaaa acagaaaatt acttctagcc 480 tggaagctcc aaaatggaat aggggctgtt tttaattacc ggagataatc cacagcaata 540 tggtaataga ataagaagga ggtttttttt ctatattcat ttcaaataaa gctatttaa 599 <210> 157 <211> 599 <212> DNA <213> Homo sapiens <400> 157 aaagagccct gtcctttgca caggacctgt ctaaagctga ggctggatca agataaaaga 60 caaacccacc ctcatgacaa atctaggtcc tacaacaaac aacaatccac cactggggta 120 ggtagaagag cgtagaaaga ccagaaaaag agcagagaag gacctcctct gtatcaaggg 180 tgtgcaggaa tagctgaagg ggaagccaga aagctaaaac ctccagcatc ttagctgtca 240 ctgtaagcac aaggtaagta agtggtcaat tagtccatca gactcaggaa gaaatggaaw 300 cctgtggtct cctgaaggta acaacagaaa caacaacagg caaacactaa cactgatgaa 360 atctcaaagg cattatgcaa atggaagaag tcaggcacaa aagactctac attttattct 420 ttcattttca tgacattttg aaagggtaaa agtatacagg gtcaaaaatc agattcatgt 480 tcaccagtga ctggggatga ttggaaagga ctgtgtaaaa aatgcataag ggaatttttt 540 gtggcaatga atatttattc tatgtcttca ctgtgatggt ggctacatga ctatggaca 599 <210> 158 <211> 599 <212> DNA <213> Homo sapiens <400> 158 ccacatattt ttcctgccgg ttgccttgga acacagcagg gaatgtctct cccaagcaga 60 agaactgctt ctaaactgct atgaaaccaa gaatgcacta gaatattagc agattatcag 120 ttcaggcttt atagtaatct tcaaaatgcc cagaatgcta ttaaggatat caggtaattc 180 taggttattg ttttatatgt tggtataaat tttaatgagc tatatctctg gggagaagtg 240 tctaatcaac aaagtatggg cattttaatc aagttttact ttttacttgt ctgagattas 300 taaaattatt tgtagaaagg ccaacagtca gaagatcaga atgtaaccaa ttgcactaca 360 acagttcccc catctgtgct gggactagtt ttctgcatct ggtctagatt atctcatctt 420 ccttcccagg tctaaaatcc aatgcatctg ttacacagca gaagaacttt tttgtgtgat 480 aaaaacataa tttatatagt aaaaccttca ttttagaatc aataggaaac tctcaacaag 540 ggattaacta ccagaatata caaggaactc caacaactca atagcagaaa agcaaacaa 599 <210> 159 <211> 599 <212> DNA <213> Homo sapiens <400> 159 aagtactcca tggtgaaaag aagcaataca gatgctgctt tttattcttt tagtctctgt 60 ggaatcaaag atggcccaaa tctgatcgtt ttcatgaatc gaagcctgat ttggaaaatt 120 taagtgagtg gtatctgaaa ataataatcc atgtcgaaac atataaatag aaaaaattac 180 tatccacata gcataattgt aatcattgat cagcaaaccc ataatcttat caatgacttg 240 ctaccttact cactagatga ctagatgttg accaaaattt taacttaagt gcatcatgcy 300 cttatattaa ggctttgatg tatttttaaa attaaattag ccaatgagag gtattttaag 360 ctgttttaag ccattgacat cttactgtga ctgagattac aagtttaggt tttggtagag 420 gagagaaaac caaaaatatt ttgtatctaa gtgataggaa atgggcaaga gaaggataaa 480 gaatagagag acagagctcc aggaaatcaa gctttactct atccacaatt aatattcgaa 540 gtagtccttt tgggcttttg aaaatgataa aagtggaacc tttagtttca tttgcttca 599 <210> 160 <211> 599 <212> DNA <213> Homo sapiens <400> 160 aatatgacgt catataggca ttaatttcca tgttatgaat tcaccagtaa aattgtttaa 60 acagagaagt aaacaagacg gtaatgttat tcaggtaaaa gtagagaggg aaaagaaata 120 ttggaaccag ttcagcaacc aaaatggtgc cagagcccaa gcatgagtta ttaaaggctg 180 gtggttcctc tctcctgacc cattaccatt cttatctctg atgctccagg ctgtcagttt 240 ctttcttttt tgaccatata caggtaagga aagcccattt atgagctatt ttatttccar 300 gttttaaaaa tgtcaattga tataggctat gatctacagt aatgcttaat ctattgaagt 360 ttttgcatca aattccatct taagatgcaa gcctgaagcc catttaatgc caaatgtaaa 420 tacaagtgct agtttcaaag ggcaagattc aaagaaagac aaacagaaga aaagtatttt 480 aattgctatc taaaagaagg ctgtgttctt gggtgaatac tttgttgatg tatttggggt 540 agaaacagag ggagaaataa ttatgtaatg ttaagctgtt ttctaaaatt ccagggctc 599 <210> 161 <211> 599 <212> DNA <213> Homo sapiens <400> 161 cacctgggtc tgggctttgc ctactactgc ctttgggatg agtcagccta atatagaaag 60 cttgtttttc tcttttttaa ttttgttttt cttctttctc taatttctgc ctcattataa 120 caatctgccc tctgtgcccc accccaaatt caagtctttc ctatgtgcaa aatatattca 180 tcccaaaaaa aatcttaatc attccagcat tgactctctt gggccaaaag tctcatcaag 240 acttcatcat ctcaacatct caaatctcat tatctaaaca attgaaatca attgtggtaw 300 gattctggga aaaaaacttg aaatcatctg tttccaaaat acagtggaac aggtatagaa 360 tacatatgtc tattccaaaa gggaaaaata gaaaaaagag acacagagag agaaagagag 420 agagagagaa agagagagag agagagatta tggtgtccca agaaaattcc aaacctagca 480 atctaatcaa atttcattag attctaaggc tagggaataa ttctctttgg cttgatgctc 540 tgtcctctag gcccaccagg gtgacagcac catcctgagg atcagttttt gcttttctt 599 <210> 162 <211> 599 <212> DNA <213> Homo sapiens <400> 162 acttgatctc tatctccaag attatttgag ctgtgtttat acacatttta ccttttagat 60 catatattgt aaaatagata ttattattat tccaatctta tagactgagc atctaaaccc 120 agtgtaacac acctcccaag tgttaaaact gggttctaaa cctcatattt caatgatact 180 tctagaactc tttctactac atccggtaat aatattaaaa acaaaatgta tataatttca 240 gtgaacatta ttgaaagttt tgtgatactt atcttaattc ctcccattat gtggcaaatr 300 taatatccca gatggttttg taaaattaga gaaatcttgt ttgaacagca gtgttgagaa 360 aatgagactg ctaaaaattt tagagaacca aactcctcat tatttttctt tgaaggtaca 420 tgataaatta cctatcctta aattctcatg tagtcatttt atataccaga aagatattta 480 atattatatt gttatgccat cgcacactga acagttgaaa attggtgtaa tttagttcat 540 gtaggaagct gttaagaccc ttaaagtaaa aaccttttaa actgaaaatc tttcctgga 599 <210> 163 <211> 599 <212> DNA <213> Homo sapiens <400> 163 tgtaatccca tctactcggt aggctgccgt gggagaaccg cttgaacccg ggaggcggag 60 gttgcagtaa gccgagatca caccattgca ctccagcctg ggcgacagag caagactcca 120 tctcaaaata ataatagtaa taataataat aataaattta aaaatcagca aacaaaaaag 180 aaatacaaca taagaagtga atatcaagtg gtggtaggag ctactccttt acctctgcag 240 gtgacattgg gacagaaacc tgaataataa tatataggga aggaagaaac ttcaagaacr 300 cttgtggaag aatgctccag gcagagggaa agccccaaga aggaagcctg cctgttgtgt 360 gtttatggga acagaaaata ggacagtggg actgaaacac aatagagaga gaaagagtag 420 taggatctgg gaacagagac ctaaccagag aacagatact taagggctgt gcatgtcatg 480 gtaaaatctt tgaattgtct ttgaagtgtg atgtaaggcc atcaaaaagg ttttgaacag 540 atttaaaagg cttacgctgg tagtaagagg catataggct ctaagctggc gagagagcc 599 <210> 164 <211> 599 <212> DNA <213> Homo sapiens <400> 164 aagcaaggtt tcgtttatga atagcctaga cccattgggg tagtaggaat ctaaaatgta 60 cctcactgat agtcctgtgt gtagctggct taagcaagga tattttgtgt gtgtgtgtgt 120 gtgtgtgtgt gtgtgtgtgt gtgtattgta ataaccattg aaaggtatgg ataacataaa 180 tttacttgaa aattccaaca tcagagatag tattgttttt catagaacta cctcccacca 240 ccagaagttt aagatgcata tattaacgta cctattagca ttattatcac acctgcttgr 300 ggtgttttat catgtttgct tgaattacca gaagtcaggg actcttgata ggctgagttg 360 ggaccttcta gatagagcaa aagctgtgaa aagggaaggt acatgcagaa gagtgattcc 420 atggaagcct tgagccagga ggaagtagaa tgaggacaca acaactagag gaagaaaaga 480 tcctggaact gaagagtaga gagccacatc tacatttgcc aacaagcatt tttagaacaa 540 catattttca gttttacagg gattggtgaa ttggaaaaaa acattcctat aacaaatgc 599 <210> 165 <211> 599 <212> DNA <213> Homo sapiens <400> 165 actacctcat tagaaattag gatttcacca tatacatttt agggacatat aaacattctg 60 tccatagcaa ttaagatgct cattcccatt ttcaatatat ttctaaattt gattttgcta 120 aatttttaaa tcaatgcctc aggtatttat tgctgatcta caaatgttca aattatggca 180 taatttttat tttttaatta gattgaaata aaatgtcatt ttaattgact ttaggtatta 240 tagttactaa aatttgaact gtaaatttta ttagctaaat agggaaattc attacaaggr 300 aagtaattcc tataaatata gtccaacagg gtacatttac atagtcaaaa tatcttgagg 360 aagagctatt gattatttaa atctaggatc aatcaaatat ggcatattat ttgctttcaa 420 atatttgtgt ttgcatcgaa tttcactaat ttttaatagg attgactttc aacaaagact 480 tccagtcaaa aattgtcctg aggccaggct caatggctca tgcctgtaat cccagcactt 540 tgggaggccg aggcgagggg atcaccaggt caggagatcc agacaatcct ggctaatat 599 <210> 166 <211> 599 <212> DNA <213> Homo sapiens <400> 166 tattgtcata ttttaagaaa ttgccacagc caccccaacc ttcagcaacc acaaccctga 60 atagtcagca gccattaaca tcgaggcaag actctccatt ggcaaatttg ctgaaggttc 120 agatgattct tagaatcttt tcagcaataa agtggttttt agctaagtta tttataattt 180 tttacacata atgctattca caatagatta cagcacagtg taaacataac tgttacatgc 240 attgggagac cacaaaattt gtatgactca ctatatagca atattcattt tattgcatts 300 gtatggaact aaacctgcaa taaatcccag gtatgcctgt atttgactgg ttacagttat 360 acagttgcca tatttggtct atctagtcag gaagtttcca gttaaatagt tacacgggtt 420 tttttggctc cttctaattg gctgagctta agttctcttt ttatttgata taggcattta 480 gaagaaatag ctaaagttaa gttttgctta tgttggcaaa tcaagcaaga tttaggtcac 540 ttatgaggcc taacttgctt tctctgctca gggatttttc aggctagctc ttctttcta 599 <210> 167 <211> 599 <212> DNA <213> Homo sapiens <400> 167 gataaaactt cttgattcaa acttaaggtt tgtccagacc agtttcacat cagacatggt 60 ttccttttca acaataaaaa tcttttctaa tataatcaca tcgacagaaa tattggtcag 120 actgaaagca agtcgactag ttatttcttt atgatgacct atttcagttc tctttaagct 180 acttacaaat gttccaaaat agtttagact ttcaactgcc atttttataa aaagttttca 240 aagacaaatt ttaactagca aaatatatga agtatttttt ttactaagct acagatgtar 300 tttccaattc ctgtaacttt gggcctcctt ctacaggctt gatagctata aaataaaacc 360 agttattatt taattcagtg gttaactaca ctcttttaga acgttcgaag gtcatgaaat 420 taatgttcta cccttgtgaa atgaaagcct gaaagctgag aagttaactc agcatatttt 480 agtaagactt aactgcaggc tatatataca cttggaatag aagtgttcgg atctctgtat 540 taaggatgtc agcatttcca ttaaaaatag cctaggtaag gagtttaact agattcagt 599 <210> 168 <211> 599 <212> DNA <213> Homo sapiens <400> 168 aaatgaccat gtttcttttt tggcttaatt atgttccttt tcaaaatgta ttgttaactg 60 ttattttgta ggatgaagat gactaagcaa tttctggaca ttcacccctc tggaggctta 120 gatttcatag tgtgaaaatg aatgtgctat gtgttgcatt atactctctg aataaaatcc 180 tgattaccta tgcaacaagg accacagggg gcacgggata gaattatgaa atcagttatg 240 gaatatgcat ttagaacaga agtaactctg cccaaataac ccaggaggaa gaaaaggacw 300 tctccacaag ggcaagtaca catagaataa ctgcaaagca accaagaact tcaatgcaca 360 ctaaattggc catcattatt ttaatgagct ggctgtaatt tttaaaagca tttgcttttg 420 taggcagatg cataaaatct gttctaatgg ggtcatttat taatttgcct aaagattatt 480 tcttgtgacg aaagcctaat ggatttaata gaatgcatct ttaagtagca gggcctaaaa 540 tttgtgtgtg tgtgtctgtg tgtttaattt caaatctttc tattgtgcat tgcaccaaa 599 <210> 169 <211> 599 <212> DNA <213> Homo sapiens <400> 169 ttctggttct tggttatttc ttcccctttt tcctactcgt gaacattatt ctaccaatta 60 tcctcttcct cttgcaccat tattttattt cttactactg gataattcca aaaattatac 120 aaacttttct atattaacac agaaaagcaa aacacacaca cacacacaca cacacacaca 180 cacacacaca caataaaacc tctcttgacc caacatttcc cttaagctcc atactttatt 240 ctctgctctc catttaaagg aataatcttt gaaagaattt tctattcttg atacccacaw 300 atactactct ttctttccct ctaaactcat cttagttcta ccacttcacc atttcttttt 360 tgtatagatc actaataact tacatgttgc tgaattcaat ccagttttta atcttcatat 420 cacctgtctt gtcatcagca tttaacagaa atcactccat tttccttgac agaccttctt 480 cacttggttt ccaggacatc actctcttag gttttctcct acctcactgg gtggcccttc 540 gtggtcccca ttgttagatt ccactcatct cccaaatctc tcacattgga gtgtacaat 599 <210> 170 <211> 599 <212> DNA <213> Homo sapiens <400> 170 tatatatttt acttactgtc tgtcatccca agtagagcat gaactattgt attagtttcc 60 caggggtgtg ataacaaatc acacaaactt tgtggtttaa tatcaaagaa atttattctc 120 tcacagttct ggaagccaga agtctgaaat caaggtgtca gtagtgccac acatcccctt 180 aaggctctag aggagaatcc tttctttttt tctttttttt ctcttttttg agatggagtc 240 tttcccctcc gcccaggagt gccctggtgc aatctcggct cactgcaatc tccgcctccr 300 ggattcaagt gattctcctg cctcagtctc ccgagcagct gggattatag gcacccacca 360 ccacacctgg ctaatttttt gtatctttag tagagacaga gtttcaccat gttggccagg 420 ctggtctcga actcatgacc tcgtgatcca cttgccttgg cctcccaaag tgctgggatt 480 acaagcatga gccaccacgc ccggccagag agaatccttt cttgtctctt ctagctctgg 540 tggctcaagg aggcattcct tggcctatgt ctacataact acaatctcta tcttcacat 599 <210> 171 <211> 599 <212> DNA <213> Homo sapiens <400> 171 agtttcccag gggtgtgata acaaatcaca caaactttgt ggtttaatat caaagaaatt 60 tattctctca cagttctgga agccagaagt ctgaaatcaa ggtgtcagta gtgccacaca 120 tccccttaag gctctagagg agaatccttt ctttttttct tttttttctc ttttttgaga 180 tggagtcttt cccctccgcc caggagtgcc ctggtgcaat ctcggctcac tgcaatctcc 240 gcctccagga ttcaagtgat tctcctgcct cagtctcccg agcagctggg attataggcr 300 cccaccacca cacctggcta attttttgta tctttagtag agacagagtt tcaccatgtt 360 ggccaggctg gtctcgaact catgacctcg tgatccactt gccttggcct cccaaagtgc 420 tgggattaca agcatgagcc accacgcccg gccagagaga atcctttctt gtctcttcta 480 gctctggtgg ctcaaggagg cattccttgg cctatgtcta cataactaca atctctatct 540 tcacatggcc ttttcctctt ttctctgtgc cttctcttcc atctcttata aggatgtgt 599 <210> 172 <211> 599 <212> DNA <213> Homo sapiens <400> 172 gtatgaatat tcaactttca tgaaaaacta tttcaagagt atttactcac agacaagatg 60 gggaatcatt cagcgggggg atccctagtg tgggacaagt ttaccatggt ccaaagttaa 120 ttccatagaa tactttctat ctatctatct atctatctat ctatctatct atctatctac 180 ctatcatcta tctatcatct atctatctat catctatcat ctatgtatgt atgtaggtat 240 gtatgtatgt atgtatgcat gtatatacgt atatatctgt ctctctgtat ctaccgcatr 300 tattgtgtgt gtatacatat atgtaataaa ggtaaataac atctacttgt atataaaaag 360 aaaagataaa gggcagaatg tctcagatca tttaatagac aaatctacat tgtgaatctc 420 agagaatgaa atattgtagg cataatttcc cagatttatt tgactttcca cctcagagac 480 ccctttcctt gcttttctca tcacagcatc tcatgaaact agtgtttatt gaacctgtaa 540 gtactgaatt agaccttaat caattatgct cctgacagag atgactactt tccttcgca 599 <210> 173 <211> 599 <212> DNA <213> Homo sapiens <400> 173 agaccattta aaaactgttc ttggcttaaa atatcaggga ataggaatag ggggtgacca 60 aattcaggaa aaattatttt tatatttatt ggcaaaatta gcacgtgttg actagcattt 120 gtctgagtgg cttattcctg ataaacagca tcatgtgtta aattgagttt gggtcctcat 180 ggatgactgg gctaaatttt ttttaagctt gaaagctttc taattgtctg tataaccata 240 tagcataatt gatgttgtat attaaaaata accaacttga acacattgag tgatttttty 300 ctcctagtaa cataaagtca tctgagtatt tatggaaata aatttgaata gccataggta 360 taataattaa gaatatagta tctatgtttt tcagcacaaa tgatttagtc atttcatcag 420 ttccaagcag tgcaatgtct attatagtac ttgaagtaat ataattttta tgacttacat 480 gcaaatgtta agttttgatt gcatcctttt catattatca tcatgaaaag taaaattcta 540 ctaattcgta aacaccatcc tctgtacgaa gcgtttccta gctagaactc atttttatt 599 <210> 174 <211> 599 <212> DNA <213> Homo sapiens <400> 174 tagtttcgtc tcttgttcat tggtttattt cattcagaag gattatgatg acttcttttg 60 tttcttttca atttcctact cactttcagt cataaatcaa cctgtaaggt cccaactgac 120 aactaggtga gtattagaca agcctgggta ctgtgaattt ggagtgactt aagtatctgc 180 ttttcatcag agatagggac tcatttccaa tgtagtagaa gatggctctc ttagaaaaaa 240 catatttcta cttttataca tcaaacatgt ctatctactt gcaaacaaaa aatatcaagr 300 ctattgccca atccctgtga atctaccata gggtattcta aaattgaagt taaattttat 360 gatgctatta agcacgttac tttttttctt cccaaatgca tgcataaaat gttattttgt 420 agaattcaaa aatttggagg aggttatata ttgttcgtgt gtgtctgtgc ttgtgtgctt 480 gaacgcatct aatttaacca ctttaattta gtcaagtttg ctaacaactt tattcatagg 540 gaaagggaaa atatctcata ttatagataa ggaaactgag gcttgaagag ttaataaac 599 <210> 175 <211> 599 <212> DNA <213> Homo sapiens <400> 175 atcttataaa tattaaatat taagatattt ataatttatg tcatacctgt ttctaaaagt 60 aatgaggcag ctttaaaatg tacctgagca aatatatatc acaaacccaa gactaggtaa 120 ctaaatgata ttttatggat ctcaattagt tgccattaac tttgtcagct ttgaatgtgt 180 gaaattatta attggacatt aaaccttaat gtgaaattat ttgaaagtca tcttttgtct 240 tatattatac aggagagagt gtgttatcag tattttggaa tttagcataa caatgtcatr 300 taccaaatgt atggggacca attgaataac attacaacat cacagcagga agtaattctt 360 gtcacaaata tttccagagg taattcttga tttagttatt ttgccagtgg atgtgtcaag 420 ttccatataa atgaatgttg gttcccttgt ggaaagagaa aattagtaac taaaagagga 480 gcctttaaag gggcaaaatc ttttaaaagt gatccatttc tatatattcc tacatggaag 540 aatatggctg gaaaccttaa tttattatga agaggccaac acatattatt tttgatttt 599 <210> 176 <211> 599 <212> DNA <213> Homo sapiens <400> 176 taaaaatcaa ggcatcttaa aattttcatt tttgatttct gaccctctca atgtagtcct 60 ttcaaactct cttgaaactc tctctctctc tttgccattt gcccacataa attctaagac 120 atcctacctc tgtctttttg aactccttga tcccaacact ttctctctcc aacttttttg 180 ttttttcttt tgagatcaac tcttgctctg tggcccaggc tagattgcag tggtgcgatc 240 ttggctcact gcatcctctg cctcctaggt tccagcaatt cttctgccac caccagaatr 300 gctgggacta caggcatggg ccaccatgtc tggctacttt ttgaattttt agtagacatg 360 gggtttcgcc atattggcca ggctggtttt gaactcctgg cctcaagtga tcagcctact 420 tctgcatctc aaagtgctgg gaccacacgc gtgacctatc atgcctggcc tctccacctt 480 ctttgtgctc ttatttttct cttgtgaata atttttcttg tttcaaaaag taagcaaaat 540 ttctataatt caaagaaggc atattattga ttcttgacat attttgttaa attgtcttc 599 <210> 177 <211> 599 <212> DNA <213> Homo sapiens <400> 177 cattcctaga atgtgtttaa tctctagctc acaaggcttc ctgcttcctg gcttactgct 60 gcttgcctga cttcacttcc cacttcttct ccacttacct gacactccat ctatggaaaa 120 ccattgctgc ttcctttacc tgcaataata tctctggcct ctggagcatc tcctcacact 180 gtcacctcac ccagaaggcc attgagctaa aaagggatct tgtcagtgat ttcaatgatc 240 caacattatg atttagcaca tgataaatgt tttcatgatg gtcagatatt aaataaacak 300 aaggttttag acagtgaatt tttcttttaa ataaaagatg aaaacaaaca tgaaaatggg 360 gttacgtcca ataggaaata gacccagaaa ttaagacttt gtggaattta gtttttccta 420 gctttttcta tgtgggctta ccattaccct cttgacacct tttactgtca ttgtacaggc 480 tctccagagt gactatcaat agtgacaaga ataataaatc tatattgaaa tatcctcaca 540 gttttactac ctaaaggagc ttgtttttca taatatgagg gaccaaatga gctgtctgc 599 <210> 178 <211> 599 <212> DNA <213> Homo sapiens <400> 178 aagacaataa aaacaaaaag agggaggaaa tatggcaatg ttaatatatt ctgttaggct 60 taaaaaggga agtaattctg tctttccaaa cagaagccat taaccacaaa ctgattgtaa 120 ttagataata ttctttgctt tgtaaagctt aaaaaaagat agcatctcag cgctgagtaa 180 aatatttatg acttgaactt gtgtatacat cacaatttaa taatgatctt ttatatgaaa 240 agtagtagtt tcttaaagaa agtctctcga taaaatgacg cataaataat tgtccaggam 300 ttcagtaaaa aacatttttc tcttttctga aagttttaaa tatagatatt gcttatttta 360 ggaaacagtt tcaatttgtc acatatcttt atcctgtaga gcaataaagc ttaatgtatt 420 atttctacag tcatgtgcta aataacaatg ttttggtcaa taactgatag catatatgtt 480 tgtggtccca taagattata atggagctga aaaattccta ttgcctggtg atatcatcct 540 agccaacata atgtcatagc acaacatatt actcacctgt ttgttgtgat gttggtgtt 599 <210> 179 <211> 599 <212> DNA <213> Homo sapiens <400> 179 tgctttaagt ctgaactttt acagaaaatt ctggcacctt tattttcagt gtttccccta 60 atgataataa taattggcac aaaagaaagg gacccagttg tattgcaaaa tacatatgta 120 ttacaaaatg ttggcagtgg agaaatgcat ttatgcaggc tagatagggg aagcaatgat 180 ttgtgtacta tttttgtctt tgtctttgtc tttgacagcc agtatctcta taagaataag 240 tcagttgata tgttttgggt ggagatttca gggtagataa tcccattagc tctttgagar 300 gatgaactac agaaacacga gatttggcct ctattgtgtg aaatacttat atattacaca 360 tgtgcacaat ttgaggcaga acacattatt cagaaagaac caattttcct ttgaacaaga 420 aaagaactta caaattatgt cggaatgtta atatagcatg tcatcatttt ctgttattga 480 ggaaatgtta taatctgggt gaacatagaa gctacaattt atgaagtatt tcttccatga 540 agtgacccac caaagtcagc atattctaca aatgacttag ctgttttgct gtacaccaa 599 <210> 180 <211> 599 <212> DNA <213> Homo sapiens <400> 180 gatttggcct ctattgtgtg aaatacttat atattacaca tgtgcacaat ttgaggcaga 60 acacattatt cagaaagaac caattttcct ttgaacaaga aaagaactta caaattatgt 120 cggaatgtta atatagcatg tcatcatttt ctgttattga ggaaatgtta taatctgggt 180 gaacatagaa gctacaattt atgaagtatt tcttccatga agtgacccac caaagtcagc 240 atattctaca aatgacttag ctgttttgct gtacaccaaa tagtcatcag gaattatcay 300 tgtggcccaa atggcacacc attaaaaatc caaggtcact tagatttgac tgagggcgta 360 ctttcagaaa caggcaatta tgcttttgat tttaaaggca aagaaacaac tgtacttaag 420 gttagcattt taattgctta gcaacacagg taactgacaa aggaagatag tttttattta 480 tgcttcatca agttctttcc tcacagaata ctttttctac ctagagtttc tttattttaa 540 agtttaattt tatatatatt ttaaatcctg ctgctgagaa ttactttcct ccaagactg 599 <210> 181 <211> 599 <212> DNA <213> Homo sapiens <220> <221> variant <222> 300 <223> a,c,g or t (any base) <400> 181 atatgcagcc ctcaattgta cagctaggtg ctaaagctag gtaaagcacc aaaaacccca 60 agatgaaata catttgcaga taattttgtg tattgctcac tgtctagaca gtttcacaaa 120 tttcataaac aaatgacttc ttatagaaat caatatagcc tagagtctat gaagcccaga 180 tcagggctta gtctttcatc ttctaatctt ataaccctga gaatttatag aattttgtat 240 ctttatagct agaaaatact ttaactctct tagttctact gcccttactt tacaggtggn 300 aaaaaaaaaa aagagagatc tgggatcacg aagtgagctg cccaggatga cagggccgat 360 agtgacaagc tgcttcctgt gcactaaact agtgaatggc aagcacttca gccttacata 420 cttacagata taatgcactt ccaagaataa cagtggcccc ttctgaggct gtggggcaag 480 aaggaagaga gggaacattt cagaatctct ggggcatttg gcacgtgatg tttggaaaat 540 tctcaaggtg tattgcaatg tttgccttcg gaaggttctg accttgtggt tgaaaactt 599 <210> 182 <211> 599 <212> DNA <213> Homo sapiens <400> 182 atccatgtaa gatgtgactt gctcctcctt tccctctgcc atgattgtga ggcctcccca 60 gccatgtgaa actgtaagtc caattgaacc tctttcttct gtaaattgcc cagtctaggt 120 tatgtcttta tcagcagcat gaaaacagac taatacattc agttatcagc agaagtttgg 180 ctattttaat ttgacatttg aattatattg gcagagggag aaagaactta gaaatatttc 240 ttcggccaac ttctgagaaa gaaacattct tttgctttac accattgtag ccatgttcaw 300 ctgtgggtga attaaggtag agtcttccta ccttacagca ctagatagta atgtttattt 360 atttagctgg tatgttttca gtgtttcgcc tatacttgct gttttatata ttttttccct 420 aaaaatagga aaatatatat aaatatataa tttcctaaaa tatatatgag aaatatttta 480 atcatgtatt ttctacaatt tgaaacttag ttgtgggaaa tcacccaact cattcctgtc 540 attttataaa cacacacaca cacacacaca cacacacaca cacacacacc ccttcaagg 599 <210> 183 <211> 599 <212> DNA <213> Homo sapiens <400> 183 ttgatactac aacagtagca gtaaagagag cccttgtcct tgacttggga ccctgctctg 60 tgtcaagtta acccttcttc tttcctttgg gggcagatac ctaacttctg ggctactttt 120 ccaccaagat gaaaaagaaa ttgattattt tgcctagaaa tctaaggctg gatagtgcac 180 atccattcta cataattagt ggagaaaaaa aactttgcaa gctagctgag gatgttccct 240 gagagcattt gaagcttact ttagtgaaga ttcttaaaat gacctcaagg ggggctatgr 300 ggaaaaaaaa tccctattta ctcattactt aagagttaga atttagctaa caaactctgc 360 tgccattctc acctctgttt tggtattttg agtgtgtcag ttgaatttta gctactgcat 420 ttttaaaata agtaaaactt taaagtagta aaatgagtct taacctaaag acaggatctc 480 ctattatcaa agtccaaaat gaaattgttt gtaaggttaa aaaaattata actaagcaaa 540 gccaggggaa aaagtgacta gtttatcttt tggtaaagaa gcaagggaaa tgaaataca 599 <210> 184 <211> 599 <212> DNA <213> Homo sapiens <400> 184 cacgagggca ggttttttct gtgctgttct tgtaatagtg aattagtctc atgagatctg 60 atggttttat aaaggggaga tcccctgcac atgctctctc ttgcctgcca ccatgcaaga 120 cgtgactttg ctcctccttt gtcatctgca atgattgtga ggcctcccca gccatgtgga 180 actgtgagcc attaaacctc tttcctttat aaattactca gtctcaggta tgtctttaca 240 agcagtgtga gaacagacta atacaggccc cttacctaag ttaacctctt tttttataak 300 gtttaatttc tagcactatt gtataggtat taaagttagt acaagtaaca tgattttatt 360 tgggaatgag tcttcaacta atagattttt aaatgatttt tcatgataaa atgacctaaa 420 atacatagag tatggaagta atgtgttttt agttggacaa tattttgaaa cagatcagtg 480 ttttcctcag tggatgtgtg tgctgtgtgt tgttgaatat tattctggat ttattctcca 540 acaaagtgta tttcctggaa ctgtttcttg tagaaaaata tacagtttct tagttttca 599 <210> 185 <211> 599 <212> DNA <213> Homo sapiens <400> 185 acccacaggt ccacctgcag ctctttacca gacctttgac ctgatctcct gttactctac 60 accttgctca ttctgttcca gctaactgac ctccatgttc tctcttgaat gtgctagata 120 tggtccacct cagggtcttt gcacttgtca cccttaacta taacaagctt cctccaaatt 180 gctgcttact taatttcctc accttcttta attctgaact tgggcataat tttcagagtg 240 aagactgtaa caaccctatt taaaatttta ggcacctccc atatcccaat ccatccagtm 300 ctctctgtgt tattgctatg cagcacttac tgctcttaaa taaaatgtat aatttccaca 360 ttctagatca gtttagatat ttcataattg taaatcattt ttattagtgt ttaaatatta 420 ttgtattcac ttgtctttat attgtccaag atttccttat ggaaaaagtt taacatacaa 480 cttagtggaa caaattttgt aataaacatc ctaatactca tcacctatat ttgaccatat 540 acattttact gtacttgctt tattgcatac atctctatgt caccatcatc ctgtttagc 599 <210> 186 <211> 599 <212> DNA <213> Homo sapiens <400> 186 aggtagaagc aaagagacca ttttgacaac tagagcagta atccaggact ttagctggac 60 ttaaggttat aacattaaaa gtggtgaaat gtgattgtat cctggttaca tcttagagta 120 taatcaaact gatttgctga tgtgttgtat gttcagcatg agagaaagaa tagtggagga 180 tagcaccaag attttttgtc ttgataaagt ggaaatactg agtttgtgta agagacagaa 240 gaaaagggga gaagtgttgg agtgaaacta tctttgagta ggcaagagag aatgaaatay 300 ggtgtataga tgaagggatt agatttaggg gaataaacag ttaattttac catgggtgag 360 agaacatggt atatgatata gatcctgtca agtggcaaat ttgtctcagg tagcttgtga 420 gagttccctt ttgattgctt cttatgttct tagtgaaata aaaatacttg gtcatcaact 480 gaattttatt tttatcttta cattaaaaaa tgtacatact ctttgaccca gacgttccac 540 ttctgggaat ctatcctttg gaaataaaac actggcatac aaggacatag gtacaaaat 599 <210> 187 <211> 599 <212> DNA <213> Homo sapiens <400> 187 aaattatgtt actaggttac catcatccca gatcactttt attacacttc ctatttgtat 60 ttttattata tctctcggtt tatgggttta ttttgcttat gattgagaag taaacagatt 120 ttcacttttt gttgtagttg atttaaatat tttcttataa cagttttaat aaaatactat 180 tttcctataa aagaatactt aatcatatga ttatgtaaaa tgtattttaa tggaacagag 240 tttatatact gctatggtct gaatattggt gtcccccaaa attcatatgt tagagcttam 300 tacccaatgt gatagtagta agaaggtgag ccttcaggaa gtgattaagg cctgagggct 360 tcatcttcgt gaatgggtta ctatcccaac taaaaagagg ttcaagggaa ctccctgtgc 420 cctctgctat gtaaagactt agcaacaatg caccatctat taagtaatga gtgagccctt 480 actaaacacc agatctattg gcatcttgat tttggacttc ccagcctcca gaaatgtgag 540 taatacgttt ctgctgtttg taagttactc agcctaaagt attttgttat agcagccca 599 <210> 188 <211> 599 <212> DNA <213> Homo sapiens <400> 188 ctctcggttt atgggtttat tttgcttatg attgagaagt aaacagattt tcactttttg 60 ttgtagttga tttaaatatt ttcttataac agttttaata aaatactatt ttcctataaa 120 agaatactta atcatatgat tatgtaaaat gtattttaat ggaacagagt ttatatactg 180 ctatggtctg aatattggtg tcccccaaaa ttcatatgtt agagcttact acccaatgtg 240 atagtagtaa gaaggtgagc cttcaggaag tgattaaggc ctgagggctt catcttcgtk 300 aatgggttac tatcccaact aaaaagaggt tcaagggaac tccctgtgcc ctctgctatg 360 taaagactta gcaacaatgc accatctatt aagtaatgag tgagccctta ctaaacacca 420 gatctattgg catcttgatt ttggacttcc cagcctccag aaatgtgagt aatacgtttc 480 tgctgtttgt aagttactca gcctaaagta ttttgttata gcagcccaaa aggagtgaga 540 cacatataca tattaaaatt acttctaaca ccaccacagt tatcaatctt ctgtccggc 599 <210> 189 <211> 599 <212> DNA <213> Homo sapiens <400> 189 caagccagct aggctaggcc tgtccagctt tccttcacaa agaaggattg gagagttgcc 60 gcttactggc tttctcaaat gtcattactt agccagtctt ctgaagattg agattcatga 120 acattggact cttgcctgta attacaattc ttaagtatat taaccttatt ttcagctgta 180 tttttagttg ctttctgact tcatcttgaa aatacctata ctctttctgc atttattcta 240 atcttacttc tgatcttgat tttaaaaaga tctttatcaa tgaaatcacc tccaagaacy 300 atttttgaac tttaagatgt attcttaaat ttttagtaaa ataggattta gaatcaactt 360 tgtgaagatt actaacagaa aaatgaatag ctcctaccat gaggcagttt atagttaatg 420 taaagaatat tatacttgtt tatacatgaa aaagccattt tctttctcta aacctcagag 480 agctatatat atttaatgaa taaatgaatg tatgatgaat gaattcctgt cagtctttag 540 cgaagtctta tctcttattt ggaattcttt ctttatcccc tatgtcttca taaattcca 599 <210> 190 <211> 599 <212> DNA <213> Homo sapiens <400> 190 ataacagatg cccaatgaat atttctgaat gtctaagtga ttgaaccagt acttcaattt 60 tgacatttta atacatctat aaataattga gtgatctgaa tgcctaaatt tggctaagag 120 gataggttat atggcaacgt gctgatctat ttgagtactc tctcaataaa tgctttcagt 180 tgtcatcagc acagttctca ttcatctttg atttaagcat ttgtcattgt gccccattgt 240 agaatagcat aatacaatgc atacatgcct caccaatctg acacatctaa ggtcacactr 300 ttagtagtac ttgaatattg ctatttccaa cttctcattt tctcattcag aaactccaat 360 gccttaacac ttcccacccc ttcagcaaca aaaaggatct tatatgcact tcaatatcag 420 tttgaactgt aattacccac catcctctgc tactccaagc tctatcttca ccatcattcc 480 ttgcctcaca caggcccctc atttcattaa ggtgcatatt cctacctttt tatttgcaac 540 attaatgttc tcagtgctca aacagtatgt caggagtctt tgcaatgttc catcccact 599 <210> 191 <211> 599 <212> DNA <213> Homo sapiens <400> 191 tttttatttt actcacaata acaatttcaa gatttaccat cttatttatt cattttatgc 60 tgtatatttt ctctaccagc aaataatccc caggaagaaa cagagacctt gtctgtccta 120 atccaccatt tcatcaccat tgcctaggac catgccacag acataacaga tgcccaatga 180 atatttctga atgtctaagt gattgaacca gtacttcaat tttgacattt taatacatct 240 ataaataatt gagtgatctg aatgcctaaa tttggctaag aggataggtt atatggcaam 300 gtgctgatct atttgagtac tctctcaata aatgctttca gttgtcatca gcacagttct 360 cattcatctt tgatttaagc atttgtcatt gtgccccatt gtagaatagc ataatacaat 420 gcatacatgc ctcaccaatc tgacacatct aaggtcacac tgttagtagt acttgaatat 480 tgctatttcc aacttctcat tttctcattc agaaactcca atgccttaac acttcccacc 540 ccttcagcaa caaaaaggat cttatatgca cttcaatatc agtttgaact gtaattacc 599 <210> 192 <211> 599 <212> DNA <213> Homo sapiens <400> 192 agtgtggctg gaacatggta tgtaaacagt gaagctgcta gatataagat tgcagatgct 60 gatagaggct aaatcattca cgacctaata ggtcctggtg aggacattga gtttttaacc 120 taaaggtaat gggaaaaaag gaagagtttt tgtttttgtt ctggggtttt atttatttat 180 ttttagtagc gacaaggttt cactatgtta cccaggctgg tctcaaattc ctcagttcaa 240 gtgatcctcc tgcctcagcc tcccaaagtg ctgggcttac agacgtgagc caccatacck 300 ggcaaaagga aggttttaag cagagcagtg aaatgaaaga gaagtaacca gttaggaggc 360 tattaccaga aaccaagcaa ggaataatag tgacctggga aggcaatggt agagatgcag 420 agtagtaaat gaatttgagg aatattttga aggtagactt aacaggattt actgtgctga 480 ttaatatgaa tttctttctt tcttttttct ttttttaaag acacaggatt ccactatgtt 540 gtccaggttg gggtgcagtt tgactaatca cagacacagt cattgtgcac tatagcctg 599 <210> 193 <211> 599 <212> DNA <213> Homo sapiens <400> 193 tcacgaccta ataggtcctg gtgaggacat tgagttttta acctaaaggt aatgggaaaa 60 aaggaagagt ttttgttttt gttctggggt tttatttatt tatttttagt agcgacaagg 120 tttcactatg ttacccaggc tggtctcaaa ttcctcagtt caagtgatcc tcctgcctca 180 gcctcccaaa gtgctgggct tacagacgtg agccaccata cctggcaaaa ggaaggtttt 240 aagcagagca gtgaaatgaa agagaagtaa ccagttagga ggctattacc agaaaccaar 300 caaggaataa tagtgacctg ggaaggcaat ggtagagatg cagagtagta aatgaatttg 360 aggaatattt tgaaggtaga cttaacagga tttactgtgc tgattaatat gaatttcttt 420 ctttcttttt tcttttttta aagacacagg attccactat gttgtccagg ttggggtgca 480 gtttgactaa tcacagacac agtcattgtg cactatagcc tggaatttct agtctcaagt 540 gatctttcct cctcagcatc ttgagtgctc tgtatttctt gcattacaga tgagtgaat 599 <210> 194 <211> 599 <212> DNA <213> Homo sapiens <400> 194 tacagacgtg agccaccata cctggcaaaa ggaaggtttt aagcagagca gtgaaatgaa 60 agagaagtaa ccagttagga ggctattacc agaaaccaag caaggaataa tagtgacctg 120 ggaaggcaat ggtagagatg cagagtagta aatgaatttg aggaatattt tgaaggtaga 180 cttaacagga tttactgtgc tgattaatat gaatttcttt ctttcttttt tcttttttta 240 aagacacagg attccactat gttgtccagg ttggggtgca gtttgactaa tcacagacay 300 agtcattgtg cactatagcc tggaatttct agtctcaagt gatctttcct cctcagcatc 360 ttgagtgctc tgtatttctt gcattacaga tgagtgaata caggattact ggagattaat 420 caggtttaag atttaaagtc aagaagtctt caatatacat atttttgaag taccttcatt 480 atatcacagc tattaagtag gcatcagaac acaatgatag tatcatcagc cttgtgctag 540 cctttccaga gaagatttag ctttctgaca gtctgcattg tgtatcagct tcactcatg 599 <210> 195 <211> 599 <212> DNA <213> Homo sapiens <400> 195 caagatttgg aagtgctata gtttgaaggt gtcccagaaa gcatgtgttg gaaacttaat 60 ccccaatgca acagttttgg gagatgggtc ctaatgggag gtgtctagat aaatagatta 120 atgtttatta taaaagggat cgagactgta tgcttgatct cttgcactct ctcttgccta 180 tgatcacttg ttcttctacc ttctgccatt gagtgatgta gcaagaaagc cctagccaga 240 tgcagcccct caaccttgga cttctcagtc tctagaactg taagaaataa atctgtgttm 300 tttagaaatt acccagtctc acatattctg ttacagcagc acagagtcaa gtaagaaatg 360 tgtttataat agtgtggcag tttttaaaaa tggttacaat ttttttgtat cttcttgcat 420 ctagaagtag agtttatgtc cctttttctg agtctgagaa tccttgtgct ctttcaacca 480 gtagaggcaa aagaagggat gttctatgac ttccaagact aggctacaaa aggtcttgca 540 gtctctgtcg agttttcttg agatgatctg agggaggcta acctccatat aagaagtgt 599 <210> 196 <211> 599 <212> DNA <213> Homo sapiens <400> 196 aagtcataga acatcccttc ttttgcctct actggttgaa agagcacaag gattctcaga 60 ctcagaaaaa gggacataaa ctctacttct agatgcaaga agatacaaaa aaattgtaac 120 catttttaaa aactgccaca ctattataaa cacatttctt acttgactct gtgctgctgt 180 aacagaatat gtgagactgg gtaatttcta aagaacacag atttatttct tacagttcta 240 gagactgaga agtccaaggt tgaggggctg catctggcta gggctttctt gctacatcay 300 tcaatggcag aaggtagaag aacaagtgat cataggcaag agagagtgca agagatcaag 360 catacagtct cgatcccttt tataataaac attaatctat ttatctagac acctcccatt 420 aggacccatc tcccaaaact gttgcattgg ggattaagtt tccaacacat gctttctggg 480 acaccttcaa actatagcac ttccaaatct tgtatgttct agtacaatag ttatttaagt 540 tgtttttagt ttctgagctc cttagaaaaa ggcaagttca ttactttgaa gtgtacatt 599 <210> 197 <211> 599 <212> DNA <213> Homo sapiens <400> 197 ctttagagtc acaacttttg ttgttgttgt tgttgttgtt gtttcactta aatgctctag 60 ttacaacgtc cagagaactt tggtaattgt tgatttgggc catgatgtca ttgacatttt 120 atagctgagg ttcttttttt aaataatagc taactctaga ctttaagtat tatttttgtt 180 ggggtaatag agctataaaa gaggcaaaac acatctctaa tttcagtaca ctaacattaa 240 aagaagaatt gccagaataa ggattttaaa aatcaaacat tttaggagta gtccagactk 300 tattggacaa ttgtcacaga tgttttctag gattaagttg gtccaagcaa taaaatttag 360 ctggtaagtg acctattttt gagtttttcc ttccatctca taagcaagct attgccattc 420 tactattgtt tccatggaag aatgctttct aggaggtagt atagcattgt atcgttcaca 480 agtaaatatc ttgggtgaaa ttaactaaag tataagagac tgcaagatag tttaaagtaa 540 ctttttagtg tacataaatc agtgccataa aggctttggt tttctgataa tgaagatgt 599 <210> 198 <211> 599 <212> DNA <213> Homo sapiens <400> 198 ccctttccta gatctactgt tggcaaaaat cctatctgct gtatttcatt acaaactaaa 60 atctcatggg aattcttgga gggttcactt tacgttgttg ttcaataatc catatggaaa 120 gagtcttaga aatactgaag cattttgctt tgactcttcc ttaatttaaa agttattcca 180 ttttgtaact aatgcctctt ttccacgttt aaatatctta taaacactgt catcaggttc 240 tggagcttta ctattctctt gcccctgaca gctataataa cctcttcaaa acaaaagaar 300 taaataattc ataacctgga aaatggacct ctgagtaatt gagttattcg tgtatatttg 360 aatagatatt aggaattatt agaccacatt ctattttaag ggatcattat gatatataga 420 aataaatgta cattatatga ctcagagacc aagtaacagt tacttaaact taggagtaca 480 acctttccat gaaaggctat ttctccttaa ctgagagttt tatgaaaatt tggctacaaa 540 actacttggg aatttatctg tttaatcatg atgcatattg attagcaaat tttctgaat 599 <210> 199 <211> 599 <212> DNA <213> Homo sapiens <400> 199 atctcataaa aatgcttata tttgagtgcc tgcctataaa agtcatacat ggctgcctgt 60 caagaacgta gacatataag actgttggcc tttttcctct aacattcttt tctttcctca 120 acattcaact gaaaaaagag atctagaggc agaggagtga gccagaaaca aagaatgaaa 180 gtcgtagaaa gtcagaaaca aagaataaaa ggtggaaaga gcacaagatc acaccattct 240 cctctcctta gcagggtggt ccaggcctga agttggaaag cagagaaata tgttatttgr 300 atttgaaata agaattgaca tttgaattgg attggactaa actttgtaaa agaaaattga 360 gtcttggtga cgaaaatgaa actcttcata taatataaaa tctagacagc aaagagttct 420 cttcaaaata tgattgatca gtgtagaata gagatccggg tagaggttgg aaaaagcatt 480 aaagcatttt ttcaatctta ccctacaggg taaacccatt atagttagac agcttgttgg 540 tgacagaagc tacaaatcct aactctaagt acaatactat ttagaacatt tatttctta 599 <210> 200 <211> 599 <212> DNA <213> Homo sapiens <400> 200 atctaacaga gaaagcataa tcctgtttca acaaacccag gcaaaaatgt ctaaattaac 60 ttttgaagaa atttttattt tattttacca acagttttca aaccagcttt atttaccaaa 120 gaccactaaa gttacatgaa cttgaaagca ttttagctag ccatttagtt tatgggcact 180 catttattta taagtcagtt tagtacctgt agacaatgta gacatacatg catagacaca 240 tacatactta gacataacat acagcacaca catacacaca cacacacaca cacacacacy 300 tgtccaaaga ttattattta atgttagacc tgagagaaac ctgcccatga ctcttggggt 360 ctctgtgaga aagacaggaa gtcccaaaag atggggtcag tggtgccttt gtgtgtgtgt 420 gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtgttcct aaagggatct cagagtcatt 480 agaagtcccc tctctccctt catgtggtat caaagatggc aaaaggaagg aggagctgaa 540 gtagaaggaa atggaagagc aagtcttaga gccaatttag gagagatttt taagtttca 599 <210> 201 <211> 599 <212> DNA <213> Homo sapiens <400> 201 gtctttacca agaatttaca ttacatttat ataagctatt cattggctat acattgttaa 60 gttataaggt gtaggttgta gtatcaggtg tggcattatt ggttaattta tagctacttc 120 tggcaactac aagcagtttg caagagatga atacatggct caaagagggg aaaccaggac 180 agaattgttc tctcgtttta acatctctct gaacctggta atttagaagg actcgcatta 240 cttagataaa agttcttttc tcatttcccc ccttttgatc aaaaatcttt cttcttgaam 300 gcattgatga acaaaatctg agtgtcaagg tatccctcat cactgggaag gctcgatcct 360 cgatcgtcct gtcaaagtgg ttgatctata gctgctgtca tctctacatg ttgtagtagc 420 atgaatttac ttttctcaga agtaaaacag atgcatagta gaagtattct atacataaga 480 attttggtaa aaagcaaatt tgtatttcag aagtaaaaaa aaaaattccc ttggggcagt 540 caactaaaaa catcatgaat aaaattaaaa agctggtcct tttttagaga tttgttgta 599 <210> 202 <211> 599 <212> DNA <213> Homo sapiens <400> 202 atgtatcttg gactatctct aaccactagg tgatagcaga gtgctcaaga tatgggggac 60 ccagactctc atattatacc tgtctgaaag agcaaaaggc ggtacacttc agttagaaac 120 taacaaagat tggtcacaaa taaagtctaa gtctgaattt tcaagtcata gaaaacagtt 180 gcaatcttaa aagtatgctg tgcaactgct attgtagtcc ctgactgcca atcctttgat 240 accaacttct actatgagat agaggtggaa aaaccttgat cagacttgac tagaacctcy 300 gctgtgagag aaaggttgga aaaaaaggca gtcctctgta gagctctttc cctgaatatc 360 atatccagag aaagaaatca aagccttcac tcttaaagga aagatggggt ttgaaaacag 420 cccaagtaaa aagtctagag tcagaattcc gaattcagga gaacttaccc ctaacaccca 480 atgggacttt tgaagacaga gtttatgagg ttactgagta atactttcag aggcaaacac 540 cagggggcta aagggagtca ctccgaatcc tgtcaacgta tgccagatgt gttgacctg 599 <210> 203 <211> 599 <212> DNA <213> Homo sapiens <400> 203 agtgagcgat ggtagttgta gtgatggtgt gttaaatcaa ggaagaaatg ttagcaaagc 60 aaaaactgtc aggagcatct ccttcagaaa caacaaatac agtgggcttc ctgagcactt 120 tcttactgca ttttttgtca tgcatttata tgattaccat agattttatg aaattttatt 180 ttataataat ttgtattcat tcattttcca gcctgcttat tccagtttag ggtcaccagt 240 gtcagatcct ctcccagcag ctcagggtgc aaggtgggaa ctgccctgga caggaagctr 300 tctcactgca gggggcaccc acacacaccc caacactcac tcacattgga accatttaga 360 cacaccagtg aacctcatgt gaacttcctt gggatgtgga aggaaaccaa actacccaga 420 gaaaacccat gtacacatgc agagaacatg tagactccac acagacagtg gccatgacca 480 agaattagtg attttcttct catcaaagtg atcataaaat gactttgaat gaaatggtgt 540 tatttgagga cttgccctat ctcacagcta agtctatttg aattgtgaga gaaataggt 599 <210> 204 <211> 599 <212> DNA <213> Homo sapiens <400> 204 ctgagctagc tggatggagg aagatatggt agatgatgct cataataata aaatgatgca 60 ggaaatatat agttcctaga ttctagtaaa tataactgaa ctcttcaaga aaaggaattg 120 tattttgccg ggtttgattt tccagcaaac agctaagtgc ataacacttg ttgctgaaag 180 gaatagtgga ggttttcttt ctgcttctga tccaattgtc atttgatgat tattttctac 240 ctgtcatgcc ctgtgccttg actctcatct atattaatct catttaattc ccactaaaar 300 agaacaaaac aaaatcacga gcacaaaatc cccaaaaaac cttttgagat aagtatcatt 360 ctcatttcac agataaggat gcagatgtag agatggtaat tttcagtacc cgcaattagt 420 aaaacagatg ctaaaataca tgattcaaat tccagaacgc tttatgttac actgcttcct 480 ctctcacact gtctgttaaa agtacttgta tttgaagctg tttgagcaaa catcatgtca 540 ttgatcctaa tattgtatgt ttgttacagt gaatacaatg ttatgaccat cttagcagg 599 <210> 205 <211> 599 <212> DNA <213> Homo sapiens <400> 205 atttcactct tctttgacat agctgtgttt tcagtgatta actttagtct tttccttaaa 60 ttaattagct atcttagtaa atgttaatga aaaaatgaaa ataacttgat tagacagcta 120 tagagatcta tgtaacatac tatgcgtcct gacttttgag agtagataca aaagcagcac 180 aaattgggtt aatttaaact caaacaaaag gtcagtttgc agaaagtaaa gacctgtgtg 240 acctcttgtt caaatcctgg aagctataaa tcctactaaa ttacttaggg ctttgttaar 300 caggcccaac aaaagataac caacattgta attattgttc agtgatggac tgaataataa 360 gcctggtttc tatttgtcaa agcaacagac cttaagtcat ttgtagagct attctaatga 420 atagtggaag gctgtgggtt acataagcaa ttaaagaaaa atcataaaaa ccaaacacct 480 agaattgcta aaaccttaaa agtatccatc aagcgttgtg aaagtcaagc ttgcaagggt 540 aaataaaatg caaaatacaa gaacaaaatc tatttaggtt tcacaatctc cagtgtctc 599 <210> 206 <211> 599 <212> DNA <213> Homo sapiens <400> 206 actcaatata gaactgataa tgagagtgaa tatatattga gcattttcta ttggtctgac 60 cctgagctaa accctttgta agtattagct catttatctc tcacaaaata cctatgaagt 120 aggtataagt tactatctta cgttctcagg gtcaagaagc tagtaagggg taaagtcaga 180 gtttgaaccc aggattggcc ctttccaagg cctgtgctct tcatctcaat gaaattagtg 240 tgtcaaagaa tgtttgaact attttaaggt ttaatactga gtggctgtgc caaaaagctr 300 tgccaatttg aacatcttgt aagaatcagt agtgttaatt ggtttgacag aaaaataaaa 360 atgtaaatgt ttataacata catgaaaata ttttaacttc tatatctttc tcattaaggc 420 agctgaatat tgctgtttat atatttattt ccatttccat ttctgtaaaa tctttttcgg 480 cttttgcttt ttagaaaaac tcacagtcct tttctttatt gatttaaaaa aacttcattt 540 tttccatttt ggcatttgtc tttaattttg catatatttt tgatttacag aagaattca 599 <210> 207 <211> 599 <212> DNA <213> Homo sapiens <400> 207 aaaccatatg ctgaagtcct tctctcaata tccttctact agaaactgat cttgatactc 60 aactctattc cagtgctttg gttttaaatc acactgctgc ttctgagaag cactcataga 120 tactctagaa tcctttctgc ttttgatcta gtatggcatc ttattttggc agttaaagaa 180 cttaaagtgt cccatgagag actgtttgct ttcttatcta atctttagta catctagcag 240 caaaacaggc catttcatgg tattattctt cagggagaag gttgttcaag gatacacaay 300 tcctgttgct tttattgtgt ggtcaaataa ataacttgag gcatctccag ctcctgacta 360 cgtcatgtat ttgttagttt ctttttgcag ctccagtttg catccctcct atagggatag 420 gttccaactc aagatccggc aaatattttc tgaataggag tggcctttct ctgcttaggc 480 aacacataat gaagcctcgc aaaagcgatt tgatgttgtt ttctgaattc tgtgctacct 540 cctgagttgt gaaagactta cttggcccga acctttctct tgcttcctct tttctcatc 599 <210> 208 <211> 599 <212> DNA <213> Homo sapiens <400> 208 cctttctctg cttaggcaac acataatgaa gcctcgcaaa agcgatttga tgttgttttc 60 tgaattctgt gctacctcct gagttgtgaa agacttactt ggcccgaacc tttctcttgc 120 ttcctctttt ctcatcgcta acatgacttg taaaagtaac tttaaagaaa aggatcctgt 180 tgccatgctg tatccttgct ggatcacaca cgaggtgttt agatgaagct ttatgcccta 240 cgggcctgtc tgccctgtac aaacattaca gtgcccatga ggctctgtaa tattagaags 300 gctgatacca attttggaac ctggttaaac cctgggggag atccaagacc atgagttctt 360 tttggcaggc caggccacct gctcacaaac aagaaacatg cagggggttt gcaaccaact 420 attcagaaag aaaataaagt tatggatgcc agaagcttca taaattacta cacaatctca 480 ggaaaggggg agttaagagg ctaggaagcg gacaactgca agaacacctg aatctaataa 540 cattctgaaa cagtttcaac tggcagagaa cgtgggcatg gaaaaagaag aacaattct 599 <210> 209 <211> 599 <212> DNA <213> Homo sapiens <400> 209 tatactatat tgtatttaat gtatttataa gtactcttta aatacaattc tttggaagat 60 aatgccttaa attaaggctg ttcctctctc tatttctggt aaaactagca ctgtattgct 120 ggccagtgga ggagatatat attactatag gagaaaggca agagatcagg caacccaaga 180 ggatatgaaa ggtaaacatg ggatggagta agtcatgaaa gtggctattt tttttcattg 240 aataaatacc tattaattct ctgctggaat ctaagacagt catgtttgta gaaaacagay 300 attttgagat taactcctca tataattcct tgtatttctg cttagaagac agccattctt 360 tttttctgag agctctaaag cttaatagtc tgttgaaaaa ttatattgtg tcaaaaatat 420 gtatactcat attttttacc cattgccact acttttatct tccatagtca ttatagcacc 480 aatttgctgt ttcttgcata tatcatttat tccagtagat tttagtacat cttttgtatt 540 ctcttacgcc cactttctag gggtttcata tatatttgat acgtttttgt tttggaaat 599 <210> 210 <211> 599 <212> DNA <213> Homo sapiens <400> 210 tttagtagtg actgactaca gtaattgaat caatttgaaa ttaattattt gtatcatgat 60 tttttttcag tttcacagca aagcaatcct gttgcaattt gtttttggtg ttatatacaa 120 gcatagtgcc cccatggaga tcccaaatat atgtgaattg ataataaagt ggatattgct 180 ctttctggca cctgttatag attttcaaag aaatatcact agtatattat catagaattt 240 attaaacctg gaagcatttc caaaatatat gtttatagtt ttatatttta aactattccr 300 agaaagaact ctactcattc gtattcaaac ctcctgactg tctcccctcc aattcattct 360 tgtagtactg ttgagttaca ttccctcatt gtgactccaa tcaagccatt tttctgctgg 420 aaccatattg atggctccct actgaatgcc aaataaagtc cacattcatc aatatatgtg 480 tgaagtgatg agctcaatag ctattccata gtttatattc aatattgctc aaactatgtt 540 ttgtcaaata cttgagtcac actggaggtt aatcatgttt tagtggaaaa actattaga 599 <210> 211 <211> 599 <212> DNA <213> Homo sapiens <400> 211 ccatggaccc tggttgtaat gatcatgcag gtcctctatc tatgcatgcc agagattctg 60 gacagacaag tatggggaca tccctttctt tatttgattc ttttgtcaat tttttataaa 120 agttttattg ctttcagtcc tttggagaaa tggaagctga atgctaaccc caaggacttc 180 tgtggcctat catgaactgg gcgtgaaata agagtttctt ggagaagtag attccttgaa 240 gtttctgaga caaaaactgg acttcttgtg atgaaaagaa agcacagtca gaatacaaam 300 tgataatgga ttgggtccaa gtggccagca tcttagacta tggaaatttg ctgttggaca 360 ttaaagcatg acacaagtta ccgaagaaga gagaagctgc tacagtccgt aacaaaaaag 420 gctgtactgt tagctagcca aacacataca cagaaacctg gaaaagagtt agttttcttt 480 cttttcatgt tcaaatgaca tagtctacct gatgcagaaa ctctcacatg gcaaaggtta 540 attagaggtt tccatggact atatcccttg ctcctgggct acaacaggac atgaggctt 599 <210> 212 <211> 599 <212> DNA <213> Homo sapiens <400> 212 cttgtttggc aaaaagcttt gcttcttttg gaccttctcg ccttcatcct ctctatagtt 60 ccagcggttc aacttccttt cattcagctt ctagtgtatg cattctctac tccatatgaa 120 ggcaaccgct gaagtgaggc agtgggagat gagaggagga gaatctaaaa ggctcagatt 180 ctgaagggca aagaagagaa gacttaggga tggtctaacc tcaggacaga atagctaaaa 240 gccacctgag cattaaccct gaggaaatta acatcaagct caagcttatt attaaaaaar 300 tctatatctg tggagcatct tttctggatt taagttaaat aataaaaaaa agacaggact 360 gcatttgaga atccagtagg cagtacgaga gaaaagaaaa agagggacat cacatttgca 420 gtggtgtgca caaaattgca ttgcctgtat tacacagtaa tgtaaatatt ttgaaatagg 480 ctgtgtattt gtaagcatac tctctacctt ctaaattatt aagagccaag tgatatacta 540 gtatgatttt aaaataaagc aaaaggaagg gctgaggcct ctgtattagt ctgttaggg 599 <210> 213 <211> 599 <212> DNA <213> Homo sapiens <400> 213 attctagaca tgcttggaga tcacaatccc tacatataaa agaccagagg aagaaaaaga 60 aaaggaaagc ttctcgagtt acatgaaatt tcatgtacag agtatcatga ggtaatttaa 120 aagcaaagac tcaagggtac ataccttcac caggtaaagc ccatacccca aaacaatggg 180 agagaaatta actgtgaaaa tctccgctgg aagagagcag gtgttggtga aaagagacat 240 gggaaatatg tttagcattt gagagggaaa ggaaatgaaa gtggggaaag gaaaatatgk 300 ggagaggaaa ttcaaattca cactgtagtc tgcccgtgtt ttattggtaa aatttaaaag 360 ctgggaaact ggccatcaca ttgcaaagtc agaaaatcat ttatgcgcct tatgggatcc 420 aatgactcct tgccaaaata ataacaaatc tatttttatc ttctctcggg gactgtcaac 480 cacttgctgt ttaatcacct tctaactaat gttagtattc taaaaggggt agtgctgttt 540 gctagatagc aatattaata tcatcacatg taccctaaaa cttaataata aaatttaaa 599 <210> 214 <211> 599 <212> DNA <213> Homo sapiens <400> 214 gatcacaatc cctacatata aaagaccaga ggaagaaaaa gaaaaggaaa gcttctcgag 60 ttacatgaaa tttcatgtac agagtatcat gaggtaattt aaaagcaaag actcaagggt 120 acataccttc accaggtaaa gcccataccc caaaacaatg ggagagaaat taactgtgaa 180 aatctccgct ggaagagagc aggtgttggt gaaaagagac atgggaaata tgtttagcat 240 ttgagaggga aaggaaatga aagtggggaa aggaaaatat ggggagagga aattcaaaty 300 cacactgtag tctgcccgtg ttttattggt aaaatttaaa agctgggaaa ctggccatca 360 cattgcaaag tcagaaaatc atttatgcgc cttatgggat ccaatgactc cttgccaaaa 420 taataacaaa tctattttta tcttctctcg gggactgtca accacttgct gtttaatcac 480 cttctaacta atgttagtat tctaaaaggg gtagtgctgt ttgctagata gcaatattaa 540 tatcatcaca tgtaccctaa aacttaataa taaaatttaa aaaaaaagaa taggctagt 599 <210> 215 <211> 599 <212> DNA <213> Homo sapiens <400> 215 tttttggatt aaatatacgt gagaatcagt gaatattata tacctggaga cctacaatgt 60 tcatttgtat attaaaggct ataaaaagtt ctatcataaa ttacatttaa tttcttaaaa 120 tacagtgttt ctcaagccca ctggaacact ggaagctttt cttatgctac atgcgctaat 180 atcttatagg acataatttg ggaaacgcga agttgtttca taataatata attaaggaac 240 ctaatatgat ccccaggaag gttaagcagc tggctcattg tggtgccact ggtttatgcs 300 aagatccaga ataatccata catctcccaa ctaccaatta ttgacaatgt gtgttactgt 360 tggcatagtg acattatgat tcttcatttt tagaagtgtt ttgtaactta cttttaaatc 420 tcctgatagc tgatgaatta aggtgatatc atacatttct ctttctactt tttccatgtc 480 ataaatgata tgataatatg gctaagagac aaaaaataat ggaagattta acactaagcc 540 ctggtttatc tgatctaatt taaaatgccc ccttctcatc cacataccac acttactca 599 <210> 216 <211> 599 <212> DNA <213> Homo sapiens <400> 216 gatatacctc aacaacacta tttttacttt acaattgatc aaattaacag agattattaa 60 ctacctacgg ttttatagaa aatgtaattc aaaataaagt ctcaagatta tttctaaaat 120 accatgtaga agtccatgat atgataggaa attagttctc tattaaaaag ataagacatt 180 tctagctcct ttaagttagt gactagttag tcccttcttg tgtgctttaa aataatttat 240 aaatcatatt attgacattg taggtgctgt atcaaaggac tcactattat agagcttgty 300 tcccaaacat gtttctactt tatattacct ctacttaaag taacactttt tcctggaaaa 360 tgctgcttcc aaattttaca ttttacattt taaatccctt caaatttatg tatttaatga 420 cttttagtaa agccttggca tcagcaatgt tgtctgttgg gcaaagacac atctataacc 480 caaagtatct tttatcaaag gtgatcaaga tgcagaaaag aaaaacaagt ttcactggca 540 atcaagacag gaacactgga gggtccattg tgccactgga atcagcctaa aaccataac 599 <210> 217 <211> 599 <212> DNA <213> Homo sapiens <400> 217 tgctagctgt gctagatgtt gaagatacag tgatgaaaag atacacattt ttcatggcac 60 tggagggcat aattaggtaa atgaatacta tggttgatgt ttgtgtactc ccaaaatgta 120 tttgttgaaa tcctaattcc gaatgtgatg atattaggag gtgggacctt tggctgctga 180 ttaggtcatg atggtgaagc tttcataaat gggattagtg cccttataaa agaggttcaa 240 gagagacctc tttccccttt caccatgtga gtaagccagt gccatctaca gagaaagtgk 300 agtcctcaca agatgctgaa tctgtcagca ccttgatctt tgacttgcca gcatccggaa 360 ttgtgagaaa taaatttcta ttgtttaagc cacctaattt attgtatttg ttatagcagc 420 ccaaacaggc caagacaatg aataattaac aataaaaata atatttataa gattagaaag 480 taaaatgttt tggagttaga ttgaagagat atccaaccca gccttgttga tcatagaggt 540 gatgatgaat tgtatctcag aacaaattat gagtatatgt gtttgtgtgt atgcataaa 599 <210> 218 <211> 599 <212> DNA <213> Homo sapiens <400> 218 agaaggagga gtcagtttca ggttgacttg aggtagtttg aacttgttga ggtgttcttg 60 aaatagtttg aacttgttga ctttgaggta tacatgggaa ctctggtggc tggttctaag 120 ttatatatga agttttgcaa ttcaagagga gaatctggat taagataggt attttgaaag 180 gatagtcatt gaagccatgg gagttgaagg ataatggcaa gaaagaacat gtagactgac 240 atcattaaag ggcttagcat accctgaaga tcagcaataa ttgaaagatg aacacaagar 300 gaggagaata caaactagta tgagacacag ctactagaca gagtgaactt ttagaaaact 360 ggttgatata ctgaaaggtt agaaagcagt attaggcaca gctatagctc ctgaaataat 420 ttttataatc ccaaatttga aaaacagaaa gaaaaattag tcatttttct ggttttatgt 480 agtgctatag ctgtatagct gtataatcct agaactataa taattattaa agaatatcta 540 tgtcgatttt ataaattact ttcaataatc caggttttag cttaacatac atggaatta 599 <210> 219 <211> 599 <212> DNA <213> Homo sapiens <400> 219 aggttatgct acttccctgg aggacctctc aaaaggaagc tgtttgttct atttctttct 60 catctgtccc aggactaggt attgcattag gagatccctt gcttcccact gctgctttta 120 aatcatttca tttccttctt cccttcattc ttcccaaatg caaggtcttt caactttcat 180 ttcgtgctac actctgccct ttattgctgc tctctggaat ttgtggtcac tgtccctcat 240 acactgaaaa ctcacatacc tctacctcta gccctgttgt attcctgatg acttgagcay 300 ccaagggagt gatacataca gcactggtca atcatttctt tacctgccac acatacagca 360 atctttaatt tcaatagcct tagccactca ttcccaaata atgcttggat catgcacatt 420 atcatgagta aatacaccca tgtctgaaat cctgatttca agtacttccc aatttttctg 480 tcttttcttt actttcagct cacagaaaca attcttccac catattaaaa actctaatcc 540 aattcacttg ttccaccact ttttttattc attattctct cctgtcttta ctttcttcc 599 <210> 220 <211> 599 <212> DNA <213> Homo sapiens <400> 220 ctggggagag agagaaactg aggcaggggc tgcctgactc tccgagcccc tcagcagacc 60 atttgacatc acacagagtg ccactagcca caagctgcat gaatttacct ctctataagt 120 aaacagagag aaaaaaatcc tcgctgtgtg tgaagatagc cccaggaggg ggaaatcttg 180 taaaagtcaa aaaaggctgt gacttatgtg acttcactgc acacatccag ctggacttct 240 cacccatctc agcgggaggg ttgtcttgag acagttgaaa cagcaaaagg gtttggaaay 300 ggtaagctat ttcaggtaac actttacgtt gccaaaccag cgatagcagc acttcagact 360 gtcacttttt ataatgtttg cctataaact tttcccgtgt ggtttttgaa atggcgccca 420 aatgcaaaca gagaacagat gggaaacctg agtcttgccc cgtccaatca cttcacggag 480 aatggacgac agatttaaac tgttaaggaa gaaaaaagca gtttctacca acggcacagc 540 tccctccatt acttttcaca aattaagcct tttctggggt ttcccaggga tggtgtctt 599 <210> 221 <211> 599 <212> DNA <213> Homo sapiens <400> 221 ttaaaaatta tatatttagg cacacccctc atatcattta agtctgcctt tgagaaacat 60 gctggatggc tcttcatgtt tgaaagaaat tatattgttg cccatgagaa aataaaaatg 120 cacacagagt aaagagccta agaatgcact tactgaggag tgagtcaccg tgtctcccaa 180 tgtccccacc cacagtggaa atccgcactc cctgttttgt cagtatccct cttgcttttg 240 atctgatgtt ttcggctgtt catgacagtg ttctccaaaa aaagatgcac agagggaagr 300 ttttctctct ggtcccaaca cgtgtattaa agtcatattt catgagtgaa aaattcctga 360 tggaccacta agacgcaggt attgaatcag tactgtgtgc ataaactcct agatatgggc 420 agctttgctt gcataagaac ttcaaaattg agtcctggcc gagtgcggtg gctcatgcct 480 gtaatcccag cactttggca ggccgaggcg ggtggatcac ctgaggtcag gagttcaaga 540 gcagcctggc caacatggtg aaaccccatc tctactaaaa atacaaaaat taagccagg 599 <210> 222 <211> 599 <212> DNA <213> Homo sapiens <400> 222 ctcccttcat cgtgtaagag aagaggctgg tggaggagga ggaggttgaa ggtcacttgc 60 ttgttttgga tacgacctct gtagacatcc aggttatgta tttcctcccc ccgggcaggt 120 ggaaatatga acctacaagc agggacttga gtggcatctg cggggaggag gtgggaaaag 180 ccacacgtgc ccaggagact ggaatgcagg gaaaggacca gaagagccag aggtagaatt 240 ctgggtatat ccatggatac aggaggggtg gcagggaagg agaaatttcc tagaaaggcr 300 agaagtcctc cttgacatgt tcctgtccat aagaacacat acgcacatgt acgcaccagc 360 aggaagcaga atgctaaccg aagataatta acccccaatt ctgtgttagg gattgagaaa 420 tagaccagga gccctgcccc ctcctctctc atttcctgac cttccacact gagaagacct 480 ggctaggcag ccttgctttt tttcctgttt agcggaggag tgaggatttc agccggaagg 540 tctttctgat ggcagatgtg taagtgccag acattgtgct gggtgccttc tgtgtccta 599 <210> 223 <211> 599 <212> DNA <213> Homo sapiens <400> 223 accatgggtg atgggttagg cgcattgcag aggtcttgtg gaggactgga ggagacctgt 60 gggatgcagt tttgcctgta ctttctttca gagctaagct ttctatcagg gataggccta 120 ataggtgaag gggtgtgggg actgatcaga ggaagggcca gaggaaaaga ggggcttcag 180 ggccgacttg gagcttgggc ggcagttcag tggtgtgact cccttcatcg tgtaagagaa 240 gaggctggtg gaggaggagg aggttgaagg tcacttgctt gttttggata cgacctctgy 300 agacatccag gttatgtatt tcctcccccc gggcaggtgg aaatatgaac ctacaagcag 360 ggacttgagt ggcatctgcg gggaggaggt gggaaaagcc acacgtgccc aggagactgg 420 aatgcaggga aaggaccaga agagccagag gtagaattct gggtatatcc atggatacag 480 gaggggtggc agggaaggag aaatttccta gaaaggcgag aagtcctcct tgacatgttc 540 ctgtccataa gaacacatac gcacatgtac gcaccagcag gaagcagaat gctaaccga 599 <210> 224 <211> 599 <212> DNA <213> Homo sapiens <400> 224 gtgtttgcag ggttattctc ggcatgctgt ggggctaggg taagttatcc ggctcctgag 60 ccctgctggg gttctcatct caagggaatt ctgtggtgtg ttactgtgcc ccacatgcaa 120 atatcagcta ctctcaaatg tgttggatgg atgaatagta gaaggtattt taagaagcca 180 caggcctctt tgtaaattaa acaggcatca tacatgggtg ttgataatga tgaatctcac 240 aaaatcttca gatgtttagt ctctgggaac attccaggaa tcctcattta ggtaacttay 300 atgtgatgag acctatttgt tcacttgaaa gaaaacctgt tttgaagtca gaggaatgcg 360 aatagaggct ctcacatggt tggaaaaagc aatctgcagg ccagttacgc cccgtaaaca 420 ggaacccagg actgccctcc tggccagggc tgagttgcag gatggggacc ccccactacc 480 tccaaccgcc cgccaggatg aggagtgctt gctctcagac gtgcccctca ctttaaatat 540 acagaggcct tcctaggcag cctttgattg tgtccttgtg gtgaccttgc cctgcagca 599 <210> 225 <211> 599 <212> DNA <213> Homo sapiens <400> 225 tttctgttac tacctctaat tggcagagtt tcttgccagg tcaatgtgga ggcagagaga 60 tggccggagg gcggccaggg gagtcaggcc aggtgtgggc aggatgggat tctgcctcct 120 cccaggtgcc tcgcctgggg gatgccctgt cccagaaagc ctacattcgt gggagccggc 180 gcacagccct tctgagatct aaagcttccc tctgaatgct gctttggagg attgtgagag 240 gtagtgactc ttcaaagttt gtttgttttc ttgaagcttt tacctctatg caaatatgcr 300 gtttggagca gggaagaaag gttaactgtg atggcgccgg ctcttaacgt ggaatgtcct 360 gaattaatgt gggtttcagt cctctggctc aggatcccct gagggagagt ttttctttcc 420 tctgcaaaac acaggagaaa agtgatccct gtggctccga cctgccttcc ttgggtcctg 480 cggtgcaaaa ccagctggga ccgtgtcccg cccacccgaa ggcagtgtgg ggaacctttc 540 ctccaggtca ttcccattca gctgattgct gccggctccc caggccacaa ctctgtgcc 599 <210> 226 <211> 599 <212> DNA <213> Homo sapiens <400> 226 aggaaatata gctggtgtgc tactctccac tgtactggtc cgattctcgc cagggggaca 60 tctctgtagg cagttcagaa attatttttt ggaagttttt taggctattc cacagataat 120 tctgatccag taggttttat gcaactgtgc aaaatgctta tggtctctat ttttttttcc 180 ttgagagatg attttagcct ttggtttttt gtttgttttt gttttttgag acagagtctt 240 gatctgccac ccaggctgga gtacaatggt gcaattgtac cctcactgca ttgtcaaack 300 tggctcactg taccctcgga ctcctgggct gaaggggtcc tccaacctcc tgagtagctg 360 ggactacagg cctggataat ttttaaaaat atttcgtaga tatggggttt cgccatgttg 420 ctcaggctgg tctccaactc ctggcagcct tggcctccca aagtgctggg attacaagtg 480 tgagccacca cacctgtcct agccttaagt tttgcatttt tttccatctt tttgctgtat 540 cccatatgat ttagagattt ttgctgtatc ccatgagatt tagagatggc tctactttt 599 <210> 227 <211> 599 <212> DNA <213> Homo sapiens <400> 227 tcacaaaacc acagcaatcc aatatgagat gtttttaata tcagacttaa caaataatta 60 catggctatg aaataactgg ggtcgtgttt aaactggaag tgttttgttt aatgttcgta 120 gtttcaataa aatgtatcca ctagtcttcc agtttgcaga ctgttgttta ggtgtttgtt 180 tagccagggt aattgttaaa aactccctct aatctagctt acccttacat ttccatggaa 240 gcgaatttta gtcattaaag gaaaacatgg gaaattgatt tttgggtgcc tggctgttam 300 gctaggtagg aaatatagct ggtgtgctac tctccactgt actggtccga ttctcgccag 360 ggggacatct ctgtaggcag ttcagaaatt attttttgga agttttttag gctattccac 420 agataattct gatccagtag gttttatgca actgtgcaaa atgcttatgg tctctatttt 480 tttttccttg agagatgatt ttagcctttg gttttttgtt tgtttttgtt ttttgagaca 540 gagtcttgat ctgccaccca ggctggagta caatggtgca attgtaccct cactgcatt 599 <210> 228 <211> 599 <212> DNA <213> Homo sapiens <400> 228 tggcgagaat cggaccagta cagtggagag tagcacacca gctatatttc ctacctagct 60 taacagccag gcacccaaaa atcaatttcc catgttttcc tttaatgact aaaattcgct 120 tccatggaaa tgtaagggta agctagatta gagggagttt ttaacaatta ccctggctaa 180 acaaacacct aaacaacagt ctgcaaactg gaagactagt ggatacattt tattgaaact 240 acgaacatta aacaaaacac ttccagttta aacacgaccc cagttatttc atagccatgy 300 aattatttgt taagtctgat attaaaaaca tctcatattg gattgctgtg gttttgtgaa 360 ttctcaccct caactgggtc agaaagactt gaaaggaata aagtctttac ttatggcttg 420 atgcggggcc attggcatag taagtgctct gtcttttaac tggttgaaat aaacagacaa 480 aacagaaaca cacacatata ccccaaattt gaatcagaga gagccagtat aaaatgatac 540 aagtaccagt tctctgggct tgccagattt ctgctctata agtaatatta aacatggct 599 <210> 229 <211> 599 <212> DNA <213> Homo sapiens <400> 229 gacttcaaat atttataatg ttaatcaaca gaatagtact tggcattgag gactgccccc 60 cttcgagtca ataaccatgt tttcactcct ctgctggtgc cctataacaa tgaatgacca 120 aaaggaaatt aacaatgaat gaccaactgg aaaactcata tttaatctga aatattaaaa 180 actaaaatct tctagagatt attttcttaa gtcaattgag tgggcccaac cccactgcta 240 ctatttcaga acgtgtccag aagacaaatg atatatatga tatatgatat gacatatgay 300 atgatacgat attgcacaaa gccaagatga ctaaacataa cctttccctg aggggccaaa 360 agaaaaggac cctctagtgt tagggcccag gcttcttcct ggaacttctc agtcacattt 420 ttctcctatc caatagacat tatctaaact gagcttccaa ataaattagc aaaccaaaaa 480 gtcttacaag ataagacctt ggtgcacaga aggtcaaggt ggaacttact gctaaccaaa 540 gctatagtag ttctaatcat ggagaactga tggacagggg cacaggcacg cacgcacgc 599 <210> 230 <211> 599 <212> DNA <213> Homo sapiens <400> 230 tggtggaaga gtcagaagac ttctgaggac attaatattc aatgactatt aatgaagaga 60 ccctaaagat catcttctta agccctcaga cgacagaaag ggaaactgag gcctgggact 120 tgtatacttt tccaaagcct cttctttgcc aggttttgca ccttcctcta agacatcttt 180 tcttttccat ctcataattc tggatgcaaa tgaactcata gctcatggaa actataaacc 240 cataaaaatg cacaaaagga cattaacaaa atattaccta aaatttccag aacttcatcr 300 acctccttcc tgatccataa gtgcatccac agatcccagg ttgagcaggc ctgcttccaa 360 caatacccac attgttggat gtaaattctt acacaaagac tcactcgggg aacttcgtcc 420 ctttccacga tttcttccct ctgcctcacc tgtccctccc tgcatgtata cacaatttta 480 aacttccttc aagaattaaa tacagtaaaa caaatcctct gggaccattt tacactttat 540 gttgaaataa actcacaata acgctgccct gaaaagccaa aatgaaaaat gacagtttt 599 <210> 231 <211> 599 <212> DNA <213> Homo sapiens <400> 231 ctgaggacat taatattcaa tgactattaa tgaagagacc ctaaagatca tcttcttaag 60 ccctcagacg acagaaaggg aaactgaggc ctgggacttg tatacttttc caaagcctct 120 tctttgccag gttttgcacc ttcctctaag acatcttttc ttttccatct cataattctg 180 gatgcaaatg aactcatagc tcatggaaac tataaaccca taaaaatgca caaaaggaca 240 ttaacaaaat attacctaaa atttccagaa cttcatcgac ctccttcctg atccataagy 300 gcatccacag atcccaggtt gagcaggcct gcttccaaca atacccacat tgttggatgt 360 aaattcttac acaaagactc actcggggaa cttcgtccct ttccacgatt tcttccctct 420 gcctcacctg tccctccctg catgtataca caattttaaa cttccttcaa gaattaaata 480 cagtaaaaca aatcctctgg gaccatttta cactttatgt tgaaataaac tcacaataac 540 gctgccctga aaagccaaaa tgaaaaatga cagtttttcc ctaacctggg ttgctccta 599 <210> 232 <211> 599 <212> DNA <213> Homo sapiens <400> 232 ctccagctcc gagaacctcc aagtatcaca gggcatgcgc cggtgtcaca gctttggaaa 60 tttaattttc aaggtgtaag tccaattacg aggactacat gaggctgaat tattcagctt 120 agcagatttg gaacctctct cccagccctt tggagacaac gtgagccaag cctctacttg 180 gtgctgcact gaaatctgtc atcagtaggg aatattggta gctgagttat ttttcgagtg 240 gtaatccgag aataaaacgg cagatcccag cactcatcgc cacttaatga acctgtttgy 300 ggagagtcca cctggtgcct gcctggcttt aggaacccgc agcagtccga gtggtgtctg 360 gggtaagctg agctgctctg ggaacacatc tcgtgcgtgg ggtgaatgaa cagcacactt 420 acccagtggg gtaggctggg agaggacaga gagcccagcc tccttagctg gatcaggaca 480 gtttaggaag gagggttgcg tccatctgag atgagagttc tgagagacat gggctcccca 540 ggaagacccc aggcacttgt cattgaagga tgaggaccga agcacttatc acctgaagc 599 <210> 233 <211> 599 <212> DNA <213> Homo sapiens <400> 233 tgcacgcaca caccatgtac acacacacac cgtgcataca cacacaccat gcacgcacac 60 acaccgtgta cacacacaca cactgcacac atacttttct tgcttttgct gtgaatcaca 120 ccgtttcacc tgtgctatct ttgaagcaga ggttttcttt attcctcctt tggaaatgat 180 gtggcatatt cttttccctc ctccattttt gtcctcagtc aaagctaaaa ggagcagttt 240 ttatgatgag atttggggag gctccagcag tgttgaaatc ctatgacata acttgaaacm 300 tcgagtgggt acataaaaaa tgtagagttt agagattttt gtattaaagg cctccctgcc 360 acccccagtc ttagaaaatg tggttcattc ctgtggttca cagaatctga agcctgagat 420 tgatgagccc cttcttgtga ttgttttaat cattctctaa agtttgtgca ttttactgta 480 cccttagtca cagagagtac tgagtgaatt taaagttgct tggaatatat taagctttct 540 tggaaaattc tctttccctt ggatcaaatg ggtgaacaga atattaagtt gagtgtcct 599 <210> 234 <211> 599 <212> DNA <213> Homo sapiens <400> 234 gcggcgtacc tggcccggcg cggcgactgc tctccgggct ggcgggggcc ggccgcgagc 60 cccgggggcc ccgaggccgc agcttgcctg cgcgctctga gccttcgcaa ctcgcgagca 120 aagtttggtg gaggcaacgc caagcctgag tcctttcttc ctctcgttcc ccaaatccga 180 gggcagcccg cgggcgtcat gcccgcgctc ctccgcagcc tggggtacgc gtgaagcccg 240 ggaggcttgg cgccggcgaa gacccaagga ccactcttct gcgtttggag ttgctccccv 300 caaccccggg ctcgtcgctt tctccatccc gacccacgcg gggcgcgggg acaacacagg 360 tcgcggagga gcgttgccat tcaaggtaat cgccgcgcaa gacgcctcgg ggagcttcgc 420 cagccgggga cgtgggcgcc acgggagccc gggacgccgg gtgcaccgtc ctccgggcgg 480 ggggcgcgga aggactagca ttgtggagga cgctccgtgt cctccctctg tggctgcata 540 ggtgatgggg gaggtgggtg cgtgctgacg gccggcgttc tggaagttct gcctctgct 599 <210> 235 <211> 599 <212> DNA <213> Homo sapiens <400> 235 aggttatgct acttccctgg aggacctctc aaaaggaagc tgtttgttct atttctttct 60 catctgtccc aggactaggt attgcattag gagatccctt gcttcccact gctgctttta 120 aatcatttca tttccttctt cccttcattc ttcccaaatg caaggtcttt caactttcat 180 ttcgtgctac actctgccct ttattgctgc tctctggaat ttgtggtcac tgtccctcat 240 acactgaaaa ctcacatacc tctacctcta gccctgttgt attcctgatg acttgagcay 300 ccaagggagt gatacataca gcactggtca atcatttctt tacctgccac acatacagca 360 atctttaatt tcaatagcct tagccactca ttcccaaata atgcttggat catgcacatt 420 atcatgagta aatacaccca tgtctgaaat cctgatttca agtacttccc aatttttctg 480 tcttttcttt actttcagct cacagaaaca attcttccac catattaaaa actctaatcc 540 aattcacttg ttccaccact ttttttattc attattctct cctgtcttta ctttcttcc 599 <210> 236 <211> 599 <212> DNA <213> Homo sapiens <400> 236 ctttttgatc ttattttttt ttagattttg aagcatactt agctctttgc agctcagaga 60 ttgttgacct gatgttactt ctgtttgaaa gattcccctc ctcctctccc atttgcttgt 120 tttatttctt aatgttttag cctaaatgtt atgtttaaca gaacttttag ggtgtttaac 180 agacaccctt cctaaaataa atctcgccca cctcatacta ttaacttttt ctacaccagc 240 actttgtttt cttctttata atattgttat aacattgtta taagtgatta tataagatay 300 gtaaacacta tatcaatagt ttattcactt gtcatttatt tttgcatcta gaatgcaaac 360 tccatatggt tagattatac ctgtactaaa ctcatttcct agctggaagt agctgcaaat 420 aagcattttc tttttttgaa tattgaataa aagaattatc ttgcaaagag tgtggagttt 480 tcatcctgaa gtgaagcaac tgtgatgttt gtatctgact atgtgggatt cagtgttgga 540 tgtgtaacct aagggctgct gtttgccacc ccagaagaca agggatagat ggtaactta 599 <210> 237 <211> 599 <212> DNA <213> Homo sapiens <400> 237 actctatatg tgtgcattcc attctgaaat gaattggaat ttaccattct ttagttagac 60 aaggggttaa aggaaagaat atacaacagc ttagccccct gacttggtac tgtcaaaaag 120 aatcagaagt ttttgagagt ggcatgatgt ggccaaagtc cacaatggcg cagaattact 180 tacagtattc caaagtggag taaattacac attcagcatc tgaaagctct tccatggtac 240 cggtttccca aaaccaaaat tactgaaaat ctaaagcacg cctattttac ttgacacacr 300 ctcttcaagg atggccatgg cttgtcccaa tgattcatac ttgtgtataa atatttaaat 360 ggtaagagct tgaagttata taaatagaag tcagctacca catacaaatc acagtgagga 420 aagagaaact tgtaaaaagt gtgacttttg tctattacag aaggagacat cttcaagacg 480 tgaaggatca ccacaatgac ctgtccagca tcttgttcaa tcagacctct ccttaaaaga 540 acttagcctc tgaatagcca aggcaatcct aagcaaaaat aacaaagctg ggggcatca 599 1

Claims (49)

  1. 개인으로부터 수득된 핵산 시료 또는 개인으로부터 유래된 유전형 데이터세트(genotype dataset)에서 하나 이상의 다형성 마커의 하나 이상의 대립인자의 존재 여부를 결정하는 단계를 포함하는, 개인에서 유방암에 대한 감수성을 결정하는 방법으로서, 상기 하나 이상의 다형성 마커는 rs10941679(서열번호 236), rs4415084(서열번호 235), 및 rs1219648(서열번호 237), 및 이들과 연관 불균형(linkage disequilibrium)인 마커들로부터 선택되고, 상기 하나 이상의 대립인자의 존재는 상기 개인의 유방암에 대한 감수성을 나타내는 것인 방법.
  2. 제1항에 있어서, 상기 하나 이상의 다형성 마커는 표 12, 표 13 및 표 14에 표시된 마커들로부터 선택되는 것인 방법.
  3. 제1항 또는 제2항에 있어서, 상기 하나 이상의 다형성 마커는 rs10941679(서열번호 236), rs4415084(서열번호 235), 및 rs1219648(서열번호 237)로부터 선택되는 것인 방법.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 개인에서 하나 이상의 일배체형의 빈도를 평가하는 단계를 더 포함하는 것인 방법.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 하나 이상의 대립인자 또는 일배체형의 존재에 의해 부여된 감수성은 증가된 감수성인 것인 방법.
  6. 제6항에 있어서, rs4415084 (서열번호 235)의 대립인자 T, rs10941679(서열번호 236)의 대립인자 G 및/또는 rs1219648(서열번호 237)의 대립인자 G의 존재는 상기 개인에서 유방암의 증가된 감수성을 나타내는 것인 방법.
  7. 제5항 또는 제6항에 있어서, 상기 하나 이상의 대립인자 또는 일배체형의 존재는 1.15 이상의 상대적 위험도(relative risk, RR) 또는 오즈비(odds ratio, OR)를 갖는, 유방암에 대한 증가된 감수성을 나타내는 것인 방법.
  8. 제5항 또는 제6항에 있어서, 상기 하나 이상의 대립인자 또는 일배체형의 존재는 1.17 이상, 1.18 이상, 1.19 이상, 1.20 이상, 1.21 이상, 1.22 이상, 1.23 이상, 1.24 이상, 1.25 이상, 1.26 이상, 1.27 이상, 1.28 이상, 1.29 이상 및 1.30 이상을 포함하는, 1.16 이상의 상대적 위험도(RR) 또는 오즈비(OR)을 갖는 증가된 감수성을 나타내는 것인 방법.
  9. 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 하나 이상의 대립인자 또는 일배체형의 존재에 의해 부여된 감수성은 감소된 감수성인 것인 방법.
  10. 제1항 내지 제9항 중 어느 한 항에 있어서, 표 12, 표 13 및 표 14에 표시된 마커들 중 하나와 연관 불균형이 아닌, 유방암에 대한 하나 이상의 위험 변이의 하나 이상의 위험 대립인자가 개인으로부터 수득된 게놈 DNA를 포함하는 시료 또는 개인으로부터 유래된 유전형 데이터세트에 존재하는지 여부를 결정하는 단계를 더 포함하는 것인 방법.
  11. 제1항 내지 제9항 중 어느 한 항에 있어서, 두개 이상의 다형성 마커 각각에서 하나 이상의 대립인자가 개인으로부터 수득된 게놈 DNA를 포함하는 시료 또는 개인으로부터 유래된 유전형 데이터세트에 존재하는지 여부를 결정하는 단계를 포함하고, 상기 두개 이상의 다형성 마커에서 상기 하나 이상의 대립인자의 존재는 유방암에 대한 증가된 감수성을 나타내는 것인 방법.
  12. 제1항 내지 제11항 중 어느 한 항에 있어서, 상기 개인으로부터 수득된 핵산 시료 또는 상기 개인으로부터 유래된 유전형 데이터세트에서 유방암에 대한 하나 이상의 고 침투성 유전적 인자(high penetrant genetic factor)의 존재 또는 부재를 결정하는 단계를 더 포함하는 것인 방법.
  13. 제12항에 있어서, 상기 고 침투성 유전적 인자는 BRCA1, BRCA2, TP53 및/또는 PTEN 중의 돌연변이인 것인 방법.
  14. 제1항 내지 제13항 중 어느 한 항에 있어서, 상기 개인의 위험도 평가, 진단, 또는 예후의 판단을 수행하기 위해 비-유전적 정보(non-genetic information)를 분석하는 단계를 더 포함하는 것인 방법.
  15. 제14항에 있어서, 상기 비-유전적 정보는 연령, 성별, 민족, 사회경제적 지위, 과거 질병 진단, 개인의 병력(medical history), 유방암의 가족력(family history), 생화학적 척도, 및 임상적 척도로부터 선택되는 것인 방법.
  16. 제11항 내지 제15항 중 어느 한 항에 있어서, 통합 위험도(combined risk)를 계산하는 단계를 더 포함하는 것인 방법.
  17. 개인으로부터 수득된 핵산 시료 또는 개인으로부터 유래된 유전형 데이터세트에서 하나 이상의 다형성 마커의 하나 이상의 대립인자가 존재하는지 여부를 결정하는 단계를 포함하는, 이전에 유방암으로 진단되었던 개인에서 하나 이상의 이차 원발성 종양(second primary tumor)을 발병할 위험도를 결정하는 방법으로서, 상기 하나 이상의 다형성 마커는 rs10941679(서열번호 236), rs4415084(서열번호 235), 및 rs1219648(서열번호 237) 및 이들과 연관 불균형인 마커들로부터 선택되고,
    상기 하나 이상의 대립인자의 존재는 하나 이상의 이차 원발성 종양을 발병할 위험도를 나타내는 것인 방법.
  18. 제17항에 있어서, 상기 하나 이상의 다형성 마커는 표 12, 표 13 및 표 14에 표시된 마커들로부터 선택되는 것인 방법.
  19. 개인에서 유방암에 대한 감수성을 평가하기 위한 키트로서, 상기 키트는 상기 개인의 게놈에서 하나 이상의 다형성 마커의 하나 이상의 대립인자를 선택적으로 검출하는 시약을 포함하고, 상기 다형성 마커는 rs10941679(서열번호 236), rs4415084(서열번호 235), 및 rs1219648(서열번호 237), 및 이들과 연관 불균형인 마커들로부터 선택되고, 상기 하나 이상의 대립인자의 존재는 유방암에 대한 감수성을 나타내는 것인 키트.
  20. 제19항에 있어서, 상기 하나 이상의 다형성 마커는 표 12, 표 13 및 표 14에 표시된 마커들로부터 선택되는 것인 키트.
  21. 제19항 또는 제20항에 있어서, 상기 시약은 상기 하나 이상의 다형성 마커를 포함하는 상기 개인의 게놈의 단편에 혼성화하는 하나 이상의 연속된(contiguous) 올리고뉴클레오티드, 완충액 및 검출가능한 표지를 포함하는 것인 키트.
  22. 제19항 내지 제21항 중 어느 한 항에 있어서, 상기 시약은 상기 개인으로부터 수득된 게놈 핵산 세그먼트의 반대쪽 가닥에 혼성화하는 한 쌍 이상의 올리고뉴 클레오티드를 포함하고, 상기 각 올리고뉴클레오티드 프라이머 쌍은 하나의 다형성 마커를 포함하는 상기 개인의 게놈의 단편을 선택적으로 증폭시키도록 설계되고, 상기 단편은 크기가 30 bp 이상인 것인 키트.
  23. 제20항 또는 제21항에 있어서, 상기 하나 이상의 올리고뉴클레오티드는 상기 개인의 게놈에 완전히 상보적인 것인 키트.
  24. 제19항 내지 제23항 중 어느 한 항에 있어서, 상기 키트는:
    a. 길이가 5 내지 100개의 뉴클레오티드로 구성된 검출 올리고뉴클레오티드 프로브;
    b. 길이가 5 내지 100개의 뉴클레오티드로 구성된 인핸서 올리고뉴클레오티드 프로브; 및
    c. 엔도뉴클레아제 효소;를 포함하고,
    상기 검출 올리고뉴클레오티드 프로브는 서열번호 1 내지 서열번호 237 중 하나로 표시된 뉴클레오티드 서열의 핵산의 제1 세그먼트에 특이적으로 혼성화되고; 및
    상기 검출 올리고뉴클레오티드 프로브는 3' 말단에 검출가능한 표지를 포함하고 5' 말단에 퀀칭 모이어티(quenching moiety)를 포함하며;
    상기 인핸서 올리고뉴클레오티드는 길이가 5개 내지 100개의 뉴클레오티드로 구성되고, 상기 올리고뉴클레오티드 프로브의 5'에 배열된 상기 뉴클레오티드 서열 의 제2 세그먼트에 상보적이어서, 상기 인핸서 올리고뉴클레오티드는 상기 두개의 올리고뉴클레오티드가 모두 상기 핵산에 혼성화되는 경우 상기 검출 올리고뉴클레오티드에 대해 3'에 위치하며; 및
    상기 제1 세그먼트와 상기 제2 세그먼트 간에 단일 염기 갭이 존재하여, 상기 올리고뉴클레오티드 프로브와 상기 인핸서 올리고뉴클레오티드 프로브가 모두 상기 핵산에 혼성화되는 경우, 상기 올리고뉴클레오티드 간에 단일 염기 갭이 존재하며; 및
    상기 핵산을 상기 엔도뉴클레아제에 의해 처리하는 단계는 상기 검출 프로브가 상기 핵산에 혼성화된 경우, 상기 검출 프로브의 3'말단으로부터 상기 검출가능한 표지를 절단하여 유리 상태의 검출가능한 표지를 방출시키는 것인 키트.
  25. 개인에서 유방암에 대한 유전적 지표(genetic indicator)를 결정하는 장치로서,
    컴퓨터 판독가능한 메모리; 및
    상기 컴퓨터 판독가능한 메모리 상에 저장된 루틴(routine)을 포함하고,
    상기 루틴은 rs10941679(서열번호 236), rs4415084(서열번호 235), 및 rs1219648(서열번호 237), 및 이들과 연관 불균형인 마커들로부터 선택되는 하나 이상의 다형성 마커에 대해 하나 이상의 개인의 마커 및/또는 일배체형 정보를 분석하고, 상기 마커 또는 일배체형 정보에 기반한 결과물(output)을 생성하기 위해 프로세서 상에서 실행되도록 개조되고, 상기 결과물은 상기 개인의 유방암의 유전 적 지표로서 상기 하나 이상의 마커 또는 일배체형의 개별적인 위험도 척도(risk measure)를 포함하는 것인 장치.
  26. 제25항에 있어서, 상기 루틴은 상기 하나 이상의 마커 대립인자 및/또는 일배체형과 연관된 유방암의 위험도 척도를 더 포함하고, 상기 위험도 척도는 유방암으로 진단된 복수의 개인에서 하나 이상의 다형성 마커의 하나 이상의 대립인자 및/또는 하나 이상의 일배체형의 빈도의 지표와 복수의 기준(reference) 개인에서 상기 하나 이상의 다형성 마커의 하나 이상의 대립인자 및/또는 일배체형의 빈도의 지표의 비교에 기반하며, 상기 개인의 개별적인 위험도는 상기 하나 이상의 마커 대립인자 및/또는 일배체형에 대한 상기 개인의 보인자 상태(carrier status)와 상기 하나 이상의 마커 대립인자 및/또는 일배체형에 대한 위험도 척도의 비교에 기반하는 것인 장치.
  27. 제25항 또는 제26항에 있어서, 상기 하나 이상의 다형성 마커는 표 12, 표 13 및 표 14에 표시된 마커들로부터 선택되는 것인 장치.
  28. 유방암에 대한 감수성을 평가하기 위해 이용될 마커를 확인하는 방법으로서, 상기 방법은
    a. rs10941679(서열번호 236), rs4415084(서열번호 235), 및 rs1219648(서열번호 237) 중 하나 이상과 연관 불균형인 하나 이상의 다형성 마커를 확인하는 단 계,
    b. 유방암으로 진단되거나 또는 유방암에 대한 감수성을 갖는 개인의 시료의 유전형 상태(genotype status)를 결정하는 단계, 및
    c. 대조군 개인의 시료의 유전형 상태를 결정하는 단계를 포함하고,
    상기 대조군 시료에서의 하나 이상의 다형성의 하나 이상의 대립인자의 빈도 대비, 유방암으로 진단되거나, 또는 유방암에 대한 감수성을 갖는 개인에서 상기 하나 이상의 대립인자의 빈도의 유의성 있는 차이는 상기 하나 이상의 다형성이 유방암에 대한 감수성을 평가하기 위해 유용하다는 것을 나타내는 것인 방법.
  29. 제28항에 있어서, 상기 대조군 시료에서의 상기 하나 이상의 다형성의 하나 이상의 대립인자의 빈도 대비, 유방암으로 진단되거나, 또는 유방암에 대한 감수성을 갖는 개인에서 상기 하나 이상의 대립인자의 빈도의 증가는 상기 하나 이상의 다형성이 유방암에 대한 증가된 감수성을 평가하기 위해 유용하다는 것을 나타내는 것인 방법.
  30. 제28항 또는 제29항에 있어서, 상기 대조군 시료에서의 상기 하나 이상의 다형성의 하나 이상의 대립인자의 빈도 대비, 유방암으로 진단되거나, 또는 유방암에 대한 감수성을 갖는 개인에서 상기 하나 이상의 대립인자의 빈도의 감소는 상기 하나 이상의 다형성이 유방암에 대한 감소된 감수성 또는 보호를 평가하기 위해 유용하다는 것을 나타내는 것인 방법.
  31. 개인으로부터 수득된 핵산 시료에서 하나 이상의 다형성 마커의 하나 이상의 대립인자가 존재하는 지 여부를 결정하는 단계를 포함하는, 개인으로부터 수득된 핵산 시료의 유전형을 분석하는 방법으로서, 상기 하나 이상의 마커는 rs10941679(서열번호 236), rs4415084(서열번호 235), 및 rs1219648(서열번호 237), 및 이들과 연관 불균형인 마커들로 구성된 군으로부터 선택되고, 상기 시료 중의 상기 하나 이상의 대립인자의 존재는 상기 개인의 유방암에 대한 감수성을 나타내는 것인 방법.
  32. 제31항에 있어서, rs4415084(서열번호 235)의 대립인자 T, rs10941679(서열번호 236)의 대립인자 G 및/또는 rs1219648(서열번호 237)의 대립인자 G의 존재의 결정은 상기 개인에서 유방암에 대한 증가된 감수성을 나타내는 것인 방법.
  33. 제31항 또는 제32항에 있어서, 유전형 분석은 상기 하나 이상의 다형성 마커를 플랭킹(flanking)하는 뉴클레오티드 프라이머 쌍을 이용한 중합효소 연쇄 반응(PCR)에 의해, 상기 하나 이상의 다형성 마커를 포함하는 핵산의 세그먼트를 증폭시키는 단계를 포함하는 것인 방법.
  34. 제31항 내지 제33항 중 어느 한 항에 있어서, 유전형 분석은 대립인자-특이적 프로브 혼성화, 대립인자-특이적 프라이머 연장(primer extension), 대립인자- 특이적 증폭, 핵산 서열결정(nucleic acid sequencing), 5'-엑소뉴클레아제 처리(exonuclease digestion), 분자 표지 분석법(molecular beacon assay), 올리고뉴클레오티드 라이게이션 분석법(oligonucleotide ligation assay), 크기 분석, 단일 가닥 구조 분석(single-stranded conformation analysis) 및 마이크로어레이 기술로부터 선택된 방법을 이용하여 수행되는 것인 방법.
  35. 제34항에 있어서, 상기 방법은 대립인자-특이적 프로브 혼성화를 포함하는 것인 방법.
  36. 제34항에 있어서, 상기 방법은 마이크로어레이 기술인 것인 방법.
  37. 제31항 내지 제35항 중 어느 한 항에 있어서,
    1) 상기 핵산의 카피를 검출 올리고뉴클레오티드 프로브 및 인핸서 올리고뉴클레오티드 프로브와, 상기 올리고뉴클레오티드 프로브와 상기 핵산 간의 특이적 혼성화 조건 하에 접촉시키는 단계로서,
    a) 상기 검출 올리고뉴클레오티드 프로브는 길이가 5 내지 100개의 뉴클레오티드로 구성되고 서열번호 1 내지 서열번호 237 중 하나에 의해 주어진 뉴클레오티드 서열을 갖는 핵산의 제1 세그먼트에 특이적으로 혼성화되고,
    b) 상기 검출 올리고뉴클레오티드 프로브는 3' 말단의 검출가능한 표지 및 5' 말단의 퀀칭 모이어티(quenching moiety)를 포함하며,
    c) 상기 인핸서 올리고뉴클레오티드는 길이가 5 내지 100개의 뉴클레오티드로 구성되고 상기 올리고뉴클레오티드 프로브의 5'에 배열된 상기 뉴클레오티드 서열의 제2 세그먼트에 상보적이어서, 상기 두개의 올리고뉴클레오티드가 모두 상기 핵산에 혼성화되는 경우 상기 인핸서 올리고뉴클레오티드는 상기 검출 올리고뉴클레오티드에 대해 3'에 위치하며, 및
    d) 상기 제1 세그먼트와 상기 제2 세그먼트 간에 단일 염기 갭(single base gap)이 존재하여, 상기 올리고뉴클레오티드 프로브와 상기 인핸서 올리고뉴클레오티드 프로브가 모두 상기 핵산에 혼성화되는 경우, 상기 올리고뉴클레오티드 간에 단일 염기 갭이 존재하는 것인 단계,
    2) 상기 검출 프로브가 상기 핵산에 혼성화되는 경우, 상기 검출 프로브의 3' 말단으로부터 상기 검출가능한 표지를 절단하여 유리된 검출가능한 표지를 방출시키는 엔도뉴클레아제로 상기 핵산을 처리하는 단계, 및
    3) 유리된 검출가능한 표지를 측정하는 단계로서, 상기 유리된 검출가능한 표지의 존재는 상기 검출 프로브가 상기 핵산의 제1 세그먼트에 특이적으로 혼성화되고, 상기 다형성 부위의 서열이 상기 검출 프로브의 상보체(complement)라는 것을 나타내는 것인 단계를 포함하는 것인 방법.
  38. 유방암 치료제에 대한 반응의 확률에 대해 개인을 평가하는 방법으로서, 상기 개인으로부터 수득된 핵산 시료, 또는 상기 개인으로부터 유래된 유전형 데이터 세트에서 하나 이상의 다형성 마커의 하나 이상의 대립인자가 존재하는지 여부를 결정하는 단계를 포함하고, 상기 하나 이상의 다형성 마커는 rs10941679(서열번호 236), rs4415084(서열번호 235), 및 rs1219648(서열번호 237), 및 이들과 연관 불균형인 마커들로 구성된 군으로부터 선택되고, 상기 하나 이상의 마커의 상기 하나 이상의 대립인자의 존재는 상기 치료제에 대한 양성 반응의 확률을 나타내는 것인 방법.
  39. 유방암으로 진단된 개인의 예후(prognosis)를 예측하는 방법으로서, 상기 방법은 상기 개인으로부터 수득된 핵산 시료, 또는 상기 개인으로부터 유래된 유전형 데이터세트에서 하나 이상의 다형성 마커의 하나 이상의 대립인자가 존재하는지 여부를 결정하는 단계를 포함하고, 상기 하나 이상의 다형성 마커는 rs10941679(서열번호 236), rs4415084(서열번호 235), 및 rs1219648(서열번호 237) 및 이들과 연관 불균형인 마커들로부터 선택되고, 상기 하나 이상의 대립인자의 존재는 상기 개인에서 유방암의 악화된 예후를 나타내는 것인 방법.
  40. 유방암의 치료를 받는 개인의 치료의 진행을 모니터링하는 방법으로서, 상기 방법은 상기 개인으로부터 수득된 핵산 시료, 또는 상기 개인으로부터 유래된 유전형 데이터세트에서 하나 이상의 다형성 마커의 하나 이상의 대립인자가 존재하는지 여부를 결정하는 단계를 포함하고, 상기 하나 이상의 다형성 마커는 rs10941679(서열번호 236), rs4415084(서열번호 235), 및 rs1219648(서열번호 237), 및 이들과 연관 불균형인 마커들로부터 선택되고, 상기 하나 이상의 대립인자의 존재가 상기 개인의 치료 결과를 나타내는 것인 방법.
  41. 제38항 내지 제40항 중 어느 한 항에 있어서, 상기 하나 이상의 다형성 마커는 표 12, 표 13 및 표 14에 표시된 마커들로부터 선택되는 것인 방법.
  42. 개인에서 유방암에 대한 감수성을 진단 및/또는 평가하기 위한 시약의 제조에서 올리고뉴클레오티드 프로브의 용도로서, 상기 프로브는 서열번호 1 내지 서열번호 237 중 하나로 표시된 뉴클레오티드 서열을 갖는 핵산의 세그먼트에 혼성화되고, 상기 프로브는 길이가 15 내지 500개의 뉴클레오티드로 구성되는 것인 용도.
  43. a. 하나 이상의 다형성 마커에 대한 식별자(identifier);
    b. 유방암으로 진단된 복수의 개인에서 상기 하나 이상의 다형성 마커의 하나 이상의 대립인자의 빈도의 지표(indicator); 및
    c. 복수의 기준 개인(reference individual)에서 상기 하나 이상의 다형성 마커의 상기 하나 이상의 대립인자의 빈도의 지표;가 저장되고,
    상기 하나 이상의 다형성 마커는 rs10941679(서열번호 236), rs4415084(서열번호 235), 및 rs1219648(서열번호 237) 및 이들과 연관 불균형인 다형성 마커들로부터 선택되는 것인 컴퓨터-판독가능한 매체(computer-readable medium).
  44. 제43항에 있어서, 상기 다형성 마커는 표 12, 표 13 및 표 14에 표시된 마커 들로부터 선택되는 것인 매체.
  45. 제43항 또는 제44항에 있어서, 상기 복수의 개인들의 선조에 대한 정보를 더 포함하는 것인 매체.
  46. 제1항 내지 제45항 중 어느 한 항에 있어서, 상기 하나 이상의 대립인자의 존재는 에스트로겐 수용체 양성 유방암 또는 프로게스테론 수용체 양성 유방암을 예측하는 것인 방법, 키트, 용도, 매체 또는 장치.
  47. 제1항 내지 제46항 중 어느 한 항에 있어서, 마커들 간의 연관 불균형은 연관 불균형 척도 r2 및/또는 |D'|의 특정한 수치값을 특징으로 하는 것인 방법, 키트, 용도, 매체 또는 장치.
  48. 제1항 내지 제47항 중 어느 한 항에 있어서, 마커들 간의 연관 불균형은 0.2 이상의 r2 값을 특징으로 하는 것인 방법, 키트, 용도, 매체 또는 장치.
  49. 제1항 내지 제48항 중 어느 한 항에 있어서, 상기 개인은 유럽계 선조를 포함하는 선조로부터 유래된 것인 방법, 키트, 용도, 매체 또는 장치.
KR1020097026476A 2007-05-25 2008-05-21 유방암의 위험도 평가, 진단, 예후 및 치료용 마커인 염색체 5p12 및 염색체 10q26 상의 유전적 변이 KR20100017865A (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
IS8647 2007-05-25
IS8647 2007-05-25
IS8700 2007-12-21
IS8700 2007-12-21

Publications (1)

Publication Number Publication Date
KR20100017865A true KR20100017865A (ko) 2010-02-16

Family

ID=39661451

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020097026476A KR20100017865A (ko) 2007-05-25 2008-05-21 유방암의 위험도 평가, 진단, 예후 및 치료용 마커인 염색체 5p12 및 염색체 10q26 상의 유전적 변이

Country Status (12)

Country Link
US (2) US8580501B2 (ko)
EP (2) EP2164984A2 (ko)
JP (1) JP2010527603A (ko)
KR (1) KR20100017865A (ko)
CN (1) CN101772578A (ko)
AU (1) AU2008256219B2 (ko)
CA (1) CA2688312A1 (ko)
EA (1) EA018444B1 (ko)
IL (1) IL202292A0 (ko)
MX (1) MX2009012722A (ko)
NZ (1) NZ581858A (ko)
WO (1) WO2008146309A2 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014171800A1 (ko) * 2013-04-19 2014-10-23 주식회사 젠큐릭스 조기 유방암 예후 예측 진단용 자동화 시스템
KR101985864B1 (ko) * 2017-12-28 2019-06-05 주식회사 엔젠바이오 유방암 및 난소암 등 암 진단용 조성물 및 이의 용도

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101542677B1 (ko) 2005-11-29 2015-08-06 캠브리지 엔터프라이즈 리미티드 유방암에 대한 마커
KR20100017865A (ko) * 2007-05-25 2010-02-16 디코드 제네틱스 이에이치에프 유방암의 위험도 평가, 진단, 예후 및 치료용 마커인 염색체 5p12 및 염색체 10q26 상의 유전적 변이
AU2009269542A1 (en) 2008-07-07 2010-01-14 Decode Genetics Ehf Genetic variants for breast cancer risk assessment
GB2466025A (en) * 2008-12-08 2010-06-09 Univ Francois Rabelais De Tour C3/ITGAM polymorphisms and cancer prognosis
EP2438193B1 (en) * 2009-06-01 2015-07-22 Genetic Technologies Limited Methods for breast cancer risk assessment
WO2011006214A1 (en) * 2009-07-16 2011-01-20 Peter Maccallum Cancer Institute Method of detecting radiation exposure and adverse toxicity thereto
US20110151457A1 (en) * 2009-12-22 2011-06-23 Elitech Holding B.V. Hypertheromostable endonuclease iv substrate probe
WO2011095999A1 (en) * 2010-02-05 2011-08-11 Decode Genetics Ehf Genetic variants for predicting risk of breast cancer
JP6420543B2 (ja) * 2011-01-19 2018-11-07 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. ゲノムデータ処理方法
EP2721180A4 (en) * 2011-06-16 2015-09-02 Decode Genetics Ehf GENETIC VARIANTS FOR PREDICTING THE RISK OF BREAST CANCER
US11261494B2 (en) 2012-06-21 2022-03-01 The Chinese University Of Hong Kong Method of measuring a fractional concentration of tumor DNA
WO2014160876A2 (en) * 2013-03-27 2014-10-02 Memorial Sloan-Kettering Cancer Center Brca2-specific modifier locus related to breast cancer risk
WO2015035415A1 (en) 2013-09-09 2015-03-12 Nantomics, Llc Method of detecting suceptibility to breast cancer through mutations in the fgfr3 and tp53 genes
CN103966310A (zh) * 2014-01-27 2014-08-06 广州市体育科学研究所 乳腺癌易感基因快速检测试剂盒及检测方法
CN104232774A (zh) * 2014-09-17 2014-12-24 湖北维达健基因技术有限公司 用于检测乳腺癌易感基因snp的引物、荧光探针及应用
CN107002138B (zh) 2014-09-30 2022-06-14 基因技术有限公司 用于评估发展乳腺癌风险的方法
CN114381455A (zh) * 2014-12-16 2022-04-22 加文医学研究所 测序对照
WO2016127944A1 (en) 2015-02-10 2016-08-18 The Chinese University Of Hong Kong Detecting mutations for cancer screening and fetal analysis
CN106295241A (zh) * 2015-06-25 2017-01-04 杭州圣庭生物技术有限公司 基于brca1和brca2突变的乳腺癌患病风险评估算法
TW202332776A (zh) 2015-07-23 2023-08-16 香港中文大學 游離dna(cell-free dna)之片段化模式分析
CN105586427B (zh) * 2016-03-10 2020-06-19 厦门艾德生物医药科技股份有限公司 检测人类brca1和brca2基因突变的引物、试剂盒及方法
CN107723350A (zh) * 2016-08-12 2018-02-23 嘉兴允英医学检验有限公司 一种遗传性乳腺癌突变基因高通量筛查方法
SG11201906397UA (en) 2017-01-25 2019-08-27 Univ Hong Kong Chinese Diagnostic applications using nucleic acid fragments
CN107254546B (zh) * 2017-08-16 2020-11-03 复旦大学附属华山医院 一种与乳腺癌新辅助化疗疗效相关的snp标志物及其应用
CN107254545B (zh) * 2017-08-16 2020-09-15 复旦大学附属华山医院北院 一种与乳腺癌化疗毒性相关的snp标志物及其应用
CN107729241B (zh) * 2017-10-12 2020-11-03 中国矿业大学 一种基于变异体分组的软件变异测试数据进化生成方法
CN109913550A (zh) * 2019-03-21 2019-06-21 吉林省银丰生物工程技术有限公司 乳腺癌新辅助化疗效果预测基因试剂盒
RU2702755C1 (ru) * 2019-06-24 2019-10-11 Федеральное государственное бюджетное научное учреждение "Федеральный исследовательский центр фундаментальной и трансляционной медицины" (ФИЦ ФТМ) Способ молекулярно-генетической диагностики наследственных форм рака молочной железы
CN110358834B (zh) * 2019-07-12 2023-05-16 深圳大学 一种lncRNA的应用以及试剂盒和药物
CN112837749B (zh) * 2021-02-01 2021-11-26 北京百奥纳芯生物科技有限公司 一种癌症筛查用基因芯片探针的优选方法

Family Cites Families (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4376110A (en) 1980-08-04 1983-03-08 Hybritech, Incorporated Immunometric assays using monoclonal antibodies
GB8810400D0 (en) 1988-05-03 1988-06-08 Southern E Analysing polynucleotide sequences
US6054270A (en) 1988-05-03 2000-04-25 Oxford Gene Technology Limited Analying polynucleotide sequences
US5700637A (en) 1988-05-03 1997-12-23 Isis Innovation Limited Apparatus and method for analyzing polynucleotide sequences and method of generating oligonucleotide arrays
ATE151110T1 (de) 1988-09-02 1997-04-15 Protein Eng Corp Herstellung und auswahl von rekombinantproteinen mit verschiedenen bindestellen
US5223409A (en) 1988-09-02 1993-06-29 Protein Engineering Corp. Directed evolution of novel binding proteins
US5750373A (en) 1990-12-03 1998-05-12 Genentech, Inc. Enrichment method for variant proteins having altered binding properties, M13 phagemids, and growth hormone variants
US5744101A (en) 1989-06-07 1998-04-28 Affymax Technologies N.V. Photolabile nucleoside protecting groups
US5143854A (en) 1989-06-07 1992-09-01 Affymax Technologies N.V. Large scale photolithographic solid phase synthesis of polypeptides and receptor binding screening thereof
US5288644A (en) 1990-04-04 1994-02-22 The Rockefeller University Instrument and method for the sequencing of genome
US5427908A (en) 1990-05-01 1995-06-27 Affymax Technologies N.V. Recombinant library screening methods
GB9015198D0 (en) 1990-07-10 1990-08-29 Brien Caroline J O Binding substance
ES2139598T3 (es) 1990-07-10 2000-02-16 Medical Res Council Procedimientos para la produccion de miembros de parejas de union especifica.
EP1046421B8 (en) 1990-12-06 2006-01-11 Affymetrix, Inc. (a Delaware Corporation) Methods and reagents for very large scale immobilized polymer synthesis
JP4146512B2 (ja) 1991-03-01 2008-09-10 ダイアックス コープ. 小型タンパク質
DK1471142T3 (da) 1991-04-10 2009-03-09 Scripps Research Inst Heterodimere receptor-biblioteker under anvendelse af fagemider
DE4122599C2 (de) 1991-07-08 1993-11-11 Deutsches Krebsforsch Phagemid zum Screenen von Antikörpern
JP2001507921A (ja) 1992-04-27 2001-06-19 トラスティーズ オブ ダートマス カレッジ 生物学的液体中の遺伝子配列の検出
US6287850B1 (en) 1995-06-07 2001-09-11 Affymetrix, Inc. Bioarray chip reaction apparatus and its manufacture
EP0695941B1 (en) 1994-06-08 2002-07-31 Affymetrix, Inc. Method and apparatus for packaging a chip
US6300063B1 (en) 1995-11-29 2001-10-09 Affymetrix, Inc. Polymorphism detection
AU730633B2 (en) 1996-05-29 2001-03-08 Phillip Belgrader Detection of nucleic acid sequence differences using coupled ligase detection and polymerase chain reactions
US6429027B1 (en) 1998-12-28 2002-08-06 Illumina, Inc. Composite arrays utilizing microspheres
IL163645A0 (en) * 2002-02-21 2005-12-18 Idgene Pharmaceuticals Ltd Association of snps in the comt locus and neighboring loci with schizophrenia, bipolar disorder, breast cancer and colorectal cancer
AU2003276973A1 (en) * 2002-09-25 2004-04-19 Amersham Biosciences (Sv) Corp. Detection methods
WO2004047514A2 (en) * 2002-11-25 2004-06-10 Sequenom, Inc. Methods for identifying risk of breast cancer and treatments thereof
KR101138862B1 (ko) * 2005-02-14 2012-05-14 삼성전자주식회사 단일염기 다형을 포함하는 유방암과 관련된 폴리뉴클레오티드, 그를 포함하는 마이크로어레이 및 진단 키트 및 그를이용한 유방암 진단 방법
KR101206028B1 (ko) * 2005-03-05 2012-11-28 삼성전자주식회사 유방암 특이적 다형성 서열을 이용한 유방암의 진단방법,유방암 특이적인 폴리뉴클레오티드 및 상기 폴리뉴클레오티드가 고정되어 있는 마이크로어레이
US7858303B2 (en) * 2005-03-14 2010-12-28 Wisconsin Alumni Research Foundation Method of analyzing breast cancer susceptibility and resistance
JP5227167B2 (ja) * 2005-05-18 2013-07-03 デコード・ジェネティクス・イーエイチエフ Chr8q24.21での変異体は癌のリスクを与える
US20070092900A1 (en) * 2005-10-26 2007-04-26 Stacey Simon N Methods for diagnosing and characterizing breast cancer and susceptibility to breast cancer
KR20100017865A (ko) * 2007-05-25 2010-02-16 디코드 제네틱스 이에이치에프 유방암의 위험도 평가, 진단, 예후 및 치료용 마커인 염색체 5p12 및 염색체 10q26 상의 유전적 변이

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014171800A1 (ko) * 2013-04-19 2014-10-23 주식회사 젠큐릭스 조기 유방암 예후 예측 진단용 자동화 시스템
KR101985864B1 (ko) * 2017-12-28 2019-06-05 주식회사 엔젠바이오 유방암 및 난소암 등 암 진단용 조성물 및 이의 용도

Also Published As

Publication number Publication date
WO2008146309A3 (en) 2009-01-22
EA018444B1 (ru) 2013-08-30
CN101772578A (zh) 2010-07-07
CA2688312A1 (en) 2008-12-04
NZ581858A (en) 2012-07-27
MX2009012722A (es) 2009-12-11
AU2008256219A1 (en) 2008-12-04
WO2008146309A2 (en) 2008-12-04
IL202292A0 (en) 2010-06-16
AU2008256219B2 (en) 2014-06-05
EP2164984A2 (en) 2010-03-24
EP2535425A1 (en) 2012-12-19
JP2010527603A (ja) 2010-08-19
US20140179546A1 (en) 2014-06-26
US20110015081A1 (en) 2011-01-20
EA200971079A1 (ru) 2010-06-30
US8580501B2 (en) 2013-11-12

Similar Documents

Publication Publication Date Title
KR20100017865A (ko) 유방암의 위험도 평가, 진단, 예후 및 치료용 마커인 염색체 5p12 및 염색체 10q26 상의 유전적 변이
KR101582321B1 (ko) 심장성 부정맥의 위험 관리를 위한 유전적 마커
AU2019201577B2 (en) Cancer diagnostics using biomarkers
DK2471954T3 (en) Susceptibility genetic variants associated with cardiovascular diseases
CN101874120B (zh) 作为用于乳腺癌风险评估、诊断、预后和治疗的标记的chr2和chr16的遗传性变型
KR101374304B1 (ko) 타입 2 당뇨병의 위험에 대한 진단 마커인 tcf7l2유전자의 유전적 변이체
KR102023584B1 (ko) 위장관췌장 신경내분비 신생물 (GEP-NENs)의 예측 방법
DK2414543T3 (en) Genetic markers for risk management of atrial fibrillation and stroke
CN101641451A (zh) chr8q24.21上的癌症易感性变体
KR20110081807A (ko) 갑상선암의 위험도 평가를 위해 유용한 유전적 변이
KR20110036608A (ko) 유방암 위험도 평가를 위한 유전적 변이
KR20140044341A (ko) 암에 대한 분자적 진단 검사
KR20150090246A (ko) 암을 위한 분자 진단 테스트
CN102317470A (zh) 促进***癌风险的遗传性变型
KR20160117606A (ko) 항-혈관형성 약물에 대한 반응 및 암의 예후를 예측하기 위한 분자적 진단 시험
KR20140006898A (ko) 결장암 유전자 발현 시그니처 및 이용 방법
KR20100037592A (ko) 낙설 증후군 및 녹내장의 진단, 예후 및 치료용 마커인 염색체 15q24 상의 유전적 변이
KR20140140069A (ko) 전반적 발달장애의 진단 및 치료용 조성물 및 그 진단 및 치료 방법
US20230390280A1 (en) Biomarkers for the diagnosis and treatment of fibrotic lung disease
KR102481305B1 (ko) 유전자에 기반한 염증성 장 질환의 진단
KR20090087486A (ko) 타입 2 당뇨병의 유전적 감수성 변이
KR20200081380A (ko) 유전적 조절
CN101631876A (zh) 2型糖尿病的遗传易感性变体
CA2497597A1 (en) Methods for identifying subjects at risk of melanoma and treatments
DK2707497T3 (en) DETECTION OF THE BRACHYSPINA MUTATION

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application