KR20220008175A - 전립선암 환자의 예후 진단 및 치료 전략 결정용 병리등급 특이적 마커 - Google Patents
전립선암 환자의 예후 진단 및 치료 전략 결정용 병리등급 특이적 마커 Download PDFInfo
- Publication number
- KR20220008175A KR20220008175A KR1020200086444A KR20200086444A KR20220008175A KR 20220008175 A KR20220008175 A KR 20220008175A KR 1020200086444 A KR1020200086444 A KR 1020200086444A KR 20200086444 A KR20200086444 A KR 20200086444A KR 20220008175 A KR20220008175 A KR 20220008175A
- Authority
- KR
- South Korea
- Prior art keywords
- mutation
- prostate cancer
- amino acid
- seq
- acid sequence
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/118—Prognosis of disease development
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/158—Expression markers
Abstract
본 발명은 전립선암 환자의 병리등급에 따른 전립선암 치료 효과의 차이 또는 예후 진단용 마커에 관한 것으로, 본 발명의 유전자의 돌연변이와 특정 병리등급의 전립선암 환자의 생존율 또는 재발율이 각각 연관성이 있으므로, 병리등급에 기초하여 전립선암의 치료 효과의 차이 또는 전립선암 환자의 예후를 예측하는데 본 발명의 돌연변이된 유전자를 마커로서 사용할 수 있다.
Description
본 발명은 전립선암 환자의 예후 진단용 마커, 이를 포함하는 전립선암 환자의 예후 진단용 키트, 및 전립선암 환자의 예후 진단용 마커를 이용하여 전립선암의 예후 진단 및 치료 전략 결정을 위해 필요한 정보를 제공하는 방법에 관한 것이다.
전립선은 남성의 생식 기관 중 하나로서, 정액을 구성하는 액체 성분의 일부를 만들어 분비하는 신체 기관이다. 중엽 및 두 개의 측엽으로 구성되어 있으며, 일부분은 선조직으로 이루어져 있고, 일부분은 근섬유로 이루어져 요도를 둘러싼다. 전립선이 커지게 되면 요도가 좁아져 오줌이 통과하기 힘들게 되며, 이러한 전립선 비대증은 중년 남성에게 흔히 나타나는 질환이다. 또한 같은 증상으로 전립선암이 발견되기도 한다.
전립선암은 전립선 내 발생하는 악성종양으로, 연령, 인종 및 가족력이 가장 중요한 원인으로 여겨지며, 호르몬, 식이습관 및 화학 약품 등도 발병에 중요한 요인으로 작용하는 것으로 알려져 있다. 2019년 중앙암등록본부 자료에 따르면 전립선 암은 전체 암 발생의 7위를 차지했고, 남성에게 발생하는 암 중 4위를 차지하며 국내 발병률이 증가하고 있다.
전립선 암의 진단은 직장수지 검사, 혈중 전립선 특이항원 (PSA)검사, 경직장 초음파 검사, 영상 진단법 등을 시행한 후 모든 소견을 종합하여 판정한다. 전립선 암 초기에는 암이 주변부로 퍼지지 않아 치료가 효과적이나 진행 후에는 난치병이 되므로 조기 진단이 매우 중요하다.
전립선 암의 치료 방법으로는 관찰 요법, 근치적 수술, 방사선 치료, 호르몬 치료 및 항암화학요법 등이 있으며, 병기, 종양의 분화도, 환자의 나이 및 건강 상태 등 관련 요소를 두루 고려하여 결정한다. 전립선 암이 국소암 단계에서 진단될 경우 완치율이 높으나, 병기가 진행된 뒤 발견되는 경우 완치율이 크게 떨어지게 된다. 완치가 되더라도 치료 후 추적검사에서 혈중 전립선특이항원 (PSA)의 수치가 증가할 경우 전립선 암의 생화학적 재발로 판명되며, 보통 국소적 전립선암의 근치적 치료 후 첫 5년 안에 30%에서 나타나고 8년 후 임상적 재발이 일어난다. 다만 생화학적 재발이 반드시 임상적 재발로 이어지는 것은 아니며, 임상적 재발이 발생하더라도 그 시기가 매우 다양하다. 또한 국소적 전립선 암에 대한 근치적 치료 후의 임상 경과에 대해 명확히 밝혀진 바가 없어, 생화학적 재발에 대응하는 치료 방침도 정립된 바가 없다.
전립선 암 환자의 병리등급은 이후 치료 방법의 선택에 영향을 미치게 된다. 전립선암의 진단을 위한 여러 바이오마커가 개시되어 있으나 (등록특허 제 10-1778036호), 현재까지 전립선암 환자의 예후까지 측정할 수 있는 마커, 특히 전립선암에서 발견되는 유전자 변이와 환자의 생존률 및 병리 등급과의 연관성에 대해서는 아직까지 연구가 이루어지지 않은 실정이다.
전립선암 환자에 대한 적합한 치료적 전략을 적용하기 위해서는, 전립선암 환자의 예후를 예측하고 및 치료 전략 결정을 도와주는 마커의 개발이 필요하다.
본 발명은 전립선암 환자의 병리등급에 기반하여, 전립선암 환자의 예후 진단 및 치료 전략 결정에 도움을 주는 마커를 제공하는 것을 과제로 한다.
상기의 목적을 달성하기 위하여, 본 발명의 일 측면은 ALMS1, NRXN3, NTRK1 및 TRIOBP를 암호화하는 유전자의 돌연변이를 검출할 수 있는 제제를 포함하는, 전립선암 환자의 병리등급에 따른 치료 효과 예측 또는 예후 진단용 조성물을 제공한다.
본 발명의 다른 측면은, 상기 조성물을 포함하는 전립선암환자의 병리등급에 따른 치료 효과 예측 또는 예후 진단용 키트를 제공한다.
본 발명의 또 다른 측면은, 병리등급을 알고 있는 전립선암 환자의 샘플로부터 시료 DNA를 준비하는 단계;
상기 시료 DNA를 상기 키트를 이용하여 증폭하는 단계;
증폭 결과로부터 병리등급 특이적 마커의 유무를 확인하는 단계;
병리등급 특이적 마커가 확인된 전립선암 환자에 임의의 전립선암 치료 후보 물질을 처리하거나, 임의의 방법으로 치료하는 단계; 및
임의의 전립선암 치료 후보 물질 또는 임의의 치료 방법이 전립선암을 개선하거나, 치료할 경우 병리등급 특이적 마커가 확인된 전립선암 환자의 병리등급군에 적합한 치료 후보 물질 또는 치료 방법으로 채택하는 단계;를 포함하는 전립선암 환자의 병리등급에 따른 전립선암 치료 효과의 차이를 판정하기 위해 필요한 정보를 제공하는 방법을 제공한다.
본 발명의 또 다른 측면은 전립선암 환자의 샘플로부터 시료 DNA를 준비하는 단계;
상기 시료 DNA를 상기 키트를 이용하여 증폭하는 단계; 및
상기 증폭 결과로부터 병리등급 특이적 마커의 유무를 확인하는 단계;를 포함하는 전립선암 환자의 병리등급에 따른 전립선암의 예후 진단을 위해 필요한 정보를 제공하는 방법을 제공한다.
본 발명에서 발굴한 돌연변이 유전자인, ALMS1, NRXN3, NTRK1 및 TRIOBP를 암호화하는 유전자의 돌연변이 또는 상기 돌연변이 유전자에 더해 COL22A1, FHOD3, MYH11, ACY3, C8orf74, CPT1A, DDX39A, FBXL4, ICAM1, KIFAP3, IPO4, NAT2, NFIX, PLIN4, SCRIB, SHC4, SOD3, STRN3, TP53 및 ZNF24로 구성된 유전자 군에서 선택되는 적어도 하나의 유전자의 돌연변이와 전립선암 환자의 병리등급이 연관성이 있으므로, 상기 유전자의 돌연변이 여부를 확인함으로써 전립선암 환자의 병리등급에 따른 전립선암 치료 효과의 차이 및 생존률 차이를 예측할 수 있다.
아울러, 본 발명에서 발굴한 돌연변이 유전자인 ALMS1, NRXN3, NTRK1 및 TRIOBP를 암호화하는 유전자의 돌연변이 또는 상기 돌연변이 유전자에 더해 COL22A1, FHOD3, MYH11, ACY3, C8orf74, CPT1A, DDX39A, FBXL4, ICAM1, KIFAP3, IPO4, NAT2, NFIX, PLIN4, SCRIB, SHC4, SOD3, STRN3, TP53 및 ZNF24로 구성된 유전자 군에서 선택되는 하나의 유전자의 돌연변이와, 특정 병리등급의 전립선암 환자의 생존율, 또는 상기 유전자의 변이와 전립선암의 재발율이 각각 연관성이 있으므로, 전립선암 환자의 예후를 예측하는데 본 발명의 유전자들의 돌연변이를 마커로서 사용할 수 있다.
다만, 본 발명의 효과는 상기에서 언급한 효과로 제한되지 아니하며, 언급되지 않은 또 다른 효과들은 하기의 기재로부터 본 기술 분야의 통상의 기술자에게 명확히 이해될 수 있을 것이다.
도 1은 본 발명에 이용된 491개의 데이터를 병리등급으로 분류한 환자 수 및 백분율을 나타낸다.
도 2는 stage Ⅱ, Ⅲ 및 Ⅳ의 병리등급 간 비교분석을 통해 확인된 52개의 병리등급 특이적 돌연변이 유전자이다.
도 3은 stage Ⅱ 및 Ⅲ + Ⅳ의 병리등급 간 비교분석을 통해 확인된 27개의 병리등급 특이적 돌연변이 유전자이다.
도 4는 stage Ⅱ + Ⅲ 및 Ⅳ의 병리등급 간 비교분석을 통해 확인된 80개의 병리등급 특이적 돌연변이 유전자이다.
도 5 내지 도 28은 병리등급 특이적 및 생존 특이적인 각각의 유전자에 대하여, 해당 유전자에 돌연변이가 있는 전립선암 환자 (적색)와 해당 유전자에 돌연변이가 없는 전립선암 환자 (청색)의 총 생존율 또는 무병 생존율에 관한 그래프이다.
도 2는 stage Ⅱ, Ⅲ 및 Ⅳ의 병리등급 간 비교분석을 통해 확인된 52개의 병리등급 특이적 돌연변이 유전자이다.
도 3은 stage Ⅱ 및 Ⅲ + Ⅳ의 병리등급 간 비교분석을 통해 확인된 27개의 병리등급 특이적 돌연변이 유전자이다.
도 4는 stage Ⅱ + Ⅲ 및 Ⅳ의 병리등급 간 비교분석을 통해 확인된 80개의 병리등급 특이적 돌연변이 유전자이다.
도 5 내지 도 28은 병리등급 특이적 및 생존 특이적인 각각의 유전자에 대하여, 해당 유전자에 돌연변이가 있는 전립선암 환자 (적색)와 해당 유전자에 돌연변이가 없는 전립선암 환자 (청색)의 총 생존율 또는 무병 생존율에 관한 그래프이다.
본 발명자들은 전립선암 환자의 병리등급 차이에 기반하여 전립선암의 감별 진단, 치료전략 결정 또는 예후 판정을 위한 병리등급 특이적 마커를 발굴하기 위하여, The Cancer Genome Atlas (TCGA)에 보고된 Prostate adenocarcinoma (PRAD) 데이터를 이용한 기계학습을 시행하였다. 그 결과 전립선암에 대한 병리등급 특이적 돌연변이 유전자와 생존 특이적 돌연변이 유전자를 각각 발견하였고, 이를 통해 24개의 전립선암 병리등급 특이적 및 생존 특이적 마커를 발굴하였다.
이하, 본 발명을 상세히 설명한다.
1. 전립선암 환자에서 병리등급 특이적 돌연변이 유전자
본 발명의 일 측면은 ALMS1, NRXN3, NTRK1 및 TRIOBP를 암호화하는 유전자의 돌연변이를 검출할 수 있는 제제를 포함하는, 전립선암 환자의 병리등급에 따른 치료 효과 예측 또는 예후 진단용 조성물을 제공하는 것이다.
본 발명의 한 실시예에서, 상기 진단용 조성물은 COL22A1, FHOD3, MYH11, ACY3, C8orf74, CPT1A, DDX39A, FBXL4, ICAM1, KIFAP3, IPO4, NAT2, NFIX, PLIN4, SCRIB, SHC4, SOD3, STRN3, TP53 및 ZNF24 로 이루어진 군으로부터 선택되는 적어도 하나를 암호화하는 유전자의 돌연변이를 검출할 수 있는 제제를 더 포함하는, 전립선암 환자의 병리등급에 따른 치료 효과 예측 또는 예후 진단용 조성물일 수 있다.
본 발명의 다른 실시예에서, 상기 ALMS1를 암호화하는 유전자의 돌연변이는 서열번호 1의 아미노산 서열에서, T196A, P1387L, T2308M, A1618V 및 A1157V로 이루어진 군으로부터 선택되는 적어도 하나의 미스센스 돌연변이거나, Y2936*인 넌센스 돌연변이거나, R4154Efs*40인 프레임 시프트 삽입(frame shift insert, FS ins) 돌연변이고;
상기 NRXN3를 암호화하는 유전자의 돌연변이는 서열번호 2의 아미노산 서열에서, L309I, A228S, R654H, R654C, D166Y, A85T, D308A 및 F23I로 이루어진 군으로부터 선택되는 적어도 하나의 미스센스 돌연변이고;
상기 NTRK1을 암호화하는 유전자의 돌연변이는 서열번호 3의 아미노산 서열에서, R342Q, R507C, P63S, P695S, G714S, A612V, R574H 및 R599H로 이루어진 군으로부터 선택되는 적어도 하나의 미스센스 돌연변이거나, Q730_L731del인인-프레임 결실(in-frame delete, IF del) 돌연변이고;
상기 TRIOBP을 암호화하는 유전자의 돌연변이는 서열번호 4의 아미노산 서열에서, P1125L, S1252F, R2259H 및 Q702R로 이루어진 군으로부터 선택되는 적어도 하나의 미스센스 돌연변이거나, Q2245*, Q350*, R1554* 및 R448*로 이루어진 군으로부터 선택되는 적어도 하나의 넌센스 돌연변이인; 전립선암 환자의 병리등급에 따른 치료 효과 예측 또는 예후 진단용 조성물일 수 있다.
본 발명의 또 다른 실시예에서, 상기 COL22A1을 암호화하는 유전자의 돌연변이는 서열번호 5의 아미노산 서열에서, N1115D, R210W, T117M, G490D, L1427M 및 D1133G로 이루어진 군으로부터 선택되는 적어도 하나의 미스센스 돌연변이거나, R592*인 넌센스 돌연변이거나, K529Rfs*21 (diploid) 및 K529Rfs*21 (amp) 중 적어도 하나의 프레임 시프트 결실(frame shift delete, FS del) 돌연변이고;
상기 FHOD3을 암호화하는 유전자의 돌연변이는 서열번호 6의 아미노산 서열에서, T1328P, R188H,G120R, A1330T 및 A1051T로이루어진 군으로부터 선택되는 적어도 하나의 미스센스 돌연변이거나, R461Afs*31인 프레임 시프트 결실(frame shift delete, FS del) 돌연변이고;
상기 MYH11을 암호화하는 유전자의 돌연변이는 서열번호 7의 아미노산 서열에서, A815T, E1888K, T975M, A732V, A1259V 및 A334V로 이루어진 군으로부터 선택되는 적어도 하나의 미스센스 돌연변이거나, R1609*인 넌센스 돌연변이고;
상기 ACY3을 암호화하는 유전자의 돌연변이는 서열번호 8의 아미노산 서열에서R233C인 미스센스 돌연변이고;
상기 C8orf74을 암호화하는 유전자의 돌연변이는 서열번호 9의 아미노산 서열에서, A273T인 미스센스 돌연변이고;
상기 CPT1A을 암호화하는 유전자의 돌연변이는 서열번호 10의 아미노산 서열에서, A577V인 미스센스 돌연변이고;
상기 DDX39A을 암호화하는 유전자의 돌연변이는 서열번호 11의 아미노산 서열에서A96V인 미스센스 돌연변이고;
상기 FBXL4을 암호화하는 유전자의 돌연변이는 서열번호 12의 아미노산 서열에서, D550A인 미스센스 돌연변이고;
상기 ICAM1을 암호화하는 유전자의 돌연변이는 서열번호 13의 아미노산 서열에서, P63L인 미스센스 돌연변이고;
상기 KIFAP3을 암호화하는 유전자의 돌연변이는 서열번호 14의 아미노산 서열에서, Q492*인 넌센스돌연변이고;
상기 IPO4을 암호화하는 유전자의 돌연변이는 서열번호 15의 아미노산 서열에서, R916*인넌센스 돌연변이고;
상기 NAT2을 암호화하는 유전자의 돌연변이는 서열번호 16의 아미노산 서열에서, L52F인 미스센스 돌연변이고;
상기 NFIX을 암호화하는 유전자의 돌연변이는 서열번호 17의 아미노산 서열에서, R343H인 미스센스 돌연변이고;
상기 PLIN4을 암호화하는 유전자의 돌연변이는 서열번호 18의 아미노산 서열에서, A646T인 미스센스 돌연변이고;
상기 SCRIB을 암호화하는 유전자의 돌연변이는 서열번호 19의 아미노산 서열에서, P422S인 미스센스 돌연변이고;
상기 SHC4을 암호화하는 유전자의 돌연변이는 서열번호 20의 아미노산 서열에서, P80L인 미스센스 돌연변이고;
상기 SOD3을 암호화하는 유전자의 돌연변이는 서열번호 21의 아미노산 서열에서, D54N인 미스센스 돌연변이고;
상기 STRN3을 암호화하는 유전자의 돌연변이는 서열번호 22의 아미노산 서열에서, L206I 및 L792I 중 적어도 하나인 미스센스 돌연변이고;
상기 TP53을 암호화하는 유전자의 돌연변이는 서열번호 23의 아미노산 서열에서, R273C, R248Q, E285K, R282W, R248W, R175H, G245D, H193R, M237I, G245S, C135F, C135Y, C135W, V157F, R181C, Y163H, V173M, N239D, R337C, R249G, C176R, C141G, E271V, H193N, G266V, G279E, P177R, G199V, T256I, A74T 및 P82L로 이루어진 군으로부터 선택되는 적어도 하나의 미스센스 돌연변이거나, R342* 및 E298* 중 적어도 하나인 넌센스 돌연변이거나, Q165Hfs*17 및 C124Wfs*25중 적어도 하나인 프레임 시프트 삽입(frame shift insert, FS ins) 돌연변이거나, A86Vfs*55, R209Kfs*6, V203Wfs*44, K319Rfs*26, S90Ffs*53, S149Pfs*21 및 Q144Gfs*24로 이루어진 군으로부터 선택되는 적어도 하나의프레임 시프트 결실(frame shift delete, FS del) 돌연변이거나, X126_splice, X307_splice, X33_splice, X331_splice, X126_splice 및 X126_splice로 이루어진 군으로부터 선택되는 적어도 하나의스플라이스 돌연변이고;
상기 ZNF24를 암호화하는 유전자의 돌연변이는 서열번호 24의 아미노산 서열에서, Y344C인 미스센스돌연변이인; 전립선암 환자의 병리등급에 따른 치료 효과 예측 또는 예후 진단용 조성물일 수 있다.
상기 유전자들의 Gene bank accession number는 각각 ALMS1 (Gene bank accession number : NM_015120.4), NRXN3 (Gene bank accession number : NM_001272020.2), NTRK1 (Gene bank accession number : NM_002529.3), TRIOBP (Gene bank accession number : NM_001039141.3), COL22A1 (Gene bank accession number : NM_152888.3), FHOD3 (Gene bank accession number : NM_001281739.3), MYH11 (Gene bank accession number : NM_002474.3), ACY3 (Gene bank accession number : NM_080658.2), C8orf74 (Gene bank accession number : NM_001040032.2), CPT1A (Gene bank accession number : NM_001876.4), DDX39A (Gene bank accession number : NM_005804.4), FBXL4 (Gene bank accession number : NM_001278716.2), ICAM1 (Gene bank accession number : NM_000201.3), KIFAP3 (Gene bank accession number : NM_014970.4), IPO4 (Gene bank accession number : NM_024658.4), NAT2 (Gene bank accession number : NM_000015.3), NFIX (Gene bank accession number : NM_001365902.2), PLIN4 (Gene bank accession number : NM_001080400.1), SCRIB (Gene bank accession number : NM_015356.5), SHC4 (Gene bank accession number : NM_203349.4), SOD3 (Gene bank accession number : NM_003102.3), STRN3 (Gene bank accession number : NM_001083893.2), TP53 (Gene bank accession number : NM_000546.5) 및 ZNF24 (Gene bank accession number : NM_006965.4)일 수 있다.
상기 유전자들의 약어의 전체 명칭은 각각 ALMS1 (ALMS1 centrosome and basal body associated protein), NRXN3 (neurexin 3), NTRK1 (neurotrophic receptor tyrosine kinase 1), TRIOBP (TRIO and F-actin binding protein), COL22A1 (collagen type XXII alpha 1 chain), FHOD3 (formin homology 2 domain containing 3), MYH11 (myosin heavy chain 11), ACY3 (aminoacylase 3), C8orf74 (chromosome 8 open reading frame 74), CPT1A (carnitine palmitoyltransferase 1A), DDX39A (DExD-box helicase 39A), FBXL4 (F-box and leucine rich repeat protein 4), ICAM1 (intercellular adhesion molecule 1), KIFAP3 (kinesin associated protein 3), IPO4 (Homo sapiens importin 4), NAT2 (N-acetyltransferase 2), NFIX (nuclear factor I X), PLIN4 (perilipin 4), SCRIB (scribble planar cell polarity protein), SHC4(SHC adaptor protein 4), SOD3(superoxide dismutase 3), STRN3(striatin 3), TP53(tumor protein p53) 및 ZNF24(zinc finger protein 24)일 수 있다.
본 발명의 또 다른 실시예에서, 상기 제제는 상기 유전자의 돌연변이에 대한 프라이머 세트, 프로브 또는 항체를 포함하는 것인, 전립선암 환자의 병리등급에 따른 치료 효과 예측 또는 예후 진단용 조성물일 수 있다.
본 발명에서 용어, '진단'은 병리 상태의 존재 또는 특징을 확인하는 것으로서, 본 발명의 목적상, 암 환자의 전이 여부에 따른 암 치료 효과의 차이를 확인하는 것뿐만 아니라 암의 치료 후 해당 개체의 재발, 약물 반응성, 내성 등과 같은 여부를 판단하는 것을 의미한다. 바람직하게 본 발명의 유전자의 돌연변이를 이용하는 경우, 전립선암 환자의 시료로부터 돌연변이 여부를 확인함으로써 해당 전립선암 환자의 병리등급에 따른 전립선암 치료 효과의 차이 및 향후 해당 환자의 예후를 알 수 있는 생존률 차이에 대해서도 예측이 가능하다.
본 발명에서 용어 '예후'란 암과 같은 신생물 질환의 예를 들어 재발, 전이성 확산 및 약물 내성을 비롯한 암-기인성 사망 또는 진행의 가능성 등의 병의 경과 및 완치 여부를 의미한다. 본 발명의 목적상 전립선암의 예후를 예측하는 것일 수 있으며, 바람직하게는 전립선암 환자의 무병생존율 또는 생존율을 예측하는 것이다.
본 발명에서 용어 '암'은 이상 세포의 조절되지 않는 성장을 특징으로 하는 질환 부류의 임의의 일원을 포함한다. 상기 용어는, 악성, 양성, 연조직 또는 고형 중 어느 것으로 특징지어지든, 모든 알려진 암 및 신생물 상태, 및 전이 전/후의 암을 포함하는 모든 시기 및 등급의 암을 포함한다.
본 발명에서 용어 '유전자' 및 이의 변형물은 폴리펩티드 사슬 생성에 관여한 DNA 조각을 포함하며; 이는 코딩 부위 이전 및 이후의 부위, 예를 들면 프로모터 및 3'-미번역 부위를 각각 포함할 뿐 아니라, 개별적인 코딩 단편(엑손) 사이의 개입 서열(인트론)을 포함한다.
상기 유전자의 돌연변이는 임의의 하나 이상의 돌연변이를 포함할 수 있고, 예를 들면, 절단형(truncating) 돌연변이, 미스센스(missense) 돌연변이(또는 과오 돌연변이), 넌센스(nonsense) 돌연변이, 프레임 시프트(frame shift) 돌연변이, 인프레임(in-frame) 돌연변이 (또는 해독틀내 돌연변이), 스플라이스 돌연변이 및 스플라이스 사이트(splice_region) 돌연변이로 이루어진 군으로부터 선택되는 적어도 하나의 돌연변이를 가질 수 있다. 상기 프레임 시프트 돌연변이는 프레임 시프트 삽입(frame shift insert, FS ins) 돌연변이 및 프레임 시프트 결실 돌연변이(frame shift delete, FS del) 중 적어도 하나일 수 있다. 상기 인-프레임 돌연변이는 인-프레임 삽입(in-frame insertion, IF ins) 돌연변이 및 인-프레임 결실(in-frame delete, IF del) 돌연변이 중 적어도 하나일 수 있다.
본 발명에서 '미스센스 돌연변이'는 DNA 염기 서열 중 한 개의 염기가 다른 염기로 치환되어 아미노산의 코돈이 다른 코돈으로 바뀌게 하는 돌연변이를 의미한다.
본 발명에서 용어 ‘넌센스 돌연변이’는 유전자의 특정 염기서열의 일부가 정지코돈으로 전환되어 더 이상 단백질의 합성이 이루어지지 않는 돌연변이를 의미한다.
본 발명에서 용어 ‘프레임 시프트 삽입’은 DNA에 하나 또는 그 이상의 뉴클레오타이드가 부가되어 유전 암호의 해독틀이 이동하여 어긋나 일어나는 돌연변이를 의미한다.
본 발명에서 용어 ‘프레임 시프트 결실’은 DNA에 하나 또는 그 이상의 뉴클레오타이드가 결실되어 유전 암호의 해독틀이 이동하여 어긋나 일어나는 돌연변이를 의미한다.
본 발명에서 용어 ‘인-프레임 결실’은 유전자의 특정 염기서열의 결실이 일어났으나 결실된 염기서열에 의한 아미노산을 제외한 나머지 아미노산의 변화가 없는 돌연변이를 의미한다.
본 발명에서 용어 ‘스플라이스 돌연변이’는 유전자의 특정 위치의 뉴클레오티드가 치환된 유전자 돌연변이를 의미한다.
폴리펩티드 서열에서의 돌연변이와 관련하여 용어 "X#Y"는 본 기술 분야에서 자명하게 인식되는 것으로, 여기서 "#"은 폴리펩티드의 아미노산 번호와 관련하여 돌연변이 위치를 나타내고, "X"는 야생형 아미노산 서열의 그 위치에서 발견되는 아미노산을 나타내며, "Y"는 그 위치에서의 돌연변이체 아미노산을 나타낸다. 예를 들어, BAZ2B 폴리펩티드와 관련하여 표기 "G1717V"는 야생형 BAZ2B 서열의 아미노산 번호 1717에는 글리신이 존재하고, 글리신이 돌연변이체 BAZ2B 서열에서 발린으로 대체되었음을 나타낸다.
폴리펩티드 서열에서의 돌연변이와 관련하여 용어 "*"는 본 기술 분야에서 자명하게 인식되는 것으로 여기서 “*”는 1개 및 3개의 아미노산 코드에서 번역 정지 코돈을 나타내는데 사용될 수 있고, 예를 들어, 넌센스 돌연변이에서 *는 해당 아미노산 위치에서의 아미노산 합성이 종료된 것을 나타낸다.
폴리펩티드 서열에서의 돌연변이와 관련하여 용어 "_"는 본 기술 분야에서 자명하게 인식되는 것으로 여기서 “_”는 범위를 나타내며 예를 들어 A200_C240라고 사용된 경우에는 해당 폴리펩티드의 200번 아미노산 서열의 알라닌(Alanine)부터 240번 아미노산 서열에 위치한 시스테인(Cystein) 까지의 범위를 나타낸다.
폴리펩티드 서열에서의 돌연변이와 관련하여 용어 “del”은 본 기술분야에서 자명하게 인식되는 것으로 여기서“del”은 결실을 나타내며, 예를 들어 V7del라고 사용된 경우에는 특정 서열에서 7번째 위치한 발린(Valine)의 결실을 의미하며, V76_S79del라고 사용된 경우에는 특정 서열에서 76번에 위치한 발린부터 79번에 위치한 세린(Serine)까지의 결실이 일어난 돌연변이를 의미한다.
폴리펩티드 서열에서의 돌연변이와 관련하여 용어 “ins”는 본 기술분야에서 자명하게 인식되는 것으로 여기서“ins”는 삽입을 나타내며, 예를 들어 V76_S77insV라고 사용된 경우에는 특정 서열에서 76번에 위치한 발린부터 77번에 위치한 세린(Serine) 사이에 발린의 삽입이 일어난 돌연변이를 의미한다.
폴리펩티드 서열에서의 돌연변이와 관련하여 용어 “fs”는 본 기술분야에서 자명하게 인식되는 것으로 여기서“fs”는 프레임 쉬프트를 나타내며, 예를 들어 V97SfsTer23 또는 V97Sfs*23라고 사용된 경우에는 특정 서열에서 97번째 위치한 발린이 세린으로 바뀌고 그로부터 23번뒤의 위치(120번째 아미노산 서열)에서 종결코돈(Termination, Ter)이 있다는 것을 나타내며, V76_S79*?라고 사용된 경우에는 특정 서열에서 97번째 위치한 발린이 세린으로 바뀌었지만, 새로운 종결코돈이 나타나지 않은 돌연변이를 의미한다.
상기 유전자의 돌연변이를 이용하여 전립선암의 예후를 진단하기 위한 분석 방법으로 차세대 염기서열분석법(next generation sequencing, NGS), RT-PCR, 직접 핵산 서열분석 방법, 마이크로 어레이가 사용될 수 있으며, 본 발명의 유전자의 돌연변이를 이용하여 돌연변이의 존재를 확인할 수 있는 방법이라면 제한없이 적용할 수 있다.
한 실시 양태에서, 돌연변이의 존재는 엄격한 조건 하에 각 유전자의 돌연변이의 폴리뉴클레오티드에 혼성화하는 항-(각 유전자의 돌연변이) 항체 또는 핵산 프로브를 사용하여 결정된다.
또 다른 실시양태에서, 항체 또는 핵산 프로브는 검출 가능하게 표지된다. 또 다른 실시양태에서, 표지는 면역형광 표지, 화학발광 표지, 인광 표지, 효소 표지, 방사성 표지, 아비딘/비오틴, 콜로이드성 금 입자, 착색 입자 및 자기입자로 이루어진 군으로부터 선택된다.
또 다른 실시양태에서, 돌연변이의 존재는 방사성면역 검정, 웨스턴블롯 검정, 면역형광 검정, 효소면역 검정, 면역침전 검정, 화학발광 검정, 면역조직화학 검정, 도트 블롯 검정, 슬롯 블롯 검정 또는 유동세포측정 검정에 의해 결정된다.
또 다른 실시양태에서, 돌연변이의 존재는 RT-PCR에 의해 결정된다. 또 다른 실시양태에서, 돌연변이의 존재는 핵산 서열분석에 의해 결정된다.
본 발명에서 용어 '폴리뉴클레오티드'는 일반적으로 비변형된 RNA 또는 DNA 또는 변형된 RNA 또는 DNA일 수 있는 임의의 폴리리보뉴클레오티드 또는 폴리데옥시리보뉴클레오티드를 지칭한다. 따라서, 예를 들어 본원에 정의된 바와 같은 폴리뉴클레오티드는 비제한적으로 단일- 및 이중-가닥 DNA, 단일- 및 이중-가닥 영역을 포함하는 DNA, 단일- 및 이중-가닥 RNA, 및 단일- 및 이중-가닥영역을 포함하는 RNA, 단일-가닥 또는 보다 전형적으로는 이중-가닥일 수도 있거나 또는 단일- 및 이중-가닥 영역을 포함할 수 있는 DNA 및 RNA를 포함하는 하이브리드 분자를 포함한다. 따라서, 안정성 또는 다른 이유로 인해 변형된 백본을 갖는 DNA 또는 RNA는 본원에서 의도된 용어와 같은 '폴리뉴클레오티드'이다. 또한, 이노신과 같은 비통상적 염기 또는 삼중수소화 염기와 같은 변형된 염기를 포함하는 DNA 또는 RNA가 본원에 정의된 바와 같은 용어 '폴리뉴클레오티드'에 포함된다. 일반적으로, 용어 '폴리뉴클레오티드'는 비변형된 폴리뉴클레오티드의 모든 화학적으로, 효소적으로 및/또는 대사적으로 변형된 형태를 포함한다. 폴리뉴클레오티드는 시험관내 재조합 DNA-매개 기술을 비롯한 다양한 방법에 의해, 그리고 세포 및 유기체 내의 DNA의 발현에 의해 제조될 수 있다.
본 발명의 다른 측면은, 상기 조성물을 포함하는, 전립선암 환자의 병리등급에 따른 치료 효과 예측 또는 예후 진단용 키트를 제공하는 것이다.
상기와 같이 제작된 본 발명의 키트는 기존의 일반적인 유전자의 돌연변이 검색 방법에 비하여 시간과 비용이 절감되어 매우 경제적이다. SSCP (Single Strand Conformational Polymorphism), PTT (Protein Truncation Test), 클로닝 (cloning), 직접 염기서열 분석 (direct sequencing) 등과 같은 기존의 유전자 돌연변이 검색 방법을 이용하여 한 유전자를 모두 검사하려면 평균적으로 수일 내지 수개월이 소요된다. 또한, 차세대 염기서열 분석법 (next generation sequencing: NGS)을 통해서도 빠르고 간단하게 유전자 돌연변이를 정밀하게 검사할 수 있다. 돌연변이를 SSCP, 클로닝, 직접 염기 서열 분석, RFLP (Restriction Fragment Length Polymorphism) 등의 기존 분석방법에 의해 검사하는 경우 검사 완료까지 약 한달 가량이 소요되는 반면, 본 발명의 키트를 이용하면 시료 DNA가 준비되어 있을 경우 약 10 내지 11시간 내에 결과를 얻을 수 있고, 칩 하나에 돌연변이를 검출할 수 있는 프라이머 세트가 함께 집적되어 있기 때문에 기존의 방법에 비해 시간뿐만 아니라 비용까지 절감할 수 있다. 기존의 방법에 비해 매 실험 당 평균 절반 이하의 시약비가 소모되므로 연구자의 인건비까지 감안하였을 때 더욱 큰 비용의 절감 효과를 기대할 수 있게 된다.
2. 생존 특이적 돌연변이 유전자를 이용한 전립선암의 예후 진단을 위해 필요한 정보를 제공하는 방법
본 발명의 다른 측면은 병리등급을 알고 있는 전립선암 환자의 샘플로부터 시료 DNA를 준비하는 단계; 상기 시료 DNA를 상기 키트를 이용하여 증폭하는 단계; 증폭 결과로부터 병리등급 특이적 마커의 유무를 확인하는 단계; 병리등급 특이적 마커가 확인된 전립선암 환자에 임의의 전립선암 치료 후보 물질을 처리하거나, 임의의 방법으로 치료하는 단계; 및 임의의 전립선암 치료 후보 물질 또는 임의의 치료 방법이 전립선암을 개선하거나, 치료할 경우 병리등급 특이적 마커가 확인된 전립선암 환자에 적합한 치료 후보 물질 또는 치료 방법으로 채택하는 단계;를 포함하는 전립선암 환자의 병리등급에 따른 암 치료 효과의 차이를 판정하기 위해 필요한 정보를 제공하는 방법을 제공한다.
본 발명의 한 실시예에서, 상기 병리등급 특이적 마커는 ALMS1, NRXN3, NTRK1, TRIOBP, COL22A1, FHOD3, MYH11, ACY3, C8orf74, CPT1A, DDX39A, FBXL4, ICAM1, KIFAP3, IPO4, NAT2, NFIX, PLIN4, SCRIB, SHC4, SOD3, STRN3, TP53 및 ZNF24로 이루어진 군으로부터 선택되는 하나를 암호화하는 유전자의 돌연변이인 방법일 수 있다.
본 발명의 다른 실시예에서, 전립선암 환자 중 병리등급 Ⅳ에 병리등급 특이적인 마커는 ACY3, C8orf74, CPT1A, DDX39A, FBXL4, ICAM1, IPO4, KIFAP3, NAT2, NFIX, PLIN4, SCRIB, SHC4, SOD3, STRN3 및 ZNF24로 이루어진 군으로부터 선택되는 하나를 암호화하는 유전자의 돌연변이인 방법일 수 있다.
본 발명의 또 다른 측면은 전립선암 환자의 샘플로부터 시료 DNA를 준비하는 단계; 상기 시료 DNA를 상기 키트를 이용하여 증폭하는 단계; 및 상기 증폭 결과로부터 병리등급 특이적 마커의 유무를 확인하는 단계;를 포함하는 전립선암 환자의 병리등급에 따른 전립선암의 예후 진단을 위해 필요한 정보를 제공하는 방법을 제공한다.
상기 전립선암의 예후 진단용 키트'에 대한 설명은 '1. 전립선암 환자에서 병리등급 특이적 돌연변이 유전자'에 기재한 바와 동일하므로 구체적인 설명을 생략한다.
상기 임의의 치료 후보 물질은 전립선암 치료를 위해서 통상적으로 쓰이는 치료제 또는 전립선암에 대한 치료 효과가 알려지지 않은 신규 물질일 수 있으나, 이에 한정되지 않는다. 상기 임의의 치료 후보 물질을 재발 특이적 마커를 가지는 전립선암 환자에 처리한 후 치료 효과를 확인함으로써, 치료 후보 물질이 특정 환자군에 효과가 있는지 여부를 알 수 있다. 만약 전립선암 치료 효과가 있다면 동일한 병리등급 특이적 마커를 가지는 환자군에 적용할 때에 치료 효과가 높다고 예측할 수 있으므로 치료 전략을 결정하는데 유용한 정보를 제공할 수 있다. 또한, 만약 임의의 치료 후보 물질을 사용시에 치료 효과가 나타나지 않을 경우에는 동일한 재발 특이적 마커를 가지는 환자군에는 더 이상 치료를 진행하지 않음으로써 불필요한 치료를 실시하지 않아도 되므로 치료 전략을 효율적으로 설계할 수 있다.
상기 임의의 치료 후보 물질 대신에 임의의 전립선암 치료 방법 역시 적용가능하며, 특정 병리등급 특이적 마커를 가지는 환자군에서 치료 효과를 확인함으로써 동일한 병리등급 특이적 마커를 가지는 환자군에 적용할지 여부를 결정할 수 있다. 병리등급 특이적 마커를 가지는 환자군에서 치료 효과를 확인시에는 임의의 치료 후보 물질과 임의의 전립선암 치료 방법이 병행될 수 있다.
본원에서 사용되는 용어 '샘플'은 환자로부터 수득한 임의의 생물학적 표본을 포함한다. 샘플은 전혈, 혈장, 혈청, 적혈구, 백혈구 (예를 들어 말초 혈액 단핵구), 유관액, 복수, 늑막 유출물 (pleural efflux), 수유관액 (nipple aspirate), 림프액 (예를 들어 림프절의 파종성 종양 세포), 골수 흡인물, 타액, 소변, 대변 (즉, 배설물), 가래, 기관지 세척액, 눈물, 미세 바늘 흡인물 (예를 들어 무작위 유선 미세 바늘 흡인에 의해 수확된), 임의의 기타 체액, 조직 샘플 (예를 들어 종양 조직) 예컨대 종양 생검 (예를 들어 천자 생검) 또는 림프절(예를 들어 감시 (sentinel) 림프절 생검), 조직 샘플 (예를 들어 종양 조직), 예를 들면 종양의 수술적 절제 및 이의 세포 추출물을 포함한다. 일부 실시예에서, 샘플은 전혈 또는 이의 일부 성분, 예를 들면 혈장, 혈청 또는 세포 펠렛이다. 다른 실시예에서, 샘플은 당업계에 공지된 임의의 기법을 사용하여 전혈 또는 이의 세포 분획물로부터 고형 종양의 순환 세포를 단리함으로써 수득된다. 다른 실시예에서, 샘플은 예를 들어 대장암과 같은 고형 종양으로부터의 포르말린 고정된 파라핀 포매 (FFPE) 종양 조직 샘플이다.
특정 실시예에서, 샘플은 대장암을 갖는 대상으로부터 수득한 동결 조직으로부터 제조된 종양 용해물 또는 추출물이다.
용어 '환자'는 통상 인간을 포함할 뿐 아니라 다른 동물, 예를 들어 다른 영장류, 설치류, 개, 고양이, 말, 양, 돼지 등을 포함할 수 있다.
용어 '개체'는 전립선암으로 판정되거나, 의심되는 인간을 제외한 대상을 포함한다.
상기 방법은 전립선암 환자의 총 생존율 또는 무병 생존율을 예측할 수 있다.
본 발명에서 용어 '총 생존율 (overall survival)'은 질환, 예컨대 암으로 진단되거나 그에 대해 치료된 후 한정된 시간 동안 살아 있는 환자를 기재하는 임상적 종점을 포함하며, 암의 재발 여부에 관계없이 생존하는 가능성을 의미한다.
본 발명에서 용어 '무병 생존율 (disease-free survival, DFS)'는 특정 질환 (예를 들어 암)에 대한 치료 후 암의 재발 없이 환자가 생존하는 기간을 포함한다.
본 발명은 전립선암 환자의 샘플에서 본 발명의 유전자의 돌연변이의 존재를 분석함으로써 대상 시료를 가진 개체가 암에 대해 어떤 예후를 가지는지를 확인할 수 있다. 또한 이러한 방법은 예후가 좋다고 알려진 돌연변이가 존재하지 않는 대조군의 개체의 총 생존율 또는 무병 생존율을 비교함으로써 달성될 수 있다. 본 발명에서 예후가 좋다고 알려진 개체란 암이 발병한 후에 전이, 재발, 사망 등의 이력이 없는 개체를 의미한다.
암이 의심되는 개체의 샘플이란 암 또는 종양이 이미 발생하였거나 발생할 것으로 예상되는 개체 또는 조직의 시료로써, 그 예후를 진단하고자 하는 대상 시료를 의미한다.
상기 전립선암 환자의 병리등급에 따른 전립선암의 예후 진단을 위해 필요한 정보를 제공하는 방법은 전립선암 환자의 총 생존율 또는 무병 생존율을 예측할 수 있다. 예를 들면, 상기 방법은 ALMS1, NRXN3, NTRK1 및 TRIOBP를 암호화하는 유전자에서 돌연변이가 확인되고, 전립선암 환자인 경우, 상기 전립선암 환자의 생존율이 상기 유전자에서 돌연변이가 확인되지 않은 사람의 생존율보다 낮거나, 상기 전립선암 환자의 전립선암의재발율이 상기 유전자에서 돌연변이가 확인되지 않은 사람의 전립선암의재발율보다 높은 것으로 판단하는 단계; 를 더 포함할 수 있다.
상기 전립선암 환자의 재발에 따른 전립선암의 예후 진단을 위해 필요한 정보를 제공하는 방법은 COL22A1, FHOD3, MYH11, ACY3, C8orf74, CPT1A, DDX39A, FBXL4, ICAM1, KIFAP3, IPO4, NAT2, NFIX, PLIN4, SCRIB, SHC4, SOD3, STRN3, TP53 및 ZNF24로 이루어진 군으로부터 선택되는 적어도 하나를 암호화하는 유전자에서 돌연변이가 확인될 경우, 전립선암 환자의 생존율이 상기 유전자에서 돌연변이가 확인되지 않은 사람의 생존율보다 낮거나, 상기 전립선암 환자의 전립선암의 재발율이 상기 유전자에서 돌연변이가 확인되지 않은 사람의 전립선암의 재발율보다 높은 것으로 판단하는 단계;를 더 포함할 수 있다.
이와 같이, 본 발명의 유전자의 돌연변이인 ALMS1, NRXN3, NTRK1, TRIOBP, COL22A1, FHOD3, MYH11, ACY3, C8orf74, CPT1A, DDX39A, FBXL4, ICAM1, KIFAP3, IPO4, NAT2, NFIX, PLIN4, SCRIB, SHC4, SOD3, STRN3, TP53 및 ZNF24로 구성된 유전자 군에서 선택되는 적어도 하나의 유전자의 돌연변이를 이용하여 암, 특히 전립선암의 발병 병리등급에 따라 유전자 변이에 차이가 있다는 내용에 대해서는 아직까지 밝혀진 바 없다. 아울러, ALMS1, NRXN3, NTRK1, TRIOBP, COL22A1, FHOD3, MYH11, ACY3, C8orf74, CPT1A, DDX39A, FBXL4, ICAM1, KIFAP3, IPO4, NAT2, NFIX, PLIN4, SCRIB, SHC4, SOD3, STRN3, TP53 및 ZNF24로 구성된 유전자 군에서 선택되는 적어도 하나의 유전자의 돌연변이를 이용하여 특정 병리등급에서 전립선암에 대한 예후를 진단 가능하다는 내용에 대해서는 아직까지 밝혀진 바가 없다. 또한, 각 유전자에서 총 생존율 또는 무병 생존율이 상이할 수 있는 점에 대해서도 보고된 바 없다. 본 발명자들은 상기 유전자들의 돌연변이를 전립선암 환자의 병리등급에 따른 전립선암 치료 효과의 차이를 예측하거나, 전립선암 환자의 예후를 진단할 수 있는 진단 표지자로 사용할 수 있는 점을 최초로 규명하였다.
본 발명의 전립선암 환자의 병리등급에 따른 전립선암 치료 효과의 차이를 예측하기 위해 필요한 정보를 제공하는 방법은 병리등급에 기반하여 전립선암의 유전자 변이를 진단하거나, 전립선암 환자의 생존율을 높이거나, 또는 재발율을 낮추는데 사용될 수 있다. 본 발명의 전립선암의 예후 진단에 대한 방법을 통해, 전립선암의 발병 병리등급에 따른 유전자의 돌연변이 발생 정보를 이용해 전립선암의 치료 효과를 예측하거나, 전립선암 환자의 생존율 또는 재발율을 예측할 수 있으므로, 각 환자에 적합한 치료제 발굴뿐만 아니라, 치료법 선택에 있어 정보를 제공할 수 있어, 전립선암에 관한 치료적 전략을 효율적으로 설계할 수 있다.
이하, 본 발명을 실시예 및 실험예에 의해 상세히 설명한다.
단, 하기 실시예 및 실험예는 본 발명을 예시하기 위한 것일 뿐, 본 발명의 내용이 하기 실시예 및 실험예에 의해 한정되는 것은 아니다.
[실시예]
실시예 1. 유전 정보 및 임상 정보의 확보
본 발명의 유전자들 (ALMS1, NRXN3, NTRK1, TRIOBP, COL22A1, FHOD3, MYH11, ACY3, C8orf74, CPT1A, DDX39A, FBXL4, ICAM1, KIFAP3, IPO4, NAT2, NFIX, PLIN4, SCRIB, SHC4, SOD3, STRN3, TP53 및 ZNF24, 이하 '후보 유전자들'로도 기재함)을 병리등급에 따른 전립선암 마커로서 활용할 수 있는지 여부를 확인하기 위하여, The Cancer Genome Atlas (TCGA)로부터 유전 정보와 임상 정보가 모두 확보되어 있는 투명 전립선암 환자 498명의 재발, 전이, 사망, 관측 시간에 관한 데이터를 입수하여 분석에 이용하였다. 하기 표 1에 전립선암 환자의 재발, 전이, 사망에 관한 데이터를 나타낸다. 위 후보 유전자들은 병리등급에 따라 전립선암 환자에서 돌연변이가 발생했던 유전자들이다.
합계 | |||
환자 수 (명) | 비율 (%) | ||
생존 여부 | 생존 | 488/498 | 98% |
사망 | 10/498 | 2% | |
재발 여부 | 무병 | 401/488 | 82.2% |
재발/진행 | 87/488 | 17.8% | |
전이 | 없음 (M0) | 456/459 | 99.4% |
있음 (M1a) | 1/459 | 0.2% | |
있음 (M1b) | 1/459 | 0.2% | |
있음 (M1c) | 1/459 | 0.2% | |
총 환자 수 | 498 명 |
실시예 2. 병리등급 특이적 마커로서 활용성 확인
TCGA 보고된 전립선암 환자 498명 중 병리등급을 확인할 수 있는 491개의 데이터를 표 2과 같이 3개의 그룹으로 분류하였고, 실시예 1의 후보 유전자들의 돌연변이와 병리등급과의 상관관계를 3가지 Feature Selection (Information Gain, Chi-Square, MRMR) 방법으로 확인하였다. 상기 유전자들의 돌연변이된 위치를 하기 표에 나타낸다.
병리등급 그룹 간 비교 | ||
테스트 세트 종류 | 세부 사항 | 비고 |
테스트 세트 1 | Stage Ⅱ vs Ⅲ vs Ⅳ | 병리등급 간 비교 분석 |
테스트 세트 2 | Stage Ⅱ vs Ⅲ + Ⅳ | Stage Ⅱ 전후 비교분석 |
테스트 세트 3 | Stage Ⅱ + Ⅲ vs Ⅳ | Stage Ⅲ 전후 비교분석 |
연령 그룹간 비교 분석 결과 | ||
테스트 세트 종류 | 병리등급 특이적 유전자 | |
테스트 세트 1 | ACY3,C8orf74,CPT1A,DDX39A,FBXL4,ICAM1,IPO4,KIFAP3,SOD3,ZNF24 | |
테스트 세트 2 | ALMS1,COL22A1,FHOD3,MYH11,NRXN3,NTRK1,TP53,TRIOBP | |
테스트 세트 3 | NAT2,NFIX,PLIN4,SCRIB,SHC4, STRN3 |
2-1. 각 그룹간 비교 분석(테스트 세트 1 - Stage Ⅰvs Ⅱ vs Ⅲ vs Ⅳ)
표 2에서 그룹별로 구분된 3개의 병리등급 그룹 각각에 대하여, 후보 유전자들의 돌연변이 발생과 전립선암 환자의 병리등급과의 연관성을 확인하였다. 0.05 미만의 P-value를 통계적으로 유의한 것으로 간주하였다. 하기 표3 내지 5에 테스트 세트 1에 관련된 후보 유전자들의 정보를 나타낸다.
유전자 | 병리등급 | 돌연변이 수 |
돌연변이(%) | 돌연변이유형 | 사이토 밴드 |
병리등급(%) | Fisher (p-value) | |||||||
Ⅱ | Ⅲ | Ⅳ | 절단 | 미스센스 | 인프레임 | 기타 | Ⅱ | Ⅲ | Ⅳ | |||||
ACY3 | 0 | 0 | 1 | 1 | 0.20 | 0 | 1 | 0 | 0 | 11q13.2 | 0 | 0 | 100 | 0.02037 |
ADA | 0 | 0 | 1 | 1 | 0.20 | 0 | 1 | 0 | 0 | 20q13.12 | 0 | 0 | 100 | 0.02037 |
AGPAT2 | 0 | 0 | 1 | 1 | 0.20 | 0 | 1 | 0 | 0 | 9q34.3 | 0 | 0 | 100 | 0.02037 |
AOC1 | 0 | 0 | 1 | 1 | 0.20 | 0 | 1 | 0 | 0 | 7q36.1 | 0 | 0 | 100 | 0.02037 |
APOBEC2 | 0 | 0 | 1 | 1 | 0.20 | 1 | 0 | 0 | 0 | 6p21.1 | 0 | 0 | 100 | 0.02037 |
ARHGAP39 | 0 | 0 | 1 | 1 | 0.20 | 0 | 1 | 0 | 0 | 8q24.3 | 0 | 0 | 100 | 0.02037 |
ARHGEF28 | 0 | 0 | 1 | 1 | 0.20 | 1 | 0 | 0 | 0 | 5q13.2 | 0 | 0 | 100 | 0.02037 |
BPIFB2 | 0 | 0 | 1 | 1 | 0.20 | 0 | 1 | 0 | 0 | 20q11.21 | 0 | 0 | 100 | 0.02037 |
C19orf26 | 0 | 0 | 1 | 1 | 0.20 | 0 | 1 | 0 | 0 | 19p13.3 | 0 | 0 | 100 | 0.02037 |
C8orf74 | 0 | 0 | 1 | 2 | 0.40 | 0 | 2 | 0 | 0 | 8p23.1 | 0 | 0 | 100 | 0.02037 |
CD40 | 0 | 0 | 1 | 1 | 0.20 | 0 | 1 | 0 | 0 | 20q13.12 | 0 | 0 | 100 | 0.02037 |
CDK2AP2 | 0 | 0 | 1 | 1 | 0.20 | 1 | 0 | 0 | 0 | 11q13.2 | 0 | 0 | 100 | 0.02037 |
CEP97 | 0 | 0 | 1 | 1 | 0.20 | 0 | 1 | 0 | 0 | 3q12.3 | 0 | 0 | 100 | 0.02037 |
CHP2 | 0 | 0 | 1 | 1 | 0.20 | 0 | 1 | 0 | 0 | 16p12.2 | 0 | 0 | 100 | 0.02037 |
CLDN12 | 0 | 0 | 1 | 1 | 0.20 | 0 | 1 | 0 | 0 | 7q21.13 | 0 | 0 | 100 | 0.02037 |
CPT1A | 0 | 0 | 1 | 2 | 0.40 | 0 | 2 | 0 | 0 | 11q13.3 | 0 | 0 | 100 | 0.02037 |
DAK | 0 | 0 | 1 | 1 | 0.20 | 1 | 0 | 0 | 0 | 11q12.2 | 0 | 0 | 100 | 0.02037 |
DAPP1 | 0 | 0 | 1 | 1 | 0.20 | 0 | 1 | 0 | 0 | 4q23 | 0 | 0 | 100 | 0.02037 |
DDX39A | 0 | 0 | 1 | 1 | 0.20 | 0 | 1 | 0 | 0 | 20p13 | 0 | 0 | 100 | 0.02037 |
DDX39A | 0 | 0 | 1 | 1 | 0.20 | 0 | 1 | 0 | 0 | 19p13.12 | 0 | 0 | 100 | 0.02037 |
유전자 | 병리등급 | 돌연변이 수 |
돌연변이(%) | 돌연변이유형 | 사이토 밴드 |
병리등급(%) | Fisher (p-value) | |||||||
Ⅱ | Ⅲ | Ⅳ | 절단 | 미스센스 | 인프레임 | 기타 | Ⅱ | Ⅲ | Ⅳ | |||||
DYNC2H1 | 0 | 0 | 1 | 1 | 0.20 | 0 | 1 | 0 | 0 | 11q22.3 | 0 | 0 | 100 | 0.02037 |
E2F8 | 0 | 0 | 1 | 1 | 0.20 | 0 | 1 | 0 | 0 | 11p15.1 | 0 | 0 | 100 | 0.02037 |
EDA | 0 | 0 | 1 | 1 | 0.20 | 0 | 1 | 0 | 0 | Xq13.1 | 0 | 0 | 100 | 0.02037 |
FAM78B | 0 | 0 | 1 | 1 | 0.20 | 0 | 1 | 0 | 0 | 1q24.1 | 0 | 0 | 100 | 0.02037 |
FBXL4 | 0 | 0 | 1 | 1 | 0.20 | 0 | 1 | 0 | 0 | 6q16.1-q16.2 | 0 | 0 | 100 | 0.02037 |
GALT | 0 | 0 | 1 | 1 | 0.20 | 0 | 1 | 0 | 0 | 9p13.3 | 0 | 0 | 100 | 0.02037 |
GEMIN2 | 1 | 0 | 1 | 2 | 0.40 | 2 | 0 | 0 | 0 | 14q21.1 | 50 | 0 | 50 | 0.016 |
GLP2R | 0 | 0 | 1 | 1 | 0.20 | 0 | 1 | 0 | 0 | 17p13.1 | 0 | 0 | 100 | 0.02037 |
GSTM3 | 0 | 0 | 1 | 1 | 0.20 | 0 | 1 | 0 | 0 | 1p13.3 | 0 | 0 | 100 | 0.02037 |
HDHD3 | 0 | 0 | 1 | 1 | 0.20 | 0 | 1 | 0 | 0 | 9q32 | 0 | 0 | 100 | 0.02037 |
HEXIM1 | 0 | 0 | 1 | 1 | 0.20 | 0 | 0 | 1 | 0 | 17q21.31 | 0 | 0 | 100 | 0.02037 |
HSD17B2 | 0 | 0 | 1 | 1 | 0.20 | 0 | 1 | 0 | 0 | 16q23.3 | 0 | 0 | 100 | 0.02037 |
ICAM1 | 0 | 0 | 1 | 2 | 0.40 | 0 | 2 | 0 | 0 | 19p13.2 | 0 | 0 | 100 | 0.02037 |
IPO4 | 0 | 0 | 1 | 2 | 0.40 | 2 | 0 | 0 | 0 | 14q12 | 0 | 0 | 100 | 0.02037 |
ISCU | 0 | 0 | 1 | 1 | 0.20 | 0 | 1 | 0 | 0 | 12q23.3 | 0 | 0 | 100 | 0.02037 |
KIFAP3 | 0 | 0 | 1 | 2 | 0.40 | 2 | 0 | 0 | 0 | 1q24.2 | 0 | 0 | 100 | 0.02037 |
KLK2 | 0 | 0 | 1 | 1 | 0.20 | 1 | 0 | 0 | 0 | 19q13.33 | 0 | 0 | 100 | 0.02037 |
LRRC17 | 0 | 0 | 1 | 1 | 0.20 | 0 | 1 | 0 | 0 | 7q22.1 | 0 | 0 | 100 | 0.02037 |
MELK | 0 | 0 | 1 | 1 | 0.20 | 0 | 1 | 0 | 0 | 9p13.2 | 0 | 0 | 100 | 0.02037 |
MT-CO2 | 0 | 0 | 1 | 1 | 0.20 | 0 | 1 | 0 | 0 | NA | 0 | 0 | 100 | 0.02037 |
유전자 | 병리등급 | 돌연변이 수 |
돌연변이(%) | 돌연변이유형 | 사이토 밴드 |
병리등급(%) | Fisher (p-value) | |||||||
Ⅱ | Ⅲ | Ⅳ | 절단 | 미스센스 | 인프레임 | 기타 | Ⅱ | Ⅲ | Ⅳ | |||||
NBL1 | 0 | 0 | 1 | 1 | 0.20 | 1 | 0 | 0 | 0 | 1p36.13 | 0 | 0 | 100 | 0.02037 |
NUMB | 0 | 0 | 1 | 1 | 0.20 | 0 | 1 | 0 | 0 | 14q24.2-q24.3 | 0 | 0 | 100 | 0.02037 |
OR52J3 | 1 | 0 | 1 | 2 | 0.40 | 0 | 2 | 0 | 0 | 11p15.4 | 50 | 0 | 50 | 0.016 |
PLRG1 | 0 | 0 | 1 | 1 | 0.20 | 1 | 0 | 0 | 0 | 4q31.3 | 0 | 0 | 100 | 0.02037 |
PRKAG3 | 0 | 0 | 1 | 1 | 0.20 | 0 | 1 | 0 | 0 | 2q35 | 0 | 0 | 100 | 0.02037 |
PTPLA | 0 | 0 | 1 | 1 | 0.20 | 1 | 0 | 0 | 0 | 10p12.33 | 0 | 0 | 100 | 0.02037 |
RWDD2A | 0 | 0 | 1 | 1 | 0.20 | 0 | 1 | 0 | 0 | 6q14.1 | 0 | 0 | 100 | 0.02037 |
S100A7L2 | 0 | 0 | 1 | 1 | 0.20 | 0 | 1 | 0 | 0 | 1q21.3 | 0 | 0 | 100 | 0.02037 |
SOD3 | 0 | 0 | 1 | 1 | 0.20 | 0 | 1 | 0 | 0 | 4p15.2 | 0 | 0 | 100 | 0.02037 |
TNFAIP3 | 0 | 0 | 1 | 1 | 0.20 | 0 | 1 | 0 | 0 | 6q23.3 | 0 | 0 | 100 | 0.02037 |
TPX2 | 0 | 0 | 1 | 1 | 0.20 | 1 | 0 | 0 | 0 | 20q11.21 | 0 | 0 | 100 | 0.02037 |
ZNF24 | 0 | 0 | 1 | 1 | 0.20 | 0 | 1 | 0 | 0 | 18q12.2 | 0 | 0 | 100 | 0.02037 |
분석 결과, 각 병리등급별 그룹에서 돌연변이가 있는 유전자이더라도 다른 그룹과 비교하였을 때 P-value가 0.05 이상으로 나타난 유전자가 있는 한편, 돌연변이가 있으면서, P-value가 0.05 미만으로 나타난 유전자가 확인되었다. 다른 그룹과 비교하였을 때 P-value가 0.05 미만인 돌연변이 유전자들은 다른 그룹에 비해서 특정 병리등급 그룹과 상호 관련성이 있는 것이므로 병리등급 특이적 유전자로 정하였다. 그룹간 비교하였을 때 SMO는 P-value는 0.05 미만으로 이들 유전자의 돌연변이 발생과 병리등급이 상관 관계가 있는 것으로 확인되었다. 도 2에 테스트 세트 1에 따른 결과를 나타낸다. 도 2에서 알 수 있듯이 ACY3, ADA, AGPAT2, AOC1, APOBEC2, ARHGEF28, BPIFB2, C19ORF26, C8orf74, CD40, CDK2AP2, CEP97, CHP2, CPT1A, DAK, DAPP1, DDX39A, DDX39A, DYNC2H1, E2F8, EDA, FAM78B, FBXL4, GALT, GLP2R, GSTM3, HDHD3, HEXM1, HSD17B2, ICAM1, IPO4, ISCU, KIFAP3, KLK2, LRRC17, MELK, MT-CO2, NBL1, NUMB, PLRG1, PRKAG3, PTPLA, RWDD2A, S100A7L2, SOD3, TNFAIP3, TPX2 및 ZNF24는 다른 그룹보다 Ⅳ그룹에서 돌연변이가 많이 나타나는 것으로 확인되었으며, GEMIN2 및 OR52J3는 Ⅱ그룹 및 Ⅳ에서 돌연변이가 많이 나타나는 것을 확인하였다.
상기 결과로부터, ACY3, ADA, AGPAT2, AOC1, APOBEC2, ARHGEF28, BPIFB2, C19ORF26, C8orf74, CD40, CDK2AP2, CEP97, CHP2, CPT1A, DAK, DAPP1, DDX39A, DDX39A, DYNC2H1, E2F8, EDA, FAM78B, FBXL4, GALT, GLP2R, GSTM3, HDHD3, HEXM1, HSD17B2, ICAM1, IPO4, ISCU, KIFAP3, KLK2, LRRC17, MELK, MT-CO2, NBL1, NUMB, PLRG1, PRKAG3, PTPLA, RWDD2A, S100A7L2, SOD3, TNFAIP3, TPX2, ZNF24, GEMIN2 및 OR52J3의 52개의 돌연변이를 Ⅱ그룹 또는 Ⅳ그룹에 특이적인 마커로 사용할 수 있는 것을 알 수 있다.
2-2. Stage Ⅱ 전후 비교분석 (테스트 세트 2 - Stage Ⅱ vs Ⅲ + Ⅳ)
표 2에서 그룹별로 구분된 3개의 병리등급 그룹 중, 저병리등급 (Ⅱ)과 고병리등급 (Ⅲ 및 Ⅳ)에 대하여, 후보 유전자들의 돌연변이 발생과 전립선암 환자의 병리등급과의 연관성을 확인하였다. 0.05 미만의 P-value를 통계적으로 유의한 것으로 간주하였다. 하기 표 6 내지 12에 테스트 세트 2에 관련된 후보 유전자들의 정보를 나타낸다.
유전자 | 돌연변이 수 |
돌연변이(%) | 사이토 밴드 |
돌연변이유형 | 병리등급 | Fisher's exact (P-Value) | |||||
절단 | 미스센스 | 인프레임 | 기타 | Stage II |
Stage III+IV | Stage III+IV(%) | |||||
ACACA | 8 | 1.7 | 17q12 | 2 | 6 | 0 | 0 | 2 | 6 | 75.0 | 0.355 |
ADAM23 | 5 | 1.1 | 2q33.3 | 0 | 5 | 0 | 0 | 0 | 5 | 100.0 | 0.091 |
ALMS1 | 7 | 1.5 | 2p13.1 | 2 | 5 | 0 | 0 | 0 | 7 | 100.0 | 0.035 |
ALPK2 | 9 | 2.0 | 18q21.31-q21.32 | 2 | 7 | 0 | 0 | 1 | 8 | 88.9 | 0.088 |
ANK3 | 8 | 1.7 | 10q21.2 | 4 | 4 | 0 | 0 | 0 | 8 | 100.0 | 0.022 |
ANKRD36C | 35 | 7.6 | 2q11.1 | 1 | 34 | 0 | 0 | 21 | 14 | 40.0 | 0.01 |
ATOH1 | 3 | 0.7 | 4q22.2 | 0 | 3 | 0 | 0 | 3 | 0 | 0.0 | 0.057 |
BRWD1 | 6 | 1.3 | 21q22.2 | 2 | 4 | 0 | 0 | 0 | 6 | 100.0 | 0.057 |
COL22A1 | 9 | 2.0 | 8q24.23-q24.3 | 3 | 6 | 0 | 0 | 0 | 9 | 100.0 | 0.014 |
CPSF7 | 2 | 0.4 | 11q12.2 | 0 | 2 | 0 | 0 | 2 | 0 | 0.0 | 0.148 |
CYFIP2 | 6 | 1.3 | 5q33.3 | 1 | 5 | 0 | 0 | 0 | 6 | 100.0 | 0.057 |
DBR1 | 7 | 1.5 | 3q22.3 | 0 | 0 | 7 | 0 | 1 | 6 | 85.7 | 0.185 |
DCC | 6 | 1.3 | 18q21.2 | 0 | 6 | 0 | 0 | 0 | 6 | 100.0 | 0.057 |
DDX23 | 6 | 1.3 | 12q13.12 | 1 | 5 | 0 | 0 | 0 | 6 | 100.0 | 0.057 |
DNASE2B | 3 | 0.7 | 1p31.1-p22.3 | 3 | 0 | 0 | 0 | 3 | 0 | 0.0 | 0.057 |
유전자 | 돌연변이 수 |
돌연변이(%) | 사이토 밴드 |
돌연변이유형 | 병리등급 | Fisher’s exact (P-Value) | |||||
절단 | 미스센스 | 인프레임 | 기타 | Stage II |
Stage III+IV |
Stage III+IV(%) | |||||
DUSP27 | 5 | 1.1 | 1q24.1 | 0 | 3 | 2 | 0 | 0 | 5 | 100.0 | 0.091 |
EIF4G3 | 6 | 1.3 | 1p36.12 | 4 | 2 | 0 | 0 | 0 | 6 | 100.0 | 0.057 |
EP300 | 7 | 1.5 | 22q13.2 | 0 | 7 | 0 | 0 | 0 | 7 | 100.0 | 0.035 |
FAM83C | 6 | 1.3 | 20q11.22 | 1 | 5 | 0 | 0 | 0 | 6 | 100.0 | 0.057 |
FBN3 | 14 | 3.1 | 19p13.2 | 0 | 14 | 0 | 0 | 1 | 13 | 92.9 | 0.012 |
FEM1A | 7 | 1.5 | 19p13.3 | 1 | 6 | 0 | 0 | 5 | 2 | 28.6 | 0.083 |
FHOD3 | 7 | 1.5 | 18q12.2 | 2 | 5 | 0 | 0 | 0 | 7 | 100.0 | 0.035 |
FRAS1 | 6 | 1.3 | 4q21.21 | 0 | 6 | 0 | 0 | 0 | 6 | 100.0 | 0.057 |
GNAZ | 3 | 0.7 | 22q11.22-q11.23 | 0 | 2 | 1 | 0 | 2 | 0 | 0.0 | 0.33 |
GRIK3 | 6 | 1.3 | 1p34.3 | 0 | 6 | 0 | 0 | 5 | 1 | 16.7 | 0.035 |
GRIP1 | 5 | 1.1 | 12q14.3 | 0 | 5 | 0 | 0 | 0 | 5 | 100.0 | 0.091 |
HSPG2 | 12 | 2.6 | 1p36.12 | 2 | 10 | 0 | 0 | 1 | 11 | 91.7 | 0.027 |
INO80 | 5 | 1.1 | 15q15.1 | 1 | 4 | 0 | 0 | 0 | 5 | 100.0 | 0.091 |
IRS2 | 3 | 0.7 | 13q34 | 2 | 1 | 0 | 0 | 3 | 0 | 0.0 | 0.057 |
ITPR3 | 6 | 1.3 | 6p21.31 | 0 | 6 | 0 | 0 | 0 | 6 | 100.0 | 0.057 |
유전자 | 돌연변이 수 |
돌연변이(%) | 사이토 밴드 |
돌연변이유형 | 병리등급 | Fisher's exact (P-Value) | |||||
절단 | 미스센스 | 인프레임 | 기타 | Stage II |
Stage III+IV |
Stage III+IV(%) | |||||
ITPRIP | 5 | 1.1 | 10q25.1 | 0 | 5 | 0 | 0 | 0 | 5 | 100.0 | 0.091 |
KAL1 | 5 | 1.1 | Xp22.31 | 3 | 2 | 0 | 0 | 0 | 5 | 100.0 | 0.091 |
KCNV1 | 5 | 1.1 | 8q23.2 | 1 | 4 | 0 | 0 | 0 | 5 | 100.0 | 0.091 |
KDM6A | 14 | 3.1 | Xp11.3 | 10 | 4 | 0 | 0 | 9 | 5 | 35.7 | 0.047 |
KIAA1109 | 6 | 1.3 | 4q27 | 1 | 5 | 0 | 0 | 1 | 5 | 83.3 | 0.264 |
KIAA1244 | 5 | 1.1 | 6q23.3-q24.1 | 0 | 5 | 0 | 0 | 0 | 5 | 100.0 | 0.091 |
KMT2D | 36 | 7.8 | 12q13.12 | 18 | 17 | 1 | 0 | 6 | 30 | 83.3 | 0.006 |
KRTAP4-6 | 6 | 1.3 | 17q21.2 | 0 | 6 | 0 | 0 | 5 | 1 | 16.7 | 0.035 |
KRTAP4-7 | 5 | 1.1 | 17q21.2 | 0 | 5 | 0 | 0 | 0 | 5 | 100.0 | 0.091 |
KSR1 | 3 | 0.7 | 17q11.2 | 0 | 3 | 0 | 0 | 3 | 0 | 0.0 | 0.057 |
LCT | 6 | 1.3 | 2q21.3 | 0 | 6 | 0 | 0 | 0 | 6 | 100.0 | 0.057 |
LRRC15 | 5 | 1.1 | 3q29 | 0 | 5 | 0 | 0 | 0 | 5 | 100.0 | 0.091 |
LRRC66 | 5 | 1.1 | 4q12 | 1 | 4 | 0 | 0 | 0 | 5 | 100.0 | 0.091 |
LTBP1 | 5 | 1.1 | 2p22.3 | 1 | 4 | 0 | 0 | 0 | 5 | 100.0 | 0.091 |
MAP1A | 5 | 1.1 | 15q15.3 | 1 | 4 | 0 | 0 | 0 | 5 | 100.0 | 0.091 |
유전자 | 돌연변이 수 |
돌연변이(%) | 사이토 밴드 |
돌연변이유형 | 병리등급 | Fisher's exact (P-Value) | |||||
절단 | 미스센스 | 인프레임 | 기타 | Stage II |
Stage III+IV |
Stage III+IV(%) | |||||
MDN1 | 9 | 2.0 | 6q15 | 0 | 9 | 0 | 0 | 1 | 8 | 88.9 | 0.088 |
MGAT4C | 3 | 0.7 | 12q21.31-q21.32 | 0 | 3 | 0 | 0 | 3 | 0 | 0.0 | 0.057 |
MT-CO1 | 3 | 0.7 | NA | 1 | 2 | 0 | 0 | 3 | 0 | 0.0 | 0.057 |
MUC2 | 6 | 1.3 | 11p15.5 | 0 | 6 | 0 | 0 | 0 | 6 | 100.0 | 0.057 |
MYH11 | 7 | 1.5 | 16p13.11 | 1 | 6 | 0 | 0 | 0 | 7 | 100.0 | 0.035 |
MYOT | 5 | 1.1 | 5q31.2 | 0 | 5 | 0 | 0 | 0 | 5 | 100.0 | 0.091 |
NALCN | 12 | 2.6 | 13q32.3-q33.1 | 0 | 12 | 0 | 0 | 1 | 11 | 91.7 | 0.027 |
NIPBL | 7 | 1.5 | 5p13.2 | 0 | 7 | 0 | 0 | 0 | 7 | 100.0 | 0.035 |
NLRP4 | 5 | 1.1 | 19q13.43 | 0 | 5 | 0 | 0 | 0 | 5 | 100.0 | 0.091 |
NOS1 | 3 | 0.7 | 12q24.22 | 0 | 3 | 0 | 0 | 3 | 0 | 0.0 | 0.057 |
NRXN3 | 8 | 1.7 | 14q24.3-q31.1 | 0 | 8 | 0 | 0 | 0 | 8 | 100.0 | 0.022 |
NTRK1 | 9 | 2.0 | 1q23.1 | 0 | 8 | 1 | 0 | 0 | 9 | 100.0 | 0.014 |
NUTM2F | 3 | 0.7 | 9q22.32 | 0 | 0 | 3 | 0 | 3 | 0 | 0.0 | 0.057 |
PCDH11X | 5 | 1.1 | Xq21.31 | 0 | 5 | 0 | 0 | 0 | 5 | 100.0 | 0.091 |
PCDHA7 | 4 | 0.9 | 5q31.3 | 0 | 4 | 0 | 0 | 3 | 1 | 25.0 | 0.162 |
유전자 | 돌연변이수 | 돌연변이 (%) |
사이토 밴드 |
돌연변이유형 | 병리등급 | Fisher's exact (P-Value) | |||||
절단 | 미스센스 | 인프레임 | 기타 | Stage II |
Stage III+IV | Stage III+IV(%) | |||||
PCDHA8 | 6 | 1.3 | 5q31.3 | 1 | 5 | 0 | 0 | 0 | 6 | 100.0 | 0.057 |
PIK3CD | 5 | 1.1 | 1p36.22 | 1 | 4 | 0 | 0 | 0 | 5 | 100.0 | 0.091 |
POM121L12 | 6 | 1.3 | 7p12.1 | 0 | 6 | 0 | 0 | 0 | 6 | 100.0 | 0.057 |
PPP2R2B | 4 | 0.9 | 5q32 | 1 | 3 | 0 | 0 | 3 | 0 | 0.0 | 0.162 |
PRRC2C | 3 | 0.7 | 1q24.3 | 1 | 2 | 0 | 0 | 3 | 0 | 0.0 | 0.057 |
RBP3 | 4 | 0.9 | 10q11.22 | 0 | 4 | 0 | 0 | 4 | 0 | 0.0 | 0.022 |
RP1 | 16 | 3.5 | 8q11.23-q12.1 | 1 | 15 | 0 | 0 | 11 | 5 | 31.3 | 0.015 |
SECISBP2L | 3 | 0.7 | 15q21.1 | 0 | 3 | 0 | 0 | 3 | 0 | 0.0 | 0.057 |
SHROOM3 | 3 | 0.7 | 4q21.1 | 1 | 2 | 0 | 0 | 3 | 0 | 0.0 | 0.057 |
SIGLEC1 | 8 | 1.7 | 20p13 | 1 | 7 | 0 | 0 | 0 | 8 | 100.0 | 0.022 |
SMC2 | 5 | 1.1 | 9q31.1 | 0 | 5 | 0 | 0 | 0 | 5 | 100.0 | 0.091 |
SMG7 | 8 | 1.7 | 1q25.3 | 4 | 4 | 0 | 0 | 1 | 7 | 87.5 | 0.128 |
SORCS2 | 3 | 0.7 | 4p16.1 | 0 | 3 | 0 | 0 | 3 | 0 | 0.0 | 0.057 |
SPTA1 | 28 | 6.1 | 1q23.1 | 3 | 25 | 0 | 0 | 3 | 23 | 88.5 | 0.002 |
STRC | 5 | 1.1 | 15q15.3 | 2 | 3 | 0 | 0 | 0 | 5 | 100.0 | 0.091 |
유전자 | 돌연변이수 | 돌연변이 (%) |
사이토 밴드 |
돌연변이유형 | 병리등급 | Fisher's exact (P-Value) | |||||
절단 | 미스센스 | 인프레임 | 기타 | Stage II |
Stage III+IV | Stage III+IV(%) | |||||
TACC2 | 6 | 1.3 | 10q26.13 | 1 | 5 | 0 | 0 | 0 | 6 | 100.0 | 0.057 |
TAF1D | 4 | 0.9 | 11q21 | 2 | 2 | 0 | 0 | 3 | 0 | 0.0 | 0.162 |
TBXA2R | 5 | 1.1 | 19p13.3 | 2 | 3 | 0 | 0 | 0 | 5 | 100.0 | 0.091 |
TENM2 | 10 | 2.2 | 5q34 | 1 | 9 | 0 | 0 | 1 | 9 | 90.0 | 0.06 |
TGM6 | 5 | 1.1 | 20p13 | 0 | 5 | 0 | 0 | 0 | 5 | 100.0 | 0.091 |
TMEM184A | 5 | 1.1 | 7p22.3 | 1 | 1 | 3 | 0 | 0 | 5 | 100.0 | 0.091 |
TMPRSS2 | 5 | 1.1 | 21q22.3 | 2 | 2 | 1 | 0 | 5 | 0 | 0.0 | 0.009 |
TNS1 | 6 | 1.3 | 2q35 | 0 | 6 | 0 | 0 | 1 | 5 | 83.3 | 0.264 |
TP53 | 64 | 13.9 | 17p13.1 | 18 | 46 | 0 | 0 | 11 | 52 | 82.5 | 0.001 |
TP53BP1 | 10 | 2.2 | 15q15.3 | 5 | 5 | 0 | 0 | 1 | 9 | 90.0 | 0.06 |
TPTE2 | 8 | 1.7 | 13q12.11 | 2 | 6 | 0 | 0 | 6 | 2 | 25.0 | 0.042 |
TRIOBP | 9 | 2.0 | 22q13.1 | 5 | 4 | 0 | 0 | 0 | 9 | 100.0 | 0.014 |
UACA | 8 | 1.7 | 15q23 | 0 | 8 | 0 | 0 | 1 | 6 | 85.7 | 0.128 |
UTP20 | 6 | 1.3 | 12q23.2 | 1 | 5 | 0 | 0 | 0 | 6 | 100.0 | 0.057 |
VPS13C | 7 | 1.5 | 15q22.2 | 0 | 6 | 1 | 0 | 1 | 6 | 85.7 | 0.185 |
유전자 | 돌연변이수 | 돌연변이 (%) |
사이토 밴드 |
돌연변이유형 | 병리등급 | Fisher's exact (P-Value) | |||||
절단 | 미스센스 | 인프레임 | 기타 | Stage II |
Stage III+IV |
Stage III+IV(%) | |||||
ZMYM3 | 13 | 2.8 | Xq13.1 | 7 | 6 | 0 | 0 | 1 | 12 | 92.3 | 0.018 |
ZNF208 | 13 | 2.8 | 19p12 | 1 | 12 | 0 | 0 | 2 | 11 | 84.6 | 0.077 |
ZNF845 | 12 | 2.6 | 19q13.42 | 1 | 11 | 0 | 0 | 8 | 4 | 33.3 | 0.047 |
ZNF99 | 10 | 2.2 | 19p12 | 0 | 10 | 0 | 0 | 1 | 9 | 90.0 | 0.06 |
분석 결과, 각 병리등급별 그룹에서 돌연변이가 있는 유전자이더라도 다른 그룹과 비교하였을 때 P-value가 0.05 이상으로 나타난 유전자가 있는 한편, 돌연변이가 있으면서, P-value가 0.05 미만으로 나타난 유전자가 확인되었다. 다른 그룹과 비교하였을 때 P-value가 0.05 미만인 돌연변이 유전자들은 다른 그룹에 비해서 특정 병리등급 그룹과 상호 관련성이 있는 것이므로 병리등급 특이적 유전자로 정하였다. 예를 들면, ZNF208는 돌연변이된 총 환자 수가 많았지만 P-value는 0.05 이상으로 높아, 이들 유전자의 돌연변이와 병리등급은 상관 관계가 없음을 알 수 있었다.
도 3에 유전자의 돌연변이와 병리등급의 연관성을 분석한 결과를 나타낸다. 도 3에서 알 수 있듯이 ANKRD36C, GRIK3, KDM6A, KRTAP4-6, RBP3, TPTE2 및 ZNF24는 고병리등급 (Ⅲ + Ⅳ)보다 저병리등급 (Ⅱ)에서 돌연변이된 유전자를 가지는 환자의 수가 많은 것으로 확인되었으며, ALMS1, ANK3, COL22A1, EP300, FHOD3, HSPG2, KMT2D, MYH11, NALCN, NIPBL, NRXN3, NTRK1, SIGLEC1, SPTA1, TP53, TRIOBP 및 ZMYM3은 저병리등급 (Ⅱ) 보다 고병리등급 (Ⅲ + Ⅳ)에서 돌연변이된 유전자를 가지는 환자의 수가 많은 것으로 확인되었다.
상기 결과로부터, ANKRD36C, GRIK3, KDM6A, KRTAP4-6, RBP3, TPTE2, ZNF24, ALMS1, ANK3, COL22A1, EP300, FHOD3, HSPG2, KMT2D, MYH11, NALCN, NIPBL, NRXN3, NTRK1, SIGLEC1, SPTA1, TP53, TRIOBP 및 ZMYM3 의 돌연변이를 stage Ⅱ 전후 특이적인 마커로 사용할 수 있는 것을 알 수 있다.
2-3. Stage Ⅲ 전후 비교분석 (테스트 세트 3 - Stage Ⅱ+ Ⅲ vs Ⅳ)
표 2에서 그룹별로 구분된 3개의 병리등급 그룹 중, 병리등급 Ⅱ + Ⅲ와, 병리등급 Ⅳ에 대하여, 후보 유전자들의 돌연변이 발생과 전립선암 환자의 병리등급과의 연관성을 확인하였다. 0.05 미만의 P-value를 통계적으로 유의한 것으로 간주하였다. 하기 표 13 내지 표 18에 테스트 세트 3에 관련된 후보 유전자들의 정보를 나타낸다.
유전자 | 돌연변이 수 |
돌연변이(%) | 사이토 밴드 |
돌연변이유형 | 병리등급 | Fisher's exact (P-Value) |
|||||
절단 | 미스센스 | 인프레임 | 기타 | Stage II+III |
Stage IV |
Stage IV(%) |
|||||
ACY3 | 1 | 0.2 | 11q13.2 | 0 | 1 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
ADA | 1 | 0.2 | 20q13.12 | 0 | 1 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
AGPAT2 | 1 | 0.2 | 9q34.3 | 0 | 1 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
AOC1 | 1 | 0.2 | 7q36.1 | 0 | 1 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
APOBEC2 | 1 | 0.2 | 6p21.1 | 1 | 0 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
ARHGAP39 | 1 | 0.2 | 8q24.3 | 0 | 1 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
ARHGEF28 | 1 | 0.2 | 5q13.2 | 1 | 0 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
BPIFB2 | 1 | 0.2 | 20q11.21 | 0 | 1 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
C19orf26 | 1 | 0.2 | 19p13.3 | 0 | 1 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
C8orf74 | 2 | 0.4 | 8p23.1 | 0 | 2 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
CD40 | 1 | 0.2 | 20q13.12 | 0 | 1 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
CDK2AP2 | 1 | 0.2 | 11q13.2 | 1 | 0 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
CEP97 | 1 | 0.2 | 3q12.3 | 0 | 1 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
CHP2 | 1 | 0.2 | 16p12.2 | 0 | 1 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
CLASRP | 4 | 0.8 | 19q13.32 | 0 | 1 | 3 | 0 | 2 | 2 | 50.0 | 0.003 |
유전자 | 돌연변이 수 |
돌연변이 (%) |
사이토 밴드 |
돌연변이유형 | 병리등급 | Fisher's exact (P-Value) |
|||||
절단 | 미스센스 | 인프레임 | 기타 | Stage II+III |
Stage IV | Stage IV(%) |
|||||
CLDN12 | 1 | 0.2 | 7q21.13 | 0 | 1 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
CPT1A | 2 | 0.4 | 11q13.3 | 0 | 2 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
DAK | 1 | 0.2 | 11q12.2 | 1 | 0 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
DAPP1 | 1 | 0.2 | 4q23 | 0 | 1 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
DDX39A | 1 | 0.2 | 20p13 | 0 | 1 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
DDX39A | 1 | 0.2 | 19p13.12 | 0 | 1 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
DYNC2H1 | 1 | 0.2 | 11q22.3 | 0 | 1 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
E2F8 | 1 | 0.2 | 11p15.1 | 0 | 1 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
EDA | 1 | 0.2 | Xq13.1 | 0 | 1 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
FAM78B | 1 | 0.2 | 1q24.1 | 0 | 1 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
FBXL4 | 1 | 0.2 | 6q16.1-q16.2 | 0 | 1 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
GALT | 1 | 0.2 | 9p13.3 | 0 | 1 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
GEMIN2 | 2 | 0.4 | 14q21.1 | 2 | 0 | 0 | 0 | 1 | 1 | 50.0 | 0.044 |
GLP2R | 1 | 0.2 | 17p13.1 | 0 | 1 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
GSTM3 | 1 | 0.2 | 1p13.3 | 0 | 1 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
유전자 | 돌연변이 수 |
돌연변이 (%) |
사이토 밴드 |
돌연변이유형 | 병리등급 | Fisher's exact (P-Value) |
|||||
절단 | 미스센스 | 인프레임 | 기타 | Stage II+III | Stage IV | Stage IV(%) |
|||||
HDHD3 | 1 | 0.2 | 9q32 | 0 | 1 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
HEXIM1 | 1 | 0.2 | 17q21.31 | 0 | 0 | 1 | 0 | 0 | 1 | 100.0 | 0.022 |
HNRNPA1 | 1 | 0.2 | 12q13.13 | 0 | 1 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
HS6ST2 | 1 | 0.2 | Xq26.2 | 1 | 0 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
HSD17B2 | 1 | 0.2 | 16q23.3 | 0 | 1 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
HSPBP1 | 1 | 0.2 | 19q13.42 | 0 | 1 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
ICAM1 | 2 | 0.4 | 19p13.2 | 0 | 2 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
IPO4 | 2 | 0.4 | 14q12 | 2 | 0 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
ISCU | 1 | 0.2 | 12q23.3 | 0 | 1 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
JMJD4 | 1 | 0.2 | 1q42.13 | 0 | 1 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
KIFAP3 | 2 | 0.4 | 1q24.2 | 2 | 0 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
KLK2 | 1 | 0.2 | 19q13.33 | 1 | 0 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
LRRC17 | 1 | 0.2 | 7q22.1 | 0 | 1 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
MACC1 | 1 | 0.2 | 7p21.1 | 0 | 1 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
MELK | 1 | 0.2 | 9p13.2 | 0 | 1 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
유전자 | 돌연변이 수 |
돌연변이 (%) |
사이토 밴드 |
돌연변이유형 | 병리등급 | Fisher's exact (P-Value) |
|||||
절단 | 미스센스 | 인프레임 | 기타 | Stage II+III | Stage IV | Stage IV(%) |
|||||
MT-CO2 | 1 | 0.2 | NA | 0 | 1 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
NANOS1 | 1 | 0.2 | 10q26.11 | 0 | 0 | 1 | 0 | 0 | 1 | 100.0 | 0.022 |
NAT2 | 2 | 0.4 | 8p22 | 0 | 2 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
NBL1 | 1 | 0.2 | 1p36.13 | 1 | 0 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
NFIX | 1 | 0.2 | 19p13.13 | 0 | 1 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
NUMB | 1 | 0.2 | 14q24.2-q24.3 | 0 | 1 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
OR10H2 | 2 | 0.4 | 19p13.12 | 0 | 2 | 0 | 0 | 1 | 1 | 50.0 | 0.044 |
OR52J3 | 2 | 0.4 | 11p15.4 | 0 | 2 | 0 | 0 | 1 | 1 | 50.0 | 0.044 |
PAX6 | 1 | 0.2 | 11p13 | 1 | 0 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
PLIN4 | 2 | 0.4 | 19p13.3 | 0 | 2 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
PLRG1 | 1 | 0.2 | 4q31.3 | 0 | 1 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
PRKAG3 | 1 | 0.2 | 2q35 | 0 | 1 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
PTER | 1 | 0.2 | 10p13 | 0 | 1 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
PTPLA | 1 | 0.2 | 10p12.33 | 1 | 0 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
RAB8B | 1 | 0.2 | 15q22.2 | 0 | 1 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
유전자 | 돌연변이 수 |
돌연변이 (%) |
사이토 밴드 |
돌연변이유형 | 병리등급 | Fisher's exact (P-Value) |
|||||
절단 | 미스센스 | 인프레임 | 기타 | Stage II+III | Stage IV | Stage IV(%) |
|||||
RASL10A | 1 | 0.2 | 22q12.2 | 0 | 1 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
RPS4Y2 | 1 | 0.2 | Yq11.223 | 0 | 1 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
RWDD2A | 1 | 0.2 | 6q14.1 | 0 | 1 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
S100A7L2 | 1 | 0.2 | 1q21.3 | 0 | 1 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
SCAMP1 | 1 | 0.2 | 5q14.1 | 1 | 0 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
SCRIB | 2 | 0.4 | 8q24.3 | 0 | 2 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
SHC4 | 1 | 0.2 | 15q21.1 | 0 | 1 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
SLC2A12 | 1 | 0.2 | 6q23.2 | 0 | 1 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
SOD3 | 1 | 0.2 | 4p15.2 | 0 | 1 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
ST6GALNAC1 | 1 | 0.2 | 17q25.1 | 0 | 1 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
STMN2 | 1 | 0.2 | 8q21.13 | 0 | 1 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
STRN3 | 3 | 0.6 | 14q12 | 0 | 3 | 0 | 0 | 1 | 1 | 50.0 | 0.044 |
TAB2 | 1 | 0.2 | 6q25.1 | 0 | 1 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
TFPT | 1 | 0.2 | 19q13.42 | 0 | 1 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
TNFAIP3 | 1 | 0.2 | 6q23.3 | 0 | 1 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
유전자 | 돌연변이 수 |
돌연변이 (%) |
사이토 밴드 |
돌연변이유형 | 병리등급 | Fisher's exact (P-Value) |
|||||
절단 | 미스센스 | 인프레임 | 기타 | Stage II+III | Stage IV | Stage IV(%) |
|||||
TPX2 | 1 | 0.2 | 20q11.21 | 1 | 0 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
TROAP | 1 | 0.2 | 12q13.12 | 0 | 1 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
TSHR | 1 | 0.2 | 14q31.1 | 0 | 1 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
UBL7 | 1 | 0.2 | 15q24.1 | 1 | 0 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
ZNF24 | 1 | 0.2 | 18q12.2 | 0 | 1 | 0 | 0 | 0 | 1 | 100.0 | 0.022 |
분석 결과, 그룹간 비교하였을 때ACY3, ADA, AGPAT2, AOC1, APOBEC2, ARHGAP39, ARHGEF28, BPIFB2, C19orf26, C8orf74, CD40, CDK2AP2, CEP97, CHP2, CLASRP, CLDN12, CPT1A, DAK, DAPP1, DDX39A, DDX39A, DYNC2H1, E2F8, EDA, FAM78B, FBXL4, GALT, GEMIN2, GLP2R, GSTM3, HDHD3, HEXIM1, HNRNPA1, HS6ST2, HSD17B2, HSPBP1, HSPG2, ICAM1, IPO4, ISCU, JMJD4, KIFAP3, KLK2, LRRC17, MACC1, MELK, MT-CO2, NANOS1, NAT2, NBL1, NFIX, NUMB, OR10H2, OR52J3, PAX6, PLIN4, PLRG1, PRKAG3, PTER, PTPLA, RAB8B, RASL10A, RPS4Y2, RWDD2A, S100A7L2, SCAMP1, SCRIB, SHC4, SLC2A12, SOD3, ST6GALNAC1, STMN2, STRN3, TAB2, TFPT, TNFAIP3, TPX2, TROAP, TSHR, UBL7, 및 ZNF24는 P-value가 0.05 미만으로 이들 유전자의 돌연변이 발생과 병리등급이 상관 관계가 있는 것으로 확인되었다.
도 4에 유전자의 돌연변이와 병리등급의 연관성을 분석한 결과를 나타낸다. 도 4에서 알 수 있듯이 CLASRP, GEMININ2, OR10H2, OR52J3, STRN3, ACY3, ADA, AGPAT2, AOC1, APOBEC2, ARHGAP39, ARHGEF28, BPIFB2, C19orf26, C8orf74, CD40, CDK2AP2, CEP97, CHP2,CLDN12, CPT1A, DAK, DAPP1, DDX39A, DDX39A, DYNC2H1, E2F8, EDA, FAM78B, FBXL4, GALT, GLP2R, GSTM3, HDHD3, HEXIM1, HNRNPA1, HS6ST2, HSD17B2, HSPBP1, HSPG2, ICAM1, IPO4, ISCU, JMJD4, KIFAP3, KLK2, LRRC17, MACC1, MELK, MT-CO2, NANOS1, NAT2, NBL1, NFIX, NUMB, PAX6, PLIN4, PLRG1, PRKAG3, PTER, PTPLA, RAB8B, RASL10A, RPS4Y2, RWDD2A, S100A7L2, SCAMP1, SCRIB, SHC4, SLC2A12, SOD3, ST6GALNAC1, STMN2, TAB2, TFPT, TNFAIP3, TPX2, TROAP, TSHR, UBL7, 및 ZNF24는 병리등급 Ⅳ에서 돌연변이된 유전자를 가지는 환자의 수가 많은 것으로 확인되었다.
상기 결과로부터, ARHGAP39, ARHGEF28, BPIFB2, C19orf26, C8orf74, CD40, CDK2AP2, CEP97, CHP2,CLDN12, CPT1A, DAK, DAPP1, DDX39A, DDX39A, DYNC2H1, E2F8, EDA, FAM78B, FBXL4, GALT, GLP2R, GSTM3, HDHD3, HEXIM1, HNRNPA1, HS6ST2, HSD17B2, HSPBP1, HSPG2, ICAM1, IPO4, ISCU, JMJD4, KIFAP3, KLK2, LRRC17, MACC1, MELK, MT-CO2, NANOS1, NAT2, NBL1, NFIX, NUMB, PAX6, PLIN4, PLRG1, PRKAG3, PTER, PTPLA, RAB8B, RASL10A, RPS4Y2, RWDD2A, S100A7L2, SCAMP1, SCRIB, SHC4, SLC2A12, SOD3, ST6GALNAC1, STMN2, TAB2, TFPT, TNFAIP3, TPX2, TROAP, TSHR, UBL7, 및 ZNF24의 돌연변이를 병리등급 Ⅱ + Ⅲ와 병리등급 Ⅳ의 구분을 위한 특이적인 마커로 사용할 수 있는 것을 알 수 있다.
실시예 3. 병리등급에 따른 생존 특이적 마커로서의 활용 가능성 확인
실시예 1의 후보 유전자들 중에서 생존 특이적인 돌연변이 유전자가 있는지 확인하였다. 실시예 1에서 확보된 498명의 대상 환자를 생존 환자(488명)와 사망 환자(10명)로 분류하고, 실시예 1에서 확보한 임상 정보 (사건(사망 또는 재발) 여부, 관측 시간)를 토대로 카플란 마이어 생존 분석법 (Spss 21)으로 생존 기간 (overall survival kaplan-meier estimate) 및 무병 생존 기간 (disease free survival kaplan-meier estimate)을 구하였다. 총 생존 기간에서는 사망을 사건으로 정하고, 무병 생존 기간에서는 전립선암의 재발을 사건으로 정하였다. 상기 유전자들 각각에서의 돌연변이 발생이 재발성 전립선암 환자의 전립선암에 의한 사망, 또는 전립선암의 재발과 상호 관련성이 있는지 여부를 확인하기 위하여, 카플란 마이어 생존 분석법에서 얻어진 각 군의 사건 시간 (event time)을 토대로 돌연변이 발생과 총 생존 기간의 연관성, 및 돌연변이 발생과 무병 생존 기간의 연관성을 로그순위 검정(log rank test)에 의해 확인하였다. 0.05 미만의 P-value를 통계적으로 유의한 것으로 간주하였다. 실험군은 본 발명의 유전자들에 돌연변이가 있는 경우 (case with alterations in query gene)로 하였고, 대조군으로는 본 발명의 유전자들에 돌연변이가 없는 경우 (case without alterations in query gene)로 하였다. 생존 기간 중앙값 (median months survival)은 해당 군의 환자들의 생존 기간을 나열하였을 때 중앙에 위치하는 값을 의미한다. 무병 생존 기간 중앙값(median months desease free)는 해당 군의 환자들의 생존 기간을 나열하였을 때 중앙에 위치하는 값을 의미한다. 카플란 마이어 생존 분석법에 의한 생존 곡선에서의 경사도는 생존 기간에 의해 결정된다.
후보 유전자들 각각에서의 돌연변이 발생이 병리등급이 알려진 전립선암 환자의 생존율과 연관성이 있는지 여부 (귀무가설)를 확인하기 위하여, 실시예 1에서 확보된 498명의 전립선암 환자의 예후를 분석하였다.
3-1. 각 병리등급간 비교 분석 (테스트 세트 1 - Stage Ⅱ vs Ⅲ vs Ⅳ)
표 2에서 그룹별로 구분된 3개의 병리등급 그룹 각각에 대하여, 후보 유전자들의 돌연변이 발생과 특정 병리등급의 전립선암 환자의 생존율과의 연관성을 확인하였다. 0.05 미만의 P-value를 통계적으로 유의한 것으로 간주하였다. 병리등급간 총 생존 및 무병 생존의 P-value를 표 19에 나타낸다.
유전자 | 총생존 | 무병생존 |
ACY3 | 0.9 | 0.0004 |
C8orf74 | 0.852 | 7.77E-16 |
CPT1A | 0.852 | 7.77E-16 |
DDX39A | 0.852 | 7.77E-16 |
FBXL4 | 0.9 | 0.0004 |
ICAM1 | 0.852 | 7.77E-16 |
IPO4 | 0.852 | 7.77E-16 |
KIFAP3 | 0.852 | 7.77E-16 |
SOD3 | 0.9 | 0.0004 |
ZNF24 | 0.9 | 0.0004 |
도 5 내지 도 14에 나타낸 바와 같이, 각 그룹간 비교 시, ACY3, C8orf74, CPT1A, DDX39A, FBXL4, ICAM1, IPO4, KIFAP3, SOD3 및 ZNF24 유전자의 돌연변이 발생이 전립선암 환자 중 병리등급 Ⅳ군의 생존율과 연관성이 있다는 귀무가설이 맞을 확률이 99.5% 이상으로, 즉 귀무가설이 틀릴 확률이 0.5% 미만으로 나타나므로, ACY3, C8orf74, CPT1A, DDX39A, FBXL4, ICAM1, IPO4, KIFAP3, SOD3 및 ZNF24 유전자들의 돌연변이 발생과 전립선암 환자 중 병리등급 Ⅳ군인 환자의 생존율과 연관성이 있는 것을 알 수 있다
3-2. Stage Ⅱ 전후 비교분석 (테스트 세트 2 - Stage Ⅱ vs Ⅲ + Ⅳ)
표 2에서 그룹별로 구분된 3개의 병리등급 그룹 각각에 대하여, 후보 유전자들의 돌연변이 발생과 특정 병리등급의 전립선암 환자의 생존율과의 연관성을 확인하였다. 0.05 미만의 P-value를 통계적으로 유의한 것으로 간주하였다. Stage Ⅱ 전후 총 생존 및 무병 생존의 P-value를 표 20에 나타낸다.
유전자 | 총생존 | 무병생존 |
ALMS1 | 0.077 | 0.01 |
COL22A1 | 0.028 | 0.469 |
FHOD3 | 0.0045 | 0.0507 |
MYH11 | 0.015 | 0.00035 |
NRXN3 | 0.707 | 0.019 |
NTRK1 | 0.823 | 0.031 |
TP53 | 0.313 | 0.0018 |
TRIOBP | 0.744 | 0.045 |
도 15 내지 도 22에 나타낸 바와 같이, 각 그룹간 비교 시, ALMS1, COL22A1, FHOD3, MYH11, NRXN3, NTRK1, TP53, TRIOBP유전자의 돌연변이 발생이 전립선암 환자 중 병리등급 Ⅲ + Ⅳ군의 생존율과 연관성이 있다는 귀무가설이 맞을 확률이 99.5% 이상으로, 즉 귀무가설이 틀릴 확률이 0.5% 미만으로 나타나므로, ACY3, C8orf74, CPT1A, DDX39A, FBXL4, ICAM1, IPO4, KIFAP3, SOD3 및 ZNF24 유전자들의 돌연변이 발생과 전립선암 환자 중 병리등급 Ⅲ + Ⅳ군인 환자의 생존율과 연관성이 있는 것을 알 수 있다.
3-3. Stage Ⅲ 전후 비교분석 (테스트 세트 3 - Stage Ⅱ + Ⅲ vs Ⅳ)
표 2에서 그룹별로 구분된 3개의 병리등급 그룹 각각에 대하여, 후보 유전자들의 돌연변이 발생과 특정 병리등급의 전립선암 환자의 생존율과의 연관성을 확인하였다. 0.05 미만의 P-value를 통계적으로 유의한 것으로 간주하였다. Stage Ⅲ 전후 총 생존 및 무병 생존의 P-value를 표 21에 나타낸다.
유전자 | 총 생존 | 무병생존 |
ACY3 | 0.9 | 0.0004 |
C8orf74 | 0.852 | 7.77E-16 |
CPT1A | 0.852 | 7.77E-16 |
DDX39A | 0.852 | 7.77E-16 |
FBXL4 | 0.9 | 0.0004 |
ICAM1 | 0.852 | 7.77E-16 |
IPO4 | 0.852 | 7.77E-16 |
KIFAP3 | 0.852 | 7.77E-16 |
NAT2 | 0.852 | 7.77E-16 |
NFIX | 0.852 | 7.77E-16 |
PLIN4 | 0.852 | 7.77E-16 |
SCRIB | 0.852 | 7.77E-16 |
SHC4 | 0.852 | 7.77E-16 |
SOD3 | 0.9 | 0.0004 |
STRN3 | 0.791 | 0.00015 |
ZNF24 | 0.9 | 0.00042 |
도 23 내지 도 28에 나타낸 바와 같이, 각 그룹간 비교 시, NAT2, NFIX, PLIN4, SCRIB, SHC4, 및 STRN3 유전자의 돌연변이 발생이 전립선암 환자 중 병리등급 Ⅳ군의 생존율과 연관성이 있다는 귀무가설이 맞을 확률이 99.5% 이상으로, 즉 귀무가설이 틀릴 확률이 0.5% 미만으로 나타나므로, NAT2, NFIX, PLIN4, SCRIB, SHC4 및 STRN3 유전자들의 돌연변이 발생과 전립선암 환자 중 병리등급 Ⅳ군인 환자의 생존율과 연관성이 있는 것을 알 수 있다.
3-4. 무병 생존 특이적 유전자
실시예 1의 후보 유전자들 중에서 생존 특이적인 돌연변이 유전자로서 상기 실시예 3-1, 3-2 및 3-3에 의해 확인된 유전자에 대하여, 무병 생존 특이적 유전자로 ACY3, ALMS1, C8orf74, CPT1A, DDX39A, FBXL4, ICAM1, IPO4, KIFAP3, NAT2, NFIX, NRXN3, NTRK1, PLIN4, SCRIB, SHC4, SOD3, STRN3, TP53, TRIOBP 및 ZNF24가 확인되었다. 하기에 각 유전자들에 해당하는 해당 결과를 나타낸다.
ACY3은 도 5에서 알 수 있는 바와 같이, 상기 ACY3 유전자에 돌연변이가 발생하지 않은 전립선암 환자의 경우 50% 이상이 80개월 이상 생존한데 반해 (청색), 상기 ACY3 유전자에 돌연변이가 발생한 전립선암 환자는 전립선암 환자의 50% 이상이 10개월이 되기 전에 사망하였으므로 돌연변이가 발생하지 않은 전립선암 환자에 비해서 생존율이 낮은 것으로 확인되었다 (적색). 따라서, ACY3 유전자에 돌연변이가 있고, 전립선암 환자의 병리등급이 Ⅳ군일 경우 전립선암에 의한 사망 확률이 높아지므로 상기 ACY3 유전자의 돌연변이가 병리등급 Ⅳ군인 전립선암 환자의 생존율 예측 마커로서 유의함을 알 수 있다.
C8orf74는 도 6에서 알 수 있는 바와 같이, 상기 C8orf74 유전자에 돌연변이가 발생하지 않은 전립선암 환자의 경우 50% 이상이 80개월 이상 생존한데 반해 (청색), 상기 C8orf74 유전자에 돌연변이가 발생한 전립선암 환자는 전립선암 환자의 50% 이상이 10개월이 되기 전에 사망하였으므로 돌연변이가 발생하지 않은 전립선암 환자에 비해서 생존율이 낮은 것으로 확인되었다 (적색). 따라서, C8orf74 유전자에 돌연변이가 있고, 전립선암 환자의 병리등급이 Ⅳ군일 경우 전립선암에 의한 사망 확률이 높아지므로 상기 C8orf74 유전자의 돌연변이가 병리등급 Ⅳ군인 전립선암 환자의 생존율 예측 마커로서 유의함을 알 수 있다.
CPT1A는 도 7에서 알 수 있는 바와 같이, 상기 CPT1A 유전자에 돌연변이가 발생하지 않은 전립선암 환자의 경우 50% 이상이 80개월 이상 생존한데 반해 (청색), 상기 CPT1A 유전자에 돌연변이가 발생한 전립선암 환자는 전립선암 환자의 50% 이상이 10개월이 되기 전에 사망하였으므로 돌연변이가 발생하지 않은 전립선암 환자에 비해서 생존율이 낮은 것으로 확인되었다 (적색). 따라서, CPT1A 유전자에 돌연변이가 있고, 전립선암 환자의 병리등급이 Ⅳ군일 경우 전립선암에 의한 사망 확률이 높아지므로 상기 CPT1A 유전자의 돌연변이가 병리등급 Ⅳ군인 전립선암 환자의 생존율 예측 마커로서 유의함을 알 수 있다.
DDX39A는 도 8에서 알 수 있는 바와 같이, 상기 CPT1A 유전자에 돌연변이가 발생하지 않은 전립선암 환자의 경우 50% 이상이 80개월 이상 생존한데 반해 (청색), 상기 DDX39A 유전자에 돌연변이가 발생한 전립선암 환자는 전립선암 환자의 50% 이상이 10개월이 되기 전에 사망하였으므로 돌연변이가 발생하지 않은 전립선암 환자에 비해서 생존율이 낮은 것으로 확인되었다 (적색). 따라서, DDX39A유전자에 돌연변이가 있고, 전립선암 환자의 병리등급이 Ⅳ군일 경우 전립선암에 의한 사망 확률이 높아지므로 상기 DDX39A 유전자의 돌연변이가 병리등급 Ⅳ군인 전립선암 환자의 생존율 예측 마커로서 유의함을 알 수 있다.
FBXL4는 도 9에서 알 수 있는 바와 같이, 상기 FBXL4 유전자에 돌연변이가 발생하지 않은 전립선암 환자의 경우 50% 이상이 80개월 이상 생존한데 반해 (청색), 상기 FBXL4 유전자에 돌연변이가 발생한 전립선암 환자는 전립선암 환자의 50% 이상이 10개월이 되기 전에 사망하였으므로 돌연변이가 발생하지 않은 전립선암 환자에 비해서 생존율이 낮은 것으로 확인되었다 (적색). 따라서, FBXL4 유전자에 돌연변이가 있고, 전립선암 환자의 병리등급이 Ⅳ군일 경우 전립선암에 의한 사망 확률이 높아지므로 상기 FBXL4 유전자의 돌연변이가 병리등급 Ⅳ군인 전립선암 환자의 생존율 예측 마커로서 유의함을 알 수 있다.
ICAM1은 도 10에서 알 수 있는 바와 같이, 상기 ICAM1 유전자에 돌연변이가 발생하지 않은 전립선암 환자의 경우 50% 이상이 80개월 이상 생존한데 반해 (청색), 상기 ICAM1 유전자에 돌연변이가 발생한 전립선암 환자는 전립선암 환자의 50% 이상이 10개월이 되기 전에 사망하였으므로 돌연변이가 발생하지 않은 전립선암 환자에 비해서 생존율이 낮은 것으로 확인되었다 (적색). 따라서, ICAM1유전자에 돌연변이가 있고, 전립선암 환자의 병리등급이 Ⅳ군일 경우 전립선암에 의한 사망 확률이 높아지므로 상기 ICAM1 유전자의 돌연변이가 병리등급 Ⅳ군인 전립선암 환자의 생존율 예측 마커로서 유의함을 알 수 있다.
IPO4는 도 11에서 알 수 있는 바와 같이, 상기 IPO4 유전자에 돌연변이가 발생하지 않은 전립선암 환자의 경우 50% 이상이 80개월 이상 생존한데 반해 (청색), 상기 IPO4 유전자에 돌연변이가 발생한 전립선암 환자는 전립선암 환자의 50% 이상이 10개월이 되기 전에 사망하였으므로 돌연변이가 발생하지 않은 전립선암 환자에 비해서 생존율이 낮은 것으로 확인되었다 (적색). 따라서, IPO4 유전자에 돌연변이가 있고, 전립선암 환자의 병리등급이 Ⅳ군일 경우 전립선암에 의한 사망 확률이 높아지므로 상기 IPO4 유전자의 돌연변이가 병리등급 Ⅳ군인 전립선암 환자의 생존율 예측 마커로서 유의함을 알 수 있다.
KIFAP3은 도 12에서 알 수 있는 바와 같이, 상기 KIFAP3 유전자에 돌연변이가 발생하지 않은 전립선암 환자의 경우 50% 이상이 80개월 이상 생존한데 반해 (청색), 상기 KIFAP3 유전자에 돌연변이가 발생한 전립선암 환자는 전립선암 환자의 50% 이상이 10개월이 되기 전에 사망하였으므로 돌연변이가 발생하지 않은 전립선암 환자에 비해서 생존율이 낮은 것으로 확인되었다 (적색). 따라서, KIFAP3 유전자에 돌연변이가 있고, 전립선암 환자의 병리등급이 Ⅳ군일 경우 전립선암에 의한 사망 확률이 높아지므로 상기 KIFAP3 유전자의 돌연변이가 병리등급 Ⅳ군인 전립선암 환자의 생존율 예측 마커로서 유의함을 알 수 있다.
SOD3는 도 13에서 알 수 있는 바와 같이, 상기 SOD3 유전자에 돌연변이가 발생하지 않은 전립선암 환자의 경우 50% 이상이 80개월 이상 생존한데 반해 (청색), 상기 SOD3 유전자에 돌연변이가 발생한 전립선암 환자는 전립선암 환자의 50% 이상이 10개월이 되기 전에 사망하였으므로 돌연변이가 발생하지 않은 전립선암 환자에 비해서 생존율이 낮은 것으로 확인되었다 (적색). 따라서, SOD3 유전자에 돌연변이가 있고, 전립선암 환자의 병리등급이 Ⅳ군일 경우 전립선암에 의한 사망 확률이 높아지므로 상기 SOD3 유전자의 돌연변이가 병리등급 Ⅳ군인 전립선암 환자의 생존율 예측 마커로서 유의함을 알 수 있다.
ZNF24는 도 14에서 알 수 있는 바와 같이, 상기 ZNF24 유전자에 돌연변이가 발생하지 않은 전립선암 환자의 경우 50% 이상이 80개월 이상 생존한데 반해 (청색), 상기 ZNF24 유전자에 돌연변이가 발생한 전립선암 환자는 전립선암 환자의 50% 이상이 20개월이 되기 전에 사망하였으므로 돌연변이가 발생하지 않은 전립선암 환자에 비해서 생존율이 낮은 것으로 확인되었다 (적색). 따라서, ZNF24 유전자에 돌연변이가 있고, 전립선암 환자의 병리등급이 Ⅳ군일 경우 전립선암에 의한 사망 확률이 높아지므로 상기 ZNF24 유전자의 돌연변이가 병리등급 Ⅳ군인 전립선암 환자의 생존율 예측 마커로서 유의함을 알 수 있다.
ALMS1는 도 15에서 알 수 있는 바와 같이, 상기 ALMS1 유전자에 돌연변이가 발생하지 않은 전립선암 환자의 경우 50% 이상이 80개월 이상 생존한데 반해 (청색), 상기 ALMS1 유전자에 돌연변이가 발생한 전립선암 환자는 전립선암 환자의 50% 이상이 20개월이 되기 전에 사망하였으므로 돌연변이가 발생하지 않은 전립선암 환자에 비해서 생존율이 낮은 것으로 확인되었다 (적색). 따라서, ALMS1유전자에 돌연변이가 있고, 전립선암 환자의 병리등급이 Ⅳ군일 경우 전립선암에 의한 사망 확률이 높아지므로 상기 ALMS1 유전자의 돌연변이가 병리등급 Ⅳ군인 전립선암 환자의 생존율 예측 마커로서 유의함을 알 수 있다.
NRXN3는 도 19에서 알 수 있는 바와 같이, 상기 NRXN3 유전자에 돌연변이가 발생하지 않은 전립선암 환자의 경우 50% 이상이 80개월 이상 생존한데 반해 (청색), 상기 NRXN3 유전자에 돌연변이가 발생한 전립선암 환자는 전립선암 환자의 50% 이상이 30개월이 되기 전에 사망하였으므로 돌연변이가 발생하지 않은 전립선암 환자에 비해서 생존율이 낮은 것으로 확인되었다 (적색). 따라서, NRXN3 유전자에 돌연변이가 있고, 전립선암 환자의 병리등급이 Ⅳ군일 경우 전립선암에 의한 사망 확률이 높아지므로 상기 NRXN3 유전자의 돌연변이가 병리등급 Ⅳ군인 전립선암 환자의 생존율 예측 마커로서 유의함을 알 수 있다.
NTRK1는 도 20에서 알 수 있는 바와 같이, 상기 NTRK1 유전자에 돌연변이가 발생하지 않은 전립선암 환자의 경우 50% 이상이 80개월 이상 생존한데 반해 (청색), 상기 NTRK1 유전자에 돌연변이가 발생한 전립선암 환자는 전립선암 환자의 50% 이상이 20개월이 되기 전에 사망하였으므로 돌연변이가 발생하지 않은 전립선암 환자에 비해서 생존율이 낮은 것으로 확인되었다 (적색). 따라서, NTRK1 유전자에 돌연변이가 있고, 전립선암 환자의 병리등급이 Ⅳ군일 경우 전립선암에 의한 사망 확률이 높아지므로 상기 NTRK1 유전자의 돌연변이가 병리등급 Ⅳ군인 전립선암 환자의 생존율 예측 마커로서 유의함을 알 수 있다.
TP53은 도 21에서 알 수 있는 바와 같이, 상기 TP53 유전자에 돌연변이가 발생하지 않은 전립선암 환자의 경우 50% 이상이 80개월 이상 생존한데 반해 (청색), 상기 TP53 유전자에 돌연변이가 발생한 전립선암 환자는 전립선암 환자의 50% 이상이 60개월이 되기 전에 사망하였으므로 돌연변이가 발생하지 않은 전립선암 환자에 비해서 생존율이 낮은 것으로 확인되었다 (적색). 따라서, TP53 유전자에 돌연변이가 있고, 전립선암 환자의 병리등급이 Ⅳ군일 경우 전립선암에 의한 사망 확률이 높아지므로 상기 TP53 유전자의 돌연변이가 병리등급 Ⅳ군인 전립선암 환자의 생존율 예측 마커로서 유의함을 알 수 있다.
TRIOBP는 도 22에서 알 수 있는 바와 같이, 상기 TRIOBP 유전자에 돌연변이가 발생하지 않은 전립선암 환자의 경우 50% 이상이 80개월 이상 생존한데 반해 (청색), 상기 TRIOBP 유전자에 돌연변이가 발생한 전립선암 환자는 전립선암 환자의 50% 이상이 30개월이 되기 전에 사망하였으므로 돌연변이가 발생하지 않은 전립선암 환자에 비해서 생존율이 낮은 것으로 확인되었다 (적색). 따라서, TRIOBP 유전자에 돌연변이가 있고, 전립선암 환자의 병리등급이 Ⅳ군일 경우 전립선암에 의한 사망 확률이 높아지므로 상기 TRIOBP 유전자의 돌연변이가 병리등급 Ⅳ군인 전립선암 환자의 생존율 예측 마커로서 유의함을 알 수 있다.
NAT2는 도 23에서 알 수 있는 바와 같이, 상기 NAT2 유전자에 돌연변이가 발생하지 않은 전립선암 환자의 경우 50% 이상이 80개월 이상 생존한데 반해 (청색), 상기 NAT2 유전자에 돌연변이가 발생한 전립선암 환자는 전립선암 환자의 50% 이상이 10개월이 되기 전에 사망하였으므로 돌연변이가 발생하지 않은 전립선암 환자에 비해서 생존율이 낮은 것으로 확인되었다 (적색). 따라서, NAT2 유전자에 돌연변이가 있고, 전립선암 환자의 병리등급이 Ⅳ군일 경우 전립선암에 의한 사망 확률이 높아지므로 상기 NAT2 유전자의 돌연변이가 병리등급 Ⅳ군인 전립선암 환자의 생존율 예측 마커로서 유의함을 알 수 있다.
NFIX는 도 24에서 알 수 있는 바와 같이, 상기 NFIX 유전자에 돌연변이가 발생하지 않은 전립선암 환자의 경우 50% 이상이 80개월 이상 생존한데 반해 (청색), 상기 NFIX 유전자에 돌연변이가 발생한 전립선암 환자는 전립선암 환자의 50% 이상이 10개월이 되기 전에 사망하였으므로 돌연변이가 발생하지 않은 전립선암 환자에 비해서 생존율이 낮은 것으로 확인되었다 (적색). 따라서, NFIX유전자에 돌연변이가 있고, 전립선암 환자의 병리등급이 Ⅳ군일 경우 전립선암에 의한 사망 확률이 높아지므로 상기 NFIX 유전자의 돌연변이가 병리등급 Ⅳ군인 전립선암 환자의 생존율 예측 마커로서 유의함을 알 수 있다.
PLIN4는 도 25에서 알 수 있는 바와 같이, 상기 PLIN4 유전자에 돌연변이가 발생하지 않은 전립선암 환자의 경우 50% 이상이 80개월 이상 생존한데 반해 (청색), 상기 PLIN4 유전자에 돌연변이가 발생한 전립선암 환자는 전립선암 환자의 50% 이상이 10개월이 되기 전에 사망하였으므로 돌연변이가 발생하지 않은 전립선암 환자에 비해서 생존율이 낮은 것으로 확인되었다 (적색). 따라서, PLIN4 유전자에 돌연변이가 있고, 전립선암 환자의 병리등급이 Ⅳ군일 경우 전립선암에 의한 사망 확률이 높아지므로 상기 PLIN4 유전자의 돌연변이가 병리등급 Ⅳ군인 전립선암 환자의 생존율 예측 마커로서 유의함을 알 수 있다.
SCRIB는 도 26에서 알 수 있는 바와 같이, 상기 SCRIB 유전자에 돌연변이가 발생하지 않은 전립선암 환자의 경우 50% 이상이 80개월 이상 생존한데 반해 (청색), 상기 SCRIB 유전자에 돌연변이가 발생한 전립선암 환자는 전립선암 환자의 50% 이상이 10개월이 되기 전에 사망하였으므로 돌연변이가 발생하지 않은 전립선암 환자에 비해서 생존율이 낮은 것으로 확인되었다 (적색). 따라서, SCRIB 유전자에 돌연변이가 있고, 전립선암 환자의 병리등급이 Ⅳ군일 경우 전립선암에 의한 사망 확률이 높아지므로 상기 SCRIB 유전자의 돌연변이가 병리등급 Ⅳ군인 전립선암 환자의 생존율 예측 마커로서 유의함을 알 수 있다.
SHC4는 도 27에서 알 수 있는 바와 같이, 상기 SHC4 유전자에 돌연변이가 발생하지 않은 전립선암 환자의 경우 50% 이상이 80개월 이상 생존한데 반해 (청색), 상기 SHC4 유전자에 돌연변이가 발생한 전립선암 환자는 전립선암 환자의 50% 이상이 10개월이 되기 전에 사망하였으므로 돌연변이가 발생하지 않은 전립선암 환자에 비해서 생존율이 낮은 것으로 확인되었다 (적색). 따라서, SHC4 유전자에 돌연변이가 있고, 전립선암 환자의 병리등급이 Ⅳ군일 경우 전립선암에 의한 사망 확률이 높아지므로 상기 S SHC4 유전자의 돌연변이가 병리등급 Ⅳ군인 전립선암 환자의 생존율 예측 마커로서 유의함을 알 수 있다.
STRN3는 도 28에서 알 수 있는 바와 같이, 상기 STRN3 유전자에 돌연변이가 발생하지 않은 전립선암 환자의 경우 50% 이상이 80개월 이상 생존한데 반해 (청색), 상기 STRN3 유전자에 돌연변이가 발생한 전립선암 환자는 전립선암 환자의 50% 이상이 40개월이 되기 전에 사망하였으므로 돌연변이가 발생하지 않은 전립선암 환자에 비해서 생존율이 낮은 것으로 확인되었다 (적색). 따라서, STRN3 유전자에 돌연변이가 있고, 전립선암 환자의 병리등급이 Ⅳ군일 경우 전립선암에 의한 사망 확률이 높아지므로 상기 STRN3 유전자의 돌연변이가 병리등급 Ⅳ군인 전립선암 환자의 생존율 예측 마커로서 유의함을 알 수 있다.
3-5. 총 생존 및 무병 생존 특이적 유전자
총 생존 및 무병 생존 특이적 유전자로는 MYH11이 확인되었다. 하기에 해당하는 결과를 나타낸다.
MYH11는 도 18의 (A)에서 알 수 있는 바와 같이, 상기 MYH11 유전자에 돌연변이가 발생하지 않은 전립선암 환자의 경우 50% 이상이 100개월 이상 생존한데 반해(청색), 상기 MYH11 유전자에 돌연변이가 발생한 전립선암 환자는 전립선암 환자의 50% 이상이 80개월이 되기 전에 사망하였으므로 돌연변이가 발생하지 않은 전립선암 환자에 비해서 생존율이 낮은 것으로 확인되었다(적색). 도 18의 (B)에 따르면 MYH11 유전자에 돌연변이가 발생하지 않은 전립선암 환자의 경우 50% 이상이 80개월 이상 재발이 없었으나 (청색), MYH11 유전자에 돌연변이가 있으면 50개월이 못되어서 전립선암 환자의 50% 이상에서 전립선암이 재발하는 것으로 나타났다(적색). 따라서, MYH11 유전자에 돌연변이가 있고, 전립선암 환자의 병리등급이 Ⅳ군일 경우 전립선암에 의한 사망이나 재발 확률이 높아지므로 상기 MYH11 유전자의 돌연변이가 병리등급 Ⅳ군인 전립선암 환자의 생존율 또는 전립선암의 재발 예측 마커로서 유의함을 알 수 있다.
3-6. 총 생존 특이적 유전자
총 생존 특이적 유전자로는 COL22A1 및 FHOD3이 확인되었다. 하기에 해당 결과를 나타낸다.
COL22A1는 도 16의 (A)에서 알 수 있는 바와 같이, 상기 COL22A1 유전자에 돌연변이가 발생하지 않은 전립선암 환자의 경우 50% 이상이 160개월 이상 생존한데 반해(청색), 상기 COL22A1 유전자에 돌연변이가 발생한 전립선암 환자는 전립선암 환자의 50% 이상이 120개월이 되기 전에 사망하였으므로 돌연변이가 발생하지 않은 전립선암 환자에 비해서 생존율이 낮은 것으로 확인되었다(적색). 도 16의 (B)에 따르면 COL22A1 유전자에 돌연변이가 발생하지 않은 전립선암 환자의 경우 50% 이상이 160개월 이상 재발이 없었으나 (청색), COL22A1 유전자에 돌연변이가 있으면 120개월이 못되어서 전립선암 환자의 50% 이상에서 전립선암이 재발하는 것으로 나타났다(적색). 따라서, COL22A1 유전자에 돌연변이가 있고, 전립선암 환자의 병리등급이 Ⅳ군일 경우 전립선암에 의한 사망이나 재발 확률이 높아지므로 상기 COL22A1 유전자의 돌연변이가 병리등급 Ⅳ군인 전립선암 환자의 생존율 또는 전립선암의 재발 예측 마커로서 유의함을 알 수 있다.
FHOD3는 도 17의 (A)에서 알 수 있는 바와 같이, 상기 FHOD3 유전자에 돌연변이가 발생하지 않은 전립선암 환자의 경우 50% 이상이 120개월 이상 생존한데 반해(청색), 상기 FHOD3 유전자에 돌연변이가 발생한 전립선암 환자는 전립선암 환자의 50% 이상이 60개월이 되기 전에 사망하였으므로 돌연변이가 발생하지 않은 전립선암 환자에 비해서 생존율이 낮은 것으로 확인되었다(적색). 도 17의 (B)에 따르면 FHOD3 유전자에 돌연변이가 발생하지 않은 전립선암 환자의 경우 50% 이상이 80개월 이상 재발이 없었으나 (청색), FHOD3 유전자에 돌연변이가 있으면 50개월이 못되어서 전립선암 환자의 50% 이상에서 전립선암이 재발하는 것으로 나타났다(적색). 따라서, FHOD3 유전자에 돌연변이가 있고, 전립선암 환자의 병리등급이 Ⅳ군일 경우 전립선암에 의한 사망이나 재발 확률이 높아지므로 상기 FHOD3 유전자의 돌연변이가 병리등급 Ⅳ군인 전립선암 환자의 생존율 또는 전립선암의 재발 예측 마커로서 유의함을 알 수 있다. 위 결과를 통해서 ACY3, ALMS1, C8orf74, COL22A1, CPT1A, DDX39A, FBXL4, FHOD3, ICAM1, IPO4, KIFAP3, MYH11, NAT2, NFIX, NRXN3, NTRK1, PLIN4, SCRIB, SHC4, SOD3, STRN3, TP53, TRIOBP 및 ZNF24로 이루어진 군으로부터 선택되는 어느 하나의 유전자에 돌연변이가 있는 경우 재발성 전립선암 환자의 생존율이 현저히 낮아지거나, 재발율이 증가하는 것을 알 수 있으므로, 본 발명의 유전자들의 돌연변이 여부를 환자의 재발 여부와 대조하여 전립선암의 예후, 특히 생존 여부 또는 재발 여부를 예측할 수 있음을 알 수 있다.
상기에서는 본 발명의 바람직한 실시예를 예시적으로 설명하였으나, 본 발명의 범위는 상기와 같은 특정 실시예에만 한정되지 아니하며, 해당 분야에서 통상의 지식을 가진 자라면 본 발명의 특허청구범위에 기재된 범주 내에서 적절하게 변경이 가능할 것이다.
<110> Catholic University of Korea Industry-Academic Cooperation Foundation
<120> Stage-specific markers for diagnosing prognosis and determining
treatment stratagies of patient of Prostate adenocarcinoma
<130> PD20-068
<160> 24
<170> KoPatentIn 3.0
<210> 1
<211> 12928
<212> DNA
<213> ALMS1
<400> 1
aggcgggcgg cactgcgcct aagctgggcc acaaccgcca gtcagggctc tccccttccc 60
ctccctcccc ccctcctcct cctcctctgc cgcccagagc gagacaccaa catggagccc 120
gaggatctgc catggccggg cgagctggag gaggaggagg aggaggagga ggaggaggag 180
gaggaggaag aggaggaggc tgcagcggcg gcggcggcga acgtggacga cgtagtggtc 240
gtggaggagg tggaggaaga ggcggggcgg gagttggact ccgactctca ctacgggccc 300
cagcatctgg aaagtataga cgacgaggag gacgaggagg ccaaggcctg gctgcaggcg 360
caccccggca ggattttgcc tccgctgtcg cccccgcagc accgctactc ggagggcgag 420
cggacctccc tggagaagat tgttccattg acctgtcatg tatggcaaca gatagtatat 480
caaggcaata gtagaacaca aatttctgat actaatgtgg tctgtttgga aacaacagct 540
cagcggggtt ctggggatga tcagaaaaca gaatcttggc attgtcttcc tcaagaaatg 600
gactcttccc aaaccttgga tacatcccag actaggttta atgtgagaac ggaagatact 660
gaagtgacag acttcccctc tctggaggag ggcatattga cgcaatcaga aaatcaagta 720
aaggaaccca acagagatct cttctgttct ccactgctag tcatacaaga tagctttgct 780
tctcctgatt tgcctttgct gacctgtttg acacaagacc aagaatttgc gcctgattct 840
ttatttcatc aaagtgaact aagttttgca cctctgaggg gaattcctga taagtctgaa 900
gatactgaat ggtcttctcg accatcggaa gttagtgaag ctttattcca ggctactgca 960
gaagtagctt cagacttagc aagcagtcgc tttagtgtat ctcagcaccc gcttataggc 1020
agcacagctg ttgggtctca gtgccctttt ttaccttctg aacaagggaa taatgaagag 1080
actatttcgt ctgttgatga actgaaaatt cccaaagact gtgatcgtta tgatgatctt 1140
tgttcatata tgtcatggaa gacacgaaaa gatacacagt ggcctgaaaa caatttagct 1200
gataaagatc aagtttcagt tgcaacttca tttgacataa ctgatgaaaa catagctact 1260
aaaagaagtg accattttga tgctgctcgt tcatatgggc agtattggac acaggaagat 1320
tcatctaagc aggcagaaac atatttaacc aagggcctgc aggggaaggt tgagtctgac 1380
gtcattactc tggatggcct aaatgaaaat gctgttgtat gcagtgaaag agttgctgaa 1440
ctacaaagaa agccaacaag agagtcggaa tatcactctt cagatctcag aatgttgagg 1500
atgtctcctg acactgtgcc aaaggctcct aaacatttaa aagcaggaga cacttctaaa 1560
ggaggcatag ctaaagttac tcaatccaac ttgaagtcag gcatcactac cactcctgtt 1620
gattcagaca ttggatctca tttatccttg tcccttgagg acctgtctca gttggctgta 1680
agttctcctc tagaaactac tactggtcaa cacactgata ctctcaacca aaagacatta 1740
gcagatactc atctaactga agagactctg aaagtcacag ctattcctga accagctgac 1800
cagaagactg caacaccaac agtactctct agttcccact cacatagggg gaagcccagc 1860
attttctacc agcagggctt gccagacagt catctaactg aagaggcttt gaaagtttca 1920
gctgctcctg gactagctga ccagacaact ggcatgtcaa ctctaacctc tacttcctac 1980
tcacatagag agaagcctgg tactttttac caacaagagt taccagagag taacttaacc 2040
gaagagcctt tggaagtttc agctgctcct ggcccagtgg agcagaagac gggaatacct 2100
acagtatcct ctacatccca ctcacatgta gaggacctcc tctttttcta tcgacagacc 2160
ttgccagatg gtcatctaac tgatcaggct ctgaaagtct cagctgtgtc tggaccagct 2220
gaccagaaga ctgggacagc aacagtactc tctactcccc actcacatag agagaagcct 2280
ggtatttttt accaacaaga gttcgcagac agtcatcaaa ctgaagagac tcttactaaa 2340
gtttcagcca ctcctggacc agctgaccag aagactgaga taccagcagt acagtctagt 2400
tcttactcac aaagagaaaa gcctagtatt ttgtacccac aggacttagc agacagtcat 2460
ctacctgaag agggtctgaa agtttcagct gttgctggac cagctgacca gaagactggc 2520
ctaccaacag taccctctag tgcatactca cacagagaga agctccttgt tttctaccaa 2580
caggccttgc tggacagcca tctacccgaa gaggctctga aagtttcagc tgtttctgga 2640
ccagctgacg gaaagactgg gacaccagct gtaacctcta cttcctctgc gtcctcttca 2700
cttggagaaa agcccagtgc tttctatcag cagaccttac ccaatagtca tctaactgaa 2760
gaggctctga aagtatcaat tgttcctgga ccaggtgatc agaagactgg gataccctca 2820
gcaccatcta gtttctactc acacagagag aagcccatta ttttttccca gcagaccctg 2880
ccagactttc ttttccctga agaagctctg aaggtttcag ctgtttctgt attggctgcc 2940
cagaagactg ggacaccaac agtgtcctct aattctcact cacatagcga gaaatctagt 3000
gttttctacc agcaagagtt gccagacagt gatctaccta gagaatctct gaaaatgtct 3060
gctattcctg gactgactga ccagaagact gtcccaacac caacagtacc ttcaggttcc 3120
ttctcacata gagagaagcc cagtattttc tatcaacagg agtggccaga tagttatgca 3180
actgaaaagg ctctgaaagt ttcaactggc cctggaccag ctgaccagaa gactgagata 3240
ccagcagtac agtctagttc ttacccacag agggagaagc ctagtgtttt gtacccacag 3300
gtgttatcag acagtcatct acctgaagag agtctgaaag tttcagcctt ccctggacca 3360
gctgaccaga tgactgacac accagcagta ccgtctactt tctactcaca aagagagaag 3420
cctggtattt tctaccaaca gaccttgcca gagagtcatc tgcctaaaga ggctctgaaa 3480
atttcagtag ctcctggact agcagaccag aagactggca caccaactgt aacctcaact 3540
tcctactcac aacatagaga aaagcccagc attttccacc agcaggcctt gccaggtact 3600
catatacctg aagaggctca gaaagtttca gctgttactg gaccaggtaa ccagaagact 3660
tggataccaa gagtactttc taccttctac tcacaaagag agaaacctgg tattttctat 3720
caacagacct tgccaggtag tcacatacct gaagaggcac agaaagtttc acctgttctt 3780
ggaccagctg accagaagac tgggacacca actccaacct ctgcttctta ctcacacaca 3840
gagaagcctg gtattttcta ccaacaggtc ttgccagata atcatccaac tgaagaggct 3900
ctgaaaattt cagttgcctc tgaaccagtt gaccagacaa ctggcacacc agctgtaacc 3960
tctacttcct actcacaata tagagagaag cccagcattt tctaccaaca gtcgttgcca 4020
agtagtcatc taactgaaga ggctaagaat gtttcagcgg ttcctggacc agctgaccag 4080
aagactgtga taccaatttt accctctact ttctactcac acacagagaa gcctggtgtt 4140
ttctaccaac aggtcttgcc acatagtcat ccaactgaag aggctctgaa aatttcagtt 4200
gcctctgaac cagttgacca gacaactggc acaccaactg taacctctac ttcttactca 4260
caacatacag agaagccgag tattttctac caacagtcgt tgccaggtag tcatctaact 4320
gaagaggcta agaacgtttc agcggttcct ggaccaggtg accggaagac tgggatacca 4380
actttaccct ctactttcta ctcacacaca gagaagcctg gtagtttcta ccaacaggtc 4440
ttgccacata gtcatctacc tgaagaggct ttggaagttt cagttgctcc tggaccagtt 4500
gaccagacga ttggcacacc aactgtaacc tccccttcca gctcatttgg agagaagccc 4560
attgttatct acaaacaggc ctttccagag ggtcatctac ctgaagagtc tctgaaagtt 4620
tcagttgctc ctggaccagt tggccagaca actggcgcac caactataac ctctccttcc 4680
tactcacaac atagagcaaa gtctggcagt ttctaccaac tggcattgct aggtagtcaa 4740
atacctgaag aggctctcag agtttcttct gctcctggac cagctgacca gacaactggc 4800
ataccaacca taacctctac ttcctactca tttggagaga agccgattgt taactacaaa 4860
caggcctttc cagatggtca tctacctgaa gaggctctga aagtttccat tgtttctgga 4920
cctactgaaa aaaagactga cataccagca ggacctttag gttccagtgc acttggagag 4980
aagcccatta ctttctaccg gcaggctctg ctagacagtc ctctaaataa agaggttgtg 5040
aaagtttcag ctgctcctgg accagctgac cagaagactg agacattacc agtacattct 5100
actagctact caaatagggg gaagcctgtc attttctacc agcagaccct atcagacagt 5160
catttacctg aagaagctct gaaagttcca cctgttcctg gaccagatgc ccagaagact 5220
gagacaccat cagtatcctc tagtttatac tcatatagag agaagcccat tgtcttctac 5280
caacaggccc tgccagacag tgagctaact caagaagctc tgaaagtttc agctgttcct 5340
caaccagctg accagaagac tgggttatct actgtaactt cctctttcta ttcacataca 5400
gagaagccta atatttctta ccagcaagag ttgccagata gtcatctaac tgaagaggct 5460
ctgaaagttt caaatgttcc tggaccagct gaccagaaga ctggggtatc aacagtaacc 5520
tctacttcct actcacacag agagaagccc attgtttcct accagcgaga gttgccgcat 5580
tttactgaag caggtttgaa aattttaaga gttcctggac cagctgacca gaagactgga 5640
ataaacatcc tgccctctaa ttcctaccca cagagagagc actctgtcat ttcttatgag 5700
caggagttgc cagatcttac tgaagtaact ttgaaagcaa taggggttcc tgggcctgct 5760
gaccagaaga ctgggataca aatagcatcc tctagttcct actcaaatag agagaaggcc 5820
agtatttttc atcagcagga gttgccagat gttactgaag aagctttaaa tgtttttgtt 5880
gttcctggac aaggtgaccg gaagactgag ataccaacag tacctttaag ttactactca 5940
cgtagagaga agcccagtgt tatctctcaa caggagttgc cagacagtca tctcacagaa 6000
gaggctctga aagtttcacc tgtttctata ccagcagagc agaagactgg gataccaata 6060
ggactgtcta gttcctactc acattcacat aaagagaaac tcaagatttc aactgtgcat 6120
ataccagatg accagaaaac tgagtttcca gcagctaccc ttagttccta ctcacaaata 6180
gagaagccca agatttcaac tgtgattgga ccaaatgacc agaagactcc atcccagaca 6240
gcttttcata gttcctattc tcaaacagta aagcccaata ttttatttca acagcagttg 6300
ccagatagag atcaaagtaa aggtattcta aagatttcag ctgtccctga actaactgat 6360
gtgaatactg gaaaaccagt atctctctct agttcttatt ttcacagaga gaaatcgaat 6420
attttcagtc cacaggaatt gccaggtagt catgtaactg aagatgtgct gaaggtttca 6480
acaattcctg gaccagctgg ccagaaaaca gtattaccaa cagctcttcc tagttccttt 6540
tcacatcgag agaaaccaga tattttctat caaaaggatt tgccagatag acatctaact 6600
gaagatgctc taaagatctc aagtgctctt gggcaagctg atcaaattac cggattacaa 6660
acagttccct ctggtactta ctcacatggt gagaatcaca agcttgtttc agaacatgtc 6720
caaaggctaa tagataattt gaattcttct gactccagtg ttagctcaaa taatgtgctt 6780
ttaaattctc aggctgatga cagagttgta ataaataaac cagaatctgc aggttttaga 6840
gatgttggct ctgaagaaat ccaggatgca gaaaatagtg ctaaaactct taaggaaatt 6900
cggacacttt tgatggaggc agaaaatatg gcactgaaac gatgcaattt tcctgctccc 6960
cttgcccgtt tcagagatat tagtgatatt tcatttatac aatctaagaa ggtggtttgc 7020
ttcaaagaac cctcttccac gggtgtatct aatggtgatt tgcttcacag acagccattc 7080
acagaggaaa gcccaagcag caggtgcata cagaaggata ttggcacaca gacgaatttg 7140
aaatgccgga gaggcattga aaattgggag tttattagtt caactacagt tagaagtcct 7200
ctacaggaag cagagagcaa agtcagtatg gcattagaag aaactcttag gcaatatcaa 7260
gcagccaaat ctgtaatgag gtctgaacct gaagggtgta gtggaaccat tgggaataaa 7320
attattatcc ctatgatgac tgtcataaaa agtgattcaa gtagtgatgc cagtgatgga 7380
aatggttcct gctcgtggga cagtaattta ccagagtctt tggaatcagt ttctgatgtt 7440
cttctaaact tctttccata tgtttcaccc aagacaagta taacagatag cagggaggaa 7500
gagggtgtgt cagagagtga ggatggtggt ggtagcagtg tagattcact ggctgcacat 7560
gtgaaaaacc ttctgcaatg tgaatcctca ctgaatcatg ctaaagaaat actcagaaat 7620
gcagaggaag aggaaagccg ggtacgagca catgcctgga atatgaagtt caatttagca 7680
catgattgtg gatactccat ttcagaatta aatgaagatg acaggaggaa agtagaagag 7740
atcaaggcag agttatttgg tcatggaaga acaactgact tgtccaaggg tttacagagt 7800
ccacggggaa tgggatgcaa gccagaagct gtatgtagtc acattattat tgagagccat 7860
gaaaagggat gtttccggac tctaacttct gaacatccac aactagatag acacccttgt 7920
gctttcagat ctgctggacc ctcagaaatg accagaggac ggcagaaccc atcatcatgc 7980
agagccaagc atgtcaacct ttctgcatcc ttagaccaga acaactccca tttcaaagtt 8040
tggaattcct tgcagttaaa aagtcattcc ccatttcaga actttatacc tgatgaattc 8100
aaaatcagca aaggtcttcg aatgccattc gatgaaaaga tggacccttg gctgtcagaa 8160
ttagtagaac ctgcttttgt gccacctaaa gaagtggatt ttcattcttc atcacaaatg 8220
ccgtccccag aacccatgaa aaagtttact acctccatca ctttttcatc tcaccgacat 8280
tctaaatgca tttccaattc ctctgttgtt aaggttggtg ttactgaagg tagccagtgt 8340
actggagcat ctgtgggggt atttaattct catttcactg aagaacaaaa tcctcccaga 8400
gatcttaaac agaaaacctc ttccccttca tcatttaaaa tgcatagtaa ttcacaagat 8460
aaagaagtga ctattttagc agaaggtaga aggcaaagcc aaaaattacc tgttgatttt 8520
gagcgttctt ttcaagaaga aaaaccctta gaaagatcag attttacagg cagtcattct 8580
gagcccagta ccagggcaaa ttgtagcaat ttcaaggaaa ttcagatttc tgataaccat 8640
acccttatta gcatgggcag accaagttcc accctaggag taaacagatc gagttccaga 8700
ctaggagtaa aagagaagaa tgtaactata actccagatc ttccttcttg catttttctt 8760
gaacaacgag agctctttga acaaagcaaa gccccacgtg cagatgacca tgtgaggaaa 8820
caccattctc cctctcctca acatcaggat tatgtagctc cagaccttcc ttcttgcatt 8880
tttcttgaac aacgagaact ctttgaacag tgcaaagccc catatgtaga tcatcaaatg 8940
agagaaaacc attctcccct tcctcaaggt caggattcta tagcttcaga ccttccgtct 9000
cccatttctc ttgaacaatg ccaaagcaaa gcgccaggtg tagatgacca aatgaataaa 9060
caccattttc cccttcctca aggtcaggat tgtgtagtgg aaaagaataa tcaacataag 9120
cctaaatcac acatttctaa tataaatgtt gaagccaagt tcaatactgt ggtctcccag 9180
tcagccccaa atcactgtac attagcagca tctgcatcta ctcctccttc aaatagaaaa 9240
gcactttctt gtgttcatat aactctttgt cccaagactt cttccaagtt ggatagtgga 9300
actttagatg aaagattcca ttcattggat gctgcttcta aagcgaggat gaatagtgag 9360
tttaactttg acttacatac tgtatcttcg agatcactgg aaccaacctc caaattattg 9420
accagtaaac ctgtagcaca ggatcaagaa tctttaggtt ttctaggacc taaatcttca 9480
ctggatttcc aagtcgtaca gccttctctt ccagacagta acactattac tcaggacttg 9540
aaaaccatac cttctcagaa tagccagata gtaacctcca ggcaaataca agtgaacatt 9600
tcagatttcg aaggacattc caatccagag gggaccccag tatttgcaga tcgattacca 9660
gagaagatga agaccccact ttctgctttc tctgaaaaat tgtcatctga tgcagtcact 9720
cagataacaa cagaaagtcc agaaaagacc ctattttcat ctgagatttt tattaatgct 9780
gaagatcgtg gacatgaaat tatagagcct ggtaaccaga agctacgcaa agctcctgtc 9840
aagtttgcct catcatcttc agtccaacag gttacttttt ctcgcggcac agatggccag 9900
cctttattat tgccatataa gccttctggt agtaccaaga tgtattatgt tccacaatta 9960
agacaaattc ctccatctcc ggattccaaa tcagatacca ccgttgaaag ctcccattca 10020
ggatccaatg atgccattgc tccagacttc ccagctcagg tgctaggcac aagagatgat 10080
gacctctcag ccactgttaa cattaaacat aaagaaggaa tctacagtaa gagggtagtg 10140
actaaggcat ccttgccagt gggagaaaaa cccttgcaga atgaaaatgc agatgcctca 10200
gttcaagtgc taatcactgg ggatgagaac ctctcagaca aaaaacagca agagattcac 10260
agtacaaggg cagtgactga ggctgcccag gctaaagaaa aagaatcttt gcagaaagat 10320
actgcagatt ccagtgctgc tgctgctgca gagcactcag ctcaagtagg agacccagaa 10380
atgaagaact tgccagacac taaagccatt acacagaaag aggagatcca taggaagaag 10440
acagttcccg aggaagcctg gccaaacaat aaagaatccc tacagatcaa tattgaagag 10500
tccgaatgtc attcagaatt tgaaaatact acccgttctg tcttcaggtc agcaaagttt 10560
tacattcatc atcccgtaca cctaccaagt gatcaagata tttgccatga atctttggga 10620
aagagtgttt tcatgagaca ttcttggaaa gatttctttc agcatcatcc agacaaacat 10680
agagaacaca tgtgtcttcc tcttccttat caaaacatgg acaagactaa gacagattat 10740
accagaataa agagcctcag catcaatgtg aatttgggaa acaaagaagt gatggatact 10800
actaaaagtc aagttagaga ttatccaaaa cataatggac aaattagtga tccacaaagg 10860
gatcagaagg tcaccccaga gcaaacaact cagcacactg tgagtttgaa tgaactgtgg 10920
aacaagtatc gggagcgaca gaggcaacag agacagcctg agttgggtga caggaaagaa 10980
ctgtccttgg tggaccgact tgatcgtttg gctaaaattc ttcagaatcc aatcacacat 11040
tctctccagg tctcagaaag tacacatgat gatagcagag gggaacgaag tgtgaaggaa 11100
tggagtggta gacaacagca gagaaataag cttcagaaaa agaagcggtt taaaagccta 11160
gagaaaagcc ataaaaatac aggcgagctt aaaaaaagca aggtgctttc tcatcatcga 11220
gctgggaggt ctaatcaaat taaaattgaa cagattaaat ttgataaata tattctgagt 11280
aaacagccag gttttaatta tataagcaac acttcttcgg attgtcggcc ctcagaggag 11340
agtgagctgc tcacagatac taccaccaac atcctttccg gcaccacttc tactgtcgaa 11400
tcagatatat tgacccaaac agatagagag gtggctctgc acgaaaggag tagctctgtt 11460
tccactattg acactgcccg gctgattcaa gcttttggcc atgaaagagt atgcttgtca 11520
cccagacgaa ttaaattata tagcagcatc accaaccaac agaggagata ccttgagaag 11580
cggagcaaac acagcaagaa agtgctgaat acaggtcatc ccctagtgac ttctgagcac 11640
accagaagga gacacatcca ggtagcaaac catgtgattt cttctgactc tatttcctct 11700
tctgccagta gtttcctgag ctcaaactct actttttgca acaagcagaa tgtacacatg 11760
ttaaacaagg gcatacaagc aggtaacttg gagattgtga acggtgccaa aaaacacact 11820
cgagatgttg ggataacttt cccaactcca agttccagcg aggctaaatt ggaagagaac 11880
agtgatgtga cttcttggtc agaagaaaaa cgtgaagaga aaatgctctt taccggttat 11940
cctgaggaca gaaagttaaa aaagaacaag aagaattccc atgaaggagt ttcctggttt 12000
gttcctgtgg aaaatgtgga gtctagatca aagaaggaaa acgtgcctaa cacttgtggc 12060
cctggcatct cctggtttga accaataacc aagaccagac cctggaggga gccactgcgg 12120
gagcagaact gtcaggggca gcacctggac ggtcggggct acctggcagg cccaggcaga 12180
gaggctggca gagacctact gaggccattt gtgagagcaa cccttcagga atcgcttcag 12240
tttcacagac ctgacttcat ctcccgctct ggggagcgga taaagcgcct gaagttaata 12300
gtccaggaga ggaagctgca gagcatgtta cagaccgagc gggatgcact attcaacatt 12360
gacagggaac ggcagggcca ccagaatcgc atgtgcccgc tgcccaagag agtcttcctg 12420
gctatccaga agaacaagcc tatcagcaag aaggaaatga ttcagaggtc caaacggatt 12480
tatgagcagc ttccagaagt acagaaaaag agagaagaag agaagagaaa atcagaatat 12540
aagtcatacc ggctgcgagc ccagctatat aaaaagagag tgaccaatca acttctgggg 12600
agaaaagttc cctgggactg acacaagttt attttcctca gagccttgga attctatttt 12660
atgaacctag agaagcagaa tccttacttt tgtgagtctg gttgaataaa gcttattctt 12720
tgtccatgtg tattttagaa atagtaactt ctaaagagtc tggaacaaag tggtgattaa 12780
aattcctaat ggtttgggag caatactttc tgcatagtgg ccttgtccaa tggcctgtgt 12840
gttacaatga tatgatcatt tctcaagaat aagtcccttt ttgtatgtgt ttttatactt 12900
ttagaaaata aaaactttag attaactc 12928
<210> 2
<211> 9153
<212> DNA
<213> NRXN3
<400> 2
gcttcacttc acctgtgcct ccctggtccg cgcacttcgc aggcgcccgc ccgcctctcg 60
gccacctctg cagcctgcca ggcacctcct cttgcgctct cgctgatttc gcccacccac 120
ctccctccac cccgtgccac gttggtttgg gtggctgctc cgcaccgggt tcctcctcct 180
ctcctctttc cctccagtcc ttcttattct cttcctctgg ctgcggtggc tgctgctgct 240
gctggttttc atccagttgg gaaacccagg aagccggcgg ctgctccgtg gcgctagtcc 300
agcacgccca gggttaaaag cctcgcgccc ttccgcggag actcccagga acacccgaag 360
aactcttcca cctgcagccc ccttttgcct ggcagttctg cattgcatct catggaagtg 420
gaaacaggaa aataaaaatg ttcaaactcc ttggatgttg ggataaactc acctgaaccc 480
acttgggttc gggctgcctc cttctcttcc ttcattgcca cctttcctct gtgtggctcc 540
cgggagtgtg cggttaagtc atcagactcg aagtgcctag agatccggag gaagccgcgc 600
cggtcttccc ctgacatgcg tggcatgccg gggctccgta ggaggtttgc tatacctggg 660
aggaccctgg cattctaaat ttcagctccg ggaaagagaa ggggcttttt gccttttatc 720
tttttttttt ctttctttaa gtagtaattt tttaactgat tcattgtttg gaaagcgcat 780
attgcttccc tcttccccga attctggcaa ctcttcctcc tgctatgatg ggcccttggg 840
catcatgaac ttcattactc ctcactggct ggaattcaaa ctgcccatct gtagtggtcc 900
cgtgcgttga ccatgcacct gagaatccac gcgagacgga gccctcctcg ccggccggcc 960
tggacgcttg ggatctggtt cctgttctgg ggatgtatcg tcagctctgt atggagttct 1020
tctaatgtag cttcctcctc ctccacctct tcctcgccgg ggtctcactc tcagcacgag 1080
caccatttcc atggcagcaa gcatcactca gtgcctattt ctatctatcg ttcccctgtt 1140
tcccttcgag gaggacacgc tggcgctacg tacatctttg ggaaaagtgg tgggcttatc 1200
ctctacacct ggccagccaa tgacaggccc agcacgcggt ctgaccgcct tgccgtgggc 1260
ttcagcacca ctgtgaagga tggcatcttg gtccgcatcg acagtgctcc aggacttggt 1320
gacttcctcc agcttcacat agaacagggg aaaattggag ttgtcttcaa cattggcaca 1380
gttgacatct ccatcaaaga ggagagaacc cctgtaaatg acggcaaata ccatgtggta 1440
cgcttcacca ggaacggcgg caacgccacc ctgcaggtgg acaactggcc agtgaatgaa 1500
cattatccta caggccggca gttaaccatc ttcaacactc aggcgcaaat agccattggt 1560
ggaaaggaca aaggacgcct cttccaaggc caactctctg ggctctatta tgatggtttg 1620
aaagtactga acatggcggc tgagaacaac cccaatatta aaatcaatgg aagtgttcgg 1680
ctggttggag aagtcccatc aattttggga acaacacaga cgacctccat gccaccagaa 1740
atgtctacta ctgtcatgga aaccactact acaatggcga ctaccacaac ccgtaagaat 1800
cgctctacag ccagcattca gccaacatca gatgatcttg tttcatctgc tgaatgttca 1860
agtgatgatg aagactttgt tgaatgtgag ccgagtacag gaggtgaatt agttatccct 1920
cttcttgtag aagacccttt agctacccct cctattgcta ctcgtgcacc ttccattaca 1980
ctccccccta cctttcgccc cctcctcacc attattgaga ccaccaaaga ttccctgtcc 2040
atgacctctg aggcggggtt accttgcttg tcggaccaag gcagcgatgg ttgtgatgat 2100
gatggcttgg tgatatctgg gtatggctca ggggaaacct ttgactctaa cctgccccct 2160
actgatgatg aagattttta caccaccttc tccttggtaa cagataagag tctttccact 2220
tcaatcttcg aaggtggcta caaagcacat gcgcccaagt gggaatccaa ggactttaga 2280
cctaacaaag tctccgaaac tagtaggact actaccacat ctttatcccc tgagctgatc 2340
cgcttcacag cttcctcctc gtctgggatg gtgcccaaat tgccagctgg caaaatgaat 2400
aaccgtgatc tcaaacccca gcctgatata gtcttgcttc cgttgcccac tgcctatgag 2460
ctagacagca ccaaactgaa gagcccacta attacttccc ccatgttccg taatgtgccc 2520
acagcaaacc ccacggagcc gggaatcaga cgggttccgg gggcctcaga ggtgatccgg 2580
gagtcgagca gcacaacagg gatggtcgtc ggcattgtgg ctgctgccgc cctctgcatc 2640
ttgatcctcc tgtacgccat gtacaagtac aggaacaggg acgaggggtc ctatcaagtg 2700
gacgagacgc ggaactacat cagcaactcc gcccagagca acggcacgct catgaaggag 2760
aagcagcaga gctcgaagag cggccacaag aaacagaaaa acaaggacag ggagtattac 2820
gtgtaaacat gcgaacactg ctcacacgcg agttttcaca gttatttcta tccacgccta 2880
tgaatctttg gacggtgaga tctcacagat gtcagaactg ctggaactat gaaatggggt 2940
atataaccac gactctggtg gggaaaaccg ttttttaaag gacacacaca cacacagcga 3000
tgcatctctc tctaaagctc agccacggct gcggcaaggt cccagcggtc gctgggagac 3060
agaaggtttt gtgccctgct gtatcataaa gcacacactt agcgctctgg agccggacgg 3120
tggctccacc acttccgcag gcctggaaac ttccttctcc ggaggacctt ttactaaaag 3180
gtagaagact tcatggctta cttgttccat aactccaagt gagtctgtaa tgtttgtgaa 3240
gcttgactgt aaccatgttt tttctgttta attatgtaaa aaacaaaact acaacaacaa 3300
aaaaagaaaa aagttaaaaa agaaaaaaac accaaaaaac aaaaacaaac aaaaaaaaaa 3360
acccacaacc cttatctggt tctgaccagt gtgcgtgtaa ctttatgatc tgaggggaaa 3420
aatggctttt gggtttttgt ttattttttt gataatgact ggacatcaga agaggaaaaa 3480
aactcaaaac aaaagcgaga gagactattg ccatatgaac tcaaaagcta tcatggtgtt 3540
cactctacat atcaggttat ggtgtctcta gaatctgttg tttgtttcct ataagatgct 3600
ttgctgaaca catagcaaaa ttcatgtgac ggatgataaa ttgattcgaa aagctggtcc 3660
cccaggatct aatttcagaa tttaccaccc aaacccggaa cagatgggtt tagggctggt 3720
gttatcagag ctattggctt tacgtaacaa tattgttcct gtccattcac ccagccaaat 3780
tgtgttaaag aggaaagccc cacaaactaa aacagccttt cctagggaag aggaagggga 3840
ggtgggctgg atctgtgact gattgaaatg catgcaaata aaaaagacaa tattaaagtc 3900
tgttatcaaa ccagacagta ggggagttca actcgtgatg gaaccacaaa aggtcacaca 3960
agccaaccat gtcatgccag agtacaaaac acatagttct ttccccgccc cgaatgtgac 4020
aatggttttc atagtggttt aattttgtag cctgacattt atggataact ctgtccttcc 4080
atttgctcac ttctctcttc acccatcttt tttaaaaaca aataaatgaa taaagctgct 4140
gtgacacaca cacaaaagga atttaatagt ataatatata tataaataaa tatatataca 4200
gatatattta tcatggtatg tttgatggga tgactgacac aggaaatctg ttaaagtctt 4260
aaaatggaat gagaatgttg ttttaaaaga aaatagcaaa acaacaaaaa agcaaacctt 4320
aaaatgtgaa gaaagtgtga attttagttt tgtcacagtt aactgtgtca aagagaatta 4380
aaaaaaaaaa cttcagattt tgtttacata ttttactaca tttttgctgg tataattcct 4440
tagccaccta tgtacatact gctttaagaa atgttttttt cctgtttatt tctgtttggt 4500
ttatattctg gttgtctttt tctttttgta aagaggaaac aatgtacaga aaaacaataa 4560
actggttgta tggccatagc tatccgaaaa gcaagagaca aagcaagaca aatattcaca 4620
caaaaatgaa gtgtgtcctc tggagggtca gatatacaat ttcttttgta cagatgaaaa 4680
tcaatcagct gcttagattt agaaatctac tcttgctggt ctttgtaagt tgcatgaata 4740
tttgactttg aaaaaatatc ttaacgacat ggggcaaaaa gtgcaatcta aatggtagcc 4800
tttactaatg tgtgtggaaa gaggtgttcc tcattatcta atatttcaat gtgttaagag 4860
tttaattttt ttgttatcat taaaaaagac aggattataa agagatatca aagcacgatt 4920
ttagataacc taaacggccc agcctatacg aagttgatta tatctcgatg tctgtaaaag 4980
attgctgttc ttggagtctt gaggtcttgt gaattgattt cctgctttct ttcatttttt 5040
tcaatttaag taataataca tttgttatat tcctttcagt gtaagtttct atttggacaa 5100
ttttatggga acatgtgcat tctctatgtg agcttctatc atattcctgt tttattagca 5160
gaacctaaag gaatttattt aatgatgttg tgacattact gctttttctt ttttcttttc 5220
ttagttcata tttgcatttt cgttcaagga tatgcttagc aataaaatgt tcttcccaaa 5280
accttgtatg ctgatgcact tttattttct taacatttga gaaaatctcg cactgaagct 5340
aattatgtca tatcttatta aaagccgagt aagagctaga ccactttcat gtgatagaag 5400
atattctaag cagttactaa ttattacatt atcaaaatgc catatttatg agataattat 5460
ctgttacttg aggcattatt ttttagattg ctatgataga ataaccagga gggagtgcat 5520
ttttctggaa agatgataga aacattgtat tctagaaaag attattggat actatggttt 5580
tgtttgtttg tttttgtttt ttgtttttcg ttttttgttt gttttttttt tgagacagag 5640
tctcgctctg tcgcccgggc tggagtgcag tggcacgatc tcggctcact gcaagctccg 5700
cctcccgggt tcacaccatt ctcctgcctc agccccccga gtaggtggga ctacaggtgc 5760
ccgccaccac gcccggctaa ttttttgtat ttttcgtaga gacggggttt caccgtgtta 5820
gccgggatgg tctcgatctc ctgacctcgt aatccacccg cctcggcctc ccaaagtgct 5880
gggattacag gcgtgagcca ccgcgcccgg cttggatact atgtttttta aaggcatttc 5940
gtacctttta cgtattttct ataagtcaac aagctttaaa cagtatttaa aactatgttc 6000
acatagtgcc ataagcacta gaaagtctta gatgtcttct ttccaagcct cccaccatat 6060
taaaatttaa aattaaaaaa cagaatccaa aaccaaaatt taaatgagtt cttcaatttt 6120
aacagcttct tacaagaatt tctgattaca acttgtttca tacacccatt gtagcagtaa 6180
tgtctcatat ttctcgttct ctcagcacac acttacttgg ccaattggat aatccatcta 6240
ccctttgttc ttcactgtaa tctagaaata tagatttaac tgaacagctg tcctttatcc 6300
atatgttggt taccagtttt caaagagtta gaattttaaa aatatatatt tagttaagcc 6360
tgtgccttca agataacatt agtggagtgg ttatactatc gactatgtta ggaatggggg 6420
ggagaaagtc aggttcagtg atgtcaaatt atgtaaagtt ttttttttgt tcctgtcttc 6480
aaagttctgt attagatgtt ctcccatcat tttttgagat ggagtcttgc agcctacagt 6540
gcagtggcat gatattggct cactgcaacc tctgcctctc aacctcaaac gattctcctg 6600
cctcagcctc ctgagtagct gcgactacag gcatgggcca ccacacccag ctcatttttt 6660
aatttatttt ttattttttt agtaaggaag ggtttcacca tgttggcaag gctggtctcg 6720
aactccttac ttcaagtgat ccacccacct tggccttgca aaatgctggg attataggtg 6780
tgagccactc ctcctgaaat ctttctaaat ctcactaata tataattcta ggactacttt 6840
aagcattcac tttttcttta attcaagaaa catttattga acacttatgt acaagctagt 6900
ctactattgg ctattgttac tttgtttcaa tgaaggcaga aaatggctag aaggatttta 6960
agcctttttg tctcttgtat aaatctatac aggtccagtc tctctttgct catattcaaa 7020
ttgaagtttg atctttctcc aaaaaatatc caagccctgt gtttgtccca gttgaactaa 7080
tatcttgatt atatagttta agatcagttt gataatgtct attgaatatt tactaaatga 7140
ttatgggata ttaaattgag agccttggga gcttatcatc tagtaaagat gaacaaaaaa 7200
tggtactata gtgaatgcaa ataagctatc aaaaagtaca aactaagttg ggagcttaga 7260
agaaattatg taagggaagg cttcatagaa ggggtgacat tttggtaaac cttggaaaac 7320
tgataggcag aaataagggc tgtatatcat tctaagcaaa cccttaaagt gggagcaagc 7380
aggatcaaaa ccataatttg gattgatgac agactgcaaa aagtacattg gaggaagata 7440
tgagtaggaa ggtttttgaa atcatgtcaa tgaatgggaa gagagaaatg ggagaatagc 7500
ttgagaagtt caaggtcaag ggctgctttg tcgagtacaa aggactcgag catatttgaa 7560
atgaaaggta ataactgatc tactcttatg gagcaaccga gtttcctgat agagatgttt 7620
atctggggga aaaaggcata agtcaatctt cttggagaga atgggatcag aaactgacat 7680
attgctacag aggttacaaa agctgtagtc agagggcttc agtgttctgg atatattaaa 7740
ggacaaggtc agatacccaa gtgggaccgt gagtgattaa tggcagcagt ccactgacag 7800
caccagtagg aaggcgctaa tgaaaagatc tctaaatatc agtaaggggt tagctgccat 7860
taataataca actttatagc tttactattt tttcttttat tgttgaaata gtgagggcac 7920
gtatttttct aattgtgttt attacaaaga aaacagaccc gaagaactta aatgacttct 7980
ccaaggtcac acagctaata catgacaatg tcatgactta aaatccagtc ttgtggttcc 8040
aaatttagag ctctttcata aacctgtctc tagagaagca agtcattttc tactttttcc 8100
agaagcattt gaagtggaag ctaaggcagg aaatgagagg atattgtgtt agtctactgg 8160
gattaccctg gcaaaatacc acaggctggg tagacaactg aaatgtattt ctcagttcca 8220
gaaacaaagt tgcagatcaa agtttgttag ggctcagttt ctgggaaggg ctctcttcct 8280
ggcttgtaga taataagcta ccttctcact atgtactcac agggcctttc ttctgttcat 8340
gcactgagag atttcttttt cttgctcttc ttataagacc accagtgcta ttggttaaag 8400
ccctgccatt atgactttgt ttgaccttaa ttacttccta aagacactac ctcccaatac 8460
agtcatgttt ggggttggga cttcaacata tgaatgttgg aggggatatg gttctgtttc 8520
tagcaaatgt atagtagtgg gaattgcaaa ggttgaagtt ccaaagtatc aagggaatca 8580
gaattgggaa gcaattctaa cctttttgaa gtggttacat ggcccaagta gaagagcaaa 8640
taattccaag agacaccaag ccacagagca ggtaggatca cgtgagtagg gcccaggata 8700
gaagagcagt gttagggttg catgagagtg agggcatata agacaacaac agctaaaagc 8760
aatgcatgct cagatcttgg gagatgtatt aaatgagtag agtgaatttc aagatatctg 8820
agtttttttt ttttaatgat tacatgggtt ctagagtcaa aatgccatgg ctcatctggt 8880
actgtaactt aagataaact gcttagctaa ggctcagctt tcatacctat aattttgtta 8940
tacttatctt gcaggtttct tgagaaatat tggatgaaat aattcatgtg aaatgcttaa 9000
catatgtgtg acaaataatt atccttaaat aaatgttggt cgttattaca attggctttg 9060
ttacttgatt caggcaggat caaaattagc tgctatatgc atgactaacc aggaccaaaa 9120
agttaataaa aatacgaaag tttggcactc tta 9153
<210> 3
<211> 2663
<212> DNA
<213> NTRK1
<400> 3
tgcagctggg agcgcacaga cggctgcccc gcctgagcga ggcgggcgcc gccgcgatgc 60
tgcgaggcgg acggcgcggg cagcttggct ggcacagctg ggctgcgggg ccgggcagcc 120
tgctggcttg gctgatactg gcatctgcgg gcgccgcacc ctgccccgat gcctgctgcc 180
cccacggctc ctcgggactg cgatgcaccc gggatggggc cctggatagc ctccaccacc 240
tgcccggcgc agagaacctg actgagctct acatcgagaa ccagcagcat ctgcagcatc 300
tggagctccg tgatctgagg ggcctggggg agctgagaaa cctcaccatc gtgaagagtg 360
gtctccgttt cgtggcgcca gatgccttcc atttcactcc tcggctcagt cgcctgaatc 420
tctccttcaa cgctctggag tctctctcct ggaaaactgt gcagggcctc tccttacagg 480
aactggtcct gtcggggaac cctctgcact gttcttgtgc cctgcgctgg ctacagcgct 540
gggaggagga gggactgggc ggagtgcctg aacagaagct gcagtgtcat gggcaagggc 600
ccctggccca catgcccaat gccagctgtg gtgtgcccac gctgaaggtc caggtgccca 660
atgcctcggt ggatgtgggg gacgacgtgc tgctgcggtg ccaggtggag gggcggggcc 720
tggagcaggc cggctggatc ctcacagagc tggagcagtc agccacggtg atgaaatctg 780
ggggtctgcc atccctgggg ctgaccctgg ccaatgtcac cagtgacctc aacaggaaga 840
acgtgacgtg ctgggcagag aacgatgtgg gccgggcaga ggtctctgtt caggtcaacg 900
tctccttccc ggccagtgtg cagctgcaca cggcggtgga gatgcaccac tggtgcatcc 960
ccttctctgt ggatgggcag ccggcaccgt ctctgcgctg gctcttcaat ggctccgtgc 1020
tcaatgagac cagcttcatc ttcactgagt tcctggagcc ggcagccaat gagaccgtgc 1080
ggcacgggtg tctgcgcctc aaccagccca cccacgtcaa caacggcaac tacacgctgc 1140
tggctgccaa ccccttcggc caggcctccg cctccatcat ggctgccttc atggacaacc 1200
ctttcgagtt caaccccgag gaccccatcc ctgtctcctt ctcgccggtg gacactaaca 1260
gcacatctgg agacccggtg gagaagaagg acgaaacacc ttttggggtc tcggtggctg 1320
tgggcctggc cgtctttgcc tgcctcttcc tttctacgct gctccttgtg ctcaacaaat 1380
gtggacggag aaacaagttt gggatcaacc gcccggctgt gctggctcca gaggatgggc 1440
tggccatgtc cctgcatttc atgacattgg gtggcagctc cctgtccccc accgagggca 1500
aaggctctgg gctccaaggc cacatcatcg agaacccaca atacttcagt gatgcctgtg 1560
ttcaccacat caagcgccgg gacatcgtgc tcaagtggga gctgggggag ggcgcctttg 1620
ggaaggtctt ccttgctgag tgccacaacc tcctgcctga gcaggacaag atgctggtgg 1680
ctgtcaaggc actgaaggag gcgtccgaga gtgctcggca ggacttccag cgtgaggctg 1740
agctgctcac catgctgcag caccagcaca tcgtgcgctt cttcggcgtc tgcaccgagg 1800
gccgccccct gctcatggtc tttgagtata tgcggcacgg ggacctcaac cgcttcctcc 1860
gatcccatgg acctgatgcc aagctgctgg ctggtgggga ggatgtggct ccaggccccc 1920
tgggtctggg gcagctgctg gccgtggcta gccaggtcgc tgcggggatg gtgtacctgg 1980
cgggtctgca ttttgtgcac cgggacctgg ccacacgcaa ctgtctagtg ggccagggac 2040
tggtggtcaa gattggtgat tttggcatga gcagggatat ctacagcacc gactattacc 2100
gtgtgggagg ccgcaccatg ctgcccattc gctggatgcc gcccgagagc atcctgtacc 2160
gtaagttcac caccgagagc gacgtgtgga gcttcggcgt ggtgctctgg gagatcttca 2220
cctacggcaa gcagccctgg taccagctct ccaacacgga ggcaatcgac tgcatcacgc 2280
agggacgtga gttggagcgg ccacgtgcct gcccaccaga ggtctacgcc atcatgcggg 2340
gctgctggca gcgggagccc cagcaacgcc acagcatcaa ggatgtgcac gcccggctgc 2400
aagccctggc ccaggcacct cctgtctacc tggatgtcct gggctagggg gccggcccag 2460
gggctgggag tggttagccg gaatactggg gcctgccctc agcatccccc atagctccca 2520
gcagccccag ggtgatctca aagtatctaa ttcaccctca gcatgtggga agggacaggt 2580
gggggctggg agtagaggat gttcctgctt ctctaggcaa ggtcccgtca tagcaattat 2640
atttattatc ccttgaaaaa aaa 2663
<210> 4
<211> 10085
<212> DNA
<213> TRIOBP
<400> 4
actcccaccc cggcagcccc tgtgcgtgga aacccagcca aggtctgatg atggaggagc 60
cttggccctg gctgtcccag gggaggaggt gaaattcctc agctctccac caagattggc 120
cacaaaagcc tgatcccctg gaacacagca ggcctcacat agacggtcag ccattggatc 180
ataggaactg ccctggcctg actcacccaa tatggaggag gtgcctgggg atgccctgtg 240
tgaacacttt gaggccaaca tacttaccca gaaccgctgt caaaactgct tccaccctga 300
ggaggcccat ggagcaagat accaggagct caggagccct tcaggtgctg aggtgcccta 360
ctgcgacctg cctcgatgtc cacctgcccc tgaggaccca ctcagcgcct caacctccgg 420
ctgccagtct gtggtggacc caggcctcag gccagggccc aagaggggcc catccccctc 480
agcagggctc ccagaagagg gtcccacagc tgcccccagg agcaggagcc gggagcttga 540
ggcagtaccc tatctggagg gcctgaccac ttccttgtgt ggcagctgca acgaggaccc 600
cggctctgac cccacctcca gccctgactc cgccacccct gatgatacca gcaactcgtc 660
ctctgtggac tgggacactg ttgagaggca ggaggaggag gcccccagct gggacgagct 720
cgcagtgatg atcccgagga ggcctcggga ggggccgaga gctgacagct cccaaagggc 780
tccgtctctc ctcaccaggt cccctgtggg aggagatgct gcaggccaga aaaaggagga 840
caccggcggt gggggccgga gcgcaggaca gcactgggca aggctccggg gagaaagcgg 900
gttgtccctg gagcggcacc ggtcaacact gacccaggct tcctccatga caccacacag 960
tggacctcga agcaccacgt ctcaggcttc tcctgcccaa agggacactg ctcaggctgc 1020
ctctacacgt gaaatcccca gagcctcctc tccccatcga atcacccaaa gggacacctc 1080
cagggcctca tccacccaac aggaaatctc cagggcctca tccacccaac aggaaacctc 1140
cagggcctca tccacccaag aggacacccc tagggcctca tccacccaag aggacacccc 1200
cagggcctca tctacacagt ggaacacccc cagagcttcc tctccctcac gaagcaccca 1260
actggataac cccagaacct cttctaccca gcaggacaac ccccaaactt cttttcctac 1320
ttgtactccc cagcgggaaa accccaggac accctgtgtc cagcaggacg atcccagagc 1380
ctcctctccc aacagaacca ctcaacgaga gaattccaga acatcctgtg cccagcggga 1440
caatcccaaa gcctccagaa cctcctctcc caatagagcc acacgagaca accccagaac 1500
atcctgcgcc cagcgggaca atcccagagc ctcctctccc agtagagcta cacgagacaa 1560
ccccacaaca tcctgtgccc agcgggacaa tcccagagcc tccagaacct cctctcccaa 1620
tagagccaca cgagacaacc ccagaacatc ctgtgcccag cgggacaatc ccagagcctc 1680
ctctcccagt agagctacac gagacaaccc cacaacatcc tgtgcccagc gggacaatcc 1740
cagagcctcc agaacctcct ctcccaatag agccacacga gacaacccca gaacatcctg 1800
cgcccagcgg gacaatccca gagcctcctc tcccaataga gctgcacgag acaaccccac 1860
aacatcctgt gcccagcggg acaatcccag agcctccaga acctcctctc ccaatagagc 1920
cacacgagac aaccccagaa catcctgtgc ccagcgggac aatcccagag cctcctctcc 1980
caatagagct acacgagaca accccacaac atcctgtgcc cagcgggaca atcccagagc 2040
ctccagaacc tcctctccca atagagccac acgagataac cccagaacat cctgtgccca 2100
gcgggacaat cccagagcct cctctcccaa cagaaccacc caacaagaca gccccagaac 2160
atcctgtgcc cgacgggacg atcccagagc ctcctctcct aacagaacca tccaacaaga 2220
gaaccccaga acatcctgtg ccctacggga caatcccaga gcctcctctc ccagcagaac 2280
catccaacaa gagaacccca gaacatcctg tgcccaacgg gacgatccca gagcctcctc 2340
tcctaacaga accacccaac aagagaaccc cagaacatcc tgtgcccgac gggacaatcc 2400
cagagcctcc tctcgcaaca gaaccatcca gcgagacaac cccagaacat cctgtgccca 2460
gcgggacaat cccagagcct cctctcctaa cagaaccatc caacaagaga acctcagaac 2520
atcctgtacc cgacaggaca atcccaggac ctcctctccc aatagagcca cacgagacaa 2580
ccccagaaca tcctgtgccc agcgggacaa tctcagagcc tcctctccca tcagagccac 2640
ccaacaggac aaccccagaa cttgtattca acagaacatc cccagatcat cttctaccca 2700
acaagacaac cctaaaacct cttgtaccaa acgagataac ctcagaccca cttgtacaca 2760
gcgggaccgc acacagtcct tttcctttca acgagacaac cctggaacct cctcatctca 2820
atgctgcacc caaaaggaga atctgagacc atcatctccc caccgctcca ctcaatggaa 2880
caatcccagg aattcatctc cccatcgtac taacaaagac atcccctggg cctcgtttcc 2940
cctccggcca actcagagtg atggtccccg aacctcttcc ccatctcgct ccaagcaaag 3000
cgaggttccc tgggcatcca tcgccctccg gccaacccaa ggtgacaggc ctcagacatc 3060
ctctcccagc aggccagccc agcatgaccc accccagtcc tcctttggcc ccacccagta 3120
caacttgcca tcccgggcca cctcttcctc ccataaccca ggccaccaga gcacctcccg 3180
aacttcctca cctgtgtacc ccgctgccta tggggctccc ctgacctctc ctgagccctc 3240
ccagcctcca tgtgctgtgt gcattgggca ccgggatgcc cctcgagcct cttcgccccc 3300
tcgctatttg cagcacgacc ccttcccctt cttcccagag ccccgcgccc ctgagagtga 3360
accgccccac cacgagcctc cctatatacc acctgctgtg tgcattggac accgagatgc 3420
cccccgggcg tcctcgcccc cccgccacac ccaatttgac cccttcccct tcctcccaga 3480
cacatcagat gccgagcatc agtgtcagtc cccccaacac gagccccttc agctccctgc 3540
acctgtgtgt attgggtacc gagatgcacc ccgggcctcc tccccaccac gccaggcccc 3600
agagccttcc ctcttattcc aggacctccc cagggccagc acagagagcc ttgtcccttc 3660
catggactct ctgcacgagt gcccccacat ccccacccct gtgtgcattg ggcaccggga 3720
tgcaccctcc ttctcatccc caccacgcca ggctcctgag ccatccctct tcttccagga 3780
tccccctgga actagtatgg agagcctggc cccctccact gactctctgc atggctcccc 3840
agtgctgatc ccccaagtgt gcatcgggca ccgggatgca ccccgagcct cctccccacc 3900
ccgccaccca cccagtgacc tagcgttcct ggcaccctca ccttcaccgg gcagctctgg 3960
gggctcccgg ggctcagcgc ctcccgggga gaccaggcac aacttggagc gggaggagta 4020
cactgtgctg gccgacctgc ccccacccag gaggctggcc cagagacagc cagggcccca 4080
ggcgcagtgc agcagcgggg gccgcaccca cagccctggc cgtgcagagg tggagcgcct 4140
cttcgggcaa gagcgcagga agtccgaggc agcgggggcc ttccaggccc aggacgaggg 4200
acggtcacag cagcccagcc aaggccagag ccaacttctc cgaagacagt ccagccctgc 4260
ccccagcagg caggtgacca tgctccctgc caaacaggca gaactgaccc ggcggagcca 4320
agcagagccc cctcatcctt ggagtcctga gaagagacct gagggagatc ggcagctcca 4380
ggggtccccg ctgcccccca ggacatcagc caggacccct gagagggagc tgcggacaca 4440
gagacctctg gagagtggcc aagcaggccc aagacagcct ctgggggtgt ggcagagtca 4500
ggaggaaccg ccagggtccc agggccctca tagacaccta gaaaggagct ggagcagcca 4560
ggagggaggc ctgggccctg ggggctggtg gggatgtgga gagcccagcc tgggggcagc 4620
caaagccccg gagggagcat gggggggcac ttccagggag tacaaggaga gctgggggca 4680
gccagaggcc tgggaggaga agcccactca tgagctcccc agagaactag gaaagagaag 4740
cccactcacg agcccccctg agaactgggg aggccccgca gagtcctcac aatcctggca 4800
ctctgggaca cccactgctg tgggctgggg ggcagaggga gcgtgtccat acccgcgtgg 4860
ctctgagagg cgacccgagc ttgactggag ggatctgctt ggccttctcc gggcaccagg 4920
agagggggtc tgggcccgtg tccccagcct ggactgggag ggcctcttgg agctcctgca 4980
ggccaggctg ccccgcaagg acccagctgg acacagggat gacctggcca gggctttagg 5040
gccagagctg ggtcccccag gcacaaacga tgtccctgag caggagtcac acagccagcc 5100
agaaggctgg gccgaggcca ccccagtcaa tggacacagc cccgcactgc agtcccagag 5160
cccggtccag ctgcccagcc ctgcctgcac ctccacccag tggccaaaga tcaaagtgac 5220
aagaggacca gcgaccgcaa ctctggcagg cctggagcag acgggccccc tggggagcag 5280
gagcactgcg aagggcccca gcttgccaga gctgcagttc caaccagagg agcctgagga 5340
gtcagaacca agcagaggcc aagaccccct gactgaccag aagcaggcag actcggcaga 5400
caagaggcca gcagagggca aggctgggag cccgctcaag ggccgactgg tgacctcatg 5460
gcggatgccc ggggaccggc ccacgctgtt caatccgttc ctgctgtctc tgggggtcct 5520
caggtggcga aggcccgatc tgctcaactt caagaaggga tggatgtcga tcttggacga 5580
gcctggagag cctccctccc cctcgctcac caccacctct acttcgcagt ggaagaaaca 5640
ttggtttgtg ctgacagatt caagtctcaa atattacaga gactccactg ctgaggaggc 5700
agatgagctg gatggtgaga tcgacctgcg ttcctgcacg gatgtcactg agtacgcggt 5760
gcagcgcaac tatggcttcc agatccacac caaggatgct gtctatacct tgtcggccat 5820
gacctcaggc atccggcgga actggatcga ggctctgaga aagaccgtac gtccaacttc 5880
agccccagat gtcaccaagc tctcggactc taacaaggag aacgcgctgc acagctacag 5940
cacccagaag ggccccctga aggcagggga gcagcgggcg ggctctgagg tcatcagccg 6000
gggtggccct cggaaggcgg acgggcagcg tcaggccttg gactacgtgg agctctcgcc 6060
gctgacccag gcttccccgc agcgggcccg caccccagcc cgcactcctg accgcctggc 6120
caagcaggag gagctggagc gggacctggc ccagcgctcc gaggagcggc gcaagtggtt 6180
tgaggccaca gacagcagga ccccagaggt gcctgctggt gaggggccgc gccggggcct 6240
gggtgccccc ctgactgagg accagcaaaa ccggcttagt gaggagatcg agaagaagtg 6300
gcaggagctg gagaagctgc ccctgcggga gaataagcgg gtgcccctca ctgccctgct 6360
caaccaaagc cgcggagagc gccgagggcc cccaagtgac ggccacgagg cactggagaa 6420
ggaggttcag gctcttcggg cccagctgga ggcgtggcgt ctccaagggg aggctcctca 6480
gagtgcactg agatcccagg aggatggcca catccccccg ggctacatct cacaggaggc 6540
atgtgagcgc agcctggcag agatggagtc ctcgcaccag caggtgatgg aggagctgca 6600
gcggcaccac gagcgggagc tgcagcgcct gcagcaggag aaggagtggc tcctggctga 6660
ggagacggca gccacggcct cagccattga agccatgaag aaggcctacc aggaagagct 6720
gagccgagag ctgagcaaaa cacggagtct ccagcagggc ccggatggcc tccggaagca 6780
gcaccagtca gatgtggagg cactgaagcg agagctgcag gtgctatcgg agcagtactc 6840
gcagaagtgc ctggagattg gggcactcat gcggcaggct gaggagcgcg agcacacgct 6900
gcgccgctgc cagcaggagg gccaggagct gctgcgccac aaccaggagc tgcatggccg 6960
cctgtcagag gagatagacc agctgcgcgg cttcattgcc tcgcagggca tgggcaatgg 7020
ctgcgggcgc agcaacgagc ggagttcctg cgagctagag gtgctgcttc gcgtaaaaga 7080
aaacgaactc cagtacctaa agaaggaggt gcagtgcctc cgggacgagc tccagatgat 7140
gcagaaggac aagcgcttca cctcgggaaa gtaccaggac gtctatgtgg agctgagcca 7200
catcaagaca cggtctgagc gggagatcga gcagctgaag gagcacctgc gtcttgccat 7260
ggccgccctc caggagaagg agtcgatgcg caacagcctg gctgagtaga ggtcccgccc 7320
agctgcagac cctccaggct ggaggaccag ccgccctcct tccctcctgg atggaagtaa 7380
aaagccaagc tttctcccca ccctctgtgg gccacacgtg cacttgcacc caccacacac 7440
acacacacac acacacacac acacacagac acacagacac atacgcacac acgtgcacac 7500
atgtacacac ggatacacac acacacacac acactgcata tctgagcgcg cccctcgcac 7560
tgggtctcac cttgcacctt cttcaggatt ttatatgtga agagattttt atatagattt 7620
ttttcctttt tttccaaaac actttatact ttaaaaaaaa aaaaaaaaag caattcctgg 7680
tggctgtgtg cctccaaccc tggtccccct ctgtctccag ccaccctctg cttgggcttc 7740
tgagctggtg gccctggccc agaggtctgg cggaggccca ggcagcagcc atggcggggt 7800
gtctctacag gggagaggcg ggagcctgcc accctcttcc tgccctacct cctactaaca 7860
cttcctgccc catttggacc cgtaccatgg ggctcaggac agagggagct agcagctggc 7920
ctccatggcc ccacagcctc cttcgaggct gtgctgggtg cagaaccgcc agagccaccc 7980
aaaaggtgtt tctcttctgc tccctgaacc tcttaactta ataaaacgtt ccagcagctc 8040
tggtgtccta gatggctggc agaacaggaa tggagattgg ggtttcttga agtggcttcc 8100
ccactcacac cctacccaca ccccaccctt cctaaagcag cggcctctag gcttctgagg 8160
gtggggctga aaatccaagg tctcccttag tacagactgt gacgccccca gtgtggcttg 8220
caggctagtg gcagcggaag catgtgggaa atagcaagtc cagtcccacc ccaacctact 8280
gaaccagcgt ctgcatttta acagggtgcc ccagtgattc acgtgacctt caaagtctga 8340
ggagccctgg agtagggccc agggcccagg cctgagagag aggcctgggg ctaagactag 8400
ccctgaccat gaccttgggc aagtcacacc cctcactgag cctcagtttg cttctccatc 8460
aaatgggtgt ttttctttca gtcccagtcc tctcctgagg cttttcccag aggtcatgcc 8520
cagccctggg caggggtgag ggcagggttg tggctgccag gcacaggtcc agcgggctgg 8580
gagtcctcac catggctggc tgtgctgatt atggttgcat ggggctggga agaggtccca 8640
tttctgagcc acagaaacag gccacatcca gtaggggtcc tggaaggctg tgagaaccca 8700
gaggagaccc tgacccagcc tgcaggtaga agactgcctt tggaggcagc tttgaaagat 8760
gactcttcca gatggaagaa tcaggaaggg ccttcccacg tggaggcacc agcaggagca 8820
aacgtccctg gtgtgttcag gcaaagagcc acaggagagt gacctcgtgg agtgggaaga 8880
gattgtttcc cattcccttg ccagggattg gttgaggaat ggacaaggct tgcagttcac 8940
gcaagccagt gaaatgcgag gggaagtctt gggagtgggg tggaggaggt catctgggaa 9000
gggtgtcctt ggtcttaaaa agaggcacaa gaggccgggc gcggtggctc ttgcctatta 9060
tcctagcact ttgggaggcc aaggcagggg gatcacttga ggtcaggagt tcgagaccag 9120
cctggccaac atggtgaaac cccgtctcta ctaaaaatac aaaaaattag ccagacgtgg 9180
tgccaagcac ctgtaatccc agctactcag gaggctgagg caggagaatc acttgaaccc 9240
aggaggcaga agttgcagtg agccaagatc gcgccactgc actccagcct gtgtgacaag 9300
ggcgaaactc catctcaaaa aaaaaggggg agggtggcgc aaggagagga cacctctctc 9360
ctggccctgt cgccatcttc cctcatcaat agctaaaaat ggcaaagaag aaagagccag 9420
gaccccgtgc catcaaatcc tccggccttg tgctgccctg tctcggcact gcttgcctta 9480
ggagatcagg agtgttccta gccactggga gatgggatgc ctgccactgg cagctctgcc 9540
gtccatcctc accatcccac cgtcccccca agacagctct ccatcccatc ctctgcctcc 9600
cttctagcct caacctaact cagggctccc ccgtctcaca cctgggttgc aggaacatcc 9660
tcttcaccaa cccccctccc atccctcctc agggctgcct agggcagcta caaaaaccag 9720
gccagcctct gaaaggtgct ccacatctca ttaaaaaccg tgaaatcgca ctgccccact 9780
atcagaatag ctcagaggag aaggtctgcc agtaccaagt gctggtgggg atacggagaa 9840
gagcagctcc caggcgctgc tggtgcaaat gtgctttgtt gcacccacgg caggaaactg 9900
accagcttct catcaagtta aatacgcatc taccctatgg cctagcattt ccactcttgc 9960
ttacacatcc aggagaaatg agtccttaca tgcacaaaag gatgagtacc gtaatactca 10020
catcagcaaa taaacaatac agctgtgtgt cagtagtaga atgaataaat tgtggtcgat 10080
tcata 10085
<210> 5
<211> 6394
<212> DNA
<213> COL22A1
<400> 5
agcttgcccc tggggaggct ccagacagct ttgttcctgg gcagtggcgg ggctggccga 60
ggctgcggcg tttctcccca aggaagtgtc ttctccgctt tccctgttct tctgtttctc 120
acacactttc tatctcattc tgtaactttc aagcctttcc ttctaactgt atgtatttag 180
ttacttgttt tcaagctggt tccctctctg gccccctggc ctggggaaag cctccacact 240
tactgcgggt cttgtttaga gtctgagttt gtgagattat ttgggggaga gtgggcgagt 300
ggctgacagg tgacccccag gaggaggatt cctggggctg gtgtcttctc ccagctgctg 360
cttccagtgg gcctgggccc aggactggac ctccgctggc acccctgagt gcctccctgc 420
caggccatgc tgctgtagac cctaacagcg tctcttcctg gccaagagaa gcctgtcccc 480
aagaacagga gagccatggc cggcctccga gggaacgctg tggctggcct cctctggatg 540
ctgctgctgt ggagtggggg cggcggctgc caggctcagc gggcaggttg caaaagtgtc 600
cactacgatc tggtcttcct cctggacacc tcctccagcg tgggcaagga ggactttgag 660
aaggtccggc agtgggtggc caacctggtg gacaccttcg aggtgggccc cgaccgcacc 720
cgtgtggggg tcgtgcgcta cagcgaccgg cccaccacgg ccttcgagtt gggactcttt 780
ggctcgcagg aggaggtcaa ggcggctgcc cggcgtctcg cctaccacgg gggcaacacc 840
aacacgggag acgcgctccg ctacatcacg gcccgcagct tctccccaca cgccggcggc 900
cgccccaggg accgcgccta caagcaggtg gccatcctgc tcaccgacgg ccgcagccag 960
gacctggtgc tggacgccgc ggcggcagcc caccgcgctg gcatccgcat ctttgccgtg 1020
ggcgtgggcg aggcactcaa ggaggagctg gaggagatcg cctcagagcc caagtccgcc 1080
cacgtcttcc acgtgtccga cttcaatgcc atcgacaaga tccggggcaa gctgcggcgc 1140
cgtctttgtg aaaatgtgct ctgtcctagc gttcgtgtag aaggagatcg ctttaagcac 1200
accaatggag gaaccaagga aatcacaggt tttgacctga tggatttgtt cagtgtgaag 1260
gaaatcttgg ggaagagaga gaatggagct cagagttcct atgtacggat gggatccttc 1320
cctgtggtgc aaagtactga ggatgtgttc ccccaaggtt tacctgatga gtacgccttt 1380
gtcacaacct tccggttcag gaaaacctct cggaaggaag actggtatat ctggcaggtc 1440
atcgaccagt acagcatccc acaggtctcc atccggctgg atggtgaaaa caaggcagtc 1500
gagtacaacg ctgtgggtgc catgaaagat gctgtcaggg tggtcttccg aggttctcgg 1560
gtcaatgacc tctttgaccg ggactggcac aagatggccc tgagcatcca ggcccagaac 1620
gtctccctgc acattgactg tgcgctggtg cagacactac ccatcgagga acgggagaac 1680
attgacatcc agggcaagac tgtgattggc aagcgcctct acgacagtgt gcccattgac 1740
tttgacctac agcggattgt gatctattgt gactcgagac acgcagaatt ggagacttgt 1800
tgtgatatcc cctcgggtcc gtgccaggtg accgtggtga cagagcctcc acctccaccc 1860
ccaccccagc ggcctcccac cccaggcagt gaacagattg ggtttttgaa gaccatcaac 1920
tgctcctgcc cagctggaga gaagggtgaa atgggagttg ctggccccat ggggctccct 1980
ggtccaaagg gagacatagg agccattggg ccggttggcg ctcctggacc taagggagag 2040
aaaggtgatg tgggcatagg accttttggc caaggggaaa agggtgaaaa gggttccctg 2100
ggcctgcccg gcccccctgg gagagacggc agcaaaggca tgagagggga gccaggagag 2160
ctgggagagc cggggctgcc gggtgaggtc ggcatgcggg ggccccaagg accacctgga 2220
ctccccggac ctcctggacg tgtcggagct cctggtctcc aaggagaacg aggtgaaaag 2280
ggaactcgag gagaaaaggg agagcgaggc ctggatggat tccctgggaa gcctggggac 2340
acaggacagc agggcaggcc cggcccttct ggtgtggcag gaccccaggg agaaaagggt 2400
gacgtgggac ctgcggggcc acctggtgta ccaggctcag tggtgcagca agagggcttg 2460
aaaggggaac agggagctcc aggacccaga ggtcaccaag gcgcccccgg tcctccagga 2520
gctcggggtc caataggccc agaaggcagg gatggacctc ctggtttgca aggtctccga 2580
gggaagaaag gtgacatggg accacctgga atccctggat tgctggggct gcagggccct 2640
ccaggacccc ctggtgtccc aggcccccct ggaccgggag gttctccggg tttgcctgga 2700
gagatcggct tcccgggaaa gcctggacct cctgggccca cgggaccccc tggaaaggac 2760
gggccaaatg gaccaccagg tccgccagga accaagggag aaccaggaga aagaggggaa 2820
gatggtctgc ctggaaaacc aggccttcgg ggagaaattg gggagcaggg cctggcaggc 2880
cgacctggag agaagggaga agcaggcctc ccaggggctc caggcttccc aggtgtgaga 2940
ggagagaaag gagaccaggg agaaaaaggt gaactgggac ttccaggact gaaaggtgac 3000
cgaggtgaaa agggtgaagc tggtcctgca ggccctcccg ggttacctgg aactacatcc 3060
ctgttcacac cacatccacg gatgcccgga gaacaagggc ccaaaggaga gaagggcgat 3120
ccaggcctgc ctggggaacc gggactgcag ggccgtcctg gagaattggg gcctcaggga 3180
cccactggac caccgggtgc caagggacag gaaggtgcac atggggctcc tggagcagct 3240
ggaaaccccg gtgctcccgg acatgtcggt gcccccggtc ccagtggccc tccaggaagt 3300
gtgggtgctc ccggcctcag aggcacccca gggaaagatg gggagcgtgg tgagaagggt 3360
gcagcggggg aagaaggcag cccagggcca gttggtccca ggggagatcc tggtgctcct 3420
gggctccctg ggccacccgg aaaagggaag gatggagagc cgggactccg tggatcacct 3480
ggactccctg gacccctagg aaccaaggct gcttgcggaa aagtcagagg gtcagaaaac 3540
tgtgcactgg gagggcaatg tgttaagggg gatcgaggag ctcctgggat ccctggttct 3600
cctggcagcc gtggtgaccc aggcattggg gttgctggcc ctcctggccc ttccggacca 3660
ccaggagaca aaggatcccc gggatcacga ggcttacctg gattccctgg cccccagggc 3720
ccagccggcc gggacggtgc accaggaaat ccaggagaaa gagggcctcc tggcaagccg 3780
ggcctctctt cactactgtc tccaggggac ataaatctct tggctaagga tgtgtgcaat 3840
gactgccctc ctggcccccc aggcctccct ggtctaccag gttttaaagg ggacaaaggt 3900
gtcccaggaa agccagggag agaaggcaca gaagggaaaa agggagaggc tgggcctcca 3960
ggcctaccag ggcccccagg aatagctgga ccacagggaa gtcaaggaga acgtggtgca 4020
gatggtgagg ttgggcagaa aggtgatcag ggtcatcctg gagttccagg tttcatgggg 4080
cccccaggga accctgggcc accaggggca gatggaattg caggagctgc tggaccacca 4140
ggaatccaag ggtcacctgg gaaagaaggc cctcctggcc cccaaggccc atctggatta 4200
cccggaatcc caggagaaga aggcaaagag ggcagagatg gaaagccggg tccccctgga 4260
gagccgggca aagcaggaga gccaggtcta ccaggaccag agggtgcccg aggcccacct 4320
ggcttcaagg gacacacagg cgattctggt gcacccggtc cccggggaga gtctggtgcc 4380
atggggcttc ctggtcagga agggttacca ggaaaagatg gtgacactgg acccactggg 4440
ccacagggtc cccaaggacc aaggggccca ccgggcaaga atggatcacc gggatctcca 4500
ggagagcctg gcccttcagg aacccctggc cagaaaggaa gcaaagggga aaatggcagc 4560
ccaggacttc ctggcttcct gggtccccgt gggcctccgg gagaaccagg agagaaagga 4620
gtcccaggca aggagggggt ccctgggaag cctggagagc ctggattcaa aggagaaagg 4680
ggagatcctg ggatcaaagg tgacaaagga cctcctggtg gaaaaggcca gcctggggac 4740
cctggaatcc caggccacaa aggccacaca ggcctgatgg gtccccaagg actacctggg 4800
gagaatggac cagttggacc cccagggcct ccaggccagc cgggatttcc aggactgagg 4860
ggggagtctc catccatgga aaccctgcgt cggcttattc aagaagagct ggggaagcag 4920
cttgaaacca gactcgccta cctcctggcc cagatgcccc cggcgtacat gaagtcatct 4980
caaggcagac ctgggccccc agggccccct ggaaaagatg ggcttccagg ccgggccggc 5040
cccatggggg agccaggtcg tcctgggcag gggggtctgg aaggaccctc tggacccata 5100
ggtcccaaag gtgagcgagg agccaaaggt gacccaggtg cacctggagt tggcctccga 5160
ggcgagatgg gaccccctgg aatcccaggt caacccgggg aacctggcta tgctaaagat 5220
ggacttcctg ggatccctgg ccctcaaggg gagacaggac cagctggaca tcctggcctc 5280
ccaggacctc ccggtccccc aggccaatgt gacccttccc agtgtgccta cttcgccagc 5340
cttgctgccc ggccgggtaa tgtgaagggt ccctaaagga ctctggaaag ccagaagact 5400
gcagtggatt tctgaaactt gaactcagag cccagtggga agccagaggt cttgaaagac 5460
ttcagccatg tgttcctttt ttttttcttt cttttatcgt ttgctttttg ttttattttc 5520
ttgagagacc tcaaaattat taaatccaac agacgctgcc ggtcggtcag attattatta 5580
atattattgt tgttgttaat tattattatt atttcatatg ctgatgcttt gtgagttctt 5640
ttccactcct ttaaagttgg gaaaacttga ttcgtggggc aggagattgt ttcttcattc 5700
ttctgacagc ccccatctga cgcgtaactg cccattttaa ggaaactctt ggtgctacaa 5760
aaccctgacc agacacttgg caaatttacc tctttcttca aaagaaaaac tttaagaaaa 5820
tgagccaatg ggcttcattc tcagtcatgc ccggagatca cccaggagaa ataatacaaa 5880
caccaccact gtccagagag agtaaagaag cagaaagaga aagaatttgc aaccatgagg 5940
aatgttccca cctcccgacg ggacgtgcat ttggaaaaca cagaatcagc cctcagggtg 6000
cactccagcc acctcagtgc tctaagctca cagaagtgaa ataatgtctg tgggttggca 6060
atggctttgt gggatcatat gtcttggcca aagatgggaa aacctatgtt gaagaggcag 6120
cccttgagtg ttaatttgtc ttctaaactg tgtaaggccc cttcaagttc ctcttgttgg 6180
tttcaattat attaattata aaacaagtgg atgtggtgac catccacttg tgtttcccta 6240
atgatgggca gttggccagg gcactgacca gagctgggaa atttgtatct ccaaggcggc 6300
tctgtctctg aaataaatgg catcaagtgc atgtgtgtat gcgacatgcc ctgcctgaac 6360
aggtgctcaa taaatccaag tttccttctc ttga 6394
<210> 6
<211> 5082
<212> DNA
<213> FHOD3
<400> 6
gagcctgcga gtccgcgagc cagcgagctg cggctgcggc ctcccctgcg cgcagctacc 60
cgggcgtccc ggcccgcggc cccgctaacc ccggggcccg cgcccccgcg gcagggatgc 120
atcatggcca cgctggcttg ccgggtgcag ttcttggacg acacggaccc tttcaacagc 180
accaacttcc ccgagcccag ccggccgccg ctgttcacgt tccgcgagga cctcgcgctc 240
ggcacccagc tggcgggggt ccataggctg ctgcaggcgc cgcacaagct ggatgactgt 300
actctgcagc tctctcacaa tggcgcctac ctggatttgg aggccaccct ggcagagcag 360
cgggatgagt tggaaggctt ccaggatgac gccgggcggg gcaagaagca cagcatcatc 420
ctaaggacgc agctgtctgt gagggtccat gcctgcatcg aaaaactata caactccagc 480
ggacgagatt tgagaagggc cctcttctcc ctgaagcaga tatttcagga tgacaaggat 540
ttggtgcatg aatttgtagt ggctgaaggt ctgacatgtt tgatcaaggt gggagctgag 600
gctgatcaga actatcagaa ctacatctta agggctttgg gccagattat gttgtatgtg 660
gatggaatga atggagtaat aaaccgcaat gaaaccattc agtggctgta cactctcatt 720
gggtcaaagt tccgcctggt ggtgaagaca gccctgaagc tgctgctcgt ctttgtagag 780
tactcggagt ccaacgcacc tctcctaatt caggctgtca ctgctgttga cacgaaaaga 840
ggggtcaaac cttggtcaaa tatcatggaa atcctggagg aaaaagatgg agttgatacg 900
gagctactgg tttatgcaat gactttggtg aacaagacgt tatcaggact accagaccaa 960
gacaccttct acgacgtcgt ggactgcctg gaggagctgg gcattgctgc tgtgtcccag 1020
aggcacttga acaagaaagg gactgacctg gacttagtgg agcaactcaa catttatgag 1080
gtggcgctca ggcacgagga tggcgatgag accacggagc caccccccag tgggtgccgg 1140
gaccggagga gggccagcgt gtgttccagt ggcggaggcg agcaccgggg cctggaccgc 1200
agaaggagcc gcaggcactc ggtgcagagc atcaagagca ccctgtcggc ccccaccagt 1260
ccctgctccc agtcagctcc cagcttcaag cccaaccaag tgcgagatct gcgtgaaaaa 1320
tacagcaatt ttggcaataa ctcttatcac tcctcaagac cctcatctgg atccagtgtg 1380
cccaccaccc ccacatcatc cgtctcaccc ccacaggagg ccaggttgga aaggtcatca 1440
ccgagtggtc ttctcacatc atccttcagg cagcaccaag agtcactggc agcagagaga 1500
gagaggcggc ggcaggagag agaagaaagg ttgcagagaa tagagcggga agaaagaaac 1560
aaattcagat acaaatactt ggaacagttg gcagctgagg agcacgagaa ggagctgaga 1620
agccggagtg tgagccgggg cagagccgac ctctccttgg acctgacctc gccagcagcc 1680
ccagcctgcc tggctcctct gagccatagc ccctcatctt cagactctca agaggctctc 1740
acggtgtctg cctcctcccc aggaacccct caccatcccc aagcaagtgc cggggatcct 1800
gaacccgaat cagaggcaga accggaagca gaggcagggg cggggcaggt tgctgatgaa 1860
gctggccagg acatagcctc tgcccacgag ggtgcagaga ctgaagtgga gcaggcacta 1920
gagcaagagc cggaagaaag agcctccctc agtgaaaaag agaggcagaa cgagggggtg 1980
aacgagaggg acaactgctc tgcctccagc gtctcgtcct ccagcagcac gttggagagg 2040
gaggagaagg aggacaagct ctccagggac aggacaactg gtttgtggcc cgcaggtgtc 2100
caggatgcag gtgtaaatgg acagtgtggc gacatcctca ccaacaaacg gttcatgctt 2160
gacatgctgt atgcccataa caggaagtct ccggatgatg aggagaaggg ggatggggag 2220
gctgggagga cccagcagga ggcagaggcg gtagccagcc ttgctaccag gatatccacc 2280
ctgcaggcca actctcagac ccaggatgag agtgtcagga gggtggatgt cggctgtttg 2340
gacaatcggg gcagtgtgaa agcatttgct gagaaattca acagtgggga cctggggaga 2400
ggttccatct cccctgatgc tgagcccaat gacaaggtcc cagaaacagc gccggtgcag 2460
ccgaagacag agtctgatta catctgggac cagctcatgg ccaatccaag agagctcaga 2520
atccaagaca tggatttcac tgacctgggg gaggaggatg acattgatgt cctagatgtg 2580
gacctgggtc acagggaggc ccctgggcca cctcccccac ccccacccac ctttctgggt 2640
ttgccgcccc caccccctcc gcccctgttg gacagcattc ctccccctcc tgtccctggt 2700
aatttattgg ttcctcctcc tccagtgttc aacgctcctc agggcttagg gtggtcccag 2760
gtacccaggg gtcagcccac attcactaag aaaaagaaga ccatccgttt gttctggaat 2820
gaagttcggc cttttgactg gccatgtaaa aacaaccgac gctgcagaga attcctgtgg 2880
tcaaaactgg aacccattaa ggtggacact tccagactgg agcacctgtt tgagtctaaa 2940
tccaaggaac tgtctgtctc aaagaaaact gctgcagatg gaaaaaggca agagatcatt 3000
gttctggatt ccaagaggag taacgccatc aatattggtc tgacggtgct gccccctcca 3060
aggacgatta agatcgccat tttgaatttt gatgagtatg ccttaaacaa agaaggaatc 3120
gagaaaattc taacgatgat tcccaccgat gaggagaagc agaaaatcca ggaagctcag 3180
ctggccaacc ctgaaatccc cctgggcagt gcagagcagt tcctcctcac cctgtcctcc 3240
atcagcgagc tctctgcacg acttcacctc tgggcattca aaatggatta tgaaactaca 3300
gaaaaggaag tagcagaacc actcctggac ctgaaggaag gaatagacca gttggagaac 3360
aataaaacct tgggctttat cctgtctact ctcttagcca ttgggaactt tctaaatgga 3420
actaatgcca aagcgtttga gttaagctac ctcgagaagg ttccagaagt caaagacaca 3480
gtgcacaagc agtcgcttct ccaccatgtg tgcaccatgg tggtagaaaa cttcccagac 3540
agctccgatc tgtactcgga gatcggggcc atcaccaggt cagccaaggt tgactttgat 3600
caacttcagg ataatttatg tcagatggag agaagatgca aagcttcatg ggatcacctc 3660
aaggcaattg caaaacatga aatgaaacca gttttaaaac aacggatgtc agagttcctg 3720
aaagactgtg cagagcgaat tataatttta aagattgtcc atagaaggat aatcaacaga 3780
ttccactcct ttttactctt tatgggccat ccaccttatg caattcggga agtgaacata 3840
aacaaattct gcaggattat tagtgaattt gcactagagt atcgcacaac cagggaaagg 3900
gttttgcagc agaaacagaa acgggccaac cacagagaga gaaataagac cagagggaag 3960
atgatcaccg attctggcaa gttctccggc agttctccgg cgcccccaag ccagccgcag 4020
ggtctgagct atgcggagga cgcggctgag cacgagaaca tgaaggctgt gctgaaaacc 4080
tcgtccccct ccgtggagga cgccaccccc gcgctgggcg tccgcacacg cagccgagca 4140
agccgaggat ccactagttc ctggactatg ggaactgatg actcgcccaa tgtcacagat 4200
gatgcagctg atgagatcat ggaccgcatc gtcaagtcag ccacccaagt gcccagtcag 4260
cgagtggtgc cgagggagag gaaacgatcc cgggccaacc ggaaatcttt gcgaagaacc 4320
ctgaagagcg gcctgacccc agaagaagcc agagccctgg gcttggttgg cacctcggag 4380
ttgcagctgt gacactcata ggttactccc aggagtgtgc tgagcagaag gcaagctctt 4440
gctggatgaa acccctccag gtggggttgg ggagacttga tattcacatc caacagtttg 4500
aaaagggaga gctcaattcc cagcgtcacc ccatggcttg tgttgcctgc tacgcattga 4560
cttggatctc caggagtccc ctgcacatac cttctccatc gtgtcagctg tgtttctctt 4620
gattccgtga cacccggttt attagttcaa aagtgtgaca ccttttctgg gcaaggaaca 4680
gcccctttaa ggagcaaatc acttctgtca cagttattat ggtaatatga ggcaatctga 4740
ttagcttcac agactgagtc tccacaacac caaaatatcc agatgtaaac cccaaacttg 4800
tacacaaaag aaagcacaga ttgtttacct gttgtggatt ttagatgtaa caaatgttta 4860
tacaaataca tacatgtaca ccatgtttca aatactaaat aaatagagtt taatgccata 4920
atgagaaact tttattcttc tgggaacagg accttaaaca gttccacagg ctcgcctctt 4980
cagaatggca aaactcttct cagtgtcctc agaagcaccc tcgcttggaa cggccttcag 5040
atcctttggg ctgtattttg ttaatagagt gagtaacatc aa 5082
<210> 7
<211> 6880
<212> DNA
<213> MYH11
<400> 7
gagatttgga cgctccggcc tgggaggtgc gtcagatccg agctcgccat ccagtttcct 60
ctccactagt ccccccagtt ggagatctgg gaccaacaag gcaccatggc gcagaagggc 120
caactcagtg acgatgagaa gttcctcttt gtggacaaaa acttcatcaa cagcccagtg 180
gcccaggctg actgggccgc caagagactc gtctgggtcc cctcggagaa gcagggcttc 240
gaggcagcca gcattaagga ggagaagggg gatgaggtgg ttgtggagct ggtggagaat 300
ggcaagaagg tcacggttgg gaaagatgac atccagaaga tgaacccacc caagttctcc 360
aaggtggagg acatggcgga gctgacgtgc ctcaacgaag cctccgtgct acacaacctg 420
agggagcggt acttctcagg gctaatatat acgtactctg gcctcttctg cgtggtggtc 480
aacccctata aacacctgcc catctactcg gagaagatcg tcgacatgta caagggcaag 540
aagaggcacg agatgccgcc tcacatctac gccatcgcag acacggccta ccggagcatg 600
cttcaagatc gggaggacca gtccattcta tgcacaggcg agtctggagc cgggaaaacc 660
gaaaacacca agaaggtcat tcagtacctg gccgtggtgg cctcctccca caagggcaag 720
aaagacacaa gtatcacggg agagctggaa aagcagcttc tacaagcaaa cccgattctg 780
gaggctttcg gcaacgccaa aacagtgaag aacgacaact cctcacgatt cggcaaattc 840
atccgcatca acttcgacgt cacgggttac atcgtgggag ccaacattga gacctatctg 900
ctagaaaaat cacgggcaat tcgccaagcc agagacgaga ggacattcca catcttttac 960
tacatgattg ctggagccaa ggagaagatg agaagtgact tgcttttgga gggcttcaac 1020
aactacacct tcctctccaa tggctttgtg cccatcccag cagcccagga tgatgagatg 1080
ttccaggaaa ccgtggaggc catggcaatc atgggtttca gcgaggagga gcagctatcc 1140
atattgaagg tggtatcatc ggtcctgcag cttggaaata tcgtcttcaa gaaggaaaga 1200
aacacagacc aggcgtccat gccagataac acagctgctc agaaagtttg ccacctcatg 1260
ggaattaatg tgacagattt caccagatcc atcctcactc ctcgtatcaa ggttgggcga 1320
gatgtggtac agaaagctca gacaaaagaa caggctgact ttgctgtaga ggctttggcc 1380
aaggcaacat atgagcgcct tttccgctgg atactcaccc gcgtgaacaa agccctggac 1440
aagacccatc ggcaaggggc ttccttcctg gggatcctgg atatagctgg atttgagatc 1500
tttgaggtga actccttcga gcagctgtgc atcaactaca ccaacgagaa gctgcagcag 1560
ctcttcaacc acaccatgtt catcctggag caggaggagt accagcgcga gggcatcgag 1620
tggaacttca tcgactttgg gctggaccta cagccctgca tcgagctcat cgagcgaccg 1680
aacaaccctc caggtgtgct ggccctgctg gacgaggaat gctggttccc caaagccacg 1740
gacaagtctt tcgtggagaa gctgtgcacg gagcagggca gccaccccaa gttccagaag 1800
cccaagcagc tcaaggacaa gactgagttc tccatcatcc attatgctgg gaaggtggac 1860
tataatgcga gtgcctggct gaccaagaat atggacccgc tgaatgacaa cgtgacttcc 1920
ctgctcaatg cctcctccga caagtttgtg gccgacctgt ggaaggacgt ggaccgcatc 1980
gtgggcctgg accagatggc caagatgacg gagagctcgc tgcccagcgc ctccaagacc 2040
aagaagggca tgttccgcac agtggggcag ctgtacaagg agcagctggg caagctgatg 2100
accacgctac gcaacaccac gcccaacttc gtgcgctgca tcatccccaa ccacgagaag 2160
aggtccggca agctggatgc gttcctggtg ctggagcagc tgcggtgcaa tggggtgctg 2220
gaaggcattc gcatctgccg gcagggcttc cccaaccgga tcgtcttcca ggagttccgc 2280
caacgctacg agatcctggc ggcgaatgcc atccccaaag gcttcatgga cgggaagcag 2340
gcctgcattc tcatgatcaa agccctggaa cttgacccca acttatacag gatagggcag 2400
agcaaaatct tcttccgaac tggcgtcctg gcccacctag aggaggagcg agatttgaag 2460
atcaccgatg tcatcatggc cttccaggcg atgtgtcgtg gctacttggc cagaaaggct 2520
tttgccaaga ggcagcagca gctgaccgcc atgaaggtga ttcagaggaa ctgcgccgcc 2580
tacctcaagc tgcggaactg gcagtggtgg aggcttttca ccaaagtgaa gccactgctg 2640
caggtgacac ggcaggagga ggagatgcag gccaaggagg atgaactgca gaagaccaag 2700
gagcggcagc agaaggcaga gaatgagctt aaggagctgg aacagaagca ctcgcagctg 2760
accgaggaga agaacctgct acaggaacag ctgcaggcag agacagagct gtatgcagag 2820
gctgaggaga tgcgggtgcg gctggcggcc aagaagcagg agctggagga gatactgcat 2880
gagatggagg cccgcctgga ggaggaggaa gacaggggcc agcagctaca ggctgaaagg 2940
aagaagatgg cccagcagat gctggacctt gaagaacagc tggaggagga ggaagctgcc 3000
aggcagaagc tgcaacttga gaaggtcacg gctgaggcca agatcaagaa actggaggat 3060
gagatcctgg tcatggatga tcagaacaat aaactatcaa aagaacgaaa actccttgag 3120
gagaggatta gtgacttaac gacaaatctt gcagaagagg aagaaaaggc caagaatctt 3180
accaagctga aaaacaagca tgaatctatg atttcagaac tggaagtgcg gctaaagaag 3240
gaagagaaga gccgacagga gctggagaag ctgaaacgga agctggaggg tgatgccagc 3300
gacttccacg agcagatcgc tgacctccag gcgcagatcg cagagctcaa gatgcagctg 3360
gccaagaagg aggaggagct gcaggcggcc ctggccaggc ttgacgatga aatcgctcag 3420
aagaacaatg ccctgaagaa gatccgggag ctggagggcc acatctcaga cctccaggag 3480
gacctggact cagagcgggc cgccaggaac aaggctgaaa agcagaagcg agacctcggc 3540
gaggagctgg aggccctaaa gacagagctg gaagacacac tggacagcac agccactcag 3600
caggagctca gggccaagag ggagcaggag gtgacggtgc tgaagaaggc cctggatgaa 3660
gagacgcggt cccatgaggc tcaggtccag gagatgaggc agaaacacgc acaggcggtg 3720
gaggagctca cagagcagct tgagcagttc aagagggcca aggcgaacct agacaagaat 3780
aagcagacgc tggagaaaga gaacgcagac ctggccgggg agctgcgggt cctgggccag 3840
gccaagcagg aggtggaaca taagaagaag aagctggagg cgcaggtgca ggagctgcag 3900
tccaagtgca gcgatgggga gcgggcccgg gcggagctca atgacaaagt ccacaagctg 3960
cagaatgaag ttgagagcgt cacagggatg cttaacgagg ccgaggggaa ggccattaag 4020
ctggccaagg acgtggcgtc cctcagttcc cagctccagg acacccagga gctgcttcaa 4080
gaagaaaccc ggcagaagct caacgtgtct acgaagctgc gccagctgga ggaggagcgg 4140
aacagcctgc aagaccagct ggacgaggag atggaggcca agcagaacct ggagcgccac 4200
atctccactc tcaacatcca gctctccgac tcgaagaaga agctgcagga ctttgccagc 4260
accgtggaag ctctggaaga ggggaagaag aggttccaga aggagatcga gaacctcacc 4320
cagcagtacg aggagaaggc ggccgcttat gataaactgg aaaagaccaa gaacaggctt 4380
cagcaggagc tggacgacct ggttgttgat ttggacaacc agcggcaact cgtgtccaac 4440
ctggaaaaga agcagaggaa atttgatcag ttgttagccg aggagaaaaa catctcttcc 4500
aaatacgcgg atgagaggga cagagctgag gcagaagcca gggagaagga aaccaaggcc 4560
ctgtccctgg ctcgggccct tgaagaggcc ttggaagcca aagaggaact cgagcggacc 4620
aacaaaatgc tcaaagccga aatggaagac ctggtcagct ccaaggatga cgtgggcaag 4680
aacgtccatg agctggagaa gtccaagcgg gccctggaga cccagatgga ggagatgaag 4740
acgcagctgg aagagctgga ggacgagctg caagccacgg aggacgccaa actgcggctg 4800
gaagtcaaca tgcaggcgct caagggccag ttcgaaaggg atctccaagc ccgggacgag 4860
cagaatgagg agaagaggag gcaactgcag agacagcttc acgagtatga gacggaactg 4920
gaagacgagc gaaagcaacg tgccctggca gctgcagcaa agaagaagct ggaaggggac 4980
ctgaaagacc tggagcttca ggccgactct gccatcaagg ggagggagga agccatcaag 5040
cagctacgca aactgcaggc tcagatgaag gactttcaaa gagagctgga agatgcccgt 5100
gcctccagag atgagatctt tgccacagcc aaagagaatg agaagaaagc caagagcttg 5160
gaagcagacc tcatgcagct acaagaggac ctcgccgccg ctgagagggc tcgcaaacaa 5220
gcggacctcg agaaggagga actggcagag gagctggcca gtagcctgtc gggaaggaac 5280
gcactccagg acgagaagcg ccgcctggag gcccggatcg cccagctgga ggaggagctg 5340
gaggaggagc agggcaacat ggaggccatg agcgaccggg tccgcaaagc cacacagcag 5400
gccgagcagc tcagcaacga gctggccaca gagcgcagca cggcccagaa gaatgagagt 5460
gcccggcagc agctcgagcg gcagaacaag gagctccgga gcaagctcca cgagatggag 5520
ggggccgtca agtccaagtt caagtccacc atcgcggcgc tggaggccaa gattgcacag 5580
ctggaggagc aggtcgagca ggaggccaga gagaaacagg cggccaccaa gtcgctgaag 5640
cagaaagaca agaagctgaa ggaaatcttg ctgcaggtgg aggacgagcg caagatggcc 5700
gagcagtaca aggagcaggc agagaaaggc aatgccaggg tcaagcagct caagaggcag 5760
ctggaggagg cagaggagga gtcccagcgc atcaacgcca accgcaggaa gctgcagcgg 5820
gagctggatg aggccacgga gagcaacgag gccatgggcc gcgaggtgaa cgcactcaag 5880
agcaagctca ggcgaggaaa cgagacctct ttcgttcctt ctagaaggtc tggaggacgt 5940
agagttattg aaaatgcaga tggttctgag gaggaaacgg acactcgaga cgcagacttc 6000
aatggaacca aggccagtga ataagcaact ttctacagtt ttgcaccacg gcaagaaaac 6060
caaaaaccaa aacaaacaaa caaaaaaaac ccaacaacaa cccagaacaa agcaaaaccc 6120
agcagactgt acttagcatt gtctaaatcc attctcaaat tccaaatatc acagacaccc 6180
ctcacacaag gaatataaaa accaccaccc tccagcctgg gcaacgtagt aaaacctcat 6240
ctatacaaga atttaaaaat aagctgggcg tggtggtaca cacctgtggt cccagctact 6300
agggaggctg agccaggaag aacgctccag cccaggactt cgaggctgca atgagctata 6360
attgcatcat tgcactccag cctgggcaac agagaccctg tctcaaccac caccaccacc 6420
accaccccta ctacccctgt attcaaggta aaaattgaag tttgtatgat gtaagagatg 6480
agaaaaaccc aacaggaaac acagacacat cctccagttc tatcaatgga ttgtgcagac 6540
actgagtttt tagaaaaaca tatccacggt aaccggtccc tggcaattct gtttacatga 6600
aatggggaga aagtcaccga aatgggtgcc gccggccccc actcccaatt cattccctaa 6660
cctgcaaacc tttccaactt ctcacgtcag gcctttgaga attctttccc cctctcctgg 6720
tttccacacc tcagacacgc acagttcacc aagtgccttc tgtagtcaca tgaattgaaa 6780
aggagacgct gctcccacgg aggggagcag gaatgctgca ctgtttacac cctgactgtg 6840
cttaaaaaca ctttcactaa taaatggtta taaatcacaa 6880
<210> 8
<211> 1371
<212> DNA
<213> ACY3
<400> 8
actttcttcc ctgaaggagc agcacagaac aaaagctcca ggcagctgct tccgctgttt 60
cgggggtagg gcggagtgac agccccacgg gccacgcagc aagcagaaga tccccgggag 120
tcaccctcaa ccctctgggg ccacgtgggc ccatgaatac cagcctgtct gcgagttaga 180
cgccagtcct ggtggcccgg gaagcccaga tccgcatcag cggttctgca ccccacacca 240
gcatgtgctc actgcctgtg ccccgggagc ccctgcgtcg cgtggctgtg actgggggca 300
cgcatggcaa cgagatgtcg ggcgtctacc tggcccggca ctggctgcat gcccccgcag 360
agctgcagag agccagcttc tccgctgtgc ctgtgctggc caacccggca gccacatccg 420
gctgccgccg ctacgtggac catgacctca accgcacctt caccagcagc ttcctcaatt 480
ccaggcccac cccggacgac ccatatgagg tgacaagagc ccgagagctg aaccagctgc 540
tggggcccaa ggcctcgggc caggcctttg actttgtcct tgacctgcac aacaccacgg 600
ccaacatggg cacctgctta atcgcgaagt cctcccacga agtctttgcc atgcacctgt 660
gccgccatct gcagctgcag taccccgagc tgtcctgcca ggtcttcctg taccagcggt 720
ctggggagga gagctacaac ctggactctg tggccaaaaa tggactgggt ctggagctgg 780
gcccccagcc acagggtgtg ctgcgggctg acattttctc aaggatgagg accctggtgg 840
ccacagttct ggacttcatc gaactcttca accagggtac ggcctttcct gcctttgaga 900
tggaagccta tagacccgtg ggcgtcgtgg acttcccccg caccgaggcc gggcacctgg 960
caggcactgt gcatcctcag ctgcaggacc gagacttcca gccactgcag cctggtgctc 1020
ccatcttcca gatgttcagt ggggaggacc tgctctatga gggagagtcc acggtgtacc 1080
ccgtgttcat taacgaggct gcctactatg agaagggcgt tgcctttgtc cagactgaga 1140
agttcacatt caccgtgcct gccatgcccg cgctgacccc tgccccgagc ccagcttcct 1200
aacccaagac acacctcccc aacctcagtc ttcccatctg aacgatgggt cctgaggcac 1260
agctctgagc acagaggtcc cttctgccac ctaccatgca ccatgttcct tgccaggcct 1320
ccccaacccc tggcctcaat ttccctttct ataaaatgga agatgtccag a 1371
<210> 9
<211> 1042
<212> DNA
<213> C8orf74
<400> 9
agtctggctc cgtctcctgg caaccagatg caggggccat ggcactctta acaccccagg 60
gagtgaaaga agtcttccaa cttcagagac cacaaggtcg ggagcgcctg cggaggcttc 120
tgaactggga ggagtttgac gaacagagag actcccggag gagcatcctg ctggacaccc 180
tctacgagag catcatcttt gcagtgggca aaggcttccc atgggtggag gtggcccagg 240
tggtcaagtt cacagaagag ctgctaaggg aaaccaaagg ctgctccatt actgaggctg 300
tgacgatcct ggggaacaag cttagagatt accggggcca tttcaacacc acccacctgc 360
tggccctctg tgactacttc caccacacct tcatccgcca ctacaaactc taccagtatg 420
tcctgggcca ggaccagcag gtcgacctga ccgttgccca cctggaggtg tgcatgccac 480
cccatcccct cccgctggcc gagggcatgg acagggactt gtggatccac gagcagcagg 540
tggccacact gacggaggcc gaggcacaga agcgcgccga cgtgctgctc ctgaaagagg 600
cgctgcgcct ggagcgggag aactcgctgc agaaggcgtt cgctgccgcc gcgcctgcgc 660
agcccggcca ggtcctggag agacaggagt tggagagcct catctgccag gcagtccaca 720
cccagatgga gctcctgcag gagctgctgc agcgccagat ccagaacaca ttcgccatct 780
tggacctgaa gcttcagaag aagactctga acctcaacgc ccccacccct atcccgcccc 840
ccatcaccag ccacgcaggc caggaggaag ccctgaagcc ccaaagagcg agcaaaggaa 900
agaaagcgaa ggcaaggaag tagaaggtcc cgactgccac acgagactga ctggggacca 960
gccacccata accatgagcc ttgcggcacg gtgagctcag cacccacaga gagacttctt 1020
gtgattaaaa gaaacaaacc ca 1042
<210> 10
<211> 5238
<212> DNA
<213> CPT1A
<400> 10
aatccgctgc tgccggcgtc gggtgcgctc ggcctcgccc gcggccctcc ttccccggct 60
cccgctcgcc gctcgttcac tccaccgccg ccgccgccgc cgccgctgcc gctgccgctg 120
ccgcacctcc gtagctgact cggtactctc tgaagatggc agaagctcac caagctgtgg 180
cctttcagtt cacggtcact ccggacggga ttgacctgcg gctgagccat gaagctctta 240
gacaaatcta tctctctgga cttcattcct ggaaaaagaa gttcatcaga ttcaagaacg 300
gcatcatcac tggcgtgtac ccggcaagcc cctccagttg gcttatcgtg gtggtgggcg 360
tgatgacaac gatgtacgcc aagatcgacc cctcgttagg aataattgca aaaatcaatc 420
ggactctgga aacggccaac tgcatgtcca gccagacgaa gaacgtggtc agcggcgtgc 480
tgtttggcac cggcctgtgg gtggccctca tcgtcaccat gcgctactcc ctgaaagtgc 540
tgctctccta ccacgggtgg atgttcactg agcacggcaa gatgagtcgt gccaccaaga 600
tctggatggg tatggtcaag atcttttcag gccgaaaacc catgttgtac agcttccaga 660
catcgctgcc tcgcctgccg gtcccggctg tcaaagacac tgtgaacagg tatctacagt 720
cggtgaggcc tcttatgaag gaagaagact tcaaacggat gacagcactt gctcaagatt 780
ttgctgtcgg tcttggacca agattacagt ggtatttgaa gttaaaatcc tggtgggcta 840
caaattacgt gagcgactgg tgggaggagt acatctacct ccgaggacga gggccgctca 900
tggtgaacag caactattat gccatggatc tgctgtatat ccttccaact cacattcagg 960
cagcaagagc cggcaacgcc atccatgcca tcctgcttta caggcgcaaa ctggaccggg 1020
aggaaatcaa accaattcgt cttttgggat ccacgattcc actctgctcc gctcagtggg 1080
agcggatgtt taatacttcc cggatcccag gagaggagac agacaccatc cagcacatga 1140
gagacagcaa gcacatcgtc gtgtaccatc gaggacgcta cttcaaggtc tggctctacc 1200
atgatgggcg gctgctgaag ccccgggaga tggagcagca gatgcagagg atcctggaca 1260
atacctcgga gcctcagccc ggggaggcca ggctggcagc cctcaccgca ggagacagag 1320
ttccctgggc caggtgtcgt caggcctatt ttggacgtgg gaaaaataag cagtctcttg 1380
atgctgtgga gaaagcagcg ttctttgtga cgttagatga aactgaagaa ggatacagaa 1440
gtgaagaccc ggatacgtca atggacagct acgccaaatc tctactacac ggccgatgtt 1500
acgacaggtg gtttgacaag tcgttcacgt ttgttgtctt caaaaacggg aagatgggcc 1560
tcaacgctga acactcctgg gcagatgcgc cgatcgtggc ccacctttgg gagtacgtca 1620
tgtccattga cagcctccag ctgggctatg cggaggatgg gcactgcaaa ggcgacatca 1680
atccgaacat tccgtacccc accaggctgc agtgggacat cccgggggaa tgtcaagagg 1740
ttatagagac ctccctgaac accgcaaatc ttctggcaaa cgacgtggat ttccattcct 1800
tcccattcgt agcctttggt aaaggaatca tcaagaaatg tcgcacgagc ccagacgcct 1860
ttgtgcagct ggccctccag ctggcgcact acaaggacat gggcaagttt tgcctcacat 1920
acgaggcctc catgacccgg ctcttccgag aggggaggac ggagaccgtg cgctcctgca 1980
ccactgagtc atgcgacttc gtgcgggcca tggtggaccc ggcccagacg gtggaacaga 2040
ggctgaagtt gttcaagttg gcgtctgaga agcatcagca tatgtatcgc ctcgccatga 2100
ccggctctgg gatcgatcgt cacctcttct gcctttacgt ggtgtctaaa tatctcgctg 2160
tggagtcccc tttccttaag gaagttttat ctgagccttg gagattatca acaagccaga 2220
cccctcagca gcaagtggag ctgtttgact tggagaataa cccagagtac gtgtccagcg 2280
gagggggctt tggaccggtt gctgatgacg gctatggtgt gtcgtacatc cttgtgggag 2340
agaacctcat caatttccac atttcttcca agttctcttg ccctgagacg gattctcatc 2400
gctttggaag gcacctgaaa gaagcaatga ctgacatcat cactttgttt ggtctcagtt 2460
ctaattccaa aaagtaattc cactggagct gctgggaagg aaaacgagct cttctgatgc 2520
aaaccaaatg aaaaataggc attaatcctg accttagctc gggatgaaac actgctctta 2580
aaaaaactca gttttccttc cagaaaatgt gggtgttttt ttttcctaga acagtatctc 2640
tcccctgtga agcataaccc cactacttcc agacttgccc tcccttgggg gacatctgat 2700
aaagtctccc ctgatgtctc cgcatcggct tggatttatt aagggatgca aatcttgttg 2760
agttaatgaa ggaattagta gggttgtggc ttcacacaca gtggaatgga aatggtgtgc 2820
tttctcagtg gcaaccgaag gcctagtgct taagggcatt tagcatcatc caagcagggt 2880
aaacttttgt tttgttaaaa gaaaaatgtg ttattcaagt tggtgtcccc agttgtagct 2940
aacacatctg gaatgcacta accaaaatgc tgtgctttgg agacctgctt ttgtcaccgt 3000
gggtaaccgt tcccgtctgg tccagtagcc tgtgtttgcc tctccacatt tgaagcaagc 3060
aggatgcaag gtcttcagtt ttactgacct tgtatgtctt caagtcttca caacccagtg 3120
ccttaaaaat gaaaggccct aaatgtaagg gagatggaga gaaagattta ttttgtagag 3180
tctttgggtg gaattgtggg tatactgttc ccttcacaat tgactgagta tggataaccg 3240
tacataagca tttgctacac cccaccagcc ccctccccct cagaaacacc agttccttcc 3300
caagggcagc tgtgccagac tcccctcccg ggactgcctt cttgtcatca taagcaacaa 3360
aagaaataac aggcacatgt cataaaaggg gagcaagggc cgtgatggtc agataattca 3420
ctcaagaata aaacatgaca cgtgcctcag gaggatctct ttcccaaagt gacagcaagg 3480
agggcagggc atcggccacc aagcggggac tagcaagtga ggaaggggag ggcagcccac 3540
cgtggtgagg agagagtggc tccacgaccc caagggatgg ccttctcctc ccacccggtg 3600
aggggaaaga ctcaccagag ggtgatggag acagtatgcc ggctcacctt ggtgaccagc 3660
caagatgtct caagtgacag tgctaggtgt tcacccagcc tgtccttcag ataggagtgc 3720
cttcacgaaa gcgtctcatg gaccacaaag caattatgca ctgagtcatc ttcagtattt 3780
aatgcaaaaa tgaagcatca tggaatgaaa ttcccactgt ctgtcatgac aagcttagct 3840
gtccattgtt ttaaattgtg tatttatttt tttgaccact tggttctagt tgggcctgac 3900
tccttcagag tgctgcaccc cgatagtaca acagcgatgg ctgaactgtt ggagtcgatg 3960
gaaggtgctt gccggagaac acgtgccttt tttttttttt ttttttttga gatggagttt 4020
cactcttgtt gcccaggctg gagtgcagtg gtgcaatctc ggctcactgc agcatctgcc 4080
ttgcaggttc aagcgattct cctgtctcag cctcccaagt agctgggatt acacgcccaa 4140
caccatgccc tgctaatttt tgtattttta gtagagacgg ggtttcatca tattggtcag 4200
gctggtctcg aactcctgac ctcaggtgat ccacctgcct cagcctccca aagtgctggg 4260
attacaggca tgagccacca tgcgcggccc acatgcatgt tttatgtatg tatacttcat 4320
gatgtaaaaa tcccaccttt atgggccaaa gatttttttt ctcctgaaag caagaaaaaa 4380
tgaaaacaaa agacaaaaaa aaaaaaaaaa gcgtccaggc gcggtggctc atgcgtgtaa 4440
tcccagcact ttgggaggcc aaggcgggcg gatcacgagg tcaggagatg gagaccatcc 4500
tggctaacac ggtgaaaccc cgtctctact aaaaattcaa aaaatgagcc gggcgtggtg 4560
gcgggcgcct gtagtcccag ctactcagga ggctgaggca ggagaatggc gtgaacccgg 4620
gaggcggagc ttgcagtgag ccgagatcgc tccactgcac tccagcctgg gcgacagagc 4680
gagactccgt ctaaaaaaaa aagcaaaaac aaaccaacaa caaaagcccc tgactgtccg 4740
tcaagcaggc agcggggatg tagctctctc tgccctgggc aagaatagca cttcccgtta 4800
aaagccagca gccggcgtca gtccctatca gagccagcta gatcatgcac tgttgaccac 4860
tgagcaatct gtgttacact agagttcaca gggcattttg agtgtagacg tgagtgctta 4920
aacatatttg ggtttctctc tcaggtttta aatgtttcaa atgtaattgt tgctcatcag 4980
tgcagttatc aatgcaattt tatattcctt gaggggagaa agaggggtct tattgtacat 5040
gtccaagggg ggtgataaga gtattatctg tttaatttaa ttggaacaaa ccattgtctt 5100
aacgcagcca tggtttgaat ttgttatctt gggctgaccg gtgcatgtaa atacagtatg 5160
ctctttggat gtaaatctta gaaatgcagt gtgaatgtag gttatcatta ataaaacatt 5220
aaccccagtc tactacaa 5238
<210> 11
<211> 1498
<212> DNA
<213> DDX39A
<400> 11
gtctgagcgc ccggcggaaa accgaagttg gaagtgtctc ttagcagcgc gcggagaaga 60
acggggagcc agcatcatgg cagaacagga tgtggaaaac gatcttttgg attacgatga 120
agaggaagag ccccaggctc ctcaagagag cacaccagct ccccctaaga aagacatcaa 180
gggatcctac gtttccatcc acagctctgg cttccgggac tttctgctga agccggagct 240
cctgcgggcc atcgtggact gtggctttga gcatccttct gaggtccagc atgagtgcat 300
tccccaggcc atcctgggca tggacgtcct gtgccaggcc aagtccggga tgggcaagac 360
agcggtcttc gtgctggcca ccctacagca gattgagcct gtcaacggac aggtgacggt 420
cctggtcatg tgccacacga gggagctggc cttccagatc agcaaggaat atgagcgctt 480
ttccaagtac atgcccagcg tcaaggtgtc tgtgttcttc ggtggtctct ccatcaagaa 540
ggatgaagaa gtgttgaaga agaactgtcc ccatgtcgtg gtggggaccc cgggccgcat 600
cctggcgctc gtgcggaata ggagcttcag cctaaagaat gtgaagcact ttgtgctgga 660
cgagtgtgac aagatgctgg agcagctgga catgcggcgg gatgtgcagg agatcttccg 720
cctgacacca cacgagaagc agtgcatgat gttcagcgcc accctgagca aggacatccg 780
gcctgtgtgc aggaagttca tgcaggatcc catggaggtg tttgtggacg acgagaccaa 840
gctcacgctg cacggcctgc agcagtacta cgtcaaactc aaagacagtg agaagaaccg 900
caagctcttt gatctcttgg atgtgctgga gtttaaccag gtgataatct tcgtcaagtc 960
agtgcagcgc tgcatggccc tggcccagct cctcgtggag cagaacttcc cggccatcgc 1020
catccaccgg ggcatggccc aggaggagcg cctgtcacgc tatcagcagt tcaaggattt 1080
ccagcggcgg atcctggtgg ccaccaatct gtttggccgg gggatggaca tcgagcgagt 1140
caacatcgtc tttaactacg acatgcctga ggactcggac acctacctgc accgggtggc 1200
ccgggcgggt cgctttggca ccaaaggcct agccatcact tttgtgtctg acgagaatga 1260
tgccaaaatc ctcaatgacg tccaggaccg gtttgaagtt aatgtggcag aacttccaga 1320
ggaaatcgac atctccacat acatcgagca gagccggtaa ccaccacgtg ccagagccgc 1380
ccacccggag ccgcccgcat gcagcttcac ctcccctttc caggcgccac tgttgagaag 1440
ctagagattg tatgagaata aacttgttat tatggaagcc tggctcccac cccatcta 1498
<210> 12
<211> 8058
<212> DNA
<213> FBXL4
<400> 12
ccttccgggt cgcgctaggc cgggcttgcg gcggttgtgc cgcatctaga gagtcgggga 60
gccgcccccg cacccaggcc ttctcgcgct gcctggtcgc tggtgaagcc cgcggcgcgc 120
gcctctcccg gaccctgcag gatttttctt cctggcctgg ttcccttgcc ttctccattt 180
gcttcattcg cttggatttt caagaagctt tgaagctgga taggagtctc cagtcttcct 240
cttgatccat atgtttcagg taaaagaatg tcacatgtca gcatttgtac ctgaagtcag 300
catgcaaagt tcagggtacc tggatgaatg ccaacttttg catttcccat gtgtatcctg 360
tgaccattct atctgggaac atccttcaaa gagttcatgc atcttactga ggacacctga 420
ccttttgaag cttcataatt cacatctaga tgtcaccggt ctttcccatg ttaacagttc 480
tgaccatgtt ttattatata tgccttcggc gccgagccag gacagctaca agaggagaaa 540
tgatgaacac ccatagagct atagaatcaa acagccagac ttcccctctc aatgcagagg 600
tagtccagta tgccaaagaa gtagtggatt tcagttccca ttatggaagt gagaatagta 660
tgtcctatac tatgtggaat ttggctggtg taccaaatgt attcccaagt tctggtgact 720
ttactcagac agctgtgttt cgaacttatg ggacatggtg ggatcagtgt cctagtgctt 780
ccttgccatt caagaggacg ccacctaatt ttcagagcca ggactatgtg gaacttactt 840
ttgaacaaca ggtgtatcct acagctgtac atgttctaga aacctatcat cccggagcag 900
tcattagaat tctcgcttgt tctgcaaatc cttattcccc aaatccacca gctgaagtaa 960
gatgggagat tctttggtca gagagaccta cgaaggtgaa tgcttcccaa gctcgccagt 1020
ttaaaccttg tattaagcag ataaatttcc ccacaaatct tatacgactg gaagtaaata 1080
gttctcttct ggaatattac actgaattag atgcagttgt gctacatggt gtgaaggaca 1140
agccagtgct ttctctcaag acttcactta ttgacatgaa tgatatagaa gatgatgcct 1200
atgcagaaaa ggatggttgt ggaatggaca gtcttaacaa aaagtttagc agtgctgtcc 1260
tcggggaagg gccaaataat gggtattttg ataaactacc ttatgagctt attcagctga 1320
ttctgaatca tcttacacta ccagacctgt gtagattagc acagacttgc aaactactga 1380
gccagcattg ctgtgatcct ctgcaataca tccacctcaa tctgcaacca tactgggcaa 1440
aactagatga cacttctctg gaatttctac agtctcgctg cactcttgtc cagtggctta 1500
atttatcttg gactggcaat agaggcttca tctctgttgc aggatttagc aggtttctga 1560
aggtttgtgg atccgaatta gtacgccttg aattgtcttg cagccacttt cttaatgaaa 1620
cttgcttaga agttatttct gagatgtgtc caaatctaca ggccttaaat ctctcctcct 1680
gtgataagct accacctcaa gctttcaacc acattgccaa gttatgcagc cttaaacgac 1740
ttgttctcta tcgaacaaaa gtagagcaaa cagcactgct cagcattttg aacttctgtt 1800
cagagcttca gcacctcagt ttaggcagtt gtgtcatgat tgaagactat gatgtgatag 1860
ctagcatgat aggagccaag tgtaaaaaac tccggaccct ggatctgtgg agatgtaaga 1920
atattactga gaatggaata gcagaactgg cttctgggtg tccactactg gaggagcttg 1980
accttggctg gtgcccaact ctgcagagca gcaccgggtg cttcaccaga ctggcacacc 2040
agctcccaaa cttgcaaaaa ctctttctta cagctaatag atctgtgtgt gacacagaca 2100
ttgatgaatt ggcatgtaat tgtaccaggt tacagcagct ggacatatta ggaacaagaa 2160
tggtaagtcc ggcatcctta agaaaactcc tggaatcttg taaagatctt tctttacttg 2220
atgtgtcctt ctgttcgcag attgataaca gagctgtgct agaactgaat gcaagctttc 2280
caaaagtgtt cataaaaaag agctttactc agtgacttaa tatatgttct gtattaaaat 2340
taatgtgctt tgttggggtt taattttggg attggttttg ggttttgttt ttagttgttt 2400
taatggtaag aattaagaca tttgtagatt ttaaagaaaa atatgaaatt gtccattaaa 2460
tcaagtaaaa atgtgcacaa atgttttcat aaaatactgc aagcacttct cttcaagaat 2520
atgagtggat attattttta ccttatgtta atcagtgata tgctttagtc aataatatga 2580
ttgataaaag aataacatgg aatcatgcta acttattttc aaaggaacac tgagcaataa 2640
agtatcgtgg catttatgca aaaaaaaaag ttaatttttt acaccttcat gtaaggatgt 2700
cttattaagc ctgtgacctg gcaagtgttt tgtttggtat gtacaaaatg gtcagagcta 2760
gttggagaat gagacatgct tttccagctg tttggttatt tctctggatt aactgttcaa 2820
ctggaaaatt tttagttttt ctagccaggt gtggtggcac acacttgtag tcctagcgac 2880
acaggaggtg gaggcaggag gattacttga gatgggattt tgagactcta gtgtacttat 2940
gattgcacct gtgagcagcc actgcactcc aacctgggca atatagcaag tccctttctc 3000
ttaaaaaaaa ttgtagtgtt tccacttttc ttctgatatt tttgtctatt tcactactgg 3060
ataatgccaa tataaaaatt tgggtataat caagaataag aggtaaacta ctaaataaaa 3120
aaagctttcc aactgttaga agcagatgcc ttaacatttt gtgaaaggta aagttttgag 3180
gtttctgaat tatataaaaa aacataaatg tggagatata tattatatat acacattata 3240
tatacatatt atagataata tatatccaca tttatgattt ttaatatata catgtatata 3300
ttatatatta tataattata tattacattt atattatatg taatgtacat gtatatatta 3360
tatacatata tataattata tatattatat agagagagat atatatcttg ctagggtgtg 3420
tggatgctgg aatataacga ttttgcactt aacaggacaa tgaattttgt tatactacag 3480
ttaatattag ttttgtgttc aaaacagctg tgccttttca tgccacaaaa tattttctgt 3540
ctactttctg agtagcagaa ttaattcatt tttttaacaa aacgatgtat gtcaagtgtt 3600
cagtagtcac atgaggagaa tgcttccttt gtgcctggca ctgtttcttg tgctttgcat 3660
tgactaattc aattctcaca acaaccctgt aagataaatg ccattactta cccccattta 3720
cagatgagga aactgaggca aagaaagatt gaagaattta tttatgatca tacagctgct 3780
agtggcagag ccaacatata aacccaggcc atctggcttc tgaagcattg cattaaacct 3840
gtgcttttag gtgttcaggg tagcttctgg ctctagggca gaggtcagga aactttttct 3900
ataaagggcc agatagtaaa tattttaggc tttgtgggct aagaggtaaa actgagattg 3960
ttatgtagat acttaaataa ctagagagaa ataaaatttg cacgaaaatt ttattgacaa 4020
aattcaaaac aataatttag aacaattttt tttgtaatac gggtttacta atgaaaagaa 4080
ttaaatattt acagggagga tcaaagttaa tgtttcgtgt cattaaagtt gattgtaagt 4140
actcatttgt taatgctgat ctgtaataag attttatgta ttttacttct gaaaattcct 4200
tgcagatagg tattgtcaaa tacttacatt aatccatgag aatatgattt ttgttgagca 4260
tattcatcac ttgaaaggtt acttcttctc tggatatttt ccttttagca tgttattaca 4320
ttgcagctta atcacttcca attgaagact aggcagaagc tcctcaattg cactgttaaa 4380
ttgattttga aaaatggaaa tttcctttac atttgcaaac tccaaaaaat actgcaggca 4440
ctatggtgtg agctacaaat ttgtgtgaga gtggagatct cgcttctttg tcttaccttt 4500
tgatagcaca ggaaatgtgt aaagcagctt gttgttactt gtaattcaaa caatgttgtc 4560
atcaaaatga cttatgtttt gcttgtaaac acgttttgcc ttgtaatttt ggcttgaatt 4620
catttcaaaa ttttattaag tcttgagcaa aagctaaatt ccaaagccat tcagtgttcc 4680
ataatagtga ttgaggacat gtcttctttt tcagaaaaat gtcaatatca gccctgaacg 4740
caaaagctca caatagaact aacactatta tgccaatgtg gttgggcaaa tcagcatatt 4800
catcttctgt atctgacaaa agataactga accattgatg tttaatctat cagaaactat 4860
gagagcaaat gaagttcacc attgctacca gtagttcagt aatacaaaat tgaatcaaat 4920
atatcccaca aagtacctgc tgatgaataa tacagtaaat aaccatagat tttaaatacc 4980
ttcttacctt ttcacaggct ttataaattt gacaaacgta atcattttgc ttcacacatt 5040
tttaacacca ccagttgtaa cacatcttag cagattctac ttcaggttgc atgaaatttg 5100
tgttttcttc ttataaaata ttcatgcttg taattgtgcc acacagataa ttcatagaga 5160
ctaatttcag tcacttcaac gttggcattg acttatcaaa taagcaataa ctaggcagtg 5220
tcagtaacat ctgttgactc atcaagagcc aaggaaaacc actcagggtc atttgccttg 5280
ttttttattg actgttgatg ttgttcccag tgttctcaat tctttaagca accattcttg 5340
ccaaaaggct aatttaatag tcttaagttt actttggaca cagtccttca gccgatagaa 5400
tcaaacacaa tttagttatc gttagtaaaa tgttttcctt gcttggttaa catctgagtc 5460
actttggctg caactttatt ttcatttttg agtttgtttt tttttttttt tgagactgag 5520
tctcattctt ttgcccaggc tggagtgcag tggcacaatc tcagttcact gcaacctcca 5580
ccctgcaggt tcaagcgagt ctcctgcctc agcctcccaa gtagctgaga ttacaggcac 5640
atgccaccac acctaactaa tttttatgtt tttagtagaa atggggtttt accatgttgt 5700
ccaggctggt cttgaactcc tgacctcaag tgatccaccc acttcagcct cccaaaatgc 5760
ttggattaca ggcatgaacc actgcatctg acctccctat agtattcttt aagaacagct 5820
ataatgacat tgcatattaa acatcatact ctgacatcta atctgatttt taaaaattca 5880
tatactaatg tgccttaaaa atgtcacttc aagtctactt ttcttttttt ctcttgtttt 5940
gatgttatgg gtaagcacta gtaataaaaa atttaaaaat attgtggtat gacaacatat 6000
gtggcactca aaatgctggt aactgcatta ctgcagtttt tagtgtgcca agtagcagtg 6060
caaaatgatg acagcaccac ataagtctcc tttgcatttg ttcaactctg ccattctaat 6120
gtgaaagcaa tcatagacag tacctaaacg aatgagtgtg gccatgttcc aataaaattt 6180
catgagcact gaaagttgaa ttttacataa ttttgatgtg ttacaaaata ctactgtgtt 6240
agccattaga ttttttcagc cattagaaaa tgtgaaactg ttcttatgag ctggctggat 6300
ttggcttgtg gaccaaattt gtgaccccta ttccagagta ttttcgagtc agttaatcca 6360
tgtttgccca ttcctaattt tataaaccac attcaaacct gttaattcgc tgttatcatt 6420
ctcattttgc catttagatt ttaaaatgaa gagcagtgtt ttgttagaaa aaacaaaatg 6480
tttaccataa caagaaagat gtgtagacaa gaaagatatt tatgtagact ctttgtttgt 6540
taaattttga agccaggtga tgcattgtta gctttgacaa ctgacttaaa tttttgtata 6600
attatttatc tttgcatttt gctcaggtaa attatcttcc cagagtctag aaataaagat 6660
atccctgatc ctgtttaaga gcataaataa tactctcaat gtaaattgtt ttgaaataag 6720
atcttaaaaa tacaaaatgt agacaattaa tattcaggtg cttacttttg agccaatatg 6780
tagcagagaa aaactaattt ctctgtggca gtatttttat ttttggcatt tcccaggaat 6840
taactgaaga ctaaaactca tatgtgaagt gtaatgatac taatcaaaga gtcagtaaaa 6900
tttccatttg gctaccatgt atgtgtgtat atatttatgt atgtatgtgt gtgttacata 6960
tttgagacag ggtctcactc tattgcccca ggctggagtg cagtggcatg atctcagctt 7020
actgcagcct cagtctccca ggctcaagcg atcctcccac ctcggcctcc cgagtacctg 7080
ggactacaga caccaccaca cctggctaat ttttttattt tttatagaga cacagtcttt 7140
ccatgttgcc tatgttggtc ttgaactcct gggctcaaat aattttccca ccttggcctc 7200
ctgtagtgct gggattacgg gcataagcca ctgtgtcagg ccccatgtat gttaatagtg 7260
aatgtttggc ttttcatttg ttactttcag ctattaaagg atacctatta cagacacagg 7320
aatttacatt ttcaaagtca tttttgacac atcagtgctg catctacttt tctcctttta 7380
gcacatttga tattgatact tcagagaaac ttttttaact acccttaaaa tcttgtcaat 7440
gaccattaac tgccaatcat cacctcattt gctttttttg acaacatact actagaaacc 7500
taggctgtga gtgtaaaacc ataactgtta gaatcatttt tttggcaata gctcacattc 7560
tgttaagagt catttgcttt aatcaaagat catgatttat tatatatttt ttataagtag 7620
ggatggggcc aagattattc ctttggcaca gcagtaagtg tgctcaagat ctttgcctgt 7680
aagcttgaat atttggctta aattttgtgc atatgaatac tgttaaaggt atatttgact 7740
acattttgaa aggaaaaagg tagtcctgct aaaattgaca tttagggata ttttaatcta 7800
tgtatttggt aaagtaatta gtgaagtatt agttataaaa attttaagga aaacatttaa 7860
aagcaaaata gtcgtatcag ataaatagag tagaatacac taaagataaa acaagtctct 7920
gttacaaatg aagttgtctg tacagacgac tgagatattt taattttatt tacataaaaa 7980
tgctgttcaa tatctaatga tttctgttgt ttgtattctg tactttagag taataaaata 8040
agtttgagta tctcatta 8058
<210> 13
<211> 2967
<212> DNA
<213> ICAM1
<400> 13
gagctcctct gctactcaga gttgcaacct cagcctcgct atggctccca gcagcccccg 60
gcccgcgctg cccgcactcc tggtcctgct cggggctctg ttcccaggac ctggcaatgc 120
ccagacatct gtgtccccct caaaagtcat cctgccccgg ggaggctccg tgctggtgac 180
atgcagcacc tcctgtgacc agcccaagtt gttgggcata gagaccccgt tgcctaaaaa 240
ggagttgctc ctgcctggga acaaccggaa ggtgtatgaa ctgagcaatg tgcaagaaga 300
tagccaacca atgtgctatt caaactgccc tgatgggcag tcaacagcta aaaccttcct 360
caccgtgtac tggactccag aacgggtgga actggcaccc ctcccctctt ggcagccagt 420
gggcaagaac cttaccctac gctgccaggt ggagggtggg gcaccccggg ccaacctcac 480
cgtggtgctg ctccgtgggg agaaggagct gaaacgggag ccagctgtgg gggagcccgc 540
tgaggtcacg accacggtgc tggtgaggag agatcaccat ggagccaatt tctcgtgccg 600
cactgaactg gacctgcggc cccaagggct ggagctgttt gagaacacct cggcccccta 660
ccagctccag acctttgtcc tgccagcgac tcccccacaa cttgtcagcc cccgggtcct 720
agaggtggac acgcagggga ccgtggtctg ttccctggac gggctgttcc cagtctcgga 780
ggcccaggtc cacctggcac tgggggacca gaggttgaac cccacagtca cctatggcaa 840
cgactccttc tcggccaagg cctcagtcag tgtgaccgca gaggacgagg gcacccagcg 900
gctgacgtgt gcagtaatac tggggaacca gagccaggag acactgcaga cagtgaccat 960
ctacagcttt ccggcgccca acgtgattct gacgaagcca gaggtctcag aagggaccga 1020
ggtgacagtg aagtgtgagg cccaccctag agccaaggtg acgctgaatg gggttccagc 1080
ccagccactg ggcccgaggg cccagctcct gctgaaggcc accccagagg acaacgggcg 1140
cagcttctcc tgctctgcaa ccctggaggt ggccggccag cttatacaca agaaccagac 1200
ccgggagctt cgtgtcctgt atggcccccg actggacgag agggattgtc cgggaaactg 1260
gacgtggcca gaaaattccc agcagactcc aatgtgccag gcttggggga acccattgcc 1320
cgagctcaag tgtctaaagg atggcacttt cccactgccc atcggggaat cagtgactgt 1380
cactcgagat cttgagggca cctacctctg tcgggccagg agcactcaag gggaggtcac 1440
ccgcaaggtg accgtgaatg tgctctcccc ccggtatgag attgtcatca tcactgtggt 1500
agcagccgca gtcataatgg gcactgcagg cctcagcacg tacctctata accgccagcg 1560
gaagatcaag aaatacagac tacaacaggc ccaaaaaggg acccccatga aaccgaacac 1620
acaagccacg cctccctgaa cctatcccgg gacagggcct cttcctcggc cttcccatat 1680
tggtggcagt ggtgccacac tgaacagagt ggaagacata tgccatgcag ctacacctac 1740
cggccctggg acgccggagg acagggcatt gtcctcagtc agatacaaca gcatttgggg 1800
ccatggtacc tgcacaccta aaacactagg ccacgcatct gatctgtagt cacatgacta 1860
agccaagagg aaggagcaag actcaagaca tgattgatgg atgttaaagt ctagcctgat 1920
gagaggggaa gtggtggggg agacatagcc ccaccatgag gacatacaac tgggaaatac 1980
tgaaacttgc tgcctattgg gtatgctgag gccccacaga cttacagaag aagtggccct 2040
ccatagacat gtgtagcatc aaaacacaaa ggcccacact tcctgacgga tgccagcttg 2100
ggcactgctg tctactgacc ccaacccttg atgatatgta tttattcatt tgttatttta 2160
ccagctattt attgagtgtc ttttatgtag gctaaatgaa cataggtctc tggcctcacg 2220
gagctcccag tcctaatcac attcaaggtc accaggtaca gttgtacagg ttgtacactg 2280
caggagagtg cctggcaaaa agatcaaatg gggctgggac ttctcattgg ccaacctgcc 2340
tttccccaga aggagtgatt tttctatcgg cacaaaagca ctatatggac tggtaatggt 2400
tacaggttca gagattaccc agtgaggcct tattcctccc ttccccccaa aactgacacc 2460
tttgttagcc acctccccac ccacatacat ttctgccagt gttcacaatg acactcagcg 2520
gtcatgtctg gacatgagtg cccagggaat atgcccaagc tatgccttgt cctcttgtcc 2580
tgtttgcatt tcactgggag cttgcactat gcagctccag tttcctgcag tgatcagggt 2640
cctgcaagca gtggggaagg gggccaaggt attggaggac tccctcccag ctttggaagc 2700
ctcatccgcg tgtgtgtgtg tgtgtatgtg tagacaagct ctcgctctgt cacccaggct 2760
ggagtgcagt ggtgcaatca tggttcactg cagtcttgac cttttgggct caagtgatcc 2820
tcccacctca gcctcctgag tagctgggac cataggctca caacaccaca cctggcaaat 2880
ttgatttttt ttttttttcc agagacgggg tctcgcaaca ttgcccagac ttcctttgtg 2940
ttagttaata aagctttctc aactgcc 2967
<210> 14
<211> 2954
<212> DNA
<213> KIFAP3
<400> 14
aggcgactct gggcgggtct gggccgctcc agtgttttgg ggcacagaag ctgtgggagg 60
agctggaggc ttcaccgtgg taaccacagc gccgctgctg ccccgccttg caggcctcag 120
gactgtcatc gcctctgggt gtgagggtac tttggccacc gtccccggaa ataaccgcgc 180
ctgcctctca agatacccca tcctctccac gccgctgccg ctgccgccat gcaaggggag 240
gacgccagat acctcaaaag gaaagttaaa ggagggaata tagatgtaca tccatcagaa 300
aaagcactca ttgttcacta tgaagtggaa gctaccattc ttggagaaat gggggacccc 360
atgttgggag aacgaaaaga atgtcaaaaa atcattcgac ttaagagtct caatgccaac 420
acagatataa cttccctggc aaggaaggtg gttgaagaat gtaaactcat tcatccttca 480
aaactaaatg aggtagaaca gctgttgtac tatctacaga accgccgtga ttcattgtca 540
ggaaaagaga aaaaagaaaa atcaagcaag cctaaagatc cacctccttt tgaaggaatg 600
gagattgatg aagttgctaa cattaatgac atggatgaat atattgagtt attatatgaa 660
gatattcctg acaaagttcg gggttctgct ttgatcctgc agcttgctcg aaatcctgat 720
aacttggaag aactactatt gaatgaaact gcccttggtg cattagcaag ggtcctgaga 780
gaagactgga agcaaagtgt cgagttagct acaaacataa tttacatctt tttttgtttc 840
tccagctttt ctcaatttca tggacttatt actcactata aaattggagc tctgtgtatg 900
aatattattg atcatgagtt aaaaagacat gagctttggc aagaagaact ctcaaagaag 960
aagaaagctg ttgatgaaga ccctgaaaac caaaccttga gaaaggatta tgaaaaaacc 1020
tttaaaaagt accaggggct tgtggtaaaa caggaacagc tattacgagt tgctctttat 1080
ttgcttctga atcttgctga ggatactcgt accgaactga aaatgaggaa caagaacata 1140
gttcacatgt tggtgaaagc ccttgatcgg gacaattttg agctgctaat tttagttgtg 1200
tcattcttga agaaactcag catttttatg gagaataaaa atgatatggt ggaaatggat 1260
attgttgaaa aactggtgaa aatgatacct tgtgagcatg aagacctgct gaatatcacc 1320
ctccgacttt tactaaacct atcctttgac acaggactga ggaataagat ggtacaagtt 1380
ggactgcttc ccaagctcac tgcactccta ggcaatgaca actacaaaca aatagcaatg 1440
tgtgttcttt accacataag catggatgac cgctttaaat caatgtttgc atacactgac 1500
tgtataccac agttaatgaa gatgctgttt gaatgttcag atgaacgaat tgacttggaa 1560
ctcatttctt tctgcattaa tcttgctgct aacaaaagaa atgtacagct tatctgtgaa 1620
ggaaatgggc tgaagatgct catgaagagg gctctgaagt ttaaggatcc attgctgatg 1680
aaaatgatta gaaacatttc tcagcatgat ggaccaacta aaaatctgtt tattgattat 1740
gttggggacc ttgcagccca gatctctaat gatgaagaag aggagtttgt gattgaatgt 1800
ttgggaactc ttgcaaactt gaccattcca gacttagact gggaattggt tcttaaagaa 1860
tataagttgg ttccatacct caaggataaa ctaaaaccag gtgctgcaga agatgatctt 1920
gttttagaag tggttataat gattggaact gtatccatgg atgactcttg tgctgcattg 1980
ctagccaaat ctggcataat ccctgcactc attgaattgc taaatgctca acaagaagat 2040
gatgaatttg tgtgtcagat aatttatgtc ttctaccaga tggttttcca ccaagccaca 2100
agagacgtca taatcaagga aacacaggct ccagcatatc tcatagacct aatgcatgat 2160
aagaataatg aaatccgaaa ggtctgtgat aatacattag atattatagc ggaatatgat 2220
gaagaatggg ctaagaaaat tcagagtgaa aagtttcgct ggcataactc tcagtggctg 2280
gagatggtag agagtcgtca gatggatgag agtgagcagt acttgtatgg tgatgatcga 2340
attgagccat acattcatga aggagatatt ctcgaaagac ctgacctttt ctacaactca 2400
gatggattaa ttgcctctga aggagccata agtcccgatt tcttcaatga ttaccacctt 2460
caaaatggag atgttgttgg gcagcattca tttcctggca gccttggaat ggatggcttt 2520
ggccaaccag ttggcattct tggacgccct gccacagcat atggattccg ccctgatgaa 2580
ccttactact atggctatgg atcttgataa agtatctgtt tccatgtgta atctcagctt 2640
agaagaaatc tgtgtgggtt gggttaattt tggatctttg cctaataatg catgttgatg 2700
ttattgtggg tctgtgtttg tttttatttt tatatgttgt tagctgcaga ttaaccccag 2760
cccctctgtc ttctgttaag tacagttgat actgacattg ttcactcatc aaaccacatc 2820
ttgatgctaa gtaacatttc ccatgagcca caaaactgaa tgctgaaaag ctactagact 2880
ggaaaacaaa cactgcatta tgtatgttaa gtgactaatt taatttcaat taaaaagcgt 2940
aaagtgaaaa tgaa 2954
<210> 15
<211> 3498
<212> DNA
<213> IPO4
<400> 15
ggcccagtag cggcggctca gttgctgcca tggagtcagc cgggctagag cagctcctac 60
gggagctgct gctaccggac accgagcgca tccgtcgggc cacggaacag ctccagatcg 120
ttcttcgggc ccccgccgct ttgccggctc tctgcgacct gctagcctcg gcggccgacc 180
cccagatccg ccagtttgcg gccgtgctga cccgcagacg actgaacacc cgctggcgac 240
ggctggcggc ggagcaacgg gagagcctca agtccctgat cctgacggcc ctgcagagag 300
aaacagagca ctgtgtgagc ctcagcctgg cccagctctc agccaccatt tttcgaaagg 360
aaggcttgga ggcctggcca cagcttttgc agctgcttca gcacagtacc cacagccccc 420
acagcccaga gagagagatg gggcttttgc tgctaagtgt ggtggtgacc tcccggcccg 480
aggccttcca accccaccac cgggagcttc ttcggcttct gaatgagact cttggtgagg 540
tgggctctcc tgggctgctc ttctactccc tgcgcactct gaccaccatg gctccctacc 600
tcagcactga agatgtgcct ctcgctcgga tgttggtgcc caagctgatc atggccatgc 660
agactctgat ccccatagat gaggcaaagg cctgtgaggc ccttgaggct ttggatgaac 720
tgttggagtc agaggtgccg gtcatcaccc cctacctctc tgaagtcctc acattctgcc 780
tggaggtagc tagaaatgtg gccctgggca atgcgatacg catacgtatt ctctgctgcc 840
tcactttctt ggtcaaagtc aagagcaagg ccttactgaa gaatcgtctc ctgccaccct 900
tgctgcacac ccttttcccc attgtggctg ctgagccccc accaggccag ttggatcccg 960
aggaccagga ttcagaagag gaagagttgg agattgagct gatgggggag actcccaagc 1020
atttcgctgt acaagttgtg gacatgctgg cactacacct gccccccgag aagctctgtc 1080
cccagctgat gcccatgttg gaagaggctt tgcggagcga gagcccatac cagcgcaaag 1140
ctggactcct ggtgctggcc gtgctgtctg acggagctgg cgaccacatc aggcagagac 1200
tgctgccccc actgctgcag attgtgtgca agggcctgga ggacccctcg caagttgtac 1260
gcaatgctgc gctgtttgcc ctgggccagt tctcagaaaa cctacagccc catatcagca 1320
gctattcaag ggaggtaatg ccactgctcc tcgcctactt gaagtcggtg cctcttggac 1380
acacacacca cctagccaag gcctgctatg ccctggagaa ttttgtggag aacctagggc 1440
ccaaggtgca gccctacctt ccggagctta tggaatgcat gctgcagctt ctgaggaacc 1500
ccagcagtcc ccgggccaag gagctggctg tgagcgccct gggagccatt gctacggctg 1560
cccaggcctc gctgctgccc tacttccctg ccatcatgga gcacctgcgg gaattcctgt 1620
taacaggccg tgaggacctt cagcctgtgc agatccagag cctggagaca ctgggggtgc 1680
tggcacgagc agtgggggag cccatgaggc cgctggctga ggaatgctgc cagctgggtc 1740
tgggcctctg cgaccaggta gacgaccctg acttgcggcg ctgcacgtac agcctatttg 1800
cagccttatc gggtctgatg ggtgagggcc tggcgcccca cttggaacag atcaccacgc 1860
tcatgctgct gtcactgcgt tccaccgagg gcattgtgcc tcagtatgac gggagcagct 1920
ccttccttct gtttgacgat gagagtgatg gggaagaaga ggaggagctc atggatgagg 1980
atgtggaaga agaggatgac tcagagatct cagggtacag cgtggagaat gccttcttcg 2040
atgagaagga agacacctgt gctgccgtgg gggagatctc tgtgaacacc agtgtggcct 2100
tccttccata catggaaagt gtctttgaag aagtatttaa actgctggag tgccctcacc 2160
tgaatgtgcg gaaggcagcc catgaggctc tgggtcagtt ttgctgtgca ctgcacaagg 2220
cctgtcaaag ctgcccctcg gaacccaaca ctgctgcttt gcaggctgcc ctggcccgag 2280
tcgtgccatc ctacatgcag gcagtgaaca gggagcggga acgccaggtg gtgatggccg 2340
tgctggaggc cctgacaggg gtgctccgca gctgtgggac cctcacactg aagccccctg 2400
ggcgcctcgc tgagctctgt ggcgtgctca aggctgtgct gcagaggaag acagcctgtc 2460
aggatactga cgaggaggag gaagaggaag atgatgatca ggctgaatac gacgccatgt 2520
tgctggagca cgctggagag gccatccctg ccctggcagc cgcggctggg ggagactcct 2580
ttgccccatt ctttgccggt ttcctgccat tattggtgtg caagacaaaa cagggctgca 2640
cagtggcaga gaagtccttt gcagtgggga ccttggcaga gactattcag ggcctgggtg 2700
ctgcctcagc ccagtttgtg tctcggctgc tccctgtgct gttgagcacc gcccaagagg 2760
cagaccccga ggtgcgaagc aatgccatct tcgggatggg cgtgctggca gagcatgggg 2820
gccaccctgc ccaggaacac ttccccaagc tgctggggct cctttttccc ctcctggcgc 2880
gggagcgaca tgatcgtgtc cgtgacaaca tctgtggggc acttgcccgc ctgttgatgg 2940
ccagtcccac caggaaacca gagccccagg tgctggctgc cctactgcat gccctgccac 3000
tgaaggagga cttggaggag tgggtcacca ttgggcgcct cttcagcttc ctgtaccaga 3060
gcagccctga ccaggttata gatgtggctc ccgagcttct gcgtatctgc agcctcattc 3120
tggctgacaa caagatccca ccagacacca aggccgcact gttgctgctc ctgacgttcc 3180
tggccaaaca gcacaccgac agctttcaag cagctctggg ctcactgcct gttgacaagg 3240
ctcaggagct ccaggctgta ctgggcctct cctagactgc aggctgcagc cagtccagag 3300
agaatagagc ctgcccaggc cttaagacca cctctcagcc cagttcagtt ctgccttacc 3360
aaagattctg agactcatac ccatttggag ccagccccac ttgctgcctt acagggctgt 3420
ccctgaggct ggatctgtta caaatgagtc atgacatcat actgtaataa aagcagcttg 3480
ttttctgctt gaacaata 3498
<210> 16
<211> 1285
<212> DNA
<213> NAT2
<400> 16
actttattac agaccttgga agcaagagga ttgcattcag cctagttcct ggttgctggc 60
caaagggatc atggacattg aagcatattt tgaaagaatt ggctataaga actctaggaa 120
caaattggac ttggaaacat taactgacat tcttgagcac cagatccggg ctgttccctt 180
tgagaacctt aacatgcatt gtgggcaagc catggagttg ggcttagagg ctatttttga 240
tcacattgta agaagaaacc ggggtgggtg gtgtctccag gtcaatcaac ttctgtactg 300
ggctctgacc acaatcggtt ttcagaccac aatgttagga gggtattttt acatccctcc 360
agttaacaaa tacagcactg gcatggttca ccttctcctg caggtgacca ttgacggcag 420
gaattacatt gtcgatgctg ggtctggaag ctcctcccag atgtggcagc ctctagaatt 480
aatttctggg aaggatcagc ctcaggtgcc ttgcattttc tgcttgacag aagagagagg 540
aatctggtac ctggaccaaa tcaggagaga gcagtatatt acaaacaaag aatttcttaa 600
ttctcatctc ctgccaaaga agaaacacca aaaaatatac ttatttacgc ttgaacctcg 660
aacaattgaa gattttgagt ctatgaatac atacctgcag acgtctccaa catcttcatt 720
tataaccaca tcattttgtt ccttgcagac cccagaaggg gtttactgtt tggtgggctt 780
catcctcacc tatagaaaat tcaattataa agacaataca gatctggtcg agtttaaaac 840
tctcactgag gaagaggttg aagaagtgct gagaaatata tttaagattt ccttggggag 900
aaatctcgtg cccaaacctg gtgatggatc ccttactatt tagaataagg aacaaaataa 960
acccttgtgt atgtatcacc caactcacta attatcaact tatgtgctat cagatatcct 1020
ctctaccctc acgttatttt gaagaaaatc ctaaacatca aatactttca tccataaaaa 1080
tgtcagcatt tattaaaaaa caataacttt ttaaagaaac ataaggacac attttcaaat 1140
taataaaaat aaaggcattt taaggatggc ctgtgattat cttgggaagc agagtgattc 1200
atgctagaaa acatttaata ttgatttatt gttgaattca tagtaaattt ttactggtaa 1260
atgaataaag aatattgtgg aaaaa 1285
<210> 17
<211> 6010
<212> DNA
<213> NFIX
<400> 17
gtctaaactt tcactttcac agcgcggcgg ctgcggcggc ggcggcggcg ggcgagggtg 60
accggccgag cggcggcggc atggagtaga cgcgcggcgg cagcggcggc ggcggcggac 120
gcgagaggca gcggcgagcg cggcggcggc ggcggcagcg gcggccccgg agccggcggg 180
gccgagcttg cgagcggcga gcgcggagcg gcgccgggcc gagcgcgggg ccgcgggccg 240
ggcgggcgca gcgcggcgga ggccggagga gccgagccgg agcccgagcc cgagcgcggc 300
cgccgcctgc cgggcctccc ctcgccgcgg ccggccgccg cgctcccgcc cgggcgccca 360
gctatgtact ccccgtactg cctcacccag gatgagttcc acccgttcat cgaggcactg 420
ctgcctcacg tccgcgcttt ctcctacacc tggttcaacc tgcaggcgcg gaagcgcaag 480
tacttcaaga agcatgaaaa gcggatgtcg aaggacgagg agcgggcggt gaaggacgag 540
ctgctgggcg agaagcccga gatcaagcag aagtgggcat cccggctgct ggccaagctg 600
cgcaaggaca tccggcccga gttccgcgag gacttcgtgc tgaccatcac gggcaagaag 660
cccccctgct gcgtgctctc caaccccgac cagaagggca agatccggcg gattgactgc 720
ctgcgccagg ctgacaaggt gtggcggctg gacctggtca tggtgatttt gtttaagggg 780
atccccctgg aaagtactga tggggagcgg ctctacaagt cgcctcagtg ctcgaacccc 840
ggcctgtgcg tccagccaca tcacattgga gtcacaatca aagaactgga tctttatctg 900
gcttactttg tccacactcc ggaatccgga caatcagata gttcaaacca gcaaggagat 960
gcggacatca aaccactgcc caacgggcac ttaagtttcc aggactgttt tgtgacttcc 1020
ggggtctgga atgtgacgga gctggtgaga gtatcacaga ctcctgttgc aacagcatca 1080
gggcccaact tctccctggc ggacctggag agtcccagct actacaacat caaccaggtg 1140
accctggggc ggcggtccat cacctcccct ccttccacca gcaccaccaa gcgccccaag 1200
tccatcgatg acagtgagat ggagagccct gttgatgacg tgttctatcc cgggacaggc 1260
cgttccccag cagctggcag cagccagtcc agcgggtggc ccaacgatgt ggatgcaggc 1320
ccggcttctc taaagaagtc aggaaagctg gacttctgca gtgccctctc ctctcagggc 1380
agctccccgc gcatggcttt cacccaccac ccgctgcctg tgcttgctgg agtcagacca 1440
gggagccccc gggccacagc atcagccctg cacttcccct ccacgtccat catccagcag 1500
tcgagcccgt atttcacgca cccgaccatc cgctaccacc accaccacgg gcaggactca 1560
ctgaaggagt ttgtgcagtt tgtgtgctcg gatggctcgg gccaggccac cggacagccc 1620
aacggtagcg gccagggcaa agtcccgggg tcatttttgc taccgccgcc gcctccagtg 1680
gccagacctg tgccccttcc tatgcctgat tccaaatcca ccagcactgc cccagacggc 1740
gccgccttga ctcctccatc accttcattc gcaacgacag gcgcctcctc tgccaaccgg 1800
tttgtcagca tcggaccccg ggacggcaac tttctgaaca tcccacagca gtctcagtcc 1860
tggttcctct gataagatcg acaaaagaaa caacaaaatg agaagaagag gttcctcgaa 1920
aggggggaga agaaattttg agaatggaaa aatcccccag cccagcccag ccccaccgaa 1980
aagcaaaaat tacacgtcgt cagccactca gcccttctct cctccagccc ggggaccccc 2040
gcgggcccca gaagcagccc agttctcaga gagcccttgg aaggggtctc ggtggagctg 2100
tgcaccagca gccaagcaga aagaaacacg cgacatggac tctgtcaagt agaggacaga 2160
aagcaagaaa ggatgcagaa ctgccttcct ccccctgacc ccgccccggc cttctgggga 2220
aggaacaaag tccccaaaca aagcaaccag cacaattctg aaggggcctg gcctccaccc 2280
tcaccccttc ctaggggaac cccaccctcc acacagccgg agctgcccta gggagcctgg 2340
agggccagct tgtaaagatg atggggttta gatccctcag gctctcccct ccagactccg 2400
cccttccctc cctccctccc tccctccctc tctgccaagg ctccagcttc ttcccccagc 2460
tgctcccgac caggaggggg agagcagcct ccacttaccc caccccaccc ttgggctaaa 2520
agcccccagg cgggcagggg gtgacccctg gagctagttg cgtgtcccag aatggagggt 2580
gttctgacac cccaccctga gccgcaagag cagtcctggg gccctggacc cctctgtaca 2640
gtccgtagga aaaagtcgga atgctctcga cggcctcgtc ccagcctggg acaggccccc 2700
tttcccctct ctctgcaggc caggagggcc tccttcctgc cacgagggag gggagtcggg 2760
ccccaggtcg cccccgcccc cagccctgca tgcaggtgcc ctcgctccgc cccatcagtt 2820
cctgcccctg cccctcatgc agactgccct gctggggccg ggccggaggg tggagcagaa 2880
aggggacccc ggagccgagc gaggaggacc aggcagccgc cgctgccgcg ctaagccacc 2940
acctgcgctt aggtaggcgt cctgctcgcc gactttcagt tccttgggag ggtgttgggt 3000
gtcgtccttt tcaaaagtgt tttggagctt tctgtgcccc ccgactttcc cccgcctccc 3060
cgccccccac gtggccactt ttctctggat tttagctgta atgtctttac tctttattta 3120
ggggtggggc attcattgtt tgggtctttt gctgttggaa tgggaactcc tcctccattt 3180
gagcaacttg ggaacaattt ggtaacacac cacaggaagt agctctcccc cccagccccc 3240
tcctccctca agggagggtt ggggggcctg tccagagggt cttcagaagc ccccctggga 3300
gggaggggag gatgagcacg cccagctccc ctccagggtg tgacttggcc cctctggctt 3360
gtctttctgt gccttactcc tcctcctgcg tctcccgttc ctggcccctt cttgagtcct 3420
tgtgcctctc tctttctctc tctttcttaa ttgtatgaaa acacaaagca caggtcagga 3480
tcctctgaga gaaaatcaac attgcaccac gtaggggtgg gctatgggct gtatttattg 3540
tgaatctagt ttgtgaggct gtggccccga gctggcggag ggagggaaga ggagggagtg 3600
acgggagggg aggaggtcag cgacctgggg ccgtagcggc aggcgaacgg tgcctgctac 3660
ccagctggaa gccacaaggt ggctggctcc aggggcggct tttgttggaa gttgagtgaa 3720
gccctccccc tgtcctcagc gtgcagccct agaggacccc agggctgagg ggcagtggat 3780
cctgcgggag tctcccgggg cgtggggagt aaggccccgg gggtgggggg ccgggtgggc 3840
cgggcgtgac gcgcggtcaa agtgcaatga tttttcagtt cggttggcta aacagggtca 3900
gagctgagag cgaagcagaa ggggctccct gtccggccca cgtgcccttt ccctcgacga 3960
cagtcgaggg ctcgggctct gtgggactgt gggagctagg gtctgcgggg cgcctgcccg 4020
ggcgaggtcg gaagctgcag gccagctggg cccgggccgg agcgtgcccg gcggggctgc 4080
ccgggcgggc agggggtggg ggctgctcct ttcccaagtg gtgttgtgag gggcaatgag 4140
ggcaacagga gatgtgggga cgtgttagga gagaaaaaaa aaaaaacaaa aatatatatg 4200
ggggaaatta actttttttt ttcattgaac caagtgcaat gcatcagaga gttttcctat 4260
ctttgtatgt taagagatta agaaaaaaaa attctatttt tgttgtaatg tcctcgcggc 4320
tctggggacg ctaaaagaac cgggcctgcc ccgccctgcg cggggataac gaaagctgag 4380
tgtttttccc ttttttttgt tcgtttttag tttttttttt tttaagtcgt tttcctgcgt 4440
tgacgaggat gatctggggt ttttatttgt ttcgtcgttc gttctgtttc ggtgggaggg 4500
ctgaaggaaa cgttcacatt ttagagttta aaaaaaacac ctcgacattt aaaaaatcaa 4560
ccaacacaag atcaaaaagg aaaaggacga gagaaaaatt atttttaaga taattaaaca 4620
taaaaccctg gtgcttctta cattataaag tacgttttaa agaacccaca aactattata 4680
cataagttta tgaatcaatt aaatatcctg cacttgttag gaatacgcat atcccttctt 4740
tgttgagttt aacggaacgg gacagcggcg tgcccccggc ggctggactg ctccggccgc 4800
gggtctcccc gggcgcccct ccctggggcc cagcacccct cctcgcccca tccccgtccg 4860
ggtacggggg cgcggcaggg gtccccggcc cctcccccgc agaggtcaat gccaacgaac 4920
aaacgtcccc tccctccctc cctctccgcc ccgagcgccc ttctttgagc cagacgccaa 4980
cttgaccctc accagcatta tcaggagcgc gctcagcaag ttggtagttt cctcccccct 5040
ttcccggcgc ccctcccgcc cccattcaac atctctcatc ctatccccga ccccctccgg 5100
ggaacaccgg gaaggctcga cgctccagga caggaccagc cacgctgaca ggtcgatttg 5160
cccaggcccg cgcccgcacg cacgcacgca cacggccccg cacacagccc cgccccaccc 5220
cgcaaccagc cctgtcgact gccttataca cccgcccccg cgctggccgg ccgacctagt 5280
gccttgttct cacccccgtg ctggcggagc ggacgccgcg ctctgggtcc cagaggggcc 5340
gggtggctca gacgacccac cactccccca ccctgaccgt gctgaacaga cccccccaca 5400
cgagagaaaa taaaggagca ataaagtcac gagaactttc gtcccccaat cgagagcccg 5460
aggggcaccc cagccccgcc tctgctcccc cccaccccac ccaccctcgg ggcgcccccc 5520
tccccccgca agccagcctg ggccagcccc gcttcggccc ctcccgggag atccgtgcgc 5580
ccgaccagca ccagcatcgc ggaccgcaaa ggccgcccgt cccgtcaaac aagtttcttc 5640
ttaggctaag aaacgcagta tatacgagta tctctatata tagtactaat ggatttggtg 5700
tgcttccccc ttagcgtccc cctccctctg ctcctcctcc ttcagcctgg tctccccctc 5760
ttctctgccc tccacccccg tctctgcact gagatacata agaaacaagg gtagtttact 5820
gtctgttttg ttttctgggt tttcagtgtc ctagcggaat gcaagtaggc agccagcccg 5880
tctgttccct ctccgccccg ccccgccccg cccccgtcac tgcgcttctg ttataccatc 5940
tttgcctgac tctctccggc ttctccattg aatggctaat gtgtatgtga aataaagaaa 6000
taaagaaaaa 6010
<210> 18
<211> 6353
<212> DNA
<213> PLIN4
<400> 18
atgcagaccc tgggcagctt ctttgggtcc ctgcctggct tcagctctgc ccggaacctg 60
gtggccaacg cacatagctc ggcgagagcc cggccggccg ctgaccccac aggagcgcct 120
gctgccgagg ctgcccaacc acaggctcag gtggctgccc acccagagca gacggcccca 180
tggacggaga aggagctgca accttcggaa aagcagatgg tgtccggggc caaagacctg 240
gtgtgttcca agatgtccag ggccaaggat gccgtgtcct ccggggtggc cagcgtggtg 300
gacgtggcta agggagtggt ccagggaggc ctggacacca ctcggtctgc acttacgggc 360
accaaggagg tggtgtccag cggggtcaca ggggccatgg acatggctaa gggggccgtc 420
caagggggtc tggacacctc gaaggctgtc ctcaccggca ccaaggacac ggtgtccact 480
gggctcacgg gggcagtgaa tgtggccaaa gggaccgtac aggccggtgt ggacaccacc 540
aagactgtgc tgaccggcac caaagacaca gtgactactg gggtcatggg ggcagtgaac 600
ttggccaaag ggactgtcca gactggcgtg gaaacctcca aggctgtgct gaccggcacc 660
aaagatgctg tgtccactgg gctcacaggg gcagtgaatg tggccagagg aagcattcag 720
accggtgtgg acaccagtaa gactgtccta acaggtacca aggacaccgt ctgtagtggg 780
gtgactggtg ccatgaatgt ggccaaagga accatccaga ccggcgtgga caccagtaag 840
actgtcctaa caggtaccaa ggacaccgtc tgtagtgggg tgactggtgc catgaatgtg 900
gccaaaggaa ccatccagac cggcgtggac accagtaaga ctgtcctaac aggtaccaag 960
gacaccgtct gtagtggggt gactggtgcc atgaatgtgg ccaaaggaac catccagacc 1020
ggcgtggaca ccaccaagac tgtcctaact ggcaccaaga acactgtctg cagtggggtg 1080
accggtgccg tgaacttggc caaagaggcc atccaggggg gcctggatac caccaagtct 1140
atggtcatgg gtacgaaaga cacgatgtcc actgggctca caggggcagc gaatgtggcc 1200
aagggggcca tgcaaactgg gctgaacaca acccaaaata tcgcaacagg tacaaaggac 1260
accgtctgca gtggggtgac tggtgccatg aatttggcca gaggaaccat ccagacaggc 1320
gtggacacca ccaagatcgt tctaactggt accaaggaca ctgtctgcag tggggtcacc 1380
ggtgctgcga atgtggccaa aggggccgtc cagggcggcc tggacactac aaagtctgtc 1440
ctgactggca ctaaagatgc tgtgtccact gggctcacag gggctgtgaa cgtggccaaa 1500
gggaccgtcc agaccggcgt agacaccacc aagactgtcc taaccggcac caaggacacc 1560
gtctgcagtg gggtgaccag tgctgtgaac gtggccaaag gggccgtcca ggggggcctg 1620
gacaccacca agtctgtggt cataggtaca aaagacacga tgtccactgg gctcacgggg 1680
gcagcgaatg tggccaaggg ggctgtccag acaggtgtag acacagccaa gaccgtgctg 1740
accggcacca aggacacagt gactactggg ctcgtggggg cagtgaatgt cgccaaaggg 1800
accgtccaga caggcatgga caccaccaaa actgtcctaa ccggtaccaa ggacaccatc 1860
tacagtgggg tcaccagtgc cgtgaacgtg gccaaggggg ctgtgcaaac tgggctgaaa 1920
acgacccaaa atatcgcgac aggtacaaag aacacctttg gcagtggggt gaccagtgct 1980
gtgaatgtgg ccaaaggggc tgcccagaca ggtgtagaca cggccaagac cgtgctgacc 2040
ggcaccaagg acacagtcac tactgggctc atgggggcag tgaatgtcgc caaagggact 2100
gtccagacca gtgtggacac caccaagact gtcctaactg gtaccaagga caccgtctgc 2160
agtggggtga ccggtgctgc gaatgtggcc aaaggggcca tccaaggggg cctggacact 2220
acaaagtctg tcctgactgg cactaaagat gctgtgtcca ctgggctcac aggggctgtg 2280
aagttggcca aagggactgt ccagaccggc atggacacca ccaagactgt gttaactggt 2340
accaaggatg ctgtgtgcag tggggtgacc ggtgctgcga atgtggccaa gggggccgtc 2400
cagatgggtg tagacacggc caagaccgtg ctgaccggta ccaaggacac tgtctgcagt 2460
ggggtcaccg gtgctgcgaa cgtggccaag ggtgctgtgc aaactgggct gaaaacgacc 2520
caaaatatcg caacaggtac aaagaacacc cttggcagtg gggtgaccgg tgctgcgaaa 2580
gtggccaaag gggccgtcca ggggggcctg gacactacaa agtctgtcct gactggcact 2640
aaagatgccg tgtccactgg gctcacaggg gctgtgaact tggccaaagg gactgtccag 2700
accggcgtgg acaccagcaa gactgtcctg accggtacca aggacaccgt ctgcagtgga 2760
gtcactggtg ccgtaaatgt ggccaaaggg accgtccaga caggtgtgga cacagccaag 2820
acggtgctga gtggcgctaa ggatgcagtg actactggag tcacgggggc agtgaatgtg 2880
gccaaaggaa ccgtgcagac cggcgtggac gcctccaagg ctgtgcttat gggtaccaag 2940
gacactgtct tcagtggggt taccggtgcc atgagcatgg ccaaaggggc cgtccagggg 3000
ggcctggaca ccaccaagac agtgctgacc ggaaccaaag acgcagtgtc cgctgggctc 3060
atggggtcag ggaacgtggc gacaggggcc acccacactg gcctcagcac cttccagaac 3120
tggttaccta gtacccccgc cacctcctgg ggtggactca ccagttccag gaccacagac 3180
aatggtgggg agcagactgc cctgagcccc caagaggccc cgttctctgg catctccacg 3240
cccccggatg tgctcagtgt aggcccggag cctgcctggg aagccgcagc cactaccaag 3300
ggccttgcga ctgacgtggc gacgttcacc caaggggccg ccccaggcag ggaggacacg 3360
gggcttttgg ccaccacaca cggccccgaa gaagccccac gcttggcaat gctgcagaat 3420
gagttggagg ggctggggga catcttccac cccatgaatg cggaggagca agctcagctg 3480
gctgcctccc agcctgggcc aaaggtgctg tcggcggaac aggggagcta cttcgttcgt 3540
ttaggtgacc tgggtcccag cttccgccag cgggcatttg aacacgcggt gagccacctg 3600
cagcacggcc agttccaagc cagggacact ctggcccagc tccaggactg cttcaggctg 3660
attgaaaagg cccagcaggc tccagaaggg cagccacgtc tggaccaggg ctcaggtgcc 3720
agtgcggagg acgctgctgt ccaggaggag cgggatgccg gggttctgtc cagggtctgc 3780
ggccttctcc ggcagctgca cacggcctac agtggcctgg tctccagcct ccagggcctg 3840
cccgccgagc tccagcagcc agtggggcgg gcgcggcaca gcctctgtga gctctatggc 3900
atcgtggcct cagctggctc tgtagaggag ctgcccgcag agcggctggt gcagagccgc 3960
gagggtgtgc accaggcttg gcaggggtta gagcagctgc tggagggcct acagcacaat 4020
cccccgctca gctggctggt agggcccttc gccttgcccg ctggcgggca gtagctgtag 4080
gagcctgcag gcccggcgcg gggtcgccct gctctgtcca gggaggagct gcctcagaac 4140
tttctccccg cccccaaacc tggatcggtt ccctaaagcc ctagaccttt ggggctgcag 4200
ctggctgagc gccgaggggc tgcggaggca gtgaccttct taactgagcc accccacgcc 4260
ctgctccggg cctgcctgca tctcccacct cctccccagc gctgcctgcc cctctcggag 4320
cctggggtca ctcagaccac cagccaagag ccttcccttg aagtccccaa gcaagcactg 4380
caattaggaa agagaaaaag cagcgtgccc agcctggaag ggcatctgtt tgccccgcta 4440
gcaacccttt tatatctagc agggctcttc cagtcctgca gcacgggccc ccagctatca 4500
gcggtgcagg cagtgctgtg gcatcccagg ctccgggcag ctccgttctc atgctgaaag 4560
tgggtctccg gccttagcac acacaccttg agggtcttaa gaaccacatt ccctcatagt 4620
agaaagtact agaaaaagcg acactgccat catcatccca aggcaggctg ctactgcctt 4680
tgctgacccc cggggtggcc tcacggtggg gacaaagctg ccaggagcca cagcagccac 4740
agctggggct ttgcaccagc ctggcttgag actgagcagt ttgcaggggg tggggggtgc 4800
aaaaaacaag caaacaggct gctgctgcct ccagctgccc accacaggcc tgccccaggc 4860
acctggggct ctgaggcccc tggggaggct gggcccagca gctgcccctg gagaacacag 4920
acaaaggact tccccgcagg gaactgtgcc ctatggaggg atcagacagg gctgggaaca 4980
gccacagagg ctgcgtgcct atggcacagc ccttcctccg ccgcacactc cccctgggtc 5040
ctcaggccca cccaagcgcc gggctgcaga ggaagcgggg ctggggaggc tgcaggcatc 5100
agagacactg gtggtggcgg acccggccgc cgggccccgt gctctcaggc tagcccaggt 5160
cgtggaggct ggcaggctca ggtcgggtgt gagacgtgcc gtggctgcgc tcagtccagc 5220
ggggaggagc cgttcagccc ggcctcccca ggaagccata tccccactca cccggtaaga 5280
gaaccttgtc gtcccctttc catgctctcc taggacacga gcccaggaac cccagaccca 5340
gggggaggaa gggtggaggg gccccagggg tcaccgtgtg caccaggggc cgtgaggggc 5400
cggggcattc agctcagctc tgaaccgggg aagctggcac ggcaaggact gcctcaggtg 5460
acgggccgtg agaggggacg ggtcaggagc cttcccaagc cttctcctca gcccgacacc 5520
catggccatc ggaggctagg atgccagaca cagccatttg cagaaatcag gcacagtgac 5580
tgcagctcac gtccagccaa ccaagcatgg ggccgcagct caggaagtcc cttcccgcca 5640
caccacagcc taattcttac tgggacggag gcaactcggc tacgctgggc aggacgacaa 5700
acacgagacg ccactgtgga atgagcaact tcggagcacg gggtgacttg cttgggaccg 5760
tgcccacgtg acagcccctt atgcagagga ggaaagagaa gccccgagtg ggaggggaac 5820
ctgtccaaag tcacacggtg tgtgggtgac acagctgggg tgagtcgagg ctggcccctg 5880
aggcccatgc tccctgaacg ctggagacca ctgtcggcta gcagcggctc tcagggaagg 5940
cctggtctcc accctcccag cctagcctcg cggaccctcg tcctccccac atcggacctg 6000
ctcacctgcc tggaccctgg gctgccagat gcaggaagca tcaaaccccc cagcctcgtg 6060
ggtgcggggc agggcgcagg cagcacagct tagatgccct ggtttgtccc tcttgtctcc 6120
tgggaagagc ttgctcccgc ccagctctcc tgccactggc ctttcagggt tgggctgggc 6180
ccagagtgcc ttttagtcgc ttctcacggt ggcctgatgg ctcaacccag tcccaaacgg 6240
gcccagtgac actgccgcct gcgccccagc tcaggccccc actgcaccag caatgctaga 6300
aaaccaagcc aataaaagtg atttcttttt tcattaaaaa accatttata gtc 6353
<210> 19
<211> 5532
<212> DNA
<213> SCRIB
<400> 19
ggactcggct tcccgacggg ctgcgcggcg gccgggtggg tgtcggcggg gcagtccggc 60
gggcagcggc ggttccggtg cggcacagcg ggcggacgag cgggcgggac gagctgagca 120
ggaccaagcg ggatgcggag ccgccgccgc cgccgctccc cgcgcttcct aagagtctga 180
gacccgccgg gccgcgcccc ctgcccaggc ccgcagtccg agcgttccga gcgcgggccg 240
ggcccagcgc cggccgcggc cgcgtccccg tccagtctcg ggcggcccgc cccctgcctg 300
cgccccctcc ccatgcgcgg cgcccatgcg gactgagccc cgccccccgg ccccgagccc 360
gccgagcgcc gccgccggag cccgcgccgc ccacccgcac catgctcaag tgcatcccgc 420
tgtggcgctg caaccggcac gtggagtcgg tggacaagcg gcactgttcg ctgcaggccg 480
tgccggagga gatctaccgc tacagccgca gcctggagga gctgctgctc gacgccaacc 540
agctgcgcga gctgcccaag ccttttttcc ggctgctgaa cttgcgcaag ctgggcctga 600
gcgacaacga gatccagcgg ttgcctcccg aggtggccaa cttcatgcag ctggtggagc 660
tggacgtgtc ccggaacgat atccctgaga tcccggagag catcaagttc tgcaaggctc 720
tggagatcgc ggacttcagc gggaaccccc tctccaggct ccctgatggc ttcactcagc 780
tgcgcagcct ggctcacctg gccctgaatg atgtgtctct gcaggcactg cccggggacg 840
tgggcaacct cgccaacctg gtgaccctgg agctccggga gaacctgctc aagtccctgc 900
cagcgtccct gtcatttctg gtcaagctgg aacagctgga tctgggaggc aacgatctgg 960
aagtgctgcc agacactctg ggggctctgc ccaatcttcg ggagctgtgg cttgaccgga 1020
accagctgtc agcactgccc ccggagctcg ggaacctgcg gcgcctggtg tgcctggacg 1080
tgtcggaaaa ccggctggag gagctgcctg ctgagctcgg cgggctggtg ctgctcactg 1140
acctgctgct gtcccagaac ctgctgcgga ggctgcccga cggcatcggt cagctgaagc 1200
agctatccat cctaaaggta gaccagaatc ggctgtgcga ggtgaccgag gccatcgggg 1260
actgtgagaa cctctctgag ctgatcctca cggagaacct gctgatggcc ctgccccgct 1320
ccctgggaaa gctgactaag ctgaccaacc tcaacgtgga ccggaaccac ctcgaggcgc 1380
tgccgcccga gatcgggggc tgtgtggcac tcagcgtcct ctccttgagg gacaaccgcc 1440
tggccgtcct gccaccagag ctggcccaca cgacagagct gcacgtgctg gacgtggcgg 1500
ggaaccgcct gcagagtctg ccgttcgcgc tcacccacct caatctcaag gccctgtggc 1560
tggcagagaa ccaggcgcag cccatgctcc ggttccagac ggaggatgat gcccggaccg 1620
gcgagaaggt gctcacctgc tacttgctgc cccagcagcc cccacccagc ctcgaggatg 1680
ctgggcagca ggggagcctc tcggagacct ggagcgatgc cccgccgagc cgcgtcagcg 1740
tcatccagtt cctggaggcc cccataggtg atgaggacgc tgaggaagct gcagctgaga 1800
agcggggcct acagcgccgg gccacacctc accccagcga gctcaaggtg atgaagagga 1860
gcatcgaggg gcggcggagc gaggcctgcc cttgccagcc agactctggg tcgcccttgc 1920
ctgcagagga ggagaagcgg ctgagtgccg agtctggcct gagtgaagac tctcgcccat 1980
ctgccagcac agtctctgag gctgagcccg agggcccgtc ggctgaggca cagggtggga 2040
gccagcagga agccacgact gctggcgggg aggaagacgc cgaagaggac taccaggagc 2100
ccacggtgca tttcgcagag gacgcactgc tgcccgggga tgacagggag atcgaggagg 2160
ggcagcctga ggccccctgg accctgccag gcgggaggca gcggctcatc cgcaaggaca 2220
cacctcacta caaaaagcac ttcaagatct ccaagctgcc ccagcccgag gccgttgtgg 2280
ctctgctgca gggcatgcag cctgatgggg agggccctgt ggctcccggg ggctggcaca 2340
atggccccca cgcaccctgg gctcctcggg cccagaagga ggaggaggag gaggaagagg 2400
gtagtcctca ggaggaggag gaagaggagg aggaggaaaa cagggctgaa gaggaagagg 2460
ccagcactga ggaggaggac aaggaggggg ccgtggtttc tgcgccctct gtcaagggag 2520
tgtcgtttga ccaggccaat aacctgctga tagagcctgc tcgcattgag gaggaagagc 2580
tgaccctcac tatcctgcgg cagactgggg gcctgggcat cagcattgcg ggcggcaagg 2640
gctccacacc ctataagggg gacgacgagg gcatattcat ctctcgggtg tccgaggaag 2700
gccctgcggc ccgggctgga gtccgtgtgg gtgacaagct cctggaggtg aatggtgtgg 2760
ctctgcaggg cgccgagcac cacgaggccg tggaggcgct ccggggggcc ggcactgccg 2820
tgcagatgcg agtgtggcgg gagcgcatgg tggagcctga gaacgcggtc accatcacgc 2880
cgctgcggcc cgaggatgat tacagccccc gagagcggcg gggagggggg ctgcgcctgc 2940
ccctgctccc gcctgagagc cccgggcccc tccgtcagcg ccacgtggcc tgcctggcac 3000
gcagcgagag ggggctgggc ttcagcattg ctggtgggaa aggctccaca ccctacaggg 3060
ctggtgatgc gggcatcttc gtctcccgca ttgccgaggg cggtgctgct caccgcgcgg 3120
gcacactgca ggttggcgac cgcgtcctct ctattaatgg agtggacgtg actgaggcca 3180
ggcatgacca cgccgtctcc ctgctgaccg ctgcctcccc caccatcgcc ctgctgttgg 3240
agcgggaggc tgggggccct cttcctccca gccctctgcc acattcctca ccccccaccg 3300
ctgctgttgc caccaccagc ataaccactg ccacccccgg ggtgcctggg ttgccgagcc 3360
tggcccccag cctgctggct gccgcgttgg aagggccata cccagtggag gagatccgtc 3420
tgccaagagc tgggggccct ctggggctta gtattgtcgg aggctccgac cattccagcc 3480
acccgtttgg tgtccaggag cctggtgtgt tcatctccaa ggtgctcccg cggggcctgg 3540
ccgctcgcag cggcctgcgg gttggggacc gcatcctggc agtgaacggg caagacgtgc 3600
gggatgccac gcaccaagaa gcagtcagtg ccctgctccg gccctgcctg gagctgtcgc 3660
tgctggtgcg gagggacccg gcacccccgg gcctacggga actgtgcatc cagaaggcac 3720
ctggggagag gctgggcatc agcatccgcg ggggtgccag gggccacgct ggcaaccccc 3780
gcgaccccac agacgagggc atcttcatct ccaaggtgag ccccacgggg gcagccgggc 3840
gcgacggtcg gctgcgtgtg ggtttgcggc tgttggaggt gaaccagcag agcctgctgg 3900
gcctgacgca cggcgaggcg gtgcagctgc tccgcagtgt gggcgacacc ctcaccgtgc 3960
tggtctgtga cggctttgag gccagcaccg acgcagccct ggaggtgtcc ccaggtgtca 4020
ttgccaaccc ctttgcggca ggcatcggcc accggaacag cctggagagc atctcttcca 4080
tcgaccggga gctgagccct gagggcccag gcaaggagaa ggagctgcct ggacagaccc 4140
tgcactgggg gcccgaggcc acagaagccg caggtcgggg tctgcagccc ctgaagctgg 4200
actaccgcgc cctggccgcc gtgcccagcg ctggcagcgt gcagagggta ccgtctggag 4260
cagctggagg gaagatggct gaatctccct gctcccctag tggccagcag ccgccctccc 4320
cgccttctcc ggatgagctg cccgccaatg tgaagcaggc ctacagggcc ttcgcggccg 4380
tgcccacttc tcacccgcct gaggatgccc ctgcccagcc ccccacgcct gggcctgcag 4440
cctccccgga gcagctgtcc ttccgggagc ggcagaagta ctttgagctg gaggtgcgcg 4500
tgccccaggc cgagggcccc cctaagcgcg tgtccctggt gggtgctgac gacctgcgga 4560
agatgcagga ggaggaagcc agaaaactac agcagaagag agcgcagatg ctgcgggagg 4620
cggcagaggc tggggccgaa gcgaggctcg ccctggacgg ggagacgctg ggcgaggagg 4680
aacaggagga tgagcagcca ccctgggcca gcccgagccc cacctcaagg cagagcccgg 4740
cgtccccccc acccctggga ggtggcgccc cggtgcggac ggccaaagct gaacggcgcc 4800
accaggagcg gctgcgcgtg cagagtccgg agccaccggc acccgagcgt gccctgtccc 4860
ctgccgagct ccgggccctg gaggccgaga agcgtgcgct gtggagggca gccaggatga 4920
agtcattgga acaggacgct ctccgagcac agatggtcct cagcaggtcc caggaaggcc 4980
ggggcacgcg ggggcccctg gagcgactgg ccgaggcccc ttcccctgcg cccaccccgt 5040
cgcccacccc tgtggaagac ctcggccccc agaccagcac ctccccggga cgcctgtcac 5100
cggactttgc tgaggagttg aggtccctgg aaccatctcc cagccctggc ccgcaggagg 5160
aggatggaga agtggctctg gtgcttctgg gcaggccctc acccggcgct gtgggccctg 5220
aagatgtggc actgtgcagc agccgccgcc ccgtaaggcc tgggcgccgt ggcctgggcc 5280
ctgtgccctc ctagaggagc aggcacctcc cccagacttg gggtgggggc cctgccagct 5340
ccagcaccac ccttgcccca agtcttttaa cctgggtgtt agcattttaa agagacccca 5400
caggagttct ggcctgtgac taactaactg ccccacccca gccgagacct cggcgagact 5460
gtaactagtg atgtttgtac aaccaaagac tctattttgt ggtttaagga gaataaagtt 5520
gactacattt ta 5532
<210> 20
<211> 5027
<212> DNA
<213> SHC4
<400> 20
attcacagat ttattagctt gcacacacac agagaaattc attcggcaaa gttcattcat 60
aaaaatttca acacgctgcg tatcatcctg cacatctcag ctttcggctg caaatgggct 120
tctgaaaaaa gctccgagag gaatccagga gggagggaag ctctgagcga gggtaggcag 180
gctgggaggg gatctgagga acacggaccc atcacaagtc agtgaaacaa tgcggagcag 240
cgcccgtcag tagtactcct ggctggtggc ccagaacggg atgcaagaca agatcttcca 300
agagagggca gcctttggaa tcaacgaacc caggcaaaag ggcctttggt tcatagatac 360
attttttttt cctttttaaa tgaacaatca ctggaacaaa taaagggtta ataggccagt 420
catttgcccc gccctgtgag agccgaaggg agcaggttcg aaagttcctg tgtgcagaac 480
agaaggctgg ggtgagggtg ggagtcgggt gctaaatatt tctactaggc tcctgcaagg 540
ctagtgatgc agcgggcccc ccgaccggcg ctcgcccggg ttctgcgcct aagagttggc 600
cgtgagcgac ccgcgccgcc gggagcctgg gtctaggctc tcccgacaag gattccaagg 660
cgagaacact ggtgcctctg cctgggccag ggagagactg aaatcagagc aggggaggcg 720
tttcccccat gggctgtcac ccttaagggg ccgggagccg aggtgggcga gctcgagagc 780
agagttggag aggtggctgc tgtgagttgc atcgggcgtt gaggtatctg atgtctgcac 840
cgtttatcta ccagacgacg aggcgattta tgcaacagta tcctgtttca gcactgccaa 900
ggctatgcga gaacgcggcc aggacagcct ggcaggactc gtgctgtatg taggactctt 960
cgggcacccc gggatgctgc acagggccaa gtacagccgc tttcggaacg agtcgatcac 1020
gtccttggac gaaggtagct ccggaggctc ggtcgggaac aagggctcgc cgcagcctcc 1080
ccaccccgcc ctggcacctc acctgccgac tgaagatgcc accttgccgt cgcaggagag 1140
ccccacccca ctgtgcacct tgatcccccg catggcaagc atgaagctgg ccaacccggc 1200
cactttgctg agtctgaaaa acttttgcct gggtaccaaa gaggtgcctc ggctgaagct 1260
ccaggaaagc cgggacccag gttccagcgg cccctcttcc ccagaaacca gtttaagtag 1320
gtccgggact gcacctccac cgcagcagga cctggtggga cacagggcaa ccgccctaac 1380
ccctgattcg tgcccgcttc ctggccctgg ggagccaaca cttaggagca ggcaggacag 1440
gcactttcta cagcacctgt tggggatggg catgaactac tgtgtgaggt acatgggctg 1500
tgttgaagtg ctgcaatcaa tgagatcact ggattttgga atgagaaccc aagttacaag 1560
ggaagcaata agtcgcctgt gtgaagctgt ccccggggca aatggagcca ttaaaaagcg 1620
aaagcctcca gttaagttcc tatcaacagt ccttggcaaa agtaatcttc agttttcagg 1680
aatgaatata aaactgacca tctcaacatg cagtctcaca ttgatgaatc ttgacaacca 1740
acagattatt gcaaatcatc atatgcagtc tatttcattt gcctctggag gggatcctga 1800
tactacagac tatgttgcct acgtagctaa agatccagtt aatcaacgag cctgtcacat 1860
attggaatgc cacaatggaa tggcccaaga cgtcataagt accatagggc aggcttttga 1920
actccggttt aaacagtact tgaaaaatcc ttctttgaat acttcttgtg aaagtgagga 1980
ggtgcatatt gatagccatg ccgaggagag agaagatcat gaatattaca atgaaattcc 2040
agggaagcag ccaccagtag gtggtgtttc agatatgcgg atcaaagttc aagccacgga 2100
acaaatggct tactgcccca tacagtgtga aaagttgtgc tatttgcctg gaaactccaa 2160
gtgcagcagt gtatatgaga actgtttaga acaaagcagg gcaataggta atgtccatcc 2220
aagaggggtg cagtcccagc gagatacctc attattgaag cacacgtgcc gagtggatct 2280
ctttgatgac ccctgctaca ttaatacaca ggctcttcaa agtacacctg gctctgctgg 2340
aaatcaaagg tcagcccaac cactggggag cccatggcac tgcggaaagg caccagaaac 2400
tgttcagccg ggtgccacag cccagcctgc cagctcacat tctttgccac acattaagca 2460
gcagctgtgg agcgaagaat gctatcatgg caagctgagc aggaaggcgg cagagagcct 2520
cttggtaaag gatggggact ttttggttcg agagagtgca acatcccctg gccaatatgt 2580
gctgagtgga ctacagggag gccaagcaaa acatcttctc ctggtggatc ctgaaggcaa 2640
ggtgaggacc aaggatcatg tatttgataa tgtcggccac cttatcagat accatatgga 2700
taacagtttg ccaatcatct cctctggaag cgaagtaagc cttaaacaac cagtgagaaa 2760
agataataat ccagcacttt tgcattccaa caaatgacag tattgaagca ccatcacact 2820
gatatttcaa gaaaccccat tttgtattag gacacaaaga taatttaaac tttgtttgta 2880
gataaaatag agcacaaact gtgaagtgca tctttccaag accatcatgg accaggtcct 2940
ctataaaatg aagaactaac aaaaattagt cttcagaaat gaaaatcaga aaagaggaag 3000
agggttggtc attttaaaag aaattatatg tatgcacgga tgtcactttt taaggccata 3060
ttgcattgat aacaagctaa aagcacaact aaaatttcac atgctaacga caacttgaat 3120
gaactgctgg ggcagtggta tgtgcctttc aacttgataa tttgggggac attttcatat 3180
tgggagatta attctaagta tcttcatgtt ctatgactat agaaccattt gccaaaaaaa 3240
aaagcttttc ttgctacaaa aaataagcaa ttttcttgag ccttattgac tttattacat 3300
tttctgttta gcagcatttt tcactgcaat gttaaaataa atatgacatt gaattcgaac 3360
tgtgtgtatg tcagtggaat caaatcaaaa gccactaaca tggctgtctg tttcattgga 3420
ctgtcccatt tgctggttaa aaggattggg gcccaaatcc tctggcctag catttctcag 3480
tgtttgctat tcagactgtc taaatacagc atgtgacaag ctgaagaagc caaatctatc 3540
agtcatttct gatttcatta tattctcccc ctcttcctgc taaaaagaca aaaaacaaaa 3600
aacaaaaaaa acaaaaaaaa cctcatgagt gcatggattt aaaagagggc aaacaaaacc 3660
agtattcttc atatttacta ttcaaattgg tttcattctt agtaaaagta cagaatctat 3720
ttgaaattat agtaaaattt cttcttgatt ggctgacact gaatcatagt ttctcaccta 3780
catatatcct tagcacctcg tatagatatg atcagacaaa atgcagaagg aaaaaaaaac 3840
atattgaatg aagcacttgg aaagattttc cacatgtaga ccaactggta aactaacaga 3900
gtgattaagc atggtgtaca gaaaagcatt acgctgagtc ttaccagtgt gaccttcagc 3960
aagttgctga atctgtttgg gttccagttt ccttggcaat aaaatgagct aaatgggcta 4020
ggtgaatttg gaggactact tcagtcctaa cttatagtat gagtctctaa aaagcaagtt 4080
tttcatttgt tagaggtcgt tattgataac cagtctgtat agttaaggta aaaaattaag 4140
cttttcttct atagtctgtg tccatactca cagaatgaat ggcacacctg agatcaacat 4200
tcacatagtt tagactccaa accattcagt ctaaaatact gaaactttgg aatataggga 4260
atgatgataa aagtggattt ggtttgagta gcagaaaact acttatgtcc ttttcttgcc 4320
tttccaagaa aaatgttttt tgtttttttt tttaatcttg agttatctgg atattgcctt 4380
gactccattt cattttggct atgtagatac aacttagtct ttgtgattgt gatatatttg 4440
ctaagtttta aataaaactt cttttggata gaaatcatta gaaaccaagc atactgcact 4500
ctaatatttt actgtaaagg cttatgattt ttatttctac tgccattaat tttttagatg 4560
gatttgtttc ctcttacaca actagaatta atgtattttt caccagtttt ccatatacct 4620
taggtcttga tcgtttgtcc ttaaaaaggg gatcagcatg agtatagaca gtagaaatgt 4680
atgggtagtc taaccacttt tatcagagac agagcagggc tgtggtctca ctctagctga 4740
gcagagtatt aacttggtag caagagttcc tgatacaaat agatgcaatg actgtaaatg 4800
gtgtcagcag tacacatgga taatcagtat ttgactgtaa tagtatagta gttaaataca 4860
gcacttaaaa ataccacaga cacagttaaa gcaaaaggaa acaataaaag gaatgtctgc 4920
atgctatttt aatctcacat tctttatctg tcttaaagtg gaaatccatt tgcctataaa 4980
tacctgtaaa cgactttaaa aaataaatga ttattgcttt gtgacaa 5027
<210> 21
<211> 1416
<212> DNA
<213> SOD3
<400> 21
agggacagcc tgcgttcctg ggctggctgg gtgcagctct cttttcagga gagaaagctc 60
tcttggagga gctggaaagg tgcccgactc cagccatgct ggcgctactg tgttcctgcc 120
tgctcctggc agccggtgcc tcggacgcct ggacgggcga ggactcggcg gagcccaact 180
ctgactcggc ggagtggatc cgagacatgt acgccaaggt cacggagatc tggcaggagg 240
tcatgcagcg gcgggacgac gacggcgcgc tccacgccgc ctgccaggtg cagccgtcgg 300
ccacgctgga cgccgcgcag ccccgggtga ccggcgtcgt cctcttccgg cagcttgcgc 360
cccgcgccaa gctcgacgcc ttcttcgccc tggagggctt cccgaccgag ccgaacagct 420
ccagccgcgc catccacgtg caccagttcg gggacctgag ccagggctgc gagtccaccg 480
ggccccacta caacccgctg gccgtgccgc acccgcagca cccgggcgac ttcggcaact 540
tcgcggtccg cgacggcagc ctctggaggt accgcgccgg cctggccgcc tcgctcgcgg 600
gcccgcactc catcgtgggc cgggccgtgg tcgtccacgc tggcgaggac gacctgggcc 660
gcggcggcaa ccaggccagc gtggagaacg ggaacgcggg ccggcggctg gcctgctgcg 720
tggtgggcgt gtgcgggccc gggctctggg agcgccaggc gcgggagcac tcagagcgca 780
agaagcggcg gcgcgagagc gagtgcaagg ccgcctgagc gcggccccca cccggcggcg 840
gccagggacc cccgaggccc ccctctgcct ttgagcttct cctctgctcc aacagacacc 900
ctccactctg aggtctcacc ttcgcctttg ctgaagtctc cccgcagccc tctccaccca 960
gaggtctccc tataccgaga cccaccatcc ttccatcctg aggaccgccc caaccctcgg 1020
agccccccac tcagtaggtc tgaaggcctc catttgtacc gaaacacccc gctcacgctg 1080
acagcctcct aggctccctg aggtaccttt ccacccagac cctccttccc caccccataa 1140
gccctgagac tcccgccttt gacctgacga tcttccccct tcccgccttc aggttcctcc 1200
taggcgctca gaggccgctc tggggggttg cctcgagtcc ccccacccct ccccacccac 1260
caccgctccc gcggcaagcc agcccgtgca acggaagcca ggccaactgc cccgcgtctt 1320
cagctgtttc gcatccaccg ccaccccact gagagctgct cctttggggg aatgtttggc 1380
aacctttgtg ttacagatta aaaattcagc aattca 1416
<210> 22
<211> 4195
<212> DNA
<213> STRN3
<400> 22
agatggagga gggattgtaa tggcggcagc cggcagctcc ctgctctgac ccacggcagg 60
cacacagcaa cgaccccttc cccgcccctc tcccggccgg cctccgcccc gcagccagcg 120
cggggccacc ctctccggcc cttcccccag ctgtcggcgt ctcgccctgc gccccggccg 180
gggccccaca cacaatggac gagcttgccg gaggcggtgg tggcggcccg gggatggcgg 240
cccctccccg gcagcagcag ggacctgggg ggaacctggg cctttcgccc ggggggaacg 300
gagcggcggg cggcgggggt cctccggcct ccgagggagc gggtcccgcg gcaggccccg 360
agctgtcccg gccgcagcag tacactatcc cggggatact gcactacatc cagcacgagt 420
gggctcggtt cgagatggag cgggcgcact gggaggtgga acgggccgaa ctgcaggccc 480
ggattgcatt tctacaaggc gaaagaaaag gtcaagagaa cctgaagaag gacttagtaa 540
gaagaataaa gatgttagag tatgcattaa aacaagaaag ggcaaaatat cacaaattaa 600
aatatggcac ggaactgaac caaggtgact tgaaaatgcc aacctttgag tcagaagaaa 660
ccaaagacac agaggctccc acagcacctc agaatagcca gttaacgtgg aagcaaggca 720
gacagctttt aagacagtat cttcaggaag taggttatac agatacaata ttagatgtac 780
ggtctcagcg ggtaaggtca ttacttggac tatctaattc agaaccaaat ggatcagtag 840
aaacaaagaa tttagaacag atcctgaatg gaggtgaatc tcctaagcaa aagggacaag 900
aaataaaaag gtcctctggt gatgttcttg agacgttcaa tttcttagaa aatgccgatg 960
acagtgatga agatgaggaa aatgacatga tcgaaggcat cccagaagga aaagacaaac 1020
atcggatgaa taaacataaa ataggtaatg aaggtttagc tgctgaccta actgacgatc 1080
ctgatactga ggaagcactg aaagaatttg attttttagt gactgctgaa gatggtgaag 1140
gagctggaga agcacggagt tcgggggatg gcacagaatg ggataaagat gacctctccc 1200
caactgctga ggtttgggat gtagaccagg gactaataag taaactgaag gaacagtaca 1260
agaaggaacg aaaggggaag aaaggggtga agagggccaa caggacaaaa ctctacgaca 1320
tgatagctga tctgggagat gatgagctgc cccacatccc ttcaggaatc attaatcagt 1380
ctaggtcagc ctctactaga atgactgatc atgaaggtgc aagagcagag gaagctgaac 1440
caataacgtt tccatctgga ggaggcaagt catttattat gggttctgat gatgttttgt 1500
taagtgtact gggccttgga gaccttgcag acttgacggt aacaaatgat gcagactata 1560
gttatgattt gcctgctaat aaagatgcct ttcgaaagac atggaatccc aagtatacac 1620
tacgtagcca ttttgatgga gtacgggcat tagcttttca tcctgtagaa cctgtgctgg 1680
ttactgcttc tgaggaccat accctgaaac tttggaacct gcaaaaaaca gttcctgcca 1740
aaaagagtgc ctctttagat gtagagccta tctacacatt tagggcccac atcggccctg 1800
ttctgtcatt agctattagt tctaatggag aacagtgttt tagtggtggt attgatgcaa 1860
ccatccagtg gtggaatatg ccgagtccca gtgtagatcc atatgataca tatgagccaa 1920
atgttctagc tggcacttta gttggtcata cagatgcagt ttggggtctt gcttatagtg 1980
gcataaaaaa tcaattactg tcttgttcag cagatggcac tgttaggtta tggaatccac 2040
aagaaaaatt gccatgtatt tgcacttaca atggagataa aaagcatgga atacctacat 2100
cagttgactt tataggctgt gatccagctc atatggtaac ctctttcaac actggtagtg 2160
cagtaattta tgatttagaa acatcacagt cattggtgat actttcatca caggtagatt 2220
ctggtttaca atctaataat catatcaaca gagtagtaag tcatcccaca cttcctgtta 2280
caataactgc tcatgaagat agacacatca aattttttga caataaaacg ggtaaaatga 2340
tccattctat ggtagctcac ttggatgctg ttacaagtct agcagtagat cctaatggaa 2400
tctatttgat gtctggaagc catgactgtt ccatcagatt atggaattta gacagcaaga 2460
catgtgtgca agaaataaca gctcacagaa agaaattgga tgaatcaatt tatgatgttg 2520
ctttccactc gtcaaaagca tatatagcta gtgcaggagc tgatgctctt gccaaagtat 2580
ttgtatgaat caacaaaaac ttgcatcgta acaagatttg cttggacaga aagagggtct 2640
gcatcactgc catcagaaag gttactgata tgacactaca tgtgatctgc ctggtgaagg 2700
ctatctgggg caggcacaaa ttggtggaaa tcacatctta atgtcaagct cattaagtta 2760
actgtaatta ctgtattttg tgggacaaag aaaaaaggac tccagtattt gtggcctgta 2820
ctggatgtga actgagcgta tatctgtttt taggtgtctt taagccaatg tggagtctga 2880
tctttcaaaa aagttttttt ttttctcttc ttcttcttct tttttttttt tttttttttt 2940
tttttggact ctgtgtgctg ccttaggggt taggaatgtg gtgctcttgt tgggggaagt 3000
gagctccaag agtagctttt tttcatctct tagtgatctt ctgtttatcg gttgaatgcc 3060
acagattccc ttttaaactt attttgcttt aaaaaaaaaa aaaaagaaaa agaaaattta 3120
acttaaaata ttttagcatt agttgcacaa aatgtttgga taaaattcta gtttttataa 3180
gtctttttat atatttagcc tgtcacaaca gtgctcaaga ttgtattgaa gtttttctgc 3240
attatacaac cctaaaacac agagatctca ctgacccgtt gccctgtaac cactttcttt 3300
ccttcttttg cctaatacag ctcagctaag tccttccata aagatgctaa ataactttca 3360
tcatcacata aatgtcttca taaaccaagg actattaagt gtattaaaat gaaacagtgg 3420
ggtttagtac tccaaatgaa ctcttaaaga aaaaaactaa tcttggcatc ctatcactat 3480
gtgatatttt gtacatctta ctgtatttac aagtttattt atcaaggatt atccatcttg 3540
ctaatggcct attatttatt tcactttttg ttggtcttta tatcctttta ttaatgtgct 3600
aaaggaacct gtatatctat tttggaactc tttgaatagt ctaaaataga ctaaaaatgg 3660
agtattttat agtttaaatt acaaaccaag gtggttcccc ctaagatata tatcttggtt 3720
taccatgatt ccaaacaaaa ctaacttgtt taaaaatatt tggagtaaag ttttatttgc 3780
attacaaata ggatacaaaa atagttgaat caggatacag aaatctgctg tgttttgact 3840
agttatccct gttttatttt tttagatgtg cttaatttta tggtgtaact aaagattttg 3900
tttgtgtaat gcatgattaa gacaataaag tattttttct agtcttccga gaaacttttc 3960
tgatcagttt gcgagttttg atgagttttg taaggttttt gttttacaaa ctatgaatca 4020
gcaaattttt aagattgtac cacatagcaa acatacagct gttgaaaaat aatgtatata 4080
aaatgcatat aataaatatt aaattgtgta cctgtatgtt actgttggct acatcatttt 4140
gtgttgaata ataaagtgca atactttatt ctccataatt aaactaggaa atgga 4195
<210> 23
<211> 2591
<212> DNA
<213> TP53
<400> 23
gatgggattg gggttttccc ctcccatgtg ctcaagactg gcgctaaaag ttttgagctt 60
ctcaaaagtc tagagccacc gtccagggag caggtagctg ctgggctccg gggacacttt 120
gcgttcgggc tgggagcgtg ctttccacga cggtgacacg cttccctgga ttggcagcca 180
gactgccttc cgggtcactg ccatggagga gccgcagtca gatcctagcg tcgagccccc 240
tctgagtcag gaaacatttt cagacctatg gaaactactt cctgaaaaca acgttctgtc 300
ccccttgccg tcccaagcaa tggatgattt gatgctgtcc ccggacgata ttgaacaatg 360
gttcactgaa gacccaggtc cagatgaagc tcccagaatg ccagaggctg ctccccccgt 420
ggcccctgca ccagcagctc ctacaccggc ggcccctgca ccagccccct cctggcccct 480
gtcatcttct gtcccttccc agaaaaccta ccagggcagc tacggtttcc gtctgggctt 540
cttgcattct gggacagcca agtctgtgac ttgcacgtac tcccctgccc tcaacaagat 600
gttttgccaa ctggccaaga cctgccctgt gcagctgtgg gttgattcca cacccccgcc 660
cggcacccgc gtccgcgcca tggccatcta caagcagtca cagcacatga cggaggttgt 720
gaggcgctgc ccccaccatg agcgctgctc agatagcgat ggtctggccc ctcctcagca 780
tcttatccga gtggaaggaa atttgcgtgt ggagtatttg gatgacagaa acacttttcg 840
acatagtgtg gtggtgccct atgagccgcc tgaggttggc tctgactgta ccaccatcca 900
ctacaactac atgtgtaaca gttcctgcat gggcggcatg aaccggaggc ccatcctcac 960
catcatcaca ctggaagact ccagtggtaa tctactggga cggaacagct ttgaggtgcg 1020
tgtttgtgcc tgtcctggga gagaccggcg cacagaggaa gagaatctcc gcaagaaagg 1080
ggagcctcac cacgagctgc ccccagggag cactaagcga gcactgccca acaacaccag 1140
ctcctctccc cagccaaaga agaaaccact ggatggagaa tatttcaccc ttcagatccg 1200
tgggcgtgag cgcttcgaga tgttccgaga gctgaatgag gccttggaac tcaaggatgc 1260
ccaggctggg aaggagccag gggggagcag ggctcactcc agccacctga agtccaaaaa 1320
gggtcagtct acctcccgcc ataaaaaact catgttcaag acagaagggc ctgactcaga 1380
ctgacattct ccacttcttg ttccccactg acagcctccc acccccatct ctccctcccc 1440
tgccattttg ggttttgggt ctttgaaccc ttgcttgcaa taggtgtgcg tcagaagcac 1500
ccaggacttc catttgcttt gtcccggggc tccactgaac aagttggcct gcactggtgt 1560
tttgttgtgg ggaggaggat ggggagtagg acataccagc ttagatttta aggtttttac 1620
tgtgagggat gtttgggaga tgtaagaaat gttcttgcag ttaagggtta gtttacaatc 1680
agccacattc taggtagggg cccacttcac cgtactaacc agggaagctg tccctcactg 1740
ttgaattttc tctaacttca aggcccatat ctgtgaaatg ctggcatttg cacctacctc 1800
acagagtgca ttgtgagggt taatgaaata atgtacatct ggccttgaaa ccacctttta 1860
ttacatgggg tctagaactt gacccccttg agggtgcttg ttccctctcc ctgttggtcg 1920
gtgggttggt agtttctaca gttgggcagc tggttaggta gagggagttg tcaagtctct 1980
gctggcccag ccaaaccctg tctgacaacc tcttggtgaa ccttagtacc taaaaggaaa 2040
tctcacccca tcccacaccc tggaggattt catctcttgt atatgatgat ctggatccac 2100
caagacttgt tttatgctca gggtcaattt cttttttctt tttttttttt ttttttcttt 2160
ttctttgaga ctgggtctcg ctttgttgcc caggctggag tggagtggcg tgatcttggc 2220
ttactgcagc ctttgcctcc ccggctcgag cagtcctgcc tcagcctccg gagtagctgg 2280
gaccacaggt tcatgccacc atggccagcc aacttttgca tgttttgtag agatggggtc 2340
tcacagtgtt gcccaggctg gtctcaaact cctgggctca ggcgatccac ctgtctcagc 2400
ctcccagagt gctgggatta caattgtgag ccaccacgtc cagctggaag ggtcaacatc 2460
ttttacattc tgcaagcaca tctgcatttt caccccaccc ttcccctcct tctccctttt 2520
tatatcccat ttttatatcg atctcttatt ttacaataaa actttgctgc cacctgtgtg 2580
tctgaggggt g 2591
<210> 24
<211> 6256
<212> DNA
<213> ZNF24
<400> 24
gtttctgcgt ctgccgtgga cagcgaagct gctgcggttc ctgagccgga ggtttgcgcc 60
ggagtgcctg tgaagaaaac ggggtattgc cctgaggctt atattctgcc tcagttgtct 120
tttcttgaaa tattataaat cagaatgtct gcacagtcag tggaagaaga ttcaatactt 180
atcatcccaa ctccagatga agaggaaaaa attctgagag tgaagttgga ggaggatcct 240
gatggcgaag agggatcaag tatcccctgg aaccatctcc cagacccaga gattttccga 300
cagcgattca ggcagtttgg ataccaggat tcacctgggc cccgtgaggc tgtgagccag 360
ctccgagaac tttgccgtct gtggctcagg ccagagacgc acacaaaaga acaaatcttg 420
gagctggtag tgctggagca gtttgttgcc atcctaccca aagagctaca gacttgggtt 480
cgagatcatc atccagagaa tggagaggag gcagtgacag tgctggagga tttggagagt 540
gaacttgatg accctggaca accggtttct ctccgtcgac gaaaacggga agtactagta 600
gaagacatgg tatctcaaga agaagctcag ggattaccaa gttctgagct tgatgctgtg 660
gagaaccagc tcaagtgggc atcctgggag ctccattccc taaggcactg tgatgatgat 720
ggtaggactg aaaatggagc actagctcca aagcaggagc ttccttcagc attagaatcc 780
catgaagttc ctggcactct caatatgggt gttcctcaaa tttttaaata tggagaaacc 840
tgtttcccca agggcaggtt tgaaagaaag agaaatccct ctcgaaagaa acaacatata 900
tgtgatgaat gtggaaaaca cttcagtcag ggctcagccc ttattcttca tcaaagaatt 960
cacagtgggg agaaacctta tggatgtgtt gagtgtggga aagcattcag ccgaagttcc 1020
attcttgtgc aacaccagag agtccacact ggagaaaaac cttacaaatg tcttgaatgt 1080
gggaaagcct ttagccagaa ttcggggctt attaatcatc agagaatcca tactggggag 1140
aaaccttatg aatgcgttca gtgtgggaaa tcgtatagtc aaagctcaaa tctttttaga 1200
catcagagaa gacacaatgc agaaaaactt ctgaatgttg tgaaagttta agaaattgaa 1260
aaaaaaaaaa gaatcagcac tcaggtcttt ttcttcagaa atgaagacaa aatttaaaat 1320
atgaaatgat gcagaatagt tttttcccta ttgactgtca gaaaatccac tgggaaatgt 1380
aaaaatcttc actcaccatt atgatattta tcttgaaaga aatggtgtca tacctgccta 1440
gaaactgaaa ttttaaactt aattcaggtc ttaatgccta aattttccat gtgatgttta 1500
tagtctgtat tacttctcca aataatgaac tacctgattc attgtccctt tcttgaaagt 1560
ttctttttta agacaaatac attatttctg cattgatcat tgaaatgttc tttatatgga 1620
tacattccct tatatattaa aaggcaacag gaattacaaa gtctgaaaac cattttaaac 1680
catcttttaa aaatttaccc ttatttcctt ttacctaatt tgaatatgca tttgagaaaa 1740
taagaggata aaggatggct aagagcctca aaatgaacca taagatctca gataagaagt 1800
gatggtgata aaacatcaaa aagtgaatgg aacaccttga ttggggaaga tatgcaaata 1860
ctttgatcta agaattgaaa tgtatcaaga atttatattt tgcctgcagg aaaattcaaa 1920
agctactcat cctctctata atttggagtc atcttactaa tgaaaataat gttttcccat 1980
atattattaa aaagcataca gtctaaataa taaacagttg taaaataatg aaggtagaaa 2040
ttataacact agggaaaaat ttgtagcgga tggcagtgtt gaaggcaaat gtaaacataa 2100
gggtaatggt ctgtcatggc ttttagaaaa agatgataga gttcatcatt attttgcctt 2160
catctttgtt aaggacagaa aattccctga caggtgggca agtatcaggt tacctatttt 2220
ttattccttt ggtacaaaag ggttgaacgt caggctaaaa aagcagccat gcatttatta 2280
ttaaacattt tctaccgaca aggcactgtg ctaggtactg taatcctacc ataagtaggt 2340
aggtatttct tccactgtaa atcatagggg tttgctgttt tatgtgagtt agcctcttcc 2400
ccttgtctga gcattcctca ggggaggtca cctgtgaggt tcccagaact gtagtttttt 2460
ttaccagggt gttgtatttg gagggggagg aggactcggc tcaaaagagc tagctggctc 2520
tccagtgttc agaggtgagt ccacgatact cttaccacaa tttggaagtt tgtgaatctt 2580
tttaaagaac taatcaatct ctaatagcat tgaggttgta cctacatatt aagttgaatg 2640
gactgttcta tttaaaaaat aaacaactag acaattaact agtttattaa cctatcacaa 2700
ttgaattttt ttttaatttt cagtcttaac acatttttta aaatgtatta aagtaataca 2760
ttgtagtagt aggattatat actccttggc tgagaattcc aagtactgtg gttctactgt 2820
ttagtggaaa actctggaag ttaaaatata gaatatgaga ggaggctttt ttataatggg 2880
catcattgtg tggaaaatga cccatgtgaa tacaaatatt tcctagttca gagattttgg 2940
ttatatctgg tgcttggatc aagtttaaaa atggaaggtg agattttgca tgagcctatt 3000
aaaaagcata gtaataaatg caaggccagc tggtggaaaa gtgaggcaga atggagcttg 3060
tttataggtt ttctgataac aattataaaa aatgtgcttt atagattaag atttattgaa 3120
gtataaatat gtagtaatga tataatgtat tttaagttat acaagaaaat gtagggactt 3180
ttgtttgggt ctttttctct ttgtggctga ggggaaacaa gtcagtgtcc aataaagctg 3240
taaactcctc tgctctaaga taaatgatgt gatttattta tttataactg gcttctttcc 3300
aagtaggttt tcaggtggca tatttggaag acggctggaa tgacagaatt cttgtatcag 3360
agtaggtaag aagggagcaa cctctcaatg gctattatgt catgcttttt aagatcgtat 3420
gcggttccta tatacaagga agcttccctg tggtagattt gtcataaatg ccaaagatat 3480
ttggtaatgt gagtgtagaa aaagtagtat gagggttggc aaatactgtt tttgtcttgg 3540
cagctctaat atctgcattg ttcagaaagg attctgaggc taaggcaaag ctctgtggga 3600
aaaagggact ggaccaaaaa aaactggatg gtggcacaca agaagaggaa atgatgagat 3660
gtgtactttc tatctctggt taggcttagt ccccactaga caaattgatt ttaaatacta 3720
tgtagtgatt tttaaattcc atccacacat tcattaccca cacagataat catagaaatt 3780
tgggggagtg cctagcttct gatgaagtgg tgatatggca gtgccaagca gtggcatcgc 3840
cagagtatct gtttggttag caaatgagca gtcattttag gtcatgcaga ttgctgatat 3900
ctgcccagta gccactgagc atttgctggt tttttcttct ggctttcttg gaggttaagc 3960
tctctgtagt catacccagt tggtacttga tctttagcaa tatgtctcat attcatgtaa 4020
attgaaggga gggttacatg tactgaaata atctgcatgc taggcattgg cttagacacc 4080
gtacctatct cacttagatt tgtggactag gaaagcaaga ttcagagatc atgtgacttg 4140
catgtggcct agagataaaa ttcaaatctg gttctgtaga ctccagggac atattcacca 4200
tgccatgggt ggtggctatt aaaccttgat aaatttgtgt ttatggttaa caaatgtgaa 4260
agctattaaa cattgctggt ttgaattttt tacagtgcag aaatgtaaaa tgaaaaagga 4320
tatttccttt cacagtgtta ccgagaagtc atgataattt cgtttgttct tccagattta 4380
ggcatatact tatttaatca ataatgtgtt aacagctgac acctgtggtt gctgtgacag 4440
gcactatttg aagtgcttta tcatggatta actcttaatc ctcagctacc gtataaagta 4500
ggacataacc ccatttcaca tgcactacac tgagacttgc ctcctctccc cccacattga 4560
agatgttctt ttttcataac tatatactat tccattgcat gaatattctg taatttattt 4620
aatcccctat ggattgataa ttaggttcat tatagataga agtgtaatta acattcctgt 4680
acatgtattt tgctacttgt gtgggtattt ctgtaggatg aataactaga aatttattgg 4740
atcaggtttc acatttgcag ttttgaaaac tactaccaaa aagatttcac caatttacaa 4800
ctccatcatt agtaagaatg cctgtttgcc tatagtctgc caaccctgaa tccttaaaaa 4860
tttttgccaa tctggtaggc aaaatttctt tcttttcttt gaatattaat gaggaggaac 4920
atcttttcat gtttcttggc catttgcatt tcctattatg aattgctttt gcccattttc 4980
ctttttttaa ttatgaaagt ctaatgacta ccttctcatt gtataaaaaa cacagttctt 5040
tgaatagaga gacccttttc tccaatgcta ccaatcacat tccacttacc acagtttaac 5100
atacatcctc tagtcacctt tccgtacgaa tatacataca cataaaaaca ctttttacat 5160
aaataggatc tcatattctg tagcttttta aaattttggt ctcaaaaaaa gataacaggt 5220
ctttaaattt ctttaatggt tgaatatgat taaatactat gaaaatgcca ttatttattc 5280
ccttaatttt tttcctctcg ctattacatt gccaaagtaa acatcctatt cagatgtctt 5340
tgtgcatgtg tgtgaatatt tctttagtct ggagtccagt aaggtggatt tttggatcaa 5400
agggtttgtt ctctgtccac cttcagtctt cccaaaggcc ttcataactg tattttcacc 5460
aagtgtatgg agaatgttca tttccccata taaccatacc tacacttgat agtttttatc 5520
tgttgggcga aaaagaacct tttcttattt tgcatttccc tgattataaa aaaaaatggt 5580
gagattgggg ttattttcat gtttattggc catttatagt ttactgtgga ttgtttgtat 5640
cccttacctg ctttctattg ggttatgtgt ggatatattg tttttatttg ttcagcatct 5700
ccttccccat cttctggtaa cacaaccttt atttatttgt ggggaaccta ttccctgtgg 5760
cttaggtgag catgtgacca ggcctggcct cctgagtccc acagcttcct agccacagtg 5820
ataaaagaat gggtatataa cttaagccag gctaaggaaa gcccttaaca gaacttctgc 5880
tggaactact ggaaagaagg ctttatggag atcccaggaa ccaaggacca tgtaagcctg 5940
aatttgtgcc atgtggagag agtctgtctg aggagaaact cggatgctag cagaaatgga 6000
aagagaacta agttctgatg tcatttttct ggaggcccta gatccagctg tgcctaaagc 6060
ctgccctacc tccggacttt aaagttttgt gagccaataa agtccctttc ttgtttaaga 6120
taattgaatt gagtttctgt tctgattaat ataggttatt tgtattttct tattgatttg 6180
tagaaaacct ttgtaatttt aaattctaga ctttatgcac tatataagtt aataaaatta 6240
gcatggcctt ccatga 6256
Claims (10)
- ALMS1, NRXN3, NTRK1 및 TRIOBP를 암호화하는 유전자의 돌연변이를 검출할 수 있는 제제를 포함하는, 전립선암 환자의 병리등급에 따른 치료 효과 예측 또는 예후 진단용 조성물.
- 제 1항에 있어서,
상기 진단용 조성물은 COL22A1, FHOD3, MYH11, ACY3, C8orf74, CPT1A, DDX39A, FBXL4, ICAM1, KIFAP3, IPO4, NAT2, NFIX, PLIN4, SCRIB, SHC4, SOD3, STRN3, TP53 및 ZNF24 로 이루어진 군으로부터 선택되는 적어도 하나를 암호화하는 유전자의 돌연변이를 검출할 수 있는 제제를 더 포함하는, 전립선암 환자의 병리등급에 따른 치료 효과 예측 또는 예후 진단용 조성물.
- 제 1항에 있어서,
상기 ALMS1를 암호화하는 유전자의 돌연변이는 서열번호 1의 아미노산 서열에서, T196A, P1387L, T2308M, A1618V 및 A1157V로 이루어진 군으로부터 선택되는 적어도 하나의 미스센스 돌연변이거나, Y2936*인 넌센스 돌연변이거나, R4154Efs*40인 프레임 시프트 삽입(frame shift insert, FS ins) 돌연변이고;
상기 NRXN3를 암호화하는 유전자의 돌연변이는 서열번호 2의 아미노산 서열에서, L309I, A228S, R654H, R654C, D166Y, A85T, D308A 및 F23I로 이루어진 군으로부터 선택되는 적어도 하나의 미스센스 돌연변이고;
상기 NTRK1을 암호화하는 유전자의 돌연변이는 서열번호 3의 아미노산 서열에서, R342Q, R507C, P63S, P695S, G714S, A612V, R574H 및 R599H로 이루어진 군으로부터 선택되는 적어도 하나의 미스센스 돌연변이거나, Q730_L731del인 인-프레임 결실(in-frame delete, IF del) 돌연변이고;
상기 TRIOBP을 암호화하는 유전자의 돌연변이는 서열번호 4의 아미노산 서열에서, P1125L, S1252F, R2259H 및 Q702R로 이루어진 군으로부터 선택되는 적어도 하나의 미스센스 돌연변이거나, Q2245*, Q350*, R1554* 및 R448*로 이루어진 군으로부터 선택되는 적어도 하나의 넌센스 돌연변이인; 전립선암 환자의 병리등급에 따른 치료 효과 예측 또는 예후 진단용 조성물.
- 제 2항에 있어서,
상기 COL22A1을 암호화하는 유전자의 돌연변이는 서열번호 5의 아미노산 서열에서, N1115D, R210W, T117M, G490D, L1427M 및 D1133G로 이루어진 군으로부터 선택되는 적어도 하나의 미스센스 돌연변이거나, R592*인 넌센스 돌연변이거나, K529Rfs*21 (diploid) 및 K529Rfs*21 (amp) 중 적어도 하나의 프레임 시프트 결실(frame shift delete, FS del) 돌연변이고;
상기 FHOD3을 암호화하는 유전자의 돌연변이는 서열번호 6의 아미노산 서열에서, T1328P, R188H,G120R, A1330T 및 A1051T로 이루어진 군으로부터 선택되는 적어도 하나의 미스센스 돌연변이거나, R461Afs*31인 프레임 시프트 결실(frame shift delete, FS del) 돌연변이고;
상기 MYH11을 암호화하는 유전자의 돌연변이는 서열번호 7의 아미노산 서열에서, A815T, E1888K, T975M, A732V, A1259V 및 A334V로 이루어진 군으로부터 선택되는 적어도 하나의 미스센스 돌연변이거나, R1609*인 넌센스 돌연변이고;
상기 ACY3을 암호화하는 유전자의 돌연변이는 서열번호 8의 아미노산 서열에서R233C인 미스센스 돌연변이고;
상기 C8orf74을 암호화하는 유전자의 돌연변이는 서열번호 9의 아미노산 서열에서, A273T인 미스센스 돌연변이고;
상기 CPT1A을 암호화하는 유전자의 돌연변이는 서열번호 10의 아미노산 서열에서, A577V인 미스센스 돌연변이고;
상기 DDX39A을 암호화하는 유전자의 돌연변이는 서열번호 11의 아미노산 서열에서A96V인 미스센스 돌연변이고;
상기 FBXL4을 암호화하는 유전자의 돌연변이는 서열번호 12의 아미노산 서열에서, D550A인 미스센스 돌연변이고;
상기 ICAM1을 암호화하는 유전자의 돌연변이는 서열번호 13의 아미노산 서열에서, P63L인 미스센스 돌연변이고;
상기 KIFAP3을 암호화하는 유전자의 돌연변이는 서열번호 14의 아미노산 서열에서, Q492*인 넌센스 돌연변이고;
상기 IPO4을 암호화하는 유전자의 돌연변이는 서열번호 15의 아미노산 서열에서, R916*인 넌센스 돌연변이고;
상기 NAT2을 암호화하는 유전자의 돌연변이는 서열번호 16의 아미노산 서열에서, L52F인 미스센스 돌연변이고;
상기 NFIX을 암호화하는 유전자의 돌연변이는 서열번호 17의 아미노산 서열에서, R343H인 미스센스 돌연변이고;
상기 PLIN4을 암호화하는 유전자의 돌연변이는 서열번호 18의 아미노산 서열에서, A646T인 미스센스 돌연변이고;
상기 SCRIB을 암호화하는 유전자의 돌연변이는 서열번호 19의 아미노산 서열에서, P422S인 미스센스 돌연변이고;
상기 SHC4을 암호화하는 유전자의 돌연변이는 서열번호 20의 아미노산 서열에서, P80L인 미스센스 돌연변이고;
상기 SOD3을 암호화하는 유전자의 돌연변이는 서열번호 21의 아미노산 서열에서, D54N인 미스센스 돌연변이고;
상기 STRN3을 암호화하는 유전자의 돌연변이는 서열번호 22의 아미노산 서열에서, L206I 및 L792I 중 적어도 하나인 미스센스 돌연변이고;
상기 TP53을 암호화하는 유전자의 돌연변이는 서열번호 23의 아미노산 서열에서, R273C, R248Q, E285K, R282W, R248W, R175H, G245D, H193R, M237I, G245S, C135F, C135Y, C135W, V157F, R181C, Y163H, V173M, N239D, R337C, R249G, C176R, C141G, E271V, H193N, G266V, G279E, P177R, G199V, T256I, A74T 및 P82L로 이루어진 군으로부터 선택되는 적어도 하나의 미스센스 돌연변이거나, R342* 및 E298* 중 적어도 하나인 넌센스 돌연변이거나, Q165Hfs*17 및 C124Wfs*25 중 적어도 하나인 프레임 시프트 삽입(frame shift insert, FS ins) 돌연변이거나, A86Vfs*55, R209Kfs*6, V203Wfs*44, K319Rfs*26, S90Ffs*53, S149Pfs*21 및 Q144Gfs*24로 이루어진 군으로부터 선택되는 적어도 하나의 프레임 시프트 결실(frame shift delete, FS del) 돌연변이거나, X126_splice, X307_splice, X33_splice, X331_splice, X126_splice 및 X126_splice로 이루어진 군으로부터 선택되는 적어도 하나의 스플라이스 돌연변이고;
상기 ZNF24를 암호화하는 유전자의 돌연변이는 서열번호 24의 아미노산 서열에서, Y344C인 미스센스 돌연변이인; 전립선암 환자의 병리등급에 따른 치료 효과 예측 또는 예후 진단용 조성물.
- 제 1항 또는 제 2항에 있어서,
상기 제제는 상기 유전자의 돌연변이에 대한 프라이머 세트, 프로브 또는 항체를 포함하는 것인, 전립선암 환자의 병리등급에 따른 치료 효과 예측 또는 예후 진단용 조성물.
- 제 1항 또는 제 2항의 조성물을 포함하는, 전립선암 환자의 병리등급에 따른 치료 효과 예측 또는 예후 진단용 키트.
- 전립선암 환자의 샘플로부터 시료 DNA를 준비하는 단계;
상기 시료 DNA를 청구항6의 키트를 이용하여 증폭하는 단계; 및
상기 증폭 결과로부터 병리등급 특이적 마커의 유무를 확인하는 단계;를 포함하는 전립선암 환자의 병리등급에 따른 전립선암의 예후 진단을 위해 필요한 정보를 제공하는 방법.
- 제 7항에 있어서,
상기 방법은 전립선암 환자의 총 생존율 또는 무병 생존율을 예측하는 방법.
- 제 8항에 있어서,
ALMS1, NRXN3, NTRK1 및 TRIOBP를 암호화하는 유전자에서 돌연변이가 확인되고, 전립선암 환자인 경우, 상기 전립선암 환자의 생존율이 상기 유전자에서 돌연변이가 확인되지 않은 사람의 생존율보다 낮거나, 상기 전립선암 환자의 전립선암의재발율이 상기 유전자에서 돌연변이가 확인되지 않은 사람의 전립선암의재발율보다 높은 것으로 판단하는 단계;를 더 포함하는 방법.
- 제 9항에 있어서,
COL22A1, FHOD3, MYH11, ACY3, C8orf74, CPT1A, DDX39A, FBXL4, ICAM1, KIFAP3, IPO4, NAT2, NFIX, PLIN4, SCRIB, SHC4, SOD3, STRN3, TP53 및 ZNF24로 이루어진 군으로부터 선택되는 적어도 하나를 암호화하는 유전자에서 돌연변이가 확인될 경우, 전립선암 환자의 생존율이 상기 유전자에서 돌연변이가 확인되지 않은 사람의 생존율보다 낮거나, 상기 전립선암 환자의 전립선암의 재발율이 상기 유전자에서 돌연변이가 확인되지 않은 사람의 전립선암의 재발율보다 높은 것으로 판단하는 단계;를 더 포함하는 방법.
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200086444A KR20220008175A (ko) | 2020-07-13 | 2020-07-13 | 전립선암 환자의 예후 진단 및 치료 전략 결정용 병리등급 특이적 마커 |
PCT/KR2021/008898 WO2022014991A1 (ko) | 2020-07-13 | 2021-07-12 | 전립선암 환자의 예후 진단 및 치료 전략 결정용 병리등급 특이적 마커 |
KR1020210186872A KR20220008247A (ko) | 2020-07-13 | 2021-12-24 | 전립선암 환자의 예후 진단 및 치료 전략 결정용 병리등급 특이적 마커 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200086444A KR20220008175A (ko) | 2020-07-13 | 2020-07-13 | 전립선암 환자의 예후 진단 및 치료 전략 결정용 병리등급 특이적 마커 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020210186872A Division KR20220008247A (ko) | 2020-07-13 | 2021-12-24 | 전립선암 환자의 예후 진단 및 치료 전략 결정용 병리등급 특이적 마커 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20220008175A true KR20220008175A (ko) | 2022-01-20 |
Family
ID=79555542
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020200086444A KR20220008175A (ko) | 2020-07-13 | 2020-07-13 | 전립선암 환자의 예후 진단 및 치료 전략 결정용 병리등급 특이적 마커 |
KR1020210186872A KR20220008247A (ko) | 2020-07-13 | 2021-12-24 | 전립선암 환자의 예후 진단 및 치료 전략 결정용 병리등급 특이적 마커 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020210186872A KR20220008247A (ko) | 2020-07-13 | 2021-12-24 | 전립선암 환자의 예후 진단 및 치료 전략 결정용 병리등급 특이적 마커 |
Country Status (2)
Country | Link |
---|---|
KR (2) | KR20220008175A (ko) |
WO (1) | WO2022014991A1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117925845A (zh) * | 2024-03-22 | 2024-04-26 | 广东辉锦创兴生物医学科技有限公司 | ***癌诊断或鉴别的甲基化分子标志物、试剂盒及其应用 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10407731B2 (en) * | 2008-05-30 | 2019-09-10 | Mayo Foundation For Medical Education And Research | Biomarker panels for predicting prostate cancer outcomes |
JP6148007B2 (ja) * | 2009-05-12 | 2017-06-14 | コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. | 前立腺癌マーカーとしてのホスホジエステラーゼ4d7 |
EA201792679A1 (ru) * | 2015-06-01 | 2018-06-29 | Локсо Онколоджи, Инк. | Способы диагностики и лечения злокачественной опухоли |
US10982285B2 (en) * | 2015-11-04 | 2021-04-20 | Duke University | Biomarkers for the identification of prostate cancer and methods of use |
KR20200031088A (ko) * | 2020-03-03 | 2020-03-23 | 조한준 | 전립선암 환자의 예후 진단 및 치료 전략 결정용 재발 특이적 마커 |
-
2020
- 2020-07-13 KR KR1020200086444A patent/KR20220008175A/ko not_active Application Discontinuation
-
2021
- 2021-07-12 WO PCT/KR2021/008898 patent/WO2022014991A1/ko active Application Filing
- 2021-12-24 KR KR1020210186872A patent/KR20220008247A/ko not_active Application Discontinuation
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117925845A (zh) * | 2024-03-22 | 2024-04-26 | 广东辉锦创兴生物医学科技有限公司 | ***癌诊断或鉴别的甲基化分子标志物、试剂盒及其应用 |
Also Published As
Publication number | Publication date |
---|---|
WO2022014991A1 (ko) | 2022-01-20 |
KR20220008247A (ko) | 2022-01-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2017267184B2 (en) | Method for assessing a prognosis and predicting the response of patients with malignant diseases to immunotherapy | |
RU2721130C2 (ru) | Оценка активности путей клеточной сигнализации с помощью линейной комбинации(ий) экспрессий генов-мишеней | |
CN107941681B (zh) | 鉴定生物样品中定量细胞组成的方法 | |
RU2719194C2 (ru) | Оценка активности клеточных сигнальных путей с применением вероятностного моделирования экспрессии целевых генов | |
KR101545020B1 (ko) | 식도암 및 식도암 전이 진단을 위한 조성물 및 방법 | |
KR20210046031A (ko) | 유방암 치료를 위한 진단 및 치료 방법들 | |
US20090305284A1 (en) | Methods for Identifying Risk of Breast Cancer and Treatments Thereof | |
KR20110015409A (ko) | 염증성 장 질환에 대한 유전자 발현 마커 | |
US20030068636A1 (en) | Compositions, kits and methods for identification, assessment, prevention, and therapy of breast and ovarian cancer | |
CN101258249A (zh) | 检测黑素瘤的方法和试剂 | |
CN109863251A (zh) | 对肺鳞状细胞癌亚型分型的方法 | |
KR20060045950A (ko) | 혈액학적 악성종양에 대한 예후 | |
JP2003304888A (ja) | 化合物の毒性予測のための方法 | |
KR102016006B1 (ko) | 교모세포종의 진단 또는 예후 예측용 바이오마커 및 그 용도 | |
EP1756317A2 (en) | Methods for identifying risk of osteoarthritis and treatments thereof | |
AU2023203393A1 (en) | Compositions and methods for screening and identifying clinically aggressive prostate cancer | |
US20230022417A1 (en) | Chemical compositions and methods of use | |
KR20140113021A (ko) | 약물 중독 및 의존성 확인용 바이오마커 | |
KR20220008247A (ko) | 전립선암 환자의 예후 진단 및 치료 전략 결정용 병리등급 특이적 마커 | |
KR20100037637A (ko) | Egfr 억제제 치료에 대한 예측 마커 | |
US20020137077A1 (en) | Genes regulated in activated T cells | |
KR20040101992A (ko) | 간 질환에서의 유전자 발현 프로파일 | |
DK2951317T3 (en) | PROCEDURE FOR PREDICTING THE BENEFIT OF INCLUSING TAXAN IN A CHEMOTHERAPY PLAN FOR BREAST CANCER PATIENTS | |
KR20190126812A (ko) | 질환 진단용 바이오마커 | |
US20220265798A1 (en) | Cancer vaccine compositions and methods for using same to prevent and/or treat cancer |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A107 | Divisional application of patent | ||
E601 | Decision to refuse application |