KR20130004522A - 인간 고형 종양에서 유전자 결손 및 돌연변이 alk 카이네이즈 - Google Patents

인간 고형 종양에서 유전자 결손 및 돌연변이 alk 카이네이즈 Download PDF

Info

Publication number
KR20130004522A
KR20130004522A KR1020127030790A KR20127030790A KR20130004522A KR 20130004522 A KR20130004522 A KR 20130004522A KR 1020127030790 A KR1020127030790 A KR 1020127030790A KR 20127030790 A KR20127030790 A KR 20127030790A KR 20130004522 A KR20130004522 A KR 20130004522A
Authority
KR
South Korea
Prior art keywords
alk
ser
leu
gly
fusion
Prior art date
Application number
KR1020127030790A
Other languages
English (en)
Other versions
KR101362284B1 (ko
Inventor
클라리사 리코바
팅-레이 구
아일란 구오
헤르베르트 학크
존 맥니일
앤소니 포쎄마토
로라 설리반
지안 유
Original Assignee
셀 시그널링 테크놀러지, 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 셀 시그널링 테크놀러지, 인크. filed Critical 셀 시그널링 테크놀러지, 인크.
Publication of KR20130004522A publication Critical patent/KR20130004522A/ko
Application granted granted Critical
Publication of KR101362284B1 publication Critical patent/KR101362284B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/82Translation products from oncogenes
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K19/00Hybrid peptides, i.e. peptides covalently bound to nucleic acids, or non-covalently bound protein-protein complexes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1205Phosphotransferases with an alcohol group as acceptor (2.7.1), e.g. protein kinases
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • G01N33/57423Specifically defined cancers of lung
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/136Screening for pharmacological compounds
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/178Oligonucleotides characterized by their use miRNA, siRNA or ncRNA

Abstract

본 발명에서 이차 단백질의 일부와 미분화 림프종 카이네이즈(Anaplastic Lymphoma Kinase ;ALK)의 일부가 결합하는 융합 단백질을 야기하는 인간 염색체 2에서 일어나는 새로운 유전자 결손 돌연변이를 인간 고형 종양, 예를 들어 비소세포성 폐암(NSCLC)에서 동정하였다. 이차 단백질들은 Echinoderm Microtubule-Associated Protein-Like 4 (EML-4) 및 TRK-융합된 유전자(TFG)를 포함한다. ALK 타이로신 카이네이즈 활성을 계속가지는 EML-4-ALK 융합단백질은 이 돌연변이에 의하여 특성화된 비소세포성 폐암의 증식과 생존을 추진하는 것을 확인하였다.
본 발명은 따라서 분리된 폴리뉴크레오타이드들, 그 기재된 돌연변이체 ALK 카이네이즈 폴리펩타이드를 코딩하는 벡터, 그것을 검출하는 프로브들, 분리된 돌연변이체 폴리펩타이드, 재조합 폴리펩타이드 및 그 융합과 트런케이트된 폴리펩타이드들을 검출하는 시약을 제공한다. 이 새로운 융합 단백질의 기재된 동정은 생물학적 샘플에서 돌연변이 ALK 카이네이즈 폴리펩타이드의 존재를 결정하는 새로운 방법, 그 단백질을 저해하는 화합물을 스크리닝하는 방법 및 본 발명에 의하여 제공되는 돌연변이 ALK 폴리뉴크레오타이드 또는 폴리펩타이드의 발현에 의하여 특징되어지는 암들의 진행을 저해하는 방법을 가능하게 할 수 있다.

Description

인간 고형 종양에서 유전자 결손 및 돌연변이 ALK 카이네이즈{Gene Defects and Mutant ALK Kinase in Human Solid Tumors}
본 발명은 일반적으로 암과 관련된 단백질 및 유전자들에 관한 것이고 암의 검출, 진단 및 치료에 관한 것이다.
이 출원은 2006년 4월 14일에 출원되어 현재 계류 중인 USSN 60/792,364의 우선권을 주장한 것으로, 그것에 의하여 그것의 개재는 레퍼런스에 의하여 그것의 전부가 여기에 첨부되었다.
많은 암들은 세포 과정들의 비정상적인 조절 또는 세포의 조절되지 않는 성장이나 증식을 야기하는 세포 신호전달 경로의 손상에 의하여 특징되어 진다. 이들 손상들은 종종 카이네이즈와 같은 특정 신호 단백질들의 활성의 변화에 의하여 야기된다. 이들 종양들 중에서 비소세포폐암(non-small cell lung carcinoma;NSCLC)과 같은 고형 종양들이 있다. NSCLC는 미국의 암 사망의 주된 원인이고 모든 폐암의 약 87%를 차지한다. 미국에서 매년 약 151,000의 NSCLC가 새로 발병하고 미국에서만 120,000 이상의 환자가 매년 그 질병으로 사망한다. "Cancer Facts and Figures 2005," 미국 암 학회 참고. NSCLC는 세 독특한 서브타입으로 구성되고 종종 전이후에만 검출되고 치사율이 진단 2년 내에 75%이다.
비정상적인 신호 활성을 가지는 카이네이즈 융합단백질을 야기하는 유전자 결손 및 전위는 직접적으로 일부 암들을 야기한다고 알려졌다. 예를 들어 타이로신 카이네이즈 융합단백질인 BCR-ABL 종양단백질은 인간 만성 골수성 백혈병(CML)의 유발제로 직접 알려졌다. 적어도 90-95%의 CML 환자에서 발견되는 BCR-ABL 종양단백질은 c-ABL 단백질 타이로신 카이네이즈로부터 유전자 서열이 소위 필라델피아 염색체를 생성하는 염색체 22 상의 BCR 서열로 전위되어 생성된다. 예를 들어 Kurzock 외, N. Engl . J. Med . 319: 990-998 (1988) 참조. 전위(translocation)는 또한 급성 림프성 백혈병 및 NSCLC 경우에서도 관찰된다.
다양한 암들에서 관련된 돌연변이 또는 융합 단백질을 야기하는 유전자 전위 및 결손이 알려졌다. 예를 들어 Falini 등은 Blood 99(2): 409-426 (2002)에서 ALCL에서 발견된 NPM-ALK 융합을 포함하는 간암에서 발견된 전위를 리뷰하였다. 현재까지 폐암에서는 Notch3관련된 t(15;19) 전위[ Dang 외, J. Natl . Can . Instit. 92(16): 1355-1357 (2000)참고)를 포함한 단지 제한된 수의 유전자 전위, 결손 및 돌연변이 단백질들이 알려졌다. 소세포 및 비소세포성 폐암에서 RNA 결합 단백질-6 (EML-4) 발현 및/또는 활성의 결손이 발견되었다. Drabkin 외, Oncogene 8(16): 2589-97 (1999) 참고. 그러나 현재까지 단백질 카이네이즈 관련된 인간 NSCLC 암에서 전위나 결손이 보고되지 않았다.
대세포 미분화 림프종에서 NPM의 ALK로 융합을 야기하는 ALK 카이네이즈 결손이 알려졌다. Morris 외,1994; Shiota 외,1994 참고. 모에신, 비-근육 미오신 중쇄 9 (Tort 외 2001), 크라쓰린(clarthrin) 중쇄(Touriol 외, 2000; Bridge 외, 2001), 트로포미오신 3 (TPM3) (Lamant 외, 1999), TRK-융합된 유전자(TGF) (Hernandez 외, Am . J. Path . 160(4): 1487-1493 (2002)) 및 다른 유전자들로 ALK의 융합이 알려졌다. 특히, TGF-ALK 융합은 비-고형 림프종에서 보고되었으나 현재까지 이 융합은 고형 종양들에서는 보고되지 않았다. 암에서 ALK의 일반적인 역할이 보고되었다. Pulford 외, J. Cell Physiol . 199(3): 330-358 (2004) 참고. 그러나 현재까지 EML-4 발현 및/또는 활성화에서 결손이 없는 것으로 보고되었다.
인간 암들에서 돌연변이를 규명하는 것은 그러한 유전자 돌연변이를 가지는 환자를 동정하는 새로운 진단 및 그러한 융합 또는 돌연변이 단백질을 타겟하는 새로운 치료제 개발을 야기할 수 있기에 매우 바람직하다. 예를 들어, BCR-ABL는 백혈병을 치료하는 치료제의 개발의 타겟일 수 있다. 아주 최근에 ABL 카이네이즈의 소분자 저해제인 Gleevec®(Imatinib mesylate, STI-571)이 CML의 치료용으로 승인을 받았다. 이 약은 종양 세포들의 성장을 유도하는 신호경로를 저해하기 위하여 고안된 항증식제의 최초의 새로운 군이다. 이 약의 개발은 CML 및 ALL에 대한 통상적인 치료인 종양의 근본원인을 특이적으로 타겟하는데 실패하여 종종 제한된 효과를 가지고 부작용으로 잘 알려져 시달리는 화학요법이나 방사선 요법보다 현저하게 우수하다는 것을 나타낸다. 마찬가지로 글리벡과 같은 타겟된 저해제들에 가장 잘 반응하는 환자들을 동정하기 위하여 환자에서 BCR-ABL 융합 단백질을 특이적으로 검출하는 방법 및 시약들이 알려졌다.
따라서, 비 소세포 폐암과 같은 폐암을 포함하는 암들 특히 고형 종양의 진행에 관련된 융합 또는 돌연변이 단백질들을 야기하는 전위 또는 결손과 같은 새로운 유전자 돌연변이의 동정과 그러한 융합 단백질의 검출 및 연구를 위한 시약들 및 방법에 대한 필요성이 존재한다. 다른 것 중에 그러한 융합 단백질의 동정은 그러한 돌연변이/융합 단백질들을 저해하는 새로운 약제의 스크리닝뿐 아니라 타겟 치료를 위한 환자를 선택하는 새로운 방법들을 가능하게 할 것이다.
발명의 요약
본 발명에서 이차 단백질과 미분화 림프종 카이네이즈(Anaplastic Lymphoma Kinase ;ALK)의 일부로 결합하는 융합 단백질을 야기하는 인간 염색체 2에서 일어나는 새로운 유전자 결손 돌연변이를 인간 고형 종양인 비소세포성 폐암(NSCLC)에서 동정하였다. ALK 융합들에 관련된 이차 단백질들은 Echinoderm Microtubule-Associated Protein-Like 4 (EML-4) 및 TRK-융합된 유전자(TFG)를 포함한다. 돌연변이/융합 ALK 카이네이즈는 현재 비소세포성 폐암 환자 샘플들에서 관찰된다.
본 발명은 따라서 상기 기재된 돌연변이/융합 ALK 폴리펩타이드를 코딩하는 폴리뉴크레오타이드 및 벡터, 그것을 검출하는 프로브 및 분석, 분리된 돌연변이/융합 ALK 폴리펩타이드, 재조합 돌연변이 폴리펩타이드 및 돌연변이 ALK 폴리뉴크레오타이드 및 폴리펩타이드를 제공한다. 이들 새로운 돌연변이 ALK 카이네이즈 및 전위/결손의 기재된 동정은 생물학적 샘플에서 돌연변이 ALK 폴리뉴크레오타이드 또는 폴리펩타이드의 존재를 결정하는 새로운 방법, 돌연변이 카이네이즈 단백질을 저해하는 화합물을 스크리닝하는 방법 및 본 발명에 의하여 제공되는 돌연변이 ALK 폴리뉴크레오타이드 또는 폴리펩타이드의 발현에 의하여 특징되어 지는 암들의 진행을 저해하는 방법을 가능하게 할 수 있다. 본 발명의 모든 특징과 구체예는 하기에서 더욱 상세하게 기재한다.
도 1A는 염색체 2 상의 EML-4 유전자 및 ALK 유전자의 위치(패널 A), 및 전장 EML-4 및 ALK 단백질의 도메인 위치 뿐 아니라 EML4-ALK 융합 단백질(짧은 변이체)의 위치(패널 B)을 나타내고; 그 융합 접합점은 아미노산 233-234에서 일어나고, 그 융합 단백질은 ALK의 카이네이즈 도메인을 포함한다(그러나 막횡단 및 세포외 도메인을 포함하지 않음). EML4 엑손 6/인트론6/ALK 엑손 20 융합 접합점 부위의 DNA(및 단백질) 서열(각각 서열번호 7과 서열번호 8)을 보여 줌(패널 B).
도 1B는 염색체 2 상의 EML-4 유전자 및 ALK 유전자의 위치(패널 A), 및 전장 EML-4 및 ALK 단백질의 도메인 위치 뿐 아니라 EML4-ALK 융합 단백질(긴 변이체)의 위치(패널 B)을 나타내고; 그 융합 접합점은 아미노산 495-496에서 일어나고, 그 융합 단백질은 ALK의 카이네이즈 도메인을 포함한다(그러나 막횡단 및 세포외 도메인을 포함하지 않음). EML4 엑손 13/ALK 엑손 20 융합 접합점 부위의 DNA(및 단백질) 서열(각각 서열번호 24와 서열번호 25)을 보여 줌(패널 B).
도 1C는 염색체 6상의 TFG 유전자의 위치와 염색체 2 상의 ALK 유전자의 위치(패널 A), 및 전장 TFG 및 ALK 단백질의 도메인 위치 뿐 아니라 TFG-ALK 융합 단백질의 위치(패널 B)을 나타내고; 그 융합 접합점은 아미노산 138-139에서 일어나고, 그 융합 단백질은 ALK의 카이네이즈 도메인을 포함한다(그러나 막횡단 및 세포외 도메인을 포함하지 않음). 또한 TFG 엑손 3/ALK 엑손 20 융합 접합점 부위의 DNA(및 단백질) 서열(각각 서열번호 26과 서열번호 27)을 보여 줌(패널 B).
도 2A는 코딩 DNA 서열 (서열번호 2)(아래 패널)을 가지는 인간 EML4-ALK 융합 단백질(짧은 변이체) (서열번호 1) (탑 패널)의 아미노산 서열(1 글자 코드)이다; EML-4 부위의 잔기는 인탤릭체로 표시하고, ALK의 카이네이즈 도메인의 잔기들은 볼드체로 표시.
도 2B는 코딩 DNA 서열 (서열번호 19)(아래 패널)을 가지는 인간 EML4-ALK 융합 단백질(긴 변이체) (서열번호 18) (탑 패널)의 아미노산 서열(1 글자 코드)이다; EML-4 부위의 잔기는 인탤릭체로 표시하고, ALK의 카이네이즈 도메인의 잔기들은 볼드체로 표시.
도 2C는 코딩 DNA 서열 (서열번호 21)(아래 패널)을 가지는 인간 TFG-ALK 융합 단백질(서열번호 20) (탑 패널)의 아미노산 서열(1 글자 코드)이다; TFG 부위의 잔기는 인탤릭체로 표시하고, ALK의 카이네이즈 도메인의 잔기들은 볼드체로 표시.
도 3A-3B는 코딩 DNA 서열 (서열번호 4)(진 뱅크 어섹션 번호 NM019063)을 가지는 인간 EML-4 단백질(서열번호 3)의 아미노산 서열(1 글자 코드)이다; 짧은 변이체 결손 돌연변이에서 계속 유지된 잔기들은 언더라인하였고 긴 변이체에서 계속 유지된 잔기들은 인탤릭체로 표시.
도 4A-4B는 코딩 DNA 서열 (서열번호 6)(진 뱅크 어섹션 번호 HSU66559)을 가지는 인간 ALK 카이네이즈(서열번호 5)(스위스포트 어섹션 번호 Q9UM73)의 아미노산 서열(1 글자 코드)이다; 결손 돌연변이체에서 계속 유지된 잔기들은 언더라인하였고 카이네이즈 도메인의 잔기들은 볼드체로 표시.
도 4C-4D는 코딩 DNA 서열 (서열번호 23)(진 뱅크 어섹션 번호 NM006070)을 가지는 인간 TFG 단백질(서열번호 22)(스위스포트 어섹션 번호 Q92734)의 아미노산 서열(1 글자 코드)이다; 결손 돌연변이체에서 계속 유지된 잔기들은 언더라인하였다.
도 5 (A)는 ALK 프라이머를 가지고 2 라운드의 PCR후에 5'RACE 산물을 통한 ALK 검출; UAP는 Universal Amplification Primer를, GSP는 Gene Specific Primer를 나타냄, (B)는 RT-PCR에 의하여 EML-4 및 ALK 결손 돌연변이체에 의하여 형성된 융합단백질의 검출을, (C)는 5'RACE에 의하여 인간 NSCLC 종양 샘플에서 EML4-ALK 융합 유전자(짧은 그리고 긴 변이체)의 검출을, 그리고 (D)는 5'RACE에 의하여 인간 NSCLC 종양 샘플에서 TFG-ALK 융합 유전자의 검출을 나타내는 젤이다.
도 6은 ALK 유전자 구분점 2p23의 반대편에 프로브들을 포함하는 이중-칼라(오렌지/그린)브레이크-어파트 프로브를 채택하여 FISH 분석에 의한 H2228세포에서 EML-4 및 ALK 전위에 의하여 형성된 융합 유전자의 검출을 나타내는 이미지이다; 프로브 크기들 및 위치들은 위쪽 패널에 표시됨.
본 발명에서는 이차 단백질의 부분과 미분화 림프종 카이네이즈(Anaplastic Lymphoma Kinase ;ALK)의 일부를 결합하는 돌연변이 융합 단백질을 야기하는 전에 알려지지 않은 새로운 유전자 결손 및 전위 돌연변이를 인간 고형 종양인 비소세포성 폐암(NSCLC)에서 동정하였다. 발견된 ALK 융합들에 관련된 이차 단백질들은 Echinoderm Microtubule-Associated Protein-Like 4 (EML-4) 및 TRK-융합된 유전자(TFG)를 포함한다.
염색체 2 상의 EML4 및 ALK 유전자들 사이에 일어나는 상기 두 기재된 결손들은 1620 아미노산 막 타이로신 카이네이즈인 ALK의 C-말단 및 카이네이즈 도메인과 401 아미노산 마이크로튜불 결합 단백질인 EML-4의 N-말단을 결합하는 융합 단백질을 생성한다. 그 결과 산물인 EML4-ALK 융합 단백질들은 각각 796 아미노산들(짧은 변이체) 및 1059 아미노산(긴 변이체)이고, ALK 카이네이즈 활성을 가지며 NSCLC를 포함하는 인간 고형 종양들의 서브셋의 증식 및 생존을 추진하는 것으로 생각된다.
염색체 2 상의 ALK 유전자 및 염색체 6상의 TFG 유전자들 사이에 일어나는 상기 기재된 전위는 1620 아미노산 막 타이로신 카이네이즈인 ALK의 C-말단 및 카이네이즈 도메인과 400 아미노산 단백질인 TFG의 N-말단을 결합하는 융합 단백질을 생성한다. 그 결과 산물인 TFG-ALK 융합 단백질들은 각각 701 아미노산을 가지고 전에 비-고형 인간 림프종에서는 관찰되었으나(상기 Hernandez 외 (2002)), 고형 종양에서는 보고되지 않았다. 상기 TFG-ALK 융합 단백질은 ALK 카이네이즈 활성을 가지며 NSCLC를 포함하는 인간 고형 종양들의 서브셋의 증식 및 생존을 추진하는 것으로 생각된다.
비록 비정상적인 융합 단백질을 야기하는 일부 유전자 전위 또는 결손이 t(15;19) 전위 관련된 Notch3 (상기 Dang 외, 참고)를 포함하는 NSCLC에서에서 알려졌지만 , 본 발명의 EML4-ALK 결손 돌연변이 및 융합 단백질은 신규하다. 유사하게 림프종과 같은 비-고형 종양에서 알려졌지만 TFG-ALK 전위 및 융합단백질은 고형 종양 NSCLC에서는 신규하다. EML-4는 대부분 인간 조직들에서 발현되는 마이크로투불-관련 단백질이다. 현재까지 EML-4 발현 및/또는 활성에서 이상이 보고된 바 없다. ALK는 막 타이로신 카이네이즈이고 인간에서 뇌 및 CNS 조직, 소장 및 고환에서 발현되나 정상 림프 세포에서는 발현되지 아니한다. 그것은 신경계의 정상적인 발생 및 기능에 중요한 역할을 한다(Iwahara 외, 1997).
ALK 발현 및/또는 활성화에서 손상은 대세포미분화 림프종 및 신경아세포종에서 발견되었다(Morris 외, 1994, Osajima-Hakomori 외, 2005 참고). 모에신, 비-근육 미오신 중쇄 9, 크라쓰린 중쇄, 트로포미오신 3 (TPM3), TRK-융합된 유전자(TFG), 및 다른 유전자들에 ALK의 융합이 보고되었다 상기 Tort 외; Touriol 외, Hernandez 외) 참고. 흥미롭게도, 상기 기재된 ALK에 EML-4의 융합(짧은 변이체)은 다른 ALK 융합 돌연변이체에 대하여 기존에 보고된 것과 같이 동일한 야생형 ALK (아미노산 1058)의 위치에서 정확하게 일어난다.
하기에서 상세하게 기재하는 것과 같이, EML4-ALK 결손 돌연변이체들 및 그 발현된 융합 단백질들은 분리되고 서열을 확인하고 그 융합단백질을 발현하기 위한 cDNA들을 제조하였다. 따라서 본 발명은 EML4-ALK 융합 폴리펩타이드들을 코딩하는 분리된 폴리뉴크레오타이드들, 그러한 폴리뉴크레오타이드들과 교잡하는 핵산 프로브 및 재조합 돌연변이체 ALK 폴리펩타이드를 생성하기 위하여 그러한 폴리뉴크레오타이드들을 이용하기 위한 숙주세포, 방법들, 벡터들을 제공한다. 본 발명은 또한 야생형 EML-4 또는 야생형 ALK를 검출하거나 결합하지 아니하고 EML4-ALK 융합 폴리펩타이드들을 특이적으로 결합 및/또는 검출하는 분리된 시약들, EML4-ALK 융합 폴리펩타이드들을 코딩하는 아미노산 서열을 포함하는 분리된 폴리펩타이드들, 재조합 돌연변이 폴리펩타이드들을 제공한다. 하기에서 더욱 상세하게 설명할 본 발명의 이들 특징들은 특히 상기 기재된 ALK 결손 및 전위 돌연변이 및/또는 융합 단백질 또는 돌연변이 ALK 카이네이즈의 발현/활성에 의하여 특징지워지는 고형 종양(예를 들어 폐암 및 육종을 포함하는 암종) 및 다른 암들을 동정하기 위하여 돌연변이 ALK 카이네이즈 발현/활성에 의하여 추진되는 깊은 연구 및 하기에 더욱 설명될 것과 같은 본 발명의 실행방법에 유용하다.
신규한 ALK 카이네이즈 돌연변이체 및 유전자 결손 및 전위 돌연변이의 동정은 하나 이상의 이들 융합 단백질에 의하여 특징지워지는 NSCLC와 같은 고형 종양들의 강력한 진단 및 치료에 중요한 관련을 가진다. 예를 들어 NSCLC는 종종 전위된 후에만 검출되고 따라서 진단 2년 이내에 치사율이 75%이다. 따라서 가능한 조기에 NSCLC를 야기할 수 있는 환자들을 동정하는 능력은 매우 바람직하다.
따라서 고형 종양인 NSCLC의 증식 및 생존을 추진하는 것으로 생각되는 유전자 결손으로부터 야기된 EML4-ALK 융합 단백질들(짧은 것과 긴 변이체) 및 유전자 전위로부터 야기된 TFG-ALK 융합 단백질의 발견은 폐암(NSCLC과 같은)을 포함하는 포유류 고형 종양들 뿐 아니라, ALK 융합단백질(EML4-ALK 또는 TFG-ALK과 같은)이 발현되는 다른 암들을 정확하게 동정하는 중요한 새로운 방법을 제공할 수 있다.
이들 종양들은 WHI-131 또는 WHI-154와 같은 돌연변이 ALK 단백질의 카이네이즈 활성의 저해제들에 반응할 것으로 생각된다. 가능한 조기에 돌연변이 ALK 카이네이즈에 의하여 추동되는 암들의 동정 능력은 특정 환자에 가장 적합한 치료제 또는 치료제의 조합을 임상적으로 결정하는데 크게 도움을 주어서 그 암을 추동하는 주된 신호 분자가 아닌 다른 카이네이즈들을 타겟팅하는 저해제의 처방을 피하는데 도움을 준다.
따라서 본 발명은 본 발명의 융합-특이적이고 돌연변이체-특이적인 약제를 사용하여 암에서 ALK 돌연변이체 폴리뉴크레오타이드 및/또는 융합 단백질의 존재를 검출하는 방법을 제공한다. 그러한 방법들은 예를 들어 돌연변이체 단백질의 ALK 카이네이즈 활성의 저해제에 반응할 것 같은 NSCLC와 같은 고형 종양을 동정하는데 사용될 수 있다. 본 발명은 또한 EML4-ALK 융합 폴리펩타이드에 의하여 특징되어지는 암의 진행을 저해하는 화합물인지를 결정하는 방법들을 제공한다. 또한 본 발명은 상기 돌연변이체 폴리펩타이드의 발현 및/또는 활성을 저해하여 EML4-ALK 융합 폴리펩타이드 또는 TFG-ALK 융합 폴리펩타이드을 발현하는 고형 종양의 진행을 저해하는 방법을 제공한다. 그러한 방법은 하기에 더욱 상세하게 설명한다.
본 발명의 더 많은 특징들, 효과 및 구체예를 하기에서 상세하게 설명한다. 여기에 인용된 모든 레퍼런스는 그것에 의하여 그대로 레퍼런스에 의하여 삽입된다.
정의들.
본 명세서에 기재된 하기 용어들은 다음과 같은 의미를 가진다.
“항체” 또는 “항체들”은 키메릭, 폴리클론 및 단클론 항체들을 포함하는 Fab or 또는 그들의 항원-인지 절편들을 포함하는 IgG, IgM, IgA, IgD, 및 IgE를 포함하는 모든 타입의 면역글로불린을 의미한다. 여기서 사용된 "인간화된 항체"는 원래 결합능력은 보유하고 인간 항체와 더욱 더 유사하게 하기 위하여 비-항원 결합 부위에 대체된 아미노산을 가지는 항체 분자들을 의미한다.
"생물학적으로 활성"이란 용어는 자연적으로 일어나는 분자의 구조, 조절 또는 생화학적 기능들을 가지는 단백질을 의미한다. 마찬가지로, "면역적으로 활성"은 특정 항체들에 결합하고 적당한 동물 또는 세포들에 특정 면역 반응을 유도하는 천연, 재조합 또는 합성 EML4-ALK 또는 TFG-ALK 융합 단백질의 능력을 의미한다.
"생물학적 샘플"이란 용어는 가장 넓은 의미에서 사용되고 (EML4-ALK 및 TFG-ALK 융합 폴리뉴크레오타이드들 및 폴리펩타이드들을 포함하는) ALK 융합 폴리뉴크레오타이드들 또는 폴리펩타이드들 또는 그들의 절편들을 포함하는 것으로 의심되는 생물학적 샘플을 의미하고, 세포, 세포로부터 분리된 염색체(예를 들어 중기 염색체의 스프리드), 지노믹 DNA (서던 분석과 같은 고체 서포트에 결합된 것 또는 용액 내), RNA (노던 분석과 같이 고체 서포트에 결합된 것 또는 용액 내), cDNA (고체 서포트에 결합된 것 또는 용액 내), 세포 추출물, 혈액, 오줌, 골수 또는 조직 및 그 유사체를 포함할 수 있다.
암 및 돌연변이체 ALK 폴리뉴크레오타이드 및 폴리펩타이드와 관하여 “특징지워진”이란 그러한 유전자 결손 및/또는 융합 폴리펩타이드가 존재하지 않는 암들과 비교하여 유전자 결손 또는 전위 및/또는 ALK관련된 융합단백질이 발현된 것이 존재하는 암을 의미한다. 돌연변이체 폴리펩타이드의 존재는 전체 또는 부분적으로 그러한 암들의 성장 및 생존을 추동할 수 있다.
"컨센서스"는 초대받지 않은 염기들을 분석하기 위하여 재-서열분석이 된 핵산 서열 또는 5‘ 및/또는 3’방향으로 XL-PCR™(Perkin Elmer, Norwalk, Conn.)을 사용하여 확장하고 재서열분석한 핵산서열 또는 GELVIEW™ Fragment Assembly system (GCG, Madison, Wis.)을 사용한 한 인사이트 클론의 중복 서열들로부터 결합된 서열, 또는 확장과 결합 모두인 서열을 의미한다.
“ALK 카이네이즈-저해 치료제”는 융합 단백질(EML4-ALK 융합 단백질 및 TFG-ALK 융합 단백질과 같은) 단독 및/또는 부분인 야생형 또는 트런케이트된 ALK 카이네이즈의 발현 및/또는 활성을 직접 또는 간접적으로 저해하는 하나 이상의 화합물, 화학 또는 생물화제를 포함하는 조성물을 의미한다.
“유도체들"은 본 발명의 융합 폴리뉴크레오타이드를 코딩하는 핵산 서열 또는 그 코딩된 폴리펩타이드 그 자체의 화학적 변형을 의미한다. 그러한 변형의 예시는 수소를 알킬, 아실, 또는 아미노기로 대체하는 것일 수 있다. 핵산 유도체는 천연 분자의 필수적인 생물학적 특징을 유지한 폴리펩타이드들을 코딩할 수 있다.
폴리펩타이드, 폴리뉴크레오타이드 또는 여기에 기재된 시약과 관련한 “검출할수 있는 표지(Detectable label"는 흥미있는 분자를 검출하기 위한 형광, 질량, 잔기, 염료, 방사성동위원소, 표지 또는 태그 변형 등을 포함하나 이에 한정되지 아니하는 화학적, 생물학적 또는 다른 변형을 의미한다.
생물학적 샘플 내에 ALK 융합 폴리펩타이드와 관련된 “발현” 또는 “발현된”은 융합 폴리펩타이드가 현저하게 발현되지 아니하는 대조군 샘플과 비교하여 현저하게 발현되는 것을 의미한다.
“중-동위원소 표지된 펩타이드”(AQUA 펩타이드와 호환되어 사용)는 WO/03016861“Absolute Quantification of Proteins and Modified Forms Thereof by Multistage Mass Spectrometry"(Gygi 외)에 기재된 것과 같이 단백질의 절대적인 정량화 또는 검출에 적합한 적어도 하나의 중-동위원소 표지를 포함하는 펩타이드를 의미하고, 하기에 더욱 설명한다. 그러한 AQUA 펩타이드와 관련하여 “특이적으로 검출”은 AQUA 펩타이드 서열을 포함하는 폴리펩타이드들 및 단백질들을 단지 검출하고 정량화하는 펩타이드들 의미하고 AQUA 펩타이드 서열을 포함하지 않는 폴리펩타이드들 및 단백질들을 실질적으로 검출하지 않는 것을 의미한다.
“분리된”(또는 "실질적으로 정제된")은 그들의 원래 환경으로부터 제거되고, 고립되고, 분리된 핵산 또는 아미노산 서열을 의미한다. 그들은 바람직하게는 그들이 원래 연관된 다른 구성성분이 적어도 60%가 없는, 더욱 바람직하게는 75%가 없는, 그리고 가장 바람직하게는 90% 또는 그 이상이 없다.
“모방체(Mimetic)"은 ALK 융합 폴리펩타이드 또는 그것의 부분의 구조의 지식으로부터 개발된 구조 또는 분자를 의미하고 전위 관련 단백질 유사 분자들의 작용의 일부 또는 전부에 영향을 줄 수 있다.
“돌연변이체 ALK” 또는 “융합” 폴리펩타이드 또는 폴리뉴크레오타이드들은 여기에 기재된 것과 같은 ALK 관련 융합 폴리펩타이드 또는 폴리뉴크레오타이드 관련 및 이차 단백질(예를 들어 EML-4 또는 TFG)를 의미한다.
"폴리뉴크레오타이드”(또는 “폴리뉴크레오타이드 서열”)은 올리고뉴크레오타이드, 뉴크레오타이드, 또는 폴리뉴크레오타이드 및 그것의 절편 및 일부 및 단일- 또는 이중-가닥인 지노믹 또는 합성 기원의 DNA 또는 RNA이고 센스 또는 앤티-센스 가닥을 나타낸다.
“폴리펩타이드”(또는 "아미노산 서열")은 올리고펩타이드, 펩타이드, 또는 폴리펩타이드 및 그것의 절편 및 일부 및 천연적으로 존재하거나 합성 분자를 의미한다. 여기에 기재된 "아미노산 서열"이 천연적으로 존재하는 단백질 분자이 아미노산 서열을 의미하는 곳에서 "폴리펩타이드" 또는 "단백질"과 같은 "아미노산 서열" 및 유사용어들은 그 상술한 단백질 분자와 관련된 완전하고 천연 아미노산 서열로 그 아미노산 서열을 한정하는 것을 의미하지 아니한다.
“EML4-ALK 융합 폴리뉴크레오타이드”는 천연, 합성, 반-합성 또는 재조합이든지간에 어느 공급원으로부터 소, 양,돼지, 쥐, 말, 바람직하게는 사람을 포함하는 포유류와 같은 종들로부터 얻은 여기에 기재된 것과 같은 실질적으로 정제된 EML4-ALK 결손 돌연변이체 유전자 산물 또는 융합 폴리뉴크레오타이드(짧은 또는 긴 변이체)의 핵산 서열을 의미한다.
“EML4-ALK 융합 폴리펩타이드”는 천연, 합성, 반-합성 또는 재조합이든지간에 어느 공급원으로부터 소, 양,돼지, 쥐, 말, 바람직하게는 사람을 포함하는 포유류와 같은 종들로부터 얻은 여기에 기재된 것과 같은 실질적으로 정제된 EML4-ALK 융합 폴리펩타이드(짧은 또는 긴 변이체)의 아미노산 서열을 의미한다.
“TFG-ALK 융합 폴리뉴크레오타이드”는 천연, 합성, 반-합성 또는 재조합이든지간에 어느 공급원으로부터 소, 양,돼지, 쥐, 말, 바람직하게는 사람을 포함하는 포유류와 같은 종들로부터 얻은 여기에 기재된 것과 같은 실질적으로 정제된 TFG-ALK 전위 돌연변이체 유전자 산물 또는 융합 폴리뉴크레오타이드의 핵산 서열을 의미한다.
“TFG-ALK 융합 폴리펩타이드”는 천연, 합성, 반-합성 또는 재조합이든지간에 어느 공급원으로부터 소, 양,돼지, 쥐, 말, 바람직하게는 사람을 포함하는 포유류와 같은 종들로부터 얻은 여기에 기재된 것과 같은 실질적으로 정제된 TFG-ALK 융합 폴리펩타이드의 아미노산 서열을 의미한다.
항체 및 단백질 또는 펩타이드의 상호작용과 관련하여 "에 특이적으로 결합하는" (또는 "특이적인 결합" 또는 “특이적으로 결합”은 그 단백질의 특정 구조의 존재(즉 항원결정부위 또는 에피토프)에 의존하는 상호작용을 의미한다; 다른 용어로 그 항체는 일반적인 단백질이 아니라 특정 단백질 구조를 인식하고 결합한다. 그것이 특이적인 것 이외에 서열 또는 항원결정부위에 항체의 결합에 대하여 “결합하지 않는다”라는 용어는 항체가 특이적인 서열 또는 항원결정부위에 항체의 결합에 비교하여서 실질적으로 반응하지 않는다는 것을 의미한다.
서열 또는 프로브 교잡 조건과 관련한 "엄격한 조건들"이란 용어는 약 Tm 마이너스 5 ℃(프로브 또는 서열의 용융 온도(Tm)의 5℃ 아래)로부터 Tm의 약 20 ℃에서 25℃ 아래 범위 내에서 일어나는 “엄격성”이다. 전형적인 엄격한 조건들은: 50% 포름아마이드, 5 X.SSC (750 mM NaCl, 75 mM trisodium citrate), 50 mM 인산나트륨(pH 7.6), 5X Denhardt' 용액, 10% dextran sulfate, 및 20 micrograms/ml 변성, 쉐어된 연어 정자 DNA를 포함하는 용액에서 42℃에서 오버나잇 배양하고, 약 65℃에서 0.1X SSC 내에서 필터를 세척하는 것을 수반하는 것을 포함한다. 당업자에게 이해되는 것과 같이 교잡의 엄격성은 동일한 또는 관련된 폴리뉴크레오타이드 서열들을 동정 또는 검출하기 위하여 변경될 수 있다.
돌연변이체 ALK 폴리펩타이드의 "변이체"는 하나 이상의 아미노산이 변경된 아미노산 서열을 의미한다. 그 변이체는 "보존된" 변화를 가질 수 있고, 여기서 그 대체된 아미노산은 예를 들어 루신을 이소루신으로 변경하는 것과 같은 유사한 구조 및 화학적 성질을 가진다. 아주 드물게, 변이체는 글라이신을 트립토판으로 변경하는 것과 같은 "비보존된" 변경을 가질 수 있다. 유사한 작은 변이들은 아미노산 결손 또는 삽입 또는 그 모두를 포함할 수 있다. 생물학적 또는 면역학적 활성을 파괴함없이 대체, 삽입 또는 결손될 수 있는 아미노산 잔기들을 결정하는 안내는 예를 들어 당업계에 주지된 DNASTAR 소프트웨어와 같은 컴퓨터 프로그램을 사용하여 발견될 수 있다.
A. 인간 고형 종양들에서 돌연변이체 ALK 카이네이즈의 동정.
염색체 2에서 일어나고 ALK의 C-말단과 카이네이즈 도메인을 가진 EML-4의 N-말단을 결합하는 두 융합 단백질 변이체의 발현을 야기하는 여기에 기재된 새로운 인간 유전자 결손은 환자로부터 온 고형 종양들과 비소세포성 폐암(NSCLC) 세포주들(H2228을 포함)으로부터 유래한 추출물의 전체 인산화된 펩타이드 프로화일을 조사하는 동안에 놀랍게 동정되었다. 고형 종양, NSCLC는 폐암의 서브타입이다. 이들 결손 융합에 관여하는 단백질은 도 1A-1B, 패널 A에 나타낸다.
H2228 세포주의 인산화된 프로화일은 먼저 실시예 1에서 상술할 분리 및 복합 혼합물로부터 변형된 펩타이드들의 질량분광기적 특성화에 대하여 최근에 알려진 기술(미국 공개 번호 20030044848, Rush 외, “Immunoaffinity Isolation of Modified Peptides from Complex Mixtures"("IAP"기술)을 사용하여 알아내었다. 포스포타이로신-특이적인 항체(Cell Signaling Technology, Inc., Beverly, MA, 2003/04 Cat. #9411)를 사용한 IAP 기술의 적용은 H2228 세포주가 ALK 카이네이즈를 발현하나, 그 단백질이 현저하게 트런케이트되었다는 것을 알아내었다.
그 스크리닝은 폐암에서 활성화되는 것으로 알려진 일부를 포함한 세포주에서 다른 많은 활성화된 카이네이즈도 동정하였다. 5’RACE에 의한 ALK에 5’서열 분석은 EML-4의 N-말단과 그 카이네이즈가 융합되었다는 것을 나타내었다(도 6 참고).
동일한 인산화된 프로화일 접근을 사용한 NSCLC 환자들 154개의 종양 샘플의 차후 조사는 그들 환자의 군에서 EML4-ALK (짧은 변이체) 돌연변이의 존재 뿐 아니라 두 번째 EML4-ALK (긴 변이체)의 존재 그리고 다른 환자군들에서 TFG-ALK 돌연변이의 존재를 나타내었다(도 1B 및 1C 참고).
이들 NSCLC 종양들에서 돌연변이체 ALK 단백질들이 세포 증식 및 생존을 추진한다는 확인은 siRNA 사일런싱을 사용한 그 세포들의 저해에 의하여 확립될 수 있다(실시예 3 참고).
상기 EML4-ALK 융합 유전자들(짧은 그리고 긴 변이체) 및 TFG-ALK 융합 유전자는 PCR에 의하여 증폭되고 분리되고, 서열분석된다(실시예 3 참고). 도 1A-1B의 패널 B에 나타난 바와 같이, 그 EML4-ALK 결손은 야생형 EML-4의 N-말단(짧은 변이체의 아미노산 1-233 또는 긴 변이체의 아미노산 1-495)과 야생형 ALK의 C-말단(아미노산 1057-1620)을 결합한다(서열번호 3과 5 참고). 그 융합 연결은 야생형 ALK의 막횡단 도메인의 C-말단에서 일어난다 (도 1A-1B). 그 EML4-ALK 융합 폴리펩타이드들은 이 단백질의 코일된 코일 도메인을 포함하는 각각 EML-4의 N-말단 233 또는 495 아미노산을 보유한다. 그 결과 산물인 EML4-ALK 융합 단백질들은 각각 796 아미노산들(짧은 변이체) 및 1059 아미노산(긴 변이체)이고 (도 1A-1B의 패널 B 및 도 2A-2B (서열번호: 1 및 18) 참고), ALK 카이네이즈 활성을 가진다. 관련된 엑손들 및 융합 접합점은 도 1A-1B (패널 B)에 나타낸다. 그 융합 접합점은 EML-4로부터 인트론 6를 포함하고, EML-4로부터 엑손 6 (짧은 변이체) 또는 엑손 13(긴 변이체)을 수반한다.
도 1C의 패널 B에 나타낸 바와 같이, 그 TFG-ALK 전위는 카이네이즈 도메인을 가지는 야생형 TFG의 N-말단 (아미노산 1-138)과 야생형 ALK의 C-말단(아미노산 1057-1620)을 연결한다(서열번호: 22 및 5; 그리고 도 1C의 패널 B 그리고 도 4C (서열번호: 20 및 1) 참고). 그 융합 접합점은 야생형 ALK의 막횡단 도메인의 C-말단에서 일어나고(도 1C 참고) ALK의 카이네이즈 활성을 보유한다. 관련된 엑손들 및 융합 접합점은 도 1C (패널 B)에 나타낸다. 그 융합 접합점은 TFG로부터 엑손 3 그리고 ALK로부터 엑손 20을 포함한다.
FISH 프로브들은 파라핀-충진된 인간 NSCLC 종양 샘플들의 군에서 EML4-ALK(짧은 변이체) 융합 단백질의 존재를 검출하는데 사용되었다(실시예 6 및 7; 도 6 참고). 이 샘플 크기에서 이 짧은 변이체의 빈도는 매우 낮았다. 그러나 TFG-ALK 융합 단백질 뿐 아니라 EML4-ALK 융합 단백질들(짧은 및 긴 변이체 모두)의 발현이 환자로부터 유래한 또 다른 154 동결 인간 NSCLC 종양 샘플 군의 인산화 프로화일을 조사한 IAP 기술을 사용하여 높은 빈도로 검출되었다( 실시예 1B).
B. 분리된 폴리뉴크레오타이드들 .
본 발명은 EML4-ALK 융합 폴리펩타이드들을 코딩하는 분리된 폴리뉴크레오타이드들, 그러한 폴리뉴크레오타이드들과 교잡하는 핵산 프로브 및 재조합 융합 폴리펩타이드를 생성하기 위하여 그러한 폴리뉴크레오타이드들을 이용하기 위한 숙주세포, 방법들, 벡터들을 제공한다.
만약 다른 언급이 없다면 여기에서 DNA 분자를 시퀀싱하여 결정된 모든 뉴크레오타이드 서열들은 자동화된 DNA 시퀀서(Applied Biosystems, Inc.에서 제조된 Model 373과 같은)를 사용하여 결정된 것이고, 여기에서 결정된 DNA 분자에 의하여 코딩되는 모든 아미노산 서열들은 자동화된 펩타이드 시퀀서를 사용하여 결정된 것이다(실시예 2 참고). 이 자동화된 접근에 의하여 결정된 DNA 서열에 대하여 당업계에 알려진 것과 같이 여기에서 결정된 뉴크레오타이드 서열은 일부 에러를 포함할 수 있다. 자동에 의하여 결정된 뉴크레오타이드 서열들은 시컨싱된 DNA 분자의 실질적인 뉴크레오타이드 서열과 전형적으로 약 90% 동일, 더욱 전형적으로 약 95%에서 적어도 약 99.9% 동일하다. 실질적인 서열은 당업계에 주지된 수동 DNA 시퀀싱 방법들을 포함하는 다른 접근에 의하여 더욱 정확하게 결정될 수 있다. 당업계에 공지된 바와 같이, 실제 서열과 비교하여 결정된 뉴크레오타이드에서 하나의 삽입 또는 결손은 그러한 삽입 또는 결손의 위치에서 시작되는 결정된 뉴크레오타이드 서열에 의하여 코딩되는 예측되는 아미노산 서열이 시퀀싱된 DNA 분자에 의하여 실질적으로 코딩되는 아미노산 서열과 완전하게 다르게 되는 뉴크레오타이드 서열의 번역에서 프레임 쉬프트를 야기할 것이다.
만약 다른 언급이 없다면 여기에서 기재된 각 뉴크레오타이드 서열은 디옥시뉴크레오타이드(A, G, C 및 T로 약칭)의 서열로 나타낸다. 그러나 DNA 분자 또는 폴리뉴크레오타이드, 디옥시리보뉴크레오타이드, 디옥시리보뉴크레오타이드들의 서열에 대하여,핵산 분자 또는 폴리뉴크레오타이드의 "뉴크레오타이드 서열"이 의도되고 RNA 분자 또는 폴리뉴크레오타이드에서는 리보뉴크레오타이드들의 해당 서열(A, G, C 및U), 여기서 특정화된 디옥시리보뉴크레오타이드 서열에서 각 티미딘 디옥시리보뉴크레오타이드(T)가 리보뉴크레오타이드 유리딘(U)으로 대체된다. 예를 들어 디옥시리보뉴크레오타이드 약어에 기재된 서열번호 2의 서열을 가진 RNA 분자와 관련하여 서열번호 2의 각 디옥시리보뉴크레오타이드 A, G 또는 C는 해당하는 리보뉴크레오타이드 A, G 또는 C로 대체되고, 각 디옥시리보뉴크레오타이드 T는 리보뉴크레오타이드 U로 대체되는 서열을 가진 RNA 분자를 나타내고자 한다.
일 실시예에서, 본 발명은
(a) 서열번호 1 또는 서열번호 18의 아미노산 서열을 포함하는 극피 동물(Echinoderm) 미소관(Microtubule)-관련 단백질-유사 4/역형성 림프종(Anaplastic Lymphoma) 카이네이즈(EML4-ALK) 융합단백질을 코딩하는 뉴크레오타이드 서열;
(b) EML4-ALK 융합 폴리펩타이드를 코딩하는 뉴크레오타이드 서열, 상기 뉴크레오타이드 서열은 서열번호 2 또는 서열번호 19의 뉴크레오타이드 서열을 포함하며;
(c) EML-4의 N-말단 아미노산 서열(서열번호 3의 잔기 1-233 또는 서열번호 3의 잔기 1-495) 및 ALK의 카이네이즈 도메인(서열번호 5의 잔기 1116-1383)을 포함하는 EML4-ALK 융합 폴리펩타이드를 코딩하는 뉴크레오타이드 서열;
(d) EML-4의 N-말단 뉴크레오타이드 서열(서열번호 4의 뉴크레오타이드 1-700 또는 서열번호 4의 뉴크레오타이드 1-1486) 및 ALK의 카이네이즈 도메인 뉴크레오타이드 서열(서열번호 6의 뉴크레오타이드 3348-4149)을 포함하는 뉴크레오타이드 서열;
(e) EML4-ALK 융합 폴리뉴크레오타이드의 융합 접합점(서열번호 2의 뉴크레오타이드 700-701 또는 서열번호 19의 뉴크레오타이드 1488-1489)을 포함하는 적어도 여섯 개의 인접한 뉴크레오타이드를 포함하는 뉴크레오타이드 서열;
(f) EML4-ALK 융합 폴리펩타이드의 융합 접합점(서열번호 1의 잔기 233-234 또는 서열번호 18의 잔기 495-496)을 포함하는 적어도 여섯 개의 인접한 아미노산을 포함하는 폴리펩타이드를 코딩하는 뉴크레오타이드 서열; 및
(g) 상기 (a)-(f)의 뉴크레오타이드 서열 중 어느 하나에 상보적인 뉴크레오타이드 서열로 구성된 군으로부터 선택된 서열과 적어도 95% 일치하는 뉴크레오타이드 서열을 포함하는 분리된 폴리뉴크레오타이드을 제공한다.
도 2의 뉴크레오타이드 서열(서열번호 2)과 같은 여기에 제공된 정보를 사용하여, 본 발명의 돌연변이체 ALK 폴리펩타이드를 코딩하는 본 발명의 뉴크레오타이드 서열은 시작물질로 mRNA를 사용하여 cDNA를 클로닝하는 것과 같은 표준 클로닝 및 스크리닝 방법을 사용하여 얻을 수 있다. 본 발명의 예시인 도 2에 기재된 EML4-ALK 융합 폴리뉴크레오타이드 서열(짧은 변이체)(서열번호 2)는 인간 NSCLC 세포주로부터 분리된 지노믹 DNA로부터 분리되었다(실시예 2에서 더욱 상술). 알려진 EML4-ALK 유전자 결손(염색체 2)이 일어나는 고형 종양들을 포함하는 다른 암들에서 지노믹 DNA 또는 cDNA 라이브러리로부터 그 융합 유전자는 동정될 수도 있다.
상기 EML4-ALK 융합 유전자의 결정된 뉴크레오타이드 서열들(서열번호 2 및 19)은 각각 796 아미노산(짧은 변이체) 및 1059 아미노산(긴 변이체)의 카이네이즈 융합 단백질들을 코딩한다(도 2A-B (서열번호 1 및 18) 그리고 도 1A-B 참고). 그 EML4-ALK 융합 폴리뉴크레오타이드들은 그 단백질의 C-말단 및 카이네이즈 도메일을 코딩하는 야생형 ALK의 뉴크레오타이드 서열 부분을 가지는 단백질의 아미노산 1-495(긴 변이체)(도 4 (서열번호 6) 참고) 또는 N-말단을 코딩하는(짧은 변이체)는 야생형 EML-4의 뉴크레오타이드 서열 부분(도 3 (서열번호 4))를 포함한다. 도 1A-B 참고. 카이네이즈 도메인은 짧은 변이체 융합 단백질 잔기 292-568 (짧은 변이체 융합 폴리뉴크레오타이드의 뉴크레오타이드 874-1704에 의하여 코딩되는) 또는 긴 변이체 융합 단백질 잔기 555-831(긴 변이체 융합 폴리뉴크레오타이드의 뉴크레오타이드 1663-2494에 의하여 코딩되는)를 포함한다. 도 2A-2B 참고.
기재한 바와 같이, 본 발명은 상기 EML4-ALK 융합 단백질의 성숙된 형태를 제공한다. 신호 가설에 따라서, 포유류 세포에 의하여 분비되는 단백질들은 거친 세포내 망상체를 통하여 단백질 체인의 성장의 배출이 일단 시작되고 성숙형 단백질로부터 제거되는 신호 또는 분비 리더 서열을 가진다. 대부분 포유류 세포 및 심지어 곤충세포들도 동일한 특이성을 가진 분비된 단백질들을 절단한다. 그러나 일부 경우에는 분비된 단백질의 절단이 완전하게 단일하지 않아서 그 단백질의 둘 이상의 성숙형태를 야기한다. 또한 분비된 단백질의 절단 특이성은 완성된 단백질의 일차 구조 즉 폴리펩타이드의 아미노산 서열의 특성에 의하여 궁극적으로 결정된다고 오랫동안 알려졌다.
예를 들어 기탁된 cDNA 클론과 같은 그 아미노산 서열을 가진 성숙형 EML4-ALK 폴리펩타이드에서 이 융합 단백질의 성숙형은 성숙형 융합 폴리펩타이드를 코딩하는 그 기탁된 크론 또는 다른 클론의 인간 DNA 서열에 의하여 코딩되는 완전한 오픈 리딩 프레임의 포유류 세포(예를 들어 하기 기재된 3T3 세포)에서 발현에 의하여 생성된 것을 의미한다.
기재한 바와 같이, 본 발명의 폴리뉴크레오타이드는 mRNA와 같은 RNA 형태, 또는 예를 들어 합성적으로 생성되거나 클로닝에 의하여 얻은 cDNA 및 지노믹 DNA를 포함하는 DNA 형태일 수 있다. 그 DNA는 이중 가닥 또는 단일 가닥일 수 있다. 단일 가닥 DNA 또는 RNA는 센스 가닥으로 알려진 코딩 가닥이거나 앤티-센스 가닥으로 알려진 비-코딩 가닥일 수 있다.
본 발명의 분리된 폴리뉴크레오타이드들은 DNA 또는 RNA이고 그들의 자연 환경으로부터 분리된 것이다. 예를 들어, 벡터에 존재하는 재조합 DNA는 본 발명의 목적을 위하여 분리된 것으로 간주된다. 분리된 DNA 분자들의 또 다른 예는 이종 숙주 세포에 존재하는 재조합 DNA분자들 또는 용액에 존재하는 정제된(부분적 또는 실질적으로) DNA 분자들을 포함한다. 분리된 RNA 분자들은 본 발명의 DNA 분자들의 인 비보 또는 인 비트로 RNA 전사체를 포함한다. 본 발명의 따른 분리된 핵산 분자들은 합성적으로 생성된 그러한 분자들을 더욱 포함한다.
본 발명의 분리된 폴리뉴크레오타이드들은 도 2A-B에서 나타낸 DNA 분자(서열번호 2 및 19), 도 1A-B에 나타난 성숙형 EML4-ALK 융합 단백질들에 대한 코딩서열을 포함하는 DNA 분자들(서열번호 1 및 18), 및 본 발명의 ALK 돌연변이체 폴리펩타이드를 코딩하지만 유전자 코드의 디제러시로 인하여 상기에 기재된 것과 실질적으로 다른 서열을 포함하는 DNA 분자를 포함한다. 그 유전자 코드는 당업계에 잘 알려져서 그러한 디제너레이트된 변이체를 생성하는 것은 당업자에게는 매우 용이하다.
또다른 실시예에서, 본 발명은 상기 기재된 기탁된 클론에 포함된 EML4-ALK 융합 뉴크레오타이드 서열을 포함하는 EML4-ALK 융합 폴리펩타이를 코딩하는 분리된 폴리뉴크레오타이드를 제공한다. 바람직하게는 그러한 핵산 분자는 여기에 기재된 전장 EML4-ALK 융합 단백질을 발현하는 또 다른 클론 또는 기탁된 cDNA 클론에 의하여 코딩되는 성숙형 융합 폴리펩타이드를 코딩할 것이다. 또 다른 구체예에서, 본 발명은 EML-4의 N-말단 아미노산 서열(서열번호 3의 잔기 1-233 또는 서열번호 3의 잔기 1-495) 및 ALK의 카이네이즈 도메인(서열번호 5의 잔기 1116-1383)을 포함하는 EML4-ALK 융합 폴리펩타이드를 코딩하는 분리된 뉴크레오타이드 서열을 제공한다. 일 구체예에서, ALK의 카이네이즈 도메인을 포함하는 폴레펩타이드는 서열번호 5의 잔기 1057-1620를 포함한다(도 1, 패널 B 참고). 또 다른 구체예에서, 상기 언급된 EML-4의 N-말단 아미노산 서열과 ALK의 카이네이즈 도메인은 서열번호 4의 뉴크레오타이드 뉴크레오타이드 1-700 또는 서열번호 4의 뉴크레오타이드 1-1486 및 서열번호 6의 뉴크레오타이드 3171-4860를 각각 포함하는 뉴크레오타이드 서열들에 의하여 코딩된다.
본 발명은 본 발명의 돌연변이체 ALK 폴리뉴크레오타이드 중 하나에 상보적인 서열을 가지는 뉴크레오타이드 서열을 포함하는 분리된 폴리뉴크레오타이드들을 제공한다. 특히 DNA 분자들과 같은 그러한 분리된 분자들은 염색체와 인 시튜 교잡에 의한 유전자 지도용 및 예를 들어 하기 섹션 F에서 상술할 노던 블럿 분석에 의하여 인간 조직에서 EML4-ALK 융합 단백질의 발현을 검출하기 위한 프로브로 유용하다.
본 발명은 여기에 기재된 분리된 핵산 분자들의 절편을 더욱 포함한다. 본 발명의 분리된 EML4-ALK 폴리뉴크레오타이드의 절편은 적어도 약 15 뉴크레오타이드, 더욱 바람직하게는 적어도 약 20 뉴크레오타이드, 더더욱 바람직하게는 적어도 약 30 뉴크레오타이드, 가장 바람직하게는 적어도 약 40 뉴크레오타이드 길이를 가지고 여기에 기재된 바와 같이 진단 프로브 및 프라이머로 유용하다. 물론 도 2A-B (서열번호 2 또는 19)에 나타낸 융합 폴리뉴크레오타이드를 발현하는 다른 클론 또는 도 2(서열번호 2)에 나타낸 것과 또는 기탁된 cDNA의 돌연변이체 ALK 뉴크레오타이드 서열들의 전부는 아니지만 대부분에 해당하는 절편과 같은 약 50-1500 뉴크레오타이드 길이의 긴 절편도 유용하다. 예를 들어 적어도 20 뉴크레오타이드 길이의 절편이 그 절편들이 유래된 각 뉴크레오타이드 서열들로부터 20 이상의 인접한 염기들을 포함하는 절편으로 생각된다. 그러한 DNA 절편의 생성은 당업자에 일상적이고 여기에 기재된 서열에 따라 합성되거나 기탁된 cDNA 클론으로부터 얻을 수 있는 DNA의 소니케이션에 의한 절단 또는 제한효소 절단에 의하여 달성될 수 있다. 또는 그러한 절편들은 직접 합성적으로 생성될 수 있다.
본 발명의 바람직한 프로브 또는 핵산 절편들은 EML4-ALK 융합 유전자 산물의 융합 접합점을 코딩하는 핵산 분자(도 1A-B, 패널 B 참고)을 포함한다. 예를 들어 일부 바람직한 구체예에서, 본 발명의 분리된 폴리뉴크레오타이드는 EML4-ALK 융합 폴리뉴크레오타이드 (도 1A-B, 패널 B (서열번호 8 및 25))의 융합 접합점(서열번호 2의 뉴크레오타이드 700-701 또는 서열번호 19의 뉴크레오타이드 1488-1489)을 포함하는 적어도 여섯개의 인접한 뉴크레오타이드를 포함하는 뉴크레오타이드 서열/절편을 포함한다. 또다른 바람직한 구체예에서, 본 발명의 분리된 폴리뉴크레오타이드는 EML4-ALK 융합 폴리뉴크레오타이드(도 1A-B, 밑 패널 B (서열번호 7 및 24))의 융합 접합점(서열번호 1의 잔기 233-234 또는 서열번호 18의 잔기 495-496)을 포함하는 적어도 여섯개의 인접한 아미노산을 포함하는 폴리펩타이드를 코딩하는 뉴크레오타이드 서열/절편을 포함한다.
또 다른 특징에서, 본 발명은 여기 기재된 본 발명의 돌연변이체 ALK 폴리뉴크레오타이드의 일부를 교잡조건 하에서 교잡하는 분리된 폴리뉴크레오타이드를 제공한다. "엄격한 조건들"이란 50% 포름아마이드, 5 X.SSC (750 mM NaCl, 75 mM trisodium citrate), 50 mM 인산나트륨(pH 7.6), 5X Denhardt' 용액, 10% dextran sulfate, 및 20 micrograms/ml 변성, 쉐어된 연어 정자 DNA를 포함하는 용액에서 42℃에서 오버나잇 배양하고, 약 65℃에서 0.1X SSC 내에서 필터를 세척하는 것을 수반하는 것을 포함한다.
폴리뉴크레오타이드의 "일부"와 교잡하는 폴리뉴크레오타이드에서 레퍼런스 폴리뉴크레오타이드의 적어도 약 15 뉴크레오타이드(nt), 바람직하게는 약 20 nt, 더욱 바람직하게는 적어도 약 30 nt, 가장 바람직하게는 약 30-70 nt가 교잡되는 폴리뉴크레오타이드 (DNA 또는 RNA)일 것이다. 이들은 상기 기재된 것과 같은 진단 프로브 및 프라이머로서 유용하고 하기에서 상술한다.
물론 레퍼런스 폴리뉴크레오타이드 (예를 들어 도 2에 기재된 성숙형 EML4-ALK 융합 폴리뉴크레오타이드(서열번호 2))의 큰 부분 예를 들어 50-750 nt 길이 부분 또는 심지어 레퍼런스 폴리뉴크레오타이드의 전장과 교잡하는 폴리뉴크레오타이드들은 도 2A-B (서열번호 2 또는 19) 또는 도 1A-B(패널 B))(서열번호 7 및 24)에 나타낸 뉴크레오타이드 서열들 또는 기탁된 cDNA의 뉴크레오타이드 서열들의 전부는 아니지만 대부분에 해당하는 폴리뉴크레오타이드들과 같은 약 50-1500 뉴크레오타이드 길이의 긴 절편도 본 발명의 프로브로 유용하다.
예를 들어 "적어도 20 뉴크레오타이드 길이"의 폴리뉴크레오타이드의 부분은 레퍼런스 폴리뉴크레오타이드의 뉴크레오타이드 서열로부터 20 개 이상의 인접한 뉴크레오타이드를 의미한다. 기재한 바와 같이, 그러한 부분은 예를 들어 그 모든 내용이 여기에 레퍼런스에 의하여 삽입된, Molecular Cloning, A Laboratory Manual, 2nd Ed., Sambrook, J., Fritsch, E. F. and Maniatis, T., eds., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (1989)에 기재된 것과 같은 중합효소 체인 반응(PCR)에 의한 타겟 서열의 증폭을 위한 프라이머로서 또는 통상의 DNA 교잡 기술에 따른 프로브로 진단적으로 유용하다. 물론, 폴리 A 서열(도 2의 EML4-ALK 서열(서열번호 2)의 3' 말단 poly(A) 트랙과 같은) 또는 T(또는 U)잔기의 상보적인 스트렛치에만 교잡하는 본 발명의 폴리뉴크레오타이드는 그러한 폴리뉴크레오타이드가 poly(A) 스트렛치 또는 그것의 상보체를 포함하는 핵산 분자(예를 들어 실질적으로 이중 가닥 cDNA 클론)에 교잡하기 때문에 본 발명의 핵산의 부위에 교잡하기 위하여 사용된 본 발명의 폴리뉴크레오타이드에 포함되지 아니한다.
기재된 바와 같이, 본 발명의 ALK 폴리펩타이드를 코딩하는 본 발명의 핵산 분자들은 성숙형 폴리펩타이드의 아미노산 서열을 코딩하는 그 자체; 프리, 또는 프로 또는 프리-프로-단백질과 같은 리더 또는 분비 서열을 코딩하는 것과 같은 부가적인 서열과 성숙형 폴리펩타이드를 코딩하는 서열; 상기 언급한 부가적인 코딩서열을 포함하거나 포함하지 아니하고 예를 들어 인트론 및 전사, 예를 들어 리보좀 결합과 같은 폴리A 신호 및 스프라이싱을 포함하는 mRNA 가공, 및 mRNA의 안정성에서 중요한 역할을 하는 전사되고 비번역되는 비-코딩 5' 및 3' 서열을 포함하나 이에 한정되지 아니하는 부가적인 비코딩 서열을 가지는 성숙형 폴리펩타이드의 코딩 서열; 부가적인 기능성을 제공하는 것과 같은 부가적인 아미노산들을 코딩하는 부가적인 코딩서열을 포함할 수 있으나 이에 한정되지 아니한다.
따라서 그 폴리펩타이드를 코딩하는 서열은 융합된 폴리펩타이드의 정제를 가능하게 하는 펩타이드를 코딩하는 서열과 같은 마커 서열에 융합될 수 있다. 본 발명의 이 특징의 바람직한 구체에에서, 마커 아미노산 서열은 상업적으로 가능한 많은 것 중에 pQE 벡터(Qiagen, Inc.)에서 제공된 태그와 같은 헥사-히스티딘 펩타이드이다. 예를 들어 Gentz 외, Proc . Natl . Acad . Sci . USA 86: 821-824 (1989)에서 기재된 것과 같이, 헥사-히스티딘은 융합 단백질의 통상적인 정제를 제공한다. 그 "HA" 태그는 Wilson 외, Cell 37: 767 (1984)에서 기재된 인후루엔자 헤마그루티닌 단백질로부터 유래한 에피토프에 해당하는 정제에 유용한 또 다른 펩타이드이다. 하기 기재된 것과 같이, 다른 그러한 융합 단백질들은 N- 또는 C-말단에서 Fc에 융합된 EML4-ALK 융합 폴리펩타이드를 포함한다.
본 발명은 여기에 기재된 EML4-ALK 융합 폴리펩타이드의 유도체, 부분 또는 아나로그를 코딩하는 본 발명의 핵산 분자의 변이체에 관한 것이다. 변이체들은 천연 유전자좌 변이(allelic variant)와 같은 자연적으로 일어날 수 있다. "유전자좌 변이"는 생물체의 염색체 상 주어진 위치를 점유한 유전자의 몇가지 교호(alternate)형태 중 하나이다. 예를 들어 Genes II, Lewin, B., ed., John Wiley & Sons, New York (1985) 참고. 비-자연적으로 존재하는 변이체들은 공지된 돌연변이 방법을 사용하여 제조될 수 있다.
그러한 변이체들은 뉴크레오타이드 대체, 결손 또는 부가에 의하여 생성되는 것을 포함한다. 그 부가, 결손 또는 대체는 하나 이상의 뉴크레오타이드과 관련될 수 있다. 그 변이체들은 코딩 부위, 비-코딩 부위 또는 양자모두에서 변경될 수 있다. 코딩 부위에서 변경은 보존적인 또는 비보존적인 아미노산 대체, 결손 또는 부가를 생성할 수 있다. 특히 이들 중에서 바람직한 것은 여기에 기재된 돌연변이체 ALK 폴리펩타이드들의 특성 및 활성(예를 들어 카이네이즈 활성)을 변화하지 않는 사일런트 대체, 결손 또는 부가이다. 이러한 면에서 또 바람직한 것은 보존적인 대체이다.
본 발명의 구체예는 본 발명의 돌연변이체 ALK 폴리뉴크레오타이드 서열과 적어도 90% 동일한, 더욱 바람직하게는 적어도 95%, 96%, 97%, 98% or 99% 동일한 뉴크레오타이드 서열(예를 들어 도 2(서열번호 1)에 나타난 EML4-ALK 융합 폴리펩타이드를 코딩하는 뉴크레오타이드 서열; 또는 EML-4의 N-말단 및 ALK의 카이네이즈 도메인을 코딩하는 뉴크레오타이드 서열(도 1, 패널 B; 및 도 3과 4 참고); 또는 그러한 예시적인 서열과 상보적인 뉴크레오타이드)을 포합하는 분리된 폴리뉴크레오타이드를 포함한다.
예를 들어 돌연변이체 ALK 폴리펩타이드를 코딩하는 레퍼런스 뉴크레오타이드 서열과 적어도 95% "동일한" 뉴크레오타이드 서열을 가지는 폴리뉴크레오타이드는 폴리뉴크레오타이드 서열이 돌연변이체 ALK 폴리펩타이드를 코딩하는 레퍼런스 뉴크레오타이드 서열의 각 100 뉴크레오타이드 당 최대 다섯개의 포인트 돌연변이를 포함할 수 있는 것을 제외하곤 레퍼런스 뉴크레오타이드 서열과 동일하다는 것을 의미한다. 다른 용어로, 레퍼런스 뉴크레오타이드 서열과 적어도 95% 동일한 뉴크레오타이드 서열을 가지는 폴리뉴크레오타이드를 얻는 것은 레퍼런스 서열의 뉴크레오타이드들 중 최대 5%가 결손되거나 또다른 뉴크레오타이드로 대체될 수 있거나 레퍼런스 서열 내의 전체 뉴크레오타이드의 최대 5%에 해당하는 뉴크레오타이드가 레퍼런스 서열에 삽입될 수 있다는 것이다. 그 레퍼런스 서열의 이들 돌연변이는 레퍼런스 뉴크레오타이드 서열의 5' 또는 3' 말단 부위 또는 레퍼런스 서열 내의 뉴크레오타이드 서열 중에 개별적으로 산재된 이들 말단 부위 사이, 또는 레퍼런스 서열 내의 하나 이상의 인접한 군에서 일어날 수 있다.
실질적으로, 특정한 핵산 분자가 예를 들어 도 2A-B (서열번호 2 및 19)에 나타난 뉴크레오타이드 서열 또는 상기 기재된 기탁된 cDNA 클론의 뉴크레오타이드 서열과 적어도 90%, 95%, 96%, 97%, 98% 또는 99% 동일한지는 Bestfit 프로그램(Wisconsin Sequence Analysis Package, Version 8 for Unix, Genetics Computer Group, University Research Park, 575 Science Drive, Madison, Wis. 53711)과 같은 공지된 컴퓨터 프로그램을 사용하여 통상적으로 결정할 수 있다. Bestfit는 두 서열사이에 동일성의 부위를 발견하기 위하여 Smith 및 Waterman의 국소 상동성 알고리즘, Advances in Applied Mathematics 2: 482-489 (1981)을 사용한다. 특정 서열이 예를 들어 본 발명의 레퍼런스 트런케이트된 ALK 폴리뉴크레오타이드 서열 또는 EML4-ALK 융합 폴리뉴크레오타이드 서열과 95% 동일한지를 결정하기 위하여 Bestfit 또는 다른 서열 배열 프로그램을 사용할 때, 레퍼런스 서열 내 전체 뉴크레오타이드의 수의 5%까지의 동일성의 차가 허용되고 레퍼런스 뉴크레오타이드 서열의 전장에 대하여 동일성의 퍼센트가 계산되게 그 계수들은 조정된다.
본 발명은 그들이 ALK 카이네이즈 활성을 가지는 폴리펩타이드를 코딩하든지에 상관없이 도 2에 나타낸 핵산 서열(서열번호 2) 또는 기탁된 cDNA의 핵산 서열과 적어도 90%, 95%, 96%, 97%, 98% 또는 99% 동일한 핵산 분자들을 그 범위에 포함한다. 이것은 ALK 카이네이즈 활성을 가지는 융합 폴리펩타이드를 코딩하지 아니하는 특정한 핵산 분자가 있더라도 예를 들어 당업자가 교잡 프로브 또는 중합효소 연쇄반응(PCR) 프라이머로 그 핵산 분자를 사용하는 방법을 알기 때문이다. 카이네이즈를 가지는 폴리펩타이드를 코딩하지 아니하는 본 발명의 핵산 분자의 용도는 특히 (1) cDNA 라이브러리에서 EML4-ALK 결손 유전자 또는 트런케이트된 ALK 유전자 또는 그것의 유전자좌 변이체를 분리; (2) Verma 외, Human Chromosomes: A Manual of Basic Techniques, Pergamon Press, New York (1988)에 기재된 바와 같이 EML4-ALK 결손 유전자 또는 트런케이트된 ALK 유전자의 정확한 염색체 위치를 제공하기 위한 중기 염색체 스프리드에 대한 인 시튜 교잡(예를 들어 "FISH"); 및 특정 조직에서 EML4-ALK 융합 단백질 또는 트런케이트된 ALK 카이네이즈 mRNA 발현을 검출하기 위한 노던 블럿 분석을 포함한다.
그러나 바람직하게는 사실상 본 발명의 돌연변이체 ALK 폴리펩타이드 또는 카이네이즈 활성을 가지는 융합 폴리펩타이드를 코딩하는 기탁된 cDNA의 핵산 서열과 적어도 95% 동일한 서열을 가지는 핵산 분자가 바람직하다. 그러한 활성은 특정한 생물학적 분석에서 측정된 것과 같은 여기에 기재된 EML4-ALK 융합 단백질(전장 단백질, 성숙형 단백질, 또는 카이네이즈 활성을 가진 단백질 절편)의 활성과 유사하나 반드시 동일할 필요는 없다. 예를 들어 ALK의 카이네이즈 활성은 예를 들어 ALK 카이네이즈에 대한 기질인 인슐린 수용체 기질 1 또는 2 (IRS1, IRS2)과 같은 펩타이드 기질을 갖는 하나 이상의 타이로신을 인산화하는 능력을 결정하여서 조사될 수 있다.
유전자 코드의 디제너러시로 인하여, 당업자는 기탁된 cDNA 또는 도 2A-B에 나타낸 핵산 서열(서열번호 2 및 19)의 핵산 서열과 적어도 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가진 많은 핵산 서열은 ALK 카이네이즈 활성을 가지는 돌연변이체 폴리펩타이드를 코딩할 것이라는 것을 즉시 알 것이다. 사실 이들 뉴크레오타이드 서열의 디제너레이트 변이체 모두는 동일한 폴리펩타이드를 코딩하므로, 이것은 상기 기재된 비교 분석을 수행하지 않아도 당업자에 명백할 것이다. 디제너레이트 변이체가 아닌 그러한 핵산 분자에 대하여 합리적인 수가 또한 ALK 카이네이즈 활성을 보유하는 폴리펩타이드를 코딩할것이라고 인식될 것이다. 이것은 당업자가 현저하게 단백질의 기능에 영향을 미치지 아니하거나 덜 영향을 미치는 아미노산 대체(예를 들어 한 지방성 아미노산을 다른 지방성 아미노산으로 대체)을 완전하게 알고 있기 때문이다.
예를 들어, 표현형적으로 사일런트 아미노산 대체를 만드는 것과 관련된 가이드는 Bowie 외, "Deciphering the Message in protein Sequences: Tolerance to amino acid Substitutions," Science 247: 1306-1310 (1990)에 기재되었고, 그것은 변형하는 아미노산 서열의 토러런스를 연구하기 위한 두 주된 접근을 기재한다. 첫번째 방법은 돌연변이가 자연선택으로 수용되든지 거절되는 진화의 과정에 의존한다. 두번째 접근은 기능성을 유지하는 서열들을 동정하기 위한 스크리닝 또는 선택 및 클론된 유전자의 특정 위치에서 아미노산 변경을 소개하는 유전공학을 사용한다. 이들 연구들은 단백질들이 아미노산 대체의 놀라운 내성을 나타낸다. 그러한 기술에 익숙한 당업자는 아미노산 변경들이 그 단백질의 특정 위치에서 수용가능할 것이라는 것을 평가한다. 예를 들어 대부분 묻혀진 아미노산 잔기들은 비극성 곁사슬을 필요로 하고, 표면 곁사슬은 일반적으로 거의 보존되지 아니한다. 다른 그러한 표현형적으로 사일런트 대체는 상기 Bowie 외에 기재되고 여기에 레퍼런스로 인용한다.
당업계에 주지되고 일반적으로 가능한 DNA 서열분석 방법은 본 발명의 폴리뉴크레오타이드 구체예를 실행하는데 사용될 수 있다. 그 방법들은 DNA 중합효소 I의 Klenow 절편, SEQUENASE®(US Biochemical Corp, Cleveland, Ohio), Taq 중합효소 (Perkin Elmer), 열안정 T7 중합효소(Amersham, Chicago, IL), 또는 재조합 중합효소와 Gibco BRL (Gaithersburg, Md.)에 의하여 판매되는 ELONGASE증폭 시스템과 같은 교정 엑소뉴크리에이즈의 조합과 같은 효소를 채택할 수 있다. 바람직하게는 그 과정은 Hamilton Micro Lab 2200 (Hamilton, Reno, Nev.), Peltier Thermal Cycler (PTC200; MJ Research, Watertown, Mass.) 및 ABI 377 DNA 시퀀서(Perkin Elmer)와 같은 기계로 자동화된다.
본 발명의 돌연변이체 LK 폴리펩타이드를 코딩하는 폴리뉴크레오타이드는 프로모터와 조절 요소와 같은 업스트림 서열을 검출하는 것으로 당업계에 알려진 여러 방법들을 채택하고 부분 핵산 서열을 이용하여 확장될 수 있다. 예를 들어 채택될 수 있는 한 방법인, "제한-자리" PCR은 알려진 위치에 인접한 미지 서열을 회수하기 위하여 유니버셜 프라이머를 사용한다(Sarkar, G., PCR Methods Applic . 2: 318-322 (1993)). 특히 지노믹 DNA는 공지된 부위에 특이적인 프라이머와 링커 서열에 프라이머의 존재로 먼저 증폭된다. 예시적인 프라이머들은 실시예 2에 기재된 것이다. 그 증폭된 서열들은 첫번의 내부 특정 프라이머와 동일한 링커 프라이머로 2 라운드의 PCR을 수행한다. 각 라운드의 PCR 산물은 적절한 RNA 중합효소로 전사되고 역전사 효소를 사용하여 서열화한다.
역 PCR은 공지된 부위에 기초한 다른 프라이머들을 사용하여 증폭되거나 확정될 수 있다(Triglia 외, Nucleic Acids Res . 16: 8186 (1988)). 그 프라이머들은 OLIGO 4.06 프라이머 분석 소프트웨어 (National Biosciences Inc., Plymouth, Minn.), 또는 또다른 적절한 프로그램을 사용하여 고안되고 22-30 뉴크레오타이드 길이로, 50% 이상의 GC 양을 가지고 약 68-72℃ 온도에서 타겟 서열에 어닐링되게 고안된다. 그 방법은 한 유전자의 공지된 부위에서 적당한 절편을 생성하기 위하여 몇개의 제한 효소를 사용한다. 그 절편은 그 다음에 분자내 라이게인셩에 의하여 원형화되고 PCR 주형으로 사용된다.
사용될 수 있는 또다른 방법은 인간 및 효모 인공 염색체 DNA에서 알려진 서열에 인접한 DNA 절편의 PCR증폭에 관련된 캡쳐 PCR이다(Lagerstrom 외, PCR Methods Applic . 1: 111-119 (1991)). 이 방법에서 다중 제한 효소 처리 및 라이게이션은 PCR을 수행하기 전에 DNA 분자의 미지 부분에 가공된 이중 가닥 서열을 위치하는데 사용될 수 있다. 미지 서열을 회수하는데 사용될 수 있는 또다른 방법 은 Parker 외, Nucleic Acids Res . 19: 3055-3060 (1991))에 기재된다. 또 지노믹 DNA (Clontech, Palo Alto, Calif.)를 워크하기 위하여 PCR, 네스티드 프라이머, 및 PROMOTERFINDER® 라이브러리를 사용할 수 있다. 이 과정은 스크리닝 라이브러리가 필요가 없고 인트론/엑손 결합점의 발견에 유용하다.
전장 cDNA를 스크리닝할 때, 더 큰 cDNA를 포함하는 크기 선택된 라이브러리를 사용하는 것이 바람직하다. 또한, 랜덤-프라임된 라이브러리는 그들이 유전자의 5' 부위를 포함하는 더 큰 서열들을 포함하고 있다는 점에서 바람직하다. 랜덤하게 프라임된 라이브러리의 사용은 올리고 d(T) 라이브러리가 전장 cDNA를 내지 못하는 상황에 더욱 바람직할 수 있다. 지노믹 라이브러리는 5' 및 3' 비-전사된 조절 부위로 서열의 확장에 유용할 수 있다.
통상적으로 가능한 모세관 전기영동은 PCR 산물들 또는 시퀀싱의 뉴크레오타이드 서열을 확인하고 크기를 분석하는데 사용될 수 있다. 특히 모세관 시퀀싱은 전기영동 분리를 위한 유동 고분자, 레이져 활성화된 네 가지 다른 형광염료(각 뉴크레오타이드 당 하나) 및 차지 커플된 장치 카메라에 의하여 방출된 파장의 검출을 채택할 수 있다. 아웃풋/광 강도는 적당한 소프트웨어(예를 들어 GENOTYPER® 및 SEQUENCE NAVIGATOR® Perkin Elmer)를 사용하여 전기 신호로 전환될 수 있고 샘플 로딩으로부터 컴퓨터 분석 및 전자 데이터 디스플레이로의 모든 과정은 컴퓨터 조절될 수 있다. 모세관 전기영동은 특정 샘플에 제한된 양 존재하는 작은 조각의 DNA의 시퀀싱에 특히 바람직하다.
C. 벡터 및 숙주 세포들.
본 발명은 또한 본 발명의 분리된 폴리뉴크레오타이드를 포함하는 재조합 벡터, 상기 재조합 벡터로 유전적으로 가공된 숙수세포 및 재조합 기술들에 의한 재조합 EML4-ALK 폴리펩타이드들 또는 그것의 절편의 생성을 제공한다.
재조합 컨스트럭트는 감염, 트랜스덕션, 트랜스팩션, 트랜스벡션, 전기천공 및 형질전환과 같은 주지 기술들을 사용하여 숙주세포로 들어갈 수 있다. 예를 들어 그 벡터는 파지, 프라즈미드, 바이러스 또는 레트로바이러스 벡터일 수 있다. 레트로바이러스 벡터들은 복제 가능 또는 복제결손일 수 있다. 후자의 경우, 일반적으로 바이러스 증식은 단지 숙주세포를 보완하여서만 일어날 것이다.
그 폴리뉴크레오타이드들은 숙주에서 증식을 위한 선택 마커를 포함한 벡터에 연결될 수 있다. 일반적으로 프라즈미드 벡터는 인산칼슘 침전체와 같은 침전체 또는 차지된 지질과 복합체로 투입된다. 만약 벡터가 바이러스이면 적당한 패키징 세포주를 사용하여 포장되어 숙주 세포들에 트랜스덕션될 수 있다.
흥미있는 폴리뉴크레오타이드의 시스-액팅 조절 부위를 포함하는 벡터가 바람직하다. 적당한 트랜스-액팅 인자들은 숙주, 보완하는 벡터 또는 숙주로 투입되는 벡터 그 자체에 의하여 제공된다. 이와 관련된 바람직한 구체예에서 상기 벡터들은 유도적 및/또는 세포 타입 특이적인 특정한 발현을 제공한다. 그러한 벡터 중에 온도 및 영양 첨가제와 같은 조작하기 용이한 환경 인자에 의하여 유도될 수 있는 것이 특히 바람직하다.
본 발명에서 유용한 발현벡터는 염색체-, 에피조말- 및 예를 들어 박테리아 프라즈미드, 박테리오파지, 효모 에피좀, 효모 염색체 요소, 배쿨로바이러스, 파포바 바이러스, 백시니아 바이러스, 아데노바이러스, 계두 바이러스, 위공수병 바이러스, 및 레트로바이러스로부터 유래한 벡터와 같은 바이러스 유래된 벡터들 및 코스미드 및 파지미드와 같은 그것의 결합을 포함한다.
본 발명의 EML4-ALK 폴리뉴크레오타이드를 포함하는 그 DNA 삽입체는 파지 람다 PL 프로모터, 대장균 lac, trp 및 tac 프로모터, SV40 초기 및 후기 프로모터 및 레트로바이러스 LTR의 프로모터와 같은 적절한 프로모터로 기능적으로 연결된다. 다른 적절한 프로모터들이 당업자에 공지된다. 그 발현 컨스트럭트는 전사 시작, 종결 및 전사된 지역에서 번역을 위한 리보좀 결합 자리를 위한 자리들을 더욱 포함할 것이다. 그 컨스트럭트에 의하여 발현된 성숙형 전사체들의 코딩 부위는 번역되는 폴리펩타이드의 말단에 적당하게 위치된 종결 코돈(UAA, UGA 또는 UAG)과 시작 코돈에서 시작하는 번역을 포함할 것이다.
기재된 바와 같이, 그 발현 벡터는 바람직하게는 적어도 하나의 선택 마커를 포함할 것이다. 그러한 마커들은 진핵세포 배앵을 위해서는 다이하이드로폴레이트 러덕테이즈 또는 네오마이신 저항성, 대장균 및 다른 세균에 대해서는 테트라사이클린 또는 앰피실린 저항성 유전자를 포함할 것이다. 적당한 숙주의 대표적인 예들은 E. coli, Streptomyces 및 Salmonella typhimurium 세포와 같은 박테리아 세포; 효모 세포와 같은 균류 세포; Drosophila S2 및 Spodoptera Sf9 세포와 같은 곤충세포;CHO, COS 및 Bowes 흑색종 세포와 같은 동물세포; 및 식물세포들을 포함하나 이에 한정되지 아니한다. 상기 숙주세포들에 대한 적당한 배양 배지 및 조건은 당업계에 공지되었다.
박테리아에 사용되기에 바람직한 벡터 중 Qiagen으로부터 구입할 수 있는 pQE70, pQE60 and pQE-9; Stratagene으로부터 구입할 수 있는 pBS 벡터, Phagescript 벡터, Bluescript 벡터, pNH8A, pNH16a, pNH18A, pNH46A; 및 Pharmacia로부터 구입할 수 있는 ptrc99a, pKK223-3, pKK233-3, pDR540, pRIT5를 포함한다. 바람직한 진핵세포 벡터 중에는 Stratagene으로부터 구입할 수 있는 pWLNEO, pSV2CAT, pOG44, pXT1 및 pSG; 그리고 Pharmacia로부터 구입할 수 있는 pSVK3, pBPV, pMSG 및 pSVL이다. 다른 적당한 벡터들은 당업자에게 용이한 것이 명백할 것이다.
본 발명에서 사용하기에 적합한 공지된 박테리아 프로모터 중에서 E. coli lacI 및 lacZ 프로모터, T3 및 T7 프로모터, gpt 프로모터, 람다 PR 및 PL 프로모터 및 trp 프로모터를 포함한다. 적당한 진핵세포 프로모터들은 CMV 즉각 조기 프로모터(immediate early promoter), HSV 티미딘 카이네이즈 프로모터, 조기 및 후기 SV40 프로모터, Rous sarcoma virus (RSV)의 것과 같은 레트로바이러스 LTR의 프로머터, 및 마우스 metallothionein-I 프로모터와 같은 메탈로싸이오네인 프로머터를 포함한다.
효묘인 Saccharomyces cerevisiae에서 알파 인자, 알콜 옥시데이즈 및 알파 팩터, 알코올 옥시데이즈, 및 PGH와 같은 컨스티투티브 또는 유도적인 프로모터를 포함한 다수의 벡터들이 사용될 수 있다. 리뷰를 위해서는 Ausubel 외 (1989) Current Protocols in Molecular Biology, John Wiley & Sons, New York, N.Y, and Grant 외, Methods Enzymol . 153: 516-544 (1997) 참고.
숙주 세포에 그 컨스트럭트의 투입은 인산칼슘 트랜스팩션, DEAE-덱스트란 매개된 트랜스팩션, 양이온성 지질-매개된 트랜스팩션, 전기천공, 트랜스덕션, 감염 또는 다른 방법들에 의하여 가능할 수 있다. 그러한 방법들은 Davis 외, Basic Methods In Molecular Biology (1986)와 같은 많은 표준 실험실 매뉴얼에 기재된다.
고등 진핵생물체에 의한 본 발명의 EML4-ALK 융합 폴리펩타이드를 코딩하는 DNA의 전사는 벡터에 인핸서를 삽입하여 증가될 수 있다. 인핸서는 주어진 세포 타입에서 프로모터의 전사활성을 증가시키기 위하여 종종 약 10에서 300 bp인 DNA의 시스-액팅 구성요소이다. 인핸서의 예들은 100 에서 270 베이스페어에서 복제 오리진의 레이트 부분에 위치한 SV40 인핸서, 사이토메갈로바이러스 조기 프로모터 인핸서, 복제 오리진의 레이트 부분의 폴리오마 인핸서 및 아데노바이러스 인핸서를 포함한다.
소포체 루멘, 세포외질 또는 세포외 환경으로 번역된 단백질의 분비를 위하여 적당한 분비 신호가 발현된 폴리펩타이드에 삽입될 수 있다. 그 신호들은 폴리펩타이드에 내생적이거나 이종성 신호일 수 있다.
상기 폴리펩타이드는 융합 단백질 (예를 들어 GST-융합)과 같은 변형된 형태로 발현될 수 있고 된 폴리펩타이드, 분비 신호뿐 아니라 부가적인 이종 기능성 부위를 포함할 수 있다. 예를 들어 부가적인 아미노산들, 특히 차지된 아미노산들의 부위는 정제 동안 또는 차후 조작 및 저장 동안에 숙주세포에서 안정성 및 지속성을 개량하기 위하여 폴리펩타이드의 N-말단에 첨가될 수 있다. 또한 펩타이드 부분은 정제를 용이하게 하기 위하여 폴리펩타이드에 부가될 수 있다. 그러한 부위는 폴리펩타이드의 제조 전에 제거될 수 있다. 다른 것 중에서 분비 및 배출을 가능하게 하기 위한, 안정성을 개량하기 위한 그리고 정제를 용이하게 하기 위한 폴리펩타이드들에 펩타이드 부위의 부가는 당업계에서 익숙하고 일상적인 기술이다. 바람직한 융합 단백질은 단백질들을 가용하게 하는데 유용한 면역글로불린으로부터 유래한 이종성 부위를 포함한다.
EML4-ALK 융합 폴리펩타이드은 황산 암모늄 또는 에탄올 침전, 산 추출, 음이온 또는 양이온 교환 크로마토그래피, 포스포셀루로스 크로마토그래피, 소수성 상호작용 크로마토그래피, 친화 크로마토그래피, 하이드록시아파테이트 크로마토그래피 및 렉틴 크로마토그래피를 포함하는 주지된 방법에 의하여 재조합 세포 배양으로부터 회수되고 정제될 수 있다. 가장 바람직하게는 고성능 액체 크로마토그래피("HPLC")를 정체에 채택한다. 본 발명의 폴리펩타이드들은 천연적으로 정제된 산물, 화학적 합성 과정의 산물, 및 예를 들어 박테리아, 효모, 고등식물, 곤충 및 포유류 세포를 포함하는 원핵 또는 진핵 숙주로부터 재조합 기술에 의하여 생성된 산물들을 포함한다. 재조합 생산 기술에서 채택된 숙주에 따라서, 본 발명의 폴리펩타이드들은 당화되거나 비당화될 수 있다. 또 본 발명의 폴리펩타이드들은 숙주-매개된 과정의결과로 일부에서는 시작 변형된 메티오닌을 포함할 수 있다.
따라서 일 구체예에서, 본 발명은 그 융합 폴리펩타이드의 발현에 적합한 조건 하에서 재조합 숙주세포(상기 기재한 것과 같은)을 배양하고 그 폴리펩타이드를 회수하여 ML4-ALK 융합 폴리펩타이드를 생성하는 방법을 제공한다. 숙주 세포의 성장에 적합한 배양 조건 및 그러한 세포들로부터 재조합 폴리펩타이드들의 발현은 당업계에 주지된다. Current Protocols in Molecular Biology, Ausubel FM 외, eds., Volume 2, Chapter 16, Wiley Interscience 참조.
D. 분리된 폴리펩타이드들 .
본 발명은 또한 분리된 돌연변이체 ALK 카이네이즈 폴리펩타이드들 및 그것의 절편을 제공한다. 일 구체예에서, 본 발명은
(a)서열번호 1 또는 서열번호 18의 아미노산 서열을 포함하는 EML4-ALK 융합 폴리펩타이드를 코딩하는 아미노산 서열;
(b) EML-4의 N-말단 아미노산 서열 (서열번호 3의 잔기 1-233 또는 서열번호 3의 잔기 1-495) 및 ALK의 카이네이즈 도메인(서열번호 5의 잔기 1116-1383)를 포함하는 EML4-ALK 융합 폴리펩타이드를 코딩하는 아미노산 서열; 및
(c) EML4-ALK 융합 폴리펩타이드의 융합 접합점(서열번호 1의 잔기 233-234 또는 서열번호 18의 잔기 495-496)를 포함하는 적어도 여섯개의 인접한 아미노산 서열을 포함하는 폴리펩타이드를 코딩하는 아미노산 서열로 구성된 군으로부터 선택된 서열과 적어도 95% 동일한 아미노산 서열을 포함하는 분리된 폴리펩타이드를 제공한다.
바람직한 일 구체예에서, 본 발명의 재조합 돌연변이체 ALK 폴리펩타이드들은 상기 기재한 것과 같은 재조합 벡터와 재조합 숙주세포를 사용하여 생성될 수 있다.
EML4-ALK 융합 폴리펩타이드 또는 트런케이트된 활성 ALK 카이네이즈 폴리펩타이드의 일부 아미노산 서열은 돌연변이체 단백질의 기능 또는 구조의 현저한 영향이 없이 변화될 수 있다는 것은 당업계에 인지될 것이다. 만약 서열에서 그러한 차이가 고려된다면 활성을 결정하는 단백질(예를 들어 ALK의 카이네이즈 도메인)에 대한 결정적인 지역이 될 것이다. 일반적으로 유사한 기능을 수행하는 잔기가 사용된다면 3차 구조를 형성하는 잔기들을 대체하는 것이 가능하다. 다른 예에서 잔기의 타입은 그 단백질의 중요하지 않은 부위에서 변경이 일어난다면 완전하게 중요하지 않을 수 있다.
따라서 본 발명은 하기 기재된 단백질 부위와 같은 EML-4 또는 ALK 단백질들의 다른 부위를 포함하거나 실질적인 ALK 카이네이즈 활성을 보유한 EML4-ALK 융합 폴리펩타이드의 변이체를 더욱 포함한다. 그러한 돌연변이체는 결손, 삽입, 역위, 반복 및 타입 대체(예를 들어 한 친수성 잔기를 또 다른 것으로 대체하나 대개 강한 소수성에 대하여 강한 친수성이 아닌)를 포함한다. 작은 변화 또는 그러한 "중성" 아미노산 대체는 활성에 거의 영향이 없다.
전형적으로 보존성 대체로 지방성 아미노산들 중 Ala, Val, Leu 및 Ile의 하나에서 또다른 하나로 대체; 하이드록시 잔기 Ser 및 Thr의 상호교환, 산성 잔기인 Asp 및 Glu의 교환, 아마이드 잔기인 Asn 및 Gln 사이의 대체, 염기성 잔기인 Lys 및 Arg의 교환 그리고 방향성 잔기인 Phe, Tyr 사이의 대체가 있다. 당업자에 공지된 보존성 대체의 예들은: 방향성: 페닐알라닌 트립토판, 타이로신; 소수성:루신, 이소루신, 발린;극성:글루타민, 아스파라긴; 염기성:알기닌, 라이신, 히스티딘; 산성:아스파트산, 글루탐산; 작은: 알라닌, 세린, 쓰레오닌, 글라이신. 상기에서 상술한 바와 같이, 표현형적으로 사일런트할 수 있는 아미노산 변화(즉 기능에 대한 현저한 해로운 효과를 나타내지 아니하는 것 같은)와 관련된 더 많은 안내는 상기 Bowie 외, Science 247에서 발견된다.
본 발명의 폴리펩타이드들은 바람직하게는 분리된 형태 그리고 바람직하게는 실질적으로 정제되어 제공된다. 본 발명의 EML4-ALK 융합 폴리펩타이드의 재조합적으로 생성된 버전은 Smith 및 Johnson, Gene 67: 31-40 (1988)에 기재된 원스템 방법에 의하여 실질적으로 정제될 수 있다.
본 발명의 폴리펩타이드들은 도 2A-B의 EML4-ALK 융합 폴리펩타이드(서열번호 1 및 18) (리더 서열을 포함하거나 또는 아니거나), EML-4의 N-말단 아미노산 서열 (서열번호 3의 잔기 1-233 또는 서열번호 3의 잔기 1-495) 및 ALK의 카이네이즈 도메인(서열번호 5의 잔기 1116-1383)를 포함하는 EML4-ALK 융합 폴리펩타이드를 코딩하는 아미노산 서열; 및 EML4-ALK 융합 폴리펩타이드(도 1A-B, 하단 패널 참고)의 융합 접합점(서열번호 1의 잔기 233-234 또는 서열번호 18의 잔기 495-496)를 포함하는 적어도 여섯개의 인접한 아미노산 서열을 포함하는 폴리펩타이드를 코딩하는 아미노산 서열 뿐 아니라 상기 기재된 것과 적어도 90% 유사성, 바람직하게는 적어도 95% 유사성, 더욱 바람직하게는 적어도 96%, 97%, 98% 또는 99% 유사성을 가지는 폴리펩타이드를 포함한다.
두 폴리펩타이드들에 대한 "% 유사성"은 Bestfit 프로그램(Wisconsin Sequence Analysis Package, Version 8 for Unix, Genetics Computer Group, University Research Park, 575 Science Drive, Madison, Wis. 53711) 및 유사성을 결정하기 위한 디폴트 세팅을 사용하여 두 폴리펩타이드의 아미노산 서열을 비교하여 생성된 유사성 스코어이다. Bestfit는 두 서열 사이의 유사성의 최고 분절을 발견하기 위하여 Smith 및 Waterman (Advances in Applied Mathematics 2: 482-489 (1981))의 국소 알고리즘을 사용한다.
예를 들어 본 발명의 EML4-ALK 융합 폴리펩타이드의 레퍼런스 아미노산 서열과 적어도 95% "동일한" 아미노산 서열을 가지는 폴리펩타이드는 폴리펩타이드 서열의 아미노산 서열이 돌연변이체 ALK 폴리펩타이드의 레퍼런스 아미노산 서열의 각 100 아미노산 당 최대 다섯개의 포인트 돌연변이를 포함할 수 있는 것을 제외하곤 레퍼런스 아미노산 서열과 동일하다는 것을 의미한다. 다른 용어로, 레퍼런스 아미노산 서열과 적어도 95% 동일한 아미노산 서열을 가지는 폴리펩타이드를 얻는 것은 레퍼런스 서열의 아미노산들 중 최대 5%가 결손되거나 또다른 아미노산으로 대체될 수 있거나 레퍼런스 서열 내의 전체 아미노산의 최대 5%에 해당하는 아미노산이 레퍼런스 서열에 삽입될 수 있다는 것이다. 그 레퍼런스 서열의 이들 돌연변이는 레퍼런스 아미노산 서열의 아미노 또는 카르복시 말단 부위 또는 이들 말단 부위 사이, 또는 레퍼런스 서열 내의 하나 이상의 인접한 군에서 개별적으로 산재되어 일어날 수 있다.
특정 서열이 예를 들어 본 발명의 레퍼런스 서열과 95% 동일한지를 결정하기 위하여 Bestfit 또는 다른 서열 배열 프로그램을 사용할 때, 레퍼런스 서열 내 전체 아미노산 잔기들의 수의 5%까지의 동일성의 차가 허용되고 레퍼런스 아미노산 서열의 전장에 대하여 동일성의 퍼센트가 계산되게 그 계수들은 조정된다.
본 발명의 EML4-ALK 융합 폴리펩타이드는 예를 들어 당업자에 주지된 방법을 사용하는 SDS-PAGE 젤에 대한 또는 분자체 젤 여과에 대한 분자량 마커로서 사용될 수 있다. 하기에서 상술하는 것과 같이, 본 발명의 폴리펩타이드들은 돌연변이체 ALK 단백질의 기능/활성을 증진 또는 저해할 수 있는 작동제 및 길항제로 또는 하기 상술한 것과 같이 돌연변이체 ALK 폴리펩타이드 발현을 검출하는 분석에서 사용하는 폴리클론 및 단클론 항체 또는 트런케이트된 폴리펩타이드와 같은 특이적인 융합 폴리펩타이드 특이적인 물질들을 생성하는데 사용될 수 있다. 또 그러한 폴리펩타이드들은 본 발명의 작동제 또는 길항제 후보물질인 EML4-ALK 융합 폴리펩타이드 또는 트런케이트된 ALK 카이네이즈 폴리펩타이드 결합 단백질들을 “포착”하기 위한 효모 투-하이브리드 시스템에서 사용될 수 있다. 효모 투 하이브리드 시스템은 Fields 및 Song, Nature 340: 245-246 (1989)에 기재된다.
또 다른 면에서, 본 발명은 예를 들어 EML4-ALK 융합 폴리펩타이드의 융합 접합점 (도 1A-B, 하단 패널 참고)을 포함하는 에피토프인 본 발명의 폴리펩타이드의 에피토프-포함 부위를 포함하는 펩타이드 또는 폴리펩타이드를 제공한다. 이 폴리펩타이드 부위의 에피토프는 본 발명의 폴리펩타이드의 면역성 또는 항원성 에피토프이다. "면역성 에피토프"는 전체 단백질이 면역원인 경우에 항체 반응을 야기하는 단백질의 부분으로 정의된다. 이들 면역성 에피토프는 분자상의 소수 위치에 한정되는 것으로 믿어진다. 한편 항체에 결합할 수 있는 단백질 분자의 부위를 "항원성 에피토프"로 정의된다. 한 단백질의 면역성 에피토프의 수는 통상적으로 항원성 에피토프의 수보다 적다. 예를 들어 Geysen 외, Proc . Natl . Acad . Sci . USA 81:3998-4002 (1983)를 참고. 본 발명의 융합 폴리펩타이드-특이적인 항체들의 생성은 하기에서 더욱 상세하게 기재된다.
항원성 에피토프-포함하는 펩타이드 또는 폴리펩타이드들에 의하여 야기된 항체들은 유사 단백질을 검출하는데 유용하고, 여러 펩타이드들에 대한 항체들은 번역후 가공을 수행하는 단백질 전구체의 여러 부위의 운명을 추적하는데 유용할 수 있다. 펩타이드들 및 항-펩타이드 항체들은 심지어 짧은 펩타이드들(예를 들어 약 9 아미노산들)이 면역침전 분석에서 더 큰 펩타이드들에 결합하고 대체할 수 있다는 것을 보였기 때문에 예를 들어 경쟁 분석에서 유사(mimicked) 단백질에 대한 다양한 정성 및 정량 분석에 사용될 수 있다. 예를 들어 Wilson 외, Cell 37: 767-778 (1984)에서 777쪽 참고. 본 발명의 항-펩타이드 항체들은 또한 예를 들어 당업계에 주지된 방법들을 사용하는 흡착 크로마토그래피에 의하여 유사 단백질의 정제에 유용하다. 면역학적 분석 포맷은 하기에서 더욱 상세하게 설명한다.
재조합 돌연변이체 ALK 폴리펩타이드들은 본 발명의 범위 내에 속하고 상기 섹션 B에 기재된 것과 같이 본 발명의 폴리뉴크레오타이드들을 사용하여 제조될 수 있다. 예를 들어 본 발명은 융합 폴리펩타이드의 발현에 적합한 조건 하에서 재조합 숙주세포(상기에 기재된 것과 같은)를 배양하고 그 폴리펩타이드를 회수하여 재조합 EML4-ALK 융합 폴리펩타이드를 생산하는 방법을 제공한다. 숙주 세포의 성장에 적합한 배양 조건 및 그러한 세포들의 재조합 폴리펩타이드들의 발현은 당업잗르에 주지된다.
E. 돌연변이체-특이적인 시약( Reagent )들
기재된 방법들의 실행에 유용한 돌연변이체 ALK 폴리펩타이드-특이적인 시약들은 다른 것들 중에서 포유류 고형 육종 또는 암 종양과 같은 암으로부터 얻은 생물학적 샘플에서 EML4-ALK 융합 폴리펩타이드 발현의 검출 및 정량화에 적합하고 해당하는 AQUA 펩타이드(중-동위원소 포지된 펩타이드들) 및 융합 폴리펩타이드 특이적인 항체들을 포함한다. 또한 본 발명의 트런케이트된 ALK 카이네이즈 폴리뉴크레오타이드 또는 폴리펩타이드의 존재 또는 부존재를 검출하는데 적합한 항체, AQUA 펩타이드 또는 핵산 프로브와 같은 트런케이션-특이적인 시약들도 유용할 것이다. 융합 폴리펩타이드-특이적인 시약은 생물학적 샘플에서 발현된 EML4-ALK 융합 폴리펩타이드의 존재/레벨을 정량화 및/또는 검출하는 특이적으로 결합할 수 있는 생물학적 또는 화학적 시약이다. 그 용어는 바람직한 항체 및 하기에 기재된 AQUA 펩타이드 시약들을 포함하나 이에 한정되지 아니하고 동등한 시약들도 본 발명의 범위 내에 있다.
항체들.
본 발명의 방법의 실행에 적합한 시약들은 EML4-ALK 융합 폴리펩타이드-특이적인 항체 및 TFG-ALK 융합 폴리펩타이드-특이적인 항체를 포함한다. 본 발명의 융합-특이적인 항체는 본 발명의 EML4-ALK 융합 폴리펩타이드(예를 들어 서열번호 1)에 특이적으로 결합하나 야생형 EML-4 또는 야생형 ALK에는 실질적으로 결합하지 아니하는 분리된 항체 또는 항체들이거나, 여기에 기재된 TFG-ALK 융합 폴리펩타이드(예를 들어 서열번호 20)에 특이적으로 결합하나 야생형 TFG 또는 야생형 ALK에는 실질적으로 결합하지 아니하는 분리된 항체 또는 항체들이다. 다른 적당한 시약들은 야생형 ALK 단백질 서열의 세포외 도메인(여기에 기재된 트런케이트되고 활성화된 ALK 카이네이즈에는 존재하지 않는 도메인)의 에피토프에 특이적으로 결합하는 에피토프-특이적인 항체들을 포함하고, 따라서 샘플 내의 야생형 ALK의 존재(또는 부존재)를 검출할 수 있다.
인간 EML4-ALK 또는 TFG-ALK 융합 폴리펩타이드-특이적인 항체들은 예를 들어 쥐 또는 토끼 및 그 반대인 다른 포유류 종에서 매우 동종이고 균등한 에피토프 펩타이드 서열에 결합할 수 있다. 본 발명의 방법을 실행하는데 유용한 항체들은 (a) 단클론 항체들, (b) EML4-ALK 융합 폴리펩타이드 (도 1A-B, 하단 패널 참고) 또는 TFG-ALK 융합 폴리펩타이드 (도 1C, 하단 패널 참고)의 융합 접합점과 같은 타겟 폴리펩타이드에 특이적으로 결합하는 정제된 폴리클론 항체들, (c) 다른 인간을 제외한 종(예를 들어 마우스, 랫트)에서 동등하고 매우 동종 에피토프 또는 인산화 자리에 결합하는 상기(a)-(b)에 기재된 것과 같은 항체 및 (d) 여기에 기재된 예시적인 항체에 의하여 결합된 항원(더욱 바람직하게는 에피토프)에 결합하는 상기(a)-(c)의 절편을 포함한다.
여기에 사용된 "항체" 또는 “항체들”은 IgG, IgM, IgA, IgD, 및 IgE를 포함하는 모든 타입의 면역글로불린을 의미한다. 그 항체들은 단클론 또는 폴리클론일 수 있고, (예를 들어) 마우스, 랫트, 토끼, 말, 또는 인간을 포함하는 기원의 종들일 수 있거나 키메릭 항체들일 수 있다. 예를 들어 M. Walker 외, Molec . Immunol. 26: 403-11 (1989); Morrision 외, Proc . Nat'l . Acad . Sci . 81: 6851 (1984); Neuberger 외, Nature 312: 604 (1984))를 참고. 그 항체들은 미국특허 제 4,474,893호(Reading) 또는 미국특허 제 4,816,567호(Cabilly 외)에 기재된 방법에 따라서 생성된 재조합 단클론 항체들일 수 있다. 그 항체들은 미국특허 제 4,676,980호(Segel 외)에 기재된 방법에 따라 제조된 화학적으로 구축된 특정 항체들일 수도 있다.
본 발명의 EML4-ALK 융합 폴리펩타이드 특이적인 항체의 바람직한 에피토프 자리는 인간 EML4-ALK 융합 폴리펩타이드 서열(서열번호 1 및 18)의 약 11에서 17 아미노산을 필수적으로 포함하는 펩타이드 절편이고, 그 절편은 짧은 변이체 융합단백질에서 잔기233-234에서 일어나고 긴 변이체 융합 단백질에서 잔기495-496에서 일어나는(도 1A-B (하단 패널 참고)) 융합 접합점을 포함한다. EML4-ALK 융합 폴리펩타이드의 융합 접합점을 포함하는 더 짧은 또는 더 긴 펩타이드/에피토프에 특이적으로 결합하는 항체들도 본 발명의 범위 내이라는 것은 예측될 것이다.
유사하게, 상기 기재된 방법들의 실행에 유용한 TFG-ALK 융합 폴리펩타이드 특이적인 항체의 바람직한 에피토프 자리는 인간 TFG-ALK 융합 폴리펩타이드 서열(서열번호 20)의 약 11에서 17 아미노산을 필수적으로 포함하는 펩타이드 절편이고, 그 절편은 융합 접합점(잔기 137-138에서 일어나는(도 1C (하단 패널)참고)를 포함한다.
본 발명은 본 발명의 방법에서 유용한 EML4-ALK 또는 TFG-ALK 융합 폴리펩타이드-특이적인 항체들이 결합하는 필수적으로 동일한 에피토프에 융합-단백질 또는 트런케이트된 단백질 특이적인 형태로 결합하는 단백질 결합하는 도메인 또는 핵산 압파머와 같은 균등한 분자들을 포함하나 본 발명은 항체의 용도에 이에 한정되지 아니한다. 예를 들어 Neuberger 외, Nature 312: 604 (1984) 참고. 그러한 균등한 비-항체 시약들은 하기에 더욱 설명된 본 발명의 방법들에서 적당하게 채택될 수 있다.
본 발명의 방법들을 실행하기에 유용한 폴리클론 항체들은 원하는 융합-단백질 특이적인 에피토프(예를 들어 여기에 기재된 ALK 융합 단백질의 융합 접합점)를 포함하는 항원으로 적당한 동물(토끼, 염소 등)을 면역화하고, 그 동물로부터 면역혈청을 수집하고 그 면역 혈청으로부터 폴리클론항체를 분리하고 공지된 방법에 따라 원하는 특이성을 가지는 폴리클론 항체들을 정제하는 표준 기술에 따라 생성될 수 있다. 그 항원은 주지된 기술에 의하여 구축되고 선택된 원하는 에피토프 서열을 포함한느 합성 펩타이드 항원일 수 있다. 예를 들어 Antibodies: A Laboratory Manual, Chapter 5, p. 75-76, Harlow & Lane Eds., Cold Spring Harbor Laboratory (1988); Czernik, Methods In Enzymology , 201: 264-283 (1991); Merrifield, J. Am . Chem . Soc . 85: 21-49 (1962))참고. 여기에 기재된 것과 같이 폴리클론 항체들은 하기에 더욱 설명하는 것과 같이 스크리닝되고 분리될 수 있다.
단클론 항체들은 본 발명의 방법들에서 유리하게 채택될 수 있고 Kohler 및 Milstein. Nature 265: 495-97 (1975); Kohler 및 Milstein, Eur . J. Immunol . 6: 511 (1976)의 주지된 기술에 따라 하이브리도마 세포 주에서 생성될 수 있고; Current Protocols in Molecular Biology, Ausubel 외 Eds. (1989)를 또한 참고. 그렇게 생성된 단클론 항체들은 매우 특이적이고 본 발명에 의하에 제공된 방법의 선택성 및 특이성을 개량한다. 예를 들어 적당한 항원(예를 들어 EML4-ALK 융합 폴리펩타이드의 융합 접합점을 포함하는 합성적 펩타이드)을 포함하는 용액을 마우스에 주사되고, 충분한 시간 후(통상의 기술을 따라), 마우스를 희생하고 비장 세포를 얻는다. 그 비장 세포들은 하이브리도마 세포를 생성하기 위하여 통상적으로 폴리에틸렌 글리콜의 존재하에서 골수종 세포와 그들을 융합하여서 불멸하게 된다. 예를 들어 토끼 융합 하이브리도마는 1997년 10월 7일에 등록된 K. Knight의 미국특허 제 5,675,063호에 기재된 것에 따라 제조될 수 있다. 그 하미브리도마 세포들은 그 후에 hypoxanthine-aminopterin-thymidine (HAT)와 같은 적당한 선택 배지에서 성장하고, 그 상등액은 하기에 기재된 바와 같이 원하는 특이성을 가진 단클론 항체들에 대하여 스크리닝한다. 그 분비된 항체는 침전, 이온교환 또는 친화 크로마토그래피 또는 그 유사와 같은 통상의 방법에 의하여 조직 배양 상등액으로부터 회수될 수 있다.
단클론 Fab 절편들은 당업자에 공지된 재조합 기술에 의하여 대장균으로부터 생성될 수 있다. 예를 들어 W. Huse, Science 246: 1275-81 (1989); Mullinax 외, Proc. Nat'l Acad . Sci . 87: 8095 (1990)참고. 만약 한 이소타입의 단클론 항체들이 특정한 적용에 바람직하다면, 특정 이소타입은 시작 융합으로부터 선택하여 직접적으로 제조될 수 있거나, 클래스-스위칭 변이체를 분리하기 위하여 sib 선택 기술을 사용하여 여러 이소타입의 단클론 항체를 분비하는 부모 하이브리도마로부터 이차적으로 제조될 수 있다(Steplewski, 외, Proc . Nat ‘l. Acad . Sci ., 82: 8653 (1985); Spira 외, J. Immunol . Methods , 74: 307 (1984)). 단클론 항체의 항원 결합 자리는 PCR에 의하여 클론될 수 있고 단일 체인 항체들은 파지-디스플레이된 재조합 항체 또는 대장균에 가용성 항체로 생성된다(예를 들어 Antibody Engineering Protocols, 1995, Humana Press, Sudhir Paul editor.참고)
미국 특허 제5,194,392, Geysen (1990)은 흥미있는 항체의 특정한 파라토프 (항원 결합 자리)에 상보적인 에피토프의 위상적(topological) 균등물(즉, “미니토프”)인 모노머(아미노산들 또는 다른 화합물들)의 서열을 검출하고 결정하는 일반적인 방법을 기재한다. 더 일반적으로는 이 방법은 흥미의 특정 수용체의 리간드 결합 자리에 상보적인 리간드의 지형상의(topographical) 동등체인 모노머의 서열을 검출하고 결정하는 것과 관련된다. 유사하게 미국특허 제5,480,971호, Houghten 외 (1996)는 흥미의 수용체에 바람직하게 결합하는 퍼알킬레이트된 올리고펩타이드의 서열을 결정하기 위하여 그러한 올리고펩타이드 세트 및 라이브러리를 사용하기 위한 방법 뿐 아니라 선형 C1-C-알킬 퍼알킬화된 올리고펩타이드 및 세트들 그리고 그러한 펩타이드의 라이브러리를 기재한다. 본 발명의 에피토프-함유 펩타이드의 비-펩타이드 아나로그는 또한 이들 방법에 의하여 통상적으로 제조될 수 있다.
폴리클론 또는 단클론이든 본 발명의 방법에서 유용한 항체들은 표준 기술에 따라 에피토프 및 융합 단백질 특이성에 대하여 스크리닝될 수 있다. 예를 들어 Czernik 외, Methods in Enzymology , 201: 264-283 (1991) 참고. 예를 들어 그 항체들은 예를 들어 바람직하게는 본 발명의 EML4-ALK 융합 폴리펩타이드와만 반응성을 가지고 야생형 EML-4 또는 야생형 ALK에는 반응성이 없으며 양 원하는 항원 모두에 대한 특이성을 보증하기 위하여 ELISA에 의하여 펩타이드 라이브러리에 대하여 스크리닝될 수 있다. 그 항체들은 ALK 관련 다른 융합 단백질에 대해 결합성이 없다는 것을 보증하고 원하는 타겟에만 반응성을 확인하기 위하여 타겟 단백질을 포함하는 세포 조제물에 대하여 웨스턴 블럿에 의하여 테스트될 수 있다. 융합 단백질-특이적인 항체들의 생산, 스크리닝, 및 용도는 당업자에게 공지되고 알려졌다. 예를 들어 2005년 9월 29일 공개된 미국 공개번호 제 20050214301, Wetzel 외, 참고.
본 발명의 방법에 유용한 융합 폴리펩타이드-특이적인 항체들은 융합 접합점을 형성하는 야생형 EML-4, 야생형 TFG, 및 야생형 ALK에서 에피토프를 가지거나 다른 융합단백질들에서 유사한 융합 에피토프를 가지는 일부 제한된 교차-반응성을 나타낼 수 있다. 이것은 대부분 항체들이 어느정도의 교차-반응성을 나타내고 항-펩타이드 항체들은 종종 면역화된 펩타이드와 동일하거나 높은 상동성을 가지는 에피토프와 교차반응을 하므로 예측되지 않는 것은 아니다. 예를 들어 상기 Czernik , 참고. 다른 융합 단백질들과 교차-반응성은 공지된 분자량 마커로 웨스턴 블럿에 의하여 용이하게 특성화된다. 교차-반응하는 단백질들의 아미노산 서열은 항체가 결합하는 EML4-ALK 또는 TFG-ALK 융합 폴리펩타이드 서열과 동일하거나 높은 상동성을 가지는 자리를 동정하기 위하여 조사될 수 있다. 바람직하지 않은 교차-반응성은 펩타이드 컬럼에 대한 항체 정제를 사용하여서 네가티브 선택에 의하여 제거될 수 있다(예를 들어 야생형 EML-4 및/또는 야생형 ALK에 결합하는 항체들을 선택제거).
여기에 기재된 방법을 실행하는데 유용한 본 발명의 EML4-ALK 융합 폴리펩타이드-특이적인 항체들(및 TFG-ALK 융합 폴리펩타이드-특이적인 항체들)은 인간 융합 폴리펩타이드에 이상적으로 특이하나, 본질적으로 인간에만 결합하는 것에 한정되지 아니한다. 본 발명은 다른 포유류 종 들(예를 들어 마우스, 랫트, 원숭이)에서 보존되고 매우 상동적 또는 동일한 에피토프들에 결합하는 항체들의 용도 및 생성을 포함한다. 다른 포유류 종 들에서 매우 상동적 또는 동일한 서열은 BLAST를 사용하는 것과 같은 표준 서열 비교에 의하여, 여기에 기재된 인간 EML4-ALK 융합 폴리펩타이드 서열(서열번호 1 및 18) 또는 인간 TFG-ALK 융합 폴리펩타이드 서열(서열번호 20)을 가지고 용이하게 동정될 수 있다.
본 발명의 방법에 채택된 항체들은 예를 들어 유체 세포측정법(FC), 면역조직화학(IHC), 및/또는 면역세포화학(ICC)과 같은 특정한 분석 포맷에서 사용을 위하여 확인되고 더 특성화될 수 있다. 그러한 방법들에서 ALK 융합 폴리펩타이드-특이적인 항체들의 용도는 하기 섹션 F에서 더욱 설명한다. 하기 섹션 F에서 설명하는 것과 같이 항체들은 또한 세포 마커(사이토케라틴) 항체 및/또는 다른 신호전달(phospho-AKT, phospho-Erk 1/2)과 협력하여 다중-계수 분석에서 사용하기 위하여 양자점과 같은 레이블 또는 형광염료(예를 들어 Alexa488, PE)과 유리하게 결합될 수 있다.
본 발명의 방법들을 실행하는데서 주어진 생물학적 샘플에서 야생형 EML-4, 야생형 TFG, 및/또는 야생형 ALK의 발현 및/또는 활성은 이들 야생형 단백질들에 대한 항체들(포스포-특이적 또는 전체)을 사용하여 유리하게 조사될 수 있다. 예를 들어 ALK 전체 및 인산화-자리 특이적인 항체들은 통상적으로 구입가능하다(Cell Signaling Technology, Inc., Beverly MA, 2005/06 Catalogue, #‘s 3341, 3342). 그러한 항체들은 상기에 기재된 것과 같은 표준 방법들에 따라 제조될 수 있다. 다른 종들로부터 이들 단백질들의 서열과 같이 인간 EML-4, TFG, 및 ALK의 아미노산 서열은 공개된다(도 3A 및 4A-4C, 그리고 레퍼런스된 SwissProt Accession 번호들).
생물학적 샘플들(예를 들어 종양 샘플)에서 EML4-ALK 및/또는 TFG-ALK 융합 폴리펩타이드 발현과 함께 야생형 EML-4, 야생형 TFG, 및 야생형 ALK의 발현 및/또는 활성화의 검출은 융합 단백질만으로 그 종양을 추진하는지 또는 야생형 ALK가 활성화되고 종양을 추진하는지에 대한 정보를 제공할 수 있다. 그러한 정보는 융합 단백질 또는 야생형 단백질(들),또는 양자를 타겟하는지를 측정하는데 임상적으로 유용하거나 종양의 진행을 저해하고 적당한 치료제 또는 그것의 결합을 선택하는데 매우 효과적일 것이다. 여기에 기재된 트런케이트된 활성화 ALK 카이네이즈에는 존재하지 아니하는 야생형 ALK 카이네이즈 세포외 도메인에 특이적인 항체들은 특히 돌연변이체 ALK 카이네이즈의 존재/부존재를 결정하는데 유용할 것이다.
하나 이사의 항체가 상기 기재된 방법들의 실행에서 사용될 수 있다고 이해되어 진다. 예를 들어 EML4-ALK 융합 폴리펩타이드가 발현되는 암에서 의심되어지거나 잠재적으로 활성화되는 카이네이즈 기질, 또 다른 카이네이즈, 또는 수용체에 특이적인 하나 이상의 항체들과 같이 하나 이상의 EML4-ALK 융합 폴리펩타이드-특이적인 항체들은 그러한 암으로부터 유래한 세포들을 포함하는 생물학적 샘플에서 그러한 다른 신호 분자들의 활성을 검출하기 위하여 동시에 채택될 수 있다.
당업자들은 여기에 기재된 본 발명의 EML4-ALK 융합 폴리펩타이드들 및 그것의 융합 접합점 에피토프-함유 절편이 면역글로불린(IgG)의 불변 도메인의 부분들과 결합될 수 있어서, 키메릭 폴리펩타이드들을 야기한다는 것을 알 수 있다. 이들 융합 단백질들은 정제를 용이하게 하고 인 비보에서 증가된 반감기를 보인다. 이것은 예를 들어 포유류 면역글로불린의 중쇄 또는 경쇄의 불변부 도메인의 여러 도메인들과 인간 CD4-폴레펩타이드의 첫 번째 두 도메인들을 포함하는 키메릭 단백질에서 나타난다(EPA 394,827; Traunecker 외, Nature 331: 84-86 (1988)). IgG 부분에서 야기된 다이설파이드-연결된 다이머 구조를 가진 융합 단백질들은 모노머 EML4-ALK 융합 폴리펩타이드 단독보다 다른 분자들에 결합하고 중화하는데 더욱 효율적일 수 있다(Fountoulakis 외, J Biochem 270: 3958-3964 (1995)).
중( heavy )-동위원소 표지된 펩타이드들 ( AQUA 펩타이드들 ).
여기 기재된 방법들의 실행에 유용한 EML4-ALK 또는 TFG-ALK 융합 폴리펩타이드-특이적인 시약들은 생물학적 샘플에서 발현된 ALK 융합 폴리펩타이드 또는 트런케이트된 ALK 카이네이즈 폴리펩타이드의 절대적인 정량화에 적합한 중-동위원소 표지된 펩타이드들을 포함할 수 있다. 복합적인 혼합물에서 단백질들의 절대적인 절대적인 정량화(AQUA)를 위한 AQUA 펩타이드들의 생산과 용도에 대해서는 알려졌다. WO/03016861,“Absolute Quantification of Proteins and Modified Forms Thereof by Multistage Mass Spectrometry,"Gygi 외 및 또한 Gerber 외 Proc . Natl. Acad . Sci . U.S.A. 100: 6940-5 (2003) (그 가르침은 레퍼런스에 의하여 그들의 내용이 여기에 삽입됨).
AQUA 방법은 펩타이드 표준 물질을 비교하여 생물학적 샘플내에 단백질 변형과 동일한 서열을 가지는 펩타이드의 절대적인 양을 결정하기 위하여 분해된 생물학적 샘플에 적어도 하나의 알려진 양의 중-동위원소 표지된 펩타이드 표준 물질(LC-SRM 크로마토그래피에 의하여 검출될 수 있는 독특한 신호를 가짐)을 투입하는 것을 채택한다. 간략하게 설명하면, 상기 AQUA 방법은 두 단계를 가진다: 펩타이드 내부 표준 물질 선택과 확인 그리고 방법 개발;과 샘플에서 타겟 단백질을 검출하고 정량화하기 위한 확인된 펩타이드 내부 표준 물질들을 고안. 그 방법은 세포 파쇄액과 같은 복잡한 생물학적 혼합물에서 하나의 주어진 펩타이드/단백질을 검출하고 정량화하는 강력한 기술이고, 예를 들어 여러 생물학적 단계에서 한 단백질의 레벨의 차이를 정량하거나 의약치료의 결과로서 단백질 인산화의 변화를 정량하는데 채택될 수 있다.
일반적으로 적합한 내부 표준 물질을 개발하기 위하여, 타겟 단백질 서열내의 특정 펩타이드(또는 변형된 펩타이드)가 분해되는데 사용되어지는 특정 프로테이즈 및 그것의 아미노산 서열에 기초하여 선택되어 진다. 그 다음에 그 펩타이드는 한 잔기가 안정적 동위원소(13C, 15N)를 포함하는 동일한 잔기로 대체되게 고체상 펩타이드 합성에 의하여 생성된다. 그 결과는 단백질분해에 의하여 생성된 그것의 천연 상대에 화학적으로 동일하고 7-Da 매스 쉬프트를 통하여 MS에 의하여 용이하게 구별될 수 있는 펩타이다. 그 다음 그 새롭게 합성된 AQUA 내부 표준 펩타이드는 LC-MS/MS에 의하여 평가된다. 이 과정은 역상 크로마토그래피, 이온화 효율 및 충돌-유도된 해리를 통한 절편화를 통하여 펩타이드 체류(retention)에 대한 정량적인 정보를 제공한다. 천연 및 내부 표준 펩타이드들에 대한 유익하고 풍부한 절편 이온들은 선택되고 그 다음에 그 펩타이드 표준 물질의 독특한 프로화일에 기초한 선택된 반응 모니터링(LC-SRM)방법을 형성하기 위한 크로마토그래피 체류의 기능으로 신속한 연속으로 특이적으로 모니터된다.
그 AQUA 전략의 두 번째 단계는 복합체 혼합물로부터 단백질 또는 변형된 단백질의 양을 측정하기 위한 그것의 고안이다. 전체 세포 파쇄액은 SDS-PAGE 젤 전기영동에 의하여 전형적으로 분리되고, 단백질 이동과 일치되는 젤의 부위를 절단한다. 이 과정은 AQUA 펩타이드 및 LC-SRM 분석의 존재 하에서 인-젤 단백질 분해를 수반한다.(상기 Gerber 외참고) AQUA 펩타이드들은 단백질분해효소로 전체 세포 파쇄액의 분해에 의하여 얻어진 복합체 펩타이드 혼합물로 스파이크되고(spiked), 상기 기재된 것과 같이 면역친화 정제를 수행한다. 분해(예를 들어 트립신처리)에 의하여 형성된 천연 펩타이드의 절편 패턴 및 체류 시간은 전에 결정된 AQUA 내부 표준 펩타이드의 것과 동일하고;따라서 SRM 실험 결과들을 사용한 LC-MS/MS 분석은 매우 복잡한 펩타이드 혼합물로부터 직접 내부 표준 물질 및 분석물 모두의 매우 특이적이고 민감한 측정을 야기한다.
절대량의 AQUA 펩타이드가 첨가(예를 들어 250 fmol)되었기 때문에, 곡선 하의 면적비는 원래 세포 파쇄액에서 단백질의 인산화 형태 또는 정확한 단백질의 발현 수준을 결정하는데 사용될 수 있다. 또 내부 표준 물질은 천연 펩타이드가 형성되는 것과 같이 인-젤 분해 동안 존재하고 젤 조각으로부터 펩타이드 추출 효율, 샘플 처리(진공 원심분리 포함) 동안 절대적인 손실 및 LC-MS 시스템으로 투입 동안의 변동과 같은 것은 천연 및 AQUA 펩타이드 양의 결정된 비율에 영향을 주지 않는다.
AQUA 펩타이드 표준물질은 타겟 단백질 내에서 IAP-LC-MS/MS 방법에 의하여 전에 동정된 공지된 서열에 대하여 개발된다. 만약 자리가 변형되면 그 자리 내에 특정 잔기의 변형된 형태를 포함하는 AQUA 펩타이드가 개발될 수 있고 그 잔기의 비변형된 형태가 삽입된 두번째 AQUA 펩타이드가 개발된다. 이 방법에서 두 표준물질은 생물학적 샘플에서 그 자리의 변형된 것과 비변형된 형태 모두를 검출하고 정량화하는데 사용될 수 있다.
펩타이드 내부 표준물질은 단백질의 일차 아미노산 서열을 조사하고 프로테이즈 절단에 의해 생성되는 펩타이드들의 한도를 결정하여 생성될 수 있다. 또한 단백질은 프로테이즈로 실질적으로 처리될 수 있고 생성된 특정 펩타이드는 그 후 시퀀싱될 수 있다. 적당한 프로테이즈는 세린 프로테이즈(예를 들어 트립신, 헵신), 메탈로 프로테이즈(예를 들어 PUMP1), 키모트립신, 카텝신, 펩신, 써모라이신, 카르복시펩티데이즈, 등을 포함하나 이에 한정되지 아니한다.
단백질 내에 펩타이드 서열은 내부 표준물질로서 펩타이드의 용도를 최적화하기 위한 하나 이상의 기준에 의하여 선택된다. 바람직하게는 펩타이드의 크기는 그 펩타이드 서열이 다른 비-타겟 단백질들에서 반복될 수 있는 기회를 최소화게 선택된다. 따라서 펩타이드는 바람직하게는 적어도 약 6 아미노산이다. 펩타이드의 크기는 이완화 빈도를 최소화하게 최적화된다. 따라서 약 20 아미노산 이사의 펩타이드들은 바람직하지 않다. 바람직한 범위는 약 7에서 15 아미노산이다. 펩타이드 서열은 또한 질량 분광 동안에 화학적으로 반응성이 없게 선택되어 시스테인, 트립토판 또는 메티오닌을 포함한 서열은 회피된다.
타겟 부위의 변형된 지역을 포함하지 않는 펩타이드 서열은 그 펩타이드 내부 표준물질이 그 단백질의 모든 형태의 정량을 결정하게 사용될 수 있게 선택될 수 있다. 또한 변형된 아미노산을 포함하는 펩타이드 내부 표준물질은 타겟 단백질의 변형된 형태만을 검출하고 정량화하는데 바람직할 수 있다. 변형된 그리고 비변형된 부위에 대한 펩타이드 표준물질은 특정 샘플에서 변형의 양을 결정하기 위하여 함께 사용될 수 있다(즉 전체 단백질의 양의 어느 정도가 변형된 형태에 의하여 나타나는지를 결정하기 위하여). 예를 들어 인산화되는 것으로 알려진 단백질의 인산화 및 비인산화 형태 모두에 대한 펩타이드 표준물질은 샘플에서 인산화된 형태의 양을 정량화하는데 사용될 수 있다.
그 펩타이드는 하나 이상의 표지된 아미노산을 사용하여 표지(즉 그 펩타이드의 실질적 부위에 표지)되거나 또는 덜 바람직하게는 그 표지는 표준 방법에 의하여 합성 후에 부착될 수 있다. 바람직하게는 그 표지는 하기 사항들에 기초하여 선택된 질량-변경 표지이다:그 질량은 MS 분석에 의하여 생성된 절편 질량이 낮은 배경을 가지는 스펙트럼의 부위로 쉬프트하기 위하여 독특하여야 한다;그 이온 질량 표시 구성성분은 MS 분석에서 바람직하게는 독특한 이온 질량 표시(signature)를 나타내는 표지 부분의 일부이다; 그 표지의 구성 원자의 질량의 합은 모든 가능한 아미노산의 절편들보다 바람직하게는 독특하게 다르다. 결과적으로 그 표지된 아미노산들 및 펩타이드들은 결과적인 질량 스펙트럼에서 이온/질량 패턴에 의하여 표지되지 않은 것과 용이하게 구별된다. 바람직하게는 그 이온 질량 표시는 20 종의 천연 아미노산들 중 어느 하나에 대한 잔기 질량이 일치하지 않은 단백질 절편에 대하여 질량을 을 준다.
그 표지는 MS의 절편화 조건 허에서 강해야 하고 바람직하지 않은 절편화를 수행하지 않는다. 표지 화학은 조건의 범위 특히 변성 조건 하에서 효율적이어야 하고 그 표지된 태그는 바람직하게는 선택의 MS 버퍼 시스템에서 가용성을 유지하여야 한다. 그 표지는 바람직하게는 그 단백질의 이온화 효율을 억제하기 아니하고 화학적으로 반응성이 없다. 그 표지는 각 표지된 절편 위치에서 독특한 질량 스펙트럼 패턴을 형성하기 위하여 둘 이상의 동위원소적으로 구별되는 종의 혼합물을 포함할 수 있다. 바람직한 표지 중에는 2H, 13C, 15N, 17O, 18O, 또는 34S와 같은 것이 적당하다. 여러 동위원소 표지를 포함한 펩타이드 내부 표준물질 쌍이 바람직할 수 있다. 중 동위원소 표지가 삽입될 수 있는 바람직한 아미노산 잔기들은 루신, 프롤린, 발린 및 페닐알라닌일 수 있다.
펩타이드 내부 표준 물질은 그들의 질량-투-차지(m/z) 비율에 따라서 바람직하게는 크로마토그래피 컬럼(예를 들어 HPLC 컬럼) 상의 그들의 체류 시간에 따라서 특성화된다. 동일한 서열의 표지되지 않은 펩타이드와 같이 용출되는 내부 표준물질들은 최적의 내부 표준물질로 선택된다. 그 다음에 그 내부 표준물질은 예를 들어 충돌 가스로 아르곤이나 헬륨을 사용하여 충돌-유도된 해리(CID)와 같은 적당한 수단에 의하여 펩타이드를 절편화하여 분석된다. 그 절편들은 그 후에 절편 이온 스펙트럼을 얻기 위하여 또는 펩타이드 절편화 표시를 얻기 위하여 예를 들어 다중-단계 질량 분광법(MSn)에 의하여 분석된다. 바람직하게는 펩타이드 절편들은 각 절편에 해당하는 피크들이 잘 분리되게 하는 m/z 비에서 중요한 차이를 가지고 그 타겟에 독특한 표시가 얻어진다. 만약 적당한 절편 표시가 처음 단계에서 얻어지지 않으면, 독특한 표시가 얻어질 때까지 MS의 부가적인 단계들이 수행된다.
MS/MS 및 MS3 스펙트럼에서 절편 이온들은 전형적으로 흥미의 펩타이드에 매우 특이적이고, LC 방법들과 같이 수십만종의 펩타이들을 포함하는 세포 파쇄액과 같은 복잡한 단백질 혼합물에서 타겟 펩타이드/단백질을 검출하고 정량화하는 매우 선택적이니 수단을 허용한다. 흥미의 타겟 단백질/펩타이드를 잠재적으로 포함하는 생물학적 샘플은 분석될 수 있다. 조 또는 부분 정제된 세포 추출물이 바람직하게 선택된다. 일반적으로 그 샘플은 적어도 0.01 mg의 단백질, 전형적으로는 0.1-10 mg/mL의 단백질을 가지고, 바람직한 버퍼 농도 및 pH로 조절될 수 있다.
바람직하게는 분석/정량화는 타겟 단백질에 해당하는 약 10 페토몰의 공지된 양의 표지된 펩타이드 내부 표준물질은 세포 파쇄액과 같은 생물학적 샘플에 첨가된다. 그 스파이크된 샘플은 그 후에 분해를 허용하기에 적당한 시간 동안 하나 이상의 프로테이즈로 처리된다. 그 후 그 샘플에서 다른 펩타이드들로부터 표지된 펩타이드 내부 표준물질과 그것에 해당하는 타겟 펩타이드를 분리하기 위하여 그 분리가 수행된다(예를 들어 HPLC, 역상 HPLC, 모세관 전기영동, 이온 교환 크로마토그래피,등). 미세모세관 LC는 바람직한 방법이다.
그 후 각 분리된 펩타이드는 MS에서 선택된 반응의 모니터에 의하여 조사된다. 이것은 펩타이드 내부 표준물질의 특성화에 의하여 얻어진 기존 지식을 사용하고 흥미있는 펩타이드와 그 내부 표준 펩타이드 모두에 대한 MS/MS 또는 MSn 스펙트럼에서 특이적인 이온을 계속적으로 모니터하기 위하여 그 MS를 필요로 하는 것과 관련된다. 용출 후 펩타이드 표준 및 타겟 펩타이드 피크 모두에 대한 곡선 후의 면적(AUC)이 계산된다. 세포 당 단백질의 정확한 카피의 수를 제공하기 위하여 그 두 면적들의 비는 분석에 사용된 세포들의 수와 단백질 분자량에 대하여 표준화될 수 있는 절대적인 정량화를 제공한다. AQUA 방법의 더욱 상세한 내용은 Gygi 및 Gerber의 상기 기재된 레퍼런스에 설명된다.
본 발명의 돌연변이체 ALK 폴리펩타이드 내에 독특한 위치(예를 들어 기재된 EML4-ALK 융합 폴리펩타이드 내에 융합 접합점)를 검출하고 정량화하기 위하여 상기에 기재된 것과 같은 AQUA 내부 펩타이드 표준물질들(중-동위원소 표지된 펩타이드들)이 바람직하게 생성될 수 있다. 예를 들어 EML4-ALK 융합 폴리펩타이드의 융합 접합점 서열(도 1A-B (하단 패널))에 해당하거나 EML4, TFG, 또는 ALK의 트런케이션 지점에 해당하는 AQUA 포스포펩타이드가 제조될 수 있다. 펩타이드 표준물질들은 EML4-ALK 또는 TFG-ALK 융합 접합점에 대하여 생성될 수 있고 그러한 표준물질들은 생물학적 샘플에서 융합 접합점(즉 EML4-ALK 융합 폴리펩타이드의 존재)를 검출하고 정량화하는 AQUA 방법들에서 채택된다.
예를 들어, 본 발명의 예시적인 AQUA 펩타이드는 아미노산 서열 INQVYR을 포함하고(도 1, 하단 패널 참고), 그것은 EML4-ALK 융합 폴리펩타이드에서 융합 접합점의 양 편에 프랭크되는 세 아미노산에 해당된다(서열번호 7 참고). 융합 접합점 서열을 포함하는 더 큰 AQUA 펩타이드들(그리고 부가적인 그것의 업스트림 또는 다운스트림 잔기)도 구축될 수 있다는 것은 인정될 것이다. 유사하게 그러한 서열의 잔기보다 짧은 것을 포함하는 더 작은 AQUA 펩타이드(그러나 여전히 융합 접합점의 지점 자체는 포함하는) 또한 구축될 수 있다. 그러한 더 크거나 짧은 AQUA 펩타이드들은 본 발명의 범위 내이고, 바람직한 AQUA 펩타이드들의 생성 및 선택은 상기에 기재된 것과 같이 수행될 수 있다(Gygi 및 Gerber의 상기 기재된 레퍼런스 참고).
핵산 프로브들 .
본 발명에 의하여 제공된 융합-특이적인 시약들은 또한 상기 섹션 B에서 상술된 것과 같이 EML4-ALK 폴리뉴크레오타이드 또는 트런케이트된 ALK 카이네이즈 폴리뉴크레오타이드의 검출에 적합한 핵산 프라이머와 핵산 프로브를 포함한다. 다른 것들 중에서 바람직한 그러한 프로브들은 그 융합을 생성하는 야생형 EML4 및/또는 야생형 ALK 유전자들에서 구분점(breakpoint)의 양 편에 해당하는 구분점 프로브들을 포함한다. 형광 인-시투 교잡(FISH) 또는 중합효소 연쇄반응 (PCR) 증폭과 같은 분석에서 그러한 프로브들의 특이적인 용도는 하기 섹션 F에서 설명한다 유사한 구분점 프로브들은 TFG-ALK 융합 폴리뉴크레오타이드의 존재를 검출하기 위하여 제조될 수 있다(도 1C (서열번호 21)참고.
F. 진단적 적용 및 분석 포맷.
본 발명의 방법은 당업자에 공지된 여러 다른 분석 포맷으로 수행될 수 있다.
면역분석.
본 발명의 실행에 유용한 면역분석은 동종 면역분석 또는 이종 면역분석일 수 있다. 동종 분석에서 그 면역학적 반응은 종종 돌연변이체 ALK 카이네이즈 폴리펩타이드-특이적인 시약 (예를 들어 EML4-ALK 융합 폴리펩타이드-특이적인 항체), 그 표지된 분석체, 및 흥미있는 생물학적 샘플이 관련된다. 그 표지로부터 일어나는 신호는 그 표지된 분석체에 항체의 결합에 대하여 직접 또는 간접적으로 변형된다. 면역학적 반응 및 그것의 양의 검출 모두는 동종 용액에서 수행된다. 채택될 수 있는 면역화학적 표지들은 자유 래디컬, 방사성-동위원소, 형광염료, 효소, 박테리오파지, 조효소 등을 포함한다. 반도체 나노결정 표지 또는 "양자 점(Quantum dots)"도 유리하게 채택될 수 있고, 그들의 제조 및 용도는 잘 알려졌다. 일반적으로 K. Barovsky, Nanotech . Law & Bus . 1(2): 기사 14 (2004) 및 거기에 인용된 특허 참고.
이종석 분석 접근에서, 그 시약들은 종종 생물학적 샘플, 돌연변이체 ALK 카이네이즈 폴리펩타이드-특이적인 시약(예를 들어 EML4-ALK 융합-특이적인 항체), 및 검출될 수 있는 신호를 생성하는 적당한 수단이다. 하기에서 더욱 설명하는 것과 같은 생물학적 샘플들이 사용될 수 있다. 그 항체는 비드, 플레이트 또는 슬라이드와 같은 서포트에 고정화되고 일반적으로 액상에서 항원을 포함하는 것으로 의심되는 샘플과 접촉된다. 그 서포트는 그 다음에 그 액상으로부터 분리되고 서포트 상 또는 그 액상은 그러한 신호를 생성하기 위한 검출될 수 있는 신호 채택 수단들에 대하여 측정된다. 그 신호는 생물학적 샘플에서 분석체의 존재와 관련된다. 검출될 수 있는 신호를 생성하는 수단들은 방사선활성 표지, 형광 표지, 효소 표지, 양자 점 및 기타의 것들을 포함한다. 예를 들어 만약 검출되는 항원이 두번째 결합 자리를 포함한다면 그 자리에 결합하는 항체는 검출될 수 있는 기를 결합될 수 있고 분리 단계 전에 액상 반응 용액에 첨가될 수 있다. 솔리드 서포트 상에 검출할 수 있는 기들의 존재는 테스트 샘플에서 항원의 존재를 나타낸다. 바람직한 면역분석의 예들은 방사성면역분석, 면역형과 방법, 효소-링크된 면역분석 및 그 유사한 방법이다.
여기에 기재된 방법을 수행하는데 유용한 면역분석 포맷 및 그것의 변이들은 당업계에 주지된다. 일반적으로 E. Maggio, Enzyme-Immunoassay, (1980) (CRC Press, Inc., Boca Raton, Fla.); 또한 예를 들어 미국 특허 제4,727,022호(Skold 외, "Methods for Modulating Ligand-Receptor Interactions and their Application"); 미국 특허 제4,659,678호(Forrest 외, "Immunoassay of Antigens"); 미국특허 제4,376,110호(David 외, "Immunometric Assays Using Monoclonal Antibodies")참고. 시약-항체 복합체의 형성에 적합한 조건들은 당업자에 주지된다. 상기 문헌 참고. EML4-ALK 융합 폴리펩타이드-특이적인 단클론 항체들은 그 표지된 단클론 항체 및 결합된 단클론 항체 모두에 대한 공급원으로서 단일 하이브리도마 세포주를 가지는 "두-자리" 또는 "샌드위치" 분석에서 사용될 수 있다. 그러한 분석은 미국 특허 제 4,376,110호에 기재된다. 그 검출될 수 있는 시약의 농도는 EML4-ALK 또는 TFG-ALK 융합 폴리펩타이드의 결합이 배경과 비교하여 검출될 수 있게 충분하여야 한다.
여기에 기재된 그 방법의 실행에 유용한 항체들은 침전과 같은 공지된 기술들에 따라서 진단 분석에 적당한 고체 서포트(예를 들어 라텍스 또는 폴리스티렌과 같은 물질로 제조된 웰, 비드, 플레이트 또는 슬라이드)에 부착될 수 있다. 항체들 또는 다른 ALK 융합 폴리펩타이드- 또는 트런케이트된 ALK 카이네이즈 폴리펩타이드- 결합 시약들은 공지된 기술에 따라 방사성표지(예를 들어, 35S, 125I, 131I), 효소 표지(예를 들어 호스래디쉬 퍼옥시데이즈, 알칼라인 포스페테이즈), 및 형광 표지들 (예를 들어 흐루르세인)과 같은 검출될 수 있는 기들에 마찬가지로 부착될 수 있다.
유동세포분석법(flow cytometry ;FC)와 같은 세포-기반 분석, 면역-조직화학(IHC), 또는 면역형광법(IF)은 그러한 분석 포맷이 임상적으로 적합하고, 인 비보에서 돌연변이체 ALK 카이네이즈 폴리펩타이드 발현의 검출을 가능하게 하고 추출물을 덩기 위하여 예를 들어 종양 샘플로부터 얻어진 세포들 조작을 야기하는 활성에서 인위적인 변화의 위험성을 회피할 수 있기에 본 발명의 방법을 실행하는데 특히 바람직하다. 따라서 일부 바람직한 구체예에서, 본 발명의 방법들은 유동세포분석법(flow cytometry ;FC)와 같은 세포-기반 분석, 면역-조직화학(IHC), 또는 면역형광법(IF) 분석 포맷을 고안한다.
유동세포 분석법(FC)은 ALK 카이네이즈 활성을 저해하는 타겟된 약물의 처리 전, 동안 및 후에 포유류 종양에서 돌연변이체 ALK 카이네이즈 폴리펩타이드 발현을 결정하기 위하여 채택될 수 있다. 예를 들어 골수 샘플로부터 유래한 종양 세포들은 그렇게하는 것이 바람직하다면 암 세포 타입을 동정하기 위한 마커로 뿐만 아니라 EML4-ALK 또는 TFG-ALK 융합 폴리펩타이드 발현 및/또는 활성화에 대한 유동세포 분석법에 의하여 분석될 수 있다. 유동세포분석법은 표준 방법들에 따라 수행될 수 있다. 예를 들어 Chow 외, Cytometry ( Communications in Clinical Cytometry) 46: 72-78 (2001). 간략하게 예를 들어, 유동세포분석에 대한 하기 프로토콜은 채택될 수 있다: 2% 파라포름알데히드로 10분간 37℃에서 세포를 고정하고, 얼음에서 30분간 90% 메탄올에서 투과를 수행. 그 후에 세포들을 일차 EML4-ALK 또는 TFG-ALK 융합 폴리펩타이드-특이적인 항체로 염색될 수 있고, 세척하고 형광-표지 이차 항체로 표지한다. 그 세포들은 그 후에 사용된 장체의 특정 프로토콜에 따라서 유동세포분석기(예를 들어 Beckman Coulter FC500)로 분석될 수 있다. 그러한 분석은 종양에서 발현된 EML4-ALK 또는 TFG-ALK 융합 폴리펩타이드의 레벨을 동정할 수 있다. ALK-저해 약제로 종양을 처리한 후에 유사한 분석은 ALK 카이네이즈의 타겟된 저해제에 대한 ALK 융합 폴리펩타이드-발현하는 종양의 반응성을 나타낸다.
면역조직화학(IHC) 염색은 ALK 카이네이즈 활성을 저해하는 타겟된 약물로 처리 전, 동안 및 후에 포유류 암(예를 들어 NSCLC와 같은 고형암)에서 돌연변이체 ALK 카이네이즈 폴리펩타이드의 발현 및/또는 활성화 상태를 결정하기 위하여 채택될 수 있다. IHC는 주지된 기술들에 따라 수행될 수 있다. 예를 들어 Antibodies: A Laboratory Manual, Chapter 10, Harlow & Lane Eds., Cold Spring Harbor Laboratory (1988)을 참고. 간략하게 예를 들면, 파라핀-충진된 조직(예를 들어 생검으로부터 종양 조직)은 에탄올에 의하여 수반되는 자이렌으로 조직 박편 탈파라핀화하고; 물에서 다음 PBS로 수화하고; 구연산 나트륨 버퍼로 슬라이드를 가열하여 항원을 탈마스크하고; 과산화수소에서 박편을 배양하고; 불록킹 용액에서 블록킹하고; 일차 항-EML4-ALK 또는 항-TFG-ALK 융합 폴리펩타이드 항체 및 이차 항체에서 슬라이드를 배양하고;그리고 마지막으로 제조업자의 지시에 따라 ABC 아비딘/바이오틴 방법을 사용하여 검출하여서 면역조직화학 염색을 준비한다.
면역형광(IF) 분석은 ALK 카이네이즈 활성을 저해하는 타겟된 약물로 처리 전, 동안 및 후에 포유류 암에서 돌연변이체 ALK 카이네이즈 폴리펩타이드의 발현 및/또는 활성화 상태를 결정하기 위하여 채택될 수 있다. IF는 주지된 기술들에 따라 수행될 수 있다. 예를 들어 J.M. Polak 및 S. Van Noorden (1997) Introduction to Immunocytochemistry, 2nd Ed.; Royal Microscopy Society Microscopy Handbook 37, BioScientific/Springer-Verlag 참고. 간략하게 예를 들면, 환자 샘플들은 환자 샘플들은 메탄올에 의하여 수반되는 파라포름알데히드에서 고정될 수 있고, 말 혈청과 같은 불록킹 용액으로 불록킹되고, Alexa 488와 같은 형광염료로 표지된 2차 항체에 의하여 수반되는 EML4-ALK 또는 TFG-ALK 융합 폴리펩타이드에 대한 일차 항체로 배양할 수 있고 에피형광 현미경으로 분석될 수 있다.
상기 기재된 분석에서 채택된 항체들은 다른 신호전달(예를 들어. EGFR, phospho-AKT, phospho-Erk 1/2) 및/또는 세포 마커(예를 들어 사이토케라틴)와 함께 다중-계수 분석을 위하여 형광염료(예를 들어 Alexa488, PE) 또는 양자점과 같은 다른 표지를 효과적으로 부착될 수 있다.
돌연변이체 ALK 카이네이즈 폴리펩타이드를 측정하기 위한 효소-링크된 면역흡수 분석법(ELISA), 방사성-면역분석(RIA), 및 형광-활성화된 세포 소팅(FACS)을 포함하는 다른 여러 프로토콜은 당업계에 공지되고 EML4-ALK 또는 TFG-ALK 융합 폴리펩타이드 발현의 변경된 또는 비정상적인 레벨을 진단하는 기초를 제공한다. 이들 융합 폴리펩타이드 발현에 대한 정상 또는 표준 값들은 복합체 형성에 적합한 조건 하에서 EML4-ALK 또는 TFG-ALK 융합 폴리펩타이드에 대한 항체와 정상 포유류 대상 바람직하게는 인간으로부터 얻은 체액 또는 세포 추출물을 결합하여 달성된다. 표준 복합체 형성의 양은 여러 방법들에 의하여 정량화되나 바람직하게는 분광 수단에 의하여 정량화될 수 있다. 대상, 대조군 및 생검된 조직으로부터 얻은 샘플들로부터 발현된 EML4-ALK 또는 TFG-ALK 융합 폴리펩타이드의 양은 표준 값들과 비교된다. 표준 및 대상 값 사이의 차이는 질병을 진단하기 위한 계수를 확립한다.
펩타이드 및 핵산 분석.
유사하게 종양으로부터 유래된 세포들을 포함하는 생물학적 샘플에서 발현된 돌연변이체 ALK 카이네이즈 폴리펩타이드의 검출/정량화를 위한 AQUA 펩타이드들은 상기 섹션 E에서 상술된 것과 같은 표준 AQUA 분석에서 사용되고 제조될 수 있다. 따라서 본 발명의 방법들의 일부 바람직한 구체예에서, 그 ALK 융합 폴리펩타이드-특이적인 시약은 상기 섹션 E에서 상술된 것과 같이 EML4-ALK 융합 폴리펩타이드 또는 TFG-ALK 융합 폴리펩타이드의 융합 접합점을 포함하는 펩타이드 서열에 해당하는 중 동위원소 표지된 포스포펩타이드(AQUA 펩타이드)를 포함한다.
본 발명의 방법들을 실행하는데 유용한 돌연변이체 ALK 폴리펩타이드-특이적인 시약들은 생물학적 샘플에서 융합 또는 트런케이트된 폴리펩타이드 발현 전사체와 직접 교잡하고 검출할 수 있는 mRNA, 올리고뉴크레오타이드 또는 DNA 프로브일 수도 있다. 그러한 프로브들은 상기 섹션 B에서 상세하게 설명되었다. 간략하게 예를 들면, 포르말린-고정된, 파라핀-충진된 환자 샘플을 형광-표지된 RNA 프로브로 프로빙하고 포름아마이드, SSC, 및 PBS로 세척하고 형광 현미경으로 분석한다. 염색체 2에서 EML4-ALK 결손 돌연변이와 같은 유전자 재배치의 형광 검출을 가능하게 하는 구분점 프로브를 포함하는 FISH 프로브가 또한 바람직하다(실시예 6 참고).
돌연변이체 ALK 폴리펩타이드를 코딩하는 폴리뉴크레오타이드들은 또한 진단 목적으로 사용될 수 있다. 사용될 수 있는 그 폴리뉴크레오타이드들은 올리고뉴크레오타이드 서열, 앤티센스 RNA 및 DNA 분자 및 PNA들을 포함한다. 그 폴리뉴크레오타이드들은 EML4-ALK 또는 TFG-ALK 융합 폴리펩타이드 또는 트런케이트된 활성화 ALK 카이네이즈 폴리펩타이드의 발현이 질병과 상관관계가 있을 수 있는 생검된 고형 종양 조직에서 유전자 발현을 검출하고 정량화하기 위하여 사용될 수 있다. 예를 들어 진단적 분석은 EML4-ALK 또는 TFG-ALK 융합 폴리펩타이드의 부존재, 존재 및 과 발현 사이를 구별하고 치료제 개입 동안에 ALK 융합 폴리펩타이드 레벨의 조절을 모니터하는데 사용될 수 있다.
일 바람직한 구체예에서, ALK 융합 폴리펩타이드 또는 트런케이트된 ALK 카이네이즈 폴리펩타이드, 또는 밀접하게 관련된 분자들을 코딩하는 유전자 서열을 포함하는 폴리뉴크레오타이드 서열들을 검출할 수 있는 PCR 프로브로 교잡은 돌연변이체 ALK 폴리펩타이드를 코딩하는 핵산 서열들을 동정하는데 사용될 수 있다. 그러한 프로브들의 사용 및 구축은 상기 섹션 B에 기재된다. 그것이 매우 특이적인 부위 예를 들어 융합 접합점 내의 10 독특한 뉴크레오타이드 또는 덜 특이적인 부위 예를 들어 3'코딩 부위로부터 제조되든지 간에 그 프로브의 특이성 및 교잡 또는 증폭의 엄격함(최대, 높은, 중간, 또는 낮은)은 그 프로브가 돌연변이체 ALK 폴리펩타이드, 대립유전자 또는 관련 서열들을 코딩하는 천연적으로 존재하는 서열만을 동정하는지를 결정할 것이다.
프로브들은 관련된 서열들의 검출에 사용될 수 있고, 바람직하게는 돌연변이체 ALK 폴리펩타이드 코딩하는 서열들 중 어느 하나로부터 적어도 50%의 뉴크레오타이드를 포함하여야 한다. 본 대상 발명의 교잡 프로브는 DNA 또는 RNA일 수 있고 서열번호 2, 19, 및 21의 뉴크레오타이드 서열, 가장 바람직하게는 융합 접합점을 포함하는 서열(도 1A-C, 하단 패널 및 서열번호 7, 24, 및 26), 또는 섹션 B에서 더 기재된 것과 같은 천연적으로 존재하는 EML-4, TFG, 및 ALK 폴리펩타이드들의 인트론, 인핸서 요소, 프로모터를 포함하는 유전자 서열로부터 유래한다.
예를 들어 본 발명의 EML4-ALK 융합 폴리뉴크레오타이드는 변경된 ALK 폴리펩타이드 발현을 검출하기 위하여 환자 생검들로부터 얻은 체액 또는 조직을 이용하는 ELISA 또는 칩 분석, 딥 스틱, 핀; PCR기술; 또는 서던 또는 노던 분석, 도트 블럿 또는 다른 막 기반 기술에서 사용될 수 있다. 그러한 정량화 및 정성화 방법들은 당업계에 주지된다. 특정 면에서 본 발명의 돌연변이체 ALK 폴리펩타이드를 코딩하는 뉴크레오타이드 서열들은 폐암을 포함하는 여러 암들의 활성화 또는 유도를 검출하는 분석에서 유용할 수 있다. 돌연변이체 ALK 폴리뉴크레오타이드들은 표준 방법들에 의하여 표지될 수 있고 교잡 복합체를 형성하기에 적합한 조건 하에서 환자로부터 유래한 체액 또는 조직에 첨가될 수 있다. 적절한 배양 시간 후 그 샘플은 세첵되고 그 신호는 정량화되고 표준 값과 비교된다. 만약 그 생검 또는 추출된 샘플에서 신호의 양이 비교 대조군 샘플의 양과 현저하게 다르다면 그 뉴크레오타이드 서열들은 샘플에 뉴크레오타이드 서열과 교잡된 것이고 그 샘플에서 EML4-ALK 융합 폴리펩타이드 또는 트런케이트된 ALK 카이네이즈 폴리펩타이드를 코딩하는 뉴크레오타이드 서열들의 변화된 레벨의 존재는 그 관련된 질병의 존재를 나타낸다. 그러한 분석은 동물 연구, 임상 실험 또는 환자의 치료 양생(regimen)을 모니터링하는 곳에서 특정 치료제 처리의 효과를 평가하는데 사용될 수 있다.
돌연변이체 ALK 카이네이즈 폴리펩타이드의 발현에 의하여 특성화된 질병의 진단에 대한 기초를 제공하기 위하여, 발현에 대한 정상 또는 표준 프로화일이 확립된다. 이것은 교잡 또는 증폭에 적합한 조건 하에서 EML4-ALK 또는 TFG-ALK 융합 폴리펩타이드를 코딩하는 서열 또는 그것의 절편으로 인간 또는 동물과 같은 정상 대상으로부터 얻어진 체액 또는 세포 추출물을 혼합하여 달성될 수 있다. 표준 교잡화는 실질적으로 정제된 폴리뉴크레오타이드의 알려진 양이 사용된 실험으로부터 얻어진 값과 정상 대상으로부터 얻어진 값들을 비교하여서 정량화될 수 있다. 정상 샘플로부터 얻어진 표준 값들은 질환에 대한 증상을 가진 환자로부터 얻어진 값들과 비교될 수 있다. 표준 및 대상 값 사이의 차이는 질병의 존재를 확립하는데 사용된다.
일단 질환이 확립되고 그 치료 프로토콜이 시작되면, 교잡 분석은 환자의 발현 레벨이 정상 환자에서 관찰된 것에 가까워지기 시작하는지 여부를 평가하기 위하여 정기적으로 반복될 수 있다. 연속적인 분석들로부터 얻어진 이 결과들은 몇 일로부터 수 개월 범위의 기간 동안에 치료의 효과를 나타내는데 사용될 수 있다.
본 발명의 돌연변이 ALK 폴리뉴크레오타이드들에 대한 부가적인 진단 용도는 당업자에게 표준적인 바람직한 분석 포맷인 중합효소 연쇄반응(PCR)의 사용과 연관될 수 있다. 예를 들어 Molecular Cloning, A Laboratory Manual, 2nd. edition, Sambrook, J., Fritsch, E. F. and Maniatis, T., eds., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (1989) 참고. PCR 올리고머들은 화학적으로 합성되거나 효소적으로 생성되거나 재조합 공급원으로부터 정제될 수 있다. 올리고머들은 바람직하게는 특정 유전자 또는 조건의 동정을 위한 최적 조건 하에서 채택된 센스 배향(5'에서 3')을 갖는 하나와 앤티센스 배향(3'에서 5')을 가지는 다른 하나인 두 뉴크레오타이드 서열로 구성된다. 상기 두 올리고머, 올리고머들의 네트스된 세트 또는 심지어 올리고머들의 디제너레이트된 풀은 밀접하게 관련된 DNA 또는 RNA 서열의 검출 및/또는 정량에 대한 덜 엄격한 조건 하에서 채택될 수 있다.
ALK 융합 폴리펩타이드 또는 트런케이트된 ALK 카이네이즈 폴리펩타이드의 발현을 정량화하는데 사용될 수 있는 방법들은 뉴크레오타이드의 방사선표지 또는 바이오틴화 ,대조 핵산의 공동증폭, 및 삽입되는 실험결과에 대한 표준 곡성을 포함한다(Melby 외, J. Immunol . Methods, 159: 235-244 (1993); Duplaa 외 Anal . Biochem. 229-236 (1993)). 다중 샘플들의 정량화 속도는 흥미있는 올리고머가 여러 희석액에 존재하는 ELISA 포맷에서 분석을 진행하여 가속화될 수 있고 분광계 또는 비색계 반응은 신속한 정량화를 준다.
본 발명의 또다른 구체예에서, 본 발명의 돌연변이체 ALK 폴리뉴크레오타이드들 뿐 아니라 그들로부터 인접 및 멀리 떨어진 인접한 유전자 부위도 천연적으로 존재하는 지노믹 서열을 맵핑하는데 유용한 교잡 프로브들을 생성하는데 사용될 수 있다. 그 서열들은 주지된 기술을 사용하여 그 염색체의 특정 부위 또는 특정 염색체에 맵핑될 수 있다. 그러한 기술들은 Price, C. M., Blood Rev . 7: 127-134 (1993), 및 Trask, B. J., Trends Genet . 7: 149-154 (1991)에서 리뷰하는 것과 같은 형광 인-시투 교잡(FISH), FACS, 또는 효모 인공 염색체,박테리아 인공 염색체,박테리아 P1 컨스트럭션 또는 단일 염색체 cDNA와 같은 인공 염색체 컨스트럭션을 포함한다.
한 바람직한 구체예에서, FISH는 채택되고(Verma 외 Human Chromosomes: A Manual of Basic Techniques, Pergamon Press, New York, N.Y. (1988)에 기재된 것과 같이) 다른 물리적인 염색체 맵핑 기술과 유전자 지도 데이터와 상관관계가 있을 수 있다. 유전자 지도 데이터의 예들은 1994년 Science 의 게놈 이슈(265: 1981f)에서 발견될 수 있다. 물리적 염색체 지도 및 특정 질환 또는 특정 질환의 예후에 대한 EML4-ALK 또는 TFG-ALK 융합 폴리펩타이드 또는 트런케이트된 활성화 ALK 카이네이즈 폴리펩타이드를 코딩하는 유전자의 위치 사이에 상관관계는 그 유전 질환과 관련된 DNA 부위를 한정하는데 도울 수 있다. 본 발명의 뉴크레오타이드 서열들은 정상, 보인자 또는 병에 걸린 환자 사이에서 유전자 서열들의 차이를 검출하는데 사용될 수 있다. 예를 들어 이중-칼라 구분점 FISH 프로브들은 샘플에서 돌연변이체 EML-4, TFG, 및/또는 ALK 유전자의 존재 또는 부존재를 검출하는데 채택될 수 있다.
확립된 염색체 마커들을 사용한 린케이지 분석과 같은 물리적 맵핑 기술 및 염색체 조제의 인 시투 교잡화는 유전자 지도를 확장하는데 사용될 수 있다. 종종 마우스와 같은 다른 포유류 종들의 염색체 상의 한 유전자의 위치는 비록 특정 인간 염색체의 암(arm)이나 수나 알려지지 않아도 관련된 마커들을 낼 수 있다. 새로운 서열들은 염색체 암 또는 그것의 부분들에 물리적 맵핑에 의하여 지정될 수 있다. 이것은 위치적 클로닝 또는 다른 유전자 발견 기술들을 사용하여 질병 유전자를 검색하는 연구자들에게 귀중한 정보를 제공한다. 일단 그 질병 또는 증후군이 특정 유전자 부위, 예를 들어 11q22-23에 존재하는 AT(Gatti 외, Nature 336: 577-580 (1988))에 유전자 연관에 의하여 대략 위치되면, 그 부위에 맵핑되는 어느 서열들은 더 깊은 연구를 위한 관련 또는 조절 유전자를 나타낼 수 있다. 본 대상 발명의 뉴크레오타이드 서열은 정상, 보인자 또는 병에 걸린 환자들 중에서 전위 , 역위 등으로 야기된 염색체 위치에서 차이를 검출하기 위하여 사용될 수 있다.
마이너 그루브-결합하는 부착된 올리고뉴크레오타이드 프로브와 같은 핵산 검출을 위한 다른 적합한 방법들(예를 들어 미국특허 제6,951,930호,"Hybridization-Triggered Fluorescent Detection of Nucleic Acids")은 당업자게 공지된다.
생물학적 샘플들.
본 발명의 방법들의 실행에 유용한 생물학적 샘플들은 EML4-ALK 또는 TFG-ALK 융합 폴리펩타이드의 발현에 의하여 특징화되는 암들이 존재하거나 발생하는 포유류로부터 얻어질 수 있다. 일 구체예에서,그 포유류는 인간이고 그 인간은 예를 들어 NSCLC와 같은 암의 치료에 대한 ALK-저해하는 치료체에 대한 후보일 수 있다. 그 인간 후보는 WHI-131 및/또는 WHI-154와 같은 ALK 카이네이즈 저해제로 현재 치료 중이거나 또는 치료를 고려하는 환자일 수 있다. 또 다른 구체예에서 그 포유류는 말 또는 소와 같은 큰 동물인 반면에 다른 구체예에서 그 포유류는 개 또는 고양이와 같은 작은 포유류이고 그들 모두는 폐암을 포함하는 암들을 발생하는 것으로 알려졌다.
포유류 암으로부터 유래한 세포(또는 세포의 추출물)을 포함하는 생물학적 샘플은 본 발명의 방법들에서 사용하기에 적합하다. EML-ALK 융합 폴리펩타이드의 경우에는 고형 또는 비-고형이든 간에 어떠한 암도 적합할 것이다. TFG-ALK의 경우에는, 고형 종양들이 본 발명의 방법들의 범위 내에 있다. 예를 들어 그 생물학적 샘플은 능막 일출물과 같은 일출물로부터 얻어진 세포들을 포함할 수 있다.늑막 일출물들(흉강에서 폐의 바깥에 만들어진 액체이고 암 세포를 포함)은 진행된 폐암(NSCLC를 포함하는)을 가지는 많은 환자에서 형성되는 것으로 알려졌으며, 그러한 일출물의 존재는 나쁜 결과와 짧은 생존 시간의 징후이다. 늑막 일출 샘플을 얻는 표준 기술들은 알려졌고, 당업계에 주지된다(Sahn, Clin Chest Med . 3(2): 443-52 (1982)참고). 순환하는 종양 세포들은 종양 마커들, 사이토케라틴 단백질 마커들 또는 (Ma 외, Anticancer Res . 23(1A): 49-62 (2003)참고)에 기재된 것과 같은 다른 네가티브 선택의 방법들을 사용하여 혈청으로부터 얻어질 수 있다. 혈청 및 골수 샘플들은 백혈병을 가진 환자에 대하여 특히 바람직할 수 있다.육종 및 암종과 같은 고형 종양들과 관련된 암들에 대하여 그 생물학적 샘플은 표준 임상 기술에 따라 얻어졌을 종양 생검으로부터 얻어진 세포를 포함할 수 있다. 예를 들어, ALK의 비정상적인 발현은 신경아세포종 및 신경외배엽 암을 포함하는 암들의 스펙트럼에서 관찰된다. 예를 들어 상기 Pulford 등의 레퍼런스 참고. 그러나 그 TFG-ALK 전위 돌연변이체는 림프종에서만 보고되고 고형 종양들에서는 전에 관찰되지 않았다.
생물학적 샘플은 ALK 융합 폴리펩타이드가 발현 및/또는 활성화되나 야생형 ALK 카이네이즈는 그러하지 아니하는 암으로부터 유래하는 세포들(또는 세포의 추출물)을 포함할 수 있다. 또한 그 샘플은 돌연변이체 ALK 폴리펩타이드와 야생형 ALK 카이네이즈 모두가 발현 및/또는 활성화되거나, 야생형 ALK 카이네이즈 및/또는 EML-4 및/또는 TFG가 발현 및/또는 활성화되나 돌연변이체 ALK 폴리펩타이드는 그러하지 아니하는 암으로부터 유래한 세포들을 포함할 수 있다.
앞의 생물학적 샘플들의 세포 추출물은 표준 기술들에 따라서 조(crude) 또는 부분적(또는 전부)정제되어 제조될 수 있고 본 발명의 방법들에 사용될 수 있다. 또한 전체 세포들을 포함하는 생물학적 샘플들은 상기에 설명한 것 같은 면역조직화학(IHC), 유동세포분석(FC), 면역형광(IF), 및 형광 인 시투 교잡(FISH)과 같은 바람직한 분석 포맷에서 이용될 수 있다. 그러한 전체 세포 분석은 그들이 종양 세포 샘플의 조작을 최소화하고 그래서 세포의 인 비보 신호/할성화 상태를 변경 및/또는 인위적인 신호를 투입하는 위험성을 감소시키는 점에서 유리하다. 전체 세포 분석은 그들이 종양 및 정상 세포의 혼합물에서 보다는 종양 세포에서만 발현 및 신호를 특성화하기 때문에 또한 유리하다.
한 화합물이 EML4-ALK 또는 TFG-ALK 융합 유전자 및/또는 융합 폴리펩타이드에 의하여 특성화되는 종양의 진행을 저해하는지를 결정하기 위한 기재된 방법들의 실행에 있어서, 포유류 골수 이식 모델 또는 이종이식 유래 세포들을 포함하는 생물학적 샘플은 유리하게 채택될 수 있다. 바람직한 이종이식(또는 이식 수용체)는 돌연변이체 ALK 카이네이즈 폴리펩타이드를 발현하는 인간 종양들을 가지는 마우스와 같은 작은 포유류이다. 인간 종양이식을 가지는 이종이식은 당업계에 주지되고( Kal, Cancer Treat Res . 72: 155-69 (1995)참고) 인간 종양을 가지는 포유류 이종이식의 생성은 잘 설명된다(Winograd 외, In Vivo . 1(1): 1-13 (1987)참고). 유사하게 골수 이식의 생성 및 이용은 잘 설명된다(예를 들어 Schwaller, 외, EMBO J. 17: 5321-333 (1998); Kelly 외, Blood 99: 310-318 (2002)참고). “에 의하여 특정된 암”에서 EML4-ALK 또는 TFG-ALK 융합 폴리뉴크레오타이드 및/또는 융합 폴리펩타이드는 그러한 융합 유전자 및/또는 융합 폴리펩타이드가 존재하지 않는 암과 비교할 때 그러한 돌연변이체 ALK 유전자 및/또는 발현된 폴리펩타이드가 존재하는 암을 의미한다.
포유류 암 종양으로부터 유래한 세포들을 포함하는 생물학적 샘플에서 돌연변이체 ALK 폴리뉴크레오타이드 존재 또는 폴리펩타이드 발현을 평가하는데 그러한 전위 및/또는 융합 단백질이 발생하지 않는 세포를 나타내는 대조군 세포들은 바람직하게는 비교의 목적으로 채택될 수 있다. 바람직하게는 대조군 샘플은 돌연변이(예를 들어 EML4-ALK 결손 돌연변이)가 발생하지 아니하고 또는 그 융합 폴리펩타이드가 발현되지 아니하는 서브세트를 나타내는 특정 암(예를 들어 NSCLC)의 서브세트로부터 유래한 암들을 포함한다. 따라서 테스트 생물학적 샘플과 대조군 샘플에서 레벨을 비교하는 것은 돌연변이체 ALK 폴리뉴크레오타이드 및/또는 폴리펩타이드가 존재하는지를 동정하는 것이다. 또한 EML4-ALK 및/또는 TFG-ALK 융합 폴리뉴크레오타이드 및/또는 폴리펩타이드가 대부분의 암에는 존재할 수 없으므로 그러한 돌연변이체 ALK 폴리펩타이드(또는 돌연변이체 폴리뉴크레오타이드를 가진)를 발현하지 않는 조직은 대조군으로 채택될 수 있다.
하기 기재된 방법들은 돌연변이체 ALK 폴리뉴크레오타이드 및/또는 폴리펩타이드에 의하여 특성화된 암들에 대한 값진 진단 용도, 및 그것과 관련된 치료 결정을 가질 것이다. 예를 들어 생물학적 샘플은 EML4-ALK 결손 돌연변이 및/또는 융합 폴리펩타이드에 의하여 특성화된 암을 가지는 것으로 전에 진단되지 아니하거나 그러한 암에 대한 치료를 받지 아니한 대상으로부터 얻어질 수 있고, 그 방법은 EML4-ALK 융합 폴리뉴크레오타이드 및/또는 폴리펩타이드가 존재 및/또는 발현되는 종양들(예를 들어 NSCLC)의 서브세트에 속하는 것과 같은 대상에서 종양을 진단적으로 동정하는데 채택된다. 본 발명의 방법들은 ALK 카이네이즈-저해하는 치료제 또는 치료제들의 혼합을 포함하는 조성물로 그 대상의 치료를 수반하는 돌연변이체 ALK 카이네이즈 폴리펩타이드-발현하는 암의 저해 또는 진행을 모니터하기 위하여 채택될 수 있다.
그러한 진단 분석은 수술 감시 과정 또는 예비적인 평가 전 또는 차후에 수행될 수 있다. 본 발명의 동정 방법은 WHI-131 및/또는 WHI-154 또는 그들의 아나로그와 같은 ALK 카이네이즈 활성을 저해하는 타겟된 치료제에 가장 잘 반응할 것 같은 EML4-ALK 및/또는 TFG-ALK 융합 단백질(들) 또는 트런케이트된 ALK 카이네이즈에 의하여 추동되는 NSCLC와 같은 암들을 가진 환자들을 동정하는 진단제로 유리하게 채택될 수 있다. 그러한 환자들을 선택하는 능력은 환자들에 그러한 약의 장차 처방 뿐 아니라 장차 ALK-타겟된 치료제의 효과의 임상적인 평가에 유용할 것이다.
진단제.
EML4-ALK 및/또는 TFG-ALK 융합 폴리뉴크레오타이드 및/또는 융합 폴리펩타이드가 존재하는 암을 선택적으로 동정하는 능력은 암의 치료에 대한 단일 물질로 투여될 때 그러한 종양이 ALK-저해하는 치료 조성물에 반응하기 쉽거나 여러 카이네이즈를 타겟팅하는 저해제에 부분적으로 또는 전체적으로 비-반응적인지를 결정하는데 유용한 정보를 얻는 것 뿐 아니라 진단의 목적으로 그러한 종양들을 정확하게 동정하는 중요한 새로운 방법들을 가능하게 한다.
따라서 일 구체예에서 본 발명은 포유류 암으로부터 유래한 생물학적 샘플에서 돌연변이체 ALK 폴리뉴크레오타이드 및/또는 그것의 코딩된 돌연변이체 ALK 폴리펩타이드의 존재를 검출하는 방법을 제공하고, 상기 방법은 :
(a) 포유류 암으로부터 생물학적 샘플을 얻고;
(b) ALK 돌연변이체 폴리뉴크레오타이드 및/또는 그것의 코딩된 돌연변이체 ALK 폴리펩타이드가 상기 생물학적 샘플에 존재하는지를 결정하기 위하여 2차 단백질의 일부를 가지는 ALK 돌연변이체를 포함하는 융합 폴리뉴크레오타이드, 또는 그것에 의하여 코딩되는 융합 폴리펩타이드를 검출하는 적어도 하나의 시약을 이용하는 단계를 포함한다.
일부 바람직한 구체예에서 그 암은 고형 육종 또는 암종이고 일 구체예에서 그 암종은 NSCLC와 같은 폐암이다. 또다른 바람직한 구체예에서 그 돌연변이체 ALK 폴리펩타이드는 상기 2차 단백질의 부위를 가지는 ALK 의 잔기 1116-1383을 포함하는 융합 폴리펩타이드(서열번호 5)이다. 또다른 바람직한 구체예에서, 그 2차 단백질은 EML-4 (서열번호 3) 및 TRK-융합된 유전자(TFG) 단백질 (서열번호 22)로 구성된 군으로부터 선택된다. 또다른 바람직한 구체예에서 그 융합 폴리펩타이드는 EML-4의 잔기 1-233 또는 잔기 1-495 (서열번호 3) 또는 TFG의 잔기 1-138(서열번호 22)를 포함한다.
다른 바람직한 구체예에서, 그 융합 폴리뉴크레오타이드는 EML4-ALK 융합 폴리뉴크레오타이드 (서열번호 2 또는 19) 또는 TFG-ALK 융합 폴리뉴크레오타이드 (서열번호 21)을 포함하는 반면, 또다른 구체예에서 그 융합 폴리펩타이드는 EML4-ALK 융합 폴리펩타이드 (서열번호 1 또는 18) 또는 TFG-ALK 융합 폴리펩타이드 (서열번호 20)를 포함한다. 또다른 바람직한 구체예에서 그 융합 폴리뉴크레오타이드는 상기에 기재된 EML4-ALK 융합 폴리뉴크레오타이드 또는 폴리펩타이드이다.
더욱 바람직한 구체예에서 그 방법은 상기에 기재된 것과 같은 EML4-ALK 융합 폴리뉴크레오타이드 및/또는 적어도 한 EML4-ALK 융합 폴리펩타이드-특이적인 시약(항체 또는 AQUA 펩타이드)를 포함하는 시약을 채택한다. 일부 바람직한 구체예에서 그 시약은 TFG-ALK 융합 폴리펩타이드 (서열번호 20) 또는 TFG-ALK 융합 폴리뉴크레오타이드 (서열번호 21)에 특이적으로 결합하거나 검출하지만 야생형 TFG 또는 야생형 ALK에는 결합하거나 검출하지 않는 분리된 시약을 포함한다. 다른 바람직한 구체예에서 그 시약은 중합효소 연쇄반응(PCR) 프로브 또는 형광 인 시투 교잡(FISH) 프로브이다. 일부 바람직한 구체예는 야생형 ALK 내에 TFG-ALK 융합 폴리펩타이드의 융합 접합점 또는 트런케이트된 지점의 아미노산 서열을 포함하는 중 동위원소 표지된 (AQUA) 펩타이드를 채택한다 .
일부 바람직한 구체예에서 본 발명의 진단 방법은 상기에 기재된 것과 같은 세포유동분석(FC), 면역조직화학(IHC), 또는 면역형광(IF) 분석 포맷에서 이행된다. 또다른 바람직한 구체예에서, 그 EML4-ALK 또는 TFG-ALK 융합 폴리펩타이드의 활성은 검출된다. 다른 바람직한 구체예에서 본 발명의 진단 방법은 상기 기재된 것과 같은 중합효소 연쇄반응(PCR) 또는 형광 인 시투 교잡(FISH) 분석 포맷에서 이행된다.
본 발명은 그 화합물이 EML4-ALK 또는 TFG-ALK 융합 폴리뉴크레오타이드 및/또는 융합 폴리펩타이드에 의하여 특성화되는 암의 진행을 저해하는지를 결정하는 방법을 더욱 제공하고, 그 방법은 상기 암에서 상기 화합물이 상기 EML4-ALK 또는 TFG-ALK 융합 폴리펩타이드의 발현 및/또는 활성을 저해하는지를 결정하는 단계를 포함한다. 바람직한 구체예에서 그 ALK 융합 폴리펩타이드의 발현 및/또는 활성의 저해는 여기에 기재된 본 발명의 EML4-ALK 융합 폴리뉴크레오타이드 또는 폴리펩타이드 및/또는 TFG-ALK 융합 폴리뉴크레오타이드 또는 폴리펩타이드를 검출하는 적어도 하나의 시약을 사용하여 결정된다. ALK 카이네이즈 활성의 저해에 적합한 화합물들은 하기 섹션 G에서 더욱 상술한다.
본 발명의 방법들의 실행에 유용한 돌연변이체 ALK 폴리뉴크레오타이드 프로브들 및 폴리펩타이드-특이적인 시약들은 상기 섹션 B 및 D에서 더욱 상세하게 설명되었다. 한 바람직한 구체예에서 그 ALK 융합 폴리펩타이드-특이적인 시약은 융합 폴리펩타이드-특이적인 항체를 포함한다. 또 다른 바람직한 구체예에서 그 융합 폴리펩타이드-특이적인 시약은 ALK 융합 폴리펩타이드의 융합 접합점(도 1A-C (하단 패널)참고)에 해당하는 중-동위원소 표지된 포스포펩타이드(AQUA 펩타이드)를 포함한다. 또 다른 바람직한 구체예에서 그 융합 폴리뉴크레오타이드-특이적인 시약은 ALK 융합 유전자의 융합 접합점 및/또는 야생형 EML4, TFG, 또는 ALK 유전자들의 구분점에 해당하는 FISH 프로브를 포함한다.
상기에 기재된 본 발명의 방법들은 상기 생물학적 샘플에서 야생형 ALK 및 EGFR, 또는 다른 다운스트림 신호 분자와 같은 다른 카이네이즈의 발현 또는 활성화의 수준을 결정하는 단계를 선택적으로 포함할 수도 있다. 주어진 생물학적 샘플에서 다른 카이네이즈 및 경로의 발현/활성화 및 ALK 융합 폴리펩타이드 발현/활성화 모두를 프로화일링하는 것은 어떠한 카이네이즈 및 경로가 그 질환을 유도하고 따라서 어떠한 치료 법이 가장 효과적일 수 있는지에 대한 귀중한 정보를 제공할 수 있다.
화합물 스크리닝.
여기에 기재된 새로운 EML4-ALK 융합 폴리펩타이드의 발견은 이 돌연변이체 ALK 단백질의 활성, 특히 그것의 ALK 카이네이즈 활성을 저해하는 새로운 화합물을 개발할 수 있게 한다. 따라서 본 발명은 한 화합물이 EML4-ALK 융합 폴리뉴크레오타이드 및/또는 융합 폴리펩타이드에 의하여 특성화되는 암을 저해하는지를 결정하는 방법을 제공하고, 상기 방법은 상기 화합물이 상기 암에서 상기 EML4-ALK 융합 폴리펩타이드의 활성 및/또는 발현을 저해하는지를 결정하는 단계를 포함한다. 한 바람직한 구체예에서, EML4-ALK 융합 폴리펩타이드의 활성 및/또는 발현의 저해는 본 발명의 융합 폴리뉴크레오타이드 및/또는 융합 폴리펩타이드를 검출하는 적어도 하나의 시약을 사용하여 결정된다. 본 발명의 바람직한 시약들은 상기에 기재되었다. ALK 카이네이즈 활성의 저해에 적합한 화합물들은 하기 섹션 G에서 더욱 상세하게 기재된다.
예를 들어 그 화합물은 작은 분자 또는 항체 저해제와 같은 카이네이즈 저해제일 수 있다. 그것은 7개의 다른 카이네이즈에 대한 활성을 가지는 범-카이네이즈 저해제 또는 카이네이즈-특이적인 저해제일 수 있다. ALK 카이네이즈-저해하는 화합물은 하기 섹션 G에서 더욱 상세하게 설명된다. 환자 생물학적 샘플은 저해제로 처리 전과 후에 얻어서 상기에 기재된 방법들을 사용하여서 다운스트림 기질 단백질의 인산화를 포함하는 ALK 카이네이즈 활성에 대한 저해제의 생물학적 효과를 분석할 수 있다. 그러한 약동학적 분석은 바람직하게는 최대 수인할수 있는 용량일 약물의 생물학적으로 활성 용량을 결정하는데 유용할 수 있다. 그러한 정보는 또한 약물 작용 기작을 나타내어 약 승인을 위한 제출에도 유용할 것이다. 그러한 바람직한 저해 특성을 가진 화합물을 동정하는 것은 하기 섹션 G에서 더욱 기재된다.
G. 암들의 치료적 저해.
본 발명에서 EML4-ALK 융합 단백질이 발현되는 포유류 고형 종양 암의 진행은 그러한 암에서 ALK 카이네이즈의 활성을 저해하여 인 비보에서 저해될 수 있다는 것을 보였다. 유사하게 여기에서 기재한 바와 같이 TFG-ALK 융합 단백질이 발현되는 포유류 고형 종양 암의 진행은 그러한 암에서 ALK 카이네이즈의 활성을 저해하여 인 비보에서 유사하게 저해될 수 있다. 돌연변이체 ALK 폴리펩타이드의 발현에 의하여 특징지워지는 암들에서 ALK 활성은 WHI-131 또는 WHI-154와 같은 소-분자 카이네이즈 저해제와 같은 ALK 카이네이즈-저해하는 치료제로 암(예를 들어 종양)을 저해하여 저해될 수 있다. 하기 실시예 2에서 더욱 기재된 바와 같이, 예를 들어 ALK 융합 단백질-발현하는 종양들의 성장 저해는 ALK-저해하는 치료제의 예시적인 타입인, siRNA를 사용하여 융합 카이네이즈를 저해하여 달성될 수 있다. 따라서 본 발명은 암에서 돌연변이체 ALK 카이네이즈의 발현 및/또는 활성을 저해하여서 AEML4-ALK 융합 폴리펩타이드을 발현하는 암 또는 TFG-ALK 융합 폴리펩타이드를 발현하는 고형 종양의 진행을 저해하는 방법을 제공한다.
ALK 카이네이즈-저해하는 치료제는 하기 기재된 예시적인 화합물의 군을 포함하여 인 비보에서 ALK 카이네이즈의 발현 및/또는 활성을 직접 또는 간접적으로 저해하는 적어도 하나의 생물학적 또는 화학적 화합물을 포함하는 조성물일 수 있다. 그러한 화합물들은 ALK 카이네이즈 자체 또는 단백질들 또는 ALK의 활성을 변형하는 분자들에 직접적으로 작용하거나 또는 ALK의 발현을 저해하여서 간접적으로 작용하는 치료제들을 포함한다. 그러한 화합물들은 또한 다중 치료제들(다른 RTK들에 대한 것들을 포함하는)을 포함하는 조성물 뿐 아니라 단일 ALK 카이네지즈 저해하는 화합물을 포함하는 조성물들을 포함하고, 그것은 화학치료제와 또는 일반적인 전사 저해제같은 비특이적인 치료제를 포함할 수 있다.
소-분자 저해제들.
일부 바람직한 구체예에서, 본 발명의 실행에 유용한 ALK-저해하는 치료제는 WHI-131 및 WHI-154, 또는 그들의 아나로그들과 같은 타겟된 소 분자 저해제이다. WHI-131 및 WHI-154는 ALK의 퀴나졸린(quinazoline)-타입 소 분자 타겟된 저해제이고 그들의 특성은 알려졌다. Marzec 외, Lab. Invest. 85(12): 1544-54 (2005)참고. 이들 화합물들은 림프종 세포의 에팝토시스를 유도하고 증식을 억제하는 것으로 알려졌다. 카이네이즈들의 다른 소 분자 타겟된 저해제들도 당업계에 주지된다. 예를 들어 BCR-ABL 융합 카이네이즈(뿐 아니라 다른 카이네이즈들)의 ATP-결합하는 자리에 특이적으로 결합하고 차단하고 그래서 이 효소의 인산화와 활성을 저해하는 글리벡 (STI-571, Imatinib)은 상업적으로 이용가능하고 그 특성들이 주지되었다. 예를 들어 Dewar 외, Blood 105(8): 3127-32 (2005) 참고. 다른 ALK의 소-분자 저해제는 현재 Novartis 및 Cephalon에 의하여 개발 중이다.
소 분자 타겟된 저해제들은 효소의 촉매자리에 결합 및/또는 ATP-결합 부위에 결합 또는 효소가 그것의 활성에 필요한 형태를 가지는 것을 저해하는 효소 내의 다른 결합 자리에 특이적이고 종종 비가역적으로 결합하여서 그들의 타겟 효소의 활성을 전형적으로 저해하는 분자들의 군이다. 소 분자 저해제들은 ALK 카이네이즈 3차 구조의 컴퓨터 모델링 또는 X-레이 결정학을 사용하여 고안될 수 있거나 ALK의 저해에 대한 화합물 라이브러리의 고성능 스크리닝에 의하여 발견될 수 있다. 그러한 방법들은 당업계에 주지되고 알려졌다. ALK 저해의 특이성은 예를 들어 상기 기재된 것과 같이 폐암 세포를 포함하는 생물학적 샘플에서 ALK 활성의 저해를 조사 및/또는 카이네이즈 패널에서 ALK 활성뿐 아니라 다른 카이네이즈 활성을 저해하는 그러한 화합물의 능력을 조사하여 확인될 수 있다. 그러한 스크리닝 방법들은 하기에서 더욱 설명한다.
항체 저해제들.
본 발명의 방법들에서 유용한 ALK 카이네이즈-저해하는 치료제들은 ALK 활성에 필요한 중요한 촉매 또는 결합 자리 또는 도메인에 특이적으로 결합하고 ALK에 리간드, 기질 또는 이차 분자들의 접근을 차단하고 또는 효소가 그것의 활성에 필요한 형태를 채택하는 것을 저해하여서 카이네이즈를 저해하는 타겟된 항체들일 수 있다. 인간화된 타겟-특이적인 항체들의 생산, 스크리닝 및 치료적 용도는 잘 알려졌다. Merluzzi 외, Adv Clin Path . 4(2): 77-85 (2000) 참고. 인간화된 타겟-특이적인 저해하는 항체들의 고성능 생성 및 스크리닝에 대한 Morphosys, 회사의 Human Combinatorial Antibody Library (HuCAL)와 같은 상업적인 기술 및 시스템이 가능하다.
여러 항-수용체 카이네이즈 타겟된 항체들의 생성 및 그 타겟 수용체의 활성을 저해하는 용도는 알려졌다. 예를 들어 미국특허 공개번호 20040202655, 2004년 10월 14일 “Antibodies to IGF-I Receptor for the Treatment of Cancers,”Morton 외; 미국특허 공개번호 20040086503, 2004년 4월 15일 “Human anti-Epidermal Growth Factor Receptor Single-Chain Antibodies," Raisch 외; 미국특허 공개번호 20040033543,2004년 2월 19일에 ”Treatment of Renal Carcinoma Using Antibodies Against the EGFr," Schwab 외 참고. 수용체 타이로신 카이네이즈 활성-저해하는 항체들의 생산 및 사용을 위한 표준화된 방법들이 당업계에 공지되었다. 예를 들어 유럽특허 EP1423428,2004년 6월 2일 “Antibodies that Block Receptor Tyrosine Kinase Activation, Methods of Screening for and Uses Thereof,”Borges 외 참고.
파지 디스플레이 방법은 ALK-특이적인 항체 저해제들을 생성하는데 채택될 수 있고 박테리오파지 라이브러리 구축 및 재조합 항체들의 선택에 대한 프로토콜은 주지된 레퍼런스 교재인 Current Protocols in Immunology, Colligan 외 (Eds.), John Wiley & Sons, Inc. (1992-2000), 17 장, 섹션 17.1에 가재된다. 또한 2001년 11월 20일 등록된 미국특허 제 6,319,690호, Little 외; 2001년 10월 9일 등록된 미국특허 제 6,300,064호, Knappik 외; 미국특허 제 5,840,479호, November 24, 1998년 11월 24일, Little 외; 미국 특허 공개번호 제 20030219839호, 2003년 11월 27일, Bowdish 외 참고.
박테리오파지의 표면상에 나타난 항체 절편의 라이브러리는 생성되고(예를 들어 미국특허 제 6,300,064호, 2001년 10월 9일, Knappik 외) 수용체 단백질 타이로신 카이네이즈(ALK와 같은)의 가용부 다이머 형태에 결합에 대하여 스크링될 수 있다. 스크리닝에 대하여 사용된 RTK의 가용부 다이머 형태에 결합하는 항체 절편은 세포에서 타겟 RTK의 컨스티투피브 활성화를 막는 후보 물질로서 동정된다. 상기 유럽특허 EP1423428, Borges 외, 참고.
상기에 기재된 것과 같이 항체 라이브러리의 스크리닝에서 동정된 ALK 결합 타겟된 항체들은 인 비트로 카이네이즈 분석 및 인 비보 세포주 및/또는 종양들 모두에서 ALK의 활성을 저해하는 그들의 능력이 더욱 스크리닝될 수 있다. ALK 저해는 상기에 기재된 것과 같이 폐암 세포를 포함하는 생물학적 샘플에서 ALK 활성의 저해를 조사 및/또는 카이네이즈들의 패널에서 ALK 활성뿐 아니라 다른 카이네이즈 활성을 저해하는 그러한 화합물의 능력을 조사하여 확인될 수 있다. 그러한 ALK 카이네이즈 저해를 스크리닝 방법들은 상기에서 더욱 설명된다.
간접 저해제들.
여기 개재된 방법들의 실행에 유용한 ALK-저해하는 화합물들은 ALK 카이네이즈 자체 이외에 단백질 또는 분자들의 활성을 저해하여서 ALK 활성을 간접적으로 저해하는 화합물일 수 있다. 그러한 저해하는 치료제들은 ALK 자체를 인산화 또는 탈인산화(그리고 따라서 활성화 또는 비활성화)하는 주된 조절 카이네이즈의 활성을 조절하는 타겟된 저해제 또는 리간드들의 결합을 방해하는 타겟된 저해제일 수 있다. 다른 수용체 타이로신 카이네이즈와 같이 STAT5 및AKT를 포함하는 어댑터 단백질들 및 다운스트림 카이네이즈들를 통한 다운스트림 신호전달을 조절한다. 결과적으로 ALK 활성에 의한 세포 성장 및 생존의 유도는 이들 상호작용 또는 다운스트림 단백질들을 타겟하여서 저해될 수 있다. 이 형태로 사용될 수 있는 현재 개발 중인 의약품은 Wartmanin을 포함한다.
ALK 카이네이즈 활성은 ALK가 그것의 활성 형태를 채택하기에 필요한 활성 분자들의 결합을 저해하는 화합물을 사용하여 간접적으로 저해될 수 있다. 유사하게 예를 들어 PDGF 수용체 타이로신 카이네이즈를 다운 레굴레이트하는 항-PDGF 항체들의 생산 및 사용이 알려졌다. 미국특허 공개번호 20030219839, “Anti-PDGF Antibodies and Methods for Producing Engineered Antibodies,"Bowdish 외 참고
ALK 활성의 간접적인 저해제들은 ALK 카이네이즈 3차 구조의 컴퓨터 모델링 또는 X-레이 결정학을 사용하여 고안될 수 있거나 ALK 카이네이즈 활성의 저해를 야기하는 필요한 결합 단백질 및/또는 주된 업스트림 조절 효소들의 저해에 대한 화합물 라이브러리의 고성능 스크리닝에 의하여 발견될 수 있다. 그러한 방법들은 당업계에 주지되고 알려졌다. 그러한 치료제에 의한 ALK 저해는 예를 들어 상기에 기재된 것과 같이 NSCLC 세포들과 같은 암 세포들을 포함하는 생물학적 샘플에서 ALK 활성의 저해를 조사 및/또는 카이네이즈의 패널에서 ALK 활성 뿐 아니라 다른 카이네이즈 활성을 저해하는 화합물의 활성을 조사하여서 확인될 수 있다. EML4-ALK 또는 TFG-ALK 융합 폴리뉴크레오타이드 및/또는 융합 폴리펩타이드에 의하여 특성화된 암을 저해하는 화합물들을 동정하는 방법은 하기에서 더욱 설명한다.
앤티 -센스 및/또는 전사 저해제들.
ALK 저해하는 치료제들은 ALK 및/또는 EML4-ALK를 코딩하는 유전자 또는 TFG-ALK 융합 유전자들 또는 트런케이트된 ALK 유전자들의 전사를 억제하여 ALK 카이네이즈 활성을 저해하는 앤티-센스 및/또는 전사 저해하는 화합물들을 포함할 수 있다. 예를 들어, 암의 치료를 위한 앤티-센스 치료에 의한 VEGFR, EGFR, 및 IGFR, 및 FGFR를 포함하는 여러 수용체 카이네이즈들의 저해는 알려졌다. 예를 들어 미국 특허 제 6,734,017호; 6,710,174, 6,617,162; 6,340,674; 5,783,683; 5,610,288을 참고.
앤티센스 올리고뉴크레오타이드는 공지된 기술에 따라 타겟 유전자에 대한 치료제로 고안, 구축되고 채택될 수 있다. 예를 들어 Cohen, J., Trends in Pharmacol. Sci . 10(11): 435-437 (1989); Marcus-Sekura, Anal . Biochem . 172: 289-295 (1988); Weintraub, H., Sci . AM . pp. 40-46 (1990); Van Der Krol 외, BioTechniques 6(10): 958-976 (1988); Skorski 외, Proc . Natl . Acad . Sci . USA (1994) 91: 4504-4508 참고. EGFR의 앤티센스 RNA 저해제를 사용하여 인 비보에서 인간 암 성장의 저해는 최근에 알려졌다. 미국특허 공개번호 20040047847, “Inhibition of Human Squamous Cell Carcinoma Growth In vivo by Epidermal Growth Factor Receptor Antisense RNA Transcribed from a Pol III Promoter," 2004년 3월 11일, He 외 유사하게 포유류 ALK 유전자(도 4(서열번호 6)참고) 또는 EML4-ALK 또는 TFG-ALK 융합 폴리뉴크레오타이드 또는 트런케이트된 ALK 폴리뉴크레오타이드 (도 2A-C (서열번호 2, 19, 및 21)참고)에 대한 적어도 하나의 올리고뉴크레오타이드를 포함하는 ALK-저해하는 치료제는 상기 기재된 방법들에 따라서 제조될 수 있다. ALK-저해하는 앤티센스를 포함하는 약학적 조성물이 하기에서 더욱 기재된 것과 같이 제조되고 투여될 수 있다.
작은 간섭( Si )RNA.
RNA 간섭의 과정을 통하여 ALK의 번역을 저해하고 따라서 활성을 저해하는 작은 간섭 RNA 분자(siRNA)는 본 발명의 방법들에서 바람직하게 채택될 수 있다. 타겟 단백질을 코딩하는 mRNA에 상보적인 서열을 포함하는 외부(exogenous) 작은 이중가닥 RNA분자들의 투여에 의한 타겟 단백질 발현의 선택적인 사일런싱 및 RNA 간섭은 잘 알려졌다. 예를 들어 미국 특허 공개번호 20040038921, “Composition and Method for Inhibiting Expression of a Target Gene," 2004년 2월 26일, Kreutzer 외 미국특허공개번호 20020086356, ”RNA Sequence-Specific Mediators of RNA Interference," 2003년 6월 12일, Tuschl 외; 미국특허 공개번호 20040229266, “RNA Interference Mediating Small RNA Molecules," 2004년 11월 18일, Tuschl 외 참고
예를 들어 여기에 나타낸 것과 같이(실시예 2 참고), 그 융합 단백질을 발현하는 인간 NSCLC 세포주에서 EML4-ALK 융합 단백질의 발현의 siRNA-매개된 사일런싱은 그들 세포들에서 질병의 진행을 선택적으로 억제하지만 돌연변이체 ALK 단백질을 발현하지 아니하는 대조군 세포에서는 그러하지 아니하다.
이중 가닥 RNA 분자들(dsRNA)은 RNA 저해(RNAi)로 알려진 매우 보존된 조절 기작에서 유전자 발현을 억제하는 것으로 알려졌다. 간략하게는 그 RNAse III Dicer는 dsRNA를 22 뉴크레오타이드의 작은 간섭 RNA (siRNA)들로 분해하고 그리고 그것은 가이드 서열이 RNA-유도된 사일런싱 복합체 RISC에 의하여 타겟-특이적인 mRNA 절단을 유도하는 작용을 한다(Hammond 외, Nature (2000) 404: 293-296 참고). RNAi는 촉매타입 반응에 관하여고 그것에 의하여 새로운 siRNA들은 더 긴 dsRNA의 연속적인 절단을 통항여 생성된다. 따라서 앤티센스와 다르게 RNAi는 비-화학량적인 형태로 타겟 RNA를 분해한다. 세포 또는 생물체에 투여될 때, 외인성 dsRNA는 RNAi를 통하여 내생적인 메신저 RNA(mRNA)의 서열-특이적인 분해를 지시하는 것으로 알려졌다.
포유류 세포들에서 그들의 발현 및 사용을 위한 벡터 및 스스템들을 포함하는 광범위한 다양한 타겟-특이적인 siRNA 산물들은 현재 상업적으로 구입가능하다. 예를 들어 Promega, Inc. (promega.com); Dharmacon, Inc. (dharmacon.com) 참고. RNAi에 대한 dsRNA의 고안, 구축 및 사용에 대한 상세한 기술적인 매뉴얼이 가능하다. 예를 들어 Dharmacon의 “RNAi Technical Reference & Application Guide"; Promega의 ”RNAi: A Guide to Gene Silencing."를 참고. ALK-저해하는 siRNA 산물들은 또한 상업적으로 구입가능하고 본 발명의 방법에 적당하게 채택될 수 있다. 예를 들어 Dharmacon, Inc., Lafayette, CO (Cat Nos. M-003162-03, MU-003162-03, D-003162-07 thru -10 (siGENOME™SMARTselection 및 SMARTpoolsiRNAs)참고.
타겟 mRNA 서열의 부분에 실질적으로 동일한 적어도 한 서열을 포함하고 49 뉴크레오타이드 길이 이하 그리고 바람직하게는 19-25 뉴크레오타이드의 작은 dsRNA이고, 그 dsRNA는 한 말단에서 적어도 하나의 1-4 뉴크레오타이드의 오버행을 적절하게 가지는 dsRNA는 포유류에서 RNAi를 매개하는데 가장 효과적이다라는 것이 최근에 확립되었다. 미국특허 공개번호 20040038921, 상기 Kreutzer 외, 미국특허 공개번호 20040229266, 상기 Tuschl 외 참고. 그러한 dsRNA 구축과 인 비보에서 타겟, 단백질의 발현을 사일런싱하는 약학 조제물의 용도는 그러한 공개본에 상세하게 기재된다.
예를 들어 만약 포유류에서 타겟되는 유전자의 서열이 공지되었다면, 21-23 nt RNA들은 인간이나 다른 영장류 세포와 같은 포유류 세포에서 생성될 수 있고 RNAi를 매개하는 그들의 능력을 테스트될 수 있다. 바람직하게는 그들의 인 비보 효과를 더욱 평가하기 위하여 적당한 동물 모델에서 RNAi를 매개하는 것으로 알려진 그 21-21 nt RNA 분자들은 테스트될 수 있다. 공지된 타겟 부위들, 예를 들어 다른 핵산 분자들 예를 들어 리보자임 또는 앤티센스, 또는 돌연변이들 또는 결손들을 포함하는 그러한 부위들과 같은 질병 또는 이상과 관련된 것으로 알려진 그러한 부위들에 의한 연구들에 기초된 효과적인 타겟 부위들로 결정된 타겟 부위들은 또한 그 부위들을 타겟팅하는 siRNA 분자들을 고안하는데 사용될 수 있다.
또한 효과적인 dsRNA 서열은 예를 들어 컴퓨터 폴딩 알고리즘을 사용하여서 타겟 부위에 대한 흥미있는 타겟 mRNA를 스크리닝하는 것이 합리적으로 고안/예측될 수 있다. 그 타겟 서열은 Oligo, MacVector, 또는 GCG 위스콘신 패키지와 같은 상업적인 서열분석 프로그램 또는 통상적인 Perl script를 사용하여 모든 절편들 또는 특정 길이, 예를 들어 23 뉴크레오타이드 절편들의 서브시퀀스들의 리스트로 인 실리코 분석될 수 있다.
여러 매개변수(parameter)들은 어느 부위가 타겟 RNA 서열 내에 가장 적합한 타겟 부위들인지를 결정하는데 사용될 수 있다. 이들 매개변수들은 2차 또는 3차 RNA 구조, 타겟 서열의 뉴크레오타이드 염기 조성물, 타겟 서열의 여러 부위들 사이의 상동성의 정도, 또는 그 RNA 전사체 내에 타겟 서열의 상대적인 위치를 포함하나 이에 한정되지 아니한다. 이들 결정에 기초하여 RNA 전사체 내에서 타겟 부위들의 수는 예를 들어 인 비트로 RNA 절단 분석, 세포 배양 또는 동물 모델을 사용하여 효과에 대한 siRNA 분자들의 스크리닝에 선택될 수 있다. 예를 들어 미국특허 공개번호 20030170891, 2003년 9월 11일, McSwiggen J 참고. RNAi 타겟 부위들의 선택 및 동정을 위한 알고리즘은 최근에 알려졌다.미국특허공개번호 20040236517, “Selection of Target Sites for Antisense Attack of RNA,"2004년 11월 25일, Drlica 외 참고.
통상적으로 사용된 유전자 전달 기술들은 인산 칼슘, DEAE-덱스트란, 전기천공 및 미세주입 및 바이러스 방법을 포함한다(Graham 외 (1973) Virol . 52: 456; McCutchan 외, (1968), J. Natl . Cancer Inst . 41: 351; Chu 외 (1987), Nucl . Acids Res . 15: 1311; Fraley 외 (1980), J. Biol . Chem . 255: 10431; Capecchi (1980), Cell 22: 479). DNA는 양이온성 리포좀을 사용하여 세포로 투입될 수도 있다(Feigner 외 (1987), Proc . Natl . Acad . Sci USA 84: 7413). 상업적으로 구입가능한 양이온성 리포좀 조제들은 Tfx 50 (Promega) 또는 Lipofectamin 200 (Life Technologies)을 포함한다. 또한 바이러스 벡터는 세포로 dsRNA를 운반하고 RNAi를 매개하기 위하여 채택될 수 있다. 미국특허 공개번호 20040023390, “siRNA-mediated Gene Silencing with Viral Vectors," 2004년 2월 4일, Davidson 외 참고.
포유류 세포에서 RNAi에 대한 벡터/발현 시스템들 및 트랜스팩션은 상업적으로 구입가능하고 잘 알려졌다. 예를 들어 Dharmacon, Inc., DharmaFECT™system; Promega, Inc., siSTRIKE™U6 Hairpin system; 또한 Gou 외 (2003) FEBS . 548, 113-118; Sui, G. 외 A DNA vector-based RNAi technology to suppress gene expression in mammalian cells (2002) Proc . Natl . Acad . Sci . 99, 5515-5520; Yu 외 (2002) Proc . Natl . Acad . Sci . 99, 6047-6052; Paul, C. 외 (2002) Nature Biotechnology 19, 505-508; McManus 외 (2002) RNA 8, 842-850 참고.
제조된 dsRNA 분자들을 사용한 포유류에서 siRNA 간섭은 포유류에 dsRNA를 포함하는 약학적 조제물을 투여하여 달성될 수 있다. 그 약학 조성물은 타겟 유전자의 발현을 저해하기 충분한 양으로 투여된다. dsRNA는 전형적으로 매일 kg 체중 당 5 mg 이하의 용량으로 투여될 수 있고 타겟 유전자의 발현을 완전하게 억제하거나 저해하는데 충분하다. 일반적으로 적절한 dsRNA의 용량은 매일 수용인의 kg 체중 당 0.01에서 2.5 mg범위, 바람직하게는 매일 kg 체중 당 0.1에서 200 mg의 범위, 더욱 바람직하게는 매일 kg 체중 당 0.1에서 100 mg의 범위, 더욱 바람직하게는 매일 kg 체중 당 1.0에서 50 mg의 범위, 가장 바람직하게는 매일 kg 체중 당 1.0에서 25 mg의 범위이다. 상기 dsRNA를 포함하는 약학 조성물은 예를 들어 당업계에서 주지된 서방형 조성을 사용하여서 하루 1회 또는 여러 양으로 여러 번 투여된다. 각 약학 조성물의 조제 및 투여는 하기에서 더욱 기재된 것과 같은 표준 기술들에 따라서 수행될 수 있다.
그 다음에 그러한 dsRNA는 상기에 기재된 것과 같이 치료적으로 유효한 양의 그러한 dsRNA를 포함하는 약학적 제제를 제조하고, 예를 들어 종양에 직접 주사를 통하여 EML4-ALK 또는 TFG-ALK 융합 단백질 또는 트런케이트된 활성 ALK 카이네이즈를 발현하는 암을 가진 인간에서 그 제제를 투여하여 암에서 ALK 발현 및 활성을 억제하는데 사용될 수 있다. siRNA 저해제를 사용한 VEGFR 및 EGFR와 같은 다른 수용체 타이로신 카이네이즈의 유사한 저해가 최근에 알려졌다. 미국특허 공개번호 20040209832, 2004년 10월 21일, McSwiggen 외; 미국특허공개번호 20030170891, 2003년 9월 11일, McSwiggen; 미국특허공개번호 20040175703, 2004년 9월 9일, Kreutzer 외 참고.
치료 조성물; 투여.
본 발명의 방법들의 실행에 유용한 ALK 카이네이즈-저해하는 치료 조성물은 경구 및 복막 경로에 한정되지 아니하고 정맥내, 근육내, 복막내, 피하내, 경피, 공기(에어로졸), 직장, 질내 및 국소(협측 및 설하를 포함하는) 투여를 포함하는 당업계에 공지된 수단들에 의하여 포유류에 투여될 수 있다.
경구 투여를 위하여 ALK-저해하는 치료제는 분말 또는 입자로서 또는 수용액 또는 서스팬전으로서 정제 또는 캡슐의 형태로 일반적으로 제공될 수 있다. 경구용 정제는 불활성 희석제, 붕해제, 결합제, 윤활제, 감미제, 향료, 발색제 및 보존제와 같은 약학적으로 수용가능한 첨가제와 혼합된 활성 성분을 포함할 수 있다. 적당한 비활성 희석제들은 탄산 나트륨과 칼슘, 인산 나트륨과 칼슘, 그리고 유당을 포함하고, 적당한 붕해제는 옥수수 전분 및 알긴산이다. 결합제는 녹말과 젤라틴을 포함하고, 만약 존재한다면 윤활제는 일반적으로 마그네슘 스테아레이트, 스테아레이트 또는 탈크일 것이다. 바람직하다면 그 정제들은 위장관에서 흡수를 늦추기 위하여 글리세릴 모노스테아레이트, 또는 글리세릴 다이스테아레이트와 같은 물질로 코팅될 수 있다.
구강용 캡슐들은 활성 성분들이 고체 희석제와 혼합된 경성 젤라틴 캡슐 및 그 활성 성분은 물 또는 땅콩 기름, 액체 파라핀 또는 올리브 유와 같은 기름과 혼합된 연성 젤라틴 캡슐을 포함한다. 근육내, 복강내, 피하내, 정맥내 용도로 본 발명의 약학 조성물은 적당한 pH 와 등장도(isotonicity)로 버퍼된 멸균된 수용액 또는 서스팬전으로 일반적으로 제공될 수 있다. 적절한 수용액 비히클은 링게르 용액 및 등장 염화나트륨을 포함한다. 그 담체는 수용성 버퍼를 배제적으로 포함할 수 있다("배제적으로"는 ALK-저해하는 치료제의 섭취를 매개하거나 영향을 주는 부가제 또는 캡슐화하는 물질이 없다는 것을 의미한다). 그러한 물질들은 예를 들어 하기에서 설명하는 것과 같은 리포좀 또는 캡시드와 같은 마이셀 구조를 포함한다. 수용성 서스팬전은 셀루로스 유도체, 알긴산 나트륨, 폴리비닐-피롤리돈 및 검 트라가칸쓰(tragacanth)와 같은 서스팬전 제 및 레시틴과 같은 습윤제를 포함할 수 있다. 수용성 서스팬전에 대한 적당한 보존제들은 에틸 및 n-프로필 p-하이드록시벤조에이트를 포함한다.
ALK 카이네이즈-저해하는 치료 조성물은 또한 임플란트 및 마이크로캡슐화된 운반 시스템을 포함하는 조절된 분비 제제와 같은 신체로부터 신속한 제거에 대하여 그 치료제(예를 들어 dsRNA 화합물)를 보호하기 위한 캡슐화된 제제를 포함할 수 있다. 생분해성, 생체수용가능한 폴리머들은 에틸렌 비닐 아세테이트, 폴리안하이드라이드, 폴리글리코릭 산, 콜라겐, 폴리오르쏘에스테르 및 폴리젖산과 같은 것이 사용될 수 있다. 그러한 제제들의 조제에 대한 방법들은 당업자들에게 명백할 것이다. 그 물질들은 Alza Corporation 및 Nova Pharmaceuticals, Inc로부터 상업적으로 얻을 수도 있다. 리포좀 서스팬전들(바이러스 항원에 대한 단클론 항체들로 감염된 세포들에 타겟된 리포좀들을 포함하는)은 또한 약학적으로 수용가능한 담체들로 사용될 수 있다. 이들은 예를 들어 미국특허 번호 제4,522,811; PCT 공개 WO 91/06309; 및 유럽특허공개 EP-A-43075에 기재된 것과 같이 당업자에 알려진 방법들에 따라서 제조될 수 있다. 캡슐화된 제제는 바이러스 코트 단백질을 포함할 수 있다. 그 바이러스 코트 단백질은 폴리오마 바이러스와 같은 바이러스와 관련되거나 똔느 바이러스로부터 유래할 수 있거나 그것은 부분적으로 또는 전부가 인위적일 수 있다. 예를 들어 그 코트 단백질은 폴리오마 바이러스의 바이러스 단백질 1 및/또는 바이러스 단백질 2 또는 그것의 유도체일 수 있다.
ALK-저해하는 조성물들은 또한 대상에 투여하기 위한 리포좀들, 담체들 및 희석제들 및 그들의 염들을 포함하는 운반 비히클을 포함할 수 있고 및/또는 약학적으로 수용가능한 제제에 존재할 수 있다. 예를 들어 핵산 분자들의 운반에 대한 방법들은 Akhtar 외, 1992, Trends Cell Bio ., 2, 139; Delivery Strategies for Antisense Oligonucleotide Therapeutics, ed. Akbtar, 1995, Maurer 외, 1999, Mol. Membr . Biol ., 16, 129-140; Hofland 및 Huang, 1999, Handb . Exp . Pharmacol., 137, 165-192; 및 Lee 외, 2000, ACS Symp. Ser., 752, 184-192. Beigelman 외, 미국특허 제 6,395,713호 및 Sullivan 외, PCT WO 94/02595에 핵산 분자들의 운반을 위한 일반적인 방법들이 더욱 기재된다. 이들 프로토콜들은 실질적으로 어느 핵산 분자의 운반을 위하여 이용될 수 있다.
ALK-저해하는 치료제들은 이온영동법, 하이드로겔들. 사이클로덱스트린들, 생분해성 나노입자들, 및 생흡착성 미세공들과 같은 다른 비히클로 삽입되어서 또는 단백질성 벡터들(O'Hare 및 Normand, 국제 PCT 공개번호 WO 00/53722)에 의해서 리포좀에서 캡슐을 포함하나 이에 한정되지 아니하는 당업자들에 공지된 여러 방법들에 의하여 포유류 종양에 투여될 수 있다. 또한 그 치료제/비히클 결합은 직접 주사 또는 주입 펌프의 사용에 의하여 국소적으로 움반된다. 피하, 근육내 또는 경피 어디든지 그 조성물의 직접 주사는 Conry 외, 1999, Clin . Cancer Res ., 5, 2330-2337 및 Barry 외, 국제 PCT 공개번호 WO 99/31262에 기재된 것들과 같은 바늘-없는 기술들 또는 표준 바늘 및 주사기 방법들을 사용하여 일어날 수 있다.
ALK 카이네이즈-저해하는 치료제의 약학적으로 수용가능한 제제들은 상기 기재된 화합물들의 염들, 예를 들어 염산, 하이드로브롬산, 아세트산, 및 벤젠 설폰산의 염들과 같은 예를 들어 산 부가 염들을 포함한다. 약동학적 (pharmacological) 조성물 또는 제제는 예를 들어 인간을 포하하는 환자 또는 세포로 투여 예를 들어 전신 투여에 적합한 형태인 조성물 또는 제제를 의미한다. 적당한 형태들은 예를 들어 경구, 경피 또는 주사에 의한 투여 경료 또는 용도에 의존한다. 그러한 형태들은 그 조성물 또는 제제가 타겟 세포에 도달하는 것을 저해해서는 안 된다. 예를 들어 혈관 속에 주사되는 약동학적 조성물들은 수용성이어야 한다. 다른 요소들은 당업계에 공지되고 그 조성물 또는 제제가 그들의 효과를 수해하는 것을 저해하는 형태 및 독성과 같은 고려사항을 포함한다.
전신성 흡수를 야기하는 투여 경로들(즉 혈관에 약의 전신성 흡수 또는 축적이 몸 전체를 통하여 분배되는 것을 수반하는)은 바람직하고 정맥내, 피한, 복강내, 흡입, 경구,폐내 및 근육내를 포함하나 한정되지 아니한다. 이들 투여 경로들 각각은 접근하기 쉬운(accessible) 질병 조직 또는 종양에 그 ALK-저해하는 치료제를 노출시킨다. 순환계로 약의 투여의 속도는 분자량 또는 크기의 함수로 나타낸다. 본 발명의 화합물을 포함하는 리포좀 또는 다른 약물 담체의 사용은 예를 들어서 망상 내피 시스템(reticular endothelial system;RES)의 조직과 같은 일부 조직 타입에서 강력하게 그 약제를 국소화할 수 있다. 림프구 및 마크로파지와 같은 세포들의 표면을 가지고 약의 회합(association)을 용이하게 할 수 있는 리포좀 제제 또한 유용하다. 이 방법은 암 세포들과 같은 비 정상 세포들의 림프구 면역 인식 및 마크로파지의 특이성을 이용하여 타겟 세포에 약제의 증가된 운반성을 제공할 수 있다.
"약학적으로 수용가능한 제제"는 그들의 원하는 활성에 가장 적합한 물리적인 위치에서 본 발명의 핵산 분자들의 효과적인 분배를 가능하게 하는 조성물 또는 제제를 의미한다. 본 발명의 핵산 분자들을 가지는 제제에 적합한 물질들의 비한정적인 예는 하기의 것을 포함하고: CNS로 약물의 투여를 증가시킬 수 있는 P-당단백질 저해제(Pluronic P85와 같은)(Jolliet-Riant and Tillement, 1999, Fundam . Clin. Pharmacol ., 13, 16-26); 뇌내 주입 후에 서방성 운반을 위한 폴리(DL-lactide-coglycolide) 미세공과 같은 생분해성 폴리머(Emerich et al, 1999, Cell Transplant, 8, 47-58) (Alkermes, Inc. Cambridge, Mass.); 및 폴리부틸시아노아크릴레이트으로 제조된 로딩된 나노입자들, 그리고 그것은 혈관 뇌 장벽을 통하여 약제를 운반할 수 있고 신경 업테이크 기작을 변경시킬 수 있다(Prog Neuro -psychopharmacol Biol Psychiatry, 23, 941-949, 1999). 본 발명의 방법에 유용한 ALK-저해하는 화합물에 대한 운반 전략의 다른 비한정적인 예들은 Boado 외, 1998, J. Pharm . Sci ., 87, 1308-1315; Tyler 외, 1999, FEBS Lett ., 421, 280-284; Pardridge 외, 1995, PNAS USA ., 92, 5592-5596; Boado, 1995, Adv . Drug Delivery Rev., 15, 73-107; Aldrian-Herrada 외, 1998, Nucleic Acids Res ., 26, 4910-4916; 및 Tyler 외, 1999, PNAS USA ., 96, 7053-7058에 기재된다.
폴리(에틸렌 글리콜) 지질(PEG-변형된 또는 긴-순환하는 리포좀들 또는 스틸쓰(stealth) 리포좀들)을 포함하는 표면-변형된 리포좀들을 포함하는 치료 조성물은 또한 본 발명의 방법에서 적절하게 채택될 수 있다. 이들 제제들은 타겟 조직들에서 약제들의 축적을 증가시키는 방법을 제공한다. 이 군의 약제 담체들은 옵소닌화 및 단핵 파고사이트 시스템(MPS 또는 RES)에 의한 제거에 저항하고, 그것에 의하여 캡슐화된 약제에 대한 증가된 조직 노출과 더 긴 혈액 순환을 가능하게 한다(Lasic 외 Chem . Rev. 1995, 95, 2601-2627; Ishiwata 외, Chem . Pharm . Bull. 1995, 43, 1005-1011). 그러한 리포좀들은 아마 혈관신생된 타겟 조직들에서 분출 및 포착에 의하여 종양들에서 선택적으로 축적되는 것을 나타낸다(Lasic 외, Science 1995, 267, 1275-1276; Oku 외,1995, Biochim . Biophys . Acta, 1238, 86-90). 그 긴 시간 순환하는 리포좀들은 특히 MPS의 조직에서 축적하는 것으로 알려진 통상의 양이온성 리포좀과 비교하여서 DNA 및 RNA의 약물동력학 및 약력학을 증가시킨다(Liu 외, J. Biol. Chem. 1995, 42, 24864-24870; Choi 외, 국제 PCT 공개번호 WO 96/10391; Ansell 외, 국제 PCT 공개번호 WO 96/10390; Holland 외, 국제 PCT 공개번호 WO 96/10392). 긴 시간 순환하는 리포좀들은 또한 간과 비장과 같은 대사적으로 공격적인 MPS 조직들에서 축적을 회피하는 그들의 능력에 기초하여 양이온성 리포좀과 비교하여 크게 약제들을 뉴크리에이즈 분해로부터 보호하기 쉬울 것이다.
치료 조성물은 약학적으로 수용가능한 담체 또는 희석제에서 원하는 화합물의 약학적으로 효과적인 양을 포함할 수 있다. 치료 용도로 수용가능한 담체들 또는 희석제는 약학 분야에서 주지되고, 예를 들어 Remington의 Pharmaceutical Sciences, Mack Publishing Co. (A. R. Gennaro, Ed. 1985)에 기재된다. 예를 들어 보존제들, 안정제들, 염료들 및 향료들은 제공될 수 있다. 이들은 벤젠산 나트륨, 소빅 산 및 p-하이드록시벤젠산의 에스테르를 포함한다. 또한 항산화제들 및 현탁제가 사용될 수 있다.
약학적으로 효과적인 용량은 질병의 상태의 치료(증상의 일부 완화, 바람직하게는 모든 증상의 완화) 또는 발생을 저해, 예방하는데 필요한 양이다. 그 약학적으로 효과적인 용량은 질병의 타입, 사용된 조성물, 투여 경로, 처리되는 포유류의 타입, 고려 사항 하의 특정 포유류의 신체적 특징들, 동시수반하는 약제 및 의약 분야에서 당업자가 인식하는 다른 인자들에 의존한다. 일반적으로 0.1 mg/kg에서 100 mg/kg 체중/일 범위의 활성성분들이 음이온 폴리머의 효과에 의존하여 투여된다.
약 0.1 mg에서 약 140 mg/kg 체중/일의 용량 레벨이 상기 나타낸 질환의 치료에 유용하다(매일 환자 당 약 0.5 mg에서 약 7 g). 단일 투여 형태를 생성하는 담체 물질들과 결합될 수 있는 활성 성분의 양은 투여의 특정 모드 및 치료되는 숙주에 의존하여 변화한다. 용량 단위 형태들은 일반적으로 활성 성분의 약 1 mg에서 약 500 mg 사이를 포함한다. 특정한 환자에 대한 특정한 투여 레벨은 채택된 특정 화합물의 활성, 나니, 체중, 일반적인 건강, 성별, 식사, 투여 시간, 투여 경로 및 분비의 속도, 약 혼합 및 치료를 수행하는 특정한 질환의 중증도에 의존한다는 것으로 이해된다.
비-인간 동물에 대한 투여에 대해서 그 조성물은 동물 사료 또는 음료수에 첨가될 수 있다. 그 동물이 그것의 사료와 함께 그 조성물의 치료적으로 적절한 양의 섭취를 가능하게 동물 사료 및 음료수는 제제화하는 것이 편리하다. 그 사료 또는 음료수에 첨가하기 위한 프리믹스로서 그 조성물을 주는 것이 편리하다.
본 발명의 실행에서 유용한 ALK-저해하는 치료제는 동일 군의 저해제(즉 항체 저해제), 또는 다른 군들(즉 항체 저해제들와 소-분자 저해제들)이든지 간에 상기 언급한 것과 같은 단일 화합물 또는 다중 화합물의 혼합을 포함할 수 있다. 화합물들의 그러한 혼합은 융합 단백질-발현하는 암의 진행을 저해하는 전체적인 치료 효과를 증가시킬 수 있다. 예를 들어서 그 치료 조성물은 WHI-131 및/또는 WHI-154와 같은 소 분자 저해제 단독, 또는 ALK 활성을 타겟하는 다른 저해제들 및/또는 다른 소 분자 저해제들과 혼합하여서 일 수 있다. 그 치료 조성물은 하나 이상의 타겟 저해제들 이외에 하나 이상의 비-특이적인 화학요법제를 더욱 포함할 수 있다. 그러한 조성물은 최근에 많은 암들에서 상승적인 종양 사멸 효과를 제공하는 것으로 알려졌다. 인 비보에서 ALK 활성 및 종양 성장을 저해하는 그러한 혼합의 효과는 하기에서 기재한 것과 같이 측정될 수 있다.
돌연변이체 ALK 카이네이즈 -저해하는 화합물들의 동정.
본 발명은 또한 화합물이 암에서 EML4-ALK 또는 TFG-ALK 융합 폴리펩타이드 또는 트런케이트된 ALK 카이네이즈 폴리펩타이드의 활성을 저해하는지를 결정하여, 화합물이 EML4-ALK 또는 TFG-ALK 융합 폴리뉴크레오타이드 및/또는 융합 폴리펩타이드에 의하여 특성화되는 암의 진행을 억제하는지를 결정하는 방법을 제공한다. 일부 바람직한 구체예에서 ALK의 활성의 저해는 골수, 혈액, 늑막 일출 또는 종양으로부터 유래한 세포들을 포함하는 생물학적 샘플을 조사하여 결정된다. 또 다른 바람직한 구체예에서 ALK의 활성의 저해는 적어도 하나의 본 발명의 돌연변이체 ALK 폴리뉴크레오타이드 또는 폴리펩타이드-특이적인 시약을 사용하여 결정된다.
그 테스트되는 화합물은 상기 기재된 것과 같은 치료제의 타입 또는 조성물일 수 있다.인 비트로 및 인 비보에서 화합물의 효과를 측정하는 방법들은 당업계에 잘 확립되고 공지된다. 예를 들어 조성물은 ALK가 활성화되는 세포 또는 세포 추출물을 사용하여 인 비트로 ALK를 저해하는 능력이 테스트된다. 화합물의 패널은 ALK(EGFR 또는 PDGFR와 같은 다른 타겟과 반대로)에 대한 화합물의 특이성을 테스트하기 위하여 채택될 수 있다.
흥미있는 단백질에 대한 적당한 결합 친화도를 가지는 화합물들의 고성능 스크리닝을 제공하는데 사용될 수 있는 약물 스크리닝을 위한 또 다른 기술이 공개된 PCT 출원 W084/03564에 기재된다. 이 방법에서 돌연변이체 ALK 폴리펩타이드들에 적용된 것과 같은 많은 수의 다른 작은 테스트 화합물들은 플라스틱 핀들 과 같은 고체 기질 또는 일부 다른 표면 상에서 합성된다. 그 테스트 화합물들은 돌연변이체 ALK 폴리펩타이드, 또는 그것의 절편들과 반응하고 세척된다. 결합된 돌연변이체 폴리펩타이드 (예를 들어 EML4-ALK 융합 폴리펩타이드)는 그 후에 당업계에 주지된 방법들에 의하여 검출된다. 정제된 돌연변이체 ALK 폴리펩타이드는 상기언급된 약물 스크리닝 기술에서 사용하기 위하여 직접적으로 코팅될 수 있다. 또한 비-중화하는 항체들은 그 펩타이드를 잡고 고체상에서 그것을 고정화하는데 사용될 수 있다.
인 비트로에서 ALK 활성의 효과적인 저해제로 발견된 화합물은 예를 들어서 NSCLC와 같은 인간 종양을 가지는 예를 들어 포유류 이종이식을 사용하여 인 비보에서 EML4-ALK 또는 TFG-ALK 융합 폴리펩타이드 및/또는 트런케이트된 ALK 카이네이즈 폴리펩타이드을 발현하는 암의 진행을 저해하는 그것의 능력이 조사될 수 있다. 이 방법에서 그 약제의 효과들은 한자와 가장 밀접하게 유사한 생물학적 셋팅에서 관찰될 수 있다. 암 세포들 또는 인접한 기질 세포들에서 신호를 변경하는 그 약제의 능력은 인산화-특이적인 항체들로 분석에 의하여 결정될 수 있다. 세포 사멸 또는 세포 증식 억제를 유도하는 그 약제의 효과는 절단된 캐스패이즈 3 및 절단된 PARP와 같은 에팝토시스 특이적인 마커들로 분석에 의하여 또한 관찰될 수 있다. 유사하게 돌연변이체 ALK 단백질에 의하여 유도된 인간 백혈병을 가지는 포유류 골수 이식체(예를 들어 마우스)가 채택될 수 있다. 이 과정에서 돌연변이체 ALK 카이네이즈에 의하여 추진된 것으로 알려진 골수 세포들은 그 마우스에 이식된다. 암 세포들의 성장은 모니터될 수 있다. 그 마우스는 그 후에 그 약제로 처리될 수 있고 암 표현형 또는 진행에 대한 그 약제의 효과는 외부적으로 관찰된다. 그 후 그 마우스는 희생되고 그 이식된 골수는 IHC 및 웨스턴 블럿 등에 의하여 분석되게 제거된다.
그러한 화합물의 독성 및 치료 효과는 예를 들어서 LD50 (50%의 그 군에 치사량인 양) 및 ED50 (50%의 그 군에 치료 효과를 가진 양)을 결정하기 위하여 세포 배양물 또는 실험 동물들에서 표준 약학적 과정들에 의하여 결정될 수 있다. 독성과 치료 효과 사이의 용량 비율은 치료 지수이고 그것은 LD50/ED50 비율로서 표현될 수 있다. 높은 치료 지수를 나타내는 화합물들이 바람직하다.
상기 및 하기에서 인용한 모든 레퍼런스의 가르침은 여기서 레퍼런스에 의하여 삽입된다.
하기 실시예는 본 발명을 더욱 설명하기 위하여 제공된 것으로 여기에 첨부된 청구범위에서 제공된 것을 제외하곤 그것의 범위를 한정하는 것이 아니다. 본 발명은 당업자에 의하여 명백한 여기에서 가르치는 그 방법들의 변경과 변화를 포함한다.
실시예 1
광범위한( global ) 포스포펩타이드 프로화일링에 의한 고형 종양들에서 ALK 카이네이즈 활성의 동정
A. 인간 NSCLC 세포주들의 프로화일링 .
H2228을 포함하는 22 인간 NSCLC 세포주들에서 카이네이즈 활성화의 광범위한 인산화 프로화일은 복합체 혼합물들로부터 변형된 펩타이드들의 분리 및 질량 분광 특성화를 위한 최근에 기재되고 강력한 기술들을 사용하여 조사되었다(“IAP" 기술,상기 Rush 외, 참고). NSCLC 세포주들의 추출물로부터 포스포타이로신-함유하는 펩타이드들을 분리하고 차후 특성화하기 위하여 그 IAP 기술은 포스포타이로신-특이적인 항체(Cell Signaling Technology, Inc., Beverly, MA, 2003/04 Cat. #9411)을 사용하여 수행되었다.
특별하게는 그 IAP 방법은 각 NSCLC 세포주들에서 단백질 인산화에 관여하는 타이로신 카이네이즈의 동정을 용이하게 하기 위하여 채택되었다. 특히 비전형적이거나 드문 카이네이즈 활성이 고려된다.
세포 배양.
모든 세포 배양 시약들은 Invitrogen, Inc으로부터 구입하였다. 전체 41 인간 NSCLC 세포주들은 조사되었다. 인간 NSCLC 세포주들, H520, H838, H1437, H1563, H1568, H1792, H1944, H2170, H2172, H2228, H2347, A549, H441, H1703, H1373, 및 H358은 American Type Culture Collection에서 구입되고, 10% FBS를 가지는 RPMI 1640 배지로 배양하고 2 mM L-글루타민, 1.5 g/L 소디움 바이카보네이트, 4.5 g/L 포도당, 10 mM HEPES, 1.0 mM 피루브산 나트륨, 페니실린/스트렙토마이신을 함유하게 조정된다. 부가적인 여섯 인간 NSCLC 세포주, HCC78, Cal-12T, HCC366, HCC15, HCC44, 및 LOU-NH91이 DSMZ로부터 구입되고, 10% FBS 및 페니실린/스트렙토마이신을 함유하는 RPMI 1640에서 배양한다. 세포들은 37℃에서 5% CO2 배양기에서 유지된다.
면역친화 침전 및 면역블럿 실험을 위하여 세포들을 80% 컨후루언스로 성장하고 수집하기 전에 FBS가 없는 RPMI 배지에서 밤새 굶겼다.
포스포펩타이드 면역침전.
1억 개의 세포들을 우레아 라이시스 버퍼(20 mM Hepes, pH 8.0, 9 M Urea, I mM sodium vanadate, 2.5 mM 인산 나트륨, 1 mM beta-glycerophosphate)에서 라이시스하였다. 그 파쇄액을 소니케이션하여서 원심분리에 의하여 투명하게 하였다.
투명화된(Cleared) 파쇄액을 전에 기재(Rush 외, Nat . Biotechnol . 23(1): 94-101 (2005)참고)된 것과 같이 DTT로 환원하고 아이도아세트아마이드로 알킬화하였다. 그 다음 샘플들을 20 mM Hepes로 4배 희석하고 우레아 농도를 2M로 감소하고, 가볍게 진탕하면서 실온에서 밤새 트립신으로 처리하였다.
전에 기재된 것(상기 Rush 외,)과 같이 처리된 펩타이드들은 Sep-Pak C18 컬럼들로 대략(crudely) 분리하였다. 용출물은 동결건조하고 건조된 펩타이드들은 1.4 ml의 MOPS IP 버퍼(50 mM MOPS/NaOH pH 7.2, 10 mM Na2PO4, 50 mM NaCl)에 녹이고 불용성 물질은 원심분리하여 제거하였다. 면역침전은 단백질 G 아가로스 비드(Roche)로 연결된 160 ㎍의 포스포-타이로신 100 항체(Cell Signaling Technology)로 4℃에서 수행된다. 그 비드들은 다음에 1 ml MOPS IP 버퍼로 3회 세척하고 찬 상태에서 1 ml HPLC 급 dH2O로 2회 세척하였다. 포스포펩타이드들은 60 ㎕ 0.1% TFA로 비드들로부터 용출하고, 40 ㎕ 0.1% TFA으로 두 번째 용출을 수반하고 그 분획들은 모았다. 그 용출된 펩타이드들은 ZipTip 컬럼(Millipore)을 사용하여 농축하였고, LC-MS/MS로 분석하였다. 질량 스펙트럼은 LTQ 이온 트랩 질량 분광기(ThermoFinnigan)로 수집하였다.
LC - MS / MS 질량 분광법에 의한 분석.
IP 용출액(100 ㎕)에서 펩타이드들은 농축하고 Stop과 Go 추출 팁들(StageTips)을 사용하여 용출된 항체로부터 분리된다(Rappsilber 외, Anal . Chem., 75(3): 663-70 (2003)참고). 펩타이드들은 미세컬럼으로부터 1 ㎕의 60% MeCN, 0.1% TFA을 가지고 7.6 ㎕의 0.4% 아세트산/0.005% heptafluorobutyric acid (HFBA)으로 용출하였다.
각 포스포펩타이드 샘플은 LC-MS로 두 번 분석되었다. 융합된 실리카 미세모세 컬럼(125 ㎛ x 18 cm)은 C18 역상 레진(Magic C18AQ, 5 ㎛ 입자들, 200 Å 포어 사이즈, Michrom Bioresources, Auburn, CA)으로 충진되었다. 샘플들(4 ㎕)은 오토샘플러(LC Packings Famos, San Francisco, CA)로 이 컬럼에 로딩하고 0.1% 포름산에서 7에서 30% 아세토나이트릴의 55분 구배로 질량 분광기로 용출하였다. 그 구배는 인-라인 스프리터를 가진 두 쌍(binary) HPLC pump (Agilent 1100, Palo Alto, CA)을 사용하여 대략 abc nl/min로 하였다. 펩타이드 이온의 용출은 하이브리드 리니어 이온 트랩-7 Tesla 이온 사이트로트론 공명 Fourier 전환 장치(LTQ-FT, Thermo Finnigan, San Jose, CA)로 질량 분석되었다.
탑-세븐 방법은 채택되고, 그것에 의하여 리니어 이온 트랩에서 7 데이터-의존하는 MS/MS 스캔은 그 리니어 이온 트랩과 그 Fourier 전환 장치를 동시에 작동하여서 ICR 세포에서 지난 MS 서베이 스캔 동안에 만들어진 측정에 기초하여 얻어진다. MS 스캔은 8x106의 자동 게인 컨트롤(AGC) 및 105의 질량 해상력을 가지고 375-1800 m/z에서 수행된다. MS/MS에 대해서 그 AGC는 8x106, 그 동적 배제(exclusion) 시간은 25 초, 그리고 싱글-차지된 이온들은 차지-상태 스크리닝에 의하여 거부되었다.
데이터베이스 분석과 할당.
펩타이드 서열은 TurboSequest 소프트웨어(v.27, rev.12) (ThermoFinnigan) 및 컴포지트 포워드/리버스 IPI 인간 단백질 데이터 베이스를 사용하여 MS/MS 스펙트럼에 할당된다. 검색 매개변수는:프로테이즈로 트립신; 1.08 Da 전구체 질량 토러런스; 시스테인에 대한 정적인 변형(+57.02146, 카르보사마이도에틸레이션; 및 세린, 쓰레오닌 및 타이로신(+79.96633 Da, 인산화), 라이신(+8.01420, 13C615N2), 알기닌(+6.02013, 13C6) 및 메티오닌(+15.99491, 산화)에 대한 동적인 변형. 타겟/디코이 데이터베이스 접근법은 측정된 위-양성 할당률이 <1%가 괴게 적당한 스코어-필터링 기준을 달성하기 위하여 사용된다. 초과하는 차지-의존하는 XCorr 쓰레스홀드(z=1, XCorr=1.5, for z=2, XCorr=2.2, for z=3, XCorr=3.3)이외에도, 할당은 모두-가볍거나 모두-무거운 라이신/알기닌 잔기들을 포함하기 위하여 그리고 -5에서 +25 ppm의 질량 정확도를 가지기 위하여 포스포타이로신을 포함하는 것이 요구된다.
이들 기준들을 통과하는 할당들은 각 펩타이드의 무거운 그리고 가벼운 형태 사이의 상대적인 양 및 피크 면적을 계산하기 위하여 통상 정량화 프로그램,Vista (Bakalarski 외, 원고 중)을 사용하여 더 평가될 수 있다. 15 이하 MS 스캔에서 신호 대 잡음을 가지는 동정된 펩타이드는 정량화에 고려되지 않았다. 대신 그 조건들 중 하나에서만 발견된 펩타이드들에 대하여 신호 대 잡음 비율이 사용되었다.
검색들은 동적인 변형들로 산화된 메티오닌(M+16) 및 인산화(Y+80)를 허용하는 27,175 단백질들을 포함하는 2004년 8월 24일에 발표된 NCBI 인간 데이터베이스에 대하여 수행하였다. 할당된 서열들의 최종 리스트를 지원하는 모든 스펙트럼(여기에 나타내지 않음)은 그들의 신뢰성을 확보하기 위하여 적어도 세명의 과학자들에 의하여 리뷰되었다.
앞서 언급한 IAP 분석 동정된 2000 이상의 비-중복된 포스포타이로신-함유하는 펩타이드들, 1,500 이상의 포스포타이로신 자리들 및 1,000 이상의 타이로신 인산화된 단백질들의 대부분은 조사된 세포주로부터 신규하였다(데이터는 나타내지 않음). NSCLC 신호전달에서 관련된 것으로 알려진 수용체 타이로신 카이네이즈는 EGFR, Her2, Her3, EphA2 및 Met과 같은 많은 세포주에서 인산화된 타이로신으로 관찰되었다. 고 수준의 EGFR 포스포펩타이드들은 NSCLC 세포주에서 활성화되는 것으로 알려진 수용체 타이로신 카이네이즈들을 동정하는 그 방법을 확인하는 EGFR의 증폭된 레벨의 유전적으로 활성화된 형태를 발현하는 것으로 알려진 두 세포주인 HCC827 및 H3255을 포함하는 몇 세포주들에서 관찰된다.
세 세포주들은 다른 NSCLC 세포주에서 관찰되지 않는 수용체 타이로신 카이네이즈들을 발현하였다. Ros, ALK, 및 PDGFR 알파로부터 많은 양의 타이로신 인산화된 펩타이드들이 HCC78, H2228, 및 H1703 세포주들에서 각각 관찰되었다. ALK를 많이 발현하는 NSCLC 세포주 H2228은 더 많은 조사를 위하여 선택되었다.
B. 인간 NSCLC 종양 샘플들의 프로화일링.
상기 파트 A에서 실질적으로 기재한 것과 같은 그 IAP 기술은 NSCLC 환자들로부터 얻은 154 인간 종양 샘플들의 패널의 광범위한 포스포-프로화일을 조사하기 위하여 추후에 적용되었다. 조직들은 중국 제 2 시안기아 호텔로부터 얻었다.
동결 조직 샘플들은 작은 조각으로 절단되고, 폴리트론을 사용하여 매번 20초씩 2회 동안 라이시스 버퍼(2.5 mM 인산 나트륨, 1 mM b-글리세롤-인산이 보충된 20 mM HEPES pH 8.0, 9 M Urea, 1 mN 소디움 바나데이트, 동결 조직 100mg 당 1ml의 라이시스 버퍼)로 균질화하였다. 그 균질액을 간단하게 소니케이션하고, 투명화된(Cleared) 파쇄액을 전에 기재(Rush 외, Nat . Biotechnol . 23(1): 94-101 (2005)참고)된 것과 같이 DTT로 환원하고 아이도아세트아마이드로 알킬화하였다. 그 다음 샘플들을 20 mM Hepes로 4배 희석하고 우레아 농도를 2M로 감소하고, 가볍게 진탕하면서 실온에서 밤새 트립신으로 처리하였다.
전에 기재된 것(상기 Rush 외,)과 같이 처리된 펩타이드들은 Sep-Pak C18 컬럼들로 대략(crudely) 분리하였다. 용출물은 동결건조하고 건조된 펩타이드들은 1.4 ml의 MOPS IP 버퍼(50 mM MOPS/NaOH pH 7.2, 10 mM Na2PO4, 50 mM NaCl)에 녹이고 불용성 물질은 원심분리하여 제거하였다. 면역침전은 단백질 G 아가로스 비드(Roche)로 연결된 160 ㎍의 포스포-타이로신 100 항체(Cell Signaling Technology)로 4℃에서 수행된다. 그 비드들은 다음에 1 ml MOPS IP 버퍼로 3회 세척하고 찬 상태에서 1 ml HPLC 급 dH2O로 2회 세척하였다. 포스포펩타이드들은 60 ㎕ 0.1% TFA로 비드들로부터 용출하고, 40 ㎕ 0.1% TFA으로 두 번째 용출을 수반하고 그 분획들은 모았다. 그 용출된 펩타이드들은 ZipTip 컬럼(Millipore)을 사용하여 농축하였고, LC-MS/MS로 분석하였다. 질량 스펙트럼은 LTQ 이온 트랩 질량 분광기(ThermoFinnigan)로 수집하였다.
포스포펩타이드 면역침전은 LC-MS/MS 분광 분석이 수반되고 그 다음은 상기 파트 A에서 기재된 것과 같이 수행되었다. 데이터베이스 검색과 서열 할당들은 27,970 단백질들을 포함하는 2004년 8월 24일에 공개된 NCBI 인간 데이터베이스를 사용한 것을 제외하고는 실질적으로 파트 A에서 기재된 것과 같이 만들어졌다.
앞서 언급한 IAP 분석 동정된 2000 이상의 비-중복된 포스포타이로신-함유하는 펩타이드들, 1,500 이상의 포스포타이로신 자리들 및 1,000 이상의 타이로신 인산화된 단백질들의 대부분은 조사된 세포주로부터 신규하였다(데이터는 나타내지 않음). NSCLC 신호전달에서 관련된 것으로 알려진 수용체 타이로신 카이네이즈들은 다시 EGFR, Her2, Her3, EphA2 및 Met과 같은 많은 세포주에서 인산화된 타이로신으로 관찰되었다. 고 수준의 EGFR 포스포펩타이드들은 NSCLC 세포주에서 활성화되는 것으로 알려진 수용체 타이로신 카이네이즈들을 동정하는 그 방법을 확인하는 몇 종류의 종양 샘플들에서 다시 관찰되었다.
다섯 환자 샘플들은 다른 NSCLC 세포주 및 종양들에서 관찰되지 않는 수용체 타이로신 카이네이즈들을 발현하였다. CS010/11, CS045, 및 CS110 환자로부터 많은 양의 타이로신 인산화된 펩타이드들이 관찰되었다. ALK를 많이 발현하는 이들 세 종양들을 더 많은 조사를 위하여 선택되었다.
실시예 2
ALK 융합 유전자들의 분리 및 시퀀싱
A. 인간 NSCLC 세포주에서 시퀀싱.
NSCLC 세포주 H2228에서 검출된 ALK 카이네이즈의 주어진 높은 인산화 수준, ALK의 카이네이즈 도메인을 코딩하는 cDNA 말단의 5‘ 신속 증폭은 키메릭 ALK 전사체가 존재하는지를 결정하기 위하여 수행되었다.
상보적인 DNA 말단들의 신속한 증폭
RNeasy 미니 키트(Qiagen)는 H2228 세포주로부터 RNA를 추출하는데 사용되었다. DNA는 DNeasy 티슈 키트(Qiagen)의 사용으로 추출되었다. cDNA 말단의 신속한 증폭은 cDNA 합성을 위해서는 ALK-GSP1 프라이머들을 그리고 네스티드 PCR 반응을 위해서는 ALK-GSP2 및 ALK-GSP3을 가지고 5‘RACE 시스템(Invitrogen)을 사용하여서 수행되었다.
5‘ RACE
도 5 (패널 A)는 5‘ RACE에 의한 EML4-ALK 융합 유전자(짧은 변이체)의 검출과 2 라운드 후에 PCR 증폭 산물의 검출을 나타낸다. 그 PCR 산물은 PCR 정제 키트(Qiagen)에 의하여 정제되고 ALK-GSP3 및 ABI 3130 모세관 자동 DNA 시퀀서(Applied Biosystems)를 사용하여서 시퀀싱하였다. 그 결과 산물의 서열 분석은 ALK의 카이네이즈 도메인 및 C-말단이 그 EML-4 유전자 N-말단과 융합된 것을 나타내었다(도 1, 패널 B 참고). 그 EML4-ALK 융합 유전자(짧은 변이체)는 인-프레임이었고,ALK의 마지막 562 아미노산들에 EML-4의 처음 233 아미노산이 융합되었다(도 1, 패널 B). EML-4 및 ALK 유전자들은 모두 염색체 2에 위치하고 따라서 그 융합 유전자는 이들 두 위치(loci) 사이에서 유전자 결손에 의하여 생성되었다.
하기 프라이머들이 사용되었다:
ALK-GSP1: 5‘gcagtagttggggttgtagtc (서열번호 9)
ALK-GSP2: 5‘gcggagcttgctcagcttgt (서열번호 10)
ALK-GSP3: 5‘tgcagctcctggtgcttcc (서열번호 11)
PCR 분석
RT-PCR 분석은 융합 단백질에서 EML-4의 N-말단이 그대로인지를 확인하기 위하여 수행되었다(도 6 (패널 B)참고). 첫째 가닥 cDNA는 올리고(dT)20을 가지는 SuperScriptTM III 첫째 가닥 합성 시스템(Invitrogen)으로 2.5mg의 전체 RNA으로부터 합성되었다. 그 다음에 그 EML4-ALK 융합 유전자는 EML-Atg 및 ALK-GSP3 프라이머 쌍을 사용하여 증폭되었다. 그 상호 융합은 프라이머 쌍 EML-4-43 및 ALK-GSP3 및 EML-4-94 및 ALK-GSP3 및 EML4-202 및 ALK-GSP3을 사용하여 검출되었다. 지노믹 PCR을 위하여, 융합 유전자의 증폭이 프라이머 쌍 EML-4-atg 및 ALK-tga을 가지고 Platinum Taq DNA polymerase 하이 피델리티(Invitrogen)를 사용하여 수행되었다.
하기 프라이머가 사용되었다:
ALK-GSP3: 5- TGCAGCTCCTGGTGCTTCC (서열번호 12)
EML4-Atg: 5- CGCAAGATGGACGGTTTGGC (서열번호 13)
EML4-43: 5- TGTTCAAGATCGCCTGTCAGCTCT (서열번호14)
EML4-94: 5- TGAAATCACTGTGCTAAAGGCGGC (서열번호 15)
EML4-202: 5- AAGCCCTCGAGCAGTTATTCCCAT (서열번호 16)
ALK-Tga: 5GAATTCCGCCGAGCTCAGGGCCCAG (서열번호 17)
중요하게, EML4-ALK 융합 (짧은 변이체)에서, ALK에서 정확하게 동일한 지점에서 EML-4 부위와 융합된 ALK부위는 ALCL에서 일어나는 NPM-ALK 융합과 같은 다른 ALK 융합들에서 관찰된다. H2228 세포주에서 ALK의 카이네이즈 도메인은 지노믹 DNA로부터 더욱 서열화되고 야생형으로 밝혀졌다. 따라서 H2228에서 발견된 결손 돌연변이는 ALK 카이네이즈 도메인에 영향이 없다. 또한 야생형 EML-4는 EML4-ALK 융합 단백질 (짧은 변이체)에서 존재하지 아니하는 자리에서만 인산화된 타이로신이고, 융합 단백질에서 보존된 N-말단 코일된 코일 도메인(도 1A 참고)은 ALK를 다이머화하고 활성화할뿐 아니라 야생형 ALK와 상호작용을 촉진하는 기능을 하는 것으로 추측된다.
B. 인간 NSCLC 세포주에서 시퀀싱.
유사하게 CS010/11, CS045, 및 CS110에서 유래한 인간 NSCLC 종양 샘플들에서 검출된 ALK 카이네이즈의 주어진 높은 인산화 수준, ALK의 카이네이즈 도메인을 코딩하는 cDNA 말단의 5‘ 신속 증폭은 키메릭 ALK 전사체가 이들 종양에 존재하는지를 결정하기 위하여 구축되었다.
5‘RACE 및 상보적인 DNA 말단들의 신속한 증폭은 cDNA 합성을 위하여 ALK-GSP1 프라이머 그리고 네스티드 PCR반응을 위해서는 ALK-GSP2 및 ALK-GSP3을 가지고 상기 파트 A에 기재된 것과 실질적으로 같이 수행되었다.
도 5 (패널 C)는 두 환자 샘플에서 5‘RACE에 의한 EML4-ALK 융합 유전자들(짧고 긴 변이체 모두)의 검출 및 한 환자에서의 TFG-ALK 융합 유전자의 검출 그리고 2라운드 후의 PCR증폭 산물의 검출을 나타낸다.그 PCR 산물들은 정제되고 파트A에서 실질적으로 기재된 것과 같이 시퀀싱하였다. 그 결과 산물의 서열 분석은 ALK의 카이네이즈 도메인과 C-말단이 두 다른 변이체에서 EML-4 유전자 N-말단에 융합되었다는 것을 나타낸다(도 1A-1B, 패널 B 참고). 그 EML4-ALK 융합 유전자들은 인-프레임이고 ALK의 마지막 592 아미노산들이 EML-4의 첫 번 233 아미노산(짧은 변이체) 또는 첫 번 495 아미노산들(긴 변이체)과 융합되었다(도 1A-1B, 패널 B 참고). EML-4 및 ALK 유전자들 모두 염색체 2에 위치하고 따라서 그 융합 유전자는 두 위치 사이의 유전자 결손에 의하여 형성되었다. CS045 환자에서 융합 유전자(짧은 변이체)의 발견은 인간 세포주 H2228에서 이 돌연변이 유전자의 발견을 확인하였다.
그 TFG-ALK 융합 유전자 또한 인-프레임이고 ALK의 마지막 562 아미노산들이 TFG의 첫 번 138 아미노산에 융합되었다(도 1C, 패널 B 참고). TFG 및 ALK 유전자들은 다른 염색체들(각각 염색체 6 및 2)에 존재하고, 따라서 그 융합 유전자는 이들 두 위치 사이의 유전자 전위에 의하여 형성되었다. 흥미롭게도 ALK에 TPG의 융합은 두 EML4-ALK 변이체들의 융합에 대하여 관찰된 것과 같은 동일한 위치에서 정확하게 일어나서, 이 지점에서 고형 종양들에서 트런케이션이 공통으로 일어날 수 있다는 것을 나타낸다.
파트 A와 동일한 프라이머가 사용되었다. EML-4의 N-말단 및 TFG가 그대로인지를 확인하기 위하여(도 6(패널 B)참고) 융합 단백질들에서 파트 A에 기재된 것과 실질적으로 같은 RT-PCR 분석이 수행되었다. EML-4 및 ALK에 대한 프라이머쌍은 파트 A에 기재된 것과 같다. 하기 프라이머 쌍이 TFG에 사용되었다:
TFG-F1: 5'-TTTGTTAATGGCCAGCCAAGACCC-3 (서열번호 28)
양 EML4-ALK 융합 변이체에서 그 ALK 부분은 ALCL에서 일어나는 NPM-ALK 융합과 같은 다른 ALK 융합들에서 관찰되는 ALK에서 정확하게 동일한 지점에서 EML-4 부위와 융합된다. 또한 야생형 EML-4는 EML4-ALK 융합 단백질에서 존재하지 아니하는 자리에서만 인산화된 타이로신이고, 융합 단백질에서 보존된 N-말단 코일된 코일 도메인(도 1A-1B 참고)은 ALK를 다이머화하고 활성화할뿐 아니라 야생형 ALK와 상호작용을 촉진하는 기능을 하는 것으로 추측된다. 또한 ALK의 TG부분의 융합은 ALK에서 동일한 지점에서 정확하게 일어나고 사실 이 지점에서 ALK에 대한 TFG의 융합은 인간 림프종에서 기재되었으나(상기 Hernandez 외 (2002), 참고) NSCLC와 같은 인간 고형 종양들에서는 전에 보고된 바가 없다.
실시예 3
siRNA 를 사용한 ALK 융합-발현하는 포유류 고형 종양들의 성장 저해
ALK의 트런케이티드된/융합 형태가 환자 CS010/11, CS045, 및 CS110 로부터 유래한 종양 샘플 뿐 아니라 NSCLC 세포주 H2228에서 세포 성장과 생존을 추진하는지를 확인하기 위하여 이들 세포들과 종양들의 성장을 저해하는 siRNA (ALK에 대한)의 능력을 조사될 수 있다.
ALK SMARTpool siRNA 이중나선들(사유 타겟 서열들-데이터는 나타내지 아니함)을 예를 들어 Dharmacon Research, Inc. (Lafayette, CO)로부터 구입될 수 있다. 비-특이적인 SMARTpool siRNA를 대조군으로 사용된다. 세포들을 전기천공에 의하여 siRNA로 트랜스팩션한다. 간략하게 설명하면, 2 x 107 세포들(H2228)을 스퀘어-파 전기천공기(BTX Genetronics, San Diego, CA)을 사용하여 한 번(20ms; 275V, K562 20ms; 285V) 펄스하고, 상온에서 30분간 배양하고 30 ml RPMI-1640/10% FBS를 가지는 T150 플라스크로 옮겼다.
생존 세포들의 수는 CellTiter 96 AQueous 원(One) 용액 세포 증식 분석(Promega)으로 결정되었다. IC50 는 OriginPro 6.1 소프트웨어(OriginLab)를 사용하여 계산된다. 48시간에서 에팝토시스 세포들의 퍼센트는 절단된-캐스페이즈-3 (Cell Signaling Technology)의 유동 세포 분석에 의하여 결정될 수 있다.
면역블럿 분석은 환자 CS010/11, CS045, 및 CS110으로부터 유래한 종양 세포 또는 H2228 세포로 에서 ALK의 발현이 siRNA의 트랜스팩션을 수반하는 72시간에서 특이적이고 크게 감소되는 것을 보여 줄 것이다. ALK의 다운 조절은 세포 성장의 강한 저해를 할 것이다. ALK siRNA로 처리는 이들 고형 종양 세포들의 증가된 에팝토시스를 야기할 것이다. 이들 결과들은 H2228 세포주 및 환자 종양들에서 돌연변이체/융합된 ALK 카이네이즈들이 이들 NSCLC 세포들의 성장 및 증식을 추진하고, 그러한 성장 및 증식은 ALK 발현 및 활성을 저해하는 siRNA를 사용하여 저해될 것이라는 것을 더욱 알려 줄 것이다.
실시예 4
WI -131 및/또는 WI -154를 사용한 ALK 융합-발현하는 포유류 고형 종양의 성장 저해
돌연변이체 ALK 융합 단백질들이 환자 CS010/11, CS045, 및 CS110 로부터 유래한 NSCLC 종양 세포주 및 NSCLC 세포주 H2228의 성장 및 생존을 추진하는 것을 더욱 확인하기 위하여, 그 세포들을 WI-131 및/또는 WI-154와 같은 ALK 카이네이즈의 타겟 저해제로 처리할 수 있다. WI-131 및 WI-154는 ALK 카이네이즈의 퀴나졸린-타입 소 분자 저해제이고, T-세포 림프종에서 그 NPM-ALK 융합 단백질에 대한 그들의 활성이 알려졌다. 상기 Marzec 외, 참고.
간략하게 설명하면, NSCLC 세포들을 계산하고, 세포 성장 저해 분석은 제조업자가 제안하는 것에 따라 CellTiter 96 AQueous 원 용액 세포 증식 분석(Promega)으로 수행된다. 간략하게 설명하면, 1000에서 5000 세포들을 프랫-바텀 96-웰 플레이트 상에 시딩하고 10% FBS를 가지는 완전 배지에서 성장된다. 24 시간 후, 그 세포 배지는 그 약제의 여러 농도를 포함하는 10% FBS를 가지는 100㎕ 완전 성장 배지로 변화되고 그 세포들을 또 72 시간 동안 배양된다. 각 약제 농도는 세포들의 세 동일한(triplicate) 웰에 적용된다. 배양의 끝에서, 20 ㎕의 CellTiter 96 AQueous 원 용액은 각 웰에 첨가하고 그 플레이트는 1-4 시간 동안 배양하였다. 흡광도는 Titan Multiskan Ascent 마이크로플레이트 리더(Titertek Instrument)를 사용하여 490nm에서 읽는다. 성장 저해는 처리된 세포들 대 비처리된 세포들로부터 읽은 흡광도의 평균 ± SD 값으로 표현될 수 있다. 그 분석은 적어도 3회 반복한다.
그러한 분석은 ALK 융합 단백질들(EML4-ALK (짧은 그리고 긴 변이체들), TFG-ALK)이 돌연변이체 단백질이 발현되는 인간 NSCLC 종양들의 서브세트의 성장 및 생존을 추진하는지를 확인할 것이고, 그러한 세포들은 WI-131 및/또는 WI-154와 같은 타겟된 저해제를 사용하여 융합 ALK 카이네이즈의 활성을 저해하여 저해될 수 있다는 것을 확인할 것이다.
실시예 5
ALK 융합 단백질들은 형질전환된 포유류 세포주의 성장 및 생존을 추진한다
하나 이상의 ALK 융합단백질의 발현이 암 표현형으로 정상세포를 형질전환할 수 있는지를 확인하기 위하여, 3T# 세포들은 상기 기재된 cDNA 컨스트럭트로 형질전환될 수 있고(실시예 2), 그것은 각각 EML4-ALK (짧은 그리고 긴 변이체) 도는 TFG-ALK 융합 단백질들을 발현한다.
간략하게 설명하면, 세포들을 10% 우태혈청(FBS) (Sigma) 및 1.0 ng/ml IL-3 (R&D Systems)을 가지는 RPMI-1640 배지(Invitrogen)에서 유지한다. 레트로바이러스 상등액의 생성 및 트랜스팩션은 전에 알려진 것과 같이 수행된다. Schwaller 외, Embo J. 17(18): 5321-33 (1998) 참고. 3T3 세포들은 MSCV-Neo/EML4-ALK (또는 TFG-ALK) 벡터를 포함하는 레트로바이러스 상등액으로 트랜스덕션하였고 G418 (1 mg/ml)에 대하여 선택하였다. 다음, 소프트 아가에서 성장하는 형질전환된 세포들의 능력을 PBS로 3회 세척한 후 트랜스덕션된 세포들을 플레이팅하여서 측정된다. 원한다면, 용량 반응 곡선에 대하여 세포들은 상기 기재된 것과 같이 ALK에 대한 siRNA로 처리되고(실시예 3 참고), 생존 세포들의 수는 CellTiter 96 AQueous 원 용액 세포 증식 분석(Promega)로 결정된다. IC50 는 OriginPro 6.1 소프트웨어(OriginLab)를 사용하여 계산된다. 48시간에서 에팝토시스 세포들의 퍼센트는 이 타겟에 특이적인 항체를 사용하여 절단된-캐스페이즈-3 (Cell Signaling Technology)의 유동 세포 분석에 의하여 결정될 수 있다.그러한 분석은 EML4-ALK 융합 단백질 (짧은 또는 긴 변이체) 또는 TFG-ALK 융합 단백질의 발현이 3T3 세포를 형질전환할 수 있고, 이들 세포들을 ALK 융합 단백질에 의하여 추진될 때 소프트 아가 상에서 생존 및 성장을 확인할 수 있고, 형질전환된 세포들에서 ALK 발현의 저해는 감소된 생존성 및 증가된 에팝토시스를 야기한다는 것을 나타낸다.
실시예 6
FISH 분석을 사용한 인간 고형 종양들에서 EML4 - ALK 융합 단백질 발현의 검
인간 NSCLC 종양 샘플에서 EML4-ALK 융합 단백질 (짧은 변이체)의 존재는 전에 알려진 것과 같이 형광 인 시투 교잡(FISH) 분석을 사용하여서 검출되었다. 예를 들어 Verma 외 Human Chromosomes: A Manual of Basic Techniques, Pergamon Press, New York, N.Y. (1988) 참고. 200 이상 파라핀-충진된 인간 NSCLC 종양 샘플들을 조사하였다.
ALK 이중 칼라, 브레이크-어파트 재배열 프로브는 Vysis (Vysis, Dowers Grove, IL, USA)로부터 얻었고, 하기 변형을 가지는 제조업자의 지시에 따라서 사용되었다. 간략하게 설명하면, 파라핀 충진된 조직 박편들을 재-수화하고 0.01M 구연산 버퍼(pH 6.0)에서 11분 동안에 마이크로웨이브 항원 회복을 수행하였다. 박편들을 프로테이즈(4mg/ml 펩신, 2000-3000U/mg)로 37℃에서 25 분간 처리하고, 탈수하고 FISH 프로브 세트로 37℃에서 18시간 교잡하였다. 세척 후, Vectashield 마운팅 배지(Vector Laboratories, Burlingame, CA)에서 4‘,6-diamidino-2-phenylindole (DAPI; mg/ml)를 핵 카운터염색에 적용되었다.
그 ALK 재배열 프로브는 야생형 서열(서열번호 6)에서 ALK 유전자의 구분점(뉴크레오타이드 3171에서)의 반대편 상에 두 다르게 표지된 프로브를 포함한다. 교잡된 때, 천연 ALK 부위는 오렌지/그린 융합 신호로 나타내는 반면, 이 지점에서 재배열(EML4-ALK 결손 돌연변이체에서 일어나는 것과 같이)은 오렌지와 그린 신호를 분리하는 것을 야기할 것이다. 도 6 참고.
그 FISH 분석은 연구된 샘플(229 샘플 중 하나)에서 짧은 변이체 EML4-ALK 돌연변이의 비교적 낮은 빈도를 나타내었다. 그러나 전세계 주어진 높은 빈도수의 NSCLC국에서만 매년 151,00 이상의 새 케이스)에서, 이 돌연변이체 ALK를 가진 환자들의 수가 현저하게 많을 것이고 그 환자는 ALK-저해하는 치료법으로부터 효과를 가질 것이다.
실시예 7
PCR 분석을 사용한 인간 고형 종양들에서 ALK 융합 단백질의 검출
인간 고형 종양 샘플에서 하나 이상의 ALK 융합 단백질들의 존재는 전에 알려진 지노믹 또는 역전사효소(RT) 중합효소 연쇄 반응(PCR)을 사용하여 검출될 수도 있다. 예를 들어 Cools 외, N. Engl . J. Med . 348: 1201-1214 (2003) 참고. 간략하게 예를 들면, 고형 종양 샘플들은 표준 기술들을 사용하여 예를 들어 NSCLC를 가지는 환자로부터 얻을 수 있다. 트런케이트된 ALK 카이네이즈 또는 EML4-ALK 융합 단백질 (짧은 또는 긴 변이체) 또는 TFG-ALK 융합 단백질에 대한 PCR 프로브들은 구축된다. RNeasy 미니 키트(Qiagen)는 종양 샘플로부터 RNA를 추출하는데 사용되었다. DNA는 DNeasy 티슈 키트(Qiagen)의 사용으로 추출되었다. RT-PCR을 위하여, 첫째 가닥 cDNA는 올리고(dT)20을 가지는 SuperScriptTM III 첫째 가닥 합성 시스템(Invitrogen)으로 2.5mg의 전체 RNA으로부터 합성되었다. 그 다음에 그 ALK 융합 유전자는 예를 들어 EML4-202 및 ALK-GSP3 프라이머 쌍을 사용하여 증폭되었다(상기 실시예 2 참고). 지노믹 PCR을 위하여, 융합 유전자의 증폭이 예를 들어 EML4-202 및 ALK-GSP3 프라이머 쌍을 가지고 Platinum Taq DNA polymerase 하이 피델리티(Invitrogen)를 사용하여 수행되었다(상기 실시예 2 참고).
그러한 분석은 트런케이트된 ALK 카이네이즈(및/또는 EML4-ALK 융합 단백질(들) 또는 TFG-ALK 융합 단백질)의 발현에 의하여 특성화되는 고형 종양을 가지는 환자를 동정할 것이고, 그 환자는 WHI-131 및/또는 WHI154와 같은 ALK-저해하는 치료제를 사용한 치료에 대한 후보자이다.
이 새로운 융합 단백질의 기재된 동정은 생물학적 샘플에서 돌연변이 ALK 카이네이즈 폴리펩타이드의 존재를 결정하는 새로운 방법, 그 단백질을 저해하는 화합물을 스크리닝하는 방법 및 본 발명에 의하여 제공되는 돌연변이 ALK 폴리뉴크레오타이드 또는 폴리펩타이드의 발현에 의하여 특징되어지는 암들의 진행을 저해하는 방법을 가능하게 할 수 있다.
<110> CELL SIGNALING TECHNOLOGY,INC. <120> Gene Defects and Mutant ALK Kinase in Human Solid Tumors <130> P08CS198D-1/KR <160> 29 <170> KopatentIn 1.71 <210> 1 <211> 796 <212> PRT <213> Artificial Sequence <220> <223> EML4-ALK Fusion protein <400> 1 Met Asp Gly Phe Ala Gly Ser Leu Asp Asp Ser Ile Ser Ala Ala Ser 1 5 10 15 Thr Ser Asp Val Gln Asp Arg Leu Ser Ala Leu Glu Ser Arg Val Gln 20 25 30 Gln Gln Glu Asp Glu Ile Thr Val Leu Lys Ala Ala Leu Ala Asp Val 35 40 45 Leu Arg Arg Leu Ala Ile Ser Glu Asp His Val Ala Ser Val Lys Lys 50 55 60 Ser Val Ser Ser Lys Gly Gln Pro Ser Pro Arg Ala Val Ile Pro Met 65 70 75 80 Ser Cys Ile Thr Asn Gly Ser Gly Ala Asn Arg Lys Pro Ser His Thr 85 90 95 Ser Ala Val Ser Ile Ala Gly Lys Glu Thr Leu Ser Ser Ala Ala Lys 100 105 110 Ser Gly Thr Glu Lys Lys Lys Glu Lys Pro Gln Gly Gln Arg Glu Lys 115 120 125 Lys Glu Glu Ser His Ser Asn Asp Gln Ser Pro Gln Ile Arg Ala Ser 130 135 140 Pro Ser Pro Gln Pro Ser Ser Gln Pro Leu Gln Ile His Arg Gln Thr 145 150 155 160 Pro Glu Ser Lys Asn Ala Thr Pro Thr Lys Ser Ile Lys Arg Pro Ser 165 170 175 Pro Ala Glu Lys Ser His Asn Ser Trp Glu Asn Ser Asp Asp Ser Arg 180 185 190 Asn Lys Leu Ser Lys Ile Pro Ser Thr Pro Lys Leu Ile Pro Lys Val 195 200 205 Thr Lys Thr Ala Asp Lys His Lys Asp Val Ile Ile Asn Gln Ala Lys 210 215 220 Met Ser Thr Arg Glu Lys Asn Ser Gln Val Tyr Arg Arg Lys His Gln 225 230 235 240 Glu Leu Gln Ala Met Gln Met Glu Leu Gln Ser Pro Glu Tyr Lys Leu 245 250 255 Ser Lys Leu Arg Thr Ser Thr Ile Met Thr Asp Tyr Asn Pro Asn Tyr 260 265 270 Cys Phe Ala Gly Lys Thr Ser Ser Ile Ser Asp Leu Lys Glu Val Pro 275 280 285 Arg Lys Asn Ile Thr Leu Ile Arg Gly Leu Gly His Gly Ala Phe Gly 290 295 300 Glu Val Tyr Glu Gly Gln Val Ser Gly Met Pro Asn Asp Pro Ser Pro 305 310 315 320 Leu Gln Val Ala Val Lys Thr Leu Pro Glu Val Cys Ser Glu Gln Asp 325 330 335 Glu Leu Asp Phe Leu Met Glu Ala Leu Ile Ile Ser Lys Phe Asn His 340 345 350 Gln Asn Ile Val Arg Cys Ile Gly Val Ser Leu Gln Ser Leu Pro Arg 355 360 365 Phe Ile Leu Leu Glu Leu Met Ala Gly Gly Asp Leu Lys Ser Phe Leu 370 375 380 Arg Glu Thr Arg Pro Arg Pro Ser Gln Pro Ser Ser Leu Ala Met Leu 385 390 395 400 Asp Leu Leu His Val Ala Arg Asp Ile Ala Cys Gly Cys Gln Tyr Leu 405 410 415 Glu Glu Asn His Phe Ile His Arg Asp Ile Ala Ala Arg Asn Cys Leu 420 425 430 Leu Thr Cys Pro Gly Pro Gly Arg Val Ala Lys Ile Gly Asp Phe Gly 435 440 445 Met Ala Arg Asp Ile Tyr Arg Ala Ser Tyr Tyr Arg Lys Gly Gly Cys 450 455 460 Ala Met Leu Pro Val Lys Trp Met Pro Pro Glu Ala Phe Met Glu Gly 465 470 475 480 Ile Phe Thr Ser Lys Thr Asp Thr Trp Ser Phe Gly Val Leu Leu Trp 485 490 495 Glu Ile Phe Ser Leu Gly Tyr Met Pro Tyr Pro Ser Lys Ser Asn Gln 500 505 510 Glu Val Leu Glu Phe Val Thr Ser Gly Gly Arg Met Asp Pro Pro Lys 515 520 525 Asn Cys Pro Gly Pro Val Tyr Arg Ile Met Thr Gln Cys Trp Gln His 530 535 540 Gln Pro Glu Asp Arg Pro Asn Phe Ala Ile Ile Leu Glu Arg Ile Glu 545 550 555 560 Tyr Cys Thr Gln Asp Pro Asp Val Ile Asn Thr Ala Leu Pro Ile Glu 565 570 575 Tyr Gly Pro Leu Val Glu Glu Glu Glu Lys Val Pro Val Arg Pro Lys 580 585 590 Asp Pro Glu Gly Val Pro Pro Leu Leu Val Ser Gln Gln Ala Lys Arg 595 600 605 Glu Glu Glu Arg Ser Pro Ala Ala Pro Pro Pro Leu Pro Thr Thr Ser 610 615 620 Ser Gly Lys Ala Ala Lys Lys Pro Thr Ala Ala Glu Val Ser Val Arg 625 630 635 640 Val Pro Arg Gly Pro Ala Val Glu Gly Gly His Val Asn Met Ala Phe 645 650 655 Ser Gln Ser Asn Pro Pro Ser Glu Leu His Lys Val His Gly Ser Arg 660 665 670 Asn Lys Pro Thr Ser Leu Trp Asn Pro Thr Tyr Gly Ser Trp Phe Thr 675 680 685 Glu Lys Pro Thr Lys Lys Asn Asn Pro Ile Ala Lys Lys Glu Pro His 690 695 700 Asp Arg Gly Asn Leu Gly Leu Glu Gly Ser Cys Thr Val Pro Pro Asn 705 710 715 720 Val Ala Thr Gly Arg Leu Pro Gly Ala Ser Leu Leu Leu Glu Pro Ser 725 730 735 Ser Leu Thr Ala Asn Met Lys Glu Val Pro Leu Phe Arg Leu Arg His 740 745 750 Phe Pro Cys Gly Asn Val Asn Tyr Gly Tyr Gln Gln Gln Gly Leu Pro 755 760 765 Leu Glu Ala Ala Thr Ala Pro Gly Ala Gly His Ile Glu Asp Thr Ile 770 775 780 Leu Lys Ser Lys Asn Ser Met Asn Gln Pro Gly Pro 785 790 795 <210> 2 <211> 2391 <212> DNA <213> Artificial Sequence <220> <223> EML4-ALK Fusion protein <400> 2 atggacggtt tcgccggcag tctcgatgat agtatttctg ctgcaagtac ttctgatgtt 60 caagatcgcc tgtcagctct tgagtcacga gttcagcaac aagaagatga aatcactgtg 120 ctaaaggcgg ctttggctga tgttttgagg cgtcttgcaa tctctgaaga tcatgtggcc 180 tcagtgaaaa aatcagtctc aagtaaaggc caaccaagcc ctcgagcagt tattcccatg 240 tcctgtataa ccaatggaag tggtgcaaac agaaaaccaa gtcataccag tgctgtctca 300 attgcaggaa aagaaactct ttcatctgct gctaaaagtg gtacagaaaa aaagaaagaa 360 aaaccacaag gacagagaga aaaaaaagag gaatctcatt ctaatgatca aagtccacaa 420 attcgagcat caccttctcc ccagccctct tcacaacctc tccaaataca cagacaaact 480 ccagaaagca agaatgctac tcccaccaaa agcataaaac gaccatcacc agctgaaaag 540 tcacataatt cttgggaaaa ttcagatgat agccgtaata aattgtcgaa aataccttca 600 acacccaaat taataccaaa agttaccaaa actgcagaca agcataaaga tgtcatcatc 660 aaccaagcaa aaatgtcaac tcgcgaaaaa aacagccaag tgtaccgccg gaagcaccag 720 gagctgcaag ccatgcagat ggagctgcag agccctgagt acaagctgag caagctccgc 780 acctcgacca tcatgaccga ctacaacccc aactactgct ttgctggcaa gacctcctcc 840 atcagtgacc tgaaggaggt gccgcggaaa aacatcaccc tcattcgggg tctgggccat 900 ggcgcctttg gggaggtgta tgaaggccag gtgtccggaa tgcccaacga cccaagcccc 960 ctgcaagtgg ctgtgaagac gctgcctgaa gtgtgctctg aacaggacga actggatttc 1020 ctcatggaag ccctgatcat cagcaaattc aaccaccaga acattgttcg ctgcattggg 1080 gtgagcctgc aatccctgcc ccggttcatc ctgctggagc tcatggcggg gggagacctc 1140 aagtccttcc tccgagagac ccgccctcgc ccgagccagc cctcctccct ggccatgctg 1200 gaccttctgc acgtggctcg ggacattgcc tgtggctgtc agtatttgga ggaaaaccac 1260 ttcatccacc gagacattgc tgccagaaac tgcctcttga cctgtccagg ccctggaaga 1320 gtggccaaga ttggagactt cgggatggcc cgagacatct acagggcgag ctactataga 1380 aagggaggct gtgccatgct gccagttaag tggatgcccc cagaggcctt catggaagga 1440 atattcactt ctaaaacaga cacatggtcc tttggagtgc tgctatggga aatcttttct 1500 cttggatata tgccataccc cagcaaaagc aaccaggaag ttctggagtt tgtcaccagt 1560 ggaggccgga tggacccacc caagaactgc cctgggcctg tataccggat aatgactcag 1620 tgctggcaac atcagcctga agacaggccc aactttgcca tcattttgga gaggattgaa 1680 tactgcaccc aggacccgga tgtaatcaac accgctttgc cgatagaata tggtccactt 1740 gtggaagagg aagagaaagt gcctgtgagg cccaaggacc ctgagggggt tcctcctctc 1800 ctggtctctc aacaggcaaa acgggaggag gagcgcagcc cagctgcccc accacctctg 1860 cctaccacct cctctggcaa ggctgcaaag aaacccacag ctgcagaggt ctctgttcga 1920 gtccctagag ggccggccgt ggaaggggga cacgtgaata tggcattctc tcagtccaac 1980 cctccttcgg agttgcacaa ggtccacgga tccagaaaca agcccaccag cttgtggaac 2040 ccaacgtacg gctcctggtt tacagagaaa cccaccaaaa agaataatcc tatagcaaag 2100 aaggagccac acgacagggg taacctgggg ctggagggaa gctgtactgt cccacctaac 2160 gttgcaactg ggagacttcc gggggcctca ctgctcctag agccctcttc gctgactgcc 2220 aatatgaagg aggtacctct gttcaggcta cgtcacttcc cttgtgggaa tgtcaattac 2280 ggctaccagc aacagggctt gcccttagaa gccgctactg cccctggagc tggtcattac 2340 gaggatacca ttctgaaaag caagaatagc atgaaccagc ctgggccctg a 2391 <210> 3 <211> 981 <212> PRT <213> Artificial Sequence <220> <223> EML-4 Protein <400> 3 Met Asp Gly Phe Ala Gly Ser Leu Asp Asp Ser Ile Ser Ala Ala Ser 1 5 10 15 Thr Ser Asp Val Gln Asp Arg Leu Ser Ala Leu Glu Ser Arg Val Gln 20 25 30 Gln Gln Glu Asp Glu Ile Thr Val Leu Lys Ala Ala Leu Ala Asp Val 35 40 45 Leu Arg Arg Leu Ala Ile Ser Glu Asp His Val Ala Ser Val Lys Lys 50 55 60 Ser Val Ser Ser Lys Gly Gln Pro Ser Pro Arg Ala Val Ile Pro Met 65 70 75 80 Ser Cys Ile Thr Asn Gly Ser Gly Ala Asn Arg Lys Pro Ser His Thr 85 90 95 Ser Ala Val Ser Ile Ala Gly Lys Glu Thr Leu Ser Ser Ala Ala Lys 100 105 110 Ser Gly Thr Glu Lys Lys Lys Glu Lys Pro Gln Gly Gln Arg Glu Lys 115 120 125 Lys Glu Glu Ser His Ser Asn Asp Gln Ser Pro Gln Ile Arg Ala Ser 130 135 140 Pro Ser Pro Gln Pro Ser Ser Gln Pro Leu Gln Ile His Arg Gln Thr 145 150 155 160 Pro Glu Ser Lys Asn Ala Thr Pro Thr Lys Ser Ile Lys Arg Pro Ser 165 170 175 Pro Ala Glu Lys Ser His Asn Ser Trp Glu Asn Ser Asp Asp Ser Arg 180 185 190 Asn Lys Leu Ser Lys Ile Pro Ser Thr Pro Lys Leu Ile Pro Lys Val 195 200 205 Thr Lys Thr Ala Asp Lys His Lys Asp Val Ile Ile Asn Gln Glu Gly 210 215 220 Glu Tyr Ile Lys Met Phe Met Arg Gly Arg Pro Ile Thr Met Phe Ile 225 230 235 240 Pro Ser Asp Val Asp Asn Tyr Asp Asp Ile Arg Thr Glu Leu Pro Pro 245 250 255 Glu Lys Leu Lys Leu Glu Trp Ala Tyr Gly Tyr Arg Gly Lys Asp Cys 260 265 270 Arg Ala Asn Val Tyr Leu Leu Pro Thr Gly Glu Ile Val Tyr Phe Ile 275 280 285 Ala Ser Val Val Val Leu Phe Asn Tyr Glu Glu Arg Thr Gln Arg His 290 295 300 Tyr Leu Gly His Thr Asp Cys Val Lys Cys Leu Ala Ile His Pro Asp 305 310 315 320 Lys Ile Arg Ile Ala Thr Gly Gln Ile Ala Gly Val Asp Lys Asp Gly 325 330 335 Arg Pro Leu Gln Pro His Val Arg Val Trp Asp Ser Val Thr Leu Ser 340 345 350 Thr Leu Gln Ile Ile Gly Leu Gly Thr Phe Glu Arg Gly Val Gly Cys 355 360 365 Leu Asp Phe Ser Lys Ala Asp Ser Gly Val His Leu Cys Val Ile Asp 370 375 380 Asp Ser Asn Glu His Met Leu Thr Val Trp Asp Trp Gln Lys Lys Ala 385 390 395 400 Lys Gly Ala Glu Ile Lys Thr Thr Asn Glu Val Val Leu Ala Val Glu 405 410 415 Phe His Pro Thr Asp Ala Asn Thr Ile Ile Thr Cys Gly Lys Ser His 420 425 430 Ile Phe Phe Trp Thr Trp Ser Gly Asn Ser Leu Thr Arg Lys Gln Gly 435 440 445 Ile Phe Gly Lys Tyr Glu Lys Pro Lys Phe Val Gln Cys Leu Ala Phe 450 455 460 Leu Gly Asn Gly Asp Val Leu Thr Gly Asp Ser Gly Gly Val Met Leu 465 470 475 480 Ile Trp Ser Lys Thr Thr Val Glu Pro Thr Pro Gly Lys Gly Pro Lys 485 490 495 Gly Val Tyr Gln Ile Ser Lys Gln Ile Lys Ala His Asp Gly Ser Val 500 505 510 Phe Thr Leu Cys Gln Met Arg Asn Gly Met Leu Leu Thr Gly Gly Gly 515 520 525 Lys Asp Arg Lys Ile Ile Leu Trp Asp His Asp Leu Asn Pro Glu Arg 530 535 540 Glu Ile Glu Val Pro Asp Gln Tyr Gly Thr Ile Arg Ala Val Ala Glu 545 550 555 560 Gly Lys Ala Asp Gln Phe Leu Val Gly Thr Ser Arg Asn Phe Ile Leu 565 570 575 Arg Gly Thr Phe Asn Asp Gly Phe Gln Ile Glu Val Gln Gly His Thr 580 585 590 Asp Glu Leu Trp Gly Leu Ala Thr His Pro Phe Lys Asp Leu Leu Leu 595 600 605 Thr Cys Ala Gln Asp Arg Gln Val Cys Leu Trp Asn Ser Met Glu His 610 615 620 Arg Leu Glu Trp Thr Arg Leu Val Asp Glu Pro Gly His Cys Ala Asp 625 630 635 640 Phe His Pro Ser Gly Thr Val Val Ala Ile Gly Thr His Ser Gly Arg 645 650 655 Trp Phe Val Leu Asp Ala Glu Thr Arg Asp Leu Val Ser Ile His Thr 660 665 670 Asp Gly Asn Glu Gln Leu Ser Val Met Arg Tyr Ser Ile Asp Gly Thr 675 680 685 Phe Leu Ala Val Gly Ser His Asp Asn Phe Ile Tyr Leu Tyr Val Val 690 695 700 Ser Glu Asn Gly Arg Lys Tyr Ser Arg Tyr Gly Arg Cys Thr Gly His 705 710 715 720 Ser Ser Tyr Ile Thr His Leu Asp Trp Ser Pro Asp Asn Lys Tyr Ile 725 730 735 Met Ser Asn Ser Gly Asp Tyr Glu Ile Leu Tyr Trp Asp Ile Pro Asn 740 745 750 Gly Cys Lys Leu Ile Arg Asn Arg Ser Asp Cys Lys Asp Ile Asp Trp 755 760 765 Thr Thr Tyr Thr Cys Val Leu Gly Phe Gln Val Phe Gly Val Trp Pro 770 775 780 Glu Gly Ser Asp Gly Thr Asp Ile Asn Ala Leu Val Arg Ser His Asn 785 790 795 800 Arg Lys Val Ile Ala Val Ala Asp Asp Phe Cys Lys Val His Leu Phe 805 810 815 Gln Tyr Pro Cys Ser Lys Ala Lys Ala Pro Ser His Lys Tyr Ser Ala 820 825 830 His Ser Ser His Val Thr Asn Val Ser Phe Thr His Asn Asp Ser His 835 840 845 Leu Ile Ser Thr Gly Gly Lys Asp Met Ser Ile Ile Gln Trp Lys Leu 850 855 860 Val Glu Lys Leu Ser Leu Pro Gln Asn Glu Thr Val Ala Asp Thr Thr 865 870 875 880 Leu Thr Lys Ala Pro Val Ser Ser Thr Glu Ser Val Ile Gln Ser Asn 885 890 895 Thr Pro Thr Pro Pro Pro Ser Gln Pro Leu Asn Glu Thr Ala Glu Glu 900 905 910 Glu Ser Arg Ile Ser Ser Ser Pro Thr Leu Leu Glu Asn Ser Leu Glu 915 920 925 Gln Thr Val Glu Pro Ser Glu Asp His Ser Glu Glu Glu Ser Glu Glu 930 935 940 Gly Ser Gly Asp Leu Gly Glu Pro Leu Tyr Glu Glu Pro Cys Asn Glu 945 950 955 960 Ile Ser Lys Glu Gln Ala Lys Ala Thr Leu Leu Glu Asp Gln Gln Asp 965 970 975 Pro Ser Pro Ser Ser 980 <210> 4 <211> 5301 <212> DNA <213> Artificial Sequence <220> <223> EML-4 <400> 4 atggacggtt tcgccggcag tctcgatgat agtatttctg ctgcaagtac ttctgatgtt 60 caagatcgcc tgtcagctct tgagtcacga gttcagcaac aagaagatga aatcactgtg 120 ctaaaggcgg ctttggctga tgttttgagg cgtcttgcaa tctctgaaga tcatgtggcc 180 tcagtgaaaa aatcagtctc aagtaaaggc caaccaagcc ctcgagcagt tattcccatg 240 tcctgtataa ccaatggaag tggtgcaaac agaaaaccaa gtcataccag tgctgtctca 300 attgcaggaa aagaaactct ttcatctgct gctaaaagtg gtacagaaaa aaagaaagaa 360 aaaccacaag gacagagaga aaaaaaagag gaatctcatt ctaatgatca aagtccacaa 420 attcgagcat caccttctcc ccagccctct tcacaacctc tccaaataca cagacaaact 480 ccagaaagca agaatgctac tcccaccaaa agcataaaac gaccatcacc agctgaaaag 540 tcacataatt cttgggaaaa ttcagatgat agccgtaata aattgtcgaa aataccttca 600 acacccaaat taataccaaa agttaccaaa actgcagaca agcataaaga tgtcatcatc 660 aaccaagaag gagaatatat taaaatgttt atgcgcggtc ggccaattac catgttcatt 720 ccttccgatg ttgacaacta tgatgacatc agaacggaac tgcctcctga gaagctcaaa 780 ctggagtggg catatggtta tcgaggaaag gactgtagag ctaatgttta ccttcttccg 840 accggggaaa tagtttattt cattgcatca gtagtagtac tatttaatta tgaggagaga 900 actcagcgac actacctggg ccatacagac tgtgtgaaat gccttgctat acatcctgac 960 aaaattagga ttgcaactgg acagatagct ggcgtggata aagatggaag gcctctacaa 1020 ccccacgtca gagtgtggga ttctgttact ctatccacac tgcagattat tggacttggc 1080 acttttgagc gtggagtagg atgcctggat ttttcaaaag cagattcagg tgttcattta 1140 tgtgttattg atgactccaa tgagcatatg cttactgtat gggactggca gaagaaagca 1200 aaaggagcag aaataaagac aacaaatgaa gttgttttgg ctgtggagtt tcacccaaca 1260 gatgcaaata ccataattac atgcggtaaa tctcatattt tcttctggac ctggagcggc 1320 aattcactaa caagaaaaca gggaattttt gggaaatatg aaaagccaaa atttgtgcag 1380 tgtttagcat tcttggggaa tggagatgtt cttactggag actcaggtgg agtcatgctt 1440 atatggagca aaactactgt agagcccaca cctgggaaag gacctaaagg tgtatatcaa 1500 atcagcaaac aaatcaaagc tcatgatggc agtgtgttca cactttgtca gatgagaaat 1560 gggatgttat taactggagg agggaaagac agaaaaataa ttctgtggga tcatgatctg 1620 aatcctgaaa gagaaataga ggttcctgat cagtatggca caatcagagc tgtagcagaa 1680 ggaaaggcag atcaattttt agtaggcaca tcacgaaact ttattttacg aggaacattt 1740 aatgatggct tccaaataga agtacagggt catacagatg agctttgggg tcttgccaca 1800 catcccttca aagatttgct cttgacatgt gctcaggaca ggcaggtgtg cctgtggaac 1860 tcaatggaac acaggctgga atggaccagg ctggtagatg aaccaggaca ctgtgcagat 1920 tttcatccaa gtggcacagt ggtggccata ggaacgcact caggcaggtg gtttgttctg 1980 gatgcagaaa ccagagatct agtttctatc cacacagacg ggaatgaaca gctctctgtg 2040 atgcgctact caatagatgg taccttcctg gctgtaggat ctcatgacaa ctttatttac 2100 ctctatgtag tctctgaaaa tggaagaaaa tatagcagat atggaaggtg cactggacat 2160 tccagctaca tcacacacct tgactggtcc ccagacaaca agtatataat gtctaactcg 2220 ggagactatg aaatattgta ctgggacatt ccaaatggct gcaaactaat caggaatcga 2280 tcggattgta aggacattga ttggacgaca tatacctgtg tgctaggatt tcaagtattt 2340 ggtgtctggc cagaaggatc tgatgggaca gatatcaatg cactggtgcg atcccacaat 2400 agaaaggtga tagctgttgc cgatgacttt tgtaaagtcc atctgtttca gtatccctgc 2460 tccaaagcaa aggctcccag tcacaagtac agtgcccaca gcagccatgt caccaatgtc 2520 agttttactc acaatgacag tcacctgata tcaactggtg gaaaagacat gagcatcatt 2580 cagtggaaac ttgtggaaaa gttatctttg cctcagaatg agactgtagc ggatactact 2640 ctaaccaaag cccccgtctc ttccactgaa agtgtcatcc aatctaatac tcccacaccg 2700 cctccttctc agcccttaaa tgagacagct gaagaggaaa gtagaataag cagttctccc 2760 acacttctgg agaacagcct ggaacaaact gtgggccaag tgaagaccac agcgaggagg 2820 agagtgaaga gggcagcgga gaccttggtg agcctcttta tgaagagcca tgcaacgaga 2880 taagcaagga gcaggccaaa gccacccttc tggaggacca gcaagaccct tcgccctcgt 2940 cctaacaccc tggcttcagt gcaactcttt tccttcagct gcatgtgatt ttgtgataaa 3000 gttcaggtaa caggatgggc agtgatggag aatcactgtt gattgagatt ttggtttcca 3060 tgtgatttgt tttcttcaat agtcttattt tcagtctctc aaatacagcc aacttaaagt 3120 tttagtttgg tgtttattga aaattaacca aacttaatac taggagaaga ctgaatcatt 3180 aatgatgtct cacaaattac tgtgtaccta agtggtgtga tgtaaatact ggaaacaaaa 3240 acagcagttg cattgatttt gaaaacaaac ccccttgtta tctgaacatg ttttcttcag 3300 gaacaaccag aggtatcaca aacactgtta ctcatctact ggctcagact gtactacttt 3360 tttttttttt tttcctgaaa aagaaaccag aaaaaaatgt actcttactg agataccctc 3420 tcaccccaaa tgtgtaatgg aaaattttta attaagaaaa acttcagttt tgccaagtgc 3480 aatggtgttg ccttctttaa aaaatgccgt tttcttacac taccagtgga tgtccagaca 3540 tgctcttagt ctactagaga ggtgctgcct tttctaagtc ataatgagga acagtccctt 3600 aatttcttgt gtgcaactct gttttatcct agaactaaga gagcattggt ttgttaaaga 3660 gctttcaatg tatattaaaa ccttcaatac tcagaaatga tggattcctc caaggagtcc 3720 tttactagcc taaacattct caaatgtttg agattcaagt gaatggaagg aaaaccacat 3780 gcctttaaaa ctaaactgta ataattacct ggctaatttc agctaagcct tcatcataat 3840 ttgttccctc agtaatagga gaaatataaa tacagtaagt ttagattatt gaattggtgc 3900 ttgaaattta ttggttttgt tgtaatttta tacagattat atgagggata agatactcat 3960 caaattgcaa attctttttt ttacagaagt gtgggtaaca gtcacagcag ttttttttac 4020 caacagcata cttaacagac ttgctgtgta gcagtttttt tctggtggag ttgctgtaag 4080 tcttgtaagt ctaatgtggc tatcctactc ttttgggcaa tgcatgtatt atgcattgga 4140 aaggtatttt ttttaagttc tgttggctag ctatggtttt cagtacattt cctactttaa 4200 gagtaattac tgacaaatat gtatttccta tatgtttata ctttgattat aaaaaagtat 4260 tttgttttga ttttttaact tgctgcattg ttttgatact ttctattttt ttggtcaaat 4320 catgtttaga aactttggat gagttaagaa gtcttaagta tgcaggcgtt tacgtgattg 4380 tgccattcca aagtgcatca gaactgtcat tcccttctaa tatcttctca ggagtaatac 4440 aaatcaggta tttcatcatc atttggtaat atgaaaactc cagtgaactc ccaaggacat 4500 ttacaacatt tatattcaca cgctgtatgg aagggtgtgg gtgtgtgtga aggggcgagt 4560 ggagacactg tgtgtatctc tagataagaa gatatgcacc acgttgaaaa tactcagtgt 4620 agatctctat gtgtataggt atctgtatat ctttcctttt gtttacaact gttaaaaaac 4680 ctcaaaatag ttctcttcaa aagaagagag attccaagca acccatcttt cttcagtatg 4740 tatgttctgt acatacttat cggagcgcgc cagtaagtat caggcatata tatctgtctg 4800 ttagcaatga ttattacatc atcagatcag catgtgctat actccctgca agaaatatac 4860 tgacatgaac aggcagttct tggagaagaa agagcatttc tttaagtacc tggggaatac 4920 agctctcagt gatcagcagg gagtttattt gaggacatca gtcacctttg gggttgccat 4980 gtacaatgag atttataatc atgatactct tcggtggtag tttcaaaaga cactactaat 5040 acgcaggaag cgtccagcta tttaatgctg gcaactactg tttaatggtc agttaaatct 5100 gtgataatgg ttggaagtgg gtggggttat gaaattgtag atgtttttag aaaaacttgt 5160 gaatgaaaat gaatccaagt gtttcatgtg aagatgttga gccattgcta tcatgcattc 5220 ctgtctcatg gcagaaaatt ttgaagatta aaaaataaaa taatcaaaat gtttcctctt 5280 tctaaaaaaa aaaaaaaaaa a 5301 <210> 5 <211> 1590 <212> PRT <213> human ALK Kinase <400> 5 Met Gly Ala Ile Gly Leu Leu Trp Leu Leu Pro Leu Leu Leu Ser Thr 1 5 10 15 Ala Ala Val Gly Ser Gly Met Gly Thr Gly Gln Arg Ala Gly Ser Pro 20 25 30 Ala Ala Gly Ser Pro Leu Gln Pro Arg Glu Pro Leu Ser Tyr Ser Arg 35 40 45 Leu Gln Arg Lys Ser Leu Ala Val Asp Phe Val Val Pro Ser Leu Phe 50 55 60 Arg Val Tyr Ala Arg Asp Leu Leu Leu Pro Pro Ser Ser Ser Glu Leu 65 70 75 80 Lys Ala Gly Arg Pro Glu Ala Arg Gly Ser Leu Ala Leu Asp Cys Ala 85 90 95 Pro Leu Leu Arg Leu Leu Gly Pro Ala Pro Gly Val Ser Trp Thr Ala 100 105 110 Gly Ser Pro Ala Pro Ala Glu Ala Arg Thr Leu Ser Arg Val Leu Lys 115 120 125 Gly Gly Ser Val Arg Lys Leu Arg Arg Ala Lys Gln Leu Val Leu Glu 130 135 140 Leu Gly Glu Glu Ala Ile Leu Glu Gly Cys Val Gly Pro Pro Gly Glu 145 150 155 160 Ala Ala Val Gly Leu Leu Gln Phe Asn Leu Ser Glu Leu Phe Ser Trp 165 170 175 Trp Ile Arg Gln Gly Glu Gly Arg Leu Arg Ile Arg Leu Met Pro Glu 180 185 190 Lys Lys Ala Ser Glu Val Gly Arg Glu Gly Arg Leu Ser Ala Ala Ile 195 200 205 Arg Ala Ser Gln Pro Arg Leu Leu Phe Gln Ile Phe Gly Thr Gly His 210 215 220 Ser Ser Leu Glu Ser Pro Thr Asn Met Pro Ser Pro Ser Pro Asp Tyr 225 230 235 240 Phe Thr Trp Asn Leu Thr Trp Ile Met Lys Asp Ser Phe Pro Phe Leu 245 250 255 Ser His Arg Ser Arg Tyr Gly Leu Glu Cys Ser Phe Asp Phe Pro Cys 260 265 270 Glu Leu Glu Tyr Ser Pro Pro Leu His Asp Leu Arg Asn Gln Ser Trp 275 280 285 Ser Trp Arg Arg Ile Pro Ser Glu Glu Ala Ser Gln Met Asp Leu Leu 290 295 300 Asp Gly Pro Gly Ala Glu Arg Ser Lys Glu Met Pro Arg Gly Ser Phe 305 310 315 320 Leu Leu Leu Asn Thr Ser Ala Asp Ser Lys His Thr Ile Leu Ser Pro 325 330 335 Trp Met Arg Ser Ser Ser Glu His Cys Thr Leu Ala Val Ser Val His 340 345 350 Arg His Leu Gln Pro Ser Gly Arg Tyr Ile Ala Gln Leu Leu Pro His 355 360 365 Asn Glu Ala Ala Arg Glu Ile Leu Leu Met Pro Thr Pro Gly Lys His 370 375 380 Gly Trp Thr Val Leu Gln Gly Arg Ile Gly Arg Pro Asp Asn Pro Phe 385 390 395 400 Arg Val Ala Leu Glu Tyr Ile Ser Ser Gly Asn Arg Ser Leu Ser Ala 405 410 415 Val Asp Phe Phe Ala Leu Lys Asn Cys Ser Glu Gly Thr Ser Pro Gly 420 425 430 Ser Lys Met Ala Leu Gln Ser Ser Phe Thr Cys Trp Asn Gly Thr Val 435 440 445 Leu Gln Asn Phe Glu Asp Gly Phe Cys Gly Trp Thr Gln Gly Thr Leu 450 455 460 Ser Pro His Thr Pro Gln Trp Gln Val Arg Thr Leu Lys Asp Ala Arg 465 470 475 480 Phe Gln Asp His Gln Asp His Ala Leu Leu Leu Ser Thr Thr Asp Val 485 490 495 Pro Ala Ser Glu Ser Ala Thr Val Thr Ser Ala Thr Phe Pro Ala Pro 500 505 510 Ile Lys Ser Ser Pro Cys Glu Leu Arg Met Ser Trp Leu Ile Arg Gly 515 520 525 Val Leu Arg Gly Asn Val Ser Leu Val Leu Val Glu Asn Lys Thr Gly 530 535 540 Lys Glu Gln Gly Arg Met Val Trp His Val Ala Ala Tyr Glu Gly Leu 545 550 555 560 Ser Leu Trp Gln Trp Met Val Leu Pro Leu Leu Asp Val Ser Asp Arg 565 570 575 Phe Trp Leu Gln Met Val Ala Trp Trp Gly Gln Gly Ser Arg Ala Ile 580 585 590 Val Ala Phe Asp Asn Ile Ser Ile Ser Leu Asp Cys Tyr Leu Thr Ile 595 600 605 Ser Gly Glu Asp Lys Ile Leu Gln Asn Thr Ala Pro Lys Ser Arg Asn 610 615 620 Leu Phe Glu Arg Asn Pro Asn Lys Glu Leu Lys Pro Gly Glu Asn Ser 625 630 635 640 Pro Arg Gln Thr Pro Ile Phe Asp Pro Thr Val His Trp Leu Phe Thr 645 650 655 Thr Cys Gly Ala Ser Gly Pro His Gly Pro Thr Gln Ala Gln Cys Asn 660 665 670 Asn Ala Tyr Gln Asn Ser Asn Leu Ser Val Glu Val Gly Ser Glu Gly 675 680 685 Pro Leu Lys Gly Ile Gln Ile Trp Lys Val Pro Ala Thr Asp Thr Tyr 690 695 700 Ser Ile Ser Gly Tyr Gly Ala Ala Gly Gly Lys Gly Gly Lys Asn Thr 705 710 715 720 Met Met Arg Ser His Gly Val Ser Val Leu Gly Ile Phe Asn Leu Glu 725 730 735 Lys Asp Asp Met Leu Tyr Ile Leu Val Gly Gln Gln Gly Glu Asp Ala 740 745 750 Cys Pro Ser Thr Asn Gln Leu Ile Gln Lys Val Cys Ile Gly Glu Asn 755 760 765 Asn Val Ile Glu Glu Glu Ile Arg Val Asn Arg Ser Val His Glu Trp 770 775 780 Ala Gly Gly Gly Gly Gly Gly Gly Gly Ala Thr Tyr Val Phe Lys Met 785 790 795 800 Lys Asp Gly Val Pro Val Pro Leu Ile Ile Ala Ala Gly Gly Gly Gly 805 810 815 Arg Ala Tyr Gly Ala Lys Thr Asp Thr Phe His Pro Glu Arg Leu Glu 820 825 830 Asn Asn Ser Ser Val Leu Gly Leu Asn Gly Asn Ser Gly Ala Ala Gly 835 840 845 Gly Gly Gly Gly Trp Asn Asp Asn Thr Ser Leu Leu Trp Ala Gly Lys 850 855 860 Ser Leu Gln Glu Gly Ala Thr Gly Gly His Ser Cys Pro Gln Ala Met 865 870 875 880 Lys Lys Trp Gly Trp Glu Thr Arg Gly Gly Phe Gly Gly Gly Gly Gly 885 890 895 Gly Cys Ser Ser Gly Gly Gly Gly Gly Gly Tyr Ile Gly Gly Asn Ala 900 905 910 Ala Ser Asn Asn Asp Pro Glu Met Asp Gly Glu Asp Gly Val Ser Phe 915 920 925 Ile Ser Pro Leu Gly Ile Leu Tyr Thr Pro Ala Leu Lys Val Met Glu 930 935 940 Gly His Gly Glu Val Asn Ile Lys His Tyr Leu Asn Cys Ser His Cys 945 950 955 960 Glu Val Asp Glu Cys His Met Asp Pro Glu Ser His Lys Val Ile Cys 965 970 975 Phe Cys Asp His Gly Thr Val Leu Ala Glu Asp Gly Val Ser Cys Ile 980 985 990 Val Ser Pro Thr Pro Glu Pro His Leu Pro Leu Ser Leu Ile Leu Ser 995 1000 1005 Val Val Thr Ser Ala Leu Val Ala Ala Leu Val Leu Ala Phe Ser Gly 1010 1015 1020 Ile Met Ile Val Tyr Arg Arg Lys His Gln Glu Leu Gln Ala Met Gln 1025 1030 1035 1040 Met Glu Leu Gln Ser Pro Glu Tyr Lys Leu Ser Lys Leu Arg Thr Ser 1045 1050 1055 Thr Ile Met Thr Asp Tyr Asn Pro Asn Tyr Cys Phe Ala Gly Lys Thr 1060 1065 1070 Ser Ser Ile Ser Asp Leu Lys Glu Val Pro Arg Lys Asn Ile Thr Leu 1075 1080 1085 Ile Arg Gly Leu Gly His Gly Ala Phe Gly Glu Val Tyr Glu Gly Gln 1090 1095 1100 Val Ser Gly Met Pro Asn Asp Pro Ser Pro Leu Gln Val Ala Val Lys 1105 1110 1115 1120 Thr Leu Pro Glu Val Cys Ser Glu Gln Asp Glu Leu Asp Phe Leu Met 1125 1130 1135 Glu Ala Leu Ile Ile Ser Lys Phe Asn His Gln Asn Ile Val Arg Cys 1140 1145 1150 Ile Gly Val Ser Leu Gln Ser Leu Pro Arg Phe Ile Leu Leu Glu Leu 1155 1160 1165 Met Ala Gly Gly Asp Leu Lys Ser Phe Leu Arg Glu Thr Arg Pro Arg 1170 1175 1180 Pro Ser Gln Pro Ser Ser Leu Ala Met Leu Asp Leu Leu His Val Ala 1185 1190 1195 1200 Arg Asp Ile Ala Cys Gly Cys Gln Tyr Leu Glu Glu Asn His Phe Ile 1205 1210 1215 His Arg Asp Ile Ala Ala Arg Asn Cys Leu Leu Thr Cys Pro Gly Pro 1220 1225 1230 Gly Arg Val Ala Lys Ile Gly Asp Phe Gly Met Ala Arg Asp Ile Tyr 1235 1240 1245 Arg Ala Ser Tyr Tyr Arg Lys Gly Gly Cys Ala Met Leu Pro Val Lys 1250 1255 1260 Trp Met Pro Pro Glu Ala Phe Met Glu Gly Ile Phe Thr Ser Lys Thr 1265 1270 1275 1280 Asp Thr Trp Ser Phe Gly Val Leu Leu Trp Glu Ile Phe Ser Leu Gly 1285 1290 1295 Tyr Met Pro Tyr Pro Ser Lys Ser Asn Gln Glu Val Leu Glu Phe Val 1300 1305 1310 Thr Ser Gly Gly Arg Met Asp Pro Pro Lys Asn Cys Pro Gly Pro Val 1315 1320 1325 Tyr Arg Ile Met Thr Gln Cys Trp Gln His Gln Pro Glu Asp Arg Pro 1330 1335 1340 Asn Phe Ala Ile Ile Leu Glu Arg Ile Glu Tyr Cys Thr Gln Asp Pro 1345 1350 1355 1360 Asp Val Ile Asn Thr Ala Leu Pro Ile Glu Tyr Gly Pro Leu Val Glu 1365 1370 1375 Glu Glu Glu Lys Val Pro Val Arg Pro Lys Asp Pro Glu Gly Val Pro 1380 1385 1390 Pro Leu Leu Val Ser Gln Gln Ala Lys Arg Glu Glu Glu Arg Ser Pro 1395 1400 1405 Ala Ala Pro Pro Pro Leu Pro Thr Thr Ser Ser Gly Lys Ala Ala Lys 1410 1415 1420 Lys Pro Thr Ala Ala Glu Val Ser Val Arg Val Pro Arg Gly Pro Ala 1425 1430 1435 1440 Val Glu Gly Gly His Val Asn Met Ala Phe Ser Gln Ser Asn Pro Pro 1445 1450 1455 Ser Glu Leu His Lys Val His Gly Ser Arg Asn Lys Pro Thr Ser Leu 1460 1465 1470 Trp Asn Pro Thr Tyr Gly Ser Trp Phe Thr Glu Lys Pro Thr Lys Lys 1475 1480 1485 Asn Asn Pro Ile Ala Lys Lys Glu Pro His Asp Arg Gly Asn Leu Gly 1490 1495 1500 Leu Glu Gly Ser Cys Thr Val Pro Pro Asn Val Ala Thr Gly Arg Leu 1505 1510 1515 1520 Pro Gly Ala Ser Leu Leu Leu Glu Pro Ser Ser Leu Thr Ala Asn Met 1525 1530 1535 Lys Glu Val Pro Leu Phe Arg Leu Arg His Phe Pro Cys Gly Asn Val 1540 1545 1550 Asn Tyr Gly Tyr Gln Gln Gln Gly Leu Pro Leu Glu Ala Ala Thr Ala 1555 1560 1565 Pro Gly Ala Gly His Tyr Glu Asp Thr Ile Leu Lys Ser Lys Asn Ser 1570 1575 1580 Met Asn Gln Pro Gly Pro 1585 1590 <210> 6 <211> 5293 <212> DNA <213> human ALK Kinase <400> 6 agagacttgc gcgcacgcac agtcctctgg agatcaggtg gaaggagccg ctgggtacca 60 aggactgttc agagcctctt cccatctcgg ggagagcgaa gggtgaggct gggcccggag 120 agcagtgtaa acggcctcct ccggcgggat gggagccatc gggctcctgt ggctgctgcc 180 gctgctgctt tccacggcag ctgtgggctc cgggatgggg accggccagc gcgcgggctc 240 cccagctgcg gggccgccgc tgcagccccg ggagccactc agctactcgc gcctgcagag 300 gaagagtctg gcagttgact tcgtggtgcc ctcgctcttc cgtgtctacg cccgggacct 360 actgctgcca ccatcctcct cggagctgaa ggctggcagg cccgaggccc gcggctcgct 420 agctctggac tgcgccccgc tgctcaggtt gctggggccg gcgccggggg tctcctggac 480 cgccggttca ccagccccgg cagaggcccg gacgctgtcc agggtgctga agggcggctc 540 cgtgcgcaag ctccggcgtg ccaagcagtt ggtgctggag ctgggcgagg aggcgatctt 600 ggagggttgc gtcgggcccc ccggggaggc ggctgtgggg ctgctccagt tcaatctcag 660 cgagctgttc agttggtgga ttcgccaagg cgaagggcga ctgaggatcc gcctgatgcc 720 cgagaagaag gcgtcggaag tgggcagaga gggaaggctg tccgcggcaa ttcgcgcctc 780 ccagccccgc cttctcttcc agatcttcgg gactggtcat agctccttgg aatcaccaac 840 aaacatgcct tctccttctc ctgattattt tacatggaat ctcacctgga taatgaaaga 900 ctccttccct ttcctgtctc atcgcagccg atatggtctg gagtgcagct ttgacttccc 960 ctgtgagctg gagtattccc ctccactgca tgacctcagg aaccagagct ggtcctggcg 1020 ccgcatcccc tccgaggagg cctcccagat ggacttgctg gatgggcctg gggcagagcg 1080 ttctaaggag atgcccagag gctcctttct ccttctcaac acctcagctg actccaagca 1140 caccatcctg agtccgtgga tgaggagcag cagtgagcac tgcacactgg ccgtctcggt 1200 gcacaggcac ctgcagccct ctggaaggta cattgcccag ctgctgcccc acaacgaggc 1260 tgcaagagag atcctcctga tgcccactcc agggaagcat ggttggacag tgctccaggg 1320 aagaatcggg cgtccagaca acccatttcg agtggccctg gaatacatct ccagtggaaa 1380 ccgcagcttg tctgcagtgg acttctttgc cctgaagaac tgcagtgaag gaacatcccc 1440 aggctccaag atggccctgc agagctcctt cacttgttgg aatgggacag tcctccagct 1500 tgggcaggcc tgtgacttcc accaggactg tgcccaggga gaagatgaga gccagatgtg 1560 ccggaaactg cctgtgggtt tttactgcaa ctttgaagat ggcttctgtg gctggaccca 1620 aggcacactg tcaccccaca ctcctcagtg gcaggtcagg accctaaagg atgcccggtt 1680 ccaggaccac caagaccatg ctctattgct cagtaccact gatgtccccg cttctgaaag 1740 tgctacagtg accagtgcta cgtttcctgc accgatcaag agctctccat gtgagctccg 1800 aatgtcctgg ctcattcgtg gagtcttgag gggaaacgtg tccttggtgc tagtggagaa 1860 caaaaccggg aaggagcaag gcaggatggt ctggcatgtc gccgcctatg aaggcttgag 1920 cctgtggcag tggatggtgt tgcctctcct cgatgtgtct gacaggttct ggctgcagat 1980 ggtcgcatgg tggggacaag gatccagagc catcgtggct tttgacaata tctccatcag 2040 cctggactgc tacctcacca ttagcggaga ggacaagatc ctgcagaata cagcacccaa 2100 atcaagaaac ctgtttgaga gaaacccaaa caaggagctg aaacccgggg aaaattcacc 2160 aagacagacc cccatctttg accctacagt tcattggctg ttcaccacat gtggggccag 2220 cgggccccat ggccccaccc aggcacagtg caacaacgcc taccagaact ccaacctgag 2280 cgtggaggtg gggagcgagg gccccctgaa aggcatccag atctggaagg tgccagccac 2340 cgacacctac agcatctcgg gctacggagc tgctggcggg aaaggcggga agaacaccat 2400 gatgcggtcc cacggcgtgt ctgtgctggg catcttcaac ctggagaagg atgacatgct 2460 gtacatcctg gttgggcagc agggagagga cgcctgcccc agtacaaacc agttaatcca 2520 gaaagtctgc attggagaga acaatgtgat agaagaagaa atccgtgtga acagaagcgt 2580 gcatgagtgg gcaggaggcg gaggaggagg gggtggagcc acctacgtat ttaagatgaa 2640 ggatggagtg ccggtgcccc tgatcattgc agccggaggt ggtggcaggg cctacggggc 2700 caagacagac acgttccacc cagagagact ggagaataac tcctcggttc tagggctaaa 2760 cggcaattcc ggagccgcag gtggtggagg tggctggaat gataacactt ccttgctctg 2820 ggccggaaaa tctttgcagg agggtgccac cggaggacat tcctgccccc aggccatgaa 2880 gaagtggggg tgggagacaa gagggggttt cggagggggt ggaggggggt gctcctcagg 2940 tggaggaggc ggaggatata taggcggcaa tgcagcctca aacaatgacc ccgaaatgga 3000 tggggaagat ggggtttcct tcatcagtcc actgggcatc ctgtacaccc cagctttaaa 3060 agtgatggaa ggccacgggg aagtgaatat taagcattat ctaaactgca gtcactgtga 3120 ggtagacgaa tgtcacatgg accctgaaag ccacaaggtc atctgcttct gtgaccacgg 3180 gacggtgctg gctgaggatg gcgtctcctg cattgtgtca cccaccccgg agccacacct 3240 gccactctcg ctgatcctct ctgtggtgac ctctgccctc gtggccgccc tggtcctggc 3300 tttctccggc atcatgattg tgtaccgccg gaagcaccag gagctgcaag ccatgcagat 3360 ggagctgcag agccctgagt acaagctgag caagctccgc acctcgacca tcatgaccga 3420 ctacaacccc aactactgct ttgctggcaa gacctcctcc atcagtgacc tgaaggaggt 3480 gccgcggaaa aacatcaccc tcattcgggg tctgggccat ggcgcctttg gggaggtgta 3540 tgaaggccag gtgtccggaa tgcccaacga cccaagcccc ctgcaagtgg ctgtgaagac 3600 gctgcctgaa gtgtgctctg aacaggacga actggatttc ctcatggaag ccctgatcat 3660 cagcaaattc aaccaccaga acattgttcg ctgcattggg gtgagcctgc aatccctgcc 3720 ccggttcatc ctgctggagc tcatggcggg gggagacctc aagtccttcc tccgagagac 3780 ccgccctcgc ccgagccagc cctcctccct ggccatgctg gaccttctgc acgtggctcg 3840 ggacattgcc tgtggctgtc agtatttgga ggaaaaccac ttcatccacc gagacattgc 3900 tgccagaaac tgcctcttga cctgtccagg ccctggaaga gtggccaaga ttggagactt 3960 cgggatggcc cgagacatct acagggcgag ctactataga aagggaggct gtgccatgct 4020 gccagttaag tggatgcccc cagaggcctt catggaagga atattcactt ctaaaacaga 4080 cacatggtcc tttggagtgc tgctatggga aatcttttct cttggatata tgccataccc 4140 cagcaaaagc aaccaggaag ttctggagtt tgtcaccagt ggaggccgga tggacccacc 4200 caagaactgc cctgggcctg tataccggat aatgactcag tgctggcaac atcagcctga 4260 agacaggccc aactttgcca tcattttgga gaggattgaa tactgcaccc aggacccgga 4320 tgtaatcaac accgctttgc cgatagaata tggtccactt gtggaagagg aagagaaagt 4380 gcctgtgagg cccaaggacc ctgagggggt tcctcctctc ctggtctctc aacaggcaaa 4440 acgggaggag gagcgcagcc cagctgcccc accacctctg cctaccacct cctctggcaa 4500 ggctgcaaag aaacccacag ctgcagaggt ctctgttcga gtccctagag ggccggccgt 4560 ggaaggggga cacgtgaata tggcattctc tcagtccaac cctccttcgg agttgcacag 4620 ggtccacgga tccagaaata agcccaccag cttgtggaac ccaacgtacg gctcctggtt 4680 tacagagaaa cccaccaaaa agaataatcc tatagcaaag aaggagccac acgagagggg 4740 taacctgggg ctggagggaa gctgtactgt cccacctaac gttgcaactg ggagacttcc 4800 gggggcctca ctgctcctag agccctcttc gctgactgcc aatatgaagg aggtacctct 4860 gttcaggcta cgtcacttcc cttgtgggaa tgtcaattac ggctaccagc aacagggctt 4920 gcccttagaa gccgctactg cccctggagc tggtcattac gaggatacca ttctgaaaag 4980 caagaatagc atgaaccagc ctgggccctg agctcggtcg cacactcact tctcttcctt 5040 gggatcccta agaccgtgga ggagagagag gcaatcaatg gctcctttca caaaccagag 5100 accaaatgtc acgttttgtt ttgtgccaac ctattttgaa gtaccaccaa aaaagctgta 5160 ttttgaaaat gctttagaaa ggttttgagc atgggttcat cctattcttt cgaaagaaga 5220 aaatatcata aaaatgagtg ataaatacaa ggccagatgt ggttgcataa ggtttttatg 5280 catgtttgtt gta 5293 <210> 7 <211> 87 <212> DNA <213> Artificial Sequence <220> <223> EML4exon6/Intron6/ALK exon20 fusion juntion region <400> 7 gcagacaagc ataaagatgt catcatcaac caagcaaaaa tgtcaactcg cgaaaaaaac 60 agccaagtgt accgccggaa gcaccag 87 <210> 8 <211> 29 <212> PRT <213> Artificial Sequence <220> <223> EML4exon6/Intron6/ALK exon20 fusion juntion region <400> 8 Ala Asp Lys His Lys Asp Val Ile Ile Asn Gln Ala Lys Met Ser Thr 1 5 10 15 Arg Glu Lys Asn Ser Gln Val Tyr Arg Arg Lys His Gln 20 25 <210> 9 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> ALK-GSP1 <400> 9 gcagtagttg gggttgtagt c 21 <210> 10 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> ALK-GSP2 <400> 10 gcggagcttg ctcagcttgt 20 <210> 11 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> ALK-GSP3 <400> 11 tgcagctcct ggtgcttcc 19 <210> 12 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> ALK-GSP3 <400> 12 tgcagctcct ggtgcttcc 19 <210> 13 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> EML4-Atg <400> 13 cgcaagatgg acggtttggc 20 <210> 14 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> EML4-43 <400> 14 tgttcaagat cgcctgtcag ctct 24 <210> 15 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> EML4-94 <400> 15 tgaaatcact gtgctaaagg cggc 24 <210> 16 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> EML4-202 <400> 16 aagccctcga gcagttattc ccat 24 <210> 17 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> ALK-Tga <400> 17 gaattccgcc gagctcaggg cccag 25 <210> 18 <211> 1059 <212> PRT <213> Artificial Sequence <220> <223> EML4-ALK Fusion protein(long variant) <400> 18 Met Asp Gly Phe Ala Gly Ser Leu Asp Asp Ser Ile Ser Ala Ala Ser 1 5 10 15 Thr Ser Asp Val Gln Asp Arg Leu Ser Ala Leu Glu Ser Arg Val Gln 20 25 30 Gln Gln Glu Asp Glu Ile Thr Val Leu Lys Ala Ala Leu Ala Asp Val 35 40 45 Leu Arg Arg Leu Ala Ile Ser Glu Asp His Val Ala Ser Val Lys Lys 50 55 60 Ser Val Ser Ser Lys Gly Gln Pro Ser Pro Arg Ala Val Ile Pro Met 65 70 75 80 Ser Cys Ile Thr Asn Gly Ser Gly Ala Asn Arg Lys Pro Ser His Thr 85 90 95 Ser Ala Val Ser Ile Ala Gly Lys Glu Thr Leu Ser Ser Ala Ala Lys 100 105 110 Ser Gly Thr Glu Lys Lys Lys Glu Lys Pro Gln Gly Gln Arg Glu Lys 115 120 125 Lys Glu Glu Ser His Ser Asn Asp Gln Ser Pro Gln Ile Arg Ala Ser 130 135 140 Pro Ser Pro Gln Pro Ser Ser Gln Pro Leu Gln Ile His Arg Gln Thr 145 150 155 160 Pro Glu Ser Lys Asn Ala Thr Pro Thr Lys Ser Ile Lys Arg Pro Ser 165 170 175 Pro Ala Glu Lys Ser His Asn Ser Trp Glu Asn Ser Asp Asp Ser Arg 180 185 190 Asn Lys Leu Ser Lys Ile Pro Ser Thr Pro Lys Leu Ile Pro Lys Val 195 200 205 Thr Lys Thr Ala Asp Lys His Lys Asp Val Ile Ile Asn Gln Glu Gly 210 215 220 Glu Tyr Ile Lys Met Phe Met Arg Gly Arg Pro Ile Thr Met Phe Ile 225 230 235 240 Pro Ser Asp Val Asp Asn Tyr Asp Asp Ile Arg Thr Glu Leu Pro Pro 245 250 255 Glu Lys Leu Lys Leu Glu Trp Ala Tyr Gly Tyr Arg Gly Lys Asp Cys 260 265 270 Arg Ala Asn Val Tyr Leu Leu Pro Thr Gly Glu Ile Val Tyr Phe Ile 275 280 285 Ala Ser Val Val Val Leu Phe Asn Tyr Glu Glu Arg Thr Gln Arg His 290 295 300 Tyr Leu Gly His Thr Asp Cys Val Lys Cys Leu Ala Ile His Pro Asp 305 310 315 320 Lys Ile Arg Ile Ala Thr Gly Gln Ile Ala Gly Val Asp Lys Asp Gly 325 330 335 Arg Pro Leu Gln Pro His Val Arg Val Trp Asp Ser Val Thr Leu Ser 340 345 350 Thr Leu Gln Ile Ile Gly Leu Gly Thr Phe Glu Arg Gly Val Gly Cys 355 360 365 Leu Asp Phe Ser Lys Ala Asp Ser Gly Val His Leu Cys Ile Ile Asp 370 375 380 Asp Ser Asn Glu His Met Leu Thr Val Trp Asp Trp Gln Lys Lys Ala 385 390 395 400 Lys Gly Ala Glu Ile Lys Thr Thr Asn Glu Val Val Leu Ala Val Glu 405 410 415 Phe His Pro Thr Asp Ala Asn Thr Ile Ile Thr Cys Gly Lys Ser His 420 425 430 Ile Phe Phe Trp Thr Trp Ser Gly Asn Ser Leu Thr Arg Lys Gln Gly 435 440 445 Ile Phe Gly Lys Tyr Glu Lys Pro Lys Phe Val Gln Cys Leu Ala Phe 450 455 460 Leu Gly Asn Gly Asp Val Leu Thr Gly Asp Ser Gly Gly Val Met Leu 465 470 475 480 Ile Trp Ser Lys Thr Thr Val Glu Pro Thr Pro Gly Lys Gly Pro Lys 485 490 495 Val Tyr Arg Arg Lys His Gln Glu Leu Gln Ala Met Gln Met Glu Leu 500 505 510 Gln Ser Pro Glu Tyr Lys Leu Ser Lys Leu Arg Thr Ser Thr Ile Met 515 520 525 Thr Asp Tyr Asn Pro Asn Tyr Cys Phe Ala Gly Lys Thr Ser Ser Ile 530 535 540 Ser Asp Leu Lys Glu Val Pro Arg Lys Asn Ile Thr Leu Ile Arg Gly 545 550 555 560 Leu Gly His Gly Ala Phe Gly Glu Val Tyr Glu Gly Gln Val Ser Gly 565 570 575 Met Pro Asn Asp Pro Ser Pro Leu Gln Val Ala Val Lys Thr Leu Pro 580 585 590 Glu Val Cys Ser Glu Gln Asp Glu Leu Asp Phe Leu Met Glu Ala Leu 595 600 605 Ile Ile Ser Lys Phe Asn His Gln Asn Ile Val Arg Cys Ile Gly Val 610 615 620 Ser Leu Gln Ser Leu Pro Arg Phe Ile Leu Leu Glu Leu Met Ala Gly 625 630 635 640 Gly Asp Leu Lys Ser Phe Leu Arg Glu Thr Arg Pro Arg Pro Ser Gln 645 650 655 Pro Ser Ser Leu Ala Met Leu Asp Leu Leu His Val Ala Arg Asp Ile 660 665 670 Ala Cys Gly Cys Gln Tyr Leu Glu Glu Asn His Phe Ile His Arg Asp 675 680 685 Ile Ala Ala Arg Asn Cys Leu Leu Thr Cys Pro Gly Pro Gly Arg Val 690 695 700 Ala Lys Ile Gly Asp Phe Gly Met Ala Arg Asp Ile Tyr Arg Ala Ser 705 710 715 720 Tyr Tyr Arg Lys Gly Gly Cys Ala Met Leu Pro Val Lys Trp Met Pro 725 730 735 Pro Glu Ala Phe Met Glu Gly Ile Phe Thr Ser Lys Thr Asp Thr Trp 740 745 750 Ser Phe Gly Val Leu Leu Trp Glu Ile Phe Ser Leu Gly Tyr Met Pro 755 760 765 Tyr Pro Ser Lys Ser Asn Gln Glu Val Leu Glu Phe Val Thr Ser Gly 770 775 780 Gly Arg Met Asp Pro Pro Lys Asn Cys Pro Gly Pro Val Tyr Arg Ile 785 790 795 800 Met Thr Gln Cys Trp Gln His Gln Pro Glu Asp Arg Pro Asn Phe Ala 805 810 815 Ile Ile Leu Glu Arg Ile Glu Tyr Cys Thr Gln Asp Pro Asp Val Ile 820 825 830 Asn Thr Ala Leu Pro Ile Glu Tyr Gly Pro Leu Val Glu Glu Glu Glu 835 840 845 Lys Val Pro Val Arg Pro Lys Asp Pro Glu Gly Val Pro Pro Leu Leu 850 855 860 Val Ser Gln Gln Ala Lys Arg Glu Glu Glu Arg Ser Pro Ala Ala Pro 865 870 875 880 Pro Pro Leu Pro Thr Thr Ser Ser Gly Lys Ala Ala Lys Lys Pro Thr 885 890 895 Ala Ala Glu Ile Ser Val Arg Val Pro Arg Gly Pro Ala Val Glu Gly 900 905 910 Gly His Val Asn Met Ala Phe Ser Gln Ser Asn Pro Pro Ser Glu Leu 915 920 925 His Lys Val His Gly Ser Arg Asn Lys Pro Thr Ser Leu Trp Asn Pro 930 935 940 Thr Tyr Gly Ser Trp Phe Thr Glu Lys Pro Thr Lys Lys Asn Asn Pro 945 950 955 960 Ile Ala Lys Lys Glu Pro His Asp Arg Gly Asn Leu Gly Leu Glu Gly 965 970 975 Ser Cys Thr Val Pro Pro Asn Val Ala Thr Gly Arg Leu Pro Gly Ala 980 985 990 Ser Leu Leu Leu Glu Pro Ser Ser Leu Thr Ala Asn Met Lys Glu Val 995 1000 1005 Pro Leu Phe Arg Leu Arg His Phe Pro Cys Gly Asn Val Asn Tyr Gly 1010 1015 1020 Tyr Gln Gln Gln Gly Leu Pro Leu Glu Ala Ala Thr Ala Pro Gly Ala 1025 1030 1035 1040 Gly His Tyr Glu Asp Thr Ile Leu Lys Ser Lys Asn Ser Met Asn Gln 1045 1050 1055 Pro Gly Pro <210> 19 <211> 3180 <212> DNA <213> Artificial Sequence <220> <223> EML-ALK <400> 19 atggacggtt tcgccggcag tctcgatgat agtatttctg ctgcaagtac ttctgatgtt 60 caagatcgcc tgtcagctct tgagtcacga gttcagcaac aagaagatga aatcactgtg 120 ctaaaggcgg ctttggctga tgttttgagg cgtcttgcaa tctctgaaga tcatgtggcc 180 tcagtgaaaa aatcagtctc aagtaaaggc caaccaagcc ctcgagcagt tattcccatg 240 tcctgtataa ccaatggaag tggtgcaaac agaaaaccaa gtcataccag tgctgtctca 300 attgcaggaa aagaaactct ttcatctgct gctaaaagtg gtacagaaaa aaagaaagaa 360 aaaccacaag gacagagaga aaaaaaagag gaatctcatt ctaatgatca aagtccacaa 420 attcgagcat caccttctcc ccagccctct tcacaacctc tccaaataca cagacaaact 480 ccagaaagca agaatgctac tcccaccaaa agcataaaac gaccatcacc agctgaaaag 540 tcacataatt cttgggaaaa ttcagatgat agccgtaata aattgtcgaa aataccttca 600 acacccaaat taataccaaa agttaccaaa actgcagaca agcataaaga tgtcatcatc 660 aaccaagaag gagaatatat taaaatgttt atgcgcggtc ggccaattac catgttcatt 720 ccttccgatg ttgacaacta tgatgacatc agaacggaac tgcctcctga gaagctcaaa 780 ctggagtggg catatggtta tcgaggaaag gactgtagag ctaatgttta ccttcttccg 840 accggggaaa tagtttattt cattgcatca gtagtagtac tatttaatta tgaggagaga 900 actcagcgac actacctggg ccatacagac tgtgtgaaat gccttgctat acatcctgac 960 aaaattagga ttgcaactgg acagatagct ggcgtggata aagatggaag gcctctacaa 1020 ccccacgtca gagtgtggga ttctgttact ctatccacac tgcagattat tggacttggc 1080 acttttgagc gtggagtagg atgcctggat ttttcaaaag cagattcagg tgttcattta 1140 tgtattattg atgactccaa tgagcatatg cttactgtat gggactggca gaagaaagca 1200 aaaggagcag aaataaagac aacaaatgaa gttgttttgg ctgtggagtt tcacccaaca 1260 gatgcaaata ccataattac atgcggtaaa tctcatattt tcttctggac ctggagcggc 1320 aattcactaa caagaaaaca gggaattttt gggaaatatg aaaagccaaa atttgtgcag 1380 tgtttagcat tcttggggaa tggagatgtt cttactggag actcaggtgg agtcatgctt 1440 atatggagca aaactactgt agagcccaca cctgggaaag gacctaaagt gtaccgccgg 1500 aagcaccagg agctgcaagc catgcagatg gagctgcaga gccctgagta caagctgagc 1560 aagctccgca cctcgaccat catgaccgac tacaacccca actactgctt tgctggcaag 1620 acctcctcca tcagtgacct gaaggaggtg ccgcggaaaa acatcaccct cattcggggt 1680 ctgggccatg gcgcctttgg ggaggtgtat gaaggccagg tgtccggaat gcccaacgac 1740 ccaagccccc tgcaagtggc tgtgaagacg ctgcctgaag tgtgctctga acaggacgaa 1800 ctggatttcc tcatggaagc cctgatcatc agcaaattca accaccagaa cattgttcgc 1860 tgcattgggg tgagcctgca atccctgccc cggttcatcc tgctggagct catggcgggg 1920 ggagacctca agtccttcct ccgagagacc cgccctcgcc cgagccagcc ctcctccctg 1980 gccatgctgg accttctgca cgtggctcgg gacattgcct gtggctgtca gtatttggag 2040 gaaaaccact tcatccaccg agacattgct gccagaaact gcctcttgac ctgtccaggc 2100 cctggaagag tggccaagat tggagacttc gggatggccc gagacatcta cagggcgagc 2160 tactatagaa agggaggctg tgccatgctg ccagttaagt ggatgccccc agaggccttc 2220 atggaaggaa tattcacttc taaaacagac acatggtcct ttggagtgct gctatgggaa 2280 atcttttctc ttggatatat gccatacccc agcaaaagca accaggaagt tctggagttt 2340 gtcaccagtg gaggccggat ggacccaccc aagaactgcc ctgggcctgt ataccggata 2400 atgactcagt gctggcaaca tcagcctgaa gacaggccca actttgccat cattttggag 2460 aggattgaat actgcaccca ggacccggat gtaatcaaca ccgctttgcc gatagaatat 2520 ggtccacttg tggaagagga agagaaagtg cctgtgaggc ccaaggaccc tgagggggtt 2580 cctcctctcc tggtctctca acaggcaaaa cgggaggagg agcgcagccc agctgcccca 2640 ccacctctgc ctaccacctc ctctggcaag gctgcaaaga aacccacagc tgcagagatc 2700 tctgttcgag tccctagagg gccggccgtg gaagggggac acgtgaatat ggcattctct 2760 cagtccaacc ctccttcgga gttgcacaag gtccacggat ccagaaacaa gcccaccagc 2820 ttgtggaacc caacgtacgg ctcctggttt acagagaaac ccaccaaaaa gaataatcct 2880 atagcaaaga aggagccaca cgacaggggt aacctggggc tggagggaag ctgtactgtc 2940 ccacctaacg ttgcaactgg gagacttccg ggggcctcac tgctcctaga gccctcttcg 3000 ctgactgcca atatgaagga ggtacctctg ttcaggctac gtcacttccc ttgtgggaat 3060 gtcaattacg gctaccagca acagggcttg cccttagaag ccgctactgc ccctggagct 3120 ggtcattacg aggataccat tctgaaaagc aagaatagca tgaaccagcc tgggccctga 3180 3180 <210> 20 <211> 701 <212> PRT <213> Artificial Sequence <220> <223> TFG-ALK Fusion protein <400> 20 Met Asn Gly Gln Leu Asp Leu Ser Gly Lys Leu Ile Ile Lys Ala Gln 1 5 10 15 Leu Gly Glu Asp Ile Arg Arg Ile Pro Ile His Asn Glu Asp Ile Thr 20 25 30 Tyr Asp Glu Leu Val Leu Met Met Gln Arg Val Phe Arg Gly Lys Leu 35 40 45 Leu Ser Asn Asp Glu Val Thr Ile Lys Tyr Lys Asp Glu Asp Gly Asp 50 55 60 Leu Ile Thr Ile Phe Asp Ser Ser Asp Leu Ser Phe Ala Ile Gln Cys 65 70 75 80 Ser Arg Ile Leu Lys Leu Thr Leu Phe Val Asn Gly Gln Pro Arg Pro 85 90 95 Leu Glu Ser Ser Gln Val Lys Tyr Leu Arg Arg Glu Leu Ile Glu Leu 100 105 110 Arg Asn Lys Val Asn Arg Leu Leu Asp Ser Leu Glu Pro Pro Gly Glu 115 120 125 Pro Gly Pro Ser Thr Asn Ile Pro Glu Asn Val Tyr Arg Arg Lys His 130 135 140 Gln Glu Leu Gln Ala Met Gln Met Glu Leu Gln Ser Pro Glu Tyr Lys 145 150 155 160 Leu Ser Lys Leu Arg Thr Ser Thr Ile Met Thr Asp Tyr Asn Pro Asn 165 170 175 Tyr Cys Phe Ala Gly Lys Thr Ser Ser Ile Ser Asp Leu Lys Glu Val 180 185 190 Pro Arg Lys Asn Ile Thr Leu Ile Arg Gly Leu Gly His Gly Ala Phe 195 200 205 Gly Glu Val Tyr Glu Gly Gln Val Ser Gly Met Pro Asn Asp Pro Ser 210 215 220 Pro Leu Gln Val Ala Val Lys Thr Leu Pro Glu Val Cys Ser Glu Gln 225 230 235 240 Asp Glu Leu Asp Phe Leu Met Glu Ala Leu Ile Ile Ser Lys Phe Asn 245 250 255 His Gln Asn Ile Val Arg Cys Ile Gly Val Ser Leu Gln Ser Leu Pro 260 265 270 Arg Phe Ile Leu Leu Glu Leu Met Ala Gly Gly Asp Leu Lys Ser Phe 275 280 285 Leu Arg Glu Thr Arg Pro Arg Pro Ser Gln Pro Ser Ser Leu Ala Met 290 295 300 Leu Asp Leu Leu His Val Ala Arg Asp Ile Ala Cys Gly Cys Gln Tyr 305 310 315 320 Leu Glu Glu Asn His Phe Ile His Arg Asp Ile Ala Ala Arg Asn Cys 325 330 335 Leu Leu Thr Cys Pro Gly Pro Gly Arg Val Ala Lys Ile Gly Asp Phe 340 345 350 Gly Met Ala Arg Asp Ile Tyr Arg Ala Ser Tyr Tyr Arg Lys Gly Gly 355 360 365 Cys Ala Met Leu Pro Val Lys Trp Met Pro Pro Glu Ala Phe Met Glu 370 375 380 Gly Ile Phe Thr Ser Lys Thr Asp Thr Trp Ser Phe Gly Val Leu Leu 385 390 395 400 Trp Glu Ile Phe Ser Leu Gly Tyr Met Pro Tyr Pro Ser Lys Ser Asn 405 410 415 Gln Glu Val Leu Glu Phe Val Thr Ser Gly Gly Arg Met Asp Pro Pro 420 425 430 Lys Asn Cys Pro Gly Pro Val Tyr Arg Ile Met Thr Gln Cys Trp Gln 435 440 445 His Gln Pro Glu Asp Arg Pro Asn Phe Ala Ile Ile Leu Glu Arg Ile 450 455 460 Glu Tyr Cys Thr Gln Asp Pro Asp Val Ile Asn Thr Ala Leu Pro Ile 465 470 475 480 Glu Tyr Gly Pro Leu Val Glu Glu Glu Glu Lys Val Pro Val Arg Pro 485 490 495 Lys Asp Pro Glu Gly Val Pro Pro Leu Leu Val Ser Gln Gln Ala Lys 500 505 510 Arg Glu Glu Glu Arg Ser Pro Ala Ala Pro Pro Pro Leu Pro Thr Thr 515 520 525 Ser Ser Gly Lys Ala Ala Lys Lys Pro Thr Ala Ala Glu Ile Ser Val 530 535 540 Arg Val Pro Arg Gly Pro Ala Val Glu Gly Gly His Val Asn Met Ala 545 550 555 560 Phe Ser Gln Ser Asn Pro Pro Ser Glu Leu His Lys Val His Gly Ser 565 570 575 Arg Asn Lys Pro Thr Ser Leu Trp Asn Pro Thr Tyr Gly Ser Trp Phe 580 585 590 Thr Glu Lys Pro Thr Lys Lys Asn Asn Pro Ile Ala Lys Lys Glu Pro 595 600 605 His Asp Arg Gly Asn Leu Gly Leu Glu Gly Ser Cys Thr Val Pro Pro 610 615 620 Asn Val Ala Thr Gly Arg Leu Pro Gly Ala Ser Leu Leu Leu Glu Pro 625 630 635 640 Ser Ser Leu Thr Ala Asn Met Lys Glu Val Pro Leu Phe Arg Leu Arg 645 650 655 His Phe Pro Cys Gly Asn Val Asn Tyr Gly Tyr Gln Gln Gln Gly Leu 660 665 670 Pro Leu Glu Ala Ala Thr Ala Pro Gly Ala Gly His Tyr Glu Asp Thr 675 680 685 Ile Leu Lys Ser Lys Asn Ser Met Asn Gln Pro Gly Pro 690 695 700 <210> 21 <211> 2106 <212> DNA <213> Artificial Sequence <220> <223> TFG-ALK <400> 21 atgaacggac agttggatct aagtgggaag ctaatcatca aagctcaact tggggaggat 60 attcggcgaa ttcctattca taatgaagat attacttatg atgaattagt gctaatgatg 120 caacgagttt tcagaggaaa acttctgagt aatgatgaag taacaataaa gtataaagat 180 gaagatggag atcttataac aatttttgat agttctgacc tttcctttgc aattcagtgc 240 agtaggatac tgaaactgac attatttgtt aatggccagc caagacccct tgaatcaagt 300 caggtgaaat atctccgtcg agaactgata gaacttcgaa ataaagtgaa tcgtttattg 360 gatagcttgg aaccacctgg agaaccagga ccttccacca atattcctga aaatgtgtac 420 cgccggaagc accaggagct gcaagccatg cagatggagc tgcagagccc tgagtacaag 480 ctgagcaagc tccgcacctc gaccatcatg accgactaca accccaacta ctgctttgct 540 ggcaagacct cctccatcag tgacctgaag gaggtgccgc ggaaaaacat caccctcatt 600 cggggtctgg gccatggcgc ctttggggag gtgtatgaag gccaggtgtc cggaatgccc 660 aacgacccaa gccccctgca agtggctgtg aagacgctgc ctgaagtgtg ctctgaacag 720 gacgaactgg atttcctcat ggaagccctg atcatcagca aattcaacca ccagaacatt 780 gttcgctgca ttggggtgag cctgcaatcc ctgccccggt tcatcctgct ggagctcatg 840 gcggggggag acctcaagtc cttcctccga gagacccgcc ctcgcccgag ccagccctcc 900 tccctggcca tgctggacct tctgcacgtg gctcgggaca ttgcctgtgg ctgtcagtat 960 ttggaggaaa accacttcat ccaccgagac attgctgcca gaaactgcct cttgacctgt 1020 ccaggccctg gaagagtggc caagattgga gacttcggga tggcccgaga catctacagg 1080 gcgagctact atagaaaggg aggctgtgcc atgctgccag ttaagtggat gcccccagag 1140 gccttcatgg aaggaatatt cacttctaaa acagacacat ggtcctttgg agtgctgcta 1200 tgggaaatct tttctcttgg atatatgcca taccccagca aaagcaacca ggaagttctg 1260 gagtttgtca ccagtggagg ccggatggac ccacccaaga actgccctgg gcctgtatac 1320 cggataatga ctcagtgctg gcaacatcag cctgaagaca ggcccaactt tgccatcatt 1380 ttggagagga ttgaatactg cacccaggac ccggatgtaa tcaacaccgc tttgccgata 1440 gaatatggtc cacttgtgga agaggaagag aaagtgcctg tgaggcccaa ggaccctgag 1500 ggggttcctc ctctcctggt ctctcaacag gcaaaacggg aggaggagcg cagcccagct 1560 gccccaccac ctctgcctac cacctcctct ggcaaggctg caaagaaacc cacagctgca 1620 gagatctctg ttcgagtccc tagagggccg gccgtggaag ggggacacgt gaatatggca 1680 ttctctcagt ccaaccctcc ttcggagttg cacaaggtcc acggatccag aaacaagccc 1740 accagcttgt ggaacccaac gtacggctcc tggtttacag agaaacccac caaaaagaat 1800 aatcctatag caaagaagga gccacacgac aggggtaacc tggggctgga gggaagctgt 1860 actgtcccac ctaacgttgc aactgggaga cttccggggg cctcactgct cctagagccc 1920 tcttcgctga ctgccaatat gaaggaggta cctctgttca ggctacgtca cttcccttgt 1980 gggaatgtca attacggcta ccagcaacag ggcttgccct tagaagccgc tactgcccct 2040 ggagctggtc attacgagga taccattctg aaaagcaaga atagcatgaa ccagcctggg 2100 ccctga 2106 <210> 22 <211> 400 <212> PRT <213> Human TFG <400> 22 Met Asn Gly Gln Leu Asp Leu Ser Gly Lys Leu Ile Val Lys Ala Gln 1 5 10 15 Leu Gly Glu Asp Ile Arg Arg Ile Pro Ile His Asn Glu Asp Ile Thr 20 25 30 Tyr Asp Glu Leu Val Leu Met Met Gln Arg Val Phe Arg Gly Lys Leu 35 40 45 Leu Ser Asn Asp Glu Val Thr Ile Lys Tyr Lys Asp Glu Asp Gly Asp 50 55 60 Leu Ile Thr Ile Phe Asp Ser Ser Asp Leu Ser Phe Ala Ile Gln Cys 65 70 75 80 Ser Arg Ile Leu Lys Leu Thr Leu Phe Val Asn Gly Gln Pro Arg Pro 85 90 95 Leu Glu Ser Ser Gln Val Lys Tyr Leu Arg Arg Glu Leu Ile Glu Leu 100 105 110 Arg Asn Lys Val Asn Arg Leu Leu Asp Ser Leu Glu Pro Pro Gly Glu 115 120 125 Pro Gly Pro Ser Thr Asn Ile Pro Glu Asn Asp Thr Val Asp Gly Arg 130 135 140 Glu Glu Lys Ser Ala Ser Asp Ser Ser Gly Lys Gln Ser Thr Gln Val 145 150 155 160 Met Ala Ala Ser Met Ser Ala Phe Asp Pro Leu Lys Asn Gln Asp Glu 165 170 175 Ile Asn Lys Asn Val Met Ser Ala Phe Gly Leu Thr Asp Asp Gln Val 180 185 190 Ser Gly Pro Pro Ser Ala Pro Ala Glu Asp Arg Ser Gly Thr Pro Asp 195 200 205 Ser Ile Ala Ser Ser Ser Ser Ala Ala His Pro Pro Gly Val Gln Pro 210 215 220 Gln Gln Pro Pro Tyr Thr Gly Ala Gln Thr Gln Ala Gly Gln Ile Glu 225 230 235 240 Gly Gln Met Tyr Gln Gln Tyr Gln Gln Gln Ala Gly Tyr Gly Ala Gln 245 250 255 Gln Pro Gln Ala Pro Pro Gln Gln Pro Gln Gln Tyr Gly Ile Gln Tyr 260 265 270 Ser Ala Ser Tyr Ser Gln Gln Thr Gly Pro Gln Gln Pro Gln Gln Phe 275 280 285 Gln Gly Tyr Gly Gln Gln Pro Thr Ser Gln Ala Pro Ala Pro Ala Phe 290 295 300 Ser Gly Gln Pro Gln Gln Leu Pro Ala Gln Pro Pro Gln Gln Tyr Gln 305 310 315 320 Ala Ser Asn Tyr Pro Ala Gln Thr Tyr Thr Ala Gln Thr Ser Gln Pro 325 330 335 Thr Asn Tyr Thr Val Ala Pro Ala Ser Gln Pro Gly Met Ala Pro Ser 340 345 350 Gln Pro Gly Ala Tyr Gln Pro Arg Pro Gly Phe Thr Ser Leu Pro Gly 355 360 365 Ser Thr Met Thr Pro Pro Pro Ser Gly Pro Asn Pro Tyr Ala Arg Asn 370 375 380 Arg Pro Pro Phe Gly Gln Gly Tyr Thr Gln Pro Gly Pro Gly Tyr Arg 385 390 395 400 <210> 23 <211> 1648 <212> DNA <213> Human TFG <400> 23 atgaacggac agttggatct aagtgggaag ctaatcatca aagctcaact tggggaggat 60 attcggcgaa ttcctattca taatgaagat attacttatg atgaattagt gctaatgatg 120 caacgagttt tcagaggaaa acttctgagt aatgatgaag taacaataaa gtataaagat 180 gaagatggag atcttataac aatttttgat agttctgacc tttcctttgc aattcagtgc 240 agtaggatac tgaaactgac attatttgtt aatggccagc caagacccct tgaatcaagt 300 caggtgaaat atctccgtcg agaactgata gaacttcgaa ataaagtgaa tcgtttattg 360 gatagcttgg aaccacctgg agaaccagga ccttccacca atattcctga aaatgatact 420 gtggatggta gggaagaaaa gtctgcttct gattcttctg gaaaacagtc tactcaggtt 480 atggcagcaa gtatgtctgc ttttgatcct ttaaaaaacc aagatgaaat caataaaaat 540 gttatgtcag cgtttggctt aacagatgat caggtttcag ggccacccag tgctcctgca 600 gaagatcgtt caggaacacc cgacagcatt gcttcctcct cctcagcagc tcacccacca 660 ggcgttcagc cacagcagcc accatataca ggagctcaga ctcaagcagg tcagattgaa 720 ggtcagatgt accaacagta ccagcaacag gccggctatg gtgcacagca gccgcaggct 780 ccacctcagc agcctcaaca gtatggtatt cagtattcag caagctatag tcagcagact 840 ggacctcaac aacctcagca gttccaggga tatggccagc aaccaacttc ccaggcacca 900 gctcctgcct tttctggtca gcctcaacaa ctgcctgctc agccgccaca gcagtaccag 960 gcgagcaatt atcctgcaca aacttacact gcccaaactt ctcagcctac taattatact 1020 gtggctcctg cctctcaacc tggaatggct ccaagccaac ctggggccta tcaaccaaga 1080 ccaggtttta cttcacttcc tggaagtacc atgacccctc ctccaagtgg gcctaatcct 1140 tatgcgcgta accgtcctcc ctttggtcag ggctataccc aacctggacc tggttatcga 1200 taaggaggct cctctacacc aattaatgta gctgctagct attggcctcc caaaagactc 1260 cagtactatt ttaatttgta ttgaagaagt tcagaaattt aaaagcagag cattttttat 1320 gatatcattg ttggtgttaa ttgaaagtat aatttgctgg aacacaaaga ccaaaatgaa 1380 agttttttcc tccctgctta aaaatgtagc agcttcttag ttactttgga acactactct 1440 tacatgtata aagtgattga cttgactttc tagcttccct tgtccggagg atattaaaat 1500 gctagggtga ggtttagcca tcttacttgg cttttactat taacatgatg tactaaagta 1560 gagccctttg agaatacaag atattatgta taaaatgtaa cactgatgat aggttaataa 1620 agatgattga atccattaaa aaaaaaaa 1648 <210> 24 <211> 117 <212> DNA <213> Artificial Sequence <220> <223> synthetic oligonucleotide <400> 24 tatggagcaa aactactgta gagcccacac ctgggaaagg acctaaagtg taccgccgga 60 agcaccagga gctgcaagcc atgcagatgg agctgcagag ccctgagtac aagctga 117 <210> 25 <211> 39 <212> PRT <213> Artificial Sequence <220> <223> synthetic peptide <400> 25 Ile Trp Ser Lys Thr Thr Val Glu Pro Thr Pro Gly Lys Gly Pro Lys 1 5 10 15 Val Tyr Arg Arg Lys His Gln Glu Leu Gln Ala Met Gln Met Glu Leu 20 25 30 Gln Ser Pro Glu Tyr Lys Leu 35 <210> 26 <211> 123 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 26 atagcttgga accacctgga gaaccaggac cttccaccaa tattcctgaa aatgtgtacc 60 gccggaagca ccaggagctg caagccatgc agatggagct gcagagccct gagtacaagc 120 tga 123 <210> 27 <211> 41 <212> PRT <213> Artificial Sequence <220> <223> Synthetic peptide <400> 27 Asp Ser Leu Glu Pro Pro Gly Glu Pro Gly Pro Ser Thr Asn Ile Pro 1 5 10 15 Glu Asn Val Tyr Arg Arg Lys His Gln Glu Leu Gln Ala Met Gln Met 20 25 30 Glu Leu Gln Ser Pro Glu Tyr Lys Leu 35 40 <210> 28 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 28 tttgttaatg gccagccaag accc 24 <210> 29 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic oligonucleotide <400> 29 tttttttttt tttttttttt 20

Claims (20)

  1. (a) 포유류 폐암으로부터 생물학적 샘플을 얻는 단계;
    (b) 상기 샘플에서 역형성 림프종 카이네이즈(Anaplastic Lymphoma Kinase)(ALK) 융합 폴리뉴크레오타이드 또는 폴리펩타이드의 존재를 검출함으로써, ALK 융합 폴리뉴크레오타이드 또는 폴리펩타이드의 존재 또는 부재에 근거하여 상기 폐암을 특성화하는 단계를 포함하는
    포유류 폐암을 특성화하는 방법.
  2. 제1항에 있어서,
    상기 폐암은 비-소 세포성 폐암(NSCLC)인
    방법.
  3. 제1항에 있어서,
    ALK 융합 폴리펩타이드의 존재가 검출되는
    방법.
  4. 제3항에 있어서,
    상기 ALK 융합 폴리펩타이드는 항체를 이용함으로써 검출되는
    방법.
  5. 제3항에 있어서,
    상기 폴리펩타이드는 유동세포분석(FC), 면역-조직화학(IHC), 또는 면역-형광(IF) 분석 포맷에서 검출되는
    방법.
  6. 제1항에 있어서,
    ALK 융합 폴리뉴크레오타이드의 존재가 검출되는
    방법.
  7. 제6항에 있어서,
    상기 ALK 융합 폴리뉴크레오타이드의 존재는 형광 인 시츄 하이브리디제이션(FISH) 분석에서 검출되는
    방법.
  8. 제7항에 있어서,
    상기 FISH 분석은 브레이크 어파트(break-apart) 유전자 프로브를 이용하여 수행되는
    방법.
  9. 제6항에 있어서,
    상기 ALK 융합 폴리뉴크레오타이드의 존재는 중합효소 연쇄반응(PCR) 분석에서 검출되는
    방법.
  10. 제9항에 있어서,
    검출된 ALK 융합 폴리뉴크레오타이드는 ALK 융합 mRNA인
    방법.
  11. (a) 포유류 폐암으로부터 생물학적 샘플을 얻는 단계; 및
    (b) 브레이크 어파트(break-apart) 프로브를 이용하는 인 시츄 하이브리디제이션(FISH) 분석으로 상기 샘플에서 ALK 유전자 재배열을 검출하는 단계를 포함하는
    포유류 폐암에서 ALK 유전자 재배열을 검출하는 방법.
  12. ALK 융합 폴리뉴크레오타이드 또는 폴리펩타이드의 존재에 의해 특성화되는 포유류 폐암의 진행을 저해하는데 이용되는 ALK 저해제.
  13. 제12항에 있어서,
    상기 폐암은 비-소 세포성 폐암(NSCLC)인
    ALK 저해제.
  14. 제12항 또는 제13항에 있어서,
    상기 저해제는 ALK의 카이네이즈 활성을 저해하는 화합물인
    ALK 저해제.
  15. 극피 동물(Echinoderm) 미소관(Microtubule)-관련 단백질-유사 4/역형성 림프종(Anaplastic Lymphoma) 카이네이즈(EML4-ALK) 융합 폴리뉴크레오타이드 또는 폴리펩타이드의 존재에 의해 특성화되는 포유류 암의 진행을 저해하는데 이용되는 ALK 저해제.
  16. 제15항에 있어서,
    상기 암은 폐암인
    ALK 저해제
  17. 제16항에 있어서,
    상기 폐암은 비-소 세포성 폐암(NSCLC)인
    ALK 저해제.
  18. 제15항 내지 제17항 중 어느 한 항에 있어서,
    상기 저해제는 ALK의 카이네이즈 활성을 저해하는 화합물인
    ALK 저해제.
  19. 인간 폐암 환자로부터 샘플을 얻는 단계;
    상기 샘플에서 인간 ALK 융합 폴리뉴크레오타이드 또는 폴리펩타이드를 검출하는 단계; 및
    상기 환자에게 ALK의 카이네이즈 활성을 저해하는 화합물의 유효량을 투여하는 단계를 포함하는 인간 폐암 환자의 치료방법에 이용되는
    ALK의 카이네이즈 활성을 저해하는 화합물.
  20. 제19항에 있어서,
    상기 검출은 형광 인 시츄 하이브리디제이션(FISH), 중합효소 연쇄반응 (PCR), 뉴크레오타이드 시퀀싱, 유동세포분석(FC), 면역-형광(IF) 또는 면역-조직화학(IHC) 분석 포맷에서 실행되는
    화합물.
KR1020127030790A 2007-04-13 2007-04-13 인간 고형 종양에서 유전자 결손 및 돌연변이 alk 카이네이즈 KR101362284B1 (ko)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/US2007/009273 WO2008127248A1 (en) 2007-04-13 2007-04-13 Gene defects and mutant alk kinase in human solid tumors

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020117024131A Division KR101274092B1 (ko) 2007-04-13 2007-04-13 인간 고형 종양에서 유전자 결손 및 돌연변이 alk 카이네이즈

Publications (2)

Publication Number Publication Date
KR20130004522A true KR20130004522A (ko) 2013-01-10
KR101362284B1 KR101362284B1 (ko) 2014-02-12

Family

ID=39864195

Family Applications (3)

Application Number Title Priority Date Filing Date
KR1020127030790A KR101362284B1 (ko) 2007-04-13 2007-04-13 인간 고형 종양에서 유전자 결손 및 돌연변이 alk 카이네이즈
KR1020117024131A KR101274092B1 (ko) 2007-04-13 2007-04-13 인간 고형 종양에서 유전자 결손 및 돌연변이 alk 카이네이즈
KR1020087025813A KR20100005180A (ko) 2007-04-13 2007-04-13 인간 고형 종양에서 유전자 결손 및 돌연변이 alk 카이네이즈

Family Applications After (2)

Application Number Title Priority Date Filing Date
KR1020117024131A KR101274092B1 (ko) 2007-04-13 2007-04-13 인간 고형 종양에서 유전자 결손 및 돌연변이 alk 카이네이즈
KR1020087025813A KR20100005180A (ko) 2007-04-13 2007-04-13 인간 고형 종양에서 유전자 결손 및 돌연변이 alk 카이네이즈

Country Status (10)

Country Link
EP (1) EP2016089B1 (ko)
JP (1) JP5562640B2 (ko)
KR (3) KR101362284B1 (ko)
CN (2) CN101466721B (ko)
AU (1) AU2007351581B2 (ko)
CA (2) CA2648864C (ko)
DK (1) DK2016089T3 (ko)
ES (1) ES2458497T3 (ko)
HK (1) HK1122040A1 (ko)
WO (1) WO2008127248A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200058239A (ko) * 2018-11-19 2020-05-27 경북대학교 산학협력단 Tfg 나노 입자 또는 tfmg 나노 입자를 포함하는 암 치료용 또는 암 전이 억제용 조성물

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120208824A1 (en) * 2006-01-20 2012-08-16 Cell Signaling Technology, Inc. ROS Kinase in Lung Cancer
US8168383B2 (en) 2006-04-14 2012-05-01 Cell Signaling Technology, Inc. Gene defects and mutant ALK kinase in human solid tumors
SI2450437T1 (sl) 2006-04-14 2017-12-29 Cell Signaling Technology Inc. Okvarjenost genov in mutantna ALK kinaza v človeških solidnih tumorjih
CA2598893C (en) 2006-10-11 2012-04-10 Astellas Pharma Inc. Eml4-alk fusion gene
TWI389893B (zh) 2007-07-06 2013-03-21 Astellas Pharma Inc 二(芳胺基)芳基化合物
US20110110923A1 (en) * 2008-02-12 2011-05-12 The Brigham And Women's Hospital, Inc. Fish assay for eml4 and alk fusion in lung cancer
RU2562144C2 (ru) * 2009-05-15 2015-09-10 Инсайт Дженетикс, Инк. Способы и композиции, связанные со слиянием алк, для диагностики и лечения рака
TWI518325B (zh) * 2010-02-04 2016-01-21 自治醫科大學 對alk抑制劑具有先抗性或後抗性癌症的識別、判斷和治療
WO2011102507A1 (ja) * 2010-02-22 2011-08-25 富士レビオ株式会社 癌遺伝子の同定方法、癌遺伝子発現細胞の樹立方法、および癌遺伝子標的薬のスクリーニング方法
CN101955995B (zh) * 2010-06-17 2013-06-26 江苏迈迪基因生物科技有限公司 淋巴瘤相关的融合基因的诊断试剂盒
KR101264810B1 (ko) * 2010-11-25 2013-05-15 한국과학기술연구원 Alk 유전자의 재배열 검출방법 및 이를 이용한 암 진단방법
WO2012092531A1 (en) 2010-12-29 2012-07-05 Expression Pathology, Inc. Her3 protein srm/mrm assay
CN102719525B (zh) * 2012-04-12 2014-06-04 厦门艾德生物医药科技有限公司 用于检测eml4-alk融合基因突变的引物、探针及检测试剂盒
US9084456B1 (en) * 2012-05-28 2015-07-21 Jack Zemer Linkage for jewelry components
CA3009552A1 (en) * 2013-03-15 2014-09-18 Expression Pathology, Inc. Srm assay to indicate cancer therapy
US10072298B2 (en) 2013-04-17 2018-09-11 Life Technologies Corporation Gene fusions and gene variants associated with cancer
CN105378110A (zh) * 2013-04-17 2016-03-02 生命技术公司 与癌症相关的基因融合体和基因变异体
EP3122901B1 (en) * 2014-03-27 2018-08-15 Life Technologies Corporation Gene fusions and gene variants associated with cancer
JP6533128B2 (ja) * 2014-09-01 2019-06-19 アークレイ株式会社 Alk融合遺伝子を増幅するためのプライマー試薬、それを含むalk融合遺伝子の増幅試薬キット、それを用いたalk融合遺伝子の増幅方法および分析方法
US10597725B2 (en) 2014-09-01 2020-03-24 Arkray, Inc. Primer reagent for amplifying ALK fusion gene, ALK fusion gene amplification reagent kit including the same, and ALK fusion gene amplification method and ALK fusion gene analysis method using the same
WO2016106701A1 (zh) * 2014-12-31 2016-07-07 深圳华大基因股份有限公司 检测非小细胞肺癌的qRT-PCR引物、探针、芯片、试剂盒、应用和方法
CN105254764A (zh) * 2015-08-27 2016-01-20 上海康岱生物医药技术有限公司 ACVR1-Fc融合蛋白及其制法和用途
WO2017153932A1 (en) 2016-03-10 2017-09-14 Novartis Ag Strn-alk fusion as a therapeutic target in gastric cancer
WO2017175111A1 (en) 2016-04-04 2017-10-12 Novartis Ag Strn-alk fusion as a therapeutic target in colorectal cancer
US11505830B2 (en) * 2017-05-31 2022-11-22 Roche Molecular Systems, Inc. Multiplex PCR detection of ALK, RET, and ROS fusions
KR101987065B1 (ko) * 2017-08-07 2019-06-10 주식회사 싸이토젠 Eml4-alk유전자 변이 분석방법
JP7385191B2 (ja) 2019-08-30 2023-11-22 学校法人同志社 Eml4-alk阻害ペプチドおよびこれを含む肺がん治療薬
CN112794914B (zh) * 2019-11-14 2022-09-16 深圳华大生命科学研究院 一种基于噬菌体展示技术开发的alk纳米抗体及其应用
CN113130001B (zh) * 2021-03-31 2023-07-18 甘肃中医药大学 一种天然化合物与抗肿瘤化合物配伍的筛选方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5529925A (en) * 1993-12-03 1996-06-25 St. Jude Children's Research Hospital Nucleic acid sequences and fusion proteins present in human t(2;5) lymphoma
US7300753B2 (en) * 1998-09-04 2007-11-27 John Rush Immunoaffinity isolation of modified peptides from complex mixtures
US20030099974A1 (en) * 2001-07-18 2003-05-29 Millennium Pharmaceuticals, Inc. Novel genes, compositions, kits and methods for identification, assessment, prevention, and therapy of breast cancer
EP1501351A2 (en) * 2002-04-17 2005-02-02 Richard Metz Short fragment homologous replacement to provide bse resistant cattle
EP1663992A1 (en) * 2003-09-18 2006-06-07 Novartis AG 2,4-di (phenylamino) pyrimidines useful in the treatment of proliferative disorders
EP1687017B1 (en) * 2003-10-24 2013-03-06 Gencia Corporation Methods and compositions for delivering polynucleotides
CA2598893C (en) * 2006-10-11 2012-04-10 Astellas Pharma Inc. Eml4-alk fusion gene
EP1914240B1 (en) * 2006-10-11 2009-12-02 Astellas Pharma Inc. EML4-ALK fusion gene

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200058239A (ko) * 2018-11-19 2020-05-27 경북대학교 산학협력단 Tfg 나노 입자 또는 tfmg 나노 입자를 포함하는 암 치료용 또는 암 전이 억제용 조성물

Also Published As

Publication number Publication date
AU2007351581A1 (en) 2008-10-23
CN101466721A (zh) 2009-06-24
KR20110117734A (ko) 2011-10-27
CN101466721B (zh) 2013-08-21
EP2016089B1 (en) 2014-01-15
KR101362284B1 (ko) 2014-02-12
JP2010501175A (ja) 2010-01-21
CA2982018C (en) 2023-10-17
KR20100005180A (ko) 2010-01-14
ES2458497T3 (es) 2014-05-05
DK2016089T3 (da) 2014-04-22
EP2016089A1 (en) 2009-01-21
KR101274092B1 (ko) 2013-06-25
CA2648864A1 (en) 2008-10-23
CA2648864C (en) 2017-11-21
CN112057625A (zh) 2020-12-11
HK1122040A1 (en) 2009-05-08
CA2982018A1 (en) 2008-10-23
AU2007351581B2 (en) 2011-12-01
JP5562640B2 (ja) 2014-07-30
WO2008127248A1 (en) 2008-10-23
EP2016089A4 (en) 2009-10-21

Similar Documents

Publication Publication Date Title
US11505833B2 (en) Compositions for detecting mutant anaplastic lymphoma kinase in lung cancer
KR101362284B1 (ko) 인간 고형 종양에서 유전자 결손 및 돌연변이 alk 카이네이즈
US10955416B2 (en) Compositions for detecting mutant anaplastic lymphoma kinase in human lung cancer
AU2012261697B2 (en) Gene defects and mutant alk kinase in human solid tumors

Legal Events

Date Code Title Description
A107 Divisional application of patent
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20170119

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20180118

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20190116

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20200115

Year of fee payment: 7