KR20050056250A - 암 관련 유전자 군 - Google Patents

암 관련 유전자 군 Download PDF

Info

Publication number
KR20050056250A
KR20050056250A KR1020057006678A KR20057006678A KR20050056250A KR 20050056250 A KR20050056250 A KR 20050056250A KR 1020057006678 A KR1020057006678 A KR 1020057006678A KR 20057006678 A KR20057006678 A KR 20057006678A KR 20050056250 A KR20050056250 A KR 20050056250A
Authority
KR
South Korea
Prior art keywords
leu
ala
val
gly
glu
Prior art date
Application number
KR1020057006678A
Other languages
English (en)
Inventor
이수진
고상석
이복만
정현호
주성호
양두석
Original Assignee
주식회사 엘지생명과학
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 엘지생명과학 filed Critical 주식회사 엘지생명과학
Publication of KR20050056250A publication Critical patent/KR20050056250A/ko

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4748Tumour specific antigens; Tumour rejection antigen precursors [TRAP], e.g. MAGE
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/136Screening for pharmacological compounds

Abstract

본 발명은 전반적으로 암 환자의 인체조직에서 나타나는 유전자 발현의 변화에 관한 것이다. 상세하게는, 본 발명은 유방, 대장, 식도, 신장, 간, 폐, 림프선, 난소, 췌장, 전립선, 직장, 및/또는 위의 정상조직과 비교하여 이에 대응하는 암 조직에서 다르게 발현되는 인간 유전자 군에 관한 것이다.

Description

암 관련 유전자 군 {Gene Families Associated with Cancers}
본 발명은 암 환자의 인체조직에서 나타나는 유전자 발현상의 변화에 관한 것이다. 상세하게는, 본 발명은 유방, 대장, 식도, 신장, 간, 폐, 림프선, 난소, 췌장, 전립선, 직장, 및/또는 위의 정상조직과 비교하여 이에 대응하는 암 조직에서 다르게 발현되는 인간 유전자 군에 관한 것이다.
미국에서는 백만 종류 이상의 새로운 암이 진단되고, 약 50 만명이 암으로 사망한다. 암의 원인은 유전적 성질, 환경적인 영향, 감염원 및 노화 등을 포함하여 여러 가지가 있으며 다양해지고 있다. 이러한 요인들은 효과기 경로의 조절과 흐름의 광범위한 스펙트럼을 벗어나도록 함으로써 정상세포를 암세포로 변형시킨다. 세포 생리기능 상의 몇 가지 변화, 즉 성장 신호의 자가 충족, 성장 저해 신호에 대한 무감각, 계획된 세포사의 회피, 무한정한 복제 능력, 지속적인 혈관 형성, 조직 침입 및 전이 등은 총체적으로 이러한 위험한 성장을 가리킨다(Hanahan and Weinberg(2000),Cell 100 : 57-70).
최근에 연구자들은 암 발생의 기초가 된다고 여겨지는 많은 유전적 변화들을 확인하였다. 이러한 유전적 변화들은 암 유전자(oncogene)의 증폭과 종양 억제 유전자의 손실로 인한 돌연변이를 포함한다. 암 유전자는 초기에는 그들의 표적세포의 형질변환을 유발하는 바이러스에 의해 운반되는 유전자라고 여겨졌다. 바이러스성 암 유전자의 주요부(major class)는 정상 세포의 기능에 관여하는 세포성 물질을 가지고 있다. 원-종양형성 유전자(proto-oncogene)라고 불리는 세포성 유전자, 어떤 경우에는 세포내의 그들의 돌연변이나 변종이 종양의 형성과 관련된다. 암 유전자의 형성은 세포성 원-종양 형성 유전자가 부적절하게 활성화되어 기능획득을 하였음을 의미한다. 이는 단백질에서의 돌연변이적 변화, 구성요소의 활성화, 과발현, 또는 적당한 시기의 발현 정지의 실패를 포함한다. 약 100 가지의 암 유전자가 확인되었다. 암 유전자의 예로는, ras, fos, myc, abl, alc myb가 있으며, 이들에 한정되는 것은 아니다(ponder(2001), Nature 411 : 336 ~341). 종양 억제 유전자는 그들의 야생형 대립 유전자에서 비정상적인 세포의 증식을 억제하는 단백질을 발현한다. 종양 억제 유전자를 코딩하는 유전자가 돌연변이되거나 결실될 때, 그 결과적인 돌연변이 단백질이나 종양 억제 유전자의 완전한 부재는 세포의 성장을 바르게 조절할 수 없게 되고, 심각한 경우, 세포의 조절 메커니즘 상에 손상이 있는 경우에는 비정상적인 증식이 일어날 수 있다. 다수의 공지된 인간 암과 암 세포계는 종양 억제 유전자가 없거나 비기능적 종양 억제 유전자를 가지고 있다. 종양 억제 유전자의 예로는, 망막아종 민감성 유전자 또는 RB gene, p53 유전자, 결장 암종 유전자(DCC) 및 신경섬유 종증 1 형(NF-1) 종양 억제 유전자가 있지만, 이들만으로 한정되는 것은 아니다(Weinberg (1991), Science 254 : 1138-1146). 종양 억제 유전자의 기능 손실이나 비활성화는 상당수가 인간 암의 개시 및/또는 전파에 주요한 역할을 한다.
게놈-와이드 발현(genome-wide expression)의 활용은, 암의 분류, 약물 표적의 확인, 진단 표지의 확인 및/또는 화학요법 치료의 결과로서 다양한 암의 치료에 대한 더 많은 유효한 전략을 계획하는 것을 촉진할 수 있다는 것에 대한 더 깊은 인식을 얻는 것을 의미한다. 암의 서브 타입을 확인하는 유전자 발현 패턴을 이용한 초기의 연구는 다소 흥미로운 결과를 나타내었다(Perou et al. (1999), Proc Natl Acad Sci U S A 96:9212-9217; Golub et al. (1999), Science 286:531-537; Alizadeh et al. (2000), Nature 403:503-511; Alon et al. (1999), Proc Natl Acad Sci U S A 96:6745-6750; 및 Bittner et al. (2000), Nature 406:536-540; Perou et al. (2000), Nature 406:747-752 참조). 유전자 발현 프로파일링에 의한 B 세포 림프종의 분자적 분류는 대형 B 세포 림프종 서브 그룹의 의학적으로 두드러진 확산을 의미한다(see Alizadeh et al., supra). 유방암에서, 제한된 수의 유전자(8, 102 유전자)를 이용한 연구는 종양을 유전자 발현 프로파일링에 기초한 서브 타입으로 분류하였고, 이러한 연구는 유방암과 관련한 분자적 표현형의 다양성을 암시하였다. 게다가, 발현 프로파일링은 연구자들로 하여금 수천의 유전자에 대한 조직 특이적 발현 수준을 묘사할 수 있도록 해 주었다(Alon et al. (1999), Proc Natl Acad Sci USA 96:67456750; Iyer et al. (1999), Science 283:8387; Khan et al.(1998), Cancer Res 58:50095013; Lee et al.(1999), Science 285:13901393; Wang et al. (1999), Gene 229:101108; Whitney et al. (1999), Ann Neurol 46:425428). 이러한 연구는 발현 프로파일링이 증진된 치료 전략을 향상시킬 뿐만 아니라 암과 같은 인간 질병의 진단에 있어서 발전을 가져오는데 이용된다는 것을 설명하고 있음에도 불구하고, 더 깊은 연구가 요구된다.
암이 광범위하고 여러 조직과 다수의 병원 요소에서 유래한 이질성인 것임에도 불구하고, 이러한 다양성은 상대적으로 적은 수의 결정적인 사건에 기초하며, 이들의 수렴은 모든 암의 발생에 필요한 것이라고 제안되어 왔다(Evan and Vousden (2001), Nature 411:342-348). 따라서, 많은 다양한 형태의 암에서 암의 발생과 발달에 관여하는 결정적인 분자 표지를 확인하기 위해 많은 다양한 형태의 암에 있어서의 전반적인 유전자 발현 수준에 나타나는 변화에 대한 포괄적인 연구가 필요하다. 또한, 당해 분야에서는 암의 보다 정확한 진단을 가능케 하는 물질과 방법에 대한 연구가 필요하다. 부가적으로, 치료 방법과 이 질병을 효과적으로 치료할 수 있는 요소를 확인하기 위한 방법에 대한 연구가 필요하다. 본 발명은 이러한 요구에 따른 것이다.
도 1은 두개의 LFG1 클론의 상대적으로 정렬 위치를 보여주고 있다.
도 2는 LFG1-Clone A (SEQ ID NO: 2)의 오픈 리딩-프레임에 의해 인코딩된 단백질의 소수성 도표이다. 분석은 Kyte-Doolittle법에 따라 수행되었다.
도 3은 LFG1-Clone B (SEQ ID NO: 4)의 오픈 리딩 프레임에 의해 인코딩된 단백질의 소수성 도표이다. 분석은 Kyte-Doolittle법에 따라 수행되었다.
도 4는 LFG2 (SEQ ID NO: 6)의 오픈 리딩 프레임에 의해 인코딩된 단백질의 소수성 도표이다. 분석은 Kyte-Doolittle법에 따라 수행되었다.
도 5는 LFG3 (SEQ ID NO: 8)의 오픈 리딩 프레임에 의해 인코딩된 단백질의 소수성 도표이다. 분석은 Kyte-Doolittle법에 따라 수행되었다.
도 6은 LFG4(SEQ ID NO: 10)의 오픈 리딩 프레임에 의해 인코딩된 단백질의 소수성 도표이다. 분석은 Kyte-Doolittle법에 따라 수행되었다.
도 7은 ALFG5(SEQ ID NO: 12)의 오픈 리딩 프레임에 의해 인코딩된 단백질의 소수성 도표이다. 분석은 Kyte-Doolittle법에 따라 수행되었다.
도 8은 두개의 LFG6 클론의 상대적으로 정렬된 위치를 도시하고 있다.
도 9는 LFG6-#20(SEQ ID NO: 14)의 오픈 리딩 프레임에 의해 인코딩된 단백질의 소수성 도표이다. 분석은 Kyte-Doolittle법에 따라 수행되었다.
도 10은 LFG6-#46(SEQ ID NO: 16)의 오픈 리딩 프레임에 의해 인코딩된 단백질의 소수성 도표이다. 분석은 Kyte-Doolittle법에 따라 수행되었다.
본 발명은 정상 조직, 이하에서는 각각 LFG1, LFG2, LFG3, LFG4, LFG5, LFG6 과 비교하여 암 조직에서만 다르게 발현되는 새로운 유전자에 관한 것이다. 본 발명은 SEQ ID NO: 1, 3, 5, 7, 9, 11, 13 또는 15나 그것의 상보체를 포함하는 것으로 구성된 분리된 핵산 분자(isolated nucleic acid)를 포함한다.
본 발명은 또한 분리된 핵산 분자를 포함하는 것으로 구성된 벡터와, 하나 또는 그 이상의 발현 조절 요소에 작동 가능하도록 연결된 핵산 분자를 포함한다. 본 발명은, 본 발명의 핵산 분자를 포함하도록 형질 전환된 숙주세포와 단백질이 발현되는 조건하에서, 본 발명의 핵산 분자로 형질전환 된 숙주세포를 배양하는 과정을 포함하는 것으로 구성된 단백질의 제조방법을 포함한다.
본 발명은 또한 SEQ ID NO: 2, 4, 6, 8, 10, 12, 14 또는 16의 아미노산 서열을 포함하는 것으로 구성된 분리된 폴리펩티드, SEQ ID NO: 2, 4, 6, 8, 10, 12, 14 또는 16의 적어도 10 개 아미노산의 단편을 포함하는 것으로 구성된 분리된 폴리펩티드, SEQ ID NO: 2, 4, 6, 8, 10, 12, 14 또는 16의 보존적인 아미노산 치환체(conservative amino acid substitution)를 포함하는 것으로 구성된 분리된 폴리펩티드, 및 SEQ ID NO: 2, 4, 6, 8, 10, 12, 14 또는 16의 천연 아미노산 서열의 변이체(variant)를 포함하는 것으로 구성된 분리된 폴리펩티드로 이루어진 군으로부터 선택된 분리된 폴리펩티드를 제공한다. 본 발명의 폴리펩티드는 또한 SEQ ID NO: 2, 4, 6, 8, 10, 12, 14 또는 16에 개시된 아미노산 서열과 적어도 약 50%, 60%, 70% 또는 75% 아미노산 서열 상동성을 가지는 폴리펩티드를 포함하며, 바람직하게는 적어도 약 80%, 더욱 바람직하게는 적어도 약 90-95%, 가장 바람직하게는 적어도 약 95-98%의 상동성 서열을 갖는 폴리펩티드를 의미한다.
본 발명은 또한 본 발명의 폴리펩티드 군의 기타 다른 구성원들을 확인(동정)하는 방법을 제공한다. 상세하게는, SEQ ID NO: 1, 3, 5, 7, 9, 11, 13 또는 15의 아미노산 서열은 LFG1, LFG2, LFG3, LFG4, LFG5, 또는 LFG6 단백질 군의 다른 구성원들을 인코딩하는 핵산 분자를 확인하기 위한 방법에서 탐침으로서 사용되거나 또는 PCR 프라이머를 형성하는 데에 사용될 수 있다.
본 발명은 또한 단일클론(monoclonal) 항체 또는 다중클론(polyclonal) 항체를 포함하여, 본 발명의 폴리펩티드에 특이적으로 결합하는 분리된 항체 또는 항원-결합 항체 단편을 제공한다.
본 발명은 또한, 핵산을 발현하는 세포를 물질(agent)에 노출시키는 것; 및 상기 물질이 상기 핵산의 발현을 조절하는지 여부를 결정함으로써, 단백질을 인코딩하는 핵산의 발현을 조절하는 물질을 확인하는 것을 포함하는 것으로 구성된, 본 발명의 단백질을 인코딩하는 핵산의 발현을 조절하는 물질을 확인하는 방법을 제공한다.
본 발명은 또한, 단백질을 발현하는 세포를 물질에 노출시키는 것; 및 상기 물질이 상기 단백질의 수준이나 적어도 하나의 활성을 조절하는지 여부를 결정함으로써, 단백질의 수준이나 적어도 하나의 활성을 조절하는 물질을 확인하는 것을 포함하는 것으로 구성된, 본 발명의 단백질의 수준이나 적어도 하나의 활성을 조절하는 물질을 확인하는 방법을 제공한다.
본 발명은 또한, 단백질을 인코딩하는 핵산의 발현을 조절하는 유효량의 물질을 투여하는 과정을 포함하는 것으로 구성된, 본 발명의 단백질을 인코딩하는 핵산 분자의 발현을 조절하는 방법을 제공한다. 본 발명은 또한, 단백질의 적어도 하나의 활성을 조절하는 유효량의 물질을 투여하는 과정을 포함하는 것으로 구성된, 본 발명의 단백질의 적어도 하나의 활성을 조절하는 방법을 제공한다.
본 발명은 또한, 단백질을 잠재적 결합 파트너에 노출시키는 것; 및 상기 잠재적 결합 파트너(binding partner)가 상기 단백질에 결합하는지를 결정함으로써, 상기 단백질에 대한 결합 파트너를 확인하는 것을 포함하는 것으로 구성된, 본 발명의 단백질에 대한 결합 파트너를 확인하는 방법을 제공한다.
본 발명은 또한 본 발명의 단백질과 결합 파트너와의 결합을 막거나 조절할 수 있는 물질을 확인하는 방법을 제공한다. 상세하게는, 상기 물질은 상기 단백질, 그의 단편 및 결합 파트너를 시험 물질과 접촉시키고, 그 시험물질이 상기 단백질과 결합 파트너 간의 결합을 막거나 줄이는지를 결정함으로써, 상기 물질이 본 발명의 단백질과 결합 파트너 사이의 결합을 막거나 줄이거나 그렇지 않으면 조절하는 등의 능력이 있는지를 시험할 수 있다.
본 발명은 또한, 결합 파트너와 상기 단백질 간의 결합을 줄이거나 막는 유효량의 물질을 투여하는 과정을 포함하는 것으로 구성된, 본 발명의 단백질과 하나 또는 그 이상의 결합 파트너 간의 결합을 막거나 줄이는 방법을 제공한다. 이러한 방법은 본 발명의 단백질 또는 결합 파트너에 결합하는 물질을 이용할 수 있다.
본 발명의 또 다른 측면에 따르면, 본 발명의 단백질은 리간드, 치료제 또는 기타 유형의 작은 화학 분자들을 제공하기 위한 합리적인 약제 설계를 위한 시발점으로 사용될 수 있다. 또는, 상기한 선별 검사에 의해 확인된 소분자나 기타 화합물들은 합리적인 약제 설계에 있어서 "선도 화합물(lead compound)"로 작용할 수도 있다.
본 발명은 또한, 프로모터 또는 인헨서 요소(enhancer element)과 작동 가능하도록 연결된 본 발명에 따른 핵산 분자를 포함하는 것으로 구성된 핵산 구조체(nucleic acid construct)를 암 세포에 주입하여 상기 핵산의 발현이 상기 암을 억제하도록 하는 것을 포함하는 것으로 구성된, 암을 치료하는 방법에 관한 것이다.
본 발명은 또한 본 발명에 따른 핵산을 포함하도록 변형된 비인간 형질전환 동물이나 인코딩된 폴리펩티드의 발현을 막는 돌연변이 된 핵산 분자를 포함하도록 변형된 비인간 형질전환 동물을 포함한다.
본 발명은 또한 SEQ ID NO: 1, 3, 5, 7, 9, 11, 13 또는 15의 전체 또는 일부를 포함하는 것으로 구성된 유전자의 전부 또는 일부가 동물의 게놈으로부터 녹아웃(knock-out)되거나 결실되어 있는 비인간 형질전환 동물을 포함한다.
본 발명은 또한, 객체(subject)로부터 조직, 혈액, 소변 또는 기타 여러 가지 샘플을 채취하여 본 발명에 따른 핵산 분자나 폴리펩티드 분자의 발현 수준을 결정하는 것을 포함하는 것으로 구성된, 암을 진단하는 방법을 제공한다.
본 발명은 또한, SEQ ID NO: 2, 4, 6, 8, 10, 12, 14 또는 16의 아미노산 서열을 포함하는 것으로 구성된 분리된 폴리펩티드; SEQ ID NO: 2, 4, 6, 8, 10, 12, 14 또는 16의 적어도 10 개 아미노산의 단편을 포함하는 것으로 구성된 분리된 폴리펩티드; SEQ ID NO: 2, 4, 6, 8, 10, 12, 14 또는 16의 보존적인 아미노산 치환체를 포함하는 것으로 구성된 분리된 폴리펩티드; SEQ ID NO: 2, 4, 6, 8, 10, 12, 14 또는 16의 천연 아미노산 서열의 변이체를 포함하는 것으로 구성된 분리된 폴리펩티드; 및 SEQ ID NO:2, 4, 6, 8, 10, 12, 14 또는 16에 개시되어 있는 서열과 적어도 약 50%, 60%, 70% 또는 75%, 바람직하게는 적어도 80%, 더욱 바람직하게는 적어도 90-95%, 가장 바람직하게는 적어도 95-98%의 아미노산 서열 상동성을 가지는 아미노산 서열의 분리된 폴리펩티드로 이루어진 군에서 선택되는 폴리펩티드 또는 단백질 및 희석제를 포함하는 것으로 구성된 조성물을 포함한다.
I. 전반적인 내용
본 발명은 정상 조직과 비교하여 암 조직에서 다르게 발현되는 새로운 유전자의 확인에 부분적으로 기반하고 있다. 이러한 유전자 군은 SEQ ID NO: 1, 3, 5, 7, 9, 11, 13 및 15의 인간 cDNA에 상응한다.
본 발명에 따른 유전자와 단백질은 샘플에서 암을 발견하거나 정상세포로부터 암종을 분화하기 위한 진단시약 또는 마커로서 사용될 수도 있다. 그들은 또한 유전자 발현이나 활성을 조절하는 물질에 대한 타겟으로도 작용할 수 있다. 예를 들어, 상기 물질은 암의 이상증식 과정을 포함한 암의 성장과 관련된 생물학적 과정을 조절하는 것으로 밝혀질 수도 있다.
II. 구체적인 내용
A. 암 관련 단백질
본 발명은 분리된 단백질, 단백질의 대립형질 변이체(allelic variant) 및 단백질의 보존적 아미노산 치환체를 제공한다. 여기서 "단백질" 또는 "폴리펩티드"는 부분적으로 SEQ ID NO: 2, 4, 6, 8, 10, 12, 14 또는 16에 기재되어 있는 인간 아미노산 서열을 가지고 있는 단백질을 의미한다. 상기 용어는 또한 상기에서 구체적으로 인용한 아미노산과 약간 다른 천연 대립형질 변이체 및 단백질을 의미한다. 대립형질 변이체는 상기 언급된 아미노산과 약간 다른 아미노산 서열을 가짐에도 불구하고 여전히 이들 단백질들과 동일하거나 유사한 생물학적 기능을 가질 것이다.
여기서, SEQ ID NO: 2, 4, 6, 8, 10, 12, 14 또는 16의 인간 아미노산 서열과 관련된 단백질 군은 인간을 포함하여 생명체로부터 분리된 단백질을 의미한다. 이들 단백질에 관련된 단백질 군의 기타 구성원을 동정하고 분리하는 데에 사용하는 방법은 이하에서 설명한다.
본 발명의 단백질은 바람직하게는 분리형(isolated form)이다. 여기서, 이러한 단백질은 일반적으로 단백질과 관련있는 세포 구성원들로부터 단백질을 제거하기 위한 물리적, 기계적 또는 화학적 방법이 사용될 때 분리되는 것으로 말한다. 당업자라면 분리된 단백질을 얻기 위한 표준 정제 방법을 사용할 수 있다.
본 발명의 단백질은 또한 SEQ ID NO: 2, 4, 6, 8, 10, 12, 14 또는 16의 삽입, 결실 또는 보존적 아미노산 치환 변이체들을 포함한다. 보존적인 변이체는 아미노산 서열상의 변형이 있음에도 단백질의 생물학적 기능에는 이로 인한 영향이 없는 변이체를 의미한다. 치환, 삽입 또는 결실 변이체는 변형된 서열이 단백질과 관련된 생물학적 기능을 막거나 중단시키는 경우에 단백질에 이에 상응하는 영향을 주게 된다. 예를 들어, 특정한 경우에는 단백질의 전체적인 극성, 구조, 소수성/친수성 특성이 생물학적 활성에 영향을 주지 않고도 바뀔 수 있다. 따라서, 아미노산 서열은 펩티드를 더 소수성 또는 친수성이 되도록 하기 위해 변형될 수도 있고, 단백질의 생물학적 성질에 영향을 주지 않으면서 변형될 수도 있다.
통상적으로, 대립형질 변이체, 보존적 치환 변이체, 및 단백질 군의 구성원들은 SEQ ID NO: 2, 4, 6, 8, 10, 12, 14 또는 16에 개시되어 있는 아미노산 서열과 적어도 50%, 60%, 70% 또는 75%, 바람직하게는 적어도 약 80%, 더욱 바람직하게는 적어도 약 90-95%, 가장 바람직하게는 적어도 약 95-98%의 아미노산 서열 상동성을 가지는 아미노산을 서열을 가지고 있다. 이러한 서열에 대한 상동성(identity) 또는 동질성(homology)은, 필요한 경우, 최대 퍼센트 동질성을 달성하도록 서열을 배열하고 간격을 도입한 후, 그러나 어떠한 보존적인 치환체를 서열 상동성의 일부로서 고려하지는 않으면서(관련 변수들에 대해서는 항목 B를 참조), SEQ ID NO: 2, 4, 6, 8, 10, 12, 14 또는 16과 동일한 후보 서열들 중에서 아미노산 잔기의 백분율로서 정의된다. 융합 단백질이나 펩티드 서열의 N-말단, C-말단 또는 내부 확장, 결실 또는 삽입은 동질성에 영향을 주는 것으로 해석되지는 않는다.
따라서, 본 발명의 단백질은 SEQ ID NO: 2, 4, 6, 8, 10, 12, 14 또는 16에 개시되어 있는 아미노산 서열을 가지고 있는 분자들; 이들 단백질의 적어도 3, 4, 5, 6, 10, 15, 20, 25, 30, 35 또는 그 이상의 아미노산 잔기의 보존적 서열을 가지고 있는 그들의 단편; 하나 또는 그 이상의 아미노산 잔기가 N-, C-말단 또는 내부에 삽입되어 있고, 개시되어 있는 코딩 서열을 가지고 있는 아미노산 서열 변이체; 및 개시되어 있는 서열 또는 적어도 하나의 잔기에 의해 치환되어 있는, 상기에서 정의되어 있는, 그들의 단편인 아미노산 서열 변이체들을 포함한다. 펩티드 또는 폴리펩티드로 칭해지기도 하는 이들 단편들(fragments)은, 친수성 부위 뿐만 아니라 공지 단백질 도메인(domain)에 상응하는 아미노산 서열의 부위로서 확인된 단백질의 항원성 부위, 기능성 부위를 포함할 수도 있다. 상기 부위들은 MacVector(Oxford Molecular)와 같이 일반적으로 사용되는 단백질 서열 분석 소프트웨어를 사용하여 쉽게 확인할 수 있다.
고려되는 변이체들은, 예를 들어, 동질성 재조합(homologous recombination), 위치 지정(site-directed) 또는 PCR 돌연변이에 의한 예정된 돌연변이를 포함하는 변이체와, 다음의 것으로 한정되는 것은 아니지만, 토끼, 마우스, 쥐, 돼지, 소, 양, 말 및 비인간 유래 종 등을 포함한 기타 다른 동물 종들의 대응 단백질과 단백질 군의 대립형질 또는 기타 천연 변이체들; 단백질이 치환, 화학적, 효소적, 또는 다른 적당한 수단에 의해 천연 아미노산 이외의 부분으로 공유결합적으로 변형된 유도체(예를 들어, 효소나 방사성 동이원소와 같은 검출 가능한 부분)를 포함한다.
본 발명은 또한 본 발명의 단백질 또는 폴리펩티드 및 희석제를 포함하는 것으로 구성된 조성물을 제공한다. 바람직한 희석제는 수용액 또는 비수용액 용제이거나 이들의 혼합액으로서, 예를 들어, 안정성, 수용성, 활성 및/또는 단백질이나 폴리펩티드의 저장성에 기여하는 수용성 염이나 글리세롤 등의 부가 성분들을 포함하는 것으로 구성될 수도 있다.
이하에서 기술하는 바와 같이, 단백질 군의 구성원들은, (1) 단백질의 수준이나 적어도 하나의 활성을 조절하는 물질을 확인하기 위하여, (2) 단백질의 결합 파트너를 확인하기 위하여, (3) 다중클론 또는 모노클로랄 항체를 유발하는 항원으로, (4) 치료제 또는 타겟으로, (5) 진단제 또는 암의 표지로 이용될 수 있다.
B. 핵산 분자
본 발명은 또한 SEQ ID NO: 2, 4, 6, 8, 10, 12, 14 또는 16을 가진 단백질 및 여기에 기재되어 있는 관련된 단백질을 인코딩하는, 바람직하게는 분리형의, 핵산 분자를 제공한다. 여기서, "핵산 분자"는, 상기 단백질 또한 펩티드를 인코딩하는 DNA 또는 RNA로서, 이러한 펩티드를 인코딩하는 아미노산 서열과 상보적이고, SEQ ID NO: 1, 3, 5, 7, 9, 11, 13 또는 15의 핵산과 혼성화하여 적정한 엄격 조건 하에서도 안정적으로 이들에 결합하며, SEQ ID NO: 2, 4, 6, 8, 10, 12, 14 또는 16의 펩티드 서열과 50%, 60%, 70%, 또는 75%, 바람직하게는 적어도 약 80%, 더욱 바람직하게는 적어도 약 90-95%, 가장 바람직하게는 적어도 약 95-98% 또는 그 이상의 서열 상동성을 갖는 폴리펩티드를 인코딩하거나, 또는 SEQ ID NO: 1, 3, 5, 7, 9, 11, 13 또는 15의 오픈 리딩 프레임과 50%, 60%, 70%, 또는 75%, 바람직하게는 적어도 약 80%, 더욱 바람직하게는 적어도 약 90-95%, 가장 바람직하게는 적어도 약 95-98%, 또는 그 이상의 서열 상동성을 갖는 핵산을 나타낸다.
본 발명은 또한 SEQ ID NO: 1, 3, 5, 7, 9, 11, 13 또는 15의 보체에 특이적으로 혼성화하는 분리된 핵산 분자, 특히 오픈 리딩 프레임 상에 특이적으로 혼성화하는 분자들을 포함한다. SEQ ID NO: 1, 3, 5, 7, 9, 11, 13 또는 15의 보체에 특이적으로 혼성화하는 그러한 분자는 엄격한 혼성 조건(stringent hybridization condition) 하에서 이러한 반응을 한다.
자연 소스로부터 유도되었거나 또는 합성되었던 간에, 또다른 골격에 기반하거나 또는 또다른 염기를 포함하고 있는 핵산 뿐만 아니라, 게놈 DNA, cDNA, mRNA 및 안티센스(antisense) 분자가 특히 고려된다. 그러나, 이러한 혼성화 또는 상보적 핵산은, 적정한 엄격 조건 하에서 인코딩 또는 혼성화하거나 또는 본 발명의 단백질을 인코딩하는 것을 포함하는 선행기술의 핵산에 대해 신규하고 비자명한 것으로 정의된다.
뉴클레오티드 또는 아미노산 서열에서의 동질성 또는 상동성은 서열에 관한 유사한 연구인 blastp, blastn, blastx, tblastn 및 tblastx 프로그램에 의한 알고리즘을 이용하는 BLAST(Basic Local Alignment Search Tool) 분석에 의해 결정된다(Altschul et al. (1997), Nucleic Acids Res. 25: 3389-3402, 및 Karlin et al. (1990), Proc. Natl. Acad. Sci. USA 87: 2264-2268). BLAST 프로그램에 의해 사용되는 접근법은, 우선 큐에리(query) 서열과 데이터베이스 서열 사이에 간격이 있거나 또는 없는 유사한 단편들을 고려한 다음, 확인되는 모든 상대의 통계학적 중요성을 평가하고, 최종적으로 중요성의 미리 선택된 역치(preselected threshold)를 만족시키는 상대들 만을 종합하는 것이다. 서열 데이터베이스에 관한 유사한 연구에 있어서 기초적인 쟁점에 대하여는 Altschul et al. (1994), Nat. Genet. 6: 119-129를 참조한다. 히스토그램(histogram), 명세서, 설계도, 기대치(데이터베이스 서열 상에서 보고된 상대에 대한 통계적 유의성 역치), 경계, 기질 및 여과기(저복잡성) 등의 써치 파라미터들은 디폴트 셋팅(default setting)되어 있다. blastp, blastx, tblastn, 및 tblastx에서 사용되는 default scoring matrix는, 길이가 85 이상의 뉴클레오티드 또는 아미노산 큐에리(query) 서열에 대해 추전되는, BLOSUM62 matrix(Henikoff et al. (1992), Proc. Natl. Acad. Sci. USA 89: 10915-10919, 이들은 참조로서 합체됨)이다.
Blastn에 있어서, scoring matrix는 M(즉, 일치하는 한 쌍의 잔기에 대한 보상 점수)대 N(즉, 불일치 잔기에 대한 벌점)의 비율로 설정하며, M과 N에 대한 디폴트 값(default value)은 각각 5, -4이다. 네 개의 Blastn 파라미터는 다음과 같이 조정되었다: Q=10 (gap creation penalty); R=10(gap extension penalty); wink=1 (큐에리에 따라 winkth 위치마다 word hit을 생성함); 및 gapw=16(gapped alignment가 생성되는 window width를 설정함). 등가 Blastp 파라미터 설정은 Q=9; R=2; wink=1; 및 gapw=32이었다. GCG 패키지 버전 10.0에서 사용 가능한 서열상의 Bestfit 비교는 DNA parameters GAP=50 (gap creation penalty) 및 LEN=3 (gap extension penalty)를 사용하고, 단백질 비교에 있어서의 등가 설정(equivalent setting)은 GAP=8 및 LEN=2이다.
"엄격한 조건(stringent condition)"은, (1) 세척을 위한 낮은 이온 결합력과 높은 온도, 예를 들어, 50℃에서 0.015 M NaCl/0.0015 M sodium citrate/0.1% SDS를 사용하거나, (2) 42℃에서 750 mM NaCl과 75 mM sodium citrate로 pH 6.5에서 0.1% bovine serum albumin/0.1% Ficoll/0.1% polyvinylpyrrolidone/50 mM sodium phosphate 버퍼와 포름아마이드, 예를 들어, 50%(vol/vol) 포름아미드와 같은 변성제(denaturing agent)를 혼성화 반응 중에 사용하는 것이다. 또 다른 예로는 42℃에서 50% 포름아미드, 5× SSC (0.75 M NaCl, 0.075 M sodium citrate), 50 mM sodium phosphate (pH 6.8), 0.1% sodium pyrophosphate, 5× Denhardt 용액, 음파처리된 salmon sperm DNA(50 g/ml), 0.1% SDS, 및 10% dextran sulfate를, 42℃에서 0.2× SSC 와 0.1% SDS로 씻으면서 혼성화하는 것이다. 당업자들은 명료하고 확인가능한 혼성화 신호를 적절히 얻기 위하여 엄격한 방법들을 결정하고 변경하는 것이 가능할 것이다. 바람직한 분자들은 상기한 조건 하에서 SEQ ID NO: 1, 3, 5, 7, 9, 11, 13 또는 15의 상보체(complement)에 혼성화되고 기능성 또는 장편 단백질을 인코딩하는 분자들이다. 보다 바람직한 혼성화 분자들은, 상기 조건 하에서 SEQ ID NO: 1, 3, 5, 7, 9, 11, 13 또는 15의 오픈 리딩 프레임의 상보적 가닥에 혼성화하는 분자들이다.
여기서 사용된 바와 같이, 핵산 분자가 다른 폴리펩티드를 인코딩하는 오염된 핵산 분자로부터 실질적으로 떨어져 있을 때, 핵산 분자는 "분리되어(isolated)" 있다고 말한다.
본 발명은 또한 개시되어 있는 핵산 분자의 단편을 제공한다. 여기서, 핵산 분자의 단편이란, 암호(coding) 또는 비암호(non-coding) 서열의 작은 부분을 의미한다. 상기 단편의 크기는 상기 언급한 방법에 의해 결정된다. 예를 들어, 상기 단편이 단백질의 활성부위를 인코딩하기 위해 선택된다면, 그 단편은 단백질의 기능 부위(functional region)를 인코딩하기에 충분할 정도로 커야 한다. 만약에 단편이 핵산 탐침이나 PCR의 프라이머로서 사용된다면, 그때의 단편 길이는 probing/priming 동안 상대적으로 적은 수의 펄스 포지티브(false positive)를 얻도록 선택된다 (항목 G에서의 내용 참조).
탐침이나 PCR의 특정한 프라이머로 사용되거나, 본 발명의 단백질을 인코딩하는 유전자 서열을 합성하는 본 발명에 따른 핵산 분자의 단편(synthetic oligonucleotides)은 Matteucci et al., ((1981) J. Am. Chem. Soc. 103: 3185-3191)의 phosphoramidite 방법 또는 자동 합성 방법과 같은 화학적 기술을 이용하여 쉽게 합성할 수 있다. 또한, 더 큰 DNA 단편은 유전자의 다양한 분자 단편들을 정의하는 올리고뉴클레오티드 군의 합성 후 완전한 변형 유전자를 생성하도록 올리고뉴클레오티드의 연결(ligation)과 같은 공지 방법에 의해 용이하게 준비될 수 있다.
본 발명의 핵산 분자는 또한 진단 및 탐침의 목적에서 탐지할 수 있는 라벨을 포함하도록 더 변형될 수도 있다. 이러한 많은 라벨들이 당업계에 잘 알려져 있고, 상기 인코딩 분자를 용이하게 사용될 수 있다. 바람직한 라벨은 biotin, 방사성 표지 라벨, 형광 표지 뉴클레오티드 등이 포함되며, 이들에 한정되는 것은 아니다. 당업자들은 본 발명의 표지 핵산 분자 변이체를 얻기 위하여 이러한 라벨을 쉽게 사용할 수 있다.
C. 다른 관련 핵산 분자들의 분리
이와 같이, SEQ ID NO:1, 3, 5, 7, 9, 11, 13 또는 15를 가진 핵산 분자의 확인 및 평가는 당업자들로 하여금 상기한 서열에 추가하여 단백질 군의 다른 구성원들을 인코딩하는 핵산 분자를 분리하는 것을 가능케 한다. 또한, 여기에 개시된 핵산 분자는 당업자들로 하여금 SEQ ID NO:2, 4, 6, 8, 10, 12, 14 또는 16을 가지고 있는 단백질과 단백질 군의 다른 구성원들을 인코딩하는 핵산 분자를 분리하는 것을 가능케 한다.
예를 들어, 당업자들은 적당한 세포들로부터 만들어진 발현 라이브러리(expression library)를 선별하기 위한 항체 프로브들을 만들기 위하여 SEQ ID NO: 2, 4, 6, 8, 10, 12, 14 또는 16의 아미노산 서열을 쉽게 이용할 수 있다. 통형적으로, 정제된 단백질(이하에서 설명함) 또는 단일클론 항체를 가진 면역된 토끼와 같은 포유류의 다중클론 항혈청은 다른 단백질 군에 대한 적당한 암호서열을 얻기 위해 포유류의 cDNA나 lambda gtll 라이브러리와 같은 유전자 발현 라이브러리를 탐침하는데 사용될 수 있다. 복제된 cDNA 서열은 융합 단백질로서 발현될 수 있고, 그 자체의 조절 서열로 직접 발현될 수도 있으며, 또한 효소의 발현을 위한 특정 숙주에 적당한 조절 서열을 활용한 구조체에 의해 발현될 수도 있다.
또는, 상기한 암호 서열의 일부가 합성될 수 있고 임의의 포유류의 단백질 군의 일부를 인코딩하는 DNA를 회복하기 위한 탐침으로서 사용될 수도 있다. 약 18 내지 20 개의 뉴클레오티드(6 내지 7개의 아미노산 가닥을 인코딩)를 포함하는 올리고머는 게놈 DNA의 스크리닝에 사용되거나, 엄격한 조건 또는 false positive의 과도한 수준을 제거할 만큼 충분히 엄격한 조건 하에서 혼성화하여 얻은 게놈 DNA 또는 cDNA 라이브러리를 선별하는데 사용된다.
또는, 올리고뉴클레오티드 프라이머 쌍들(pairs)이, 핵산 분자를 인코딩하여 선택적으로 복사하는 PCR에서 사용하기 위하여 준비될 수 있다. 이러한 PCR 프라이머를 사용한 PCR 변성/복원/확장 사이클은 당해 분야에서 잘 알려져 있고, 다른 인코딩 핵산 분자를 분리하는 데에도 쉽게 적용할 수 있다.
단백질 군의 다른 구성원들을 인코딩하는 핵산 분자들은 또한, 다음의 것으로 한정되는 것은 아니지만 PSI-BLAST (Altschul et al. (1997), Nucl. Acids Res. 25: 3389-3402); PHI-BLAST (Zhang et al. (1998), Nucl. Acids Res. 26: 3986-3990), 3D-PSSM (Kelly et al. (2000), J. Mol. Biol. 299: 499-520); 및 other computational analysis methods (Shi et al. (1999), Biochem. Biophys. Res. Commun. 262 : 132-138 및 Matsunami et. al. (2000), Nature 404: 601-604) 등을 포함하는 임의의 유용한 컴퓨팅 방법을 사용하는 기존 게놈 또는 기타 서열 정보에서 확인될 수 있다.
D. 핵산 분자를 포함한 rDNA 분자들
본 발명은 또한 암호 서열을 포함하는 재조합 DNA 분자들(rDNAs)을 제공한다. 여기서, rDNA 분자는 in situ 분자 조작이 행해진 DNA 분자이다. rDNA 분자를 만드는 방법은 당업계에서 공지되어 있으며, 예를 들어, Sambrook et al., 분자 복제-실험실 매뉴얼, 3판., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 2001.을 참조할 수 있다. 바람직한 rDNA 분자에서, 암호 DNA 서열은 발현 조절 서열 및/또는 벡터 서열에 작동 가능하도록 연결되어 있다.
본 발명의 단백질 군 인코딩 서열 중의 하나가 작동 가능하게 연결되어 있는 벡터 및/또는 발현 조절 서열의 선택은, 당업계에 공지되어 있는 바와 같이, 예를 들어, 단백질 발현과 변형될 숙주세포 등 소망하는 기능적 성질에 직접적으로 좌우된다. 본 발명에 의해 의도된 벡터는, 적어도 rDNA 분자에 포함된 구조유전자의 숙주세포로의 복제 또는 삽입과, 바람직하게는 발현을 행할 수 있다.
당업계에 알려진 작동 가능하도록 연결된 단백질 인코딩 서열의 발현을 조절하는 데에 사용되는 발현 조절 물질에는 유도 프로모터, 구성 프로모터, 분비 신호 및 기타 다른 조절물질들이 포함되지만, 이들만으로 한정되는 것은 아니다. 바람직하게는, 유도 프로모터는 숙주세포의 배지에서 영양분에 반응하는 것과 같이 용이하게 조절된다.
하나의 실시예로서, 코딩 핵산 분자를 함유하는 벡터는 그것으로 형질전환된 원핵 생물의 복제단위, 즉, 박테리아 숙주세포와 같은 원핵세포의 숙주세포에서 염색체외적으로 재조합 DNA 분자의 자율증식과 유지를 행할 수 있는 능력을 가진 DNA 서열을 포함한다. 이러한 복제단위는 당업계에 잘 알려져 있다. 또한, 원핵 생물의 복제단위를 가진 벡터는 그의 발현으로 약물 저항성과 같은 탐지 가능한 마커를 전달하는 유전자를 포함한다. 전형적인 박테리아 저항성 유전자는 암피실린(ampicillin), 카나마이신(kanamycin), 클로람페니콜(chloramphenicol) 또는 테트라사이클린(tetracycline)에 대해 저항성을 가진다.
원핵 생물의 복제단위를 가진 벡터는 또한 E. coli와 같은 박테리아 숙주세포에서 암호 유전자 서열의 발현(전사 및 번역)을 조절할 수 있는 원핵 생물 프로모터 또는 박테리오파지 프로모터를 포함한다. 프로모터는 DNA 서열로 이루어져 있으며, RNA 폴리머라아제(RNA polymerase)가 결합하도록 하여 전사(transcription)가 일어나도록 하는 발현 조절 물질이다. 박테리아 숙주에 적합한 프로모터 서열이 본 발명의 DNA 서열의 삽입을 위한 적당한 제한자리(restriction site)를 가진 플라스미드 벡터에 통상적으로 제공되어 있다. 이러한 전형적인 플라스미드 벡터에는 Biorad Laboratories (Richmond, CA)에서 수득 가능한 pUC8, pUC9, pBR322 및 pBR329, Pharmacia (Piscataway, NJ)에서 수득 가능한 pPL 및 pKK223가 있다.
진핵 세포에 적합한 발현 백터, 바람직하게는 척추동물 세포에 적합한 발현 벡터가, 암호 서열을 포함한 rDNA 분자를 형성하기 위해, 사용될 수도 있다. 바이러스 벡터를 포함한 진핵 세포 발현 벡터는 당업계에 널리 알려져 있으며, 여러 상업적인 소스로부터 수득 가능하다. 통상적으로, 이러한 벡터는 바람직한 DNA 단편의 삽입을 위한 적당한 제한자리를 갖고 있다. 이러한 벡터로는 pSVL 과 pKSV-10 (Pharmacia), pBPV-1/pML2d (International Biotechnologies, Inc.), pTDT1 (ATCC, #31255), 및 이하에서 설명되는 pCDM8 및 유사한 진핵 생물 발현 벡터가 있다. 벡터는 필요시에는 조직 특이성 프로모터에 의해 변형될 수도 있다.
본 발명의 rDNA 분자를 제조하는데 사용되는 진핵 세포 발현 벡터는 진핵 세포에서 효과적인 선택 마커, 바람직하게는 약제 저항성 선택 마커를 더 포함할 수 있다. 바람직한 약제 저항성 선택 마커는 네오마이신(neomycin) 저항성에 따라 발현된 유전자인 네오마이신 포스포트랜스퍼라아제(neomycin phosphotransferase (neo) gene)이다(Southern et al. (1982), J. Mol. Anal. Genet. 1: 327-341). 또는, 상기 선택 마커는 별도 플라스미드에 존재할 수 있고, 두개의 벡터가 숙주세포의 동시 감염에 의해 도입되고, 선택 마커에 대한 적당한 시약에서 배양함으로써 분리된다.
E. 외래적으로 공급된 코딩 핵산 분자를 포함하는 숙주세포
본 발명은 또한 본 발명의 단백질을 인코딩하는 핵산 분자로 형질 전환된 숙주세포를 제공한다. 상기 숙주세포는 원핵 세포일 수도 있고, 진핵 세포일 수도 있다. 본 발명의 단백질의 발현에 유용한 진핵 세포는 그 세포주(cell line)가 배양법이나 발현 벡터의 전파 및 유전자 생성물의 발현에 적합하다면 특별히 한정되지 않는다. 바람직한 진핵 숙주세포에는, 효모, 곤충 및 포유류 세포, 바람직하게는 마우스, 쥐, 원숭이 또는 인간 세포주로부터의 척추세포가 포함되지만, 이들로 한정되는 것은 아니다. 바람직한 진핵 숙주세포는 CCL61로서 ATCC로부터 수득 가능한 Chinese hamster ovary (CHO) 세포, CCL61로서 ATCC로부터 수득 가능한 NIH Swiss mouse embryo(NIH/3T3) 세포, baby hamster kidney(BHK) 세포 및 진핵 세포의 조직배양 세포주 등이 포함된다.
임의의 원핵 숙주세포는 본 발명의 단백질을 인코딩하는 rDNA 분자를 발현하는데 사용될 수 있다. 바람직한 원핵 숙주세포는 E. coli이다.
본 발명의 rDNA에 의한 적당한 숙주세포의 형질전환은 사용되는 벡터 및 숙주 시스템의 유형에 통상적으로 좌우되는 공지 방법들에 의해 달성된다. 원핵 숙주세포의 형질전환에 있어서는 전기 천공법(electroporation) 및 염 처리 방법이 주로 사용된다(예를 들어, Cohen et al. (1972), Proc. Natl. Acad. Sci. USA 69 : 2110; 및 Sambrook et al., supra를 참조하라). rDNA를 포함한 벡터에 의한 척추 세포의 형질전환에 있어서는, 전기 천공법, 양이온성 지질 또는 염 처리 방법이 주로 사용되며, 예를 들어 Graham et al. (1973), Virol. 52: 456; Wigler et al. (1979), Proc. Natl. Acad. Sci. USA 76: 1373-1376을 참조할 수 있다.
성공적으로 형질 전환된 세포, 즉, 본 발명의 rDNA 분자를 포함하고 있는 세포는 선택 마커를 통한 분리법을 포함한 공지 방법에 의해 확인될 수 있다. 예를 들어, 본 발명의 rDNA가 도입된 세포는 복제되어 단일 콜로니를 생성할 수 있다. 이들 콜로니로부터의 세포들은 Southern(1975) J. Mol. Biol. 98: 503 또는 Berent et al., (1985) Biotech. 3: 208에 의해 설명된 것과 같은 방법을 이용해, 배양, 분해되고 rDNA의 존재를 위해 그것의 DNA 함유량이 측정되거나, 또는 생성된 단백질이 면역학 방법을 통해 측정될 수 있다.
F. rDNA 분자를 이용한 재조합 단백질의 생산
본 발명은 또한 상기 핵산 분자를 이용하는 본 발명의 단백질을 생산하는 방법을 제공한다. 일반적으로, 단백질의 재조합 형태의 생산은 이하의 단계를 주로 포함한다:
우선, 본 발명의 단백질을 인코딩하는 핵산 분자를 얻는 바, 상기 핵산 분자는 SEQ ID NO: 1, 3, 5, 7, 9, 11, 13 또는 15, 또는 SEQ ID NO: 1의 뉴클레오티드 390-4883 또는 390-4880, 또는 SEQ ID NO: 3의 뉴클레오티드 12-4907 또는 12-4904, 또는 SEQ ID NO: 5의 뉴클레오티드 424-1911 또는 424-1908, 또는 SEQ ID NO: 7의 뉴클레오티드 405-1838 또는 405-1835, 또는 SEQ ID NO: 9의 뉴클레오티드 89-1153 또는 89-1150, 또는 SEQ ID NO: 11의 뉴클레오티드 223-1572 또는 223-1569, 또는 SEQ ID NO: 13의 뉴클레오티드 418-1395 또는 418-1392, SEQ ID NO: 15의 뉴클레오티드 271-1434 또는 271-1431를 포함하는 것으로 구성되거나, 본질적으로 구성되거나 또는 구성되어 있다. 만일 이들 오픈 리딩 프레임(open-reading-frame)으로서의 인코딩 서열이 인트론에 의해 간섭된지 않는다면, 어떠한 숙주에서의 발현에 바로 적합하다.
핵산 분자는, 상기한 바와 같이, 단백질 오픈-리딩-프레임을 포함한 발현 단위를 형성하기 위하여 적당한 조절 서열과 작동 가능하도록 연결되어 있다. 상기 발현 단위는 적당한 숙주를 형질전환하는 데에 사용되고, 형질전환된 숙주는 재조합 단백질의 생산이 가능한 조건 하에서 배양된다. 선택적으로, 재조합 단백질은 배지 또는 세포로부터 분리된다; 불순물에 대해 내성이 있는 특정한 경우에는 단백질의 회수 및 정제는 필요하지 않을 수도 있다.
상기한 과정의 각각은 다양한 방식으로 수행될 수 있다. 예를 들어, 바람직한 암호 서열은 게놈 단편으로부터 얻어져서 적당한 숙주에 직접 사용될 수도 있다. 다양한 숙주에서 작동 가능한 발현 벡터의 형성은 적당한 복제단위와 조절 서열을 이용하여 행해진다. 상기 조절 서열, 발현 벡터 및 형질전환 방법은 유전자 발현에 사용되는 숙주세포의 유형에 좌우되고, 이에 대해서는 상기에서 이미 논의되었다. 적당한 제한자리가, 만일 일반적으로 이용될 수 없다면, 이들 벡터로 삽입할 절단 가능한 유전자를 만들기 위해 암호서열의 말단에 부가될 수 있다. 당업자라면 재조합 단백질을 생산하는 본 발명에 따른 핵산 분자의 이용을 위해 당업계에 알려진 숙주/발현 시스템을 쉽게 적용할 수 있을 것이다.
G. 암 관련 유전자를 인코딩하는 핵산의 발현을 조절하는 물질을 확인하는 방법
본 발명의 또 다른 실시예는 SEQ ID NO: 2, 4, 6, 8, 10, 12, 14 또는 16의 아미노산 서열을 가진 단백질과 같은 본 발명의 단백질을 인코딩하는 핵산의 발현을 조절(modulation)하는 물질의 확인 방법을 제공하는 것이다. 이러한 분석방법은 본 발명에 따른 핵산의 발현 수준에서의 변화를 모니터링하는 가용적인 수단을 이용할 수도 있다. 여기서 물질은, 세포에서 핵산의 발현을 상향(up)- 또는 하향(down-) 조절할 수 있는 능력이 있다면 본 발명에 따른 핵산의 발현을 조절한다고 말한다.
하나의 분석 형태에서, SEQ ID NO: 1의 뉴클레오티드 390-4883, SEQ ID NO: 3의 뉴클레오티드 12-4907, SEQ ID NO: 5의 뉴클레오티드 424-1911, SEQ ID NO: 7의 뉴클레오티드 405-1838, SEQ ID NO: 9의 뉴클레오티드 89-1153, SEQ ID NO: 11의 뉴클레오티드 223-1572, SEQ ID NO: 13의 뉴클레오티드 418-1395, SEQ ID NO: 15의 뉴클레오티드 271-1434 및/또는 5' 및/또는 3' 조절 인자와 분석 융합 파트너로 이루어진 오픈 리딩 프레임 내의 핵산 간에 리포터 유전자(reporter gene) 융합을 포함하는 세포주가 제조될 수 있다. 개똥벌레 루시페라아제 유전자(firefly luciferase gene) 및 클로람페니콜 아세틸트렌스퍼라아제(chloramphenicol acetyltransferase)를 인코딩하는 유전자 등을 포함한 수많은 분석가능한 융합 파트너가 알려져 있으며 쉽게 수득될 수 있다(Alam et al. (1990), Anal. Biochem. 188: 245-254). 그런 다음, 리포터 유전자 융합을 포함하는 세포주를 적당한 조건과 시간에 시험될 물질에 노출시킨다. 실험군과 대조군 사이의 리포터 유전자의 발현상의 차이로서 본 발명에 따른 핵산의 발현을 조절하는 물질을 확인할 수 있다.
또 다른 분석형태로서, SEQ ID NO: 2, 4, 6, 8, 10, 12, 14 또는 16를 가지고 있는 단백질과 같은 본 발명의 단백질을 인코딩하는 핵산의 발현을 조절하는 물질의 능력을 모니터링하는데 사용할 수도 있다. 예를 들어, mRNA 발현은 본 발명에 따른 핵산과의 혼성화를 통해서 직접 확인될 수 있다. 세포주를 적절한 시간과 조건 하에서 시험될 물질에 노출시키고, 전체 RNA 또는 mRNA는 Sambrook et al., Molecular Cloning - A Laboratory Manual, Third Ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 2001에 개시되어 있는 과정과 같은 기본적인 과정에 의해 분리한다.
세포는 인체 조직으로부터 분리된 것, 예를 들어, 암 환자로부터의 생체 조직이나 배양된 세포가 바람직하다. ATCC 유방 관 암종 세포주(ATCC breast ductal carcinoma cell lines) (Catalogue Nos. CRL-2320, CRL-2338, 및 CRL-7345), ATCC 결직장 선암종 세포주(ATCC colorectal adenocarcinoma cell lines) (Catalogue Nos. CCL-222, CCL-224, CCL-225, CCL-234, CRL-7159, 및 CRL-7184) 세포주, ATCC 신장 clear cell 암종 세포주(ATCC kidney clear cell carcinoma cell line) (Catalogue Nos. HTB-46 및 HTB-47), ATCC 신장세포 선암종 세포주(ATCC renal cell adenocarcinoma cell line) (Catalogue Nos. CRL-1611, CRL-1932 및 CRL-1933), ATCC 간세포 암종 세포주(ATCC liver hepatocellular carcinoma cell line) (Catalogue Nos. CRL-2233, CRL-2234, 및 HB-8065), ATCC 폐 선암종 세포주(ATCC lung adenocarcinoma cell line) (Catalogue Nos. CRL-5944, CRL-7380, 및 CRL-5907), ATCC 림프선 선암종 세포주(ATCC lymphoma adenocarcinoma cell line) (Catalogue Nos. CRL-7936, CRL-7264, 및 CRL-7507), ATCC 난소 선암종 세포주(ATCC ovary adenocarcinoma cell line) (Catalogue Nos. HTB-161, HTB-75, 및 HTB-76), ATCC 췌장 선암종 세포주(ATCC pancreas adenocarcinoma cell line) (Catalogue Nos. CRL-1687, CRL-2119, 및 HTP-79), 전립선 선암종 세포주(prostate adenocarinoma cell line) (Catalogue Nos. CRL-1435, CRL-2422, 및 CRL-2220) 및 ATCC 위 선암종 세포주(ATCC gastric adenocarcinoma cell line) (Catalogue Nos. CRL-1739, CRL-1863, 및 CRL-1864)와 같은 세포주가 이용될 수 있다. 또는, 기타 다른 세포나 세포주가 사용될 수도 있다.
상기 물질과 조절 세포에 노출된 세포간의 RNA 발현 정도의 차이를 탐지하기 위한 탐침은 본 발명에 따른 핵산으로부터 준비될 수 있다. 필수적인 것은 아니지만, 매우 엄격한 조건하에서 표적 핵산과만 혼성화하는 탐침을 사용하는 것이 바람직하다. 매우 상보적인 핵산만이 매우 엄격한 조건 하에서 혼성화한다. 따라서, 분석 조건의 엄격성은 두 개의 핵산 가닥 사이에 혼성화하기 위해 존재해야 하는 상보성의 양을 결정한다. 엄격함의 정도는 탐침: 표적 혼성체와 탐침: 비표적 혼성체 간의 안정도의 차이를 최대화하도록 선택되어야 한다.
탐침은 당업계에 공지된 방법을 통하여 본 발명의 핵산으로부터 만들어질 수 있다. 예를 들어, 탐침의 G+C 함량과 탐침 길이는 표적 서열에 대한 탐침 결합에 영향을 줄 수 있다. 탐침 특이성을 최적화하는 방법은 일반적으로 Sambrook et al., supra, 또는 Ausubel et al., Short Protocols in Molecular Biology, Fourth Ed., John Wiley & Sons, Inc., New York, 1999에서 얻을 수 있다.
혼성화 조건은, Sambrook et al. and Ausubel et al.에 의해 기재된 방법과 같은 공지 방법을 이용하여 각 탐침의 요건에 따라 조절된다. 세포성 RNA 전체 또는 polyA RNA가 풍부한 RNA의 혼성화는 임의의 방법으로 수행될 수 있다. 예를 들어, 전체 세포성 RNA 또는 polyA RNA가 풍부한 RNA가 고체 지지체에 고정될 수 있고, 상기 고체 지지체는 탐침이 특이적으로 혼성화하는 상태하에서 본 발명에 따른 서열의 적어도 하나 또는 그것의 일부에 노출되어 있다. 또는, 본 발명에 따른 서열의 적어도 하나 또는 그것의 일부를 포함하는 것으로 구성된 핵산 단편이 실리콘 칩이나 다공질 유리 웨이퍼 또는 막과 같은 고체 지지체에 고정될 수 있다. 그러한 고체 지지체는 부착된 서열이 특이적으로 혼성화하는 조건하에서 샘플의 전체 세포성 RNA 또는 polyA RNA가 풍부한 RNA에 노출될 수 있다. 이러한 고체 지지체와 혼성화 방법은, 예를 들어, Beattie, (1995) WO 95/11755에 의해 개시된 것과 같이 널리 얻어질 수 있다. 처리되지 않은 세포 개체군과 상기 물질에 노출된 세포 개체군에서 유래된 RNA 샘플에 대해 주어진 탐침이 특이적으로 혼성화하는 능력을 시험함으로써, SEQ ID NO: 2, 4, 6, 8, 10, 12, 14 또는 16의 서열을 가지고 있는 단백질을 인코딩하는 핵산의 발현을 상향- 또는 하향-조절하는 물질이 확인된다.
mRNA의 질적 및 양적 분석에 대한 혼성화는 RNase Protection Assay를 이용하여 또한 수행할 수 있다(i.e., RPA, see Ma et al. (1996), Methods 10: 273-238). 간단히 말하면, 유전자 생성물을 인코딩하는 cDNA와 RNA 폴리머라아제 프로모터(e.g., T7, T3 또는 SP6 RNA polymerase)에 의존적인 파지 특이적 DNA를 포함하는 것으로 구성된 발현 매체는 cDNA 분자의 3' 말단에서 선형화되고, 파지 프로모터의 흐름에 따라 이러한 선형화된 분자는 in vitro 전사에 의해 cDNA의 표지 안티센스 전사체의 합성을 위한 주형으로 사용된다. 그런 다음, 표지 전사체는 80% 포름아미드(formamide), 40 mM Pipes, pH 6.4, 0.4 M NaCl 및 1 mM EDTA를 포함하는 것으로 구성된 완충액에서 45℃로 하룻밤 동안 배양함으로서 분리 RNA의 혼합물(전체 또는 단편화된 mRNA)에 혼성화 된다. 그런 다음, 결과적인 혼성체는 40 ㎍/ml 리보뉴클라아제 A(ribonuclease A)와 2 ㎍/ml 리보뉴클라아제(ribonuclease)를 포함하는 것으로 구성된 완충액에서 분해된다. 외부 단백질의 비활성화 및 추출 후, 분석을 위해 샘플을 요소/폴리아크릴아미드 겔상에 올려진다.
또 다른 분석방법에서, 유전자 생성물의 발현에 영향을 주는 물질을 확인하기 위하여, 우선 생리학적으로 본 발명의 유전자 생성물을 발현하는 세포 또는 세포주가 확인된다. 이렇게 확인된 세포 및/또는 세포주는, 전사기구의 적합한 조정이 적절한 표면 형질도입 메커니즘 및/또는 세포 기질의 케스케이드(cascade)와 물질의 세포외적 접촉을 유지하기 위하여 필수적인 세포기구를 포함하는 것으로 구성되었다고 여겨진다. 또한, 이러한 세포나 세포주는 하나 또는 그 이상의 항원 단편과 결합된 유전자 생성물을 인코딩하는 구조 유전자의 작동 가능한 비번역 5' 프로모터 말단을 포함하는 것을 특징으로 하는 발현 기구(예를 들어, 플라스미드 또는 바이러스형 벡터) 구조체로 형질도입되거나 감염되기도 하며, 이것은 상기 유전자 생성물에서 특별한 것으로서, 상기 단편은 상기 프로모터의 전사 조절을 받고, 그 분자량이 천연 폴리펩티드와 구별되거나 면역학적 독특한 표지나 검출할 수 있는 표지를 포함하는 것으로 구성된 폴리펩티드로서 발현된다.이러한 과정은 당업계에 널리 알려져 있다(Sambrook et al., supra참조).
그런 다음, 위에서 설명된 바와 같은 형질도입 또는 감염된 세포 또는 세포주는 적당한 조건 하에서 물질과 접촉된다. 예를 들어, 약제학적으로 적합한 부형제 내의 물질은 생리적 pH에서 phosphate buffered saline(PBS), Eagles balanced salt solution (BSS), 혈청을 포함하는 것으로 구성된 PBS 또는 BSS 또는 37℃에서 PBS 또는 BSS 및/또는 혈청을 포함하는 것으로 구성된 성장조절 배지와 같은 수용성의 생리학적 완충액에서 세포와 접촉한다. 상기 조건은 필요시에는 당업자에 의해 조정될 수도 있다. 상기와 같이 세포와 물질이 접촉한 다음, 상기 세포는 분쇄되고, 그 여액의 폴리펩티드는 분획되어 폴리펩티드 분획을 모와 항체와 접촉시켜서 면역학적 분석(예를 들어, ELISA, immunoprecipitation 또는 Western blot)에 의해 더 처리된다. "물질-접촉(agent-contacted)" 샘플로부터 분리된 단백질 풀(pool)은 부형제 만이 세포와 접촉한 대조군과 비교되고, 대조군과 비교하여 "물질-접촉" 샘플로부터의 면역학적으로 생성된 신호가 상기 물질의 효과를 구별하는데에 사용될 것이다.
H. 암 관련 단백질의 수준이나 적어도 하나의 활성을 조절하는 물질을 확인하는 방법
본 발명의 또 다른 실시예는 EQ ID NO: 2, 4, 6, 8, 10, 12, 14 또는 16의 아미노산 서열을 가진 단백질과 같은 본 발명의 단백질의 수준이나 적어도 하나의 활성을 조절하는 물질을 확인하는 방법을 제공하는 것이다. 이러한 방법 또는 분석은 바람직한 활성을 모니터링하고 검출하는 수단을 이용할 수 있으며, 특히 암을 치료하는 물질을 확인하는 데에 유용하다.
하나의 형태에서, 비노출 대조군 세포군체에 비교하여 시험될 물질에 노출된 세포군체 간의 본 발명의 단백질의 상대적인 양을 분석할 수 있다. 이 형태에서, 특정 항체와 같은 탐침이 다른 세포군체에서 단백질의 특징적인 발현을 모니터링하는 데에 사용된다. 세포주 또는 세포군체는 적당한 조건과 시간에 시험 물질에 노출된다. 세포 여액은 노출된 세포주나 세포군체 및 노출되지 않은 세포주나 세포군체인 대조군으로부터 제조될 수 있다. 그런 다음, 상기 세포 여액은 탐침으로 분석된다.
항체 탐침은, 그들이 충분한 길이를 가지고 있거나, 또는 필요하거나, 또는 면역력을 증가시키는 데에 필요하거나, 적당한 담체와 접합한다면, 본 발명의 펩티드, 폴리펩티드 또는 단백질을 이용한 적절한 면역 프로토클에서 적당한 포유류 숙주를 면역화시켜 제조될 수 있다. BSA, KLH 또는 기타 담체 단백질과 같은 담체를 가진 면역학적 접합체를 제조하는 방법은 당업계에 널리 알려져 있다. 몇몇 경우에는, 예를 들어, 카르보디이미드 시약을 사용하는 직접 접합체를 사용하는 것이 유용하다; 다른 경우에는, Pierce Chemical Co.(Rockford, IL)에서 공급되는 것과 같은 결합제가 합텐(hapten)에 접속력(accessibility)을 부여하여 바람직할 수 있다. 합텐 펩티드는, 예를 들어, 담체에 대한 결합을 촉진하기 위하여, 시스테인 잔기를 가지고 아미노 또는 카르복시 말단에서 확장되거나 또는 시스테인 잔기를 가지고 산재될 수 있다(interspersed). 면역원의 투약은, 당업계에서 전반적으로 이해되고 있는 바와 같이, 일반적으로 적절한 시기에 적합한 보조제를 사용하여 주사하는 방법으로 행한다. 면역화 과정 동안에, 항체의 역가(titer)가 항체 형성의 적합성을 결정하는데 취해진다.
이러한 방식으로 만들어진 다중클론 항형청은 어떤 경우에는 만족스러울 수 있는 반면에, 약제학적인 조성에 따라서는 단일클론 항혈청이 바람직한 경우도 있다. 소망하는 단일클론 항혈청을 분비하는 면역화된 세포주는 Kohler and Milstein((1975) Nature 256: 495-497)의 표준 방법이나, 일반적으로 알려져 있는 바와 같이 림프구 또는 비장 세포의 영구화(불멸화)에 영향을 주는 변형 방법을 이용하여 제조될 수 있다. 소망하는 항체를 분비하는 영구 세포주는 항원이 펩티드 헵텐, 폴리펩티드 또는 단백질인 면역 분석법에 의해 스크리닝된다. 바람직한 항체를 분비하는 적절한 영구 세포 배양물이 확인될 때, 세포는 in vitro 또는 복수액에서의 생성에 의해 배양될 수 있다.
그런 다음, 소망하는 단일클론 항체는 배양 상층액 또는 복수 상층액으로부터 회수될 수 있다. 면역학적으로 중요한(항원이 결합된) 부분을 포함한 단일클론 항체의 또는 다중클론 항혈청의 단편들은 완전한 항체 뿐만 아니라, 길항제로서 이용될 수 있다. 특히 치료분야에서, Fab, Fab 또는 F(ab )2 단편과 같은 면역학적 활성인(항원이 결합된) 항체 단편들의 활용은 일반적으로 전체 면역 글로불린보다 면역성이 덜 생기게 한다.
재조합 수단에 의한 현재 기술을 이용하여 항체 또는 항원 결합 단편들을 생성할 수도 있다. 단백질의 소망하는 부위에 특이적으로 결합하는 항체 부위는 인간 항체와 같이 다중 종 기원의 키메라의 상황에서도 생성될 수 있다.
상기 방법에서 분석되는 물질은 무작위로 선택될 수도 있고, 합리적으로 선택되거나 디자인될 수도 있다. 여기서, 물질은, 상기 물질이 단독으로 또는 결합된 기질이나 결합 파트너 등과 함께 본 발명의 단백질의 결합에 관여하는 특이적인 서열을 고려하지 않고 임의적으로 선택될 때 무작위로 선택된다(randomly selected)고 말한다. 무작위로 선택된 물질의 예는, 화학적 라이브러리, 펩티드 조합성 라이브러리 또는 유기체의 성장 배양액을 이용하는 것이다.
여기서, 물질은, 상기 물질이 물질의 활동과 관련하여 표적부위 및/또는 그의 형태의 서열을 고려하는 비무작위 기반하에 선택될 때 합리적으로 선택되거나 디자인된다(rationally selected or designed)고 말한다. 이러한 표적부위를 형성하는 펩티드 서열을 이용함으로써 물질을 합리적으로 선택하거나 디자인할 수 있다. 예를 들어, 합리적으로 선택된 펩티드 물질은 그의 아미노산 서열이 어떠한 기능적 공통 자리에 동일하거나 그것의 유도체인 펩티드일 수 있다.
예를 들어, 본 발명에 따른 물질은, 탄수화물 뿐만 아니라 펩티드, 소분자, 비타민 유도체가 될 수도 있다. 주요 음성 단백질, 이러한 단백질들을 인코딩하는 DNA들, 이러한 단백질들에 대한 항체, 이러한 단백질의 펩티드 단편 또는 이들 단백질 유사체가 기능을 수행하기 위해 세포 속으로 도입될 수 있다. 여기서 "유사체(mimic)"란, 기초가 된 단백질과는 화학적으로 다르지만, 물체 표면의 정밀 X선 사진이나 기능적으로는 이들과 유사한 구조를 가지는 단백질 분자의 한 부분 또는 그 이상의 부분이 변형된 것을 의미한다(Grant in: Molecular Biology and Biotechnology, Meyers, ed., pp. 659-664, VCH Publishers, Inc., New York, 1995 참조). 당업자라면 본 발명의 물질의 구조적 성질에 어떠한 제한도 없음을 쉽게 알 수 있을 것이다.
본 발명의 펩티드 물질은 당업계에 알려진 바와 같이, 표준 고체상(또는 액체상) 펩티드 합성법을 이용하여 제조될 수 있다. 또한, 이러한 단백질을 인코딩하는 DNA는 상업적으로 수득 가능한 올리고뉴클레오티드 합성 장치를 사용하여 합성하고, 표준 재조합 생산 시스템을 이용하여 재조합 생산이 가능하다. 고체상 펩티드 합성을 이용한 생산은 유전자가 인코딩되지 않은 아미노산이 포함된 경우라면 필수적이다.
본 발명에 따른 물질의 또 다른 종류는, 예를 들어 세포질 도메인(cytoplasmic domain), 간극 도메인(spacer domain), α-나선 와권상 나선 도메인(α-helical coiled-coil domain) 또는 수용체 도메인(receptor domain)과 같은 면역학적으로 활성인 항체이다. 항체 물질은 항체에 의해 표적화되도록 의도된 단백질 부위인 항원 부위를 포함하고 있는 펩티드를 가지고 적당한 포유류를 면역화함으로 얻어진다.
I. 암 관련 단백질의 발현 또는 한가지 이상의 활성을 조절하는 물질의 활용
실시예에 제공된 바와 같이, SEQ ID NO: 2, 4, 6, 8, 10, 12, 14 또는 16의 핵산 서열을 가진 단백질과 같은 본 발명의 단백질과 핵산은 암 조직에서 다르게 발현된다. 길항제 또는 저해제와 같은 단백질 또는 단백질의 적어도 하나의 활성의 발현을 상향- 또는 하향-조절하거나 변형하는 물질은 단백질의 기능 및 활성과 관련된 생물학적 및 병리학적 과정을 조절하는 데에 이용될 수 있다. 여기에는 본 발명의 동종체(homologues) 및 유사체(analogues)를 사용하는 것으로 확인된 물질도 포함된다.
여기서, 본 발명의 단백질에 의해 조절되는 병리학적 또는 생물학적 과정의 변형이 요구되는 포유동물 이라면 어떠한 포유동물이라도 본 발명의 대상이 될 수 있다. 용어 "포유동물"이란 포유류 강에 속하는 개체를 의미한다. 본 발명은 특히 인간의 치료에 유용하다.
병리학적 과정은 유해한 결과를 초래하는 생물학적 과정의 범주를 의미한다. 예를 들어, 본 발명의 단백질의 발현은 세포성장과 과형성(hyperplasia)과 관련될 수 있다. 상기한 물질이 과정의 정도 또는 심각성을 줄인다면 이 물질은 병리학적 과정을 조절한다고 할 수 있다. 그러한 예로, 어떠한 방식으로든 본 발명의 단백질의 적어도 하나의 활성의 발현을 상향- 또는 하향-조절하거나 변화시키는 물질을 투여함으로써 암을 막거나 질병의 전파를 막을 수 있다.
본 발명의 물질은 단독으로 또는 특정한 병리학적 과정을 조정하는 다른 물질과 함께 제공될 수 있다. 예를 들어, 본 발명의 물질은 기타 다른 공지 약물과 함께 투여될 수 있다. 상기한 바와 같이, 두 가지의 물질은 동시에 작용할 수 있는 방식으로 동시에 또는 독립적인 방법으로 투여될 수 있다.
본 발명의 물질은 비경구적으로 투여되거나, 피하, 정맥, 근육, 복강을 통해 투여되거나, 피부에 바르거나 구강을 통해 투여될 수 있다. 당업계의 기술 내에서 개인에 따른 각 성분의 효율적인 양의 범위는 다양하게 정해질 필요가 있다. 기준 투여량은 체중에 대해0.1 내지 100 ㎍/kg이 바람직하다. 더욱 바람직하게는 0.1 내지 10 ㎍/kg, 가장 바람직하게는 0.1 내지 1 ㎍/kg을 투여하는 것이다.
또한, 본 발명의 구성 성분인 약리학적 활성 물질은 활성성분이 활성자리로 전달되도록 하기 위해 약리학적으로 이용할 수 있도록 준비하는 과정을 촉진하는 부형제 및 보조제를 포함하는 것으로 구성된 적절한 약리학적 담체를 포함할 수도 있다. 비경구형 투여를 위한 적합한 제형에는 수용성 염과 같은 수용성 형태의 활성 성분이 용해된 수용액을 포함한다. 또한, 적절한 유성 투여 현탁액으로서 활성 성분의 현탁액이 투여될 수도 있다. 적당한 친유성 용매 또는 비히클은 참기름 또는 에틸 올레인산(ethyl oleate)이나 트리글리세리드(triglyceride)와 같은 합성 지방산 에스테르와 같은 지방 지질을 포함한다. 수용성 투여 현탁액은 소디움 카르복시메틸 셀룰로오스(sodium carboxymethyl cellulose), 소르비톨(sorbitol), 및/또는 덱스트란(dextran)과 같은 현탁액의 점도를 증가시키는 물질을 포함할 수도 있다. 또한, 현탁액은 안정제를 포함할 수도 있다. 리포좀은 상기 물질을 세포로 전달하기 위해 켑슐화하는 데에 사용되기도 한다.
본 발명에 따른 전신 투여를 위한 약제학적 제형은 장내 투여, 비경구 투여, 국부적인 투여를 위해 제형화 될 수 있다. 사실상, 상기한 제형의 세가지 형태는 활성 성분의 전신 투여를 달성하기 위해 동시에 이용될 수도 있다.
경구 투여를 위하여 적당한 제형은 강성 또는 연성 젤라틴 캡슐, 환제 및 코팅된 정제, 강장제, 시럽 또는 흡입제 및 이들의 분비가 조절된 형태의 정제를 포함한다.
본 발명의 방법을 실행함에 있어서, 본 발명의 화합물은 단독 또는 다른 치료용 또는 진단용 물질과 함께 투여될 수 있다. 바람직한 예에서, 본 발명의 화합물은 일반적인 의학 실험에 따라 이러한 조건에서 통상적으로 처방되는 다른 성분과 함께 투여될 수 있다. 본 발명에 따른 화합물은 인간, 양, 말, 소, 돼지, 개, 고양이, 쥐, 마우스와 같은 포유동물의 생체내 또는 생체외에서 사용될 수 있다.
J. 결합 파트너를 확인하는 방법
본 발명의 또 다른 실시예는 본 발명의 단백질의 결합 파트너(binding partner)를 분리하고 확인하는 방법을 제공하는 것이다. 일반적으로, 본 발명의 단백질은 본 발명의 단백질과 잠재적인 결합 파트너 사이의 결합(association)이 가능한 조건 하에서 세포의 잠재적인 결합 파트너, 추출물(extract) 또는 분획(fraction)과 혼합되어 있다. 혼합 후에, 본 발명의 단백질과 관련되는 펩티드, 폴리펩티드, 단백질 또는 기타 다른 분자들은 혼합물로부터 분리된다. 그런 다음, 본 발명의 단백질과 결합하는 결합 파트너는 제거되고 더 분석될 수 있다. 결합 파트너를 확인하고 분리하기 위하여 전체 단백질, 예를 들어 SEQ ID NO: 2, 4, 6, 8, 10, 12, 14 또는 16의 전체 아미노산 서열을 포함하는 것으로 구성된 단백질이 사용될 수 있다. 또는, 단백질의 분획이 사용될 수도 있다.
여기서, 세포 추출물은 용해 또는 분쇄된 세포로부터 만들어진 제조물 또는 분획을 의미한다. 세포 추출물로서 바람직한 원료는 인간 종양으로부터 유래한 세포나 종양의 생체 조직 또는 조직 배양을 통해 형질전환된 세포일 것이다. 또는, 세포성 추출물은 정상 조직이나 이용 가능한 세포주로부터도 얻을 수도 있다.
상기 세포의 추출물을 얻는 방법은 다양하다. 세포는 물리적 또는 화학적 방법을 통해 분쇄될 수 있다. 물리적 분쇄 방법의 예는 음파처리 또는 기계적 전단 방법이 포함되지만 이로 한정되는 것은 아니다. 화학적 용해 방법의 예로는 세제 용해 및 효소 용해가 있지만, 이들로 한정되는 것은 아니다. 당업자라면 이러한 방법을 활용하여 추출물을 쉽게 얻을 수 있을 것이다.
일단 세포 추출물이 준비되면, 결합 파트너와 단백질이 결합할 수 있는 조건 하에서 상기 추출물은 단백질과 혼합된다. 다양한 조건들이 사용될 수 있으며, 인간 세포의 원형질에 발견되는 조건을 매우 닮은 조건이 가장 바람직하다. 삼투압, pH, 온도, 사용한 세포 추출액의 농도와 같은 특징은 결합 파트너와 단백질의 결합을 최적화하기 위해 다양하게 조절할 수 있다.
적절한 조건 하에서 혼합한 다음, 결합 복합체(bound complex)는 혼합액으로부터 분리된다. 혼합물의 분리에는 다양한 기술이 사용될 수 있다. 예를 들어, 본 발명의 단백질에 특이적인 항체가 결합 파트너 복합체를 면역침전(immunoprecipitate)하는 데에 사용될 수 있다. 또는, 크로마토그래피나 밀도/침전 원심분리와 같은 기본적인 화학 분리 기술이 사용될 수도 있다.
추출물에 있는 비결합 세포 성분을 제거한 후에, 결합 파트너는 통상의 방법으로 복합체로부터 분리될 수 있다. 예를 들어, 상기 분리는 혼합물의 염 농도나 pH를 변화시켜서 수행할 수 있다.
혼합 추출액으로부터 결합 파트너를 분리하는 것을 돕기 위해, 본 발명의 단백질을 고체 지지체에 고정시킬 수 있다. 예를 들어, 단백질은 니트로셀룰로오스 기질(nitrocellulose matrix)이나 아크릴 비드(acrylic beads)에 부착시킬 수 있다. 단백질을 고체 지지체에 부착시키는 것은 추출물에 존재하는 성분으로부터 펩티드/결합 파트너를 분리하는 것을 도와 준다. 확인된 결합 파트너는 단독 단백질 또는 둘 또는 그 이상의 단백질의 복합체일 수 있다. 또한, 결합 파트너는 Takayama et al. (1997), Methods Mol. Biol. 69: 171-184 또는 Sauder et al. (1996), J. Gen. Virol. 77: 991-996의 과정을 따라 Far-Western assay를 사용하거나 또는 말단에 에피톱이 부착된 단백질(epitope tagged proteins)이나 GST 융합 단백질(GST fusion proteins)을 이용하여 확인할 수 있다.
또한, 본 발명에 따른 핵산 분자는 yeast two-hybrid system이나 기타 생체내 단백질-단백질 검출 시스템에 사용될 수 있다. yeast two-hybrid system은 다른 단백질 파트너 쌍들을 확인하는데 사용되어 왔으며, 본 명세서에 기재되어 있는 핵산 분자들을 사용하는데 손쉽게 적용될 수 있다.
K. 암 관련 단백질의 결합 파트너의 이용
상기 방법으로 얻어진 본 발명의 단백질의 결합 파트너와 그 동종체 및 유사체는 일단 분리되고 나면, 다양한 용도로 사용될 수 있다. 상기 결합 파트너는 당업계에서 알려진 기술을 이용하여 그 자신에 결합하는 항체 생산에 이용될 수 있다. 결합 파트너에 결합하는 항체들은 본 발명의 단백질의 활성을 분석하는데 이용되거나, 본 발명의 단백질이 관여하는 생물학적 또는 병리학적 과정을 조절하는 치료 물질로 이용되거나 또는 결합 파트너를 정제하는데 이용될 수 있다. 이하 상기 용도를 자세히 설명한다.
L. 암 관련 단백질과 결합 파트너 간의 상호 작용을 막는 물질을 동정하는 방법
본 발명의 또 다른 실시예는 본 발명 단백질과 그 결합 파트너 간의 결합을 막거나 또는 줄여주는 물질을 확인(동정)하는 방법을 제공한다. 본 발명 단백질 중 하나를 테스트하고자 하는 물질의 존재 및 부재 상태에서 결합 파트너와 혼합한다. 단백질이 결합할 수 있는 조건 하에서 혼합한 다음, 상기 두 혼합물을 분석 비교하면 상기 테스트 물질이 본 발명의 단백질과 결합 파트너 간의 결합을 줄이거나 막는지를 알 수 있다. 테스트 물질을 함유한 샘플에 존재하는 결합량이 줄었다면, 테스트 물질이 본 발명의 단백질과 결합 파트너간의 결합을 줄이거나 막는 물질이라고 판단할 수 있다.
여기서, 물질은, 그것의 존재 시에 결합 파트너가 본 발명 단백질과 결합하는 현상이 방지되거나 어느 정도 줄어든다면, 본 발명 단백질과 그 결합 파트너간의 결합을 줄이거나 막는다고 말한다. 어떤 종류의 물질들은 결합 파트너에 결합함으로써 상기 결합을 줄이거나 막고, 또 다른 종류의 물질들은 본 발명의 단백질에 결합함으로써 상기 결합을 줄이거나 막을 것이다.
상기 분석에서 사용된 결합 파트너는 분리되어 완전히 특징이 밝혀진 단백질이거나 본 발명 단백질과 결합된 부분적으로 특징이 밝혀진 단백질 또는 세포 추출물에 존재하는 상태로 동정된 결합 파트너일 수 있다. 상기 결합 파트너가, 예를 들어, 분자량 등 확인가능한 특성에 의해 특징지어지는 한, 본 분석법이 사용될 수 있음은 당업자에게 자명할 것이다.
상기에서 분석된 물질은 무작위로 선택될 수도 있고, 합리적으로 선택되거나 디자인될 수도 있다. 여기서, 물질은, 그것이 본 발명의 단백질과 결합 파트너와의 결합에 관련된 특정 서열을 고려함이 없이 무작위로 선택될 때 무작위로 선택된다고 말한다. 이렇게 무작위로 선택된 물질의 예로는, 화학적 라이브러리, 펩티드 조합 라이브러리 또는 유기체의 성장 배양액을 이용하는 것이다.
여기서, 물질은, 그것의 작용과 관련된 표적부위 및/또는 그 입체형태를 고려해서 비무작위성 기반하에 선택될 때 합리적으로 선택되거나 디자인된다고 말한다. 본 발명의 단백질과의 결합 위치를 구성하는 결합 파트너의 펩티드 서열을 이용함으로써 상기 물질을 합리적으로 선택하거나 디자인 할 수 있다. 예를 들어, 합리적으로 선택되거나 디자인된 물질은 결합 파트너 상의 본 발명의 단백질의 결합 위치와 동일한 아미노산 서열을 가진 펩티드를 가질 수 있다. 이러한 물질은 결합 파트너에 결합함으로써 본 발명 단백질과 결합 파트너의 결합을 줄이거나 막을 것이다.
본 발명의 물질은, 예를 들어, 탄화수소들 뿐만 아니라 펩티드, 소분자, 비타민 유도체 등일 수 있다. 당업자는 본 발명에 따른 상기 물질의 구조적 성질에 제한이 없음을 쉽게 인식할 수 있다.
본 발명에 따른 물질들 중의 하나는 아미노산 서열이 본 발명 단백질의 아미노산 서열에 기초해서 선택된 펩티드 물질이다. 본 발명의 펩티드 물질은 당업계에 공지되어 있는 바와 같은 표준 고체상(또는 용액상) 펩티드 합성 방법으로 제조될 수 있다. 또한, 이러한 펩티드를 인코딩하는 DNA는 상업적으로 수득 가능한 올리고뉴클레오티드 합성 장치를 이용해서 합성될 수 있고 표준 재조합 생산 시스템을 이용하여 재조합적으로 제조될 수 있다. 고체상 펩티드 합성을 이용한 생산은 유전자가 인코딩되지 않은 아미노산이 포함된 경우라면 필수적이다.
본 발명에 따른 물질 중의 또 다른 경우는 본 발명의 단백질이나 결합 파트너의 임계 위치(critical position)와 면역 반응성을 갖는 항체들이다. 상기에서 설명한 바와 같이, 이들 항체는 본 발명 단백질이나 그 결합 파트너의 일부를 항원성 부분으로 가지고 있는 펩티드와 적당한 포유동물 객체의 면역화에 의해 얻어진다. 임계 부위는 본 발명의 단백질과 그 결합 파트너의 결합에 관련된 결합 위치를 포함한다.
이하에서 설명하는 바와 같이, 항체 물질은 항체에 의해 표적화 되고 본 발명의 단백질 또는 결합 파트너의 일부인 항원영역을 함유하는 펩티드를 갖는 적당한 포유류의 면역화에 의해 얻어진다. 임계영역(critical regions)은 본 발명의 단백질과 결합 파트너의 결합에 관여하는 접촉위치를 포함한다.
이하에서 설명하는 바와 같이, 본 발명의 단백질의 활성에 관련된 잔기의 중요한 최소 서열은 잠재적인 관련 분자들의 two hybrid screening과 동정의 미끼(bait)로서 효과적으로 이용할 수 있는 기능적 선형 도메인을 정의한다. 이러한 단편들의 사용은 전체 분자를 사용할 때와 비교하여 스크리닝의 특이성을 상당히 증가시킬 것이므로 바람직하다. 유사하게, 이런 선형 서열은 생화학적 친화도 정제법(biochemical affinity purification strategy)으로 결합 단백질을 분리할 때 친화 기질(affinity matrix)로도 사용될 수 있다.
M. 암 관련 단백질과 결합 파트너 사이의 결합을 막는 물질의 이용
실시예에 나타낸 바와 같이, SEQ ID NO: 2, 4, 6, 8, 10, 12, 14 또는 16의 아미노산 서열을 가진 단백질과 같은 본 발명의 단백질과 핵산은, 암 조직 내에서 다르게 발현된다. 동종체나 유사체를 이용하여 확인된 것들을 포함하여 본 발명의 단백질과 그 결합 파트너와의 상호 작용을 줄이거나 막는 물질은 본 발명 단백질의 작용과 활성과 연관된 생물학적 및 병리학적 치료들을 조절하는데 사용될 수 있다.
여기서, 객체(subject)는 본 발명의 단백질에 의해 조절되는 병리학적 또는 생물학적 과정의 조절이 요구되는 포유동물 이라면 어떠한 포유동물일 수 있다. 용어 "포유동물"이란 포유류 강에 속하는 개체를 의미한다. 본 발명은 특히 인간의 치료에 유용하다.
병리학적 과정이란 유해 결과를 초래하는 생물학적 과정의 범주를 의미한다. 예를 들어, 본 발명의 단백질의 발현은 세포성장과 과형성(hyperplasia)과 관련될 수 있다. 여기서, 물질은, 그것이 과정의 정도 또는 심각성을 줄일 때, 병리학적 과정을 조절한다고 말하게 된다. 그러한 예로, 본 발명의 단백질과 결합 파트너의 상호작용을 줄이거나 막는 물질을 투여함으로써 암을 막거나 질병의 전파를 막을 수 있다.
본 발명에 따른 물질은 비경구적으로 투여되거나, 피하, 정맥, 근육, 복강을 통해 투여되거나, 피부에 바르거나 구강을 통하여 투여될 수 있다. 택일적으로 또는 동시에 구강을 통한 투여될 수도 있다. 투여량은 환자의 나이, 건강, 체중, 동시 치료의 종류, 치료의 횟수 및 소망하는 효과의 특성에 따라 결정될 것이다.
본 발명은 또한 본 발명의 단백질과 결합 파트너의 결합을 막는 하나 또는 그 이상의 물질을 포함한 조성물을 제공한다. 당업계의 기술 내에서 개인에 따른 각 성분의 효율적인 양의 범위는 다양하게 정해질 필요가 있다. 기준 투여량은 체중에 대해0.1 내지 100 ㎍/kg이 바람직하다. 더욱 바람직하게는 0.1 내지 10 ㎍/kg, 가장 바람직하게는 0.1 내지 1 ㎍/kg을 투여하는 것이다.
약리학적 활성 물질은 활성성분 이외에, 본 발명의 조성물은 활성자리로의 전달에 약리학적으로 사용될 수 있도록 준비하는 과정으로 활성 화합물을 처리하는 것을 촉진하는 부형제 및 보조제를 포함하는 것으로 구성된 적절한 약리학적 담체를 포함할 수도 있다. 비경구형 투여를 위한 적절한 제형은 수용성 염과 같은 수용성 형태의 활성 성분이 용해된 수용액을 포함한다. 또한, 적절한 유성 주사 현탁액으로서 활성 성분의 현탁액이 투여될 수도 있다. 적당한 친유성 용매 또는 비히클은 참기름 또는 에틸 올레인산(ethyl oleate)이나 트리글리세리드(triglyceride)와 같은 합성 지방산 에스테르와 같은 지방 지질을 포함한다. 수용성 주사 현탁액은 소디움 카르복시메틸 셀룰로오스(sodium carboxymethyl cellulose), 소르비톨(sorbitol), 및/또는 덱스트란(dextran)과 같은 현탁액의 점도를 증가시키는 물질을 포함할 수도 있다. 또한, 현탁액은 안정제를 포함할 수도 있다. 리포좀은 상기 물질을 세포로 전달하기 위해 켑슐화하는 데에 사용되기도 한다.
본 발명에 따른 전신 투여용 약제 제형은 장내 투여, 비경구 투여, 국부적인 투여를 위해 제형화될 수 있다. 사실상, 상기한 제형의 세가지 형태는 활성 성분의 전신 투여를 달성하기 위해 동시에 이용될 수도 있다.
경구 투여를 위한 적당한 제형은 강성 또는 연성 젤라틴 캡슐, 환제 및 코팅된 정제, 강장제, 시럽 또는 흡입제 및 이들의 분비가 조절된 형태의 정제를 포함한다.
본 발명에 따른 방법을 실행함에 있어서, 본 발명의 화합물은 단독 또는 다른 치료용 또는 진단용 물질과 함계 사용될 수 있다. 하나의 바람직한 예에서, 본 발명의 화합물은 일반적으로 받아들여지는 의학 실시에 따라 이러한 조건에서 통상적으로 처방되는 다른 성분과 함께 투여될 수 있다. 본 발명에 따른 화합물은 인간, 양, 말, 소, 돼지, 개, 고양이, 쥐, 마우스와 같은 포유동물의 생체내 또는 생체외에서 사용될 수 있다.
N. 합리적 약제 디자인과 조합 화학
본 발명은 또한 합리적 약제 디자인과 조합 화학도 포함하고 있다. 당업자들은 암 치료용으로 개발될 수 있는 화합물을 확인하는 데에 본 발명의 측면들을 활용하고 사용하는 적절한 방법들을 인식할 것이다. 폴리펩티드를 포함하는 합리적 약제 디자인은 디자인된 약이 상호작용 하게 될 첫번째 펩티드를 확인하고 정의하는 것과, 두 번째 펩티드의 요건을 정의하기 이하여 첫 번째 타겟 펩티드를 이용하는 것을 필요로 한다. 이렇게 정의된 요건을 가지고, 당업자는 정해진 모든 요건을 만족하는 하나의 적당한 펩티드 또는 비(非)펩티드를 찾거나 준비할 수 있다. 따라서, 합리적 약제 디자인의 하나의 목표는 다소간 효과 있는 리간드 형태의 약을 만들기 위해서 작용하는 생물학적으로 활성화된 폴리펩티드나 또는 이들이 상호작용 하는 작은 분자들(예를 들어, 작용물질, 길항제, null compounds)의 구조적 또는 기능적 유사체를 생산하는 것이다(Hodgson (1991), Bio. Technology 9:19-21 참조). 조합 화학(combinatorial chemistry)은 가능한 한 보다 빠르고 저렴하게 약물을 만들기 위해 생체 활성인 화합물을 개별적으로가 아니라 대량으로 합성하고 시험하는 과학이다. 컴퓨터를 이용한 단백질 모델링과 신약 발견 분야의 발전으로 인해, 최근 몇 년 사이 합리적 약제 디자인과 조합 화학은 밀접한 관계가 되었다(US Pat. No. 4,908,773; 5,884,230; 5,873,052; 5,331,573; 및 5,888,738 참조).
합리적 약제 디자인과 조합 화학에서 분자 모델링의 사용은 컴퓨터 그래픽의 도래로 인해 급격히 증가해 왔다. 이것으로 분자들을 컴퓨터 화면상에서 삼차원으로 볼 수 있을 뿐만 아니라, 효소, 담체, 시험을 위해 합리적으로 디자인된 유도 분자들과 같은 거대 분자들간의 상호 작용을 실험할 수 있게 되었다(Boorman (1992), Chem. Eng. News 70:18-26 참조). 사용자에 친숙한 많은 소프트웨어와 하드웨어가 현재 수득 가능하며, 사실상 모든 제약회사가 합리적 약제 디자인을 위한 컴퓨터 모델링 부서를 가지고 있다. 예를 들어, Molecular Simulations Inc.(www.msi.com) 사용자가 아미노산 서열로부터 시작하여 그 단백질 또는 폴리펩티드의 2차원 내지 3차원 모델을 만들고, 다른 2, 3차원 모델들과 비교하여, 실시간으로 3차원 모델을 가진 화합물, 약제 및 펩티드와의 상호작용을 분석할 수 있도록 하는 몇몇 정교한 프로그램들을 판매하고 있다. 따라서, 본 발명의 몇 가지 실시예에서, 본 발명 단백질의 부위를 그 부위와 상호작용하는 분자들(예를 들어, 안티프로테인 항체와 같이, 총제적으로 "결합 파트너"로 칭함), 및 펩티드, 펩티드 유사체(peptidomimetics), 화학물질과 같은 분자들의 단편들 또는 유도체들과 비교할 수 있고 이로써 치료적 상호작용을 예측하고 디자인하는데 소프트웨어가 사용된다 (Schneider (1998), Genetic Engineering News December: page 20; Tempczyk et al. (1997), Molecular Simulations Inc. Solutions April; 및 Butenhof (1998), Molecular Simulations Inc. Case Notes (August 1998) for a discussion of molecular modeling 참조).
O. 유전자 치료
또 하나의 실시예에서, 유전자 치료는 단백질의 기능 및 활성과 관련된 생물학적 및 병리학적 과정의 조절 수단으로 이용될 수 있다. 이는 SEQ ID NO: 2, 4, 6, 8, 10, 12, 14 또는 16 서열의 전부 또는 적어도 일부를 포함하는 것으로 구성된 단백질을 인코딩하는 유전자 구조체 또는 SEQ ID NO: 1, 3, 5, 7, 9, 11, 13 또는 15의 비코딩 부위의 전부 또는 일부를 포함하는 것으로 구성된 유전자 구조체를 암 세포에 삽입하도록 구성되어 있으며, 이들 유전자 구조체는 상기 단백질의 발현이 상기 암을 억제하도록 작동가능하게 프로모터나 인핸서 물질에 연결되어 있으며, 상기 프로모터나 인핸서는 상기 유전자 구조체를 조절하는 프로모터나 인핸서이다.
상기한 구조체에서, 상기 단백질의 발현은 어떤 적당한 프로모터(예를 들어, 인간 사이토메갈로 바이러스(CMV), simian virus 40 (SV40), metallothionein promoters)에 의해 통제될 수 있고, 어떤 적당한 포유동물 조절물질에 의해서도 조절될 수 있다. 예를 들어, 필요하다면, 신경세포, T 세포, B 세포에서 유전자 발현을 선택적으로 통제하는 것으로 알려진 인핸서들을 사용하여 유전자 발현을 통제할 수 있다. 상기 인핸서에는 그들의 발현에 있어서 조직이나 세포 특이성을 갖는 인핸서도 제한없이 포함될 수 있다. 또는, LFG1, LFG2, LFG3, LFG4, LFG5 또는 LFG6 의 게놈 클론(genomic clone)이 치료 물질로 사용된다면(예를 들어, 그것의 분리에 뒤이어, 상기한 본 발명의 핵산분자와 혼성화함), 상기한 어떤 프로모터나 조절 물질을 포함하여, 동계 조절 서열 또는, 필요하다면, 이종의 원천으로부터 유래된 조절서열에 의해 조절될 수 있다.
구조체를 암세포에 삽입하는 것은, 예를 들어, 바이러스나 플라스미드 벡터 등을 이용하여 생체내에서 달성된다. 이러한 방법은 생체외 사용으로도 응용될 수 있다. 따라서, 본 발명에 따른 방법들은 세포를 생체외에서 유전적으로 변형하고 숙주로 주입하는 데 있어서, 또는 이러한 치료에 특히 적합한 벡터를 포함하는 여러 가지 적당한 방법을 사용하여 생체내에서 유전자 변형을 만들어 내는데 있어서 여러 가지 형태의 유전자 치료로 쉽게 응용될 수 있다.
세포가 암에 대해 관련을 가지도록 하는 적당한 굴성(tropism)을 가진, 아데노 바이러스 벡터(adenoviral vectors), 아데노 관련 바이러스 벡터(adeno-associated viral vectors), 또는 기타 바이러스 벡터들(예를 들어 상피세포)은 치료용으로 만들어진 유전자의 유전자 전달 시스템으로 사용될 수 있다. 이러한 목적에 유용한 많은 벡터들은 일반적으로 알려져 있다(Cozzi PJ, et al., (2002) Prostate, 53(2):95-100; Bitzer M, Lauer U., (2002) Dtsch Med Wochenschr. 127(31-32):1623-1624; Mezzina and Danos (2002), Trends Genet. 8:241-256; Loser et al. (2002) Curr. Gene Ther. 2:161-171; Pfeifer and Verma (2001), Annu. Rev. Genomics Hum. Genet. 2:177-211 참조). 레트로 바이러스 벡터(retroviral vectors)는 특히 잘 개발되어 임상에 이용되어 왔다(Anderson et al. (1995), U.S. Patent No. 5,399,346 참조). 바이러스에 기초하지 않은 접근법도 치료용 DNA를 발암이 예상되는 세포로 주입하는데 이용될 수 있다(Jeschke et al. (20002) Curr. Gene Ther. 1:267-278; Wu et al. (1988), J. Biol. Chem. 263:14621-14624; Wu et al. (1989), J. Biol. Chem. 264:16985-16987 참조). 예를 들어, lipofection, asialorosonucoid polylysine conjugation 또는 덜 바람직하지만 외과적 조건 하에서의 현미주사(microinjection)로도 신경세포나 T 세포에 유전자를 주입할 수 있다.
상기한 응용방법들에 있어서 치료용 핵산 구조체는 발마직하게는 발암 부위에 처리된다(예를 들어, 주사에 의해). 그러나, 발암 부위와 가까운 조직에 처리하거나 또는 발암이 예상되는 세포에 공급되는 혈관에 처리할 수도 있다.
P. 형질전환 동물 (Transgenic Animals)
SEQ ID NO: 1, 3, 5, 7, 9, 11, 13 또는 15의 cDNA 서열, 또는 SEQ ID NO: 2, 4, 6, 8, 10, 12, 14 또는 16의 폴리펩티드 서열을 인코딩하는 오픈 리딩 프레임(open reading frame), 또는 적어도 대략 3, 4, 5, 6, 10, 15, 25, 30, 35 또는 그 이상의 아미노산 잔기의 연속 서열을 가진 이들의 단편들에 대응하는 돌연변이, 넉아웃(knock-out) 또는 변형 유전자를 포함하고 있는 형질변환 동물도 본 발명에 포함된다. 형질변환 동물은 재조합 유전자, 외래 유전자 또는 복제된 유전물질이 실험적으로 이식된 유전적으로 변형된 동물이다. 이러한 유전물질은, 종종 "transgene"이라고 일컬어진다. Transgene의 핵산서열, 이 경우 SEQ ID NO: 1, 3, 5, 7, 9, 11, 13 또는 15의 형태의 핵산서열이, 보통은 특정 핵산서열이 발견되지 않는 게놈 내의 유전자 자리나 transgene의 통상의 유전자 자리에 끼어 들어 통합될 수 있다. Transgene은 대상 동물과 같은 종 또는 다른 종의 게놈으로부터 유도된 핵산서열로 구성될 수도 있다.
일부 실시예에서, SEQ ID NO: 1, 3, 5, 7, 9, 11, 13 또는 15를 포함하는 것으로 구성된 유전자의 전부 또는 일부가 결실된 형질전환 동물이 작제될 수도 있다. SEQ ID NO: 1, 3, 5, 7, 9, 11, 13 또는 15에 대응하는 유전자가 하나 또는 그 이상의 인트론을 포함하고 있는 경우, 전체 유전자-모든 엑손, 인트론 및 조절 서열-가 결실될 수도 있다. 또는, 전체 유전자 보다는 적은 수의 유전자가 결실될 수도 있다. 예를 들어, 하나의 엑손 및/또는 인트론이 결실되어 본 발명의 단백질의 변형된 형태가 발현되는 동물을 작제될 수도 있다.
용어 "생식선 형질전환 동물(germ cell line transgenic animal)"이란 유전적 변형 또는 유전정보가 생식선 세포에 도입됨으로써, 그 유전 정보를 자손에 전달하는 능력을 제공받은 형질전환 동물을 말한다. 그 자손이 그 유전적 변형 또는 유전 정보의 모두 또는 일부를 갖게 되면, 그 자손도 역시 형질전환 동물이 된다.
유전적 변형 또는 유전 정보는 그 수용체가 속하는 동물 종에 대해 외래적이거나, 특정 개체에만 외래적이거나 또는 그 수용체가 이미 가지고 있는 유전정보일 수 있다. 최종적인 경우에는 변형된 또는 도입된 유전자가 본래의 유전자와 다르게 발현될 수도 있다.
형질전환 동물은 트랜스펙션(transfection), 전기 천공법(electroporation), 현미주사(microinjection), 배아 줄기 세포에서의 유전자 타겟팅(gene targeting), 재조합 바이러스 레트로 바이러스 감염(recombinant viral and retroviral infection)을 포함한 많은 다양한 방법들에 의해 작제될 수 있다(U.S. Patent No. 4,736,866; U.S. Patent No. 5,602,307; Mullins et al. (1993), Hypertension 22: 630-633; Brenin et al. (1997), Surg. Oncol. 6: 99-110; Recombinant Gene Expression Protocols (Methods in Molecular Biology, Vol. 62), Tuan, ed., Humana Press, Totowa, NJ, 1997 참조).
활성화된 암유전자 서열을 발현하는 것(U.S. Patent No. 4,736,866); simian SV40 T-antigen을 발현하는 것(U.S. Patent No. 5,728,915); 인터페론 조절물질 1(IRF-1)의 발현이 없는 것(U.S. Patent No. 5,731,490); 도파민 기능장애 (dopaminergic dysfunction)로 보이는 것(U.S. Patent No. 5,723,719); 적어도 하나의 혈압 조절에 관여하는 인간 유전자를 발현하는 것(U.S. Patent No. 5,731,489); 천여 알츠하이머 병에 존재하는 상태와 더 큰 유사성을 보이는 것(U.S. Patent No. 5,720,936); 감소된 세포접착(cellular adhesion) 매개 능력을 가진 것(U.S. Patent No. 5,602,307); 소 성장 호르몬 유전자를 가진 것(Clutter et al. (1996), Genetics 143: 1753-1760); 또는 완전한 인간 항체에 반응하는 능력을 가진 것(McCarthy (1997), Lancet 349: 405) 등을 포함한 다수의 재조합 또는 형질 전환 마우스가 생산되어 왔다.
대부분의 형질전환 실험에서는 마우스와 쥐가 여전히 사용되지만, 어떤 경우에는 다른 종의 동물이 바람직하거나 또는 필수적이기까지 하다. 양, 염소, 돼지, 개, 고양이, 원숭이, 침팬지, 햄스터, 토끼, 소, 기니아 피그를 포함한 쥐과가 아닌 다양한 동물이 형질전환 과정에서 성공적으로 이용되어 왔다(Kim et al. (1997), Mol. Reprod. Dev. 46: 515-526; Houdebine (1995), Reprod. Nutr. Dev. 35: 609-617; Petters (1994), Reprod. Fertil. Dev. 6: 643-645; Schnieke et al. (1997), Science 278: 2130-2133; 및 Amoah (1997), J. Animal Sci. 75: 578-585 참조).
핵산 단편을 재조합 능력이 있는 포유동물 세포로 도입하는 방법은 다수의 핵산 분자의 동시-형질전환(co-transformation)을 선호하는 방법에 의해 수행될 수 있다. 미국특허 제5,489,743호와 미국특허 제5,602,307호에 개시되어 있는 것을 포함하여, 형질전환 동물을 생산하는 자세한 과정은 당업자에게는 용이하게 사용될 수 있다.
Q. 진단 방법
본 발명에 따른 유전자와 단백질은, 비(非) 발암조직과 비교해서 암 조직에서 다양하게 발현하기 때문에, 암을 진단 또는 모니터링하거나, 질병의 진행과정을 추적하거나, 비 발암조직 샘플로부터 발암 조직을 구별해내는데 사용될 수 있다. 본 발명의 핵산 분자 또는 단백질을 이용하여 암을 진단하는 하나의 수단은 생체시료로부터 조직을 얻어내는 것이다.
본 발명의 핵산이나 단백질을 검출하는 분석방법은 어떠한 가용적인 형태일 수 있다. 핵산을 분석하는 통상적 방법으로는 혼성화(hybridization)나 PCR 기반 형태를 포함한다. 본 발명의 단백질, 폴리펩티드, 펩티드를 검출하는 통상적인 방법은 항체 탐침의 in situ binding assays와 같은 방법을 포함한다(Harlow & Lane, Antibodies - A Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1988 참조). 바람직한 실시예에서, 분석은 적절한 조건 하에서 수행된다.
일반적으로, 본 발명의 진단법은 실시예가 핵산에 기초한 분석인지 또는 단백질에 기초한 분석인지에 따라 분류될 수 있다. 일부 진단 방법은 본 발명의 핵산이나 단백질에서 암적 이상에 기여하는 돌연변이나 다형성(polymorphisms)을 찾는 것이다. 또 다른 진단법은, 암과 같은 질병으로 고통받고 있는 유기체내에서 본 발명 RNA나 단백질의 수준과 닮은 피실험 유기체의 본 발명 RNA 또는 단백질의 수준을 검출하거나, 또는 질병을 가지고 있지 않는 유기체와 다른 피실험 유기체내의 본 발명 RNA 또는 단백질 수준을 검출함으로써 단백질 활성에서의 결점을 확인하여 구별한다.
또한, 단백질 활성이나 수준의 이상을 빠르게 검출하고 확인할 수 있도록 하기 위하여 다음의 실시예에서 설명될 반응물과 방법을 결합하여 만든 키트의 생산이 고려된다. 진단키트는 핵산 탐침, 항체 또는 이들의 조합을 포함하며, 특히 본 발명 단백질, 핵산 탐침 또는 이들 조합의 돌연변이를 검출하여 하나 또는 그 이상의 본 발명 단백질의 RNA 또는 단백질 발현의 수준을 결정하는데 사용될 수 있다. 이 키트의 검출성분은 통상적으로 하나 또는 그 이상의 다음의 반응물과 조합하여 제공될 것이다. DNA, RNA 또는 단백질을 흡수하거나 결합할 수 있는 지지체가 종종 제공된다. 이용 가능한 지지체로는 양으로 대전된 치환기의 배열을 가지고 있는 니트로셀룰로오즈, 나이론 또는 나이론 유도체의 막을 포함한다. 하나 또는 그 이상의 제한효소, 조절 반응물, 버퍼, 증폭 효소(amplification enzyme) 및 송아지-흉선 DNA 또는 연어-정액 DNA와 같은 비(非)인간 폴리뉴클레오타이드가 이 키트에 제공될 수 있다.
유용한 핵산 기반 진단기술은, 직접적인 DNA 시퀀싱(direct DNA sequencing), 구배 젤 전기영동(gradient gel electrophoresis), 서던 블로팅(Southern Blot analysis), 단일가닥 확인법(single-stranded confirmation analysis(SSCA)), RNAse protection assay, 점 블로팅(dot blot analysis), 핵산 증폭(nucleic acid amplification), 대립형질-특이 PCR(allele-specific PCR)과 이들의 조합을 포함한다. 이들 분석의 출발점은 생물학적 샘플로부터 핵산을 분리 또는 정제하는 것이다. 생체조직 검체는 좋은 샘플로 고려될 수 있다. 샘플로부터 핵산을 추출하고 프라이머를 이용하여 중합효소 연쇄반응(PCR;the Polymerase Chain Reaction)과 같은 DNA 증폭기술로 이를 증폭할 수 있다. 당업자라면 쉽게 다형성의 존재를 확증하는데 사용할 수 있는 방법을 용이하게 인식할 것이다. 뿐만 아니라, 당업계에 알려진 사용 가능한 분석법이라면 본 발명에 사용될 수 있다. 폴리뉴클레오티드 분석법의 특별한 실시예의 하나는 GenechipsTM으로 알려져 있으며, 미국특허 제5,143,854호; PCT 공개 WO 90/15070 및 92/10092에 일반적으로 설명되어 있다.
다양한 표지 및 접합 기술이 당업계에서 알려져 있으며, 이들은 다양한 핵산 분석법에 사용될 수 있다. 올리고 표지, 닉 번역(nick translation), 말단 표지(end-labeling), 또는 표지 뉴클레오티드를 사용하는 PCR 증폭(PCR amplification)을 포함하여 혼성화나 PCR을 위한 표지 핵산을 생산하는 기술이 다수 알려져 있지만, 이들 만으로 한정되는 것은 아니다. 또는, 본 발명의 단백질을 인코딩하는 핵산은 mRNA 탐침을 생산하기 위한 벡터로 복제될 수 있다. 이러한 벡터들은 당업계에 알려져 있고, 상업적으로도 이용 가능하며, T7, T3 또는 SP6와 같은 적절한 RNA 중합효소와 표지 뉴클레오티드를 첨가함으로써 생체외에서 RNA 탐침을 합성하는데 사용될 수 있다. Pharmacia Biotech(Piscataway, NJ), Promega(Madison, WI) 및 U.S. Biochemical Corp(Cleveland, OH)와 같은 많은 회사가 상업적 키트와 이 과정의 프로토콜을 공급하고 있다. 적절한 리포터 분자 또는 표지로는 기질, 보조인자(cofactors), 억제제, 자성 입자 뿐만 아니라, 방사성 핵종(radionuclides), 효소, 형광물질, 화학발광체, 또는 색소 생산제(chromogenic agent) 등이 포함된다.
바람직한 단백질 기반 진단에서는, 본 발명의 항체가 지지체에 부착되어 있는데, 많은 항체가 지지체의 별개의 영역에 부착되어 있고 각각의 항체가 중복되지 않는 방식으로 규칙적으로 배열되어 있다. 당업자라면 단백질에 기초한 진단방법을 통한 이용 가능한 분석법을 쉽게 인식할 것이다. 생체 샘플로부터 단백질을 얻어서, 이를 전통적인 방법 (예를 들어, 방사성 동위원소법, 비색 분석법(colorimetrically), 형광법 등)으로 표지한다. 돌연변이 및/또는 야생형의 본 발명 단백질의 기지 농도의 표지된 기준을 사용하면, 연구자는 샘플 내의 본 발명 단백질의 농도를 정확하게 결정할 수 있고, 이 정보로부터 단백질의 특정 형태의 발현 수준을 평가할 수 있다. 밀도측정계(densitometry)에서의 전통적인 방법도 또한 단백질의 발현 수준 또는 농도를 보다 정확하게 결정하는 데에 사용될 수 다. 진단 분석법에 대해 당업계에서 알려진 기술들을 사용하면 이러한 접근법은 쉽게 자동화될 수 있다. 상기한 바와 같이, 당업계에 알려진 어드레서블 어레이(addressable array) 기술은 본 발명의 이러한 측면에서 이용될 수 있고, 항체 결합 유형과 진단 정보를 최대화하기 위한 시도로서 칩상에서의 단백질 배열을 디스플레이 한다.
상기한 바와 같이, 본 발명의 유전자나 단백질에 있어서 다형성의 존재 또는 검출은 유기체 내에서의 암 또는 유사한 질병의 진단을 제공할 수 있다. 추가적인 실시예는 본 발명 항체와 같이 유전자나 단백질의 특정한 다형적 변이체에 특이적인 검출 요소를 포함하는 것으로 구성된 진단 키트를 만드는 것을 포함한다. 상기 검출 요소는 통상적으로 하나 또는 그 이상의 상기 반응물의 조합으로 제공될 것이다. 종종 RNA 또는 단백질을 흡수하거나 결합하는 능력을 가진 지지체가 제공될 것이다. 양으로 대전된 치환체의 배열을 갖는 것을 특징으로 하는 니트로셀룰로오스, 나일론 또는 나이론 유도체의 막 및 GenechipsTM 또는 그 등가물이 이 목적에 이용할 수 있는 지지체에 포함되며, 이들에 한정되는 것은 아니다. 역전사 효소(Reverse Transcriptase) 및/또는 태그 중합효소(Taq polymerase)와 같은 효소가 dNTPs, 완충제 또는 송아지-흉선 DNA나 연어-정액 DNA와 같은 비-인간 폴리뉴클레오티드 처럼 이 키트에 공급될 수 있다. 이 키트 분석법으로부터의 결과는 보건 의료 담당자(healthcare provider) 또는 진단 실험실(diagnostic laboratory)에 의해 해석될 수 있다. 또는, 상기 진단키트는 자가 진단용으로 대량 생산되어 판매될 수도 있다.
다형성의 존재 또는 부존재에 따라 질병을 진단하는 것 이외에, 암을 포함한 일부 질병들은 특정 조직에서 본 발명의 단백질이나 유전자의 왜곡된 수준 또는 본 발명의 단백질 발현의 이상 형태에 기인한다. 예를 들어, 다양한 조직에서의 발현 수준을 모니터링함으로써, 진단이 이루어지거나 질병 상태가 확인될 수 있다. 유사하게, 특정 조직 내에서의 다양한 발명 단백질들의 발현 수준의 비율(ratio)(발현 형태 등)을 결정함으로써, 건강 또는 질병의 예측을 할 수 있다. 본 발명 단백질의 발현 수준은 암 환자 뿐만 아니라 건강한 개체의 다양한 조직 내에서 결정된다. 이 값은 데이터베이스로 기록되고 피실험 개체로부터 얻어진 값과 비교될 수 있다. 뿐만 아니라, 건강한 개체와 질병을 가진 개체 모두의 다양한 조직 내 발현 비율 또는 유형이 데이터베이스로 기록된다. 이러한 분석을 "질병상태 프로파일"이라고 부르는데, 피실험 개체의 질병상태 프로파일을 다른 질병상태 프로파일(예를 들어, 건강한 개체의 것이나 또는 질병을 가진 개체의 것)과 비교함으로써, 의사는 질병의 존재 또는 부존재를 신속하게 진단할 수 있다.
상기한 핵산과 단백질 기반 진단 기술은 본 발명 유전자나 단백질의 조직 내 발현 수준 또는 양 또는 비율을 확인하는데 사용될 수 있다. 예를 들어, quantitative Northern hybridizations, in situ analysis, immunohistochemistry, ELISA, genechip array technology, PCR, 및 Western blots을 통해서, 특정 발명 단백질(야생형 또는 돌연변이)의 단백질 또는 RNA 의 발현량 또는 수준이 신속히 결정되어, 이 정보로부터 발현 비율이 확인될 수 있다. 또는, 분석될 본 발명 단백질들은, 상기한 동종 부위의 하나 또는 그 이상의 점유에 근거하여 확인되는 현재는 알려져 있지 않은 군일 수 있다.
더 이상의 설명이 없더라도, 당업자는 상기의 설명과 다음의 실시예를 이용하여 본 발명의 화합물을 만들고 이용할 수 있고, 청구된 방법을 실시할 수 있을 것이다. 그러므로 다음의 실시예는 본 발명의 바람직한 구체화를 명확히 지적하는 것이며, 명세서의 나머지 부분을 어떤 식으로든 제한하는 의미로 해석되어서는 안 된다.
실시예 1: 암에서 차등 발현된 mRNA의 동정 - 1
암세포 조직과 정상세포 조직 간의 유전자 발현상의 전체적인 변화는 GeneExpress Oncology DatasuiteTM of Gene Logic, Inc. (Gaithersburg, MD)을 사용하여 실험하였다. 데이터베이스는 Affymetrix Human Genome U95 array를 사용하여 만들어진 정상조직과 암 조직 샘플로부터 유래한 유전자 발현 프로필을 포함한다. 데이터베이스 내의 조직 샘플 중에서, 본 발명자들은 유방, 대장, 식도, 신장, 간, 폐, 림프선, 난소, 췌장, 전립선, 직장 또는 위에서 유래한 정상 및 암 조직의 발현 프로필을 분석하였다.
Affymetrix Human Genome U95 array는 63,175 개의 탐침 세트를 포함하고 있다. 탐침 세트는 하나의 전사체(transcript: 유전자 또는 cDNA 클론)를 검출하기 위한 탐침 세트로서, 16 내지 20 개의 올리고뉴클레오티드 탐침 쌍으로 이루어져 있다. 평균적 차이는 전사체의 발현 수준의 상대적 지시자(relative indicator)로서의 역할을 하며, 각 탐침 쌍의 강도 차이의 측정은 완전한 결합의 강도로부터 비결합의 강도를 빼서 계산한다. 탐침 쌍과 다른 혼성화 산물들 사이의 혼성화 차이는 형광 강도에 영향을 줄 수 있을 것이다. 계산된 평균적 차이를 이용하여, 각 유전자에 대한 압솔루트 콜(absolute call)을 만든다; "부재"(=검출되지 않음), "존재"(=검출됨) 또는 "약간"(=존재여부가 확실하지 않음).
암 조직과 정상 조직 사이의 유전자의 발현상의 차이는 다음의 통계학적인 방법으로 결정되었다. (1) 각 탐침에 대해, 평균적 차이와 압솔루트 콜은 Affymetrix Microarray Suite(v4.0)에 의해 정한다. (2) 주어진 샘플 세트에서, 조직 세포간의 이상치(outlier)는 MatLab 프로그램을 이용한 Principal Component Analysis(PCA)로 검출하였다. PCA에 사용된 지표점(data point)이 무작위로 선택된 탐침 세트(5,000 내지 6,000 탐침 세트)의 평균적 차이였다. 이상치는 그 이상의 분석에서 제외되었다. (3) 유전자 발현의 다양성은 GeneExpress program의 Fold Change Analysis tool을 이용하여 분석하였다. 접힘 변화(암 조직/정상조직)는 정상 조직의 샘플 세트에서의 유전자 차이의 평균에 대한 암 조직의 샘플 세트에서의 유전자 차이의 평균을 비교하여 계산하였다. 발현 단계에서 적어도 3 개의 접힘이 증가 또는 감소된 유전자를 얻었다. 유전자는 그들이 Variance Test 의 분석에 의해 결정된 것과 같은 0.05와 동등한 또는 그 보다 작은 p-value를 갖는다면 분석에서 포함되었다(Steel et al., Principles and Procedures of Statistics: A Biometrical Approach, Third Ed., McGraw-Hill, 1997). (4) 적어도 5 개의 암 유형들에서 차등 발현을 보이는 유전자들이 선택되었다.
칩 데이터의 분석은, 마커 LFG1의 발현이 정상 조직 샘플과 비교하여 암 조직 샘플에서 특이적으로 상향-조절되는 것을 보였다. LFG1(SEQ ID NO: 1 또는 3)의 발현 수준은 Affymetrix GeneChipsTM U95에서 단편 번호 91875_s_at에 의해 측정될 수 있다. 910875_s_at 서열은 EST AI053741로부터 유래되었다. 다양한 악성의 이상 형성물에서의 910875_s_at의 발현 수준을 정상 대조군 조직과 비교하여 표 1에 나타내었고, 여기에 접힘 변화, 변화의 경향(상향- 또는 하향-조절), p-수치 등을 나타내었다. 접힘 변화(암 조직/정상조직)는 정상 조직 샘플 세트상 차이의 기하학적 평균과 암 조직 샘플 세트상 차이의 기하학적 평균을 비교하여 측정하였다. 1.5 이상의 접힘 변화는 중요한 의미를 가진다(Wodicka et al. (1997), Nature Biotech. 15:1359-1367). 표 1에는 또한, 각각의 조직 형태에 대해, 샘플 세트에서 샘플의 전체 수와 함께, 존재, 부재, 약간이라 부르는 샘플의 수가 나타나있다. 이러한 데이터는 LFG1의 상향-조절이 암에서 진단됨을 의미한다.
칩 서열 단편 번호 910875_s_at에 결합한 샘플에 의해 결정된 유전자칩 발현(GeneChip expression) 결과는 TaqmanTM assay (Perkin-Elmer)를 이용한 정량적 RT-PCR(Q-RT-PCR)에 의해 확인되었다. 특정 Affymetrix fragment (91875_s_at)의 서열 정보 파일에 기초하여 디자인된 PCR 프라이머(5'-GCTGAAGCAGGAAAATCGCTT-3' (SEQ ID NO: 17) 및 5'-TGAGACGGAGTCTCACTCGGT-3' (SEQ ID NO: 18))가 분석에 사용되었다. 각각의 RNA 샘플의 타겟 유전자(전체 RNA의 10 ng)는 대조 유전자에 대해 상대적으로 분석되었다. 이러한 목적으로, CTBP1 유전자(C-말단 결합 단백질 1)에 특이적인 프라이머(5'-GTTTTTCCTAATTTTGGCATGAAC-3' (SEQ ID NO: 19)와 5'-CGCCCAAGCTTTTCCTTTT-3' (SEQ ID NO: 20))가 대조 프라이머로서 사용되었다. 이러한 접근법은 CTBP1 cycle threshold(Ct) 수치의 양에 비례한 타겟 mRNA의 Ct 수치에 의해 측정됨으로써 상대적인 발현을 제공한다. 샘플 패널은 대장, 신장, 간, 폐, 난소, 위 및 췌장으로부터의 정상 및 종양 조직의 전체 RNA 쌍을 포함하였다(Ambion, Inc., Austin, TX). Q-RT-PCR 데이터는 정상 샘플과 비교하여 암세포에서 LFG1의 상향-조절을 확인시켜 준다.
실시예 2: 차등 발현된 mRNA 종에 대응하는 장편 인간 cDNA(LFG1)의 클로닝
SEQ ID NO: 1 또는 3을 가진 장편 cDNA는 인간 심장의 cDNA 라이브러리를 이용하여 polymerase chain reaction(PCR)과 cDNA ends의 빠른 증폭(RACE)을 이용하여 얻었다(ResGen, Huntsville, AL). PCR을 위한 유전자-특이적 올리고(5'-CACCCTTTGCCTCTGTCACTTCCGCA-3' (SEQ ID NO: 21), 5'-GCTGGAGCACCAGGACTGCATTG-3' (SEQ ID NO: 22), 5'-GGAGCTGAGCAGCAGTGTAATGAA-3' (SEQ ID NO: 23), 5'-GAGGCCTGCCTGAAGGAGGAGCTTC-3' (SEQ ID NO: 24), 5"-TCTGGAAGTAGTGCAGACGCCTCAGG-3" (SEQ ID NO: 25), 5"-AGCCAACGTCGGCTTTGTTATCCAGC-3" (SEQ ID NO: 26), 5"-GCTGTCAGATATGATGGTTCTGGAC-3" (SEQ ID NO: 27), 5"-CCAGCCTCACCACTGTTGGGTTGC-3" (SEQ ID NO: 28), 5"-CATTCTCTGAGCTGTATTAGTGT-3" (SEQ ID NO: 29), 5"-CCTGAGCTGGAATGACCTGCA-3" (SEQ ID NO: 30), 5"-CTTTGTGTTGGCTGCAGCCACA-3" (SEQ ID NO: 31), 5"-TGAGGAGAGACTTTGCTGACTGGT-3" (SEQ ID NO: 32), 5"-GTCCTGTCTGGCGGTGCCGA-3" (SEQ ID NO: 33), 5"-GCTCCAGGATCCCCTGTCACCTGGGCCTTCTGCCTTTTGGCT-3" (SEQ ID NO: 34), 5"-CCATATGGAGAGGAGAGCAGCGGGCCCA-3' (SEQ ID NO: 35), 5'-GAAGGAGGAACATGGAGAGGAGA-3' (SEQ ID NO: 36), 5'-CCATATGCCCCGGGTAGTCTACTGCAT-3' (SEQ ID NO: 37), 및 5'-GTCGACTCGAGTCACTTCCGCAAAAACTTCTTG-3' (SEQ ID NO: 38))와, RACE (5'-TCCATTCCGAAGGCTCTCCTCC-3' (SEQ ID NO: 39), 5'-GTCTGTGTGACGGAAATGTAAGC-3' (SEQ ID NO: 40), 및 5'-GAAGGTCGAAGGCAGACCGATGT-3' (SEQ ID NO: 41))는 Human Genome Browser(University of California, Santa Cruz)를 이용하여 91875_s_at 서열을 포함하는 예상된 유전자들에 기초로 하여 디자인되었다. 프라이머를 가진 증폭 생성물들은 Topo Cloning System (Invitrogen, Carlsbad, CA)을 사용하여 PCR4-Topo 벡터에 합체되었고, 뒤이어 시퀀싱되었다.
상기에서 검출된 차등 조절된 mRNA에 대응되는 장편 인간 cDNA의 뉴클레오티드 서열이 SEQ ID NOS: 1 및 3에 개시되어 있다. 전자에서, cDNA는 5293 개의 염기 쌍들로 구성되어 있다. 후자에서, cDNA는 5317 개의 염기 쌍들로 구성되어 있다.
뉴클레오티드 390-4880(정지 코돈을 포함하여 390-4883)에서 SEQ ID NO: 1의 cDNA 뉴클레오티드 서열 내의 오픈 리딩 프레임은 1497개 아미노산의 단백질을 인코딩한다. SEQ ID NO: 1에 의해 인코딩된 예측되는 단백질에 대응하는 아미노산 서열은 SEQ ID NO: 2에 개시되어 있다 도 2는 Kyte-Doolittle value (Kyte and Doolittle (1982), J. Mol. Biol. 157:105-142)를 이용한 SEQ ID NO: 2의 아미노산 서열의 소수성 분석의 결과를 보여주고 있다. 소수성 부위는 상기한 항원성 펩티드를 생산하는데 사용될 수 있다.
뉴클레오티드 12-4904(정지 코돈을 포함하여 12-4907)에서 SEQ ID NO: 3의 cDNA 뉴클레오티드 서열 내의 오픈 리딩 프레임은 1631개 아미노산의 단백질을 인코딩한다. SEQ ID NO: 3에 의해 인코딩된 예상 단백질에 대응하는 아미노산 서열은 SEQ ID NO: 4에 개시되어 있다 도 3은 Kyte-Doolittle value (Kyte and Doolittle (1982), J. Mol. Biol. 157:105-142)를 이용한 SEQ ID NO: 3의 아미노산 서열의 소수성 분석의 결과를 보여주고 있다. 소수성 부위는 상기한 항원성 펩티드를 생산하는데 사용된다.
SEQ ID NO: 2의 단백질 서열은 SEQ ID NO: 2가 SEQ ID NO: 4의 N-말단에 최초 134개의 아미노산이 부족하다는 것을 제외하면 SEQ ID NO: 4의 단백질 서열과 동일하다.
SEQ ID NOS: 2와 4는 Calponin homology 도메인(SEQ ID NO: 4의 38-145 아미노산 위치), calmodulin-결합(SEQ ID NO: 2의 629-646 아미노산 위치 및 SEQ ID NO: 4의 763-780 아미노산 위치)을 위한 IQ 도메인, RasGAP 도메인(SEQ ID NO: 2의 858-1195 아미노산 위치 및 SEQ ID NO: 4의 992-1329 아미노산 위치), 및 RasGAP C-말단 도메인(SEQ ID NO: 2의 1298-1421 아미노산 위치 및 SEQ ID NO: 4의 1432-1555 아미노산 위치)을 포함한다. SEQ ID NOS: 2 및 4는 IQGAP 단백질과 유사하다(Weissbach et al. (1994), J Biol Chem 269:20517-20521; Brill et al. (1996), Mol Cell Biol 16:4869-4878). IQGAP는 세포골격 구조, 세포-세포 접착 및 증식 신호와 관련한 단백질에 결합하여 그 기능을 조절한다(Fukada et al. (2002), Cell 109: 1-20; Briggs et al. (2002), J Biol Chem 277: 7453-7465; McCallum et al. (1998), J Biol Chem 273: 22537-22544). IQGAP1-결여 마우스는 야생형과 비교하여 후발성 위 이상증식(late-onset gastric hyperplasia)의 현저한 증가를 나타내었다 (Li et al. (2000), Mol Cell Biol 20: 697-701).
Northern 블롯에 의한 분석은 LFG1에 대응하는 mRNA 전사체의 크기를 결정하기 위하여 수행되었다. 다양한 인체 조직으로부터의 전체 RNA를 포함하고 있는 Northern 블롯이 이용되었고(Human 12-Lane MTN Blot, Clontech, Palo Alto, CA), 91875_s _at 서열을 포함하는 EST는 random primer method에 의해 방사성으로 표지되었으며, 블롯을 탐침으로 사용하였다. 블롯은 42℃에서 50% 포름아미드(formamide), 5X SSPE, 0.1% SDS, 5X Denhart s 용액, 및 0.2 mg/ml herring sperm DNA에서 혼성화되었고, 상온에서 0.1% SDS를 함유한 0.2X SSC로 세척되었다. Northern 블롯은 크기가 대략 7.2 kb과 6.3 kb인 이러한 유전자의 세 개의 전사체를 보여 주었다. 이는 LFG1 클론(SEQ ID NO: 1 and 3)의 크기에 상응한다.
실시예 3: 암에서 차등 발현된 mRNA의 동정 - 2
LFG1 마커 대신에 LFG2 마커가 사용되었다는 점을 제외하고는 실시예 1과 동일한 과정을 반복하였다.
칩 데이터의 분석은 LFG2 마커의 발현이 정상 조직의 샘플과 비교하여 암 조직 샘플에서 유의적으로 하향-조절되는 것을 보여 주었다. LFG2(SEQ ID NO: 5)의 발현 수준은 Affymetrix GeneChipsTM U95 상의 칩 서열 단편 번호82941_at에 의해 측정되었다. 82941_at 서열은 EST AI277612로부터 유래되었다. 정상 대조 조직과 비교하여 다양한 악성 이상형성물(malignant neoplasm)에서의 82941_at 발현 수준이 표 2에 나타나 있으며, 접힘 변화, 변화의 방향(상향- 또는 하향-조절), p-수치 등도 확인할 수 있다. 접힘 변화(암/정상)는 정상 조직의 샘플 세트에서의 평균 차이의 기하학적인 평균에 대한 암 조직의 샘플 세트에서의 평균 차이의 기하학적인 평균을 비교하여 계산하였다. 1.5 이상의 접힘 변화는 심각하게 받아들여진다(Wodicka et al. (1997), Nature Biotech. 15:1359-1367). 또한, 표 2에는 각각의 조직 유형에 대하여 샘플 세트에서의 샘플 전체의 수와 함께, 존재, 부재, 또는 약간이라 부르는 샘플의 수가 나타나 있다. 이러한 데이터는 LFG2의 하향-조절이 암의 징후일 수 있음을 나타낸다.
실시예 4: 차등 발현된 mRNA 종에 대응하는 장편 인간 cDNA(LFG2)의 클로닝
SEQ ID NO: 5를 가지고 있는 장편 cDNA는 GeneTrapper assay를 이용하는 oligo-pulling 방법으로 얻어졌다(Life Technologies, Rockville, MD). 간단히, 유전자-특이적 올리고(5'-GAATGTGTCAGAGACAAGTGCAGC-3' (SEQ ID NO: 42))는 82941_at 서열을 포함한 EST의 서열에 기초하여 디자인되었다. 올리고는 비오틴(biotin)으로 표지되었고, Sambrook et al의 순서에 따라 불완전하게 분화된 위 선암종 라이브러리(adenocarcinoma library)(NCI CGAP Gas4) (ResGen, Huntsville, AL)로부터 단일 가닥의 플라스미드 DNA (cDNA 재조합체) 5 ㎍과 혼성화 하는데 이용되었다. 혼성화된 cDNA는 streptavidin-conjugated beads에 의해 분리되었고 가열에 의해 용출되었다. 용출된 cDNA는 이중 가닥의 플라스미드 DNA로 바뀌어 E. coli 세포(DH10B)를 형질전환 하는데 사용되었으며, 가장 긴 cDNA가 스크리닝되었다. 유전자-특이적 프라이머를 사용한 PCR에 의해 양성 선택(positive selection)을 한 다음, cDNA 클론은 DNA 시퀀싱되었다.
상기에서 검출된 차등 조절된 mRNA에 대응하는 장편 인간 cDNA의 뉴클레오티드 서열이 SEQ ID NO: 5에 개시되어 있다. cDNA는 3608 개의 염기 쌍을 포함하는 것으로 구성되어 있다.
뉴클레오티드 424-1908(정지 코돈을 포함하여 424-1911)에서 SEQ ID NO: 5의 cDNA 뉴클레오티드 서열 내의 오픈 리딩 프레임은 495개의 아미노산의 단백질을 인코딩한다. SEQ ID NO: 5에 의해 인코딩된 예상 단백질에 대응하는 아미노산 서열이 SEQ ID NO: 6에 개시되어 있다.
SEQ ID NO: 6는 선택된 다음이온 리간드(polyanionic ligand)의 엔도시토시스(endocytosis), 자살 세포(apoptotic cells)와 박테리아의 식세포 작용(phagocytosis), 세포 부착(cell adhesion) 및 아테롬성 동맥경화증(atherosclerosis)의 발달에 관여하는 스카벤저 수용체(scavenger receptors)에 상동성을 가진다(Peiser et al. (2002), Curr. Opin. Immunol. 14:123-128; Resnick et al. (1994), Trends Biol. Sci. 19:5-8). 스카벤저 수용체의 공지된 연구 결과에 기초하여, SEQ ID NO: 6은 세포질 도메인(1-35 아미노산 위치), 막관통 도메인(transmenbrane domain)(36-58 아미노산 위치), α-나선 와권상 나선 도메인(α-helical coiled-coil domain)(90-301 아미노산 위치), 콜라겐-유사 도메인(305-380 아미노산 위치) 및 스카벤저 수용체 시스테인-풍부 도메인(cystein-rich (SRCR) domain)(393-493 아미노산 위치)를 가지고 있다. 상기 SRCR 도메인은 여섯 개의 시스테인 잔기(418, 431, 462, 472, 482, 및 492 아미노산 위치)를 가지고 있는데, 이들은 도메인 내부의 이황화 결합에 관여한다. SEQ ID NO: 6은 또한 마우스 동족체와 동질성을 나타낸다(GenBank Accession No. BC016096). 이는 전체 인접 서열(contiguous sequence)에 대해 70% 상동성을 보인다.
도 4는 Kyte-Doolittle values를 이용하여 SEQ ID NO: 6의 아미노산 서열의 소수성 분석의 결과를 보여주고 있다(Kyte and Doolittle (1982), J. Mol. Biol. 157:105-142). 소수성 부위는 상기한 바와 같이 항원성 펩티드의 생산에 이용될 수 있다.
Northern 블롯에 의한 분석은 LFG2에 대응하는 mRNA 전사체의 크기를 결정하기 위하여 수행되었다. 다양한 인체 조직으로부터의 전체 RNA를 포함하는 Northern 블롯이 이용되었고(Human 12-Lane MTN Blot, Clontech, Palo Alto, CA), 82941_at 서열을 포함하는 EST는 random primer method에 의해 방사선적으로 표지되었으며, 블롯을 탐침으로 사용하였다. 블롯은 42℃에서 50% 포름아미드(formamide), 5X SSPE, 0.1% SDS, 5X Denhart s 용액, 및 0.2 mg/ml herring sperm DNA에서 혼성화되었고, 상온에서 0.1% SDS를 함유한 0.2X SSC로 세척되었다. Northern 블롯은 그 크기가 대략 3.7 kb인 상기 유전자에 대한 단일 전사체를 보여 주었다. 이는 LFG2 클론(SEQ ID NO: 5)의 크기에 상응한다.
실시예 5: 암에서 차등 발현된 mRNA의 동정 - 3
LFG1 마커 대신에 LFG3 마커가 사용되었다는 점을 제외하고는 실시예 1과 동일한 과정을 반복하였다.
칩 데이터의 분석은 LFG3 마커의 발현이 정상 조직의 샘플과 비교하여 암 조직 샘플에서 유의적으로 하향-조절되는 것을 보여 주었다. LFG3(SEQ ID NO: 5)의 발현 수준은 Affymetrix GeneChipsTM U95 상의 칩 서열 단편 번호46104_at에 의해 측정되었다. 46104_at 서열은 EST AA772055로부터 유래된다. 정상 대조 조직과 비교하여 다양한 악성 이상형성물에서의 46104_at 발현 수준이 표 3에 나타나 있으며, 접힘 변화, 변화의 방향(상향- 또는 하향=조절), p-수치 등도 나타나 있다. 접힘 변화(암/정상)는 정상 조직 샘플 세트에서의 평균 차이의 기하학적인 평균에 대한 암 조직의 샘플 세트에서의 평균 차이의 기하학적인 평균을 비교하여 계산하였다. 1.5 이상의 접힘 변화는 심각하게 받아들여진다(Wodicka et al. (1997), Nature Biotech. 15:1359-1367). 또한, 표 3에는, 각각의 조직 유형에 대해, 그러한 샘플 세트에서의 샘플 전체의 수와 함께, 존재, 부재, 또는 약간이라 부르는 샘플의 수가 나타나 있다. 이러한 데이터는 LFG3의 하향-조절이 암의 징후일 수 있음을 나타낸다.
실시예 6: 차등 발현된 mRNA 종에 대응하는 장편 인간 cDNA(LFG3)의 클로닝
SEQ ID NO: 7을 가지는 장편 cDNA는 GeneTrapper assay를 이용하는 oligo-pulling 방법으로 얻었다(Life Technologies, Rockville, MD). 간단히 말하면, 유전자-특이적 올리고(5'-GTATGCATCAGAATTCCCTATAGATCTTT-3' (SEQ ID NO: 44))는 46104_at 서열을 포함하고 있는 EST의 서열에 기초하여 디자인되었다. 올리고는 비오틴(biotin)으로 표지되었고, Sambrook et al의 순서에 따라 불완전하게 분화된 인간 태아 신장(ResGen, Huntsville, AL)로부터 단일 가닥 플라스미드 DNA (cDNA 재조합체) 5 ㅅg과 혼성화하는데 사용되었다. 혼성화 된 cDNA는 streptavidin-conjugated beads에 의해 분리되었고 가열에 의해 용출되었다. 용출된 cDNA는 이중 가닥 플라스미드 DNA로 바뀌어 E. coli 세포(DH10B)를 형질전환하는데 사용되었으며 가장 긴 cDNA는 스크리닝되었다. 유전자-특이적 프라이머를 사용한 PCR에 의해 양성 선택(positive selection)을 한 다음, cDNA 클론은 DNA 시퀀싱되었다. LFG3의 5'-말단은 인간 태아 신장으로부터 얻어진 cDNA(Clontech, Palo Alto, CA)와 유전자 특이적 프라이머(5'-TTCCTTCACCAAAGGCATCCAGCCATTCTATG-3' (SEQ ID NO: 46))를 사용하여 cDNA 말단의 급속 증폭(RACE)에 의해 확인되었다.
상기에서 검출된 차등 조절된 mRNA에 대응하는 장편 인간 cDNA의 뉴클레오티드는 SEQ ID NO: 7에 개시되어 있다 CDNA는 3162개의 염기 쌍을 포함하는 것으로 구성되어 있다.
뉴클레오티드 405-1835(정지 코돈을 포함하여 405-1838)에서 SEQ ID NO: 7의 cDNA 뉴클레오티드 서열 내의 오픈 리딩 프레임은 477개의 아미노산의 단백질을 인코딩한다. SEQ ID NO: 7에 의해 인코딩된 예상 단백질에 대응하는 아미노산 서열은 SEQ ID NO: 8에 개시되어 있다.
SEQ ID NO: 8은 모노카르복시산염 운송체(monocarboxylate transporters (MCTs))와 유사하며, 열 개의 예상 막관통 도메인(transmembrane) (아미노산 위치 10-29, 80-99, 107-128, 140-160, 274-295, 312-332, 339-360, 363-384, 396-416, 및 433-451)을 포함하고 있다. MCT 단백질은 락테이트(lactate), 피루베이트(pyruvate), 가지달린-사슬 옥소산(branched-chain oxo acids), 케톤체(ketone bodies), β-히드록시-부틸레이트(beta-hydroxy-butylate), 및 아세테이트(acetate)와 같은 단일 카르복시산염의 촉진된 이송에 대해 촉매작용을 한다(Halestrap and Price (1999), Biochem. J. 343:281-299). 표 4에는 8 개의 공지된 모노카르복시산염과 SEQ ID NO: 4의 유사율(similarity)이 요약되어 있다.
도 5는 Kyte-Doolittle value를 이용한 SEQ ID NO: 8의 아미노산 서열의 소수성 분석의 결과를 보여주고 있다(Kyte and Doolittle (1982), J. Mol. Biol. 157:105-142). 소수성 부위는 상기한 항원성 펩티드를 생산하는데 사용될 수 있다.
Northern 블롯에 의한 분석은 LFG3에 대응하는 mRNA 전사체의 크기를 결정하기 위하여 수행되었다. 다양한 인체 조직으로부터의 전체 RNA를 포함한 Northern 블롯이 사용되었고(Human 12-Lane MTN Blot, Clontech, Palo Alto, CA), 46104_at 서열을 포함하는 EST는 random primer method에 의해 방사선적으로 표지되었으며, 블롯을 탐침하기 위하여 사용하였다. 블롯은 42℃에서 50% 포름아미드(formamide), 5X SSPE, 0.1% SDS, 5X Denhart s 용액, 및 0.2 mg/ml herring sperm DNA에서 혼성화되었고, 상온에서 0.1% SDS를 함유한 0.2X SSC로 세척되었다. Northern 블롯은 크기가 약 4.2 kb인 이러한 유전자에 대한 한 개의 전사체를 보여 주었다. 이는 LFG3 클론(SEQ ID NO:7)의 크기에 상응한다.
실시예 7: 암에서 차등 발현된 mRNA의 동정 - 4
LFG1 마커 대신에 LFG4 마커가 사용되었다는 점을 제외하고는 실시예 1과 동일한 과정을 반복하였다.
칩 데이터의 분석은 LFG4 마커의 발현이 정상 조직의 샘플과 비교하여 암 조직 샘플에서 유의적으로 하향-조절되는 것을 보여 주었다. LFG4(SEQ ID NO: 9)의 발현 수준은 Affymetrix GeneChipsTM U95 상의 칩 서열 단편 번호62158_at에 의해 측정될 수 있다. 62158_at 서열은 EST AI123532로부터 유래된다. 정상 대조 조직과 비교하여 다양한 악성 이상형성물에서의 62158_at 발현 수준이 표 5에 나타나 있으며, 접힘 변화, 변화의 방향(상향- 또는 하향-조절), p-수치 등도 나타나 있다. 접힘 변화(암 조직/정상조직)는 정상 조직의 샘플 세트에서의 평균 차이의 기하학적인 평균에 대한 암 조직의 샘플 세트에서의 평균 차이의 기하학적인 평균을 비교하여 계산하였다. 1.5 이상의 접힘 변화는 심각하게 받아들여진다(Wodicka et al. (1997), Nature Biotech. 15:1359-1367). 또한, 표 5에는, 각각의 조직 유형에 대해, 샘플 세트에서의 샘플 전체의 수와 함께, 존재, 부재 또는 약간이라 부르는 샘플의 수가 나타나 있다. 이들 데이터는 LFG4의 하향-조절이 암에 대한 징후가 될 수 있음을 나타낸다.
실시예 8: 차등 발현된 mRNA 종에 대응하는 장편 인간 cDNA(LFG4)의 클로닝
SEQ ID NO: 9를 가지는 장편 cDNA는 cDNA 말단의 급속 증폭(RACE)에 의해 얻었다. 간단히 말하면, 유전자-특이적 올리고(5'-TAATGTTAGAGTAACAGCATTTTCCTTCAA-3' (SEQ ID NO: 49)와 5'-TGCCCCACACTAACTCAGTTCTTGTGATG-3' (SEQ ID NO: 50))는 62158_at 서열을 포함하고 있는 EST의 서열에 기초하여 디자인되었다. 올리고는 인간의 뇌로부터 얻은 cDNA의 PCR 증폭을 위해 사용되었다(Clontech, Palo Alto, CA). 증폭된 생성물은 프라이머와 함께 Topo Cloning System(Invitrogen, Carlsbad, CA)을 이용하는 PCR4-Top 벡터내로 합체된 다음 시퀀싱되었다.
상기에서 검출된 차등 조절된 mRNA에 대응하는 장편 인간 cDNA의 뉴클레오티드는 SEQ ID NO: 9에 개시되어 있다 cDNA는 4891개의 염기 쌍을 포함하는 것으로 구성되어 있다.
뉴클레오티드 89-1150(정지 코돈을 포함하여 89-1153)에서 SEQ ID NO: 9의 cDNA 뉴클레오티드 서열 내의 오픈 리딩 프레임은 354개의 아미노산의 단백질을 인코딩한다. SEQ ID NO: 9에 의해 인코딩된 예상 단백질에 대응하는 아미노산 서열은 SEQ ID NO: 10에 개시되어 있다.
SEQ ID NO: 10은 쥐 Kilon과 닭 Neurotractin과 유사하다(Funatsu et al. (1999), J Biol Chem 274:8224-8230; Marg et al. (1999), J Cell Biol 145:865-876). 단백질 서열 분석법은 분비 신호 펩티드(1-33 아미노산 위치), 세 개의 면역글로불린 도메인(47-136, 145-208, 및 231-312 아미노산 자리), 및 여섯 개의 추정되는 N-결합 글리코실화 자리(73, 155, 275, 286, 294, 및 307 아미노산 위치)를 나타낸다. Kilon/Neurotractin은 면역글로불린 상과(superfamily)의 IgLON 속과(subfamily)의 일원이다. IgLON은 신경섬유의 성장을 전반에 걸쳐 변경하고 세포-세포 간 부착과 인지에 있어서 영향을 미치는 글리코실포스파딜이노시톨(glycosylphosphatidylinositol)(GPI)-결합 세포 부착 분자의 과(family)이다(Miyate et al. (2000), J Comparative Neurol 424:74-85).
도 6은 Kyte-Doolittle values를 이용하여 SEQ ID NO: 10의 아미노산 서열의 소수성 분석의 결과를 보여주고 있다(Kyte and Doolittle (1982), J. Mol. Biol. 157:105-142). 친수성 부위는 상기한 바와 같이 항원성 펩티드의 생산에 이용될 수 있다. 이러한 수경 도표(hydropathy plot)은 C-말단에 소수성 부위의 존재를 보여준다. GPI-anchored 단백질의 경우에, GPI-anchor의 첨가는 C-말단 소수성 부위가 절단된 후에 일어난다고 알려져 있다. 추정적인 GPI anchor 부착 자리는 밝혀져 있다(아미노산 위치 324에서 Gly).
Northern 블롯에 의한 분석은 LFG4에 대응하는 mRNA 전사체의 크기를 결정하기 위하여 수행되었다. 다양한 인체 조직으로부터의 전체 RNA를 포함하고 있는 Northern 블롯이 이용되었고(Human 12-Lane MTN Blot, Clontech, Palo Alto, CA), 62158_at 서열을 포함하고 있는 EST는 random primer method에 의해 방사선상으로 표지되었으며, 블롯을 탐침하는데 사용되었다. 블롯은 42℃에서 50% 포름아미드(formamide), 5X SSPE, 0.1% SDS, 5X Denhart s 용액, 및 0.2 mg/ml herring sperm DNA에서 혼성화되었고, 상온에서 0.1% SDS를 함유하고 있는 0.2X SSC로 세척되었다. Northern 블롯은 크기가 대략 5.4 kb인 이러한 유전자의 단일 전사체를 보여 주었다. 이는 LFG4 클론(SEQ ID NO: 9)의 크기에 상응한다.
실시예 9: 암에서 차등 발현된 mRNA의 동정 - 5
LFG1 마커 대신에 LFG5 마커가 사용되었다는 점을 제외하고는 실시예 1과 동일한 과정을 반복하였다.
칩 데이터의 분석은 LFG5 마커의 발현이 정상 조직의 샘플과 비교하여 암 조직 샘플에서 유의적으로 하향-조절되는 것을 보여 주었다. LFG5(SEQ ID NO: 11)의 발현 수준은 Affymetrix GeneChipsTM U95 상의 칩 서열 단편 번호46659_at에 의해 측정될 수 있다. 정상 대조 조직과 비교하여 다양한 악성 이상형성물에서의 46659_at 발현 수준이 표 6에 나타나 있으며, 접힘 변화, 변화의 방향(상향- 또는 하향-조절), p-수치 등도 나타나 있다. 접힘 변화(암/정상)는 정상 조직의 샘플 세트에서의 평균 차이의 기하학적인 평균에 대한 암 조직의 샘플 세트에서의 평균 차이의 기하학적인 평균을 비교하여 계산하였다. 또한, 표 6에는, 각각의 조직 유형에 대해, 샘플 세트에서의 샘플 전체의 수와 함께, 존재, 부재, 또는 약간이라 부르는 샘플의 수가 나타나 있다. 이러한 데이터는 LFG5의 차등 조절이 암의 징후일 수 있다는 것을 나타낸다.
실시예 10: 차등 발현된 mRNA 종에 대응하는 장편 인간 cDNA(LFG5)의 클로닝
SEQ ID NO: 11을 가지고 있는 장편 cDNA는 GeneTrapper assay(Life Technologies, Rockville, MD)를 사용하는 oligo-pulling 방법으로 얻었다. 간단히 말하면, 유전자-특이적 올리고(5'-GAGAAGACCAGGGAAGAAGCAG-3' (SEQ ID NO: 53))는 46659_at 서열을 포함하고 있는 EST의 서열에 기초하여 디자인되었다. 올리고는 비오틴(biotin)으로 표지되었고, Sambrook et al의 순서에 따라 인간 심장 라이브러리(ResGen, Huntsville, AL)로부터 단일 가닥의 플라스미드 DNA(cDNA 재조합체) 5 ㎍과 혼성화하는데 사용되었다. 혼성화 된 cDNA는 streptavidin-conjugated beads에 의해 분리되었고 가열에 의해 용출되었다. 용출된 cDNA는 이중 가닥의 플라스미드 DNA로 변경되어 E. coli 세포(DH10B)를 형질전환하는데 사용되었으며, 가장 긴 cDNA가 스크리닝되었다. 유전자-특이적 프라이머를 사용하는 PCR에 의해 양성 선택을 한 다음, cDNA 클론은 DNA 시퀀싱되었다.
상기에서 검출된 차등 조절된 mRNA에 대응하는 장편 인간 cDNA의 뉴클레오티드 서열은 SEQ ID NO: 11에 개시되어 있다. cDNA는 3098개의 염기 쌍을 포함하는 것으로 구성되어 있다.
뉴클레오티드 223-1569(정지 코돈을 포함하여 223-1572)에서 SEQ ID NO: 11의 cDNA 뉴클레오티드 서열 내의 오픈 리딩 프레임은 449개의 아미노산의 단백질을 인코딩한다. SEQ ID NO: 11에 의해 인코딩된 예상 단백질에 대응하는 아미노산 서열은 SEQ ID NO: 12에 개시되어 있다.
SEQ ID NO: 12는 티미딜레이트 키나아제 도메인(Thymidylate kinase domain)(257-438 아미노산 위치)을 포함하고 있다. 티미딜레이트 키나아제는 RNA와 DNA를 합성하기 위한 뉴클레오티드를 합성하는 역할을 하고, 치료용 뉴클레오티드 및 뉴클레오티드 유사체의 약리학적 활성화에 요구되는 뉴클레오티드 모노포스페이트 키나아제(nucleotide monophosphate kinases)의 일원이다(Van Rompay et al. (2000), Pharmacology & Therapeutics 87:189-198). SEQ ID NO: 12는 대식세포 활성 동안에 유도되는 마우스 티미딜레이트 키나아제(GenBank Accession No. NM_020557)에 동질성을 나타낸다 (Lee and O Brien (1995), J Immunol. 154:6094-6102). 이는 전체 인접 서열에 대해 63% 상동성을 보인다.
도 7은 Kyte-Doolittle value를 사용한 SEQ ID NO: 12의 아미노산 서열의 소수성 분석의 결과를 보여주고 있다(Kyte and Doolittle (1982), J. Mol. Biol. 157:105-142). 소수성 부위는 상기한 항원성 펩티드를 생산하는데 사용될 수 있다.
Northern 블롯에 의한 분석은 LFG5에 대응하는 mRNA 전사체의 크기를 결정하기 위하여 수행되었다. 다양한 인체 조직으로부터의 전체 RNA를 포함하고 있는 Northern 블롯이 사용되었고(Human 12-Lane MTN Blot, Clontech, Palo Alto, CA), 82941_at 서열을 포함하고 있는 EST는 random primer method에 의해 방사선적으로 표지되었으며, 블롯을 탐침하는데 사용하였다. 블롯은 42℃에서 50% 포름아미드(formamide), 5X SSPE, 0.1% SDS, 5X Denhart s 용액, 및 0.2 mg/ml herring sperm DNA에서 혼성화되었고, 상온에서 0.1% SDS를 함유한 0.2X SSC로 세척되었다. Northern 블롯은 크기가 약 3.0 kb인 이러한 유전자의 단일 전사체를 보여 주었다. 이는 LFG5 클론(SEQ ID NO: 11)의 크기에 상응한다.
실시예 11: 암에서 차등 발현된 mRNA의 동정 - 6
LFG1 마커 대신에 LFG6 마커가 사용되었다는 점을 제외하고는 실시예 1과 동일한 과정을 반복하였다.
칩 데이터의 분석은 LFG6 마커의 발현이 정상 조직의 샘플과 비교하여 암 조직 샘플에서 유의적으로 상향-조절되었음을 보여 주었다. LFG6(SEQ ID NO: 13 또는 15)의 발현 수준은 Affymetrix GeneChipsTM U95 상에서 칩 서열 단편 번호 44103_at에 의해 측정될 수 있다. 44103_at 서열은 EST AA865614로부터 유래된다. 정상 대조 조직과 비교하여 다양한 악성 이상형성물에서의 44103_at 발현 수준이 표 7에 나타나 있으며, 접힘 변화, 변화의 방향(상향- 또는 하향-조절), p-수치 등도 나타나 있다. 접힘 변화(암/정상)는 정상 조직의 샘플 세트에서의 평균 차이의 기하학적인 평균에 대한 암 조직의 샘플 세트에서의 평균 차이의 기하학적인 평균을 비교하여 계산하였다. 1.5 이상의 접힘 변화는 심각하게 받아들여진다(Wodicka et al. (1997), Nature Biotech. 15:1359-1367). 또한, 표 7에는, 각각의 조직 유형에 대해, 샘플 세트에서 샘플 전체의 수와 함께, 존재, 부재, 또는 약간이라 부르는 샘플의 수가 또한 나타나 있다. 이러한 데이터는 LFG6의 상향-조절이 암에 대한 징후일 수 있음을 나타낸다.
실시예 12: 차등 발현된 mRNA 종에 대응하는 장편 인간 cDNA(LFG6)의 클로닝
SEQ ID NO: 13 또는 15를 가지고 있는 장편 cDNA는 GeneTrapper assay(Life Technologies, Rockville, MD)를 사용하여 oligo-pulling 방법으로 얻었다. 간략히 말하면, 유전자-특이적 올리고(5'-CGCTGGGTCATCGGACGGT-3'(SEQ ID NO: 56))는 44103_at 서열을 포함한 EST의 서열에 기초하여 디자인 되었다. 올리고는 비오틴(biotin)으로 표지되었고, Sambrook et al의 순서에 따라 충분히 분화된 인간 위 선암종 라이브러리(ResGen, Huntsville, AL)로부터 단일 가닥의 플라스미드 DNA(cDNA 재조합체) 5 ㎍과 혼성화하는데 사용되었다. 혼성화된 cDNA는 streptavidin-conjugated beads에 의해 분리되었고 가열에 의해 용출되었다. 용출된 cDNA는 이중 가닥의 플라스미드 DNA로 변경되어 E. coli 세포(DH10B)를 형질전환하는데 사용되었으며, 가장 긴 cDNA가 스크리닝되었다. 유전자-특이적 프라이머를 사용하여 PCR에 의해 양성 선택을 한 다음, cDNA 클론은 DNA 시퀀싱되었다.
상기에서 검출된 차등 조절된 mRNA에 대응하는 장편 인간 cDNA의 뉴클레오티드 서열은 SEQ ID NO: 13 또는 15에 개시되어 있다. 전자에서, cDNA는 1893개의 염기 쌍을 포함하는 것으로 구성되어 있다. 후자에서, cDNA는 1597개의 염기 쌍을 포함하는 것으로 구성되어 있다.
뉴클레오티드 418-1392(정지 코돈을 포함하여 418-1395)에서 SEQ ID NO: 13의 cDNA 뉴클레오티드 서열 내의 오픈 리딩 프레임은 325개의 아미노산의 단백질을 인코딩한다. SEQ ID NO: 13에 의해 인코딩된 예상 단백질에 대응하는 아미노산 서열은 SEQ ID NO: 14에 개시되어 있다. 도 9는 Kyte-Doolittle value를 사용한 SEQ ID NO: 14의 아미노산 서열의 소수성 분석의 결과를 보여주고 있다(Kyte and Doolittle (1982), J. Mol. Biol. 157:105-142). 소수성 부위는 상기한 바와 같이 항원성 펩티드를 생산하는데 사용될 수 있다.
뉴클레오티드 271-1431(정지 코돈을 포함하여 271-1434)에서 SEQ ID NO: 15의 cDNA 뉴클레오티드 서열 내의 오픈 리딩 프레임은 387개의 아미노산의 단백질을 인코딩한다. SEQ ID NO: 15에 의해 인코딩된 예상 단백질에 대응하는 아미노산 서열은 SEQ ID NO: 16에 개시되어 있다 도 10은 Kyte-Doolittle value를 이용한 SEQ ID NO: 16의 아미노산 서열의 소수성 분석의 결과를 보여주고 있다(Kyte and Doolittle (1982), J. Mol. Biol. 157:105-142). 친수성 부위는 상기한 바와 같이 항원성 펩티드를 생산하는데 사용될 수 있다.
SEQ ID NO: 14와 16은 유비퀴틴 동종(ubiquitin homologues: UBQ) 도메인(아미노산 위치 239-300)을 포함하고 있다. SEQ ID NO: 14와 16은 rat Sharpin 단백질과 유사하다(Lim et al. (2001), Mol Cell Neurosci 17:385-397). Sharpin은 cytoskeletal complex의 organization과 특화 세포 접합(specialized cell junction)에서 세포내 신호화(intracellular signaling)에 있어서 작용하는 Sharpin 단백질의 ankyrin complex와 직접적으로 상호작용 한다(Sheng and Kim (2000), J Cell Sci 113:1851-1856).
Northern 블롯에 의한 분석은 LFG6에 대응하는 mRNA 전사체의 크기를 결정하기 위하여 수행되었다. 다양한 인체 조직으로부터의 전체 RNA를 포함하고 있는 Northern 블롯이 사용되었고(Human 12-Lane MTN Blot, Clontech, Palo Alto, CA), 44103_at 서열을 포함하는 EST는 random primer method에 의해 방사선적으로 표지되었으며, 블롯을 탐침하는데 사용되었다. 블롯은 42℃에서 50% 포름아미드(formamide), 5X SSPE, 0.1% SDS, 5X Denhart s 용액, 및 0.2 mg/ml herring sperm DNA에서 혼성화되었고, 상온에서 0.1% SDS를 함유한 0.2X SSC로 세척되었다. Northern 블롯은 크기가 대략 2.2 kb, 1.5 kb 및 1.2 kb인 이러한 유전자의 세 개의 전사체를 보여 주었다. 이는 LFG6 클론(SEQ ID NO: 13 및 15)의 크기에 상응한다.
본 발명의 내용이 상기한 실시예에 상세히 설명되어 있음에도 불구하고, 본 발명의 범주에서 벗어나지 않는 여러 가지의 다양한 변형이 가능하다. 따라서, 본 발명은 다음의 청구범위에 의해서만 한정된다. 본 명세서에서 언급된 모든 인용 특허, 명세서, 공보는 그 전체가 참조로서 본 발명에 합체된다.
<110> LG Life Sciences Ltd. <120> Gene Famililies Associated With Cancers <130> LL05KR009(P) <150> US60/419911 <151> 2002-10-18 <150> US60/419912 <151> 2002-10-18 <150> US60/420088 <151> 2002-10-18 <150> US60/434243 <151> 2002-12-16 <150> US60/434278 <151> 2002-12-16 <150> US60/438278 <151> 2003-01-03 <160> 56 <170> KopatentIn 1.71 <210> 1 <211> 5293 <212> DNA <213> Homo sapiens <220> <221> CDS <222> (390)..(4880) <223> LBFL109 Clone A <400> 1 gtcctgtctg gcggtgccga cggtgagggg cggtggccca acggcgggag attcaaacct 60 ggaagaagga ggaacatgga gaggagagca gcgggcccag gctgggcagc ctctggatcg 120 aggcctgcct gaaggaggag cttccttccc cggtggagct ggaggagagc cttcggaatg 180 gagtgctgct ggccaagctg ggccactgtt ttgcaccctc cgtggttccg ttgaagaaga 240 tctacgatgt ggagcagctg cggtaccagg caactggctt acatttccgt cacacagaca 300 acatcaactt ttggctatct gcaatagccc acatcggtct gccttcgacc ttcttcccag 360 agaccacgga catctatgac aaaaagaac atg ccc cgg gta gtc tac tgc atc 413 Met Pro Arg Val Val Tyr Cys Ile 1 5 cat gct ctc agt ctc ttc ctc ttc cgg ctg gga ttg gcc cct cag ata 461 His Ala Leu Ser Leu Phe Leu Phe Arg Leu Gly Leu Ala Pro Gln Ile 10 15 20 cat gat cta tac ggg aaa gtg aaa ttc aca gct gag gaa ctc agc aac 509 His Asp Leu Tyr Gly Lys Val Lys Phe Thr Ala Glu Glu Leu Ser Asn 25 30 35 40 atg gcg tcc gaa ctg gcc aaa tat ggc ctc cag ctg cct gcc ttc agc 557 Met Ala Ser Glu Leu Ala Lys Tyr Gly Leu Gln Leu Pro Ala Phe Ser 45 50 55 aag atc ggg ggc atc ttg gcc aat gag ctc tcg gtg gat gag gct gca 605 Lys Ile Gly Gly Ile Leu Ala Asn Glu Leu Ser Val Asp Glu Ala Ala 60 65 70 gtc cat gca gct gtt ctt gcc atc aat gaa gca gtg gag cga ggg gtg 653 Val His Ala Ala Val Leu Ala Ile Asn Glu Ala Val Glu Arg Gly Val 75 80 85 gtg gag gac acc ctg gct gcc ttg cag aat ccc agt gct ctt ctg gag 701 Val Glu Asp Thr Leu Ala Ala Leu Gln Asn Pro Ser Ala Leu Leu Glu 90 95 100 aat ctc cga gag cct ctg gca gcc gtc tac cag gag atg ctg gcc cag 749 Asn Leu Arg Glu Pro Leu Ala Ala Val Tyr Gln Glu Met Leu Ala Gln 105 110 115 120 gcc aag atg gag aag gca gcc aat gcc agg aac cat gat gac aga gaa 797 Ala Lys Met Glu Lys Ala Ala Asn Ala Arg Asn His Asp Asp Arg Glu 125 130 135 agc cag gac atc tat gac cac tac cta act cag gct gaa atc cag ggc 845 Ser Gln Asp Ile Tyr Asp His Tyr Leu Thr Gln Ala Glu Ile Gln Gly 140 145 150 aat atc aac cat gtc aac gtc cat ggg gct cta gaa gtt gtt gat gat 893 Asn Ile Asn His Val Asn Val His Gly Ala Leu Glu Val Val Asp Asp 155 160 165 gcc ctg gaa aga cag agc cct gaa gcc ttg ctc aag gcc ctt caa gac 941 Ala Leu Glu Arg Gln Ser Pro Glu Ala Leu Leu Lys Ala Leu Gln Asp 170 175 180 cct gcc ctg gcc ctg cga ggg gtg agg aga gac ttt gct gac tgg tac 989 Pro Ala Leu Ala Leu Arg Gly Val Arg Arg Asp Phe Ala Asp Trp Tyr 185 190 195 200 ctg gag cag ctg aac tca gac aga gag cag aag gca cag gag ctg ggc 1037 Leu Glu Gln Leu Asn Ser Asp Arg Glu Gln Lys Ala Gln Glu Leu Gly 205 210 215 ctg gtg gag ctt ctg gaa aag gag gaa gtc cag gct ggt gtg gct gca 1085 Leu Val Glu Leu Leu Glu Lys Glu Glu Val Gln Ala Gly Val Ala Ala 220 225 230 gcc aac aca aag ggt gat cag gaa caa gcc atg ctc cac gct gtg cag 1133 Ala Asn Thr Lys Gly Asp Gln Glu Gln Ala Met Leu His Ala Val Gln 235 240 245 cgg atc aac aaa gcc atc cgg agg gga gtg gcg gct gac act gtg aag 1181 Arg Ile Asn Lys Ala Ile Arg Arg Gly Val Ala Ala Asp Thr Val Lys 250 255 260 gag ctg atg tgc cct gag gcc cag ctg cct cca gtg tac cct gtt gca 1229 Glu Leu Met Cys Pro Glu Ala Gln Leu Pro Pro Val Tyr Pro Val Ala 265 270 275 280 tcg tct atg tac cag ctg gag ctg gca gtg ctc cag cag cag cag ggg 1277 Ser Ser Met Tyr Gln Leu Glu Leu Ala Val Leu Gln Gln Gln Gln Gly 285 290 295 gag ctt ggc cag gag gag ctc ttc gtg gct gtg gag atg ctc tca gct 1325 Glu Leu Gly Gln Glu Glu Leu Phe Val Ala Val Glu Met Leu Ser Ala 300 305 310 gtg gtc ctg att aac cgg gcc ctg gag gcc cgg gat gcc agt ggc ttc 1373 Val Val Leu Ile Asn Arg Ala Leu Glu Ala Arg Asp Ala Ser Gly Phe 315 320 325 tgg agc agc ctg gtg aac cct gcc aca ggc ctg gct gag gtg gaa gga 1421 Trp Ser Ser Leu Val Asn Pro Ala Thr Gly Leu Ala Glu Val Glu Gly 330 335 340 gaa aat gcc cag cgt tac ttc gat gcc ctg ctg aaa ttg cga cag gag 1469 Glu Asn Ala Gln Arg Tyr Phe Asp Ala Leu Leu Lys Leu Arg Gln Glu 345 350 355 360 cgt ggg atg ggt gag gac ttc ctg agc tgg aat gac ctg cag gcc acc 1517 Arg Gly Met Gly Glu Asp Phe Leu Ser Trp Asn Asp Leu Gln Ala Thr 365 370 375 gtg agc cag gtc aat gca cag acc cag gaa gag act gac cgg gtc ctt 1565 Val Ser Gln Val Asn Ala Gln Thr Gln Glu Glu Thr Asp Arg Val Leu 380 385 390 gca gtc agc ctc atc aat gag gct ctg gac aaa ggc agc cct gag aag 1613 Ala Val Ser Leu Ile Asn Glu Ala Leu Asp Lys Gly Ser Pro Glu Lys 395 400 405 act ctg tct gcc cta ctg ctt cct gca gct ggc cta gat gat gtc agc 1661 Thr Leu Ser Ala Leu Leu Leu Pro Ala Ala Gly Leu Asp Asp Val Ser 410 415 420 ctc cct gtc gcc cct cgg tac cat ctc ctc ctt gtg gca gcc aaa agg 1709 Leu Pro Val Ala Pro Arg Tyr His Leu Leu Leu Val Ala Ala Lys Arg 425 430 435 440 cag aag gcc cag gtg aca ggg gat cct gga gct gtg ctg tgg ctt gag 1757 Gln Lys Ala Gln Val Thr Gly Asp Pro Gly Ala Val Leu Trp Leu Glu 445 450 455 gag atc cgc cag gga gtg gtc aga gcc aac cag gac act aat aca gct 1805 Glu Ile Arg Gln Gly Val Val Arg Ala Asn Gln Asp Thr Asn Thr Ala 460 465 470 cag aga atg gct ctt ggt gtg gct gcc atc aat caa gcc atc aag gag 1853 Gln Arg Met Ala Leu Gly Val Ala Ala Ile Asn Gln Ala Ile Lys Glu 475 480 485 ggc aag gca gcc cag act gag cgg gtg ttg agg aac ccc gca gtg gcc 1901 Gly Lys Ala Ala Gln Thr Glu Arg Val Leu Arg Asn Pro Ala Val Ala 490 495 500 ctt cga ggg gta gtt ccc gac tgt gcc aac ggc tac cag cga gcc ctg 1949 Leu Arg Gly Val Val Pro Asp Cys Ala Asn Gly Tyr Gln Arg Ala Leu 505 510 515 520 gaa agt gcc atg gca aag aaa cag cgt cca gca gac aca gct ttc tgg 1997 Glu Ser Ala Met Ala Lys Lys Gln Arg Pro Ala Asp Thr Ala Phe Trp 525 530 535 gtt caa cat gac atg aag gat ggc act gcc tac tac ttc cat ctg cag 2045 Val Gln His Asp Met Lys Asp Gly Thr Ala Tyr Tyr Phe His Leu Gln 540 545 550 acc ttc cag ggg atc tgg gag caa cct cct ggc tgc ccc ctc aac acc 2093 Thr Phe Gln Gly Ile Trp Glu Gln Pro Pro Gly Cys Pro Leu Asn Thr 555 560 565 tct cac ctg acc cgg gag gag atc cag tca gct gtc acc aag gtc act 2141 Ser His Leu Thr Arg Glu Glu Ile Gln Ser Ala Val Thr Lys Val Thr 570 575 580 gct gcc tat gac cgc caa cag ctc tgg aaa gcc aac gtc ggc ttt gtt 2189 Ala Ala Tyr Asp Arg Gln Gln Leu Trp Lys Ala Asn Val Gly Phe Val 585 590 595 600 atc cag ctc cag gcc cgc ctc cgt ggc ttc cta gtt cgg cag aag ttt 2237 Ile Gln Leu Gln Ala Arg Leu Arg Gly Phe Leu Val Arg Gln Lys Phe 605 610 615 gct gag cat tcc cac ttt ctg agg acc tgg ctc cca gca gtc atc aag 2285 Ala Glu His Ser His Phe Leu Arg Thr Trp Leu Pro Ala Val Ile Lys 620 625 630 atc cag gct cat tgg cgg ggt tat agg cag cgg aag att tac ctg gag 2333 Ile Gln Ala His Trp Arg Gly Tyr Arg Gln Arg Lys Ile Tyr Leu Glu 635 640 645 tgg ttg cag tat ttt aaa gca aac ctg gat gcc ata atc aag atc cag 2381 Trp Leu Gln Tyr Phe Lys Ala Asn Leu Asp Ala Ile Ile Lys Ile Gln 650 655 660 gcc tgg gcc cgg atg tgg gca gct cgg agg caa tac ctg agg cgt ctg 2429 Ala Trp Ala Arg Met Trp Ala Ala Arg Arg Gln Tyr Leu Arg Arg Leu 665 670 675 680 cac tac ttc cag aag aat gtt aac tcc att gtg aag atc cag gca ttt 2477 His Tyr Phe Gln Lys Asn Val Asn Ser Ile Val Lys Ile Gln Ala Phe 685 690 695 ttc cga gcc agg aaa gcc caa gat gac tac agg ata tta gtg cat gca 2525 Phe Arg Ala Arg Lys Ala Gln Asp Asp Tyr Arg Ile Leu Val His Ala 700 705 710 ccc cac cct cct ctc agt gtg gta cgc aga ttt gcc cat ctc ttg aat 2573 Pro His Pro Pro Leu Ser Val Val Arg Arg Phe Ala His Leu Leu Asn 715 720 725 caa agc cag caa gac ttc ttg gct gag gca gag ctg ctg aag ctc cag 2621 Gln Ser Gln Gln Asp Phe Leu Ala Glu Ala Glu Leu Leu Lys Leu Gln 730 735 740 gaa gag gta gtt agg aag atc cga tcc aat cag cag ctg gag cag gac 2669 Glu Glu Val Val Arg Lys Ile Arg Ser Asn Gln Gln Leu Glu Gln Asp 745 750 755 760 ctc aac atc atg gac atc aag att ggc ctg ctg gtg aag aac cgg atc 2717 Leu Asn Ile Met Asp Ile Lys Ile Gly Leu Leu Val Lys Asn Arg Ile 765 770 775 act ctg cag gaa gtg gtc tcc cac tgc aag aag ctg acc aag agg aat 2765 Thr Leu Gln Glu Val Val Ser His Cys Lys Lys Leu Thr Lys Arg Asn 780 785 790 aag gaa cag ctg tca gat atg atg gtt ctg gac aag cag aag ggt tta 2813 Lys Glu Gln Leu Ser Asp Met Met Val Leu Asp Lys Gln Lys Gly Leu 795 800 805 aag tcg ctg agc aaa gag aaa cgg cag aaa cta gaa gca tac caa cac 2861 Lys Ser Leu Ser Lys Glu Lys Arg Gln Lys Leu Glu Ala Tyr Gln His 810 815 820 ctc ttc tac ctg ctc cag act cag ccc atc tac ctg gcc aag ctg atc 2909 Leu Phe Tyr Leu Leu Gln Thr Gln Pro Ile Tyr Leu Ala Lys Leu Ile 825 830 835 840 ttt cag atg cca cag aac aaa acc acc aag ttc atg gag gca gtg att 2957 Phe Gln Met Pro Gln Asn Lys Thr Thr Lys Phe Met Glu Ala Val Ile 845 850 855 ttc agc ctg tac aac tat gcc tcc agc cgc cga gag gcc tat ctc ctg 3005 Phe Ser Leu Tyr Asn Tyr Ala Ser Ser Arg Arg Glu Ala Tyr Leu Leu 860 865 870 ctc cag ctg ttc aag aca gca ctc cag gag gaa atc aag tca aag gtg 3053 Leu Gln Leu Phe Lys Thr Ala Leu Gln Glu Glu Ile Lys Ser Lys Val 875 880 885 gag cag ccc cag gac gtg gtg aca ggc aac cca aca gtg gtg agg ctg 3101 Glu Gln Pro Gln Asp Val Val Thr Gly Asn Pro Thr Val Val Arg Leu 890 895 900 gtg gtg aga ttc tac cgt aat ggg cgg gga cag agt gcc ctg cag gag 3149 Val Val Arg Phe Tyr Arg Asn Gly Arg Gly Gln Ser Ala Leu Gln Glu 905 910 915 920 att ctg ggc aag gtt atc cag gat gtg cta gaa gac aaa gtg ctc agc 3197 Ile Leu Gly Lys Val Ile Gln Asp Val Leu Glu Asp Lys Val Leu Ser 925 930 935 gtc cac aca gac cct gtc cac ctc tat aag aac tgg atc aac cag act 3245 Val His Thr Asp Pro Val His Leu Tyr Lys Asn Trp Ile Asn Gln Thr 940 945 950 gag gcc cag aca ggg cag cgc agc cat ctc cca tat gat gtc acc ccg 3293 Glu Ala Gln Thr Gly Gln Arg Ser His Leu Pro Tyr Asp Val Thr Pro 955 960 965 gag cag gcc ttg agc cac ccc gag gtc cag aga cga ctg gac atc gcc 3341 Glu Gln Ala Leu Ser His Pro Glu Val Gln Arg Arg Leu Asp Ile Ala 970 975 980 cta cgc aac ctc ctc gcc atg act gat aag ttc ctt tta gcc atc acc 3389 Leu Arg Asn Leu Leu Ala Met Thr Asp Lys Phe Leu Leu Ala Ile Thr 985 990 995 1000 tca tct gtg gac caa att ccg tat ggg atg cga tat gtg gcc aaa gtc 3437 Ser Ser Val Asp Gln Ile Pro Tyr Gly Met Arg Tyr Val Ala Lys Val 1005 1010 1015 ctg aag gca act ctg gca gag aaa ttc cct gac gcc aca gac agc gag 3485 Leu Lys Ala Thr Leu Ala Glu Lys Phe Pro Asp Ala Thr Asp Ser Glu 1020 1025 1030 gtc tat aag gtg gtc ggg aac ctc ctg tac tac cgc ttc ctg aac cca 3533 Val Tyr Lys Val Val Gly Asn Leu Leu Tyr Tyr Arg Phe Leu Asn Pro 1035 1040 1045 gct gtg gtg gct cct gac gcc ttc gac att gtg gcc atg gca gct ggt 3581 Ala Val Val Ala Pro Asp Ala Phe Asp Ile Val Ala Met Ala Ala Gly 1050 1055 1060 gga gcc ctg gct gcc ccc cag cgc cat gcc ctg ggg gct gtg gct cag 3629 Gly Ala Leu Ala Ala Pro Gln Arg His Ala Leu Gly Ala Val Ala Gln 1065 1070 1075 1080 ctc cta cag cac gct gcg gct ggc aag gcc ttc tct ggg cag agc cag 3677 Leu Leu Gln His Ala Ala Ala Gly Lys Ala Phe Ser Gly Gln Ser Gln 1085 1090 1095 cac cta cgg gtc ctg aat gac tat ctg gag gaa aca cac ctc aag ttc 3725 His Leu Arg Val Leu Asn Asp Tyr Leu Glu Glu Thr His Leu Lys Phe 1100 1105 1110 agg aag ttc atc cat aga gcc tgc cag gtg cca gag cca gag gag cgt 3773 Arg Lys Phe Ile His Arg Ala Cys Gln Val Pro Glu Pro Glu Glu Arg 1115 1120 1125 ttt gca gtg gac gag tac tca gac atg gtg gct gtg gcc aaa ccc atg 3821 Phe Ala Val Asp Glu Tyr Ser Asp Met Val Ala Val Ala Lys Pro Met 1130 1135 1140 gtg tac atc acc gtg ggg gag ctg gtc aac acg cac agg ctg ttg ctg 3869 Val Tyr Ile Thr Val Gly Glu Leu Val Asn Thr His Arg Leu Leu Leu 1145 1150 1155 1160 gag cac cag gac tgc att gcc cct gat cac caa gac ccc ctg cat gag 3917 Glu His Gln Asp Cys Ile Ala Pro Asp His Gln Asp Pro Leu His Glu 1165 1170 1175 ctc ctg gag gat ctt ggg gag ctg ccc acc atc cct gac ctt att ggt 3965 Leu Leu Glu Asp Leu Gly Glu Leu Pro Thr Ile Pro Asp Leu Ile Gly 1180 1185 1190 gag agc atc gct gca gat ggg cac aca gac ctg agc aag cta gaa gtg 4013 Glu Ser Ile Ala Ala Asp Gly His Thr Asp Leu Ser Lys Leu Glu Val 1195 1200 1205 tcc ctg acg ctg acc aac aag ttt gaa gga cta gag gca gat gct gat 4061 Ser Leu Thr Leu Thr Asn Lys Phe Glu Gly Leu Glu Ala Asp Ala Asp 1210 1215 1220 gac tcc aac acc cgt agc ctg ctt ctg agc acc aag cag ctg ttg gcc 4109 Asp Ser Asn Thr Arg Ser Leu Leu Leu Ser Thr Lys Gln Leu Leu Ala 1225 1230 1235 1240 gat atc ata cag ttc cat cct ggg gac acc ctc aag gag atc ctg tcc 4157 Asp Ile Ile Gln Phe His Pro Gly Asp Thr Leu Lys Glu Ile Leu Ser 1245 1250 1255 ctc tcg gct tcc aga gag caa gaa gca gcc cac aag cag ctg atg agc 4205 Leu Ser Ala Ser Arg Glu Gln Glu Ala Ala His Lys Gln Leu Met Ser 1260 1265 1270 cga cgc cag gcc tgt aca gcc cag aca ccg gag cca ctg cga cga cac 4253 Arg Arg Gln Ala Cys Thr Ala Gln Thr Pro Glu Pro Leu Arg Arg His 1275 1280 1285 cgc tca ctg aca gct cac tcc ctc ctg cca ctg gca gag aag cag cgg 4301 Arg Ser Leu Thr Ala His Ser Leu Leu Pro Leu Ala Glu Lys Gln Arg 1290 1295 1300 cgc gtc ctg cgg aac ctg cgc cga ctt gaa gcc ctg ggg ttg gtc agc 4349 Arg Val Leu Arg Asn Leu Arg Arg Leu Glu Ala Leu Gly Leu Val Ser 1305 1310 1315 1320 gcc aga aat ggc tac cag ggg cta gtg gac gag ctg gcc aag gac atc 4397 Ala Arg Asn Gly Tyr Gln Gly Leu Val Asp Glu Leu Ala Lys Asp Ile 1325 1330 1335 cgc aac cag cac aga cac agg cac agg cgg aag gca gag ctg gtg aag 4445 Arg Asn Gln His Arg His Arg His Arg Arg Lys Ala Glu Leu Val Lys 1340 1345 1350 ctg cag gcc aca tta cag ggc ctg agc act aag acc acc ttc tat gag 4493 Leu Gln Ala Thr Leu Gln Gly Leu Ser Thr Lys Thr Thr Phe Tyr Glu 1355 1360 1365 gag cag ggt gac tac tac agc cag tac atc cgg gcc tgc ctg gac cac 4541 Glu Gln Gly Asp Tyr Tyr Ser Gln Tyr Ile Arg Ala Cys Leu Asp His 1370 1375 1380 ctg gcc ccc gac tcc aag agt tct ggg aag ggg aag aag cag cct tct 4589 Leu Ala Pro Asp Ser Lys Ser Ser Gly Lys Gly Lys Lys Gln Pro Ser 1385 1390 1395 1400 ctt cat tac act gct gct cag ctc ctg gaa aag ggt gtc ttg gtg gaa 4637 Leu His Tyr Thr Ala Ala Gln Leu Leu Glu Lys Gly Val Leu Val Glu 1405 1410 1415 att gaa gat ctt ccc gcc tct cac ttc aga aac gtc atc ttt gac atc 4685 Ile Glu Asp Leu Pro Ala Ser His Phe Arg Asn Val Ile Phe Asp Ile 1420 1425 1430 acg ccg gga gat gag gca gga aag ttt gaa gta aat gcc aag ttc ctg 4733 Thr Pro Gly Asp Glu Ala Gly Lys Phe Glu Val Asn Ala Lys Phe Leu 1435 1440 1445 ggt gtg gac atg gag cga ttt cag ctt cac tat cag gat ctc ctg cag 4781 Gly Val Asp Met Glu Arg Phe Gln Leu His Tyr Gln Asp Leu Leu Gln 1450 1455 1460 ctc cag tat gag ggt gtg gct gtc atg aaa ctc ttc aac aag gcc aaa 4829 Leu Gln Tyr Glu Gly Val Ala Val Met Lys Leu Phe Asn Lys Ala Lys 1465 1470 1475 1480 gtc aat gtc aac ctt ctc atc ttc ctc ctc aac aag aag ttt ttg cgg 4877 Val Asn Val Asn Leu Leu Ile Phe Leu Leu Asn Lys Lys Phe Leu Arg 1485 1490 1495 aag tgacagaggc aaagggtgct acccaagccc ctcttacctc tctggatgct 4930 Lys ttctttaaca ctaactcacc actgtgcttc cctgcagaca cccagagctc aggactgggc 4990 aaggcccagg gattctcacc ccttccccag ctgggaggag cttgcctgcc tggccacaga 5050 cagtgtatct tctaattggc taaagtgggc cttgcccaga gtccagctgt gtggctttta 5110 tcatgcatga caaacccctg gctttcctgc cagatggatt ctcatccctt acagctgact 5170 cttccaggca atttccatag atctgcagtc ctgcctctgc cacagtctct ctgttgtccc 5230 cacatctacc caacttcctg tactgttgcc cttctgatgt taataaaagc agctgttact 5290 ccc 5293 <210> 2 <211> 1497 <212> PRT <213> Homo sapiens <400> 2 Met Pro Arg Val Val Tyr Cys Ile His Ala Leu Ser Leu Phe Leu Phe 1 5 10 15 Arg Leu Gly Leu Ala Pro Gln Ile His Asp Leu Tyr Gly Lys Val Lys 20 25 30 Phe Thr Ala Glu Glu Leu Ser Asn Met Ala Ser Glu Leu Ala Lys Tyr 35 40 45 Gly Leu Gln Leu Pro Ala Phe Ser Lys Ile Gly Gly Ile Leu Ala Asn 50 55 60 Glu Leu Ser Val Asp Glu Ala Ala Val His Ala Ala Val Leu Ala Ile 65 70 75 80 Asn Glu Ala Val Glu Arg Gly Val Val Glu Asp Thr Leu Ala Ala Leu 85 90 95 Gln Asn Pro Ser Ala Leu Leu Glu Asn Leu Arg Glu Pro Leu Ala Ala 100 105 110 Val Tyr Gln Glu Met Leu Ala Gln Ala Lys Met Glu Lys Ala Ala Asn 115 120 125 Ala Arg Asn His Asp Asp Arg Glu Ser Gln Asp Ile Tyr Asp His Tyr 130 135 140 Leu Thr Gln Ala Glu Ile Gln Gly Asn Ile Asn His Val Asn Val His 145 150 155 160 Gly Ala Leu Glu Val Val Asp Asp Ala Leu Glu Arg Gln Ser Pro Glu 165 170 175 Ala Leu Leu Lys Ala Leu Gln Asp Pro Ala Leu Ala Leu Arg Gly Val 180 185 190 Arg Arg Asp Phe Ala Asp Trp Tyr Leu Glu Gln Leu Asn Ser Asp Arg 195 200 205 Glu Gln Lys Ala Gln Glu Leu Gly Leu Val Glu Leu Leu Glu Lys Glu 210 215 220 Glu Val Gln Ala Gly Val Ala Ala Ala Asn Thr Lys Gly Asp Gln Glu 225 230 235 240 Gln Ala Met Leu His Ala Val Gln Arg Ile Asn Lys Ala Ile Arg Arg 245 250 255 Gly Val Ala Ala Asp Thr Val Lys Glu Leu Met Cys Pro Glu Ala Gln 260 265 270 Leu Pro Pro Val Tyr Pro Val Ala Ser Ser Met Tyr Gln Leu Glu Leu 275 280 285 Ala Val Leu Gln Gln Gln Gln Gly Glu Leu Gly Gln Glu Glu Leu Phe 290 295 300 Val Ala Val Glu Met Leu Ser Ala Val Val Leu Ile Asn Arg Ala Leu 305 310 315 320 Glu Ala Arg Asp Ala Ser Gly Phe Trp Ser Ser Leu Val Asn Pro Ala 325 330 335 Thr Gly Leu Ala Glu Val Glu Gly Glu Asn Ala Gln Arg Tyr Phe Asp 340 345 350 Ala Leu Leu Lys Leu Arg Gln Glu Arg Gly Met Gly Glu Asp Phe Leu 355 360 365 Ser Trp Asn Asp Leu Gln Ala Thr Val Ser Gln Val Asn Ala Gln Thr 370 375 380 Gln Glu Glu Thr Asp Arg Val Leu Ala Val Ser Leu Ile Asn Glu Ala 385 390 395 400 Leu Asp Lys Gly Ser Pro Glu Lys Thr Leu Ser Ala Leu Leu Leu Pro 405 410 415 Ala Ala Gly Leu Asp Asp Val Ser Leu Pro Val Ala Pro Arg Tyr His 420 425 430 Leu Leu Leu Val Ala Ala Lys Arg Gln Lys Ala Gln Val Thr Gly Asp 435 440 445 Pro Gly Ala Val Leu Trp Leu Glu Glu Ile Arg Gln Gly Val Val Arg 450 455 460 Ala Asn Gln Asp Thr Asn Thr Ala Gln Arg Met Ala Leu Gly Val Ala 465 470 475 480 Ala Ile Asn Gln Ala Ile Lys Glu Gly Lys Ala Ala Gln Thr Glu Arg 485 490 495 Val Leu Arg Asn Pro Ala Val Ala Leu Arg Gly Val Val Pro Asp Cys 500 505 510 Ala Asn Gly Tyr Gln Arg Ala Leu Glu Ser Ala Met Ala Lys Lys Gln 515 520 525 Arg Pro Ala Asp Thr Ala Phe Trp Val Gln His Asp Met Lys Asp Gly 530 535 540 Thr Ala Tyr Tyr Phe His Leu Gln Thr Phe Gln Gly Ile Trp Glu Gln 545 550 555 560 Pro Pro Gly Cys Pro Leu Asn Thr Ser His Leu Thr Arg Glu Glu Ile 565 570 575 Gln Ser Ala Val Thr Lys Val Thr Ala Ala Tyr Asp Arg Gln Gln Leu 580 585 590 Trp Lys Ala Asn Val Gly Phe Val Ile Gln Leu Gln Ala Arg Leu Arg 595 600 605 Gly Phe Leu Val Arg Gln Lys Phe Ala Glu His Ser His Phe Leu Arg 610 615 620 Thr Trp Leu Pro Ala Val Ile Lys Ile Gln Ala His Trp Arg Gly Tyr 625 630 635 640 Arg Gln Arg Lys Ile Tyr Leu Glu Trp Leu Gln Tyr Phe Lys Ala Asn 645 650 655 Leu Asp Ala Ile Ile Lys Ile Gln Ala Trp Ala Arg Met Trp Ala Ala 660 665 670 Arg Arg Gln Tyr Leu Arg Arg Leu His Tyr Phe Gln Lys Asn Val Asn 675 680 685 Ser Ile Val Lys Ile Gln Ala Phe Phe Arg Ala Arg Lys Ala Gln Asp 690 695 700 Asp Tyr Arg Ile Leu Val His Ala Pro His Pro Pro Leu Ser Val Val 705 710 715 720 Arg Arg Phe Ala His Leu Leu Asn Gln Ser Gln Gln Asp Phe Leu Ala 725 730 735 Glu Ala Glu Leu Leu Lys Leu Gln Glu Glu Val Val Arg Lys Ile Arg 740 745 750 Ser Asn Gln Gln Leu Glu Gln Asp Leu Asn Ile Met Asp Ile Lys Ile 755 760 765 Gly Leu Leu Val Lys Asn Arg Ile Thr Leu Gln Glu Val Val Ser His 770 775 780 Cys Lys Lys Leu Thr Lys Arg Asn Lys Glu Gln Leu Ser Asp Met Met 785 790 795 800 Val Leu Asp Lys Gln Lys Gly Leu Lys Ser Leu Ser Lys Glu Lys Arg 805 810 815 Gln Lys Leu Glu Ala Tyr Gln His Leu Phe Tyr Leu Leu Gln Thr Gln 820 825 830 Pro Ile Tyr Leu Ala Lys Leu Ile Phe Gln Met Pro Gln Asn Lys Thr 835 840 845 Thr Lys Phe Met Glu Ala Val Ile Phe Ser Leu Tyr Asn Tyr Ala Ser 850 855 860 Ser Arg Arg Glu Ala Tyr Leu Leu Leu Gln Leu Phe Lys Thr Ala Leu 865 870 875 880 Gln Glu Glu Ile Lys Ser Lys Val Glu Gln Pro Gln Asp Val Val Thr 885 890 895 Gly Asn Pro Thr Val Val Arg Leu Val Val Arg Phe Tyr Arg Asn Gly 900 905 910 Arg Gly Gln Ser Ala Leu Gln Glu Ile Leu Gly Lys Val Ile Gln Asp 915 920 925 Val Leu Glu Asp Lys Val Leu Ser Val His Thr Asp Pro Val His Leu 930 935 940 Tyr Lys Asn Trp Ile Asn Gln Thr Glu Ala Gln Thr Gly Gln Arg Ser 945 950 955 960 His Leu Pro Tyr Asp Val Thr Pro Glu Gln Ala Leu Ser His Pro Glu 965 970 975 Val Gln Arg Arg Leu Asp Ile Ala Leu Arg Asn Leu Leu Ala Met Thr 980 985 990 Asp Lys Phe Leu Leu Ala Ile Thr Ser Ser Val Asp Gln Ile Pro Tyr 995 1000 1005 Gly Met Arg Tyr Val Ala Lys Val Leu Lys Ala Thr Leu Ala Glu Lys 1010 1015 1020 Phe Pro Asp Ala Thr Asp Ser Glu Val Tyr Lys Val Val Gly Asn Leu 1025 1030 1035 1040 Leu Tyr Tyr Arg Phe Leu Asn Pro Ala Val Val Ala Pro Asp Ala Phe 1045 1050 1055 Asp Ile Val Ala Met Ala Ala Gly Gly Ala Leu Ala Ala Pro Gln Arg 1060 1065 1070 His Ala Leu Gly Ala Val Ala Gln Leu Leu Gln His Ala Ala Ala Gly 1075 1080 1085 Lys Ala Phe Ser Gly Gln Ser Gln His Leu Arg Val Leu Asn Asp Tyr 1090 1095 1100 Leu Glu Glu Thr His Leu Lys Phe Arg Lys Phe Ile His Arg Ala Cys 1105 1110 1115 1120 Gln Val Pro Glu Pro Glu Glu Arg Phe Ala Val Asp Glu Tyr Ser Asp 1125 1130 1135 Met Val Ala Val Ala Lys Pro Met Val Tyr Ile Thr Val Gly Glu Leu 1140 1145 1150 Val Asn Thr His Arg Leu Leu Leu Glu His Gln Asp Cys Ile Ala Pro 1155 1160 1165 Asp His Gln Asp Pro Leu His Glu Leu Leu Glu Asp Leu Gly Glu Leu 1170 1175 1180 Pro Thr Ile Pro Asp Leu Ile Gly Glu Ser Ile Ala Ala Asp Gly His 1185 1190 1195 1200 Thr Asp Leu Ser Lys Leu Glu Val Ser Leu Thr Leu Thr Asn Lys Phe 1205 1210 1215 Glu Gly Leu Glu Ala Asp Ala Asp Asp Ser Asn Thr Arg Ser Leu Leu 1220 1225 1230 Leu Ser Thr Lys Gln Leu Leu Ala Asp Ile Ile Gln Phe His Pro Gly 1235 1240 1245 Asp Thr Leu Lys Glu Ile Leu Ser Leu Ser Ala Ser Arg Glu Gln Glu 1250 1255 1260 Ala Ala His Lys Gln Leu Met Ser Arg Arg Gln Ala Cys Thr Ala Gln 1265 1270 1275 1280 Thr Pro Glu Pro Leu Arg Arg His Arg Ser Leu Thr Ala His Ser Leu 1285 1290 1295 Leu Pro Leu Ala Glu Lys Gln Arg Arg Val Leu Arg Asn Leu Arg Arg 1300 1305 1310 Leu Glu Ala Leu Gly Leu Val Ser Ala Arg Asn Gly Tyr Gln Gly Leu 1315 1320 1325 Val Asp Glu Leu Ala Lys Asp Ile Arg Asn Gln His Arg His Arg His 1330 1335 1340 Arg Arg Lys Ala Glu Leu Val Lys Leu Gln Ala Thr Leu Gln Gly Leu 1345 1350 1355 1360 Ser Thr Lys Thr Thr Phe Tyr Glu Glu Gln Gly Asp Tyr Tyr Ser Gln 1365 1370 1375 Tyr Ile Arg Ala Cys Leu Asp His Leu Ala Pro Asp Ser Lys Ser Ser 1380 1385 1390 Gly Lys Gly Lys Lys Gln Pro Ser Leu His Tyr Thr Ala Ala Gln Leu 1395 1400 1405 Leu Glu Lys Gly Val Leu Val Glu Ile Glu Asp Leu Pro Ala Ser His 1410 1415 1420 Phe Arg Asn Val Ile Phe Asp Ile Thr Pro Gly Asp Glu Ala Gly Lys 1425 1430 1435 1440 Phe Glu Val Asn Ala Lys Phe Leu Gly Val Asp Met Glu Arg Phe Gln 1445 1450 1455 Leu His Tyr Gln Asp Leu Leu Gln Leu Gln Tyr Glu Gly Val Ala Val 1460 1465 1470 Met Lys Leu Phe Asn Lys Ala Lys Val Asn Val Asn Leu Leu Ile Phe 1475 1480 1485 Leu Leu Asn Lys Lys Phe Leu Arg Lys 1490 1495 <210> 3 <211> 5317 <212> DNA <213> Homo sapiens <220> <221> CDS <222> (12)..(4904) <223> LBFL109 Clone B <400> 3 gaaggaggaa c atg gag agg aga gca gcg ggc cca ggc tgg gca 44 Met Glu Arg Arg Ala Ala Gly Pro Gly Trp Ala 1 5 10 gcc tat gaa cgc ctc aca gct gag gag atg gat gag cag agg cgg cag 92 Ala Tyr Glu Arg Leu Thr Ala Glu Glu Met Asp Glu Gln Arg Arg Gln 15 20 25 aat gtt gcc tat cag tac ctg tgc cgg ctg gag gag gcc aag cgc tgg 140 Asn Val Ala Tyr Gln Tyr Leu Cys Arg Leu Glu Glu Ala Lys Arg Trp 30 35 40 atg gag gcc tgc ctg aag gag gag ctt cct tcc ccg gtg gag ctg gag 188 Met Glu Ala Cys Leu Lys Glu Glu Leu Pro Ser Pro Val Glu Leu Glu 45 50 55 gag agc ctt cgg aat gga gtg ctg ctg gcc aag ctg ggc cac tgt ttt 236 Glu Ser Leu Arg Asn Gly Val Leu Leu Ala Lys Leu Gly His Cys Phe 60 65 70 75 gca ccc tcc gtg gtt ccg ttg aag aag atc tac gat gtg gag cag ctg 284 Ala Pro Ser Val Val Pro Leu Lys Lys Ile Tyr Asp Val Glu Gln Leu 80 85 90 cgg tac cag gca act ggc tta cat ttc cgt cac aca gac aac atc aac 332 Arg Tyr Gln Ala Thr Gly Leu His Phe Arg His Thr Asp Asn Ile Asn 95 100 105 ttt tgg cta tct gca ata gcc cac atc ggt ctg cct tcg acc ttc ttc 380 Phe Trp Leu Ser Ala Ile Ala His Ile Gly Leu Pro Ser Thr Phe Phe 110 115 120 cca gag acc acg gac atc tat gac aaa aag aac atg ccc cgg gta gtc 428 Pro Glu Thr Thr Asp Ile Tyr Asp Lys Lys Asn Met Pro Arg Val Val 125 130 135 tac tgc atc cat gct ctc agt ctc ttc ctc ttc cgg ctg gga ttg gcc 476 Tyr Cys Ile His Ala Leu Ser Leu Phe Leu Phe Arg Leu Gly Leu Ala 140 145 150 155 cct cag ata cat gat cta tac ggg aaa gtg aaa ttc aca gct gag gaa 524 Pro Gln Ile His Asp Leu Tyr Gly Lys Val Lys Phe Thr Ala Glu Glu 160 165 170 ctc agc aac atg gcg tcc gaa ctg gcc aaa tat ggc ctc cag ctg cct 572 Leu Ser Asn Met Ala Ser Glu Leu Ala Lys Tyr Gly Leu Gln Leu Pro 175 180 185 gcc ttc agc aag atc ggg ggc atc ttg gcc aat gag ctc tcg gtg gat 620 Ala Phe Ser Lys Ile Gly Gly Ile Leu Ala Asn Glu Leu Ser Val Asp 190 195 200 gag gct gca gtc cat gca gct gtt ctt gcc atc aat gaa gca gtg gag 668 Glu Ala Ala Val His Ala Ala Val Leu Ala Ile Asn Glu Ala Val Glu 205 210 215 cga ggg gtg gtg gag gac acc ctg gct gcc ttg cag aat ccc agt gct 716 Arg Gly Val Val Glu Asp Thr Leu Ala Ala Leu Gln Asn Pro Ser Ala 220 225 230 235 ctt ctg gag aat ctc cga gag cct ctg gca gcc gtc tac cag gag atg 764 Leu Leu Glu Asn Leu Arg Glu Pro Leu Ala Ala Val Tyr Gln Glu Met 240 245 250 ctg gcc cag gcc aag atg gag aag gca gcc aat gcc agg aac cat gat 812 Leu Ala Gln Ala Lys Met Glu Lys Ala Ala Asn Ala Arg Asn His Asp 255 260 265 gac aga gaa agc cag gac atc tat gac cac tac cta act cag gct gaa 860 Asp Arg Glu Ser Gln Asp Ile Tyr Asp His Tyr Leu Thr Gln Ala Glu 270 275 280 atc cag ggc aat atc aac cat gtc aac gtc cat ggg gct cta gaa gtt 908 Ile Gln Gly Asn Ile Asn His Val Asn Val His Gly Ala Leu Glu Val 285 290 295 gtt gat gat gcc ctg gaa aga cag agc cct gaa gcc ttg ctc aag gcc 956 Val Asp Asp Ala Leu Glu Arg Gln Ser Pro Glu Ala Leu Leu Lys Ala 300 305 310 315 ctt caa gac cct gcc ctg gcc ctg cga ggg gtg agg aga gac ttt gct 1004 Leu Gln Asp Pro Ala Leu Ala Leu Arg Gly Val Arg Arg Asp Phe Ala 320 325 330 gac tgg tac ctg gag cag ctg aac tca gac aga gag cag aag gca cag 1052 Asp Trp Tyr Leu Glu Gln Leu Asn Ser Asp Arg Glu Gln Lys Ala Gln 335 340 345 gag ctg ggc ctg gtg gag ctt ctg gaa aag gag gaa gtc cag gct ggt 1100 Glu Leu Gly Leu Val Glu Leu Leu Glu Lys Glu Glu Val Gln Ala Gly 350 355 360 gtg gct gca gcc aac aca aag ggt gat cag gaa caa gcc atg ctc cac 1148 Val Ala Ala Ala Asn Thr Lys Gly Asp Gln Glu Gln Ala Met Leu His 365 370 375 gct gtg cag cgg atc aac aaa gcc atc cgg agg gga gtg gcg gct gac 1196 Ala Val Gln Arg Ile Asn Lys Ala Ile Arg Arg Gly Val Ala Ala Asp 380 385 390 395 act gtg aag gag ctg atg tgc cct gag gcc cag ctg cct cca gtg tac 1244 Thr Val Lys Glu Leu Met Cys Pro Glu Ala Gln Leu Pro Pro Val Tyr 400 405 410 cct gtt gca tcg tct atg tac cag ctg gag ctg gca gtg ctc cag cag 1292 Pro Val Ala Ser Ser Met Tyr Gln Leu Glu Leu Ala Val Leu Gln Gln 415 420 425 cag cag ggg gag ctt ggc cag gag gag ctc ttc gtg gct gtg gag atg 1340 Gln Gln Gly Glu Leu Gly Gln Glu Glu Leu Phe Val Ala Val Glu Met 430 435 440 ctc tca gct gtg gtc ctg att aac cgg gcc ctg gag gcc cgg gat gcc 1388 Leu Ser Ala Val Val Leu Ile Asn Arg Ala Leu Glu Ala Arg Asp Ala 445 450 455 agt ggc ttc tgg agc agc ctg gtg aac cct gcc aca ggc ctg gct gag 1436 Ser Gly Phe Trp Ser Ser Leu Val Asn Pro Ala Thr Gly Leu Ala Glu 460 465 470 475 gtg gaa gga gaa aat gcc cag cgt tac ttc gat gcc ctg ctg aaa ttg 1484 Val Glu Gly Glu Asn Ala Gln Arg Tyr Phe Asp Ala Leu Leu Lys Leu 480 485 490 cga cag gag cgt ggg atg ggt gag gac ttc ctg agc tgg aat gac ctg 1532 Arg Gln Glu Arg Gly Met Gly Glu Asp Phe Leu Ser Trp Asn Asp Leu 495 500 505 cag gcc acc gtg agc cag gtc aat gca cag acc cag gaa gag act gac 1580 Gln Ala Thr Val Ser Gln Val Asn Ala Gln Thr Gln Glu Glu Thr Asp 510 515 520 cgg gtc ctt gca gtc agc ctc atc aat gag gct ctg gac aaa ggc agc 1628 Arg Val Leu Ala Val Ser Leu Ile Asn Glu Ala Leu Asp Lys Gly Ser 525 530 535 cct gag aag act ctg tct gcc cta ctg ctt cct gca gct ggc cta gat 1676 Pro Glu Lys Thr Leu Ser Ala Leu Leu Leu Pro Ala Ala Gly Leu Asp 540 545 550 555 gat gtc agc ctc cct gtc gcc cct cgg tac cat ctc ctc ctt gtg gca 1724 Asp Val Ser Leu Pro Val Ala Pro Arg Tyr His Leu Leu Leu Val Ala 560 565 570 gcc aaa agg cag aag gcc cag gtg aca ggg gat cct gga gct gtg ctg 1772 Ala Lys Arg Gln Lys Ala Gln Val Thr Gly Asp Pro Gly Ala Val Leu 575 580 585 tgg ctt gag gag atc cgc cag gga gtg gtc aga gcc aac cag gac act 1820 Trp Leu Glu Glu Ile Arg Gln Gly Val Val Arg Ala Asn Gln Asp Thr 590 595 600 aat aca gct cag aga atg gct ctt ggt gtg gct gcc atc aat caa gcc 1868 Asn Thr Ala Gln Arg Met Ala Leu Gly Val Ala Ala Ile Asn Gln Ala 605 610 615 atc aag gag ggc aag gca gcc cag act gag cgg gtg ttg agg aac ccc 1916 Ile Lys Glu Gly Lys Ala Ala Gln Thr Glu Arg Val Leu Arg Asn Pro 620 625 630 635 gca gtg gcc ctt cga ggg gta gtt ccc gac tgt gcc aac ggc tac cag 1964 Ala Val Ala Leu Arg Gly Val Val Pro Asp Cys Ala Asn Gly Tyr Gln 640 645 650 cga gcc ctg gaa agt gcc atg gca aag aaa cag cgt cca gca gac aca 2012 Arg Ala Leu Glu Ser Ala Met Ala Lys Lys Gln Arg Pro Ala Asp Thr 655 660 665 gct ttc tgg gtt caa cat gac atg aag gat ggc act gcc tac tac ttc 2060 Ala Phe Trp Val Gln His Asp Met Lys Asp Gly Thr Ala Tyr Tyr Phe 670 675 680 cat ctg cag acc ttc cag ggg atc tgg gag caa cct cct ggc tgc ccc 2108 His Leu Gln Thr Phe Gln Gly Ile Trp Glu Gln Pro Pro Gly Cys Pro 685 690 695 ctc aac acc tct cac ctg acc cgg gag gag atc cag tca gct gtc acc 2156 Leu Asn Thr Ser His Leu Thr Arg Glu Glu Ile Gln Ser Ala Val Thr 700 705 710 715 aag gtc act gct gcc tat gac cgc caa cag ctc tgg aaa gcc aac gtc 2204 Lys Val Thr Ala Ala Tyr Asp Arg Gln Gln Leu Trp Lys Ala Asn Val 720 725 730 ggc ttt gtt atc cag ctc cag gcc cgc ctc cgt ggc ttc cta gtt cgg 2252 Gly Phe Val Ile Gln Leu Gln Ala Arg Leu Arg Gly Phe Leu Val Arg 735 740 745 cag aag ttt gct gag cat tcc cac ttt ctg agg acc tgg ctc cca gca 2300 Gln Lys Phe Ala Glu His Ser His Phe Leu Arg Thr Trp Leu Pro Ala 750 755 760 gtc atc aag atc cag gct cat tgg cgg ggt tat agg cag cgg aag att 2348 Val Ile Lys Ile Gln Ala His Trp Arg Gly Tyr Arg Gln Arg Lys Ile 765 770 775 tac ctg gag tgg ttg cag tat ttt aaa gca aac ctg gat gcc ata atc 2396 Tyr Leu Glu Trp Leu Gln Tyr Phe Lys Ala Asn Leu Asp Ala Ile Ile 780 785 790 795 aag atc cag gcc tgg gcc cgg atg tgg gca gct cgg agg caa tac ctg 2444 Lys Ile Gln Ala Trp Ala Arg Met Trp Ala Ala Arg Arg Gln Tyr Leu 800 805 810 agg cgt ctg cac tac ttc cag aag aat gtt aac tcc att gtg aag atc 2492 Arg Arg Leu His Tyr Phe Gln Lys Asn Val Asn Ser Ile Val Lys Ile 815 820 825 cag gca ttt ttc cga gcc agg aaa gcc caa gat gac tac agg ata tta 2540 Gln Ala Phe Phe Arg Ala Arg Lys Ala Gln Asp Asp Tyr Arg Ile Leu 830 835 840 gtg cat gca ccc cac cct cct ctc agt gtg gta cgc aga ttt gcc cat 2588 Val His Ala Pro His Pro Pro Leu Ser Val Val Arg Arg Phe Ala His 845 850 855 ctc ttg aat caa agc cag caa gac ttc ttg gct gag gca gag ctg ctg 2636 Leu Leu Asn Gln Ser Gln Gln Asp Phe Leu Ala Glu Ala Glu Leu Leu 860 865 870 875 aag ctc cag gaa gag gta gtt agg aag atc cga tcc aat cag cag ctg 2684 Lys Leu Gln Glu Glu Val Val Arg Lys Ile Arg Ser Asn Gln Gln Leu 880 885 890 gag cag gac ctc aac atc atg gac atc aag att ggc ctg ctg gtg aag 2732 Glu Gln Asp Leu Asn Ile Met Asp Ile Lys Ile Gly Leu Leu Val Lys 895 900 905 aac cgg atc act ctg cag gaa gtg gtc tcc cac tgc aag aag ctg acc 2780 Asn Arg Ile Thr Leu Gln Glu Val Val Ser His Cys Lys Lys Leu Thr 910 915 920 aag agg aat aag gaa cag ctg tca gat atg atg gtt ctg gac aag cag 2828 Lys Arg Asn Lys Glu Gln Leu Ser Asp Met Met Val Leu Asp Lys Gln 925 930 935 aag ggt tta aag tcg ctg agc aaa gag aaa cgg cag aaa cta gaa gca 2876 Lys Gly Leu Lys Ser Leu Ser Lys Glu Lys Arg Gln Lys Leu Glu Ala 940 945 950 955 tac caa cac ctc ttc tac ctg ctc cag act cag ccc atc tac ctg gcc 2924 Tyr Gln His Leu Phe Tyr Leu Leu Gln Thr Gln Pro Ile Tyr Leu Ala 960 965 970 aag ctg atc ttt cag atg cca cag aac aaa acc acc aag ttc atg gag 2972 Lys Leu Ile Phe Gln Met Pro Gln Asn Lys Thr Thr Lys Phe Met Glu 975 980 985 gca gtg att ttc agc ctg tac aac tat gcc tcc agc cgc cga gag gcc 3020 Ala Val Ile Phe Ser Leu Tyr Asn Tyr Ala Ser Ser Arg Arg Glu Ala 990 995 1000 tat ctc ctg ctc cag ctg ttc aag aca gca ctc cag gag gaa atc aag 3068 Tyr Leu Leu Leu Gln Leu Phe Lys Thr Ala Leu Gln Glu Glu Ile Lys 1005 1010 1015 tca aag gtg gag cag ccc cag gac gtg gtg aca ggc aac cca aca gtg 3116 Ser Lys Val Glu Gln Pro Gln Asp Val Val Thr Gly Asn Pro Thr Val 1020 1025 1030 1035 gtg agg ctg gtg gtg aga ttc tac cgt aat ggg cgg gga cag agt gcc 3164 Val Arg Leu Val Val Arg Phe Tyr Arg Asn Gly Arg Gly Gln Ser Ala 1040 1045 1050 ctg cag gag att ctg ggc aag gtt atc cag gat gtg cta gaa gac aaa 3212 Leu Gln Glu Ile Leu Gly Lys Val Ile Gln Asp Val Leu Glu Asp Lys 1055 1060 1065 gtg ctc agc gtc cac aca gac cct gtc cac ctc tat aag aac tgg atc 3260 Val Leu Ser Val His Thr Asp Pro Val His Leu Tyr Lys Asn Trp Ile 1070 1075 1080 aac cag act gag gcc cag aca ggg cag cgc agc cat ctc cca tat gat 3308 Asn Gln Thr Glu Ala Gln Thr Gly Gln Arg Ser His Leu Pro Tyr Asp 1085 1090 1095 gtc acc ccg gag cag gcc ttg agc cac ccc gag gtc cag aga cga ctg 3356 Val Thr Pro Glu Gln Ala Leu Ser His Pro Glu Val Gln Arg Arg Leu 1100 1105 1110 1115 gac atc gcc cta cgc aac ctc ctc gcc atg act gat aag ttc ctt tta 3404 Asp Ile Ala Leu Arg Asn Leu Leu Ala Met Thr Asp Lys Phe Leu Leu 1120 1125 1130 gcc atc acc tca tct gtg gac caa att ccg tat ggg atg cga tat gtg 3452 Ala Ile Thr Ser Ser Val Asp Gln Ile Pro Tyr Gly Met Arg Tyr Val 1135 1140 1145 gcc aaa gtc ctg aag gca act ctg gca gag aaa ttc cct gac gcc aca 3500 Ala Lys Val Leu Lys Ala Thr Leu Ala Glu Lys Phe Pro Asp Ala Thr 1150 1155 1160 gac agc gag gtc tat aag gtg gtc ggg aac ctc ctg tac tac cgc ttc 3548 Asp Ser Glu Val Tyr Lys Val Val Gly Asn Leu Leu Tyr Tyr Arg Phe 1165 1170 1175 ctg aac cca gct gtg gtg gct cct gac gcc ttc gac att gtg gcc atg 3596 Leu Asn Pro Ala Val Val Ala Pro Asp Ala Phe Asp Ile Val Ala Met 1180 1185 1190 1195 gca gct ggt gga gcc ctg gct gcc ccc cag cgc cat gcc ctg ggg gct 3644 Ala Ala Gly Gly Ala Leu Ala Ala Pro Gln Arg His Ala Leu Gly Ala 1200 1205 1210 gtg gct cag ctc cta cag cac gct gcg gct ggc aag gcc ttc tct ggg 3692 Val Ala Gln Leu Leu Gln His Ala Ala Ala Gly Lys Ala Phe Ser Gly 1215 1220 1225 cag agc cag cac cta cgg gtc ctg aat gac tat ctg gag gaa aca cac 3740 Gln Ser Gln His Leu Arg Val Leu Asn Asp Tyr Leu Glu Glu Thr His 1230 1235 1240 ctc aag ttc agg aag ttc atc cat aga gcc tgc cag gtg cca gag cca 3788 Leu Lys Phe Arg Lys Phe Ile His Arg Ala Cys Gln Val Pro Glu Pro 1245 1250 1255 gag gag cgt ttt gca gtg gac gag tac tca gac atg gtg gct gtg gcc 3836 Glu Glu Arg Phe Ala Val Asp Glu Tyr Ser Asp Met Val Ala Val Ala 1260 1265 1270 1275 aaa ccc atg gtg tac atc acc gtg ggg gag ctg gtc aac acg cac agg 3884 Lys Pro Met Val Tyr Ile Thr Val Gly Glu Leu Val Asn Thr His Arg 1280 1285 1290 ctg ttg ctg gag cac cag gac tgc att gcc cct gat cac caa gac ccc 3932 Leu Leu Leu Glu His Gln Asp Cys Ile Ala Pro Asp His Gln Asp Pro 1295 1300 1305 ctg cat gag ctc ctg gag gat ctt ggg gag ctg ccc acc atc cct gac 3980 Leu His Glu Leu Leu Glu Asp Leu Gly Glu Leu Pro Thr Ile Pro Asp 1310 1315 1320 ctt att ggt gag agc atc gct gca gat ggg cac aca gac ctg agc aag 4028 Leu Ile Gly Glu Ser Ile Ala Ala Asp Gly His Thr Asp Leu Ser Lys 1325 1330 1335 cta gaa gtg tcc ctg acg ctg acc aac aag ttt gaa gga cta gag gca 4076 Leu Glu Val Ser Leu Thr Leu Thr Asn Lys Phe Glu Gly Leu Glu Ala 1340 1345 1350 1355 gat gct gat gac tcc aac acc cgt agc ctg ctt ctg agc acc aag cag 4124 Asp Ala Asp Asp Ser Asn Thr Arg Ser Leu Leu Leu Ser Thr Lys Gln 1360 1365 1370 ctg ttg gcc gat atc ata cag ttc cat cct ggg gac acc ctc aag gag 4172 Leu Leu Ala Asp Ile Ile Gln Phe His Pro Gly Asp Thr Leu Lys Glu 1375 1380 1385 atc ctg tcc ctc tcg gct tcc aga gag caa gaa gca gcc cac aag cag 4220 Ile Leu Ser Leu Ser Ala Ser Arg Glu Gln Glu Ala Ala His Lys Gln 1390 1395 1400 ctg atg agc cga cgc cag gcc tgt aca gcc cag aca ccg gag cca ctg 4268 Leu Met Ser Arg Arg Gln Ala Cys Thr Ala Gln Thr Pro Glu Pro Leu 1405 1410 1415 cga cga cac cgc tca ctg aca gct cac tcc ctc ctg cca ctg gca gag 4316 Arg Arg His Arg Ser Leu Thr Ala His Ser Leu Leu Pro Leu Ala Glu 1420 1425 1430 1435 aag cag cgg cgc gtc ctg cgg aac ctg cgc cga ctt gaa gcc ctg ggg 4364 Lys Gln Arg Arg Val Leu Arg Asn Leu Arg Arg Leu Glu Ala Leu Gly 1440 1445 1450 ttg gtc agc gcc aga aat ggc tac cag ggg cta gtg gac gag ctg gcc 4412 Leu Val Ser Ala Arg Asn Gly Tyr Gln Gly Leu Val Asp Glu Leu Ala 1455 1460 1465 aag gac atc cgc aac cag cac aga cac agg cac agg cgg aag gca gag 4460 Lys Asp Ile Arg Asn Gln His Arg His Arg His Arg Arg Lys Ala Glu 1470 1475 1480 ctg gtg aag ctg cag gcc aca tta cag ggc ctg agc act aag acc acc 4508 Leu Val Lys Leu Gln Ala Thr Leu Gln Gly Leu Ser Thr Lys Thr Thr 1485 1490 1495 ttc tat gag gag cag ggt gac tac tac agc cag tac atc cgg gcc tgc 4556 Phe Tyr Glu Glu Gln Gly Asp Tyr Tyr Ser Gln Tyr Ile Arg Ala Cys 1500 1505 1510 1515 ctg gac cac ctg gcc ccc gac tcc aag agt tct ggg aag ggg aag aag 4604 Leu Asp His Leu Ala Pro Asp Ser Lys Ser Ser Gly Lys Gly Lys Lys 1520 1525 1530 cag cct tct ctt cat tac act gct gct cag ctc ctg gaa aag ggt gtc 4652 Gln Pro Ser Leu His Tyr Thr Ala Ala Gln Leu Leu Glu Lys Gly Val 1535 1540 1545 ttg gtg gaa att gaa gat ctt ccc gcc tct cac ttc aga aac gtc atc 4700 Leu Val Glu Ile Glu Asp Leu Pro Ala Ser His Phe Arg Asn Val Ile 1550 1555 1560 ttt gac atc acg ccg gga gat gag gca gga aag ttt gaa gta aat gcc 4748 Phe Asp Ile Thr Pro Gly Asp Glu Ala Gly Lys Phe Glu Val Asn Ala 1565 1570 1575 aag ttc ctg ggt gtg gac atg gag cga ttt cag ctt cac tat cag gat 4796 Lys Phe Leu Gly Val Asp Met Glu Arg Phe Gln Leu His Tyr Gln Asp 1580 1585 1590 1595 ctc ctg cag ctc cag tat gag ggt gtg gct gtc atg aaa ctc ttc aac 4844 Leu Leu Gln Leu Gln Tyr Glu Gly Val Ala Val Met Lys Leu Phe Asn 1600 1605 1610 aag gcc aaa gtc aat gtc aac ctt ctc atc ttc ctc ctc aac aag aag 4892 Lys Ala Lys Val Asn Val Asn Leu Leu Ile Phe Leu Leu Asn Lys Lys 1615 1620 1625 ttt ttg cgg aag tgacag aggcaaaggg tgctacccaa gcccctctta 4940 Phe Leu Arg Lys 1630 cctctctgga tgctttcttt aacactaact caccactgtg cttccctgca gacacccaga 5000 gctcaggact gggcaaggcc cagggattct caccccttcc ccagctggga ggagcttgcc 5060 tgcctggcca cagacagtgt atcttctaat tggctaaagt gggccttgcc cagagtccag 5120 ctgtgtggct tttatcatgc atgacaaacc cctggctttc ctgccagatg gattctcatc 5180 ccttacagct gactcttcca ggcaatttcc atagatctgc agtcctgcct ctgccacagt 5240 ctctctgttg tccccacatc tacccaactt cctgtactgt tgcccttctg atgttaataa 5300 aagcagctgt tactccc 5317 <210> 4 <211> 1631 <212> PRT <213> Homo sapiens <400> 4 Met Glu Arg Arg Ala Ala Gly Pro Gly Trp Ala Ala Tyr Glu Arg Leu 1 5 10 15 Thr Ala Glu Glu Met Asp Glu Gln Arg Arg Gln Asn Val Ala Tyr Gln 20 25 30 Tyr Leu Cys Arg Leu Glu Glu Ala Lys Arg Trp Met Glu Ala Cys Leu 35 40 45 Lys Glu Glu Leu Pro Ser Pro Val Glu Leu Glu Glu Ser Leu Arg Asn 50 55 60 Gly Val Leu Leu Ala Lys Leu Gly His Cys Phe Ala Pro Ser Val Val 65 70 75 80 Pro Leu Lys Lys Ile Tyr Asp Val Glu Gln Leu Arg Tyr Gln Ala Thr 85 90 95 Gly Leu His Phe Arg His Thr Asp Asn Ile Asn Phe Trp Leu Ser Ala 100 105 110 Ile Ala His Ile Gly Leu Pro Ser Thr Phe Phe Pro Glu Thr Thr Asp 115 120 125 Ile Tyr Asp Lys Lys Asn Met Pro Arg Val Val Tyr Cys Ile His Ala 130 135 140 Leu Ser Leu Phe Leu Phe Arg Leu Gly Leu Ala Pro Gln Ile His Asp 145 150 155 160 Leu Tyr Gly Lys Val Lys Phe Thr Ala Glu Glu Leu Ser Asn Met Ala 165 170 175 Ser Glu Leu Ala Lys Tyr Gly Leu Gln Leu Pro Ala Phe Ser Lys Ile 180 185 190 Gly Gly Ile Leu Ala Asn Glu Leu Ser Val Asp Glu Ala Ala Val His 195 200 205 Ala Ala Val Leu Ala Ile Asn Glu Ala Val Glu Arg Gly Val Val Glu 210 215 220 Asp Thr Leu Ala Ala Leu Gln Asn Pro Ser Ala Leu Leu Glu Asn Leu 225 230 235 240 Arg Glu Pro Leu Ala Ala Val Tyr Gln Glu Met Leu Ala Gln Ala Lys 245 250 255 Met Glu Lys Ala Ala Asn Ala Arg Asn His Asp Asp Arg Glu Ser Gln 260 265 270 Asp Ile Tyr Asp His Tyr Leu Thr Gln Ala Glu Ile Gln Gly Asn Ile 275 280 285 Asn His Val Asn Val His Gly Ala Leu Glu Val Val Asp Asp Ala Leu 290 295 300 Glu Arg Gln Ser Pro Glu Ala Leu Leu Lys Ala Leu Gln Asp Pro Ala 305 310 315 320 Leu Ala Leu Arg Gly Val Arg Arg Asp Phe Ala Asp Trp Tyr Leu Glu 325 330 335 Gln Leu Asn Ser Asp Arg Glu Gln Lys Ala Gln Glu Leu Gly Leu Val 340 345 350 Glu Leu Leu Glu Lys Glu Glu Val Gln Ala Gly Val Ala Ala Ala Asn 355 360 365 Thr Lys Gly Asp Gln Glu Gln Ala Met Leu His Ala Val Gln Arg Ile 370 375 380 Asn Lys Ala Ile Arg Arg Gly Val Ala Ala Asp Thr Val Lys Glu Leu 385 390 395 400 Met Cys Pro Glu Ala Gln Leu Pro Pro Val Tyr Pro Val Ala Ser Ser 405 410 415 Met Tyr Gln Leu Glu Leu Ala Val Leu Gln Gln Gln Gln Gly Glu Leu 420 425 430 Gly Gln Glu Glu Leu Phe Val Ala Val Glu Met Leu Ser Ala Val Val 435 440 445 Leu Ile Asn Arg Ala Leu Glu Ala Arg Asp Ala Ser Gly Phe Trp Ser 450 455 460 Ser Leu Val Asn Pro Ala Thr Gly Leu Ala Glu Val Glu Gly Glu Asn 465 470 475 480 Ala Gln Arg Tyr Phe Asp Ala Leu Leu Lys Leu Arg Gln Glu Arg Gly 485 490 495 Met Gly Glu Asp Phe Leu Ser Trp Asn Asp Leu Gln Ala Thr Val Ser 500 505 510 Gln Val Asn Ala Gln Thr Gln Glu Glu Thr Asp Arg Val Leu Ala Val 515 520 525 Ser Leu Ile Asn Glu Ala Leu Asp Lys Gly Ser Pro Glu Lys Thr Leu 530 535 540 Ser Ala Leu Leu Leu Pro Ala Ala Gly Leu Asp Asp Val Ser Leu Pro 545 550 555 560 Val Ala Pro Arg Tyr His Leu Leu Leu Val Ala Ala Lys Arg Gln Lys 565 570 575 Ala Gln Val Thr Gly Asp Pro Gly Ala Val Leu Trp Leu Glu Glu Ile 580 585 590 Arg Gln Gly Val Val Arg Ala Asn Gln Asp Thr Asn Thr Ala Gln Arg 595 600 605 Met Ala Leu Gly Val Ala Ala Ile Asn Gln Ala Ile Lys Glu Gly Lys 610 615 620 Ala Ala Gln Thr Glu Arg Val Leu Arg Asn Pro Ala Val Ala Leu Arg 625 630 635 640 Gly Val Val Pro Asp Cys Ala Asn Gly Tyr Gln Arg Ala Leu Glu Ser 645 650 655 Ala Met Ala Lys Lys Gln Arg Pro Ala Asp Thr Ala Phe Trp Val Gln 660 665 670 His Asp Met Lys Asp Gly Thr Ala Tyr Tyr Phe His Leu Gln Thr Phe 675 680 685 Gln Gly Ile Trp Glu Gln Pro Pro Gly Cys Pro Leu Asn Thr Ser His 690 695 700 Leu Thr Arg Glu Glu Ile Gln Ser Ala Val Thr Lys Val Thr Ala Ala 705 710 715 720 Tyr Asp Arg Gln Gln Leu Trp Lys Ala Asn Val Gly Phe Val Ile Gln 725 730 735 Leu Gln Ala Arg Leu Arg Gly Phe Leu Val Arg Gln Lys Phe Ala Glu 740 745 750 His Ser His Phe Leu Arg Thr Trp Leu Pro Ala Val Ile Lys Ile Gln 755 760 765 Ala His Trp Arg Gly Tyr Arg Gln Arg Lys Ile Tyr Leu Glu Trp Leu 770 775 780 Gln Tyr Phe Lys Ala Asn Leu Asp Ala Ile Ile Lys Ile Gln Ala Trp 785 790 795 800 Ala Arg Met Trp Ala Ala Arg Arg Gln Tyr Leu Arg Arg Leu His Tyr 805 810 815 Phe Gln Lys Asn Val Asn Ser Ile Val Lys Ile Gln Ala Phe Phe Arg 820 825 830 Ala Arg Lys Ala Gln Asp Asp Tyr Arg Ile Leu Val His Ala Pro His 835 840 845 Pro Pro Leu Ser Val Val Arg Arg Phe Ala His Leu Leu Asn Gln Ser 850 855 860 Gln Gln Asp Phe Leu Ala Glu Ala Glu Leu Leu Lys Leu Gln Glu Glu 865 870 875 880 Val Val Arg Lys Ile Arg Ser Asn Gln Gln Leu Glu Gln Asp Leu Asn 885 890 895 Ile Met Asp Ile Lys Ile Gly Leu Leu Val Lys Asn Arg Ile Thr Leu 900 905 910 Gln Glu Val Val Ser His Cys Lys Lys Leu Thr Lys Arg Asn Lys Glu 915 920 925 Gln Leu Ser Asp Met Met Val Leu Asp Lys Gln Lys Gly Leu Lys Ser 930 935 940 Leu Ser Lys Glu Lys Arg Gln Lys Leu Glu Ala Tyr Gln His Leu Phe 945 950 955 960 Tyr Leu Leu Gln Thr Gln Pro Ile Tyr Leu Ala Lys Leu Ile Phe Gln 965 970 975 Met Pro Gln Asn Lys Thr Thr Lys Phe Met Glu Ala Val Ile Phe Ser 980 985 990 Leu Tyr Asn Tyr Ala Ser Ser Arg Arg Glu Ala Tyr Leu Leu Leu Gln 995 1000 1005 Leu Phe Lys Thr Ala Leu Gln Glu Glu Ile Lys Ser Lys Val Glu Gln 1010 1015 1020 Pro Gln Asp Val Val Thr Gly Asn Pro Thr Val Val Arg Leu Val Val 1025 1030 1035 1040 Arg Phe Tyr Arg Asn Gly Arg Gly Gln Ser Ala Leu Gln Glu Ile Leu 1045 1050 1055 Gly Lys Val Ile Gln Asp Val Leu Glu Asp Lys Val Leu Ser Val His 1060 1065 1070 Thr Asp Pro Val His Leu Tyr Lys Asn Trp Ile Asn Gln Thr Glu Ala 1075 1080 1085 Gln Thr Gly Gln Arg Ser His Leu Pro Tyr Asp Val Thr Pro Glu Gln 1090 1095 1100 Ala Leu Ser His Pro Glu Val Gln Arg Arg Leu Asp Ile Ala Leu Arg 1105 1110 1115 1120 Asn Leu Leu Ala Met Thr Asp Lys Phe Leu Leu Ala Ile Thr Ser Ser 1125 1130 1135 Val Asp Gln Ile Pro Tyr Gly Met Arg Tyr Val Ala Lys Val Leu Lys 1140 1145 1150 Ala Thr Leu Ala Glu Lys Phe Pro Asp Ala Thr Asp Ser Glu Val Tyr 1155 1160 1165 Lys Val Val Gly Asn Leu Leu Tyr Tyr Arg Phe Leu Asn Pro Ala Val 1170 1175 1180 Val Ala Pro Asp Ala Phe Asp Ile Val Ala Met Ala Ala Gly Gly Ala 1185 1190 1195 1200 Leu Ala Ala Pro Gln Arg His Ala Leu Gly Ala Val Ala Gln Leu Leu 1205 1210 1215 Gln His Ala Ala Ala Gly Lys Ala Phe Ser Gly Gln Ser Gln His Leu 1220 1225 1230 Arg Val Leu Asn Asp Tyr Leu Glu Glu Thr His Leu Lys Phe Arg Lys 1235 1240 1245 Phe Ile His Arg Ala Cys Gln Val Pro Glu Pro Glu Glu Arg Phe Ala 1250 1255 1260 Val Asp Glu Tyr Ser Asp Met Val Ala Val Ala Lys Pro Met Val Tyr 1265 1270 1275 1280 Ile Thr Val Gly Glu Leu Val Asn Thr His Arg Leu Leu Leu Glu His 1285 1290 1295 Gln Asp Cys Ile Ala Pro Asp His Gln Asp Pro Leu His Glu Leu Leu 1300 1305 1310 Glu Asp Leu Gly Glu Leu Pro Thr Ile Pro Asp Leu Ile Gly Glu Ser 1315 1320 1325 Ile Ala Ala Asp Gly His Thr Asp Leu Ser Lys Leu Glu Val Ser Leu 1330 1335 1340 Thr Leu Thr Asn Lys Phe Glu Gly Leu Glu Ala Asp Ala Asp Asp Ser 1345 1350 1355 1360 Asn Thr Arg Ser Leu Leu Leu Ser Thr Lys Gln Leu Leu Ala Asp Ile 1365 1370 1375 Ile Gln Phe His Pro Gly Asp Thr Leu Lys Glu Ile Leu Ser Leu Ser 1380 1385 1390 Ala Ser Arg Glu Gln Glu Ala Ala His Lys Gln Leu Met Ser Arg Arg 1395 1400 1405 Gln Ala Cys Thr Ala Gln Thr Pro Glu Pro Leu Arg Arg His Arg Ser 1410 1415 1420 Leu Thr Ala His Ser Leu Leu Pro Leu Ala Glu Lys Gln Arg Arg Val 1425 1430 1435 1440 Leu Arg Asn Leu Arg Arg Leu Glu Ala Leu Gly Leu Val Ser Ala Arg 1445 1450 1455 Asn Gly Tyr Gln Gly Leu Val Asp Glu Leu Ala Lys Asp Ile Arg Asn 1460 1465 1470 Gln His Arg His Arg His Arg Arg Lys Ala Glu Leu Val Lys Leu Gln 1475 1480 1485 Ala Thr Leu Gln Gly Leu Ser Thr Lys Thr Thr Phe Tyr Glu Glu Gln 1490 1495 1500 Gly Asp Tyr Tyr Ser Gln Tyr Ile Arg Ala Cys Leu Asp His Leu Ala 1505 1510 1515 1520 Pro Asp Ser Lys Ser Ser Gly Lys Gly Lys Lys Gln Pro Ser Leu His 1525 1530 1535 Tyr Thr Ala Ala Gln Leu Leu Glu Lys Gly Val Leu Val Glu Ile Glu 1540 1545 1550 Asp Leu Pro Ala Ser His Phe Arg Asn Val Ile Phe Asp Ile Thr Pro 1555 1560 1565 Gly Asp Glu Ala Gly Lys Phe Glu Val Asn Ala Lys Phe Leu Gly Val 1570 1575 1580 Asp Met Glu Arg Phe Gln Leu His Tyr Gln Asp Leu Leu Gln Leu Gln 1585 1590 1595 1600 Tyr Glu Gly Val Ala Val Met Lys Leu Phe Asn Lys Ala Lys Val Asn 1605 1610 1615 Val Asn Leu Leu Ile Phe Leu Leu Asn Lys Lys Phe Leu Arg Lys 1620 1625 1630 <210> 5 <211> 3608 <212> DNA <213> Homo sapiens <220> <221> CDS <222> (424)..(1908) <223> Clone LBFL110 <400> 5 ggcggcgaga gcagctgcag ctcgcatctc aggcagtacc tagaggagct gccggtgcct 60 cctcagaaca tctcctgatc gctacccagg accaggcacc aaggacaggg agtcccaggc 120 gcacaccccc cattctgggt cccccaggcc cagaccccca ctctgccaca ggttgcatct 180 tgacctggtc ctcctgcaga agtggcccct gtggtcctgc tctgagactc gtccctgggc 240 gcccctgcag cccctttcta tgactccatc tggatttggc tggctgtggg gacgcggtcc 300 gaggggcggc ctggctctca gcgtggtggc agccagctct ctggccacca tggcaaatgc 360 tgagatctga ggggacaagg ctctacagcc tcagccaggg gcactcagct gttgcagggt 420 gtg atg gag aac aaa gct atg tac cta cac acc gtc agc gac tgt 465 Met Glu Asn Lys Ala Met Tyr Leu His Thr Val Ser Asp Cys 1 5 10 gac acc agc tcc atc tgt gag gat tcc ttt gat ggc agg agc ctg tcc 513 Asp Thr Ser Ser Ile Cys Glu Asp Ser Phe Asp Gly Arg Ser Leu Ser 15 20 25 30 aag ctg aac ctg tgt gag gat ggt cca tgt cac aaa cgg cgg gca agc 561 Lys Leu Asn Leu Cys Glu Asp Gly Pro Cys His Lys Arg Arg Ala Ser 35 40 45 atc tgc tgt acc cag ctg ggg tcc ctg tcg gcc ctg aag cat gct gtc 609 Ile Cys Cys Thr Gln Leu Gly Ser Leu Ser Ala Leu Lys His Ala Val 50 55 60 ctg ggg ctc tac ctg ctg gtc ttc ctg att ctt gtg ggc atc ttc atc 657 Leu Gly Leu Tyr Leu Leu Val Phe Leu Ile Leu Val Gly Ile Phe Ile 65 70 75 tta gca gtg tcc agg ccg cgc agc tcc cct gac gac ctg aag gcc ctg 705 Leu Ala Val Ser Arg Pro Arg Ser Ser Pro Asp Asp Leu Lys Ala Leu 80 85 90 act cgc aat gtg aac cgg ctg aat gag agc ttc cgg gac ttg cag ctg 753 Thr Arg Asn Val Asn Arg Leu Asn Glu Ser Phe Arg Asp Leu Gln Leu 95 100 105 110 cgg ctg ctg cag gct ccg ctg caa gcg gac ctg acg gag cag gtg tgg 801 Arg Leu Leu Gln Ala Pro Leu Gln Ala Asp Leu Thr Glu Gln Val Trp 115 120 125 aag gtg cag gac gcg ctg cag aac cag tca gac tcg ttg ctg gcg ctg 849 Lys Val Gln Asp Ala Leu Gln Asn Gln Ser Asp Ser Leu Leu Ala Leu 130 135 140 gcg ggc gca gtg cag cgg ctg gag ggc gcg ctg tgg ggg ctg cag gcg 897 Ala Gly Ala Val Gln Arg Leu Glu Gly Ala Leu Trp Gly Leu Gln Ala 145 150 155 cag gcg gtg cag acc gag cag gcg gtg gcc ctg ctg cgg gac cgc acg 945 Gln Ala Val Gln Thr Glu Gln Ala Val Ala Leu Leu Arg Asp Arg Thr 160 165 170 ggc cag cag agc gac acg gcg cag ctg gag ctc tac cag ctg cag gtg 993 Gly Gln Gln Ser Asp Thr Ala Gln Leu Glu Leu Tyr Gln Leu Gln Val 175 180 185 190 gag agc aac agt agc cag ctg ctg ctg agg cgc cac gcg ggc ctg ctg 1041 Glu Ser Asn Ser Ser Gln Leu Leu Leu Arg Arg His Ala Gly Leu Leu 195 200 205 gac ggg ctg gcg cgc agg gtg ggc atc ctg ggc gag gag ctg gcc gac 1089 Asp Gly Leu Ala Arg Arg Val Gly Ile Leu Gly Glu Glu Leu Ala Asp 210 215 220 gtg ggc ggc gtg ctg cgc ggc ctc aac cac agc ctg tcc tac gac gtg 1137 Val Gly Gly Val Leu Arg Gly Leu Asn His Ser Leu Ser Tyr Asp Val 225 230 235 gcc ctc cac cgc acg cgg ctg cag gac ctg cgg gtg ctg gtg agc aac 1185 Ala Leu His Arg Thr Arg Leu Gln Asp Leu Arg Val Leu Val Ser Asn 240 245 250 gcc agc gag gac acg cgc cgc ctg cgc ctg gcg cac gta ggc atg gag 1233 Ala Ser Glu Asp Thr Arg Arg Leu Arg Leu Ala His Val Gly Met Glu 255 260 265 270 ctg cag ctg aag cag gag ctg gcc atg ctc aac gcg gtc acc gag gac 1281 Leu Gln Leu Lys Gln Glu Leu Ala Met Leu Asn Ala Val Thr Glu Asp 275 280 285 ctg cgc ctc aag gac tgg gag cac tcc atc gca ctg cgg aac atc tcc 1329 Leu Arg Leu Lys Asp Trp Glu His Ser Ile Ala Leu Arg Asn Ile Ser 290 295 300 ctc gcg aaa ggg cca ccg gga ccc aaa ggt gat cag ggg cat gaa gga 1377 Leu Ala Lys Gly Pro Pro Gly Pro Lys Gly Asp Gln Gly His Glu Gly 305 310 315 aag gaa ggc agg cct ggc atc cct gga ttg cct gga ctt cga ggt ctg 1425 Lys Glu Gly Arg Pro Gly Ile Pro Gly Leu Pro Gly Leu Arg Gly Leu 320 325 330 ccc ggg gag aga ggt acc cca gga ttg ccc ggg ccc aag ggc gat gat 1473 Pro Gly Glu Arg Gly Thr Pro Gly Leu Pro Gly Pro Lys Gly Asp Asp 335 340 345 350 ggg aag ctg ggg gcc aca gga cca atg ggc atg cgt ggg ttc aaa ggt 1521 Gly Lys Leu Gly Ala Thr Gly Pro Met Gly Met Arg Gly Phe Lys Gly 355 360 365 gac cga ggc cca aaa gga gag aaa gga gag aaa gga gac aga gct ggg 1569 Asp Arg Gly Pro Lys Gly Glu Lys Gly Glu Lys Gly Asp Arg Ala Gly 370 375 380 gat gcc agt ggc gtg gag gcc ccg atg atg atc cgc ctg gtg aat ggc 1617 Asp Ala Ser Gly Val Glu Ala Pro Met Met Ile Arg Leu Val Asn Gly 385 390 395 tca ggt ccg cac gag ggc cgc gtg gaa gtg tac cac gac cgg cgt tgg 1665 Ser Gly Pro His Glu Gly Arg Val Glu Val Tyr His Asp Arg Arg Trp 400 405 410 ggc acc gtg tgt gac gac ggc tgg gac aag aag gac gga gac gtg gtg 1713 Gly Thr Val Cys Asp Asp Gly Trp Asp Lys Lys Asp Gly Asp Val Val 415 420 425 430 tgc cgc atg ctc ggc ttc cgc ggt gtg gag gag gtg tac cgc aca gct 1761 Cys Arg Met Leu Gly Phe Arg Gly Val Glu Glu Val Tyr Arg Thr Ala 435 440 445 cga ttc ggg caa ggc act ggg agg atc tgg atg gat gac gtt gcc tgc 1809 Arg Phe Gly Gln Gly Thr Gly Arg Ile Trp Met Asp Asp Val Ala Cys 450 455 460 aag ggc aca gag gaa acc atc ttc cgc tgc agc ttc tcc aaa tgg ggg 1857 Lys Gly Thr Glu Glu Thr Ile Phe Arg Cys Ser Phe Ser Lys Trp Gly 465 470 475 gtg aca aac tgt gga cat gcc gaa gat gcc agc gtg aca tgc aac aga 1905 Val Thr Asn Cys Gly His Ala Glu Asp Ala Ser Val Thr Cys Asn Arg 480 485 490 cac tg aaagtgggca gagcccaagt tcggggtcct gcacagagca cccttcctgc 1960 His 495 atccctgggg tggggcacag ctcggggcca ccctgaccat gcctcgacca caccccgtcc 2020 agcattctca gtcctcacac ctgcatccca ggaccgtggg ggccggtcgt catttccctc 2080 ttgaacatgt gctccgaagt ataactctgg gacctactgc ccgtctctct cttccaccag 2140 gttcctgcat gaggagccct gatcaactgg atcaccactt tgcccagcct ctgaacacca 2200 tgcaccaggc ctcaatatcc cagttccctt tggcctttta gttacaggtg aatgctgaga 2260 atgtgtcaga gacaagtgca gcagcagcga tggttggtag tatagatcat ttactcttca 2320 gacaattccc aaacctccat tagtccaaga gtttctacat cttcctcccc agcaagaggc 2380 aacgtcaagt gatgaatttc ccccctttac tctgcctctg ctccccattt gctagtttga 2440 ggaagtgaca tagaggagaa gccagctgta ggggcaagag ggaaatgcaa gtcacctgca 2500 ggaatccagc tagatttgga gaagggaatg aaactaacat tgaatgacta ccatggcacg 2560 ctaaatagta tcttgggtgc caaattcatg tatccactta gctgcattgg tccagggcat 2620 gtcagtctgg atacagcctt acctccaggt agcacttaac tggtccattc acctagactg 2680 caagtaagaa gacaaaatga ctgagaccgt gtgcccacct gaacttattg tctttacttg 2740 gcctgagcta aaagcttggg tgcaggacct gtgtaactag aaagttgcct acttcagaac 2800 ctccagggcg tgagtgcaag gtcaaacatg actggcttcc aggccgacca tcaatgtagg 2860 aggagagctg atgtggaggg tgacatgggg gctgcccatg ttaaacctga gtccagtgct 2920 ctggcattgg gcagtcacgg ttaaagccaa gtcatgtgtg tctcagctgt ttggaggtga 2980 tgattttgca tcttccaagc ctcttcaggt gtgaatctgt ggtcaggaaa acacaagtcc 3040 taatggaacc cttagggggg aaggaaatga agattcccta taacctctgg gggtggggag 3100 taggaataag gggcttgggc ctccataaat ctgcaatctg caccctcctc ctagagacag 3160 ggagatcgtg ttctgctttt tacatgagga gcagaactgg gccatacaca tgttcaagaa 3220 ctaggggagc tacctggtag caagtgagtg cagacccacc tcaccttggg ggaatctcaa 3280 actcataggc ctcagataca cgatcacctg tcatatcagg tgagcactgg cctgcttggg 3340 gagagacctg ggcccctcca ggtgtaggaa cagcaacact cctggctgac aactaagcca 3400 atatggccct aggtcattct tgcttccaat atgcttgcca ctccttaaat gtcctaatga 3460 tgagaaactc tctttctgac caattgctat gtttacataa cacgcatgta ctcatgcatc 3520 ccttgccaga gcccatatat gtatgcatat ataaacatag cactttttac tacatagctc 3580 agcacattgc aaggtttgca tttaagtt 3608 <210> 6 <211> 495 <212> PRT <213> Homo sapiens <400> 6 Met Glu Asn Lys Ala Met Tyr Leu His Thr Val Ser Asp Cys Asp Thr 1 5 10 15 Ser Ser Ile Cys Glu Asp Ser Phe Asp Gly Arg Ser Leu Ser Lys Leu 20 25 30 Asn Leu Cys Glu Asp Gly Pro Cys His Lys Arg Arg Ala Ser Ile Cys 35 40 45 Cys Thr Gln Leu Gly Ser Leu Ser Ala Leu Lys His Ala Val Leu Gly 50 55 60 Leu Tyr Leu Leu Val Phe Leu Ile Leu Val Gly Ile Phe Ile Leu Ala 65 70 75 80 Val Ser Arg Pro Arg Ser Ser Pro Asp Asp Leu Lys Ala Leu Thr Arg 85 90 95 Asn Val Asn Arg Leu Asn Glu Ser Phe Arg Asp Leu Gln Leu Arg Leu 100 105 110 Leu Gln Ala Pro Leu Gln Ala Asp Leu Thr Glu Gln Val Trp Lys Val 115 120 125 Gln Asp Ala Leu Gln Asn Gln Ser Asp Ser Leu Leu Ala Leu Ala Gly 130 135 140 Ala Val Gln Arg Leu Glu Gly Ala Leu Trp Gly Leu Gln Ala Gln Ala 145 150 155 160 Val Gln Thr Glu Gln Ala Val Ala Leu Leu Arg Asp Arg Thr Gly Gln 165 170 175 Gln Ser Asp Thr Ala Gln Leu Glu Leu Tyr Gln Leu Gln Val Glu Ser 180 185 190 Asn Ser Ser Gln Leu Leu Leu Arg Arg His Ala Gly Leu Leu Asp Gly 195 200 205 Leu Ala Arg Arg Val Gly Ile Leu Gly Glu Glu Leu Ala Asp Val Gly 210 215 220 Gly Val Leu Arg Gly Leu Asn His Ser Leu Ser Tyr Asp Val Ala Leu 225 230 235 240 His Arg Thr Arg Leu Gln Asp Leu Arg Val Leu Val Ser Asn Ala Ser 245 250 255 Glu Asp Thr Arg Arg Leu Arg Leu Ala His Val Gly Met Glu Leu Gln 260 265 270 Leu Lys Gln Glu Leu Ala Met Leu Asn Ala Val Thr Glu Asp Leu Arg 275 280 285 Leu Lys Asp Trp Glu His Ser Ile Ala Leu Arg Asn Ile Ser Leu Ala 290 295 300 Lys Gly Pro Pro Gly Pro Lys Gly Asp Gln Gly His Glu Gly Lys Glu 305 310 315 320 Gly Arg Pro Gly Ile Pro Gly Leu Pro Gly Leu Arg Gly Leu Pro Gly 325 330 335 Glu Arg Gly Thr Pro Gly Leu Pro Gly Pro Lys Gly Asp Asp Gly Lys 340 345 350 Leu Gly Ala Thr Gly Pro Met Gly Met Arg Gly Phe Lys Gly Asp Arg 355 360 365 Gly Pro Lys Gly Glu Lys Gly Glu Lys Gly Asp Arg Ala Gly Asp Ala 370 375 380 Ser Gly Val Glu Ala Pro Met Met Ile Arg Leu Val Asn Gly Ser Gly 385 390 395 400 Pro His Glu Gly Arg Val Glu Val Tyr His Asp Arg Arg Trp Gly Thr 405 410 415 Val Cys Asp Asp Gly Trp Asp Lys Lys Asp Gly Asp Val Val Cys Arg 420 425 430 Met Leu Gly Phe Arg Gly Val Glu Glu Val Tyr Arg Thr Ala Arg Phe 435 440 445 Gly Gln Gly Thr Gly Arg Ile Trp Met Asp Asp Val Ala Cys Lys Gly 450 455 460 Thr Glu Glu Thr Ile Phe Arg Cys Ser Phe Ser Lys Trp Gly Val Thr 465 470 475 480 Asn Cys Gly His Ala Glu Asp Ala Ser Val Thr Cys Asn Arg His 485 490 495 <210> 7 <211> 3162 <212> DNA <213> Homo sapiens <220> <221> CDS <222> (405)..(1835) <223> Clone LBFL123 <400> 7 tggccggggt gccccgcaaa gagagacaag ggagaaaaag acagcaggga aaaccccggg 60 gaggagaagg cgaaagagaa ggtggagctc agagaagggg gccggctccc cagctccatg 120 tggccgccgc cgctgcgggt ctgtgggggc agagggcggc ggctcccagg gcagcgcgta 180 gcgggaccga ttgcctaata ctccggcagg ggccggggcc gcagctggct cggataaata 240 gccgcccggc tggcccggag ctgcagggga gagcggcggc cgcgatcccc accacaccac 300 cagcccggcc gcacggggca ctgagccggg tgctgagcac cggaggcccc gccgaggccg 360 ggactcagga cctgcagaga aacgcctcct gattttgtct taca atg gaa ctt 413 Met Glu Leu 1 aaa aag tcg cct gac ggt gga tgg ggc tgg gtg att gtg ttt gtc tcc 461 Lys Lys Ser Pro Asp Gly Gly Trp Gly Trp Val Ile Val Phe Val Ser 5 10 15 ttc ctt act cag ttt ttg tgt tac gga tcc cca cta gct gtt gga gtc 509 Phe Leu Thr Gln Phe Leu Cys Tyr Gly Ser Pro Leu Ala Val Gly Val 20 25 30 35 ctg tac ata gaa tgg ctg gat gcc ttt ggt gaa gga aaa gga aaa aca 557 Leu Tyr Ile Glu Trp Leu Asp Ala Phe Gly Glu Gly Lys Gly Lys Thr 40 45 50 gcc tgg gtt gga tcc ctg gca agt gga gtt ggc ttg ctt gca agt cct 605 Ala Trp Val Gly Ser Leu Ala Ser Gly Val Gly Leu Leu Ala Ser Pro 55 60 65 gtc tgc agt ctc tgt gtc tca tct ttt gga gca aga cct gtc aca atc 653 Val Cys Ser Leu Cys Val Ser Ser Phe Gly Ala Arg Pro Val Thr Ile 70 75 80 ttc agt ggc ttc atg gtg gct gga ggc ctg atg ttg agc agt ttt gct 701 Phe Ser Gly Phe Met Val Ala Gly Gly Leu Met Leu Ser Ser Phe Ala 85 90 95 ccc aat atc tac ttt ctg ttt ttt tcc tat ggc att gtt gta ggt tca 749 Pro Asn Ile Tyr Phe Leu Phe Phe Ser Tyr Gly Ile Val Val Gly Ser 100 105 110 115 agc gtt ggc ctt ttc ata tat gct gct ctg cag agg atg ctg gtt gag 797 Ser Val Gly Leu Phe Ile Tyr Ala Ala Leu Gln Arg Met Leu Val Glu 120 125 130 ttc tat gga ctg gat gga tgc ttg ctg att gtg ggt gct tta gct tta 845 Phe Tyr Gly Leu Asp Gly Cys Leu Leu Ile Val Gly Ala Leu Ala Leu 135 140 145 aat ata tta gcc tgt ggc agt ctg atg aga ccc ctc caa tct tct gat 893 Asn Ile Leu Ala Cys Gly Ser Leu Met Arg Pro Leu Gln Ser Ser Asp 150 155 160 tgt cct ttg cct aaa aaa ata gct cca gaa gat cta cca gat aaa tac 941 Cys Pro Leu Pro Lys Lys Ile Ala Pro Glu Asp Leu Pro Asp Lys Tyr 165 170 175 tcc att tac aat gaa aaa gga aag aat ctg gaa gaa aac ata aac att 989 Ser Ile Tyr Asn Glu Lys Gly Lys Asn Leu Glu Glu Asn Ile Asn Ile 180 185 190 195 ctt gac aag agc tac agt agt gag gaa aaa tgc agg atc acg tta gcc 1037 Leu Asp Lys Ser Tyr Ser Ser Glu Glu Lys Cys Arg Ile Thr Leu Ala 200 205 210 aat ggt gac tgg aaa caa gac agc cta ctt cat aaa aac ccc aca gtg 1085 Asn Gly Asp Trp Lys Gln Asp Ser Leu Leu His Lys Asn Pro Thr Val 215 220 225 aca cac aca aaa gag cct gaa acg tac aaa aag aaa gtt gca gaa cag 1133 Thr His Thr Lys Glu Pro Glu Thr Tyr Lys Lys Lys Val Ala Glu Gln 230 235 240 aca tat ttt tgc aaa cag ctt gcc aag agg aag tgg cag tta tat aaa 1181 Thr Tyr Phe Cys Lys Gln Leu Ala Lys Arg Lys Trp Gln Leu Tyr Lys 245 250 255 aac tac tgt ggt gaa act gtg gct ctt ttt aaa aac aaa gta ttt tca 1229 Asn Tyr Cys Gly Glu Thr Val Ala Leu Phe Lys Asn Lys Val Phe Ser 260 265 270 275 gcc ctt ttc att gct atc tta ctc ttt gac atc gga ggg ttt cca cct 1277 Ala Leu Phe Ile Ala Ile Leu Leu Phe Asp Ile Gly Gly Phe Pro Pro 280 285 290 tca tta ctt atg gaa gat gta gca aga agt tca aac gtg aaa gaa gaa 1325 Ser Leu Leu Met Glu Asp Val Ala Arg Ser Ser Asn Val Lys Glu Glu 295 300 305 gag ttt att atg cca ctt att tcc att ata ggc att atg aca gca gtt 1373 Glu Phe Ile Met Pro Leu Ile Ser Ile Ile Gly Ile Met Thr Ala Val 310 315 320 ggt aaa ctg ctt tta ggg ata ctg gct gac ttc aag tgg att aat acc 1421 Gly Lys Leu Leu Leu Gly Ile Leu Ala Asp Phe Lys Trp Ile Asn Thr 325 330 335 ttg tat ctt tat gtt gct acc tta atc atc atg ggc cta gcc ttg tgt 1469 Leu Tyr Leu Tyr Val Ala Thr Leu Ile Ile Met Gly Leu Ala Leu Cys 340 345 350 355 gca att cca ttt gcc aaa agc tat gtc aca ttg gcg ttg ctt tct ggg 1517 Ala Ile Pro Phe Ala Lys Ser Tyr Val Thr Leu Ala Leu Leu Ser Gly 360 365 370 atc cta ggg ttt ctt act ggt aat tgg tcc atc ttt cca tat gtg acc 1565 Ile Leu Gly Phe Leu Thr Gly Asn Trp Ser Ile Phe Pro Tyr Val Thr 375 380 385 acg aag act gtg gga att gaa aaa tta gcc cat gcc tat ggg ata tta 1613 Thr Lys Thr Val Gly Ile Glu Lys Leu Ala His Ala Tyr Gly Ile Leu 390 395 400 atg ttc ttt gct gga ctt gga aat agc cta gga cca ccc atc gtt ggt 1661 Met Phe Phe Ala Gly Leu Gly Asn Ser Leu Gly Pro Pro Ile Val Gly 405 410 415 tgg ttt tat gac tgg acc cag acc tat gat att gca ttt tat ttt agt 1709 Trp Phe Tyr Asp Trp Thr Gln Thr Tyr Asp Ile Ala Phe Tyr Phe Ser 420 425 430 435 ggc ttc tgc gtc ctg ctg gga ggt ttt att ctg ctg ctg gca gcc ttg 1757 Gly Phe Cys Val Leu Leu Gly Gly Phe Ile Leu Leu Leu Ala Ala Leu 440 445 450 ccc tct tgg gat aca tgc aac aag caa ctc ccc aag cca gct cca aca 1805 Pro Ser Trp Asp Thr Cys Asn Lys Gln Leu Pro Lys Pro Ala Pro Thr 455 460 465 act ttc ttg tac aaa gtt gcc tct aat gtt tagaa gaatattgga 1850 Thr Phe Leu Tyr Lys Val Ala Ser Asn Val 470 475 agacactatt tttgctattt tataccatat agcaacgata ttttaacaga tctcaagcaa 1910 attttctaga gtcaagacta ttttctcata gcaaaatttc acaatgactg actctgaatg 1970 aattattttt ttttttttat atatcctatt ttttatgtag tgtatgcgta gcctctatct 2030 cgtatttttt tctatttctc ctccccacac catcaatggg actattctgt tttgctgtta 2090 ttcactagtt cttaacattg taaaaagttt gaccagcctc agaaggcttt ctctgtgtaa 2150 agaagtataa tttctctgct gactccattt aatccactgc aaggcaccta gagagactgc 2210 tcctatttta aaagtgatgc aagcatcatg ataagatatg tgtgaagccc actaggaaat 2270 aaatcattct cttctctatg tttgacttgc tagtaaacag aagacttcaa gccagccagg 2330 aaattaaagt ggcgactaaa acagccttaa gaattgcagt ggagcaaatt ggtcattttt 2390 taaaaaaata tattttaacc tacagtcacc agttttcatt attctattta cctcactgaa 2450 gtactcgcat gttgtttggt acccactgag caactgtttc agttcctaag gtatttgctg 2510 agatgtgggt gaactccaaa tggagaagta gtcactgtag actttcttca tggttgacca 2570 ctccaacctt gctcactttt gcttcttggc catccactca gctgatgttt cctgggaagt 2630 gctaatttta cctgtttcca aattggaaac acatttctca atcattccgt tctggcaaat 2690 gggaaacatc catttgcttt gggcacagtg gggatgggct gcaagttctt gcatatcctc 2750 ccagtgaagc atttatttgc tactatcaga ttttaccact atcaaatata attcaagggc 2810 agaattaaac gtgagtgtgt gtgtgtgtgt gtgtgtgtgt gctatgcatg ctctaagtct 2870 gcatgggata tgggaatgga aaagggcaat aagaaattaa tacccttatg cagttgcatt 2930 taaccttaag aaaaatgtcc ttgggataaa ctccaatgtt taatacattg attttttttc 2990 taaagaaatg ggttttaaac tttggtatgc atcagaattc cctatagatc tttttgaaaa 3050 tataggtacc tgggtatcac acatagaact tttaattctg ctggtgtagg ctgttgccca 3110 aacatctata attttactga gctcttcaag tgattctgat aacacagcct gg 3162 <210> 8 <211> 477 <212> PRT <213> Homo sapiens <400> 8 Met Glu Leu Lys Lys Ser Pro Asp Gly Gly Trp Gly Trp Val Ile Val 1 5 10 15 Phe Val Ser Phe Leu Thr Gln Phe Leu Cys Tyr Gly Ser Pro Leu Ala 20 25 30 Val Gly Val Leu Tyr Ile Glu Trp Leu Asp Ala Phe Gly Glu Gly Lys 35 40 45 Gly Lys Thr Ala Trp Val Gly Ser Leu Ala Ser Gly Val Gly Leu Leu 50 55 60 Ala Ser Pro Val Cys Ser Leu Cys Val Ser Ser Phe Gly Ala Arg Pro 65 70 75 80 Val Thr Ile Phe Ser Gly Phe Met Val Ala Gly Gly Leu Met Leu Ser 85 90 95 Ser Phe Ala Pro Asn Ile Tyr Phe Leu Phe Phe Ser Tyr Gly Ile Val 100 105 110 Val Gly Ser Ser Val Gly Leu Phe Ile Tyr Ala Ala Leu Gln Arg Met 115 120 125 Leu Val Glu Phe Tyr Gly Leu Asp Gly Cys Leu Leu Ile Val Gly Ala 130 135 140 Leu Ala Leu Asn Ile Leu Ala Cys Gly Ser Leu Met Arg Pro Leu Gln 145 150 155 160 Ser Ser Asp Cys Pro Leu Pro Lys Lys Ile Ala Pro Glu Asp Leu Pro 165 170 175 Asp Lys Tyr Ser Ile Tyr Asn Glu Lys Gly Lys Asn Leu Glu Glu Asn 180 185 190 Ile Asn Ile Leu Asp Lys Ser Tyr Ser Ser Glu Glu Lys Cys Arg Ile 195 200 205 Thr Leu Ala Asn Gly Asp Trp Lys Gln Asp Ser Leu Leu His Lys Asn 210 215 220 Pro Thr Val Thr His Thr Lys Glu Pro Glu Thr Tyr Lys Lys Lys Val 225 230 235 240 Ala Glu Gln Thr Tyr Phe Cys Lys Gln Leu Ala Lys Arg Lys Trp Gln 245 250 255 Leu Tyr Lys Asn Tyr Cys Gly Glu Thr Val Ala Leu Phe Lys Asn Lys 260 265 270 Val Phe Ser Ala Leu Phe Ile Ala Ile Leu Leu Phe Asp Ile Gly Gly 275 280 285 Phe Pro Pro Ser Leu Leu Met Glu Asp Val Ala Arg Ser Ser Asn Val 290 295 300 Lys Glu Glu Glu Phe Ile Met Pro Leu Ile Ser Ile Ile Gly Ile Met 305 310 315 320 Thr Ala Val Gly Lys Leu Leu Leu Gly Ile Leu Ala Asp Phe Lys Trp 325 330 335 Ile Asn Thr Leu Tyr Leu Tyr Val Ala Thr Leu Ile Ile Met Gly Leu 340 345 350 Ala Leu Cys Ala Ile Pro Phe Ala Lys Ser Tyr Val Thr Leu Ala Leu 355 360 365 Leu Ser Gly Ile Leu Gly Phe Leu Thr Gly Asn Trp Ser Ile Phe Pro 370 375 380 Tyr Val Thr Thr Lys Thr Val Gly Ile Glu Lys Leu Ala His Ala Tyr 385 390 395 400 Gly Ile Leu Met Phe Phe Ala Gly Leu Gly Asn Ser Leu Gly Pro Pro 405 410 415 Ile Val Gly Trp Phe Tyr Asp Trp Thr Gln Thr Tyr Asp Ile Ala Phe 420 425 430 Tyr Phe Ser Gly Phe Cys Val Leu Leu Gly Gly Phe Ile Leu Leu Leu 435 440 445 Ala Ala Leu Pro Ser Trp Asp Thr Cys Asn Lys Gln Leu Pro Lys Pro 450 455 460 Ala Pro Thr Thr Phe Leu Tyr Lys Val Ala Ser Asn Val 465 470 475 <210> 9 <211> 4891 <212> DNA <213> Homo sapiens <220> <221> CDS <222> (89)..(1150) <223> Clone LBFL131 <400> 9 acgcctggtt cccgggaaga ctcgccagca ccagggggtg ggggagtgcg agctgaaagc 60 tgctggagag tgagcagccc tagcaggg atg gac atg atg ctg ttg gtg cag 112 Met Asp Met Met Leu Leu Val Gln 1 5 ggt gct tgt tgc tcg aac cag tgg ctg gcg gcg gtg ctc ctc agc ctg 160 Gly Ala Cys Cys Ser Asn Gln Trp Leu Ala Ala Val Leu Leu Ser Leu 10 15 20 tgc tgc ctg cta ccc tcc tgc ctc ccg gct gga cag agt gtg gac ttc 208 Cys Cys Leu Leu Pro Ser Cys Leu Pro Ala Gly Gln Ser Val Asp Phe 25 30 35 40 ccc tgg gcg gcc gtg gac aac atg atg gtc aga aaa ggg gac acg gcg 256 Pro Trp Ala Ala Val Asp Asn Met Met Val Arg Lys Gly Asp Thr Ala 45 50 55 gtg ctt agg tgt tat ttg gaa gat gga gct tca aag ggt gcc tgg ctg 304 Val Leu Arg Cys Tyr Leu Glu Asp Gly Ala Ser Lys Gly Ala Trp Leu 60 65 70 aac cgg tca agt att att ttt gcg gga ggt gat aag tgg tca gtg gat 352 Asn Arg Ser Ser Ile Ile Phe Ala Gly Gly Asp Lys Trp Ser Val Asp 75 80 85 cct cga gtt tca att tca aca ttg aat aaa agg gac tac agc ctc cag 400 Pro Arg Val Ser Ile Ser Thr Leu Asn Lys Arg Asp Tyr Ser Leu Gln 90 95 100 ata cag aat gta gat gtg aca gat gat ggc cca tac acg tgt tct gtt 448 Ile Gln Asn Val Asp Val Thr Asp Asp Gly Pro Tyr Thr Cys Ser Val 105 110 115 120 cag act caa cat aca ccc aga aca atg cag gtg cat cta act gtg caa 496 Gln Thr Gln His Thr Pro Arg Thr Met Gln Val His Leu Thr Val Gln 125 130 135 gtt cct cct aag ata tat gac atc tca aat gat atg acc gtc aat gaa 544 Val Pro Pro Lys Ile Tyr Asp Ile Ser Asn Asp Met Thr Val Asn Glu 140 145 150 gga acc aac gtc act ctt act tgt ttg gcc act ggg aaa cca gag cct 592 Gly Thr Asn Val Thr Leu Thr Cys Leu Ala Thr Gly Lys Pro Glu Pro 155 160 165 tcc att tct tgg cga cac atc tcc cca tca gcg aaa cca ttt gaa aat 640 Ser Ile Ser Trp Arg His Ile Ser Pro Ser Ala Lys Pro Phe Glu Asn 170 175 180 gga caa tat ttg gac att tat gga att aca agg gac cag gct ggg gaa 688 Gly Gln Tyr Leu Asp Ile Tyr Gly Ile Thr Arg Asp Gln Ala Gly Glu 185 190 195 200 tat gaa tgc agt gcg gaa aat gat gtg tca ttc cca gat gtg agg aaa 736 Tyr Glu Cys Ser Ala Glu Asn Asp Val Ser Phe Pro Asp Val Arg Lys 205 210 215 gta aaa gtt gtt gtc aac ttt gct cct act att cag gaa att aaa tct 784 Val Lys Val Val Val Asn Phe Ala Pro Thr Ile Gln Glu Ile Lys Ser 220 225 230 ggc acc gtg acc ccc gga cgc agt ggc ctg ata aga tgt gaa ggt gca 832 Gly Thr Val Thr Pro Gly Arg Ser Gly Leu Ile Arg Cys Glu Gly Ala 235 240 245 ggt gtg ccg cct cca gcc ttt gaa tgg tac aaa gga gag aag aag ctc 880 Gly Val Pro Pro Pro Ala Phe Glu Trp Tyr Lys Gly Glu Lys Lys Leu 250 255 260 ttc aat ggc caa caa gga att att att caa aat ttt agc aca aga tcc 928 Phe Asn Gly Gln Gln Gly Ile Ile Ile Gln Asn Phe Ser Thr Arg Ser 265 270 275 280 att ctc act gtt acc aac gtg aca cag gag cac ttc ggc aat tat act 976 Ile Leu Thr Val Thr Asn Val Thr Gln Glu His Phe Gly Asn Tyr Thr 285 290 295 tgt gtg gct gcc aac aag cta ggc aca acc aat gcg agc ctg cct ctt 1024 Cys Val Ala Ala Asn Lys Leu Gly Thr Thr Asn Ala Ser Leu Pro Leu 300 305 310 aac cct cca agt aca gcc cag tat gga att acc ggg agc gct gat gtt 1072 Asn Pro Pro Ser Thr Ala Gln Tyr Gly Ile Thr Gly Ser Ala Asp Val 315 320 325 ctt ttc tcc tgc tgg tac ctt gtg ttg aca ctg tcc tct ttc acc agc 1120 Leu Phe Ser Cys Trp Tyr Leu Val Leu Thr Leu Ser Ser Phe Thr Ser 330 335 340 ata ttc tac ctg aag aat gcc att cta caa taaattcaaa gacccataaa 1170 Ile Phe Tyr Leu Lys Asn Ala Ile Leu Gln 345 350 aggcttttaa ggattctctg aaagtgctga tggctggatc caatctggta cagtttgtta 1230 aaagcagcgt gggatataat cagcagtgct tacatgggga tgatcgcctt ctgtagaatt 1290 gctcattatg taaatacttt aattctactc ttttttgatt agctacatta ccttgtgaag 1350 cagtacacat tgtccttttt ttaagacgtg aaagctctga aattactttt agaggatatt 1410 aattgtgatt tcatgtttgt aatctacaac ttttcaaaag cattcagtca tggtctgcta 1470 ggttgcaggc tgtagtttac aaaaacgaat attgcagtga atatgtgatt ctttaaggct 1530 gcaatacaag cattcagttc cctgtttcaa taagagtcaa tccacattta caaagatgca 1590 tttttttctt ttttgataaa aaagcaaata atattgcctt cagattattt cttcaaaata 1650 taacacatat ctagattttt ctgctcgcat gatattcagg tttcaggaat gagccttgta 1710 atataactgg ctgtgcagct ctgcttctct ttcctgtaag ttcagcatgg gtgtgccttc 1770 atacaataat atttttctct ttgtctccaa ctaatataaa atgttttgct aaatcttaca 1830 atttgaaagt aaaaataaac cagagtgatc aagttaaacc atacactatc tctaagtaac 1890 gaaggagcta ttggactgta aaaatctctt cctgcactga caatggggtt tgagaatttt 1950 gccccacact aactcagttc ttgtgatgag agacaattta ataacagtat agtaaatata 2010 ccatatgatt tctttagttg tagctaaatg ttagatccac cgtgggaaat tattcccttt 2070 aaaatgacag cacagtccac tcaaaggatt gcctagcaat acagcatctt ttcctttcac 2130 tagtccaagc caaaaatttt aagatgattt gtcagaaagg gcacaaagtc ctatcaccta 2190 atattacaag agttggtaag cgctcatcat taattttatt ttgtggcagc taagttagta 2250 tgacagaggc agtgctcctg tggacaggag cattttgcat attttccatc tgaaagtatc 2310 actcagttga tagtctggaa tgcatgttat atattttaaa acttccaaaa tatattataa 2370 caaacattct atatcggtat gtagcagacc aatctctaaa atagctaatt cttcaataaa 2430 atctttctat atagccattt cagtgcaaac aagtaaaatc aaaaaagacc atcctttatt 2490 tttccttaca tgatatatgt aagatgcgat caaataaaga caaaacacca gtgatgagaa 2550 tatcttaaga taagtaatta tcaaattatt gtgaatgtta aattatttct actataaaga 2610 agcaaaacta catttttgaa ggaaaatgct gttactctaa cattaattta caggaatagt 2670 ttgatggttt cactctttac taaagaaagg ccatcacctt gaaagccatt ttacaggttt 2730 gatgaagtta ccaatttcag tacacctaaa tttctacaaa tagtcccctt ttacaagttg 2790 taacaacaaa gaccctataa taaaattaga tacaagaaat tttgcagtgg ttatacatat 2850 ttgagatatc tagtatgttg ccctagcagg gatggcttaa aaactgtgat tttttttctt 2910 caagtaaaac ttagtcccaa agtacatcat aaatcaattt taactagaaa aatgaatctt 2970 aaatgagggg acataagtat actctttcca caaaatggca ataataaggc ataaagctag 3030 taaatctact aactgtaata aatgtatgac attattttga ttgatacatt aaaaaagagt 3090 ttttagaaca aatatggcat ttaactttat tatttatttg cttttaagaa atattctttg 3150 tggaattgtt gaataaacta taaaatatta ttttgtattg cagctttaaa gtggcacact 3210 ccataataat ctacctacta gaaatagtgg tgctaccaca aaaaatgtta accatcagta 3270 ccattgtttg ggagaaagaa acaggtcaag aatgcatatt attcagtgac cgctttccta 3330 gagttaaaat acctcctctt tgtaaggttt gtaggtaaat tgaggtataa actatggatg 3390 aaccaaataa ttagttcaaa gtgttgtcat gattccaaat ttgtggagtc tggtgttttt 3450 accatagaat gtgacagaag tacagtcata gctcagtagc tatatgtatt tgcctttatg 3510 ttagaagaga ctttcttgag tgacattttt aaatagagga ggtattcact atgtttttct 3570 gtatcacagc agcattccta gtccttaggc cctcggacag agtgaaatca tgagtattta 3630 tgagttcaat attgtcaaat aaggctacag tatttgcttt tttgtgtgaa tgtattgcat 3690 ataatgttca agtagatgat tttacattta tggacatata aaacgtctga ttaccccatt 3750 ttatcagtcc tgactgtaca agattgttgc aatttcagaa tagcagtttt ataaattgat 3810 ttatctttta atctataaca atttgtgtta gctgttcatt tcaggattat attttctaca 3870 agttccactt gtgggactcc ttttgttgcc cctatttttt tttaaagaag gaagaaagaa 3930 aaatgagtag cagtttaaaa atgagaatgg agagaaaaga aaaagaatga aaaggaaagg 3990 cagtaaagag ggaaaaaaaa ggaaggatgg aaggaatgaa ggaaggaagg gaggaagggg 4050 agaaggtagg aagaaagaaa ggatgagagg gaaggaagaa tcagagtatt agggtagtta 4110 acttacacat ttgcattctt agttatactg caagtggtgt aactatgttt ttcaatgatc 4170 gcatttgaaa cataagtcct attataccat taagttccta ttatgcagca attatataat 4230 aaaaagtact gcccaagtta tagtaatgtg ggtgtttttg agacactaaa agatttgaga 4290 gggagaattt caaacttaaa gccacttttg gggggtttat aacttaactg aaaaattaat 4350 gcttcatcat aacatttaag ctatatctag aaagtagact ggagaactga gaaaattacc 4410 caggtaattc agggaaaaaa aaaaaatata tatatatata aataccccta catttgaagt 4470 cagaaaactc tgaaaaactg aattatcaaa gtcaatcatc tataatgatc aaatttactg 4530 aacaattgtt aatttatcca ttgtgcttag ctttgtgaca cagccaaaag ttacctattt 4590 aatcttttca ataaaaattg ttttttgaaa tccagaaatg atttaaaaag aggtcaggtt 4650 tttaactatt tattgaagta tgtggatgtc cagtatttca atagatatga atatgaataa 4710 atggtatgcc ttaagattct ttgaatatgt atttacttta aagactggaa aaagctcttc 4770 ctgtctttta gtaaacatcc atatttcata acctgatgta aaatatgttg tactgtttcc 4830 aataggggaa tataaactca gtttatcaat taaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4890 a 4891 <210> 10 <211> 354 <212> PRT <213> Homo sapiens <400> 10 Met Asp Met Met Leu Leu Val Gln Gly Ala Cys Cys Ser Asn Gln Trp 1 5 10 15 Leu Ala Ala Val Leu Leu Ser Leu Cys Cys Leu Leu Pro Ser Cys Leu 20 25 30 Pro Ala Gly Gln Ser Val Asp Phe Pro Trp Ala Ala Val Asp Asn Met 35 40 45 Met Val Arg Lys Gly Asp Thr Ala Val Leu Arg Cys Tyr Leu Glu Asp 50 55 60 Gly Ala Ser Lys Gly Ala Trp Leu Asn Arg Ser Ser Ile Ile Phe Ala 65 70 75 80 Gly Gly Asp Lys Trp Ser Val Asp Pro Arg Val Ser Ile Ser Thr Leu 85 90 95 Asn Lys Arg Asp Tyr Ser Leu Gln Ile Gln Asn Val Asp Val Thr Asp 100 105 110 Asp Gly Pro Tyr Thr Cys Ser Val Gln Thr Gln His Thr Pro Arg Thr 115 120 125 Met Gln Val His Leu Thr Val Gln Val Pro Pro Lys Ile Tyr Asp Ile 130 135 140 Ser Asn Asp Met Thr Val Asn Glu Gly Thr Asn Val Thr Leu Thr Cys 145 150 155 160 Leu Ala Thr Gly Lys Pro Glu Pro Ser Ile Ser Trp Arg His Ile Ser 165 170 175 Pro Ser Ala Lys Pro Phe Glu Asn Gly Gln Tyr Leu Asp Ile Tyr Gly 180 185 190 Ile Thr Arg Asp Gln Ala Gly Glu Tyr Glu Cys Ser Ala Glu Asn Asp 195 200 205 Val Ser Phe Pro Asp Val Arg Lys Val Lys Val Val Val Asn Phe Ala 210 215 220 Pro Thr Ile Gln Glu Ile Lys Ser Gly Thr Val Thr Pro Gly Arg Ser 225 230 235 240 Gly Leu Ile Arg Cys Glu Gly Ala Gly Val Pro Pro Pro Ala Phe Glu 245 250 255 Trp Tyr Lys Gly Glu Lys Lys Leu Phe Asn Gly Gln Gln Gly Ile Ile 260 265 270 Ile Gln Asn Phe Ser Thr Arg Ser Ile Leu Thr Val Thr Asn Val Thr 275 280 285 Gln Glu His Phe Gly Asn Tyr Thr Cys Val Ala Ala Asn Lys Leu Gly 290 295 300 Thr Thr Asn Ala Ser Leu Pro Leu Asn Pro Pro Ser Thr Ala Gln Tyr 305 310 315 320 Gly Ile Thr Gly Ser Ala Asp Val Leu Phe Ser Cys Trp Tyr Leu Val 325 330 335 Leu Thr Leu Ser Ser Phe Thr Ser Ile Phe Tyr Leu Lys Asn Ala Ile 340 345 350 Leu Gln <210> 11 <211> 3098 <212> DNA <213> Homo sapiens <220> <221> CDS <222> (223)..(1569) <223> LBFL164 <400> 11 gtttatcgcg cacatctcgc ggcgaggagg agaggccgga agggcgcccc agccccaagg 60 ctcctgcccc gcctgggcct ccggctttcg tttccccgca acgcttcgct ttcgtttccc 120 gctggcgcct ggctccctcc gggtttcgtt tcccgccggc gcctggctcc cgccaggttt 180 cgtttccgag gcggggccga gggcggcgtc gctgaggcgc cc atg gcc ttc 231 Met Ala Phe 1 gcc cgc cgg ctc ctg cgc ggg cca ctg tcg ggg ccg ctg ctc ggg cgg 279 Ala Arg Arg Leu Leu Arg Gly Pro Leu Ser Gly Pro Leu Leu Gly Arg 5 10 15 cgc ggg gtc tgc gct ggg gcc atg gct ccg ccg cgc cgc ttc gtc ctg 327 Arg Gly Val Cys Ala Gly Ala Met Ala Pro Pro Arg Arg Phe Val Leu 20 25 30 35 gag ctt ccc gac tgc acc ctg gct cac ttc gcc cta ggc gcc gac gcc 375 Glu Leu Pro Asp Cys Thr Leu Ala His Phe Ala Leu Gly Ala Asp Ala 40 45 50 ccc ggc gac gca gac gcc ccc gac ccc cgc ctg gcg gcg ctg ctg ggg 423 Pro Gly Asp Ala Asp Ala Pro Asp Pro Arg Leu Ala Ala Leu Leu Gly 55 60 65 ccc ccg gag cgc agc tac tcg ctg tgc gtg ccc gtg acc ccg gac gcc 471 Pro Pro Glu Arg Ser Tyr Ser Leu Cys Val Pro Val Thr Pro Asp Ala 70 75 80 ggc tgc ggg gcc cgg gtc cgg gcg gcg cgg ctg cac cag cgc ctg ctg 519 Gly Cys Gly Ala Arg Val Arg Ala Ala Arg Leu His Gln Arg Leu Leu 85 90 95 cac cag ctg cgc cgc ggc ccc ttc cag cgg tgc cag ctg ctc agg ctg 567 His Gln Leu Arg Arg Gly Pro Phe Gln Arg Cys Gln Leu Leu Arg Leu 100 105 110 115 ctc tgc tac tgc ccg ggc ggc cag gcc ggc ggc gca cag caa ggc ttc 615 Leu Cys Tyr Cys Pro Gly Gly Gln Ala Gly Gly Ala Gln Gln Gly Phe 120 125 130 ctg ctg cgc gac ccc ctg gat gac cct gac acc cgg caa gcg ctg ctc 663 Leu Leu Arg Asp Pro Leu Asp Asp Pro Asp Thr Arg Gln Ala Leu Leu 135 140 145 gag ctg ctg ggc gcc tgc cag gag gca cca cgc ccg cac ttg ggc gag 711 Glu Leu Leu Gly Ala Cys Gln Glu Ala Pro Arg Pro His Leu Gly Glu 150 155 160 ttc gag gcc gac ccg cgc ggc cag ctg tgg cag cgc ctc tgg gag gtg 759 Phe Glu Ala Asp Pro Arg Gly Gln Leu Trp Gln Arg Leu Trp Glu Val 165 170 175 caa gac ggc agg cgg ctg cag gtg ggc tgc gca cag gtc gtg ccc gtc 807 Gln Asp Gly Arg Arg Leu Gln Val Gly Cys Ala Gln Val Val Pro Val 180 185 190 195 ccg gag ccc ccg ctg cac ccg gtg gtg cca gac ttg ccc agt tcc gtg 855 Pro Glu Pro Pro Leu His Pro Val Val Pro Asp Leu Pro Ser Ser Val 200 205 210 gtc ttc ccg gac cgg gaa gcc gcc cgg gcc gtt ttg gag gag tgt acc 903 Val Phe Pro Asp Arg Glu Ala Ala Arg Ala Val Leu Glu Glu Cys Thr 215 220 225 tcc ttt att cct gaa gcc cgg gca gtg ctt gac ctg gtc gac cag tgc 951 Ser Phe Ile Pro Glu Ala Arg Ala Val Leu Asp Leu Val Asp Gln Cys 230 235 240 cca aaa cag atc cag aaa gga aag ttc cag gtt gtt gcc atc gaa gga 999 Pro Lys Gln Ile Gln Lys Gly Lys Phe Gln Val Val Ala Ile Glu Gly 245 250 255 ctg gat gcc acg ggt aaa acc acg gtg acc cag tca gtg gca gat tca 1047 Leu Asp Ala Thr Gly Lys Thr Thr Val Thr Gln Ser Val Ala Asp Ser 260 265 270 275 ctt aag gct gtc ctc tta aag tca cca ccc tct tgc att ggc cag tgg 1095 Leu Lys Ala Val Leu Leu Lys Ser Pro Pro Ser Cys Ile Gly Gln Trp 280 285 290 agg aag atc ttt gat gat gaa cca act atc att aga aga gct ttt tac 1143 Arg Lys Ile Phe Asp Asp Glu Pro Thr Ile Ile Arg Arg Ala Phe Tyr 295 300 305 tct ttg ggc aat tat att gtg gcc tcc gaa ata gct aaa gaa tct gcc 1191 Ser Leu Gly Asn Tyr Ile Val Ala Ser Glu Ile Ala Lys Glu Ser Ala 310 315 320 aaa tct cct gtg att gta gac agg tac tgg cac agc acg gcc acc tat 1239 Lys Ser Pro Val Ile Val Asp Arg Tyr Trp His Ser Thr Ala Thr Tyr 325 330 335 gct ata gcc act gag gtg agt ggg ggt ctc cag cac ctg ccc cca gcc 1287 Ala Ile Ala Thr Glu Val Ser Gly Gly Leu Gln His Leu Pro Pro Ala 340 345 350 355 cat cac cct gtg tac cag tgg cca gag gac ctg ctc aaa cct gac ctt 1335 His His Pro Val Tyr Gln Trp Pro Glu Asp Leu Leu Lys Pro Asp Leu 360 365 370 atc ctg ctg ctc act gtg agt cct gag gag agg ttg cag agg ctg cag 1383 Ile Leu Leu Leu Thr Val Ser Pro Glu Glu Arg Leu Gln Arg Leu Gln 375 380 385 ggc cgg ggc atg gag aag acc agg gaa gaa gca gaa ctt gag gcc aac 1431 Gly Arg Gly Met Glu Lys Thr Arg Glu Glu Ala Glu Leu Glu Ala Asn 390 395 400 agt gtg ttt cgt caa aag gta gaa atg tcc tac cag cgg atg gag aat 1479 Ser Val Phe Arg Gln Lys Val Glu Met Ser Tyr Gln Arg Met Glu Asn 405 410 415 cct ggc tgc cat gtg gtt gat gcc agc ccc tcc aga gaa agg gtc ctg 1527 Pro Gly Cys His Val Val Asp Ala Ser Pro Ser Arg Glu Arg Val Leu 420 425 430 435 cag acg gta tta agc cta atc cag aat agt ttt agt gaa ccg t 1570 Gln Thr Val Leu Ser Leu Ile Gln Asn Ser Phe Ser Glu Pro 440 445 agttactctg gccaggtgcc acgtctaact agattagatg ttgtttgaaa catctacatc 1630 caccatttgt tatgcagtgt tcccaaattt ctgttctaca agcatgttgt gtggcagaaa 1690 actggagacc aggcatctta attttacttc agccatcgta ccctcttctg actgatggac 1750 ccgtcatcac aaaggtccct ctcatcatgt tccagtgaga ggccagcgat tgctttcttc 1810 ctggcatagt aaacattttc ttggaacata tgtttcactt aatcactacc aaatatctgg 1870 aagacctgtc ttactcagac agcaccaggt gtacagaagc agcagacaag atcttccaga 1930 tcagcaggga gaccccggag cctctgcttc tcctacactg gcatgctgat gagatcgtga 1990 catgcccaca ttggcttctt ccacatctgg ttgcactcgt catgatgggc tcgctgcatc 2050 tccctcagtc ccaaattcta gagccaagtg ttcctgcaga ggctgtctat gtgtcctggc 2110 tgcccaagga cactcctgca gagccatttt tgggtaagga acacttacaa agaaggcatt 2170 gatcttgtgt ctgaggctca gagccctttt gataggcttc tgagtcatat ataaagacat 2230 tcaagccaag atgctccaac tgcaaatata ccaaccttct ctgaattata ttttgcttat 2290 ttatatttct tttctttttt tctaaagtat ggctctgaat agaatgcaca ttttccattg 2350 aactggatgc atttcattta gccaatccag taatttattt atattaatct atacaatatg 2410 tttcctcagc ataggagcta tgattcatta attaaaagtg gagtcaaaac gctaaatgca 2470 atgtttgttg tgtattttca ttacacaaac ttaatttgtc ttgttaaata agtacagtgg 2530 atcttggagt gggatttctt ggtaaattat cttgcacttg aatgtctcat gattacatat 2590 gaaatcgctt tgacatatct ttagacagaa aaaagtagct gagtgagggg gaaattatag 2650 agctgtgtga ctttagggag taggttgaac caggtgatta cctaaaattc cttccagttc 2710 aaaggcagat aaatctgtaa attattttat cctatctacc atttcttaag aagacattac 2770 tccaaaataa ttaaatttaa ggctttatca ggtctgcata tagaatctta aattctaata 2830 aagtttcatg ttaatgtcat aggattttta aaagagctat aggtaatttc tatataatat 2890 gtgtatatta aaatgtaatt gatttcagtt gaaagtattt taaagctgat aaatagcatt 2950 agggttcttt gcaatgtggt atctagctgt attattggtt ttatttactt taaacatttt 3010 gaaaagctta tactggcagc ctagaaaaac aaacaattaa tgtatcttta tgtccctggc 3070 acatgaataa actttgctgt ggtttact 3098 <210> 12 <211> 449 <212> PRT <213> Homo sapiens <400> 12 Met Ala Phe Ala Arg Arg Leu Leu Arg Gly Pro Leu Ser Gly Pro Leu 1 5 10 15 Leu Gly Arg Arg Gly Val Cys Ala Gly Ala Met Ala Pro Pro Arg Arg 20 25 30 Phe Val Leu Glu Leu Pro Asp Cys Thr Leu Ala His Phe Ala Leu Gly 35 40 45 Ala Asp Ala Pro Gly Asp Ala Asp Ala Pro Asp Pro Arg Leu Ala Ala 50 55 60 Leu Leu Gly Pro Pro Glu Arg Ser Tyr Ser Leu Cys Val Pro Val Thr 65 70 75 80 Pro Asp Ala Gly Cys Gly Ala Arg Val Arg Ala Ala Arg Leu His Gln 85 90 95 Arg Leu Leu His Gln Leu Arg Arg Gly Pro Phe Gln Arg Cys Gln Leu 100 105 110 Leu Arg Leu Leu Cys Tyr Cys Pro Gly Gly Gln Ala Gly Gly Ala Gln 115 120 125 Gln Gly Phe Leu Leu Arg Asp Pro Leu Asp Asp Pro Asp Thr Arg Gln 130 135 140 Ala Leu Leu Glu Leu Leu Gly Ala Cys Gln Glu Ala Pro Arg Pro His 145 150 155 160 Leu Gly Glu Phe Glu Ala Asp Pro Arg Gly Gln Leu Trp Gln Arg Leu 165 170 175 Trp Glu Val Gln Asp Gly Arg Arg Leu Gln Val Gly Cys Ala Gln Val 180 185 190 Val Pro Val Pro Glu Pro Pro Leu His Pro Val Val Pro Asp Leu Pro 195 200 205 Ser Ser Val Val Phe Pro Asp Arg Glu Ala Ala Arg Ala Val Leu Glu 210 215 220 Glu Cys Thr Ser Phe Ile Pro Glu Ala Arg Ala Val Leu Asp Leu Val 225 230 235 240 Asp Gln Cys Pro Lys Gln Ile Gln Lys Gly Lys Phe Gln Val Val Ala 245 250 255 Ile Glu Gly Leu Asp Ala Thr Gly Lys Thr Thr Val Thr Gln Ser Val 260 265 270 Ala Asp Ser Leu Lys Ala Val Leu Leu Lys Ser Pro Pro Ser Cys Ile 275 280 285 Gly Gln Trp Arg Lys Ile Phe Asp Asp Glu Pro Thr Ile Ile Arg Arg 290 295 300 Ala Phe Tyr Ser Leu Gly Asn Tyr Ile Val Ala Ser Glu Ile Ala Lys 305 310 315 320 Glu Ser Ala Lys Ser Pro Val Ile Val Asp Arg Tyr Trp His Ser Thr 325 330 335 Ala Thr Tyr Ala Ile Ala Thr Glu Val Ser Gly Gly Leu Gln His Leu 340 345 350 Pro Pro Ala His His Pro Val Tyr Gln Trp Pro Glu Asp Leu Leu Lys 355 360 365 Pro Asp Leu Ile Leu Leu Leu Thr Val Ser Pro Glu Glu Arg Leu Gln 370 375 380 Arg Leu Gln Gly Arg Gly Met Glu Lys Thr Arg Glu Glu Ala Glu Leu 385 390 395 400 Glu Ala Asn Ser Val Phe Arg Gln Lys Val Glu Met Ser Tyr Gln Arg 405 410 415 Met Glu Asn Pro Gly Cys His Val Val Asp Ala Ser Pro Ser Arg Glu 420 425 430 Arg Val Leu Gln Thr Val Leu Ser Leu Ile Gln Asn Ser Phe Ser Glu 435 440 445 Pro <210> 13 <211> 1893 <212> DNA <213> Homo sapiens <220> <221> CDS <222> (418)..(1392) <223> LBFL167 Clone #20 <400> 13 agtccagctg ccgttaggcg ctgggatagt cgcacgctgg atgcatctac gtccgccgag 60 cccctggggc gaagaggccg cgtccgcctt catttgtggc cggtgcttcg ccccctgacc 120 cttcgccccc aaagaccagc tctaacgtga gcgcctcggc cgccctgccc cagcctcgta 180 cacgccgcca gcctcgccca gccggtgtcc ggagaccctc gggccgtgtc catttgtggg 240 caaagccagc ggggcaggct tggccagagt gcaccactcg gcgccgtccc aggcccgacg 300 ctctgggcgc gcccggaacc ccaggttcgc ggcccgtgtt tccgaccggc ggagggggct 360 cagcggcccg atcccacgga agcgcgctcg gaggggtggg acccggccgg accggag 417 atg gcg ccg cca gcg ggc ggg gcg gcg gcg gcg gcc tcg gac ttg ggc 465 Met Ala Pro Pro Ala Gly Gly Ala Ala Ala Ala Ala Ser Asp Leu Gly 1 5 10 15 tcc gcc gca gtg ctc ttg gct gtg cac gcc gcg gtg agg ccg ctg ggc 513 Ser Ala Ala Val Leu Leu Ala Val His Ala Ala Val Arg Pro Leu Gly 20 25 30 gcc ggg cca gac gcc gag gca cag ctg cgg agg ctg cag ctg agc gcg 561 Ala Gly Pro Asp Ala Glu Ala Gln Leu Arg Arg Leu Gln Leu Ser Ala 35 40 45 gac cct gag cgg cct ggg cgc ttc cgg ctg gag ctg ctg ggc gcg gga 609 Asp Pro Glu Arg Pro Gly Arg Phe Arg Leu Glu Leu Leu Gly Ala Gly 50 55 60 cct ggg gcg gtt aat ttg gag tgg ccc ctg gag tca gtt tcc tac acc 657 Pro Gly Ala Val Asn Leu Glu Trp Pro Leu Glu Ser Val Ser Tyr Thr 65 70 75 80 atc cga ggc ccc acc cag cac gag cta cag cct cca cca gga ggg cct 705 Ile Arg Gly Pro Thr Gln His Glu Leu Gln Pro Pro Pro Gly Gly Pro 85 90 95 gga acc ctc agc ctg cac ttc ctc aac cct cag gaa gct cag cgg tgg 753 Gly Thr Leu Ser Leu His Phe Leu Asn Pro Gln Glu Ala Gln Arg Trp 100 105 110 gca gtc cta gtc cga ggt gcc acc gtg gaa gga cag aat ggc agc aag 801 Ala Val Leu Val Arg Gly Ala Thr Val Glu Gly Gln Asn Gly Ser Lys 115 120 125 agc aac tca cca cca gcc ttg ggc cca gaa gca tgc cct gtc tcc ctg 849 Ser Asn Ser Pro Pro Ala Leu Gly Pro Glu Ala Cys Pro Val Ser Leu 130 135 140 ccc agt ccc ccg gaa gcc tcc aca ctc aag ggc cct cca cct gag gca 897 Pro Ser Pro Pro Glu Ala Ser Thr Leu Lys Gly Pro Pro Pro Glu Ala 145 150 155 160 gat ctt cct agg agc cct gga aac ttg acg gag aga gaa gag ctg gca 945 Asp Leu Pro Arg Ser Pro Gly Asn Leu Thr Glu Arg Glu Glu Leu Ala 165 170 175 ggg agc ctg gcc cgg gct att gca ggt gga gac gag aag ggg gca gcc 993 Gly Ser Leu Ala Arg Ala Ile Ala Gly Gly Asp Glu Lys Gly Ala Ala 180 185 190 caa gtg gca gcc gtc ctg gcc cag cat cgt gtg gcc ctg agt gtt cag 1041 Gln Val Ala Ala Val Leu Ala Gln His Arg Val Ala Leu Ser Val Gln 195 200 205 ctt cag gag gcc tgc ttc cca cct ggc ccc atc agg ctg cag gtc aca 1089 Leu Gln Glu Ala Cys Phe Pro Pro Gly Pro Ile Arg Leu Gln Val Thr 210 215 220 ctt gaa gac gct gcc tct gcc gca tcc gcc gcg tcc tct gca cac gtt 1137 Leu Glu Asp Ala Ala Ser Ala Ala Ser Ala Ala Ser Ser Ala His Val 225 230 235 240 gcc ctg cag gtc cac ccc cac tgc act gtt gca gct ctc cag gag cag 1185 Ala Leu Gln Val His Pro His Cys Thr Val Ala Ala Leu Gln Glu Gln 245 250 255 gtg ttc tca gag ctc ggt ttc ccg cca gcc gtg caa cgc tgg gtc atc 1233 Val Phe Ser Glu Leu Gly Phe Pro Pro Ala Val Gln Arg Trp Val Ile 260 265 270 gga cgg tgc ctg tgt gtg cct gag cgc agc ctt gcc tct tac ggg gtt 1281 Gly Arg Cys Leu Cys Val Pro Glu Arg Ser Leu Ala Ser Tyr Gly Val 275 280 285 cgg cag gat ggg gac cct gct ttc ctc tac ttg ctg tca gct cct cga 1329 Arg Gln Asp Gly Asp Pro Ala Phe Leu Tyr Leu Leu Ser Ala Pro Arg 290 295 300 gaa gcc cca ggt cag tcc tcg atg ggg gtg ggg tgt ggg agg tgg ggt 1377 Glu Ala Pro Gly Gln Ser Ser Met Gly Val Gly Cys Gly Arg Trp Gly 305 310 315 320 gca gcc cca cag tcc tgagctcc accccctcag ccacaggacc tagccctcag 1430 Ala Ala Pro Gln Ser 325 cacccccaga agatggacgg ggaacttgga cgcttgtttc ccccatcatt ggggctaccc 1490 ccaggccccc agccagctgc ctccagcctg cccagtccac tccagcccag ctggtcctgt 1550 ccttcctgca ccttcatcaa tgccccagac cgccctggct gtgagatgtg tagcacccag 1610 aggccctgca cttgggaccc ccttgctgca gcttccacct agcagccacc agaggtacca 1670 gaggtggcac aggcagggga ggtggggggc cagggcagaa tccacaggaa tgacccagct 1730 cctcccccac aggttacaag gggagagtgg cccttccctc acaagtccga catctccagg 1790 cccccactga actccgggga cctctactga ctgcttgctg ggacagtcac cagggttggg 1850 gggaagggcc acaaaatgaa accattaaag acccttaaga gcc 1893 <210> 14 <211> 325 <212> PRT <213> Homo sapiens <400> 14 Met Ala Pro Pro Ala Gly Gly Ala Ala Ala Ala Ala Ser Asp Leu Gly 1 5 10 15 Ser Ala Ala Val Leu Leu Ala Val His Ala Ala Val Arg Pro Leu Gly 20 25 30 Ala Gly Pro Asp Ala Glu Ala Gln Leu Arg Arg Leu Gln Leu Ser Ala 35 40 45 Asp Pro Glu Arg Pro Gly Arg Phe Arg Leu Glu Leu Leu Gly Ala Gly 50 55 60 Pro Gly Ala Val Asn Leu Glu Trp Pro Leu Glu Ser Val Ser Tyr Thr 65 70 75 80 Ile Arg Gly Pro Thr Gln His Glu Leu Gln Pro Pro Pro Gly Gly Pro 85 90 95 Gly Thr Leu Ser Leu His Phe Leu Asn Pro Gln Glu Ala Gln Arg Trp 100 105 110 Ala Val Leu Val Arg Gly Ala Thr Val Glu Gly Gln Asn Gly Ser Lys 115 120 125 Ser Asn Ser Pro Pro Ala Leu Gly Pro Glu Ala Cys Pro Val Ser Leu 130 135 140 Pro Ser Pro Pro Glu Ala Ser Thr Leu Lys Gly Pro Pro Pro Glu Ala 145 150 155 160 Asp Leu Pro Arg Ser Pro Gly Asn Leu Thr Glu Arg Glu Glu Leu Ala 165 170 175 Gly Ser Leu Ala Arg Ala Ile Ala Gly Gly Asp Glu Lys Gly Ala Ala 180 185 190 Gln Val Ala Ala Val Leu Ala Gln His Arg Val Ala Leu Ser Val Gln 195 200 205 Leu Gln Glu Ala Cys Phe Pro Pro Gly Pro Ile Arg Leu Gln Val Thr 210 215 220 Leu Glu Asp Ala Ala Ser Ala Ala Ser Ala Ala Ser Ser Ala His Val 225 230 235 240 Ala Leu Gln Val His Pro His Cys Thr Val Ala Ala Leu Gln Glu Gln 245 250 255 Val Phe Ser Glu Leu Gly Phe Pro Pro Ala Val Gln Arg Trp Val Ile 260 265 270 Gly Arg Cys Leu Cys Val Pro Glu Arg Ser Leu Ala Ser Tyr Gly Val 275 280 285 Arg Gln Asp Gly Asp Pro Ala Phe Leu Tyr Leu Leu Ser Ala Pro Arg 290 295 300 Glu Ala Pro Gly Gln Ser Ser Met Gly Val Gly Cys Gly Arg Trp Gly 305 310 315 320 Ala Ala Pro Gln Ser 325 <210> 15 <211> 1597 <212> DNA <213> Homo sapiens <220> <221> CDS <222> (271)..(1431) <223> LBFL167 Clone #46 <400> 15 gtgagcgcct cggccgccct gccccagcct cgtacacgcc gccagctcgc ccagccggtg 60 tccggagacc ctcgggccgt gtccatttgt gggcaaagcc agcggggcag gcttggccag 120 agtgcaccac tcggcgccgt cccaggcccg acgctctggg cgcgcccgga accccaggtt 180 cgcggcccgt gtttccgacc ggcggagggg gctcagcggc ccgatcccac ggaagcgcgc 240 tcggaggggt gggacccggc cggaccggag atg gcg ccg cca gcg ggc ggg gcg 294 Met Ala Pro Pro Ala Gly Gly Ala 1 5 gcg gcg gcg gcc tcg gac ttg ggc tcc gcc gca gtg ctc ttg gct gtg 342 Ala Ala Ala Ala Ser Asp Leu Gly Ser Ala Ala Val Leu Leu Ala Val 10 15 20 cac gcc gcg gtg agg ccg ctg ggc gcc ggg cca gac gcc gag gca cag 390 His Ala Ala Val Arg Pro Leu Gly Ala Gly Pro Asp Ala Glu Ala Gln 25 30 35 40 ctg cgg agg ctg cag ctg agc gcg gac cct gag agg cct ggg cgc ttc 438 Leu Arg Arg Leu Gln Leu Ser Ala Asp Pro Glu Arg Pro Gly Arg Phe 45 50 55 cgg ctg gag ctg ctg ggc gcg gga cct ggg gcg gtt aat ttg gag tgg 486 Arg Leu Glu Leu Leu Gly Ala Gly Pro Gly Ala Val Asn Leu Glu Trp 60 65 70 ccc ctg gag tca gtt tcc tac acc atc cga ggc ccc acc cag cac gag 534 Pro Leu Glu Ser Val Ser Tyr Thr Ile Arg Gly Pro Thr Gln His Glu 75 80 85 cta cag cct cca cca gga ggg cct gga acc ctc agc ctg cac ttc ctc 582 Leu Gln Pro Pro Pro Gly Gly Pro Gly Thr Leu Ser Leu His Phe Leu 90 95 100 aac cct cag gaa gct cag cgg tgg gca gtc cta gtc cga ggt gcc acc 630 Asn Pro Gln Glu Ala Gln Arg Trp Ala Val Leu Val Arg Gly Ala Thr 105 110 115 120 gtg gaa gga cag aat ggc agc aag agc aac tca cca cca gcc ttg ggc 678 Val Glu Gly Gln Asn Gly Ser Lys Ser Asn Ser Pro Pro Ala Leu Gly 125 130 135 cca gaa gca tgc cct gtc tcc ctg ccc agt ccc ccg gaa gcc tcc aca 726 Pro Glu Ala Cys Pro Val Ser Leu Pro Ser Pro Pro Glu Ala Ser Thr 140 145 150 ctc aag ggc cct cca cct gag gca gat ctt cct agg agc cct gga aac 774 Leu Lys Gly Pro Pro Pro Glu Ala Asp Leu Pro Arg Ser Pro Gly Asn 155 160 165 ttg acg gag aga gaa gag ctg gca ggg agc ctg gcc cgg gct att gca 822 Leu Thr Glu Arg Glu Glu Leu Ala Gly Ser Leu Ala Arg Ala Ile Ala 170 175 180 ggt gga gac gag aag ggg gca gcc caa gtg gca gcc gtc ctg gcc cag 870 Gly Gly Asp Glu Lys Gly Ala Ala Gln Val Ala Ala Val Leu Ala Gln 185 190 195 200 cat cgt gtg gcc ctg agt gtt cag ctt cag gag gcc tgc ttc cca cct 918 His Arg Val Ala Leu Ser Val Gln Leu Gln Glu Ala Cys Phe Pro Pro 205 210 215 ggc ccc atc agg ctg cag gtc aca ctt gaa gac gct gcc tct gcc gca 966 Gly Pro Ile Arg Leu Gln Val Thr Leu Glu Asp Ala Ala Ser Ala Ala 220 225 230 tcc gcc gcg tcc tct gca cac gtt gcc ctg cag gtc cac ccc cac tgc 1014 Ser Ala Ala Ser Ser Ala His Val Ala Leu Gln Val His Pro His Cys 235 240 245 act gtt gca gct ctc cag gag cag gtg ttc tca gag ctc ggt ttc ccg 1062 Thr Val Ala Ala Leu Gln Glu Gln Val Phe Ser Glu Leu Gly Phe Pro 250 255 260 cca gcc gtg caa cgc tgg gtc atc gga cgg tgc ctg tgt gtg cct gag 1110 Pro Ala Val Gln Arg Trp Val Ile Gly Arg Cys Leu Cys Val Pro Glu 265 270 275 280 cgc agc ctt gcc tct tac ggg gtt cgg cag gat ggg gac cct gct ttc 1158 Arg Ser Leu Ala Ser Tyr Gly Val Arg Gln Asp Gly Asp Pro Ala Phe 285 290 295 ctc tac ttg ctg tca gct cct cga gaa gcc cca gcc aca gga cct agc 1206 Leu Tyr Leu Leu Ser Ala Pro Arg Glu Ala Pro Ala Thr Gly Pro Ser 300 305 310 cct cag cac ccc cag aag atg gac ggg gaa ctt gga cgc ttg ttt ccc 1254 Pro Gln His Pro Gln Lys Met Asp Gly Glu Leu Gly Arg Leu Phe Pro 315 320 325 cca tca ttg ggg cta ccc cca ggc ccc cag cca gct gcc tcc agc ctg 1302 Pro Ser Leu Gly Leu Pro Pro Gly Pro Gln Pro Ala Ala Ser Ser Leu 330 335 340 ccc agt cca ctc cag ccc agc tgg tcc tgt cct tcc tgc acc ttc atc 1350 Pro Ser Pro Leu Gln Pro Ser Trp Ser Cys Pro Ser Cys Thr Phe Ile 345 350 355 360 aat gcc cca gac cgc cct ggc tgt gag atg tgt agc acc cag agg ccc 1398 Asn Ala Pro Asp Arg Pro Gly Cys Glu Met Cys Ser Thr Gln Arg Pro 365 370 375 tgc act tgg gac ccc ctt gct gca gct tcc acc tagcagcca ccagaggtta 1450 Cys Thr Trp Asp Pro Leu Ala Ala Ala Ser Thr 380 385 caaggggaga gtggcccttc cctcacaagt ccgacatctc caggccccca ctgaactccg 1510 gggacctcta ctgactgctt gctgggacag tcaccagggt tggggggaag ggccacaaaa 1570 tgaaaccatt aaagaccctt aagagcc 1597 <210> 16 <211> 387 <212> PRT <213> Homo sapiens <400> 16 Met Ala Pro Pro Ala Gly Gly Ala Ala Ala Ala Ala Ser Asp Leu Gly 1 5 10 15 Ser Ala Ala Val Leu Leu Ala Val His Ala Ala Val Arg Pro Leu Gly 20 25 30 Ala Gly Pro Asp Ala Glu Ala Gln Leu Arg Arg Leu Gln Leu Ser Ala 35 40 45 Asp Pro Glu Arg Pro Gly Arg Phe Arg Leu Glu Leu Leu Gly Ala Gly 50 55 60 Pro Gly Ala Val Asn Leu Glu Trp Pro Leu Glu Ser Val Ser Tyr Thr 65 70 75 80 Ile Arg Gly Pro Thr Gln His Glu Leu Gln Pro Pro Pro Gly Gly Pro 85 90 95 Gly Thr Leu Ser Leu His Phe Leu Asn Pro Gln Glu Ala Gln Arg Trp 100 105 110 Ala Val Leu Val Arg Gly Ala Thr Val Glu Gly Gln Asn Gly Ser Lys 115 120 125 Ser Asn Ser Pro Pro Ala Leu Gly Pro Glu Ala Cys Pro Val Ser Leu 130 135 140 Pro Ser Pro Pro Glu Ala Ser Thr Leu Lys Gly Pro Pro Pro Glu Ala 145 150 155 160 Asp Leu Pro Arg Ser Pro Gly Asn Leu Thr Glu Arg Glu Glu Leu Ala 165 170 175 Gly Ser Leu Ala Arg Ala Ile Ala Gly Gly Asp Glu Lys Gly Ala Ala 180 185 190 Gln Val Ala Ala Val Leu Ala Gln His Arg Val Ala Leu Ser Val Gln 195 200 205 Leu Gln Glu Ala Cys Phe Pro Pro Gly Pro Ile Arg Leu Gln Val Thr 210 215 220 Leu Glu Asp Ala Ala Ser Ala Ala Ser Ala Ala Ser Ser Ala His Val 225 230 235 240 Ala Leu Gln Val His Pro His Cys Thr Val Ala Ala Leu Gln Glu Gln 245 250 255 Val Phe Ser Glu Leu Gly Phe Pro Pro Ala Val Gln Arg Trp Val Ile 260 265 270 Gly Arg Cys Leu Cys Val Pro Glu Arg Ser Leu Ala Ser Tyr Gly Val 275 280 285 Arg Gln Asp Gly Asp Pro Ala Phe Leu Tyr Leu Leu Ser Ala Pro Arg 290 295 300 Glu Ala Pro Ala Thr Gly Pro Ser Pro Gln His Pro Gln Lys Met Asp 305 310 315 320 Gly Glu Leu Gly Arg Leu Phe Pro Pro Ser Leu Gly Leu Pro Pro Gly 325 330 335 Pro Gln Pro Ala Ala Ser Ser Leu Pro Ser Pro Leu Gln Pro Ser Trp 340 345 350 Ser Cys Pro Ser Cys Thr Phe Ile Asn Ala Pro Asp Arg Pro Gly Cys 355 360 365 Glu Met Cys Ser Thr Gln Arg Pro Cys Thr Trp Asp Pro Leu Ala Ala 370 375 380 Ala Ser Thr 385 <210> 17 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 17 gctgaagcag gaaaatcgct t 21 <210> 18 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 18 tgagacggag tctcactcgg t 21 <210> 19 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 19 gtttttccta attttggcat gaac 24 <210> 20 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 20 cgcccaagct tttcctttt 19 <210> 21 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 21 caccctttgc ctctgtcact tccgca 26 <210> 22 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 22 gctggagcac caggactgca ttg 23 <210> 23 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 23 ggagctgagc agcagtgtaa tgaa 24 <210> 24 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 24 gaggcctgcc tgaaggagga gcttc 25 <210> 25 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 25 tctggaagta gtgcagacgc ctcagg 26 <210> 26 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 26 agccaacgtc ggctttgtta tccagc 26 <210> 27 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 27 gctgtcagat atgatggttc tggac 25 <210> 28 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 28 ccagcctcac cactgttggg ttgc 24 <210> 29 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 29 cattctctga gctgtattag tgt 23 <210> 30 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 30 cctgagctgg aatgacctgc a 21 <210> 31 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 31 ctttgtgttg gctgcagcca ca 22 <210> 32 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 32 tgaggagaga ctttgctgac tggt 24 <210> 33 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 33 gtcctgtctg gcggtgccga 20 <210> 34 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 34 gctccaggat cccctgtcac ctgggccttc tgccttttgg ct 42 <210> 35 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 35 ccatatggag aggagagcag cgggccca 28 <210> 36 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 36 gaaggaggaa catggagagg aga 23 <210> 37 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 37 ccatatgccc cgggtagtct actgcat 27 <210> 38 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 38 gtcgactcga gtcacttccg caaaaacttc ttg 33 <210> 39 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 39 tccattccga aggctctcct cc 22 <210> 40 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 40 gtctgtgtga cggaaatgta agc 23 <210> 41 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 41 gaaggtcgaa ggcagaccga tgt 23 <210> 42 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 42 gaatgtgtca gagacaagtg cagc 24 <210> 43 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 43 tgtagaaact cttggactaa tggagg 26 <210> 44 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 44 gtatgcatca gaattcccta tagatcttt 29 <210> 45 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 45 tagatgtttg ggcaacagcc t 21 <210> 46 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 46 ttccttcacc aaaggcatcc agccattcta tg 32 <210> 47 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 47 aaatgtctga ttaccccatt ttatcagt 28 <210> 48 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 48 taatcctgaa atgaacagct aaca 24 <210> 49 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 49 taatgttaga gtaacagcat tttccttcaa 30 <210> 50 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 50 tgccccacac taactcagtt cttgtgatg 29 <210> 51 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 51 aaggctttat caggtctgca tatagaatc 29 <210> 52 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 52 gcaaagaacc ctaatgctat ttatcagc 28 <210> 53 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 53 gagaagacca gggaagaagc ag 22 <210> 54 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 54 ggacggggaa cttggacgc 19 <210> 55 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 55 aagtgcaggg cctctgggtg 20 <210> 56 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 56 cgctgggtca tcggacggt 19

Claims (33)

  1. (a) SEQ ID NO: 1, 3, 5, 7, 9, 11, 13 또는 15를 포함하는 것으로 구성된 분리된 핵산 분자, (b) SEQ ID NO: 2, 4, 6, 8, 10, 12, 14 또는 16을 인코딩하는 분리된 핵산 분자, (c) 암에서 발현되는 단백질을 인코딩하고, SEQ ID NO: 1, 3, 5, 7, 9, 11, 13 또는 15의 전체 근접 서열(entire contiguous sequence)에 대해 적어도 75% 뉴클레오티드 서열 상동성을 나타내는 분리된 핵산 분자, 및 (d) (a), (b) 또는 (c)의 핵산 분자의 상보체를 포함하는 것으로 구성된 분리된 핵산 분자로 이루어진 군으로부터 선택된 분리된 핵산 분자.
  2. 제 1 항에 있어서, 상기 핵산 분자는 SEQ ID NO: 1의 뉴클레오티드 390-4880, SEQ ID NO: 3의 뉴클레오티드 12-4904, SEQ ID NO: 5의 뉴클레오티드 424-1908, SEQ ID NO: 7의 뉴클레오티드 405-1835, SEQ ID NO: 9의 뉴클레오티드 89-1150, SEQ ID NO: 11의 뉴클레오티드 223-1569, SEQ ID NO: 13의 뉴클레오티드 418-1392, 또는 SEQ ID NO: 15의 뉴클레오티드 271-1431을 포함하는 것으로 구성되어 있는 것을 특징으로 하는 핵산 분자.
  3. 제 1 항에 있어서, 상기 핵산 분자는 SEQ ID NO: 1의 뉴클레오티드 390-4883, SEQ ID NO: 3의 뉴클레오티드 12-4907, SEQ ID NO: 5의 뉴클레오티드 424-1911, SEQ ID NO: 7의 뉴클레오티드 405-1838, SEQ ID NO: 9의 뉴클레오티드 89-1153, SEQ ID NO: 11의 뉴클레오티드 223-1572, SEQ ID NO: 13의 뉴클레오티드 418-1395, 또는 SEQ ID NO: 15의 뉴클레오티드 271-1434 을 포함하는 것으로 구성되어 있는 것을 특징으로 하는 핵산 분자.
  4. 제 1 항에 있어서, 상기 핵산 분자는 SEQ ID NO: 1의 뉴클레오티드 390-4883, SEQ ID NO: 3의 뉴클레오티드 12-4907, SEQ ID NO: 5의 뉴클레오티드 424-1908, SEQ ID NO: 7의 뉴클레오티드 405-1835, SEQ ID NO: 9의 뉴클레오티드 89-1153, SEQ ID NO: 11의 뉴클레오티드 223-1569, SEQ ID NO: 13의 뉴클레오티드 418-1395, SEQ ID NO: 15의 뉴클레오티드 271-1434로 구성된 것을 특징으로 하는 핵산 분자.
  5. 제 1 항 내지 제 4 항 중의 어느 하나에 있어서, 상기 핵산 분자는 하나 또는 그 이상의 발현 조절 요소에 작동 가능하도록 연결되어 있는 것을 특징으로 하는 핵산 분자.
  6. 제 1 항 내지 4 항 중의 어느 하나에 따른 분리된 핵산 분자를 포함하는 것으로 구성된 벡터.
  7. 제 1 항 내지 4 항 중의 어느 하나에 따른 핵산 분자를 포함하도록 형질 전환된 숙주세포.
  8. 제 6 항에 따른 벡터를 포함하는 것으로 구성된 숙주세포.
  9. 제 8 항에 있어서, 상기 숙주세포는 원핵 숙주세포와 진핵 숙주세포로 이루어진 군으로부터 선택된 것을 특징으로 하는 숙주세포.
  10. 제 1 항 내지 제 4 항 중 어느 하나에 따른 핵산 분자에 의해 인코딩된 단백질이 발현되는 조건 하에서, 상기 핵산 분자로 형질 전환된 숙주세포를 배양하는 과정을 포함하는 것으로 구성된 폴리펩티드의 제조방법.
  11. 제 10 항에 있어서, 상기한 숙주세포는 원핵 숙주세포와 진핵 숙주세포로 이루어진 군으로부터 선택된 것을 특징으로 하는 방법.
  12. 제 10 항의 방법에 의해 제조된 분리된 폴리펩티드.
  13. SEQ ID NO: 2, 4, 6, 8, 10, 12, 14 또는 16의 아미노산 서열로 구성된 단백질과 SEQ ID NO: 2, 4, 6, 8, 10, 12, 14 또는 16과 적어도 75%의 상동성을 가지는 단백질로 이루어진 군으로부터 선택되는 분리된 폴리펩티드 또는 단백질.
  14. 제 13 항의 폴리펩티드에 결합하는 분리된 항체 또는 항원-결합 항체 단편.
  15. 제 14 항에 있어서, 상기 항체는 단일클론(monoclonal) 또는 다중클론(polyclonal) 항체인 것을 특징으로 하는 항체.
  16. 핵산을 발현하는 세포를 물질(agent)에 노출시키는 것; 및
    상기 물질이 상기 핵산의 발현을 조절하는지 여부를 결정함으로써, 단백질을 인코딩하는 핵산의 발현을 조절하는 물질을 확인하는 것;
    을 포함하는 것으로 구성된, 제 13 항의 단백질을 인코딩하는 핵산의 발현을 조절하는 물질을 확인하는 방법.
  17. 단백질을 발현하는 세포를 물질에 노출시키는 것; 및
    상기 물질이 상기 단백질의 수준이나 적어도 하나의 활성을 조절하는지 여부를 결정함으로써, 단백질의 수준이나 적어도 하나의 활성을 조절하는 물질을 확인하는 것;
    을 포함하는 것으로 구성된, 제 13 항에 따른 단백질의 수준이나 적어도 하나의 활성을 조절하는 물질을 확인하는 방법.
  18. 제 17 항에 있어서, 상기 물질은 상기 단백질의 하나의 활성을 조절하는 것을 특징으로 하는 방법.
  19. 단백질을 인코딩하는 핵산의 발현을 조절하는 유효량의 물질을 투여하는 것을 포함하는 것으로 구성된, 제 13 항의 단백질을 인코딩하는 핵산의 발현을 조절하는 방법.
  20. 단백질의 적어도 하나의 활성을 조절하는 유효량의 물질을 투여하는 것을 포함하는 것으로 구성된, 제 13 항에 따른 단백질의 적어도 하나의 활성을 조절하는 방법.
  21. 단백질을 잠재적 결합 파트너(potential binding partner)에 노출시키는 것; 및
    상기 잠재적 결합 파트너가 상기 단백질에 결합하는지를 결정함으로써, 상기 단백질에 대한 결합 파트너를 확인하는 것;
    을 포함하는 것으로 구성된, 제 13 항의 단백질에 대한 결합 파트너를 확인하는 방법.
  22. 파트너를 가진 단백질을 물질에 노출시키는 것; 및
    상기 물질이 상기 단백질과 결합 파트너(binding partner)의 결합(association)을 조절하는지 여부를 결정함으로써 상기 단백질과 결합 파트너와의 결합을 조절하는 물질을 확인하는 것;
    을 포함하는 것으로 구성된, 제 21 항의 결합 파트너와 제 13 항의 단백질 간의 상호작용을 조절하는 물질을 확인하는 방법.
  23. 결합 파트너와 단백질의 결합을 조절하는 유효량의 물질을 투여하는 것을 포함하는 것으로 구성된, 제 21 항의 결합 파트너와 제 13 항의 단백질 간의 상호작용을 조절하는 방법.
  24. 제 1 항 내지 제 4 항 중의 어느 하나에 따른 핵산 분자를 포함하도록 변형된 비인간 형질전환 동물.
  25. 제 24 항에 있어서, 상기 핵산 분자는 인코딩된 단백질의 발현을 막는 돌연변이를 포함하는 것을 특징으로 하는 동물.
  26. 프로모터 또는 인헨서 요소(enhancer element)에 연결된 제 1 항 내지 제 4 항 중의 어느 하나에 따른 분리된 핵산 분자를 포함하는 것으로 구성된 유전자 구조체(gene construct)를 병든 세포에 주입하는 것을 포함하는 것으로 구성된, 객체(subject)에서 병을 치료하는 방법.
  27. 제 26 항에 있어서, 상기 병든 세포로 주입하는 것은 생체내(in vivo) 에서 행해지는 것을 특징으로 하는 방법.
  28. 제 26 항에 있어서, 상기 병든 세포로 주입하는 것은 바이러스성 또는 플라스미드 물질의 사용을 더 포함하고, 생체내(in vitro) 또는 생체외(in vivo)에서 행해지는 것을 특징으로 하는 방법.
  29. 제 1 항 내지 제 4 항 또는 제 13 항 중의 어느 하나에 따른 핵산 분자 또는 단백질의 발현 수준을 결정하는 것으로 구성된, 객체에서 질병 상태를 진단하는 방법.
  30. 제 26 항 내지 제 29 항 중의 어느 하나에 있어서, 상기 질병 상태는 암인 것을 특징으로 하는 방법.
  31. 제 26 항 내지 제 29 항 중 어느 하나에 있어서, 상기 질병 상태는 악성 종양인 것을 특징으로 하는 방법.
  32. 제 31 항에 있어서, 상기 악성 종양은 유방, 대장, 식도, 신장, 간, 폐, 림프선, 난소, 췌장, 전립선, 직장 또는 위에서 발생하는 것을 특징으로 하는 방법.
  33. SEQ ID NO: 2, 4, 6, 8, 10, 12, 14 또는 16의 아미노산 서열을 포함하는 것으로 구성된 분리된 폴리펩티드; SEQ ID NO: 2, 4, 6, 8, 10, 12, 14 또는 16의 아미노산 중 적어도 10 개의 단편을 포함하는 것으로 구성된 분리된 폴리펩티드; SEQ ID NO: 2, 4, 6, 8, 10, 12, 14 또는 16의 보존적인 아미노산 치환체(conservative amino acid substitution)를 포함하는 것으로 구성된 분리된 폴리펩티드; SEQ ID NO: 2, 4, 6, 8, 10, 12, 14 또는 16의 천연 아미노산 서열 변이체(variant)를 포함하는 것으로 구성된 분리된 폴리펩티드; 및 SEQ ID NO: 2, 4, 6, 8, 10, 12, 14 또는 16과 적어도 약 75% 아미노산 서열 상동성을 나타내는 분리된 폴리펩티드로 이루어진 군에서 선택되는 폴리펩티드 또는 단백질과 희석제를 포함하는 것으로 구성된 조성물.
KR1020057006678A 2002-10-18 2003-10-16 암 관련 유전자 군 KR20050056250A (ko)

Applications Claiming Priority (12)

Application Number Priority Date Filing Date Title
US41991102P 2002-10-18 2002-10-18
US41991202P 2002-10-18 2002-10-18
US42008802P 2002-10-18 2002-10-18
US60/420,088 2002-10-18
US60/419,911 2002-10-18
US60/419,912 2002-10-18
US43424302P 2002-12-16 2002-12-16
US43427802P 2002-12-16 2002-12-16
US60/434,278 2002-12-16
US60/434,243 2002-12-16
US43827803P 2003-01-03 2003-01-03
US60/438,278 2003-01-03

Publications (1)

Publication Number Publication Date
KR20050056250A true KR20050056250A (ko) 2005-06-14

Family

ID=32111168

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020057006678A KR20050056250A (ko) 2002-10-18 2003-10-16 암 관련 유전자 군

Country Status (6)

Country Link
US (1) US7718787B2 (ko)
EP (1) EP1558737A4 (ko)
JP (1) JP2006512923A (ko)
KR (1) KR20050056250A (ko)
AU (1) AU2003269557A1 (ko)
WO (1) WO2004035789A1 (ko)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1558737A4 (en) * 2002-10-18 2008-06-11 Lg Life Sciences Ltd GENE FAMILIES ASSOCIATED WITH CANCERS
WO2008066057A1 (fr) * 2006-11-30 2008-06-05 Kyoto University Contrôle d'une prolifération cellulaire ciblée pour iqgap3
EP3351270A1 (en) 2007-05-23 2018-07-25 The Trustees of the University of Pennsylvania Targeted carriers for intracellular drug delivery
WO2009018446A1 (en) * 2007-08-01 2009-02-05 The Johns Hopkins University Esophageal cancer markers

Family Cites Families (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0826078B2 (ja) * 1984-01-12 1996-03-13 カイロン コーポレイション フアクタ−v▲iii▼c組成物
US4736866A (en) 1984-06-22 1988-04-12 President And Fellows Of Harvard College Transgenic non-human mammals
US4908773A (en) 1987-04-06 1990-03-13 Genex Corporation Computer designed stabilized proteins and method for producing same
US5143854A (en) 1989-06-07 1992-09-01 Affymax Technologies N.V. Large scale photolithographic solid phase synthesis of polypeptides and receptor binding screening thereof
US5399346A (en) 1989-06-14 1995-03-21 The United States Of America As Represented By The Department Of Health And Human Services Gene therapy
DE69132531T2 (de) 1990-12-06 2001-09-13 Affymetrix Inc Verbindungen und ihre Verwendung in einer binären Synthesestrategie
US5331573A (en) 1990-12-14 1994-07-19 Balaji Vitukudi N Method of design of compounds that mimic conformational features of selected peptides
US5723719A (en) 1991-08-08 1998-03-03 Health Research Inc. Transgenic mouse as model for diseases involving dopaminergic dysfunction
DE4126968A1 (de) 1991-08-14 1993-02-18 Detlev Prof Dr Med Ganten Transgene ratten, die in ihrem genom mindestens ein menschliches gen enthalten, das an der blutdruckregulation beteiligt ist
WO1993014200A1 (en) 1992-01-07 1993-07-22 Tsi Corporation Transgenic animal models for alzheimer's disease
US5602307A (en) 1992-08-12 1997-02-11 Baylor College Of Medicine Non-human animal having predefined allele of a cellular adhesion gene
US5731490A (en) 1992-09-29 1998-03-24 The Ontario Cancer Institute Mutant mouse lacking the expression of interferon regulatory factor 1 (IRF-1)
US5489743A (en) 1993-01-19 1996-02-06 Amgen Inc. Transgenic animal models for thrombocytopenia
US5884230A (en) 1993-04-28 1999-03-16 Immunex Corporation Method and system for protein modeling
PT725682E (pt) 1993-10-28 2002-09-30 Houston Advanced Res Ct Dispositivo poroso microfabricado de escoamento
EP0740708B1 (en) 1993-11-26 2004-08-04 Lawrence B. Hendry Design of drugs involving receptor-ligand-dna interactions
JPH08311100A (ja) * 1995-03-13 1996-11-26 Terumo Corp ヒト肺腺癌に関するモノクローナル抗体および抗原、及びそれを用いた免疫測定方法
US5728915A (en) 1995-05-08 1998-03-17 Children's Hospital, Inc. Transgenic mice which express simian SV 40 T-antigen under control of the retinoblastoma gene promoter
US5873052A (en) 1996-11-06 1999-02-16 The Perkin-Elmer Corporation Alignment-based similarity scoring methods for quantifying the differences between related biopolymer sequences
AU4187499A (en) * 1998-05-14 1999-11-29 Chiron Corporation Human genes and gene expression products v
JP2002017376A (ja) * 1999-07-08 2002-01-22 Herikkusu Kenkyusho:Kk 分泌蛋白質、または膜蛋白質
EP1514933A1 (en) * 1999-07-08 2005-03-16 Research Association for Biotechnology Secretory protein or membrane protein
AU7680300A (en) * 1999-08-18 2001-03-13 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Human dna sequences
AU2001233293A1 (en) * 2000-02-03 2001-08-14 Hyseq, Inc. Methods and materials relating to scavenger receptor-like polypeptides and polynucleotides
AU2001241541A1 (en) * 2000-02-17 2001-08-27 Millennium Predictive Medicine, Inc. Novel genes, compositions, kits, and methods for identification, assessment, prevention, and therapy of human prostate cancer
PL366626A1 (en) * 2000-03-29 2005-02-07 Corixa Corporation Compositions and methods for the therapy and diagnosis of lung cancer
AU2001249642A1 (en) * 2000-04-06 2001-10-23 Genetics Institute, Llc Polynucleotides encoding novel secreted proteins
US20020132237A1 (en) * 2000-05-26 2002-09-19 Corixa Corporation Compositions and methods for the therapy and diagnosis of ovarian cancer
AU6531101A (en) * 2000-06-02 2001-12-17 Genentech Inc Secreted and transmembrane polypeptides and nucleic acids encoding the same
WO2001098354A2 (en) * 2000-06-21 2001-12-27 Incyte Genomics, Inc. Human receptors
AU2002216610A1 (en) * 2000-09-01 2002-04-02 Genentech Inc. Secreted and transmembrane polypeptides and nucleic acids encoding the same
EP1412387A2 (en) * 2000-10-27 2004-04-28 Incyte Genomics, Inc. Transporters and ion channels
NZ526707A (en) * 2000-11-28 2005-03-24 Wyeth Corp Use of SMARC nucleic acid and polypeptide expression analysis for the diagnosis and prognosis of prostate cancer
AU2002245128A1 (en) * 2000-12-19 2002-07-30 Pe Corporation (Ny) Human transporter proteins, nucleic acid molecules encoding them, and uses thereof
JP2005500815A (ja) * 2000-12-29 2005-01-13 キュラジェン コーポレイション タンパク質およびそれをコードする核酸
US20020137081A1 (en) * 2001-01-08 2002-09-26 Olga Bandman Genes differentially expressed in vascular tissue activation
AU2002255478A1 (en) * 2001-01-10 2002-09-12 Pe Corporation (Ny) Kits, such as nucleic acid arrays, comprising a majority of human exons or transcripts, for detecting expression and other uses thereof
US20070015148A1 (en) * 2001-01-25 2007-01-18 Orr Michael S Gene expression profiles in breast tissue
JPWO2002064770A1 (ja) * 2001-02-15 2004-06-17 持田製薬株式会社 新規スカベンジャー受容体クラスa蛋白質
US20030185815A1 (en) * 2001-04-03 2003-10-02 Muralidhara Padigaru Novel antibodies that bind to antigenic polypeptides, nucleic acids encoding the antigens, and methods of use
EP1379540A4 (en) * 2001-04-19 2005-11-16 Bristol Myers Squibb Co POLYNUCLEOTIDES AND POLYPEPTIDES ASSOCIATED WITH NF-KB PATH
US6489153B1 (en) * 2001-10-31 2002-12-03 Pe Corporation (Ny) Isolated human kinase proteins, nucleic acid molecules encoding human kinase proteins, and uses thereof
AU2002364705A1 (en) * 2001-11-29 2003-09-09 Curagen Corporation Antisense modulation of protein expression
WO2003064642A1 (en) * 2002-01-28 2003-08-07 Bayer Healthcare Ag Regulation of human thymidylate kinase
EP1558737A4 (en) * 2002-10-18 2008-06-11 Lg Life Sciences Ltd GENE FAMILIES ASSOCIATED WITH CANCERS

Also Published As

Publication number Publication date
US20060168670A1 (en) 2006-07-27
WO2004035789A9 (en) 2004-07-22
EP1558737A1 (en) 2005-08-03
US7718787B2 (en) 2010-05-18
JP2006512923A (ja) 2006-04-20
EP1558737A4 (en) 2008-06-11
WO2004035789A1 (en) 2004-04-29
AU2003269557A1 (en) 2004-05-04

Similar Documents

Publication Publication Date Title
US20020187472A1 (en) Steap-related protein
US20020102569A1 (en) Diagnostic marker for cancers
KR100954322B1 (ko) 췌장암과 관련된 신규한 lbfl313 유전자
US20080227737A1 (en) Type 2 diabetes mellitus genes
US20030082533A1 (en) Intelectin
US20050170500A1 (en) Methods for identifying risk of melanoma and treatments thereof
US20050277118A1 (en) Methods for identifying subjects at risk of melanoma and treatments thereof
CA2494899A1 (en) Polypeptides and nucleic acids encoding these and their use for the prevention, diagnosis or treatment of liver disorders and epithelial cancer
JP2004516815A (ja) ダウン症候群重要領域1−様1タンパク質
AU770704B2 (en) DNA polymerase lambda and uses thereof
KR20050056250A (ko) 암 관련 유전자 군
US6680196B1 (en) Gene that is amplified and overexpressed in cancer and methods of use thereof
JP2004537971A (ja) 大腸癌マーカー
CN100552027C (zh) 与癌症相关的基因家族
US6656698B1 (en) 12832, a novel human kinase-like molecule and uses thereof
US20030054446A1 (en) Novel retina-specific human proteins C7orf9, C12orf7, MPP4 and F379
JP2004516813A (ja) 関連腫瘍マーカー
US20030167480A1 (en) NDR2-related proteins
US20060121471A1 (en) Gene families associated with stomach cancer
JP2004500046A (ja) 新規ポリペプチドおよびそれをコードするポリヌクレオチド
KR20050056199A (ko) 간암 관련 유전자 훼밀리
WO2001041805A1 (en) Novel cdna 22360 associated with renal disease and other disease states
JP2005504504A (ja) TIMM8b関連タンパク質
JP2004507242A (ja) 腎臓特異タンパク質

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application