KR20190041476A - C-절단된 피브릴린-1의 발현을 유도하는 돌연변이를 포함하는 마우스 - Google Patents

C-절단된 피브릴린-1의 발현을 유도하는 돌연변이를 포함하는 마우스 Download PDF

Info

Publication number
KR20190041476A
KR20190041476A KR1020197005701A KR20197005701A KR20190041476A KR 20190041476 A KR20190041476 A KR 20190041476A KR 1020197005701 A KR1020197005701 A KR 1020197005701A KR 20197005701 A KR20197005701 A KR 20197005701A KR 20190041476 A KR20190041476 A KR 20190041476A
Authority
KR
South Korea
Prior art keywords
fbn1
protein
sequence
mutation
human mammal
Prior art date
Application number
KR1020197005701A
Other languages
English (en)
Inventor
찰린 헌트
제이슨 마스타이티스
궈춘 공
카-만 비너스 라이
제스퍼 그로마다
아리스 엔. 에코노미데스
Original Assignee
리제너론 파마슈티칼스 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 리제너론 파마슈티칼스 인코포레이티드 filed Critical 리제너론 파마슈티칼스 인코포레이티드
Publication of KR20190041476A publication Critical patent/KR20190041476A/ko

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K67/00Rearing or breeding animals, not otherwise provided for; New breeds of animals
    • A01K67/027New breeds of vertebrates
    • A01K67/0275Genetically modified vertebrates, e.g. transgenic
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K49/00Preparations for testing in vivo
    • A61K49/0004Screening or testing of compounds for diagnosis of disorders, assessment of conditions, e.g. renal clearance, gastric emptying, testing for diabetes, allergy, rheuma, pancreas functions
    • A61K49/0008Screening agents using (non-human) animal models or transgenic animal models or chimeric hosts, e.g. Alzheimer disease animal model, transgenic model for heart failure
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/78Connective tissue peptides, e.g. collagen, elastin, laminin, fibronectin, vitronectin, cold insoluble globulin [CIG]
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/05Animals comprising random inserted nucleic acids (transgenic)
    • A01K2217/054Animals comprising random inserted nucleic acids (transgenic) inducing loss of function
    • A01K2217/056Animals comprising random inserted nucleic acids (transgenic) inducing loss of function due to mutation of coding region of the transgene (dominant negative)
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2227/00Animals characterised by species
    • A01K2227/10Mammal
    • A01K2227/105Murine
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2267/00Animals characterised by purpose
    • A01K2267/03Animal model, e.g. for test or diseases
    • A01K2267/0306Animal model for genetic diseases

Abstract

선천성 지방이영양증 (NPSCL)을 갖는 신생아 조로 증후군을 모델링하기 위한, Fbn1 유전자 내 돌연변이를 포함하는 비-인간 동물이 제공된다. 또한, 상기 비-인간 동물 모델을 제조하는 방법이 제공된다. 비-인간 동물 모델은, NPSCL을 억제하거나 감소시키는데 있어서의, 또는 NPSCL-유사 증상을 완화시키는데 있어서의 활성에 대하여 화합물을 스크리닝하거나, 또는 NPSCL을 촉진하거나 악화시키는데 있어서 잠재적으로 유해한 활성에 대하여 화합물을 스크리닝하기 위하여, 뿐만 아니라 NPSCL의 기전 및 잠재적 신규 치료 및 진단 표적에 대한 통찰력을 제공하기 위하여 사용될 수 있다.

Description

C-절단된 피브릴린-1의 발현을 유도하는 돌연변이를 포함하는 마우스
관련 출원에 대한 상호 참조
본원은 2016년 7월 29일 금요일에 출원된 미국 출원 제62/368,924호(모든 목적을 위해 본 명세서에 그 전문이 참고로 포함됨)의 이점을 주장한다.
EFS 웹을 통한 텍스트 파일로서 제출된 서열 목록에 대한 참조
파일 500041SEQLIST.txt로서 기록된 서열 목록은 184 킬로바이트이고, 2017년 7월 28일 생성되었고, 이는 본원에 참고로 편입된다.
3000개 초과의 돌연변이가 인간의 피브릴린 -1 (FBN1) 유전자 내에서 임상적으로 식별되었다. 이러한 돌연변이는, 유형 I 피브릴린병증 (type I fibrillinopathies), 마르판 증후군 (Marfan syndrome), MASS 증후군, 단리된 수정체전위 증후군 (isolated ectopia lentis syndrome), 흉부 대동맥류 (thoracic aortic aneurysms), 바일-마르케사니 증후군 (Weill-Marchesani syndrome), 겔레오피직 및 말단왜소 형성이상 (geleophysic and acromicric dysplasia), 경직성 피부 증후군 (stiff skin syndrome), 및 선천성 지방이영양증을 갖는 신생아 조로 증후군 (neonatal progeroid syndrome with congenital lipodystrophy, NPSCL)을 포함하는 다양한 병태와 연관되어 있다. FBN1 돌연변이를 갖도록 조작된, 현재 사용가능한 형질전환 비-인간 포유동물은 NPSCL의 증상을 적절하게 반영하지 않는다.
발명의 개요
선천성 지방이영양증을 갖는 신생아 조로 증후군을 모델링하기 위한 방법 및 조성물이 제공된다. 일 양태에서, 본 발명은 비-인간 포유동물로서, 이의 게놈이 돌연변이를 포함하는 피브릴린 -1 (Fbn1) 유전자를 포함하고, 상기 유전자의 발현이, 상기 비-인간 포유동물로 하여금 신생아 조로 증후군의 하나 이상의 선천성 지방이영양증-유사 증상이 발병하도록 하는 C-말단 절단된 Fbn1 단백질을 유발하도록 하는, 비-인간 포유동물을 제공한다. 선택적으로, 비-인간 포유동물은 돌연변이에 대해 이형접합자를 갖는다. 선택적으로, Fbn1 유전자는 비-인간 포유동물에 내인성인 Fbn1 프로모터를 포함한다. 선택적으로, 돌연변이는 프레임시프트 돌연변이이다.
일부 비-인간 포유동물에서, 돌연변이는 조기 종결 코돈을 유발한다. 선택적으로, 조기 종결 코돈은 Fbn1 유전자의 말단으로부터 2번째 엑손 또는 최종 엑손 내 존재한다. 선택적으로, 조기 종결 코돈은 최종 엑손 내 존재하거나, 또는 Fbn1 유전자 내 최종 엑손-엑손 접합의 상류에 있는 약 55개 미만의 염기쌍이다. 선택적으로, 조기 종결 코돈은 Fbn1 유전자 내 최종 엑손-엑손 접합의 상류에 있는 약 55개 미만의 염기쌍이다. 선택적으로, 조기 종결 코돈은 최종 엑손 내 존재하거나, 또는 Fbn1 유전자 내 최종 엑손-엑손 접합의 상류에 있는 약 20개 미만의 염기쌍이다. 선택적으로, 돌연변이는, 말단으로부터 2번째 엑손의 건너뜀(skipping)을 유발하는 스플라이스 부위 돌연변이이다. 선택적으로, 돌연변이는 최종 암호화 엑손 내에 조기 종결 코돈을 유발한다.
일부 비-인간 포유동물에서, 돌연변이는 퓨린 계열의 전구단백질 전환효소 (proprotein convertase)에 대한 염기성 아미노산 인식 서열을 파괴한다. 일부 비-인간 포유동물에서, 돌연변이는 전구-피브릴린-1의 아스프로신 C-말단 절단 생성물의 제거를 유발한다. 일부 비-인간 포유동물에서, 돌연변이는 전구-피브릴린-1의 아스프로신 C-말단 절단 생성물의 파괴를 유발한다. 일부 비-인간 포유동물에서, 조기 종결 코돈은 양전하를 띈 C-말단을 갖는 암호화된 단백질을 생성한다.
일부 비-인간 포유동물에서, 암호화된 단백질 (즉, C-말단 절단된 Fbn1 단백질)은 (상기 암호화된 단백질이 서열 번호 30과 최적 정렬될 경우) 서열 번호 30에 명시된 야생형 마우스 Fbn1 단백질 내의 아미노산 2700 내지 2790, 아미노산 2710 내지 2780, 아미노산 2720 내지 2770, 아미노산 2730 내지 2760, 또는 아미노산 2737 내지 2755 위치에 상응하는 위치에서 절단된다. 선택적으로, 암호화된 단백질은 (상기 암호화된 단백질이 서열 번호 30과 최적 정렬될 경우) 최종 아미노산이 서열 번호 30 내 아미노산 2737, 아미노산 2738, 또는 아미노산 2755에 상응하는 위치에 존재하도록 절단된다 .
일부 비-인간 포유동물에서, 암호화된 단백질 (즉, C-말단 절단된 Fbn1 단백질)은 서열 번호 8, 42, 또는 43에 명시된 서열로 이루어진 C-말단을 갖는다. 일부 비-인간 포유동물에서, 암호화된 단백질은 서열 번호 8, 42, 43, 45, 46, 또는 47에 명시된 서열로 이루어진 C-말단을 갖는다. 선택적으로, 암호화된 단백질은 (상기 암호화된 단백질이 서열 번호 30과 최적 정렬될 경우) 최종 아미노산이 서열 번호 30에 명시된 야생형 마우스 Fbn1 내의 아미노산 2737에 상응하는 위치에 존재하도록 절단되며, 그리고 상기 암호화된 단백질의 C-말단은 서열 번호 43에 명시된 서열로 이루어진다. 선택적으로, 암호화된 단백질은 (상기 암호화된 단백질이 서열 번호 30과 최적 정렬될 경우) 최종 아미노산이 서열 번호 30에 명시된 야생형 마우스 Fbn1 내의 아미노산 2737에 상응하는 위치에 존재하도록 절단되며, 그리고 상기 암호화된 단백질의 C-말단은 서열 번호 43 또는 46에 명시된 서열로 이루어진다. 선택적으로, 암호화된 단백질은 (상기 암호화된 단백질이 서열 번호 30과 최적 정렬될 경우) 최종 아미노산이 서열 번호 30 내 아미노산 2738에 상응하는 위치에 존재하도록 절단되며, 그리고 상기 암호화된 단백질의 C-말단은 서열 번호 8에 명시된 서열로 이루어진다. 선택적으로, 암호화된 단백질은 (상기 암호화된 단백질이 서열 번호 30과 최적 정렬될 경우) 최종 아미노산이 서열 번호 30 내 아미노산 2738에 상응하는 위치에 존재하도록 절단되며, 그리고 상기 암호화된 단백질의 C-말단은 서열 번호 8 또는 45에 명시된 서열로 이루어진다. 선택적으로, 암호화된 단백질은 (상기 암호화된 단백질이 서열 번호 30과 최적 정렬될 경우) 최종 아미노산이 서열 번호 30 내 아미노산 2755에 상응하는 위치에 존재하도록 절단되며, 그리고 상기 암호화된 단백질의 C-말단은 서열 번호 42에 명시된 서열로 이루어진다. 선택적으로, 암호화된 단백질은 (상기 암호화된 단백질이 서열 번호 30과 최적 정렬될 경우) 최종 아미노산이 서열 번호 30 내 아미노산 2755에 상응하는 위치에 존재하도록 절단되며, 그리고 상기 암호화된 단백질의 C-말단은 서열 번호 42 또는 47에 명시된 서열로 이루어진다.
일부 비-인간 포유동물에서, Fbn1 유전자는 말단으로부터 2번째 엑손에 돌연변이를 포함한다. 선택적으로, Fbn1 유전자의 말단으로부터 2번째 엑손은, (상기 말단으로부터 2번째 엑손이 서열 번호 26, 27, 또는 28과 최적 정렬될 경우) 서열 번호 25에 명시된 야생형 마우스 Fbn1 말단으로부터 2번째 엑손 서열과 비교하여, 서열 번호 26, 27, 또는 28에서의 돌연변이에 상응하는 돌연변이를 포함한다.
일부 비-인간 포유동물에서, Fbn1 유전자의 전체 또는 일부는 결실되고, 그리고 병렬상동성 인간 FBN1 유전자 서열로 대체된다. 선택적으로, 암호화된 단백질의 C-말단 절단을 유발하는 돌연변이는 병렬상동성 인간 FBN1 유전자 서열 내에 위치한다. 선택적으로, 병렬상동성 인간 FBN1 유전자 서열은 내인성 비-인간 포유동물 Fbn1 좌위 내에 위치한다.
일부 비-인간 포유동물에서, 돌연변이화된 Fbn1 유전자에 의하여 암호화된 단백질은 서열 번호 31, 32, 또는 33에 명시된 서열로 이루어진다.
일부 비-인간 포유동물에서, 포유동물은 설치류이다. 선택적으로, 설치류는 랫트 또는 마우스이다.
일부 비-인간 포유동물에서, 포유동물은 마우스이다. 일부 비-인간 포유동물 또는 마우스에서, 돌연변이는, -1 프레임시프트를 야기하여, 엑손 64의 3' 말단 또는 엑손 65의 5' 말단에서의 조기 종결 코돈을 유발하는, 내인성 마우스 Fbn1 유전자의 엑손 64에서의 삽입 또는 결실을 포함한다. 선택적으로, 돌연변이는, -1 프레임시프트를 야기하여, 엑손 65의 5' 말단에서의 조기 종결 코돈을 유발하는, 엑손 64에서의 삽입을 포함한다. 선택적으로, 삽입은 (상기 돌연변이를 포함하는 Fbn1 유전자가 서열 번호 20과 최적 정렬될 경우) 서열 번호 20에 명시된 야생형 마우스 Fbn1 암호화 서열에서의 위치 8179 및 8180에 상응하는 위치 사이에 존재하며, 그리고/또는 조기 종결 코돈은 (상기 돌연변이를 포함하는 Fbn1 유전자가 서열 번호 20과 최적 정렬될 경우) 서열 번호 20에 명시된 야생형 마우스 Fbn1 암호화 서열에서의 위치 8241에 상응하는 위치에 존재한다. 선택적으로, 돌연변이는, -1 프레임시프트를 야기하여, 엑손 64의 3' 말단에서의 조기 종결 코돈을 유발하는, 엑손 64에서의 삽입 또는 결실을 포함한다. 선택적으로, 돌연변이는 (상기 돌연변이를 포함하는 Fbn1 유전자가 서열 번호 20과 최적 정렬될 경우) 서열 번호 20에 명시된 야생형 마우스 Fbn1 암호화 서열에서의 위치 8209 및 8210에 상응하는 위치 사이에 존재하는 삽입을 포함하며, 그리고/또는 조기 종결 코돈은 (상기 돌연변이를 포함하는 Fbn1 유전자가 서열 번호 20과 최적 정렬될 경우) 서열 번호 20에 명시된 야생형 마우스 Fbn1 암호화 서열에서의 위치 8214에 상응하는 위치에 존재한다. 선택적으로, 돌연변이는 (상기 돌연변이를 포함하는 Fbn1 유전자가 서열 번호 20과 최적 정렬될 경우) 서열 번호 20에 명시된 야생형 마우스 Fbn1 암호화 서열에서의 위치 8161에 상응하는 위치에서 개시된 결실을 포함하며, 그리고/또는 조기 종결 코돈은 (상기 돌연변이를 포함하는 Fbn1 유전자가 서열 번호 20과 최적 정렬될 경우) 서열 번호 20에 명시된 야생형 마우스 Fbn1 암호화 서열에서의 위치 8214에 상응하는 위치에 존재한다. 선택적으로, C-말단 절단된 Fbn1 단백질은 양전하를 띈 C-말단을 갖는다.
일부 비-인간 포유동물에서, 증상은 하기 중 하나 이상을 포함한다: 체중 감소, 지방 제외 질량의 감소, 지방 질량의 감소, 체지방 백분율의 감소, 식품 섭취의 증가 (체중에 의하여 정규화됨), 및 척추후만증의 증가. 일부 비-인간 포유동물에서, 증상은 하기 중 하나 이상을 포함한다: 체중 감소, 지방 제외 질량의 감소, 지방 질량의 감소, 백색 지방 조직의 감소 (체중에 의하여 정규화됨), 보존된 갈색 지방 조직과 조합된 백색 지방 조직의 감소 (체중에 의하여 정규화됨), 체지방 백분율의 감소, 식품 섭취의 증가 (체중에 의하여 정규화됨), 및 척추후만증의 증가. 선택적으로, 비-인간 포유동물은 하기 중 하나 이상을 갖는다: 정상 글루코스 내성, 정상 혈청 콜레스테롤 수준, 정상 혈청 트리글리세라이드 수준, 및 정상 혈청 비-에스테르화 지방산 수준. 선택적으로, 비-인간 포유동물은 하기 중 하나 이상을 갖는다: 대사율 증가, 인슐린 민감도의 개선, 정상 글루코스 내성, 정상 혈청 콜레스테롤 수준, 정상 혈청 트리글리세라이드 수준, 및 정상 혈청 비-에스테르화 지방산 수준. 선택적으로, 증상은, 지방 질량의 감소 및 체지방 백분율의 감소 중 적어도 하나, 및 정상 글루코스 내성, 정상 혈청 콜레스테롤 수준, 정상 혈청 트리글리세라이드 수준, 및 정상 혈청 비-에스테르화 지방산 수준 중 적어도 하나를 포함한다. 선택적으로, 증상은, 지방 질량의 감소 및 체지방 백분율의 감소, 정상 글루코스 내성, 정상 혈청 콜레스테롤 수준, 정상 혈청 트리글리세라이드 수준, 및 정상 혈청 비-에스테르화 지방산 수준을 포함한다. 선택적으로, 증상은, 백색 지방 조직의 감소 (체중에 의하여 정규화됨), 및 인슐린 민감도의 개선, 정상 글루코스 내성, 정상 혈청 콜레스테롤 수준, 정상 혈청 트리글리세라이드 수준, 및 정상 혈청 비-에스테르화 지방산 수준 중 적어도 하나를 포함한다. 선택적으로, 증상은, 백색 지방 조직의 감소 (체중에 의하여 정규화됨) 및 인슐린 민감도의 개선를 포함한다.
또 다른 양태에서, 본 발명은, 하기 단계를 포함하는, 본원에 기술된 비-인간 포유동물 중 임의의 것을 제조하는 방법을 제공한다: (a) 1세포기 배아가 아닌 비-인간 포유동물 만능 세포의 게놈을 하기와 접촉시키는 단계: (i) Cas9 단백질; 및 (ⅱ) Fbn1 유전자에서의 표적 게놈 좌위 내 제1 가이드 RNA 인식 서열에 혼성화되*와 혼성화하는 제1 가이드 RNA (상기 Fbn1 유전자는 암호화된 단백질의 C-말단 절단을 유발하는 돌연변이를 포함하도록 변형됨); (b) 상기 변형된 비-인간 포유동물 만능 세포를 숙주 배아에 도입시키는 단계; 및 (c) 상기 숙주 배아를 대리모에 이식하여, 암호화된 단백질의 C-말단 절단을 유발하는 돌연변이를 포함하도록 Fbn1 유전자가 변형되는, 유전적으로 변형된 F0 세대 비-인간 포유동물을 생산하는 단계 (상기 돌연변이는 F0 세대 비-인간 포유동물 내 선천성 지방이영양증-유사 증상을 생산함). 선택적으로, 만능 세포는 배아 줄기 (ES) 세포이다.
일부 방법에서, 단계 (a)는, 비-인간 포유동물 만능 세포의 게놈을, Fbn1 유전자에서의 표적 게놈 좌위 내 제2 가이드 RNA 인식 서열에 혼성화되는 제2 가이드 RNA와 접촉시키는 것을 추가로 포함한다. 일부 방법에서, 상기 방법은 추가로, 단계 (a) 이후에, 그리고 단계 (b)에 앞서, 변형된 비-인간 포유동물 만능 세포를 선별하는 단계를 추가로 포함하며, 상기 변형된 비-인간 포유동물 만능 세포는 암호화된 단백질의 C-말단 절단을 유발하는 돌연변이에 대하여 이형 접합자를 갖는다.
일부 방법에서, 접촉 단계 (a)는 표적 게놈 좌위에서 5' 표적 서열에 혼성화되*와 혼성화하는 5' 상동성 아암 및 표적 게놈 좌위에서 3' 표적 서열에 혼성화되는 3' 상동성 아암을 포함하는 외인성 수선 주형과 게놈을 접촉시키는 것을 추가로 포함한다. 선택적으로, 외인성 수선 주형은 5' 상동성 아암 및 3' 상동성 아암에 의해 측접된 핵산 삽입물을 추가로 포함한다. 선택적으로, 핵산 삽입물은 표적 게놈 좌위에 상동성 또는 병렬상동성이다. 선택적으로, 외인성 수선 주형은 길이가 약 50개 뉴클레오타이드 내지 약 1 kb이다. 선택적으로, 외인성 수선 주형은 길이가 약 80개 뉴클레오타이드 내지 약 200개 뉴클레오타이드이다. 선택적으로, 외인성 수선 주형은 단일-가닥 올리고데옥시뉴클레오타이드이다.
또 다른 양태에서, 본 발명은, 하기 단계를 포함하는, 본원에 기술된 비-인간 포유동물 중 임의의 것을 제조하는 방법을 제공한다: (a) 비-인간 포유동물 1세포기 배아의 게놈을 하기와 접촉시키는 단계: (i) Cas9 단백질; 및 (ⅱ) Fbn1 유전자에서의 표적 게놈 좌위 내 제1 가이드 RNA 인식 서열에 혼성화되는 제1 가이드 RNA (상기 Fbn1 유전자는 암호화된 단백질의 C-말단 절단을 유발하는 돌연변이를 포함하도록 변형됨); 및 (b) 상기 변형된 비-인간 포유동물 1세포기 배아를 대리모에 이식하여, 암호화된 단백질의 C-말단 절단을 유발하는 돌연변이를 포함하도록 Fbn1 유전자가 변형되는, 유전적으로 변형된 F0 세대 비-인간 포유동물을 생산하는 단계 (상기 돌연변이는 F0 세대 비-인간 포유동물에서 선천성 지방이영양증-유사 증상을 생산함).
일부 방법에서, 단계 (a)는, 비-인간 1세포기 배아의 게놈을, Fbn1 유전자에서의 표적 게놈 좌위 내 제2 가이드 RNA 인식 서열에 혼성화되는 제2 가이드 RNA와 접촉시키는 것을 추가로 포함한다. 일부 방법에서, 상기 방법은 추가로, 단계 (a) 이후에, 그리고 단계 (b)에 앞서, 변형된 비-인간 포유동물 1세포기 배아를 선별하는 단계를 추가로 포함하며, 상기 변형된 비-인간 1세포기 배아는 암호화된 단백질의 C-말단 절단을 유발하는 돌연변이에 대하여 이형 접합자를 갖는다.
일부 방법에서, 접촉 단계 (a)는 표적 게놈 좌위에서 5' 표적 서열에 혼성화되*와 혼성화하는 5' 상동성 아암 및 표적 게놈 좌위에서 3' 표적 서열에 혼성화되는 3' 상동성 아암을 포함하는 외인성 수선 주형과 게놈을 접촉시키는 것을 추가로 포함한다. 선택적으로, 외인성 수선 주형은 5' 상동성 아암 및 3' 상동성 아암에 의해 측접된 핵산 삽입물을 추가로 포함한다. 선택적으로, 핵산 삽입물은 표적 게놈 좌위에 상동성 또는 병렬상동성이다. 선택적으로, 외인성 수선 주형은 길이가 약 50개 뉴클레오타이드 내지 약 1 kb이다. 선택적으로, 외인성 수선 주형은 길이가 약 80개 뉴클레오타이드 내지 약 200개 뉴클레오타이드이다. 선택적으로, 외인성 수선 주형은 단일-가닥 올리고데옥시뉴클레오타이드이다.
또 다른 양태에서, 본 발명은, 하기 단계를 포함하는, 선천성 지방이영양증-유사 증상을 완화시키기 위한 활성에 대하여 화합물을 스크리닝하는 방법을 제공한다: (a) 상기 기술된 임의의 피험체 비-인간 포유동물을, 상기 화합물과 접촉시키는 단계; 및 (b) 상기 화합물과 접촉되지 않은 대조군 비-인간 포유동물과 비교하여, 피험체 비-인간 포유동물의 선천성 지방이영양증-유사 증상의 존재를 결정하는 단계 (여기서 상기 대조군 비-인간 포유동물은 피험체 비-인간 포유동물과 동일한Fbn1 돌연변이를 포함하며, 이로써 선천성 지방이영양증-유사 증상을 완화시키기 위한 활성이 대조군 비-인간 포유동물과 비교하여 피험체 비-인간 포유동물에서의 선천성 지방이영양증-유사 증상의 출현 감소에 의하여 식별되도록 함).
일부 방법에서, 증상은 하기 중 하나 이상을 포함한다: 체중 감소, 지방 제외 질량의 감소, 지방 질량의 감소, 체지방 백분율의 감소, 식품 섭취의 증가 (체중에 의하여 정규화됨), 및 척추후만증의 증가. 선택적으로, 증상은 지방 질량의 감소 및 체지방 백분율의 감소 중 적어도 하나를 포함한다. 선택적으로, 증상은 지방 질량의 감소 및 체지방 백분율의 감소을 포함한다. 일부 방법에서, 증상은 하기 중 하나 이상을 포함한다: 체중 감소, 지방 제외 질량의 감소, 지방 질량의 감소, 백색 지방 조직의 감소 (체중에 의하여 정규화됨), 보존된 갈색 지방 조직과 조합된 백색 지방 조직의 감소 (체중에 의하여 정규화됨), 체지방 백분율의 감소, 식품 섭취의 증가 (체중에 의하여 정규화됨), 및 척추후만증의 증가. 선택적으로, 증상은, 백색 지방 조직의 감소 (체중에 의하여 정규화됨)을 포함한다.
도 1은, 선천성 지방이영양증을 갖는 신생아 조로 증후군과 관련된 돌연변이체 인간 FBN1 유전자 변이체, 야생형 마우스 Fbn1 유전자, 및 조작된 마우스 Fbn1 유전자 변이체 MAID 8501 내의 상응하는 영역에 대한, 뉴클레오타이드 및 아미노산 서열 및 야생형 인간 FBN1 유전자의 말단으로부터 2번째 엑손 내 영역의 뉴클레오타이드 서열 (및 암호화된 아미노산 서열)을 도시한다. "R" 및 "S" 사이의 아미노산 서열에서의 정방향 슬래쉬 기호는 퓨린 절단 부위를 나타낸다.
도 2는 조작된 마우스 Fbn1 유전자 변이체 MAID 8501에 대하여 이형접합자 또는 동종접합성인, 수컷 및 암컷 F0 창시자(founder) 마우스의 퍼센트 생존율을 도시한다.
도 3은, 선천성 지방이영양증을 갖는 신생아 조로 증후군과 관련된 돌연변이체 인간 FBN1 유전자 변이체, 야생형 마우스 Fbn1 유전자, 및 조작된 마우스 Fbn1 유전자 변이체 MAID 8502에서의 상응하는 영역에 대한, 뉴클레오타이드 및 아미노산 서열 및 야생형 인간 FBN1 유전자의 말단으로부터 2번째 엑손 내 영역의 뉴클레오타이드 서열 (및 암호화된 아미노산 서열)을 도시한다. 도 3은 또한, 생성된 예상 MAID 8502 변이체 및 MAID 8520 변이체에 대한, 마우스 Fbn1 유전자의 말단으로부터 2번째 엑손 내 영역의 암호화된 아미노산 서열을 도시한다. "R" 및 "S" 사이의 아미노산 서열에서의 정방향 슬래쉬 기호는 퓨린 절단 부위를 나타낸다.
도 4는 수컷 야생형 마우스, 및 조작된 마우스 Fbn1 유전자 변이체 MAID 8520에 대하여 이형접합자인 F1 세대 마우스에 대한, 체중에 의하여 정규화된 주간 식품 섭취량을 도시한다.
도 5는 3-개월령 수컷 F1 수컷 야생형 마우스, 및 조작된 마우스 Fbn1 유전자 변이체 MAID 8520에 대하여 이형접합자인 3-개월령 F1 수컷 마우스를 나타내었다.
도 6은 야생형 수컷 마우스 및 야생형 암컷 마우스, 그리고 조작된 마우스 Fbn1 유전자 변이체 MAID 8520에 대하여 이형접합자인 수컷 및 암컷 마우스를 포함하는, 연령별 F1 마우스의 체중을 도시한다.
도 7a 내지 7e는 척추후만증의 uCT 영상에 의해 나타낸, 야생형 암컷 마우스 (도 7a7b) 및 Fbn1 유전자 변이체 MAID 8520 이형접합자 마우스 ( 7c 내지 7e)의 골격을 나타낸다.
도 8a 내지 8c는 체중 및 지방 질량과 관련된 에세이를 도시한다. 도 8a는, 21% 지방의 사육자 식이(breeder diet) 또는 60% 고-지방 식이에서의, Fbn1 유전자 변이체 MAID 8520 이형접합자 마우스 및 야생형 마우스의 체중을 도시한다. 도 8b는, ECHOMRI™에 의하여 측정 시, 21% 지방 사육자 식이 또는 60% 고-지방 식이에서의, Fbn1 유전자 변이체 MAID 8520 이형접합자 마우스 및 야생형 마우스의 지방 질량 (지방 질량의 그램수 및 지방 질량의 백분율)을 도시한다. 도 8c는, ECHOMRI™에 의하여 측정 시, 21% 지방의 사육자 식이 또는 60% 고-지방 식이에서의, Fbn1 유전자 변이체 MAID 8520 이형접합자 마우스 및 야생형 마우스의 지방 제외 질량 (지방 제외 질량의 그램수 및 지방 제외 질량의 백분율)을 도시한다. 모든 마우스는 31주령이었다. 마우스는 스캔 시점에서 22주 동안 60% 고-지방 식이 중이었다. 별표는 한쪽 말단(unpaired) t-시험에 의한, p<0.0001을 나타낸다.
도 9a 내지 9c는 수컷 마우스에서의 글루코스 항상성에 관련된 에세이를 도시한다. 도 9a는 차우(chow) 식이 중인 수컷 야생형 마우스 및 Fbn1 유전자 변이체 MAID 8520 이형접합자 마우스에 대한 체중을 도시한다. 도 9b는 차우 식이 중인 수컷 야생형 마우스 및 Fbn1 유전자 변이체 MAID 8520 이형접합자 마우스에 대한 밤샘 공복 후의 글루코스를 도시한다. 도 9c는 차우 식이 중인 수컷 야생형 마우스 및 Fbn1 유전자 변이체 MAID 8520 이형접합자 마우스에 대한 경구 글루코스 내성을 도시한다.
도 9d 내지 9f는 암컷 마우스에서의 글루코스 항상성에 관련된 에세이를 도시한다. 도 9d는 차우 식이 중인 암컷 야생형 마우스 및 Fbn1 유전자 변이체 MAID 8520 이형접합자 마우스에 대한 체중을 도시한다. 9e는 차우 식이 중인 암컷 야생형 마우스 및 Fbn1 유전자 변이체 MAID 8520 이형접합자 마우스에 대한 밤샘 공복 후의 글루코스를 도시한다. 도 9f는 차우 식이 중인 암컷 야생형 마우스 및 Fbn1 유전자 변이체 MAID 8520 이형접합자 마우스에 대한 경구 글루코스 내성을 도시한다.
도 10a 내지 10c는 수컷 마우스에서의 순환 지질에 관련된 에세이를 도시한다. 도 10a는 차우 식이 중인 수컷 야생형 마우스 및 Fbn1 유전자 변이체 MAID 8520 이형접합자 마우스에 대한 혈청 콜레스테롤 수준을 도시한다. 10b는 차우 식이 중인 수컷 야생형 마우스 및 Fbn1 유전자 변이체 MAID 8520 이형접합자 마우스에 대한 트리글리세라이드 수준을 도시한다. 10c는 차우 식이 중인 수컷 야생형 마우스 및 Fbn1 유전자 변이체 MAID 8520 이형접합자 마우스에 대한 비-에스테르화 지방산 (NEFA-C) 수준을 도시한다.
도 10d 내지 10f는 암컷 마우스에서의 순환 지질에 관련된 에세이를 도시한다. 도 10d는 차우 식이 중인 암컷 야생형 마우스 및 Fbn1 유전자 변이체 MAID 8520 이형접합자 마우스에 대한 혈청 콜레스테롤 수준을 도시한다. 도 10e는 차우 식이 중인 암컷 야생형 마우스 및 Fbn1 유전자 변이체 MAID 8520 이형접합자 마우스에 대한 트리글리세라이드 수준을 도시한다. 10f는 차우 식이 중인 암컷 야생형 마우스 및 Fbn1 유전자 변이체 MAID 8520 이형접합자 마우스에 대한 비-에스테르화 지방산 (NEFA-C) 수준을 도시한다.
도 11a 내지 11g는 체중 대비 간 말단(terminal liver) 및 지방체(fat pad) 중량을 도시한다. 도 11a는 차우 식이 중인 34주령 암컷 Fbn1 유전자 변이체 MAID 8520 이형접합자 마우스에 대한 체중을 도시한다. 도 11b 내지 11d는 각 그룹에 대한 생간, 갈색 지방 조직 (BAT) 및 내장 백색 지방 조직 (WAT) 중량을 도시한다. 도 11e 내지 11g는 체중의 백분율로서 이들의 체중을 도시한다.
도 12a 내지 12h는, 12주 동안 60% 고-지방 식이 중인 암컷 Fbn1 유전자 변이체 MAID 8520 이형접합자 마우스의 Columbia Instruments Oxymax CLAMS 시스템으로부터의 대사성 케이지(cage) 데이터를 도시한다.
도 13a 내지 13d는, 20주 동안 60% 고-지방 식이 중인 암컷 Fbn1 유전자 변이체 MAID 8520 이형접합자 마우스의 인슐린 내성 시험을 나타낸다.
정의
본 명세서에서 상호교환적으로 사용된, 용어 "단백질", "폴리펩타이드", 및 "펩타이드"는, 암호화 및 비-암호화된 아미노산 및 화학적 또는 생화학적으로 변형 또는 유도된 아미노산을 포함하여, 임의의 길이의 아미노산의 폴리머 형태를 포함한다. 상기 용어는 또한 변형된 폴리머, 예컨대 변형된 펩타이드 골격을 갖는 폴리펩타이드를 포함한다.
단백질은 "N-말단" 및 "C-말단"을 갖는 것으로 지칭된다. 용어 "N-말단"은, 유리 아민 기 (-NH2)를 가진 아미노산에 의해 종결된, 단백질 또는 폴리펩타이드의 시작부에 관한 것이다. 용어 "C-말단"은, 유리 카르복실 기 (-COOH)에 의해 종결된, 아미노산 쇄 (단백질 또는 폴리펩타이드)의 말단에 관한 것이다.
본 명세서에서 상호교환적으로 사용된, 용어 "핵산" 및 "폴리뉴클레오타이드"는, 리보뉴클레오타이드, 데옥시리보뉴클레오타이드, 또는 이의 유사체 또는 변형된 버전을 포함하여, 임의의 길이의 뉴클레오타이드의 폴리머 형태를 포함한다. 이들은 단일-, 이중-, 및 다중-가닥 DNA 또는 RNA, 게놈 DNA, cDNA, DNA-RNA 혼성체, 및 퓨린 염기, 피리미딘 염기, 또는 다른 천연, 화학적으로 변형된, 생화학적으로 변형된, 비-천연, 또는 유도된 뉴클레오타이드 염기를 포함하는 폴리머를 포함한다.
핵산은, 1개 모노뉴클레오타이드 5탄당 고리의 5' 포스페이트가 포스포디에스테르 결합을 통해 한 방향으로 이의 인접 3' 산소에 부착되는 방식으로 모노뉴클레오타이드가 반응하여 올리고뉴클레오타이드를 제조하기 때문에, "5' 말단" 및 "3' 말단"을 갖는 것으로 언급된다. 올리고뉴클레오타이드의 말단은, 이의 5' 포스페이트가 모노뉴클레오타이드 5탄당 고리의 3' 산소에 연결되지 않는 경우, "5' 말단"으로서 지칭된다. 올리고뉴클레오타이드의 말단은, 이의 3' 산소가 또 다른 모노뉴클레오타이드 5탄당 고리의 5' 포스페이트에 연결되지 않는 경우, "3' 말단"으로서 지칭된다. 핵산 서열은, 더 큰 올리고뉴클레오타이드의 내부에 있는 경우에도, 또한 5' 및 3' 말단을 갖는 것으로 언급될 수 있다. 선형 또는 원형 DNA 분자 중 어느 하나에서, 별개의 요소는 "하류" 또는 3' 요소의 "상류" 또는 5'로 지칭된다.
용어 "야생형(wild type)"은 (돌연변이체와 대조된, 이환된, 변경된, 또는 다른 등등 경우와 같은) 정상 상태 또는 상황에서 발견된, 구조 및/또는 활성을 갖는 단위체를 포함한다. 야생형 유전자 및 폴리펩타이드는 다수의 상이한 형태 (예를 들면, 대립유전자)로 종종 실재한다.
단백질 및 핵산에 관한 용어 "단리된(isolated)"은, 동일계내 정상적으로 존재할 수 있는 다른 박테리아, 바이러스 또는 세포 구성 요소와 비교하여 상대적으로 정제된 단백질 및 핵산을 포함하며, 이는 단백질 및 폴리뉴클레오타이드의 실질적으로 순수한 제제를 최대로 포함한다. 용어 "단리된"은 또한, 화학적으로 합성되고, 이에 따라 실질적으로 다른 단백질 또는 핵산에 의해 오염되지 않거나, 또는 자연적으로 동반되는 대부분의 다른 세포 구성요소 (예를 들면, 다른 세포 단백질, 폴리뉴클레오타이드, 또는 세포 구성요소)로부터 분리 또는 정제된, 단백질 및 핵산을 포함한다.
"외인성(Exogenous)" 분자 또는 서열은 그 형태로 세포에서 정상적으로 존재하지 않는 분자 또는 서열을 포함한다. 정상 존재는 세포의 특정 발달기 및 환경 조건에 관한 존재를 포함한다. 외인성 분자 또는 서열은, 예를 들어, 세포 내의 상응하는 내인성 서열의 돌연변이화된 버전, 예컨대 내인성 서열의 인간화된 버전을 포함할 수 있거나, 또는 세포 내에서 내인성 서열에 상응하나 상이한 형태인 (즉, 염색체 내가 아닌) 서열을 포함할 수 있다. 그에 반해서, 내인성(endogenous) 분자 또는 서열은 특정 환경 조건 하에서 특정 발달기의 특정 세포에서 그 형태로 정상적으로 존재하는 분자 또는 서열을 포함한다.
"코돈 최적화(Codon optimization)"는, 천연 서열의 적어도 하나의 코돈을, 일반적으로 천연 아미노산 서열을 유지하면서 숙주 세포의 유전자에서 더 자주 또는 가장 빈번하게 사용되는 코돈으로 대체시킴으로써, 특정 숙주 세포에서 발현을 증진시키기 위한 핵산 서열의 개질 공정을 포함한다. 예를 들어, Cas9 단백질을 암호화하는 폴리뉴클레오타이드는, 천연 발생의 핵산 서열과 비교하여, 박테리아 세포, 효모 세포, 인간 세포, 비-인간 세포, 포유동물 세포, 설치류 세포, 마우스 세포, 랫트 세포, 햄스터 세포, 또는 임의의 다른 숙주 세포를 포함하는 소정의 원핵 또는 진핵 세포에서 더 높은 빈도의 용법을 갖는 코돈을 치환시키도록 개질될 수 있다. 코돈 사용 표는, 예를 들어, "코돈 사용 데이터베이스"에서 용이하게 이용가능하다. 이러한 표는 수많은 방식으로 조정될 수 있다. 하기를 참고한다: Nakamura 외 (2000) Nucleic Acids Research 28:292 (이는 모든 목적을 위하여 그 전체 내용이 본원에 참조로 편입됨). 특정 숙주에서의 발현을 위하여 특정 서열의 코돈 최적화용 컴퓨터 알고리즘도 또한 이용가능하다 (참고: 예컨대, Gene Forge).
용어 "좌위(locus)"는 유전자 (또는 유의미한 서열)의 특정 위치, DNA 서열, 폴리펩타이드-암호화 서열, 또는 유기체의 게놈의 염색체상의 위치를 지칭한다. 예를 들어, "Fbn1 좌위"는 Fbn1 유전자의 특정 위치, Fbn1 DNA 서열, Fbn1-암호화 서열, 또는 그와 같은 서열이 존재하는 것에 대해 식별된 유기체의 게놈의 염색체상의 Fbn1 위치를 지칭할 수 있다. "Fbn1 좌위"는, 예를 들어, 인핸서, 프로모터, 5' 및/또는 3' UTR, 또는 이들의 조합을 포함하는, Fbn1 유전자의 조절 요소를 포함할 수 있다.
용어 "유전자"는 생성물 (예를 들면, RNA 생성물 및/또는 폴리펩타이드 생성물)에 대하여 암호화하는 염색체내 DNA 서열을 지칭하는데, 이는 비-암호화 인트론으로 저해된 암호화 영역, 및 암호화 영역에 인접하여 위치된 양쪽 5' 및 3' 말단의 서열을 포함하여, 이는 유전자가 (5' 및 3' 미번역된 서열을 포함하는) 전장 mRNA에 상응하게 된다. 용어 "유전자"는 또한 조절 서열 (예를 들면, 프로모터, 인핸서, 및 전사 인자 결합 부위), 폴리아데닐화 신호, 내부 리보솜 진입 부위, 사일런서, 격리 서열(insulating sequence), 및 매트릭스 부착 영역을 포함하는 다른 비-암호화 서열을 포함한다. 이들 서열은 (예를 들면, 10 kb 이내로) 유전자의 암호화 영역에 가까울 수 있거나 또는 먼 부위에 있을 수 있고, 이들은 유전자의 전사 및 번역의 수준 또는 속도에 영향을 미친다.
용어 "대립유전자(allele)"는 유전자의 변이체 형태를 지칭한다. 일부 유전자는, 염색체에서 동일한 위치 또는 유전적 좌위에 위치되는, 여러 가지의 상이한 형태를 갖는다. 2배체 유기체는 각각의 유전적 좌위에 2개의 대립유전자를 갖는다. 각각의 1쌍의 대립유전자는 특정 유전적 좌위의 유전자형을 나타낸다. 유전자형은 특정 좌위에 2개의 동일한 대립유전자가 있으면 동종접합자로서, 그리고 2개의 대립유전자가 상이하면 이형접합자로서 기재된다.
"프로모터(promoter)"는 특정 폴리뉴클레오타이드 서열를 위한 적절한 전사 개시 부위에서 RNA 합성을 개시하기 위해 RNA 폴리머라제 Ⅱ를 유도할 수 있는 TATA 박스를 일반적으로 포함하는 DNA의 조절 영역이다. 프로모터는 전사 개시 속도에 영향을 미치는 다른 영역을 추가적으로 포함할 수 있다. 본 명세서에서 개시된 프로모터 서열은 작동가능하게 연결된 폴리뉴클레오타이드의 전사를 조절한다.
"작동가능한 연결(operable linkage)" 또는 "작동가능하게 연결된(operably linked)" 것은, 양쪽 성분이 정상적으로 기능하고, 그 성분들 중 적어도 하나가 다른 성분들 중 적어도 하나에 작용하는 기능을 매개할 수 있는 가능성을 허용하도록 하는, 2개 이상의 성분들 (예를 들면, 프로모터 및 또 다른 서열 요소)의 병치를 포함한다. 예를 들어, 프로모터가 하나 이상의 전사 조절 인자의 존재 또는 부재에 반응하여 암호화 서열의 전사의 수준을 조절하는 경우, 프로모터는 암호화 서열에 작동가능하게 연결될 수 있다. 작동가능한 연결은 서로 인접하거나, 또는 트랜스로 작용하는 그러한 서열을 포함할 수 있다 (예를 들면, 조절 서열은 암호화 서열의 전사를 조절하기 위해 일정 거리에서 작용할 수 있다).
핵산의 "상보성(Complementarity)"은, 이의 핵염기 그룹의 배향으로 인해, 핵산의 1개 가닥내 뉴클레오타이드 서열이 대향하는 핵산 가닥의 또 다른 서열과 수소 결합을 형성한다는 것을 의미한다. DNA에서 상보성 염기는 전형적으로 T와 A, 그리고 G와 C이다. RNA에서, 이들은 전형적으로 G와 C, 그리고 A와 U이다. 상보성은 완벽하거나, 또는 실질적/충분할 수 있다. 2개 핵산 사이의 완벽한 상보성은, 2개 핵산이 이중나선의 모든 염기가 왓슨-크릭 쌍형성에 의해 상보성 염기에 결합되는 이중나선을 형성할 수 있다는 것을 의미한다. "실질적" 또는 "충분한" 상보성은 1개 가닥의 서열이 대향하는 가닥의 서열에 완전히 그리고/또는 완벽히 상보성이 아니지만, 2개 가닥 상의 염기 사이에서 충분한 결합이 혼성화 조건 (예를 들면, 염 농도 및 온도)의 세트에서 발생하여 안정한 혼성 복합체를 형성한다는 것을 의미한다. 그와 같은 조건은 혼성화되는 가닥의 Tm (용융 온도)를 예상하기 위해 서열 및 표준 수학적 계산을 이용하여, 또는 통상의 방법을 사용함으로써 Tm의 경험적 결정에 의해 예상될 수 있다. Tm은 2개 핵산 가닥 사이에 형성된 혼성화 복합체의 모집단이 50% 변성되는 (즉, 이중-가닥 핵산 분자의 모집단이 단일 가닥으로 절반 해리되는) 온도를 포함한다. Tm 미만 온도에서는 혼성화 복합체의 형성이 양호한 반면, Tm 초과 온도에서는 혼성화 복합체에서 가닥의 용융 또는 분리가 양호하다. Tm은, 다른 공지된 Tm 계산이 핵산 구조적 특징을 고려하여도, 예를 들면, Tm=81.5+0.41(% G+C)를 이용함으로써, 수성 1 M NaCl 용액 중의 공지된 G+C 함량을 갖는 핵산에 대하여 추산될 수 있다.
"혼성화 조건(Hybridization condition)"은 1개 핵산 가닥이 제2 핵산 가닥에 상보성 가닥 상호작용 및 수소 결합에 의해 결합하여 혼성화 복합체를 생산하는 누적 환경을 포함한다. 그와 같은 조건은 핵산을 함유하는 수성 또는 유기 용액의 화학적 성분 및 이의 농도 (예를 들면, 염, 킬레이트제, 포름아미드), 그리고 혼합물의 온도를 포함한다. 다른 인자, 예컨대 항온처리 시간의 길이 또는 반응 챔버 치수는 환경에 기여할 수 있다. 참고: 예컨대, Sambrook 외, Molecular Cloning, A Laboratory Manual, 2.sup.nd ed., pp. 1.90-1.91, 9.47-9.51, 1 1.47-11.57 (Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., 1989) (모든 목적을 위하여 그 전체 내용이 참고로 본원에 편입됨).
혼성화는, 염기 사이에 미스매치가 가능하여도, 2개 핵산이 상보성 서열을 함유하는 것을 요구한다. 2개 핵산 사이의 혼성화에 적절한 조건은, 핵산 길이, 상보성 정도, 및 본원에 널리 공지된 변수에 따라 달라진다. 2개 뉴클레오타이드 서열 사이의 상보성 정도가 증가할수록, 상기 서열을 갖는 핵산의 혼성체에 대한 용융 온도 (Tm)의 값도 증가한다. 짧은 연신부의 상보성 (예를 들면 35개 이하, 30개 이하, 25개 이하, 22개 이하, 20개 이하, 또는 18개 이하 뉴클레오타이드에 걸친 상보성)을 가진 핵산 사이의 혼성화를 위해, 미스매치의 위치는 중요해진다 (참고: Sambrook 외, 상기, 11.7-11.8). 전형적으로, 혼성화가능한 핵산용 길이는 적어도 약 10개 뉴클레오타이드이다. 실례가 되는 혼성화가능한 핵산용 최소 길이는 적어도 약 15개 뉴클레오타이드, 적어도 약 20개 뉴클레오타이드, 적어도 약 22개 뉴클레오타이드, 적어도 약 25개 뉴클레오타이드, 및 적어도 약 30개 뉴클레오타이드를 포함한다. 게다가, 온도 및 세정 용액 염 농도는 인자, 예컨대 상보성의 영역의 길이 및 상보성의 정도에 따라 필요한 경우 조정될 수 있다.
폴리뉴클레오타이드의 서열은 특이적으로 혼성화가 가능해지기 위해 이의 표적 핵산의 서열에 100% 상보성일 필요는 없다. 또한, 폴리뉴클레오타이드는 개재하는 또는 인접한 분절이 혼성화 사건에 관여되지 않는 정도로 하나 이상의 분절에 걸쳐 혼성화할 수 있다(예를 들면, 루프 구조 또는 헤어핀 구조). 폴리뉴클레오타이드 (예를 들면, gRNA)는 이들이 표적화되는 표적 핵산 서열 이내의 표적 영역에 대해 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 99%, 또는 100% 서열 상보성을 포함할 수 있다. 예를 들어, 20개 뉴클레오타이드 중 18개가 표적 영역에 상보적이어서 특이적으로 혼성화될, gRNA는 90% 상보성을 나타낼 것이다. 이러한 예시에서, 잔존하는 비상보성 뉴클레오타이드는 상보성 뉴클레오타이드와 함께 클러스터링 또는 산재될 수 있고, 서로에 대해 또는 상보성 뉴클레오타이드에 인접할 필요는 없다.
핵산 내 핵산 서열의 특정 연신부들 간의 상보성 백분율은 하기를 이용하여 일상적으로 결정될 수 있다: 당해 분야에서 공지된 BLAST 프로그램 (기본 국부 정렬 검색 도구) 및 PowerBLAST 프로그램 (Altschul 외 (1990) J. Mol . Biol. 215:403-410; Zhang and Madden (1997) Genome Res. 7:649-656), 또는 갭 프로그램 (Wisconsin Sequence Analysis Package, Version 8 for Unix, Genetics Computer Group, University Research Park, Madison Wis.) [Smith 및 Waterman의 알고리즘 (Adv. Appl. Math., 1981, 2, 482-489)을 사용하는 디폴트 설정을 사용함].
본 명세서에서 제공된 방법 및 조성물은 여러 가지의 상이한 성분을 이용한다. 일부 성분이 활성 변이체 및 단편을 가질 수 있다는 것이 설명 전반에 걸쳐 인식된다. 그와 같은 성분은, 예를 들어, Cas9 단백질, CRISPR RNA, tracrRNA, 및 가이드 RNA를 포함한다. 각각의 이들 성분에 대한 생물학적 활성은 본 명세서에서 다른 곳에 기재된다.
2개 폴리뉴클레오타이드 또는 폴리펩타이드 서열의 문맥에서 "서열 동일성(Sequence identity)" 또는 "동일성(identity)"은, 명시된 비교 윈도우에 걸쳐 최대 관련성으로 정렬된 경우, 동일한 2개 서열에서 잔기를 지칭한다. 서열 동일성의 백분율이 단백질에 관련하여 사용되는 경우, 동일하지 않은 잔기 위치는 보존적 아미노산 치환에 의해 종종 상이한 것으로 인식되는데, 여기에서 아미노산 잔기는 유사한 화학적 특성 (예를 들면, 전하 또는 소수성)을 갖는 다른 아미노산 잔기로 치환되고 따라서 분자의 기능적 특성이 변화하지 않는다. 서열이 보존적 치환으로 상이한 경우, 퍼센트 서열 동일성은 치환의 보존적 성질을 보정하기 위해 상향 조정될 수 있다. 이러한 보존적 치환에 의해 상이한 서열은, "서열 유사성(sequence similarity)" 또는 "유사성(similarity)"으로 일컬어진다. 이러한 조절을 위한 수단은 당해 분야의 숙련가에게 잘 공지되어 있다. 전형적으로 이는 완전한 미스매치보다는 보존적인 치환을 일부로서 스코어링함으로서 서열 동일성의 퍼센트를 증가시키는 것을 포함한다. 따라서, 예를 들어, 동일한 아미노산에 1의 스코어가 주어지고 비-보존적 치환에 0의 스코어가 주어지는 경우, 보존적 치환은 0과 1 사이의 스코어가 주어진다. 보존적 치환의 평점은, 예를 들면, 프로그램 PC/GENE (Intelligenetics, Mountain View, California)에서 시행된 바와 같이, 계산된다.
"서열 동일성의 백분율(Percentage of sequence identity)"은 비교 윈도우에 대한 2개의 최적 정렬된 서열 비교에 의해 결정된 값을 포함하고, 여기서 비교 윈도우의 폴리뉴클레오타이드 서열의 일부는 2개 서열의 최적의 정렬을 위하여 (부가 또는 결실을 포함하지 않는) 참조 서열과 비교하여 부가 또는 결실 (즉, 갭)을 포함할 수 있다. 백분율은, 양쪽 서열에서 동일한 핵산 염기 또는 아미노산 잔기가 발생하는 위치의 수를 결정하여 일치되는 위치의 수를 계산하고, 상기 일치된 위치의 수를 비교 윈도우에서의 위치의 총 수로 나누고, 그리고 그 결과에 100을 곱하여 서열 동일성의 백분율을 산출함으로써 계산된다.
달리 언급되지 않는 한, 서열 동일성/유사성 값은 하기 파라미터를 사용하는 갭 버전 10을 사용하여 수득된 값을 포함한다: 갭 중량 50 및 길이 중량 3, 및 nwsgapdna.cmp 평점 매트릭스를 사용하는 뉴클레오타이드 서열에 대한 % 동일성 및 % 유사성; 갭 중량 8 및 길이 중량 2, 및 BLOSUM62 평점 매트릭스를 사용하는 아미노산 서열에 대한 % 동일성 및 % 유사성; 또는 이의 임의의 동등한 프로그램. "동등한 프로그램(Equivalent program)"은, 문제의 임의의 2개 서열에 대하여, 동일한 뉴클레오타이드 또는 아미노산 잔기 매치를 갖는 정렬, 그리고 갭 버전 10에 의해 생성된 상응하는 정렬에 비교된 경우 동일한 퍼센트 서열 동일성을 생성하는 임의의 서열 비교 프로그램을 포함한다.
공유된 에피토프를 지칭하기 위해 본 명세서에서 사용된 용어 "실질적인 동일성(substantial identity)"은, 상응하는 위치에 동일한 잔기를 함유하는 서열을 포함한다. 예를 들어, 2개 서열은 이의 상응하는 잔기의 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상이 잔기의 관련된 연신부에 걸쳐 동일한 경우, 실질적으로 동일한 것으로 간주될 수 있다. 관련된 연신부는, 예를 들어, 완전한 서열일 수 있거나, 적어도 5, 10, 15개 이상의 잔기일 수 있다.
용어 "보존적 아미노산 치환(conservative amino acid substitution)"은, 서열에서 정상적으로 존재하는 아미노산의, 유사한 크기, 전하, 또는 극성의 상이한 아미노산으로의 치환을 지칭한다. 보존적 치환의 예는 비-극성 (소수성) 잔기, 예컨대 이소류신, 발린, 또는 류신의, 또 다른 비-극성 잔기로의 치환을 포함한다. 마찬가지로, 보존적 치환의 예는 1개 극성 (친수성) 잔기를, 또 다른 것, 예컨대 아르기닌과 라이신, 글루타민과 아스파라긴, 또는 글라이신과 세린으로 치환한 것을 포함한다. 추가적으로, 염기성 잔기, 예컨대 라이신, 아르기닌, 또는 히스티딘의 또 다른 것으로의 치환, 또는 1개 산성 잔기, 예컨대 아스파르트산 또는 글루탐산의 또 다른 산성 잔기로의 치환은 보존적 치환의 추가적인 예이다. 비-보존적 치환의 예는 비-극성 (소수성) 아미노산 잔기, 예컨대 이소류신, 발린, 류신, 알라닌, 또는 메티오닌의 극성 (친수성) 잔기 예컨대 시스테인, 글루타민, 글루탐산 또는 라이신으로의 치환, 및/또는 극성 잔기의 비-극성 잔기로의 치환을 포함한다. 전형적인 아미노산 범주화는 아래 요약된다.
Figure pct00001

"상동(homologous)" 서열 (예를 들면, 핵산 서열)은, 예를 들어, 공지된 참조 서열에 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일한 정도로, 공지된 참조 서열에 동일 또는 실질적으로 유사한 서열을 포함한다. 상동 서열은, 예를 들어, 병렬상동성 서열 및 직렬상동성 서열을 포함할 수 있다. 상동 유전자는, 예를 들어, 공통 선조 DNA 서열로부터, 종 분화(speciation) 사건 (병렬상동성 유전자) 또는 유전적 중복 사건 (직렬상동성 유전자) 중 어느 것을 통해 전형적으로 전승된다. "병렬상동성(Orthologous)" 유전자는 공통 선조 유전자로부터의 종 분화에 의해 진화했던 상이한 종들의 유전자를 포함한다. 병렬상동체는 통상 진화 과정에서 동일한 기능을 유지한다. "직렬상동성(Paralogous)" 유전자는 게놈 이내의 중복에 의해 관련된 유전자를 포함한다. 직렬상동체는 진화의 과정에서 신규한 기능을 발달시킬 수 있다.
용어 "시험관내 ( in vitro )"는 인공 환경 (예를 들면, 시험 튜브) 내에 발생하는 공정 또는 반응, 그리고 인공 환경을 포함한다. 용어 "생체내 ( in vivo )"는 천연 환경 내에 발생하는 공정 또는 반응, 그리고 천연 환경 (예를 들면, 세포 또는 유기체 또는 몸체)를 포함한다. 용어 "생체외 ( ex vivo )"는 개체의 몸체로부터 제거된 세포, 그리고 상기 세포 내 발생하는 공정 또는 반응을 포함한다.
하나 이상의 인용된 요소를 "포함하는(comprising)" 또는 "포함하는 (including)" 조성물 또는 방법은, 구체적으로 인용되지 않은 다른 요소를 포함할 수 있다. 예를 들어, 단백질을 "포함하는" 또는 "포괄하는" 조성물은, 단백질을 단독으로 또는 다른 성분과 병용하여 함유할 수 있다.
값의 범위의 지정은 그 범위 이내 또는 상기를 한정하는 모든 정수, 그리고 그 범위 이내의 정수에 의해 정의된 모든 하위범위를 포함한다.
문맥으로부터 달리 분명하지 않는 한, 용어 "약(about)"은 언급된 값의 측정의 표준 오차 한계 (예를 들면, SEM) 이내 값을 포괄한다.
관사 "a", "an", 및 "the"의 단수 형태는 문맥이 달리 명확히 나타내지 않는 한 복수에 대한 언급도 포함한다. 예를 들어, 용어 "하나의 Cas9 단백질" 또는 "적어도 하나의 Cas9 단백질"은, 이의 혼합물을 포함하는 복수의 Cas9 단백질을 포함할 수 있다.
통계적으로 유의미한 것은 p ≤0.05를 의미한다.
I. 개관
본 발명은 선천성 지방이영양증을 갖는 신생아 조로 증후군 (neonatal progeroid syndrome with congenital lipodystrophy, NPSCL)을 모델링하기 위한, Fbn1 유전자 내 돌연변이를 포함하는 비-인간 동물을 제공한다. 또한 상기 비-인간 동물 모델을 제조하는 방법이 제공된다. 비-인간 동물 모델은, NPSCL을 억제 또는 감소시키거나, 또는 NPSCL-유사 증상을 완화시키는 활성에 대하여 화합물을 스크리닝하거나, 또는 NPSCL을 촉진하거나 악화시키는데 잠재적으로 유해한 활성에 대하여 화합물을 스크리닝하기 위하여, 뿐만 아니라 NPSCL의 기전 및 잠재적 신규 치료 및 진단 표적에 대한 통찰력을 제공하기 위하여 사용될 수 있다.
Ⅱ. 선천성 지방이영양증을 갖는 신생아 조로 증후군의 비-인간 동물 모델
Fbn1 유전자 내 돌연변이를 포함하는 비-인간 동물 (예컨대, 비-인간 포유동물, 예컨대 랫트 또는 마우스)이 본원에 제공된다. 상기 비-인간 동물은 선천성 지방이영양증 (NPSCL)을 갖는 신생아 조로 증후군을 모델링하고, 그리고 NPSCL-유사 증상 (예컨대, 선천성 지방이영양증-유사 증상)을 나타낸다.
A. 선천성 지방이영양증을 갖는 신생아 조로 증후군( NPSCL ).
신생아 조로 증후군 (NPS)은, 안면 및 사지에 우선적으로 영향을 미치는 선천성, 부분적 지방이영양증을 특징으로 한다. O'Neill 외 (2007) Am . J. Med . Gen . A. 143A:1421-1430 (이는 모든 목적을 위하여 그 전체내용이 참고로 본원에 편입됨). 이는 또한 선천성 지방이영양증을 갖는 신생아 조로 증후군(NPSCL), 마르판-조로 증후군 (marfanoid-progeroid syndrome), 또는 마르판-조로-지방이영양증 (marfanoid-progeroid-lipodystrophy, MPL) 증후군으로서 지칭된다. 이는, 안면 및 사지에 우선적으로 영향을 미치는, 피하 지방 조직의 감소로 인한 선천성의 극도의 여윔을 특징으로 한다. 참고: Hou 외 (2009) Pediatrics and Neonatology 50:102-109 및 O’Neill 외 (2007) Am . J. Med . Gen . A. 143A:1421-1430 (이는 모든 목적을 위하여 그 전체내용이 참고로 본원에 편입됨). 표현형은 전형적으로 출생시, 그리고 출생 이전에도, 피하 지방의 결핍으로 인한 얇은 피부 및 두드러진 맥관구조를 갖는 자궁내 성장 지체로서 명백히 나타난다. O'Neill 외 (2007). 환자는, 전체 연령에서, 연령에 대해 정상 미만인 몇몇 표준 편차를 갖는 체질량 지수 (BMI)를 나타낸다. O'Neill 외 (2007). NPS 환자가 안면 이형성 특성(facial dysmorphic features) 및 감소된 피하 지방으로 인하여 조로를 나타내기는 하지만, 이들은 진정 조로증의 일반적 특성, 예컨대 백내장(cataracts), 조기 모발 회색화 또는 인슐린 저항성은 갖지 않는다. O'Neill 외 (2007). 환자는 정상 공복 혈장 글루코스 및 인슐린 수준을 가지며, 이는 이들이 정상 인슐린 민감도 및 글루코스 조작기전을 갖는다는 것을 시사한다. O'Neill 외 (2007).
NPSCL을 갖는 환자의 기본적 특징은 하기를 포함한다: (1) 선천성 지방이영양증; (2) 중량 증가에 비례하지 않는 가속된 선형 성장에 의한 조산; 및 (3) 개별 안면 특징부를 갖는 조로성 외관. 참고: 예컨대, Takenouchi 외 (2013) Am . J. Med . Genet . Part A 161A:3057-3062 (이는 모든 목적을 위하여 그 전체내용이 참고로 본원에 편입됨). 문헌[Jacquinet 외]은, 자궁 내 성장 지체 및/또는 조산, 출생 시의 노화성 안면 외관 및 감소된 피하 지방, 및 진행성 마르판 특성을 포함하는 마르판-조로 표현형을 보고한다. 대동맥 기부 확장(Aortic root dilation), 수정체 전위(ectopic lentis) 및 경막 확장(dural ectasia)은 시간에 따라 나타날 수 있다. 발달 지표 및 지능은 정상인 것으로 나타난다. Jacquinet 외 (2014) Eur . J. Med . Genet . 57(5):203-234 (이는 모든 목적을 위하여 그 전체내용이 참고로 본원에 편입됨).
다수의 지방이영양성 증후군과 달리, 인간 NPSCL 환자에서 관찰되는 표현형은 내장 지방 조직이 없음에도 불구하고 글루코스 항상성 및 순환 지질 면에서 정상적인 대사 프로파일이다. 인간 NPSCL 환자는 백색 지방 조직의 손실에도 불구하고 정상적인 글루코스 항상성을 갖는다.
본원에 개시된 비-인간 동물 모델은 NPSCL-유사 증상 (예컨대, 선천성 지방이영양증-유사 증상)을 나타낸다. 상기 증상은, 예를 들어, 하기 중 하나 이상을 포함할 수 있다: 체중 감소, 지방 제외 질량의 감소, 지방 질량의 감소, 백색 지방 조직의 감소 (예컨대, 체중에 의하여 정규화됨), 갈색 지방 조직 보존과 병용된 백색 지방 조직의 감소 (예컨대, 체중에 의하여 정규화됨), 체지방 백분율의 감소, 식품 섭취의 증가 (체중에 의하여 정규화됨), 및 척추후만증의 증가. 상기 증상은, 예를 들어, 하기 중 하나 이상을 포함할 수 있다: 체중 감소, 지방 제외 질량의 감소, 지방 질량의 감소, 체지방 백분율의 감소, 식품 섭취의 증가 (체중에 의하여 정규화됨), 및 척추후만증의 증가. 상기 증상은 하기 중 하나 이상과 병용될 수 있다: 대사율 증가, 인슐린 민감도의 개선, 정상 글루코스 내성, 정상 혈청 콜레스테롤 수준, 정상 혈청 트리글리세라이드 수준, 및 정상 혈청 비-에스테르화 지방산 수준. 대안적으로, 상기 증상은 하기 중 하나 이상과 병용될 수 있다: 정상 글루코스 내성, 정상 혈청 콜레스테롤 수준, 정상 혈청 트리글리세라이드 수준, 및 정상 혈청 비-에스테르화 지방산 수준. 예를 들어, 증상은, 지방 질량의 감소 및 체지방 백분율의 감소 중 적어도 하나, 및 정상 글루코스 내성, 정상 혈청 콜레스테롤 수준, 정상 혈청 트리글리세라이드 수준, 및 정상 혈청 비-에스테르화 지방산 수준 중 적어도 하나를 포함할 수 있다. 대안적으로, 증상은, 지방 질량의 감소 및 체지방 백분율의 감소, 정상 글루코스 내성, 정상 혈청 콜레스테롤 수준, 정상 혈청 트리글리세라이드 수준, 및 정상 혈청 비-에스테르화 지방산 수준을 포함할 수 있다. 다른 가능한 표현형은 하기 중 하나 이상을 포함한다: 감소된 간 중량, 감소된 갈색 지방 조직 (BAT) 중량, 감소된 내장 백색 지방 조직 (WAT) 중량, 감소된 WAT 중량 (체중으로 정규화됨), 상승된 대사율 (체중으로 정규화됨), 증가된 에너지 소비량, 개선된 글루코스 내성, 및 인슐린 민감도의 개선 (고-지방 식이 중). 예를 들어, 증상은, 개선된 대사율, 인슐린 민감도의 개선, 정상 글루코스 내성, 정상 혈청 콜레스테롤 수준, 정상 혈청 트리글리세라이드 수준, 및 정상 혈청 비-에스테르화 지방산 수준 중 적어도 하나와 병용된, 체중에 의하여 정규화된 (예컨대, 보존된 갈색 지방 조직과 병용된) 백색 지방 조직의 감소를 포함할 수 있다. 예를 들어, 증상은, 인슐린 민감도의 개선와 병용된, 체중에 의하여 정규화된 (예컨대, 보존된 갈색 지방 조직과 병용된) 백색 지방 조직의 감소를 포함할 수 있다.
감소 또는 증가는 통계적으로 유의미할 수 있다. 예를 들어, 감소 또는 증가는, 대조군 야생형 비-인간 동물과 비교하여, 적어도 약 1%, 적어도 약 2%, 적어도 약 3%, 적어도 약 4%, 적어도 약 5%, 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 30%, 적어도 약 40%, 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 또는 100% 만큼일 수 있다.
B. Fbn1 돌연변이
NPSCL은 인간에서의 FBN1 유전자 내 돌연변이와 관련된다. 참고: 예컨대, Takenouchi 외 (2013) Am. J. Med . Genet. Part A 161A:3057-3062; Graul-Neumann 외 (2010) Am. J. Med . Genet. A. 152A(11):2749-2755; Goldblatt 외 (2011) Am. J. Med . Genet . A 155A(4):717-720; Horn 및 Robinson (2011) Am . J. Med . Genet . A. 155A(4);721-724; Jacquinet 외 (2014) Eur . J. Med . Genet . 57(5):203-234; 및 Romere 외 (2016) Cell 165(3):566-579 (이는 모든 목적을 위하여 그 전체내용이 참고로 본원에 편입됨). FBN1은 탄성 및 비-탄성 세포외 기질 내 미세원섬유의 주요 성분인 구조적 당단백질 피브릴린-1을 암호화하는, 65개 암호화 엑손 (총 66개 엑손)을 갖는 230 kb 유전자이다. 전구피브릴린-1은, 프로테아제 퓨린에 의하여 C-말단에서 절단된 2871-아미노산 길이의 전구단백질로서 번역된다. 이는, 성숙 피브릴린-1 (세포외 기질 성분) 외에, 140-아미노산 길이의 C-말단 절단 생성물 (즉, 아스프로신)을 생성한다. 예시적 인간 피브릴린-1 서열은 UniProt 수탁 번호 P35555로 할당된다.
FBN1 유전자 내에서 3000개 초과의 돌연변이가 임상적으로 식별되었다. 참고: 예컨대, Wang 외 (2016) Forensic Science International 261:e1-e4 및 www.umd/be/FBN1/ (이는 모든 목적을 위하여 그 전체내용이 참고로 본원에 편입됨). 이러한 돌연변이는, 유형 I 피브릴린병증 (type I fibrillinopathies), 마르판 증후군, MASS 증후군, 단리된 수정체전위 증후군, 흉부 대동맥류 (thoracic aortic aneurysms), 바일-마르케사니 증후군 (Weill-Marchesani syndrome), 겔레오피직 및 말단왜소 형성이상 (geleophysic and acromicric dysplasia), 경직성 피부 증후군 (stiff skin syndrome), 및 선천성 지방이영양증을 갖는 신생아 조로 증후군을 포함하는 다양한 병태와 연관되어 있다. 참고: 예컨대, Davis 및 Summers (2012) Mol. Genet . Metab . 107(4):635-647 (이는 모든 목적을 위하여 그 전체내용이 참고로 본원에 편입됨). 이들 중 가장 통상적인 것들은 눈, 심혈관, 및 골격 징후를 포함하는 상염색체 우성 마르판 증후군이다. 참고: Loeys 외 (2010) J. Med . Genet . 47(7):476-485 및 Jacquinet 외 (2014) Eur . J. Med . Genet . 57(5):203-234 (이들의 각각은 모든 목적을 위하여 그 전체가 참고로 본 명세서에서 편입됨). 전형적인 마르판 증후군에서의 돌연변이는, 제한된 유전자형-표현형 연관관계로 FBN1 유전자 전반에 산재하여 있다. 참고: 예컨대, Faivre 외 (2007) Am . J. Hum . Genet . 81(3):454-466, 및 Jacquinet 외 (2014) Eur . J. Med . Genet . 57(5):203-234 (이들의 각각은 모든 목적을 위하여 그 전체가 참고로 본 명세서에서 편입됨).
본원에 개시된 NPSCL의 비-인간 동물 모델은, 비-인간 동물 내 NPSCL-유사 증상 (예컨대, 선천성 지방이영양증-유사 증상)을 생성하는, Fbn1 유전자 내 돌연변이를 포함한다. 돌연변이는 비-인간 동물에서의 내인성 Fbn1 유전자 내에 존재할 수 있다. 대안적으로, 비-인간 동물은, 내인성 Fbn1 유전자의 전체 또는 일부가 결실되어, 그리고 인간 FBN1 유전자 유래, 또는 다른 포유동물, 예컨대 비-인간 영장류 유래의 다른 병렬상동성 서열로 대체되는 인간화 Fbn1 좌위를 포함할 수 있다. 병렬상동성 서열에 의한 대체는, 병렬상동성 서열 유래의 돌연변이를 도입하기 위하여, 특정 엑손 또는 인트론 내 발생할 수 있다. 대체는 또한, 모든 엑손에서, 또는 모든 엑손 및 인트론에서, 또는 모든 엑손, 인트론 및 조절 서열을 포함하는 측접 서열에서 발생할 수 있다. 병렬상동성 서열에 의한 대체의 정도에 따라서, 조절 서열, 예컨대 프로모터는 내인성일 수 있거나, 또는 병렬상동성 서열을 대체함에 으로서 공급될 수 있다.
바람직하게는, 비-인간 동물은 돌연변이에 대하여 이형 접합자를 갖는다. 바람직하게는, 돌연변이는 암호화된 단백질의 C-말단 절단을 유발한다. 예를 들어, 돌연변이는 프레임시프트를 야기할 수 있다. 프레임시프트 돌연변이는, 참조 서열과 비교하여 번역이 또 다른 프레임으로 변화되는, 번역 개시 코돈 (개시 코돈) 및 종결 코돈 (정지 코돈) 사이의 서열 변화이다. 예를 들어, 판독 프레임은, 5' 방향으로 하나의 뉴클레오타이드가 이동하거나 (-1 프레임시프트), 또는 3' 방향으로 하나의 뉴클레오타이드가 이동할 수 있다 (+1 프레임시프트). 프레임시프트 돌연변이를 갖는 유전자에 의하여 암호화된 단백질은, N-말단부터 프레임시프트 돌연변이까지는 야생형 유전자에 의하여 암호화된 단백질과 동일하나, 상기 지점 초과에서는 상이하다. 상기 프레임시프트는 조기 종결 코돈을 유발할 수 있다. 상기 미숙 코돈은, 예를 들어, 말단으로부터 2번째 엑손, 또는 최종 엑손 내 존재할 수 있다. 선택적으로, 조기 종결 코돈은, 최종 엑손-엑손 접합의 상류에 있는 약 100개 미만의 염기쌍이거나, 또는 상기의 상류에 있는 약 55개 미만의 염기쌍이다. 예를 들어, 조기 종결 코돈은, 말단으로부터 2번째 암호화 엑손 내 최종 엑손-엑손 접합의 상류에 있는 약 100개 미만의 염기쌍, 90개 미만의 염기쌍, 80개 미만의 염기쌍, 70개 미만의 염기쌍, 60개 미만의 염기쌍, 55개 미만의 염기쌍, 50개 미만의 염기쌍, 40개 미만의 염기쌍, 30개 미만의 염기쌍, 25개 미만의 염기쌍, 또는 20개 미만의 염기쌍일 수 있다. 대안적으로, 조기 종결 코돈은, (예컨대, 말단으로부터 2번째 암호화 엑손의 건너뜀을 유발하는 스플라이스 부위 돌연변이의 결과로서) 최종 암호화 엑손 내에 존재할 수 있다. 선택적으로, 조기 종결 코돈은 최종 암호화 엑손 (예컨대, 마우스 Fbn1의 엑손 65) 내에 있거나, 또는 말단으로부터 2번째 엑손 (예컨대, 마우스 Fbn1의 엑손 64) 내에서 존재하며, 여기서 조기 종결 코돈이 말단으로부터 2번째 엑손 내에 존재할 경우, 이는 최종 엑손-엑손 접합의 상류에 있는 약 55개 미만의 염기쌍 (예컨대, 약 20개 미만의 염기쌍, 예컨대 19개 염기쌍)이다. 선택적으로, 미숙 코돈이 최종 암호화 엑손 내에 존재할 경우, 이는 최종 엑손-엑손 접합의 하류에 있는 약 100개 미만의 염기쌍, 90개 미만의 염기쌍, 80개 미만의 염기쌍, 70개 미만의 염기쌍, 60개 미만의 염기쌍, 55개 미만의 염기쌍, 50개 미만의 염기쌍, 40개 미만의 염기쌍, 30개 미만의 염기쌍, 25개 미만의 염기쌍, 20개 미만의 염기쌍, 15개 미만의 염기쌍, 또는 10개 미만의 염기쌍 (예컨대, 9개 염기쌍)이다. 선택적으로, 조기 종결 코돈은, (상기 돌연변이를 포함하는 Fbn1 유전자가 서열 번호 20과 최적 정렬될 경우) 서열 번호 20에서 명시된 야생형 마우스 Fbn1 암호화 서열 내의 위치 8150 및 8300, 8160 및 8290, 8170 및 8280, 8180 및 8270, 8190 및 8260, 8200 및 8250, 8210 및 8300, 8210 및 8290, 8210 및 8280, 8210 및 8270, 8210 및 8260, 8210 및 8250, 8200 및 8300, 8200 및 8290, 8200 및 8280, 8200 및 8270, 8200 및 8260, 8200 및 8250, 8150 및 8245, 8160 및 8245, 8170 및 8245, 8180 및 8245, 8190 및 8245, 8200 및 8245, 8150 및 8250, 8160 및 8250, 8170 및 8250, 8180 및 8250, 8190 및 8250, 8200 및 8250, 또는 8210 및 8245에 상응하는 위치 사이에 존재한다 .
조기 종결 코돈은 양전하를 띈 C-말단을 갖는 절단된 단백질을 유발할 수 있다. 20개 통상적인 아미노산 중에서, 5개는 하전될 수 있는 측쇄를 갖는다. pH=7에서, 2개 [아스파르트산 (Asp, D), 및 글루탐산 (Glu, E)]는 음전하를 띄고, 그리고 3개 [라이신 (Lys, K), 아르기닌 (Arg, R), 및 히스티딘 (His, H)]는 양전하를 띈다. 일부 경우에서, 조기 종결 코돈은 극도로 높은 양전하를 띈 C-말단 [예컨대, ETEKHKRN (서열 번호 34)]을 갖는 절단된 단백질을 유발할 수 있다. 대안적으로, 조기 종결 코돈은 보다 낮은 양전하를 띈 C-말단 [예컨대, ISLRQKPM (서열 번호 35)]을 갖는 절단된 단백질을 유발할 수 있다.
선택적으로, 돌연변이는 퓨린 계열의 전구단백질 전환효소(proprotein convertase)에 대한 염기성 아미노산 인식 서열 [RGRKRR (서열 번호 36)]을 파괴한다. 예를 들어, 돌연변이는 퓨린 인식 서열의 상류에서 절단된 단백질을 유발할 수 있거나, 퓨린 인식 서열을 돌연변이화하거나, 또는 퓨린 인식 서열의 상류에서 프레임시프트를 유발할 수 있다. 선택적으로, 돌연변이는 퓨린 계열의 전구단백질 전환효소에 대한 100개 염기쌍의 염기성 아미노산 인식 서열 내에 존재한다. 예를 들어, 돌연변이는 퓨린 인식 서열의 약 90개 염기쌍, 80개 염기쌍, 70개 염기쌍, 60개 염기쌍, 50개 염기쌍, 40개 염기쌍, 또는 30개 염기쌍 내에서 존재할 수 있다. 예시로서, 상기 돌연변이는 말단으로부터 2번째 엑손 또는 최종 엑손에서 프레임시프트를 유발하는, 뉴클레오타이드의 삽입 또는 결실을 포함할 수 있다. 또 다른 예시로서, 상기 돌연변이는 말단으로부터 2번째 엑손의 건너뜀을 유발하는 공여체 스플라이스 부위 돌연변이, 및 최종 엑손 내 조기 종결 코돈을 유발하는 후속 프레임시프트를 포함할 수 있다.
일부 비-인간 동물에서, 돌연변이는 전구피브릴린-1의 C-말단 절단 생성물 (즉, 아스프로신)의 파괴 또는 제거 (예컨대, 이형접합자 제거)을 유발한다. C-말단 절단 생성물의 파괴 또는 제거는, 예를 들어, 퓨린 계열의 전구단백질 전환효소에 대한 염기성 아미노산 인식 서열의 파괴으로부터 유발될 수 있다. 대안적으로, C-말단 절단 생성물의 파괴 또는 제거는, 예를 들어, C-말단 절단 생성물이 절단되도록 조기 종결 코돈을 생성하는 돌연변이로부터 유발될 수 있다. 아스프로신의 파괴는, 아스프로신의 감소된 생산 또는 감소된 활성을 갖는 아스프로신의 생산을 유발한다. 일부 비-인간 동물에서, Fbn1 유전자는 말단으로부터 2번째 엑손에서의 돌연변이를 포함한다. 예를 들어, Fbn1 유전자의 말단으로부터 2번째 엑손은, (상기 말단으로부터 2번째 엑손이 서열 번호 26, 27, 또는 28과 최적 정렬될 경우) 야생형 마우스 Fbn1 (서열 번호 25) 유래의 말단으로부터 2번째 엑손과 비교하여, 서열 번호 26, 27, 또는 28 (각각 MAID 대립유전자 8501, 8520, 및 8502 유래의, 말단으로부터 2번째 엑손)에서의 돌연변이에 상응하는 돌연변이를 포함할 수 있다 .
일부 비-인간 동물에서, 돌연변이화된 Fbn1 유전자에 의하여 암호화된 Fbn1 단백질은 (상기 암호화된 단백질이 서열 번호 30과 최적 정렬될 경우) 서열 번호 30에 명시된 야생형 마우스 Fbn1 단백질 내 아미노산 2710 내지 2780, 아미노산 2720 내지 2770, 아미노산 2730 내지 2760, 또는 아미노산 2737 내지 2755 위치에 상응하는 위치에서 절단된다. 예를 들어, 암호화된 단백질은 (상기 암호화된 단백질이 서열 번호 30과 최적 정렬될 경우) 서열 번호 30에 명시된 야생형 마우스 Fbn1 단백질 내 아미노산 2737, 아미노산 2738, 또는 아미노산 2755와 상응하는 위치에 존재하도록 절단될 수 있다. 마찬가지로, 암호화된 단백질은, 최종 아미노산이 본원에 기술된 MAID 8501, 8502, 및 8520 Fbn1 변이체에 의하여 암호화된, 절단된 Fbn1 단백질의 최종 아미노산에 상응하는 위치에 존재하도록 절단될 수 있다.
또 다른 예시로서, 암호화된 단백질은 서열 번호 8, 42, 또는 43에 명시된 서열로 이루어진 C-말단을 가질 수 있거나, 또는 암호화된 단백질은 본원에 기술된 MAID 8501, 8502, 및 8520 Fbn1 변이체에 의하여 암호화된 단백질의 C-말단에 상응하는 C-말단을 가질 수 있다. 예를 들어, 암호화된 단백질은 (상기 암호화된 단백질이 서열 번호 30과 최적 정렬될 경우) 최종 아미노산이 서열 번호 30에 명시된 야생형 마우스 Fbn1 내 아미노산 2737에 상응하는 위치에 존재하도록 절단될 수 있고, 그리고 상기 암호화된 단백질의 C-말단은 서열 번호 43에 명시된 서열로 이루어진다. 또 다른 예시로서, 암호화된 단백질은 (상기 암호화된 단백질이 서열 번호 30과 최적 정렬될 경우) 최종 아미노산이 서열 번호 30에 명시된 야생형 마우스 Fbn1 내 아미노산 2738에 상응하는 위치에 존재하도록 절단될 수 있으며, 그리고 상기 암호화된 단백질의 C-말단은 서열 번호 8에 명시된 서열로 이루어진다. 또 다른 예시로서, 암호화된 단백질은 (상기 암호화된 단백질이 서열 번호 30과 최적 정렬될 경우) 최종 아미노산이 서열 번호 30에 명시된 야생형 마우스 Fbn1 내 아미노산 2755에 상응하는 위치에 존재하도록 절단될 수 있으며, 그리고 상기 암호화된 단백질의 C-말단은 서열 번호 42에 명시된 서열로 이루어진다. 예시적 절단된 Fbn1 단백질은 서열 번호 31, 32 및 33를 포함한다.
Fbn1 유전자는, Fbn1 단백질, 예컨대 Swiss-Prot 및 GenBank 데이터베이스에 기술된 것들을 암호화하는 임의의 공지된 유전자를 지칭하는데, 이는 상기 데이터베이스에 기술된 이러한 단백질의 변이체, 또는 그렇지 않으면 야생형 서열에 대하여 적어도 95, 96, 97, 98 또는 99% 동일성을 갖는 단백질 변이체를 포함하고, 상기 유전자의 혼성체를 포함하고, 그리고 추가로 본원에 기술된 NPSCL-유사 증상 (예컨대, 선천성 지방이영양증-유사 증상)을 생성하는 돌연변이에 의하여 변형된, 임의의 상기 유전자 또는 상기 유전자의 혼성체를 포함한다. NPSCL-유사 증상을 생성하는 돌연변이화 잔기 이외에 임의의 변이가 존재할 경우, 상기 변이는 바람직하게는 암호화 서열에 영향을 미치지 않거나, 또는 이들이 암호화 서열에 영향을 미치는 경우, 이는 바람직하게는 보존적 치환을 도입함으로써 그렇게 된다.
본원에 개시된 비-인간 동물 중 일부에서, 내인성 Fbn1 유전자는 NPSCL-유사 증상을 생산하도록 돌연변이화된다. 예시적 마우스 피브릴린-1 서열은 수탁 번호 NM_007993.2 또는 UniProt 수탁 번호 Q61554로 할당된다. 예시적 랫트 피브릴린-1 서열은 수탁 번호 NM_031825.1 또는 UniProt 수탁 번호 Q9WUH8로 할당된다. 다른 예시적 피브릴린-1 서열은 수탁 번호 NM_001001771.1 (돼지), NM_001287085.1 (개), 및 NM_174053.2 (소)를 포함한다. 마우스 Fbn1 유전자는 염색체 15의 긴 아암 상의 15q15-q21.1에 존재한다. Megenis 외 (1991) Genomics 11:346-351 (이는 모든 목적을 위하여 그 전체내용이 참고로 본원에 편입됨). 인간 FBN1과 유사하게, 이는 65개 엑손으로 고도로 단편화된 매우 큰 유전자이다. Pereira 외 (1993) Hum. Mol . Genet . 2:961-968 (이는 모든 목적을 위하여 그 전체내용이 참고로 본원에 편입됨).
내인성 Fbn1 유전자에서의 이러한 돌연변이는, 본원의 다른 곳에 개시된, NPSCL로 진단된 환자 내의 인간 FBN1 유전자에서 식별된 돌연변이에 상응할 수 있다. 내인성 Fbn1 유전자 (또는 단백질) 내 잔기 (예컨대, 뉴클레오타이드 또는 아미노산)는, 명시된 비교 윈도우 (예컨대, Fbn1 암호화 서열)에 대한 최대 상응성을 위하여 2개 서열을 최적 정렬함으로써, 인간 FBN1 유전자 (또는 단백질) 내 잔기와 상응하는 것을 결정할 수 있으며, 여기서 비교 윈도우 내 폴리뉴클레오타이드 (또는 아미노산) 서열의 부분은 2개 서열의 최적 정렬을 위하여 (첨가 또는 결실을 포함하지 않는) 참조 서열과 비교하여 첨가 또는 결실 (즉, 갭)을 포함할 수 있다 (참고: 예컨대, 서열 동일성 및 상보성에 관하여 본원에 다른 곳에서의 검토사항). 2개 잔기는, 이들이 최적 정렬 시에 동일한 위치에 위치할 경우, 상응한다.
NPSCL-유사 증상을 생산하는 마우스 Fbn1 유전자 내 돌연변이의 특이적 예시는, c.8207_8208ins1bp (참조 서열 NM_007993.2 또는 참조 서열 서열 번호 20)이다. 본원에 개시된 일부 비-인간 동물은, c.8207_8208ins1bp 또는 서열 번호 20의 NM_007993.2에 상응하는 돌연변이를 갖는 Fbn1 유전자를 포함한다 (Fbn1 유전자가 NM_007933.2 또는 서열 번호 20과 최적 정렬될 경우). NPSCL-유사 증상을 생성할 수 있는 마우스 Fbn1 유전자 서열 내 돌연변이의 특이적 예시는, 서열 번호 20 (마우스 WT Fbn1 cDNA)과 비교한 서열 번호 21, 22, 또는 23에서의 돌연변이, 또는 서열 번호 25 (WT Fbn1 cDNA의 말단으로부터 2번째 엑손)와 비교한 서열 번호 26, 27, 또는 28에서의 돌연변이이다. NPSCL-유사 증상을 생산할 수 있는 돌연변이화된 마우스 Fbn1 단백질의 특이적 예시는, 서열 번호 31, 32, 및 33이다.
본원에 개시된 다른 비-인간 동물에서, 내인성 Fbn1 유전자의 전체 또는 일부는 결실되고, 그리고 인간 Fbn1 유전자 유래의 상응하는 서열로 대체되었다. 예를 들어, 인간 Fbn1 유전자 서열은 내인성 Fbn1 좌위에 위치할 수 있다 (즉, 내인성 Fbn1 좌위의 전체 또는 일부가 인간화됨). 상기 비-인간 동물에서, 인간 FBN1 유전자의 상응하는 서열은 NPSCL-유사 증상을 생성하는 돌연변이를 포함할 수 있다. 예시적 인간 FBN1 cDNA 서열은 수탁 번호 NM_000138.3으로 할당되고, 그리고 예시적 인간 피브릴린-1 단백질 서열은 UniProt 수탁 번호 P35555로 할당된다. 인간 FBN1 유전자 내 특이적 돌연변이 위치가 본원에 언급될 경우, 이들은 FBN1 cDNA NM_000138.3 (Ensembl 전사체 FBN1-201=ENST00000316623)에 대한 언급이다. 마찬가지로, 인간 FBN1 유전자 인트론 또는 엑손이 본원에 언급될 경우, 이들은 참조 서열 NM_000138.3 및 ENST00000316623에 관한 것으로, ATG 개시 코돈의 위치에 따른 엑손 2로부터 개시된 엑손 넘버링 (즉, 제1 암호화 엑손으로부터 개시된 엑손 넘버링)을 갖는다. 돌연변이 위치의 넘버링은 인간 게놈 변이 협회 (Human Genome Variation Society; HGVS) 서열 변이체 명명법 (varnomen.hgvs.org)을 기준으로 한다. 접두사 "c"는 참조 서열이 암호화 DNA 참조 서열임 (단백질 암호화 전사체를 기준으로 함)을 나타낸다. 넘버링은 "ATG" 번역 개시 (시작) 코돈의 "A"에서 "c.1"으로 개시되고, 그리고 번역 종결 (정지) 코돈 (즉, TAA, TAG, 또는 TGA)의 최종 뉴클레오타이드로 종결된다. 인트론의 5' 말단의 뉴클레오타이드는 바로 상류 엑손의 최종 뉴클레오타이드, 및 이후 "+" (플러스), 및 이후 인트론에 대한 이들의 위치에 대하여 넘버링된다 (예컨대, c.87+1). 인트론의 3' 말단의 뉴클레오타이드는, 바로 하류 엑손의 제1 뉴클레오타이드, 및 이후 "-" (마이너스) 및 인트론에 대한 이들의 위치에 대하여 넘버링된다 (예컨대, c.88-3). 참조 서열에 비해 하나의 뉴클레오타이드가 다른 뉴클레오티드로 치환된 치환 돌연변이는, "접두사""위치_치환된""참조_뉴클레오타이드">"신규_뉴클레오타이드"의 포멧으로, (예컨대, c.123A>G는 참조 서열이 암호화 DNA 참조 서열이고, 그리고 참조 서열 내의 위치 123에서의 "A"가 "G"로 치환된다는 것을 나타낸다). 참조 서열에 비해 하나 이상의 뉴클레오타이드가 존재하지 않는 결실 돌연변이는, "접두사""위치(들)_결실됨""del"의 포멧으로, (예컨대, c.123_127del은 암호화 DNA 참조 서열 내의 위치 123-127에서의 뉴클레오타이드가 결실됨을 나타낸다). 참조 서열에 비해 하나 이상의 뉴클레오타이드가 삽입되고, 상기 삽입체가 바로 5' 서열(sequence immediately 5')의 사본이 아닌 삽입 돌연변이는, "접두사""위치_측접""ins""삽입_서열"의 포멧이다 (예컨대, c.123_124insAGC는 서열 AGC가 암호화 DNA 참조 서열의 위치 123과 124의 사이에 삽입됨을 나타낸다). 참조 서열에 비해, 하나 이상의 뉴클레오타이드가 하나 이상의 다른 뉴클레오타이드로 대체되고 [여기에서 돌연변이가 치환, 역위(inversion), 또는 전환(conversion)인] 삽입/결실 (indel) 돌연변이는, "접두사""위치(들)_결실""delins""삽입_서열"의 포멧으로, (예컨대, c.123_127delinsAG는 암호화 DNA 참조 서열 내의 위치 123 내지 127의 서열이 결실되어, 서열 "AG"로 대체되었다는 것을 나타낸다).
바람직하게는, 돌연변이는, 인간 FBN1 서열과 최적 정렬될 경우, 인간 FBN1 서열 또는 비-인간 Fbn1 서열 내 상응하는 위치에서의 c.8100 내지 c.8300, 또는 c.8150 내지 c.8250에서 존재한다. 인간 FBN1 유전자 내 예시적 돌연변이는 프레임시프트를 유발하는 뉴클레오타이드의 삽입 또는 결실을 포함한다. 참고: 예컨대, Takenouchi 외 (2013) Am . J. Med . Genet . Part A 161A:3057-3062; Graul-Neumann 외 (2010) Am. J. Med . Genet. A. 152A(11):2749-2755; 및 Goldblatt 외 (2011) Am. J. Med . Genet. A 155A(4):717-720 (이는 모든 목적을 위하여 그 전체내용이 참고로 본원에 편입됨). 인간 FBN1 유전자 내 돌연변이의 일 예시는 c.8155_8156del이다. 이는, p.Lys2719의 17개 코돈 하류에 후속 조기 종결 코돈을 가져 프레임시프트를 야기하는 암호화 엑손 64 (말단으로부터 2번째 엑손) 내 2개 염기쌍의 결실이다. 참고: 예컨대, Graul-Neumann 외 (2010) Am . J. Med . Genet . A. 152A(11):2749-2755. 동일한 조기 종결 코돈을 유발하는 프레임시프트를 유발하는, 인간 FBN1 유전자 내 돌연변이의 또 다른 예시는 c.8156_8175del이다. 참고: 예컨대, Goldblatt 외 (2011) Am . J. Med . Genet . A 155A(4):717-720. 동일한 조기 종결 코돈을 유발하는 프레임시프트를 유발하는 인간 FBN1 유전자 내 돌연변이의 추가의 또 다른 예시는 c.8175_8182del이다. 참고: 예컨대, Takenouchi 외 (2013) Am. J. Med . Genet . Part A 161A:3057-3062. 암호화 엑손 64 내에 조기 종결 코돈을 유발하는 인간 FBN1 유전자 내 돌연변이의 또 다른 예시는 c.8206_8207insA이다. 참고: 예컨대, Romere 외 (2016) Cell 165(3):566-579. 본원에 기술된 비-인간 동물은, Fbn1 유전자 서열이 수탁 번호 NM_000138.3에 명시된 cDNA 서열에 상응하는 인간 FBN1 유전자와 최적 정렬될 경우, 이러한 돌연변이 중 임의의 것에 상응하는 돌연변이를 갖는 Fbn1 유전자를 포함한다.
인간 FBN1 유전자 내 다른 예시적 돌연변이는, 말단으로부터 2번째 엑손 (엑손 64)의 건너뜀을 유발하는 공여체 스플라이스 부위 돌연변이, 및 최종 엑손 (엑손 65) 내 조기 종결 코돈을 유발하는 후속 프레임시프트를 포함한다. 참고: 예컨 , Horn and Robinson (2011) Am . J. Med . Genet . A. 155A(4):721-724 및 Jacquinet 외 (2014) Eur . J. Med . Genet . 57(5):203-234 (이들의 각각은 모든 목적을 위하여 그 전체가 참고로 본 명세서에서 편입됨). 인간 FBN1 유전자 내 돌연변이의 일 예시는 c.8226+1G>A이다. 참고: 예컨대, Jacquinet 외 (2014) Eur . J. Med . Genet. 57(5):203-234. 인간 FBN1 유전자 내 돌연변이의 또 다른 예시는 c.8226+1G>T이다. 참고: 예컨대, Horn and Robinson (2011) Am. J. Med . Genet. A. 155A(4):721-724 및 Romere 외 (2016) Cell 165(3):566-579. 이러한 돌연변이는 인트론 64의 스플라이스-공여체 부위에 영향을 미쳐서 고도로 보존된 GT 디뉴클레오타이드를 변화시키고, 그리고 절단된 전구피브릴린-1의 합성을 허용하는 안정된 mRNA의 생산 및 암호화 엑손 64의 건너뜀을 야기하여, C-말단 퓨린 절단 부위가 변경된다. 엑손 64의 건너뜀은, 암호화 엑손 65의 개시시점에서의 프레임시프트 및 9번째 하류 코돈에서 조기 종결 코돈의 생성을 유발한다.
본원에 기술된 비-인간 동물은, Fbn1 유전자 서열이 수탁 번호 NM_000138.3에 명시된 cDNA 서열에 상응하는 인간 FBN1 유전자 서열과 최적 정렬될 경우, 이러한 돌연변이 중 임의의 것에 상응하는 돌연변이를 갖는 Fbn1 유전자를 포함할 수 있다. 마찬가지로, 본원에 기술된 비-인간 동물은, 돌연변이체 Fbn1 유전자가 본원에 기술된 돌연변이체 인간 FBN1 유전자 중 임의의 것에 의하여 암호화된 인간 FBN1 단백질 중 임의의 것과 상응하는 Fbn1 단백질을 암호화하도록, 돌연변이를 갖는 Fbn1 유전자를 포함할 수 있다. 유사하게, 암호화된 단백질은, 최종 아미노산이 본원에 기술된 돌연변이체 인간 FBN1 유전자 중 임의의 것에 의하여 암호화된 절단된 Fbn1 단백질의 최종 아미노산에 상응하는 위치에 존재하도록 절단될 수 있고, 그리고/또는 본원에 기술된 돌연변이체 인간 FBN1 유전자 중 임의의 것에 의하여 암호화된 절단된 Fbn1 단백질의 C-말단과 동일한 C-말단을 가질 수 있다.
특정 예시적 돌연변이체 Fbn1 대립유전자는 돌연변이체 마우스 Fbn1 대립유전자이다. 예를 들어, 돌연변이체 마우스 Fbn1 대립유전자의 돌연변이는 말단으로부터 2번째 엑손 (엑손 64)에서의 삽입 또는 결실을 포함할 수 있는데, 이는 -1 프레임시프트를 유발하여 Fbn1의 최종 엑손 (엑손 65)의 5' 말단, 또는 말단으로부터 2번째 엑손 (엑손 64)의 3' 말단에서 조기 종결 코돈을 유발할 수 있다.
일 예시로서, 돌연변이는 서열 번호 22에 명시되고 실시예 2에 기술된 MAID 8520 대립유전자에서와 같이, -1 프레임시프트를 야기하여, 엑손 65의 5' 말단에서 조기 종결 코돈을 유발하는, 엑손 64에서의 삽입 또는 결실을 포함할 수 있다. 선택적으로, 삽입 또는 결실은 (상기 돌연변이를 포함하는 Fbn1 유전자가 서열 번호 20과 최적 정렬될 경우) 서열 번호 20에 명시된 야생형 마우스 Fbn1 암호화 서열 내에 위치 8241에 상응하는 위치의 상류 (예컨대, 위치 8179 및 8180에 상응하는 위치 사이의 삽입)에 존재하며, 그리고/또는 조기 종결 코돈은 (상기 돌연변이를 포함하는 Fbn1 유전자가 서열 번호 20과 최적 정렬될 경우) 서열 번호 20에 명시된 야생형 마우스 Fbn1 암호화 서열의 위치 8241에 상응하는 위치에 존재한다.
또 다른 예시로서, 돌연변이는 서열 번호 21에 명시되고 실시예 1에 기술된 MAID 8501 대립유전자, 또는 서열 번호 23에 명시되고 실시예 2에 기술된 MAID 8502 대립유전자에서와 같이, -1 프레임시프트를 야기하여 말단으로부터 2번째 엑손 (엑손 64)의 3' 말단에서 조기 종결 코돈을 유발하는, 말단으로부터 2번째 엑손 (엑손 64)에서의 삽입 또는 결실을 포함할 수 있다. 선택적으로, 삽입 또는 결실은 (상기 돌연변이를 포함하는 Fbn1 유전자가 서열 번호 20과 최적 정렬될 경우) 서열 번호 20에 명시된 야생형 마우스 Fbn1 암호화 서열 내에 위치 8214에 상응하는 위치의 상류 (예컨대, 위치 8209 및 8210에 상응하는 위치 사이의 삽입, 또는 위치 8161에 상응하는 위치에서 개시되는 결실)에 존재하며, 그리고/또는 조기 종결 코돈은 (상기 돌연변이를 포함하는 Fbn1 유전자가 서열 번호 20과 최적 정렬될 경우) 서열 번호 20에 명시된 야생형 마우스 Fbn1 암호화 서열에서의 위치 8214에 상응하는 위치에 존재한다.
일 예시적 돌연변이체 마우스 Fbn1 대립유전자는, 서열 번호 21에 명시되고 실시예 1에 기술된 MAID 8501 대립유전자이다. MAID 8501 대립유전자에 의하여 암호화된 단백질은, 서열 번호 31에 명시된다. NM_007993.2를 참조 서열로서 사용하여, 이러한 돌연변이체 Fbn1 대립유전자에서의 돌연변이는 c.8213_8214delinsACT이다. 이러한 돌연변이는, c.8212와 8213 사이에 A를 삽입하고, c.8214에서 G>T 치환을 제조함에 의하여 생성되는데, 엑손 64와 65 사이의 경계로부터 19개 뉴클레오타이드 상류에, Fbn1의 말단으로부터 2번째 엑손 (엑손 64) 내 조기 종결 코돈을 유발한다. 돌연변이는, 말단으로부터 2번째 엑손의 최종 50개 뉴클레오타이드 (최종 24개 뉴클레오타이드) 내에 존재하고, mRNA 넌센스-매개 붕괴 (NMD)를 회피하도록 예측되어, 돌연변이체인 절단된 전구피브릴린 단백질의 발현을 유도한다.
또 다른 예시적 마우스 대립유전자는, 서열 번호 23에 명시되고 실시예 2에 기술된, MAID 8502 대립유전자이다. MAID 8502 대립유전자에 의하여 암호화된 단백질은 서열 번호 33에 명시된다. 이는 인간 c.8155_8156del Fbn1 대립유전자에 상응하는 돌연변이체 Fbn1 대립유전자로서, 암호화 엑손 64 (말단으로부터 2번째 엑손) 내 2개 염기쌍의 결실을 갖고, 프레임시프트를 유발하여 p.Lys2719의 17개 코돈 하류에 후속적인 조기 종결 코돈을 갖는다. MAID 8502 대립유전자에서 2개 염기쌍의 결실은, 엑손 64 및 65 사이의 경계로부터 71개 뉴클레오타이드 상류에 있다. 돌연변이는, 엑손 64 및 65에서의 경계로부터 19개 뉴클레오타이드 상류에서, 마우스 Fbn1의 말단으로부터 2번째 엑손 (엑손 64)에서의 조기 종결 코돈을 유발한다.
또 다른 예시적 마우스 대립유전자는, 서열 번호 22에 명시되고 실시예 2에 기술된, MAID 8520 대립유전자이다. MAID 8520 대립유전자에 의하여 암호화된 단백질은 서열 번호 32에 명시된다. NM_007993.2를 참조 서열로서 사용하여, 이러한 돌연변이체 Fbn1 대립유전자에서의 돌연변이는 8179_8180insAGGCGGCCCAGAGCCACCTGCCAGC이다. 이러한 돌연변이는 엑손 64 및 65 사이의 경계로부터 54개 뉴클레오타이드 상류에서, 말단으로부터 2번째 엑손 (엑손 64) 내 25-bp 삽입 (서열 번호 44에 명시된 삽입된 서열)을 통하여 생성되었다. 이는 마우스 Fbn1의 말단으로부터 2번째 엑손 (엑손 64)에서의 프레임시프트를 유발한다. 돌연변이는, 엑손 64 및 65에서의 경계로부터 9개 뉴클레오타이드 하류에서, 마우스 Fbn1의 최종 엑손 (엑손 65)에 조기 종결 코돈을 유발한다.
상기 예시적 마우스 Fbn1 대립유전자 각각은, 마우스 Fbn1 유전자의 말단으로부터 2번째 엑손 (엑손 64)에 프레임시프트 돌연변이를 유발한다. 각 프레임시프트 돌연변이는, 마우스 Fbn1 유전자의 최종 엑손 (엑손 65)의 5' 말단, 또는 말단으로부터 2번째 엑손 (엑손 64)의 3' 말단 중 어느 하나 내에서의 조기 종결 코돈을 유발한다. 각 돌연변이가 조기 종결 코돈을 유발하기 때문에, 각 돌연변이는 전구피브릴린-1의 C-말단 절단 생성물 (즉, 아스프로신)을 파괴시키거나 제거하며, 이는 생산될 경우, C-말단 절단 생성물은 필연적으로 절단될 것이기 때문이다. 또한, 상기 예시적 마우스 Fbn1 대립유전자 각각은, 아스파르트산 및 글루탐산에 비해 라이신, 아르기닌, 및 히스티딘의 수가 더 많아서, 양전하를 띈 C-말단 말단을 유발한다. Fbn1 단백질의 최종 14개 아미노산은 서열 번호 45, 46, 및 47에 각각 명시된, MAID 8501, MAID 8502 및 MAID 8520 대립유전자에 의하여 암호화된다.
C. 비-인간 동물
임의의 적합한 비-인간 동물은 본원에 개시된 NPSCL의 모델로서 사용될 수 있다. 그와 같은 비-인간 동물은 바람직하게는 포유동물, 예컨대 설치류 (예를 들면, 랫트, 마우스, 및 햄스터)이다. 다른 비-인간 포유동물은, 예를 들어, 비-인간 영장류, 원숭이, 유인원, 고양이, 개, 토끼, 말, 황소, 사슴, 들소, 가축 (예를 들면, 소 종 예컨대 소, 거세소, 및 다른 동종; 양 종 예컨대 양, 염소, 및 다른 동종; 및 돼지 종 예컨대 돼지 및 야생돼지)를 포함한다. 용어 "비-인간"은 인간을 배제한다.
본원에 개시된 비-인간 동물 모델에서 이용된 마우스는, 예를 들어, 129 품종, C57BL/6 품종, BALB/c 품종, 스위스 웹스터 품종, 129 및 C57BL/6 품종의 혼합물, BALB/c 및 C57BL/6 품종의 혼혈, 129 및 BALB/c 품종의 혼혈, 및 BALB/c, C57BL/6 및 129 품종의 혼혈을 포함하는, 임의의 품종로부터 유래된 것일 수 있다. 예를 들어, 마우스는 적어도 부분적으로는 BALB/c 품종로부터 유래된 것일 수 있다 (예를 들면, 적어도 약 25%, 적어도 약 50%, 적어도 약 75%만큼 BALB/c 품종로부터 유래된 것, 또는 약 25%, 약 50%, 약 75%, 또는 약 100%만큼 BALB/c 품종로부터 유래된 것). 일 예시에서, 마우스는 50% BALB/c, 25% C57BL/6, 및 25% 129를 포함하는 품종을 가질 수 있다. 대안적으로, 마우스는 BALB/c를 배제하는 품종 또는 품종의 조합을 포함할 수 있다.
129 품종의 예는 129P1, 129P2, 129P3, 129X1, 129S1 (예를 들면, 129S1/SV, 129S1/Svlm), 129S2, 129S4, 129S5, 129S9/SvEvH, 129S6 (129/SvEvTac), 129S7, 129S8, 129T1, 및 129T2를 포함한다. 참고: 예컨대, Festing 외 (1999) Mammalian Genome 10(8):836 (이는 모든 목적을 위하여 그 전체내용이 참고로 본원에 편입됨). C57BL 품종의 예는 C57BL/A, C57BL/An, C57BL/GrFa, C57BL/Kal_wN, C57BL/6, C57BL/6J, C57BL/6ByJ, C57BL/6NJ, C57BL/10, C57BL/10ScSn, C57BL/10Cr, 및 C57BL/Ola를 포함한다. 본원에 제공된 비-인간 동물 모델에서 이용된 마우스는, 또한 상기 언급된 129 품종 및 상기 언급된 C57BL/6 품종 (예를 들면, 50% 129 및 50% C57BL/6)의 혼합물에서 유래한 것일 수 있다. 마찬가지로, 본원에 제공된 비-인간 동물 모델에서 이용된 마우스는 상기 언급된 129 품종의 혼혈, 또는 상기 언급된 BL/6 품종 (예를 들면, 129S6 (129/SvEvTac) 품종)의 혼합물에서 유래된 것일 수 있다.
본원에 제공된 비-인간 동물 모델에서 이용된 랫트는, 예를 들어, ACI 랫트 품종, 흑색 아구티(Dark Agouti; DA) 랫트 품종, 위스타(Wistar) 랫트 품종, LEA 랫트 품종, 스프라그 도울리 (SD) 랫트 품종, 또는 피셔(Fisher) 랫트 품종 예컨대 피셔 F344 또는 피셔 F6을 포함하는, 임의의 랫트 품종에서 유래된 것일 수 있다. 랫트는 또한 상기 인용된 2 이상의 품종의 혼혈로부터 유래된 품종에서 유래된 것일 수 있다. 예를 들어, 랫트는 DA 품종, 또는 ACI 품종 유래의 것일 수 있다. ACI 랫트 품종은, 백색 배 및 발 그리고 RT1 av1 일배체형을 갖는, 흑색 아구티(agouti)를 갖는 것을 특징으로 한다. 그와 같은 품종은 Harlan Laboratories 사를 포함하는 여러 공급원으로부터 입수할 수 있다. 흑색 아구티 (DA) 랫트 품종은 아구티 코트(agouti coat) 및 RT1 av1 일배체형을 갖는 것을 특징으로 한다. 그와 같은 랫트는 Charles River 및 Harlan Laboratories 사를 포함하는 여러 가지의 공급원으로부터 입수할 수 있다. 일부 경우에서, 랫트는 근친교배한 랫트 품종으로부터 유래된 것이다. 참고: 예컨대, US 2014/0235933 A1 (이는 모든 목적을 위하여 그 전체내용이 참고로 본원에 편입됨).
Ⅱ. 선천성 지방이영양증을 갖는 신생아 조로 증후군의 동물 모델의 생성
A. 세포 내 Fbn1 돌연변이의 생성
뉴클레아제 제제 및/또는 외인성 수선 주형의 사용을 통하여 세포 (예컨대, 만능 세포 또는 1세포기 배아) 내 게놈에서의 Fbn1 유전자를 변형하는 다양한 방법이 제공된다. 방법은 시험관내, 생체외 또는 생체내에서 발생할 수 있다. 뉴클레아제 제제는 단독으로, 또는 외인성 수선 주형과 병용하여 사용될 수 있다. 대안적으로, 외인성 수선 주형은 단독으로, 또는 뉴클레아제 제제와 병용하여 사용될 수 있다.
이중-가닥 파단 (double-strand breaks, DSB)에 반응하는 수선은, 주로 2개 보존된 DNA 수선 경로: 비-상동 말단 연결 (non-homologous end joining, NHEJ) 및 상동 재조합 (HR)을 통해 발생한다. 참고: Kasparek & Humphrey (2011) Seminars in Cell & Dev . Biol . 22:886-897 (이는 모든 목적을 위하여 그 전체내용이 참고로 본원에 편입됨). NHEJ는 상동성 주형의 필요성 없이, 외인성 서열에 대한 파단 말단의 직접적인 라이게이션, 또는 파단 말단의 서로에 대한 직접적인 라이게이션에 의한, 핵산 이중-가닥 파단의 수선을 포함한다. NHEJ에 의한 비-인접 서열의 라이게이션은 이중-가닥 파단의 부위 근처 결실, 삽입, 또는 전좌를 종종 초래할 수 있다.
외인성 수선 주형에 의해 매개된 표적 핵산 (예컨대, Fbn1 유전자)의 수선은, 2개 폴리뉴클레오타이드 사이의 어느 유전적 정보 교환 과정을 포함할 수 있다. 예를 들어, NHEJ는 외인성 수선 주형의 말단과 절단 말단의 직접적인 라이게이션을 통해, 외인성 수선 주형의 표적화된 통합을 또한 유도할 수 있다(즉, NHEJ-기반된 포착). 그와 같은 NHEJ-매개된 표적화된 통합은, 상동성 지향된 수선 (homology directed repair, HDR) 경로가 (예를 들면, 비-분할 세포, 1차 세포, 및 상동성-기반의 DNA 수선을 잘 실시하지 못하는 세포에서) 용이하게 사용할 수 없는 경우, 외인성 수선 주형의 삽입에 바람직할 수 있다. 게다가, 상동성-지향된 수선과는 대조적으로, (Cas-매개된 절단에 의해 형성된 돌출부(overhang) 이상의) 절단 부위가 측접한 서열 동일성의 큰 영역에 관한 지식은 필요 없고, 이는 게놈 서열을 제한적으로만 알고 있는 게놈을 갖는 유기체에 표적화된 삽입을 시도하는 경우 유익할 수 있다. 통합은 외인성 수선 주형과 절단된 게놈 서열 사이의 블런트 말단(blunt end)의 라이게이션을 통해, 또는 절단된 게놈 서열에서 Cas 단백질에 의해 생성된 것과 양립가능한 돌출부가 측접되는 외인성 수선 주형을 사용하는 스티키 말단(stiky end) (즉, 5' 또는 3' 돌출부를 갖는 것)의 라이게이션을 통해 진행할 수 있다. 참고: 예컨대, US 2011/020722, WO 2014/033644, WO 2014/089290, 및 Maresca 외 (2013) Genome Res. 23(3):539-546 (이들의 각각은 모든 목적을 위하여 그 전체가 참고로 본 명세서에서 편입됨). 블런트 말단이 라이게이션되면, 표적 및/또는 공여체 절제는, 표적 서열에서 원치않는 변경을 형성할 수 있는, 단편 연결에 필요한 미세상동성의 생성 영역에 필요해질 수 있다.
수선은 상동성 지향된 수선 (HDR) 또는 상동 재조합 (HR)을 통해 또한 발생할 수 있다. HDR 또는 HR은 뉴클레오타이드 서열 상동성을 요구할 수 있는 핵산 수선의 형태를 포함하고, "표적" 분자 (즉, 이중-가닥 파단을 경험하였던 것)의 수선용 주형으로서 "공여체" 분자를 사용하고, 공여체부터 표적으로의 유전적 정보의 전달을 유발시킨다. 임의의 특정 이론에 구속되고자 하는 바램 없이, 상기 전달은 파손된 표적과 공여체 사이에 형성되는 이종이중나선 DNA의 미스매치 교정, 및/또는 합성-의존적 가닥 어닐링 (상기 공여체는 상기 표적의 일부가 될 유전적 정보를 합성하는데 사용됨) 및/또는 관련 공정을 포함할 수 있다. 일부 경우에서, 공여체 폴리뉴클레오타이드, 공여체 폴리뉴클레오타이드의 일부, 공여체 폴리뉴클레오타이드의 사본, 또는 공여체 폴리뉴클레오타이드의 사본의 일부는 표적 DNA에 통합한다. 참고: Wang 외 (2013) Cell 153:910-918; Mandalos 외 (2012) PLOS ONE 7:e45768:1-9; 및 Wang 외 (2013) Nat Biotechnol. 31:530-532 (이들의 각각은 모든 목적을 위하여 그 전체가 참고로 본 명세서에서 편입됨).
게놈에서의 Fbn1 유전자에 대한 표적화된 유전적 변형은, Fbn1 유전자 내 표적 게놈 좌위에서의 5' 표적 서열에 혼성화되는 5' 상동 아암, 및 Fbn1 유전자 내 표적 게놈 좌위에서의 3' 표적 서열에 혼성화되는 3' 상동 아암을 포함하는 외인성 수선 주형을 세포와 접촉시킴에 의하여, 생성될 수 있다. 외인성 수선 주형은, Fbn1 유전자에 대한 표적화된 유전적 변형을 생성하도록, 표적 게놈 좌위와 재조합될 수 있다. 상기 방법은, 예를 들어, 암호화된 단백질의 C-말단 절단을 유발하는 돌연변이를 포함하도록 변형된 Fbn1 유전자를 유발한다. 외인성 수선 주형의 예시는 본 명세서에서 다른 곳에 기재된다.
게놈 내 Fbn1 유전자에 대한 표적화된 유전적 변형은, 또한 Fbn1 유전자 내 표적 게놈 좌위에서의 인식 서열에서 하나 이상의 틈(nick) 또는 이중-가닥 파단을 유도하는 뉴클레아제 제제를 세포와 접촉시킴에 의하여, 생성될 수 있다. 상기 방법은, 예를 들어, 암호화된 단백질의 C-말단 절단을 유발하는 돌연변이를 포함하도록 변형된 Fbn1 유전자를 유발할 수 있다. 본 방법에서 사용될 수 있는 뉴클레아제 제제의 예시 및 변형은 본원에서 다른 곳에 기술된다.
예를 들어, 게놈 내 Fbn1 유전자에 대한 표적화된 유전적 변형은, Fbn1 유전자에서의 표적 게놈 좌위 내 하나 이상의 가이드 RNA 인식 서열에 혼성화되는 하나 이상의 가이드 RNA 및 Cas 단백질을 세포와 접촉시킴에 의하여, 생성될 수 있다. 예를 들어, 상기 방법은, Fbn1 유전자 내 가이드 RNA 인식 서열에 대하여 혼성화되는 가이드 RNA 및 Cas 단백질을 세포와 접촉시키는 단계를 포함할 수 있다. Cas 단백질 및 가이드 RNA는 복합체를 형성하고, 그리고 Cas 단백질은 가이드 RNA 인식 서열을 절단한다. Cas9 단백질에 의한 절단은 (예를 들면, Cas9 단백질이 틈내기효소(nickase)일 경우) 이중-가닥 파단 또는 단일-가닥 파단을 형성할 수 있다. 상기 방법은, 예를 들어, 암호화된 단백질의 C-말단 절단을 유발하는 돌연변이를 포함하도록 변형된 Fbn1 유전자를 유발할 수 있다. 방법에서 사용될 수 있는 Cas9 단백질 및 가이드 RNA의 예시 및 변형은, 본 명세서에서 다른 곳에 기술된다.
선택적으로, 세포는, Fbn1 유전자에서의 표적 게놈 좌위 내의 추가적인 가이드 RNA 인식 서열에 혼성화되는 하나 이상의 추가 가이드 RNA와 추가로 접촉될 수 있다. 접합체를 하나 이상의 추가 가이드 RNA (예컨대, 제2 가이드 RNA 인식 서열에 혼성화되는 제2 가이드 RNA)에 접촉함으로써, Cas 단백질에 의한 절단은 2 이상의 이중-가닥 파단, 또는 (예컨대, Cas 단백질이 틈내기효소일 경우) 2 이상의 단일-을 형성할 수 있다.
선택적으로, 세포는, 표적화된 유전적 변형을 생성하도록 Fbn1 유전자 내 표적 게놈 좌위와 재조합되는 하나 이상의 외인성 수선 주형과 추가적으로 접촉될 수 있다. 본 방법에서 사용될 수 있는 외인성 수선 주형의 예시 및 변형은, 본원에서 다른 곳에서 개시된다.
Cas 단백질, 가이드 RNA(들), 및 외인성 수선 주형(들)은 본원에서 다른 곳에서 기술된 바와 같은 임의의 수단에 의하여, 그리고 임의의 형태로 세포로 도입될 수 있고, 그리고 Cas 단백질, 가이드 RNA(들), 및 외인성 수선 주형(들) 중 전체 또는 일부는 임의의 조합으로 동시에 또는 순차적으로 도입될 수 있다.
그와 같은 일부 방법에서, 외인성 수선 주형에 의한 표적 핵산 (예컨대, Fbn1 유전자)의 수선은 상동성-지향된 수선 (HDR)을 통해 발생한다. 상동성-지향된 수선은, Cas 단백질이 이중-가닥 파단을 형성하기 위해 Fbn1 유전자에서 DNA의 양쪽 가닥을 절단하는 경우, Cas 단백질이 단일-가닥 절단을 형성하기 위해 표적 핵산에서 DNA의 1개 가닥을 절단시키는 틈내기효소인 경우, 또는 Cas 틈내기효소가 2개 상쇄 틈(offset nick)에 의해 형성된 이중-가닥 파단을 형성하는데 사용되는 경우 발생할 수 있다. 그와 같은 방법에서, 외인성 수선 주형은 5' 및 3' 표적 서열에 상응하는 5' 및 3' 상동성 아암을 포함한다. 가이드 RNA 인식 서열(들) 또는 절단 부위(들)는 5' 표적 서열에 인접하거나, 3' 표적 서열에 인접하거나, 5' 표적 서열 및 3' 표적 서열 모두에 인접할 수 있거나, 또는 5' 표적 서열 및 3' 표적 서열 모두에 인접하지 않을 수 있다. 선택적으로, 외인성 수선 주형은 5' 및 3' 상동성 아암에 의해 측접된 핵산 삽입물을 추가로 포함할 수 있고, 상기 핵산 삽입물은 5' 및 3' 표적 서열 사이 삽입된다. 예를 들어, 핵산 삽입물은 야생형 비-인간 동물 Fbn1 서열과 비교하여 하나 이상의 변형을 포함할 수 있거나, 또는 이는 야생형 인간 FBN1 서열과 비교하여 하나 이상의 변형을 포함하는 인간 FBN1 암호화 서열의 전체 또는 일부를 포함할 수 있다. 핵산 삽입물이 존재하지 않으면, 외인성 수선 주형은 5' 및 3' 표적 서열 사이에서 게놈 서열을 결실시키는 기능을 할 수 있다. 외인성 수선 주형의 예시는 본 명세서에서 다른 곳에 기재된다.
대안적으로, 외인성 수선 주형에 의하여 매개된 Fbn1 유전자의 수선은, 비-상동 말단 연결 (NHEJ)-매개된 라이게이션에 의해 발생할 수 있다. 그와 같은 방법에서, 외인성 수선 주형의 적어도 하나의 말단은 Fbn1 유전자 내 Cas-매개된 절단에 의해 형성된 적어도 하나의 돌출부에 상보성인 짧은 단일-가닥 영역을 포함한다. 외인성 수선 주형에서 상보성 말단은 핵산 삽입물에 측접될 수 있다. 예를 들어, 외인성 수선 주형의 각각의 말단은 Fbn1 유전자 내 Cas-매개된 절단에 의해 형성된 돌출부에 상보성인 짧은 단일-가닥 영역을 포함할 수 있고, 외인성 수선 주형 내의 이들 상보성 영역은 핵산 삽입물에 측접될 수 있다. 예를 들어, 핵산 삽입물은 야생형 비-인간 동물 Fbn1 서열과 비교하여 하나 이상의 변형을 포함할 수 있거나, 또는 이는 야생형 인간 FBN1 서열과 비교하여 하나 이상의 변형을 포함하는 인간 FBN1 암호화 서열의 전체 또는 일부를 포함할 수 있다.
돌출부 [즉, 엇갈린 말단(staggered end)]은 Cas-매개된 절단에 의해 형성된 이중-가닥 파단의 블런트 말단의 절제에 의해 형성될 수 있다. 그와 같은 절제는 단편 연결에 필요한 미세상동성의 영역을 생성시킬 수 있지만, 이것은 Fbn1 유전자에서 원치않는 또는 통제불가능한 변경을 형성할 수 있다. 대안적으로, 그와 같은 돌출부는 쌍형성된 Cas 틈내기효소 사용에 의해 형성될 수 있다. 예를 들어, 세포는 DNA의 반대편 가닥을 절단하는 제1 및 제2 틈내기효소와 접촉될 수 있고, 그것에 의하여 게놈은 이중 틈내기를 통하여 변형된다. 이는, 세포를 제1 Cas 단백질 틈내기효소, Fbn1 유전자에서의 표적 게놈 좌위 내 제1 가이드 RNA 인식 서열에 혼성화되는 제1 가이드 RNA, 제2 Cas 단백질 틈내기효소, 및 Fbn1 유전자에서의 표적 게놈 좌위 내 제2 가이드 RNA 인식 서열에 혼성화되는 제2 가이드 RNA와 접촉시킴에 의하여, 달성될 수 있다. 제1 Cas 단백질 및 제1 가이드 RNA는 제1 복합체를 형성하고, 그리고 제2 Cas 단백질 및 제2 가이드 RNA는 제2 복합체를 형성한다. 제1 Cas 단백질 틈내기효소는 제1 가이드 RNA 인식 서열 내 게놈 DNA의 제1 가닥을 절단하고, 제2 Cas 단백질 틈내기효소는 제2 가이드 RNA 인식 서열 내 게놈 DNA의 제2 가닥을 절단하고, 그리고 선택적으로, 외인성 수선 주형은, 표적화된 유전적 변형을 생성하도록 Fbn1 유전자 내 표적 게놈 좌위와 재조합된다.
제1 틈내기효소는 게놈 DNA의 제1 가닥 (즉, 상보적 가닥)을 절단할 수 있고, 그리고 제2 틈내기효소는 게놈 DNA의 제2 가닥 (즉, 비-상보적 가닥)을 절단할 수 있다. 제1 및 제2 틈내기효소는, Cas9의 RuvC 도메인 내 촉매적 잔기를 돌연변이화함에 의하여 (예컨대, 본원에서 다른 곳에 기술된 D10A 돌연변이), 또는 Cas9의 HNH 도메인 내 촉매적 잔기를 돌연변이화함에 의하여 (예컨대, 본원에서 다른 곳에 기술된 H840A 돌연변이), 생성될 수 있다. 상기 방법에서, 이중 틈내기는 엇갈린 말단 (즉, 돌출부)을 갖는 이중-가닥 파단을 형성하도록 이용될 수 있다. 제1 및 제2 가이드 RNA 인식 서열은, DNA의 제1 및 제2 가닥에서 제1 및 제2 틈내기효소에 의해 형성된 틈이 이중-가닥 파단을 형성하도록, 절단 부위를 형성하기 위해 배치될 수 있다. 돌출부는, 제1 및 제2 CRISPR RNA 인식 서열 내 틈이 상쇄될 경우, 형성된다. 오프세트 윈도우는, 예를 들어, 적어도 약 5 bp, 10 bp, 20 bp, 30 bp, 40 bp, 50 bp, 60 bp, 70 bp, 80 bp, 90 bp, 100 bp 또는 그 이상일 수 있다. 참고: 예컨대, Ran 외 (2013) Cell 154:1380-1389; Mali 외 (2013) Nat . Biotech.31:833-838; 및 Shen 외 (2014) Nat . Methods 11:399-404.
B. 뉴클레아제 제제
원하는 인식 서열로 틈(nick) 또는 이중 가닥 파단을 유도하는 임의의 뉴클레아제 제제는, 본 명세서에 개시된 방법 및 조성물에서 사용될 수 있다. 천연 발생적 또는 원상태 뉴클레아제 제제는, 뉴클레아제 제제가 목적 인식 서열 내 틈 또는 이중-가닥 파단을 유도하는 한, 이용될 수 있다. 대안적으로, 변형된 또는 조작된 뉴클레아제 제제가 이용될 수 있다. "조작된 뉴클레아제 제제"는, 목적 인식 서열 내 틈 또는 이중-가닥 파단을 특이적으로 인식하고 유도하도록, 이의 원래 형태로부터 조작 (변형 또는 유도)되는 뉴클레아제를 포함한다. 따라서, 조작된 뉴클레아제 제제는 원상태의 천연 발생적 뉴클레아제 제제로부터 유도될 수 있거나, 또는 이는 인공적으로 형성 또는 합성될 수 있다. 조작된 뉴클레아제는 인식 서열 내 틈 또는 이중-가닥 파단을 유도할 수 있으며, 예를 들어, 여기서 상기 인식 서열은 원상태 (비-조작된 또는 비-변형된) 뉴클레아제 제제에 의하여 인식될 서열이 아니다. 뉴클레아제 제제의 변형은, 핵산 절단 제제 내의 하나의 뉴클레오타이드 또는 단백질 절단 제제 내의 하나의 아미노산만큼 적을 수 있다. 인식 서열 또는 다른 DNA 내 틈 또는 이중-가닥 파단을 생성하는 것은, 인식 서열 또는 다른 DNA를 "제거" 또는 "절단"하는 것으로 본원에서 지칭될 수 있다.
뉴클레아제 제제의 활성 변이체 및 단편 (즉, 조작된 뉴클레아제 제제)이 또한 제공된다. 상기 활성 변이체는 원상태 뉴클레아제 제제와 적어도 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성을 포함할 수 있으며, 여기서 상기 활성 변이체는 목적 인식 서열에서 절단하는 능력을 유지하고, 그리고 이에 따라 틈 또는 이중-가닥-파단-유도 활성을 유지한다. 예를 들어, 본원에 기술된 뉴클레아제 제제 중 임의의 것은 원상태 엔도뉴클레아제 서열로부터 변형될 수 있고, 그리고 원상태 뉴클레아제 제제에 의하여 인식되지 않은 인식 서열에서 틈 또는 이중-가닥 파단을 인식하고 유도하도록 설계될 수 있다. 따라서, 일부 조작된 뉴클레아제는, 상응하는 원상태 뉴클레아제 제제 인식 서열과 상이한 인식 서열에 틈 또는 이중-가닥 파단을 유도하는 특이성을 갖는다. 틈 또는 이중-가닥-파단-유도 활성을 위한 에세이는 공지되어 있고, 이는 일반적으로 인식 서열을 함유하는 DNA 기질에 대한 엔도뉴클레아제의 전체적인 활성 및 특이성을 측정한다.
용어 "뉴클레아제 제제에 대한 인식 서열"은, 틈 또는 이중-가닥 파단이 뉴클레아제 제제에 의하여 유도되는, DNA 서열을 포함한다. 뉴클레아제 제제에 대한 인식 서열은 세포에 대하여 내인성 (또는 원상태)일 수 있거나, 또는 인식 서열은 세포에 대하여 외인성일 수 있다. 세포에 대하여 외인성인 인식 서열은, 세포의 게놈 내 천연 발생된 것이 아니다. 인식 서열은 또한, 표적 좌위에 위치되는 것을 목적하는, 관심 폴리뉴클레오타이드에 대하여 외인성일 수 있다. 일부 경우에서, 인식 서열은 숙주 세포의 게놈 내 단 1회 존재한다.
예시된 인식 서열의 활성 변이체 및 단편이 또한 제공된다. 상기 활성 변이체는, 소정의 인식 서열과 적어도 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성을 포함할 수 있으며, 여기서 상기 활성 변이체는 생물학적 활성을 유지하고, 그리고 이에 따라 서열-특이적 방식으로 뉴클레아제 제제에 의하여 인식 및 절단될 수 있다. 뉴클레아제 제제에 의한 인식 서열의 이중-가닥 파단을 측정하는 에세이는 본 분야에 공지된다 (예컨대, TAQMAN® qPCR 에세이, Frendewey 외 (2010) Methods in Enzymology 476:295-307 (이는 모든 목적을 위하여 그 전체내용이 참고로 본원에 편입됨)).
인식 서열의 길이는 가변되고, 그리고, 예를 들어, 아연 핑거 뉴클레아제 (zinc finger nuclease, ZFN) 쌍에 대해서는 약 30-36 bp (즉, 각 ZFN에 대해서는 약 15-18 bp), 전사 활성인자-유사 효과기 뉴클레아제 (Transcription Activator-Like Effector Nuclease, TALEN)에 대해서는 약 36 bp, 또는 CRISPR/Cas9 가이드 RNA에 대해서는 약 20 bp인, 인식 서열을 포함할 수 있다.
뉴클레아제 제제의 인식 서열은 표적 게놈 좌위 내에서, 또는 이에 근접하여 임의의 곳에 위치될 수 있다. 인식 서열은, 유전자의 발현에 영향을 미치는, 조절 영역 내에서, 또는 유전자 (예컨대, Fbn1 유전자)의 암호화 영역 내에 위치할 수 있다. 뉴클레아제 제제의 인식 서열은, 인트론, 엑손, 프로모터, 인핸서, 조절 영역, 또는 임의의 비-단백질 암호화 영역 내에 위치할 수 있다.
본원에 개시된 다양한 방법 및 조성물에서 이용될 수 있는 뉴클레아제 제제의 일 유형은 전사 활성인자-유사 효과기 뉴클레아제 (TALEN)이다. TAL 효과기 뉴클레아제는, 원핵 또는 진핵 유기체의 게놈 내 특이적 표적 서열에 이중-가닥 파단을 제조하는데 사용될 수 있는, 서열-특이적 뉴클레아제의 부류이다. TAL 효과기 뉴클레아제는, 엔도뉴클레아제, 예컨대 FokI의 촉매 도메인에, 원상태 또는 조작된 전사 활성인자-유사 (TAL) 효과기, 또는 이의 기능성 부분을 융합시킴으로서 형성된다. 고유의 모듈형 TAL 효과기 DNA 결합 도메인은, 잠재적으로 어느 소정의 소정의 DNA 인식 특이성을 갖는 단백질의 설계를 가능하도록 한다. 따라서, TAL 효과기 뉴클레아제의 DNA 결합 도메인은 특이적 DNA 표적 부위를 인식하도록 조작될 수 있으며, 그리고 이에 따라 목적 표적 서열에서 이중-가닥 파단을 제조하는데 사용될 수 있다. 참고: WO 2010/079430; Morbitzer 외 (2010) Proc. Natl . Acad . Sci . U.S.A . 107(50:21617-21622; Scholze & Boch (2010) Virulence 1:428-432; Christian 외 (2010) Genetics 186:757-761; Li 외 (2011) Nucleic Acids Res. 39(1):359-372; 및 Miller 외 (2011) Nature Biotechnology 29:143-148 (이는 모든 목적을 위하여 그 전체내용이 참고로 본원에 편입됨).
적합한 TAL 뉴클레아제의 예 및 적합한 TAL 뉴클레아제를 제조하는 방법은, 예를 들어 US 2011/0239315 A1, US 2011/0269234호 A1, US 2011/0145940호 A1, US 2003/0232410 A1, US 2005/0208489 A1, US 2005/0026157 A1, US 2005/0064474 A1, US 2006/0188987 A1 및 US 2006/0063231 A1 (이들은 각각 모든 목적을 위해 본 명세서에 그 전문이 참고로 포함됨)에 개시되어 있다. 다양한 구현예에서, 예를 들어, 관심 게놈 좌위 내 표적 핵산 서열 내에서 또는 이에 근접하여 절단된, TAL 효과기 뉴클레아제가 조작되며, 여기서 상기 표적 핵산 서열은 외인성 수선 주형에 의하여 변형될 서열에서, 또는 이에 근접하여 존재한다. 본원에 제공된 다양한 방법 및 조성물에 의한 사용에 적합한 TAL 뉴클레아제는, 본원에서 다른 곳에 기술된 외인성 수선 주형에 의하여 변형될 표적 핵산 서열에서 또는 이에 근접하여 결합되도록 특이적으로 설계된 것들을 포함한다.
일부 TALEN에서, TALEN의 각 모노머는 2개 초가변 잔기를 통하여 단일 염기쌍을 인식하는 33-35개 TAL 반복체를 포함한다. 일부 TALEN에서, 뉴클레아제 제제는 개별적 뉴클레아제, 예컨대 FokI 엔도뉴클레아제에 작동가능하게 연결된 TAL-반복부-기반 DNA 결합 도메인을 포함하는 키메라 단백질이다. 예를 들어, 뉴클레아제 제제는 제1 TAL-반복부-기반 DNA 결합 도메인 및 제2 TAL-반복부-기반 DNA 결합 도메인을 포함할 수 있으며, 여기서 제1 및 제2 TAL-반복부-기반 DNA 결합 도메인은 각각 FokI 뉴클레아제에 작동가능하게 연결되며, 제1 및 제2 TAL-반복부-기반 DNA 결합 도메인은 가변 길이 (12-20 bp)의 스페이서 서열에 의하여 분리된 표적 DNA 서열 각 가닥에서의 2개의 인접 표적 DNA 서열을 인식하며, 그리고 FokI 뉴클레아제 하부단위는 이량체화되어, 표적 서열에서 이중 가닥 파단을 제조하는 활성 뉴클레아제를 형성한다.
본원에 개시된 다양한 방법 및 조성물에서 이용될 수 있는 뉴클레아제 제제의 또 다른 예시는 아연-핑거 뉴클레아제 (ZFN)이다. 일부 ZFN에서, ZFN의 각각의 단량체는 3개 이상의 아연 핑거 기반 DNA 결합 도메인을 포함하고, 각각의 아연 핑거 기반 DNA 결합 도메인은 3bp 하위부위에 결합한다. 다른 ZFN에서, ZFN은 개별적인 뉴클레아제, 예컨대 FokI 엔도뉴클레아제에 작동 가능하게 연결된 아연 핑거 기반 DNA 결합 도메인을 포함하는 키메라 단백질이다. 예를 들어, 뉴클레아제 제제는 제1 ZFN 및 제2 ZFN을 포함할 수 있고, 제1 ZFN 및 제2 ZFN의 각각은 FokI 뉴클레아제 하위단위에 작동 가능하게 연결되고, 제1 및 제2 ZFN은 약 5-7bp 스페이서에 의해 분리된 표적 DNA 서열 각 가닥에서의 2개의 인접한 표적 DNA 서열을 인식하고, FokI 뉴클레아제 하위단위는 이합체화하여 이중 가닥 파단을 만드는 활성 뉴클레아제를 생성한다. 참고: 예를 들면, US 2006/0246567; US 2008/0182332; US 2002/0081614; US 2003/0021776; WO 2002/057308 A2; US 2013/0123484; US 2010/0291048; WO 2011/017293 A2; 및 Gaj 외 (2013) Trends in Biotechnology 31(7):397-405 (이는 모든 목적을 위하여 그 전체내용이 참고로 본원에 편입됨).
본원에 개시된 다양한 방법 및 조성물에서 이용될 수 있는 뉴클레아제 제제의 또 다른 유형은, 메가뉴클레아제이다. 메가뉴클레아제는 보존된 서열 모티프에 기초한 4개의 계열, 즉 LAGLIDADG, GIY-YIG, H-N-H 및 His-Cys 박스 계열로 분류된다. 이들 모티프는 금속 이온의 배위, 및 포스포디에스테르 결합의 가수분해에 참여한다. 메가뉴클레아제는 이의 긴 인식 서열에 대하여, 그리고 이의 DNA 기질 내 일부 서열 다형성을 용인하는 것에 대하여 주목된다. 메가뉴클레아제 도메인, 구조 및 작용이 공지되어 있다. 참고: 예컨대, Guhan and Muniyappa (2003) Crit Rev Biochem Mol Biol . 38:199-248; Lucas 외 (2001) Nucleic Acids Res. 29:960-969; Jurica and Stoddard, (1999) Cell Mol Life Sci 55:1304-1326; Stoddard (2006) Q Rev Biophys 38:49-95; 및 Moure 외 (2002) Nat Struct Biol 9:764. 일부 예시에서, 천연 발생적 변이체 및/또는 조작된 유도체 메가뉴클레아제가 사용된다. 속도론, 보조인자 상호작용, 발현, 최적 조건, 및/또는 인식 서열 특이성을 변형시키기 위한 방법이 공지되어 있으며, 그리고 활성에 대하여 스크리닝하기 위한 방법이 공지되어 있다. 참고: 예컨대, Epinat 외, (2003) Nucleic Acids Res . 31:2952-2962; Chevalier 외 (2002) Mol . Cell 10:895-905; Gimble 외 (2003) Mol . Biol . 334:993-1008; Seligman 외 (2002) Nucleic Acids Res. 30:3870-3879; Sussman 외 (2004) J. Mol . Biol . 342:31-41; Rosen 외 (2006) Nucleic Acids Res. 34:4791-4800; Chames 외 (2005) Nucleic Acids Res. 33:e178; Smith 외 (2006) Nucleic Acids Res. 34:e149; Gruen 외 (2002) Nucleic Acids Res. 30:e29; Chen and Zhao (2005) Nucleic Acids Res 33:e154; WO 2005/105989; WO 2003/078619; WO 2006/097854; WO 2006/097853; WO 2006/097784; 및 WO 2004/031346 (이의 각각은 모든 목적을 위하여 이의 전체내용이 참조로 본원에 편입됨).
하기를 포함하는 임의의 메가뉴클레아제가 사용될 수 있다: 예를 들어, I-SceI, I-SceII, I-SceIII, I-SceIV, I-SceV, I-SceVI, I-SceVII, I-CeuI, I-CeuAIIP, I-CreI, I-CrepsbIP, I-CrepsbIIP, I-CrepsbIIIP, I-CrepsbIVP, I-TliI, I-PpoI, PI-PspI, F-SceI, F-SceII, F-SuvI, F-TevI, F-TevII, I-AmaI, I-AniI, I-ChuI, I-CmoeI, I-CpaI, I-CpaII, I-CsmI, I-CvuI, I-CvuAIP, I-DdiI, I-DdiII, I-DirI, I-DmoI, I-HmuI, I-HmuII, I-HsNIP, I-LlaI, I-MsoI, I-NaaI, I-NanI, I-NcIIP, I-NgrIP, I-NitI, I-NjaI, I-Nsp236IP, I-PakI, I-PboIP, I-PcuIP, I-PcuAI, I-PcuVI, I-PgrIP, I-PobIP, I-PorI, I-PorIIP, I-PbpIP, I-SpBetaIP, I-ScaI, I-SexIP, I-SneIP, I-SpomI, I-SpomCP, I-SpomIP, I-SpomIIP, I-SquIP, I-Ssp6803I, I-SthPhiJP, I-SthPhiST3P, I-SthPhiSTe3bP, I-TdeIP, I-TevI, I-TevII, I-TevIII, I-UarAP, I-UarHGPAIP, I-UarHGPA13P, I-VinIP, I-ZbiIP, PI-MtuI, PI-MtuHIP PI-MtuHIIP, PI-PfuI, PI-PfuII, PI-PkoI, PI-PkoII, PI-Rma43812IP, PI-SpBetaIP, PI-SceI, PI-TfuI, PI-TfuII, PI-ThyI, PI-TliI, PI-TliII, 또는 이의 임의의 활성 변이체 또는 단편.
메가뉴클레아제는, 예를 들어, 12 내지 40 염기쌍의 이중-가닥 DNA 서열을 인식할 수 있다. 일부 경우에서, 메가뉴클레아제는 게놈 내에 완벽하게 매칭된 하나의 표적 서열을 인식한다.
일부 메가뉴클레아제는 귀소(homimg) 뉴클레아제이다. 귀소 뉴클레아제의 일 유형은, 예를 들어, I-SceI, I-CreI, 및 I-Dmol을 포함하는 귀소 뉴클레아제의 LAGLIDADG 계열이다.
적합한 뉴클레아제 제제는 또한, 유형 I, 유형 Ⅱ, 유형 Ⅲ, 및 유형 IV 엔도뉴클레아제를 포함하는 제한 엔도뉴클레아제를 포함한다. 유형 I 및 유형 Ⅲ 제한 엔도뉴클레아제는, 특정 인식 서열을 인식하지만, 절단 부위 (인식 서열)로부터 떨어져 있는 수백개 염기쌍일 수 있는 뉴클레아제 결합 부위의 가변 위치에서 전형적으로 절단된다. 유형 Ⅱ 시스템에서, 제한 활성은 임의의 메틸화효소 활성에 독립적이고, 절단은 전형적으로 결합 부위 내부 또는 그 근처 특정 부위에서 발생한다. 대부분의 유형 Ⅱ 효소는 회문 서열(palindromic sequence)을 절단한다. 그러나, 유형 Ⅱa 효소는 비-회문성 인식 서열을 인식하고 인식 서열의 외부를 절단하고, 유형 Ⅱb 효소는 인식 서열의 외부 양쪽 부위에 대해 2회 서열을 절단하고, 유형 Ⅱs 효소는 비대칭 인식 서열을 인식하여 한쪽에서 그리고 인식 서열로부터 약 1-20 뉴클레오타이드의 한정된 거리에서 절단한다. 유형 IV 제한 효소는 메틸화된 DNA를 표적화한다. 제한 효소는, 예를 들어, 하기에서 추가로 기술되고, REBASE 데이터베이스 [rebase.neb.com; Roberts 외 (2003) Nucleic Acids Res . 31:418-420; Roberts 외 (2003) Nucleic Acids Res . 31:1805-1812; 및 Belfort 외 (2002) in Mobile DNA II, pp. 761-783, Eds. Craigie 외, (ASM Press, Washington, DC)에서의 웹페이지 (이는 모든 목적을 위하여 그 전체내용이 참고로 본원에 편입됨)]에서 분류된다.
본원에 기술된 방법 및 조성물에서 사용하기 위한 다른 적합한 뉴클레아제 제제는, 본원에서 다른 곳에 기술된 CRISPR-Cas 시스템을 포함한다.
뉴클레아제 제제는 본 분야에 공지된 임의의 수단에 의하여 세포로 도입될 수 있다. 뉴클레아제 제제를 암호화하는 폴리펩타이드는 세포로 직접적으로 도입될 수 있다. 대안적으로, 뉴클레아제 제제를 암호화하는 폴리뉴클레오타이드는 세포로 도입될 수 있다. 뉴클레아제 제제를 암호화하는 폴리뉴클레오타이드가 세포로 도입될 경우, 뉴클레아제 제제는 세포 내에서 일시적으로, 조건적으로, 또는 항시적으로 발현될 수 있다. 예를 들어, 뉴클레아제 제제를 암호화하는 폴리뉴클레오타이드는 발현 카세트 내 함유될 수 있으며, 그리고 조건적 프로모터, 유도성 프로모터, 항시적 프로모터, 또는 조직-특이적 프로모터에 작동가능하게 연결될 수 있다. 상기 프로모터는 본원의 다른 곳에 추가로 상세히 논의되어 있다. 대안적으로, 뉴클레아제 제제는, 뉴클레아제 제제를 암호화하는 mRNA로서 세포로 도입될 수 있다.
뉴클레아제 제제를 암호화하는 폴리뉴클레오타이드는 세포의 게놈 내에 안정적으로 통합될 수 있고, 그리고 세포 내 활성인 프로모터에 작동가능하게 연결될 수 있다. 대안적으로, 뉴클레아제 제제를 암호화하는 폴리뉴클레오타이드는, 삽입 폴리뉴클레오타이드를 포함하는 표적화 벡터와 분리된, 벡터 또는 플라스미드 내에서, 또는 표적화 벡터 내에서 존재할 수 있다.
뉴클레아제 제제가 뉴클레아제 제제를 암호화하는 폴리뉴클레오타이드의 도입을 통하여 세포에 제공될 경우, 뉴클레아제 제제를 암호화하는 상기 폴리뉴클레오타이드는, 뉴클레아제 제제를 암호화하는 천연 발생적 폴리뉴클레오타이드 서열과 비교하여, 관심 세포 내에서 더 높은 빈도로 사용되는 코돈을 대체하도록 변형될 수 있다. 예를 들어, 뉴클레아제 제제를 암호화하는 폴리뉴클레오타이드는, 천연 발생적 폴리뉴클레오타이드 서열에 비교된 경우, 박테리아 세포, 효모 세포, 인간 세포, 비-인간 세포, 포유동물 세포, 설치류 세포, 마우스 세포, 랫트 세포, 또는 관심의 임의의 다른 숙주 세포를 포함하는, 소정의 관심 원핵 또는 진핵 세포에서 더 높은 빈도로 사용되는 코돈을 대체하도록 변형될 수 있다.
C. CRISPR - Cas 시스템
본 명세서에서 개시된 방법은 세포 내에서 게놈을 변형시키기 위해 규칙적으로 무리를 이룬 산재된 짧은 회문성 반복부 (Clustered Regularly Interspersed Short Palindromic Repeats, CRISPR)/CRISPR-관련된 (Cas) 시스템, 또는 그와 같은 시스템의 구성 요소를 이용한다. CRISPR-Cas 시스템은 Cas 유전자의 발현에서 관여된, 또는 상기의 활성을 유도하는 전사체 및 다른 요소를 포함한다. CRISPR-Cas 시스템은 유형 I, 유형 Ⅱ, 또는 유형 Ⅲ 시스템일 수 있다. 대안적으로 CRISPR/Cas 시스템은, 예를 들어, 유형 V 시스템 (예를 들면, 하위유형 V-A 또는 하위유형 V-B)일 수 있다. 본 명세서에서 개시된 방법 및 조성물은 핵산의 부위-지향된 절단을 위하여 (Cas 단백질과 복합체화된 가이드 RNA (gRNA)를 포함하는) CRISPR 복합체를 이용함으로서 CRISPR-Cas 시스템을 이용할 수 있다.
본 명세서에서 개시된 방법에서 사용된 CRISPR-Cas 시스템은 비-천연 발생의 것이다. "비-천연 발생" 시스템은 사람의 손의 관여를 표시하는 것, 예컨대 이의 천연 발생적 상태로부터 변경 또는 돌연변이화되거나, 또는 이들이 사실상 자연적으로 관련되는 적어도 하나의 다른 성분을 적어도 실질적으로 포함하지 않거나, 또는 이들이 자연적으로 관련되지 않는 적어도 하나의 다른 성분과 관련되는 시스템의 하나 이상의 구성 요소를 포함한다. 예를 들어, 일부 CRISPR-Cas 시스템은 자연적으로 함께 발생하지 않는 Cas 단백질 및 gRNA를 포함하는 비-천연 발생적 CRISPR 복합체를 사용한다.
(1) Cas 단백질
Cas 단백질은 일반적으로 가이드 RNA (gRNA, 아래에 더 상세히 기재됨)과 상호작용할 수 있는 적어도 하나의 RNA 인식 또는 결합 도메인을 포함한다. Cas 단백질은 뉴클레아제 도메인 (예를 들면, DNase 또는 RNase 도메인), DNA 결합 도메인, 헬리카제 도메인, 단백질-단백질 상호작용 도메인, 이량체화 도메인, 및 다른 도메인을 또한 포함할 수 있다. 뉴클레아제 도메인은, 핵산 분자의 공유결합의 파손을 포함하는, 핵산 절단을 위한 촉매 활성을 보유한다. 절단은 블런트 말단 또는 엇갈린 말단을 생산할 수 있고, 이는 단일-가닥 또는 이중-가닥일 수 있다. 예를 들어, 야생형 Cas9 단백질은 전형적으로 블런트 절단 생성물을 형성할 것이다. 대안적으로, 야생형 Cpf1 단백질 (예를 들면, FnCpf1)은 비-표적화된 가닥에서 PAM 서열로부터 18번째 염기 쌍 이후, 및 표적화된 가닥에서 23번째 염기 이후에 발생하는 절단으로, 5-뉴클레오타이드 5' 돌출부를 가진 절단 생성물을 초래할 수 있다. Cas 단백질은 Fbn1 유전자에서 이중-가닥 파단 (예컨대, 블런트 말단을 갖는 이중-가닥 파단)을 형성하는 전체 절단 활성을 가질 수 있거나, 또는 이는 Fbn1 유전자 내 단일-가닥 절단을 형성하는 틈내기효소일 수 있다.
Cas 단백질의 예시는 하기를 포함한다: Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas5e (CasD), Cas6, Cas6e, Cas6f, Cas7, Cas8a1, Cas8a2, Cas8b, Cas8c, Cas9 (Csn1 또는 Csx12), Cas10, Casl0d, CasF, CasG, CasH, Csy1, Csy2, Csy3, Cse1 (CasA), Cse2 (CasB), Cse3 (CasE), Cse4 (CasC), Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1 , Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4, 및 Cu1966, 및 이의 동족체 또는 변형된 버전.
바람직하게는, Cas 단백질은 Cas9 단백질 또는 유형 Ⅱ CRISPR-Cas 시스템 유래의 Cas9 단백질로부터 유도된 것이다. Cas9 단백질은 유형 Ⅱ CRISPR-Cas 시스템으로부터이고 전형적으로 보존된 구조를 가진 4 핵심 모티프를 공유한다. 모티프 1, 2, 및 4는 RuvC-유사 모티프이고, 모티프 3은 HNH 모티프이다. 예시적 Cas9 단백질은 스트렙토코커스 파이오제네스 , 스트렙토코커스 써모필러스 , 스트렙토코커스 종, 스타필로코쿠스 아우레우스 , 노카르디옵시스 다손빌레이 , 스트렙토마이세스 프리스티나에스피랄리스 , 스트렙토마이세스 비리도크로모게네스 , 스트렙토마이세스 비리도크로모게네스, 스트렙토스포랑기움 로세움 , 스트렙토스포랑기움 로세움 , 알리시클로바실러스 아시도칼다리우스 , 바실러스 슈도마이코이데스 , 바실러스 셀레니티레두센스 , 엑시구오박테리움 시비리쿰 , 락토바실러스 델부르에키 , 락토바실러스 살리바리우스 , 미크로스킬라 마리나, 부르크홀데리아레스 박테리아, 폴라로모나스 나프탈레니보란스 , 폴라로모나스 종, 크로코스파에라 왓소니 , 사이아노테세 종, 미크로시스티스 애루기노사 , 시네코코커스 종, 아세토할로비움 아라바티쿰 , 암모니펙스 데겐시 , 칼디셀룰로시럽토르 베시이 , 칸디다투스 데술포루디스 , 클로스트리디움 보툴리눔, 클로스트리디움 디피실 , 피네골디아 마그나 , 나트라나에로비우스 써모필러스 , 펠로토마쿨럼 써모프로피오니쿰 , 아시디티오바실러스 칼두스 , 아시디티오바실러스 페록시단스 , 알로크로마티움 비노숨 , 마리노박테르 종, 니트로소코커스 할로필러스 , 니트로소코커스 왓소니 , 슈도알테로모나스 할로플랑크티스 , 크테도노박테르 라세미페르 , 메타노할로비움 에베스티가툼 , 아나베나 배리아빌리스 , 노둘라리아 스푸미게나 , 노스톡 종, 아르트로스피라 맥시마, 아르트로스피라 플라텐시스 , 아르트로스피라 종, 린그바이아 종, 미크로콜레우스 크토노플라스테스 , 오실라토리아 종, 페트로토가 모빌리스, 써모시포 아프리카누스, 또는 아카리오클로리스 마리나 유래의 것이다. Cas9 계열 일원의 추가의 예는, 모든 목적을 위하여 그 전체가 참고로 본 명세서에서 편입된, WO 2014/131833에서 기재된다. S . 파이오제네스 유래의 Cas9 (SwissProt 수탁 번호 Q99ZW2로 할당됨)는 바람직한 효소이다. S . 아우레우스 유래의 Cas9 (UniProt 수탁 번호 J7RUA5로 할당됨)는 또 다른 바람직한 효소이다.
Cas 단백질의 또 다른 예시는 Cpf1 (프레보텔라프란시셀라 1 유래의 CRISPR) 단백질이다. Cpf1은 Cas9의 특징적인 아르기닌-풍부 클러스터에 대응물과 함께 Cas9의 상응하는 도메인에 상동성인 RuvC-유사 뉴클레아제 도메인을 함유하는 큰 단백질 (약 1300 아미노산)이다. 하지만, Cpf1은 Cas9 단백질에서 존재하는 HNH 뉴클레아제 도메인이 결핍되고, RuvC-유사 도메인은, HNH 도메인을 포함하는 긴 삽입물을 함유하는 Cas9와는 대조적으로, Cpf1 서열에서 연속성이다. 참고: 예컨대, Zetsche 외 (2015) Cell 163(3):759-771 (이는 모든 목적을 위하여 그 전체내용이 참고로 본원에 편입됨). 예시적 Cpf1 단백질은 프란시셀라 툴라렌시스 1, 프란시셀라 툴라렌시스 아종 노비시다, 프레보텔라 알벤시스 , 라크노스피라세 박테리아 MC2017 1, 부티리비브리오 프로테오클라스티쿠스 , 페레그리니박테리아 박테리아 GW2011_ GWA2 _33_10, 파르쿠박테리아 박테리아 GW2011_ GWC2 _44_17, 스미텔라 SCADC , 아시다미노코쿠스 BV3L6 , 라크노스피라세 박테리아 MA2020, 칸디다투스 메타노플라스마 테르미툼 , 유박테리움 엘리겐스 , 모락셀라 보보쿨리 237, 렙토스피라 이나다이 , 라크노스피라세 박테리아 ND2006, 포르피로모나스 크레비오리카니스 3, 프레보텔라 디시엔스, 및 포르피로모나스 마카카에 유래의 것이다. 프란시셀라 노비시다 U112 유래의 Cpf1 (FnCpf1; UniProt 수탁 번호 A0Q7Q2)은 바람직한 효소이다.
Cas 단백질은 야생형 단백질 (즉, 자연에서 발생하는 것), 변형된 Cas 단백질 (즉, Cas 단백질 변이체), 또는 야생형 또는 변형된 Cas 단백질의 단편일 수 있다. Cas 단백질은 또한 야생형 또는 변형된 Cas 단백질의 활성 변이체 또는 단편일 수 있다. 활성 변이체 또는 단편은 야생형 또는 변형된 Cas 단백질 또는 이의 일부에 적어도 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성을 포함할 수 있고, 여기서 상기 활성 변이체는 원하는 절단 부위에서 절단하는 능력을 유지하고, 따라서 틈-유도 또는 이중-가닥-파단-유도 활성을 유지한다. 틈-유도 또는 이중-가닥-파단-유도 활성을 위한 에세이는 공지되어 있고, 일반적으로 절단 부위를 함유하는 DNA 기질에 대한 Cas 단백질의 전체적인 활성 및 특이성을 측정한다.
Cas 단백질은 핵산 결합 친화도, 핵산 결합 특이성, 및 효소적 활성 중 하나 이상을 증가 또는 감소시키도록 변형될 수 있다. Cas 단백질은 또한 단백질의 임의의 다른 활성 또는 특성, 예컨대 안정성을 변화시키도록 변형될 수 있다. 예를 들어, Cas 단백질의 하나 이상의 뉴클레아제 도메인은 변형, 결실, 또는 불활성화될 수 있거나, Cas 단백질은 단백질의 기능에 필수적이지 않은 도메인을 제거하거나, 또는 Cas 단백질의 활성을 최적화 (예를 들면, 증진 또는 감소)시키기 위해 절단될 수 있다.
Cas 단백질은 적어도 하나의 뉴클레아제 도메인, 예컨대 DNase 도메인을 포함할 수 있다. 예를 들어, 야생형 Cpf1 단백질은 일반적으로, 표적 DNA의 양쪽 가닥을 절단시키는 RuvC-유사 도메인을 아마도 이량체성 구조로 포함한다. Cas 단백질은 적어도 2개의 뉴클레아제 도메인, 예컨대 DNase 도메인을 포함한다. 예를 들어, 야생형 Cas9 단백질은 일반적으로 RuvC-유사 뉴클레아제 도메인 및 HNH-유사 뉴클레아제 도메인을 포함한다. RuvC 및 HNH 도메인은 DNA에서 이중-가닥 파단을 만들기 위해 이중-가닥 DNA의 상이한 가닥을 각각 절단할 수 있다. 참고: 예컨대, Jinek 외 (2012) Science 337:816-821 (이는 모든 목적을 위하여 그 전체내용이 참고로 본원에 편입됨).
뉴클레아제 도메인의 한쪽 또는 양쪽은 이들이 더 이상 기능적이지 않거나 또는 감소된 뉴클레아제 활성을 갖도록 결실 또는 돌연변이화될 수 있다. 뉴클레아제 도메인 중 하나가 결실 또는 돌연변이화되면, 생성되는 Cas 단백질 (예를 들면, Cas9)는 틈내기효소로서 지칭될 수 있고, 이중-가닥 파단이 아닌 이중-가닥 DNA 이₃내부 가이드 RNA 인식 서열에서 단일-가닥 절단을 생성할 수 있다 (즉, 이는 양쪽 가닥이 아닌, 상보성 가닥 또는 비-상보성 가닥을 절단할 수 있다). 뉴클레아제 도메인의 양쪽이 결실 또는 돌연변이화되면, 생성되는 Cas 단백질 (예를 들면, Cas9)는 이중-가닥 DNA (예를 들면, 뉴클레아제-무효(null) Cas 단백질)의 양쪽 가닥을 절단시키는 능력이 감소할 것이다. Cas9를 틈내기효소로 전환시키는 돌연변이의 예는, S. 파이오제네스 유래 Cas9의 RuvC 도메인에서 D10A (Cas9의 위치 10에서 아스파르테이트부터 알라닌으로의) 돌연변이이다. 마찬가지로, S. 파이오제네스 유래 Cas9의 HNH 도메인 내 H939A (아미노산 위치 839에서 히스티딘으로부터 알라닌으로), 또는 H840A (아미노산 위치 840에서 히스티딘으로부터 알라닌으로)는 Cas9를 틈내기효소로 전환할 수 있다. Cas9를 틈내기효소로 전환시키는 돌연변이의 다른 예는, S. 써모필러스 유래 Cas9에 대해서도 상응하는 돌연변이를 포함한다. 참고: 예컨대, Sapranauskas 외 (2011) Nucleic Acids Research 39:9275-9282 및 WO 2013/141680 (이는 모든 목적을 위하여 그 전체내용이 참고로 본원에 편입됨). 그와 같은 돌연변이는 방법, 예컨대 부위-지향된 돌연변이생성, PCR-매개된 돌연변이생성, 또는 총 유전자 합성을 사용하여 생성될 수 있다. 틈내기효소를 형성하는 다른 돌연변이의 예는, 예를 들어, 이들의 각각이 모든 목적을 위하여 그 전체가 참고로 본 명세서에서 편입되는, WO 2013/176772 및 WO 2013/142578에서 발견될 수 있다.
Cas 단백질은 또한 융합 단백질로서 이종성 폴리펩타이드에 작동가능하게 연결될 수 있다. 예를 들어, Cas 단백질은 절단 도메인, 후성적 변형 도메인, 전사 활성화 도메인, 또는 전사 억제인자 도메인에 융합될 수 있다. 참고: WO 2014/089290 (이는 모든 목적을 위하여 그 전체내용이 참고로 본원에 편입됨). Cas 단백질은 또한 이종 폴리펩타이드에 융합되어, 증가된 또는 감소된 안정성을 제공할 수 있다. 융합된 도메인 또는 이종 폴리펩타이드는 N-말단, C-말단, 또는 Cas 단백질 내에 내부적으로 위치될 수 있다.
Cas 융합 단백질의 예는 세포내 국재화를 제공하는 이종 폴리펩타이드에 융합된 Cas 단백질이다. 그와 같은 이종성 폴리펩타이드는, 예를 들어, 하나 이상의 핵 국재화 신호 (NLS), 예컨대 핵에 표적화하는 SV40 NLS, 미토콘드리아에 표적화하기 위한 미토콘드리아 국재화 신호, ER 유지 신호 등을 포함할 수 있다. 참고: 예컨대, Lange 외 (2007) J. Biol . Chem . 282:5101-5105 (이는 모든 목적을 위하여 그 전체내용이 참고로 본원에 편입됨). 그와 같은 세포내 국재화 신호는 N-말단, C-말단, 또는 Cas 단백질 이내 어디든지 위치될 수 있다. NLS는 염기성 아미노산의 연신부를 포함할 수 있고, 단일분절 서열 또는 이중분절 서열을 포함할 수 있다.
Cas 단백질은 또한 세포-관통 도메인에 작동가능하게 연결될 수 있다. 예를 들어, 세포-관통 도메인은 HIV-1 TAT 단백질, 인간 B형 간염 바이러스 유래의 TLM 세포-관통 모티프, MPG, Pep-1, VP22, 단순 포진 바이러스 유래의 세포 관통 펩타이드, 또는 폴리아르기닌 펩타이드 서열로부터 유래될 수 있다. 참고: 예컨대, WO 2014/089290 (이는 모든 목적을 위하여 그 전체내용이 참고로 본원에 편입됨). 세포-투과 도메인은 N-말단, C-말단, 또는 Cas 단백질 내부 어딘가에 위치할 수 있다.
Cas 단백질은 또한 추적 또는 정제의 편이성을 위하여 이종성 폴리펩타이드, 예컨대 형광 단백질, 정제 태그, 또는 에피토프 태그에 작동가능하게 연결될 수 있다. 형광 단백질의 예는 하기를 포함한다: 녹색 형광 단백질 [예를 들면, GFP, GFP-2, tagGFP, turboGFP, eGFP, 에메랄드(Emerald), 아자미 그린(Azami Green), 단량체 아자미 그린, CopGFP, AceGFP, ZsGreenl], 황색 형광 단백질 [예를 들면, YFP, eYFP, 시트린(Citrine), 베누스(Venus), YPet, PhiYFP, ZsYellowl], 청색 형광 단백질 [예를 들면 eBFP, eBFP2, 아주라이트(Azurite), mKalamal, GFPuv, 사파이어(Sapphire), T-사파이어(T-Sapphire)], 청록색 형광 단백질 [예를 들면 eCFP, 세룰리안(Cerulean), CyPet, AmCyanl, 미도리시-시안(Midoriishi-Cyan)], 적색 형광 단백질 (mKate, mKate2, mPlum, DsRed 단량체, mCherry, mRFP1, DsRed-Express, DsRed2, DsRed-Monomer, HcRed-Tandem, HcRedl, AsRed2, eqFP611, mRaspberry, mStrawberry, Jred), 오렌지색 형광 단백질 [mOrange, mKO, 쿠사비라-오렌지(Kusabira-Orange), 단량체 쿠사비라-오렌지, mTangerine, tdTomato], 및 임의의 다른 적합한 형광 단백질. 태그의 예는 하기를 포함한다: 글루타티온-S-전달효소 (GST), 키틴 결합 단백질 (CBP), 말토스 결합 단백질, 티오레독신 (TRX), 폴리(NANP), 직렬 친화도 정제 (TAP) 태그, myc, AcV5, AU1, AU5, E, ECS, E2, FLAG, 혈구응집소 (HA), nus, Softag 1, Softag 3, Strep, SBP, Glu-Glu, HSV, KT3, S, S1, T7, V5, VSV-G, 히스티딘 (His), 비오틴 카르복실 담체 단백질 (BCCP), 및 칼모둘린.
Cas9 단백질은 또한 외인성 수선 주형 또는 표지된 핵산에 결박될 수 있다(tethered). 그와 같은 결박 (즉, 물리적 연결)은 공유적 상호작용 또는 비공유적 상호작용을 통해 달성될 수 있고, 결박은 (예를 들면, 단백질에서 시스테인 또는 라이신 잔기의 변형 또는 인테인 변형에 의해 달성될 수 있는, 직접적인 융합 또는 화학적 콘주게이션을 통해) 직접적으로 이루어질 수 있거나, 또는 하나 이상의 개재 링커 또는 어댑터 분자, 예컨대 스트렙타비딘 또는 압타머를 통해 달성될 수 있다. 참고: 예컨대, Pierce 외 (2005) Mini Rev . Med . Chem . 5(1):41-55; Duckworth 외 (2007) Angew . Chem . Int . Ed . Engl . 46(46):8819-8822; Schaeffer and Dixon (2009) Australian J. Chem . 62(10):1328-1332; Goodman 외 (2009) Chembiochem. 10(9):1551-1557; 및 Khatwani 외 (2012) Bioorg . Med . Chem . 20(14):4532-4539 (이들의 각각은 모든 목적을 위하여 그 전체가 참고로 본 명세서에서 편입됨). 단백질-핵산 콘주게이트 합성을 위한 비공유적 전략은, 비오틴-스트렙타비딘 및 니켈-히스티딘 방법을 포함한다. 공유적 단백질-핵산 콘주게이트는 다양한 화학 물질을 사용하여 적절하게 관능화된 핵산 및 단백질을 연결시킴으로써 합성될 수 있다. 이들 화학성질의 일부는 단백질 표면 상의 아미노산 잔기 (예를 들면, 라이신 아민 또는 시스테인 티올)에 대한 올리고뉴클레오타이드의 직접적인 부착을 포함하나, 반면 다른 더욱 복잡한 전략은 단백질의 번역후 변형, 또는 촉매적 또는 반응성 단백질 도메인의 관여를 요구한다. 핵산에 대한 단백질의 공유적 부착 방법은, 예를 들어, 올리고뉴클레오타이드의 단백질 라이신 또는 시스테인 잔기로의 화학적 가교결합, 발현된 단백질-라이게이션, 화학효소적 방법, 및 광압타머의 사용을 포함할 수 있다. 외인성 수선 주형 또는 표지된 핵산은 C-말단, N-말단, 또는 Cas9 단백질 내의 내부 영역에 결박될 수 있다. 바람직하게는, 외인성 수선 주형 또는 표지된 핵산은 Cas9 단백질의 C-말단 또는 N-말단에 결박된다. 마찬가지로, Cas9 단백질은 외인성 수선 주형 또는 표지된 핵산의 5' 말단, 3' 말단, 또는 그 내부 영역에 결박될 수 있다. 즉, 외인성 수선 주형 또는 표지된 핵산은 임의의 배향 및 극성으로 결박될 수 있다. 바람직하게는, Cas9 단백질은 외인성 수선 주형 또는 표지된 핵산의 5' 말단 또는 3' 말단에 결박된다.
Cas 단백질은 임의의 형태로 제공될 수 있다. 예를 들어, Cas 단백질은 단백질, 예컨대 gRNA과 복합체를 이룬 Cas 단백질의 형태로 제공될 수 있다. 대안적으로, Cas 단백질은 Cas 단백질을 암호화하는 핵산, 예컨대 RNA [예를 들면, 메신저 RNA (mRNA)] 또는 DNA의 형태로 제공될 수 있다. 선택적으로, Cas 단백질을 암호화하는 핵산은 특정 세포 또는 유기체에서 단백질로 효율적으로 번역되기 위해 최적화된 코돈일 수 있다. 예를 들어, Cas 단백질을 암호화하는 핵산은, 천연 발생적 폴리뉴클레오타이드 서열에 비해, 박테리아 세포, 효모 세포, 인간 세포, 비-인간 세포, 포유동물 세포, 설치류 세포, 마우스 세포, 랫트 세포, 또는 임의의 다른 관심 숙주 세포에서 더 높은 빈도로 사용되는 코돈을 대체하도록 변형될 수 있다. Cas 단백질을 암호화하는 핵산이 세포에 도입되는 경우, Cas 단백질은 세포에서 일시적으로, 조건적으로, 또는 항시적으로 발현될 수 있다.
Cas 단백질을 암호화하는 핵산은 세포의 게놈에 안정적으로 통합될 수 있고, 세포에서 활성인 프로모터에 작동가능하게 연결될 수 있다. 대안적으로, Cas 단백질을 암호화하는 핵산은 발현 작제물에서 프로모터에 작동가능하게 연결될 수 있다. 발현 작제물은 관심의 유전자 또는 다른 핵산 서열 (예를 들면, Cas 유전자)의 발현을 유도할 수 있는 임의의 핵산 작제물을 포함하며, 이는 표적 세포에 상기 관심 핵산 서열을 전달할 수 있다. 예를 들어, Cas 단백질을 암호화하는 핵산은 핵산 삽입물을 포함하는 표적화 벡터, 및/또는 gRNA를 암호화하는 DNA를 포함하는 벡터 내 존재할 수 있다. 대안적으로, 핵산 삽입물을 포함하는 표적화 벡터와는 별개이고, 및/또는 gRNA를 암호화하는 DNA를 포함하는 벡터와는 별개인 벡터 또는 플라스미드 내에 존재할 수 있다. 발현 작제물에서 사용될 수 있는 프로모터는, 예를 들어, 진핵 세포, 인간 세포, 비-인간 세포, 포유동물 세포, 비-인간 포유동물 세포, 설치류 세포, 마우스 세포, 랫트 세포, 햄스터 세포, 토끼 세포, 만능 세포, 배아 줄기 (ES) 세포, 또는 접합체 중 하나 이상에서 활성인 프로모터를 포함한다. 그와 같은 프로모터는, 예를 들어, 조건적 프로모터, 유도성 프로모터, 항시적 프로모터, 또는 조직-특이적 프로모터일 수 있다. 선택적으로, 프로모터는 일 방향으로는 Cas 단백질의 발현을, 그리고 다른 방향으로는 가이드 RNA의 발현을 모두 유도하는 양방향성 프로모터일 수 있다. 그와 같은 양방향성 프로모터는 (1) 3 외부 조절 요소: 원위 서열 요소 (DSE), 근위 서열 요소 (PSE), 및 TATA 박스를 함유하는 완전한 종래의 일방향 Pol III 프로모터; 및 (2) 역방향 배향으로 DSE의 5′ 말단에 융합된 PSE 및 TATA 박스를 포함하는 제2 염기성 Pol III 프로모터로 구성될 수 있다. 예를 들어, H1 프로모터에서, DSE는 PSE 및 TATA 박스에 인접하고, 프로모터는 역방향 전사가 U6 프로모터로부터 유래된 PSE 및 TATA 박스를 첨부시킴으로써 조절되는 혼성 프로모터 형성에 의해 양방향성으로 만들어질 수 있다. 참고: 예컨대, US 2016/0074535 (이는 모든 목적을 위하여 그 전체내용이 참고로 본원에 편입됨). Cas 단백질 및 가이드 RNA를 동시에 암호화하는 유전자를 발현시키기 위한 양방향성 프로모터의 사용은 전달을 용이하게 하기 위해 압축 발현 카세트의 생성을 허용한다.
(2) 가이드 RNA
"가이드 RNA" 또는 "gRNA"는, Cas 단백질 (예를 들면, Cas9 단백질)에 결합하고, 그리고 표적 DNA (예컨대, Fbn1 유전자) 내 특정 위치에 Cas 단백질을 표적화하는, RNA 분자이다. 가이드 RNA는 하기와 같은 2개 분절을 포함할 수 있다: "DNA-표적화 분절" 및 "단백질-결합 분절". "절편"은 분자의 절편 또는 영역, 예컨대, RNA 내 뉴클레오타이드의 인접 연신부를 포함한다. 일부 gRNA는 2개의 별개의 RNA 분자: "활성인자-RNA" (예를 들면, tracrRNA) 및 "표적화인자-RNA" (예를 들면, CRISPR RNA 또는 crRNA)를 포함할 수 있다. 다른 gRNA는, 또한 "단일-분자 gRNA," "단일-가이드 RNA," 또는 "sgRNA"로 지칭될 수 있는, 단일 RNA 분자 (단일 RNA 폴리뉴클레오타이드)이다. 참고: 예컨대, WO 2013/176772, WO 2014/065596, WO 2014/089290, WO 2014/093622, WO 2014/099750, WO 2013/142578, 및 WO 2014/131833 (이의 각각은 모든 목적을 위하여 그 전체내용이 참고로 본원에 편입됨). Cas9에 대하여, 예를 들어, 단일-가이드 RNA는 (예를 들면, 링커를 통해) tracrRNA에 융합된 crRNA를 포함할 수 있다. Cpf1에 대하여, 예를 들어, 단지 crRNA는 절단을 달성하는데 필요하다. 용어 "가이드 RNA" 및 "gRNA"는 이중-분자 gRNA 및 단일 분자 gRNA 둘 다를 포함한다.
예시적 2-분자 gRNA는 crRNA-유사 ("CRISPR RNA" 또는 "표적화인자-RNA" 또는 "crRNA" 또는 "crRNA 반복부") 분자, 및 상응하는 tracrRNA-유사 ("트랜스-작용 CRISPR RNA" 또는 "활성제-RNA" 또는 "tracrRNA" 또는 "스캐폴드") 분자를 포함한다. crRNA는 gRNA의 DNA-표적화 분절 (단일-가닥), 및 gRNA의 단백질-결합 분절의 dsRNA 이중나선의 이분의 일을 형성하는 뉴클레오타이드의 연신부를 모두 포함한다.
상응하는 tracrRNA (활성인자-RNA)는 gRNA의 단백질-결합 분절의 dsRNA 이중나선의 다른 절반을 형성하는 뉴클레오타이드의 연신부를 포함한다. crRNA의 뉴클레오타이드의 연신부는, gRNA의 단백질-결합 도메인의 dsRNA 이중나선을 형성하기 위해, tracrRNA의 뉴클레오타이드의 연신부에 상보적이며 이와 혼성화된다. 이와 같이, 각각의 crRNA는 상응하는 tracrRNA를 갖는다고 언급될 수 있다.
crRNA 및 상응하는 tracrRNA는 gRNA를 형성하도록 혼성화된다. 단지 crRNA가 필요한 시스템에서, crRNA는 gRNA일 수 있다. crRNA는 추가적으로 가이드 RNA 인식 서열에 혼성화되는 단일-가닥 DNA-표적화 분절을 제공한다. 세포 이내 변형을 위하여 사용되는 경우, 소정의 crRNA 또는 tracrRNA 분자의 정확한 서열은 RNA 분자가 사용될 종에 특이적이도록 설계될 수 있다. 참고: 예컨대, Mali 외 (2013) Science 339:823-826; Jinek 외 (2012) Science 337:816-821; Hwang 외 (2013) Nat. Biotechnol . 31:227-229; Jiang 외 (2013) Nat. Biotechnol. 31:233-239; 및 Cong 외 (2013) Science 339:819-823 (이는 모든 목적을 위하여 그 전체내용이 참고로 본원에 편입됨).
소정의 gRNA의 DNA-표적화 분절 (crRNA)는 표적 DNA에서 서열에 상보성인 뉴클레오타이드 서열 (즉, 가이드 RNA 인식 서열)을 포함한다. gRNA의 DNA-표적화 분절은 혼성화 (즉, 염기 쌍형성)를 통해 서열-특이적 방식으로 표적 DNA (예컨대, Fbn1 유전자)와 상호작용한다. 이와 같이, DNA-표적화 분절의 뉴클레오타이드 서열은 다양할 수 있고, gRNA 및 표적 DNA가 상호작용할 표적 DNA 내에 위치를 결정할 수 있다. 피험체 gRNA의 DNA-표적화 분절은 표적 DNA 내 임의의 원하는 서열에 혼성화되도록 변형될 수 있다. 천연 발생적 crRNA는, CRISPR/Cas 시스템 및 유기체에 따라 달라지지만, 종종 21 내지 46개 뉴클레오타이드 길이의 2개 직접 반복부 (DR)가 측접된, 21 내지 72개 뉴클레오타이드 길이의 표적화 분절을 종종 함유한다 (참고: 예컨대, WO 2014/131833 (이는 모든 목적을 위하여 그 전체내용이 참고로 본원에 편입됨)). S . 파이오제네스의 경우에서, DR은 36개 뉴클레오타이드 길이이며, 표적화 분절은 30개 뉴클레오타이드 길이이다. 3' 위치된 DR은, 상응하는 tracrRNA에 상보성이고 상기로 혼성화되고, 그 다음 Cas 단백질에 결합된다.
DNA-표적화 분절은 적어도 약 12개 뉴클레오타이드, 적어도 약 15개 뉴클레오타이드, 적어도 약 17개 뉴클레오타이드, 적어도 약 18개 뉴클레오타이드, 적어도 약 19개 뉴클레오타이드, 적어도 약 20개 뉴클레오타이드, 적어도 약 25개 뉴클레오타이드, 적어도 약 30개 뉴클레오타이드, 적어도 약 35개 뉴클레오타이드, 또는 적어도 약 40개 뉴클레오타이드의 길이를 가질 수 있다. 상기 DNA-표적화 분절은 약 12개 뉴클레오타이드 내지 약 100개 뉴클레오타이드, 약 12개 뉴클레오타이드 내지 약 80개 뉴클레오타이드, 약 12개 뉴클레오타이드 내지 약 50개 뉴클레오타이드, 약 12개 뉴클레오타이드 내지 약 40개 뉴클레오타이드, 약 12개 뉴클레오타이드 내지 약 30개 뉴클레오타이드, 약 12개 뉴클레오타이드 내지 약 25개 뉴클레오타이드, 또는 약 12개 뉴클레오타이드 내지 약 20개 뉴클레오타이드의 길이를 가질 수 있다. 예를 들어, DNA 표적화 분절은 약 15개 뉴클레오타이드 내지 약 25개 뉴클레오타이드 (예를 들면, 약 17개 뉴클레오타이드 내지 약 20개 뉴클레오타이드, 또는 약 17개 뉴클레오타이드, 약 18개 뉴클레오타이드, 약 19개 뉴클레오타이드, 또는 약 20개 뉴클레오타이드)일 수 있다. 참고: 예컨대, US 2016/0024523 (이는 모든 목적을 위하여 그 전체내용이 참고로 본원에 편입됨). S . 파이오제네스 유래의 Cas9에 대하여, 전형적인 DNA-표적화 분절은 16 내지 20개 뉴클레오타이드 길이, 또는 17 내지 20개 뉴클레오타이드 길이이다. S. 아우레우스 유래의 Cas9에 대하여, 전형적인 DNA-표적화 분절은 길이가 21 내지 23개 뉴클레오타이드 길이이다. Cpf1에 대하여, 전형적인 DNA-표적화 분절은 적어도 16개 뉴클레오타이드, 또는 길이 적어도 18개 뉴클레오타이드 길이이다.
TracrRNA는 임의의 형태 (예를 들면, 전장 tracrRNA, 또는 활성 부분적인 tracrRNA)일 수 있고, 그리고 가변하는 길이의 것일 수 있다. 이들은 일차 전사체 또는 가공된 형태를 포함할 수 있다. 예를 들어, (단일-가이드 RNA의 일부로서, 또는 2-분자 gRNA의 일부로서의 별개의 분자로서) tracrRNA는, 야생형 tracrRNA 서열의 전부 또는 일부 (예를 들면, 야생형 tracrRNA 서열의 약 20, 26, 32, 45, 48, 54, 63, 67, 85개 또는 그이상의 뉴클레오타이드)을 포함할 수 있거나, 상기로 구성될 수 있다. S. 파이오제네스 유래의 야생형 tracrRNA 서열의 예시는, 171-뉴클레오타이드, 89-뉴클레오타이드, 75-뉴클레오타이드, 및 65-뉴클레오타이드 버전을 포함한다. 참고: 예컨대, Deltcheva 외 (2011) Nature 471:602-607; WO 2014/093661 (이의 각각은 모든 목적을 위하여 그 전체내용이 참고로 본원에 편입됨). 단일-가이드 RNA (sgRNA) 이내 tracrRNA의 예는, sgRNA의 +48, +54, +67, 및 +85 버전 이내 발견된 tracrRNA 분절을 포함하고, 여기에서 "+n"는 야생형 tracrRNA의 최대 +n의 뉴클레오타이드가 sgRNA에서 포함되는 것을 나타낸다. 참고: US 8,697,359 (이는 모든 목적을 위하여 그 전체내용이 참고로 본원에 편입됨).
표적 DNA 이내 가이드 RNA 인식 서열과 DNA-표적화 서열 사이 상보성 백분율은, 적어도 60% (예를 들면, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100%)일 수 있다. 표적 DNA 이내 가이드 RNA 인식 서열과 DNA-표적화 서열 사이 상보성 백분율은, 약 20개 인접 뉴클레오타이드에 대해 적어도 60%일 수 있다. 예로서, 표적 DNA 이내 가이드 RNA 인식 서열과 DNA-표적화 서열 사이 상보성 백분율은, 표적 DNA의 상보성 가닥 이내 가이드 RNA 인식 서열의 5’말단에서 14개 인접 뉴클레오타이드에 대해서는 100%이고, 나머지에 대해서는 0%만큼 낮다. 그와 같은 경우에, DNA-표적화 서열은 14개 뉴클레오타이드 길이인 것으로 간주될 수 있다. 또 다른 예로서, 표적 DNA 이내 가이드 RNA 인식 서열과 DNA-표적화 서열 사이 상보성 백분율은, 표적 DNA의 상보성 가닥 이내 가이드 RNA 인식 서열의 5’말단에서 7개 인접 뉴클레오타이드에 대해서는 100%이고, 나머지에 대해서는 0%만큼 낮다. 그와 같은 경우에, DNA-표적화 서열은 7개 뉴클레오타이드 길이인 것으로 간주될 수 있다. 일부 가이드 RNA에서, DNA-표적 서열 이내 적어도 17개 뉴클레오타이드는 표적 DNA에 상보성이다. 예를 들어, DNA-표적화 서열은 길이 20개 뉴클레오타이드일 수 있고, 표적 DNA (가이드 RNA 인식 서열)과의 미스매치를 1, 2, 또는 3개 포함할 수 있다. 바람직하게는, 미스매치는 프로토스페이서 인접한 모티프 (protospacer adjacent motif, PAM) 서열에 인접하지 않는다 (예를 들면, 미스매치는 DNA-표적화 서열의 5' 말단 내이거나, 또는 미스매치는 PAM 서열로부터 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 또는 19개 염기 쌍 떨어져 있다).
gRNA의 단백질-결합 분절은 서로 상보성인 뉴클레오타이드의 2개 연신부를 포함할 수 있다. 단백질-결합 분절의 상보성 뉴클레오타이드는 혼성화되어, 이중-가닥 RNA 이중나선 (dsRNA)를 형성한다. 피험체 gRNA의 단백질-결합 분절은 Cas 단백질과 상호작용하고, gRNA는 DNA-표적화 분절을 통해 표적 DNA 이내 특정 뉴클레오타이드 서열에 결합된 Cas 단백질을 유도한다.
가이드 RNA는 추가의 바람직한 특성 (예를 들면, 변형된 또는 조절된 안정성; 세포내 표적화; 형광 표지로 추적; 단백질 또는 단백질 복합체를 위한 결합 부위 등)을 제공하는 변형 또는 서열을 포함할 수 있다. 그와 같은 변형의 예는, 예를 들어, 하기를 포함한다: 5' 캡 (예를 들면, 7-메틸구아닐레이트 캡 (m7G)); 3' 폴리아데닐화된 꼬리 (즉, 3' 폴리(A) 꼬리); (예를 들면, 단백질 및/또는 단백질 복합체에 의한 조절된 안정성 및/또는 조절된 접근성을 허용하기 위한)리보스위치 서열; 안정성 조절 서열; dsRNA 이중나선 (즉, 헤어핀)을 형성하는 서열; 세포내 위치(예를 들면, 핵, 미토콘드리아, 엽록체 등)에 RNA를 표적화하는 변형 또는 서열; 추적을 제공하는 변형 또는 서열 (예를 들면, 형광 분자에 대한 직접 콘주게이션, 형광 검출을 용이하게 하는 모이어티에 대한 콘주게이션, 형광 검출을 허용하는 서열 등); 단백질 (예를 들면, 전사 활성인자, 전사 억제인자, DNA 메틸전달효소, DNA 탈메틸효소, 히스톤 아세틸전달효소, 히스톤 탈아세틸화효소 등을 포함하는, DNA에서 작용하는 단백질)에 대한 결합 부위에 제공하는 변형 또는 서열; 및 이들의 조합.
가이드 RNA는 임의의 형태로 제공될 수 있다. 예를 들어, gRNA는, 2개 분자 (별개의 crRNA 및 tracrRNA)로서 또는 1개 분자 (sgRNA)로서, RNA의 형태로, 그리고 선택적으로 Cas 단백질과의 복합체 형태로 제공될 수 있다. 예를 들어, gRNA는 예를 들어, T7 RNA 폴리머라제를 사용하여 시험관내 전사에 의하여 제조될 수 있다 (참고: 예컨대, WO 2014/089290 및 WO 2014/065596, 이의 각각은 모든 목적을 위하여 그 전체내용이 참고로 본원에 편입됨). 가이드 RNA는 또한 화학적 합성에 의해 제조될 수 있다.
gRNA는 또한 gRNA를 암호화하는 DNA의 형태로 제공될 수 있다. gRNA를 암호화하는 DNA는 단일 RNA 분자 (sgRNA) 또는 별개의 RNA 분자 (예를 들면, 별개의 crRNA 및 tracrRNA)를 암호화할 수 있다. 후자의 경우에, gRNA를 암호화하는 DNA는 각각 crRNA 및 tracrRNA를 암호화하는 하나의 DNA 분자로서, 또는 별개의 DNA 분자들로서 제공될 수 있다.
gRNA가 DNA의 형태로 제공되는 경우, gRNA는 세포에서 일시적으로, 조건적으로, 또는 항시적으로 발현될 수 있다. gRNA를 암호화하는 DNA는 세포의 게놈에 안정적으로 통합될 수 있고, 세포에서 활성인 프로모터에 작동가능하게 연결될 수 있다. 대안적으로, gRNA를 암호화하는 DNA는 발현 작제물에서 프로모터에 작동가능하게 연결될 수 있다. 예를 들어, gRNA를 암호화하는 DNA는 외인성 수선 주형을 포함하는 벡터, 및/또는 Cas 단백질을 암호화하는 핵산을 포함하는 벡터 내 존재할 수 있다. 대안적으로, 이는 외인성 수선 주형을 포함하는 벡터, 및/또는 Cas 단백질을 암호화하는 핵산을 포함하는 벡터와는 별개의, 플라스미드 또는 벡터 내 존재할 수 있다. 발현 작제물에서 사용될 수 있는 프로모터는, 예를 들어, 진핵 세포, 인간 세포, 비-인간 세포, 포유동물 세포, 비-인간 포유동물 세포, 설치류 세포, 마우스 세포, 랫트 세포, 햄스터 세포, 토끼 세포, 만능 세포, 배아 줄기 (ES) 세포, 또는 접합체 중 하나 이상에서 활성인 프로모터를 포함한다. 그와 같은 프로모터는, 예를 들어, 조건적 프로모터, 유도성 프로모터, 항시적 프로모터, 또는 조직-특이적 프로모터일 수 있다. 그와 같은 프로모터는 또한, 예를 들어, 양방향성 프로모터일 수 있다. 적합한 프로모터의 특정 예는 RNA 폴리머라제 Ⅲ 프로모터, 예컨대 인간 U6 프로모터, 랫트 U6 폴리머라제 Ⅲ 프로모터, 또는 마우스 U6 폴리머라제 Ⅲ 프로모터를 포함한다.
(3) 가이드 RNA 인식 서열
용어 "가이드 RNA 인식 서열"은, 충분한 결합 조건이 실재하면, gRNA의 DNA-표적화 분절이 결합할 표적 DNA (예컨대, Fbn1 유전자) 내에 존재하는 핵산 서열을 포함한다. 예를 들어, 가이드 RNA 인식 서열은 가이드 RNA가 상보성을 갖도록 설계된 서열을 포함하고, 여기에서 가이드 RNA 인식 서열과 DNA 표적화 서열 사이의 혼성화는 CRISPR 복합체의 형성을 촉진시킨다. 전체 상보성은, 혼성화를 야기하여 CRISPR 복합체의 형성을 촉진시키기에 충분한 상보성이 있다면, 반드시 요구되지 않는다. 가이드 RNA 인식 서열은 또한, 아래에 더 상세히 기재된, Cas 단백질을 위한 절단 부위를 포함한다. 가이드 RNA 인식 서열은, 예를 들어, 세포의 핵 또는 세포질, 혹은 세포의 소기관, 예컨대 미토콘드리아 또는 엽록체 내에 위치될 수 있는, 임의의 폴리뉴클레오타이드를 포함할 수 있다.
표적 DNA 이내 가이드 RNA 인식 서열은 Cas 단백질 또는 gRNA에 의해 표적화될 수 있다 (즉, 상기에 의해 결합될 수 있거나, 또는 상기와 혼성화할 수 있거나, 또는 상기에 상보성일 수 있다). 적합한 DNA/RNA 결합 조건은 세포에서 정상적으로 존재하는 생리학적 조건을 포함한다. 다른 적합한 DNA/RNA 결합 조건 (예를 들면, 무세포 시스템에서의 조건)은 당해 분야에서 공지된다 (참고: 예컨대, Molecular Cloning: A Laboratory Manual, 3판, (Sambrook 외, Harbor Laboratory Press 2001) (이는 모든 목적을 위하여 그 전체내용이 참고로 본원에 편입됨)). Cas 단백질 또는 gRNA에 상보성이고 상기와 혼성화되는 표적 DNA의 가닥은 "상보성 가닥"으로 불릴 수 있고, "상보성 가닥"에 상보성인 (그리고 따라서 Cas 단백질 또는 gRNA에 상보성이 아닌) 표적 DNA의 가닥은 "비상보성 가닥" 또는 "주형 가닥"으로 불릴 수 있다.
Cas 단백질은 gRNA의 DNA-표적화 분절이 결합할 표적 DNA에서 존재하는 핵산 서열의 내부 또는 외부 부위에서 핵산을 절단시킬 수 있다. "절단 부위"는 Cas 단백질이 단일-가닥 절단 또는 이중-가닥 파단을 생산하는 핵산의 위치를 포함한다. 예를 들어, (가이드 RNA 인식 서열에 혼성화되어 Cas 단백질와 복합체화된 gRNA를 포함하는) CRISPR 복합체의 형성은, gRNA의 DNA-표적화 분절이 결합할 표적 DNA에서 존재하는 핵산 서열 내 또는 그 근처 (예를 들면, 상기 핵산 서열로부터 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50개 또는 그 이상의 염기 쌍 이내) 한쪽 또는 양쪽 가닥의 절단을 초래할 수 있다. 절단 부위가 gRNA의 DNA-표적화 분절이 결합할 핵산 서열의 외부이면, 절단 부위는 "가이드 RNA 인식 서열" 이내인 것으로 여전히 간주된다. 절단 부위는 핵산의 단지 한쪽 가닥, 또는 양쪽 가닥 내에 존재할 수 있다. 절단 부위는 핵산의 양쪽 가닥에서 동일한 위치일 수 있거나(블런트 말단을 생성) 또는 각각의 가닥에서 상이한 부위일 수 있다 [엇갈린 말단 (즉, 돌출부)를 생성]. 엇갈린 말단은, 예를 들어, 2개 Cas 단백질 사용에 의해 생산될 수 있고, 이들의 각각은 상이한 가닥에서 상이한 절단 부위에 단일-가닥 절단을 생산하고, 그렇게 함으로써 이중-가닥 파단을 생산한다. 예를 들어, 제1 틈내기효소는 이중-가닥 DNA (dsDNA)의 제1 가닥에서 단일-가닥 절단을 형성하고, 제2 틈내기효소는 dsDNA의 제2 가닥에서 단일-가닥 절단을 형성하여, 돌출하는 서열이 형성될 수 있다. 일부 경우에서, 제1 가닥에서 틈내기효소의 가이드 RNA 인식 서열은 제2 가닥에서 틈내기효소의 가이드 RNA 인식 서열로부터 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 40, 50, 75, 100, 250, 500, 또는 1,000개 염기 쌍만큼 떨여져 있다.
Cas 단백질에 의한 표적 DNA의 부위-특이적 절단은, (i) gRNA와 표적 DNA 사이의 염기-쌍형성 상보성, 및 (ⅱ) 표적 DNA에서, 프로토스페이서 인접 모티프 (PAM)로 불리는 짧은 모티프, 둘 모두에 의해 결정된 위치에서 발생할 수 있다. PAM은 가이드 RNA 인식 서열에 측접될 수 있다. 선택적으로, 가이드 RNA 인식 서열은 PAM에 의해 3' 말단에서 측접될 수 있다. 대안적으로, 가이드 RNA 인식 서열은 PAM에 의해 5' 말단에서 측접될 수 있다. 예를 들어, Cas 단백질의 절단 부위는 PAM 서열의 약 1 내지 약 10개, 또는 약 2 내지 약 5개 염기 쌍 (예를 들면, 3개 염기 쌍)만큼 상류 또는 하류일 수 있다. 일부 경우 (예컨대, S. 파이오제네스 유래의 Cas9, 또는 밀접하게 관련된 Cas9가 사용될 경우), 비-상보적 가닥의 PAM 서열은 5'-N1GG-3’일 수 있으며, 여기서 N1은 임의의 DNA 뉴클레오타이드이고, 그리고 표적 DNA의 비-상보적 가닥의 가이드 RNA 인식 서열의 3' 최측근에 존재한다. 이와 같이, 상보적 가닥의 PAM 서열은 5'-CCN2-3'일 것이며, 여기서 N2는 임의의 DNA 뉴클레오타이드이며, 그리고 표적 DNA의 상보적 가닥의 가이드 RNA 인식 서열의 5' 최측근에 존재할 것이다. 상기 일부 경우에서, N1 및 N2 는 상보적일 수 있으며, 그리고 N1- N2 염기쌍은 임의의 염기쌍 (예컨대, N1=C 그리고 N2=G; N1=G 그리고 N2=C; N1=A 그리고 N2=T; 또는 N1=T, 그리고 N2=A)일 수 있다. S. 아우레우스 유래의 Cas9의 경우에서, PAM은 NNGRRT (서열번호: 146) 또는 NNGRR (서열번호: 147)일 수 있고, 여기서 N은 A, G, C, 또는 T일 수 있고, 그리고 R은 G 또는 A일 수 있다.(예를 들면, FnCpf1에 대한) 일부 경우에서, PAM 서열은 5' 말단의 상류에 존재할 수 있으며, 그리고 서열 5’-TTN-3’를 가질 수 있다.
가이드 RNA 인식 서열의 예는 gRNA의 DNA-표적화 분절에 상보성인 DNA 서열, 또는 PAM 서열 외에, 그와 같은 DNA 서열을 포함한다. 예를 들어, 상기 표적 모티프는 Cas9 단백질에 의해 인식된 NGG 모티프, 예컨대 GN19NGG (서열 번호 39) 또는 N20NGG (서열 번호 40의 바로 앞 20개-뉴클레오타이드 DNA 서열일 수 있다 (참고: 예컨대, WO 2014/165825 (이는 모든 목적을 위하여 그 전체내용이 참고로 본원에 편입됨). 5' 말단에서 구아닌은 세포에서 RNA 폴리머라제에 의한 전사를 용이하게 할 수 있다. 가이드 RNA 인식 서열의 다른 예는, 시험관내 T7 폴리머라제에 의한 효율적 전사를 촉진하기 위하여, 5' 말단에서 2개 구아닌 뉴클레오타이드를 포함할 수 있다 (예를 들면, GGN20NGG; 서열 번호 41). 참고: 예컨대, WO 2014/065596 (이는 모든 목적을 위하여 그 전체내용이 참고로 본원에 편입됨). 다른 가이드 RNA 인식 서열은 서열번호: 39-41의 길이로 4-22개 뉴클레오타이드를 가질 수 있다 (5' G 또는 GG, 및 3' GG 또는 NGG를 포함함). 추가의 다른 가이드 RNA 인식 서열은 서열번호: 39-41의 길이로 14 내지 20개 뉴클레오타이드를 가질 수 있다.
가이드 RNA 인식 서열은 세포에 내인성 또는 외인성인 임의의 핵산 서열일 수 있다. 가이드 RNA 인식 서열은 유전자 생성물 (예를 들면, 단백질)을 암호화하는 서열 또는 비-암호화 서열 (예를 들면, 조절 서열)일 수 있거나, 또는 양쪽 모두를 포함할 수 있다.
D. 외인성 수선 주형
본원에 개시된 방법 및 조성물은 Fbn1 유전자의 뉴클레아제 제제로 절단한 후, 외인성 수선 주형을 이용하여 Fbn1 유전자를 변형시킬 수 있다. 예를 들어, 세포는 1세포기 배아일 수 있고, 외인성 수선 주형은 길이 5 kb 미만일 수 있다. 1세포기 배아 이외의 세포 유형에서, 외인성 수선 주형 (예를 들면, 표적화 벡터)는 더 길 수 있다. 예를 들어, 1세포기 배아 이외의 세포 유형에서, 외인성 수선 주형은 본 명세서에서 다른 곳에 기재된 큰 표적화 벡터 (LTVEC) (예를 들면, 적어도 10 kb의 길이를 갖거나, 또는 적어도 10 kb의 총합을 갖는 5' 및 3' 상동성 아암을 갖는 표적화 벡터)일 수 있다. 뉴클레아제 제제와 병용한 외인성 수선 주형 사용은, 상동성-지향된 수선을 촉진시킴으로써, Fbn1 유전자 내에서 더욱 정확한 변형을 유발할 수 있다.
그와 같은 방법에서, 뉴클레아제 제제는 단일-가닥 파단 (틈) 또는 이중-가닥 파단을 형성하기 위해 Fbn1 유전자를 절단시키고, 외인성 수선 주형은 비-상동 말단 연결 (NHEJ)-매개된 라이게이션을 통해 또는 상동성-지향된 수선 사건을 통해 Fbn1 유전자를 재조합시킨다. 선택적으로, 외인성 수선 주형으로의 수선은 뉴클레아제 절단 부위를 제거하거나 파괴하여, 표적화되지 않은 대립유전자가 뉴클레아제 제제에 의하여 재-표적화될 수 없도록 한다.
외인성 수선 주형은 데옥시리보핵산 (DNA) 또는 리보핵산 (RNA)를 포함할 수 있고, 이들은 단일-가닥 또는 이중-가닥일 수 있고, 이들은 선형 또는 원형 형태일 수 있다. 예를 들어, 외인성 수선 주형은 단일-가닥 올리고데옥시뉴클레오타이드 (ssODN)일 수 있다. 참고: 예컨대, Yoshimi 외 (2016) Nat. Commun . 7:10431 (이는 모든 목적을 위하여 그 전체가 참고로 본 명세서에서 편입됨). 예시적 외인성 수선 주형은 길이가 약 50개 뉴클레오타이드 내지 약 5 kb이거나, 길이가 약 50개 뉴클레오타이드 내지 약 3 kb이거나, 또는 길이가 약 50개 내지 약 1,000개 뉴클레오타이드이다. 다른 예시적 외인성 수선 주형은 길이가 약 40 내지 약 200개 뉴클레오타이드이다. 예를 들어, 외인성 수선 주형은 길이가 약 50 내지 약 60개, 약 60 내지 약 70개, 약 70 내지 약 80개, 약 80 내지 약 90개, 약 90 내지 약 100개, 약 100 내지 약 110개, 약 110 내지 약 120개, 약 120 내지 약 130개, 약 130 내지 약 140개, 약 140 내지 약 150개, 약 150 내지 약 160개, 약 160 내지 약 170개, 약 170 내지 약 180개, 약 180 내지 약 190개, 또는 약 190 내지 약 200개 뉴클레오타이드일 수 있다. 대안적으로, 외인성 수선 주형은 길이가 약 50 내지 약 100개, 약 100 내지 약 200개, 약 200 내지 약 300개, 약 300 내지 약 400개, 약 400 내지 약 500개, 약 500 내지 약 600개, 약 600 내지 약 700개, 약 700 내지 약 800개, 약 800 내지 약 900개, 또는 약 900 내지 약 1,000개 뉴클레오타이드일 수 있다. 대안적으로, 외인성 수선 주형은 길이가 약 1 kb 내지 약 1.5 kb, 약 1.5 kb 내지 약 2 kb, 약 2 kb 내지 약 2.5 kb, 약 2.5 kb 내지 약 3 kb, 약 3 kb 내지 약 3.5 kb, 약 3.5 kb 내지 약 4 kb, 약 4 kb 내지 약 4.5 kb, 또는 약 4.5 kb 내지 약 5 kb일 수 있다. 대안적으로, 외인성 수선 주형은, 예를 들어, 길이가 5 kb, 4.5 kb, 4 kb, 3.5 kb, 3 kb, 2.5 kb, 2 kb, 1.5 kb, 1 kb, 900개 뉴클레오타이드, 800개 뉴클레오타이드, 700개 뉴클레오타이드, 600개 뉴클레오타이드, 500개 뉴클레오타이드, 400개 뉴클레오타이드, 300개 뉴클레오타이드, 200개 뉴클레오타이드, 100개 뉴클레오타이드, 또는 50개 뉴클레오타이드 이하일 수 있다. 1세포기 배아 이외의 세포 유형에서, 외인성 수선 주형 (예를 들면, 표적화 벡터)은 보다 더 길 수 있다. 예를 들어, 1세포기 배아 이외의 세포 유형에서, 외인성 수선 주형은 본 명세서에서 다른 곳에 기재된 큰 표적화 벡터 (LTVEC)일 수 있다.
일 예에서, 외인성 수선 주형은 길이가 약 80개 뉴클레오타이드 내지 약 200개 뉴클레오타이드인 ssODN이다. 또 다른 예에서, 외인성 수선 주형은 길이가 약 80개 뉴클레오타이드 내지 약 3 kb인 ssODN이다. 그와 같은 ssODN은, 예를 들어, 길이가 각각 약 40개 뉴클레오타이드 내지 약 60개 뉴클레오타이드인 상동성 아암을 가질 수 있다. 그와 같은 ssODN은 또한, 예를 들어, 길이가 각각 약 30개 뉴클레오타이드 내지 100개 뉴클레오타이드인 상동성 아암을 가질 수 있다. 상동성 아암은 대칭 (예를 들면, 길이가 각각 40개 뉴클레오타이드, 또는 각각 60개 뉴클레오타이드)일 수 있거나, 이들은 비대칭 (예를 들면, 길이가 36개 뉴클레오타이드인 하나의 상동성 아암, 및 길이가 91개 뉴클레오타이드인 하나의 상동성 아암)일 수 있다.
외인성 수선 주형은 추가의 바람직한 특성 (예를 들면, 변형된 또는 조절된 안정성; 형광 표지로 추적 또는 검출; 단백질 또는 단백질 복합체를 위한 결합 부위 등)을 제공하는 변형 또는 서열을 포함할 수 있다. 외인성 수선 주형은 하나 이상의 형광 표지, 정제 태그, 에피토프 태그, 또는 이들의 조합을 포함할 수 있다. 예를 들어, 외인성 수선 주형은 하나 이상의 형광 표지 (예를 들면, 형광 단백질 또는 다른 형광단 또는 염료), 예컨대 적어도 1, 적어도 2, 적어도 3, 적어도 4, 또는 적어도 5개 형광 표지를 포함할 수 있다. 예시적 형광 표지는 형광단, 예컨대 플루오레세인 (예를 들면, 6-카르복시플루오세인 (6-FAM)), 텍사스 레드(Texas Red), HEX, Cy3, Cy5, Cy5.5, 퍼시픽 블루(Pacific Blue), 5-(및-6)-카르복시테트라메틸로다민 (TAMRA), 및 Cy7을 포함한다. 광범위한 형광 염료는 올리고뉴클레오타이드 표지화를 위하여 상업적으로 이용가능하다 (예를 들면, Integrated DNA Technologies 사). 그와 같은 형광 표지 (예를 들면, 내부 형광 표지)는, 예를 들어, 외인성 수선 주형의 말단과 양립가능한 돌출되는 말단을 갖는 절단된 Fbn1 유전자에 직접적으로 통합된 외인성 수선 주형을 검출하는데 사용될 수 있다. 표지 또는 태그는 외인성 수선 주형 이내 5' 말단, 3' 말단, 또는 내부적일 수 있다. 예를 들어, 외인성 수선 주형은, Integrated DNA Technologies (5’IRDYE®700) 사의 IR700 형광단이 5' 말단에 콘주게이트될 수 있다.
외인성 수선 주형은 또한 Fbn1 유전자 내에 통합되도록, DNA의 분절을 포함하는 핵산 삽입물을 포함할 수 있다. Fbn1 유전자 내에서 핵산 삽입물의 통합은, Fbn1 유전자 내 관심의 핵산 서열의 부가, Fbn1 유전자 내에서 관심의 핵산 서열의 결실, 또는 Fbn1 유전자 내에서 관심의 핵산 서열의 대체 (즉, 결실 및 삽입)를 유발할 수 있다. 일부 외인성 수선 주형은 Fbn1 유전자 내 임의의 상응하는 결실 없이, Fbn1 유전자 내 핵산 삽입물을 삽입하도록 설계된다. 다른 외인성 수선 주형은 핵산 삽입물의 임의의 상응하는 삽입 없이, Fbn1 유전자 내에서 관심 핵산 서열을 결실시키도록 설계된다. 추가의 다른 외인성 수선 주형은 Fbn1 유전자 내에서 관심 핵산 서열을 결실시키고 이를 핵산 삽입물로 대체시키도록 설계된다.
결실되고/되거나 대체되는 Fbn1 유전자 내 핵산 삽입물 또는 상응하는 핵산은, 다양한 길이의 것일 수 있다. 결실되고/되거나 대체되는 Fbn1 유전자 내에서 예시적 핵산 삽입물 또는 상응하는 핵산은, 약 1개 뉴클레오타이드 내지 약 5 kb 길이이거나 약 1개 뉴클레오타이드 내지 약 1,000 뉴클레오타이드 길이이다. 예를 들어, 결실되고/되거나 대체되는 Fbn1 유전자 내에서 핵산 삽입물 또는 상응하는 핵산은, 약 1 내지 약 10개, 약 10 내지 약 20개, 약 20 내지 약 30개, 약 30 내지 약 40개, 약 40 내지 약 50개, 약 50 내지 약 60개, 약 60 내지 약 70개, 약 70 내지 약 80개, 약 80 내지 약 90개, 약 90 내지 약 100개, 약 100 내지 약 110개, 약 110 내지 약 120개, 약 120 내지 약 130개, 약 130 내지 약 140개, 약 140 내지 약 150개, 약 150 내지 약 160개, 약 160 내지 약 170개, 약 170 내지 약 180개, 약 180 내지 약 190개, 또는 약 190 내지 약 200개 뉴클레오타이드 길이일 수 있다. 마찬가지로, 결실되고/되거나 대체되는 표적 Fbn1 유전자 내에서 핵산 삽입물 또는 상응하는 핵산은 약 1 내지 약 100개, 약 100 내지 약 200개, 약 200 내지 약 300개, 약 300 내지 약 400개, 약 400 내지 약 500개, 약 500 내지 약 600개, 약 600 내지 약 700개, 약 700 내지 약 800개, 약 800 내지 약 900개, 또는 약 900 내지 약 1,000개 뉴클레오타이드 길이일 수 있다. 마찬가지로, 결실되고/되거나 대체되는 Fbn1 유전자 내에서 핵산 삽입물 또는 상응하는 핵산은 길이가 약 1 kb 내지 약 1.5 kb, 약 1.5 kb 내지 약 2 kb, 약 2 kb 내지 약 2.5 kb, 약 2.5 kb 내지 약 3 kb, 약 3 kb 내지 약 3.5 kb, 약 3.5 kb 내지 약 4 kb, 약 4 kb 내지 약 4.5 kb, 또는 약 4.5 kb 내지 약 5 kb일 수 있다. Fbn1 유전자로부터 결실되는 핵산은 또한 약 1 kb 내지 약 5 kb, 약 5 kb 내지 약 10 kb, 약 10 kb 내지 약 20 kb, 약 20 kb 내지 약 30 kb, 약 30 kb 내지 약 40 kb, 약 40 kb 내지 약 50 kb, 약 50 kb 내지 약 60 kb, 약 60 kb 내지 약 70 kb, 약 70 kb 내지 약 80 kb, 약 80 kb 내지 약 90 kb, 약 90 kb 내지 약 100 kb, 약 100 kb 내지 약 200 kb, 약 200 kb 내지 약 300 kb, 약 300 kb 내지 약 400 kb, 약 400 kb 내지 약 500 kb, 약 500 kb 내지 약 600 kb, 약 600 kb 내지 약 700 kb, 약 700 kb 내지 약 800 kb, 약 800 kb 내지 약 900 kb, 약 900 kb 내지 약 1 Mb, 또는 더 길 수 있다. 대안적으로, Fbn1 유전자 내에서로부터 결실되는 핵산은 약 1 Mb 내지 약 1.5 Mb, 약 1.5 Mb 내지 약 2 Mb, 약 2 Mb 내지 약 2.5 Mb, 약 2.5 Mb 내지 약 3 Mb, 약 3 Mb 내지 약 4 Mb, 약 4 Mb 내지 약 5 Mb, 약 5 Mb 내지 약 10 Mb, 약 10 Mb 내지 약 20 Mb, 약 20 Mb 내지 약 30 Mb, 약 30 Mb 내지 약 40 Mb, 약 40 Mb 내지 약 50 Mb, 약 50 Mb 내지 약 60 Mb, 약 60 Mb 내지 약 70 Mb, 약 70 Mb 내지 약 80 Mb, 약 80 Mb 내지 약 90 Mb, 또는 약 90 Mb 내지 약 100 Mb일 수 있다.
핵산 삽입물은 게놈 DNA 또는 임의의 다른 유형의 DNA를 포함할 수 있다. 예를 들어, 핵산 삽입물은 원핵생물, 진핵생물, 효모, 새 (예를 들면, 닭), 비-인간 포유동물, 설치류, 인간, 랫트, 마우스, 햄스터, 토끼, 돼지, 소, 사슴, 양, 염소, 고양이, 개, 흰담비, 영장류 (예를 들면, 마모셋, 레서스 원숭이), 사육된 포유동물, 농업 포유동물, 거북, 또는 관심의 임의의 다른 유기체 유래의 것일 수 있다.
핵산 삽입물은 Fbn1 유전자의 전부 또는 일부 (예를 들면, 피브릴린-1 단백질의 특정 모티프 또는 영역을 암호화하는 유전자의 일부)에 상동성 또는 병렬상동성인 서열을 포함할 수 있다. 상동성 서열은 상이한 종 또는 동일한 종 유래의 것일 수 있다. 예를 들어, 핵산 삽입물은 Fbn1 유전자에서의 대체를 위하여 표적화된 서열에 비해, 하나 이상(예를 들면, 1, 2, 3, 4, 5개 또는 그 이상)의 점 돌연변이를 포함하는 서열을 포함할 수 있다. 일부 경우에서, 핵산 삽입물은 인간 Fbn1 서열이다. 이는, 핵산 삽입물의 삽입이 Fbn1 비-인간 핵산 서열의 전체 또는 일부가 상응하는 병렬상동성 인간 핵산 서열로 대체되도록 유발하는 (즉, 핵산 삽입물이 이의 내인성 게놈 좌위에서 상응하는 비-인간 DNA 서열 대신 삽입되는) 경우, 비-인간 동물에서의 Fbn1 좌위의 전체 또는 일부의 인간화를 유발할 수 있다. 삽입된 인간 서열은 인간 Fbn1 유전자에서의 하나 이상의 돌연변이를 추가로 포함할 수 있다.
결실되고/되거나 대체되는 Fbn1 유전자 내 핵산 삽입물 또는 상응하는 핵산은, 암호화 영역 예컨대 엑손; 비-암호화 영역, 예컨대 인트론, 미번역된 영역, 또는 조절 영역 (예를 들면, 프로모터, 인핸서, 또는 전사 억제인자-결합 요소); 또는 이들의 임의의 조합일 수 있다.
핵산 삽입물은 또한 조건적 대립유전자를 포함할 수 있다. 조건적 대립유전자는, 모든 목적을 위하여 그 전체가 참고로 본 명세서에서 편입된, US 2011/0104799에서 기재된 바와 같이, 다기능성 대립유전자일 수 있다. 예를 들어, 조건적 대립유전자는 하기를 포함할 수 있다: (a) 표적 유전자의 전사에 관한, 센스 배향의 구동 서열; (b) 센스 또는 안티센스 배향의 약물 선택 카세트 (DSC); (c) 안티센스 배향의 관심 뉴클레오타이드 서열 (NSI); 및 (d) 역방향 배향의 조건적 역전 모듈 (엑손-분할 인트론, 및 가역적 유전자-트랩-유사 모듈을 이용하는, COIN). 참고: 예컨대, US 2011/0104799. 조건적 대립유전자는 제1 재조합효소에 노출시 재조합하는 재조합가능 유닛을 추가로 포함하여, (i) 구동 서열 및 DSC가 결핍되며; 그리고 (ⅱ) 센스 배향으로의 NSI, 및 안티센스 배향으로의 COIN을 함유하는 조건적 대립유전자를 형성할 수 있다. 참고: 예컨대, US 2011/0104799.
핵산 삽입물은 선택 마커를 암호화하는 폴리뉴클레오타이드를 또한 포함할 수 있다. 대안적으로, 핵산 삽입물은 선택 마커를 암호화하는 폴리뉴클레오타이드가 결핍될 수 있다. 선택 마커는 선택 카세트 내에 함유될 수 있다. 선택적으로, 선택 카세트는 자가-결실 카세트일 수 있다. 참고: 예컨대, US 8,697,851 및 US 2013/0312129 (이의 각각은 모든 목적을 위하여 그 전체내용이 참고로 본원에 편입됨). 예시로서, 자가-결실 카세트는, 마우스 Prm1 프로모터에 작동가능하게 연결된 (인트론에 의하여 분리된 Cre 재조합효소를 암호화하는 2개 엑손을 포함하는) Crei 유전자, 및 인간 유비퀴틴 프로모터에 작동가능하게 연결된 네오마이신 저항성 유전자를 포함할 수 있다. Prm1 프로모터를 이용함으로써, 자가-결실 카세트는 F0 동물의 수컷 생식 세포에서 특이적으로 결실될 수 있다. 예시적 선택 마커는 네오마이신 인산기전이효소 (neor), 하이그로마이신 B 인산기전이효소 (hygr), 퓨로마이신-N-아세틸기전달효소 (puror), 블라스티시딘 S 탈아미노효소 (bsrr), 잔틴/구아닌 포스포리보실 전달효소 (gpt), 또는 단순 포진 바이러스 티미딘 키나제 (HSV-k), 또는 이들의 조합물을 포함한다. 선택 마커를 암호화하는 폴리뉴클레오타이드는 표적화될 세포에서 활성인 프로모터에 작동가능하게 연결될 수 있다. 프로모터의 예는 본 명세서에서 다른 곳에 기재된다.
핵산 삽입물은 또한 리포터 유전자를 포함할 수 있다. 예시적 리포터 유전자는 루시퍼라아제, β-갈락토시다아제, 녹색 형광 단백질 (GFP), 증진된 녹색 형광 단백질 (eGFP), 청록색 형광 단백질 (CFP), 황색 형광 단백질 (YFP), 증진된 황색 형광 단백질 (eYFP), 청색 형광 단백질 (BFP), 증진된 청색 형광 단백질 (eBFP), DsRed, ZsGreen, MmGFP, mPlum, mCherry, tdTomato, mStrawberry, J-Red, mOrange, mKO, mCitrine, Venus, YPet, Emerald, CyPet, Cerulean, T-Sapphire, 및 알칼리 포스파타제를 암호화하는 것들을 포함한다. 그와 같은 리포터 유전자는 표적화될 세포에서 활성인 프로모터에 작동가능하게 연결될 수 있다. 프로모터의 예는 본 명세서에서 다른 곳에 기재된다.
핵산 삽입물은 하나 이상의 발현 카세트 또는 결실 카세트를 또한 포함할 수 있다. 소정의 카세트는 발현에 영향을 미치는 다양한 조절 성분과 함께, 관심의 뉴클레오타이드 서열, 선택 마커를 암호화하는 폴리뉴클레오타이드, 및 리포터 유전자 중 하나 이상을 포함할 수 있다. 포함될 수 있는 선택가능한 마커 및 리포터 유전자의 예는 본 명세서에서 다른 곳에 상세히 논의된다.
핵산 삽입물은 부위-특이적 재조합 표적 서열이 측접된 핵산을 포함할 수 있다. 대안적으로, 핵산 삽입물은 하나 이상의 부위-특이적 재조합 표적 서열을 포함할 수 있다. 전체 핵산 삽입물이 그와 같은 부위-특이적 재조합 표적 서열에 의해 측접될 수 있어도, 핵산 삽입물 내의 임의의 관심 영역 또는 개별 폴리뉴클레오타이드는, 또한 그와 같은 부위에 의해 측접될 수도 있다. 핵산 삽입물에서 관심의 핵산 삽입물 또는 임의의 폴리뉴클레오타이드가 측접할 수 있는 부위-특이적 재조합 표적 서열은, 예를 들어, loxP, lox511, lox2272, lox66, lox71, loxM2, lox5171, FRT, FRT11, FRT71, attp, att, FRT, rox, 또는 이들의 조합을 포함할 수 있다. 일 예에서, 부위-특이적 재조합 부위는 핵산 삽입물 이내 함유된 리포터 유전자 및/또는 선택 마커를 암호화하는 폴리뉴클레오타이드를 측접한다. Fbn1 유전자 내 핵산 삽입물의 통합 이후, 부위-특이적 재조합 부위 사이의 서열은 제거될 수 있다. 선택적으로, 부위-특이적 재조합 부위를 포함하는 핵산 삽입물을 각각 갖는 2개의 외인성 수선 주형이 사용될 수 있다. 외인성 수선 주형은 관심의 핵산에 측접하는 5' 및 3' 영역에 대해 표적화될 수 있다. 표적 게놈 좌위에 2개 핵산 삽입물을 통합한 이후, 2개의 삽입된 부위-특이적 재조합 부위들 사이의 관심의 핵산은 제거될 수 있다.
핵산 삽입물은, 유형 I, 유형 Ⅱ, 유형 Ⅲ, 및 유형 IV 엔도뉴클레아제를 포함하는, 제한 엔도뉴클레아제 (즉, 제한 효소)를 위한 하나 이상의 제한 부위를 또한 포함할 수도 있다. 유형 I 및 유형 Ⅲ 제한 엔도뉴클레아제는, 특정 인식 서열을 인식하지만, 절단 부위 (인식 서열)로부터 수백개 염기쌍만큼 떨어져 있을 수 있는, 뉴클레아제 결합 부위의 가변 위치에서 전형적으로 절단된다. 유형 Ⅱ 시스템에서, 제한 활성은 임의의 메틸화효소 활성에 독립적이고, 절단은 전형적으로 결합 부위 이내 또는 근처 특정 부위에서 발생한다. 대부분의 유형 Ⅱ 효소는 회문 서열을 절단하지만, 유형 Ⅱa 효소는 비-회문성 인식 서열을 인식하여 인식 서열의 외부를 절단시키고, 유형 Ⅱb 효소는 인식 서열의 외부 양쪽 부위에 대해 2회 서열을 제거하고, 유형 Ⅱs 효소는 비대칭 인식 서열을 인식하여 한쪽에서 그리고 인식 서열로부터 약 1-20 뉴클레오타이드의 한정된 거리에서 절단한다. 유형 IV 제한 효소는 메틸화된 DNA를 표적한다. 제한 효소는, 예를 들어, 하기에서 추가로 기술되고, 그리고 분류된다: REBASE 데이터베이스 (rebase.neb.com; Roberts 외, (2003) Nucleic Acids Res. 31:418-420; Roberts 외, (2003) Nucleic Acids Res. 31:1805-1812; 및 Belfort 외 (2002) in Mobile DNA II, pp. 761-783, Eds. Craigie 외, (ASM Press, Washington, DC)에서의 웹페이지).
(1) 비-상동-말단-연결- 매개된 삽입용 수선 주형
일부 외인성 수선 주형은, 5' 말단 및/또는 3' 말단에, 표적 게놈 좌위의 (예컨대, Fbn1 유전자 내의) Cas-단백질-매개된 절단에 의해 형성된 하나 이상의 돌출부에 상보성인 짧은 단일-가닥 영역을 갖는다. 이들 돌출부는 또한 5' 및 3' 상동성 아암으로 지칭될 수 있다. 예를 들어, 일부 외인성 수선 주형은 5' 말단 및/또는 3' 말단에, 표적 게놈 좌위의 5' 및/또는 3' 표적 서열의 Cas-단백질-매개된 절단에 의해 형성된 하나 이상의 돌출부에 상보성인 짧은 단일-가닥 영역을 갖는다. 그와 같은 일부 외인성 수선 주형은 5' 말단에서만 또는 3' 말단에서만 상보성 영역을 갖는다. 예를 들어, 그와 같은 일부 외인성 수선 주형은 표적 게놈 좌위에서 5' 표적 서열에 형성된 돌출부에 상보성인 5' 말단에만, 또는 표적 게놈 좌위에서 3' 표적 서열에 형성된 돌출부에 상보성인 3' 말단에만, 상보성 영역을 갖는다. 다른 그와 같은 외인성 수선 주형은 5' 및 3' 말단 모두에 상보성 영역을 갖는다. 예를 들어, 다른 그와 같은 외인성 수선 주형은 각각 5' 및 3' 말단 모두에, 표적 게놈 좌위에서의 Cas-매개된 절단에 의해 생성된 예를 들면, 제1 및 제2 돌출부에 상보성인 상보성 영역을 갖는다. 예를 들어, 외인성 수선 주형이 이중-가닥인 경우, 단일-가닥 상보성 영역은, 각각의 말단에서 수선 주형의 최상부 가닥의 5' 말단, 및 수선 주형의 최하부 가닥의 5' 말단으로부터 확장하여, 5' 돌출부를 형성할 수 있다. 대안적으로, 단일-가닥 상보성 영역은, 수선 주형의 최상부 가닥의 3' 말단, 및 주형의 최하부 가닥의 3' 말단으로부터 확장하여, 3' 돌출부를 형성할 수 있다.
상보적 영역은 외인성 수선 주형 및 Fbn1 유전자 사이의 라이게이션을 촉진하기에 충분한 임의의 길이의 것일 수 있다. 예시적 상보성 영역은 길이가 약 1 내지 약 5개 뉴클레오타이드, 길이가 약 1 내지 약 25개 뉴클레오타이드, 또는 길이가 약 5 내지 약 150개 뉴클레오타이드이다. 예를 들어, 상보성 영역은 길이가 적어도 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 또는 25개 뉴클레오타이드일 수 있다. 대안적으로, 상보성 영역은 길이가 약 5 내지 약 10개, 약 10 내지 약 20개, 약 20 내지 약 30개, 약 30 내지 약 40개, 약 40 내지 약 50개, 약 50 내지 약 60개, 약 60 내지 약 70개, 약 70 내지 약 80개, 약 80 내지 약 90개, 약 90 내지 약 100개, 약 100 내지 약 110개, 약 110 내지 약 120개, 약 120 내지 약 130개, 약 130 내지 약 140개, 약 140 내지 약 150개 뉴클레오타이드일 수 있거나, 또는 더 길 수 있다.
그와 같은 상보성 영역은 틈내기효소의 2개 쌍에 의해 형성된 돌출부에 상보성일 수 있다. 엇갈린 말단을 가진 2개 이중-가닥 파단은 제1 이중-가닥 파단을 형성하기 위해 DNA의 반대편 가닥을 절단시키는 제1 및 제2 틈내기효소, 그리고 제2 이중-가닥 파단을 형성하기 위해 DNA의 반대편 가닥을 절단시키는 제3 및 제4 틈내기효소 사용에 의해 형성될 수 있다. 예를 들어, Cas 단백질은 제1, 제2, 제3, 및 제4 가이드 RNA와 상응하는 제1, 제2, 제3, 및 제4 가이드 RNA 인식 서열을 틈내기하는데 사용될 수 있다. 제1 및 제2 가이드 RNA 인식 서열은 제1 절단 부위를 형성하도록 배치되어, DNA의 제1 및 제2 가닥에서 제1 및 제2 틈내기효소에 의해 형성된 틈이 이중-가닥 파단을 형성할 수 있다 (즉, 제1 절단 부위는 제1 및 제2 가이드 RNA 인식 서열 이내 틈을 포함한다). 마찬가지로, 제3 및 제4 가이드 RNA 인식 서열은 제2 절단 부위를 형성하도록 배치되어, DNA의 제1 및 제2 가닥에서 제3 및 제4 틈내기효소에 의해 형성된 틈이 이중-가닥 파단을 형성할 수 있다 (즉, 제2 절단 부위는 제3 및 제4 가이드 RNA 인식 서열 이내 틈을 포함한다). 바람직하게는, 제1 및 제2 가이드 RNA 인식 서열 및/또는 제3 및 제4 가이드 RNA 인식 서열 이내 틈은 돌출부를 형성하는 오프-세트 틈일 수 있다. 오프세트 윈도우는, 예를 들어, 적어도 약 5 bp, 10 bp, 20 bp, 30 bp, 40 bp, 50 bp, 60 bp, 70 bp, 80 bp, 90 bp, 100 bp 또는 그 이상일 수 있다. 참고: Ran 외 (2013) Cell 154:1380-1389; Mali 외 (2013) Nat. Biotech.31:833-838; 및 Shen 외 (2014) Nat. Methods 11:399-404 (이는 모든 목적을 위하여 그 전체내용이 참고로 본원에 편입됨). 그와 같은 경우에, 이중-가닥 외인성 수선 주형은 제1 및 제2 가이드 RNA 인식 서열 이내 틈에 의해 그리고 제3 및 제4 가이드 RNA 인식 서열 이내 틈에 의해 형성된 돌출부에 상보성인 단일-가닥 상보성 영역으로 설계될 수 있다. 그와 같은 외인성 수선 주형은 그 다음 비-상동-말단-연결-매개된 라이게이션에 의해 삽입될 수 있다.
(2) 상동성 -지향된 수선에 의한 삽입용 수선 주형
일부 외인성 수선 주형은 상동성 아암을 포함한다. 외인성 수선 주형이 또한 핵산 삽입물을 포함하면, 상동성 아암에 핵산 삽입물이 측접될 수 있다. 참조의 편의를 위하여, 상동성 아암은 본 명세서에서 5' 및 3' (즉, 상류 및 하류) 상동성 아암으로서 지칭된다. 이러한 용어는 외인성 수선 주형 이내 핵산 삽입물에 대한 상동성 아암의 상대 위치에 관한 것이다. 5' 및 3' 상동성 아암은 Fbn1 유전자 내의 영역에 상응하고, 이것은 본 명세서에서 각각 "5' 표적 서열" 및 "3' 표적 서열"이라 칭해진다.
2개의 영역이 상동성 재조합 반응에 대한 기질로서 작용하도록 서로에 충분한 수준의 서열 동일성을 공유할 때, 상동성 아암 및 표적 서열은 서로에 "상응한다" 또는 "상응하다". 용어 "상동성"은 어느 한쪽 동일하거나 또는 상응하는 서열에 서열 동일성을 공유하는 DNA 서열을 포함한다. 외인성 수선 주형에서 발견된 상응하는 상동성 아암과 소정의 표적 서열 사이 서열 동일성은 상동 재조합이 발생하도록 하는 서열 동일성의 임의의 정도일 수 있다. 예를 들어, 외인성 수선 주형 (또는 이의 단편) 및 표적 서열 (또는 이의 단편)과 상동성 아암이 공유한 서열 동일성의 양은 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성일 수 있어서, 이로써 서열은 상동 재조합을 겪는다. 더욱이, 상동성 아암과 상응하는 표적 서열 사이의 상동성을 갖는 상응하는 영역은, 상동 재조합을 촉진시키는데 충분한 임의의 길이일 수 있다. 예시적 상동성 아암은 길이가 약 25개 뉴클레오타이드 내지 약 2.5 kb이거나, 길이가 약 25개 뉴클레오타이드 내지 약 1.5 kb이거나, 또는 길이가 약 25개 내지 약 500개 뉴클레오타이드이다. 예를 들어, 소정의 상동성 아암 (또는 각각의 상동성 아암) 및/또는 상응하는 표적 서열은 길이가 약 25 내지 약 30개, 약 30 내지 약 40개, 약 40 내지 약 50개, 약 50 내지 약 60개, 약 60 내지 약 70개, 약 70 내지 약 80개, 약 80 내지 약 90개, 약 90 내지 약 100개, 약 100 내지 약 150개, 약 150 내지 약 200개, 약 200 내지 약 250개, 약 250 내지 약 300개, 약 300 내지 약 350개, 약 350 내지 약 400개, 약 400 내지 약 450개, 또는 약 450 내지 약 500개 뉴클레오타이드인 상동성의 상응하는 영역을 포함할 수 있어서, 이로써 상동성 아암은 Fbn1 유전자 내 상응하는 표적 서열과 상동 재조합을 하기에 충분한 상동성을 갖는다. 대안적으로, 소정의 상동성 아암 (또는 각각의 상동성 아암) 및/또는 상응하는 표적 서열은 길이가 약 0.5 kb 내지 약 1 kb, 약 1 kb 내지 약 1.5 kb, 약 1.5 kb 내지 약 2 kb, 또는 약 2 kb 내지 약 2.5 kb인 상동성의 상응하는 영역을 포함할 수 있다. 예를 들어, 상동성 아암은 각각 길이가 약 750개 뉴클레오타이드일 수 있다. 상동성 아암은 대칭 일 수 있거나 (각각 길이가 약 동일한 크기), 또는 이들은 비대칭일 수 있다 (다른 것보다 더 길다).
상동성 아암은 세포에 대하여 원래의 좌위 (예를 들면, 표적화된 좌위)에 상응할 수 있다. 대안적으로, 예를 들어, 이들은, 예를 들어, 이식유전자, 발현 카세트, 또는 DNA의 이종성 또는 외인성 영역을 포함하여, 세포의 게놈에 통합되었던 DNA의 이종성 또는 외인성 분절의 영역에 상응할 수 있다. 대안적으로, 표적화 벡터의 상동성 아암은 효모 인공 염색체 (YAC), 박테리아 인공 염색체 (BAC), 인간 인공 염색체의 영역, 또는 적절한 숙주 세포에서 함유된 임의의 다른 조작된 영역에 상응할 수 있다. 또한, 표적화 벡터의 상동성 아암은 BAC 라이브러리, 코스미드 라이브러리, 또는 P1 파아지 라이브러리의 영역에 상응할 수 있거나, 상기로부터 유래될 수 있거나, 또는 합성 DNA로부터 유래될 수 있다.
뉴클레아제 제제가 외인성 수선 주형과 병용하여 사용되는 경우, 5' 및 3' 표적 서열은 바람직하게는 뉴클레아제 절단 부위에 충분히 근접하여 위치되어, 뉴클레아제 절단 부위의 단일-가닥 절단 (틈) 또는 이중-가닥 파단 상에 상동성 아암과 표적 서열 사이의 상동성 재조합 사건의 발생을 촉진시킨다. 용어 "뉴클레아제 절단 부위"는 뉴클레아제 제제 (예를 들면, 가이드 RNA와 복합체화된 Cas9 단백질)에 의해 틈 또는 이중-가닥 파단이 형성되는 DNA 서열을 포함한다. 외인성 수선 주형의 5' 및 3' 상동성 아암에 상응하는 Fbn1 유전자 내 표적 서열은, 거리가 예컨대 뉴클레아제 절단 부위에서 단일-가닥 절단 또는 이중-가닥 파단 상의 상동성 아암과 5' 및 3' 표적 서열 사이 상동성 재조합 사건의 발생을 촉진시키는 정도인 경우, 뉴클레아제 절단 부위에 "충분히 근접하여 위치"된다. 따라서, 외인성 수선 주형의 5' 및/또는 3' 상동성 아암에 상응하는 표적 서열은, 예를 들어, 소정의 뉴클레아제 절단 부위의 적어도 1개 뉴클레오타이드 이내, 또는 소정의 뉴클레아제 절단 부위의 적어도 10개 뉴클레오타이드 내지 약 1,000개 뉴클레오타이드 이내일 수 있다. 예로서, 뉴클레아제 절단 부위는 표적 서열의 적어도 한쪽 또는 양쪽에 바로 인접할 수 있다.
외인성 수선 주형의 상동성 아암에 상응하는 표적 서열 및 뉴클레아제 절단 부위의 공간적 연관관계는 가변할 수 있다. 예를 들어, 표적 서열은 뉴클레아제 절단 부위에 대해 5' 위치될 수 있거나, 표적 서열은 뉴클레아제 절단 부위에 대해 3' 위치될 수 있거나, 또는 표적 서열은 뉴클레아제 절단 부위에 측접될 수 있다.
1세포기 배아 이외의 세포에서, 외인성 수선 주형은 "큰 표적화 벡터" 또는 "LTVEC"일 수 있는데, 이는 세포에서 상동성 재조합을 수행하기 위해 의도된 다른 접근법에 의해 전형적으로 사용된 것보다 더 큰 핵산 서열로부터 유래되고 상기에 상응하는 상동성 아암을 포함하는 표적화 벡터를 포함한다. LTVEC는 또한 세포에서 상동성 재조합을 수행하기 위해 의도된 다른 접근법에 의해 전형적으로 사용된 것보다 더 큰 핵산 서열을 갖는 핵산 삽입물을 포함하는 표적화 벡터를 포함한다. 예를 들어, LTVEC는 이의 크기 제한 때문에 기존의 플라스미드-기반 표적화 벡터에 의해 수용될 수 없었던 대형 좌위의 변형을 가능하게 한다. 예를 들어, 표적화된 유전좌위는 종래의 방법을 사용하여 표적화될 수 없거나, 뉴클레아제 제제(예를 들어, Cas 단백질)에 의해 유도된 틈 또는 이중 가닥 파괴 없이 오직 부정확하거나 또는 상당히 낮은 효율에 의해서만 표적화될 수 있는, 세포의 유전좌위일 수 있다(즉, 5' 및 3' 상동성 아암은 이것에 상응할 수 있다).
LTVEC의 예는 박테리아 인공 염색체 (BAC), 인간 인공 염색체, 또는 효모 인공 염색체 (YAC)로부터 유래된 벡터를 포함한다. LTVEC 및 이들의 제조 방법의 비-제한 예는, 예를 들면, 이들의 각각이 모든 목적을 위하여 그 전체가 참고로 본 명세서에서 편입되는, 미국 특허 번호 6,586,251; 6,596,541; 및 7,105,348; 및 WO 2002/036789에서 기재된다. LTVEC는 선형 형태 또는 원형 형태일 수 있다.
LTVEC는 임의의 길이일 수 있고, 전형적으로 길이가 적어도 10 kb이다. 예를 들어, LTVEC는 약 50 kb 내지 약 300 kb, 약 50 kb 내지 약 75 kb, 약 75 kb 내지 약 100 kb, 약 100 kb 내지 125 kb, 약 125 kb 내지 약 150 kb, 약 150 kb 내지 약 175 kb, 약 175 kb 내지 약 200 kb, 약 200 kb 내지 약 225 kb, 약 225 kb 내지 약 250 kb, 약 250 kb 내지 약 275 kb 또는 약 275 kb 내지 약 300 kb일 수 있다. 대안적으로, LTVEC는 적어도 10 kb, 적어도 15 kb, 적어도 20 kb, 적어도 30 kb, 적어도 40 kb, 적어도 50 kb, 적어도 60 kb, 적어도 70 kb, 적어도 80 kb, 적어도 90 kb, 적어도 100 kb, 적어도 150 kb, 적어도 200 kb, 적어도 250 kb, 적어도 300 kb, 적어도 350 kb, 적어도 400 kb, 적어도 450 kb, 또는 적어도 500 kb 이상일 수 있다. LTVEC의 크기는 종래의 에세이, 예를 들면, 서던 블랏팅 및 광범위 (예를 들면, 1 kb 내지 5 kb) PCR에 의한 표적화 사건의 스크리닝을 가능하게 하기에 너무 클 수 있다.
LTVEC에서 5' 상동성 아암 및 3' 상동성 아암의 총계는, 전형적으로 적어도 10 kb이다. 예로서, 5' 상동성 아암은 약 5 kb 내지 약 100 kb 범위일 수 있고/있거나 3' 상동성 아암은 약 5 kb 내지 약 100 kb 범위일 수 있다. 각각의 상동성 아암은, 예를 들어, 약 5 kb 내지 약 10 kb, 약 10 kb 내지 약 20 kb, 약 20 kb 내지 약 30 kb, 약 30 kb 내지 약 40 kb, 약 40 kb 내지 약 50 kb, 약 50 kb 내지 약 60 kb, 약 60 kb 내지 약 70 kb, 약 70 kb 내지 약 80 kb, 약 80 kb 내지 약 90 kb, 약 90 kb 내지 약 100 kb, 약 100 kb 내지 약 110 kb, 약 110 kb 내지 약 120 kb, 약 120 kb 내지 약 130 kb, 약 130 kb 내지 약 140 kb, 약 140 kb 내지 약 150 kb, 약 150 kb 내지 약 160 kb, 약 160 kb 내지 약 170 kb, 약 170 kb 내지 약 180 kb, 약 180 kb 내지 약 190 kb, 또는 약 190 kb 내지 약 200 kb일 수 있다. 5' 및 3' 상동성 아암의 총계는, 예를 들어, 약 10 kb 내지 약 20 kb, 약 20 kb 내지 약 30 kb, 약 30 kb 내지 약 40 kb, 약 40 kb 내지 약 50 kb, 약 50 kb 내지 약 60 kb, 약 60 kb 내지 약 70 kb, 약 70 kb 내지 약 80 kb, 약 80 kb 내지 약 90 kb, 약 90 kb 내지 약 100 kb, 약 100 kb 내지 약 110 kb, 약 110 kb 내지 약 120 kb, 약 120 kb 내지 약 130 kb, 약 130 kb 내지 약 140 kb, 약 140 kb 내지 약 150 kb, 약 150 kb 내지 약 160 kb, 약 160 kb 내지 약 170 kb, 약 170 kb 내지 약 180 kb, 약 180 kb 내지 약 190 kb, 또는 약 190 kb 내지 약 200 kb일 수 있다. 대안적으로, 각각의 상동성 아암은 적어도 5 kb, 적어도 10 kb, 적어도 15 kb, 적어도 20 kb, 적어도 30 kb, 적어도 40 kb, 적어도 50 kb, 적어도 60 kb, 적어도 70 kb, 적어도 80 kb, 적어도 90 kb, 적어도 100 kb, 적어도 110 kb, 적어도 120 kb, 적어도 130 kb, 적어도 140 kb, 적어도 150 kb, 적어도 160 kb, 적어도 170 kb, 적어도 180 kb, 적어도 190 kb, 또는 적어도 200 kb일 수 있다. 마찬가지로, 5' 및 3' 상동성 아암의 총계는 적어도 10 kb, 적어도 15 kb, 적어도 20 kb, 적어도 30 kb, 적어도 40 kb, 적어도 50 kb, 적어도 60 kb, 적어도 70 kb, 적어도 80 kb, 적어도 90 kb, 적어도 100 kb, 적어도 110 kb, 적어도 120 kb, 적어도 130 kb, 적어도 140 kb, 적어도 150 kb, 적어도 160 kb, 적어도 170 kb, 적어도 180 kb, 적어도 190 kb, 또는 적어도 200 kb일 수 있다.
LTVEC는 세포에서 상동성 재조합을 수행하기 위해 의도된 다른 접근법에 의해 전형적으로 사용된 것보다 더 큰 핵산 서열을 갖는 핵산 삽입물을 포함할 수 있다. 예를 들어, LTVEC는 약 5 kb 내지 약 10 kb, 약 10 kb 내지 약 20 kb, 약 20 kb 내지 약 40 kb, 약 40 kb 내지 약 60 kb, 약 60 kb 내지 약 80 kb, 약 80 kb 내지 약 100 kb, 약 100 kb 내지 약 150 kb, 약 150 kb 내지 약 200 kb, 약 200 kb 내지 약 250 kb, 약 250 kb 내지 약 300 kb, 약 300 kb 내지 약 350 kb, 약 350 kb 내지 약 400 kb, 또는 그 초과 범위의 핵산 삽입물을 포함할 수 있다.
E. 세포의 게놈 접촉 및 세포로의 핵산 도입
세포의 게놈을 접촉시키는 것은, 하나 이상의 뉴클레아제 제제 또는 핵산 암호화 뉴클레아제 제제 (예컨대, 하나 이상의 Cas 단백질)을 암호화하는 하나 이상의 Cas 단백질 또는 핵산, 및 하나 이상의 가이드 RNA (즉, 하나 이상의 CRISPR RNA 및 하나 이상의 tracrRNA)를 암호화하는 하나 이상의 가이드 RNA 또는 핵산 및/또는 하나 이상의 외인성 수선 주형을 세포로 도입하는 것을 포함하며, 단, 상기 세포가 1세포기 배아일 경우, 예를 들어, 외인성 수선 주형은 길이가 5 kb 미만일 수 있다. 세포의 게놈 접촉 (즉, 세포 접촉)은 상기 성분의 단 하나, 성분의 하나 이상, 또는 모든 성분을 세포에 도입하는 것을 포함할 수 있다. "도입"은 서열이 세포의 내측에 접근하는 그와 같은 방식으로 핵산 또는 단백질을 세포에 제시하는 것을 포함한다. 도입은 임의의 수단에 의해 달성될 수 있고, 성분 중 하나 이상 (예를 들면, 성분 중 2개, 또는 모든 성분)가 세포에 동시에 또는 임의의 조합으로 순차적으로 도입될 수 있다. 예를 들어, 외인성 수선 주형은 뉴클레아제 제제의 도입에 앞서 도입될 수 있거나, 뉴클레아제 제제의 도입 이후 도입될 수 있다 (예를 들면, 외인성 수선 주형은 뉴클레아제 제제의 도입 약 1, 2, 3, 4, 8, 12, 24, 36, 48, 또는 72 시간 전 또는 후 투여될 수 있다). 참고: 예컨대, US 2015/0240263 및 US 2015/0110762 (이의 각각은 모든 목적을 위하여 그 전체내용이 참고로 본원에 편입됨).
뉴클레아제 제제는 단백질의 형태로, 또는 뉴클레아제 제제를 암호화하는 핵산, 예컨대 RNA [예를 들면, 메신저 RNA (mRNA)] 또는 DNA의 형태로 세포에 도입될 수 있다. DNA의 형태로 도입된 경우, DNA는 세포에서 활성인 프로모터에 작동가능하게 연결될 수 있다. 그와 같은 DNA는 하나 이상의 발현 작제물일 수 있다.
예를 들어, Cas 단백질은 단백질, 예컨대 gRNA와 복합체화된 Cas 단백질의 형태로, 또는 Cas 단백질을 암호화하는 핵산, 예컨대 RNA (예를 들면, 메신저 RNA (mRNA)) 또는 DNA의 형태로 세포에 도입될 수 있다. 가이드 RNA는 RNA의 형태로 또는 가이드 RNA를 암호화하는 DNA의 형태로 세포에 도입될 수 있다. DNA의 형태로 도입된 경우, Cas 단백질 및/또는 가이드 RNA를 암호화하는 DNA는 세포에서 활성인 프로모터에 작동가능하게 연결될 수 있다. 그와 같은 DNA는 하나 이상의 발현 작제물일 수 있다. 예를 들어, 그와 같은 발현 작제물은 단일 핵산 분자의 성분일 수 있다. 대안적으로, 이들은 2 이상의 핵산 분자 중에서 임의의 조합으로 분리될 수 있다 (즉, 하나 이상의 CRISPR RNA를 암호화하는 DNA, 하나 이상의 tracrRNA, 및 Cas 단백질을 암호화하는 DNA를 암호화하는 DNA는 별개의 핵산 분자의 성분일 수 있다).
일부 방법에서, 뉴클레아제 제제 (예를 들면, Cas 단백질 및 가이드 RNA)를 암호화하는 DNA 및/또는 외인성 수선 주형을 암호화하는 DNA는, DNA 미니서클을 통해 세포에 도입될 수 있다. 참고: 예컨대, WO 2014/182700 (이는 모든 목적을 위하여 그 전체내용이 참고로 본원에 편입됨). DNA 미니서클은 복제의 기원도, 항생제 선택 마커도 갖지 않는 비-바이러스 유전자 전달에 사용될 수 있는 초나선 DNA 분자이다. 따라서, DNA 미니서클은 플라스미드 벡터보다 크기가 전형적으로 더 작다. 이들 DNA는 박테리아 DNA가 결여되고 따라서 박테리아 DNA에서 발견된 메틸화되지 않은 CpG 모티프가 결핍된다.
본 명세서에서 제공된 방법은 세포에 핵산 또는 단백질을 도입하기 위한 특정 방법에 의존하지 않고, 핵산 또는 단백질이 최소 하나의 세포의 내측에 접근한다는 점에만 의존한다. 핵산 및 단백질을 다양한 세포 유형에 도입하는 방법은 당해 분야에서 공지되고, 예를 들어, 안정된 형질감염 방법, 일시적 형질감염 방법, 및 바이러스-매개된 방법을 포함한다.
형질감염 프로토콜 뿐만 아니라 핵산 또는 단백질을 세포에 도입하기 위한 프로토콜은 다양할 수 있다. 비-제한적인 형질감염 방법은 하기를 사용하는 화학성질-기반 형질감염 방법을 포함한다: 리포좀; 나노입자; 인산칼슘 (Graham 외 (1973) Virology 52 (2): 456-67, Bacchetti 외 (1977) Proc . Natl . Acad . Sci . USA 74 (4): 1590-4, 및 Kriegler, M (1991). Transfer and Expression: A Laboratory Manual. New York: W. H. Freeman and Company. pp. 96-97); 덴드리머; 또는 양이온성 폴리머, 예컨대 DEAE-덱스트란 또는 폴리에틸렌이민. 비-화학적 방법은 전기천공, 소노-포레이션 (Sono-poration), 및 광학 형질감염을 포함한다. 입자 기반 형질감염은 유전자 총(gene gun) 또는 자석 보조 형질감염 (magnet-assisted transfection)의 사용을 포함한다 (Bertram (2006) Current Pharmaceutical Biotechnology 7, 277-28). 바이러스 방법도 또한 형질감염에 사용될 수 있다.
세포에 핵산 또는 단백질의 도입은 또한 전기천공, 세포내질 주사, 바이러스 감염, 아데노바이러스, 아데노-관련 바이러스, 렌티바이러스, 레트로바이러스, 형질감염, 지질-매개된 형질감염, 또는 뉴클레오펙션(nucleofection)으로 매개될 수 있다. 뉴클레오펙션은 핵산 기질을 세포질에 전달될 뿐만 아니라 핵 막을 통해 핵에 전달되도록 하는 개선된 전기천공 기술이다. 게다가, 본 명세서에서 개시된 방법에서 뉴클레오펙션의 사용은, 전형적으로 규칙적 전기천공보다 훨씬 더 적은 세포 (예를 들면, 일반 전기천공 시의 7백만개에 비해, 단지 약 2백만개)를 요구한다. 일 예시에서, 뉴클레오펙션은 LONZA® NUCLEOFECTOR™ 시스템을 사용하여 수행된다.
세포 (예를 들면, 1세포기 배아)에 핵산 또는 단백질의 도입은 또한 미세주입으로 달성될 수 있다. 1세포기 배아에서, 미세주입은 모계 및/또는 부계 전핵 또는 세포질에 실시될 수 있다. 미세주입이 단 하나의 전핵에 실시되는 경우, 이 때 부계 전핵은 크기가 더 크므로 바람직하다. mRNA의 미세주입은 바람직하게는 (예컨대, mRNA를 번역 기작에 직접적으로 전달하기 위하여) 세포질 내로 수행되며, 한편 Cas 단백질을 암호화하는 DNA 또는 단백질의 미세주입은 바람직하게는 핵/전핵 내로 수행된다. 대안적으로, 미세주입은 하기의 핵/전핵 및 세포질 둘 모두에 대한 주입에 의하여, 수행될 수 있다: 핵/전핵에 바늘이 먼저 도입되어고 제1 양을 주사할 수 있고, 그리고 1세포기 배아로부터 바늘을 제거하는 동안 제2 양을 세포질에 주사할 수 있다. 뉴클레아제 제제 단백질이 세포질에 주사되면, 단백질은 바람직하게는 핵 국재화 신호를 포함하여, 핵/전핵에 전달을 보장한다. 미세주입 실행 방법은 널리 공지되어 있다. 참고: 예컨대, Nagy 외 (Nagy A, Gertsenstein M, Vintersten K, Behringer R., 2003, Manipulating the Mouse Embryo. Cold Spring Harbor, New York: Cold Spring Harbor Laboratory Press); Meyer 외 (2010) Proc . Natl. Acad . Sci . USA 107:15022-15026, 및 Meyer 외 (2012) Proc . Natl . Acad . Sci. USA 109:9354-9359.
세포에 핵산 또는 단백질을 도입하는 다른 방법은, 예를 들어, 벡터 전달, 입자-매개된 전달, 엑소좀-매개된 전달, 지질-나노입자-매개된 전달, 세포-투과-펩타이드-매개된 전달, 또는 이식가능-디바이스-매개된 전달을 포함할 수 있다.
세포에 핵산 또는 단백질의 도입은 일정 기간 동안 1회 또는 다회 수행될 수 있다. 예를 들어, 도입은 일정 기간 동안 적어도 2회, 적어도 3회, 적어도 4회, 적어도 5회, 적어도 6회, 적어도 7회, 적어도 8회, 적어도 9회, 적어도 10회, 적어도 11회, 적어도 12회, 적어도 13회, 적어도 14회, 적어도 15회, 적어도 16회, 적어도 17회, 적어도 18회, 적어도 19회, 또는 적어도 20회 수행될 수 있다.
일부 경우에서, 방법 및 조성물에서 이용된 세포는 이의 게놈에 안정적으로 편입된 DNA 작제물을 갖는다. 그와 같은 경우에, 접촉은 이의 게놈에 이미 안정적으로 편입된 작제물을 포함하는 세포를 제공하는 것을 포함할 수 있다. 예를 들어, 본 명세서에서 개시된 방법에서 이용된 세포는 이의 게놈 (즉, Cas-준비 세포)에 안정적으로 편입된 기존의 Cas-암호화 유전자를 가질 수 있다. "안정적으로 편입된" 또는 "안정적으로 도입된" 또는 "안정적으로 통합된"은, 뉴클레오타이드 서열이 세포의 게놈에 통합되어 이의 자손에게 물려줄 수 있도록, 세포에 폴리뉴클레오타이드를 도입하는 것을 포함한다. 임의의 프로토콜은 표적화된 게놈 통합 시스템의 DNA 작제물 또는 다양한 성분의 안정된 편입에 사용될 수 있다.
F. 표적화된 유전적 변형의 유형
표적화된 유전적 변형의 다양한 유형은 본 명세서에서 기재된 방법을 사용하여 도입될 수 있다. 이러한 표적화된 변형은 예를 들어 하나 이상의 뉴클레오타이드의 부가, 하나 이상의 뉴클레오타이드의 결실, 하나 이상의 뉴클레오타이드의 치환, 점 돌연변이, 관심 폴리뉴클레오타이드 또는 이의 일부의 넉아웃 (kncokout), 관심 폴리뉴클레오타이드 또는 이의 일부의 넉인(knock-in), 이종성, 외인성, 상동성, 또는 병렬상동성 핵산 서열에 의한 내인성 핵산 서열의 대체, 도메인 스왑(swap), 엑손 스왑, 인트론 스왑, 조절 서열 스왑, 유전자 스왑 또는 이들의 조합을 포함할 수 있다. 예를 들어, 적어도 1, 2, 3, 4, 5, 7, 8, 9, 10개 이상의 뉴클레오타이드가 표적화된 게놈 변형을 형성하기 위해 변화 (예를 들면, 결실, 삽입, 또는 치환)될 수 있다. 결실, 삽입, 또는 대체는, 본 명세서에서 다른 곳에 개시된 바와 같이, 임의의 크기일 수 있다. 참고: 예컨대, Wang 외 (2013) Cell 153:910-918; Mandalos 외 (2012) PLOS ONE 7:e45768:1-9; 및 Wang 외 (2013) Nat Biotechnol. 31:530-532 (이들의 각각은 모든 목적을 위하여 그 전체가 참고로 본 명세서에서 편입됨).
상기 표적화된 유전적 변형은 표적 게놈 좌위의 파괴를 유발할 수 있으며, 질환-유발 돌연변이 또는 질환-유발 대립유전자를 도입할 수 있으며, 표적 게놈 좌위의 인간화 (즉, 비-인간 핵산 서열의 상동성 또는 병렬상동성 인간 핵산 서열로의 대체)를 유발할 수 있으며, 조건적 대립유전자를 형성할 수 있으며, 그리고 다른 동일한 것들이 발생할 수 있다. 파괴는 조절 요소 (예를 들면, 프로모터 또는 인핸서)의 변경, 미스센스 돌연변이, 넌센스 돌연변이, 프레임-시프트 돌연변이, 절단 돌연변이, 삭제 돌연변이, 또는 적은 수의 뉴클레오타이드의 삽입 또는 결실 (예를 들면, 프레임시프트 돌연변이 야기)를 포함할 수 있으며, 그리고 이는 비활성화 (즉, 작용 손실) 또는 대립유전자의 손실을 유발한다.
표적화된 유전적 변형은, 예를 들어, 이중 대립유전자성 변형 또는 단일 대립유전자성 변형일 수 있다. 바람직하게는, 표적화된 유전적 변형은 단일 대립유전자성 변형이다. 이중 대립유전자성 변형은 동일한 변형이 (예를 들면, 2배체 세포에서) 상응하는 상동 염색체의 동일한 좌위에 실시되는, 또는 상이한 변형이 상응하는 상동 염색체의 동일한 좌위에 실시되는 사건을 포함한다. 일부 방법에서, 표적화된 유전적 변형은 단일 대립유전자성 변형이다. 단일 대립유전자성 변형은, 변형이 오직 1개 대립유전자에 대해서만 제조 (즉, 2개 상동 염색체 중 오직 하나 내에서의 Fbn1 유전자에 대한 변형)되는 사건을 포함한다. 상동 염색체는 동일한 좌위에 동일한 유전자를 갖지만, 가능하게는 상이한 대립유전자를 가질 수도 있는 염색체 (예를 들면, 감수분열 동안 쌍 형성되는 염색체)를 포함한다. 용어 대립유전자는 유전적 서열의 임의의 하나 이상의 대안적인 형태를 포함한다. 2배체 세포 또는 유기체에서, 소정의 서열의 2개 대립유전자는 전형적으로 한 쌍의 상동 염색체에서 상응하는 좌위를 차지한다.
단일대립유전자성 돌연변이는 표적화된 Fbn1 변형에 대하여 이형접합자인 세포를 유발할 수 있다. 이형접합자는, Fbn1 유전자 중 오직 하나의 대립유전자 (즉, 둘 모두의 상동 염색체 상에서의 상응하는 대립유전자)만이 표적화된 변형을 갖는 사건을 포함한다.
이중 대립유전자성 변형은 표적화된 변형에 대하여 동종접합성을 초래할 수 있다. 동종접합성은, Fbn1 유전자의 대립유전자 둘 모두 (즉, 양쪽 상동 염색체 상의 상응하는 대립유전자)가 표적화된 변형을 갖는 사건을 포함한다. 예를 들어, 이중 대립유전자성 변형은, Cas 단백질이 제1 가이드 RNA 인식 서열 내에서 (즉, 제1 가이드 RNA 인식 서열 내 제1 절단 부위에서) 제1 및 제2 상동 염색체 쌍을 절단하고, 이로써 제1 및 제2 상동 염색체 내 말단 서열을 생성하는 경우, 생성될 수 있다. 제1 및 제2 상동 염색체 각각에서의 말단 서열은 외인성 수선 주형에 의하여 매개된 수선 과정을 실시하여, 이후 표적화된 유전적 변형을 포함하는 이중 대립유전자성 변형을 갖는 게놈을 형성할 수 있다. 예를 들어, 외인성 수선 주형은 핵산 삽입물을 포함할 경우, 핵산 삽입물은 제1 및 제2 상동 염색체 쌍에서의 Fbn1 유전자 내 삽입되고, 이로써 동종접합성 변형된 게놈을 유발할 수 있다.
대안적으로, 이중 대립유전자성 변형은 표적화된 변형에 대하여 복합 이형접합성(compound heterozygosity) [예를 들면, 반접합성(hemizygosity)]을 초래할 수 있다. 복합 이형접합성은 상기 표적 좌위의 양쪽 대립유전자 (즉, 양쪽 상동 염색체에서 대립유전자)가 변형되었지만, 이들이 상이한 방식 (예를 들면, 하나의 대립유전자의 표적화된 변형, 및 다른 대립유전자의 불활성화 또는 파괴)으로 변형된 상황을 포함한다. 예를 들어, 표적화된 변형의 부재 하에서 대립유전자에서, Cas 단백질에 의해 형성된 이중-가닥 파단은, 비-상동 말단 연결 (NHEJ)-매개된 DNA 수선에 의해 수선될 수 있고, 이는 핵산 서열의 삽입 또는 결실을 포함하는 돌연변이체 대립유전자를 생성하며, 이로 인해 게놈 좌위의 파괴를 야기시킨다. 예를 들어, 이중 대립유전자성 변형은 세포가 표적화된 변형을 가진 하나의 대립유전자 및 발현될 수 없는 또 다른 대립유전자를 갖는 경우, 복합 이형접합성을 초래할 수 있다. 복합 이형접합성은 반접합성을 포함한다. 반접합성은 표적 좌위의 단 하나의 대립유전자 (즉, 2개 상동 염색체 중 하나에서의 대립유전자)가 존재하는 상황을 포함한다. 예를 들어, 표적화된 변형이 하나의 대립 유전자에 발생하고, 다른 대립 유전자에는 상응하는손실 또는 결실이 발생하는 경우, 이중 대립유전자성 변형은 반접합성으로 발생할 수 있다.
G. 표적화된 유전적 변형에 의한 세포 식별
본원에 개시된 방법은 변형된 Fbn1 유전자를 갖는 세포를 식별하는 것을 추가로 포함할 수 있다. 다양한 방법은 표적화된 유전적 변형, 예컨대 결실 또는 삽입을 갖는 세포를 식별하는데 사용될 수 있다. 상기 방법은 Fbn1 유전자 내 표적화된 유전적 변형을 갖는 일 세포를 식별하는 것을 포함할 수 있다. 스크리닝은 변형된 게놈 좌위를 갖는 그와 같은 세포를 식별하는데 실시될 수 있다.
스크리닝 단계는 모 염색체의 대립유전자 (MOA)의 변형을 평가하기 위한 정량적 에세이 (예를 들면, 대립유전자 손실 (loss-of-allele, LOA) 및/또는 대립유전자 추가 (gain-of-allele, GOA) 에세이)를 포함할 수 있다. 예를 들어, 정량적 에세이는 정량적 PCR, 예컨대 실시간 PCR (qPCR)을 통해 수행될 수 있다. 실시간 PCR은 표적 게놈 좌위를 인식하는 제1 프라이머 세트, 및 비-표적화된 참조 좌위를 인식하는 제2 프라이머 세트를 이용할 수 있다. 프라이머 세트는 증폭된 서열을 인식하는 형광 프로브를 포함할 수 있다.
스크리닝 단계는 또한, 표적 게놈 좌위 외부의 게놈 위치에 핵산 삽입물이 무작위 형질전환 삽입된 것으로부터, 표적 게놈 좌위에 핵산 삽입물이 올바르게 표적화 삽입된 것을 구별하는데 사용된 에세이인, 유지 에세이(retention assay)를 포함할 수 있다. 표적화된 변형에 대하여 스크리닝을 위한 종래의 에세이, 예컨대 광범위 PCR 또는 서던 블랏팅은, 삽입된 표적화 벡터를 표적화된 좌위에 연결한다. 그러나, LTVEC는 이의 큰 상동성 아암 크기 때문에, 그와 같은 종래의 에세이에 의한 스크리닝을 허용하지 않는다. LTVEC 표적화를 스크리닝하기 위해, 대립유전자 손실 (LOA) 및 대립유전자 추가 (GOA) 에세이를 포함하는 대립유전적 변형 (MOA) 에세이가 사용될 수 있다 (참고: 예컨대, US 2014/0178879 및 Frendewey 외 (2010) Methods Enzymol . 476:295-307 (이들의 각각은 모든 목적을 위하여 그 전체가 참고로 본 명세서에서 편입됨)). 대립유전자 손실 (LOA) 에세이는 종래의 스크리닝 논리를 반전시켜, 돌연변이가 유도되었던 천연 좌위의 사본의 수를 정량화시킨다. 올바르게 표적화된 세포 클론에서, LOA 에세이는 (X 또는 Y 염색체에 있지 않은 유전자에 대하여) 2개 천연 대립유전자 중 하나를 검출하고, 다른 대립유전자는 표적화된 변형에 의해 파괴된다. 동일한 원리는 대립유전자 추가 (GOA) 에세이에서 반대로 적용되어, 삽입된 표적화 벡터의 사본 수를 정량화할 수 있다. 예를 들어, GOA 및 LOA 에세이들의 조합된 사용은, 천연 표적 유전자의 손실된 하나의 사본, 및 약물 내성 유전자 또는 다른 삽입된 마커의 이득된 하나의 사본를 갖는 올바르게 표적화된 이형접합자 클론을 밝혀낼 것이다.
예로서, 정량적 폴리머라제 쇄 반응 (qPCR)은 대립유전자 정량화의 방법으로서 사용될 수 있지만, 상기 표적 유전자의 0, 1, 및 2개 사본, 또는 핵산 삽입물의 0, 1, 및 2개 사본 사이의 차이를 확실하게 구별할 수 있는 임의의 방법은 MOA 에세이를 개발하는데 사용될 수 있다. 예를 들어, TAQMAN®은, 특히 참조 유전자와 비교하여, 게놈 DNA 샘플에서 DNA 주형의 사본의 수를 정량화하는데 사용될 수 있다 (참고: 예컨대, US 6,596,541 (이는 모든 목적을 위하여 그 전체내용이 참고로 본원에 편입됨)). 참조 유전자는 상기 표적 유전자(들) 또는 좌위 (들)로서 동일한 게놈 DNA에서 정량화된다. 따라서, 2회 TAQMAN® 증폭 (각각 이의 각각의 프로브를 가짐)이 수행된다. 일 TAQMAN® 프로브는 참조 유전자의 "Ct" (역치 주기)을 결정하고, 한편 다른 프로브는 성공적인 표적화 (즉, LOA 에세이)에 의해 대체되는 표적화된 유전자(들) 또는 좌위(좌위들)의 영역의 Ct를 결정한다. Ct는 각각의 TAQMAN® 프로브를 위한 개시 DNA의 양을 반영하는 양이며, 즉 덜 풍부한 서열은 역치 주기를 달성하기 위해 PCR의 더 많은 주기를 필요로 한다. TAQMAN® 반응용 주형 서열의 사본의 수 절반만큼 감소는 약 1 Ct 유닛의 증가를 초래할 것이다. 상기 표적 유전자(들) 또는 좌위(좌위들)의 하나의 대립유전자가 상동 재조합으로 대체된 세포에서 TAQMAN® 반응은, 비-표적화된 세포로부터 DNA에 비교된 경우, 참조 유전자용 Ct의 증가 없이 표적 TAQMAN® 반응용 1 Ct의 증가를 초래할 것이다. GOA 에세이를 위해서는, 또 다른 TAQMAN® 프로브가 성공적인 표적화에 의해 표적화된 유전자(들) 또는 좌위(좌위들)을 대체하고 있는 핵산 삽입물의 Ct를 결정하는데 사용될 수 있다. 쌍형성 gRNA는 표적 게놈 좌위에서 큰 Cas-매개된 결실을 형성할 수 있기 때문에, 이는 (즉, 1세포기 배아 이외의 세포에서) LTVEC에 의한 올바른 표적화를 입증하는데 유용한 확대 표준 LOA 및 GOA 에세이일 수 있다. 예를 들어, LOA 및 GOA 에세이는 단독으로는, 특히 GOA 에세이가 LTVEC 삽입물 이내 선택 카세트에 대한 프로브를 이용할 경우, 표적 게놈 좌위의 큰 Cas-유도된 결실이 게놈에서 다른 곳에서 무작위로 발생한 LTVEC의 통합과 일치하는 클론으로부터, 올바르게 표적화된 세포 클론을 식별할 수 없다. 표적화된 세포에서 선택 압력은 선택 카세트에 기반되기 때문에, 게놈에서 다른 곳에 발생한 LTVEC의 무작위 형질전환 통합은 일반적으로 선택 카세트 및 LTVEC의 인접한 영역을 포함할 것이지만, LTVEC의 원위 영역은 더 많이 배제할 것이다. 예를 들어, LTVEC의 일부가 게놈에 무작위로 통합되면, LTVEC은 3' 상동성 아암에 인접한 선택 카세트와 길이가 약 5 kb 이상의 핵산 삽입물을 포함하고, 일반적으로 5' 상동성 아암이 아닌 3' 상동성 아암은 선택 카세트에 형질전환에 의해 통합될 것이다. 대안적으로, 선택 카세트가 5' 상동성 아암에 인접하면, 일반적으로 3' 상동성 아암이 아닌 5' 상동성 아암은 선택 카세트에 형질전환에 의해 통합될 것이다. 예로서, LOA 및 GOA 에세이가 LTVEC의 표적화된 통합을 평가하는데 사용되면, GOA 에세이는 선택 카세트에 대한 프로브를 이용하고, LTVEC의 무작위 형질전환 통합과 조합된 표적 게놈 좌위에서 이형접합자 결실은 표적 게놈 좌위에서 LTVEC의 이형접합자 표적화된 통합과 동일한 판독된 정보를 제공할 것이다. LTVEC에 의한 올바른 표적화를 입증하기 위해, 유지 에세이는, 단독으로 또는 LOA 및/또는 GOA 에세이와 함께 사용될 수 있다.
유지 에세이는 (LTVEC의 5' 상동성 아암에 상응하는) 5' 표적 서열 및/또는 (LTVEC의 3' 상동성 아암에 상응하는) 3' 표적 서열에서 DNA 주형의 사본 수를 결정한다. 특히, 선택 카세트에 인접한 상동성 아암에 상응하는 표적 서열에서 DNA 주형의 사본 수 결정은 유용하다. 2배체 세포에서, 2개 초과의 사본 수는 일반적으로, 바람직하지 않은, 표적 게놈 좌위에서 보다는 표적 게놈 좌위의 외부에서 무작위로 LTVEC의 형질전환 통합을 나타낸다. 올바르게 표적화된 클론은 2개의 사본 수를 유지할 것이다. 게다가, 그와 같은 유지 에세이에서 2개 미만의 사본 수는 일반적으로, 또한 바람직하지 않은, 결실에 표적화된 영역을 넘어서 확장하는 큰 Cas-매개된 결실을 나타낸다. 참고: 예컨대, US 2016/0145646 및 WO 2016/081923 (이의 각각은 모든 목적을 위하여 그 전체내용이 참고로 본원에 편입됨).
적합한 정량적 에세이의 다른 예는 하기를 포함한다: 형광-매개된 원위치 혼성화 (FISH), 비교 게놈 혼성화, 등온성 DNA 증폭, 고정된 프로브(들)에 대한 정량적 혼성화, INVADER® 프로브, TAQMAN® 분자 항로표지 프로브, 또는 ECLIPSE™ 프로브 기술 (참고: 예컨대, US 2005/0144655 (이는 모든 목적을 위하여 그 전체내용이 참고로 본원에 편입됨)). 표적화된 변형에 대하여 스크리닝을 위한 종래의 에세이, 예컨대 광범위 PCR, 서던 블랏팅, 또는 생거(Sanger) 서열분석이 또한 사용될 수 있다. 그와 같은 에세이는 전형적으로 삽입된 표적화 벡터와 표적화된 게놈 좌위 사이 연결에 대하여 증거를 수득하기 위해 사용된다. 예를 들어, 광범위 PCR 에세이를 위하여, 일 프라이머는 삽입된 DNA 이내 서열을 인식할 수 있고 한편 다른의 것은 표적화 벡터의 상동성 아암의 말단을 넘어서 표적 게놈 좌위 서열을 인식한다.
차세대 서열분석 (NGS)는 또한, 특히 변형된 1세포기 배아에서 스크리닝에 사용될 수 있다. 차세대 서열분석은 또한 "NGS" 또는 "대량 병렬 서열분석" 또는 "고 처리율 서열분석"으로 지칭될 수 있다. 그와 같은 NGS는 표적화된 유전적 변형의 정확한 성질을 정의하기 위해 그리고 모자이크 현상을 검출하기 위해 MOA 에세이 및 유지 에세이에 더하여 스크리닝 도구로서 사용될 수 있다. 모자이크 현상은 단일 수정란 (즉, 접합체)로부터 개발된 하나의 개체에서 상이한 유전자형을 가진 세포의 2 이상의 모집단의 존재를 지칭한다. 본 명세서에서 개시된 방법에서, 선택 마커를 사용하여 표적화된 클론에 대하여 스크리닝하는 것이 필요 없다. 예를 들어, 본 명세서에서 기재된 MOA 및 NGS 에세이는 선택 카세트 사용 없이 신뢰가능할 수 있다.
H. 유전적으로 변형된 비-인간 동물의 제조 방법
유전적으로 변형된 비-인간 동물은 본 명세서에서 개시된 다양한 방법을 이용하여 생성될 수 있다. 본 명세서에서 기재된 방법을 포함하여, 유전적으로 변형된 유기체 생산을 위한 임의의 편리한 방법 또는 프로토콜은 그와 같은 유전적으로 변형된 비-인간 동물의 생산에 적합하다. 유전적으로 변형시키는 만능 세포 예컨대 배아 줄기 (ES) 세포로 개시하는 그와 같은 방법은 일반적으로 하기 단계를 포함한다: (1) 본 명세서에서 기재된 방법을 사용하여 1세포기 배아가 아닌 만능 세포의 게놈을 변형시키는 단계; (2) 유전적으로 변형된 만능 세포를 식별 및 선별하는 단계; (3) 유전적으로 변형된 만능 세포를 숙주 배아에 도입하는 단계; 및 (4) 대리모에서 유전적으로 변형된 만능 세포를 포함하는 숙주 배아를 이식 및 잉태하는 단계. 대리모는 그 다음 표적화된 유전적 변형을 포함하는 그리고 생식계열을 통해 표적화된 유전적 변형을 전달할 수 있는 F0 세대 비-인간 동물을 생산할 수 있다. 유전적으로 변형된 게놈 좌위를 보유하는 동물은 본 명세서에서 기재된 바와 같이 대립유전자 (MOA) 에세이의 변형을 통해 식별될 수 있다. 공여체 세포는 임의의 단계, 예컨대 배반포기 또는 전-상실배기 (즉, 4 세포기 또는 8 세포기)에서 숙주 배아에 도입될 수 있다. 생식계열을 통해 유전적 변형을 전달할 수 있는 자손이 생성된다. 만능 세포는, 예를 들어, 본 명세서에서 다른 곳에 논의된 바와 같이 ES 세포 (예를 들면, 설치류 ES 세포, 마우스 ES 세포, 또는 랫트 ES 세포)일 수 있다. 참고: 예컨대, 미국 특허 번호 7,294,754 (이는 모든 목적을 위하여 그 전체내용이 참고로 본원에 편입됨).
대안적으로, 유전적으로 변형시키는 1세포기 배아로 개시하는 그와 같은 방법은 일반적으로 하기 단계를 포함한다: (1) 본 명세서에서 기재된 방법을 사용하여 1세포기 배아의 게놈을 변형시키는 단계; (2) 유전적으로 변형된 배아를 식별 또는 선별하는 단계; 및 (3) 대리모에서 유전적으로 변형된 배아를 이식 및 잉태하는 단계. 대리모는 그 다음 표적화된 유전적 변형을 포함하는 그리고 생식계열을 통해 표적화된 유전적 변형을 전달할 수 있는 F0 세대 비-인간 동물을 생산할 수 있다. 유전적으로 변형된 게놈 좌위를 보유하는 동물은 본 명세서에서 기재된 바와 같이 대립유전자 (MOA) 에세이의 변형을 통해 식별될 수 있다.
핵전이 기술은 또한 비-인간 포유동물 동물을 생성하는데 사용될 수 있다. 간단히, 핵전이 방법은 하기의 단계를 포함할 수 있다: (1) 난모세포를 제핵하는 또는 제핵된 난모세포를 제공하는 단계; (2) 제핵된 난모세포와 조합되도록 공여체 세포 또는 핵을 단리 또는 제공하는 단계; (3) 재구성된 세포를 형성하기 위해 제핵된 난모세포에 세포 또는 핵을 삽입하는 단계; (4) 배아를 형성하기 위해 비-인간 동물의 자궁에 재구성된 세포를 이식하는 단계; 및 (5) 배아를 발달시키는 단계. 그와 같은 방법에서, 난모세포는, 이들이 살아있는 동물의 어느 한쪽 난관 및/또는 난소로부터 또한 단리될 수 있어도, 사망한 동물로부터 일반적으로 회수된다. 난모세포는 제핵에 앞서 당해 분야의 숙련가에 공지된 여러 가지의 배지에서 성숙될 수 있다. 난모세포의 제핵은, 본 분야의 숙련가에게 잘 알려진 다수의 방식으로 수행될 수 있다. 재구성 세포를 형성하기 위한 제핵된 난모세포로의 공여체 세포 또는 핵의 삽입은, 융합 이전에 투명대 하의 공여체 세포의 미세주입에 의하여 수행될 수 있다. 융합은 접촉/융합 면을 거쳐 DC 전기 펄스의 인가 (전기융합)에 의해, 융합-촉진 화학물질, 예컨대 폴리에틸렌 글리콜에 세포의 노출에 의해, 또는 불활성화된 바이러스, 예컨대 센다이 바이러스에 의해 유도될 수 있다. 재구성된 세포는 핵 공여체 및 수령체 난모세포의 융합 이전의, 상기 동안의, 그리고/또는 상기 이후의 전기 및/또는 비-전기 수단에 의해 활성화될 수 있다. 활성화 방법은 전기 펄스, 화학적으로 유도된 쇼크, 정자에 의한 침투, 난모세포에서 2가 양이온의 수준 증가, 및 난모세포에서의 (키나제 억제제의 식으로서) 세포 단백질의 인산화 감소를 포함한다. 활성화된 재구성된 세포, 또는 배아는 당해 분야의 숙련가에 널리 공지된 배지에서 배양될 수 있고 그 다음 동물의 자궁에 전달될 수 있다. 참고: 예컨대, US 2008/0092249, WO 1999/005266, US 2004/0177390, WO 2008/017234, 및 미국 특허 번호 7,612,250 (이의 각각은 모든 목적을 위하여 그 전체내용이 참고로 본원에 편입됨).
본 명세서에서 제공된 다양한 방법은 표적화된 유전적 변형을 포함하는 유전적으로 변형된 F0 동물의 세포인 유전적으로 변형된 비-인간 F0 동물의 생성을 허용한다. F0 동물을 생성하는데 사용된 방법에 의존하여, 표적화된 유전적 변형을 갖는 F0 동물 이내 세포의 수는 다양할 것임이 인식된다. 예를 들어, VELOCIMOUSE® 방법을 통해 상응하는 유기체로부터 전-상실배기 배아 (예를 들면, 8-세포기 마우스 배아)에 대한 공여체 ES 세포의 도입은 표적화된 유전적 변형을 갖는 세포를 포함하기 위해 F0 동물의 세포 모집단의 더 큰 백분율을 허용한다. 예를 들어, 비-인간 F0 동물의 세포 구성분의 적어도 50%, 60%, 65%, 70%, 75%, 85%, 86%, 87%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%가 표적화된 유전적 변형을 갖는 세포 집단을 포함할 수 있다. 게다가, F0 동물의 적어도 하나 이상의 생식 세포는 표적화된 유전적 변형을 가질 수 있다.
I. 비-인간 동물 및 세포의 유형
본 명세서에서 제공된 방법은 비-인간 동물 그리고 비-인간 동물로부터 세포 및 배아를 이용한다. 그와 같은 비-인간 동물은 바람직하게는 포유동물, 예컨대 설치류 (예를 들면, 랫트, 마우스, 및 햄스터)이다. 다른 비-인간 포유동물은, 예를 들어, 비-인간 영장류, 원숭이, 유인원, 고양이, 개, 토끼, 말, 황소, 사슴, 들소, 가축 (예를 들면, 소 종 예컨대 소, 거세소, 및 다른 동종; 양 종 예컨대 양, 염소, 및 다른 동종; 및 돼지 종 예컨대 돼지 및 야생돼지)을 포함한다. 용어 "비-인간"은 인간을 배제한다.
본 명세서에서 제공된 방법에서 이용된 비-인간 동물 세포는, 예를 들어, 분화전능성 세포 또는 만능 세포 (예를 들면, 배아 줄기 (ES) 세포 예컨대 설치류 ES 세포, 마우스 ES 세포, 또는 랫트 ES 세포)일 수 있다. 분화전능성 세포는 임의의 세포 유형을 생기게 할 수 있는 미분화된 세포를 포함하고, 만능 세포는 1 초과 분화된 세포 유형으로 발생하는 능력을 갖는 미분화된 세포를 포함한다. 그와 같은 만능 및/또는 전분화성 세포는, 예를 들어, ES 세포 또는 ES-유사 세포, 예컨대 유도 만능 줄기 (iPS) 세포일 수 있다. ES 세포는 배아에 도입시 발생 배아의 임의의 조직에 기여할 수 있는 배아-유래된 전분화성 또는 만능 세포를 포함한다. ES 세포는 배반포의 내부 세포 덩어리로부터 유래될 수 있고 3개 척추동물 배엽층 (내배엽, 외배엽, 및 중배엽)의 어느 하나의 세포로 분화할 수 있다.
본 명세서에서 제공된 방법에서 이용된 비-인간 동물 세포는 또한 1세포기 배아 (즉, 수정된 난모세포 또는 접합체)를 포함할 수 있다. 그와 같은 1세포기 배아는 임의의 유전적 배경 (예를 들면, BALB/c, C57BL/6, 129, 또는 이들의 조합)일 수 있고, 신선하거나 냉동일 수 있고, 천연 교배 또는 시험관내 수정으로부터 유래될 수 있다.
본원에 제공된 방법에서 이용된 마우스 및 마우스 세포는, 예를 들어, 129 품종, C57BL/6 품종, BALB/c 품종, 스위스 웹스터 품종, 129 및 C57BL/6 품종의 혼혈, BALB/c 및 C57BL/6 품종의 혼혈, 129 및 BALB/c 품종의 혼혈, 및 BALB/c, C57BL/6, 및 129 품종의 혼혈을 포함하는, 임의의 품종 유래의 것일 수 있다. 예를 들어, 본 명세서에서 제공된 방법에서 이용된 마우스 또는 마우스 세포는 적어도 부분적으로 BALB/c 품종 유래의 것 (예를 들면, BALB/c 품종로부터 유래된 적어도 약 25%, 적어도 약 50%, 적어도 약 75%, 또는 BALB/c 품종로부터 유래된 약 25%, 약 50%, 약 75%, 또는 약 100%) 일 수 있다. 일 예에서, 마우스 또는 마우스 세포는 50% BALB/c, 25% C57BL/6, 및 25% 129를 포함하는 품종을 가질 수 있다. 대안적으로, 마우스 또는 마우스 세포는 BALB/c를 배제하는 품종 또는 품종 조합을 포함할 수 있다.
129 품종 및 C57BL 품종의 예시는 본원에서 다른 곳에 개시된다. 본 명세서에서 제공된 방법에서 이용된 마우스 및 마우스 세포는, 또한 상기 언급된 129 품종 및 상기 언급된 C57BL/6 품종 (예를 들면, 50%의 129 및 50%의 C57BL/6)의 혼합물 유래의 것일 수 있다. 마찬가지로, 본 명세서에서 제공된 방법에서 이용된 마우스 및 마우스 세포는 상기 언급된 129 품종의 혼혈, 또는 상기 언급된 BL/6 품종 (예를 들면, 129S6 (129/SvEvTac) 품종)의 혼혈 유래의 것일 수 있다. 마우스 ES 세포의 특정 예는 VGF1 마우스 ES 세포이다. (또한 F1H4로서 공지된) VGF1 마우스 ES 세포는 숫컷 129S6/SvEvTac 마우스에 암컷 C57BL/6NTac 마우스를 이종교배시킴으로써 생산된 혼혈 배아로부터 유래되었다. 참고: 예컨대, Auerbach 외 (2000) Biotechniques 29, 1024-1028 (이는 모든 목적을 위하여 그 전체내용이 참고로 본원에 편입됨).
본 명세서에서 제공된 방법에서 이용된 랫트 또는 랫트 세포는, 예를 들어, ACI 랫트 품종, 흑색 아구티 (DA) 랫트 품종, 위스타 랫트 품종, LEA 랫트 품종, 스프라그 도울리 (SD) 랫트 품종, 또는 피셔 랫트 품종, 예컨대 피셔 F344 또는 피셔 F6을 포함하는, 임의의 랫트 품종 유래의 것일 수 있다. 랫트 또는 랫트 세포는 또한 상기 인용된 2 이상의 품종의 혼혈로부터 유래된 품종로부터 수득될 수 있다. 예를 들어, 랫트 또는 랫트 세포는 DA 품종 또는 ACI 품종 유래의 것일 수 있다. ACI 랫트 품종은, 백색 배 및 발 그리고 RT1 av1 일배체형을 갖는, 흑색 아구티를 갖는 것을 특징으로 한다. 그와 같은 품종은 Harlan Laboratories를 포함하는 여러 가지의 공급원으로부터 입수할 수 있다. ACI 랫트로부터 랫트 ES 세포주의 예는 ACI.G1 랫트 ES 세포이다. 흑색 아구티 (DA) 랫트 품종은 아구티 코트(agouti coat) 및 RT1 av1 일배체형을 갖는 것으로 특성화된다. 그와 같은 랫트는 Charles River 및 Harlan Laboratories 사를 포함하는 여러 가지의 공급원으로부터 입수할 수 있다. DA 랫트로부터 랫트 ES 세포주의 예는, DA.2B 랫트 ES 세포주 및 DA.2C 랫트 ES 세포주이다. 일부 경우에서, 랫트 또는 랫트 세포는 근친교배한 랫트 품종 유래의 것이다. 참고: 예컨대, US 2014/0235933 A1 (이는 모든 목적을 위하여 그 전체내용이 참고로 본원에 편입됨).
숙주 배아로 이식된 세포는 "공여체 세포"로 지칭될 수 있다. 공여체 세포는 상이한 품종 유래의, 또는 숙주 배아와 동일한 품종 유래의 것일 수 있다. 마찬가지로, 대리모는 공여체 세포 및/또는 숙주 배아로서 동일한 품종 유래의 것일 수 있거나, 대리모는 공여체 세포 및/또는 숙주 배아로서 상이한 품종 유래의 것일 수 있다.
여러 가지의 숙주 배아는 본 명세서에서 개시된 방법 및 조성물에서 이용될 수 있다. 예를 들어, 공여체 세포 (예를 들면, 공여체 ES 세포)는 상응하는 유기체로부터 전-상실배기 배아 (예를 들면, 8-세포기 배아)에 도입될 수 있다. 참고: 예컨대, US 7,576,259; US 7,659,442; US 7,294,754; 및 US 2008/0078000 (이의 각각은 모든 목적을 위하여 그 전체내용이 참고로 본원에 편입됨). 다른 방법에서, 공여체 세포는 2-세포기, 4-세포기, 8-세포기, 16-세포기, 32-세포기, 또는 64-세포기에서 숙주 배아에 이식될 수 있다. 숙주 배아는 또한 배반포일 수 있거나 전-배반포 배아, 전-상실배기 배아, 상실배기 배아 (예컨대, 응집된 상실배기 배아), 미결속된 상실배기 배아, 또는 결속된 상실배기 배아일 수 있다. 마우스 배아를 이용하는 경우, 숙주 배아기는 하기에서 기재된 테일러(Theiler) 단계와 관련하여, Theiler 단계 1 (TS1), TS2, TS3, TS4, TS5, 및 TS6일 수 있다: Theiler (1989) "The House Mouse: Atlas of Mouse Development," Springer-Verlag, New York (이는 모든 목적을 위하여 그 전체내용이 참고로 본원에 편입됨). 예를 들어, 테일러(Theiler) 단계는 TS1, TS2, TS3, 및 TS4로부터 선택될 수 있다. 일부 방법에서, 숙주 배아는 투명대를 포함하고, 공여체 세포는 투명대에서 홀을 통해 숙주 배아에 도입되는 ES 세포이다. 다른 방법에서, 숙주 배아는 투명대(zona)-없는 배아이다.
Ⅲ. 화합물을 스크리닝하는 방법
본원에 기술된 Fbn1 돌연변이를 갖는 비-인간 동물은, 선천성 지방이영양증 (NPSCL)을 갖는 신생아 조로 증후군을 억제하거나 감소하거나, 또는 NPSCL-유사 증상 (예컨대, 선천성 지방이영양증-유사 증상)을 완화하는데 잠재적으로 유용한 활성에 대해 화합물을 스크리닝하기 위하여, 또는 NPSCL를 촉진하거나 악화하는데 잠재적으로 유해한 활성에 대하여 화합물을 스크리닝하기 위하여 사용될 수 있다. NPSCL를 억제하거나 감소시키거나, 또는 NPSCL-유사 증상을 완화하는 활성을 갖는 화합물은 NPSCL에 대한 치료제 또는 예방제로서 잠재적으로 유용성이 있다. NPSCL를 촉진 또는 악화시키는 활성을 갖는 화합물은 독극물로 식별되고, 그리고 이들은 인간과 접촉될 수 있는 다른 환경 (예를 들어, 음식, 농산물, 작제물, 또는 공급된 물)에서, 또는 치료제로서 회피될 것이다.
스크리닝될 수 있는 화합물의 예는 항체, 항원 결합 단백질, 부위 특이적 DNA 결합 단백질(예를 들어, CRISPR-Cas 복합체), 폴리펩타이드, 베타-회전(beta-turn) 모방체, 다당류, 인지질, 호르몬, 프로스타글란딘, 스테로이드, 방향족 화합물, 헤테로환계 화합물, 벤조디아제핀, 올리고머 N-치환된 글라이신 및 올리고카바메이트를 포함한다. 화합물의 대형 조합 라이브러리는 WO 제1995/012608호, WO 제1993/006121호, WO 제1994/008051호, WO 제1995/035503호 및 WO 제1995/030642호(이들은 각각 모든 목적을 위해 본 명세서에 그 전문이 참고로 포함됨)에 기재된 암호화된 합성 라이브러리(ESL) 방법에 의해 작제될 수 있다. 펩타이드 라이브러리는 파아지 디스플레이 방법에 의해 또한 생성될 수 있다. 참고: 예컨대, US 5,432,018 (이는 모든 목적을 위하여 그 전체내용이 참고로 본원에 편입됨). 상이한 유전자에 CRISPR-Cas 시스템을 표적화하기 위한 가이드 RNA의 라이브러리의 용도는 하기에 개시된다: 예컨대, WO 2014/204727, WO 2014/093701, WO 2015/065964, 및 WO 2016/011080 (이는 모든 목적을 위하여 그 전체내용이 참고로 본원에 편입됨).
동물-기반 에세이는 일반적으로, Fbn1 돌연변이체 비-인간 동물에게 화합물을 투여하는 것, 및 반응 변화에 대한 인간의 NPSCL의 증상과 밀접하게 유사한 증상을 평가하는 것을 포함한다. 변화는, 상기 화합물을 비-인간 동물과 접촉시키기 이전 및 이후의 증상의 정도로부터, 또는 상기 화합물의 부재 하에 동일한 Fbn1 돌연변이 (예컨대, 야생형 코호트 동배)를 갖는 대조군 동물로 수행된 대조군 실험을 수행함에 의하여, 평가될 수 있다.
모니터링될 수 있는 적합한 NPSCL-유사 징후 또는 증상은, 본원에서 다른 곳에 개시된 바와 같은, 체중, 지방 제외 질량, 지방 질량, 백색 지방 질량 (예컨대, 체중에 의하여 정규화됨), 체지방 백분율, 식품 섭취 (체중에 의하여 정규화됨), 및 척추후만증을 포함한다. 예를 들어, 백색 지방 조직 질량 (예컨대, 체중에 의하여 정규화됨)이 모니터링될 수 있다. 대안적으로, 이러한 증상은 하기 중 하나 이상과 병용하여 모니터링될 수 있다: 글루코스 내성, 혈청 콜레스테롤 수준, 혈청 트리글리세라이드 수준, 및 혈청 비-에스테르화 지방산 수준. 유사하게, 이러한 증상은 하기 중 하나 이상과 병용하여 모니터링될 수 있다: 글루코스 내성, 혈청 콜레스테롤 수준, 혈청 트리글리세라이드 수준, 혈청 비-에스테르화 지방산 수준, 간 중량, 갈색 지방 조직 (BAT) 중량, 내장 백색 지방 조직 (WAT) 중량, WAT 중량 (체중으로 정규화됨), 대사율 (체중으로 정규화됨), 에너지 소비량, 및 고-지방 식이에서의 인슐린 민감도. 예를 들어, 상기 NPSCL-유사 증상의 악화는 하기 중 하나 이상을 유발할 수 있다: 대조군 비-인간 동물에서의 증상의 수준과 비교하거나, 또는 화합물과의 접촉 이전의 증상의 수준과 비교하여, 체중 감소, 지방 제외 질량의 감소, 지방 질량의 감소, 백색 지방 조직의 감소 (예컨대, 체중에 의하여 정규화됨), 체지방 백분율의 감소, 식품 섭취의 증가 (체중에 의하여 정규화됨), 및 척추후만증의 증가. 상기 감소 또는 증가는 하기 중 하나 이상과 함께 발생할 수 있다: 감소된 간 중량, 보존된 갈색 지방 조직 (BAT) 중량 (예컨대, 체중에 의하여 정규화됨), 감소된 내장 백색 지방 조직 (WAT) 중량, 감소된 WAT 중량 (체중으로 정규화됨), 상승된 대사율 (체중으로 정규화됨), 증가된 에너지 소비량, 개선된 글루코스 내성, 및 인슐린 민감도의 개선 (고-지방 식이 중). 상기 감소 또는 증가는 정상치를 유지하는 하기 중 하나 이상과 함께 발생할 수 있다: 글루코스 내성, 혈청 콜레스테롤 수준, 혈청 트리글리세라이드 수준, 및 혈청 비-에스테르화 지방산 수준. 대안적으로, 상기 NPSCL-유사 증상의 완화는 하기 중 하나 이상을 유발할 수 있다: 화합물과의 접촉 이전의 증상의 수준과 비교하여, 또는 대조군 비-인간 동물에서의 증상의 수준과 비교하여, 증가된 체중, 증가된 지방 제외 질량, 증가된 지방 질량, 증가된 체지방 백분율, 감소된 식품 섭취 (체중에 의하여 정규화됨), 및 감소된 척추후만증. 상기 감소 또는 증가는 하기 중 하나 이상과 함께 발생할 수 있다: 증가된 간 중량, 보존 또는 변경된 갈색 지방 조직 (BAT) 중량 (예컨대, 체중에 의하여 정규화됨), 증가된 내장 백색 지방 조직 (WAT) 중량, 증가된 WAT 중량 (체중에 의하여 정규화됨), 감소된 대사율 정규화 내지 체중, 감소된 에너지 소비량, 감소된 글루코스 내성, 및 고-지방 식이에서의 감소된 인슐린 민감도. 상기 증상은 본원에 제공된 실시예에서 기술된 바와 같이 에세이될 수 있다. 감소 또는 증가는 통계적으로 유의미할 수 있다. 예를 들어, 감소 또는 증가는, 적어도 약 1%, 적어도 약 2%, 적어도 약 3%, 적어도 약 4%, 적어도 약 5%, 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 30%, 적어도 약 40%, 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 또는 100% 만큼일 수 있다.
상기 또는 하기 언급되는 모든 특허 출원, 웹사이트, 다른 공보, 수탁 번호 등은 각각의 개별 항목이 구체적이고 개별적으로 참고로 편입되는 것으로 나타낸 것과 동일한 정도로 모든 목적을 위해 이들의 전체가 참고로 편입된다. 서열의 상이한 버전이 상이한 시간에서 수탁 번호와 관련될 경우, 본 출원의 유효 출원일에서의 수탁 번호와 관련된 버전이 유효하다. 유효 출원일은 적용가능하면 수탁 번호를 참조하는 우선권 출원의 출원일 또는 실제 출원일의 더 빠른 것을 의미한다. 마찬가지로, 공보, 웹사이트 또는 다른 동종의 상이한 버전이 상이한 시간에 공개될 경우, 달리 표지되지 않는 한, 출원의 유효 출원일에서 가장 최근에 공개된 버전이 유효하다. 본 발명의 임의의 특징, 단계, 요소, 구현예, 또는 양태는 달리 특이적으로 나타내지 않는 한 임의의 다른 것과 병용하여 사용될 수 있다. 본 발명이 명확성 및 이해를 위해 예시 및 실시예에 의해 상당히 상세하게 기재되었음에도 불구하고, 첨부된 청구항의 범위 내에서 특정한 변화 및 변형이 실행될 수 있음이 명확할 것이다.
서열의 간략한 기술
첨부하는 서열 목록에서 열거된 뉴클레오타이드 및 아미노산 서열은, 뉴클레오타이드 염기에 대하여 표준 문자 약어, 그리고 아미노산에 대하여 3-문자 코드를 사용하여 도시된다. 뉴클레오타이드 서열은 서열의 5' 말단에서 개시하고 3' 말단까지 정방향으로 (즉, 각각의 라인에서 좌측으로부터 우측까지) 진행하는 표준 협약을 따른다. 각각의 뉴클레오타이드 서열의 단 하나의 가닥이 도시되지만, 상보성 가닥은 표시된 가닥에 대한 어떠한 언급에 의해서도 포함되는 것으로 이해된다. 아미노산 서열은 서열의 아미노 말단에서 개시하고 카르복시 말단까지 정방향으로 (즉, 각각의 라인에서 좌부터 우까지) 진행하는 표준 협약을 따른다.
1. 서열의 기재사항.
Figure pct00002
Figure pct00003
실시예
실시예 1. 절단된 C-말단을 갖는 MAID 8501 Fbn1 돌연변이체 마우스의 생성.
돌연변이체 Fbn1 마우스 대립유전자를 인간 돌연변이체 FBN1 대립유전자를 재형성하기 위하여 생성하였다. NM_007993.2를 참조 서열로서 사용하여, 돌연변이는 c.8213_8214delinsACT이다. c.8212 및 8213 사이에 A를 삽입하고, c.8214에서의 G>T 치환을 제조함에 의하여 생성된 이러한 돌연변이는, Fbn1의 말단으로부터 2번째 엑손 내 조기 종결 코돈을 유발한다. 돌연변이체 대립유전자는 MAID 8501로서 표지된다. 도 1을 참조한다. 상기 돌연변이는 말단으로부터 2번째 엑손의 최종 50개 뉴클레오타이드 내에 존재하고, 그리고 mRNA 넌센스-매개 붕괴 (NMD)를 건너뜀하도록 예측되어 돌연변이체, 절단된 전구피브릴린 단백질의 발현을 유도한다.
돌연변이체 대립유전자를 생성하기 위하여, CRISPR/Cas9 성분은 공여체 주형와 함께, 세포질 mRNA 피에조 주입 또는 전핵 주입을 통하여 C57BL/6 1세포기 배아로 도입되었다. 가이드 RNA DNA-표적화 서열의 서열은 서열 번호 37에 명시되며, 그리고 공여체의 서열은 서열 번호 38에 명시된다. NGS는 올바르게 표적화된 클론을 스크리닝하기 위하여 사용되었다. 표적화 결과는 표 2에 명시된다.
표 2. MAID 8501에 대한 표적화 결과.
Figure pct00004
F0 창시자 마우스는, 배아를 가임신 암컷 마우스로 미세주입한 후 생성되었다. 도 2에 나타난 바와 같이, MAID 8501 Fbn1 돌연변이에 대하여 동종접합성인 수컷 또는 암컷 마우스 중 어떤 것도 40일 후 생존하지 못했으며, 한편 수컷 및 암컷 이형접합자 마우스는 더 길게 생존하였다.
실시예 2. 절단된 C-말단을 갖는 MAID 8520 Fbn1 돌연변이체 마우스의 생성.
또 다른 실험에서, 가이드 RNA 서열 및 공여체 서열은 인간 c.8155_8156del Fbn1 대립유전자에 상응하는 돌연변이체 Fbn1 대립유전자를 생성하기 위하여 설계되었는데, 이는 암호화 엑손 64 (말단으로부터 2번째 엑손) 내 2개 염기쌍의 결실을 가져, 프레임시프트를 야기하고 p.Lys2719의 17개 코돈 하류에 후속 조기 종결 코돈을 갖는다. 예측된 변이체 대립유전자는 MAID 8502로서 표지된다. 도 3을 참조한다.
돌연변이체 대립유전자를 생성하기 위하여, CRISPR/Cas9 성분은 공여체 주형와 함께, 세포질 mRNA 피에조 주입 또는 전핵 주입을 통하여 C57BL/6 1세포기 배아로 도입되었다. 생성된 일 클론은, 예측된 MAID 8502 대립유전자보다는 오히려 도 3에 도시된 MAID 8520 돌연변이체 대립유전자를 가졌다. MAID 8520 돌연변이체 대립유전자는 또한, 도 3에 나타난 암호화된 Fbn1 단백질의 조기 종결을 유발한다.
F0 창시자 마우스는 배아를 가임신 암컷 마우스로 미세주입한 후 생성되었고, 그리고 F1 세대 마우스가 후속하여 생산되었다. 야생형 마우스와 비교하여, Fbn1 돌연변이에 대하여 이형접합자인 마우스는, 체중에 의하여 정규화될 경우, 더 많이 섭취하였다. 예컨대, 체중에 의하여 정규화된 (그램 대 그램) 1주당 식품 섭취를 도시하는 도 4를 참고하며, 여기서 이형접합자 수컷은, 체중에 의하여 정규화될 경우, 이들의 야생형 대응체보다 대략 1.7배 더 많이 음식을 섭취하였다. 식품 섭취의 증가에도 불구하고, Fbn1 돌연변이에 대하여 이형접합자인 수컷 및 암컷 마우스의 체중은, 시간의 경과에 따라 상응하는 야생형 마우스보다 일관되게 더 낮았다. 예컨대, 좌측에 2마리의 3-개월령 수컷 F1 이형접합자 마우스, 및 우측에 2마리의 3-개월령 야생형 수컷 F1 마우스를 도시한 도 5를 참고한다. 또한, 5주령 내지 13주령의 F1 자손의 체중을 도시하는, 도 6을 참고한다. 예를 들어, 이형접합자 돌연변이체 수컷의 체중은 대략 5주령에서 7그램, 그리고 13주령에서 12그램이었고, 그리고 상응하는 야생형 수컷의 체중은 대략 5주령에서 18그램, 그리고 13주령에서 25그램이었다. 이러한 경향은 또한 암컷 마우스에서 관찰되었다.
야생형 암컷과 비교된 이형접합자 암컷의 추가 분석은, 야생형 암컷과 비교될 경우, 이형접합자 돌연변이체 암컷 내 척추후만증 (즉, 등이 둥글게 돌출됨)을 도시하였다. 참고: 도 7a-7e. 이와 같이, 이형접합자 암컷은 이들의 야생형 대응물과 비교하여 매우 적은 지방을 가졌다. 도 8a-8c에 나타난 바와 같이, 이형접합자 돌연변이체 암컷 마우스는, 설치류 내 지방 및 지방 제외 질량을 측정하기 위하여 사용된 ECHOMRI™에 의하여 측정시, 체중, 지방 제외 질량, 및 지방 질량이 통계적으로 유의미하게 낮았다. 이러한 차이는, 마우스에 21주 동안 60% 고-지방 식이로 먹이를 줄 경우, 균등하게 유지되었다. 체지방이 없음에도 불구하고, 이형접합자 돌연변이체 암컷 및 상응하는 야생형 암컷은, 차우(chow) 식이에서 유사한 글루코스 내성 (경구 글루코스 내성, 밤새 금식 후 2mg/kg 주어짐), 및 혈청 콜레스테롤, 트리글리세라이드 및 비-에스테르화 지방산에서 상승되지 않음 (ADVIA에 의하여 측정됨)을 도시하였다. 참고: 예컨대, 각각 도 9a-9f 및 10a-10f.
이형접합자 돌연변이체 암컷의 추가 분석은, 내장 백색 지방의 거의 완전한 손실에도 불구하고, 갈색 지방 조직 (BAT) 저장의 보존을 도시하였다. 참고: 도 11a-11h. BAT의 보존은, 본 발명자들이 12주 동안의 60% 고-지방 식이 공급 후 이형접합자 돌연변이체 암컷의 에너지 소비량을 측정하도록 하였다. 참고: 도 12a-12h. Columbia Instruments Oxymax CLAMS 시스템을 사용한 대사 케이지(metabolic cage) 분석은, 마우스가 이들의 VO2, VCO2 및 에너지 소비량 (에너지)에 의하여 나타낼 때, 상승된 대사율(체중으로 정규화됨)을 갖는다는 것을 도시하였다. 고-지방 식이 20주 후, 이러한 마우스는 또한 개선된 글루코스 내성도 나타냈다. 참고: 도 13a-13d.
피브릴린-1의 C-말단 결실에 대하여 이형접합자인 마우스는, 백색 지방 저장이 더욱 크게 감소하여 야윈 상태이나, 이들은 야생형 마우스에 비해, 보존된 갈색 지방, 증가된 에너지 소비량, 유사한 글루코스 내성, 고-지방 식이에서의 인슐린 민감도의 개선를 가졌고, 그리고 혈청 지질의 상승은 없었다. 이는, 다수의 지방이영양성 증후군과 달리, 이러한 특정 마우스가 내장 지방 조직이 없음에도 불구하고 글루코스 항상성 및 순환 지질 면에서 정상적인 대사 프로파일을 갖는다는 점에서, 인간 NPSCL 환자에서 관찰되는 FBN1 표현형을 다시 한번 나타낸다. FBN1 돌연변이체 마우스의 다수의 다른 모델은 극도로 정상인 이형접합체를 갖는 한편, 동형접합체는 생후 초기 또는 배아기에 사멸된다. 참고: 예컨대, Pereira 외 (1999) Proc . Natl. Acad . Sci . U.S.A . 96(7):3819-3823 (이는 모든 목적을 위하여 그 전체내용이 참고로 본원에 편입됨). 본 모델은, 치료적 선택사항의 연구를 가능하게 하는, 인간 환자의 다수 특성을 다시 한번 나타내는, 우성 이형접합자 표현형을 도시한다. 특히, 본 모델은, 백색 지방 조직은 손실되나, 갈색 지방 조직은 백색 조직의 손실에도 불구하고 인슐린 민감도의 개선과 함께 보존된다는 것을 도시한다. 인간 NPSCL 환자는 백색 지방 조직의 손실에도 불구하고 정상적인 글루코스 항상성을 가지며, 이는 본 모델에 반영된다. 갈색 지방 조직의 보존으로 인해 마우스는 저장할 수 없는 잉여 지방을 연소할 수 있으므로, 유지된/인슐린 민감도의 개선을 기초로 하는 기전을 가질 가능성이 크다.
<110> Regeneron Pharmaceuticals, Inc. <120> FIBRILLIN-1 MUTATIONS FOR MODELING NEONATAL PROGEROID SYNDROME WITH CONGENITAL LIPODYSTROPHY <130> 057766/500041 <150> US 62/368,924 <151> 2016-07-29 <160> 47 <170> KoPatentIn 3.0 <210> 1 <211> 24 <212> DNA <213> Homo sapiens <400> 1 cggagaagca caaacgaaac tgat 24 <210> 2 <211> 8 <212> PRT <213> Homo sapiens <400> 2 Arg Arg Ser Thr Asn Glu Thr Asp 1 5 <210> 3 <211> 24 <212> DNA <213> Homo sapiens <400> 3 cggagaagca caaacgaaaa ctga 24 <210> 4 <211> 7 <212> PRT <213> Homo sapiens <400> 4 Arg Arg Ser Thr Asn Glu Asn 1 5 <210> 5 <211> 24 <212> DNA <213> Mus musculus <400> 5 cggagaagca cgaacgaaac ggat 24 <210> 6 <211> 8 <212> PRT <213> Mus musculus <400> 6 Arg Arg Ser Thr Asn Glu Thr Asp 1 5 <210> 7 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 7 cggagaagca cgaacgaaaa ctga 24 <210> 8 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 8 Arg Arg Ser Thr Asn Glu Asn 1 5 <210> 9 <211> 60 <212> DNA <213> Homo sapiens <400> 9 gagtgtaaga tcaatggcta ccccaaacgg ggcaggaaac ggagaagcac aaacgaaact 60 60 <210> 10 <211> 20 <212> PRT <213> Homo sapiens <400> 10 Glu Cys Lys Ile Asn Gly Tyr Pro Lys Arg Gly Arg Lys Arg Arg Ser 1 5 10 15 Thr Asn Glu Thr 20 <210> 11 <211> 60 <212> DNA <213> Homo sapiens <400> 11 gagtgtgatc aatggctacc ccaaacgggg caggaaacgg agaagcacaa acgaaactga 60 60 <210> 12 <211> 19 <212> PRT <213> Homo sapiens <400> 12 Glu Cys Asp Gln Trp Leu Pro Gln Thr Gly Gln Glu Thr Glu Lys His 1 5 10 15 Lys Arg Asn <210> 13 <211> 60 <212> DNA <213> Mus musculus <400> 13 gagtgtaaga tcaacggcta cccaaaacga ggccggaaac ggagaagcac gaacgaaacg 60 60 <210> 14 <211> 20 <212> PRT <213> Mus musculus <400> 14 Glu Cys Lys Ile Asn Gly Tyr Pro Lys Arg Gly Arg Lys Arg Arg Ser 1 5 10 15 Thr Asn Glu Thr 20 <210> 15 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 15 gagtgtgatc aatggctacc ccaaacgggg caggaaacgg agaagcacaa acgaaactga 60 60 <210> 16 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 16 Glu Cys Asp Gln Trp Leu Pro Gln Thr Gly Gln Glu Thr Glu Lys His 1 5 10 15 Lys Arg Asn <210> 17 <211> 55 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 17 Pro Pro Ala Ser Ser Glu Met Asp Asp Asn Ser Leu Ser Pro Glu Ala 1 5 10 15 Cys Tyr Glu Cys Lys Ile Asn Gly Tyr Pro Lys Ala Ala Gln Ser His 20 25 30 Leu Pro Ala Thr Arg Pro Glu Thr Glu Lys His Glu Arg Asn Gly Cys 35 40 45 Leu Arg His Pro Gly Arg Val 50 55 <210> 18 <211> 37 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 18 Pro Pro Ala Ser Ser Glu Met Asp Asp Asn Ser Leu Ser Pro Glu Ala 1 5 10 15 Cys Tyr Glu Cys Asp Gln Trp Leu Pro Gln Thr Gly Gln Glu Thr Glu 20 25 30 Lys His Lys Arg Asn 35 <210> 19 <211> 8616 <212> DNA <213> Homo sapiens <400> 19 atgcgtcgag ggcgtctgct ggagatcgcc ctgggattta ccgtgctttt agcgtcctac 60 acgagccatg gggcggacgc caatttggag gctgggaacg tgaaggaaac cagagccagt 120 cgggccaaga gaagaggcgg tggaggacac gacgcgctta aaggacccaa tgtctgtgga 180 tcacgttata atgcttactg ttgccctgga tggaaaacct tacctggcgg aaatcagtgt 240 attgtcccca tttgccggca ttcctgtggg gatggatttt gttcgaggcc aaatatgtgc 300 acttgcccat ctggtcagat agctccttcc tgtggctcca gatccataca acactgcaat 360 attcgctgta tgaatggagg tagctgcagt gacgatcact gtctatgcca gaaaggatac 420 atagggactc actgtggaca acctgtttgt gaaagtggct gtctcaatgg aggaaggtgt 480 gtggccccaa atcgatgtgc atgcacttac ggatttactg gaccccagtg tgaaagagat 540 tacaggacag gcccatgttt tactgtgatc agcaaccaga tgtgccaggg acaactcagc 600 gggattgtct gcacaaaaac gctctgctgt gccacagtcg gccgagcctg gggccacccc 660 tgtgagatgt gtcctgccca gcctcacccc tgccgccgtg gcttcattcc aaatatccgc 720 acgggagctt gtcaagatgt ggatgaatgc caggccatcc ccgggctctg tcagggagga 780 aattgcatta atactgttgg gtcttttgag tgcaaatgcc ctgctggaca caaacttaat 840 gaagtgtcac aaaaatgtga agatattgat gaatgcagca ccattcctgg aatctgtgaa 900 gggggtgaat gtacaaacac agtcagcagt tacttttgca aatgtccccc tggtttttac 960 acctctccag atggtaccag atgcatagat gttcgcccag gatactgtta cacagctctg 1020 acaaacgggc gctgctctaa ccagctgcca cagtccataa ccaaaatgca gtgctgctgt 1080 gatgccggcc gatgctggtc tccaggggtc actgtcgccc ctgagatgtg tcccatcaga 1140 gcaaccgagg atttcaacaa gctgtgctct gttcctatgg taattcctgg gagaccagaa 1200 tatcctcccc caccccttgg ccccattcct ccagttctcc ctgttcctcc tggctttcct 1260 cctggacctc aaattccggt ccctcgacca ccagtggaat atctgtatcc atctcgggag 1320 ccaccaaggg tgctgccagt aaacgttact gattactgcc agttggtccg ctatctctgt 1380 caaaatggac gctgcattcc aactcctggg agttaccggt gtgagtgcaa caaagggttc 1440 cagctggacc tccgtgggga gtgtattgat gttgatgaat gtgagaaaaa cccctgtgct 1500 ggtggtgagt gtattaacaa ccagggttcg tacacctgtc agtgccgagc tggatatcag 1560 agcacactca cgcggacaga atgccgagac attgatgagt gtttacagaa tggccggatc 1620 tgcaataatg gacgctgcat caacacagat ggcagttttc attgcgtgtg taatgcgggc 1680 tttcatgtta cacgagatgg gaagaactgt gaagatatgg atgaatgcag cataaggaac 1740 atgtgcctta atggaatgtg tatcaatgaa gatggcagtt ttaaatgtat ttgcaaacct 1800 ggattccagc tggcatcaga tggacgttat tgcaaagaca ttaacgagtg tgaaacccct 1860 gggatctgca tgaatgggcg ttgcgtcaac actgatggct cctacagatg tgaatgcttc 1920 cctggactgg ctgtgggtct ggatggccgt gtgtgtgttg acacacacat gcggagcaca 1980 tgctatggtg gatacaagag aggccagtgt atcaaacctt tgtttggtgc tgtcactaaa 2040 tctgaatgct gttgcgccag cactgagtat gcatttgggg aaccttgcca gccgtgtcct 2100 gcacagaatt cagcggaata tcaggcactc tgcagcagtg ggccaggaat gacgtcagca 2160 ggcagtgata taaatgaatg tgcactagat cctgatattt gcccaaatgg aatctgtgaa 2220 aaccttcgtg ggacctataa atgtatatgc aattcaggat atgaagtgga ttcaactggg 2280 aaaaactgcg ttgatattaa tgaatgtgta ctgaacagtc tcctttgtga caatggacaa 2340 tgtagaaata ctcctggaag ttttgtctgt acctgcccca agggatttat ctacaaacct 2400 gatctaaaaa catgtgaaga cattgatgaa tgcgaatcaa gtccttgcat taatggagtc 2460 tgcaagaaca gcccaggctc ttttatttgt gaatgttctt ctgaaagtac tttggatcca 2520 acaaaaacca tctgcataga aaccatcaag ggcacttgct ggcagactgt cattgatggg 2580 cgatgtgaga tcaacatcaa tggagccacc ttaaagtccc agtgctgctc ctccctcggt 2640 gctgcgtggg gaagcccgtg caccctatgc caagttgatc ccatatgtgg taaagggtac 2700 tcaagaatta aaggaacaca atgtgaagat atagatgaat gtgaagtgtt cccaggagtg 2760 tgtaaaaatg gcctgtgtgt taacactagg gggtcattca agtgtcagtg tcccagtgga 2820 atgactttgg atgccacagg aaggatctgt cttgatatcc gcctggaaac ctgcttcctg 2880 aggtacgagg acgaggagtg caccctgcct attgctggcc gccaccgcat ggacgcctgc 2940 tgctgctccg tcggggcagc ctggggtact gaggaatgcg aggagtgtcc catgagaaat 3000 actcctgagt acgaggagct gtgtccgaga ggacccggat ttgccacaaa agaaattaca 3060 aatggaaagc ctttcttcaa agatatcaat gagtgcaaga tgatacccag cctctgcacc 3120 cacggcaagt gcagaaacac cattggcagc tttaagtgca ggtgtgacag cggctttgct 3180 cttgattctg aagaaaggaa ctgcacagac attgacgaat gccgcatatc tcctgacctc 3240 tgtggcagag gccagtgtgt gaacacccct ggggactttg aatgcaagtg tgacgaaggc 3300 tatgaaagtg gattcatgat gatgaagaac tgcatggata ttgatgagtg tcagagagat 3360 cctctcctat gccgaggtgg tgtttgccat aacacagagg gaagttaccg ctgtgaatgc 3420 ccgcctggcc atcagctgtc ccccaacatc tccgcgtgta tcgacatcaa tgaatgtgag 3480 ctgagtgcac acctgtgccc caatggccgt tgcgtgaacc tcatagggaa gtatcagtgt 3540 gcctgcaacc ctggctacca ttcaactccc gataggctat tttgtgttga cattgatgaa 3600 tgcagcataa tgaatggtgg ttgtgaaacc ttctgcacaa actctgaagg cagctatgaa 3660 tgtagctgtc agccgggatt tgcactaatg cctgaccaga gatcatgcac cgacatcgat 3720 gagtgtgaag ataatcccaa tatctgtgat ggtggtcagt gcacaaatat ccctggagag 3780 tacaggtgct tgtgttatga tggattcatg gcatctgaag acatgaagac ttgtgtagat 3840 gtcaatgagt gtgacctgaa tccaaatatc tgcctaagtg ggacctgtga aaacacgaaa 3900 ggctcattta tctgccactg tgatatgggc tactccggca aaaaaggaaa aactggctgt 3960 acagacatca atgaatgtga aattggagca cacaactgtg gcaaacatgc tgtatgtacc 4020 aatacagcag gaagcttcaa atgtagctgc agtcccgggt ggattggaga tggcattaag 4080 tgcactgatc tggacgaatg ttccaatgga acccatatgt gcagccagca tgcagactgc 4140 aagaatacca tgggatctta ccgctgtctg tgcaaggaag gatacacagg tgatggcttc 4200 acttgtacag accttgatga gtgctctgag aacctgaatc tctgtggcaa tggccagtgc 4260 ctcaatgcac caggaggata ccgctgtgaa tgcgacatgg gcttcgtgcc cagtgctgac 4320 gggaaagcct gtgaagatat tgatgagtgc tcccttccga acatctgtgt ctttggaact 4380 tgccacaacc tccctggcct gttccgctgt gagtgtgaga taggctacga actggacaga 4440 agcggcggga actgcacaga tgtgaatgaa tgcctggatc caaccacgtg catcagtggg 4500 aactgtgtca acactccagg cagctatatc tgtgactgcc cacctgattt tgaactgaac 4560 ccaactcgag ttggctgtgt tgatacccgc tctggaaatt gctatttgga tattcgacct 4620 cgaggagaca atggagatac agcctgcagc aatgaaattg gagttggtgt ttccaaagct 4680 tcctgctgct gttctctggg taaagcctgg ggtactcctt gtgagatgtg tcctgctgtg 4740 aacacatccg agtacaaaat tctttgtcct ggaggggaag gtttccgacc aaatcctatc 4800 accgttatat tggaagatat tgatgagtgc caggagctac cagggctgtg ccaaggagga 4860 aaatgtatca acacctttgg gagtttccag tgccgctgtc caaccggcta ctacctgaat 4920 gaagatacac gagtgtgtga tgatgtgaat gaatgtgaga ctcctggaat ctgtggtcca 4980 gggacatgtt acaacaccgt tggcaactac acctgtatct gtcctccaga ctacatgcaa 5040 gtgaatgggg gaaataattg catggatatg agaagaagtt tgtgctacag aaactactat 5100 gctgacaacc agacctgtga tggagaattg ttattcaaca tgaccaagaa gatgtgctgc 5160 tgttcctaca acattggccg ggcgtggaac aagccctgtg aacagtgtcc catcccaagt 5220 acagatgagt ttgctacact ctgtggaagt caaaggccag gctttgtcat cgacatttat 5280 accggtttac ccgttgatat tgatgagtgc cgggagatcc caggggtctg tgaaaatgga 5340 gtgtgtatca acatggttgg cagcttccga tgtgaatgtc cagtgggatt cttctataat 5400 gacaagttgt tggtttgtga agatattgac gagtgtcaga acggcccagt gtgccagcgc 5460 aacgccgaat gcatcaacac tgcaggcagc taccgctgtg actgtaagcc cggctaccgc 5520 ttcacctcca caggacagtg caatgatcgt aatgaatgtc aagaaatccc caatatatgc 5580 agtcatgggc agtgcattga cacagttgga agcttttatt gcctttgcca cactggtttt 5640 aaaacaaatg atgaccaaac catgtgcttg gacataaatg aatgtgaaag agatgcctgt 5700 gggaatggaa cttgccggaa cacaattggt tccttcaact gccgctgcaa tcatggtttc 5760 atcctttctc acaacaatga ctgtatagat gttgatgaat gtgcaagtgg aaatgggaat 5820 ctttgcagaa atggccaatg cattaataca gtggggtctt tccagtgcca gtgcaatgaa 5880 ggctatgagg tggctccaga tgggaggacc tgtgtggata tcaatgaatg tcttctagaa 5940 cccagaaaat gtgcaccagg tacctgtcaa aacttggatg ggtcctacag atgcatttgc 6000 ccacctggat acagtcttca aaatgagaag tgtgaagata ttgatgagtg tgtcgaagag 6060 ccagaaattt gtgccctggg cacatgcagt aacactgaag gcagcttcaa atgtctgtgt 6120 ccagaagggt tttccttgtc ctccagtgga agaaggtgcc aagatttgcg aatgagctac 6180 tgttatgcga agtttgaagg aggaaagtgt tcatcaccca aatccagaaa tcactccaag 6240 caggaatgct gctgtgcctt gaagggagaa ggctggggag acccctgcga gctctgcccc 6300 acggaacctg atgaggcctt ccgccagata tgtccttatg gaagtgggat catcgtggga 6360 cctgatgatt cagcagttga tatggacgaa tgcaaagaac ccgatgtctg taaacatgga 6420 cagtgcatca atacagatgg ttcctatcgc tgcgagtgtc cctttggtta tattctagca 6480 gggaatgaat gtgtagatac tgatgaatgt tctgttggca atccttgtgg aaatggaacc 6540 tgcaagaatg tgattggagg ttttgaatgc acctgcgagg agggatttga gcccggtcca 6600 atgatgacat gtgaagatat aaatgaatgt gcccagaatc ctctgctctg tgccttccga 6660 tgtgtgaaca cttatgggtc atatgaatgc aaatgtcccg tgggatatgt gctcagagaa 6720 gaccgtagga tgtgcaaaga tgaggatgag tgtgaagagg gaaaacatga ctgtactgaa 6780 aaacaaatgg aatgcaagaa cctcattggc acatatatgt gcatctgtgg acccgggtat 6840 cagcggagac ctgatggaga aggctgtgta gatgagaatg aatgtcagac gaagccaggg 6900 atctgtgaga atgggcgctg cctcaacacc cgtgggagct acacctgtga gtgtaatgat 6960 gggtttaccg ccagccccaa ccaggacgag tgccttgaca atcgggaagg gtactgcttc 7020 acagaggtgc tacaaaacat gtgtcagatc ggctccagca acaggaaccc cgtcaccaaa 7080 tcggaatgct gctgtgacgg agggagaggc tggggtcccc actgtgagat ctgccctttc 7140 caggggactg tggctttcaa gaaactctgt ccccatggcc gaggattcat gaccaatgga 7200 gcagatatcg atgaatgcaa ggttattcac gatgtttgcc gaaatgggga atgtgtcaat 7260 gacagaggat catatcattg catttgtaaa actgggtaca ctccagatat aactgggact 7320 tcctgtgtag atctgaacga gtgcaaccag gctcccaaac cctgcaattt tatctgcaaa 7380 aacacagaag ggagttacca gtgttcatgc ccgaaaggct acattctgca agaggatgga 7440 aggagctgca aagatcttga tgagtgtgca accaagcaac acaactgcca gttcctatgt 7500 gttaacacca ttggcggctt cacatgcaaa tgtcctcccg gatttaccca acaccatacg 7560 tcctgcattg ataacaatga atgcacctct gacatcaatc tgtgcgggtc taagggcatt 7620 tgccagaaca ctcctggaag cttcacctgt gaatgccagc ggggattctc acttgatcag 7680 accggctcca gctgtgaaga cgtggacgag tgtgagggta accaccgctg ccagcatggc 7740 tgccagaaca tcattggggg ctacaggtgc agctgccccc agggctacct ccagcactac 7800 cagtggaacc agtgtgttga tgaaaacgaa tgcctcagcg ctcacatctg cggaggagcc 7860 tcctgtcaca acaccctggg gagctacaag tgcatgtgtc ccgccggctt ccagtatgaa 7920 cagttcagtg gaggatgcca agacatcaat gaatgtggct ctgcgcaggc cccctgcagc 7980 tatggctgtt ccaataccga gggcggttac ctgtgtggct gtccacctgg ttacttccgc 8040 ataggccaag ggcactgtgt ttctggaatg ggcatgggcc gaggaaaccc agagccacct 8100 gtcagtggtg aaatggatga caattcactc tccccagagg cttgttacga gtgtaagatc 8160 aatggctacc ccaaacgggg caggaaacgg agaagcacaa acgaaactga tgcctccaat 8220 atcgaggatc agtctgagac agaagccaat gtgagtcttg caagttggga tgttgagaag 8280 acagccatct ttgctttcaa tatttcccac gtcagtaaca aggttcgaat cctagaactc 8340 cttccagctc ttacaactct gacgaatcac aacagatact tgatcgaatc tggaaatgaa 8400 gatggcttct ttaaaatcaa ccaaaaggaa gggatcagct acctccactt cacaaagaag 8460 aagccagtgg ctggaaccta ttcattacaa atcagtagta ctccacttta taaaaagaaa 8520 gaacttaacc aactagaaga caaatatgac aaagactacc tcagtggtga actgggtgat 8580 aatctgaaga tgaaaatcca ggttttgctt cattaa 8616 <210> 20 <211> 8622 <212> DNA <213> Mus musculus <400> 20 atgcggcgag gagggctgct ggaggtcgcg ctggcgttcg ccctgctcct cgagtcctac 60 acgagccatg gggcggacgc caatttggag gctgggagcc tgaaggagac cagagccaat 120 cgggccaaga gaagaggcgg cggaggacac gatgcgctga aaggacccaa tgtctgtgga 180 tcacgttata atgcatactg ttgtcctgga tggaaaacct tacctggtgg aaatcagtgt 240 attgttccca tttgccggca ttcctgtggg gatggattct gctcgaggcc aaatatgtgc 300 acttgcccgt ctggtcagat atctccttcc tgtggctcca gatccatcca acactgcagc 360 atccgctgta tgaatggggg cagctgcagc gatgaccact gtctgtgcca gaaagggtac 420 atcggcactc actgtggaca gcctgtctgt gaaagtggct gtctcaacgg agggaggtgt 480 gtggccccaa atcggtgtgc ttgcacgtac ggctttactg gaccccagtg tgaaagagat 540 tacagaacag gcccatgttt tactgtggta agcaaccaga tgtgccaggg acagctcagc 600 gggattgtct gcaccaaaac actttgctgt gccaccgtgg gccgagcctg gggccacccc 660 tgtgagatgt gtcctgccca gcctcacccc tgccgccgcg gcttcattcc caacatccgc 720 actggagctt gtcaagatgt ggatgaatgt caggccatcc cagggatgtg tcaaggagga 780 aattgcatta ataccgttgg atcttttgag tgcaaatgcc ctgctggaca caaatttaat 840 gaagtgtcac aaaaatgtga agatattgac gagtgcagca ccattcctgg agtctgcgat 900 ggcggggaat gtacaaacac tgtcagcagc tacttctgca aatgtccccc tggtttttac 960 acctctcctg atggcaccag atgcgtagat gttcgccctg gttactgcta cacagctctg 1020 gcaaacgggc gctgctctaa ccagctgcca cagtccataa ccaaaatgca gtgctgttgc 1080 gatcttggcc ggtgctggtc tccaggggtt actgttgctc ccgagatgtg tcccatcagg 1140 tcaactgagg atttcaacaa gctgtgctct gtccctctgg taattcccgg gagaccagaa 1200 tatcctcccc cacccattgg cccccttcct ccagttcagc ccgttcctcc tggctatcct 1260 cctgggcctg tgattccagc ccctcggcca ccgccagaat atccatatcc atctccgtct 1320 cgggaaccac caagggtgct gcctttcaac gttactgact actgtcaact ggtccgctat 1380 ctctgtcaaa atgggcgctg cattccaact cccggtagct accgctgcga gtgcaacaag 1440 ggcttccagc tggatatccg tggcgaatgc atcgacgtgg atgagtgtga gaagaaccca 1500 tgcactggtg gcgagtgcat caacaaccag ggctcctaca cctgtcactg cagagctggc 1560 taccagagca cactcaccag aactgagtgc agagacatag atgagtgtct tcagaatggc 1620 cggatctgca acaatggtcg ctgtatcaac acagacggca gcttccactg cgtatgcaat 1680 gcgggctttc atgtcacgcg ggacggaaag aactgtgaag atatggatga gtgcagcatc 1740 cgaaacatgt gcctaaacgg aatgtgtatt aatgaagatg gcagtttcaa gtgtatttgc 1800 aaacctgggt tccaactggc atcagatggc cgctactgca aagatatcaa tgagtgtgag 1860 acacctggga tctgcatgaa cggacgctgt gtgaacacgg atggctccta cagatgcgaa 1920 tgcttccccg gattggctgt gggtctagac ggacgtgtgt gtgttgacac acacatgcgg 1980 agcacatgct atggaggata caggagaggc cagtgcgtga agccgttgtt tggtgctgtt 2040 accaaatcgg aatgctgttg tgccagcact gagtatgcct ttggggaacc ctgccagccg 2100 tgtcctgcac agaattcagc ggaatatcag gcactctgca gcagtggacc gggaatgaca 2160 tcagcaggca ctgatataaa cgaatgtgca ttagatcctg atatttgccc aaatggaatt 2220 tgtgaaaatc tccgtgggac ctacaaatgt atatgcaact cgggatatga agtagacata 2280 actgggaaaa actgtgtcga tattaatgag tgtgtgctga acagtctact ttgtgacaat 2340 ggacaatgtc gaaacacacc tggaagtttt gtctgcacct gccccaaagg atttgtgtac 2400 aaacctgacc taaaaacctg tgaagacatt gatgaatgtg aatcgagtcc ttgcattaat 2460 ggagtctgca agaacagccc tggctccttc atttgtgaat gttctcctga aagtactctg 2520 gacccaacaa aaaccatctg catagaaacc atcaagggca cttgctggca gactgtcatc 2580 gacgggcgct gtgagatcaa catcaacgga gccaccttga agtccgagtg ctgctcctcc 2640 cttggtgctg cgtgggggag cccgtgcacc atctgtcaac ttgatcccat ttgtggtaaa 2700 gggttctcaa gaattaaagg cacgcaatgt gaagatatca atgagtgtga agtgttcccg 2760 ggagtatgca agaacggcct gtgtgtcaac tccaggggtt cattcaagtg cgagtgtccc 2820 aatggaatga ctttggatgc tacaggaaga atctgtcttg acatccgcct ggagacctgc 2880 ttcctcaagt atgacgatga agagtgcacc ttgcccatcg ctggccgcca ccgaatggat 2940 gcctgctgct gctctgttgg ggcagcctgg ggaacggaag agtgtgagga gtgtccattg 3000 agaaacagcc gggagtatga ggaactctgt ccccgaggac ctgggtttgc cacaaaagac 3060 attacaaatg ggaaaccttt cttcaaagat atcaatgagt gcaagatgat acccagcctc 3120 tgtacccacg gcaagtgcag gaacaccatt ggcagcttca agtgtaggtg tgacagtggc 3180 tttgctctgg attctgaaga gaggaactgt acagacattg atgagtgccg catatctcct 3240 gacctctgtg gccgaggcca gtgtgtgaac accccggggg actttgaatg caagtgtgat 3300 gaaggctatg aaagtggctt catgatgatg aagaactgca tggatattga tgaatgtcag 3360 agagatcctc tcctgtgtcg aggaggcatt tgccacaaca cagagggaag ctatcgctgc 3420 gaatgtcctc ctggtcacca attgtcccca aacatctctg catgcattga catcaacgag 3480 tgtgagctga gtgcgaatct ctgtccccat gggcgttgtg tgaacctcat agggaagtac 3540 cagtgtgcct gcaaccctgg ctaccacccc actcatgaca ggctcttctg tgtcgatatt 3600 gatgaatgca gcataatgaa cggtggttgt gagaccttct gcacaaactc tgacgggagc 3660 tatgaatgta gctgtcagcc aggcttcgcg ctaatgccag accagcgatc gtgcacagac 3720 attgatgagt gtgaagacaa ccccaatatc tgtgatggtg gccagtgcac aaacatacct 3780 ggggagtaca ggtgcctgtg ctatgatggg ttcatggcat ctgaagacat gaagacttgt 3840 gtggatgtca atgagtgtga cctgaatcca aacatctgcc ttagtgggac ctgtgaaaat 3900 actaaaggct cgttcatctg ccactgtgat atgggatatt cagggaagaa aggaaaaacg 3960 ggctgtacag atatcaatga atgtgagatc ggagcacaca actgtggcag acatgctgta 4020 tgcacaaata cagccgggag cttcaagtgc agctgcagtc ccggctggat tggagacggc 4080 attaagtgca cagatctgga tgaatgctct aatggaaccc acatgtgcag ccaacacgcg 4140 gactgcaaga acaccatggg gtcatatcgc tgtctctgta aggatggcta tacaggggat 4200 ggcttcacct gtacagacct cgacgagtgc tccgagaacc tgaacctctg tggcaatggc 4260 cagtgcctca acgcccctgg cgggtaccgc tgtgaatgcg acatgggctt cgtgcccagt 4320 gctgacggga aggcctgtga agatatcgat gagtgctccc ttccaaacat ctgtgtcttt 4380 ggaacttgcc acaacctccc gggcctcttc cgttgcgagt gtgagattgg ctatgaactg 4440 gaccgaagtg gtggaaactg cacagatgtt aatgagtgtc tggatcccac cacctgcatc 4500 agtggaaact gtgtcaacac tcccggtagt tacacatgcg attgtcctcc ggattttgag 4560 ctgaatccaa ctcgtgtcgg ctgtgtcgat actcgctctg gaaactgcta tctggatatc 4620 cgaccccggg gagacaatgg agatacagcc tgcagcaatg aaattggagt tggtgtctct 4680 aaggcttcct gctgttgttc actgggtaaa gcttggggaa ccccatgtga gctgtgtcct 4740 tctgtgaaca catctgagta taaaattctt tgccctggag gagaaggttt tcgtccaaat 4800 cccatcaccg ttatattgga agacatcgat gagtgccagg agcttccagg gctgtgccaa 4860 ggggggaagt gcatcaatac ctttggcagc ttccagtgtc gctgtccaac tggttactac 4920 ctgaatgaag acactcgagt gtgtgatgat gtgaacgaat gtgagactcc tggaatctgt 4980 ggtccgggga cctgttacaa caccgttggc aactatacct gcatttgtcc tccagactac 5040 atgcaagtga acgggggaaa taattgcatg gacatgagaa gaagtctatg ctacagaaac 5100 tattacgctg acaaccagac ctgcgatgga gaactcctgt tcaacatgac caagaagatg 5160 tgctgttgct cctacaacat cggcagagcc tggaacaaac cctgtgaaca gtgccccatc 5220 ccaagcacag atgagtttgc taccctctgt gggagccaga ggcccggctt cgtgattgac 5280 atttatacgg gtttacccgt ggatattgat gaatgccggg agatccctgg ggtctgtgaa 5340 aatggagtgt gcatcaacat ggttggcagc ttccggtgtg agtgtcccgt gggattcttc 5400 tataacgaca agttactggt ttgtgaagat atcgacgagt gtcagaatgg ccctgtgtgc 5460 cagcgaaatg cggaatgcat caacactgca ggcagctacc gctgtgactg taagcccggc 5520 taccgcctta cctccacagg tcaatgcaac gatcgaaacg agtgccaaga aatcccgaac 5580 atatgcagtc atggccagtg catcgacacc gtgggaagct tctactgcct ttgtcacact 5640 ggcttcaaaa caaatgtgga tcagaccatg tgcttagaca taaatgagtg tgagagagac 5700 gcctgtggga acgggacttg cagaaacacg attggctcct tcaactgtcg ctgtaaccat 5760 ggcttcatac tgtctcacaa caatgactgc atagatgttg atgagtgtgc aactggaaac 5820 gggaaccttt gcagaaatgg ccagtgtgtc aataccgtgg gctcctttca gtgcaggtgc 5880 aatgaaggct atgaggtggc tccggacggc aggacctgtg tggatatcaa cgagtgtgtt 5940 ctggatcctg ggaaatgtgc acctggaacc tgtcagaacc tggatggctc ctacagatgc 6000 atttgcccgc ctgggtatag tctacagaat gacaagtgtg aagatattga tgagtgtgtt 6060 gaagagccag aaatctgtgc cttggggacc tgcagcaaca ctgagggtag cttcaaatgt 6120 ctgtgtccag aggggttctc cctgtcctcc actggaagaa ggtgccaaga tttgcgaatg 6180 agctactgct atgcgaagtt tgaaggtggg aagtgttcat cacccaaatc cagaaaccat 6240 tccaagcagg agtgctgctg tgctttgaag ggagaaggct ggggagatcc ttgtgagttg 6300 tgccccactg agccagatga ggctttccgc cagatctgcc cctttggaag tgggatcatt 6360 gtgggccctg atgactcagc agttgatatg gacgaatgca aagaacctga tgtctgtaga 6420 catgggcagt gcattaacac agacggctcc tatcgatgcg agtgtccttt tggttatatt 6480 ctggaaggga atgagtgtgt ggataccgat gaatgctctg tgggcaatcc ttgtggaaat 6540 gggacctgca agaatgtgat tggaggtttt gaatgtacct gtgaggaggg gttcgagcct 6600 ggcccaatga tgacttgtga agatataaat gaatgtgccc agaatcctct gctctgcgcc 6660 ttccgctgtg taaataccta cgggtcctat gaatgcaaat gccctgttgg atacgttctc 6720 cgagaagaca ggaggatgtg taaagatgag gatgagtgtg cagagggaaa acacgactgt 6780 actgagaagc aaatggagtg taagaacctc attggtacct acatgtgcat ctgcggccct 6840 gggtaccagc gcagacccga tggagagggc tgcatagatg agaatgagtg tcagaccaag 6900 cccgggatct gtgagaatgg gcgttgcctc aacaccctgg gtagctacac ttgtgagtgt 6960 aacgatggct tcacagccag ccccactcag gatgagtgct tggacaaccg ggaagggtac 7020 tgcttttcgg aggtcttgca aaacatgtgc cagattggct caagcaacag gaaccccgtc 7080 accaagtccg agtgctgctg tgatggaggg agaggctggg gaccccactg tgagatctgc 7140 cctttcgagg gcacagtggc ttacaagaag ctctgtcccc acggccgagg attcatgacc 7200 aacggagcag atattgatga gtgcaaggtt attcatgatg tttgccgaaa tggggagtgt 7260 gtcaacgaca gagggtccta tcactgcatc tgtaaaactg gctacactcc ggatataaca 7320 gggaccgcct gtgtagatct gaatgaatgc aaccaggctc ccaaaccctg caattttata 7380 tgcaaaaaca cagaagggag ttaccagtgt tcctgcccga agggctacat tctgcaagag 7440 gatggaagga gctgcaaaga tcttgacgag tgtgcaacca agcagcataa ctgtcagttc 7500 ctgtgtgtta acaccatcgg tggcttcaca tgcaaatgcc ctcctgggtt tacccagcat 7560 cacactgcct gcattgataa caatgagtgc acgtctgata tcaacctgtg tgggtccaag 7620 ggtgtttgcc agaacactcc aggaagcttc acctgtgaat gccaacgggg gttctcactc 7680 gatcagagtg gtgccagctg tgaagatgtg gacgagtgtg agggtaacca ccgctgtcaa 7740 catggctgcc agaacatcat cggaggctat aggtgtagct gcccccaggg ctacctccag 7800 cactaccaat ggaaccagtg tgtagatgaa aacgagtgcc tgagtgcaca tgtctgtgga 7860 ggagcctcct gccacaacac cctggggagt tacaagtgca tgtgtcccac cggcttccag 7920 tacgaacagt tcagtggagg ctgccaagac atcaatgagt gtggctcatc ccaggccccc 7980 tgcagttacg gttgctctaa tactgagggt ggctacctgt gtggctgtcc accaggatac 8040 ttccggatag gccaagggca ttgtgtttct ggaatgggca tgggccgagg cggcccagag 8100 ccacctgcca gcagcgagat ggacgacaac tcactgtccc cagaggcctg ctatgagtgt 8160 aagatcaacg gctacccaaa acgaggccgg aaacggagaa gcacgaacga aacggatgcc 8220 tccgacatcc aggacgggtc tgagatggaa gccaacgtga gcctcgccag ctgggatgtg 8280 gagaagccgg ctagctttgc tttcaatatt tcccatgtca ataacaaggt ccgaatccta 8340 gagctcctgc cggccctcac aactctgatg aaccacaaca gatacttgat tgaatctgga 8400 aatgaagatg gcttctttaa aatcaaccag aaagaagggg tcagctacct ccacttcacg 8460 aagaagaagc cggtggctgg gacctactcc ttacaaatca gcagcacccc actttataaa 8520 aagaaagaac ttaaccagtt agaagacaga tatgacaaag actacctcag tggtgaactg 8580 ggcgataacc tgaagatgaa aattcagatc ttgctgcatt aa 8622 <210> 21 <211> 8623 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 21 atgcggcgag gagggctgct ggaggtcgcg ctggcgttcg ccctgctcct cgagtcctac 60 acgagccatg gggcggacgc caatttggag gctgggagcc tgaaggagac cagagccaat 120 cgggccaaga gaagaggcgg cggaggacac gatgcgctga aaggacccaa tgtctgtgga 180 tcacgttata atgcatactg ttgtcctgga tggaaaacct tacctggtgg aaatcagtgt 240 attgttccca tttgccggca ttcctgtggg gatggattct gctcgaggcc aaatatgtgc 300 acttgcccgt ctggtcagat atctccttcc tgtggctcca gatccatcca acactgcagc 360 atccgctgta tgaatggggg cagctgcagc gatgaccact gtctgtgcca gaaagggtac 420 atcggcactc actgtggaca gcctgtctgt gaaagtggct gtctcaacgg agggaggtgt 480 gtggccccaa atcggtgtgc ttgcacgtac ggctttactg gaccccagtg tgaaagagat 540 tacagaacag gcccatgttt tactgtggta agcaaccaga tgtgccaggg acagctcagc 600 gggattgtct gcaccaaaac actttgctgt gccaccgtgg gccgagcctg gggccacccc 660 tgtgagatgt gtcctgccca gcctcacccc tgccgccgcg gcttcattcc caacatccgc 720 actggagctt gtcaagatgt ggatgaatgt caggccatcc cagggatgtg tcaaggagga 780 aattgcatta ataccgttgg atcttttgag tgcaaatgcc ctgctggaca caaatttaat 840 gaagtgtcac aaaaatgtga agatattgac gagtgcagca ccattcctgg agtctgcgat 900 ggcggggaat gtacaaacac tgtcagcagc tacttctgca aatgtccccc tggtttttac 960 acctctcctg atggcaccag atgcgtagat gttcgccctg gttactgcta cacagctctg 1020 gcaaacgggc gctgctctaa ccagctgcca cagtccataa ccaaaatgca gtgctgttgc 1080 gatcttggcc ggtgctggtc tccaggggtt actgttgctc ccgagatgtg tcccatcagg 1140 tcaactgagg atttcaacaa gctgtgctct gtccctctgg taattcccgg gagaccagaa 1200 tatcctcccc cacccattgg cccccttcct ccagttcagc ccgttcctcc tggctatcct 1260 cctgggcctg tgattccagc ccctcggcca ccgccagaat atccatatcc atctccgtct 1320 cgggaaccac caagggtgct gcctttcaac gttactgact actgtcaact ggtccgctat 1380 ctctgtcaaa atgggcgctg cattccaact cccggtagct accgctgcga gtgcaacaag 1440 ggcttccagc tggatatccg tggcgaatgc atcgacgtgg atgagtgtga gaagaaccca 1500 tgcactggtg gcgagtgcat caacaaccag ggctcctaca cctgtcactg cagagctggc 1560 taccagagca cactcaccag aactgagtgc agagacatag atgagtgtct tcagaatggc 1620 cggatctgca acaatggtcg ctgtatcaac acagacggca gcttccactg cgtatgcaat 1680 gcgggctttc atgtcacgcg ggacggaaag aactgtgaag atatggatga gtgcagcatc 1740 cgaaacatgt gcctaaacgg aatgtgtatt aatgaagatg gcagtttcaa gtgtatttgc 1800 aaacctgggt tccaactggc atcagatggc cgctactgca aagatatcaa tgagtgtgag 1860 acacctggga tctgcatgaa cggacgctgt gtgaacacgg atggctccta cagatgcgaa 1920 tgcttccccg gattggctgt gggtctagac ggacgtgtgt gtgttgacac acacatgcgg 1980 agcacatgct atggaggata caggagaggc cagtgcgtga agccgttgtt tggtgctgtt 2040 accaaatcgg aatgctgttg tgccagcact gagtatgcct ttggggaacc ctgccagccg 2100 tgtcctgcac agaattcagc ggaatatcag gcactctgca gcagtggacc gggaatgaca 2160 tcagcaggca ctgatataaa cgaatgtgca ttagatcctg atatttgccc aaatggaatt 2220 tgtgaaaatc tccgtgggac ctacaaatgt atatgcaact cgggatatga agtagacata 2280 actgggaaaa actgtgtcga tattaatgag tgtgtgctga acagtctact ttgtgacaat 2340 ggacaatgtc gaaacacacc tggaagtttt gtctgcacct gccccaaagg atttgtgtac 2400 aaacctgacc taaaaacctg tgaagacatt gatgaatgtg aatcgagtcc ttgcattaat 2460 ggagtctgca agaacagccc tggctccttc atttgtgaat gttctcctga aagtactctg 2520 gacccaacaa aaaccatctg catagaaacc atcaagggca cttgctggca gactgtcatc 2580 gacgggcgct gtgagatcaa catcaacgga gccaccttga agtccgagtg ctgctcctcc 2640 cttggtgctg cgtgggggag cccgtgcacc atctgtcaac ttgatcccat ttgtggtaaa 2700 gggttctcaa gaattaaagg cacgcaatgt gaagatatca atgagtgtga agtgttcccg 2760 ggagtatgca agaacggcct gtgtgtcaac tccaggggtt cattcaagtg cgagtgtccc 2820 aatggaatga ctttggatgc tacaggaaga atctgtcttg acatccgcct ggagacctgc 2880 ttcctcaagt atgacgatga agagtgcacc ttgcccatcg ctggccgcca ccgaatggat 2940 gcctgctgct gctctgttgg ggcagcctgg ggaacggaag agtgtgagga gtgtccattg 3000 agaaacagcc gggagtatga ggaactctgt ccccgaggac ctgggtttgc cacaaaagac 3060 attacaaatg ggaaaccttt cttcaaagat atcaatgagt gcaagatgat acccagcctc 3120 tgtacccacg gcaagtgcag gaacaccatt ggcagcttca agtgtaggtg tgacagtggc 3180 tttgctctgg attctgaaga gaggaactgt acagacattg atgagtgccg catatctcct 3240 gacctctgtg gccgaggcca gtgtgtgaac accccggggg actttgaatg caagtgtgat 3300 gaaggctatg aaagtggctt catgatgatg aagaactgca tggatattga tgaatgtcag 3360 agagatcctc tcctgtgtcg aggaggcatt tgccacaaca cagagggaag ctatcgctgc 3420 gaatgtcctc ctggtcacca attgtcccca aacatctctg catgcattga catcaacgag 3480 tgtgagctga gtgcgaatct ctgtccccat gggcgttgtg tgaacctcat agggaagtac 3540 cagtgtgcct gcaaccctgg ctaccacccc actcatgaca ggctcttctg tgtcgatatt 3600 gatgaatgca gcataatgaa cggtggttgt gagaccttct gcacaaactc tgacgggagc 3660 tatgaatgta gctgtcagcc aggcttcgcg ctaatgccag accagcgatc gtgcacagac 3720 attgatgagt gtgaagacaa ccccaatatc tgtgatggtg gccagtgcac aaacatacct 3780 ggggagtaca ggtgcctgtg ctatgatggg ttcatggcat ctgaagacat gaagacttgt 3840 gtggatgtca atgagtgtga cctgaatcca aacatctgcc ttagtgggac ctgtgaaaat 3900 actaaaggct cgttcatctg ccactgtgat atgggatatt cagggaagaa aggaaaaacg 3960 ggctgtacag atatcaatga atgtgagatc ggagcacaca actgtggcag acatgctgta 4020 tgcacaaata cagccgggag cttcaagtgc agctgcagtc ccggctggat tggagacggc 4080 attaagtgca cagatctgga tgaatgctct aatggaaccc acatgtgcag ccaacacgcg 4140 gactgcaaga acaccatggg gtcatatcgc tgtctctgta aggatggcta tacaggggat 4200 ggcttcacct gtacagacct cgacgagtgc tccgagaacc tgaacctctg tggcaatggc 4260 cagtgcctca acgcccctgg cgggtaccgc tgtgaatgcg acatgggctt cgtgcccagt 4320 gctgacggga aggcctgtga agatatcgat gagtgctccc ttccaaacat ctgtgtcttt 4380 ggaacttgcc acaacctccc gggcctcttc cgttgcgagt gtgagattgg ctatgaactg 4440 gaccgaagtg gtggaaactg cacagatgtt aatgagtgtc tggatcccac cacctgcatc 4500 agtggaaact gtgtcaacac tcccggtagt tacacatgcg attgtcctcc ggattttgag 4560 ctgaatccaa ctcgtgtcgg ctgtgtcgat actcgctctg gaaactgcta tctggatatc 4620 cgaccccggg gagacaatgg agatacagcc tgcagcaatg aaattggagt tggtgtctct 4680 aaggcttcct gctgttgttc actgggtaaa gcttggggaa ccccatgtga gctgtgtcct 4740 tctgtgaaca catctgagta taaaattctt tgccctggag gagaaggttt tcgtccaaat 4800 cccatcaccg ttatattgga agacatcgat gagtgccagg agcttccagg gctgtgccaa 4860 ggggggaagt gcatcaatac ctttggcagc ttccagtgtc gctgtccaac tggttactac 4920 ctgaatgaag acactcgagt gtgtgatgat gtgaacgaat gtgagactcc tggaatctgt 4980 ggtccgggga cctgttacaa caccgttggc aactatacct gcatttgtcc tccagactac 5040 atgcaagtga acgggggaaa taattgcatg gacatgagaa gaagtctatg ctacagaaac 5100 tattacgctg acaaccagac ctgcgatgga gaactcctgt tcaacatgac caagaagatg 5160 tgctgttgct cctacaacat cggcagagcc tggaacaaac cctgtgaaca gtgccccatc 5220 ccaagcacag atgagtttgc taccctctgt gggagccaga ggcccggctt cgtgattgac 5280 atttatacgg gtttacccgt ggatattgat gaatgccggg agatccctgg ggtctgtgaa 5340 aatggagtgt gcatcaacat ggttggcagc ttccggtgtg agtgtcccgt gggattcttc 5400 tataacgaca agttactggt ttgtgaagat atcgacgagt gtcagaatgg ccctgtgtgc 5460 cagcgaaatg cggaatgcat caacactgca ggcagctacc gctgtgactg taagcccggc 5520 taccgcctta cctccacagg tcaatgcaac gatcgaaacg agtgccaaga aatcccgaac 5580 atatgcagtc atggccagtg catcgacacc gtgggaagct tctactgcct ttgtcacact 5640 ggcttcaaaa caaatgtgga tcagaccatg tgcttagaca taaatgagtg tgagagagac 5700 gcctgtggga acgggacttg cagaaacacg attggctcct tcaactgtcg ctgtaaccat 5760 ggcttcatac tgtctcacaa caatgactgc atagatgttg atgagtgtgc aactggaaac 5820 gggaaccttt gcagaaatgg ccagtgtgtc aataccgtgg gctcctttca gtgcaggtgc 5880 aatgaaggct atgaggtggc tccggacggc aggacctgtg tggatatcaa cgagtgtgtt 5940 ctggatcctg ggaaatgtgc acctggaacc tgtcagaacc tggatggctc ctacagatgc 6000 atttgcccgc ctgggtatag tctacagaat gacaagtgtg aagatattga tgagtgtgtt 6060 gaagagccag aaatctgtgc cttggggacc tgcagcaaca ctgagggtag cttcaaatgt 6120 ctgtgtccag aggggttctc cctgtcctcc actggaagaa ggtgccaaga tttgcgaatg 6180 agctactgct atgcgaagtt tgaaggtggg aagtgttcat cacccaaatc cagaaaccat 6240 tccaagcagg agtgctgctg tgctttgaag ggagaaggct ggggagatcc ttgtgagttg 6300 tgccccactg agccagatga ggctttccgc cagatctgcc cctttggaag tgggatcatt 6360 gtgggccctg atgactcagc agttgatatg gacgaatgca aagaacctga tgtctgtaga 6420 catgggcagt gcattaacac agacggctcc tatcgatgcg agtgtccttt tggttatatt 6480 ctggaaggga atgagtgtgt ggataccgat gaatgctctg tgggcaatcc ttgtggaaat 6540 gggacctgca agaatgtgat tggaggtttt gaatgtacct gtgaggaggg gttcgagcct 6600 ggcccaatga tgacttgtga agatataaat gaatgtgccc agaatcctct gctctgcgcc 6660 ttccgctgtg taaataccta cgggtcctat gaatgcaaat gccctgttgg atacgttctc 6720 cgagaagaca ggaggatgtg taaagatgag gatgagtgtg cagagggaaa acacgactgt 6780 actgagaagc aaatggagtg taagaacctc attggtacct acatgtgcat ctgcggccct 6840 gggtaccagc gcagacccga tggagagggc tgcatagatg agaatgagtg tcagaccaag 6900 cccgggatct gtgagaatgg gcgttgcctc aacaccctgg gtagctacac ttgtgagtgt 6960 aacgatggct tcacagccag ccccactcag gatgagtgct tggacaaccg ggaagggtac 7020 tgcttttcgg aggtcttgca aaacatgtgc cagattggct caagcaacag gaaccccgtc 7080 accaagtccg agtgctgctg tgatggaggg agaggctggg gaccccactg tgagatctgc 7140 cctttcgagg gcacagtggc ttacaagaag ctctgtcccc acggccgagg attcatgacc 7200 aacggagcag atattgatga gtgcaaggtt attcatgatg tttgccgaaa tggggagtgt 7260 gtcaacgaca gagggtccta tcactgcatc tgtaaaactg gctacactcc ggatataaca 7320 gggaccgcct gtgtagatct gaatgaatgc aaccaggctc ccaaaccctg caattttata 7380 tgcaaaaaca cagaagggag ttaccagtgt tcctgcccga agggctacat tctgcaagag 7440 gatggaagga gctgcaaaga tcttgacgag tgtgcaacca agcagcataa ctgtcagttc 7500 ctgtgtgtta acaccatcgg tggcttcaca tgcaaatgcc ctcctgggtt tacccagcat 7560 cacactgcct gcattgataa caatgagtgc acgtctgata tcaacctgtg tgggtccaag 7620 ggtgtttgcc agaacactcc aggaagcttc acctgtgaat gccaacgggg gttctcactc 7680 gatcagagtg gtgccagctg tgaagatgtg gacgagtgtg agggtaacca ccgctgtcaa 7740 catggctgcc agaacatcat cggaggctat aggtgtagct gcccccaggg ctacctccag 7800 cactaccaat ggaaccagtg tgtagatgaa aacgagtgcc tgagtgcaca tgtctgtgga 7860 ggagcctcct gccacaacac cctggggagt tacaagtgca tgtgtcccac cggcttccag 7920 tacgaacagt tcagtggagg ctgccaagac atcaatgagt gtggctcatc ccaggccccc 7980 tgcagttacg gttgctctaa tactgagggt ggctacctgt gtggctgtcc accaggatac 8040 ttccggatag gccaagggca ttgtgtttct ggaatgggca tgggccgagg cggcccagag 8100 ccacctgcca gcagcgagat ggacgacaac tcactgtccc cagaggcctg ctatgagtgt 8160 aagatcaacg gctacccaaa acgaggccgg aaacggagaa gcacgaacga aaactgatgc 8220 ctccgacatc caggacgggt ctgagatgga agccaacgtg agcctcgcca gctgggatgt 8280 ggagaagccg gctagctttg ctttcaatat ttcccatgtc aataacaagg tccgaatcct 8340 agagctcctg ccggccctca caactctgat gaaccacaac agatacttga ttgaatctgg 8400 aaatgaagat ggcttcttta aaatcaacca gaaagaaggg gtcagctacc tccacttcac 8460 gaagaagaag ccggtggctg ggacctactc cttacaaatc agcagcaccc cactttataa 8520 aaagaaagaa cttaaccagt tagaagacag atatgacaaa gactacctca gtggtgaact 8580 gggcgataac ctgaagatga aaattcagat cttgctgcat taa 8623 <210> 22 <211> 8647 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 22 atgcggcgag gagggctgct ggaggtcgcg ctggcgttcg ccctgctcct cgagtcctac 60 acgagccatg gggcggacgc caatttggag gctgggagcc tgaaggagac cagagccaat 120 cgggccaaga gaagaggcgg cggaggacac gatgcgctga aaggacccaa tgtctgtgga 180 tcacgttata atgcatactg ttgtcctgga tggaaaacct tacctggtgg aaatcagtgt 240 attgttccca tttgccggca ttcctgtggg gatggattct gctcgaggcc aaatatgtgc 300 acttgcccgt ctggtcagat atctccttcc tgtggctcca gatccatcca acactgcagc 360 atccgctgta tgaatggggg cagctgcagc gatgaccact gtctgtgcca gaaagggtac 420 atcggcactc actgtggaca gcctgtctgt gaaagtggct gtctcaacgg agggaggtgt 480 gtggccccaa atcggtgtgc ttgcacgtac ggctttactg gaccccagtg tgaaagagat 540 tacagaacag gcccatgttt tactgtggta agcaaccaga tgtgccaggg acagctcagc 600 gggattgtct gcaccaaaac actttgctgt gccaccgtgg gccgagcctg gggccacccc 660 tgtgagatgt gtcctgccca gcctcacccc tgccgccgcg gcttcattcc caacatccgc 720 actggagctt gtcaagatgt ggatgaatgt caggccatcc cagggatgtg tcaaggagga 780 aattgcatta ataccgttgg atcttttgag tgcaaatgcc ctgctggaca caaatttaat 840 gaagtgtcac aaaaatgtga agatattgac gagtgcagca ccattcctgg agtctgcgat 900 ggcggggaat gtacaaacac tgtcagcagc tacttctgca aatgtccccc tggtttttac 960 acctctcctg atggcaccag atgcgtagat gttcgccctg gttactgcta cacagctctg 1020 gcaaacgggc gctgctctaa ccagctgcca cagtccataa ccaaaatgca gtgctgttgc 1080 gatcttggcc ggtgctggtc tccaggggtt actgttgctc ccgagatgtg tcccatcagg 1140 tcaactgagg atttcaacaa gctgtgctct gtccctctgg taattcccgg gagaccagaa 1200 tatcctcccc cacccattgg cccccttcct ccagttcagc ccgttcctcc tggctatcct 1260 cctgggcctg tgattccagc ccctcggcca ccgccagaat atccatatcc atctccgtct 1320 cgggaaccac caagggtgct gcctttcaac gttactgact actgtcaact ggtccgctat 1380 ctctgtcaaa atgggcgctg cattccaact cccggtagct accgctgcga gtgcaacaag 1440 ggcttccagc tggatatccg tggcgaatgc atcgacgtgg atgagtgtga gaagaaccca 1500 tgcactggtg gcgagtgcat caacaaccag ggctcctaca cctgtcactg cagagctggc 1560 taccagagca cactcaccag aactgagtgc agagacatag atgagtgtct tcagaatggc 1620 cggatctgca acaatggtcg ctgtatcaac acagacggca gcttccactg cgtatgcaat 1680 gcgggctttc atgtcacgcg ggacggaaag aactgtgaag atatggatga gtgcagcatc 1740 cgaaacatgt gcctaaacgg aatgtgtatt aatgaagatg gcagtttcaa gtgtatttgc 1800 aaacctgggt tccaactggc atcagatggc cgctactgca aagatatcaa tgagtgtgag 1860 acacctggga tctgcatgaa cggacgctgt gtgaacacgg atggctccta cagatgcgaa 1920 tgcttccccg gattggctgt gggtctagac ggacgtgtgt gtgttgacac acacatgcgg 1980 agcacatgct atggaggata caggagaggc cagtgcgtga agccgttgtt tggtgctgtt 2040 accaaatcgg aatgctgttg tgccagcact gagtatgcct ttggggaacc ctgccagccg 2100 tgtcctgcac agaattcagc ggaatatcag gcactctgca gcagtggacc gggaatgaca 2160 tcagcaggca ctgatataaa cgaatgtgca ttagatcctg atatttgccc aaatggaatt 2220 tgtgaaaatc tccgtgggac ctacaaatgt atatgcaact cgggatatga agtagacata 2280 actgggaaaa actgtgtcga tattaatgag tgtgtgctga acagtctact ttgtgacaat 2340 ggacaatgtc gaaacacacc tggaagtttt gtctgcacct gccccaaagg atttgtgtac 2400 aaacctgacc taaaaacctg tgaagacatt gatgaatgtg aatcgagtcc ttgcattaat 2460 ggagtctgca agaacagccc tggctccttc atttgtgaat gttctcctga aagtactctg 2520 gacccaacaa aaaccatctg catagaaacc atcaagggca cttgctggca gactgtcatc 2580 gacgggcgct gtgagatcaa catcaacgga gccaccttga agtccgagtg ctgctcctcc 2640 cttggtgctg cgtgggggag cccgtgcacc atctgtcaac ttgatcccat ttgtggtaaa 2700 gggttctcaa gaattaaagg cacgcaatgt gaagatatca atgagtgtga agtgttcccg 2760 ggagtatgca agaacggcct gtgtgtcaac tccaggggtt cattcaagtg cgagtgtccc 2820 aatggaatga ctttggatgc tacaggaaga atctgtcttg acatccgcct ggagacctgc 2880 ttcctcaagt atgacgatga agagtgcacc ttgcccatcg ctggccgcca ccgaatggat 2940 gcctgctgct gctctgttgg ggcagcctgg ggaacggaag agtgtgagga gtgtccattg 3000 agaaacagcc gggagtatga ggaactctgt ccccgaggac ctgggtttgc cacaaaagac 3060 attacaaatg ggaaaccttt cttcaaagat atcaatgagt gcaagatgat acccagcctc 3120 tgtacccacg gcaagtgcag gaacaccatt ggcagcttca agtgtaggtg tgacagtggc 3180 tttgctctgg attctgaaga gaggaactgt acagacattg atgagtgccg catatctcct 3240 gacctctgtg gccgaggcca gtgtgtgaac accccggggg actttgaatg caagtgtgat 3300 gaaggctatg aaagtggctt catgatgatg aagaactgca tggatattga tgaatgtcag 3360 agagatcctc tcctgtgtcg aggaggcatt tgccacaaca cagagggaag ctatcgctgc 3420 gaatgtcctc ctggtcacca attgtcccca aacatctctg catgcattga catcaacgag 3480 tgtgagctga gtgcgaatct ctgtccccat gggcgttgtg tgaacctcat agggaagtac 3540 cagtgtgcct gcaaccctgg ctaccacccc actcatgaca ggctcttctg tgtcgatatt 3600 gatgaatgca gcataatgaa cggtggttgt gagaccttct gcacaaactc tgacgggagc 3660 tatgaatgta gctgtcagcc aggcttcgcg ctaatgccag accagcgatc gtgcacagac 3720 attgatgagt gtgaagacaa ccccaatatc tgtgatggtg gccagtgcac aaacatacct 3780 ggggagtaca ggtgcctgtg ctatgatggg ttcatggcat ctgaagacat gaagacttgt 3840 gtggatgtca atgagtgtga cctgaatcca aacatctgcc ttagtgggac ctgtgaaaat 3900 actaaaggct cgttcatctg ccactgtgat atgggatatt cagggaagaa aggaaaaacg 3960 ggctgtacag atatcaatga atgtgagatc ggagcacaca actgtggcag acatgctgta 4020 tgcacaaata cagccgggag cttcaagtgc agctgcagtc ccggctggat tggagacggc 4080 attaagtgca cagatctgga tgaatgctct aatggaaccc acatgtgcag ccaacacgcg 4140 gactgcaaga acaccatggg gtcatatcgc tgtctctgta aggatggcta tacaggggat 4200 ggcttcacct gtacagacct cgacgagtgc tccgagaacc tgaacctctg tggcaatggc 4260 cagtgcctca acgcccctgg cgggtaccgc tgtgaatgcg acatgggctt cgtgcccagt 4320 gctgacggga aggcctgtga agatatcgat gagtgctccc ttccaaacat ctgtgtcttt 4380 ggaacttgcc acaacctccc gggcctcttc cgttgcgagt gtgagattgg ctatgaactg 4440 gaccgaagtg gtggaaactg cacagatgtt aatgagtgtc tggatcccac cacctgcatc 4500 agtggaaact gtgtcaacac tcccggtagt tacacatgcg attgtcctcc ggattttgag 4560 ctgaatccaa ctcgtgtcgg ctgtgtcgat actcgctctg gaaactgcta tctggatatc 4620 cgaccccggg gagacaatgg agatacagcc tgcagcaatg aaattggagt tggtgtctct 4680 aaggcttcct gctgttgttc actgggtaaa gcttggggaa ccccatgtga gctgtgtcct 4740 tctgtgaaca catctgagta taaaattctt tgccctggag gagaaggttt tcgtccaaat 4800 cccatcaccg ttatattgga agacatcgat gagtgccagg agcttccagg gctgtgccaa 4860 ggggggaagt gcatcaatac ctttggcagc ttccagtgtc gctgtccaac tggttactac 4920 ctgaatgaag acactcgagt gtgtgatgat gtgaacgaat gtgagactcc tggaatctgt 4980 ggtccgggga cctgttacaa caccgttggc aactatacct gcatttgtcc tccagactac 5040 atgcaagtga acgggggaaa taattgcatg gacatgagaa gaagtctatg ctacagaaac 5100 tattacgctg acaaccagac ctgcgatgga gaactcctgt tcaacatgac caagaagatg 5160 tgctgttgct cctacaacat cggcagagcc tggaacaaac cctgtgaaca gtgccccatc 5220 ccaagcacag atgagtttgc taccctctgt gggagccaga ggcccggctt cgtgattgac 5280 atttatacgg gtttacccgt ggatattgat gaatgccggg agatccctgg ggtctgtgaa 5340 aatggagtgt gcatcaacat ggttggcagc ttccggtgtg agtgtcccgt gggattcttc 5400 tataacgaca agttactggt ttgtgaagat atcgacgagt gtcagaatgg ccctgtgtgc 5460 cagcgaaatg cggaatgcat caacactgca ggcagctacc gctgtgactg taagcccggc 5520 taccgcctta cctccacagg tcaatgcaac gatcgaaacg agtgccaaga aatcccgaac 5580 atatgcagtc atggccagtg catcgacacc gtgggaagct tctactgcct ttgtcacact 5640 ggcttcaaaa caaatgtgga tcagaccatg tgcttagaca taaatgagtg tgagagagac 5700 gcctgtggga acgggacttg cagaaacacg attggctcct tcaactgtcg ctgtaaccat 5760 ggcttcatac tgtctcacaa caatgactgc atagatgttg atgagtgtgc aactggaaac 5820 gggaaccttt gcagaaatgg ccagtgtgtc aataccgtgg gctcctttca gtgcaggtgc 5880 aatgaaggct atgaggtggc tccggacggc aggacctgtg tggatatcaa cgagtgtgtt 5940 ctggatcctg ggaaatgtgc acctggaacc tgtcagaacc tggatggctc ctacagatgc 6000 atttgcccgc ctgggtatag tctacagaat gacaagtgtg aagatattga tgagtgtgtt 6060 gaagagccag aaatctgtgc cttggggacc tgcagcaaca ctgagggtag cttcaaatgt 6120 ctgtgtccag aggggttctc cctgtcctcc actggaagaa ggtgccaaga tttgcgaatg 6180 agctactgct atgcgaagtt tgaaggtggg aagtgttcat cacccaaatc cagaaaccat 6240 tccaagcagg agtgctgctg tgctttgaag ggagaaggct ggggagatcc ttgtgagttg 6300 tgccccactg agccagatga ggctttccgc cagatctgcc cctttggaag tgggatcatt 6360 gtgggccctg atgactcagc agttgatatg gacgaatgca aagaacctga tgtctgtaga 6420 catgggcagt gcattaacac agacggctcc tatcgatgcg agtgtccttt tggttatatt 6480 ctggaaggga atgagtgtgt ggataccgat gaatgctctg tgggcaatcc ttgtggaaat 6540 gggacctgca agaatgtgat tggaggtttt gaatgtacct gtgaggaggg gttcgagcct 6600 ggcccaatga tgacttgtga agatataaat gaatgtgccc agaatcctct gctctgcgcc 6660 ttccgctgtg taaataccta cgggtcctat gaatgcaaat gccctgttgg atacgttctc 6720 cgagaagaca ggaggatgtg taaagatgag gatgagtgtg cagagggaaa acacgactgt 6780 actgagaagc aaatggagtg taagaacctc attggtacct acatgtgcat ctgcggccct 6840 gggtaccagc gcagacccga tggagagggc tgcatagatg agaatgagtg tcagaccaag 6900 cccgggatct gtgagaatgg gcgttgcctc aacaccctgg gtagctacac ttgtgagtgt 6960 aacgatggct tcacagccag ccccactcag gatgagtgct tggacaaccg ggaagggtac 7020 tgcttttcgg aggtcttgca aaacatgtgc cagattggct caagcaacag gaaccccgtc 7080 accaagtccg agtgctgctg tgatggaggg agaggctggg gaccccactg tgagatctgc 7140 cctttcgagg gcacagtggc ttacaagaag ctctgtcccc acggccgagg attcatgacc 7200 aacggagcag atattgatga gtgcaaggtt attcatgatg tttgccgaaa tggggagtgt 7260 gtcaacgaca gagggtccta tcactgcatc tgtaaaactg gctacactcc ggatataaca 7320 gggaccgcct gtgtagatct gaatgaatgc aaccaggctc ccaaaccctg caattttata 7380 tgcaaaaaca cagaagggag ttaccagtgt tcctgcccga agggctacat tctgcaagag 7440 gatggaagga gctgcaaaga tcttgacgag tgtgcaacca agcagcataa ctgtcagttc 7500 ctgtgtgtta acaccatcgg tggcttcaca tgcaaatgcc ctcctgggtt tacccagcat 7560 cacactgcct gcattgataa caatgagtgc acgtctgata tcaacctgtg tgggtccaag 7620 ggtgtttgcc agaacactcc aggaagcttc acctgtgaat gccaacgggg gttctcactc 7680 gatcagagtg gtgccagctg tgaagatgtg gacgagtgtg agggtaacca ccgctgtcaa 7740 catggctgcc agaacatcat cggaggctat aggtgtagct gcccccaggg ctacctccag 7800 cactaccaat ggaaccagtg tgtagatgaa aacgagtgcc tgagtgcaca tgtctgtgga 7860 ggagcctcct gccacaacac cctggggagt tacaagtgca tgtgtcccac cggcttccag 7920 tacgaacagt tcagtggagg ctgccaagac atcaatgagt gtggctcatc ccaggccccc 7980 tgcagttacg gttgctctaa tactgagggt ggctacctgt gtggctgtcc accaggatac 8040 ttccggatag gccaagggca ttgtgtttct ggaatgggca tgggccgagg cggcccagag 8100 ccacctgcca gcagcgagat ggacgacaac tcactgtccc cagaggcctg ctatgagtgt 8160 aagatcaacg gctacccaaa ggcggcccag agccacctgc cagcaacgag gccggaaacg 8220 gagaagcacg aacgaaacgg atgcctccga catccaggac gggtctgaga tggaagccaa 8280 cgtgagcctc gccagctggg atgtggagaa gccggctagc tttgctttca atatttccca 8340 tgtcaataac aaggtccgaa tcctagagct cctgccggcc ctcacaactc tgatgaacca 8400 caacagatac ttgattgaat ctggaaatga agatggcttc tttaaaatca accagaaaga 8460 aggggtcagc tacctccact tcacgaagaa gaagccggtg gctgggacct actccttaca 8520 aatcagcagc accccacttt ataaaaagaa agaacttaac cagttagaag acagatatga 8580 caaagactac ctcagtggtg aactgggcga taacctgaag atgaaaattc agatcttgct 8640 gcattaa 8647 <210> 23 <211> 8620 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 23 atgcggcgag gagggctgct ggaggtcgcg ctggcgttcg ccctgctcct cgagtcctac 60 acgagccatg gggcggacgc caatttggag gctgggagcc tgaaggagac cagagccaat 120 cgggccaaga gaagaggcgg cggaggacac gatgcgctga aaggacccaa tgtctgtgga 180 tcacgttata atgcatactg ttgtcctgga tggaaaacct tacctggtgg aaatcagtgt 240 attgttccca tttgccggca ttcctgtggg gatggattct gctcgaggcc aaatatgtgc 300 acttgcccgt ctggtcagat atctccttcc tgtggctcca gatccatcca acactgcagc 360 atccgctgta tgaatggggg cagctgcagc gatgaccact gtctgtgcca gaaagggtac 420 atcggcactc actgtggaca gcctgtctgt gaaagtggct gtctcaacgg agggaggtgt 480 gtggccccaa atcggtgtgc ttgcacgtac ggctttactg gaccccagtg tgaaagagat 540 tacagaacag gcccatgttt tactgtggta agcaaccaga tgtgccaggg acagctcagc 600 gggattgtct gcaccaaaac actttgctgt gccaccgtgg gccgagcctg gggccacccc 660 tgtgagatgt gtcctgccca gcctcacccc tgccgccgcg gcttcattcc caacatccgc 720 actggagctt gtcaagatgt ggatgaatgt caggccatcc cagggatgtg tcaaggagga 780 aattgcatta ataccgttgg atcttttgag tgcaaatgcc ctgctggaca caaatttaat 840 gaagtgtcac aaaaatgtga agatattgac gagtgcagca ccattcctgg agtctgcgat 900 ggcggggaat gtacaaacac tgtcagcagc tacttctgca aatgtccccc tggtttttac 960 acctctcctg atggcaccag atgcgtagat gttcgccctg gttactgcta cacagctctg 1020 gcaaacgggc gctgctctaa ccagctgcca cagtccataa ccaaaatgca gtgctgttgc 1080 gatcttggcc ggtgctggtc tccaggggtt actgttgctc ccgagatgtg tcccatcagg 1140 tcaactgagg atttcaacaa gctgtgctct gtccctctgg taattcccgg gagaccagaa 1200 tatcctcccc cacccattgg cccccttcct ccagttcagc ccgttcctcc tggctatcct 1260 cctgggcctg tgattccagc ccctcggcca ccgccagaat atccatatcc atctccgtct 1320 cgggaaccac caagggtgct gcctttcaac gttactgact actgtcaact ggtccgctat 1380 ctctgtcaaa atgggcgctg cattccaact cccggtagct accgctgcga gtgcaacaag 1440 ggcttccagc tggatatccg tggcgaatgc atcgacgtgg atgagtgtga gaagaaccca 1500 tgcactggtg gcgagtgcat caacaaccag ggctcctaca cctgtcactg cagagctggc 1560 taccagagca cactcaccag aactgagtgc agagacatag atgagtgtct tcagaatggc 1620 cggatctgca acaatggtcg ctgtatcaac acagacggca gcttccactg cgtatgcaat 1680 gcgggctttc atgtcacgcg ggacggaaag aactgtgaag atatggatga gtgcagcatc 1740 cgaaacatgt gcctaaacgg aatgtgtatt aatgaagatg gcagtttcaa gtgtatttgc 1800 aaacctgggt tccaactggc atcagatggc cgctactgca aagatatcaa tgagtgtgag 1860 acacctggga tctgcatgaa cggacgctgt gtgaacacgg atggctccta cagatgcgaa 1920 tgcttccccg gattggctgt gggtctagac ggacgtgtgt gtgttgacac acacatgcgg 1980 agcacatgct atggaggata caggagaggc cagtgcgtga agccgttgtt tggtgctgtt 2040 accaaatcgg aatgctgttg tgccagcact gagtatgcct ttggggaacc ctgccagccg 2100 tgtcctgcac agaattcagc ggaatatcag gcactctgca gcagtggacc gggaatgaca 2160 tcagcaggca ctgatataaa cgaatgtgca ttagatcctg atatttgccc aaatggaatt 2220 tgtgaaaatc tccgtgggac ctacaaatgt atatgcaact cgggatatga agtagacata 2280 actgggaaaa actgtgtcga tattaatgag tgtgtgctga acagtctact ttgtgacaat 2340 ggacaatgtc gaaacacacc tggaagtttt gtctgcacct gccccaaagg atttgtgtac 2400 aaacctgacc taaaaacctg tgaagacatt gatgaatgtg aatcgagtcc ttgcattaat 2460 ggagtctgca agaacagccc tggctccttc atttgtgaat gttctcctga aagtactctg 2520 gacccaacaa aaaccatctg catagaaacc atcaagggca cttgctggca gactgtcatc 2580 gacgggcgct gtgagatcaa catcaacgga gccaccttga agtccgagtg ctgctcctcc 2640 cttggtgctg cgtgggggag cccgtgcacc atctgtcaac ttgatcccat ttgtggtaaa 2700 gggttctcaa gaattaaagg cacgcaatgt gaagatatca atgagtgtga agtgttcccg 2760 ggagtatgca agaacggcct gtgtgtcaac tccaggggtt cattcaagtg cgagtgtccc 2820 aatggaatga ctttggatgc tacaggaaga atctgtcttg acatccgcct ggagacctgc 2880 ttcctcaagt atgacgatga agagtgcacc ttgcccatcg ctggccgcca ccgaatggat 2940 gcctgctgct gctctgttgg ggcagcctgg ggaacggaag agtgtgagga gtgtccattg 3000 agaaacagcc gggagtatga ggaactctgt ccccgaggac ctgggtttgc cacaaaagac 3060 attacaaatg ggaaaccttt cttcaaagat atcaatgagt gcaagatgat acccagcctc 3120 tgtacccacg gcaagtgcag gaacaccatt ggcagcttca agtgtaggtg tgacagtggc 3180 tttgctctgg attctgaaga gaggaactgt acagacattg atgagtgccg catatctcct 3240 gacctctgtg gccgaggcca gtgtgtgaac accccggggg actttgaatg caagtgtgat 3300 gaaggctatg aaagtggctt catgatgatg aagaactgca tggatattga tgaatgtcag 3360 agagatcctc tcctgtgtcg aggaggcatt tgccacaaca cagagggaag ctatcgctgc 3420 gaatgtcctc ctggtcacca attgtcccca aacatctctg catgcattga catcaacgag 3480 tgtgagctga gtgcgaatct ctgtccccat gggcgttgtg tgaacctcat agggaagtac 3540 cagtgtgcct gcaaccctgg ctaccacccc actcatgaca ggctcttctg tgtcgatatt 3600 gatgaatgca gcataatgaa cggtggttgt gagaccttct gcacaaactc tgacgggagc 3660 tatgaatgta gctgtcagcc aggcttcgcg ctaatgccag accagcgatc gtgcacagac 3720 attgatgagt gtgaagacaa ccccaatatc tgtgatggtg gccagtgcac aaacatacct 3780 ggggagtaca ggtgcctgtg ctatgatggg ttcatggcat ctgaagacat gaagacttgt 3840 gtggatgtca atgagtgtga cctgaatcca aacatctgcc ttagtgggac ctgtgaaaat 3900 actaaaggct cgttcatctg ccactgtgat atgggatatt cagggaagaa aggaaaaacg 3960 ggctgtacag atatcaatga atgtgagatc ggagcacaca actgtggcag acatgctgta 4020 tgcacaaata cagccgggag cttcaagtgc agctgcagtc ccggctggat tggagacggc 4080 attaagtgca cagatctgga tgaatgctct aatggaaccc acatgtgcag ccaacacgcg 4140 gactgcaaga acaccatggg gtcatatcgc tgtctctgta aggatggcta tacaggggat 4200 ggcttcacct gtacagacct cgacgagtgc tccgagaacc tgaacctctg tggcaatggc 4260 cagtgcctca acgcccctgg cgggtaccgc tgtgaatgcg acatgggctt cgtgcccagt 4320 gctgacggga aggcctgtga agatatcgat gagtgctccc ttccaaacat ctgtgtcttt 4380 ggaacttgcc acaacctccc gggcctcttc cgttgcgagt gtgagattgg ctatgaactg 4440 gaccgaagtg gtggaaactg cacagatgtt aatgagtgtc tggatcccac cacctgcatc 4500 agtggaaact gtgtcaacac tcccggtagt tacacatgcg attgtcctcc ggattttgag 4560 ctgaatccaa ctcgtgtcgg ctgtgtcgat actcgctctg gaaactgcta tctggatatc 4620 cgaccccggg gagacaatgg agatacagcc tgcagcaatg aaattggagt tggtgtctct 4680 aaggcttcct gctgttgttc actgggtaaa gcttggggaa ccccatgtga gctgtgtcct 4740 tctgtgaaca catctgagta taaaattctt tgccctggag gagaaggttt tcgtccaaat 4800 cccatcaccg ttatattgga agacatcgat gagtgccagg agcttccagg gctgtgccaa 4860 ggggggaagt gcatcaatac ctttggcagc ttccagtgtc gctgtccaac tggttactac 4920 ctgaatgaag acactcgagt gtgtgatgat gtgaacgaat gtgagactcc tggaatctgt 4980 ggtccgggga cctgttacaa caccgttggc aactatacct gcatttgtcc tccagactac 5040 atgcaagtga acgggggaaa taattgcatg gacatgagaa gaagtctatg ctacagaaac 5100 tattacgctg acaaccagac ctgcgatgga gaactcctgt tcaacatgac caagaagatg 5160 tgctgttgct cctacaacat cggcagagcc tggaacaaac cctgtgaaca gtgccccatc 5220 ccaagcacag atgagtttgc taccctctgt gggagccaga ggcccggctt cgtgattgac 5280 atttatacgg gtttacccgt ggatattgat gaatgccggg agatccctgg ggtctgtgaa 5340 aatggagtgt gcatcaacat ggttggcagc ttccggtgtg agtgtcccgt gggattcttc 5400 tataacgaca agttactggt ttgtgaagat atcgacgagt gtcagaatgg ccctgtgtgc 5460 cagcgaaatg cggaatgcat caacactgca ggcagctacc gctgtgactg taagcccggc 5520 taccgcctta cctccacagg tcaatgcaac gatcgaaacg agtgccaaga aatcccgaac 5580 atatgcagtc atggccagtg catcgacacc gtgggaagct tctactgcct ttgtcacact 5640 ggcttcaaaa caaatgtgga tcagaccatg tgcttagaca taaatgagtg tgagagagac 5700 gcctgtggga acgggacttg cagaaacacg attggctcct tcaactgtcg ctgtaaccat 5760 ggcttcatac tgtctcacaa caatgactgc atagatgttg atgagtgtgc aactggaaac 5820 gggaaccttt gcagaaatgg ccagtgtgtc aataccgtgg gctcctttca gtgcaggtgc 5880 aatgaaggct atgaggtggc tccggacggc aggacctgtg tggatatcaa cgagtgtgtt 5940 ctggatcctg ggaaatgtgc acctggaacc tgtcagaacc tggatggctc ctacagatgc 6000 atttgcccgc ctgggtatag tctacagaat gacaagtgtg aagatattga tgagtgtgtt 6060 gaagagccag aaatctgtgc cttggggacc tgcagcaaca ctgagggtag cttcaaatgt 6120 ctgtgtccag aggggttctc cctgtcctcc actggaagaa ggtgccaaga tttgcgaatg 6180 agctactgct atgcgaagtt tgaaggtggg aagtgttcat cacccaaatc cagaaaccat 6240 tccaagcagg agtgctgctg tgctttgaag ggagaaggct ggggagatcc ttgtgagttg 6300 tgccccactg agccagatga ggctttccgc cagatctgcc cctttggaag tgggatcatt 6360 gtgggccctg atgactcagc agttgatatg gacgaatgca aagaacctga tgtctgtaga 6420 catgggcagt gcattaacac agacggctcc tatcgatgcg agtgtccttt tggttatatt 6480 ctggaaggga atgagtgtgt ggataccgat gaatgctctg tgggcaatcc ttgtggaaat 6540 gggacctgca agaatgtgat tggaggtttt gaatgtacct gtgaggaggg gttcgagcct 6600 ggcccaatga tgacttgtga agatataaat gaatgtgccc agaatcctct gctctgcgcc 6660 ttccgctgtg taaataccta cgggtcctat gaatgcaaat gccctgttgg atacgttctc 6720 cgagaagaca ggaggatgtg taaagatgag gatgagtgtg cagagggaaa acacgactgt 6780 actgagaagc aaatggagtg taagaacctc attggtacct acatgtgcat ctgcggccct 6840 gggtaccagc gcagacccga tggagagggc tgcatagatg agaatgagtg tcagaccaag 6900 cccgggatct gtgagaatgg gcgttgcctc aacaccctgg gtagctacac ttgtgagtgt 6960 aacgatggct tcacagccag ccccactcag gatgagtgct tggacaaccg ggaagggtac 7020 tgcttttcgg aggtcttgca aaacatgtgc cagattggct caagcaacag gaaccccgtc 7080 accaagtccg agtgctgctg tgatggaggg agaggctggg gaccccactg tgagatctgc 7140 cctttcgagg gcacagtggc ttacaagaag ctctgtcccc acggccgagg attcatgacc 7200 aacggagcag atattgatga gtgcaaggtt attcatgatg tttgccgaaa tggggagtgt 7260 gtcaacgaca gagggtccta tcactgcatc tgtaaaactg gctacactcc ggatataaca 7320 gggaccgcct gtgtagatct gaatgaatgc aaccaggctc ccaaaccctg caattttata 7380 tgcaaaaaca cagaagggag ttaccagtgt tcctgcccga agggctacat tctgcaagag 7440 gatggaagga gctgcaaaga tcttgacgag tgtgcaacca agcagcataa ctgtcagttc 7500 ctgtgtgtta acaccatcgg tggcttcaca tgcaaatgcc ctcctgggtt tacccagcat 7560 cacactgcct gcattgataa caatgagtgc acgtctgata tcaacctgtg tgggtccaag 7620 ggtgtttgcc agaacactcc aggaagcttc acctgtgaat gccaacgggg gttctcactc 7680 gatcagagtg gtgccagctg tgaagatgtg gacgagtgtg agggtaacca ccgctgtcaa 7740 catggctgcc agaacatcat cggaggctat aggtgtagct gcccccaggg ctacctccag 7800 cactaccaat ggaaccagtg tgtagatgaa aacgagtgcc tgagtgcaca tgtctgtgga 7860 ggagcctcct gccacaacac cctggggagt tacaagtgca tgtgtcccac cggcttccag 7920 tacgaacagt tcagtggagg ctgccaagac atcaatgagt gtggctcatc ccaggccccc 7980 tgcagttacg gttgctctaa tactgagggt ggctacctgt gtggctgtcc accaggatac 8040 ttccggatag gccaagggca ttgtgtttct ggaatgggca tgggccgagg cggcccagag 8100 ccacctgcca gcagcgagat ggacgacaac tcactgtccc cagaggcctg ctatgagtgt 8160 gatcaatggc taccccaaac ggggcaggaa acggagaagc acaaacgaaa ctgatgcctc 8220 cgacatccag gacgggtctg agatggaagc caacgtgagc ctcgccagct gggatgtgga 8280 gaagccggct agctttgctt tcaatatttc ccatgtcaat aacaaggtcc gaatcctaga 8340 gctcctgccg gccctcacaa ctctgatgaa ccacaacaga tacttgattg aatctggaaa 8400 tgaagatggc ttctttaaaa tcaaccagaa agaaggggtc agctacctcc acttcacgaa 8460 gaagaagccg gtggctggga cctactcctt acaaatcagc agcaccccac tttataaaaa 8520 gaaagaactt aaccagttag aagacagata tgacaaagac tacctcagtg gtgaactggg 8580 cgataacctg aagatgaaaa ttcagatctt gctgcattaa 8620 <210> 24 <211> 175 <212> DNA <213> Homo sapiens <400> 24 gcactgtgtt tctggaatgg gcatgggccg aggaaaccca gagccacctg tcagtggtga 60 aatggatgac aattcactct ccccagaggc ttgttacgag tgtaagatca atggctaccc 120 caaacggggc aggaaacgga gaagcacaaa cgaaactgat gcctccaata tcgag 175 <210> 25 <211> 175 <212> DNA <213> Mus musculus <400> 25 gcattgtgtt tctggaatgg gcatgggccg aggcggccca gagccacctg ccagcagcga 60 gatggacgac aactcactgt ccccagaggc ctgctatgag tgtaagatca acggctaccc 120 aaaacgaggc cggaaacgga gaagcacgaa cgaaacggat gcctccgaca tccag 175 <210> 26 <211> 176 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 26 gcattgtgtt tctggaatgg gcatgggccg aggcggccca gagccacctg ccagcagcga 60 gatggacgac aactcactgt ccccagaggc ctgctatgag tgtaagatca acggctaccc 120 aaaacgaggc cggaaacgga gaagcacgaa cgaaaactga tgcctccgac atccag 176 <210> 27 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 27 gcattgtgtt tctggaatgg gcatgggccg aggcggccca gagccacctg ccagcagcga 60 gatggacgac aactcactgt ccccagaggc ctgctatgag tgtaagatca acggctaccc 120 aaaggcggcc cagagccacc tgccagcaac gaggccggaa acggagaagc acgaacgaaa 180 cggatgcctc cgacatccag 200 <210> 28 <211> 173 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 28 gcattgtgtt tctggaatgg gcatgggccg aggcggccca gagccacctg ccagcagcga 60 gatggacgac aactcactgt ccccagaggc ctgctatgag tgtgatcaat ggctacccca 120 aacggggcag gaaacggaga agcacaaacg aaactgatgc ctccgacatc cag 173 <210> 29 <211> 2871 <212> PRT <213> Homo sapiens <400> 29 Met Arg Arg Gly Arg Leu Leu Glu Ile Ala Leu Gly Phe Thr Val Leu 1 5 10 15 Leu Ala Ser Tyr Thr Ser His Gly Ala Asp Ala Asn Leu Glu Ala Gly 20 25 30 Asn Val Lys Glu Thr Arg Ala Ser Arg Ala Lys Arg Arg Gly Gly Gly 35 40 45 Gly His Asp Ala Leu Lys Gly Pro Asn Val Cys Gly Ser Arg Tyr Asn 50 55 60 Ala Tyr Cys Cys Pro Gly Trp Lys Thr Leu Pro Gly Gly Asn Gln Cys 65 70 75 80 Ile Val Pro Ile Cys Arg His Ser Cys Gly Asp Gly Phe Cys Ser Arg 85 90 95 Pro Asn Met Cys Thr Cys Pro Ser Gly Gln Ile Ala Pro Ser Cys Gly 100 105 110 Ser Arg Ser Ile Gln His Cys Asn Ile Arg Cys Met Asn Gly Gly Ser 115 120 125 Cys Ser Asp Asp His Cys Leu Cys Gln Lys Gly Tyr Ile Gly Thr His 130 135 140 Cys Gly Gln Pro Val Cys Glu Ser Gly Cys Leu Asn Gly Gly Arg Cys 145 150 155 160 Val Ala Pro Asn Arg Cys Ala Cys Thr Tyr Gly Phe Thr Gly Pro Gln 165 170 175 Cys Glu Arg Asp Tyr Arg Thr Gly Pro Cys Phe Thr Val Ile Ser Asn 180 185 190 Gln Met Cys Gln Gly Gln Leu Ser Gly Ile Val Cys Thr Lys Thr Leu 195 200 205 Cys Cys Ala Thr Val Gly Arg Ala Trp Gly His Pro Cys Glu Met Cys 210 215 220 Pro Ala Gln Pro His Pro Cys Arg Arg Gly Phe Ile Pro Asn Ile Arg 225 230 235 240 Thr Gly Ala Cys Gln Asp Val Asp Glu Cys Gln Ala Ile Pro Gly Leu 245 250 255 Cys Gln Gly Gly Asn Cys Ile Asn Thr Val Gly Ser Phe Glu Cys Lys 260 265 270 Cys Pro Ala Gly His Lys Leu Asn Glu Val Ser Gln Lys Cys Glu Asp 275 280 285 Ile Asp Glu Cys Ser Thr Ile Pro Gly Ile Cys Glu Gly Gly Glu Cys 290 295 300 Thr Asn Thr Val Ser Ser Tyr Phe Cys Lys Cys Pro Pro Gly Phe Tyr 305 310 315 320 Thr Ser Pro Asp Gly Thr Arg Cys Ile Asp Val Arg Pro Gly Tyr Cys 325 330 335 Tyr Thr Ala Leu Thr Asn Gly Arg Cys Ser Asn Gln Leu Pro Gln Ser 340 345 350 Ile Thr Lys Met Gln Cys Cys Cys Asp Ala Gly Arg Cys Trp Ser Pro 355 360 365 Gly Val Thr Val Ala Pro Glu Met Cys Pro Ile Arg Ala Thr Glu Asp 370 375 380 Phe Asn Lys Leu Cys Ser Val Pro Met Val Ile Pro Gly Arg Pro Glu 385 390 395 400 Tyr Pro Pro Pro Pro Leu Gly Pro Ile Pro Pro Val Leu Pro Val Pro 405 410 415 Pro Gly Phe Pro Pro Gly Pro Gln Ile Pro Val Pro Arg Pro Pro Val 420 425 430 Glu Tyr Leu Tyr Pro Ser Arg Glu Pro Pro Arg Val Leu Pro Val Asn 435 440 445 Val Thr Asp Tyr Cys Gln Leu Val Arg Tyr Leu Cys Gln Asn Gly Arg 450 455 460 Cys Ile Pro Thr Pro Gly Ser Tyr Arg Cys Glu Cys Asn Lys Gly Phe 465 470 475 480 Gln Leu Asp Leu Arg Gly Glu Cys Ile Asp Val Asp Glu Cys Glu Lys 485 490 495 Asn Pro Cys Ala Gly Gly Glu Cys Ile Asn Asn Gln Gly Ser Tyr Thr 500 505 510 Cys Gln Cys Arg Ala Gly Tyr Gln Ser Thr Leu Thr Arg Thr Glu Cys 515 520 525 Arg Asp Ile Asp Glu Cys Leu Gln Asn Gly Arg Ile Cys Asn Asn Gly 530 535 540 Arg Cys Ile Asn Thr Asp Gly Ser Phe His Cys Val Cys Asn Ala Gly 545 550 555 560 Phe His Val Thr Arg Asp Gly Lys Asn Cys Glu Asp Met Asp Glu Cys 565 570 575 Ser Ile Arg Asn Met Cys Leu Asn Gly Met Cys Ile Asn Glu Asp Gly 580 585 590 Ser Phe Lys Cys Ile Cys Lys Pro Gly Phe Gln Leu Ala Ser Asp Gly 595 600 605 Arg Tyr Cys Lys Asp Ile Asn Glu Cys Glu Thr Pro Gly Ile Cys Met 610 615 620 Asn Gly Arg Cys Val Asn Thr Asp Gly Ser Tyr Arg Cys Glu Cys Phe 625 630 635 640 Pro Gly Leu Ala Val Gly Leu Asp Gly Arg Val Cys Val Asp Thr His 645 650 655 Met Arg Ser Thr Cys Tyr Gly Gly Tyr Lys Arg Gly Gln Cys Ile Lys 660 665 670 Pro Leu Phe Gly Ala Val Thr Lys Ser Glu Cys Cys Cys Ala Ser Thr 675 680 685 Glu Tyr Ala Phe Gly Glu Pro Cys Gln Pro Cys Pro Ala Gln Asn Ser 690 695 700 Ala Glu Tyr Gln Ala Leu Cys Ser Ser Gly Pro Gly Met Thr Ser Ala 705 710 715 720 Gly Ser Asp Ile Asn Glu Cys Ala Leu Asp Pro Asp Ile Cys Pro Asn 725 730 735 Gly Ile Cys Glu Asn Leu Arg Gly Thr Tyr Lys Cys Ile Cys Asn Ser 740 745 750 Gly Tyr Glu Val Asp Ser Thr Gly Lys Asn Cys Val Asp Ile Asn Glu 755 760 765 Cys Val Leu Asn Ser Leu Leu Cys Asp Asn Gly Gln Cys Arg Asn Thr 770 775 780 Pro Gly Ser Phe Val Cys Thr Cys Pro Lys Gly Phe Ile Tyr Lys Pro 785 790 795 800 Asp Leu Lys Thr Cys Glu Asp Ile Asp Glu Cys Glu Ser Ser Pro Cys 805 810 815 Ile Asn Gly Val Cys Lys Asn Ser Pro Gly Ser Phe Ile Cys Glu Cys 820 825 830 Ser Ser Glu Ser Thr Leu Asp Pro Thr Lys Thr Ile Cys Ile Glu Thr 835 840 845 Ile Lys Gly Thr Cys Trp Gln Thr Val Ile Asp Gly Arg Cys Glu Ile 850 855 860 Asn Ile Asn Gly Ala Thr Leu Lys Ser Gln Cys Cys Ser Ser Leu Gly 865 870 875 880 Ala Ala Trp Gly Ser Pro Cys Thr Leu Cys Gln Val Asp Pro Ile Cys 885 890 895 Gly Lys Gly Tyr Ser Arg Ile Lys Gly Thr Gln Cys Glu Asp Ile Asp 900 905 910 Glu Cys Glu Val Phe Pro Gly Val Cys Lys Asn Gly Leu Cys Val Asn 915 920 925 Thr Arg Gly Ser Phe Lys Cys Gln Cys Pro Ser Gly Met Thr Leu Asp 930 935 940 Ala Thr Gly Arg Ile Cys Leu Asp Ile Arg Leu Glu Thr Cys Phe Leu 945 950 955 960 Arg Tyr Glu Asp Glu Glu Cys Thr Leu Pro Ile Ala Gly Arg His Arg 965 970 975 Met Asp Ala Cys Cys Cys Ser Val Gly Ala Ala Trp Gly Thr Glu Glu 980 985 990 Cys Glu Glu Cys Pro Met Arg Asn Thr Pro Glu Tyr Glu Glu Leu Cys 995 1000 1005 Pro Arg Gly Pro Gly Phe Ala Thr Lys Glu Ile Thr Asn Gly Lys Pro 1010 1015 1020 Phe Phe Lys Asp Ile Asn Glu Cys Lys Met Ile Pro Ser Leu Cys Thr 1025 1030 1035 1040 His Gly Lys Cys Arg Asn Thr Ile Gly Ser Phe Lys Cys Arg Cys Asp 1045 1050 1055 Ser Gly Phe Ala Leu Asp Ser Glu Glu Arg Asn Cys Thr Asp Ile Asp 1060 1065 1070 Glu Cys Arg Ile Ser Pro Asp Leu Cys Gly Arg Gly Gln Cys Val Asn 1075 1080 1085 Thr Pro Gly Asp Phe Glu Cys Lys Cys Asp Glu Gly Tyr Glu Ser Gly 1090 1095 1100 Phe Met Met Met Lys Asn Cys Met Asp Ile Asp Glu Cys Gln Arg Asp 1105 1110 1115 1120 Pro Leu Leu Cys Arg Gly Gly Val Cys His Asn Thr Glu Gly Ser Tyr 1125 1130 1135 Arg Cys Glu Cys Pro Pro Gly His Gln Leu Ser Pro Asn Ile Ser Ala 1140 1145 1150 Cys Ile Asp Ile Asn Glu Cys Glu Leu Ser Ala His Leu Cys Pro Asn 1155 1160 1165 Gly Arg Cys Val Asn Leu Ile Gly Lys Tyr Gln Cys Ala Cys Asn Pro 1170 1175 1180 Gly Tyr His Ser Thr Pro Asp Arg Leu Phe Cys Val Asp Ile Asp Glu 1185 1190 1195 1200 Cys Ser Ile Met Asn Gly Gly Cys Glu Thr Phe Cys Thr Asn Ser Glu 1205 1210 1215 Gly Ser Tyr Glu Cys Ser Cys Gln Pro Gly Phe Ala Leu Met Pro Asp 1220 1225 1230 Gln Arg Ser Cys Thr Asp Ile Asp Glu Cys Glu Asp Asn Pro Asn Ile 1235 1240 1245 Cys Asp Gly Gly Gln Cys Thr Asn Ile Pro Gly Glu Tyr Arg Cys Leu 1250 1255 1260 Cys Tyr Asp Gly Phe Met Ala Ser Glu Asp Met Lys Thr Cys Val Asp 1265 1270 1275 1280 Val Asn Glu Cys Asp Leu Asn Pro Asn Ile Cys Leu Ser Gly Thr Cys 1285 1290 1295 Glu Asn Thr Lys Gly Ser Phe Ile Cys His Cys Asp Met Gly Tyr Ser 1300 1305 1310 Gly Lys Lys Gly Lys Thr Gly Cys Thr Asp Ile Asn Glu Cys Glu Ile 1315 1320 1325 Gly Ala His Asn Cys Gly Lys His Ala Val Cys Thr Asn Thr Ala Gly 1330 1335 1340 Ser Phe Lys Cys Ser Cys Ser Pro Gly Trp Ile Gly Asp Gly Ile Lys 1345 1350 1355 1360 Cys Thr Asp Leu Asp Glu Cys Ser Asn Gly Thr His Met Cys Ser Gln 1365 1370 1375 His Ala Asp Cys Lys Asn Thr Met Gly Ser Tyr Arg Cys Leu Cys Lys 1380 1385 1390 Glu Gly Tyr Thr Gly Asp Gly Phe Thr Cys Thr Asp Leu Asp Glu Cys 1395 1400 1405 Ser Glu Asn Leu Asn Leu Cys Gly Asn Gly Gln Cys Leu Asn Ala Pro 1410 1415 1420 Gly Gly Tyr Arg Cys Glu Cys Asp Met Gly Phe Val Pro Ser Ala Asp 1425 1430 1435 1440 Gly Lys Ala Cys Glu Asp Ile Asp Glu Cys Ser Leu Pro Asn Ile Cys 1445 1450 1455 Val Phe Gly Thr Cys His Asn Leu Pro Gly Leu Phe Arg Cys Glu Cys 1460 1465 1470 Glu Ile Gly Tyr Glu Leu Asp Arg Ser Gly Gly Asn Cys Thr Asp Val 1475 1480 1485 Asn Glu Cys Leu Asp Pro Thr Thr Cys Ile Ser Gly Asn Cys Val Asn 1490 1495 1500 Thr Pro Gly Ser Tyr Ile Cys Asp Cys Pro Pro Asp Phe Glu Leu Asn 1505 1510 1515 1520 Pro Thr Arg Val Gly Cys Val Asp Thr Arg Ser Gly Asn Cys Tyr Leu 1525 1530 1535 Asp Ile Arg Pro Arg Gly Asp Asn Gly Asp Thr Ala Cys Ser Asn Glu 1540 1545 1550 Ile Gly Val Gly Val Ser Lys Ala Ser Cys Cys Cys Ser Leu Gly Lys 1555 1560 1565 Ala Trp Gly Thr Pro Cys Glu Met Cys Pro Ala Val Asn Thr Ser Glu 1570 1575 1580 Tyr Lys Ile Leu Cys Pro Gly Gly Glu Gly Phe Arg Pro Asn Pro Ile 1585 1590 1595 1600 Thr Val Ile Leu Glu Asp Ile Asp Glu Cys Gln Glu Leu Pro Gly Leu 1605 1610 1615 Cys Gln Gly Gly Lys Cys Ile Asn Thr Phe Gly Ser Phe Gln Cys Arg 1620 1625 1630 Cys Pro Thr Gly Tyr Tyr Leu Asn Glu Asp Thr Arg Val Cys Asp Asp 1635 1640 1645 Val Asn Glu Cys Glu Thr Pro Gly Ile Cys Gly Pro Gly Thr Cys Tyr 1650 1655 1660 Asn Thr Val Gly Asn Tyr Thr Cys Ile Cys Pro Pro Asp Tyr Met Gln 1665 1670 1675 1680 Val Asn Gly Gly Asn Asn Cys Met Asp Met Arg Arg Ser Leu Cys Tyr 1685 1690 1695 Arg Asn Tyr Tyr Ala Asp Asn Gln Thr Cys Asp Gly Glu Leu Leu Phe 1700 1705 1710 Asn Met Thr Lys Lys Met Cys Cys Cys Ser Tyr Asn Ile Gly Arg Ala 1715 1720 1725 Trp Asn Lys Pro Cys Glu Gln Cys Pro Ile Pro Ser Thr Asp Glu Phe 1730 1735 1740 Ala Thr Leu Cys Gly Ser Gln Arg Pro Gly Phe Val Ile Asp Ile Tyr 1745 1750 1755 1760 Thr Gly Leu Pro Val Asp Ile Asp Glu Cys Arg Glu Ile Pro Gly Val 1765 1770 1775 Cys Glu Asn Gly Val Cys Ile Asn Met Val Gly Ser Phe Arg Cys Glu 1780 1785 1790 Cys Pro Val Gly Phe Phe Tyr Asn Asp Lys Leu Leu Val Cys Glu Asp 1795 1800 1805 Ile Asp Glu Cys Gln Asn Gly Pro Val Cys Gln Arg Asn Ala Glu Cys 1810 1815 1820 Ile Asn Thr Ala Gly Ser Tyr Arg Cys Asp Cys Lys Pro Gly Tyr Arg 1825 1830 1835 1840 Phe Thr Ser Thr Gly Gln Cys Asn Asp Arg Asn Glu Cys Gln Glu Ile 1845 1850 1855 Pro Asn Ile Cys Ser His Gly Gln Cys Ile Asp Thr Val Gly Ser Phe 1860 1865 1870 Tyr Cys Leu Cys His Thr Gly Phe Lys Thr Asn Asp Asp Gln Thr Met 1875 1880 1885 Cys Leu Asp Ile Asn Glu Cys Glu Arg Asp Ala Cys Gly Asn Gly Thr 1890 1895 1900 Cys Arg Asn Thr Ile Gly Ser Phe Asn Cys Arg Cys Asn His Gly Phe 1905 1910 1915 1920 Ile Leu Ser His Asn Asn Asp Cys Ile Asp Val Asp Glu Cys Ala Ser 1925 1930 1935 Gly Asn Gly Asn Leu Cys Arg Asn Gly Gln Cys Ile Asn Thr Val Gly 1940 1945 1950 Ser Phe Gln Cys Gln Cys Asn Glu Gly Tyr Glu Val Ala Pro Asp Gly 1955 1960 1965 Arg Thr Cys Val Asp Ile Asn Glu Cys Leu Leu Glu Pro Arg Lys Cys 1970 1975 1980 Ala Pro Gly Thr Cys Gln Asn Leu Asp Gly Ser Tyr Arg Cys Ile Cys 1985 1990 1995 2000 Pro Pro Gly Tyr Ser Leu Gln Asn Glu Lys Cys Glu Asp Ile Asp Glu 2005 2010 2015 Cys Val Glu Glu Pro Glu Ile Cys Ala Leu Gly Thr Cys Ser Asn Thr 2020 2025 2030 Glu Gly Ser Phe Lys Cys Leu Cys Pro Glu Gly Phe Ser Leu Ser Ser 2035 2040 2045 Ser Gly Arg Arg Cys Gln Asp Leu Arg Met Ser Tyr Cys Tyr Ala Lys 2050 2055 2060 Phe Glu Gly Gly Lys Cys Ser Ser Pro Lys Ser Arg Asn His Ser Lys 2065 2070 2075 2080 Gln Glu Cys Cys Cys Ala Leu Lys Gly Glu Gly Trp Gly Asp Pro Cys 2085 2090 2095 Glu Leu Cys Pro Thr Glu Pro Asp Glu Ala Phe Arg Gln Ile Cys Pro 2100 2105 2110 Tyr Gly Ser Gly Ile Ile Val Gly Pro Asp Asp Ser Ala Val Asp Met 2115 2120 2125 Asp Glu Cys Lys Glu Pro Asp Val Cys Lys His Gly Gln Cys Ile Asn 2130 2135 2140 Thr Asp Gly Ser Tyr Arg Cys Glu Cys Pro Phe Gly Tyr Ile Leu Ala 2145 2150 2155 2160 Gly Asn Glu Cys Val Asp Thr Asp Glu Cys Ser Val Gly Asn Pro Cys 2165 2170 2175 Gly Asn Gly Thr Cys Lys Asn Val Ile Gly Gly Phe Glu Cys Thr Cys 2180 2185 2190 Glu Glu Gly Phe Glu Pro Gly Pro Met Met Thr Cys Glu Asp Ile Asn 2195 2200 2205 Glu Cys Ala Gln Asn Pro Leu Leu Cys Ala Phe Arg Cys Val Asn Thr 2210 2215 2220 Tyr Gly Ser Tyr Glu Cys Lys Cys Pro Val Gly Tyr Val Leu Arg Glu 2225 2230 2235 2240 Asp Arg Arg Met Cys Lys Asp Glu Asp Glu Cys Glu Glu Gly Lys His 2245 2250 2255 Asp Cys Thr Glu Lys Gln Met Glu Cys Lys Asn Leu Ile Gly Thr Tyr 2260 2265 2270 Met Cys Ile Cys Gly Pro Gly Tyr Gln Arg Arg Pro Asp Gly Glu Gly 2275 2280 2285 Cys Val Asp Glu Asn Glu Cys Gln Thr Lys Pro Gly Ile Cys Glu Asn 2290 2295 2300 Gly Arg Cys Leu Asn Thr Arg Gly Ser Tyr Thr Cys Glu Cys Asn Asp 2305 2310 2315 2320 Gly Phe Thr Ala Ser Pro Asn Gln Asp Glu Cys Leu Asp Asn Arg Glu 2325 2330 2335 Gly Tyr Cys Phe Thr Glu Val Leu Gln Asn Met Cys Gln Ile Gly Ser 2340 2345 2350 Ser Asn Arg Asn Pro Val Thr Lys Ser Glu Cys Cys Cys Asp Gly Gly 2355 2360 2365 Arg Gly Trp Gly Pro His Cys Glu Ile Cys Pro Phe Gln Gly Thr Val 2370 2375 2380 Ala Phe Lys Lys Leu Cys Pro His Gly Arg Gly Phe Met Thr Asn Gly 2385 2390 2395 2400 Ala Asp Ile Asp Glu Cys Lys Val Ile His Asp Val Cys Arg Asn Gly 2405 2410 2415 Glu Cys Val Asn Asp Arg Gly Ser Tyr His Cys Ile Cys Lys Thr Gly 2420 2425 2430 Tyr Thr Pro Asp Ile Thr Gly Thr Ser Cys Val Asp Leu Asn Glu Cys 2435 2440 2445 Asn Gln Ala Pro Lys Pro Cys Asn Phe Ile Cys Lys Asn Thr Glu Gly 2450 2455 2460 Ser Tyr Gln Cys Ser Cys Pro Lys Gly Tyr Ile Leu Gln Glu Asp Gly 2465 2470 2475 2480 Arg Ser Cys Lys Asp Leu Asp Glu Cys Ala Thr Lys Gln His Asn Cys 2485 2490 2495 Gln Phe Leu Cys Val Asn Thr Ile Gly Gly Phe Thr Cys Lys Cys Pro 2500 2505 2510 Pro Gly Phe Thr Gln His His Thr Ser Cys Ile Asp Asn Asn Glu Cys 2515 2520 2525 Thr Ser Asp Ile Asn Leu Cys Gly Ser Lys Gly Ile Cys Gln Asn Thr 2530 2535 2540 Pro Gly Ser Phe Thr Cys Glu Cys Gln Arg Gly Phe Ser Leu Asp Gln 2545 2550 2555 2560 Thr Gly Ser Ser Cys Glu Asp Val Asp Glu Cys Glu Gly Asn His Arg 2565 2570 2575 Cys Gln His Gly Cys Gln Asn Ile Ile Gly Gly Tyr Arg Cys Ser Cys 2580 2585 2590 Pro Gln Gly Tyr Leu Gln His Tyr Gln Trp Asn Gln Cys Val Asp Glu 2595 2600 2605 Asn Glu Cys Leu Ser Ala His Ile Cys Gly Gly Ala Ser Cys His Asn 2610 2615 2620 Thr Leu Gly Ser Tyr Lys Cys Met Cys Pro Ala Gly Phe Gln Tyr Glu 2625 2630 2635 2640 Gln Phe Ser Gly Gly Cys Gln Asp Ile Asn Glu Cys Gly Ser Ala Gln 2645 2650 2655 Ala Pro Cys Ser Tyr Gly Cys Ser Asn Thr Glu Gly Gly Tyr Leu Cys 2660 2665 2670 Gly Cys Pro Pro Gly Tyr Phe Arg Ile Gly Gln Gly His Cys Val Ser 2675 2680 2685 Gly Met Gly Met Gly Arg Gly Asn Pro Glu Pro Pro Val Ser Gly Glu 2690 2695 2700 Met Asp Asp Asn Ser Leu Ser Pro Glu Ala Cys Tyr Glu Cys Lys Ile 2705 2710 2715 2720 Asn Gly Tyr Pro Lys Arg Gly Arg Lys Arg Arg Ser Thr Asn Glu Thr 2725 2730 2735 Asp Ala Ser Asn Ile Glu Asp Gln Ser Glu Thr Glu Ala Asn Val Ser 2740 2745 2750 Leu Ala Ser Trp Asp Val Glu Lys Thr Ala Ile Phe Ala Phe Asn Ile 2755 2760 2765 Ser His Val Ser Asn Lys Val Arg Ile Leu Glu Leu Leu Pro Ala Leu 2770 2775 2780 Thr Thr Leu Thr Asn His Asn Arg Tyr Leu Ile Glu Ser Gly Asn Glu 2785 2790 2795 2800 Asp Gly Phe Phe Lys Ile Asn Gln Lys Glu Gly Ile Ser Tyr Leu His 2805 2810 2815 Phe Thr Lys Lys Lys Pro Val Ala Gly Thr Tyr Ser Leu Gln Ile Ser 2820 2825 2830 Ser Thr Pro Leu Tyr Lys Lys Lys Glu Leu Asn Gln Leu Glu Asp Lys 2835 2840 2845 Tyr Asp Lys Asp Tyr Leu Ser Gly Glu Leu Gly Asp Asn Leu Lys Met 2850 2855 2860 Lys Ile Gln Val Leu Leu His 2865 2870 <210> 30 <211> 2873 <212> PRT <213> Mus musculus <400> 30 Met Arg Arg Gly Gly Leu Leu Glu Val Ala Leu Ala Phe Ala Leu Leu 1 5 10 15 Leu Glu Ser Tyr Thr Ser His Gly Ala Asp Ala Asn Leu Glu Ala Gly 20 25 30 Ser Leu Lys Glu Thr Arg Ala Asn Arg Ala Lys Arg Arg Gly Gly Gly 35 40 45 Gly His Asp Ala Leu Lys Gly Pro Asn Val Cys Gly Ser Arg Tyr Asn 50 55 60 Ala Tyr Cys Cys Pro Gly Trp Lys Thr Leu Pro Gly Gly Asn Gln Cys 65 70 75 80 Ile Val Pro Ile Cys Arg His Ser Cys Gly Asp Gly Phe Cys Ser Arg 85 90 95 Pro Asn Met Cys Thr Cys Pro Ser Gly Gln Ile Ser Pro Ser Cys Gly 100 105 110 Ser Arg Ser Ile Gln His Cys Ser Ile Arg Cys Met Asn Gly Gly Ser 115 120 125 Cys Ser Asp Asp His Cys Leu Cys Gln Lys Gly Tyr Ile Gly Thr His 130 135 140 Cys Gly Gln Pro Val Cys Glu Ser Gly Cys Leu Asn Gly Gly Arg Cys 145 150 155 160 Val Ala Pro Asn Arg Cys Ala Cys Thr Tyr Gly Phe Thr Gly Pro Gln 165 170 175 Cys Glu Arg Asp Tyr Arg Thr Gly Pro Cys Phe Thr Val Val Ser Asn 180 185 190 Gln Met Cys Gln Gly Gln Leu Ser Gly Ile Val Cys Thr Lys Thr Leu 195 200 205 Cys Cys Ala Thr Val Gly Arg Ala Trp Gly His Pro Cys Glu Met Cys 210 215 220 Pro Ala Gln Pro His Pro Cys Arg Arg Gly Phe Ile Pro Asn Ile Arg 225 230 235 240 Thr Gly Ala Cys Gln Asp Val Asp Glu Cys Gln Ala Ile Pro Gly Met 245 250 255 Cys Gln Gly Gly Asn Cys Ile Asn Thr Val Gly Ser Phe Glu Cys Lys 260 265 270 Cys Pro Ala Gly His Lys Phe Asn Glu Val Ser Gln Lys Cys Glu Asp 275 280 285 Ile Asp Glu Cys Ser Thr Ile Pro Gly Val Cys Asp Gly Gly Glu Cys 290 295 300 Thr Asn Thr Val Ser Ser Tyr Phe Cys Lys Cys Pro Pro Gly Phe Tyr 305 310 315 320 Thr Ser Pro Asp Gly Thr Arg Cys Val Asp Val Arg Pro Gly Tyr Cys 325 330 335 Tyr Thr Ala Leu Ala Asn Gly Arg Cys Ser Asn Gln Leu Pro Gln Ser 340 345 350 Ile Thr Lys Met Gln Cys Cys Cys Asp Leu Gly Arg Cys Trp Ser Pro 355 360 365 Gly Val Thr Val Ala Pro Glu Met Cys Pro Ile Arg Ser Thr Glu Asp 370 375 380 Phe Asn Lys Leu Cys Ser Val Pro Leu Val Ile Pro Gly Arg Pro Glu 385 390 395 400 Tyr Pro Pro Pro Pro Ile Gly Pro Leu Pro Pro Val Gln Pro Val Pro 405 410 415 Pro Gly Tyr Pro Pro Gly Pro Val Ile Pro Ala Pro Arg Pro Pro Pro 420 425 430 Glu Tyr Pro Tyr Pro Ser Pro Ser Arg Glu Pro Pro Arg Val Leu Pro 435 440 445 Phe Asn Val Thr Asp Tyr Cys Gln Leu Val Arg Tyr Leu Cys Gln Asn 450 455 460 Gly Arg Cys Ile Pro Thr Pro Gly Ser Tyr Arg Cys Glu Cys Asn Lys 465 470 475 480 Gly Phe Gln Leu Asp Ile Arg Gly Glu Cys Ile Asp Val Asp Glu Cys 485 490 495 Glu Lys Asn Pro Cys Thr Gly Gly Glu Cys Ile Asn Asn Gln Gly Ser 500 505 510 Tyr Thr Cys His Cys Arg Ala Gly Tyr Gln Ser Thr Leu Thr Arg Thr 515 520 525 Glu Cys Arg Asp Ile Asp Glu Cys Leu Gln Asn Gly Arg Ile Cys Asn 530 535 540 Asn Gly Arg Cys Ile Asn Thr Asp Gly Ser Phe His Cys Val Cys Asn 545 550 555 560 Ala Gly Phe His Val Thr Arg Asp Gly Lys Asn Cys Glu Asp Met Asp 565 570 575 Glu Cys Ser Ile Arg Asn Met Cys Leu Asn Gly Met Cys Ile Asn Glu 580 585 590 Asp Gly Ser Phe Lys Cys Ile Cys Lys Pro Gly Phe Gln Leu Ala Ser 595 600 605 Asp Gly Arg Tyr Cys Lys Asp Ile Asn Glu Cys Glu Thr Pro Gly Ile 610 615 620 Cys Met Asn Gly Arg Cys Val Asn Thr Asp Gly Ser Tyr Arg Cys Glu 625 630 635 640 Cys Phe Pro Gly Leu Ala Val Gly Leu Asp Gly Arg Val Cys Val Asp 645 650 655 Thr His Met Arg Ser Thr Cys Tyr Gly Gly Tyr Arg Arg Gly Gln Cys 660 665 670 Val Lys Pro Leu Phe Gly Ala Val Thr Lys Ser Glu Cys Cys Cys Ala 675 680 685 Ser Thr Glu Tyr Ala Phe Gly Glu Pro Cys Gln Pro Cys Pro Ala Gln 690 695 700 Asn Ser Ala Glu Tyr Gln Ala Leu Cys Ser Ser Gly Pro Gly Met Thr 705 710 715 720 Ser Ala Gly Thr Asp Ile Asn Glu Cys Ala Leu Asp Pro Asp Ile Cys 725 730 735 Pro Asn Gly Ile Cys Glu Asn Leu Arg Gly Thr Tyr Lys Cys Ile Cys 740 745 750 Asn Ser Gly Tyr Glu Val Asp Ile Thr Gly Lys Asn Cys Val Asp Ile 755 760 765 Asn Glu Cys Val Leu Asn Ser Leu Leu Cys Asp Asn Gly Gln Cys Arg 770 775 780 Asn Thr Pro Gly Ser Phe Val Cys Thr Cys Pro Lys Gly Phe Val Tyr 785 790 795 800 Lys Pro Asp Leu Lys Thr Cys Glu Asp Ile Asp Glu Cys Glu Ser Ser 805 810 815 Pro Cys Ile Asn Gly Val Cys Lys Asn Ser Pro Gly Ser Phe Ile Cys 820 825 830 Glu Cys Ser Pro Glu Ser Thr Leu Asp Pro Thr Lys Thr Ile Cys Ile 835 840 845 Glu Thr Ile Lys Gly Thr Cys Trp Gln Thr Val Ile Asp Gly Arg Cys 850 855 860 Glu Ile Asn Ile Asn Gly Ala Thr Leu Lys Ser Glu Cys Cys Ser Ser 865 870 875 880 Leu Gly Ala Ala Trp Gly Ser Pro Cys Thr Ile Cys Gln Leu Asp Pro 885 890 895 Ile Cys Gly Lys Gly Phe Ser Arg Ile Lys Gly Thr Gln Cys Glu Asp 900 905 910 Ile Asn Glu Cys Glu Val Phe Pro Gly Val Cys Lys Asn Gly Leu Cys 915 920 925 Val Asn Ser Arg Gly Ser Phe Lys Cys Glu Cys Pro Asn Gly Met Thr 930 935 940 Leu Asp Ala Thr Gly Arg Ile Cys Leu Asp Ile Arg Leu Glu Thr Cys 945 950 955 960 Phe Leu Lys Tyr Asp Asp Glu Glu Cys Thr Leu Pro Ile Ala Gly Arg 965 970 975 His Arg Met Asp Ala Cys Cys Cys Ser Val Gly Ala Ala Trp Gly Thr 980 985 990 Glu Glu Cys Glu Glu Cys Pro Leu Arg Asn Ser Arg Glu Tyr Glu Glu 995 1000 1005 Leu Cys Pro Arg Gly Pro Gly Phe Ala Thr Lys Asp Ile Thr Asn Gly 1010 1015 1020 Lys Pro Phe Phe Lys Asp Ile Asn Glu Cys Lys Met Ile Pro Ser Leu 1025 1030 1035 1040 Cys Thr His Gly Lys Cys Arg Asn Thr Ile Gly Ser Phe Lys Cys Arg 1045 1050 1055 Cys Asp Ser Gly Phe Ala Leu Asp Ser Glu Glu Arg Asn Cys Thr Asp 1060 1065 1070 Ile Asp Glu Cys Arg Ile Ser Pro Asp Leu Cys Gly Arg Gly Gln Cys 1075 1080 1085 Val Asn Thr Pro Gly Asp Phe Glu Cys Lys Cys Asp Glu Gly Tyr Glu 1090 1095 1100 Ser Gly Phe Met Met Met Lys Asn Cys Met Asp Ile Asp Glu Cys Gln 1105 1110 1115 1120 Arg Asp Pro Leu Leu Cys Arg Gly Gly Ile Cys His Asn Thr Glu Gly 1125 1130 1135 Ser Tyr Arg Cys Glu Cys Pro Pro Gly His Gln Leu Ser Pro Asn Ile 1140 1145 1150 Ser Ala Cys Ile Asp Ile Asn Glu Cys Glu Leu Ser Ala Asn Leu Cys 1155 1160 1165 Pro His Gly Arg Cys Val Asn Leu Ile Gly Lys Tyr Gln Cys Ala Cys 1170 1175 1180 Asn Pro Gly Tyr His Pro Thr His Asp Arg Leu Phe Cys Val Asp Ile 1185 1190 1195 1200 Asp Glu Cys Ser Ile Met Asn Gly Gly Cys Glu Thr Phe Cys Thr Asn 1205 1210 1215 Ser Asp Gly Ser Tyr Glu Cys Ser Cys Gln Pro Gly Phe Ala Leu Met 1220 1225 1230 Pro Asp Gln Arg Ser Cys Thr Asp Ile Asp Glu Cys Glu Asp Asn Pro 1235 1240 1245 Asn Ile Cys Asp Gly Gly Gln Cys Thr Asn Ile Pro Gly Glu Tyr Arg 1250 1255 1260 Cys Leu Cys Tyr Asp Gly Phe Met Ala Ser Glu Asp Met Lys Thr Cys 1265 1270 1275 1280 Val Asp Val Asn Glu Cys Asp Leu Asn Pro Asn Ile Cys Leu Ser Gly 1285 1290 1295 Thr Cys Glu Asn Thr Lys Gly Ser Phe Ile Cys His Cys Asp Met Gly 1300 1305 1310 Tyr Ser Gly Lys Lys Gly Lys Thr Gly Cys Thr Asp Ile Asn Glu Cys 1315 1320 1325 Glu Ile Gly Ala His Asn Cys Gly Arg His Ala Val Cys Thr Asn Thr 1330 1335 1340 Ala Gly Ser Phe Lys Cys Ser Cys Ser Pro Gly Trp Ile Gly Asp Gly 1345 1350 1355 1360 Ile Lys Cys Thr Asp Leu Asp Glu Cys Ser Asn Gly Thr His Met Cys 1365 1370 1375 Ser Gln His Ala Asp Cys Lys Asn Thr Met Gly Ser Tyr Arg Cys Leu 1380 1385 1390 Cys Lys Asp Gly Tyr Thr Gly Asp Gly Phe Thr Cys Thr Asp Leu Asp 1395 1400 1405 Glu Cys Ser Glu Asn Leu Asn Leu Cys Gly Asn Gly Gln Cys Leu Asn 1410 1415 1420 Ala Pro Gly Gly Tyr Arg Cys Glu Cys Asp Met Gly Phe Val Pro Ser 1425 1430 1435 1440 Ala Asp Gly Lys Ala Cys Glu Asp Ile Asp Glu Cys Ser Leu Pro Asn 1445 1450 1455 Ile Cys Val Phe Gly Thr Cys His Asn Leu Pro Gly Leu Phe Arg Cys 1460 1465 1470 Glu Cys Glu Ile Gly Tyr Glu Leu Asp Arg Ser Gly Gly Asn Cys Thr 1475 1480 1485 Asp Val Asn Glu Cys Leu Asp Pro Thr Thr Cys Ile Ser Gly Asn Cys 1490 1495 1500 Val Asn Thr Pro Gly Ser Tyr Thr Cys Asp Cys Pro Pro Asp Phe Glu 1505 1510 1515 1520 Leu Asn Pro Thr Arg Val Gly Cys Val Asp Thr Arg Ser Gly Asn Cys 1525 1530 1535 Tyr Leu Asp Ile Arg Pro Arg Gly Asp Asn Gly Asp Thr Ala Cys Ser 1540 1545 1550 Asn Glu Ile Gly Val Gly Val Ser Lys Ala Ser Cys Cys Cys Ser Leu 1555 1560 1565 Gly Lys Ala Trp Gly Thr Pro Cys Glu Leu Cys Pro Ser Val Asn Thr 1570 1575 1580 Ser Glu Tyr Lys Ile Leu Cys Pro Gly Gly Glu Gly Phe Arg Pro Asn 1585 1590 1595 1600 Pro Ile Thr Val Ile Leu Glu Asp Ile Asp Glu Cys Gln Glu Leu Pro 1605 1610 1615 Gly Leu Cys Gln Gly Gly Lys Cys Ile Asn Thr Phe Gly Ser Phe Gln 1620 1625 1630 Cys Arg Cys Pro Thr Gly Tyr Tyr Leu Asn Glu Asp Thr Arg Val Cys 1635 1640 1645 Asp Asp Val Asn Glu Cys Glu Thr Pro Gly Ile Cys Gly Pro Gly Thr 1650 1655 1660 Cys Tyr Asn Thr Val Gly Asn Tyr Thr Cys Ile Cys Pro Pro Asp Tyr 1665 1670 1675 1680 Met Gln Val Asn Gly Gly Asn Asn Cys Met Asp Met Arg Arg Ser Leu 1685 1690 1695 Cys Tyr Arg Asn Tyr Tyr Ala Asp Asn Gln Thr Cys Asp Gly Glu Leu 1700 1705 1710 Leu Phe Asn Met Thr Lys Lys Met Cys Cys Cys Ser Tyr Asn Ile Gly 1715 1720 1725 Arg Ala Trp Asn Lys Pro Cys Glu Gln Cys Pro Ile Pro Ser Thr Asp 1730 1735 1740 Glu Phe Ala Thr Leu Cys Gly Ser Gln Arg Pro Gly Phe Val Ile Asp 1745 1750 1755 1760 Ile Tyr Thr Gly Leu Pro Val Asp Ile Asp Glu Cys Arg Glu Ile Pro 1765 1770 1775 Gly Val Cys Glu Asn Gly Val Cys Ile Asn Met Val Gly Ser Phe Arg 1780 1785 1790 Cys Glu Cys Pro Val Gly Phe Phe Tyr Asn Asp Lys Leu Leu Val Cys 1795 1800 1805 Glu Asp Ile Asp Glu Cys Gln Asn Gly Pro Val Cys Gln Arg Asn Ala 1810 1815 1820 Glu Cys Ile Asn Thr Ala Gly Ser Tyr Arg Cys Asp Cys Lys Pro Gly 1825 1830 1835 1840 Tyr Arg Leu Thr Ser Thr Gly Gln Cys Asn Asp Arg Asn Glu Cys Gln 1845 1850 1855 Glu Ile Pro Asn Ile Cys Ser His Gly Gln Cys Ile Asp Thr Val Gly 1860 1865 1870 Ser Phe Tyr Cys Leu Cys His Thr Gly Phe Lys Thr Asn Val Asp Gln 1875 1880 1885 Thr Met Cys Leu Asp Ile Asn Glu Cys Glu Arg Asp Ala Cys Gly Asn 1890 1895 1900 Gly Thr Cys Arg Asn Thr Ile Gly Ser Phe Asn Cys Arg Cys Asn His 1905 1910 1915 1920 Gly Phe Ile Leu Ser His Asn Asn Asp Cys Ile Asp Val Asp Glu Cys 1925 1930 1935 Ala Thr Gly Asn Gly Asn Leu Cys Arg Asn Gly Gln Cys Val Asn Thr 1940 1945 1950 Val Gly Ser Phe Gln Cys Arg Cys Asn Glu Gly Tyr Glu Val Ala Pro 1955 1960 1965 Asp Gly Arg Thr Cys Val Asp Ile Asn Glu Cys Val Leu Asp Pro Gly 1970 1975 1980 Lys Cys Ala Pro Gly Thr Cys Gln Asn Leu Asp Gly Ser Tyr Arg Cys 1985 1990 1995 2000 Ile Cys Pro Pro Gly Tyr Ser Leu Gln Asn Asp Lys Cys Glu Asp Ile 2005 2010 2015 Asp Glu Cys Val Glu Glu Pro Glu Ile Cys Ala Leu Gly Thr Cys Ser 2020 2025 2030 Asn Thr Glu Gly Ser Phe Lys Cys Leu Cys Pro Glu Gly Phe Ser Leu 2035 2040 2045 Ser Ser Thr Gly Arg Arg Cys Gln Asp Leu Arg Met Ser Tyr Cys Tyr 2050 2055 2060 Ala Lys Phe Glu Gly Gly Lys Cys Ser Ser Pro Lys Ser Arg Asn His 2065 2070 2075 2080 Ser Lys Gln Glu Cys Cys Cys Ala Leu Lys Gly Glu Gly Trp Gly Asp 2085 2090 2095 Pro Cys Glu Leu Cys Pro Thr Glu Pro Asp Glu Ala Phe Arg Gln Ile 2100 2105 2110 Cys Pro Phe Gly Ser Gly Ile Ile Val Gly Pro Asp Asp Ser Ala Val 2115 2120 2125 Asp Met Asp Glu Cys Lys Glu Pro Asp Val Cys Arg His Gly Gln Cys 2130 2135 2140 Ile Asn Thr Asp Gly Ser Tyr Arg Cys Glu Cys Pro Phe Gly Tyr Ile 2145 2150 2155 2160 Leu Glu Gly Asn Glu Cys Val Asp Thr Asp Glu Cys Ser Val Gly Asn 2165 2170 2175 Pro Cys Gly Asn Gly Thr Cys Lys Asn Val Ile Gly Gly Phe Glu Cys 2180 2185 2190 Thr Cys Glu Glu Gly Phe Glu Pro Gly Pro Met Met Thr Cys Glu Asp 2195 2200 2205 Ile Asn Glu Cys Ala Gln Asn Pro Leu Leu Cys Ala Phe Arg Cys Val 2210 2215 2220 Asn Thr Tyr Gly Ser Tyr Glu Cys Lys Cys Pro Val Gly Tyr Val Leu 2225 2230 2235 2240 Arg Glu Asp Arg Arg Met Cys Lys Asp Glu Asp Glu Cys Ala Glu Gly 2245 2250 2255 Lys His Asp Cys Thr Glu Lys Gln Met Glu Cys Lys Asn Leu Ile Gly 2260 2265 2270 Thr Tyr Met Cys Ile Cys Gly Pro Gly Tyr Gln Arg Arg Pro Asp Gly 2275 2280 2285 Glu Gly Cys Ile Asp Glu Asn Glu Cys Gln Thr Lys Pro Gly Ile Cys 2290 2295 2300 Glu Asn Gly Arg Cys Leu Asn Thr Leu Gly Ser Tyr Thr Cys Glu Cys 2305 2310 2315 2320 Asn Asp Gly Phe Thr Ala Ser Pro Thr Gln Asp Glu Cys Leu Asp Asn 2325 2330 2335 Arg Glu Gly Tyr Cys Phe Ser Glu Val Leu Gln Asn Met Cys Gln Ile 2340 2345 2350 Gly Ser Ser Asn Arg Asn Pro Val Thr Lys Ser Glu Cys Cys Cys Asp 2355 2360 2365 Gly Gly Arg Gly Trp Gly Pro His Cys Glu Ile Cys Pro Phe Glu Gly 2370 2375 2380 Thr Val Ala Tyr Lys Lys Leu Cys Pro His Gly Arg Gly Phe Met Thr 2385 2390 2395 2400 Asn Gly Ala Asp Ile Asp Glu Cys Lys Val Ile His Asp Val Cys Arg 2405 2410 2415 Asn Gly Glu Cys Val Asn Asp Arg Gly Ser Tyr His Cys Ile Cys Lys 2420 2425 2430 Thr Gly Tyr Thr Pro Asp Ile Thr Gly Thr Ala Cys Val Asp Leu Asn 2435 2440 2445 Glu Cys Asn Gln Ala Pro Lys Pro Cys Asn Phe Ile Cys Lys Asn Thr 2450 2455 2460 Glu Gly Ser Tyr Gln Cys Ser Cys Pro Lys Gly Tyr Ile Leu Gln Glu 2465 2470 2475 2480 Asp Gly Arg Ser Cys Lys Asp Leu Asp Glu Cys Ala Thr Lys Gln His 2485 2490 2495 Asn Cys Gln Phe Leu Cys Val Asn Thr Ile Gly Gly Phe Thr Cys Lys 2500 2505 2510 Cys Pro Pro Gly Phe Thr Gln His His Thr Ala Cys Ile Asp Asn Asn 2515 2520 2525 Glu Cys Thr Ser Asp Ile Asn Leu Cys Gly Ser Lys Gly Val Cys Gln 2530 2535 2540 Asn Thr Pro Gly Ser Phe Thr Cys Glu Cys Gln Arg Gly Phe Ser Leu 2545 2550 2555 2560 Asp Gln Ser Gly Ala Ser Cys Glu Asp Val Asp Glu Cys Glu Gly Asn 2565 2570 2575 His Arg Cys Gln His Gly Cys Gln Asn Ile Ile Gly Gly Tyr Arg Cys 2580 2585 2590 Ser Cys Pro Gln Gly Tyr Leu Gln His Tyr Gln Trp Asn Gln Cys Val 2595 2600 2605 Asp Glu Asn Glu Cys Leu Ser Ala His Val Cys Gly Gly Ala Ser Cys 2610 2615 2620 His Asn Thr Leu Gly Ser Tyr Lys Cys Met Cys Pro Thr Gly Phe Gln 2625 2630 2635 2640 Tyr Glu Gln Phe Ser Gly Gly Cys Gln Asp Ile Asn Glu Cys Gly Ser 2645 2650 2655 Ser Gln Ala Pro Cys Ser Tyr Gly Cys Ser Asn Thr Glu Gly Gly Tyr 2660 2665 2670 Leu Cys Gly Cys Pro Pro Gly Tyr Phe Arg Ile Gly Gln Gly His Cys 2675 2680 2685 Val Ser Gly Met Gly Met Gly Arg Gly Gly Pro Glu Pro Pro Ala Ser 2690 2695 2700 Ser Glu Met Asp Asp Asn Ser Leu Ser Pro Glu Ala Cys Tyr Glu Cys 2705 2710 2715 2720 Lys Ile Asn Gly Tyr Pro Lys Arg Gly Arg Lys Arg Arg Ser Thr Asn 2725 2730 2735 Glu Thr Asp Ala Ser Asp Ile Gln Asp Gly Ser Glu Met Glu Ala Asn 2740 2745 2750 Val Ser Leu Ala Ser Trp Asp Val Glu Lys Pro Ala Ser Phe Ala Phe 2755 2760 2765 Asn Ile Ser His Val Asn Asn Lys Val Arg Ile Leu Glu Leu Leu Pro 2770 2775 2780 Ala Leu Thr Thr Leu Met Asn His Asn Arg Tyr Leu Ile Glu Ser Gly 2785 2790 2795 2800 Asn Glu Asp Gly Phe Phe Lys Ile Asn Gln Lys Glu Gly Val Ser Tyr 2805 2810 2815 Leu His Phe Thr Lys Lys Lys Pro Val Ala Gly Thr Tyr Ser Leu Gln 2820 2825 2830 Ile Ser Ser Thr Pro Leu Tyr Lys Lys Lys Glu Leu Asn Gln Leu Glu 2835 2840 2845 Asp Arg Tyr Asp Lys Asp Tyr Leu Ser Gly Glu Leu Gly Asp Asn Leu 2850 2855 2860 Lys Met Lys Ile Gln Ile Leu Leu His 2865 2870 <210> 31 <211> 2738 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 31 Met Arg Arg Gly Gly Leu Leu Glu Val Ala Leu Ala Phe Ala Leu Leu 1 5 10 15 Leu Glu Ser Tyr Thr Ser His Gly Ala Asp Ala Asn Leu Glu Ala Gly 20 25 30 Ser Leu Lys Glu Thr Arg Ala Asn Arg Ala Lys Arg Arg Gly Gly Gly 35 40 45 Gly His Asp Ala Leu Lys Gly Pro Asn Val Cys Gly Ser Arg Tyr Asn 50 55 60 Ala Tyr Cys Cys Pro Gly Trp Lys Thr Leu Pro Gly Gly Asn Gln Cys 65 70 75 80 Ile Val Pro Ile Cys Arg His Ser Cys Gly Asp Gly Phe Cys Ser Arg 85 90 95 Pro Asn Met Cys Thr Cys Pro Ser Gly Gln Ile Ser Pro Ser Cys Gly 100 105 110 Ser Arg Ser Ile Gln His Cys Ser Ile Arg Cys Met Asn Gly Gly Ser 115 120 125 Cys Ser Asp Asp His Cys Leu Cys Gln Lys Gly Tyr Ile Gly Thr His 130 135 140 Cys Gly Gln Pro Val Cys Glu Ser Gly Cys Leu Asn Gly Gly Arg Cys 145 150 155 160 Val Ala Pro Asn Arg Cys Ala Cys Thr Tyr Gly Phe Thr Gly Pro Gln 165 170 175 Cys Glu Arg Asp Tyr Arg Thr Gly Pro Cys Phe Thr Val Val Ser Asn 180 185 190 Gln Met Cys Gln Gly Gln Leu Ser Gly Ile Val Cys Thr Lys Thr Leu 195 200 205 Cys Cys Ala Thr Val Gly Arg Ala Trp Gly His Pro Cys Glu Met Cys 210 215 220 Pro Ala Gln Pro His Pro Cys Arg Arg Gly Phe Ile Pro Asn Ile Arg 225 230 235 240 Thr Gly Ala Cys Gln Asp Val Asp Glu Cys Gln Ala Ile Pro Gly Met 245 250 255 Cys Gln Gly Gly Asn Cys Ile Asn Thr Val Gly Ser Phe Glu Cys Lys 260 265 270 Cys Pro Ala Gly His Lys Phe Asn Glu Val Ser Gln Lys Cys Glu Asp 275 280 285 Ile Asp Glu Cys Ser Thr Ile Pro Gly Val Cys Asp Gly Gly Glu Cys 290 295 300 Thr Asn Thr Val Ser Ser Tyr Phe Cys Lys Cys Pro Pro Gly Phe Tyr 305 310 315 320 Thr Ser Pro Asp Gly Thr Arg Cys Val Asp Val Arg Pro Gly Tyr Cys 325 330 335 Tyr Thr Ala Leu Ala Asn Gly Arg Cys Ser Asn Gln Leu Pro Gln Ser 340 345 350 Ile Thr Lys Met Gln Cys Cys Cys Asp Leu Gly Arg Cys Trp Ser Pro 355 360 365 Gly Val Thr Val Ala Pro Glu Met Cys Pro Ile Arg Ser Thr Glu Asp 370 375 380 Phe Asn Lys Leu Cys Ser Val Pro Leu Val Ile Pro Gly Arg Pro Glu 385 390 395 400 Tyr Pro Pro Pro Pro Ile Gly Pro Leu Pro Pro Val Gln Pro Val Pro 405 410 415 Pro Gly Tyr Pro Pro Gly Pro Val Ile Pro Ala Pro Arg Pro Pro Pro 420 425 430 Glu Tyr Pro Tyr Pro Ser Pro Ser Arg Glu Pro Pro Arg Val Leu Pro 435 440 445 Phe Asn Val Thr Asp Tyr Cys Gln Leu Val Arg Tyr Leu Cys Gln Asn 450 455 460 Gly Arg Cys Ile Pro Thr Pro Gly Ser Tyr Arg Cys Glu Cys Asn Lys 465 470 475 480 Gly Phe Gln Leu Asp Ile Arg Gly Glu Cys Ile Asp Val Asp Glu Cys 485 490 495 Glu Lys Asn Pro Cys Thr Gly Gly Glu Cys Ile Asn Asn Gln Gly Ser 500 505 510 Tyr Thr Cys His Cys Arg Ala Gly Tyr Gln Ser Thr Leu Thr Arg Thr 515 520 525 Glu Cys Arg Asp Ile Asp Glu Cys Leu Gln Asn Gly Arg Ile Cys Asn 530 535 540 Asn Gly Arg Cys Ile Asn Thr Asp Gly Ser Phe His Cys Val Cys Asn 545 550 555 560 Ala Gly Phe His Val Thr Arg Asp Gly Lys Asn Cys Glu Asp Met Asp 565 570 575 Glu Cys Ser Ile Arg Asn Met Cys Leu Asn Gly Met Cys Ile Asn Glu 580 585 590 Asp Gly Ser Phe Lys Cys Ile Cys Lys Pro Gly Phe Gln Leu Ala Ser 595 600 605 Asp Gly Arg Tyr Cys Lys Asp Ile Asn Glu Cys Glu Thr Pro Gly Ile 610 615 620 Cys Met Asn Gly Arg Cys Val Asn Thr Asp Gly Ser Tyr Arg Cys Glu 625 630 635 640 Cys Phe Pro Gly Leu Ala Val Gly Leu Asp Gly Arg Val Cys Val Asp 645 650 655 Thr His Met Arg Ser Thr Cys Tyr Gly Gly Tyr Arg Arg Gly Gln Cys 660 665 670 Val Lys Pro Leu Phe Gly Ala Val Thr Lys Ser Glu Cys Cys Cys Ala 675 680 685 Ser Thr Glu Tyr Ala Phe Gly Glu Pro Cys Gln Pro Cys Pro Ala Gln 690 695 700 Asn Ser Ala Glu Tyr Gln Ala Leu Cys Ser Ser Gly Pro Gly Met Thr 705 710 715 720 Ser Ala Gly Thr Asp Ile Asn Glu Cys Ala Leu Asp Pro Asp Ile Cys 725 730 735 Pro Asn Gly Ile Cys Glu Asn Leu Arg Gly Thr Tyr Lys Cys Ile Cys 740 745 750 Asn Ser Gly Tyr Glu Val Asp Ile Thr Gly Lys Asn Cys Val Asp Ile 755 760 765 Asn Glu Cys Val Leu Asn Ser Leu Leu Cys Asp Asn Gly Gln Cys Arg 770 775 780 Asn Thr Pro Gly Ser Phe Val Cys Thr Cys Pro Lys Gly Phe Val Tyr 785 790 795 800 Lys Pro Asp Leu Lys Thr Cys Glu Asp Ile Asp Glu Cys Glu Ser Ser 805 810 815 Pro Cys Ile Asn Gly Val Cys Lys Asn Ser Pro Gly Ser Phe Ile Cys 820 825 830 Glu Cys Ser Pro Glu Ser Thr Leu Asp Pro Thr Lys Thr Ile Cys Ile 835 840 845 Glu Thr Ile Lys Gly Thr Cys Trp Gln Thr Val Ile Asp Gly Arg Cys 850 855 860 Glu Ile Asn Ile Asn Gly Ala Thr Leu Lys Ser Glu Cys Cys Ser Ser 865 870 875 880 Leu Gly Ala Ala Trp Gly Ser Pro Cys Thr Ile Cys Gln Leu Asp Pro 885 890 895 Ile Cys Gly Lys Gly Phe Ser Arg Ile Lys Gly Thr Gln Cys Glu Asp 900 905 910 Ile Asn Glu Cys Glu Val Phe Pro Gly Val Cys Lys Asn Gly Leu Cys 915 920 925 Val Asn Ser Arg Gly Ser Phe Lys Cys Glu Cys Pro Asn Gly Met Thr 930 935 940 Leu Asp Ala Thr Gly Arg Ile Cys Leu Asp Ile Arg Leu Glu Thr Cys 945 950 955 960 Phe Leu Lys Tyr Asp Asp Glu Glu Cys Thr Leu Pro Ile Ala Gly Arg 965 970 975 His Arg Met Asp Ala Cys Cys Cys Ser Val Gly Ala Ala Trp Gly Thr 980 985 990 Glu Glu Cys Glu Glu Cys Pro Leu Arg Asn Ser Arg Glu Tyr Glu Glu 995 1000 1005 Leu Cys Pro Arg Gly Pro Gly Phe Ala Thr Lys Asp Ile Thr Asn Gly 1010 1015 1020 Lys Pro Phe Phe Lys Asp Ile Asn Glu Cys Lys Met Ile Pro Ser Leu 1025 1030 1035 1040 Cys Thr His Gly Lys Cys Arg Asn Thr Ile Gly Ser Phe Lys Cys Arg 1045 1050 1055 Cys Asp Ser Gly Phe Ala Leu Asp Ser Glu Glu Arg Asn Cys Thr Asp 1060 1065 1070 Ile Asp Glu Cys Arg Ile Ser Pro Asp Leu Cys Gly Arg Gly Gln Cys 1075 1080 1085 Val Asn Thr Pro Gly Asp Phe Glu Cys Lys Cys Asp Glu Gly Tyr Glu 1090 1095 1100 Ser Gly Phe Met Met Met Lys Asn Cys Met Asp Ile Asp Glu Cys Gln 1105 1110 1115 1120 Arg Asp Pro Leu Leu Cys Arg Gly Gly Ile Cys His Asn Thr Glu Gly 1125 1130 1135 Ser Tyr Arg Cys Glu Cys Pro Pro Gly His Gln Leu Ser Pro Asn Ile 1140 1145 1150 Ser Ala Cys Ile Asp Ile Asn Glu Cys Glu Leu Ser Ala Asn Leu Cys 1155 1160 1165 Pro His Gly Arg Cys Val Asn Leu Ile Gly Lys Tyr Gln Cys Ala Cys 1170 1175 1180 Asn Pro Gly Tyr His Pro Thr His Asp Arg Leu Phe Cys Val Asp Ile 1185 1190 1195 1200 Asp Glu Cys Ser Ile Met Asn Gly Gly Cys Glu Thr Phe Cys Thr Asn 1205 1210 1215 Ser Asp Gly Ser Tyr Glu Cys Ser Cys Gln Pro Gly Phe Ala Leu Met 1220 1225 1230 Pro Asp Gln Arg Ser Cys Thr Asp Ile Asp Glu Cys Glu Asp Asn Pro 1235 1240 1245 Asn Ile Cys Asp Gly Gly Gln Cys Thr Asn Ile Pro Gly Glu Tyr Arg 1250 1255 1260 Cys Leu Cys Tyr Asp Gly Phe Met Ala Ser Glu Asp Met Lys Thr Cys 1265 1270 1275 1280 Val Asp Val Asn Glu Cys Asp Leu Asn Pro Asn Ile Cys Leu Ser Gly 1285 1290 1295 Thr Cys Glu Asn Thr Lys Gly Ser Phe Ile Cys His Cys Asp Met Gly 1300 1305 1310 Tyr Ser Gly Lys Lys Gly Lys Thr Gly Cys Thr Asp Ile Asn Glu Cys 1315 1320 1325 Glu Ile Gly Ala His Asn Cys Gly Arg His Ala Val Cys Thr Asn Thr 1330 1335 1340 Ala Gly Ser Phe Lys Cys Ser Cys Ser Pro Gly Trp Ile Gly Asp Gly 1345 1350 1355 1360 Ile Lys Cys Thr Asp Leu Asp Glu Cys Ser Asn Gly Thr His Met Cys 1365 1370 1375 Ser Gln His Ala Asp Cys Lys Asn Thr Met Gly Ser Tyr Arg Cys Leu 1380 1385 1390 Cys Lys Asp Gly Tyr Thr Gly Asp Gly Phe Thr Cys Thr Asp Leu Asp 1395 1400 1405 Glu Cys Ser Glu Asn Leu Asn Leu Cys Gly Asn Gly Gln Cys Leu Asn 1410 1415 1420 Ala Pro Gly Gly Tyr Arg Cys Glu Cys Asp Met Gly Phe Val Pro Ser 1425 1430 1435 1440 Ala Asp Gly Lys Ala Cys Glu Asp Ile Asp Glu Cys Ser Leu Pro Asn 1445 1450 1455 Ile Cys Val Phe Gly Thr Cys His Asn Leu Pro Gly Leu Phe Arg Cys 1460 1465 1470 Glu Cys Glu Ile Gly Tyr Glu Leu Asp Arg Ser Gly Gly Asn Cys Thr 1475 1480 1485 Asp Val Asn Glu Cys Leu Asp Pro Thr Thr Cys Ile Ser Gly Asn Cys 1490 1495 1500 Val Asn Thr Pro Gly Ser Tyr Thr Cys Asp Cys Pro Pro Asp Phe Glu 1505 1510 1515 1520 Leu Asn Pro Thr Arg Val Gly Cys Val Asp Thr Arg Ser Gly Asn Cys 1525 1530 1535 Tyr Leu Asp Ile Arg Pro Arg Gly Asp Asn Gly Asp Thr Ala Cys Ser 1540 1545 1550 Asn Glu Ile Gly Val Gly Val Ser Lys Ala Ser Cys Cys Cys Ser Leu 1555 1560 1565 Gly Lys Ala Trp Gly Thr Pro Cys Glu Leu Cys Pro Ser Val Asn Thr 1570 1575 1580 Ser Glu Tyr Lys Ile Leu Cys Pro Gly Gly Glu Gly Phe Arg Pro Asn 1585 1590 1595 1600 Pro Ile Thr Val Ile Leu Glu Asp Ile Asp Glu Cys Gln Glu Leu Pro 1605 1610 1615 Gly Leu Cys Gln Gly Gly Lys Cys Ile Asn Thr Phe Gly Ser Phe Gln 1620 1625 1630 Cys Arg Cys Pro Thr Gly Tyr Tyr Leu Asn Glu Asp Thr Arg Val Cys 1635 1640 1645 Asp Asp Val Asn Glu Cys Glu Thr Pro Gly Ile Cys Gly Pro Gly Thr 1650 1655 1660 Cys Tyr Asn Thr Val Gly Asn Tyr Thr Cys Ile Cys Pro Pro Asp Tyr 1665 1670 1675 1680 Met Gln Val Asn Gly Gly Asn Asn Cys Met Asp Met Arg Arg Ser Leu 1685 1690 1695 Cys Tyr Arg Asn Tyr Tyr Ala Asp Asn Gln Thr Cys Asp Gly Glu Leu 1700 1705 1710 Leu Phe Asn Met Thr Lys Lys Met Cys Cys Cys Ser Tyr Asn Ile Gly 1715 1720 1725 Arg Ala Trp Asn Lys Pro Cys Glu Gln Cys Pro Ile Pro Ser Thr Asp 1730 1735 1740 Glu Phe Ala Thr Leu Cys Gly Ser Gln Arg Pro Gly Phe Val Ile Asp 1745 1750 1755 1760 Ile Tyr Thr Gly Leu Pro Val Asp Ile Asp Glu Cys Arg Glu Ile Pro 1765 1770 1775 Gly Val Cys Glu Asn Gly Val Cys Ile Asn Met Val Gly Ser Phe Arg 1780 1785 1790 Cys Glu Cys Pro Val Gly Phe Phe Tyr Asn Asp Lys Leu Leu Val Cys 1795 1800 1805 Glu Asp Ile Asp Glu Cys Gln Asn Gly Pro Val Cys Gln Arg Asn Ala 1810 1815 1820 Glu Cys Ile Asn Thr Ala Gly Ser Tyr Arg Cys Asp Cys Lys Pro Gly 1825 1830 1835 1840 Tyr Arg Leu Thr Ser Thr Gly Gln Cys Asn Asp Arg Asn Glu Cys Gln 1845 1850 1855 Glu Ile Pro Asn Ile Cys Ser His Gly Gln Cys Ile Asp Thr Val Gly 1860 1865 1870 Ser Phe Tyr Cys Leu Cys His Thr Gly Phe Lys Thr Asn Val Asp Gln 1875 1880 1885 Thr Met Cys Leu Asp Ile Asn Glu Cys Glu Arg Asp Ala Cys Gly Asn 1890 1895 1900 Gly Thr Cys Arg Asn Thr Ile Gly Ser Phe Asn Cys Arg Cys Asn His 1905 1910 1915 1920 Gly Phe Ile Leu Ser His Asn Asn Asp Cys Ile Asp Val Asp Glu Cys 1925 1930 1935 Ala Thr Gly Asn Gly Asn Leu Cys Arg Asn Gly Gln Cys Val Asn Thr 1940 1945 1950 Val Gly Ser Phe Gln Cys Arg Cys Asn Glu Gly Tyr Glu Val Ala Pro 1955 1960 1965 Asp Gly Arg Thr Cys Val Asp Ile Asn Glu Cys Val Leu Asp Pro Gly 1970 1975 1980 Lys Cys Ala Pro Gly Thr Cys Gln Asn Leu Asp Gly Ser Tyr Arg Cys 1985 1990 1995 2000 Ile Cys Pro Pro Gly Tyr Ser Leu Gln Asn Asp Lys Cys Glu Asp Ile 2005 2010 2015 Asp Glu Cys Val Glu Glu Pro Glu Ile Cys Ala Leu Gly Thr Cys Ser 2020 2025 2030 Asn Thr Glu Gly Ser Phe Lys Cys Leu Cys Pro Glu Gly Phe Ser Leu 2035 2040 2045 Ser Ser Thr Gly Arg Arg Cys Gln Asp Leu Arg Met Ser Tyr Cys Tyr 2050 2055 2060 Ala Lys Phe Glu Gly Gly Lys Cys Ser Ser Pro Lys Ser Arg Asn His 2065 2070 2075 2080 Ser Lys Gln Glu Cys Cys Cys Ala Leu Lys Gly Glu Gly Trp Gly Asp 2085 2090 2095 Pro Cys Glu Leu Cys Pro Thr Glu Pro Asp Glu Ala Phe Arg Gln Ile 2100 2105 2110 Cys Pro Phe Gly Ser Gly Ile Ile Val Gly Pro Asp Asp Ser Ala Val 2115 2120 2125 Asp Met Asp Glu Cys Lys Glu Pro Asp Val Cys Arg His Gly Gln Cys 2130 2135 2140 Ile Asn Thr Asp Gly Ser Tyr Arg Cys Glu Cys Pro Phe Gly Tyr Ile 2145 2150 2155 2160 Leu Glu Gly Asn Glu Cys Val Asp Thr Asp Glu Cys Ser Val Gly Asn 2165 2170 2175 Pro Cys Gly Asn Gly Thr Cys Lys Asn Val Ile Gly Gly Phe Glu Cys 2180 2185 2190 Thr Cys Glu Glu Gly Phe Glu Pro Gly Pro Met Met Thr Cys Glu Asp 2195 2200 2205 Ile Asn Glu Cys Ala Gln Asn Pro Leu Leu Cys Ala Phe Arg Cys Val 2210 2215 2220 Asn Thr Tyr Gly Ser Tyr Glu Cys Lys Cys Pro Val Gly Tyr Val Leu 2225 2230 2235 2240 Arg Glu Asp Arg Arg Met Cys Lys Asp Glu Asp Glu Cys Ala Glu Gly 2245 2250 2255 Lys His Asp Cys Thr Glu Lys Gln Met Glu Cys Lys Asn Leu Ile Gly 2260 2265 2270 Thr Tyr Met Cys Ile Cys Gly Pro Gly Tyr Gln Arg Arg Pro Asp Gly 2275 2280 2285 Glu Gly Cys Ile Asp Glu Asn Glu Cys Gln Thr Lys Pro Gly Ile Cys 2290 2295 2300 Glu Asn Gly Arg Cys Leu Asn Thr Leu Gly Ser Tyr Thr Cys Glu Cys 2305 2310 2315 2320 Asn Asp Gly Phe Thr Ala Ser Pro Thr Gln Asp Glu Cys Leu Asp Asn 2325 2330 2335 Arg Glu Gly Tyr Cys Phe Ser Glu Val Leu Gln Asn Met Cys Gln Ile 2340 2345 2350 Gly Ser Ser Asn Arg Asn Pro Val Thr Lys Ser Glu Cys Cys Cys Asp 2355 2360 2365 Gly Gly Arg Gly Trp Gly Pro His Cys Glu Ile Cys Pro Phe Glu Gly 2370 2375 2380 Thr Val Ala Tyr Lys Lys Leu Cys Pro His Gly Arg Gly Phe Met Thr 2385 2390 2395 2400 Asn Gly Ala Asp Ile Asp Glu Cys Lys Val Ile His Asp Val Cys Arg 2405 2410 2415 Asn Gly Glu Cys Val Asn Asp Arg Gly Ser Tyr His Cys Ile Cys Lys 2420 2425 2430 Thr Gly Tyr Thr Pro Asp Ile Thr Gly Thr Ala Cys Val Asp Leu Asn 2435 2440 2445 Glu Cys Asn Gln Ala Pro Lys Pro Cys Asn Phe Ile Cys Lys Asn Thr 2450 2455 2460 Glu Gly Ser Tyr Gln Cys Ser Cys Pro Lys Gly Tyr Ile Leu Gln Glu 2465 2470 2475 2480 Asp Gly Arg Ser Cys Lys Asp Leu Asp Glu Cys Ala Thr Lys Gln His 2485 2490 2495 Asn Cys Gln Phe Leu Cys Val Asn Thr Ile Gly Gly Phe Thr Cys Lys 2500 2505 2510 Cys Pro Pro Gly Phe Thr Gln His His Thr Ala Cys Ile Asp Asn Asn 2515 2520 2525 Glu Cys Thr Ser Asp Ile Asn Leu Cys Gly Ser Lys Gly Val Cys Gln 2530 2535 2540 Asn Thr Pro Gly Ser Phe Thr Cys Glu Cys Gln Arg Gly Phe Ser Leu 2545 2550 2555 2560 Asp Gln Ser Gly Ala Ser Cys Glu Asp Val Asp Glu Cys Glu Gly Asn 2565 2570 2575 His Arg Cys Gln His Gly Cys Gln Asn Ile Ile Gly Gly Tyr Arg Cys 2580 2585 2590 Ser Cys Pro Gln Gly Tyr Leu Gln His Tyr Gln Trp Asn Gln Cys Val 2595 2600 2605 Asp Glu Asn Glu Cys Leu Ser Ala His Val Cys Gly Gly Ala Ser Cys 2610 2615 2620 His Asn Thr Leu Gly Ser Tyr Lys Cys Met Cys Pro Thr Gly Phe Gln 2625 2630 2635 2640 Tyr Glu Gln Phe Ser Gly Gly Cys Gln Asp Ile Asn Glu Cys Gly Ser 2645 2650 2655 Ser Gln Ala Pro Cys Ser Tyr Gly Cys Ser Asn Thr Glu Gly Gly Tyr 2660 2665 2670 Leu Cys Gly Cys Pro Pro Gly Tyr Phe Arg Ile Gly Gln Gly His Cys 2675 2680 2685 Val Ser Gly Met Gly Met Gly Arg Gly Gly Pro Glu Pro Pro Ala Ser 2690 2695 2700 Ser Glu Met Asp Asp Asn Ser Leu Ser Pro Glu Ala Cys Tyr Glu Cys 2705 2710 2715 2720 Lys Ile Asn Gly Tyr Pro Lys Arg Gly Arg Lys Arg Arg Ser Thr Asn 2725 2730 2735 Glu Asn <210> 32 <211> 2755 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 32 Met Arg Arg Gly Gly Leu Leu Glu Val Ala Leu Ala Phe Ala Leu Leu 1 5 10 15 Leu Glu Ser Tyr Thr Ser His Gly Ala Asp Ala Asn Leu Glu Ala Gly 20 25 30 Ser Leu Lys Glu Thr Arg Ala Asn Arg Ala Lys Arg Arg Gly Gly Gly 35 40 45 Gly His Asp Ala Leu Lys Gly Pro Asn Val Cys Gly Ser Arg Tyr Asn 50 55 60 Ala Tyr Cys Cys Pro Gly Trp Lys Thr Leu Pro Gly Gly Asn Gln Cys 65 70 75 80 Ile Val Pro Ile Cys Arg His Ser Cys Gly Asp Gly Phe Cys Ser Arg 85 90 95 Pro Asn Met Cys Thr Cys Pro Ser Gly Gln Ile Ser Pro Ser Cys Gly 100 105 110 Ser Arg Ser Ile Gln His Cys Ser Ile Arg Cys Met Asn Gly Gly Ser 115 120 125 Cys Ser Asp Asp His Cys Leu Cys Gln Lys Gly Tyr Ile Gly Thr His 130 135 140 Cys Gly Gln Pro Val Cys Glu Ser Gly Cys Leu Asn Gly Gly Arg Cys 145 150 155 160 Val Ala Pro Asn Arg Cys Ala Cys Thr Tyr Gly Phe Thr Gly Pro Gln 165 170 175 Cys Glu Arg Asp Tyr Arg Thr Gly Pro Cys Phe Thr Val Val Ser Asn 180 185 190 Gln Met Cys Gln Gly Gln Leu Ser Gly Ile Val Cys Thr Lys Thr Leu 195 200 205 Cys Cys Ala Thr Val Gly Arg Ala Trp Gly His Pro Cys Glu Met Cys 210 215 220 Pro Ala Gln Pro His Pro Cys Arg Arg Gly Phe Ile Pro Asn Ile Arg 225 230 235 240 Thr Gly Ala Cys Gln Asp Val Asp Glu Cys Gln Ala Ile Pro Gly Met 245 250 255 Cys Gln Gly Gly Asn Cys Ile Asn Thr Val Gly Ser Phe Glu Cys Lys 260 265 270 Cys Pro Ala Gly His Lys Phe Asn Glu Val Ser Gln Lys Cys Glu Asp 275 280 285 Ile Asp Glu Cys Ser Thr Ile Pro Gly Val Cys Asp Gly Gly Glu Cys 290 295 300 Thr Asn Thr Val Ser Ser Tyr Phe Cys Lys Cys Pro Pro Gly Phe Tyr 305 310 315 320 Thr Ser Pro Asp Gly Thr Arg Cys Val Asp Val Arg Pro Gly Tyr Cys 325 330 335 Tyr Thr Ala Leu Ala Asn Gly Arg Cys Ser Asn Gln Leu Pro Gln Ser 340 345 350 Ile Thr Lys Met Gln Cys Cys Cys Asp Leu Gly Arg Cys Trp Ser Pro 355 360 365 Gly Val Thr Val Ala Pro Glu Met Cys Pro Ile Arg Ser Thr Glu Asp 370 375 380 Phe Asn Lys Leu Cys Ser Val Pro Leu Val Ile Pro Gly Arg Pro Glu 385 390 395 400 Tyr Pro Pro Pro Pro Ile Gly Pro Leu Pro Pro Val Gln Pro Val Pro 405 410 415 Pro Gly Tyr Pro Pro Gly Pro Val Ile Pro Ala Pro Arg Pro Pro Pro 420 425 430 Glu Tyr Pro Tyr Pro Ser Pro Ser Arg Glu Pro Pro Arg Val Leu Pro 435 440 445 Phe Asn Val Thr Asp Tyr Cys Gln Leu Val Arg Tyr Leu Cys Gln Asn 450 455 460 Gly Arg Cys Ile Pro Thr Pro Gly Ser Tyr Arg Cys Glu Cys Asn Lys 465 470 475 480 Gly Phe Gln Leu Asp Ile Arg Gly Glu Cys Ile Asp Val Asp Glu Cys 485 490 495 Glu Lys Asn Pro Cys Thr Gly Gly Glu Cys Ile Asn Asn Gln Gly Ser 500 505 510 Tyr Thr Cys His Cys Arg Ala Gly Tyr Gln Ser Thr Leu Thr Arg Thr 515 520 525 Glu Cys Arg Asp Ile Asp Glu Cys Leu Gln Asn Gly Arg Ile Cys Asn 530 535 540 Asn Gly Arg Cys Ile Asn Thr Asp Gly Ser Phe His Cys Val Cys Asn 545 550 555 560 Ala Gly Phe His Val Thr Arg Asp Gly Lys Asn Cys Glu Asp Met Asp 565 570 575 Glu Cys Ser Ile Arg Asn Met Cys Leu Asn Gly Met Cys Ile Asn Glu 580 585 590 Asp Gly Ser Phe Lys Cys Ile Cys Lys Pro Gly Phe Gln Leu Ala Ser 595 600 605 Asp Gly Arg Tyr Cys Lys Asp Ile Asn Glu Cys Glu Thr Pro Gly Ile 610 615 620 Cys Met Asn Gly Arg Cys Val Asn Thr Asp Gly Ser Tyr Arg Cys Glu 625 630 635 640 Cys Phe Pro Gly Leu Ala Val Gly Leu Asp Gly Arg Val Cys Val Asp 645 650 655 Thr His Met Arg Ser Thr Cys Tyr Gly Gly Tyr Arg Arg Gly Gln Cys 660 665 670 Val Lys Pro Leu Phe Gly Ala Val Thr Lys Ser Glu Cys Cys Cys Ala 675 680 685 Ser Thr Glu Tyr Ala Phe Gly Glu Pro Cys Gln Pro Cys Pro Ala Gln 690 695 700 Asn Ser Ala Glu Tyr Gln Ala Leu Cys Ser Ser Gly Pro Gly Met Thr 705 710 715 720 Ser Ala Gly Thr Asp Ile Asn Glu Cys Ala Leu Asp Pro Asp Ile Cys 725 730 735 Pro Asn Gly Ile Cys Glu Asn Leu Arg Gly Thr Tyr Lys Cys Ile Cys 740 745 750 Asn Ser Gly Tyr Glu Val Asp Ile Thr Gly Lys Asn Cys Val Asp Ile 755 760 765 Asn Glu Cys Val Leu Asn Ser Leu Leu Cys Asp Asn Gly Gln Cys Arg 770 775 780 Asn Thr Pro Gly Ser Phe Val Cys Thr Cys Pro Lys Gly Phe Val Tyr 785 790 795 800 Lys Pro Asp Leu Lys Thr Cys Glu Asp Ile Asp Glu Cys Glu Ser Ser 805 810 815 Pro Cys Ile Asn Gly Val Cys Lys Asn Ser Pro Gly Ser Phe Ile Cys 820 825 830 Glu Cys Ser Pro Glu Ser Thr Leu Asp Pro Thr Lys Thr Ile Cys Ile 835 840 845 Glu Thr Ile Lys Gly Thr Cys Trp Gln Thr Val Ile Asp Gly Arg Cys 850 855 860 Glu Ile Asn Ile Asn Gly Ala Thr Leu Lys Ser Glu Cys Cys Ser Ser 865 870 875 880 Leu Gly Ala Ala Trp Gly Ser Pro Cys Thr Ile Cys Gln Leu Asp Pro 885 890 895 Ile Cys Gly Lys Gly Phe Ser Arg Ile Lys Gly Thr Gln Cys Glu Asp 900 905 910 Ile Asn Glu Cys Glu Val Phe Pro Gly Val Cys Lys Asn Gly Leu Cys 915 920 925 Val Asn Ser Arg Gly Ser Phe Lys Cys Glu Cys Pro Asn Gly Met Thr 930 935 940 Leu Asp Ala Thr Gly Arg Ile Cys Leu Asp Ile Arg Leu Glu Thr Cys 945 950 955 960 Phe Leu Lys Tyr Asp Asp Glu Glu Cys Thr Leu Pro Ile Ala Gly Arg 965 970 975 His Arg Met Asp Ala Cys Cys Cys Ser Val Gly Ala Ala Trp Gly Thr 980 985 990 Glu Glu Cys Glu Glu Cys Pro Leu Arg Asn Ser Arg Glu Tyr Glu Glu 995 1000 1005 Leu Cys Pro Arg Gly Pro Gly Phe Ala Thr Lys Asp Ile Thr Asn Gly 1010 1015 1020 Lys Pro Phe Phe Lys Asp Ile Asn Glu Cys Lys Met Ile Pro Ser Leu 1025 1030 1035 1040 Cys Thr His Gly Lys Cys Arg Asn Thr Ile Gly Ser Phe Lys Cys Arg 1045 1050 1055 Cys Asp Ser Gly Phe Ala Leu Asp Ser Glu Glu Arg Asn Cys Thr Asp 1060 1065 1070 Ile Asp Glu Cys Arg Ile Ser Pro Asp Leu Cys Gly Arg Gly Gln Cys 1075 1080 1085 Val Asn Thr Pro Gly Asp Phe Glu Cys Lys Cys Asp Glu Gly Tyr Glu 1090 1095 1100 Ser Gly Phe Met Met Met Lys Asn Cys Met Asp Ile Asp Glu Cys Gln 1105 1110 1115 1120 Arg Asp Pro Leu Leu Cys Arg Gly Gly Ile Cys His Asn Thr Glu Gly 1125 1130 1135 Ser Tyr Arg Cys Glu Cys Pro Pro Gly His Gln Leu Ser Pro Asn Ile 1140 1145 1150 Ser Ala Cys Ile Asp Ile Asn Glu Cys Glu Leu Ser Ala Asn Leu Cys 1155 1160 1165 Pro His Gly Arg Cys Val Asn Leu Ile Gly Lys Tyr Gln Cys Ala Cys 1170 1175 1180 Asn Pro Gly Tyr His Pro Thr His Asp Arg Leu Phe Cys Val Asp Ile 1185 1190 1195 1200 Asp Glu Cys Ser Ile Met Asn Gly Gly Cys Glu Thr Phe Cys Thr Asn 1205 1210 1215 Ser Asp Gly Ser Tyr Glu Cys Ser Cys Gln Pro Gly Phe Ala Leu Met 1220 1225 1230 Pro Asp Gln Arg Ser Cys Thr Asp Ile Asp Glu Cys Glu Asp Asn Pro 1235 1240 1245 Asn Ile Cys Asp Gly Gly Gln Cys Thr Asn Ile Pro Gly Glu Tyr Arg 1250 1255 1260 Cys Leu Cys Tyr Asp Gly Phe Met Ala Ser Glu Asp Met Lys Thr Cys 1265 1270 1275 1280 Val Asp Val Asn Glu Cys Asp Leu Asn Pro Asn Ile Cys Leu Ser Gly 1285 1290 1295 Thr Cys Glu Asn Thr Lys Gly Ser Phe Ile Cys His Cys Asp Met Gly 1300 1305 1310 Tyr Ser Gly Lys Lys Gly Lys Thr Gly Cys Thr Asp Ile Asn Glu Cys 1315 1320 1325 Glu Ile Gly Ala His Asn Cys Gly Arg His Ala Val Cys Thr Asn Thr 1330 1335 1340 Ala Gly Ser Phe Lys Cys Ser Cys Ser Pro Gly Trp Ile Gly Asp Gly 1345 1350 1355 1360 Ile Lys Cys Thr Asp Leu Asp Glu Cys Ser Asn Gly Thr His Met Cys 1365 1370 1375 Ser Gln His Ala Asp Cys Lys Asn Thr Met Gly Ser Tyr Arg Cys Leu 1380 1385 1390 Cys Lys Asp Gly Tyr Thr Gly Asp Gly Phe Thr Cys Thr Asp Leu Asp 1395 1400 1405 Glu Cys Ser Glu Asn Leu Asn Leu Cys Gly Asn Gly Gln Cys Leu Asn 1410 1415 1420 Ala Pro Gly Gly Tyr Arg Cys Glu Cys Asp Met Gly Phe Val Pro Ser 1425 1430 1435 1440 Ala Asp Gly Lys Ala Cys Glu Asp Ile Asp Glu Cys Ser Leu Pro Asn 1445 1450 1455 Ile Cys Val Phe Gly Thr Cys His Asn Leu Pro Gly Leu Phe Arg Cys 1460 1465 1470 Glu Cys Glu Ile Gly Tyr Glu Leu Asp Arg Ser Gly Gly Asn Cys Thr 1475 1480 1485 Asp Val Asn Glu Cys Leu Asp Pro Thr Thr Cys Ile Ser Gly Asn Cys 1490 1495 1500 Val Asn Thr Pro Gly Ser Tyr Thr Cys Asp Cys Pro Pro Asp Phe Glu 1505 1510 1515 1520 Leu Asn Pro Thr Arg Val Gly Cys Val Asp Thr Arg Ser Gly Asn Cys 1525 1530 1535 Tyr Leu Asp Ile Arg Pro Arg Gly Asp Asn Gly Asp Thr Ala Cys Ser 1540 1545 1550 Asn Glu Ile Gly Val Gly Val Ser Lys Ala Ser Cys Cys Cys Ser Leu 1555 1560 1565 Gly Lys Ala Trp Gly Thr Pro Cys Glu Leu Cys Pro Ser Val Asn Thr 1570 1575 1580 Ser Glu Tyr Lys Ile Leu Cys Pro Gly Gly Glu Gly Phe Arg Pro Asn 1585 1590 1595 1600 Pro Ile Thr Val Ile Leu Glu Asp Ile Asp Glu Cys Gln Glu Leu Pro 1605 1610 1615 Gly Leu Cys Gln Gly Gly Lys Cys Ile Asn Thr Phe Gly Ser Phe Gln 1620 1625 1630 Cys Arg Cys Pro Thr Gly Tyr Tyr Leu Asn Glu Asp Thr Arg Val Cys 1635 1640 1645 Asp Asp Val Asn Glu Cys Glu Thr Pro Gly Ile Cys Gly Pro Gly Thr 1650 1655 1660 Cys Tyr Asn Thr Val Gly Asn Tyr Thr Cys Ile Cys Pro Pro Asp Tyr 1665 1670 1675 1680 Met Gln Val Asn Gly Gly Asn Asn Cys Met Asp Met Arg Arg Ser Leu 1685 1690 1695 Cys Tyr Arg Asn Tyr Tyr Ala Asp Asn Gln Thr Cys Asp Gly Glu Leu 1700 1705 1710 Leu Phe Asn Met Thr Lys Lys Met Cys Cys Cys Ser Tyr Asn Ile Gly 1715 1720 1725 Arg Ala Trp Asn Lys Pro Cys Glu Gln Cys Pro Ile Pro Ser Thr Asp 1730 1735 1740 Glu Phe Ala Thr Leu Cys Gly Ser Gln Arg Pro Gly Phe Val Ile Asp 1745 1750 1755 1760 Ile Tyr Thr Gly Leu Pro Val Asp Ile Asp Glu Cys Arg Glu Ile Pro 1765 1770 1775 Gly Val Cys Glu Asn Gly Val Cys Ile Asn Met Val Gly Ser Phe Arg 1780 1785 1790 Cys Glu Cys Pro Val Gly Phe Phe Tyr Asn Asp Lys Leu Leu Val Cys 1795 1800 1805 Glu Asp Ile Asp Glu Cys Gln Asn Gly Pro Val Cys Gln Arg Asn Ala 1810 1815 1820 Glu Cys Ile Asn Thr Ala Gly Ser Tyr Arg Cys Asp Cys Lys Pro Gly 1825 1830 1835 1840 Tyr Arg Leu Thr Ser Thr Gly Gln Cys Asn Asp Arg Asn Glu Cys Gln 1845 1850 1855 Glu Ile Pro Asn Ile Cys Ser His Gly Gln Cys Ile Asp Thr Val Gly 1860 1865 1870 Ser Phe Tyr Cys Leu Cys His Thr Gly Phe Lys Thr Asn Val Asp Gln 1875 1880 1885 Thr Met Cys Leu Asp Ile Asn Glu Cys Glu Arg Asp Ala Cys Gly Asn 1890 1895 1900 Gly Thr Cys Arg Asn Thr Ile Gly Ser Phe Asn Cys Arg Cys Asn His 1905 1910 1915 1920 Gly Phe Ile Leu Ser His Asn Asn Asp Cys Ile Asp Val Asp Glu Cys 1925 1930 1935 Ala Thr Gly Asn Gly Asn Leu Cys Arg Asn Gly Gln Cys Val Asn Thr 1940 1945 1950 Val Gly Ser Phe Gln Cys Arg Cys Asn Glu Gly Tyr Glu Val Ala Pro 1955 1960 1965 Asp Gly Arg Thr Cys Val Asp Ile Asn Glu Cys Val Leu Asp Pro Gly 1970 1975 1980 Lys Cys Ala Pro Gly Thr Cys Gln Asn Leu Asp Gly Ser Tyr Arg Cys 1985 1990 1995 2000 Ile Cys Pro Pro Gly Tyr Ser Leu Gln Asn Asp Lys Cys Glu Asp Ile 2005 2010 2015 Asp Glu Cys Val Glu Glu Pro Glu Ile Cys Ala Leu Gly Thr Cys Ser 2020 2025 2030 Asn Thr Glu Gly Ser Phe Lys Cys Leu Cys Pro Glu Gly Phe Ser Leu 2035 2040 2045 Ser Ser Thr Gly Arg Arg Cys Gln Asp Leu Arg Met Ser Tyr Cys Tyr 2050 2055 2060 Ala Lys Phe Glu Gly Gly Lys Cys Ser Ser Pro Lys Ser Arg Asn His 2065 2070 2075 2080 Ser Lys Gln Glu Cys Cys Cys Ala Leu Lys Gly Glu Gly Trp Gly Asp 2085 2090 2095 Pro Cys Glu Leu Cys Pro Thr Glu Pro Asp Glu Ala Phe Arg Gln Ile 2100 2105 2110 Cys Pro Phe Gly Ser Gly Ile Ile Val Gly Pro Asp Asp Ser Ala Val 2115 2120 2125 Asp Met Asp Glu Cys Lys Glu Pro Asp Val Cys Arg His Gly Gln Cys 2130 2135 2140 Ile Asn Thr Asp Gly Ser Tyr Arg Cys Glu Cys Pro Phe Gly Tyr Ile 2145 2150 2155 2160 Leu Glu Gly Asn Glu Cys Val Asp Thr Asp Glu Cys Ser Val Gly Asn 2165 2170 2175 Pro Cys Gly Asn Gly Thr Cys Lys Asn Val Ile Gly Gly Phe Glu Cys 2180 2185 2190 Thr Cys Glu Glu Gly Phe Glu Pro Gly Pro Met Met Thr Cys Glu Asp 2195 2200 2205 Ile Asn Glu Cys Ala Gln Asn Pro Leu Leu Cys Ala Phe Arg Cys Val 2210 2215 2220 Asn Thr Tyr Gly Ser Tyr Glu Cys Lys Cys Pro Val Gly Tyr Val Leu 2225 2230 2235 2240 Arg Glu Asp Arg Arg Met Cys Lys Asp Glu Asp Glu Cys Ala Glu Gly 2245 2250 2255 Lys His Asp Cys Thr Glu Lys Gln Met Glu Cys Lys Asn Leu Ile Gly 2260 2265 2270 Thr Tyr Met Cys Ile Cys Gly Pro Gly Tyr Gln Arg Arg Pro Asp Gly 2275 2280 2285 Glu Gly Cys Ile Asp Glu Asn Glu Cys Gln Thr Lys Pro Gly Ile Cys 2290 2295 2300 Glu Asn Gly Arg Cys Leu Asn Thr Leu Gly Ser Tyr Thr Cys Glu Cys 2305 2310 2315 2320 Asn Asp Gly Phe Thr Ala Ser Pro Thr Gln Asp Glu Cys Leu Asp Asn 2325 2330 2335 Arg Glu Gly Tyr Cys Phe Ser Glu Val Leu Gln Asn Met Cys Gln Ile 2340 2345 2350 Gly Ser Ser Asn Arg Asn Pro Val Thr Lys Ser Glu Cys Cys Cys Asp 2355 2360 2365 Gly Gly Arg Gly Trp Gly Pro His Cys Glu Ile Cys Pro Phe Glu Gly 2370 2375 2380 Thr Val Ala Tyr Lys Lys Leu Cys Pro His Gly Arg Gly Phe Met Thr 2385 2390 2395 2400 Asn Gly Ala Asp Ile Asp Glu Cys Lys Val Ile His Asp Val Cys Arg 2405 2410 2415 Asn Gly Glu Cys Val Asn Asp Arg Gly Ser Tyr His Cys Ile Cys Lys 2420 2425 2430 Thr Gly Tyr Thr Pro Asp Ile Thr Gly Thr Ala Cys Val Asp Leu Asn 2435 2440 2445 Glu Cys Asn Gln Ala Pro Lys Pro Cys Asn Phe Ile Cys Lys Asn Thr 2450 2455 2460 Glu Gly Ser Tyr Gln Cys Ser Cys Pro Lys Gly Tyr Ile Leu Gln Glu 2465 2470 2475 2480 Asp Gly Arg Ser Cys Lys Asp Leu Asp Glu Cys Ala Thr Lys Gln His 2485 2490 2495 Asn Cys Gln Phe Leu Cys Val Asn Thr Ile Gly Gly Phe Thr Cys Lys 2500 2505 2510 Cys Pro Pro Gly Phe Thr Gln His His Thr Ala Cys Ile Asp Asn Asn 2515 2520 2525 Glu Cys Thr Ser Asp Ile Asn Leu Cys Gly Ser Lys Gly Val Cys Gln 2530 2535 2540 Asn Thr Pro Gly Ser Phe Thr Cys Glu Cys Gln Arg Gly Phe Ser Leu 2545 2550 2555 2560 Asp Gln Ser Gly Ala Ser Cys Glu Asp Val Asp Glu Cys Glu Gly Asn 2565 2570 2575 His Arg Cys Gln His Gly Cys Gln Asn Ile Ile Gly Gly Tyr Arg Cys 2580 2585 2590 Ser Cys Pro Gln Gly Tyr Leu Gln His Tyr Gln Trp Asn Gln Cys Val 2595 2600 2605 Asp Glu Asn Glu Cys Leu Ser Ala His Val Cys Gly Gly Ala Ser Cys 2610 2615 2620 His Asn Thr Leu Gly Ser Tyr Lys Cys Met Cys Pro Thr Gly Phe Gln 2625 2630 2635 2640 Tyr Glu Gln Phe Ser Gly Gly Cys Gln Asp Ile Asn Glu Cys Gly Ser 2645 2650 2655 Ser Gln Ala Pro Cys Ser Tyr Gly Cys Ser Asn Thr Glu Gly Gly Tyr 2660 2665 2670 Leu Cys Gly Cys Pro Pro Gly Tyr Phe Arg Ile Gly Gln Gly His Cys 2675 2680 2685 Val Ser Gly Met Gly Met Gly Arg Gly Gly Pro Glu Pro Pro Ala Ser 2690 2695 2700 Ser Glu Met Asp Asp Asn Ser Leu Ser Pro Glu Ala Cys Tyr Glu Cys 2705 2710 2715 2720 Lys Ile Asn Gly Tyr Pro Lys Ala Ala Gln Ser His Leu Pro Ala Thr 2725 2730 2735 Arg Pro Glu Thr Glu Lys His Glu Arg Asn Gly Cys Leu Arg His Pro 2740 2745 2750 Gly Arg Val 2755 <210> 33 <211> 2737 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 33 Met Arg Arg Gly Gly Leu Leu Glu Val Ala Leu Ala Phe Ala Leu Leu 1 5 10 15 Leu Glu Ser Tyr Thr Ser His Gly Ala Asp Ala Asn Leu Glu Ala Gly 20 25 30 Ser Leu Lys Glu Thr Arg Ala Asn Arg Ala Lys Arg Arg Gly Gly Gly 35 40 45 Gly His Asp Ala Leu Lys Gly Pro Asn Val Cys Gly Ser Arg Tyr Asn 50 55 60 Ala Tyr Cys Cys Pro Gly Trp Lys Thr Leu Pro Gly Gly Asn Gln Cys 65 70 75 80 Ile Val Pro Ile Cys Arg His Ser Cys Gly Asp Gly Phe Cys Ser Arg 85 90 95 Pro Asn Met Cys Thr Cys Pro Ser Gly Gln Ile Ser Pro Ser Cys Gly 100 105 110 Ser Arg Ser Ile Gln His Cys Ser Ile Arg Cys Met Asn Gly Gly Ser 115 120 125 Cys Ser Asp Asp His Cys Leu Cys Gln Lys Gly Tyr Ile Gly Thr His 130 135 140 Cys Gly Gln Pro Val Cys Glu Ser Gly Cys Leu Asn Gly Gly Arg Cys 145 150 155 160 Val Ala Pro Asn Arg Cys Ala Cys Thr Tyr Gly Phe Thr Gly Pro Gln 165 170 175 Cys Glu Arg Asp Tyr Arg Thr Gly Pro Cys Phe Thr Val Val Ser Asn 180 185 190 Gln Met Cys Gln Gly Gln Leu Ser Gly Ile Val Cys Thr Lys Thr Leu 195 200 205 Cys Cys Ala Thr Val Gly Arg Ala Trp Gly His Pro Cys Glu Met Cys 210 215 220 Pro Ala Gln Pro His Pro Cys Arg Arg Gly Phe Ile Pro Asn Ile Arg 225 230 235 240 Thr Gly Ala Cys Gln Asp Val Asp Glu Cys Gln Ala Ile Pro Gly Met 245 250 255 Cys Gln Gly Gly Asn Cys Ile Asn Thr Val Gly Ser Phe Glu Cys Lys 260 265 270 Cys Pro Ala Gly His Lys Phe Asn Glu Val Ser Gln Lys Cys Glu Asp 275 280 285 Ile Asp Glu Cys Ser Thr Ile Pro Gly Val Cys Asp Gly Gly Glu Cys 290 295 300 Thr Asn Thr Val Ser Ser Tyr Phe Cys Lys Cys Pro Pro Gly Phe Tyr 305 310 315 320 Thr Ser Pro Asp Gly Thr Arg Cys Val Asp Val Arg Pro Gly Tyr Cys 325 330 335 Tyr Thr Ala Leu Ala Asn Gly Arg Cys Ser Asn Gln Leu Pro Gln Ser 340 345 350 Ile Thr Lys Met Gln Cys Cys Cys Asp Leu Gly Arg Cys Trp Ser Pro 355 360 365 Gly Val Thr Val Ala Pro Glu Met Cys Pro Ile Arg Ser Thr Glu Asp 370 375 380 Phe Asn Lys Leu Cys Ser Val Pro Leu Val Ile Pro Gly Arg Pro Glu 385 390 395 400 Tyr Pro Pro Pro Pro Ile Gly Pro Leu Pro Pro Val Gln Pro Val Pro 405 410 415 Pro Gly Tyr Pro Pro Gly Pro Val Ile Pro Ala Pro Arg Pro Pro Pro 420 425 430 Glu Tyr Pro Tyr Pro Ser Pro Ser Arg Glu Pro Pro Arg Val Leu Pro 435 440 445 Phe Asn Val Thr Asp Tyr Cys Gln Leu Val Arg Tyr Leu Cys Gln Asn 450 455 460 Gly Arg Cys Ile Pro Thr Pro Gly Ser Tyr Arg Cys Glu Cys Asn Lys 465 470 475 480 Gly Phe Gln Leu Asp Ile Arg Gly Glu Cys Ile Asp Val Asp Glu Cys 485 490 495 Glu Lys Asn Pro Cys Thr Gly Gly Glu Cys Ile Asn Asn Gln Gly Ser 500 505 510 Tyr Thr Cys His Cys Arg Ala Gly Tyr Gln Ser Thr Leu Thr Arg Thr 515 520 525 Glu Cys Arg Asp Ile Asp Glu Cys Leu Gln Asn Gly Arg Ile Cys Asn 530 535 540 Asn Gly Arg Cys Ile Asn Thr Asp Gly Ser Phe His Cys Val Cys Asn 545 550 555 560 Ala Gly Phe His Val Thr Arg Asp Gly Lys Asn Cys Glu Asp Met Asp 565 570 575 Glu Cys Ser Ile Arg Asn Met Cys Leu Asn Gly Met Cys Ile Asn Glu 580 585 590 Asp Gly Ser Phe Lys Cys Ile Cys Lys Pro Gly Phe Gln Leu Ala Ser 595 600 605 Asp Gly Arg Tyr Cys Lys Asp Ile Asn Glu Cys Glu Thr Pro Gly Ile 610 615 620 Cys Met Asn Gly Arg Cys Val Asn Thr Asp Gly Ser Tyr Arg Cys Glu 625 630 635 640 Cys Phe Pro Gly Leu Ala Val Gly Leu Asp Gly Arg Val Cys Val Asp 645 650 655 Thr His Met Arg Ser Thr Cys Tyr Gly Gly Tyr Arg Arg Gly Gln Cys 660 665 670 Val Lys Pro Leu Phe Gly Ala Val Thr Lys Ser Glu Cys Cys Cys Ala 675 680 685 Ser Thr Glu Tyr Ala Phe Gly Glu Pro Cys Gln Pro Cys Pro Ala Gln 690 695 700 Asn Ser Ala Glu Tyr Gln Ala Leu Cys Ser Ser Gly Pro Gly Met Thr 705 710 715 720 Ser Ala Gly Thr Asp Ile Asn Glu Cys Ala Leu Asp Pro Asp Ile Cys 725 730 735 Pro Asn Gly Ile Cys Glu Asn Leu Arg Gly Thr Tyr Lys Cys Ile Cys 740 745 750 Asn Ser Gly Tyr Glu Val Asp Ile Thr Gly Lys Asn Cys Val Asp Ile 755 760 765 Asn Glu Cys Val Leu Asn Ser Leu Leu Cys Asp Asn Gly Gln Cys Arg 770 775 780 Asn Thr Pro Gly Ser Phe Val Cys Thr Cys Pro Lys Gly Phe Val Tyr 785 790 795 800 Lys Pro Asp Leu Lys Thr Cys Glu Asp Ile Asp Glu Cys Glu Ser Ser 805 810 815 Pro Cys Ile Asn Gly Val Cys Lys Asn Ser Pro Gly Ser Phe Ile Cys 820 825 830 Glu Cys Ser Pro Glu Ser Thr Leu Asp Pro Thr Lys Thr Ile Cys Ile 835 840 845 Glu Thr Ile Lys Gly Thr Cys Trp Gln Thr Val Ile Asp Gly Arg Cys 850 855 860 Glu Ile Asn Ile Asn Gly Ala Thr Leu Lys Ser Glu Cys Cys Ser Ser 865 870 875 880 Leu Gly Ala Ala Trp Gly Ser Pro Cys Thr Ile Cys Gln Leu Asp Pro 885 890 895 Ile Cys Gly Lys Gly Phe Ser Arg Ile Lys Gly Thr Gln Cys Glu Asp 900 905 910 Ile Asn Glu Cys Glu Val Phe Pro Gly Val Cys Lys Asn Gly Leu Cys 915 920 925 Val Asn Ser Arg Gly Ser Phe Lys Cys Glu Cys Pro Asn Gly Met Thr 930 935 940 Leu Asp Ala Thr Gly Arg Ile Cys Leu Asp Ile Arg Leu Glu Thr Cys 945 950 955 960 Phe Leu Lys Tyr Asp Asp Glu Glu Cys Thr Leu Pro Ile Ala Gly Arg 965 970 975 His Arg Met Asp Ala Cys Cys Cys Ser Val Gly Ala Ala Trp Gly Thr 980 985 990 Glu Glu Cys Glu Glu Cys Pro Leu Arg Asn Ser Arg Glu Tyr Glu Glu 995 1000 1005 Leu Cys Pro Arg Gly Pro Gly Phe Ala Thr Lys Asp Ile Thr Asn Gly 1010 1015 1020 Lys Pro Phe Phe Lys Asp Ile Asn Glu Cys Lys Met Ile Pro Ser Leu 1025 1030 1035 1040 Cys Thr His Gly Lys Cys Arg Asn Thr Ile Gly Ser Phe Lys Cys Arg 1045 1050 1055 Cys Asp Ser Gly Phe Ala Leu Asp Ser Glu Glu Arg Asn Cys Thr Asp 1060 1065 1070 Ile Asp Glu Cys Arg Ile Ser Pro Asp Leu Cys Gly Arg Gly Gln Cys 1075 1080 1085 Val Asn Thr Pro Gly Asp Phe Glu Cys Lys Cys Asp Glu Gly Tyr Glu 1090 1095 1100 Ser Gly Phe Met Met Met Lys Asn Cys Met Asp Ile Asp Glu Cys Gln 1105 1110 1115 1120 Arg Asp Pro Leu Leu Cys Arg Gly Gly Ile Cys His Asn Thr Glu Gly 1125 1130 1135 Ser Tyr Arg Cys Glu Cys Pro Pro Gly His Gln Leu Ser Pro Asn Ile 1140 1145 1150 Ser Ala Cys Ile Asp Ile Asn Glu Cys Glu Leu Ser Ala Asn Leu Cys 1155 1160 1165 Pro His Gly Arg Cys Val Asn Leu Ile Gly Lys Tyr Gln Cys Ala Cys 1170 1175 1180 Asn Pro Gly Tyr His Pro Thr His Asp Arg Leu Phe Cys Val Asp Ile 1185 1190 1195 1200 Asp Glu Cys Ser Ile Met Asn Gly Gly Cys Glu Thr Phe Cys Thr Asn 1205 1210 1215 Ser Asp Gly Ser Tyr Glu Cys Ser Cys Gln Pro Gly Phe Ala Leu Met 1220 1225 1230 Pro Asp Gln Arg Ser Cys Thr Asp Ile Asp Glu Cys Glu Asp Asn Pro 1235 1240 1245 Asn Ile Cys Asp Gly Gly Gln Cys Thr Asn Ile Pro Gly Glu Tyr Arg 1250 1255 1260 Cys Leu Cys Tyr Asp Gly Phe Met Ala Ser Glu Asp Met Lys Thr Cys 1265 1270 1275 1280 Val Asp Val Asn Glu Cys Asp Leu Asn Pro Asn Ile Cys Leu Ser Gly 1285 1290 1295 Thr Cys Glu Asn Thr Lys Gly Ser Phe Ile Cys His Cys Asp Met Gly 1300 1305 1310 Tyr Ser Gly Lys Lys Gly Lys Thr Gly Cys Thr Asp Ile Asn Glu Cys 1315 1320 1325 Glu Ile Gly Ala His Asn Cys Gly Arg His Ala Val Cys Thr Asn Thr 1330 1335 1340 Ala Gly Ser Phe Lys Cys Ser Cys Ser Pro Gly Trp Ile Gly Asp Gly 1345 1350 1355 1360 Ile Lys Cys Thr Asp Leu Asp Glu Cys Ser Asn Gly Thr His Met Cys 1365 1370 1375 Ser Gln His Ala Asp Cys Lys Asn Thr Met Gly Ser Tyr Arg Cys Leu 1380 1385 1390 Cys Lys Asp Gly Tyr Thr Gly Asp Gly Phe Thr Cys Thr Asp Leu Asp 1395 1400 1405 Glu Cys Ser Glu Asn Leu Asn Leu Cys Gly Asn Gly Gln Cys Leu Asn 1410 1415 1420 Ala Pro Gly Gly Tyr Arg Cys Glu Cys Asp Met Gly Phe Val Pro Ser 1425 1430 1435 1440 Ala Asp Gly Lys Ala Cys Glu Asp Ile Asp Glu Cys Ser Leu Pro Asn 1445 1450 1455 Ile Cys Val Phe Gly Thr Cys His Asn Leu Pro Gly Leu Phe Arg Cys 1460 1465 1470 Glu Cys Glu Ile Gly Tyr Glu Leu Asp Arg Ser Gly Gly Asn Cys Thr 1475 1480 1485 Asp Val Asn Glu Cys Leu Asp Pro Thr Thr Cys Ile Ser Gly Asn Cys 1490 1495 1500 Val Asn Thr Pro Gly Ser Tyr Thr Cys Asp Cys Pro Pro Asp Phe Glu 1505 1510 1515 1520 Leu Asn Pro Thr Arg Val Gly Cys Val Asp Thr Arg Ser Gly Asn Cys 1525 1530 1535 Tyr Leu Asp Ile Arg Pro Arg Gly Asp Asn Gly Asp Thr Ala Cys Ser 1540 1545 1550 Asn Glu Ile Gly Val Gly Val Ser Lys Ala Ser Cys Cys Cys Ser Leu 1555 1560 1565 Gly Lys Ala Trp Gly Thr Pro Cys Glu Leu Cys Pro Ser Val Asn Thr 1570 1575 1580 Ser Glu Tyr Lys Ile Leu Cys Pro Gly Gly Glu Gly Phe Arg Pro Asn 1585 1590 1595 1600 Pro Ile Thr Val Ile Leu Glu Asp Ile Asp Glu Cys Gln Glu Leu Pro 1605 1610 1615 Gly Leu Cys Gln Gly Gly Lys Cys Ile Asn Thr Phe Gly Ser Phe Gln 1620 1625 1630 Cys Arg Cys Pro Thr Gly Tyr Tyr Leu Asn Glu Asp Thr Arg Val Cys 1635 1640 1645 Asp Asp Val Asn Glu Cys Glu Thr Pro Gly Ile Cys Gly Pro Gly Thr 1650 1655 1660 Cys Tyr Asn Thr Val Gly Asn Tyr Thr Cys Ile Cys Pro Pro Asp Tyr 1665 1670 1675 1680 Met Gln Val Asn Gly Gly Asn Asn Cys Met Asp Met Arg Arg Ser Leu 1685 1690 1695 Cys Tyr Arg Asn Tyr Tyr Ala Asp Asn Gln Thr Cys Asp Gly Glu Leu 1700 1705 1710 Leu Phe Asn Met Thr Lys Lys Met Cys Cys Cys Ser Tyr Asn Ile Gly 1715 1720 1725 Arg Ala Trp Asn Lys Pro Cys Glu Gln Cys Pro Ile Pro Ser Thr Asp 1730 1735 1740 Glu Phe Ala Thr Leu Cys Gly Ser Gln Arg Pro Gly Phe Val Ile Asp 1745 1750 1755 1760 Ile Tyr Thr Gly Leu Pro Val Asp Ile Asp Glu Cys Arg Glu Ile Pro 1765 1770 1775 Gly Val Cys Glu Asn Gly Val Cys Ile Asn Met Val Gly Ser Phe Arg 1780 1785 1790 Cys Glu Cys Pro Val Gly Phe Phe Tyr Asn Asp Lys Leu Leu Val Cys 1795 1800 1805 Glu Asp Ile Asp Glu Cys Gln Asn Gly Pro Val Cys Gln Arg Asn Ala 1810 1815 1820 Glu Cys Ile Asn Thr Ala Gly Ser Tyr Arg Cys Asp Cys Lys Pro Gly 1825 1830 1835 1840 Tyr Arg Leu Thr Ser Thr Gly Gln Cys Asn Asp Arg Asn Glu Cys Gln 1845 1850 1855 Glu Ile Pro Asn Ile Cys Ser His Gly Gln Cys Ile Asp Thr Val Gly 1860 1865 1870 Ser Phe Tyr Cys Leu Cys His Thr Gly Phe Lys Thr Asn Val Asp Gln 1875 1880 1885 Thr Met Cys Leu Asp Ile Asn Glu Cys Glu Arg Asp Ala Cys Gly Asn 1890 1895 1900 Gly Thr Cys Arg Asn Thr Ile Gly Ser Phe Asn Cys Arg Cys Asn His 1905 1910 1915 1920 Gly Phe Ile Leu Ser His Asn Asn Asp Cys Ile Asp Val Asp Glu Cys 1925 1930 1935 Ala Thr Gly Asn Gly Asn Leu Cys Arg Asn Gly Gln Cys Val Asn Thr 1940 1945 1950 Val Gly Ser Phe Gln Cys Arg Cys Asn Glu Gly Tyr Glu Val Ala Pro 1955 1960 1965 Asp Gly Arg Thr Cys Val Asp Ile Asn Glu Cys Val Leu Asp Pro Gly 1970 1975 1980 Lys Cys Ala Pro Gly Thr Cys Gln Asn Leu Asp Gly Ser Tyr Arg Cys 1985 1990 1995 2000 Ile Cys Pro Pro Gly Tyr Ser Leu Gln Asn Asp Lys Cys Glu Asp Ile 2005 2010 2015 Asp Glu Cys Val Glu Glu Pro Glu Ile Cys Ala Leu Gly Thr Cys Ser 2020 2025 2030 Asn Thr Glu Gly Ser Phe Lys Cys Leu Cys Pro Glu Gly Phe Ser Leu 2035 2040 2045 Ser Ser Thr Gly Arg Arg Cys Gln Asp Leu Arg Met Ser Tyr Cys Tyr 2050 2055 2060 Ala Lys Phe Glu Gly Gly Lys Cys Ser Ser Pro Lys Ser Arg Asn His 2065 2070 2075 2080 Ser Lys Gln Glu Cys Cys Cys Ala Leu Lys Gly Glu Gly Trp Gly Asp 2085 2090 2095 Pro Cys Glu Leu Cys Pro Thr Glu Pro Asp Glu Ala Phe Arg Gln Ile 2100 2105 2110 Cys Pro Phe Gly Ser Gly Ile Ile Val Gly Pro Asp Asp Ser Ala Val 2115 2120 2125 Asp Met Asp Glu Cys Lys Glu Pro Asp Val Cys Arg His Gly Gln Cys 2130 2135 2140 Ile Asn Thr Asp Gly Ser Tyr Arg Cys Glu Cys Pro Phe Gly Tyr Ile 2145 2150 2155 2160 Leu Glu Gly Asn Glu Cys Val Asp Thr Asp Glu Cys Ser Val Gly Asn 2165 2170 2175 Pro Cys Gly Asn Gly Thr Cys Lys Asn Val Ile Gly Gly Phe Glu Cys 2180 2185 2190 Thr Cys Glu Glu Gly Phe Glu Pro Gly Pro Met Met Thr Cys Glu Asp 2195 2200 2205 Ile Asn Glu Cys Ala Gln Asn Pro Leu Leu Cys Ala Phe Arg Cys Val 2210 2215 2220 Asn Thr Tyr Gly Ser Tyr Glu Cys Lys Cys Pro Val Gly Tyr Val Leu 2225 2230 2235 2240 Arg Glu Asp Arg Arg Met Cys Lys Asp Glu Asp Glu Cys Ala Glu Gly 2245 2250 2255 Lys His Asp Cys Thr Glu Lys Gln Met Glu Cys Lys Asn Leu Ile Gly 2260 2265 2270 Thr Tyr Met Cys Ile Cys Gly Pro Gly Tyr Gln Arg Arg Pro Asp Gly 2275 2280 2285 Glu Gly Cys Ile Asp Glu Asn Glu Cys Gln Thr Lys Pro Gly Ile Cys 2290 2295 2300 Glu Asn Gly Arg Cys Leu Asn Thr Leu Gly Ser Tyr Thr Cys Glu Cys 2305 2310 2315 2320 Asn Asp Gly Phe Thr Ala Ser Pro Thr Gln Asp Glu Cys Leu Asp Asn 2325 2330 2335 Arg Glu Gly Tyr Cys Phe Ser Glu Val Leu Gln Asn Met Cys Gln Ile 2340 2345 2350 Gly Ser Ser Asn Arg Asn Pro Val Thr Lys Ser Glu Cys Cys Cys Asp 2355 2360 2365 Gly Gly Arg Gly Trp Gly Pro His Cys Glu Ile Cys Pro Phe Glu Gly 2370 2375 2380 Thr Val Ala Tyr Lys Lys Leu Cys Pro His Gly Arg Gly Phe Met Thr 2385 2390 2395 2400 Asn Gly Ala Asp Ile Asp Glu Cys Lys Val Ile His Asp Val Cys Arg 2405 2410 2415 Asn Gly Glu Cys Val Asn Asp Arg Gly Ser Tyr His Cys Ile Cys Lys 2420 2425 2430 Thr Gly Tyr Thr Pro Asp Ile Thr Gly Thr Ala Cys Val Asp Leu Asn 2435 2440 2445 Glu Cys Asn Gln Ala Pro Lys Pro Cys Asn Phe Ile Cys Lys Asn Thr 2450 2455 2460 Glu Gly Ser Tyr Gln Cys Ser Cys Pro Lys Gly Tyr Ile Leu Gln Glu 2465 2470 2475 2480 Asp Gly Arg Ser Cys Lys Asp Leu Asp Glu Cys Ala Thr Lys Gln His 2485 2490 2495 Asn Cys Gln Phe Leu Cys Val Asn Thr Ile Gly Gly Phe Thr Cys Lys 2500 2505 2510 Cys Pro Pro Gly Phe Thr Gln His His Thr Ala Cys Ile Asp Asn Asn 2515 2520 2525 Glu Cys Thr Ser Asp Ile Asn Leu Cys Gly Ser Lys Gly Val Cys Gln 2530 2535 2540 Asn Thr Pro Gly Ser Phe Thr Cys Glu Cys Gln Arg Gly Phe Ser Leu 2545 2550 2555 2560 Asp Gln Ser Gly Ala Ser Cys Glu Asp Val Asp Glu Cys Glu Gly Asn 2565 2570 2575 His Arg Cys Gln His Gly Cys Gln Asn Ile Ile Gly Gly Tyr Arg Cys 2580 2585 2590 Ser Cys Pro Gln Gly Tyr Leu Gln His Tyr Gln Trp Asn Gln Cys Val 2595 2600 2605 Asp Glu Asn Glu Cys Leu Ser Ala His Val Cys Gly Gly Ala Ser Cys 2610 2615 2620 His Asn Thr Leu Gly Ser Tyr Lys Cys Met Cys Pro Thr Gly Phe Gln 2625 2630 2635 2640 Tyr Glu Gln Phe Ser Gly Gly Cys Gln Asp Ile Asn Glu Cys Gly Ser 2645 2650 2655 Ser Gln Ala Pro Cys Ser Tyr Gly Cys Ser Asn Thr Glu Gly Gly Tyr 2660 2665 2670 Leu Cys Gly Cys Pro Pro Gly Tyr Phe Arg Ile Gly Gln Gly His Cys 2675 2680 2685 Val Ser Gly Met Gly Met Gly Arg Gly Gly Pro Glu Pro Pro Ala Ser 2690 2695 2700 Ser Glu Met Asp Asp Asn Ser Leu Ser Pro Glu Ala Cys Tyr Glu Cys 2705 2710 2715 2720 Asp Gln Trp Leu Pro Gln Thr Gly Gln Glu Thr Glu Lys His Lys Arg 2725 2730 2735 Asn <210> 34 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 34 Glu Thr Glu Lys His Lys Arg Asn 1 5 <210> 35 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 35 Ile Ser Leu Arg Gln Lys Pro Met 1 5 <210> 36 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 36 Arg Gly Arg Lys Arg Arg 1 5 <210> 37 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 37 acggagaagc acgaacgaaa cgg 23 <210> 38 <211> 123 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 38 cagggccctt aggtatctgc agacaaggag accctgatat acctggatgt cggaggcatc 60 agttttcgtt cgtgcttctc cgtttccggc ctcgttttgg gtagccgttg atcttacact 120 cat 123 <210> 39 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (2)..(21) <223> n = A, T, C, or G <400> 39 gnnnnnnnnn nnnnnnnnnn ngg 23 <210> 40 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (1)..(21) <223> n = A, T, C, or G <400> 40 nnnnnnnnnn nnnnnnnnnn ngg 23 <210> 41 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (3)..(23) <223> n = A, T, C, or G <400> 41 ggnnnnnnnn nnnnnnnnnn nnngg 25 <210> 42 <211> 28 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 42 Ala Ala Gln Ser His Leu Pro Ala Thr Arg Pro Glu Thr Glu Lys His 1 5 10 15 Glu Arg Asn Gly Cys Leu Arg His Pro Gly Arg Val 20 25 <210> 43 <211> 17 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 43 Asp Gln Trp Leu Pro Gln Thr Gly Gln Glu Thr Glu Lys His Lys Arg 1 5 10 15 Asn <210> 44 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 44 aggcggccca gagccacctg ccagc 25 <210> 45 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 45 Tyr Pro Lys Arg Gly Arg Lys Arg Arg Ser Thr Asn Glu Asn 1 5 10 <210> 46 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 46 Leu Pro Gln Thr Gly Gln Glu Thr Glu Lys His Lys Arg Asn 1 5 10 <210> 47 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 47 Lys His Glu Arg Asn Gly Cys Leu Arg His Pro Gly Arg Val 1 5 10

Claims (52)

  1. 비-인간 포유동물로서, 이의 게놈이 돌연변이를 포함하는 피브릴린 -1 (Fbn1) 유전자를 포함하고, 이로써 상기 유전자의 발현에 의해 상기 비-인간 포유동물이 신생아 조로 증후군의 하나 이상의 선천성 지방이영양증-유사 증상이 발병하도록 하는 C-말단 절단된 Fbn1 단백질을 유발하도록 하는, 비-인간 포유동물.
  2. 청구항 1에 있어서, 상기 비-인간 포유동물은 상기 돌연변이에 대하여 이형접합자인, 비-인간 포유동물.
  3. 청구항 1 또는 2에 있어서, 상기 Fbn1 유전자는 상기 비-인간 포유동물에 내인성인 Fbn1 프로모터를 포함하는, 비-인간 포유동물.
  4. 청구항 1 내지 3 중 어느 한 항에 있어서, 상기 돌연변이는 프레임시프트(frameshift) 돌연변이인, 비-인간 포유동물.
  5. 청구항 1 내지 4 중 어느 한 항에 있어서, 상기 돌연변이는 조기 종결 코돈을 유발하는, 비-인간 포유동물.
  6. 청구항 5에 있어서, 상기 조기 종결 코돈은 상기 Fbn1 유전자의 말단으로부터 2번째 엑손 또는 최종 엑손 내 존재하는, 비-인간 포유동물.
  7. 청구항 6에 있어서, 상기 조기 종결 코돈은 상기 최종 엑손 내에 존재하거나, 또는 상기 Fbn1 유전자 내 최종 엑손-엑손 접합의 상류에 있는 약 55개 미만의 염기쌍인, 비-인간 포유동물.
  8. 청구항 1 내지 7 중 어느 한 항에 있어서, 상기 돌연변이는, 상기 말단으로부터 2번째 엑손의 건너뜀(skip)을 유발하는 스플라이스 부위 돌연변이인, 비-인간 포유동물.
  9. 청구항 1 내지 8 중 어느 한 항에 있어서, 상기 돌연변이는 상기 최종 암호화 엑손 내 조기 종결 코돈을 유발하는, 비-인간 포유동물.
  10. 청구항 1 내지 9 중 어느 한 항에 있어서, 상기 돌연변이는 퓨린 계열의 전구단백질 전환효소에 대한 염기성 아미노산 인식 서열을 파괴하는, 비-인간 포유동물.
  11. 청구항 1 내지 10 중 어느 한 항에 있어서, 상기 돌연변이는 전구-피브릴린-1의 아스프로신 C-말단 절단 생성물의 파괴 또는 제거를 유발하는, 비-인간 포유동물.
  12. 청구항 1 내지 11 중 어느 한 항에 있어서, 상기 C-말단 절단된 Fbn1 단백질은 양전하를 띈 C-말단을 갖는, 비-인간 포유동물.
  13. 청구항 1 내지 12 중 어느 한 항에 있어서, 상기 C-말단 절단된 Fbn1 단백질이 서열 번호 30과 최적 정렬될 경우, 상기 C-말단 절단된 Fbn1 단백질은 서열 번호 30에 명시된 야생형 마우스 Fbn1 단백질 내의 아미노산 2700 내지 2790, 아미노산 2710 내지 2780, 아미노산 2720 내지 2770, 아미노산 2730 내지 2760, 또는 아미노산 2737 내지 2755의 위치에 상응하는 위치에서 절단되는, 비-인간 포유동물.
  14. 청구항 13에 있어서, 상기 C-말단 절단된 Fbn1 단백질이 서열 번호 30과 최적 정렬될 경우, 상기 C-말단 절단된 Fbn1 단백질은 상기 최종 아미노산이 서열 번호 30에 명시된 야생형 마우스 Fbn1 단백질 내의 아미노산 2737, 아미노산 2738, 또는 아미노산 2755의 위치에 상응하는 위치에 존재하도록 절단되는, 비-인간 포유동물.
  15. 청구항 1 내지 14 중 어느 한 항에 있어서, 상기 C-말단 절단된 Fbn1 단백질은 서열 번호 8, 42, 43, 45, 46, 또는 47에 명시된 서열로 이루어진 C-말단을 갖는, 비-인간 포유동물.
  16. 청구항 13 내지 15 중 어느 한 항에 있어서, 상기 C-말단 절단된 Fbn1 단백질은 (상기 C-말단 절단된 Fbn1 단백질이 서열 번호 30과 최적 정렬될 경우) 상기 최종 아미노산은 서열 번호 30에 명시된 야생형 마우스 Fbn1 단백질 내의 아미노산 2737의 위치와 상응하는 위치에서 존재하도록 절단되며, 그리고 상기 C-말단 절단된 Fbn1 단백질의 C-말단은 서열 번호 43 또는 46에 명시된 서열로 이루어지는, 비-인간 포유동물.
  17. 청구항 13 내지 15 중 어느 한 항에 있어서, 상기 C-말단 절단된 Fbn1 단백질은 (상기 C-말단 절단된 Fbn1 단백질이 서열 번호 30과 최적 정렬될 경우) 상기 최종 아미노산이 서열 번호 30에 명시된 야생형 마우스 Fbn1 단백질 내 아미노산 2738의 위치와 상응하는 위치에서 존재하도록 절단되며, 그리고 상기 C-말단 절단된 Fbn1 단백질의 C-말단은 서열 번호 8 또는 45에 명시된 서열로 이루어지는, 비-인간 포유동물.
  18. 청구항 13 내지 15 중 어느 한 항에 있어서, 상기 C-말단 절단된 Fbn1 단백질은 (상기 C-말단 절단된 Fbn1 단백질이 서열 번호 30과 최적 정렬될 경우) 상기 최종 아미노산이 서열 번호 30에 명시된 야생형 마우스 Fbn1 단백질 내의 아미노산 2755의 위치와 상응하는 위치에서 존재하도록 절단되며, 그리고 상기 C-말단 절단된 Fbn1 단백질의 C-말단은 서열 번호 42 또는 47에 명시된 서열로 이루어지는, 비-인간 포유동물.
  19. 청구항 1 내지 18 중 어느 한 항에 있어서, 상기 돌연변이는 상기 말단으로부터 2번째 엑손 내 존재하는, 비-인간 포유동물.
  20. 청구항 19에 있어서, 상기 Fbn1 유전자의 말단으로부터 2번째의 돌연변이화된 엑손은 (상기 말단으로부터 2번째의 돌연변이화된 엑손이 서열 번호 26, 27, 또는 28과 최적 정렬될 경우) 서열 번호 25에 명시된 야생형 마우스 Fbn1 말단으로부터 2번째 엑손 서열과 비교하여, 서열 번호 26, 27, 또는 28에서의 돌연변이에 상응하는 돌연변이를 포함하는, 비-인간 포유동물.
  21. 청구항 1 내지 20 중 어느 한 항에 있어서, 상기 Fbn1 유전자의 전체 또는 일부는 결실되고, 그리고 병렬상동성 인간 FBN1 유전자 서열로 대체되는, 비-인간 포유동물.
  22. 청구항 21에 있어서, 상기 돌연변이는 상기 병렬상동성 인간 FBN1 유전자 서열 내에 위치하는, 비-인간 포유동물.
  23. 청구항 21 또는 22에 있어서, 상기 병렬상동성 인간 FBN1 유전자 서열은 상기 내인성 비-인간 포유동물 Fbn1 좌위 내에 위치하는, 비-인간 포유동물.
  24. 청구항 1 내지 23 중 어느 한 항에 있어서, 상기 돌연변이화된 Fbn1 유전자에 의하여 암호화된 상기 C-말단 절단된 Fbn1 단백질은 서열 번호 31, 32, 또는 33에 명시된 서열로 이루어진 것인, 비-인간 포유동물.
  25. 청구항 1 내지 24 중 어느 한 항에 있어서, 상기 비-인간 포유동물은 설치류인, 비-인간 포유동물.
  26. 청구항 25에 있어서, 상기 설치류는 랫트 또는 마우스인, 비-인간 포유동물.
  27. 청구항 26에 있어서, 상기 설치류는 마우스인, 비-인간 포유동물.
  28. 청구항 27에 있어서, 상기 돌연변이는 상기 내인성 마우스 Fbn1 유전자의 엑손 64에 삽입 또는 결실을 포함하며, 이는 -1 프레임시프트를 야기하여, 엑손 64의 3' 말단 또는 엑손 65의 5' 말단에 조기 종결 코돈을 유발하는, 비-인간 포유동물.
  29. 청구항 28에 있어서, 상기 돌연변이는 엑손 64에서의 삽입을 포함하며, 이는 -1 프레임시프트를 야기하여, 엑손 65의 5' 말단에 조기 종결 코돈을 유발하는, 비-인간 포유동물.
  30. 청구항 29에 있어서, 상기 삽입은 (상기 돌연변이를 포함하는 상기 Fbn1 유전자가 서열 번호 20과 최적 정렬될 경우) 서열 번호 20에 명시된 야생형 마우스 Fbn1 암호화 서열에서의 위치 8179 및 8180에 상응하는 위치 사이에 존재하며, 그리고/또는 상기 조기 종결 코돈은 (상기 돌연변이를 포함하는 상기 Fbn1 유전자가 서열 번호 20과 최적 정렬될 경우) 서열 번호 20에 명시된 야생형 마우스 Fbn1 암호화 서열에서의 위치 8241에 상응하는 위치에 존재하는, 비-인간 포유동물.
  31. 청구항 28에 있어서, 상기 돌연변이는 엑손 64에서의 삽입 또는 결실을 포함하며, 이는 -1 프레임시프트를 야기하여, 엑손 64의 3' 말단에 조기 종결 코돈을 유발하는, 비-인간 포유동물.
  32. 청구항 31에 있어서, 상기 돌연변이는 (상기 돌연변이를 포함하는 상기 Fbn1 유전자가 서열 번호 20과 최적 정렬될 경우) 서열 번호 20에 명시된 야생형 마우스 Fbn1 암호화 서열의 위치 8209 및 8210에 상응하는 위치 사이에 존재하는 삽입을 포함하며, 그리고/또는 상기 조기 종결 코돈은 (상기 돌연변이를 포함하는 상기 Fbn1 유전자가 서열 번호 20과 최적 정렬될 경우) 서열 번호 20에 명시된 야생형 마우스 Fbn1 암호화 서열의 위치 8214에 상응하는 위치에 존재하는, 비-인간 포유동물.
  33. 청구항 31에 있어서, 상기 돌연변이는 (상기 돌연변이를 포함하는 상기 Fbn1 유전자가 서열 번호 20과 최적 정렬될 경우) 서열 번호 20에 명시된 야생형 마우스 Fbn1 암호화 서열의 위치 8161에 상응하는 위치에서 시작되는 결실을 포함하며, 그리고/또는 상기 조기 종결 코돈은 (상기 돌연변이를 포함하는 상기 Fbn1 유전자가 서열 번호 20과 최적 정렬될 경우) 서열 번호 20에 명시된 야생형 마우스 Fbn1 암호화 서열의 위치 8214에 상응하는 위치에 존재하는, 비-인간 포유동물.
  34. 청구항 28 내지 33 중 어느 한 항에 있어서, 상기 C-말단 절단된 Fbn1 단백질은 양전하를 띈 C-말단을 갖는, 비-인간 포유동물.
  35. 청구항 1 내지 34 중 어느 한 항에 있어서, 상기 증상은, 체중 감소, 지방 제외 질량의 감소, 지방 질량의 감소, 백색 지방 조직의 감소 (체중에 의하여 정규화됨), 보존된 갈색 지방 조직과 조합된 백색 지방 조직의 감소 (체중에 의하여 정규화됨), 체지방 백분율의 감소, 식품 섭취의 증가 (체중에 의하여 정규화됨), 및 척추후만증의 증가 중 하나 이상을 포함하는, 비-인간 포유동물.
  36. 청구항 34에 있어서, 상기 비-인간 포유동물은 대사율 증가, 인슐린 민감도의 개선, 정상 글루코스 내성, 정상 혈청 콜레스테롤 수준, 정상 혈청 트리글리세라이드 수준, 및 정상 혈청 비-에스테르화 지방산 수준 중 하나 이상을 갖는, 비-인간 포유동물.
  37. 청구항 35에 있어서, 상기 증상은, 백색 지방 조직의 감소 (체중에 의하여 정규화됨)를 포함하고, 인슐린 민감도의 개선, 정상 글루코스 내성, 정상 혈청 콜레스테롤 수준, 정상 혈청 트리글리세라이드 수준, 및 정상 혈청 비-에스테르화 지방산 수준 중 적어도 하나를 포함하는, 비-인간 포유동물.
  38. 청구항 36에 있어서, 상기 증상은, 백색 지방 조직의 감소 (체중에 의하여 정규화됨) 및 인슐린 민감도의 개선를 포함하는, 비-인간 포유동물.
  39. 청구항 1 내지 38 중 어느 한 항의 비-인간 포유동물을 제조하는 방법으로서,
    (a) 1세포기 배아가 아닌 비-인간 포유동물 만능 세포의 게놈을 하기와 접촉시키는 단계:
    (i) Cas9 단백질; 및
    (ⅱ) 상기 Fbn1 유전자의 표적 게놈 좌위 내 제1 가이드 RNA 인식 서열과 혼성화하는 제1 가이드 RNA (상기 Fbn1 유전자는 상기 C-말단 절단된 Fbn1 단백질을 유발하는 상기 돌연변이를 포함하도록 변형됨);
    (b) 상기 변형된 비-인간 포유동물 만능 세포를 숙주 배아에 도입하는 단계; 및
    (c) 상기 숙주 배아를 대리모에 이식하여, 유전적으로 변형된 F0 세대 비-인간 포유동물을 생산하는 단계로서, 상기 Fbn1 유전자가 상기 C-말단 절단된 Fbn1 단백질을 유발하는 상기 돌연변이를 포함하도록 변형되는 단계 (상기 돌연변이는 상기 F0 세대 비-인간 포유동물 내 선천성 지방이영양증-유사 증상을 생성함);를 포함하는, 방법.
  40. 청구항 39에 있어서, 상기 만능 세포가 배아 줄기 (ES) 세포인, 방법.
  41. 청구항 1 내지 38 중 어느 한 항의 비-인간 포유동물을 제조하는 방법으로서,
    (a) 비-인간 포유동물 1세포기 배아의 게놈을 하기와 접촉시키는 단계:
    (i) Cas9 단백질; 및
    (ⅱ) 상기 Fbn1 유전자의 표적 게놈 좌위 내 제1 가이드 RNA 인식 서열과 혼성화하는 제1 가이드 RNA (상기 Fbn1 유전자는 상기 C-말단 절단된 Fbn1 단백질을 유발하는 상기 돌연변이를 포함하도록 변형됨); 및
    (b) 상기 변형된 비-인간 포유동물 1세포기 배아를 대리모에 이식하여, 유전적으로 변형된 F0 세대 비-인간 포유동물을 생산하는 단계로서, 상기 Fbn1 유전자가 상기 C-말단 절단된 Fbn1 단백질을 유발하는 상기 돌연변이를 포함하도록 변형되는 단계 (상기 돌연변이는 상기 F0 세대 비-인간 포유동물 내 선천성 지방이영양증-유사 증상을 생산함);를 포함하는, 방법.
  42. 청구항 39 내지 41 중 어느 한 항에 있어서, 단계 (a)는, 상기 비-인간 포유동물 만능 세포 또는 상기 비-인간 1세포기 배아의 게놈을, 상기 Fbn1 유전자에서의 상기 표적 게놈 좌위 내 제2 가이드 RNA 인식 서열과 혼성화하는 제2 가이드 RNA와 접촉시키는 것을 추가로 포함하는, 방법.
  43. 청구항 39 내지 42 중 어느 한 항에 있어서, 상기 방법은 단계 (a) 이후 및 단계 (b) 이전에, 변형된 비-인간 포유동물 만능 세포 또는 변형된 비-인간 포유동물 1세포기 배아를 선별하는 단계를 추가로 포함하되, 상기 변형된 비-인간 포유동물 만능 세포 또는 상기 변형된 비-인간 1세포기 배아는 상기 C-말단 절단된 Fbn1 단백질을 유발하는 상기 돌연변이에 대하여 이형접합자인, 방법.
  44. 청구항 39 내지 43 중 어느 한 항에 있어서, 상기 접촉 단계 (a)는, 상기 표적 게놈 좌위에서 5' 표적 서열과 혼성화하는 5' 상동성 아암, 및 상기 표적 게놈 좌위에서 3' 표적 서열과 혼성화하는 3' 상동성 아암을 포함하는 외인성 수선 주형과 상기 게놈을 접촉시키는 것을 추가로 포함하는, 방법.
  45. 청구항 44에 있어서, 상기 외인성 수선 주형이 상기 5' 상동성 아암 및 상기 3' 상동성 아암에 의해 측접된 핵산 삽입물을 추가로 포함하는, 방법.
  46. 청구항 45에 있어서, 상기 핵산 삽입물은 상기 표적 게놈 좌위에 대하여 상동성 또는 병렬상동성인, 방법.
  47. 청구항 44 내지 46 중 어느 한 항에 있어서, 상기 외인성 수선 주형은 약 50개 뉴클레오타이드 내지 약 1 kb 길이인, 방법.
  48. 청구항 47에 있어서, 상기 외인성 수선 주형은 약 80개 뉴클레오타이드 내지 약 200개 뉴클레오타이드 길이인, 방법.
  49. 청구항 44 내지 48 중 어느 한 항에 있어서, 상기 외인성 수선 주형은 단일-가닥 올리고데옥시뉴클레오타이드인, 방법.
  50. 선천성 지방이영양증-유사 증상을 완화시키기 위한 활성에 대하여 화합물을 스크리닝하는 방법으로서:
    (a) 청구항 1 내지 38 중 어느 한 항의 피험체 비-인간 포유동물을, 상기 화합물과 접촉시키는 단계; 및
    (b) 상기 화합물과 접촉되지 않은 대조군 비-인간 포유동물과 비교하여, 상기 피험체 비-인간 포유동물의 선천성 지방이영양증-유사 증상의 존재를 결정하는 단계로서, 상기 대조군 비-인간 포유동물은 상기 피험체 비-인간 포유동물과 동일한 Fbn1 돌연변이를 포함하는 단계;를 포함하되,
    이로 인해, 선천성 지방이영양증-유사 증상을 완화시키기 위한 활성이, 상기 대조군 비-인간 포유동물에 비해 상기 피험체 비-인간 포유동물에서 선천성 지방이영양증-유사 증상의 출현 감소에 의해 식별되도록 하는, 방법.
  51. 청구항 50에 있어서, 상기 증상은 체중 감소, 지방 제외 질량의 감소, 지방 질량의 감소, 백색 지방 조직의 감소 (체중에 의하여 정규화됨), 보존된 갈색 지방 조직과 조합된 백색 지방 조직의 감소 (체중에 의하여 정규화됨), 체지방 백분율의 감소, 식품 섭취의 증가 (체중에 의하여 정규화됨), 및 척추후만증의 증가 중 하나 이상을 포함하는, 방법.
  52. 청구항 51에 있어서, 상기 증상은, 백색 지방 조직의 감소 (체중에 의하여 정규화됨)을 포함하는, 방법.
KR1020197005701A 2016-07-29 2017-07-28 C-절단된 피브릴린-1의 발현을 유도하는 돌연변이를 포함하는 마우스 KR20190041476A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201662368924P 2016-07-29 2016-07-29
US62/368,924 2016-07-29
PCT/US2017/044409 WO2018023014A1 (en) 2016-07-29 2017-07-28 Mice comprising mutations resulting in expression of c-truncated fibrillin-1

Publications (1)

Publication Number Publication Date
KR20190041476A true KR20190041476A (ko) 2019-04-22

Family

ID=59656182

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020197005701A KR20190041476A (ko) 2016-07-29 2017-07-28 C-절단된 피브릴린-1의 발현을 유도하는 돌연변이를 포함하는 마우스

Country Status (14)

Country Link
US (2) US10548302B2 (ko)
EP (1) EP3490373B1 (ko)
JP (1) JP2019523009A (ko)
KR (1) KR20190041476A (ko)
CN (1) CN109803530A (ko)
AU (1) AU2017302657A1 (ko)
BR (1) BR112019001783A2 (ko)
CA (1) CA3031206A1 (ko)
ES (1) ES2965134T3 (ko)
IL (1) IL264434A (ko)
MX (1) MX2019001211A (ko)
RU (1) RU2721125C1 (ko)
SG (1) SG11201901305YA (ko)
WO (1) WO2018023014A1 (ko)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10548302B2 (en) 2016-07-29 2020-02-04 Regeneron Pharmaceuticals, Inc. Fibrillin-1 mutations for modeling neonatal progeroid syndrome with congenital lipodystrophy
CN109486944A (zh) * 2018-12-27 2019-03-19 中国医学科学院北京协和医院 基因突变作为诊断mpls标志物的应用
CN111296364B (zh) * 2019-10-27 2022-06-24 上海莱士血液制品股份有限公司 一种基因改造的小鼠动物模型基因改造方法及其应用
US11895994B2 (en) 2019-10-27 2024-02-13 Shanghai Raas Blood Products Co., Ltd. Humanized knock-in mouse expressing human Protein C
WO2021091539A1 (en) * 2019-11-05 2021-05-14 Versiti Blood Research Institute Foundation, Inc. A murine model of fetal/neonatal alloimmune thrombocytopenia
KR102356676B1 (ko) * 2020-12-10 2022-02-07 서울대학교 산학협력단 아스프로신을 포함하는 췌장암 진단용 바이오마커 및 이의 이용

Family Cites Families (72)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5723286A (en) 1990-06-20 1998-03-03 Affymax Technologies N.V. Peptide library and screening systems
CA2118806A1 (en) 1991-09-18 1993-04-01 William J. Dower Method of synthesizing diverse collections of oligomers
CA2143848C (en) 1992-10-01 2007-09-11 W. Clark Still Complex combinatorial chemical libraries encoded with tags
US5523226A (en) 1993-05-14 1996-06-04 Biotechnology Research And Development Corp. Transgenic swine compositions and methods
JPH09508353A (ja) 1993-11-02 1997-08-26 アフィマックス テクノロジーズ ナムローゼ フェンノートシャップ 分子多様性の合成及びスクリーニング
WO1995030642A1 (en) 1994-05-06 1995-11-16 Pharmacopeia, Inc. Combinatorial dihydrobenzopyran library
US5663046A (en) 1994-06-22 1997-09-02 Pharmacopeia, Inc. Synthesis of combinatorial libraries
WO1999005266A2 (en) 1997-07-26 1999-02-04 Wisconsin Alumni Research Foundation Trans-species nuclear transfer
US6599692B1 (en) 1999-09-14 2003-07-29 Sangamo Bioscience, Inc. Functional genomics using zinc finger proteins
US20030104526A1 (en) 1999-03-24 2003-06-05 Qiang Liu Position dependent recognition of GNN nucleotide triplets by zinc fingers
US6586251B2 (en) 2000-10-31 2003-07-01 Regeneron Pharmaceuticals, Inc. Methods of modifying eukaryotic cells
US7105348B2 (en) 2000-10-31 2006-09-12 Regeneron Pharmaceuticals, Inc. Methods of modifying eukaryotic cells
US20050144655A1 (en) 2000-10-31 2005-06-30 Economides Aris N. Methods of modifying eukaryotic cells
US6596541B2 (en) 2000-10-31 2003-07-22 Regeneron Pharmaceuticals, Inc. Methods of modifying eukaryotic cells
US7026462B2 (en) 2000-12-07 2006-04-11 Sangamo Biosciences, Inc. Regulation of angiogenesis with zinc finger proteins
US7947469B2 (en) 2001-01-22 2011-05-24 Gendaq, Ltd. Modulation of HIV infection
EP1353941B1 (en) 2001-01-22 2013-03-13 Sangamo BioSciences, Inc. Modified zinc finger binding proteins
AUPR451401A0 (en) 2001-04-20 2001-05-24 Monash University A method of nuclear transfer
CA2474486C (en) 2002-01-23 2013-05-14 The University Of Utah Research Foundation Targeted chromosomal mutagenesis using zinc finger nucleases
JP2005520519A (ja) 2002-03-15 2005-07-14 セレクティス ハイブリッドおよび単鎖メガヌクレアーゼならびにその使用
US20030232410A1 (en) 2002-03-21 2003-12-18 Monika Liljedahl Methods and compositions for using zinc finger endonucleases to enhance homologous recombination
US7612250B2 (en) 2002-07-29 2009-11-03 Trustees Of Tufts College Nuclear transfer embryo formation method
EP2806025B1 (en) 2002-09-05 2019-04-03 California Institute of Technology Use of zinc finger nucleases to stimulate gene targeting
WO2004031346A2 (en) 2002-09-06 2004-04-15 Fred Hutchinson Cancer Research Center Methods and compositions concerning designed highly-specific nucleic acid binding proteins
US20060248603A1 (en) 2002-12-27 2006-11-02 Applied Research Systems Ars Holding N.V. Novel fibrillin-like polypeptides
US8409861B2 (en) 2003-08-08 2013-04-02 Sangamo Biosciences, Inc. Targeted deletion of cellular DNA sequences
US7888121B2 (en) 2003-08-08 2011-02-15 Sangamo Biosciences, Inc. Methods and compositions for targeted cleavage and recombination
EP1591521A1 (en) 2004-04-30 2005-11-02 Cellectis I-Dmo I derivatives with enhanced activity at 37 degrees C and use thereof
CA2579677A1 (en) 2004-09-16 2006-03-30 Sangamo Biosciences, Inc. Compositions and methods for protein production
WO2006044962A1 (en) 2004-10-19 2006-04-27 Regeneron Pharmaceuticals, Inc. Method for generating an animal homozygous for a genetic modification
WO2006097784A1 (en) 2005-03-15 2006-09-21 Cellectis I-crei meganuclease variants with modified specificity, method of preparation and uses thereof
US20110158974A1 (en) 2005-03-15 2011-06-30 Cellectis Heterodimeric Meganucleases and Use Thereof
CN101117633B (zh) 2006-08-03 2011-07-20 上海交通大学附属儿童医院 一种细胞核移植方法
SI2415872T1 (sl) 2006-12-14 2016-09-30 Dow Agrosciences Llc Optimizirani nekanonični proteini s cinkovim prstom
KR20100120226A (ko) 2008-04-11 2010-11-12 유티씨 파워 코포레이션 매니폴드 섬프를 갖는 바이폴라 플레이트 및 연료 전지
EP2206723A1 (en) 2009-01-12 2010-07-14 Bonas, Ulla Modular DNA-binding domains
US20110239315A1 (en) 2009-01-12 2011-09-29 Ulla Bonas Modular dna-binding domains and methods of use
CA2755192C (en) 2009-03-20 2018-09-11 Sangamo Biosciences, Inc. Modification of cxcr4 using engineered zinc finger proteins
US8772008B2 (en) 2009-05-18 2014-07-08 Sangamo Biosciences, Inc. Methods and compositions for increasing nuclease activity
RU2425880C2 (ru) * 2009-07-30 2011-08-10 Учреждение Российской академии наук Институт общей генетики им. Н.И. Вавилова РАН Способ получения трансгенных мышей
US20120178647A1 (en) 2009-08-03 2012-07-12 The General Hospital Corporation Engineering of zinc finger arrays by context-dependent assembly
US8354389B2 (en) 2009-08-14 2013-01-15 Regeneron Pharmaceuticals, Inc. miRNA-regulated differentiation-dependent self-deleting cassette
CA2779858C (en) 2009-10-29 2019-10-29 Aris N. Economides Multifunctional alleles
SG181601A1 (en) 2009-12-10 2012-07-30 Univ Minnesota Tal effector-mediated dna modification
US9637739B2 (en) 2012-03-20 2017-05-02 Vilnius University RNA-directed DNA cleavage by the Cas9-crRNA complex
WO2013141680A1 (en) 2012-03-20 2013-09-26 Vilnius University RNA-DIRECTED DNA CLEAVAGE BY THE Cas9-crRNA COMPLEX
LT3401400T (lt) 2012-05-25 2019-06-10 The Regents Of The University Of California Būdai ir kompozicijos, skirtos rnr molekulės nukreipiamai tikslinės dnr modifikacijai ir rnr molekulės nukreipiamam transkripcijos moduliavimui
WO2014033644A2 (en) 2012-08-28 2014-03-06 Novartis Ag Methods of nuclease-based genetic engineering
DE202013012597U1 (de) 2012-10-23 2017-11-21 Toolgen, Inc. Zusammensetzung zum Spalten einer Ziel-DNA, umfassend eine für die Ziel-DNA spezifische guide-RNA und eine Cas-Protein-codierende Nukleinsäure oder ein Cas-Protein, sowie deren Verwendung
EP3138911B1 (en) 2012-12-06 2018-12-05 Sigma Aldrich Co. LLC Crispr-based genome modification and regulation
ES2658401T3 (es) 2012-12-12 2018-03-09 The Broad Institute, Inc. Suministro, modificación y optimización de sistemas, métodos y composiciones para la manipulación de secuencias y aplicaciones terapéuticas
US8697359B1 (en) 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
EP2931899A1 (en) 2012-12-12 2015-10-21 The Broad Institute, Inc. Functional genomics using crispr-cas systems, compositions, methods, knock out libraries and applications thereof
CA3081054A1 (en) 2012-12-17 2014-06-26 President And Fellows Of Harvard College Rna-guided human genome engineering
EP3561050B1 (en) 2013-02-20 2021-12-08 Regeneron Pharmaceuticals, Inc. Genetic modification of rats
WO2014131833A1 (en) 2013-02-27 2014-09-04 Helmholtz Zentrum München Deutsches Forschungszentrum Für Gesundheit Und Umwelt (Gmbh) Gene editing in the oocyte by cas9 nucleases
CA2906553C (en) 2013-03-15 2022-08-02 The General Hospital Corporation Rna-guided targeting of genetic and epigenomic regulatory proteins to specific genomic loci
EP4286517A3 (en) 2013-04-04 2024-03-13 President and Fellows of Harvard College Therapeutic uses of genome editing with crispr/cas systems
BR112015026197B1 (pt) 2013-04-16 2022-12-06 Regeneron Pharmaceuticals, Inc Método para modificação marcada de um lócus genômico de interesse em uma célula de rato pluripotente
CA2910427C (en) 2013-05-10 2024-02-20 Sangamo Biosciences, Inc. Delivery methods and compositions for nuclease-mediated genome engineering
WO2014204727A1 (en) 2013-06-17 2014-12-24 The Broad Institute Inc. Functional genomics using crispr-cas systems, compositions methods, screens and applications thereof
CN105899665B (zh) 2013-10-17 2019-10-22 桑格摩生物科学股份有限公司 用于核酸酶介导的基因组工程改造的递送方法和组合物
WO2015065964A1 (en) 2013-10-28 2015-05-07 The Broad Institute Inc. Functional genomics using crispr-cas systems, compositions, methods, screens and applications thereof
AU2014357521B2 (en) 2013-12-02 2018-10-11 Baylor College Of Medicine Identification of a new polypeptide hormone for maintenance of optimal body weight and blood glucose
RU2685914C1 (ru) 2013-12-11 2019-04-23 Регенерон Фармасьютикалс, Инк. Способы и композиции для направленной модификации генома
JP6606088B2 (ja) 2014-02-24 2019-11-13 サンガモ セラピューティクス, インコーポレイテッド ヌクレアーゼ媒介性標的化組み込みのための方法および組成物
CA2952697A1 (en) 2014-06-16 2015-12-23 The Johns Hopkins University Compositions and methods for the expression of crispr guide rnas using the h1 promoter
PL3155099T3 (pl) 2014-06-23 2018-08-31 Regeneron Pharmaceuticals, Inc. Łączenie dna mediowane nukleazą
DK3161128T3 (en) 2014-06-26 2018-11-05 Regeneron Pharma METHODS AND COMPOSITIONS FOR TARGETED GENTICAL MODIFICATIONS AND PROCEDURES FOR USE THEREOF
WO2016011080A2 (en) 2014-07-14 2016-01-21 The Regents Of The University Of California Crispr/cas transcriptional modulation
LT3221457T (lt) 2014-11-21 2019-06-10 Regeneron Pharmaceuticals, Inc. Nukreipiančios genetinės modifikacijos būdai ir kompozicijos, naudojant suporuotas kreipiančiąsias rnr sekas
US10548302B2 (en) 2016-07-29 2020-02-04 Regeneron Pharmaceuticals, Inc. Fibrillin-1 mutations for modeling neonatal progeroid syndrome with congenital lipodystrophy

Also Published As

Publication number Publication date
EP3490373B1 (en) 2023-10-25
CA3031206A1 (en) 2018-02-01
EP3490373C0 (en) 2023-10-25
EP3490373A1 (en) 2019-06-05
US11730150B2 (en) 2023-08-22
US20180027782A1 (en) 2018-02-01
ES2965134T3 (es) 2024-04-11
MX2019001211A (es) 2019-09-16
IL264434A (en) 2019-02-28
CN109803530A (zh) 2019-05-24
WO2018023014A1 (en) 2018-02-01
RU2721125C1 (ru) 2020-05-18
SG11201901305YA (en) 2019-03-28
JP2019523009A (ja) 2019-08-22
US10548302B2 (en) 2020-02-04
US20200107527A1 (en) 2020-04-09
AU2017302657A1 (en) 2019-02-14
BR112019001783A2 (pt) 2019-05-07

Similar Documents

Publication Publication Date Title
JP6889762B2 (ja) 標的化された遺伝子修飾のための方法及び組成物、並びに使用方法
JP7095066B2 (ja) 単一ステップの複数標的化を通じた標的化された遺伝子修飾のための方法及び組成物
US11730150B2 (en) Fibrillin-1 mutations for modeling neonatal progeroid syndrome with congenital lipodystrophy
JP6336140B2 (ja) ヌクレアーゼ媒介dnaアセンブリ
RU2771374C1 (ru) Способы для бесшовного внесения целевых модификаций в направленные векторы
NZ765592B2 (en) Methods and compositions for targeted genetic modifications and methods of use

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application