KR20210096088A - 전이유전자 전달용 조성물 및 방법 - Google Patents

전이유전자 전달용 조성물 및 방법 Download PDF

Info

Publication number
KR20210096088A
KR20210096088A KR1020217014866A KR20217014866A KR20210096088A KR 20210096088 A KR20210096088 A KR 20210096088A KR 1020217014866 A KR1020217014866 A KR 1020217014866A KR 20217014866 A KR20217014866 A KR 20217014866A KR 20210096088 A KR20210096088 A KR 20210096088A
Authority
KR
South Korea
Prior art keywords
grna
nucleic acid
sequence
dna endonuclease
cell
Prior art date
Application number
KR1020217014866A
Other languages
English (en)
Inventor
앨런 리차드 브룩스
카렌 보
Original Assignee
크리스퍼 테라퓨틱스 아게
바이엘 헬쓰케어 엘엘씨
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 크리스퍼 테라퓨틱스 아게, 바이엘 헬쓰케어 엘엘씨 filed Critical 크리스퍼 테라퓨틱스 아게
Publication of KR20210096088A publication Critical patent/KR20210096088A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P7/00Drugs for disorders of the blood or the extracellular fluid
    • A61P7/04Antihaemorrhagics; Procoagulants; Haemostatic agents; Antifibrinolytic agents
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/745Blood coagulation or fibrinolysis factors
    • C07K14/755Factors VIII, e.g. factor VIII C (AHF), factor VIII Ag (VWF)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/81Protease inhibitors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/48Hydrolases (3) acting on peptide bonds (3.4)
    • C12N9/50Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
    • C12N9/64Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from animal tissue
    • C12N9/6421Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from animal tissue from mammals
    • C12N9/6424Serine endopeptidases (3.4.21)
    • C12N9/644Coagulation factor IXa (3.4.21.22)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y304/00Hydrolases acting on peptide bonds, i.e. peptidases (3.4)
    • C12Y304/21Serine endopeptidases (3.4.21)
    • C12Y304/21022Coagulation factor IXa (3.4.21.22)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Hematology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Cell Biology (AREA)
  • Mycology (AREA)
  • Toxicology (AREA)
  • Epidemiology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Diabetes (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Medicinal Preparation (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)

Abstract

표적 세포로의 DNA 및 RNA를 포함한 핵산의 표적화된 전달을 위한 조성물, 방법, 및 시스템이 본원에 제공된다. 또한, 게놈 편집에 의해 세포에서 이식유전자를 발현시키기 위한 조성물, 방법, 및 시스템이 제공된다. 게놈 내 표적 게놈 좌위(locus), 특히 알부민 유전자의 좌위 내로 관심 유전자(GOI: gene-of-interest)에서 넉킹(knocking)하기 위한 조성물, 방법, 및 시스템이 추가로 제공된다. 또한, 생체외(ex vivo) 및/또는 생체내(in vivo) 게놈 편집을 이용하는 장애 또는 건강상 병태를 갖거나 갖는 것으로 의심되는 대상체를 치료하기 위한 조성물, 방법, 및 시스템이 추가로 제공된다.

Description

이식유전자를 전달하기 위한 조성물 및 방법
관련 출원의 교차 참조
본 출원은 2018년 10월 17일에 출원된 미국 임시특허출원 일련번호 62/747,128호에 대해 우선권의 이익을 주장하며, 이는 임의의 도면을 포함하여 그 전체가 참조로서 명백하게 본원에 포함된다.
서열 목록의 포함
첨부된 서열 목록의 물질은 본 출원에 참조로서 본원에 포함된다. 052984-535001WO_Sequence Listing.txt 명칭의 첨부된 서열 목록 텍스트 파일은 2019년 10월 8일에 생성되었고, 125 KB이다.
기술분야
본 개시내용은 예를 들어, 인간 세포와 같은 표적 세포로의 핵산의 표적화된 전달을 위한 조성물, 방법, 및 시스템을 제공한다. 본 발명의 일부 구현예는 세포에서 게놈 편집에 의해 이식유전자를 발현시키기 위한 조성물, 방법, 및 시스템에 관한 것이다.
게놈 시퀀싱 기법 및 분석 방법에서의 최근의 발전은 다양한 범위의 생물학적 기능 및 질환과 관련된 유전적 인자를 카탈로그화(catalog)하고 맵핑(map)하는 능력을 유의하게 가속화시켰다. 정밀한 게놈 표적화 기법은 개별적인 유전적 요소의 선택적인 동요를 가능하게 함으로써 인과적인 유전적 변이의 전신적인 가역적 조작을 가능하게 하기 위해, 뿐만 아니라 합성 생물학, 생물공학, 및 의학 적용을 발전시키기 위해 필요하다.
최근, 설계된 부위-특이적 뉴클레아제를 사용하는 유전자 편집은 생물의학적 연구와 치료적 개발 둘 다를 위한 기술로서 출현하였다. 최근 수년 이내에, 4개의 주요 유형의 엔도뉴클레아제, 즉, 메가뉴클레아제 및 이의 유도체, 아연 핑거 뉴클레아제(ZFN: zinc finger nuclease), 전사 활성자-유사 이펙터 뉴클레아제(TALEN: transcription activator-like effector nuclease), 및 엔도뉴클레아제 9와 관련된 일정한 간격을 두고 주기적으로 분포하는 짧은 회문 반복부(CRISPR: clustered regularly interspaced short palindromic repeat)(cas9)에 기초한 다양한 플랫폼이 유전자 편집을 위해 개발되었다. 각각의 뉴클레아제 유형은 특이적인 DNA 좌위(loci)에서 DNA 이중-가닥 절단부(DSB: double-stranded break)를 포함할 수 있어서, 2개의 DNA 수선 경로를 촉발할 수 있다. 비-상동 말단 연결(NHEJ: non-homologous end joining) 경로는 DSB에서 무작위 삽입/결실(indel: insertion/deletion) 돌연변이를 생성시키는 반면, 상동성-지향 수선(HDR: homology-directed repair) 경로는 공여체 주형 상에서 운반되는 유전 정보로 DSB를 수선한다. 따라서, 이들 유전자 편집 플랫폼은 다수의 방식으로, 예컨대 유전자 기능을 교란시키며, 돌연변이체 유전자를 정상으로 수선하고, DNA 물질을 삽입시켜, 특이적인 게놈 좌위에서 유전자를 조작할 수 있다.
그러나, 현재 이용 가능한 게놈 편집 기법은 많은 단점, 예를 들어, 정확도, 표적외(off-target) 편집의 허용 불가능한 수준 등을 겪을 수 있다. 이에, 다수의 방식으로, 예컨대 유전자 기능을 교란시키며, 돌연변이체 유전자를 정상으로 수선하고/거나 이종성 DNA 물질을 특이적인 좌위, 예컨대 표적 세포의 게놈 내의 안전한 보유(harbor) 좌위에서 삽입시켜, 특이적인 게놈 좌위에서 유전자를 조작할 수 있는 새로운 게놈 유전자 편집 플랫폼에 대한 필요성이 남아 있다.
특히, 표적 세포, 예를 들어, 인간 세포로의 DNA 및 RNA를 포함한 핵산의 표적화된 전달을 위한 조성물, 방법, 및 시스템이 본원에 제공된다. 또한, 게놈 편집에 의해 표적화된 방식으로 이식유전자를 세포의 게놈 내로 통합함으로써 세포에서 이식유전자를 발현시키기 위한 조성물, 방법, 및 시스템이 제공된다. 개시내용의 소정의 양태 및 구현예는 게놈 내에서, 특히 내인성 알부민 좌위(locus) 내의 또는 그 부근의 게놈 위치에 대해 특정한 안전한 보유 위치 내로 관심 유전자(GOI: gene-of-interest)에서 넉킹(knocking)하기 위한 조성물, 방법, 및 시스템에 관한 것이다. 생체외(ex vivo) 및/또는 생체내(in vivo) 게놈 편집을 이용하는 장애 또는 건강상 병태를 갖거나 갖는 것으로 의심되는 대상체를 치료하기 위한 조성물, 방법, 및 시스템이 추가로 제공된다.
일 양태에서, 내인성 알부민 좌위 내의 또는 그 근처의 게놈 서열에 상보적인 서열을 갖는 가이드 RNA(gRNA) 서열이 본원에 제공된다.
일부 구현예에서, gRNA는 표 3에 나열된 것들로부터 선택되는 서열 및 표 3에 나열된 임의의 것들에 대해 적어도 85% 상동성을 갖는 이의 변이체를 갖는다.
또 다른 양태에서, 임의의 상기 언급된 gRNA를 갖는 조성물이 본원에 제공된다.
일 양태에서, 본원에 개시된 바와 같은 가이드 RNA(gRNA: guide RNA) 및 상기 gRNA를 인코딩하는 핵산을 포함하는 시스템이 본원에 제공된다. 일부 구현예에서, 시스템의 gRNA는 표 3에 나열된 것들로부터 선택되는 서열 및 표 3에 나열된 임의의 것들에 대해 적어도 85% 상동성을 갖는 이의 변이체를 갖는다.
일부 구현예에서, 상기 시스템은 추가로, 데옥시리보핵산(DNA) 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산; 및 관심 유전자(GOI) 또는 이의 기능적 유도체를 인코딩하는 핵산 서열을 갖는 공여체 주형 중 하나 이상을 갖는다. 일부 구현예에서, gRNA는 서열번호 22, 21, 28, 및 30 중 임의의 하나로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 서열번호 22로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 서열번호 21로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 서열번호 28로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 서열번호 30으로부터의 스페이서 서열을 포함한다.
일부 구현예에서, DNA 엔도뉴클레아제는 서열 NGG 또는 NNGG를 갖는 프로토스페이서 인접 모티프(PAM: protospacer adjacent motif); 또는 이의 기능적 유도체를 인식하며, 여기서 N은 임의의 뉴클레오타이드 또는 이의 기능적 유도체이다. 일부 구현예에서, DNA 엔도뉴클레아제는 II형 Cas 엔도뉴클레아제 또는 이의 기능적 유도체이다.
일부 구현예에서, DNA 엔도뉴클레아제는 Cas9이다. 일부 구현예에서, Cas9는 스트렙토콕커스 파이오게네스(Streptococcus pyogenes)(spCas9)로부터의 것이다. 일부 구현예에서, Cas9는 스타필로콕커스 루그두넨시스(Staphylococcus lugdunensis)(SluCas9)로부터의 것이다.
일부 구현예에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 숙주 세포에서의 발현을 위해 코돈 최적화된다.
일부 구현예에서, 관심 유전자(GOI)를 인코딩하는 핵산 서열은 숙주 세포에서 발현을 위해 코돈 최적화된다. 일부 구현예에서, GOI는 치료적 폴리펩타이드 및 예방적 폴리펩타이드로 이루어진 군으로부터 선택되는 폴리펩타이드를 인코딩한다. 일부 구현예에서, GOI는 인자 VIII(FVIII) 단백질, 인자 IX 단백질, 알파-1-항트립신, 인자 XIII(FXIII) 단백질, 인자 VII(FVII) 단백질, 인자 X(FX) 단백질, 단백질 C, 세린 프로테아제 저해제 G1(세르핀 G1), 또는 이의 임의의 기능적 유도체로 이루어진 군으로부터 선택되는 단백질을 인코딩한다. 일부 구현예에서, GOI는 FVIII 단백질 또는 이의 기능적 유도체를 인코딩한다. 일부 구현예에서, GOI는 FIX 단백질 또는 이의 기능적 유도체를 인코딩한다. 일부 구현예에서, GOI는 세르핀 G1 단백질 또는 이의 기능적 유도체를 인코딩한다.
일부 구현예에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 데옥시리보핵산(DNA) 서열이다.
일부 구현예에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 리보핵산(RNA) 서열이다.
일부 구현예에서, DNA 엔도뉴클레아제를 인코딩하는 RNA 서열은 공유 결합을 통해 gRNA에 연결된다.
일부 구현예에서, 상기 조성물은 추가로 리포솜 또는 지질 나노입자를 가진다.
일부 구현예에서, 공여체 주형은 아데노 관련 바이러스(AAV: Adeno Associated Virus) 벡터에서 인코딩된다.
일부 구현예에서, DNA 엔도뉴클레아제는 리포솜 또는 지질 나노입자에서 제형화된다.
일부 구현예에서, 리포솜 또는 지질 나노입자는 또한 gRNA를 가진다.
일부 구현예에서, DNA 엔도뉴클레아제는 gRNA와 예비복합체화되어, 리보뉴클레오단백질(RNP) 복합체를 형성한다.
또 다른 양태에서, 상기 기재된 임의의 조성물을 갖고 사용 설명서를 추가로 갖는 키트가 본원에 제공된다.
또 다른 양태에서, 세포에서 게놈을 편집하는 방법이 본원에 제공된다. 상기 방법은 세포에 (a) 본원에 기재된 임의의 gRNA 또는 상기 gRNA를 인코딩하는 핵산; (b) 데옥시리보핵산(DNA) 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산; 및 (c) 관심 유전자(GOI) 또는 기능적 유도체를 인코딩하는 핵산 서열을 갖는 공여체 주형을 제공하는 단계를 포함한다. 일부 구현예에서, gRNA는 서열번호 22, 21, 28, 및 30 중 임의의 하나로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 서열번호 21로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 서열번호 22로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 서열번호 28로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 서열번호 30으로부터의 스페이서 서열을 포함한다.
일부 구현예에서, gRNA는 표 3에 나열된 것들로부터 선택되는 서열 및 표 3에 나열된 임의의 것들에 대해 적어도 85% 상동성을 갖는 이의 변이체를 갖는다.
일부 구현예에서, DNA 엔도뉴클레아제는 서열 NGG 또는 NNGG를 갖는 프로토스페이서 인접 모티프(PAM: protospacer adjacent motif); 또는 이의 기능적 유도체를 인식하며, 여기서 N은 임의의 뉴클레오타이드이다. 일부 구현예에서, DNA 엔도뉴클레아제는 II형 Cas 엔도뉴클레아제 또는 이의 기능적 유도체이다.
일부 구현예에서, DNA 엔도뉴클레아제는 Cas9이다. 일부 구현예에서, Cas9는 스트렙토콕커스 파이오게네스(spCas9)로부터의 것이다. 일부 구현예에서, Cas9는 스타필로콕커스 루그두넨시스(SluCas9)로부터의 것이다.
일부 구현예에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 코돈 최적화된다.
일부 구현예에서, 관심 유전자(GOI)를 인코딩하는 핵산 서열은 코돈 최적화된다. 일부 구현예에서, GOI는 치료적 폴리펩타이드 및 예방적 폴리펩타이드로 이루어진 군으로부터 선택되는 폴리펩타이드를 인코딩한다. 일부 구현예에서, GOI는 FVIII 단백질, FIX 단백질, 알파-1-항트립신, FXIII 단백질, FVII 단백질, FX 단백질, 단백질 C, 세르핀 G1, 또는 이의 임의의 기능적 유도체로 이루어진 군으로부터 선택되는 단백질을 인코딩한다.
일부 구현예에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 데옥시리보핵산(DNA) 서열이다.
일부 구현예에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 리보핵산(RNA) 서열이다.
일부 구현예에서, DNA 엔도뉴클레아제를 인코딩하는 RNA 서열은 공유 결합을 통해 gRNA에 연결된다.
일부 구현예에서, 공여체 주형은 AAV 벡터에서 인코딩된다.
일부 구현예에서, (a), (b) 및 (c) 중 하나 이상이 리포솜 또는 지질 나노입자에서 제형화된다.
일부 구현예에서, DNA 엔도뉴클레아제는 리포솜 또는 지질 나노입자에서 제형화된다.
일부 구현예에서, 리포솜 또는 지질 나노입자는 또한 gRNA를 가진다.
일부 구현예에서, DNA 엔도뉴클레아제는 세포에 제공되기 전에 gRNA와 예비복합체화되어, RNP 복합체를 형성한다.
일부 구현예에서, (a) 및 (b)는 (c)가 세포에 제공된 후 상기 세포에 제공된다.
일부 구현예에서, (a) 및 (b)는 (c)가 세포에 제공된 후 약 1 내지 14일째에 상기 세포에 제공된다.
일부 구현예에서, 관심 유전자(GOI)를 인코딩하는 핵산 서열은 세포의 게놈 서열 내로 삽입된다.
일부 구현예에서, 삽입은 세포의 게놈 내 알부민 유전자 또는 알부민 유전자 조절 요소에, 그 안에, 또는 그 부근에 존재한다.
일부 구현예에서, 삽입은 알부민 유전자의 제1 인트론 내에 존재한다.
일부 구현예에서, 삽입은 게놈 내 인간 알부민 유전자의 제1 엑손의 단부의 적어도 37 bp 다운스트림 및 게놈 내 인간 알부민 유전자의 제2 엑손의 출발의 적어도 330 bp 업스트림이다.
일부 구현예에서, 관심 유전자를 인코딩하는 핵산 서열은 내인성 알부민 프로모터의 제어 하에 발현된다.
일부 구현예에서, 세포는 간세포이다.
또 다른 양태에서, 세포의 게놈이 임의의 상기 기재된 방법에 의해 편집되는, 유전적으로 변형된 세포가 본원에 제공된다.
일부 구현예에서, 관심 유전자를 인코딩하는 핵산 서열은 세포의 게놈 서열 내로 삽입된다.
일부 구현예에서, 삽입은 세포의 게놈 내 알부민 유전자 또는 알부민 유전자 조절 요소에, 그 안에, 또는 그 부근에 존재한다.
일부 구현예에서, 삽입은 알부민 유전자의 제1 인트론 내에 존재한다.
일부 구현예에서, 삽입은 게놈 내 인간 알부민 유전자의 제1 엑손의 단부의 적어도 37 bp 다운스트림 및 게놈 내 인간 알부민 유전자의 제2 엑손의 출발의 적어도 330 bp 업스트림이다.
일부 구현예에서, 관심 유전자를 인코딩하는 핵산 서열은 내인성 알부민 프로모터의 제어 하에 발현된다.
일부 구현예에서, 관심 유전자를 인코딩하는 핵산 서열은 코돈 최적화된다.
일부 구현예에서, 세포는 간세포이다.
또 다른 양태에서, 대상체에서 장애 또는 건강상 병태를 치료하는 방법이 본원에 제공된다. 상기 방법은 임의의 상기 언급된 유전적으로 변형된 세포를 상기 대상체에게 투여하는 단계를 포함한다.
일부 구현예에서, 대상체는 A형 혈우병, B형 혈우병, 또는 HAE를 갖고 있거나 갖는 것으로 의심되는 환자이다.
일부 구현예에서, 대상체는 A형 혈우병, B형 혈우병, 또는 HAE의 위험이 있는 것으로 진단된다.
일부 구현예에서, 유전적으로 변형된 세포는 자기유래(autologous)이다.
일부 구현예에서, 세포는 간세포이다.
일부 구현예에서, 관심 유전자를 인코딩하는 핵산 서열은 세포의 게놈 서열 내로 삽입된다.
일부 구현예에서, 삽입은 세포의 게놈 내 알부민 유전자 또는 알부민 유전자 조절 요소에, 그 안에, 또는 그 부근에 존재한다.
일부 구현예에서, 삽입은 알부민 유전자의 제1 인트론 내에 존재한다.
일부 구현예에서, 삽입은 게놈 내 인간 알부민 유전자의 제1 엑손의 단부의 적어도 37 bp 다운스트림 및 게놈 내 인간 알부민 유전자의 제2 엑손의 출발의 적어도 330 bp 업스트림이다.
일부 구현예에서, 관심 유전자를 인코딩하는 핵산 서열은 내인성 알부민 프로모터의 제어 하에 발현된다.
일부 구현예에서, 상기 방법은, 대상체로부터 생물학적 시료를 수득하는 단계로서, 상기 생물학적 시료는 간세포의 세포(hepatocyte cell)를 갖는 단계, 및 관심 유전자를 인코딩하는 핵산 서열을 세포의 게놈 서열 내로 삽입함으로써 간세포의 세포의 게놈을 편집하여 유전적으로 변형된 세포를 생성하는 단계를 추가로 갖는다.
또 다른 양태에서, 대상체에서 장애 또는 건강상 병태를 치료하는 방법이 본원에 제공된다. 상기 방법은, 대상체로부터 생물학적 시료를 수득하는 단계로서, 상기 생물학적 시료는 간세포의 세포를 갖는 단계, 상기 간세포의 세포에 (a) 상기 기재된 임의의 gRNA 또는 상기 gRNA를 인코딩하는 핵산; (b) 데옥시리보핵산(DNA) 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산; 및 (c) 관심 유전자(GOI) 또는 기능적 유도체를 인코딩하는 핵산 서열을 갖는 공여체 주형을 제공하여 유전적으로 변형된 세포를 생성하는 단계, 및 상기 유전적으로 변형된 세포를 상기 대상체에게 투여하는 단계를 포함한다.
일부 구현예에서, 상기 대상체는 FVIII 결핍(A형 혈우병), FIX 결핍(B형 혈우병), 헌터 증후군(Hunters Syndrome)(MPS II), 헐러 증후군(Hurlers Syndrome)(MPS1H), 알파-1-항트립신 결핍, FXIII 결핍, FVII 결핍, FX 결핍, 단백질 C 결핍, 및 유전성 혈관부종(HAE: hereditary angioedema)으로 이루어진 군으로부터 선택되는 장애 또는 건강상 병태를 갖고 있거나 갖는 것으로 의심되는 환자이다. 일부 구현예에서, 대상체는 A형 혈우병을 갖고 있거나 갖는 것으로 의심되는 환자이다. 일부 구현예에서, 대상체는 B형 혈우병을 갖고 있거나 갖는 것으로 의심되는 환자이다. 일부 구현예에서, 대상체는 HAE를 갖고 있거나 갖는 것으로 의심되는 환자이다.
일부 구현예에서, 상기 대상체는 A형 혈우병, B형 혈우병, MPS II, MPS1H, 알파-1-항트립신 결핍, FXIII 결핍, FVII 결핍, FX 결핍, 단백질 C 결핍, 및 HAE로 이루어진 군으로부터 선택되는 장애 또는 건강상 병태의 위험이 있는 것으로 진단된다. 일부 구현예에서, 대상체는 A형 혈우병의 위험이 있는 것으로 진단된다. 일부 구현예에서, 대상체는 B형 혈우병의 위험이 있는 것으로 진단된다. 일부 구현예에서, 대상체는 HAE의 위험이 있는 것으로 진단된다.
일부 구현예에서, 유전적으로 변형된 세포는 자기유래이다.
일부 구현예에서, gRNA는 표 3에 나열된 것들로부터 선택되는 서열 및 표 3에 나열된 임의의 것들에 대해 적어도 85% 상동성을 갖는 이의 변이체를 갖는다.
일부 구현예에서, DNA 엔도뉴클레아제는 서열 NGG 또는 NNGG를 갖는 프로토스페이서 인접 모티프(PAM); 또는 이의 기능적 유도체를 인식하며, 여기서 N은 임의의 뉴클레오타이드이다. 일부 구현예에서, DNA 엔도뉴클레아제는 II형 Cas 엔도뉴클레아제 또는 이의 기능적 유도체이다.
일부 구현예에서, DNA 엔도뉴클레아제는 Cas9이다. 일부 구현예에서, Cas9는 스트렙토콕커스 파이오게네스(spCas9)로부터의 것이다. 일부 구현예에서, Cas9는 스타필로콕커스 루그두넨시스(SluCas9)로부터의 것이다.
일부 구현예에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 코돈 최적화된다.
일부 구현예에서, 관심 유전자(GOI) 또는 이의 기능적 유도체를 인코딩하는 핵산 서열은 코돈 최적화된다.
일부 구현예에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 데옥시리보핵산(DNA) 서열이다.
일부 구현예에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 리보핵산(RNA) 서열이다.
일부 구현예에서, DNA 엔도뉴클레아제를 인코딩하는 RNA 서열은 공유 결합을 통해 gRNA에 연결된다.
일부 구현예에서, (a), (b) 및 (c) 중 하나 이상이 리포솜 또는 지질 나노입자에서 제형화된다.
일부 구현예에서, 공여체 주형은 AAV 벡터에서 인코딩된다.
일부 구현예에서, DNA 엔도뉴클레아제는 리포솜 또는 지질 나노입자에서 제형화된다.
일부 구현예에서, 리포솜 또는 지질 나노입자는 또한 gRNA를 가진다.
일부 구현예에서, DNA 엔도뉴클레아제는 세포에 제공되기 전에 gRNA와 예비복합체화되어, RNP 복합체를 형성한다.
일부 구현예에서, (a) 및 (b)는 (c)가 세포에 제공된 후 상기 세포에 제공된다.
일부 구현예에서, (a) 및 (b)는 (c)가 세포에 제공된 후 약 1 내지 14일째에 상기 세포에 제공된다.
일부 구현예에서, (GOI) 또는 이의 기능적 유도체를 인코딩하는 핵산 서열은 세포의 게놈 서열 내로 삽입된다.
일부 구현예에서, 삽입은 세포의 게놈 내 알부민 유전자 또는 알부민 유전자 조절 요소에, 그 안에, 또는 그 부근에 존재한다.
일부 구현예에서, 삽입은 알부민 유전자의 제1 인트론 내에 존재한다.
일부 구현예에서, 삽입은 게놈 내 인간 알부민 유전자의 제1 엑손의 단부의 적어도 37 bp 다운스트림 및 게놈 내 인간 알부민 유전자의 제2 엑손의 출발의 적어도 330 bp 업스트림이다.
일부 구현예에서, (GOI) 또는 이의 기능적 유도체를 인코딩하는 핵산 서열은 내인성 알부민 프로모터의 제어 하에 발현된다.
일부 구현예에서, 세포는 간세포이다.
일부 구현예에서, 대상체에서 A형 혈우병, B형 혈우병, MPS II, MPS1H, 알파-1-항트립신 결핍, FXIII 결핍, FVII 결핍, FX 결핍, 단백질 C 결핍, 및 HAE로 이루어진 군으로부터 선택되는 장애 또는 건강상 병태를 치료하는 방법이 본원에 제공된다. 상기 방법은 대상체 내의 세포에 (a) 상기 기재된 임의의 gRNA; (b) 데옥시리보핵산(DNA) 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산; 및 (c) 관심 유전자(GOI) 또는 기능적 유도체를 인코딩하는 핵산 서열을 갖는 공여체 주형을 제공하는 단계를 갖는다.
일부 구현예에서, 상기 대상체는 A형 혈우병, B형 혈우병, MPS II, MPS1H, 알파-1-항트립신 결핍, FXIII 결핍, FVII 결핍, FX 결핍, 단백질 C 결핍, 및 HAE로 이루어진 군으로부터 선택되는 장애 또는 건강상 병태를 갖고 있거나 갖는 것으로 의심되는 환자이다.
일부 구현예에서, 상기 대상체는 A형 혈우병, B형 혈우병, MPS II, MPS1H, 알파-1-항트립신 결핍, FXIII 결핍, FVII 결핍, FX 결핍, 단백질 C 결핍, 및 HAE로 이루어진 군으로부터 선택되는 장애 또는 건강상 병태의 위험이 있는 것으로 진단된다.
일부 구현예에서, gRNA는 표 3에 나열된 것들로부터 선택되는 서열 및 표 3에 나열된 임의의 것들에 대해 적어도 85% 상동성을 갖는 이의 변이체를 갖는다.
일부 구현예에서, DNA 엔도뉴클레아제는 서열 NGG 또는 NNGG를 갖는 프로토스페이서 인접 모티프(PAM); 또는 이의 기능적 유도체를 인식하며, 여기서 N은 임의의 뉴클레오타이드이다. 일부 구현예에서, DNA 엔도뉴클레아제는 II형 Cas 엔도뉴클레아제 또는 이의 기능적 유도체이다.
일부 구현예에서, DNA 엔도뉴클레아제는 Cas9이다. 일부 구현예에서, Cas9는 스트렙토콕커스 파이오게네스(spCas9)로부터의 것이다. 일부 구현예에서, Cas9는 스타필로콕커스 루그두넨시스(SluCas9)로부터의 것이다.
일부 구현예에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 코돈 최적화된다.
일부 구현예에서, GOI 또는 이의 기능적 유도체를 인코딩하는 핵산 서열은 코돈 최적화된다.
일부 구현예에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 데옥시리보핵산(DNA) 서열이다.
일부 구현예에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 리보핵산(RNA) 서열이다.
일부 구현예에서, DNA 엔도뉴클레아제를 인코딩하는 RNA 서열은 공유 결합을 통해 gRNA에 연결된다.
일부 구현예에서, (a), (b) 및 (c) 중 하나 이상이 리포솜 또는 지질 나노입자에서 제형화된다.
일부 구현예에서, 공여체 주형은 AAV 벡터에서 인코딩된다.
일부 구현예에서, DNA 엔도뉴클레아제는 리포솜 또는 지질 나노입자에서 제형화된다.
일부 구현예에서, 리포솜 또는 지질 나노입자는 또한 gRNA를 가진다.
일부 구현예에서, DNA 엔도뉴클레아제는 세포에 제공되기 전에 gRNA와 예비복합체화되어, RNP 복합체를 형성한다.
일부 구현예에서, (a) 및 (b)는 (c)가 세포에 제공된 후 상기 세포에 제공된다.
일부 구현예에서, (a) 및 (b)는 (c)가 세포에 제공된 후 약 1 내지 14일째에 상기 세포에 제공된다.
일부 구현예에서, GOI 또는 이의 기능적 유도체를 인코딩하는 핵산 서열은 세포의 게놈 서열 내로 삽입된다.
일부 구현예에서, 삽입은 세포의 게놈 내 알부민 유전자 또는 알부민 유전자 조절 요소에, 그 안에, 또는 그 부근에 존재한다.
일부 구현예에서, 삽입은 세포의 게놈 내의 알부민 유전자의 제1 인트론 내에 존재한다.
일부 구현예에서, 삽입은 게놈 내 인간 알부민 유전자의 제1 엑손의 단부의 적어도 37 bp 다운스트림 및 게놈 내 인간 알부민 유전자의 제2 엑손의 출발의 적어도 330 bp 업스트림이다.
일부 구현예에서, GOI 또는 이의 기능적 유도체를 인코딩하는 핵산 서열은 내인성 알부민 프로모터의 제어 하에 발현된다.
일부 구현예에서, 세포는 간세포이다.
일부 구현예에서, GOI를 인코딩하는 핵산 서열, 예컨대 FVIII 단백질 또는 기능적 유도체를 인코딩하는 핵산 서열은 대상체의 간에서 발현된다.
또 다른 양태에서, 대상체에서 A형 혈우병, B형 혈우병, 또는 HAE를 치료하는 방법이 본원에 제공된다. 상기 방법은 본원에 개시된 바와 같은 유전적으로 변형된 세포를 투여하는 단계를 포함한다. 일부 구현예에서, 유전적으로 변형된 세포는 대상체에 대해 자기유래이다. 일부 구현예에서, 상기 방법은 (i) 대상체로부터 생물학적 시료를 수득하는 단계로서, 상기 생물학적 시료는 간세포의 세포를 포함하고, 유전적으로 변형된 세포는 상기 간세포로부터 제조되는 단계를 포함한다.
본원에 기재된 각각의 양태 및 구현예는 이러한 구현예 또는 양태의 맥락으로부터 분명하게 또는 명확하게 배제되지 않는 한 함께 사용될 수 있다.
상기 요약은 단지 예시적이고, 임의의 방식으로 제한하려는 것이 아니다. 본원에 기재된 예시적인 구현예 및 특질 외에도, 개시내용의 추가의 양태, 구현예, 목적 및 특질은 도면 및 상세한 설명과 청구항으로부터 완전히 명료해질 것이다.
본 개시내용의 소정의 특질 및 이점에 대한 이해는, 본 발명의 원리가 이용되는 예시적인 구현예, 및 첨부된 도면을 나타내는 하기 상세한 설명을 참조로 하여 수득될 것이며, 도면에서:
도 1은 상이한 코돈 최적화된 FVIII-BDD 코딩 서열의 다수의 정렬을 도시한다. 성숙한 코딩 서열만 도시되어 있다(신호 펩타이드 영역은 결실되어 있음). ClustalW 알고리즘이 사용되었다.
도 2는 DNA 공여체 주형의 비제한적인 예시적인 설계를 도시한다.
도 3은 Hepa1-6 세포에서 mAlb gRNA-T1의 절단 효율의 TIDE 분석 결과를 도시한다.
도 4는 상이한 용량에서 Cas9 mRNA 및 mAlb gRNA_T1을 캡슐화하는 나노입자(LNP) 또는 PBS 대조군을 투약한 후 3일째에 마우스의 간 및 비장에서 INDEL 빈도의 결과를 도시한다. N=5마리 마우스/군, 평균 값이 플롯화되어 있다.
도 5는 실시예 4에서 사용된 알부민 인트론 1 내로의 표적화된 통합을 위한 DNA 공여체 주형의 설계를 도시한다. SA; 스플라이스 수용기 서열(splice acceptor sequence), LHA; 좌측 상동성 아암(arm); RHA; 우측 상동성 아암, pA; 폴리아데닐화 신호, gRNA 부위; gRNA 표적화된 Cas9 뉴클레아제에 의한 절단을 매개하는 gRNA에 대한 표적 부위, 델타 퓨린(delta furin); FVIII에서 퓨린 부위의 결실, FVIII-BDD; B-도메인이 SQ 연결 펩타이드에 의해 대체되는 B-도메인 결실(BDD)을 갖는 인간 FVIII에 대한 코딩 서열이다.
도 6은 4명의 공여체로부터의 1차 인간 간세포에서 인간 알부민 인트론 1을 표적화하는 7개의 후보(candidate) gRNA의 INDEL 빈도를 도시한다.
도 7은 상이한 알부민 가이드 RNA 및 spCas9 mRNA로 형질주입된 비-인간 영장류(원숭이) 1차 간세포에서 INDEL 빈도를 도시한다.
도 8은 예시적인 AAV-mSEAP 공여체 카세트의 개략도를 도시한다.
도 9는 AAV 내로의 패키징(packaging)에 사용되는 예시적인 FVIII 공여체 카세트의 개략도를 도시한다.
도 10은 AAV8-pCB056, 뒤이어 spCas9 mRNA 및 mAlbT1 가이드 RNA를 캡슐화하는 LNP의 주사 후 시간 경과에 따른 A형 혈우병 마우스의 혈액 내 FVIII 수준을 도시한다.
도 11은 spCas9 mRNA 및 gRNA를 캡슐화하는 LNP가 주사된 후 제10일 및 제17일에서 A형 혈우병 마우스의 혈액 내 FVIII 수준을 도시한다. LNP는 AAV8-pCB0056 후 17일째 또는 4일째에 투약되었다.
도 12는 인간 FVIII 유전자 및 상이한 폴리아데닐화 신호 서열을 함유하는 예시적인 플라스미드 공여체의 개략도를 도시한다.
도 13은 3개의 상이한 polyA 신호, 뒤이어 LNP 캡슐화된 Cas9mRNA 및 mAlbT1 gRNA를 플라스미드 공여체에게 수력학적 주사(hydrodynamic injection) 후 마우스에서 FVIII 활성 및 FVIII 활성/표적화된 통합 비(ratio)를 도시한다. 2군, 3군 및 4군은 각각 pCB065, pCB076 및 pCB077로 투약되었다. 표는 각각의 개별 마우스에 대한 제10일의 FVIII 활성, 표적화된 통합 빈도 및 FVIII 활성/TI 비(ratio)(비(Ratio))를 함유한다.
도 14는 1차 인간 간세포에서 표적화된 통합을 평가하는 데 사용된 예시적인 AAV 공여체 카세트의 개략도를 도시한다.
도 15는 spCas9 mRNA 및 hALb4 gRNA의 리포펙션(lipofection)과 함께 또는 이러한 리포펙션 없이 AAV-DJ-SEAP 바이러스로 형질도입된 1차 인간 간세포의 배지 내 SEAP 활성을 도시한다. 2개의 세포 공여체가 시험되었고(HJK, ONR), 검정색 막대 및 흰색 막대로 표시되었다. 좌측 상의 막대의 3개 쌍(pair)은 Cas9 및 gRNA 단독(막대의 제1 쌍), 100,000 MOI 단독에서 AAV-DJ-pCB0107(SEAP 바이러스)(막대의 제2 쌍) 또는 100,000 MOI 단독에서 AAV-DJ-pCB0156(FVIII 바이러스)(막대의 제3 쌍)으로 형질주입된 세포의 대조군 조건에서의 SEAP 활성을 나타낸다. 우측 상의 막대의 4개 쌍은 다양한 MOI에서 AAV-DJ-pCB0107(SEAP 바이러스)로 형질도입되고 Cas9 mRNA 및 hAlb T4 gRNA로 형질주입된 세포의 웰에서 SEAP 활성을 나타낸다.
도 16은 spCas9 mRNA 및 hALb4 gRNA의 리포펙션과 함께 또는 이러한 리포펙션 없이 AAV-DJ-FVIII 바이러스로 형질도입된 1차 인간 간세포의 배지 내 FVIII 활성을 도시한다. 2개의 세포 공여체가 시험되었고(HJK, ONR), 검정색 막대 및 흰색 막대로 표시되었다. 좌측 상의 막대의 2개 쌍은 100,000 MOI 단독에서 AAV-DJ-pCB0107(SEAP 바이러스)(막대의 제1 쌍) 또는 100,000 MOI 단독에서 AAV-DJ-pCB0156(FVIII 바이러스)(막대의 제2 쌍)으로 형질도입된 세포의 대조군 조건에서의 FVIII 활성을 나타낸다. 우측 상의 막대의 4개 쌍은 다양한 MOI에서 AAV-DJ-pCB0156(FVIII 바이러스)로 형질도입되고 Cas9 mRNA 및 hAlb T4 gRNA로 형질주입된 세포의 웰로부터의 배지 내 FVIII 활성을 나타낸다.
도 17a는 혈액 응고 인자 IX(F9, FIX)에 대해 코돈-최적화된 서열을 함유하는 DNA 주형의 비-제한적인 예시적 설계를 도시한다. hFIX SA: hFIX 스플라이스 수용기이다. spA+: 신호 펩타이드이다. Stuffer: 인간 미세부수체(micro-satellite) 서열로부터 유래된 스터퍼(stuffer) 단편이다. 18: 18-bp 무작위 서열이다.
도 17b는 알부민 좌위의 제1 인트론에서 도 17a에 기재된 공여체 DNA 주형의 표적화된 통합 효율을 개략적으로 요약한 것이다.
도 18a는 인간 세르핀(Serpin) G1/C1 저해제 유전자(SERPING1)에 대한 코딩 서열을 함유하는 DNA 주형의 비-제한적인 예시적 설계를 도시한다. 도 18b는 알부민 좌위의 제1 인트론에서 삽입 후 제11일에 도 18a에 기재된 공여체 DNA 주형으로부터 발현된 SERPING1 활성을 개략적으로 요약한 것이다.
본 개시내용은 특히, 예를 들어, 포유류 세포, 예를 들어, 인간 세포와 같은 표적 세포의 게놈 내 특정 위치, 예를 들어, 안전한 보유 좌위로의 DNA 및 RNA를 포함한 핵산의 표적화된 전달을 위한 조성물, 방법, 및 시스템을 제공한다. 이식유전자의 표적-특이적 전달은 이것이 삽입 돌연변이형성(insertional mutagenesis)의 위험을 경감시킬 수 있게 하므로 무작위 통합에 대한 유리한 대안이다. 본 개시내용의 일부 양태 및 구현예는 게놈 편집에 의해 표적화된 방식으로 세포의 게놈 내로 통합된 이식유전자를 발현시키기 위한 조성물, 방법, 및 시스템에 관한 것이다. 일부 구현예에서, 이식유전자는, 해당되는 안전한 보유 좌위에서 발견되는 프로모터를 이용하거나 삽입 전 이식유전자에 융합된 외인성 프로모터에 의해 이식유전자의 발현적 조절을 가능하게 할 수 있는 게놈 내의 특정한 안전한 보유 위치 내로 삽입될 수 있다. 일부 구현예에서, 관심 이식유전자는 알부민 유전자의 제1 인트론 부근에 또는 그 내에 표적화된 방식으로 통합된다. 원칙적으로, 안전한 보유 좌위로 전달될 이식유전자에 대한 특정한 제한은 없다. 일부 특정 양태 및 구현예는 표적화된 세포의 게놈 내 특정한 안전한 보유 좌위로서 이용되는 내인성 알부민 좌위 내의 또는 그 부근의 게놈 위치 내로 통합된 관심 치료 단백질, 예컨대 혈액 응고 단백질 FIX 및 C1 저해제(C1INH)를 발현시키기 위한 게놈 편집을 위한 시스템, 조성물, 및 방법에 관한 것이다. 본 개시내용은 또한, 특히, 장애 또는 건강상 병태의 치료에 사용하기 위한 시스템, 뿐만 아니라 장애 또는 건강상 병태의 치료용 약제의 제조에 사용하기 위한 시스템을 포함하여, 생체외생체내 둘 다에서 장애 또는 건강상 병태, 예를 들어, B형 혈우병 또는 유전성 혈관부종(HAE)을 갖고 있거나 갖는 것으로 의심되는 대상체를 치료하기 위한 시스템, 조성물, 및 방법을 제공한다.
정의
다르게 정의되지 않는 한, 본원에 사용된 모든 기술적 및 과학적 용어는 본 발명이 속한 당업계의 당업자에 의해 통상적으로 이해되는 바와 동일한 의미를 갖는다. 상세한 설명은 예시적이고 설명적인 것일 뿐이며, 청구된 임의의 주제를 제약하는 것이 아님을 이해해야 한다. 본 출원에서, 단수형의 사용은 다르게 구체적으로 언급되지 않는 한 복수형을 포함한다. 명세서에 사용된 바와 같이, 단수형("a", "an" 및 "the")은 문맥상 다르게 명확하게 지시하지 않는 한 복수의 지칭을 포함함을 주목해야 한다. 이 출원에서, "또는"의 사용은 다르게 언급되지 않는 한 "및/또는"을 의미한다. 더욱이, 용어 "포함하는", 뿐만 아니라 다른 형태, 예컨대 "포함하다", "포함한다" 및 "포함되는"의 사용은 제한적이지 않다.
본 개시내용의 다양한 특질이 단일 구현예의 맥락에서 기재될 수 있긴 하지만, 상기 특질은 또한, 별도로 또는 임의의 적합한 조합으로 제공될 수 있다. 대조적으로, 본 개시내용이 명료성을 위해 별도의 구현예의 맥락에서 본원에 기재될 수 있긴 하지만, 상기 개시내용은 또한 단일 구현예에서 시행될 수 있다. 본원에서 인용된 임의의 공개된 특허 출원 및 임의의 다른 공개된 참조, 문헌, 원고, 및 과학적 문헌은 임의의 목적을 위해 참조로서 본원에 포함된다. 상충되는 경우, 정의를 포함하여 본 명세서가 우선할 것이다. 게다가, 물질, 방법 및 예는 단지 예시적인 것이며 제한하려는 것이 아니다.
본원에 사용된 바와 같이, 범위 및 양은 "약(about)" 특정 값 또는 범위로서 표현될 수 있다. 또한 약은 정확한 양을 포함한다. 그러므로, "약 5 μL"는 "약 5 μL" 및 또한 "5 μL"를 의미한다. 일반적으로, 용어 "약"은 실험 오차, 예컨대 ± 10% 내에 있는 것으로 예상될 양을 포함한다.
수치 값의 범위가 본원에 제시된 경우, 그 범위의 하한과 상한 사이의 각각의 개입된 값, 그 범위의 상한 및 하한인 값 및 그 범위를 사용하여 언급된 모든 값은 본 개시내용 내에 포괄되는 것으로 고려된다. 그 범위의 하한 및 상한 내의 모든 가능한 서브-범위가 또한 본 개시내용에 의해 고려된다.
용어 "폴리펩타이드," "폴리펩타이드 서열," "펩타이드," "펩타이드 서열," "단백질," "단백질 서열" 및 "아미노산 서열"은 펩타이드 결합에 의해 하나를 다른 것에 연결시킨 아미노산 잔기의 선형 시리즈를 지정하기 위해 본원에서 상호 교환적으로 사용되며, 상기 시리즈는 단백질, 폴리펩타이드, 올리고펩타이드, 펩타이드 및 이들의 단편을 포함할 수 있다. 단백질은 자연 발생 아미노산 및/또는 합성(예를 들어, 변형된 또는 비-자연 발생) 아미노산으로 이루어질 수 있다. 그러므로, 본원에 사용된 바와 같이 "아미노산", 또는 "펩타이드 잔기"는 자연 발생 아미노산과 합성 아미노산 둘 다 의미한다. 용어 "폴리펩타이드", "펩타이드", 및 "단백질"은 비제한적으로, 이종성 아미노산 서열을 갖는 융합 단백질, N-말단 메티오닌 잔기를 갖거나 갖지 않는 이종성 및 동종성 리더(leader) 서열을 갖는 융합; 면역학적으로 태깅된 단백질; 검출 가능한 파트너를 갖는 융합 단백질, 예를 들어, 융합 파트너로서 형광 단백질, β-갈락토시다제, 루시퍼라제 등을 포함하는 융합 단백질을 포함한다. 더욱이, 아미노산 서열의 시작 또는 단부(end)에서의 파선은 하나 이상의 아미노산 잔기의 추가 서열에 대한 펩타이드 결합 또는 카르복실 또는 하이드록실 단부 기에 대한 공유 결합을 나타낸다. 그러나, 파선의 부재는, 카르복실 또는 하이드록실 단부 기에 대한 이러한 펩타이드 결합 또는 공유 결합이 존재하지 않으며 아미노산 서열의 표시에서 이러한 것을 생략하는 것이 통상적임을 의미하는 것으로 간주되어서는 안 된다.
본원에서 상호 교환적으로 사용되는 용어 "폴리뉴클레오타이드," "폴리뉴클레오타이드 서열," "올리고뉴클레오타이드," "올리고뉴클레오타이드 서열," "올리고머," "올리고," "핵산 서열" 또는 "뉴클레오타이드 서열"은 임의의 길이의 뉴클레오타이드의 중합체성 형태인 리보뉴클레오타이드 또는 데옥시리보뉴클레오타이드를 지칭한다. 그러므로, 이 용어는 단일-가닥, 이중-가닥, 또는 다중-가닥 DNA 또는 RNA, 게놈 DNA, cDNA, DNA-RNA 하이브리드, 또는 퓨린 및 피리미딘 염기 또는 다른 자연적 뉴클레오타이드 염기, 화학적으로 또는 생화학적으로 변형된 뉴클레오타이드 염기, 비-자연적 뉴클레오타이드 염기, 또는 유도체화된 뉴클레오타이드 염기를 갖는 중합체를 포함하지만 이들로 제한되지는 않는다.
용어 "유도체" 및 "변이체"는 비제한적으로, 본원에 개시된 화합물로부터 유래되는 구조 또는 서열을 갖고 이의 구조 또는 서열은 본원에 개시된 것들과 충분히 유사하여 상기 구조 또는 서열이 동일하거나 유사한 활성 및 이용성을 갖거나 이러한 유사성에 기초하여 기준 화합물과 동일하거나 유사한 활성 및 이용성을 나타내는 것으로 당업자에 의해 예상되므로 "기능적으로 동등한" 또는 "기능적 등가물"로서 상호 교환적으로 지칭될 임의의 화합물, 예컨대 핵산 또는 단백질을 지칭한다. "유도체" 또는 "변이체"를 수득하기 위한 변형은 예를 들어, 하나 이상의 핵산 또는 아미노산 잔기의 첨가, 결실 및/또는 치환을 포함할 수 있다.
단백질의 맥락에서 기능적 등가물 또는 상기 기능적 등가물의 단편은 하나 이상의 보존적 아미노산 치환을 가질 수 있다. 용어 "보존적 아미노산 치환"은 원래의 아미노산과 유사한 특성을 갖는 또 다른 아미노산에 대한 아미노산의 치환을 지칭한다. 보존적 아미노산의 군은 하기와 같다:
Figure pct00001
보존적 치환은 바람직한 예정된 펩타이드 또는 이의 단편의 임의의 위치에 도입될 수 있다. 그러나, 비-보존적 치환, 특히 비제한적으로 임의의 하나 이상의 위치에서의 비-보존적 치환을 도입하는 것이 바람직할 수 있다. 펩타이드의 기능적 등가 단편의 형성을 유발하는 비-보존적 치환은 예를 들어, 유도체 또는 변이체 단편의 기능성을 유지하는 한편 극성, 전기적 전하 및/또는 입체적 벌크(steric bulk)에서 실질적으로 상이할 것이다.
"서열 동일성 백분율"은 비교창(comparison window)에 걸쳐 2개의 최적으로 정렬된 서열을 비교함으로써 결정되며, 상기 비교창에서 폴리뉴클레오타이드 또는 폴리펩타이드의 부분(portion)은 2개 서열의 최적 정렬에 대해 기준 서열(첨가 또는 결실을 갖지 않음)과 비교하여 첨가 또는 결실(즉, 갭)을 가질 수 있다. 일부 경우, 백분율은, 동일한 핵산 염기 또는 아미노산 잔기가 서열 둘 다에서 발생하는 위치의 수를 결정하여 매칭된 위치의 수를 산출하며, 상기 매칭된 위치의 수를 비교창의 위치의 총수로 나누고, 그 결과를 100으로 곱하여 서열 동일성 백분율을 산출함으로써 계산될 수 있다.
2개 이상의 핵산 또는 폴리펩타이드 서열의 맥락에서 용어 "동일한" 또는 "동일성" 백분율은, 하기 서열 비교 알고리즘 중 하나를 사용하여 또는 수동적 정렬 및 시각적 조사에 의해 측정된 바와 같이 비교창 또는 지정된 영역에 걸쳐 최대 대응을 위해 비교되고 정렬될 때, 동일하거나 또는 동일한 아미노산 잔기 또는 뉴클레오타이드를 명시된 백분율(예를 들어, 명시된 영역, 예를 들어, 전체 폴리펩타이드 서열 또는 폴리펩타이드의 개별 도메인에 걸쳐 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 또는 99% 동일성)로 갖는 2개 이상의 서열 또는 서브서열(subsequence)을 지칭한다. 그 후에, 이러한 서열은 "실질적으로 동일"하다고 한다. 이 정의는 또한, 시험 서열의 보체를 지칭한다.
본원에서 상호 교환적으로 사용되는 용어 "상보적인" 또는 "실질적으로 상보적인"은, 핵산(예를 들어, DNA 또는 RNA)이 서열-특이적, 역평행 방식으로 이를 또 다른 핵산에 비-공유적으로 결합할 수 있게 하는, 즉, 왓슨-크릭 염기쌍 및/또는 G/U 염기쌍을 형성할 수 있게 하는(즉, 핵산이 상보적 핵산에 특이적으로 결합함) 뉴클레오타이드 서열을 가짐을 의미한다. 당업계에 알려진 바와 같이, 표준 왓슨-크릭 염기쌍 형성은, 티미딘(T)과 쌍을 형성하는 아데닌(A), 우라실(U)과 쌍을 형성하는 아데닌(A), 및 시토신(C)과 쌍을 형성하는 구아닌(G)을 포함한다.
특정 RNA를 "인코딩하는" DNA 서열은, 적절한 조절 서열의 제어 하에 배치될 때 RNA로 전사되는 DNA 핵산 서열이다. DNA 폴리뉴클레오타이드는 단백질로 번역되는 RNA(mRNA)를 인코딩할 수 있거나, DNA 폴리뉴클레오타이드는 단백질로 번역되지 않는 RNA(예를 들어, tRNA, rRNA, 또는 가이드 RNA; "비-코딩" RNA 또는 "ncRNA"라고도 함)를 인코딩할 수 있다. 단백질 코딩 서열 또는 특정 단백질 또는 폴리펩타이드를 인코딩하는 서열은, 적절한 조절 서열의 제어 하에 배치될 때 시험관내에서 또는 생체내에서 mRNA로 전사되고(DNA의 경우) 폴리펩타이드로 번역되는(mRNA의 경우) 핵산 서열이다.
본원에 사용된 바와 같이, "코돈"은 DNA 또는 RNA 분자에서 함께 유전적 코드 단위를 형성하는 3개 뉴클레오타이드의 서열을 지칭한다. 본원에 사용된 바와 같이, 용어 "코돈 축퇴성(codon degeneracy)"은 인코딩되는 폴리펩타이드의 아미노산 서열에 영향을 주지 않으면서 뉴클레오타이드 서열의 변이(variation)를 허용하는 유전적 코드에서의 성질을 지칭한다.
용어 "코돈-최적화된" 또는 "코돈 최적화"는 다양한 숙주의 형질전환을 위한 핵산 분자의 유전자 또는 코딩 영역을 지칭하고, DNA에 의해 인코딩되는 폴리뉴클레오타이드를 변경시키지 않으면서 숙주 유기체의 전형적인 코돈 용법을 반영하기 위한 핵산 분자의 유전자 또는 코딩 영역에서의 코돈의 변경을 지칭한다. 이러한 최적화는, 적어도 하나의 또는 1개 초과의 또는 유의한 수의 코돈을 해당 유기체의 유전자에서 더욱 빈번하게 사용되는 하나 이상의 코돈으로 대체하는 것을 포함한다. 코돈 용법은 예를 들어, www.kazusa.or.jp/codon/(2008년 5월 20일에 방문)에서 입수 가능한 "코돈 용법 데이터베이스(Codon Usage Database)"에서 쉽게 입수 가능하다. 각각의 유기체에서 코돈 용법 또는 코돈 선호도에 대한 지식을 이용함으로써, 당업자는 빈도를 임의의 주어진 폴리펩타이드 서열에 적용하고, 폴리펩타이드를 인코딩하지만 주어진 종에 최적인 코돈을 사용하는 코돈-최적화된 코딩 영역의 핵산 단편을 생성할 수 있다. 코돈-최적화된 코딩 영역은 당업자에게 알려진 다양한 방법에 의해 설계될 수 있다.
용어 "재조합" 또는 "조작된"은 예를 들어, 세포, 핵산, 단백질, 또는 벡터를 지칭하는 데 사용될 때, 상기 세포, 핵산, 단백질 또는 벡터가 실험 방법에 의해 변형되었거나 이의 결과임을 나타낸다. 그러므로, 예를 들어, 재조합 또는 조작된 단백질은 실험 방법에 의해 생성된 단백질을 포함한다. 재조합 또는 조작된 단백질은 네이티브(비-재조합 또는 야생형) 형태의 단백질 내에서 발견되지 않는 아미노산 잔기를 포함할 수 있거나, 변형되어 있는, 예를 들어 표지되어 있는 아미노산 잔기를 포함할 수 있다. 상기 용어는 펩타이드, 단백질, 또는 핵산 서열에 대한 임의의 변형을 포함할 수 있다. 이러한 변형은, 하나 이상의 아미노산, 데옥시리보뉴클레오타이드, 또는 리보뉴클레오타이드를 포함하여 펩타이드, 단백질 또는 핵산 서열의 임의의 화학적 변형; 펩타이드 또는 단백질 내 하나 이상의 아미노산의 첨가, 결실, 및/또는 치환; 및 핵산 서열 내 하나 이상의 핵산의 첨가, 결실. 및/또는 치환을 포함할 수 있다.
용어 "게놈 DNA" 또는 "게놈 서열"은 비제한적으로 박테리아, 진균류, 고세균, 식물 또는 동물의 게놈의 DNA를 포함하여 유기체의 게놈의 DNA를 지칭한다.
본원에 사용된 바와 같이, 핵산의 맥락에서 "이식유전자," "외인성 유전자" 또는 "외인성 서열"은 세포의 게놈에 존재하지 않았지만 예를 들어, 게놈-편집을 통해 게놈 내로 인공적으로 도입된 핵산 서열 또는 유전자를 지칭한다.
본원에 사용된 바와 같이, 핵산의 맥락에서 "내인성 유전자" 또는 "내인성 서열"은 임의의 인공 수단을 통해 도입되지 않으면서 세포의 게놈에 자연적으로 존재하는 핵산 서열 또는 유전자를 지칭한다.
용어 "벡터" 또는 "발현 벡터"는, 또 다른 DNA 세그먼트(segment), 즉, "삽입물"이 부착되어 세포에서 부착된 세그먼트의 복제를 야기할 수 있는 레플리콘(replicon), 예컨대 플라스미드, 파지, 바이러스, 또는 코스미드(cosmid)를 의미한다.
용어 "발현 카세트"는 프로모터에 작동적으로 연결된 DNA 코딩 서열을 갖는 벡터를 지칭한다. "작동적으로 연결된"은, 기재된 구성요소가 이의 의도된 방식으로 작동하도록 허용하는 관계로 존재하는 병렬(juxtaposition)을 지칭한다. 예를 들어, 프로모터는, 상기 프로모터가 이의 전사 또는 발현에 영향을 미친다면 코딩 서열에 작동적으로 연결된다. 용어 "재조합 발현 벡터," 또는 "DNA 작제물"은 벡터 및 적어도 하나의 삽입물을 갖는 DNA 분자를 지칭하기 위해 본원에서 상호 교환적으로 사용된다. 재조합 발현 벡터는 통상, 삽입물(들)을 발현시키고/거나 전파시킬 목적으로, 또는 다른 재조합 뉴클레오타이드 서열의 작제를 위해 생성된다. 핵산(들)은 프로모터 서열에 작동적으로 연결될 수 있거나 연결되지 않을 수 있고 DNA 조절 서열에 작동적으로 연결될 수 있거나 연결되지 않을 수 있다.
용어 "작동적으로 연결된"은 관심 뉴클레오타이드 서열이 뉴클레오타이드 서열의 발현을 가능하게 하는 방식으로 조절 서열(들)에 연결된다는 것을 의미한다. 용어 "조절 서열"은 예를 들어, 프로모터, 인핸서 및 다른 발현 제어 요소(예를 들어, 폴리아데닐화 신호)를 포함하도록 의도된다. 이러한 조절 서열은 당업계에 잘 알려져 있고, 예를 들어 문헌[Goeddel; Gene Expression Technology: Methods in Enzymology 185, Academic Press, San Diego, CA (1990)]에 기재되어 있다. 조절 서열은 많은 유형의 숙주 세포에서 뉴클레오타이드 서열의 구성적 발현을 지시(direct)하는 것, 및 소정의 숙주 세포에서만 뉴클레오타이드 서열의 발현을 지시하는 것(예를 들어, 조직-특이적 조절 서열)을 포함한다. 발현 벡터의 설계는 표적 세포의 선택, 요망되는 발현 수준 등과 같은 인자에 좌우될 수 있다는 것은 당업자에 의해 인지될 것이다.
세포는 외인성 DNA, 예를 들어, 재조합 발현 벡터가 세포 내부에 도입되었을 때 이러한 DNA에 의해 "유전적으로 변형되거나" "형질전환되거나" "형질주입되었다". 외인성 DNA의 존재는 영구적인 또는 일시적인 유전적 변화를 초래한다. 형질전환적 DNA는 세포의 게놈 내로 통합(공유 연결)될 수 있거나 통합되지 않을 수 있다. 치료적 활성을 갖는, 예를 들어 A형 혈우병을 치료하는, 유전적으로 변형된(또는 형질전환된 또는 형질주입된) 세포가 사용되고 치료적 세포로 지칭될 수 있다.
분자, 예컨대 펩타이드 단편의 맥락에서 사용된 용어 "농도"는 주어진 부피의 용액에 존재하는 분자의 양, 즉, 분자의 몰수를 지칭한다.
용어 "개체", "대상체", 및 "숙주"는 본원에서 상호 교환적으로 사용되며, 진단, 치료 또는 치료법이 요망되는 임의의 대상체를 지칭한다. 일부 양태에서, 대상체는 포유류이다. 일부 양태에서, 대상체는 인간이다. 일부 양태에서, 대상체는 환자이다. 일부 양태에서, 대상체는 인간 환자이다. 일부 양태에서, 대상체는 관심 유전자(GOI)와 관련된 장애 또는 건강상 병태를 갖고 있거나 갖는 것으로 의심될 수 있다. 일부 양태에서, 대상체는 A형 혈우병을 가질 수 있거나 갖는 것으로 의심되고/거나 A형 혈우병의 하나 이상의 증상을 갖는다. 일부 양태에서, 대상체는 진단 시 또는 이후에 GOI와 관련된 장애 또는 건강상 병태의 위험이 있는 것으로 진단된 인간이다. 일부 양태에서, 대상체는 진단 시 또는 이후에 혈우병 A의 위험이 있는 것으로 진단된 인간이다. 일부 경우, GOI와 관련된 장애 또는 질환 병태의 위험의 진단은, GOI의 발현에 영향을 미칠 수 있는 게놈 내 내인성 GOI 또는 상기 GOI 부근의 게놈 서열에서의 하나 이상의 돌연변이의 존재에 기초하여 결정될 수 있다.
질환 또는 병태를 지칭하는 데 사용되는 용어 "치료"는, 개체를 괴롭히는 병태와 관련된 증상의 적어도 개선이 달성됨을 의미하며, 여기서, 상기 개선은 광범위한 의미에서 매개변수, 예를 들어 치료받는 병태(예를 들어, A형 혈우병)와 관련된 증상의 규모(magnitude)의 적어도 감소를 지칭하는 데 사용된다. 이와 같이, 치료는 또한, 숙주가 더 이상 병태, 또는 적어도 병태를 특징으로 하는 증상을 겪지 않도록, 병리학적 병태 또는 적어도 이와 관련된 증상이 완전히 저해되는, 예를 들어 발생이 예방되거나 전적으로 없어지는 상황을 포함한다. 그러므로, 치료는 (i) 예방, 즉, 임상적 증상이 발증하지 않도록 야기하는 것, 예를 들어, 질환 진행을 예방하는 것을 포함하여, 임상적 증상의 발증 위험을 감소시키는 것; (ii) 저해, 즉, 임상적 증상의 발증 또는 추가 발증을 억제시키는 것, 예를 들어, 활성 질환을 경감시키거나 완전히 저해하는 것을 포함한다.
본원에 사용된 바와 같은 용어 "유효량," "약학적 유효량," 또는 "치료적 유효량"은 특정 병태를 갖는 대상체에게 투여될 때 요망되는 이용성을 제공하기에 충분한 조성물의 양을 의미한다. A형 혈우병의 생체외 치료의 맥락에서, 용어 "유효량"은 혈우병 A의 적어도 하나의 또는 하나 이상의 징후 또는 증상을 예방 또는 완화시키는 데 필요한 치료적 세포 또는 이의 자손의 집단의 양을 지칭하고, 요망되는 효과를 제공하기에, 예를 들어, 대상체의 A형 혈우병의 증상을 치료하기에 충분한 치료적 세포 또는 이의 자손을 갖는 조성물의 양에 관한 것이다. 따라서, 용어 "치료적 유효량"은 치료를 필요로 하는 대상체, 예컨대 A형 혈우병을 갖거나 이에 대한 위험이 있는 대상체에게 투여될 때, 특정 효과를 촉진시키기에 충분한 치료적 세포 또는 상기 치료적 세포를 갖는 조성물의 양을 지칭한다. 유효량은 또한, 질환의 증상의 발증을 예방 또는 지연시키거나, 질환의 증상의 경로를 변경시키거나(예를 들어, 비제한적으로, 질환의 증상의 진행을 늦추는 것) 또는 질환의 증상을 반전시키기에 충분한 양을 포함할 것이다. 대상체(예를 들어, 환자)에서 A형 혈우병의 생체내 치료 또는 시험관내에서 배양된 세포에서 수행된 게놈 편집의 맥락에서, 유효량은, 대상체 내 세포 또는 시험관내에서 배양된 세포의 게놈을 편집하는 데 필요한 게놈 편집에 사용되는 구성요소, 예컨대 gRNA, 공여체 주형 및/또는 부위-지향적(site-directed) 폴리펩타이드(예를 들어, DNA 엔도뉴클레아제)의 양을 지칭한다. 임의의 주어진 경우에 대해, 적절한 "유효량"은 일상적인 실험을 사용하여 당업자에 의해 결정될 수 있는 것으로 이해된다.
본원에 사용된 바와 같이 용어 "약학적으로 허용 가능한 부형제"는 대상체로의 관심 화합물(들)의 투여를 위한 약학적으로 허용 가능한 담체, 첨가제 또는 희석제를 제공하는 임의의 적합한 성분을 지칭한다. "약학적으로 허용 가능한 부형제"는 약학적으로 허용 가능한 희석제, 약학적으로 허용 가능한 첨가제, 및 약학적으로 허용 가능한 담체로 지칭되는 성분을 포괄할 수 있다.
게놈 편집을 위한 시스템
일 양태에서, 세포에서 게놈 편집에 의해 관심 유전자(GOI)를 발현시키기 위한 조성물, 방법, 및 시스템이 본원에 제공된다. 일부 구현예에서, 제공된 조성물, 방법, 및 시스템은 게놈 내에서, 특히 내인성 알부민 좌위 내의 또는 그 부근의 게놈 위치에 대해 특정한 안전한 보유 위치 내로의 관심 유전자(GOI)의 넉킹을 위한 것이다. 일반적으로, 당업자는, 안전한 보유 좌위가 외인성 핵산을 통합시키는 데 사용될 수 있는 게놈 내 위치이며, 상기 안전한 보유 좌위 내로의 외인성 핵산의 첨가가 핵산 단독의 첨가에 의해 숙주 세포의 성장에 유의한 효과를 야기하지 않음을 이해할 것이다. 일부 구현예에서, GOI는, 해당되는 안전한 보유 좌위에서 발견되는 프로모터를 이용하거나 삽입 전 GOI 코딩 서열에 융합된 외인성 프로모터에 의해 GOI의 발현적 조절을 가능하게 할 수 있는 게놈 내의 특정한 안전한 보유 위치 내로 삽입될 수 있다. 일부 구현예에서, 관심 GOI는 알부민 유전자의 제1 인트론 부근에 또는 그 내에 표적화된 방식으로 통합된다.
원칙적으로, 안전한 보유 좌위로 전달될 이식유전자에 대한 특정한 제한은 없다. 일부 구현예에서, GOI는 치료적 폴리펩타이드 및 예방적 폴리펩타이드로 이루어진 군으로부터 선택되는 폴리펩타이드를 인코딩한다. 일부 구현예에서, GOI는 FVIII 단백질, 인자 IX 단백질, 알파-1-항트립신, FXIII 단백질, FVII 단백질, FX 단백질, 단백질 C, 또는 이의 임의의 기능적 유도체로 이루어진 군으로부터 선택되는 단백질을 인코딩한다. 일부 특정 구현예는 세포에서 혈액 응고 단백질, 예컨대 FVIII의 발현, 기능 또는 활성을 게놈 편집에 의해 조정하기 위한 편집을 위한 조성물 및 방법에 관한 것이다. 본 개시내용은 또한 특히, 생체외생체내 둘 다에서 하나 이상의 상기 단백질과 관련된 장애 또는 건강상 병태를 갖고 있거나 갖는 것으로 의심되는 환자를 치료하기 위한 조성물 및 방법을 제공한다. 일부 구현예에서, 상기 환자는 A형 혈우병, B형 혈우병, MPS II, MPS1H, 알파-1-항트립신 결핍, FXIII 결핍, FVII 결핍, FX 결핍, 단백질 C 결핍, 및 HAE로 이루어진 군으로부터 선택되는 장애 또는 건강상 병태를 갖고 있거나 갖는 것으로 의심되는 환자이다. 일부 구현예에서, 환자는 A형 혈우병 환자이다. 일부 구현예에서, 환자는 B형 혈우병 환자이다. 일부 구현예에서, 환자는 HAE 환자이다.
A형 혈우병(Hem A) 및 인자 VIII
A형 혈우병(HemA)은 혈액 내 낮은 또는 검출 불가능한 수준의 FVIII를 초래하는 FVIII 유전자에서의 유전적 결함에 의해 야기된다. 이는, 조직 손상 부위에서 무효한 응괴(clot) 형성을 초래하여, 치료받지 않는다면 치명적일 수 있는 비제어된 출혈을 유발한다. 결측(missing) FVIII 단백질은 대체는 HemA 환자에 대해 효과적인 치료이고 현재의 표준 치유법이다. 그러나, 단백질 대체 치료법은 FVIII 단백질의 빈번한 정맥내 주사를 필요로 하며, 이는 성인에서는 불편하며 어린이에서는 문제가 되고 비용이 엄청 비싸며(>$200,000/년), 치료 요법이 밀접하게 후속되지 않는다면 출혈 사건을 통해 고장(break)을 초래할 수 있다.
FVIII 유전자는, 간뿐만 아니라 신체 내 다른 부위에 존재하는 동양혈관 내피 세포(sinusoidal endothelial cell)에서 주로 발현된다. 외인성 FVIII은 순환에서 FVIII을 생성시켜 질환의 치유에 영향을 미치는 간의 간세포에서 발현되고 이로부터 분비될 수 있다. 간의 간세포를 표적화하는 유전자 전달 방법이 개발되었으며, 이들 방법은 동물 모델과 임상 시험에서 환자 둘 다에서 HemA에 대한 치료로서 FVIII 유전자를 전달하는 데 사용되어 왔다.
A형 혈우병에 대한 영구적인 치유법이 고도로 바람직하다. AAV를 사용하는 전형적인 바이러스 기초 유전자 치료법이 전임상 동물 모델에서 그리고 환자에서 장래성을 보여줄 것인 한편, 상기 치료법은 많은 단점을 갖고 있다. AAV 기초 유전자 치료법은, AAV 바이러스 캡시드(특히 혈청형 AAV5, AAV8 또는 AAV9 또는 AAVrh10을 일반적으로 사용함) 내부에 캡슐화되는 간 특이적 프로모터에 의해 구동되는(driven) FVIII 유전자를 사용한다. 유전자 치료법에 사용되는 모든 AAV 바이러스는 패키지된 유전자 카세트를 형질도입된 세포의 핵 내로 전달하며, 상기 유전자 카세트는 거의 배제적으로 에피솜(episomal)으로 남아 있으며, 이는 치료적 단백질을 야기하는 치료적 유전자의 에피솜 복사체(copy)이다. AAV는 이의 캡슐화된 DNA를 숙주 세포의 게놈 내로 통합시키기 위한 기전을 갖고 있지 않지만, 대신에 에피솜으로서 유지되므로 숙주 세포가 분열할 때 복제되지 않는다. 에피솜 DNA는 또한, 시간 경과에 따라 분해를 받을 수 있다. AAV 에피솜을 함유하는 간 세포가 분열하도록 유도될 때, AAV 게놈은 복제되지 않지만 대신에 희석되는 것으로 실증되었다. 그 결과, AAV 기초 유전자 치료법은, 간이 아직 성인 크기를 달성하지 않은 어린이에게 주어질 때는 효과적일 것으로 예상되지 않는다. 게다가, 현재 AAV 기초 유전자 치료법이 성인 인간에게 주어질 때 얼마나 오래 지속될 것인지 알려져 있지 않지만, 동물 데이터는 10년이라는 기간에 걸쳐 치료적 효과에서 단지 작은 손실을 실증하였다. 따라서, HemA에 대한 새로운 효과적이고 영구적인 치료를 개발하기 위한 중요한 필요성이 존재한다.
B형 혈우병(Hem B) 및 인자 IX
B형 혈우병은 혈액 응고 인자 IX(FIX)에서의 결핍 또는 기능이상(dysfunction)에 의해 야기되는 유전성 출혈 장애이다. 충분한 인자 IX 없이, 혈액은 적절하게 응고되지 않아서 출혈을 제어할 수 없다. 이는 최초의 사람이 장애를 갖는 것으로 진단된 후 원래 "크리스마스 질환"으로 명명되었다. 모든 인종 및 경제적 군은 이 장애에 의해 영향을 받는다. B형 혈우병은 X-연관 열성 장애(X-linked recessive disorder)로서 유전되며, 통상 X 염색체 상에 인과적 돌연변이를 운반하는 남성에서 나타나고 여성에 의해 전파된다. B형 혈우병은 FIX 유전자에서의 여러 가지 결함으로 인한 것이다. B형 혈우병은, FIX 결핍이 FVIII 결핍(A형 혈우병)보다 4배 내지 6배 덜 만연해(prevalent) 있다는 점에서 두번째로 가장 보편적인 유형의 혈우병이다.
B형 혈우병은 일반적으로, 유병(affected) 개체에서의 인자 IX의 혈장 수준에 기초하여 중증, 중등도, 또는 경증(각각 1% 미만, 2-5%, 6-30%)으로 분류된다. 다수의 기저(underlying) 돌연변이가 식별되었고 상이한 수준의 임상 중증도와 연관이 있어 왔다. 인자 IX 결핍은 증가된 출혈 경향을 유발하며, 상기 출혈은 자발적으로 또는 경증 외상에 반응한 것일 수 있다. 인자 IX 결핍은 응고 캐스케이드의 간섭을 야기함으로써, 외상이 존재할 때 자발적 출혈을 야기할 수 있다. 인자 IX는 활성화될 때 인자 X를 활성화시키며, 이는 피브리노겐을 피브린으로 전환시키는 것을 돕는다. 현재, B형 혈우병에 대한 진단은 응고 스크리닝 시험, 출혈 점수, 및 응고 인자 검정법을 포함하여 많은 기지의 기법 및 방법에 의해 수행될 수 있다.
유전성 혈관부종(HAE) 및 SERPING1
유전성 혈관부종(HAE)은, 혈장 결핍을 유발하여 중증 팽윤의 재발성 공격을 초래하는, 세린 프로테아제 저해제(세르핀)인 C1 저해제(C1INH)를 인코딩하는 SERPING1에서의 돌연변이에 의해 주로 야기되는 유전적 장애이다. 3개의 주요 유형의 HAE가 존재한다. I형 및 II형은 C1 저해제 단백질을 만드는 SERPING1 유전자에서의 돌연변이에 의해 야기되는 한편, III형은 종종 인자 XII 유전자의 돌연변이로 인한 것이다. 이는 증가된 양의 브래디키닌(bradykinin)을 초래하며 이는 팽윤을 촉진한다. 병태는 사람의 부모로부터 상염색체 우성 방식으로 유전되거나 새로운 돌연변이로서 발생할 수 있다. 공격의 촉발인자(trigger)는 미미한 외상 또는 스트레스를 포함할 수 있지만, 종종 임의의 명백한 선행 사건 없이 발생한다.
유전성 혈관부종은 대략 50,000명당 1명에게 영향을 미친다. 장애는 일반적으로 소아기에 처음으로 주목된다. I형 및 II형은 여성 및 남성에게 동등하게 영향을 미쳤다. III형은 남성보다는 여성에게 더 많이 영향을 미친다. 기도(airway)가 연관되어 있을 때, 치료가 없을 시, 사망은 약 25%에서 발생한다. 현재, I형 및 II형에 대한 진단은 혈청 보체 인자 4(C4) 및 C1-저해제(C1-INH) 수준의 측정에 기초한 것들을 포함하여 많은 기지의 기법 및 방법에 의해 수행될 수 있다. 예를 들어, 혈액 시험은, 혈청 보체 인자 2 및 4(C2 및 C4), C1 저해제(C1-INH) 항원성(antigenic) 단백질, C1 저해제(C1-INH) 기능적 수준의 측정 중 하나 이상을 이용하여 장애를 진단하는 데 사용될 수 있다.
일부 구현예에서, 게놈 편집을 위한, 특히, 관심 유전자(GOI)를 인코딩하는 핵산 서열을 세포의 게놈 내로 삽입하기 위한 시스템이 본원에 제공된다. 이들 시스템은 예컨대 세포의 게놈을 편집하기 위해 그리고 대상체, 예를 들어, GOI와 관련된 건강상 병태 또는 장애를 앓고 있는 환자를 치료하기 위해 본원에 기재된 방법에 사용될 수 있다. 일부 구현예에서, GOI는 폴리펩타이드에 대한 아미노산 서열을 인코딩할 수 있다. 일반적으로, 인코딩된 폴리펩타이드의 크기 또는 생물학적 활성 또는 기능성에 관한 구체적인 한계는 없다. 이에, 인코딩된 폴리펩타이드는 임의의 폴리펩타이드일 수 있고, 예를 들어, 치료적 폴리펩타이드, 예방적 폴리펩타이드, 진단적 폴리펩타이드, 및 기능식품(nutraceutical) 폴리펩타이드일 수 있다. 일부 구현예에서, GOI는 FVIII 단백질, 인자 IX 단백질, 알파-1-항트립신, FXIII 단백질, FVII 단백질, FX 단백질, 단백질 C, 또는 이의 임의의 기능적 유도체로 이루어진 군으로부터 선택되는 단백질을 인코딩한다. 일부 구현예에서, 본원에 개시된 시스템은 예컨대 세포의 게놈을 편집하기 위해 그리고 생체외생체내 둘 다에서 하나 이상의 상기 단백질과 관련된 장애 또는 건강상 병태를 갖고 있거나 갖는 것으로 의심되는 환자를 치료하기 위해 본원에 기재된 방법에 사용될 수 있다. 일부 구현예에서, 상기 환자는 A형 혈우병, B형 혈우병, MPS II, MPS1H, 알파-1-항트립신 결핍, FXIII 결핍, FVII 결핍, FX 결핍, 단백질 C 결핍, 및 HAE로 이루어진 군으로부터 선택되는 장애 또는 건강상 병태를 갖고 있거나 갖는 것으로 의심되는 환자이다. 일부 구현예에서, 환자는 A형 혈우병 환자이다. 일부 구현예에서, 환자는 B형 혈우병 환자이다. 일부 구현예에서, 환자는 HAE 환자이다.
일부 구현예에서, (a) 데옥시리보핵산(DNA) 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산; (b) 서열번호 18-44 및 104 중 임의의 하나로부터의 스페이서 서열을 포함하는 가이드 RNA(gRNA), 또는 상기 gRNA를 인코딩하는 핵산; 및 (c) 관심 유전자(예를 들어, FVIII, FIX, 또는 SERPING1)를 인코딩하는 핵산 서열을 포함하는 공여체 주형을 포함하는 시스템이 본원에 제공된다. 일부 구현예에서, gRNA는 서열번호 21, 22, 28, 및 30 중 임의의 하나로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 서열번호 21로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 서열번호 22로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 서열번호 28로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 서열번호 30으로부터의 스페이서 서열을 포함한다.
일부 구현예에서, (a) 데옥시리보핵산(DNA) 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산; (b) 서열번호 18-44 및 104 중 임의의 하나로부터의 스페이서 서열을 포함하는 가이드 RNA(gRNA), 또는 상기 gRNA를 인코딩하는 핵산; 및 (c) FVIII 유전자를 인코딩하는 핵산 서열을 포함하는 공여체 주형을 포함하는 시스템이 본원에 제공된다. 일부 구현예에서, gRNA는 서열번호 21, 22, 28, 및 30 중 임의의 하나로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 서열번호 21로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 서열번호 22로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 서열번호 28로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 서열번호 30으로부터의 스페이서 서열을 포함한다.
일부 구현예에서, (a) 데옥시리보핵산(DNA) 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산; (b) 서열번호 18-44 및 104 중 임의의 하나로부터의 스페이서 서열을 포함하는 가이드 RNA(gRNA), 또는 상기 gRNA를 인코딩하는 핵산; 및 (c) FIX 유전자를 인코딩하는 핵산 서열을 포함하는 공여체 주형을 포함하는 시스템이 본원에 제공된다. 일부 구현예에서, gRNA는 서열번호 21, 22, 28, 및 30 중 임의의 하나로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 서열번호 21로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 서열번호 22로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 서열번호 28로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 서열번호 30으로부터의 스페이서 서열을 포함한다.
일부 구현예에서, (a) 데옥시리보핵산(DNA) 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산; (b) 서열번호 18-44 및 104 중 임의의 하나로부터의 스페이서 서열을 포함하는 가이드 RNA(gRNA), 또는 상기 gRNA를 인코딩하는 핵산; 및 (c) SERPING1 유전자를 인코딩하는 핵산 서열을 포함하는 공여체 주형을 포함하는 시스템이 본원에 제공된다. 일부 구현예에서, gRNA는 서열번호 21, 22, 28, 및 30 중 임의의 하나로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 서열번호 21로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 서열번호 22로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 서열번호 28로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 서열번호 30으로부터의 스페이서 서열을 포함한다.
일부 구현예에서, DNA 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산을 포함하는 본원에 기재된 임의의 시스템에 따르면, DNA 엔도뉴클레아제는 Cas 엔도뉴클레아제이다. 일부 구현예에서, Cas 엔도뉴클레아제는 서열 NGG 또는 NNGG를 갖는 프로토스페이서 인접 모티프(PAM)를 인식하며, 여기서 N은 임의의 뉴클레오타이드이다. 일부 구현예에서, Cas 엔도뉴클레아제는 II형 Cas 엔도뉴클레아제이다. 일부 구현예에서, Cas 엔도뉴클레아제는 Cas9 엔도뉴클레아제이다. 일부 구현예에서, Cas9 엔도뉴클레아제는 스트렙토콕커스 파이오게네스(SpyCas9)로부터의 것이다. 예를 들어, 일부 구현예에서, Cas9는 서열번호 110의 아미노산 서열 또는 서열번호 110의 아미노산 서열과 적어도 75% 서열 동일성을 갖는 이의 변이체를 포함한다. 일부 구현예에서, Cas9 엔도뉴클레아제는 스타필로콕커스 루그두넨시스(SluCas9)로부터의 것이다. 예를 들어, 일부 구현예에서, Cas9는 서열번호 111의 아미노산 서열 또는 서열번호 111의 아미노산 서열과 적어도 75% 서열 동일성을 갖는 이의 변이체를 포함한다.
일부 구현예에서, DNA 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산을 포함하는 본원에 기재된 임의의 시스템에 따르면, DNA 엔도뉴클레아제는 상이한 Cas 엔도뉴클레아제로부터 유래된 2개 이상의 부분을 포함하는 조작된 엔도뉴클레아제이다. 일부 구현예에서, 조작된 엔도뉴클레아제는 서열 NGG 또는 NNGG를 갖는 프로토스페이서 인접 모티프(PAM)를 인식하며, 여기서 N은 임의의 뉴클레오타이드이다. 일부 구현예에서, 상이한 Cas 엔도뉴클레아제는 II형 Cas 엔도뉴클레아제이다. 일부 구현예에서, 상이한 Cas 엔도뉴클레아제는 Cas9 엔도뉴클레아제이다. 일부 구현예에서, 조작된 엔도뉴클레아제는 스트렙토콕커스 파이오게네스 Cas9(SpyCas9)로부터의 PAM-상호작용 도메인(PID: PAM-interacting domain)을 포함한다. 일부 구현예에서, 조작된 엔도뉴클레아제는 스타필로콕커스 루그두넨시스 Cas9(SluCas9)로부터의 PID를 포함한다.
일부 구현예에서, 본원에 기재된 임의의 시스템에 따르면, DNA 엔도뉴클레아제는 서열 NGG 또는 NNGG를 갖는 프로토스페이서 인접 모티프(PAM), 또는 이의 기능적 유도체를 인식하며, 여기서 N은 임의의 뉴클레오타이드이다. 일부 구현예에서, DNA 엔도뉴클레아제는 II형 Cas 엔도뉴클레아제 또는 이의 기능적 유도체이다. 일부 구현예에서, DNA 엔도뉴클레아제는 Cas9이다. 일부 구현예에서, Cas9는 스트렙토콕커스 파이오게네스(spCas9)로부터의 것이다. 일부 구현예에서, Cas9는 스타필로콕커스 루그두넨시스(SluCas9)로부터의 것이다.
일부 구현예에서, 본원에 기재된 임의의 시스템에 따르면, 이의 관심 유전자를 인코딩하는 핵산 서열은 숙주 세포에서의 발현을 위해 코돈 최적화된다. 일부 구현예에서, 관심 유전자를 인코딩하는 핵산 서열은 인간 세포에서의 발현을 위해 코돈 최적화된다.
일부 구현예에서, 본원에 기재된 임의의 시스템에 따르면, 상기 시스템은 DNA 엔도뉴클레아제를 인코딩하는 핵산을 포함한다. 일부 구현예에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 숙주 세포에서의 발현을 위해 코돈 최적화된다. 일부 구현예에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 인간 세포에서의 발현을 위해 코돈 최적화된다. 일부 구현예에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 DNA, 예컨대 DNA 플라스미드이다. 일부 구현예에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 RNA, 예컨대 mRNA이다.
일부 구현예에서, 본원에 기재된 임의의 시스템에 따르면, 공여체 주형은 AAV 벡터에서 인코딩된다. 일부 구현예에서, 공여체 주형은 GOI를 인코딩하는 핵산 서열을 포함하는 공여체 카세트를 포함하고, 상기 공여체 카세트는 한면 또는 양면 상에서 gRNA 표적 부위에 의해 측면 근접해 있다(flanked). 일부 구현예에서, 공여체 카세트는 한면 또는 양면 상에서 gRNA 표적 부위에 의해 측면 근접해 있다. 일부 구현예에서, gRNA 표적 부위는 시스템 내 gRNA에 대한 표적 부위이다. 일부 구현예에서, 공여체 주형의 gRNA 표적 부위는 시스템 내 gRNA에 대한 세포 게놈 gRNA 표적 부위의 역보체(reverse complement)이다.
일부 구현예에서, 본원에 기재된 임의의 시스템에 따르면, DNA 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산은 리포솜 또는 지질 나노입자에서 제형화된다. 일부 구현예에서, 리포솜 또는 지질 나노입자는 또한 gRNA를 포함한다. 일부 구현예에서, 리포솜 또는 지질 나노입자는 지질 나노입자이다. 일부 구현예에서, 시스템은 DNA 엔도뉴클레아제를 인코딩하는 핵산 및 gRNA를 포함하는 지질 나노입자를 포함한다. 일부 구현예에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 DNA 엔도뉴클레아제를 인코딩하는 mRNA이다.
일부 구현예에서, 본원에 기재된 임의의 시스템에 따르면, DNA 엔도뉴클레아제는 gRNA와 복합체화하여, RNP 복합체를 형성한다.
핵산
게놈-표적화 핵산 또는 가이드 RNA
본 개시내용은 관련된 폴리펩타이드(예를 들어, 부위-지향 폴리펩타이드 또는 DNA 엔도뉴클레아제)의 활성을 표적 핵산 내의 특이적 핵산 서열로 지향시킬 수 있는 게놈-표적화 핵산을 제공한다. 일부 구현예에서, 게놈-표적화 핵산은 RNA이다. 게놈-표적화 RNA는 본원에서 "가이드 RNA" 또는 "gRNA"로 지칭된다. 가이드 RNA는 적어도 관심 표적 핵산 서열에 혼성화된 스페이서 서열, 및 CRISPR 반복부 서열을 갖는다. II형 시스템에서, gRNA는 또한 tracrRNA 서열이라고 하는 제2 RAN를 갖는다. II형 가이드 RNA(gRNA)에서, CRISPR 반복부 서열 및 tracrRNA 서열은 서로에 혼성화되어 듀플렉스를 형성한다. V형 가이드 RNA(gRNA)에서, crRNA는 듀플렉스를 형성한다. 두 시스템 모두에서, 듀플렉스는 부위-지향 폴리펩타이드에 결합하여, 가이드 RNA 및 부위-지향 폴리펩타이드가 복합체를 형성하게 된다. 게놈-표적화 핵산은 부위-지향 폴리펩타이드와의 회합으로 인해서 복합체에 대한 표적 특이성을 제공한다. 그러므로, 게놈-표적화 핵산은 부위-지향 폴리펩타이드의 활성을 지향시킨다.
일부 구현예에서, 게놈-표적화 핵산은 이중-분자 가이드 RNA이다. 일부 구현예에서, 게놈-표적화 핵산은 단일-분자 가이드 RNA이다. 이중-분자 가이드 RNA는 RNA의 두 가닥을 갖는다. 제1 가닥은 5'에서 3' 방향으로, 선택적인 스페이서 연장 서열, 스페이서 서열 및 최소 CRISPR 반복부 서열을 갖는다. 제2 가닥은 최소 tracrRNA 서열(최소 CRISPR 반복부 서열에 상보적임), 3' tracrRNA 서열 및 선택적인 tracrRNA 연장 서열을 갖는다. II형 시스템에서 단일-분자 가이드 RNA(sgRNA)는 5'에서 3' 방향으로, 선택적인 스페이서 연장서열, 스페이서 서열, 최소 CRISPR 반복부 서열, 단일-분자 가이드 링커, 최소 tracrRNA 서열, 3' tracrRNA 서열 및 선택적인 tracrRNA 연장 서열을 갖는다. 선택적인 tracrRNA 연장은 가이드 RNA에 추가 기능성(예를 들어, 안정성)을 기여하는 요소를 가질 수 있다. 단일-분자 가이드 링커는 최소 CRISPR 반복부 및 최소 tracrRNA 서열을 연결하여 헤어핀 구조를 형성한다. 선택적인 tracrRNA 연장은 하나 이상의 헤어핀을 갖는다. V형 시스템에서 단일-분자 가이드 RNA(sgRNA)는 5'에서 3' 방향으로, 최소 CRISPR 반복부 서열 및 스페이서 서열을 갖는다.
예시의 방식으로, CRISPR/Cas/Cpf1 시스템에서 사용되는 가이드 RNA, 또는 다른 더 작은 RNA는 하기에 예시되고 당업계에 기재된 바와 같이 화학적 수단에 의해서 쉽게 합성될 수 있다. 화학적 합성 절차가 계속적으로 확장되지만, 고성능 액체 크로마토그래피(HPLC, 이는 겔, 예컨대 PAGE의 사용을 피함)와 같은 절차에 의한 이러한 RNA의 정제는, 폴리뉴클레오타이드 길이가 수백 초과의 뉴클레오타이드로 유의하게 증가하므로 더욱 곤란하게 되는 경향이 있다. 더 긴 길이의 RNA를 생성시키는 데 사용되는 하나의 접근법은 함께 리게이션된(ligated) 2개의 이상의 분자를 생성하는 것이다. 훨씬 더 긴 RNA, 예컨대 Cas9 또는 Cpf1 엔도뉴클레아제를 인코딩하는 것은 효소적으로 더욱 쉽게 생성된다. 다양한 유형의 RNA 변형, 예를 들어, 안정성을 증강시키고/거나 선천적 면역 반응의 가능성 또는 정도를 감소시키고/거나 다른 속성을 증강시키는 변형은 당업계에 기재된 바와 같이 RNA의 화학적 합성 및/또는 효소적 생성 동안 또는 그 후에 도입될 수 있다.
스페이서 연장 서열
게놈-표적화 핵산의 일부 구현예에서, 스페이서 연장 서열은 활성을 변형시키며, 안정성을 제공하고/하거나 게놈-표적화 핵산의 변형을 위한 위치를 제공할 수 있다. 스페이서 연장 서열은 표적상(on-target) 또는 표적외(off-target) 활성 또는 특이성을 변형시킬 수 있다. 일부 구현예에서, 스페이서 연장 서열이 제공된다. 스페이서 연장 서열은 1, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 120, 140, 160, 180, 200, 220, 240, 260, 280, 300, 320, 340, 360, 380, 400, 1000, 2000, 3000, 4000, 5000, 6000, 또는 7000개 이상을 초과하는 뉴클레오타이드 길이를 가질 수 있다. 스페이서 연장 서열은 약 1, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 120, 140, 160, 180, 200, 220, 240, 260, 280, 300, 320, 340, 360, 380, 400, 1000, 2000, 3000, 4000, 5000, 6000, 또는 7000개 이상의 뉴클레오타이드 길이를 가질 수 있다. 스페이서 연장 서열은 1, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 120, 140, 160, 180, 200, 220, 240, 260, 280, 300, 320, 340, 360, 380, 400, 1000, 2000, 3000, 4000, 5000, 6000, 7000개 이상보다 미만인 뉴클레오타이드의 길이를 가질 수 있다. 일부 구현예에서, 스페이서 연장 서열은 10개 미만의 뉴클레오타이드 길이이다. 일부 구현예에서, 스페이서 연장 서열은 10 내지 30개의 뉴클레오타이드 길이이다. 일부 구현예에서, 스페이서 연장 서열은 30 내지 70개의 뉴클레오타이드 길이이다.
일부 구현예에서, 스페이서 연장 서열은 또 다른 모이어티(예를 들어, 안정성 제어 서열, 엔도리보뉴클레아제 결합 서열, 리보자임)를 갖는다. 일부 구현예에서, 모이어티는 핵산 표적화 핵산의 안정성을 저하시키거나 증가시킨다. 일부 구현예에서, 모이어티는 전사 종결자 세그먼트(즉, 전사 종결 서열)이다. 일부 구현예에서, 모이어티는 진핵생물 세포에서 작용한다. 일부 구현예에서, 모이어티는 원핵생물 세포에서 작용한다. 일부 구현예에서, 모이어티는 진핵생물 세포와 원핵생물 세포 둘 다에서 작용한다. 적합한 모이어티의 비제한적인 예는, 5' 캡(예를 들어, 7-메틸구아닐레이트 캡(m7 G)), 리보스위치(riboswitch) 서열(예를 들어, 단백질 및 단백질 복합체에 의한 조절된 안정성 및/또는 조절된 접근성을 가능하게 하기 위해), dsRNA 듀플렉스(즉, 헤어핀)를 형성하는 서열, RNA를 서브세포(subcellular) 위치(예를 들어, 핵, 미토콘드리아, 엽록체 등)에 표적화하는 서열, 트래킹(tracking)(예를 들어, 형광 분자에 대한 직접적인 접합, 형광 검출을 용이하게 하는 모이어티에 대한 접합, 형광 검출을 가능하게 하는 서열 등)을 제공하는 변형 또는 서열, 및/또는 단백질(예를 들어, 전사 활성자, 전사 억제자, DNA 메틸트랜스퍼라제, DNA 데메틸라제, 히스톤 아세틸트랜스퍼라제, 히스톤 데아세틸라제 등을 포함하여, DNA에 작용하는 단백질)에 대한 결합 부위를 제공하는 변형 또는 서열을 포함한다.
스페이서 서열
스페이서 서열은 관심 표적 핵산 내 서열에 혼성화된다. 게놈-표적화 핵산의 스페이서는 혼성화(즉, 염기쌍 형성)를 통해서 서열-특이적 방식으로 표적 핵산과 상호작용한다. 그러므로, 스페이서의 뉴클레오타이드 서열은 관심 표적 핵산의 서열에 좌우된다.
본원에서 CRISPR/Cas 시스템에서, 스페이서 서열은 시스템에서 사용되는 Cas9 효소의 PAM의 5'에 위치된 표적 핵산에 혼성화되도록 설계된다. 스페이서는 표적 서열을 완벽하게 매칭시킬 수 있거나 미스매치를 가질 수 있다. 각각의 Cas9 효소는, 이것이 표적 DNA에서 인식된다는 점에서 특정 PAM 서열을 갖는다. 예를 들어, 에스. 파이오게네스(S. pyogenes)는 서열 5'- NRG-3'를 갖는 PAM을 표적 핵산에서 인식하며, R은 A 또는 G를 가지며, N은 임의의 뉴클레오타이드이고, N은 스페이서 서열에 의해 표적화된 표적 핵산 서열의 바로 3'이다.
일부 구현예에서, 표적 핵산 서열은 20개의 뉴클레오타이드를 갖는다. 일부 구현예에서, 표적 핵산은 20개 미만의 뉴클레오타이드를 갖는다. 일부 구현예에서, 표적 핵산은 20개 초과의 뉴클레오타이드를 갖는다. 일부 구현예에서, 표적 핵산은 적어도 5, 10, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30개 이상의 뉴클레오타이드를 갖는다. 일부 구현예에서, 표적 핵산은 최대 5, 10, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30개 이상의 뉴클레오타이드를 갖는다. 일부 구현예에서, 표적 핵산 서열은 PAM의 제1 뉴클레오타이드에 바로 5'에 20개의 염기를 갖는다. 예를 들어, 5'-NNNNNNNNNNNNNNNNNNNNNRG-3'(서열번호 100)를 갖는 서열에서, 표적 핵산은 Ns에 상응하는 서열을 가지며, N은 임의의 뉴클레오타이드이고, 밑줄표시된 NRG 서열(R은 G 또는 A임)은 스트렙토콕커스 파이오게네스 Cas9 PAM이다. 일부 구현예에서, S.p. Cas9에 의해 인식된 서열로서 본 개시내용의 조성물 및 방법에 사용되는 PAM 서열은 NGG이다.
일부 구현예에서, 표적 핵산에 혼성화된 스페이서 서열은 적어도 약 6개의 뉴클레오타이드(nt) 길이를 갖는다. 스페이서 서열은 적어도 약 6 nt, 약 10 nt, 약 15 nt, 약 18 nt, 약 19 nt, 약 20 nt, 약 25 nt, 약 30 nt, 약 35 nt 또는 약 40 nt, 약 6 nt 내지 약 80 nt, 약 6 nt 내지 약 50 nt, 약 6 nt 내지 약 45 nt, 약 6 nt 내지 약 40 nt, 약 6 nt 내지 약 35 nt, 약 6 nt 내지 약 30 nt, 약 6 nt 내지 약 25 nt, 약 6 nt 내지 약 20 nt, 약 6 nt 내지 약 19 nt, 약 10 nt 내지 약 50 nt, 약 10 nt 내지 약 45 nt, 약 10 nt 내지 약 40 nt, 약 10 nt 내지 약 35 nt, 약 10 nt 내지 약 30 nt, 약 10 nt 내지 약 25 nt, 약 10 nt 내지 약 20 nt, 약 10 nt 내지 약 19 nt, 약 19 nt 내지 약 25 nt, 약 19 nt 내지 약 30 nt, 약 19 nt 내지 약 35 nt, 약 19 nt 내지 약 40 nt, 약 19 nt 내지 약 45 nt, 약 19 nt 내지 약 50 nt, 약 19 nt 내지 약 60 nt, 약 20 nt 내지 약 25 nt, 약 20 nt 내지 약 30 nt, 약 20 nt 내지 약 35 nt, 약 20 nt 내지 약 40 nt, 약 20 nt 내지 약 45 nt, 약 20 nt 내지 약 50 nt, 또는 약 20 nt 내지 약 60 nt일 수 있다. 일부 구현예에서, 스페이서 서열은 20개의 뉴클레오타이드를 갖는다. 일부 구현예에서, 스페이서는 19개의 뉴클레오타이드를 갖는다. 일부 구현예에서, 스페이서는 18개의 뉴클레오타이드를 갖는다. 일부 구현예에서, 스페이서는 17개의 뉴클레오타이드를 갖는다. 일부 구현예에서, 스페이서는 16개의 뉴클레오타이드를 갖는다. 일부 구현예에서, 스페이서는 15개의 뉴클레오타이드를 갖는다.
일부 구현예에서, 스페이서 서열과 표적 핵산 사이의 상보성 백분율은 적어도 약 30%, 적어도 약 40%, 적어도 약 50%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100%이다. 일부 구현예에서, 스페이서 서열과 표적 핵산 사이의 상보성 백분율은 최대 약 30%, 최대 약 40%, 최대 약 50%, 최대 약 60%, 최대 약 65%, 최대 약 70%, 최대 약 75%, 최대 약 80%, 최대 약 85%, 최대 약 90%, 최대 약 95%, 최대 약 97%, 최대 약 98%, 최대 약 99%, 또는 100%이다. 일부 구현예에서, 스페이서 서열과 표적 핵산 사이의 상보성 백분율은 표적 핵산의 상보적 가닥의 표적 서열의 6개의 인접(contiguous) 5'-대부분의(most) 뉴클레오타이드에 걸쳐 100%이다. 일부 구현예에서, 스페이서 서열과 표적 핵산 사이의 상보성 백분율은 약 20개의 인접 뉴클레오타이드에 걸쳐 적어도 60%이다. 일부 구현예에서, 스페이서 서열과 표적 핵산의 길이는 1 내지 6개 뉴클레오타이드만큼 상이할 수 있으며, 이는 벌지(bulge) 또는 벌지들(bulges)로서 생각될 수 있다.
일부 구현예에서, 스페이서 서열은 컴퓨터 프로그램을 사용하여 설계 또는 선택된다. 컴퓨터 프로그램은 변수, 예컨대 예측된 용융 온도, 2차 구조 형성, 예측된 어닐링 온도, 서열 동일성, 게놈 컨텍스트, 크로마틴 접근성, % GC, 게놈 발생(예를 들어, 동일하거나 유사하지만 미스매치의 결과로서의 하나 이상의 스팟, 삽입 또는 결실에서 상이한 서열)의 빈도, 메틸화 상태, SNP의 존재 등을 사용할 수 있다.
최소 CRISPR 반복부 서열
일부 구현예에서, 최소 CRISPR 반복부 서열은 기준 CRISPR 반복부 서열(예를 들어, 에스. 파이오게네스로부터의 crRNA)과 적어도 약 30%, 약 40%, 약 50%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 95% 또는 100% 서열 동일성을 갖는 서열이다.
일부 구현예에서, 최소 CRISPR 반복부 서열은 세포에서 최소 tracrRNA 서열에 혼성화될 수 있는 뉴클레오타이드를 갖는다. 최소 CRISPR 반복부 서열 및 최소 tracrRNA 서열은 듀플렉스, 즉 염기쌍-형성된 이중-가닥 구조를 형성한다. 종합하면, 최소 CRISPR 반복부 서열 및 최소 tracrRNA 서열은 부위-지향 폴리펩타이드에 결합한다. 최소 CRISPR 반복부 서열의 적어도 일부는 최소 tracrRNA 서열에 혼성화된다. 일부 구현예에서, 최소 CRISPR 반복부 서열의 적어도 부분은 최소 tracrRNA 서열과 적어도 약 30%, 약 40%, 약 50%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 95% 또는 100% 상보성을 포함한다. 일부 구현예에서, 최소 CRISPR 반복부 서열의 적어도 부분은 최소 tracrRNA 서열과 최대 약 30%, 약 40%, 약 50%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 95% 또는 100% 상보성을 포함한다.
최소 CRISPR 반복부 서열은 약 7개 뉴클레오타이드 내지 약 100개 뉴클레오타이드 길이를 가질 수 있다. 예를 들어, 최소 CRISPR 반복부 서열의 길이는 약 7개 뉴클레오타이드(nt) 내지 약 50 nt, 약 7 nt 내지 약 40 nt, 약 7 nt 내지 약 30 nt, 약 7 nt 내지 약 25 nt, 약 7 nt 내지 약 20 nt, 약 7 nt 내지 약 15 nt, 약 8 nt 내지 약 40 nt, 약 8 nt 내지 약 30 nt, 약 8 nt 내지 약 25 nt, 약 8 nt 내지 약 20 nt, 약 8 nt 내지 약 15 nt, 약 15 nt 내지 약 100 nt, 약 15 nt 내지 약 80 nt, 약 15 nt 내지 약 50 nt, 약 15 nt 내지 약 40 nt, 약 15 nt 내지 약 30 nt 또는 약 15 nt 내지 약 25 nt이다. 일부 구현예에서, 최소 CRISPR 반복부 서열은 대략 9개 뉴클레오타이드 길이이다. 일부 구현예에서, 최소 CRISPR 반복부 서열은 대략 12개 뉴클레오타이드 길이이다.
일부 구현예에서, 최소 CRISPR 반복부 서열은 적어도 6, 7 또는 8개의 인접 뉴클레오타이드의 스트레치(stretch)에 걸쳐 기준 최소 CRISPR 반복부 서열(예를 들어, 에스. 파이오게네스로부터의 야생형 crRNA)과 적어도 약 60% 동일하다. 예를 들어, 최소 CRISPR 반복부 서열은 적어도 6, 7 또는 8개의 인접 뉴클레오타이드의 스트레치에 걸쳐 기준 최소 CRISPR 반복부 서열과 적어도 약 65% 동일, 적어도 약 70% 동일, 적어도 약 75% 동일, 적어도 약 80% 동일, 적어도 약 85% 동일, 적어도 약 90% 동일, 적어도 약 95% 동일, 적어도 약 98% 동일, 적어도 약 99% 동일 또는 100% 동일하다.
최소 tracrRNA 서열
일부 구현예에서, 최소 tracrRNA 서열은 기준 tracrRNA 서열(예를 들어, 에스. 파이오게네스로부터의 야생형 tracrRNA)과 적어도 약 30%, 약 40%, 약 50%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 95% 또는 100% 서열 동일성을 갖는 서열이다.
일부 구현예에서, 최소 tracrRNA 서열은 세포에서 최소 CRISPR 반복부 서열에 혼성화되는 뉴클레오타이드를 갖는다. 최소 tracrRNA 서열 및 최소 CRISPR 반복부 서열은 듀플렉스, 즉 염기쌍-형성된 이중-가닥 구조를 형성한다. 함께, 최소 tracrRNA 서열 및 최소 CRISPR 반복부는 부위-지향 폴리펩타이드에 결합한다. 최소 tracrRNA 서열의 적어도 일부는 최소 CRISPR 반복부 서열에 혼성화될 수 있다. 일부 구현예에서, 최소 tracrRNA 서열은 최소 CRISPR 반복부 서열과 적어도 약 30%, 약 40%, 약 50%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 95% 또는 100% 상보성이다.
최소 tracrRNA 서열은 약 7개 뉴클레오타이드 내지 약 100개 뉴클레오타이드 길이를 가질 수 있다. 예를 들어, 최소 tracrRNA 서열은 약 7개 뉴클레오타이드(nt) 내지 약 50 nt, 약 7 nt 내지 약 40 nt, 약 7 nt 내지 약 30 nt, 약 7 nt 내지 약 25 nt, 약 7 nt 내지 약 20 nt, 약 7 nt 내지 약 15 nt, 약 8 nt 내지 약 40 nt, 약 8 nt 내지 약 30 nt, 약 8 nt 내지 약 25 nt, 약 8 nt 내지 약 20 nt, 약 8 nt 내지 약 15 nt, 약 15 nt 내지 약 100 nt, 약 15 nt 내지 약 80 nt, 약 15 nt 내지 약 50 nt, 약 15 nt 내지 약 40 nt, 약 15 nt 내지 약 30 nt 또는 약 15 nt 내지 약 25 nt 길이일 수 있다. 일부 구현예에서, 최소 tracrRNA 서열은 대략 9개 뉴클레오타이드 길이이다. 일부 구현예에서, 최소 tracrRNA 서열은 대략 12개 뉴클레오타이드이다. 일부 구현예에서, 최소 tracrRNA는 문헌[Jinek , Science, 337(6096):816-821 (2012)]에 기재된 tracrRNA nt 23-48로 구성된다.
일부 구현예에서, 최소 tracrRNA 서열은 적어도 6, 7 또는 8개의 인접 뉴클레오타이드의 스트레치에 걸쳐 기준 최소 tracrRNA(예를 들어, 에스. 파이오게네스로부터의 야생형 tracrRNA) 서열과 적어도 약 60% 동일하다. 예를 들어, 최소 tracrRNA 서열은 적어도 6, 7 또는 8개의 인접 뉴클레오타이드의 스트레치에 걸쳐 기준 최소 tracrRNA 서열과 적어도 약 65% 동일, 약 70% 동일, 약 75% 동일, 약 80% 동일, 약 85% 동일, 약 90% 동일, 약 95% 동일, 약 98% 동일, 약 99% 동일 또는 100% 동일하다.
일부 구현예에서, 최소 CRISPR RNA와 최소 tracrRNA 사이의 듀플렉스는 이중 나선을 갖는다. 일부 구현예에서, 최소 CRISPR RNA와 최소 tracrRNA 사이의 듀플렉스는 적어도 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개 이상의 뉴클레오타이드를 갖는다. 일부 구현예에서, 최소 CRISPR RNA와 최소 tracrRNA 사이의 듀플렉스는 최대 약 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개 이상의 뉴클레오타이드를 갖는다.
일부 구현예에서, 듀플렉스는 미스매치를 갖는다(즉, 듀플렉스의 2개 가닥은 100% 상보적이지는 않음). 일부 구현예에서, 듀플렉스는 적어도 약 1, 2, 3, 4 또는 5개의 미스매치를 갖는다. 일부 구현예에서, 듀플렉스는 최대 약 1, 2, 3, 4, 또는 5개의 미스매치를 갖는다. 일부 구현예에서, 듀플렉스는 2개 이하의 미스매치를 갖는다.
벌지
일부 구현예에서, 최소 CRISPR RNA와 최소 tracrRNA 사이의 듀플렉스에 "벌지"가 존재한다. 벌지는 듀플렉스 내의 뉴클레오타이드의 쌍형성되지 않은(unpaired) 영역이다. 일부 구현예에서, 벌지는 부위-지향 폴리펩타이드에 대한 듀플렉스의 결합에 기여한다. 벌지는 듀플렉스의 한 측면 상에 쌍형성되지 않은 5'-XXXY-3'를 가지며, 여기서 X는 임의의 퓨린이고, Y는 반대 가닥 상의 뉴클레오타이드와 워블 쌍(wobble pair)을 형성할 수 있는 뉴클레오타이드, 및 듀플렉스의 다른 측면 상의 쌍형성되지 않은 뉴클레오타이드 영역을 갖는다. 듀플렉스의 양 측면 상의 쌍형성되지 않은 뉴클레오타이드의 수는 상이할 수 있다.
일례에서, 벌지는 상기 벌지의 최소 CRISPR 반복부 가닥 상에 쌍형성되지 않은 퓨린(예를 들어, 아데닌)을 갖는다. 일부 구현예에서, 벌지는 상기 벌지의 최소 tracrRNA 서열 가닥의 쌍형성되지 않은 5'-AAGY-3'를 가지며, 여기서 Y는 최소 CRISPR 반복부 가닥 상에서 뉴클레오타이드와 워블 쌍형성을 형성할 수 있는 뉴클레오타이드를 갖는다.
일부 구현예에서, 듀플렉스의 최소 CRISPR 반복부 측면 상의 벌지는 적어도 1, 2, 3, 4 또는 5개 이상의 쌍형성되지 않은 뉴클레오타이드를 갖는다. 일부 구현예에서, 듀플렉스의 최소 CRISPR 반복부 측면 상의 벌지는 최대 1, 2, 3, 4 또는 5개 이상의 쌍형성되지 않은 뉴클레오타이드를 갖는다. 일부 구현예에서, 듀플렉스의 최소 CRISPR 반복부 측면 상의 벌지는 1개의 쌍형성되지 않은 뉴클레오타이드를 갖는다.
일부 구현예에서, 듀플렉스의 최소 tracrRNA 서열 측면 상의 벌지는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개 이상의 쌍형성되지 않은 뉴클레오타이드를 갖는다. 일부 구현예에서, 듀플렉스의 최소 tracrRNA 서열 측면 상의 벌지는 최대 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개 이상의 쌍형성되지 않은 뉴클레오타이드를 갖는다. 일부 구현예에서, 듀플렉스의 제2 측면(예를 들어, 듀플렉스의 최소 tracrRNA 서열 측면) 상의 벌지는 4개의 쌍형성되지 않은 뉴클레오타이드를 갖는다.
일부 구현예에서, 벌지는 적어도 하나의 워블 쌍형성을 갖는다. 일부 구현예에서, 벌지는 최대 하나의 워블 쌍형성을 갖는다. 일부 구현예에서, 벌지는 적어도 하나의 퓨린 뉴클레오타이드를 갖는다. 일부 구현예에서, 벌지는 적어도 3개의 퓨린 뉴클레오타이드를 갖는다. 일부 구현예에서, 벌지 서열은 적어도 5개의 퓨린 뉴클레오타이드를 갖는다. 일부 구현예에서, 벌지 서열은 적어도 하나의 구아닌 뉴클레오타이드를 갖는다. 일부 구현예에서, 벌지 서열은 적어도 하나의 아데닌 뉴클레오타이드를 갖는다.
헤어핀
다양한 구현예에서, 하나 이상의 헤어핀은 3' tracrRNA 서열에서 최소 tracrRNA에 대해서 3'에 위치된다.
일부 구현예에서, 헤어핀은 최소 CRISPR 반복부 및 최소 tracrRNA 서열 듀플렉스에서 마지막 쌍형성된 뉴클레오타이드로부터 적어도 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15 또는 20개 이상의 뉴클레오타이드 3'에서 출발한다. 일부 구현예에서, 헤어핀은 최소 CRISPR 반복부 및 최소 tracrRNA 서열 듀플렉스에서 마지막 쌍형성된 뉴클레오타이드의 최대 약 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개 이상의 뉴클레오타이드 3'에서 출발한다.
일부 구현예에서, 헤어핀은 적어도 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15 또는 20개 이상의 연속적인 뉴클레오타이드를 갖는다. 일부 구현예에서, 헤어핀은 최대 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15개 이상의 연속적인 뉴클레오타이드를 갖는다.
일부 구현예에서, 헤어핀은 CC 디뉴클레오타이드(즉, 2개의 연속적인 시토신 뉴클레오타이드)를 갖는다.
일부 구현예에서, 헤어핀은 듀플렉스화된 뉴클레오타이드(예를 들어, 함께 혼성화된, 헤어핀의 뉴클레오타이드)를 갖는다. 예를 들어, 헤어핀은 3' tracrRNA 서열의 헤어핀 듀플렉스의 GG 디뉴클레오타이드에 혼성화된 CC 디뉴클레오타이드를 갖는다.
하나 이상의 헤어핀은 부위-지향 폴리펩타이드의 가이드 RNA-상호작용 영역과 상호작용할 수 있다.
일부 구현예에서, 2개 이상의 헤어핀이 존재하고, 일부 구현예에서 3개 이상의 헤어핀이 존재한다.
3' tracrRNA 서열
일부 구현예에서, 3' tracrRNA 서열은 기준 tracrRNA 서열(예를 들어, 에스. 파이오게네스로부터의 tracrRNA)과 적어도 약 30%, 약 40%, 약 50%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 95% 또는 100% 서열 동일성을 갖는 서열을 갖는다.
일부 구현예에서, 3' tracrRNA 서열은 약 6개 뉴클레오타이드 내지 약 100개 뉴클레오타이드 길이를 갖는다. 예를 들어, 3' tracrRNA 서열은 약 6개 뉴클레오타이드(nt) 내지 약 50 nt, 약 6 nt 내지 약 40 nt, 약 6 nt 내지 약 30 nt, 약 6 nt 내지 약 25 nt, 약 6 nt 내지 약 20 nt, 약 6 nt 내지 약 15 nt, 약 8 nt 내지 약 40 nt, 약 8 nt 내지 약 30 nt, 약 8 nt 내지 약 25 nt, 약 8 nt 내지 약 20 nt, 약 8 nt 내지 약 15 nt, 약 15 nt 내지 약 100 nt, 약 15 nt 내지 약 80 nt, 약 15 nt 내지 약 50 nt, 약 15 nt 내지 약 40 nt, 약 15 nt 내지 약 30 nt, 또는 약 15 nt 내지 약 25 nt의 길이를 가질 수 있다. 일부 구현예에서, 3' tracrRNA 서열은 대략 14개 뉴클레오타이드 길이를 갖는다.
일부 구현예에서, 3' tracrRNA 서열은 적어도 6, 7 또는 8개의 인접 뉴클레오타이드의 스트레치에 걸쳐 기준 3' tracrRNA 서열(예를 들어, 에스. 파이오게네스로부터의 야생형 3' tracrRNA 서열)과 적어도 약 60% 동일하다. 예를 들어, 3' tracrRNA 서열은 적어도 6, 7 또는 8개의 인접 뉴클레오타이드의 스트레치에 걸쳐 기준 3' tracrRNA 서열(예를 들어, 에스. 파이오게네스로부터의 야생형 3' tracrRNA 서열)과 적어도 약 60% 동일, 약 65% 동일, 약 70% 동일, 약 75% 동일, 약 80% 동일, 약 85% 동일, 약 90% 동일, 약 95% 동일, 약 98% 동일, 약 99% 동일 또는 100% 동일하다.
일부 구현예에서, 3' tracrRNA 서열은 1개 초과의 듀플렉스화된 영역(예를 들어, 헤어핀, 혼성화된 영역)을 갖는다. 일부 구현예에서, 3' tracrRNA 서열은 2개의 듀플렉스화된 영역을 갖는다.
일부 구현예에서, 3' tracrRNA 서열은 스템 루프 구조를 갖는다. 일부 구현예에서, 3' tracrRNA에서의 스템 루프 구조는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15 또는 20개 이상의 뉴클레오타이드를 갖는다. 일부 구현예에서, 3' tracrRNA에서의 스템 루프 구조는 최대 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개 이상의 뉴클레오타이드를 갖는다. 일부 구현예에서, 스템 루프 구조는 기능성 모이어티를 갖는다. 예를 들어, 스템 루프 구조는 앱타머(aptamer), 리보자임, 단백질-상호작용 헤어핀, CRISPR 어레이, 인트론 또는 엑손을 가질 수 있다. 일부 구현예에서, 스템 루프 구조는 적어도 약 1, 2, 3, 4 또는 5개 이상의 기능성 모이어티를 갖는다. 일부 구현예에서, 스템 루프 구조는 최대 약 1, 2, 3, 4 또는 5개 이상의 기능성 모이어티를 갖는다.
일부 구현예에서, 3' tracrRNA 서열에서의 헤어핀은 P-도메인을 갖는다. 일부 구현예에서, P-도메인은 헤어핀에서 이중-가닥 영역을 갖는다.
tracrRNA 연장 서열
일부 구현예에서, tracrRNA 연장 서열은, tracrRNA가 단일-분자 가이드 또는 이중-분자 가이드의 맥락에 있든지 간에 제공될 수 있다. 일부 구현예에서, tracrRNA 연장 서열은 약 1개 뉴클레오타이드 내지 약 400개 뉴클레오타이드 길이를 갖는다. 일부 구현예에서, tracrRNA 연장 서열은 1, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 120, 140, 160, 180, 200, 220, 240, 260, 280, 300, 320, 340, 360, 380 또는 400개 초과의 뉴클레오타이드 길이를 갖는다. 일부 구현예에서, tracrRNA 연장 서열은 약 20 내지 약 5000개 이상의 뉴클레오타이드 길이를 갖는다. 일부 구현예에서, tracrRNA 연장 서열은 1000개 초과의 뉴클레오타이드 길이를 갖는다. 일부 구현예에서, tracrRNA 연장 서열은 1, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 120, 140, 160, 180, 200, 220, 240, 260, 280, 300, 320, 340, 360, 380, 400개 이상보다 미만의 뉴클레오타이드 길이를 갖는다. 일부 구현예에서, tracrRNA 연장 서열은 1000개 미만의 뉴클레오타이드 길이를 가질 수 있다. 일부 구현예에서, tracrRNA 연장 서열은 10개 미만의 뉴클레오타이드 길이를 갖는다. 일부 구현예에서, tracrRNA 연장 서열은 10 내지 30개 뉴클레오타이드 길이이다. 일부 구현예에서, tracrRNA 연장 서열은 30 내지 70개 뉴클레오타이드 길이이다.
일부 구현예에서, tracrRNA 연장 서열은 기능성 모이어티(예를 들어, 안정성 제어 서열, 리보자임, 엔도리보뉴클레아제 결합 서열)를 갖는다. 일부 구현예에서, 기능성 모이어티는 전사 종결자 세그먼트(즉, 전사 종결 서열)를 갖는다. 일부 구현예에서, 기능적 모이어티는 약 10개 뉴클레오타이드(nt) 내지 약 100 뉴클레오타이드, 약 10 nt 내지 약 20 nt, 약 20 nt 내지 약 30 nt, 약 30 nt 내지 약 40 nt, 약 40 nt 내지 약 50 nt, 약 50 nt 내지 약 60 nt, 약 60 nt 내지 약 70 nt, 약 70 nt 내지 약 80 nt, 약 80 nt 내지 약 90 nt, 또는 약 90 nt 내지 약 100 nt, 약 15 nt 내지 약 80 nt, 약 15 nt 내지 약 50 nt, 약 15 nt 내지 약 40 nt, 약 15 nt 내지 약 30 nt, 또는 약 15 nt 내지 약 25 nt의 총 길이를 갖는다. 일부 구현예에서, 기능적 모이어티는 진핵생물 세포에서 작용한다. 일부 구현예에서, 기능적 모이어티는 원핵생물 세포에서 작용한다. 일부 구현예에서, 기능적 모이어티는 진핵생물 세포와 원핵생물 세포 둘 다에서 작용한다.
적합한 tracrRNA 연장 기능적 모이어티의 비제한적인 예는, 3' 폴리-아데닐화된 테일(tail), 리보스위치 서열(예를 들어, 단백질 및 단백질 복합체에 의한 조절된 안정성 및/또는 조절된 접근성을 가능하게 하기 위해), dsRNA 듀플렉스(즉, 헤어핀)를 형성하는 서열, RNA를 서브세포 위치(예를 들어, 핵, 미토콘드리아, 엽록체 등)에 표적화하는 서열, 트래킹(예를 들어, 형광 분자에 대한 직접적인 접합, 형광 검출을 용이하게 하는 모이어티에 대한 접합, 형광 검출을 가능하게 하는 서열 등)을 제공하는 변형 또는 서열, 및/또는 단백질(예를 들어, 전사 활성자, 전사 억제자, DNA 메틸트랜스퍼라제, DNA 데메틸라제, 히스톤 아세틸트랜스퍼라제, 히스톤 데아세틸라제 등을 포함하여, DNA에 작용하는 단백질)에 대한 결합 부위를 제공하는 변형 또는 서열을 포함한다. 일부 구현예에서, tracrRNA 연장 서열은 프라이머 결합 부위 또는 분자 인덱스(molecular index)(예를 들어, 바코드 서열)를 갖는다. 일부 구현예에서, tracrRNA 연장 서열은 하나 이상의 친화도 태그를 갖는다.
단일-분자 가이드 링커 서열
일부 구현예에서, 단일-분자 가이드 핵산의 링커 서열은 약 3개 뉴클레오타이드 내지 약 100개 뉴클레오타이드 길이를 갖는다. 상기 Jinek 등에서, 예를 들어, 단순한 4개 뉴클레오타이드 "테트라루프"(-GAAA-)가 사용되었다(문헌[Science, 337(6096):816-821 (2012)]). 예시적인 링커는 약 3개 뉴클레오타이드(nt) 내지 약 90 nt, 약 3 nt 내지 약 80 nt, 약 3 nt 내지 약 70 nt, 약 3 nt 내지 약 60 nt, 약 3 nt 내지 약 50 nt, 약 3 nt 내지 약 40 nt, 약 3 nt 내지 약 30 nt, 약 3 nt 내지 약 20 nt, 약 3 nt 내지 약 10 nt의 길이를 갖는다. 예를 들어, 링커는 약 3 nt 내지 약 5 nt, 약 5 nt 내지 약 10 nt, 약 10 nt 내지 약 15 nt, 약 15 nt 내지 약 20 nt, 약 20 nt 내지 약 25 nt, 약 25 nt 내지 약 30 nt, 약 30 nt 내지 약 35 nt, 약 35 nt 내지 약 40 nt, 약 40 nt 내지 약 50 nt, 약 50 nt 내지 약 60 nt, 약 60 nt 내지 약 70 nt, 약 70 nt 내지 약 80 nt, 약 80 nt 내지 약 90 nt, 또는 약 90 nt 내지 약 100 nt의 길이를 가질 수 있다. 일부 구현예에서, 단일-분자 가이드 핵산의 링커는 4 내지 40개 뉴클레오타이드이다. 일부 구현예에서, 링커는 적어도 약 100, 500, 1000, 1500, 2000, 2500, 3000, 3500, 4000, 4500, 5000, 5500, 6000, 6500 또는 7000개 이상의 뉴클레오타이드이다. 일부 구현예에서, 링커는 최대 약 100, 500, 1000, 1500, 2000, 2500, 3000, 3500, 4000, 4500, 5000, 5500, 6000, 6500 또는 7000개 이상의 뉴클레오타이드이다.
링커는 여러 가지 서열 중 임의의 것을 가질 수 있지만, 일부 구현예에서 링커는 가이드의 다른 기능성 영역을 간섭할 수 있는 분자내 결합을 유발할 만한 가이드 RNA의 다른 부분과 상동성인 광범위한 영역을 갖는 서열을 갖지 않을 것이다. 상기 Jinek 등에서, 단순한 4개 뉴클레오타이드 서열 -GAAA-가 사용되었지만(문헌[Science, 337(6096):816-821 (2012)]), 더 긴 서열을 포함하여 다수의 다른 서열이 마찬가지로 사용될 수 있다.
일부 구현예에서, 링커 서열은 기능성 모이어티를 갖는다. 예를 들어, 링커 서열은 앱타머, 리보자임, 단백질-상호작용 헤어핀, 단백질 결합 부위, CRISPR 어레이, 인트론 또는 엑손을 포함하여 하나 이상의 특질을 가질 수 있다. 일부 구현예에서, 링커 서열은 적어도 약 1, 2, 3, 4 또는 5개 이상의 기능성 모이어티를 갖는다. 일부 구현예에서, 링커 서열은 최대 약 1, 2, 3, 4 또는 5개 이상의 기능성 모이어티를 갖는다.
일부 구현예에서, 본 개시내용에 따라 gRNA에 표적화된 게놈 위치는 게놈, 예를 들어, 인간 게놈 내 내인성 알부민 좌위 내에 또는 그 부근에 있을 수 있다. 이러한 위치를 표적화하는 예시적인 가이드 RNA는 표 3 또는 4에 나열된 스페이서 서열 및 관련된 Cas9 또는 Cpf1 절단 부위를 포함한다. 당업자가 이해하는 바와 같이, 각각의 가이드 RNA는 이의 게놈 표적 서열에 상보적인 스페이서 서열을 포함하도록 설계된다. 예를 들어, 표 3 또는 4에 나열된 각각의 스페이서 서열은 단일 RNA 키메라(chimera) 또는 crRNA(상응하는 tracrRNA와 함께) 내로 투입될 수 있다. 문헌[Jinek , Science, 337, 816-821 (2012)] 및 문헌[Deltcheva , Nature, 471, 602-607 (2011)]을 참조한다.
공여체 DNA 또는 공여체 주형
부위-지향 폴리펩타이드, 예컨대 DNA 엔도뉴클레아제는 핵산, 예를 들어 게놈 DNA에서 이중-가닥 절단부 또는 단일-가닥 절단부를 도입할 수 있다. 이중-가닥 절단부는 세포의 내인성 DNA-수선 경로(예를 들어, 상동성-의존 수선(HDR: homology-dependent repair) 또는 비-상동성 단부 결합(non-homologous end joining) 또는 대체 비-상동성 단부 결합(A-NHEJ: alternative non-homologous end joining) 또는 미세상동성-매개 단부 결합(MMEJ: microhomology-mediated end joining))를 자극할 수 있다. NHEJ는 상동성 주형에 대한 필요성 없이 절단된 표적 핵산을 수선할 수 있다. 이는 때때로 절단 부위에서 표적 핵산 내에 작은 결실 또는 삽입(indel)을 초래할 수 있고, 유전자 발현의 교란(disruption) 또는 변경을 유발할 수 있다. 상동성 재조합(HR: homologous recombination)으로도 알려진 HDR은 상동성 수선 주형 또는 공여체가 이용 가능할 때 발생할 수 있다.
상동성 공여체 주형은 표적 핵산 절단 부위에 측면 근접된 서열에 상동성인 서열을 갖는다. 자매 염색분체가 일반적으로 세포에 의해 수선 주형으로서 사용된다. 그러나, 게놈 편집의 목적을 위해서, 수선 주형은 종종 외인성 핵산, 예컨대 플라스미드, 듀플렉스 올리고뉴클레오타이드, 단일-가닥 올리고뉴클레오타이드, 이중-가닥 올리고뉴클레오타이드, 또는 바이러스 핵산으로서 공급된다. 외인성 공여체 주형을 사용하는 경우, 상동성의 측면 근접 영역들 사이에 추가 핵산 서열(예컨대 이식유전자) 또는 변형(예컨대 단일 또는 다수의 염기 변화 또는 결실)을 도입하여, 추가 또는 변경된 핵산 서열이 또한 표적 좌위 내에 혼입되게 되는 것이 보편적이다. MMEJ는 작은 결실 및 삽입이 절단 부위에서 발생할 수 있다는 점에서 NHEJ와 유사한 유전적 성과를 초래한다. MMEJ는 절단 부위에 측면 근접된 몇몇 염기쌍의 상동성 서열을 사용하여, 선호되는 단부-결합 DNA 수선 성과를 유도한다. 일부 예에서, 뉴클레아제 표적 영역에서의 잠재적인 미세상동성의 분석에 기초하여, 가능한 수선 성과를 예측하는 것이 가능할 수 있다.
그러므로, 일부 경우에, 상동성 재조합을 사용하여 외인성 폴리뉴클레오타이드 서열을 표적 핵산 절단 부위 내로 삽입한다. 외인성 폴리뉴클레오타이드 서열은 본원에서 공여체 폴리뉴클레오타이드(또는 공여체 또는 공여체 서열 또는 폴리뉴클레오타이드 공여체 주형)로 지칭된다. 일부 구현예에서, 공여체 폴리뉴클레오타이드, 공여체 폴리뉴클레오타이드의 일부, 공여체 폴리뉴클레오타이드의 복사체, 또는 공여체 폴리뉴클레오타이드의 복사체의 일부가 표적 핵산 절단 부위 내로 삽입된다. 일부 구현예에서, 공여체 폴리뉴클레오타이드는 외인성 폴리뉴클레오타이드 서열, 즉, 표적 핵산 절단 부위에서 자연적으로 발생하지 않는 서열이다.
이중 가닥 절단부가 발생하는 세포의 핵 내부에 외인성 DNA 분자가 충분한 농도로 공급될 때, 상기 외인성 DNA는 NHEJ 수선 과정 동안 이중 가닥 절단부에 삽입되므로 게놈에의 영구적인 첨가가 될 수 있다. 일부 구현예에서, 이들 외인성 DNA 분자는 공여체 주형으로 지칭된다. 공여체 주형이 선택적으로 관련 조절 서열, 예컨대 프로모터, 인핸서, polyA 서열 및/또는 스플라이스 수용기 서열(본원에서 "공여체 카세트"로 지칭되기도 함)과 함께 관심 유전자, 예컨대 FVIII 유전자에 대한 코딩 서열을 함유한다면, 상기 관심 유전자는 게놈 내 통합된 복사체로부터 발현되어 세포의 수명 동안 영구적인 발현을 초래할 수 있다. 더욱이, 공여체 DNA 주형의 통합된 복사체는 세포가 분열할 때 딸세포로 전파될 수 있다.
이중 가닥 절단부의 어느 한면의 DNA 서열과 상동성을 갖는 측면 근접 DNA 서열(상동성 아암(arm)으로 지칭됨)을 함유하는 공여체 DNA 주형이 충분한 농도로 존재할 때, 공여체 DNA 주형은 HDR 경로를 통해 통합될 수 있다. 상동성 아암은 이중 가닥 절단부의 어느 한면의 서열과 공여체 주형 사이에서 상동성 재조합을 위한 기질로서 작용한다. 이는, 이중 가닥 절단부의 어느 한면의 서열이 비-변형된 게놈 내의 것으로부터 변경되지 않는, 공여체 주형의 무오류(error free) 삽입을 초래할 수 있다.
HDR에 의한 편집을 위한 공급된 공여체는 상당히 다양하지만 일반적으로는 게놈 DNA에 대한 어닐링을 가능하게 하도록 작거나 큰 측면 근접 상동성 아암을 갖는 의도된 서열을 함유한다. 도입된 유전적 변화에 측면 근접된 상동성 영역은 30 bp 이하일 수 있거나, 프로모터, cDNA 등을 함유할 수 있는 수-킬로베이스의 카세트만큼 클 수 있다. 단일-가닥 올리고뉴클레오타이드 공여체와 이중-가닥 올리고뉴클레오타이드 공여체 둘 다 사용될 수 있다. 이들 올리고뉴클레오타이드는 100 nt 미만 내지 수 kb 초과의 크기 범위이지만, 더 긴 ssDNA가 또한 생성 및 사용될 수 있다. PCR 앰플리콘(amplicon), 플라스미드 및 미니-서클을 포함하여 이중-가닥 공여체가 종종 사용된다. 일반적으로, AAV 벡터가 공여체 주형의 전달의 매우 효과적인 수단인 것으로 밝혀졌지만, 개별 공여체에 대한 패키징 한계는 5 kb 미만이다. 공여체의 활성 전사는 HDR을 3-배 증가시켰는데, 이는 프로모터의 포함이 전환율을 증가시킬 수 있음을 나타낸다. 이에 반해, 공여체의 CpG 메틸화는 유전자 발현 및 HDR을 저하시킬 수 있다.
일부 구현예에서, 공여체 DNA는 여러 가지 상이한 방법에 의해, 예를 들어, 형질주입, 나노-입자, 마이크로-주사 또는 바이러스 형질도입에 의해 뉴클레아제와 함께 또는 독립적으로 공급될 수 있다. 일부 구현예에서, HDR을 위한 공여체의 사용 가능성을 증가시키기 위해 광범위한 테더링 옵션(tethering option)이 사용될 수 있다. 예는, 공여체를 뉴클레아제에 부착시키는 것, 근처에 결합하는 DNA 결합 단백질에 부착시키는 것, 또는 DNA 단부 결합 또는 수선에 관여된 단백질에 부착시키는 것을 포함한다.
NHEJ 또는 HDR에 의한 게놈 편집에 더하여, NHEJ 경로와 HR 둘 다 사용하는 부위-특이적 유전자 삽입이 수행될 수 있다. 아마도 인트론/엑손 경계를 포함하여, 소정의 설정에서 조합 접근법이 적용 가능할 수 있다. NHEJ는 인트론에서 리게이션에 효과적인 것으로 증명될 수 있지만, 무오류 HDR은 코딩 영역에서 더욱 적합해질 수 있다.
일부 구현예에서, 게놈 내로 삽입되고자 하는 외인성 서열은 관심 유전자(GOI) 또는 이의 기능적 유도체이다. 외인성 유전자는 GOI 생성물, 예를 들어, GOI 단백질, 또는 이의 기능적 유도체를 인코딩하는 뉴클레오타이드 서열을 포함한다. GOI의 기능적 유도체는, 야생형 GOI 단백질, 예컨대 야생형 인간 GOI 단백질의 실질적인 활성, 예를 들어, 야생형 GOI 단백질이 나타내는 활성의 적어도 약 30%, 약 40%, 약 50%, 약 60%, 약 70%, 약 80%, 약 90%, 약 95% 또는 약 100%를 갖는 GOI 단백질의 기능적 유도체를 인코딩하는 핵산 서열을 포함할 수 있다. 일부 구현예에서, GOI 단백질의 기능적 유도체는 GOI 단백질, 예를 들어, 야생형 GOI 단백질과 적어도 약 30%, 약 40%, 약 50%, 약 60%, 약 70%, 약 80%, 약 85%, 약 90%, 약 95%, 약 96%, 약 97%, 약 98% 또는 약 99%의 아미노산 서열 동일성을 가질 수 있다. 일부 구현예에서, 당업자는 당업계에 알려진 많은 방법을 사용하여, 화합물, 예를 들어, 펩타이드 또는 단백질의 기능성 또는 활성을 시험할 수 있다. GOI 단백질의 기능적 유도체는 또한, 야생형 GOI 단백질의 임의의 단편, 또는 전장, 야생형 GOI 단백질 내 하나 이상의 아미노산 잔기 상에 보존적 변형을 갖는 변형된 GOI 단백질의 단편을 포함할 수 있다. 그러므로, 일부 구현예에서, GOI의 핵산 서열의 기능적 유도체는 GOI, 예를 들어, 야생형 GOI와 적어도 약 30%, 약 40%, 약 50%, 약 60%, 약 70%, 약 80%, 약 85%, 약 90%, 약 95%, 약 96%, 약 97%, 약 98% 또는 약 99%의 핵산 서열 동일성을 가질 수 있다.
GOI 또는 이의 기능적 유도체의 삽입이 관련되어 있는 일부 구현예에서, GOI 또는 이의 기능적 유도체의 cDNA는 결함적 GOI 또는 이의 조절 서열을 갖는 환자의 게놈 내로 삽입될 수 있다. 이러한 경우, 공여체 DNA 또는 공여체 주형은 GOI 또는 이의 기능적 유도체를 인코딩하는 서열, 예를 들어, cDNA 서열을 갖는 발현 카세트 또는 벡터 작제물일 수 있다. 일부 구현예에서, 발현 벡터는 변형된 GOI 단백질, 예컨대 FVIII-BDD를 인코딩하는 서열을 함유하며, 이는 본 개시내용의 어디에나 기재되어 있고 사용될 수 있다.
일부 구현예에서, 공여체 카세트를 포함하는 본원에 기재된 임의의 공여체 주형에 따르면, 상기 공여체 카세트는 한면 또는 양면 상에서 gRNA 표적 부위에 의해 측면 근접해 있다. 예를 들어, 이러한 공여체 주형은 공여체 카세트의 gRNA 표적 부위 5' 및/또는 공여체 카세트의 gRNA 표적 부위 3'와 함께 공여체 카세트를 포함할 수 있다. 일부 구현예에서, 공여체 주형은 공여체 카세트의 gRNA 표적 부위 5'와 함께 공여체 카세트를 포함한다. 일부 구현예에서, 공여체 주형은 공여체 카세트의 gRNA 표적 부위 3'와 함께 공여체 카세트를 포함한다. 일부 구현예에서, 공여체 주형은 공여체 카세트의 gRNA 표적 부위 5' 및 공여체 카세트의 gRNA 표적 부위 3'와 함께 공여체 카세트를 포함한다. 일부 구현예에서, 공여체 주형은 공여체 카세트의 gRNA 표적 부위 5' 및 공여체 카세트의 gRNA 표적 부위 3'와 함께 공여체 카세트를 포함하고, 2개의 gRNA 표적 부위는 동일한 서열을 포함한다. 일부 구현예에서, 공여체 주형은 적어도 하나의 gRNA 표적 부위를 포함하고, 상기 공여체 주형 내 적어도 하나의 gRNA 표적 부위는 공여체 주형의 공여체 카세트가 통합되어야 하는 표적 좌위 내 gRNA 표적 부위와 동일한 서열을 포함한다. 일부 구현예에서, 공여체 주형은 적어도 하나의 gRNA 표적 부위를 포함하고, 상기 공여체 주형 내 적어도 하나의 gRNA 표적 부위는 공여체 주형의 공여체 카세트가 통합되어야 하는 표적 좌위 내 gRNA 표적 부위의 역보체를 포함한다. 일부 구현예에서, 공여체 주형은 공여체 카세트의 gRNA 표적 부위 5' 및 공여체 카세트의 gRNA 표적 부위 3'와 함께 공여체 카세트를 포함하고, 공여체 주형 내 2개의 gRNA 표적 부위는 공여체 주형의 공여체 카세트가 통합되어야 하는 표적 부위 내 gRNA 표적 부위와 동일한 서열을 포함한다. 일부 구현예에서, 공여체 주형은 공여체 카세트의 gRNA 표적 부위 5' 및 공여체 카세트의 gRNA 표적 부위 3'와 함께 공여체 카세트를 포함하고, 공여체 주형 내 2개의 gRNA 표적 부위는 공여체 주형의 공여체 카세트가 통합되어야 하는 표적 부위 내 gRNA 표적 부위의 역보체를 포함한다.
부위-지향적 폴리펩타이드 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산
따라서, 일부 구현예에서, 게놈 편집 방법 및 조성물은 부위-지향적 폴리펩타이드 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산 서열(또는 올리고뉴클레오타이드)을 사용할 수 있다. 부위-지향적 폴리펩타이드를 인코딩하는 핵산 서열은 DNA 또는 RNA일 수 있다. 부위-지향적 폴리펩타이드를 인코딩하는 핵산 서열이 RNA라면, 이는 gRNA 서열에 공유 연결되거나 별도의 서열로서 존재할 수 있다. 일부 구현예에서, 부위-지향적 폴리펩타이드 또는 DNA 엔도뉴클레아제의 펩타이드 서열은 이의 핵산 서열 대신에 사용될 수 있다.
벡터
또 다른 양태에서, 본 개시내용은 본 개시내용의 게놈-표적화 핵산, 본 개시내용의 부위-지향 폴리펩타이드 및/또는 본 개시내용의 구현예를 수행하는 데 필요한 임의의 핵산 또는 단백질 분자를 인코딩하는 뉴클레오타이드 서열을 갖는 핵산을 제공한다. 일부 구현예에서, 이러한 핵산은 벡터(예를 들어, 재조합 발현 벡터)이다.
고려되는 발현 벡터는 백시니아(vaccinia) 바이러스, 폴리오바이러스, 아데노바이러스, 아데노-관련 바이러스, SV40, 단순 포진 바이러스, 인간 면역결핍 바이러스, 레트로바이러스(예를 들어, 뮤린 백혈구 바이러스, 비장 괴사 바이러스, 및 레트로바이러스, 예컨대 라우스 육종(Rous Sarcoma) 바이러스, 하비 육종(Harvey Sarcoma) 바이러스, 조류 백혈증 바이러스, 렌티바이러스, 인간 면역결핍 바이러스, 골수증식성 육종(myeloproliferative sarcoma) 바이러스, 및 유방 종양 바이러스로부터 유래된 벡터) 및 다른 재조합 벡터에 기초한 바이러스 벡터를 포함하지만, 이들로 제한되지 않는다. 진핵생물 표적 세포에 고려되는 다른 벡터는 벡터 pXT1, pSG5, pSVK3, pBPV, pMSG, 및 pSVLSV40(Pharmacia)을 포함하지만, 이들로 제한되지 않는다. 진핵생물 표적 세포에 고려되는 추가 벡터는 벡터 pCTx-1, pCTx-2, 및 pCTx-3을 포함하지만, 이들로 제한되지 않는다. 숙주 세포와 융화성인 한, 다른 벡터가 사용될 수 있다.
일부 구현예에서, 벡터는 하나 이상의 전사 및/또는 번역 제어 요소를 갖는다. 이용되는 숙주/벡터 시스템에 따라, 구성적 프로모터 및 유도성 프로모터, 전사 인핸서 요소, 전사 종결자 등을 포함하여 임의의 다수의 적합한 전사 및 번역 제어 요소가 발현 벡터에 사용될 수 있다. 일부 구현예에서, 벡터는 바이러스 서열 또는 CRISPR 머시너리 또는 다른 요소의 구성요소를 불활성화시키는 자기-불활성화 벡터이다.
적합한 진핵생물 프로모터(즉, 진핵생물 세포에서 기능적인 프로모터)의 비제한적인 예는 거대세포바이러스(CMV: cytomegalovirus) 급초기(immediate early), 단순 포진 바이러스(HSV) 티미딘 키나제, 초기 및 후기 SV40, 레트로바이러스로부터의 긴 말단 반복부(LTR: long terminal repeat), 인간 연장 인자-1 프로모터(EF1), 닭 베타-액틴 프로모터(CAG)에 융합된 거대세포바이러스(CMV) 인핸서를 갖는 하이브리드 작제물, 뮤린 줄기세포 바이러스 프로모터(MSCV), 포스포글리세레이트 키나제-1 좌위 프로모터(PGK) 및 마우스 메탈로티오네인-I로부터의 것을 포함한다.
Cas 엔도뉴클레아제와 연계되어 사용되는 가이드 RNA를 포함하여 작은 RNA를 발현시키기 위해, 예를 들어 U6 및 H1을 포함하여 RNA 중합효소 III 프로모터와 같은 다양한 프로모터가 유리할 수 있다. 이러한 프로모터의 사용을 증강시키기 위한 설명 및 매개변수는 당업계에 알려져 있고, 추가 정보 및 접근법은 정기적으로 기재되어 있으며; 예를 들어, 문헌[Ma, H. 등, Molecular Therapy - Nucleic Acids 3, e161 (2014) doi:10.1038/mtna.2014.12]를 참조한다.
발현 벡터는 또한 번역 개시를 위한 리보솜 결합 부위 및 전사 종결자를 함유할 수 있다. 발현 벡터는 또한 발현을 증폭시키기 위한 적절한 서열을 포함할 수 있다. 발현 벡터는 또한 부위-지향 폴리펩타이드에 융합된 비-네이티브 태그(예를 들어, 히스티딘 태그, 헤마글루티닌 태그, 녹색 형광 단백질 등)를 인코딩하는 뉴클레오타이드 서열을 포함하여, 융합 단백질을 초래할 수 있다.
일부 구현예에서, 프로모터는 유도성 프로모터(예를 들어, 열 충격 프로모터, 테트라사이클린-조절 프로모터, 스테로이드-조절 프로모터, 금속-조절 프로모터, 에스트로겐 수용체-조절 프로모터 등)이다. 일부 구현예에서, 프로모터는 구성적 프로모터(예를 들어, CMV 프로모터, UBC 프로모터)이다. 일부 구현예에서, 프로모터는 공간적으로 제약되고/거나 시간적으로(temporally) 제약된 프로모터(예를 들어, 조직 특이적 프로모터, 세포 유형 특이적 프로모터 등)이다. 일부 구현예에서, 유전자가 발현되고자 한다면 상기 유전자는 게놈 내로 삽입된 후 상기 게놈에 존재하는 내인성 프로모터 하에, 벡터는 숙주 세포에서 발현되고자 하는 적어도 하나의 유전자에 대한 프로모터를 갖지 않는다.
부위-지향적 폴리펩타이드 또는 DNA 엔도뉴클레아제
NHEJ 및/또는 HDR로 인한 표적 DNA의 변형은 예를 들어, 돌연변이, 결실, 변경, 통합, 유전자 교정, 유전자 대체, 유전자 태깅, 이식유전자 삽입, 뉴클레오타이드 결실, 유전자 교란, 전좌 및/또는 유전자 돌연변이를 유발할 수 있다. 비-네이티브 핵산을 게놈 DNA 내로 통합시키는 과정은 게놈 편집의 일례이다.
부위-지향 폴리펩타이드는 DNA를 절단하기 위해 게놈 편집에 사용되는 뉴클레아제이다. 부위-지향은 하나 이상의 폴리펩타이드 또는 상기 폴리펩타이드를 인코딩하는 하나 이상의 mRNA로서 세포 또는 환자에게 투여될 수 있다.
CRISPR/Cas 또는 CRISPR/Cpf1 시스템의 맥락에서, 부위-지향 폴리펩타이드는 결국 폴리펩타이드가 지향되는 표적 DNA 내 부위를 명시하는 가이드 RNA에 결합할 수 있다. 본원에서 CRISPR/Cas 또는 CRISPR/Cpf1 시스템의 일부 구현예에서, 부위-지향 폴리펩타이드는 엔도뉴클레아제, 예컨대 DNA 엔도뉴클레아제이다.
일부 구현예에서, 부위-지향 폴리펩타이드는 복수의 핵산-절단(즉, 뉴클레아제) 도메인들을 갖는다. 2개 이상의 핵산-절단 도메인은 링커를 통해 함께 연결될 수 있다. 일부 구현예에서, 링커는 가요성 링커를 갖는다. 링커는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 35, 40개 이상의 아미노산 길이를 가질 수 있다.
자연-발생 야생형 Cas9 효소는 2개의 뉴클레아제 도메인인 HNH 뉴클레아제 도메인 및 RuvC 도메인을 포함한다. 본원에서, "Cas9"는 자연-발생 Cas9와 재조합 Cas9 둘 다 지칭한다. 본원에서 고려되는 Cas9 효소는 HNH 또는 HNH-유사 뉴클레아제 도메인, 및/또는 RuvC 또는 RuvC-유사 뉴클레아제 도메인을 갖는다.
HNH 또는 HNH-유사 도메인은 McrA-유사 폴드(fold)를 갖는다. HNH 또는 HNH-유사 도메인은 2개의 역평행 β-가닥 및 α-나선을 갖는다. HNH 또는 HNH-유사 도메인은 금속 결합 부위(예를 들어, 2가 양이온 결합 부위)를 갖는다. HNH 또는 HNH-유사 도메인은 표적 핵산의 하나의 가닥(예를 들어, crRNA 표적화 가닥의 상보적 가닥)을 절단할 수 있다.
RuvC 또는 RuvC-유사 도메인은 RNaseH 또는 RNaseH-유사 폴드를 갖는다. RuvC/RNaseH 도메인은 RNA와 DNA 둘 다에 대한 작용을 포함하여 핵산-기초 기능의 다양한 세트에 관여한다. RNaseH 도메인은 복수의 α-나선들에 의해 둘러싸인 5개의 β-가닥을 갖는다. RuvC/RNaseH 또는 RuvC/RNaseH-유사 도메인은 금속 결합 부위(예를 들어, 2가 양이온 결합 부위)를 갖는다. RuvC/RNaseH 또는 RuvC/RNaseH-유사 도메인은 표적 핵산의 하나의 가닥(예를 들어, 이중-가닥 표적 DNA의 비-상보적 가닥)을 절단할 수 있다.
일부 구현예에서, 부위-지향 폴리펩타이드는 야생형의 예시적인 부위-지향적 폴리펩타이드[예를 들어, 에스. 파이오게네스로부터의 Cas9, US2014/0068797 서열 ID No. 8 또는 문헌[Sapranauskas 등, Nucleic Acids Res, 39(21): 9275-9282 (2011)]], 및 다양한 다른 부위-지향 폴리펩타이드와 적어도 10%, 적어도 15%, 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 99%, 또는 100% 아미노산 서열 동일성을 갖는 아미노산 서열을 갖는다.
일부 구현예에서, 부위-지향 폴리펩타이드는 야생형의 예시적인 부위-지향 폴리펩타이드(예를 들어, 상기 에스. 파이오게네스로부터의 Cas9)의 뉴클레아제 도메인과 적어도 10%, 적어도 15%, 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 99% 또는 100% 아미노산 서열 동일성을 갖는 아미노산 서열을 갖는다.
일부 구현예에서, 부위-지향 폴리펩타이드는 10개의 인접 아미노산에 걸쳐 야생형 부위-지향 폴리펩타이드(예를 들어, 상기 에스. 파이오게네스로부터의 Cas9)와 적어도 70%, 75%, 80%, 85%, 90%, 95%, 97%, 99% 또는 100% 동일성을 갖는다. 일부 구현예에서, 부위-지향 폴리펩타이드는 10개의 인접 아미노산에 걸쳐 야생형 부위-지향 폴리펩타이드(예를 들어, 상기 에스. 파이오게네스로부터의 Cas9)와 최대 70%, 75%, 80%, 85%, 90%, 95%, 97%, 99% 또는 100% 동일성을 갖는다. 일부 구현예에서, 부위-지향 폴리펩타이드는 상기 부위-지향 폴리펩타이드의 HNH 뉴클레아제 도메인 내의 10개의 인접 아미노산에 걸쳐 야생형 부위-지향 폴리펩타이드(예를 들어, 상기 에스. 파이오게네스로부터의 Cas9)와 적어도 70%, 75%, 80%, 85%, 90%, 95%, 97%, 99% 또는 100% 동일성을 갖는다. 일부 구현예에서, 부위-지향 폴리펩타이드는 상기 부위-지향 폴리펩타이드의 HNH 뉴클레아제 도메인 내의 10개의 인접 아미노산에 걸쳐 야생형 부위-지향 폴리펩타이드(예를 들어, 상기 에스. 파이오게네스로부터의 Cas9)와 최대 70%, 75%, 80%, 85%, 90%, 95%, 97%, 99% 또는 100% 동일성을 갖는다. 일부 구현예에서, 부위-지향 폴리펩타이드는 상기 부위-지향 폴리펩타이드의 RuvC 뉴클레아제 도메인 내의 10개의 인접 아미노산에 걸쳐 야생형 부위-지향 폴리펩타이드(예를 들어, 상기 에스. 파이오게네스로부터의 Cas9)와 적어도 70%, 75%, 80%, 85%, 90%, 95%, 97%, 99% 또는 100% 동일성을 갖는다. 일부 구현예에서, 부위-지향 폴리펩타이드는 상기 부위-지향 폴리펩타이드의 RuvC 뉴클레아제 도메인 내의 10개의 인접 아미노산에 걸쳐 야생형 부위-지향 폴리펩타이드(예를 들어, 상기 에스. 파이오게네스로부터의 Cas9)와 최대 70%, 75%, 80%, 85%, 90%, 95%, 97%, 99% 또는 100% 동일성을 갖는다.
일부 구현예에서, 부위-지향 폴리펩타이드는 야생형의 예시적인 부위-지향 폴리펩타이드의 변형된 형태를 갖는다. 야생형의 예시적인 부위-지향 폴리펩타이드의 변형된 형태는 부위-지향 폴리펩타이드의 핵산-절단 활성을 감소시키는 돌연변이를 갖는다. 일부 구현예에서, 야생형의 예시적인 부위-지향 폴리펩타이드의 변형된 형태는 상기 야생형의 예시적인 부위-지향적 폴리펩타이드(예를 들어, 상기 에스. 파이오게네스로부터의 Cas9)의 핵산-절단 활성의 90% 미만, 80% 미만, 70% 미만, 60% 미만, 50% 미만, 40% 미만, 30% 미만, 20% 미만, 10% 미만, 5% 미만, 또는 1% 미만을 갖는다. 부위-지향 폴리펩타이드의 변형된 형태는 실질적인 핵산-절단 활성을 갖지 않을 수 있다. 부위-지향 폴리펩타이드가 실질적인 핵산-절단 활성을 갖지 않는 변형된 형태일 때, 이는 본원에서 "효소적으로 불활성"이라고 지칭된다.
일부 구현예에에서, 부위-지향 폴리펩타이드의 변형된 형태는, 이것이 (예를 들어, 이중-가닥 표적 핵산의 당-포스페이트 골격 중 단지 하나를 절단함으로써) 표적 핵산 상에 단일-가닥 절단부(SSB)를 유도할 수 있도록 돌연변이를 갖는다. 일부 구현예에서, 돌연변이는 야생형 부위-지향 폴리펩타이드(예를 들어, 상기 에스. 파이오게네스로부터의 Cas9)의 복수의 핵산-절단 도메인들 중 하나 이상에서 핵산-절단 활성의 90% 미만, 80% 미만, 70% 미만, 60% 미만, 50% 미만, 40% 미만, 30% 미만, 20% 미만, 10% 미만, 5% 미만, 또는 1% 미만을 초래한다. 일부 구현예에에서, 돌연변이는 표적 핵산의 상보적 가닥을 절단하는 능력을 보유하지만, 표적 핵산의 비-상보적 가닥을 절단하는 이의 능력을 감소시키는 복수의 핵산-절단 도메인들 중 하나 이상을 초래한다. 일부 구현예에에서, 돌연변이는 표적 핵산의 비-상보적 가닥을 절단하는 능력을 보유하지만, 표적 핵산의 상보적 가닥을 절단하는 이의 능력을 감소시키는 복수의 핵산-절단 도메인들 중 하나 이상을 초래한다. 예를 들어, 야생형의 예시적인 에스. 파이오게네스 Cas9 폴리펩타이드 내의 잔기, 예컨대 Asp10, His840, Asn854 및 Asn856은 복수의 핵산-절단 도메인들(예를 들어, 뉴클레아제 도메인) 중 하나 이상을 불활성시키도록 돌연변이화된다. 일부 구현예에서, 돌연변이화되는 잔기는 야생형의 예시적인 에스. 파이오게네스 Cas9 폴리펩타이드(예를 들어, 서열 및/또는 구조적 정렬에 의해 결정된 바와 같음) 내 잔기 Asp10, His840, Asn854 및 Asn856에 상응한다. 돌연변이의 비제한적인 예는 D10A, H840A, N854A 또는 N856A를 포함한다. 당업자는 알라닌 치환 이외의 돌연변이가 적합함을 인식할 것이다.
일부 구현예에서, D10A 돌연변이는 H840A, N854A, 또는 N856A 돌연변이 중 하나 이상과 조합되어, DNA 절단 활성이 실질적으로 결여된 부위-지향적 폴리펩타이드를 생성한다. 일부 구현예에서, H840A 돌연변이는 D10A, N854A, 또는 N856A 돌연변이 중 하나 이상과 조합되어, DNA 절단 활성이 실질적으로 결여된 부위-지향적 폴리펩타이드를 생성한다. 일부 구현예에서, N854A 돌연변이는 H840A, D10A, 또는 N856A 돌연변이 중 하나 이상과 조합되어, DNA 절단 활성이 실질적으로 결여된 부위-지향적 폴리펩타이드를 생성한다. 일부 구현예에서, N856A 돌연변이는 H840A, N854A, 또는 D10A 돌연변이 중 하나 이상과 조합되어, DNA 절단 활성이 실질적으로 결여된 부위-지향적 폴리펩타이드를 생성한다. 실질적으로 불활성 뉴클레아제 도메인을 갖는 부위-지향 폴리펩타이드는 "닉카제(nickase)"로 지칭된다.
일부 구현예에서, RNA-가이드 엔도뉴클레아제, 예를 들어 Cas9의 변이체는 CRISPR-매개 게놈 편집의 특이성을 증가시키는 데 사용될 수 있다. 야생형 Cas9는 일반적으로 표적 서열 내의 명시된 약 20개 뉴클레오타이드 서열(예컨대 내인성 게놈 좌위)과 혼성화되도록 설계된 단일 가이드 RNA에 의해 가이드된다. 그러나, 몇몇 미스매치는 가이드 RNA와 표적 좌위 사이에서 용인(torelated)되어, 표적 부위에서 필요한 상동성의 길이를 예를 들어, 13 nt만큼의 낮은 상동성으로 효과적으로 감소시켜서, 표적 게놈 내 어디에서나 결합 및 CRISPR/Cas9 복합체에 의한 이중-가닥 핵산 절단 - 표적외 절단으로도 알려져 있음 - 에 대한 잠재성을 상승시킬 수 있다. Cas9의 닉카제 변이체는 각각 단지 하나의 가닥을 절단하기 때문에, 이중-가닥 절단부를 생성하기 위해서는 닉카제의 쌍은 표적 핵산의 가까운 근접부에서 그리고 반대 가닥 상에서 결합하여, 이중-가닥 절단부의 등가물인 한 쌍의 닉(nick)을 생성하는 것이 필요하다. 이는 2개의 별도의 가이드 RNA - 각각의 닉카제에 대해 1개 - 가 표적 핵산의 가까운 근접부에서 그리고 반대 가닥 상에서 결합해야 한다는 것을 필요로 한다. 이러한 요건은 생성되는 이중-가닥 절단부에 대해서 요구되는 상동성의 최소 길이를 본질적으로 2배로 만들고, 이에 의해서 이중-가닥 절단 사건이 게놈 내에서 다른 곳에서 일어날 가능성을 감소시키고, 여기서 2종의 가이드 RNA 부위 - 그것이 존재하는 경우 - 는 이중-가닥 절단부가 형성되게 하기에 서로에 대해서 충분히 가까울 가능성이 낮다. 당업계에 기재된 바와 같이, 닉카제를 또한 사용하여 NHEJ에 비해서 HDR를 촉진시킬 수 있다. HDR을 사용하여 목적하는 변화를 효과적으로 매개하는 특이적 공여체 서열의 사용을 통해서 게놈 내의 표적 부위 내에 선택된 변화를 도입할 수 있다. 유전자 편집에서 사용하기 위한 다양한 CRISPR/Cas 시스템의 설명은 예를 들어, 국제특허출원공개 WO2013/176772호; 문헌[Nature Biotechnology 32, 347-355 (2014)], 및 이에서 인용된 참조문헌에서 찾아볼 수 있다.
일부 구현예에에서, 부위-지향 폴리펩타이드(예를 들어, 변이체, 돌연변이된, 효소적으로 불활성 및/또는 조건부로 효소적으로 불활성인 부위-지향 폴리펩타이드)는 핵산을 표적화한다. 일부 구현예에에서, 부위-지향 폴리펩타이드(예를 들어, 변이체, 돌연변이된, 효소적으로 불활성 및/또는 조건부로 효소적으로 불활성인 엔도리보뉴클레아제)는 DNA를 표적화한다. 일부 구현예에에서, 부위-지향 폴리펩타이드(예를 들어, 변이체, 돌연변이된, 효소적으로 불활성 및/또는 조건부로 효소적으로 불활성인 엔도리보뉴클레아제)는 RNA를 표적화한다.
일부 구현예에에서, 부위-지향 폴리펩타이드는 하나 이상의 비-네이티브 서열을 갖는다(예를 들어, 부위-지향 폴리펩타이드는 융합 단백질임).
일부 구현예에에서, 부위-지향 폴리펩타이드는 박테리아(예를 들어, 에스. 파이오게네스)로부터의 Cas9와 적어도 15% 아미노산 동일성을 갖는 아미노산 서열, 핵산 결합 도메인, 및 2개의 핵산 절단 도메인(즉, HNH 도메인 및 RuvC 도메인)을 갖는다.
일부 구현예에에서, 부위-지향 폴리펩타이드는 박테리아(예를 들어, 에스. 파이오게네스)로부터의 Cas9와 적어도 15% 아미노산 동일성을 갖는 아미노산 서열, 및 2개의 핵산 절단 도메인(즉, HNH 도메인 및 RuvC 도메인)을 갖는다.
일부 구현예에서, 부위-지향 폴리펩타이드는 박테리아(예를 들어, 에스. 파이오게네스)로부터의 Cas9과 적어도 15% 아미노산 동일성을 갖는 아미노산 서열, 및 2개의 핵산 절단 도메인을 가지며, 상기 핵산 절단 도메인 중 하나 또는 둘 다는 박테리아(예를 들어, 에스. 파이오게네스)로부터의 Cas9로부터의 뉴클레아제 도메인과 적어도 50% 아미노산 동일성을 갖는다.
일부 구현예에서, 부위-지향 폴리펩타이드는 박테리아(예를 들어, 에스. 파이오게네스)로부터의 Cas9와 적어도 15% 아미노산 동일성을 갖는 아미노산 서열, 2개의 핵산 절단 도메인(즉, HNH 도메인 및 RuvC 도메인), 및 비-네이티브 서열(예를 들어, 핵 국지화 신호) 또는 부위-지향 폴리펩타이드를 비-네이티브 서열에 연결하는 링커를 갖는다.
일부 구현예에서, 부위-지향 폴리펩타이드는 박테리아(예를 들어, 에스. 파이오게네스)로부터의 Cas9와 적어도 15% 아미노산 동일성을 갖는 아미노산 서열, 2개의 핵산 절단 도메인(즉, HNH 도메인 및 RuvC 도메인)을 가지며, 상기 부위-지향 폴리펩타이드는 뉴클레아제 도메인의 절단 활성을 적어도 50% 감소시키는 핵산 절단 도메인 중 하나 또는 둘 다에서 돌연변이를 갖는다.
일부 구현예에서, 부위-지향 폴리펩타이드는 박테리아(예를 들어, 에스. 파이오게네스)로부터의 Cas9와 적어도 15% 아미노산 동일성을 갖는 아미노산 서열, 및 2개의 핵산 절단 도메인(즉, HNH 도메인 및 RuvC 도메인)을 가지며, 상기 뉴클레아제 도메인 중 하나는 아스파트산 10의 돌연변이를 갖고/갖거나 상기 뉴클레아제 도메인 중 하나는 히스티딘 840의 돌연변이를 가지며, 상기 돌연변이는 뉴클레아제 도메인(들)의 절단 활성을 적어도 50% 감소시킨다.
일부 구현예에서, 하나 이상의 부위-지향 폴리펩타이드, 예를 들어 DNA 엔도뉴클레아제는 게놈 내의 특이적 좌위에서 하나의 이중-가닥 절단부를 함께 산출하는 2개의 닉카제, 또는 게놈 내의 특이적 좌위에서 2개의 이중-가닥 절단부를 함께 산출하는 4개의 닉카제를 포함한다. 대안적으로, 하나의 부위-지향 폴리펩타이드, 예를 들어 DNA 엔도뉴클레아제는 게놈 내의 특이적 좌위에서 하나의 이중-가닥 절단부에 영향을 미친다.
일부 구현예에서, 부위-지향 폴리펩타이드를 인코딩하는 폴리뉴클레오타이드는 게놈을 편집하는 데 사용될 수 있다. 이러한 일부의 구현예에서, 부위-지향 폴리펩타이드를 인코딩하는 폴리뉴클레오타이드는 관심 표적 DNA를 함유하는 세포에서의 발현을 위해 당업계의 표준 방법에 따라 코돈-최적화된다. 예를 들어, 의도된 표적 핵산이 인간 세포에 존재한다면, Cas9를 인코딩하는 인간 코돈-최적화된 폴리뉴클레오타이드는 Cas9 폴리펩타이드의 생성을 위해 사용되는 것으로 고려된다.
하기는 본 개시내용의 다양한 구현예에서 사용될 수 있는 부위-지향적 폴리펩타이드의 일부 예를 제공한다.
CRISPR 엔도뉴클레아제 시스템
CRISPR(일정한 간격을 두고 주기적으로 분포하는 짧은 회문 반복부) 게놈 좌위는 많은 원핵생물(예를 들어, 박테리아 및 고세균)의 게놈에서 발견될 수 있다. 원핵생물에서, CRISPR 좌위는 면역계의 유형으로서 작용하여 외래 침입자, 예컨대 바이러스 및 파지에 대해 원핵생물을 방어하는 것을 돕는 생성물을 인코딩한다. CRISPR 좌위 기능은 3개 스테이지(stage)가 있다: CRISPR 좌위 내로의 새로운 서열의 통합, CRISPR RNA(crRNA)의 발현, 및 외래 침입자 핵산의 침묵화(silencing). 5개 유형의 CRISPR 시스템(예를 들어, I형, II형, III형, U형 및 V형)이 식별되어 있다.
CRISPR 좌위는 "반복부"로 지칭되는 다수의 짧은 반복 서열을 포함한다. 발현될 때, 상기 반복부는 2차 헤어핀 구조(예를 들어, 헤어핀)를 형성하고/거나 비구조화된 단일 가닥 서열을 가질 수 있다. 반복부는 통상적으로 클러스터에서 발생하고, 빈번하게는 종들 사이에서 나뉜다. 반복부는 "스페이서"로 지칭되는 독특한 개입 서열을 이용하여 정기적으로 이격되어, 반복부-스페이서-반복부 좌위 구조물을 초래한다. 스페이서는 기지의 외부 침입자 서열과 동일하거나 이와 높은 상동성을 갖는다. 스페이서-반복부 단위는 crisprRNA(crRNA)를 인코딩하며, 이는 스페이서-반복부 단위의 성숙 형태로 가공된다. crRNA는 표적 핵산(원핵생물에서의 자연 발생 형태에서, 스페이서 서열은 외래 침입자 핵산을 표적화함)을 표적화는 데 관여하는 "시드(seed)" 또는 스페이서 서열을 갖는다. 스페이서 서열은 crRNA의 5' 또는 3' 단부에 위치된다.
CRISPR 좌위는 또한 CRISPR 관련(Cas) 유전자를 인코딩하는 폴리뉴클레오타이드 서열을 갖는다. Cas 유전자는 원핵생물에서 생물발생 및 crRNA 기능의 간섭 스테이지에 관여된 엔도뉴클레아제를 인코딩한다. 일부 Cas 유전자는 상동성 2차 및/또는 3차 구조를 갖는다.
II형 CRISPR 시스템
자연에서 II형 CRISPR 시스템에서의 crRNA 생물발생은 트랜스-활성화 CRISPR RNA(tracrRNA)를 필요로 한다. tracrRNA는 내인성 RNaseIII에 의해 변형된 다음, 전(pre)-crRNA 어레이의 crRNA 반복부에 혼성화된다. 내인성 RNaseIII은 모집되어 전-crRNA를 절단한다. 절단된 crRNA는 엑소리보뉴클레아제 트리밍(trimming)을 받아, 성숙 crRNA 형태(예를 들어, 5' 트리밍)를 생성한다. tracrRNA는 crRNA에 혼성화된 채로 유지되고, tracrRNA 및 crRNA는 부위-지향 폴리펩타이드(예를 들어, Cas9)와 회합된다. crRNA-tracrRNA-Cas9 복합체의 crRNA는 복합체를, crRNA가 혼성화할 수 있는 표적 핵산으로 가이드한다. 표적 핵산에의 crRNA의 혼성화는 표적화된 핵산 절단을 위해 Cas9를 활성화시킨다. II형 CRISPR 시스템에서 표적 핵산은 프로토스페이서 인접 모티프(PAM)로 지칭된다. 자연에서, PAM은 표적 핵산에의 부위-지향 폴리펩타이드(예를 들어, Cas9)의 결합을 용이하게 하는 데 필수적이다. II형 시스템(Nmeni 또는 CASS4로도 지칭됨)은 II-A형(CASS4) 및 II-B형(CASS4a)으로 추가로 세분된다. 문헌[Jinek 등, Science, 337(6096):816-821 (2012)]은 CRISPR/Cas9 시스템이 RNA-프로그래밍 가능한 게놈 편집에 유용함을 보여주었으며, 국제특허출원공개 WO 2013/176772호는 부위-특이적 게놈 편집을 위한 CRISPR/Cas 엔도뉴클레아제 시스템의 다수의 예 및 적용을 제공한다.
V형 CRISPR 시스템
V형 CRISPR 시스템은 II형 시스템과 몇몇 중요한 차이를 갖는다. 예를 들어, Cpf1은 II형 시스템과는 대조적으로, tracrRNA가 결여되어 있는 단일 RNA-가이드 엔도뉴클레아제이다. 사실, Cpf1-관련 CRISPR 어레이는 추가 트랜스-활성화 tracrRNA의 필요 없이 성숙 crRNA로 가공된다. V형 CRISPR 어레이는 42 내지 44개 뉴클레오타이드 길이의 짧은 성숙 crRNA로 가공되고, 각각의 성숙 crRNA는 직접 반복부의 19개 뉴클레오타이드로 시작하여 23 내지 25개 뉴클레오타이드의 스페이서 서열로 이어진다. 이와는 대조적으로, II형 시스템의 성숙 crRNA는 20 내지 24개 뉴클레오타이드의 스페이서 서열로 시작하여 약 22개 뉴클레오타이드의 직접 반복부로 이어진다. 또한, Cpf1은 T-풍부 프로토스페이서-인접 모티프를 사용하여 Cpf1-crRNA 복합체는, G-풍부 PAM과는 대조적으로 II형 시스템에 대해 표적 DNA 이후에 존재하는, 짧은 T-풍부 PAM 이후의 표적 DNA를 효율적으로 절단한다. 따라서, V형 시스템은 PAM으로부터 원위부인 지점에서 절단하는 한편, II형 시스템은 PAM에 인접한 지점에서 절단한다. 또한, II형 시스템에 비해서, Cpf1은 4 또는 5개 뉴클레오타이드 5' 오버행(overhang)을 갖는 엇갈린(staggered) DNA 이중-가닥 절단부를 통해 DNA를 절단한다. II형 시스템은 블런트(blunt) 이중-가닥 절단부를 통해 절단한다. II형 시스템과 유사하게, Cpf1은 예측된 RuvC-유사 엔도뉴클레아제 도메인을 함유하지만, 제2 HNH 엔도뉴클레아제 도메인이 결여되어 있으며, 이는 II형 시스템과는 대조적이다.
Cas 유전자/폴리펩타이드 및 프로토스페이서 인접 모티프
예시적인 CRISPR/Cas 폴리펩타이드는 문헌[Fonfara 등, Nucleic Acids Research, 42: 2577-2590 (2014)]의 도 1에서의 Cas9 폴리펩타이드를 포함한다. CRISPR/Cas 유전자 명명 시스템은 과도한 재기록을 겪었는데, 그 이유는 Cas 유전자가 발견되었기 때문이다. 상기 Fonfara의 도 5는 다양한 종으로부터의 Cas9 폴리펩타이드에 대한 PAM 서열을 제공한다.
게놈-표적화 핵산과 부위-지향 폴리펩타이드의 복합체
게놈-표적화 핵산은 부위-지향 폴리펩타이드(예를 들어, 핵산-가이드 뉴클레아제, 예컨대 Cas9)와 상호작용하여, 복합체를 형성한다. 게놈-표적화 핵산(예를 들어, gRNA)은 부위-지향 폴리펩타이드를 표적 핵산으로 가이드한다.
이전에 언급된 바와 같이, 일부 구현예에서, 부위-지향 폴리펩타이드 및 게놈-표적화 핵산은 각각 세포 또는 환자에게 별도로 투여될 수 있다. 한편, 일부 다른 구현예에서, 부위-지향 폴리펩타이드는 tracrRNA와 함께 하나 이상의 가이드 RNA 또는 하나 이상의 crRNA와 예비-복합체화될 수 있다. 그 후에, 예비-복합체화된 물질은 세포 또는 환자에게 투여될 수 있다. 이러한 예비-복합체화된 물질은 리보핵단백질 입자(RNP)로 알려져 있다.
게놈 편집 방법
일 양태에서, 게놈 편집, 특히 관심 유전자를 세포의 게놈 내로 삽입하는 방법이 본원에 제공된다. 일부 구현예는 세포에서 단백질의 발현, 기능 또는 활성을 게놈 편집에 의해 조정하기 위한 편집 방법에 관한 것이며, 상기 단백질은 FVIII 단백질, FIX 단백질, 알파-1-항트립신, FXIII 단백질, FVII 단백질, FX 단백질, 단백질 C, 및 세르핀 G1로 이루어진 군으로부터 선택된다. 일부 특정 구현예는 세포에서 혈액 응고 단백질, 예컨대 FVIII의 발현, 기능 또는 활성을 게놈 편집에 의해 조정하기 위한 편집을 위한 방법에 관한 것이다. 상기 방법은 대상체, 예를 들어, A형 혈우병 환자를 치료하는 데 사용될 수 있으며, 이러한 경우, 세포는 환자 또는 별도의 공여체로부터 단리될 수 있다. 그 후에, 세포의 염색체 DNA는 본원에 기재된 물질 및 방법을 사용하여 편집된다. 일부 다른 특정 구현예는 세포에서 혈액 응고 단백질의 발현, 기능 또는 활성을 게놈 편집에 의해 조정하기 위한 편집을 위한 방법에 관한 것이다. 상기 방법은 대상체, 예를 들어, B형 혈우병 환자를 치료하는 데 사용될 수 있으며, 이러한 경우, 세포는 환자 또는 별도의 공여체로부터 단리될 수 있다. 더욱 일부 다른 특정 구현예는 세포에서 세린 프로테아제 저해제 G1의 발현, 기능 또는 활성을 게놈 편집에 의해 조정하기 위한 편집을 위한 방법에 관한 것이다. 상기 방법은 대상체, 예를 들어, 유전성 혈관부종 환자를 치료하는 데 사용될 수 있으며, 이러한 경우, 세포는 환자 또는 별도의 공여체로부터 단리될 수 있다.
일부 구현예에서, 넉인(knock-in) 전략은 관심 유전자(GOI)에서의 넉킹인(knocking-in)을 수반한다. 인코딩된 폴리펩타이드의 크기 또는 생물학적 활성 또는 기능에 관한 구체적인 한계는 없다. 일부 구현예에서, GOI는 FVIII 단백질, FIX 단백질, 알파-1-항트립신, FXIII 단백질, FVII 단백질, FX 단백질, 단백질 C, 및 세르핀 G1, 또는 이의 임의의 기능적 유도체로 이루어진 군으로부터 선택되는 단백질을 인코딩한다. 일부 구현예에서, GOI가 삽입되는 게놈 서열은 알부민 좌위에, 그 내에, 또는 그 부근에 있다. 일부 구현예에서, GOI는 혈액-응고 단백질, 예컨대 FVIII을 인코딩한다. 일부 구현예에서, 넉인 전략은 FVIII-인코딩 서열, 예를 들어, 야생형 FVIII 유전자(예를 들어, 야생형 인간 FVIII 유전자), FVIII cDNA, 미니유전자(minigene)(자연 또는 합성 인핸서 및 프로모터, 하나 이상의 엑손, 및 자연 또는 합성 인트론, 및 자연 또는 합성 3'UTR 및 폴리아데닐화 신호를 가짐) 또는 변형된 FVIIII 유전자를 게놈 서열 내로 넉킹인시키는 단계를 수반한다. 일부 구현예에서, 넉인 전략은 FIX-인코딩 서열, 예를 들어, 야생형 FIX 유전자(예를 들어, 야생형 인간 FIX 유전자), FIX cDNA, 미니유전자(자연 또는 합성 인핸서 및 프로모터, 하나 이상의 엑손, 및 자연 또는 합성 인트론, 및 자연 또는 합성 3'UTR 및 폴리아데닐화 신호를 가짐) 또는 변형된 FIX 유전자를 게놈 서열 내로 넉킹인시키는 단계를 수반한다. 일부 구현예에서, 넉인 전략은 SERPING1-인코딩 서열, 예를 들어, 야생형 SERPING1 유전자(예를 들어, 야생형 인간 SERPING1 유전자), SERPING1 cDNA, 미니유전자(자연 또는 합성 인핸서 및 프로모터, 하나 이상의 엑손, 및 자연 또는 합성 인트론, 및 자연 또는 합성 3'UTR 및 폴리아데닐화 신호를 가짐) 또는 변형된 SERPING1 유전자를 게놈 서열 내로 넉킹인시키는 단계를 수반한다.
일부 구현예에서, 관심 유전자(GOI), 예를 들어, FVIII 유전자 또는 이의 기능적 유도체를 인코딩하는 유전자를 게놈 내로 넉인시키는 방법이 본원에 제공된다. 일 양태에서, 본 개시내용은 세포의 게놈 내로의 GOI, 예를 들어, FVIII 유전자의 핵산 서열, 예를 들어, FVIII 단백질 또는 이의 기능적 유도체를 인코딩하는 핵산 서열의 삽입을 제공한다. GOI의 핵산 서열은 GOI 또는 이의 유도체의 야생형 단백질을 인코딩할 수 있다. 이에, 일부 구현예에서, GOI는 야생형 단백질을 인코딩할 수 있다. 야생형 단백질의 기능적 유도체는, 야생형 단백질의 실질적인 활성, 예를 들어, 야생형 단백질이 나타내는 활성의 적어도 약 30%, 약 40%, 약 50%, 약 60%, 약 70%, 약 80%, 약 90%, 약 95% 또는 약 100%를 갖는 펩타이드를 포함할 수 있다. 일부 구현예에서, 당업자는 당업계에 알려진 많은 방법을 사용하여, 화합물, 예를 들어, 펩타이드 또는 단백질의 기능성 또는 활성을 시험할 수 있다. 일부 구현예에서, 인코딩된 야생형 단백질의 기능적 유도체는 또한, 야생형 단백질의 임의의 단편, 또는 상응하는 전장, 야생형 단백질 내 하나 이상의 아미노산 잔기 상에 보존적 변형을 갖는 변형된 단백질의 단편을 포함할 수 있다. 일부 구현예에서, 인코딩된 야생형 단백질의 기능적 유도체는 또한, 야생형 단백질의 기능성에 실질적으로 악영향을 미치지 않는 하나 이상의 아미노산의 임의의 변형(들), 예를 들어, 결실, 삽입 및/또는 돌연변이를 포함할 수 있다. 그러므로, 일부 구현예에서, 야생형 GOI의 핵산 서열의 기능적 유도체는 야생형 GOI와 적어도 약 30%, 약 40%, 약 50%, 약 60%, 약 70%, 약 80%, 약 85%, 약 90%, 약 95%, 약 96%, 약 97%, 약 98% 또는 약 99%의 핵산 서열 동일성을 가질 수 있다.
일부 구현예에서, GOI 또는 이의 기능적 유도체는 세포의 게놈 서열 내로 삽입된다. 일부 구현예에서, 삽입 부위는 세포의 게놈 내의 알부민 좌위에 또는 그 내에 존재한다. 삽입 방법은 알부민 유전자의 제1 인트론(또는 인트론 1)을 표적화하는 하나 이상의 gRNA를 사용한다. 일부 구현예에서, 공여체 DNA는 GOI 또는 이의 기능적 유도체에 대한 코딩 서열을 포함하는 단일 가닥 또는 이중 가닥 DNA이다. 일부 구현예에서, 공여체 DNA는 FVIII 단백질, FIX 단백질, 알파-1-항트립신, FXIII 단백질, FVII 단백질, FX 단백질, 단백질 C, 세르핀 G1, 또는 이의 기능적 유도체로 이루어진 군으로부터 선택되는 단백질에 대한 코딩 서열을 포함하는 단일 가닥 또는 이중 가닥 DNA이다.
일부 구현예에서, 게놈 편집 방법은 DNA 엔도뉴클레아제, 예컨대 CRISPR/Cas 시스템을 이용하여, 관심 유전자 또는 이의 기능적 유도체를 유전적으로 도입(넉인)한다. 일부 구현예에서, DNA 엔도뉴클레아제는 서열 NGG 또는 NNGG를 갖는 프로토스페이서 인접 모티프(PAM)를 인식하며, 여기서 N은 임의의 뉴클레오타이드, 이의 상동체(homolog), 자연 발생 분자, 이의 코돈-최적화된 버전, 또는 변형된 버전의 재조합, 및 이들 중 임의의 조합이다. 일부 구현예에서, DNA 엔도뉴클레아제는 II형 Cas 엔도뉴클레아제 또는 이의 기능적 유도체이다. 일부 구현예에서, DNA 엔도뉴클레아제는 Cas9이다. 일부 구현예에서, Cas9는 스트렙토콕커스 파이오게네스(spCas9)로부터의 것이다. 일부 구현예에서, Cas9는 스타필로콕커스 루그두넨시스(SluCas9)로부터의 것이다.
일부 구현예에서, 게놈-편집을 받는 세포는 게놈에 하나 이상의 돌연변이(들)를 가지며, 이는 이러한 돌연변이(들)를 갖지 않는 정상에서의 발현과 비교하여 내인성 관심 유전자의 발현의 감소를 초래한다. 정상 세포는 GOI에 결함을 갖지 않는 상이한 대상체로부터 기원된(또는 단리된) 건강한 또는 대조군 세포일 수 있다. 일부 구현예에서, 게놈-편집을 받는 세포는 GOI-관련 병태 또는 장애의 치료를 필요로 하는 대상체로부터 기원(또는 단리)될 수 있다. 일부 특정 구현예에서, 게놈-편집을 받는 세포는 GOI와 관련된 건강상 병태 또는 장애의 치료를 필요로 하는 환자로부터 기원(또는 단리)될 수 있다. 일부 구현예에서, 상기 환자는 A형 혈우병, B형 혈우병, MPS II, MPS1H, 알파-1-항트립신 결핍, FXIII 결핍, FVII 결핍, FX 결핍, 단백질 C 결핍, 및 HAE로 이루어진 군으로부터 선택되는 장애 또는 건강상 병태를 갖고 있거나 갖는 것으로 의심되는 환자이다. 일부 구현예에서, 환자는 A형 혈우병 환자이다. 일부 구현예에서, 환자는 B형 혈우병 환자이다. 일부 구현예에서, 환자는 HAE 환자이다. 따라서, 일부 구현예에서, 이러한 세포에서 내인성 GOI 유전자의 발현은 정상 세포에서 내인성 관심 유전자 발현의 발현과 비교하여 약 10%, 약 20%, 약 30%, 약 40%, 약 50%, 약 60%, 약 70%, 약 80%, 약 90% 또는 약 100% 감소된다.
일부 구현예에서, 게놈 편집 방법은, 예를 들어, FVIII 유전자와 같은 기능적 GOI의 게놈, 예를 들어, 공급된 프로모터에 작동적으로 연결된 FVIII 코딩 서열의 비-코딩 영역에서 표적화된 통합을 수행하여, 생체내에서 FVIII 단백질을 안정하게 생성시킨다. 일부 구현예에서, GOI 코딩 서열의 표적화된 통합은, 관심 세포 유형, 예를 들어, 간세포 또는 동양혈관 내피 세포에서 고도로 발현되는 알부민 유전자의 인트론에서 발생한다. 일부 구현예에서, 삽입될 GOI 코딩 서열은 야생형 GOI 코딩 서열, 예를 들어, 야생형 인간 GOI 코딩 서열일 수 있다. 일부 구현예에서, GOI 코딩 서열은 야생형 GOI 코딩 서열, 예컨대 야생형 인간 GOI 코딩 서열의 기능적 유도체일 수 있다.
일 양태에서, 본 개시내용은 세포의 게놈 내로의 예를 들어, FVIII 유전자 또는 이의 기능적 유도체와 같은 관심 유전자(GOI)의 삽입을 제안한다. 일부 구현예에서, 삽입될 GOI 코딩 서열은 변형된 GOI 코딩 서열이다. 일부 구현예에서, 변형된 GOI 코딩 서열은 표적 세포에서 알부민 유전자의 인트론 1 내로 특이적으로 통합된다. 일부 구현예에서, 변형된 GOI 코딩 서열은 인간을 포함한 포유류의 간세포에서 알부민 유전자의 인트론 1 내로 특이적으로 통합된다. 일부 구현예에서, 삽입될 FVIII 코딩 서열은 변형된 GOI 코딩 서열이다. 일부 구현예에서, 변형된 FVIII 코딩 서열에서, 야생형 FVIII 코딩 서열의 B-도메인은 결실되고, "SQ 링크"(아미노산 서열 SFSQNPPVLKRHQR - 서열번호 1)라고 하는 링커 펩타이드로 대체된다. 이러한 B-도메인 결실 FVIII(FVIII-BDD)은 당업계에 잘 알려져 있고, 전장 FVIII과 동등한 생물학적 활성을 갖는다. 예를 들어, 일부 구현예에서, B-도메인 결실 FVIII은 이의 더 작은 크기 때문에 전장 FVIII에 걸쳐 있다(4371 bp 대 7053 bp). 그러므로, 일부 구현예에서, FVIII 신호 펩타이드가 결여되어 있고 이의 5' 단부(FVIII 코딩 서열의 N-말단)에 스플라이스 수용기 서열을 함유하는 FVIII-BDD 코딩 서열은 인간을 포함한 포유류의 간세포에서 알부민 유전자의 인트론 1 내로 특이적으로 통합된다. 일부 구현예에서, 알부민 프로모터로부터 이러한 변형된 GOI 코딩 서열의 전사는 알부민의 엑손 1, 인트론 1의 부분 및 통합된 GOI 서열을 함유하는 전-mRNA를 초래할 수 있다. 예를 들어, 알부민 프로모터로부터 상기 변형된 FVIII 코딩 서열의 전사는 알부민의 엑손 1, 인트론 1의 부분 및 통합된 FVIII-BDD 유전자 서열을 함유하는 전-mRNA를 초래할 수 있다. 이러한 전-mRNA가 자연적인 스플라이싱 과정을 겪어 인트론을 제거할 때, 스플라이싱 머시너리는 알부민 엑손 1의 3' 측면의 스플라이스 공여체를 다음 이용 가능한 스플라이스 수용기에 결합시킬 수 있으며, 상기 스플라이스 수용기는 삽입된 DNA 공여체의 FVIII-BDD 코딩 서열의 5' 단부의 스플라이스 수용기일 것이다. 이는 FVIII-BDD에 대한 성숙 코딩 서열에 융합된 알부민 엑손 1을 함유하는 성숙 mRNA를 초래할 수 있다. 알부민의 엑손 1은 신호 펩타이드 + 2개의 추가 아미노산, 및 인간에서 알부민의 N-말단에서 단백질 서열 DAH를 통상적으로 인코딩하는 코돈 중 1/3을 인코딩한다. 따라서, 일부 구현예에서, 세포로부터의 분비 동안 알부민 신호 펩타이드의 예측된 절단 후, N-말단에 첨가된 3개의 추가 아미노산 잔기를 갖는 FVIII-BDD 단백질이 생성되어, FVIII-BDD 단백질의 N-말단에서 아미노산 서열 -DAHATRRYY(서열번호 98)-를 초래할 수 있다. 이들 3개 아미노산 중 3번째(밑줄표시)가 부분적으로는 엑손 1의 단부에 의해 그리고 부분적으로는 FVIII-BDD DNA 공여체 주형에 의해 인코딩되기 때문에, 3번째 추가 아미노산 잔기의 정체성(identity)이 Leu, Pro, His, Gln 또는 Arg인 것을 선택하는 것이 가능하다. 일부 구현예에서 이들 옵션 중에서, Leu이 최소로 분자적으로 복잡하므로 새로운 T-세포 에피토프를 형성할 가능성이 가장 작기 때문에 Leu이 선택되어, FVIII-BDD 단백질의 N-말단에서 아미노산 서열 -DALATRRYY-를 초래한다. 대안적으로, DNA 공여체 주형은 3번째 잔기를 결실시켜, FVIII-BDD 단백질의 N-말단에서 아미노산 서열 DALTRRYY를 초래하도록 설계될 수 있다. 일부 경우, 추가 아미노산을 네이티브 단백질의 서열에 첨가하는 것은 면역원성 위험을 증가시킬 수 있다. 따라서, FVIII-BDD의 N-말단에 대한 2개의 잠재적인 옵션의 잠재적인 면역원성을 예측하기 위한 인실리코(in silico) 분석이, 1개 잔기(DALTRRYY)의 결실이 더 낮은 면역원성 점수를 가짐을 실증하는 일부 구현예에서, 이는 적어도 일부 구현예에서 선택의 설계일 수 있다.
일부 구현예에서, 코돈 용법이 최적화되어 있는, 예를 들어, FVIII-BDD와 같이 변형된 GOI를 인코딩하는 DNA 서열이 사용되어 포유류 세포에서 발현을 향상시킬 수 있다(소위 코돈 최적화). 상이한 컴퓨터 알고리즘은 또한, 코돈 최적화를 수행하기 위해 당업계에서 이용 가능하고 이들은 별개의 DNA 서열을 생성시킨다. 상업적으로 입수 가능한 코돈 최적화 알고리즘의 예는 회사 ATUM 및 GeneArt(Thermo Fisher Scientific의 파트)에 의해 이용되는 것들이다. FVIII 코딩 서열의 코돈 최적화는 마우스에게 유전자 기초 전달 후 FVIII의 발현을 유의하게 향상시키는 것으로 실증되었다(문헌[Nathwani AC, Gray JT, Ng CY, Blood. 2006;107(7):2653-2661.]; 문헌[Ward NJ, Buckley SM, Waddington SN, Blood. 2011; 117(3):798-807]; 문헌[Radcliffe PA, Sion CJ, Wilkes FJ, Gene Ther. 2008;15(4):289-297]).
일부 구현예에서, 상이한 알고리즘에 의해 코돈 최적화되었던 변형된 GOI 코딩 서열과 네이티브 GOI 서열(인간 게놈에 존재하는 바와 같음) 사이의 서열 상동성 또는 동일성은 약 30%, 약 40%, 약 50%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 95%, 또는 100% 범위일 수 있다. 일부 구현예에서, 변형된 GOI의 코돈-최적화된 코딩 서열은 네이티브 GOI 서열과 약 75% 내지 약 79%의 서열 상동성 또는 동일성을 갖는다. 일부 구현예에서, 변형된 GOI의 코돈-최적화된 코딩 서열은 네이티브 GOI 서열과 70%, 약 71%, 약 72%, 약 73%, 약 74%, 약 75%, 약 76%, 약 77%, 약 78%, 약 79% 또는 약 80%의 서열 상동성 또는 동일성을 갖는다.
일부 구현예에서, 공여체 주형 또는 공여체 작제물은 변형된 GOI를 인코딩하는 DNA 서열을 함유하도록 제조된다. 일부 구현예에서, DNA 공여체 주형은 변형된 GOI의 코돈-최적화된 인간 코딩 서열을 함유하도록 설계된다. 일부 구현예에서, 코돈-최적화는, GOI, 예를 들어, FVIII의 신호 펩타이드를 인코딩하는 5' 단부에서의 서열이 결실되었고 스플라이스 수용기 서열로 대체되었으며 게다가 FVIII 정지 코돈(MAB8A - 서열번호 87) 후 폴리아데닐화 신호가 3' 단부에 첨가되는 방식으로 수행된다. 스플라이스 수용기 서열은 기지의 유전자로부터 기지의 스플라이스 수용기 서열 중에서 선택될 수 있거나, 당업계에 알려진 많은 스플라이스 수용기 서열의 정렬로부터 유래되는 컨센서스(consensus) 스플라이스 수용기 서열이 사용될 수 있다. 일부 구현예에서, 고도로 발현되는 유전자로부터의 스플라이스 수용기 서열은, 이러한 서열이 최적의 스플라이싱 효율을 제공하는 것으로 생각되기 때문에 사용된다. 일부 구현예에서, 컨센서스 스플라이싱 수용기 서열은 컨센서스 서열 T/CNC/TT/CA/GAC/T(서열번호 99)을 갖는 브랜치(Branch) 부위, 뒤이어 20 bp 내에 10 내지 12개 염기의 폴리피리미딘 트랙(C 또는 T), 뒤이어 >가 인트론/엑손 경계의 위치인 AG>G/A로 이루어진다. 일부 구현예에서, 합성 스플라이스 수용기 서열(ctgacctcttctcttcctcccacag - 서열번호 2)이 사용된다. 또 다른 구현예에서, 인간(TTAACAATCCTTTTTTTTCTTCCCTTGCCCAG- 서열번호 3) 또는 마우스(ttaaatatgttgtgtggtttttctctccctgtttccacag- 서열번호 4)의 알부민 유전자 인트론 1/엑손 2 경계로부터의 네이티브 스플라이스 수용기 서열이 사용된다.
폴리아데닐화 서열은, 세포 내에서 mRNA의 안정성에 필수적인 polyA 테일을 첨가하기 위해 세포에 신호를 제공한다. DNA-공여체 주형이 AAV 입자 내로 패키징될 일부 구현예에서, 패키징된 DNA의 크기는 일반적으로 AAV에 대한 패키징 한계 내에서 유지되며, 이는 예를 들어, 약 5 Kb 미만, 예를 들어, 약 4.7 Kb 이하이다. 그러므로, 일부 구현예에서, 가능한 한 짧은 polyA 서열, 예를 들어, 약 10-량체, 약 20-량체, 약 30-량체, 약 40-량체, 약 50-량체 또는 약 60-량체 또는 이들 중 임의의 개입 수의 뉴클레오타이드를 사용하는 것이 바람직하다. 컨센서스 합성 poly A 신호 서열은 서열 AATAAAAGATCTTTATTTTCATTAGATCTGTGTGTTGGTTTTTTGTGTG(서열번호 5)와 함께 문헌에 기재되어 왔으며(문헌[Levitt N, Briggs D, Gil A, Proudfoot NJ. Genes Dev. 1989; 3(7):1019-1025]), 많은 발현 벡터에서 보편적으로 사용된다.
일부 구현예에서, 추가의 서열 요소는 DNA 공여체 주형에 첨가되어, 통합 빈도를 향상시킬 수 있다. 하나의 이러한 요소는, HDR에 의한 통합을 가능하게 하기 위해 통합이 표적화되는 게놈 내 이중 가닥 절단부 중 어느 한면에서 DNA 서열과 동일한 서열인 상동성 아암이다. 이중 가닥 절단부의 좌측면으로부터의 서열(LHA)은 DNA 공여체 주형의 5'(FVIII 코딩 서열의 N-말단) 단부에 부착되고, 이중 가닥 절단부의 우측면으로부터의 서열(RHA)은 예를 들어, MAB8B(서열번호 88)에 대한 DNA 공여체 주형의 3'(FVIII 코딩 서열의 C-말단) 단부에 부착된다.
일부 구현예에서 제공되는 대안적인 DNA 공여체 주형 설계는, 게놈 부위를 절단하는 데 사용될 sgRNA에 대한 인식 서열에 상보적인 서열을 갖는다. MAB8C(서열번호 89)는 이러한 유형의 DNA 공여체 주형의 일례를 나타낸다. sgRNA 인식 부위를 포함시킴으로써, DNA 공여체 주형 및 sgRNA/Cas9가 전달되었던 세포의 핵 내부에서 sgRNA/Cas9 복합체에 의해 DNA 공여체 주형은 절단될 것이다. 선형 단편으로의 공여체 DNA 주형의 절단은 비-상동성 단부 결합 기전에 의해 또는 HDR 기전에 의해 이중 가닥 절단부에서의 통합 빈도를 증가시킬 수 있다. 이는 특히, 핵으로의 전달 후 AAV 게놈이 연쇄화(concatemerize)하여 더 큰 원형 이중 가닥 DNA 분자를 형성하는 것으로 알려져 있기 때문에, AAV에서 패키징된 공여체 DNA 주형의 전달의 경우 유익할 수 있다(문헌[Nakai 등 J. Viology 2001, vol 75 p. 6969-6976]). 따라서, 일부 경우, 원형 연쇄체(concatemer)는 특히 NHEJ 기전에 의한, 이중 가닥 절단부에서의 통합에 덜 효율적인 공여체일 수 있다. 원형 플라스미드 DNA 공여체 주형을 사용하는 표적화된 통합의 효율이 플라스미드에 아연 핑거 뉴클레아제 절단 부위를 포함시킴으로써 증가될 수 있을 것으로 이전에 보고되었다(문헌[Cristea 등 Biotechnol. Bioeng. 2013;110: 871-880]). 더욱 최근, 이러한 접근법은 또한, CRISPR/Cas9 뉴클레아제를 사용하여 적용되었다(문헌[Suzuki 2017, Nature 540,144-149]). sgRNA 인식 서열은 이중 가닥 DNA 공여체 주형의 어느 한 가닥 상에 존재할 때 활성인 한편, 게놈에 존재하는 sgRNA 인식 서열의 역보체의 사용은 안정한 통합을 선호하는 것으로 예측되는데, 왜냐하면 리버스(reverse) 배향에서의 통합은 sgRNA 인식 서열을 재생성시키며, 상기 sgRNA 인식 서열은 재절단되어 삽입된 공여체 DNA 주형을 방출시킬 수 있기 때문이다. NHEJ에 의한 포워드(forward) 배향에서의 게놈 내 이러한 공여체 DNA 주형의 통합은 sgRNA 인식 서열을 재생성시키지 않아, 통합된 공여체 DNA 주형은 게놈 밖으로 삭제(excise)될 수 없는 것으로 예측된다. GOI 공여체 DNA 주형의 통합 효율에 있어서 상동성 아암을 갖거나 갖지 않는 공여체에 sgRNA 인식 서열을 포함시키는 이점은 예를 들어, 공여체의 전달을 위해 AAV 그리고 CRISPR-Cas9 구성요소의 전달을 위해 LNP를 사용하여 마우스에서 시험되고 결정될 수 있다.
일부 구현예에서, 공여체 DNA 주형은, 한면 또는 양면 상에서 gRNA 표적 부위에 의해 측면 근접해 있는 본원에 기재된 임의의 구현예에 따라 공여체 카세트에 GOI 또는 이의 기능적 유도체를 포함한다. 일부 구현예에서, 공여체 주형은 공여체 카세트의 gRNA 표적 부위 5' 및/또는 공여체 카세트의 gRNA 표적 부위 3'를 포함한다. 일부 구현예에서, 공여체 주형은 2개의 측면 근접 gRNA 표적 부위를 포함하고, 2개의 gRNA 표적 부위는 동일한 서열을 포함한다. 일부 구현예에서, 공여체 주형은 적어도 하나의 gRNA 표적 부위를 포함하고, 상기 공여체 주형 내의 적어도 하나의 gRNA 표적 부위는, 알부민 유전자의 제1 인트론을 표적화하는 하나 이상의 gRNA 중 적어도 하나에 대한 표적 부위이다. 일부 구현예에서, 공여체 주형은 적어도 하나의 gRNA 표적 부위를 포함하고, 상기 공여체 주형 내의 적어도 하나의 gRNA 표적 부위는, 알부민 유전자의 제1 인트론 내 하나 이상의 gRNA 중 적어도 하나에 대한 표적 부위의 역보체이다. 일부 구현예에서, 공여체 주형은 공여체 카세트의 gRNA 표적 부위 5' 및 공여체 카세트의 gRNA 표적 부위 3'를 포함하고, 상기 공여체 주형 내 2개의 gRNA 표적 부위는 알부민 유전자의 제1 인트론을 표적화하는 하나 이상의 gRNA에 의해 표적화된다. 일부 구현예에서, 공여체 주형은 공여체 카세트의 gRNA 표적 부위 5' 및 공여체 카세트의 gRNA 표적 부위 3'를 포함하고, 상기 공여체 주형 내 2개의 gRNA 표적 부위는 알부민 유전자의 제1 인트론 내 하나 이상의 gRNA 중 적어도 하나에 대한 표적 부위의 역보체이다.
표적 부위, 즉, GOI-인코딩 유전자가 삽입되는 게놈 위치 내로의 GOI-인코딩 유전자의 삽입은 내인성 알부민 유전자 좌위 또는 이의 이웃 서열에 있을 수 있다. 일부 구현예에서, GOI-인코딩 유전자는, 삽입된 유전자의 발현이 알부민 유전자의 내인성 프로모터에 의해 제어되는 방식으로 삽입된다. 일부 구현예에서, GOI-인코딩 유전자는 알부민 유전자의 인트론 중 하나에 삽입된다. 일부 구현예에서, GOI-인코딩 유전자는 알부민 유전자의 엑손 중 하나에 삽입된다. 일부 구현예에서, GOI-인코딩 유전자는 인트로:엑손의 연접(junction)에 삽입된다(또는 그 반대). 일부 구현예에서, GOI-인코딩 유전자의 삽입은 알부민 좌위의 제1 인트론(또는 인트론 1)에 있다. 일부 구현예에서, GOI-인코딩 유전자의 삽입은 알부민 유전자의 발현에 유의하게 영향을 미치지 않으며, 예를 들어, 상향조절하거나 하향조절하지 않는다.
일부 구현예에서, GOI-인코딩 유전자의 삽입을 위한 표적 부위는 내인성 알부민 유전자에, 그 내에 또는 그 부근에 있다. 일부 구현예에서, 표적 부위는, 게놈 내 알부민 유전자 좌위의 프로모터의 업스트림인 유전자간(intergenic) 영역에 있다. 일부 구현예에서, 표적 부위는 알부민 유전자 좌위 내에 있다. 일부 구현예에서, 표적 부위는 알부민 유전자 좌위의 인트론 중 하나이다. 일부 구현예에서, 표적 부위는 알부민 유전자 좌위의 엑손 중 하나이다. 일부 구현예에서, 표적 부위는 알부민 유전자 좌위의 인트론과 엑손 사이의 연접 중 하나에 있다(또는 그 반대). 일부 구현예에서, 표적 부위는 알부민 유전자 좌위의 제1 인트론(또는 인트론 1) 내에 있다. 소정의 구현예에서, 표적 부위는 알부민 유전자의 제1 엑손(즉, 제1 엑손의 마지막 핵산으로부터)의 적어도, 약 또는 최대 0, 1, 5, 10, 20, 30, 40, 50, 100, 150, 200, 250, 300, 350, 400, 450 또는 500 또는 550 또는 600 또는 650 bp 다운스트림이다. 일부 구현예에서, 표적 부위는 알부민 유전자의 제1 인트론의 적어도, 약 또는 최대 0.1 kb, 약 0.2 kb, 약 0.3 kb, 약 0.4 kb, 약 0.5 kb, 약 1 kb, 약 1.5 kb, 약 2 kb, 약 2.5 kb, 약 3 kb, 약 3.5 kb, 약 4 kb, 약 4.5 kb 또는 약 5 kb 업스트림이다. 일부 구현예에서, 표적 부위는 알부민 유전자의 제2 엑손의 약 0 bp 내지 약 100 bp 업스트림, 약 101 bp 내지 약 200 bp 업스트림, 약 201 bp 내지 약 300 bp 업스트림, 약 301 bp 내지 약 400 bp 업스트림, 약 401 bp 내지 약 500 bp 업스트림, 약 501 bp 내지 약 600 bp 업스트림, 약 601 bp 내지 약 700 bp 업스트림, 약 701 bp 내지 약 800 bp 업스트림, 약 801 bp 내지 약 900 bp 업스트림, 약 901 bp 내지 약 1000 bp 업스트림, 약 1001 bp 내지 약 1500 bp 업스트림, 약 1501 bp 내지 약 2000 bp 업스트림, 약 2001 bp 내지 약 2500 bp 업스트림, 약 2501 bp 내지 약 3000 bp 업스트림, 약 3001 bp 내지 약 3500 bp 업스트림, 약 3501 bp 내지 약 4000 bp 업스트림, 약 4001 bp 내지 약 4500 bp 업스트림 또는 약 4501 bp 내지 약 5000 bp 업스트림이다. 일부 구현예에서, 표적 부위는 게놈 내 인간 알부민 유전자의 제1 엑손의 단부(즉, 3' 단부)의 적어도 37 bp 다운스트림이다. 일부 구현예에서, 표적 부위는 게놈 내 인간 알부민 유전자의 제2 엑손의 시작(즉, 5' 시작)의 적어도 330 bp 업스트림이다.
일부 구현예에서, 세포에서 게놈을 편집하는 방법이 본원에 제공되며, 상기 방법은 세포에 (a) 서열번호 18-44 및 104 중 임의의 하나로부터의 스페이서 서열을 포함하는 gRNA, 또는 상기 gRNA를 인코딩하는 핵산; (b) DNA 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산; 및 (c) GOI 또는 기능적 유도체를 인코딩하는 핵산 서열을 포함하는 공여체 주형을 제공하는 단계를 포함한다. 일부 구현예에서, gRNA는 서열번호 21, 22, 28, 및 30 중 임의의 하나로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 서열번호 21로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 서열번호 22로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 서열번호 28로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 서열번호 30으로부터의 스페이서 서열을 포함한다. 일부 구현예에서, 세포는 인간 세포, 예를 들어, 인간 간세포의 세포이다.
일부 구현예에서, 본원에 기재된 세포에서 게놈을 편집하는 임의의 방법에 따르면, DNA 엔도뉴클레아제는 서열 NGG 또는 NNGG를 갖는 프로토스페이서 인접 모티프(PAM), 또는 이의 기능적 유도체를 인식하며, 여기서 N은 임의의 뉴클레오타이드이다. 일부 구현예에서, DNA 엔도뉴클레아제는 II형 Cas 엔도뉴클레아제 또는 이의 기능적 유도체이다. 일부 구현예에서, DNA 엔도뉴클레아제는 Cas9이다. 일부 구현예에서, Cas9는 스트렙토콕커스 파이오게네스(spCas9)로부터의 것이다. 일부 구현예에서, Cas9는 스타필로콕커스 루그두넨시스(SluCas9)로부터의 것이다.
일부 구현예에서, 본원에 기재된 세포에서 게놈을 편집하는 임의의 방법에 따르면, GOI 또는 이의 기능적 단편을 인코딩하는 핵산 서열은 세포에서의 발현을 위해 코돈 최적화된다. 일부 구현예에서, 세포는 인간 세포이다.
일부 구현예에서, 본원에 기재된 세포에서 게놈을 편집하는 임의의 방법에 따르면, 상기 방법은 DNA 엔도뉴클레아제를 인코딩하는 핵산을 이용한다. 일부 구현예에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 세포에서의 발현을 위해 코돈 최적화된다. 일부 구현예에서, 세포는 인간 세포, 예를 들어, 인간 간세포의 세포이다. 일부 구현예에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 DNA, 예컨대 DNA 플라스미드이다. 일부 구현예에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 RNA, 예컨대 mRNA이다.
일부 구현예에서, 본원에 기재된 세포에서 게놈을 편집하는 임의의 방법에 따르면, 공여체 주형은 AAV 벡터에서 인코딩된다. 일부 구현예에서, 공여체 주형은 관심 유전자(GOI) 또는 기능적 유도체를 인코딩하는 핵산 서열을 포함하는 공여체 카세트를 포함하고, 상기 공여체 카세트는 한면 또는 양면 상에서 gRNA 표적 부위에 의해 측면 근접해 있다. 일부 구현예에서, 공여체 카세트는 한면 또는 양면 상에서 gRNA 표적 부위에 의해 측면 근접해 있다. 일부 구현예에서, gRNA 표적 부위는 (a)의 gRNA에 대한 표적 부위이다. 일부 구현예에서, 공여체 주형의 gRNA 표적 부위는 (a)의 gRNA에 대한 세포 게놈 gRNA 표적 부위의 역보체이다.
일부 구현예에서, 본원에 기재된 세포에서 게놈을 편집하는 임의의 방법에 따르면, DNA 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산은 리포솜 또는 지질 나노입자에서 제형화된다. 일부 구현예에서, 리포솜 또는 지질 나노입자는 또한 gRNA를 포함한다. 일부 구현예에서, 리포솜 또는 지질 나노입자는 지질 나노입자이다. 일부 구현예에서, 상기 방법은 DNA 엔도뉴클레아제를 인코딩하는 핵산 및 gRNA를 포함하는 지질 나노입자를 이용한다. 일부 구현예에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 DNA 엔도뉴클레아제를 인코딩하는 mRNA이다.
일부 구현예에서, 본원에 기재된 세포에서 게놈을 편집하는 임의의 방법에 따르면, DNA 엔도뉴클레아제는 gRNA와 예비-복합체화하여, RNP 복합체를 형성한다.
일부 구현예에서, 본원에 기재된 세포에서 게놈을 편집하는 임의의 방법에 따르면, (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산은 (c)의 공여체 주형이 세포에 제공된 후 상기 세포에 제공된다. 일부 구현예에서, (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산은 (c)의 공여체 주형이 세포에 제공된 후 4일 초과째에 상기 세포에 제공된다. 일부 구현예에서, (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산은 (c)의 공여체 주형이 세포에 제공된 후 적어도 14일째에 상기 세포에 제공된다. 일부 구현예에서, (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산은 (c)의 공여체 주형이 세포에 제공된 후 적어도 17일째에 상기 세포에 제공된다. 일부 구현예에서, (a) 및 (b)는 DNA 엔도뉴클레아제를 인코딩하는 핵산 및 gRNA를 포함하는 지질 나노입자로서 세포에 제공된다. 일부 구현예에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 DNA 엔도뉴클레아제를 인코딩하는 mRNA이다. 일부 구현예에서, (c)는 공여체 주형을 인코딩하는 AAV 벡터로서 세포에 제공된다.
일부 구현예에서, 본원에 기재된 세포에서 게놈을 편집하는 임의의 방법에 따르면, (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산의 하나 이상의 추가 용량은, (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산의 제1 용량 후에 상기 세포에 제공된다. 일부 구현예에서, (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산의 하나 이상의 추가 용량은, 관심 유전자(GOI) 또는 기능적 유도체를 인코딩하는 핵산 서열의 표적화된 통합의 표적 수준 및/또는 GOI 또는 기능적 유도체를 인코딩하는 핵산 서열의 발현의 표적 수준이 달성될 때까지, (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산의 제1 용량 후에 상기 세포에 제공된다.
일부 구현예에서, 본원에 기재된 세포에서 게놈을 편집하는 임의의 방법에 따르면, GOI 또는 기능적 유도체를 인코딩하는 핵산 서열은 내인성 알부민 프로모터의 제어 하에 발현된다.
일부 구현예에서, GOI 또는 이의 기능적 유도체를 세포 게놈의 알부민 좌위 내로 삽입시키는 방법이 본원에 제공되며, 상기 방법은 세포 내로 (a) Cas DNA 엔도뉴클레아제(예를 들어, Cas9) 또는 상기 Cas DNA 엔도뉴클레아제를 인코딩하는 핵산, (b) gRNA 또는 상기 gRNA를 인코딩하는 핵산으로서, 상기 gRNA는 Cas DNA 엔도뉴클레아제를 가이드하여 알부민 좌위에서 표적 폴리뉴클레오타이드 서열을 절단할 수 있는, gRNA 또는 상기 gRNA를 인코딩하는 핵산, 및 (c) GOI 또는 이의 기능적 유도체를 포함하는 본원에 기재된 임의의 구현예에 따른 공여체 주형을 도입하는 단계를 포함한다. 일부 구현예에서, 상기 방법은 Cas DNA 엔도뉴클레아제를 인코딩하는 mRNA를 세포 내로 도입하는 단계를 포함한다. 일부 구현예에서, 상기 방법은 세포 내로 i) Cas DNA 엔도뉴클레아제를 인코딩하는 mRNA 및 ii) gRNA를 포함하는 본원에 기재된 임의의 구현예에 따른 LNP를 도입하는 단계를 포함한다. 일부 구현예에서, 공여체 주형은 AAV 공여체 주형이다. 일부 구현예에서, 공여체 주형은 GOI 또는 이의 기능적 유도체를 포함하는 공여체 카세트를 포함하고, 상기 공여체 카세트는 한면 또는 양면 상에서 gRNA의 표적 부위에 의해 측면 근접해 있다. 일부 구현예에서, 공여체 카세트의 측면 근접해 있는 gRNA 표적 부위는 알부민 좌위 내 gRNA 표적 부위의 역보체이다. 일부 구현예에서, Cas DNA 엔도뉴클레아제 또는 상기 Cas DNA 엔도뉴클레아제를 인코딩하는 핵산 및 gRNA 또는 상기 gRNA를 인코딩하는 핵산은 세포 내로의 공여체 주형의 도입 후 상기 세포 내로 도입된다. 일부 구현예에서, Cas DNA 엔도뉴클레아제 또는 상기 Cas DNA 엔도뉴클레아제를 인코딩하는 핵산 및 gRNA 또는 상기 gRNA를 인코딩하는 핵산은, 공여체 주형이 세포핵 내로 진입할 수 있도록 세포 내로의 공여체 주형의 도입 후 충분한 시간에서 상기 세포 내로 도입된다. 일부 구현예에서, Cas DNA 엔도뉴클레아제 또는 상기 Cas DNA 엔도뉴클레아제를 인코딩하는 핵산 및 gRNA 또는 상기 gRNA를 인코딩하는 핵산은, 공여체 주형이 세포핵 내에서 단일 가닥 AAV 게놈으로부터 이중 가닥 DNA 분자로 전환될 수 있도록 세포 내로의 공여체 주형의 도입 후 충분한 시간에서 상기 세포 내로 도입된다. 일부 구현예에서, Cas DNA 엔도뉴클레아제는 Cas9이다.
일부 구현예에서, GOI 또는 이의 기능적 유도체를 본원에 기재된 세포 게놈의 알부민 좌위 내로 삽입시키는 임의의 방법에 따르면, 표적 폴리뉴클레오타이드 서열은 알부민 유전자의 인트론 1에 있다. 일부 구현예에서, gRNA는 표 3 또는 4에 나열된 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 서열번호 18-44 및 104 중 임의의 하나로부터의 스페이서 서열, 또는 gRNA를 인코딩하는 핵산을 포함한다. 일부 구현예에서, gRNA는 서열번호 21, 22, 28, 및 30 중 임의의 하나로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 서열번호 21로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 서열번호 22로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 서열번호 28로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 서열번호 30으로부터의 스페이서 서열을 포함한다.
일부 구현예에서, GOI 또는 이의 기능적 유도체를 세포 게놈의 알부민 좌위 내로 삽입시키는 방법이 본원에 제공되며, 상기 방법은 세포 내로 (a) i) Cas9 DNA 엔도뉴클레아제를 인코딩하는 mRNA 및 ii) gRNA로서, 상기 gRNA는 Cas9 DNA 엔도뉴클레아제를 가이드하여 알부민 좌위에서 표적 폴리뉴클레오타이드 서열을 절단할 수 있는, gRNA를 포함하는 본원에 기재된 임의의 구현예에 따른 LNP, 및 (b) GOI 또는 이의 기능적 유도체를 포함하는 본원에 기재된 임의의 구현예에 따른 AAV 공여체 주형을 도입하는 단계를 포함한다. 일부 구현예에서, 공여체 주형은 GOI 또는 이의 기능적 유도체를 포함하는 공여체 카세트를 포함하고, 상기 공여체 카세트는 한면 또는 양면 상에서 gRNA의 표적 부위에 의해 측면 근접해 있다. 일부 구현예에서, 공여체 카세트의 측면 근접해 있는 gRNA 표적 부위는 알부민 좌위 내 gRNA 표적 부위의 역보체이다. 일부 구현예에서, LNP는 세포 내로의 AAV 공여체 주형의 도입 후 상기 세포 내로 도입된다. 일부 구현예에서, LNP는, 공여체 주형이 세포핵으로 진입할 수 있도록 세포 내로의 AAV 공여체 주형의 도입 후 충분한 시간에서 상기 세포 내로 도입된다. 일부 구현예에서, LNP는, 공여체 주형이 세포핵 내에서 단일 가닥 AAV 게놈으로부터 이중 가닥 DNA 분자로 전환될 수 있도록 세포 내로의 AAV 공여체 주형의 도입 후 충분한 시간에서 상기 세포 내로 도입된다. 일부 구현예에서, 세포 내로의 LNP의 하나 이상의(예컨대 2, 3, 4, 5개 이상의) 추가 도입은 상기 세포 내로의 LNP의 제1 도입 후 수행된다. 일부 구현예에서, gRNA는 서열번호 18-44 및 104 중 임의의 하나로부터의 스페이서 서열, 또는 gRNA를 인코딩하는 핵산을 포함한다. 일부 구현예에서, gRNA는 서열번호 21, 22, 28, 및 30 중 임의의 하나로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 서열번호 21로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 서열번호 22로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 서열번호 28로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 서열번호 30으로부터의 스페이서 서열을 포함한다.
표적 서열 선택
일부 구현예에서, 특정 기준 좌위에 대한 5' 경계 및/또는 3' 경계의 위치에서의 시프트(shift)가 사용되어 유전자 편집의 특정 적용을 용이하게 하거나 증강시키는데, 이는 본원에 추가로 기술 및 예시된 바와 같이, 편집을 위해서 선택된 엔도뉴클레아제 시스템에 부분적으로 좌우된다.
이러한 표적 서열 선택의 제1의 비제한적인 양태에서, 다수의 엔도뉴클레아제 시스템은 절단을 위한 잠재적인 표적 부위의 초기 선택을 안내하는 규칙 또는 기준, 예컨대 CRISPR II형 또는 V형 엔도뉴클레아제의 경우에 DNA 절단 부위에 인접한 특정 자리에서 PAM 서열 모티프의 필요성을 갖는다.
표적 서열 선택 또는 최적화의 또 다른 비제한적인 양태에서, 표적 서열 및 유전자 편집 엔도뉴클레아제의 특정 조합에 대한 "표적외" 활성의 빈도(즉, 선택된 표적 서열이 아닌 부위에서 일어나는 DSB의 빈도)는 표적상 활성의 빈도에 대해 평가된다. 일부 경우에, 목적하는 좌위에서 교정하여 편집된 세포는 다른 세포에 비해 선택적인 이점을 가질 수 있다. 선택적인 이점의 예시적인 비제한적인 예는 속성, 예컨대 증강된 복제율, 지속성, 특정 상태에 대한 내성, 환자에게 도입된 후 생체내에서의 증강된 성공적인 이식률 또는 지속성, 및 이러한 세포의 유지 또는 증가된 수 또는 생존력과 연관된 다른 속성의 획득을 포함한다. 다른 경우에, 요망되는 좌위에서 교정하여 편집된 세포는 교정하여 편집된 세포를 식별, 분류 또는 달리 선택하기 위해서 사용되는 하나 이상의 스크리닝 방법에 의해서 긍정적으로 선택될 수 있다. 선택적인 이점 및 직접적인 선택 방법 둘 모두는 교정과 연관된 표현형을 이용할 수 있다. 일부 구현예에서, 세포는 세포의 의도된 집단을 선택 또는 정제하기 위해서 사용되는 새로운 표현형을 생성하는 제2 변형을 생성하기 위해서 2회 이상 편집될 수 있다. 이러한 제2 변형은 선택 가능하거나 또는 스크리닝 가능한 마커를 위해서 제2 gRNA를 첨가함으로써 생성될 수 있다. 일부 경우, 세포는 cDNA를 함유하는 DNA 단편 및 또한 선별 마커를 사용하여 요망되는 좌위에서 올바르게 편집될 수 있다.
일부 구현예에서, 임의의 선택적인 이점이 적용 가능하든 또는 임의의 직접적인 선택이 특정 경우에서 적용될 것이든 간에, 표적 서열 선택은 또한 적용 효과를 증강시키고/거나 목적하는 표적이 아닌 부위에서 바람직하지 않은 변경에 대한 가능성을 감소시키기 위해서 표적외 빈도를 고려하여 가이드된다. 본 명세서 및 관련 기술 분야에서 추가로 기재 및 예시된 바와 같이, 표적외 활성의 발생은 표적 부위와 다양한 표적외 부위 간의 유사성 및 비유사성, 뿐만 아니라 사용된 특정 엔도뉴클레아제를 비롯한 다수의 인자에 의해서 영향을 받는다. 표적외 활성의 예측에 도움이 되는 생물정보학 툴이 입수 가능하며, 빈번하게는 이러한 툴을 또한 사용하여 표적외 활성의 가장 가능한 부위를 식별할 수 있고, 이어서 이것을 실험 설정에서 평가하여 표적외 대 표적상 활성의 상대적인 빈도를 평가하고, 이에 의해서 더 높은 표적상 활성을 갖는 서열의 선택이 가능할 수 있다. 이러한 기술의 예시적인 실시예가 본 명세서에 제공되며, 다른 것은 관련 기술 분야에 알려져 있다.
표적 서열 선택의 또 다른 양태는 상동성 재조합 사건에 관한 것이다. 상동성의 서열 공유 영역은 개재된 서열의 결실을 유발하는 상동성 재조합 사건을 위한 초점으로서 기능할 수 있다. 이러한 재조합 사건은 염색체 및 다른 DNA 서열의 정상 복제 과정 동안 일어나고, 또한 DNA 서열이 합성될 때 다른 시간에, 예컨대 이중-가닥 절단부(DSB)의 수선의 경우에 일어나는데, 이것은 정상 세포 복제 사이클 동안 정기적으로 일어나거나 또는 다양한 사건(예컨대 UV광 및 DNA 절단의 다른 유도자)의 발생 또는 특정 작용제(예컨대 다양한 화학적 유도자)의 존재에 의해서 또한 증강될 수 있다. 다수의 이러한 유도자는 DSB가 게놈에서 무비판적으로 발생하게 하고, DSB는 정상 세포에서 정기적으로 유도 및 수선된다. 수선 동안, 본래 서열은 완전한 정확도로 재작제될 수 있지만, 일부 경우에서, 작은 삽입 또는 결실("indel"이라고 지칭됨)이 DSB 부위에서 도입된다.
DSB는 또한 선택된 염색체 위치에서 지향되거나 또는 우선적인 유전자 변형 사건을 유발하는 데 사용될 수 있는, 본 명세서에 기술된 엔도뉴클레아제 시스템의 경우에서와 같이, 특정 위치에서 특이적으로 유도될 수 있다. DNA 수선(뿐만 아니라 복제)과 관련하여 재조합에 적용될 상동성 서열에 대한 경향성은 다수의 상황에 이용될 수 있고, 유전자 편집 시스템, 예컨대 CRISPR의 한 응용을 위한 기반인데, 여기서 상동성 직접 수선을 사용하여 "공여체" 폴리뉴클레오타이드의 사용을 통해서 제공된 관심 서열을 목적하는 염색체 위치 내에 삽입한다.
10개 이하의 염기쌍을 가질 수 있는 "미세상동성"의 작은 영역일 수 있는, 특정 서열들 간의 상동성 영역을 또한 사용하여 목적하는 결실을 제공할 수 있다. 예를 들어, 단일 DSB는 근처 서열과 미세상동성을 나타내는 부위에서 도입된다. 이러한 DSB의 정상 수선 과정 동안, 높은 빈도로 일어나는 결과는 DSB 및 수반된 세포 수선 공정에 의해서 용이해지는 재조합의 결과로서의 개재된 서열의 결실이다.
그러나, 일부 상황에서, 상동성의 영역 내에서 표적 서열을 선택하는 것은 또한 유전자 융합(결실이 암호 영역에 존재하는 경우)을 비롯한 훨씬 더 큰 결실을 생성시킬 수 있고, 이는 특정 상황에 따라서 바람직하거나 바람직하지 않을 수 있다.
본원에 제공된 예는 GOI, 예를 들어, FVIII-인코딩 유전자를 삽입할 뿐만 아니라 표적상 사건에 비해서 표적외 사건을 최소화하도록 설계된 이러한 영역 내에서의 특이적 표적 서열의 선택을 유발하는 대체를 유도하도록 설계된 DSB의 생성을 위해서 다양한 표적 영역의 선택을 추가로 예시한다.
표적화된 통합
일부 구현예에서, 본원에 제공된 방법은 간세포의 게놈 내 특정 위치에서 관심 유전자(GOI) 또는 기능적 GOI를 통합시키는 것이며, 이는 "표적화된 통합"으로 지칭된다. 일부 구현예에서, 표적화된 통합은 게놈 DNA에서 이중 가닥 절단부를 생성시키기 위해 서열 특이적 뉴클레아제를 사용함으로써 가능해진다.
일부 구현예에서 사용되는 CRISPR-Cas 시스템은, 다수의 게놈 표적들이 신속하게 스크리닝되어 최적의 CRISPR-Cas 설계를 식별할 수 있다는 이점을 가진다. CRISPR-Cas 시스템은, 관련된 Cas 뉴클레아제(예를 들어 Cas9 뉴클레아제)를 DNA 내 특정 서열에 표적화하는 단일 가이드 RNA(sgRNA)라고 하는 RNA 분자를 사용한다. 이러한 표적화는 sgRNA와 상기 sgRNA의 대략 20 bp 표적화 서열 내의 게놈 서열 사이의 왓슨-크릭 염기쌍 형성에 의해 발생한다. 일단 표적 부위에 결합되면, Cas 뉴클레아제는 게놈 DNA의 두 가닥 모두를 절단하여, 이중 가닥 절단부를 생성시킨다. 특정 DNA 서열을 표적화하기 위해 sgRNA를 설계하기 위한 유일한 요건은, 게놈 서열에 상보적인 sgRNA 서열의 3' 단부에서 표적 서열이 프로토스페이서 인접 모티프(PAM) 서열을 함유해야 한다는 것이다. Cas9 뉴클레아제의 경우, PAM 서열은 NRG(여기서 R은 A 또는 G이고 N은 임의의 염기임), 또는 더욱 제약된 PAM 서열 NGG이다. 따라서, 게놈의 임의의 영역을 표적화하는 sgRNA 분자는 모든 PAM 모티프에 인접한 20 bp 서열을 위치시킴으로써 인실리코에서 설계될 수 있다. PAM 모티프는 진핵생물의 게놈 내 평균적으로 바로 15 bp에서 발생한다. 그러나, 인실리코 방법에 의해 설계된 sgRNA는 세포에서 이중 가닥 절단부를 상이한 빈도로 생성시킬 것이며, 인실리코 방법을 사용하여 일련의 sgRNA 분자의 절단 효율을 예측하는 것은 불가능하다. sgRNA가 시험관내에서 신속하게 합성될 수 있기 때문에, 이는 주어진 게놈 영역에서 모든 잠재적인 sgRNA 서열의 신속한 스크리닝을 가능하게 하여, 가장 효율적인 절단을 초래하는 sgRNA를 식별한다. 일반적으로, 주어진 게놈 영역 내 일련의 sgRNA가 세포에서 시험될 때, 0% 내지 90% 범위의 절단 효율이 관찰된다. 인실리코 알고리즘뿐만 아니라 실험실 실험 또한, 임의의 주어진 sgRNA의 표적외 잠재력을 결정하는 데 사용될 수 있다. sgRNA의 20 bp 인식 서열에 대한 완벽한 매치는 대부분의 진핵생물 게놈에서 주로 단지 한 번 발생할 것인 한편, sgRNA에 대한 1개 이상의 염기쌍 미스매치를 갖는 게놈에서 다수의 추가 부위가 존재할 것이다. 이들 부위는, 종종 미스매치의 수 또는 위치에 기초하여 예측 불가능한 가변적인 빈도로 절단될 수 있다. 인실리코 분석에 의해 식별되지 않은 추가의 표적외 부위에서의 절단 또한 발생할 수 있다. 그러므로, 가장 선호할 만한 표적외 프로파일을 갖는 sgRNA를 식별하기 위해 관련 세포 유형에서 sgRNA의 수를 스크리닝하는 것은 치료 용도에 최적인 sgRNA의 선택에 있어서 중요한 구성요소이다. 선호할 만한 표적외 프로파일은 실제 표적외 부위의 수 및 이들 부위에서의 절단 빈도뿐만 아니라, 이들 부위의 게놈에서의 위치를 고려할 것이다. 예를 들어, 기능적으로 중요한 유전자, 특히 종양유전자(oncogene) 또는 항-종양유전자(anti-oncogene)에 근접하거나 그 내의 표적외 부위는 미지의 기능을 갖는 유전자간 영역에서의 부위보다 덜 선호할 만한 것으로 여겨질 것이다. 그러므로, 최적의 sgRNA의 식별은 단순히 유기체의 게놈 서열의 인실리코 분석에 의해 예측될 수 없으나, 실험적 시험을 필요로 한다. 인실리코 분석은 시험할 가이드의 수를 좁히는 데 도움을 줄 수 있긴 하지만, 이는 높은 표적상 절단을 갖는 가이드를 예측할 수 없거나 낮은 바람직한 표적외 절단으로 가이드를 예측할 수 없다. 실험적 데이터는, 각각이 관심 영역(예컨대 알부민 인트론 1)의 게놈에 대해 완벽한 매치를 갖는 sgRNA의 절단 효율이 0% 절단 내지 >90% 절단으로 다양하고 임의의 기지의 알고리즘에 의해 예측 불가능함을 나타낸다. Cas 효소에 의한 절단을 촉진하는 주어진 sgRNA의 능력은, 해당 영역 내 염색질 구조에 의해 결정될 수 있는 게놈 DNA 내 특정 부위의 접근성에 관한 것일 수 있다. 휴지기(quiescent) 분화된 세포, 예컨대 간세포 내 대부분의 게놈 DNA는 고도로 응축된 이질염색질에 존재하는 한편, 활성적으로 전사되는 영역은 고분자(large molecule), 예컨대 Cas 단백질과 같은 단백질에 더욱 접근 가능한 것으로 알려진 더욱 열린(open) 염색질 상태로 존재한다. 심지어 활성적으로 전사된 유전자 내에서 DNA의 일부 특정 영역은, 결합된 전사 인자 또는 다른 조절 단백질의 존재 또는 부재로 인해 다른 것들보다 더욱 접근 가능하다. 게놈 내 또는 특정 게놈 좌위 또는 게놈 좌위 영역, 예컨대 인트론, 예컨대 알부민 인트론 1 내의 부위를 예측하는 것은 불가능하며, 따라서, 관련 세포 유형에서 실험적으로 결정될 필요가 있을 것이다. 일단 일부 부위가 삽입에 잠재적인 부위로서 선택되면, 예를 들어, 실험적 시험과 함께 또는 없이, 선택된 부위로부터 업스트림 또는 다운스트림에 몇몇 뉴클레오타이드를 이동시킴으로써 이러한 부위에 일부 변이를 첨가하는 것이 가능할 수 있다.
일부 구현예에서, 본원에 개시된 방법에 사용될 수 있는 gRNA는 표 3으로부터 나열된 하나 이상 또는 표 3으로부터의 것과 적어도 약 85% 뉴클레오타이드 서열 동일성을 갖는 이의 임의의 유도체이다.
핵산 변형
일부 구현예에서, 세포에 도입된 폴리뉴클레오타이드는 본 명세서에 추가로 기재되고, 관련 기술 분야에 알려진 바와 같이, 예를 들어, 활성, 안정성 또는 특이성을 증강시키거나, 전달을 변경하거나, 숙주 세포에서 선천적 면역 반응을 감소시키거나 또는 다른 증강을 위해 개별적으로 또는 조합되어 사용될 수 있는 하나 이상의 변형을 갖는다.
특정 구현예에서, 변형된 폴리뉴클레오타이드가 CRISPR/Cas9/Cpf1 시스템에서 사용되는데, 이 경우 가이드 RNA(단일-분자 가이드 또는 이중-분자 가이드) 및/또는 세포에 도입된 Cas 또는 Cpf1 엔도뉴클레아제를 인코딩하는 DNA 또는 RNA가 하기에 기재 및 예시된 바와 같이 변형될 수 있다. 이러한 변형된 폴리뉴클레오타이드를 CRISPR/Cas9/Cpf1 시스템에서 사용하여 임의의 하나 이상의 게놈 좌위를 편집할 수 있다.
이러한 사용의 비제한적인 예시의 목적을 위해서 CRISPR/Cas9/Cpf1 시스템을 사용하면, 가이드 RNA의 변형을 사용하여 단일-분자 가이드 또는 이중-분자일 수 있는 가이드 RNA, 및 Cas 또는 Cpf1 엔도뉴클레아제를 갖는 CRISPR/Cas9/Cpf1 게놈 편집 복합체의 형성 또는 안정성을 증강시킬 수 있다. 가이드 RNA의 변형을 또한 또는 대안적으로 사용하여 게놈에서 게놈 편집 복합체와 표적 서열 간의 상호작용의 개시, 안정성 또는 속도론을 향상시킬 수 있는데, 이것을 사용하여 예를 들어 표적상 활성을 향상시킬 수 있다. 가이드 RNA의 변형을 또한 또는 대안적으로 사용하여 특이성, 예를 들어 다른 (표적외) 부위에서의 효과와 비교된 표적상 부위에서의 게놈 편집의 상대적인 속도를 향상시킬 수 있다.
변형을 또한 또는 대안적으로 사용하여 예를 들어, 세포에 존재하는 리보뉴클레아제(RNAse)에 의한 절단에 대한 이의 내성을 증가시키고, 이에 의해서 세포에서 이의 반감기를 증가시킴으로써, 가이드 RNA의 안정성을 증가시킬 수 있다. 가이드 RNA 반감기를 향상시키는 변형은 특별하게는 엔도뉴클레아제를 생성하기 위해서 번역될 필요가 있는 RNA를 통해서 편집될 세포에 Cas 또는 Cpf1 엔도뉴클레아제가 도입되는 구현예에서 유용할 수 있는데, 그 이유는 엔도뉴클레아제를 인코딩하는 RNA와 동시에 도입된 가이드 RNA의 반감기의 증가를 사용하여 가이드 RNA 및 인코딩된 Cas 또는 Cpf1 엔도뉴클레아제가 세포에서 함께 존재하는 시간을 증가시킬 수 있기 때문이다.
변형을 또한 또는 대안적으로 사용하여 세포에 도입된 RNA가 선천적 면역 반응을 유발할 가능성 또는 정도를 감소시킬 수 있다. 하기 및 당업계에 기재된 바와 같이, 작은-간섭 RNA(siRNA)를 비롯한 RNA 간섭(RNAi)과 관련하여 널리 특징규명된, 이러한 반응은 RNA의 감소된 반감기 및/또는 사이토카인 또는 면역 반응과 연관된 다른 인자의 유발과 연관되는 경향이 있다.
RNA의 안정성을 향상시키는 변형(예컨대 세포에 존재하는 RNAse에 의한 이의 절단을 증가시킴으로써), 생성된 산물(즉 엔도뉴클레아제)의 번역을 향상시키는 변형, 및/또는 세포에 도입된 RNA가 선천적 면역 반응을 유발할 가능성 또는 정도를 감소시키는 변형을 포함하지만 이들로 제한되지 않는 하나 이상의 유형의 변형이 세포에 도입되는 엔도뉴클레아제를 인코딩하는 RNA에 또한 행해질 수 있다.
변형, 예컨대 상기 및 나머지 것의 조합이 마찬가지로 사용될 수 있다. CRISPR/Cas9/Cpf1의 경우에, 예를 들어, 하나 이상의 유형의 변형이 가이드 RNA에 행해질 수 있고/있거나(상기에 예시된 것 포함) 하나 이상의 유형의 변형이 Cas 엔도뉴클레아제를 인코딩하는 RNA에 행해질 수 있다(상기에 예시된 것 포함).
예의 방식으로, CRISPR/Cas9/Cpf1 시스템에서 사용되는 가이드 RNA 또는 다른 더 작은 RNA는 화학적 수단에 의해서 쉽게 합성될 수 있고, 하기에 예시되고 당업계에 기재된 바와 같이, 다수의 변형이 쉽게 도입되게 한다. 화학적 합성 절차는 계속적으로 확장되지만, 고성능 액체 크로마토그래피(HPLC, 이것은 겔, 예컨대 PAGE의 사용을 회피함)와 같은 절차에 의한 이러한 RNA의 정제는 보다 곤란해지는 경향이 있는데, 그 이유는 폴리뉴클레오타이드 길이가 수백 초과의 뉴클레오타이드로 상당히 증가하기 때문이다. 더 큰 길이의 화학적으로-변형된 RNA를 생성하기 위해서 사용되는 한 접근법은 함께 리게이션된 2개 이상의 분자를 생성하는 것이다. 훨씬 더 긴 RNA, 예컨대 Cas9 엔도뉴클레아제를 인코딩하는 것이 효소적으로 보다 쉽게 생성된다. 적은 유형의 변형이 일반적으로 효소적으로 생산된 RNA에서 사용하기 위해서 입수 가능하지만, 하기에 및 관련 기술 분야에 추가로 기술된 바와 같이, 예를 들어, 안정성을 향상시키고/거나, 선천적 면역 반응의 가능성 또는 정도를 감소시키고/거나 다른 속성을 향상시키는 데 사용될 수 있는 변형이 여전히 존재하고; 새로운 유형의 변형이 정기적으로 개발되고 있다.
다양한 유형의 변형, 특히 더 작은 화학적으로 합성된 RNA와 함께 빈번하게 사용되는 것의 예의 방식으로, 변형은 당의 2' 자리에서 변형된 하나 이상의 뉴클레오타이드, 일부 구현예에서 2'-O-알킬, 2'-O-알킬-O-알킬, 또는 2'-플루오로-변형된 뉴클레오타이드를 가질 수 있다. 일부 구현예에서, RNA 변형은 피리미딘의 리보스, 무염기성(abasic) 잔기, 또는 RNA의 3' 단부에서 역위 염기(inverted base) 상에 2'-플루오로, 2'-아미노 또는 2' O-메틸 변형을 포함한다. 이러한 변형은 일상적으로 올리고뉴클레오타이드 내에 혼입되고, 이들 올리고뉴클레오타이드는 주어진 표적에 대해서 2'-데옥시올리고뉴클레오타이드보다 더 높은 Tm(즉, 더 높은 표적 결합 친화도)을 갖는 것으로 나타났다.
다수의 뉴클레오타이드 및 뉴클레오사이드 변형이 이들이 혼입된 올리고뉴클레오타이드를 네이티브 올리고뉴클레오타이드보다 뉴클레아제 소화에 대해서 더 내성으로 만드는 것으로 보였고; 이들 변형된 올리고는 비변형된 올리고뉴클레오타이드보다 더 긴 시간 동안 온전하게 살아 남는다. 변형된 올리고뉴클레오타이드의 구체적인 예는 변형된 골격, 예를 들어, 포스포로티오에이트, 포스포트라이에스터, 메틸 포스포네이트, 단쇄 알킬 또는 사이클로알킬 당간(intersugar) 연결부 또는 단쇄 헤테로원자 또는 헤테로사이클릭 당간 연결부를 갖는 것을 포함한다. 일부 올리고뉴클레오타이드는 포스포로티오에이트 골격을 갖는 올리고뉴클레오타이드 및 헤테로원자 골격을 갖는 것들, 특히 CH2 -NH-O-CH2, CH,~N(CH3)~O~CH2(메틸렌(메틸이미노) 또는 MMI 골격으로 알려져 있음), CH2 --O--N (CH3)-CH2, CH2 -N (CH3)-N (CH3)-CH2 및 O-N (CH3)- CH2 -CH2 골격으로서, 네이티브 포스포디에스테르 골격은 O- P-- O- CH로 표시됨); 아미드 골격[문헌[De Mesmaeker , Ace. Chem. Res., 28:366-374 (1995)] 참조]; 모르폴리노 골격 구조(Summerton 및 Weller, 미국 특허 제5,034,506호 참조); 펩타이드 핵산(PNA) 골격(여기서 올리고뉴클레오타이드의 포스포디에스테르 골격은 폴리아미드 골격으로 대체되며, 뉴클레오타이드는 폴리아미드 골격의 아자 질소 원자에 직접적으로 또는 간접적으로 결합되고, 문헌[Nielsen , Science 1991, 254, 1497] 참조)이다. 인-함유 연결부는, 포스포로티오에이트, 카이랄 포스포로티오에이트, 포스포로디티오에이트, 포스포트리에스테르, 아미노알킬포스포트리에스테르, 3' 알킬렌 포스포네이트 및 카이랄 포스포네이트를 포함하는 메틸 및 다른 알킬 포스포네이트, 포스피네이트, 3'-아미노 포스포르아미데이트 및 아미노알킬포스포르아미데이트를 갖는 포스포르아미데이트, 티오노포스포르아미데이트, 티오노알킬포스포네이트, 티오노알킬포스포트리에스테르, 및 정상적인 3'-5' 연결을 갖는 보라노포스페이트 및 이들의 2'-5' 연결된 유사체, 및 인접한 뉴클레오사이드 단위의 쌍이 3'-5'에서 5'-3' 또는 2'-5'에서 5'-2'로 연결되는 역전된 극성을 갖는 것들을 포함하지만 이들로 제한되지 않으며; 미국 특허 제3,687,808; 4,469,863; 4,476,301; 5,023,243; 5,177,196; 5,188,897; 5,264,423; 5,276,019; 5,278,302; 5,286,717; 5,321,131; 5,399,676; 5,405,939; 5,453,496; 5,455,233; 5,466,677; 5,476,925; 5,519,126; 5,536,821; 5,541,306; 5,550,111; 5,563,253; 5,571,799; 5,587,361; 및 5,625,050호를 참조한다.
모르폴리노-기초 올리고머성 화합물은 문헌[Braasch 및 David Corey, Biochemistry, 41(14): 4503-4510 (2002)]; 문헌[Genesis, Volume 30, Issue 3, (2001)]; 문헌[Heasman, Dev. Biol., 243: 209-214 (2002)]; 문헌[Nasevicius , Nat. Genet., 26:216-220 (2000)]; 문헌[Lacerra , Proc. Natl. Acad. Sci., 97: 9591-9596 (2000)]; 및 1991년 7월 23일에 등록된 미국 특허 제5,034,506호에 기재되어 있다.
사이클로헥세닐 핵산 올리고뉴클레오타이드 모방체는 문헌[Wang , J. Am. Chem. Soc., 122: 8595-8602 (2000)]에 기재되어 있다.
내부에 인 원자를 포함하지 않는 변형된 올리고뉴클레오타이드 골격은 단쇄 알킬 또는 사이클로알킬 뉴클레오사이드간(internucleoside) 연결부, 혼합된 헤테로원자와 알킬 또는 사이클로알킬 뉴클레오사이드간 연결부 또는 하나 이상의 단쇄 헤테로원자 또는 헤테로사이클릭 뉴클레오사이드간 연결부에 의해서 형성된 골격을 갖는다. 이는, 모르폴리노 연결부(뉴클레오사이드의 당 부분으로부터 부분적으로 형성됨); 실록산 골격; 술파이드, 술폭시드 및 술폰 골격; 포름아세틸 및 티오포름아세틸 골격; 메틸렌 포름아세틸 및 티오포름아세틸 골격; 알켄 함유 골격; 술파메이트 골격; 메틸렌이미노 및 메틸렌히드라지노 골격; 술포네이트 및 술폰아미드 골격; 아미드 골격을 갖는 것들; 및 N, O, S 및 CH2 성분 부분이 혼합된 다른 것들을 가지며; 미국 특허 제5,034,506; 5,166,315; 5,185,444; 5,214,134; 5,216,141; 5,235,033; 5,264,562; 5,264,564; 5,405,938; 5,434,257; 5,466,677; 5,470,967; 5,489,677; 5,541,307; 5,561,225; 5,596,086; 5,602,240; 5,610,289; 5,602,240; 5,608,046; 5,610,289; 5,618,704; 5,623,070; 5,663,312; 5,633,360; 5,677,437; 및 5,677,439호를 참조하며, 이들은 각각 참조에 의해 본원에 포함된다.
하나 이상의 치환된 당 모이어티 또한 포함될 수 있으며, 예를 들어, 2' 위치에서, OH, SH, SCH3, F, OCN, OCH3, OCH3 O(CH2)n CH3, O(CH2)n NH2, 또는 O(CH2)n CH3, 여기서 n은 1 내지 약 10임; C1 내지 C10 저급 알킬, 알콕시알콕시, 치환된 저급 알킬, 알카릴 또는 아랄킬; Cl; Br; CN; CF3; OCF3; O-, S-, 또는 N-알킬; O-, S-, 또는 N-알케닐; SOCH3; SO2 CH3; ONO2; NO2; N3; NH2; 헤테로사이클로알킬; 헤테로사이클로알카릴; 아미노알킬아미노; 폴리알킬아미노; 치환된 실릴; RNA 절단기; 리포터 기; 인터칼레이터(intercalator); 올리고뉴클레오타이드의 약물동력학적 특성을 향상시키기 위한 기; 또는 올리고뉴클레오타이드 및 유사한 특성을 갖는 다른 치환체의 약물역학적 특성을 향상시키기 위한 기 중 하나가 포함될 수 있다. 일부 구현예에서, 변형은 2'-메톡시에톡시(2'-O-(2-메톡시에틸)로도 알려져 있는, 2'-O-CH2CH2OCH3)를 포함한다(문헌[Martin 등, HeIv. Chim. Acta, 1995, 78, 486]). 다른 변형은 2'-메톡시(2'-0-CH3), 2'-프로폭시(2'-OCH2 CH2CH3) 및 2'-플루오로(2'-F)를 포함한다. 유사한 변형이 또한 올리고뉴클레오타이드 상의 다른 자리, 특별하게는 3' 말단 뉴클레오타이드 상의 당의 3' 자리 및 5' 말단 뉴클레오타이드의 5' 자리 상에서 행해질 수 있다. 올리고뉴클레오타이드는 또한 펜토퓨라노실기 대신에 당 모방체, 예컨대 사이클로부틸을 가질 수 있다.
일부 구현예에서, 뉴클레오타이드 단위의 당 및 뉴클레오사이드간 연결기 둘 모두, 즉, 골격은 신규 기로 대체된다. 염기 단위는 적절한 핵산 표적 화합물과의 하이브리드화를 위해 유지된다. 탁월한 하이브리드화 특성을 갖는 것으로 밝혀진 올리고뉴클레오타이드 모방체인 이러한 올리고머 화합물 중 하나는 펩티드 핵산(PNA)으로 지칭된다. PNA 화합물에서, 올리고뉴클레오타이드의 당-골격은 아미드 함유 골격, 예를 들어 아미노에틸글리신 골격으로 대체된다. 핵염기는 보유되며, 골격의 아미드 부분의 아자 질소 원자에 직접적으로 또는 간접적으로 결합된다. PNA 화합물의 제조를 교시하는 대표적인 미국 특허는 미국 특허 제5,539,082호; 제5,714,331호; 및 제5,719,262호를 갖지만 이들로 제한되지 않는다. PNA 화합물의 추가 교시는 문헌[Nielsen 등, Science, 254: 1497-1500 (1991)]에서 찾을 수 있다.
일부 구현예에서, 가이드 RNA는 또한 추가로 또는 대안적으로, 핵염기(흔히 관련 기술 분야에서 단순히 "염기"라 지칭함) 변형 또는 치환을 포함할 수 있다. 본원에 사용된 바와 같이, "변형되지 않은" 또는 "자연" 핵염기는, 아데닌 (A), 구아닌 (G), 티민 (T), 시토신 (C) 및 우라실 (U)을 포함한다. 변형된 핵염기는, 자연 핵산에서 드물게 또는 일시적으로만 발견되는 핵염기, 예를 들어 하이포잔틴, 6-메틸아데닌, 5-Me 피리미딘, 특히 5-메틸시토신 (또한 5-메틸-2' 데옥시시토신으로 지칭되며, 종종 당업계에서 5-Me-C로 지칭됨), 5-하이드록시메틸시토신 (HMC), 글리코실 HMC 및 겐토비오실 HMC뿐 아니라, 합성 핵염기, 예를 들어 2-아미노아데닌, 2-(메틸아미노)아데닌, 2-(이미다졸릴알킬)아데닌, 2-(아미노알킬아미노)아데닌 또는 다른 이종치환된 알킬아데닌, 2-티오우라실, 2-티오티민, 5-브로모우라실, 5-하이드록시메틸우라실, 8-아자구아닌, 7-데아자구아닌, N6(6-아미노헥실)아데닌 및 2,6-디아미노퓨린을 포함한다. 문헌[Kornberg, A., DNA Replication, W. H. Freeman & Co., San Francisco, pp75-77 (1980)]; 문헌[Gebeyehu , Nucl. Acids Res. 15:4513 (1997)]. 당업계에 알려진 "보편적" 염기, 예를 들어, 이노신이 또한 포함될 수 있다. 5-Me-C 치환은 핵산 듀플렉스 안정성을 0.6℃ 내지 1.2℃ 증가시키는 것으로 나타났고(문헌[Sanghvi, Y. S., in Crooke, S. T. 및 Lebleu, B., eds., Antisense Research and Applications, CRC Press, Boca Raton, 1993, pp. 276-278]), 염기 치환의 구현예이다.
일부 구현예에서, 변형된 핵염기는 다른 합성 및 자연 핵염기, 예컨대 5-메틸시토신 (5-me-C), 5-하이드록시메틸 시토신, 잔틴, 하이포잔틴, 2-아미노아데닌, 아데닌 및 구아닌의 6-메틸 및 다른 알킬 유도체, 아데닌 및 구아닌의 2-프로필 및 다른 알킬 유도체, 2-티오우라실, 2-티오티민 및 2-티오시토신, 5-할로우라실 및 시토신, 5-프로피닐 우라실 및 시토신, 6-아조 우라실, 시토신 및 티민, 5-우라실 (유사-우라실), 4-티오우라실, 8-할로, 8-아미노, 8-티올, 8-티오알킬, 8-하이드록실 및 다른 8-치환된 아데닌 및 구아닌, 5-할로 특히 5-브로모, 5-트리플루오로메틸 및 다른 5-치환된 우라실 및 시토신, 7-메틸구아닌 및 7-메틸아데닌, 8-아자구아닌 및 8-아자아데닌, 7-데아자구아닌 및 7-데아자아데닌 및 3-데아자구아닌 및 3-데아자아데닌을 포함한다.
나아가, 핵염기는 미국 특허 제3,687,808호에 개시된 것들, 문헌['The Concise Encyclopedia of Polymer Science And Engineering', pages 858-859, Kroschwitz, J.I., ed. John Wiley & Sons, 1990]에 개시된 것들, 문헌[Englisch 등, Angewandle Chemie, International Edition', 1991, 30, page 613]에 개시된 것들, 및 문헌[Sanghvi, Y. S., Chapter 15, Antisense Research and Applications', pages 289- 302, Crooke, S.T. 및 Lebleu, B. ea., CRC Press, 1993]에 개시된 것들을 포함한다. 이러한 핵염기 중 일부는 본 개시내용의 올리고머 화합물의 결합 친화성을 증가시키는데 특히 유용하다. 이는 5-치환된 피리미딘, 6-아자피리미딘, 및 2-아미노프로필아데닌, 5-프로피닐우라실 및 5-프로피닐시토신을 갖는 N-2, N-6 및 0-6 치환된 퓨린을 포함한다. 5-메틸시토신 치환은 핵산 이중체 안정성을 0.6℃ 내지 1.2℃ 만큼 증가시키는 것으로 나타났으며(문헌[Sanghvi, Y. S., Crooke, S. T. 및 Lebleu, B., eds, 'Antisense Research and Applications', CRC Press, Boca Raton, 1993, pp. 276-278]), 이는 현재, 보다 더욱 특히 2'-O-메톡시에틸 당 변형과 조합될 때, 바람직한 염기 치환이다. 변형된 핵염기는 미국 특허 제3,687,808호, 뿐만 아니라 4,845,205; 5,130,302; 5,134,066; 5,175,273; 5,367,066; 5,432,272; 5,457,187; 5,459,255; 5,484,908; 5,502,177; 5,525,711; 5,552,540; 5,587,469; 5,596,091; 5,614,617; 5,681,941; 5,750,692; 5,763,588; 5,830,653; 6,005,096호; 및 미국특허출원공개 2003/0158403호에 기재되어 있다.
일부 구현예에서, 가이드 RNA 및/또는 엔도뉴클레아제를 인코딩하는 mRNA(또는 DNA)는, 올리고뉴클레오타이드의 활성, 세포적 분포, 또는 세포적 흡수를 증강시키는 하나 이상의 모이어티 또는 접합체에 화학적으로 연결된다. 이러한 모이어티는 지질 모이어티, 예컨대 콜레스테롤 모이어티[Letsinger , Proc. Natl. Acad. Sci. USA, 86: 6553-6556 (1989)]; 담즙산[Manoharan , Bioorg. Med. Chem. Let., 4: 1053-1060 (1994)]; 티오에테르, 예를 들어, 헥실-S-트리틸티올[Manoharan 등, Ann. N. Y. Acad. Sci., 660: 306-309 (1992) 및 Manoharan , Bioorg. Med. Chem. Let., 3: 2765-2770 (1993)]; 티오콜레스테롤[Oberhauser , Nucl. Acids Res., 20: 533-538 (1992)]; 지방족 사슬, 예를 들어, 도데칸디올 또는 운데실 잔기[Kabanov , FEBS Lett., 259: 327-330 (1990) 및 Svinarchuk , Biochimie, 75: 49- 54 (1993)]; 인지질, 예를 들어, 디-헥사데실-rac-글리세롤 또는 트리에틸암모늄 1,2-디-O-헥사데실-rac-글리세로-3-H-포스포네이트[Manoharan , Tetrahedron Lett., 36: 3651-3654 (1995) 및 Shea , Nucl. Acids Res., 18: 3777-3783 (1990)]; 폴리아미드 또는 폴리에틸렌 글리콜 사슬[Mancharan , Nucleosides & Nucleotides, 14: 969-973 (1995)]; 아다만탄 아세트산[Manoharan , Tetrahedron Lett., 36: 3651-3654 (1995)]; 팔미틸 모이어티[(Mishra , Biochim. Biophys. Acta, 1264: 229-237 (1995)]; 또는 옥타데실아민 또는 헥실아미노-카르보닐-t 옥시콜레스테롤 모이어티[Crooke , J. Pharmacol. Exp. Ther., 277: 923-937 (1996)]를 포함하지만 이들로 제한되지 않는다. 또한 미국 특허 제4,828,979; 4,948,882; 5,218,105; 5,525,465; 5,541,313; 5,545,730; 5,552,538; 5,578,717, 5,580,731; 5,580,731; 5,591,584; 5,109,124; 5,118,802; 5,138,045; 5,414,077; 5,486,603; 5,512,439; 5,578,718; 5,608,046; 4,587,044; 4,605,735; 4,667,025; 4,762,779; 4,789,737; 4,824,941; 4,835,263; 4,876,335; 4,904,582; 4,958,013; 5,082,830; 5,112,963; 5,214,136; 5,082,830; 5,112,963; 5,214,136; 5,245,022; 5,254,469; 5,258,506; 5,262,536; 5,272,250; 5,292,873; 5,317,098; 5,371,241, 5,391,723; 5,416,203, 5,451,463; 5,510,475; 5,512,667; 5,514,785; 5,565,552; 5,567,810; 5,574,142; 5,585,481; 5,587,371; 5,595,726; 5,597,696; 5,599,923; 5,599, 928 및 5,688,941호를 참조한다.
일부 구현예에서, 당 및 다른 모이어티는 단백질 및 뉴클레오타이드, 예컨대 양이온성 폴리좀(polysome) 및 리포솜을 갖는 복합체를 특정 부위로 표적화하는 데 사용될 수 있다. 예를 들어, 간세포는 아시알로당단백질 수용체(ASGPR: asialoglycoprotein receptor)를 통해 매개될 수 있으며; 예를 들어, 문헌[Hu, , Protein Pept Lett. 21(10):1025-30 (2014)]를 참조한다. 당업계에 알려져 있고 정기적으로 개발되는 다른 시스템은 본 경우에 사용될 생물분자 및/또는 이의 복합체를 관심 특정 표적 세포에 표적화하는 데 사용될 수 있다.
일부 구현예에서, 이들 표적화 모이어티 또는 접합체는 작용기, 예컨대 1차 또는 2차 하이드록실기에 공유 결합된 접합체 기를 포함할 수 있다. 본 개시내용의 접합체 기는 인터칼레이터, 리포터 분자, 폴리아민, 폴리아미드, 폴리에틸렌 글리콜, 폴리에테르, 올리고머의 약물역학적 특성을 증강시키는 기, 및 올리고머의 약물동력학적 특성을 증강시키는 기를 포함한다. 전형적인 접합체 기는 콜레스테롤, 지질, 인지질, 비오틴, 페나진, 폴레이트, 페난트리딘, 안트라퀴논, 아크리딘, 플루오레세인, 로다민, 쿠마린 및 염료를 포함한다. 본 개시내용의 맥락에서 약물역학적 특성을 증강시키는 기는, 흡수를 향상시키고/거나 분해에 대한 내성을 증강시키고/거나 표적 핵산과의 서열-특이적 혼성화를 강화시키는 기를 포함한다. 본 개시내용의 맥락에서 약물동력학적 특성을 증강시키는 기는, 본 개시내용의 화합물의 흡수, 분포, 대사 또는 배출을 향상시키는 기를 포함한다. 대표적인 접합체 기는 1992년 10월 23일에 출원된 국제특허출원 PCT/US92/09196호 및 미국 특허 제6,287,860호에 개시되어 있으며, 이들은 참조로서 본원에 포함된다. 접합체 모이어티는 지질 모이어티, 예컨대 콜레스테롤 모이어티, 담즙산, 티오에테르, 예를 들어, 헥실-5-트리틸티올, 티오콜레스테롤, 지방족 사슬, 예를 들어, 도데칸디올 또는 운데실 잔기, 인지질, 예를 들어, 디-헥사데실-rac-글리세롤 또는 트리에틸암모늄, 1,2-디-O-헥사데실-rac-글리세로-3-H-포스포네이트, 폴리아민 또는 폴리에틸렌 글리콜 사슬, 또는 아다만탄 아세트산, 팔미틸 모이어티, 또는 옥타데실아민 또는 헥실아미노-카르보닐-옥시 콜레스테롤 모이어티를 포함하지만 이들로 제한되지 않는다. 예를 들어, 미국 특허 제4,828,979; 4,948,882; 5,218,105; 5,525,465; 5,541,313; 5,545,730; 5,552,538; 5,578,717, 5,580,731; 5,580,731; 5,591,584; 5,109,124; 5,118,802; 5,138,045; 5,414,077; 5,486,603; 5,512,439; 5,578,718; 5,608,046; 4,587,044; 4,605,735; 4,667,025; 4,762,779; 4,789,737; 4,824,941; 4,835,263; 4,876,335; 4,904,582; 4,958,013; 5,082,830; 5,112,963; 5,214,136; 5,082,830; 5,112,963; 5,214,136; 5,245,022; 5,254,469; 5,258,506; 5,262,536; 5,272,250; 5,292,873; 5,317,098; 5,371,241, 5,391,723; 5,416,203, 5,451,463; 5,510,475; 5,512,667; 5,514,785; 5,565,552; 5,567,810; 5,574,142; 5,585,481; 5,587,371; 5,595,726; 5,597,696; 5,599,923; 5,599,928 및 5,688,941호를 참조한다.
화학적 합성에 덜 적합하고, 일반적으로 효소적 합성에 의해서 생산되는 더 긴 폴리뉴클레오타이드가 또한 다양한 수단에 의해서 변형될 수 있다. 이러한 변형은 예를 들어, 특정 뉴클레오타이드 유사체의 도입, 분자의 5' 또는 3' 단부에서 특정 서열 또는 다른 모이어티의 혼입 및 다른 변형을 포함할 수 있다. 예의 방식으로, Cas9를 인코딩하는 mRNA는 대략 4kb 길이이고, 시험관내 전사에 의해서 합성될 수 있다. mRNA에 대한 변형이 적용되어 예를 들어, 이의 번역 또는 안정성을 증가시키거나(예컨대 세포를 사용한 절단에 대한 이의 내성을 증가시킴으로써) 또는 외인성 RNA, 특별하게는 예컨대 Cas9를 인코딩하는 더 긴 RNA의 도입 이후에 세포에서 흔히 발견되는 선천적 면역 반응을 유발하는 RNA의 경향성을 감소시킬 수 있다.
다수의 이러한 변형, 예컨대 폴리A 테일, 5' 캡 유사체(예를 들어, 안티 리버스 맵 유사체(ARCA: Anti Reverse Cap Analog) 또는 m7G(5')ppp(5')G(mCAP)), 변형된 5' 또는 3' 미번역 영역(UTR), 변형된 염기(예컨대 슈도-UTP, 2-티오-UTP, 5-메틸시티딘-5'-트라이포스페이트(5-메틸-CTP) 또는 N6-메틸-ATP의 사용) 또는 5' 말단 포스페이트를 제거하기 위한 포스파타제로의 처리는 관련 기술 분야에 기재되어 있다. 이들 변형 및 다른 변형이 관련 기술 분야에 알려져 있고, RNA의 새로운 변형은 정기적으로 개발되고 있다.
예를 들어, TriLink Biotech, AxoLabs, Bio-Synthesis Inc., Dharmacon 및 다수의 다른 회사를 비롯한, 변형된 RNA의 다수의 상업적인 공급원이 존재한다. 트라이링크에 의해서 기술된 바와 같이, 예를 들어, 5-메틸-CTP를 사용하여 바람직한 특징, 예컨대 증가된 뉴클레아제 안정성, 시험관내 전사 RNA를 갖는 선천적 면역 수용체의 증가된 번역 또는 감소된 상호작용을 부여할 수 있다. 5-메틸시티딘-5'-트라이포스페이트(5-메틸-CTP), N6-메틸-ATP, 뿐만 아니라 슈도-UTP 및 2-티오-UTP는 또한 하기에 언급된 Kormann 등 및 Warren 등에 의한 간행물에 예시된 바와 같이, 번역을 향상시키면서, 배양물 중에서 그리고 생체내에서 선천적 면역 자극을 감소시키는 것으로 나타났다.
생체내에 전달된 화학적으로 변형된 mRNA를 사용하여 개선된 치료적 효과를 달성할 수 있음이 나타났다; 예를 들어, 문헌[Kormann 등, Nature Biotechnology 29, 154-157 (2011)]를 참조한다. 이러한 변형을 사용하여 예를 들어, RNA 분자의 안정성을 증가시키고/거나 이의 면역원성을 감소시킬 수 있다. 화학적 변형, 예컨대 슈도-U, N6-메틸-A, 2-티오-U 및 5-메틸-C를 사용하면, 각각 2-티오-U 및 5-메틸-C를 갖는 유리딘 잔기 및 시티딘 잔기의 단지 1/4이 마우스에서 mRNA의 톨-유사 수용체(TLR) 매개된 인식의 상당한 감소를 유발하였다는 것을 발견하였다. 선천적 면역계의 활성화를 감소시킴으로써, 이들 변형을 사용하여 생체내에서 mRNA의 안정성 및 지속성을 효과적으로 증가시킬 수 있다; 예를 들어, 상기 문헌 Kormann 등을 참조한다.
또한, 선천적 항-바이러스 반응을 우회하도록 설계된 변형을 혼입하는 합성 메신저 RNA의 반복된 투여는 분화된 인간 세포를 전분화능(pluripotency)으로 재프로그래밍할 수 있는 것으로 나타났다. 예를 들어, 문헌[Warren, , Cell Stem Cell, 7(5):618-30 (2010)]을 참조한다. 1차 재프로그래밍 단백질로서 작용하는 이러한 변형된 mRNA는 다수의 인간 세포 유형을 재프로그래밍하는 효율적인 수단일 수 있다. 이러한 세포는 유도 만능 줄기세포(iPSC: induced pluripotency stem cell)로 지칭되고, 5-메틸-CTP, 슈도-UTP 및 안티 리버스 캡 유사체(ARCA)를 혼입하는 효소적으로 합성된 RNA는 세포의 항바이러스 반응을 효과적으로 피하는 데 사용될 수 있을 것으로 밝혀졌으며; 예를 들어, 상기 Warren 등을 참조한다.
당업계에 기재된 폴리뉴클레오타이드의 다른 변형은 예를 들어, polyA 테일의 사용, 5' 캡 유사체(예컨대 m7G(5')ppp(5')G(mCAP))의 첨가, 5' 또는 3' 비번역 영역(UTR)의 변형, 또는 5' 말단 포스페이트를 제거하기 위한 포스파타제의 처리를 포함하고 - 새로운 접근법이 정기적으로 개발되고 있다.
본원에 사용되기 위한 변형된 RNA의 생성에 적용 가능한 많은 조성물 및 기법은 저분자-간섭 RNA(siRNA)를 포함하여 RNA 간섭의 변형과 연계되어 개발되어 왔다. siRNA는, mRNA 간섭을 통해 유전자 침묵화에 미치는 이의 효과가 일반적으로 일시적이며 반복 투여를 필요로 할 수 있기 때문에 특정 과제를 제시한다. 게다가, siRNA는 이중 가닥 RNA(dsRNA)이며, 포유류 세포는 dsRNA를 검출하고 중화시키도록 진화된 면역 반응을 가지며, 이는 종종 바이러스 감염의 부산물이다. 그러므로, 포유류 효소, 예컨대 PKR(dsRNA-반응성 키나제), 및 dsRNA에 대한 세포성 반응을 매개할 수 있는 잠재적으로 레티노산-유도성 유전자 I(RIG-I), 뿐만 아니라 이러한 분자에 반응하여 사이토카인의 유도를 촉발할 수 있는 Toll-유사 수용체(예컨대 TLR3, TLR7 및 TLR8)이 존재하며; 예를 들어, 문헌[Angart , Pharmaceuticals (Basel) 6(4): 440-468 (2013); Kanasty , Molecular Therapy 20(3): 513-524 (2012); Burnett , Biotechnol J. 6(9):1130-46 (2011); Judge 및 MacLachlan, Hum Gene Ther 19(2):111-24 (2008)]에 의한 개관; 및 이들에서 인용된 참조문헌을 참조한다.
따라서, 본 명세서에 기술된 바와 같이, 매우 다양한 변형이 관련 기술 분야에서 개발되었고, 적용되어 RNA 안정성을 향상시키고/거나 선천적 면역 반응을 감소시키고/거나 폴리뉴클레오타이드를 인간 세포에 도입하는 것과 관련하여 유용할 수 있는 다른 이점을 달성하였으며; 예를 들어, 문헌[Whitehead KA 등, Annual Review of Chemical and Biomolecular Engineering, 2: 77-96 (2011)]; 문헌[Gaglione 및 Messere, Mini Rev Med Chem, 10(7):578-95 (2010)]; 문헌[Chernolovskaya 등, Curr Opin Mol Ther., 12(2):158-67 (2010)]; 문헌[Deleavey 등, Curr Protoc Nucleic Acid Chem Chapter 16:Unit 16.3 (2009)]; 문헌[Behlke, Oligonucleotides 18(4):305-19 (2008)]; 문헌[Fucini 등, Nucleic Acid Ther 22(3): 205-210 (2012)]; 문헌[Bremsen 등, Front Genet 3:154 (2012)]의 개관을 참조한다.
상기에 주목된 바와 같이, 변형된 RNA의 다수의 상업적인 공급원이 존재하며, 이들 중 다수는 siRNA의 효과를 개선시키도록 설계된 변형을 전문으로 하였다. 다양한 접근법이 문헌에 보고된 다양한 발견을 기초로 제공된다. 다양한 접근법이 문헌에 보고된 다양한 발견을 기초로 제공된다. 예를 들어, 다마콘은 비-브릿징 산소의 황(포스포로티오에이트, PS)으로의 대체를 광범위하게 사용하여 문헌[Kole, Nature Reviews Drug Discovery 11:125-140 (2012)]에 의해서 보고된 바와 같이, siRNA의 뉴클레아제 내성을 향상시켰다는 것을 주목한다. 리보스의 2'-위치의 변형은 듀플렉스 안정성(Tm)을 증가시키면서 뉴클레오타이드간 포스페이트 결합의 뉴클레아제 내성을 개선시킨다고 보고되어 있는데, 이것은 또한 면역 활성화로부터의 보호를 제공한다는 것을 나타내었다. 작은, 널리-용인되는 2'-치환(2'-O-메틸, 2'-플루오로, 2'-하이드로)을 갖는 중간 PS 골격 변형의 조합물은 문헌[Soutschek 등 Nature 432:173-178 (2004)]에 의해서 보고된 바와 같이, 생체내에 적용하기 위해서 매우 안정한 siRNA와 회합되어 있고; 2'-O-메틸 변형은 문헌[Volkov, Oligonucleotides 19:191-202 (2009)]에 보고된 바와 같이 안정성을 개선시키는 데 효과적인 것으로 보고되어 있다. 선천적 면역 반응의 유도를 감소시키는 것과 관련하여, 특정 서열을 2'-O-메틸, 2'-플루오로, 2'-하이드로로 변형시키는 것은 일반적으로 침묵 활성을 보존하면서, TLR7/TLR8 상호작용을 감소시키는 것으로 보고되어 있다; 예를 들어, 문헌[Judge 등, Mol. Ther. 13:494-505 (2006)]; 및 문헌[Cekaite 등, J. Mol. Biol. 365:90-108 (2007)]을 참조한다. 추가 변형, 예컨대 2-티오우라실, 슈도우라실, 5-메틸사이토신, 5-메틸우라실, 및 N6-메틸아데노신은 또한 TLR3, TLR7 및 TLR8에 의해서 매개된 면역 효과를 최소화하는 것으로 나타났다; 예를 들어, 문헌[Kariko, K. 등, Immunity 23:165-175 (2005)] 참조한다.
또한 관련 기술 분야에 공지된 바와 같이, 그리고 상업적으로 입수 가능한 바와 같이, 세포에 의한 이의 전달 및/또는 흡수를 향상시킬 수 있는 본 명세서에서 사용하기 위한, 폴리뉴클레오타이드, 예컨대 RNA에 예를 들어, 콜레스테롤, 토코페롤 및 엽산, 지질, 펩타이드, 중합체, 링커 및 압타머를 비롯한, 다수의 접합체를 적용할 수 있다; 예를 들어, 문헌[Winkler, Ther. Deliv. 4:791-809 (2013)]의 개관 및 여기에 인용된 참고 문헌을 참조한다.
전달
일부 구현예에서, 본원에 제공된 방법에 사용되는 임의의 핵산 분자, 예를 들어, 본 개시내용의 게놈-표적화 핵산 및/또는 부위-지향 폴리펩타이드를 인코딩하는 핵산은 세포에 전달하기 위해서 전달 비히클의 표면 내에 또는 표면 상에 패키징된다. 고려되는 전달 비히클은 나노구체, 리포솜, 양자점, 나노입자, 포릴에틸렌 글리콜 입자, 하이드로겔 및 마이셀을 포함하지만, 이들로 제한되지 않는다. 당업계에 기재된 바와 같이, 다양한 표적화 모이어티를 사용하여 이러한 비히클과 목적하는 세포 유형 또는 위치의 우선적인 상호작용을 향상시킬 수 있다.
본 개시내용의 복합체, 폴리펩타이드 및 핵산을 세포에 도입하는 것은 바이러스 또는 박테리오파지 감염, 형질주입, 접합, 프로토플라스트 융합, 리포펙션, 전기천공, 핵주입(nucleofection), 인산칼슘 침전, 폴리에틸렌이민(PEI)-매개 형질주입, DEAE-덱스트란 매개 형질주입, 리포솜-매개 형질주입, 입자 총 기술, 인산칼슘 침전, 직접 미세-주사, 나노입자-매개 핵산 전달 및 유사한 기법에 의해서 생성될 수 있다.
일부 구현예에서, 가이드 RNA 폴리뉴클레오타이드(RNA 또는 DNA) 및/또는 엔도뉴클레아제 폴리뉴클레오타이드(들)(RNA 또는 DNA)는 관련 기술 분야에 공지된 바이러스 또는 비-바이러스 전달 비히클에 의해서 전달될 수 있다. 대안적으로, 엔도뉴클레아제 폴리펩타이드(들)는 관련 기술 분야에 알려진 바이러스 또는 비-바이러스 전달 비히클, 예컨대 전기천공 또는 지질 나노입자에 의해서 전달될 수 있다. 일부 구현예에서, DNA 엔도뉴클레아제는 tracrRNA와 함께 하나 이상의 가이드 RNA 또는 하나 이상의 crRNA와 예비-복합체화되거나 또는 단독으로 하나 이상의 폴리펩타이드로서 전달될 수 있다.
일부 구현예에서, 폴리뉴클레오타이드는 나노입자, 리포솜, 리보핵단백질, 양으로 하전된 펩타이드, 소분자 RNA-접합체, 압타머-RNA 키메라, 및 RNA-융합 단백질 복합체를 포함하지만 이들로 제한되지 않는 비-바이러스 전달 비히클에 의해서 전달될 수 있다. 일부 예시적인 비-바이러스 전달 비히클은 문헌[Peer 및 Lieberman, Gene Therapy, 18: 1127-1133 (2011)](이것은 다른 폴리뉴클레오타이드의 전달에 또한 유용한 siRNA를 위한 비-바이러스 전달 비히클에 초점을 맞추고 있음)에 기술되어 있다.
일부 구현예에서, 폴리뉴클레오타이드, 예컨대 엔도뉴클레아제를 인코딩하는 가이드 RNA, sgRNA 및 mRNA는 지질 나노입자(LNP)에 의해서 세포 또는 환자에게 전달될 수 있다.
핵산에 대한 몇몇 비-바이러스 전달 방법이 동물 모델과 인간 둘 다에서 시험되긴 하였지만, 가장 잘 개발된 시스템은 지질 나노입자이다. 지질 나노입자(LNP)는 일반적으로, 이온화 가능한 양이온성 지질 및 3개 이상의 추가 구성요소, 일반적으로 콜레스테롤, DOPE 및 폴리에틸렌 글리콜(PEG) 함유 지질로 이루어지며, 예를 들어, 실시예 2를 참조한다. 양이온성 지질은 양으로 하전된 핵산에 결합하여 치밀한 복합체를 형성할 수 있으며, 이 복합체는 핵산을 분해로부터 보호한다. 미세 유체 시스템을 통한 통과 동안 구성요소들은 자가-조립하여 50 내지 150 nM의 크기 범위의 입자를 형성하며, 상기 입자에서 핵산은 양이온성 지질과 복합체화되고 지질 이중층 유사 구조에 의해 둘러싸인 코어에 캡슐화된다. 대상체의 순환 내로의 주사 후, 이들 입자는 아포지질단백질 E(apoE)에 결합할 수 있다. ApoE는 LDL 수용체에 대한 리간드이고, 수용체 매개 세포내이입을 통해 간의 간세포 내로의 흡수를 매개한다. 이러한 유형의 LNP는 mRNA 및 siRNA를 설치류, 영장류 및 인간의 간의 간세포에 효율적으로 전달하는 것으로 나타났다. 세포내이입 후, LNP는 엔도솜에 존재한다. 캡슐화된 핵산은 양이온성 지질의 이온화 가능한 성질에 의해 매개되는 엔도솜 탈출 과정을 겪는다. 이는 핵산을, mRNA가 인코딩된 단백질로 번역될 수 있는 세포질 내로 전달한다. 그러므로, 일부 구현예에서, LNP 내로의 gRNA 및 Cas9를 인코딩하는 mRNA의 캡슐화는 IV 주사 후 상기 구성요소 둘 다를 간세포로 효율적으로 전달하는 데 사용된다. 엔도솜 탈출 후, Cas9 mRNA는 Cas9 단백질로 번역되고, gRNA와 복합체를 형성할 수 있다. 일부 구현예에서, Cas9 단백질 서열 내로의 핵 국재화 신호의 포함은 핵으로의 Cas9 단백질/gRNA 복합체의 전좌를 촉진한다. 대안적으로, 저분자 gRNA는 핵 공극 복합체를 가로지르고, 핵 내에서 Cas9 단백질과 복합체를 형성한다. 일단 핵 내에서 gRNA/Cas9 복합체는 상동성 표적 부위에 대한 게놈을 스캔하고, 게놈 내 요망되는 표적 부위에서 이중 가닥 절단부를 우선적으로 생성시킨다. 생체내에서 RNA 분자의 반감기는 수시간 내지 수일 정도로 짧다. 유사하게는, 단백질의 반감기는 수시간 내지 수일 정도로 짧은 경향이 있다. 그러므로, 일부 구현예에서, LNP를 사용한 gRNA 및 Cas9 mRNA의 전달은 gRNA/Cas9 복합체의 단지 일시적인 발현 및 활성을 초래할 수 있다. 이는 표적외 절단의 빈도를 감소시키는 이점을 제공하므로, 일부 구현예에서는 유전독성(genotoxicity)의 위험을 최소화시킬 수 있다. LNP는 일반적으로, 바이러스 입자보다 덜 면역원성이다. 많은 인간이 AAV에 대해 기존의 면역력을 갖고 있긴 하지만, LNP에 대해서는 기존의 면역력이 존재하지 않는다. LNP에 대한 추가의 적응 면역 반응은 발생할 가능성이 거의 없으며, 이는 LNP의 반복 투약을 가능하게 한다.
몇몇 상이한 이온화 가능한 양이온성 지질은 LNP에 사용되기 위해 개발되어 왔다. 이들은 다른 것들 중에서도 C12-200(문헌[Love 등 (2010), Proc Natl Acad Sci USA vol. 107, 1864-1869]), MC3, LN16, MD1을 포함한다. 하나의 유형의 LNP에서, GalNac 모이어티는 LNP의 외부에 부착되고 아시알릴로당단백질(asialyloglycoprotein) 수용체를 통해 간 내로의 흡수를 위한 리간드로서 작용한다. 임의의 이들 양이온성 지질은 간으로의 gRNA 및 Cas9 mRNA의 전달을 위한 LNP를 제형화하는 데 사용된다.
일부 구현예에서, LNP는 1000 nm, 500 nm, 250 nm, 200 nm, 150 nm, 100 nm, 75 nm, 50 nm 또는 25 nm 미만의 직경을 갖는 임의의 입자를 지칭한다. 대안적으로, 나노입자는 1 내지 1000 nm, 1 내지 500 nm, 1 내지 250 nm, 25 내지 200 nm, 25 내지 100 nm, 35 내지 75 nm 또는 25 내지 60 nm 크기 범위일 수 있다.
LNP는 양이온, 음이온성 또는 중성 지질로부터 제조될 수 있다. 중성 지질, 예컨대 융합생성 인지질 DOPE 또는 막 성분 콜레스테롤을 '헬퍼 지질'로서 LNP에 포함시켜 형질주입 활성 및 나노입자 안정성을 향상시킬 수 있다. 양이온성 지질의 한계는 불량한 안정성 및 신속한 클리어런스, 뿐만 아니라 염증 또는 항-염증 반응의 생성으로 인한 낮은 효능을 포함한다. LNP는 또한 소수성 지질, 친수성 지질 또는 소수성 지질 및 친수성 지질 둘 다 가질 수 있다.
관련 기술 분야에 공지된 임의의 지질 또는 지질의 조합물을 사용하여 LNP를 제조할 수 있다. LNP를 제조하는 데 사용되는 지질의 예는 DOTMA, DOSPA, DOTAP, DMRIE, DC-콜레스테롤, DOTAP-콜레스테롤, GAP-DMORIE-DPyPE 및 GL67A-DOPE-DMPE-폴리에틸렌 글리콜(PEG)이다. 양이온성 지질의 예는 98N12-5, C12-200, DLin-KC2-DMA(KC2), DLin-MC3-DMA(MC3), XTC, MD1 및 7C1이다. 중성 지질의 예는 DPSC, DPPC, POPC, DOPE 및 SM이다. PEG-변형된 지질의 예는 PEG-DMG, PEG-CerC14 및 PEG-CerC20이다.
일부 구현예에서, 지질을 임의의 수치의 몰비로 조합하여 LNP를 제조할 수 있다. 또한, 폴리뉴클레오타이드(들)를 다양한 범위의 몰비로 지질(들)과 조합하여 LNP를 제조할 수 있다.
일부 구현예에서, 부위-지향 폴리펩타이드 및 게놈-표적화 핵산은 각각 세포 또는 환자에게 별개로 투여될 수 있다. 다른 한편, 부위-지향 폴리펩타이드를 tracrRNA와 함께 하나 이상의 가이드 RNA 또는 하나 이상의 crRNA와 예비-복합체화할 수 있다. 이어서, 예비-복합체화된 물질을 세포 또는 환자에게 투여할 수 있다. 이러한 예비-복합체화된 물질은 리보핵단백질 입자(RNP)로 알려져 있다.
RNA는 RNA 또는 DNA와 특이적 상호작용을 형성할 수 있다. 이의 특성은 많은 생물학적 과정에서 활용되지만, 그것은 또한 핵산-풍부 세포 환경에서 무차별적인 상호작용의 위험이 따른다. 이러한 문제에 대한 하나의 해결책은 리보핵단백질 입자(RNP)의 형성인데, 여기서 RNA는 엔도뉴클레아제와 예비-복합체화된다. RNP의 또 다른 이익은 분해로부터의 RNA의 보호이다.
일부 구현예에서, RNP에서 엔도뉴클레아제는 변형되거나 또는 비변형될 수 있다. 마찬가지로, gRNA, crRNA, tracrRNA 또는 sgRNA는 변형되거나 또는 비변형될 수 있다. 다수의 변형이 관련 기술 분야에 공지되어 있고, 사용될 수 있다.
엔도뉴클레아제 및 sgRNA는 일반적으로 1:1 몰비로 조합될 수 있다. 대안적으로, 엔도뉴클레아제, crRNA 및 tracrRNA는 일반적으로 1:1:1 몰비로 조합될 수 있다. 그러나 매우 다양한 몰비를 사용하여 RNP를 제조할 수 있다.
일부 구현예에서, 재조합 아데노-연관 바이러스(AAV) 벡터가 전달을 위해서 사용될 수 있다. rAAV 입자를 제조하기 위한 기술(여기서, 전달될 폴리뉴클레오타이드, rep 및 cap 유전자, 및 헬퍼 바이러스 기능을 포함하는 패키징될 AAV 게놈이 세포에 제공됨)은 관련 기술 분야에서 표준이다. rAAV의 생산은 하기의 구성 요소가 단일 세포(본 명세서에서는 포장 세포라고 지칭됨) 내에 존재할 것을 필요로 한다: rAAV 게놈, 상기 rAAV 게놈으로부터 분리된 (, 상기 내에 존재하지 않는) AAV rep 및 cap 유전자, 및 헬퍼 바이러스 작용. AAV rep 및 cap 유전자는 재조합 바이러스가 유래될 수 있는 임의의 AAV 항원형으로부터 기원할 수 있고, AAV 항원형 AAV-1, AAV-2, AAV-3, AAV-4, AAV-5, AAV-6, AAV-7, AAV-8, AAV-9, AAV-10, AAV-11, AAV-12, AAV-13 및 AAV rh.74를 포함하지만 이들로 제한되지 않는, rAAV 게놈 ITR과 상이한 AAV 항원형으로부터 기원할 수 있다. 위형 rAAV의 생성은 예를 들어, 국제특허출원공개 WO 01/83692호에 개시되어 있다. 표 1을 참조한다.
Figure pct00002
일부 구현예에서, 패키징 세포를 생성하는 방법은 AAV 입자 생산을 위한 필요한 성분 모두를 안정하게 발현하는 세포주를 생성하는 것을 포함한다. 예를 들어, AAV rep 및 cap 유전자가 결여된 rAAV 게놈, rAAV 게놈으로부터 분리된 AAV rep 및 cap 유전자, 및 선택 가능한 마커, 예컨대 네오마이신 내성 유전자를 갖는 플라스미드(또는 다수의 플라스미드)가 세포의 게놈 내에 통합된다. AAV 게놈을 GC 테일링(문헌[Samulski 등, 1982, Proc. Natl. Acad. S6. USA, 79:2077-2081]), 제한 엔도뉴클레아제 절단 부위를 함유하는 합성 링커의 첨가(문헌[Laughlin 등, 1983, Gene, 23:65-73]) 또는 직접 평활 말단 리게이션(문헌[Senapathy & Carter, 1984, J. Biol. Chem., 259:4661-4666])과 같은 절차에 의해서 박테리아 플라스미드에 도입하였다. 이어서, 패키징 세포주를 헬퍼 바이러스, 예컨대 아데노바이러스로 감염시킨다. 이 방법의 장점은 세포가 선택 가능하고 rAAV의 대규모 생산에 적합하다는 것이다. 적합한 방법의 다른 예는 플라스미드가 아니라 아데노바이러스 또는 바큘로바이러스를 사용하여 패키징 세포에 rAAV 게놈 및/또는 rep 및 cap 유전자를 도입한다.
rAAV 생산의 일반 원칙은 예를 들어 문헌[Carter, 1992, Current Opinions in Biotechnology, 1533-539; 및 Muzyczka, 1992, Curr. Topics in Microbial. and Immunol., 158:97-129)]에서 검토된다. 다양한 접근법이 문헌[Ratschin 등, Mol. Cell. Biol. 4:2072 (1984)]; 문헌[Hermonat 등, Proc. Natl. Acad. Sci. USA, 81:6466 (1984)]; 문헌[Tratschin 등, Mo1. Cell. Biol. 5:3251 (1985)]; 문헌[McLaughlin 등, J. Virol., 62:1963 (1988)]; 및 문헌[Lebkowski 등, 1988 Mol. Cell. Biol., 7:349 (1988)], 문헌[Samulski 등 (1989, J. Virol., 63:3822-3828)]; 미국 특허 제5,173,414호; 국제 특허 제WO 95/13365호 및 상응하는 미국 특허 제5,658.776호; 국제 특허 제WO 95/13392호; 국제 특허 제WO 96/17947제; 국제 특허 제PCT/US98/18600호; 국제 특허 제WO 97/09441호(PCT/US96/14423); 국제 특허 제WO 97/08298호(PCT/US96/13872); 국제 특허 제WO 97/21825호(PCT/US96/20777); 국제 특허 제WO 97/06243호(PCT/FR96/01064); 국제 특허 제WO 99/11764호; 문헌[Perrin 등 (1995) Vaccine 13:1244-1250]; 문헌[Paul 등 (1993) Human Gene Therapy 4:609-615]; 문헌[Clark 등 (1996) Gene Therapy 3:1124-1132]; 미국 특허 제5,786,211호; 미국 특허 제5,871,982호; 및 미국 특허 제6,258,595호에 기재되어 있다.
AAV 벡터 항원형은 표적 세포 유형에 매칭될 수 있다. 예를 들어, 하기 예시적인 세포 유형은 특히 제시된 AAV 항원형에 의해서 형질도입될 수 있다. 예를 들어, 간 조직/세포 유형에 적합한 AAV 벡터의 혈청형은 AAV3, AAV5, AAV8 및 AAV9를 포함하지만 이들로 제한되지 않는다.
아데노-관련 바이러스 벡터 외에도, 다른 바이러스 벡터가 사용될 수 있다. 이러한 바이러스 벡터는 렌티바이러스, 알파바이러스, 엔테로바이러스, 페스티바이러스, 바큘로바이러스, 헤르페스바이러스, 엡스타인 바 바이러스, 파포바바이러스, 폭스바이러스, 백시나 바이러스, 및 단순 포진 바이러스를 포함하지만 이들로 제한되지 않는다.
일부 구현예에서, Cas9 mRNA, 알부민 유전자 내 1 또는 2개의 좌위를 표적화하는 sgRNA, 및 공여체 DNA는 지질 나노입자 내로 별도로 제형화되거나, 모두 1개의 지질 나노입자 내로 공동-제형화되거나 2개 이상의 지질 나노입자 내로 공동-제형화된다.
일부 구현예에서, Cas9 mRNA를 지질 나노입자 중에서 제형화하고, 반면에 sgRNA 및 공여체 DNA를 AAV 벡터로 전달한다. 일부 구현예에서, Cas9 mRNA 및 sgRNA는 지질 나노입자에서 공동-제형화되는 한편, 공여체 DNA는 AAV 벡터에서 전달된다.
Cas9 뉴클레아제를 DNA 플라스미드로서, mRNA로서 또는 단백질로서 전달하기 위해 옵션이 이용 가능하다. 가이드 RNA는 동일한 DNA로부터 발현될 수 있거나, 또한 RNA로서 전달될 수 있다. RNA는 이의 반감기를 변경 또는 향상시키거나, 면역 반응의 가능성 또는 정도(degree)를 저하시키기 위해 화학적으로 변형될 수 있다. 엔도뉴클레아제 단백질은 전달 전에 gRNA와 복합체화될 수 있다. 바이러스 벡터는 효율적인 전달을 가능하게 하며; Cas9의 분할 버전 및 Cas9의 더 작은 오르토로그(ortholog)는 HDR에 대한 공여체일 수 있는 바와 같이 AAV에서 패키징될 수 있다. 이들 구성요소를 각각 전달할 수 있는 광범위한 비-바이러스 전달 방법이 또한 존재하거나, 비-바이러스 방법 및 바이러스 방법이 협력하여 이용될 수 있다. 예를 들어, 나노입자는 단백질 및 가이드 RNA를 전달하는 데 사용될 수 있는 한편, AAV는 공여체 DNA를 전달하는 데 사용될 수 있다.
치료적 치료를 위한 게놈-편집 구성요소를 전달하는 것에 관한 일부 구현예에서, 적어도 2개의 구성요소는 형질전환될 세포, 예를 들어, 간세포의 핵 내로 전달된다; 서열 특이적 뉴클레아제 및 DNA 공여체 주형. 일부 구현예에서, 공여체 DNA 주형은 간에 대한 친화성(tropism)을 갖는 AAV 내로 패키징된다. 일부 구현예에서, AAV는 혈청형 AAV8, AAV9, AAVrh10, AAV5, AAV6 또는 AAV-DJ로부터 선택된다. 일부 구현예에서, AAV 패키징된 DNA 공여체 주형은 대상체, 예를 들어, 환자에게 우선 말초 IV 주사에 의해 투여되고, 뒤이어 서열 특이적 뉴클레아제가 투여된다. AAV 패키징된 공여체 DNA 주형을 우선 전달하는 이점은, 전달된 공여체 DNA 주형이 형질도입된 간세포의 핵에서 안정하게 유지될 것이며, 이는 HDR 또는 NHEJ에 의해 DNA 공여체의 후속적인 통합으로 게놈에 이중 가닥 절단부를 생성시킬 서열 특이적 뉴클레아제의 후속 투여를 가능하게 한다는 것이다. 일부 구현예에서, 서열 특이적 뉴클레아제는, 요망되는 치료 효과에 충분한 수준에서 이식유전자의 표적화된 통합을 촉진하는 데 필요한 시간 동안만 표적 세포에서 활성으로 남아 있는 것이 바람직하다. 서열 특이적 뉴클레아제가 연장된 기간 동안 세포에서 활성으로 남아 있다면, 이는 표적외 부위에서 이중 가닥 절단부의 증가된 빈도를 초래할 것이다. 구체적으로, 표적외 절단의 빈도는, 뉴클레아제가 활성인 시간으로 곱한 표적외 절단 효율의 함수이다. mRNA 형태의 서열 특이적 뉴클레아제의 전달은, mRNA 및 번역된 단백질이 세포에서 수명이 짧기 때문에 수시간 내지 수일의 범위의 짧은 뉴클레아제 활성 기간을 초래한다. 그러므로, 이미 공여체 주형을 함유하는 세포 내로의 서열 특이적 뉴클레아제의 전달은, 표적외 통합에 비해 표적화된 통합의 최고 가능한 비를 초래하는 것으로 예상된다. 게다가, 말초 IV 주사 후 간세포의 핵으로의 공여체 DNA 주형의 AAV 매개 전달은, 바이러스가 세포를 감염시키며 엔도솜을 탈출한 다음 핵으로 수송되기 위한 요건 및 숙주 구성요소에 의한 단일 가닥 AAV 게놈으로부터 이중 가닥 DNA 분자로의 전환으로 인해 대략 1일 내지 14일의 시간이 소요된다. 그러므로, 일부 구현예에서, 핵으로의 공여체 DNA 주형의 전달 과정은 CRISPR-Cas9 구성요소를 공급하기 전에 이들 뉴클레아제 구성요소가 단지 약 1일 내지 3일 동안 활성일 것이기 때문에 완료되게 된다.
일부 구현예에서, 서열 특이적 뉴클레아제는, Cas9 뉴클레아제와 함께 알부민 유전자의 인트론 1 내에서 DNA 서열에 관한 sgRNA로 이루어진 CRISPR-Cas9이다. 일부 구현예에서, Cas9 뉴클레아제는 하나 이상의 핵 국재화 신호(NLS)에 작동적으로 융합된 Cas9 단백질을 인코딩하는 mRNA로서 전달된다. 일부 구현예에서, sgRNA 및 Cas9 mRNA는 지질 나노입자 내로의 패키징에 의해 간세포에 전달된다. 일부 구현예에서, 지질 나노입자는 지질 C12-200을 함유한다(문헌[Love 등 2010, Proc Natl Acad Sci USA vol 107 1864-1869]). 일부 구현예에서, LNP에서 패키징되는 Cas9 mRNA에 대한 sgRNA의 비는 1:1(질량비)이어서, 마우스에서 생체내에서 최대 DNA 절단을 초래한다. 대안적인 구현예에서, LNP에 패키징되는 Cas9 mRNA에 대한 sgRNA의 상이한 질량비, 예를 들어, 10:1, 9:1, 8:1, 7:1, 6:1, 5:1, 4:1, 3:1 또는 2:1 또는 반대의 비가 사용될 수 있다. 일부 구현예에서, Cas9 mRNA 및 sgRNA는 별도의 LNP 제형 내로 패키징되고, Cas9 mRNA 함유 LNP는 환자에게 약 1시간 내지 약 8시간 동안 전달된 후, sgRNA를 함유하는 LNP는 sgRNA의 전달 전에 Cas9 mRNA가 번역되는 최적의 시간을 허용한다.
일부 구현예에서, gRNA 및 Cas9 mRNA를 캡슐화하는 LNP 제형("LNP-뉴클레아제 제형")은, AAV 내로 패키징된 DNA 공여체 주형이 이미 투여된 대상체, 예를 들어, 환자에게 투여된다. 일부 구현예에서, LNP-뉴클레아제 제형은, AAV-공여체 DNA 주형의 투여 후 1일 내지 28일째 내에 또는 7일 내지 28일째 내에 또는 7일 내지 14일째 내에 대상체에게 투여된다. AAV-공여체 DNA 주형에 비해 LNP-뉴클레아제 제형의 전달을 위한 최적의 시기는 당업자에게 알려진 기법, 예를 들어, 마우스 및 원숭이를 포함한 동물 모델에서 수행된 연구를 사용하여 결정될 수 있다.
일부 구현예에서, DNA-공여체 주형은 비-바이러스 전달 방법을 사용하여 대상체, 예를 들어, 환자의 간세포에 전달된다. 일부 환자(일반적으로 30%)는 가장 보편적으로 사용되는 AAV 혈청형에 관한 기존의 중화 항체를 갖고 있어서 상기 AAV에 의한 효과적인 유전자 전달을 방지하는 한편, 모든 환자는 비-바이러스 전달 방법으로 치료 가능할 것이다. 몇몇 비-바이러스 전달 방법이 당업계에 알려져 왔다. 특히 지질 나노입자(LNP)는 동물 및 인간에서 정맥내 주사 후 이의 캡슐화된 카고(cargo)를 간세포의 세포질로 효율적으로 전달하는 것으로 알려져 있다. 이들 LNP는 수용체 매개 세포내이입 과정을 통해 간에 의해 활성적으로 흡수되어, 간 내로의 우선적인 흡수를 초래한다.
일부 구현예에서, 공여체 주형의 핵 국재화를 촉진하기 위해, 플라스미드의 핵 국재화를 촉진할 수 있는 DNA 서열, 예를 들어, 초기 프로모터 및 시미안 바이러스 40(SV40: simian virus 40) 복제 기원의 366 bp 영역이 공여체 주형에 첨가될 수 있다. 세포성 단백질에 결합하는 다른 DNA 서열 또한, DNA의 핵 진입을 향상시키기 위해 사용될 수 있다.
일부 구현예에서, 도입된 GOI의 발현 또는 활성 수준은 AAV-공여체 DNA 주형 후, 예를 들어, gRNA 및 Cas9 뉴클레아제 또는 상기 Cas9 뉴클레아제를 인코딩하는 mRNA를 함유하는 LNP-뉴클레아제 제형의 제1 투여 이후에 대상체, 예를 들어, 환자의 혈액에서 측정된다. GOI 수준이 예를 들어, 정상 수준의 적어도 5% 내지 50%, 특히 5% 내지 20%의 GOI 수준으로서 정의되는 바와 같이 질환을 치유하기에 충분하지 않다면, LNP-뉴클레아제 제형의 제2 또는 제3 투여가 주어져서 알부민 인트론 1 부위 내로의 추가 표적화된 통합을 촉진할 수 있다. 요망되는 치료적 수준의 GOI를 수득하기 위해 다수의 용량의 LNP-뉴클레아제 제형을 사용하는 실현 가능성은, 당업계에 알려진 기법, 예를 들어, 마우스 및 원숭이를 포함한 동물 모델을 사용하는 시험을 사용하여 시험되고 최적화될 수 있다.
일부 구현예에서, i) 공여체 카세트를 포함하는 AAV-공여체 DNA 주형 및 ii) LNP-뉴클레아제 제형을 대상체에게 투여하는 단계를 포함하는 본원에 기재된 임의의 방법에 따르면, 초기 용량의 LNP-뉴클레아제 제형은, AAV-공여체 DNA 주형을 대상체에게 투여한 후 1일 내지 28일째 내에 상기 대상체에게 투여된다. 일부 구현예에서, 초기 용량의 LNP-뉴클레아제 제형은, 표적 세포의 핵으로의 공여체 DNA 주형의 전달을 가능하게 하기에 충분한 시간 후에 대상체에게 투여된다. 일부 구현예에서, 초기 용량의 LNP-뉴클레아제 제형은, 표적 세포의 핵에서 단일 가닥 AAV 게놈으로부터 이중 가닥 DNA 분자로의 전환을 가능하게 하기에 충분한 시간 후에 대상체에게 투여된다. 일부 구현예에서, 하나 이상의(예컨대 2, 3, 4, 5개 이상의) 추가 용량의 LNP-뉴클레아제 제형은 초기 용량의 투여 후 대상체에게 투여된다. 일부 구현예에서, 하나 이상의 용량의 LNP-뉴클레아제 제형은, 공여체 카세트의 표적화된 통합의 표적 수준 및/또는 공여체 카세트의 발현의 표적 수준이 달성될 때까지 대상체에게 투여된다. 일부 구현예에서, 상기 방법은 LNP-뉴클레아제 제형의 각각의 투여 후 공여체 카세트의 표적화된 통합의 수준 및/또는 공여체 카세트의 발현 수준을 측정하는 단계, 및 공여체 카세트의 표적화된 통합의 표적 수준 및/또는 공여체 카세트의 발현의 표적 수준이 달성되지 않는다면 추가 용량의 LNP-뉴클레아제 제형을 투여하는 단계를 추가로 포함한다. 일부 구현예에서, LNP-뉴클레아제 제형의 하나 이상의 추가 용량 중 적어도 하나의 양은 초기 용량과 동일하다. 일부 구현예에서, LNP-뉴클레아제 제형의 하나 이상의 추가 용량 중 적어도 하나의 양은 초기 용량보다 더 적다. 일부 구현예에서, LNP-뉴클레아제 제형의 하나 이상의 추가 용량 중 적어도 하나의 양은 초기 용량보다 더 많다.
유전적으로 변형된 세포 및 세포 집단
일 양태에서, 본원의 개시내용은 세포에서 게놈을 편집하여, 유전적으로 변형된 세포를 생성시키는 방법을 제공한다. 일부 양태에서, 유전적으로 변형된 세포의 집단이 제공된다. 따라서, 유전적으로 변형된 세포는 게놈 편집에 의해(예를 들어, CRISPR/Cas9/Cpf1 시스템을 사용하여) 도입된 적어도 하나의 유전자 변형을 갖는 세포를 지칭한다. 일부 구현예에서, 유전적으로 변형된 세포는 유전적으로 변형된 간세포의 세포이다. 외인성 게놈-표적화 핵산 및/또는 게놈-표적화 핵산을 인코딩하는 외인성 핵산을 갖는 유전자 변형된 세포가 본 명세서에서 고려된다. 용어 "유전적으로 변형된 세포"는 특정 대상체 세포뿐만 아니라 이러한 세포의 자손 또는 잠재적 자손을 지칭한다. 소정의 변형은 돌연변이 또는 환경적 영향으로 인해 후세대(succeeding generation)에서 발생할 수 있기 때문에, 이러한 자손은 사실상 모세포(parent cell)와 동일할 수 없으나, 본원에 사용된 바와 같은 용어의 범위 내에 여전히 포함된다.
일부 구현예에서, 세포의 게놈은 관심 유전자 또는 이의 기능적 유도체의 핵산 서열을 세포의 게놈 서열 내로 삽입함으로써 편집될 수 있다. 일부 구현예에서, 게놈-편집을 받는 세포는 게놈에 하나 이상의 돌연변이(들)를 가지며, 이는 이러한 돌연변이(들)를 갖지 않는 정상에서의 발현과 비교하여 내인성 GOI의 발현의 감소를 초래한다. 정상 세포는 GOI와 관련된 결함을 갖지 않는 상이한 대상체로부터 기원된(또는 단리된) 건강한 또는 대조군 세포일 수 있다. 일부 구현예에서, 게놈-편집을 받는 세포는 GOI-관련 병태 또는 장애의 치료를 필요로 하는 대상체로부터 기원(또는 단리)될 수 있다. 따라서, 일부 구현예에서, 이러한 세포에서 내인성 GOI의 발현은 정상 세포에서 내인성 관심 유전자 발현의 발현과 비교하여 약 10%, 약 20%, 약 30%, 약 40%, 약 50%, 약 60%, 약 70%, 약 80%, 약 90% 또는 약 100% 감소된다.
이식유전자, 예를 들어, GOI 또는 이의 기능적 단편을 인코딩하는 핵산의 성공적인 삽입 시, 세포에서의 도입된 GOI 또는 이의 기능적 유도체의 발현은 상기 세포의 내인성 GOI의 발현과 비교하여, 적어도 약 10%, 약 20%, 약 30%, 약 40%, 약 50%, 약 60%, 약 70%, 약 80%, 약 90%, 약 100%, 약 200%, 약 300%, 약 400%, 약 500%, 약 600%, 약 700%, 약 800%, 약 900%, 약 1,000%, 약 2,000%, 약 3,000%, 약 5,000%, 약 10,000% 이상일 수 있다. 일부 구현예에서, 게놈-편집 세포에서 GOI의 기능적 단편을 포함하는 도입된 GOI 생성물의 활성은 세포의 내인성 GOI의 발현과 비교하여, 적어도 약 10%, 약 20%, 약 30%, 약 40%, 약 50%, 약 60%, 약 70%, 약 80%, 약 90%, 약 100%, 약 200%, 약 300%, 약 400%, 약 500%, 약 600%, 약 700%, 약 800%, 약 900%, 약 1,000%, 약 2,000%, 약 3,000%, 약 5,000%, 약 10,000% 이상일 수 있다. 일부 구현예에서, 세포에서의 도입된 GOI 또는 이의 기능적 유도체의 발현은 세포의 내인성 GOI의 발현의 적어도 약 2배, 약 3배, 약 4배, 약 5배, 약 6배, 약 7배, 약 8배, 약 9배, 약 10배, 약 15배, 약 20배, 약 30배, 약 50배, 약 100배, 약 1000배 이상이다. 또한 일부 구현예에서, 게놈-편집 세포에서 GOI의 기능적 단편을 포함하여 도입된 GOI 생성물의 활성은 정상적인 건강한 세포에서의 GOI 생성물의 활성과 필적하거나 그보다 클 수 있다.
예를 들어, A형 혈우병과 같은 장애 또는 건강상 병태를 치료하거나 개선하는 것에 관한 일부 구현예에서, 유전자 편집을 위한 주된 표적은 인간 세포이다. 예를 들어, 생체외 방법 및 생체내 방법에서, 인간 세포는 간세포이다. 일부 구현예에서, 이를 필요로 하는 환자로부터 유래되어 그 환자와 이미 완전히 매칭된 자기 세포에서 유전자 편집을 수행함으로써, 환자 내에 안전하게 재도입되어, 환자의 질환과 연관된 하나 이상의 임상적 병태를 개선시키는 데 효과적일 세포의 집단을 효과적으로 생기게 할 수 있는 세포를 생성하는 것이 가능하다. 이러한 치료에 대한 일부 구현예에서, 간세포의 세포는 당업계에 알려진 임의의 방법에 따라 단리되고, 유전적으로 변형된, 치료적으로 효과적인 세포를 생성시키는 데 사용될 수 있다. 일부 구현예에서, 간 줄기세포는 생체외에서 유전적으로 변형된 다음, 이들 간 줄기세포가, 삽입된 GOI(예를 들어, 삽입된 FVIII 유전자)를 발현하는 유전적으로 변형된 간세포 또는 동양혈관 내피 세포를 야기할 환자에게 재도입된다.
본 개시내용은 추가로, 유전적으로 변형된 세포의 자손을 제공하며, 상기 자손은 이것이 유래된 유전적으로 변형된 세포와 동일한 외인성 핵산 또는 폴리펩타이드를 포함할 수 있다.
치료적 접근법
일 양태에서, 환자의 게놈을 편집함으로써 상기 환자에서 장애 또는 건강상 병태를 치료하기 위한 유전자 치료 접근법이 본원에 제공된다. 일부 구현예에서, 유전자 치료 접근법은 기능적 GOI, 예를 들어, FVIII, FIX, 및 SERPING1을 환자의 관련 세포 유형의 게놈 내로 통합시키고, 이는 GOI-관련 장애 또는 건강상 병태, 예를 들어, A형 혈우병에 대한 영구적인 치유를 제공할 수 있다. A형 혈우병의 치료를 위해 FVIII 유전자의 사용이 관여하는 구현예에서, FVIII 유전자를 통합시키는 유전자 치료 접근법을 받는 세포 유형은 간세포인데, 이들 세포가 많은 단백질을 효율적으로 발현시키고 혈액 내로 분비시키기 때문이다. 게다가, 간세포를 사용하는 이러한 통합 접근법은, 간이 완전히 성장되지 않은 소아 환자에 대해 고려될 수 있는데, 간세포가 분열함에 따라, 통합된 유전자가 딸세포로 전파될 것이기 때문이다.
또 다른 양태에서, GOI 또는 이의 기능적 유도체를 유전자 좌위 내로 게놈 내로 넉킹하고 GOI 생성물의 활성을 회복시킴으로써 게놈에 영구적인 변화를 생성시키기 위해 게놈 조작 툴을 사용하기 위한 세포적, 생체외생체내 방법이 본원에 제공된다. 이러한 방법은, 게놈으로부터 임의의 서열을 영구적으로 결실시키거나, 삽입하거나, 편집하거나, 교정하거나, 대체하거나 게놈 좌위에서 외인성 서열, 예를 들어, GOI를 삽입하기 위해 엔도뉴클레아제, 예컨대 CRISPR-관련(CRISPR/Cas9, Cpf1 및 유사한 엔도뉴클레아제) 뉴클레아제를 사용한다. 이러한 방식으로, 본 개시내용에 제시된 예는 (환자의 수명에 대해 잠재적인 치료법을 전달하기 보다는) 단일 치료로 GOI의 활성을 회복시킨다.
일부 구현예에서, 표적 단백질과 관련된 장애 또는 건강상 병태의 치료에 사용하기 위한, 예컨대 장애 또는 건강상 병태의 치료용 약제의 제조에 사용하기 위한 본원에 기재된 임의의 구현예에 따른 게놈 편집 시스템의 하나 이상의 구성요소가 본원에 제공된다.
일부 구현예에서, 생체외 세포-기초 치료법은, 환자로부터 단리된 간세포를 사용하여 수행된다. 다음으로, 이들 세포의 염색체 DNA는 본원에 기재된 물질 및 방법을 사용하여 편집된다. 마지막으로, 편집된 세포는 환자 내로 이식된다.
생체외 세포 치료 접근법의 하나의 이점은, 투여 전에 치료제의 포괄적인 분석을 수행하는 능력이다. 모든 뉴클레아제-기초 치료제는 어느 정도 수준의 표적외 효과를 갖는다. 생체외에서 유전자 교정을 수행하는 것은 당업자가 이식 전에 교정된 세포 집단을 완전히 특징화할 수 있게 한다. 본 개시내용의 양태는, 표적외 절단이 있다면 환자에게 미미한 위험과 관련된 게놈 위치에 있음을 보장하기 위해 교정된 세포의 전체 게놈의 시퀀싱을 포함한다. 더욱이, 클론 집단을 포함하여 특정 세포의 집단은 이식 전에 단리될 수 있다.
이러한 방법의 또 다른 구현예는 생체내 기초 치료법이다. 이러한 방법에서, 환자에서 세포의 염색체 DNA는 본 명세서에 기재된 물질 및 방법을 사용하여 교정된다. 일부 구현예에서, 세포는 간세포이다.
생체내 유전자 치료법의 이점은 치료제 생성 및 투여의 용이성이다. 동일한 치료적 접근법 및 치료법은 동일하거나 유사한 유전자형 또는 대립유전자를 공유하는 하나를 초과하는 환자, 예를 들어 다수의 환자를 치료하는 데 사용될 수 있다. 이와는 대조적으로, 생체외 세포 치료법은 일반적으로 환자 자신의 세포를 사용하며, 이것은 단리되고, 조작되고 동일한 환자에게 복귀된다.
일부 구현예에서, 본 개시내용에 따른 치료 방법을 필요로 하는 대상체는 A형 혈우병, B형 혈우병, MPS II, MPS1H, 알파-1-항트립신 결핍, FXIII 결핍, FVII 결핍, FX 결핍, 단백질 C 결핍, 및 HAE로 이루어진 군으로부터 선택되는 장애 또는 건강상 병태의 증상을 갖고 있는 환자이다. 일부 구현예에서, 대상체는 장애 또는 건강상 병태를 갖는 것으로 의심되는 인간일 수 있다. 일부 구현예에서, 대상체는 A형 혈우병을 갖는 것으로 의심되는 인간일 수 있다. 대안적으로, 대상체는 장애 또는 건강상 병태, 예를 들어, A형 혈우병의 위험이 있는 것으로 진단된 인간일 수 있다. 일부 구현예에서, 대상체는 B형 혈우병을 갖는 것으로 의심되는 인간일 수 있다. 대안적으로, 대상체는 B형 혈우병의 위험이 있는 것으로 진단된 인간일 수 있다. 일부 구현예에서, 대상체는 HAE를 갖는 것으로 의심되는 인간일 수 있다. 대안적으로, 대상체는 HAE의 위험이 있는 것으로 진단된 인간일 수 있다. 일부 구현예에서, 치료를 필요로 하는 대상체는, GOI 생성물의 발현 수준 또는 기능성을 포함한 활성이 정상적인 건강한 대상체와 비교하여 실질적으로 감소되도록 내인성 GOI 또는 이의 조절 서열에 하나 이상의 유전적 결함(예를 들어, 결실, 삽입 및/또는 돌연변이)을 가질 수 있다.
일부 구현예에서, 대상체에서 A형 혈우병을 치료하는 방법이 본원에 제공되며, 상기 방법은 대상체의 세포에 (a) 서열번호 18-44 및 104 중 임의의 하나로부터의 스페이서 서열을 포함하는 gRNA, 또는 상기 gRNA를 인코딩하는 핵산; (b) DNA 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산; 및 (c) GOI 또는 기능적 유도체를 인코딩하는 핵산 서열을 포함하는 공여체 주형을 제공하는 단계를 포함한다. 일부 구현예에서, gRNA는 서열번호 21, 22, 28, 및 30 중 임의의 하나로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 서열번호 21로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 서열번호 22로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 서열번호 28로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 서열번호 30으로부터의 스페이서 서열을 포함한다. 일부 구현예에서, 세포는 인간 세포, 예를 들어, 인간 간세포의 세포이다. 일부 구현예에서, 대상체는 A형 혈우병, B형 혈우병, MPS II, MPS1H, 알파-1-항트립신 결핍, FXIII 결핍, FVII 결핍, FX 결핍, 단백질 C 결핍, 및 HAE를 갖고 있거나 갖는 것으로 의심되는 환자이다. 일부 구현예에서, 대상체는 A형 혈우병의 위험이 있는 것으로 진단된다.
일부 구현예에서, 대상체에서 B형 혈우병을 치료하는 방법이 본원에 제공되며, 상기 방법은 대상체의 세포에 (a) 서열번호 18-44 및 104 중 임의의 하나로부터의 스페이서 서열을 포함하는 gRNA, 또는 상기 gRNA를 인코딩하는 핵산; (b) DNA 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산; 및 (c) GOI 또는 기능적 유도체를 인코딩하는 핵산 서열을 포함하는 공여체 주형을 제공하는 단계를 포함한다. 일부 구현예에서, gRNA는 서열번호 21, 22, 28, 및 30 중 임의의 하나로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 서열번호 21로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 서열번호 22로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 서열번호 28로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 서열번호 30으로부터의 스페이서 서열을 포함한다. 일부 구현예에서, 세포는 인간 세포, 예를 들어, 인간 간세포의 세포이다. 일부 구현예에서, 대상체는 B형 혈우병을 갖고 있거나 갖는 것으로 의심되는 환자이다. 일부 구현예에서, 대상체는 B형 혈우병의 위험이 있는 것으로 진단된다.
일부 구현예에서, 대상체에서 HAE를 치료하는 방법이 본원에 제공되며, 상기 방법은 대상체의 세포에 (a) 서열번호 18-44 및 104 중 임의의 하나로부터의 스페이서 서열을 포함하는 gRNA, 또는 상기 gRNA를 인코딩하는 핵산; (b) DNA 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산; 및 (c) GOI 또는 기능적 유도체를 인코딩하는 핵산 서열을 포함하는 공여체 주형을 제공하는 단계를 포함한다. 일부 구현예에서, gRNA는 서열번호 21, 22, 28, 및 30 중 임의의 하나로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 서열번호 21로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 서열번호 22로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 서열번호 28로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 서열번호 30으로부터의 스페이서 서열을 포함한다. 일부 구현예에서, 세포는 인간 세포, 예를 들어, 인간 간세포의 세포이다. 일부 구현예에서, 대상체는 유전성 혈관부종을 갖고 있거나 갖는 것으로 의심되는 환자이다. 일부 구현예에서, 대상체는 유전성 혈관부종의 위험이 있는 것으로 진단된다.
일부 구현예에서, 본원에 기재된 장애 또는 건강상 병태를 치료하는 임의의 방법에 따르면, DNA 엔도뉴클레아제는 서열 NGG 또는 NNGG를 갖는 프로토스페이서 인접 모티프(PAM), 또는 이의 기능적 유도체를 인식하며, 여기서 N은 임의의 뉴클레오타이드이다. 일부 구현예에서, DNA 엔도뉴클레아제는 II형 Cas 엔도뉴클레아제 또는 이의 기능적 유도체이다. 일부 구현예에서, DNA 엔도뉴클레아제는 Cas9이다. 일부 구현예에서, Cas9는 스트렙토콕커스 파이오게네스(spCas9)로부터의 것이다. 일부 구현예에서, Cas9는 스타필로콕커스 루그두넨시스(SluCas9)로부터의 것이다.
일부 구현예에서, 본원에 기재된 장애 또는 건강상 병태를 치료하는 임의의 방법에 따르면, GOI 또는 이의 기능적 단편을 인코딩하는 핵산 서열은 세포에서의 발현을 위해 코돈 최적화된다. 일부 구현예에서, 세포는 인간 세포이다.
일부 구현예에서, 본원에 기재된 장애 또는 건강상 병태를 치료하는 임의의 방법에 따르면, 상기 방법은 DNA 엔도뉴클레아제를 인코딩하는 핵산을 이용한다. 일부 구현예에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 세포에서의 발현을 위해 코돈 최적화된다. 일부 구현예에서, 세포는 인간 세포, 예를 들어, 인간 간세포의 세포이다. 일부 구현예에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 DNA, 예컨대 DNA 플라스미드이다. 일부 구현예에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 RNA, 예컨대 mRNA이다.
일부 구현예에서, 본원에 기재된 장애 또는 건강상 병태를 치료하는 임의의 방법에 따르면, 공여체 주형은 AAV 벡터에서 인코딩된다. 일부 구현예에서, 공여체 주형은 GOI 또는 기능적 유도체를 인코딩하는 핵산 서열을 포함하는 공여체 카세트를 포함하고, 상기 공여체 카세트는 한면 또는 양면 상에서 gRNA 표적 부위에 의해 측면 근접해 있다. 일부 구현예에서, 공여체 카세트는 한면 또는 양면 상에서 gRNA 표적 부위에 의해 측면 근접해 있다. 일부 구현예에서, gRNA 표적 부위는 (a)의 gRNA에 대한 표적 부위이다. 일부 구현예에서, 공여체 주형의 gRNA 표적 부위는 (a)의 gRNA에 대한 세포 게놈 gRNA 표적 부위의 역보체이다. 일부 구현예에서, 공여체 주형을 세포에 제공하는 단계는 상기 공여체 주형을 상기 대상체에게 투여하는 단계를 포함한다. 일부 구현예에서, 투여는 정맥내 경로를 통한 것이다.
일부 구현예에서, 본원에 기재된 장애 또는 건강상 병태를 치료하는 임의의 방법에 따르면, DNA 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산은 리포솜 또는 지질 나노입자에서 제형화된다. 일부 구현예에서, 리포솜 또는 지질 나노입자는 또한 gRNA를 포함한다. 일부 구현예에서, 상기 gRNA 및 DNA 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산을 세포에 제공하는 단계는 리포솜 또는 지질 나노입자를 상기 대상체에게 투여하는 단계를 포함한다. 일부 구현예에서, 투여는 정맥내 경로를 통한 것이다. 일부 구현예에서, 리포솜 또는 지질 나노입자는 지질 나노입자이다. 일부 구현예에서, 상기 방법은 DNA 엔도뉴클레아제를 인코딩하는 핵산 및 gRNA를 포함하는 지질 나노입자를 이용한다. 일부 구현예에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 DNA 엔도뉴클레아제를 인코딩하는 mRNA이다.
일부 구현예에서, 본원에 기재된 장애 또는 건강상 병태를 치료하는 임의의 방법에 따르면, DNA 엔도뉴클레아제는 gRNA와 예비-복합체화하여, RNP 복합체를 형성한다.
일부 구현예에서, 본원에 기재된 장애 또는 건강상 병태를 치료하는 임의의 방법에 따르면, (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산은 (c)의 공여체 주형이 세포에 제공된 후 상기 세포에 제공된다. 일부 구현예에서, (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산은 (c)의 공여체 주형이 세포에 제공된 후 4일 초과째에 상기 세포에 제공된다. 일부 구현예에서, (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산은 (c)의 공여체 주형이 세포에 제공된 후 적어도 14일째에 상기 세포에 제공된다. 일부 구현예에서, (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산은 (c)의 공여체 주형이 세포에 제공된 후 적어도 17일째에 상기 세포에 제공된다. 일부 구현예에서, (a) 및 (b)를 세포에 제공하는 단계는 DNA 엔도뉴클레아제를 인코딩하는 핵산 및 gRNA를 포함하는 지질 나노입자를 대상체에게 투여하는(예컨대 정맥내 경로에 의해) 단계를 포함한다. 일부 구현예에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 DNA 엔도뉴클레아제를 인코딩하는 mRNA이다. 일부 구현예에서, (c)를 세포에 제공하는 단계는 AAV 벡터에서 인코딩되는 공여체 주형을 대상체에게 투여하는(예컨대 정맥내 경로에 의해) 단계를 포함한다.
일부 구현예에서, 본원에 기재된 장애 또는 건강상 병태를 치료하는 임의의 방법에 따르면, (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산의 하나 이상의 추가 용량은, (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산의 제1 용량 후에 상기 세포에 제공된다. 일부 구현예에서, (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산의 하나 이상의 추가 용량은, GOI 또는 기능적 유도체를 인코딩하는 핵산 서열의 표적화된 통합의 표적 수준 및/또는 GOI 또는 기능적 유도체를 인코딩하는 핵산 서열의 발현의 표적 수준이 달성될 때까지, (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산의 제1 용량 후에 상기 세포에 제공된다. 일부 구현예에서, (a) 및 (b)를 세포에 제공하는 단계는 DNA 엔도뉴클레아제를 인코딩하는 핵산 및 gRNA를 포함하는 지질 나노입자를 대상체에게 투여하는(예컨대 정맥내 경로에 의해) 단계를 포함한다. 일부 구현예에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 DNA 엔도뉴클레아제를 인코딩하는 mRNA이다.
일부 구현예에서, 본원에 기재된 장애 또는 건강상 병태를 치료하는 임의의 방법에 따르면, GOI 또는 기능적 유도체를 인코딩하는 핵산 서열은 내인성 알부민 프로모터의 제어 하에 발현된다.
일부 구현예에서, 본원에 기재된 장애 또는 건강상 병태를 치료하는 임의의 방법에 따르면, GOI 또는 기능적 유도체를 인코딩하는 핵산 서열은 대상체의 간에서 발현된다.
대상체 내로의 세포의 이식
일부 구현예에서, 본 개시내용의 생체외 방법은, 이러한 방법을 필요로 하는 대상체 내로 게놈-편집 세포를 이식하는 단계를 수반한다. 이러한 이식 단계는 당업계에 알려진 임의의 이식 방법을 사용하여 성취될 수 있다. 예를 들어, 유전적으로 변형된 세포는 대상체의 혈액에 직접적으로 주사되거나 그렇지 않다면 대상체에게 투여될 수 있다.
일부 구현예에서, 본원에 개시된 방법은, 요망되는 효과(들)가 발휘되도록 요망되는 부위에서 도입된 세포의 적어도 부분적인 국재화를 초래하는 방법 또는 경로에 의해 유전적으로 변형된 치료적 세포를 대상체 내로 "도입하는 것" 및 "이식하는 것"과 상호 교환적으로 사용될 수 있는 투여를 포함한다. 치료적 세포 또는 이의 분화된 자손은 대상체에서 목적하는 위치에 전달하는 임의의 적절한 경로에 의해서 투여될 수 있고, 여기서 이식된 세포 또는 세포의 성분의 적어도 일부는 생존한다. 대상체에게 투여된 후 세포의 생존 기간은 수시간, 예를 들어 24시간만큼 짧을 수 있거나 수일까지, 수년, 또는 심지어는 환자의 일생만큼 길 수 있고, 즉 장기간 이식물이다.
예방적으로 제공될 때, 본원에 기재된 치료적 세포는 GOI-관련 장애 또는 건강상 병태, 예를 들어, A형 혈우병의 임의의 증상에 앞서 대상체에게 투여될 수 있다. 이에, A형 혈우병의 치료를 위해 FVIII 유전자의 사용이 관여하는 일부 구현예에서, 유전적으로 변형된 간세포의 세포 집단의 예방적 투여는 A형 혈우병의 발생을 예방하는 역할을 한다.
일부 구현예에서 치료적으로 제공될 때, 유전적으로 변형된 간세포의 세포는 GOI-관련 장애 또는 건강상 병태의 증상 또는 징후(indication)의 발증(onset) 시(또는 그 후에), 예를 들어, 질환의 발증 시 제공된다.
일부 구현예에서, 본원에 기재된 방법에 따라 투여되는 치료적 간세포의 세포 집단은 하나 이상의 공여체로부터 수득된 동종이계 간세포의 세포를 갖는다. "동종이계"는, 동일한 종의 하나 이상의 상이한 공여체로부터 수득된 간세포의 세포 또는 상기 간세포의 세포를 갖는 생물학적 시료를 지칭하며, 하나 이상의 좌위에서의 유전자는 동일하지 않다. 예를 들어, 대상체에게 투여되는 간세포의 세포 집단은 하나 이상의 무관한 공여체 대상체로부터, 또는 하나 이상의 동일하지 않은 형제자매체로부터 유래될 수 있다. 일부 구현예에서, 동계(syngeneic) 간세포의 세포 집단, 예컨대 유전적으로 동일한 동물로부터 또는 동일한 쌍둥이로부터 수득된 것들이 사용될 수 있다. 다른 구현예에서, 간세포의 세포는 자기 세포이며; 즉, 간세포의 세포는 대상체로부터 수득되거나 단리되고 동일한 대상체에게 투여되며, 즉, 공여체와 수혜체(recipient)가 동일하다.
일부 구현예에서, 유효량은 GOI-관련 장애 또는 건강상 병태의 적어도 하나 이상의 징후 또는 증상을 예방하거나 완화시키는 데 필요한 치료적 세포 집단의 양을 지칭하고, 요망되는 효과를 제공하기에, 예를 들어, GOI-관련 장애 또는 건강상 병태를 갖는 대상체를 치료하기에 충분한 양에 관한 것이다. 일부 구현예에서, 치료적 유효량은 전형적인 대상체, 예컨대 GOI-관련 장애 또는 건강상 병태를 갖고 있거나 이에 대한 위험이 있는 대상체에게 투여될 때, 특정 효과를 촉진시키기에 충분한 치료적 세포 또는 상기 치료적 세포를 갖는 조성물의 양을 지칭한다. 유효량은 또한, 질환의 증상의 발증을 예방 또는 지연시키거나, 질환의 증상의 경로를 변경시키거나(예를 들어, 비제한적으로, 질환의 증상의 진행을 늦추는 것) 또는 질환의 증상을 반전시키기에 충분한 양을 포함할 것이다. 임의의 주어진 경우에 대해, 적절한 유효량은 일상적인 실험을 사용하여 당업자에 의해 결정될 수 있는 것으로 이해된다.
본원에 기재된 다양한 구현예에 사용되기 위해, 치료적 세포, 예를 들어, 게놈-편집 간세포의 세포의 유효량은 적어도 102 세포, 적어도 5 X 102 세포, 적어도 103 세포, 적어도 5 X 103 세포, 적어도 104 세포, 적어도 5 X 104 세포, 적어도 105 세포, 적어도 2 X 105 세포, 적어도 3 X 105 세포, 적어도 4 X 105 세포, 적어도 5 X 105 세포, 적어도 6 X 105 세포, 적어도 7 X 105 세포, 적어도 8 X 105 세포, 적어도 9 X 105 세포, 적어도 1 X 106 세포, 적어도 2 X 106 세포, 적어도 3 X 106 세포, 적어도 4 X 106 세포, 적어도 5 X 106 세포, 적어도 6 X 106 세포, 적어도 7 X 106 세포, 적어도 8 X 106 세포, 적어도 9 X 106 세포, 또는 이들의 복합일 수 있다. 치료적 세포는 하나 이상의 공여체로부터 유래될 수 있거나, 자기유래 공급원으로부터 수득된다. 본원에 기재된 일부 구현예에서, 치료적 세포는 이를 필요로 하는 대상체에게 투여되기 전에 배양물에서 확장된다(expanded).
일부 구현예에서, GOI-관련 장애 또는 건강상 병태를 갖는 환자의 세포에서 발현되는 기능성 GOI 생성물의 수준에서 보통의 점진적(modest and incremental) 증가는 질환의 하나 이상의 증상을 개선시키기 위해, 장기간 생존율을 증가시키기 위해, 그리고/또는 다른 치료와 관련된 부작용을 감소시키기 위해 유익할 수 있다. 인간 환자에게 이러한 세포의 투여 시, 증가된 수준의 기능성 GOI 생성물을 생성하는 치료적 세포의 존재가 유익하다. 일부 구현예에서, 대상체의 효과적인 치료는 치료받는 대상체에서 총 GOI 단백질에 비해 적어도 약 1%, 3%, 5% 또는 7%의 기능성 GOI 생성물을 발생시킨다. 일부 구현예에서, 기능성 GOI 생성물은 총 GOI 생성물의 적어도 약 10%이다. 일부 구현예에서, 기능성 GOI 생성물은 총 GOI 생성물의 적어도, 약 또는 최대 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90% 또는 100%이다. 유사하게는, 상당히 증가된 수준의 기능성 GOI를 갖는 세포의 비교적 더 제한된 하위집단의 도입이 다양한 환자에서 이로울 수 있는데, 그 이유는 일부 상황에서 정상 세포는 병이 걸린 세포에 비해서 선택적인 이점을 가질 것이기 때문이다. 그러나, 심지어, 상승된 수준의 기능성 GOI 생성물을 갖는 치료적 세포의 보통 수준은 환자에서 GOI-관련 장애 또는 건강상 병태의 하나 이상의 양태를 개선하는 데 유익할 수 있다. 일부 구현예에서, 이러한 세포가 투여되는 환자에서 약 10%, 약 20%, 약 30%, 약 40%, 약 50%, 약 60%, 약 70%, 약 80%, 약 90% 이상의 치료제가 증가된 수준의 기능성 GOI 생성물을 생성한다.
일부 구현예에서, 요망되는 부위에서 세포 조성물의 적어도 부분적인 국재화를 초래하는 방법 또는 경로에 의해 대상체에게 치료적 세포 조성물을 전달하는 것이다. 세포 조성물은 대상체에서 효과적인 치료를 유발하는 임의의 적절한 경로에 의해서 투여될 수 있고, 즉 투여는 대상체에서 목적하는 위치에 대한 전달을 유발하고, 여기서 전달되는 조성물의 적어도 일부, 즉 적어도 1 x 104개의 세포가 임의의 시간 기간 동안 목적하는 부위에 전달된다. 투여 모드는 주사, 주입, 점적(instillation) 또는 섭취를 포함한다. "주사"는 비제한적으로 정맥내, 근육내, 동맥내, 척추강내, 심실내, 낭내, 안와내, 심장내, 피내, 복강내, 기관경유(transtracheal), 피하, 표피하, 관절내, 피막하, 지주막하(subarachnoid), 척수내, 뇌척수내 및 흉골내 주사 및 주입을 포함한다. 일부 구현예에서, 경로는 정맥내이다. 세포의 전달을 위해, 주사 또는 주입에 의한 투여가 수행될 수 있다.
일부 구현예에서, 세포는 전신으로 투여되며, 다시 말해, 치료적 세포의 집단은 표적 부위, 조직, 또는 기관(organ) 내로 직접적으로 투여되기 보다는 이는 대신에 대상체의 순환계로 진입하므로, 대사 및 다른 유사한 과정을 받는다.
GOI-관련 장애 또는 건강상 병태의 치료를 위한 조성물을 갖는 치료의 효능은 숙련된 임상의에 의해 결정될 수 있다. 그러나, 징후 또는 증상 중 임의의 하나 또는 모두가 그러나 일례로 기능성 GOI 생성물의 수준이 유익한 방식으로 변경되거나(예를 들어, 적어도 10%만큼 증가됨), 질환의 다른 임상적으로 허용되는 증상 또는 마커가 향상되거나 개선된다면, 치료는 효과적인 치료인 것으로 여겨진다. 효능은 또한, 입원 또는 의학적 개입에 대한 필요성에 의해 평가되는 바와 같이 개체가 악화되는 것의 실패에 의해 측정될 수 있다(예를 들어, 질환의 진행이 중단되거나 적어도 늦춰짐). 이들 지표를 측정하는 방법은 당업자에게 알려져 있고/거나 본원에 기재되어 있다. 치료는 개체 또는 동물(일부 비제한적인 예는 인간 또는 포유류를 포함함)에서 질환의 임의의 치료를 포함하며, (1) 질환을 저해하는 것, 예를 들어, 증상의 진행을 억제시키거나 늦추는 것; 또는 (2) 질환을 완화하는 것, 예를 들어, 증상의 퇴축(regression)을 야기하는 것; 및 (3) 증상의 발증을 예방하거나 이의 가능성을 감소시키는 것을 포함한다.
일부 구현예에서, 기능적 표적 단백질 결함과 관련된 장애 또는 건강상 병태의 치료에 사용하기 위한, 예컨대 장애 또는 건강상 병태의 치료용 약제의 제조에 사용하기 위한 본원에 기재된 임의의 구현예에 따른 유전적으로 변형된 세포가 본원에 제공된다.
조성물
일 양태에서, 본 개시내용은 본원에 기재된 방법을 수행하기 위한 조성물을 제공한다. 조성물은 게놈-표적화 핵산(예를 들어, gRNA); 부위-지향적 폴리펩타이드(예를 들어, DNA 엔도뉴클레아제) 또는 상기 부위-지향적 폴리펩타이드를 인코딩하는 뉴클레오타이드 서열 및 본원에 개시된 방법의 요망되는 유전적 변형을 수행하기 위해 삽입될 폴리뉴클레오타이드(예를 들어, 공여체 주형) 중 하나 이상을 포함할 수 있다.
일부 구현예에서, 조성물은 게놈-표적화 핵산(예를 들어, gRNA)을 인코딩하는 뉴클레오타이드 서열을 갖는다.
일부 구현예에서, 조성물은 부위-지향적 폴리펩타이드(예를 들어, DNA 엔도뉴클레아제)를 갖는다. 일부 구현예에서, 조성물은 부위-지향적 폴리펩타이드를 인코딩하는 뉴클레오타이드 서열을 갖는다.
일부 구현예에서, 조성물은 게놈 내로 삽입될 폴리뉴클레오타이드(예를 들어, 공여체 주형)를 갖는다.
일부 구현예에서, 조성물은 (i) 게놈-표적화 핵산(예를 들어, gRNA)을 인코딩하는 뉴클레오타이드 서열 및 (ii) 부위-지향적 폴리펩타이드(예를 들어, DNA 엔도뉴클레아제) 또는 상기 부위-지향적 폴리펩타이드를 인코딩하는 뉴클레오타이드 서열을 갖는다.
일부 구현예에서, 조성물은 (i) 게놈-표적화 핵산(예를 들어, gRNA)을 인코딩하는 뉴클레오타이드 서열 및 (ii) 게놈 내로 삽입될 폴리뉴클레오타이드(예를 들어, 공여체 주형)를 갖는다.
일부 구현예에서, 조성물은 (i) 부위-지향적 폴리펩타이드(예를 들어, DNA 엔도뉴클레아제) 또는 상기 부위-지향적 폴리펩타이드를 인코딩하는 뉴클레오타이드 서열 및 (ii) 게놈 내로 삽입될 폴리뉴클레오타이드(예를 들어, 공여체 주형)를 갖는다.
일부 구현예에서, 조성물은 (i) 게놈-표적화 핵산(예를 들어, gRNA)을 인코딩하는 뉴클레오타이드 서열, (ii) 부위-지향적 폴리펩타이드(예를 들어, DNA 엔도뉴클레아제) 또는 상기 부위-지향적 폴리펩타이드를 인코딩하는 뉴클레오타이드 서열 및 (iii) 게놈 내로 삽입될 폴리뉴클레오타이드(예를 들어, 공여체 주형)를 갖는다.
임의의 상기 조성물의 일부 구현예에서, 조성물은 단일-분자 가이드 게놈-표적화 핵산을 갖는다. 임의의 상기 조성물의 일부 구현예에서, 조성물은 이중-분자 가이드 게놈-표적화 핵산을 갖는다. 임의의 상기 조성물의 일부 구현예에서, 조성물은 2개 이상의 이중-분자 가이드 또는 단일-분자 가이드를 갖는다. 일부 구현예에서, 조성물은 핵산 표적화 핵산을 인코딩하는 벡터를 갖는다. 일부 구현예에서, 게놈-표적화 핵산은 DNA 엔도뉴클레아제, 특히 Cas9이다.
일부 구현예에서, 조성물은 게놈-편집, 특히, 세포의 게놈 내로의 GOI 또는 이의 유도체의 삽입에 사용될 수 있는 하나 이상의 grNA를 포함하는 조성물을 함유할 수 있다. 조성물에 대한 gRNA는 내인성 알부민 유전자에, 그 내에 또는 그 부근의 게놈 부위를 표적화할 수 있다. 따라서, 일부 구현예에서, gRNA는 알부민 유전자에, 그 내에, 또는 그 부근의 게놈 서열에 상보적인 스페이서 서열을 가질 수 있다.
일부 구현예에서, 조성물에 대한 gRNA는 표 3에 나열된 것들 및 표 3에 나열된 임의의 것과 적어도 약 50%, 약 55%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90% 또는 약 95%의 동일성 또는 상동성을 갖는 이의 변이체로부터 선택되는 서열이다. 일부 구현예에서, 키트에 대한 gRNA의 변이체는 표 3에 나열된 임의의 것과 적어도 약 85% 상동성을 갖는다.
일부 구현예에서, 조성물에 대한 gRNA는 게놈 내 표적 부위에 상보적인 스페이서 서열을 갖는다. 일부 구현예에서, 스페이서 서열은 15개 염기 내지 20개 염기 길이이다. 일부 구현예에서, 스페이서 서열과 게놈 서열 사이의 상보성은 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 적어도 100%이다.
일부 구현예에서, 조성물은 DNA 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산 및/또는 GOI 또는 이의 기능적 유도체의 핵산 서열을 갖는 공여체 주형을 가질 수 있다. 일부 구현예에서, DNA 엔도뉴클레아제는 Cas9이다. 일부 구현예에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 DNA 또는 RNA이다.
일부 구현예에서, 키트에 대한 하나 이상의 임의의 올리고뉴클레오타이드 또는 핵산 서열은 AAV 벡터에서 인코딩될 수 있다. 따라서, 일부 구현예에서, gRNA는 AAV 벡터에서 인코딩될 수 있다. 일부 구현예에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 AAV 벡터에서 인코딩될 수 있다. 일부 구현예에서, 공여체 주형은 AAV 벡터에서 인코딩될 수 있다. 일부 구현예에서, 2개 이상의 올리고뉴클레오타이드 또는 핵산 서열은 단일 AAV 벡터에서 인코딩될 수 있다. 그러므로, 일부 구현예에서, gRNA 서열 및 DNA 엔도뉴클레아제-인코딩 핵산은 단일 AAV 벡터에서 인코딩될 수 있다.
일부 구현예에서, 조성물은 리포솜 또는 지질 나노입자를 가질 수 있다. 따라서, 일부 구현예에서, 조성물의 임의의 화합물(예를 들어, DNA 엔도뉴클레아제 또는 이를 인코딩하는 핵산, gRNA 및 공여체 주형)은 리포솜 또는 지질 나노입자에서 제형화될 수 있다. 일부 구현예에서, 하나 이상의 이러한 화합물은 공유 결합 또는 비-공유 결합을 통해 리포솜 또는 지질 나노입자와 회합된다. 일부 구현예에서, 임의의 화합물은 리포솜 또는 지질 나노입자에서 별도로 또는 함께 함유될 수 있다. 따라서, 일부 구현예에서, 각각의 DNA 엔도뉴클레아제 또는 이를 인코딩하는 핵산, gRNA 및 공여체 주형은 리포솜 또는 지질 나노입자에서 별도로 제형화된다. 일부 구현예에서, DNA 엔도뉴클레아제는 리포솜 또는 지질 나노입자에서 gRNA와 함께 제형화된다. 일부 구현예에서, DNA 엔도뉴클레아제 또는 이를 인코딩하는 핵산, gRNA 및 공여체 주형은 리포솜 또는 지질 나노입자에서 함께 제형화된다.
일부 구현예에서, 상기에 기재된 조성물은 하나 이상의 추가 시약을 추가로 가지며, 여기서 이러한 추가 시약은 완충제, 폴리펩타이드 또는 폴리뉴클레오타이드를 세포에 도입하기 위한 완충제, 세척 완충제, 제어 시약, 제어 벡터, 제어 RNA 폴리뉴클레오타이드, DNA로부터 폴리펩타이드를 시험관내에서 생산하기 위한 시약, 서열결정을 위한 어댑터 등으로부터 선택된다. 완충제는 안정화 완충제, 재구성 완충제, 희석 완충제 등일 수 있다. 일부 구현예에서, 상기 조성물은 표적상 결합 또는 엔도뉴클레아제에 의한 DNA의 절단을 용이하게 하거나 또는 향상시키거나 또는 표적화의 특이성을 개선시키기 위해서 사용될 수 있는 하나 이상의 성분을 또한 포함할 수 있다.
일부 구현예에서, 조성물의 임의의 구성요소는 특정 투여 모드 및 투여형에 따라서, 약학적으로 허용 가능한 부형제, 예컨대 담체, 용매, 안정화제, 아주반트, 희석제 등과 함께 제형화된다. 일부 구현예에서, 가이드 RNA 조성물은 일반적으로 생리학적으로 상용성인 pH 및 투여 제형 및 경로에 따라서, 약 3의 pH 내지 약 11의 pH, 약 pH 3 내지 약 pH 7 범위이도록 제형화된다. 일부 구현예에서, pH는 약 pH 5.0 내지 약 pH 8 범위로 조정된다. 일부 구현예에서, 조성물은 하나 이상의 약학적으로 허용 가능한 부형제와 함께, 본 명세서에 기술된 바와 같은 치료적 유효량의 적어도 하나의 화합물을 갖는다. 선택적으로, 조성물은 본 명세서에 기술된 화합물의 조합물을 가질 수 있거나 또는 박테리아 성장의 치료 또는 예방에 유용한 제2 활성 성분(예를 들어, 비제한적으로 항-박테리아제 또는 항-미생물제)을 포함할 수 있거나 또는 본 개시내용의 시약의 조합물을 포함할 수 있다. 일부 구현예에서, gRNA는 다른 하나 이상의 올리고뉴클레오타이드, 예를 들어, DNA 엔도뉴클레아제를 인코딩하는 핵산 및/또는 공여체 주형과 함께 제형화된다. 대안적으로, DNA 엔도뉴클레아제를 인코딩하는 핵산 및 공여체 주형은 별도로 또는 다른 올리고뉴클레오타이드와 조합되어, gRNA 제형에 대해 상기 기재된 방법으로 제형화된다.
적합한 부형제는 예를 들어, 큰 서서히 대사되는 거대 분자, 예컨대 단백질, 다당류, 폴리락트산, 폴리글리콜산, 중합체 아미노산, 아미노산 공중합체, 및 불활성 바이러스 입자를 포함하는 담체 분자를 포함할 수 있다. 다른 예시적인 부형제는 항산화제(예를 들어 비제한적으로, 아스코르브산), 킬레이팅제(예를 들어 비제한적으로, EDTA), 탄수화물(예를 들어 비제한적으로, 덱스트린, 하이드록시알킬셀룰로스 및 하이드록시알킬메틸셀룰로스), 스테아르산, 액체(예를 들어 비제한적으로 오일, 물, 염수, 글리세롤 및 에탄올), 습윤제 또는 유화제, pH 완충 물질 등을 포함한다.
일부 구현예에서, 조성물의 임의의 화합물(예를 들어, DNA 엔도뉴클레아제 또는 이를 인코딩하는 핵산, gRNA 및 공여체 주형)은 형질주입, 예컨대 전기천공을 통해 전달될 수 있다. 일부 예시적인 구현예에서, DNA 엔도뉴클레아제는 세포에 제공되기 전에 gRNA와 예비복합체화되어 RNP 복합체를 형성할 수 있고, RNP 복합체가 전기천공될 수 있다. 이러한 구현예에서, 공여체 주형은 전기천공을 통해 전달될 수 있다.
일부 구현예에서, 조성물은 생체외 치료 방법에 사용되는 치료적 세포를 갖는 치료적 조성물을 지칭한다.
일부 구현예에서, 치료적 조성물은 세포 조성물 및 임의로 본 명세서에 기술된 바와 같이 활성 성분으로서 그 내에 용해 또는 분산된 적어도 하나의 추가 생물활성제와 함께 생리학적으로 용인되는 담체를 함유한다. 일부 구현예에서, 치료적 조성물은 바람직하지 않는 한 치료적 목적을 위해서 포유동물 또는 인간 환자에게 투여될 때 실질적으로 면역원성이지 않다.
일반적으로, 본원에 기재된 유전적으로 변형된 치료적 세포는 약학적으로 허용 가능한 담체와 함께 현탁물로서 투여된다. 당업자는 세포 조성물 중에서 사용될 약학적으로 허용 가능한 담체가 완충제, 화합물, 저온보존제, 보존제 또는 다른 작용제를 대상체에 전달될 세포의 생존성을 실질적으로 방해하는 양으로 포함하지 않을 것이라는 것을 인식할 것이다. 세포를 갖는 제형은 예를 들어, 세포막 온전성이 유지되는 것을 허용하는 삼투성 완충제, 및 임의로 투여 시 세포 생존성을 유지시키거나 이식을 향상시키기 위한 영양제를 포함할 수 있다. 이러한 제형 및 현탁물은 관련 기술 분야의 통상의 기술자에게 공지되어 있고/있거나 일상적인 실험을 사용하여, 본 명세서에 기술된 바와 같이, 전구 세포와 함께 사용하기 위해서 개작될 수 있다.
일부 구현예에서, 세포 조성물은 또한 리포솜 조성물로서 유화 또는 제공될 수 있되, 단 유화 절차는 세포 생존성에 악영향을 주지 않아야 한다. 세포 및 임의의 다른 활성 성분을 약학적으로 허용 가능하고, 활성 성분과 상용성인 부형제와, 본 명세서에 기술된 치료 방법에서 사용하기에 적합한 양으로 혼합할 수 있다.
세포 조성물 중에 포함되는 추가 작용제는 그 중에 성분의 약학적으로 허용 가능한 염을 포함할 수 있다. 약학적으로 허용 가능한 염은 무기산, 예컨대, 예를 들어 염화수소산 또는 인산 또는 아세트산, 타타르산, 만델산 등과 같은 유기산을 사용하여 형성되는 산 부가염(폴리펩타이드의 유리 아미노기를 사용하여 형성됨)을 포함한다. 유리 카복실기를 사용하여 형성된 염은 또한 무기 염기, 예컨대, 예를 들어, 나트륨, 칼륨, 암모늄, 칼슘 또는 제2철 수산화물 및 이소프로필아민, 트라이메틸아민, 2-에틸아미노 에탄올, 히스티딘, 프로카인 등과 같은 유기 염기로부터 유래될 수 있다.
생리학적으로 용인되는 담체는 관련 기술 분야에 널리 공지되어 있다. 예시적인 액체 담체는 활성 성분 및 물 이외에 어떤 물질도 함유하지 않거나 또는 완충제, 예컨대 생리학적 pH 값의 인산나트륨, 생리 식염수 또는 둘 모두를 함유하는 멸균 수성 용액이다. 더 추가로, 수성 담체는 하나를 초과하는 완충제 염, 뿐만 아니라 염, 예컨대 염화나트륨 및 염화칼륨, 덱스트로스, 폴리에틸렌 글리콜 및 다른 용질을 함유할 수 있다. 액체 조성물은 또한 물 이외에 그리고 물을 제외하고 액체 상을 또한 함유할 수 있다. 이러한 추가 액체 상의 예는 글리세린, 식물유, 예컨대 면실유, 및 수-유 에멀션이다. 특정 장애 또는 병태의 치료에 효과적인 세포 조성물에서 사용되는 활성 화합물의 양은 장애 또는 병태의 본성에 좌우될 것이고, 표준 임상 기술에 의해서 결정될 수 있다.
키트
일부 구현예는 임의의 상기 기재된 조성물, 예를 들어, 게놈 편집용 조성물 또는 치료적 세포 조성물 및 하나 이상의 추가 구성요소를 함유하는 키트를 제공한다.
일부 구현예에서, 키트는 요망되는 목적, 예를 들어, 게놈 편집 또는 세포 치료법을 위한 조성물과 동시에 또는 순차적으로 투여될 수 있는 하나 이상의 추가 치료제를 가질 수 있다.
일부 구현예에서, 키트는 방법을 실시하기 위해서 키트의 성분을 사용하기 위한 설명서를 추가로 포함할 수 있다. 방법을 실시하기 위한 설명서는 일반적으로 적합한 기록 매체 상에 기록되어 있다. 예를 들어, 설명서는 기재(substrate), 예컨대 종이 또는 플라스틱 등에 인쇄될 수 있다. 설명서는 키트 또는 이의 구성요소(즉, 패키징 또는 서브패키징과 관련됨) 등의 용기의 표지화에서 패키지 삽입물로서 키트에 존재할 수 있다. 설명서는 적합한 컴퓨터 판독 가능한 저장 매체, 예를 들어, CD-ROM, 디스켓, 플래시 드라이브 등 상에 존재하는 전자 저장 데이터 파일로서 존재할 수 있다. 일부 예에서, 실제 설명서는 키트에 존재하지 않지만, 원격 공급원으로부터(예를 들어, 인터넷을 통해) 설명서를 수득하기 위한 수단이 제공될 수 있다. 이러한 구현예의 예는 설명서를 볼 수 있는 웹 주소 및/또는 설명서를 다운로딩할 수 있는 웹 주소를 포함하는 키트이다. 설명서와 관련하여, 설명서를 입수하기 위한 이러한 수단은 적합한 기재 상에 기록될 수 있다.
다른 가능한 치료적 접근법
유전자 편집은 특정 서열을 표적화하도록 조작된 뉴클레아제를 사용하여 수행될 수 있다. 현재까지 4개의 주요 유형의 뉴클레아제: 메가뉴클레아제 및 이의 유도체, 아연 핑거 뉴클레아제(ZFN), 전사 활성자 유사 이펙터 뉴클레아제(TALEN), 및 CRISPR-Cas9 뉴클레아제 시스템이 존재한다. 뉴클레아제 플랫폼은, 특히 ZFN 및 TALEN이 단백질-DNA 상호작용을 통해 있으므로 설계의 어려움, 표적화 밀도 및 작용 모드에서 다양한 한편, RNA-DNA 상호작용은 주로 Cas9를 가이드한다. Cas9 절단은 또한, 상이한 CRISPR 시스템 사이에서 상이한 인접 모티프인 PAM을 필요로 한다. 스트렙토콕커스 파이오게네스로부터의 Cas9는 NRG PAM을 사용하여 절단하며, 나이쎄리아 메닌지티디스(Neisseria meningitidis)로부터의 CRISPR는 NNNNGATT(서열번호 101), NNNNNGTTT(서열번호 102) 및 NNNNGCTT(서열번호 103)를 포함하여 PAM과 함께 부위에서 절단할 수 있다. 많은 다른 Cas9 오르토로그는 대안적인 PAM에 인접한 프로토스페이서를 표적화한다.
CRISPR 엔도뉴클레아제, 예컨대 Cas9는 본 개시내용의 방법의 다양한 구현예에서 사용될 수 있다. 그러나, 본원에 기재된 교시, 예컨대 치료적 표적 부위는 엔도뉴클레아제의 다른 형태, 예컨대 ZFN, TALEN, HE 또는 MegaTAL에, 또는 뉴클레아제들의 조합을 사용하여 적용될 수 있다. 그러나, 본 개시내용의 교시를 이러한 엔도뉴클레아제에 적용하기 위해, 당업자는 다른 것들 중에서도, 특정 표적 부위에 관한 단백질을 조작할 필요가 있을 것이다.
추가 결합 도메인은 Cas9 단백질에 융합되어 특이성을 증가시킬 수 있다. 이들 작제물의 표적 부위는 식별된 gRNA 명시 부위에 맵핑할 것이지만, 추가 결합 모티프, 예컨대 아연 핑거 도메인을 필요로 할 것이다. 메가-TAL의 경우, 메가뉴클레아제는 TALE DNA-결합 도메인에 융합될 수 있다. 메가뉴클레아제 도메인은 특이성을 증가시키고 절단을 제공할 수 있다. 유사하게는, 불활성화된 또는 사멸된 Cas9(dCas9)는 절단 도메인에 융합되고, sgRNA/Cas9 표적 부위 및 융합된 DNA-결합 도메인에 대한 인접 결합 부위를 필요로 할 수 있다. 이는 아마도, 촉매적 불활성화 외에도, 추가 결합 부위 없이 결합을 저하시키기 위해 dCas9의 일부 단백질 조작을 필요로 할 것이다.
일부 구현예에서, 본 개시내용에 따라 게놈을 편집하는 조성물 및 방법(예를 들어, 알부민 좌위 내로의 GOI-인코딩 서열의 삽입)은 임의의 하기 접근법을 사용하여 이용되거나 수행될 수 있다.
아연 핑거 뉴클레아제
아연 핑거 뉴클레아제(ZFN)는 II형 엔도뉴클레아제 FokI의 촉매작용 도메인에 연결된 조작된 아연 핑거 DNA 결합 도메인을 갖는 모듈 단백질이다. FokI은 이량체로서만 기능하기 때문에, 한 쌍의 ZFN은 반대 DNA 가닥 상에서 동족 표적 "절반-부위" 서열에 결합하고, 촉매작용적으로 활성인 FokI 이량체가 형성되도록 그들 사이에서 정확한 이격을 갖도록 조작되어야 한다. 그 자체로 서열 특이성을 갖지 않는 FokI 도메인의 이량체화 시, DNA 이중-가닥 브레이크는 게놈 편집 시에 개시 단계로서 ZFN 절반-부위들 사이에서 생성된다.
각각의 ZFN의 DNA 결합 도메인은 일반적으로 풍부한 Cys2-His2 구조의 3 내지 6개의 아연 핑거를 갖고, 각각의 핑거는 주로 표적 DNA 서열의 하나의 가닥 상에서 3개의 뉴클레오타이드를 인식하지만, 제4 뉴클레오타이드와의 교차-가닥 상호작용이 또한 중요할 수 있다. DNA와 중요하게 접촉하는 자리에서 핑거의 아미노산의 변경은 주어진 핑거의 서열 특이성을 변경한다. 따라서, 4-핑거 아연 핑거 단백질은 12bp의 표적 서열을 선택적으로 인식할 것이고, 여기서 표적 서열은 각각의 핑거에 의해서 기여된 3개의 선호의 복합물이지만, 3개의 선호는 이웃하는 핑거에 의해서 다양한 정도로 영향을 받을 수 있다. ZFN의 중요한 양상은 그것이 개별 핑거를 단순히 변형시킴으로써 거의 임의의 게놈 주소로 쉽게 재-표적화될 수 있다는 것이지만, 이것을 잘 수행하기 위해서는 상당한 전문지식이 필요하다. ZFN의 대부분의 적용에서, 4 내지 6개의 핑거의 단백질이 사용되고, 이것은 각각 12 내지 18bp를 인식한다. 따라서, 한 쌍의 ZFN는 일반적으로 절반-부위들 사이에 5 내지 7bp의 스페이서를 포함하지 않는, 24 내지 36bp의 조합된 표적 서열을 인식할 것이다. 결합 부위는 15-17 bp를 포함하여 더 큰 스페이서로 추가로 분리될 수 있다. 반복 서열 또는 유전자 동족체가 설계 과정 동안 제외된다고 가정하면, 이러한 길이의 표적 서열은 인간 게놈에서 독특할 것이다. 그럼에도 불구하고, ZFN 단백질-DNA 상호작용은 이의 특이성이 절대적이지 않아서, 표적외 결합 및 절단 사건이 2개의 ZFN들 사이의 이종이량체로서 또는 ZFN 중 하나 또는 나머지 것의 동종이량체로서 일어난다. 후자 가능성은 FokI 도메인의 이량체화 계면을 조작하여 절대적(obligate) 이종이량체 변이체(이것은 그 자체와 함께 아니라 단지 서로와 이량체화할 수 있음)로서도 공지된 "플러스" 및 "마이너스" 변이체를 생성함으로써 효과적으로 제거되었다. 절대적 이종이량체를 강요하는 것은 동종이량체의 형성을 예방한다. 이것은 ZFN, 뿐만 아니라 이들 FokI 변이체를 채택하는 임의의 다른 뉴클레아제의 상당히 향상된 특이성을 갖는다.
다양한 ZFN-기반 시스템은 관련 기술 분야에 공지되어 있고, 이의 변형은 정식으로 보고되어 있으며, 다수의 참조문헌은 ZFN의 설계를 안내하는 데 사용되는 규칙 및 파라미터를 기술한다; 예를 들어, 문헌[Segal 등, Proc Natl Acad Sci USA 96(6):2758-63 (1999)]; 문헌[Dreier B 등, J Mol Biol. 303(4):489-502 (2000)]; 문헌[Liu Q 등, J Biol Chem. 277(6):3850-6 (2002)]; 문헌[Dreier 등, J Biol Chem 280(42):35588-97 (2005)]; 및 문헌[Dreier 등, J Biol Chem. 276(31):29466-78 (2001)]를 참조한다.
전사 활성자-유사 이펙터 뉴클레아제(TALEN)
TALEN은 모듈 뉴클레아제의 또 다른 포맷을 나타내며, 이에 의해서 ZFN에서와 같이, 조작된 DNA 결합 도메인이 FokI 뉴클레아제 도메인에 연결되고, 한쌍의 TALEN이 협력하여 작동하여 표적화된 DNA 절단을 달성한다. 차이점은 DNA 결합 도메인의 본성 및 관련된 표적 DNA 서열 인식 특성이다. TALEN DNA 결합 도메인은 TALE 단백질로부터 유래하는데, 이것은 본래 식물 박테리아 병원균 산토모나스 종(Xanthomonas sp)에서 본래 기재되었다. TALE는 33 내지 35개의 아미노산 반복부의 탠덤 어레이를 가지며, 각각의 반복부는 일반적으로 최대 20 bp 길이인 표적 DNA 서열에서 단일 염기쌍을 인식하여, 최대 40 bp의 총 표적 서열 길이를 제공한다. 각각의 반복부의 뉴클레오타이드 특이성은 반복 가변 이중잔기(repeat variable diresidue: RVD)에 의해서 결정되는데, 이것은 자리 12 및 13에서 단지 2개의 아미노산을 포함한다. 염기 구아닌, 아데닌, 사이토신 및 티민은 4개의 RVD: 각각 Asn-Asn, Asn-Ile, His-Asp 및 Asn-Gly에 의해서 인식된다. 이것은 아연 핑거에 대해서가 아니라 훨씬 더 단순한 인식 암호를 구성하고, 따라서 뉴클레아제 설계를 위해서 후자보다 이점을 나타낸다. 그럼에도 불구하고, ZFN에서와 같이, TALEN의 단백질-DNA 상호작용은 이의 특이성에서 완전하지 않고, TALEN은 또한 FokI 도메인의 절대적 이종이량체 변이체의 사용으로부터 이익을 얻어서 표적외 활성을 감소시킨다.
촉매작용 기능이 불활성화된 FokI 도메인의 추가 변이체가 생성되었다. TALEN 또는 ZFN 쌍 중 어느 하나의 절반부가 불활성 FokI 도메인을 함유하는 경우, 단지 단일-가닥 DNA 절단(닉킹(nicking))이 DSB보다는 표적 부위에서 일어날 것이다. 그 결과는 Cas9 절단 도메인 중 하나가 비활성화된 CRISPR/Cas9/Cpf1 "닉카제" 돌연변이체의 사용과 대등하다. DNA 닉을 사용하여 DSB에서보다는 더 낮은 효율로 HDR에 의해서 게놈 편집을 유도할 수 있다. 주요 이점은 표적외 닉이 NHEJ-매개 수선-오류가 일어나기 쉬운 DSB와 달리 신속하고 정확하게 수선된다는 것이다.
다양한 TALEN-기반 시스템은 관련 기술 분야에 기술되어 있고, 이의 변형은 정식으로 보고되어 있다; 예를 들어, 문헌[Boch, Science 326(5959):1509-12 (2009); Mak 등, Science 335(6069):716-9 (2012)]; 및 문헌[Moscou 등, Science 326(5959):1501 (2009)]를 참조한다. "골든 게이트(Golden Gate)" 플랫폼 또는 코딩 반응식을 기재로 하는 TALEN의 사용이 다수의 그룹에 의해서 기술되어 있다; 예를 들어, 문헌[Cermak 등, Nucleic Acids Res. 39(12):e82 (2011)]; 문헌[Li 등, Nucleic Acids Res. 39(14):6315-25(2011)]; 문헌[Weber 등, PLoS One. 6(2):e16765 (2011)]; 문헌[Wang 등, J Genet Genomics 41(6):339-47, Epub 2014 May 17 (2014)]; 및 문헌[Cermak T 등, Methods Mol Biol. 1239:133-59 (2015)]를 참조한다.
호밍 엔도뉴클레아제(Homing Endonuclease)
호밍 엔도뉴클레아제(HE)는 긴 인식 서열(14 내지 44개의 염기쌍)을 갖고, 높은 특이성으로 DNA를 절단하는(흔히 게놈에서 독특한 부위에서) 서열-특이적 엔도뉴클레아제이다. 진핵생물, 원생생물, 박테리아, 고세균, 시아노박테리아 및 파지를 비롯한, 광범위한 숙주로부터 유래된 LAGLIDADG(서열번호6), GIY-YIG, His-Cis 박스, H-N-H, PD-(D/E)xK 및 Vsr-유사를 비롯하여, 이의 구조에 의해서 분류되는 바와 같은 HE의 적어도 6개의 공지된 패밀리가 존재한다. ZFN 및 TALEN에서와 같이 HE를 사용하여 게놈 편집에서 초기 단계로서 표적 유전자좌에서 DSB를 생성할 수 있다. 또한, 일부 자연 HE 및 조작된 HE는 DNA의 단일 가닥 만을 절단하고, 이에 의해서 부위-특이적 닉카제로서 기능한다. HE의 큰 표적 서열 및 이것이 제공하는 특이성은 이것을 부위-특이적 DSB를 생성하기 위한 매력적인 후보로 만들었다.
다양한 HE-기반 시스템이 관련 기술 분야에 기술되어 있고, 이의 변형은 정지적으로 보고된다; 예를 들어, 문헌[Steentoft 등, Glycobiology 24(8):663-80 (2014)]; 문헌[Belfort 및 Bonocora, Methods Mol Biol. 1123:1-26 (2014)]; 문헌[Hafez 및 Hausner, Genome 55(8):553-69 (2012)]; 및 그것들에 인용된 참조문헌의 검토를 참조한다.
MegaTAL / Tev-mTALEN / MegaTev
혼성 뉴클레아제의 추가 예로서, MegaTAL 플랫폼 및 Tev-mTALEN 플랫폼은 TALE DNA 결합 도메인 및 촉매작용적으로 활성인 HE의 융합을 사용하고, 조정 가능한 DNA 결합 및 TALE의 특이성 둘 모두, 뿐만 아니라 HE의 절단 서열 특이성을 이용한다; 예를 들어, 문헌[Boissel 등, NAR 42: 2591-2601 (2014)]; 문헌[Kleinstiver 등, G3 4:1155-65 (2014)]; 및 문헌[Boissel 및 Scharenberg, Methods Mol. Biol. 1239: 171-96 (2015)]를 참조한다.
추가 변형에서, MegaTev 구조는 메가뉴클레아제(Mega)와 GIY-YIG 호밍 엔도뉴클레아제 I-TevI(Tev)로부터 유래된 뉴클레아제 도메인의 융합이다. 2개의 활성 부위는 DNA 기질 상에서 약 30 bp 떨어져서 자리하며, 비-상용성 응집 단부를 갖는 2개의 DSB를 생성하며; 예를 들어, 문헌[Wolfs 등, NAR 42, 8816-29 (2014)] 참조한다. 존재하는 뉴클레아제-기반 접근법의 다른 조합이 발전될 것이고, 본 명세서에 기술된 표적화된 게놈 변형을 달성하기에 유용할 것이라는 것이 예견된다.
dCas9-FokI 또는 dCpf1-Fok1 및 다른 뉴클레아제
본 명세서에 기술된 뉴클레아제 플랫폼의 구조적 특성과 기능성 특성의 조합은 내재하는 결핍 중 일부를 잠재적으로 극복할 수 있는 게놈 편집에 대한 추가 접근법을 제공한다. 예로서, CRISPR 게놈 편집 시스템은 일반적으로 단일 Cas9 엔도뉴클레아제를 사용하여 DSB를 생성한다. 표적화의 특이성은 표적 DNA와의 왓슨-크릭 염기쌍 형성(또한 에스. 파이오게네스로부터의 Cas9의 경우에 인접한 NAG 또는 NGG PAM 서열에서 추가 2개의 염기)을 겪은 가이드 RNA에서 20 또는 22개의 뉴클레오타이드 서열에 의해서 유도된다. 이러한 서열은 인간 게놈에서 독특하기에 충분히 길지만, RNA/DNA 상호작용의 특이성은 완전하지 않고, 특별하게는 표적 서열의 5' 절반부에서 상당한 난잡성이 때때로 용인되고, 특이성을 유도하는 다수의 염기를 효과적으로 감소시킨다. 이에 대한 하나의 해결책은 Cas9 또는 Cpf1 촉매작용 기능을 완전히 비활성화시켰고 - RNA-가이드 DNA 결합 기능 만을 보유함 - 대신에 비활성화된 Cas9에 FokI 도메인을 융합시킨다; 예를 들어, 문헌[Tsai 등, Nature Biotech 32: 569-76 (2014)]; 및 문헌[Guilinger 등, Nature Biotech. 32: 577-82 (2014)]를 참조한다. FokI은 촉매작용적으로 활성이 되기 위해서 이량체화되어야 하기 때문에, 근접하게 2개의 FokI 융합부를 테더링하여 이량체를 형성하고, DNA를 절단하기 위해서 2종의 가이드 RNA가 필요하다. 이는 조합된 표적 부위에서 염기의 수를 본질적으로 2배로 하고, 이에 의해서 CRISPR-기반 시스템에 의한 표적화의 엄격성을 증가시킨다.
추가 예로서, 촉매작용적으로 활성인 HE, 예컨대 I-TevI에 대한 TALE DNA 결합 도메인의 융합은 조정 가능한 DNA 결합 및 TALE의 특이성 둘 모두, 뿐만 아니라 I-TevI의 절단 서열 특이성을 이용하고, 표적외 절단이 추가로 감소될 수 있다고 예상된다.
본 개시내용의 하나 이상의 구현예의 상세 사항이 하기 첨부된 설명에 제시되어 있다. 본원에 기재된 것과 유사하거나 동등한 임의의 물질 및 방법이 본 개시내용의 실시 또는 시험에 사용될 수 있긴 하지만, 일부 예시적인 물질 및 방법은 이제 기재된다. 본 발명의 다른 특질, 목적 및 이점은 설명으로부터 명백해질 것이다. 본 설명에서, 단수 형태는 그 문맥이 달리 명백하게 구술되지 않는 한, 복수를 포함한다. 달리 정의되지 않는 한, 본원에서 사용된 모든 기술 및 과학 용어는 본 개시내용이 속하는 당업계의 당업자에 의해 통상적으로 이해되는 바와 동일한 의미를 갖는다. 상충되는 경우, 본 설명이 우선할 것이다.
본원에 기재된 실시예 및 구현예는 단지 예시 목적이며 이에 대한 다양한 수정 및 변경이 당업자에게 제안될 것이며 본 출원 및 첨부된 청구항의 사상 및 범위 내에 포함되어야 하는 것으로 이해된다. 본원에 인용된 모든 공개, 특허, 및 특허 출원은 모든 목적을 위해 그 전체가 참조로서 본원에 포함된다.
본 개시내용의 일부 구현예는 본원에 제공되고 하기 비제한적인 실시예에 의해 추가로 예시된다.
실시예
실시예 1: 시험관내에서 Hepa1-6 세포에서 마우스 알부민 유전자의 인트론 1에서 Cas9 뉴클레아제에 의한 절단을 지향하는 gRNA의 식별
관련 전임상 동물 모델에서 평가하기 위해, 관련 전임상 동물 종으로부터의 알부민의 인트론 1에서 Cas9 뉴클레아제에 의한 효율적인 절단을 지향하는 gRNA 분자를 시험하였다. A형 혈우병의 마우스 모델이 잘 확립되어 있고(문헌[Bi L, Lawler AM, Antonarakis SE, High KA, Gearhart JD, Kazazian HH., Jr Targeted disruption of the mouse factor VIII gene produces a model of hemophilia A. (Nat Genet. 1995;10:119-21. doi: 10.1038/ng0595-119)]), 이 질환에 대한 새로운 치료적 접근법을 시험하기 위한 평가 가능한 모델 시스템을 나타낸다. 마우스 알부민의 인트론 1에서 절단하는 잠재력을 갖는 gRNA를 식별하기 위해, 인트론의 서열을, 마우스 게놈에서의 관심 서열 및 모든 관련된 서열에서 스트렙토콕커스 파이오게네스 Cas9(spCas9)에 의한 절단을 위한 잠재적인 표적일 NGG PAM 서열을 이용하여 모든 가능한 gRNA 표적 서열을 식별하는 알고리즘(예를 들어 CCTOP; https://crispr.cos.uni-heidelberg.de/)을 사용하여 분석하였다. 그 후에, 각각의 gRNA를 마우스 게놈에서의 정확한 서열 또는 관련 서열의 빈도에 기초하여 순위를 매겨, 표적외 절단의 최소의 이론적 위험을 갖는 gRNA를 식별하였다. 이러한 유형의 분석에 기초하여, mALbgRNA_T1이라고 하는 gRNA를 시험을 위해 선택하였다.
mAlbgRNA_T1은 마우스 게놈에서 단지 4개의 다른 부위와 상동성을 나타내었으며, 이들은 각각 하기 표 2에 제시된 바와 같이 4개의 뉴클레오타이드 미스매치를 나타낸다.
Figure pct00003
mALbgRNA_T1의 효율을 평가하여 마우스 세포에서 Cas9에 의한 절단을 촉진하기 위해, 마우스 간 세포 유래 세포주 Hepa1-6을 사용하였다. Hepa1-6 세포를 5% CO2 인큐베이터에서 DMEM+10% FBS에서 배양하였다. 2.4 μl의 spCas9(0.8 μg/μl) 및 3 μl의 합성 gRNA(20 μMolar) 및 7 μl의 PBS(1:5 spCas9: gRNA 비)를 혼합함으로써 스트렙토콕커스 파이오게네스 Cas9(spCas9) 단백질에 결합된 gRNA로 이루어진 RNP를 예비-형성하고 실온에서 10분 동안 인큐베이션하였다. 핵주입(nucleofection)을 위해, SF 보충 시약(Lonza)의 전체 바이얼을 SF 핵주입제 시약(Lonza)에 첨가하여, 완전 핵주입 시약을 제조하였다. 각각의 핵주입을 위해, 1x105 Hepa1-6 세포를 20 μl의 완전 핵주입 시약에 재현탁시키며, RNP를 첨가한 다음, 4D 핵주입 장치(Lonza)에 배치된 핵주입 큐벳(16웰 스트립)으로 이전시키고, 프로그램 EH-100을 사용하여 핵주입하였다. 세포를 10분 동안 휴지시킨 후, 이들 세포를 신선한 완전 배지를 갖는 적절한 크기의 플레이트로 이전시켰다. 핵주입 후 48시간째에, 세포를 수집하며, 게놈 DNA를 추출하고, Qiagen DNeasy 키트(cat 69506)를 사용하여 정제하였다.
알부민 인트론 1 내 표적 부위에서의 Cas9/gRNA 매개 절단의 빈도를 평가하기 위해, 표적 부위에 측면 근접해 있는 프라이머 쌍(MALBF3; 5' TTATTACGGTCTCATAGGGC 3' (서열번호 11) 및 MALBR5: AGTCTTTCTGTCAATGCACAC 3' (서열번호 12))을 52℃ 어닐링 온도를 사용하는 중합효소 연쇄 반응(PCR)에 사용하여, 게놈 DNA로부터 609 bp 영역을 증폭시켰다. PCR 생성물을, Qiagen PCR 정제 키트(Cat no. 28106)를 사용하여 정제하고, PCR 반응에 사용된 동일한 프라이머와 함께 상거(Sanger) 시퀀싱을 사용하여 직접적으로 시퀀싱하였다. 서열 데이터를, gRNA/Cas9 복합체에 대한 예측된 절단 부위에 존재하는 삽입 및 결실(INDELS)의 빈도를 결정한 분해에 의한 Indel의 트랙킹(TIDES: Tracking of Indels by Decomposition)이라고 하는 알고리즘에 의해 분석하였다(문헌[Brinkman 등 (2104); Nucleic Acids Research, 2014, 1]). mAlbgRNA_T1에 대한 INDEL 세대의 전체 빈도는 3개의 독립적인 실험에서 시험될 때 85% 내지 95%였으며, 이는 이들 세포의 게놈에서 gRNA/Cas9에 의한 효율적인 절단을 나타내었다. mAlb gRNA-T1로 핵주입된 Hepa1-6 세포에서의 TIDES 분석의 일례는 도 3에 도시되어 있다. 대부분의 삽입 및 결실은 1 bp 삽입 및 1 bp 결실로 구성되며, 6 bp 이하의 결실의 수는 더 작다.
실시예 2: 마우스에서 생체내에서 mAlbgRNA_T1의 절단 효율의 평가
Cas9 및 mAlbgRNA-T1을 마우스의 간세포에 전달하기 위해 지질 나노입자(LNP) 전달 비히클을 사용하였다. 뉴클레아제에 대한 내성을 향상시키기 위해 화학적으로 변형된 뉴클레오타이드를 혼입하는 sgRNA를 화학적으로 합성하였다. 일례에서 gRNA는 하기 구조: 5' usgscsCAGUUCCCGAUCGUUACGUUUUAGAgcuaGAAAuagcAAGUUAAAAUAAGGCUAGUCCGUUAUCaacuuGAAAaaguggcaccgagucggugcusususU-3'(서열번호 13)로 이루어지며, 여기서, "A, G, U, C"는 네이티브 RNA 뉴클레오타이드이며, "a, g, u, c"는 2'-O-메틸 뉴클레오타이드이고, "s"는 포스포로티오에이트 골격을 나타낸다. gRNA의 마우스 알부민 표적화 서열을 밑줄표시되어 있고, gRNA 서열의 나머지는 보편적인 스캐폴드(scaffold) 서열이다. 핵 국재화 도메인(NLS)에 융합된 spCas9 단백질을 인코딩하기 위해 spCas9 mRNA를 설계하였으며, 상기 NLS는 spCas9 단백질을 게놈 DNA의 절단이 발생할 수 있는 핵 구획 내로 수송하는 데 필요하다. Cas9 mRNA의 추가 구성요소는 리보솜 결합을 촉진하기 위해 제1 코돈 전 5' 단부에서의 KOZAK 서열, 및 일련의 A 잔기로 이루어진 3' 단부에서의 polyA 테일이다. NLS 서열을 갖는 spCas9 mRNA의 서열의 일례는 서열번호 81에 표시되어 있다. mRNA는 당업계에 잘 알려진 상이한 방법에 의해 생성될 수 있다. 본원에 사용된 이러한 방법 중 하나는, T7 중합효소 프로모터를 함유하는 플라스미드에서 mRNA의 서열이 인코딩되는 T7 중합효소를 사용하는 시험관내 전사이다. 간략하게는, T7 중합효소 및 리보뉴클레오타이드를 함유하는 적절한 완충액에서 플라스미드의 인큐베이션 시, 요망되는 단백질의 아미노산 서열을 인코딩하는 RNA 분자를 생성하였다. 반응 혼합물 내 자연 리보뉴클레오타이드 또는 화학적으로 변형된 리보뉴클레오타이드를 사용하여, 발현, 안정성 또는 면역원성의 측면에서 이점을 가질 수 있는 변형된 화학 구조를 갖거나 자연 화학적 구조를 갖는 mRNA 분자를 생성시켰다. 게다가, 각각의 아미노산에 대해 가장 빈번하게 사용되는 코돈을 이용함으로써 spCas9 코딩 서열의 서열을 코돈 용법에 대해 최적화하였다. 추가로, 코딩 서열을 최적화하여, 크립틱(cryptic) 리보솜 결합 부위 및 업스트림 개방 리딩 프레임(open reading frame)을 제거하여, spCas9 단백질에서 mRNA의 가장 효율적인 번역을 촉진하였다.
이들 연구에 사용되는 LNP의 1차 구성요소는 지질 C12-200이다(문헌[Love 등 2010, Proc Natl Acad Sci USA vol 107 1864-1869]). C12-200 지질은 고도로-하전된 RNA 분자와 복합체를 형성한다. C12-200을 1,2-디올레오일-sn-글리세로-3-포스포에탄올아민(DOPE), DMPE-mPEG2000 및 콜레스테롤과 조합하였다. 예를 들어, NanoAssemblr 장치(Precision NanoSystems)에서 제어된 조건 하에 핵산, 예컨대 gRNA 및 mRNA와 혼합되었을 때, LNP의 자가-조립이 발생하였으며, 핵산은 상기 LNP 내부에 캡슐화되었다. LNP에서 gRNA 및 Cas9 mRNA를 조립하기 위해, 에탄올 및 지질 스톡(stock)을 유리 바이얼 내로 적절하게 피펫팅하였다. DOPE, DMPE-mPEG2000 및 콜레스테롤에 대한 C12-200의 비를 조정하여, 제형을 최적화하였다. 전형적인 비는 50:10:38.5:1.5의 몰비의 C12-200, DOPE, 콜레스테롤 및 mPEG2000-DMG로 이루어졌다. gRNA 및 mRNA를 Rnase 무함유 튜브에서 100 mM Na 시트레이트 pH 3.0 및 300 mM NaCl에서 희석시켰다. NanoAssemblr 카트리지(Precision NanoSystems)를 지질 측면 상에서는 에탄올로 그리고 RNA 측면 상에서는 물로 세척하였다. 지질의 워킹 스톡(working stock)을 주사기 내로 도입하며, 공기를 주사기로부터 제거하고, 카트리지에 삽입하였다. gRNA와 Cas9 mRNA의 혼합물로 주사기를 로딩하기 위해 동일한 절차를 사용하였다. 그 후에, Nanoassemblr 진행을 표준 조건 하에 수행하였다. 그 후에, LNP 현탁액을, 4 리터의 PBS에서 4시간 동안 20 Kd 컷오프 투석 카트리지를 사용하여 투석시킨 다음, 원심분리 동안 PBS에서의 3회의 세척을 포함하여 20 Kd 컷오프 스핀 카트리지(Amicon)를 통한 원심분리를 사용하여 농축시켰다. 마지막으로, LNP 현탁액을, 0.2 μM 주사기 필터를 통해 멸균 여과하였다. 내독소 수준을 상업적인 내독소 키트(LAL 검정법)를 사용하여 체크하였으며, 입자 크기 분포를 동적 광 산란에 의해 결정하였다. 캡슐화된 RNA의 농도를 리보그린 검정법(ribogreen assay)(Thermo Fisher)을 사용하여 결정하였다. 대안적으로, gRNA 및 Cas9 mRNA를 별도로 LNP 내로 제형화한 다음, 함께 혼합한 후 세포를 배양물에서 처리하거나 동물에게 주사하였다. 별도로 제형화된 gRNA 및 Cas9 mRNA를 사용하는 것은 특정 비의 gRNA 및 Cas9 mRNA가 시험되게 하였다.
대안적인 양이온성 지질 분자를 이용한 대안적인 LNP 제형을 또한, gRNA 및 Cas9 mRNA의 생체내 전달에 사용하였다. mALB gRNA T1 및 Cas9 mRNA를 캡슐화하는 신선하게 제조된 LNP를 RNA와 1:1 질량비로 혼합하고, A형 혈우병 마우스의 꼬리 정맥 내로 주사하였다(TV 주사). 대안적으로, LNP를 안와(RO: retro orbital) 주사에 의해 투약하였다. 마우스에게 주어진 LNP의 용량은 체중 kg당 0.5 내지 2 mg의 RNA 범위였다. LNP의 주사 후 3일째에, 마우스를 희생시켰고, 간의 좌엽 및 우엽 조각 및 비장 조각을 수집하고 게놈 DNA를 각각으로부터 정제하였다. 그 후에, 게놈 DNA를 TIDES 분석을 받게 하여, 알부민 인트론 1 내 표적 부위에서 절단 빈도 및 절단 프로파일을 측정하였다. 결과의 일례는 도 4에 도시되어 있으며, 평균적으로 25%의 대립유전자를 2 mg/kg의 용량에서 절단하였다. 용량 반응을, 약 5% 절단을 초래하는 0.5 mg/kg 용량 및 약 10% 절단을 초래하는 1 mg/kg에서 관찰하였다. PBS 완충액 단독을 주사한 마우스는 TIDES 검정법에서 약 1% 내지 2%의 낮은 신호를 보여주었으며, 이는 TIDES 검정법 자체의 백그라운드의 측정치이다.
실시예 3: 인간 알부민의 인트론 1로 표적화된 sgRNA의 indel 빈도의 평가
인간 알부민 유전자의 인트론 1 내에서 스트렙토콕커스 파이오게네스 Cas9(spCas9)에 의한 절단을 위한 표적일 NGG PAM 서열을 이용하는 모든 잠재적인 gRNA 신호를, "CCTop"라고 하는 공개된 알고리즘에 기초한 "귀도(Guido)"라고 하는 전매 알고리즘(proprietary algorithm)을 사용하여 식별하였다(예를 들어, https://crispr.cos.uni-heidelberg.de/ 참조). 이 알고리즘은 인간 게놈에서 잠재적인 표적외 부위를 식별하고, 예측된 표적외 절단 잠재력에 기초하여 각각의 gRNA의 순위를 매긴다. 식별된 gRNA 서열은 하기 표에 제공된다.
Figure pct00004
5 μg/μl에서 Cas9 뉴클레아제 단백질(Platinum™, GeneArt™)을 Thermo Fisher Scientific(카탈로그 번호 A27865, Carlsbad, CA)로부터 구매한 다음, 0.83 μg/μl 또는 5.2 μM의 작업 농도까지 1:6 희석시켰다. 화학적으로 변형된 합성 단일 가이드 RNA(sgRNA)(Synthego Corp, Menlo Park, CA)를 스탁 용액으로서 TE 완충액과 함께 100 μM에서 재현탁시켰다. 대안적으로, 사용된 gRNA를 시험관내 전사(IVT)에 의해 생성할 수 있다. 이 용액을 뉴클레아제-무함유 물과 20 μM의 작업 농도로 희석시켰다.
리보뉴클레오단백질 복합체를 제조하기 위해, Cas9 단백질(12.5 pmol) 및 sgRNA (60 pmol)를 실온에서 10분 내지 20분 동안 인큐베이션하였다. 이러한 인큐베이션 동안, HepG2 세포(American Type Culture Collection, Manassas, Virginia) 또는 HuH7 세포(American Type Tissue Culture Collection, Manassas, Virginia)를 37℃에서 5분 동안 0.25%(Thermo Fisher Scientific)에서 트립신-EDTA를 사용하여 해리시켰다. 각각의 형질주입 반응은 1 x 105 세포를 함유하였으며, 실험당 적절한 수의 세포를 350xG에서 3분 동안 원심분리한 다음, 형질주입 반응당 20 μl의 Lonza SF 핵주입 + 보충 용액(카탈로그 번호 V4XC-2032, Basel, Switzerland)에 재현탁시켰다. 20 μl의 핵주입용액 내 재현탁된 세포를 RNP의 각각의 튜브에 첨가하였고, 전체 부피를 16-웰 핵주입 스트립의 하나의 웰로 이전시켰다. HepG2 또는 HuH7 세포를 Amaxa 4D-핵주입기 시스템(Lonza) 상에서 EH-100 프로그램을 사용하여 형질주입하였다. HepG2 및 HuH7는 인간 간세포의 세포주이며, 따라서 간에서 유전자를 절단하는 데 사용되는 gRNA를 평가하는 것과 관련이 있다. 형질주입 후, 세포를 핵주입 스트립에서 10분 동안 인큐베이션하며, 10% 소 태아 혈청(카탈로그 번호 10438026, Thermo Fisher Scientific)이 보충된 이글스 최소 필수 배지(Eagle's Minimum Essential Medium)(카탈로그 번호 10-009-CV, Corning, Corning, NY)로 구성된 가온 배지를 함유하는 48-웰 플레이트 내로 이전시켰다. 다음날, 세포에 신선한 배지를 재공급하였다.
형질주입 후 48시간째에, HepG2 또는 HuH7 세포를 해리시켰고, Qiagen DNeasy 키트(카탈로그 번호 69506, Hilden, Germany)를 사용하여 DNA를 추출하였다. PCR을, 추출된 게놈 DNA를 Platinum SuperFi Green PCR Master Mix(Thermo Fisher Scientific) 및 0.2 μM에서 하기 프라이머: 알부민 포워드: 5'-CCCTCCGTTTGTCCTAGCTT-3' (서열번호 14); 알부민 리버스: 5'-TCTACGAGGCAGCACTGTT-3' (서열번호 15); AAVS1 포워드:5'-AACTGCTTCTCCTCTTGGGAAGT-3' (서열번호 16); AAVS1 리버스:5'-CCTCTCCATCCTCTTGCTTTCTTTG-3'(서열번호 17)와 함께 사용하여 수행하였다. PCR 조건은 98℃(1X)에서 2분, 뒤이어 98℃에서 30초, 62.5℃ 에서 30초 및 72℃에서 1분이었다(35x). 올바른 PCR 생성물을, 1.2% E-겔(Thermo Fisher Scientific)을 사용하여 확인하였으며, Qiagen PCR 정제 키트(카탈로그 번호 28106)를 사용하여 정제하였다. 정제된 PCR 생성물을, 상응하는 PCR 생성물에 대한 포워드 프라이머 또는 리버스 프라이머를 사용하는 상거 시퀀싱을 받게 하였다. gRNA/Cas9에 대한 예측된 절단 부위에서의 삽입 또는 결실의 빈도를, Brinkman, (문헌[Brinkman, E.K., Chen, T., Amendola, M, 및 van Steensel, B. Easy quantitative assessment of genome editing by sequence trace decomposition. Nucleic Acids Research, 2014, Vol. 42, No. 22 e168 ])에 의해 기재된 바와 같이 TIDE 분석 알고리즘을 사용하여 결정하였다. 간략하게는, 크로마토그램 시퀀싱 파일을 비-처리된 세포로부터 유래된 대조군 크로마토그램과 비교하여, 일탈적인(aberrant) 뉴클레오타이드의 상대 존재비(relative abundance)를 결정하였다. 그 결과는 표 4에 요약되어 있다. 또한, 관련된 전임상 종, 예컨대 비-인간 영장류에서 상동성인 인간에서 gRNA 서열을 식별하는 것이 흥미롭다. 영장류 마카카 파스시쿨라리스마카카 물라타의 알부민 인트론 1 서열과 인간 알부민 인트론 1에서 식별된 잠재적인 gRNA 서열의 정렬은 표 4에 나타낸 바와 같이 완벽한 매치 또는 1 내지 2개의 뉴클레오타이드 미스매치를 갖는 몇몇 gRNA 분자를 식별하였다. IVT 가이드를 사용하여 생성된 INDEL 빈도를 HuH7 세포에서 측정하였고, 합성 가이드로 생성된 INDEL 빈도를 HepG2 세포에서 측정하였다. HuH7 세포에서 상이한 가이드에 의해 생성된 INDEL 빈도는 0.3% 내지 64% 범위였으며, 이는 알부민의 인트론 1에서 효율적으로 절단하는 gRNA가 인실리코 알고리즘에 기초한 열린 서열에 순수하게 기초하여 선택될 수 없을 것임을 실증한다. HuH7 세포에서 IVT gRNA 및 HepG2 세포에서 합성 gRNA의 INDEL 빈도에 기초하여, 40% 초과의 절단 빈도를 갖는 몇몇 gRNA를 식별하였다. 특히 흥미로운 것은, 합성 가이드로서 46% 및 43% 절단을 나타낸 gRNA T5 및 T12이고, 인간 및 영장류에서 100% 동일하다.
Figure pct00005
Figure pct00006
실시예 4: 마우스 알부민 인트론 1에서 관심 치료 유전자의 표적화된 통합
질환을 치료하는 데 필요한 치료 단백질을 발현시키는 접근법은 해당 단백질을 인코딩하는 유전자의 코딩 서열 또는 cDNA를 생체내에서 간 내 알부민 좌위 내로 표적화된 통합시키는 것이다. 표적화된 통합은, 공여체 DNA 주형이 이중 가닥 절단부의 부위에서 유기체의 게놈 내로 통합되는 과정이며, 이러한 통합은 HDR 또는 NHEJ에 의해 발생한다. 이러한 접근법은 서열 특이적 DNA 뉴클레아제 및 치료 유전자를 인코딩하는 공여체 DNA 주형을 유기체의 세포 내로 도입하는 것을 사용한다. 본 발명자들은, 알부민 인트론 1로 표적화된 CRISPR-Cas9 뉴클레아제가 공여체 DNA 주형의 표적화된 통합을 촉진할 수 있는지 평가하였다. 공여체 DNA 주형은 AAV 바이러스, 예를 들어 마우스의 경우 AAV8 바이러스에서 전달되며, 이는 정맥내 주사 후 간의 간세포를 우선적으로 형질도입시킨다. 서열 특이적 gRNA mAlb_T1 및 Cas9 mRNA는, gRNA 및 Cas9 mRNA를 캡슐화하는 LNP 제형의 정맥내 주사 또는 RO 주사에 의해 동일한 마우스의 간의 간세포로 전달된다. 하나의 경우, AAV8-공여체 주형은 LNP 전에 마우스에게 주사되는데, AAV에 의한 간세포의 형질도입이 수시간 내지 수일이 소요되고 전달된 공여체 DNA가 수주 내지 수개월 동안 간세포의 핵에서 안정하게 유지되기 때문이다. 대조적으로, LNP에 의해 전달되는 gRNA 및 mRNA는 RNA 분자의 고유한 불안정성으로 인해 단지 1일 내지 4일 동안 간세포에서 지속될 것이다. 또 다른 경우, AAV-공여체 주형 후 1일 내지 7일 사이에 LNP를 마우스에게 주사한다. 공여체 DNA 주형은 (i) 통합을 최대화하고 (ii) 인코딩된 치료 단백질의 발현을 최대화하기 위해 몇몇 설계 특질을 혼입한다.
통합이 HDR을 통해 발생하기 위해서는 상동성 아암은 치료 유전자 카세트의 어느 한 면에 포함될 필요가 있다. 이들 상동성 아암은 마우스 알부민 인트론 1 내의 gRNA 절단 부위의 어느 한 면의 서열로 이루어진다. 더 긴 상동성 아암이 일반적으로, 더욱 효율적인 HDR을 촉진하는 한편, 상동성 아암의 길이는 약 4.7 내지 5.0 Kb의 AAV 바이러스에 대한 패키징 한계에 의해 제한될 수 있다. 그러므로, 상동성 아암의 최적 길이를 식별하는 것은 시험을 필요로 한다. 통합은 또한, 이중 가닥 DNA 공여체의 자유 단부가 이중 가닥 절단부의 말단에 결합되는 NHEJ 기전을 통해 발생할 수 있다. 이러한 경우, 상동성 아암은 필요하지 않다. 그러나, gRNA 절단 부위를 유전자 카세트에 혼입하는 것은 선형 이중 가닥 단편을 생성시킴으로써 통합 효율을 향상시킬 수 있다. 리버스 배향에서 gRNA 절단 부위를 사용함으로써, 요망되는 포워드 배향에서의 통합이 선호될 수 있다. FVIII의 퓨린 절단 부위에서의 돌연변이의 도입은, 단백질의 발현 동안 퓨린에 의해 절단될 수 없는 FVIII 단백질을 생성시켜, 완전한 기능성을 유지하는 한편 혈장에서 향상된 안정성을 갖는 것으로 나타난 하나의 사슬 FVIII 폴리펩타이드를 초래할 수 있다.
알부민 인트론 1에서 FVIII 유전자를 통합하도록 설계된 예시적인 DNA 공여체는 도 5에 도시되어 있다. 특정 공여체 설계의 서열은 서열번호 87-92로부터의 서열에 있다.
FVIII 공여체 DNA로 패키징된 AAV8 또는 다른 AAV 혈청형 바이러스의 생성은 잘 확립된 바이러스 패키징 방법을 사용하여 달성된다. 하나의 이러한 방법에서, HEK293 세포를 3개의 플라스미드로 형질주입하는데, 1개의 플라스미드는 AAV 패키징 단백질을 인코딩하며, 두번째는 아데노바이러스 헬퍼 단백질을 인코딩하고, 세번째는 AAV ITR 서열에 의해 측면 근접해 있는 FVIII 공여체 DNA 서열을 함유한다. 형질주입된 세포는, 첫번째 플라스미드 상에서 인코딩된 AAV 캡시드 단백질의 조성에 의해 명시된 혈청형의 AAV 입자를 발생시킨다. 이들 AAV 입자를 세포 상층액 또는 상층액으로부터 수집하고, CsCl 구배 또는 이오딕사놀(Iodixanol) 구배에 걸쳐 또는 요망되는 바와 같은 다른 방법에 의해 세포를 용해시키고 정제하였다. 공여체 DNA의 게놈 복사체의 수를 정량적 PCR(Q-PCR)에 의해 측정함으로써, 정제된 바이러스 입자를 정량화한다.
gRNA 및 Cas9 mRNA의 생체내 전달은 다양한 방법에 의해 달성된다. 제1 경우에, gRNA 및 Cas9 단백질은 AAV 바이러스 벡터로부터 발현된다. 이러한 경우, gRNA의 전사는 U6 프로모터로부터 구동되고, Cas9 mRNA 전사는 유비쿼터스 프로모터, 예컨대 EF1-알파 또는 간 특이적 프로모터 및 인핸서, 예컨대 트랜스티레틴(transthyretin) 프로모터/인핸서로부터 구동된다. spCas9 유전자(4.4 Kb)의 크기는 spCas9 및 gRNA 카세트를 단일 AAV에 포함시키는 것을 배제하므로, gRNA 및 spCas9를 전달하기 위해 별도의 AAV를 필요로 한다. 제2 경우에, 바이러스 게놈의 자가-불활성화를 촉진하는 서열 요소를 갖는 AAV 벡터를 사용한다. 이 경우, 벡터 DNA에 gRNA에 대한 절단 부위를 포함시키는 것은 생체내에서 벡터 DNA의 절단을 초래한다. 절단될 때 Cas9의 발현을 차단하는 위치에서 절단 부위를 포함시킴으로써, Cas9 발현을 더 짧은 기간으로 제한한다. gRNA 및 Cas9를 생체내에서 세포에 전달하기 위한 제3의 대안적인 접근법에서, 비-바이러스 전달 방법을 사용한다. 일례에서, 지질 나노입자(LNP)를 비-바이러스 전달 방법으로서 사용한다. 몇몇 상이한 이온화 가능한 양이온성 지질은 LNP에 사용되기 위해 입수 가능하다. 이들은 다른 것들 중에서도 C12-200(문헌[Love 등 (2010), Proc Natl Acad Sci USA vol. 107, 1864-1869]), MC3, LN16, MD1을 포함한다. 하나의 유형의 LNP에서, GalNac 모이어티는 LNP의 외부에 부착되고 아시알릴로당단백질 수용체를 통해 간 내로의 흡수를 위한 리간드로서 작용한다. 임의의 이들 양이온성 지질은 간으로의 gRNA 및 Cas9 mRNA의 전달을 위한 LNP를 제형화하는 데 사용된다.
FVIII의 표적화된 통합 및 발현을 평가하기 위해, A형 혈우병 마우스에게 우선 AAV 바이러스, 예를 들어, FVIII 공여체 DNA 주형을 캡슐화하는 AAV8 바이러스를 정맥내 주사한다. AAV의 용량은 마우스당 1010 내지 1012 벡터 게놈(VG)이며, 이는 4x1011 내지 4 x1013 VG/kg과 동등하다. AAV-공여체의 주사 후 1시간 내지 7일 사이에, 동일한 마우스에게 gRNA 및 Cas9 mRNA를 캡슐화하는 LNP의 iv 주사를 제공한다. Cas9 mRNA 및 gRNA를 별도의 LNP 내로 캡슐화한 다음, 혼합한 후에 1:1의 RNA 질량비에서 주사한다. 주어진 LNP의 용량은 체중 kg당 0.25 내지 2 mg의 RNA 범위였다. LNP를 꼬리 정맥 주사에 의해 또는 안와 주사에 의해 투약한다. 표적화된 통합 및 FVIII 단백질 발현의 효율에 미치는 AAV 주사와 비교하여 LNP 주사의 시간의 영향을, AAV 투약 후 1시간, 24시간, 48시간, 72시간, 96시간, 120시간, 144시간 및 168시간의 시험 시간에 의해 평가한다.
또 다른 예에서, 공여체 DNA 주형을, LNP인 비-바이러스 전달 시스템을 사용하여 생체내에서 전달한다. DNA 분자를 상기 기재된 것과 유사한 LNP 입자 내로 캡슐화하고, iv 주사 후 간에서 간세포에 전달한다. 엔도솜으로부터 세포질로의 DNA의 탈출이 상대적으로 효율적으로 발생하는 한편, 핵 내로의 큰 하전된 DNA 분자의 전좌는 효율적이지 않다. 하나의 경우, 핵 내로의 DNA의 전달을 향상시키는 방식은, 공여체 DNA 주형 내로의 AAV ITR의 혼입에 의해 AAV 게놈을 모방하는 것이다. 이러한 경우, ITR 서열은 DNA를 안정화시키거나 그렇지 않으면 핵 전좌를 향상시킨다. 공여체 DNA 주형 서열로부터의 CG 디뉴클레오타이드(CpG 서열)의 제거 또한, 핵 전달을 향상시킨다. CG 디뉴클레오타이드를 함유하는 DNA는 선천적 면역 시스템에 의해 인식되고 무효화된다. 인공 DNA 서열에 존재하는 CpG 서열의 제거는 비-바이러스 벡터 및 바이러스 벡터에 의해 전달되는 DNA의 지속성을 향상시킨다. 코돈 최적화 과정은 일반적으로, CG 디뉴클레오타이드의 함량을 증가시키는 데, 왜냐하면 많은 경우 가장 빈번한 코돈이 제3 위치에 C 잔기를 갖고 있으며 이는 다음 코돈이 G로 시작할 때 CG를 생성시키는 기회를 증가시키기 때문이다. 1시간 내지 5일 이후에 이어지는 공여체 DNA 주형의 LNP 전달과 gRNA 및 Cas9 mRNA를 함유하는 LNP의 전달의 조합을 A형 혈우병 마우스에서 평가한다.
gRNA/Cas9 및 공여체 DNA 주형의 생체내 전달의 효과성을 평가하기 위해, 주사맞은 A형 혈우병 마우스를 제2 구성요소의 투약 후 약 7일에 시작하는 상이한 시기에 혈액 내 FVIII 수준에 대해 평가한다. 혈액 시료를 RO 출혈에 의해 수집하며, 혈장을 분리하고 발색 검정법(Diapharma)을 사용하여 FVIII 활성에 대해 검정하였다. FVIII 단백질 표준을 사용하여 검정법을 보정하고 혈액 내 FVIII 활성의 ml당 단위를 계산한다.
FVIII mRNA의 발현을 또한, 연구 종료 시 마우스의 간에서 측정한다. 마우스의 간으로부터 추출된 총 RNA를 알부민 mRNA 및 FVIII mRNA의 수준에 대해 Q-PCR을 사용하여 검정한다. 치료받지 않은 마우스와 비교할 때 알부민 mRNA에 대한 FVIII mRNA의 비는, 하이브리드 알부민-FVIII mRNA를 생성하기 위해 선임(co-opt)되었던 알부민 전사물의 %의 지표(indication)이다.
치료받은 마우스의 간으로부터의 게놈 DNA를 구체적으로 알부민 인트론 1 내의 gRNA의 표적 부위에서 표적화된 통합 사건에 대해 평가한다. PCR 프라이머는 예측된 표적화된 통합의 종료 시 연접 단편을 증폭시키도록 설계된다. 이들 프라이머는 포워드 배향과 리버스 배향 둘 다에서 통합을 검출하도록 설계된다. PCR 생성물의 시퀀싱은, 예상된 통합 사건이 발생하였는지를 확인시켜 준다. 표적화된 통합을 겪은 알부민 대립유전자의 백분율을 정량화하기 위해, 예상된 연접 단편에 상응하는 표준을 합성한다. 상이한 농도에서 치료받지 않은 마우스로부터의 게놈 DNA에서 스파이크되고(spiked) 동일한 PCR 반응을 받았을 때, 표준 곡선이 생성되고 사용되어, 치료받은 마우스로부터의 시료에서 통합 사건을 갖는 대립유전자의 복사 수(copy number)를 계산한다.
실시예 5: 영장류 알부민 인트론 1에서 표적화된 통합
마우스에 대해 실시예 4에서 기재된 동일한 방법을, 영장류의 알부민 인트론 1을 표적화하는 gRNA를 사용하여 영장류 종에 적용한다. AAV8 또는 LNP를 사용하여, 우선 공여체 DNA 주형을 iv 주사에 의해 전달한다. 사용된 용량은 마우스에서 성공적인 것으로 밝혀진 용량에 기초한다. 후속적으로, 동일한 영장류에게 gRNA 및 Cas9 mRNA를 캡슐화하는 LNP의 iv 주사를 제공한다. 마우스에서 효과적인 것으로 밝혀진 동일한 LNP 제형 및 용량을 사용한다. 영장류의 A형 혈우병 모델이 존재하지 않기 때문에, FVIII 단백질은 인간 FVIII 특이적 ELISA 검정법을 사용하여 측정될 필요가 있다. 실시예 4에 기재된 표적화된 통합 및 FVIII mRNA 수준의 동일한 분자적 분석을 영장류에서 수행한다. 영장류는 임상 평가로의 번역을 가능하게 하는 양호한 전임상 모델이다.
실시예 6: 인간 1차 간세포에서 gRNA/Cas9에 의한 표적상 및 표적외 절단 및 표적화된 통합의 평가
1차 인간 간세포는, 환자의 간으로 전달될 gRNA/Cas9의 약효 및 표적외 절단의 평가에 가장 관련된 세포 유형이다. 이들 세포를 제한된 기간 동안 배양물에서 부착성 단일층(monolayer)으로서 성장시킨다. 방법은 부착성 세포를 mRNA, 예를 들어 Message Max(Thermo Fisher)로 형질주입하기 위해 확립되었다. Cas9 mRNA와 gRNA의 혼합물에 의한 형질주입 후, 표적상 절단 효율을 TIDES 분석을 사용하여 측정한다. 게놈 DNA의 동일한 시료를 표적외 분석을 받게 하여, gRNA/Cas9 복합체에 의해 절단된 게놈 내 추가 부위를 식별하였다. 하나의 이러한 방법은 "GuideSeq"(문헌[Tsai 등 Nat Biotechnol. 2015 Feb;33(2):187-197])이다. 다른 방법은 딥 시퀀싱(deep sequencing), 전체 게놈 시퀀싱(wholde genome Sequencing), ChIP-seq(문헌[Nature Biotechnology 32,677-683 2014]), BLESS(문헌[2013 Crosetto doi:10.1038/nmeth.2408]), 문헌[2015 Frock doi:10.1038/nbt.3101]에 기재된 바와 같은 고처리량, 게놈-와이드, 전좌 시퀀싱(HTGTS: high-throughput, genome-wide, translocation sequencing), 디게놈-seq(Digenome-seq)(문헌[2015 Kim doi:10.1038/nmeth.3284]), 및 IDLV(문헌[2014 Wang doi:10.1038/nbt.3127])을 포함한다.
1차 인간 간세포를, 공여체 DNA 주형을 함유하는 AAV 바이러스에 의해 형질도입한다. 특히, AAV6 또는 AAVDJ 혈청형은 배양물에서 세포를 형질주입하는 데 특히 효율적이다. AAV-DAN 공여체에 의한 형질도입 후 1시간과 48시간 사이에, 세포를 그 후에 gRNA 및 Cas9 mRNA로 형질주입하여 표적화된 통합을 유도한다. 표적화된 통합 사건을, 실시예 4에 기재된 동일한 PCR 기초 접근법을 사용하여 측정한다.
실시예 7: 배양물 내 1차 인간 간세포의 인간 알부민 인트론 1에서 효율적으로 절단하는 가이드 RNA의 식별 및 선택
4개의 gRNA(T4, T5, T11, T13)를, 비-인간 영장류와의 완벽한 상동성을 갖고 HuH7 및 HepG2 세포(표 4)에서의 절단 효율에 대한 스크리닝에 기초하여, 1차 인간 간세포에서의 절단 효율을 평가하기 위해 선택하였다. 1차 인간 간세포(BioIVT)를 해동시키며, 동결보존된 간세포 회수 배지(CHRM)(Gibco)로 이전시키고, 저속에서 펠렛화한 다음, InVitro GRO™ CP 배지(BioIVT) + Torpedo™ 항생제 믹스(BioIVT)에서 콜라겐 IV(Corning)로 예비-코팅된 24-웰 플레이트에 0.7x106 세포/ml의 밀도로 평판배양하였다. 플레이트를 37℃에서 5% CO2에서 인큐베이션하였다. 세포가 부착된 후(평판배양 후 3시간 내지 4시간째), 플레이트에 부착되지 않은 사멸된 세포를 신선한 가온 완전 배지를 첨가하여 세척해 낸 다음, 세포를 5% CO2, 37℃에서 인큐베이션하였다. 세포를 형질주입하기 위해, Cas9 mRNA(Trilink) 및 가이드 RNA(Synthego Corp, Menlo Park, CA)를 얼음 상에서 해동시킨 다음, 웰당 0.6 ug mRNA 및 0.2 ug 가이드에서 30 μl OptiMem 배지(Gibco)에 첨가하였다. 총 핵산 중량에 대해 2:1 부피에서 30 μl OptiMem에서 희석된 MessengerMax(ThermoFisher)를 Cas9 mRNA/gRNA OptiMem 용액과 함께 실온에서 20분 동안 인큐베이션하였다. 혼합물을 24웰 플레이트에 배양된 간세포의 웰당 500 μl의 간세포 평판배양 배지에 적가하고, 세포를 5% CO2, 37℃에서 인큐베이션하였다. 세포를 세척하고, 다음날 아침 재공급하였으며, 형질주입 후 48시간째에 200 μl의 가온 0.25% 트립신-EDTA(Gibco)를 각각의 웰에 첨가하고 37℃에서 5-10분 동안 인큐베이션함으로써 게놈 DNA 추출을 위해 수집하였다. 일단 세포가 탈리(dislodge)되면, 200 μl FBS(Gibco)를 첨가하여 트립신을 불활성화시켰다. 1 ml PBS(Gibco)에 첨가한 후, 세포를 1200 rpm에서 3분 동안 펠렛화한 다음 50 μl PBS에 재현탁시켰다. MagMAX DNA Multi-Sample Ultra 2.0 키트(Applied Biosytems)를 상기 키트 내의 설명서에 따라 사용하여 게놈 DNA를 추출하였다. 게놈 DNA 품질 및 농도를 분광광도계를 사용하여 분석하였다. TIDE 분석을 위해, 게놈 DNA를 예측된 표적상 절단 부위의 측면 근접해 있는 프라이머(AlbF: CCCTCCGTTTGTCCTAGCTTTTC 및 AlbR: CCAGATACAGAATATCTTCCTCAACGCAGA) 및 Platinum PCR SuperMix High Fidelity(Invitrogen)를 사용하여 35 사이클의 PCR 및 55℃의 어닐링 온도를 사용하여 PCR 증폭시켰다. PCR 생성물을 우선 아가로스 겔 전기영동에 의해 분석하여, 올바른 크기의 생성물(1053 bp)이 생성되었음을 확인한 다음, 프라이머(For: CCTTTGGCACAATGAAGTGG, rev: GAATCTGAACCCTGATGACAAG)를 사용하여 정제하고 시퀀싱하였다. 서열 데이터를, Tsunami라고 하는 TIDES 알고리즘의 변형된 버전을 사용하여 분석하였다(문헌[Brinkman 등 (2104); Nucleic Acids Research, 2014, 1]). 이는, gRNA/Cas9 복합체에 대한 예측된 절단 부위에 존재하는 삽입 및 결실(INDELS)의 빈도를 결정한다.
표준 20개 뉴클레오타이드 표적 서열 또는 T4, T5, T11, 및 T13 가이드(AxoLabs, Kulmbach Germany, 또는 Synthego Corp, Menlo Park, CA에서 화학적으로 합성됨)의 19개 뉴클레오타이드 표적 서열(5' 말단에서 1 bp 더 짧음)을 함유하는 가이드 RNA를 시험하였다. 19 뉴클레오타이드 gRNA는 더욱 서열 특이적일 수 있지만, 더 짧은 가이드는 더 낮은 약효를 가질 수 있다. 인간 AAVS1 좌위 및 인간 보체 인자를 표적화하는 대조군 가이드를 공여체간 비교를 위해 포함시켰다. 알부민 인트론 1에서 표적 부위에서의 INDEL 빈도를, 형질주입 후 48시간째에 TIDES 방법을 사용하여 측정하였다. 도 6은 4명의 상이한 인간 공여체로부터의 1차 간세포의 형질주입 결과를 요약한다. 그 결과는, 상이한 가이드에 대해 20% 내지 80% 범위의 절단 효율을 실증한다. 각각의 알부민 gRNA의 20개 뉴클레오타이드 버전은 19개 뉴클레오타이드 변이체보다 일관적으로 더욱 강력하였다. 20개 뉴클레오타이드 gRNA의 우수한 약효는 임의의 잠재적인 이익을 상쇄시킬 수 있고, 19개 뉴클레오타이드 gRNA는 표적외 절단의 측면을 가질 수 있다. 가이드 RNA T4는 약 60%의 INDEL 빈도를 갖는 4개의 세포 공여체에 걸쳐 가장 일관된 절단을 나타내었다. gRNA T4, T5, T11 및 T13을 표적외 분석에 선택하였다.
실시예 8: 인간 알부민 가이드 RNA에 대한 표적외 부위의 식별
CRISPR/Cas9에 대한 표적외 부위의 식별을 위한 2개 접근법은 아브이니티오(ab initio) 예측 및 경험적 검출이다. 가이드 RNA에 의한 Cas9 절단 부위의 사양은, Cas9 절단이 가이드 RNA 서열과 게놈 사이에서의 미스매칭을 용인하므로 불완전한 과정이다. 상이한 가이드의 안전성 위험을 이해하고 가장 선호할 만한 표적외 프로파일을 갖는 가이드를 선택하기 위해서는 Cas9 절단 부위의 스펙트럼을 아는 것이 중요하다. 예측 방법은 표적외 예측에 대한 CCTop 알고리즘으로부터 채택된 소프트웨어 툴인 귀도(Guido)에 기초한다(Stemmer , 2015). 귀도는 인간 게놈의 전체 GRCh38/hg38 빌드(build)와 가이드 RNA 사이의 상동성에 대해 검색함으로써 잠재적인 표적외 절단 부위를 식별하기 위해 보타이(Bowtie) 1 알고리즘을 사용한다(Langmead , 2009). 귀도는 가이드 RNA에 대해 5개 이하의 미스매치를 갖는 서열을 검출하여, PAM-근접 상동성 및 올바르게 위치한 NGG PAM을 우선화시킨다. 부위를 이의 미스매치의 수 및 위치에 의해 순위를 매겼다. 각각의 진행에 대해, 가이드 서열뿐만 아니라 게놈 PAM을 연쇄화시키고 디폴트 매개변수와 함께 진행시킨다. 3개 이하의 미스매치를 갖는 상위 히트(top hit)는 알부민 가이드 T4, T5, T11 및 T13에 대해 하기 표 5 내지 8에 나타나 있다. 각각의 표에서 첫번째 줄은 인간 게놈 내 표적상 부위를 나타내며, 하기 라인은 예측된 표적외 부위를 나타낸다.
Figure pct00007
Figure pct00008
Figure pct00009
Figure pct00010
게다가, 인간 간 세포에서 인간 알부민 gRNA T4, T5, T11, T13에 대한 표적외 부위를, GUIDE-seq라고 하는 방법을 사용하여 식별하였다. GUIDE-seq(Tsai 2015)는 표적외 절단 부위를 찾는 경험적 방법이다. GUIDE-seq는 염색체 DNA 내 이중 가닥 절단부의 부위에서 올리고뉴클레오타이드의 자발적 캡처에 의존한다. 간략하게는, 관련 세포를 gRNA/Cas9 복합체로 형질주입한 후, 이중 가닥 올리고뉴클레오타이드 게놈 DNA를 세포로부터 정제하며, 초음파처리하고, 일련의 어댑터 리게이션을 수행하여 라이브러리를 생성시켰다. 올리고뉴클레오타이드-함유 라이브러리를 고처리량 DNA 시퀀싱을 받게 하고, 결과물을 디폴트 GUIDE-seq 소프트웨어로 처리하여, 올리고뉴클레오타이드 캡처 부위를 식별하였다.
상세하게는, 2개의 상보적인 단일 가닥 올리고뉴클레오타이드를 89℃까지 가열한 다음 실온까지 서서히 냉각시켜 어닐링시킴으로써 이중 가닥 GUIDE-seq 올리고를 생성시켰다. 240 pmol의 가이드 RNA(Synthego Corp, Menlo Park, CA) 및 48 pmol의 20 μMolar Cas9 TruCut(ThermoFisher Scientific)를 4.8 uL의 최종 부피에서 혼합함으로써 RNP 복합체를 제조하였다. 별도의 튜브에서 4 μl의 10 μMolar GUIDEse 이중 가닥 올리고뉴클레오타이드를 1.2 μl의 RNP 믹스와 혼합한 다음, 핵주입 카세트(Lonza)에 첨가하였다. 여기에 16.4 μl의 Nucleofector SF 용액(Lonza) 및 3.6 μl의 보충제(Lonza)를 첨가하였다. 부착성 배양물로서 성장된 HepG2 세포를 트립신으로 처리하여, 이들을 플레이트로부터 방출시킨 다음, 트립신의 탈활성화 후 펠렛화하고 Nucleofector 용액에서 12.5 e6 세포/ml로 재현탁시키고 20 μl(2.5 e5 세포)를 각각의 핵주입 큐벳에 첨가하였다. 핵주입을, 4-D 핵주입기 유닛(Lonza)에서 EH-100 세포 프로그램으로 수행하였다. 실온에서 10분 동안 인큐베이션 후, 80-μl의 완전 HepG2 배지를 첨가하고, 세포 현탁액을 24웰 플레이트의 웰에 배치시키고 37℃, 5% CO2에서 48시간 동안 인큐베이션하였다. 세포를 트립신으로 방출시키며, 원심분리(300 g 10분)에 의해 펠렛화한 다음, 게놈 DNA를 DNAeasy 혈액 및 조직 키트(Qiagen)를 사용하여 추출하였다. 인간 알부민 인트론 1 영역을, 프라이머 AlbF(CCCTCCGTTTGTCCTAGCTTTTC) 및 AlbR(CCAGATACAGAATATCTTCCTCAACGCAGA) 및 Platinum PCR SuperMix High Fidelity(Invitrogen)를 사용하여 35 사이클의 PCR 및 55℃의 어닐링 온도를 사용하여 PCR 증폭시켰다. PCR 생성물을 우선 아가로스 겔 전기영동에 의해 분석하여, 올바른 크기의 생성물(1053 bp)이 생성되었음을 확인한 다음, 프라이머(For: CCTTTGGCACAATGAAGTGG, rev: GAATCTGAACCCTGATGACAAG)를 사용하여 직접적으로 시퀀싱하였다. 서열 데이터를, Tsunami라고 하는 TIDES 알고리즘의 변형된 버전을 사용하여 분석하였다(문헌[Brinkman 등 (2104); Nucleic Acids Research, 2014, 1]). 이는, gRNA/Cas9 복합체에 대한 예측된 절단 부위에 존재하는 삽입 및 결실(INDEL)의 빈도를 결정한다. Tsai 에 의해 기재된 프로토콜과 비교하여, 본 발명자들은 40 pmol(~1.67 μM) 캡처 올리고뉴클레오타이드와 함께 GUIDE-seq를 수행하여, 표적외 절단 부위 식별의 민감성을 증가시켰다. 대략 0.01%의 민감성을 달성하기 위해, 본 발명자들은 형질주입당 최소 10,000개의 독특한 표적상 서열 판독물을 최소 50%의 표적상 절단으로 정의하였다. RNP의 형질주입이 없는 시료를 병행하여 처리하였다. RNP-함유 시료와 RNP-미접촉(naive) 시료 둘 다에서 확인되는 부위(+/-1 kb)를 추가 분석으로부터 배제한다.
GUIDE-seq를 인간 간종양 세포주 HepG2에서 수행하였다. HepG2에서, 표적상 부위에서의 GUIDE-seq 올리고뉴클레오타이드의 캡처는 70% 내지 200%의 NHEJ 빈도 범위에 있었으며, 이는 효율적인 올리고 캡처를 실증하였다.
공통 어댑터(Common Adapter)를, 8-량체 분자 지수(molecular index)를 함유하는 시료 바코드 어댑터(A01 - A16) 각각에 어닐링함으로써 Y-어댑터를 제조하였다. RNP로 핵주입되었던 HepG2 세포로부터 추출된 게놈 DNA 및 가이드Dseq 올리고를 Qubit를 사용하여 정량화하고, 모든 시료를 120 uL 부피 TE 완충액에서 400 ng까지 정상화하였다. 게놈 DNA를, Covaris S220 초음파처리기에 대한 표준 작동 절차에 따라 200 bp의 평균 길이까지 전단시켰다. 평균 단편 길이를 확인하기 위해, 1 uL의 시료를 TapeStation 상에서 제조업체 프로토콜에 따라 분석하였다. 전단된 DNA의 시료를, AMPure XP SPRI 비드를 제조업체 프로토콜에 따라 사용하여 세정하고, 17 uL의 TE 완충액에서 용출시켰다. 단부 수선 반응을 게놈 DNA 상에서 튜브당 22.5 uL의 총 부피에 대해 1.2 μl의 dNTP 믹스(5 mM 각각 dNTP), 3 μl의 10 x T4 DNA 리가제 완충액, 2.4 μl의 End-Repair Mix, 2.4 μl의10x Platinum Taq 완충액(Mg2+ 무첨가), 및 0.6 μl의Taq 중합효소(비-핫스타트(non-hotstart)) 및 14 uL 전단 DNA 시료(이전 단계로부터)를 혼합함으로써 수행하고, 서모사이클러(12℃ 15분; 37℃ 15분; 72℃ 15분; 4℃ 유지)에서 인큐베이션하였다. 여기에 1 μl 어닐링된 Y 어댑터(10 μM), 2 μl T4 DNA 리가제를 첨가하고, 혼합물을 서모사이클러(16℃, 30분; 22℃, 30분; 4℃ 유지)에서 인큐베이션하였다. 시료를, AMPure XP SPRI 비드를 제조업체 프로토콜에 따라 사용하여 세정하고, 23 uL의 TE 완충액에서 용출시켰다. 1 uL의 시료를 TapeStation 상에서 제조업체 프로토콜에 따라 분석하여, 단편에의 어댑터의 리게이션을 확인하였다. GUIDEse 라이브러리를 제조하기 위해, 14 μl 뉴클레아제-무함유 H2O, 3.6 μl 10 x Platinum Taq 완충액, 0.7μl dNTP 믹스(각각 10 mM), 1.4 μl MgCl2, 50 mM, 0.36 μl Platinum Taq 중합효소, 1.2 μl 센스 또는 안티센스 유전자 특이적 프라이머(10 μM), 1.8 μl TMAC (0.5M), 0.6 μl P5_1(10 μM) 및 10 μl의 이전 단계로부터의 시료를 함유하는 반응을 제조하였다. 이 믹스를 서모사이클러(95℃ 5분, 그 후에 15 사이클의 95℃ 30초, 70℃ (사이클당 마이너스 1℃) 2분 동안, 72℃ 30초, 뒤이어 10 사이클의 95℃ 30초, 55℃ 1분, 72℃ 30초, 뒤이어 72℃ 5분)에서 인큐베이션하였다. PCR 반응을, AMPure XP SPRI 비드를 제조업체 프로토콜에 따라 사용하여 세정하고, 15 uL의 TE 완충액에서 용출시켰다. 1 uL의 시료를 TapeStation 상에서 제조업체의 프로토콜에 따라 체크하여 시료 진행을 추적하였다. 6.5 μl 뉴클레아제-무함유 H2O, 3.6 μl 10x Platinum Taq 완충액 (Mg2+ 무함유), 0.7 μl dNTP 믹스 (각각 10 mM), 1.4 μl MgCl2 (50mM), 0.4 μl Platinum Taq 중합효소, 1.2 μl의 유전자 특이적 프라이머 (GSP) 2 (센스; + 또는 안티센스; -), 1.8 μl TMAC (0.5M), 0.6μl P5_2 (10 μM) 및 15μl의 이전 단계로부터의 PCR 생성물을 혼합함으로써 제2 PCR을 수행하였다. GSP1+를 제1 PCR에 사용한다면, GSP2+를 PCR2에서 사용하였다. GSP1- 프라이머를 제1 PCR 반응에 사용한다면, GSP2- 프라이머를 이 제2 PCR 반응에 사용하였다. 1.5 μl의 P7 (10 μM)를 첨가한 후, 반응을 서모사이클러를 하기 프로그램: 95℃ 5분, 그 후에 15 사이클의 95℃ 30초, 70℃ (사이클당 마이너스 1℃) 2분 동안, 72℃ 30초, 뒤이어 10 사이클의 95℃ 30초, 55℃ 1분, 72℃ 30초, 뒤이어 72℃ 5분에서 인큐베이션하였다. PCR 반응을, AMPure XP SPRI 비드를 제조업체 프로토콜에 따라 사용하여 세정하고, 30 uL의 TE 완충액에서 용출시키고, 1 uL를 TapeStation 상에서 제조업체 프로토콜에 따라 분석하여 증폭을 확인하였다. PCR 생성물의 라이브러리를, Illumina 라이브러리 정량화에 대한 Kapa Biosystems 키트를 제조업체가 공급한 프로토콜에 따라 정량화하고, Illumina 시스템 상에서 차세대 시퀀싱을 받게 하여, 올리고뉴클레오타이드가 통합되었던 부위를 결정하였다.
GUIDE-seq의 결과는 표 9 내지 12에 나열되어 있다. GUIDE-seq에 의해 식별된 예측된 표적 서열을 고려하는 것이 중요하다. 예측된 표적 서열이 PAM을 결여하거나 gRNA에 대한 유의한 상동성, 예를 들어 5개 초과의 미스매치(mm)를 결여한다면, 이들 게놈 부위는 참 표적외 부위인 것으로 여겨지지 않지만 검정법으로부터의 백그라운드 신호인 것으로 여겨진다. GUIDE-seq 접근법은 HepG2 세포에서 올리고 캡처의 높은 빈도를 초래하였으며, 이는 상기 방법이 이 세포 유형에서 적절함을 나타낸다. 표적상 판독물 카운트는 4개 가이드 중 3개에 대해 최소 10,000개의 표적상 판독물의 예비-설정된 기준을 충족시켰다. 4개의 리드(lead) gRNA 후보에 대한 소수의 표적외 부위를 식별하였다. 참(true) 표적외 부위의 수(PAM을 함유하고, gRNA와 유의한 상동성을 가짐을 의미)는 4 gRNA에 대해 0 내지 6의 범위였다. T4 가이드는 현실적인 것으로 보이는 2개의 표적외 부위를 나타내었다. 시퀀싱 판독물 카운트에 의해 판단된 바와 같이 GUIDE-seq에서 이들 사건의 빈도는 표적외 절단 빈도의 2% 내지 0.6%였다. T13 가이드와 T5 가이드 둘 다, gRNA에 상동성을 갖고 PAM을 함유하는 GUIDE-seq에 의한 표적외 부위를 나타내지 않았으며, 시험된 4개 가이드의 가장 바람직한 표적외 프로파일을 갖는 것으로 보인다. gRNA T11은, 23%의 표적상 판독물 카운트인 상대적으로 높은 판독물 카운트를 갖는 하나의 표적외 부위를 나타내었으며, 이는, 이 가이드가 치료 용도에 덜 매력적임을 시사한다.
Figure pct00011
Figure pct00012
Figure pct00013
Figure pct00014
치료 약물 후보를 종종 비-인간 영장류에서 평가하여, 인간에서 사용하기 위한 이의 약효 및 안전성을 예측한다. CRISPR-Cas9 시스템을 사용하는 유전자 편집의 경우, 가이드 RNA의 서열 특이성은, 동일한 표적 서열이 인간과 비-인간 영장류 둘 다에 존재하여, 인간에서 잠재적으로 사용될 가이드를 시험해야 함을 의미한다. 인간 알부민 인트론 1을 표적화하는 가이드를 인실리코에서 스크리닝하여, 시노몰구스 마카크에서 상응하는 게놈 서열과 매칭하는 것들을 식별하였다(표 4 참조). 그러나, 비-인간 영장류의 게놈을 절단하는 이들 가이드의 능력, 및 이들이 예측된 표적상 부위에서 절단되는 상대 효율은 관련 세포 시스템에서 결정될 필요가 있다. 시노몰구스 원숭이로부터의 1차 간세포(BioIVT, Westbury, NY)를, 1차 인간 간세포에 대해 상기 기재된 동일한 실험 프로토콜을 사용하여 알부민 가이드 RNA T4, T5, T11 또는 T13 및 spCas9 mRNA로 형질주입하였다. 그 후에, INDELS의 빈도를 상기 기재된 동일한 TIDES 프로토콜을 사용하되, 시노몰구스 알부민 인트론 1에 특이적인 PCR 프라이머를 사용하여 결정하였다. 그 결과는 도 7에 요약되어 있다. 인간 1차 간세포에서 가이드 RNA T4에 대해 상응하는 데이터는 비교를 위해 동일한 도면에 도시된다. 모든 4개 가이드는 2개의 상이한 동물 공여체로부터의 시노몰구스 간세포에서 알부민 인트론 1 내의 예상된 부위에서 절단을 10% 내지 25% 범위의 빈도로 촉진하였다. 절단 효율의 순위 순서는 T5>T4>T11=T13이었다. T5 가이드 RNA는 4개의 가이드 중 가장 강력하였으며, 2개 공여체에서 20% 및 25%의 표적 대립유전자를 절단하였다. 절단 효율은 인간 세포에서 상응하는 가이드보다 더 낮았으며, 이는 형질주입 효율의 차이로 인한 것일 수 있다. 대안적으로, 이들 가이드 및/또는 spCas9 효소는 영장류 세포에서 고유하게 덜 강력할 수 있다. 그렇지만, T5가 4개의 가이드 중 가장 강력한 것이었다는 발견은 GUIDEseq에 의한 이의 선호할 만한 표적외 프로파일과 함께, T5를 NHP에서뿐만 아니라 인간에서 시험하기에 매력적으로 만든다.
실시예 9: CRISPR/Cas9에 의해 매개되는 마우스 알부민 인트론 1 내로의 SEAP 리포터 유전자 공여체의 표적화된 통합은 SEAP의 발현 및 혈액 내로의 분비를 초래한다
CRISPR/Cas9에 의한 서열 특이적 절단을 사용하여 Cas9/gRNA 복합체에 의해 생성된 이중 가닥 절단부에서 관심 유전자를 인코딩하는 공여체 주형 서열의 통합을 매개하는 잠재력을 평가하기 위해, 본 발명자들은 리포터 유전자 뮤린 분비된 알칼리 포스파타제(mSEAP: murine secreted alkaline phosphatase)를 인코딩하는 공여체 주형을 설계하고 작제하였다. mSEAP 유전자는 마우스에서 비-면역원성이어서, 인코딩된 mSEAP 단백질의 발현이 단백질에 대한 면역 반응으로부터 간섭 없이 모니터링되게 한다. 게다가, mSEAP는, 적절한 신호 펩타이드가 코딩 서열의 5' 단부에 포함될 때 혈액 내로 쉽게 분비되고, 단백질은, 단백질의 활성을 측정하는 검정법을 사용하여 쉽게 검출 가능하다. AAV 내로 패키징하기 위한 mSEAP 작제물을, spCas9 및 가이드 RNA mALbT1(tgccagttcccgatcgttacagg, 서열번호 80)을 이용한 절단을 통해 마우스 알부민의 인트론 1 내로 표적화된 통합을 위해 도 8에 도시된 바와 같이 설계하였다. 신호 펩타이드가 제거된 mSEAP 코딩 서열을 마우스에 대해 코돈-최적화시키고, 내인성 마우스 알부민 엑손 1로 스플라이싱한 후 올바른 리딩 프레임을 유지시키는 데 필요한 2개의 염기쌍(TG)으로 이어졌다. 컨센서스 스플라이스 수용기 서열 및 폴리피리미딘 트랙(CTGACCTCTTCTCTTCCTCCCACAG, 서열번호 2)으로 구성된 스플라이스 수용기를 코딩 서열의 5' 단부에 첨가하고, 폴리아데닐화 신호(sPA)를 코딩 서열의 3' 단부에 첨가하였다(AATAAAAGATCTTTATTTTCATTAGATCTGTGTGTTGGTTTTTTGTGTG, 서열번호 5). 게놈 (TGCCAGTTCCCGATCGTTACAGG, 서열번호 80)에 존재하는 mAlbT1 가이드 RNA에 대한 표적 부위의 역보체를 이 카세트의 어느 한 면에 포함시켰다. 본 발명자들은, 가이드 RNA에 대한 절단 부위를 첨가함으로써 AAV 게놈은 생체내에서 이것이 전달된 세포의 핵 내부에서 절단되어 비-상동 말단 연결 (NHEJ) 경로에 의해 이중 가닥 절단부에서 통합에 최적인 주형인 선형 DNA 단편을 생성시켜야 한다고 가정하였다. AAV 캡시드 내로의 효율적인 패키징을 가능하게 하기 위해, 인간 미세부수체 서열로부터 유래된 스터퍼 단편을 첨가하여, 4596 bp의 ITR을 포함하는 전체 크기를 달성하였다. 이 공여체 카세트가 Cas9/mALbT1 가이드 RNA 복합체에 의해 생성된 알부민 인트론 1에서 이중 가닥 절단부 내로의 포워드 배향으로 통합된다면, 알부민 프로모터로부터의 전사는 1차 전사체를 생성시키는 것으로 예측되며, 상기 전사체는 알부민 엑손 1의 스플라이스 공여체로부터 컨센서스 스플라이스 수용기로의 스플라이싱을 겪고, 알부민 엑손 1이 프레임 내에서 mSEAP 코딩 서열에 융합되는 성숙 mRNA를 생성시킬 수 있다. 이 mRNA의 번역은, 마우스 알부민(알부민 엑손 1에서 인코딩됨)의 신호 펩타이드가 선행된 mSEAP 단백질을 생성할 것이다. 신호 펩타이드는 순환 내로의 mSEAP의 분비를 지향시키고, 분비 과정에서 절단되어 성숙 mSEAP 단백질을 남길 것이다. 마우스 알부민 엑손 1이 신호 펩타이드 및 전구-펩타이드, 뒤이어 성숙 알부민 단백질(Glu-Ala + 1 bp (C)를 인코딩함)의 N-말단을 인코딩하는 7 bp를 인코딩하기 때문에, 전구-펩타이드의 절단 후, SEAP 단백질은 N-말단에서 3개의 추가 아미노산, 즉, Glu-Ala-Leu(Leu은 통합된 SEAP 유전자 카세트로부터 TG로 스플라이싱된 알부민 엑손 1의 마지막 C 염기에 의해 생성됨)을 함유하는 것으로 예측된다. 본 발명자들은, 류신이 비하전된 무극성이어서 SEAP 단백질의 기능을 간섭하는 경향이 없기 때문에, N-말단에 첨가된 3개의 추가 아미노산의 제3 아미노산으로서 류신(Leu)을 인코딩하도록 선택하였다. pCB0047로 지정된 이 SEAP 공여체 카세트를, HEK293기초 형질주입 시스템 및 바이러스 정제를 위한 표준 방법(Vector Biolabs Inc)을 사용하여 AAV8 혈청형 캡시드 내로 패키징하였다. mSEAP 코딩 서열 내에 위치한 프라이머 및 프로브와 함께 정량적 PCR을 사용하여 바이러스를 적정(titer)하였다.
pCB0047 바이러스를 제0일에 마우스의 꼬리 정맥 내로 2e12 vg/kg의 용량으로, 뒤이어 4일 후에 mALbT1 가이드 RNA (가이드 RNA 서열 5' TGCCAGTTCCCGATCGTTACAGG 3', PAM 밑줄표시, 서열번호 80) 및 spCas9 mRNA.를 캡슐화하는 지질 나노입자(LNP)를 주사하였다. 단일 가이드 RNA를 화학적으로 합성하고 본질적으로 기재된 바와 같이 화학적으로 변형된 염기를 혼합하였으며(Hendel 등, Nat Biotechnol. 2015 33(9): 985-989), 표준 tracr RNA 서열을 사용하였다. spCas9 mRNA를 표준 기법을 사용하여 합성하였고, 단백질의 N-말단과 C-말단 둘 다에서 핵 국재화 신호를 첨가하는 뉴클레오타이드 서열을 포함하였다. 핵 국재화 신호는, mRNA가 관심 세포의 세포질에 LNP에 의해 전달된 다음 spCas9 단백질로 번역된 후에 상기 spCas9 단백질을 핵에 지향시키는 데 필요하다. Cas9 단백질을 핵으로 지향시키는 NLS 서열의 사용은 당업계에 잘 알려져 있고, 예를 들어 Jinek 등을 참조한다(eLife 2013;2:e00471. DOI: 10.7554/eLife.00471). spCas9 mRNA는 또한, polyA 테일을 함유하였고, 안정성 및 번역 효율을 향상시키기 위해 5' 단부에서 캡핑되었다. gRNA 및 Cas9 mRNA를 LNP에서 패키징하기 위해 본 발명자들은 본질적으로 Kaufmann 등 (Nano Lett. 15(11):7300-6)에 의해 기재된 바와 같은 프로토콜을 사용하여, 이온화 가능한 지질 C12-200(AxoLabs)에 기초하여 LNP를 조립하였다. LNP의 다른 구성요소는 cis-4,7,10,13,16,19-도코사헥사엔산(DHA, Sigma로부터 구매됨), 1,2-디리놀레오일-sn-글리세로-3-포스포콜린(DLPC, Avanti로부터 구매됨), 1,2-디미리스토일-sn-글리세로-3-포스포에탄올아민-N-[메톡시(폴리에틸렌 글리콜)-2000](DMPE-mPEG200, Avanti로부터 구매됨) 및 콜레스테롤(Avanti로부터 구매됨)이다. LNP를 Nanoassembler Benchtop 기기(Precision Nanosystems)를 사용하여 생성하였으며, 여기서, LNP는 지질 및 핵산 구성요소가 미세유체 챔버에서 제어된 조건 하에 혼합될 때 자가-조립한다. spCas9 mRNA 및 가이드 RNA를 별도의 LNP에서 캡슐화하였다. LNP를 포스페이트 완충 식염수 내로 투석에 의해 농축시키고, 사용 전에 4℃에서 1주 이하 동안 보관하였다. LNP를 동적 광 산란을 사용하여 특징화하였으며, LNP는 일반적으로 50 내지 60 nM 범위의 크기를 가졌다. LNP 중 RNA의 농도를 Ribogreen 검정법 키트(Thermofisher Scientific)를 사용하여 측정하였으며, 마우스에게 주어진 용량을 결정하는 데 사용하였다. 마우스에게 투약하기 위해, spCas9 및 가이드 RNA LNP를, 주사 직전에 RNA와 1:1 질량비로 혼합하였다. 광범위한 LNP 용량을 마우스에게 IV 주사하고 TIDES 절차를 사용하여 간에서 알부민 인트론 1 내의 표적상 부위에서의 마우스 게놈의 절단을 측정함으로써, spCas9 mRNA 및 가이드 RNA를 마우스의 간에 전달하는 이들 LNP의 능력을 실증하였다(Brinkman 등, Nucleic Acids Res. 2014 Dec 16; 42(22): e168). 25% 이하의 대립유전자가 표적상 부위에서 절단된 전형적인 결과에 대해 실시예 2(도 4)를 참조한다.
5마리의 2개 코호트에게 2e12 vg/kg의 AAV8-CB0047 바이러스를 꼬리 정맥에 주사하였다. 3일 후에, 코호트 중 하나에 spCas9 mRNA 및 mAlbT1 가이드 RNA를 캡슐화하는 LNP를 2 mg/kg(1:1 비의 spCas9 및 gRNA)의 총 RNA 용량으로 주사하였다. 혈액 시료를 매주 수집하고, 혈장을 상업적인 키트(InvivoGen)를 사용하여 SEAP 활성에 대해 검정하였다. 그 결과(표 13 참조)는, AAV8-pCB0047 바이러스만 수용한 마우스에서 SEAP 활성이 검출 가능하지 않았음을 실증한다. AAV8-pCB0047 바이러스, 뒤이어 LNP를 수용한 마우스는, 투약 후 4주째에 마지막 시점까지 안정한 채로 유지된 혈장에서 SEAP 활성을 가졌다. 마우스가 AAV8 공여체 SEAP 유전자와 CRISPR-Cas9 유전자 편집 구성요소 둘 다 수용하였을 때 SEAP만 발현되었다는 발견은, SEAP 단백질이 알부민 인트론 1에서 표적 부위 내로 통합된 SEAP 유전자의 복사체로부터 발현되고 있었음을 시사한다. pCB047 내 SEAP 유전자가 신호 펩타이드 또는 프로모터를 결여하기 때문에, 이는 프로모터 및 신호 펩타이드에 작동적으로 연결되지 않는 한, 즉, SEAP 코딩 서열과 인프레임에 있지 않는 한, 발현 및 분비될 수 없다. pCB047 유전자 카세트가 게놈 내 무작위 부위 내로 통합된다면, 이는 발생할 것 같지 않다.
pCB0047로부터의 SEAP 유전자 카세트가 알부민의 인트론 1에 통합되었음을 확인하기 위해, 본 발명자들은 Droplet Digital PCR(DD-PCR)을 사용하여, 연구의 종료 시 마우스의 간으로부터 추출된 게놈 DNA에서의 통합 빈도를 측정하였다. DD-PCR은, 복잡한 혼합물에서 핵산 서열의 복사체 수를 정확하게 정량화하는 방법이다. PCR 프라이머 쌍을, 하나의 프라이머가 mAlbT1 가이드의 표적 부위의 5' 측면 상에 마우스 알부민 게놈 서열에 위치하고(표적화된 통합을 위한 예측 부위) 다른 프라이머가 pCB0047에서 SEAP 유전자의 5' 단부에 위치하도록 설계하였다. "인-아웃(in-out)" PCR은, SEAP 카세트가 요망되는 포워드 배향에서 통합될 때 마우스 알부민 게놈 서열과 통합된 SEAP 카세트 사이의 연접부를 증폭시킬 것이다. 이들 2개 프라이머에 의해 증폭된 DNA 서열에 혼성화하는 형광 프로브를 설계하였다. DD-PCR 검정법에 대한 내부 대조군으로서, 마우스 알부민 유전자를 검출하는 프라이머 프로브 세트를 사용하였다. 이 DD-PCR 검정법을 사용하여, 본 발명자들은 0.24 +/-0.07 %(알부민 유전자의 100개 복사체당 0.24개 복사체)의 표적화된 통합 빈도를 측정하였으며, SEAP 카세트가 알부민 인트론 1에서 통합되었음을 확인시켜 주었다.
Figure pct00015
실시예 10: CRISPR/Cas9에 의해 매개되는 마우스 알부민 인트론 1 내로의 인간 FVIII 유전자 공여체의 표적화된 통합은 혈액에서 FVIII의 발현을 초래한다
알부민의 인트론 1 내로의 유전자의 표적화된 통합을 위한 본원에 기재된 유전자 편집 전략을 사용하여, 치료적 이익을 제공할 목표로 간에서 임의의 관심 유전자를 발현시킬 수 있다. 간에서 해당 단백질을 발현함으로써 대체될 수 있는 단백질의 부재(absence) 또는 감소된 수준을 초래하는 유전 질환을 갖는 환자를 이 접근법으로 치료할 수 있다. 특히, 혈액에서 정상적으로 존재하는 단백질의 결핍에 의해 야기되는 질환은, 단백질의 발현의 정상적인 부위가 간이 아니거나 간 내의 간세포가 아니라도 이러한 표적화된 유전자 편집 접근법에 의해 치료될 수 있는데, 간세포에서 알부민 인트론 1 내로 통합된 치료 유전자의 발현이 혈액 내로의 인코딩된 단백질의 분비를 초래할 것이기 때문이다.
이러한 유전자 편집 전략으로 치료될 수 있는 질환의 예는 A형 혈우병, B형 혈우병, MPS II, MPS1H, 알파-1-항트립신 결핍, FXIII 결핍, FVII 결핍, FX 결핍, 단백질 C 결핍, 및 HAE를 포함한다.
A형 혈우병은, 본원에 기재된 유전자 편집 접근법을 사용하여 치료 이익을 제공할 수 있는지 결정하기 위해 질환의 일례로서 선택되었다. A형 혈우병은 광범위하게 연구된 질환으로서(Coppola 등, J Blood Med. 2010; 1: 183-195), 환자는 이들의 혈액에서 기능성 FVIII 단백질을 낮은 수준으로 초래하는 FVIII 유전자의 돌연변이를 갖는다. 인자 VIII은 응고 캐스케이드의 중요한 구성요소이고, 충분한 양의 FVIII의 부재 시 혈액은 손상 부위에서 안정한 응괴를 형성하는 데 실패하여 과도한 출혈을 초래한다. 효과적으로 치료받지 않은 A형 혈우병 환자는, 관절 파괴를 초래하는 관절에서의 출혈을 경험한다. 두개내 출혈 또한 발생할 수 있고 이따금 치명적일 수 있다.
이 유전자 편집 전략을 A형 혈우병을 치료하는 데 사용할 수 있을 것인지 평가하기 위해, 본 발명자들은 마우스 FVIII 유전자가 불활성화된 마우스 모델을 사용하였다. 이들 A형 혈우병 마우스는 이들의 혈액에 검출 가능한 FVIII를 갖지 않으며, 이는 외인적으로 공급된 FVIII를 FVIII 활성 검정법(Diapharma, Chromogenix Coatest SP 인자 FVIII, cat# K824086 키트)을 사용하여 측정할 수 있게 한다. 이 검정법에서 표준으로서 본 발명자들은 혈우병 환자의 치료에 사용되는 재조합 인간 FVIII인 코게네이트(Kogenate)(Bayer)를 사용하였다. 검정법의 결과는, 정상 인간 FVIII 활성의 백분율로서 보고되며, 이 백분율은 1 IU/ml로서 정의된다. 인간 FVIII 공여체 주형을, 강한 간 특이적 프로모터의 제어 하에 AAV 벡터를 마우스에게 전달하였을 때 작용하는 것으로 보였던 B-도메인 결실 FVIII 코딩 서열에 기초하여 작제하였다(McIntosh 등, 2013; Blood;121(17):3335-3344). 네이티브 신호 펩타이드를 인코딩하는 DNA 서열을 이 FVIII 코딩 서열로부터 제거하고, 마우스 알부민 엑손 1로의 스플라이싱 후 올바른 리딩 프레임을 유지시키는 데 필요한 2개 염기쌍(TG)으로 대체하였다. 마우스 알부민 인트론 1로부터 유래된 스플라이스 수용기 서열을 FVIII 코딩 서열의 바로 5'에 삽입하였다. 인간 글로빈 유전자로부터의 3' 비번역 서열, 뒤이어 합성 폴리아데닐화 신호 서열을 FVIII 코딩 서열의 3' 측면 상에 삽입하였다. 합성 폴리아데닐화 신호는, 폴리아데닐화를 효과적으로 지향시키는 것으로 나타난 짧은 49 bp 서열이다(Levitt 등, 1989; GENES & DEVELOPMENT 3:1019-1025). 3' UTR 서열을 B-글로빈 유전자로부터 얻었으며, 이 서열은 폴리아데닐화 효율을 추가로 향상시키는 작용을 할 수 있다. mAlbT1 가이드 RNA에 대한 표적 부위의 역보체를 이 FVIII 유전자 카세트의 어느 한 부위에 배치시켜, 도 9에 도시된 바와 같이 AAV2의 ITR 서열을 함유하는 pCB056이라고 하는 벡터를 생성시켰다. 이 플라스미드를 AAV8 캡시드 내로 패키징하여, AAV8-pCB056 바이러스를 생성시켰다.
5마리 A형 혈우병 마우스의 코호트(2군; G2)에게 AAV8-pCB056 바이러스를 1 e13 vg/kg의 용량으로 주사하였으며, 19일 후에 동일한 마우스의 꼬리 정맥에 mAlbT1 가이드 RNA 및 spCas9 mRNA를 캡슐화하는 2개의 C12-200 기초 LNP의 혼합물을 각각 1mg RNA/kg의 용량으로 주사하였다. LNP를 상기 실시예 2에 기재된 바와 같이 제형화하였다. 5마리 A형 혈우병 마우스의 별도의 코호트(6군; G6)에게 AAV8-pCB056 바이러스를 1 e13 vg/kg의 용량으로 주사하였으며, 4주 후에 FVIII 활성을 모니터링하였다. AAV만 주사하였을 때, 마우스의 혈액에서 어떠한 FVIII 활성도 측정 가능하지 않았다(도 9의 G6). AAV8-pCB056 바이러스, 뒤이어 LNP 중 CRISPR/Cas9 유전자 편집 구성요소를 수용한 마우스는 이들의 혈액에, FVIII 활성의 정상 인간 수준의 25% 내지 60% 범위인 FVIII 활성을 가졌다. 중증 혈우병 환자는 정상의 1% 미만인 FVIII 활성 수준을 가지며, 중등도 혈우병 A 환자는 정상의 1% 내지 5%인 FVIII 수준을 갖고, 경증 환자는 정상의 6% 내지 30%인 수준을 갖는다. FVIII 대체 단백질 치료법을 취하는 A형 혈우병 환자는, 3%, 5%, 10%, 15% 및 20%의 예측된 FVIII 최저치(trough level)에서 출혈이 발생하지 않았을 때의 빈도가 각각 71%, 79%, 91%, 97%, 및 100%였으며(Spotts 등 Blood 2014 124:689), 이는 FVIII 수준이 15% 내지 20%의 최소 수준을 초과하여 유지될 때 출혈 사전의 비율이 제로에 근접하게 감소되었음을 시사한다. A형 혈우병을 치유하는 데 필요한 정확한 FVIII 수준이 정의되지 않았고 환자들 사이에서 다양할 것 같긴 하지만, 5% 내지 30%의 수준은 출혈 사건의 유의한 감소를 제공하는 것 같다. 그러므로, 상기 기재된 A형 혈우병 마우스 모델에서 달성되었던 FVIII 수준(25% 내지 60%)은 치유적인 것으로 예상되는 치료적으로 관련된 범위에 있다.
도 10에서 5마리 중 4마리의 마우스는 제36일에 연구의 종료 시까지 안정한 FVIII 수준을 나타내었다(검정법의 정상적인 변동성 및 마우스 생리학에서 변화 내에서). 마우스(2-3) 중 1마리에서 FVIII 활성은 제36일에 검출 불가능한 수준까지 하락하였고, 이는 마우스에서 외래 단백질로서 인식될 수 있는 인간 FVIII 단백질에 대한 면역 반응으로 인한 것일 것 같았다(Meeks 등, 2012 Blood 120(12): 2512-2520). AAV-FVIII 공여체 주형을 주사하였을 때만 FVIII 단백질이 마우스에서 발현되지 않았다는 관찰은, FVIII의 발현이 CRISPR/Cas9 유전자 편집 구성요소의 제공을 필요로 하였음을 실증한다. FVIII 공여체 카세트가 프로모터 또는 신호 펩타이드를 갖지 않기 때문에, FVIII는 게놈 내 무작위 부위 내로 카세트의 통합에 의해 또는 일부 다른 정의되지 않은 기전에 의해 이루어질 것 같지 않다. FVIII 공여체 카세트가 알부민의 인트론 1 내로 통합되었는지 확인하기 위해 본 발명자들은 DD-PCR 포맷에서 인-아웃 PCR을 사용하였다. 2군의 마우스의 전체 간을 균질화하였으며, 게놈 DNA를 추출하고 mAlbT1 gRNA에 대한 절단 부위의 5' 위치에서 마우스 알부민 유전자에 위치한 하나의 프라이머를 사용하여 DD-PCR에 의해 검정하였으며, 여기서 표적상 통합이 발생하였던 것으로 예측된다. 제2 PCR 프라이머는 pCB056 카세트 내의 FVIII 코딩 서열의 5' 단부에 위치하였다. 검출에 사용된 형광 프로브를 설계하여, 2개 PCR 프라이머 사이의 서열에 혼성화시켰다. 이들 2개 프라이머를 사용하는 PCR은, FVIII 카세트가 mAlbT1 gRNA 절단 부위에서 포워드 배향으로 통합된 통합 사건의 5' 연접부를 증폭시킬 것이며 이는 FVIII 단백질을 발현시킬 수 있을 것이다. 마우스 알부민 유전자 내 영역에 대한 DD-PCR 검정법을 대조군으로서 사용하여, 검정법에서 마우스 게놈의 복사체 수를 측정하였다. 이러한 검정법은 100개 반수체 마우스 게놈(평균 1.0)당 0.46 내지 1.28개의 표적화된 통합 사건을 검출하였다. 통합된 FVIII 유전자 카세트로부터 생성되는 FVIII과 일관된 피크 FVIII 수준 및 표적화된 통합 빈도 사이에 상관관계가 존재하였다. 마우스 간 내의 세포 중 약 70%가 간세포이고 AAV8과 LNP 둘 다 간세포에 의해 주로 흡수된다는 것을 가정하여, 1.4%(1.0 *(1/0.7))의 간세포 알부민 대립유전자는 통합된 FVIII 카세트를 포워드 배향에서 함유하였음을 추정할 수 있다. 이들 결과는, CRISPR/Cas9가 적절하게 설계된 FVIII 유전자 카세트를 마우스의 알부민 인트론 1 내로 통합시켜 치료적 수준의 기능성 FVIII 단백질의 발현 및 혈액 내로의 분비를 초래할 수 있음을 실증한다. 이 연구에 이용되는 전달 양상, 즉, FVIII 공여체 주형을 전달하는 AAV 바이러스 및 CRISPR/Cas9 구성요소를 전달하는 LNP는 환자에게 생체내 전달하기에 잠재적으로 잘 받아들인다. Cas9는 생체내에서 짧은 수명(1일 내지 3일 범위)을 갖는 mRNA로서 전달되었기 때문에, CRISPR/Cas9 유전자 편집 복합체는 단기간 동안만 활성일 것이므로, 이는 표적외 절단 사건이 발생하는 시간을 제한하여 예측된 안전성 이익을 제공한다. 이들 데이터는, CRISPR/Cas9가 단지 단기간 동안 활성적이긴 하지만, 이는 마우스에서 치료적으로 관련된 수준의 FVIII 활성을 발휘하기에 충분한 빈도로 표적화된 통합을 유도하기에 충분하였음을 실증한다.
Figure pct00016
실시예 11: AAV 공여체에 비해 LNP에서 가이드 RNA 및 Cas9 mRNA를 투약하는 시기는 유전자 발현 수준에 영향을 미친다
AAV 공여체 주형을 주사하는 시간과 Cas9 mRNA 및 가이드 RNA를 캡슐화하는 LNP의 투약 사이의 시간이 공여체 주형 상에서 인코딩된 유전자의 발현 수준에 영향을 미치는지의 여부를 평가하기 위해, 본 발명자들은 5마리 마우스의 2개 코호트에게 각각 mSEAP를 인코딩하는 AAV8-pCB0047을 주사하였다. AAV를 주사한 후 4일째에, 마우스의 하나의 코호트(3군)에게 spCas9 mRNA 및 mAlbT1 gRNA (각각 1 mg/kg)를 캡슐화하는 C12-200 기초 LNP를 주사하였으며, 다음 4주 동안 매주 혈장에서 SEAP 활성을 측정하였다. SEAP 활성을 제2 코호트의 마우스에서 4주 동안 모니터링하였으며, 이 기간 동안 SEAP가 검출되지 않았다. AAV를 주사한 후 28일째에, 4군의 마우스에게 spCas9 mRNA 및 mAlbT1 gRNA (각각 1 mg/kg)를 캡슐화하는 C12-200 기초 LNP를 주사하였으며, 다음 3주 동안 매주 혈장에서 SEAP 활성을 측정하였다. SEAP 데이터는 표 15에 요약되어 있다. AAV 후 4일째에 LNP 캡슐화된 spCas9/gRNA를 수용한 3군에서, SEAP 활성은 평균적으로 3306 마이크로U/ml였다. AAV 후 28일째에 LNP 캡슐화된 spCas9/gRNA를 수용한 4군에서, SEAP 활성은 평균적으로 13389 마이크로U/ml였으며, 이는 3군에서보다 4-배 더 높다. 이들 데이터는, LNP 후 28일째에 LNP 캡슐화된 spCas9/gRNA의 투약이, LNP 캡슐화된 spCas9/gRNA가 AAV-공여체 주형 후 단지 4일째에 투약되는 것보다 게놈에서 통합된 유전자로부터 4-배 더 높은 발현을 초래함을 실증하였다. 이러한 향상된 발현은 알부민 인트론 1 내로의 전장 공여체 인코딩된 유전자 카세트의 통합의 더 높은 빈도로 인한 것 같다.
Figure pct00017
AAV-공여체 및 LNP 캡슐화된 Cas9/gRNA 투약 시기의 영향을 또한, FVIII 유전자를 치료 관련 유전자의 일례로서 사용하여 평가하였다. A형 혈우병 마우스의 2개 코호트에, 인간 FVIII 공여체 카세트를 인코딩하는 AAV8-pCB056을 제0일에 2e12 vg/kg의 용량으로 주사하였다. 4일 이후에 코호트 중 하나에, spCas9 mRNA 및 mAlbT1 gRNA (각각 1 mg/kg)를 캡슐화하는 C12-200 기초 LNP를 주사한 한편, 17일 이후에 제2 코호트에게 spCas9 mRNA 및 mAlbT1 gRNA (각각 1 mg/kg)를 캡슐화하는 C12-200 기초 LNP를 투약하였다. AAV8-pCB056의 투약을 시차를 두어, spCas9 mRNA 및 가이드 RNA를 캡슐화하는 LNP의 동일한 배치를 동일한 일자에 2개 군 모두에 사용하였다. 마우스의 혈액에서 FVIII 활성을 LNP를 투약한 후 제10일 및 제17일에 측정하였으며, 그 결과를 도 11에 도시한다. AAV 후 4일째에 LNP를 수용한 마우스는 이의 혈액에 검출 가능한 FVIII을 갖지 않은 한편, AAV 후 17일째에 LNP로 주사된 군의 마우스의 모든 4마리는 제17일에 정상의 2% 내지 30% 범위인 검출 가능한 FVIII 활성을 가졌다. 이들 결과는, FVIII을 인코딩하는 AAV 공여체에 대해, AAV 공여체 후 적어도 17일째에 CRISPR/Cas9 구성요소의 투약은 치료적으로 관련된 수준의 FVIII을 초래한 한편, AAV 후 4일째의 투약은 FVIII 발현을 유발하지 않는다.
AAV가 간의 세포를 포함하여 세포를 감염시키는 과정은, 엔도솜으로부터의 탈출, 바이러스 언코팅(uncoating) 및 핵으로의 AAV 게놈의 수송을 수반한다. 단일 가닥 게놈이 바이러스에 패키징되는 이들 연구에 사용된 AAV의 경우, 단일 가닥 게놈은 이중 가닥 DNA 합성 과정을 겪어 이중 가닥 DNA 게놈을 형성한다. 이중 가닥 게놈으로의 단일 가닥 게놈의 완전한 전환에 필요한 시간은 잘 확립되어 있지 않지만, 속도 제한 단계인 것으로 여겨진다(Ferrari 등 1996; J Virol. 70: 3227-3234). 그 후에, 이중 가닥 선형 게놈은, 헤드 투 테일 및 테일 투 헤드로 결합된 단량체로 이루어진 다량체성 환형 형태로 연쇄화된다(Sun 등 2010; Human Gene Therapy 21:750-762). 본 발명자들의 연구에 사용된 AAV 공여체 주형이 상동성 아암을 함유하지 않기 때문에, 이들은 HDR을 위한 주형이 아닐 것이며, 따라서 NEHJ 경로를 통해 단지 통합될 수 있다. 단지 이중 가닥 선형 DNA 단편만 이중 가닥 절단부에서 NHEJ 매개 통합을 위한 주형이다. 그러므로, 본 발명자들은, AAV 공여체 후 곧 CRISPR-Cas9 구성요소를 간 세포에 전달하는 것은 통합 빈도를 낮출 것이며, 대부분의 AAV 게놈이 단일 가닥 형태로 있고 이들 환경 하에 게놈 내의 대부분의 이중 가닥 절단부가 공여체 주형의 통합 없이 작은 삽입 및 결실로 수선될 것이기 때문임을 가정한다. CRISPR/Cas9 유전자 편집 구성요소를 AAV-공여체 후 나중에 전달하는 것은, NHEJ 매개 표적화된 통합에 대한 주형인 이중 가닥 AAV 게놈의 형성을 위한 시간을 허용한다. 그러나, AAV 공여체를 전달한 후 너무 오래 대기하는 것은, NHEJ 매개 표적화된 통합에 대한 주형이 아닐 원형(연쇄체) 형태로의 이중 가닥 선형 형태의 전환을 초래할 수 있다. 공여체 주형에서 가이드 RNA/Cas9에 대한 절단 부위의 포함은 원형 형태의 절단을 초래하여, 선형 형태를 생성시킬 것이다. 임의의 잔여 선형 형태를 또한 절단하여, AAV ITR 서열을 함유하는 짧은 단편을 방출시킬 것이다. AAV 공여체 주형에서 1 또는 2개의 가이드 RNA 절단 부위의 포함은 AAV 게놈의 연쇄체 형태로부터 여러 가지 선형 단편을 생성시킬 것이다. 선형 단편의 유형은 AAV 게놈에서 절단 부위의 수 및 연쇄체에서 다량체의 수 및 이의 상대 배향에 따라 다를 것이므로, 예측하기 어렵다. AAV에서 카세트의 5' 단부에 배치된 단일 gRNA 부위는 단량체성 원형과 헤드 투 테일 연쇄체 둘 다로부터 단량체성 이중 가닥 주형을 방출시킬 것이다(헤드 투 테일은 다음 AAV 게놈의 3' 단부에 결합된 하나의 AAV 게놈의 5' 단부를 의미함). 그러나, 5' 단부에 배치된 단일 gRNA 부위는 헤드 투 테일 연쇄체로부터 단량체성 이중 가닥 선형 주형을 방출시키지 않을 것이다(헤드 투 헤드는 다음 AAV 게놈의 5' 단부에 결합된 하나의 AAV 게놈의 5' 단부로 구성됨). 5' 단부에서 단일 gRNA 부위를 사용하는 가능한 이점은, 이중 가닥 단편을 함유하는 짧은 ITR을 단지, 헤드 투 테일 연쇄체로부터가 아니라 헤드 투 헤드 연쇄체로부터 방출시킬 것이라는 점이다. AAV 게놈의 5' 단부에서 단일 gRNA 절단 부위를 이용하여, ITR은 선형 단량체성 유전자 카세트의 3' 단부에 남아 있을 것이므로 게놈에 통합될 것이다. AAV 내의 공여체 카세트가 2개의 gRNA 부위(측면 근접 카세트)를 함유할 때, 이는 모든 형태의 이중 가닥 DNA로부터 단량체성 이중 가닥 주형의 방출을 초래할 것이며, 따라서, 특히 헤드 투 테일 연쇄체와 테일 투 헤드 연쇄체의 믹스가 존재한다면 표적화된 통합을 위해 더 많은 주형을 유리시킬 수 있다. 카세트에 측면 근접해 있는 2개의 gRNA 표적 부위를 포함하는 잠재적인 단점은, 이것이 AAV ITR 서열을 함유하는 작은(약 150개 염기쌍) 이중 가닥 선형 단편을 방출시킬 것이라는 점이다. 이들 작은(약 150개 염기쌍) 단편 중 2개는 관심 치료 유전자를 함유하는 유전자 카세트의 각각의 복사체에 대해 생성될 것이다. 짧은 ITR 함유 단편은 또한, 게놈 내 이중 가닥 절단부에서 NHEJ 매개 표적화된 통합을 위한 주형인 것으로 예상되고, 따라서, 게놈 내 이중 가닥 절단부에서의 통합을 위한 유전자 카세트를 함유하는 단편과 경쟁할 것이며, 이에 의해 숙주 세포의 게놈 내로의 치료 유전자 카세트의 통합의 요망되는 사건이 발생하는 빈도를 감소시킬 것이다. 연쇄체 형성의 동역학 및 연쇄체의 분자 조성(헤드 투 테일 및 테일 투 헤드 연쇄체의 함량 및 연쇄체 내 단량체 단위의 수)과 같은 많은 매개변수가 알려져 있지 않은 이러한 생물학적 시스템의 복잡성을 고려하면, 공여체 카세트 내 0, 1 또는 2개의 가이드 절단 부위가 치료 유전자를 함유하는 요망되는 공여체 카세트의 최고 표적화된 통합을 달성할 것인지의 여부 또는 이것이 CRISPR/Cas9 유전자 편집 구성요소의 전달 시기에 의해 영향을 받는 방식을 임의의 확신을 갖고 예측하는 것이 불가능하다. 본 발명자들의 데이터는, 2개의 가이드 RNA 절단 부위의 포함은, CRISPR/Cas9 유전자 편집 구성요소가, LNP가 AAV-공여체 카세트 후 4일째에 투여되었을 때가 아니라 AAV-공여체 카세트가 투약된 후 적어도 17일째에 spCas9 mRNA 및 가이드 RNA를 캡슐화하는 LNP에 의해 전달되는 설정에서 측정 가능한 표적화된 통합을 유발함을 뒷받침한다.
실시예 12: FVIII 발현에 미치는 상이한 폴리아데닐화 신호의 영향
마우스 알부민 인트론 1 내로의 표적화된 통합 후 FVIII 유전자의 발현 시 상이한 폴리아데닐화 신호 서열의 영향을 평가하기 위해 본 발명자들은 도 12에 도시된 일련의 플라스미드를 작제하였다. 이들 플라스미드를, 수력학적 주사(HDI)를 사용하여 마우스에게 전달 후 생체내에서 원형 플라스미드 DNA의 선형화를 초래할 5' 단부에서 mALbT1 gRNA에 대한 표적 부위로 설계하였다. HDI는 마우스의 간으로의 플라스미드 DNA의 전달을 위한 확립된 기법이고(Budker 등, 1996; Gene Ther., 3, 593-598), 식염수 중 나상(naked) 플라스미드 DNA를 마우스의 꼬리 정맥 내로 신속하게 주사한다(5초 내지 7초 이내에 2 내지 3 ml 부피).
6마리의 A형 혈우병 마우스의 코호트에게 마우스당 25 μg의 pCB065, pCB076 또는 pCB077을 수력적으로 주사하였다. 24시간 이후에 마우스에게 spCas9 mRNA 및 mAlbT1 gRNA를 캡슐화하는 C12-200 LNP를 각각 RNA의 1 mg/kg의 용량으로 안와 주사에 의해 투약하였다. 마우스의 혈액에서 FVIII 활성을 LNP를 투약한 후 제10일에 측정하였다. 10일 후, 마우스를 희생시키고, 전체 간을 균질화하였으며, 게놈 DNA를 균질물로부터 추출하였다. 알부민 인트론 1 내로의 포워드 배향에서 FVIII 공여체 카세트의 표적화된 통합 빈도를 정량적 실시간 PCR을 사용하여 정량화하였다. 이러한 실시간 PCR 검정법에서, 하나의 프라이머를 예상된 통합 부위(mAlbT1 gRNA의 절단 부위)의 마우스 알부민 유전자 5'의 게놈 서열에 위치시켰고, 제2 PCR 프라이머를 공여체 플라스미드 내 FVIII 코딩 서열의 5' 단부에 위치시켰다. 형광 프로브를 2개의 프라미어 사이에 위치시켰다. 이러한 검정법은, 통합이 포워드 배향에서 발생하였을 때 마우스 게놈과 공여체 카세트 사이의 연접부를 특이적으로 검출할 것이다(FVIII 유전자는 게놈 마우스 알부민 유전자와 동일한 배향에 존재함). 미접촉 마우스 간 게놈 DNA 내로 스파이킹된 연접부 단편의 예측된 서열로 이루어진 합성 DNA 단편을 복사체 수 표준으로서 사용하여, 간 게놈 DNA에서의 통합의 절대 복사체를 계산하였다. 2군(pCB065가 주사됨), 3군(pCB076이 주사됨) 및 4군(pCB077이 주사됨) 내 마우스에서 FVIII 활성은 각각 5.5%, 4.2% 및 11.4%였다. pCB077이 주사된 4군은 최고 FVIII 활성을 가졌다. 수력학적 주사에 의한 간으로의 DNA의 전달이 마우스 사이에서 고도로 가변적이기 때문에, 본 발명자들은 각각의 개별 마우스에 대해 도 13에 도시된 바와 같이 표적화된 통합 빈도로 나눈 FVIII 활성을 계산하였다. 이 비율은 FVIII 유전자의 통합된 복사체당 FVIII 발현을 나타내고, pCB065 및 pCB076과 비교하여 pCB077(4군)로부터 우수한 발현을 실증하였다. 본 발명자들이 임의의 FVIII을 발현하지 않는 마우스를 배제하였을 때, 평균 FVIII/TI 비는 pCB065, pCB076 및 pCB077에 대해 각각 42, 8 및 57이었다. 이들 데이터는, pCB077에서의 aPA+ 폴리아데닐화 신호가 pCB076에서의 sPA 폴리아데닐화 신호와 비교하여 FVIII의 우수한 발현을 가능하게 함을 나타낸다. sPA+ 폴리아데닐화 신호를 사용한 FVIII의 발현은, 소 성장 호르몬(bGH) 폴리아데닐화 신호를 사용한 발현과 유사하였다. AAV 바이러스를 사용하여 공여체를 전달할 때 bGH polyA (225 bp)와 비교하여 짧은 폴리아데닐화 신호 서열, 예컨대 sPA (49 bp) 또는 sPA+ (54 bp)를 사용하는 것은, 특히 크기가 4.3 Kb인 FVIII 유전자의 경우 AAV에 대한 패키징 한계(ITR을 배제하고 4.4 Kb)에 근접할 때 유리하다. sPA+ 폴리아데닐화 신호는 FVIII 유전자의 정지 코돈과 합성 폴리아데닐화 신호 서열 (aataaaagatctttattttcattagatctgtgtgttggttttttgtgtg) 사이의 5 bp 스페이서(tcgcg)의 존재에 의해서만 sPA 폴리아데닐화 신호와 상이하다. 이러한 합성 폴리아데닐화 신호 서열이 이전에 기재되었고(Levitt 등, 1989; Genes Dev. (7):1019-25) AAV 기초 유전자 치료법 벡터에서 다른 것들에 의해 사용되어 온 한편(McIntosh 등, 2013; Blood 121:3335-3344), 스페이서 서열을 포함하는 이익은 명확하게 실증되지 않았다. 본 발명자들의 데이터는, 5 bp의 짧은 스페이서의 포함이 알부민 인트론 1 내로 통합된 FVIII 유전자의 발현을 향상시켰으며, 여기서 전사는 게놈 내 강한 알부민 프로모터로부터 구동되었음을 실증한다. 스페이서의 이점은 게놈에서 고도로 발현된 좌위 내로의 표적화된 통합의 설정에 독특하다는 것이 가능하다.
실시예 13: LNP를 사용한 CRISPR/Cas9 구성요소의 반복 투약은 마우스 알부민 인트론 1로 표적화된 AAV 전달된 공여체 카세트의 발현에서 증분 증가를 초래한다
치료 유전자가 알부민의 인트론 1 내로 통합되는 유전자 편집 기초 유전자 치료법을 환자에게 투여하는 설정에서, 최적의 치료 이익을 환자에게 제공하는 유전자 발현 수준을 달성하는 것이 유리할 것이다. 예를 들어, A형 혈우병에서, 혈액 내 FVIII 단백질의 가장 바람직한 수준은 20% 내지 100%, 또는 30% 내지 100%, 또는 40% 내지 100%, 또는 50% 내지 100% 범위일 것이다. 100%를 초과하는 FVIII 수준은 혈전증 사건의 위험을 증가시키고(Jenkins 등, 2012; Br J Haematol. 157:653-63), 그러므로 바람직하지 않다. AAV 게놈의 에피솜 복사체로부터 치료 유전자의 발현을 구동하기 위해 강한 프로모터를 사용하는 표준 AAV 기초 유전자 치료법은, 달성되는 발현 수준의 임의의 제어를 가능하게 하지 않으며, 왜냐하면 AAV 바이러스가 단지 1회 투약될 수 있고 달성되는 발현 수준이 환자들 사이에서 유의하게 다양하기 때문이다(Rangarajan 등, 2017; N Engl J Med 377:2519-2530). 환자에게 AAV 바이러스가 투약된 후, 이들은 바이러스의 효과적인 재투여를 예방하는 것으로 예상되는 전임상 모델에 기초하여 바이러스 캡시드 단백질에 대해 높은 역가의 항체를 발달시킨다(Petry 등, 2008; Gene Ther. 15:54-60). AAV 바이러스에 의해 전달되는 치료 유전자가 안전한 보유 좌위, 예컨대 알부민 인트론 1에서 게놈 내로 통합되고, 이러한 표적화된 통합이 게놈에서 이중 가닥 절단부의 생성을 통해 발생하는 접근법은, 표적화된 통합 수준 및 따라서 치료 유전자 생성물의 수준을 제어하는 기회를 제공한다. 간이, 관심 치료 유전자를 인코딩하는 공여체 DNA 카세트를 함유하는 AAV 게놈을 캡슐화하는 AAV에 의해 형질도입된 후, AAV 게놈은 형질도입된 세포의 핵 내에서 에피솜으로 유지될 것이다. 이들 에피솜 AAV 게놈은 시간 경과에 따라 상대적으로 안정하고, 따라서, CRISPR/Cas9에 의해 생성된 이중 가닥 절단부에서 표적화된 통합을 위한 공여체 주형의 풀을 제공한다. AAV 전달된 공여체 주형 상에서 인코딩된 단백질의 발현에서 단계식 증가를 유도하는 비-면역원성 LNP에서 전달된 CRISPR/Cas9 구성요소를 반복된 용량으로 사용하는 잠재성을, C12-200 LNP에서 캡슐화된 spCas9 mRNA 및 mALbT1 gRNA 및 AAV8-pCB0047을 사용하여 평가하였다. 5마리 마우스의 코호트에게 2e12 vg/kg에서 AAV8-pCB0047을 꼬리 정맥에 주사하였고, 4일 이후에 1 mg/kg에서 spCas9 mRNA 및 1 mg/kg에서 mAlbT1 gRNA를 캡슐화하는 C12-200 기초 LNP를 iv로 주사하였다. 혈액 내 SEAP 수준을 다음 4주 동안 매주 측정하였고, 3306 마이크로U/ml로 평균화하였다(표 16). 마지막 SEAP 측정 후 제4주에 동일한 마우스에게 C12-200 LNP 캡슐화된 spCas9 mRNA 및 mALbT1 gRNA를 각각 1 mg/kg로 재투약하였다. 혈액 내 SEAP 수준을 다음 3주 동안 매주 측정하였고, 6900 마이크로U/ml로 평균화하였으며, 이는 제1 LNP 용량 후의 주평균 수준(mean weekly level)보다 2-배 더 높았다. 그 후에, 동일한 5마리의 마우스에게 C12-200 LNP 캡슐화된 spCas9 mRNA 및 mALbT1 gRNA를 각각 1 mg/kg로 제3 주사하였다. 혈액 내 SEAP 수준을 다음 4주 동안 매주 측정하였고, 13117 마이크로U/ml로 평균화하였으며, 이는 제2 LNP 용량 후의 주평균 수준보다 2-배 더 높았다. 이들 데이터는, LNP에서 캡슐화된 spCas9 mRNA 및 gRNA를 포함하는 CRISPR/Cas9 유전자 편집 구성요소가 AAV 전달된 공여체 주형으로부터 유전자 발현에서 단계식 증가를 초래할 수 있음을 실증한다. 공여체 주형 상에서 인코딩된 SEAP 유전자가 발현을 위해 프로모터 및 신호 펩타이드 서열에 공유 연결에 의존한다는 사실은, 증가된 발현이 알부민 인트론 1 내로의 증가된 표적화된 통합으로 인한 것임을 시사한다. 제12주에서, 마우스를 희생시키고, 전체 간을 균질화하였으며, 게놈 DNA를 추출하고, 포워드 배향(기능성 SEAP 단백질을 생성하는 데 필요한 배향)에서 예측된 5' 연접부의 측면 근접해 있는 프라이머와 함께 DD-PCR을 사용하여 알부민 인트론 1에서 표적화된 통합에 대해 검정하였다. 통합 빈도는 평균적으로 0.3%였다(100개 알부민 대립유전자당 0.3개 복사체).
Figure pct00018
실시예 14: CRISPR/Cas9에 의해 매개되는 1차 인간 간세포에서 알부민 인트론 1 내로의 SEAP 공여체의 표적화된 통합은 SEAP의 발현을 초래한다
CRISPR/Cas9 절단에 의해 매개되는 알부민 인트론 1 내로의 유전자 카세트의 표적화된 통합이 또한 인간 게놈에 특이적인 가이드 RNA를 사용하여 인간 세포에서 작동하는지 실증하기 위해, 본 발명자들은 1차 인간 간세포에서 실험을 수행하였다. 1차 인간 간세포는, 정상 표현형을 유지시키기 위해 최소 시험관내 조작을 겪은 인간 공여체의 간으로부터 수집된 인간 간세포이다. 2개의 공여체 주형을 도 14에 도시된 바와 같이 작제하였고, 시험관내에서 간세포를 형질도입하는 데 특히 효과적인 AAV-DJ 혈청형 (Grimm 등, 2008; J Virol. 82: 5887-5911) 내로 패키징하였다. AAV-DJ 바이러스를, 관련 유전자(FVIII 또는 mSEAP)의 코딩 서열 내에 위치한 프로브 및 프라이머를 사용하여 정량적 PCR에 의해 적정하여, ml당 게놈 복사체(GC)로서 표현된 역가를 초래하였다.
1차 인간 간세포(BioIVT, Westbury, NY)를 해동시키며, 간세포 회수 배지(CHRM)(Gibco)로 이전시키고, 저속에서 펠렛화한 다음, InVitro GRO™ CP 배지(BioIVT) + Torpedo™ 항생제 믹스(BioIVT)에서 콜라겐 IV(Corning)로 예비-코팅된 24-웰 플레이트에 0.7x106 세포/ml의 밀도로 평판배양하였다. 플레이트를 37℃에서 5% CO2에서 인큐베이션하였다. 세포가 부착된 후(평판배양 후 3시간 내지 4시간째), 플레이트에 부착되지 않은 사멸된 세포를 세척해 내고, 신선한 가온 완전 배지를 웰에 첨가하였다. 0.02 μg/μl mRNA 및 0.2 μMolar 가이드의 최종 농도에서 RNA를 OptiMem 배지(Gibco)에 첨가함으로써 spCas9 mRNA (Trilink에서 생산)와 hAlb T4 가이드 RNA (Synthego Corp, Menlo Park, CA에서 생산)의 지질 기초 형질주입 혼합물을 제조하였다. 여기에 Optimem에서 30-배 희석된 피로펙타민을 동일 부피로 첨가하고, 실온에서 20분 동안 인큐베이션하였다. AAV-DJ-pCB0107 또는 AAV-DJ-pCB0156을 관련 웰에 세포당 1,000 GC 내지 세포당 100,000 GC 범위의 다양한 감염 다중도(multiplicities of infection)로 첨가하였으며, 뒤이어 spCas9 mRNA / gRNA 지질 형질주입 혼합물을 즉시(5분 이내) 첨가하였다. 그 후에, 플레이트를 5% CO2, 37℃에서 72시간 동안 인큐베이션하였으며, 그 후에 배지를 수집하고, 발색성 검정법(Diapharma, Chromogenix Coatest SP Factor FVIII, cat# K824086 키트)을 사용하여 FVIII 활성에 대해 또는 상업적인 키트(InvivoGen)를 사용하여 SEAP 활성에 대해 검정하였다. 그 결과는 도 15 및 도 16에 요약되어 있다. 세포를 spCas9 mRNA 및 gRNA 단독으로 또는 SEAP 바이러스 단독으로 또는 FVIII 바이러스 단독으로 형질주입한 대조군은 낮은 수준의 SEAP 활성을 가졌으며, 세포에서 백그라운드 활성을 나타낸다. AAV-DJ-pCB0107 바이러스와 Cas9 mRNA/hAlbT4 gRNA 둘 다 형질주입되었을 때, SEAP 활성은 50,000 및 100,000의 더 높은 MOI에서 백그라운드 수준을 유의하게 초과하였다. 이들 데이터는, CRISPR/Cas9 유전자 편집 구성요소와 동일한 gRNA에 대해 절단 부위를 함유하는 AAV 전달 공여체의 조합은 공여체 인코딩된 이식유전자의 발현을 초래할 수 있음을 나타낸다. AAV 공여체에서 인코딩된 SEAP 유전자에 프로모터 또는 신호 펩타이드가 결여되어 있기 때문에 그리고 SEAP 발현이 유전자 편집 구성요소를 필요로 하였기 때문에, SEAP는 인간 알부민 인트론 1 내로 통합된 공여체의 복사체로부터 발현되었을 것 같다. 인-아웃 PCR은, 인간 알부민의 인트론 1 내로의 SEAP 공여체의 통합을 확인하는 데 사용될 수 있을 방법이다.
세포가 100, 000 MOI의 AAV-DJ-pCB0107 또는 AAV-DJ-pCB0156 바이러스 단독(Cas9 mRNA 또는 gRNA 없음)으로 형질주입된 대조군은 72시간째에 배지 중 낮거나 검출 불가능한 수준의 FVIII 활성을 나타내었다(도 16). spCas9 mRNA 및 hAlbT4 gRNA와 함께 다양한 MOI에서 AAV-DJ-pCB0156 바이러스로 형질주입된 세포는 72시간째에 배지에서 측정 가능한 수준의 FVIII 활성을 가졌으며, 상기 수준은 0.2 내지 0.6 mIU/ml 범위였다. 이들 데이터는, CRISPR/Cas9 유전자 편집 구성요소와 동일한 gRNA에 대해 절단 부위를 함유하는 AAV 전달 공여체의 조합은 공여체 인코딩된 FVIII 이식유전자의 발현을 초래할 수 있음을 나타낸다. AAV 공여체에서 인코딩된 FVIII 유전자에 프로모터 또는 신호 펩타이드가 결여되어 있기 때문에 그리고 FVIII 발현이 유전자 편집 구성요소를 필요로 하였기 때문에, FVIII는 인간 알부민 인트론 1 내로 통합된 공여체의 복사체로부터 발현되었을 것 같다. 인-아웃 PCR은, 인간 알부민의 인트론 1 내로의 FVIII 공여체의 통합을 확인하는 데 사용될 수 있을 방법이다.
실시예 15: CRISPR/Cas9에 의해 매개되는 NSG 마우스 모델에서 알부민 인트론 1 내로의 인자 IX 공여체의 표적화된 통합은 인자 IX의 발현을 초래한다
CRISPR/Cas9 절단에 의해 매개되는 알부민 인트론 1 내로의 유전자 카세트의 표적화된 통합이 다른 관심 유전자에 이용될 수 있는지 실증하기 위해, 추가 실험을 설계하여, FIX 공여체 서열을 함유하는 AAV-기초 벡터 및 Cas9 mRNA 및 gRNA 표적화 알부민 인트론 1(서열번호 80)을 함유하는 LNP의 투여 시 NSG 마우스에서 혈액 응고 인자 IX(F9, FIX)의 발현을 평가하였다. FIX의 생물학적 중요성은, 정량적으로(낮은 활성 및 낮은 항원) 그리고/또는 정성적으로(낮은 활성 및 정상 항원) FIX 기능의 결함으로 인한 X-연관 선천적 출혈 질환인 B형 혈우병(크리스마스 질환)에서 실증된다.
이들 실험(CB1022)에 사용된 AAV8 벡터의 개략도는 도 17a에 도시되어 있다. 인간 미세부수체 서열로부터 유래된 스터퍼 서열을 AAV 벡터 내로 혼입하여, 실시예 14에 기재된 FVIII을 인코딩하는 벡터와 유사한 크기를 유지시켜 더욱 직접적인 비교를 가능하게 하였다. FIX를 인코딩하는 코돈-최적화된 서열은 서열 목록에서 서열번호 105로서 제공된다. 이들 실험에서, FIX 발현을, Sharma 등 (In vivo genome editing of the albumin locus as a platform for protein replacement therapy. Blood , 126(15):1777-1784, 2015)에 기재된 바와 같이 Affinity Biologicals로부터의 VisuLize hFactor IX 항원 ELISA 키트를 사용함으로써 평가하였다. FIX가 FVIII과 비교하여 더 작은 단백질이기 때문에, FIX는 FVIII와 비교하여 더 높은 수준으로 발현되어야 하며, 이는 더 작은 AAV 공여체의 더 양호한 통합 효율로 인한 것일 것으로 예측된다. AAV 벡터의 3개의 상이한 용량을 하기와 같이 FIX의 발현 수준을 조사하기 위해 꼬리 정맥 주사에 의해 15마리 마우스(5마리로 구성된 3개 군)에서 시험하였다:
Figure pct00019
4주 후, 냉동된 LNP를 2 mg/kg 총 RNA로 투약하였다. 이들 실험에 사용된 LNP는 Cas9 mRNA 또는 mALbgRNA_T1 (서열번호 80)을 캡슐화하는 냉동된 LNP 제형이었으며, gRNA LNP 및 Cas9 mRNA LNP를 주사 전에 RNA 질량에 의해 계산된 바와 같이 1:1 비로 혼합하였다. 동일한 냉동된 LNP 제형은 별도의 연구에서 2 mg/kg에서 33% INDELS를 산출하는 것으로 나타났다. FIX 발현 수준을, LNP 투약 후 제10일 및 제24일에 안와(RO) 채혈을 통해, Sharma 등(상기 2015)에 기재된 바와 같이 Affinity Biologicals로부터의 VisuLize hFactor IX 항원 ELISA 키트를 사용함으로써 측정하였고, 3개의 상이한 항원 희석: 1:50, 1:200; 및 1:400이었다. 하기 표 18에 요약된 바와 같이, 낮은 수준의 hFIX 활성은 1 × 1013 (대략 4%) 및 2 × 1012 (대략 1.5%) vg/kg의 AAV8-CB1022 벡터가 투약된 NSG 마우스에서 제10일에 검출되었다. 제24일에, 낮은 수준의 FIX는 1 × 1013으로 투약된 NSG 마우스에서 유지되었다. 표적화된 통합(TI) 효율을 제24일에 평가하였으며, 그 결과는 하기 표 18 및 도 17b에 요약되어 있다.
Figure pct00020
이 실시예에서 기재된 결과는, CRISPR/Cas9 절단에 의해 매개되는 알부민 인트론 1 내로의 유전자 카세트의 표적화된 통합이 다른 관심 유전자에 이용될 수 있음을 실증한다.
실시예 16: CRISPR/Cas9에 의해 매개되는 NSG 마우스 모델에서 알부민 인트론 1 내로의 세르핀 G1 공여체의 표적화된 통합은 세르핀 G1의 발현을 초래한다
이 실시예는, CRISPR/Cas9-매개 절단이, 알부민 인트론 1 내로의 마우스 세르핀 G1/C1 저해제 유전자에 대한 유전자 카세트의 통합을 표적화하는 데 사용될 수 있음을 실증하기 위해 수행된 실험 결과를 기재한다. 이들 실험(CB1045)에서 사용된 AAV 벡터의 개략도는 도 18a에 도시되어 있으며, 여기서, 인간 미세부수체 서열로부터 유래된 스터퍼 서열을 AAV 벡터 내로 혼입하여, 실시예 14 내지 15에 기재된 FVIII 및 FIX를 인코딩하는 벡터와 유사한 크기를 유지시켜 더욱 직접적인 비교를 가능하게 하였다. SERPING1 유전자는 세린 프로테아제 저해제(세르핀)인 C1 저해제를 인코딩한다. C1 저해제는 염증을 포함하여 혈관을 유지시키는 데 관여하는 광범위한 과정을 제어하는 데 중요하다. 염증은 감염, 자극 또는 다른 손상에 대한 정상적인 신체 반응이다. 특히, C1 저해제는 혈장 칼리크레인(kallikrein) 및 인자 XII의 활성화된 형태를 포함하여 혈액 내 몇몇 단백질의 활성을 차단한다. SERPING1에서의 돌연변이는 유전성 혈관부종(HAE)을 초래하며, 이는 10,000명 중 약 1명 내지 50,000명 중 1명에서 발생하는 매우 드물고 잠재적으로 생명-위협성 유전적 병태이다.
실험은, 성숙 SERPIN G1 CDS를 NSG 마우스에서 AAV8를 통해 알부민 좌위로 전달하고 CRISPR/Cas9를 통해 통합시키도록 설계되었다. 도 18a에 도시된 바와 같이, SERPIN G1은 또한, FVIII과 비교하여 더 짧은 공여체 서열이며, 따라서, AAV 벡터는 각각 패키징 용량을 유지시키기 위해 스터퍼 단편을 포함하였다. 이들 실험에서, 알부민으로부터의 C1 저해제 발현을, Abcam으로부터의 인간 C1 저해제 ELISA 키트(ab224883)에 의해 측정하였다. 이들 실험에 사용된 성숙 SERPING1 코딩 서열(CDS)은 서열 목록에서 서열번호 106으로서 제공된다. AAV 벡터 CB1045의 2개의 상이한 용량을 하기와 같이 SERPING1의 발현 수준을 조사하기 위해 꼬리 정맥 주사에 의해 15마리 마우스(5마리로 구성된 3개 군)에서 시험하였다:
Figure pct00021
4주 후, 냉동된 LNP를 1 mg/kg 총 RNA로 1군 및 2군의 동물에게 투약하였다. 이들 실험에 사용된 C12-200 LNP는 Cas9 mRNA 또는 mALB gRNA(서열번호 80)을 캡슐화하는 냉동된 LNP 제형이었으며, gRNA LNP 및 Cas9 mRNA LNP를 주사 전에 RNA 질량에 의해 계산된 바와 같이 1:1 비로 혼합하였다. SERPING1 발현 수준을, LNP 투약 후 제11일 및 제17일에 안와(RO) 채혈을 통해, Abcam으로부터의 인간 C1 저해제 ELISA 키트(ab224883)를 사용함으로써 측정하였다. 도 18b에 요약된 바와 같이, 마우스 mALB 좌위로부터 발현된 SERPING1 활성은 1군 및 2군의 NSG 마우스에서 제11일에 관찰되었다.
이 실시예에서 기재된 결과는, CRISPR/Cas9-매개 절단이 알부민 인트론 1 내로의, 마우스 SERPING1 유전자에 의해 예시된 바와 같이 다른 관심 유전자에 대한 유전자 카세트의 통합을 표적화하는 데 이용될 수 있음을 추가로 확인시켜 준다.
본 개시내용이 어느 정도의 길이로 그리고 몇몇 기재된 구현예에 관하여 특히 어느 정도 기재되긴 하였지만, 본 개시내용은 임의의 이러한 특정물 또는 구현예 또는 임의의 특정 구현예로 제한되어야 하는 것으로 의도되지 않지만, 선행 기술의 측면에서 이러한 청구항의 가장 넓은 가능한 해석을 제공하기 위해 첨부된 청구항을 참조로 간주되어야 하고, 따라서 본 개시내용의 의도된 범위를 효과적으로 포괄하는 것으로 간주되어야 한다.
SEQUENCE LISTING <110> Casebia Therapeutics Limited Liability Partnership <120> Compositions and Methods for Delivering Transgenes <130> 052984-535001WO <140> Herewith <141> Herewith <150> US 62/747,128 <151> 2018-10-17 <160> 111 <170> PatentIn version 3.5 <210> 1 <211> 14 <212> PRT <213> Artificial sequence <220> <223> Synthetic polypeptide <220> <221> misc_feature <223> linker peptide <400> 1 Ser Phe Ser Gln Asn Pro Pro Val Leu Lys Arg His Gln Arg 1 5 10 <210> 2 <211> 25 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> synthetic splice acceptor <400> 2 ctgacctctt ctcttcctcc cacag 25 <210> 3 <211> 32 <212> DNA <213> Homo sapiens <220> <221> misc_feature <223> native albumin intron 1/exon 2 splice acceptor, human <400> 3 ttaacaatcc ttttttttct tcccttgccc ag 32 <210> 4 <211> 40 <212> DNA <213> Mus musculus <220> <221> misc_feature <223> native albumin intron 1/exon 2 splice acceptor, mouse <400> 4 ttaaatatgt tgtgtggttt ttctctccct gtttccacag 40 <210> 5 <211> 49 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> consensus synthetic poly A signal sequence <400> 5 aataaaagat ctttattttc attagatctg tgtgttggtt ttttgtgtg 49 <210> 6 <211> 9 <212> PRT <213> Artificial sequence <220> <223> Synthetic polypeptide <400> 6 Leu Ala Gly Leu Ile Asp Ala Asp Gly 1 5 <210> 7 <211> 20 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> target site <400> 7 tgcctttacc ccatcgttac 20 <210> 8 <211> 20 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> target site <400> 8 tgcctcctcc cgatagttac 20 <210> 9 <211> 20 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> target site <400> 9 ggacagttcc tgattgttac 20 <210> 10 <211> 20 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> target site <400> 10 tgccttttcc cgattgttaa 20 <210> 11 <211> 20 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> MALBF3 primer <400> 11 ttattacggt ctcatagggc 20 <210> 12 <211> 21 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> MALBR5 primer <400> 12 agtctttctg tcaatgcaca c 21 <210> 13 <211> 100 <212> RNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> gRNA <220> <221> misc_feature <222> (1)..(2) <223> phosphorothioate linkage <220> <221> modified_base <222> (1)..(1) <223> um <220> <221> misc_feature <222> (2)..(3) <223> phosphorothioate linkage <220> <221> modified_base <222> (2)..(2) <223> gm <220> <221> modified_base <222> (3)..(3) <223> cm <220> <221> misc_feature <222> (3)..(4) <223> phosphorothioate linkage <220> <221> modified_base <222> (29)..(29) <223> gm <220> <221> modified_base <222> (30)..(30) <223> cm <220> <221> modified_base <222> (31)..(31) <223> um <220> <221> modified_base <222> (32)..(32) <223> 2'-O-methyladenosine <220> <221> modified_base <222> (37)..(37) <223> um <220> <221> modified_base <222> (38)..(38) <223> 2'-O-methyladenosine <220> <221> modified_base <222> (39)..(39) <223> gm <220> <221> modified_base <222> (40)..(40) <223> cm <220> <221> modified_base <222> (68)..(69) <223> 2'-O-methyladenosine <220> <221> modified_base <222> (70)..(70) <223> cm <220> <221> modified_base <222> (71)..(72) <223> um <220> <221> modified_base <222> (77)..(78) <223> 2'-O-methyladenosine <220> <221> modified_base <222> (79)..(79) <223> gm <220> <221> modified_base <222> (80)..(80) <223> um <220> <221> modified_base <222> (81)..(82) <223> gm <220> <221> modified_base <222> (83)..(83) <223> cm <220> <221> modified_base <222> (84)..(84) <223> 2'-O-methyladenosine <220> <221> modified_base <222> (85)..(85) <223> cm <220> <221> modified_base <222> (86)..(86) <223> cm <220> <221> modified_base <222> (87)..(87) <223> gm <220> <221> modified_base <222> (88)..(88) <223> 2'-O-methyladenosine <220> <221> modified_base <222> (89)..(89) <223> gm <220> <221> modified_base <222> (90)..(90) <223> um <220> <221> modified_base <222> (91)..(91) <223> cm <220> <221> modified_base <222> (92)..(93) <223> gm <220> <221> modified_base <222> (94)..(94) <223> um <220> <221> modified_base <222> (95)..(95) <223> gm <220> <221> modified_base <222> (96)..(96) <223> cm <220> <221> misc_feature <222> (97)..(98) <223> phosphorothioate linkage <220> <221> modified_base <222> (97)..(99) <223> um <220> <221> misc_feature <222> (98)..(99) <223> phosphorothioate linkage <220> <221> misc_feature <222> (99)..(100) <223> phosphorothioate linkage <400> 13 ugccaguucc cgaucguuac guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 14 <211> 20 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Albumin forward primer <400> 14 ccctccgttt gtcctagctt 20 <210> 15 <211> 19 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Albumin reverse primer <400> 15 tctacgaggc agcactgtt 19 <210> 16 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> AAVS1 forward primer <400> 16 aactgcttct cctcttggga agt 23 <210> 17 <211> 25 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> AAVS1 reverse primer <400> 17 cctctccatc ctcttgcttt ctttg 25 <210> 18 <211> 23 <212> DNA <213> Homo sapiens <220> <221> misc_feature <223> Human Albumin Intron-1_T1 <400> 18 taattttctt ttgcgcacta agg 23 <210> 19 <211> 23 <212> DNA <213> Homo sapiens <220> <221> misc_feature <223> Human Albumin Intron-1_T2 <400> 19 tagtgcaatg gataggtctt tgg 23 <210> 20 <211> 23 <212> DNA <213> Homo sapiens <220> <221> misc_feature <223> Human Albumin Intron-1_T3 <400> 20 agtgcaatgg ataggtcttt ggg 23 <210> 21 <211> 23 <212> DNA <213> Homo sapiens <220> <221> misc_feature <223> Human Albumin Intron-1_T4 <400> 21 taaagcatag tgcaatggat agg 23 <210> 22 <211> 23 <212> DNA <213> Homo sapiens <220> <221> misc_feature <223> Human Albumin Intron-1_T5 <400> 22 atttatgaga tcaacagcac agg 23 <210> 23 <211> 23 <212> DNA <213> Homo sapiens <220> <221> misc_feature <223> Human Albumin Intron-1_T6 <400> 23 tgattcctac agaaaaactc agg 23 <210> 24 <211> 23 <212> DNA <213> Homo sapiens <220> <221> misc_feature <223> Human Albumin Intron-1_T7 <400> 24 tgtatttgtg aagtcttaca agg 23 <210> 25 <211> 23 <212> DNA <213> Homo sapiens <220> <221> misc_feature <223> Human Albumin Intron-1_T8 <400> 25 gactgaaact tcacagaata ggg 23 <210> 26 <211> 23 <212> DNA <213> Homo sapiens <220> <221> misc_feature <223> Human Albumin Intron-1_T9 <400> 26 aatgcataat ctaagtcaaa tgg 23 <210> 27 <211> 23 <212> DNA <213> Homo sapiens <220> <221> misc_feature <223> Human Albumin Intron-1_T10 <400> 27 tgactgaaac ttcacagaat agg 23 <210> 28 <211> 23 <212> DNA <213> Homo sapiens <220> <221> misc_feature <223> Human Albumin Intron-1_T11 <400> 28 ttaaataaag catagtgcaa tgg 23 <210> 29 <211> 23 <212> DNA <213> Homo sapiens <220> <221> misc_feature <223> Human Albumin Intron-1_T12 <400> 29 gatcaacagc acaggttttg tgg 23 <210> 30 <211> 23 <212> DNA <213> Homo sapiens <220> <221> misc_feature <223> Human Albumin Intron-1_T13 <400> 30 taataaaatt caaacatcct agg 23 <210> 31 <211> 23 <212> DNA <213> Homo sapiens <220> <221> misc_feature <223> Human Albumin Intron-1_T14 <400> 31 ttcattttag tctgtcttct tgg 23 <210> 32 <211> 23 <212> DNA <213> Homo sapiens <220> <221> misc_feature <223> Human Albumin Intron-1_T15 <400> 32 attatctaag tttgaatata agg 23 <210> 33 <211> 23 <212> DNA <213> Homo sapiens <220> <221> misc_feature <223> Human Albumin Intron-1_T16 <400> 33 atcatcctga gtttttctgt agg 23 <210> 34 <211> 23 <212> DNA <213> Homo sapiens <220> <221> misc_feature <223> Human Albumin Intron-1_T17 <400> 34 gcatctttaa agaattattt tgg 23 <210> 35 <211> 23 <212> DNA <213> Homo sapiens <220> <221> misc_feature <223> Human Albumin Intron-1_T18 <400> 35 tactaaaact ttattttact ggg 23 <210> 36 <211> 23 <212> DNA <213> Homo sapiens <220> <221> misc_feature <223> Human Albumin Intron-1_T19 <400> 36 tgaattattc ttctgtttaa agg 23 <210> 37 <211> 23 <212> DNA <213> Homo sapiens <220> <221> misc_feature <223> Human Albumin Intron-1_T20 <400> 37 aatttttaaa atagtattct tgg 23 <210> 38 <211> 23 <212> DNA <213> Homo sapiens <220> <221> misc_feature <223> Human Albumin Intron-1_T21 <400> 38 atgcatttgt ttcaaaatat tgg 23 <210> 39 <211> 23 <212> DNA <213> Homo sapiens <220> <221> misc_feature <223> Human Albumin Intron-1_T22 <400> 39 tttggcattt atttctaaaa tgg 23 <210> 40 <211> 23 <212> DNA <213> Homo sapiens <220> <221> misc_feature <223> Human Albumin Intron-1_T23 <400> 40 aaagttgaac aatagaaaaa tgg 23 <210> 41 <211> 23 <212> DNA <213> Homo sapiens <220> <221> misc_feature <223> Human Albumin Intron-1_T24 <400> 41 ttactaaaac tttattttac tgg 23 <210> 42 <211> 23 <212> DNA <213> Homo sapiens <220> <221> misc_feature <223> Human Albumin Intron-1_T26 <400> 42 tgcatttgtt tcaaaatatt ggg 23 <210> 43 <211> 23 <212> DNA <213> Homo sapiens <220> <221> misc_feature <223> Human Albumin Intron-1_T27 <400> 43 tgggcaaggg aagaaaaaaa agg 23 <210> 44 <211> 23 <212> DNA <213> Homo sapiens <220> <221> misc_feature <223> Human Albumin Intron-1_T28 <400> 44 tcctaggtaa aaaaaaaaaa agg 23 <210> 45 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 45 taattttctt ttgcccacta agg 23 <210> 46 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 46 tagtgcaatg gataggtctt agg 23 <210> 47 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 47 agtgcaatgg ataggtctta ggg 23 <210> 48 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 48 taaagcatag tgcaatggat agg 23 <210> 49 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 49 atttatgaga tcaacagcac agg 23 <210> 50 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 50 tgattcctac agaaaaagtc agg 23 <210> 51 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 51 aatgcataat ctaagtcaaa tgg 23 <210> 52 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 52 ttaaataaag catagtgcaa tgg 23 <210> 53 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 53 atttatgaga tcaacagcac agg 23 <210> 54 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 54 taataaaatt caaacatcct agg 23 <210> 55 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 55 attatcctga ctttttctgt agg 23 <210> 56 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 56 tactaaaact ttattttact tgg 23 <210> 57 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 57 tgaattattc ctctgtttaa agg 23 <210> 58 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 58 atgcatttgt ttcaaaatat tgg 23 <210> 59 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 59 tttggcattt atttctaaaa tgg 23 <210> 60 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 60 aaagttgaac aatagaaaaa tgg 23 <210> 61 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 61 tgcatttgtt tcaaaatatt ggg 23 <210> 62 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 62 taattttctt ttgcccacta agg 23 <210> 63 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 63 tagtgcaatg gataggtctt agg 23 <210> 64 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 64 agtgcaatgg ataggtctta ggg 23 <210> 65 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 65 taaagcatag tgcaatggat agg 23 <210> 66 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 66 atttatgaga tcaacagcac agg 23 <210> 67 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 67 tgattcctac agaaaaagtc agg 23 <210> 68 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 68 aatgcataat ctaagtcaaa tgg 23 <210> 69 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 69 ttaaataaag catagtgcaa tgg 23 <210> 70 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 70 atttatgaga tcaacagcac agg 23 <210> 71 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 71 taataaaatt caaacatcct agg 23 <210> 72 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 72 attatcctga ctttttctgt agg 23 <210> 73 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 73 tactaaaact ttattttact tgg 23 <210> 74 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 74 tgaattattc ctctgtttaa agg 23 <210> 75 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 75 atgcatttgt ttcaaaatat tgg 23 <210> 76 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 76 tttggcattt atttctaaaa tgg 23 <210> 77 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 77 aaagttgaac aatagaaaaa tgg 23 <210> 78 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 78 tgcatttgtt tcaaaatatt ggg 23 <210> 79 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 79 tggggaaggg gagaaaaaaa agg 23 <210> 80 <211> 23 <212> DNA <213> Mus musculus <220> <221> misc_feature <223> Mouse albumin intron 1 gRNA sequence, mALbgRNA_T1 <220> <221> misc_feature <222> (21)..(23) <223> PAM sequence <400> 80 tgccagttcc cgatcgttac agg 23 <210> 81 <211> 4438 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> spCas9 mRNA <400> 81 ggaaataaga gagaaaagaa gagtaagaag aaatataaga gccaccatgg ccccaaagaa 60 gaagcggaag gtcggtatcc acggagtccc agcagccgac aagaagtaca gcatcggcct 120 ggacatcggc accaactctg tgggctgggc cgtgatcacc gacgagtaca aggtgcccag 180 caagaaattc aaggtgctgg gcaacaccga ccggcacagc atcaagaaga acctgatcgg 240 agccctgctg ttcgacagcg gcgaaacagc cgaggccacc cggctgaaga gaaccgccag 300 aagaagatac accagacgga agaaccggat ctgctatctg caagagatct tcagcaacga 360 gatggccaag gtggacgaca gcttcttcca cagactggaa gagtccttcc tggtggaaga 420 ggacaagaag cacgagagac accccatctt cggcaacatc gtggacgagg tggcctacca 480 cgagaagtac cccaccatct accacctgag aaagaaactg gtggacagca ccgacaaggc 540 cgacctgaga ctgatctacc tggccctggc ccacatgatc aagttcagag gccacttcct 600 gatcgagggc gacctgaacc ccgacaacag cgacgtggac aagctgttca tccagctggt 660 gcagacctac aaccagctgt tcgaggaaaa ccccatcaac gccagcggcg tggacgccaa 720 ggctatcctg tctgccagac tgagcaagag cagaaggctg gaaaatctga tcgcccagct 780 gcccggcgag aagaagaacg gcctgttcgg caacctgatt gccctgagcc tgggcctgac 840 ccccaacttc aagagcaact tcgacctggc cgaggatgcc aaactgcagc tgagcaagga 900 cacctacgac gacgacctgg acaacctgct ggcccagatc ggcgaccagt acgccgacct 960 gttcctggcc gccaagaacc tgtctgacgc catcctgctg agcgacatcc tgagagtgaa 1020 caccgagatc accaaggccc ccctgagcgc ctctatgatc aagagatacg acgagcacca 1080 ccaggacctg accctgctga aagctctcgt gcggcagcag ctgcctgaga agtacaaaga 1140 aatcttcttc gaccagagca agaacggcta cgccggctac atcgatggcg gcgctagcca 1200 ggaagagttc tacaagttca tcaagcccat cctggaaaag atggacggca ccgaggaact 1260 gctcgtgaag ctgaacagag aggacctgct gagaaagcag agaaccttcg acaacggcag 1320 catcccccac cagatccacc tgggagagct gcacgctatc ctgagaaggc aggaagattt 1380 ttacccattc ctgaaggaca accgggaaaa gatcgagaag atcctgacct tcaggatccc 1440 ctactacgtg ggccccctgg ccagaggcaa cagcagattc gcctggatga ccagaaagag 1500 cgaggaaacc atcaccccct ggaacttcga ggaagtggtg gacaagggcg ccagcgccca 1560 gagcttcatc gagagaatga caaacttcga taagaacctg cccaacgaga aggtgctgcc 1620 caagcacagc ctgctgtacg agtacttcac cgtgtacaac gagctgacca aagtgaaata 1680 cgtgaccgag ggaatgagaa agcccgcctt cctgagcggc gagcagaaaa aggccatcgt 1740 ggacctgctg ttcaagacca acagaaaagt gaccgtgaag cagctgaaag aggactactt 1800 caagaaaatc gagtgcttcg actccgtgga aatctccggc gtggaagata gattcaacgc 1860 ctccctgggc acataccacg atctgctgaa aattatcaag gacaaggact tcctggataa 1920 cgaagagaac gaggacattc tggaagatat cgtgctgacc ctgacactgt ttgaggaccg 1980 cgagatgatc gaggaaaggc tgaaaaccta cgctcacctg ttcgacgaca aagtgatgaa 2040 gcagctgaag agaaggcggt acaccggctg gggcaggctg agcagaaagc tgatcaacgg 2100 catcagagac aagcagagcg gcaagacaat cctggatttc ctgaagtccg acggcttcgc 2160 caaccggaac ttcatgcagc tgatccacga cgacagcctg acattcaaag aggacatcca 2220 gaaagcccag gtgtccggcc agggcgactc tctgcacgag catatcgcta acctggccgg 2280 cagccccgct atcaagaagg gcatcctgca gacagtgaag gtggtggacg agctcgtgaa 2340 agtgatgggc agacacaagc ccgagaacat cgtgatcgag atggctagag agaaccagac 2400 cacccagaag ggacagaaga actcccgcga gaggatgaag agaatcgaag agggcatcaa 2460 agagctgggc agccagatcc tgaaagaaca ccccgtggaa aacacccagc tgcagaacga 2520 gaagctgtac ctgtactacc tgcagaatgg ccgggatatg tacgtggacc aggaactgga 2580 catcaacaga ctgtccgact acgatgtgga ccatatcgtg cctcagagct ttctgaagga 2640 cgactccatc gataacaaag tgctgactcg gagcgacaag aacagaggca agagcgacaa 2700 cgtgccctcc gaagaggtcg tgaagaagat gaagaactac tggcgacagc tgctgaacgc 2760 caagctgatt acccagagga agttcgataa cctgaccaag gccgagagag gcggcctgag 2820 cgagctggat aaggccggct tcatcaagag gcagctggtg gaaaccagac agatcacaaa 2880 gcacgtggca cagatcctgg actcccggat gaacactaag tacgacgaaa acgataagct 2940 gatccgggaa gtgaaagtga tcaccctgaa gtccaagctg gtgtccgatt tccggaagga 3000 tttccagttt tacaaagtgc gcgagatcaa caactaccac cacgcccacg acgcctacct 3060 gaacgccgtc gtgggaaccg ccctgatcaa aaagtaccct aagctggaaa gcgagttcgt 3120 gtacggcgac tacaaggtgt acgacgtgcg gaagatgatc gccaagagcg agcaggaaat 3180 cggcaaggct accgccaagt acttcttcta cagcaacatc atgaactttt tcaagaccga 3240 aatcaccctg gccaacggcg agatcagaaa gcgccctctg atcgagacaa acggcgaaac 3300 cggggagatc gtgtgggata agggcagaga cttcgccaca gtgcgaaagg tgctgagcat 3360 gccccaagtg aatatcgtga aaaagaccga ggtgcagaca ggcggcttca gcaaagagtc 3420 tatcctgccc aagaggaaca gcgacaagct gatcgccaga aagaaggact gggaccccaa 3480 gaagtacggc ggcttcgaca gccctaccgt ggcctactct gtgctggtgg tggctaaggt 3540 ggaaaagggc aagtccaaga aactgaagag tgtgaaagag ctgctgggga tcaccatcat 3600 ggaaagaagc agctttgaga agaaccctat cgactttctg gaagccaagg gctacaaaga 3660 agtgaaaaag gacctgatca tcaagctgcc taagtactcc ctgttcgagc tggaaaacgg 3720 cagaaagaga atgctggcct ctgccggcga actgcagaag ggaaacgagc tggccctgcc 3780 tagcaaatat gtgaacttcc tgtacctggc ctcccactat gagaagctga agggcagccc 3840 tgaggacaac gaacagaaac agctgtttgt ggaacagcat aagcactacc tggacgagat 3900 catcgagcag atcagcgagt tctccaagag agtgatcctg gccgacgcca atctggacaa 3960 ggtgctgtct gcctacaaca agcacaggga caagcctatc agagagcagg ccgagaatat 4020 catccacctg ttcaccctga caaacctggg cgctcctgcc gccttcaagt actttgacac 4080 caccatcgac cggaagaggt acaccagcac caaagaggtg ctggacgcca ccctgatcca 4140 ccagagcatc accggcctgt acgagacaag aatcgacctg tctcagctgg gaggcgacaa 4200 gagacctgcc gccactaaga aggccggaca ggccaaaaag aagaagtgag cggccgctta 4260 attaagctgc cttctgcggg gcttgccttc tggccatgcc cttcttctct cccttgcacc 4320 tgtacctctt ggtctttgaa taaagcctga gtaggaagaa aaaaaaaaaa aaaaaaaaaa 4380 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaa 4438 <210> 82 <211> 25 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Synthetic splice acceptor <400> 82 ctgacctctt ctcttcctcc cacag 25 <210> 83 <211> 42 <212> DNA <213> Mus musculus <220> <221> misc_feature <223> Mouse albumin Intron 1 splice acceptor <400> 83 ctttaaatat gttgtgtggt ttttctctcc ctgtttccac ag 42 <210> 84 <211> 33 <212> DNA <213> Mus musculus <220> <221> misc_feature <223> Mouse albumin Intron 2 splice acceptor <400> 84 cctcatactg aggtttttgt gtctgctttt cag 33 <210> 85 <211> 32 <212> DNA <213> Homo sapiens <220> <221> misc_feature <223> Human albumin Intron 1 splice acceptor <400> 85 ttaacaatcc ttttttttct tcccttgccc ag 32 <210> 86 <211> 34 <212> DNA <213> Homo sapiens <220> <221> misc_feature <223> Human albumin Intron 2 splice acceptor <400> 86 attatactac atttttctac atcctttgtt tcag 34 <210> 87 <211> 4402 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> MAB8A <400> 87 aattgctgac ctcttctctt cctcccacag tggccaccag aagatactac ctcggagccg 60 tcgaattgag ctgggattac atgcaatccg acctgggaga actgcccgtg gatgccaggt 120 ttcctcctcg ggtccccaag tccttcccgt tcaacacctc agtcgtctac aagaaaaccc 180 tcttcgtgga gttcaccgac catctgttca acatcgccaa gccaagaccc ccgtggatgg 240 gactcctcgg tccgaccatc caagccgaag tgtacgacac tgtggtcatt accctgaaga 300 acatggcctc ccatcctgtg tccctgcatg cagtgggcgt gtcctactgg aaggcttccg 360 aaggggccga gtacgacgat caaaccagcc agcgggaaaa ggaggatgac aaagtgttcc 420 cgggtggttc gcacacctac gtgtggcaag tgctcaagga gaacggtcct atggcctctg 480 atcccctgtg tctgacctac tcctacctgt cccatgtcga cctcgtgaag gatctgaaca 540 gcgggctgat tggcgccctg ctcgtgtgcc gggaaggctc cctggccaag gaaaagaccc 600 agacactgca caagttcatc ttgctgttcg ccgtgtttga tgagggaaag tcctggcata 660 gcgagactaa gaactccctt atgcaagacc gggatgctgc ctccgctagg gcttggccta 720 agatgcatac tgtgaacgga tacgtgaaca gatccctgcc tggccttatc ggttgccacc 780 ggaagtccgt gtattggcat gtgatcggca tgggaaccac tccagaggtg cactccattt 840 tcttggaggg gcataccttc ttggtgcgca accacagaca ggcctccctg gaaatttctc 900 cgatcacttt cctgactgcc cagaccctcc ttatggacct gggtcagttc ctgctgttct 960 gccacatttc gtcccaccaa cacgatggca tggaagccta cgtgaaagtg gactcgtgcc 1020 cggaagaacc acagctgcgg atgaagaaca acgaagaggc agaggactac gatgatgatc 1080 ttaccgattc ggaaatggat gtggtccgat tcgacgacga taatagccca tccttcatcc 1140 aaattaggag cgtggccaag aagcacccca aaacttgggt gcattacatt gcggccgagg 1200 aagaggattg ggactacgca cccctcgtgc ttgcacccga tgatcggtcc tacaagtccc 1260 aatacctgaa caacggcccg cagaggatcg gtcggaagta taagaaagtg cgcttcatgg 1320 cctacaccga cgagactttc aagaccagag aggccattca gcacgaaagc ggcattctgg 1380 ggccgctgtt gtacggggag gtcggagata cactgctcat cattttcaag aaccaggcgt 1440 ccagacccta caacatctac ccgcacggaa tcactgacgt ccgccccctg tactcccgga 1500 gactcccgaa gggagtcaag cacttgaaag acttccccat cctgcctggg gaaatcttca 1560 agtacaagtg gaccgtgacc gtcgaggatg ggccgaccaa gtccgatcca agatgcctca 1620 ctagatacta ctcatccttc gtcaacatgg aacgggacct ggcctcagga ctgattggcc 1680 ccctgctcat ctgctacaag gagtccgtgg atcagcgcgg aaaccagatc atgtcggaca 1740 aacgcaacgt catcctcttc tccgtctttg acgagaaccg ctcatggtac cttacggaga 1800 acatccagcg gttcctcccc aaccctgccg gagtgcagct cgaggacccg gaattccagg 1860 catcaaacat tatgcactcc atcaacggtt acgtgttcga cagcctccag cttagcgtgt 1920 gcctccatga agtcgcatat tggtacatcc tgtccattgg agcacaaacc gactttctct 1980 ccgtgttctt ctccggatat accttcaagc acaagatggt gtacgaggat accctgaccc 2040 tcttcccctt ctccggagag actgtgttta tgtcgatgga aaacccaggc ctgtggattt 2100 tggggtgcca caactcggat ttccgaaacc ggggcatgac tgccttgctc aaggtgtcct 2160 cctgtgacaa gaacacggga gactactacg aggactccta cgaggatatt tccgcctacc 2220 tcctgtccaa gaacaacgcc atcgaaccca ggtccttcag ccagaaccct cctgtcctca 2280 agcgccatca gagagaaatc acccgcacga ccctgcagtc cgaccaggaa gagatcgatt 2340 acgacgacac tatctccgtc gaaatgaaga aggaggactt tgacatctac gacgaagatg 2400 aaaatcagtc ccctcgctcg ttccaaaaga aaacgagaca ctacttcatc gctgctgtgg 2460 agcggctctg ggactacggc atgtcctcat cgccccacgt gcttaggaac cgggctcaat 2520 ccgggagcgt ccctcagttc aagaaagtgg tgtttcaaga attcaccgat ggaagcttca 2580 cgcagccgtt gtacaggggc gaactgaacg agcaccttgg cctgctggga ccttacatca 2640 gagcagaggt cgaggacaac atcatggtga ccttccggaa ccaagcctcc cggccatatt 2700 cattctactc gagccttatc tcatacgagg aggatcagag acagggggct gaacctcgga 2760 agaacttcgt caagccgaac gagacaaaga cctacttttg gaaggtgcag caccacatgg 2820 ccccgaccaa ggatgagttc gactgcaagg cctgggcgta cttctccgac gtggatctcg 2880 aaaaggacgt gcattccggg ctgatcggac cgctgctcgt ctgccacact aacaccctca 2940 atcctgctca cggcagacaa gtgaccgtgc aggagttcgc cctgttcttc accatcttcg 3000 acgaaactaa gtcatggtac tttaccgaga acatggagcg gaattgtcgg gccccatgta 3060 acatccagat ggaggacccg acattcaagg agaactaccg gttccacgcc attaacggat 3120 acattatgga cactcttccg ggactcgtga tggcacagga ccaacgcatc agatggtatc 3180 ttctgtcgat ggggagcaac gaaaacatcc attcgatcca ctttagcggt cacgtgttca 3240 cagtgcgcaa gaaggaagag tacaagatgg cgctgtacaa cctgtaccct ggggtgttcg 3300 agactgtgga aatgctgccg tccaaggccg gaatttggcg cgtggaatgt ctgatcggtg 3360 aacatctgca tgccggaatg tccaccctgt tcctggtgta ctccaacaag tgccaaaccc 3420 cactgggaat ggcatcagga cacattagag acttccagat taccgcgagc ggacagtacg 3480 gacaatgggc ccccaagttg gccaggctgc actactctgg aagcattaac gcctggagca 3540 ccaaggagcc gttcagctgg atcaaggtgg accttctggc gccaatgatc atccacggaa 3600 ttaagactca gggagcccgc cagaagttct catcgctcta catctcccag tttatcatca 3660 tgtactcact ggatgggaag aagtggcaga cttaccgggg aaattccacc ggtactctga 3720 tggtgttctt cggaaacgtg gacagctccg gcatcaagca caatatcttt aacccgccta 3780 tcatcgcccg atacatccgg ctccacccga ctcactactc catccggtcg actctgcgga 3840 tggaactcat gggttgcgac ctcaactcct gctcaatgcc actgggcatg gagtccaagg 3900 ctatctcgga cgctcagatt actgcatcgt cgtactttac caacatgttc gctacctggt 3960 ccccgtccaa agcccggctg catctccaag gcagatcaaa cgcgtggagg cctcaggtca 4020 acaacccgaa ggaatggctt caggtcgact tccaaaagac catgaaagtc accggagtga 4080 ccacccaggg cgtgaaatcg ctgctgacct ctatgtacgt gaaggaattc ctgatctcat 4140 caagccagga cggccaccag tggacactgt tcttccaaaa tggaaaggtc aaggtctttc 4200 agggaaatca agactccttc acccccgtgg tgaactccct ggacccccct ctgcttaccc 4260 gctacttgcg cattcatccg caatcctggg tgcaccagat cgccctgcga atggaagtgc 4320 tgggctgtga agcgcaggac ctgtactaaa ataaaagatc tttattttca ttagatctgt 4380 gtgttggttt tttgtgtgcc gc 4402 <210> 88 <211> 4502 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> MAB8B <400> 88 aattgaactt tgagtgtagc agagaggaac cattgccacc ttcagatttt aatgtctgac 60 ctcttctctt cctcccacag tggccaccag aagatactac ctcggagccg tcgaattgag 120 ctgggattac atgcaatccg acctgggaga actgcccgtg gatgccaggt ttcctcctcg 180 ggtccccaag tccttcccgt tcaacacctc agtcgtctac aagaaaaccc tcttcgtgga 240 gttcaccgac catctgttca acatcgccaa gccaagaccc ccgtggatgg gactcctcgg 300 tccgaccatc caagccgaag tgtacgacac tgtggtcatt accctgaaga acatggcctc 360 ccatcctgtg tccctgcatg cagtgggcgt gtcctactgg aaggcttccg aaggggccga 420 gtacgacgat caaaccagcc agcgggaaaa ggaggatgac aaagtgttcc cgggtggttc 480 gcacacctac gtgtggcaag tgctcaagga gaacggtcct atggcctctg atcccctgtg 540 tctgacctac tcctacctgt cccatgtcga cctcgtgaag gatctgaaca gcgggctgat 600 tggcgccctg ctcgtgtgcc gggaaggctc cctggccaag gaaaagaccc agacactgca 660 caagttcatc ttgctgttcg ccgtgtttga tgagggaaag tcctggcata gcgagactaa 720 gaactccctt atgcaagacc gggatgctgc ctccgctagg gcttggccta agatgcatac 780 tgtgaacgga tacgtgaaca gatccctgcc tggccttatc ggttgccacc ggaagtccgt 840 gtattggcat gtgatcggca tgggaaccac tccagaggtg cactccattt tcttggaggg 900 gcataccttc ttggtgcgca accacagaca ggcctccctg gaaatttctc cgatcacttt 960 cctgactgcc cagaccctcc ttatggacct gggtcagttc ctgctgttct gccacatttc 1020 gtcccaccaa cacgatggca tggaagccta cgtgaaagtg gactcgtgcc cggaagaacc 1080 acagctgcgg atgaagaaca acgaagaggc agaggactac gatgatgatc ttaccgattc 1140 ggaaatggat gtggtccgat tcgacgacga taatagccca tccttcatcc aaattaggag 1200 cgtggccaag aagcacccca aaacttgggt gcattacatt gcggccgagg aagaggattg 1260 ggactacgca cccctcgtgc ttgcacccga tgatcggtcc tacaagtccc aatacctgaa 1320 caacggcccg cagaggatcg gtcggaagta taagaaagtg cgcttcatgg cctacaccga 1380 cgagactttc aagaccagag aggccattca gcacgaaagc ggcattctgg ggccgctgtt 1440 gtacggggag gtcggagata cactgctcat cattttcaag aaccaggcgt ccagacccta 1500 caacatctac ccgcacggaa tcactgacgt ccgccccctg tactcccgga gactcccgaa 1560 gggagtcaag cacttgaaag acttccccat cctgcctggg gaaatcttca agtacaagtg 1620 gaccgtgacc gtcgaggatg ggccgaccaa gtccgatcca agatgcctca ctagatacta 1680 ctcatccttc gtcaacatgg aacgggacct ggcctcagga ctgattggcc ccctgctcat 1740 ctgctacaag gagtccgtgg atcagcgcgg aaaccagatc atgtcggaca aacgcaacgt 1800 catcctcttc tccgtctttg acgagaaccg ctcatggtac cttacggaga acatccagcg 1860 gttcctcccc aaccctgccg gagtgcagct cgaggacccg gaattccagg catcaaacat 1920 tatgcactcc atcaacggtt acgtgttcga cagcctccag cttagcgtgt gcctccatga 1980 agtcgcatat tggtacatcc tgtccattgg agcacaaacc gactttctct ccgtgttctt 2040 ctccggatat accttcaagc acaagatggt gtacgaggat accctgaccc tcttcccctt 2100 ctccggagag actgtgttta tgtcgatgga aaacccaggc ctgtggattt tggggtgcca 2160 caactcggat ttccgaaacc ggggcatgac tgccttgctc aaggtgtcct cctgtgacaa 2220 gaacacggga gactactacg aggactccta cgaggatatt tccgcctacc tcctgtccaa 2280 gaacaacgcc atcgaaccca ggtccttcag ccagaaccct cctgtcctca agcgccatca 2340 gagagaaatc acccgcacga ccctgcagtc cgaccaggaa gagatcgatt acgacgacac 2400 tatctccgtc gaaatgaaga aggaggactt tgacatctac gacgaagatg aaaatcagtc 2460 ccctcgctcg ttccaaaaga aaacgagaca ctacttcatc gctgctgtgg agcggctctg 2520 ggactacggc atgtcctcat cgccccacgt gcttaggaac cgggctcaat ccgggagcgt 2580 ccctcagttc aagaaagtgg tgtttcaaga attcaccgat ggaagcttca cgcagccgtt 2640 gtacaggggc gaactgaacg agcaccttgg cctgctggga ccttacatca gagcagaggt 2700 cgaggacaac atcatggtga ccttccggaa ccaagcctcc cggccatatt cattctactc 2760 gagccttatc tcatacgagg aggatcagag acagggggct gaacctcgga agaacttcgt 2820 caagccgaac gagacaaaga cctacttttg gaaggtgcag caccacatgg ccccgaccaa 2880 ggatgagttc gactgcaagg cctgggcgta cttctccgac gtggatctcg aaaaggacgt 2940 gcattccggg ctgatcggac cgctgctcgt ctgccacact aacaccctca atcctgctca 3000 cggcagacaa gtgaccgtgc aggagttcgc cctgttcttc accatcttcg acgaaactaa 3060 gtcatggtac tttaccgaga acatggagcg gaattgtcgg gccccatgta acatccagat 3120 ggaggacccg acattcaagg agaactaccg gttccacgcc attaacggat acattatgga 3180 cactcttccg ggactcgtga tggcacagga ccaacgcatc agatggtatc ttctgtcgat 3240 ggggagcaac gaaaacatcc attcgatcca ctttagcggt cacgtgttca cagtgcgcaa 3300 gaaggaagag tacaagatgg cgctgtacaa cctgtaccct ggggtgttcg agactgtgga 3360 aatgctgccg tccaaggccg gaatttggcg cgtggaatgt ctgatcggtg aacatctgca 3420 tgccggaatg tccaccctgt tcctggtgta ctccaacaag tgccaaaccc cactgggaat 3480 ggcatcagga cacattagag acttccagat taccgcgagc ggacagtacg gacaatgggc 3540 ccccaagttg gccaggctgc actactctgg aagcattaac gcctggagca ccaaggagcc 3600 gttcagctgg atcaaggtgg accttctggc gccaatgatc atccacggaa ttaagactca 3660 gggagcccgc cagaagttct catcgctcta catctcccag tttatcatca tgtactcact 3720 ggatgggaag aagtggcaga cttaccgggg aaattccacc ggtactctga tggtgttctt 3780 cggaaacgtg gacagctccg gcatcaagca caatatcttt aacccgccta tcatcgcccg 3840 atacatccgg ctccacccga ctcactactc catccggtcg actctgcgga tggaactcat 3900 gggttgcgac ctcaactcct gctcaatgcc actgggcatg gagtccaagg ctatctcgga 3960 cgctcagatt actgcatcgt cgtactttac caacatgttc gctacctggt ccccgtccaa 4020 agcccggctg catctccaag gcagatcaaa cgcgtggagg cctcaggtca acaacccgaa 4080 ggaatggctt caggtcgact tccaaaagac catgaaagtc accggagtga ccacccaggg 4140 cgtgaaatcg ctgctgacct ctatgtacgt gaaggaattc ctgatctcat caagccagga 4200 cggccaccag tggacactgt tcttccaaaa tggaaaggtc aaggtctttc agggaaatca 4260 agactccttc acccccgtgg tgaactccct ggacccccct ctgcttaccc gctacttgcg 4320 cattcatccg caatcctggg tgcaccagat cgccctgcga atggaagtgc tgggctgtga 4380 agcgcaggac ctgtactaaa ataaaagatc tttattttca ttagatctgt gtgttggttt 4440 tttgtgtgcg atcgggaact ggcatcttca gggagtagct taggtcagtg aagagaagcc 4500 gc 4502 <210> 89 <211> 4567 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> MAB8C <400> 89 gcggcctaag gcaattgtgc cagttcccga tcgttacagg aactttgagt gtagcagaga 60 ggaaccattg ccaccttcag attttaatgt ctgacctctt ctcttcctcc cacagtggcc 120 accagaagat actacctcgg agccgtcgaa ttgagctggg attacatgca atccgacctg 180 ggagaactgc ccgtggatgc caggtttcct cctcgggtcc ccaagtcctt cccgttcaac 240 acctcagtcg tctacaagaa aaccctcttc gtggagttca ccgaccatct gttcaacatc 300 gccaagccaa gacccccgtg gatgggactc ctcggtccga ccatccaagc cgaagtgtac 360 gacactgtgg tcattaccct gaagaacatg gcctcccatc ctgtgtccct gcatgcagtg 420 ggcgtgtcct actggaaggc ttccgaaggg gccgagtacg acgatcaaac cagccagcgg 480 gaaaaggagg atgacaaagt gttcccgggt ggttcgcaca cctacgtgtg gcaagtgctc 540 aaggagaacg gtcctatggc ctctgatccc ctgtgtctga cctactccta cctgtcccat 600 gtcgacctcg tgaaggatct gaacagcggg ctgattggcg ccctgctcgt gtgccgggaa 660 ggctccctgg ccaaggaaaa gacccagaca ctgcacaagt tcatcttgct gttcgccgtg 720 tttgatgagg gaaagtcctg gcatagcgag actaagaact cccttatgca agaccgggat 780 gctgcctccg ctagggcttg gcctaagatg catactgtga acggatacgt gaacagatcc 840 ctgcctggcc ttatcggttg ccaccggaag tccgtgtatt ggcatgtgat cggcatggga 900 accactccag aggtgcactc cattttcttg gaggggcata ccttcttggt gcgcaaccac 960 agacaggcct ccctggaaat ttctccgatc actttcctga ctgcccagac cctccttatg 1020 gacctgggtc agttcctgct gttctgccac atttcgtccc accaacacga tggcatggaa 1080 gcctacgtga aagtggactc gtgcccggaa gaaccacagc tgcggatgaa gaacaacgaa 1140 gaggcagagg actacgatga tgatcttacc gattcggaaa tggatgtggt ccgattcgac 1200 gacgataata gcccatcctt catccaaatt aggagcgtgg ccaagaagca ccccaaaact 1260 tgggtgcatt acattgcggc cgaggaagag gattgggact acgcacccct cgtgcttgca 1320 cccgatgatc ggtcctacaa gtcccaatac ctgaacaacg gcccgcagag gatcggtcgg 1380 aagtataaga aagtgcgctt catggcctac accgacgaga ctttcaagac cagagaggcc 1440 attcagcacg aaagcggcat tctggggccg ctgttgtacg gggaggtcgg agatacactg 1500 ctcatcattt tcaagaacca ggcgtccaga ccctacaaca tctacccgca cggaatcact 1560 gacgtccgcc ccctgtactc ccggagactc ccgaagggag tcaagcactt gaaagacttc 1620 cccatcctgc ctggggaaat cttcaagtac aagtggaccg tgaccgtcga ggatgggccg 1680 accaagtccg atccaagatg cctcactaga tactactcat ccttcgtcaa catggaacgg 1740 gacctggcct caggactgat tggccccctg ctcatctgct acaaggagtc cgtggatcag 1800 cgcggaaacc agatcatgtc ggacaaacgc aacgtcatcc tcttctccgt ctttgacgag 1860 aaccgctcat ggtaccttac ggagaacatc cagcggttcc tccccaaccc tgccggagtg 1920 cagctcgagg acccggaatt ccaggcatca aacattatgc actccatcaa cggttacgtg 1980 ttcgacagcc tccagcttag cgtgtgcctc catgaagtcg catattggta catcctgtcc 2040 attggagcac aaaccgactt tctctccgtg ttcttctccg gatatacctt caagcacaag 2100 atggtgtacg aggataccct gaccctcttc cccttctccg gagagactgt gtttatgtcg 2160 atggaaaacc caggcctgtg gattttgggg tgccacaact cggatttccg aaaccggggc 2220 atgactgcct tgctcaaggt gtcctcctgt gacaagaaca cgggagacta ctacgaggac 2280 tcctacgagg atatttccgc ctacctcctg tccaagaaca acgccatcga acccaggtcc 2340 ttcagccaga accctcctgt cctcaagcgc catcagagag aaatcacccg cacgaccctg 2400 cagtccgacc aggaagagat cgattacgac gacactatct ccgtcgaaat gaagaaggag 2460 gactttgaca tctacgacga agatgaaaat cagtcccctc gctcgttcca aaagaaaacg 2520 agacactact tcatcgctgc tgtggagcgg ctctgggact acggcatgtc ctcatcgccc 2580 cacgtgctta ggaaccgggc tcaatccggg agcgtccctc agttcaagaa agtggtgttt 2640 caagaattca ccgatggaag cttcacgcag ccgttgtaca ggggcgaact gaacgagcac 2700 cttggcctgc tgggacctta catcagagca gaggtcgagg acaacatcat ggtgaccttc 2760 cggaaccaag cctcccggcc atattcattc tactcgagcc ttatctcata cgaggaggat 2820 cagagacagg gggctgaacc tcggaagaac ttcgtcaagc cgaacgagac aaagacctac 2880 ttttggaagg tgcagcacca catggccccg accaaggatg agttcgactg caaggcctgg 2940 gcgtacttct ccgacgtgga tctcgaaaag gacgtgcatt ccgggctgat cggaccgctg 3000 ctcgtctgcc acactaacac cctcaatcct gctcacggca gacaagtgac cgtgcaggag 3060 ttcgccctgt tcttcaccat cttcgacgaa actaagtcat ggtactttac cgagaacatg 3120 gagcggaatt gtcgggcccc atgtaacatc cagatggagg acccgacatt caaggagaac 3180 taccggttcc acgccattaa cggatacatt atggacactc ttccgggact cgtgatggca 3240 caggaccaac gcatcagatg gtatcttctg tcgatgggga gcaacgaaaa catccattcg 3300 atccacttta gcggtcacgt gttcacagtg cgcaagaagg aagagtacaa gatggcgctg 3360 tacaacctgt accctggggt gttcgagact gtggaaatgc tgccgtccaa ggccggaatt 3420 tggcgcgtgg aatgtctgat cggtgaacat ctgcatgccg gaatgtccac cctgttcctg 3480 gtgtactcca acaagtgcca aaccccactg ggaatggcat caggacacat tagagacttc 3540 cagattaccg cgagcggaca gtacggacaa tgggccccca agttggccag gctgcactac 3600 tctggaagca ttaacgcctg gagcaccaag gagccgttca gctggatcaa ggtggacctt 3660 ctggcgccaa tgatcatcca cggaattaag actcagggag cccgccagaa gttctcatcg 3720 ctctacatct cccagtttat catcatgtac tcactggatg ggaagaagtg gcagacttac 3780 cggggaaatt ccaccggtac tctgatggtg ttcttcggaa acgtggacag ctccggcatc 3840 aagcacaata tctttaaccc gcctatcatc gcccgataca tccggctcca cccgactcac 3900 tactccatcc ggtcgactct gcggatggaa ctcatgggtt gcgacctcaa ctcctgctca 3960 atgccactgg gcatggagtc caaggctatc tcggacgctc agattactgc atcgtcgtac 4020 tttaccaaca tgttcgctac ctggtccccg tccaaagccc ggctgcatct ccaaggcaga 4080 tcaaacgcgt ggaggcctca ggtcaacaac ccgaaggaat ggcttcaggt cgacttccaa 4140 aagaccatga aagtcaccgg agtgaccacc cagggcgtga aatcgctgct gacctctatg 4200 tacgtgaagg aattcctgat ctcatcaagc caggacggcc accagtggac actgttcttc 4260 caaaatggaa aggtcaaggt ctttcaggga aatcaagact ccttcacccc cgtggtgaac 4320 tccctggacc cccctctgct tacccgctac ttgcgcattc atccgcaatc ctgggtgcac 4380 cagatcgccc tgcgaatgga agtgctgggc tgtgaagcgc aggacctgta ctaaaataaa 4440 agatctttat tttcattaga tctgtgtgtt ggttttttgt gtgcgatcgg gaactggcat 4500 cttcagggag tagcttaggt cagtgaagag aagtgccagt tcccgatcgt tacaggccgc 4560 gggccgc 4567 <210> 90 <211> 4567 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> MAB8D <400> 90 gcggcctaag gcaattgtgc cagttcccga tcgttacagg aactttgagt gtagcagaga 60 ggaaccattg ccaccttcag attttaatgt ctgacctctt ctcttcctcc cacagtggcc 120 accagaaggt actacctagg agccgtggaa ctgagctggg actacatgca gtctgacctg 180 ggagagctgc ccgtggacgc tagatttcct ccaagagtgc ccaagagctt ccccttcaac 240 acctccgtgg tgtacaagaa aaccctgttc gtggaattca ccgaccacct gttcaatatc 300 gccaagccta gacctccttg gatgggcctg ctgggcccta caattcaggc cgaggtgtac 360 gacaccgtgg tcatcaccct gaagaacatg gccagccatc ctgtgtctct gcacgccgtg 420 ggagtgtctt actggaaggc ttctgagggc gccgagtacg acgaccagac aagccagaga 480 gagaaagagg acgacaaggt tttccctggc ggcagccaca cctatgtctg gcaggtcctg 540 aaagaaaacg gccctatggc ctccgatcct ctgtgcctga catacagcta cctgagccat 600 gtggacctgg tcaaggacct gaactctggc ctgatcggcg ctctgctcgt gtgtagagaa 660 ggcagcctgg ccaaagaaaa gacccagaca ctgcacaagt tcatcctgct gttcgccgtg 720 ttcgacgagg gcaagagctg gcacagcgag acaaagaaca gcctgatgca ggacagagat 780 gccgcctctg ctagagcttg gcccaagatg cacaccgtga acggctacgt gaacagaagc 840 ctgcctggac tgatcggatg ccacagaaag tccgtgtact ggcatgtgat cggcatgggc 900 accacacctg aggtgcacag catctttctg gaaggacaca ccttcctcgt gcggaaccac 960 agacaggcca gcctggaaat cagccctatc accttcctga ccgctcagac cctgctgatg 1020 gatctgggcc agtttctgct gttctgccac atcagcagcc accagcacga tggcatggaa 1080 gcctacgtga aggtggacag ctgccccgaa gaaccccagc tgagaatgaa gaacaacgag 1140 gaagccgagg actacgacga cgacctgacc gactctgaga tggacgtcgt cagattcgac 1200 gacgataaca gccccagctt catccagatc agaagcgtgg ccaagaagca ccccaagacc 1260 tgggtgcact atatcgccgc cgaggaagag gactgggatt acgctcctct ggtgctggcc 1320 cctgacgaca gaagctacaa gagccagtac ctgaacaacg gccctcagag aatcggccgg 1380 aagtataaga aagtgcggtt catggcctac accgacgaga cattcaagac cagagaggct 1440 atccagcacg agagcggcat tctgggacct ctgctgtatg gcgaagtggg cgacacactg 1500 ctgatcatct tcaagaacca ggccagcaga ccctacaaca tctaccctca cggcatcacc 1560 gatgtgcggc ctctgtactc tagaaggctg cccaagggcg tgaagcacct gaaggacttc 1620 cctatcctgc ctggcgagat cttcaagtac aagtggaccg tgaccgtcga ggacggccct 1680 accaagagcg atcctagatg cctgacacgg tactacagca gcttcgtgaa catggaacgc 1740 gacctggcca gcggcctgat tggtcctctg ctgatctgct acaaagaaag cgtggaccag 1800 aggggcaacc agatcatgag cgacaagaga aacgtgatcc tgttctccgt ctttgacgag 1860 aacaggtcct ggtatctgac cgagaacatc cagcggtttc tgcccaatcc tgctggcgtg 1920 cagctggaag atcctgagtt ccaggcctcc aacatcatgc actccatcaa cggctatgtg 1980 ttcgacagcc tgcagctgag cgtgtgcctg cacgaagtgg cctactggta catcctgtct 2040 atcggcgccc agaccgactt cctgtccgtg ttctttagcg gctacacctt caagcacaag 2100 atggtgtacg aggataccct gacactgttc ccattcagcg gcgagacagt gttcatgagc 2160 atggaaaacc ccggcctgtg gatcctgggc tgtcacaaca gcgacttcag aaacagaggc 2220 atgacagccc tgctgaaggt gtccagctgc gacaagaaca ccggcgacta ctacgaggac 2280 tcttacgagg acatcagcgc ctacctgctg agcaagaaca atgccatcga gcctcggagc 2340 ttctctcaga accctcctgt gctgaagaga caccagcgcg agatcaccag aaccacactg 2400 cagagcgacc aagaggaaat cgattacgac gacaccatca gcgtcgagat gaagaaagaa 2460 gatttcgaca tctacgacga ggacgagaat cagagcccca gatctttcca gaagaaaacg 2520 cggcactact tcattgccgc cgtggaaaga ctgtgggact acggcatgag cagcagccca 2580 catgtgctga gaaacagggc ccagagcgga agcgtgcccc agttcaagaa agtggtgttc 2640 caagagttca ccgacggcag cttcacccag cctctgtata gaggcgagct gaacgagcac 2700 ctgggactgc tgggacctta catcagagct gaggtcgagg ataacatcat ggtcaccttt 2760 agaaaccagg cctctaggcc ctactccttc tacagctccc tgatcagcta cgaagaggac 2820 cagagacagg gcgctgagcc cagaaagaac ttcgtgaagc ccaacgagac taagacctac 2880 ttttggaagg tgcagcacca catggcccct acaaaggacg agttcgactg caaggcctgg 2940 gcctacttct ctgacgtgga cctcgagaag gatgtgcaca gcggactcat cggacccctg 3000 cttgtgtgcc acaccaacac actgaatccc gctcacggca ggcaagtgac cgtgcaagag 3060 ttcgccctgt tcttcaccat cttcgatgag acaaagtcct ggtacttcac cgaaaacatg 3120 gaaagaaact gcagggcccc ttgcaacatc cagatggaag atcccacctt caaagagaac 3180 taccggttcc acgccatcaa tggctacatc atggacactc tgcccggcct ggttatggca 3240 caggatcaga ggatcagatg gtatctgctg tccatgggct ccaacgagaa tatccacagc 3300 atccacttca gcggccatgt gttcaccgtg cggaaaaaag aagagtacaa gatggccctg 3360 tacaatctgt accccggcgt gttcgagact gtggaaatgc tgcctagcaa ggccggaatc 3420 tggcgcgtgg aatgtctgat cggagagcat ctgcatgccg gaatgtctac cctgttcctg 3480 gtgtacagca acaagtgtca gacccctctc ggcatggcct ctggacacat cagagacttc 3540 cagatcaccg cctctggcca gtacggacag tgggctccta aactggctag actgcactac 3600 agcggcagca tcaacgcctg gtccaccaaa gagcccttca gctggatcaa ggtggacctg 3660 ctggctccca tgatcatcca cggaatcaag acccagggcg ccagacagaa gttcagcagc 3720 ctgtacatca gccagttcat catcatgtac agcctggacg gcaagaagtg gcagacctac 3780 agaggcaaca gcaccggcac actcatggtg ttcttcggca acgtggactc cagcggcatt 3840 aagcacaaca tcttcaaccc tccaatcatt gcccggtaca tccggctgca ccccacacac 3900 tacagcatca gatctaccct gaggatggaa ctgatgggct gcgacctgaa cagctgctct 3960 atgcccctcg gaatggaaag caaggccatc agcgacgccc agatcacagc cagcagctac 4020 ttcaccaaca tgttcgccac atggtcccca tctaaggccc ggctgcatct gcagggcaga 4080 tctaacgctt ggaggcccca agtgaacaac cccaaagagt ggctgcaggt cgactttcag 4140 aaaaccatga aagtgaccgg cgtgaccaca cagggcgtca agtctctgct gacctctatg 4200 tacgtgaaag agttcctgat ctccagcagc caggacggcc accagtggac cctgtttttc 4260 cagaacggca aagtcaaggt gttccaggga aaccaggaca gcttcacacc cgtggtcaac 4320 tccctggatc ctccactgct gaccagatac ctgagaattc accctcagtc ttgggtgcac 4380 cagatcgctc tgagaatgga agtgctggga tgtgaagctc aggacctcta ctaaaataaa 4440 agatctttat tttcattaga tctgtgtgtt ggttttttgt gtgcgatcgg gaactggcat 4500 cttcagggag tagcttaggt cagtgaagag aagtgccagt tcccgatcgt tacaggccgc 4560 gggccgc 4567 <210> 91 <211> 4402 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> MAB8E <400> 91 aattgctgac ctcttctctt cctcccacag tggccaccag aagatactac ctgggagctg 60 tggaattgag ctgggattac atgcaatctg acctgggaga actgcctgtg gatgccaggt 120 ttcctcctag ggtccccaag tccttcccat tcaacacctc agtggtctac aagaaaaccc 180 tctttgtgga gttcacagac catctgttca acattgccaa gccaagaccc ccatggatgg 240 gactcctggg tccaaccatc caagctgaag tgtatgacac tgtggtcatt accctgaaga 300 acatggcctc ccatcctgtg tccctgcatg cagtgggagt gtcctactgg aaggcttctg 360 aaggggctga gtatgatgat caaaccagcc agagagaaaa ggaggatgac aaagtgttcc 420 caggtggtag tcacacctat gtgtggcaag tgctcaagga gaatggtcct atggcctctg 480 atcccctgtg tctgacctac tcctacctgt cccatgtgga cctggtgaag gatctgaact 540 ctgggctgat tggagccctg ctggtgtgca gagaaggctc cctggccaag gaaaagaccc 600 agacactgca caagttcatc ttgctgtttg ctgtgtttga tgagggaaag tcctggcatt 660 ctgagactaa gaactccctt atgcaagaca gagatgctgc ctcagctagg gcttggccta 720 agatgcatac tgtgaatgga tatgtgaaca gatccctgcc tggccttatt ggttgccaca 780 ggaagtctgt gtattggcat gtgattggca tgggaaccac tccagaggtg cactccattt 840 tcttggaggg gcataccttc ttggtgagga accacagaca ggcctccctg gaaatttctc 900 caatcacttt cctgactgcc cagaccctcc ttatggacct gggtcagttc ctgctgttct 960 gccacatttc atcccaccaa catgatggca tggaagccta tgtgaaagtg gactcatgcc 1020 cagaagaacc acagctgaga atgaagaaca atgaagaggc agaggactat gatgatgatc 1080 ttacagattc agaaatggat gtggtcagat ttgatgatga taatagccca tccttcatcc 1140 aaattaggag tgtggccaag aagcacccca aaacttgggt gcattacatt gcagctgagg 1200 aagaggattg ggactatgca cccttggtgc ttgcaccaga tgataggtcc tacaagtccc 1260 aatacctgaa caatggccca cagaggattg gtagaaagta taagaaagtg agattcatgg 1320 cctacacaga tgagactttc aagaccagag aggccattca gcatgaatct ggcattctgg 1380 ggccactgtt gtatggggag gttggagata cactgctcat cattttcaag aaccaggcct 1440 ccagacccta caacatctac cctcatggaa tcactgatgt cagacccctg tactccagaa 1500 gactcccaaa gggagtcaag cacttgaaag acttccccat cctgcctggg gaaatcttca 1560 agtacaagtg gacagtgaca gtggaggatg ggccaaccaa gtctgatcca agatgcctca 1620 ctagatacta ctcatccttt gtcaacatgg aaagagacct ggcctcagga ctgattggcc 1680 ccctgctcat ctgctacaag gagtctgtgg atcagagagg aaaccagatc atgtctgaca 1740 aaaggaatgt catcctcttc tctgtctttg atgagaacag atcatggtac cttacagaga 1800 acatccagag gttcctcccc aaccctgctg gagtgcagct ggaggaccca gaattccagg 1860 catcaaacat tatgcactcc atcaatggtt atgtgtttga cagcctccag ctttctgtgt 1920 gcctccatga agtggcatat tggtacatcc tgtccattgg agcacaaaca gactttctct 1980 ctgtgttctt ctctggatat accttcaagc acaagatggt gtatgaggat accctgaccc 2040 tcttcccctt ctctggagag actgtgttta tgtcaatgga aaacccaggc ctgtggattt 2100 tggggtgcca caactcagat ttcagaaaca ggggcatgac tgccttgctc aaggtgtcct 2160 cctgtgacaa gaacacagga gactactatg aggactccta tgaggatatt tctgcctacc 2220 tcctgtccaa gaacaatgcc attgaaccca ggtccttcag ccagaaccct cctgtcctca 2280 agaggcatca gagagaaatc accagaacta ccctgcagtc tgaccaggaa gagattgatt 2340 atgatgacac tatctcagtg gaaatgaaga aggaggactt tgacatctat gatgaagatg 2400 aaaatcagtc ccctaggtcc ttccaaaaga aaacaagaca ctacttcatt gctgctgtgg 2460 agagactctg ggactatggc atgtcctcat caccccatgt gcttaggaac agggctcaat 2520 ctgggtctgt ccctcagttc aagaaagtgg tgtttcaaga attcacagat ggaagcttca 2580 cacagccatt gtacagggga gaactgaatg agcaccttgg cctgctggga ccttacatca 2640 gagcagaggt ggaggacaac atcatggtga ccttcagaaa ccaagcctcc aggccatatt 2700 cattctactc cagccttatc tcatatgagg aggatcagag acagggggct gaacctagga 2760 agaactttgt caagccaaat gagacaaaga cctacttttg gaaggtgcag caccacatgg 2820 cccctaccaa ggatgagttt gactgcaagg cctgggctta cttctctgat gtggatctgg 2880 aaaaggatgt gcattctggg ctgattggac ctctgctggt ctgccacact aacaccctca 2940 atcctgctca tggcagacaa gtgacagtgc aggagtttgc cctgttcttc accatctttg 3000 atgaaactaa gtcatggtac tttacagaga acatggagag aaattgtagg gccccatgta 3060 acatccagat ggaggaccca acattcaagg agaactacag attccatgcc attaatggat 3120 acattatgga cactcttcca ggactggtga tggcacagga ccaaagaatc agatggtatc 3180 ttctgagcat ggggagcaat gaaaacatcc attccatcca cttttcaggt catgtgttca 3240 cagtgaggaa gaaggaagag tacaagatgg ctctgtacaa cctgtaccct ggggtgtttg 3300 agactgtgga aatgctgcca tccaaggctg gaatttggag ggtggaatgt ctgattggtg 3360 aacatctgca tgctggaatg tccaccctgt tcctggtgta ctccaacaag tgccaaaccc 3420 cactgggaat ggcatcagga cacattagag acttccagat tacagcatct ggacagtatg 3480 gacaatgggc ccccaagttg gccaggctgc actactctgg aagcattaat gcctggagca 3540 ccaaggagcc attcagctgg atcaaggtgg accttctggc tccaatgatc atccatggaa 3600 ttaagactca gggagccaga cagaagttct catccctcta catctcccag tttatcatca 3660 tgtactcact ggatgggaag aagtggcaga cttacagggg aaattccaca ggtactctga 3720 tggtgttctt tggaaatgtg gacagctctg gcatcaagca caatatcttt aaccctccta 3780 tcattgccag gtacatcaga ctccacccaa ctcactactc catcaggtcc actctgagga 3840 tggaactcat gggttgtgac ctcaactcct gctcaatgcc actgggcatg gagtccaagg 3900 ctatctcaga tgctcagatt actgcatcct cttactttac caacatgttt gctacctggt 3960 ccccctccaa agccagactg catctccaag gcagatcaaa tgcctggagg cctcaggtca 4020 acaacccaaa ggaatggctt caggtggact tccaaaagac catgaaagtc acaggagtga 4080 ccacccaggg agtgaaatcc ctgctgacct ctatgtatgt gaaggaattc ctgatctcat 4140 caagccagga tggccaccag tggacactgt tcttccaaaa tggaaaggtc aaggtctttc 4200 agggaaatca agactccttc acccctgtgg tgaactccct ggacccccct ctgcttacca 4260 ggtacttgag aattcatcca caatcctggg tgcaccagat tgccctgagg atggaagtgc 4320 tgggctgtga agcccaggac ctgtactaaa ataaaagatc tttattttca ttagatctgt 4380 gtgttggttt tttgtgtgcc gc 4402 <210> 92 <211> 4419 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> MAB8F (GA co/CpG free) <400> 92 gctagccaat tgctgacctc ttctcttcct cccacagtgg ccaccagaag gtactacctg 60 ggagctgtgg aactgagctg ggactacatg cagtctgacc tgggagagct gcctgtggat 120 gctagatttc ctccaagagt gcccaagagc ttccccttca acacctctgt ggtgtacaag 180 aaaaccctgt ttgtggaatt cacagaccac ctgttcaata ttgccaagcc tagacctcct 240 tggatgggcc tgctgggccc tacaattcag gctgaggtgt atgacacagt ggtcatcacc 300 ctgaagaaca tggccagcca tcctgtgtct ctgcatgctg tgggagtgtc ttactggaag 360 gcttctgagg gggctgagta tgatgaccag acaagccaga gagagaaaga ggatgacaag 420 gttttccctg ggggcagcca cacctatgtc tggcaggtcc tgaaagaaaa tggccctatg 480 gcctctgatc ctctgtgcct gacatacagc tacctgagcc atgtggacct ggtcaaggac 540 ctgaactctg gcctgattgg ggctctgctg gtgtgtagag aaggcagcct ggccaaagaa 600 aagacccaga cactgcacaa gttcatcctg ctgtttgctg tgtttgatga gggcaagagc 660 tggcactctg agacaaagaa cagcctgatg caggacagag atgctgcctc tgctagagct 720 tggcccaaga tgcacacagt gaatggctat gtgaacagaa gcctgcctgg actgattgga 780 tgccacagaa agtctgtgta ctggcatgtg attggcatgg gcaccacacc tgaggtgcac 840 agcatctttc tggaaggaca caccttcctg gtgaggaacc acagacaggc cagcctggaa 900 atcagcccta tcaccttcct gacagctcag accctgctga tggatctggg ccagtttctg 960 ctgttctgcc acatcagcag ccaccagcat gatggcatgg aagcctatgt gaaggtggac 1020 agctgccctg aagaacccca gctgagaatg aagaacaatg aggaagctga ggactatgat 1080 gatgacctga cagactctga gatggatgtg gtcagatttg atgatgataa cagccccagc 1140 ttcatccaga tcagatctgt ggccaagaag caccccaaga cctgggtgca ctatattgct 1200 gctgaggaag aggactggga ttatgctcct ctggtgctgg cccctgatga cagaagctac 1260 aagagccagt acctgaacaa tggccctcag agaattggca ggaagtataa gaaagtgagg 1320 ttcatggcct acacagatga gacattcaag accagagagg ctatccagca tgagtctggc 1380 attctgggac ctctgctgta tggggaagtg ggggacacac tgctgatcat cttcaagaac 1440 caggccagca gaccctacaa catctaccct catggcatca cagatgtgag gcctctgtac 1500 tctagaaggc tgcccaaggg ggtgaagcac ctgaaggact tccctatcct gcctggggag 1560 atcttcaagt acaagtggac agtgacagtg gaggatggcc ctaccaagtc tgatcctaga 1620 tgcctgacaa ggtactacag cagctttgtg aacatggaaa gggacctggc ctctggcctg 1680 attggtcctc tgctgatctg ctacaaagaa tctgtggacc agaggggcaa ccagatcatg 1740 agtgacaaga gaaatgtgat cctgttctct gtctttgatg agaacaggtc ctggtatctg 1800 acagagaaca tccagaggtt tctgcccaat cctgctgggg tgcagctgga agatcctgag 1860 ttccaggcct ccaacatcat gcactccatc aatggctatg tgtttgacag cctgcagctg 1920 tctgtgtgcc tgcatgaagt ggcctactgg tacatcctgt ctattggggc ccagacagac 1980 ttcctgtctg tgttcttttc tggctacacc ttcaagcaca agatggtgta tgaggatacc 2040 ctgacactgt tcccattctc tggggagaca gtgttcatga gcatggaaaa ccctggcctg 2100 tggatcctgg gctgtcacaa cagtgacttc agaaacagag gcatgacagc cctgctgaag 2160 gtgtccagct gtgacaagaa cactggggac tactatgagg actcttatga ggacatctct 2220 gcctacctgc tgagcaagaa caatgccatt gagcctagga gcttctctca gaaccctcct 2280 gtgctgaaga gacaccagag ggagatcacc agaaccacac tgcagtctga ccaagaggaa 2340 attgattatg atgacaccat ctctgtggag atgaagaaag aagattttga catctatgat 2400 gaggatgaga atcagagccc cagatctttc cagaagaaaa caaggcacta cttcattgct 2460 gctgtggaaa gactgtggga ctatggcatg agcagcagcc cccatgtgct gagaaacagg 2520 gcccagtctg gaagtgtgcc ccagttcaag aaagtggtgt tccaagagtt cacagatggc 2580 agcttcaccc agcctctgta tagaggggag ctgaatgagc acctgggact gctgggacct 2640 tacatcagag ctgaggtgga ggataacatc atggtcacct ttagaaacca ggcctctagg 2700 ccctactcct tctacagctc cctgatcagc tatgaagagg accagagaca gggggctgag 2760 cccagaaaga actttgtgaa gcccaatgag actaagacct acttttggaa ggtgcagcac 2820 cacatggccc ctacaaagga tgagtttgac tgcaaggcct gggcctactt ctctgatgtg 2880 gacctggaga aggatgtgca ctctggactc attggacccc tgcttgtgtg ccacaccaac 2940 acactgaatc ctgctcatgg caggcaagtg acagtgcaag agtttgccct gttcttcacc 3000 atctttgatg agacaaagtc ctggtacttc acagaaaaca tggaaagaaa ctgcagggcc 3060 ccttgcaaca tccagatgga agatcccacc ttcaaagaga actacaggtt ccatgccatc 3120 aatggctaca tcatggacac tctgcctggc ctggttatgg cacaggatca gaggatcaga 3180 tggtatctgc tgtccatggg ctccaatgag aatatccaca gcatccactt ctctggccat 3240 gtgttcacag tgaggaaaaa agaagagtac aagatggccc tgtacaatct gtaccctggg 3300 gtgtttgaga ctgtggaaat gctgcctagc aaggctggaa tctggagggt ggaatgtctg 3360 attggagagc atctgcatgc tggaatgtct accctgttcc tggtgtacag caacaagtgt 3420 cagacccctc tgggcatggc ctctggacac atcagagact tccagatcac agcctctggc 3480 cagtatggac agtgggctcc taaactggct agactgcact actctggcag catcaatgcc 3540 tggtccacca aagagccctt cagctggatc aaggtggacc tgctggctcc catgatcatc 3600 catggaatca agacccaggg ggccagacag aagttcagca gcctgtacat cagccagttc 3660 atcatcatgt acagcctgga tggcaagaag tggcagacct acagaggcaa cagcacaggc 3720 acactcatgg tgttctttgg caatgtggac tcttctggca ttaagcacaa catcttcaac 3780 cctccaatca ttgccaggta catcaggctg caccccacac actacagcat cagatctacc 3840 ctgaggatgg aactgatggg ctgtgacctg aacagctgct ctatgcccct gggaatggaa 3900 agcaaggcca tctctgatgc ccagatcaca gccagcagct acttcaccaa catgtttgcc 3960 acatggtccc catctaaggc caggctgcat ctgcagggca gatctaatgc ttggaggccc 4020 caagtgaaca accccaaaga gtggctgcag gtggactttc agaaaaccat gaaagtgaca 4080 ggagtgacca cacagggggt caagtctctg ctgacctcta tgtatgtgaa agagttcctg 4140 atctccagca gccaggatgg ccaccagtgg accctgtttt tccagaatgg caaagtcaag 4200 gtgttccagg gaaaccagga cagcttcaca cctgtggtca actccctgga tcctccactg 4260 ctgaccagat acctgagaat tcaccctcag tcttgggtgc accagattgc tctgagaatg 4320 gaagtgctgg gatgtgaagc tcaggacctc tactaaaata aaagatcttt attttcatta 4380 gatctgtgtg ttggtttttt gtgtgccgcg ggtttaaac 4419 <210> 93 <211> 4314 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> codon optimized mature FVIII-BDD coding sequence <220> <221> misc_feature <223> F8-BDD1, codon optimized <400> 93 gccaccagaa gatactacct cggagccgtc gaattgagct gggattacat gcaatccgac 60 ctgggagaac tgcccgtgga tgccaggttt cctcctcggg tccccaagtc cttcccgttc 120 aacacctcag tcgtctacaa gaaaaccctc ttcgtggagt tcaccgacca tctgttcaac 180 atcgccaagc caagaccccc gtggatggga ctcctcggtc cgaccatcca agccgaagtg 240 tacgacactg tggtcattac cctgaagaac atggcctccc atcctgtgtc cctgcatgca 300 gtgggcgtgt cctactggaa ggcttccgaa ggggccgagt acgacgatca aaccagccag 360 cgggaaaagg aggatgacaa agtgttcccg ggtggttcgc acacctacgt gtggcaagtg 420 ctcaaggaga acggtcctat ggcctctgat cccctgtgtc tgacctactc ctacctgtcc 480 catgtcgacc tcgtgaagga tctgaacagc gggctgattg gcgccctgct cgtgtgccgg 540 gaaggctccc tggccaagga aaagacccag acactgcaca agttcatctt gctgttcgcc 600 gtgtttgatg agggaaagtc ctggcatagc gagactaaga actcccttat gcaagaccgg 660 gatgctgcct ccgctagggc ttggcctaag atgcatactg tgaacggata cgtgaacaga 720 tccctgcctg gccttatcgg ttgccaccgg aagtccgtgt attggcatgt gatcggcatg 780 ggaaccactc cagaggtgca ctccattttc ttggaggggc ataccttctt ggtgcgcaac 840 cacagacagg cctccctgga aatttctccg atcactttcc tgactgccca gaccctcctt 900 atggacctgg gtcagttcct gctgttctgc cacatttcgt cccaccaaca cgatggcatg 960 gaagcctacg tgaaagtgga ctcgtgcccg gaagaaccac agctgcggat gaagaacaac 1020 gaagaggcag aggactacga tgatgatctt accgattcgg aaatggatgt ggtccgattc 1080 gacgacgata atagcccatc cttcatccaa attaggagcg tggccaagaa gcaccccaaa 1140 acttgggtgc attacattgc ggccgaggaa gaggattggg actacgcacc cctcgtgctt 1200 gcacccgatg atcggtccta caagtcccaa tacctgaaca acggcccgca gaggatcggt 1260 cggaagtata agaaagtgcg cttcatggcc tacaccgacg agactttcaa gaccagagag 1320 gccattcagc acgaaagcgg cattctgggg ccgctgttgt acggggaggt cggagataca 1380 ctgctcatca ttttcaagaa ccaggcgtcc agaccctaca acatctaccc gcacggaatc 1440 actgacgtcc gccccctgta ctcccggaga ctcccgaagg gagtcaagca cttgaaagac 1500 ttccccatcc tgcctgggga aatcttcaag tacaagtgga ccgtgaccgt cgaggatggg 1560 ccgaccaagt ccgatccaag atgcctcact agatactact catccttcgt caacatggaa 1620 cgggacctgg cctcaggact gattggcccc ctgctcatct gctacaagga gtccgtggat 1680 cagcgcggaa accagatcat gtcggacaaa cgcaacgtca tcctcttctc cgtctttgac 1740 gagaaccgct catggtacct tacggagaac atccagcggt tcctccccaa ccctgccgga 1800 gtgcagctcg aggacccgga attccaggca tcaaacatta tgcactccat caacggttac 1860 gtgttcgaca gcctccagct tagcgtgtgc ctccatgaag tcgcatattg gtacatcctg 1920 tccattggag cacaaaccga ctttctctcc gtgttcttct ccggatatac cttcaagcac 1980 aagatggtgt acgaggatac cctgaccctc ttccccttct ccggagagac tgtgtttatg 2040 tcgatggaaa acccaggcct gtggattttg gggtgccaca actcggattt ccgaaaccgg 2100 ggcatgactg ccttgctcaa ggtgtcctcc tgtgacaaga acacgggaga ctactacgag 2160 gactcctacg aggatatttc cgcctacctc ctgtccaaga acaacgccat cgaacccagg 2220 tccttcagcc agaaccctcc tgtcctcaag cgccatcaga gagaaatcac ccgcacgacc 2280 ctgcagtccg accaggaaga gatcgattac gacgacacta tctccgtcga aatgaagaag 2340 gaggactttg acatctacga cgaagatgaa aatcagtccc ctcgctcgtt ccaaaagaaa 2400 acgagacact acttcatcgc tgctgtggag cggctctggg actacggcat gtcctcatcg 2460 ccccacgtgc ttaggaaccg ggctcaatcc gggagcgtcc ctcagttcaa gaaagtggtg 2520 tttcaagaat tcaccgatgg aagcttcacg cagccgttgt acaggggcga actgaacgag 2580 caccttggcc tgctgggacc ttacatcaga gcagaggtcg aggacaacat catggtgacc 2640 ttccggaacc aagcctcccg gccatattca ttctactcga gccttatctc atacgaggag 2700 gatcagagac agggggctga acctcggaag aacttcgtca agccgaacga gacaaagacc 2760 tacttttgga aggtgcagca ccacatggcc ccgaccaagg atgagttcga ctgcaaggcc 2820 tgggcgtact tctccgacgt ggatctcgaa aaggacgtgc attccgggct gatcggaccg 2880 ctgctcgtct gccacactaa caccctcaat cctgctcacg gcagacaagt gaccgtgcag 2940 gagttcgccc tgttcttcac catcttcgac gaaactaagt catggtactt taccgagaac 3000 atggagcgga attgtcgggc cccatgtaac atccagatgg aggacccgac attcaaggag 3060 aactaccggt tccacgccat taacggatac attatggaca ctcttccggg actcgtgatg 3120 gcacaggacc aacgcatcag atggtatctt ctgtcgatgg ggagcaacga aaacatccat 3180 tcgatccact ttagcggtca cgtgttcaca gtgcgcaaga aggaagagta caagatggcg 3240 ctgtacaacc tgtaccctgg ggtgttcgag actgtggaaa tgctgccgtc caaggccgga 3300 atttggcgcg tggaatgtct gatcggtgaa catctgcatg ccggaatgtc caccctgttc 3360 ctggtgtact ccaacaagtg ccaaacccca ctgggaatgg catcaggaca cattagagac 3420 ttccagatta ccgcgagcgg acagtacgga caatgggccc ccaagttggc caggctgcac 3480 tactctggaa gcattaacgc ctggagcacc aaggagccgt tcagctggat caaggtggac 3540 cttctggcgc caatgatcat ccacggaatt aagactcagg gagcccgcca gaagttctca 3600 tcgctctaca tctcccagtt tatcatcatg tactcactgg atgggaagaa gtggcagact 3660 taccggggaa attccaccgg tactctgatg gtgttcttcg gaaacgtgga cagctccggc 3720 atcaagcaca atatctttaa cccgcctatc atcgcccgat acatccggct ccacccgact 3780 cactactcca tccggtcgac tctgcggatg gaactcatgg gttgcgacct caactcctgc 3840 tcaatgccac tgggcatgga gtccaaggct atctcggacg ctcagattac tgcatcgtcg 3900 tactttacca acatgttcgc tacctggtcc ccgtccaaag cccggctgca tctccaaggc 3960 agatcaaacg cgtggaggcc tcaggtcaac aacccgaagg aatggcttca ggtcgacttc 4020 caaaagacca tgaaagtcac cggagtgacc acccagggcg tgaaatcgct gctgacctct 4080 atgtacgtga aggaattcct gatctcatca agccaggacg gccaccagtg gacactgttc 4140 ttccaaaatg gaaaggtcaa ggtctttcag ggaaatcaag actccttcac ccccgtggtg 4200 aactccctgg acccccctct gcttacccgc tacttgcgca ttcatccgca atcctgggtg 4260 caccagatcg ccctgcgaat ggaagtgctg ggctgtgaag cgcaggacct gtac 4314 <210> 94 <211> 4443 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> codon optimized mature FVIII-BDD coding sequence <220> <221> misc_feature <223> F8-BDD2, codon optimized <400> 94 gccaccagaa ggtactacct aggagccgtg gaactgagct gggactacat gcagtctgac 60 ctgggagagc tgcccgtgga cgctagattt cctccaagag tgcccaagag cttccccttc 120 aacacctccg tggtgtacaa gaaaaccctg ttcgtggaat tcaccgacca cctgttcaat 180 atcgccaagc ctagacctcc ttggatgggc ctgctgggcc ctacaattca ggccgaggtg 240 tacgacaccg tggtcatcac cctgaagaac atggccagcc atcctgtgtc tctgcacgcc 300 gtgggagtgt cttactggaa ggcttctgag ggcgccgagt acgacgacca gacaagccag 360 agagagaaag aggacgacaa ggttttccct ggcggcagcc acacctatgt ctggcaggtc 420 ctgaaagaaa acggccctat ggcctccgat cctctgtgcc tgacatacag ctacctgagc 480 catgtggacc tggtcaagga cctgaactct ggcctgatcg gcgctctgct cgtgtgtaga 540 gaaggcagcc tggccaaaga aaagacccag acactgcaca agttcatcct gctgttcgcc 600 gtgttcgacg agggcaagag ctggcacagc gagacaaaga acagcctgat gcaggacaga 660 gatgccgcct ctgctagagc ttggcccaag atgcacaccg tgaacggcta cgtgaacaga 720 agcctgcctg gactgatcgg atgccacaga aagtccgtgt actggcatgt gatcggcatg 780 ggcaccacac ctgaggtgca cagcatcttt ctggaaggac acaccttcct cgtgcggaac 840 cacagacagg ccagcctgga aatcagccct atcaccttcc tgaccgctca gaccctgctg 900 atggatctgg gccagtttct gctgttctgc cacatcagca gccaccagca cgatggcatg 960 gaagcctacg tgaaggtgga cagctgcccc gaagaacccc agctgagaat gaagaacaac 1020 gaggaagccg aggactacga cgacgacctg accgactctg agatggacgt cgtcagattc 1080 gacgacgata acagccccag cttcatccag atcagaagcg tggccaagaa gcaccccaag 1140 acctgggtgc actatatcgc cgccgaggaa gaggactggg attacgctcc tctggtgctg 1200 gcccctgacg acagaagcta caagagccag tacctgaaca acggccctca gagaatcggc 1260 cggaagtata agaaagtgcg gttcatggcc tacaccgacg agacattcaa gaccagagag 1320 gctatccagc acgagagcgg cattctggga cctctgctgt atggcgaagt gggcgacaca 1380 ctgctgatca tcttcaagaa ccaggccagc agaccctaca acatctaccc tcacggcatc 1440 accgatgtgc ggcctctgta ctctagaagg ctgcccaagg gcgtgaagca cctgaaggac 1500 ttccctatcc tgcctggcga gatcttcaag tacaagtgga ccgtgaccgt cgaggacggc 1560 cctaccaaga gcgatcctag atgcctgaca cggtactaca gcagcttcgt gaacatggaa 1620 cgcgacctgg ccagcggcct gattggtcct ctgctgatct gctacaaaga aagcgtggac 1680 cagaggggca accagatcat gagcgacaag agaaacgtga tcctgttctc cgtctttgac 1740 gagaacaggt cctggtatct gaccgagaac atccagcggt ttctgcccaa tcctgctggc 1800 gtgcagctgg aagatcctga gttccaggcc tccaacatca tgcactccat caacggctat 1860 gtgttcgaca gcctgcagct gagcgtgtgc ctgcacgaag tggcctactg gtacatcctg 1920 tctatcggcg cccagaccga cttcctgtcc gtgttcttta gcggctacac cttcaagcac 1980 aagatggtgt acgaggatac cctgacactg ttcccattca gcggcgagac agtgttcatg 2040 agcatggaaa accccggcct gtggatcctg ggctgtcaca acagcgactt cagaaacaga 2100 ggcatgacag ccctgctgaa ggtgtccagc tgcgacaaga acaccggcga ctactacgag 2160 gactcttacg aggacatcag cgcctacctg ctgagcaaga acaatgccat cgagcctcgg 2220 agcttctctc agaaccctcc tgtgctgaag agacaccagc gcgagatcac cagaaccaca 2280 ctgcagagcg accaagagga aatcgattac gacgacacca tcagcgtcga gatgaagaaa 2340 gaagatttcg acatctacga cgaggacgag aatcagagcc ccagatcttt ccagaagaaa 2400 acgcggcact acttcattgc cgccgtggaa agactgtggg actacggcat gagcagcagc 2460 ccacatgtgc tgagaaacag ggcccagagc ggaagcgtgc cccagttcaa gaaagtggtg 2520 ttccaagagt tcaccgacgg cagcttcacc cagcctctgt atagaggcga gctgaacgag 2580 cacctgggac tgctgggacc ttacatcaga gctgaggtcg aggataacat catggtcacc 2640 tttagaaacc aggcctctag gccctactcc ttctacagct ccctgatcag ctacgaagag 2700 gaccagagac agggcgctga gcccagaaag aacttcgtga agcccaacga gactaagacc 2760 tacttttgga aggtgcagca ccacatggcc cctacaaagg acgagttcga ctgcaaggcc 2820 tgggcctact tctctgacgt ggacctcgag aaggatgtgc acagcggact catcggaccc 2880 ctgcttgtgt gccacaccaa cacactgaat cccgctcacg gcaggcaagt gaccgtgcaa 2940 gagttcgccc tgttcttcac catcttcgat gagacaaagt cctggtactt caccgaaaac 3000 atggaaagaa actgcagggc cccttgcaac atccagatgg aagatcccac cttcaaagag 3060 aactaccggt tccacgccat caatggctac atcatggaca ctctgcccgg cctggttatg 3120 gcacaggatc agaggatcag atggtatctg ctgtccatgg gctccaacga gaatatccac 3180 agcatccact tcagcggcca tgtgttcacc gtgcggaaaa aagaagagta caagatggcc 3240 ctgtacaatc tgtaccccgg cgtgttcgag actgtggaaa tgctgcctag caaggccgga 3300 atctggcgcg tggaatgtct gatcggagag catctgcatg ccggaatgtc taccctgttc 3360 ctggtgtaca gcaacaagtg tcagacccct ctcggcatgg cctctggaca catcagagac 3420 ttccagatca ccgcctctgg ccagtacgga cagtgggctc ctaaactggc tagactgcac 3480 tacagcggca gcatcaacgc ctggtccacc aaagagccct tcagctggat caaggtggac 3540 ctgctggctc ccatgatcat ccacggaatc aagacccagg gcgccagaca gaagttcagc 3600 agcctgtaca tcagccagtt catcatcatg tacagcctgg acggcaagaa gtggcagacc 3660 tacagaggca acagcaccgg cacactcatg gtgttcttcg gcaacgtgga ctccagcggc 3720 attaagcaca acatcttcaa ccctccaatc attgcccggt acatccggct gcaccccaca 3780 cactacagca tcagatctac cctgaggatg gaactgatgg gctgcgacct gaacagctgc 3840 tctatgcccc tcggaatgga aagcaaggcc atcagcgacg cccagatcac agccagcagc 3900 tacttcacca acatgttcgc cacatggtcc ccatctaagg cccggctgca tctgcagggc 3960 agatctaacg cttggaggcc ccaagtgaac aaccccaaag agtggctgca ggtcgacttt 4020 cagaaaacca tgaaagtgac cggcgtgacc acacagggcg tcaagtctct gctgacctct 4080 atgtacgtga aagagttcct gatctccagc agccaggacg gccaccagtg gaccctgttt 4140 ttccagaacg gcaaagtcaa ggtgttccag ggaaaccagg acagcttcac acccgtggtc 4200 aactccctgg atcctccact gctgaccaga tacctgagaa ttcaccctca gtcttgggtg 4260 caccagatcg ctctgagaat ggaagtgctg ggatgtgaag ctcaggacct ctactaaaat 4320 aaaagatctt tattttcatt agatctgtgt gttggttttt tgtgtgcgat cgggaactgg 4380 catcttcagg gagtagctta ggtcagtgaa gagaagtgcc agttcccgat cgttacaggc 4440 cgc 4443 <210> 95 <211> 4317 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> codon optimized mature FVIII-BDD coding sequence <220> <221> misc_feature <223> F8-BDD3, codon optimized <400> 95 gccaccagaa gatactacct gggagctgtg gaattgagct gggattacat gcaatctgac 60 ctgggagaac tgcctgtgga tgccaggttt cctcctaggg tccccaagtc cttcccattc 120 aacacctcag tggtctacaa gaaaaccctc tttgtggagt tcacagacca tctgttcaac 180 attgccaagc caagaccccc atggatggga ctcctgggtc caaccatcca agctgaagtg 240 tatgacactg tggtcattac cctgaagaac atggcctccc atcctgtgtc cctgcatgca 300 gtgggagtgt cctactggaa ggcttctgaa ggggctgagt atgatgatca aaccagccag 360 agagaaaagg aggatgacaa agtgttccca ggtggtagtc acacctatgt gtggcaagtg 420 ctcaaggaga atggtcctat ggcctctgat cccctgtgtc tgacctactc ctacctgtcc 480 catgtggacc tggtgaagga tctgaactct gggctgattg gagccctgct ggtgtgcaga 540 gaaggctccc tggccaagga aaagacccag acactgcaca agttcatctt gctgtttgct 600 gtgtttgatg agggaaagtc ctggcattct gagactaaga actcccttat gcaagacaga 660 gatgctgcct cagctagggc ttggcctaag atgcatactg tgaatggata tgtgaacaga 720 tccctgcctg gccttattgg ttgccacagg aagtctgtgt attggcatgt gattggcatg 780 ggaaccactc cagaggtgca ctccattttc ttggaggggc ataccttctt ggtgaggaac 840 cacagacagg cctccctgga aatttctcca atcactttcc tgactgccca gaccctcctt 900 atggacctgg gtcagttcct gctgttctgc cacatttcat cccaccaaca tgatggcatg 960 gaagcctatg tgaaagtgga ctcatgccca gaagaaccac agctgagaat gaagaacaat 1020 gaagaggcag aggactatga tgatgatctt acagattcag aaatggatgt ggtcagattt 1080 gatgatgata atagcccatc cttcatccaa attaggagtg tggccaagaa gcaccccaaa 1140 acttgggtgc attacattgc agctgaggaa gaggattggg actatgcacc cttggtgctt 1200 gcaccagatg ataggtccta caagtcccaa tacctgaaca atggcccaca gaggattggt 1260 agaaagtata agaaagtgag attcatggcc tacacagatg agactttcaa gaccagagag 1320 gccattcagc atgaatctgg cattctgggg ccactgttgt atggggaggt tggagataca 1380 ctgctcatca ttttcaagaa ccaggcctcc agaccctaca acatctaccc tcatggaatc 1440 actgatgtca gacccctgta ctccagaaga ctcccaaagg gagtcaagca cttgaaagac 1500 ttccccatcc tgcctgggga aatcttcaag tacaagtgga cagtgacagt ggaggatggg 1560 ccaaccaagt ctgatccaag atgcctcact agatactact catcctttgt caacatggaa 1620 agagacctgg cctcaggact gattggcccc ctgctcatct gctacaagga gtctgtggat 1680 cagagaggaa accagatcat gtctgacaaa aggaatgtca tcctcttctc tgtctttgat 1740 gagaacagat catggtacct tacagagaac atccagaggt tcctccccaa ccctgctgga 1800 gtgcagctgg aggacccaga attccaggca tcaaacatta tgcactccat caatggttat 1860 gtgtttgaca gcctccagct ttctgtgtgc ctccatgaag tggcatattg gtacatcctg 1920 tccattggag cacaaacaga ctttctctct gtgttcttct ctggatatac cttcaagcac 1980 aagatggtgt atgaggatac cctgaccctc ttccccttct ctggagagac tgtgtttatg 2040 tcaatggaaa acccaggcct gtggattttg gggtgccaca actcagattt cagaaacagg 2100 ggcatgactg ccttgctcaa ggtgtcctcc tgtgacaaga acacaggaga ctactatgag 2160 gactcctatg aggatatttc tgcctacctc ctgtccaaga acaatgccat tgaacccagg 2220 tccttcagcc agaaccctcc tgtcctcaag aggcatcaga gagaaatcac cagaactacc 2280 ctgcagtctg accaggaaga gattgattat gatgacacta tctcagtgga aatgaagaag 2340 gaggactttg acatctatga tgaagatgaa aatcagtccc ctaggtcctt ccaaaagaaa 2400 acaagacact acttcattgc tgctgtggag agactctggg actatggcat gtcctcatca 2460 ccccatgtgc ttaggaacag ggctcaatct gggtctgtcc ctcagttcaa gaaagtggtg 2520 tttcaagaat tcacagatgg aagcttcaca cagccattgt acaggggaga actgaatgag 2580 caccttggcc tgctgggacc ttacatcaga gcagaggtgg aggacaacat catggtgacc 2640 ttcagaaacc aagcctccag gccatattca ttctactcca gccttatctc atatgaggag 2700 gatcagagac agggggctga acctaggaag aactttgtca agccaaatga gacaaagacc 2760 tacttttgga aggtgcagca ccacatggcc cctaccaagg atgagtttga ctgcaaggcc 2820 tgggcttact tctctgatgt ggatctggaa aaggatgtgc attctgggct gattggacct 2880 ctgctggtct gccacactaa caccctcaat cctgctcatg gcagacaagt gacagtgcag 2940 gagtttgccc tgttcttcac catctttgat gaaactaagt catggtactt tacagagaac 3000 atggagagaa attgtagggc cccatgtaac atccagatgg aggacccaac attcaaggag 3060 aactacagat tccatgccat taatggatac attatggaca ctcttccagg actggtgatg 3120 gcacaggacc aaagaatcag atggtatctt ctgagcatgg ggagcaatga aaacatccat 3180 tccatccact tttcaggtca tgtgttcaca gtgaggaaga aggaagagta caagatggct 3240 ctgtacaacc tgtaccctgg ggtgtttgag actgtggaaa tgctgccatc caaggctgga 3300 atttggaggg tggaatgtct gattggtgaa catctgcatg ctggaatgtc caccctgttc 3360 ctggtgtact ccaacaagtg ccaaacccca ctgggaatgg catcaggaca cattagagac 3420 ttccagatta cagcatctgg acagtatgga caatgggccc ccaagttggc caggctgcac 3480 tactctggaa gcattaatgc ctggagcacc aaggagccat tcagctggat caaggtggac 3540 cttctggctc caatgatcat ccatggaatt aagactcagg gagccagaca gaagttctca 3600 tccctctaca tctcccagtt tatcatcatg tactcactgg atgggaagaa gtggcagact 3660 tacaggggaa attccacagg tactctgatg gtgttctttg gaaatgtgga cagctctggc 3720 atcaagcaca atatctttaa ccctcctatc attgccaggt acatcagact ccacccaact 3780 cactactcca tcaggtccac tctgaggatg gaactcatgg gttgtgacct caactcctgc 3840 tcaatgccac tgggcatgga gtccaaggct atctcagatg ctcagattac tgcatcctct 3900 tactttacca acatgtttgc tacctggtcc ccctccaaag ccagactgca tctccaaggc 3960 agatcaaatg cctggaggcc tcaggtcaac aacccaaagg aatggcttca ggtggacttc 4020 caaaagacca tgaaagtcac aggagtgacc acccagggag tgaaatccct gctgacctct 4080 atgtatgtga aggaattcct gatctcatca agccaggatg gccaccagtg gacactgttc 4140 ttccaaaatg gaaaggtcaa ggtctttcag ggaaatcaag actccttcac ccctgtggtg 4200 aactccctgg acccccctct gcttaccagg tacttgagaa ttcatccaca atcctgggtg 4260 caccagattg ccctgaggat ggaagtgctg ggctgtgaag cccaggacct gtactaa 4317 <210> 96 <211> 4314 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> codon optimized mature FVIII-BDD coding sequence <220> <221> misc_feature <223> F8-BDD4, codon optimized <400> 96 gccaccagaa ggtactacct gggagctgtg gaactgagct gggactacat gcagtctgac 60 ctgggagagc tgcctgtgga tgctagattt cctccaagag tgcccaagag cttccccttc 120 aacacctctg tggtgtacaa gaaaaccctg tttgtggaat tcacagacca cctgttcaat 180 attgccaagc ctagacctcc ttggatgggc ctgctgggcc ctacaattca ggctgaggtg 240 tatgacacag tggtcatcac cctgaagaac atggccagcc atcctgtgtc tctgcatgct 300 gtgggagtgt cttactggaa ggcttctgag ggggctgagt atgatgacca gacaagccag 360 agagagaaag aggatgacaa ggttttccct gggggcagcc acacctatgt ctggcaggtc 420 ctgaaagaaa atggccctat ggcctctgat cctctgtgcc tgacatacag ctacctgagc 480 catgtggacc tggtcaagga cctgaactct ggcctgattg gggctctgct ggtgtgtaga 540 gaaggcagcc tggccaaaga aaagacccag acactgcaca agttcatcct gctgtttgct 600 gtgtttgatg agggcaagag ctggcactct gagacaaaga acagcctgat gcaggacaga 660 gatgctgcct ctgctagagc ttggcccaag atgcacacag tgaatggcta tgtgaacaga 720 agcctgcctg gactgattgg atgccacaga aagtctgtgt actggcatgt gattggcatg 780 ggcaccacac ctgaggtgca cagcatcttt ctggaaggac acaccttcct ggtgaggaac 840 cacagacagg ccagcctgga aatcagccct atcaccttcc tgacagctca gaccctgctg 900 atggatctgg gccagtttct gctgttctgc cacatcagca gccaccagca tgatggcatg 960 gaagcctatg tgaaggtgga cagctgccct gaagaacccc agctgagaat gaagaacaat 1020 gaggaagctg aggactatga tgatgacctg acagactctg agatggatgt ggtcagattt 1080 gatgatgata acagccccag cttcatccag atcagatctg tggccaagaa gcaccccaag 1140 acctgggtgc actatattgc tgctgaggaa gaggactggg attatgctcc tctggtgctg 1200 gcccctgatg acagaagcta caagagccag tacctgaaca atggccctca gagaattggc 1260 aggaagtata agaaagtgag gttcatggcc tacacagatg agacattcaa gaccagagag 1320 gctatccagc atgagtctgg cattctggga cctctgctgt atggggaagt gggggacaca 1380 ctgctgatca tcttcaagaa ccaggccagc agaccctaca acatctaccc tcatggcatc 1440 acagatgtga ggcctctgta ctctagaagg ctgcccaagg gggtgaagca cctgaaggac 1500 ttccctatcc tgcctgggga gatcttcaag tacaagtgga cagtgacagt ggaggatggc 1560 cctaccaagt ctgatcctag atgcctgaca aggtactaca gcagctttgt gaacatggaa 1620 agggacctgg cctctggcct gattggtcct ctgctgatct gctacaaaga atctgtggac 1680 cagaggggca accagatcat gagtgacaag agaaatgtga tcctgttctc tgtctttgat 1740 gagaacaggt cctggtatct gacagagaac atccagaggt ttctgcccaa tcctgctggg 1800 gtgcagctgg aagatcctga gttccaggcc tccaacatca tgcactccat caatggctat 1860 gtgtttgaca gcctgcagct gtctgtgtgc ctgcatgaag tggcctactg gtacatcctg 1920 tctattgggg cccagacaga cttcctgtct gtgttctttt ctggctacac cttcaagcac 1980 aagatggtgt atgaggatac cctgacactg ttcccattct ctggggagac agtgttcatg 2040 agcatggaaa accctggcct gtggatcctg ggctgtcaca acagtgactt cagaaacaga 2100 ggcatgacag ccctgctgaa ggtgtccagc tgtgacaaga acactgggga ctactatgag 2160 gactcttatg aggacatctc tgcctacctg ctgagcaaga acaatgccat tgagcctagg 2220 agcttctctc agaaccctcc tgtgctgaag agacaccaga gggagatcac cagaaccaca 2280 ctgcagtctg accaagagga aattgattat gatgacacca tctctgtgga gatgaagaaa 2340 gaagattttg acatctatga tgaggatgag aatcagagcc ccagatcttt ccagaagaaa 2400 acaaggcact acttcattgc tgctgtggaa agactgtggg actatggcat gagcagcagc 2460 ccccatgtgc tgagaaacag ggcccagtct ggaagtgtgc cccagttcaa gaaagtggtg 2520 ttccaagagt tcacagatgg cagcttcacc cagcctctgt atagagggga gctgaatgag 2580 cacctgggac tgctgggacc ttacatcaga gctgaggtgg aggataacat catggtcacc 2640 tttagaaacc aggcctctag gccctactcc ttctacagct ccctgatcag ctatgaagag 2700 gaccagagac agggggctga gcccagaaag aactttgtga agcccaatga gactaagacc 2760 tacttttgga aggtgcagca ccacatggcc cctacaaagg atgagtttga ctgcaaggcc 2820 tgggcctact tctctgatgt ggacctggag aaggatgtgc actctggact cattggaccc 2880 ctgcttgtgt gccacaccaa cacactgaat cctgctcatg gcaggcaagt gacagtgcaa 2940 gagtttgccc tgttcttcac catctttgat gagacaaagt cctggtactt cacagaaaac 3000 atggaaagaa actgcagggc cccttgcaac atccagatgg aagatcccac cttcaaagag 3060 aactacaggt tccatgccat caatggctac atcatggaca ctctgcctgg cctggttatg 3120 gcacaggatc agaggatcag atggtatctg ctgtccatgg gctccaatga gaatatccac 3180 agcatccact tctctggcca tgtgttcaca gtgaggaaaa aagaagagta caagatggcc 3240 ctgtacaatc tgtaccctgg ggtgtttgag actgtggaaa tgctgcctag caaggctgga 3300 atctggaggg tggaatgtct gattggagag catctgcatg ctggaatgtc taccctgttc 3360 ctggtgtaca gcaacaagtg tcagacccct ctgggcatgg cctctggaca catcagagac 3420 ttccagatca cagcctctgg ccagtatgga cagtgggctc ctaaactggc tagactgcac 3480 tactctggca gcatcaatgc ctggtccacc aaagagccct tcagctggat caaggtggac 3540 ctgctggctc ccatgatcat ccatggaatc aagacccagg gggccagaca gaagttcagc 3600 agcctgtaca tcagccagtt catcatcatg tacagcctgg atggcaagaa gtggcagacc 3660 tacagaggca acagcacagg cacactcatg gtgttctttg gcaatgtgga ctcttctggc 3720 attaagcaca acatcttcaa ccctccaatc attgccaggt acatcaggct gcaccccaca 3780 cactacagca tcagatctac cctgaggatg gaactgatgg gctgtgacct gaacagctgc 3840 tctatgcccc tgggaatgga aagcaaggcc atctctgatg cccagatcac agccagcagc 3900 tacttcacca acatgtttgc cacatggtcc ccatctaagg ccaggctgca tctgcagggc 3960 agatctaatg cttggaggcc ccaagtgaac aaccccaaag agtggctgca ggtggacttt 4020 cagaaaacca tgaaagtgac aggagtgacc acacaggggg tcaagtctct gctgacctct 4080 atgtatgtga aagagttcct gatctccagc agccaggatg gccaccagtg gaccctgttt 4140 ttccagaatg gcaaagtcaa ggtgttccag ggaaaccagg acagcttcac acctgtggtc 4200 aactccctgg atcctccact gctgaccaga tacctgagaa ttcaccctca gtcttgggtg 4260 caccagattg ctctgagaat ggaagtgctg ggatgtgaag ctcaggacct ctac 4314 <210> 97 <211> 4314 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Native FVIII-BDD mature CDS <400> 97 gccaccagaa gatactacct gggtgcagtg gaactgtcat gggactatat gcaaagtgat 60 ctcggtgagc tgcctgtgga cgcaagattt cctcctagag tgccaaaatc ttttccattc 120 aacacctcag tcgtgtacaa aaagactctg tttgtagaat tcacggttca ccttttcaac 180 atcgctaagc caaggccacc ctggatgggt ctgctaggtc ctaccatcca ggctgaggtt 240 tatgatacag tggtcattac acttaagaac atggcttccc atcctgtcag tcttcatgct 300 gttggtgtat cctactggaa agcttctgag ggagctgaat atgatgatca gaccagtcaa 360 agggagaaag aagatgataa agtcttccct ggtggaagcc atacatatgt ctggcaggtc 420 ctgaaagaga atggtccaat ggcctctgac ccactgtgcc ttacctactc atatctttct 480 catgtggacc tggtaaaaga cttgaattca ggcctcattg gagccctact agtatgtaga 540 gaagggagtc tggccaagga aaagacacag accttgcaca aatttatact actttttgct 600 gtatttgatg aagggaaaag ttggcactca gaaacaaaga actccttgat gcaggatagg 660 gatgctgcat ctgctcgggc ctggcctaaa atgcacacag tcaatggtta tgtaaacagg 720 tctctgccag gtctgattgg atgccacagg aaatcagtct attggcatgt gattggaatg 780 ggcaccactc ctgaagtgca ctcaatattc ctcgaaggtc acacatttct tgtgaggaac 840 catcgccagg cgtccttgga aatctcgcca ataactttcc ttactgctca aacactcttg 900 atggaccttg gacagtttct actgttttgt catatctctt cccaccaaca tgatggcatg 960 gaagcttatg tcaaagtaga cagctgtcca gaggaacccc aactacgaat gaaaaataat 1020 gaagaagcgg aagactatga tgatgatctt actgattctg aaatggatgt ggtcaggttt 1080 gatgatgaca actctccttc ctttatccaa attcgctcag ttgccaagaa gcatcctaaa 1140 acttgggtac attacattgc tgctgaagag gaggactggg actatgctcc cttagtcctc 1200 gcccccgatg acagaagtta taaaagtcaa tatttgaaca atggccctca gcggattggt 1260 aggaagtaca aaaaagtccg atttatggca tacacagatg aaacctttaa gactcgtgaa 1320 gctattcagc atgaatcagg aatcttggga cctttacttt atggggaagt tggagacaca 1380 ctgttgatta tatttaagaa tcaagcaagc agaccatata acatctaccc tcacggaatc 1440 actgatgtcc gtcctttgta ttcaaggaga ttaccaaaag gtgtaaaaca tttgaaggat 1500 tttccaattc tgccaggaga aatattcaaa tataaatgga cagtgactgt agaagatggg 1560 ccaactaaat cagatcctcg gtgcctgacc cgctattact ctagtttcgt taatatggag 1620 agagatctag cttcaggact cattggccct ctcctcatct gctacaaaga atctgtagat 1680 caaagaggaa accagataat gtcagacaag aggaatgtca tcctgttttc tgtatttgat 1740 gagaaccgaa gctggtacct cacagagaat atacaacgct ttctccccaa tccagctgga 1800 gtgcagcttg aggatccaga gttccaagcc tccaacatca tgcacagcat caatggctat 1860 gtttttgata gtttgcagtt gtcagtttgt ttgcatgagg tggcatactg gtacattcta 1920 agcattggag cacagactga cttcctttct gtcttcttct ctggatatac cttcaaacac 1980 aaaatggtct atgaagacac actcacccta ttcccattct caggagaaac tgtcttcatg 2040 tcgatggaaa acccaggtct atggattctg gggtgccaca actcagactt tcggaacaga 2100 ggcatgaccg ccttactgaa ggtttctagt tgtgacaaga acactggtga ttattacgag 2160 gacagttatg aagatatttc agcatacttg ctgagtaaaa acaatgccat tgaaccaaga 2220 agcttctccc agaatccacc agtcttgaaa cgccatcaac gggaaataac tcgtactact 2280 cttcagtcag atcaagagga aattgactat gatgatacca tatcagttga aatgaagaag 2340 gaagattttg acatttatga tgaggatgaa aatcagagcc cccgcagctt tcaaaagaaa 2400 acacgacact attttattgc tgcagtggag aggctctggg attatgggat gagtagctcc 2460 ccacatgttc taagaaacag ggctcagagt ggcagtgtcc ctcagttcaa gaaagttgtt 2520 ttccaggaat ttactgatgg ctcctttact cagcccttat accgtggaga actaaatgaa 2580 catttgggac tcctggggcc atatataaga gcagaagttg aagataatat catggtaact 2640 ttcagaaatc aggcctctcg tccctattcc ttctattcta gccttatttc ttatgaggaa 2700 gatcagaggc aaggagcaga acctagaaaa aactttgtca agcctaatga aaccaaaact 2760 tacttttgga aagtgcaaca tcatatggca cccactaaag atgagtttga ctgcaaagcc 2820 tgggcttatt tctctgatgt tgacctggaa aaagatgtgc actcaggcct gattggaccc 2880 cttctggtct gccacactaa cacactgaac cctgctcatg ggagacaagt gacagtacag 2940 gaatttgctc tgtttttcac catctttgat gagaccaaaa gctggtactt cactgaaaat 3000 atggaaagaa actgcagggc tccctgcaat atccagatgg aagatcccac ttttaaagag 3060 aattatcgct tccatgcaat caatggctac ataatggata cactacctgg cttagtaatg 3120 gctcaggatc aaaggattcg atggtatctg ctcagcatgg gcagcaatga aaacatccat 3180 tctattcatt tcagtggaca tgtgttcact gtacgaaaaa aagaggagta taaaatggca 3240 ctgtacaatc tctatccagg tgtttttgag acagtggaaa tgttaccatc caaagctgga 3300 atttggcggg tggaatgcct tattggcgag catctacatg ctgggatgag cacacttttt 3360 ctggtgtaca gcaataagtg tcagactccc ctgggaatgg cttctggaca cattagagat 3420 tttcagatta cagcttcagg acaatatgga cagtgggccc caaagctggc cagacttcat 3480 tattccggat caatcaatgc ctggagcacc aaggagccct tttcttggat caaggtggat 3540 ctgttggcac caatgattat tcacggcatc aagacccagg gtgcccgtca gaagttctcc 3600 agcctctaca tctctcagtt tatcatcatg tatagtcttg atgggaagaa gtggcagact 3660 tatcgaggaa attccactgg aaccttaatg gtcttctttg gcaatgtgga ttcatctggg 3720 ataaaacaca atatttttaa ccctccaatt attgctcgat acatccgttt gcacccaact 3780 cattatagca ttcgcagcac tcttcgcatg gagttgatgg gctgtgattt aaatagttgc 3840 agcatgccat tgggaatgga gagtaaagca atatcagatg cacagattac tgcttcatcc 3900 tactttacca atatgtttgc cacctggtct ccttcaaaag ctcgacttca cctccaaggg 3960 aggagtaatg cctggagacc tcaggtgaat aatccaaaag agtggctgca agtggacttc 4020 cagaagacaa tgaaagtcac aggagtaact actcagggag taaaatctct gcttaccagc 4080 atgtatgtga aggagttcct catctccagc agtcaagatg gccatcagtg gactctcttt 4140 tttcagaatg gcaaagtaaa ggtttttcag ggaaatcaag actccttcac acctgtggtg 4200 aactctctag acccaccgtt actgactcgc taccttcgaa ttcaccccca gagttgggtg 4260 caccagattg ccctgaggat ggaggttctg ggctgcgagg cacaggacct ctac 4314 <210> 98 <211> 9 <212> PRT <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 98 Asp Ala His Ala Thr Arg Arg Tyr Tyr 1 5 <210> 99 <211> 7 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Branch site consensus sequence <220> <221> misc_feature <222> (1)..(1) <223> Y is T or C <220> <221> misc_feature <222> (2)..(2) <223> N is any nucleotide <220> <221> misc_feature <222> (3)..(3) <223> Y is C or T <220> <221> misc_feature <222> (4)..(4) <223> Y is T or C <220> <221> misc_feature <222> (5)..(5) <223> R is A or G <220> <221> misc_feature <222> (7)..(7) <223> Y is C or T <400> 99 ynyyray 7 <210> 100 <211> 22 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> target nucleic acid sequence <220> <221> misc_feature <222> (1)..(20) <223> N is any nucleotide <220> <221> misc_feature <222> (21)..(21) <223> R is G or A <400> 100 nnnnnnnnnn nnnnnnnnnn rg 22 <210> 101 <211> 8 <212> DNA <213> Neisseria meningitidis <220> <221> misc_feature <223> Neisseria meningitidis PAM <220> <221> misc_feature <222> (1)..(4) <223> N is any nucleotide <400> 101 nnnngatt 8 <210> 102 <211> 9 <212> DNA <213> Neisseria meningitidis <220> <221> misc_feature <223> Neisseria meningitidis PAM <220> <221> misc_feature <222> (1)..(5) <223> N is any nucleotide <400> 102 nnnnngttt 9 <210> 103 <211> 8 <212> DNA <213> Neisseria meningitidis <220> <221> misc_feature <223> Neisseria meningitidis PAM <220> <221> misc_feature <222> (1)..(4) <223> N is any nucleotide <400> 103 nnnngctt 8 <210> 104 <211> 23 <212> DNA <213> Homo sapiens <220> <221> misc_feature <223> Human Albumin Intron-1_T25 <400> 104 accttttttt ttttttacct agg 23 <210> 105 <211> 1296 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> codon optimized FIX coding sequence <400> 105 ttcctcgacc acgagaacgc caacaagatc ctgaacagac ccaagcggta caacagcggc 60 aagctggaag agttcgtgca gggcaacctg gaacgcgagt gcatggaaga gaagtgcagc 120 ttcgaagagg ccagagaggt gttcgagaac accgagagaa ccaccgagtt ctggaagcag 180 tacgtggacg gcgaccagtg cgagagcaat ccttgtctga atggcggcag ctgcaaggac 240 gacatcaaca gctacgagtg ctggtgccct ttcggcttcg agggcaagaa ttgcgagctg 300 gacgtgacct gcaacatcaa gaacggcaga tgcgagcagt tctgcaagaa cagcgccgac 360 aacaaggtcg tgtgctcctg tacagagggc tacagactgg ccgagaacca gaagtcttgc 420 gagcctgccg tgccttttcc atgtggcaga gtgtctgtgt cccagaccag caagctgacc 480 agagccgaga cagtgttccc cgatgtggac tacgtgaaca gcaccgaggc cgagacaatc 540 ctggacaaca tcacccagag cacccagtcc ttcaacgact tcacaagagt cgtcggcggc 600 gaggatgcca aacctggaca gtttccttgg caagtggtgc tgaatggcaa ggtggacgcc 660 ttttgtggcg gctccatcgt gaacgagaag tggattgtga ccgccgctca ctgtgtggaa 720 accggcgtga aaattacagt ggtggccggc gagcacaaca tcgaggaaac agagcacacc 780 gagcagaaac ggaacgtgat cagaatcatc cctcaccaca actacaacgc cgccatcaac 840 aagtacaacc acgatatcgc cctgctggaa ctggacgagc ctctcgtgct gaatagctac 900 gtgaccccta tctgtatcgc cgacaaagag tacaccaaca tctttctgaa gttcggcagc 960 ggctacgtgt ccggctgggg aagagttttc cacaagggaa gatctgccct ggtgctgcag 1020 tacctgagag tgcctctggt ggatagagcc acctgtctga gaagcaccaa gttcaccatc 1080 tacaacaaca tgttctgcgc cggcttccac gaaggcggca gagattcttg tcaaggcgat 1140 tctggcggcc ctcacgtgac agaggtggaa ggcacaagct ttctgaccgg catcatcagc 1200 tggggcgaag agtgtgccat gaaggggaag tacggcatct acaccaaggt gtccagatac 1260 gtgaactgga tcaaagaaaa gaccaagctc acctga 1296 <210> 106 <211> 1437 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> SERPING1 coding sequence <400> 106 aaccccaacg ccaccagcag cagctctcag gatccagagt ctctgcagga cagaggcgag 60 ggcaaagtgg ccacaaccgt gatcagcaag atgctgttcg tggaacccat cctggaagtg 120 tccagcctgc ctaccaccaa cagcacaaca aacagcgcca ccaagatcac cgccaacacc 180 accgatgagc ctaccacaca gcctacaacc gagccaacca ctcagcccac tatccagcct 240 acacagccaa ctacacagct gcccacagac agcccaactc agccaacaac aggcagcttc 300 tgccctggac ctgtgacact gtgtagcgac ctggaaagcc actctacaga ggccgttctg 360 ggagatgccc tggtggattt cagcctgaag ctgtaccacg ccttcagcgc catgaagaaa 420 gtggaaacaa acatggcctt cagtcccttc agcattgcca gcctgctgac acaggttctg 480 ctcggagctg gcgagaacac caagaccaac ctggaatcta tcctgagcta ccccaaggac 540 ttcacatgcg tgcaccaggc tctgaagggc ttcaccacaa agggcgtgac aagcgtgtcc 600 cagatcttcc actctcctga cctggccatc agagacacct tcgtgaacgc cagcagaacc 660 ctgtacagca gctcccctag agtgctgagc aacaacagcg acgctaacct ggaactgatc 720 aacacctggg tcgccaagaa cacaaacaac aagatcagca gactgctgga cagcctgcca 780 agcgacacaa gactggtgct gctgaacgcc atctacctga gcgccaagtg gaaaaccaca 840 ttcgacccca agaaaaccag gatggaaccc ttccacttca agaacagcgt gatcaaggtg 900 cccatgatga acagcaagaa ataccccgtg gctcacttca tcgatcagac cctgaaggct 960 aaagtgggcc agctccagct gagccacaac ctgtctctgg ttatcctggt gcctcagaac 1020 ctgaagcaca ggctggaaga tatggaacag gccctgtctc ctagcgtgtt caaggccatc 1080 atggaaaagc tggaaatgag caagttccag ccaacactgc tgaccctgcc tagaatcaaa 1140 gtgaccacca gccaggacat gctgagcatt atggaaaaac tcgaattctt cgacttcagc 1200 tacgacctga acctgtgcgg cctgacagag gaccctgatc tgcaagtgtc tgccatgcag 1260 catcagaccg tgctggaact caccgagaca ggcgttgaag ctgccgccgc ttctgctatc 1320 tctgtggcta gaaccctgct ggtgttcgag gtgcagcagc ctttcctgtt cgtgctgtgg 1380 gatcagcagc ataagttccc cgtgttcatg ggcagagtgt acgaccctag agcctga 1437 <210> 107 <211> 18 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> 18-bp random sequence <400> 107 cggtactcct caaagcgt 18 <210> 108 <211> 28 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> hFIX splice acceptor <400> 108 actaaagaat tattctttta catttcag 28 <210> 109 <211> 2705 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Stuffer fragment derived from human micro-satellite sequence <400> 109 ggatccgccc aggtttaaac gcgcggctgc agaaagtgtg tttctaaact gctacatcgc 60 aaggaatgct cagctctgtg agttcaactc aatcatccca aagaattttc tgagaaagct 120 tctgtcttct ttttatagga agttatttcc tttactacgg tactcctcaa agagtgcaat 180 gatccccttg cagtttctac aaaaagagtg tttcaaacct gaactatcaa agaaaggttc 240 cacactgtga gttgaatgca gacatcacga agaaggttct gagagtgctt ctgtttagtt 300 ctgtgcagtt tatcccgttt ccaacgaaat gctcagagag gaccaaatat ccacttgcag 360 tttctacaaa aagagtgttt caaagctgaa ctatcaaaga aaggttcagc actgtgagtt 420 gaatgcaaac atcacgaaga gggttctgag aatgcttctg tttagttctg tgcgggttat 480 cccgtttcca acgaaatcct cagagcggtc caaatatcta cttgcagttt ctacagaaag 540 accgtttcaa acctgaacta tcaaagaaag gttcaacact gtgagttgaa tgcaaacatc 600 acgaagaagg ttctgagaat gcttctgttt agttctgtgc ggtttatccc gtttccaacg 660 aaatcctcag agaggcctaa atatccactt gcacattcta caaatagtgt gtttcgaaac 720 tgctccatcc aaaggaatgt tcagctctgt gagttaaact cagtcgtcac caagagtttt 780 ctgtgaatgc tactgtctag cttttatatg aagctatttc ctttactacc ataggcctaa 840 agcggtccat atctccactt gcagattcta cacaaagaga gtttccaaac tgctctgtca 900 aagggaatgt tcaactctgt gacttgaatg caatcatcac aaagtagttt ctgagaatgc 960 ttctatctag cttttacggg aagataattc cttttccacc acaggcctca aagccctcca 1020 aatgtccact tgcagattct ggaaaaagag tgtttcaaag cttctctctc gaaaggaaag 1080 ttcaactctg tgagttgaat gcaagcatca caaagaagtt tctgagaatg cttctgttta 1140 gctttcctgt gaagattctc ccgtttccaa cgaaatcttc aaaaaggtcc aaatatccac 1200 ttgcagattc cacacaaaga gtgattggaa actgctcttt gaaaaggaac cttcaactct 1260 gtgagttgaa tgcaatcatc acaaagaagt ttctgacaat gcttctctcc agtttttatg 1320 tgaccataat tcgttttcca ccacaggcct gaaagcgctc caaatgtcca cttgtagaca 1380 ctacgaaaag catgtttcag aactactcta tgaaaagcaa tgtgaaactc tgggagttga 1440 acacaaacat cacagagaag tttctgagaa tgcttctgtt tagtttttat gtgaagatat 1500 tcccgtttcc aaagacatct tcggagaggt ccacatatcc acttgcagat tccacaaaaa 1560 gagagtttca acactgctct atccatagga gggttcaact ctgtgagttg aatgcaatca 1620 tcacagagaa gtttctgaga aggcttctgt ctagatttta tgcgaagata tacccgtttc 1680 gaacgaaggc cacagagtgg tccaaatatc cacttgcaga tcctacaaaa agagtgtttc 1740 aaacctgaac tatcaaagga aggttcaact ctgggatttg aatgcaaaca tcaccaagaa 1800 gtttctgaga atgcttccgt ttagttaggt gcagttatcc cgtttccaac gaaatcctca 1860 gagaggtcca aatatccact tgtagattgt acaaaaagag tgtctcaaac ctgctccatc 1920 caaaggaatg ttcagctctg tgagttaaac tcaatcatca caaagtattt tctgagaatg 1980 cttctgtcta gtttttctat gaagctattc cctttactac cataggcctc aaagcgctcc 2040 aaatctccac ttgcacattc cacaacaaga gtgtttccaa actgctctat caataggaat 2100 gttcaactct gtgaggtgaa tgcaatcatc acaaagcagt ttctgagaat gcttctatct 2160 agtatttagg tgaagatatt tccttttcca ccacaaacca caaagccctc caaacgtcca 2220 cttgcagatt ctagaaaaag agtgtttcat agctgctctt tccaaaggaa agttcaactc 2280 tgggagttga atacaaacat caccaaaaag ttcctgagaa tgcatctgtg tagtttttat 2340 gtgaagatga ttccgtttcc aacgaaatct tcaaagaggt ctacatgtcc ccttgcagat 2400 gccacagaaa gagagtttca aaactgcgct ctcaaaagga gagttcaact ccgtgagttg 2460 aatgcagtca tcacagagaa gcttctgagg atgcttctgt ctagatggca tgtgaagata 2520 tacccgtttc gaacgaagga cacagagtgg tccaaatatc cacttgtaga tcctgcaaaa 2580 agagtgtttc aaacgtgaac tttgaaagga aagttcaact cggggatttg aatgcaaaca 2640 tcacaaagaa gattctgaga ctgcttctgt ttagtcagct gaaattatcc cgtttccaac 2700 gaatt 2705 <210> 110 <211> 1400 <212> PRT <213> Streptococcus pyogenes <220> <221> misc_feature <223> Cas9 endonuclease <400> 110 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val 20 25 30 Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 35 40 45 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 50 55 60 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 65 70 75 80 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 85 90 95 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 100 105 110 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 115 120 125 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 130 135 140 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 145 150 155 160 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 165 170 175 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 180 185 190 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 195 200 205 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 210 215 220 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 225 230 235 240 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 245 250 255 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 260 265 270 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 275 280 285 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 290 295 300 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 305 310 315 320 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 325 330 335 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 340 345 350 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 355 360 365 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 370 375 380 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 385 390 395 400 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 405 410 415 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 420 425 430 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 435 440 445 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 450 455 460 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 465 470 475 480 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 485 490 495 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 500 505 510 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 515 520 525 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 530 535 540 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 545 550 555 560 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 565 570 575 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 580 585 590 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 595 600 605 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 610 615 620 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 625 630 635 640 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 645 650 655 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 660 665 670 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 675 680 685 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 690 695 700 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 705 710 715 720 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 725 730 735 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 740 745 750 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 755 760 765 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 770 775 780 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 785 790 795 800 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 805 810 815 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 820 825 830 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 835 840 845 Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys 850 855 860 Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg 865 870 875 880 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 885 890 895 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 900 905 910 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 915 920 925 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 930 935 940 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 945 950 955 960 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 965 970 975 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 980 985 990 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 995 1000 1005 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu 1010 1015 1020 Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile 1025 1030 1035 Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe 1040 1045 1050 Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu 1055 1060 1065 Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly 1070 1075 1080 Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr 1085 1090 1095 Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys 1100 1105 1110 Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro 1115 1120 1125 Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp 1130 1135 1140 Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser 1145 1150 1155 Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu 1160 1165 1170 Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser 1175 1180 1185 Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr 1190 1195 1200 Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser 1205 1210 1215 Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala 1220 1225 1230 Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr 1235 1240 1245 Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly 1250 1255 1260 Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His 1265 1270 1275 Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser 1280 1285 1290 Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser 1295 1300 1305 Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu 1310 1315 1320 Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala 1325 1330 1335 Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr 1340 1345 1350 Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile 1355 1360 1365 Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly 1370 1375 1380 Asp Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys 1385 1390 1395 Lys Lys 1400 <210> 111 <211> 1054 <212> PRT <213> Staphylococcus lugdunensis <220> <221> misc_feature <223> Cas9 endonuclease <400> 111 Met Asn Gln Lys Phe Ile Leu Gly Leu Asp Ile Gly Ile Thr Ser Val 1 5 10 15 Gly Tyr Gly Leu Ile Asp Tyr Glu Thr Lys Asn Ile Ile Asp Ala Gly 20 25 30 Val Arg Leu Phe Pro Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg 35 40 45 Ser Lys Arg Gly Ser Arg Arg Leu Lys Arg Arg Arg Ile His Arg Leu 50 55 60 Glu Arg Val Lys Lys Leu Leu Glu Asp Tyr Asn Leu Leu Asp Gln Ser 65 70 75 80 Gln Ile Pro Gln Ser Thr Asn Pro Tyr Ala Ile Arg Val Lys Gly Leu 85 90 95 Ser Glu Ala Leu Ser Lys Asp Glu Leu Val Ile Ala Leu Leu His Ile 100 105 110 Ala Lys Arg Arg Gly Ile His Lys Ile Asp Val Ile Asp Ser Asn Asp 115 120 125 Asp Val Gly Asn Glu Leu Ser Thr Lys Glu Gln Leu Asn Lys Asn Ser 130 135 140 Lys Leu Leu Lys Asp Lys Phe Val Cys Gln Ile Gln Leu Glu Arg Met 145 150 155 160 Asn Glu Gly Gln Val Arg Gly Glu Lys Asn Arg Phe Lys Thr Ala Asp 165 170 175 Ile Ile Lys Glu Ile Ile Gln Leu Leu Asn Val Gln Lys Asn Phe His 180 185 190 Gln Leu Asp Glu Asn Phe Ile Asn Lys Tyr Ile Glu Leu Val Glu Met 195 200 205 Arg Arg Glu Tyr Phe Glu Gly Pro Gly Lys Gly Ser Pro Tyr Gly Trp 210 215 220 Glu Gly Asp Pro Lys Ala Trp Tyr Glu Thr Leu Met Gly His Cys Thr 225 230 235 240 Tyr Phe Pro Asp Glu Leu Arg Ser Val Lys Tyr Ala Tyr Ser Ala Asp 245 250 255 Leu Phe Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Gln Arg Asp 260 265 270 Gly Leu Ser Lys Leu Glu Tyr His Glu Lys Tyr His Ile Ile Glu Asn 275 280 285 Val Phe Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Asn Glu 290 295 300 Ile Asn Val Asn Pro Glu Asp Ile Lys Gly Tyr Arg Ile Thr Lys Ser 305 310 315 320 Gly Lys Pro Gln Phe Thr Glu Phe Lys Leu Tyr His Asp Leu Lys Ser 325 330 335 Val Leu Phe Asp Gln Ser Ile Leu Glu Asn Glu Asp Val Leu Asp Gln 340 345 350 Ile Ala Glu Ile Leu Thr Ile Tyr Gln Asp Lys Asp Ser Ile Lys Ser 355 360 365 Lys Leu Thr Glu Leu Asp Ile Leu Leu Asn Glu Glu Asp Lys Glu Asn 370 375 380 Ile Ala Gln Leu Thr Gly Tyr Thr Gly Thr His Arg Leu Ser Leu Lys 385 390 395 400 Cys Ile Arg Leu Val Leu Glu Glu Gln Trp Tyr Ser Ser Arg Asn Gln 405 410 415 Met Glu Ile Phe Thr His Leu Asn Ile Lys Pro Lys Lys Ile Asn Leu 420 425 430 Thr Ala Ala Asn Lys Ile Pro Lys Ala Met Ile Asp Glu Phe Ile Leu 435 440 445 Ser Pro Val Val Lys Arg Thr Phe Gly Gln Ala Ile Asn Leu Ile Asn 450 455 460 Lys Ile Ile Glu Lys Tyr Gly Val Pro Glu Asp Ile Ile Ile Glu Leu 465 470 475 480 Ala Arg Glu Asn Asn Ser Lys Asp Lys Gln Lys Phe Ile Asn Glu Met 485 490 495 Gln Lys Lys Asn Glu Asn Thr Arg Lys Arg Ile Asn Glu Ile Ile Gly 500 505 510 Lys Tyr Gly Asn Gln Asn Ala Lys Arg Leu Val Glu Lys Ile Arg Leu 515 520 525 His Asp Glu Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ser Ile Pro 530 535 540 Leu Glu Asp Leu Leu Asn Asn Pro Asn His Tyr Glu Val Asp His Ile 545 550 555 560 Ile Pro Arg Ser Val Ser Phe Asp Asn Ser Tyr His Asn Lys Val Leu 565 570 575 Val Lys Gln Ser Glu Asn Ser Lys Lys Ser Asn Leu Thr Pro Tyr Gln 580 585 590 Tyr Phe Asn Ser Gly Lys Ser Lys Leu Ser Tyr Asn Gln Phe Lys Gln 595 600 605 His Ile Leu Asn Leu Ser Lys Ser Gln Asp Arg Ile Ser Lys Lys Lys 610 615 620 Lys Glu Tyr Leu Leu Glu Glu Arg Asp Ile Asn Lys Phe Glu Val Gln 625 630 635 640 Lys Glu Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg 645 650 655 Glu Leu Thr Asn Tyr Leu Lys Ala Tyr Phe Ser Ala Asn Asn Met Asn 660 665 670 Val Lys Val Lys Thr Ile Asn Gly Ser Phe Thr Asp Tyr Leu Arg Lys 675 680 685 Val Trp Lys Phe Lys Lys Glu Arg Asn His Gly Tyr Lys His His Ala 690 695 700 Glu Asp Ala Leu Ile Ile Ala Asn Ala Asp Phe Leu Phe Lys Glu Asn 705 710 715 720 Lys Lys Leu Lys Ala Val Asn Ser Val Leu Glu Lys Pro Glu Ile Glu 725 730 735 Thr Lys Gln Leu Asp Ile Gln Val Asp Ser Glu Asp Asn Tyr Ser Glu 740 745 750 Met Phe Ile Ile Pro Lys Gln Val Gln Asp Ile Lys Asp Phe Arg Asn 755 760 765 Phe Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Gln Leu Ile 770 775 780 Asn Asp Thr Leu Tyr Ser Thr Arg Lys Lys Asp Asn Ser Thr Tyr Ile 785 790 795 800 Val Gln Thr Ile Lys Asp Ile Tyr Ala Lys Asp Asn Thr Thr Leu Lys 805 810 815 Lys Gln Phe Asp Lys Ser Pro Glu Lys Phe Leu Met Tyr Gln His Asp 820 825 830 Pro Arg Thr Phe Glu Lys Leu Glu Val Ile Met Lys Gln Tyr Ala Asn 835 840 845 Glu Lys Asn Pro Leu Ala Lys Tyr His Glu Glu Thr Gly Glu Tyr Leu 850 855 860 Thr Lys Tyr Ser Lys Lys Asn Asn Gly Pro Ile Val Lys Ser Leu Lys 865 870 875 880 Tyr Ile Gly Asn Lys Leu Gly Ser His Leu Asp Val Thr His Gln Phe 885 890 895 Lys Ser Ser Thr Lys Lys Leu Val Lys Leu Ser Ile Lys Pro Tyr Arg 900 905 910 Phe Asp Val Tyr Leu Thr Asp Lys Gly Tyr Lys Phe Ile Thr Ile Ser 915 920 925 Tyr Leu Asp Val Leu Lys Lys Asp Asn Tyr Tyr Tyr Ile Pro Glu Gln 930 935 940 Lys Tyr Asp Lys Leu Lys Leu Gly Lys Ala Ile Asp Lys Asn Ala Lys 945 950 955 960 Phe Ile Ala Ser Phe Tyr Lys Asn Asp Leu Ile Lys Leu Asp Gly Glu 965 970 975 Ile Tyr Lys Ile Ile Gly Val Asn Ser Asp Thr Arg Asn Met Ile Glu 980 985 990 Leu Asp Leu Pro Asp Ile Arg Tyr Lys Glu Tyr Cys Glu Leu Asn Asn 995 1000 1005 Ile Lys Gly Glu Pro Arg Ile Lys Lys Thr Ile Gly Lys Lys Val 1010 1015 1020 Asn Ser Ile Glu Lys Leu Thr Thr Asp Val Leu Gly Asn Val Phe 1025 1030 1035 Thr Asn Thr Gln Tyr Thr Lys Pro Gln Leu Leu Phe Lys Arg Gly 1040 1045 1050 Asn

Claims (114)

  1. 시스템으로서,
    데옥시리보핵산(DNA) 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산;
    서열번호 22, 21, 28, 30, 18-20, 23-27, 29, 31-44, 및 104 중 임의의 하나로부터의 스페이서 서열을 포함하는 가이드 RNA(gRNA), 또는 상기 gRNA를 인코딩하는 핵산; 및
    관심 유전자(GOI: gene-of-interest) 또는 이의 기능적 유도체를 인코딩하는 핵산 서열을 포함하는 공여체 주형을 포함하는, 시스템.
  2. 제1항에 있어서, 상기 gRNA는 서열번호 22, 21, 28, 및 30 중 임의의 하나로부터의 스페이서 서열을 포함하는, 시스템.
  3. 제2항에 있어서, 상기 gRNA는 서열번호 22로부터의 스페이서 서열을 포함하는, 시스템.
  4. 제2항에 있어서, 상기 gRNA는 서열번호 21로부터의 스페이서 서열을 포함하는, 시스템.
  5. 제2항에 있어서, 상기 gRNA는 서열번호 28로부터의 스페이서 서열을 포함하는, 시스템.
  6. 제2항에 있어서, 상기 gRNA는 서열번호 30으로부터의 스페이서 서열을 포함하는, 시스템.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서, 상기 DNA 엔도뉴클레아제는 서열 NGG 또는 NNGG를 갖는 프로토스페이서 인접 모티프(PAM: protospacer adjacent motif); 또는 이의 기능적 유도체를 인식하며, 여기서 N은 임의의 뉴클레오타이드인, 시스템.
  8. 제1항 내지 제7항 중 어느 한 항에 있어서, 상기 DNA 엔도뉴클레아제는 II형 Cas 엔도뉴클레아제 또는 이의 기능적 유도체인, 시스템.
  9. 제1항 내지 제8항 중 어느 한 항에 있어서, 상기 DNA 엔도뉴클레아제는 Cas9인, 시스템.
  10. 제1항 내지 제9항 중 어느 한 항에 있어서, 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산은 숙주 세포에서의 발현을 위해 코돈 최적화되는 것인, 시스템.
  11. 제1항 내지 제10항 중 어느 한 항에 있어서, 상기 GOI 또는 이의 기능적 유도체를 인코딩하는 핵산 서열은 숙주 세포에서의 발현을 위해 코돈 최적화되는 것인, 시스템.
  12. 제1항 내지 제11항 중 어느 한 항에 있어서, 상기 GOI는 치료적 폴리펩타이드 및 예방적 폴리펩타이드로 이루어진 군으로부터 선택되는 폴리펩타이드를 인코딩하는, 시스템.
  13. 제1항 내지 제11항 중 어느 한 항에 있어서, 상기 GOI는 인자 VIII(FVIII) 단백질, 인자 IX(FIX) 단백질, 알파-1-항트립신, 인자 XIII(FXIII) 단백질, 인자 VII(FVII) 단백질, 인자 X(FX) 단백질, 단백질 C, 세린 프로테아제 저해제 G1(세르핀(serpin) G1), 또는 이의 임의의 기능적 유도체로 이루어진 군으로부터 선택되는 단백질을 인코딩하는, 시스템.
  14. 제13항에 있어서, 상기 GOI는 FVIII 단백질 또는 이의 임의의 기능적 유도체를 인코딩하는, 시스템.
  15. 제13항에 있어서, 상기 GOI는 FIX 단백질 또는 이의 임의의 기능적 유도체를 인코딩하는, 시스템.
  16. 제13항에 있어서, 상기 GOI는 세르핀 G1 단백질 또는 이의 임의의 기능적 유도체를 인코딩하는, 시스템.
  17. 제1항 내지 제16항 중 어느 한 항에 있어서, 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산은 데옥시리보핵산(DNA)인, 시스템.
  18. 제1항 내지 제16항 중 어느 한 항에 있어서, 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산은 리보핵산(RNA)인, 시스템.
  19. 제18항에 있어서, 상기 DNA 엔도뉴클레아제를 인코딩하는 RNA는 mRNA인, 시스템.
  20. 제1항 내지 제19항 중 어느 한 항에 있어서, 상기 공여체 주형은 AAV 벡터에서 인코딩되는, 시스템.
  21. 제20항에 있어서, 상기 공여체 주형은 GOI 또는 기능적 유도체를 인코딩하는 핵산 서열을 포함하는 공여체 카세트를 포함하고, 상기 공여체 카세트는 한면 또는 양면 상에서 gRNA 표적 부위에 의해 측면 근접해 있는(flanked), 시스템.
  22. 제21항에 있어서, 상기 공여체 카세트는 한면 또는 양면 상에서 gRNA 표적 부위에 의해 측면 근접해 있는, 시스템.
  23. 제21항 또는 제22항에 있어서, 상기 gRNA 표적 부위는 상기 시스템 내 gRNA에 대한 표적 부위인, 시스템.
  24. 제23항에 있어서, 상기 공여체 주형의 gRNA 표적 부위는 상기 시스템 내 gRNA에 대한 게놈 gRNA 표적 부위의 역보체(reverse complement)인, 시스템.
  25. 제1항 내지 제24항 중 어느 한 항에 있어서, 상기 DNA 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산은 리포솜 또는 지질 나노입자에서 제형화되는, 시스템.
  26. 제25항에 있어서, 상기 리포솜 또는 지질 나노입자는 또한 gRNA를 포함하는, 시스템.
  27. 제1항 내지 제26항 중 어느 한 항에 있어서, 상기 DNA 엔도뉴클레아제는 gRNA와 예비복합체화되어, 리보뉴클레오단백질(RNP) 복합체를 형성하는, 시스템.
  28. 세포에서 게놈을 편집하는 방법으로서, 상기 방법은
    세포에,
    (a) 서열번호 22, 21, 28, 30, 18-20, 23-27, 29, 31-44, 및 104 중 임의의 하나로부터의 스페이서 서열을 포함하는 gRNA, 또는 상기 gRNA를 인코딩하는 핵산;
    (b) DNA 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산; 및
    (c) 관심 유전자(GOI) 또는 이의 기능적 유도체를 인코딩하는 핵산 서열을 포함하는 공여체 주형을 제공하는 단계를 포함하는, 방법.
  29. 제28항에 있어서, 상기 gRNA는 서열번호 22, 21, 28, 및 30 중 임의의 하나로부터의 스페이서 서열을 포함하는, 방법.
  30. 제29항에 있어서, 상기 gRNA는 서열번호 21로부터의 스페이서 서열을 포함하는, 방법.
  31. 제30항에 있어서, 상기 gRNA는 서열번호 22로부터의 스페이서 서열을 포함하는, 방법.
  32. 제29항에 있어서, 상기 gRNA는 서열번호 28로부터의 스페이서 서열을 포함하는, 방법.
  33. 제29항에 있어서, 상기 gRNA는 서열번호 30으로부터의 스페이서 서열을 포함하는, 방법.
  34. 제28항 내지 제33항 중 어느 한 항에 있어서, 상기 DNA 엔도뉴클레아제는 서열 NGG 또는 NNGG를 갖는 프로토스페이서 인접 모티프(PAM); 또는 이의 기능적 유도체를 인식하며, 여기서 N은 임의의 뉴클레오타이드인, 방법.
  35. 제28항 내지 제34항 중 어느 한 항에 있어서, 상기 DNA 엔도뉴클레아제는 II형 Cas 엔도뉴클레아제 또는 이의 기능적 유도체인, 방법.
  36. 제28항 내지 제35항 중 어느 한 항에 있어서, 상기 DNA 엔도뉴클레아제는 Cas9인, 방법.
  37. 제28항 내지 제36항 중 어느 한 항에 있어서, 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산은 세포에서의 발현을 위해 코돈 최적화되는 것인, 방법.
  38. 제28항 내지 제37항 중 어느 한 항에 있어서, 상기 GOI 또는 이의 기능적 유도체를 인코딩하는 핵산 서열은 세포에서의 발현을 위해 코돈 최적화되는 것인, 방법.
  39. 제28항 내지 제38항 중 어느 한 항에 있어서, 상기 GOI는 치료적 폴리펩타이드 및 예방적 폴리펩타이드로 이루어진 군으로부터 선택되는 폴리펩타이드를 인코딩하는, 방법.
  40. 제28항 내지 제38항 중 어느 한 항에 있어서, GOI는 FVIII 단백질, FIX 단백질, 알파-1-항트립신, FXIII 단백질, FVII 단백질, FX 단백질, 단백질 C, 세르핀 G1, 또는 이의 임의의 기능적 유도체로 이루어진 군으로부터 선택되는 단백질을 인코딩하는, 방법.
  41. 제28항 내지 제40항 중 어느 한 항에 있어서, 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산은 데옥시리보핵산(DNA)인, 방법.
  42. 제28항 내지 제40항 중 어느 한 항에 있어서, 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산은 리보핵산(RNA)인, 방법.
  43. 제42항에 있어서, 상기 DNA 엔도뉴클레아제를 인코딩하는 RNA는 mRNA인, 방법.
  44. 제28항 내지 제43항 중 어느 한 항에 있어서, 상기 공여체 주형은 AAV 벡터에서 인코딩되는, 방법.
  45. 제28항 내지 제44항 중 어느 한 항에 있어서, 상기 공여체 주형은 GOI 또는 기능적 유도체를 인코딩하는 핵산 서열을 포함하는 공여체 카세트를 포함하고, 상기 공여체 카세트는 한면 또는 양면 상에서 gRNA 표적 부위에 의해 측면 근접해 있는, 방법.
  46. 제45항에 있어서, 상기 공여체 카세트는 한면 또는 양면 상에서 gRNA 표적 부위에 의해 측면 근접해 있는, 방법.
  47. 제45항 또는 제46항에 있어서, 상기 gRNA 표적 부위는 (a)의 gRNA에 대한 표적 부위인, 방법.
  48. 제47항에 있어서, 상기 공여체 주형의 gRNA 표적 부위는 (a)의 gRNA에 대한 세포 게놈 내 gRNA 표적 부위의 역보체인, 방법.
  49. 제28항 내지 제48항 중 어느 한 항에 있어서, 상기 DNA 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산은 리포솜 또는 지질 나노입자에서 제형화되는, 방법.
  50. 제49항에 있어서, 상기 리포솜 또는 지질 나노입자는 또한 gRNA를 포함하는, 방법.
  51. 제28항 내지 제50항 중 어느 한 항에 있어서, 상기 세포에 gRNA와 예비복합체화된 DNA 엔도뉴클레아제를 제공하여, RNP 복합체를 형성하는 단계를 포함하는, 방법.
  52. 제28항 내지 제51항 중 어느 한 항에 있어서, (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산은 (c)의 공여체 주형이 세포에 제공된 후 4일 초과째에 상기 세포에 제공되는, 방법.
  53. 제28항 내지 제52항 중 어느 한 항에 있어서, (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산은 (c)가 세포에 제공된 후 적어도 14일째에 상기 세포에 제공되는, 방법.
  54. 제52항 또는 제53항에 있어서, (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산의 하나 이상의 추가 용량은, (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산의 제1 용량 후에 상기 세포에 제공되는, 방법.
  55. 제54항에 있어서, (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산의 하나 이상의 추가 용량은, GOI 또는 기능적 유도체를 인코딩하는 핵산 서열의 표적화된 통합의 표적 수준 및/또는 GOI 또는 기능적 유도체를 인코딩하는 핵산 서열의 발현의 표적 수준이 달성될 때까지, (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산의 제1 용량 후에 상기 세포에 제공되는, 방법.
  56. 제28항 내지 제55항 중 어느 한 항에 있어서, 상기 GOI 또는 이의 기능적 유도체를 인코딩하는 핵산 서열은 내인성 알부민 프로모터의 제어 하에 발현되는, 방법.
  57. 제28항 내지 제56항 중 어느 한 항에 있어서, 상기 세포는 간세포인, 방법.
  58. 세포의 게놈이 제28항 내지 제57항 중 어느 한 항의 방법에 의해 편집되는, 유전적으로 변형된 세포.
  59. 제58항에 있어서, 상기 GOI 또는 기능적 유도체를 인코딩하는 핵산 서열은 내인성 알부민 프로모터의 제어 하에 발현되는, 유전적으로 변형된 세포.
  60. 제58항 또는 제59항에 있어서, 상기 GOI 또는 이의 기능적 유도체를 인코딩하는 핵산 서열은 세포에서의 발현을 위해 코돈 최적화되는 것인, 유전적으로 변형된 세포.
  61. 제58항 내지 제60항 중 어느 한 항에 있어서, 상기 세포는 간세포인, 유전적으로 변형된 세포.
  62. 대상체에서 장애 또는 건강상 병태를 치료하는 방법으로서, 상기 방법은
    대상체 내 세포에,
    (a) 서열번호 22, 21, 28, 30, 18-20, 23-27, 29, 31-44, 및 104 중 임의의 하나로부터의 스페이서 서열을 포함하는 gRNA, 또는 상기 gRNA를 인코딩하는 핵산;
    (b) DNA 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산; 및
    (c) 관심 유전자(GOI) 또는 이의 기능적 유도체를 인코딩하는 핵산 서열을 포함하는 공여체 주형을 제공하는 단계를 포함하는, 방법.
  63. 제62항에 있어서, 상기 gRNA는 서열번호 22, 21, 28, 및 30 중 임의의 하나로부터의 스페이서 서열을 포함하는, 방법.
  64. 제63항에 있어서, 상기 gRNA는 서열번호 22로부터의 스페이서 서열을 포함하는, 방법.
  65. 제63항에 있어서, 상기 gRNA는 서열번호 21로부터의 스페이서 서열을 포함하는, 방법.
  66. 제63항에 있어서, 상기 gRNA는 서열번호 28로부터의 스페이서 서열을 포함하는, 방법.
  67. 제63항에 있어서, 상기 gRNA는 서열번호 30으로부터의 스페이서 서열을 포함하는, 방법.
  68. 제62항 내지 제67항 중 어느 한 항에 있어서, 상기 GOI는 치료적 폴리펩타이드 및 예방적 폴리펩타이드로 이루어진 군으로부터 선택되는 폴리펩타이드를 인코딩하는, 방법.
  69. 제62항 내지 제67항 중 어느 한 항에 있어서, GOI는 FVIII 단백질, FIX 단백질, 알파-1-항트립신, FXIII 단백질, FVII 단백질, FX 단백질, 단백질 C, 세르핀 G1, 또는 이의 임의의 기능적 유도체로 이루어진 군으로부터 선택되는 단백질을 인코딩하는, 방법.
  70. 제69항에 있어서, 상기 GOI는 FVIII 단백질 또는 이의 임의의 기능적 유도체를 인코딩하는, 방법.
  71. 제69항에 있어서, 상기 GOI는 FIX 단백질 또는 이의 임의의 기능적 유도체를 인코딩하는, 방법.
  72. 제69항에 있어서, 상기 GOI는 세르핀 G1 단백질 또는 이의 임의의 기능적 유도체를 인코딩하는, 방법.
  73. 제62항 내지 제72항 중 어느 한 항에 있어서, 상기 대상체는 A형 혈우병, B형 혈우병, MPS II, MPS1H, 알파-1-항트립신 결핍, FXIII 결핍, FVII 결핍, FX 결핍, 단백질 C 결핍, 및 HAE로 이루어진 군으로부터 선택되는 장애 또는 건강상 병태를 갖고 있거나 갖는 것으로 의심되는 환자인, 방법.
  74. 제73항에 있어서, 상기 대상체는 A형 혈우병을 갖고 있거나 갖는 것으로 의심되는 환자인, 방법.
  75. 제73항에 있어서, 상기 대상체는 B형 혈우병을 갖고 있거나 갖는 것으로 의심되는 환자인, 방법.
  76. 제73항에 있어서, 상기 대상체는 HAE를 갖고 있거나 갖는 것으로 의심되는 환자인, 방법.
  77. 제62항 내지 제72항 중 어느 한 항에 있어서, 상기 대상체는 A형 혈우병, B형 혈우병, MPS II, MPS1H, 알파-1-항트립신 결핍, FXIII 결핍, FVII 결핍, FX 결핍, 단백질 C 결핍, 및 HAE로 이루어진 군으로부터 선택되는 장애 또는 건강상 병태의 위험이 있는 것으로 진단되는, 방법.
  78. 제77항에 있어서, 상기 대상체는 A형 혈우병의 위험이 있는 것으로 진단되는 환자인, 방법.
  79. 제77항에 있어서, 상기 대상체는 B형 혈우병의 위험이 있는 것으로 진단되는 환자인, 방법.
  80. 제77항에 있어서, 상기 대상체는 HAE의 위험이 있는 것으로 진단되는 환자인, 방법.
  81. 제62항 내지 제80항 중 어느 한 항에 있어서, 상기 DNA 엔도뉴클레아제는 서열 NGG 또는 NNGG를 갖는 프로토스페이서 인접 모티프(PAM); 또는 이의 기능적 유도체를 인식하며, 여기서 N은 임의의 뉴클레오타이드인, 방법.
  82. 제62항 내지 제81항 중 어느 한 항에 있어서, 상기 DNA 엔도뉴클레아제는 II형 Cas 엔도뉴클레아제 또는 이의 기능적 유도체인, 방법.
  83. 제62항 내지 제82항 중 어느 한 항에 있어서, 상기 DNA 엔도뉴클레아제는 Cas9인, 방법.
  84. 제62항 내지 제83항 중 어느 한 항에 있어서, 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산은 세포에서의 발현을 위해 코돈 최적화되는 것인, 방법.
  85. 제62항 내지 제84항 중 어느 한 항에 있어서, 상기 GOI 또는 이의 기능적 유도체를 인코딩하는 핵산 서열은 세포에서의 발현을 위해 코돈 최적화되는 것인, 방법.
  86. 제62항 내지 제85항 중 어느 한 항에 있어서, 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산은 데옥시리보핵산(DNA)인, 방법.
  87. 제62항 내지 제85항 중 어느 한 항에 있어서, 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산은 리보핵산(RNA)인, 방법.
  88. 제87항에 있어서, 상기 DNA 엔도뉴클레아제를 인코딩하는 RNA는 mRNA인, 방법.
  89. 제62항 내지 제88항 중 어느 한 항에 있어서, (a)의 gRNA, (b)의 DNA 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산, 및 (c)의 공여체 주형 중 하나 이상은 리포솜 또는 지질 나노입자에서 제형화되는, 방법.
  90. 제62항 내지 제89항 중 어느 한 항에 있어서, 상기 공여체 주형은 AAV 벡터에서 인코딩되는, 방법.
  91. 제62항 내지 제90항 중 어느 한 항에 있어서, 상기 공여체 주형은 GOI 또는 기능적 유도체를 인코딩하는 핵산 서열을 포함하는 공여체 카세트를 포함하고, 상기 공여체 카세트는 한면 또는 양면 상에서 gRNA 표적 부위에 의해 측면 근접해 있는, 방법.
  92. 제91항에 있어서, 상기 공여체 카세트는 한면 또는 양면 상에서 gRNA 표적 부위에 의해 측면 근접해 있는, 방법.
  93. 제91항 또는 제92항에 있어서, 상기 gRNA 표적 부위는 (a)의 gRNA에 대한 표적 부위인, 방법.
  94. 제93항에 있어서, 상기 공여체 주형의 gRNA 표적 부위는 (a)의 gRNA에 대한 세포 게놈 내 gRNA 표적 부위의 역보체인, 방법.
  95. 제62항 내지 제94항 중 어느 한 항에 있어서, 공여체 주형을 세포에 제공하는 단계는 상기 공여체 주형을 상기 대상체에게 투여하는 단계를 포함하는, 방법.
  96. 제95항에 있어서, 상기 투여는 정맥내 경로를 통한 것인, 방법.
  97. 제62항 내지 제96항 중 어느 한 항에 있어서, 상기 DNA 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산은 리포솜 또는 지질 나노입자에서 제형화되는, 방법.
  98. 제97항에 있어서, 상기 리포솜 또는 지질 나노입자는 또한 gRNA를 포함하는, 방법.
  99. 제98항에 있어서, 상기 gRNA 및 DNA 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산을 세포에 제공하는 단계는 리포솜 또는 지질 나노입자를 상기 대상체에게 투여하는 단계를 포함하는, 방법.
  100. 제99항에 있어서, 상기 투여는 정맥내 경로를 통한 것인, 방법.
  101. 제62항 내지 제100항 중 어느 한 항에 있어서, 상기 세포에 gRNA와 예비복합체화된 DNA 엔도뉴클레아제를 제공하여, RNP 복합체를 형성하는 단계를 포함하는, 방법.
  102. 제62항 내지 제101항 중 어느 한 항에 있어서, (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산은 (c)의 공여체 주형이 세포에 제공된 후 4일 초과째에 상기 세포에 제공되는, 방법.
  103. 제62항 내지 제102항 중 어느 한 항에 있어서, (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산은 (c)의 공여체 주형이 세포에 제공된 후 적어도 14일째에 상기 세포에 제공되는, 방법.
  104. 제102항 또는 제103항에 있어서, (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산의 하나 이상의 추가 용량은, (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산의 제1 용량 후에 상기 세포에 제공되는, 방법.
  105. 제104항에 있어서, (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산의 하나 이상의 추가 용량은, GOI 또는 기능적 유도체를 인코딩하는 핵산 서열의 표적화된 통합의 표적 수준 및/또는 GOI 단백질 또는 기능적 유도체를 인코딩하는 핵산 서열의 발현의 표적 수준이 달성될 때까지, (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산의 제1 용량 후에 상기 세포에 제공되는, 방법.
  106. 제102항 내지 제105항 중 어느 한 항에 있어서, (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산을 세포에 제공하는 단계는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산 및 gRNA를 포함하는 지질 나노입자를 상기 대상체에게 투여하는 단계를 포함하는, 방법.
  107. 제102항 내지 제106항 중 어느 한 항에 있어서, (c)의 공여체 주형을 세포에 제공하는 단계는 AAV 벡터에서 인코딩되는 공여체 주형을 상기 대상체에게 투여하는 단계를 포함하는, 방법.
  108. 제62항 내지 제107항 중 어느 한 항에 있어서, GOI 또는 이의 기능적 유도체를 인코딩하는 핵산 서열은 내인성 알부민 프로모터의 제어 하에 발현되는, 방법.
  109. 제62항 내지 제108항 중 어느 한 항에 있어서, 상기 세포는 간세포인, 방법.
  110. 제62항 내지 제109항 중 어느 한 항에 있어서, GOI 또는 이의 기능적 유도체를 인코딩하는 핵산 서열은 상기 대상체의 간에서 발현되는, 방법.
  111. 대상체에서 A형 혈우병, B형 혈우병, 또는 유전성 혈관부종을 치료하는 방법으로서, 상기 방법은
    제58항 내지 제61항 중 어느 한 항의 유전적으로 변형된 세포를 상기 대상체에게 투여하는 단계를 포함하는, 방법.
  112. 제111항에 있어서, 상기 유전적으로 변형된 세포는 상기 대상체에 대해 자기유래(autologous)인, 방법.
  113. 제111항 또는 제112항에 있어서,
    상기 대상체로부터 생물학적 시료를 수득하는 단계로서, 상기 생물학적 시료는 간세포의 세포(hepatocyte cell)를 포함하고, 상기 유전적으로 변형된 세포는 간세포로부터 제조되는 단계를 추가로 포함하는, 방법.
  114. 제1항 내지 제27항 중 어느 한 항의 시스템의 하나 이상의 요소를 포함하고, 사용 설명서를 추가로 포함하는, 키트.
KR1020217014866A 2018-10-17 2019-10-17 전이유전자 전달용 조성물 및 방법 KR20210096088A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862747128P 2018-10-17 2018-10-17
US62/747,128 2018-10-17
PCT/US2019/056779 WO2020081843A1 (en) 2018-10-17 2019-10-17 Compositions and methods for delivering transgenes

Publications (1)

Publication Number Publication Date
KR20210096088A true KR20210096088A (ko) 2021-08-04

Family

ID=68468827

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020217014866A KR20210096088A (ko) 2018-10-17 2019-10-17 전이유전자 전달용 조성물 및 방법

Country Status (11)

Country Link
US (1) US20210348159A1 (ko)
EP (1) EP3867377A1 (ko)
JP (1) JP2022505173A (ko)
KR (1) KR20210096088A (ko)
CN (1) CN113366106A (ko)
AU (1) AU2019362000A1 (ko)
BR (1) BR112021007403A2 (ko)
CA (1) CA3116885A1 (ko)
IL (1) IL282369A (ko)
MX (1) MX2021004455A (ko)
WO (1) WO2020081843A1 (ko)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2020289581A1 (en) 2019-06-07 2021-11-18 Regeneron Pharmaceuticals, Inc. Non-human animals comprising a humanized albumin locus
WO2022093863A1 (en) * 2020-10-26 2022-05-05 Research Institute At Nationwide Children's Hospital Chimeric antigen receptor (car) nk cells and uses thereof
CN114496063B (zh) * 2022-01-13 2023-05-23 北京博康健基因科技有限公司 基于天然氨基酸序列的信号肽设计与二级结构从头算建模方法和装置
WO2024006960A1 (en) * 2022-06-29 2024-01-04 Juno Therapeutics, Inc. Lipid nanoparticles for delivery of nucleic acids
CN117947040A (zh) * 2022-10-31 2024-04-30 苏州荷光科汇生物科技有限公司 用于目的基因的表达盒及其应用

Family Cites Families (138)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3687808A (en) 1969-08-14 1972-08-29 Univ Leland Stanford Junior Synthetic polynucleotides
US4469863A (en) 1980-11-12 1984-09-04 Ts O Paul O P Nonionic nucleic acid alkyl and aryl phosphonates and processes for manufacture and use thereof
US5023243A (en) 1981-10-23 1991-06-11 Molecular Biosystems, Inc. Oligonucleotide therapeutic agent and method of making same
US4476301A (en) 1982-04-29 1984-10-09 Centre National De La Recherche Scientifique Oligonucleotides, a process for preparing the same and their application as mediators of the action of interferon
JPS5927900A (ja) 1982-08-09 1984-02-14 Wakunaga Seiyaku Kk 固定化オリゴヌクレオチド
FR2540122B1 (fr) 1983-01-27 1985-11-29 Centre Nat Rech Scient Nouveaux composes comportant une sequence d'oligonucleotide liee a un agent d'intercalation, leur procede de synthese et leur application
US4605735A (en) 1983-02-14 1986-08-12 Wakunaga Seiyaku Kabushiki Kaisha Oligonucleotide derivatives
US4948882A (en) 1983-02-22 1990-08-14 Syngene, Inc. Single-stranded labelled oligonucleotides, reactive monomers and methods of synthesis
US4824941A (en) 1983-03-10 1989-04-25 Julian Gordon Specific antibody to the native form of 2'5'-oligonucleotides, the method of preparation and the use as reagents in immunoassays or for binding 2'5'-oligonucleotides in biological systems
US4587044A (en) 1983-09-01 1986-05-06 The Johns Hopkins University Linkage of proteins to nucleic acids
US5118802A (en) 1983-12-20 1992-06-02 California Institute Of Technology DNA-reporter conjugates linked via the 2' or 5'-primary amino group of the 5'-terminal nucleoside
US5550111A (en) 1984-07-11 1996-08-27 Temple University-Of The Commonwealth System Of Higher Education Dual action 2',5'-oligoadenylate antiviral derivatives and uses thereof
US5367066A (en) 1984-10-16 1994-11-22 Chiron Corporation Oligonucleotides with selectably cleavable and/or abasic sites
US5258506A (en) 1984-10-16 1993-11-02 Chiron Corporation Photolabile reagents for incorporation into oligonucleotide chains
US5430136A (en) 1984-10-16 1995-07-04 Chiron Corporation Oligonucleotides having selectably cleavable and/or abasic sites
US4828979A (en) 1984-11-08 1989-05-09 Life Technologies, Inc. Nucleotide analogs for nucleic acid labeling and detection
FR2575751B1 (fr) 1985-01-08 1987-04-03 Pasteur Institut Nouveaux nucleosides de derives de l'adenosine, leur preparation et leurs applications biologiques
US5235033A (en) 1985-03-15 1993-08-10 Anti-Gene Development Group Alpha-morpholino ribonucleoside derivatives and polymers thereof
US5405938A (en) 1989-12-20 1995-04-11 Anti-Gene Development Group Sequence-specific binding polymers for duplex nucleic acids
US5185444A (en) 1985-03-15 1993-02-09 Anti-Gene Deveopment Group Uncharged morpolino-based polymers having phosphorous containing chiral intersubunit linkages
US5166315A (en) 1989-12-20 1992-11-24 Anti-Gene Development Group Sequence-specific binding polymers for duplex nucleic acids
US5034506A (en) 1985-03-15 1991-07-23 Anti-Gene Development Group Uncharged morpholino-based polymers having achiral intersubunit linkages
US4762779A (en) 1985-06-13 1988-08-09 Amgen Inc. Compositions and methods for functionalizing nucleic acids
US5317098A (en) 1986-03-17 1994-05-31 Hiroaki Shizuya Non-radioisotope tagging of fragments
JPS638396A (ja) 1986-06-30 1988-01-14 Wakunaga Pharmaceut Co Ltd ポリ標識化オリゴヌクレオチド誘導体
US5276019A (en) 1987-03-25 1994-01-04 The United States Of America As Represented By The Department Of Health And Human Services Inhibitors for replication of retroviruses and for the expression of oncogene products
US5264423A (en) 1987-03-25 1993-11-23 The United States Of America As Represented By The Department Of Health And Human Services Inhibitors for replication of retroviruses and for the expression of oncogene products
US4904582A (en) 1987-06-11 1990-02-27 Synthetic Genetics Novel amphiphilic nucleic acid conjugates
ATE113059T1 (de) 1987-06-24 1994-11-15 Florey Howard Inst Nukleosid-derivate.
US5585481A (en) 1987-09-21 1996-12-17 Gen-Probe Incorporated Linking reagents for nucleotide probes
US4924624A (en) 1987-10-22 1990-05-15 Temple University-Of The Commonwealth System Of Higher Education 2,',5'-phosphorothioate oligoadenylates and plant antiviral uses thereof
US5188897A (en) 1987-10-22 1993-02-23 Temple University Of The Commonwealth System Of Higher Education Encapsulated 2',5'-phosphorothioate oligoadenylates
US5525465A (en) 1987-10-28 1996-06-11 Howard Florey Institute Of Experimental Physiology And Medicine Oligonucleotide-polyamide conjugates and methods of production and applications of the same
DE3738460A1 (de) 1987-11-12 1989-05-24 Max Planck Gesellschaft Modifizierte oligonukleotide
US5082830A (en) 1988-02-26 1992-01-21 Enzo Biochem, Inc. End labeled nucleotide probe
EP0406309A4 (en) 1988-03-25 1992-08-19 The University Of Virginia Alumni Patents Foundation Oligonucleotide n-alkylphosphoramidates
US5278302A (en) 1988-05-26 1994-01-11 University Patents, Inc. Polynucleotide phosphorodithioates
US5109124A (en) 1988-06-01 1992-04-28 Biogen, Inc. Nucleic acid probe linked to a label having a terminal cysteine
US5216141A (en) 1988-06-06 1993-06-01 Benner Steven A Oligonucleotide analogs containing sulfur linkages
US5175273A (en) 1988-07-01 1992-12-29 Genentech, Inc. Nucleic acid intercalating agents
US5262536A (en) 1988-09-15 1993-11-16 E. I. Du Pont De Nemours And Company Reagents for the preparation of 5'-tagged oligonucleotides
US5512439A (en) 1988-11-21 1996-04-30 Dynal As Oligonucleotide-linked magnetic particles and uses thereof
US5599923A (en) 1989-03-06 1997-02-04 Board Of Regents, University Of Tx Texaphyrin metal complexes having improved functionalization
US5457183A (en) 1989-03-06 1995-10-10 Board Of Regents, The University Of Texas System Hydroxylated texaphyrins
US5391723A (en) 1989-05-31 1995-02-21 Neorx Corporation Oligonucleotide conjugates
US4958013A (en) 1989-06-06 1990-09-18 Northwestern University Cholesteryl modified oligonucleotides
US5451463A (en) 1989-08-28 1995-09-19 Clontech Laboratories, Inc. Non-nucleoside 1,3-diol reagents for labeling synthetic oligonucleotides
US5134066A (en) 1989-08-29 1992-07-28 Monsanto Company Improved probes using nucleosides containing 3-dezauracil analogs
US5254469A (en) 1989-09-12 1993-10-19 Eastman Kodak Company Oligonucleotide-enzyme conjugate that can be used as a probe in hybridization assays and polymerase chain reaction procedures
US5399676A (en) 1989-10-23 1995-03-21 Gilead Sciences Oligonucleotides with inverted polarity
US5264564A (en) 1989-10-24 1993-11-23 Gilead Sciences Oligonucleotide analogs with novel linkages
US5264562A (en) 1989-10-24 1993-11-23 Gilead Sciences, Inc. Oligonucleotide analogs with novel linkages
US5292873A (en) 1989-11-29 1994-03-08 The Research Foundation Of State University Of New York Nucleic acids labeled with naphthoquinone probe
US5177198A (en) 1989-11-30 1993-01-05 University Of N.C. At Chapel Hill Process for preparing oligoribonucleoside and oligodeoxyribonucleoside boranophosphates
US5130302A (en) 1989-12-20 1992-07-14 Boron Bilogicals, Inc. Boronated nucleoside, nucleotide and oligonucleotide compounds, compositions and methods for using same
US5486603A (en) 1990-01-08 1996-01-23 Gilead Sciences, Inc. Oligonucleotide having enhanced binding affinity
US5459255A (en) 1990-01-11 1995-10-17 Isis Pharmaceuticals, Inc. N-2 substituted purines
US5587361A (en) 1991-10-15 1996-12-24 Isis Pharmaceuticals, Inc. Oligonucleotides having phosphorothioate linkages of high chiral purity
US5587470A (en) 1990-01-11 1996-12-24 Isis Pharmaceuticals, Inc. 3-deazapurines
US5681941A (en) 1990-01-11 1997-10-28 Isis Pharmaceuticals, Inc. Substituted purines and oligonucleotide cross-linking
US5578718A (en) 1990-01-11 1996-11-26 Isis Pharmaceuticals, Inc. Thiol-derivatized nucleosides
WO1991013080A1 (en) 1990-02-20 1991-09-05 Gilead Sciences, Inc. Pseudonucleosides and pseudonucleotides and their polymers
US5214136A (en) 1990-02-20 1993-05-25 Gilead Sciences, Inc. Anthraquinone-derivatives oligonucleotides
US5321131A (en) 1990-03-08 1994-06-14 Hybridon, Inc. Site-specific functionalization of oligodeoxynucleotides for non-radioactive labelling
US5470967A (en) 1990-04-10 1995-11-28 The Dupont Merck Pharmaceutical Company Oligonucleotide analogs with sulfamate linkages
DK0455905T3 (da) 1990-05-11 1998-12-07 Microprobe Corp Dipsticks til nukleinsyrehybridiseringsassays og fremgangsmåde til kovalent immobilisering af oligonukleotider
US5677437A (en) 1990-07-27 1997-10-14 Isis Pharmaceuticals, Inc. Heteroatomic oligonucleoside linkages
US5541307A (en) 1990-07-27 1996-07-30 Isis Pharmaceuticals, Inc. Backbone modified oligonucleotide analogs and solid phase synthesis thereof
US5610289A (en) 1990-07-27 1997-03-11 Isis Pharmaceuticals, Inc. Backbone modified oligonucleotide analogues
US5138045A (en) 1990-07-27 1992-08-11 Isis Pharmaceuticals Polyamine conjugated oligonucleotides
JPH0874B2 (ja) 1990-07-27 1996-01-10 アイシス・ファーマシューティカルス・インコーポレーテッド 遺伝子発現を検出および変調するヌクレアーゼ耐性、ピリミジン修飾オリゴヌクレオチド
US5618704A (en) 1990-07-27 1997-04-08 Isis Pharmacueticals, Inc. Backbone-modified oligonucleotide analogs and preparation thereof through radical coupling
US5602240A (en) 1990-07-27 1997-02-11 Ciba Geigy Ag. Backbone modified oligonucleotide analogs
US5218105A (en) 1990-07-27 1993-06-08 Isis Pharmaceuticals Polyamine conjugated oligonucleotides
US5623070A (en) 1990-07-27 1997-04-22 Isis Pharmaceuticals, Inc. Heteroatomic oligonucleoside linkages
US5688941A (en) 1990-07-27 1997-11-18 Isis Pharmaceuticals, Inc. Methods of making conjugated 4' desmethyl nucleoside analog compounds
US5489677A (en) 1990-07-27 1996-02-06 Isis Pharmaceuticals, Inc. Oligonucleoside linkages containing adjacent oxygen and nitrogen atoms
US5608046A (en) 1990-07-27 1997-03-04 Isis Pharmaceuticals, Inc. Conjugated 4'-desmethyl nucleoside analog compounds
US5245022A (en) 1990-08-03 1993-09-14 Sterling Drug, Inc. Exonuclease resistant terminally substituted oligonucleotides
WO1992002534A2 (en) 1990-08-03 1992-02-20 Sterling Drug, Inc. Compounds and methods for inhibiting gene expression
US5177196A (en) 1990-08-16 1993-01-05 Microprobe Corporation Oligo (α-arabinofuranosyl nucleotides) and α-arabinofuranosyl precursors thereof
US5512667A (en) 1990-08-28 1996-04-30 Reed; Michael W. Trifunctional intermediates for preparing 3'-tailed oligonucleotides
US5214134A (en) 1990-09-12 1993-05-25 Sterling Winthrop Inc. Process of linking nucleosides with a siloxane bridge
US5561225A (en) 1990-09-19 1996-10-01 Southern Research Institute Polynucleotide analogs containing sulfonate and sulfonamide internucleoside linkages
WO1992005186A1 (en) 1990-09-20 1992-04-02 Gilead Sciences Modified internucleoside linkages
US5432272A (en) 1990-10-09 1995-07-11 Benner; Steven A. Method for incorporating into a DNA or RNA oligonucleotide using nucleotides bearing heterocyclic bases
US5173414A (en) 1990-10-30 1992-12-22 Applied Immune Sciences, Inc. Production of recombinant adeno-associated virus vectors
ATE198598T1 (de) 1990-11-08 2001-01-15 Hybridon Inc Verbindung von mehrfachreportergruppen auf synthetischen oligonukleotiden
US5714331A (en) 1991-05-24 1998-02-03 Buchardt, Deceased; Ole Peptide nucleic acids having enhanced binding affinity, sequence specificity and solubility
US5539082A (en) 1993-04-26 1996-07-23 Nielsen; Peter E. Peptide nucleic acids
US5719262A (en) 1993-11-22 1998-02-17 Buchardt, Deceased; Ole Peptide nucleic acids having amino acid side chains
US5371241A (en) 1991-07-19 1994-12-06 Pharmacia P-L Biochemicals Inc. Fluorescein labelled phosphoramidites
US5571799A (en) 1991-08-12 1996-11-05 Basco, Ltd. (2'-5') oligoadenylate analogues useful as inhibitors of host-v5.-graft response
US5484908A (en) 1991-11-26 1996-01-16 Gilead Sciences, Inc. Oligonucleotides containing 5-propynyl pyrimidines
TW393513B (en) 1991-11-26 2000-06-11 Isis Pharmaceuticals Inc Enhanced triple-helix and double-helix formation with oligomers containing modified pyrimidines
US5595726A (en) 1992-01-21 1997-01-21 Pharmacyclics, Inc. Chromophore probe for detection of nucleic acid
US5565552A (en) 1992-01-21 1996-10-15 Pharmacyclics, Inc. Method of expanded porphyrin-oligonucleotide conjugate synthesis
US5633360A (en) 1992-04-14 1997-05-27 Gilead Sciences, Inc. Oligonucleotide analogs capable of passive cell membrane permeation
US5434257A (en) 1992-06-01 1995-07-18 Gilead Sciences, Inc. Binding compentent oligomers containing unsaturated 3',5' and 2',5' linkages
US5272250A (en) 1992-07-10 1993-12-21 Spielvogel Bernard F Boronated phosphoramidate compounds
US5574142A (en) 1992-12-15 1996-11-12 Microprobe Corporation Peptide linkers for improved oligonucleotide delivery
US5476925A (en) 1993-02-01 1995-12-19 Northwestern University Oligodeoxyribonucleotides including 3'-aminonucleoside-phosphoramidate linkages and terminal 3'-amino groups
GB9304618D0 (en) 1993-03-06 1993-04-21 Ciba Geigy Ag Chemical compounds
EP0691977B1 (en) 1993-03-31 1997-11-26 Sanofi Oligonucleotides with amide linkages replacing phosphodiester linkages
US5502177A (en) 1993-09-17 1996-03-26 Gilead Sciences, Inc. Pyrimidine derivatives for labeled binding partners
DE69433592T2 (de) 1993-11-09 2005-02-10 Targeted Genetics Corp., Seattle Die erzielung hoher titer des rekombinanten aav-vektors
CA2176215C (en) 1993-11-09 2007-06-26 James P. Trempe Stable cell lines capable of expressing the adeno-associated virus replication gene
US5457187A (en) 1993-12-08 1995-10-10 Board Of Regents University Of Nebraska Oligonucleotides containing 5-fluorouracil
US5596091A (en) 1994-03-18 1997-01-21 The Regents Of The University Of California Antisense oligonucleotides comprising 5-aminoalkyl pyrimidine nucleotides
US5625050A (en) 1994-03-31 1997-04-29 Amgen Inc. Modified oligonucleotides and intermediates useful in nucleic acid therapeutics
US5525711A (en) 1994-05-18 1996-06-11 The United States Of America As Represented By The Secretary Of The Department Of Health And Human Services Pteridine nucleotide analogs as fluorescent DNA probes
US5658785A (en) 1994-06-06 1997-08-19 Children's Hospital, Inc. Adeno-associated virus materials and methods
US5597696A (en) 1994-07-18 1997-01-28 Becton Dickinson And Company Covalent cyanine dye oligonucleotide conjugates
US5580731A (en) 1994-08-25 1996-12-03 Chiron Corporation N-4 modified pyrimidine deoxynucleotides and oligonucleotide probes synthesized therewith
US5856152A (en) 1994-10-28 1999-01-05 The Trustees Of The University Of Pennsylvania Hybrid adenovirus-AAV vector and methods of use therefor
AU707866B2 (en) 1994-12-06 1999-07-22 Targeted Genetics Corporation Packaging cell lines for generation of high titers of recombinant AAV vectors
FR2737730B1 (fr) 1995-08-10 1997-09-05 Pasteur Merieux Serums Vacc Procede de purification de virus par chromatographie
EP0847442A1 (en) 1995-08-30 1998-06-17 Genzyme Corporation Chromatographic purification of adenovirus and aav
AU715543B2 (en) 1995-09-08 2000-02-03 Genzyme Corporation Improved AAV vectors for gene therapy
US5910434A (en) 1995-12-15 1999-06-08 Systemix, Inc. Method for obtaining retroviral packaging cell lines producing high transducing efficiency retroviral supernatant
DK1944362T3 (en) 1997-09-05 2016-01-25 Genzyme Corp Fremgangsmåder til fremstilling af hjælpevirusfri præparater med høj titer af rekombinante AAV-vektorer
US6258595B1 (en) 1999-03-18 2001-07-10 The Trustees Of The University Of Pennsylvania Compositions and methods for helper-free production of recombinant adeno-associated viruses
US6287860B1 (en) 2000-01-20 2001-09-11 Isis Pharmaceuticals, Inc. Antisense inhibition of MEKK2 expression
US7056502B2 (en) 2000-04-28 2006-06-06 The Trustees Of The University Of Pennsylvania Recombinant aav vectors with AAV5 capsids and AAV5 vectors pseudotyped in heterologous capsids
US20030158403A1 (en) 2001-07-03 2003-08-21 Isis Pharmaceuticals, Inc. Nuclease resistant chimeric oligonucleotides
US9209196B2 (en) 2011-11-30 2015-12-08 Sharp Kabushiki Kaisha Memory circuit, method of driving the same, nonvolatile storage device using the same, and liquid crystal display device
DE102012007232B4 (de) 2012-04-07 2014-03-13 Susanne Weller Verfahren zur Herstellung von rotierenden elektrischen Maschinen
UA118014C2 (uk) 2012-05-25 2018-11-12 Те Ріджентс Оф Те Юніверсіті Оф Каліфорнія Спосіб модифікації днк-мішені
US9873894B2 (en) * 2013-05-15 2018-01-23 Sangamo Therapeutics, Inc. Methods and compositions for treatment of a genetic condition
JP2015092462A (ja) 2013-09-30 2015-05-14 Tdk株式会社 正極及びそれを用いたリチウムイオン二次電池
JP6202701B2 (ja) 2014-03-21 2017-09-27 株式会社日立国際電気 基板処理装置、半導体装置の製造方法及びプログラム
JP6197169B2 (ja) 2014-09-29 2017-09-20 東芝メモリ株式会社 半導体装置の製造方法
WO2017077386A1 (en) * 2015-11-06 2017-05-11 Crispr Therapeutics Ag Materials and methods for treatment of glycogen storage disease type 1a
EP3380622A4 (en) * 2015-11-23 2019-08-07 Sangamo Therapeutics, Inc. METHODS AND COMPOSITIONS FOR MODIFYING IMMUNITY
EP3967758A1 (en) * 2015-12-01 2022-03-16 CRISPR Therapeutics AG Materials and methods for treatment of alpha-1 antitrypsin deficiency
CN105567735A (zh) * 2016-01-05 2016-05-11 华东师范大学 一种凝血因子基因突变的定点修复载体***及方法
WO2018170150A2 (en) * 2017-03-16 2018-09-20 Seattle Children's Hospital (dba Seattle Children's Research Institute) Engraftable cell-based immunotherapy for long-term delivery of therapeutic proteins
BR112020007502A2 (pt) * 2017-10-17 2020-10-06 Crispr Therapeutics Ag composições e métodos para edição gênica para hemofilia a

Also Published As

Publication number Publication date
CN113366106A (zh) 2021-09-07
US20210348159A1 (en) 2021-11-11
CA3116885A1 (en) 2020-04-23
EP3867377A1 (en) 2021-08-25
JP2022505173A (ja) 2022-01-14
WO2020081843A1 (en) 2020-04-23
IL282369A (en) 2021-06-30
MX2021004455A (es) 2021-08-11
AU2019362000A1 (en) 2021-05-20
BR112021007403A2 (pt) 2021-12-07

Similar Documents

Publication Publication Date Title
JP7482028B2 (ja) 血友病aに対する遺伝子編集用組成物及び方法
KR102587132B1 (ko) 암 면역요법을 위한 crispr-cpf1-관련 방법, 조성물 및 구성성분
KR102351329B1 (ko) 혈색소병증의 치료를 위한 물질 및 방법
US20240117352A1 (en) Expression of foxp3 in edited cd34+ cells
KR20210096088A (ko) 전이유전자 전달용 조성물 및 방법
KR20180081600A (ko) 티틴-기반 근증 및 다른 티틴성병증의 치료를 위한 물질 및 방법
WO2019204668A1 (en) Compositions and methods for knockdown of apo(a) by gene editing for treatment of cardiovascular disease
US12016932B2 (en) Gene editing for hemophilia A with improved factor VIII expression
EP3737762A1 (en) Compositions and methods for gene editing by targeting transferrin
US20210130824A1 (en) Compositions and methods for gene editing by targeting fibrinogen-alpha
US20230149563A1 (en) Compositions and methods for expressing factor ix for hemophilia b therapy
JP2023520262A (ja) 改善された第viii因子発現による血友病aのための遺伝子編集
KR20240099358A (ko) B형 혈우병 치료를 위한 인자 ix를 발현하기 위한 조성물 및 방법

Legal Events

Date Code Title Description
A201 Request for examination